diff --git a/.gitignore b/.gitignore
index 64eafee2..502f5c50 100644
--- a/.gitignore
+++ b/.gitignore
@@ -29,6 +29,7 @@ samplesheet.csv
magma.sh
.Rproj.user
-docs/_site
+docs/.quarto
-.DS_Store
+docs/_site
+resources/snpeff/data/mbovis_AF2122/snpEffectPredictor.bin
diff --git a/bin/rename_vcf_chrom.py b/bin/rename_vcf_chrom.py
index c5c8e81b..1bf58b1e 100755
--- a/bin/rename_vcf_chrom.py
+++ b/bin/rename_vcf_chrom.py
@@ -36,7 +36,6 @@ def errlog(x,ext=False):
quit(1)
def cmd_out(cmd,verbose=1):
- cmd = "set -u pipefail; " + cmd
if verbose==2:
sys.stderr.write("\nRunning command:\n%s\n" % cmd)
stderr = open("/dev/stderr","w")
@@ -56,19 +55,27 @@ def cmd_out(cmd,verbose=1):
def main(args):
generator = cmd_out("bcftools view " + args.vcf) if args.vcf else sys.stdin
- convert = dict(zip(args.source,args.target))
- for l in generator:
- if l[0]=="#":
- sys.stdout.write(l.strip()+"\n")
- else:
- row = l.strip().split()
- row[0] = convert[row[0]]
- sys.stdout.write("\t".join(row)+"\n")
+ convert = dict(zip(args.source, args.target))
+
+ # Open the output file for writing, or use stdout if not specified
+ outfile = open(args.outfile, 'w') if args.outfile else sys.stdout
+ try:
+ for l in generator:
+ if l[0] == "#":
+ outfile.write(l.strip() + "\n")
+ else:
+ row = l.strip().split()
+ row[0] = convert[row[0]]
+ outfile.write("\t".join(row) + "\n")
+ finally:
+ if args.outfile:
+ outfile.close()
parser = argparse.ArgumentParser(description='tbprofiler script',formatter_class=argparse.ArgumentDefaultsHelpFormatter)
parser.add_argument('--vcf',type=str,help='')
parser.add_argument('--source',nargs="+",type=str,help='')
parser.add_argument('--target',nargs="+",type=str,help='')
+parser.add_argument('--outfile', type=str, required=False, help='Output VCF file')
parser.set_defaults(func=main)
args = parser.parse_args()
args.func(args)
diff --git a/conf/docker.config b/conf/docker.config
index 753be2b6..e5e02ea4 100644
--- a/conf/docker.config
+++ b/conf/docker.config
@@ -55,6 +55,12 @@ process {
container = "ghcr.io/torch-consortium/magma/magma-container-2:1.1.1"
}
+ // withName:
+ // 'SNPEFF.*' {
+ // container = "quay.io/biocontainers/snpeff:4.3.1t--2"
+ // }
+
+
}
diff --git a/default_params.config b/default_params.config
index e937d6cb..fba2a2e9 100644
--- a/default_params.config
+++ b/default_params.config
@@ -487,7 +487,7 @@ GATK_GENOTYPE_GVCFS {
SNPEFF {
results_dir = "${params.outdir}/vcf_files/cohort/raw_variant_files/annotated"
- arguments = " -nostats -ud 100 Mycobacterium_tuberculosis_h37rv "
+ arguments = " -nostats -ud 100 mbovis_AF2122 "
should_publish = true
}
diff --git a/modules.json b/modules.json
index 9de8b7f1..ed6de7f4 100644
--- a/modules.json
+++ b/modules.json
@@ -1,177 +1,26 @@
{
- "name": "TORCH-consortium/magma",
- "homePage": "https://github.com/TORCH-consortium/MAGMA",
- "repos": {
- "https://github.com/nf-core/modules.git": {
- "modules": {
- "nf-core": {
- "bcftools/merge": {
- "branch": "master",
- "git_sha": "c9c3ef86c1892413b3c86fb38c4e39fd7288512f",
- "installed_by": ["modules"]
- },
- "bcftools/view": {
- "branch": "master",
- "git_sha": "c9c3ef86c1892413b3c86fb38c4e39fd7288512f",
- "installed_by": ["modules"]
- },
- "bwa/mem": {
- "branch": "master",
- "git_sha": "a29f18660f5e3748d44d6f716241e70c942c065d",
- "installed_by": ["modules"]
- },
- "bwamem2/mem": {
- "branch": "master",
- "git_sha": "a29f18660f5e3748d44d6f716241e70c942c065d",
- "installed_by": ["modules"]
- },
- "delly/call": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "fastqc": {
- "branch": "master",
- "git_sha": "08108058ea36a63f141c25c4e75f9f872a5b2296",
- "installed_by": ["modules"]
- },
- "fastqutils/info": {
- "branch": "master",
- "git_sha": "92168db7097574f7407062f26e901f2d2fb96135",
- "installed_by": ["modules"]
- },
- "gatk4/applybqsr": {
- "branch": "master",
- "git_sha": "8a7e6e269f4044d922ce84bbe5717a8c07de8834",
- "installed_by": ["modules"]
- },
- "gatk4/applyvqsr": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "gatk4/baserecalibrator": {
- "branch": "master",
- "git_sha": "f63c350bc9dc0b0a934d14d3a85298002c15adc1",
- "installed_by": ["modules"]
- },
- "gatk4/combinegvcfs": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "gatk4/genotypegvcfs": {
- "branch": "master",
- "git_sha": "81880787133db07d9b4c1febd152c090eb8325dc",
- "installed_by": ["modules"]
- },
- "gatk4/haplotypecaller": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "gatk4/indexfeaturefile": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "gatk4/markduplicates": {
- "branch": "master",
- "git_sha": "1ec937ab3edc307bc0d79a2200d784e9f0868359",
- "installed_by": ["modules"]
- },
- "gatk4/mergevcfs": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "gatk4/selectvariants": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "gatk4/variantrecalibrator": {
- "branch": "master",
- "git_sha": "81880787133db07d9b4c1febd152c090eb8325dc",
- "installed_by": ["modules"]
- },
- "gatk4/variantstotable": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "iqtree": {
- "branch": "master",
- "git_sha": "2ae11ef01a83c7330c09d08d14d21ff445e32141",
- "installed_by": ["modules"]
- },
- "ismapper": {
- "branch": "master",
- "git_sha": "81880787133db07d9b4c1febd152c090eb8325dc",
- "installed_by": ["modules"]
- },
- "lofreq/call": {
- "branch": "master",
- "git_sha": "81880787133db07d9b4c1febd152c090eb8325dc",
- "installed_by": ["modules"]
- },
- "lofreq/filter": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "lofreq/indelqual": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "multiqc": {
- "branch": "master",
- "git_sha": "f0719ae309075ae4a291533883847c3f7c441dad",
- "installed_by": ["modules"]
- },
- "samtools/index": {
- "branch": "master",
- "git_sha": "d090922b1a4b80ba283186459ababf8e308abcbb",
- "installed_by": ["modules"]
- },
- "samtools/merge": {
- "branch": "master",
- "git_sha": "d090922b1a4b80ba283186459ababf8e308abcbb",
- "installed_by": ["modules"]
- },
- "samtools/stats": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "snpdists": {
- "branch": "master",
- "git_sha": "81880787133db07d9b4c1febd152c090eb8325dc",
- "installed_by": ["modules"]
- },
- "snpeff/download": {
- "branch": "master",
- "git_sha": "81880787133db07d9b4c1febd152c090eb8325dc",
- "installed_by": ["modules"]
- },
- "snpeff/snpeff": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "snpsites": {
- "branch": "master",
- "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
- "installed_by": ["modules"]
- },
- "tbprofiler/profile": {
- "branch": "master",
- "git_sha": "81880787133db07d9b4c1febd152c090eb8325dc",
- "installed_by": ["modules"]
- }
+ "name": "TORCH-consortium/magma",
+ "homePage": "https://github.com/TORCH-consortium/MAGMA",
+ "repos": {
+ "https://github.com/nf-core/modules.git": {
+ "modules": {
+ "nf-core": {
+ "snpeff/download": {
+ "branch": "master",
+ "git_sha": "81880787133db07d9b4c1febd152c090eb8325dc",
+ "installed_by": [
+ "modules"
+ ]
+ },
+ "snpeff/snpeff": {
+ "branch": "master",
+ "git_sha": "05954dab2ff481bcb999f24455da29a5828af08d",
+ "installed_by": [
+ "modules"
+ ]
+ }
+ }
+ }
}
- }
}
- }
-}
+}
\ No newline at end of file
diff --git a/modules/local/gatk/variant_recalibrator.nf b/modules/local/gatk/variant_recalibrator.nf
index 3cffcf32..7e6f7e90 100644
--- a/modules/local/gatk/variant_recalibrator.nf
+++ b/modules/local/gatk/variant_recalibrator.nf
@@ -27,7 +27,6 @@ process GATK_VARIANT_RECALIBRATOR {
tag "annotation: ${annotations}"
publishDir params.results_dir, mode: params.save_mode, enabled: params.should_publish
-
input:
val(analysisMode)
val(annotations)
@@ -47,16 +46,11 @@ process GATK_VARIANT_RECALIBRATOR {
tuple val(joint_name), path("*${analysisMode}*.command.log"), emit: annotationsLog
script:
-
- def finalResourceFilesArg = (resourceFilesArg ? "--resource:${resourceFilesArg}" : "")
-
- def optionalAnnotationPrefix = ""
-
- if (task.process.split("__").length == 1) {
- optionalAnnotationPrefix = ""
- } else {
- optionalAnnotationPrefix = ".${task.process.split("__")[-1]}"
- }
+ // Only add --resource argument if resourceFiles and resourceFileIndexes are non-empty
+ def resourceFilesExist = resourceFiles && resourceFiles.size() > 0
+ def resourceFileIndexesExist = resourceFileIndexes && resourceFileIndexes.size() > 0
+ def finalResourceFilesArg = (resourceFilesArg && resourceFilesExist && resourceFileIndexesExist) ? "--resource:${resourceFilesArg}" : ""
+ def optionalAnnotationPrefix = (task.process.split("__").length == 1) ? "" : ".${task.process.split('__')[-1]}"
"""
${params.gatk_path} VariantRecalibrator --java-options "-Xmx${task.memory.giga}G" \\
@@ -73,15 +67,5 @@ process GATK_VARIANT_RECALIBRATOR {
2>${joint_name}.${analysisMode}${optionalAnnotationPrefix}.command.log
cp ${joint_name}.${analysisMode}${optionalAnnotationPrefix}.command.log .command.log
-
- """
-
- stub:
-
- """
- touch ${joint_name}.${analysisMode}.tranches
- touch ${joint_name}.${analysisMode}.R
- touch ${joint_name}.${analysisMode}.recal.vcf.gz
- touch ${joint_name}.${analysisMode}.mod
"""
}
diff --git a/modules/local/snpeff/snpeff.nf b/modules/local/snpeff/snpeff.nf
index a607e6f6..81631b92 100644
--- a/modules/local/snpeff/snpeff.nf
+++ b/modules/local/snpeff/snpeff.nf
@@ -30,6 +30,8 @@ process SNPEFF {
input:
tuple val(joint_name), path(rawJointVariantsFile)
path(ref_fasta)
+ path(snpeff_config)
+ path(snpeff_db)
output:
tuple val(joint_name), path("*.annotated.vcf")
@@ -38,9 +40,11 @@ process SNPEFF {
shell:
'''
- rename_vcf_chrom.py --vcf !{rawJointVariantsFile} --source !{params.ref_fasta_basename} --target 'Chromosome' \
- | !{params.snpeff_path} -nostats !{params.arguments} \
- | rename_vcf_chrom.py --target !{params.ref_fasta_basename} --source 'Chromosome' \
+ snpEff build -c complete_snpeff.config -gff3 -v mbovis_AF2122
+
+ rename_vcf_chrom.py --vcf !{rawJointVariantsFile} --source !{params.ref_fasta_basename} --target 'Chromosome' \\
+ | !{params.snpeff_path} -nostats -c !{snpeff_config} !{params.arguments} \\
+ | rename_vcf_chrom.py --target !{params.ref_fasta_basename} --source 'Chromosome' \\
> !{joint_name}.raw_variants.annotated.vcf
'''
diff --git a/modules/local/tbprofiler/vcf_profile__cohort.nf b/modules/local/tbprofiler/vcf_profile__cohort.nf
index 7b3a4f93..12e60f6f 100644
--- a/modules/local/tbprofiler/vcf_profile__cohort.nf
+++ b/modules/local/tbprofiler/vcf_profile__cohort.nf
@@ -40,8 +40,8 @@ process TBPROFILER_VCF_PROFILE__COHORT {
"""
- bcftools view ${mergedVcf} | sed 's/NC-000962-3-H37Rv/Chromosome/g' > intermediate.vcf
-
+ bcftools view ${mergedVcf} | sed 's/${params.ref_fasta_basename}/Chromosome/g' > intermediate.vcf
+
cat intermediate.vcf | bcftools view -Oz -o intermediate.vcf.gz
${params.tbprofiler_path} profile \\
diff --git a/modules/local/tbprofiler/vcf_profile__lofreq.nf b/modules/local/tbprofiler/vcf_profile__lofreq.nf
index f2d82621..7309d1f5 100644
--- a/modules/local/tbprofiler/vcf_profile__lofreq.nf
+++ b/modules/local/tbprofiler/vcf_profile__lofreq.nf
@@ -41,8 +41,8 @@ process TBPROFILER_VCF_PROFILE__LOFREQ {
"""
- bcftools view ${mergedLofreqVcf} | sed 's/NC-000962-3-H37Rv/Chromosome/g' > intermediate.vcf
-
+ bcftools view ${mergedLofreqVcf} | sed 's/${params.ref_fasta_basename}/Chromosome/g' > intermediate.vcf
+
cat intermediate.vcf | bcftools view -Oz -o intermediate.vcf.gz
${params.tbprofiler_path} profile \\
diff --git a/modules/nf-core/bwa/mem/environment.yml b/modules/nf-core/bwa/mem/environment.yml
deleted file mode 100644
index ed5448a1..00000000
--- a/modules/nf-core/bwa/mem/environment.yml
+++ /dev/null
@@ -1,13 +0,0 @@
----
-# yaml-language-server: $schema=https://raw.githubusercontent.com/nf-core/modules/master/modules/environment-schema.json
-channels:
- - conda-forge
- - bioconda
-
-dependencies:
- # renovate: datasource=conda depName=bioconda/bwa
- - bioconda::bwa=0.7.18
- # renovate: datasource=conda depName=bioconda/htslib
- - bioconda::htslib=1.21
- # renovate: datasource=conda depName=bioconda/samtools
- - bioconda::samtools=1.21
diff --git a/modules/nf-core/bwa/mem/main.nf b/modules/nf-core/bwa/mem/main.nf
deleted file mode 100644
index 3c544178..00000000
--- a/modules/nf-core/bwa/mem/main.nf
+++ /dev/null
@@ -1,74 +0,0 @@
-process BWA_MEM {
- tag "$meta.id"
- label 'process_high'
-
- conda "${moduleDir}/environment.yml"
- container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
- 'https://community-cr-prod.seqera.io/docker/registry/v2/blobs/sha256/bf/bf7890f8d4e38a7586581cb7fa13401b7af1582f21d94eef969df4cea852b6da/data' :
- 'community.wave.seqera.io/library/bwa_htslib_samtools:56c9f8d5201889a4' }"
-
- input:
- tuple val(meta) , path(reads)
- tuple val(meta2), path(index)
- tuple val(meta3), path(fasta)
- val sort_bam
-
- output:
- tuple val(meta), path("*.bam") , emit: bam, optional: true
- tuple val(meta), path("*.cram") , emit: cram, optional: true
- tuple val(meta), path("*.csi") , emit: csi, optional: true
- tuple val(meta), path("*.crai") , emit: crai, optional: true
- path "versions.yml" , emit: versions
-
- when:
- task.ext.when == null || task.ext.when
-
- script:
- def args = task.ext.args ?: ''
- def args2 = task.ext.args2 ?: ''
- def prefix = task.ext.prefix ?: "${meta.id}"
- def samtools_command = sort_bam ? 'sort' : 'view'
- def extension = args2.contains("--output-fmt sam") ? "sam" :
- args2.contains("--output-fmt cram") ? "cram":
- sort_bam && args2.contains("-O cram")? "cram":
- !sort_bam && args2.contains("-C") ? "cram":
- "bam"
- def reference = fasta && extension=="cram" ? "--reference ${fasta}" : ""
- if (!fasta && extension=="cram") error "Fasta reference is required for CRAM output"
- """
- INDEX=`find -L ./ -name "*.amb" | sed 's/\\.amb\$//'`
-
- bwa mem \\
- $args \\
- -t $task.cpus \\
- \$INDEX \\
- $reads \\
- | samtools $samtools_command $args2 ${reference} --threads $task.cpus -o ${prefix}.${extension} -
-
- cat <<-END_VERSIONS > versions.yml
- "${task.process}":
- bwa: \$(echo \$(bwa 2>&1) | sed 's/^.*Version: //; s/Contact:.*\$//')
- samtools: \$(echo \$(samtools --version 2>&1) | sed 's/^.*samtools //; s/Using.*\$//')
- END_VERSIONS
- """
-
- stub:
- def args2 = task.ext.args2 ?: ''
- def prefix = task.ext.prefix ?: "${meta.id}"
- def extension = args2.contains("--output-fmt sam") ? "sam" :
- args2.contains("--output-fmt cram") ? "cram":
- sort_bam && args2.contains("-O cram")? "cram":
- !sort_bam && args2.contains("-C") ? "cram":
- "bam"
- """
- touch ${prefix}.${extension}
- touch ${prefix}.csi
- touch ${prefix}.crai
-
- cat <<-END_VERSIONS > versions.yml
- "${task.process}":
- bwa: \$(echo \$(bwa 2>&1) | sed 's/^.*Version: //; s/Contact:.*\$//')
- samtools: \$(echo \$(samtools --version 2>&1) | sed 's/^.*samtools //; s/Using.*\$//')
- END_VERSIONS
- """
-}
diff --git a/modules/nf-core/bwa/mem/meta.yml b/modules/nf-core/bwa/mem/meta.yml
deleted file mode 100644
index b6f696c0..00000000
--- a/modules/nf-core/bwa/mem/meta.yml
+++ /dev/null
@@ -1,111 +0,0 @@
-name: bwa_mem
-description: Performs fastq alignment to a fasta reference using BWA
-keywords:
- - mem
- - bwa
- - alignment
- - map
- - fastq
- - bam
- - sam
-tools:
- - bwa:
- description: |
- BWA is a software package for mapping DNA sequences against
- a large reference genome, such as the human genome.
- homepage: http://bio-bwa.sourceforge.net/
- documentation: https://bio-bwa.sourceforge.net/bwa.shtml
- arxiv: arXiv:1303.3997
- licence: ["GPL-3.0-or-later"]
- identifier: "biotools:bwa"
-input:
- - - meta:
- type: map
- description: |
- Groovy Map containing sample information
- e.g. [ id:'test', single_end:false ]
- - reads:
- type: file
- description: |
- List of input FastQ files of size 1 and 2 for single-end and paired-end data,
- respectively.
- ontologies:
- - edam: "http://edamontology.org/data_2044" # Sequence
- - edam: "http://edamontology.org/format_1930" # FASTQ
- - - meta2:
- type: map
- description: |
- Groovy Map containing reference information.
- e.g. [ id:'test', single_end:false ]
- - index:
- type: file
- description: BWA genome index files
- pattern: "Directory containing BWA index *.{amb,ann,bwt,pac,sa}"
- ontologies:
- - edam: "http://edamontology.org/data_3210" # Genome index
- - - meta3:
- type: map
- description: |
- Groovy Map containing sample information
- e.g. [ id:'test', single_end:false ]
- - fasta:
- type: file
- description: Reference genome in FASTA format
- pattern: "*.{fasta,fa}"
- ontologies:
- - edam: "http://edamontology.org/data_2044" # Sequence
- - edam: "http://edamontology.org/format_1929" # FASTA
- - - sort_bam:
- type: boolean
- description: use samtools sort (true) or samtools view (false)
- pattern: "true or false"
-output:
- - bam:
- - meta:
- type: file
- description: Output BAM file containing read alignments
- - "*.bam":
- type: file
- description: Output BAM file containing read alignments
- pattern: "*.{bam}"
- ontologies:
- - edam: "http://edamontology.org/format_2572" # BAM
- - cram:
- - meta:
- type: file
- description: Output CRAM file containing read alignments
- - "*.cram":
- type: file
- description: Output CRAM file containing read alignments
- pattern: "*.{cram}"
- ontologies:
- - edam: "http://edamontology.org/format_3462" # CRAM
- - csi:
- - meta:
- type: file
- description: Optional index file for BAM file
- - "*.csi":
- type: file
- description: Optional index file for BAM file
- pattern: "*.{csi}"
- - crai:
- - meta:
- type: file
- description: Optional index file for CRAM file
- - "*.crai":
- type: file
- description: Optional index file for CRAM file
- pattern: "*.{crai}"
- - versions:
- - versions.yml:
- type: file
- description: File containing software versions
- pattern: "versions.yml"
-authors:
- - "@drpatelh"
- - "@jeremy1805"
- - "@matthdsm"
-maintainers:
- - "@drpatelh"
- - "@jeremy1805"
- - "@matthdsm"
diff --git a/modules/nf-core/bwa/mem/tests/main.nf.test b/modules/nf-core/bwa/mem/tests/main.nf.test
deleted file mode 100644
index 5de2c2f4..00000000
--- a/modules/nf-core/bwa/mem/tests/main.nf.test
+++ /dev/null
@@ -1,260 +0,0 @@
-nextflow_process {
-
- name "Test Process BWA_MEM"
- tag "modules_nfcore"
- tag "modules"
- tag "bwa"
- tag "bwa/mem"
- tag "bwa/index"
- script "../main.nf"
- process "BWA_MEM"
-
- setup {
- run("BWA_INDEX") {
- script "../../index/main.nf"
- process {
- """
- input[0] = [
- [id: 'test'],
- file(params.modules_testdata_base_path + 'genomics/sarscov2/genome/genome.fasta', checkIfExists: true)
- ]
- """
- }
- }
- }
-
- test("Single-End") {
-
- when {
- process {
- """
- input[0] = [
- [ id:'test', single_end:true ], // meta map
- [
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true)
- ]
- ]
- input[1] = BWA_INDEX.out.index
- input[2] = [[id: 'test'],file(params.modules_testdata_base_path + 'genomics/sarscov2/genome/genome.fasta', checkIfExists: true)]
- input[3] = false
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert snapshot(
- process.out.cram,
- process.out.csi,
- process.out.crai,
- process.out.versions,
- bam(process.out.bam[0][1]).getHeaderMD5(),
- bam(process.out.bam[0][1]).getReadsMD5()
- ).match()
- }
- )
- }
-
- }
-
- test("Single-End Sort") {
-
- when {
- process {
- """
- input[0] = [
- [ id:'test', single_end:true ], // meta map
- [
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true)
- ]
- ]
- input[1] = BWA_INDEX.out.index
- input[2] = [[id: 'test'],file(params.modules_testdata_base_path + 'genomics/sarscov2/genome/genome.fasta', checkIfExists: true)]
- input[3] = true
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert snapshot(
- process.out.cram,
- process.out.csi,
- process.out.crai,
- process.out.versions,
- bam(process.out.bam[0][1]).getHeaderMD5(),
- bam(process.out.bam[0][1]).getReadsMD5()
- ).match()
- }
- )
- }
-
- }
-
- test("Paired-End") {
-
- when {
- process {
- """
- input[0] = [
- [ id:'test', single_end:false ], // meta map
- [
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_2.fastq.gz', checkIfExists: true)
- ]
- ]
- input[1] = BWA_INDEX.out.index
- input[2] = [[id: 'test'],file(params.modules_testdata_base_path + 'genomics/sarscov2/genome/genome.fasta', checkIfExists: true)]
- input[3] = false
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert snapshot(
- process.out.cram,
- process.out.csi,
- process.out.crai,
- process.out.versions,
- bam(process.out.bam[0][1]).getHeaderMD5(),
- bam(process.out.bam[0][1]).getReadsMD5()
- ).match()
- }
- )
- }
-
- }
-
- test("Paired-End Sort") {
-
- when {
- process {
- """
- input[0] = [
- [ id:'test', single_end:false ], // meta map
- [
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_2.fastq.gz', checkIfExists: true)
- ]
- ]
- input[1] = BWA_INDEX.out.index
- input[2] = [[id: 'test'],file(params.modules_testdata_base_path + 'genomics/sarscov2/genome/genome.fasta', checkIfExists: true)]
- input[3] = true
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert snapshot(
- process.out.cram,
- process.out.csi,
- process.out.crai,
- process.out.versions,
- bam(process.out.bam[0][1]).getHeaderMD5(),
- bam(process.out.bam[0][1]).getReadsMD5()
- ).match()
- }
- )
- }
-
- }
-
- test("Paired-End - no fasta") {
-
- when {
- process {
- """
- input[0] = [
- [ id:'test', single_end:false ], // meta map
- [
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_2.fastq.gz', checkIfExists: true)
- ]
- ]
- input[1] = BWA_INDEX.out.index
- input[2] = [[:],[]]
- input[3] = false
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert snapshot(
- process.out.cram,
- process.out.csi,
- process.out.crai,
- process.out.versions,
- bam(process.out.bam[0][1]).getHeaderMD5(),
- bam(process.out.bam[0][1]).getReadsMD5()
- ).match()
- }
- )
- }
-
- }
-
- test("Single-end - stub") {
-
- options "-stub"
-
- when {
- process {
- """
- input[0] = [
- [ id:'test', single_end:true ], // meta map
- [
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true)
- ]
- ]
- input[1] = BWA_INDEX.out.index
- input[2] = [[id: 'test'],file(params.modules_testdata_base_path + 'genomics/sarscov2/genome/genome.fasta', checkIfExists: true)]
- input[3] = false
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert snapshot(process.out).match() }
- )
- }
- }
-
- test("Paired-end - stub") {
-
- options "-stub"
-
- when {
- process {
- """
- input[0] = [
- [ id:'test', single_end:false ], // meta map
- [
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_2.fastq.gz', checkIfExists: true)
- ]
- ]
- input[1] = BWA_INDEX.out.index
- input[2] = [[id: 'test'],file(params.modules_testdata_base_path + 'genomics/sarscov2/genome/genome.fasta', checkIfExists: true)]
- input[3] = false
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert snapshot(process.out).match() }
- )
- }
- }
-}
diff --git a/modules/nf-core/bwa/mem/tests/main.nf.test.snap b/modules/nf-core/bwa/mem/tests/main.nf.test.snap
deleted file mode 100644
index 3aaefdda..00000000
--- a/modules/nf-core/bwa/mem/tests/main.nf.test.snap
+++ /dev/null
@@ -1,271 +0,0 @@
-{
- "Single-End": {
- "content": [
- [
-
- ],
- [
-
- ],
- [
-
- ],
- [
- "versions.yml:md5,c60680eba0f00e791c0d5a0a6e9d665f"
- ],
- "53df0e7b72f1f85fb28af5fec435246",
- "798439cbd7fd81cbcc5078022dc5479d"
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.5"
- },
- "timestamp": "2025-03-27T08:36:00.831642964"
- },
- "Single-End Sort": {
- "content": [
- [
-
- ],
- [
-
- ],
- [
-
- ],
- [
- "versions.yml:md5,c60680eba0f00e791c0d5a0a6e9d665f"
- ],
- "5eca502b75fefc26e8000908bf0bb3a3",
- "94fcf617f5b994584c4e8d4044e16b4f"
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.5"
- },
- "timestamp": "2025-03-27T08:36:16.025706238"
- },
- "Paired-End": {
- "content": [
- [
-
- ],
- [
-
- ],
- [
-
- ],
- [
- "versions.yml:md5,c60680eba0f00e791c0d5a0a6e9d665f"
- ],
- "fec2aafbba4637767bc4e202c71aee58",
- "57aeef88ed701a8ebc8e2f0a381b2a6"
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.5"
- },
- "timestamp": "2025-03-27T08:36:27.309924644"
- },
- "Paired-End Sort": {
- "content": [
- [
-
- ],
- [
-
- ],
- [
-
- ],
- [
- "versions.yml:md5,c60680eba0f00e791c0d5a0a6e9d665f"
- ],
- "d5ad8844218280969c1f9349bd62d057",
- "af8628d9df18b2d3d4f6fd47ef2bb872"
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.5"
- },
- "timestamp": "2025-03-27T08:36:45.448624985"
- },
- "Single-end - stub": {
- "content": [
- {
- "0": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.bam:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "1": [
-
- ],
- "2": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.csi:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "3": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.crai:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "4": [
- "versions.yml:md5,c60680eba0f00e791c0d5a0a6e9d665f"
- ],
- "bam": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.bam:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "crai": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.crai:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "cram": [
-
- ],
- "csi": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.csi:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "versions": [
- "versions.yml:md5,c60680eba0f00e791c0d5a0a6e9d665f"
- ]
- }
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.5"
- },
- "timestamp": "2025-03-27T08:37:16.211123969"
- },
- "Paired-End - no fasta": {
- "content": [
- [
-
- ],
- [
-
- ],
- [
-
- ],
- [
- "versions.yml:md5,c60680eba0f00e791c0d5a0a6e9d665f"
- ],
- "fec2aafbba4637767bc4e202c71aee58",
- "57aeef88ed701a8ebc8e2f0a381b2a6"
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.5"
- },
- "timestamp": "2025-03-27T08:36:56.592159657"
- },
- "Paired-end - stub": {
- "content": [
- {
- "0": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.bam:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "1": [
-
- ],
- "2": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.csi:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "3": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.crai:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "4": [
- "versions.yml:md5,c60680eba0f00e791c0d5a0a6e9d665f"
- ],
- "bam": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.bam:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "crai": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.crai:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "cram": [
-
- ],
- "csi": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.csi:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "versions": [
- "versions.yml:md5,c60680eba0f00e791c0d5a0a6e9d665f"
- ]
- }
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.5"
- },
- "timestamp": "2025-03-27T08:37:32.177177506"
- }
-}
\ No newline at end of file
diff --git a/modules/nf-core/fastqc/environment.yml b/modules/nf-core/fastqc/environment.yml
deleted file mode 100644
index 691d4c76..00000000
--- a/modules/nf-core/fastqc/environment.yml
+++ /dev/null
@@ -1,5 +0,0 @@
-channels:
- - conda-forge
- - bioconda
-dependencies:
- - bioconda::fastqc=0.12.1
diff --git a/modules/nf-core/fastqc/main.nf b/modules/nf-core/fastqc/main.nf
deleted file mode 100644
index 033f4154..00000000
--- a/modules/nf-core/fastqc/main.nf
+++ /dev/null
@@ -1,64 +0,0 @@
-process FASTQC {
- tag "${meta.id}"
- label 'process_medium'
-
- conda "${moduleDir}/environment.yml"
- container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
- 'https://depot.galaxyproject.org/singularity/fastqc:0.12.1--hdfd78af_0' :
- 'biocontainers/fastqc:0.12.1--hdfd78af_0' }"
-
- input:
- tuple val(meta), path(reads)
-
- output:
- tuple val(meta), path("*.html"), emit: html
- tuple val(meta), path("*.zip") , emit: zip
- path "versions.yml" , emit: versions
-
- when:
- task.ext.when == null || task.ext.when
-
- script:
- def args = task.ext.args ?: ''
- def prefix = task.ext.prefix ?: "${meta.id}"
- // Make list of old name and new name pairs to use for renaming in the bash while loop
- def old_new_pairs = reads instanceof Path || reads.size() == 1 ? [[ reads, "${prefix}.${reads.extension}" ]] : reads.withIndex().collect { entry, index -> [ entry, "${prefix}_${index + 1}.${entry.extension}" ] }
- def rename_to = old_new_pairs*.join(' ').join(' ')
- def renamed_files = old_new_pairs.collect{ _old_name, new_name -> new_name }.join(' ')
-
- // The total amount of allocated RAM by FastQC is equal to the number of threads defined (--threads) time the amount of RAM defined (--memory)
- // https://github.com/s-andrews/FastQC/blob/1faeea0412093224d7f6a07f777fad60a5650795/fastqc#L211-L222
- // Dividing the task.memory by task.cpu allows to stick to requested amount of RAM in the label
- def memory_in_mb = task.memory ? task.memory.toUnit('MB').toFloat() / task.cpus : null
- // FastQC memory value allowed range (100 - 10000)
- def fastqc_memory = memory_in_mb > 10000 ? 10000 : (memory_in_mb < 100 ? 100 : memory_in_mb)
-
- """
- printf "%s %s\\n" ${rename_to} | while read old_name new_name; do
- [ -f "\${new_name}" ] || ln -s \$old_name \$new_name
- done
-
- fastqc \\
- ${args} \\
- --threads ${task.cpus} \\
- --memory ${fastqc_memory} \\
- ${renamed_files}
-
- cat <<-END_VERSIONS > versions.yml
- "${task.process}":
- fastqc: \$( fastqc --version | sed '/FastQC v/!d; s/.*v//' )
- END_VERSIONS
- """
-
- stub:
- def prefix = task.ext.prefix ?: "${meta.id}"
- """
- touch ${prefix}.html
- touch ${prefix}.zip
-
- cat <<-END_VERSIONS > versions.yml
- "${task.process}":
- fastqc: \$( fastqc --version | sed '/FastQC v/!d; s/.*v//' )
- END_VERSIONS
- """
-}
diff --git a/modules/nf-core/fastqc/meta.yml b/modules/nf-core/fastqc/meta.yml
deleted file mode 100644
index 2b2e62b8..00000000
--- a/modules/nf-core/fastqc/meta.yml
+++ /dev/null
@@ -1,67 +0,0 @@
-name: fastqc
-description: Run FastQC on sequenced reads
-keywords:
- - quality control
- - qc
- - adapters
- - fastq
-tools:
- - fastqc:
- description: |
- FastQC gives general quality metrics about your reads.
- It provides information about the quality score distribution
- across your reads, the per base sequence content (%A/C/G/T).
-
- You get information about adapter contamination and other
- overrepresented sequences.
- homepage: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/
- documentation: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/Help/
- licence: ["GPL-2.0-only"]
- identifier: biotools:fastqc
-input:
- - - meta:
- type: map
- description: |
- Groovy Map containing sample information
- e.g. [ id:'test', single_end:false ]
- - reads:
- type: file
- description: |
- List of input FastQ files of size 1 and 2 for single-end and paired-end data,
- respectively.
-output:
- - html:
- - meta:
- type: map
- description: |
- Groovy Map containing sample information
- e.g. [ id:'test', single_end:false ]
- - "*.html":
- type: file
- description: FastQC report
- pattern: "*_{fastqc.html}"
- - zip:
- - meta:
- type: map
- description: |
- Groovy Map containing sample information
- e.g. [ id:'test', single_end:false ]
- - "*.zip":
- type: file
- description: FastQC report archive
- pattern: "*_{fastqc.zip}"
- - versions:
- - versions.yml:
- type: file
- description: File containing software versions
- pattern: "versions.yml"
-authors:
- - "@drpatelh"
- - "@grst"
- - "@ewels"
- - "@FelixKrueger"
-maintainers:
- - "@drpatelh"
- - "@grst"
- - "@ewels"
- - "@FelixKrueger"
diff --git a/modules/nf-core/fastqc/tests/main.nf.test b/modules/nf-core/fastqc/tests/main.nf.test
deleted file mode 100644
index e9d79a07..00000000
--- a/modules/nf-core/fastqc/tests/main.nf.test
+++ /dev/null
@@ -1,309 +0,0 @@
-nextflow_process {
-
- name "Test Process FASTQC"
- script "../main.nf"
- process "FASTQC"
-
- tag "modules"
- tag "modules_nfcore"
- tag "fastqc"
-
- test("sarscov2 single-end [fastq]") {
-
- when {
- process {
- """
- input[0] = Channel.of([
- [ id: 'test', single_end:true ],
- [ file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true) ]
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- // NOTE The report contains the date inside it, which means that the md5sum is stable per day, but not longer than that. So you can't md5sum it.
- // looks like this:
- // https://github.com/nf-core/modules/pull/3903#issuecomment-1743620039
- { assert process.out.html[0][1] ==~ ".*/test_fastqc.html" },
- { assert process.out.zip[0][1] ==~ ".*/test_fastqc.zip" },
- { assert path(process.out.html[0][1]).text.contains("| File type | Conventional base calls |
") },
- { assert snapshot(process.out.versions).match() }
- )
- }
- }
-
- test("sarscov2 paired-end [fastq]") {
-
- when {
- process {
- """
- input[0] = Channel.of([
- [id: 'test', single_end: false], // meta map
- [ file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_2.fastq.gz', checkIfExists: true) ]
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert process.out.html[0][1][0] ==~ ".*/test_1_fastqc.html" },
- { assert process.out.html[0][1][1] ==~ ".*/test_2_fastqc.html" },
- { assert process.out.zip[0][1][0] ==~ ".*/test_1_fastqc.zip" },
- { assert process.out.zip[0][1][1] ==~ ".*/test_2_fastqc.zip" },
- { assert path(process.out.html[0][1][0]).text.contains("| File type | Conventional base calls |
") },
- { assert path(process.out.html[0][1][1]).text.contains("| File type | Conventional base calls |
") },
- { assert snapshot(process.out.versions).match() }
- )
- }
- }
-
- test("sarscov2 interleaved [fastq]") {
-
- when {
- process {
- """
- input[0] = Channel.of([
- [id: 'test', single_end: false], // meta map
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_interleaved.fastq.gz', checkIfExists: true)
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert process.out.html[0][1] ==~ ".*/test_fastqc.html" },
- { assert process.out.zip[0][1] ==~ ".*/test_fastqc.zip" },
- { assert path(process.out.html[0][1]).text.contains("| File type | Conventional base calls |
") },
- { assert snapshot(process.out.versions).match() }
- )
- }
- }
-
- test("sarscov2 paired-end [bam]") {
-
- when {
- process {
- """
- input[0] = Channel.of([
- [id: 'test', single_end: false], // meta map
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/bam/test.paired_end.sorted.bam', checkIfExists: true)
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert process.out.html[0][1] ==~ ".*/test_fastqc.html" },
- { assert process.out.zip[0][1] ==~ ".*/test_fastqc.zip" },
- { assert path(process.out.html[0][1]).text.contains("| File type | Conventional base calls |
") },
- { assert snapshot(process.out.versions).match() }
- )
- }
- }
-
- test("sarscov2 multiple [fastq]") {
-
- when {
- process {
- """
- input[0] = Channel.of([
- [id: 'test', single_end: false], // meta map
- [ file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_2.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test2_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test2_2.fastq.gz', checkIfExists: true) ]
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert process.out.html[0][1][0] ==~ ".*/test_1_fastqc.html" },
- { assert process.out.html[0][1][1] ==~ ".*/test_2_fastqc.html" },
- { assert process.out.html[0][1][2] ==~ ".*/test_3_fastqc.html" },
- { assert process.out.html[0][1][3] ==~ ".*/test_4_fastqc.html" },
- { assert process.out.zip[0][1][0] ==~ ".*/test_1_fastqc.zip" },
- { assert process.out.zip[0][1][1] ==~ ".*/test_2_fastqc.zip" },
- { assert process.out.zip[0][1][2] ==~ ".*/test_3_fastqc.zip" },
- { assert process.out.zip[0][1][3] ==~ ".*/test_4_fastqc.zip" },
- { assert path(process.out.html[0][1][0]).text.contains("| File type | Conventional base calls |
") },
- { assert path(process.out.html[0][1][1]).text.contains("| File type | Conventional base calls |
") },
- { assert path(process.out.html[0][1][2]).text.contains("| File type | Conventional base calls |
") },
- { assert path(process.out.html[0][1][3]).text.contains("| File type | Conventional base calls |
") },
- { assert snapshot(process.out.versions).match() }
- )
- }
- }
-
- test("sarscov2 custom_prefix") {
-
- when {
- process {
- """
- input[0] = Channel.of([
- [ id:'mysample', single_end:true ], // meta map
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true)
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert process.out.html[0][1] ==~ ".*/mysample_fastqc.html" },
- { assert process.out.zip[0][1] ==~ ".*/mysample_fastqc.zip" },
- { assert path(process.out.html[0][1]).text.contains("| File type | Conventional base calls |
") },
- { assert snapshot(process.out.versions).match() }
- )
- }
- }
-
- test("sarscov2 single-end [fastq] - stub") {
-
- options "-stub"
- when {
- process {
- """
- input[0] = Channel.of([
- [ id: 'test', single_end:true ],
- [ file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true) ]
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert snapshot(process.out).match() }
- )
- }
- }
-
- test("sarscov2 paired-end [fastq] - stub") {
-
- options "-stub"
- when {
- process {
- """
- input[0] = Channel.of([
- [id: 'test', single_end: false], // meta map
- [ file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_2.fastq.gz', checkIfExists: true) ]
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert snapshot(process.out).match() }
- )
- }
- }
-
- test("sarscov2 interleaved [fastq] - stub") {
-
- options "-stub"
- when {
- process {
- """
- input[0] = Channel.of([
- [id: 'test', single_end: false], // meta map
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_interleaved.fastq.gz', checkIfExists: true)
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert snapshot(process.out).match() }
- )
- }
- }
-
- test("sarscov2 paired-end [bam] - stub") {
-
- options "-stub"
- when {
- process {
- """
- input[0] = Channel.of([
- [id: 'test', single_end: false], // meta map
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/bam/test.paired_end.sorted.bam', checkIfExists: true)
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert snapshot(process.out).match() }
- )
- }
- }
-
- test("sarscov2 multiple [fastq] - stub") {
-
- options "-stub"
- when {
- process {
- """
- input[0] = Channel.of([
- [id: 'test', single_end: false], // meta map
- [ file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_2.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test2_1.fastq.gz', checkIfExists: true),
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test2_2.fastq.gz', checkIfExists: true) ]
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert snapshot(process.out).match() }
- )
- }
- }
-
- test("sarscov2 custom_prefix - stub") {
-
- options "-stub"
- when {
- process {
- """
- input[0] = Channel.of([
- [ id:'mysample', single_end:true ], // meta map
- file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastq/test_1.fastq.gz', checkIfExists: true)
- ])
- """
- }
- }
-
- then {
- assertAll (
- { assert process.success },
- { assert snapshot(process.out).match() }
- )
- }
- }
-}
diff --git a/modules/nf-core/fastqc/tests/main.nf.test.snap b/modules/nf-core/fastqc/tests/main.nf.test.snap
deleted file mode 100644
index d5db3092..00000000
--- a/modules/nf-core/fastqc/tests/main.nf.test.snap
+++ /dev/null
@@ -1,392 +0,0 @@
-{
- "sarscov2 custom_prefix": {
- "content": [
- [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ]
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:02:16.374038"
- },
- "sarscov2 single-end [fastq] - stub": {
- "content": [
- {
- "0": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "1": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "2": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "html": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "versions": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "zip": [
- [
- {
- "id": "test",
- "single_end": true
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ]
- }
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:02:24.993809"
- },
- "sarscov2 custom_prefix - stub": {
- "content": [
- {
- "0": [
- [
- {
- "id": "mysample",
- "single_end": true
- },
- "mysample.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "1": [
- [
- {
- "id": "mysample",
- "single_end": true
- },
- "mysample.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "2": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "html": [
- [
- {
- "id": "mysample",
- "single_end": true
- },
- "mysample.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "versions": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "zip": [
- [
- {
- "id": "mysample",
- "single_end": true
- },
- "mysample.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ]
- }
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:03:10.93942"
- },
- "sarscov2 interleaved [fastq]": {
- "content": [
- [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ]
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:01:42.355718"
- },
- "sarscov2 paired-end [bam]": {
- "content": [
- [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ]
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:01:53.276274"
- },
- "sarscov2 multiple [fastq]": {
- "content": [
- [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ]
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:02:05.527626"
- },
- "sarscov2 paired-end [fastq]": {
- "content": [
- [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ]
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:01:31.188871"
- },
- "sarscov2 paired-end [fastq] - stub": {
- "content": [
- {
- "0": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "1": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "2": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "html": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "versions": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "zip": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ]
- }
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:02:34.273566"
- },
- "sarscov2 multiple [fastq] - stub": {
- "content": [
- {
- "0": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "1": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "2": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "html": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "versions": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "zip": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ]
- }
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:03:02.304411"
- },
- "sarscov2 single-end [fastq]": {
- "content": [
- [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ]
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:01:19.095607"
- },
- "sarscov2 interleaved [fastq] - stub": {
- "content": [
- {
- "0": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "1": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "2": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "html": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "versions": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "zip": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ]
- }
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:02:44.640184"
- },
- "sarscov2 paired-end [bam] - stub": {
- "content": [
- {
- "0": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "1": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "2": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "html": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ],
- "versions": [
- "versions.yml:md5,e1cc25ca8af856014824abd842e93978"
- ],
- "zip": [
- [
- {
- "id": "test",
- "single_end": false
- },
- "test.zip:md5,d41d8cd98f00b204e9800998ecf8427e"
- ]
- ]
- }
- ],
- "meta": {
- "nf-test": "0.9.0",
- "nextflow": "24.04.3"
- },
- "timestamp": "2024-07-22T11:02:53.550742"
- }
-}
\ No newline at end of file
diff --git a/modules/nf-core/multiqc/environment.yml b/modules/nf-core/multiqc/environment.yml
deleted file mode 100644
index a27122ce..00000000
--- a/modules/nf-core/multiqc/environment.yml
+++ /dev/null
@@ -1,5 +0,0 @@
-channels:
- - conda-forge
- - bioconda
-dependencies:
- - bioconda::multiqc=1.27
diff --git a/modules/nf-core/multiqc/main.nf b/modules/nf-core/multiqc/main.nf
deleted file mode 100644
index 58d9313c..00000000
--- a/modules/nf-core/multiqc/main.nf
+++ /dev/null
@@ -1,63 +0,0 @@
-process MULTIQC {
- label 'process_single'
-
- conda "${moduleDir}/environment.yml"
- container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
- 'https://depot.galaxyproject.org/singularity/multiqc:1.27--pyhdfd78af_0' :
- 'biocontainers/multiqc:1.27--pyhdfd78af_0' }"
-
- input:
- path multiqc_files, stageAs: "?/*"
- path(multiqc_config)
- path(extra_multiqc_config)
- path(multiqc_logo)
- path(replace_names)
- path(sample_names)
-
- output:
- path "*multiqc_report.html", emit: report
- path "*_data" , emit: data
- path "*_plots" , optional:true, emit: plots
- path "versions.yml" , emit: versions
-
- when:
- task.ext.when == null || task.ext.when
-
- script:
- def args = task.ext.args ?: ''
- def prefix = task.ext.prefix ? "--filename ${task.ext.prefix}.html" : ''
- def config = multiqc_config ? "--config $multiqc_config" : ''
- def extra_config = extra_multiqc_config ? "--config $extra_multiqc_config" : ''
- def logo = multiqc_logo ? "--cl-config 'custom_logo: \"${multiqc_logo}\"'" : ''
- def replace = replace_names ? "--replace-names ${replace_names}" : ''
- def samples = sample_names ? "--sample-names ${sample_names}" : ''
- """
- multiqc \\
- --force \\
- $args \\
- $config \\
- $prefix \\
- $extra_config \\
- $logo \\
- $replace \\
- $samples \\
- .
-
- cat <<-END_VERSIONS > versions.yml
- "${task.process}":
- multiqc: \$( multiqc --version | sed -e "s/multiqc, version //g" )
- END_VERSIONS
- """
-
- stub:
- """
- mkdir multiqc_data
- mkdir multiqc_plots
- touch multiqc_report.html
-
- cat <<-END_VERSIONS > versions.yml
- "${task.process}":
- multiqc: \$( multiqc --version | sed -e "s/multiqc, version //g" )
- END_VERSIONS
- """
-}
diff --git a/modules/nf-core/multiqc/meta.yml b/modules/nf-core/multiqc/meta.yml
deleted file mode 100644
index b16c1879..00000000
--- a/modules/nf-core/multiqc/meta.yml
+++ /dev/null
@@ -1,78 +0,0 @@
-name: multiqc
-description: Aggregate results from bioinformatics analyses across many samples into
- a single report
-keywords:
- - QC
- - bioinformatics tools
- - Beautiful stand-alone HTML report
-tools:
- - multiqc:
- description: |
- MultiQC searches a given directory for analysis logs and compiles a HTML report.
- It's a general use tool, perfect for summarising the output from numerous bioinformatics tools.
- homepage: https://multiqc.info/
- documentation: https://multiqc.info/docs/
- licence: ["GPL-3.0-or-later"]
- identifier: biotools:multiqc
-input:
- - - multiqc_files:
- type: file
- description: |
- List of reports / files recognised by MultiQC, for example the html and zip output of FastQC
- - - multiqc_config:
- type: file
- description: Optional config yml for MultiQC
- pattern: "*.{yml,yaml}"
- - - extra_multiqc_config:
- type: file
- description: Second optional config yml for MultiQC. Will override common sections
- in multiqc_config.
- pattern: "*.{yml,yaml}"
- - - multiqc_logo:
- type: file
- description: Optional logo file for MultiQC
- pattern: "*.{png}"
- - - replace_names:
- type: file
- description: |
- Optional two-column sample renaming file. First column a set of
- patterns, second column a set of corresponding replacements. Passed via
- MultiQC's `--replace-names` option.
- pattern: "*.{tsv}"
- - - sample_names:
- type: file
- description: |
- Optional TSV file with headers, passed to the MultiQC --sample_names
- argument.
- pattern: "*.{tsv}"
-output:
- - report:
- - "*multiqc_report.html":
- type: file
- description: MultiQC report file
- pattern: "multiqc_report.html"
- - data:
- - "*_data":
- type: directory
- description: MultiQC data dir
- pattern: "multiqc_data"
- - plots:
- - "*_plots":
- type: file
- description: Plots created by MultiQC
- pattern: "*_data"
- - versions:
- - versions.yml:
- type: file
- description: File containing software versions
- pattern: "versions.yml"
-authors:
- - "@abhi18av"
- - "@bunop"
- - "@drpatelh"
- - "@jfy133"
-maintainers:
- - "@abhi18av"
- - "@bunop"
- - "@drpatelh"
- - "@jfy133"
diff --git a/modules/nf-core/multiqc/tests/main.nf.test b/modules/nf-core/multiqc/tests/main.nf.test
deleted file mode 100644
index 33316a7d..00000000
--- a/modules/nf-core/multiqc/tests/main.nf.test
+++ /dev/null
@@ -1,92 +0,0 @@
-nextflow_process {
-
- name "Test Process MULTIQC"
- script "../main.nf"
- process "MULTIQC"
-
- tag "modules"
- tag "modules_nfcore"
- tag "multiqc"
-
- config "./nextflow.config"
-
- test("sarscov2 single-end [fastqc]") {
-
- when {
- process {
- """
- input[0] = Channel.of(file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastqc/test_fastqc.zip', checkIfExists: true))
- input[1] = []
- input[2] = []
- input[3] = []
- input[4] = []
- input[5] = []
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert process.out.report[0] ==~ ".*/multiqc_report.html" },
- { assert process.out.data[0] ==~ ".*/multiqc_data" },
- { assert snapshot(process.out.versions).match("multiqc_versions_single") }
- )
- }
-
- }
-
- test("sarscov2 single-end [fastqc] [config]") {
-
- when {
- process {
- """
- input[0] = Channel.of(file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastqc/test_fastqc.zip', checkIfExists: true))
- input[1] = Channel.of(file("https://github.com/nf-core/tools/raw/dev/nf_core/pipeline-template/assets/multiqc_config.yml", checkIfExists: true))
- input[2] = []
- input[3] = []
- input[4] = []
- input[5] = []
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert process.out.report[0] ==~ ".*/multiqc_report.html" },
- { assert process.out.data[0] ==~ ".*/multiqc_data" },
- { assert snapshot(process.out.versions).match("multiqc_versions_config") }
- )
- }
- }
-
- test("sarscov2 single-end [fastqc] - stub") {
-
- options "-stub"
-
- when {
- process {
- """
- input[0] = Channel.of(file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/fastqc/test_fastqc.zip', checkIfExists: true))
- input[1] = []
- input[2] = []
- input[3] = []
- input[4] = []
- input[5] = []
- """
- }
- }
-
- then {
- assertAll(
- { assert process.success },
- { assert snapshot(process.out.report.collect { file(it).getName() } +
- process.out.data.collect { file(it).getName() } +
- process.out.plots.collect { file(it).getName() } +
- process.out.versions ).match("multiqc_stub") }
- )
- }
-
- }
-}
diff --git a/modules/nf-core/multiqc/tests/main.nf.test.snap b/modules/nf-core/multiqc/tests/main.nf.test.snap
deleted file mode 100644
index 7b7c1322..00000000
--- a/modules/nf-core/multiqc/tests/main.nf.test.snap
+++ /dev/null
@@ -1,41 +0,0 @@
-{
- "multiqc_versions_single": {
- "content": [
- [
- "versions.yml:md5,8f3b8c1cec5388cf2708be948c9fa42f"
- ]
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.4"
- },
- "timestamp": "2025-01-27T09:29:57.631982377"
- },
- "multiqc_stub": {
- "content": [
- [
- "multiqc_report.html",
- "multiqc_data",
- "multiqc_plots",
- "versions.yml:md5,8f3b8c1cec5388cf2708be948c9fa42f"
- ]
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.4"
- },
- "timestamp": "2025-01-27T09:30:34.743726958"
- },
- "multiqc_versions_config": {
- "content": [
- [
- "versions.yml:md5,8f3b8c1cec5388cf2708be948c9fa42f"
- ]
- ],
- "meta": {
- "nf-test": "0.9.2",
- "nextflow": "24.10.4"
- },
- "timestamp": "2025-01-27T09:30:21.44383553"
- }
-}
\ No newline at end of file
diff --git a/modules/nf-core/multiqc/tests/nextflow.config b/modules/nf-core/multiqc/tests/nextflow.config
deleted file mode 100644
index c537a6a3..00000000
--- a/modules/nf-core/multiqc/tests/nextflow.config
+++ /dev/null
@@ -1,5 +0,0 @@
-process {
- withName: 'MULTIQC' {
- ext.prefix = null
- }
-}
diff --git a/modules/nf-core/multiqc/tests/tags.yml b/modules/nf-core/multiqc/tests/tags.yml
deleted file mode 100644
index bea6c0d3..00000000
--- a/modules/nf-core/multiqc/tests/tags.yml
+++ /dev/null
@@ -1,2 +0,0 @@
-multiqc:
- - modules/nf-core/multiqc/**
diff --git a/modules/nf-core/snpeff/download/environment.yml b/modules/nf-core/snpeff/download/environment.yml
new file mode 100644
index 00000000..48236b6f
--- /dev/null
+++ b/modules/nf-core/snpeff/download/environment.yml
@@ -0,0 +1,7 @@
+---
+# yaml-language-server: $schema=https://raw.githubusercontent.com/nf-core/modules/master/modules/environment-schema.json
+channels:
+ - conda-forge
+ - bioconda
+dependencies:
+ - bioconda::snpeff=5.1
diff --git a/modules/nf-core/snpeff/download/main.nf b/modules/nf-core/snpeff/download/main.nf
new file mode 100644
index 00000000..c77fffe3
--- /dev/null
+++ b/modules/nf-core/snpeff/download/main.nf
@@ -0,0 +1,54 @@
+process SNPEFF_DOWNLOAD {
+ tag "FIXME"
+ label 'process_medium'
+
+ conda "${moduleDir}/environment.yml"
+ container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
+ 'https://depot.galaxyproject.org/singularity/snpeff:5.1--hdfd78af_2' :
+ 'biocontainers/snpeff:5.1--hdfd78af_2' }"
+
+ input:
+ tuple val(meta), val(snpeff_db)
+
+ output:
+ tuple val(meta), path('snpeff_cache'), emit: cache
+ path "versions.yml" , emit: versions
+
+ when:
+ task.ext.when == null || task.ext.when
+
+ script:
+ def args = task.ext.args ?: ''
+ def avail_mem = 6144
+ if (!task.memory) {
+ log.info '[snpEff] Available memory not known - defaulting to 6GB. Specify process memory requirements to change this.'
+ } else {
+ avail_mem = (task.memory.mega*0.8).intValue()
+ }
+ """
+ snpEff \\
+ -Xmx${avail_mem}M \\
+ download ${snpeff_db} \\
+ -dataDir \${PWD}/snpeff_cache \\
+ ${args}
+
+
+ cat <<-END_VERSIONS > versions.yml
+ "${task.process}":
+ snpeff: \$(echo \$(snpEff -version 2>&1) | cut -f 2 -d ' ')
+ END_VERSIONS
+ """
+
+ stub:
+ """
+ mkdir -p snpeff_cache/${snpeff_db}
+
+ touch snpeff_cache/${snpeff_db}/sequence.I.bin
+ touch snpeff_cache/${snpeff_db}/sequence.bin
+
+ cat <<-END_VERSIONS > versions.yml
+ "${task.process}":
+ snpeff: \$(echo \$(snpEff -version 2>&1) | cut -f 2 -d ' ')
+ END_VERSIONS
+ """
+}
diff --git a/modules/nf-core/snpeff/download/meta.yml b/modules/nf-core/snpeff/download/meta.yml
new file mode 100644
index 00000000..a3211fc7
--- /dev/null
+++ b/modules/nf-core/snpeff/download/meta.yml
@@ -0,0 +1,49 @@
+name: snpeff_download
+description: Genetic variant annotation and functional effect prediction toolbox
+keywords:
+ - annotation
+ - effect prediction
+ - snpeff
+ - variant
+ - vcf
+tools:
+ - snpeff:
+ description: |
+ SnpEff is a variant annotation and effect prediction tool.
+ It annotates and predicts the effects of genetic variants on genes and proteins (such as amino acid changes).
+ homepage: https://pcingola.github.io/SnpEff/
+ documentation: https://pcingola.github.io/SnpEff/se_introduction/
+ licence: ["MIT"]
+ identifier: biotools:snpeff
+input:
+ - - meta:
+ type: map
+ description: |
+ Groovy Map containing sample information
+ e.g. [ id:'test', single_end:false ]
+ - genome:
+ type: file
+ description: Reference genome in FASTA format
+ pattern: "*.{fasta,fna,fa}"
+ - cache_version:
+ type: string
+ description: Version of the snpEff cache to download
+output:
+ - cache:
+ - meta:
+ type: file
+ description: |
+ snpEff cache
+ - snpeff_cache:
+ type: file
+ description: |
+ snpEff cache
+ - versions:
+ - versions.yml:
+ type: file
+ description: File containing software versions
+ pattern: "versions.yml"
+authors:
+ - "@maxulysse"
+maintainers:
+ - "@maxulysse"
diff --git a/modules/nf-core/snpeff/download/tests/main.nf.test b/modules/nf-core/snpeff/download/tests/main.nf.test
new file mode 100644
index 00000000..ef547c6f
--- /dev/null
+++ b/modules/nf-core/snpeff/download/tests/main.nf.test
@@ -0,0 +1,51 @@
+
+nextflow_process {
+
+ name "Test Process SNPEFF_DOWNLOAD"
+ script "../main.nf"
+ process "SNPEFF_DOWNLOAD"
+
+ tag "modules"
+ tag "modules_nfcore"
+ tag "snpeff"
+ tag "snpeff/download"
+
+ test("test-snpeff-download") {
+
+ when {
+ process {
+ """
+ input[0] = [ [ id:"WBcel235.105" ], "WBcel235.105" ]
+
+ """
+ }
+ }
+
+ then {
+ assertAll(
+ { assert process.success },
+ { assert snapshot(process.out).match() }
+ )
+ }
+ }
+
+ test("test-snpeff-download-stub") {
+ options '-stub'
+ when {
+ process {
+ """
+ input[0] = [ [ id:"WBcel235.105" ], "WBcel235.105" ]
+
+ """
+ }
+ }
+
+ then {
+ assertAll(
+ { assert process.success },
+ { assert snapshot(process.out).match() }
+ )
+ }
+ }
+
+}
diff --git a/modules/nf-core/snpeff/download/tests/main.nf.test.snap b/modules/nf-core/snpeff/download/tests/main.nf.test.snap
new file mode 100644
index 00000000..5bccdd8a
--- /dev/null
+++ b/modules/nf-core/snpeff/download/tests/main.nf.test.snap
@@ -0,0 +1,100 @@
+{
+ "test-snpeff-download-stub": {
+ "content": [
+ {
+ "0": [
+ [
+ {
+ "id": "WBcel235.105"
+ },
+ [
+ [
+ "sequence.I.bin:md5,d41d8cd98f00b204e9800998ecf8427e",
+ "sequence.bin:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ]
+ ]
+ ],
+ "1": [
+ "versions.yml:md5,5fc7ed9f548eccf5fac9fdefc12ef56e"
+ ],
+ "cache": [
+ [
+ {
+ "id": "WBcel235.105"
+ },
+ [
+ [
+ "sequence.I.bin:md5,d41d8cd98f00b204e9800998ecf8427e",
+ "sequence.bin:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ]
+ ]
+ ],
+ "versions": [
+ "versions.yml:md5,5fc7ed9f548eccf5fac9fdefc12ef56e"
+ ]
+ }
+ ],
+ "meta": {
+ "nf-test": "0.8.4",
+ "nextflow": "24.04.4"
+ },
+ "timestamp": "2024-09-19T12:48:45.183665736"
+ },
+ "test-snpeff-download": {
+ "content": [
+ {
+ "0": [
+ [
+ {
+ "id": "WBcel235.105"
+ },
+ [
+ [
+ "sequence.I.bin:md5,2fd1694bd91cf7952cbad8cfed161e53",
+ "sequence.II.bin:md5,bacedbdea89508e108223767fa260a4c",
+ "sequence.III.bin:md5,444118a9fb9d0a03c37e86094d8e52a9",
+ "sequence.IV.bin:md5,ff756628faa0b71cd65495668c3d82b5",
+ "sequence.V.bin:md5,d6ad5476162ac45829f719dd4ee3f4e7",
+ "sequence.X.bin:md5,b79bec6cc8f96b8373dac56bab5d0a6c",
+ "sequence.bin:md5,ec2bc2ae81755ab90fcf1848bc7ce41f",
+ "snpEffectPredictor.bin:md5,1d99251d0405f0a42913ed8b5b2c2fa7"
+ ]
+ ]
+ ]
+ ],
+ "1": [
+ "versions.yml:md5,5fc7ed9f548eccf5fac9fdefc12ef56e"
+ ],
+ "cache": [
+ [
+ {
+ "id": "WBcel235.105"
+ },
+ [
+ [
+ "sequence.I.bin:md5,2fd1694bd91cf7952cbad8cfed161e53",
+ "sequence.II.bin:md5,bacedbdea89508e108223767fa260a4c",
+ "sequence.III.bin:md5,444118a9fb9d0a03c37e86094d8e52a9",
+ "sequence.IV.bin:md5,ff756628faa0b71cd65495668c3d82b5",
+ "sequence.V.bin:md5,d6ad5476162ac45829f719dd4ee3f4e7",
+ "sequence.X.bin:md5,b79bec6cc8f96b8373dac56bab5d0a6c",
+ "sequence.bin:md5,ec2bc2ae81755ab90fcf1848bc7ce41f",
+ "snpEffectPredictor.bin:md5,1d99251d0405f0a42913ed8b5b2c2fa7"
+ ]
+ ]
+ ]
+ ],
+ "versions": [
+ "versions.yml:md5,5fc7ed9f548eccf5fac9fdefc12ef56e"
+ ]
+ }
+ ],
+ "meta": {
+ "nf-test": "0.8.4",
+ "nextflow": "24.04.4"
+ },
+ "timestamp": "2024-08-29T14:27:47.123555"
+ }
+}
\ No newline at end of file
diff --git a/modules/nf-core/snpeff/snpeff/environment.yml b/modules/nf-core/snpeff/snpeff/environment.yml
new file mode 100644
index 00000000..48236b6f
--- /dev/null
+++ b/modules/nf-core/snpeff/snpeff/environment.yml
@@ -0,0 +1,7 @@
+---
+# yaml-language-server: $schema=https://raw.githubusercontent.com/nf-core/modules/master/modules/environment-schema.json
+channels:
+ - conda-forge
+ - bioconda
+dependencies:
+ - bioconda::snpeff=5.1
diff --git a/modules/nf-core/snpeff/snpeff/main.nf b/modules/nf-core/snpeff/snpeff/main.nf
new file mode 100644
index 00000000..83598810
--- /dev/null
+++ b/modules/nf-core/snpeff/snpeff/main.nf
@@ -0,0 +1,65 @@
+process SNPEFF_SNPEFF {
+ tag "FIXME"
+ label 'process_medium'
+
+ conda "${moduleDir}/environment.yml"
+ container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
+ 'https://depot.galaxyproject.org/singularity/snpeff:5.1--hdfd78af_2' :
+ 'biocontainers/snpeff:5.1--hdfd78af_2' }"
+
+ input:
+ tuple val(meta), path(vcf)
+ val db
+ tuple val(meta2), path(cache)
+
+ output:
+ tuple val(meta), path("*.ann.vcf"), emit: vcf
+ tuple val(meta), path("*.csv"), emit: report
+ tuple val(meta), path("*.html"), emit: summary_html
+ tuple val(meta), path("*.genes.txt"), emit: genes_txt
+ path "versions.yml" , emit: versions
+
+ when:
+ task.ext.when == null || task.ext.when
+
+ script:
+ def args = task.ext.args ?: ''
+ def avail_mem = 6144
+ if (!task.memory) {
+ log.info '[snpEff] Available memory not known - defaulting to 6GB. Specify process memory requirements to change this.'
+ } else {
+ avail_mem = (task.memory.mega*0.8).intValue()
+ }
+ def prefix = "joint" //task.ext.prefix ?: "${meta.id}"
+ def cache_command = cache ? "-dataDir \${PWD}/${cache}" : ""
+ """
+ snpEff \\
+ -Xmx${avail_mem}M \\
+ $db \\
+ $args \\
+ -csvStats ${prefix}.csv \\
+ $cache_command \\
+ $vcf \\
+ > ${prefix}.ann.vcf
+
+ cat <<-END_VERSIONS > versions.yml
+ "${task.process}":
+ snpeff: \$(echo \$(snpEff -version 2>&1) | cut -f 2 -d ' ')
+ END_VERSIONS
+ """
+
+ stub:
+ def prefix = "" //task.ext.prefix ?: "${meta.id}"
+ """
+ touch ${prefix}.ann.vcf
+ touch ${prefix}.csv
+ touch ${prefix}.html
+ touch ${prefix}.genes.txt
+
+ cat <<-END_VERSIONS > versions.yml
+ "${task.process}":
+ snpeff: \$(echo \$(snpEff -version 2>&1) | cut -f 2 -d ' ')
+ END_VERSIONS
+ """
+
+}
diff --git a/modules/nf-core/snpeff/snpeff/meta.yml b/modules/nf-core/snpeff/snpeff/meta.yml
new file mode 100644
index 00000000..ef3d495a
--- /dev/null
+++ b/modules/nf-core/snpeff/snpeff/meta.yml
@@ -0,0 +1,90 @@
+name: snpeff_snpeff
+description: Genetic variant annotation and functional effect prediction toolbox
+keywords:
+ - annotation
+ - effect prediction
+ - snpeff
+ - variant
+ - vcf
+tools:
+ - snpeff:
+ description: |
+ SnpEff is a variant annotation and effect prediction tool.
+ It annotates and predicts the effects of genetic variants on genes and proteins (such as amino acid changes).
+ homepage: https://pcingola.github.io/SnpEff/
+ documentation: https://pcingola.github.io/SnpEff/se_introduction/
+ licence: ["MIT"]
+ identifier: biotools:snpeff
+input:
+ - - meta:
+ type: map
+ description: |
+ Groovy Map containing sample information
+ e.g. [ id:'test', single_end:false ]
+ - vcf:
+ type: file
+ description: |
+ vcf to annotate
+ - - db:
+ type: string
+ description: |
+ which db to annotate with
+ - - meta2:
+ type: map
+ description: |
+ Groovy Map containing sample information
+ e.g. [ id:'test', single_end:false ]
+ - cache:
+ type: file
+ description: |
+ path to snpEff cache (optional)
+output:
+ - vcf:
+ - meta:
+ type: file
+ description: |
+ annotated vcf
+ pattern: "*.ann.vcf"
+ - "*.ann.vcf":
+ type: file
+ description: |
+ annotated vcf
+ pattern: "*.ann.vcf"
+ - report:
+ - meta:
+ type: file
+ description: snpEff report csv file
+ pattern: "*.csv"
+ - "*.csv":
+ type: file
+ description: snpEff report csv file
+ pattern: "*.csv"
+ - summary_html:
+ - meta:
+ type: file
+ description: snpEff summary statistics in html file
+ pattern: "*.html"
+ - "*.html":
+ type: file
+ description: snpEff summary statistics in html file
+ pattern: "*.html"
+ - genes_txt:
+ - meta:
+ type: file
+ description: txt (tab separated) file having counts of the number of variants
+ affecting each transcript and gene
+ pattern: "*.genes.txt"
+ - "*.genes.txt":
+ type: file
+ description: txt (tab separated) file having counts of the number of variants
+ affecting each transcript and gene
+ pattern: "*.genes.txt"
+ - versions:
+ - versions.yml:
+ type: file
+ description: File containing software versions
+ pattern: "versions.yml"
+authors:
+ - "@maxulysse"
+maintainers:
+ - "@maxulysse"
diff --git a/modules/nf-core/snpeff/snpeff/tests/main.nf.test b/modules/nf-core/snpeff/snpeff/tests/main.nf.test
new file mode 100644
index 00000000..661e9672
--- /dev/null
+++ b/modules/nf-core/snpeff/snpeff/tests/main.nf.test
@@ -0,0 +1,87 @@
+nextflow_process {
+
+ name "Test Process SNPEFF_SNPEFF"
+ script "../main.nf"
+ process "SNPEFF_SNPEFF"
+ config "./nextflow.config"
+ tag "modules"
+ tag "modules_nfcore"
+ tag "modules_snpeff"
+ tag "snpeff"
+ tag "snpeff/download"
+ tag "snpeff/snpeff"
+
+ test("test_SNPEFF_SNPEFF") {
+
+ setup {
+ run("SNPEFF_DOWNLOAD") {
+ script "../../download/main.nf"
+ process {
+ """
+ input[0] = Channel.of([[id:params.snpeff_db], params.snpeff_db])
+ """
+ }
+ }
+ }
+
+ when {
+ process {
+ """
+ input[0] = Channel.of([
+ [ id:'test' ], // meta map
+ file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/vcf/test.vcf', checkIfExists: true)
+ ])
+ input[1] = params.snpeff_db
+ input[2] = SNPEFF_DOWNLOAD.out.cache
+ """
+ }
+ }
+
+ then {
+ assertAll(
+ { assert process.success },
+ { assert path(process.out.report[0][1]).exists() },
+ { assert path(process.out.summary_html[0][1]).exists() },
+ { assert path(process.out.vcf[0][1]).exists() },
+ { assert snapshot(process.out.genes_txt).match("genes_txt") },
+ { assert snapshot(process.out.versions).match("versions") }
+ )
+ }
+ }
+
+ test("test_SNPEFF_SNPEFF - stub") {
+
+ options "-stub"
+
+ setup {
+ run("SNPEFF_DOWNLOAD") {
+ script "../../download/main.nf"
+ process {
+ """
+ input[0] = Channel.of([[id:params.snpeff_db], params.snpeff_db])
+ """
+ }
+ }
+ }
+
+ when {
+ process {
+ """
+ input[0] = Channel.of([
+ [ id:'test' ], // meta map
+ file(params.modules_testdata_base_path + 'genomics/sarscov2/illumina/vcf/test.vcf', checkIfExists: true)
+ ])
+ input[1] = params.snpeff_db
+ input[2] = SNPEFF_DOWNLOAD.out.cache
+ """
+ }
+ }
+
+ then {
+ assertAll(
+ { assert process.success },
+ { assert snapshot(process.out).match() },
+ )
+ }
+ }
+}
diff --git a/modules/nf-core/snpeff/snpeff/tests/main.nf.test.snap b/modules/nf-core/snpeff/snpeff/tests/main.nf.test.snap
new file mode 100644
index 00000000..9fc0c9f5
--- /dev/null
+++ b/modules/nf-core/snpeff/snpeff/tests/main.nf.test.snap
@@ -0,0 +1,112 @@
+{
+ "versions": {
+ "content": [
+ [
+ "versions.yml:md5,25d44a118d558b331d51ec00be0d997c"
+ ]
+ ],
+ "meta": {
+ "nf-test": "0.8.4",
+ "nextflow": "24.02.0"
+ },
+ "timestamp": "2024-03-18T17:37:18.879477"
+ },
+ "genes_txt": {
+ "content": [
+ [
+ [
+ {
+ "id": "test"
+ },
+ "test.genes.txt:md5,130536bf0237d7f3f746d32aaa32840a"
+ ]
+ ]
+ ],
+ "meta": {
+ "nf-test": "0.8.4",
+ "nextflow": "24.02.0"
+ },
+ "timestamp": "2024-03-18T17:37:18.874822"
+ },
+ "test_SNPEFF_SNPEFF - stub": {
+ "content": [
+ {
+ "0": [
+ [
+ {
+ "id": "test"
+ },
+ "test.ann.vcf:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ],
+ "1": [
+ [
+ {
+ "id": "test"
+ },
+ "test.csv:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ],
+ "2": [
+ [
+ {
+ "id": "test"
+ },
+ "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ],
+ "3": [
+ [
+ {
+ "id": "test"
+ },
+ "test.genes.txt:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ],
+ "4": [
+ "versions.yml:md5,25d44a118d558b331d51ec00be0d997c"
+ ],
+ "genes_txt": [
+ [
+ {
+ "id": "test"
+ },
+ "test.genes.txt:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ],
+ "report": [
+ [
+ {
+ "id": "test"
+ },
+ "test.csv:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ],
+ "summary_html": [
+ [
+ {
+ "id": "test"
+ },
+ "test.html:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ],
+ "vcf": [
+ [
+ {
+ "id": "test"
+ },
+ "test.ann.vcf:md5,d41d8cd98f00b204e9800998ecf8427e"
+ ]
+ ],
+ "versions": [
+ "versions.yml:md5,25d44a118d558b331d51ec00be0d997c"
+ ]
+ }
+ ],
+ "meta": {
+ "nf-test": "0.9.2",
+ "nextflow": "24.10.4"
+ },
+ "timestamp": "2025-03-05T14:55:15.626663647"
+ }
+}
\ No newline at end of file
diff --git a/modules/nf-core/snpeff/snpeff/tests/nextflow.config b/modules/nf-core/snpeff/snpeff/tests/nextflow.config
new file mode 100644
index 00000000..a950a047
--- /dev/null
+++ b/modules/nf-core/snpeff/snpeff/tests/nextflow.config
@@ -0,0 +1,3 @@
+params {
+ snpeff_db = "WBcel235.105"
+}
diff --git a/resources/genome/NC_002945v4.dict b/resources/genome/NC_002945v4.dict
new file mode 100644
index 00000000..c0dc903b
--- /dev/null
+++ b/resources/genome/NC_002945v4.dict
@@ -0,0 +1,2 @@
+@HD VN:1.0 SO:unsorted
+@SQ SN:NC_002945v4 LN:4349904 M5:32d696d7c1da76474a24beb2240554e0 UR:file:///home/ubuntu/tools/magma/genomeMbov/NC_002945v4.fa
diff --git a/resources/genome/NC_002945v4.fa b/resources/genome/NC_002945v4.fa
new file mode 100644
index 00000000..a8d64a15
--- /dev/null
+++ b/resources/genome/NC_002945v4.fa
@@ -0,0 +1,62144 @@
+>NC_002945v4 Mycobacterium bovis AF2122/97 genome assembly, chromosome: Mycobacterium_bovis_AF2122/97
+TTGACCGATGACCCCGGTTCAGGCTTCACCACAGTGTGGAACGCGGTCGTCTCCGAACTTAACGGCGACC
+CTAAGGTTGACGACGGACCCAGCAGTGATGCTAATCTCAGCGCTCCGCTGACCCCTCAGCAAAGGGCTTG
+GCTCAATCTCGTCCAGCCATTGACCATCGTCGAGGGGTTTGCTCTGTTATCCGTGCCGAGCAGCTTTGTC
+CAAAACGAAATCGAGCGCCATCTGCGGGCCCCGATTACCGACGCTCTCAGCCGCCGACTCGGACATCAGA
+TCCAACTCGGGGTCCGCATCGCTCCGCCGGCGACCGACGAAGCCGACGACACTACCGTGCCGCCTTCCGA
+AAATCCTGCTACCACATCGCCAGACACCACAACCGACAACGACGAGATTGATGACAGCGCTGCGGCACGG
+GGCGATAACCAGCACAGTTGGCCAAGTTACTTCACCGAGCGCCCGCGCAATACCGATTCCGCTACCGCTG
+GCGTAACCAGCCTTAACCGTCGCTACACCTTTGATACGTTCGTTATCGGCGCCTCCAACCGGTTCGCGCA
+CGCCGCCGCCTTGGCGATCGCAGAAGCACCCGCCCGCGCTTACAACCCCCTGTTCATCTGGGGCGAGTCC
+GGTCTCGGCAAGACACACCTGCTACACGCGGCAGGCAACTATGCCCAACGGTTGTTCCCGGGAATGCGGG
+TCAAATATGTCTCCACCGAGGAATTCACCAACGACTTCATTAACTCGCTCCGCGATGACCGCAAGGTCGC
+ATTCAAACGCAGCTACCGCGACGTAGACGTGCTGTTGGTCGACGACATCCAATTCATTGAAGGCAAAGAG
+GGTATTCAAGAGGAGTTCTTCCACACCTTCAACACCTTGCACAATGCCAACAAGCAAATCGTCATCTCAT
+CTGACCGCCCACCCAAGCAGCTCGCCACCCTCGAGGACCGGCTGAGAACCCGCTTTGAGTGGGGGCTGAT
+CACTGACGTACAACCACCCGAGCTGGAGACCCGCATCGCCATCTTGCGCAAGAAAGCACAGATGGAACGG
+CTCGCGATCCCCGACGATGTCCTCGAACTCATCGCCAGCAGTATCGAACGCAATATCCGTGAACTCGAGG
+GCGCGCTGATCCGGGTCACCGCGTTCGCCTCATTGAACAAAACACCAATCGACAAAGCGCTGGCCGAGAT
+TGTGCTTCGCGATCTGATCGCCGACGCCAACACCATGCAAATCAGCGCGGCGACGATCATGGCTGCCACC
+GCCGAATACTTCGACACTACCGTCGAAGAGCTTCGCGGGCCCGGCAAGACCCGAGCACTGGCCCAGTCAC
+GACAGATTGCGATGTACCTGTGTCGTGAGCTCACCGATCTTTCGTTGCCCAAAATCGGCCAAGCGTTCGG
+CCGTGATCACACAACCGTCATGTACGCCCAACGCAAGATCCTGTCCGAGATGGCCGAGCGCCGTGAGGTC
+TTTGATCACGTCAAAGAACTCACCACTCGCATCCGTCAGCGCTCCAAGCGCTAGCACGGCGTGTTCTTCC
+GACAACGTTCTTAAAAAAACTTCTCTCTCCCAGGTCACACCAGTCACAGAGATTGGCTGTGAGTGTCGCT
+GTGCACAAACCGCGCACAGACTCATACAGTCCCGGCGGTTCCGTTCACAACCCACGCCTCATCCCCACCG
+ACCCAACACACACCCCACAGTCATCGCCACCGTCATCCACAACTCCGACCGACGTCGACCTGCACCAAGA
+CCAGACTGTCCCCAAACTGCACACCCTCTAATACTGTTACCGAGATTTCTTCGTCGTTTGTTCTTGGAAA
+GACAGCGCTGGGGATCGTTCGCTGGATACCACCCGCATAACTGGCTCGTCGCGGTGGGTCAGAGGTCAAT
+GATGAACTTTCAAGTTGACGTGAGAAGCTCTACGGTTGTTGTTCGACTGCTGTTGCGGCCGTCGTGGCGG
+GTCACGCGTCATGGGCGTTCGTCGTTGGCAGTCCCCACGCTAGCGGGGCGCTAGCCACGGGATCGAACTC
+ATCGTGAGGTGAAAGGGCGCAATGGACGCGGCTACGACAAGAGTTGGCCTCACCGACTTGACGTTTCGTT
+TGCTACGAGAGTCTTTCGCCGATGCGGTGTCGTGGGTGGCTAAAAATCTGCCAGCCAGGCCCGCGGTGCC
+GGTGCTCTCCGGCGTGTTGTTGACCGGCTCGGACAACGGTCTGACGATTTCCGGATTCGACTACGAGGTT
+TCCGCCGAGGCCCAGGTTGGCGCTGAAATTGTTTCTCCTGGAAGCGTTTTAGTTTCTGGCCGATTGTTGT
+CCGATATTACCCGGGCGTTGCCTAACAAGCCCGTAGGCGTTCATGTCGAAGGTAACCGGGTCGCATTGAC
+CTGCGGTAACGCCAGGTTTTCGCTACCGACGATGCCAGTCGAGGATTATCCGACGCTGCCGACGCTGCCG
+GAAGAGACCGGATTGTTGCCTGCGGAATTATTCGCCGAGGCAATCAGTCAGGTCGCTATCGCCGCCGGCC
+GGGACGACACGCTGCCTATGTTGACCGGCATCCGGGTCGAAATCCTCGGTGAGACGGTGGTTTTGGCCGC
+TACCGACAGGTTTCGCCTGGCTGTTCGAGAACTGAAGTGGTCGGCGTCGTCGCCAGATATCGAAGCGGCT
+GTGCTGGTCCCGGCCAAGACGCTGGCCGAGGCCGCCAAAGCGGGCATCGGCGGCTCTGACGTTCGTTTGT
+CGTTGGGTACTGGGCCGGGGGTGGGCAAGGATGGCCTGCTCGGTATCAGTGGGAACGGCAAGCGCAGCAC
+CACGCGACTTCTTGATGCCGAGTTCCCGAAGTTTCGGCAGTTGCTACCAACCGAACACACCGCGGTGGCC
+ACCATGGACGTGGCCGAGTTGATCGAAGCGATCAAGCTGGTTGCGTTGGTAGCTGATCGGGGCGCGCAGG
+TGCGCATGGAGTTCGCTGATGGCAGCGTGCGGCTTTCTGCGGGTGCCGATGATGTTGGACGAGCCGAGGA
+AGATCTTGTTGTTGACTATGCCGGTGAACCATTGACGATTGCGTTTAACCCAACCTATCTAACGGACGGT
+TTGAGTTCGTTGCGCTCGGAGCGAGTGTCTTTCGGGTTTACGACTGCGGGTAAGCCTGCCTTGCTACGTC
+CGGTGTCCGGGGACGATCGCCCTGTGGCGGGTCTGAATGGCAACGGTCCGTTCCCGGCGGTGTCGACGGA
+CTATGTCTATCTGTTGATGCCGGTTCGGTTGCCGGGCTGAGCACTTGGCGCCCGGGTAGGTGTACGTCCG
+TCATTTGGGGCTGCGTGACTTCCGGTCCTGGGCATGTGTAGATCTGGAATTGCATCCAGGGCGGACGGTT
+TTTGTTGGGCCTAACGGTTATGGTAAGACGAATCTTATTGAGGCACTGTGGTATTCGACGACGTTAGGTT
+CGCACCGCGTTAGCGCCGATTTGCCGTTGATCCGGGTAGGTACCGATCGTGCGGTGATCTCCACGATCGT
+GGTGAACGACGGTAGAGAATGTGCCGTCGACCTCGAGATCGCCACGGGGCGAGTCAACAAAGCGCGATTG
+AATCGATCATCGGTCCGAAGTACACGTGATGTGGTCGGAGTGCTTCGAGCTGTGTTGTTTGCCCCTGAGG
+ATCTGGGGTTGGTTCGTGGGGATCCCGCTGACCGGCGGCGCTATCTGGATGATCTGGCGATCGTGCGTAG
+GCCTGCGATCGCTGCGGTACGAGCCGAATATGAGAGGGTGGTGCGCCAGCGGACGGCGTTATTGAAGTCC
+GTACCTGGAGCACGGTATCGGGGTGACCGGGGTGTGTTTGACACTCTTGAGGTATGGGACAGTCGTTTGG
+CGGAGCACGGGGCTGAACTGGTGGCCGCCCGCATCGATTTGGTCAACCAGTTGGCACCGGAAGTGAAGAA
+GGCATACCAGCTGTTGGCGCCGGAATCGCGATCGGCGTCTATCGGTTATCGGGCCAGCATGGATGTAACC
+GGTCCCAGCGAGCAGTCAGATACCGATCGGCAATTGTTAGCAGCTCGGCTGTTGGCGGCGCTGGCGGCCC
+GTCGGGATGCCGAACTCGAGCGTGGGGTTTGTCTAGTTGGTCCGCACCGTGACGACCTAATACTGCGACT
+AGGCGATCAACCCGCGAAAGGATTTGCTAGCCATGGGGAGGCGTGGTCGTTGGCGGTGGCACTGCGGTTG
+GCGGCCTATCAACTGTTACGCGTTGATGGTGGTGAGCCGGTGTTGTTGCTCGACGACGTGTTCGCCGAAC
+TGGATGTCATGCGCCGTCGAGCGTTGGCGACGGCGGCCGAGTCCGCCGAACAGGTGTTGGTGACTGCCGC
+GGTGCTCGAGGATATTCCCGCCGGCTGGGACGCCAGGCGGGTGCACATCGATGTGCGTGCCGATGACACC
+GGATCGATGTCGGTGGTTCTGCCATGACGGGTTCTGTTGACCGGCCCGACCAGAATCGCGGTGAGCGATT
+AATGAAGTCACCAGGGTTGGATTTGGTCAGGCGCACCCTGGACGAAGCTCGTGCTGCTGCCCGCGCGCGC
+GGACAAGACGCCGGTCGAGGGCGGGTCGCTTCCGTTGCGTCGGGTCGGGTGGCCGGACGGCGACGAAGCT
+GGTCGGGTCCGGGGCCCGACATTCGTGATCCACAACCGCTGGGTAAGGCCGCTCGTGAGCTGGCAAAGAA
+ACGCGGCTGGTCGGTGCGGGTCGCCGAGGGTATGGTGCTCGGCCAGTGGTCTGCGGTGGTCGGCCACCAG
+ATCGCCGAACATGCACGCCCGACTGCGCTAAACGACGGGGTGTTGAGCGTGATTGCGGAGTCGACGGCGT
+GGGCGACGCAGTTGAGGATCATGCAGGCCCAGCTTCTGGCCAAGATCGCCGCAGCGGTTGGCAACGATGT
+GGTGCGATCGCTAAAGATCACCGGGCCGGCGGCACCATCGTGGCGCAAGGGGCCTCGCCATATTGCCGGT
+AGGGGTCCGCGCGACACCTACGGATAACACGTCGATCGGCCCAGAACAAGGCGCTCCGGTCCCGGCCTGA
+GAGCCTCGAGGACGAAGCGGATCCGTATGCCGGACGTCGGGACGCACCAGGAAGAAAGATGTCCGACGCA
+CGGCGCGGTTAGATGGGTAAAAACGAGGCCAGAAGATCGGCCCTGGCGCCCGATCACGGTACAGTGGTGT
+GCGACCCCCTGCGGCGACTCAACCGCATGCACGCAACCCCTGAGGAGAGTATTCGGATCGTGGCTGCCCA
+GAAAAAGAAGGCCCAAGACGAATACGGCGCTGCGTCTATCACCATTCTCGAAGGGCTGGAGGCCGTCCGC
+AAACGTCCCGGCATGTACATTGGCTCGACCGGTGAGCGCGGTTTACACCATCTCATTTGGGAGGTGGTCG
+ACAACGCGGTCGACGAGGCGATGGCCGGTTATGCAACCACAGTGAACGTAGTGCTGCTTGAGGATGGCGG
+TGTCGAGGTCGCCGACGACGGCCGCGGCATTCCGGTCGCCACCCACGCCTCCGGCATACCGACCGTCGAC
+GTGGTGATGACACAACTACATGCCGGCGGCAAGTTCGACTCGGACGCGTATGCGATATCTGGTGGTCTGC
+ACGGCGTCGGCGTGTCGGTGGTTAACGCGCTATCCACCCGGCTCGAAGTCGAGATCAAGCGCGACGGGTA
+CGAGTGGTCTCAGGTTTATGAGAAGTCGGAACCCCTGGGCCTCAAGCAAGGGGCGCCGACCAAGAAGACG
+GGGTCAACGGTACGGTTCTGGGCCGACCCCGCTGTTTTCGAAACCACGGAATACGACTTCGAAACCGTCG
+CCCGCCGGCTGCAAGAGATGGCGTTCCTCAACAAGGGGCTGACCATCAACCTGACCGACGAGAGGGTGAC
+CCAAGACGAGGTCGTCGACGAAGTGGTCAGCGACGTCGCCGAGGCGCCGAAGTCGGCAAGTGAACGCGCA
+GCCGAATCCACTGCACCGCACAAAGTTAAGAGCCGCACCTTTCACTATCCGGGTGGCCTGGTGGACTTCG
+TGAAACACATCAACCGCACCAAGAACGCGATTCATAGCAGCATCGTGGACTTTTCCGGCAAGGGCACCGG
+GCACGAGGTGGAGATCGCGATGCAATGGAACGCCGGGTATTCGGAGTCGGTGCACACCTTCGCCAACACC
+ATCAACACCCACGAGGGCGGCACCCACGAAGAGGGCTTCCGCAGCGCGCTGACGTCGGTGGTGAACAAGT
+ACGCCAAGGACCGCAAGCTACTGAAGGACAAGGACCCCAACCTCACCGGTGACGATATCCGGGAAGGCCT
+GGCCGCTGTGATCTCGGTGAAGGTCAGCGAACCGCAGTTCGAGGGCCAGACCAAGACCAAGTTGGGCAAC
+ACCGAGGTCAAATCGTTTGTGCAGAAGGTCTGTAATGAACAGCTGACCCACTGGTTTGAAGCCAACCCCA
+CCGACTCGAAAGTCGTTGTGAACAAGGCTGTGTCCTCGGCGCAAGCCCGTATCGCGGCACGTAAGGCACG
+AGAGTTGGTGCGGCGTAAGAGCGCCACCGACATCGGTGGATTGCCCGGCAAGCTGGCCGATTGCCGTTCC
+ACGGATCCGCGCAAGTCCGAACTGTATGTCGTAGAAGGTGACTCGGCCGGCGGTTCTGCAAAAAGCGGTC
+GCGATTCGATGTTCCAGGCGATACTTCCGCTGCGCGGCAAGATCATCAATGTGGAGAAAGCGCGCATCGA
+CCGGGTGCTAAAGAACACCGAAGTTCAGGCGATCATCACGGCGCTGGGCACCGGGATCCACGACGAGTTC
+GATATCGGCAAGCTGCGCTACCACAAGATCGTGCTGATGGCCGACGCCGATGTTGACGGCCAACATATTT
+CCACGCTGTTGTTGACGTTGTTGTTCCGGTTCATGCGGCCGCTCATCGAGAACGGGCATGTGTTTTTGGC
+ACAACCGCCGCTGTACAAACTCAAGTGGCAGCGCAGTGACCCGGAATTCGCATACTCCGACCGCGAGCGC
+GACGGTCTGCTGGAGGCGGGGCTGAAGGCCGGGAAGAAGATCAACAAGGAAGACGGCATTCAGCGGTACA
+AGGGTCTAGGTGAAATGGACGCTAAGGAGTTGTGGGAGACCACCATGGATCCCTCGGTTCGTGTGTTGCG
+TCAAGTGACGCTGGACGACGCCGCCGCCGCCGACGAGTTGTTCTCCATCCTGATGGGCGAGGACGTCGAC
+GCGCGGCGCAGCTTTATCACCCGCAACGCCAAGGATGTTCGGTTCCTGGATGTCTAACGCAACCCTGCGT
+TCGATTGCAAACGAGGAATAGATGACAGACACGACGTTGCCGCCTGACGACTCGCTCGACCGGATCGAAC
+CGGTTGACATCCAGCAGGAGATGCAGCGCAGCTACATCGACTATGCGATGAGCGTGATCGTCGGCCGCGC
+GCTGCCGGAGGTGCGCGACGGGCTCAAGCCCGTGCATCGCCGGGTGCTCTATGCAATGTTCGATTCCGGC
+TTCCGCCCGGACCGCAGCCACGCCAAGTCGGCCCGGTCGGTTGCCGAGACCATGGGCAACTACCACCCGC
+ACGGCGACGCGTCGATCTACGACACCCTGGTGCGCATGGCCCAGCCCTGGTCGCTGCGCTACCCGCTGGT
+GGACGGCCAGGGCAACTTCGGCTCGCCAGGCAATGACCCACCGGCGGCGATGAGGTACACCGAAGCCCGG
+CTGACCCCGTTGGCGATGGAGATGCTGAGGGAAATCGACGAGGAGACAGTCGATTTCATCCCTAACTACG
+ACGGCCGGGTGCAAGAGCCGACGGTGCTACCCAGCCGGTTCCCCAACCTGCTGGCCAACGGGTCAGGCGG
+CATCGCGGTCGGCATGGCAACCAATATCCCGCCGCACAACCTGCGTGAGCTGGCCGACGCGGTGTTCTGG
+GCGCTGGAGAATCACGACGCCGACGAAGAGGAGACCCTGGCCGCGGTCATGGGGCGGGTTAAAGGCCCGG
+ACTTCCCGACCGCCGGACTGATCGTCGGATCCCAGGGCACCGCTGATGCCTACAAAACTGGCCGCGGCTC
+CATTCGAATGCGCGGAGTTGTTGAGGTAGAAGAGGATTCCCGCGGTCGTACCTCGCTGGTGATCACCGAG
+TTGCCGTATCAGGTCAACCACGACAACTTCATCACTTCGATCGCCGAACAGGTCCGAGACGGCAAGCTGG
+CCGGCATTTCCAACATTGAGGACCAGTCTAGCGATCGGGTCGGTTTACGCATCGTCATCGAGATCAAGCG
+CGATGCGGTGGCCAAGGTGGTGATTAATAACCTTTACAAGCACACCCAGCTGCAGACCAGCTTTGGCGCC
+AACATGCTAGCGATCGTCGACGGGGTGCCGCGCACGCTGCGGCTGGACCAGCTGATCCGCTATTACGTTG
+ACCACCAACTCGACGTCATTGTGCGGCGCACCACCTACCGGCTGCGCAAGGCAAACGAGCGAGCCCACAT
+TCTGCGCGGCCTGGTTAAAGCGCTCGACGCGCTGGACGAGGTCATTGCACTGATCCGGGCGTCGGAGACC
+GTCGATATCGCCCGGGCCGGACTGATCGAGCTGCTCGACATCGACGAGATCCAGGCCCAGGCAATCCTGG
+ACATGCAGTTGCGGCGCCTGGCCGCACTGGAACGCCAGCGCATCATCGACGACCTGGCCAAAATCGAGGC
+CGAGATCGCCGATCTGGAAGACATCCTGGCAAAACCCGAGCGGCAGCGTGGGATCGTGCGTGACGAACTC
+GCCGAAATCGTGGACAGGCACGGCGACGACCGGCGTACCCGGATCATCGCGGCCGACGGAGACGTCAGCG
+ACGAGGATTTGATCGCCCGCGAGGACGTCGTTGTCACTATCACCGAAACGGGATACGCCAAGCGCACCAA
+GACCGATCTGTATCGCAGCCAGAAACGCGGCGGCAAGGGCGTGCAGGGTGCGGGGTTGAAGCAGGACGAC
+ATCGTCGCGCACTTCTTCGTGTGCTCCACCCACGATTTGATCCTGTTCTTCACCACCCAGGGACGGGTTT
+ATCGGGCCAAGGCCTACGACTTGCCCGAGGCCTCCCGGACGGCGCGCGGGCAGCACGTGGCCAACCTGTT
+AGCCTTCCAGCCCGAGGAACGCATCGCCCAGGTCATCCAGATCCGCGGCTACACCGACGCCCCGTACCTG
+GTGCTGGCCACTCGCAACGGGCTGGTGAAAAAGTCCAAGCTGACCGCCTTCGACTCCAATCGCTCGGGCG
+GAATCGTGGCGGTCAACCTGCGCGACAACGACGAGCTGGTCGGTGCGGTGCTGTGTTCGGCCGACGACGA
+CCTGCTGCTGGTCTCGGCCAACGGGCAGTCCATCAGGTTCTCGGCGACCGACGAGGCGCTGCGGCCAATG
+GGTCGTGCCACCTCGGGTGTGCAGGGCATGCGGTTCAATATCGACGACCGGCTGCTGTCGCTGAACGTCG
+TGCGTGAAGGCACCTATCTGCTGGTGGCGACGTCAGGGGGCTATGCGAAACGTACCGCGATCGAGGAATA
+CCCGGTACAGGGCCGCGGCGGTAAAGGTGTGCTGACGGTCATGTACGACCGCCGGCGCGGCAGGTTGGTT
+GGGGCGTTGATTGTCGACGACGACAGCGAGCTGTATGCCGTCACTTCCGGCGGTGGCGTGATCCGCACCG
+CGGCACGCCAGGTTCGCAAGGCGGGACGGCAGACCAAGGGTGTTCGGTTGATGAATCTGGGCGAGGGCGA
+CACACTGTTGGCCATCGCGCGCAACGCCGAAGAAAGTGGCGACGATAATGCCGTGGACGCCAACGGCGCA
+GACCAGACGGGCAATTAATCAGGCTCGCCCGACGACGATGCGGATCGCGTAGCGATCTGAGGAGGAATCG
+GGCAGCTAGGCTCGGCAGCCGGGTACGAGTGTTAGGAGTCGGGGTGACTGCACCGAACGAGCCGGGGGCG
+CTCAGCAAGGGCGACGGCCCGAATGCGGATGGCTTGGTCGACCGTGGGGGCGCACATCGGGCAGCGACCG
+GGCCAGGCCGCATACCAGATGCTGGAGACCCGCCGCCGTGGCAGCGTGCTGCGACTCGGCAATCCCAAGC
+GGGGCATCGTCAGCCGCCGCCGGTATCACACCCTGAGGGGCGCCCGACCAACCCGCCCGCCGCCGCCGAT
+GCTCGGCTGAATCGCTTCATCTCCGGTGCGTCTGCCCCGGTGACCGGCCCAGCCGCCGCGGTCAGGACCC
+CGCAGCCGGATCCCGACGCTTCGCTGGGGTGTGGCGACGGTTCCCCCGCCGAGGCCTATGCCAGCGAGCT
+GCCCGACCTATCCGGCCCGACTCCGCGGGCCCCGCAACGCAACCCCGCGCCGGCGCGTCCCGCGGAGGGT
+GGCGCGGGATCGAGAGGGGATTCGGCCGCCGGTTCGAGCGGCGGTCGTTCGATTACCGCTGAGAGTAGAG
+ACGCCCGTGTCCAGCTGTCGGCGCGGCGAAGCCGCGGGCCGGTTCGAGCCAGCATGCAGATCCGACGGAT
+TGATCCATGGAGCACGTTGAAGGTGTCGCTGTTGTTGTCGGTGGCGCTGTTCTTCGTCTGGATGATCACG
+GTCGCGTTCCTCTACCTGGTGCTCGGCGGTATGGGCGTATGGGCCAAGCTCAACAGCAACGTCGGTGACC
+TGTTGAACAACGCGAGCGGCAGCAGCGCGGAACTTGTCTCCAGCGGCACCATCTTCGGCGGCGCATTCCT
+GATCGGCTTGGTCAACGTCGTCCTGATGACCGCGCTTGCCACCATCGGTGCGTTCGTCTACAACCTGATC
+ACCGATCTGATCGGCGGCATCGAAGTGACGCTGGCAGACCGGGACTAATGTTTTGAGAGTCGGGCGCCGG
+TTGCGGTAATCTCGTCGCTCGGCCGTACGCGAGTACGGGCCTATAGCTCAGGCGGTTAGAGCGCTTCGCT
+GATAACGAAGAGGTCGGAGGTTCGAGTCCTCCTAGGCCCACGACCATGTGCCCGTCACGACGTTCGGTGA
+GGTTCGCATTGCCACTGGCCGCGATCGCTGTGGCGGCCATCGTCGTGCGGTTCCGACGCGGAGCCGATGT
+CTGGCATGTGGCCGGCGATCCACCTCCTGATCACATAACCGGTGACGAAGAGGGGCCTTAGCTCAGTTGG
+TAGAGCACTGCCTTTGCAAGGCAGGGGTCAGGGGTTCGAGTCCCCTAGGCTCCACAAGTGAAAAGCGTAG
+CTCGGATACTTCGAATGACCACGTTTGATCACAATCGCGAGTGAAGAGGGCGTTGATGGCCACTCCGACG
+GCCTCGACACCCGACCCGTACAGGTGGCGGTAGCGGTCCAAGGTCAACCCGGCGGAGTCGTGTTCGAGCA
+TGTTCTGAAGTGCCTTGAATTCGCCCCGGCCTGGATCGCCAACGACGCCGGGTGTGCCGAGCTCATGCAG
+TTTTGAACTCCTACACCACCGCCGGCTTCCCGGTAGCGTCCATCACAGTCTGAGGGAACAGCTGCGCCGC
+GGTCACCGCCTGCGACCACCACCGGCGCCGCACATGGCTGCCGCGCATGTAGCCGCCCGCCGAGTCCGGG
+AACGCTAGAAGCTCAGCAACCCATCGAACGCGGTCGGCCGGTTGTCGGCGTCCACGAGCACGCACCCTAG
+AGCGAAAGTCATGGATCCGCCGTTGGCGGGGTCTCCGGTATTGCCGGACTCGTCTATGTAAGCGACCAGC
+ACGCGACGATGCTGGCACGATTCTTGGGCGATTGACCACAGTTACAGATAACTACTGTTAACCGCAGTTG
+TGTCCTTTCGCAGGTGGACTGAGTTGTAACCCATTGATCTGCATCATGATTCGCCTGTGCAAGGCGGGGG
+TCAGGGGTTCGAATCCCTAGGCCCCACCGTGTGACGACCGGCCTCAGGGGCGCGGTTGCACCTCGACGCT
+CGGTGGTCGGGGCGACGGCTCCGGTCGCGACGAGCGCCGGACGATGCTGAAGGCGACGGCACCGCCGGCG
+AGGATGGCCGCCGCGATCCCCGCGAAGATCCAGAGGTGGTGTTTGCTGCGACGTTGGGTCCGGGCGTCCT
+GTAGGGCCTGCGGTAGGTTGGCCACCACGTCCTGGGCAGCGGTCAGCTCTTGAGCGAGCGTCTCTTGGGC
+GGCAGCGACCTCGCGGGCCAATCGGCCTTCCCGGTAACGGCGGCGAAGCCCGGCCGCGGTCGACCGGGCG
+GACTGAAGCCCAAGTCCGACCCCGAGTTCGAGGAGGCCTCGGGTCACGTCCACCGGACCCACCGCAGAGT
+AGGCCAGACCCCGGGTCAGCCGCTCGCGTGGGGTCAACCGGGTTTCCACCTGCTCACTCATTTTGCCGCC
+TTTCTGTGTCCGGGCCGAGGCTTGCGCTCAATAACTCGGTCAAGTTCCTTCACAGACTGCCATCACTGGC
+CCGTCGGCGGGCTCGTTGCGGGTGCGCCGCGTGCGGGTTTGTGTTCCGGGCACCGGGTGGGGGCCCGCCC
+GGGCGTAATGGCAGACTGTGATTCCGTGACTAACAGCCCCCTTGCGACCGCTACCGCCACGCTGCACACT
+AACCGCGGCGACATCAAGATCGCCCTGTTCGGAAACCATGCGCCCAAGACCGTCGCCAATTTTGTGGGCC
+TTGCGCAGGGCACCAAGGACTATTCGACCCAAAACGCATCAGGTGGCCCGTCCGGCCCGTTCTACGACGG
+CGCGGTCTTTCACCGGGTGATCCAGGGCTTCATGATCCAGGGTGGCGATCCAACCGGGACGGGTCGCGGC
+GGACCCGGCTACAAGTTCGCCGACGAGTTCCACCCCGAGCTGCAATTCGACAAGCCCTATCTGCTCGCGA
+TGGCCAACGCCGGTCCGGGCACCAACGGCTCACAGTTTTTCATCACCGTCGGCAAGACTCCGCACCTGAA
+CCGGCGCCACACCATTTTCGGTGAAGTGATCGACGCGGAGTCACAGCGGGTTGTGGAGGCGATCTCCAAG
+ACGGCCACCGACGGCAACGATCGGCCGACGGACCCGGTGGTGATCGAGTCGATCACCATCTCCTGACCCG
+AAGCTACGTCGGCTCGTCGCTCGAATACACCTTGTGGACCCGCCAGGGCACGTGGCGGTACACCGACACG
+CCGTTGGGGCCGTTCAACCGGACGCCCTCACGCCAAGTCCGCTCACCTTTGGCCGCGACCGGCGTAACCG
+GCAGCGGTAAGCGCATCGAGCACCTCCACTGGGTCGCTGCCGAGATCCCAGCGGGACAAAATCAGCAGCC
+CCCGCTGACCGTTTCGATCTCGAGCAGGCGCACCAGGCGGCCGTAACGGCGAAACTCGTCGATTCGGATG
+ATCTTGATATTGGAATGTCGTAATAGCTGCGTCCGGAACCAACCTCGGATCGCCAGGCCGTCGGGGGTAA
+TTGCCAGCCTTGGACGTGCGCGCCAAGTGGCGCTCGCAAACAAGATCAGACCCAGCGCGGCAACTCCGGT
+CAACACCCGCCCGGGCGTGTCTGTGACTAAGGTCACAGACGCAATAGCCATCACGACTCCCCCGGCTCCG
+CAACCAGCGATTCCCGAGGTGCGAGGCGCCCATGCTGTTTGCTGCATGTATTCCTTAGACCCTCTCACCA
+CTGCAGACAAAGTTATCCACAGACGCTATCAACAGTGGGGATGAATCACATGCGTGTGATTGAGTGACCA
+AAAGGTTGCTGGCACAGTAACGACCCGACCAGAATATGAATTCATTCTATCGGCGGCGTGGATCAATGCC
+AGCGCATCGTGAGCAACAAACCGGTGATCATGAAAGCGAACGCGATCGCATAGTTCCAGGGACCGAGTTG
+CGCCATCCAATTGAGCGCTGTGGGGGCTTGGCTGCCAATGGCTGCCAACTGAAACACCATTAACCAGATG
+AGTCCGATCAGCATCAGACCGATGAACAACGAGACGAACCATACGCTCGACGGTCCGACCTTCACCTTCA
+TCGGCGTGCGGCTCACCGCGCTGACGGTGAAGTCGTTCTTCTTGCGGACCTTGGACTTGGGCATCACTTT
+CCTCGGGATCTGGCGGGACTACCTCGACAAGACGACGAATGGCCCGGGGTGCAACGATAGAAGTTGCAGC
+TGCAGGCATACCTTGTTATGAGACTAACCCACCCAACACCCTGCCCGGAAAACGGAGAGACCATGATTGA
+TCGGCGCCGATCGGCGTGGCGTTTCAGTGTCCCCTTAGTGTGCTTGCTGGCGGGGCTGCTGCTGGCCGCC
+ACGCATGGGGTGTCGGGCGGCACCGAGATCCGCCGCAGCGATGCGCCGCGACTGGTCGACCTTGTCCGTC
+GGGCGCAGGCATCGGTGAACCGTCTCGCCACCGAACGCGAAGCGCTGACCACCAGAATCGACTCGGTGCA
+CGGCCGATCTGTCGATACCGCGTTGGCGGCCATGCAGCGGCGGTCCGCCGAGCTGGCCGGTGTGGCGGCT
+ATGAATCCGGTCCATGGGCCGGGCCTGGTGGTTACCCTGCAAGACGCGCAACGCGACGCCAACGGCCGGT
+TTCCGCGCGACGCGTCCCCGGACGATCTGGTTGTGCATCAGCAAGACATCGAGGCTGTCCTCAACGCGTT
+GTGGAATGCCGGTGCTGAGGCGATCCAGATGCAGGACCAGCGCATCATCGCGATGTCGATAGCTCGTTGT
+GTCGGAAACACGTTGCTGCTCAACGGGCGTACCTATAGCCCGCCCTACACGATCGCCGCGATCGGAGACG
+CCGCCGCCATGCAGGCTGCTCTGGCTGCGGCTCCCCTGGTGACGCTCTACAAGCAGTACGTGGTCCGGTT
+CGGCCTCGGGTACCGCGAAGAAGTCCATCCTGACTTGCAGATAGTCGGCTATGCCGATCCCGTCCGGATG
+CACTTCGCGCAGCCTGCAGGCCCCTTGGACTACTGAACGACTGCCGGCAGGGTCAGGCGGTAGCCTGTCA
+CGATGCGGATCCTGGTCGTTGACAACTACGACAGCTTCGTGTTCAACCTGGTGCAGTACCTCGGCCAGCT
+CGGCATCGAGGCCGAGGTGTGGCGCAACGACGACCACCGGCTATCCGATGAGGCCGCCGTCGCCGGCCAA
+TTCGACGGTGTCCTGCTCAGTCCCGGTCCGGGTACCCCGGAGCGCGCGGGCGCGTCGGTGAGTATGGTGC
+ACGCGTGTGCGGCAGCACACACCCCTTTGCTGGGGGTCTGCCTTGGGCACCAAGCCATCGGCGTTGCGTT
+CGGCGCCACCGTGGACCGTGCGCCCGAGCTATTGCACGGCAAGACCAGCAGCGTATTCCACACCAATGTC
+GGTGTGCTACAAGGGCTTCCGGATCCCTTCACGGCCACTCGATACCATTCGTTGACAATTCTGCCTAAGT
+CGCTGCCAGCGGTGCTGAGGGTCACGGCCCGCACTAGCAGCGGTGTGATCATGGCCGTGCAGCACACCGG
+GCTGCCGATCCACGGTGTCCAGTTCCATCCGGAGTCGATTCTCACCGAGGGCGGGCACCGCATACTGGCC
+AACTGGCTCACCTGCTGCGGATGGACGCAAGACGACACCCTGGTACGTCGGCTGGAAAACGAAGTGCTCA
+CCGCCATCTCACCGCACTTCCCAACTTCAACCGCTAGCGCGGGCGAAGCTACTGGCCGAACCTCAGCGTG
+ATGATGCCGTCCCGGTTGACGCCGGTCCCCGCCGGCGGGTTTTGATAGACGACCCGGTTGTGTTGGGAGC
+CACCGGCGTCGACGTCGGCCCCTTTGTCGAGCATCCCGGTCCAGCCCAGCGCGCGCAATCGTGGTTCGGC
+GTCGACCCAGAACATGCCGGATAGGTCGGGCATGACGAATTGGTTGCCCTTGGACACCTGTAGTTCGATG
+ACTGAATCGACCGGAACTGTGGTGCCTGCGGGTGGATTGGTGCCGGTCACCTCGCCGGCGGGACGGGGGC
+TGTCCACCGAGGCCTGACTGAATTTGGTGAAGCCGTAGACGTTGAGGTTCTTCTGCGCCACGTCGACGGT
+CTGGCCCGCGACATCGGGAATGTCTTTGGTCGCCGGACCAGAGCCAACGATGATGATGACCACATTGGTG
+ATGGCCGACGTCTGGTTGGCTGGCGGGTTGGTCCCGATGACCTTGCCCACCAGTTCCGGGGTGGACGGCG
+AATTCGCTTGCTTGAAGCGGCCGAATCCGGCGGCAGTCAGTTTCTTGACCGCTTCGGCGTATGTCAGCGT
+GGAGACGTCGGGTATTTCGCGTTGCTCGGGTCCGGTGGACACGTTGACTGTGATCTCGTCGCCTGCACTC
+ACCGACGTGTTGGCGGCCGGGTCGGTGCCGATAACGTGGTCCGGTGGGATTGTCGAGTCCGGCTTCTGCA
+AGGTGCGGATTTTGAAGCCCCGGTTTTGCAGTGTGGCGATGGCGTCGGCGGAGGATTGACCCCGAACGTC
+GGGAACTTGAACGTCGCGGGTGATGCCGCCGAACGTGTTGATGGCGATGGTTACCACGACGGTCAGCACA
+GCGAGCACGGCGACCACCGCAACCCAACGGCCCACCGAACCGATGCTGCGGTCACGGTCGGTGTCGTCTA
+AGTCCTGGCGTGGTAGCGGATCGGTGCGCGGACCGCTAAGGTTGCCGGCCGCAGACGACAGCAGCGAGGT
+CCGCTCGGCATCGGTGAGCACTTTGGGCGCCTCGGGCGGCTCACCGTTGTGCACGCGGACCAGGTCGGCG
+CGCATCTCCGCCGCTGTCTGATAGCGGTTTTCCGGATTTTTGGCCAGCGCCTTGAGAACGACGGCGTCCA
+GGTCGGCGGAGAGGCCTTCGTGCCGCGCCGAAGGTGGGATCGGGTCTTCGCGCACATGTTGGTAGGCAAC
+CGAGACGGGTGAGTCGCCGGTGAAAGGTGGCTCCCCGGTGAGGACTTCATAAAGAACACAGCCCAAGGAA
+TAGACATCGGATCGGGCGTCGACGGAATCACCCCGGGCCTGTTCGGGTGACAGGTACTGCGCCGTGCCGA
+TCACTGCTGCGGTCTGGGTCACGCTGTTGCCGCTGTCGGCAATGGCGCGGGCGATGCCGAAATCCATCAC
+CTTTACTGCATTGGTCGCGCTGATCATGATGTTCGCCGGCTTGACGTCACGGTGGATGATTCCGTTCTGA
+TGACTGAAGTTCAGCGCTTGGCAGGCGTCGGCGATGACCTCGATGGCGCGTTTGGGCGTCATCGGCCCTT
+CGGTGTGGACAATGTCGCGCAGGGTAACGCCGTCGACGTATTCCATGACGATGTAGGGCAATGGCCCGGC
+GGGCGTTTCGGCTTCACCGGTGTCGTAGACCGCGACGATTGCAGGGTGGTTCAATGCCGCGGCGTTTTGC
+GCCTCACGCCGGAAGCGAAGGTAAAAACTGGGATCGCGGGCTAGATCAGCGCGCAGCACCTTGACCGCAA
+CGTCGCGGTGCAACCGGAGGTCGCGGGCCAGGTGGACCTCGGACATGCCCCCAAATCCAAGGATTTCGCC
+AAGTTCGTAGCGGTCGGACAGGTGGGAAGGGGTGGTCATTGCGCTATCTCGTATCGGGCCAGCGACGCGC
+GCGAATGCGGTGTCGGCGGGACAACCCAGCTTTGCAGTCCAGAATGACGTGTTTCCCCGCGTTCCGTCCA
+ATTGAGTCGCGGGCTAGCATCAGTCCCGCCAGTGTTGCTGGCCGGAGGGTTCCCGGTGGTGGTCACGGTC
+GGCGTCGGTGCCTGCTGCGGGCTGTTGTCCCCGGGCGCTTTGATGACGAGCAGCACGGCGATGATGATTG
+CCAGCGCCCCCAGCACCCCCGCGGCCCAGAGCAGCGCACGCTGACCGGACGAAAACGTGCGCCGCGGCGG
+CCGGTGACCACCCGTGGCCGGGCGGGATCGACGGGATGCCGCAGTCCGGCCAGCAGAGTTGGCCGCGACC
+CTGGCCGTCGTACCCGACGGAATGGCCGCCGGGGCGGCCCGGCCAGGGGGGGGTGTCTGGCTGGGCCGCG
+GGGGCCGGCGGCCGGCGCGCACCGCTGCCACCGCGTCGGCGAACGGTCCCCCACTGCGATAGCGCATCGC
+GGGGTTCTTCACCAGAGTTATCTCGATGAGTTCTCGCACATTGGGCGGCAGGTCGGGAGGCAGCGGCGGC
+GGCGGCTCCTTGATGTGCTTCATTGCCACGGTCAGGGCACCATCGCCGGCGAACGGCCGTTTACCCGAAA
+CCGCTTCATACCCAACAACTCCCAGTGAATAGACGTCGCTGGCCGGGCTGGCGTCGTGACCGAGGGCCTG
+CTCCGGCGCGATGTATTGGGCGGTGCCCATCACCATGCCGGTCTGGGTCACGGGCGCTGCATCGACGGCT
+TTGGCGATGCCGAAGTCGGTGATCTTCACCTGCCCGGTGGGGGTGATCAAGATGTTGCCCGGTTTGACGT
+CGCGGTGCACCAGGCCAGCGGCATGCGCGATCTGCAGAGCGCGGCCGGTCTGCTCGAGCATGTCCAGTGC
+GTGCCGCAACGACAGCCGGCCGGTGCGTTTGAGCACCGAATTTAGTGGCTCGCCGTTGACCAGCTCCATC
+ACCAGGTAGGCCGTGCGACCCTCCCCGTTCATCTGGCTTTCGCCGTAGTCGTGCACGCTGGCGATGCCCG
+GATGGTTCAGCATCGCGGTGGTGCGCGCTTCGGCCCGGAACCGTTCGATGAACTCCGGATCGGAGGAGAA
+CTCGCTCTTGAGCACCTTCACCGCAACACGCCGGCCCAACCGGTTATCCACGGCCTCCCAGACTTGGCCC
+ATACCACCGGTGGCGATGAGGCGCTGCAGGCGGTATCTGCCCGACAGCGTCACGCCAACTCGGGGGCTCA
+TGGTTCCCCCTGCAGTGCGGCTTCGATCACCGCCCGCCCGATCGGTGCCGCGAGGGCACCTCCGGTGGCG
+GACAGCCGATCAGCCCCGTTCTCCACCAGCACGGCAACAGCCACCTTGGGCGCTTGTGCGGGCGCAAAGG
+CGATGTACCAAGCGTGCGGTGGAGTGTGACGAGGGTCGGTGCCATGTTCGGCGGTGCCCGTCTTGGATGC
+GATCTGCACGCCGGGGATTGCCCCTTTCTGCTGTGCGACTTTCTCGGCGCCGACCATCAGCTCTGTTAGC
+TTAGCGGCGACCTGCGGTGACACCGCGCGGCGCTGCTGGTATCCGACGGTGGTTGAGATATTGGCTAGGT
+CCGGTCCCTTGAGGCTGCCGACTAGATAAGGCCTCATCGTAATGCCGCCGTTTGCGATGGTCGCGGCTAT
+TTCTGCGTTCGCTAGCGGGGTCAGCGCAACGTCCTTTTGGCCGATACTGGTCATCCCTAGTGCGGCGCTG
+TCCGGGATAGGCCCGACGGTTGATTCCGCCACTTGCAGCGGAGTTGGGCGCGGTGGGCTATCGAGACCGA
+ACGCGCGCGCCATGCTGCGCAGGGCGTCGGCGCCGGTGCGGATGCCCAGCTGGACGAATGCGGTGTTGCA
+TGATTTGACGAATGCCTCACGCAGCGACACGGTGGGTTCGTCCCCGCACGGCGCACCGCCGTAGTTCTCT
+AGCTGGGCGGTGCTGCCTGGCAACGGAATTGTGGGCGCCGCAGTCAGCTGTTCGGTCTCGGTGGCCCCGG
+CGGCCAGCGCGGCCGCAGTGGTGATCACTTTGAAAGTCGAACCCGGTGGATACGTCTCAGAGATGGCACG
+GTTGGTCAGTGGAGAGGCGGGATTGTCGCCAAGCCGCTGCCAGGCTTGCGCCTGCACCTCGGGGTTATGC
+GACGCCAGCAGGTTGGGGTCGTAGGACGGAGAAGACACCAACGCCAAAATCTTGCCGGTTGATGGCTCAA
+GGGCGACCACCGCTCCCTTACAGGGCCCGTAGCAGCCTTGCTGCATCGCGTCCCAGCCGGCTTGCTGAAT
+GCGCGGGTTGATCGTGGTATCGACATTACCGCCGCGTGGGTCGCGACCGGTGAAGAAGTCGGCCAGCCGG
+CGGCCGAACAGACGGCGGTCGGACCCGTTCAATATCGGGTCCTCGGCTCGTTCTAGGGCGGTGCTGGAAT
+AGCGCAGGGAGTAGAAGCCGGTAACCGGCGCGTACACCTCAGGATTGGGATAGACCCGCAGGAAACGAAA
+GCGGCCGTCGGTGGCTACCGAGTACGCCAGCAGTTGGCCACCAGCGGTGATCTGGCCGCGCTGCCGTGAA
+TACTCGTCGAGCAACACTCGCTGGTTGCGGGGATCGGCACGCAGCCCGTCGGCGGTGAAGACCTGCGTCA
+TGGTCGCGTTGAGCAGTAGCAACACGATCAACGCCATCACGGTCACCGATATTCGGCGCAGAGAGGCGTT
+CATACGCGTTCGATGACCTCGGTGCCGGCCGCCGTAATCGGCGACTTATTTCGTGGGCGGGTGCGCAGTG
+GGCGGCGGGCTCCGTGCGAGATGCGTGCCAGGATGGCCAGCAATATGTAGTTGGCCAGCAGTGAAGACCC
+GCCGTAGGACATCCACGGTGTGGTCAACCCGGTCAGCGGAATGAGTCGGGTCACACCGCCGACGACGATG
+AACAGCTGAATGGCTAGCGTCGATGAGAGGCCGGCGGCCAGCAGCTTGCCGAAGCTATCGCGGGTGGCGA
+TGGCCGTGCGCAAACCCCGGATGATCACGATGGTGTAGAGCATCAGGATGGCCGTCAAGCCCACCAACCC
+AAGCTCTTCGCCGAACGCGGCGATGATGAAATCGGTGGATGCCGCGGGCACGGTGTCGGGTTGACCATTA
+CCGAGCCCGGTGCCGAAGATACCGCCTGTAGCGAAGCTGAAAAGCGACTGCACGATCTGATATCCGGTGC
+CGTCTGGATCTGCGAACGGATCCAGCCAGGTCTGTACGCGGAGCCGGACGTGCTCAAAAATGAAGTACGC
+CACCAAGGTTCCTGCCGCGAACAGAGTCAGGCCGATGACGACCCAACTGAACCGCTGGGTGGCGAGGTAA
+ACCACCACCAGAAACGATGTGTACAGCAGCAGCGAAGCGCCGAGGTCTTTCTCGAAGACCATCACACCCA
+CCGAGATGACCCAGGCTGCCAACAGTGGCGCGAGGTCTCGCGGGCGCGGCAGGGTCATTCCGAGCAAATG
+TTTGCCGGCGCTGGTGAACAGGCCGCGTTTGGCCACCAGTACCGCCGAAAAGAAGATCAGCAGCAGAATC
+TTTGAAAATTCGGCGGGTTGAATCGAGAAGCCGGGCAACCGGATCCAGATCTTGGCGCCGTTCTGTTCGG
+ACAGTGCTGCCGGGAGCAGCGCGGGAACTGCCAAGAAAACCAGACCCGCGAGCCCGCAAATGTAGCCGTA
+GCGTGCGAGCTGTCGGTGGTCCTTGAGGAAGGTCACCACGAGCGCGAAGGCAGCTACGCCCACCAGCGTC
+CACAGCATCTGCTGGTTTGCGCTGGGGTGCCGATGCTCGCCGATCTCGTTGTCCACCAGATCGAGGCGGT
+GGATCATTACCAGGCCAAGTCCGTTGAGCAGTGCCACCACCGGGAGCAACAGCGGGTCAGTGTAGGGGGC
+GAAGCGCCGGATGGCCAGATGCGCGGATCCGAACAGGGTCAGGAAGGCCAGTCCGTAGCTAGTCAAGTCC
+CAGGGCACCCCCTGGTCTTGATTGGCCTGCACGACCAGCAGTGCGGCAAACGTGATTACGGCGGCAAAGC
+ACAGCAGCAGCAGTTCAGCGTTGCGCCGAGTCGGCAACGGGGGCGTTACGGCCACCGGCGCTTGCAGTCG
+TGTCGTCATGCCGCCGCCCGGCAGTCGATGCCCGGCTGAGGCGGGGGTGGCGGAAGTGCGGCCATCGTCG
+GCGAGCTGGTGACGGGCCAAGGCGTCGGCGGCGACGCGGGCGCTGCCGGGGAGGCACTCGTGGGGATGGC
+AGGAGTAGTTCCGGTGGGGGCCGACGCGGAGGTGGTGGGTGATGGAGCGGCTGGCGAGGAGGTGACGTTT
+GGTTCGGTTGTCTCGCTGGTGGTGGGTGGGGCCGGGCGCCCGGGCGGGGACGTGGCACGCGGCGCCGGGC
+AAGGCGGCAGCAGGGAGTTGGCCGCCAGTTCGCGCAACTGCCCGATGGCGTCATCGAGAGTGCCGGCCGG
+GAGACCGGCCCGAACCTGTGCGCGCTCCGGCGGTCGCAGATCCTCCAGTTTCATCAGATGGCAGTCGAGA
+GGGCCCCCAGACTGTCCGTAGCTGATCTGCGACAGCTCGTTACGCGGGCTGAGGCAGCCCATCAGGTAAG
+GCTGGTGCAGGGACATGCCCAGTAGCGACCCTTGAATCCCCCGCATGATGGACACGCTGCCGGCGTAGTC
+CGCTACGTAGTAGTTGCTGCGGATGATCGCGCGACCAATGAGCAGGCCCGCAGTCATCAGCACGGTCACC
+AGGGCGACAACGAATGCTAGCCGTCGGCCCGACCACCGTGGCCGACTGAATGTATCGGCCTGTGGCGGAA
+CGCGTTTAACGATCTCCTTGCGCTGGCTGATGGCAGAGGCCCGGCCGGCGGCGGTGTTGGGCAGGGTCAG
+TTGGTCGTCGTCGCCTGAGACCGCCCCGGCCAGAATCGGTTGGGTCTGGCCGTAGTCGTAGTCGACGACG
+TCGGCGACGACGACAGTGACGTTGTCGGGGCCGCCGCCGCGCAGCGCCAGTTCAATGAGGCGGTGAGCGC
+TCTCGGCAACCTCGGGGATCTGCAGGGCCTCGAGGATAGTTTCATCGCTAACCGGATCGGACAACCCGTC
+CGAGCACAGCAGGTAACGATCACCGGCGCGGGCTTCTCGCATGGTCAGCGTCGGTTCGACCTCATGGCCG
+GTCAACGCCCGCATGATCAACGAGCGTTGCGGGTGGCTGTGCGCCTCCTCCGGGGTGATCCGGCCTTCGT
+CGACCAGCGTTTGGACAAACGTGTCGTCCTTGGTGATCTGCGTCAGCTCACCGTCGCGCAGCAGGTAACC
+GCGCGAGTCACCGATATGCACCAGGCCGAGCCGGTTGCCCGCGAACAGGATTGCGGTGAGCGTGGTACCC
+ATGCCTTCGAGATCGGGCTCCATCTCGACTTGCGCTGCGATAGCCGAGTTGCCGGCGCGCACCGCGGCAT
+CCAGCTTGGCCAGCAGATCGCCACCGGGCTCGTCGTCATCGAGATGGGCCAATGCGGCAATCACCAACTG
+GGACGCCACCTCGCCGGCCGCATGCCCACCCATGCCGTCGGCCAGGGCCAATAGCCGTGCCCCAGCGTAG
+ACCGAGTCTTCGTTGTTGGCGCGTACCAAGCCGCGATCGCTGCGCGCCGCGTATCGCAGGACCAGGGTCA
+CGAGCGCCACTCTCCCCCGCAAGCGGGTGGGGGTACCCCCCACTTGTGGGGGCGCGCCCCCACCGCTTCT
+CTGCGCTCTGCATCGTCGCCAGCGCGGGTCACGGGCGCAACTCGATTGCAGTTTTGCCGATGCGAACCGG
+CGTTCCGATCGGAACTCGTACCGCAGTCGTCACCTTCGCCCTGTCCAGGTAAGTGCCGTTGGTCGATCCT
+AGATCTTCGACGTACCACTCGGAGCCGCGCATAGACAGCCGAGCGTGCCGCGTCGAGGCGTAGTCGTCGG
+TCAGCACCAGGGTCGAGTCGTCGGCGCGCCCGATCAACACCGGCTGTTCGCTCAGCGTGATACGCGCGCC
+AGTCAACGCACCTTCGGTCACCACCAGGTAGCGTGCAGCGTGCCGGCGCTGACGCGCGCCTAAGAGCGTC
+CCTCGCAGCGCCAGGCCGCGGCGCATCATGACCGCGCCGGTCGGCGCATAAATGTCGGTCTTCAAGATCC
+GTAGCACGGACCAGATGAATACCCACAACAACATCAAGAATCCGGCACGCGTTAGTTGCAGTACCAACCC
+CTGCATCTGGCGTCCTTTCCGTCCTGCACCGTCTGCTCCGGCCCCGCGCTGCCGAGCACGTCAGCAAAGT
+CACGATACTTTGACGGTGGTCGGCGCGGGTCAACCCCGGCAGCTTCGAGCCCAGTAGGTTCAGTGCATGC
+GGACGATGATCTCGGAGTGTCCCAAGCGGATCACATCACCGTCGGCCAACTGCCACTCCTGTACCGGTGC
+ATTGTTAACAGTGGTGCCGTTGGTGGAGTTCAGGTCTGCGAGCAATGCGACCTGCCCGTCCCACCGGATC
+TCCAAGTGACGGCGTGACACACCGGTGTCGGGCAGCCGGAACTGGGCGTCCTGTCCGCGACCGATGATGT
+TGGAGCCCTCGCGGAGCTGGTAAGTGCGTCCGCTGCCGTCGTCGAGCTGCAGCGTAACCGACGTTCCGGC
+GGACCCATAGCCGCCCTGCCCGTAACCGCTGTAGCCACCGGGCGCTGGCTGACCGTAGTCCGGAGCGCCT
+GATTGGCCGTAGTCGTAGTCTCGGCCGGCGGGTTCGGCGTACCCGCCACCCTGAGGAGCGTATCCCGGGA
+CCTGCGGGGATTCGGTGTAGCGGGTGTAGTCAGCGCCGCCGCCATAGTCTTGCCGGCCGTATGTCGTGGC
+GCCTTGCTGGTAGCCCTGGTCGTAACCGCCTTGGTCGGGGTAAGCCGGTCGTTGCTCGGGCGGGCCCGGA
+GGGCCAGAGGGCACATAGCTGCCCTCCTCGTGGCGAGCCGGGCCACGCCCGTACTCCCCGTACCCGCCGT
+AGCCGGGCTGGCCGCCACCGGGTGAAGGGCCGCAGCCGCCGCTTTGGCGATAGCCCTGGTCGTAGCCGGG
+AGCGCCGTAGCCGGCAGCCGGGCCGGGAGAAACAGGAGGGCGTTGCTCGTAGGGCGGCGGATAGCCCCCC
+TGCCCTTGGTCGGGGTAGCCTCGACCCTGGTCCTGGTGCCCGCGCTGGTCGGGGTAGCCGCGTTGCTCGG
+GGTAACCGCCCTGGTCGGGGTACCCGATTTGCTCGGGGTAGTCGCCCTGGCCCGGGTGGCGCGGGCGTGG
+GTAGCCCGGCTGGGGCGGGTAGCCGCCCGTCTCGGGTGGATACCCCCCGCGGGGGTCAGATCCGCCTTGC
+GGATCCGGGCCACCACGCGGATCCTCTTGCGGACGCGCATAGCGGTCGTCGTAATACTCGTCGGGACGCC
+CCTGCCCCTGACCGCCACGGTAGCTCGAATTGTCACTCATTGGTGCTACTCCTGGTTCTGCGCCAAACGC
+GTGGTTTGATTGTGGCCGGGCGCAATCGATGACCGGCGGGTGGGTCTCAACGTCGGGGTTAACAGTGCCG
+CGGGCGCGGAACTGGCCGGTATGCAGGTTCGACGACTGCTCGAATCGGACGACCACATCACCATACGTTT
+GCCACCCCTGTTCTTGGATATAGTCCGCCAAGTCCCGAGCAAAACCGGTTGACTTCAGCTCAGGATCAGC
+GCCCAACTTCTCAAAGTCGTGCACACCGAGGGTAATGATGTATTCGTTGGGCGCCAAAAGGCGATTTCCC
+TGCAGCGACTGGATGCGGTCGGCCGCCTCGCGGCGCAGCAGGGCTTCGACCTCTTGCGGGACGATCGAGC
+CTCCAAAGATGCGGGCAAACGCATCGCCAACCGTCTGCTCGAGTTTGCGCTCAACGCGCTGAACCAGCCT
+TTTCTGGCTACCCATCTTTCAGCGCTCGCCTCACTGTTCTGGTGCATCGTCGGCGCAAGGCAAACGACTC
+GCCTGTATGTCGTGTCAATCAATCATGGTATCGGGACAGTGTGAGCGAGCGGAAAGGGCCGGCCACGCCC
+ACTGAGCCCGCCGGCGCCCCTGGCAGCGGATGGGGCCTGCGGCTACTACAGTGGTATGGTCCTCCGGTTG
+TTGCGGGCGAGTGGCGGAATGGCAGACGCGCTGGCTTCAGGTGCCAGTGTCCTTCGGGACGTGGGGGTTC
+AAGTCCCCCTTCGCCCACCGTACTGTGAGACGAGTCGTGACCGACATCGTCGTCGAAACGGCCGCCATGG
+GCGTGGTTGGAACGGCTAGCGCACGCCCACGGCCAGCCCAGGGCAACCCCGGTATCGACGTGACTATCGC
+CGGCGCTGTCCGGTTCAGCTCGGTCGCGGCCGCAGCCGGGTGGCGGGGCGCCTCGGTACCCTTTTACACG
+GCGCGCATCGCGGTCAGCGTCCTCGCCGCTTGTTGCGCCATACCGGTTATCACGTCGGCGGCTGGCAGGA
+CGGCATTGACCAGGCCCGCGGCTTGACCGGCGGTGACATTGGCGATGCTGTAGTCACGCGCAGGAACGGC
+TCGCCAATATCTGGCCATGGCTTCTTCGCGATGGAGAATGTCGAGTTCGGTGTCCTCGAATTGGTCGGTG
+AGGGCGTTGCTTAGCACGCTCATCGTGTGTCCTTGCGGCCAGGGATAGCGCCGTAGCTGATCGTAGATAG
+TGGTGCGGCACATGTCGTCGCCAGTGGCCGCCAGCAGCGGGTCCCGCGCCTGCGGTGTGGATAACGCTTC
+GACCGTGGCGTAGAAGCGCGTACCGACCAATACCCCGGCGGCGCCCAACATCAACGCGGCGGCAAGGCCC
+CGGCCGTCGGCGATGCCCCCGGCGGCGATCACCGGGATATCAGTTCCCCGCGCGGTGACCAGGTCGACGA
+TTTCGGGTACCAAGGTCAGGGTGGAACGTGGACCGTGGCCGTGCCCACCGGCCTCGGTGCCCTGAGCCAC
+CAACACATCGGCGCCGACCTGCAGGGCTCGCTCGGCCTGGGTCCGGTTTTGGATCTGGCAGACCAACCGC
+GTTCCGGCGGACTTGATGGCGTCAGCGAAAACCGCGGGGTCCCCGAACGACAGCATCACCGCCACCGGCT
+CATACTGCAGCGCGAGGTCGAGCAGCTGCGGTTGGCGGGCCAAAGACCAGGTGATGAACCCGCAGCCCAC
+CGGCGCTCCAGCGGCGAGATCGAACTGCCGGGCCAACCAATCCCGGTCCCCATAGCCGCCCCCGATGAGG
+CCGAGTCCCCCTGCGCCACTTACCGCGGCAGCCAGCTCACCGCCGGCGATCAAGTCCATTGGCGCGGACA
+CTATCGGATAGTCGATTCCGAACATCTGGCTAAAGGCCGTCGATAGCACCACAACAACCTCCTTGGCGAG
+CGTCGTGATGACACGCAGATCCTGGCCGATGGTAGGTGATCAGGCGAGCCACTTCTTCGGCGAACTCGCG
+AGCCGAGCCTGATCACGCTGGGTTTGGCAACTGCCGGGCTTGCCGACCGGGCATCAAGCGGCCGGTTGTG
+GGCCAACCTGTGCGATCGGCAGGTGCACCACGACCCCGGGCACCGGGGTGACCTCGAGTCCTTCGTTGCG
+GGCCAGCAGAGCCGCATTGTCCGGGAGCTGCCTGGAATTGATCTCGCCGCCGGCAATCCGACGCAGCACG
+TCGTGGGCTGCCGCGAGCTGTTCGCGCTTTCGGTACTGGCCGCCGGGAAGCTTGATGCCGGCCCATACGC
+CGTACTCCACCCGATGCTCGACCGCGTGTTGAGCACACCGGCGCTGCTGTAGGAGCGGGCACCGGCGCAG
+GCATTGGATCCGCGCTTGGGTGGCCGACCGCTCATAGGCGCGTGCCTTAGCGGCGCCGTCGCTGCCGTCG
+TCATCGGGGTACCCGAACCATAGTTCCGGGTCGGTTGCGCAGGGGTGTGCCATGTGCCGGCCTCCTTGTT
+GAACGAAACGTAGGCAAAAGCGTATATGTCTGTGGCGGGCTCTGCAAGAGAATCGCGATAAAAACGTATA
+TACATAAGGGGTGGCCGCGGCCGAGTCGTATCCGGGTAGTATCCGGCTTATGGCCGGAGCGTGCGGTGAG
+CCGTGAGTCGGCCGGCGCGGCCATTCGCGCACTTCGCGAGTCGCGTGACTGGTCCCTCGCGGACCTGGCG
+GCCGCCACTGGCGTAAGCACCATGGGCCTGAGCTATCTGGAGCGCGGTGCCCGCAAGCCACACAAAAGCA
+CAGTTCAGAAGGTCGAAAATGGCCTCGGCCTGCCGCCTGGCACCTACTCGCGGCTGTTGGTCGCCGCTGA
+TCCCGATGCGGAGCTGGCCCGACTGATCGCCGCACAGCCGTCCAACCCGACGGCTGTCCGCCGCGCCGGT
+GCGGTCGTCGTGGACCGCCACAGCGATACCGACGTGCTGGAGGGCTACGCCGAAGCACAGCTCGATGCCA
+TCAAATCCGTCATCGACCGATTGCCTGCGACGACCTCCAACGAATATGAGACGTATATTCTCTCTGTGAT
+CGCGCAATGCGTGAAGGCGGAGATGCTGGCCGCCAGCTCCTGGCGGGTGGCGGTGAACGCCGGCGCCGAC
+TCGACCGGCCGGCTCATGGAGCATCTGCGGGCGCTGGAAGCCACGCGCGGCGCGCTACTGGAGCGGATGC
+CGACAAGCTTGAGCGCCCGGTTCGATCGGGCATGTGCGCAGTCGTCGTTACCGGAGGCGGTCGTGGCCGC
+GCTAATCGGCGTCGGCGCCGACGAAATGTGGGATATCCGCAATCGGGGCGTCATCCCTGCGGGCGCGCTC
+CCCCGCGTCCGAGCCTTCGTCGACGCAATCGAGGCAAGTCACGACGCGGATGAGGGGCAGCAGTGAATTA
+CAGCGAGGTCGAGCTGTTGAGTCGCGCTCATCAACTGTTCGCCGGAGACAGTCGGCGACCGGGGTTGGAT
+GCGGGCACCACACCCTACGGGGATCTGCTGTCTCGGGCTGCCGACCTGAATGTGGGTGCGGGCCAGCGCC
+GGTATCAACTCGCCGTGGACCACAGCCGGGCGGCCTTGCTGTCTGCTGCGCGAACCGATGCCGCGGCCGG
+GGCCGTCATCACCGGCGCTCAACGGGATCGGGCATGGGCCCGGCGGTCGACCGGAACCGTTCTCGACGAG
+GCTCGCTCGGATACCACCGTTACTGCGGTTATGCCGATAGCCCAGCGCGAAGCCATACGCCGTCGTGTGG
+CGCGGCTGCGCGCGCAACGAGCCCATGTGCTGACGGCGCGACGACGGGCACGACGGCACCTGGCGGCGCT
+GCGTGCGCTGCGGTACCGGGTGGCGCACGGCCCGGGGGTCGCGCTGGCCAAACTTCGGCTGCCGTCGCCG
+AGCGGTCGCGCCGGCATCGCGGTCCACGCCGCGCTGTCGCGACTTGGCCGTCCCTATGTCTGGGGCGCAA
+CGGGGCCAACCAGTTCGACTGTTCCGGTTTGGTCCAGTGGGCCTACGCCCAGGCGGGTGTTCACCTGGAT
+CGCACCACCTATCAACAGATCAACGAGGGGATCCCGGTGCCGCGCTCACAGGTCCGGCCGGGCGATCTGG
+TCTTCCCGCACCCCGGGCACGTGCAGCTGGCGATCGGCAACAATCTGGTCGTCGAGGCGCCCCATGCGGG
+CGCGTCGGTTCGGGTCAGCTCGCTGGGCAACAACGTGCAGATTCGGCGACCGCTGAGTGGCAGATAATCG
+CCCAATCAGACGGGCAGGATGAGAAGGTTGAACCATGTCGGAGCAAGCCGGGTCTTCGGTAGCTGTCATC
+CAGGAGCGCCAGGCTTTGCTGGCAAGGCAACACGACGCCGTGGCCGAAGCCGACCGTGAGTTGGCCGACG
+TGCTAGCCAGCGCGCATGCGGCCATGCGGGAAAGCGTCCGTCGGCTGGATGCTATCGCGGCCGAACTCGA
+CCGCGCGGTTCCGGATCAGGATCAGCTTGCCGTCGATACGCTCATGGGAGCGCGTGAGTTTCAAACGTTC
+CTGGTCGCCAAGCAGCGCGAGATCGTAGCGGTCGTCGCCGCCGCCCACGAGCTCGATCGCGCAAAAAGCG
+CTGTGCTAAAGCGCCTGCGGGCACAGTACACGGAACCGGCCCGTTAGCTGCGGACCGGATACGCTGGACC
+GGCAGGCGTTGGGTGAATTGTCGGCGACTACACACCTAGGTACTGTCACGCGGCATGGAAGCGCCGGGGA
+CAGGGCCCGCAGTGGGTCGCAGTGGCGTTTGACGCGGCGATGTCCACGCACGAAGATCTCCTTGCCACGA
+TCAGGTACGTCCGCGACCGAACCGGTGACCCAAACGCGTGGCAGACCGGGTTGACACCGACCGAGGTGAC
+CGCGGTGGTCACGTCCACGACACGTTCCGAACAGCTCGATGCCATTTTGCGTAAGATCCGCCAGCGGCAT
+TCGAACCTGTACTATCCAGCACCGCCCGATCGGGAACAAGGAGACGCCGCCCGTGCCATCGCGGATGCGG
+AAGCAGCTCTGGCACATCCGAATTCGGCTACCGCGCAGCTCGATCTGCAGGTCGTCTCGGCAATTCTGAA
+CGCGCATCTGAAGACTGTCGAGGGTGGCGAATCGCTGCACGAGCTTCAGCAAGAGATCGAAGCCGCGGTA
+CGCATTCGATCCGATCTGGACACTCCGGCCGGCGCGCGTGATTTCCAGCGTTTCTTGATCGGCAAGCTCA
+AGGATATCCGGGAGGTGGTTGCGACCGCGAGCCTGGACGCTGCGTCGAAATCCGCTCTGATGGCCGCCTG
+GACATCGCTGTATGACGCATCCAAGGGCGACCGTGGCGATGCCGATGACCGCGGACCGGCGTCGGTCGGC
+TCGGGCGGCGCGCCCGCACGCGGTGCCGGTCAGCAGCCGGAGTTGCCGACACGAGCCGAACCCGATTGCC
+TCCTCGACTCGCTGCTGCTCGAGGATCCGGGTTTGCTGGCCGATGACCTACAGGTGCCGGGAGGCACATC
+CGCGGCAATACCATCAGCGTCGTCGACGCCAAGCCTGCCCAATCTTGGCGGAGCAACGATGCCGGGTGGC
+GGAGCAACACCGGCCTTGGTCCCCGGTGTGAGCGCGCCGGGTGGGCTTCCGCTCTCCGGCCTGCTGCGCG
+GCGTGGGTGACGAACCGGAGTTGACGGACTTCGACGAACGGGGACAAGAAGTCAGGGATCCGGCCGATTA
+TGAGCATTCCAACGAACCGGATGAGCGTCGCGCCGACGACCGAGAAGGCGCCGACGAGGACGCCGGGCTG
+GGCAAATCAGAATCGCCACCGCAGGCTCCGACGACCGTGACGCTGCCCAACGGTGAGACGGTGACCGCGG
+CCAGTCCCCAGCTCGCCGCGGCGATCAAGGCGGCGGCCAGCGGCACACCGATCGCAGATGCGTTCCAACA
+ACAGGGAATTGCCATCCCGCTACCGGGAACCGCGGTCGCCAACCCCGTCGACCCCGCCCGGATCTCAGCG
+GGAGACGTAGGTGTGTTCACCGATCGCCACGCCCTTGCCCTTGGCCCTAGCAAAGCTCTTCTGGACGGCC
+AGATTCAACACATCTCAGCCGTGCGAGGGCGAAACTTTCTAGGCTGGATACATCCAGCGGCGACCGCGAC
+CGCGCCGGCGAGGACCGAAGCACCGACACCAACCAGGCCGGCGGCCGCTCGATAGGTACTGACCGCCCGG
+TCACAACAAGAGGAGACAGCGGATGACAGATCGAATTCACGTGCAGCCTGCACATTTACGTCAGGCCGCT
+GCCCATCACCAGCAGACCGCCGACTACCTGCGGACCGTGCCGTCGTCGCACGACGCGATCCGCGAAAGTC
+TGGACTCGCTGGGGCCTATTTTCAGTGAGCTCCGCGACACCGGGCGTGAGCTGCTCGAGCTCAGAAAGCA
+GTGCTACCAGCAGCAAGCCGACAACCACGCCGATATTGCCCAGAACCTGCGAACGTCGGCCGCGATGTGG
+GAGCAGCACGAGCGAGCGGCGTCGCGCAGCCTCGGCAACATCATTGACGGGAGCCGATGACAGGGCGATG
+ACCGACGCCAATCCCGCTTTCGACACGGTCCACCCCAGCGGGCACATTCTTGTTCGGTCCTGCCGCGGTG
+GATACATGCATAGCGTCTCGCTGAGCGAGGCGGCGATGGAGACCGACGCAGAAACCCTGGCGGAAGCCAT
+CCTGCTCACCGCCGACGTGTCCTGCCTTAAAGCGTTGCTGGAAGTACGCAACGAGATCGTGGCGGCGGGC
+CACACCCCGTCCGCGCAGGTTCCCACGACCGACGACCTGAACGTCGCGATCGAAAAGCTGCTGGCCCATC
+AACTGCGCCGCCGTAACCGTTGAAGTGCTAGATGAGCCAGGTCTTGGTGCTGTCGGGATCGGGTGCGATG
+TCGGTGGGCGGCTCGATCGGATTGGGGCCGAACAATTCTCGCGCTCGAGTGAGCAGAGCCCGCACCTCGT
+CGAGTTGCTGCTGCAGCGCAGAATCAGCCATAACCCCACGCTACCCAGGCCCCGTCTGACACACAATTCA
+CCACCCGCTCACCGCCTGCGCGGGCCAGATGATGCCGGTACGCTTACCCGGTGGCGATCTTCGGTCGATG
+GAGTGCGCGCCAGCGACTCCGGAGAGCGACCCGGGAATCCCTCACGATTCCGACGTTTAGCTCCTCGCTG
+GATTGCACCACACGGGTAATTGGCGGGCTCTGGCCCGCTGAGCTTTCGTCTAACACCGCCGAAACCGCCA
+CGCTTGCAGAACATCTGAAAGCGGATCTGCATCGGATAGTTGGTTCTGCCAACGACGAGCTGATGGTCAT
+CTGGCGTGCGGGGATGGCTGATTCGACGCGACGCGCAGAAGAAGACAGAGTGATCGACCGCGCCCGCGCG
+TCGGCGATGCGTCGCGTCGAGTCGGCGATGCGCGAGCTTCGGCAGATAACGGGGCGCGTTCCCGTGGAAA
+TTCCGCGTATGCGCGGCGCCGGCGGCTCGGATCTGGACACGACACGACTCATGCCGGCCGTCACGGTAGT
+TCAGCCCGCTGACCAGGCCTGTACGGATTGGCCGGTTGCCGCCGCCGAGGATGACGAAGCCCGACTGCAG
+CGCCTCCTGGCGTTCGTGGCTCGTCAGGAGCCACGGCTGAACTGGGCGGTCGGCGTTAACGCGGACGGCA
+CGACGGTCCTGGTCACCGACGTCGCCCATGGTTGGATACCTCCGGGCATCGCCCTTCCCGAAGGCGTGCG
+ATTGTTGGCACCGGCGCGACGCGCCGGCAGAGCCCCCGAGTTGGTCGGTATCACGACGTGTTGCAAGACG
+TACACCCCCGGTGACTCGCTGCGTCGGGCGGTCGATTCAACCGCGCCGACGTCCTCGGTGCAGCCGCGAG
+CGTTGCCAGCGATCGCCGGCCTGAGTGTGGAGCTGGGCATAGCGACCCAGCGGCACGACGGCTTACCGAA
+GATCGTGCACGCCATGGCCACGGCGGCCGGCAACGGCGCCGCCGCCGAGGAAGTCGACCTGTTGCGGGTG
+CACGTCGATACCGCGCTCCACCACGTCTTGGCCCAGTATCCCCGGGTCGATCCGGCGTTACTGCTCAACT
+GTATGTTGTTGGCCGCCACCGAGCGCAGCGTCACGGGAGACCCGATCGCGGCGAACTATCACTTCGCGTG
+GTTCCGGGAACTCGATTCACGCCGATAGCTTTCTCGAATCCCCACGGCAAGCGTCCGGCGATGAATTGAC
+GCTGGTGGGGGGCGTGGACATACTGTCATGGTGTCGGGGTCGGACAGTCGCAGCGAACCGAGCCAGCTGA
+GCGACCGAGACCTCGTCGAATCGGTTCTTCGTGACTTGAGCGAGGCGGCCGACAAGTGGGAGGCGCTCGT
+CACGCAGGCTGAAACTGTTACCTACAGCGTGGACTTGGGAGACGTTCGCGCTGTTGCCAATTCGGACGGG
+CGGTTGCTCGAGCTGACGTTGCATCCGGGCGTGATGACCGGCTACGCGCACGGGGAGCTGGCCGACCGAG
+TGAACCTGGCGATTACGGCCCTGCGCGACGAGGTTGAGGCCGAGAACCGGGCACGGTACGGCGGCCGCCT
+GCAGTGACATCGGTATCTGCGAGGATCAAGCCCATTTGCTGGCAAGGCATTTCGGCGCGGGGCGCAAGGC
+CCACAGCCGGGCCGTGGCCACCCTGAAAGCCGATATCCAAGCCTGGCACCCGGCTGGCATCCAGACCCCG
+AAGCCGCGATGCGAATCAGATGTGTTCGCGCGAATCGGTCACACGAGCCACCCATCAACTCGGAAGAGCC
+GGGTGGGGCCGGGAGCATCCGAGGCACCGCTTGCCTGACATAACAGCATAACCGCCCCGCCATTGTCGCT
+GTGATGGACATGCCCCAGCCATTTGTCGGCTAGCTATACAGCGAACGTCAATTTTTCGTGAATCAGCCTG
+AGGCTATTGATAATTCACGGCGGCACGTCCTACTCTTAGCGGCGCTATGCGACCCAATGCGCGTGCGATG
+TTGCGTTTGGTGCATTGTGGTGCCGGTGCTGGTGGGCCGGCGATAACGTCGAAAGGTGCGGTATTGGGTG
+ACCGTGTCGGCGCGTTGTCGCAGTGCCGATCGGCGGCAGCGCTGAGTCGATTCGACTTTGCACCCCGTGA
+CTCTGTTCCCACCGCCACCTTCGGTGGTGGATGCGCTTTCAGGTCCACCAATAGGCTAGCTGTTTTCGAG
+CGGTGTATTTGCGTGGGGGGTGAATGTGGATACGGACAATGACAGGCCCACGCTGGCGAGGGTTTACCGC
+AGCCTGCGGGACATTTGTCCGGACAGCTGGAATCTTCCGGGCGGTCGGATGCCCACTGGCTTGGGCTATG
+ACTTTCTGCGCCCTGTCGAGGACTCGGGGATCAACGACCTGAAGCACTATTACTTCATGGCGGATTTGGC
+CGATGGGCAACCGCTAGGCCGGGCAAACCTCTATAGCGTCTGTTTCGACCTGGCCACCACCGACCGCAAG
+CTCACTCCGGCCTGGCGAACGACCATCAAACGGTGGTTTCCGGGGTTTATGACCTTCCGTTTCCTCGAGT
+GCGGGTTGCTCACCATGGTGAGCAACCCGCTGGCGTTGCGGTCCGACACCGACTTGGAGCGGGTATTGCC
+TGTGCTGGCCGGCCAGATGGACCAGTTGGCGCATGACGACGGGTCGGATTTCTTGATGATCCGGGACGTG
+GACCCGGAACACTACCAGCGATACCTTGACATCCTGCGCCCGTTGGGCTTTCGGCCTGCGCTGGGCTTTT
+CCCGGGTAGACACGACCATCAGCTGGTCGAGCGTGGAAGAGGCACTGGGCTGCCTGTCTCACAAAAGGCG
+CCTGCCGTTGAAGACGTCGCTGGAGTTTCGTGAGCGGTTCGGTATCGAGGTCGAGGAACTCGACGAGTAT
+GCCGAGCATGCGCCGGTATTGGCCCGGCTTTGGCGCAACGTCAAGACGGAGGCAAAGGATTACCAGCGCG
+AGGACCTGAACCCTGAGTTCTTCGCGGCGTGTTCTCGGCATCTGCATGGACGTAGCAGACTGTGGTTGTT
+CCGCTACCAGGGCACGCCAATTGCCTTCTTTTTGAACGTTTGGGGTGCGGATGAGAACTACATACTGCTT
+GAGTGGGGCATCGATCGTGATTTTGAACATTATAGGAAGGCGAATCTGTACCGGGCGGCGCTGATGCTCA
+GCCTAAAAGATGCGATCAGCCGAGATAAACGGCGAATGGAAATGGGTATTACGAACTATTTCACAAAACT
+TCGCATTCCGGGTGCCCGAGTCATACCGACCATCTATTTCCTGCGTCACAGCACGGATCCGGTGCATACG
+GCAACGTTAGCGCGAATGATGATGCACAATATTCAACGGCCAACGCTACCCGACGATATGTCGGAGGAAT
+TCTGTCGCTGGGAAGAGCGAATACGTCTGGACCAGGACGGGCTACCCGAACACGATATCTTTCGCAAGAT
+CGATCGTCAGCACAAATACACGGGGCTCAAACTCGGCGGAGTCTACGGTTTTTATCCCCGATTCACCGGA
+CCGCAGCGATCCACGGTCAAGGCCGCGGAGCTGGGCGAGATCGTGTTGCTGGGCACGAACTCGTATCTGG
+GCCTGGCCACCCATCCAGAGGTGGTGGAGGCCTCGGCGGAGGCCACGCGACGGTACGGCACCGGCTGCTC
+GGGTTCGCCGTTGCTGAACGGCACGTTGGACTTGCACGTCTCGCTTGAGCAGGAACTAGCCTGTTTTTTG
+GGCAAACCCGCCGCCGTGTTGTGCTCCACCGGATATCAGAGCAACCTGGCGGCGATCAGCGCGCTATGCG
+AATCCGGGGACATGATCATCCAAGACGCGCTGAACCACCGCAGCCTGTTCGACGCCGCCAGGTTGTCCGG
+GGCCGACTTCACCTTGTACCGGCACAACGACATGGACCACCTGGCGCGGGTGCTACGCCGCACCGAGGGG
+CGCCGCCGGATCATCGTCGTGGACGCGGTGTTCAGCATGGAAGGCACCGTCGCCGACCTGGCCACCATCG
+CCGAGCTTGCCGACCGGCACGGCTGCCGGGTCTATGTGGACGAGTCCCATGCGCTGGGCGTGCTCGGCCC
+CGACGGGCGAGGAGCTTCGGCCGCGTTGGGTGTCTTGGCGCGCATGGACGTGGTGATGGGCACGTTCAGC
+AAATCCTTTGCCTCCGTCGGCGGGTTCATCGCCGGAGATCGGCCCGTCGTGGACTACATCCGGCACAACG
+GTTCAGGTCATGTGTTTTCCGCCAGCCTGCCGCCGGCCGCCGCGGCTGCCACCCACGCGGCTCTGCGCGT
+CAGTCGGCGTGAACCCGACCGGCGGGCGCGGGTGCTGGCCGCGGCCGAGTACATGGCCACCGGCCTGGCA
+CGGCAGGGCTATCAGGCCGAGTATCACGGAACCGCGATCGTGCCGGTGATCCTGGGCAACCCGACCGTGG
+CGCATGCGGGCTATCTGCGGCTGATGCGCTCCGGGGTGTATGTGAACCCGGTGGCCCCCCCAGCCGTGCC
+GGAGGAGCGTTCGGGATTCCGCACCAGCTACCTAGCCGACCACCGACAATCCGACCTCGACCGGGCCTTG
+CACGTGTTTGCCGGCCTTGCCGAGGACCTGACCCCGCAAGGAGCCGCGCTATGAAGGAGGCCATCAACGC
+CACCATCCAACGGATCTTGCGAACCGACCGCGGCATCACCGCGAACCAGGTACTCGTCGACGACCTGGGT
+TTTGACTCGCTCAAGCTGTTCCAGTTGATCACCGAGCTAGAAGACGAATTCGACATCGCCATCTCTTTCC
+GCGACGCACAGAACATCAAAACAGTGGGAGACGTCTACACCAGCGTCGCGGTCTGGTTCCCCGAAACCGC
+CAAGCCGGCCCCACTTGGGAAAGGAACAGCATGACCGACGACGCCGATCTTGATCTGGTCCGAAGAACTT
+TCGCCGCGTTTGCCCGCGGCGACCTCGCCGAGCTGACGCAATGCTTTGCGCCCGACGTGGAGCAGTTTGT
+CCCGGGCAAGCACGCCCTGGCTGGGGTGTTCCGCGGCGTGGACAACGTGGTTGCGTGCCTCGGCGACACC
+GCGGCCGCCGCCGACGGCACCATGACGGTGACGCTTGAAGACGTGTTAAGCAACACCGATGGCCAGGTGA
+TCGCCGTGTATCGATTGCGGGCCAGCAGGGCCGGGAAGGTCCTCGACCAGCGCGAGGCGATCCTGGTTAC
+CGTCGCCGGTGGTCGGATCACCCGACTTAGCGAGTTTTACGCCGACCCGGCGGCGACCGAAAGCTTCTGG
+GCATGACGGCGGCCTTGCTTTCACCAGCCATCGCCTGGCAGCAGATCTCGGCTTGCACGGACCGCACGCT
+GACGATCACTTGCGAGGATTCCGAGGTAATCAGCTATCAGGACCTCATCGCGCGCGCGGCGGCATGCATC
+CCCCCGCTACGGCGTCTTGACCTCAAACGCGGTGAACCCGTGCTGATCACCGCCCACACCAACCTGGAAT
+TCCTGTCCTGCTTTTTGGGCCTCATGCTCCATGGCGCTGTGCCGGTACCCATCCCGCCGCGGGAGGCACT
+GAAGACCACCGAGCGTTTCATGACTCGGCTCGGCCCACTGCTGCGCCATCACCGCGTGCTGATCTGCACA
+CCGGCCGAACACGACGAGATACGCGCTGCCGCCAGCACCGACTGCCAGATCAGCAGATTTACTGCCCTAG
+CCGAGGCTGGCGACGAGCAGTTCGGCCGCGCCACGGCCCAGCAACTCGCCGACACCGCCACCGCCGACTG
+GCCGCTATGCACCCTCGACGACGACGCCTACGTCCAATACACCTCTGGCAGCACCGCAGCACCACGCGGA
+GTGGTCATCACCTACCGCAACCTGCTGTCCAACATGCGCGCAATGGCCGTGGGCTCACAATTCCAGCACG
+GCGATGTCATGGGCAGCTGGCTGCCCTTGCACCATGACATGGGGCTGGTGGGCAGCCTATTCGCCGCACT
+CTTCAACAGTGTCAGCGCGGTATTCACCACGCCACACCGGTTTCTGTATGACCCGTTGGGATTCCTCAGA
+CTGCTCACCAGCTCCGGGGCTACCCACACGTTCATGCCTAACTTCGCTCTGGAGTGGCTGATCAACGCCT
+ACCACAGGCGCGGCGCCGACATCGAAGGCATCGACCTACACAAAATGCGCCGCTTGATCATCGCCTCCGA
+ACCCGTCCATGCCGAGGGCATGCGGAGATTCGCCGCCACCTTCGCCGGCGTCGGACTTGCCCCCACGGCC
+CTGGGTTCGGGCTATGGCCTGGCCGAAGCGACCGTCGCCGTGTCGATGTCAGCGCCCAACACGGGATTCC
+GCACCGAAACCCACGCCGCCGCGGAGGTCGTCACCGGCGGCCGAGTGCTGCCTGGCTACGAGGTGCGCAT
+TGACGCCGCACCAGGTGCCCGGGCCGGAACGATCAAACTGCGCGGCGACAGCGTGGCCGCCAAAGCCTAT
+GTGGGCGGGAAGAAGCTGGACGCGCTCGACGAGGAAGGCTTCTGCGACACCCACGACTTGGGTTTTCTTG
+TAGACGACGAAATCGTCATCCTTGGCCGGCAGGACGAGGTGTTCATTGTCCACGGAGAAAACAGATTCCC
+CTACGACATCGAGTTCATCATTCGCGGGGAATCCGAGCAGCACCGGACCAAAGTCGCATGTTTCGGGGTC
+AACGAACGCGTCGTGGTTGTGTTGGAAAGCCCATTGGACAGCATCATCGACAAGGCCGAAGCCGACCGAC
+TGAGATGTCAAGTCGTTGCCGCGACTGGGCTGCAGTTGGATGAACTGATCACGGTTCGGCGCGGCGCGAT
+TCCCACCACCACCAGCGGCAAGCTCAAACGACGCGCCGTCGCGCAGGCTTATCGAGACGGCACACTGCCC
+CGTCTTGCCACCCACGCGTGGACGGCGGATCCCGATAGCGCTCCCAAAACGACCCGGTCCAGCCTGGAAG
+GCGCCCACTGATCTTCCACTGACGTCTCATCAAACCCCCGGGGCGCTCGCGCGCTGGGCGCGCTCATCGA
+CCGGGGCTTGGGTTGATTGGCCCCGGCTCTCTTCGCGCGCTGGGCGCGCTCATCGACCGCGGCCGGGTGG
+CCCGGCGAAAGCTTGGGCGATCGTCAGCCAGCGTTGTGCGTCCTCCCCTACTGCGTTGACGTCAAGAGTG
+CTCAGCGCGCGCCGCTGGGTGACCAGGAAGCAGAAGTCCTCGGCGGACCCGGTGACCCGCTGGGCCGCAT
+CGGATGGCCCCCAAGACCAAGTGTCGCCGCTCGGTCCCCGCAGCTCGACCAGGAACGGCTCGGCCGGAGG
+GGTTAGGTTGTTGACGATGAACGCGTAGTCGCGGGTGCGGACACCGAGATGCGCAATAGACCGCAGTCGC
+TGGGTGGCGGGCCGGATGACGCCCAGGGCGTCGGCGACGTCCAGTCCATGTGCCCAGGTCTCCATCAACC
+GCGCTGTTGCCATCGACGCCGCGCTCATCGGTGGCCCGAACCAGGCCAATTTGCGGCCATCGGGAACCGC
+CAGCAGTTCCTCGTGCAGCCGCCCCCGAGTGACCCGCCAGTCTGTGAGCAGTTCGGCAGGTGAAACGGCC
+GCCAGTTCTGTCGCGGCGTCGTCGACGAAACCGGCCGGATTGGCCGCGGCGGCGGTCATCAGCTCGGCGA
+ACCCGGCCTCGTCGGTGACCGCCGTCAGCGCCACTCGATCGGTCCACAGCAGGTGGCCGATCTGGTGTGC
+GATGGTCCAACCCGGCGCAGGTGTCGGATCGGCCCAGCGATCCGCTGGCAGGTGCGCCACCAGCGCGTCG
+AGGTCGTCGCTTTCGGCACGCAGGTCTGCCACGAACGGCCCAGGATCCGCCATCACCACCTCCTGAGGTA
+ACAGTTCGTCGGGAAAGGCATGTTTGTACCCTAGCGACCGATCACAGGCTGGCCGCGGCGCCCGACGATG
+GTGTGCACCACCAGCCCGGCTAGGTAGATCGCCGACCCGAACAGCACAAATACGGGCGCGTGCCCGTGCT
+CGGGAATCAAGGCTGCGGCCACGGTAATCGAGAGGATGTATGAGACCCAAAACAGTGCATCCTGCACGGC
+GAACACGTGCCCGCGCAATGCGTCGTCGACGTCCATCTGCATCGCCGAATCGGCGCACAGCTTGACCACC
+TGGCCGGCCACACCTAAAAGGAAGCCGCATACCACCATCACCGGGACCAGCAGCCCGGCGGCCGCGACCT
+GGATAGTGGCGGCCGCAGCCAACGCGCCATTTGCCGTGGCGTAGCGTCCCCAGCGCCGGATCGCGGTCGG
+AGTCAAGACGTTGGCCAGGAAGGCTCCCAGCCCGGTGGCCGCGAAGAACAGCAGTGCGGTACCCAACCCC
+CCAACGGCCCGGGCGGTCACGTGGCGGACCAGGAGCAAGATCAGCAGTGAGTTGATACCGACCACCATCC
+GATGCGCTGCCAAACCGGACAGGCCGGCAGCGACGGTCGGAAGTTGCACCACGGTGCGCGCTCCATGTAG
+CCAACCGGTGACCACGGCGTAGACAGCAGATCCGTGGATCGCGCGTTCGGTGTCGTCCGGGCCGAGTACC
+CGCGGGCCGAACCGCAGCGACCAAAGCAACGCGATCGATACGGGGATCGCCACCAGGAAGACGATCGCGG
+AGGCCCCCTCGTCGCCGCTGCCGAGCAGCCAACGAGGCAACAGCATGAAGTTGGCGCCCAGGAACGCGGA
+GACCGCCCCCGACGCGATGGCCACCGAGTTCATCGTGACCACCTGTTCGCGCGGCACCACGTGGGGCAGT
+GCCGCCGACAGTCCCGAGGCGACGAATCGTGCCAAGCCGTTGGCGACCAGCGCTCCGACCAACAGCGGCA
+CGTCGCCGGCTCCGACCGCGAGTATCGTGCCGACCCCGGCGATCAGGGCTAGCCGGCCGGTGTTGGCGCC
+AACCAGCACCCACCGCCGATCCCACCGGTCCATTAGGGCCCCGGCGAAGGGCCCCAGCAGCGAATAGGGC
+AGAAACAGCACCGCGAAGGCCCCCGCGATGGCCATCGGGTCGGCCGCCCGGTCCGGGTTGAACAGCAACG
+CTCCGGCCAGCCCCGCCTGAAACAACCCGTCGCCGAACTGACTCGCAACCCGCACCTGCAGCAGACGCCA
+GAAGTCGGGCAAGCTGCGCACCGACCGCCAAACGTCGACGGGTGCGCGTGCGTGCATCCGGGAGTGAATC
+ACTAAACCCACTTCCACCCTGGGCACAGGCAAGGTTCGGTCCACCCCGTGCCGCCCCAACCACAGTAAAA
+ATATTCGCCGACCCTGCTTGTTCGCCCCGGGCGATGCGACGGTGGTGCGATGATGGTGTGGTGGCGCCGC
+ACGAAGACCCCGAGGACCATGTCGCACCCGCCGCACAACGGGTGCGAGCGGGCACCTTATTGTTGGCCAA
+CACCGATCTCCTTGAACCGACATTTCGCCGCAGTGTGATCTACATCGTGGAGCACAACGACGGCGGTACC
+CTCGGTGTGGTCCTCAATCGGCCCAGCGAAACCGCGGTCTACAACGTGTTGCCGCAGTGGGCCAAACTCG
+CGGCCAAGCCAAAGACAATGTTCATCGGTGGGCCGGTGAAGCGCGACGCGGCGCTGTGTCTGGCGGTATT
+GCGGGTTGGCGCTGACCCGGAAGGCGTGCCGGGCCTAAGGCATGTCGCGGGCAGGCTGGTGATGGTCGAT
+CTGGATGCCGACCCCGAGGTGCTCGCAGCGGCGGTGGAAGGGGTGCGCATCTACGCCGGGTACTCCGGCT
+GGACCATCGGTCAGCTCGAAGGTGAAATCGAGCGCGACGACTGGATTGTGTTGTCGGCGTTGCCATCTGA
+CGTTTTGGTGGGGCCGAGAGCCGACCTGTGGGGGCAGGTGCTGCGACGGCAGCCGCTGCCGCTGTCGCTG
+CTGGCCACCCACCCGATCGATCTGAGCCGGAACTAGGCTACTCCGCCGCCGAGCTTGCCAGAGCAGCGCG
+TCGCGTCGCCGCGGTCGAGCCAGGCGATCCGGCCCAGCCTAGTGGGCCACAGGCTGTTCAATGACAGGCC
+TGGGTGCAGACCGCGCAGCTGCCAACGCAGTTGGCGGTGGGGCTAGCGGTTTCACGGCGCAGCGCGTACT
+GGGCGCTCTGCCACGACCCCGCGGCCAGCGTGCCGACCGCGCCCGCAATGCAGACGATCACCACCATCAA
+GGCGGTGTGCCCGGGCGCGGCCACCGCCACCACTCCCCCGGCGGCCAGCATTACTGCGGCTGCCAACTGC
+GTGGGCGCCATCGCGCGCAGCGCCAGCGCCGTGGGGTCGGCAGTGGGCGTATGGAACAGCGACCAGCTCC
+CGAACAGGGCGGACGCCGCCGCCGCACACATGCACAGCACACCCGCGAGGAACATTCGTTCACCATACGA
+GGCCGCCGACGAATCCGCTCACCGAGCTCCATGCGGGCCCGTGTTTCTGCTCGGCCTCATCGCGACCTAG
+CGCGGCGGGACTGGTGTCAGGGTGCCCGCGGGCGGATACCCAGGCGCCTGCCCGGGTAGTCCCACCGGTG
+CCGAACCGGGTGCCGGGGCAGGCGCCTGAGCGGGCGCCGCATGCGCAACCACTTGGAATCCGTTGACAAT
+CGCATCGGTGGCCGGCCCGTCGGTGACCGCCTGCGACAGCGCGGTGGTCACCGACAGCGAAACCAGGTAC
+TTGTCGGCTCCGGAGGTGGCGATGACGTGGCGCCGGGAGGTGTTGAGGGTCATGTCGTTTTCGCGGTAGG
+TGCCCTCGATGATTGATGACGGAAAGCCGTCGAAATTGGCCATCGAGGCGTTTGTGGTCTGCCATGCGAG
+CAATTTCTGGCTGTCAATGTAGCCGTGTGTGATGGCCTCAGCGGGATCGAAGTCACCGATCAGCCTATAC
+ACCACCAGCTGCGCATTCGACGTGTAGACGCTGTTGCCCAACCGGTCGGCGATCACCACGAACGCGTCGG
+GCACGTTGGGGTCGGGCACCTGAGTCCAGCGCGGCGGCATCGGCAGTGTGATGTCGAGCGCCTTGAATCC
+GTGCGGTCGCTGTGCCTCCAGCTTGACGCCCTTCTCCCGGAGGTGGTCCCGAAGTGTGCCGCTGATCGCG
+GGAGTCACTGGCGGCGGCAGCGGGGGCACAGCGGTGGACCCGGGTGCTCCGACCGGAATCGGCGACGCGA
+TCGGTGCGGGTGCTGGCGCCGGTGAGAACCTGTTGCTGCTCCCGCCCGGAAGCGCCGTGAGGTTCTGCAC
+GGGCGGGACTGTTGCCGGCGCCGAGACTGGGGCAGGGATAGGCGGCGGTGGCAGCAGGGGATCCGCTGAG
+GCCTTCCCGGCGGTGACCAGCACCACGCCGATGAAACCGGTGGCCATGCCGCCTGCGAAGACCCGCCAGG
+TGCGCGCGATCTGGATCATTTGCGTCGGTCCCTCCGAATGGCCGGGCGACGGTGCCCGTCGTCGAGGCTG
+AATGTAACCAGCGCTCCATGGCAGTGCACAGGCTTGAAATGCAGCTGGAATGAACCTCTGATCGTGGTGC
+AACGGAACCGAGACCAACCCGTGGCCGGTAGCGCGGCCCCGGAGGTTCCCGGGCCACCCTTATACCCTGT
+TGGGCGTGACCGAATCGCCAACCGCTGGGCCTGGCGGCGTGCCCCGTGCCGACGACGCGGACTCCGACGT
+GCCACGGTACCGCTATACCGCCGAGCTCGCGGCTAGGCTGGAACGGACCTGGCAGGAAAACTGGGCCCGG
+CTAGGGACGTTCAACGTGCCCAACCCGGTCGGCTCGCTGGCCCCACCGGATGGTGCCGCGGTGCCTGACG
+ACAAGCTCTTCGTGCAGGACATGTTCCCCTACCCCTCGGGTGAGGGACTCCACGTTGGTCATCCCCTCGG
+CTACATCGCGACCGACGTCTATGCCCGCTATTTCCGGATGGTGGGCCGTAATGTGCTGCATGCGCTAGGG
+TTCGACGCGTTCGGGCTGCCCGCCGAGCAATACGCGGTGCAAACCGGCACCCATCCGCGTACCCGGACCG
+AAGCCAACGTCGTCAACTTTCGCCGCCAGTTGGGCCGGCTGGGCTTCGGCCACGACAGCCGACGAAGCTT
+CTCGACCACCGATGTCGACTTCTACAGGTGGACTCAGTGGATCTTCCTACAGATATACAACGCGTGGTTC
+GACACCACAGCCAACAAGGCGCGCCCGATATCAGAGCTGGTCGCCGAATTCGAGTCCGGTGCAAGGTGTC
+TCGATGGCGGCCGGGATTGGGCCAAGTTGACCGCGGGGGAGCGAGCCGATGTGATCGACGAGTACCGGCT
+GGTCTATCGGGCGGATTCGCTGGTGAACTGGTGCCCGGGGCTAGGTACGGTGCTTGCCAACGAAGAGGTG
+ACCGCCGACGGCCGCAGCGACCGGGGCAATTTTCCGGTGTTCCGGAAGCGGTTGCGGCAATGGATGATGC
+GGATCACCGCCTATGCCGACCGGCTGCTCGACGACCTGGATGTGCTGGATTGGCCTGAGCAGGTCAAGAC
+CATGCAGCGCAACTGGATCGGGCGTTCGACGGGTGCGGTGGCGCTGTTCTCGGCGAGAGCGGCCAGCGAT
+GACGGGTTCGAAGTCGACATCGAGGTGTTCACCACGCGGCCCGACACCTTGTTCGGCGCCACGTATCTGG
+TGCTGGCTCCCGAGCACGACTTGGTCGACGAGTTGGTCGCCGCGTCCTGGCCGGCTGGGGTCAACCCCTT
+GTGGACATACGGCGGCGGCACACCTGGTGAGGCCATCGCCGCCTACCGGCGTGCGATCGCCGCCAAATCA
+GACCTCGAGCGCCAGGAGAGCAGGGAAAAGACCGGCGTCTTCTTGGGCAGCTACGCCATCAACCCGGCCA
+ACGGTGAGCCGGTGCCGATCTTCATCGCCGACTACGTGCTGGCCGGGTACGGTACCGGGGCAATCATGGC
+GGTGCCGGGTCATGACCAGCGGGACTGGGACTTCGCTCGGGCATTTGGTCTACCGATCGTGGAAGTAATT
+GCCGGCGGCAATATTTCGGAATCCGCGTATACAGGCGATGGCATCCTGGTCAACTCGGATTACCTCAATG
+GAATGAGCGTGCCAGCAGCAAAGCGGGCCATCGTCGACCGGTTGGAGTCCGCGGGCCGCGGCCGGGCTCG
+AATCGAATTCAAATTGCGCGACTGGCTTTTTGCGCGGCAGCGGTATTGGGGTGAACCATTCCCGATCGTC
+TATGACAGCGACGGGCGTCCGCATGCACTCGACGAAGCTGCACTGCCCGTCGAGCTGCCTGATGTCCCGG
+ACTACTCGCCGGTTTTGTTCGACCCCGACGATGCGGACAGCGAGCCTTCGCCCCCACTGGCCAAGGCGAC
+TGAGTGGGTACACGTCGACCTGGACCTCGGTGATGGCCTGAAGCCCTACAGCCGCGACACCAACGTGATG
+CCGCAGTGGGCGGGCAGCTCCTGGTATGAACTGCGCTACACCGATCCGCACAACTCAGAACGGTTCTGCG
+CCAAGGAAAACGAGGCCTATTGGATGGGACCGCGGCCGGCTGAGCACGGCCCGGACGACCCCGGTGGCGT
+CGACTTGTACGTCGGCGGTGCTGAACACGCGGTTTTGCACCTGCTGTATTCCAGGTTCTGGCACAAGGTC
+TTGTACGACCTGGGTCACGTCAGCTCTCGCGAGCCTTACCGCAGGCTGGTCAATCAGGGCTATATTCAAG
+CTTACGCTTACACCGATGCGCGCGGATCCTATGTCCCTGCCGAGCAGGTGATCGAACGCGGTGACAGATT
+TGTCTATCCTGGACCTGACGGTGAGGTCGAAGTTTTCCAGGAATTCGGCAAAATCGGTAAGAGCCTGAAG
+AATTCGGTATCGCCGGACGAAATCTGCGACGCATACGGGGCAGATACGCTTCGGGTTTACGAGATGTCGA
+TGGGGCCGCTGGAGGCTTCACGTCCATGGGCCACAAAGGATGTTGTCGGCGCGTACCGTTTTCTGCAGCG
+GGTGTGGCGCTTGGTCGTCGACGAGCACACCGGCGAAACTCGGGTGGCTGACGGCGTGGAACTCGACATC
+GATACGCTACGGGCGTTGCACCGCACCATCGTCGGCGTGTCAGAAGACTTTGCGGCACTTCGCAATAACA
+CCGCAACGGCTAAGTTGATCGAATACACGAACCACCTCACCAAGAAGCATCGTGATGCGGTGCCTCGGGC
+CGCCGTGGAGCCGCTTGTACAAATGCTGGCTCCGCTGGCCCCACATATTGCCGAGGAGCTGTGGCTGCGA
+CTGGGCAACACCACCTCGTTGGCACACGGCCCGTTCCCGAAGGCCGATGCCGCCTACCTCGTCGACGAGA
+CGGTCGAGTATCCGGTGCAGGTGAACGGCAAGGTACGTGGCCGGGTGGTGGTGGCCGCCGACACCGACGA
+GGAAACGCTGAAAGCCGCCGTTCTGACCGACGAAAAGGTCCAGGCATTCTTGGCTGGTGCCACCCCGCGC
+AAGGTTATCGTGGTCGCCGGCCGGCTGGTCAATCTCGTCATCTAGGTCGTGTCGGCGGTGCCGACGGTGG
+GCGAGGTAATCCGCGGGGTAGTTCGTTGTATGCGTTACGCCGCGAGAGCCGGCGGCGACCAGATTGGTTG
+ATAGCGTGGTACTTTCACGCTCGTTTGCGAGCAGGGGAGTTGCTTGCAGGGCCACTGGCCGGTTCGCCCG
+AGGCGAGACGCTCCAGTGGCGCCAGGGCCTTCCTGAGGGTTTCCAAGTCGGAGCGGGGAAGTTGGCTGAG
+CAGCGCGGCCAGAGCCGCGCGCCGGTTGGCCAGTGACTCACCGTGAACCGCCCGCCCTTGCGGCGTGATG
+TCTACCAACACCGCCCGCAAGTCGGACGGGTCTCGCGAGCGTTTCACCAGTCCAATCTTCTCGAGCCGCC
+GGATCGCCACGGTGGTGGTGGGAGTTCGCACCCGTTCGTGAGCGGCCAGGTCGGTCATCCGGATGGGACC
+TTGATCGAGCAGGGTGACCAGGATCGACAGTTGCGCCAGCGTTAGGTCGCCGGCTGCAGCCCCGTTGGGA
+TCCCCGCGGCGCAGCATTGAAATCAGCTTGGACAATGCGCGGTGCAGCCCCTCCGCCAGTTGGGTCACTT
+CCGGTGCGGTGAATTCGCTGTCCGCCATAAACCGGCAGTCTAACCTGACATGCGTGTGACCGTAGACTTG
+TGTCGGGCGACCTTTGACCGCCAATGCATTTGGTCCCGAAATCCGCTGCATTTTCTTGCCAATCGAGCGG
+ACAACACTCATGTCATGGCTGACTACCTACATTGTCAGTTCTGCCGGATCCATGGTCAGTGATGTCGAAT
+GCCACTGACCGCCAACGGAAACCGGCTCTCGCGTTAACGGGACAGTCAATATTGGAGACGCCGGCAGCCG
+CTGCTGGCTTCACCATCGGATCGGCGTAATTAGGGCACCGGTGAGGAGGGCTGGTAGCTTCTGGCGAAGC
+CAGGGATCGGCGCCCCAAACGGGCCGGGACAAGCGCCCTCGGGCGGGACCAATACTCGGCGGCGGAACAG
+TTCGGCCAGCATCGTCTGGGCCATCAGCTCGGAACGGCCGATGCAGGCAGCCCTCGCAGCTTCAGGTTCG
+CGCCGATGGATTGCGGCGTTCTCTTCCTCGTAGAACGGCAACACGTCGTCGCGGCTGTTTTGGTATGTCA
+TCCAGAACACTCGCGGAATCAGGTTCTGTGAGGCCCGGATGGTGGCGTGCAGCCGCGGTCCTGCGTACTC
+GTCGTTGACCGTGCGCCGGTACTCCCACACGCATTCGGCGAAGGCCCGCGACTCCTTGGAGTTGCGCAGC
+GATCGCATGACTGCGTCGAGCTGGCCCAGGATCCGAGGCGTGGGGTTGGCGGCTGCGCGGGCAGAGGCAA
+TGCCGTTGAGCAAGCCGTCGAGTTCGTGATGTTCCAGGATGGTGGCGACGTCGAACCGCTCGATGAACGC
+GCCGCGGTGATAGCGAGTCGACACAATGCCGTCGTGTTCGAGTTGAACCAGCGCCTCTTGGATGGGAACC
+CGGCTGACCCCCAGGCCGTGCGCGATTTCATTGCGGTCGACGCGGTCCCCGCTGCGCAGTTTGCCGGTCA
+ATAGCAGGTTGAGGATGTGGGCGACAACCTGGTCCTTTTCCTTAACCCCGTACTTTTTTGGCATCGGTAT
+CTAGCATCTCTTTCAGCCCGCTGCAGCCATCCGGCGCTGGCAAGTTTCTCATGACTCGGCGTCTGCGTTG
+TGGTGTTTCCCAGATGAAGCCGGGGGTAACGCGATCTGACAGACGTCAACCGGAGTTCACCGGCCATCGC
+GCCACCTGCAAAGCGCGGCCGCAGCGCTCAGGTCGTAGTCGGGACCGTCACAGCCAACGGTCAACAGCGT
+GACACCGAGACCGGCGAGGGCTTCGGCGCTGGCGATCAGCCCGCCGCCGTCGACCGCGGCGGAGCGTTCG
+ATAGTCGCTGGGTTTCGGCCGACGGTCGAGCAGTGCGTGCTCAGCACGGCCGACTTCGCTAGGTAGCTGT
+CCCCGGCGGTAAAGCTGTGCCAGATATCGGCATACTCGGCGACCAGTCGCAGGGTCTTACGCTCTCCGCC
+GCCGCCGATCAGCACCGGGATGTCCCGTGTCGGCGGCGGGTTCAGCTTGCCAAGCCGCGCCTTGATCCGG
+GGCAGCGCAGCCGCCAGGTCGTCGAGGCGGCTGCCCGCTGTGCCGAACCGGTAGCCGTACTCGTCGTAGT
+CCTTCTGTTTCCAGCCCGACCCGATACCCAGGATGAGCCGGCCGCCGGAGATGTGGTCGACGGTACGGGC
+CATGTCGGCAAGCAGCTCCGGATTGCGGTAGGAGTTGCACGTCACTAGAGCGCCGATTTCGATGTGCGAC
+GTTTGCTCGGCCCAGGCTCCCAAGACGGTCCAGCATTCGAAGTGTGGGCCGTCAGGGTCGCCGTAGAGCG
+GAAAGAAGTGGTCCCAGGTAAAAGCGATGTCCACACCGATGTCCTCGCACCGGCGGACGGCGTCTCGGAC
+GGCGCGGTAATGGGGGGCGTGCTGCGGCTGCAGTTGTACGCCGATACGAACGGGGAGATCGGGACGCACG
+AGTGAAGTCATGGGTCCACCGTAGGCTCAGCGTGTGTCGAGCACCCCGCGCACGATCTCGATCAGGGCGC
+GCGGTTGGTCACTTTGCACCGAGTGGCCTGACTTCTCGACGATGTGAACGCCACGGAAATGCGTTGCACG
+CCTGTGGAGTTCGGCGGTGTCCTGGTCGGTGACGAAGCCCGACGAGCCGCCGCGCACGAGTGTGATCGGC
+GCGGACAGGGCGTCGACGTCGTCCCAGAGCCCTGCGAAATCTCCGAACGTGCGGATCGCGTCATAGCGCC
+ACACCCAGTTGCCGTTGTCCAGCCGGCGGGAGTTGTGGAACACGCCGCGGCGCAACGACTTGACATCGCG
+GTGCGGGGCCGCGGCGATCGTTAGGTCCAGCATGGCCTGAAAGCTGGGGAATTCCCGCTCGCCGTGCATC
+AGCGCCACCGTGCCGCGCTGCTCGGCGGTCAGCTCGGCGTGCCGTTGCAATGCCGACGGGGTGACGTCGA
+CGAGAACGAGTTCGCCGACCAGGTCGGGTGCCATCGCGGCCAGCCGTATCGCAGTCAACCCGCCCAGCGA
+CATGCCGACCACGAATTCGGCACCCGGCGCAAGCTCGCGTAGCACCGGCGCCAAGGTCTCGGAGTTGAGC
+TGCGGCGAGTAATTGCCGTCCTCCCGCCAAGCGGAATGGCCGTGCCCTGGAAGGTCCACCGCCAGCGCCG
+GCTCACCCAGGCCGACGATCACGGTGTCCCAGGTATGGGCGTTCTGTCCGCCGCCGTGCAGAAAGATCAC
+CCGCGGCGCAGAGCCGCCCCAGCGCAGCGCGCTGATGGCTCCCGCTTGGACCCGCTCGACTTCAGGCAGT
+GGACCATTGACACCGGCCTGCTCAGCGTTCTCAGCCAGCAGGGCAAACTCGTCCAGTCCGGTCAGTTCGT
+CGTCAGATAGCACGCAGCGGACGTTACCCGCGTTTGACTCTGCGGATACCAGGCAATTGTGCGAGTGGCC
+CGCGTGGTAAGCGCAGAGTCAACGCTAACCGATGATGAACTCTTCGAGTTGCGCGCGCGCGATGTCGTCG
+GGCAGCTGCTCGGGCGGGCTCTTCATCAGGTAGGCCGACGCCGGGATCACCGGTCCGCCGATGCCGCGGT
+CCTTGGCGATCTTGGCCGCCCGCACCGCGTCGATGATGACGCCGGCCGAGTTTGGCGAGTCCCACACCTC
+GAGCTTGTACTCCAGGTTCAACGGCACATCTCCGAAGGCGCGGCCCTCAAGACGGACATAGGCCCATTTG
+CGATCGTCGAGCCATCCGACGTGGTCGGACGGGCCGATGTGCACGTCCTTGGTCTTGAACTCGCGCTTCA
+GATTCGAAGTGACGGCCTGGGTCTTGGAGATCTTCTTGGACTCCAGCCGTTCACGTTCGAGCATGTTGAG
+GAAGTCCATGTTGCCGCCCACGTTGAGCTGCATGGTGCGGTCGAGCTGCACGCCGCGGTCCTCGAACAGC
+TTGGCCAGCACCCGGTGGGTGATCGTCGCGCCGACCTGGCTCTTGATGTCATCACCGACGATGGGTACCC
+CGGCGTCGGTGAACTTCTTGGCCCACACCGGGTCGGAGGCGATGAACACCGGCAGCGCGTTGACGAACGC
+CACCCCGGCGTCGATAGCACACTGGGCGTAGAACTTGTCGGCTTCCTCCGAGCCCACCGGCAAATAGGAG
+ACCAGCACGTCGACCTTGGCCTCCTTGAGCGCCTGGACGACGTCGACGGGCTCCGCGTCGGAGAGTTCGA
+TGGTGTCGGCGTAGTACTTGCCGATGCCATCGAGGGTAGGCCCGCGCTGCACGATCACGTTGGTCGGCGC
+CACATCGGCGATCTTGATGGTGTTGTTCTCCGAGGCGAAGATGGCGTCGGACAGGTCGAAGCCGACCTTC
+TTGGCGTCCACGTCGAACGCCGCCACGAACTTGACGTCGCGAACGTGGTACGGGCCGAACCGCACGTGCA
+TGAGGCCCGGTACGGTCGATGTGTCGTCGGCGTTGTAGTAGTACTCGACGCCCTGGACCAGCGAGGACGC
+GCAGTTGCCGACGCCGACAATGGCGACTCGAACCTCCGTCGACGCCTCCGGCGCCGGTAACGACTGGTGC
+TCACTCATTAAGGCGTTCTCCTAACCTCATAACCTCTGGGGTGTCTTGGGTGTTGGTTCGTGCTGGGTTT
+ACGTCTGTTCGGCGGGGTTGGGTGCTGCCCGTTCCGCGGCGATGAGCTCGTTGAGCCACTTGACCTCGCG
+CTCGCTGGACTCGAGCCCGAGTTGATGCAATTGGCGGGTGTAGCGGTCGAAGGAACTGCTGGCCCGCGCC
+ACCGCCTCGCGCAAGCCTTCCCGGCGTTCCTCGACCTGGCGGCGCCGGCCTTCCAGGATGCGCATCCGCG
+CTTCGGCCGGGGTGCGGTTGAAGAACGCCAGGTGCACCCCGAAACCGTCGTCGGTGTAGTTGTGTGGGCC
+GGTGTCGGCCACCAGCTCGCCGAATCGACGGCGACCCTTGTCGGTCAGTTGGTAAACGCGTCGTGCTCGC
+CGCACCGGGGTGCCCGCTGGGGCGGCATTCTCGGCGATCAACCCGTCGGCCTGCATGCGTCGCAGCGCCG
+GGTATAACGAACCGTACGAAAATGCCCGAAACGCGCCCAGCAGGCCGGTCAGCCTCTTGCGCAACTCGTA
+GCCATGCATCGGTGACTCGATCAACAGACCCAGGATGGCGAGCTCCAGCATCGAGTCACCTCCTTTTGTA
+TGGCTTTTGAATGGCCGTTACGACGGTTCGACGCCTCGCGTCATCGTATCGCCTCGATATATTTGCGACA
+ACATCACCGCGTCAAGACGGGTAGCTGACGTGCTTGATGGTGCCGTCACCTGCGAAAACGAGGTATCCAC
+CGCCGTAGTCGCTAGAGACATACAACGACAACGACAACGCAGCCGGCGTGGTGGGGTCCTTGGCCGGTTC
+GACGATCAGGTACATGCTTTTGACGTCGGATTGTTTGAGGCCGAGGGTTTCCGGGGCGCCGCGCATGATG
+CTCACAGCGGTCTTCGCATCGAATTTGCTCAGGTCAACCACGGACACGTCGGCAATGCTCTTGGCGGAAC
+TGGTCGCATCGCCCCAGCCGCCGCGGTAGGTATACGCCAGGACTCGGCGGTCGTCCGCCGGGTCGACGCG
+ATCGAGCGACGCATACTCCGGGTAGATCACCAGCCGGTAGCCCATGGTGTCGCCGAACCGCTTGCGGGTC
+TGCTCCAGCAGGCCGGTGAGCCCGCCGAGGGAATGCAGCTGCCTGGGCGGGGTCAGCACCACGGGGGCGA
+TCCCGTCGGGCTTTGCTCCGGGATCCGAGGTGAAGTCCAGCGGAGAGCGGGTGTTGCCGTACACGCCCCA
+GCCGATGCCGACGCCCAGCAGCACCGATGCGACAAACGCAGCGGCCAGCAAGCCCAACTCGGTGCGTTTC
+GCCCGCGATTTGAGCGCGGGCATTTGTGCGGGTGCGCTCTCGACCTGCAGGTCGGCCACCAGACGCTGCA
+GGTCACCTAGGGTCACAGCCTTGGTAGCTGCGCTGACGCGCTCCCGGTGTTCCTCCATCGAGAGCTCGCC
+GTCACGCAGGGCGTCGTCGAGAATCCGGCAGGCGTCCTGCCGGTCGCTGTCTTTGGCGCGGGTTGCCGTC
+GATACTCCGCGCGCAAGGGGTGCGCCCAGCCACTTCGCCACAGGGACGATAGTAGGAGTCTGGCTGGGAA
+TCTGAACTCGATCCCGCCGTACCCGCGCAACAACGGCGCCGGTTGCGTATCGGTGGTGTGGATGGCGTCG
+TACTCTGGTCAGCGTGCGACTGCAGCGACAGGTAGTGGACTACACGCTACGGCGACGCTCCCTGCTGGCC
+GAGGTGTATTCGGGACGCACCGGTGTGTCGGAGGTGTGCGACGCCAACCCCTACCTGCTGCGCGCCGCAA
+AGTTTCATGGGAAGCCCAGCCGGGTCATCTGCCCGATCTGCCGCAAGGAGCAGCTCACACTGGTGTCGTG
+GGTGTTCGGCGAGCACCTCGGTGCGGTATCAGGGTCCGCGCGCACCGCCGAAGAACTGATCCTGCTGGCG
+ACCCGGTTCTCCGAGTTCGCGGTCCACGTGGTGGAGGTATGTCGAACCTGCAGTTGGAATCATCTGGTCA
+AGTCATACGTCCTGGGCGCCGCACGTCCGGCACGCCCCCCTAGGGGGTCTGGCGGGACGCGGACGGCGCG
+CAACGGGGCCCGCACGGCCAGTGAATAGCGACGGGCGTCACCATCAGTCGTCCAGCGGCGCCCCGCGCGG
+GCCGGCGAATCCCGGCCAGCGTGGTCAGGTTCCACCCGACGACAGACTGACCGCGATCCTCCCGCCGGTG
+ACCGATGACCGATCGGCTCCGCACGCGGACTCCATCGAGGCGGTCAAGGCCGCGCTCGACGGCGCGCCGC
+CGATGCCCCCGCCGCGCGACCCGCTCGAGGAGGTCACGGCCGCGTTGGCCGCCCCGCCCGGTAAACCGCC
+GCGGGGGGATCAGCTTGGTGGCAGACGTCGCCCACCGGGGCCGCCCGGGCCCCCCGGTTCGTCCGGACAG
+CCTGCCGGCCGGCTGCCCCAACCGAGGGTGGACTTGCCCCGGGTCGGCCAGATCAACTGGAAATGGATAC
+GGCGTTCGCTGTACCTCACCGCGGCGGTGGTGATCCTGTTGCTGATGGTCACCTTCACGATGGCCTACCT
+GATCGTCGACGTTCCCAAGCCAGGTGACATCCGTACCAACCAGGTCTCCACGATCCTTGCCAGCGACGGC
+TCGGAAATCGCCAAAATTGTTCCGCCCGAAGGTAATCGGGTCGACGTCAACCTCAGCCAGGTGCCGATGC
+ATGTGCGCCAGGCGGTGATTGCGGCCGAAGACCGCAATTTCTATTCGAATCCGGGATTCTCGTTCACCGG
+CTTCGCGCGGGCAGTCAAGAACAACCTGTTCGGCGGCGATCTGCAGGGCGGATCGACGATTACCCAGCAG
+TACGTCAAGAACGCGCTGGTCGGTTCCGCACAGCACGGGTGGAGCGGTCTGATGCGCAAGGCGAAAGAAT
+TGGTCATCGCGACGAAGATGTCGGGGGAGTGGTCTAAAGACGATGTGCTGCAGGCGTATCTGAACATCAT
+CTACTTCGGCCGGGGCGCCTACGGCATTTCGGCGGCGTCCAAGGCTTATTTCGACAAGCCCGTCGAGCAG
+CTGACCGTTGCCGAAGGGGCGTTGTTGGCAGCGCTGATTCGGCGGCCTTCGACGCTGGACCCGGCGGTCG
+ACCCCGAAGGGGCCCATGCCCGCTGGAATTGGGTACTCGACGGCATGGTGGAAACCAAGGCTCTCTCGCC
+GAATGACCGTGCGGCGCAGGTGTTTCCCGAGACAGTGCCGCCCGATCTGGCCCGGGCGGAGAATCAGACC
+AAAGGACCCAACGGGCTGATCGAGCGGCAGGTGACAAGGGAGTTGCTCGAGCTGTTCAACATCGACGAGC
+AGACCCTCAACACCCAGGGGCTGGTGGTCACCACCACGATTGATCCGCAGGCCCAACGGGCGGCGGAGAA
+GGCGGTTGCGAAATACCTGGACGGGCAGGACCCCGACATGCGTGCCGCCGTGGTTTCCATCGACCCGCAC
+AACGGGGCGGTGCGTGCGTACTACGGTGGCGACAATGCCAATGGCTTTGACTTCGCTCAAGCGGGATTGC
+AGACTGGATCGTCGTTTAAGGTGTTTGCTCTGGTGGCCGCCCTTGAGCAGGGGATCGGCCTGGGCTACCA
+GGTAGACAGCTCTCCGTTGACGGTCGACGGCATCAAGATCACCAACGTCGAGGGCGAGGGTTGCGGGACG
+TGCAACATCGCCGAGGCGCTCAAAATGTCGCTGAACACCTCCTACTACCGGCTGATGCTCAAGCTCAACG
+GCGGCCCACAGGCTGTGGCCGATGCCGCGCACCAAGCCGGCATTGCCTCCAGCTTCCCGGGCGTTGCGCA
+CACGCTGTCCGAAGATGGCAAGGGTGGACCGCCCAACAACGGGATCGTGTTGGGCCAGTACCAAACCCGG
+GTGATCGACATGGCATCGGCGTATGCCACGTTGGCCGCGTCCGGTATCTACCACCCGCCGCATTTCGTAC
+AGAAGGTGGTCAGTGCCAACGGCCAGGTCCTCTTCGACGCCAGCACCGCGGACAACACCGGCGATCAGCG
+CATCCCCAAGGCGGTAGCCGACAACGTGACTGCGGCGATGGAGCCGATCGCAGGTTATTCGCGTGGCCAC
+AACCTAGCGGGTGGGCGGGATTCGGCGGCCAAGACCGGCACTACGCAATTTGGTGACACCACCGCGAACA
+AAGACGCCTGGATGGTCGGGTACACGCCGTCGTTGTCTACGGCTGTGTGGGTGGGCACCGTCAAGGGTGA
+CGAGCCACTGGTAACCGCTTCGGGTGCAGCGATTTACGGCTCGGGCCTGCCGTCGGACATCTGGAAGGCA
+ACCATGGACGGCGCCTTGAAGGGCACGTCGAACGAGACTTTCCCCAAACCGACCGAGGTCGGTGGTTATG
+CCGGTGTGCCGCCGCCGCCTCCGCCGCCGCCGTCGGAGGTACCACCTTCGGAGACCGTCATCCAGCCCAC
+GGTCGAAATTGCGCCGGGGATTACCATCCCGATCGGTCCCCCGACCACCATTACCCTGGCGCCACCGCCC
+CCGGCCCCGCCCGCTGCGACTCCCACGCCGCCGCCGTGACCGGCGCGCTGTCCCAAAGCAGCAACATCTC
+GCCACTTCCTTTGGCCGCCGATCTGCGGAGCGCCGATAACCGCGATTGCCCCAGCCGCACCGACGTATTG
+GGTGCCGCTCTGGCGAATGTCGTCGGTGGCCCGGTAGGCCGGCACGCGCTGATCGGCCGCACCCGGCTGA
+TGACCCCGCTGCGGGTGATGTTTGCAATCGCGTTGGTGTTCCTGGCGCTCGGTTGGTCGACGAAAGCGGC
+CTGCTTGCAGTCCACCGGAACCGGTCCAGGTGATCAGCGGGTGGCCAACTGGGATAACCAGCGTGCTTAC
+TACCAGTTGTGCTACTCCGATACGGTGCCGCTCTATGGCGCTGAGTTATTGAGCCAAGGCAAGTTTCCGT
+ACAAATCAAGCTGGATCGAAACCGACAGCAACGGCACACCGCAGCTGCGCTACGACGGACAGATCGCGGT
+GCGCTATATGGAGTATCCGGTGCTGACTGGGATCTATCAGTACCTGTCGATGGCGATAGCCAAGACCTAC
+ACCGCGTTAAGCAAGGTGGCTCCCCTCCCGGTGGTTGCCGAAGTGGTGATGTTCTTCAACGTCGCCGCGT
+TCGGTTTGGCGCTGGCGTGGCTGACAACCGTCTGGGCGACCTCGGGCCTGGCCGGCCGCCGGATATGGGA
+TGCGGCGCTGGTGGCCGCCTCACCGCTGGTGATCTTTCAGATATTCACCAATTTCGATGCGCTGGCAACG
+GGTTTGGCGACGAGTGGGCTGCTGGCCTGGGCGCGGCGCAGACCGGTGCTTGCCGGTGTGCTGATCGGGT
+TGGGCTCCGCGGCGAAACTGTATCCGCTGTTGTTCTTGTACCCGTTGTTGCTGCTGGGCATCCGGGCCGG
+TCGCCTGAATGCTCTGGCCCGCACCATGGCGGCCGCGGCGGCGACCTGGTTGTTGGTGAATCTGCCGGTG
+ATGCTGCTCTTTCCGCGCGGCTGGTCGGAGTTCTTCCGGCTCAACACCCGGCGCGGCGACGACATGGACT
+CGTTGTACAACGTCGTCAAGTCGTTCACCGGCTGGCGTGGCTTCGACCCCACCCTGGGCTTCTGGGAGCC
+GCCGCTGGTGCTGAACACGGTTGTCACGCTCTTGTTCGTGTTATGTTGTGCGGCAATTGCTTACATCGCG
+CTCACCGCACCCCACCGGCCGCGCGTGGCGCAGCTGACTTTCTTGACGGTGGCCAGCTTCCTGTTGGTCA
+ACAAGGTGTGGAGTCCCCAGTTCTCGCTTTGGCTGGTGCCGCTGGCCGTGCTGGCTTTGCCGCACCGCCG
+GATCTTGCTGGCGTGGATGACGATCGACGCGTTGGTGTGGGTGCCGCGGATGTACTACCTATACGGCAAC
+CCGAGCCGCTCGCTGCCCGAGCAGTGGTTCACCACGACGGTGTTGCTGCGTGACATCGCCGTGATGGTGC
+TGTGCGGACTGGTGGTCTGGCAGATCTACCGCCCCGGGCGCGACCTCGTGCGTACCGGCGGGCCAGGGGC
+ACTGCCGGCTTGTGGGGGAGTCGACGACCCGGTGGGAGGGGTCTTTGCCAACGCCGCCGACGCCCCGCCA
+GGTCGGCTACCGTCGTGGCTGCGTCCCCGGCTGGGCGACGAGCATGCGCGAGAGAGGACGCCCGATGCAG
+GTCGCGATCGCACTTTTTCCGGGCAACACCGCGCTTGACGCGGTTGGCCCCTACGAGGTGCTGCAGCGGG
+TGCCGTCGTTCGACGTCGTGTTCGTCGGCCACCGCCGCGGGGAGGTTCGCAGCGACAACGCCATGCTGGG
+TCTGCTGTGTGACGCGGCATTCGACGAGCTAACCCGGCCCGATGTGGTGATCTTTCCGGGCGGCATCGGA
+ACTCGGACCCTGATCCACGACCAGACCGTGCTCGACTGGGTGCGCGAAGCGCACCGGCACACCCTACTCA
+CCACCTCGGTGTGCACCGGCGGGCTGGTGTTGGCGGCTGCCGGACTGCTCAACGGCTTGACCGCGACCAC
+GCATTGGCGAGTACAGGATCTGTTCAACTCGCTGGGCGCCCGATACGTCCCCCAGCGTGTCGTCGAGCAT
+CTGCCAGAGCGGGTCATCACCGCCGCCGGGGTGTCGAGCGGGATCGACATGGGATTGCGGCTGGTGGAGC
+TTTTGGTCAGCCGGGAAGCCGCCGAAGCGAGCCAGCTGATGATCGAGTATGACCCGCAGCCACCGGTGGA
+TGCCGGCTCCCTGGCCAAGGCCTCGCCGGCTACCCATCGGCTCGCGTTGGAGTTCTATCAGCATCGTTTG
+TGATCTGTTCGCGATAGGCCTCGCCGTTCGCGACACTGACATTGCGCACACGACACGCCGCGGATCGTCG
+CACCGGGTTAAGCCTGGAGTGCGGTGGTGCCTGGTCGGCATTTTCGCAGTCGAGGGCTCTCGTGTAGCCT
+GGGCGAGTTGCCGACGCAGGCGACCCTCCTGCCACGGATCGACCGTGGCCGCACACGACCACAGGAGGTG
+ATGAGGTTCCTATGCGTCCATACGAAATCATGGTCATCCTCGACCCGACCCTCGACGAACGCACCGTAGC
+CCCGTCCTTGGAGACGTTCCTCAACGTCGTCCGTAAGGACGGCGGAAAAGTCGAAAAGGTGGACATCTGG
+GGCAAGCGTCGGCTGGCGTACGAGATCGCCAAGCATGCCGAAGGCATCTACGTGGTGATCGACGTGAAAG
+CCGCCCCGGCGACGGTGTCCGAACTCGACCGCCAGCTCAGCCTCAACGAGTCGGTGTTGCGCACCAAGGT
+AATGCGCACCGACAAGCACTAATCGGCCTGCCAGGCACTGGCTGTTCGCTGTCGGTGCGGTTACGTAGGC
+TCGGCGAAGAAGAACACGACCAGCCGCCGAACCCAGGCGGACGCAGGAGGAAATTGTGGCTGGTGACACC
+ACCATCACCATCGTCGGAAATCTGACCGCTGACCCCGAGCTGCGGTTCACCCCGTCCGGTGCGGCCGTGG
+CGAATTTCACCGTGGCGTCAACGCCCCGGATCTATGACCGTCAGACCGGCGAATGGAAAGACGGCGAAGC
+GCTGTTCCTCCGGTGCAATATCTGGCGGGAGGCGGCCGAGAACGTGGCCGAGAGCCTCACCCGGGGGGCA
+CGAGTCATCGTTAGCGGGCGGCTTAAGCAGCGGTCGTTTGAAACCCGTGAGGGCGAGAAGCGCACCGTCA
+TCGAGGTCGAGGTCGATGAGATTGGGCCTTCGCTTCGGTACGCCACCGCCAAGGTCAACAAGGCCAGCCG
+CAGCGGCGGGTTTGGCAGCGGATCCCGTCCGGCGCCGGCGCAGACCAGCAGCGCCTCGGGAGATGACCCG
+TGGGGCAGCGCACCGGCGTCGGGTTCGTTCGGCGGCGGCGATGACGAACCGCCATTCTGACCCCAAGAAC
+TGCAAATCAAGAAACGGAAAGATAGACACTCATGGCCAAGTCCAGCAAGCGGCGCCCGGCTCCGGAAAAG
+CCGGTCAAGACGCGTAAATGCGTGTTCTGCGCGAAGAAGGACCAAGCGATCGACTACAAGGACACCGCGC
+TGTTGCGCACCTACATCAGCGAGCGCGGCAAGATCCGCGCGCGTCGGGTCACGGGCAACTGCGTGCAGCA
+CCAGCGAGACATCGCGCTCGCGGTGAAGAACGCCCGCGAGGTGGCGCTGCTGCCCTTTACGTCTTCGGTG
+CGGTAGCGCCGAATGTCCAACGGAGAGTGCAAAATACCATGAAGCTCATTCTCACGGCCGATGTCGATCA
+CCTCGGGTCCATCGGCGACACTGTCGAGGTCAAGGACGGGTATGGCCGTAACTTTCTGCTCCCGCGCGGC
+CTGGCGATCGTCGCCTCGCGCGGAGCCCAGAAGCAGGCTGACGAGATCCGCCGGGCCCGCGAAACCAAAA
+GCGTACGCGACCTAGAGCACGCCAACGAGATCAAGGCGGCGATCGAGGCGCTCGGCCCGATAGCGCTGCC
+GGTGAAGACTTCAGCTGATTCTGGGAAGTTGTTCGGCTCGGTGACCGCCGCAGATGTGGTTGCTGCCATC
+AAGAAGGCCGGTGGACCAAACCTCGATAAGCGGATCGTTCGGCTGCCCAAGACGCACATCAAGGCCGTGG
+GCACGCATTTTGTGTCGGTGCACCTGCACCCGGAAATCGATGTCGAGGTATCGCTGGACGTCGTGGCGCA
+GAGCTAAGGCAAGCTGAGGCCACAACAGTTTGCGCATGCCGGTGGTGACCGCGGTCGGCCGCCGCCGGGG
+TTTCGCCATGCCCTGGGTGTCCACCGCACGGTCCGGTGCGGTGATGCTGGCGAACTATTCGGCCGGCGTT
+TGCGGGCGGGTGTCTTCACCGGGCCTTAACGTCAGGAAAATGTGTCTGAAAGCCAACACGCCCGGCGCGG
+TAACCTGGCTCGACACGCCGAAGAGATTCTTGTCCACACAAACGGCGTCGCGTTGTATGGCCGTTAACAG
+CAGTGATGTCGTAACGGGCCGTATTGATCCACAGGTTCTCCACACCCCGCTCAACACAGACGTCGACGGA
+TATGCACATGCGATGCACAGCTCCATAAACAGTGGCCCCTTGGAGTACTTGCCAGCAACGTTTAGCGTCT
+TCCCGGCGCTAGGCGATGTGGGTGACTTGGGCGGTGGTGTCGGTGCGGCGACTTACGCTCTGGATAGGTT
+GTCGAATATGCGTTCGGGTGCTTGTGTCGGAGGAGGTGAGAGCCCATGGCGGTCGTTGATGACCTAGCGC
+CCGGCATGGACTCCTCACCGCCCAGTGAAGATTACGGCCGTCAACCACCGCAGGATCTCGCCGCCGAGCA
+GTCCGTGCTGGGCGGGATGTTGCTGAGCAAGGACGCCATCGCCGATGTACTGGAACGGCTACGGCCCGGC
+GATTTTTATCGTCCGGCGCATCAGAACGTCTACGACGCCATTTTGGACCTGTATGGGCGGGGAGAACCGG
+CTGATGCGGTGACGGTGGCCGCCGAACTGGATCGCCGTGGGCTGCTGCGCCGCATCGGCGGTGCTCCCTA
+CCTGCACACCCTGATCTCGACGGTGCCGACGGCCGCCAACGCGGGCTACTACGCGAGCATCGTTGCCGAA
+AAGGCGCTGCTGCGCCGGCTGGTAGAGGCCGGAACCCGGGTGGTGCAGTACGGCTATGCCGGCGCCGAAG
+GCGCGGATGTGGCCGAGGTGGTCGATCGCGCGCAGGCCGAAATCTACGACGTCGCGGATCGGCGGCTGTC
+GGAAGACTTTGTGGCGCTTGAGGACCTGCTGCAACCGACGATGGACGAGATCGATGCCATCGCTTCCAGT
+GGCGGCCTGGCGCGCGGGGTGGCTACCGGCTTCACCGAACTCGACGAGGTCACCAACGGCCTGCATCCGG
+GGCAGATGGTCATCGTGGCGGCGCGCCCGGGCGTGGGAAAGTCCACCCTTGGGCTGGACTTCATGCGGTC
+ATGCTCGATCAGGCATCGGATGGCCAGCGTCATCTTCTCGCTGGAGATGAGCAAGTCCGAGATTGTCATG
+CGACTGCTGTCGGCGGAGGCCAAAATCAAGCTCTCCGACATGCGTTCGGGCCGGATGAGCGATGACGACT
+GGACCCGGCTGGCGCGGCGGATGAGCGAAATCAGCGAAGCGCCACTGTTTATCGACGACTCGCCCAACCT
+GACCATGATGGAGATCCGTGCCAAGGCGCGCCGCCTGCGGCAAAAGGCCAACCTGAAGTTGATCGTGGTC
+GACTACCTGCAACTGATGACCTCGGGCAAGAAGTATGAATCACGGCAGGTGGAGGTGTCGGAGTTCTCGC
+GGCATCTGAAGCTGTTGGCAAAAGAGCTTGAGGTTCCCGTGGTCGCGATCAGCCAGCTCAACCGTGGGCC
+CGAGCAGCGTACCGATAAGAAACCGATGCTGGCCGACCTCAGGGAATCGGGCTGCCTGACCGCGTCCACC
+AGAATCTTGCGCGCCGATACCGGCGCTGAGGTCGCCTTCGGTGAGCTCATGCGAAGCGGTGAACGTCCCA
+TGGTGTGGTCGCTGGACGAGCGGCTGCGCATGGTGGCCCGGCCGATGATCAACGTGTTCCCGAGCGGGCG
+CAAGGAAGTGTTTCGGCTTCGGCTGGCTTCCGGACGCGAAGTCGAGGCCACCGGCAGCCACCCCTTTATG
+AAGTTCGAAGGCTGGACTCCCTTGGCGCAGTTGAAGGTTGGTGACCGGATCGCAGCACCGCGCCGGGTAC
+CTGAGCCCATCGACACTCAGCGGATGCCCGAGTCTGAGCTCATTTCGCTGGCTCGCATGATCGGTGACGG
+GTCGTGCCTGAAGAACCAGCCGATCCGCTACGAGCCGGTGGATGAGGCGAACCTGGCCGCGGTGACGGTC
+TCGGCGGCGCACTCGGATGGGGCTGCGATCCGCGACGACTACCTCGCAGCTCGAGTGCCGTCGTTGCGCC
+CGGCGCGGCAACGACTACCGCGCGGGCGGTGCACGCCGATTGCGGCGTGGCTGGCTGGCCTAGGGCTATT
+CACGAAACGCAGCCACGAAAAATGCGTACCGGAGGCTGTATTTCGCGCCCCCAATGACCAGGTGGCGTTG
+TTTCTGCGGCATCTGTGGAGCGCTGGTGGCTCTGTTCGGTGGGATCCCACGAATGGTCAAGGCCGGGTCT
+ACTACGGCTCAACCAGTAGGCGTCTCATCGACGATGTGGCTCAATTGCTGCTTCGGGTTGGGATTTTTTC
+CTGGATCACACACGCCCCAAAGTTGGGCGGCCACGATTCGTGGCGGCTGCACATTCATGGCGCGAAGGAT
+CAGGTCAGGTTCCTTCGTCACGTCGGCGTTCACGGCGCCGAAGCGGTGGCGGCCCAAGAGATGCTGCGTC
+AGCTCAAAGGACCGGTTCGCAACCCGAACCTGGACAGCGCGCCGAAAAAAGTATGGGCGCAAGTCCGCAA
+CCGACTGTCCGCCAAACAGATGATGGACATCCAGCTCCACGAACCGACGATGTGGAAGCATTCCCCGAGC
+CGGTCAAGGCCGCATCGCGCGGAGGCGCGGATCGAAGATCGAGCGATCCATGAGCTGGCGAGAGGCGACG
+CGTACTGGGACACCGTCGTGGAGATCACCAGCATTGGGGATCAACATGTTTTCGATGGGACTGTAAGCGG
+CACACACAATTTCGTCGCCAATGGCATTAGTTTGCACAATTCGCTGGAACAAGATGCCGACGTTGTCATC
+CTGCTGCATCGACCCGACGCCTTTGACCGCGACGATCCACGTGGGGGAGAAGCGGATTTCATTCTCGCCA
+AACACCGCAACGGTCCGACGAAGACGGTCACCGTAGCGCATCAACTGCACCTGTCACGCTTCGCCAACAT
+GGCTCGGTGACATGCGGATGTGTGGGGTTTCACGGAGCGTGGCCGAATGTCACGAATGATGGGGCCATCA
+GGGCGGACCGGTCCACGCATCCGCGGCGGCGTTGAAGTCCCCGAGCAACACGCGTCGTGGTTGATGCGTG
+AGATGAGTCAGATCAGGGCGACAGGACGTCGAACCAGTGGGACTAATGCATGATCACCAGATACAAGCCT
+GAGTCGGGGTTTGTCGCCCGTAGCGGTGGTCCCGACCGGAAGCGTCCCCATGACTGGATCGTTTGGCACT
+TCACCCATGCCGACAATCTCCCTGGGATCATCACCGCTGGCCGTCTGCTGGCCGATTCAGCAGTCACCCC
+GACGACCGAGGTGGCATATAACCCAGTCAAGGAGTTGCGCCGCCACAAAGTCGTCGCCCCCGACAGCAGG
+TACCCGGCGTCGATGGCAAGCGATCATGTGCCGTTCTACATTGCGGCGCGGTCGCCCATGCTCTACGTCG
+TATGCAAGGGCCACTCCGGCTACTCCGGCGGTGCCGGCCCGCTGGTGCACCTCGGGGTGGCGCTTGGCGA
+CATCATAGACGCGGATCTGACGTGGTGCGCCAGTGACGGCAATGCTGCAGCCAGCTACACCAAGTTCAGC
+CGCCAGGTCGACACGCTCGGCACCTTCGTCGACTTTGACCTGCTCTGCCAGCGGCAATGGCACAACACCG
+ATGACGACCCCAACCGCCAGAGCCGCCGCGCCGCCGAGATCCTGGTATACGGCCATGTCCCGTTCGAGCT
+GGTCAGCTACGTGTGTTGCTATAACACCGAGACGATGACACGGGTACGAACTCTGCTCGATCCTGTCGGT
+GGGGTGCGAAAGTATGTCATCAAGCCCGGCATGTACTACTAAGGAAGGAGGAGGCCATATGATCACGTAC
+GGCTCTGGCGACCTCCTTCGGGCTGACACCGAAGCGCTCGTCAACACCGTCAACTGTGTTGGGGTGATGG
+GCAAGGGAATTGCGCTGCAGTTCAAACGCCGCTACCCCGAGATGTTCACCGCCTACGAAAAGGCGTGCAA
+ACGCGGCGAAGTTACCATCGGCAAGATGTTCGTCGTCGACACCGGACAGCTCGACGGACCGAAACACATC
+ATCAACTTCCCCACCAAGAAACACTGGCGTGCACCGTCGAAGCTGGCCTATATCGACGCCGGCCTCATTG
+ATCTCATCCGCGTGATCCGTGAACTCAACATTGCTTCTGTGGCAGTTCCCCCGCTGGGGGTGGGCAACGG
+AGGTCTGGATTGGGAAGATGTCGAGCAACGGCTCGTATCAGCATTCCAGCAGCTGCCCGACGTTGACGCC
+GTGATCTACCCCCCATCAGGTGGATCTCGCGCCATCGAGGGCGTCGAAGGACTTCGGATGACCTGGGGGC
+GCGCCGTCATACTCGAAGCGATGCGGCGATATCTCCAGCAGCGCCGCGCGATGGAGCCGTGGGAAGACCC
+TGCAGGGATCTCGCATCTGGAGATTCAGAAGCTCATGTACTTCGCCAACGAGGCCGATCCCGATCTTGCG
+CTAGATTTCACGCCCGGCCGATACGGGCCATACAGCGAACGTGTCCGTCACTTACTGCAAGGAATGGAGG
+GCGCATTCACAGTCGGCCTGGGTGACGGCACCGCAAGAGTTCTTGCGAACCAACCGATCTCGTTGACTAC
+TAAGGGAACTGACGCCATAACGGACTATCTGGCCACCGATGCGGCAGCTGACCGGGTGAGCGCCGCAGTC
+GACACGGTGTTGCGCGTCATCGAAGGCTTTGAAGGCCCATACGGGGTTGAGCTGCTCGCCAGTACGCATT
+GGGTGGCCACACGTGAGGGCGCCAAGGAACCAGCCACGGCAGCGGCCGCGGTCCGAAAGTGGACAAAACG
+CAAGGGTCGGATCTACAGCGACGATCGCATCGGTGTTGCCCTCGACCGCATTCTTATGACTGCCTGAAAG
+CGACCGGCTCGTCGTTAAGGATGTGCGCCGACGCCCAGCCGTCAGGGAGCGTTGGGCTGCTCGGACGGAA
+TTGCCCCACCGCAACCACCCGGTGGCGGCGGGCCGGGGAGGGGCTCACCGCCGCTGACACAATCGAAGTA
+AAACTGTGGGCCGGTAAACCACGTTTGCATCCACTGGTGCCAAAACGAGCCGTCGGGGTACTTCTCGCCG
+TCGCACACGGCCAAGTCGCCAAAACCCCATCGGCCACCCGGGCAATAGCCTTTCGTCATGTCCGGCTGAT
+GCGGGTCAGGTGGATCTGCGCTGGCAACCGAGGCAGGAAACACAAGCGCCGCTGCACAACCCAGTATCGC
+AGTACTCAGGCGAGCAAACTTCAACTTCATTTCAAACTCCGTCAAACGTTGAATCGACTCGGCGGACTCC
+AAGCGATGGTCAGCGCTTGCGGATGAGCCGCGGCAATGAGTCGTAGTGGGCAGACATTCCCGAGAACAGC
+CTGAAATCCTGTTCGGTTGATGCCGTGCCGGCATCGACGTACCAGGACGAGGCACTGACTCGGGAAGGCA
+CAGCCGCCGTGGCGATTGTATATGACGCGTCGGACTGGGCAGCGATGGCGCGGGACTCTGCCCGGGCGCC
+GGCCTTGGACACGGCCAGCGCCCGCCACCTGTCGTCGGCATTTGGCGTTTGTCGAATTGCGGCATTATTT
+TGCTCGGGTGATGTCATCAGCTATTGGTTCGGTCGCGCGGTGGATAGTCCCCCTCCTGGGGGTTGCAGCC
+GTTGCTTCCATCGGTGTTATCGCGGACCCGGTGCGGGTCGTTCGGGCCCCGGCGTTGATCCTGGTCGATG
+CGGCAAACCCGCTGGCCGGAAAGCCCTTCTACGTCGATCCCGCCTCGGCGGCCATGATCGCCGCGCGCAA
+CGCCAACCCGCCGAACGCCGAGCTGACCTCCGTCGCCAACACCCCGCAGTCCTACTGGCTCGACCAGGCA
+TTCCCGCCGGCGACCGTCGGCGGCACGGTTGCCAGGTACACCGGAGCGGCGCAGGCGGCCGGCGCCATGC
+CGGTTCTGACGCTGTATGGAATCCCCCATCGCGACTGCGGTAGCTACGCATCCGGTGGGTTCGCGACGGG
+CACTGATTACCGCGGGTGGATCGACGCTGTCGCATCCGGCCTGGGCTCATCGCCGGCGACGATCATCGTC
+GAACCCGATGCGCTGGCCATGGCCGACTGCCTGTCGCCTGACCAGCGCCAGGAACGTTTCGACTTGGTGC
+GCTACGCCGTCGACACGCTGACCCGCGACCCGGCCGCTGCCGTGTACGTCGATGCGGGGCATTCGCGCTG
+GCTGAGCGCCGAGGCAATGGCCGCCAGGCTCAACGATGTCGGTGTGGGCCGCGCGCGCGGGTTTAGCCTC
+AACGTCTCGAACTTCTACACCACCGATGAGGAAATCGGCTATGGCGAGGCGATTTCGGGGCTCACGAACG
+GTTCGCATTACGTGATCGACACGTCGCGCAACGGCGCCGGACCCGCGCCCGACGCCCCGCTCAACTGGTG
+TAACCCCAGCGGCCGCGCCCTGGGCGCACCGCCCACCACGGCGACCGCGGGCGCGCACGCCGACGCTTAC
+CTGTGGATCAAACGTCCCGGGGAATCGGACGGAACCTGCGGTCGCGGGGAGCCTCAGGCGGGTCGGTTCG
+TTAGCCAGTACGCCATCGATCTGGCCCACAACGCCGGCCAGTAGAGACCTCACGCGCAGACCGGCTGAGC
+GTGCGGCCGTTGGGCCGTCGGCGTCGGGTTCGGCCAGGTGGGGTAACGGTTCGGGCACGTTTCCACTACC
+TCGTGACACGTCATGCGGCACCGCGGTTCGGGTGGTCGACAATGCGGGACATGACCCAAAATTCGGGGTG
+CTGCCGGCCCGCAGCGTCGGGCTGCGCCGCGCTGGTGACCGTCGCGAGACGGGAGCCCGACGTTGGCGCG
+TGAGATCTCACGCCAGACGTTTCTGCGGGGTGCCGCCGGAGCGTTGGCCGCCGGCGCGGTCTTCGGCTCG
+GTCCGGGCTACCGCGGATCCGGCTGCCTCTGGCTGGGAGGCTCTTTCTTCCGCCCTCGGAGGGAAAGTGC
+TACAACCGGACGACGGTCCCCAATTCGCAACGGCCAAGCAGGTTTTCAACACCAACTACAACGGCTATAC
+GCCGGCGGTGATCGTTACCCCGACATCGCAGCTGGACGTGCAGAAGGCGATGGCGTTCGCTGCCGCGAAC
+AACCTCAAGGTGGCCCCACGCGGTGGCGGGCACTCCTACGTGGGGGCGTCCACGGCCAACGGCGCCATGG
+TGCTCGACCTACGTCAGCTACCTGGGGACATCAACTACGACGCCACCACCGGGCGGGTCACGGTGACGCC
+CGCCACCGGTTTGTACGCCATGCACCAGGTGTTGGCCGCGGCCGGCCGGGGCATCCCGACCGGCACCTGC
+CCGACGGTCGGTGTCGCGGGACACGCGCTGGGCGGCGGGCTGGGCGCCAATTCCCGGCACGCCGGCCTGC
+TCTGTGACCAATTGACGTCGGCGTCGGTGGTGCTGCCCAGCGGCCAGGCGGTCACCGCGTCCGCCACCGA
+CCACCCCGACCTGTTCTGGGCGTTGCGCGGTGGCGGTGGCGGCAACTTCGGCGTGACAACCTCGCTGACC
+TTCGCGACGTTCCCCAGCGGGGACCTCGACGTCGTGAACCTCAATTTCCCACCGCAGTCGTTCGCGCAGG
+TTCTGGTCGGTTGGCAGAATTGGCTGCGAACCGCCGACCGAGGCAGCTGGGCACTGGCCGATGCCACCGT
+CGACCCGCTGGGCACGCATTGCCGCATCCTTGCGACCTGCCCGGCCGGGTCGGGCGGCAGCGTGGCGGCC
+GCCATCGTTTCGGCCGTCGGAACGCAACCGACCGGCACCGAAAACCACACGTTCAACTATCTGGACCTGG
+TCAGATATCTGGCCGTCGGGAACCTCAACCCGTCGCCGCTGGGATATGTCGGCGGATCCGATGTCTTCAC
+GACGATCACTCCGGCGACCGCCCAGGGAATCGCCTCGGCGGTCGACGCCTTTCCGCGTGGAGCGGGCCGC
+ATGTTGGCGATCATGCACGCCCTCGACGGCGCGCTCGCCACTGTGTCACCGGGGGCCACGGCCTTCCCGT
+GGCGTCGGCAGTCGGCGCTGGTGCAGTGGTACGTCGAAACATCCGGCTCCCCGTCGGAAGCGACTAGCTG
+GCTCAACACCGCACATCAAGCGGTGCGAGCGTATTCGGTTGGCGGCTATGTGAACTATCTCGAGGTAAAC
+CAACCGCCGGCACGTTACTTTGGCCCGAATCTGTCCCGGCTGAGCGCAGTACGTCAGAAGTATGACCCCA
+GCCGGGTCATGTTCTCCGGGCTGAACTTCTAGCAGCCCCGCATGAGTACTAGCCCCTAGGACGGGCCATC
+CTCGTCTACCCTGGGAAGTGATCATGGAACTTTCCGTGTCTGTTATCGCGGGGTTGGTCATCGCACTGCT
+GGCGGCCATCACCCCTGCTGCGGGCGAACGCCCGGAAAGCCGCCGCCAGGCGCTCGCAAATGCCGCCGAG
+GCCGGGGAGCATCCGGCCACATCACCGTTGCGACGGTAGCCGATTCGTCGCGATACGGCTGTGGAGTTAG
+GAGGCGCGGATGGAGACAGGTTCGCCGGGAAAACGTCCGGTCTTGCCCAAGCGTGCCCGCCTGCTGGTGA
+CGGCAGGCATGGGCATGCTCGCGTTGCTGCTGTTTGGACCCCGGCTAGTCGATATTTACGTTGACTGGTT
+GTGGTTTGGTGAGGTCGGTTTCCGCAGCGTCTGGATCACGGTACTGCTGACCCGCCTGGCGATTGTCGCA
+GCGGTCGCACTTGTGGTGGCCGGCATTGTGCTTGCTGCCCTACTGCTGGCGTATCGCTCGCGGCCGTTCT
+TTGTACCCGACGAGCCGCAGCGGGACCCGGTCGCGCCACTTCGCAGCGCGGTGATGCGCCGGCCGCGCCT
+GTTCGGGTGGGGCATCGCCGTCACGCTCGGTGTGGTGTGCGGGCTGATCGCTTCGTTCGACTGGGTGAAG
+GTTCAGTTGTTCGTACACGGGGGCACCTTTGGCATCGTGGACCCCGAATTCGGCTATGACATTGGGTTTT
+TCGTCTTCGATCTGCCGTTCTACCGGTCGGTGCTGAACTGGCTGTTCGTGGCCGTGGTTCTGGCGTTTCT
+AGCGAGCCTGTTGACGCATTACCTGTTCGGCGGCCTTCGGCTGACAACCGGCAGAGGCATGCTGACCCAG
+GCAGCTCGCGTTCAACTCGCAGTGTTCGCCGGCGCGGTTGTACTGCTGAAGGCGGTTGCCTACTGGTTGG
+ATCGCTATGAGCTGTTGTCGAGTGGACGTAAGGAGCCGACCTTCACCGGCGCCGGCTACACCGATATCCA
+CGCCGAGCTGCCGGCCAAGCTTGTGCTGGTGGCGATTGCGGTATTGTGTGCGGTGTCATTCTTTACCGCG
+ATCTTTTTGCGCGACTTGAGGATTCCGGCGATGGCCGCCGCACTGCTGGTGCTGTCGGCGATCCTGGTCG
+GTGGACTGTGGCCGCTGCTGATGGAGCAGTTCTCGGTGCGTCCCAACGCCGCCGATGTCGAACGCCCATA
+TATCCAACGCAACATCGAAGCGACCCGCGAGGCGTATCGGATCGGTGGCGATTGGGTCCAGTACCGTAGC
+TATCCGGGCATCGGTACCAAACAGCCGCGCGACGTGCCCGTGGATGTCACCACGATTGCCAAGGTGCGGC
+TGTTGGACCCGCATATCCTGTCCCGAACCTTCACCCAGCAACAGCAGCTCAAGAATTTCTTTAGCTTCGC
+CGAGATACTCGACATCGATCGCTATCGCATCGACGGTGAGCTGCAGGACTACATCGTCGGCGTCCGGGAG
+CTCTCGCCGAAAAGCCTCACCGGCAATCAGACCGACTGGATCAACAAACACATCGTCTACACGCATGGCA
+ACGGCTTCGTGGCCGCCCCGGCCAATCGGGTGAACGCGGCGGCCCGCGATGCCGAGAATATTTCCGACAG
+CAACAGCGGGTACCCGATATACGCCGTCAGTGACATCGCGTCGCTGGGTTCTGGGCGCCAGGTCATCCCG
+GTCGAGCAGCCGCGGGTCTACTACGGCGAGGTGATCGCCCAGGCCGATCCGGACTACGCGATCGTGGGCG
+GAGCCCCGGGGTCCGCGCCGCGCGAGTATGACACCGACACGTCCAAGTACACCTATACCGGCGCCGGGGG
+TGTGTCGATCGGAAACTGGTTCAACCGCACGGTGTTTGCCACCAAGTTCGCCCAGCACAAGTTCCTGTTC
+TCCCGGGAGATCGGCTCGGAGTCGAAGGTGTTGATCCATCGCGACCCGAAGGAACGGGTGCAACGCGTGG
+CGCCGTGGTTGACCACCGACGACAACCCCTATCCGGTGGTGGTGAACGGGCGGATCGTCTGGATCGTCGA
+CGCCTACACCACCTTGGACACCTATCCGTACGCACAACGCAGCTCGCTCGAGGGCCCGGTGACCAGCCCG
+ACCGGCATTGTGCGGCAAGGCAAGCAGGTGTCGTACGTGCGTAACTCCGTCAAGGCAACCGTGGACGCCT
+ACGACGGAACCGTAACGCTGTTTCAGTTCGATCGAGACGACCCGGTGCTGCGGACCTGGATGCGTGCCTT
+TCCCGGAACCGTCAAGTCCGAAGACCAGATTCCCGACGAGTTGCGTGCCCACTTCCGTTATCCGGAGGAC
+CTTTTCGAGGTCCAACGTAGCTTGCTGGCCAAGTATCATGTCGACGAACCGCGAGAGTTCTTCACCACCA
+ACGCCTTCTGGTCGGTGCCCAGCGACCCGACCAACGACGCTAACGCCACTCAACCGCCGTTCTACGTCCT
+CGTCGGCGACCAGCAGAGCGCCCAGCCGTCCTTCCGGTTGGCGTCGGCGATGGTTGGCTACAACCGCGAA
+TTCCTCTCCGCGTACATCTCGGCGCACTCGGATCCGGCGAACTACGGCAAGCTGACCGTGCTGGAGTTAC
+CCACCGACACCCTGACCCAAGGCCCGCAACAAATTCAGAACTCGATGATCTCCGACACTCGGGTCGCCTC
+CGAGCGCACCCTGCTGGAACGGTCAAACCGGATTCACTACGGCAACCTCTTGTCGCTGCCGATCGCCGAC
+GGCGGCGTGCTCTATGTGGAACCGCTCTACACCGAGCGGATCTCGACAAGCCCGAGCAGTTCGACTTTCC
+CGCAACTTTCCCGGGTGCTGGTCAGCGTGCGTGAACCCCGCACCGAGGGCGGGGTCCGGGTCGGGTACGC
+ACCGACCCTGGCCGAATCTTTGGATCAGGTATTTGGGCCCGGCACCGGTCGGGTCGCCACCGCTCCCGGC
+GGTGATGCCGCCAGCGCGCCACCGCCGGGAGCCGGCGGGCCGGCACCGCCGCAGGCCGTACCGCCACCGA
+GAACGACCCAACCGCCGGCCGCCCCGCCCCGGGGGCCGGACGTCCCCCCCGCGACGGTGGCCGAACTGCG
+GGAAACGCTGGCCGATCTGCGCGCGGTGCTCGACCGGTTAGAGAAGGCCATCGATGCCGCCGAAACGCCC
+GGTGGATAAGCCGGCATTCTTAGCCGGTGAACTCCGAGCGCTGTTCTGGCGCTAATCTGACGCTAGAATA
+GCGCTATGGCTACCATTCAAGTTCGGGATTTGCCCGAAGATGTCGCCGAAACCTATCGACGGCGCGCCAC
+CGCAGCGGGGCAGTCGCTGCAGACGTATATGCGCACCAAGCTCATCGAAGGGGTGCGGGGCCGAGACAAG
+GCCGAGGTAATCGAGATCCTGGAACAGGCGCTCGCCAGCACTGCCAGCCCAGGCATCAGCCGGGAGACCA
+TCGAGGCATCCCGGCGGGAGCTCAGGGGTGGATGAATGTGTAGTCGACGCGGCGGCCGTGGTTGACGCTC
+TCGCCGGCAAGGGCGCCAGCGCGATCGTTCTGCGCGGTTTGCTCAAGGAGTCGATTTCTAACGCGCCGCA
+TTTGCTGGACGCAGAGGTCGGACATGCACTCCGCCGCGCCGTGCTCAGCGACGAAATCTCCGAAGAGCAG
+GCTCGCGCCGCGTTGGATGCCTTGCCTTATCTCATCGACAATCGTTACCCGCACAGCCCACGACTGATCG
+AATACACATGGCAGCTAAGGCACAACGTCACGTTCTACGACGCCCTTTACGTCGCACTGGCCACCGCACT
+GGATGTCCCGCTGCTCACGGGCGACTCGCGGCTTGCGGCCGCGCCGGGCCTTCCGTGCGAAATCAAACTC
+GTTCGGTGACATCCCTTTGCGGGACGCCAATGGCGCCGTCGTAGCCGGGCCAGCCCGTCGTCAGCCTTGG
+ACAGCCTCCAGCGCTGCATTGAACGTCTTGCTGGGCCGCATCACCGCCGTAGTCATGTCGCTGTCCGGCG
+CGTAGTAGCCGCCGATGTCCACCGGTTCGCCTTGTACCTCGGTGAGCTCTCGCACGATGACGTCTTCGTT
+TTTGGTCAACACATCTGCCAGCGAGGCGAAGTGTTCGGCCAGCTGCTGGTCGTCGGTCTGCGCGGCCAGC
+TCTTGTGCCCAGTACATGGCGAGGTAGAACTGGCTGCCCCGGTTGTCGAGTTCACCGGTTTTGCGCGACG
+GACTCTTGTCGTTGTCCAGCAGCTTGCCGATGGCGGCATCCAGGGTCTTACCCAAGAGTTTGGCCCGCTC
+GTTACCGGTCTTGATGCCGATATCCTCGAAACCGGCGCCCAGCGCGAGGAACTCACCCAGAGAATCCCAG
+CGCAGGTGATTCTCCTCCACCAATTGTTTGACGTGCTTGGGTGCCGAACCGCCCGCCCCCGTCTCGTACA
+TTCCGCCGCCGGCCATCAGCGGAACGACGGACAGCATCTTGGCGCTGGTGCCTAACTCCAGGATCGGGAA
+CAGGTCGGTGAGGTAGTCGCGCAGGATGTTGCCGGTCGCGGCGATGGTGTCCAGTCCACGGACCAGGCGC
+TCGCACGTGTAGCGCATGGATCGCACTTGCGACATGATCTGGATGTCCAGACCTTCGGTGTCGTGATCTT
+TCAGGTATGTCTTGACCTTCTTGATCAGCTCGTTCTCGTGCGGGCGGTACGGGTCCAGCCAGAACAGCAC
+CGGCATCCCGGAGATGCGCGCGCGGGTGACAGCCAGCTTGACCCAGTCACGGATCGGTGCGTCCTTGACG
+ATGCACATGCGCCAGATGTCGCCGGCTTCCACGTTCTCGGTCAGCAGCACCTCGCCGGTGGCGACATCGA
+CGATGTTGGCGACGCCGTCCTCGGGAATCTCGAACGTCTTGTCGTGCGAGCCGTACTCCTCGGCCTGCTG
+GGCCATCAGACCCACATTGGGGACGGTGCCCATCGTCGTCGGATCGAACTGGCCATTTGTCTTGCAGAAG
+TTGATGATCTCCTGATAGATGCGCGAGAAGGTGGACTCCGGGTTGACCGCCTTGGTGTCCTTGAGCTTTC
+CGTCGGCGCCATACATCTTGCCGCCCGCGCGAATCATCGCGGGCATCGAGGCGTCCACGATCACATCGCT
+CGGCGAGTGGAAGTTGGAGATACCTCTGGCCGAATCGACCATCGCGAGCTCGGGGCGGTGTTCGTGGCAA
+CGGTGTAGGTCCTCGATGATCTCGTCGCGTTGCGACGCCGGCAGCGACTCGATCTTGCTGTACAGATCGG
+ACAAGCCATTGTTGACGTTGACGCCCAAGTCGTCGAACAGCTCCTGGTGCTTGGCGAAGGCGTCCTTGTA
+GAAGATCCTGACCGCGTGGCCGAAGACGATGGGGTGGCTGACCTTCATCATGGTCGCCTTGACGTGCAAG
+GAGAACATCACGCCGGTCTCGAACGCATCCTGCATCTGCTCTTCGTAGAAGTCGCACAGCGCTTTCTTGC
+TCATGAACATGCTGTCGATGACGTCGCCGTCATCCAGCGGCACCTCGGGCTTGAGCACGATCGTCTTGCC
+GCTCTTGGCCAGCAGTTCCATCCTCACGTTGCGCGCGCGGTCCAGTGTCATCGACTTCTCGCCGGCGTAG
+AAGTCACCGTGCCGCATGTGCGCTACGTGGGTGCGTGAGGCCATCGACCACTCGCCCATGCTGTGCGGGT
+GCTTGCGCGCGTACTCCTTCACCGCCTTGGGCGCCCGACGGTCCGAATTGCCTTGGCGTAGTACCGGGTT
+CACCGCGCTGCCCAGGCATCTGGCGTAGCGCTCTTTGATGGCCTTCTCCTGGTCAGTGTTCGGGTCCGCC
+GGGTAGTCTGGGACCGCGTAACCCTTGTCTTGCAGTTCCTTGATGGCGGCTACCAGCTGTGGCACCGAGG
+CGCTGATGTTCGGCAGCTTGATGATGTTGGTGTCGGGTAGCTGAGTCAGCCGGCCCAGTTCGGCGAGGTT
+ATCCGGTACCCGCTGCTCCTCGGTCAGGTAATCGGGGAATTCCGCCAGGATGCGTGCCGCTACAGAGATG
+TCGCTGGCCTCGATCTTGATGCCCGCCGGTTCGGCAAAGGCACGCACAATCGGCAGAAAGGCGTAGGTCG
+CCAGCAGCGGCGCCTCGTCGGTCAGCGTGTAAATGATGGTCGGCTGTTCGGCGCTCATGGTGTTCTCCCG
+GCGTCACTGTCGGTCAGATGCTGAATCACTCCGCGTTGTAGCGGCGGTTACCAGTATCGCGGATTGCGCC
+GCACATGATTCGGGCGGTGTTCTGCGCGACGACGATCACTTTCTGTTTGCCCGAAGGCCGTCGAGGGCGA
+CGTCGGTCACCTTTGCGGCCAACTCAGCGTTGTAGCTCTGCATCGCTTGGCAGCCGACTAGGAGCGTCTT
+GACTTCAAGCACGTCTACGTCCGGCCGTACGGTGCCGGCGCGCTGGGCGGCGCGCAACAGGTCGGTGAGC
+AGGTCCAAGAAATCTGCCTCGGCTTCCGGGGCCGCGCTGCTGATTTCAATCCCGACGCCGGCCAGCGCCT
+CGACCAGGCCGCGATCGGTGGCGCCCCACTGCAATACCATCGACCGCAGGAATGCAAACAGCGCGTCGCC
+GGGATGCTTGGATTTGAGCAGGGCATGTCCCTTGTCGATGATGCGGTGCATCCGGTCGGCGATCACCGCC
+TGAAACAGCGCCTCCTTGGTCGGGAAATGCCGGTATACCGTGCCTGCGCCGACTCCGGCGCGCCGAGCGA
+TCTCGTCAACGGGCACCGATAGACCGTCGGCCGCAAAGGTTTGGTAGGCAACCTCCAATACGCGTGCCCG
+GTTACGGGCCGCGTCGGCACGCACCCGCCGGTCAGTAGGAGCCAAGTCGTACCTCCGAAAGCCTTGACAA
+AGCGGGGCGCGCGTTCCGTATAGTTCGGCTAAGCGGAGCGCTCGCCCCGCTTAGTCAAAGCATAGCGAGG
+AGCCCTCATGACCAAATGGACTGCCGCCGACATTCCTGACCAGACCGGCCGGACCGCCGTCATCACGGGG
+GCCAACACCGGACTTGGATTCGAGACCGCCGCAGCGCTTGCCGCCCATGGTGCACACGTGGTGCTGGCTG
+TGCGCAACCTCGACAAGGGCAAGCAGGCGGCGGCACGCATCACCGAGGCCACCCCCGGCGCCGAAGTAGA
+GCTTCAGGAGCTTGACCTGACCTCGCTGGCGTCGGTGCGCGCCGCCGCGGCACAGCTGAAGTCTGACCAC
+CAGCGCATCGACCTGCTGATCAACAACGCCGGGGTGATGTATACACCCCGACAGACCACAGCAGACGGCT
+TCGAGATGCAGTTCGGCACCAACCACTTGGGCCATTTCGCGTTGACCGGCCTGTTGATTGATCGACTGCT
+GCCCGTCGCCGGTTCACGAGTGGTCACCATCAGCAGCGTCGGCCATCGCATCCGTGCCGCAATCCATTTC
+GACGACCTCCAGTGGGAACGCCGGTACAGGCGGGTCGCCGCCTACGGCCAAGCCAAGCTCGCCAACCTGC
+TGTTCACTTATGAACTTCAGCGTCGGTTAGCACCGGGCGGAACCACCATCGCGGTCGCGTCGCACCCGGG
+AGTGTCCAACACCGAACTGGTCCGCAACATGCCACGGCCGCTCGTCGCGGTGGCGGCCATACTGGCGCCG
+CTGATGCAAGACGCCGAACTGGGGGCCCTGCCGACATTGCGTGCCGCCACCGATCCCGCGGTGCGCGGCG
+GCCAGTACTTCGGACCCGATGGCTTCGGTGAAATACGGGGCTACCCGAAGGTGGTGGCCTCCAGCGCCCA
+GTCTCACGACGAGCAGCTGCAGCGCCGCCTGTGGGCTGTGTCCGAAGAGCTCACCGGGGTCGTCTATCCC
+GTCGGATGAGCCGGACTCAACGGCAACGGTTGGTCAACACTCGACGATGTTGACTGCGACGTTGATGGCG
+AGCCCGCCGGCCGAGGTTTCCTTGTACTTGGTGTGCATGTCCGCGCCGGTGGCGCGCATGGTGTCGATGA
+CCTGGTCGAGGGTGACGCGATGGATGCCGTCGCCGCGCAATGCCATCCGTGCGGCGTTGATGGCCTTGCC
+GGCGGAAATCGCGTTGCGTTCGATGCAGGGGATCTGCACCAGCCCGGCGATGGGGTCACAGGTCAGGCCG
+AGGCTGTGTTCCATGGCGATCTCGGCGGCGTTTTCCACTTGTCGCGGTGTGCCGCCGAGGATTTCAGCCA
+ATCCGGCGGCGGCCATGGCGGCCGCGGAGCCGACCTCGCCCTGACAGCCGACCTCGGCTCCGGAGATCGA
+TGCTCGCTCCTTGAACAACGATCCGATGGCTCCAGCAGTGAGCAGGAATCGCACGGTGACATCGTCGGGG
+TCCCCCGCGCCGGCCGACGTGTAGTGGATTGCGTAGTGCAGGACCGCCGGCACGATGCCGGCGGCACCGT
+TGGTCGGGGCGGTGACGACGCGCCCACCGGAGGCGTTCTCCTCGTTGACTGCCAGCGCGACCAGGTTGAC
+CCAGTCCTCAGCGAATTCCGGCTTGCGAGTGGGGTCTTCGGCGTTCAAGCGGTCATACCACACCTTCGCT
+CGCCGGCGCACCCGGAGGCCGCCAGGAAGCAACCCTTCGCGAGCGATGCTCCGCTGTTCGCACTCAACCA
+TGACGTCGCGCAGGTGCAGCAGCGCGGCGCGTACCTCGTTCTCGGTGCGGCAACATGTTTCGTTGCGCAG
+CGCCGCTTCGCTAATTGACACGTCGAGGCGGTCACAGATGTCCAGCAGTTCTTGGGCCGACACGTAGGGA
+AGGGCAACTGAGCATGGATGTTGGCCGCTGTTGCCGCTGGTCTGTTCCGTGACGATGAACCCTCCGCCCA
+CCGAAAAATAAGTCTCGGTGGCCAAGACGCGGCCGTGTGGGCCCGCGGCAGTGAACGTCATTCCGTTGGG
+ATGCGTTGGCAGAACGATGTCGGGATGCAGGTCGATATCACGCTCGGTCAGCGGGACCGGAATGACACCG
+CCGATTCGCGTCACGCCGGACGCTGCGATCTCGGCGAGCCGGCGTTCCTTGTGTTCGGTGGTAATCGTTT
+CTGGCTGGCAGCCTTCCAGCCCCAGCAATATCGCCGACATGGTGCCATGACCGGCTCCGGTGGCCGCGAG
+CGAGCCGAACAGATCCACTCGCATCGCCTCGAGGTCATCCAGGTGGCCCCGGCGGCGCAGCGCAACTACG
+AACTGGTTTGCCGCGCGCATCGGTCCCACGGTGTGGGAACTGGACGGCCCGATGCCGATGGTGAACAGGT
+CGAAGACGCTGATGGTCATGTCCGGTGCAGTTCCGGGTAGAGCGGATAGCGTGCGGCCAGCCGCTGGACC
+TGGGCGCGCAGCGGACCCAGCTGGTCGTCGTTGGTGGCCGTCAGTGCCGCCGCGATGAGGTCTGCCACGG
+CGCGGAAGTCGTTGTGGGAGAAGCCGCGTGCGGCCAGCGCCGGGGTGCCGATTCGCAGGCCCGAGGTGAT
+CATCGGGGGACGAGGGTCGAAGGGTACCGCGTTGCGGTTGACGGTGATGTCCACGGCGGCCAACCGGTCT
+TCGGCTTGCTGGCCGTCGAGTTCGGCGTCGCGCAGGTCGACTAGGACGAGGTGCACATCGGTGCCGCCGG
+TTAGCACCGCGATGCCACGTTCGGCGACGTCGGGCTGGGTCAACCGGCCGGCAAGGATGCGCGCGCCGTC
+GAGGCAACGTTGTTGGCGCTGCGCGAATTCAGGTTGTGCTGCCATCTTGAATGCGGTGGCCTTGGCTGCG
+ATGACATGCCCGAGCGGCCCGCCCTGCTGCCCAGGGAAGACCGCGGAATTGATCTTCTTGGCGATGGCCG
+GGTCATTGCACAAGATGATGCCGCCGCGGGGCCCGCCGAGCGTCTTGTGAGTGGTGGAGGTGACGACGTG
+GGCGTGCGGCACCGGGCTGGGGTGCACGCCAGCGGCGACCAGGCCGGCGAAATGCGCCATATCCACCATG
+AGCACGGCGTCGACTTCGTCGGCGATGGCGCGGAAGCGGGCGAAATCCAGCTGGCGTGGGTACGCCGACC
+AGCCGGCGATGATCATTTTGGGCCGGTGTGTGCGCGCTGCCTCGGCGACGGCATCCATGTCGACCAGGTA
+GTCCTCTTTGGACACCTCGTAGGCGGTGGCGTGGTAGAGCTTGCCGGAAAAGTTGATCCGCATCCCGTGG
+GTCAGGTGACCGCCATGAGCCAGCGACAACCCCAGGATGGTGTCGCCGGGGTTTAGCAGCGCATGCATGG
+TGGCGGCGTTGGCGGTGGCCCCCGAATGTGGTTGCACGTTGGCGTATTCGGCGCCAAAGAGCGCTTTGAC
+GCGGTCGATAGCCAACTGCTCGACACCGTCGACGAATTCACAGCCACCGTAGTAGCGCCGGCCCGGGTAG
+CCTTCGGCGTACTTGTTGGTCAAGACCGAACCTTGGGCCTGCATCACGGCCAGCGGTGCATAGTTCTCCG
+AAGCGATCATCTCCAAGCCGGATTCTTGACGGCGCAGCTCGCCGTCGATCAGGGCGGCGATGTCCGGGTC
+GAAGGCGGTCAGGGAGTCGTTGAGGGTGTTCATCAGCTCAGTCCGGTCTGTTCGGCGTACTCGGGGGCGG
+TCAAGGGTGTTCCCGGAGCAATCGGCTGCCCGGCCAAATGGGCATCCGGCGGCCGCGACATCGTTTCGGC
+CACGGCGAGGTCGCCAACAGTTCGATCGTGCGGTTCAGACAAGGGCCAACTCCGGTTTCGACGAGCCCGG
+ATCGCGCCGGGCTGGTTGCGCCCTCCCCGCTCTGTCCTGAAACCTGAGAGTCTGCGGCGTCGCATCATGG
+CGCCGCTCTACACCTTCGGTCAGGCACGGTCGGTGCGACCGTCCCTGTCTCCAGAGTTGCCTCGGCGGTG
+TGGTGCTTGGGCCTGAGAGATTCTCGGGGAGGAGATTGCTCCTACGGCGCCTCGACATGGAGGTTCTCCC
+ACATCGCGTCAGCGGCTGTTCGATTGTGACGGAAAGCAACATACACACCACGCATGTGTTTTGTCACCCT
+GCGGTCGCTGGTAGTCGGACGGCCCAATCAGACAGCGCGGGTCATATCACGCGTTCGTGCACAGTTGGGT
+GTTTATCCACAGGGGTGCGTTTGTCGGCGGCTGGCGGGGCGTGGCGGCGATAGCATTCGAATATGAGTTC
+GATCACGGTGTCGGTGGACCCGGTGGACCCGGTGGACCCGGTGGACCCGGTGGACCCGGTGGACCCGGTG
+GACGCCGTGGTCGCCGCGGGATCAGACGGGCTCACTGTGGCCCGCATCGAGTCCGAGATCGGGGCCTTGG
+AGTTCCTGAACGAACTGCGCACTGAACTCAAGAGTGGACAGTTTCGACCTCAACCGGTGCGGGAACGCAA
+GATCCCCAAACCGGGCGGGTTGGGCAAGGTACGGCGGCTGGGGATTCCCACAGTGGCCGACCGGGTCGTT
+CAGGCGGCGTTGAAACTGGTGCTAGAACCCATCTTTGAGACCGACTTCGAGCCGGTCTCCTACGGGTTTC
+GGCCCGCGCGACGCGCGCACGACACGATCGCTGAGATTCACTTGTTCGGCACCCAGGAGTATCGCTGGGT
+GCTCGACGCTGATATCAAGGCGTGCTTTGACCGCATCGACCACGCGGACCTGATGGACCGGGTGCGTCAC
+CGGATCAAAGACAAGCGGGTGTTGCGGCTGGTGAACTGGCAGCGCATTCGGCATCGCTGGAATTGGACCG
+ACGTCCGCCGCTGGCTCACCGACCCCACCGGGCGGTGGCACCCCATCAGCGCGGACGGGATCACCCTGTT
+TAACCCCGCCGCGGTGCCTATTCGGCGATACCGCTATCGGGGCAACACGATCCCCACTCCCTGGACTCAG
+GCTGTCTGAACCACCCCATCGGCAGATTCCGTGAAGAGCCAGATACGGTGAAAGTCGCACGTCCGGTTCG
+AAGGGCGGCCACGGGAAACGGACCCGCAGCAACGCGGGCACCGCACCCATGGTCGACCCAACTGCCACGC
+ACCCGGTGACCGGTGCGAAGTCCACCATATCGACCAGTGGGCAACCGGCGGCTCAACCGATATCGACAAA
+CTCACCTTCACCTGCACACCCAACCACAAGCTAGTCGGGAAAGGCTGGCAGACAAGGAAACGGTCCGACG
+GCCAAACGGAATGGATCCCGCCACCCCACCTCGACCGCGGTGCCCACACCAACGACTACCACCACCCCGA
+ACGCCTCTTCGACCACTAGCGGGCCGCGCCCTGACCACAAAACGTCAAGACCAGGCCCCACAAGTGCGCC
+ACGTTGGTAGCGTCTGGGAATGCTCTTCGCGGCCCTGCGTGACATGCAATGGAGAAAGCGCCGCCTGGTC
+ATCACGATCATCAGCACCGGGCTGATCTTCGGGATGACGCTTGTTTTGACCGGACTCGCGAACGGCTTCC
+GGGTGGAGGCCCGGCACACCGTCGATTCCATGGGTGTCGATGTATTCGTCGTCAGATCCGGCGCTGCTGG
+ACCTTTTCTGGGTTCAATACCGTTTCCCGATGTTGACCTGGCCCGAGTGGCCGCTGAACCCGGTGTCATG
+GCCGCGGCCCCGTTGGGCAGCGTGGGGACGATCATGAAAGAAGGCACGTCGACGCGAAACGTCACGGTCT
+TCGGCGCGCCCGAGCACGGACCTGGCATGCCACGGGTCTCAGAGGGTCGGTCACCGTCGAAACCGGACGA
+AGTCGCGGCATCGAGCACGATGGGCCGACACCTCGGTGACACTGTCGAGGTCGGCGCGCGCAGATTGCGG
+GTCGTTGGCATTGTGCCGAATTCCACCGCGCTGGCCAAGATCCCCAATGTCTTCCTCACGACCGAGGGCT
+TACAGAAATTGGCGTACAACGGGCAGCCGAATATCACGTCCATCGGGATCATAGGTATGCCCCGACAGCT
+GCCGGAGGGTTACCAGACTTTCGATCGGGTGGGCGCTGTCAATGATTTGGTGCGCCCATTGAAGGTCGCA
+GTGAATTCGATCTCGATCGTGGCTGTTTTGCTGTGGATTGTGGCGGTGCTGATCGTCGGCTCGGTGGTGT
+ACCTTTCGGCTCTTGAGCGGCTACGTGACTTCGCGGTGTTCAAGGCGATTGGCACGCCAACGCGCTCGAT
+TATGGCCGGGCTCGCATTACAGGCGCTGGTCATTGCGTTGCTTGCGGCGGTGGTGGGCGTCGTCCTGGCG
+CAGGTGTTGGCACCACTGTTTCCGATGATTGTCGCGGTACCCGTCGGTGCTTACCTGGCGCTACCGGTGG
+CCGCGATCGTCATCGGTCTGTTCGCTAGTGTTGCCGGATTGAAGCGCGTGGTGACGGTCGATCCCGCGCA
+GGCGTTCGGAGGTCCCTAGCGGTGGGCGATCTCAGCATTCAGAACCTCGTCGTTGAGTACTACAGCGGTG
+GATACGCGCTTAGGCCGATCAACGGTTTGAACCTCGACGTGGCAGCCGGGTCGTTGGTGATGCTGCTCGG
+ACCCAGCGGCTGCGGCAAGACGACACTGCTTTCCTGTCTGGGCGGCATTCTGCGCCCGAAGTCTGGGGCG
+ATCAAGTTCGACGAAGTCGACATCACGACGCTACAAGGCGCCGAGCTGGCGAACTACCGGCGTAACAAGG
+TCGGCATCGTGTTCCAGGCGTTCAATCTGGTGCCCAGCCTGACCGCTGTCGAGAACGTGATGGTGCCGTT
+ACGCTCGGCCGGGATGTCACGCAGGGCGTCGCGTAGGCGTGCCGAAGAACTGCTGGCGCGCGTCAATCTC
+GCGGAACGAATGAATCATCGACCCGGTGATCTGAGCGGAGGTCAGCAGCAACGAGTCGCGGTGGCACGCG
+CGATTGCGCTGGATCCGCCACTGATCCTCGCTGACGAACCGACCGCACACCTGGATTTCATCCAGGTGGA
+GGAGGTGCTGCGGTTGATCCGCGAACTGGCCGATGGCGAGCGTGTGGTCGTGGTCGCAACCCACGACAGC
+AGGATGTTGCCGATGGCCGATCGCGTCGTTGAGCTGACACCCGATTTCGCGGAGACAAATCGGCCACCTG
+AAACCGTACATCTTCAGGCCGGCGAGGTGCTGTTCGAGCAGAGCACGATGGGCGACCTGATCTACGTGGT
+GTCGGAGGGCGAGTTTGAGATTGTGCACGATTGGCCGACGGCGGTGAGGAATTGGTCAAGGTTGCCGGGC
+CGGGGGATTACTTCGGCGAGATAGGCGTGCTGTTTCACCTGCCGCGCTCGGCGACCGTGCGTGCCCGCAG
+CGACGCGACGGCCGTCGGCTATACCGTGCAGGCGTTTCGTGAGCGGCTCGGCGTGGGGGGTCTGCGCGAT
+CTGATCGAGCATCGTGCGCTTGCCAACGACTAACCCGGCTTGGCCGGAACTAGCCACTGCCGGGGCAGCG
+GTGGCGGTTCACACCGCGTGCGCGTTTGGAGGTCCCTGAGCGATGGGCGATCTGAGCATTAGCCAGGTGT
+CGGCGCGTCCGGGACGGATCGGGATTCGCGCTAGGCAAATGTTCGACGGATACCGGTTTCAGCGTGGTCC
+CGTGCTGGTCGTGGTCGAGGATGGTCGGATCAGCGCGGTCGATTTTGCTGGCTCCGCCTGCCCCGATATG
+AACCTGGTTGATCTGGGTGAATCGACTTTGTTGCCGGGTCTGGTGGATGCGCATGCGCATTTGTGCTGGG
+ACCCCGACGGTAGGCCAGAGGATTTGGCCGGCGACCCCCATGCGGTGCTGGTGGGACGGGCGCGACGGCA
+CGCCGCGGCCGCGTTGCGCTCCGGGATCACCACGATTCGCGATCTCGGCGACCGTGACTATGCGGCCTTG
+GCGCTGCGGGAGGAGTATCGGCAGAAAACGACGGTGGGGCCGGAACTGGTGGTTTCTGGGCCACCATTGA
+CTCGCAGCGGCGGGCATTGCTGGTTCCTCGGCGGCGTGGCCGATAGCGTCGAGGAGCTGGTTGATGCGGT
+GCAGGAGCGGGCCGCGCGGGGAGCGGATTGGATCAAGGTGATGGCCACGGGCGGATTCGTTACCACAGCA
+TCCGATCCGTGGCAGCCGCAGTACGGCAGCGGCCAACTGGCCGCGGTGGTGGCGGCCGCCGAGCAGGTAG
+GTCTACCGGTGACCGCACATGCACATGCCACCGCAGGGATCGCCGCGGCGGTCGCCGCGGGTGTTGACGG
+CATCGAGCACTGCACGTTCTTGAGCGAAGGCAGCGCCGCCGCCAGCCCGGATGTTGTTGAAGCGATTGTT
+GCCCAAGGTGTGTGGTGCGGTATGACGATTCCCCGGGTGTATCCGGAGATGCCGGAGAACCTTGTCGCGG
+TTGTGCAGGATGGATGGCGAAACATCCGCCGGCTCATCGACGCCGGTGCGCGTGTCGCCCTGTCCACCGA
+CGCTGGAGTCGCCCCGGGCAGACGCCATGACGTGCTCCCCGACGATTTGGTGTATCTGTCTCGACACGGG
+TTCACCAGCACAGAGGTGCTGACCGGCGCCACCGCAGCGGCCGCTGCCAGCTGTGGGCTCGGCCACCGCA
+AGGGTCGCATCGCGCCGGGCTACGACGCTGATCTGCTGGCTGTTGCGGCAGGTGTGGACCATGACCCCGC
+CGGACTCTGCGACGTCAAAGCCGTCTGGCGCAGCGGAACCCAGGTACCGCTACAAGCATCCGCTGTGGGC
+TACAACACCCCGTCATAACCCCGTCATAAAATGCAGGACAGCATCTTCAATCTGTTGACCGAGGAACAGC
+TTCGGGGTCGCAACACGCTCAAGTGGAACTATTTCGGGCCCGATGTAGTGCCACTGTGGCTGGCGGAGAT
+GGACTTTCCCACCGCACCGGCTGTGCTCGACGGGGTGCGGGCGTGCGTCGACAACGAGGAGTTCGGCTAC
+CCGCCGTTGGGCGAGGACAGCCTGCCGAGGGCGACGGCCGATTGGTGCCGACAACGCTACGGTTGGTGCC
+CCCGACCGGACTGGGTCCGCGTCGTGCCGGATGTCCTGAAGGGGATGGAAGTCGTCGTCGAATTCCTTAC
+CCGGCCGGAGAGTCCGGTCGCGTTGCCGGTTCCGGCTTACATGCCGTTTTTCGACGTCCTGCACGTCACC
+GGCCGCCAACGAGTGGAAGTCCCAATGGTGCAGCAAGACTCGGGACGCTACCTGCTGGACCTGGACGCTC
+TGCAGGCCGCGTTCGTCCGCGGTGCCGGATCGGTGATTATCTGCAATCCGAATAACCCACTGGGTACGGC
+GTTCACCGAAGCCGAGCTACGTGCGATTGTGGATATCGCGGCCCGCCACGGCGCCCGGGTGATCGCGGAT
+GAGATCTGGGCACCGGTGGTCTACGGATCGCGCCATGTCGCCGCCGCTTCGGTGTCGGAGGCGGCGGCTG
+AAGTCGTGGTCACGTTGGTGTCGGCGTCCAAAGGCTGGAACTTGCCGGGTCTGATGTGCGCTCAGGTGAT
+CCTGTCTAACCGCCGTGACGCCCACGACTGGGACCGGATCAACATGTTGCACCGCATGGGCGCATCAACG
+GTCGGTATCCGCGCGAACATCGCCGCCTACCATCATGGCGAATCTTGGTTGGACGAGCTGCTCCCTTATC
+TGCGGGCGAACCGTGATCATCTGGCACGGGCGCTGCCGGAGTTAGCTCCCGGGGTAGAGGTCAACGCTCC
+GGACGGTACCTACCTGTCGTGGGTGGATTTCCGTGCGCTGGCTCTGCCGTCTGAACCGGCGGAATACCTG
+CTCTCGAAGGCGAAGGTGGCGCTGTCGCCTGGCATTCCGTTCGGCGCCGCGGTGGGCTCGGGATTTGCGC
+GGCTGAACTTCGCCACCACCCGCGCAATACTGGATCGGGCGATCGAGGCTATCGCGGCCGCCCTGCGCGA
+CATCATCGATTAAGCCAACCAGTAGATTCACAACGCTGCGGCGTGTTGGGTCAGGCTGAAGAAGATGTAG
+GCGAGGCAGATCAGGAAGTTCAGTGCCACGAGAACCAAACCCAGACAGATTAGTGAATGCGTGGCTCGGC
+GTTGTAGGCGGTGGAATTTCGCGACGCGCTTCTCATGGTTCAGCTGGGTCACGATCAGTGCGAACTTGAC
+GTCGGTCCATTCTTCGTCGGCGGCGGGAGCGCCCAACAGCATTTCCTGAAGGCGCTTCGGCGGGGCTTCG
+ACGCCGACCCGCGCGAAGTGCTGGCTCAGCCGCCGGGCTTGCCTGCGGCCAAGAATCTGACCCCGCACCG
+GTGGCTGATGCGAGAGCTTCCTTCGTTCGTCCCCCCAGTGGTTGGACGGGGTCGTCACAGCGGGCATTCT
+AAGTCCCGCGGGCCACAAAAGGCAGTGCCGCGGAACTTCTTGGCCCAAACGGGCACCCGGCTACGTGCGC
+ACCGCGACCGTCGACAACTGGTCGGCGAGCCGGTCCGGGGAATCCACCATCGAGAACGTCCGTGCTCCCT
+CGATTACCTCGAAACGGGCGCGCGGGATGGTCGCGGCGAGCCGTTGACCGTTCTCGAGTGCGAAGAACAC
+GTCATCCGCCGACCACGCGATGAGCGCCGGCTTGTCGAATTCAGGCAGCCGGGCGGCGACTGCGGTGGTG
+ACTTCGGTGCGCAGCGATAGCGAGAGCTGACGCAGGTCTTCGGCGATGGCCGGGTTGGATAGCGCCGGAC
+GAACCCAGGCCCGGGTGAGATGGTCGATGTTGTGGTGCGACAAACCGGCATACGCGCGGTTACGCGCGGC
+CGGTGCCCGCATCACCTGGATCGCGGCCCGGAACAGGGTGGCCGATTTCGCGGCCAGGATCACCGGTTTG
+AGGATCGGCGGCGGAAAGTGTTCGAACGCATCGCAACTAGTGAGGACCAGGGCACCGAGCCGTTCGGGAT
+AGTGGACCGCGACGAGCTGGGTGACGACCCCGCCGGTGTCGTTGCCGACCAGCACCACGTCCTTGAGCTC
+GAGCGCGGCAAGGACGTCGGCGACGATGCCGGCAACCCCGCCGATGGTCTGGTCGGCGCCGGGGCGTAGC
+GGCTTAGGATGCGCACCCAGCGGCCAGGTGGGGGCGATGCAGCGCAGGCCACGACCGGCGAGTCGCTCAC
+TGACCCGTCGCCATAGTTGACCGCCCATCATGTACCCGTGCACGAACACGACAGGCCTGCCAGTTTCGGG
+TCCGGTTGCTTCGTAATGAATAGTTCCGGCACTAATGTCGATCGTCGACATGGATGCCCACCCTTCGAGG
+TACATTTACAAGCAGACTGCCGGTAACTTACCAACAGATTGTATGGAAATCAAGAGACGCACCCAGGAGG
+AACGCTCCGCGGCGACCCGCGAGGCGCTGATCACCGGGGCCCGCAAGCTGTGGGGGTTACGGGGTTATGC
+GGAGGTGGGGACGCCGGAAATCGCGACCGAGGCGGGGGTCACGCGGGGGGCGATGTACCACCAATTCGCC
+GATAAAGCAGCACTATTCCGCGATGTGGTGGAGGTCGTGGAGCAAGACGTGATGGCCCGGATGGCCACCT
+TGGTCGCCGCCTCGGGGGCGGCGACGCCGGCCGATGCAATCCGGGCAGCGGTCGATGCCTGGCTCGAGGT
+ATCTGGTGATCCGGAGGTGCGTCAGCTGGTCCTGCTGGATGCGCCCGTCGTGCTGGGCTGGGCGGGTTTC
+CGCGACGTCGCCCAGCGATACAGCCTGGGCATGACCGAACAGTTGATCACCGAGGCGATCCGGGCCGGCC
+AGTTGGCTCGTCAACCGGTGCGGCCGCTGGCCCAGGTGCTCATTGGCGCGCTCGACGAGGCGGCGATGTT
+CATCGCCACCGCCGACGACCCCAAGCGCGCCCGTCGGGAGACCAGACAGGTGCTGCGCCGGCTCATCGAC
+GGGATGCTTAACGGCTAGCGCTGGGCGCGGCCTCGGCAAAATGGCTTGCGGACCGGGATCTGAGTTCCAG
+AACTGGGCGCAGGACTGGCTGGTCACCACTTGGCGGCGAGGCGTGTCCATTCCGCTGCCAGGTCGCGGTC
+CCGGTGGAAGCCGCGCAGGGTAATCAGCTCGATAGCTTTGCGCGCATCTTGGATATCTTGAGGCGATGCG
+GCGTCCACGAGCGCACGTAGATCACTGCGATCCTGGGGTCGCCGATCATCATCTCTCGCAAGAAGTTTCA
+TCGCGATCAGATGCGCCGTTGTGGCCACCGGAGCGACTAGATCGGGCAAGATCTCGATCTCCTCGGCAGC
+CTCCGCAATCTCCGGTTCGATGCCACAGCTCGCGAAAAGGAGGTCCACCACAACATTCGCGGCAGTGTCT
+GCGGTTGCTCCGAGACGGACCGCTGCCAACCGTCTGGCCGCGTCCTGCTCTACCGACGCCAGGAGATGGT
+ACTGCTGGGTAAGAAGTTGACGGACTAAAGATTCCGCGGCATCGTCGTTTGCCACCGCGACAACAATGTC
+CACGTCACGGGTGAAACGTGGTTCGGATCGCGCAGACACCGCGAAACCACCAACCAGCGCCCACCGCTGA
+CGCAATCCGGTCAGGTCCTTGGCGACCCTACGGAGTGTCGACTCCACAGCGTTCATGTGAACCGTGTGGA
+CGTCGGGCCTGCGCTGTCACCCTCCTCCGCCCCGGGACGCGTCATCCTCCACGCGTCGATAGCTGCTTCA
+ATTTCAACAACGTCCGCATTGGGCCGTTCACGACCCAGCCTCATGCGCTGCATCTGCTCGCCAACCTCGT
+ACATGTCCAGAGCGAGCCTCAGCTTCTGCGCAGCGACGGAAACTGCCACACTCAAAGCCTACTGGGCGCA
+CGTGTGGCAACGAGTCGATCCACACGAAATGCCGCCGTTGGGCCGCGGACTAGCCGAATTTTCCGGGTGG
+TGACACAGCCCACATTTGGCATGGGACTTTCGGCCCTGTCCGCGTCCGTGTCGGCCAGACAAGCTTTGGG
+CATTGGCCACAATCGGGCCACAATCGAAAGCCGAGCAGGTGGAACCGAAACGCAGTCGCCTCGTCGTATG
+TGCACCCGAGCCATCGCACGCGCGGGAATTCCCGGATGTCGCCGTATTCTCCGGCGGCCGGGCTAACGCA
+TCCCAGGCCGAACGGTTGGCTCGTGCCGTGGGTCGCGTGTTGGCCGATCGGGGCGTCACCGGGGGTGCTC
+GGGTGCGGCTGACCATGGCGAACTGCGCCGATGGGCCGACGCTGGTGCAGATAAACCTGCAGGTAGGTGA
+CACCCCATTAAGGGCGCAGGCCGCCACCGCGGGCATCGATGATCTGCGACCCGCACTGATCAGACTGGAT
+CGACAGATCGTGCGGGCGTCGGCACAGTGGTGCCCCCGGCCTTGGCCGGATCGGCCCCGCCGGCGATTGA
+CCACGCCGGCCGAGGCGCTAGTCACCCGCCGCAAACCGGTCGTGCTAAGGCGCGCAACCCCGTTGCAGGC
+GATTGCCGCTATGGACGCCATGGACTACGACGTGCATTTGTTCACCGACGCCGAGACGGGGGAGGACGCT
+GTGGTCTATCGGGCTGGACCGTCGGGGCTGCGGCTGGCCCGCCAGCACCACGTATTTCCCCCAGGATGGT
+CACGTTGTCGCGCCCCAGCCGGGCCGCCGGTGCCGCTGATTGTGAATTCGCGTCCGACACCGGTTCTCAC
+GGAGGCCGCCGCGGTGGACCGGGCGCGCGAACATGGACTGCCATTCCTGTTTTTCACCGACCAGGCCACC
+GGCCGCGGCCAGCTGCTCTACTCCCGCTACGACGGCAACCTCGGGTTGATCACCCCGACCGGTGACGGCG
+TTGCCGACGGTCTGGCATGAGCCCGGGCTCGCGGCGCGCCAGCCCGCAAAGCGCCCGGGAGGTGGTCGAG
+CTCGACCGTGACGAGGCGATGCGGTTGCTGGCCAGCGTTGACCATGGGCGTGTGGTGTTCACCCGCGCGG
+CGCTGCCGGCGATCCGTCCAGTCAATCACCTCGTGGTCGACGGTCGGGTGATCGTGCGCACCCGCCTGAC
+GGCCAAGGTGTCCGTTGCGGTGCGATCGAGCGCCGATGCCGGTGTCGTGGTCGCCTACGAAGCCGACGAC
+CTTGATCCGCGGCGTCGGACGGGGTGGAGTGTGGTGGTGACGGGACTGGCGACCGAGGTCAGCGATCCCG
+AGCAGGTTGCCCGCTACCAGCGGCTGCTACACCCGTGGGTGAACATGGCGATGGACACCGTGGTCGCGAT
+CGAACCCGAGATCGTCACCGGCATCCGCATCGTTGCTGACTCGCGTACGCCGTAGCCGATTGGCCGCGGG
+CGGCCCGCACGCATCCGCACTATCTGATAAATTCTTCAATTCGTCAACCGATGTAACGCTGAAGCTCTCA
+GGAGACGCGGTGGAGTCCGAACCGCTGTACAAGCTCAAGGCGGAGTTCTTCAAAACCCTTGCGCATCCGG
+CGCGGATCAGGATTTTGGAGCTGCTGGTCGAGCGGGACCGTTCGGTCGGTGAGTTGCTGTCCTCGGACGT
+CGGCCTGGAGTCGTCGAACCTGTCCCAGCAGCTGGGTGTGCTACGCCGGGCGGGTGTTGTCGCGGCACGT
+CGTGACGGCAACGCGATGATCTATTCGATTGCCGCACCCGATATCGCCGAGCTGCTGGCGGTGGCACGCA
+AGGTGCTGGCCAGGGTGCTCAGCGACCGGGTGGCGGTGCTAGAGGACCTCCGCGCCGGCGGCTCGGCCAC
+GTAACGCCATGGGTTGGGTTGCCAAGATTTTCCGTGTTGGCCGGGTGGTCGAGCCCGCGGCCCCCTTACC
+GGCGGCGATAGCCGAACCACCCGCCGGGGTACGGGGTTCGCTGCAGATCCGACATGTTGACGCGGGTTCG
+TGCAACGGGTGTGAGGTGGAGATTTCGGGCGCCTTTGGCCCGGTGTATGACGCGGAGCGGTTCGGGGCGC
+GGCTGGTCGCCTCGCCCCGACACGCCGATGCGTTGTTGGTGACCGGCGTGGTCACGCACAACATGGCCGG
+CCCACTGCGCAAGACCCTGGAGGCCACGCCGCGCCCGCGGGTGGTAATCGCGTGCGGGGATTGCGCGCTG
+AACCGGGGGGTGTTCGCCGACGCCTACGGCGTGGTCGGTGCGGTCGGCGAGGTGGTACCCGTCGACGTCG
+AGATCGCCGGCTGCCCGCCGACACCCGCGGCCATCATGGCGGCGCTGCGATCGGTGACCGGGAAATGACC
+GCTGCACCGACGGCCGGCGGGGTCGTCACTTCGGGCGTGGGCGTTGCCGGGGTCGGCGTGGGGTTGCTGG
+GCATGTTTGGACCGGTGCGTGTAGTGCACGTCGGTTGGCTGCTTCCGCTGTCCGGCGTGCACATCGAGCT
+CGACCGGTTGGGCGGATTCTTCATGGCGCTCACGGGCGCGGTAGCGGCTCCGGTCGGTTGTTACCTGATC
+GGCTACGTGCGCCGTGAACACCTCGGTCGGGTCCCGATGGCGGTGGTGCCGCTGTTCGTCGCGGCGATGC
+TGTTGGTGCCGGCCGCGGGCTCGGTGACGACGTTTCTGCTGGCGTGGGAGCTGATGGCGATCGCGTCGCT
+GATCCTGGTGCTCTCCGAGCACGCCCGCCCGCAGGTCCGCTCGGCGGGCCTGTGGTACGCCGTGATGACT
+CAGCTGGGATTCATCGCAATCCTGGTCGGGCTGGTGGTGTTGGCGGCGGCCGGGGGTTCCGACCGGTTCG
+CCGGCCTCGGGGCAGTCTGCGACGGGGTCCGCGTCGCCGTATTTATGCTCACGCTGGTCGGGTTTGGTTC
+GAAGGCGGGCCTGGTGCCACTGCACGCCTGGCTGCCGCGGGCCCACCCGGAGGCGCCGAGCCCGGTGTCG
+GCGTTGATGAGCGCGGCGATGGTCAACCTGGGCATCTACGGCATCGTCCGTTTCGATCTGCAGCTGCTGG
+GGCCGGGCCCACGCTGGTGGGGGCTTGCGCTGCTGGCCGTGGGCGGCACGTCCGCGCTGTATGGGGTGCT
+GCAGGCTTCGGTGGCCGCCGATCTCAAACGGCTGCTGGCCTATTCGACGACCGAGAACATGGGCCTGATC
+ACGCTGGCGCTCGGTGCGGCAACACTTTTCGCGGATACCGGAGCCTACGGGCCGGCGTCGATCGCCGCCG
+CCGCAGCGATGCTGCACATGATTGCGCACGCGGCGTTTAAGAGCCTCGCCTTCATGGCGGCCGGATCTGT
+GCTGGCCGCGACCGGGCTGCGCGACCTGGACCTGCTCGGCGGGCTGGCCCGCCGAATGCCGGCGACCACC
+GTCTTTTTCGGGGTGGCCGCACTGGGCGCATGTGGTCTGCCGTTGGGCGCCGGGTTTGTCAGTGAGTGGC
+TGCTGGTCCAGTCGTTGATCCACGCTGCCCCCGGACACGACCCCATCGTGGCGCTGACGACACCGCTGGC
+GGTCGGCGTGGTCGCACTGGCCACCGGTCTGAGCGTGGCGGCGATGACCAAGGCCTTCGGGATCGGGTTT
+CTCGCCCGTCCCCGCTCCACCCAAGCCGAAGCGGCGCGTGAGGCGCCGGCCAGCATGCGCGCCGGCATGG
+CGATCGCGGCGGGCGCCTGCCTGGTGCTGGCGGTGGCACCGCTGCTGGTCGCACCCATGGTGCGGCGGGC
+CGCCGCGACGCTGCCGGCCGCTCAGGCGGTCAAGTTCACCGGTCTGGGCGCCGTGGTGCGGCTGCCCGCG
+ATGTCCGGGTCGATCGCGCCCGGCGTGATCGCCGCCGCTGTGCTCGCCGCGGCGTTGGCGGTAGCCGTCC
+TCGCGCGGTGGCGTTTCCGCCGGCGCCCGGCGCCGGCCAGGTTGCCGCTGTGGGCTTGCGGCGCGGCCGA
+TCTCACCGTGCGCATGCAATACACGGCCACGTCGTTCGCCGAGCCGCTGCAGCGGGTCTTCGGCGACGTG
+CTGCGCCCGGACACCGACATCGAGGTCACCCACACCGCCGAGTCGCGCTATATGGCCGAGCGGATCACCT
+ACCGGACCGCGGTCGCCGACGCGATCGAACAGCGCCTCTATACGCCGGTGGTCGGGGCGGTGGCCGCCAT
+GGCCGAGCTGCTGCGCCGTGCCCACACCGGCAGCGTGCACCGCTACCTGGCCTACGGCGCGCTGGGCGTA
+CTGATCGTGCTGGTGGTCGCGAGGTGTACGTGATGTCCTACCTAGCGGGCGCCGCGCAAATCGGCGGGGT
+CATGGTGGGTGCGCCGCTGGTCATCGGTATGACGCGGCAGGTACGGGCACGCTGGGAAGGCCGGGCCGGC
+GCCGGCCTGCTGCAACCGTGGCGTGATCTGCTCAAACAGCTTGGCAAGCAACAGATCACACCGGCGGGGA
+CGACGATCGTGTTCGCCGCCGCGCCGGTGATCGTCGCCGGGACAACGCTTTTGATCGCCGCGATCGCACC
+TCTGGTGGCCACCGGGTCACCCCTGGACCCCAGCGCCGACTTGTTTGCCGTGGTCGGGCTGCTATTCCTG
+GGCACCGTCGCACTGACCCTGGCCGGCATCGACACCGGCACCTCTTTCGGCGGCATGGGCGCCAGCCGCG
+AGATCACCATCGCCGCACTGGTCGAACCAACGATCCTGCTGGCGGTGTTCGCGCTGTCCATCCCCGCCGG
+ATCGGCCAATCTCGGTGCGCTGGTGGCGAGTACGATCGACCACCCGGGCCACGTGGTGTCGCTGGCCGGC
+GTACTGGCCTTCGTGGCGTTGGTGATTGTCATCGTCGCCGAGACCGGGCGGCTGCCGGTGGACAACCCGG
+CCACCCACCTGGAATTGACGATGGTGCACGAGGCCATGGTCCTCGAGTACGCCGGCCCACGGCTGGCGCT
+GGTCGAATGGGCGGCCGGGATGCGGCTCACGGTGCTGCTGGCACTGCTGGCGAATCTGTTCCTGCCGTGG
+GGGATCGCCGGCGCCGCGCCCACCGCGCTCGACGTGTTGACCGGCGTGGTGGCGGTGGCGGCCAAGGTCG
+CGATTCTCGCGGTGCTGCTGGCGACGTTCGAGGTGTTCCTCGCCAAACTGCGATTGTTCCGGGTACCCGA
+ACTGCTGGCCGGCTCGTTTCTGCTGGCCTTGCTCGCGGTCACCGCCGCCAACTTCTTCACGGTGGGGGCG
+TGAGGGGCCAGCGATGAGTAACGCCAACTTCTCGATCCTGGTCGACTTCGCCGCGGGTGGGCTGGTGTTG
+GCGTCGGTGCTGATTGTCTGGCGCCGCGACCTGCGGGCCATTGTGCGGCTGCTGGCCTGGCAGGGTGCTG
+CGCTGGCCGCGATCCCGCTACTGCGCGGCATCCGCGACAACGACCGTGCGCTGATCGCGGTGGGCATCGC
+CGTGTTGGCGCTGCGCGCGCTGGTGTTGCCCTGGCTGCTGGCCCGCGCGGTGGGCGCCGAAGCGGCCGCG
+CAGCGGGAGGCCACCCCGTTGGTCAACACCGCCAGCTCGCTGCTGATTACCGCCGGACTGACCCTCACCG
+CGTTCGCGATCACCCAGCCGGTGGTCAACCTGGAACCGGGCGTCACCATCAACGCGGTGCCGGCCGCGTT
+CGCGGTGGTGCTGATCGCGCTGTTCGTGATGACCACGCGGCTGCACGCGGTCTCGCAGGCCGCCGGATTC
+CTGATGCTAGACAACGGGATCGCGGCGACCGCATTCCTGCTCACCGCCGGGGTGCCGCTGATCGTCGAAC
+TTGGTGCCTCGCTGGACGTGCTGTTCGCGGTCATCGTGATCGGCGTGTTGACCGGCCGGCTGCGCCGCAT
+TTTCGGCGATGCCGACCTGGACAAGCTGCGGGAGTTGCGGGATTGATGACCGGTTTGCTGCTTGCCGCGA
+TCCTCGCACCGCTCGCCGCGTCAATCGCCTCCTTGATCACCGGGTGGCGACGCACGACGGCGACGCTCAC
+CGCGCTGTCCGCCACGACGGTGCTGGCCTGCGCTGTGGCGATGGGGTTTTGGATGGGGTCGGGGGCGCAG
+TTCGGGCTGGGCGGTCTGCTGCGCGCCGATGCGCTGACGGTGGTCATGCTCGTCGTCATCGGGATCGTCG
+GCACACTGGCCACCGCGGCGAGCATCGGCTACATCGACACCGAGCTGGCACACGGGCATATCGACGGACG
+TAGCGCTCGGCTGTATGGGGTGCTGACCCCGGCGTTTCTTTGCGCGACGGTTCTGGCGGTGTGCGCCAAC
+AACATCGGCGTCATTTGGGTAGCGATCGAGGCCACCACGGTGATCACCGCGTTTCTGGTGGGGCATCGCC
+GCACCCGCACCGCGCTGGAAGCGACCTGGAAATACGTGGTGATCTGTTCGGTCGGGATCGCCGTCGCCTT
+CTTGGGTACCGTGCTGCTGTATTTCGCCGCGCGGGATTCCGGTGCCGCTGCTGCCGGCGCGCTGAACCTC
+GATATCCTGGCCGAACACGCCGCCGGCCTAGACCCCGGGGTCGCTCGACTGGCCGGCGGGTTGCTGCTCA
+TCGGTTATGGCGCCAAGGCGGGCCTCTTCCCGTTTCACACCTGGCTGGCGGACGCGCACAGCCAAGCCCC
+CGCACCGGTGTCCGCACTGATGAGCGGCGTGCTGCTGGCGGTGGCGTTCTCGGTGCTGATCCGATTGCGG
+CCGATCCTCGACGCGGTCAGCGGGCCCGCCTACCTGCGCAACGGGCTGCTCGTGGTCGGGTTGGCGACGC
+TGCTGGTGGCGGTGCTGATGCTGACCGTGACCGGCGACGTCAAGCGGATGCTGGCCTACTCGTCGATGGA
+GCACATGGGCCTGATCGCGATCGCCGCGGCCGCCGGCACGACATTGGCGATCGCCGCGCTGCTGCTGCAC
+GTGCTCGCCCACGGGATCGGCAAGACCGTGCTGTTTCTGGCGGGCGGTCAGCTGCAGGCCGCACACGACT
+CCACCGCCATCGCCGATATCACCGGCGTGATGCGACGGTCGCGGCTGATCGGCGTGTCGTTTGCCGTCGG
+CCTGATCGTCCTGCTTGGCTTGCCGCCGTTCGCGATGTTCGCCAGCGAGCTGGCGATCGCGCGCTCATTG
+GCCAACGAGCGGCTGGCCTGGGTGCTGGGTGCGGCGCTGCTGCTGATCGCCATCGGTTTCACGGCTCTGG
+CACGCAATTCCGGACGCATGCTGCTCGGCACCCCGGCGGCGGGCGCGCCGGCGATCACCGTGCCGGCCAC
+CGCGGCGGCGGCGTTGATGGTGGGCATCGTCGTCTCGGCGGCCCTCGGCATCACCGCGGGCCCACTCGCC
+GACCTGCTTGGCATCGCCGCCAGCAACGTGGGTCTACCGTGATGAGTGCCAGCTGGCTGCGCCACCGGGT
+ATCCGAGCGTGGACTGATAGCGACGGCCGAACAACTCTGGGCCGATTCGTTTCGCCTGGCCCTGGTCGCT
+GCCCACGACGACGGCGACAGTCTGCGTGTCGTGTACCTTTTCTTGGCGGGCTATCCAGATCGCCGCGTCG
+AGTTGGAATACGTTGTGCCGGCGGATAATCCAGAGATCAGATCGTTGGCGTACCTGTCCTTTCCGGCTGG
+CCGGTTCGAGCGCGAAATGGCGGACCTGTACGGAATTCGCCCGGTCGGCCATCCCAAACCCCGCCGACTG
+GTACGGCACGCGCATTGGCCCGACTGGCATCCCATGCGCACCGACGCCGGGCCCGCGCCCGAATTCACTG
+ATACGGGGGCCTTCCCGTTCCTCGCCGTCGAAGGACCCGGCGTGTACGAGATTCCGGTCGGGCCGGTGCA
+CGCCGGCCTCATCGAACCCGGTCACTTCCGGTTTTCTGTCGCGGGCGAGACGATCGTGCGGCTGAAGGCG
+CGGCTGTGGTTTGTGCACCGTGGCATCGAGAAACTCTTCCACGGCCGCCCCGCCACGGCCGCGGTCGATC
+TCGCCGAACGCATCAGCGGCGACACGTCGGCAGCGCACGCGCTCGCGCACAGCCTGGCGATCGAAGACGC
+TCTCGGCATCGAGCTGCCCCACGAGATCCACCGGCTGCGGGCCCTGATCGTCGAACTCGAACGGCTCTAC
+AACCACGCCGCCGACCTGGGTGCCTTGGCCAACGACGTCGGCTACTCGCTGGCCAACGCTCACGCCCAAC
+GCATCCGCGAAAATCTGTTGCGGCGCAATGCCGCAGTCACCGGTCACCGGCTACTGCGCGGCGCCATCCG
+CGCGGGCGGGGTTGCGCTGCGTGCGCTGCCCGATACCGACGAGCTTGCAGCGCTCGCCGTCGATCTCGCC
+GAGGTCGCCACCCTGACGCTGGCCAACTCGGTGGTCTACGACCGCTTCGCCGGCACCGCCGTGCTGCACC
+CCGACGACGCCAGCGCCCTGGGCTGCCTGGGCTATGTTGCCCGCGCCAGCGGACTGCGCAGCGACGCCCG
+GGTCGAACACCCCACCATAGTGCTGCCCATCACCGAGATCGGCGCGCCTGACGGCGACGTCTTGGCTCGC
+TACACCGTGCGGCGCGACGAATTCGCCGCGTCTGCCGCTCTTGCTCAACACATTGTCGAATCACACACCG
+GTCCAATAGAATACGCCGCTACACTGCACCCGGTGGGCGCGCCCAGCAGCGGTATCGGCATCGTCGAAGG
+CTGGCGCGGCACTATCGTGCACCGCGTCGAAATTGACGTCGATGGCCGCATCACCCGGGCGAAAGTCGTC
+GATCCGTCCTGGTTCAACTGGCCCGCACTGCCGGTGGCGATGGCCGACACCATCGTCCCCGACTTCCCGT
+TGGCCAACAAAAGCTTCAACCAGTCCTACGCGGGCAACGACCTCTAACCGTGAGCGCGCCCAGTTGTACG
+GCCCTAGCGGCGTGTCGGTGTACAAACACGCACCCTCGCGGGTTCGGTTGCGCCAAACTAGAAGTACCGT
+GGTCAAGGGACGTTCGGGGAGCCTGTCGTGGCGTCGAGTGCGCACCGGTGACCTCGGTCTGGCTGTTTGG
+GGTGGACGCGAGGAGTACCGGGCGGTCAAACCGGGCACACCAGGGATACAACCGAAGGGAGACATGATGA
+CTGTGACCGTTGTCGATGCTGGACCCGGCCGGGTGAGCCGTTCGGTGGAGGTGGCCGCGCCGGCGGCCGA
+GTTGTTCGCCATCGTTGCTGATCCCCGGCGCCACCGCGAACTGGACGGATCGGGCACGGTTCGCGGCAAC
+ATCAAGGTACCGGCGAAATTAGTTGTCGGGTCGAAGTTTTCGACGAAGATGAAGTTGTTCGGCCTACCGT
+ATCGCATCACCAGCAGGGTGACCGCGCTCAAACCGAACGAATTGGTCGAGTGGAGCCACCCGTTAGGCCA
+TCGGTGGAGATGGGAATTCGAATCGCTGTCACCGACACTGACCCGCGTCACCGAGACATTCGACTACCAC
+GCCGCCGGTGCGATCAAGAACGGCCTGAAGTTCTACGAGATGACGGGTTTCGCGAAGTCCAATGCGGCGG
+GAATCGAGGCCACGTTGGCCAAGCTGAGCGATCAGTACGCCCGCGGTAGGGCATGACGCCATGGGGGCGT
+GTCGGTGTACCGACACGCTCGCTCACGGGTTCGGTTGCACCAAGAAAAGATGTACCAGATCACCTGCCTG
+AATAGGATTTCTGGCCCGACGTAGCTTCGGGCTAGCGCGAGCGACGACTCCGCCGTCGAGCAGGATGTCA
+CCGTGGATCAACCGTGGAACGCCAACATCCACTACGACGCTCTGCTGGATGCCATGGTGCCGCTCGGTAC
+CCAGTGCGTGCTCGACGTCGGGTGCGGCGACGGGTTGCTGGCTGCCCGGCTGGCTCGGCGCATACCCTAC
+GTCACGGCAGTGGACATCGATGCGCCCGTCCTGCGACGTGCGCAGACACGGTTCGCCAACGCGCCGATCC
+GCTGGCTGCATGCCGACATCATGACGGCTGAGCTGCCCAACGCGGGCTTCGACGCCGTGGTCTCCAATGC
+CGCCCTGCACCACATCGAGGACACTCGGACGGCGCTGAGCCGGCTCGGCGGGCTGGTAACTCCCGGTGGG
+ACGCTGGCCGTGGTCACCTTCGTGACGCCCTCGCTGCGAAACGGCTTATGGCACTTGACAAGCTGGGTTG
+CCTGCGGCATGGCCAATCGCGTCAAGGGCAAGTGGGAACATTCCGCTCCGATCAAGTGGCCGCCCCCGCA
+GACGTTGCATGAGCTACGCAGCCACGTTCGCGCCCTGCTGCCCGGGGCGTGTATCCGTCGGCTGCTGTAC
+GGCCGGGTGCTCGTTACGTGGCGCGCACCCGTCTAATCGGGAGAACCCAATGGCGGCGGCCGATATGACC
+AAGTGCGCGTTAGCTTGCGAGATTGGCTGCCCGCATCCAATGATCGGCGGATACGGGTCGCAAACCACCT
+CAGACCGGCAGCTAAGGAGCGCAAGTGGCCAAGAACCAAAACCGCATCCGCAACCGGTGGGAGTTGATCA
+CCTGTGGTCTCGGGGGACACGTCACCTACGCGCCGGACGACGCGGCACTTGCTGCGCGGCTGCGCGCCAG
+CACCGGGCTGGGCGAAGTATGGCGCTGCTTGCGCTGCGGCGATTTCGCGCTCGGTGGGCCGCAGGGGCGT
+GGTGCTCCCGAGGATGCGCCGTTGATTATGCGCGGCAAGGCGTTACGTCAGGCCATCATCATTCGCGCGC
+TCGGGGTCGAACGGCTAGTCCGGGCGTTGGTGTTGGCGCTGGCCGCGTGGGCGGTGTGGGAGTTTCGCGG
+TGCGCGGGGAGCTATCCAGGCGACCCTGGATAGGGACTTGCCGGTCCTGCGTGCGGCCGGATTCAAGGTC
+GATCAAATGACGGTGATCCACGCTCTGGAGAAAGCGTTGGCCGCCAAACCGTCGACGTTGGCCCTGATCA
+CGGGCATGCTGGCGGCATACGCAGTGCTGCAGGCCGTCGAGGGGGTCGGTTTGTGGCTGCTGAAGCGCTG
+GGGCGAGTACTTCGCGGTGGTGGCCACCTCAATTTTCCTGCCGTTGGAGGTTCACGACCTGGCCAAGGGC
+ATCACGACGACTCGGGTCGTGACCTTCAGCATCAATGTCGCCGCCGTTGTCTACCTGCTGATTTCTAAGC
+GGTTGTTCGGTGTGCGCGGCGGGCGCAAGGCTTATGACGTCGAACGGCGCGGCGAGCAGCTGCTCGACCT
+CGAGCGCGCCGCGATGCTCACCTGACCAGCCAAAATCCCACCTGTGCGGGGCCTGCGGGTTGTGTCAAAG
+GTCACTAGCGCCTTTTTCGCACTGTTTACTCCGGCGCGGCGTGCCCGTAAAGCCGCCCGGGTGAACTTGG
+ATCAGGTGGCGCAATGTCGCCGGACCGACGAAGGACCGACGCTGTGTCAACACTGCCAACCTGGGTCAGC
+CAGAGCTCTACCGACCGCGGCGTGGTCGCGCCAATCACAGCGCGTGCCCGCGACGCACTGCAGGCCGTGC
+TGCGCGCCAGGCGCCGCGGCCAGCGCTCTGACTTGCGCCTTATGCGCAGAGGCGTGGAGCGTTGTTGAGG
+TCAGGCCCGCGCCGAGGGCCGCGACTTTCTCGCTACAATCGCGCGCGGCGCGGGAGAGCCGCTAGCCGCC
+GGTGACCGGCGATTGGAGATTGAGTTGCGACCGAACGGATGGCGGTGACGGTCGGCGTCATTTGTGCGAT
+CCCGCAAGAGCTGGCGTATCTGCGCGGTGTCCTGGTCGATGCGAAACGCCAGCAGGTCGCGCAGATCCTC
+TTCGATAGCGGCCAACTCGACGCGCACCGGGTCGTGTTGGCCGCCGCCGGCATGGGCAAAGTTAACACGG
+GCCTGACCGCAACGCTGCTTGCCGATCGATTCGGCTGCCGCACCATCGTTTTCACGGGAGTGGCCGGCGG
+GCTGGATCCCGAGCTATGCATCGGTGACATCGTCATCGCCGATCGGGTCGTCCAACACGACTTCGGTCTG
+CTCACCGATGAGCGGCTGCGCCCCTATCAGCCCGGACACATCCCCTTCATCGAACCGACCGAGCGGCTCG
+GATACCCGGTTGATCCCGCGGTCATCGATCGGGTCAAACACCGCCTCGACGGGTTCACGCTGGCGCCGCT
+GTCCACCGCCGCGGGAGGTGGTGGCCGGCAGCCACGCATCTACTACGGCACCATCCTGACCGGTGACCAA
+TACCTTCACTGCGAGCGCACCCGCAACCGGCTGCACCACGAACTCGGCGGTATGGCCGTCGAAATGGAAG
+GCGGTGCGGTGGCGCAAATCTGCGCGTCCTTCGATATCCCATGGCTGGTCATTCGCGCGCTCTCCGATCT
+CGCCGGAGCCGATTCGGGGGTGGACTTCAATCGGTTTGTCGGCGAGGTGGCGGCCAGTTCGGCCCGCGTT
+CTGCTGCGCTTGCTGCCGGTGTTGACGGCCTGTTGAAGACGACTATCCGCCGGTGCGTTCACCGCGTCAG
+GCGGCTTCGGTGAGGTGAGTAATTTGGTCATTAACTTGGTCATGCCGCCGCCGATGTTGAGCGGAGGCCA
+CAGGTCGGCCGGAAGTGAGGAGCCACGATGACGGCGGCCGTGACCGGTGAACACCACGCGAGTGTGCAGC
+GGATACAACTCAGAATCAGCGGGATGTCGTGCTCTGCGTGCGCCCACCGTGTGGAATCGACCCTCAACAA
+GCTGCCGGGGGTTCGGGCAGCTGTGAACTTCGGCACCCGGGTGGCAACCATCGACACCAGCGAGGCGGTC
+GACGCTGCCGCGCTGTGCCAGGCGGTCCGCCGCGCGGGCTATCAGGCCGATCTGTGCACGGATGACGGTC
+GGAGCGCGAGTGATCCGGACGCCGACCACGCTCGACAGCTGCTGATCCGGCTAGCGATCGCCGCCGTGCT
+GTTTGTGCCCGTGGCCGATCTGTCGGTGATGTTTGGGGTCGTGCCTGCCACGCGCTTCACCGGCTGGCAG
+TGGGTGCTAAGCGCGCTGGCACTGCCGGTCGTGACCTGGGCGGCGTGGCCGTTTCACCGCGTTGCGATGC
+GCAACGCCCGCCACCACGCCGCCTCCATGGAGACGCTAATCTCGGTCGGTATCACGGCCGCCACGATCTG
+GTCGCTGTACACCGTCTTCGGCAATCACTCGCCCATCGAGCGCAGCGGCATATGGCAGGCGCTGCTGGGA
+AGCGATGCTATTTATTTCGAGGTCGCGGCGGGTGTCACGGTGTTCGTGCTGGTGGGGCGGTATTTCGAGG
+CGCGCGCCAAGTCGCAGGCGGGCAGTGCGCTGAGAGCCTTGGCGGCGCTGAGCGCCAAGGAAGTAGCCGT
+CCTGCTACCGGATGGGTCGGAGATGGTCATCCCGGCCGACGAACTCAAAGAACAGCAGCGCTTCGTGGTG
+CGTCCAGGGCAGATAGTTGCCGCCGACGGCCTCGCCGTCGACGGGTCCGCTGCGGTCGACATGAGCGCGA
+TGACCGGCGAGGCCAAACCGACCCGGGTGCGTCCGGGGGGGCAGGTCATCGGCGGCACCACAGTGCTTGA
+CGGCCGGCTGATCGTGGAGGCGGCCGCGGTGGGCGCCGACACCCAGTTCGCCGGAATGGTCCGCCTCGTT
+GAGCAAGCGCAGGCGCAAAAGGCCGACGCACAGCGACTAGCCGACCGGATCTCCTCGGTGTTTGTTCCCG
+CTGTGTTGGTTATCGCGGCACTAACCGCAGCCGGATGGCTAATCGCCGGGGGACAACCCGACCGTGCCGT
+CTCGGCCGCACTCGCCGTGCTTGTCATCGCCTGCCCGTGTGCCCTGGGGCTGGCGACTCCGACCGCGATG
+ATGGTGGCCTCTGGTCGCGGTGCCCAGCTCGGAATATTTCTGAAGGGCTACAAATCGTTGGAGGCCACCC
+GCGCGGTGGACACCGTCGTCTTCGACAAGACCGGCACCCTGACGACGGGCCGGCTGCAGGTCAGTGCGGT
+GACCGCGGCACCGGGCTGGGAGGCCGACCAGGTGCTCGCCTTGGCCGCGACCGTGGAAGCCGCGTCCGAG
+CACTCGGTGGCGCTCGCGATCGCCGCGGCAACGACTCGGCGAGACGCGGTCACCGACTTTCGCGCCATAC
+CCGGCCGCGGCGTCAGCGGCACCGTGTCCGGGCGGGCGGTACGGGTGGGCAAACCGTCATGGATCGGGTC
+CTCGTCGTGCCACCCCAACATGCGCGCGGCCCGGCGCCACGCCGAATCGCTGGGTGAGACGGCCGTATTC
+GTCGAGGTCGACGGCGAACCATGCGGGGTCATCGCGGTCGCCGACGCCGTCAAGGACTCGGCGCGAGACG
+CCGTGGCCGCCCTGGCCGATCGTGGTCTGCGCACCATGCTGTTGACCGGTGACAATCCCGAATCGGCGGC
+GGCCGTGGCTACTCGCGTCGGCATCGACGAGGTGATCGCCGACATCCTGCCGGAAGGCAAGGTCGATGTC
+ATCGAGCAGCTACGCGACCGCGGACATGTCGTCGCCATGGTCGGTGACGGCATCAACGACGGACCCGCAC
+TGGCCCGTGCCGATCTAGGCATGGCCATCGGGCGCGGCACGGACGTCGCGATCGGTGCCGCCGACATCAT
+CTTGGTCCGCGACCACCTCGACGTTGTACCCCTTGCGCTTGACCTGGCAAGGGCCACGATGCGCACCGTC
+AAACTCAACATGGTCTGGGCATTCGGATACAACATCGCCGCGATTCCCGTCGCCGCTGCCGGACTGCTCA
+ACCCCCTGGTGGCCGGTGCGGCCATGGCGTTCTCATCGTTCTTCGTGGTCTCAAACAGCTTGCGGTTGCG
+CAAATTTGGGCGATACCCGCTAGGCTGCGGAACCGTCGGTGGGCCACAAATGACCGCGCCGTCGTCCGCG
+TGATGCGTTGTCGGGCAACACGATATCGGGCTCAGCGGCGACCGCATCCGGTCTCGGCCGAGGACCAGAG
+GCGCTTCGCCACACCATGATTGCCAGGACCGCGCCGATCACCACCGGCAGATGAGTCAAAATCCGCGTGG
+TGCTGACCGCGCCGGACAGCGCATCCACAATCACATAGCCGGTCAGTATGGCGACGAACGCCGTCAGAAC
+ACCGGCCAGGCCGGCGGCGGCGCTCGGCCATAGCGCCGCGCCCACCATGATCACACCGAGCGCAATCGAC
+CACGACGTGGACTCGTTGAGCAAGTGGGTGCCGGCACCCGTCGGGTGCTGATGGGTCAGGCCGACGTCTA
+GGCCAAACCCCTGCACGGTGCCCAGGGCGATCTGCGCGATGCCCACGCACAGCAACGCCCAACGTCGCCA
+GGTCATCGGTGAATGTTGCCGCCGCGGCGCCCGGCGGATCCCGAGGCGCCCAACAGGCGGGACAACCGGG
+CGGGACTCGGCGAGCCGACGCAGATCACCAGCCTGGCTGGCCACCTGGGTAAACCATGCGCGACAGGCGC
+TGCACTCGCCCAGGTGTTCATCGACTCTCGCCGAGGGCACCGGTGCGCGCTCGCCGTCGAGTCGTGCCGA
+CAGCGCTTCGCGCGCGACCTCGCAGTCCATGCCATCAATAGTCGCGCAATGCCGACGGATTGCTCCAGCG
+GGCTCGGACCACATCGCCGCGGGCACACCCCTGCGGCCTTGCAAAACGGTTGATGCGTGGTGGTTAAAGC
+TCCCGGCCGTTGTGGCTTGTGCGAGCACGGTGGCCCGGGTGGTGCGTGAGCGCCGTGGGGCTCGCGTTCA
+GGGGTCAATCGGGTTTGTCGTCGTCGTCTTGGTTGTGGAGGAATCGTTCGGGGTGGTGGAAGGTGTTGGT
+CCACGGTTGGCCGTGGTCGAGGTGGGGTGGTGGTAGCCATTCGGTGTGGCCGTGGGTGTTTTTGCGGGTG
+GTCCAGCCTTTTTCGGCGAGTCGGTTGTCGGGGTCGCAGGCCAGGGTGAGGTCGGTGATGTCGGTGCGTC
+CGGTGCTGGTCCAGCCGGTGACGTGGTGGGCTTGGCTGTGGTAGGCCGGTGCGTCACAGCCGGGTTTGGT
+GCAGCCGCGGTCGTTGGCGAACAGCATGATCCGCTGGGCCGGGGAGGCTAGGCGTTTGGTGTGATACAGC
+GCCAGGGGTGTGCCGTGGTCGAAGATCGCCTGGGGGTACCTCCCGCTTGCGGGGGAGTAGTGGTGGGCGT
+GGCTGGTCATGCGGATCACATCGGCCATGGGTAGCAGGGTGCCGCCGCCGGTGAAGCCCTTGCCGGCGCC
+GGTTTGCAGGTCGGTCAGGGTGGTGGTGACCACAATCGAGACGGGAAGACCGTTGTGTTGGCCCAGTTCC
+CCGGAGGCGATCAGCGCGCGCAGCCCGGCCAGCAGCCCGTCGTGGTTGCGTTGGGCTTGGCTGCGGGTGT
+CGCGGTCGATGGCGGCCGCATCGGGGGTGGTGTCGATGACCGGGGTGTGGTCGTCGGGGTTGGTCGCGCC
+GGGGGCGGCCAGTTTGGCTAGCACGGCTTCAAAGGTGGCCCGCGCTTGGGGGGTCAGGTAGCCACTTAGC
+CGTGACATGCCGTCGTATTGCTGGTTGCTCAGGGTGATGCCGCGTTTGCGGGCGCGTTCGGTGTCGGTGA
+GGTCGCCGTCGGGGTGTAGCCAGTCCATGACCCGCTGGGCGTAGCGGGCCAGCTCGTCGGGACGATATTG
+AGCGGCTTTGCCGGCCAGGTCGGCTTCGGCGGCCTGGCGGGTGGACACATCCACCGCGGCGGGCAGGTGG
+GCGAAAAAGGGCGCGAATCACTTTGATGTGCGCCTCGCCGATCAGGCCCTGGCGTTGGGCGGTGGCGGTG
+GCGGTCAACTGTGGGGCTAGCGGTTCGCCGGTGAGTGCTCGACGAGGTCCGAGATCGGCGGCGTCGGCGA
+TGCGTAGGGCGGCGTCGGGCTTGGTGATGCGTAACCGGTTGGCCAGCGCGCAGCACAGCGTGCCGCCCAG
+TTCTTCCTCGCTGGCTTGGGTGTCGAGTTGGTTGATCAACGTGTGCCCGACCGCCGGTAGCCGGCGCACC
+AAGCATTCCAGACGTTCCAGAGACCGCAGCCGTTCCGGGGTGGTCAACACCTCAAAAGACACCTCGTCCA
+AGCGGTCCAGCTCGGCATCCAGCGCATCAAAGACCTCGACAAGCTCCTCCCGGCTATTCGCTAACATGTT
+CGAATCATAACGTCGGGCACTGACAAAGAGCGCCCCGCTGATAACCGTGAAACTGAAGTGACACAAGGGA
+TTTACCCAGATCCTACGAGTTGATACGGGAAGGTACCGCACCTTTCCTGGGCGCGATGGGAACTTTCTGC
+CCGTTATGGCCGACTAACACCGCGGGTGAAGCAAAGCGCTGCCTAGGCAAGGAGGTGAGTCCTGGCGGCC
+ACGATATGGATGGCTATACCACCGGAGGTGCACTCGGGCCTGTTGAGCGCCGGGTGCGGTCCGGGATCAT
+TGCTTGTTGCCGCGCAGCAGTGGCAAGAACTTAGTGATCAGTACGCACTCGCATGCGCCGAGTTGGGCCA
+ATTGTTGGGCGAGGTTCAGGCCAGCAGCTGGCAGGGAACCGCCGCCACCCAGTACGTGGCTGCCCATGGC
+CCCTATCTGGCCTGGCTTGAGCAAACCGCGATCAACAGCGCCGTCACCGCCGCACAGCACGTAGCGGCTG
+CCGCTGCCTACTGCAGCGCCCTGGCCGCGATGCCCACCCCAGCAGAGCTGGCCGCCAACCACGCCATTCA
+TGGCGTTCTGATCGCCACCAACTTCTTCGGGATCAACACCGTTCCGATCGCGCTCAACGAAGCCGATTAT
+GTCCGCATGTGGCTGCAAGCCGCCGACACCATGGCCGCCTACCAGGCCGTCGCCGATGCGGCCACGGTGG
+CCGTACCGTCCACCCAACCGGCGCCACCGATCCGCGCGCCCGGCGGCGATGCCGCAGATACCTGGCTAGA
+CGTATTGAGTTCAATTGGTCAGCTCATCCGGGATATCTTGGATTTCATTGCCAACCCGTACAAGTATTTT
+CTGGAGTTTTTCGAGCAATTCGGCTTCAGCCCGGCCGTAACGGTCGTCCTTGCCCTTGTTGCCCTGCAGC
+TGTACGACTTTCTTTGGTATCCCTATTACGCCTCGTACGGCCTGCTCCTGCTTCCGTTCTTCACTCCCAC
+CTTGAGCGCGTTGACCGCCCTAAGCGCGCTGATCCATTTGCTGAACCTGCCCCCGGCTGGACTGCTTCCT
+ATCGCCGCAGCGCTCGGTCCCGGCGACCAATGGGGCGCAAACTTGGCTGTGGCTGTCACGCCGGCCACGG
+CGGCCGTGCCCGGCGGAAGCCCGCCCACCAGCAACCCCGCGCCCGCCGCTCCCAGCTCGAACTCGGTTGG
+CAGCGCTTCGGCTGCACCCGGCATCAGCTATGCCGTGCCAGGCCTGGCGCCACCCGGGGTTAGCTCTGGC
+CCTAAAGCCGGCACCAAATCACCTGACACCGCCGCCGACACCCTTGCAACCGCGGGCGCAGCACGACCGG
+GCCTCGCCCGAGCCCACCGAAGAAAGCGCAGCGAAAGCGGCGTCGGGATACGCGGTTACCGCGACGAATT
+TTTGGACGCGACCGCCACGGTGGACGCCGCTACGGATGTGCCCGCTCCCGCCAACGCGGCTGGCAGTCAA
+GGTGCCGGCACTCTCGGCTTTGCCGGTACCGCACCGACAACCAGCGGCGCCGCGGCCGGAATGGTTCAAC
+TGTCGTCGCACAGCACAAGCACTACAGTCCCGTTGCTGCCCACTACCTGGACAACCGACGCCGAACAATG
+AACAAGGAGAAAAGAACCGATGACGCTTAAGGTCAAAGGCGAGGGACTCGGTGCGCAGGTCACAGGGGTC
+GATCCCAAGAATCTGGACGATATAACCACCGACGAGATCCGGGATATCGTTTACACGAACAAGCTCGTTG
+TGCTAAAAGACGTCCATCCGTCTCCGCGGGAGTTCATCAAACTCGGCAGGATAATTGGACAAATCGTTCC
+GTATTACGAACCCATGTACCATCACGAAGACCACCCGGAGATCTTTGTCTCCTCCACTGAGGAAGGTCAG
+GGGGTCCCAAAAACCGGCGCGTTCTGGCATATCGACTATATGTTTATGCCGGAACCTTTCGCGTTTTCCA
+TGGTGCTGCCGCTGGCGGTGCCTGGACACGACCGCGGGACCTATTTCATCGATCTCGCCAGGGTCTGGCA
+GTCGCTGCCCGCCGCCAAGCGAGACCCGGCCCGCGGAACCGTCAGCACCCACGACCCTCGACGCCACATC
+AAGATCCGACCCAGCGACGTCTACCGGCCCATCGGAGAGGTATGGGACGAGATCAACCGGACCACGCCCC
+CAATAAAGTGGCCTACGGTCATCCGGCACCCAAAGACCGGCCAAGAGATCCTCTACATCTGCGCGACGGG
+CACCACCAAGATCGAGGACAAGGACGGCAATCCGGTTGATCCGGAGGTGCTGCAAGAACTCATGGCCGCG
+ACCGGACAGCTCGATCCTGAGTACCAGTCGCCGTTCATACATACTCAGCACTACCAGGTTGGCGACATCA
+TCTTGTGGGACAACCGGGTTCTCATGCACCGAGCGAAGCACGGCAGCGCCGCGGGCACTCTGACGACCTA
+CCGCCTGACCATGCTTGATGGCCTCAAGACGCCGGGATACGCGGCATGAGCCACACCGACTTGACGCCCT
+GCACACGGGTGCTGGCATCCAGCGGCACGGTTCCGATCGCAGAGGAACTGCTGGCCAGAGTGCTCGAGCC
+CTACTCCTGCAAAGGATGTCGCTACCTCATCGACGCACAGTACAGCGCCACCGAGGATTCGGTTCTTGCC
+TATGGCAACTTCACGATCGGTGAGTCCGCCTATATTCGAAGCACGGGGCACTTCAACGCGGTCGAACTGA
+TTCTGTGTTTCAATCAGCTCGCCTACAGCGCCTTCGCTCCGGCCGTCCTCAACGAGGAAATCCGGGTGCT
+TCGCGGCTGGTCGATCGACGACTACTGCCAACACCAGCTCTCTAGCATGCTGATCAGGAAGGCATCATCG
+CGGTTCAGAAAACCGCTGAACCCGCAAAAGTTCTCTGCCCGCCTCCTGTGTCGAGATCTGCAGGTCATCG
+AACGAACCTGGCGCTATCTCAAGGTCCCGTGCGTCATCGAGTTCTGGGACGAGAACGGCGGGGCGGCGTC
+CGGTGAGATCGAACTAGCGGCCCTCAACATTCCGTAATCCAATGGGAGGAAAGAAGTTTCAAGCTATGCC
+TCAGTTGCCATCTACCGTGCTGGACCGGGTCTTCGAGCAGGCACGGCAGCAGCCGGAAGCAATCGCCTTG
+CGTCGCTGCGACGGCACTAGCGCACTGCGGTACCGTGAACTCGTCGCCGAAGTTGGTGGCCTTGCCGCGG
+ATTTGCGTGCCCAGTCGGTTAGCCGGGGTTCTAGGGTGCTGGTCATTTCCGACAATGGACCCGAGACGTA
+CCTGTCGGTGCTGGCGTGTGCAAAGCTCGGGGCGATCGCCGTCATGGCCGACGGCAATCTTCCGATCGCA
+GCCATCGAACGATTCTGTCAGATCACCGACCCCGCAGCGGCTCTCGTCGCACCAGGGAGCAAGATGGCAT
+CTTCCGCCGTTCCCGAGGCGCTGCACTCGATACCAGTGATCGCGGTCGACATAGCCGCTGTTACACGGGA
+ATCCGAGCATTCCTTGGATGCAGCCAGCCTCGCCGGGAACGCGGACCAGGGGAGCGAGGATCCGCTGGCG
+ATGATCTTCACCAGCGGTACCACGGGCGAGCCCAAGGCTGTGCTACTGGCCAACCGCACCTTCTTCGCCG
+TCCCGGACATCTTGCAAAAAGAGGGTTTGAACTGGGTCACTTGGGTCGTCGGCGAAACCACCTACTCGCC
+GCTGCCGGCGACGCACATCGGTGGACTGTGGTGGATACTTACCTGCCTGATGCACGGCGGGTTGTGTGTC
+ACCGGCGGCGAGAATACGACATCGTTGCTGGAGATTCTCACCACGAACGCGGTGGCGACGACGTGCCTAG
+TGCCAACGCTTCTTTCGAAGTTAGTTTCTGAACTGAAGTCCGCCAACGCGACGGTTCCCTCGCTGCGCCT
+AGTTGGATACGGTGGTTCGCGGGCGATCGCGGCCGATGTGCGGTTTATCGAAGCTACCGGCGTGCGCACC
+GCACAGGTCTACGGATTGAGCGAGACCGGTTGCACGGCTTTGTGTTTGCCGACCGATGACGGCTCGATCG
+TCAAGATCGAAGCAGGTGCTGTTGGCCGTCCGTACCCTGGCGTGGACGTCTATCTTGCCGCTACCGATGG
+CATCGGCCCTACCGCCCCCGGCGCCGGCCCGTCCGCCTCGTTCGGCACGCTATGGATTAAGTCACCGGCC
+AACATGCTGGGCTACTGGAACAATCCCGAACGCACCGCAGAGGTGCTGATTGACGGCTGGGTGAACACCG
+GTGACCTGCTGGAGCGCCGCGAGGACGGCTTCTTCTACATCAAGGGAAGATCCTCGGAGATGATCATCTG
+TGGTGGCGTGAACATTGCGCCCGACGAGGTCGATCGCATCGCGGAGGGCGTGTCGGGCGTCCGCGAGGCC
+GCGTGCTACGAGATTCCTGACGAAGAGTTCGGCGCGCTGGTGGGCCTGGCCGTGGTCGCATCGGCAGAGC
+TTGACGAGTCGGCAGCCCGGGCGCTCAAGCACACGATTGCGGCTCGTTTTCGACGGGAGTCCGAGCCGAT
+GGCGCGGCCGTCGACAATTGTGATCGTCACCGACATTCCACGAACGCAGTCCGGCAAGGTCATGCGGGCC
+TCGCTTGCAGCGGCGGCAACAGCAGACAAGGCCAGAGTGGTCGTTCGTGGCTGAGCCGGTGCGGGACCGA
+ATCCTCGCCGCCGTCTGCGACGTGTTGTATATCGACGAGGCGGATCTCATTGATGGCGACGAAACGGATC
+TCCGCGACCTCGGGCTGGACTCTGTTCGGTTTGTTCTGCTGATGAAGCAGCTAGGCGTGAACCGACAATC
+CGAACTGCCGTCCCGATTGGCCGCGAACCCGTCGATTGCGGGTTGGCTTCGCGAGCTGGAGGCTGTGTGC
+ACCGAGTTCGGTTAAGCCGCTCGCAGCGCAACCTCTACAACGGCGTGCGCCAGGATAACAATCCCGCGTT
+ATATCTGATCGGCAAGAGCTATCGGTTCCGCCGGTTGGAGCTGGCGAGATTCCTGGCCGCTCTGCACGCA
+ACGGTACTGGACAACCCCGTGCAACTTTGCGTCCTGGAGAATTCGGGGGCAGACTATCCGGATCTGGTGC
+CGCGGCTACGGTTCGGCGACATCGTGCGGGTGGGGTCAGCCGATGAGCACCTGCAGAGCACATGGTGTTC
+GGGCATCCTGGGCAAGCCACTGGTGCGGCATACGGTGCACACCGACCCGAACGGGTATGTGACCGGTCTG
+GACGTTCACACCCACCACATCCTGCTGGACGGCGGCGCGACCGGGACGATCGAAGCTGACCTGGCGCGTT
+ACCTGACCACCGACCCGGCGGGCGAAACCCCCAGTGTCGGTGCGGGTCTAGCCAAGCTCAGGGAGGCGCA
+CCGTCGTGAGACGGCCAAGGTGGAAGAATCGCGGGGGCGCCTGTCGGCTGTCGTGCAGCGTGAACTCGCC
+GACGAAGCATACCACGGCGGGCACGGGCACAGCGTTAGCGACGCTCCCGGGACCGCGGCCAAGGGCGTCC
+TGCACGAATCGGCAACGATCTGCGGCAACGCGTTTGATGCCATCCTGACCCTTTCGGAAGCGCAGCGGGT
+CCCGCTTAATGTGCTGGTGGCTGCGGCGGCCGTCGCGGTGGACGCGAGCCTTCGGCAGAACACCGAAACC
+CTCTTGGTGCACACGGTGGACAACCGGTTCGGAGATTCTGATCTGAATGTCGCGACCTGTTTGGTCAATT
+CGGTTGCCCAGACCGTCCGGTTTCCCCCATTTGCGTCGGTGTCCGATGTCGTTCGAACGCTTGACCGCGG
+CTATGTCAAGGCGGTAAGACGCCGGTGGCTTCGTGAGGAGCATTACCGCCGAATGTATTTGGCGATCAAC
+CGGACATCTCACGTGGAGGCGTTGACGCTAAATTTCATTCGCGAGCCATGCGCACCTGGCCTGCGCCCGT
+TCTTGTCGGAGGTCCCGATTGCCACGGATATCGGTCCGGTCGAGGGCATGACGGTGGCGTCTGTTCTGGA
+CGAAGAACAGCGCACACTGAACCTAGCCATCTGGAACCGAGCCGATCTGCCCGCGTGCAAGACACACCCC
+AAGGTCGCGGAACGGATAGCGGCAGCGTTGGAATCGATGGCGGCGATGTGGGATCGGCCGATCGCCATGA
+TCGTCAACGACTGGTTCGGGATCGGCCCGGACGGGACTCGCTGCCAAGGCGATTGGCCAGCCCGTCAGCC
+GTCGACGCCCGCGTGGTTTCTCGATTCCGCAAGGGGCGTCCACCAATTTCTCGGCAGGCGCCGCTTCGTC
+TACCCGTGGGTCGCGTGGTTGGTGCAACGCGGCGCCGCACCGGGTGATGTTCTGGTGTTCACCGACGACG
+ACACCGACAAGACCATTGACCTGCTCATCGCGTGTCACCTTGCGGGTTGCGGGTACAGCGTCTGCGACAC
+CGCTGACGAAATTTCCGTGCGGACCAATGCGATTACCGAGCACGGCGATGGCATCTTGGTGACAGTGGTC
+GACGTGGCCGCCACCCAGCTGGCGGTTGTCGGCCATGACGAGCTGCGGAAGGTCGTTGACGAGCGCGTCA
+CACAGGTGACACACGACGCACTGCTGGCCACCAAGACCGCCTACATCATGCCGACCTCGGGAACTACCGG
+ACAACCCAAGCTGGTGCGAATCTCACACGGCTCGCTCGCGGTTTTCTGTGATGCGATCAGCCGCGCCTAC
+GGTTGGGGAGCCCACGACACCGTTCTGCAGTGCGCTCCGTTGACATCGGACATCAGCGTCGAGGAGATTT
+TCGGTGGCGCGGCCTGTGGCGCGCGACTGGTGCGATCCGCGGCTATGAAAACCGGCGACCTGGCGGCGCT
+GGTTGACGATCTCGTCGCCCGCGAGACGACAATCGTCGACCTGCCGACCGCCGTCTGGCAGCTGTTGTGC
+GCCGACGGCGACGCCATTGACGCGATCGGCCGCTCGCGCCTGCGGCAGATCGTAATCGGCGGTGAAGCCA
+TCCGCTGTAGCGCCGTGGACAAGTGGCTTGAATCGGCTGCTTCACAAGGGATCTCGCTGCTCTCGAGCTA
+TGGTCCAACAGAAGCCACGGTCGTCGCCACCTTCTTGCCGATCGTTTGCGACCAGACCACCATGGACGGC
+GCACTGCTCAGGCTCGGCCGGCCGATCCTACCGAACACGGTGTTCCTCGCGTTCGGTGAAGTCGTCATTG
+TCGGGGATTTAGTCGCCGACGGCTACCTCGGGATCGACGGCGACGGCTTCGGCACCGTGACGGCCGCAGA
+CGGTTCCCGACGCCGTGCCTTTGCCACTGGCGACCGGGTGACCGTCGACGCCGAAGGATTTCCGGTCTTC
+TCCGGACGCAAAGACGCCGTCGTCAAGATCTCCGGCAAGCGTGTCGATATCGCTGAGGTAACCAGGCGCA
+TCGCCGAAGACCCCGCGGTGTCAGATGTCGCCGTCGAGTTGCACAGCGGAAGCCTCGGAGTGTGGTTCAA
+GAGCCAACGGACCCGCGAGGGCGAACAAGACGCTGCCGCGGCGACCCGGATCAGGCTCGTCCTCGTGAGT
+CTGGGAGTGTCGTCGTTTTTCGTTGTCGGCGTGCCGAATATCCCGAGGAAGCCCAACGGGAAGATCGACA
+GCGACAACCTGCCGAGGCTGCCTCAGTGGTCAGCTGCTGGGCTAAACACCGCCGAGACGGGTCAGCGAGC
+GGCCGGCCTCTCGCAGATCTGGAGCCGGCAGCTCGGCCGGGCAATCGGGCCGGACTCGTCGCTGCTTGGT
+GAGGGCATCGGCTCGTTGGATCTCATCAGAATACTGCCCGAGACGCGTAGGTATCTGGGGTGGCGCCTCT
+CGCTGCTGGATCTGATCGGTGCCGATACCGCCGCCAATCTGGCCGATTACGCGCCAACGCCCGACGCGCC
+GACGGGCGAAGATCGGTTTAGGCCGCTGGTGGCCGCGCAACGGCCCGCGGCGATTCCGTTGTCGTTTGCC
+CAGCGGCGACTATGGTTTCTCGACCAGTTACAGCGACCCGCTCCGGTCTACAACATGGCGGTGGCGTTGC
+GGCTGCGCGGGTATCTCGATACCGAGGCGTTGGGCGCGGCGGTCGCCGATGTCGTGGGCCGCCACGAAAG
+CCTACGGACGGTGTTTCCGGCGGTCGACGGGGTCCCTCGGCAGCTGGTCATCGAAGCGCGGCGGGCAGAT
+CTTGGCTGCGACATCGTCGATGCCACCGCATGGCCGGCTGACCGGCTGCAACGGGCCATCGAGGAGGCGG
+CGCGCCACAGCTTCGATTTGGCAACCGAGATACCTTTGCGGACGTGGCTTTTCCGGATCGCCGACGACGA
+ACATGTGCTGGTGGCGGTTGCACACCATATCGCCGCCGACGGCTGGTCGGTGGCTCCGCTGACGGCCGAT
+CTGAGTGCGGCATATGCCAGCCGTTGTGCGGGTCGGGCACCGGACTGGGCGCCATTGCCAGTGCAGTATG
+TCGATTACACGCTGTGGCAGCGGGAAATCCTCGGTGATCTCGACGACAGCGACAGCCCGATCGCCGCGCA
+GCTGGCCTACTGGGAAAATGCGTTGGCCGGTATGCCGGAACGGCTGCGGCTGCCCACCGCTCGGCCCTAT
+CCACCGGTTGCCGATCAGCGCGGCGCCAGTTTGGTGGTGGATTGGCCGGCGTCGGTGCAACAGCAGGTGC
+GTCGGATCGCCCGCCAGCACAACGCGACCAGCTTCATGGTGGTAGCTGCCGGGCTTGCCGTGCTGCTGTC
+GAAACTCAGCGGAAGCCCCGATGTGGCGGTCGGATTTCCCATCGCCGGCCGCAGCGATCCTGCGCTGGAT
+AACTTGGTGGGCTTTTTTGTCAACACCTTGGTGTTGCGGGTCAACCTGGCCGGTGATCCCAGCTTCGCCG
+AACTGCTGGGGCAGGTGCGAGCGCGCAGCCTGGCCGCCTACGAAAATCAAGACGTACCTTTCGAGGTGCT
+CGTTGATCGCCTCAAACCCACTCGAGCCCTGACCCATCACCCGCTGATCCAGGTGATGTTGGCCTGGCAG
+GACAATCCGGTTGGACAGCTGAATTTGGGTGATCTGCAGGCCACCCCGATGCCGATCGACACCCGCACCG
+CCCGCATGGACTTGGTGTTTTCGTTAGCGGAACGCTTCAGCGAGGGTAGCGAACCTGCCGGGATCGGCGG
+AGCGGTGGAATACCGCACCGATGTGTTTGAAGCCCAAGCAATCGACGTGCTTATCGAGCGGTTGCGGAAG
+GTGTTGGTGGCGGTGGCCGCTGCTCCGGAACGGACGGTGTCGTCGATCGATGCGCTGGATGGGACCGAGC
+GTGCCCGGTTGGATGAGTGGGGTAACCGCGCTGTGCTGACTGCGCCCGCGCCCACGCCGGTGTCGATCCC
+GCAGATGTTGGCCGCCCAGGTGGCACGTATCCCCGAAGCGGAGGCGGTGTGTTGCGGGGACGCGTCGATG
+ACGTATCGGGAACTCGACGAGGCGTCCAACCGGTTAGCGCATCGGCTGGCAGGTTGTGGGGCCGGCCCGG
+GCGAGTGTGTGGCGCTGCTGTTCGAGCGGTGCGCGCCGGCGGTCGTGGCGATGGTGGCAGTGCTCAAAAC
+CGGGGCGGCGTATCTGCCGATCGATCCGGCGAATCCTCCGCCGCGGGTGGCGTTCATGCTCGGCGACGCG
+GTGCCCGTGGCCGCGGTCACCACGGCTGGGCTGCGCTCCCGGTTGGCGGGACACGACTTGCCGATCATCG
+ATGTCGTCGATGCTTTAGCGGCATATCCGGGCACGCCCCCACCCATGCCGGCCGCAGTGAACCTCGCCTA
+CATCCTGTACACCTCGGGCACTACCGGCGAGCCCAAAGGCGTGGGGATCACCCATCGCAACGTCACCAGG
+CTGTTCGCATCACTGCCGGCACGCTTGTCGGCGGCGCAGGTGTGGTCGCAGTGTCATTCCTATGGCTTCG
+ACGCCTCGGCGTGGGAGATCTGGGGCGCGTTGCTAGGTGGTGGGCGACTGGTGATCGTGCCCGAGTCGGT
+GGCGGCCTCGCCGAACGACTTTCATGGGCTGCTCGTGGCCGAACACGTCAGCGTGCTGACTCAGACTCCG
+GCTGCGGTGGCAATGTTGCCGACGCAGGGTTTGGAGTCGGTGGCGTTGGTGGTGGCCGGTGAGGCATGTC
+CGGCAGCGCTGGTGGATCGGTGGGCGCCCGGGCGGGTGATGCTAAATGCTTATGGCCCAACCGAGACCAC
+GATCTGTGCGGCGATAAGTGCGCCGTTGCGACCGGGTTCGGGGATGCCGCCGATTGGTGTTCCGGTGTCG
+GGGGCGGCGTTGTTTGTGCTGGATAGCTGGTTGCGCCCGGTACCGGCCGGGGTGGCCGGAGAGTTGTACA
+TTGCCGGTGCGGGCGTCGGTGTTGGGTATTGGCGTCGGGCGGGGCTGACCGCGTCACGGTTTGTGGCCTG
+CCCATTCGGCGGTTCCGGGGCACGCATGTATCGCACCGGGGATCTGGTGTGTTGGCGCGCCGATGGCCAG
+TTGGAGTTCCTGGGGCGCACCGACGATCAGGTCAAGATCCGCGGGTATCGCATCGAGCTCGGCGAGGTTG
+CGACCGCGCTGGCCGAGCTGGCTGGGGTAGGTCAAGCGGTTGTAATCGCCCGTGAAGACCGCCCTGGGGA
+CAAGCGCCTAGTCGGGTATGCCACCGAAATTGCCCCCGGGGCAGTGGACCCGGCCGGGCTGCGGGCGCAA
+CTAGCCCAGCGATTGCCCGGTTACCTGGTGCCAGCCGCGGTGGTAGTGATCGATGCGCTTCCGTTGACGG
+TCAACGGCAAACTTGATCATCGTGCGTTGCCGGCACCGGAATACGGTGATACCAACGGATATCGCGCTCC
+GGCCGGGCCGGTTGAGAAGACCGTGGCCGGCATCTTTGCCCGGGTGCTTGGGCTTGAGCGGGTCGGCGTC
+GACGACTCGTTCTTCGAGCTCGGCGGCGATTCGCTGGCGGCAATGCGGGTTATCGCCGCGATCAACACCA
+CCCTAAACGCCGATCTGCCGGTGCGCGCGTTGCTGCACGCGTCGTCGACGAGAGGTTTAAGCCAGCTGTT
+GGGGCGAGATGCCCGACCGACCAGCGATCCGCGCTTGGTGTCTGTGCACGGCGACAACCCCACCGAGGTG
+CATGCCAGCGACCTCACGCTGGACCGGTTCATCGACGCCGACACGCTGGCCACCGCCGTCAACCTGCCGG
+GCCCGAGCCCCGAGCTACGGACGGTCCTGCTGACGGGCGCGACGGGTTTCCTCGGACGGTATCTGGTCCT
+TGAATTGCTGCGGCGGCTGGACGTCGACGGCAGGCTGATCTGTTTGGTGCGGGCGGAGTCCGACGAGGAT
+GCGCGGCGTCGTCTGGAGAAGACCTTCGATAGCGGTGACCCGGAATTGCTGCGGCACTTCAAGGAGCTTG
+CCGCCGACCGGCTGGAGGTCGTCGCAGGCGACAAGAGCGAACCCGACCTGGGCCTGGACCAACCGATGTG
+GCGGCGGCTGGCCGAAACCGTGGATTTGATTGTCGATTCCGCGGCGATGGTCAACGCGTTTCCCTACCAC
+GAATTGTTCGGGCCCAACGTCGCGGGCACCGCCGAGCTGATCCGAATCGCGCTTACCACCAAGCTCAAAC
+CCTTCACCTACGTGTCAACCGCCGACGTGGGTGCTGCGATCGAGCCGTCGGCGTTCACCGAGGACGCCGA
+CATCCGGGTAATCAGCCCCACCCGCACCGTCGACGGCGGCTGGGCTGGCGGCTACGGCACCAGCAAGTGG
+GCCGGTGAGGTGCTGCTGCGCGAGGCCAACGACCTGTGCGCGCTGCCGGTCGCGGTGTTTCGCTGCGGGA
+TGATCCTGGCCGACACCAGCTATGCCGGACAGCTCAACATGTCGGACTGGGTCACCCGGATGGTGTTGAG
+CTTGATGGCTACCGGCATCGCGCCTCGTTCGTTCTACGAACCGGACTCCGAGGGCAATCGGCAACGCGCG
+CACTTCGACGGGCTGCCAGTCACCTTCGTTGCCGAGGCGATCGCGGTGCTGGGCGCGCGGGTGGCCGGCT
+CATCGTTGGCGGGATTTGCGACCTATCACGTGATGAACCCGCACGACGACGGTATCGGGCTCGATGAGTA
+TGTGGACTGGCTGATTGAGGCCGGCTACCCGATACGCCGCATCGATGACTTTGCGGAGTGGTTGCAGCGG
+TTTGAGGCCAGCCTGGGCGCTCTGCCGGATCGGCAACGCCGGCACTCGGTGCTGCCGATGCTGCTGGCGA
+GCAATTCCCAGCGATTGCAGCCGCTTAAGCCGACCAGGGGGTGCTCCGCGCCGACCGACCGATTCCGTGC
+CGCGGTGCGAGCGGCGAAAGTCGGCTCCGACAAGGACAATCCAGACATCCCGCACGTGTCGGCGCCGACC
+ATCATCAACTACGTCACCAACCTACAACTGCTCGGACTGCTGTAGTTGCTCGGCGATAAAGAGCGCAGCC
+ATGGTCGGGGGAGATCATGTGGTCACTTTCGGGTCGGCATCGATTCTGCGAGCAGAATATGTGGTTGATG
+GCCACTAGGCCGGTACCGGGGAACTGGCGGTTCCCGGCCGATGAGCATCGGCCCTGACGCGCGGCCGTAA
+GCTCCAGGAATGGGGACGCACGGGGCTACCAAGAGTGCGACGTCGGCTGTGCCAACGCCCCGGTCGAACT
+CCATGGCGATGGTACGGCTGGCAATTGGCCTGCTGGGTGTGTGCGCGGTGGTCGCGGCCTTCGGGCTGGT
+GTCGGGAGCGCGCCGCTACGCTGAGGCCGGCAATCCCTATCCGGGCGCCTTCGTCAGCGTCGCCGAGCCG
+GTCGGGTTCTTCGCCGCGTCGCTGGCCGGTGCGCTGTGTCTGGGCGCGCTGATCCACGTGGTCATGACGG
+CCAAACCCGAGCCGGATGGCTTAATCGACGCCGCGGCGTTCCGGATTCACCTGCTGGCAGAACGTGTTTC
+AGGTCTCTGGTTGGGGCTAGCCGCGACCATGGTGGTCATTCAGGCCGCCCACGATACTGGAGTGGGGCCC
+GCGAGACTGCTGGCTAGTGGGGCACTATCGGACTCCGTCGCCGCCTCCGAGATGGCACGCGGGTGGATTG
+TTGCGGCGATCTGCGCGCTGGTGGTTGCGACGGCGCTGCGGCTGTACACTCGCTGGCTCGGGCACGTTGT
+GCTGCTTGTCCCCACTGTGCTTGCCGTCGTCGCCACCGCGGTGACCGGTAACCCGGGACAGGGACCCGAC
+CATGACTACGCGACCAGCGCCGCGATCGTGTTCGCGGTCGCGTTCGCCACCTTGACCGGGCTCAAGATCG
+CTGCGGCGTTGGCGGGAACGACGCCAAGCCGCGCTGTGCTGGTAACGCAGGTCACCTGTGGAGCGCTCGC
+GTTGGCATACGGAGCGATGCTGCTTTATCTCTTCATCCCGGGCTGGGCGGTCGATTCGGATTTTGCCCGC
+CTTGGTCTGCTTGCGGGGGTAATCCTGACGTCGGTGTGGTTGTTTGACTGCTGGCGGCTGTTGGTCAGGC
+CGCCACATGCGGGCCGTCGCCGCGGTGGTGGCTCCGGTGCCGCACTGGCCATGATGGCCGCCATGGCTTC
+GATAGCTGCCATGGCCGTTATGACCGCGCCGCGATTTCTCACCCACGCGTTCACGGCTTGGGATGTCTTC
+CTCGGCTATGAACTGCCGCAACCGCCGACCATAGCCCGGGTGCTCACCGTGTGGCGCTTCGATAGCCTGA
+TCGGAGCCGCTGGTGTGGTTCTCGCGATCGGGTATGCGGCGGGCTTCGCCGCGCTGCGGCGCCGAGGTAA
+CTCTTGGCCGGTGGGCAGATTGATCGCCTGGCTGACTGGTTGCGCCGCACTGGTATTCACCAGCGGCTCC
+GGTGTACGGGCCTATGGTTCGGCGATGTTCAGCGTCCACATGGCCGAACACATGACACTGAACATGTTCA
+TCCCGGTCCTGTTGGTGCTCGGTGGCCCGGTCACGCTGGCGCTGCGGGTGCTGCCGGTAACGGGTGATGG
+ACGGCCGCCGGGGGCTCGCGAATGGCTGACCTGGCTGCTGCACTCCCGGGTGACAACTTTCCTGTCGCAC
+CCGATCACCGCATTCGTCCTCTTTGTGGCCTCGCCCTATATCGTCTATTTCACACCGCTGTTCGATACCT
+TCGTCCGCTATCACTGGGGCCACGAGTTCATGGCGATCCATTTCCTGGTGGTCGGGTACTTGTTCTACTG
+GGCGATCATCGGCATCGACCCAGGGCCGCGCCGACTGCCCTACCCGGGCCGGATCGGGCTGTTGTTCGCG
+GTGATGCCGTTCCACGCCTTCTTCGGGATCGCGCTGATGACGATGTCGTCTACGGTGGGCGCTACGTTCT
+ATCGTTCCGTCAATCTGCCGTGGTTGTCGAGCATCATCGCCGACCAGCATCTCGGCGGTGGAATTGCTTG
+GAGCCTAACGGAATTGCCGGTCATCATGGTCATCGTGGCGCTGGTTACCCAATGGGCGCGCCAAGACCGC
+CGAGTCGCGTCCCGCGAAGACCGGCATGCCGACAGCGACTACGCCGACGACGAGCTGGAAGCCTACAACG
+CGATGCTTCGCGAGTTGTCGCGAATGCGGCGCTGAATGTGCAGATGATTTTGGAAGCGGTTGGCGTATCT
+GCCCGTGCTCGGCTACACCAGGACCGCGGGGCGCTGGCACGCGAACGATCCGGCGAGGAGGTGGGCCAGC
+CGGAGATTCCCTCCACAGGCTGCAGCAGAAGTCCTGGATCTGACCCCGACCTGAACCCTTGTCAGTGCGG
+TCCATCGACGGAAAATTGCTGTTCCGCCATGCTGGGCATGCTATTGAGCGCCAAAATTGCGTAGCCGCAA
+GCTGTTTGACACGACGAAAAATGACGAGAACGCCATGGCGGCACCGGCGATCAAAGGGTTGAGCAGTCCG
+GCGGCGGCAATCGGGATGGCTGCGACGTTGTACCCGAACGCCCAGATCATGTTCATCCGGATCGTCCGCA
+TGGTTGCACGGGCCAGGTCCAGCGCCTGCGGAACAGTATTCAGATCATCGCGCACCAGAATGATGTCGGC
+TGCACCGAGCGCGACGTCGGTGCCACGCCCGATCGCCAACCCCAAGTCGGCACCCACCAACGCGGGACCG
+TCGTTGATGCCGTCACCGACCATGGCGACGGTATGTCCTTCCTCGCGGAGCCGTTGGATCACGTCGACCT
+TGCCTTCGGGCAGCATATCGGCGACAGCGGAGTCGATGCCGACCTGCGCCGCCACCGCGTCGGCGGCGGC
+CCGATTGTCGCCGGTGAGCAGAATCGTCCGCAGCCCGCGGCTGCGTAGCGCAGCGACGGCGGCAGCCGCT
+GAATCCTTGAGGGTGTCGGCGATTGTCAGGGCTGCGCGGACGACACCGTCGACCGACACAAAAACGACAG
+TCTCGCCTCGGGATTCGCCGTCCAGGCGCGCGGACACCAGAGCCGCGTCGTGGCAGGGCGTGGTCCGGGT
+AATCCAGGATGGCTTGCCGACCTCAACGTGATGGCCGCCGACTTCCCCCGATACACCGCAGCCCGCGACG
+GCGACAAACCCGTTGACTGGACCCGGATCCGGCGAAGCGGCAACGATGGCCGCCGCCATCGCATGCTCGG
+AAGCCGATTCGACAGCGGCGGCGAGGCCAAGCACTTCCTCGCGATCTCGCTCGCTGGTGCCTGAACCTGC
+CATTGTTACGGTGCTCACCGCCAGCTGCCCAACCGTCAACGTGCCGGTCTTGTCGAACACCACGGTGTCG
+ATGCTCCGGATGGTTTCCAGTGCCCGGTACCCCTTGATAAAGATCCCTAGCTGCGCTCCCCGTCCGGAAG
+CAACCATCATGGCGGTAGGTGTCGCGAGCCCAAGCGCACACGGGCACGCGATCACCAACACCCCTAGCGT
+GACCGAGAACGCGCGATCCGCGCCTGCGCCGCTGACGAGCCAGGCCGCACCTGCAAGTCCAGCAATGACG
+AAAACCACCGGCACGAACACGCCCGCGATGTGGTCGGCGAGGCGCTGGGCACGCGCCTTCTGCGTCTGGG
+CTTGCTCCACGAGGCGGACCATCGCGGCGAACTGGGTATCGGCCCCTACCGCGGTGGCCTCGATGACCAG
+GCGGCCGTCCATCACGACCGTGCCCCCCACGACCGAGGCCGCCGGATAGGCACGGACCGGCTTGGCCTCA
+CCGGTCATGGCGCTCATATCGATCGCCGCGCTGCCGTCGACAACGACTCCGTCAGCTGCGATGGTTTCCC
+CCGGCCGCGTCACGAAGCGCTGGCGCTTCTTGAGTTCGCTCGCCGGTATCACTAGCTCCGCGCCGTCGGG
+CAGCAGCACCGCCACATTCTTGGCGCCTAGCTCCGCCAGCGCACGCAGCGCGCTGCCGGCCTTGGACTTG
+GCTCGTGCTTCAAAGTAACGACCGGCAAGAACGAAGACGGTCACACCGGCCGCGACCTCGAGGTAGATCG
+AGTCGCTGTTGAGAATGGCCCGCCAGATTCCCGAGCCTTCCCGTGGCGGCTGATCGCCGAAGACGGACGA
+AAGCGACCAGGCGGTGGCGGCCACGATCCCGACCGAGATCAGCGTTTCCATGGATGTCGTCCGGTGGCGC
+GCGTTTCGCAGCGCGACCGAGTGGAAGGGCCATGCGGCCCAGGTCACAACCGGAGCGGCCAGGGCCGTCA
+ATATGTATCCCCAGCCGGGAACCCTGGCGCTGGGGACGATCGCGAACAACGTCGACAGGTCAGCCAGCGG
+CACGAACAACACCGCCGCGACTAGCAGCCGCCGCAGCAGTCTGCGGGCGTGGGCGCCGTCGGGATCCTTT
+GTCCGTTTGTCTAGGACGGTTGTCTCGGTGTGCGGTGCCGCGTGGTATCCGGCTTTCTCGACCACCCCGC
+ACAGCTCATCGGCTGCCATGCCCACGGCATCGATGGTCGCGACGCGGGTTGCGAAGTTGACGGATGCGCG
+TACTCCGGGGATCTTGTTGAGCTTCGTCTCGACGCGGCTGGCACAGGCCGCACATGACATACCCGAAACA
+TCGAGCCGGATCCGCCGCACCGACTGCAGGTCGGCATCTCCCACAACTGGAGCCGCCACGGCCCTCCTCG
+GATCGGCGTATTTGCACCCGTCAGCCTACAAGTCGTAAGCAGGCGGTAATCGGTTCCCTATGGCCCGCTG
+GATGCACTGGCGATGGATTCTTTTGGTCCGATTTCTGCGGTTGGCGTGCTAGGTTTCCGACTGTGACGCC
+CGTCACAACGTTTCCTCTCGTGGACGCGATCCTCGCTGGTCGCGACCGCAACCTTGACGGCGTTATCTTG
+ATCGCCGCCCAACACCTGCTGCAAACAACGCACGCCATGCTGCGTTCGCTATTTCGGGTCGGCCTCGATC
+CGCGCAACGTCGCGGTGATCGGCAAGTGCTATTCCACTCACCCGGGAGTTGTCGACGCGATGCGGGCCGA
+CGGCATCTATGTCGACGATTGCAGCGACGCCTACGCACCCCACGAATCATTCGACACCCAGTACACCCGC
+CACGTAGAATGGTTTTTCGCCGAATCCTGGGCGCGGCTTACGGCCGGGCGTACGGCTCGTGTCGTGCTCC
+TCGACGACGGCGGATCGCTGCTAGCCGTCGCCGGCGCCATGCTCGATGCGAGCGCCGACGTGATCGGAAT
+CGAGCAGACGTCCGCCGGCTACGCCAAAATCGTCGGTTGTGCGCTGGGGTTTCCCGTCATCAACATCGCC
+CGCTCGTCGGCAAAGCTTCTATACGAGTCGCCGATCATCGCCGCACGCGTGACACAGACGGCATTCGAGC
+GCACCGCGGGCATCGACTCAAGCGCAGCGATCCTGATCACCGGCGCGGGCGCAATCGGCACTGCCCTGGC
+CGATGTGCTGCGTCCGCTGCATGACCGGGTGGACGTGTACGACACGCGCTCCGGCTGTATGACGCCCATC
+GATCTTCCGAATGCGATCGGCGGCTATGACGTGATCATCGGTGCCACCGGCGCCACCAGTGTGCCCGCCA
+GCATGCACGAATTGCTGCGCCCCGGCGTATTGCTGATGTCGGCGTCTTCGTCCGATCGCGAGTTCGATGC
+CGTCGCGTTGCGTCGGCGCACGACGCCCAATCCTGACTGCCATGCCGACCTCAGGGTAGCCGACGGCAGT
+GTCGACGCTACCTTGTTGAATTCGGGCTTCCCGGTCAACTTTGACGGTTCGCCCATGTGCGGCGATGCGT
+CGATGGCGCTCACGATGGCGTTGTTGGCGGCCGCGGTGTTGTATGCGTCGGTCGCGGTCGCCGACGAAAT
+GTCATCCGATCATCCGCATCTCGGGCTGATCGACCAGGGCGACATCGTGGCATCGTTTCTGAACATCGAC
+GTCCCGCTCCAAGCTCTCAGCCGGCTACCGTTGCTTTCGATCGATGGGTATCGCCGCCTTCAGGTGCGCT
+CCGGCCATACCTTGTTCCGCCAAGGTGAGCGGGCCGACCACTTCTTTGTCATCGAATCCGGCGAGCTTGA
+GGCGCTCGTCGACGGGAAGGTCATCCTTAGACTCGGTGCCGGAGACCACTTCGGCGAGGCGTGTTTGCTC
+GGTGGCATGCGGCGCATAGCGACGGTGCGGGCATGTGAGCCATCGGTCCTGTGGGAGCTCGACGGCAAGG
+CTTTCGGCGACGCGCTGCATGGGGACGCTGCAATGCGTGAGATCGCCTACGGTGTCGCTCGCACCCGGCT
+CATGCACGCCGGCGCGTCCGAGTCCTTGATGGTGTAACGGTCTTGCATTCGTGGGCTGTCGGCGGATCAC
+GGGATCGTTATGCCGGTTCTTGCGAGTGACATAGGTTGACATACGTATAACCGGTCCCTGCGGTCGAACA
+CGGCTTGACAATTGGACGAATCTCGTTGCGCGCCATCAGTTGTGCTCACAGGATCGCCGCCGTTCGGAGC
+GATGAGCCCGCTTGGCGCGCGAAGTGCGCCGGGGCGGATCCTGCCCGAGCCGCGCGACGACGGCCTCGAT
+GCCCGTCGCGGTCGATGACCTTGATTCCTTGGGCGCTGACCCGCACCTTGATGCGGCGGTCCTCCGACGG
+TAAGTAGTAGGCCTTGAGCTGGATATTGGGCGGCCAACGTCGCCGAGTGCGGCGGTGTGAGTGCGACACA
+GCCTTACCGAAACCCACAGTGCGGCCGGTGATTTGGCAGCGGGCGGACATGGCGAACCTCCTCCCGGACC
+AGCCTGTTGAAAATAGTTTTCGACAACCGTTGCACGGCACGGTAGCGTGGGTGCAGTTTAATGGCAATCA
+TTTTCAATAAGGTTTGGCGATGCGTACTCCGGTGATATTGGTGGCAGGTCAGGATCACACCGACGAGGTG
+ACGGGCGCCTTGTTGCGCCGGACCGGAACGGTGGTCGTGGAGCACCGGTTTGACGGCCATGTGGTGCGAC
+GGATGACTGCCACGCTGAGCCGTGGCGAATTGATCACCACGGAGGACGCTTTGGAGTTCGCCCACGGCTG
+TGTGTCGTGCACAATCCGCGACGACCTGCTGGTGCTGTTACGCAGACTGCACCGCCGAGACAATGTCGGC
+CGGATCGTCGTGCACCTGGCGCCGTGGCTGGAGCCCCAGCCCATCTGCTGGGCGATCGACCACGTGCGGG
+TTTGCGTCGGACACGGATACCCAGACGGACCAGCCGCCCTCGACGTGCGGGTCGCGGCCGTGGTGACCTG
+TGTGGACTGCGTAAGGTGGCTGCCGCAGTCACTCGGCGAGGACGAACTGCCCGACGGGCGCACGGTGGCC
+CAAGTGACGGTCGGTCAGGCCGAGTTCGCCGACCTTCTGGTGCTGACCCACCCGGAACCGGTCGCCGTGG
+CGGTTCTGCGCCGACTGGCCCCTCGAGCGCGAATCACCGGCGGCGTCGACCGCGTCGAGCTGGCGCTGGC
+GCATCTGGACGACAACTCACGGAGGGGTCGTACCGATACCCCGCACACGCCATTGCTGGCGGGCCTGCCT
+CCGTTGGCAGCCGACGGTGAGGTTGCGATCGTGGAATTCAGTGCCCGCCGCCCGTTTCACCCGCAACGTC
+TGCATGCCGCGGTTGACCTGCTGCTCGATGGCGTGGTTCGCACTCGAGGTCGGCTGTGGCTGGCCAACCG
+GCCGGATCAGGTCATGTGGCTCGAATCAGCCGGTGGCGGTCTGCGGGTCGCATCGGCCGGAAAGTGGTTG
+GCGGCGATGGCGGCCTCGGAGGTGGCCTATGTCGACCTGGAGCGGCGGTTGTTCGCCGACCTGATGTGGG
+TCTACCCGTTCGGAGACCGGCACACCGCGATGACGGTACTGGTATGCGGCGCCGATCCGACCGACATCGT
+CAATGCCCTGAACGCGGCGCTGCTCAGCGACGACGAAATGGCATCTCCGCAACGCTGGCAGTCCTACGTC
+GACCCTTTCGGCGACTGGCATGACGACCCGTGCCACGAAATGCCCGATGCGGCTGGGGAATTCTCGGCAC
+ACCGCAACTCAGGAGAATCTCGATGAAACCCCGGTATCCATCCCGACTACCAGCCCGTGGTACAGACGCC
+GACACTACGGCTCAGCGCGCGCTGGATGCTACCGAGGGCGTCGATAGGTTCTATCCACCCGCGTCAGAGT
+CTTCCGCGTCGTCAGGGCGTTCATCAGGTTGCACGACACCGACTGTGCTTGCCAACCACTTCGGTGCCAG
+CGCTGAGACTGCGGTGGCTCCTGCCGTGGCGCTGAAGACGCCCGTCCAGGCGACCGGTCCCAGCGGGGTA
+CACCCGAAAAAGTGGCTGATAACCGGGGTTTGAATGATGCCGACCAACACCCCGGCGCTGCCCAGTGCGG
+TGGCAATGACGAGCGGACTGTGCCGGCGCGTCAGCAGTGTCTGCGCTAGCTGGGTCATCACGAGTGCAGT
+CAAACCCATTGTCGCCGTGCGTCGTTCGGTTCCGGGAGTCCAGCGCCCGATGGCCCAGGCTGCCGTTGCG
+CCGGCGGCGGTGACGACGCCGCGGTTAACGATCTGACGCAGCAATGGCGCGTCCAGCGAGGGCGTAGGCC
+CGATCAGCACCGCACGTCGATGTTCGCGCTGCGCTCGCTCGGCCGCGTCATCGGTTGGGTATTCGGCGTC
+GTCGGGTTCGGCAAACTGCGAGGTGACGGCCACCGCAAGCGCGGGAAACATGTCGGTGAGCAGATTCACC
+AGCAGCAGTTGACGAGTCCCCACCGGCGCCCGCCCGGCCCCGAACGCCGTCCCGATGACGGTGAACAGAA
+CTTCGCCCACATTGCCGCCGACCAGAATCGTCACCGCGTCACGAACACCGGCCCACATGCTGCGGCCCTC
+GACCAGCGCGTCGAGCAGCACGCCCAGGTCATCGTCGGTCAGCACGATATCGGCGGCCCCACGGGCGGCA
+GAGGAACCGCGCCCGCTCACTCCGATGCCCACGTCGGCCATCCGGATGGCCGCGGCGTCGTTGGCGCCGT
+CGCCGACCATCGCGGTCACTCGCCCGCAGCGCTGCAGCGACGCCACAATCTGAACCTTTTGTTCCGGGCT
+GACCCGAGCAAAGACTTGCATGTCGGCGGCGAGTTTGGCATGCGCCTCCTCGTCCAGGACGGCAAGTTCG
+GCACCGGTCACGACTCGCGCGTCCGCCGGTAGTCCCAGCTGGCGGGCGATCGCCCGGGCGGTGATCGGAT
+GGTCGCCGGTGATCAGCACCACGTTGCGCTCGGCGTCCAGCAAGGCTTCGATCAACGGACGCGAGGAAGG
+CCGGGCCGTATCCGCCAATCCGACATAGCCGATCAGCTCGAGATCGTGCGCGACGGCGTCGACAGCGTCG
+GCGTCGGTCTCGTCATCATGGGTGGTCCCGTTGTCCCAGGTGCGCTGCGCGACTGCCAGAACACGCAGGC
+CCTGCTCGGCGAGGTGGCGTACCACGGATTCGGCATGTTCGTGGTCGACGCCCGGGTCGGCGAGTCGGCA
+GCGCGGCAGGATCGTCTCCGGAGCGCCCTTGAGCATCAACATCGGTATCCCGTCGGTGCCCACTCTGCCG
+ATCGCGGCGGCGTAGCCGCGACTGGACTCAAACGGTACTTCGGCCAGCACCACCCACTCCGAATCGCCTT
+GGCTACTAAGCGAACCGGCCAGCGCACTAGCCGCCGCGAGGATCGCCTCATCGGTGGCGTGCGCGTGCCC
+TTCCCCGTTATGGGGCTGCGTGGACGCGCGCGCGGCGGCCCGCAGCACCTCGGCGGAGGGCGCATCGGTG
+GTCTGCGGCAACGGATCCCGTTCGGCTGCGGTGCTGCTCGGTAGCGCGCATACCACCCGCAGGCGGTTCT
+CGGTGAGTGTGCCGGTCTTGTCGAAACATATGGTGTCGACACGGCCGAGCGCCTCGATGGTGCGAGGCGA
+GCGCACCAGCGCCCCACGTGCCGTCAGGCGCTGGGCGGCGGCAAGCTGGGAGAGGGTGGCCACCAACGGT
+AGACCCTCCGGGACCGCGGCCACCGCGATGGCGACGCCGTCGGCCACCGCTTGCCGCAGCGACGCCCGGC
+GCAGCAACGCCAGAGCTGTCACCGCGGCGCCGCCGGCCAACGTCATGGGCAGCACTTTGCTGGTCAGCTC
+GCGCAGCCGGGCCTGGACTCCGGCCGCCGTTTCGACATCGGCGACCGCCGAGATCGCGCGATGTGCGGCG
+GTGCCGACTCCGGTGGCTACCACGATCGCGCGGGCGTGTCCGGCGACGATGGTGCTGCCCTCAAACAGCA
+TGCTGGCCCGGTCGGGGTCGTTGACGGCGACGGGGTCCACCTGCTTGTCCACCGGTAGCGACTCGCCGGT
+AAGAAAGGACTCGTCGACCTCGAGGTCTTCGGCCACCAGCAGGCGCGCATCCGCCGGGACCACCTCCGGC
+GCGGCCAGGTCGATGACATCGCCGACTCGCAGCGACTTCGCCGACACCGTGGCCGTCCGGGTGGCGTGCC
+GGGCCGCCTCCAGTCGACGTCGGGTAGTCGCTACCGCCGGCACCACCACCCGGCGCACCAGCTGGTCCTG
+CTCGGCGAATAGCTCGGCGGCCGCCGCCTCGGCTCGCAATCGTTGTACCCCACCGGTGATCGCGTTGACC
+GTCATCACGCCCGCTACCAGTAGCGCGTCGATATTGCTGCCGACAATCGCCGATGCTGCGGCGCCCACCG
+CCAGGATCGGAGTCAGCGGATCGGCCAGTTCATGGCGGGTGGCCACCGCCAGCTGCGCCAAGGTTCGTGC
+CGGGCCGCGCAGCGGCGCCATCACCGGTTCGTAGGACAGGTCGTCCAGAATGCGCCGCCAGGCCGGGATT
+CCGGGTTCGACGGCCAAGGGTCGGGAGCCGCCGGCTAGCCGCGAGTAGACGATCTCGGGGTCCAGCGCGT
+GCCAGGCGGTCAGCGGTTGCGGGGTGGGGTCGGGCATCCGCAGCACCTTGGCGGCCGACCACATTCCGGA
+CACCAAAGCCGTTGCGGCAGCGGCATTGACCGGATTGAGCCAGCGACGGAAGCTGGCTGGGTTGGTGGTT
+TTGTCCTGCTCACCGGTGACCAACAACAGCCCGGCCAAGGTGGTGCCACCTTGGGCGAGGTGTACCGCGG
+ATTCACTGGCTGCCCGGGCCACCGGAAGCGCTGACAGGATCCGCACCGCCGCGGCCAGATCGGTGCCGGT
+GATTAGGTCGGCAGTCCATGGTGTTGCCCCGCGGGGATCGTCGAGAGCCACACCGACGTCAGCGATGGCC
+AACGCGGCCAACGTATCGGTGGATGCGAAGTCCCGGTGCACCGCGGTGATCAGCAATACCGGTCCGCGAT
+CCGCGCGCAACTCACGCACCAACTTCAGCAACGGCGTGCCAGGCGGATGCGTCGAACCGACGCTGGCCGA
+TAGATCTTCGGTGCCCGCGACATGGCGCAAAACCACCCGCGCTCCGGTTCGGTGCGCGGTCTGCAGCAGC
+GGGATTGCGTATGGGTCGACTTCCCACCCCACGTCGACGCTGCCCACGCATTGGCCATCGACCACCAGGT
+CGGCATGCTCGAGGCCCTGAGCCGGCGTTGCCGACGGCCCTTGAGCCGGAGCCCATCTCAAGCGGGCACC
+GGTAGCCGGCAATTCATCGGGGTCGGGTTCGGGTGCCTGCTCGCCATGGAGCAAGGCGTCGGCGACCTCG
+TAGACGCGGTCGTCGTCCCAGCCGGGTTCGTCTCCCTGTGCATGCAATACGGCGCGGTTGTCACCGCGCA
+GCGCTGCGCCGTCGATAACGACCACCCGCACCCGATCCAGGCGGCGCAACGCGCCGGGGTCGAGGACTAG
+TTGCCCGGTGTTGGCGAGCCCGCGACCCAGCACCGCCGCGAACGCCTGTCGGCCCATGTGCGCGGCACGT
+GGTACTCCGGCCAGGATCGCGCCGGCCGCGTCCTCGGTACCACCGCCGGCCACCAGTGCACTGGCCGCGG
+CGATCAACGAACCGTTTGCGGCCTGGTTGACGTATTGCTCCACCGGCCCGGCCCTTGACCCTTTGGCGGT
+GTCGATCGCGGCGTCGATGGATCCGCCGACCACGACGTGCGAAGCCTCGCCTGCCGCCGCAGCCGCCCAA
+CTGTGTCGCGGCTCCTGCGATTTGGCCCCGGCCGACGAGATGATGGGCACCACCGGAGCCTGCGGCCGTC
+TGGGGGAGGCCAGCGCGGGTTCGCGGTCACGCCATACGCGACGGTGCGCCGCCGCTTCGGAGATTTGCAG
+GCTGCGTTGCACCAGATCGAGCAGCGGTGTGCCCAGGGACTGGGTTAGCCCGTTGGCCGCCGCCGTCGTA
+GCGGCGAGCGCAATATCGGTGCCCACTCGACCCAACCGCGACTCCATAAGCGACACCATTCGCGGTTGAT
+GGTTTATCAGAGCGGCCAGGGCTCTGGTGGTTTGCGGTGCGGCGGGCAGTCGGGCGACCCAGCCGGTGAC
+CGTGGCACCCATCGCTACCAGATCCATTGCCGCAGCGGTCAACGGCACCAGGATCGCCAAGGGGTTACCT
+GGGTCGGCGAATGGTGCCGAGTTCGGCGACGACACCGACCCAGCCAGGAATATGTCGGCAGCCACCGCGG
+AAACCACATCACGTACCTCGTCCACGGCGATGTCGCTATCCACATCAGGTTCAAGTTCGACCACCAGCCG
+ACCCAATGAGCCCTCAACGTGGGCCTCGGCCACGCCTGGGATCCTGCGGACTGGCTCCTCCACCATGGCG
+GCATGCTCGTGCCAGCGAGGGAATGGCAGTAGCGGATCCAGGTCGAAATGCACGCGCCGTCCGCTGCGCC
+AACGCACCGGCGGTGTCATTCCGTCAGGCGATTCGTTGTGGGAACCGCGTACCCCGATTGCGCGACCAGT
+CGTTTGCACCACCGACTGCACCACCGGGCCGGTCAGCTCCAGCACCGGGCTGGCCAGCGTCTGCACCGCC
+GCGGCCGCACTCCCCGGCAAGCGGGCGCCGGCTCGCACTGTCTGTGCTACTCCGTTGGTCACACCACCGA
+GGACAGTGGCCACACCCGGGATCTTCACTGAGTCACCCTTCAACTACCGATACCGCGCCTAATCCTGATG
+GCGTATCAGCGCCATGTCTACCGACTTGCGCATACTTCGCCGGGTGAGGTCGCCGGTGAAGGCAGTCCGG
+ACCCCTTTGGTCTGCGAGCGATGAATGCAGACGCCGTGTCGGATCTAGCTTGAGTACGGGCGGGCCCGTG
+ACGCGCCGGTGGCGGGCACGTGAAACCGACCCAAACGATCCCAACGACGCGGCAACGCCTGGCTAACGGC
+TCACGGATCGAATCAGTGGATGCGGTGGGGTCCGTGAATCAGCCGGCAAGCGGCCAAGCGTTGCATTGTG
+CGGCCGACATTGGGGGGCCGACGAAATCGGCTCACAAAATGCGGTGGTGGGCCCTGCCGACGTGGTAACC
+CGCCGGGAAGGACTTCTCGATGACCTGCAGCTGGTGGTTCACTCTCGACTCCAGCTCGAGCACCACGCAG
+CTGTCACCGACGGTCTTCGACTCAAGGACGATGTACCGCTGACCGCCACCGTTGACATCGGTGATCGGGT
+CACCGGAGTGCAATGTTTCGACGGGCACCAAATCCGGATTTCCGTTTGACTCCACGCGAAACACAGTAAG
+GCAATTAAGCCGACTAGGGAACACTCTGCGTGGGTGCGCCACCTCGACGCGGAGGCACCAGCGGGTTGGC
+CGCGGCGGGCTCGCTCTTGGGTGGTCGCCAGTGATTGTGACCAGCTGCCGGAGCGGGAATGCGTGTTGGA
+CAGCCGAATCCCCGCAATTGGCGCAACGTGCCCCGGAAGCCGCGCTACATTTGGCTCCTAGCCACCAGAC
+AGCTTGCCCGAAAACGGCAGAGGTCCCTGATGTCGCTTTTGATCACATCACCGGCGACGGTGGCTGCGGC
+GGCAACACATCTGGCGGGTATCGGATCGGCGCTCAGCACAGCCAACGCGGCAGCGGCCGCTCCGACGACG
+GCGCTATCGGTCGCGGGTGCCGATGAGGTCTCGGTGCTGATCGCAGCGCTATTCGAGGCGTACGCCCAGG
+AGTATCAGGCGCTGAGTGCCCAGGCACTGGCGTTCCACGACCAGTTCGTGCAGGCGCTCAACATGGGTGC
+GGTTTGCTATGCGGCCGCAGAGACAGCCAACGCAACTCCGCTGCAGGCTCTGCAGACTGTGCAGCAGAAC
+GTCCTCACCGTGGTCAACGCGCCCACCCAGGCATTGCTAGGTCGACCAATCATCGGCAACGGTGCCAACG
+GGTTACCGAACACCGGGCAAGACGGTGGGCCCGGCGGGTTGCTGTTCGGCAACGGTGGCAACGGCGGATC
+CGGCGGGGTGGATCAGGCCGGTGGTAACGGCGGTGCAGCCGGCCTGATCGGTAACGGCGGGTCCGGCGGC
+GTCGGCGGGCCGGGGATAGCTGGCAGTGCGGGCGGGGCGGGCGGCGCCGGTGGGCTGCTGTTCGGCAACG
+GCGGGCCCGGCGGGGCCGGTGGGATTGGCACCACCGGTGACGGTGGGCCTGGCGGTGCCGGCGGTAACGC
+CATCGGTCTGTTTGGCAGCGGAGGTACCGGCGGGATGGGCGGCGTCGGCGGCATGGGCGGTGTCGGCAAC
+GGCGGCAACGCGGGTAACGGCGGCACCGCCGGACTGTTCGGTCACGGCGGGGCCGGCGGTGCCGGGGGCA
+TCGGCAGCGCCGACGGCGGGCTCGGTGGTGGCGGCGGCAATGGCCGGTTCATGGGCAACGGTGGGGTCGG
+CGGTGCCGGCGGCTACGGCGCTAGCGGAGACGGCGGAAACGCCGGCAACGGCGGCTTGGGCGGCGTGTTC
+GGCGATGGCGGGGCCGGTGGTACCGGCGGTCTGGGTGACGTTAACGGCGGGCTTGCCGGTATTGGCGGTA
+ACGCCGGGTTCGTCGGCAACGGCGGAGCCGGCGGCAATGGCCAGCTCGGCAGCGGCGCAGTCTCCTCGGC
+GGGTGGGATGGGCGGCAACGGGGGCTTGGTGTTCGGCAACGGCGGCCCCGGCGGTCTAGGCGGGCCGGGC
+ACGTCGGCCGGCAACGGCGGTATGGGCGGCAACGCTGTCGGACTGTTCGGCCAGGGCGGGGCCGGCGGGG
+CCGGCGGGTCCGGATTCGGGGCCGGTATTCCAGGTGGCAGGGGCGGTGACGGCGGTAGCGGCGGGCTGAT
+CGGCGACGGCGGCACCGGTGGCGGTGCAGGCGCGGGTGACGCTGCTGCATCGGCCGGTGGTAACGGTGGT
+AACGCCCGGTTGATCGGGAACGGCGGTGACGGTGGCCCGGGCATGTTCGGCGGGCCCGGCGGAGCTGGCG
+GCAGCGGCGGCACGATATTCGGCTTCGCCGGAACCCCCGGGCCGAGCTAGGCGTGTTGCATCCCGCCCAA
+CGGCGCAGGCAACAATGGTGCGATGAGTGGCGCCAGCTCATCGGAGTCGCCCACCTGCTATCGCCATCCC
+GGGCGCCGGACCTACGTCCGCTGCACCCGATGTGATCGGTACATCTGTGGCGAATGTATGCGCGTGGGTC
+CCGTCGGCCACCAGTGCGCGGAGTGTGTGCGCGAAGGCGCCCGGGCGGTGCGGCAGCCTCGTACCCCATT
+CGGCGGGCGGCAGCGGTCGGCAACTCCGGTGGTTACATACACGCTGATCTCGCTGAATGCGCTGGTGTTC
+GTCATGCAAGTGACCGTGATGGGTCTGGAACGGCAGCTCGCTTTGTGGCCACCCGCGGTCGCCAGCGGTC
+AGACCTACCGGTTGGTGACCTCGGCGTTCCTGCACTACGGGGCGATGCACCTGCTGTTGAACATGTGGGC
+GCTGTATGTGGTGGGTCCGCCGTTGGAGATGTGGCTGGGCCGGTTGCGGTTCGGCGCGCTGTATGCGGTG
+AGCGCGCTGGGTGGCTCGGTGTTGGTCTATCTGATCGCACCGCTTAATACGGCGACGGCGGGGGCATCGG
+GGGCGGTGTTCGGTCTTTTCGGTGCCACGTTCATGGTGGCCAGGCGGCTCCACCTTGATGTTCGTTGGGT
+CGTCGCGCTCATCGTGATCAACTTGGCTTTCACGTTCCTCGCGCCGGCGATCAGCTGGCAGGGGCACGTC
+GGCGGGCTGGTAACGGGTGCGCTGGTGGCAGCGACCTACGTCTACGCGCCCAGGGAACGTCGGAACTTGA
+TCCAGGCCACAGTGACGATCACCGTTTTGGTTGCGTTCGTCGTGCTGATCGGCTGGCGCACAGTCGATTT
+GCTCGCACTGTTCGGTGGGCGCCTCAACCTGAGCTGAACACATCAAAACCGATAGCCGCTTGTCTTCGCG
+TGTCTTCGGGGAATCCGACGCGGTCACATCTAAACTTGCCACGATCAAGAGGAGGGGCAGCGACGTATCG
+GCAGCAAGCACTGCGCCGGACGACGAAGTGGTCAGGGCGCGCTAACAGCGAGAGCTGAGCCGGGCGGGAT
+TCACTCCGTGCCGGCACGTTCTGTTCCCCGGCCCCGTTGGGTGGCCCCGGTGCGCCGGGTCGGTCGGCTG
+GCCGTATGGGATCGGCCGGAGCGGCGCAGCGGAATTCCAGCGTTAGATGGCCTTCGTGCGATAGCGGTCG
+CGCTGGTACTCGCCAGCCATGGCGGCATCCCCGGTATGGGCGGCGGGTTCATCGGCGTCGACGCCTTCTT
+CGTCTTGAGCGGATTTCTCATCACCTCGCTGCTGCTCGACGAGCTGGGGCGCACCGGTCGTATCGATCTG
+AGCGGGTTCTGGATTCGCCGTGCGCGGCGGCTGCTGCCGGCGCTGGTGCTGATGGTTCTCACCGTGAGCG
+CCGCACGCGCACTATTTCCTGACCAAGCTCTCACCGGGCTACGGAGCGATGCGATCGCCGCGTTCCTATG
+GACGGCGAATTGGCGGTTTGTGGCCCAAAATACCGATTACTTCACCCAGGGCGCTCCACCCTCGCCCCTA
+CAGCACACCTGGTCGTTGGGGGTGGAGGAGCAGTATTACGTTGTCTGGCCACTGTTGCTGATCGGGGCGA
+CGCTACTGTTGGCGGCCCGGGCGAGGCGCCGTTGCAGACGGGCCACGGTGGGCGGGGTTCGGTTCGCCGC
+GTTCCTGATTGCCAGTCTCGGCACGATGGCTTCCGCCACCGCCGCGGTCGCATTTACCTCGGCGGCCACC
+CGCGACCGGATTTACTTCGGCACCGATACCCGTGCGCAGGCGTTGCTGATCGGCTCCGCGGCAGCGGCTC
+TGCTGGTGCGGGATTGGCCATCGCTGAACCGCGGGTGGTGCCTGATCCGGACTCGCTGGGGACGGCGGAT
+TGCCCGTCTGTTGCCGTTCGTCGGGCTGGCTGGGCTGGCGGTGACGACTCACGTCGCAACGGGCAGTGTG
+GGCGAGTTCCGCCATGGTCTGCTGATCGTGGTGGCAGGTGCGGCCGTCATCGTGGTTGCCTCGGTAGCCA
+TGGAGCAGCGCGGAGCGGTGGCCCGCATCCTGGCCTGGCGACCGTTGGTGTGGCTGGGCACCATATCGTA
+CGGCGTCTATCTGTGGCACTGGCCAATCTTTCTGGCGCTCAACGGCCAACGTACGGGCTGGTCGGGCCCG
+GCCCTGTTTGCCGCTAGGTGTGCAGCCACGGTGGTGCTGGCCGGTGCGTCGTGGTGGCTGATCGAGCAAC
+CTATTCGGCGCTGGCGACCGGCACGGGTTCCGCTGTTGCCGCTGGCAGCGGCGACCGTTGCCAGCGCTGC
+CGCCGTGACGATGCTCGTTGTTCCGGTCGGAGCCGGACCGGGGCTACGCGAGATCGGCCTTCCGCCCGGC
+GTTTCGGCGGTCGCCGCGGTCTCGCCGTCGCCGCCGGAAGCGAGTCAGCCCGCGCCCGGGCCACGAGATC
+CCAACCGGCCGTTCACCGTTTCGGTATTCGGTGATTCGATCGGGTGGACTTTGATGCATTACCTGCCGCC
+GACTCCCGGATTCCGGTTCATCGACCACACCGTCATCGGCTGCAGCCTGGTACGCGGCACACCGTATCGG
+TACATCGGTCAAACCCTGGAGCAGAGGGCGGAATGCGACGGCTGGCCGGCCAGATGGTCGGCGCAGGTCA
+ACCGGGACCAACCGGACGTTGCGTTGCTGATCGTCGGCCGCTGGGAGACGGTAGACCGGGTCAATGAGGG
+GCGGTGGACACATATCGGCGACCCGACCTTCGATGCGTACCTCAACGCCGAGCTACAGCGAGCGCTCAGC
+ATCGTTGGATCCACCGGGGTTCGAGTGATGGTCACCACCGTGCCCTACAGCCGCGGCGGCGAAAAGCCGG
+ACGGCCGCTTGTATCCGGAGGATCAACCCGAGCGTGTGAACAAATGGAACGCCATGTTACATAACGCCAT
+TAGCCAACACTCGAACGTCGGAATGATCGACCTCAACAAAAAGCTTTGTCCAGACGGCGTTTACACGGCC
+AAGGTCGACGGCATCAAGGTCCGCAGTGATGGTGTTCATCTCACCCAGGAAGGCGTGAAGTGGCTGATAC
+CGTGGCTTGAGGATTCGGTGCGGGTCGCCAGTTAATCCGCCGTGTGCTCCGGATGAGCGCGACGGTAACC
+CTGGAATTGTGCTGTGTGCTGGCTGTGTCGTTGTGATGAGCCTGTCTAAGTGGTGCGTAACCGTTTGACG
+AGCCGCGGCCTCGCTGCAAACATTGAAGCCCGCACGTCTGGGTTTGTATTTACACAACGAGGGCGCTCCC
+CGATCTGGCGCGCGCAACGAGGTGCGCACTATCCATTCGAGGTGAACTGGACTCCTTGATGCTCAGGCCG
+GTGCGGTTTGTCGAGAAAGGCGAATAGGAACAGTCCATGAAAGTGTGGATCACTGGGGCTGGCGGAATGA
+TGGGGTCACATCTCGCCGAAATGTTGCTGGCCGCCGGACACGATGTGTACGCTACCTACTGCAGGCCGAC
+CATCGATCCGTCGGACCTGCAATTCAACGGAGCAGAAGTCGATATCACCGACTGGTGCTCGGTCTACGAT
+TCGATAGCGACATTCCGCCCCGACGCGGTATTTCATCTCGCGGCCCAAAGCTATCCGGCGGTTTCGTGGG
+CCCGGCCGGTTGAGACGCTGACCACCAACATGGTTGGCACCGCCATCGTTTTCGAAGCACTACGTCGCGT
+GCGACCGCACGCAAAGATTATTGTTGCGGGCTCGTCGGCCGAATATGGATTTGTTGACCCATCCGAGGTT
+CCGATTAATGAGCGGCGAGAACTTCGCCCGCTCCATCCGTATGGTGTTTCTAAGGCGGCCACCGACATGC
+TGGCGTATCAATATCACAAGTCTTACGGCATGCACACCGTCGTCGCTCGTATCTTCAATTGCACCGGGCC
+ACGCAAAGTCGGAGATGCACTTTCCGATTTCGTCCGCCGTTGTACATGGTTGGAGCACCATCCGGAACAA
+AGTGCCATCCGGGTGGGAAATCTTAAGACGAAACGGACTATCGTGGACGTCCGCGATCTCAATCGGGCGT
+TGATGCTGATGCTGGATAAAGGCGAGGCCGGGGCTGACTACAATGTGGGAGGTTCGATCGCCTACGAGAT
+GGGCGACGTTCTCAAACAAGTAATCGCGGCTTGTAAACGTGACGATATCGTGCCGGAAGTCGACCCCGCC
+CTTCTTCGGCCCACCGACGAAAAGATCATCTACGGAGATTGCAGCAAGCTGGCGGCCATAACAGGCTGGC
+AACAAGAAATCTGTTTGACTCAAACGATTGCCGACATGTTCGATTATTGGCGTAGCAAATCCGAGTCCGC
+CCTGATGGTGTGACCGAATGTCTTTGTCCTGCCAACCTGAGGAGCAGATAAGATTGACCGTAACGGACTC
+TCAGTATCGACAAAAGGTGTGCACCGCGAGAACTGCTGAGGAGATCTTTGTAGAGACAATCGCTGTCAAG
+ACACGCATCCTCAATGACCGGGTCTTGCTGGAAGCCGCTCGCGCAATTGGGGACCGCTTGATTGCCGGCT
+ATCGTGCGGGAGCACGCGTCTTCATGTGTGGCAACGGTGGTAGCGCTGCGGATGCGCAACATTTTGCCGC
+GGAGCTAACGGGTCACCTGATCTTTGATCGGCCACCGCTTGGCGCCGAGGCACTCCACGCCAATTCGTCG
+CACCTAACAGCGGTGGCCAACGACTATGACTACGACACCGTTTTTGCCAGGGCCCTCGAAGGATCTGCGC
+GTCCCGGCGACACGCTTTTTGCGATAAGTACCTCCGGCAATTCTATGAGTGTACTGCGGGCCGCGAAAAC
+CGCAAGGGAGTTGGGTGTGACGGTTGTTGCAATGACGGGCGAATCCGGCGGCCAGCTGGCAGAATTCGCA
+GATTTCTTGATCAACGTCCCGTCACGCGACACCGGGCGAATCCAGGAATCTCACATCGTTTTTATTCATG
+CGATCTCCGAACATGTCGAACACGCGCTTTTCGCGCCTCGCCAATAGGAAAGCCGATCCTTACGCGGCCA
+TTCGAAAGATGGTCGCGGAACGTGCGGGACACCAATGGTGTCTCTTCCTCGATAGAGACGGGGTCATCAA
+TCGACAAGTGGTCGGCGACTACGTACGGAACTGGCGGCAGTTTGAATGGTTGCCCGGGGCGGCGCGGGCG
+TTGAAGAAGCTACGGGCATGGGCTCCGTACATCGTTGTCGTGACAAACCAGCAGGGCGTGGGTGCCGGAT
+TGATGAGCGCCGTCGACGTGATGGTGATACATCGGCACCTCCAAATGCAGCTTGCATCCGATGGCGTGCT
+GATAGATGGATTTCAGGTTTGCCCGCACCACCGTTCGCAGCGGTGTGGCTGCCGTAAGCCGAGACCGGGT
+CTGGTCCTCGACTGGCTCAGACGACACCCCGACAGTGAGCCATTGCTGAGCATCGTGGTTGGGGACAGCC
+TCAGCGATCTTGAATTGGCACACAACGTCGCCGCTGCTGCCGGTGCATGTGCCAGTGTCCAGATAGGGGG
+CGCCAGTTCTGGCGGTGTCGCTGACGCGTCATTTGACTCGCTCTGGGAGTTCGCTGTCGCAGTCGGACAT
+GCGCGGGGGGAGCGGGGCTAATGGCGATCTTGCGCGGGCGAGCGCCGTTGCGGCTCGGACTCGGCGGTGG
+CGGGACAGACGTGGAACCGTACTCGAGCCAGTTTGGCGGACGAATTCTTAGCGTAACCATCGACAAATAC
+GCCTACGCGTTCGCGGAGCGCGGAACAGGAGATGAGATCGCCTTTCGCTCGCCGGACCGCGACCGAGCCG
+GCCAGGCCTCGATCGACGATCTGGCGTCTCTCGAAGAAGACTTTACCGTTGCACGTCGCCGTCTACCGGC
+GGGTGATTGCGGAGTTCAACGGTGGTACACCGTTTCCGCTCCAGCTGGCGACGCAGGTGGACGCTCCTCC
+CGGGTCGGGGCTGGGCTCGTCGTCTGCTTTGGTGGTGGCGATGCTTCTCACGACATGTGCGCTCATCGGC
+TCGTCGCCGGGCCCATACGAGCTGGCGCGACTGGCCTGGGAAATCGAACGGGTTGATCTCGGCATGGCCG
+GTGGTTGGCAAGACCACTACGCCGCGGCTTTCGGCGGCTTCAACTTCATGGAGTCCCGCCCCAACGGAGA
+AGTCGTGGTGAATCCGCTTCGGATACGGCGGGAGGTGATCGCCGAACTGGAAGCTTCCCTTCTTCTGTAC
+TTCGGCGGCGTCTCCAGGCTGTCGTCGGAAGTCATCGCCGATCAACAACGCAATGTCGTCGAGCGAGACG
+CGGACGCGCTTGCGGCCACTCACTCGATCTGCGCCGAGGCACTCGAAATGAAGGATCTTCTCGTGGTGGG
+TGACATACCCGGCTTCGCCGATTCACTGCTTCGCGGCTGGCAAGCGAAAAAGCGGACGTCAACCCGAATC
+TCGAACCCCGCAATCGAGCACGCTTACCAGGTCGCGCAGTCCAGCGGCATGGTCGCCGGGAAAGTCTCGG
+GTGCCGGTGGGGGTGGCTTCCTCATGATGATCGTGGACCCGCGTCGCCGTATCGAAGTCGCACGCAGCCT
+CGAACGAGAGTGCGGAGGATCGGTGGCTCCTTGCCTGTTTACCAAAGGCGGAGCGGTGACCTGGCATATC
+CCAGAGTCCACGGCACCCCGTAAGGCGTGGAGTTGCTGATGCCGTGGCTTCAGCGCTCGGAAACGCTGGA
+ATCTTGCTGTGTGCTGGCTGTGTCCTTGCGACGAGCCACTCGACTTGGCGCGTACCGGTTTGACGATCGG
+GGAGCCCAGTGCAAGCATGAGACCCCGCAAGCACCGGGCGCTGACGCCTCTTCGTGAGGTGACTGAGACG
+ACACCCCCGTGTGTCCTGGCCGTGAGGAGGTGAGGGCGAGATGAGTCCGAGCGACAGTCCCGATCCGACA
+TTCGTCTTGTCCCGATCTGGCTCCGGCATTCTTTCTGCCTTCTGAGCTTTCGCGAGTTACTGCGCATGTC
+CGATGTGGCGCAGTTGTGGCGTTCTGAATGACGCACGCTGATCGGGCTTCCTGCAGGAGAAGAACATGAC
+CACGATGATCATGACTTTTGTTGTTCCACAACGTGTTACCCGTGCGACGAAAGGGCGGGCACGGTCGCTG
+CTGCGGGTGAGTCGGCGTCTGACGGACACGTTTCGCGCACCGCTCGCCTGGACCCCGCAGGAGCGGGCCG
+ACCGGTATGTGGCACGTATGCCGATCGCGGTGATTGCGGACTGAGCGGGCGTCGGCGCGTGGCGCGGTTA
+CCCGTTGGACCGGCGCTAGCCCAACCCGCGCGCGCGTGTTGGTACACCGACACGCTGTCTGGGCCCTACA
+ACTGCGCACGCTCGCGGCCAGTGCCGCTAGCCGACCACCTCAATGGGATCACCAACGGTGACGGCGTCGA
+AGTACCATGCCGCGTTGTCCGGGCTGAGGTTGATACAGCCGTGGCTGACGTTGGCGTATCCCTGCGAGTT
+GACCGACCAGGGGGCCGAGTGCACGTACACGCCGCTCCAGGTAACACGAACCGCGTAGTGGGCGGTGAGC
+AGATACCCGTCCGAGGAATTCAGCGGGATGCCGATGGTACGCGAGTCCATCACGACCGTGCGCTCCTTGG
+ACATTGCGTGAAAGCTACCGATTGGTGTCGGGCGGCTGGGCTTGCCTAACGACGCGGGCATGGTGCGGAG
+GACTTCTCCGTTTCTGCTGACCGTGAAGGTATGTGCCGAGATGCTGGCAACCCCGATCAGTGCGTCACCG
+GTCTCGAATCCTTCGGTCAGTTCCTGCACACCCACCGAGACACGGGTGTGAGGTGGCCAATACCGGTGGG
+GCACCCACCGCACGACATTGCTAGCGACCCACTCGAAGTGTCCGGTCGTGTTGTGCGGTGTGCTGATGCG
+GATGGACCGCTCGACGGCGCGGCGATCGGTCACGGGCGTGGTGAATGTCACCACCACCGGGTGCGCCACC
+CCCACCACGGCACCATTAGCCGGCGACACCGACGCAACGCCTGGGATCGGTTGGAGTGGCGGGACCGCGG
+CGGTCGCTATGCTGACTGATTCCGCGGTGAGCATCAGCGTGATCGCGACCACAACGGATAGATAACGAAC
+CACTCGACGCATGGCGTCCACCCTCCCGAGATGGTGCGATCGACACACGACATTCTAGTGACCATCGACC
+CATTGCGGGCCGAGCAAGCAGTTTCTGGATAGCCCCGCCGCCCCGCGGGTGCGGATTGGCAGGCCGCGCG
+GCCTCGCGTTAGCCTCAGCGGAATCGGTGCCAAGGCCGAGGAGGTGCGGGTGCTCTTCCGTCAGCTGGAG
+TACTTCGTCGCGGTCGCCCAGGAGCGGCATTTCGCTCGGGCCGCTGAGAAGTGCTACGTGTCGCAACCTG
+CGCTGTCTTCGGCAATCGCCAAGCTCGAACGCGAACTCAACGTCACCCTGATCAATCGCGGACACAGTTT
+CGAAGGCCTTACTCGCGAGGGTGAGCGGTTGGTGGTATGGGCCAAGCGGATACTTGCCGAGCACGCTGCG
+TTCAAGGCCGAGGTGGATGCGGTGCGGTCCGGGATAACCGGGACGCTTCGGCTAGGCACGGTTCCCACCG
+CGTCAACGACGGCATCCCTGGTGCTGTCGGCGTTTTGCTCGGCGCACCCGTTGGCGAAGGTGCAAGTCTG
+TTCCCGGCTGGCTGCGACCGAGCTGTACCGACGGCTGCGCGAATTCGAGCTCGATGCCGTCATCGTGCAC
+CCCGAGACCCAAGACAGTGATGATGTTGATCTGGTGCCGCTCTATGAGGAGCAGTACGTGCTGTTGTCGC
+CGGCGGATATGCTGCCGCCGGGGACATCGACGTTGGTGTGGCGGGATGCCGCGCAACTACCGTTGGCATT
+GCTCACTGCGGATATGCGGGACCGCCAGGTTATCGACGCCGCGTTCGCCGACCACGCGGTCTCGGCGATC
+CCGCAGGTCGAAACCGATTCCGTTGCTTCGCTGTTCGCACAGGTGGCAACCGGCAACTGGGCGTCCATCG
+TTCCGCACACCTGGCTATGGGCAATGCCAATGAGCGGGCCGACGGGTGGTGAGATCCGCGCGGTCGAATT
+GGTCGATCCGGTGCTGAAAGCCCAGATCGCCCTGGCTACCAACGCCTTGGGACCGGGATCTCCGGTTGCC
+CGAGCGCTCATAACATGCGCGCAGGCGCTGGCGCTGAACGAATTCTTTGACACGCAGCTGCGGGGGATCA
+CCCGTCGCCGCTGATCGCGGGCGTCGCTGCGCTGGTAGTGTTCAGCTTCGCCAGGTGGCCGCTCTCCACC
+CCGTCTGCAGGGTCGAGTTCGCAGTCGATGAGTGACGGTCCGTTCGATGCCAGTGCATCGGTCAGCGCCG
+ACTCCAGTTCGGTTGGGGTGCTTACGTGATATCCTTTGCCGCCGAACGCCTCTGCGATCAGTTCGTGACG
+TGCATGAGCGTTCAGCACGGTGGGCGCTGGGTCGTGTCGCCACACCGGGGCGGCCGACCTAAAGATCGTT
+GCCTCGTCGCCGCGGTAGACGCCGCCGTTGTTGAGGATGACGACGGTGACCGGGAGTCGGTATCGGCAGA
+TGGTCTCGAACTCCATGCCGCTGAAGCCAAATGCGCTGTCGCCCTCGATCGCCACGACAGGTCGCCCGGT
+CTCGACGGCGGCCGCGATGGCGTAGCCCATGCCGATGCCCATCACGCCCCAGGTTCCGCTGTCGAGCCGG
+TGCCGCGGTAGGTGCATGTCGATGATGTTGCGGGCGAGGTCCAGCGCGTTGGCGCCTTCGTTGACCACAT
+AGACATCCGGGTTGCGTTGCAGCACAGACCTAATGGCACCAAGCGCGTTGTAGAACCGCATCGGATGATG
+ATCGTCGGCCAACCGCCGACGCATCTTGGCACTGTTGCGGGCCTTGCGGTCGGCGAGCTCGCCGGTCCAC
+GCCGCCGAGGCCACGCTCGAACGATCGGCCGCAGCTTCGAGGAGCGCCGACATTACCGAGCCGATGTCGC
+CGGTCAGCGGTGCCACGATCGGCCGGTTGCTGTCAAACTCCGACGCCTCGATATCGACCTGGATGAACTT
+GGCATCGGCCGACCATTGCGGCGACTCTCCGTTGCCTAGTAGCCAATTCAGCCGAGCGCCAACCAGCAGC
+ACCACGTCGGCGCGGGCCATCGCCAGCGAACGAGCCGCAGCCGCCGACTGCGGGTGTGAGTCGGGCAGCA
+GCCCCTTGGCCATCGACATCGGCAGGAAGGGAATGCCGGTGTGCTCCACAAACTCCCGAATAACGTTGTC
+GGCCTGCGCATATGCCGCGCCCTTGCCGAGCACGAGCAGCGGTCGCTGCGCTTGGGCGAGCACGTCCAGC
+GCGCGATCAATCGCCTCCGGTGCCGGCAGTAGTCGGGGAGCCGGGTCCACCGGCCGCCAAATGGCGCCGG
+AAGCAGCCGATGCCTCAACGGCCTGGCCCAGCACATCGCCGGGGATATCGAGGTATACACCGCCGGGCCG
+CCCGGAGGTCGCGGTGCGAATGGCGCGCGCGACGCCGCGCCCGATGTCCTGGACTTGGCCGATCCGATAC
+GCCGCCTTCACGAACGGTCGAGCGGCGTTGAGCTGGTCGAGGTCCTGATAGTCGCCGCGCTGCAGGTCGA
+CCATCGGCCGGCTGCTCGATCCGGAGATCTGGATCATCGGGAAGCAGTTCGTGGTGGCGTTCGCCAGCGC
+GGGCAGGCCGTTGAGAAAGCCGGGGCCGGACGTCGTCAGACACACGCCGGGCCGTGCGGTGAGGAACCCC
+GCGGCGGCCGCCGCATTGCCCGCTGATGCTTCGTGGCGGAAACCGATATAGCGGATCCCCGAGGCTTGGG
+CGGCGCGAGCCAGGTCGGTGATCGGGATGCCGACAACGCCGTAGATGGTGTCGACGTCGTTGGCTTTGAG
+GGCGTCCACCACCAGGTGGCAGCCGTCGGTCAGCACTGTGCAGGGAGATGCCGATCGTGTGGTCATGGTG
+TTCACTGTTGTCCGGGGCGCCGGCCGTGTCCAAGACCGAGTCACTATGCAGCGATTTACGCGGTCTATCA
+ACCGTTAGCGGATCGGTATTGGACGCCGGGCAGGCGAGCCCGGCACTGTGCTGATCGTGCCGAACCCGCA
+CACCGAACACATGGAAGGAGCGTTCGCGATGGCATCCGACTTCGGCCCGCGCATCGCCGATCTTGTCGAG
+GTGGCGGCGACCCGGCTGCCCGAGGCTCCGGCGCTCGTCGTCACCGCGGATCGCATCGCGATCAGCCACC
+GCGACCTGGCCCGTCTGGTTGATGAGCTGGCCGGCCAGCTGACGCGGTCCGGCCTGCTGCCCGGTGACCG
+GGTCGCGCTGCGCATGGGCAGCAACGCCGAATTCGTCGTCGCCTTGCTGGCGGCGTCGCGTGCGGATCTC
+GTCGTCGTGCCGCTGGATCCGGCGCTGCCCATCACCGAGCAACGCGTCCGAAGCCAGGCCGCGGGAGCCC
+GGGTGGTGCTGATTGACGCGGATGGGCCGCACGACAGGGCAGAACCCACCACCCGGTGGTGGCCGCTCAC
+GGTGAACGTCGGCGGTGACAGCGGCCCCTCGGGTGGCACCTTGTCGGTCCACCTGGACGCCGCCACCGAG
+CCGAACCCCGCAACCTCGACGCCCGAGGGACTGCGACCCGATGACGCCATGATCATGTTCACCGGCGGGA
+CGACCGGCCTGCCGAAGATGGTCCCCTGGACGCACGCAAACATCGCCAGCTCGGTCCGCGCCATCATCAC
+CGGGTACCGGCTGAGCCCGCGGGACGCCACCGTTGCGGTGATGCCGCTCTACCATGGCCACGGGCTGATC
+GCGTCGTTGCTTGCCACCCTGGCGTCCGGCGGCGCGGTGTCGCTGCCCGCACGCGGGCGATTCTCCGCGC
+ACACCTTCTGGGACGACATCAAAGCCGTTGGAGCCACCTGGTATACGGCGGTTCCGACGATTCACCAAAT
+CCTGCTGGAGCGATCGGCAACCGAACCGTCGGGGCGCAAACCTGCCGCACTGCGTTTCATCCGCAGCTGC
+AGCGCACCGCTCACTGCCCAAGCCGCGCTAGCACTGCAAACCGAGTTCGCGGCACCGGTCGTGTGTGCCT
+TCGGCATGACCGAAGCCACCCACCAGGTAACGACAACGCAGATTGAGGGTATCGACCAAACCGAAACTCC
+CGTCGTGTCAACCGGTCTGGTCGGCCGGTCGACGGGAGCGCAAATCCGGATCGTCGGGTCCGACGGGCTG
+CCACTGCCCGCGGGCGCGGTCGGGGAGATCTGGCTGCGGGGGACCACCGTGGTACGCGGGTATCTGGGTG
+ACCCGACGATAACCGCCGCGAATTTCACCGACGGTTGGTTGCGTACCGGTGATCTCGGGTCCCTGTCGGC
+GGCCGGTGACCTGAGCATCCGCGGCCGCATCAAGGAACTCATCAACCGAGGTGGTGAAAAGATCTCGCCC
+GAGCGCGTCGAGGGCGTGCTGGCCAGCCATCCAAACGTCATGGAGGCAGCCGTATTCGGCGTCCCGCACC
+AGCTCTACGGCGAGGCGGTCGCGGCGGTGATTGTGCCTCGTGAGTCCGCCCCGCCGACTCGCGAGGAGCT
+TGTCCAGTTCTGCCGGGAACGGTTGGCGGCCTTCGAGATCCCGGCCTCCTTCCAGGAGGCCAGCGGGCTG
+CCGCACACCGCGAAGGGTTCGCTCGACCGCCGCGCTGTCGCCGAACGGTTCGGCCATTCGGTGTAGCTAG
+CCGGCCCCGGCCTTTACCCGGGCGGCGGCGGATTCCGGCATCGGTTCGTAGCGGGCAAACGAACGGGTGA
+AGGATGCGGCCCCATGCGCCAGCGAGCGCAAATCGATTGCGTAGCGGGTCAGCTCGACCTGAGGCACCTC
+GGCCTTGATCACCGTGCGGTCGTGCCCCGCGGTCTCGGTGCCGAGCACTCGGCCACGACGACTGGACAGG
+TCGCCCAACACCGCGCCGACGAAATCGTCGGGTACCAGCACCGAAATCTCATCGATTGGCTCGAGCAAGA
+TCACCTTCGTCGCGGCCGCGGCCTCCCGCAATGCGAGCGCGCCGGCCATTTGGAAAGCGAAATCGGAAGA
+GTCGACGCTGTGGGCTTTGCCGTCGAGCAACGTGACCCGGATATCGACCACCGGGTAGCCGGCGTGCACT
+CCCTTATCCATCTGTGCGCGGACACCTTTCTCCACACTGGGGATAAACTGCCGCGGCACCGCCCCGCCAA
+CCACTTTGTCGAGGAACTCGAACCCGGAGCCCTCCGGCAGCGGCTCCACCTCGATGTCGCACACCCCGTA
+CTGACCGTGACCACCGGACTGTTTGATGTGGCGGCCATGGCCTTTCGCATTGCCGGCGAAGGTTTCCCGC
+AGCGGCACCCGCAGCTCGATCGTGTCTACGCTGACGCCGTACCGGTTGGCCAGTGTATCCAGGACGACGC
+CGGCATGGGCCTCGCCCATACACCACAGCACGACCTGATGGGTCTCTTGATTTTGCTCGATCCGCAGTGT
+CGGGTCTTCGGCGGCCAACCGGCCCAACCCGACCGACAGCTTGTCTTCGTCGGTCTTGGCATGCGCCGCA
+ATGGCGATCGGCAGCAGCGGCTCGGGCATGGTCCAGGGTTTCAGCACCAGGGGCTCGGCCTTATCCGAGA
+GTGTGTCCCCGGTCTCGGCCCGGCTCAGCTTGCCGATGGCGCAGATGTCGCCCGCGACCACGGCTGCTGC
+CGGGCGCTGTTGCTTGCCCAGCGGGAACGACAAGACTCCGATGCGCTCGTCTTCGTCGTGGTCGGGGTGC
+GTGTTACTAGTTCCGCCGCCGAAAAACGATGAGAAATGGCCCGACACATGGACCGTCGTGTCGGGCCTGA
+TGGTTCCGGAGAACACCCGCACCAAGCTGACCCGGCCGACGTAGGGGTCCGACGTCGTCTTCACCACCTC
+GGCGAGCAACGGCGCGTCATTGTCACAGGCCAGCTCCGCATGCGGGACACCCTGCGGGGTAAAGACCTCC
+GGCAGTGGGTGCTCCATCGGAGACGGAAATCCGCGGGTGGCTACCTCAAGCAATTCCAGTGTGCCGACCC
+CGGTGCTGCTGCACACCGGAATCACCGGGAAGAACGAGCCTCGGGCGACGGCTTTCTCCAGATCCTGGAT
+CAGCACCGACTCGTCGATCGTCTCGCCGCCGAGGTAGCGCTCCATCAAGGACTCATCCTCGGATTCCTCG
+ATGATTCCTTCGATCAAGGCGCCGCGCGCCTCCTCGATTCGCTCGGTGTCCGACTCGGCCGGGGTTCGTG
+TCGTTCGCTTGCCGTCGGCGTACTCGTACAGTGCCTGCGAAAGCAATCCGATCAGGCCGTCACCGGACGG
+CAGGTAGAGCGGTAAGACCTTGTCGCCGAAGGCGTCTTGTGCCGCGGTCAGCGCTTCCCGGTAGTTCGCC
+CGGGCGTGGTCCAGCTTGGTGATGACCACCGCGCGGGGCATGCCGACCTGGCTGCATTCCTGCCACAGGG
+ACTTGGTCGGTTCGTCGACGCCCTCGTTGGCCGCGATCACGAACAGTGCGCAATCGGCGGCCCGCAACCC
+GGCCACAGCTCACCCACGAAGTCGGCGTACCCAGGGGTGTCGACGAGGTTGACCTTGATGCCGTCGTAAG
+CCAGCGAGGCGACCGCAAGGCCCACCGAGCGCTGTTGCCGGATCTCCGCCTCGTCGAAGTCGCAGACCGT
+GGTGCCCTCGGTGACCGAGCCCGGCCTGGACAACACCTTGGCCGCCACCAGGAGAGCCTCGATGAGGGTG
+GTCTTGCCGCCCCCCGAGGGCCCCACCAGAACCACGTTGCGAACGCCGCCGGGCCCGTTTGCGGTGGGAG
+CGGCGGCCGCGCCCTGGGAAGCATTCACTCTGTCGGCCATGGCTTTCCTCCAGTTCTCCGGGGTCGGTTC
+CCGTGGTGTGGCCAGCAGGACGTAGTAGGCAACTTTTCTCCCAACTGCCGCCCAGCACAAGGGTCGGGTC
+CGGTGAGTAGTAGGCAATCGGAGCCGTCGTTGTGGTCAGGCGTGCCAGCTGGCCCAGCGCTGGACTGCTA
+TTGCGATTACCGGGCCGTTCAACGGAACCGATTGGTATTGAGCATATTTGGCGCGCAGCAGGCGGTATGC
+GGCGCGCATCACCTCGCCATCGCGATGAATCGCGGCGACCCCGTCGGCCCGGACCCACCACAACTGGGTC
+CAATCATCGGCATAGCTGTCGACGAGCACGCTGGCCCGTGGATTGTGCTCGAGATTGGCGAGCCGGCGCA
+GCCGCTGCGTCGTTTTCCGCTTCGCGTCGACGGCGGTGTAGATAACGTCTGCACCGGTCGCCTCGGCCGG
+GCGCCTAGCGCCGAGCGCGAATACGACCGGCACCAGGTGGGGTGTGCCGTCGGGCGTGCTGGTGGCCAGT
+CGTGCGACGGGGGACTGGGCAAACCTGAGCTTTGGGTCGAATTCCCCCACGGCGCCAGCTTATGCTCAGC
+TGCCGCCCAACGTCGCGCAGTCTGGACGGCCAGACGTCGCGGCCGTGACAGCGGACATCTCGGGCAGCCC
+GGTCCATGGGGCGTGCGTGCTAATGGTGCCGGTGGTAATCCAGTGGCGCGCAAGGTAATTGGCCGGGTCG
+GTCTCGGCCGCCGCAGGAATCGGTTGGGTCGGTTTGAACGTGACAGAGACGAACAGAGACCAGTGCTATC
+GCGTCGAACGGACGACCGTTGACGCTTTGACACATCCCGAGTATCGAGTACATACTCGAGGCGTGCAGCG
+GGTCAGGGTCACGAGGAACGCCCGGAAGCACCGCGTGTCCAAGCACCGCATCGTCGCCGCTATGCGCCAC
+TGCGGTGTTCCGGTCATTCAGGAAGATGGCTCGCTGTACTACCAGGGCCGCGATACGTCGGGCCGTCTTA
+CCGAGGTCGTCGCCGTCGAAGCCGACGACGGTGACCTGATCATCACTCACGCAATGCCGAAGGAGTGGAA
+GCGATGACGAAGAAGCCACGTAACCCCGCCGACTACGTGATCGGCGACGATGTCGAGGTGTCTGACGTCG
+ATCTCAAGCAAGAGGAGGTCTATGTCGATGGCGAGCGGCTAACGGACGAGCGCGTCGAGCAGATGGCTTC
+AGAGTCGCTGCGGCTGGCGCGCGAACGAGAAGCCAACCTGATTCCTGGCGGCAAGTCTCTGTCCGGCGGC
+TCTGCGCACTCGCCGGCTGTGCAGGTGGTCGTTTCGAAGGCTACCCACGCCAAGCTCAAGGAGCTGGCGC
+GCAGCCGGAAGATGAGCGTATCTAAGCTGCTGCGTCCCGTGCTCGACGAGTTCGTACAGCGAGAAACGGG
+TCGGATTCTCCCACGGCGTTAGCTTGTGCTCAGCCGCCGCTCGACGTCGCGAAGTCTGGACAGTCAGCTG
+TCGCAGCCGTGACCAGCGGACATCTCGGGCAGCTAGCCCGACAGGGTGCGCGTGCACCTGGCCCGGGTGG
+TAATCCATTGACGCGCACGGCAATTGGCCGGCTCGGTCTCGGTCTGCGGATACCGCACTGAAGGGCGACA
+ATTTTGGCGAAAAGGCCGTGTGCGGTGCCGGGTCGCGCTACGTTCAGATTCACCTAACAATGTCGTCCGC
+CAACGAGCGTGTTCGCCGGTGGTGGGGCGGGCGGGTTGGGGAGGTGTGTGATGTCGTTTGTCAGCGTAGC
+CCCGGAGATTGTGGTGGCCGCGGCAACAGACCTGGCGGGTATCGGATCGGCGATCAGCGCGGCCAATGCC
+GCCGCGGCTGCGCCGACCACCGCCGTGCTGGCCGCGGGTGCCGATGAGGTGTCGGCGGCGATCGCGGCGC
+TGTTTTCCGGCCACGCTCAGGCCTATCAGGCGCTCAGCGCCCAGGCGGCGGCGTTTCATCAGCAGTTCGT
+GCAGACGCTTGCCGGTGGCGCTGGAGCATATGCGGCCGCCGAGGCCCAGGTCGAGCAGCAGCTGCTGGCC
+GCGATCAACGCGCCCACCCAGGCGCTGCTGGGGCGCCCCTTGATCGGCAACGGTGCCGATGGGGCGCCGG
+GGACTGGGCAGGCCGGCGGGGCTGGGGGGATCTTGTACGGCAATGGGGGCAATGGCGGCTCCGGGGCGGC
+TGGGCAGGCCGGGGGTGCCGGCGGGCCGGCCGGGCTGATCGGCCATGGCGGGTCCGGCGGGGCCGGCGGG
+CACGGCGGATGGCTGTGGGGCAACGGCGGCGTCGGCGGATCCGGCGGGGCGGGTGTCGGCGCAGGCGTGG
+CTGGCGGTCACGGCGGTGCGGGCGGTGCCGCCGGGCTGTGGGGCGCCGGCGGCGGCGGTGGCAATGGCGG
+GAACGGCGCCGATGCCAACATCGTCAGCGGTGGAGACGGTGGCCTCGGCGGTGCCGGTGGCGGTGGCGGA
+TGGCTCTACGGCGACGGCGGGGCCGGCGGACACGGCGGACAAGGCGCAATCGGCCTCGGCGGCGGCGCCG
+GCGGCGACGGGGGCCAGGGCGGCGCCGGCCGCGGACTGTGGGGTACTGGCGGCGCCGGCGGACACGGCGG
+GCAAGGCGGTGGTACCGGGGGCCCACCGCTGCCCGGTCAGGCAGGCATGGGCGCCGCGGGTGGCGCCGGT
+GGGCTGATCGGCAACGGCGGGGCCGGCGGCGACGGCGGTGTCGGCGCGTCCGGCGGGGTCGCCGGAGTAG
+GCGGTGCCGGCGGGAACGCCATGCTGATCGGGCACGGCGGCGCCGGCGGCGCCGGCGGAGACAGCAGTTT
+CGCTAATGGCGCGGCCGGCGGCGCGGGCGGTGCCGGAGGGCACCTCTTCGGCAATGGCGGGTCCGGCGGC
+CACGGCGGAGCCGTCACGGCCGGCAACACCGGTATCGGTGGCGCCGGCGGCGTCGGTGGGGACGCCAGGC
+TGATCGGCCACGGTGGCGCCGGCGGTGCCGGCGGGGACCGCGCCGGAGCCTTGGTTGGCCGTGACGGCGG
+GCCCGGTGGGAACGGGGGCGCTGGCGGCCAGCTATACGGCAACGGCGGCGACGGCGGGCCCGGCGGTCAG
+GGCGGTCAGGCGTTCGGCGCTAACAATATCGGCGGCACCGGCGGGGCCGGCGGCAACGGCGGGCCGGCCA
+TCCTGAGTGGCAATGGTGGCAATGGCGGCGCCGGCGGCGCTGGCGGCGCCGGCGGCGCAGGTGGTGGGGC
+CGGTGGGGTCGGCGGTGCCGGCGGCGCCCCCGGCACCGGCGGAACACTGCAGGCGGCGGTGAGCGGATTG
+GTGACGGCTTTGTTCGGTGCACCCGGCCAACCCGGCGACACCGGCCAACCCGGCTAGCCCCGATCAACGA
+GGGTTTCGGTGCCGGTCCGGGGCATGGCCATCCGCTGAGCTGGCGATCTGGACTACGTTGGTGTAGAAAA
+ATCCTGCCGCCCGGACCCTTAAGGCTGGGACAATTTCTGATAGCTACCCCGACACAGGAGGTTACGGGAT
+GAGCAATTCGCGCCGCCGCTCACTCAGGTGGTCATGGTTGCTGAGCGTGCTGGCTGCCGTCGGGCTGGGC
+CTGGCCACGGCGCCGGCCCAGGCGGCCCCGCCGGCCTTGTCGCAGGACCGGTTCGCCGACTTCCCCGCGC
+TGCCCCTCGACCCGTCCGCGATGGTCGCCCAAGTGGGGCCACAGGTGGTCAACATCAACACCAAACTGGG
+CTACAACAACGCCGTGGGCGCCGGGACCGGCATCGTCATCGATCCCAACGGTGTCGTGCTGACCAACAAC
+CACGTGATCGCGGGCGCCACCGACATCAATGCGTTCAGCGTCGGCTCCGGCCAAACCTACGGCGTCGATG
+TGGTCGGGTATGACCGCACCCAGGATGTCGCGGTGCTGCAGCTGCGCGGTGCCGGTGGCCTGCCGTCGGC
+GGCGATCGGTGGCGGCGTCGCGGTTGGTGAGCCCGTCGTCGCGATGGGCAACAGCGGTGGGCAGGGCGGA
+ACGCCCCGTGCGGTGCCTGGCAGGGTGGTCGCGCTCGGCCAAACCGTGCAGGCGTCGGATTCGCTGACCG
+GTGCCGAAGAGACATTGAACGGGTTGATCCAGTTCGATGCCGCGATCCAGCCCGGTGATTCGGGCGGGCC
+CGTCGTCAACGGCCTAGGACAGGTGGTCGGTATGAACACGGCCGCGTCCGATAACTTCCAGCTGTCCCAG
+GGTGGGCAGGGATTCGCCATTCCGATCGGGCAGGCGATGGCGATCGCGGGCCAGATCCGATCGGGTGGGG
+GGTCACCCACCGTTCATATCGGGCCTACCGCCTTCCTCGGCTTGGGTGTTGTCGACAACAACGGCAACGG
+CGCACGAGTCCAACGCGTGGTCGGGAGCGCTCCGGCGGCAAGTCTCGGCATCTCCACCGGCGACGTGATC
+ACCGCGGTCGACGGCGCTCCGATCAACTCGGCCACCGCGATGGCGGACGCGCTTAACGGGCATCATCCCG
+GTGACGTCATCTCGGTGACCTGGCAAACCAAGTCGGGCGGCACGCGTACAGGGAACGTGACATTGGCCGA
+GGGACCCCCGGCCTGATTTCGTCGCGGATACCACCCGCCGGCCGGCCAATTGGATTGGCGCCAGCCGTGA
+TTGCCGCGTGAGCCCCCGAGTTCCGTCTCCCGTGCGCGTGGCATCGTGGAAGCAATGAACGAGGCAGAAC
+ACAGCGTCGAGCACCCTCCCGTGCAGGGCAGTCACGTCGAAGGCGGTGTGGTCGAGCATCCGGATGCCAA
+GGACTTCGGCAGCGCCGCCGCCCTGCCCGCCGATCCGACCTGGTTTAAGCACGCCGTCTTCTACGAGGTG
+CTGGTCCGGGCGTTCTTCGACGCCAGCGCGGACGGTTCCGGCGATCTGCGTGGACTCATCGATCGCCTCG
+ACTACCTGCAGTGGCTTGGCATCGACTGCATCTGGTTGCCGCCGTTCTACGACTCGCCGCTGCGCGACGG
+CGGTTACGACATTCGCGACTTCTACAAGGTGCTGCCCGAATTCGGCACCGTCGACGATTTCGTCGCCCTG
+GTCGACGCCGCTCACCGGCGAGGTATCCGCATCATCACCGACCTGGTGATGAATCACACCTCGGAGTCGC
+ACCCCTGGTTTCAGGAGTCCCGCCGCGACCCAGACGGACCGTACGGTGACTATTACGTGTGGAGCGACAC
+CAGCGAGCGCTACACCGACGCCCGGATCATCTTCGTCGACACCGAAGAGTCGAACTGGTCATTCGATCCT
+GTCCGCCGACAGTTCTACTGGCACCGATTCTTCTCCCACCAACCGGATCTGAACTACGACAACCCCGCCG
+TGCAAGAGGCGATGATCGACGTCATCCGCTTTTGGCTCGGCTTGGGCATCGACGGGTTTCGGTTGGACGC
+GGTGCCCTATCTCTTTGAACGTGAGGGCACCAACTGCGAGAACCTGCCGGAAACACACGCTTTTCTCAAG
+CGAGTCCGCAAGGTGGTGGACGACGAATTCCCCGGCCGGGTGCTGCTAGCCGAAGCCAATCAGTGGCCGG
+GCGATGTCGTCGAATATTTCGGTGATCCCAACACCGGTGGCGACGAGTGCCACATGGCCTTTCACTTCCC
+GCTGATGCCGCGCATCTTCATGGCCGTGCGCCGGGAGTCCCGTTTTCCGATCTCGGAGATCATCGCCCAG
+ACCCCACCAATCCCTGACATGGCGCAATGGGGGATATTTCTGCGCAACCACGACGAGCTGACGTTAGAAA
+TGGTCACCGACGAAGAGCGCGACTACATGTACGCCGAGTACGCCAAGGATCCACGGATGAAGGCGAATGT
+CGGAATCCGTCGTCGGCTTGCGCCGCTGCTCGACAACGACCGCAACCAGATCGAGCTGTTCACCGCGCTG
+CTGCTGTCGCTGCCCGGCTCGCCGGTCCTCTACTACGGCGACGAGATCGGGATGGGCGACGTGATCTGGT
+TGGGTGATCGCGACGGCGTGCGCATCCCGATGCAGTGGACACCGGACCGCAACGCGGGTTTCTCCACCGC
+CAACCCGGGTCGGCTGTACCTGCCGCCCAGCCAGGACCCGGTTTACGGGTATCAGGCCGTCAACGTCGAG
+GCGCAACGCGACACCTCGACGTCGCTGCTCAACTTCACTCGCACCATGCTGGCCGTGCGTCGCCGACACC
+CCGCGTTTGCGGTCGGCGCATTCCAGGAATTGGGCGGGTCCAACCCGTCGGTGCTGGCCTACGTGCGTCA
+GGTGGCCGGCGATGACGGCGACACCGTGCTCTGTGTCAACAACCTGTCGCGATTCCCGCAGCCCATCGAA
+TTGGACTTGCAGCAATGGACCAACTACACGCCGGTCGAGCTGACCGGGCACGTGGAGTTTCCACGCATCG
+GCCAGGTGCCCTATCTGCTGACGCTGCCAGGACACGGGTTCTACTGGTTCCAGTTGACCACACATGAGGT
+GGGGGCACCTCCCACTTGCGGGGGAGAGCGGCGCCTATGACTCGCGCCGGCGACGATGCACAGCGAAGCG
+ATGAGGAGGAGCGGCGCCTATGACTCGCGCCAGCGACGATGCACAGCGAAGCGATGAGGAGGAGCGGCGC
+CTATGACTCGGTCGGACACGCTGGCAACCAAGCTGCCATGGTCCGATTGGCTTCCGCGGCAACGTTGGTA
+TGCCGGACGCAACCGCGAGCTGGCCACGGTCAAGCCGGGCGTAGTCGTCGCCCTGCGACACAACCTCGAC
+CTAGTCCTGGTCGACGTAACCTACACCGACGGTGCAACGGAGCGTTACCAGGTGCTCGTCGGATGGGATT
+TTGAGCCGGCGTCCGAGTACGGCACGAAAGCCGCCATCGGCGTCGCCGACGATCGCACGGGATTCGATGC
+TCTCTACGACGTCGCCGGGCCGCAATTCCTCCTGTCGCTAATCGTCTCGTCCGCCGTCTGTGGCACATCC
+ACCGGCGAAGTAACGTTCACCAGGGAGCCAGACGTCGAGCTGCCCTTTGCCGCGCAGCCGCGGGTATGTG
+ACGCCGAACAGAGCAACACCAGTGTGATCTTCGATCGGCGGGCTATCCTCAAGGTGTTCCGCCGGGTAAG
+CAGCGGGATCAACCCCGACATAGAGCTGAACCGCGTGCTTACCCGTGCCGGTAATCCACATGTGGCCCGC
+CTGCTGGGCGCTTACCAGTTTGGGCGGCCCAATCGTTCGCCAACCGATGCTCTGGCGTACGCCCTGGGCA
+TGGTGACCGAGTATGAGGCGAACGCGGCCGAAGGCTGGGCGATGGCCACCGCCAGCGTGCGGGACCTCTT
+CGCCGAGGGAGACCTCTATGCCCACGAAGTCGGCGGCGATTTCGCCGGTGAATCCTACCGGCTCGGCGAG
+GCGGTCGCCTCGGTGCACGCCACGCTGGCTGACAGCCTCGGAACCGCGCAGGCAACGTTCCCGGTGGACC
+GGATGCTGGCGCGGCTGTCGTCGACGGTGGCGGTGGTGCCCGAACTGCGGGAGTACGCGCCAACGATCGA
+ACAGCAATTCCAGAAGCTCGCGGCGGAGGCAATCACGGTCCAGCGGGTGCACGGTGACCTGCACTTGGGA
+CAGGTGCTGCGTACCCCGGAAAGCTGGCTGTTGATCGACTTTGAAGGCGAGCCGGGCCAGCCGCTGGACG
+AACGGCGAGCGCCGGATTCGCCGCTGCGCGACGTGGCCGGTGTGTTGCGATCGTTCGAGTACGCCGCTTA
+CGGGCCGCTGGTGGACCAGGCCACCGACAAACAACTTGCCGCTCGCGCCCGCGAATGGGTCGAGCGCAAT
+CGCGCCGCCTTCTGCGACGGCTACGCGGTCGCGTCGGGAATCGACCCGCGAGATTCGGCGCTGCTGTTGG
+GCGCCTACGAACTCGACAAGGCGGTTTATGAGACCGGCTATGAGACACGGCACCGGCCGGGTTGGCTTCC
+GATTCCGCTGCGTTCGATCGCCCGCCTGACCGCTAGCTGATACCGGCCGGGGTGTCCGGCTTATTGCTTG
+GCGTGCGTGCGTCCTGGGCGTCTGGAAGCATGCTCGTGTGCAACGAGAGATTTATGACGGTGAGGCGCGG
+CTGTCATGGGTGTTGGCGGCGCTGGCCGGGATACTGGGGGCAACCGCGTTCACCCACTCCGCGGGATACT
+TCGTTACTTTCATGACCGGCAATTCGCAGCGCGCGGTGCTGGGATTGTTTGGGGACGACGCGTGGATGTC
+TGTCACCGCGTCGTTGCTGATTCTATTCTTCGTCGCCGGCGTGGTGATTGCGTCGGTGTGCCGGCGGCAT
+TTCTGGGCGGCGCATCCCCACGGCCCGACCGTGCTGACCACCTTCAGTTTGATATTTGCCGCCGGAGTCG
+ACATTATGCTGGGCGGCTGGCACGAGAGCATGCTCGATTTTGTGCCGATTCTGTTCGTGGTCTTCGGGAT
+TGGCGCCTTGAACACATCGTTCGTCAAGGATGGCGAGGTATCGGTTCCGTTGAGCTATGTGACCGGCACA
+TTGGTCAAGATGGGCCAGGGCATCGAACGTCACCTGGCCGGCGGAAAAGTGGAGGACTGGCTCGGCTACT
+TCCTGCTGCACGCCAGCTTCGTGCTAGGCGCCGCGGCCGGTGGCGCCATTAGTATGGTCGTCACCGGACC
+CCAGATGCTCGCGGTCGCGGCGGTAGTGTGCGCTGCGACAACCGGCTATACCTACCTGCACGCTGACCGG
+CGAGGGTTGGTCAATCAAAAGCGGCCCCAGCCGGGAAAGCGGCTCTTTCGAGCGCTCAGGCGAGGCGAAT
+TAGATTCGGGAACCTCCACGCCCGCAACCAATTACGGGTCGAGTTAGCTTGGCTTCCAGTGGCGCTGGCG
+AAGGGGTGACCACGCCAACTTCACCCGGAAGGTCCGACCCAGTGCGGATGTTCCACACATCGGCAGCAGC
+GCTGGCCGTTGCGCTGCTGCCGATGCTGGCTTGCTGGCTCAGGCGGCCGGCGCAGCAGGGGCGGCCGGGG
+GTGTCGCGCCGTTGAGCACATGCTGGATATCGGCCTTCATGGCGACCAGCTGCTCGTTCCAGTAGGGCCA
+CGAGTGTGTTCCGTTGGGCGGGAAGTTAAACACCCCGTTGCGTCCACCGTCGGCCGCGTAGGTGTCCCGG
+AAGGTCTGGTTGGTGCGCAGGGTGAGGCCTTCCAGGAACTTCGCCGGTATGTTGTCGCCGCCGAGGTCGC
+TGGGTGTGCCGTTACCGCAGTACACCCAGATCCGGGTGTTGTTGGCGACCAGGCGGGGAATCTGAACCAT
+TGGGTCGTTGCGCTTCCAGGCCGGGTCGCTGGACGGACCCCACATGCTGTTGGCGTTGTAACCGCCCGAG
+TCGTTCATCGCCAGGCCGATCAGCGTCGGCCACCAGCCCTCGGACGGGTTGAGGAAGCCCGACAACGACG
+CGGCGTACGGGAACTGCTGCGGGTAGTACGCGGCCAGGATCAGCGCGGAACCGCCCGACATCGAAAGACC
+CACCGCCGCGTTGCCTGTCGGGGACACGCCCTTGTTGGCCTGTAGCCAGGCGGGCATCTCTCTGGTAAGG
+AAGGTCTCCCACTTGTAGGTGTAGTTCTGGCCGTTGCTCTGCGAGGGCTGATACCAGTCGGTGTAGAAAC
+TGGATTGGCCGCCCACGGGCATGATCACCGACAACCCTGACTGGTAGTACTCCTCGAAGGCCGGGGTGTT
+GATGTCCCAGCCGTTGTAGTCATCCTGGGCCCGCAGACCGTCGAGCAGGTAGACCGCGTGCGGTCCGCCG
+CCCTGGAACTGGACCTTGATGTCGCGGCCCATCGACGCGGATGGCACCTGCAGATATTCCACTGGAAGAC
+CGGGCCTAGAGAATGCGCCCGCGGTGGCCGGCCCGCCGAAGGTACCGACCAGACCGTAAACCAGGACAGC
+CCCCATAGCCGCGATAGCCAGCCGGCGCGGCAGGGTTGTCGCTGCGCTCCGCAACCTTCGCACCTGTTCG
+AAGAACGTCATAGCTACTACCAATCCCAACTCTCATCTGCCGCACGACGCGGTCGAATCTGTTCTGGGCG
+AGTGAAACACACCGAGGACGCTCAGTTCGAATGTCGTGGCCGCAGCGCGAGATCGCGGTTGGCTAACGAT
+TCAGCGTCGGCCCGGACACCTTGGGCGATTGACACACCCGGGTCACGGCTGGCTCCCGAGCGGCGCAACG
+ACCGCACGCACAACCCCTATGCTTACTGCCGACCAGAGGAGAGACCCATGCGCACCTTCGAGTCGGTCGC
+CGACCTGGCCGCCGCCGCGGGCGAAAAGGTCGGGCAGAGCGACTGGGTGACCATCACCCAGGAAGAGGTC
+AATCTGTTCGCCGACGCAACGGGTGATCACCAGTGGATCCACGTCGACCCGGAACGGGCCGCTGCGGGTC
+CCTTTGGCACCACCATCGCGCACGGATTCATGACCCTGGCGTTGCTCCCGCGCCTGCAACACCAGATGTA
+CACCGTCAAGGGCGTCAAGCTGGCAATCAACTACGGCCTGAACAAGGTTCGCTTCCCGGCACCAGTACCC
+GTCGGCTCGCGGGTGCGTGCGACGAGCTCGCTGGTCGGTGTCGAGGATCTGGGCAACGGCACCGTGCAGG
+CGACGGTGTCGACGACCGTCGAGGTCGAGGGATCGGCCAAGCCGGCGTGTGTGGCCGAAAGCATCGTGCG
+CTACGTCGCCTGAGGCAACTCGCGGTCAGAATTCGGCGATCGCGTGCTCGAGGCGTTGGGCCAGCCAGGC
+CTCGGCGTGCGCGCGCCGGGTCGGAATGTGCTGTGACGGGAAAAGCGTTGTCACCGGCTGGTATTCGCGC
+AGCGTACGGCGGGCGACGGTCATCTTGTGCAGCTCAGTGGCGCCGTCGGCGATGCCCAGTGACTCGGCTG
+CCAGCATCATCTTGACGAACGGCATCTCGTCGGAGACCCCGAGCGCGCCGTGCAGGTGCATGGCCCGCTG
+CACGACGTCATGCAGCACCTGGGGCATCGCCACCTTGACCGCCGCGATGTCGCGGCGCACCTTTTGATAG
+TCGTGGTGTTTGTCGATAAGCCACGCGGTGCGCAGTACCAGCAGCCGGAACTGCTCGATCTGGATCCAAC
+TATCGGCGATCTTCTCCTGGGTCATCTGCAGATCGGCGAGCCGCCCGTGTCTAGTCTGGCGCGACAGGGC
+ACGCTCGCACATCATGTCGAATGCTCTGCGCGCCAGCGCGATTGTCCGCATCGCGTGATGTATTCGGCCG
+CCGCCCAATCGGGTCTGCGCGATCATGAACGCTTGGCCCTCGCCGCCGAGCACATGATCGGCCGGCACCC
+GGACGTCGTGGTAGCGGATGTAGCCGTGGCTGGCGTGCCGGGTGGACTCGGCTCCCACACCGACGTTGCG
+CACGATCTCGATGCCCGGGGTGTCGGCCGGGACGATGAACAGCGACATCTTCTCGTACGTACGGGCTTCC
+GGCTTGGTGACGGCCATGACGATAAAGAACGACGCATGCTTGGCGTTGGTGGAAAACCACTTCTCGCCGT
+TGATGATCCAGTCCCCGTTTCCCGCGGCATCGCGGGTCGCCGCGGTCACAAACAGCCCGGGATCGGAACC
+ACCCTGCGGCTCGGTCATCGAATAGCAGGAGGTGATCTCGCCGTCGAGCAGCGGTCGTAGATAGCGGGCT
+TTCTGCTCGTCGGTGCCGAACAGCGCCAGGATCTCGGCGTTGCCGGAGTCCGGCGCCTGACAGCCGAACG
+CCGACGGCGCCCACCGGGAGCGGCCGATGATCTCGTTGAGCAGCGCCAGCTTGACCTGACCGAAGCCCTG
+TCCGCCGAGTTCGGGACGCAAATGCGCGGCCCACAACCCCTGGTCTTTCACCTGCCGCTGCAGCGGCCGC
+AGGATCGCCATCGTGTCGGCGTTCTTTTTGTCGTAAGGATCGAGGGCGACCAGATCGAGCGGTTCGAGTT
+CCTCGGCCATGAATTTTTCGACCCAATCCAGCTTGGACTGGTATTGCGGGTCGGTTTCGAAGTCCCACAC
+CGTCGGCAACCGTTCCCCGGCGCGGCGTCGCACCGGCATCGTTGATAGAGCAAGACCATCGTAGGTGCGG
+TCTAGCGGCTTCAGCGCAGTTCGGGCAGGACGTTGGTGCGGTAGAAGTCGATGGCGGTGATCGGGTCGTC
+CTGGGGGAAATGCAGGAAGGGGACGGCGCCGGCGTCGAGAACCGCTTGCACCGCACCGATGTGGACGCCG
+GGATCGGTACCGACCGCCCAATTGGCCAGCACTTTCTCGATCGGGTTCGACTCGGCGGCACGCTGGATCT
+CGACCGGATTGGGCTGGTCGACGGCCCCGGCGGTGAATCGCCACAAGTCGGCGGCGCGGGCGGCCGCCTT
+GTCGTCGCCGACGACGGCGAACAGTTCGGCCCGCTTACCCAGGGTGGTGGGATCTCGTCCGGCCGCTTGA
+GCGCCCGCGGCGAACGCGGCGAGCAGCTTGGCGTCGTTGATGTCGCGGGCTTGGGCGATCCAACCATCAC
+CGTATCGGCCGGCCAGGGTGGCGCTCTGGGGGCCGCTCGCGGCGACAAAGATCGGCGGCGGCATCGCCGG
+CGTGTCGTAGAGCTTGAGCTCGTCGGTCCGAAAATAGTGGCCCGTGAACGAGATCCGCTCACCGCTCCAC
+AGCTGGCGGATCAGTACGATGGCCTCGATCAGCCGGTCGTGGCGCTCGCGGTAGTTGCCGAACGTGTCGG
+TGGCGGCTTGTTCGTTGAGCCGCTTGCCGGTGCCCAGCCCCAGAAACACCCGTCCGGGGTTCAGGATCGC
+CAGCGAGGCAAACGCCTGAGCGACGGTGGCCGGATGGTAGCGGTATATGGGACAGGTCACCCCGGTGCCG
+AACAAGATGCTGCTGGTGCTGTTGCCCACCAACGCCAGGGTCAGCCAGGGAAACATCGAATGGCCCTCGT
+TGTCTTGCCATGGCTGTAGGTGGTCGCTGGCCCACACATACCGGAAGCCAGCTTGCTCGGCGGCTTGGGC
+GTGCGCCACCAGCCGATCGGTGCGGAATTGTTCGTGGGATAAGACGACACCCACCCCGCGGCTTGCCGGC
+TCTGGGGTCGGCGTCGGACCGCTGCGCGTGCTGCAACCGCCGCCTAGCCCACCGGCGCCGATCGCGCCGA
+ACCCGGCGGCCAGACCGAACGTCCGCCGTGAGATGCCGGTCATCGGGCTGCACTACCCGCGTCGCGCTGC
+AGCACACCTTCGAGAGTGCATCCTGACTCACCGTCGGCGCCACCGGTTAGCCTGGCGAGATGACCCCGCA
+GGCACGCCCAGCGCGCAGGGCCGATGTCCGCGAGCTGTCCCGCACCATGGCCCGGGCGTTCTATGACGAT
+CCGTTCATGAGCTGGTTACTGTCGAACGACAACGCCCGCACCGCAAGGCTGACCCGGTTGTTCGCGACGA
+TTGTCCGCCACCAGCATCTGGCCGGCGGTGGTGTGGAAGTGGCCCGCGGCGCGGCGGGCATCGGCGGGGC
+GGCGCTGTGGGATCCCCCGGATCGATGGCGGGAGTCGCGCCGCCAGCAACTGGCGATGACACCGGGGTTC
+CTGCGGGTGTTCGGCTTTCGGACGGCCAAGGCCCGCGCGGCGCTGGACGTGATGATGCGTGTGCATCCCG
+AAGAACCCCACTGGTATCTGGCCGCCATCGGCAGCGACCCGACGGTCCGCGGCCAGGGGTTCGGTCAGGT
+GCTGATGCGGTCACGGCTGGACCGTTGCGATGCCGAACACTGTCCGGCCTACCTCGAATCCACCAAACCC
+GAGAATGTGCCCTACTATCAACGGTTCGGTTTCCGGGTGACCCGTGAGATCGCTCTGCCCGACGCGGGGC
+CGCCGCTATGGGCGATGTGGCGGGAGCCTCGGTAGCGGTTCTTGGCAGCTGGATCGTTCGTCCGGCCGGG
+TGATCACTGCGCGACCGTGAATCTGGCGACGCCGCACCGGCGTGTCGCGTCGCCAGACTCACAGTCGCGG
+CAATCTCTGACCGCCGGTGCGCTGAGATAGCTCCCGAGGTGCAAAAGTGGTGCGCAGATCGTCAGGCTGA
+GCTTGCCGGGATCGCGTGGGTCGGCACCCGCAGCCGTCGTCTGCCACCCAATAGTGTGTGCGACCCGCCC
+GGTACACGCGGAATCAACGGGTATGCGGTTCTGGCATAGGCTTGTCAGGCAATGATCGCTCTGCCCGCCT
+TGGAAGGTGTCGAACATCGGCACGTGGATGTGGCGGAAGGCGTCAGGATCCACGTTGCGGACGCCGGGCC
+GGCCGATGGTCCGGCGGTAATGCTGGTGCACGGCTTCCCGCAGAACTGGTGGGAGTGGCGCGACCTCATC
+GGCCCGCTGGCCGCCGACGGCAACCGGGTGCTGTGTCCCGACCTGCGCGGCGCGGGCTGGAGTTCGGCGC
+CCCGCTCGCGGTATACCAAGACCGAGATGGCTGACGATCTGGCTGCGGTTTTGGACGGCCTGGGTGTGGC
+CAAGGTCAAGCTGGTGGCCCACGATTGGGGTGGGCCGGTCGCGTTCATCATGATGTTGCGCCATCCCGAG
+AAGGTGACCGGGTTTTCGGCGTGAACACCGTGGCACCCTGGGTGAAGCGCGATCTTGGCATGCTCCGCAA
+TATGTGGCGGTTCTGGTATCAGATCCCCATGTCGCTGCCGGTGATCGGCCCCGCGGGTGATCAGCGATCC
+TAAGGGCCGCTACTTCCGGCTGTTGACCAGGTGGGTCGGGGGCGGATTTCGGGTTCCCGGTGACGACGTG
+CGCCTGTACTTGGACTGCATGCGCGAGCCGGGGCACGCCGAGGCCGGATCGCGGTGGTATCGCACCTTTC
+AGACCAGGGAAATGCTGCGCTGGCTGCGCGGCGAGTACAACGACGCTCGGGTCGATGTCCCGGTCCGATG
+GCTGCACGGCACCGAGATCCGGTGATCACGCCCGACCTGCTGGACGGCTATGCCGAGCGGGCCAGCGATT
+TCGAGGTGGAGCTGGTCGACGGCGTGGGCCATTGGATCGTCGAGCAGCGACCCGAGCTGGTGCTCGACCG
+GGTGCGTGCGTTCCTAGCTGCGGGGACCGAGCAGCGCGATTGACGCATCCACCGCCGGCTCGACGATGTT
+CCGGATCGGCTGGCCGTCCTCGACGGTCAGCGCGGTCAGTTCACGCAAACCGCCCAGCAAGATTACGGCC
+AGTGGCACATTCAGTGGCGGTAGGTTAGCCCGCCGGAACCCAGGGCTGGCGCTGAGCTCGATCAGCAGGC
+TGGTTAGCTGCTCCATGCCGCGGCGCTGGACGGGGTAAGCGGCGGCACCGAGCGACGGGAATTCACGGAT
+CCAACTCAACGTCACCGCCGGCCTGGATTCGATATGGGTGACGTAGGCCTCGACCGCCTGACGAATCTGG
+TCGTGCCAGTCGGCGTTTGGATCGACGGCCGCCCGGATGCTGTTGCCCAACGTCTCGTTGTCCGCTAGCA
+GGAGTTCCAAAAAGCACTGTTCCTTGCTGGTGAACCGGTCGTAGAACGTGCGCTTGGATGTGCGGGCGTG
+CCGGACGATGTCGGAGACGGTGGTGGCGCGATAACCCCGCTCACCGATCGAGGCGACCAGGCCGTCGAGC
+AACCGTAGCCGAAACGAGTCGGTCTCGACGACCAACGCGCCGGCGGCGACTGCTGTCACCCGCGCCTCCT
+CTACCTATCCCTTGTCAGGTTTGGTACCAAAGAGTACCGTACTGGACAAGCCACGGTACACCACCGTACC
+ACGCCCGATCCAGGGACGTTAGGAGCAACACCGCCATGAGCGAAGTCGTCACCGCCGCACCGGCACCGCC
+CGTAGTCCGACTTCCCCCGGCGGTCCGCGGGCCGAAGTTGTTCCAGGGATTGGCCTTCGTGGTGTCACGG
+CGACGGCTGCTGGGGCGGTTCGTGCGTCGCTACGGCAAGGCCTTCACCGCCAATATCCTGATGTACGGCC
+GGGTCGTGGTGGTCGCCGACCCGCAGCTAGCCAGGCAGGTCTTCACCAGCAGTCCTGAGGAGCTGGGCAA
+CATCCAGCCCAACCTGAGTCGGATGTTCGGTTCCGGCTCGGTGTTCGCGCTGGACGGCGACGACCACCGG
+CGGCGGCGCCGGCTACTGGCGCCGCCTTTCCACGGCAAGAGCATGAAGAACTACGAGACCATCATCGAAG
+AGGAGACCCTGCGCGAGACCGCCAATTGGCCGCAAGGACAGGCTTTCGCAACGCTGCCGTCAATGATGCA
+TATCACGCTCAACGCCATCCTGCGTGCGATCTTCGGGGCCGGCGGCAGTGAACTAGACGAGCTGCGCCGC
+CTCATTCCGCCGTGGGTCACGCTGGGCTCGCGCCTGGCGGCGCTACCGAAACCCAAACGCGACTATGGCC
+GCCTTAGCCCGTGGGGCCGGCTGGCCGAGTGGCGGCGCCAGTACGACACTGTCATCGACAAGCTCATCGA
+AGCCGAGCGGGCCGACCCGAACTTCGCCGATCGGACCGACGTATTGGCGTTGATGCTGCGCAGCACTTAC
+GACGACGGTTCCATCATGTCGCGCAAGGACATTGGCGACGAGCTGCTCACGCTGCTGGCCGCCGGGCACG
+AAACCACGGCGGCGACACTGGGCTGGGCGTTCGAGCGGCTCAGCCGGCACCCCGACGTGCTCGCGGCTCT
+GGTCGAGGAGGTCGACAACGGCGGTCACGAGCTGCGTCAAGCGGCGATCCTGGAGGTACAGCGGGCCAGG
+ACCGTCATCGATTTTGCGGCTCGTCGCGTCAATCCACCCGTTTACCAGCTCGGCGAGTGGGTGATTCCCC
+GCGGGTATTCGATCATTATCAATATCGCCCAGATACATGGCGATCCCGACGTCTTCCCGCAGCCGGATCG
+CTTCGACCCGCAGCGCTACATCGGAAGTAAGCCATCCCCGTTTGCGTGGATCCCTTTTGGTGGCGGGACC
+CGCCGCTGTGTCGGGGCCGCATTCGCCAACATGGAGATGGATGTGGTGCTGCGAACGGTGCTGCGCCACT
+TCACCCTCGAGACCACCACGGCCGCGGGCGAGCGCAGCCACGGTCGAGGAGTTGCATTCACCCCGAAGGA
+TGGCGGTCGGGTGGTGATGCGCCGACGCTGACGGCCAGCTCGGGCCCGCGTTCAGGTCCCGAGTTCGGGT
+GAAAGGCTGGCCCGCAGTGCAGATTCGGCGGTCCGTCGGGGTAGCCTCCAGCCGGGCCGGACGAAGTGGC
+ACGTGTACCCGTTGGGGTAGCGCTGCAGGTAGTCCTGGTGCTCGGGTTCGGCTTCCCAGAAATCCCCGGC
+CGGGCTGACCTCGGTCACCACCTTGCCGGGCCACAGGCCGGATGCCTCGACATCGGCGATGGTGTCCAGC
+GCGATCCGCTTTTGCTGCTCATCGAAGTAGAAGATGGCCGACCGGTAGCTGGTCCCCCGGTCGTTACCTT
+GCCGGTCTTTGGTTGTCGGGTCGTGGATCTGGAAGAAGAATTCCAGCAGGGTGCGGTAATCGGTGACCGT
+GGGGTCGAAGATGATTTCGACGGCTTCGGCGTGCGTGCCGTGGTTACGGTAGGTTGCGTTGGGGATGTTC
+CCGCCGCTGTAGCCCACCCGCGTGGAGACCACACCGGGCTGGTTGCGGATCAGATCCTGCAGCCCCCAAA
+AGCAGCCGCCGGCGAGGATCGCTTTCTGATTGCTCGTCATTTCCGGACCTCCCGATCAGGCTACACTCCG
+GCGATGGAGTGTAACGGCGCGAAGACCGCACTGTGAGCGCTTCGGAGTTCTCCCGTGCTGAACTCGCCGC
+CGCCTTCGAGAAGTTCGAGAAGACCGTGGCCCGCGCCGCCGCGACGCGCGACTGGGATTGCTGGGTGCAG
+CACTACACCCCCGACGTCGAATACATCGAGCACGCGGCGGGCATCATGCGAGGCCGCCAGCGGGTACGTG
+CCTGGATTCAAGAAACGATGACGACCTTCCCGGGCAGTCACATGGTGGCCTTCCCGTCGCTGTGGTCGGT
+GATCGACGAGTCCACCGGGCGAATTATCTGCGAATTGGGCAACCCCATGCTCGACCCCGGCGACGGCAGC
+GTGATCAGCGCGACGAACATTTCGATCATCACCTATGCCGGCAATGGCCAGTGGTGCCGTCAAGAAGACA
+TCTACAACCCGTTGCGGTTCCTGCGGGCGGCGATGAAGTGGTGTCGCAAGGCGCAGGAGTTGGGCACCCT
+CGACGAGGACGCGGCGCGTTGGATGCGCCGGCATGGAGGTCCTTAAATGAACGCACCCAAGCTGGTCATT
+GGCGCGAACGGCTTCCTGGGTTCGCACGTGACTCGCCAGCTCGTCGCCGACTGCGCGCCGCAGAAAGGTG
+AGGTACGCGCGATGGTGCGACCCGCTGCCAACACCCGGAGCATCGACGATCTACCGCTCACCCGATTCCA
+CGGCGACGTCTTCGACACCGCCACCGTGGCCGAGGCGATGGCCGGCTGCGACGACGTCTACTACTGTGTG
+GTCGACACCCGCGCCTGGTTGCGCGATCCCTCCCCGCTGTTTCGCACCAATGTGGCAGGCCTGCGCAACG
+TCCTCGATGTGGCCACAGACGCCAGCCTGCGCAGGTTCGTCTTCACCAGCAGTTATGCGACGGTGGGTCG
+TCGGCGTGGACACGTGGCGACCGAAGAAGACCGGGTGGATACCCGCAAGGTGACTCCTTACGTGCGGTCC
+CGGGTGGCGGCCGAGGATCTGGTGCTGCAATACGCGCACGACGCAGGTCTGCCCGCCGTCGCGATGTGTG
+TGTCGACAACCTACGGCGGCGGCGACTGGGGCCGCACCCCACACGGCGCCTTCATCGCGGGCGCGGTGTT
+CGGCAGGCTGCCTTTCACGATGCGCGGCATCCGGCTGGAGGCGGTGGGTGTCGACGATGCTGCGAGGGCG
+CTGATCTTGGCGGCCGAACGCGGGCACAACGGCGAACGGTACCTCATCTCCGAACGCATGATGCCGTTGC
+AAGAAGTGGTGCGGATCGCCGCGGATGAGGCCGGTGTCCCGCCGCCACGATGGTCGATCTCGGTGCCGGT
+GCTTTACGCCCTGGGTGCGTTGGGCAGTTTGCGAGCCCGACTCACGGGCAAAGATACCGAACTCAGCCTG
+GCGTCGGTGCGCATGATGCGTTCCGAGGCCGATGTCGACCACGGCAAGGCCGTCCGCGAGTTGGGTTGGC
+AGCCACGTCCGGTGGAGGAGTCGATCCGGGAGGCCGCCCGGTTCTGGGCGGCGATGCGCACCGTCGGGAA
+GGACCCCGCGGCCTCGTGATCCGAAAAGGCCTAGGGACGCTGCCGGGAATGTTGATCGCCGGCACGTGTT
+GCACAGGTCATGAGCAACCGGATTGTGTTAGAACCCAGCGCCGATCACCCGATCACCATCGAGCCGACCA
+ACCGACGGGTGCAGGTACGCGTCAATGGCGAGGTGGTCGCGGACACGGCCGCGGCGCTGTGCTTGCAGGA
+AGCCAGTTACCCTGCAGTGCAATATATTCCGTTGGCCGACGTGGTACAGGATAGGCTGATCCGCACCGAG
+ACCAGCACCTATTGCCCGTTCAAGGGTGAAGCCAGCTATTACAGCGTGACTACCGACGCCGGCGACATCG
+TCGACGACGTGATGTGGACGTACGAAAACCCTTATCCGGCGGTAGCGGCGATCGCGGGGCATGTCGCGTG
+CTATCCGGACAAAGCCGAAATCAGCATCTTCCCGGGGTAGCGCAGGCTACCGGGTATACCTCGGCCAACG
+ACTGGGTGTCGCTGTATTCGCGCAGCGAGATGATCATCCCGTCACGGGTCTCGAAGATGCAGACGAACGG
+GCTGTCATATCGGGTCCGGTCGGCGCTCACACCGTCGCAATGCCCCTCGACCACTACCGTTTCACCCTCG
+TTGACGCAGCGGATGAGTTCGATGTTGACCTCGAAGACCTGCTTGCGCCGCTCGACTGCTCGCCGAAACG
+TCTTCTTGTCCAATTCCGTACGGGTGACGATGCTCCAGTAGGTGAAGTCGTTGCTGAGCAGCGCGAAGCC
+TTCGTCGAGATCTCCGCCCTCGCAGAGGCTTTGCAGGAACATCCAGGCCAGTTCGGCTTGCGGGTCGTCG
+AACGGCGTCATCACATCGCCATCTTGTCTCGGGAGACAGCGTGCGGTCAATTGACGTGGTCGTCGAAGCG
+GTGGTCACCTTCGCGGGGGCGGCCGGCTTCGCGCACACCTTGGCGCCGTTGCGTCGCGGTCAGCAGGATC
+CATGCTTTCGGGTCCCCGGTGACGGCACTATCTGGCGGACCAGCTTGCTGCCCACCGGGCCGGTCACCGC
+GCGGATCAGCCGTGCTGGGCGCGACGCCGCCCGTTGCGTGGCGTGGGGCAGCGGTGCCGAGGAGTTTGTC
+GACATGGCGCCCGCCATGCTGGGCGCCGCCGACGACGCCAGCGATTTCGTGCCGCTGCATCCGGCCGTGG
+CCGCCGCGCACCGCCGGCTGCCGAACTTGCGCCTGGGCCGCACCGGCCAGGTGCTGGAAGCCTTGATCCC
+GGCGGTCATCGAGCAGCGGGTACCCGGCGCCGACGCGTTTCGGTCGTGGCGGCTGTTGGTGTCCAAGTAC
+GGAACGCAGGCCCCCGGTCCGGCGCCACCCGGCATGCGGGTGCCGCCGTCGGCCGAGGTGTGGCGTCACA
+TCCCGTCCTGGGAGTTTCATCGCGCCAATGTCGACCCGGGGCGGGCTCGCGCGGTGGTGGGTTGCGCGCA
+GCGGGCGGCGTCGCTGGAGCGGCTGGTGTCGCTGCCCGCGGCTCGGGCGGCGGAGGCGCTGACATCGTTG
+CCTGGAGTCGGGGTATGGACCGCGGCCGAGACCACACAACGCGTGTTCGGTGACGCCGACGCCGTGTCGG
+TCGGCGACTACCACATTCCGAAGATGATCGGCTGGACGCTTGTGGGCCGGCCGGTCGACGACGCCGGCAT
+GCTCGAGCTGCTGGAGCCGATGCGCCCGCATCGCCACCGGGTGGTCCGCTTGCTCGAAGCCAGCGGCTTG
+GCGCGTGAGCCGCGCCGCGGGCCCCGGCTGCCGGTACAGAACATCCGGGCGCTGTAGGGGAGTTTGACGG
+GGATCTTGCTCGGTCCGGCGCCCCGATTCCCGCCAGATCGGCTGCCGGCGCCGCTAAGCCGTTGTCGGCC
+GATCACTGCCTCCGCGTTCGGCCTCGGCGGTCTGCCGGTTCAGTCGCTGCGTCTCGTAGATGGTGACGTT
+GGTGCGAGACAACAACAGTGCCGCGATACCGACGGCGATGATCGCTCCAGGCACCACCGAGAACGAGCCG
+GTCATCTCAGCGACCATGATCATGACGGCCAGCGGCGCGCGGGAGACACTGCCGAAGCACGCCATCATTG
+CGACCACGACGAAGATGCCCGGCTCGTGGGGCACCCCGGGCAGCTCGGTGAGCTCGCCTAGCCGCCAGAT
+CGCCGCTCCGACGAAGGCGCCGATCACGATTCCCGGCCCGAATAGCCCGCCTGATCCGCCGGTGCCGATC
+GACAGCGACGTCGCGAGGATCTTGGCGATCGGCAAGACGATGACGATCCACAACGGGATGCTCAGCAGCG
+TCCCCCGATCGGCGGCTAGCTGCGCCCAGCCATAGCCGCTGCTCAGGATCTGGGGAATCGGCAGACCTAA
+CAGCCCGACCAGCAGTCCGCCGATCGCCGGTTTGAGCACCGGGCCCCCGGGCAGCCGGCGCGTAATTGCC
+ACCGACGCGTGAAAGACTCGGGCATACAAGTAGCCTACGGCGGCTGCGATCAGCCCGATCACCACGAACC
+ACAGTAGTGGCCACGCCTTTTCGAAGCGATACTCGGCGTCGATGTAGCCGAACAGCGGGTCGAAGCCCAA
+GAAGGCGCCGAGCACGGCGTAGGCGGTTCCCGAGGCGATGAAACCCGGCAGCAGGTTGCGGTAGTCGAAG
+TCGTCGCGGTAGGGGATCGAGGCGCCCAACGCCGCTCCGCCCAGTGGCGCAGCGAAGATGGCGCCGATGC
+CGGCGCCGATACCCAGCGCTACCGCGGTCCGGCCGTCTTCGTTGGACAGGTTCAGCCGGCGGGTCAGCAG
+TGAGCAGAAGCCGGCCGAGATCTGCGCGGTCGGGCCTTCGCGGCCGCCTGAACCGCCCGAGCCGATGGTC
+AAGGCGCTGGCCACCATCTTCACCAGCACCGCCCGACCTCGGATGGCGCGCGGATCGCCGTGCACCGACT
+CGATCGCTTCGTCGGTGCCGTGACCGGTGGCCTCCGGGGCGAGCTTGGCCACGATCAATGCCGACAGCAC
+CGCCCCGCCCGTCGTCACCAGCGGAATCGCCCACGGACGCGCGAAACCGGTGGACCCGCGGTGGCCGCCC
+TCCCCAACGGGAGTGGGAATCTGATAGTCCGCGAGGTAGCCGAGCAGAAACTCGCTGGTGTATTTCAGCG
+CGAGGTAGAAGACGACGGCGCCCAGGCCGGCAATGACACCGATCGTGATGCCTAGCAGGAACCATTTGCG
+CAGGTAGCCCGCGCTCCTGATCGATACGCCGAGTCGTCCGCCGGCGGCCTCGTTCCCGATGTCTTCCGCC
+TCCGGCATGGTCGGGAGGTTAGCAGCATGCCAAGCGAACACCGACCAGTCGCCCGGCGCCATCCCAGAGT
+TGGCCAGCGCTATCCGACGATCAGCAGCGCAACCATGGCCCAGGTCTGGACGTACGCGATCACCGCCGCT
+GTGCGGCGAGGAGATCCGAAACGGTGCCGCACTCTTGGACCCCGACCTCTGTCATGACGCCGCCGCTCGT
+CGTGGCCGCGTTCAGGCCGGTCGGCCATTACCGACTCGCAACGGACAGAGCCGGTGGGCCCTGCTCGCCC
+CCGGCGACCGGAGCCAAGCTGACAAGTTCCGTAGCATCCCGCCCAACGGTAGGTACCAAGCCGCAGTGGT
+GGCACACTTTAGTGATGTCAATGTCGCTCACGGCCGGTCGCGGCCCGGGACGTCCCCCGGCGGCGAAAGC
+AGATGAGACTCGGAAGCGTATTCTGCACGCCGCCCGTCAAGTGTTCAGCGAACGTGGTTATGACGGCGCG
+ACTTTTCAGGAGATCGCCGTCCGCGCCGACCTGACCCGACCGGCGATCAACCACTACTTCGCCAACAAGC
+GGGTGCTCTACCAAGAGGTGGTGGAGCAAACCCACGAACTCGTCATTGTGGCCGGCATCGAACGGGCACG
+CCGCGAGCCGACCTTGATGGGGCGGCTGGCGGTCGTCGTTGACTTCGCGATGGAGGCCGATGCCCAGTAT
+CCCGCCTCGACCGCGTTCCTGGCCACCACCGTGCTCGAATCCCAGCGGCATCCAGAATTGAGTCGGACCG
+AAAACGATGCGGTGCGCGCAACCCGAGAATTCCTGGTTTGGGCTGTCAATGATGCGATCGAACGCGGTGA
+ACTAGCCGCCGACGTCGATGTCTCTTCGTTGGCCGAGACGCTGTTGGTCGTGTTGTGTGGCGTGGGCTTC
+TATATCGGTTTTGTCGGGAGCTATCAGCGGATGGCGACCATCACCGATTCGTTCCAGCAGCTGTTGGCCG
+GCACGCTCTGGCGGCCTCCGACCTGACCGAGACCTAACCGGCGGCCCCGAAGCGTAGTGATGTGCCACAC
+AAATCGTATAGGTTACCTAACTTACTTAGGTAGCATGGCATGCCGTGACCGAACTCGACGACGTGTCCTC
+GTTACCATCCTCGCGACGGACCGCTGGCGATACCTGGGCGATCACCGAAAGCGTTGGCGCCACCGCGTTG
+GGGGTCGCGGCGGCACGTGCCGTGGAAACGGCCGCGACCAATCCGCTGATCCGTGACGAGTTCGCCAAGG
+TGTTGGTGTCGTCGGCGGGTACCGCCTGGGCACGGCTGGCCGACGCCGATTTGGCCTGGCTCGACGGTGA
+TCAGCTCGGCCGACGCGTGCATCGGGTTGCCTGCGACTACCAGGCGGTGCGCACCCACTTCTTCGACGAG
+TACTTCGGTGCCGCCGTCGACGCAGGTGTCCGGCAGGTGGTGATCCTCGCTGCCGGACTGGACGCTCGGG
+CCTACCGCCTGAACTGGCCGGCGGGCACTGTGGTTTACGAGATCGACCAGCCTTCGGTGTTGGAGTACAA
+GGCGGGGATTCTTCAATCGCATGGCGCGGTTCCAACGGCGAGACGGCATGCCGTCGCGGTGGACCTGCGC
+GACGACTGGCCGGCCGCGCTGATAGCTGCCGGATTCGATGGCACCCAACCGACTGCCTGGCTAGCCGAGG
+GCTTGCTACCCTACCTGCCCGGCGACGCCGCGGACCGGCTATTCGACATGGTCACCGCGCTCAGCGCACC
+GGGCAGCCAGGTCGCTGTCGAGGCTTTCACCATGAACACAAAGGGCAACACGCAGCGCTGGAATCGGATG
+CGCGAGCGACTCGGTTTAGACATCGATGTCCAGGCGTTGACCTACCACGAGCCCGACCGGTCGGATGCCG
+CGCAATGGCTGGCCACGCATGGCTGGCAGGTGCACAGCGTGAGCAATCGCGAGGAGATGGCCCGACTGGG
+CCGGGCGATCCCGCAAGACCTGGTCGACGAGACCGTCCGCACCACGTTGCTGCGAGGGCGTCTGGTCACA
+CCCGCTCAACCGGCGTGACACCGGCATCACGAGAACCAGAGGGAGCACAGGATGAGCGCCATGCGCACCC
+ATGACGACACCTGGGATATCAAGACCAGCGTCGGCGCCACCGCAGTGATGGTGGCTGCTGCCCGGGCCGT
+CGAAACCGACCGGCCCGACCCGCTGATCCGCGATCCCTACGCCAGACTGCTCGTCACCAACGCCGGGGCC
+GGCGCCATTTGGGAAGCCATGCTCGACCCAACACTGGTAGCCAAGGCGGCTGCCATCGATGCCGAAACCG
+CGGCCATCGTCGCCTATCTGCGCAGCTACCAAGCGGTGCGGACCAACTTCTTCGATACCTACTTCGCCAG
+CGCTGTCGCCGCCGGAATCCGGCAGGTAGTGATTCTGGCGTCCGGACTGGATTCCCGCGCCTATCGCCTG
+GACTGGCCCGCCGGAACCATCGTGTATGAGATCGATCAACCCAAGGTGCTTTCCTACAAGTCCACGACGC
+TGGCGGAAAACGGGGTAACGCCGTCGGCTGGTCGCCGTGAGGTGCCCGCCGACCTGCGCCAGGACTGGCC
+CGCCGCGCTGCGTGATGCCGGGTTTGACCCGACGGCACGCACGGCGTGGTTGGCCGAGGGGCTGTTGATG
+TACCTACCGGCCGAGGCCCAGGACCGGCTGTTCACCCAGGTCGGCGCCGTGAGCGTGGCGGGCAGCCGGA
+TCGCGGCCGAGACTGCGCCGGTGCACGGCGAAGAGCGGCGAGCAGAAATGAGGGCACGGTTCAAGAAAGT
+GGCCGATGTGCTCGGTATCGAGCAGACCATCGACGTGCAGGAACTGGTCTACCACGACCAGGATCGGGCG
+TCCGTTGCCGACTGGCTCACCGATCACGGTTGGCGGGCCCGATCCCAACGTGCGCCCGACGAGATGCGCC
+GCGTGGGTCGCTGGGTTGAGGGGGTGCCGATGGCGGACGACCCGACTGCGTTCGCCGAGTTTGTCACCGC
+AGAGCGGTTGTAGCGAGCGCATCCGACTGACCTTATATATCCGGATATATGGCTGGATCTTTTCTATTGC
+TGGTTCAACCGGGTGACTAGGATCGCGGTTATCACCGATGAGTGACCGCGTCAAGGCGGTCGCGCCGCCG
+GACGGAAGGACGATGATGACCACCGAATCGGTTGCCCGGAAGACCCAGAAATCTGAGACCGAGGCTCCGC
+GCGAACCGGCGCCCGTTTCGGATGAAAAGCAAACCGATGTCGCTAAAACGGTGGCTCGGCTGCGAAAGAC
+CTTTGCCAGCGGGCGTACCCGCAGCGTCGAGTGGCGCAAGCAGCAGTTGCGCGCGCTACAGAAGTTGATG
+GACGAGAACGAGGACGCGATCGCCGCGGCACTCGCCGAGGATCTGGATCGCAATCCGTTCGAGGCATACC
+TCGCTGACATCGCGACGACCTCCGCCGAAGCGAAATACGCGGCCAAGCGGGTGCGCAGGTGGATGCGGCG
+CCGCTACCTGCTGCTCGAGGTGCCGCAGCTGCCCGGCCGCGGCTGGGTGGAGTACGAGCCATATGGCACC
+GTGCTAATCATCGGTGCCTGGAACTACCCGTTCTACCTGACCCTGGGTCCGGCGGTCGGAGCCATTGCCG
+CTGGAAACGCCGTCGTGCTCAAACCGTCGGAAATCGCCGCTGCATCGGCGCACTTGATGACCGAATTGGT
+GTATCGCTATCTCGACACCGAAGCGATCGCGGTCGTGCAGGGCGATGGTGCGGTGAGTCAGGAGCTGATC
+GCTCAGGGTTTCGACCGCGTGATGTTCACCGGTGGCACCGAGATCGGCCGCAAGGTCTACGAAGGCGCCG
+CGCCGCACCTGACCCCGGTCACCCTCGAGCTCGGCGGCAAGAGCCCGGTGATCGTCGCGGCCGATGCCGA
+TGTAGATGTCGCGGCCAAGCGGATCGCCTGGATCAAACTGCTCAACGCCGGGCAGACATGCGTTGCACCC
+GACTATGTGCTGGCGGATGCCACCGTCCGCGACGAGCTGGTCAGCAAGATCACCGCGGCCCTCACCAAGT
+TCCGCTCCGGTGCGCCGCAGGGCATGCGCATCGTCAACCAGCGTCAATTCGACCGGCTGAGTGGATACCT
+CGCCGCAGCGAAAACCGACGCTGCAGCCGACGGCGGCGGGGTCGTCGTGGGCGGCGACTGTGACGCATCG
+AACCTGCGCATCCAACCCACCGTGGTCGTCGATCCCGACCCGGACGGGCCGTTGATGAGCAACGAGATCT
+TCGGACCGATCCTGCCGGTGGTCACCGTCAAATCTCTGGACGACGCGATTCGCTTCGTGAACTCGCGGCC
+CAAGCCGCTATCGGCGTACCTGTTCACTAAGTCGCGTGCGGTTCGCGAGCGGGTGATCAGGGAGGTGCCG
+GCGGGCGGAATGATGGTTAACCATTTGGCTTTTCAGGTGTCGACGGCCAAACTGCCGTTCGGTGGTGTCG
+GCGCATCGGGCATGGGTGCCTACCACGGCCGTTGGGGTTTCGAGGAGTTCAGCCACCGTAAGTCGGTGTT
+GACCAAACCAACCCGACCCGACCTGTCCAGCTTTATCTACCCGCCGTACACCGAGCGCGCCATCAAGGTG
+GCTCGCCGGCTGTTCTGACCTGGGCGCGGGTTGTCGCCCCGTTGACACCCGACTCGTTATAACCCCGAAT
+TGTGATTGCGGAGAGGAGCCTGATGCCCGGAGTGCAAGATCGCGTCATCGTCGTTACTGGAGCCGGCGGT
+GGCTTGGGCCGCGAATACGCCCTTACGCTCGCCGGGGAGGGCGCCAGCGTCGTGGTCAACGACCTCGGTG
+GCGCCCGCGACGGCACGGGCGCCGGTTCGGCGATGGCCGATGAGGTCGTCGCCGAGATTCGCGACAAGGG
+GGGCCGGGCGGTCGCCAACTACGACAGCGTCGCCACCGAGGACGGCGCAGCGAACATCATCAAGACCGCG
+CTTGACGAATTCGGCGCCGTGCACGGTGTGGTGAGCAACGCCGGGATCTTGCGCGACGGCACCTTCCACA
+AGATGTCGTTCGAGAATTGGGACGCCGTGCTTAAGGTGCACCTTTATGGCGGATACCACGTGCTACGCGC
+GGCCTGGCCGCATTTCCGTGAGCAGAGTTACGGCCGGGTCGTGGTGGCGACCTCCACCAGCGGGCTGTTC
+GGCAACTTCGGCCAGACCAACTATGGGGCGGCCAAGCTTGGTCTGGTCGGCCTGATCAATACGCTGGCGC
+TGGAGGGAGCCAAGTACAACATCCACGCCAATGCTCTTGCCCCGATCGCGGCGACCAGGATGACCCAGGA
+CATCCTGCCGCCCGAAGTACTGGAAAAGCTCACACCCGAGTTCGTCGCACCGGTGGTGGCCTACCTGTGC
+ACCGAGGAGTGTGCCGACAACGCATCGGTGTACGTCGTCGGTGGTGGCAAGGTGCAGCGAGTTGCGCTGT
+TTGGCAACGACGGCGCCAACTTCGACAAACCGCCGTCGGTACAAGATGTTGCGGCGCGGTGGGCCGAGAT
+CACCGATCTGTCCGGTGCGAAAATTGCTGGATTCAAGTTGTAGAAGTAAATGAAGGCTTGTGTCGTAAAA
+GAACTTTCCGGCCCGTCCGGCATGGTGTACACCGACATCGACGAGGTATCCGGTGACGGCGGAAAGGTTG
+TTATCGACGTACGGGCCGCCGGCGTCTGCTTTCCGGACCTGCTGCTGACCAAGGGCGAGTATCAACTGAA
+GCTAACGCCGCCGTTCGTGCCCGGCATGGAAACGGCGGGTGTGGTGCGTTCGGCGCCGTCGGATGCGGGT
+TTTCATGTGGGCGAACGTGTTTCAGCATTCGGAGTGCTCGGCGGCTACGCCGAACAAATAGCCGTACCGG
+TGGCCAATGTGGTTCGCAGCCCCGTCGAGCTCGATGACGCCGGGGCGGTGTCGCTGTTGGTGAACTACAA
+CACCATGTACTTCGCCCTGGCTCGGCGTGCCGCGCTGCGACCGGGAGACACCGTGCTGGTGCTCGGCGCC
+GCCGGCGGAGTGGGCACGGCCGCCGTCCAGATCGCGAAGGCGATGCAGGCTGGCAAGGTGATAGCCATGG
+TGCACCGCGAAGGTGCGATCGACTATGTCGCTTCGCTCGGTGCCGACGTGGTGCTTCCGCTGACCGAGGG
+CTGGGCTCAGCAGGTGCGTGACCACACCTACGGTCAGGGGGTGGACATCGTCGTCGATCCCATCGGCGGA
+CCGACATTCGACGACGCGCTCGGCGTGCTGGCGATCGACGGCAAGTTATTGTTGATCGGCTTTGCCGCGG
+GTGCTGTACCGACCCTCAAGGTCAACCGGCTGCTGGTGCGCAATATCAGCGTGGTGGGCGTCGGGTGGGG
+CGAGTATCTCAACGCGGTTCCCGGTTCGGCCGCCTTGTTCGCCTGGGGGCTAAACCAGCTGGTCTTTCTG
+GGGCTCAGACCGCCTCCGCCGCAACGCTATCCGTTGTCGGAAGCACAGGCCGCGTTGCAGAGTCTGGACG
+ACGGCGGTGTGCTCGGCAAGGTTGTGCTCGAGCCCTAAGCGCATGCTCGCGATTCGGCGATACGGTGATG
+CTGTGACGGATCGGCGGGCCAACACGAGGAATTCGCACCCGCTGCCGGCGTGACCAACGCCACGCTGGCA
+GCAATCGGGTATCCGATCGCGTTGGCCAGCAAGCTGTTGGCGATATCGGCCGTCGAAAGCACAACCGCGT
+AGCCGTCCGCAACCACAGTGGAAATGGTGCTGGCGATCTTGGTGTGCGCGAGCGCTTCGATGCCAGGGTC
+AGGGAGCCCGGTGGGCGCCCGGTCGTCGGGCAACGTCAGCATCGACGAGCCGCCGGTCTGTGACAAGTTC
+GCCAACAACGGATTGGGCAGCCACGCCGGTACCTGGCGCGGATGTGGTGCACGAACGCGTTGACATATTG
+GGGGCTCTTCGCGGATGAGGGTGTAGGGCGGGTCGGCGCGTCGTTGCCGGGTAGGGGTCGCGGTCTTTCG
+ATGATGGGCGGTTCCACGCTGCCGAAAAGGAAGACCTCGGCGTGTCTGCCCGAGGCACTAGGTCGCAAGG
+GTAACCGAGGGTGCACGTTGACGGGGTGAGGCCAAGCGGGCGCCGAGCGTGAACTGAGGGCGAGATTTCG
+GCCGATTCTCCGCCCTCAGTTCACGCTGGGCGACGGCGCCAACGGGCTGCCCCTGGCCGGTCGCACCAAG
+ACGCCGCATACGTACCAAACTTCCCATACTCACCCATCGCGGTGAACCCCAAACCCAGTGCCGGCCACCA
+TTGGCCTTCCCGATGGATTGGTGCCAGCAGCAACCGGCATCATCGAAAACCGGCTCTTCATGATCGAGGG
+CCGGCAGCGGCTCGAGCAGCGGCAGGCCGGGGTGATCACGTAGTAGTGCTGAATGACCCGAGCATCGGGC
+GATCAGATGCTGAAGCTTTGCAGTTGCTGAGTAATGTCGGCCAACGTCACCACAATCGCGATGAATTCAA
+TCATGCCGCCCAGGGCGGCCAACCCAATGGTGGCCGCGAGCGGCAGCTCGATCGCAGCGCGGAGGTTGCC
+GGCCGCCAGTTGATTCACGAACAGGGTGAGGTCATAGGCGGGCAGGATAGTGACGAAGGCAAGACCTAGA
+TCTGCCGTCGGAAGAAGAATCGAGTAGCCGGTCGACACAACGGAAGCGAAAGTGTCCGCGATGTTGATGA
+GCGTCGCCGGTTGTGGCGGCGGTGGCGGCGGTAGCAACGTCGGCACATACGGCGGGAACGCGGGCATCGG
+AGTTTGGGGCAGGGTGTTCAGGGCGGCTGGCAACTCGACCATGAAGTCGTTGACGCCCTGTTGCGTTCCG
+GCAACCAGGGCATCGGCGACAACGCTCGCCGGGACATCCGGGAAGAGCCCGAATGGGGTAGGCACGTTCG
+CCGGGCTCGTCGAATAGCCGAACCTCGGGTCGCCGTAACCCAGATTGACGATTACTTCCAAGTTCGGTTC
+GACCAGCGCCGCCAGCGGTGGGCCAATGACCGGGATTGCCCGCAACGGGGCCAGCAGCGGCAGATGCTCG
+GTTTCAATGATGTAGTACGTGTTCGACGTCGTGCCCTGTGTCGGCAACTGCGTGGCCGACGCTATCTGTG
+CCGGTGTGAGGTCCGCATACGTGGTGTGCACCGTGAGTATCCCGAATACTGCGTTGATATCGGACAGGAC
+ATTGAGTGGATACCGCGGGAAGTCGGCGAAACCGTCGTACTCGAGGGTGTAGGTCGTCGTCGGATAGGGA
+TTGTCCGGGGTCGCCCCGTAGAACGGTAGGCCGAGGGTGGTGACATTCAGACCGGGTATGCGCGCAAGTA
+TCCCGCCATTGGGATTCATCTCGTTGCCGATCAAGATGAAATTGAGCTGGCTGGGGCTGGGAGCGTTGGG
+ACCCAGCGAGATGAGGTGCTGCATTTCCAGGGACGCGATGACGGCGCTCTGCGAATAGCCGAACACGGTG
+ACGTGGTTTCCGGCGTTGATTTGCTCCCAAATCGCGCCGTCGAGAATCTGTAGGCCCAACTGCACCGAGG
+TTTGGAAGGGCAGGGATTTGACGCCGGTGATCGGATATAGCTCTTCGGGCGTCACCAGCGCTTTGACGAC
+CGGATTCGAGACGACGGGGTCGATGAACAAGGTCGTGATGGCGTTGACATAACTCGGCGTGGGTATCGGT
+GACCCGGTGCCGCCCATGATGATCGCCGTATTTTGGTTGAACATTGGCGGTAGCACCGGGGGTGAGGTTG
+GCTTAAAGAGTCCGGCCGTCGCCTCCTGCACCAGCGCGCTCGTGTTGGTGGCCTCGGCATTGACAAATGC
+GTTTGCGGCCGCCGCCAACCTCTGGGTGAATTCGTTGTGAAACGCCGCAACCTGTGCGCTGATCGCCTGG
+AACTGCTGGCCGTACGCGCCGAACAGCGTGGCAAGGGCCGTGGACACTTCGTCCGCGGCAGCCGCCGCCA
+GGCCGGTTGTCGGGGCCGCGACGGCCGCCGTAGCCTGGTTGATCGCCGAGCCGATCCCGGCCAAATCGGT
+AGCCGCCGCTGCCAATACCGACGGCTGCGCGAATACGTACGACAAACCCCATCCCTCCTTGTCGACGGGG
+CCCATAACCCACCTGTCGAGCCGATACGTTGAGCGTAAAGCGACTCCGCGGTTGTGTCTGGCCTTTGGAG
+TGAACCCAAATGGGGCCATGCTGCCTCGTCATTGGCGAGGTCGGTAAACGGTAGTCGGTGGACGTCGATG
+CCGTCGGGAATCCGTTAGGTGACGAGGCCCTCGATGTTTCGAACGGTGTCCGAGGCCGCCGCGAGGAGGG
+TGAGCAATTCCACGCCGCCCGCTATCGATCGTGCCTAAACCTACGGTGGCCGCCAGGGGATAGCCGATCG
+CGTTGATCAGATTGCCCGCAGCGAGTTGCCTGACGAACAGTTGGGTGGTGTACAGCGGCAGGGTGGTGAC
+CAGGGCGAGGGCGATGTCCACGGTGGGCAGCAGGACGGCGTAGTTGGTTGAGATGATCCTGGCGAGCGTG
+TTCACCACCTCGGCCGGCGTCGGTGCGGCGGCCACCGCGGCCACCAGATCGGCGGGTTGCGGCAGCTGGA
+TCTGCGGGAGCGTGAGCGGTTGCGCGGACAGCGCCTGCAGGTCGGCCGTGAAGTCAAGGATGCCTTCTTG
+TGTTCCGGCGGCCAGGGCATCGGCGATGACCTGAGGCGGCACGTTCGGCCACAGCCCGAACGGCGTTCGC
+ACATCGGCGTAGCTCGTCGAGTAGCCGTAGTTCGGGTCGCCGTAGCCCAGGTTGACGATCACCTTCAGGT
+TCGGCTGGATCAGGTCGGCCAGCGGATCTCCGATGACCGGCACCGCCCGCAGCGGTTGCAGCAGCGGCCG
+ATTCTCGGTGCGGATGATGTAGTAGTCGGTGACCCCCGTATAGCCCGGCGACGTCGGTAATTTAGTAGCG
+CCCTCGACCTGCGCGGGCGTGAGGTCCAAATACTTGGTGTGTACGAATGTGATGCCTGCAACCGCGTTGA
+GGTCGGAAATGAAGTTGAGCGGGTATCGCGAGAAGTCGGCGAACCCGTCGTACTCGAGCGTGTAGATGGC
+CGTCGGATAGATCGTGTCCGAGGGCGTTGCGCCATAGAACGTCAGGTCCAGAGTCGGAAGCGTCAGATCC
+GGGAACCGCGCGAGCATACCGCCATTGGGGTTCATTTCATTGCCGACAAGCACGAAATTGAGGTCGCTCG
+CCGAAGGTGCGGCCCCGCCCATCGCCGTGAACCTCTGCATCTCCAGCGACGCGATTATGGCGCTTTGCGA
+CCAGCCGAAAACGGTGACCGCGTTTCCGGTGGTCGCGAGCTCTACCATGATCGCGTCGTGCAAGATGGTC
+AAGCCCTCTTCCACTGACGTGTTGAGGACCAAACTTCTGACACCGGTGAGTGGGTACAACTCTTCGGGTG
+TGAAGACGGCTTGTAGCGCCCGCCGAACGGACCTACAGCGTATTGGCGGCGTCAACATAGACGGCGGTGG
+TAGTGGAATTCCGGTGGGCCCAAAGAACAAGGTGGTCAAGTTCGCCGGGAATGGCGGAATCATCGCGGCC
+GCCGCGGGGGTTGGTGCGGCGGCGGGCACAGCCAGCTGATTTTGCCGGGTGCTGGCGATGGCGGCCTCGG
+CATCTGCGTAGCTGTTCGCCGCGGCGGCCAACGTCTGGTGGAACCTAACTGTGAAACGCCTCGACTTGAG
+CGAGCACGGCCTGGTATTCCTGGCCGTATGCGCCGAACGGTTTCGCGATGGCGGCCGACACCTCATCGCC
+GGCCGCCGCGGCCAGTGCACACGTCGGGCCTGCCGCGGCCGCGCCGGCCGTACTCACGGCCGAACCGATT
+CCTGCCACCTCGGCGGCGGCCGCCGCTACGATCCGCGGCTCAGCGATCAGATACGACATCGTCTCACTCC
+CCTAGCACCAGGTGTCGGCCAACCGGGTCAACCCGGGGTTTTGGTCAGCCCAGAGCGGTCCCGCTGCCCT
+GGTGGTCGCTTACGCGAATCGGATTCGCGCGAAAGCGTTTCCCCTCATCCGAGCAGCACCCCGCGCATCC
+GGTTGACTGTGGCCTGGCTGATACCGGCGTCGCGCAGGTAGCCGCCCAGCGATCCGTAGGTCTCGTCAAT
+GGTCTGGCGTGCGGCGGCCAGGTACTCCGCGCGGACACCCAGGACCCCGTCGGACAGCCGGGCCTTGGTG
+AACGTCACCACCTCGGGTGCCAGTTCGGTGTCGAAACGCTGCTGGATCATCTCGGAGATCCGGGCCCGCA
+GTTGTGGCACGGAGTCGTTGCTGCGCAGGTAGTCGGCGACGATGACGTCGCGGTCCAGGCCGACCGCTTC
+AAGCACCAGCGCGACCACGAAGCCGGTGCGATCCTTACCCGCGAAGCAGTGGGTGAGCACCGGGCGTCCG
+GCGGCAAGCAGTGTGACGACACGATGTAGCGCGCGCTGTGCTCCATTGCGCGTTGGGAATTGGCGATACT
+CGTCGGTCATGTAGCGGGTGGCCGCGTCATTTATCGACTGGCTGGATTCGCCGGACTCGCCGTTGGACCC
+GCCATTGGTTAGCAGCCTCTTGAATGCGGTTTCGTGCGGCGCTGAGTCGTCGGCGTCATCATCGGCGAGG
+TCGGGGAACGGCAGCAGGTGGACGTCGATGCCGTCCGGAACCCGTCCTGGACCGCGGCGGGCAACCTCCC
+GGGACGACCGCAGGTCGGCAACGTCGGTGATCCCCAGCCGGCGCAGCGTTGCCCGGCCGGCGTCGTCGAG
+GCGGCTCAGCTCGCTGGACCGGAACAGCCGCCCCGGCCGCAATGCGGTTGCGGTGTCGGCGACGTCACGA
+AAGTTCCACGCGCCCGGCAGTTCACGGACAGCCATCTCAGGTGACCGCCGCAGCGAAGGTGGACTTCTCC
+CTCGACAGCTCGGCGCGGGCGATGGAGCGCAGGTGCACCTCGTCGGGACCGTCGAAGATGCGCATGGCGC
+GGTGCCAGCCGTACAACCGGGCCAGCGGGGTGTCGTCGCTGACGCCGGCGGCCCCGTGGACCTGGATTGC
+GCGGTCGATGACATCGCAGGCCACCCGCGGGGCCACCGCCTTGATCATGGCGACCAGGTGGCGCGCCTCT
+TTGTTGCCATGTTGGTCGATTGTCCACGCCGCCTTTTCGCACAGCAGCCTTGCCTGGTCGATTTCGTTGC
+GGGACTGAGCAATCGCCTGTTGCACGACGCCCTGTTCGGCTAGCGGACGGCCGAACGCCACCCGGTTGCG
+GACGCGATTCACCATGAGTGCCAAGGCGCGTTCGGCCGCGCCCAGCGCACGCATGCAGTGGTGGATACGG
+CCCGGCCCCAGCCGGGCCTGGGCTATGGCGAATCCGCTGCCCTCTTCGCCGAGCAGGTTGGTGGCCGGGA
+CCCGGACGTTGTGGTAGTCGATCTCGCAGTGGCCGTGCCGGTCCTGCCAGCCGAACACCGGTGTGGAGCG
+AACGATCGTCACGCCGGGGGTGTCGATCGGGACGAGGACCATCGACTGCTGTTGGTGGGCGGCTGCGTCC
+GGGTTGGTGCGGCCCATCACGATGAGGATCTTGCACCGCGGGTCCGCCGCTCCCGACGTCCACCACTTAC
+GGCCGTTGATGACGTAGTCGGCACCGTCCCGGGAGATGGTGGTTTCGATGTTGCGGGCGTCGCTGCTGGC
+CACCGCCGGCTCGGTCATCGAGAAGGCGCTGCGGATCTTGCCGTCGAGCAGCGGCCGCAGCCATTGCGCC
+CGTTGCTGCTCGGTGCCGAACATGTGCAGGATCTCCATGTTGCCGGTGTCCGGTGCGGCGCAGTTGAGTG
+CCTCGGGCGCGATTTCCATGCTCCATCCGGTCATTTCGGCCAGCGGCGCGTACTCCAGGTTGGTCAATCC
+CGACTCGGCCGACAGGAATAGGTTCCACAGGCCGCGGTCTTTGGCCTTGGTTTTCAGTTCCTCGATGATC
+GGCGGCGCGGTGTGGTCGGCCGGTCCGGCCGCGCGGCGATAGTCGTCGTAATCGGCCTCAGCGCCGAAGA
+CGTGCTCGGTCATGAAGTCGGACAACCGCGTGCGGTAGTCGATGGCCTTGGCCGACATCGCGAAGTCCAT
+TCCGCCACGATATCTACCGGCGCTAGCAGACGCATAAGTCCCTCGACACGCCGACGAGAAGGGGGTTTTG
+CGTCTGCTCGCCGTCGTTTCGTGCCACCGTTCAACTGACCCGCAAGTGGCAGCGCGAGCTCGACTATTCG
+CTACGCAAGAGTTTGTGGAGCTTCCACGACAACCGCATTGCGATGCGGTTCCAGTACGAATCCCGTGACC
+GCAACGGCCAGTGGTATCGCAGCTACGGCACCGAACTGTGGCGAAGCCAGCATCAACGACGTGCCGATCG
+CCGAATCCGAGCGTCGCTACCTCGGTGCGCGCTCGGCATCCGAGTATGGCCAGGAAATACCGCTCTGGTA
+GCCCGGTAGGGTGTCTGAGCAAATCTATCGGCGTTCAGTAAGGAAAGTGGATGTACGCGCCATGACAGAT
+CCGCAGACGCAGAGCACCAGGGTCGGGGTGGTTGCCGAGTCGGGGCCCGACGAACGACGGGTCGCGCTGG
+TTCCCAAGGCGGTCGCGTCGCTGGTGAACCGTGGTGTGGCGGTCGTGGTCGAGGCCGGTGCGGGCGAGCG
+CGCGCTGCTTCCCGATGAGCTCTACACCGCTGTCGGTGCCAGCATCGGGGATGCTTGGGCCGCCGACGTC
+GTTGTCAAGGTCGCGCCGCCGACGGCGGCGGAGGTCGGCCGGTTGCGCGGTGGGCAGACACTGATCGGCT
+TTCTAGCGCCCCGTAATGCTGACAACTCGATCGGCGCGCTGACCCAGGCCGGGGTGCAGGCGTTCGCGCT
+CGAGGCCATCCCGCGCATCTCGCGGGCGCAGGTGATGGACGCGCTGTCGTCGCAAGCCAACGTGTCTGGG
+TATAAGGCTGTGCTGCTCGCGGCCTCGGAATCGACCCGGTTCTTTCCGATGCTGACGACGGCGGCCGGAA
+CGGTGAAGCCGGCCACGGTGCTGGTGCTCGGCGTCGGCGTGGCCGGCCTGCAGGCGCTGGCGACGGCCAA
+ACGGCTAGGCGCGCGCACCACGGGCTACGATGTGCGTCCCGAGGTGGCCGACCAGGTCCGATCGGTGGGC
+GCTCAATGGCTTGATTTGGGCATCTCAGCGTCCGGTGAGGGCGGTTACGCCCGCGAACTGACCGACGACG
+AGCGCGCCCAGCAGCAAAAGGCATTGGAAGAAGCGATCAGTGGCTTCGACGTGGTGATCACCACCGCGCT
+GGTGCCGGGCCGCCCGGCGCCAACGTTGGTGACCGCCGCTGCAGTGGAAGCGATGAAGCCTGGCAGCGTG
+GTGGTGGATCTCGCCGGCGAGACGGGCGGCAACTGCGAATTGACCGAGCCCGGCCGGACAGTCGTCAAGC
+ACGACGTCACCATTGCCGCACCGCTGAACCTGCCGGCCACGATGCCCGAGCACGCCAGCGAGCTCTACAG
+CAAGAACATCACCGCGCTACTCGACTTGTTGATCAAAGACGGCAGGCTGGCCCCGGACTTCGACGACGAG
+GTGATTGCCCAGTCGTGTGTCACCCGCGGGAAGGACTCCTAGATGTGCAACGAATTGTTGGAGAACCTGG
+CGATCCTGGTGCTGTCCGGATTCGTCGGGTTCGCGGTGATCTCGAAAGTGCCCAACACGTTGCACACCCC
+GCTGATGTCAGGAACCAACGCCATCCACGGCATTGTCGTTCTCGGCGCGCTGGTGGTTTTCGGCGAAATT
+GAGCACCCATCGCTCGTGTTGCAGGTCATCCTGTTCGTCGCGGTGGTGTTCGGCACGCTGAACGTCATCG
+GCGGATTCATCGTCACCGACCGAATGCTCGGCATGTTCAAGGCCAAGAAGCCCGCCGTGCCAGCCAAGCC
+CGACCGCGACGAGGCGCTCCGATGAACCTGCACTACCTGGTCGAGATTCTCTACATCATCTCCTTTTCAC
+TCTTCATCTACGGGTTGATGGGGCTCACCGGCCCCAAGACCGCGGTGCGCGGGAACCTGATCGCCGCGGC
+CGGCATGACCATCGCCGTGGCGGCCACGTTGGTCATGATCCGACACACCAGCCAATGGCCGCTGATCATC
+GCCGGTCTGGTGGTGGGTGTTGTGCTCGGTGTGCCGCCGGCGCGACTGACCAAGATGACCGCCATGCCGC
+AGCTGGTGGCATTCTTCAACGGCGTGGGCGGAGGAACGGTCGCACTCATCGCGCTGTCGGAGTTCATCGA
+TACCACCGGCTTTTCCGCATTCCAGCACGGCGAGTCGCCGACCGTGCACATCGTGGTGGCCTCATTGTTC
+GCCGCGATCATCGGGTCGATCTCGTTCTGGGGGTCTATCGTCGCGTTCGGCAAGTTGCAGGAGATCATCT
+CCGGGCGGCCGATCGGACTCGGCAAGGCGCAGCAGCCGATCAACCTGTTGCTGCTGGCCGTGGCCGTGGC
+CGCCGCCGTGGTGATCGGACTGCACGCGCATCCCGGGAGCGGTGGGGTCGCATTGTGGTGGATGATCGGC
+CTGTTGGTCGCCGCCGGCGTGCTGGGTCTGATGGTGGTGTTGCCGATCGGTGGCGCCGACATGCCGGTGG
+TCATCTCGATGCTCAACGCCATGACCGGCCTGTCGGCCGCGGCGGCGGGTCTGGCGTTGAACAACACCGC
+GATGATCGTGGCCGGCATGATCGTCGGCGCGTCCGGCTCGATCCTGACCAACCTGATGGCTAAGGCGATG
+AACCGCTCCATTCCGGCGATCGTCGCGGGCGGTTTCGGCGGCGGCGGTGTGGCGCCCAGTGGCGGCGGCG
+ACGACAAACACGTCAAGGCCACTTCGGCCGCCGATGCCGCGATCCAGATGGCATACGCCAATCAGGTGAT
+CGTGGTGCCCGGCTACGGGTTGGCCGTCGCGCAGGCGCAGCATGCGGTGAAGGACCTGGCAACCTTGCTG
+GAGGACAGGGGTGTGCCGGTCAAGTACGCGATTCACCCGGTCGCCGGCCGGATGCCCGGGCATATGAACG
+TGCTGCTGGCCGAGGCCGAAGTCGACTACGACGCGATGAAGGACATGGACGACATCAACGACGAGTTCGC
+CCGCACCGACGTCACCATCGTGATCGGCGCCAACGACGTCACCAACCCGGCGGCCCGCAACGAGACGTCC
+AGCCCGATCTACGGCATGCCGATCCTCAACGTGGACAAGTCGAGGTCGGTGATCGTGCTCAAACGGTCGA
+TGAATTCCGGGTTCGCCGGCATCGACAACCCGCTGTTCTACGCCGACGGCACCACTATGTTGTTCGGTGA
+TGCGAAGAAATCGGTGACCGAAGTCTCCGAGGAACTCAAGGCGTTGTAGCGCGCGAGCGCTGGCTCAGAC
+GGGCGGATACGCCGGCGGCGGGTATCCGTCGCCGGTTTCGACCCCGCGTAGACCCCAGGTGAGGTACCGG
+AAGAAGAACTCGATTTCGTCGCTCACGTCGTAGTCAGGACTCGGATCCATCACTTCACCCTCTCGACTCG
+CGACTTGGTTCGCAACGGAGTTTAGTCACATCCGCGCCGGTGCGACAGGTTGTCGCCGCCTTGCCTAAAC
+TGAACAACCAGTTGATTGATACAGCTTCGGCCGGGGCCCATGGGCTCCACCGGCAGCGACGATAGCGAGT
+AGCGATGCCATCCGACACCAGCCCCAACGGGCTAAGCCGCCGTGAGGAGTTGCTGGCTGTTGCCACCAAA
+CTATTCGCGGCGCGCGGTTATCACGGCACCCGGATGGACGACGTCGCCGATGTGATCGGGCTCAACAAAG
+CAACGGTCTATCACTACTACGCCAGCAAGTCGCTGATCCTGTTCGACATTTACCGTCAGGCGGCCGAGGG
+CACCCTGGCCGCCGTGCACGACGATCCGTCCTGGACGGCCCGTGAAGCGCTGTACCAGTACACGGTCCGG
+CTGCTCACTGCGATCGCGAGCAACCCCGAGCGGGCCGCCGTGTACTTCCAGGAGCAGCCCTACATCACCG
+AGTGGTTCACCAGCGAGCAGGTCGCCGAGGTCCGCGAGAAGGAGCAGCAAGTCTACGAGCACGTACACGG
+CCTGATCGACCGCGGGATTGCCAGCGGCGAGTTCTATGAGTGCGACTCGCATGTGGTGGCGCTGGGGTAC
+ATCGGGATGACGCTGGGCAGCTACCGCTGGCTGCGGCCGAGCGGGCGCCGAACGGCCAAGGAGATCGCGG
+CGGAGTTCAGCACGGCACTGCTGCGCGGGCTGATCCGCGACGAATCGATCCGCAACCAGTCTCCGCTTGG
+AACTCGGAAGGAAACGTGAACCTCACGCGATCGGTGGAATCAATCTCGCTACGGACCCGAGGGCGCCACT
+GAGCACCGACAACTCCGTCACACTGGATTGACCGAAGTTGAACATCAGGCCCGGATTCGCCGACGGAAGA
+TACGGATACGTATTGGGTAGCGCGGACTGCGGTAACAATCCGATGCTTACTAGGGCGGCTTGGGGGCCTT
+GCACGGTCCCGGTCGCCAGGGCCGAGGCCACGGCGATCGGGTTGATTGGCGCGAACAGGCTGGCCGGGGT
+GGGTACGTCGGCGTAGCCGTAGCCATAGCCCAAGTCGACTAGCACCCGTAGGTCGGGCTGAATCAGCTCG
+GCTATTGGGGTCCCTACGAAGGGGATGGCGCGAATCGGCTGCAACAGCGGCAGGTCCTGGGTCAGAAACA
+TGTAGTAATGGGTGTTGCCGGTGTAGCCCGGAGACGTGGGCAACGGCACGGCATTGGCAACCTCGGCCGC
+GGTGAAGGGGTACGCGTTGTGCACCCATCTGATGCCCATGAAGGCGTTGAGGTCCGACAAGATATTGAGC
+GGGTACTGCGGGTTGTGGGCGTAGCCGTCGTATTGGCCGGTGTACATGTAGGTCTGGTAGGGGGAATCCG
+GTGGAGTCGCACCGTTGAACGACATATCCAAGAACGTGAGGTAAAGGCCCACGTAACGCTCGAGGACGCC
+GCCGTTGGGGTTATTGATATTACCGATCAACGTGAAAGCCAGCCGGCTTGGATCTGGGGCTTGGCCCGGT
+GGTAACGCCATAAGAGCGCGTATTTCATTGGTCGCTACCGCGGCGCTTTGCGAGTAGCCGAAAACGACGA
+CGTCATGCCCATTTTGTAGTTCCGCGTTGATGCCGTTGTTCAGCAGCGTGACACCCTGGGCGATGGATTG
+GTCCAGTGACAGGTTCCCGATAAACGGCCACCACTGCTCGGGCGTGTACTGGGCGACCGGGTTGTTGGGC
+CCGAAAATGGGCCGAATGTATGCGCTGTCAATGATCGCCAAGACGCGGTCACTAAGGATCGGTTCCCCGG
+TGCCGCCCATCATCAACGCGGTTAGCGGGTTGCCTGACAGCATCCCGACAGAACCGAGGGCGCCGCTGGA
+CCCGGCGGTGCCCGACATAGCAGCGGTGTTGCTGGCTTCAGCCTGGGCATAGGCGGCCCCGGCGGCAGCC
+AGCGCCCGGGTGAACTCGCCATGGAACGCCGCAGCCTGCTTTAGGACCTCTTGACATTCGCGCGCGTATT
+CGCTGAACAGCGCTGCAGCGGCCGACGACACCTCATCGGCGGCCGCGGCCAGCAGTCCGGTCGTTGGACC
+CGCAGCGGACGCGCTGGCCGCTCGTATCGCCGAACCGATCCCGTCCACGTCCGCGGCCGCCGTTGCCAAC
+ATCTCCGGGGCCGCGATGACGTAGGACATCTGGTCTCCTGTTCGACGCTGGGGCCCTTAGAGCCTAGAGC
+GCGCCCGCCGGGAAGCCCGGCGTTTTCGGCCAATCGTTATCGCGGCCGCGTCAGGTGAAGACCGGTGGCG
+GGATCAGGTGCAGGATGTTGCCGAGACCGCCACTCATCAGGGATAGCAGTGTCACCTGTGGCTGGCCGAA
+GTAGAAATTCAGGCCCGGGTTTATCGACGGGACCCACGGATAGCTGTCCGGGAACCACTCCGGCCCAATC
+AATCCGGCTTCCACCCCAATCTCCACGATGGCGCCATAGGGCGCCTGCAGGCTCCCTTTGATCAGGTAAT
+ACGTGACAGCGAACGGGTTGGGGATCGAGAACAGCCCGGCCGGAGTGGGGATATCCGCGTAATTGCCGCC
+CGGCCCGTAGTCGGCGTAGCCCAAGTCGACGAGCACCCGCAGCTGCGGCTGGAACAGGTCGGCGATCGGG
+GGACCGGCGTAGGGGATGTCACGGATCGGCTGGAGCAGTGGCAGATCCTGAGTCAGGAACATGTAGTACT
+GGGTGTTGCCGGTATAGCCCGGGGAGGTCGGCAACGGCACCGCGTTATCCACCTGGGTGGCCATGAGTTC
+CGGGTACGTGTTGTGCACGTAGAAGTAGCCCATGAAGGCGTTGATGTCCGACAGGATGCGCAGCGGGAAT
+TGCGGCGCGTGGGCGATGCCGTCGTACTGGGCCGTGTAAATGTGTGTCGGGTAGGGACTATTCGCCGGGG
+TTGCGCCATTGAACGGCACGTCCAGGAACGGGATGTAGAAGCCGGGGAAGCGCGCCAGCAGCCCGCCGAC
+GGGATTGTTGCCACTACCAATCATGACGAAGGAGATATCGTCCGGATTCGGCGAACCCATCGCCATCAGC
+GAATTGATGTAGTTGTTGATGATCGTGGCGCTCTGCGAGTAGCCGAACGCAACGACCTTGTTGTCGAGGG
+CCAGTTGGTTGTTGACGGTGGTATTCAGCAGCGCCACGCCTTCGGTGACGGACTGGTTGAACGTCAGATT
+GCCGAGGTCGGGGGTAACCGGCCAGAACTGCTCGGGCGTGAACAGGCCTTGCGAGACAGCACCCGGGAAG
+AGGGTCTGGATGAAAGCCTTGTTGATGTCTGTCACGTACTCGGGGTCGGGTAGCGGGTTATTGGTGCCGC
+CCATAATCAACGCCGTTATCGGACTCTCCGCAGCCAGCTGCGCGATCGCCGGCAGCCCGCCGGCCCCGCT
+GGATCCGTTGGGGCTCAACGGCGTACGGCCCAACAGCGTCCGGATCGGTGCGTTGATAGTGTCCAGCGCG
+TGCGATACCCGGGCCGCATTGGCCGCTTCGGCGTGTGCGTAGGCGTTGCCGGCGGCCTCCAACGTCCGGG
+TGAACTCGCTGTGGAACGCCGCGGCCTGCTTGACGACCGCCTGATACTCCCGCCCGTATGCGCTGAACAG
+GGCCGCCGTTGCCGCCGAAACCTCATCGCCGGCCGCGGCCAGCAGGTTACATGTCGGGCCTGCCGCAGCC
+GCGTTGGCGGCCCGCAGCGTGGAAGCGATCTCATCCACATGGGCAGCTGCCGTCGCCAGCATGTCAGGGG
+CTGTGACCAGGTGCGACATCTCCCCGTCCTTCCCAACGGACCGGCGCCCGCACCGGTCACTTGGGACTGA
+CCCGCTACCGCGGGTATTAGGTACTTAACGAGAGTAAGGCGGTCCTGCCGCTACGTCCGGCGTTTGGACA
+AACCTCGATGACTGCCTGACCTATGGCGGCTGCTATAACCGCGAGCATGCTAACCAGCTTGGTGAGTGCG
+GTCGGATCGCATCACGTCACCACCGACCCTGACGTGCTGGCCGGCCGCAGCGTCGACCACACCGGCCGCT
+ATCGGGGCCGGGCCAGCGCGCTGGTGCGGCCCGGCTCGGCTGAAGAGGTCGCCGAAGTGCTGCGGGTGTG
+CCGGGACGCTGGAGCCTATGTCACCGTTCAAGGCGGCCGCACCTCACTGGTGGCGGGCACCGTTCCCGAA
+CACGACGACGTGCTGCTGTCTACCGAACGGCTTTGCGTCGTCAGCGATGTCGATACCGTTGAGCGCCGAA
+TCGAGATCGGTGCCGGGGTCACACTGGCCGCGGTGCAGCACGCCGCGTCAACGGCTGGGCTGGTGTTCGG
+CGTGGATTTGTCGGCCCGGGATACCGCGACCGTCGGTGGCATGGCCTCGACGAACGCCGGCGGATTGCGC
+ACGGTCCGTTACGGCAACATGGGCGAGCAGGTTGTCGGGCTAGACGTCGCGCTGCCCGACGGTACGGTGC
+TGCGCCGGCACAGCCGGGTGCGTCGCGACAACACCGGCTACGACCTGCCCGCGCTGTTCGTCGGGGCCGA
+AGGCACCCTGGGGGTTATCACCGCGCTGGATCTGCGGCTGCACCCCACCCCGTCGCATCGGGTGACAGCC
+GTGTGCGGGTTCGCCGAGCTGGCAGCGCTGGTCGATGCCGGCCGAATGTTCCGCGACGTGGAGGGCATCG
+CGGCGTTGGAATTGATTGACGGTCGGGCCGCCGCGCTAACCCGTGAACATCTTGGCGTTCGCCCCCCCGT
+CGAGGCTGACTGGTTGCTATTGGTGGAACTGGCCGCCGACCACGATCAGACCGACCGGCTCGCCGACCTG
+CTCGGCGGTGCACGGATGTGCGGGGAGCCCGCGGTCGGTGTGGATGCCGCTGCGCAGCAACGGTTGTGGC
+GCACCCGTGAATCGCTGGCCGAGGTGCTCGGTGTGTACGGCCCGCCGCTGAAGTTCGACGTCTCGCTGCC
+ATTGTCGGCGATCAGCGGCTTCGCCCGAGATGCGGTCGCGTTGGTTCACCGACACGTCCCGGATTCTCCG
+GAGGCGTTGCCGCTGTTGTTCGGTCACATCGGTGAGGGCAACCTGCACCTGAACGTGCTGCGTTGCCCGC
+CTGATCGGGAACCGGCGTTGTACGCAAAGATGATGGGCCTCATCGCCGAATGCGGCGGTAACGTCAGTTC
+AGAACATGGGGTGGGCAGCCGCAAGCGTGCCTACCTGGGAATGTCCCGGCAGGCCAACGACGTCGCCGCG
+ATGCGGAGGGTCAAGGCGGCGTTGGACCCGACCGGGTACCTTAACGCCGCGGTCTTGTTCGACTGACCGG
+TGCTGCGCAAGCATTCAGCGCCTTTAAAGATCACCGGTGAAACTGATGAGCTGACGCACCGCGATGCCAT
+CGGCGAGGTGGTCCATCGCCTCGTTGATATCGTCCAACCGAATCGTTGACGTCACCAGCGACTCCACCGG
+CAGACGGCCCGATTGCCACAACGACACGAAGCGGGGAATGTCGTGGCTGGGCACCGCCGAACCCAGATAG
+CTGCCGATCAGTGACCGGCCTTCGGTGACAAAATCCAACGGCGACAAGCTGATCCGGACATCCGGTGGCG
+GCAACCCGACGGTGATGGTGCGCCCTCCGGGCGCGGTAAGCCCGATCGCGGTGTGCAGCGCGGCAGGATG
+ACCGACGGCTTCGACAACCACGGCGGCTTTGACCCCGCCGGCCGTGGCCTGCTGCGGTGTGTAGATCTCA
+TGGGCGCCCAAGGCCTTTGCGGCCGACAGCTTTTCGGGTAGCTGATCGACGGCGACCACACGAACGTCTG
+TATACGTCAAAGCGGTGAGCACCGCTGCCATACCGACGCCCCCGAGGCCGACGACGGCGACCGACTGGCC
+GGGCTGCGGATCACCGACGTTGAGTACCGCACCCCCACCGGTGAGCACCGCGCACCCGAGTAGGGCAGCG
+ACGGTGGGCGGCACCTCGTGCGGCACCGGAACCACGCTGGCCCGGTTGACGACGACATGGGTCGCGAAAC
+CCGAGACGCCGAGGTGGTGGTACACCGGGCGGCCGCCCCGGCTGAGCCGGATACCGCCACCGAGCAGTGT
+GCCGGCCTTGTTGGCCGCGCTGCCCGGTTCGCACGGCGTCCGACCGTCGGTCGCGCACGCCGCGCACTGG
+CCGCAACGCGGAAGGAACACCAGCACGACTCGCTGACCGACCGCGACCCCGTCGACGCCGTCGCCGACCT
+GCTCGACGATTCCAGCGGCTTCATGACCGAGCAAGATCGGCACCGGCCGTACCCGGGTGCCGTCGACCAC
+CGACAGGTCGGAGTGGCACACGCCCGCAGCCTCGATTCGGACAAGGACCTCACCGCGGTCGGGCGGGTCC
+AGGTGCAGCTCGACGACGCTGATTGGTTTCGACCGCCAATAGGGCCGCGGCACACCGATCTGGTCTAGCA
+CCGCGCCCCGGATGGCAGGCATGTTGGAATACAACCATGGCTGCACTGCCGGCACCGGAGAAGCTCCTGC
+GCAGCGACTTTCCGGTGCTGTGGCCGGTGGGAACTCGATGGGCCGACAACGACATGTTCGGCCACCTCAA
+CAACGCCGTCTACTACCAGCTGTTTGACACCGCGATAAACGCCTGGATCAACACGAGCACCGGGGTTGAC
+CCGCTCGCGATGCCTGTGCTGGGCATTGTCGCGGAGTCGGGCTGCCGTTATTTCTCGGAACTGCGTTTCC
+CGGAGAGCCTAATGGTGGGCCTGGCTGTGACGCGGTTGGGGCGCAGCAGCGTCACCTACCGGCTGGGTGT
+GTTTAAGGAGCCTGACGATGCGGGGGTGATCACCGCACTCGGGCACTGGGTGCACGTCTATGTCGATCGG
+ACTAGCCGCAGGCCGGTTCCGATTCCCGAGGCCATTCGGTCGCTGTTGTCGACGGCTTGCGTAAGCGGAT
+AAGCCGCGCCCAGATTGCGTTCAGGGCTGTGATTTTCGCCGCTCCAACCACAGCCATGACGGCAATCTCG
+TGCTCACCGCGACCCAGGTATGCTTCCCGAATGCCAGTTTTGAGCAAGACCGTCGAGGTCACCGCCGACG
+CCGCATCGATCATGGCCATCGTTGCCGATATCGAGCGCTACCCAGAGTGGAATGAAGGGGTCAAGGGCGC
+ATGGGTGCTCGCTCGCTACGATGACGGGCGTCCCAGCCAGGTGCGGCTCGACACCGCTGTTCAAGGCATC
+GAGGGCACCTATATCCACGCCGTGTACTACCCAGGCGAAAACCAGATTCAAACCGTCATGCAGCAGGGTG
+AACTGTTTGCCAAGCAGGAGCAGCTGTTCAGTGTGGTGGCAACCGGCGCCGCGAGCTTGCTCACGGTGGA
+CATGGACGTCCAGGTCACCATGCCGGTGCCCGAGCCGATGGTGAAGATGCTGCTCAACAACGTCCTGGAG
+CATCTCGCCGAAAATCTCAAGCAGCGCGCCGAGCAGCTGGCGGCCAGCTAAGGCATGTGCGGGCTCAGCC
+GAAGACTTCGGTCTCAGCCAGGGCCTCCGTCAGCCTGCGTGCCCCATCGGTGAACTGCCAGACGGTGTGC
+TCGATTACGGCGGCTGTGTCGCGGCGGCGCAGCGCGGCGATCAGCTGCCGATGACTGTTCACCGCGTCCG
+CGCCCCATCGCGGGTCGGCCGCGAACACCTGCGCCGGCATATAGCGCGCGGCATTAAGCAGGAACCAGGC
+CAACTTGATCCGGCGGCTCGCTTTGTTGAAGACGCGGTGGAACGCGAACTCGATCGACGCGATGGTTTTG
+GCATCACCGGACCCGATAGCACCGGCCAGCGCATTGTTGATGCGGTCCAGCTCGTCGATCTCAACGTCGG
+TGATGTGAGCGGTGGCCGATGTGGCAAGTTCTTGGGCAATGGTGGCCTGCAGCCAGAAAATGTCGTCGAT
+GTCTTGGCGGGTCAACGGCAGCACCACGTGGCCGCGATGTGGCTCCAGCCCGACCATCCCCTCACCGCGC
+AGTTTCAGCAGCGCCTCCCGCACCGGCGTGACGCTGACTCCGAGCTCGGCTGCCGTCTCGTCCAGACGGA
+TGAACGTTCCAGAGCGCAGGGCGCCCGACATGATGGCGGCCCGCAGGTGGCCCGCGACCTCGTCGGACAA
+CTGTGCCCGGCGCAGGGGAAGCTGGCTCCGCGGCTTCGCCGATAGAGGTGCGTTCACGTGGCTTGCCAGG
+ACTTTCAGGGTCGGGCCGGGATTGCCGGGGACTTGCCGGGGGCTTGGCGGGGGCTTGTTGTTGGGCCGCT
+CAGGCCATAGTGTGACCCAGACAACATCATGCTTTATCAAATATCAACCTGGCGCAAGGGATGCGCAAGT
+GAAAGGAAGGGAAGGAAGGGATAGTTGACCGCGCAACTGGCCAGTCACCTGACGCGGGCGCTAACACTAG
+CCCAACAGCAGCCCTACCTTGCTCGCCGGCAGAACTGGGTCAACCAGCTCGAACGGCACGCGATGATGCA
+GCCAGACGCGCCGGCGCTGAGGTTTGTGGGCAACACCATGACGTGGGCTGACCTAAGGCGCCGGGTTGCG
+GCGCTGGCGGGCGCATTGAGCGGTCGCGGGGTCGGTTTCGGCGATCGGGTCATGATCCTGATGCTTAACC
+GCACCGAGTTCGTCGAGTCGGTGCTGGCCGCCAACATGATCGGGGCCATCGCCGTACCACTGAATTTCCG
+GCTCACCCCAACCGAAATCGCCGTCCTGGTCGAAGACTGTGCCGCACACGTGATGCTGACCGAAGCTGCG
+CTGGCTCCGGTGGCCATCGGTGTCCGCAACATCCAGCCCTTGCTGAGCGTGATCGTGGTCGCCGGCGGAT
+CCAGCCAGGACAGCGTGTTCGGCTATGAGGACCTACTCAACGAGGCCGGGGATGTCCACGAACCGGTGGA
+CATCCCGAACGACTCGCCGGCCTTGATCATGTACACCGCGGGCACCACCGGCCGCCCGAAGGGCGCCGTG
+CTGACTCACGCGAACCTCACCGGTCAGGCGATGACCGCGCTCTACACCAGTGGCGCCAATATCAACAGCG
+ACGTCGGTTTCGTCGGCGTCCCGCTGTTCCATATCGCCGGAATCGGCAACATGCTGACCGGGCTGCTGCT
+CGGCTTGCCCACGGTGATCTATCCGCTGGGCGCGTTCGACCCGGGACAGCTGCTCGACGTGCTGGAGGCA
+GAGAAGGTCACCGGCATCTTTCTGGTTCCCGCGCAGTGGCAGGCGGTCTGTACCGAACAGCAAGCACGAC
+CACGTGACTTGAGGTTACGGGTGTTGTCGTGGGGAGCTGCGCCGGCGCCGGATGCGTTGCTGCGGCAGAT
+GTCGGCAACCTTTCCCGAAACCCAGATACTGGCCGCATTCGGCCAGACCGAGATGTCACCGGTCACCTGC
+ATGCTGCTCGGCGAAGATGCGATCGCTAAGCGCGGATCGGTCGGCAGGGTGATCCCGACCGTCGCCGCAA
+GGGTGGTCGATCAGAACATGAACGATGTCCCCGTCGGCGAAGTGGGCGAAATTGTCTACCGGGCACCAAC
+ATTGATGAGCTGCTACTGGAACAACCCGGAGGCCACCGCGGAGGCGTTCGCAGGCGGCTGGTTCCATTCT
+GGGGATCTGGTTCGTATGGACTCCGACGGTTACGTCTGGGTGGTGGACCGCAAGAAGGACATGATTATCT
+CCGGCGGTGAAAACATTTACTGCGCCGAGCTGGAAAACGTTCTGGCCAGCCATCCCGACATCGCCGAAGT
+CGCGGTCATCGGCCGGGCCGACGAGAAGTGGGGAGAGGTGCCGATCGCGGTCGCGGCCGTAACGAACGAC
+GACCTTCGGATCGAAGACCTAGGTGAGTTCCTGACCGACCGGCTTGCGCGCTACAAGCACCCCAAGGCGC
+TCGAGATCGTGGACGCTCTGCCCCGCAACCCCGCGGGGAAGGTGCTCAAGACTGAACTGCGATTGCGCTA
+CGGCGCCTGTGTGAATGTTGAAAGACGTTCTGCATCAGCTGGTTTCACGGAGAGAAGGGAAAATCGACAG
+AAATTGTAACGTTTGCCCGCTATTGACGAAGGGTTAAATGTGCGGATGCCTTACACTCCTGGCTGGCCAT
+CGGGTAGATTCCTGTGGTCTCCGTTACTCCCTGTGAGTAACGAGGTGGCGGTCACACACCAAGGGTCGGG
+GCAAGGAGGAGGCGTGCGACATGATGCGCCGCGGCGCCGCGATACCCAGGTCGGCGGCTTGAGGGAGCCG
+CGGTGACGACGTCGACAACGCTTGGCGGTTACGTCCGCGACCAACTGCAAACCCCGCTGACCCTCGTCGG
+TGGATTCTTTCGCATGTGTGTGCTGACTGGAAAGGCGCTGTTTCGCTGGCCGTTCCAGTGGCGCGAGTTC
+ATTCTGCAGTGCTGGTTCATCATGCGGGTCGGATTTTTACCGACGATCATGGTCTCGATACCGCTGACGG
+TGCTGTTGATCTTCACGCTCAATATTCTGCTGGCCCAGTTCGGCGCGGCAGACATCTCCGGTTCCGGCGC
+GGCGATCGGCGCGGTCACCCAGCTTGGCCCGCTGACAACGGTGCTGGTGGTCGCCGGCGCCGGATCCACG
+GCCATCTGCGCCGACCTGGGTGCCCGCACCATCCGCGAGGAAATCGACGCGATGGAGGTGCTGGGCATCG
+ATCCCATCCACCGTCTGGTGGTGCCGCGGGTGCTCGCCTCGATGCTGGTCGCCACGCTGCTCAACGGCTT
+GGTGATCACCGTCGGCCTGGTCGGTGGCTTTCTCTTCGGTGTCTATCTGCAGAACGTTTCGGGCGGCGCC
+TACCTTGCCACGCTGACCTTGATCACCGGCCTGCCCGAGGTGGTCATCGCAACCATCAAAGCCGCAACGT
+TCGGCCTGATCGCGGGCCTTGTCGGCTGCTATCGGGGGCTGACCGTCCGTGGCGGTTCCAAGGGTCTTGG
+CACCGCCGTCAACGAGACCGTGGTGCTGTGTGTGATTGCCCTGTTCGCCGTCAACGTGATCTTGACGACC
+ATCGGTGTGCGATTCGGGACGGGGCGCTGACATGTCGACCGCTGCTGTGCTGCGCGCCCGCTTCCCGCGG
+GCGGTCGCCAACCTTCGTCAATATGGAGGTGCGGCGGCCCGTGGATTGGACGAGGCCGGCCAGCTCACCT
+GGTTCGCTTTGACCAGCATCGGGCAGATCGCGCACGCGCTGCGCTACTACCGCAAGGAGACGCTGCGGCT
+GATCGCCCAGATCGGCATGGGTACCGGCGCGATGGCCGTCGTCGGCGGCACGGTCGCCATCGTTGGCTTT
+GTCACGCTGTCCGGCAGCTCGCTGGTCGCAATCCAGGGCTTCGCGTCGCTGGGCAACATCGGTGTCGAGG
+CGTTCACCGGGTTCTTCGCCGCACTGATCAACGTGCGCATCGCCGGCCCAGTTGTCACGGGTGTCGCCCT
+GGCGGCCACGGTCGGTGCGGGTGCTACGGCCGAGCTGGGCGCGATGCGGATCAGCGAGGAGATCGATGCC
+CTGGAAGTGATGGGCATAAAGTCGATCTCGTTTCTGGCCTCCACCCGGATCATGGCCGGGCTGGTGGTGA
+TCATCCCGCTGTACGCGTTGGCGATGATTATGTCGTTCCTGTCCCCGCAGATCACCACCACGGTGCTCTA
+CGGGCAGTCGAACGGCACCTACGAGCATTACTTTCAAACGTTCCTGCGTCCCGACGATGTCTTTTGGTCC
+TTCTTGGAGGCCCTCATCATCACTGCGATCGTCATGGTCAGCCACTGCTACTACGGGTACGCCGCCGGTG
+GAGGCCCCGTCGGTGTCGGCGAGGCCGTCGGCCGATCGATGCGTTTCTCGTTGGTCTCGGTGCAGGTCGT
+TGTCCTGTTTGCAGCGTTGGCGCTCTACGGTGTCGACCCGAACTTCAATCTCACGGTGTAGCCGCATGAC
+GACGCCGGGGAAGCTGAACAAGGCGCGAGTGCCGCCCTACAAGACGGCGGGTTTGGGTCTAGTGCTGGTC
+TTCGCGCTCGTAGTTGCCTTGGTATACCTGCAGTTTCGCGGGGAGTTCACGCCCAAGACGCAGTTGACGA
+TGCTGTCCGCTCGTGCGGGTTTGGTGATGGATCCCGGGTCGAAGGTCACCTATAACGGGGTGGAGATCGG
+GCGGGTAGACACCATCTCGGAGGTCACACGTGACGGCGAGTCGGCGGCCAAGTTCATCTTGGATGTGGAT
+CCGCGTTACATCCACCTGATTCCGGCAAATGTGAACGCCGACATCAAGGCGACCACGGTGTTCGGCGGTA
+AGTATGTGTCGTTGACCACGCCGAAAAACCCGACAAAGAGGCGGATAACGCCAAAAGACGTCATCGACGT
+ACGGTCGGTGACCACCGAGATCAACACGTTGTTCCAGACGCTCACCTCGATCGCCGAGAAGGTGGATCCG
+GTCAAGCTGAACCTGACCCTGAGCGCGGCCGCGGAGGCGTTGACCGGGCTGGGCGATAAGTTCGGCGAGT
+CGATCGTCAACGCCAACACCGTTCTGGATGACCTCAATTCGCGGATGCCGCAGTCGCGCCACGACATTCA
+GCAATTGGCGGCTCTGGGCGACGTCTACGCCGACGCGGCGCCGGACCTGTTCGACTTTCTCGACAGTTCG
+GTGACCACCGCCCGCACCATCAATGCCCAGCAAGCGGAACTGGATTCGGCGCTGTTGGCGGCGGCCGGGT
+TCGGCAACACCACAGCCGATGTCTTCGACCGCGGCGGGCCGTATCTGCAGCGGGGGGTCGCCGACCTGGT
+CCCCACCGCCACCCTGCTCGACACTTATAGCCCGGAACTGTTCTGCACGATCCGCAACTTCTACGATGCC
+GATCCGCTCGCTAAAGCGGCGGCCGGTGGCGGTAACGGCTACTCGCTGAGGACGAACTCAGAGATCCTAT
+CCGGGATAGGTATCTCCTTGTTGTCTCCCCTGGCGTTAGCCACCAATGGGGCGGCAATCGGAATCGGACT
+GGTAGCCGGATTGATAGCGTCGCCCCTCGCGGTGGCCGCAAATCTAGCGGGAGCCCTACCCGGAATCGTT
+GGCGGCGCGCCCAATCCCTATACCTATCCGGAGAATCTGCCGCGGGTGAACGCTCGCGGTGGCCCGGGGG
+GCGCCCCCGGTTGCTGGCAGCCGATCACCCGGGATCTGTGGCCAGCGCCGTATCTGGTGATGGACACCGG
+TGCCAGCCTCGCCCCGTACAACCACATGGAGGTTGGCTCGCCTTATGCAGTCGAGTACGTCTGGGGCCGT
+CAGGTAGGGGATAACACGATCAACCCATGAAAATCACTGGAACCGTCGTCAAACTCGGCATCGTCTCGGT
+GGTGCTGCTGTTCTTCACGGTGATGATCATCGTGATTTTCGGTCAGATGCGCTTCGACCGGACTAATGGC
+TATACCGCGGAGTTCAGCAATGTCAGCGGGCTGCGCCAAGGCCAGTTTGTCCGTGCTTCGGGGGTAGAGA
+TCGGCAAGGTCAAAGCACTACACCTGGTCGACGGTGGCCGTCGGGTTCGGGTGGAGTTCAATATCGATCG
+TTCGGTGCCGTTGTATCAGTCCACGACCGCCCAGATCCGCTATTCCGACCTGATCGGTAACCGGTACGTG
+GAGCTCAAACGGGGTGAGGGCAAGGGGGCCAACGATCTGCTGCCGCCAGGTGGACTCATCCCATTGTCCC
+GCACGTCACCGGCCTTGGATCTGGACGCGTTGATCGGTGGTTTCAAGCCGGTGTTTCGGGCGTTGGATCC
+CGCGAAGGTGAACAACATCGCCAACGCGCTCATCACCGTCTTCCAGGGGCAAGGTGGCACCATAAACGAC
+ACCCTCGACCAGACCGCGCAACTGACCAGCCAGATCGCGGAGCGCGATCAGGCGATCGGTGAGGTTGTCA
+AGAACCTGAACATCGTGCTGGACACCACGGTCAAGCATCGAAAAGAGTTCGACGAGACGGTCAATAACTT
+GGAGAATCTGATCACTGGGCTGAGGAACCACTCCGACCAGTTGGCCGGCGGCCTCGCGCACATCAGCAAC
+GGCGCCGGCACGGTGGCCGACCTGCTTGCCGAGAATCGCACGTTGGTGCGCAAGGCCGTCAGCTACCTGG
+ACGCTATTCAGCAACCGGTCATCGACCAGCGCGTCGAGTTGGACGACCTGCTCCACAAGACGCCGACCGC
+GTTGACGGCGCTCGGACGCGCCAACGGAACCTACGGCGATTTCCAGAACTTCTACCTCTGCGACCTCCAG
+ATCAAGTGGAACGGATTCCAAGCCGGAGGGCCGGTCCGCACGGTGAAGCTCTTTAGCCAGCCGACGGGTA
+GGTGCACGCCGCAATGAGAACGCTGGAACCACCCAACCGAATGCGAATTGGGCTCATGGGCATCGTCGTT
+GCGCTGCTCGTTGTCGCTGTGGGCCAAAGCTTTACCAGTGTTCCCATGCTATTCGCAAAGCCGAGCTACT
+ACGGCCAGTTCACCGACTCCGGCGGACTGCACAAGGGCGACAGGGTACGCATCGCCGGCTTGGGAGTGGG
+CACCGTGGAGGGGCTCAAGATCGACGGCGACCACATCGTGGTCAAGTTCTCCATCGGCACCAACACCATC
+GGCACCGAGAGCCGCCTAGCCATCCGCACCGACACCATCCTGGGTAGGAAAGTGCTCGAGATCGAGCCGC
+GCGGCGCCCAAGCGTTGCCGCCCGGGGGCGTTTTGCCGGTTGGGCAAAGCACCACCCCGTACCAGATTTA
+CGACGCGTTCTTCGACGTCACCAAGGCCGCATCCGGCTGGGACATCGAGACGGTCAAGCGGTCGCTGAAT
+GTGTTGTCGGAGACCGTTGATCAGACCTATCCGCACCTGAGCGCCGCCCTCGACGGGGTGGCTAAGTTCT
+CCGACACCATCGGCAAGCGCGACGAGCAGATCACGCACCTACTAGCCCAGGCCAACCAGGTGGCCAGCAT
+CCTGGGTGATCGCAGTGACCAGGTCGACCGCCTATTGGTCAACGCTAAGACCCTGATCGCCGCGTTCAAC
+GAGCGCGGCCGCGCGGTCGACGCCCTGCTGGGGAACATCTCCGCTTTCTCGGCCCAGGTGCAAAACCTTA
+TCAACGACAACCCGAACCTGAACCATGTGCTCGAGCAGCTGCGCATCCTCACCGACCTGTTGGTCGACCG
+CAAGGAGGATTTGGCTGAAACCCTGACGATCTTGGGCAGATTCAGCGCGTCGTTCGGTGAGACGTTTGCC
+TCTGGGCCCTACTTCAAAGTGCTGCTGGCCAACCTGGTGCCGGGTCAGATCTTGCAGCCGTTTGTCGATG
+CGGCATTCAAGAAGCGTGGTATTAGCCCGGAGGACTTCTGGCGCAGCGCCGGGCTGCCGGCATACCGGTG
+GCCCGACCCCAATGGCACCCGGTTCCCCAACGGTGCGCCGCCGCCACCACCGCCGGTGTTGGAGGGCACG
+CCCGAGCATCCCGGGCCGGCGGTGCCGCCGGGATCGCCGTGCTCCTACACCCCGCCGGCGGACGGTCTGC
+CGCGGCCGTGGGATCCGCTGCCCTGCGCTAACCTCACTCAAGGTCCATTCGGTGGCCCCGATTTCCCGGC
+GCCGCTGGATGTCGCGACGTCGCCGCCGAACCCAGACGGTCCACCGCCCGCCCCGGGCCTACCAATCGCG
+GGACGTCCGGGTGAGGTGCCGCCGAACGTTCCCGGCACGCCGGTGCCGATTCCACAGGAGGCTCCCCCCG
+GGGCACGCACGCTGCCCCTCGGGCCGGCGCCTGGTCCGGCTCCGCCCCCGGCGGCGCCAGGCCCGCCGGC
+ACCACCGGGCCCCGGGCCGCAGTTGCCGGCCCCGTTCATCAACCCCGGCGGCACCGGCGGTAGTGGCGTG
+ACGGGAGGTAGCGAGAATTGAGCACCATCTTTGATATCCGCAACCTGCGGTTGCCGCAGCTGTCGCGGGC
+CTCGGTTGTCATCGGATCGTTGGTGGTGGTGCTGGCGCTGGCCGCCGGAATTGTTGGTGTGCGGCTCTAT
+CAAAAACTGACGAACAACACGGTGGTCGCCTACTTCACCCAAGCCAATGCGCTGTATGTCGGAGACAAGG
+TCCAGATTATGGGCCTCCCGGTCGGTTCGATCGACAAGATCGAACCAGCCGGCGACAAAATGAAGGTGAC
+TTTCCACTACCAGAACAAGTACAAGGTGCCTGCCAATGCCTCCGCGGTGATCCTCAACCCCACCTTGGTG
+GCGTCGCGGAACATTCAGTTGGAGCCACCCTACAGAGGTGGTCCAGTGCTGGCCGATAATGCGGTGATCC
+CGGTCGAGCGCACCCAGGTACCGACGGAGTGGGACGAGCTGCGGGACAGCGTTTCGCATATTATCGACGA
+GCTCGGCCCGACACCTGAGCAGCCCAAGGGGCCGTTCGGCGAAGTCATCGAGGCATTCGCCGACGGGCTG
+GCCGGCAAGGGTAAGCAAATCAACACCACGCTGAACAGCCTGTCGCAGGCGTTGAACGCCTTGAATGAGG
+GCCGCGGCGACTTCTTCGCGGTGGTACGCAGCCTGGCGCTATTCGTCAACGCGCTACATCAGGACGACCA
+ACAGTTCGTCGCGTTGAACAAGAACCTTGCGGAGTTCACCGACAGGTTGACCCACTCCGATGCGGACCTG
+TCGAACGCCATCCAGCAATTCGACAGCTTGCTCGCCGTCGCGCGCCCGTTCTTCGCCAAGAACCGCGAGG
+TGCTGACGCATGACGTCAATAATCTCGCGACCGTGACCACCACGTTGCTGCAGCCCGATCCGTTGGATGG
+GTTGGAGACCGTCCTGCACATCTTCCCGACGCTGGCGGCGAACATTAACCAGCTTTACCATCCGACACAC
+GGTGGCGTGGTGTCGCTTTCCGCGTTCACGAATTTCGCCAACCCGATGGAGTTCATCTGCAGCTCGATTC
+AGGCGGGTAGCCGGCTCGGTTATCAAGAGTCGGCCGAACTCTGTGCGCAGTATCTGGCGCCAGTCCTCGA
+TGCGATCAAGTTCAACTACTTTCCGTTCGGCCTGAACGTGGCCAGCACCGCCTCGACACTGCCTAAAGAG
+ATCGCGTACTCCGAGCCCCGCTTGCAGCCGCCCAACGGGTACAAGGACACCACGGTGCCCGGCATCTGGG
+TGCCGGATACGCCGTTGTCACACCGCAACACGCAGCCCGGTTGGGTGGTGGCACCCGGGATGCAAGGGGT
+TCAGGTGGGACCGATCACGCAGGGTTTGCTGACGCCGGAGTCCCTGGCCGAACTCATGGGTGGTCCCGAT
+ATCGCCCCTCCGTCGTCAGGGCTGCAAACCCCGCCCGGACCCCCGAATGCGTACGACGAGTACCCCGTGC
+TGCCGCCGATCGGTTTACAGGCCCCACAGGTGCCGATACCACCGCCGCCTCCTGGGCCCGACGTAATCCC
+GGGTCCGGTGCCACCGACGCCGGCACCGGTGGGGGCGCCGTTGCCCGCTGAGGCAGGAGGGGGTCAATGA
+TGAGCGTGCTGGCGCGGATGCGGGTGATGCGCCACCGAGCCTGGCAGGGGCTGGTGTTGCTGGTGCTCGC
+ACTCTTGCTGAGTTCGTGCGGCTGGCGCGGCATCTCCAATGTGGCGATCCCCGGCGGCCCGGGCACCGGC
+CCGGGCTCCTACACCATCTACGTGCAGATGCCGGACACGTTGGCGATCAACGGCAACAGTCGGGTCATGG
+TGGCCGACGTCTGGGTCGGATCGATCCGCGCGATCAAGTTGAAGAACTGGGTGGCCACGCTGACGCTGAG
+CCTGAAGAAGGACGTCACGCTACCGAAAAATGCCACCGCCAAGATCGGGCAGACCAGCCTGCTGGGTTCG
+CAGCACGTCGAGCTGGCCGCGCCGCCAGATCCGTCGCCGGTGCCGCTGAAGGATGGTGACACCATCCCGT
+TGAAGCGCTCCTCGGCCTATCCCACCACCGAGCAGACGCTGGCCAGCATCGCCACCTTGTTGCGCGGCGG
+CGGCCTGGTGAACCTCGAAGGGATTCAGCAAGAGATCAACGCCATCGTGACGGGGCGGGCGGACCAGATC
+CGGGCCTTTCTTGGCAAGCTCGACACCTTCACCGACGAGCTCAACCAGCAACGCGATGACATTACCCGCG
+CCATTGATTCCACCAATCGGTTGTTGGCTTATGTGGGCGGTCGTTCGGAAGTCCTCAATCGGGTGCTCAC
+CGACCTACCGCCATTGATCAAGCACTTTGCGGATAAGCAGGAACTGTTGATCAACGCTTCCGATGCGGTA
+GGCCGGCTCAGCCAGTCCGCCGACCAGTATCTTTCGGCTGCCCGGGGCGATCTGCACCAGGACCTGCAGG
+CGCTGCAATGCCCGCTCAAGGAACTGCGTCGAGCCGCTCCGTATCTGGTGGGTGCGCTCAAATTGATCCT
+CACCCAGCCCTTTGACGTCGACACCGTGCCGCAGCTGGTGCGGGGCGACTACATGAACTTGTCGCTGACG
+CTGGACCTGACCTACAGCGCCATCGACAATGCGTTCCTTACCGGGACCGGATTCTCCGGTGCGTTGCGCG
+CCCTCGAGCAGTCTTTTGGCCGCGATCCCGAGACAATGATTCCCGACATCCGGTACACACCGAACCCCAA
+CGATGCGCCGGGCGGCCCGCTGGTAGAAAGGGGAAATCGCCAGTGCTGACTCGCTTCATCCGACGCCAGT
+TGATCCTTTTTGCGATCGTCTCCGTAGTCGCAATCGTCGTATTGGGCTGGTACTACCTGCGAATTCCGAG
+TCTGGTGGGTATCGGGCAGTACACCTTGAAGGCCGACTTGCCCGCATCGGGTGGCCTGTATCCGACGGCC
+AATGTGACCTACCGCGGTATCACCATTGGCAAGGTTACTGCCGTCGAGCCCACCGACCAGGGCGCACGAG
+TGACGATGAGCATCGCCAGCAACTACAAAATCCCCGTCGATGCCTCGGCGAACGTGCATTCGGTGTCAGC
+GGTGGGCGAGCAGTACATCGACCTGGTGTCCACCGGTGCTCCGGGTAAATACTTCTCCTCCGGACAGACC
+ATCACCAAGGGCACCGTTCCCAGTGAGATCGGGCCGGCGCTGGACAATTCCAATCGCGGGTTGGCCGCAT
+TGCCCACGGAGAAGATCGGCTTGCTGCTCGACGAGACCGCGCAAGCGGTGGGTGGGCTGGGACCCGCGTT
+GCAACGGTTGGTCGATTCCACTCAAGCGATCGTCGGTGACTTCAAAACCAACATTGGCGACGTCAACGAC
+ATCATCGAGAACTCCGGGCCGATTTTGGACAGCCAGGTCAACACGGGTGATCAGATCGAGCGCTGGGCGC
+GCAAATTGAACAATCTGGCCGCACAGACCGCGACCAGGGATCAGAACGTGCGAAGCATCCTGTCCCAGGC
+GGCCCCCACCGCCGATGAGGTTAACGCGGTATTCAGCGGTGTTCGCGATTCGCTGCCACAGACCCTGGCC
+AATCTTGAGGTTGTGTTCGATATGCTCAAGCGCTACCACGCCGGCGTGGAGCAATTGTTGGTGTTCCTCC
+CACAGGGTGCCGCGATCGCACAGACCGTACTCACGCCAACTCCGGGTGCTGCCCAGCTGCCGCTCGCGCC
+GGCGATCAACTATCCGCCGCCGTGCTTGACGGGTTTTCTTCCTGCATCGGAGTGGCGGTCTCCGGCCGAT
+ACCAGTCCCAGGCCGTTGCCGTCGGGAACCTATTGCAAGATTCCCCAGGATGCCCAGCTGCAAGTCCGGG
+GGGCGCGCAACATTCCCTGTGTCGATGTCCCGGGCAAACGAGCGGCGACGCCGAAGGAGTGCCGCAGTAA
+GGACCCGTACGTTCCGCTGGGTACCAACCCGTGGTTTGGTGATCCGAACCAGATTCTCACCTGCCCGGCA
+CCTGGAGCGCGCTGCGATCAGCCGGTGAAGCCGGGTTTGGTGATTCCGGCGCCCTCGATCAACACCGGTT
+TGAATCCGGCGCCCGCCGATCAGGTGCAAGGAACGCCCCCGCCGGTCAGTGACCCGTTGCAAAGACCGGG
+TTCGGGTACTGTGCAGTGCAACGGGCAGCAGCCTAACCCGTGCGTCTACACTCCAACATCGGGCCCGTCG
+GCGGTCTATAGCCCGGCCAGCGGTGAACTGGTGGGGCCGGATGGTGTCAAGTACGCCGTCGCAAACTCGA
+GCACAACAGGAGACGACGGATGGAAGGAGATGCTGGCGCCGGCCAGCTGAACCCTGCCGATGCGAATAAG
+TCGTCGTCTACGGAGGTGAAGGCGGCGGATTCGGCGGAATCTGACGCCGGAGCCGACCAGACTGGCCCGC
+AGGTGAAGGCGGCGGATTCGGCGGAATCTGACGCCGGAGAGCTCGGCGAGGACGCGTGCCCAGAACAGGC
+CCTCGTCGAGCGGCGCCCGTCGCGGTTGCGGCGAGGCTGGCTTGTTGGCATTGCGGCGACGCTGCTCGCG
+TTGGCCGGTGGCCTTGGCGCAGCGGGTTATTTTGCGTTGCGCTCACACCAGGAAAGCCAATCAATCGCGC
+GCGAGGACCTTGCGGCCATTGAGGCCGCTAAGGATTGCGTTGCGGCCACGCAGGCACCCGATGCTGGGGC
+GATGTCGGCTAGCATGCAGAAGATCATCGAGTGTGGCACCGGTGATTTCGGTGCCCAGGCGTCGTTGTAC
+ACCAGCATGCTCGTCGAGGCGTATCAAGCGGCCAGCGTCCACGTGCAAGTGACCGATATGCGCGCGGCGG
+TCGAGCGCAACAACAATGACGGGTCGGTCGATGTTCTGGTGGCGCTCCGGGTCAAGGTGTCCAACACCGA
+CTCGGATGCCCATGAAGTCGGCTACCGTCTTCGGGTCCGGATGGCACTGGATGAGGGCCGCTATAAGATC
+GCCAAACTCGACCAGGTGACGAAGTGACGGTGGTGGTCGAGAAGACGCCGACCACCCTGCCCCAGGCGAC
+ACCGAACGGTGCAGCGCCCTGGCATGTTCGGGCGGGCGCCTTCGCCATCGACGTGCTGCCCGGGCTCGCC
+GTGGCGGCGACCATGGCGTTGACGGCTTTAACGGTGCCGCCGGGCAGCGCGTGGCGGTGGTTATGCGCTT
+GTCTGCTCGGATTGACCATTCTCCTTCTGGCCGTTAACCGGTTGTTGTTGCCGACGATTACCGGATGGAG
+TCTTGGCCGCGCTCTTACCGGCATCCGGGTGGTTCGGCGTGACGGCTCCGCCATCGGTCCGTGGCGGTTG
+CTGGTCCGGGATTTGGCGCACTTGGTGGACACCCTCTCGCTGTTTGTGGGTTGGCTGTGGCCGCTGTGGG
+ATTCGCGGCGACGCACCTTCGCCGACCTGTTGTTGCGCACTGAGGTGCGACGTGTCGAACCGGTGCAGCG
+GCCCGCGGTGATACGGCGACTGACGGCGGCGGTGGCATTGGCGGCGGCGGGCGCGTGCGCGAGCGCAACC
+GCGGTGGGCGCTGCGGTGGTGTACGTCAATGAATGGCAAACCGATCACACTCGCGCGCAGCTCGCAACGC
+GGGGCCCGAAGCTCGTGGTCGACGTCCTGAGCTACGACCCCGAAACGGTGCAGCGTGATTTCGAACGGGC
+GCGATCGCTGGCCACCGACAGGTACCGCCCGCAGCTGAGCATCCAACAGGATTCGGTGCGCGAGTCGGGA
+CCTGTTCGTAACCAGTACTGGGTTACCGACAGCGCGGTGCTGTCGGCGACACCAGCTCAGGCGACCATGC
+TGTTGTTCATGCAGGGTGAACGCGGTACACCACCCAATCAGCGGTATATCAGCGCAACTGTGCGGGCGAT
+CTTCCAAAAATCGCGCGGGCAATGGCGCCTCGACGATCTGGCAGTCGTGATGAAACCCCGACAACCCACC
+GGCGAAAAATGAGCCCCCGTCGTAAGTTTGAACCCGGCGAGGGGGCGCTGCTGGCCCCGCAGTCAATCGA
+ACCGTCGCGGCGATGGGGTTTGCCGCTGGCTCTGACCGCATCCGCTGTGGTTATGGCCGCGGCGATCTCA
+GCCTGTGCGCTCATGCGGATCTCCCATGAATCGCACCAGCGAGCAGCGCACAAGGATATCGTGATGCTCA
+GTGATGTCCGATCTTTCATGACCATGTTCACGTCACCGGATCCGTTTCACGCCAACGAATATGCGGAGCG
+GGTGCTGTCCCACGCCACGGGCGACTTCGCCAAGCAGTACCACGAAAGAGCAAACGATATCCTGATTCGC
+ATCTCCGGGGTGGAACCGACCACAGGAACGGTTCTAGACGCGGGCGTACAGAGGTGGAACGAGGATGGTA
+GTGCCAACGTGCTGGTGGTCACCCAGATCACCTCGAAATCCGCGGACGGCAAGCGGGTGGTCTCGAACGC
+CAATCGTTGGCTGGTAACGGCTAAGCAGGAAGGTAACGAGTGGAAGATCAGCAGTCTGCTTCCGGTGATC
+TGACCCAAAAGTCCGTTGCCAACGGAGAGTCCACCGACACGGCATCCGCAGCCACCGAGGGCCACCGGGG
+CGAGATCGACGCCGCGGGAGAGCCGGACGAACGCGGTGCCGCCGTGGCTGACAGCCAAGCTGACGAGGAT
+GATTCGGCCGCGACGGCTGCCAGGGGCGGCAAGACACGGGCAAGACGATCGCGTGGCAGGCGGTTAGCGA
+TCACGGTCGGCGTGGCCGCTGCGTTGTTCGTGGGCTCGGCAGCGTTCGCTGGTGCGACGGTGGAGCCCTA
+CCTCTCCGAGCGCGCCGTGGTGGCCACCAAGCTCATGGTCGCGCGGACCGCCGCCAATGCGATCACGACG
+TTGTGGACCTACACGCCGGAGAACATGGACACCCTGGCCGATCGGGCCGCGAATTACCTCAGCGGTGATT
+TCGCGGCTCAGTACCGCAGATTCGTCGACCAGATCGCCGCAGCAAACAAACAGGCCAAGATTACCAACGA
+TACCGAGGTCACCGGTGCTGCCGTGGAATCGCTGAGCGGCCGGGATGCCGTTGCCATCGTCTACACCAAC
+ACCACGACCACCAGTCCGGTGACCAAGAACATCCCAGCATTGAAGTATCTGTCCTACCGGCTGTTCATGA
+AGCGTTATGACGCGCGGTGGCTGGTGACCAGGATGACGACCATCACCTCGCTGGATTTGACGCCGCAGGT
+GTAGCGGGACCGAGCCCGCCGGCGCTGCGAAGCCTTAGTTGAACGCCAGCCAGCTGGGCAGCGCCCGCTC
+ATGGGAGTCACAGAGCACCTGACGGGTGTCGCACGATCCTTTCGGCGACCCAGCGCCGGCCCACATGCCC
+CCGGTATCACGGCGCAGAACGATCGCCGATGACCCCCCGCCGTCGAGCAGAATCGCGGTGTCACTACCCA
+GGCCGCGGAACAGGTCTTGGATGTTGTCCGGGGTGTAGTTGCCGCCCTGGAAGATGTACATCTCGTCCTT
+CTGCTTCGCATAGGCAAGCGCCGTTCGCGCGGCGCTGGGACCGCCGTCGTGGAGCTGGCCGGTATTGCCG
+GGGGATAACAGCCCGATTCCGGCCACGGCGACGAACCGTGCATTCTTGTTGAGCAAGTCCTCGATCACCG
+GAGTGGCAAGATCGTAGTCCTGTCTGCTTTTGGGCCGCAAAACATACGGTGCACCACCGACCGGAAGGAT
+CATCGTCGTCAGCGAGCTCCACAACTCATTTCCTCCGGAAAGGCCCTGCTTTCCGGCGTAGGCGACGGTG
+CCGGTGACCGCTTGGTTGGCGCGTCCTTGTCCGCGGGTGTTGTCCACGTAGGCGCCCAGCGGTGAGCTGC
+AGCCGGTCGACCGCCAGCTGCCCCCCTTTTGTCCGCGAACGTCGAAGAAGTTGGCGTTGACCGCAATGGT
+GGGTCGCCCCATACGCTGCCACGCCTTAAGCGGCGGGTAGATCTCGGAGGCTTGCCACAAGCCTTCACCG
+GTGTGAGCACCTGGGTTGTGTTCGCAGCGCGCCTGGTCTCCAGTGTGGGTGTCTACCAGTAGATGTGGTG
+AAAGCCGTTGGGAGGCATTCTTGATGATCATCAGATGGCCGCCGTTGTTCATCTCGTACCAGTGACCACC
+TGCGTTGAGCAGCGGCATAGGATGACCGCCGCCGAAGTTGTACACCAGGTATGAGCCCCTGGTGGTGGCT
+ATCGCTTGGGCGAGCATCTCGCGCCCGTCGGCGGCGCGGGCGGCCGGCTGCCCGGTGGTGCAGGCGAGGG
+CGGCGCACACCGCCAACGCGGCGTAGCAAGCCGTCAATCGGCGCAGGCTGGCAGTCGGTGTCAGCACAGC
+AACCCTCTCGGCCCGAATCCACATGCAACCATCCCAGCATTAGGCACACTGATCACACTGTCAACTTCAG
+TAACAGCTGCGTGACGGTTCGGCCGCGTTCGAATTACGGTTGTTCGCTTGAGCTTTCGCGTGCGCTTTGG
+CGAGCTTGGTATTGAGCTTGGTGTTCCACGGCGATCGCCATCTCGACCGCTCCCGGAATTCGGTGGAAGC
+TGCTGCGGTCGTACAGGTGTGTGATGAATCCACCCAGCAACAGCCCGATGATCAGCCCGATCGACGTCAT
+GGTCAGGGCCTGGGACAGGCCGGCGTCGGCGTTTCCGTTCAGATACAGCAGTGACCGCACACCTAGGAAC
+ACCTGGTGCATCGGCTCGAATTGAGCCAACCAGCGGAAGAACGCTGGTACGGCTTCCAGCGGGACGGTCG
+CGCCCGCCGACGGCAATCCGAGGATGACGAAGATCAACATGCTGACCAACAGGCCCATCGAGCCCAGCAC
+CGCGATCAGCGAGCTGGACGTGACGCCGACCGCTATGATCGCGAATACTCCGTAGAGCCATACTTGCCAC
+CCGAGCGGAATCGGCATGCCCAGGCCGTGGGCGATCGCCAGGTAGACACCCGAGGTGAGCAACGCCAGCA
+CCACCATCACCGCCCACTTGACCAACAGCGTACGGAAGCGAGAGATGTTGACCTGCTCGGCGAAGCGATA
+GACGGGGCCGAATTCGGCTGGTACATAGCCAAGCATCGAGTCCACCAGGGTGCTCACCACGATGCTGCCG
+GTAAAGCCCGCCAATAGCAGCAAGAGGGCGTAGTAAAACGCCGACAGCCCGTTGCCGGTGCCGTTGGGCA
+GTGGGTTATAGGCGGTGGATTTGACATCGATGGGACTGGCCAGCCCGGCCGCCGCCGCCCCGGCCAGTGC
+CACACCGCCGGTCTGGGCCGCTACCTCCGCGGTAAGTCGCTCGCCCACTTTGCCGTTGACCACCGTCAGT
+GCCCGGGTCAGCGTCTGGCCGGCGATGCTAGCTGCCAGCGTGCCCGCCCGCGGATTCGTTGAGATCGTGA
+TCGCGGGCCGGTCTGTGCGGGTTGGCGTCACCGCACTCGCCCCGAAGTCCCGTAGCTGCGACGAGAAGGT
+CGGCGGTATCAGCGCCGAGCCGTACACCGCCGCGGTGTCGAGCAGCCGCCTGGCCTCGTCCGGCGAAACC
+ACTCGGATGTCGAACTTGTTCTTGTCCAAGCCGGAAACCAGACCGTCGACAATCTGCTGGCCCGCGGGCC
+CGGCGTCCTCGTTCACCAACGCGATTGGGAAATGCCGCAAATTGGTCATGGGGTTTAGGATGCCGCCCAG
+ATAGAGCGCGGCCAGCGCCGACATCAGGGCCAACGTGGTGGCGATCGGTGCCATCCAGAAACGCACCGTC
+CGAATCGCTTTGACGTTCCGCTTGGGGTTGGGTGCGGCGGGGCGCGGCTGCGCTTGAGACATGCGAGCTC
+CTGTCTGTCGTGGCCACTCTATGTTGCCGAATCGCCCAGCTTCGCGTGCATCTCCCAGATCAGTACTTCC
+GACGGCTCATTGGCGGTCAGGCCGCGGGCGTCAGCGTCGGTGAACCGCACCGCGTCCCCGTCGGCAAGCT
+CGCCGCCACCTTCCAGAGTGAGGCGGCCGTAGGCGACGAACAGATGCAGGAAGGGTGCGCAGGGCAGGCT
+GACCGTAGCGCCGGGCCGCAGCCGCGCGCCGTGCAACGAGGCGCTGCTGTTATGCAGGGTGAGCGCTGCG
+TCTTGCCCGGGTATGCCCGACGCGATGGTTACCAGGCCGGCGCGCAACAGTTCGTCGTCTATCTCCTGCT
+GTTGGTAGCTGGCAGTGATGCCGGTTGCATCGGGTATTACCCACATCTGCACGAAATGCACCGGCTCGGT
+AGCAGAATCGTTCATTTCCGAATGCAAGATTCCGGTGCCGGCCGACATGCGTTGGGCCAGACCGGGATAG
+ATCACTCCGCTATTGCCGGCGGAATCCTGGTGTCTGAGCGCTCCCCGCAGCACCCAGGTCACGATTTCCA
+TGTCACGGTGTGGATGGGGATCAAAACCCGAAGCCGGTTCCATTTGGTCGTCGTTGTTCACCAACAGGAG
+CCCGTGGTGGGTGTTGTCGGGATCGTAGTGGTCGCCGAATGAGAACGAATGCCGGGATTTCAGCCAGGAC
+GTCGTGGTGACCGCCCGGTCGGCCGCACGCCTTATCTCGACGGTGGCGGTCATGACGTCACGTTCGCCAT
+CACAGCGAATCGGGCAGGCCGAATTTCGGGAACAAGGTGGTGTCGAGGAAGGCCACCACGTGTGACACGC
+GGTCGGCGGCCATGTCCAGCACGTGTAGCTGAAAAGGCAGGTGCACGTCACCGGCACGCATGTACATGGC
+CGCGGCGGGCTGGCCGTTGGCGATCAACGAAATCAGGCGCATATCGCCAGGCGAATAGGCGGGGCACTGT
+TGGTGAATGAGGGTGACGATGGCCTGTGCGCCCTGGTACCAGCCGGTATACGGCGGCATTTCCCAGATCG
+CCTCGGCGGTGAACAGCTCGACCAACCGGTCGATGTCATAAGCCTCGAACGCGGCGATATAGCGGGCCAA
+CAGGTCTTGCGCCTCGGGTGAATCCGGCGCGGACAACCGGTCGGCGGCGCTGGGCCGGACCGTCTGCAGC
+TGAGAGCGGGCCCGCTGCAGCAGGCTATTGACGGCGACGGTGCTGGTACCGATCGCGTCGGCCACCTCGG
+CCGATTTCCACTGCAGCACGTCGCGCAGCAGCAGTACGGCTCGCTGCCGGGGTGAGAGGTGCTGCAGAGC
+CGCCACAAAGGCCAACCGCACCGATTCCCGGTTCCCGACGATCGTTGAGGGATCAGCAGGGTCGTCCGTC
+ACGTCCGGCAGCGGCTCCAGCCAGGACACCTCTCGACGTTCCACCAACTCCCCGGACGGATCGGCACTCG
+GCCGCCCGAGCCCCGTCGGCAACGGCCGGCGTCGACGGCCCTCCAACGCCGTCAGGCAGGTGTTGGTGGC
+GATCCGATGCAGCCAGGTGCGTAGCGAGGACTTGCCCGCGAAGCCCTCATAGGCCTTCCAGGCCCGCAGC
+AGCGTCTCCTGAACAAGGTCTTCCGCGTCGTGCAGCGAGCCAGTCATGCGATAGCAGTGTGCGAGCAGTT
+CACGCCGGTAGGGCTCGGTGTGGGCGGAGAAGTCCCCGCGCCGTTCGTCGGCGGGCTCGCGGCCAGAGTT
+TTCTGCGAGCACACTCACGTCAATGAGCCTACGCAGAGTCTCCGACACTCTCACCGGAGCAGCCGTTACG
+CTCCCGGTAATGACTACCACCCGGACTGAACGGAATTTCGCGGGCATCGGCGATGTGCGCATCGTCTACG
+ACGTCTGGACGCCGGACACCGCGCCGCAAGCGGTGGTCGTGCTGGCCCATGGTCTGGGCGAGCATGCCCG
+CCGCTACGACCATGTCGCGCAGCGGCTCGGCGCGGCCGGCCTGGTCACCTATGCGCTTGACCACCGCGGG
+CATGGCCGCTCGGGTGGCAAACGGGTGCTAGTGAGAGACATCTCCGAGTACACCGCTGACTTCGACACCC
+TCGTTGGGATCGCCACCCGGGAATATCCCGGGTGCAAGCGCATCGTGCTCGGGCACAGCATGGGCGGCGG
+CATTGTGTTCGCTTACGGTGTCGAACGTCCAGACAACTACGACCTGATGGTGCTTTCGGCGCCGGCGGTG
+GCGGCACAGGACCTGGTGAGCCCGGTAGTGGCGGTTGCCGCCAAGCTTCTGGGCGTCGTGGTGCCCGGCC
+TGCCGGTGCAGGAACTGGATTTTACTGCCATCTCTCGCGACCCTGAGGTGGTCCAGGCTTACAACACCGA
+CCCACTCGTGCACCACGGACGGGTTCCGGCCGGGATTGGCCGCGCGCTGCTGCAGGTGGGCGAGACCATG
+CCGCGGCGAGCACCGGCATTGACCGCGCCGCTGCTAGTGCTGCACGGCACCGATGACCGGCTGATCCCCA
+TCGAGGGCAGCCGTCGCCTGGTCGAATGTGTGGGATCGGCCGACGTGCAGCTGAAGGAGTATCCCGGGCT
+GTACCACGAGGTGTTCAACGAGCCGGAGCGCAACCAGGTGCTCGACGATGTGGTCGCCTGGCTCACCGAG
+CGGTTGTAGGCCGAGCCGACCTGTCGCAGCCCTCCACTAGTTTTGGCGCCATGACCAACGACAAGATGCT
+GGCCCGCATCGCAGCCCTGCTGCGCCAGGCCGAAGGCACCGACAACCCGCACGAGGCCGACGCGTTCATG
+AGCACCGCACAACGGTTGGCCACGGCGGCATCCATCGACCTGGCGGTGGCCCGGTCGCACGCGGGCAACC
+GTTCACCCGCGCAGGCCCCGACACAGCGCACCATCACCATCGGGGCGGCGGGCACCCGCGGATTGCGGAC
+CTATGTGCAGCTCTTCGTGCTCATCGCGGCGGCCAACGACGTGCGCTGCGACGTGGCATCGAATTCGACG
+TTCGTGTACGCCTACGGGTTCGCCGAGGACATCGACACCAGCCACGCCCTATACGCCAGCCTGGTGGTCC
+AGATGGTCCGGGCATCCGACGCCTACCTCGCCTCGGGAGCGCACCGGCCCACGCCGACGATCACCGCCCG
+ACTCAACTTCCAGCTGGCGTTCGGCGCCCGGGTCGGCCAGCGCTTGGCCGATGCCCGAGAGCAGACTCGG
+CAGGAAGCCACCAAGGACCGTGATCGTCCGCCTGGTACCGCAATTGCCCTGCGGGACAAGGACATCGAGC
+TGCATGAGTACTACCGTCGTTCCTCTAAGGCGCGCGGCGCCTGGCGAGCCAGCCGGGCCACCGCGGGATA
+CTCGTCGGCGGCACGGCGCGCCGGTGATCGAGCGGGACGGCAAGCACGACTCGGGAACAACCCCGAGCTG
+CCCGGGGCACGGGCCGCGCTGGGCCGGTGATCGGCGCGGACGTTCCGCGGGATTCCCAGCGTGCCAGGGT
+GTACGCGGCCGAGGCGTTCGTCCGGACCTTGTTCGACCGCGTCACCGCACACGGCTCACCGACGGTGGAG
+TTCTTCGGTACCCAGTTGACGCTGCCCCCAGAAGGTCGGTTCGGTTCGGTGGCATCGGTGCAGCGTTATG
+TGGACGACGTGCTTGCGCTACCGGCGGTAGGGCAGAACTGGCCGACGGTGTCGCCGGTGCGCGTGCGGGC
+GCGCCGGGCGGCCACCGCGGCGCACTATGAAAACCATGGCGGCACAGGCACTATTGCGGTACCCGACCGG
+CACACCGCCGGTTGGGCGATGCGCGAGTTGGTCGTGCTACACGAAGTGGCGCATCATTTGTGCCAGGTGC
+CACCGCCACACGGACCCGAGTTTGTGGCGACGGTGTGCACCCTGACAGAGCTGGTGATGGGACCCGAAGT
+TGGTCACGTGTTTCGCGTCGTCTACGCGCAGGAGGGCGTGCGCTGAACGAGCTAGACGCCGACCTGCGGG
+CACGTGAGGTCGAGGCCCAGATGACCGACGACGAGCGATTCTCACTGTTGGTCGGCCTGACCGGGGCCAG
+CGATCTGTGGCCGGTGCGCGATGAACGCATCCCACAGGGCGTGCCGATGTGTGCCGGGTATGTGCCGGGG
+ATTCCCCGGCTCGGGGTCCCGGCCTTGTTGATGAGCGATGCCGGTCTGGGCGTCACCAACCCTGGCTACC
+GCCCCGGTGACACCGCTACGGCGCTGCCCGCCGGCCTTGCCCTAGCGGCCAGCTTTAACCCGGTGCTGGC
+CCGGTCCTCGGGCAAAGCGATCGGCCGGGAGGCGCGCAGTCGCGGGTTCAACGTGCAACTGGCCGGCGCA
+ATCAATCTGGCGCGCGACCCGCGTAACGGCCGCAACTTCGAGTACCTTTCCGAGGACCCGTTGTTGAGTG
+CCACGATGGCCGCGGAGTCGATCATCGGGATTCAGCAGCAGGGTGTCATTGCGACGACGAAACACTTCTC
+GCTGAACTGCAACGAAACCAATCGGCACTGGCTGGACGCGGTCATCGATCCCGACGCGCACCGCGAGTCG
+GACTTGTTGGCGTTCGAGATCGTCATCGAGCGGTCGCAGCCCGGCGCCGTGATGGCGGCGTACAACAAGG
+TCAACGGAGATTACGCTGCCGGCAACGACCACTTGCTCAACGACGTGCTGAAAGGTGCTTGGGGATACCG
+CGGTTGGGTGATGTCGGATTGGGGCGGAACACCCAGCTGGGAGTGCGCGCTGGCCGGCCTGGACCAAGAG
+TGCGGTGCGCAGATCGATGCAGTGCTGTGGCAGTCGGAAGCATTCACCGACCGCCTGCGTGCCGCCTACG
+CCGACGGCAATCTACCCAAGGGGCGCCTGTCGGACATGGTACGGCGGATCCTGCGGTCGATGTTTGCCGT
+CGGAATCGACCGATGGAAACCAGCGCCGGCGCCGGACATGAACGCGCACAACGAGATTGCCGCACAGATG
+GCGCGGCAAGGAATCGTGCTGCTGCAAAACCGAGGGCTGCTGCCGCTCGCTCCCGAATCGGCCGGGCGTA
+TTGCCGTCATCGGCGGCTATGCACACCTCGGTGTGCCAGCCGGTTACGGTTCGAGCGCCGTCACCCCGCC
+GGGGGGCTATGCGGGCGTGATACCGATCGGTGGGTCTGGCTTGGCAGCCGGGTTGCGTAATCTCTACCTG
+CTGCCGTCAAGCCCGCTGAGTGAGTTGCGAAAGCGGTTGCCCAACGCGCAGTTCGAGTTCGATCCTGGCA
+TCAACCCGGCGGAGGCGGTGCTGGCTGCGCGGCGAGCAGACATCGCGATCGTGTTCGCGATCCGTGCCGA
+AGGAGAGGGCTTCGACAGCGCCGATCTGTCGCTGCCATGGGGTCAGGATGCGCTGATCGCCGCAGTCGCG
+TCCGCCAACGCGAATACCGTTGTGGTGCTTGAGACGGGCAACCCGGTGACCATGCCCTGGCGCGACTCGG
+TGAACGCCATCATGCAGGCCTGGTATCCGGGCCAGGCGGGTGGCCAGGCCGTTGCGGAGATTGTGACCGG
+GCAGGTGAATCCTTCGGGCCGGCTGCCGATCACCTTCCCGGTCGATCTCGGTCAGACGCCACGCTCGCAA
+CCGCGCGAGCTCGGTGCCCCGTGGGGGACATCGACCACGATCCACTACACCGAGGGCGCCGATGTTGGTT
+ACCGCTGGTTTGCCAGCACAAATCAGACCCCGATGTTCGCGTTCGGTCACGGCTTGTCCTATACCAGTTT
+CGAGTATCGTGACCTGGTGGTGACGGGCGGCCACACCGTGCACGCCAGTTTCAGCGTTACCAACACGGGC
+GACCGCAGCGGGGCGGATGTCCCGCAGCTGTATATGATCGCAGCTCCCGGCGAATCGCGGTTGCGGTTGC
+TGGGATTCGAGCGGGTCGAGCTCGAACCCGGCCAGACTCGGCGGGTAAGGATCGAGGCGGACCCGCGACT
+GCTCGCCCGCTACGACGGCGAGGCCAGAAGCTGGCGCATCGAGCCGGGCGGTTACACGGTGGCGGTGGGC
+GCTTCGGCGGTAGCGCTGAAGCTGGCAGCCAAGGTCAAGCTGGCCGGCCGTGGGTTCGGGCGGTGACGGG
+CCGGCCCAGCGAGGCCCGTACCCACGACCGGCATGATAGGTCTACTTGACCGGGGCCAATTCGTCGCCGC
+AGGTGCAGCGGTAGGCGTCACCGGCGCCAGCACAGTGGCATGGGACTTCGATGCGAACCCGACAGCCACA
+GCCCTCGTGGCTGCAGGTCAGCAAGGTCCCAGCCTCGTAGTTCGTCATTCGTATCACCCTCATCCGTGTC
+GGGGATCCCCGAGGAATCCCAGGTGGTCAGCTGTCGGTAATCCAGAACAGCTACTTAAATATATACCCTA
+TACGGGTATCTGGTAAACCCCCAGGCCGGTGGGCGGTTGCCTGCTGGCGCGCGACGGTCGGTGGTCGCGC
+TAGCGTTTGGGCATGGACCAGCAACCCAACCCGCCCGACGTCGACGCATTTTTGGACAGCACACTGGTCG
+GCGACGATCCGGCGTTAGCCGCGGCATTGGCGGCCAGCGACGCGGCCGAGTTACCCCGCATCGCGGTGTC
+GGCACAGCAGGGCAAGTTCCTGTGCCTGCTGGCCGGTGCCATCCAGGCGCGCCGCGTCCTCGAGATCGGC
+ACACTCGGTGGCTTCAGCACCATTTGGCTGGCGCGTGGCGCGGGCCCACAGGGACGGGTGGTCACGCTGG
+AATACCAGCCCAAGCACGCTGAGGTCGCCCGGGTGAACCTGCAGCGAGCGGGCGTCGCCGATCGGGTGGA
+GGTGGTCGTCGGTCCGGCGCTGGACACGTTGCCGACGTTGGCCGGTGGCCCGTTCGACCTGGTGTTCATC
+GACGCCGACAAAGAGAACAACGTCGCATATATTCAGTGGGCGATCCGGTTGGCCCGGCGCGGCGCAGTGA
+TCGTGGTGGACAACGTTATTCGTGGCGGCGGGATTCTTGCTGAGTCCGACGATGCCGACGCAGTGGCGGC
+ACGTCGGACGCTGCAAATGATGGGTGAGCACCCCGGCCTAGACGCCACGGCGATCCAGACCGTCGGGCGC
+AAGGGCTGGGACGGTTTCGCCCTCGCTTTGGTGCGGTAGCCGCTGGTCCGGCGCCCAATTTTCGTTGCTG
+GCATCCCGAAAACGGGCGTAATCTTGGAGCAGATGGATGGGTGGCAGCGAGCCCAAAAGTTTTGCTGCAT
+AACAGAAAGGTTGCAAAATGAGTACAGTCCATTCATCAATTGATCAACACCCTGATTTGTTGGCTCTGCG
+TGCCAGCTTCGACCGCGCCGCCGAGTCGACGATCGCGCATTTCACATTCGGTCTGGCCCTGCTGGCGGGC
+CTGTATGTGGCTGCATCGCCGTGGATCGTCGGCTTCAGCGCCACCAGAGGGCTGCCAACGTGTGACCTTA
+TCGTGGGGATCGCGGTCGCGTACTTGGCGTATGGGTTCGCGTCGGCCCTGGATCGCACACACGGCATGAC
+CTGGACGCTACCCGTGCTCGGTGTGTGGGTCATTTTCTCGCCGTGGGTGCTACCAGGGGTCGCGGTGACG
+GCTGGCATGATGTGGTCGCACATCATCGCAGGTGCGGTGGTAGCCGTCCTGGGCTTCTACTTCGGGATGC
+GCACGCGGGCCGCGGCTAACCAAGGATAGTTCGAAGTTCGCGAGCCAGAGGGCAACTCGGGAATGTCCTG
+GCCGGGGCGGTCCCGGCCAGGCAGCGGCTAGTTGCGGCTAGCCGCAGACCGCGCCGACCGCGGCAGAGCT
+GACCAGCTTGACGTACTTGGACAGTACGCCAGTAGTGTAGCGCGGCGGTGGAGGACTGAAATCCTGTTGT
+CGGGACGCGAATTCGGCCGGATCGGCCAACACATCGAGAACGCGGCCGGCCACGTCGAGCCGGATCCGGT
+CGCCGTTGCGCAGAAGTGCGATCGGTCCGCCGTCGACCGCCTCCGGTGCGATGTGGCCAACGCACAGGCC
+GGTGGTTCCACCGGAGAACCGGCCGTCGGTCAGCAGTAGAACATCTTTACCGAGTCCTGCGCCTTTGATC
+GCGCCTGTGATGGCGAGCATTTCGCGCATCCCGGGGCCGCCCTTGGGTCCTTCGTACCGGATTACCACGG
+CGTCGCCCACGGTAATGGTGCCATCCTCAAGGGCGTCCAGCGCAGCGCGCTCGCCGTCGAAAACTCTTGC
+GGTGCCTTCGAATACGTCGGAATCGAATCCGGCGGTCTTGACCACCGCACCTTCGGGTGCCAGCGATCCG
+TGCAGGATGGTGATGCCACCGCTCGGGTGGATCGGGTTTGCCAACGCACGTAGCACCTTGCCATCTGGAT
+CCGGCGGGGTGATGGCAGCCAGATTCTCGGCCATGGTGTGACCGGTAACCGTCAGGCAGTCGCCGTGTAG
+CAGACCGGCGTCCAGCAGCGCCTTCATAACCACCGGCACACCGCCGATGTGATCGACGTCGGACATCACA
+TGGCGGCCGAACGGCTTGACATCGGCCAAATGCGGCACCCCCGACCCGATCCGGCTGAAGTCCTGAAGCG
+ATAGTGCGACGTTGGCCTCGTGGGCGATGGCCAGCAGATGCAGCACCGCGTTGGTCGAGCCGCCGAACGC
+CATTACCACCGCGATGGCGTTCTCGAACGCCTCCTTGGTGAGGATGTCGCGGGCGGTGATGCCGCGGCGC
+AGCAGCTCGACGACGGCCTGACCGCTGCGACGCGCGAACCCGTCGCGCCGGCGGTCGGTCGCCGGCGGTG
+CCGCGCTGCCCGGCAACGACATGCCGAGCGCCTCGGCGGCGCTGGCCATGGTGTTAGCGGTGTACATGCC
+GCCGCATGCCCCTTCGCCGGGGCAGATTGCCCGCTCGATGGCATCGACGTCGGCGCGACTCATCAAACCG
+CGAGAGCACGCTCCGACCGCCTCGAAGGCGTCAATGATGGTGACGTCTCGTTCGCTACCGTCGGAGAGCT
+TGGCCCGGCCGGGCAAAATAGAGCCCGCGTAGAGGAACACCGCCGCCAGATCCAGTCGTGCGGCGGCCAT
+CAGCATTCCGGGCAGCGATTTGTCGCATCCGGCCAGCAGCACCGAACCGTCGAGTCGTTCGGCCTGCATC
+ACGACTTCGACGCTGTCGGCGATCACCTCACGGGAAACCAGCGAGAAGTGCATCCCCTCATGACCCATGG
+AGATGCCGTCCGAAACCGAGATCGTGCCGAACTCAAGCGGATAGCCGCCGGCCGAAAACACCCCCTCCTT
+GACCGCGTTGGCCAGCCGGTCCAATGAGAGATTGCACGGCGTGATTTCGTTCCACGACGACGCGACCCCG
+ATCTGTGGCTTCGCGAAGTCTTCGTCGTCCATGCCCACCGCCCTCAACATGCCCCGGGCAGCGGCCTTCT
+CCAGGCCGTCGGTGACGTCTCGACTGCGGGGCTTGATGTCGGCGACCGTCGAGACGGAAGCGGCTTCGTC
+GGTGGTTTGCGGCATTGTTCAAGTATGCGGCCCAAGGATGCGCTCGCCGCGGCACGGTTGCCAAATTCTA
+GGTCCGATACCCCGCTGGGGTACAAGATATGATGGGTAGCATGCCTGGGCCCTGCTTTCGGGTTGGCGAG
+TATCTCTGGAGATGGCGAGTAAATGACAGCAGCACACGGCTACACGCAGCAAAAGGACAACTACGCCAAG
+CGGTTGCGTCGCGTCGAGGGGCAAGTGCGCGGCATCGCGCGAATGATCGAGGAAGACAAGTACTGCATTG
+ACGTTCTGACCCAGATCAGCGCCGTCACCAGTGCGTTGCGGTCGGTGGCGCTGAACCTGCTGGACGAGCA
+CCTGAGCCACTGCGTCACCCGTGCCGTGGCCGAGGGCGGTCCTGGGGCTGACGGCAAGCTGGCAGAGGCC
+TCGGCAGCAATCGCGCGCCTGGTTCGTTCCTGATCGCCGCGTGTTGAAGCGCAAACCTGCCCACCACCCG
+TTGGTGCGGTGCGTACGGTAGGGGCAGCGTAATCGTGCCCTGAACGACCCCGAACCATCGAACTTCGCGG
+CCGATTCCGCGCAGGACGCGATGACTGCCCCAACCGGAACCTCCGCCACTACGACGCGACCGTGGACGCC
+ACGGATCGCCACGCAACTGTCCGTGCTGGCTTGCGCGGCCTTTATCTATGTCACCGCCGAAATCCTGCCA
+GTGGGCGCGCTGTCGGCGATAGCGCGGAACTTGCGCGTCAGCGTGGTCCTAGTTGGGACCTTGCTGTCCT
+GGTATGCCCTTGTCGCGGCCGTGACAACGGTTCCGCTGGTGCGTTGGACCGCACACTGGCCGCGCCGCCG
+GGCCCTGGTGGTCAGCCTGGTCTGCCTGACCGTCTCGCAACTCGTCTCGGCGCTGGCGCCCAACTTCGCG
+GTGCTGGCCGCCGGGCGGGTGCTCTGCGCGGTCACCCATGGCCTGCTGTGGGCGGTCATCGCGCCGATCG
+CCACCCGGCTGGTGCCGCCCAGTCACGCCGGGCGCGCCACGACGTCGATCTACATCGGAACCAGTCTGGC
+GCTGGTCGTCGGTAGCCCACTCACGGCTGCCATGAGCCTGATGTGGGGTTGGCGGCTGGCGGCGGTGTGC
+GTGACCGGCGCGGCGGCCGCGGTCGCCCTGGCCGCCCGGCTGGCGTTGCCGGAGATGGTGCTGCGCGCCG
+ACCAGCTCGAGCACGTTGGCCGACGGGCTCGTCACCACCGTAATCCTCGCCTGGTCAAGGTCAGTGTGCT
+CACGATGATCGCGGTAACCGGCCATTTCGTGTCCTACACCTACATCGTGGTGATCATCCGCGACGTCGTC
+GGTGTACGTGGGCCGAATCTGGCCTGGCTGCTCGCCGCCTATGGGGTCGCCGGCCTGGTGTCCGTGCCCC
+TGGTGGCGCGGCCGTTGGACCGTTGGCCCAAGGGCGCCGTCATCGTCGGTATGACCGGACTGACGGCGGC
+GTTCACCTTGCTGACCGCGCTGGCATTCGGTGAACGCCACACCGCGGCGACGGCACTGCTGGGCACCGGT
+GCGATTGTGCTGTGGGGAGCCTTGGCCACTGCCGTGTCACCGATGCTGCAATCGGCGGCGATGCGTAGCG
+GCGGCGACGACCCCGACGGGGCCTCAGGTTTGTATGTGACGGCGTTTCAGATCGGCATCATGGCCGGCGC
+TCTGCTGGGTGGGCTGCTCTACGAGCGCAGCTTGGCGATGATGCTGACCGCGTCGGCGGGTTTGATGGGT
+GTTGCGTTGTTCGGGATGACGGTTAGCCAGCACTTGTTCGAGAATCCGACTCTGAGTCCCGGCGACGGCT
+AACACAGCAGGTCAGCGGGACCAGTTGGTGCCGCTATGCCACACTGGGCTGAAGAACGTCACCGGAGGGA
+AAGCAATTATGTCGCGCTGGAAGCAGGGCTGGACGAGGGGGAGTCTATTCGCCGCTCTGAACATAGCCGC
+AGTGGTTGCGGTGCTGATGCTGGGTGCTGGCGTTGCCGTGGCGGACCCGGACGCGGCTCCCGGCGATCCC
+GGAGGTCCCGGGGGCCCCGGGGGCACAGCGGGACCCGTCGACCCGCCGGCAGTTGACCTGTTGGCGCCGC
+CACCCGACCCGTTGGCGCTGCCGCCGGCACTTGACCCGTTGGCGCCGCCGCCACCTGACCCGCTCGCGCC
+GCCCCCGCCTGACCCGCTGGCAGTGCCGGTAGCAGCGGGCCCCGTTGCCGGGCAGGATCCGACACCGTTT
+GTTGGCCCGCCGCCGTTCCGGCCGCCGACGTTCAATCCGGTCGACGGCGCGATGGTCGGTGTGGCCAAGC
+CGATCGTCATCAACTTCGCGGTGCCGATCGCCGACCGGGCGATGGCCGAAAGCGCCATCCACATTTCGTC
+CATCCCGCCCGTGCCGGGCAAGTTCTACTGGATGAGCCCGACTCAGGTACGCTGGCGCCCGTTTGAGTTC
+TGGCCCGCCAACACCGCGGTAAACATCGATGCGGCCGGCACCAAGTCGAGCTTCCGGACCGGTGATTCGC
+TGGTGGCCACCGCCGACGACGCCACGCATCAGATGACAATCACCCGCAACGGCGTCGTGCAAAAGACCTT
+CCCCATGTCGATGGGCATGGTGTCCGGCGGCCACCAGACCCCGAATGGCACCTACTACGTGCTTGAGAAG
+TTCGCCACCGTGGTCATGGACTCCTCGACGTACGGGGTCCCGGTCAACTCGGCCCAAGGCTACAAGTTGA
+CCGTCTCCGACGCCGTCCGGATCGACAACAGCGGCAACTTCGTGCACAGCGCGCCGTGGTCGGTGGCAGA
+TCAGGGCAAGCGCAACGTCACCCACGGCTGCATCAACCTCAGCCCGGCCAACGCGAAGTGGTTCTACGAC
+AACTTCGGCAGCGGTGACCCGGTCGTCGTGAAGAACTCTGTCGGGACTTACAACAAAAACGACGGTGCCC
+AGGACTGGCAGATCTAACGGCCGCGCGGTTGCCCACGAGTGACCCGTAGCCAATCGCGGCTCCCCTTACT
+GGAGCTTTACTGAAAGCAGGTCAGCGACAGCATCGTGTAGTGCCGAAGCAGCCGGCGGGCGCAGTCTTTC
+ACCACCAGGTTGCGCCTGCCGTCGAGACTGTAGGCGGCGTCGACCGCCCAGAAGGCGAACAAGCTGGTCG
+ATAGGTAAGCGGCCATGTCCTCGCAGCGCAGCAGTGCCTCGGCCACATCCTCGAGCAGGTGTTTGACCGA
+GCGCGCGGCCTCGGCATGGCTCATGCCGAGCAAGTCGAAGTGCCAATCGGCGGGCGGGTCTTGGTCTTCG
+TCCAGCGGCAGCGTCTTTAGCACCTCGGAGATTAGCGCGTGGATCTGCAGCGGACGTAGACAGTCGGCCG
+GGCGGGGCTGCTGAATGTCGGCAAGCCAGCCCAGCAACCGCTCGTATAGCCGATCTGCTGACATCTCGCG
+AATCAGGTTGCGCGCCCACTTCCGCGGTTCCTCGCGGTTGTCGTGGTAAAGGATCAGATCCAGCGGGCCA
+TGCTTGTCGAACCGCATCAGGCGCCAGATCAGGTCGAAGAACTCCTCCGCTGACAGGACCTCACCGTAGG
+GAATCGTCAGTTCGCGGTTGCGGATCTCGCGCACTTCGGGGGCCTCGGTGGCCGCCGAAATCCATTCCTC
+GAACCGCGCGCCGTCGATCTGCTTTGTCTGCAGTGGTAGCGATACCGGACGTTGCGGGGTTTTCTTCCAC
+TTGAGGAGCAGTTCGGCAATCTCGTCAGCGGCGGCGCACAGGGTGGCAATAAATCGCTGCTGGTAAGACT
+CGTCGGGTACACCCCTAGTCAACAGCTCGCTCAAGGAGACATCCGAACTGTCCTCGACATCGCTGACCAT
+CCGCCCTGGATTGTCGGCGACGCGGTGGAAAACCAGAATGATGCAGCTGCGAGCACTTCCGGAGGCGGTG
+CGGAAGCGGTGATGCACCAGCGAGCCAGCGGCGAATACACTGCTCAGCGGTCGCTCGGAATCGGTCACCT
+CGATCACCGTTGGGTGGTCCTGACCGCCCAGCTGGCGCTGCGCGTCGAACACCTTGCGGATGCTGTCGGG
+GGTGGTGAAGATCGATGCATTTTCACTCGACCACGGCACCCCGTCCTCGTTGACGAAGCAGGTGCGGGCG
+AGTTTATGGGTGCCGGGTAGGAAGGTGAAATTCTGTCCCGCTGGCCCCTGCGCGGTTCCGCGCCGCCAGG
+TAATGAGGATCTTGTATTCGTCGTTGAACGGGGTGTTGTCGATATGCAGCATGTTGTCCTGGGCCAGGAC
+CGACAGCGGTTCGGCGTCCTTGCCGCGTGCATCGATCATTCTGATCGGTCCACCGACGGCATAGGAGATC
+AACGCGATCATCAAGGGGTGCACCAGCGCGCCATTGACCGCTGGATCGGTCAGCATTCCGGGGCTTCGCC
+GCAGGTCTAGGAAGCGGTGAATGAAACTGCGACTGCCCTCCCGGGCCATGAGTTCGTCGTAGCGTTTTAC
+CAATTCCAAAAAGTCGTCCGACTCGACGATGTCGGCAAGGACGACTGCGCCCTGCTCGGCCATCTGATCG
+ATGAGGTCTCGTAGTGCCGCGGTGGCGATTTCGGCAGCTTCTGAACCCTGGGCCGCCAGCGCGTCGGTCA
+GCTCCTGCAGCAGTTTCCTGCGGTAGGACTCCTTGTCATCTAGATCACGGAATCGTTTGTAGGCCCAGGC
+GGCGGGCAGCTGGTCCTGTGACACCAGCTCGGGACCGATCGGTGGTGCGTATTCCAGCGGCAATATGTCA
+TCGGCGGCGAACTTGGTCAGCTGGATTCCGTCGGAATTATCCGGCAAGGCCTGGGTGGTCGCAGTCTGAC
+CGAGTGAGCTCATGTCCCGGGAAATCTGAATCACCTCCGCTTTCGCGTATTGCGCAAGAACTCGGTTCGT
+TGACCCGTCGAGGTCGACTGCAGAACGTACCTCCGGAGGCGGCGTTATCGCCAGACCTATTACCTGGGGG
+TCTGCCCGAAAGGGAAAACCCGGTGTCCTTTCTGGTTATCGAAGTGACCGGAATATTCGGTGCCGGCGGC
+GCACACGCGAGAATGGATGCCGCGCACGAGTTTATGCGCTTGTTCGGGTTCTGCCCGAAAGGGAAGACTT
+GATTTCCCGTTAGTTCAACCACCGGGTGATCGGCGCACTGAACGAGAAAGGATATGGCGAATGCGCACGA
+ATTGCTGGTGGCGGTTGTCCGGCTATGTCATGCGGCATCGGCGCGATCTGCTGTTGGGATTCGGGGCGGC
+GCTGGCCGGCACCGTCATCGCCGTTTTGGTTCCGCTGGTAACCAAGCGTGTCATAGACGACGCGGTCGCG
+GCCGACCACAGACCGCTGGCGCCCTGGGCCGTGGTTCTGGTCGCCGCCGCCGGGGCGACCTACTTGCTGA
+CGTACGTACGCCGGTACTACGGCGGTCGAATTGCCCACCTGGTACAGCATGACCTGCGCATGGACGCCTT
+TCAGGCCCTGTTGCGGTGGGACGGCCGACAACAGGACCGGTGGAGCAGCGGCCAGCTCATCGTCCGCACC
+ACCAATGACCTGCAACTGGTGCAGGCGTTGCTGTTCGATGTGCCCAATGTGCTCAGGCATGTGCTGACAC
+TGCTACTAGGTGTCGCGGTCATGACCTGGTTGTCGGTGCCGCTTGCGCTGCTTGCGGTGCTGCTGGTACC
+CGTGATTGGCCTGATCGCCCACCGCAGCCGCCGGCTGCTGGCCGCAGCCACCCACTGTGCCCAGGAACAC
+AAGGCCGCGGTCACCGGAGTCGTCGATGCGGCGGTCTGCGGAATCCGGGTCGTCAAGGCGTTCGGGCAGG
+AGGAGCGGGAGACGGTCAAGCTGGTGATGGCATCCCGCGCGCTCTATGCTGCCCAGCTGCGGGTGGCCAG
+GCTCAACGCACACTTCGGTCCGCTGCTGCAAACCCTGCCCGCGTTGGGTCAGATGGCGGTCTTCGCGCTC
+GGCGGATGGATGGCCGCGCAGGGCAGCATTACGGTGGGCACCTTTGTTGCCTTCTGGGCCTGCCTGACAT
+TGCTGGCGCGGCCGGCATGCGATCTGGCGGGGATGCTGACCATTGCCCAGCAGGCGCGCGCCGGCGCGGT
+GCGGGTACTCGAACTCATCGACAGCCGGCCGACGCTGGTTGACGGCACCAAGCCGCTGTCGCTGGAGGCT
+CGGTTATCACTGGAGTTCCAGCGGGTGTCCTTCGGATATGTGGCTGACCGCCCCGTGCTCCGCGAGATAA
+GCCTGTCGGTCCGGGCCGGGGAGACCCTGGCGGTGGTCGGTGCGCCGGGCAGCGGCAAATCCACGTTGGC
+GTCGCTGGCGACGCGTTGCTACGACGTCACACAGGGCGCGGTGCGGATCGGTGGTCAGGATGTGCGCGAG
+CTGACGCTCGACTCGCTGCGGTCAGCCATCGGCCTGGTACCCGAAGATGCCGTCCTGTTCTCCGGAACGA
+TCGGTGCAAACATCGCCTATGGCCGCCCGGATGCGACGCCCGAACAGATTGCCACGGCGGCCCGGGCGGC
+GCACATCGAGGAGTTCGTCAACACTCTGCCGGACGGGTATCAGACGGCCGTCGGTGCGCGCGGACTGACG
+CTGTCCGGCGGGCAACGCCAACGCATCGCCCTGGCCCGGGCGCTACTGCACCAGCCGCGGTTGTTGATCA
+TGGACGACCCGACCTCTGCCGTGGATGCGGTCATCGAATGCGGAATTCAGGAGGTGCTGCGGGAGGCGAT
+CGCGGATCGCACCGCGGTCATTTTCACCCGCCGCCGATCCATGCTTACCTTGGCCGACCGGGTCGCGGTC
+CTCGACTCCGGGCGCCTGCTCGATGTCGGCACCCCCGACGAGGTGTGGGAGCGCTGTCCCCGCTATCGGG
+AATTGCTGTCGCCCGCGCCGGATCTCGCCGATGACCTGGTTGTCGCGGAGCGCTCGCCGGTGTGTCGACC
+GGTGGCCGGGCTCGGCACCAAGGCCGCGCAGCACACCAACGTCCACAACCCCGGGCCTCACGATCACCCA
+CCCGGCCCCGACCCGTTACGCCGTCTGCTGCGTGAGTTCCGCGGCCCGCTTGCGTTGAGCCTGCTGTTGG
+TGGCCGTGCAGACCTGCGCGGGTCTGCTGCCGCCCCTGCTCATCCGCCACGGTATTGACGTCGGGATTCG
+CCGCCATGTGCTCTCGGCGCTTTGGTGGGCAGCGCTCGCCGGCACCGCCACCGTGGTCATTAGGTGGGTC
+GTGCAGTGGGGGAGTGCCATGGTCGCCGGATACACCGGTGAGCAGGTGCTGTTTCGATTGCGGTCCGTCG
+TCTTCGCCCATGCCCAGCGCCTGGGCCTGGACGCATTTGAAGACGACGGAGATGCCCAGATCGTCACCGC
+GGTCACCGCCGACGTCGAGGCCATCGTGGCGTTCCTGCGCACGGGTCTGGTCGTTGCCGTGATCAGCGTG
+GTGACCCTGGTCGGCATTTTGGTGGCGCTGCTGGCCATCCGCGCCCGGCTGGTGTTGCTGATCTTCACCA
+CCATGCCGGTGCTTGCCCTTGCGACCTGGCAATTCCGTCGGGCGTCGAATTGGACCTATCGGCGGGCGCG
+GCACCGGTTGGGGACGGTAACCGCCACGTTGCGTGAGTACGCGGCGGGGTTGCGGATCGCCCAGGCGTTC
+CGCGCCGAATACCGGGGACTGCAAAGCTATTTCGCTCATAGTGACGACTATCGCCGACTTGGGGTGCGCG
+GGCAGCGGCTGCTAGCCCTGTACTACCCGTTCGTGGCATTGCTCTGCAGCCTGGCGACCACCCTGGTCCT
+GCTCGACGGTGCACGCGAGGTGCGAGCGGGGGTGATCTCGGTCGGAGCGCTGGTGACCTATCTGCTCTAC
+ATCGAGCTGTTGTACACGCCGATAGGCGAACTGGCGCAAATGTTCGACGATTACCAGCGTGCGGCGGTGG
+CGGCCGGGCGGATCCGGTCGCTGCTGAGCACGCGGACACCGTCGTCGCCGGCGGCACGACCGGTGGGGAC
+GTTGCGTGGTGAAGTGGTTTTCGACGCCGTCCACTATTCCTACCGAACACGAGAAGTGCCGGCACTGGCC
+GGCATCAACCTGCGAATTCCGGCCGGGCAGACGGTGGTGTTCGTCGGCTCCACCGGATCCGGGAAATCCA
+CCCTGATCAAGTTGGTGGCGCGGTTCTACGATCCGACCCATGGGACGGTCCGAGTCGACGGATGCGACCT
+GCGGGAGTTCGATGTCGACGGCTATCGCAACCGGCTCGGCATCGTGACGCAGGAGCAGTACGTCTTCGCC
+GGGACGGTCCGCGATGCCATCGCATACGGACGGCCCGATGCCACCGATGCCCAGGTCGAACGGGCTGCGC
+GGGAGGTCGGTGCCCATCCGATGATCACCGCACTCGACAACGGGTACCTGCATCAGGTCACCGCGGGTGG
+GCGCAATCTGTCCGCCGGTCAGCTGCAGTTGCTCGCATTGGCCAGGGCGCGTCTGGTTGACCCCGACATT
+CTGCTGCTGGATGAGGCCACCGTGGCCCTGGATCCTGCCACCGAGGCCGTGGTGCAGCGGGCCACCCTCA
+CCCTGGCAGCCCGTCGGACGACCTTGATCGTGGCTCACGGGCTAGCCATCGCCGAACACGCCGACCGCAT
+TGTCGTGCTCGAGCACGGCACCGTTGTCGAGGACGGCGCCCACACCGAACTTCTCGCTGCTGGGGGCCAC
+TATTCGCGGCTGTGGGCGGCCCATACTCGACTGTGTTCGCCGGAAATCACTCAGCTTCAATGTATTGACG
+CATAGACGTCACCAAGCCACCGAATGGGTGGCGAGTTGACCGGGCGCCGGATCCCGACGGTTGTGGTTGA
+TCTGCCGAATCAACGGCTTCTGGCCACGAACATGTGTCCGCGACTGGCGTTCTGCGATACCAACCCAATC
+GGTTACTATAGAAACTGTTCCCGCCGACAACTAACTCCCTTGTTCGCGTGGAGGGGTTCTCGGGTCCGGT
+CAGCGAGGTCCGGAGCGGGGCGGAAATTTCATTGAACAGCCGTAGAAGTTCAGCCAGGACCGGAACGGAT
+CCAGCGGCAAGCATGCCTTCAGGAGCCATGTTGTCGAATCAGTGCCTAGGGCTGGGGGCGCCCGGAAGGA
+ACACCACAGGGGGGACCGACATTCCGCATGTGGTCAAGCGCAGCGGAGCGAAATTCCGCGAGGAGTTCAT
+CCTCCGTCCGGACCGGGTGCAAATGGCACCGGTGAATGTCATTTCGGTCGCGGTGGTGGCGAGCGACCCG
+TTGACCCGCGATGGAGCTTTGGCCCGACTCTCGTCTCACCGGGAGCTCGACGTGCGCGCTTGGCAGGCTG
+GATGCGAAACCTCGGTCCTGCTCGTGCTGGCCACCACGATCACCGCGCCTCTTCTATGCCAGATCGAGGA
+CGTGCAGAAGGATGGCCCCAGTCACGCGCCGAAACTGGTCGTCGTCGCCGACGAATTCTCCGCTGAACAA
+GTTTTCCGGATGATCAAGCTGGGGTTGACCGGGTTGTTGTATCGCAGCCAGAGCACGTTCGACTGCATCG
+TCGAGACAATCCGGTTGTCCGCCGAAGGCCGCCTGCGACTCCCCGAACGTGTCCAGCGTTACCTGGTCGG
+CCGCATCAAGTCCACCCCGACCGCCGAACCTGACACACCGTGCGCCGCCGCTCTTGCCGAGCGTGAGGTG
+GCGGTGCTGCGTCTGCTAGCGGACGGCTTGAGCACGCACCAAGTGGCGGTGCAGCTCAACTATTGCGAGC
+GCACGATCAAGAACATCGTTCATGACATAGTGACGCGGCTGAAGCTCCGCAACCGCACGCATGCCGTCGC
+ACATGCGCTGCGCGCGGGCCTCATTTGATTGATGGCCGGCGTCCGACGTACGTGCGGCCGGGCCGATCCC
+AAGCGAGTGGTGCAACGTGCACGGTAGCCATTATGTATAGCAACATACATATGCCTCGGATGGAGCGGCG
+ATGCAAGGTCCACGCGAACGGATGGTGGTCTCGGCCGCGCTGTTGATTCGGGAACGGGGAGCCCACGCCA
+CCGCCATCTCGGATGTGCTGCAGCACAGCGGCGCACCGCGGGGGTCGGCCTATCACTACTTCCCGGGCGG
+TCGTACCCAACTGCTATGCGAGGCCGTCGATTACGCCGGAGAGCATGTCGCCGCCATGATCAACGAGGCC
+GAGGGGGGCCTGGAGCTGCTGGACGCGCTGATTGACAAGTATCGCCAGCAGCTGCTCAGCACCGACTTTC
+GCGCCGGCTGCCCGATCGCCGCGGTCTCGGTGGAGGCGGGCGACGAACAAGATCGCGAGCGGATGGCGCC
+GGTGATCGCGCGTGCAGCGGCGGTGTTTGACCGCTGGTCGGACTTGACTGCCCAGCGGTTCATTGCCGAC
+GGCATACCGCCGGATCGGGCGCACGAGCTGGCGGTGTTGGCGACGTCGACGCTCGAGGGCGCAATCTTGC
+TGGCTCGGGTGCGGCGCGACCTGACGCCGCTGGATCTGGTTCACCGCCAGCTGCGCAACCTGCTGCTGGC
+CGAGCTGCCCGAAAGGAGCCGATGATGACCAGCTCTGATTGGCTGCCCACCGCGTGCATCCTCTGCGAGT
+GCAACTGCGGCATCGTCGTGCAAGTCGACGATCGCCGACTGGCCCGCATCCGGGGCGACAAGGCGCATCC
+GGGGTCTGCGGGCTACACCTGCAACAAGGCGTTGCGGCTGGACCATTACCAGAACAACCGGGCTCGCCTG
+AGCTCGCCGATGCGCCGCCGAGCCGATGGCACCTACGAGGAGATCGACTGGGACACGGCGATTGTCGAGA
+TTGCCGAGGGATTCAAACAGATCCGTGATACCCACGGCGGGGACAAGATCTTCTACTACGGCGGCGGCGG
+ACAGGGCAATCACCTCGGCGGCGCCTACAGCGGCGCCTTTCTGAAGGCACTGGGGTCGCGCTACCGGTCG
+AATGCGCTGGCGCAGGAGAAGACCGGCGAAGCCTGGGTCGACTTCCAGCTGTACGGCGGTCACACGCGCG
+GCGAGTTCGAGAACGCCGAGGTGTCGGTGTTCGTCGGGAAGAACCCATGGATGTCGCAGAGCTTCCCGCG
+GGCCCGGGTCGTGCTCAACGAGATCGCCAAGGATCCCGGCCGGTCGATGATCGTGATCGATCCCGTCGTC
+ACCGACACCGCGAAGATGGCCGACTTCCATCTACGGGTGCAACCGGGTTGCGACGCCTGGTGCTTGGCGG
+CTTTGGCCGCGGTCTTGGTCCAGGAAAACCTCTGTAACGAAGCCTTTCTTGCCGCGCACGTGCACGGAGT
+GGACACCGTGCGCGCCGCCCTGCAAGAGGTCCCGGTCGCCGACTACGCGCAGCGTTGCGGGGTGGACGAG
+GAGTTGTTGCGTGCCGCGGCCCGGCGCATCGGCACCGCCGCGAGCGTGTCGGTGTTCGAAGACCTGGGAA
+TCCAGCAGGCGCCCAACAGCACCGTCTGCTCCTATCTGAACAAGCTGCTGTGGATCCTGACCGGCAACTT
+CGCGAAAAAGGGTGGCCAACACCTGCATTCGTCGTTCGCTCCGCTGTTCAGCCAGGTCTCCGGCCGCACA
+CCGGTCACCGGTGCGCCTATTATCGCGGGCCTGATCCCGGGCAACGTGGTGCCCGAGGAGATCCTGACCG
+AGCACCCGGATCGGTTTCGGGCGATGATCGTCGAGAGCGGCAATCCGGCTCACTCGCTGGCCGATTCAGC
+CGCCTGCCGGGCGGCATTCCAGGCGCTGGAACTGATGGTGGTCGTCGATGTCGCCATGACCGAGACGGCC
+AGGCTCGCCCACTACGTGCTGCCGGCGGCGTCGCAGTTCGAGAAGCCGGAAGCCACATTCTTCAATTTCG
+AGTTTCCACGCAACGGCTTTCAGTTGCGCCGGCCGTTGTTTCCGCCACTGCCCGGAACACTGCCCGAACC
+CGAGATTTGGGCGCGGCTGGTGCGGGCACTTGGCGTAGTCGACGAAGCGGACCTGCGGCCGCTGCGAGAG
+GCCGCTGCTCAGGGTCGCCAGGCGTATACCGAGGCGTTCCTCGCGGCGGCGGCGACCAATCCCACCGTGG
+CGAAACTGACCGCCTATGTGCTCTATGAAACGCTCGGGCCGACGCTGCCGGACGGTCTGGCCGGGGCGGC
+CGCGTTGTGGGGACTTGCCCAGAAGACGGCGATGGCCTACCCTGACGCCGTCCGCCGCGCCGGCCACGCC
+GACGGCAACGCGCTGTTCGACGCGATTCTCGAGCGCCCCTCCGGGGTCACGTTTACCGTGCACAACTACG
+AAGACGACTTCGCTTTGATTAGCCACCCCGATCACAAGATCGCCCTGGAGATTCCGGAAATGCTGGCAGA
+GATCCGGTCGCTGACCCAGACCCCGTCGCGGTTGACCACGCCTCAACTGCCGATCGTGCTGTCGGTGGGC
+GAGCGCCGCGCGTACACGGCCAACGACATCTTCCGTGACCCGTCCTGGCGCAAACGCGACGCCAACGGGG
+CGCTGCGGGTCAGCGTCGAAGACGCCCAGGCCCTGGGACTGGCCGATGGGTGCCTGGCTCGTATCACGAC
+CGCGGCGGGCAGTGCGGAGGCGACGGTGGAGGTCACCGAGACGATGCTGGCCGGACACGCCGCGCTGCCC
+AACGGCTTTGGGCTGGACTACACCGGCGACGACGGGCGCACCGTCGTCGCCGGTGTCGCCCCGAACGCAC
+TTACTTCGACGAGATGGCGCGACCCCTACGCCGGCACCCCCTGGCACAAGCACGTGCCCGCCGCCATCCG
+CCGAGCAGACGCAGAATCGCCCATTTGGTAGCCCAAATGGGCGATTCTGCGTCTGCTCGCGGGGTCTTAG
+CCTAGTTCCAGATCCGGACCCTGCGCTGCGGGTCCAGAAACAGCGCGTCATCCTCGGTGACGTCGAAGGC
+CTGATAAAAAGCGTCCACGTTGCGAACCACACCGTTGCACCGGAACTCCGGCGGGGAGTGCGGATCGACC
+GCCAACCGGCGGATTGCTTCGGCTGCACGCGATTTGGTTCGCCATATTTGTGCCCAGCCGAAGAACACCC
+GTTGCATGCCGGTCAGCCCGTCGATAACCGGAGCGGGGTTGCCGTTCAGCGAGAGCTGGTAAGCCAGCAG
+GGCGATCGACAGCCCGCCCAGGTCGCCGATGTTCTCGCCTATGGTGAACGCGCCTTGCACATGAGGCGGG
+CCGGGGTGGTCGACGAGATCGCGCGGCGTGTAAGCGTGGTACTGCTCGATCAACGCTTTGGTGCGGGCGG
+CGAACTCGGTGCGATCGTCGTCGGTCCACCAATCGACCAGATTGCCGTCGCCGTCGTATTTGGCGCCCTG
+ATCGTCGAAACCGTGCCCGATCTCGTGCCCGATCACCGCCCCGATCCCGCCGTAGTTGGCGGCCTCGTCG
+GCCTGCGGATCGAAAAATGGTGGCTGTAAAATCGCTGCGGGGAAGACGATTTCGTTCATCCCCGGGTTGT
+AGTAGGCGTTGACGGTTTGTGGTGTCATGAACCACTCGTCGCGGTCGACCGGGCCGAAAAGCTTGGCTAG
+CTCGCGGTCATGGTTGACGGCGTAGCCGCGCTGGACGTTACCGTAGAGGTCGTCGCGGTCGATCGCCAGC
+TTCGAGTAGTCGCGCCACTTGATCGGATAGCCGACTTTGGCGGTGAACTTGTTCAGCTTCGCTAGCGCGC
+GTTGCCGGGTCTGCGGCGTCATCCAATCCAGCTCGCTGATGCTGATCCGATACGCCTCCTGCAGGTTGTC
+CACCAGGGTGTCGATGCGGGACTTGGCATCCGGCGGGAAATGGCGTTGTACATAGAGCTTTCCGACGGCA
+TCGCCCATCAGGTTCTCCACCAGTGACACCCCACGCTTCCAACGGTCCCGAAGCTGCTGTGCGCCGGTAA
+GCGTGCGGCCGTAGAATTCGAAGTCCTCGGCGACCAGGGCGCGGGTCAGCCAGGGGGCCCGGGCGCGGAT
+CAAACGCCAACGCGCCCAGCATTTCCAGTCTTCAACGTTAACGCTCGCCCACAGCGAGGCAAAGGTGACG
+AGGTAATCAGGTTGGCGCACAACCAGTTCCGTCATGGCGTCCGGAGCGCTCCCCAATGCGGTCACCCAGC
+TGACCCAGTCGAAACCCGCCCCTTCGGTCTGCAGCTGGGCAAACGTGCGCAGGTTGTAGCCAAGGTCGGC
+GTCGCGGCGCTTCACCACATCCCAATGCGCGTCGGCGAGTTTGGTCTCCAGCGCGACGATGCGGTCCGCG
+GTTTTGGCATGGTCACGGCTCTCGCCCCCGTACACCAGGCCGAACATCCGGGCGATGTGCCCCGGGTAGG
+CCGCTAGCACGGCGGCGTGTTGCTCGTCACGGTAGTAGGACTCGTCGGGTAATCCGATGCCGGATTGGGT
+GAAATGCACCAAGTAACGGGTCGAGTCTTTGGAATCGGTATCGACATAGACTCCGATGCCGCCGCCCACG
+CCGGCACGTTGCAGAGTGCCAAGGGCGGCGGCCAATTCGGTGGCGTCGGCCGCGCTGTCAATCGTGGCCA
+ATTCGTCGTGCAGCGGTTGCACCCCTGCGCGCTCGACGGCTTCCTCGTCGAGGAAGCTGGCGTAGAGGTC
+GCCGATGCGCTGCGCATCGGTGCCTACCGCAGCACCTGCTTGGCTGGCCTGGATGATCAGGTCTCGCACT
+TGTGTCTCGGCGCGGTCGAACAGGCTACGGAAGGCGCCGTCGGTCGCTCGGTCCGCTGGTATCTCGTGTT
+CAGCCAGCCAGCGGCCGTTAACGTGGCCGAACAGGTCGTCTTGGGGTCGGGCATCAGCGTCGATGTGGCT
+CAGGTCGATACCCGAGGGGATGGCAAGTGTCACCCCGCCATCCTTCCACCTCTTTTCGGGTGCAACGATC
+GGGCCATGCCTGACGGGGAGCAGAGCCAGCCACCGGCCCAAGAAGATGCGGAAGACGACTCGCGGCCCGA
+CGCCGCGGAGGCCGCCGCGGCCGAACCCAAATCATCAGCCGGTCCGATGTTCTCGACCTACGGTATCGCC
+TCGACACTACTCGGCGTGCTATCGGTCGCCGCGGTCGTGCTGGGTGCGATGATCTGGTCCGCACACCGCG
+ATGACTCCGGCGAGCGTACCTACCTGACCCGGGTCATGCTGACCGCCGCTGAATGGACGGCCGTGCTGAT
+CAACATGAACGCCGACAACATCGATGCCAGCCTGCAGCGACTGCACGACGGAACGGTCGGTCAACTCAAC
+ACCGACTTCGACGCTGTCGTGCAGCCCTACCGGCAGGTGGTGGAGAAGTTGCGGACGCACAGCAGCGGCA
+GGATCGAGGCGGTAGCGATCGATACGGTGCACCGCGAGCTGGATACCCAGTCCGGTGCCGCCCGACCGGT
+AGTAACCACGAAATTGCCACCGTTTGCCACTCGCACCGACTCGGTGCTGCTGGTCGCGACGTCGGTCAGT
+GAGAACGCCGGCGCCAAACCCCAGACCGTGCACTGGAACTTGCGGCTCGATGTCTCCGATGTGGACGGCA
+AGCTGATGATCTCCCGGTTGGAGTCGATTCGATGAGAAATGCTTGGCGGCTGGTGGTGTTCGATGTCCTG
+GCACCACTGGCCACGATCGCCGCCCTGGCCGCGATCGGCGTCTTGCTCGGCTGGCCCCTGTGGTGGGTTT
+CGACGTGCTCGGTGTTGGTGCTGCTGGTGGTCGAAGGTGTGGCAATCAACTTCTGGCTGTTGCGTCGTGA
+TTCGGTAACCGTCGGTACCGACGACGATGCGCCCGGGCTGCGACTGGCCGTTGTCTTCCTGTGCGCCGCC
+GCGATCTCGGCGGCGGTGGTGACTGGGTACCTGCGCTGGACGACACCGGACCGCGACTTCAATCGGGATT
+CCCGGGAAGTGGTGCATCTTGCCACGGGGATGGCCGAGACGGTCGCGTCATTCTCCCCGAGCGCACCGGC
+CGCCGCTGTTGACCGGGCCGCGGCGATGATGGTGCCCGAACATGCGGGCGGGTTCAAGGAGCAATACGCC
+AAGTCCAGCGCCGATCTCGCACGGCGCGGTGTTACGGCCCAGGCCGCTACGCTGGCGGCCGGCGTGGAGG
+CGATCGGGCCGTCGGCAGCCAGTGTTGCGGTGATTCTGCGGGTTAGCCAAAGCATTCCCGGCCAGCCGAC
+CAGTCAAGCGGCGCGAGCGCTGCGGGTGACCTTGACCAAGCGGGGCAGCGGCTGGCTGGTGCTCGACGTG
+ACGCCGATCAACGCTCGCTAAGAGTCGGCGGCACGTACGGATTTGGCTCTGACGAACCGGTCCGACAGCC
+GCCGCATCCGGATCATCAGCGAGGCCGACGGGCTCACGATGCCGTCGAGGTAGGCGGTCAGGTCCTGCGC
+TGTGACGCCAATGCGCGACGCGAATTCCTGTCGTTGCAGGCCAGAGCGGTCCAACAGGAGCCCAACCTGA
+CGGGCCACCTCGGCGCGCTCATTGGCGTCTAGGTGAGTACGGGCCCGGTCCAGCACCTCCCAAAAGGCGT
+TGGCGATGCCGGTCGCCGGTATGCCCTCGAGGACTTCTTCGACTTGGCGTGCTGTCCGCCCGTAGGGGTC
+GCGCTTGAGCGCGGCCGCTATGCGTTGCCAGGTGGCGATGTCGCCACTTTCCAGCGCCGAACGAATGGCG
+ACGGTAGGCCAGAACTCGACCCGCCGGTCGACGTCCGGCTCGCTCCACGCGACGGTGGGTTGTTGCGGCG
+GTGCGGGGTGTGGCTCGGCTGCCAACGTCACCTCGCCTCCTCCAACATCGCCACGGCCACCGACAGGCAA
+CGCCGCCGGACCTCTTCCCACTTTGCCTGGGCATCAGCTCCGGGCGACTGGTCACCGAGGTCAGACGGTT
+GCGGATCTGCCAGGCGACCAACCAACTGGGTGGCCATCCATTGCCGCCCGGGTGCTTGACAAGAGTAGTA
+CCGATCCATCCCAGCCAGCACCGCGGCGGCGGTTTCGGGTGCCATCGTATCGACCAGGTCAGCAAAGTCG
+GCGTAGTCGTGGCTGCTGTTTCGGGACATGATCAGGTAGCCCTTGAAGCGCAGCGTTTCCGCGCCGGTTG
+GGATCTGCAAGCGGTCACCGGTGGGCAATGCGACGTTGGTCGTCTCCACCGGGCTGCGCCGCCGGTAGCC
+GGGGCCCGCCCGGTGAGTCTGCACCCCCCCGCACTCCCAGGTGGTTGTCTGAAGCGCGTCGAGGGCGACC
+GCGAGCCGCTTGCGCCACACGGTGACCGGGTGCACCGGGCGCTGGCCCCATGATATCGCCCGGGCGATGC
+CGTTGCGGTAGGCCAGCTGCACCTGGTCGAGCGCCTTACCGTCACATCCACACCCGGTGAAGGCGAGCGG
+ATCGGTAACGCAAATGGCGTCCGGCGCAAGTCGCTTGAGCTTGGCCGCCGACTTGAGCACCATCCGCACA
+TCCGCGCTGGGCGGGATCGCCGCGGCGAAGTCGTCAGGAATGACCACGACGTCACCGAGGTCGACTTTCG
+GCAGCGGTCGGTCGAAGTCGACCGACGGCAAGATGTGGGCCAGCCATCGGGGCAACCACCAGTTCCATCG
+GTCAAACATCGCCATCAATGCCGGTACCAGCACCAGCCGCACGACGGTGGCGTCCACGGCGATCGCGACC
+GCGCACGCCACGCCGATCTCGGCCACTAGCGGCATGCCGGCGAACGCGAACCCGCAAAACACCGCGATCA
+TGATCAACGCGGCGCTGGTGATCGTGCGCGCGCTGGTGCGCACACCGTACGCGACCGCGTCGCGGGTCTG
+GCCCGTCTGCAGGAACCGCTCCCGGATTCGCGTAAGCAGGAAGATTTCATAGTCCATCGACAACCCGAAC
+GTCATCGCCAGGACCAGCGGGGGAACGGTGCTGTCGATCGAATGAAGCGCCGGGAAACCGAGCCCCCGTG
+CCCAGCCCCACTGGAAGACCATCACCAGGCTGCCGTAGGCGGCGGCCACCGACAGCAGCGTCATCAGCAC
+GCCCTTGAACGCCAGGAACACCGAGCGGATTGAGATCAACAACATCAAAAACGCGATCACCGCCACGAAG
+ACCAGCACCAGCGGTTGCGTCGCGGACACCCGGTCGTCGAAATCCTTGATCAGAGCGGTCGGCCCGCCGA
+CGTCCACTTGTGCCGCGCCGGCAACCCGGGGTAGCTGGGTCCGCATCCAGGTGATGGTGTCGCGGGCGCC
+CAAATCCTCGGGATCGACCGATAGCACCGCGCTGAGCAAAGCGCTGCCGTTGTCGTCGGCGAATCGCGGT
+GGGGCCACCGAAACGACGTTGGGCGCCTGTGCGATCCGATGACGGATTGCGGCGATTGTCTGGCTATGTT
+CGGGTGCGGACGCACCGCCGGCGTCAAACCTGACCAGCACCTGAACCGGGCCCAGCGCGCCCGGCCCCAG
+CGCTTGGGCCGCGGCCGCTGCGCCGGTGCGGATCTCGTGTGACGAGTCGAACTGGCGCAGCAAGCTGTTG
+CCCAGCACCATCAAGGTTGCCGGTGCCGCCATGACAAGCAGCACGGTCGATGCCGCCAGTGCTGTGATCC
+AGGGTCGGCGCATCACCCACCCGACCCAGCGGGACCAGAACCAAGATTGCGTGCTTGCCGGCCGCCGCGA
+CCAGTGCACTAACGCTGACCGCTTGGCCGCCGCGCGGGCAAATGTTGCTAGCACGGCAGGTGTCAGGGTG
+GCCGACGTCAGCATCGCAACCGCGACCGCGAGAATCGCCCCGGTGGCCATCGATCTCAGCGCCGGGGTGT
+TGATCAGGTAGATCCCGGTCAGCGACGCGATGACCGTCATACCGGACAACACCACAGCCAACCCCGAAGT
+GGCCATCGCGGCGTCGACCGCGTCGGGCGGCCGGCGTCCGCAACGCAGTTCCTCGCGGTAGCGCATCAGG
+ATGAACAGGGAGTAGTCGACGGCAAGCGCGATGCCGAACATCGAAACGGTCGATGTCACGAACACCGACA
+TGGTGGTGTGCATCGACAACACAAACACCAGGCCCATGGTGATGACGACCGTGCAAACGGCGAGTGCCAG
+CGGGATCGCTGCGGCGGCCAACGAGCCGAAAACCGCAACCAGGACCATCAGAATGATAGGCAGGTTCCAG
+CGTTCGGCGTTGGCAATATCGTGTTTGGTGTTTGCCGCCGCGGCCGCGGACAGCGCGCCCTGCCCGATGA
+CATAGAGCCGCACTTTGCCGTTGGCAGTTTGCCCGGACTGATCGCCTTTGACGCCTATTCGGTCGCGCAG
+CTTTTTGGCGACGTCACTGGTGCCCGCGTTGCGGGCGTCCAGCCGCAGCGACACCACATACGGCCGGTCC
+GGTTGCGGGGGCCGTTGGGTGGGGTTGGGTGCCTCCGTCACCCCAGGCAGTTCGCTGGCTATTTGTCGCA
+GTAGCGCGACGGCATTGTCGATGTCTTGGTAGCTAGCATCCGGTCGGGGGGCCGCTACCAGCGCCAGCGC
+CGGGGCTCCCCGGTCCGGGTAGTGCGCGTCGAGTTGGTCGTGGACCAGCAATGACTGCGACCCGGCGACT
+TCGAAACCGCCACCGGTTAGATTCCCCGACTGCGTCATCGCCAGGTAAACCGCCGGCACTAACGCCAGCA
+ACCAACCCGTGAAGACCAACCAACGGCACCTGCGCAGGTTGCGGCTCAAGCGCATCATGAACTGCTGGAT
+TTCGGACTCCCCGTACTCTCGCGCAGTGCGTGCCCGCGAGCCTACCGAAGATCGCGTGCATGCGTTCGGC
+GTGGACCGCACAGCACCTGGAGTTGGCGGCGCCGAGGGCCGAGATGGCAGGATGACGGATCGTCGGGGGC
+GGGAACTCCCAGGCCGCCGGGCCGTCGCAAACCCGTCGCAAACCCGTCGCAAACCGTAAGGAGTCATCCA
+TGAAGACAGGCACCGCGACGACGCGGCGCAGGCTGTTGGCAGTACTGATCGCCCTCGCGTTGCCGGGGGC
+CGCCGTTGCGCTGCTGGCCGAACCATCAGCGACCGGCGCGTCGGACCCGTGCGCGGCCAGCGAAGTGGCG
+AGGACGGTCGGTTCGGTCGCCAAGTCGATGGGCGACTACCTGGATTCACACCCAGAGACCAACCAGGTGA
+TGACCGCGGTCTTGCAGCAGCAGGTAGGGCCGGGGTCGGTCGCATCGCTGAAGGCCCATTTCGAGGCGAA
+TCCCAAGGTCGCATCGGATCTGCACGCGCTTTCGCAACCGCTGACCGATCTTTCGACTCGGTGCTCGCTG
+CCGATCAGCGGCCTGCAGGCGATCGGTTTGATGCAGGCGGTGCAGGGCGCCCGCCGGTAGATGCCGGACC
+GCCGCCGGGTCCGGCGCAGTCGAGCGTGAGGCAGCGGTCGCCTACCGGGGCGGTGTCTCGCCGCCTTCTG
+GTCGCAGGTCAGGGGTCGGCGCTGGACCTTGCGGTGTGGTTTCGACCGGGTCGTCGCAGGGTGTGCCCTG
+CGGTTGGATGACAAGTCGCAGGTTTGGATCGGTTGGCGGGTCGCGATCGTTGTCGGAATCGGCGGTGCTC
+TCGGTGCGGAACATGAAGAAGAACACCACCCAGCCGATTGCGGCGATGAGCAGCCAGCTGATCAGCCGGT
+AGATCAACATCGCCGAGATGGCACTCGGCAAGGGCATGCCGCTGGATACCAGGCCGGGTACCAGCACCGC
+CTCGACCACCAACAGACCACCGGGCATCAGCGGTATGGTGCCGACCGCGCGGGCGGCGGCGTAGGCGACC
+GCCAGCCCACCGACCGAGGCATGGTCGCCGGCGGCGTACGCGGCGAAACCGAGGCAGGCTACGTCGGCGA
+TCCAGTTGAACAACGACCAACCGAACGCCACGCCCAGGTCGCGCCTGCCCAGGCTGACCGATTCCAGCTG
+CATGAGCGTCTCGCGCCACTTCGGTAGGCCGGCATCGGCCGGCCTACCGCGAACCGAGTTGGCCCACGAC
+AAAACTCTCCTGCCGATCCCCTCGATGAGCTCCGGCCGCGACGCCACCGCCTGGGCCAGTAGCAGCAATG
+TGACGAAGCCGCCCAGGGTGAACAGCAGTGAGAACGGGTTGTTCTTGGCGCCCAGGAAGAATGCGCCACC
+CAACCCGAGCAATGCCAAGCCCACCGCCTGCAACACGCCCGACATGACCAGCTGCCATGACGCCACCACC
+GTCGAGGCGCCCCAGATGCGTTGCTGACGGAGTAAGAACGTAGCCGACAACACCGGCCCACCCGGCAGCG
+TGGTGCTCAGCGAGTTGGCGGCGTAGAAGGCGGCCTCCGACCGCCATTGCTTGACGTGCACCCCGGCGGA
+TTTCAGCAGGGTTCGCTGAATCTGGGCGAAGCTGTGCATCGAGGCGCCCGCGGCTGCCACCGCGGCCAGC
+AACCACCACCACTTGGCGCGATACAAGCTCACCCAGGCCTTGGCGAGCTGGTCCCAGCCCAACGCCACCT
+CTATAGCAAGCACGATTGCGACGATGGCCAGTACCGCCCATCGCAACCACCAGTACTTGCCGCGCGGGGG
+TACGCCCTCAGCGGGGGGTGCCCCCACCCGCGTGCGAGGGAGTGCCCCCACGCGCTGGCGGAGGTTGCGG
+GCGGGGGCGTCGTGCGACACGTGCTTAAGGGTAACCGTGCAGGTGGCGCCGTAATCGCGATACATCGCTA
+ACCGTGTCAGCCTCGTTGGGGGGTCGTGACCGGATCGTGCCGCCTGGCAAAGTAACTATGCGGGCTCGAC
+GCGACCCGCCGCGACCTTACGACGCCGCCGTTCCCGTTACGCTTGCCGGATGTCGGCGAGCCTGGATGAC
+GCTTCGGTCGCACCGCTGGTTCGCAAGACCGCGGCCTGGGCGTGGCGGTTCTTGGTCATCCTGGCCGCGA
+TGGTCGCGCTGCTGTGGGTCCTCAACAAGTTTGAGGTCATCGTCGTCCCGGTGTTGCTGGCGCTGATGTT
+GAGTGCGTTGCTGGTGCCGCCGGTGGATTGGCTGGACTCCCGGGGCCTGCCGCGCGCTGTCGCGGTGACG
+CTGGTCTTGTTGAGCGGTTTCGCGGTTCTCGGCGGCATCCTGACGTTCGTCGTCAGCCAATTCATCGCGG
+GGTTGCCGCATCTGGTCACCGAGGTTGAGCGCAGCATCGACTCCGCGCGCAGATGGCTGATCGAAGGCCC
+GGCGCACTTGCGCGGCGAACAGATCGACAACGCGGGCAACGCCGCGATCGAGGCGCTGCGCAACAACCAG
+GCGAAGCTGACCAGTGGCGCATTGTCGACTGCAGCCACCATTACCGAGCTGGTTACCGCGGCGGTGCTGG
+TACTGTTCACGCTCATTTTCTTCCTCTACGGGGGCCGGAGCATCTGGCAGTACGTCACGAAGGCCTTCCC
+GGCCAGCGTCCGTGACAGAGTGCGTGCGGCGGGGCGCGCCGGTTATGCGTCGCTGATCGGGTACGCGCGG
+GCCACCTTCCTAGTGGCATTGACCGATGCGGCCGGGGTGGGCGCGGGGCTGGCGGTGATGGGTGTGCCGC
+TGGCATTACCGCTGGCCTCGCTGGTGTTTTTCGGTGCCTTCATTCCGTTGATCGGTGCCGTGGTCGCCGG
+GTTTCTGGCCGTGGTGGTGGCCCTGCTGGCCAAGGGCATTGGCTACGCGCTGATCACGGTCGGTTTGCTA
+ATCGCGGTGAACCAACTTGAGGCCCATTTACTGCAGCCGCTGGTGATGGGTCGGGCGGTGTCGATTCACC
+CGCTGGCCGTGGTGCTGGCCATTGCCGCTGGCGGTGTGCTTGCCGGAGTCGTCGGCGCCCTGTTGGCCGT
+CCCGACGGCCGCTTTCTTCAACAATGCGGTGCAGGTGCTGCTGGGCGGGAATCCGTTCGCCGACGTGGCA
+GACGTTTCTTCCGATCACCTCACCGAGGTTTAAAGGCGTCCTTCGCGGCGAAGCAGATCCTGGGCGGACA
+GGGCGCCGCCGCCGCGGCGGCGCTGACGCGTCTTATCGCTCGTGCCGCGGGCATTCAGCTGCTCAGTGGC
+TGCCTCTGAGTCGTCGCCGTCCGACCGTATGATTGGCAGGGCCGCGGTGGGTTCGGCCGGGTCACCGGCT
+GCGTCTGTGGAGCGGTTCGCCGCAAGCGGCATAGCCCGGGTCTGACCGGCAGACGGGGCCGATGGCGGGG
+TCGGGGTTGGTGGCGGCGTGGATGCTGGCGACTGCACGGACCGACCGGCAGCCGCGAGGCGGGTTGTCGG
+CGGCTCCGTCGACGACCCGATCTGCATCCGTGTGGTGCTCGCCCCAGACGGCGCCGCCGGCGCGGCAGTT
+GCTTCCAGGGCAGGCGTGAGCTCCGGTGAGCTTGCTGGACTCGAGCGGGCCGGTCGAGGTGACTCCGCCA
+GCGGATGGGTCGGATCGTGCGGTGGGCGCGGGTCCCCAGCGGCGCGCGCCGCAACCAGCCCAGCTGTGAC
+CGGAGGACGTGCGGGACGCCCGTTGCTGACGGGCCGCTTGCGCTCGTCGGGCAGGTGGATCTCGCCCAGC
+CCGATGCGGGTCTGCAGGCGTCTGGCCCAGCGCGGTGCCCACCAGCAGTCATCGCCGAGCAGCTTCATCA
+CCGATGGCACTAAAAACATCCGCACCACGGTCGCGTCCAGCAGCAGCGCCGCCATCAGTCCAAAGGCCAG
+ATACTTCATCATCACCAGGTCGGAGAACACGAACGCGCCCGCGACGACGGCAACAATCAGCGCCGCGGCG
+GTAATGATGCGTCCGGTGGCTGCGGTGCCGATCCGGATCGCCTCCTGGGTCGACATGCCGCGCTCTCGCG
+CCTCGACCATCCGGGACACCAAGAACACCTCGTAGTCGGTGGATAGGCCGAAGACCAGCGCGATGATCAG
+CCCGATCACCGGCGCTGTCAGCGGGGTCGGCGTGAAATTCAGCCACTTCGAAAAGTGTCCGTCGACGAAT
+ATCCACGTCAGGATGCCCATGGTGGACCCGAGCGTCAGAGCGCTCATCAGCGTCGCCTTGATTGGCAGCA
+CCACCGAGCCGAACGCCAAGAACATCAAGACGATCGTGGTGGTCAGCAGGATGACCACCATCAGCGGCAT
+CTTCGCGAACAGGCCGTGGATTGAATCCAGCTCCAGGGCGGGAGTTCCACCGACCAAGACCGTGATTCCT
+TTGGGCGGGGTGATCGCGCGCAGCTCGGTGAGCTTCTTCGACGCGTCAGCCGGGTTGATCAACCCGTTCT
+GCAGGACGCGCACCGATGGATCTTTAGATGCGCCTACCGCGTAGGCACGCTCTTGCCACATATTCGCCGG
+ATCGTTGTCCGGCTCGATGAATCCGCCGATCGCCATCGCCTTGCTGCGGATGTCAGCGATCTGCGCCTCG
+GTGACCGGTTGATGGTTGCTGGTCTGGATCACCAGTGTCAGCGGATTGGTGCGGTATCCGGGGAAGAGTT
+TGTCGAACTCCTCCTGCGCCTGGCGCACCGAATTGGTCGGCGGCAAGTACTTCTCGCTGATCCCGCCCAA
+TGACAGCTTGCCCACCGGGATAATCAGCAAAATCATGATGATGACGATCGGTGCGGCGAACAGCACTGGG
+CGCTTCATCACCCGGTTAACCAGCTTGCCCCAGATGCCGGCTTCGACCTCTTCGCGGGTCTTGGTCCGCT
+GCAGGCGGTCGGCGAGCCAGTTCAGGTAGGCGGCCGAAATCTTCCAGTTCGCCAGGAAGGGCACCCGGAA
+CAGGGTCCGCACGCCGAGCGCGTCGACGTGTTTGCCCAGGATCCCCAGACAGGCCGGCAACACGGTGATA
+GACAGGATGGCCGACAGCATCACCGATGCGATCGTGGCGTAGGTCAGCGACTTCAGGAAACCCTGCGGGA
+AGAGCAGCAGACCGATCGCCGACGCGACGATCAACACCGCCGAGAACGTCACCGTGCGTCCGGCGGTGAT
+CACCGTGCGCCGTACTGCCGTCTCGGTGTCGTAGCCTTCGGCGATCTCTTCGCGGAACCGGCTCACGATG
+AACAACCCGTAGTCGATGGCGATCCCCAGACCGATCAGCGACACCACGGGCTGGGCGAAATAGTGCACGG
+GACCGAAGATCGCGAGGAACCGCATGATGCCCAGCGCGCCGGCGATGCACAGCCCTCCGACCATCACCGG
+TAGGCCGGCGGCGATCACGCCGCCGAACACGAAGAACAACACCACCGCCACCAACGGCAGCGCCAGCACT
+TCCATTCGCCGTTGGTCGGTGGCGATGGTGCCGGTCAACGCCTCGGCCACCGGTTGCAGCCCGGCGAGCT
+TCACCGTGCCTCCGTCGAGCCGCTGCAGGTCGGGTGCGATGGCCTTGTAGTTGTTGAGGATGGTGTCGTC
+GTCATCACCCTTGAGCGGGATGGAAACGAAGGTGTACTTCTTGTCGGCGGTGGCCATGCCGGTCGCCTGA
+CTCGCTCTCAGGTAGCCGGCCCATCCCAAGACCTGGTCGGGGTGATCCTGCTGGAACCGGTTGAGCTCGT
+CGACGACCTTCTTTGACCAGGCCGGGTCGTCAACGGTCTTGCCGGCTGGGGCTTGGAAGATCGCGACGAT
+GTGACCGCTTCGGTCTCGGCCGTAGACCTGGTCGCCCAGCACCGATGCTTGCACCGATTGGCTGCCGTCG
+TCGTAGAAGCCGCTCTGCGTGACGTGCTTGCCGAGGCTCAGCCCGAAAACGCCGCCGCCGAGGCATAGAG
+CGACCATGACCCCGATTACGATGAACCGGTAGCGGTACACAGTTCGACCCCACCAGGCGAACACGTAAGC
+TCCTTACTGGATCGGCAGCGACCCGCGTATTGCTTTTTGGTTGTCACACACGTCGGCTGTCACACTCGCG
+AGGTCAACAGCGAGGACAGCGGCCGGAACGGCTGCAGCCAAGCCCCCTGCTCAGGTAGCGAATCGAGGCC
+GATTCGAGGTAGTGGTTCCCGGAAAACACCAGCGATGTCCTCCAGGTCGACGAACTCCAAGGTATCCGAC
+GCTAGCGCCCAACTGGCGTGTTCACGAAATCCGAGCACTTGAACTGGGGTTCCGCTGCGGGCGACCGCCT
+CCAACGGTTGGCGGAATGCCTGACCGTCGGCCGACGCCACCACCAGCGCGGCGAGCCCTTCGCGGTAGCG
+CTCGTCGATGTGCGCCAACATGTCGCGGTCAACGTCGCTGTCCTCGTCTACTTTCGGTTTGGCGAAGACG
+GCGAATCCGACATTGCGCAACGCGTCCACCCACGGCCGGACCACCTCGGCGCTGCCAGGGGCGATGTTGG
+TGAAGACGGTGGCCTCCGGTTCGGTCGAGATGCCTGGACGGCCGGCCACAATCTCTGCGGTTCGGGCCAG
+CAGCCAGCGTCCCAGGGCGTCGAATCGTGGTCGTTCCAGTGCTGTCGGCCGGCGGCCCAAGATGGAGCCC
+AAACCCATGTCGAGGTTGGGAGCGTCCCACACCAGCAATACCCGTGCCCCCGGCGCACCGAGACTGGTCA
+GCCCGTCCTGCGATAAGTCTTCCGCCAGTACCGAGTGCCGGGCGAGGGATTCAGATGTTTGTGAAGTCAC
+GTCTTCGGTCAGGCTCATCATCATCTAATTTTCAGGTCTCTTTCAGAGCAACCGTGCTTTTTCCATAACA
+ACTCGATGACTGCGCCGCCCCCAAGCTGGGCTTTCCTCTCGTACTTGGTAGCCGGTCGGACGACCGAAAT
+CGGCAGCAGTTCGGTGTCGGGGTCGACGCGAACCAGCCGGGGTTCGGCGTCGCCGGCCGCGGCGATGTGC
+TCGGCGTAGCCGGGATGGTCGGTCGCGGCGTGCAGCACACCACTGGGAACGAGCCGGTCTGCGATCAAGG
+CCATGGTGGCCGGCTGTAACAGGCGGCGCTTATGGTGGCGTGCCTTCGGCCACGGATCGGGGAAGAAGAC
+TCGAACACCGCACAACGAATCGGGGGCGATCAAGTGTTGCAGCACGTCGACGGCATTGCCAAGGATCAGC
+CGGATGTTGATCCCGTCGGAGCCCACTTTGTCAATCGCGCAGAGCAGCTGAGCCAGCCCGCGGCGATAGA
+CGTCCACAGCGATCACGTCGACATGGGGTTCGGCCTTCGCCATCGCCAGCGTCGACGTGCCGCTGCCGGA
+GCCGATCTCCAACACCACCGGCGCGTCACGGCCAAACCAGGCACGGGTATCCACCGGTGTCCCGCGCGGG
+GATTGAGGTAGCGCCAGGAGGCCAAGCTCCGGCCAAAGTCGCTCCCAGGTCTCGCGTTGGGCCTTGGAGA
+TCCCCGACCGCCGCGACCGGATGCTCGTGCTGGGGAGCTGGCCCGATGCCACCGGTGTGTCGGGACGTAG
+CCCTACCCCGGGTTGCGCATGCATTTGTCCATGGTGGACCATCAGCGCCCGGCGTAGCCGCCCCTGGTCC
+AGATTGATACCCAACAGTTGCCTTCGGCGGGTAGCGGACAACTGCTGACTCGCGCCTCGGCGGCGAGGGT
+GCCACCATTCTGAACGAACCGATCGGGTGGGAGATGCGCGGACAAGGGCACCAGATTTTCGTCGACGAGC
+TGGCGCGATTCGCCACCAGCTCCGCCGACCAGCGGGTAGTGGCGATCGCGCAGCGGGCCGCCGAACCGCT
+GCGCGTAGCGGTCCGTGGGCGTCCCGGGGTGGGTTGCCGCACGGTGGCGCGCGCCCTGCAGGGTGCTGGG
+AGCTCGTCGGGCATGACGGTGACACCGCAAGCACGCGCCGCCGACTCTGACGTCGACCTGGTCGTCTACG
+TCACCGTCGAGGTAGTCAAGCCCGAGGACCGCGAAGCCATCGCCGCCACCCGGCGCCCGGTGGTGGCGGT
+GTTGAACAAGGCCGATCTGGCCGGCCCGCTCTCGGGTGCAGGTCCGATCGTGATGGCGCAGGCCCGGTGC
+GCGCAATTTTCTACACTCCTCGGGGTCCCCATGGAGTCCATGATCGGGTTGCTCGCCGTCGCGGCGCTCG
+ACGATCTTGATGACACCTTGCGGGCCGCGCTGCGGGCGCTAGCCGCCCACCCCGACGGCTTTGACGCTCT
+CGACCGAGCCGTTGCGGGGTTTCTGGCGGCAGCCCTGCCGGTCCCTACCGAGGTACGGTTGCGGTTGCTG
+GACACCCTCGACCTGTTCGGCATCGCACTGGGCATGGCAGCGTTCCGGCCGGGCCGGCCCTCGCGAACCC
+CGGCGCAGCTCCGCACCCTGTTACGCCGGGTCAGCGGTGTCGACGCCGTCATCGACAAGGTCACCGCCGC
+CGGTTCTGAGGTGCGCTACCGGCGGTTGCTTGACGCGGTCGCGGAGCTGGAGGCGCTGGCCGCGCAGGCC
+AAGGAGATCGGCGGTCCGATCGGTGAGTTCTTGCGCGACGACGACACAGTTCTCGCCCGGATGGCGGCCG
+CCGTCGACGTAGCCCTGGCCGTCGGGCTAGACGTTGGCCCGTTGGACGATCCGGCCGCCCACCTGCCGCG
+GGCGGTGCGGTGGCATCGTTACAGCCTGGACAACGGTGACATGCACCGCACGTGCGGCGCGGATATCGCT
+CGGGGATCCCTTCGGCTGTGGTCGCTGGCCGGCGGCATGCCCCTGCACCGATACCGGAAGTCATCGTGAT
+CCGCGCGGCTAGTGATGACCCGGCCGGGGTGGACGAGCTGGTGGCAGCGATCGCGCCGGGGCTTGCCGGG
+CTGGGTTTGCCGGTCATCAACCGCCGCGAGGTGGTGCTGGTGACCGGTCCGTGGCTGGCCGGGGTTAGCG
+GTGTGCGCGCGGCACTGGCCGAAAGGCTGCCGCAGCGTAGGTTCGTCGAGACGGCAGAGTTGGGACCCGG
+CGATGCGCCGGTGGCGGTGGTGTTCGTTGTTTCCGCGGCAACCGCGCTGACCGAATCCGATTGCGTGTTG
+CTGGACACCGCCGCGGAGCACACCGATGCGGTGGTAGCTGTGGTGTCCAAGATCGACGTGCACCGCGGCT
+GGCGTGACGTGCTTACCAGTAACCGCGACAGGCTGGCCGCGCGCGCGTCCCGCTACGCCCGGGTGCCCTG
+GGTTGGCGCGGCCGCCGCACCTGAGCTGGGCGAGCCATACCTGGACGACTTGGTCGCCGCCATCCAGAAA
+CAGCTCGCCGATCCGGCTGTCGCGCGGCGAAACATGTTGCGTGCGTGGGAATCCCGGCTTCTGATGGTCG
+CGCGGCGGTTCGATGGCGATGCACAGAGCGCCGGTCGGCGGGCACGGGTCGACGCGTTGCGCCAGCAACG
+GCGCACGGTCCTGCGGCAGGGGCGTCAATCGAAGTCTGAACACACCATCGCGCTGCGCGCGCAGATCCAG
+CACGCTCGGGTCAAATTGTCCTACTTTGCCCGCAATCGGTGTTCGTTGCTGCGCGTCGAGCTGCAGGAGC
+ACGTCGCCGGTCTGTCCCGGAAGGACATCGCCAGGTTCGCGGCATACACGCGCGGCCGGGTCCAGGAGGT
+GGTCGCCGAGGTGGGCGAAGGTGCCGTCGCGCACCTTGCCGACGTCGCGCAGCTGTTGGGTGTGCCGGTG
+CAGCCACCGGTCCTCGAGAACCTCCCGGCGGTGCTCCCGACGGTTGTGGCCCCGCCACTGACATCACGAC
+GATTGGAGATCCGGCTGACAACACTCTTGGGCGCCGGGTTCGGGCTGGGTATCGCGCTGACCCTGAGCAG
+GCTGGTGGCGGGTCTTACTCCCGGCCTGGCTGCATCGGGGATGGTGGCGGGTGTGGCGATCGGCCTGGCG
+GTGACCGCCTGGGTGGTGAATGCCCGCGCGCTGCTGCACGACCGTGTCGTGGTGGACCGCTGGACGGGTG
+AGGTGACGGCATCGCTGCGGTCCGTGGTGGAGCAGCTGGTCGCCACTCGGGTGGTGGCTGTCGAGACGCT
+GCTGAGCACCGCGATTAGTGAACGCGACGACGCCGAGAACGCCCGGGTGGCCGATCAGGTCAGCATCATT
+GACGGCGAACTGCGCGAACACGCCGTCGCTGCGGCGCGGGCCGCGGCCCTGCGTGACCGGGAGATGCCGG
+CGGTGCGGGCCGCACTTGAGGCGGTGCGTGCAGAACTCGGCGAGCCGGGTACGCCCACAACAGGCCTGTT
+CTGAAGCTTCTGAATCGTTGTTGTGAGCAGGCTTATACCCGCCCAAGTCTTCCCTGACAAGTTCTGGGCG
+ATAACCTGGATAAAAAGTGTCTCACTAGGTGAGCGGCCGTATCAGCCTCGCCACCAAGACGGGCATACCT
+AACCCATACGTAACCGCGAGCACCCGATAACTACGCAGGAGAATTCGATGACCTCAGCGACCATCCCCGG
+TCTGGATACCGCGCCGACGAATCACCAGGGGTTGCTGTCCTGGGTCGAAGAGGTCGCCGAGCTCACCCAG
+CCGGACCGGGTGGTCTTCACTGACGGCTCGGAAGAAGAGTTCCAGCGGCTCTGCGATCAGCTAGTCGAGG
+CCGGCACGTTCATCAGGCTCAACCCCGAGAAGCACAAGAACTCCTACCTGGCATTGTCGGATCCGTCCGA
+TGTCGCGCGGGTGGAGTCGCGGACGTACATCTGCTCGGCGAAAGAGATCGACGCCGGCCCCACCAACAAC
+TGGATGGATCCCGGCGAAATGCGGTCCATCATGAAAGACCTGTACCGGGGTTGCATGCGCGGGCGCACCA
+TGTATGTGGTGCCGTTCTGTATGGGACCGCTGGGCGCCGAGGACCCCAAACTTGGTGTGGAGATCACCGA
+CTCCGAGTACGTCGTCGTCTCCATGCGCACCATGACCCGGATGGGCAAGGCCGCGCTGGAGAAAATGGGC
+GACGACGGTTTCTTTGTCAAGGCGCTGCACTCGGTCGGCGCGCCGCTGGAACCGGGCCAAAAGGACGTGG
+CCTGGCCCTGCAGCGAAACCAAGTACATCACCCACTTCCCGGAGACCCGGGAGATCTGGAGCTACGGCTC
+GGGCTACGGCGGCAACGCGTTGCTGGGCAAGAAGTGCTACTCACTGCGTATCGCGTCGGCGATGGCCCAC
+GATGAGGGCTGGCTGGCCGAGCACATGCTGATCCTCAAGCTGATTTCGCCGGAGAACAAGGCTTACTACT
+TCGCGGCCGCATTCCCGTCGGCGTGTGGCAAGACCAACCTGGCGATGCTGCAGCCAACCATCCCCGGCTG
+GCGTGCGGAGACACTCGGAGACGACATCGCATGGATGCGATTTGGCAAGGACGGTCGCCTGTACGCCGTC
+AACCCGGAATTCGGCTTCTTCGGGGTGGCGCCGGGCACCAACTGGAAGTCGAACCCTAACGCCATGCGCA
+CCATTGCCGCCGGCAACACGGTGTTCACCAATGTCGCACTCACCGACGACGGCGACGTGTGGTGGGAGGG
+CCTGGAAGGCGACCCGCAGCACCTGATCGACTGGAAGGGCAACGACTGGTACTTCCGCGAGACGGAAACC
+AATGCGGCACACCCGAACTCCCGGTACTGCACACCGATGTCGCAGTGCCCGATCCTGGCCCCCGAGTGGG
+ATGACCCGCAGGGCGTCCCGATCTCGGGGATCCTGTTCGGCGGCCGCCGCAAGACCACGGTTCCGCTGGT
+CACCGAGGCGCGCGACTGGCAGCACGGGGTGTTCATCGGTGCGACCCTGGGTAGCGAGCAGACCGCCGCG
+GCCGAGGGCAAGGTCGGCAATGTGCGCCGCGACCCGATGGCCATGCTGCCGTTTTTGGGCTACAACGTTG
+GGGACTACTTCCAGCACTGGATCAACCTGGGCAAGCACGCCGATGAGTCCAAGCTGCCCAAGGTGTTCTT
+CGTCAACTGGTTCCGTCGCGGTGACGACGGTCGCTTCCTGTGGCCGGGCTTCGGCGAGAACAGCCGGGTG
+CTGAAGTGGATCGTCGATCGCATCGAGCACAAGGCCGGCGGTGCGACCACCCCGATCGGCACCGTTCCCG
+CCGTGGAGGACTTGGACCTGGACGGACTGGACGTCGACGCCGCCGATGTAGCCGCGGCGCTGGCAGTCGA
+TGCCGATGAATGGCGTCAGGAACTGCCGCTGATCGAAGAATGGCTGCAGTTCGTCGGCGAGAAGCTGCCG
+ACCGGTGTCAAAGATGAGTTCGACGCCCTGAAGGAGCGCCTAGGTTAGGGCGAGCAGACGCATAAGCCCC
+CGCACGCACGGCGTGTCGAGGGCTTTAGTGTCTGCTCGCGCTCGTTAGCGGCGGGCACGCACAAGTTCTT
+CGACAGCGCGCAAAGACACCGAAAGCCTCTCTTCCCAACCGCCCGTGATCACCACGAATGATCGTCCCGC
+GGCGCGGAGAGCCTGCTCGCAGCGGGCGAAAAAGGTACCGCGTGCGCCGGGGACACAGCGTCCGTCGTCG
+GCGTCCCAGGGCACATCGGGCGTGGTGAGCAGTGTGAGATCGTAGGGACGCCGAGCTAGATCACGGAGCT
+CTTGCGGGCAGCCGCCCGCCAGGAACTCGGCCCACACGGTCGTCGCGAGCGGATCCGTGTCGCAGATCAG
+GACGCGATCGGCGTCACGAGCCAAGGCTTCCTCCGACGCGATCTGTCCGCGAACGATTTCGGCCCACTCC
+AGTCCTATCAGTGAGCCGCCATTGAGCTCCCGCAACATTTTCGCCCGCTCCGGGACCCACTTCGTTCGGA
+GCTTTTCCGCAACCGCCTGTGCCAGCGTGGTCTTCCCGGTGGATTCGGGTCCGATGATGCTCACGCGTTT
+GACGAAGGCCGGCCGCACGCACCGTGGGATGTGTTGCCAGTGGCCAAGCGGGTCCGCGCGGATGTCGGTT
+GCAGTCACGGGAACGACGGTGCGACCGTGATCGACCGCCACGAAACGCGCTCCGAGGACCTGGGCAAAGT
+CCGCGTTGTAGGGCTCGGCACCGAAGACGAAGTCGGGGCGGGTTGCCAGCACGCCCTGCAGGCTCGCCTT
+CCAGATGTCCCAGAAGTCCGGGTGCTCCCACGGGCGCTGCGGGTTCTCGTTGGCCAGATGGACCACGCGA
+TCGAAGGGGAACAGCTCCCGCATCCATGCAACGCGCTGGGCGCCCGGAATCGGCTCTGCTGCCGTTGATC
+CGACGACGATGGTCAGCTCATCCACCCATCGCCGCGCGAACTCGCAAAGGTAGACGTGTCCCGCATGGGG
+CGGCATGAACTTGCCGAGCACCATTCCGTGTGTCACGACGTCGCCTCAGCGATTCGGCCGGCGATGACAT
+TCTCCCACTCGTCCAGCCGCGAAAGAAAGTACGCCTCAGCCTCATCGAAGCTGATTCCGACGTCAGGAGC
+GACCTTGGCTACGACGTCGGCGTAGACCCGGGAGGCCTCTGGGTCGACGAATTCCCACTGACCGAGGGGC
+CATTTCGCGGTGAGATAACCCGCGTCCGAGTACGCTTGGTACAACGGCGTTCCCGGATAGGGGACGATCC
+GGCTCATGAACTTGAAGCCGACCGTATACTTTGTTGCCCGCAGCAGGCGGACTGTTTCGCGTAGCTCGTC
+GGGCTGCACGGTGGGGTGAAACATAATGGTGCCCGGGATAACGTCAATGCCGAGCTGTTGCAGGGCGTTG
+ATCGTGTCGGCGGCATCTTGTCCACGAGTGAGGATCTGCTTGCGGTAGGCGCGCAGTTGCTCGTAGGACC
+CAGTCTCCACGCCGATGAATACCCGACGCAGGCCCGCCCTGTGCAGATGTTTGAACAAGTCCAGATCGAC
+AACGGAGTCCAGCCGGATATCGACCATGAAGTTGACGCTGATCCCCCTCCTGAGTACCGCGTTGGCAAAG
+TCAGCGGCGCGTTGCTGCGAACCGGGGTGTTTGGAGATAAACAGGTCGTCGGTGATGGATAGGAAGTTGA
+CGTCGTAGTCCGACACCAGATAATCGATCTCGTCGACGACCGCGTCAACCGACTTCGCCCGGTAGCTGTC
+CTTCCCTAGCATCGCGGACATGGCCCCGGTGCCGCAGAACGTGCAGCGGTAGGGGCATCCGCGGGTGGAA
+AAGACGGAGGCGGCGAAGCCATCAGCAAGGACGGTCGGCAACTCGTCGCGAGCCGGGCGAGGCAACTCGT
+CAAGGTCGACCAGCGAGGAGGGTGTGCGCAGGATCTGTCCCTGCTCACTACGGCGGGCTAGTCCCGGGAC
+GTCGTCAACCGCAGCGTCATTCGCCAGGGCCAAGGCCAGCTTGGTGAACGCTACCTCCCCGTCGCCAACG
+ACGACGTAGTCGAAACAGTCATGCTGGCGCAGGATGCGCTCGTAGTTCAGTGTTGCCATCGCATTCCCGA
+TGACGATGCGCACGCCATCCCAGGCCTGTCTCGCGCGCTGCGCCAACCACAACACCTCCGGAAATGTGTC
+GATGCAGGAAAAGCCGACAAGCCGGGGCGTTCCTGATAAGGCGGCGGCGCTTTGCATGGCCAGCCACGTC
+TCCTGCACGGACCCGTGGCCGGCGACCAGGCCGTTGACGGAGGTGACTGCGATCCCTTGGGTCTTGGCGT
+ATGCCTTGATCGACATCATCCCGAGGTGCTCCATGGGCATGGAGCAATACAGCCACGGATCTCCAAGCTT
+GAGTCCGTCAACGTACGACAGCCCGTCTTGACGGACGCCTGGAGGATTGACCAGAAGAGTTGCCACGTGG
+AGAACTTTACAAACGATTTCGGCTGGTGATGGGCGGAATTGCGCCCTGCGGCTCTGGTCGCCGGGCCGCG
+ACGTACCCTCGGCGCATGCAGATTCGCCCGTATATCGCCGCCGATAAGCCCGCCGTCATCCTGTATCCGT
+CCGGGACGGTCATCAGCTTCGACGAGTTGGAGGCCCGCGCCAACCGGTTGGCGCATTGGTTCCGCCAGGC
+TGGTCTGCGCGAGGACGACGTCGTGGCCATCCTGATGGAGAACAACGAGCACGTGCACGCGGTCATGTGG
+GCGGCTCGCCGCAGCGGGTTGTACTACGTGCCGATCAATACCCACCTGACCGCCTCCGAGGCCGCCTACA
+TCGTCGACAACAGCGGTGCCAAAGCAATTGTCGGTTCGGCGGCGCTGCGCGAGACCTGCCACGGCCTGGC
+CGAACACCTTCCGGGCGGGCTGCCGGACCTGCTGATGCTTGCCGGGGGCGGTCTGGTCGGCTGGATGACC
+TACCCGGAATGCGTTGCCGATCAACCAGACACCCCGATCGAGGACGAACGCGAGGGTGACCTGCTGCAGT
+ACTCGTCGGGAACGACTGGCCGACCGAAGGGAATCAAACGCGAATTGCCACACGTCTCACCGGATGCGGC
+ACCCGGGATGATGCCGGCACTGCTCGATTTCTGGATGGACGCCGACTCGGTATATCTGAGTCCCGCGCCG
+ATGTACCACACCGCTCCGTCAGTGTGGACGATGAGCGCACTGGCCGCGGGCGTCACCACCGTCGTGATGG
+AGAAGTTCGACGCCGAGGGCGCCCTCGACGCCATCCAGCGCTACCGGGTGACCCACGCGCAATTCGTCCC
+GGCCATGTTCGTCCGGATGCTGAAACTCCCTGAAGCAGTTCGTAATTCGTATGACATGTCCAGCCTTAGG
+CGAGTGATCCACGCGGCCGCTCCATGTCCAGTCCAGATCAAGGAGCAGATGATTCACTGGTGGGGACCGA
+TCATCGACGAGTACTACGCCTCCTCGGAAGCCAGCGGGTCGACGTTGATCACAGCCGAGGATTGGTTGAC
+GCATCCGGGTTCGGTCGGCAAGCCCATACAGGGCGGGGTGCACATCGTGGGCGCCGACGGCAGCGAGCTG
+CCGCCGAACCAGCCGGGCGAAATCTATTTCGAGGGCGGGTACCCCTTCGAATACCTCAACGATCCGGCGA
+AAACCGCGGCGTCGCGCAACAAGCACGGCTGGGTAACCGTCGGCGACGTCGGCTATCTCGACGACGACGG
+CTACTTGTTCCTGACCGGCCGGCGCCACCACATGATCATCTCCGGCGGCGTGAACATCTACCCGCAGGAG
+GCGGAGAACCTCTTGGTCGCCCACCCCAAGGTGCTCGACGCGGCGGTGTTCGGCGTTCCCGACGACGAGA
+TGGGTCAACGTGTCATGGCCGCGGTGCAAACCGTCGACTCCGCCGATGCCAACGATCAGTTCGCCGGCGA
+GCTATTAGCCTGGTTACGAGACCGCTTGTCACACTTCAAGTGTCCAAGGTCGATCGCGTTCGAACCGCAA
+TTGCCGCGCACCGACACCGGAAAGCTCTACAAGAGCGGGCTGGTCGAAAAATACTCGGTGTGACCGATGC
+TGCCGGGGGCCCGACCTGTCCACCCAGACACCGGCTATATCCCGCCCCGGGCCACCAGTTGTCCGGCTAT
+CACGTTGCGCTGGATCTCGTTGGTGCCTTCACCGAGGATCATCAAGGGTGCGTCGCGGAAGTACCGTTCC
+ACGTCGTACTCGGTCGAGTAGCCGTAGCCGCCGTGGATACGCACGGCGTTTAGGGCGATTTCCATCGCGA
+CCTCGGAGGCGAACAACTTGGCCATCCCGGCCTCCATATCGCAGCGTTGGCCGCTGTCGTACCGCTCGGC
+GGCATAGCGGGTCAGCTGACGGGCCGCTGTGAGCTTGGTCGCCATGTCGGCCAGGTAATTGCCGACCGCC
+TGATGCTGCCAGATCGGTCGGCCAAAGCTTTCCCGTTGCTGAGCGTAGGCCAGCGAGTCCTCGAGTGCCG
+CCGTCGCCACGCCCAGCGCCCGCGCGGCCACTTGGATGCGACCCGTTTCAAGTCCCTTCATCATCTGCGA
+AAAGCCTTGACCCATGGCTCCGCCCAGGATCGCCGAGACCGGCACCCGGAGGTTGTCGAACGACAGCTCG
+CAGGATTCGACGCCCTTGTAACCCAACTTCGGCAAGTCCCGCGACACCGTGAGTCCCGGCCCGGGTTCGA
+CGAGCACGATCGACATGCCTTGGTGCCGCGGTGTGGCGTTCGGGTCGGTCTTGCACAGCACCGCGAAAAG
+TCCGGACCGGCGGGCGTTGCTGATCCACGTCTTGCAGCCGTTGATCAACAACCCGGCAGAGCCTTCAGGG
+CCGTCGGCCAACGCCGTGGTCGACATGTTCTGCAGATCCGAGCCACCGCCGGGCTCGGTTAGCGCCATGG
+TGGCCCGCAGCTCGCCACTGGCCATCGGGGGCAGATATGTCCGCCGCTGTTCCTCGGTGCCAAACAGGGT
+CAGCAATTTGGCGACGACGGTGTGCCCGCCCATCGCGCCGGCCAGGCTCATCCAGCCGCGTGCCAGCTCC
+TGGGTGACTTGCACATAGCACGGCATCGACACCGGCGACCCGCCGTACTGTTCGTCGATCGCCAGGCCGT
+AGATGCCGATGTGTTTCATCTGCTCGATCCACGCCTCCGGGTAGCTATTGGCATGCTCGACCTCACGGAC
+GGTTGGCTTCACGTCTCGGTCGATGAATGCCCGCACGGTGGCGACCAGCATCGCTTCGTCGTCGTTGAGC
+TCGTTGCGCACCTTTTGTCGCCCTCCGTATTGACCCCCTGTCCGATAGCCTGCCAGAATGTGGCGTTGTG
+GCTAGCGGGTATGGGGGCATCCGCGTCGGCGGGCCCTATTTCGATGACCTGTCAAAAGGTCAGGTGTTCG
+ACTGGGCGCCGGGGGTCACACTGTCGCTGGGGCTGGCGGCCGCCCATCAGTCGATCGTGGGTAACCGGCT
+ACGCCTGGCTCTGGACTCCGACCTGTGTGCGGCGGTGACGGGTATGCCGGGGCCGCTGGCGCATCCGGGC
+CTGGTTTGCGATGTGGCGATCGGCCAGTCAACTTTGGCGACTCAGCGGGTCAAAGCCAACCTGTTCTACC
+GCGGGCTCAGGTTTCACCGATTTCCGGCAGTGGGCGACACCCTCTACACCCGTACCGAGGTGGTGGGGCT
+GCGAGCCAACTCGCCCAAACCGGGCCGTGCGCCAACCGGATTGGCGGGGCTGCGGATGACCACGATCGAC
+CGGACCGATCGGTTGGTGCTCGATTTCTACCGGTGCGCCATGCTGCCCGCCAGCCCCGATTGGAAACCCG
+GCGCTGTGCCAGGTGACGACTTGTCCAGGATCGGTGCCGACGCGCCGGCGCCGGCCGCCGATCCAACCGC
+ACACTGGGACGGTGCGGTTTTCCGAAAGCGGGTTCCCGGGCCGCACTTCGATGCCGGTATTGCCGGTGCG
+GTGTTGCATAGCACCGCAGACCTGGTCAGTGGAGCGCCGGAGCTGGCTCGGCTCACCCTCAATATCGCTG
+CTACGCACCATGATTGGCGGGTCAGCGGACGACGGCTGGTCTACGGCGGGCATACCATCGGACTGGCACT
+CGCGCAGGCAACCCGGCTATTGCCTAACCTGGCGACCGTCCTGGACTGGGAATCCTGCGACCACACCGCT
+CCGGTACACGAGGGCGACACCCTCTACAGCGAGCTGCATATCGAGTCTGCGCAGGCCCACGCAGACGGGG
+GTGTGCTGGGACTGCGGTCACTGGTCTACGCGGTCAGCGATTCGGCGAGTGAGCCCGATCGGCAGGTGCT
+CGACTGGCGTTTTAGCGCCTTGCAATTCTAGGTTCGGTTACTAAGGGCCAGCGCGGCACGCAAACTGTTG
+CACTGACTAGTGAAGAACCTTTGTGAGACCCCAACATTCGGGGCCACACGATCGAAACCGTGGAAGGCGC
+CTTCGACTACTTCTACCTGGCATGGCACCCCGGCTGCTGTCAGACGTTCGGCATAGGCCAGATCCTCGTC
+GTGGAGCAGGTCGTGGGTGCCGACGCCGATCCATGCCGGCGCCAGCCCTCCTAGGTCGTCACGCCGTCCC
+GGGACCGCGACCCGTGCGTCCGCATCGCCAAGATATGCCCGCCAGCCGAACCGGTTGGCGCGCCCGTTCC
+ATAGCCGGTAGTGCGGGTTGGCGGGGGCGATCGACGTCCGGTCGTCGAGCATGGGGTACACCAGCAACTG
+AAATGCCGGTGTGATGCCGCCACGGTCGCGGGCAAGCAGAGCCAGCGCCGCCGCGAGGCCGCCGCCGGCA
+CTAGCGCCGCCGATTGCCACCCGCGCGGGGTCCACCGCCGGCAGGCTGGCCAGCCAGGTCAACGCCGAGT
+AGCAGTCGCCCAGGGCGGCAGGATACGGATTTTCCGGCGCCAGGCGGTAGTCCACCGATGCGACAGTGAT
+GCCCAGTCTGCTGCTGAACCGGAGGCAGAGCCGATCGTCCTGTTGCGCGGTGCCCATTACGTATCCGCCG
+GCGTGGATCCACAGCAGCGCGGGCGCTGGTTCGTTGCTGCCGGCGGGTCGGTATAGCCGGACACCGACCC
+CGGATTCCAGGGTGAGCACCTCGATATCGGGGGGTGTACGGGACATTCGAAGCCCCGCGACGACGATCAA
+TGCCCGCATGACTGGCAGGGTGCGAGGACCGACCAGCTGTCGTGGGGTGACGACGGCGATGCGACGCAGG
+TCGGGGTGGACTTCGTTGCCGGACACCGGTCCAGTATGCGTCGGCGCAATTTCGCCTCGGTACAGCGATG
+GCTTTGGCAGGCTGCGGTTAGTCGAACGAGGATCGGGATGGTGGCCTGATGAGTGATCCAGCAAGAGGGG
+CGGAAGCCGAGGATGCCTACGGTTTTCCCGCCGGGCTGTGGCGCTGGCTGCAGCGGCATCCACCGCCGGC
+GTTGCACCGGCTCACCCGGTTTCGCAGCCCGTTGCGTGGTCCGTGGTTGACGTCGGTGTTCGGCCTGGTG
+CTATTGGTGGCGTTGCCTTTCGTCATCATCACCGGGCTACTTTCTTATATCGCCTATGCGCCGCAGCTGG
+GCCAGGCCATCCCCGGTGACGTCGGCTGGCTGCGACTCCCCGCTTTCACCTGGCCCACCCGTCCGTCCTG
+GCTGTACCGGTTGACCCAGGGGCTGCATGTGGGGCTGGGGCTGGTGATCATTCCCGTGGTGCTGGCCAAG
+TTGTGGTCGGTGATACCGCGGCTGTTTGTGTGGCCGCCGGCGCGCTCGATTGCCCAGGTGCTCGAACGGT
+TGTCGGTGCTGATGCTGGTCGGTGGGATCCTGTTCCAGATCGTCACCGGCGTGCTCAACATTCAGTATGA
+CTACATCTTCGGGTTCAGCTTCTACACCGGCCACTATTTTGGGGCTTGGGTCTTCATTGCGGGTTTCCTG
+TTGCATATCGTGGTCAAGATCCCCCACATGGTCACCGGGTTGCGATCGATACCGATGCGAGAAGTGTTGG
+GTACCAACGTGGCTGACACCCGGGCGCAGCCGTGCGATCCGGACGGGCTGGTGTCGGTCAATCCGGGCGA
+GGCCACGCTAAGCAGACGCGGTGCCCTGGGATTGGTCGGTGCCGGGGTGCTGCTGATCGGGGTGCTGACG
+GTTGGGCAAACCCTGGGCGGGTTCACCCGCAAGGCCGCCCTGCTGCTGCCCCGGGGCCGTGTCGTGAGCC
+CGGGCGACTTCCCGGTCAACAAGACCGCCGCCGCCGCCGGGATCACCGCGGAGGCCATTGGCCCCGACTG
+GCGGCTGGTGCTGCGTGGCGGGCCTGCGGAAGTAGTGCTGGATCGCGCCACGCTGGCCGGCCTGCCGCAA
+CGCACCGCCCGGCTGCCGCTGGCCTGCGTCGAAGGGTGGTCGGCCGTGCGCACCTGGAGCGGCGTGCCGC
+TGGCCGAGCTGGCGCTGCTGGCGGGCGTGCCGGCGGCGCGCTCGGCACGGGTTACATCGCTGCAGCGCGG
+CGGGGCGTTCGGCGAGGCGAAGCTGGCGGCAAACCAGATCGCCGACCCCGATGCGCTGCTGGCGTTGCGG
+GTCGACGGGGCGGATCTGTCGCTGAATCATGGCTACCCGGCCCGCATCATCGTTCCCGCACTGCCCGGTG
+TGCACAACACGAAATGGGTCGCTGGCATCGAATTCCACAAGAGGTGAAATGTTCGACATTGCAACGCGTT
+TCAAAAACTCCTACGGGTCAGGTCCATTGCACCTGCTGGCGATGGTGTCTGGCTTCGCCCTGCTGGGCTA
+CATCGTGGCCACCGCCAGGCCCTCGGCGCTGTGGAACCAGGCCACCTGGTGGCAGTCGATCGCGGTCTGG
+TTTGTCGCCGCCGTCGTAGCCCACGACCTGCTGTTGTACCCGCTCTACGCGCTGGCCGACCGGATCCTGG
+CCAGGCTAGTCGGCAGGCGCGACGTCTCGGCGCCCCGCCGCCGCCCGGAACTACCGGTACGCAACTACAT
+TCGGATCCCGGCGCTGGCAGCCGGCTTGACGCTGCTGGTTTTCCTGCCCGGCATCATCAGACAGGGTGCG
+CCGACATACCTGGATGCGACCGGACAGACGCAGGAACCATTTCTGGGCAGGTGGTTGCTGCTCACCGCGG
+TCGCGTTCGGGATCAGCGCGGCCGCTTACGCCATTCGGCTGGTGGTGGCGCACGTGAGGCGGCGCCGAGC
+GGGGTGTTCGCGGGTCGACGCGATCGACGAGGAGTAGGCTCCCACCATGAACCAGCGACGCGCCGCCGGG
+TCAACCGGTGTGGCCTACATCAGATGGTTGCTACGTGCCCGTCCCGCTGACTATATGCTGGCCTTGAGTG
+TCGCCGGGGGTTCGCTACCGGTGGTGGGTAAGCACCTCAAGCCGCTCGGCGGCGTTACTGCCATCGGCGT
+CTGGGGCGCCCGGCACGCATCCGATTTCTTGTCCGCGACGGCGAAGGATTTACTGACCCCCGGTATCAAC
+GAGGTTCGCCGTCGAGATCGTGCCAGCACGCAGGAGGTTTCCGTCGCGGCCTTACGCGGCATCGTTTCGC
+CCGACGACCTTGCCGTCGAATGGCCGGCGCCGGAGCGCACGCCGCCGGTCTGCGGGGCGCTGCGCCACCG
+CCGTTACGTCCACCGCCGTCGCGTCCTCTACGGCGACGACCCGGCCCAGTTGCTCGACGTATGGCGCCGC
+AAAGATATGCCCACCAAACCCGCGCCGGTGTTGATCTTCGTCCCAGGCGGTGCCTGGGTGCACGGCAGTC
+GCGCCATCCAGGGGTATGCGGTGCTGTCTCGGCTGGCCGCACAGGGGTGGGTGTGCCTATCGATCGACTA
+CCGGGTCGCACCGCATCACCGCTGGCCACGACACATCCTGGATGTCAAGACCGCCATCGCGTGGGCACGG
+GCCAATGTCGACAAATTCGGCGGTGACCGCAATTTCATTGCGGTGGCTGGTTGTTCGGCCGGCGGCCACT
+TGTCCGCGCTGGCCGGGCTCACCGCCAACGACCCGCAATATCAGGCCGAGCTGCCAGAGGGCTCCGACAC
+GTCGGTCGACGCGGTGGTGGGGATTTACGGCCGCTACGACTGGGAGGACCGCTCCACCCCGGAACGTGCC
+CGGTTCGTCGATTTTCTGGAGCGGGTAGTGGTTCAGCGCACGATTGATCGTCACCCCGAAGTGTTCCGTG
+ACGCGTCGCCGATCCAACGAGTCACCAGAAATGCACCGCCATTCCTGGTGATTCATGGCAGCCGTGACTG
+TGTCATCCCGGTTGAGCAGGCGCGGAGCTTTGTCGAGCGGTTACGAGCGGTCTCCCGCTCACAGGTTGGC
+TACCTGGAGCTGCCCGGTGCGGGCCACGGCTTCGACCTGCTAGACGGCGCTCGCACCGGCCCGACGGCAC
+ACGCGATCGCGCTGTTTCTCAACCAGGTTCATCGCAGCCGGGCACAGTTCGCGAAAGAGGTCATCTAAAC
+GCCGGCCAATTGTATGGTCGCCCTATGAGTAGGGGGCTGCGGTGAAACGGCTCAGCGGCTGGGACGCGGT
+ACTGCTTTACAGCGAGACCCCGAATGTGCACATGCACACACTCAAGGTCGCCGTGATCGAATTGGATTCG
+GACAGACAGGAATTCGGTGTCGACGCGTTTCGCGAGGTGATCGCTGGCCGGCTGCATAAGCTTGAGCCAT
+TGGGCTATCAGCTGGTTGATGTCCCGTTGAAGTTCCATCACCCGATGTGGCGGGAGCACTGCCAGGTCGA
+TCTCAACTACCACATCCGGCCGTGGCGGTTGCGCGCCCCGGGGGGTCGGCGCGAACTCGACGAGGCGGTC
+GGAGAAATCGCCAGCACCCCGCTGAACCGCGACCACCCGCTGTGGGAGATGTACTTCGTTGAGGGGCTTG
+CCAACCACCGGATCGCGGTGGTTGCCAAAATTCACCATGCGTTGGCTGACGGTGTTGCCTCGGCAAACAT
+GATGGCACGGGGGATGGATCTGCTGCCGGGACCGGAGGTCGGCCGCTATGTGCCTGACCCCGCTCCTACC
+AAGCGGCAGTTGCTGTCCGCGGCGTTCATCGACCACTTGCGCCACCTCGGCCGGATTCCTGCAACCATCC
+GGTACACCACGCAGGGTCTAGGCCGGGTGCGACGTAGCTCGCGCAAGCTCTCACCCGCACTGACCATGCC
+ATTTACCCCGCCACCGACGTTCATGAATCGGATAAAGAAGCCGTTGTCCAAGCCCTCGGGACGGCCGCCG
+CCGCACACCAACCGAGCGCCCTCCTCGATGCCCTTGGCGATGTAGCGCTTCAACGCGAGTCCGCTGCTTC
+TCCGAGATCAGCGGCCCGATCTGAGCTGCCGGGTCCGACGGCGGGCCCACCGGGAGAGCCGTTACGAAAT
+TAGTTACCGCAGCCACGATTTCATCGTACCGGGAGCGCGGAGCCAGAATGCGGGTCTGGTTGACGCAGCC
+CTGTCCGGCGTTCATGACGCCGGAGAACACCATCATCGGAATAGCTGCGGCCAGGTCGACGTCCTCGAGA
+ATGATGGCCGCCGACTTGCCGCCGAGTTCTAAGGTGCACGGCTTGAGCATCTCAGCGGCACGCCTGCCGA
+CCTCTCGGCCGACGGCCGAGCTGCCGGTGAAGGTAAACATGTCGATGTCCGGGTTAGACGTCAGCGCCTG
+ACCGGTCTCAATCCCTCCCGGCACTACCGACAACACCCCCTCGGGCAGGCCCACCTCGGCGAACACCTCC
+GCCAAAGCGTTTGCGGTCAGCGGTGTTTCGGCGGCGGGCTTGAGCACGATGGTGCAGCCGGCCAGCAGCG
+CCGGCGCAATCTTGTTGACGGCCAGAAACAGCGGGACGTTCCAGGCCACGATCGCGCCCACCACACCGAC
+CGACTCACGGCTGACAATGCTCTGTCCATAGGAGCCGGTGCGGGTTTCGGTCCAGGTGACCTTGTCCGCT
+GCACCGGCAAAGTAGTTCATCGCCCCCATCGAACCCATCCAGTGCATCGTCTCGATGATGGTCGGCGGCT
+GGCCGGTTTCGGCTGCGAGCAGCTTGGTGAACAGGTCCTTGCGCTCAGCCAGCATCTTGACCGCCGCAGC
+GATCACCGCCGCACGCTCGTGCGGCGGGGTCGAGGGCCAGGGGCCGTTGTCGAACGCCGCACGTGCTGCG
+GCGACCGCGGCGTCGACGTCGGCGGCGGCCGCCATCGGCACCTTGCCGACATATTCCCCAGTGGCTGGGC
+AGCGTACCTCGATAACATCGGAGGTCGACGGTTTGGTCCACTTGCCGCCGATGAAAAGCTTGTCGTATTC
+CGTGGCACTGTCAGACATATGCGCCGCTCCTCCTCATCGCTGCGCTCGGCATCGTCGCCGGCGGTCATGG
+CGTCACCCTACCCAAGCCGAACGCGAAACGAGAACGTGTTCCATTATTAGGGTGTGAGCACCAATACCAG
+ATTGCTCACCAGGAACTCACGCAGCACCGGGACGGATGTCAGCCACCACGCCCATCTGGGGTGGTAGCGG
+GGAAATACGGCTAACGCGGCTCCGGTGCCGGCAGCCCAGCGCAGACCCTCGGCGGCGGACACGGCAAACA
+ACGACGACCCATAGTTGTTCTTTGCCGGATGGCCGTGTTTGCGGACATATCGGGCGGCGGCGCGGGCGCC
+GCCGAGGTAGTGGCTGAGGCCCATCTCGTGCCCGCCGAATGGCCCCAGCCAAACCGTGTAGGACAGCACG
+ACCAACCCGCCTGGCTTGGTCACCCGCAGCATCTCGGTGCCAAGCTGCCAGGGGCGCGGCACGTGTTCGG
+CGACATTGGAGGACAAGCAGATGTCTACCGAGTCGTCGGCCAACGGCAGTGCCATGCCTGACGCCCGGAC
+GAACATGCCGGGCCGGCCGGTGAACGCAGGTCCGGCGGCATGCATTTCATCAGGGTCCGGCTCGACGCCG
+ATGTAGCCGACACCGGCGTCGGAGAACGCCGTCGCGAAATACCCCGGCCCGCCGCCAACGTCGAGCAGCG
+TACGGCCAACTGGCGGCTCGCTATGTGTGGCCAGCCACAGATCGCCGATCATTGCTGCGGTGTCGGCCGC
+CAGTGTGCGATAGAACCGTGCCGGGTCGCGCTGCTCGTAGCGGAAGTCTGCCAGCAGTCGCAGCGAGCGC
+CGCAGTGTCGCCCGTCGCGCGAACACATCGGTGACCGCCACCTGGCACACCCTACGGCCCGCTAGGCTAT
+CGACCAATGTCTGCTCTGCGCTCGGTGTTGCTGCTGTGCTGGCGCGACATCGGGCACCCCCAGGGGGGCG
+GGAGCGAAGCCTATCTGCAACGCATCGGGGCTCAGTTGGCCGCATCGGGCATTGCAGTCACGTTGCGCAC
+CGCTCGCTATCCCGGTGCGCCACGGCATGAACTGGTCGACGGGGTGCGGATCAGTCGTGCCGGCGGGCGC
+TACTCGGTGTATCTATGGGCGTTGCTGGCGATGGCCGCAGCCCGATGTGGGCTTGGGCCGCTGCGCCGAG
+TGCGCCCGGATGTGGTCGTCGATACCCAAAACGGCTGGCCGTTTGTGGCCCGGCTGTTGTATGGCCGGCG
+GTCGCTGGTACTGGTACACCATTGCCACCGTGAGCAGTGGCCGGTGGCCGGGCGGATGATGGGTCGGCTC
+GGCTGGTATGTCGAGTCGATGTTGTCGCCACGGCTACACCGGCGCAACCAGTACGTGACGGTGTCGCTGC
+CGTCGGCGCGGGATCTGATCGCCCTCGGTGTGGACAGCGAGCGGATCGCTGTGGTGCGCAACGGCCTCGA
+CGAGGCGCCGTCGCCAACGTTGTCCGGCCCACGTGCGCCCACGCCGCGTGTGGTGGTGCTCTCCCGGCTG
+GTGCCGCACAAGCAGATCGAGGACGCGTTGGCAGCGGTCGCGGAGCTACAGCCTCGGATACCGGGCCTGC
+ACCTAGACATCGTCGGCGGTGGCTGGTGGCGGCAGCGCCTCGTTGACCATGTGCACCGGCTCGACATTGC
+TGACGCCGTTACCTTTCACGGGCATGTCGACGATGTGACCAAACACCATGTGCTGCAAAGCTCCTGGGTG
+CACTTGTTGCCCTCACGTAAAGAGGGATGGGGGCTCGCGGTCATCGAGGCGGCCCAGCACGGCGTGCCCA
+CCATCGGGTACAGATCCTCCGGTGGTTTGGCGGACTCGATCGTCGACGGGGTGACCGGCATATTGGTCGA
+CGACCGGGCCGAATTGGTGGCTTGGCTCGAACAACTGCTGTCCGATTCGGTGCTGCGTGACCAACTCGGC
+GCCAAGGCACAGGCGCGTAGCGGTGAGTTCTCCTGGCGGCAAAGCGCCGAAGCGCTGCGCAGCGTGTTGG
+AGGCAGTGCAGGCCAGCCGTTTTGTCAGCGGCGTGGTTTGAGCCGGCTTCGACAGACTTAATCCTGGGCG
+CGGCTCGCCGGCGTGTCTTCGCAGTGGTGTAAGTGTCGGCGCACCCAATAGCCGGCCGCGCCAGCGCCGC
+CGACCAGCAGCATCGAAAGCCACGCCCAATGCGCGAGCATTGTCGCTTTGAGGCGGGCCGACGATGCACC
+GGAGGTTTGGCCGCCGACCCGATAAAGAGCCAATTCGTCGTCGCGGTGCGCCGCTGCTAGCCGGCCGAGG
+GTGCGTGCGGCCGCGCCCATGTCGCCGGCGCTGTCGGATTCGACGACCAGCCACCCGACGCCGGCCGCGG
+CCAAGGTTGACGGATGGGGCCCGGTGAGCAGCAGCTCCTGGACCGCCCGGGCGTGCGCGTCTTCGCCGGG
+AACGGTCACCCCGGAAATGACCAGATCACCTGTGGTCAGCACATCGGCGCGAACCCAACGGGGGAGCGGA
+TCGAGTACCGGTGCCGAACCGGACCACGAGAAGCGCCGCATGGTGCCCGCGGGCAAGACCGCAACCGTCC
+GGGGATCGGCATTGATCGCCGCTGCCACCGCCGCCCAACCGGACGGGTAGTGCACAGGCGCAACCTTGCC
+CCACACCCCCCACGCCAAGTCAGGCAGCGTTAGGACCAGCGCCAGACAGCAGACCACCGCCGCCGTTGCC
+GGTCGCAGCCAGCGTCGCAGCGTTAGCACCGTGCCCGCACCGGAGAGTGTGTATCCGGGTACCGCCAGCG
+CGACCCACTTCTGTCCGTCGCGCAGCACGCCCAGGCCGGGTGCGGCATCGACCACCACCCGTAGCGCGTG
+CAGACCTGGGCCGGTCGCAAGGACAGCCGGGACCATCACGGACACCGCCGCTAGTGTCAGCAGCGGCACT
+GCCACGGGCCGGCGCGCCACAGTCGGTAGTCCGATCGCCACCATGGCGAGTAGTACGACGGCGGATGCCA
+CTGCGAAAAGCGTTGTCCGCGAGCTAGGTACGGCCTCGCCGTTCCAGATCCCACCGAGACTGGCCAAGCT
+GCCAAGCGTGCCCAGCCCCGGTTCGGCGCGTGGCGCGAACGCGGTAACCCCAAGCTGATTGGCTGCCGTG
+TGGCTGGTCAACGACGAGCCCAGCGCCGACGCCGTCAGCCAGGGCAGCGCACCCACCAGCGCGGAGCCCA
+ACGCCGCGACCCCACATTGCCAGCGCGGGCGGCCCGCGCCGGGCATCGCCACGCACACCACCGCAACTGT
+CGCGGCGAGTAGCAGCCCGGACGGGGTCAGGCCGGCCAGCGCAACCCAGAACGCCAGCCCAAAAAGCCCG
+AACCAACCCGCGCCAACCGTTGTTCGCATCGTTAACATCGCGGTCGCAACCCAGGGCAGACACCCATAGC
+CGACCAGCAGGCTCCAATGGCCCTGCAAAAGTCGTTCGGCCACATAGGGATTCCAGATCGCCAGCGTGAT
+CGCGACAAACTGGCCGGCTGCCCCCGCTGCGGGTAGTGCCGTTGCGACCAGTCGGGCCGCGCCCCAGCCC
+GCCAGCCAAAGCCCCAGCAGCAGCAGCGCTTTCACCACGACGCCGCCGTCGACGAGGTGTGACGCCAAAG
+CGACCGCGAAGTCCTGCGGAGTCGCCCGGGGCGCCGATGTCAGCCCTAGGGCGTTGGCCGACACATACGA
+CCGTGGTGTGGACACTGCATCGCGCAGCAGTAGGTATCCGGGCCGCAGTAGCGGCGCGGCCAACAGCAGC
+ACCAAGACCAGCGCGTACCCCGGTCGGAACCAGCGCACGTCGCCTGATTAGCGCCGCTCGGGCGGGCCGG
+GGTCGGGATGCCCCGCGTCCGGCGGTGGGGGCGGCTGCGCCGAACCGAGTCGGGGCGGATCCGAGCCATT
+CGGCTCGCGCGGGAAGTCGGGGCGCTGCGTGGGCAGTTTCTCGGTCTCAGCCTCCGCTCCAGGCACCGGT
+TCTTCGAAGCCGCCGCGGCGGTAATCGTGGTCGTCCCGATCCCCGCTGGCAGCCATCAGCGCACCTTCGG
+TCCGAAGGCTAAACGACGCGAACAGACCACCGCCGACCAGCGCGACCAAGCCGGCCGCGGTGAATGTAAT
+CGGCAGCACCCGCGACCACAGCGCCAGCCGGTCGCGCTCGTCGCGAGCCGCGTTGACCTGGGATTCGACC
+GTCTCTTCGGTGGAGGTGACCTGGTAGTCGGCAAACGTGACCTCTGGTTTGAGTGGGTCACGAGCGAAGT
+AGTGGTTGGCGCGTTCGGTTTCTTTGACGATGGTGCCGGACACCGGGTCCACCCAGAATGTTCGCTGCGC
+CGCGTAATAGCGGGTCATGGTGATTTGCTCGTTCGGATCACCGGGTAGCCCCCACATCGCCGCTGATGTG
+GTGACTTTGCCGTCCTCGTCGCCGGCGTACAGCGACGGGTATTTGAGGGGAGCCACCAGCTTCCCCTCGG
+GGGTGTAGCCGACGTTCTGCGTGAAGCGGTATGTGGTTAAACCGTTGACGTCCTCCTCGCCTTCGTAGTT
+GGCGTCAAACGCCTTCTGTGCGATGGGGTCGAAATAGGGGTATGTCTTCTTCTCGGTGTGAAACGGGAAC
+CGGTAAGACAGCCCGTCGTGCCGCAGCGGAATGGCCGTCGGCGGGTTCTCGTCATTGAGGCCCCGCGGTT
+TCTGGACGGCGCCGCCGGTGTGGGTGTCGTCGGAGACAGCCATCGCCGTCTTGCGGTTGAGGGTGACCGT
+GTCGACGATCGCCAGCAGCAGCCCGCTGTCCTTCTGCTTGTCGGTGCGCCGGAGCGAGGATCCGACCTGA
+AGTGTGACCACGTCGGCGTTGGCGGGCGATTCGACGGTGACTTGCTGTTGGGACACCAGCGGCACGTCCT
+GGTTGACCACGATGTGCTCGGTGGCTAGCGACGCCGAGTCGAGTGCCGTTCCAGTGCCGTCGCTGATCAA
+CGTGGCATCGATATCGAGTGGGATCTCAGCGATCCTCCTGGTGGTATAGGTCGACAGCAGCAGGGCGGCG
+ATCAGTAGGGCGGCTCCGAGTCCGATAGCGCCGCACGCGGCGAACCGCAACATGACTGCCCGGTTCACCT
+GCGCCGCTCTCCCCCGCAAGCGGGTGGTGCCCCCACCTCATCGCTTCGTCCCCCGCAAGCGGGCGGTGCC
+CCCACTGCATCGTCGCCGGCGCGGTTCACGTTGCTGTGACCTCCTTATGGTCCATGGACTCGTCGGTCGG
+GACCCGCTCCGACCTGACCAAGCGAGGCAAAACCCGTTTGACCCTAACAGCAGAGCGTATGGGCCCGGCG
+GACGAATCGGGTGCACCGATTCGCCCGCAAACACCTCACAGGCACACTGTGTTGGTGACCAACGGCCAGG
+TGGTGGGTGGGACCCGTGGCTTTCTGCCCGCCGTCGAGGGAATGCGCGCATGCGCGGCCGTCGGCGTCGT
+GGTCACTCACGTCGCGTTCCAGACCGGGCACTCTAGCGGTGTGGGCGGGCGGCTGTTCGGCCGCTTCGAT
+CTGGCGGTGGCGGTGTTCTTCGCCGTGTCGGGATTCTTGTTGTGGCGCGGACACGCCGCAGCGGCGCGAG
+ATCTGCGGTCACACCCGCGAACCGGTCCGTATCTGCGATCGCGGGTGGCGCGCATCATGCCGGCCTATGT
+GGTGGCGGTGGTCGTCATCCTGTCCCTGCTGCCCGACGCGGATCATGCCAGCCTGACCGTGTGGCTGGCC
+AACCTGACGCTCACCCAGATCTATGTGCCGCTGACCCTGACCGGCGGCCTGACCCAGATGTGGAGCCTGT
+CGGTGGAGGTCGCCTTCTATGCGGCGCTGCCGGTCTTAGCGTTGCTGGGCCGCCGAATTCCGGTCGGTGC
+CCGAGTGCCGGCGATCGCGGCGCTGGCGGCGCTCAGCTGGGCGTGGGGCTGGCTCCCGTTGGACGCCGGG
+TCGGGGATCAACCCGTTGACCTGGCCGCCGGCGTTCTTCTCGTGGTTCGCCGCGGGAATGTTGCTGGCGG
+AGTGGGCCTACAGCCCGGTCGGGTTGCCGCATCGGTGGGCGCGCCGCCGCGTGGCGATGGCGGTTACCGC
+GCTGCTGGGTTACCTGGTGGCGGCCTCGCCGTTGGCGGGTCCGGAGGGCCTGGTTCCGGGCACGGCGGCA
+CAATTCGCGGTGAAGACCGCGATGGGCTCGCTGGTAGCGTTCGCGCTGGTGGCGCCGCTGGTGCTGGACC
+GGCCCGACACGTCGCACCGGCTGCTGGGCAGCCCCGCGATGGTGACCCTGGGCCGTTGGTCCTATGGCCT
+GTTCATCTGGCATCTGGCCGCGCTGGCCATGGTGTTTCCCGTGATCGGAGCGTTCCCGTTTACCGGGCGA
+ATGCCGACGGTGCTGGTGTTGACGCTGATCTTCGGTTTCGCGATCGCCGCGGTCAGCTACGCCCTGGTCG
+AGTCGCCCTGCCGGGAAGCGTTGCGCCGCTGGGAGCGCCGCAACGAACCCATATCGGTCGGCGAACTTCA
+GGCGGACGCGATTGCACCCTGACTCGGCCGGCTGACACCTGGCGGGCACCTAGTCGATCGTGCCCGCTGG
+CACGATCCACTGACAGGGCTGACCGGTCACGGCGGCGATGAGATCGAAGTCCGCGTCGTAATGTAGAACG
+ACCAGCCCGTGTTCCTCGCCGGCCGCGGCAATGAGCAGGTCCGGGATTTTGCGACCGCGCTGACTACGCG
+CAGCGAGTAGGCGCTGGATTCCAAGCGCGCGGCGATGATGCGATGCCGTCGATTCGATGAGGTCGAACGC
+GCTCAATGCCACCATGAGCCGCTGCCACTCGGTCTCATTGCGTGCGGAGTACCCGACTTCAAGGTCGGTT
+ATTTGCGTGCGAGCGACGGCACCGGCCTCAGCCAACGGTTCCACCGCCCGCCGCACGGCGGGCCGGCTGA
+GCCTTTTGATCACGCTGGTGTCGAGAAGATATTTCAGCGCCATGCTTCGGCGCGGTCCTCTGGCGGTGCG
+GCGGCCAGCGTGTCGAGAGCGGCGGCGACGCGTTGAACTCGCTGAGACGTGGCTTGCCGCAGGGCCGCGT
+TGACGGTGTCTTTGATCGTCGTCGTGCCCAATTCTGTACGAGCCATGTTTAAAGCCTGCTCGTCGATGTC
+GACGAGATGTTTCGCCATGAATCGGAGTATATATCAATAAGGAGCCGATATATATGCACAATGCCAAGCC
+CATGGCATTCGCCCGGCGCGGCTGTCTCACTGATAGCCGCCCTGCCGCTCGAAGATGCGGCGCGGGTTGT
+CGACGAGCATGGTGTGCAGCTGCTCGTCGGTGACGCCGTGCTGCTTCAGTGCGGGGATGACGTCGTTGTG
+GATGTGGAGGTAATGCCAATTCGGCATCGCCACCGGCACCAGCTCCTCGGGAAGCGCGTCGAAATAGCAG
+CAGGCGTCGTGTGATAGCACCATCTTGTCGGCATGGCCGCGCTCGCACATTCGGGCCACGATGTTCACCC
+GGTCCTGAAACGGTGAGATCACGTCGACGCCGAACCGGTCCATCCCGAGGTAGGAGCCGGCGGCGATGAG
+CTCTTCCAGGTAGCCGACGTCGGTGCTGTCGCCGCAGTGTCCGATAACCACCCGGCTCAGTTCCACCCCC
+TCCTCGGCGAAGATGCGTTGCTGGTCAAGGCCGCGCCGCAGCCCGGCGTGGGTGTGGGTGGAGATCGGCG
+CCCCGGTGCGTTTGTGTGCTTGGGCGACCGCGCGCAACACCCGCTCGACACCAGGGGTGAGGCCGGGTTC
+GTCGGTGGCGCACTTGAGGATTCCCGCCTTGATGCCGGTGTCGGCGATGCCGTGCTCGATGTCGCGGACG
+AACATGTCGGTCATGATCTCCGGGCCGTCCAGCTGTGCGCCCGGCCCGAGGTAGTGGAAGTAGAACGGGA
+CGTCGTTGTAGGTGTACAAGCCGGTGGCCACGACGATGTTCAGCTCGGTGGCCGCGGCCACCCGGGCGAT
+GCGCGGGATGTATCGGCCCAGCCCGATCACCGTGAGGTCGACGATGGTGTCCACGCCGCGGGCCTTGAGT
+TCGCCTAGCCGGGCGATGGCGCCGGCCACCCGCTTGTCCTCGTCGCCCCAGGCTTCCGGGTAGTTCTGCG
+CAATCTCGGTGGTCATGATGAAGACGTGCTCGTGCATCAGCGTGACGCCGAGATCAGCGGTGTCGATGGG
+TCCGCGAGCGGTATTTAGTTCTGGCACGTCACTGATGCTAGGCCGCAATCGGTGTCTTGCGGGGCCGCAG
+TGCAGTAGCGTCACCCTCGTCGTTGACCGAACCGCTCGGGAGCCAATTCTTATGCTGCTCAACCCCAACC
+ATTTGACACGCAAATACCCAGACCGTCGCTCCGGGGAGATCATGGCCGCGACGGTGGACTTCTTCGAGTC
+CAGGGGGAAGGCCCGGCTCAAGCACGACGACCACGAGCGGATCTGGTACTCGGACTTCCTGGACTTCGTC
+GGGCGGGAACGCATCTTTGCTTCCCTACTGACGCCGGCCTCCTATGGCGCCGATGATTGCCGCTGGGACA
+CCTACCGGATCAGCGAGTTCGCCGAGATCATGGGCTTCTACGGGCTGAGCTACTGGTACCCCTTCCAGGT
+GACCGCCCTAGGCCTGGGCCCGATCTGGATGAGCGCCAACGAGGACGCCAAGCGCAAGGCCGCCGCGGGG
+CTCGAGGCCGGCGAAGTGTTCGCCTTCGGCCTGTCCGAACAGACCCACGGCGCCGACGTCTATCAGACCG
+ACATGATCCTTACCCCCAGCGACGGCGGCTGGACCGCCAACGGCGAGAAGTACTACATCGGCAACGCCAA
+CGTGGCCCGGATGGTCTCCACCTTCGGCAAGATCGCCGGCACCCCAGAAAGCCAGGAGTACGTCTTCTTC
+GTCGCCGACTCCCAGCACGAGCGGTATGACCTGATCAAGAATGTGGTGAACTCGCAGAACTATGTGGCCA
+ATTACGCGCTGCGCGATTACCCGGTCACCGAGGCCGACATCCTGCATCGTGGCGCCGAAGCCTTCCACGC
+CGCCCTCAACACGGTCAACGTCTGCAAGTACAACCTGGGTTGGGGTGCCATCGGAATGTGCACCCACGCC
+CTCTACGAGTCGGTCACCCACGCGGCCAACCGTCACCTGTACGGCACTGTGGTGACCGACTTCAGCCACG
+TGCGGCGGCTGCTCACCGACGCCTACGTGCGGCTAATTGCGATGAAGCTGGTCGCCAGCCGGGCCAGCGA
+CTACATGCGCAGCGCGTCGGCCGCCGACCGTCGCTACCTGCTCTACAGCCCGCTGACCAAGGCGAAGGTC
+ACCAGCGAAGGCGAGCGGGTCATCACCGCCCTGTGGGACGTCATTGCGGCCAAAGGGGTGGAAAAGGACA
+CGTTTTTCGAGACCGTGGCTCGCGAGATTGGCCTGCTGCCCAGGTTGGAAGGCACCGTGCACATCAACAT
+CGGGCTACTCGGCAAATTCATGCCCAACTACCTGTTCGCTCCCGACTCCACGCTGCCGGTCATCCCGCGT
+CGCGACGACGCCGCCGATGACGCGTTCCTGTTTGCCCAGGGACCCACCGGGGGCTTGGGTAAGGTGCGTT
+TCCACGACTGGCGCGCGTCATTTGACACCTGCGCGCATCTGCCTAATGTCGCACTGCTGCGCGAGCAAGT
+CGACGTGTTCGCCGAGCTGCTGGCCAGCGCCACCCCGGACGCGGCACAGCAGAAGGATATCGACTTTGCC
+TTCGGCGTGGGACAACTCTTCGCGAACGTGCCCTATGCCCAGCTCATTTTGGAGGAGGCCCGGCTATCTG
+GTGTCGACGAGGCCTTGATCGACGAGATCTTCGGCGTACTGGTTCGGGACTTCAACACCCATGCCGTCGA
+GCTGCACGGCAGGTCCGCCACGACAGCCGAACAGGCTCGGTTCGCCATGCGAATGGTCCGTCGGCCGGTG
+CACGATCCCGCCCGCTACGACCAGATCTGGAAGGACCACGTGCTCGCGCTCAACGGCGCATATCAAATGG
+CACCATAGTGCGCCGCGTCGAGATCGACGCTGCCGTGTTGCCCACTCGCACTTTCGCGCGCTGGTGTCAA
+TCTCGACGCCAGCCTTGACCGTGATGCAGCGCACATTAGAATGACCAGTGGTCACCAACGCAAGGAGGCC
+CCATGCCGACGGTGACGTGGGCGCGTGTCGATCCGGCTCGCCGTGCCGCCGTGGTGGAAGCCGCCGAGGC
+TGAGTTCGGTGCGCACGGATTCTCCCGCGGCAGCTTGAACGTCATAGCCCGGCGTGCCGGAGTCGCCAAG
+GGCAGCCTGTTCCAGTACTTCGCGGACAAGCGCGACCTCTACGCGTTTATTGCCGACATCGCCAGCCAGC
+GAGTCCGCTCCTACATGGAGGACCTGATCCGCGAGCTGGACCCGAACCGGCCGTTCTTCGAATTCCTCAC
+CGACCTGCTCGATGGCTGGGTCGCCTACTTCGCCGAGCATCCTCGGGAACGTGCGTTGCATGCTGCGGCG
+ACCCTGGAGGTCGACACCGATGCCCGCATCAGCGTGCGCAGCGTCCTGCACCGCCACTACCTGGACGTGC
+TACGGCCGCTGGTGCGCGACGCGCACGCGCGGGGCGACCTGCGCGCAGATTCCGACACCGGTGCATTGAT
+GTCGCTGCTGCTGCTGATCTTTCCGCACCTGGCGCTGGCTCCATACATGCGTGGTTTGGATCCGATCCTG
+GGCCTCGACGAGCCCACACCTGAGCAGCCCGCGCTGGCCGTGCGCAGGCTTGTCGCCGTGCTGGCGGCGG
+CCTTCGATGCCCAGCACCCCGCGACCAACTCAGCCCAGACCCGATCGGAGGAGATCACATGACACGCACA
+CGTTCGGGCTCGCTCGCCGCGGGCGGACTCAACTGGGCGAGCCTGCCACTGAAGCTGTTCGCCGGGGGCA
+ACGCAAAGTTCTGGGATCCGGCCGACATCGACTTCACGCGCGACCGGGCGGACTGGGAGAAGTTGTCGGA
+CGACGAACGTGACTACGCCACCCGATTGTGCACCCAGTTCATTGCCGGCGAGGAGGCGGTGACCGAGGAC
+ATCCAGCCGTTCATGTCCGCGATGCGGGCCGAGGGACGGCTGGCCGACGAGATGTATCTGACGCAGTTCG
+CGTTCGAGGAAGCCAAACACACCCAGGTGTTTCGCATGTGGCTGGATGCCGTCGGAATCAGCGAAGACTT
+GCATCGCTATCTCGACGACTTGCCCGCCTACCGCCAAATCTTCTACGCGGAGTTGCCGGAGTGCCTCAAC
+GCATTGTCGGCCGATCCCTCACCGGCCGCCCAGGTCCGGGCGTCGGTCACCTACAACCACATCGTGGAAG
+GCATGCTGGCGCTCACGGGCTACTACGCCTGGCACAAGATCTGTGTGGAACGCGCAATCCTTCCCGGCAT
+GCAGGAGCTGGTCCGGCGCATCGGTGACGACGAGCGACGCCACATGGCTTGGGGCACCTTCACCTGTCGG
+CGCCACGTCGCCGCCGACGACGCCAATTGGACGGTGTTCGAAACACGGATGAACGAGCTCATCCCGCTGG
+CGCTGCGCCTCATCGAGGAGGGCTTTGCGCTGTACGGCGACCAGCCCCCATTCGACCTGTCCAAGGACGA
+TTTCCTGCAATACTCGACCGACAAGGGAATGCGCCGGTTCGGCACCATCAGCAACGCCCGCGGCCGGCCG
+GTCGCCGAAATCGACGTCGACTACTCGCCCGCGCAGCTGGAGGACACCTTCGCCGACGAGGACCGGCGCA
+CCCTGGCAGCGGCCTCGGCCTAGGCCTGGCGAGCAGACGCAAAATCGCCCAATTTCGTGCCGAATTGGGC
+GATTTTGCGTCTGCTCGCCAGGGGAACGCTAGGCGATCCAGACGGTCTTGATGTTGCAGAACTCGCGTAT
+CCCGTGTGCGGACAGTTCCCGGCCATAGCCCGAGCGCTTGACCCCGCCGAACGGCAATTCGGGATAGGAC
+ACCGTCATGCCGTTGATAAAAACCTGGCCCGCCACGATGTCGTCGATGAAGCGTCGTTGCTCGGTCTCGT
+CGCGGGTCCAGGCGTTGGATCCCAGCCCGAAGGTGGTGGCGTTGGCGATCTCGACGGCCTCGTCGATGTT
+CGCCGCGCGGAACACCGAGGCGACCGGACCGAAGACCTCCTCGGTGTAGAGAGCCATGTCCTTGGAGATG
+TCGGTGATCACGGTCGGCGGGTAGAACCAGCCCGGCCGGTCGAGACGCTTTCCGCCGCACCGGATCACCG
+CGCCCGCCGCGGCAGCATCCTCGACTTGCTTGGCAACCTCGTTGCGGCCCTGCTCGGTGGCCAGCGGGCC
+CACGTCGGTGTCCGGGTCGGTCGGGTCGCCGACCCGTAACGCCGCCATCCGCGCGACGAACTTGTCGACG
+AAATCGTCGTAAATGTCGGCGTGGACGATGAACCGCTTGGCGGCGATGCAGGATTGGCCGTTGTTCTGCA
+CCCGGCCGGTGACGGCGGTGCTGACCGCGGCGTCCAGATCGGCCGACGGCATAACGATGAACGGGTCGCT
+GCCGCCGAGCTCGAGCACGGTCGGCTTGATCTCGTTACCGGCGATAGCGCCCACCGATTGGCCGGCCGGC
+TCGCTTCCGGTCAGCGTGGCCGCCGCGACCCGGGGATCACGCAGGATGGCTTCGACGGCTCCCGAGCTAA
+CAAGCAACGTCTGGAAGCAGCCGTCCGGGAAGCCGCCTCGGGCGATGACGTCGGCCAGGTACAGCGCGCA
+TTGCGGCACGTTCGACGCGTGCTTGAGCAGGCCGACGTTTCCGGCCATCAGTGCCGGTGCGGCGAACCGA
+ACCGCTTGCCACAGGGGGAAGTTCCATGGCATCACCGCCAGGATCACCCCGAGCGGCTGGTATCGGCCGT
+AGGCCGCCGACGCCCCGACCTTGGCCGCATCGGCGGGTTCGTCGGCCAGCAACGCCTCGGCGTTTTCGGC
+GTAGTAGCGAAAACCCTTGGCGCACTTCAGTGCCTCGGCTTTGGCCGCGGCCAGCGTCTTGCCCATCTCG
+AGCGTCATCATCGCGGCGGCCTGGTCGGCCTCGGCTTCCAGCAAGTCGGCGGTGGCATTGGCCCACCGGG
+CGCGCTGGGCGAAGCTGGTCTGGCGGTAGTCGGCGAACCGCCGGTGGGCCCGGGCTATTGCCGCGTCGAC
+TTCGTCATCGGTCGCCGCAGTGAATGTCTTGACTGTTTCGCCGGTAGCCGGGTTGATGGTGGCGATGGGC
+ACGCTGACATCCTTTGCTGGGTGGGTTTGCACAAATCGTCCGGTGTCCAGCCTGCCACTAACGTGGCCAG
+CGCTCCCGAGCAGGAGGTGTCGGGGCCTCCTATCGGCTGGGGTGGGCTCTATCACGGGCAGGACCAGCGT
+GGCGGAACATGTCACCGATCGCATGTTCGTCGGGAGCTAATCGGCCCGTTCAATCGGCCGGTGGCGAGGC
+GACTTTGCGTAGCGACATCGGCGGGACGTAGCGCCCGATCAGCGTGCGGTGCCACCAGGCTCGGTCCCGT
+CGCAGCTCGGCCACGGTGGTGAAGCGGTACTGATACAGCTGCGCGCGCACATACCGAGGCGGAGATTGCG
+GGAAAGGATTGTGGCGCAACAGCTTCAGCGTCGCAGGATCATTGCGCAGCAACCGGTTTAGGAATGGCGT
+CATCCACGGTAGTGCGTAGCCCGGTGAGATGGCGGCGAACCACATGAGCCAGTCCAGCCGCAGATGGTAG
+GGGGCCCATTGCCGCGGCAGCCGGCGCGGATCACCGGGCTTGCCCTTGAATTCGTATGCTTTCCAGACGG
+TTTGTTCGGTAATCGGTGACTCGTCGGTCCCTTCGATTACCACTTCCCGGCGGGTGCGGCAGATGCTGCC
+GAACGCCCCGTAGGTGTTGACCAAATGAAAGGGGTTGAACGACATGTTCATTCGTTGATGAGAGGACAGC
+AGATTGCGTGCCGGCCAGTAGCTCAGCAACAGCACCGCCGCGGTGAATACGACCACGAGGCCGGCGAACC
+ACTGCGGCGGTGCCGACAGCGCCGGCTGGGCCGGCATCGGCAGCAGCGCCGCGGCCGAAGATGTGTCGAT
+CGCGCTGCACGCCAAGAGGATGGTCAGCCAATTGAGCCAGGAGAAATTTCCCGATGCCACCAGCCATAGC
+TGGGTAACCACGATGATCGCGGCGGCGATGCTGGCTGCGGGCTGTGGTGTGAACAACCCAAACGGCACCA
+CGAGCTGGGCGAAATGGTTGCCCGCCACCTCAATCCGGTGCAATGGCTTAGGCAGGTGATGGAAGAACCA
+GCTCAACGGGCCCGGCATGGGCTGTGTTTCGTGGTGGTAGTACAGGCACGTCAGACTGCGCCAGCACGAG
+TCGCCGCGCATCTTGATCAATCCGGCACCGAATTCGACCCGGAACAGCAGCCAGCGCGCCAACAACAACG
+TCAGAATCGGCGGGGCGGTGCGCTCGTTTCCGAGGAAGATCATCAGGAAGCCGGTCTCCAGCAGCAGCGA
+CTCCCAACCGAATGAGTACCACGCCTGCCCGACGTTGACGATGGACAGGTAGAGCACCCACAGCGTCAGC
+CAGATCAGCATCGTGGCCCACAACGGCACGAAGGAGGCCGCACCGGCGACGACGGCTGCCGACAACACGG
+CACCCAACCAGCAGACCCCGGCGAACACCCGATCGGAATAGCGAAAGTGAAAGATGCTCGGTGTTCGCCA
+GAAGGACTGTCCAGCCAGATACCGCGGCACCGGCAGCATGCCGTGCTCTCCGATGAGGGGCCGGAACTGC
+TGTGCGGCCGCGACGAATGCGATCAGATAAATAATCGCCGTGCCGCGCTCCAGCGCCAGTCTGCCCAGCC
+AATATTCGGGCGCTGAAAACCATCCCATGGCCGTTACTCCTTGGACACGGCGTTCACACCAACTATTGCA
+TGCGGTCTTGACCACGAGACTCTGATGTGGCGACCACCGATGCCGCCACCACGGAAACCGAAATCAGTGC
+CAGCAGTTGCACACTGGCCCAGTTCCCGGCGTATCCGTCGACCGACCGCCACGGATGCCGGGACAGCGCA
+GCGCCGGCCAGGATCAGCCCGCCCGCAGCCAGTCCGACGGTGACCCGGTCACGTAGTCGCTCCCGGCGGC
+GCAGTGCATACCGCACACCGAGGGCCGTGCCCATCACCATGACCCCGGCGATGCTGGCGATCACCGCCCC
+GGCCGCCAGCACCCCGGCCGCCGCCCAGGCTCCGGGCCTCCAGGGTGGTGTGGGCCGGTCGGCGAGCTGC
+CGTCGCCCGGTCCGCCAGAACGCCAGCAGAGCTAGCAGGGGCAGCAGGGCCAGCCCTATCGCCAGGCTCG
+CCCGATACAGCGAGTTCGGTGCGAATGTCAGCGTGATGGTGCCGGGGTTCCCGGCGGGCACCACCCAGGC
+CTGCTGCCACCCGTTGACGGCGATCGGTGTCAGCCGGGCCCCGGTGCTCGTGCGGGCCACCCAGCCCGAG
+TTGATGCTTTCGGGTACCACCAGCACCCGGGAAGTGGCCGACTCGGGAACCCGAACTTCGCGGTGGGTGG
+GACCCCACGCACCCGTTTCAGCAGAAGTAACTGTCGCGCTTGACAATCCAGCACCGGGAGTTGACAACTG
+GGCACCGTCGACCACGAACGCGGCGCCGGGGCTGATCAGCAATTCCTGCTGTCCCGCCGGCAGCGCTATC
+GGCTCGCGTTCACACGGGAGCGCGGCGACCGGTTCACCGTCCAGCAAGGCGCCCACCGTGGTTCGGATCG
+AGGTGTGCACGAACCGGCCCGCGACGGCGACGACCGGGCCGTGATCGCAATCCACGGTGAGCGCACGCGC
+GCGGTTGCGGGCGGCGTCGGCCGGCGCAATCGGGGCGCCGCCGGCGCCAAGCACCACCACTTCGGCCAGC
+CCCGGCGGCTTGAGCTGGTCGAAGCCCAGCGCGTTGCGATCGATGACATCGTCCCAGTCCAGCAGGCTGA
+CCGACACCGTGTCGGTCACCCGGGGATGCAGCCATAGCGTCGTTAGCTCGCCGACCTGCAGTTGTCGGAC
+CTGGGGGCCGTCGCCCAGGTTGATGGCCACCACCGTCGGATGGGCCGGCAACATCGACCGGCTGGCGGCC
+AGCCGCAGCCCGGTCACCACGGTGGGCCGCGGCAGGGCCAGCGTCAGCGTCGGCGGGGTTTTGTGTTGCA
+CCACCCGCTGCGGCGCGGTCCAGGCGGTGGCCGGATCGCCGTCGGCGGCCGCGTACGCCGAGCCGAGGAT
+GTCGACAAGGTCGGAATCACCGCTGGCCCGGGTGGTGGAAGGCGCGGCGATCAAGTCGGCCAGCTTCGGG
+CCCTGCCGTGGTCGCACCCACACCATCGGGGTCACCGACACCGGGCGGGGTACGGTCAGTGTGCGGCTGA
+GATTGGCCGGTTCCTCGGGTGCCAGGGCCATCGAGGCGGCGCAGCGCACGCCGTCGGGTCCCGGGGCGCA
+GCCCGGTCTGCCCAGCAGTTCGGATCCCAGGTCCCAGCCCGCGATCGCCGAACCCGGCGGCGGCCCGGGC
+ACCAGCACGGTGTGTCGCAGCTGAACCGGATGGGCGAAACCGGACGCATCGTATTGGGTGATGGCCAGAT
+CGGTGATGCCGAACTGCACACCGGCCGACCCGTCGTCGGTGGCGGCCGCGGTAAACCGCACCCAGGGGGT
+TTCGCCGTAGGGCAGTGCGGCGGTGAGCGGTTTGCCCGCCTCATCGAACCGCAGGGTGGTGCTGCCGTTG
+ACGGTCTCGATCAGGATGCGTCGGACCTGGGCGCCGACCGCGGTCGCGCTGGGTGTCAGGGTGACGACGG
+CATTGGTCACCGGACGGTCGAAATCCACCTGCAGCCACTGCCCAACGGCGGCCTGCAGCGCGTTGGACAC
+CCAAGCGGTCGCCGGGTCACCGTCGACGGCGGCCGCGGGTGCGCTCGCCGGGGCGACGTCGGGCATGGCG
+GTGGCATCCGCCGAGGAGCTCGACACGGTGATCCGGCCGCCGGTCCATCCACCGACGACCGGCTCCGCGC
+CCGGCACCGGGTAGTCAGGCACCCGGTTGTAGGTGTGCCGGGCGTCGCCGGGTGCCCGGATCGCCGACGA
+GTGGTGGTCCACCCGGCCGTAATCGGTCTCGCGGGCCACCGGGGTGTCGGTGACGGCGACCTGGGGCACC
+GGCAAGCCGGCAGCTCGAGCGTCCGCGGTCATCAGCACCGGACCCAGCGGGGGCTGGCCCTGCAGCCGGC
+GTCGTTCGTCCAGACGCAGCAGGACCTCGGGTCCGCCGTCGACGCGGGCGAGCTGGTCGGTCGCGGCGAA
+GTAGGGCGCACCGGGGTTGGCGGGCGCGCTCACCCGGTAGATCTCAATCGCGGGATATCGGGGTCGCAGG
+CCGCTGTCGTTGACGAAACCCGCCAGCGGATCAGGACCCACCGGCGCGCCGAACTCCGCCAGCTTCGCTA
+GCCCGGGCGACCCTGCGATGCTACGGTGCAGCAGAATCGGTCGTGCCGAGCGCGACGTCTCGGGATCCAG
+ATCGTTGCGTACCAGCACATAGGAAATGCCTTGGCGGGCAAGGGTATCGGCCAGCCCCGCCGACGGTCGT
+CCGGCGGCGAACAGGCGTTGCACGGAGTCCAGCGCTCGAATGGTCTGCGGCGGGGTCAGCGGAATGGAGT
+CGCGCACGCCCCACGGGCCGTCGCCGAGCACCTGCAGCGGCTCGTCGTGGCTGGTGCCCCACACCTGGGT
+GGCGAACGGGGCGCCCGGGACCACCAGCACCCGCCCGGGAGTGGGCGTCGCGGCATGGTGTGTGCGCAGC
+CAGTCGGCGGCCTCCTGCCAGTACTGGGGAAGCGCACCGAACGTGCCGGGCGGGGCGACCCGGCCGGTCC
+ACGCCAGCGAGGTGCTGACCACCAGCGCGGTCAGGGCTACCACCGCCACCGCTACTCGCTTGTCCCGCTC
+GGGGTGCGCGAACGCGCGCAGCCACGCCGGCCTCGGCGCGCTGCCTGGCAGCGGAACTCGGCTCAGCAGC
+TGCGCCAAGCCCAGCACCAGGGGCAGCCGGATCACCGGCCCCACCTTGTGTACGTTGCGCAGGGGGGTGC
+CGGCGGCGTCCAGGAACGCCTGCACCGGGTGGGCGACCGGCGAAGCCAGCCCGCCGCGGTGGCCGACGGC
+CAGCAGCACCACCCCGACCAACAGCATCGTCACCAGCCGGCCGCGCGCCGGCATCGCCGGGCTAGTCAGT
+CCGGCCAGCCCGGCCGCTGCGACCAGGCAGGTGCCCAGGATGGCCGCCGATCCGGTGACCAACGGCGCGC
+CCGCGGTCGCGTTCGGCGCCACGAACGGCGTCCAGCTGTCGGTGCCGCGCAGCACCTCCACCAGCGAGGA
+CCATTGCGTGGTCACGCCGGAAGATTCGATGAAGTCCAGAAACGGCGGACTGACCCCGTGCAGCTGCGTC
+AGCGCCATTACCCACCACAGTGTCGCCAGGGCCATCGCCAACAGCCACCACGCGGTGTAGCGCCACCACA
+ACCGATTCGGCCGGTGACAGGCCCACCAGATCACCGCCGGCAGGCAACCGGCCAGCGTCGCGATGGCGTT
+GACCGCGCCCATCAGCGCCACCGCCAGCCCGGCTTGGGCGGCCAGCGCGCGCACCGAGCGGCCAGAAGTC
+CCCCGCAGCGCCAGGATCGTGGGCAGCAGCACCCACGGCGCCAGCATCATCGGCAAGGTTTCCGACGAGA
+TCGACCCGAGTGTGGTCAGCACCCGTGGTGACAGCGCGAACGCCACGGCGCCGACCACCCGCGAGGACGG
+GCCGCCGACGCCCAGCGCCTCGGCTACCCGCAGCAGGCCCCAGAAGCCGACCGTGAGCAACACCGCCCAC
+CACAGCCGCTGAGTGACCCAGCCGGGCACTCCCAGCAGGTGACCGATCACGAAGAAGGTGCCGTGCGGAA
+ACAGATACCCGTAGGCCTGGTTCTGCGCCTGCCCGAACGGCAGGTCGCTGTTCCACAGGTTGGTCGCACG
+CGCCAGGAAGCGCAGCGGGTTGGCGGTGAGGTCCAGCTTGGTGTCGGGGGAGACTTGTCCGGGGGATTGG
+GCGAACGTCAGCGCCAACGCTACCGCGCCGACCACCGGCAGCCATTTGCGAGACAACGGCGCCACCTGCG
+ACCCGGAGGCCGCCTCAGCCTGCGGCGCCCGGGTCGCGGGGCTAGCTACGGTTACCGTACTCGACCCGGT
+TGAGCACTGATGACGACGGATCGCCCCCGGGGAGTGGCGGTTTCTTGTCCTGCTGCACCATCAGGGTCAC
+TCCGAAGATCGCGGCCGCGCCCAGCAACAGACCAACCACCACGCTTGCGGCGGCGGGCGCGACGATCCGG
+TTCATCGGTGGCTCCTCGACGGCTGTGGGTGCGGCTTGAGAGGCTAGAGGCAACTTAGCAGAAGCGTGGG
+CCTGGCCCCCCAACCCGGAGCGTATGCGCCACCGTGACAGCATGTCCGGATGGCTTTTCCACGCACACTG
+GCGATACTCGCTGCGGCAGCAGCGTTGGTGGTGGCCTGCAGCCATGGCGGCACACCCACCGGATCGTCGA
+CGACCTCCGGCGCGTCGCCCGCAACTCCGGTAGCCGTTCCCGTGCCCCGGAGCTGCGCCGAGCCGGCGGG
+GATCCCGGCGCTGCTGTCCCCCCGTGACAAGCTGGCCCAGCTGCTGGTGGTCGGCGTGCGAGATGCTGCG
+GACGCCCAAGCCGTGGTCACCAACTACCACGTCGGCGGCATCCTCATCGGCAGCGACACCGACCTGACGA
+TTTTTGACGGCGCGCTGGCCGAGATCGTTGCCGGCGGGGGTCCGCTGCCGCTGGCGGTGAGTGTCGACGA
+GGAAGGCGGGCGGTTGTCCCGGTTGAGGTCGCTGATCGGCGGTACGGGGCCGTCGGCCCGCGAACTGGCA
+CAAACCCGAACCGTCCAGCAGGTGCGCGACTTGGCTCGAGACCGCGGCCGGCAGATGAGAAAGCTGGGTA
+TCACCATCGACTTCGCCCCGGTGGTCGACGTCACCGACGCCCCGGATGACACGGTGATCGGGGACCGGTC
+GTTCGGCTCGGATCCGGCTACGGTCACCGCGTATGCCGGGGCGTACGCGCAGGGTCTGCGCGATGCCGGG
+GTGCTGCCGGTGCTCAAGCATTTCCCCGGTCACGGGCGTGGCTCGGGTGATTCGCACAACGGGGGTGTCA
+CGACACCACCGCTTGATGACCTGGTGGGCGATGACCTGGTGCCCTACCGAACGCTGGTGACCCAGGCGCC
+GGTCGGTGTGATGGTGGGTCATCTGCAGGTTCCTGGGTTGACCGGCTCCGAGCCGGCCAGTCTGAGCAAG
+GCCGCGGTGAACCTGCTGCGCACCGGCACGGGATACGGCGCACCGCCGTTCGATGGTCCAGTGTTCAGCG
+ACGACCTCTCTGGTATGGCCGCGATCTCAGACCGGTTTGGCGTCAGCGAGGCGGTGTTGCGCACCTTGCA
+AGCCGGTGCCGATATCGCACTGTGGGTTACCACCAAAGAGGTGCCCGCGGTGCTGGACCGCCTGGAACAG
+GCGCTGCGCGCCGGTGAATTGCCGATGTCGGCGGTCGACCGGTCGGTGGTGCGGGTGGCGACCATGAAGG
+GGCCCAACCCGGGGTGTGGCCGTTAGCGATGTGCGGCTGGCGCCCCACTGCTTACCGTAGGGTTAGATAG
+ACGGGCTACAGGGGCCCAAAAGGGGCTGGCGATGGCAGGTGGTACCAAGCGACTACCGCGTGCTGTCCGA
+GAGCAGCAGATGCTCGATGCCGCCGTGCAGATGTTCTCGGTTAACGGCTACCACGAGACCTCGATGGACG
+CGATCGCTGCCGAGGCGCAGATCTCCAAGCCGATGCTGTACCTGTACTACGGCTCCAAGGAAGACCTGTT
+CGGCGCCTGCCTGAACCGTGAGATGAGCCGGTTCATCGACGCGTTGCGTTCCAGCATCAACTTCGACCAG
+AGCCCGAAAGACTTGCTGCGCAACACCATCGTGTCGTTCCTACGCTATATCGATGCCAACCGGGCGTCGT
+GGATCGTGATGTACACCCAGGCCACCAGCTCCCAAGCGTTCGCGCACACGGTGCGTGAGGGGCGCGAACA
+GATCGTCCAACTGGTGGCCGAGTTGGTGCGGGCCGGCACCCGCGGCCCGCTTACGGACGCCGAAATCGAG
+ATGATGGCCGTCGCGCTGGTGGGCGCCGGCGAGGCAGTGGCCACCCGGCTCGGTATCGGTGACACTGACG
+TTGACGAGGCGGCCGAGATGATGATCAACCTGTTCTGGCTCGGCCTCAAGGGCGCGCCGGTGGATCGGCT
+CGAGACCGGGCACTGACCTGCGCGGTATCGGCCACTGAGATGTGGGTGTATTTTAGATGCAGATGTAAAT
+TCGATGTATGATTCGAACGCAAGTCCAGCTCCCAGATGAGCTTTACCGGGACGCCAAGCGGGTCGCGCAC
+GAGCACGAAATGACCCTTGCCGAGGTCGTTCGTCGCGGGCTGGAGCACATGGTGCGGATCTATCCGAGGC
+GCGATGCGGCGTCCGACACCTGGCAGCCGCCCACGCCGCGTCGACTCGGTCCGTTTCGTGCGTCCGAAGA
+AACGTGGCGCGAGCTCGCCAACGAGGCGTGAGTAGCCCGTGCTCTCGATCGATACGAATATCCTGCTGTA
+CGCGCAGAACCGGGATTGCCCCGAGCATGACGCCGCCGCCGCCTTCCTCGTCGAGTGCTCTGGTCGAGCC
+GACGTCGCAGTCTGCGAACTCGTGCTTATGGAGCTGTATCAATTGCTGCGGAATCCTACGGTGGTGACGC
+GACCGCTCGAGGGCCCCGAGGCGGCGGAAGTCTGTCAGACGTTCCGTCGCAACCGGCGGTGGGCGCTCCT
+CGAGAACGCTCCGGTCATGAACGAGGTGTGGGTGTTGGCGGCCACGCCTAGAATTGCTCGCCGGCGCCTA
+TTCGATGCCCGGCTGGCACTGACCTTGCGCCATCATGGTGTCGACGAATTCGCCACTCGAAACATCAACG
+GCTTCACCGACTTCGGCTTCTCACGCGTGTGGGACCCGATAACGTCGGATGGCTGACCACGCCGGGCCGA
+TCCGCGTGGCCCCGGCTATAGACCCCGCACGGTAGCGGTCAGGTGGGGGTATCCCTTGGCCATATTGCGC
+AGCGTGAGATCCCAGCCGCCATCGCCTTCGGCGACGTAGAGTCCCGCGGTGGCCGGCAGCAGCACCGGCT
+TGGCGAACCGAACCGAATAGCGCACCGCGTCCGGAAAACGGGCTTCGATATTCGCCAATACCGCCGCGGC
+AGTGAACATCCCGTGCGCGATGACGGTGGGGAAGCCGAACAGTTTCGCCGCGATCGGGTTGGTGTGGATC
+GGGTTGTGATCGCCGCCGACGGCGGCATAGCGGCGGATCTTCGCCGGGGTGATCCGCAGGACCGCGGCGG
+GCGGGGGTAGCTTGGGCTTTTTTTGCGGCGGCGGTTTGGGTTCGCCGGACAAGCTGGTGCGTTGTTGATG
+CAGGAACGTCGTCACCTGGTGCCAGGCGACATCGTTGCCGACGCTGACGTTGGTCACCAGATCGACCAGC
+AGGCCCCTGCGGTGTTCGCGCAGATTCTCCGCGCGCACCCGCACGCCCACCGCGTCGGTGACCGCGATCG
+GCCGGTATTGCGTGATGTGGTTCTCGGTGTGTATCGCTCCCATTGCGGCGAACGGGAAGTCGAAGCCGGT
+CACCAACGACATCACCGATGGAAAAGTTAACGCGAACGGATAGGTCAACGGCACCTGGTTGCCGTAGCGC
+AGACCGGTGACCGCCGCGTAGGCCGCGACGTTGGCGGGGTCGATCGGCAGCTCCTCGACGGTCACCGTCC
+GGTTGGGCAGCTGGTCTGTCCGGGGCACCACGGGTAGCGCCCCGGCCGCCGCGCGCAGCAGGTTCTTCAG
+GCCGCTGGGTTGAGTCACTACTGTCCCCTCACGCGCCGATCATGGCCTGGCCGCAGACACGAATGACGTT
+GCCGGTCACCGCGTTTGACGCCGGGCTGGCGAAGTAGGCGATGGCCTCGGCGACGTCGACGGGCTGCCCG
+CCCTGCAGCAGCGAGTTCAGCCGGCGGCCTACCTCACGGGTGGCCAGCGGGATGGCGGCCGTCATCTGGG
+TTTCGATGAATCCCGGTGCCACGGCGTTGATCGTGATGCCTTTCGCGGCCAGGCCGGGTGCCAGCGCCTG
+GGTGATGCCGATCATCCCGGCCTTGGTGGTGGCGTAGTTGGTCTGGCCGCGGTTGCCGGCGATGCCGGCG
+ATCGACGACAGCCCGATCACCCGACCACCCTCTCCGATGCTGCCGTTGCCCACCAGACCCTCGGTGAGCC
+GCAACGGGGCAAGCAGATTGACAGCCAGGACGGCGTCCCAACGCGCATCGTCCATGTTGGCCAGCAGCTT
+GTCACGGGTGATGCCGGCGTTGTTGACCAGGATGTCGGCCTTGCCACCGTGGTGGTCGCGCAGGTGCTCG
+CTGATCTTGTCGACGGCATCGTCGGCGGTGACGTCGAGCCACAGCGCGGTGCCGCCCACCTTGCTGGCGG
+TTTCGGCCAGGTTCTCGGCGGCGGACTCCACATCGATGGCGACCACGTGGGCGCCGTCGCGAGCGAACAC
+CTCGGCGATGGTTGCGCCGATGCCGCGGGCCGCGCCGGTCACAATGGCGACCTTGCCGTCCAGCGGCTTC
+TCCCAGTCGGCCGGCGGTGTGGAATCGTCCGCCCCGACAGAGAAGACTTGGCCGTCGACGTAGGCCGACT
+TGGCCGACAGCAGGAATCGCATGGTCGACTCGAGGCCGGTAGCTGCGGGCTTGGCGTCCGGCGACAGGTA
+GACCAACGCCGTTGTCGCACCGCGGCGCAGTTCCTTGCCCAGCGAGCGGGTGAAGCCCTCCAGCGCGCGC
+TGCGCGATCCGCTCGTTCGTGCTGGCGGCCGCTTCGGGTGTGCCGCCAACAACCACCACGCGCCCGCAAC
+GGCCGAGATTGCGCAGTACCGGAGTAAAGAACTCGTGCAGCCCCTTGAGCCCGGCCGGCTCTGTGATGCC
+GGTGGCGTCGAAGACCAGCCCGCCGAACGAGTCCGCCCAGCGCCCGCCCAGGTTGTTTCCTACCAGGTCG
+TAGTCCTTTTCGAGTGCCGCGCGCAGTGGTTCGACGACCCTGCCGGCCCCGCCGATCAGCAGCGACCCGG
+TCAGTGGCGGTTCGCCTGCTCGATAGCGGCGAAGCGTCTCGGGTTGCGGAACACCCAATTGCCTGGCCAA
+AAACGATCCTGGACCGGAGTTGACAACCTGCGAGAACAGATCGGACGAACGCTTGGGAGCCACTTCAGCT
+GCCTTCCGTATCGTGTGGGGGTCGGGCGCGCCAATACACGTAACCGTATCGAGGACTAACTTACTTCAGA
+GTAAGAACAGTGGGTAGTATGGCCCTCAACGGCCGATCCCCCGAACTGATCAACGGAGAAAACAGTGGCC
+CCTGCTGCTAAGAACACTTCACAGACCAGGCGGCGAGTCGCCGTACTGGGCGGCAACCGCATCCCGTTCG
+CCAGATCGGACGGTGCCTACGCGGATGCGTCCAACCAGGACATGTTCACCGCGGCGCTGAGCGGCTTGGT
+GGACCGATTCGGACTCGCCGGCGAGCGGCTGGACATGGTGGTGGGCGGTGCGGTGCTCAAACACAGCCGC
+GACTTCAATCTAATGCGCGAATGCGTGCTGGGCTCCGAACTCTCGCCGTACACGCCGGCGTTCGACCTGC
+AGCAGGCCTGCGGGACGGGCCTGCAGGCCGCGATCGCGGCCGCCGACGGCATTGCCGCCGGGCGGTATGA
+GGTGGCCGCCGCTGGCGGGGTGGACACCACCTCGGACCCGCCGATCGGCCTGGGCGACGACCTGCGCCGC
+ACCCTGCTCAAGCTGCGCCGATCTAGGTCCAACGTGCAACGCCTCAAGCTGGTGGGCACGCTGCCGGCCA
+GCCTGGGCGTGGAGATCCCCGCCAACAGCGAGCCGCGCACCGGGCTGTCGATGGGCGAGCACGCCGCCGT
+CACCGCCAAGCAGATGGGCATCAAACGCGTAGACCAGGACGAGCTGGCCGCCGCCAGCCATCGCAATATG
+GCCGACGCCTACGACCGGGGTTTCTTCGACGACCTGGTCAGTCCGTTTTTAGGGCTGTACCGAGACGACA
+ATCTGCGGCCTAACTCCAGCGTCGAGAAACTGGCCACGCTGCGTCCGGTCTTCGGAGTGAAGGCCGGTGA
+CGCGACGATGACGGCCGGCAATTCGACTCCGCTGACCGACGGCGCCTCGGTGGCATTGCTGGCCAGCGAA
+CAGTGGGCGGAGGCACACTCGCTGGCTCCGCTGGCCTATCTCGTGGATGCCGAGACCGCCGCGGTCGACT
+ATGTCAACGGCAACGACGGCCTGTTGATGGCGCCGACCTACGCGGTACCCCGGCTGCTGGCCCGTAACGG
+GTTGAGCCTGCAGGACTTCGACTTCTACGAAATCCACGAGGCGTTTGCCTCCGTGGTGCTCGCGCATCTG
+GCGGCGTGGGAGTCCGAGGAGTACTGCAAGCGGCGGCTGGGCCTGGACGCCGCGCTGGGGTCGATCGATC
+GGTCCAAGCTCAACGTCAACGGGTCGTCGTTGGCCGCCGGGCACCCCTTCGCGGCGACCGGTGGGCGGAT
+TTTGGCGCAGACCGCCAAGCAGCTCGCCGAGAAGAAGGCGGCGAAAAAAGGCGGCGGACCGCTGCGCGGG
+CTGATTTCGATCTGCGCGGCCGGCGGCCAAGGTGTGGCCGCGATTTTGGAGGCCTGACGCTGACGGCTCG
+GTAAGTGCCTCGCGGGAAGTCCCGAGTGGCCGGTGGGCCGCCCAAAGAAATGTGTTGCGGGTGGTTTGCG
+CCCTGAGCAGATGGGTACCCGATCACTCGGATAGCCCCGTGTTGTTGTCTGACCCCCCGACCCCGACGGC
+AATGCGGGGCAATCCCCTGGAAAGGGCCGCCGCTGGTGGGAGGGGACCCAGCGGCGGTCTTTTTGGGCTT
+GCCCCATCGTTCGTTGACTCTGCGTCCACCACGCAAAAGTGCGAGTAACCCGTCCGGTGGACGCAGAGTC
+AACAGATAAGGATCAGAACGCGGCCTCGTCGAGTTCCATGATGTCGTTGTCCAGCGTCTCGATCACCTCG
+CGGGTGCTGGTCAACAGCGGCAAGAAGTTCTTCGCGAAGAACGACGCCACCGCGACTTTGCCTTCGTAGA
+AGGACCGCTCGTCGCCGGTGGCACCCGCGTCGAGTGCCGCCACCGCCACCGCGGCCTGACGCTGCAGCAA
+CCAGCCGATGATGAGGTCACCGACGCTCATCAAGAAGCGCACCGAACCCAAGCCCACCTTGTAGAGGCTG
+GTGACGTCCTGCTGCGCGGCCATCAGGTAGCCGGTCAGTGCGGCCGCCATGCCCTGGACGTCGGTGAGCG
+CCTTGGCCAGCAGCGCGCGTTCGGTCTTCAGCCGGCCGTTGCCAGCACCGCTGTCGACGAACGCCTGGAT
+CTGGCCTGACACGTGCGCCAACGCCACGCCCTTGTCACGGACGATTTTGCGGAAGAAGAAGTCTTGTGCC
+TGGATGGCGGTGGTGCCTTCGTACAGGGAGTCGATCTTGGCGTCCCGGATGTACTGCTCGATCGGATAGT
+CCTGCAAGAAGCCGGATCCACCCAGGGTTTGCAGGCTTTCAGTGAGCTTGGCGTAAGCCTGTTCGGAGCC
+CACACCCTTGACTACCGGCAACATCAGGTCGTTGACCCTGACGGCCAACTTGGCGTCCACACCGTGCACC
+ACCTCGGCGACAGCCGCGTCCTGGAAAGTGGCGGTGTAGAGGTAGAGCGCACGCAGGCCCTCGGCGTAAG
+CCTTCTGGGTCATCAGCGAGCGGCGCACGTCGGGGTGATGTGTGATCGTCACCCGGGGCGCGGTCTTGTC
+GGTCATCTGGGTCAGGTCGGCACCCTGCACGCGGGACTTGGCGTACTGAAGCGCGTTGAGGTAGCCGGTG
+GACAGCGTCGCGATGGCCTTCGTGCCGACCATCATGCGGGCCTGCTCAATGACCTCGAACATCTGCGCGA
+TGCCGTTGTGTACCTCGCCGACCAGCCAGCCCTTGGCGGGGACGCCGTGTTGGCCGAACGCCAGTTCACA
+GGTCGCCGAGACCTTTAGGCCCATCTTGTGTTCGACGTTGGTGACGAACACGCCATTGCGCTCGCCGGGT
+TCGCCGGTTTCGACGTCGAACAGGAACTTGGGCACGAAGTACAGCGACAGGCCCTTGGTGCCGGGACCGG
+CGCCCTCCGGGCGAGCCAGCACCAGGTGGAAGATGTTCTCGAACAGGTCGCCGGAGTCACCCGAGGTAAT
+GAACCGCTTGACGCCGTCGATGTGCCAGGACCCGTCGGCCTGTTGGACAGCTTTGGTTCGGGCAGCGCCC
+ACATCGGAGCCGGCATCCGGCTCGGTGAGCACCATGGTCGATCCCCAGCCGCGTTCGGCGGCTAGGACCG
+CCCACTTCTTCTGCTCCTCGGTGCCGAGGTGGTAGAGGATCTGGGCGAAGCCCGCGCCGCCGGCGTACAT
+CCATACCGCCGGATTGGCGCCCAAGATGTGCTCATGCAGCGCCCAGACCACTGCCTTGGGCATCGGCATG
+CCCCCGAGTGCCTCGTCGATGCCGACCTTGTCCCAACCGGCTTCCAGCATCGCGTTGACTGACTTTTTGA
+ACGATTCCGGCAGCATCACCGAGTGGGTTTTCGGGTCGAAAACGGGCGGGTTGCGGTCCCCTTCGACGAA
+CGACTCGGCCACCGGCCCCTCGGCCAGCCGGCTGACCTCGGCCAGCATGTCGCGGGCGGTGTCGACGTCG
+ACGTCGCTGAATTCGCCATGGCCCAAAGCTTTGTCGACGCCCAGCACTTCGAACAGGTTAAAAACCTGGT
+CACGGACGTTGCTCCGGTAGTGGCTCACTGCCGATCCTCCTCGTTGAGAGTGCCACCTCAGGGTTGGGTA
+GGGTTGGGTACTCGAAACCAAGTTACCCACCAGTAACACCGTCAAAATATATCCGTTGCATAGGTCAATG
+CAAGTTGATGTGAGCTACATTGCACCAACTAACTAACCAACCGGTTGGGTTAGCGGTGATCCTGGCCGTG
+TCGGTCCTCTCACCTGCGGCGATAGCGATCAAATGAAGACTATGCGGAGTCTAGGGCGGCAGCGCCTGGC
+AGCGTAGATCATCGGCTCACGCGGATGCGGCCTCTTGGTACGGACATGCGCGCGGATGTCCGGCGAGTAG
+GGTCGGATGCGAAAACTACGTCCTCGGCTCTAGGGGCGAATGAAGTTCGGTGAACTCAACGAACAACCTG
+ACGCCGTCCTCACTGCGGGAGGCCTTCGGCCATTTCCCGACCGGGGTGGTGGCCATCGCTGCGGAGGTCG
+ACGGAGTGCGGCAAGGCTTGGCAGCCAGTACCTTTGTCCCGGTCTCGCTGGAACCGCCGCTGGTGTCGTT
+CTGTGTGCAGAACACCTCGACGACATGGCCGAAACTCACCGGCGTGCCGATGCTGGGCATCAGCGTGCTC
+GGCGAGGCCCATGACGCCGCAGTGCGCACACTGGCCGCAAAAACTGGGGACAGGTTCGCCGGTTTGGAGA
+CGGTATCCAACGACGCCGGCGCCGTCTTCATCAAGGGCACCAGCGTGTGGCTCGAGAGCGCGATCGAGCA
+GCTGGTCCCGGCGGGAGATCACACCATCGTGGTCTTACGGGTCAACCAGGTCAAGGTGGATCCCAACGTA
+GCGCCCATTGTGTTCCATCGCAGCGTGCTCCGCCGACTCGGCGTCTAAACGTCTATACGGACGCCCACTT
+GGTCTGTCCGGACAACATAGCGGTCAGCGGCCCATTCTGGTTGCGATAAATGATGGTAGATCACGTCATT
+TTGCTTCCAGTAGTCGTGCCCATGTTTGAGAGGCACAACTATTGGTCGCTTTCATTCGTTGCGCGCAGAC
+CGGTCTTTGTATGACGATGATGGGAAGTTCTATCTGCCGCCAAAAGCAGAATGGCAGGACGCAGGATGAA
+GCGATGAGCCGACCCGCCGGAACCGGTTTCCGGGAACGGGTGGGATGCATGCCCACTTGAGGTCTCGCGG
+CAGGCGGTGGAGCGTGGCAAAAACGTCGCATCGGGTGAGCAGCGCCGATGGCATGAGTAAGCGTATTTTG
+CGTTTGATAATCGCGCAGAGCGGCTTCTATAGCGCCGCACTTCAGCTCGGGAATGTCTCGATCGTTCTAC
+CGTTTGTGGTAGCCGAGCTCGACGCCGAATTGTGGATAGCGGCTCTTATTTTTCCTGCATTCACGGCCGG
+TGGGGCGATCGGGAATGTGGTCGCGCCGCCGGCGGTGGCCGCCGTTCCACGCCGTCACCGATTGTTCATT
+ATTGTGTCCTGTTTGGCCGTCCTGGCTGGCGTCAATGCCTTGTGCGCAACCATCGGCAAAGGAAGCGTCG
+CTGGAATCCTATTGGTGGTCAATGTGACGCTGATCGGGGTCGTTTCGGTGATCTCCTTCGTCGCCTTCGC
+GGATCTGGTGGCGGCTATGCCATCAGGAACCGCCCGAGCCCGCATTCTTCTTACCGAGGTCGGAGTAGGG
+GCGGCTTTGACGGCCGTGGTGGCGGCGACGCTGTCATTCGTACCCGACCAACACCCATTAAGCAGGAACA
+TTCACCTACTGTGGACGGCAGCCGTGGCAATGGCTATCTCGGCGGCCATATGCCGGGCATTGCCTCACCG
+GATCGTCCCCAGGGTCCATGCGGCGCCCGGTCTGCACAAACTCGTGTACGTCGGTTGGACGGCTATCCGA
+ACCAATGGTTGGTATCGTCGGTACCTGCTTGTGCAGGTACTCTTTGGCTCGGTCGTGCTCGGGTCCTCGT
+TCCACAGCATTCGCGTCGCCGCCGTACCCGGGGACCAGCCCGACGAGGTCGTTGCCGTCGTCCTTTTCGT
+CTGCGTCGGACTCTTGGGTGGGATCGCGTTGTGGAACCGCGTCCGGGAGAGATTTGGCCTGGTCGGTTTG
+TTTGTCGGCAGTGCACTCGTTAGCATCGCCGCGGCAGTGCTATCCATCGCATTCGATTTGGCCGGAGCGT
+GGCCCAACGTCGTCGCCATCGGTCTGGTGATTGCACTGGTATCCATCGCCAATCAAAGCGTATTCACCGC
+AGGCCAACTGTGGATTGCCCGTGACGCCGAACCCGGCCTGCGAACATCCCTCATCTCCTTCGGCCAGCTC
+GTCATCAACGCAGGCTTAGTCGGTATGGGTTTGGCGCTGGGGTTGATTGCCCAGGATCACGATGCGGTGT
+GGCCGGTGATGATCGTTCTGCTGTTGAACCTGACGGCTGCCTACTCAGCGACGCGGTTCGCTCCAGCCAA
+GTCCGTGGATGTTCGTGGCTTGCCTCAGGTTTCGCGCACTTCCCGACCTAAAACCGGGGGTTAGCGGCGA
+AACAGCTTGCTGCCCAGCCATACCACCGGATCATACTTGCGGTCGGCGACCCGTTCTTTCATCGGGATCA
+GGGCATTGTCGGTGATCTTGATGTTTTCTGGGCACACTTCGGTGCAGCACTTGGTGATATTGCAGTAGCC
+CAGGCCGTGCTCTTCCTGTGCTTGGCTGCGTCGGTCCCGGGTGTCCAGCGGATGCATTTCGAGTTCGGCG
+ATTCGCATCAGGAAGCGGGGGCCGGCGAACGCATCCTTGTTTTCCTCGTGATCGCGAACTACGTGGCAGA
+CGTTTTGGCACAGGAAGCATTCAATGCACTTGCGGAACTCCTGCGAGCGTGCAACGTCGACTTGCGCCAT
+TCGGTACTCGCTGGGCTGTAGCTCCTTGGGTGGCGCGAAAGACGGGATCTCGCGCGCTTTTTGGTAGTTG
+AACGAGACGTCGGTAACAAGATCGCGAATCACCGGAAACGTCCGCATTGGGGTGACCGTGACGATCTCGT
+CCTCGTCGAATGTCGACATCCGCGTCATGCACATCAGTCGCGGTTTGCCGTTGATCTCGGCCGAGCAGGA
+TCCGCACTTGCCAGCTTTGCAATTCCAGCGCACTGCGAGATCCGGTGTCTGCGTCTGTTGTAGACGGAGG
+ATGACGTCCAGCACGACCTCGCCCTCGTTGACCTCCACGGTGAATTCGCGGAGTTCGCCACAGCTTTCGT
+CTCCGCGCCACACCCGCATACTCGCGCTGTACGTCATTTAGCCTCTCCGTCCTGGATGCTCGGCCAGCTC
+TTCGTCGGTGTAGTATTTCTCCAACTCCGAGATCTCGAAGAGCTCCAGCAAGTCGGGTCGCATGGGCGTT
+TGCAGCTGCTGGGTGACGTTGATGTGGCAGTTGGAGTCGCCGGACCCGCTGCCACCGGTGCCCATGGTTT
+CGGTGGCCCGGCATACCAGCAAGATCCTGCGCCAGTTGGGGTCCATACCGGGATGGTCGTCTCGGGTGTG
+GCCGCCTCGGCTTTCGGTGCGCTGTAGCGCAGCTCTGGCCACGCACTCGCTGACCAGCAACATGTTGCGC
+AGGTCGATGGACAGGTTCCAGCCCGGATTGTATTGACGGTGACCTTCGACGAGTACGTTGTGGTAGCGCG
+ACCACAGCTCGGCCAAAAGAGTCAGCGCCCTGGATATTTCGTCGGCGTTGCGGATGATACCGACCAGATC
+GTTCATCACGTACTGCAAGTCCATATGCAGCGCGTACGGATTCTCCGGCGCCGAGCCGTCTTTCGGTCCT
+TCGAAGGGGCTCAGCGCCTGCTGGGCCGCCGCATCGATAGCCTCCGCTGAAACCGCTGGCCGGCTGCTCA
+GTGCCCGTACGTAATCCGCTGCGCCCAGGCCGGCCCGCCGGCCGAATACCAGCAGATCGGACAGCGAATT
+GCCGCCCAGCCGGTTGGAGCCGTGCATACCGCCGGCACACTCACCGGCAGCGAACAGGCCTGGCACCGTG
+GCGGCGCCGGTGTCCGCGTCTACTTCGACACCGCCCATCACGTAGTGACACGTCGGCCCGACTTCCATTG
+CCTGCGTTGTGATATCGACTTCAGCGAGCTCTTTGAACTGGTGATACATCGACGGCAATCGCCGTTTGAT
+CTCGGCGGGTGTCAGCCGGGATGCGATGTCGAGGTAGACGCCGCCGTGCGGGGTACCGCGGCCGGCCTTG
+ACCTCTGAGTTGATCGCGCGCGCGACCTCGTCGCGGGGCAGCAAGTCCGGGGTGCGTCGGGCCGAGTCGT
+TGTCCTTAAGCCACTGGTCGGCCTCTTCCTCCGTCTCGGCGTACTGGCCCTTGAACACCGGCGGAATGTA
+GTCGAACATGAAGCGAGAGTTCTCCGAGTTTTTGAGCACTCCGCCGTCGCCGCGAACACCCTCAGTGACC
+AGAATTCCCTTGACACTGGGCGGCCACACCATGCCCGTCGGGTGGAACTGGACGAACTCCATGTTGATCA
+GCGTCGCCCCGGCCCGCAGTGCCAACGCGTGCCCGTCTCCGGTGTACTCCCAGGAGTTGGATGTCACCTT
+GAACGACTTGCCGATCCCGCCAGTGGCAAGCACCACCGCTGGCGCCTCGAACACGATGAACCGGCCGCTT
+TCCCGCCAGTAGCCGAAGGCTCCGGCGATCGCGCCTTGGTCCTTGAGCAGTTCGGTGATGGTGCATTCGG
+CGAACACTTTGATCCGCGCTTCGTAGTCGCCGAGCTCGGCGTGGTCCTCCTGCTGCAGCGAGACAACCTT
+TTGCTGCAGGGTGCGGATCAACTCCAGGCCGGTGCGGTCGCCGACGTGCGCCAGTCGCGGATAGGTGTGT
+CCGCCGAAGTTGCGCTGACTGATTCGGCCATCGTCGGTGCGGTCGAACAGCGCGCCGTAGGTCTCCAACT
+CCCAGACCCGGTCCGGCGCCTCCTTGGCGTGCAGCTCGGCCATACGCCAGTTGTTCAGGAACTTTCCACC
+GCGCATCGTGTCGCCGAAGTGAGTCTTCCAATTGTCCTTCGGGTTGGCGTTGCCCATCGCGGCCGCGCAG
+CCGCCTTCGGCCATGACCGTGTGGGCCTTGCCGAATAGGGATTTGCACACGACGGCTACTTTCAAGCCGC
+GTTCCCGCGCCTCGATGACCGCGCGTAACCCCGCGCCGCCGGCACCGATCACGACTACGTCGTAGGAGTG
+CCGCTCGACCTCAACCATAAAACCTCGCTCAGCTTCTGAAACGATCCTTCAGCCAATAAATCTGAGATCT
+GTGATGCTGCCACTGGCCACCAGCATGATGTAGAAATCGGTGAGCGCCAGGGTCCCCAGCGTGATCCACG
+CGAATTGCATGTGTCGGGTATTGAGCTTGCTGACCTGTGTCCAGATCCAGTATCGCACTGGGTGCTTGGA
+GAAATGCTTGAGCCGACCGCCGGTGGCGTGCCGGCACGAATGGCACGAGATGGTGTATGCCCACAGCAGA
+ACCACATTGATCGTCAAAATGACATTGCCCAAACCGAAGCCGAATCCGGACGGCGAGTGAAATGCCGCGA
+TCGCGTCATAGGTGTTGATCAGCGACACCACCACCGCGATATAGAAGAAATACCGGTGGGTGTTCTGGAC
+GATCAGCGGAAGCCGGGTTTCACCGGTGTAATGAGCCCGCGGCTCGGGCACTGCGCAGCTTGTCGGCGAC
+TGCCATACCGACCGGTAGTAGGCCTTGCGGTAATAATAGCAGGTGAGCCGGAATCCAAGCAGGAACGGTA
+ATACCATCGCTCCCAACGGAATCCACCCTGGAAAATGCCCGAACCAGACGCCGAGATGACTGGCGCCGGG
+CTGGCAGGACGCGCTGACGCACGGCGAGTAGAACGGCGTCAGGTAATGATATTTTTCCACCCAGTATTGG
+CTGCCCCAGAACGCCCGAGTGGTCGCATAGCAGATGAACGCCAAAAGACCGAGGTTGGTCAGCAGCGGTG
+GCAACCACCAGAGGTCGGTGCGAAGCGTCCGTTCTGGGATTTGTGCGCGGGTGGGTGTGAAAACGCCGAT
+CGCAGGACGGTTCGCCGTGGGTGCGCTCATCTAATGTGATCCTCTTCGCGTGTTATCTCGTTGAAGGGTA
+CACAGAGAACGGCCCCCTTTTTCTGGGGGGCTCGGTTGTTCAGTACCTGTGACCTCCGACACCCTCATCG
+TCGACATCGCGCCAAAATTCGCGATCGTACTCGGTGTCGGGGATGGCGATTTTCTCGCTGGGTTGCGGTA
+CGGCGGCCCGTTCCAGGTCTAATTCAGAGACGTCGGTGTCGAGCAATTCGATGTCGGTGAGGATCCGGTC
+GGCATCGATCACGATGCGACGCGTTGCCGGGTTGTCGCCGAATCGCGCCTTCAGTGCGGTCACGCACCGC
+CGCAGTCCGCCGACGAGGTCGTGCAGTTCGGCGAGTTCGGCAGTCGTGGACAATGGGTGCTCCCTGGGCT
+GGCGGTGTTACAGATCACAGTACGCTCCCGATACTAGCTATCGACGGACGGAGTCGTTGGGTCTACTCGG
+CCCAATGGCATGATCCGGCGGACCCATCGGCCCGGCCGGATCATGCCGTATCGCGAACTACTTCGTGATG
+GCGATGCGCTGCGCCTGAGTTTCGGCTGGGGCCTTGTAGGCGCCGGCAACCCGGACGGTCAGCACACCGG
+CGTCATAGGAAGCCGCGATGGCCTCGCTGGTGACGTGCGCGGGCAGCCGGAACGAGCGGCGGAATGATCC
+GTAGCGGATCTCACGCAGGGTGCGGCCGTCTTTGTCTCCGGCGTCTTGCGTGTGCTCGTCGCGGTGTTCG
+CCGCGGATCACCAGGCGGCTCACCGGCTGGCCAGGGTCAAGCTCGACGTTGACGTCCTTGTCGACGTCAA
+TGCCGGGCAGTTCCAAACGGACCACCGCGTCGTCGCCATCCTTGACGATCTCGGCGGCCGGCGTGAAGTC
+TCCGGCGACCGGGCGGTACCAGTCCGTCGTCGCGGCAGGGCCGAAGAAGTCACGTAGCCAGCGGTCCCAG
+GGCTCAACGTCCCACACCGGACGCGACCACAATGCGAGATTGTTCATGGTTATCTCCTCATGCTTCGTTG
+TGAGTTAGCTGTGTCCGGCGCGTTGCCGGCCCGCTATACCAAGAACCTGAGTCGACCACGCTTAAGTTCC
+ACCTCGGCGTTCACCGGAAGCGAACACTGTCACACAGCCGGTCGCCAGGTGTGATCACAGCGTCATATGT
+GCGTCACATTCGGCGATTTTTCGGTAATTTGCCCCTCATACCCTCAGACCATGCCTACGGCTGGGAGTTC
+GCGCGCGCCTGCCGCGGCTCGCGAGATCGTCGTGGTCGGCCACGGCATGGTGGGCCATCGGCTGGTCGAA
+GCGGTGCGTGCCCGTGACGCGGACGGGTCGCTGCGGATCACGGTGCTGGCCGAGGAGGGCGATGCGGCCT
+ATGACCGGGTCGGTCTGACGTCCTATACCGAAAGCTGGGACCGCGCCCTGTTGGCCTTGCCGGGTAACGA
+TTACGCCGGTGACCAGCGGGTTCGGTTGCTACTAAACACCCGAGTCACCCAGATTGACCGGGCAACCAAG
+TCGGTGGTCACCGCGGCAGGGCAACGGCATCGCTACGACACCCTGGTGCTGGCCACCGGCTCCTACGCAT
+TCGTCCCGCCGGTGCCCGGCCACGACCTGCCCGCGTGCCACGTCTACCGCACCTTTGACGATCTCGACGC
+TATCCGCGCCGGCGCCCAGCGCACCCTGGACGGCGGTCACACCGATGGCGGGGTGGTTATCGGTGGCGGC
+CTGCTGGGCCTGGAAGCCGCCAATGCGCTGCGCCAGTTCGGGTTGCAGACACACGTCGTCGAGATGATGC
+CACGATTGATGGCCCAACAGATCGACGAGGCCGGGGGTGCACTACTGGCCAGGATGATCGCCGATCTCGG
+GATCGCGGTGCACGTCGGGACCGGTACCGAGTCGATCGAGTCGGTGAAGCATTCGGATGGCTCGGTGTGG
+GCGCGGGTTCGCCTGAGCGACGGCGAGGTGATCGATGCTGGGGTGGTGATCTTTGCCGCCGGCATCCGGC
+CGCGCGACGAGTTGGCCAGGGCGGCGGGGCTGGCGATCGGCGACCGGGGCGGTGTGCTCACCGACTTGTC
+CTGCCGGACAAGCGATCCCGATATCTACGCGGTCGGCGAAGTCGCCGCGATAGACGGGCGGTGTTACGGC
+CTGGTCGGGCCCGGATACACCAGCGCCGAGGTGGTGGCCGACCGACTGCTGGACGGGTCGGCCGAGTTCC
+CCGAAGCGGACCTGTCGACCAAACTCAAGCTGTTGGGTGTCGACGTCGCCAGCTTCGGCGACGCGATGGG
+GGCAACCGAGAACTGCCTCGAGGTTGTCATCAATGACGCGGTGAAGCGCACATATGCCAAGTTGGTGCTC
+TCCGACGACGCCACCACGCTGCTCGGTGGCGTGCTGGTGGGCGATGCCTCGTCGTACGGGGTGCTGCGGC
+CGATGGTCGGCGCCGAACTGCCCGGGGATCCCCTGGCGCTGATCGCGCCGGCCGGATCTGGGGCCGGCGC
+TGGCGCTTTAGGTGTTGGGGCGCTGCCGGATTCGGCCCAGATCTGCTCGTGCAACAACGTCACCAAGGGC
+GAGCTGAAGTGCGCGATTGCCGACGGTTGTGGGGACGTTCCCGCGCTGAAGTCATGCACCGCGGCCGGCA
+CGTCGTGTGGGTCGTGCGTGCCGCTGCTCAAGCAGCTGCTAGAAGCCGAGGGTGTGGAGCAGTCCAAGGC
+GCTGTGCGAGCACTTCAGCCAGTCGCGCGCGGAGCTTTTTGAAATCATCACCGCCACCGAAGTCCGGACT
+TTCTCCGGGTTGCTTGACCGCTTTGGACGCGGAAAGGGTTGCGACATCTGCAAACCCGTGGTCGCCTCTA
+TCCTGGCATCCACCGGCTCCGACCACATTTTGGACGGCGAGCAGGCCTCGCTACAAGATTCCAACGACCA
+CTTCCTGGCCAACATCCAGAAGAACGGCAGTTACTCGGTGGTGCCGAGGGTGCCTGGCGGTGACATCAAG
+CCAGAACACCTGATTTTGATCGGCCAGATCGCACAGGACTTCGGCCTCTACACCAAGATCACCGGCGGTC
+AGCGGATCGACTTGTTCGGCGCCCGGGTGGATCAGCTGCCCTTGATCTGGCAGCGACTGGTTGATGGCGG
+CATGGAATCTGGGCACGCCTACGGCAAGGCGGTGCGGACCGTGAAGAGCTGCGTGGGCAGCGACTGGTGC
+CGCTACGGTCAGCAGGATTCGGTGCAGCTGGCCATCGACCTGGAACTGCGTTATCGCGGGCTACGGGCAC
+CGCACAAGATAAAGCTGGGCGTCTCGGGTTGCGCGCGGGAATGCGCCGAGGCGCGCGGCAAGGATGTGGG
+CGTGATCGCCACCGAGAAAGGCTGGAACCTTTACGTCGCCGGCAACGGCGGCATGACGCCCAAGCACGCT
+CAACTACTGGCCAGCGACCTCGACAAAGAGACGCTCATCCGCTACATCGACCGCTTTCTCATTTACTACA
+TCCGCACGGCCGACCGGCTGCAGCGAACCGCGCCATGGGTGGAATCGCTTGGGCTGGACCATGTGCGCGA
+GGTGGTCTGCGAGGACTCGCTGGGTCTGGCCGAGGAATTCGAGGCCGCGATGCAACGCCATGTCGCCAAC
+TACAAGTGCGAGTGGAAGGGCGTGCTGGAGGACCCGGACAAGCTGTCCCGGTTCGTTTCCTTCGTCAACG
+CCCCCGATGCCGTCGACTCGACGGTGACCTTCACCGAGCGTGCCGGGCGCAAAGTACCTGTGTCCATTGG
+TATCCCGCGGGTCCGATCATGAAGTCCGGGAGGACAAAGGAGGGACTGTGACGCTTCTCAACGACATTCA
+GGTATGGACCACCGCCTGCGCATACGACCATCTCATTCCGGGACGTGGTGTCGGGGTGTTACTCGATGAC
+GGTAGTCAGGTGGCACTGTTCCGGCTCGACGACGGCTCGGTGCACGCGGTCGGTAACGTCGACCCGTTCT
+CCGGTGCTGCGGTGATGTCCCGCGGCATCGTCGGTGATCGCGGAGGTCGCGCCATGGTGCAATCGCCGAT
+CCTGAAGCAGGCTTTCGCGCTCGACGATGGCTCGTGCCTCGACGATCCGCGCGTTTCGGTGCCGGTGTAT
+CCGGCGCGCGTCACACCCGAAGGCCGCATTCAGGTCGCGCGGGTAGCGGTCTAGCTCACCCCGCGAACCT
+CACAGCTTGAGCACACGTCCGGCGATGACCAGATGTACCTCATCGCAGACGGCTGCCACGCGTCGGTTGA
+TTGTGCCCAGTAGATCGCGAAACAGCACGCCCGAAGAATGGGATGGCACCACCCCGAGGCCGACCTCGTT
+CGTCACCACGATCGCAGTGGGCAATCCGGTCAGCGCGGCGCACAACCCGTCGAGCCGTGCCTCGAGGACG
+GCGTAGACGTCCGCGGTCGCAGCAGACCACAACGCCTCGCCATCCATGATGGCCGTCAGCCAGGTGCCCA
+AGCAGTCCACGAGCACGGGACTTCGTGCCTCGGACAAAGCCGTCGCGACGTCGGCCGTTTCCACCGTTAG
+CCAGGTCGGTGGGCGGCGAGCGCGATGCAGTGCGACCCGGGCGTCCCAATCGGGATCGCTGCCAGCGGCC
+GGGCGGCCAGGCGCGACGTAGACGACGTCGGCCGCATCGCCCAACAACGCTTCGGCGTGCGTGGACTTTC
+CCGAGCGGACGCCGCCAGTGACCAGTATCCGCACCGGGTCATCGTAGGTGGGGCGGCCTCATGGCGCGCC
+CGGAGCGAGAAAGGGCAAGGTCGGCGGGCAACCATGGCGGGCCAGGTTGAGCAGCGCATCGACGTCGAGG
+TGTCGTTCGACGAGATCGCCGAGCAGGTCGAGGCGGCGCTCGCGTGCGGCCAGGAAGCATGAGCCCGACG
+GGGCGAGGCCGAGCGTCTCTCGCAGGAAGGCCTCGCGCAGGGCGTCGCCTTCCAACGAGCCGTGCCACAT
+GGTGCCGAACACCGGTCCGTCGCGCGCGCCGCCGAGGAACTCCTCGGCGGTGTCACCGCGGGTGATCCGG
+CCGTGGTGAATCTCGTACCCCGACGCGGGCACACCGAGTCCTTCGCCGCGCGGTAGCCGCAGCACCTTGT
+GGGGGGAAAATGCGGTCTCCACGTCGAGCAAACCCAAGCCCTCGACCTCGGTCACCTGCCCTCCCGGACC
+TTCGATGCCGTACGGGTCGCGAATCACCCGGCCCAGCATCTGGAACCCGCCACAAATGCCGAGCAGCGGC
+TTGCCCGCCGCAACATGCACCAGCAGCGCACGATCTAGGTCTCGCGCCCTCAGCCAGGCTAGATCGGCGA
+TCGTTGCCCGGGTGCCCGGCAACACGATCAGATCGGCATCGTCCAGCGCGCGGGGGTCGGAAGCGAACAC
+GACATCCAAGTCGGGCTCAAGACCCAATGCGTCGACATCGGTGAAGTTGCTGATTCGTGGCAGGCGCACG
+ACGGCTACCCGGCGGGCTCCGGTGCCCGCCGCGCGCCGGCCCTGTAGGTCGAGGGCATCTTCGGAGTCCA
+GCCAGAGGTCGGGGTGCCACGGCAGGGTGCCGTACACCCTGCGCCCGGTGACCCGTTCCAGGTCGCGCAG
+ACCTGGCGCCAGCAGGTCGGAGTCGCCCCGAAACTTATTGACCACAAACCCCGCGACCAGCGCCTGGTCC
+TCGGCAGCCAGCAACGCGACGGTGCCCAGGAACGCAGCGAACACCCCGCCGCGGTCGATGTCACCGACGA
+CGATGGTCGGCAGTCCCGCATGACGGGCAAGCCCCATGTTGACGTAGTCACCTGCGCGCAGGTTGATTTC
+GGCCGGGCTGCCGGCGCCCTCCGCGACAACGACGTCGTAGCGGGCGGCGAGGGCGTCGAAGGCGCGGCAT
+GCGGCCTCGGCGAGCGCTCGCCGCCCCGCACACCAGCTTGACGACGCCACCTCGCCCCAGGGCTTGCCCA
+TCAACACCACGTGGCTGCGGTGATCACTGGCCGGCTTGAGCAAGACCGGGTTCATCGCCGCCTCGGGCGT
+GGTCCTAGCCGCGAGTGCCTGCACCCATTGCGCCCGACCGATCTCCACGCCCGTGCCGTCGGGGCCTCGG
+CAGACCATCGAGTTGTTGGACATGTTCTGCGCCTTAAACGGCGCCACCCGCACACCGCGTCGGGCCAACG
+CGCGGCACAGCCCCGCGGTCACGGCGCTCTTACCGGCGTCGCTTGTCGTACCCGCGACCAGCAGACCCGA
+CATCCGTCTCCCGAAGGTTTCTCACTCCACCCGGGTCGCTGAGTCGGTGTCCCAGGTTCCGGGCATCATT
+GGCGTGCGTGGGCTGCCGCCGAACGCGTCGTTGGGTAACGTGATCAGTCCTGCGACTTGTCCGGGACTGG
+CCTTGTGGGTTGTTCCGGCGAAACCCAGGGTTCCCGCTCCTTGAGGCGAACCCGTCGGGTCGTGGCCGGT
+TTCGGGGTCTAAATCCAGGTATTCGTAACCGCGGCCGAGCTGTTTGATCTTTGGCCGCCGACGCCGCTGC
+GGTTGAACCTGTTCCTCGGGCGCCGCCGCGGCCGCTGGGGCCTCGGCGCTGTCGGGTTCCGGCGTCTTCT
+TTCGAACGCCGGTGCCGACGGCCTTCCTGGCCTGCGCCGCCGAGTTCAGGTCACCCACCAGGTACCCGAA
+GCTTTGTATGCCGGCTCCGGTCACCGGCGGCGGGGCGGTCACCGGCGGCGGTGGCGGCCCGGGCGGGGGC
+GTCGGCGCGGTCACGGCCGTGGGGGCCGGGGCTGGGGCTGGAGTTGGGGTGGGGGTCGGGATACTCGGGG
+CAATCGCCGCGACCGGCGGGATGACGGGCGGCGCGGATGGCGGGATGCCAACCAGGCCCGCCAGCCCAGA
+CAAGCCCGCGAAGCCGCCTGCTGCACTCGCAGGGGCAAGGGTCAACGGCGCCAGCGGGGCGGCTAGCAGG
+GGCAGCGCCGCCGGGAGCAACGCAAGAGTTTGCTCGAGCAGCGTTTTAACCAGCGCGATGGTATCGGTGA
+TGATCGTGCCAATGGCTTCGACCGTGGTGAACATCAGGGTAAAAGCGATAGTTGCGGGATTGCCCGACGC
+GAACGCCGCCGCCAGATCCGCCCCGATGAATGCGAAGGTTTGCGACAGGAAGGCGACATAAGATCCGATG
+TCCATGGGGTAGCCAAGGGCGAACGCAATGTTGGCCGGGCTTAGGAAGGTTAGCGGATTACCCAGCGAGG
+GCAGCCACGGATCAAATCCGGAAAACATCGCTTGCAAAAAGGGGAGGTTGGTCAGCCAGTTGATGAACGG
+TTGTATAACGTTGTTGTAGAAGTCGGTATACCCGATCTTCTGCAACCATTGCAGCCATTCCTGGACTTGG
+TTCGGCTCGTCGGAAGCCGCTGTCGGCGCGTTGGCTTTCACGATCTGGGGGGCTGGGGTGGTCTGCGGTG
+CGGCGGCCACCGCCGCGGTCGAGACCGCTTGATAGCTGGCCATCGTGGTGGCGGCCTGGATCCACATCCG
+CGCGTAGTCGGACTCGTTGAGCGCGATCGGGATGGTGTTGATGCCGAAGAAGTTCGTCGCCATCAGCACG
+CCGTGGAGGGCGTGGTTGGCGCCCAGCTCGGCCAACGTTGGCATCGCGGCCAAGGCGGTGCCGTAGGCGG
+TGGCCGCGGTTTCTTGCCGGGTGGCCATGGCCGCGCTGTTAGCGCTGGCCTGCACCAGCCACGCCAGATA
+AGGGGTATGGGCGGCCACGTAAACCGCGGCGGTCGGGCCGTCCCAGGTGCCGGCCTGTACGGCGGCCAAC
+AGCGCGGCCAGCTCGTCGGCCGTCTCCGCGTAGGCGATGCTCAACGAGTGCCACCCCTCGGCCGACACCA
+GCAGCGGACCGGGCCCAGGCCCGCTGCTTAGCAGCGCCGAGTGCACCTCTGGGGGCGAAGCCATCCAGAT
+CGGGGCGGTCATCGGCGGCTGACCGCCGGCGGAGGTGTCGTCGCGTCGCGAGCAGCCACGTTAAGGCCCA
+GCAGCGTGGTGGTGGCCCGACCGCTAGACAAGGTTTGGAGCGTCATGACCGGTTAGCTTTCTCGGGGTAC
+ACCGCCCCGGGTGGCAGGACGCGATGACGCGAGTCTCCTGGCTCCCGGATCGTTGCTTGCCTCGCCTTCC
+AGCCTGTGGCCGTGGCTTATGAGGGTCGCTCCCCGGTGACAGTGGCGGGACCGCGCCGGATTCTCACCGG
+CTTCCTGCATCGTCATCGCCTGACGGGAAGAATATTGGCATGCAGAGCGTGGATTTGCACGTTGAGCGGC
+ATTTGCCAAGCAGGGGTCGGTCACATCGCACGGTCGCAACAGTCACATGTGTCACTGCACTAGGCGACAT
+CCGATCTGCCCAGCTCTCAGCGACAGGCGCCTGGCCGGCGGTTTTGTTCCCAAGTTGGTCGTGGCTGTGC
+GGGATTGGAGGCGGCGTTGACCTGCAGAAACCGAGTTGTCGCGCTTAGCTGGGCACAGCGACCATCGCCG
+ACGGCGGAGCTCGGCGTCGGTGAGTCGCTTCGGTCGGCCGGGGCGGCGCGATTCGGGTTCGACCACGTGG
+TCGTCGACCAGCTGACGCGCCGAACGTGCAACCACGGCGGCAGCGCCCGGCGACGTGTCCCCGCCACCAG
+TACACGTTCGGCGCAGCCAGTGCACACACGGCACGGAGTTTAGGACTTACTCATTTGGCTATCCGCGACC
+GATATCGCCGACCAGGTAGCGCTGCATTGTCGGGCCAATGGCGTCGACCAGCATCTCCACCGACATGGAG
+TGCAGCGGCTCAGAACGCACCCCGTAGCGCATGATGCCCAAACCGACGAGTTGAGCGGCGCACAGCGACG
+CTCGGATGGCAATCTTGTCGGCCCCGAGCATCTTGAGCAACGGGTTGAAGACCGGTCCGATGAACATGGA
+CTGCACGATCTCGGCGGTCTTGGCTAGCCCGGTGGTTGCGATGGCGCTCGCCGCAAAGGGACCGCCGCCG
+GCCGCATCCCAGGTGGTGATCAGCACGTAGAGGGTTCGGCGGCCTACCTGGTTGACGCTTCCGGTGACGA
+TTTTTTCGATGAAATCCGGTGTGCCGAAGGGCAACCGCAGCATCTTCGCTACCGGGTCGAGGAGTCCGCG
+TGATGGCTCTTGGCTACGGGCCATGGTGTCAGGATCACCCCGCTGTGATCAAAGATCAAGCGTCACCGGT
+GTCGGCGTGCCATGCCAGCGGTGCAGCCGTTGCTGACGTGCTACCGCGCTGCGAAATCGGTTCGCGACCA
+GCTGTGCCAAGCCCGGATGGGTGCCGAGCGGTCGGGTTACCACATCGGCACCGGATGCCCGCAGCCGCTC
+TTGAAAAAGGCCTTCTGCCAACAGGAAGGAGGCGACCACGACGCGGCGCGCACCTCGGTTGGCTTCGGCC
+CGGTCTCGGGCCCGCTGCACAGCCGTGCGCACATCCGGACCGCCGGTGCCCGCAAATCCCATGTCCACCC
+ATGATCCGGTCAGTTCGGACACTAGCGTCCGAGTGGTGTGCAGGTCGGCACGTGCCCGCCTATCCGACGC
+GCCGGCCGCTGCGAGGATCACTGAATCGCCAGGACGCCAACCGGATTCCACCAGCTGCTGGGTGACTATC
+TGCGCGATCTCACGGCATGGCCCCAACGCGGGGGTGACCGTGACATGCGGGTGCGCACTGGCTGCGACAT
+GAGCGGGCAGGTCGGTGCGAACATGATATCCGCGGGACAAGAACGCGGGCACCACGATTGCGGGACGGCA
+GGAAAGGGCGGAAAGCACTTCGCTGGGTGAGGGTCCGAGCACATCAACGAAGGCGACCTGCACAGTGCGG
+TCGACGAGCGCGCTCACTTGCGCGGCGATGTCCGCTATCATCGCGACACCGGACGGTCTGCGGGTTCCGT
+GGGCCGTCAAGATCAGGTTCATACGTCATCGTGCCGGCTGTCAACGGCGAGACGGTAGCCACGTTTCACC
+ACTGTTGCCACGATGTTCTTGTCGCCCAGAGCCGTTCGTAGCCGCAGTACGGCGGTGTCCACGGCGTGGG
+TGTCGCTGCCGTCGCCGGGTAGGACGCGTAGCAAGTCGCCACGAGAGACGACGCCGCCGGGGCGATGTAC
+CAACGCGCGCAAAATCGCCATTCCGGACGGCGATAGTGGCTTCACCGAATCATCCACCAGCACAGAGGTT
+CCACGGATCTCGATCACGTGGCCGGCTGCTTTGAACGTGCACGAACCCAGCAGCGGCAGCTCCTCGGCAA
+TGTGGCGGGCTAAGGCTCCCAACCGCATTCGCTCGGGAGCCGACGTCGGGACGCCCTTTCGGATCAACGG
+CCGCGAAGTTACCGGGCCGACACACATCGCGTGCACGTCGGTACGCAGCGCAGCCAACAGTTGGTCCTCG
+ATATCCAATTCACGGCTGCGTTCTAGCACCGCGGCTGCGGCAGGTGCCGACGTGAAGGTGACCGCGTCGA
+ATTGTCGTCGCGCGATCCCGGTGACTAAATGGTCGAACACGCCGCCTAGTGGCGCCGGCTTCCACCGGTA
+AACCCGGATCGGCACCACTTGCGCGCCGGCGAAACGTAACCCGCCCAGAAATTCCGGAAACGGGTCCCAG
+CTGTCGGCGGCACCGTGCAGCTGGACGGCAATACGCGTACGGGACACCCCCGATTCGAGCAGATATTCCA
+GCACTTCATGCGACGATTCAGAGTCGGGGGACCACTCTTCACGCAGGCCGGCGGCACGCAGCGCACCAGT
+TGCCTTTGGTCCGCGGGAGATGATCCGGGCCGACGACAACGATTCCAGGAGCTCGTTGGCCAGCCCCCAC
+CCCTCGGCCGCGGCCAACCAGCCGCGAAATCCGATGCCGGTGTGGGCGACCAGAATGTCAGGCGGGTCGG
+CGATCAACGCCTCGGTGTTGTTCTGCAGTTCATCGTCGTCGGGAAGCGCGATCATCTTGATCGCTGGGGC
+ACTACAGACCTCGGCGCCCTGGCGGCGAAGCAATGCGCACAGCTCTTCGGCGCGGCGAGCGGATGTCACC
+GCGATCCGGTAGCCGGTCAGTGGCGCCGAGTGTGCCTGGGCCATATGACGTGTCTAGGCCTGTGAGGTTT
+CAGTCGCGTTACCAGGCAATTGCTGCCGGATTGCCCATTGCCGATACCCACCTCTGTGGCTTCGGGCGTG
+GCGCTAGACGTAGGCCAAGCCCGCGGGTGCGGTGGTCGCCGGCACGAGCTCGCCGGCGCTCTTTAGGCCC
+CGACGCACATAAATCGCCCAGGTCAACACCGAGGCGACCAGGTAGAACACCCCGAAGGCCCAAAATGCCG
+AGGTGGCCGTGCCACTGGTCAGGTAGGACTCTCGCAGAGCCAGGTTGACGCCCACTCCGCCGAGCGCGCC
+GACCGCCCCGGCCAGGCCGATCAGCGCGCCTGACATCGACCGCGACCACTGCCTGCGCTCGGCTTCACTG
+ATCTGCAGCGAATGGCTGCGCGCCTCGAAGATCGACGGAATCATCTTGTACACAGAGCCATTGCCGATGC
+CGGACAAAATGAACAGAGCCGTGAAGCCGATGACGTAGCCGACCATCGTCGCAGTCGGCATCGGCCCGGC
+CAGGTGGTCACCGAAAGTGCTTGCGCTGATGAGTATTCCGGTGGCCAGCAGCATGGCGCAGAAGGCAGCT
+AGGGTGACTCGGCCGCCACCGATACGGTCGGCGAGCTTGCCGCCATATATTCGGGACAGCGATCCCAATA
+GCGGCCCCAGGAAGGCGATCTGGGCCGCATGCAGCGAGGCCTGCGCCGTGCTCTGACCGCTGGCGATGAA
+GTTGATCTGCAGCACCTGACCGAATGCGAAAGAGAACCCGATGAACGAGCCGAAAGTGCCGATGTACAGC
+AGCGAGATCACCCAGGTGTGCGGCTCGGACACTACCGCACGCATGGTGTTCAGCTCGATGCGATACTCCG
+TCAGGTTGTCCATGTACAGTGCGGCGCCGAGGCCGGCGACCGCCAGCAGCACCAGATATATCGCGCACAC
+CCAGTAGGGCTCGCGGTCACCGGCCGTTGCGATCACCAGCAGGCCGACCAACTGCACCATCGGCACCCCG
+AGGTTGCCGCCACCCGCGTTGAGCGCAAGCGCGGCGCCCTTGAGTCGTTGCGGAAAGAAAGCGTTGATGT
+TCGTCATGGAGGCGGCGAAGTTGCCGCCGCCGAGGCCGGCTAGCGCACCGCACACCAGATACGGCCACAG
+TGGCAAACCAGGGTTGGCCAGCAACAGAATGCTGCCAACGGTCGGAATCAACAGCACCAGTGCAGAAAAG
+ATGGTCCAGTTGCGCCCCCCGAACTTTGCGGTGGCAAATGTGTAAGGGAAGCGCAGGCATGCCCCGACCA
+AGGTCGCGGTGGCGCCGAGCAGGAACTTGTCGCCGGCGGAAAAGCCGTACACCGATGTGGGCATGAACAG
+CACCATCACCGACCAGAGGGACCAGACGGAAAATCCGACGTGCTCGGCGGCCACCGACCAGATCAGATTG
+CGTCGGGCGATGAATTTGTTGCCGGCCTCCCACGCCACCGAGTCTTCGGGATCCCAGTCGGAGATCTGGT
+GGGAACGGCCCATACTGACCCCTATCGTGATCGACGTTCTCGATCACGCTAGAAATCCTTTGTTGCCCGG
+GCGCTTCCGGTAGTGACCCCGGCGTGAACTTTCGCTCACACGGTTACCGCCAGCGTGTGAGGGCGGCCGT
+GCAGCGGAGCGGATTACCAGACGTCGCCCGCGCGCCAATCGCACATCAGCTCCGCCGAGGTGTCCAGGCT
+GATGTCGATGGGCAGGACGAACACCGTTCCGTCGTCATCGGGTGTACGGACTGGACCGGTTGGTGCCAGT
+ACCGATGTCGGGCCGTGCCAGGGCAGCCAGCCGCGTGAGGCGTACAGTCTGCGGGCCCGCGCCGAGGAAC
+TGAGCGCTCCGAGCTGGTAAGCGCCGCGCATCACCTGCTCGACGGCGTCCAACAGCGCGCTCACCAGGCG
+TTGGCCCCGCCAGTCCGCCCGCACCGCAACGCCTTCGACGTACCCGCAGCGCAGCGCGTTGCCGCGGTAG
+ATCAGTCGCCGCTGGATCACCGCGGCATGCGCGATGATCGCCCCGTGATGCCAGATCAGGGCGTGCATCC
+CACCCAGCGTGTGCTCCCAGTCGGTCTCGGTGAAGTCACCGGCAAACGCGCCGGTGACCATCTGACGGAT
+GTCCTGGCGGGTCTCGCTGTCAAGATCGGCGGTGTGGACCAGGCGGGCCGTGTGTACCTGGGTGTGCACA
+GTCCCTGTCTACCAGGCTTGTGTTACACCCTGGCCAGGCAACCGAGACCGGGGTCGTGCCCAGTGCAGTC
+GCACATATTGGCCGGGCCGTATCTGCGCGACCTTGTCGATGTCCTCGTCGGTGATGACGCCGACGACCGG
+ATAGCTTCCGGTGATCGGGTGATCCGGCCCCAGGATCACCGGTAATCCGTTGGGCGGCACCTGGATTGCG
+CCGCGGGTAACGCCTTCGCCGGGCAGTTGCCGATCCGGCCAGCGGTGCTGTAGCGGGCGGCCCTGTAGCC
+GCATTCCTACGCGGTCACTGCGGTTGGACGCCATCCAGATGGTATGCACCAACGCGTCCGGGTCCACCAG
+CCAGTCGTCGCGCGGCCCGGGCACCACCCGCAGCTCCACCAGATGCTCCTCGATAGCGGCCACCGGTGCC
+TGGTCGAGTTCGGGATAGTCGTCGGTGTGTTCGCCGACCGGCAGCACGTCTCCGGCCCGTAGCGGCGACG
+GGCCGATCGCCGACATCACGTCGTAGCTGCGTGACCCCAGCACGGGCTCCACACAGACGCCGCCGCGCAC
+CGCCAGATAGGTCCGCAGCCCGGCCCGTGGGGTGCCCAGTGAGATCACCTGGCCGTCCCGGACGTGGTGA
+ATGCTGTTGGTGCCGACCATGATTCCGTTCACGGTCGGATCGGTGTCGGCGCCCGTCACCGCGATGTCGA
+CGTCGCCGCCGCGAACCCGCGCCGAGAAGCCGCCGAAGGTCACTTCGACCGTGGCCCAATCGTCGGGGTT
+GGCGACTAGCCGGTTGGCCAGCGTGTGGGAGCGGCGGTCGGCGGCACCGGATCGACCGACACCGAGATGG
+GCCAGTCCGGCACGGCCGAGGTCTTCGACGAGGGCCAGCGGTCCGCTGCGCAGGATTTCCAGTGTTGTCA
+TGGCTGCTTCCTCCAGCTCAGGCGGCCCGGAACTGAACCCACATGCCCGGTGTGAGCAGCGCCGGCTGGG
+GTCGGTCGACATCCCACAGGACCGCGTCGGTGTGGCCGATGATCTGCCAATCGCTGGGCGCTTGAGATGG
+ATATATCGCGCTGAATCCGTCGGCGAGGGCGACCGATCCGGGCGGCATCGAGGTGCGCCGTTCGGGCCGG
+CGCGGCACCCGCAGGCTCGGGTCGCCGTCGATCAGGTAGGCGAACCCCGGGGCGGACCCACTGAATCCCG
+CCCGCCATCCGGTGGCGGTGTGGGCGTTGATGACCGCTGCGGTGGTCAGGCCGGTGCAGCGGGCGACCTC
+GGCGAGGTCTGGGCCGTCGTAGACGACGTCGATTACCAGGTCGCATCGGTGATCGGCCGCAGCCACCGCC
+TCGGGGGTGACCCGCAACCTGCGCAGCCGCTGACGGGTGACCCCTTGGTAGCGGGGCGCGTCCAGCTTCA
+CCAATACGGTGCGCGAGGCCGCAACGATGTCGACCACACCGGGTAGCGCCGCGGCTCGCAATGCATCGGT
+CCATGCCATTGCGTCAGCGGTGCTGTCACATTGCAGCATCAGCGCATGGTCGCCGTAGTCGAGCACGGTG
+CAGGCCAATGCCGCGTCCATAAAGACGTCCATCACACTCATGCGTCGACGGTAGCGCTGCAATCTTCGGC
+TCGGCCAGGGATTTTCGAGACTGCCAGAGGTGCCTTAGCAAATGCTCATGCGCCCAAGATCTGGCTGATC
+TGTGGCGGCAGTTGCTCGGCCACCACGGGATAACTCAGCACCGACGAGAAGGCGATGGCTCCGGCCTGTT
+CCTTGGAAGTGAAGATGTGGCGCCGCTGGGCGGTTGCCTGCGACGCCGCAATCTCCGGGTCGGCCAACAA
+CGCCTTCTCGTCCTCGGGGCTCTCGGTCATCCAGATCAGCACATCGGCGGCATCAAGCACCGCTTTAATG
+TGATCGCGCGGAATGACGCCGCGCTGATCGACGGCGAAGGGTTTGATGCTGTCGGCGATCACCAGACCCA
+TGTCGTTGAGGAAGTCAGTTCGCCAGCCCGCCAGGGTTGCGACCACGTTGCCCTGCCAGAGGCGACCCTG
+CAGCAACAGCGCCTTCTTGCCCCGCCAGCGCGGATGCCGCTGCGCCACCGCGGCGAACTTCTGGTCGACG
+GCCTCGATCAGCGACCTCATCCGGTCGGCCGCAAACACCGCCTGGCCGATCGACCTGGCCTGGTCCTTCC
+ACGGCTCGAAGAATGCGTCGCCGCCGGACTGGGCGACGGTCGGGGCGATCGCCGACAGCTGCTGATAGGT
+ATCGGCGTCCACCCCGGCGTTGATCGCCACGATCAGGTCGGGTTTTAAGGCGGCGATTCGGTCGATCTGA
+ATCCCGTTGTCCAGGTTCAATACCGCCGGCCGCGCCCCGCCGAGCTTGGGCGCCGCCCACGGCCACACCG
+CAAACGGCTGGTCACCGAACCAGTCGGTCACCGCGATGGGCACCACATCGACCGCGAGCAAGTCGTCCTG
+CTCGGTGTAGCCGGCGCTGACCACGCGCTTGGGTGGCTCTTTGATGACGGTCTGACCGAACAGGTGGGTG
+ATAGTTACCGCCGCGCCGCCAGGAGTGCCCGGCGGGGGTTTGGGCGATGAACAGCCCGCGAACAGCCCGG
+TGGCTGCTGCAGCCTCGGCGACCTGCAAGAATCCCCGGCGGCTGCATCCCTGTCGCACAGCGTGAGGGTA
+TCGCGCGCGTTACCGCCGGCGTCGGGCGCTGGTACTTGCTGGCCCGTATCCGCCGCCGCCGGGGGTTTCG
+ATCACCAGCGTGTCGCCCGGCTCGACGTGCGTTGAGCCGCATCCGGCCAACTCGACGGTGCTGCCGTCGG
+CGCGTTCCACTCGGTTGCGTCCCAGCTCTCCGGGGGAGCCGCCGGCCATGCCGTAGGGCCGAACCCGCCG
+ATGACCGGAGAGCGTGCTGACCGTCATCGGCTCGGTGAACTCGAGGCGTCGGACGGCGCCGTCGCCGCCC
+CGCCAGCGACCGGCGCCCCCGCTGCCCTGACGTACGGCGAACTCGCGCAGCAACACCGGGTAGCGCCACT
+CCAGCACCTCGGGATCGGTGAGCCGGGAGTTGGTCATGTGCGTCTGCACCACCGAGGCCCCGTGGTACCC
+GTCACCGGCCCCGGAGCCCGATCCTACGGTTTCGTAGTACTGGTGCCGCTCGTTGCCGAACGTGACGTTG
+TTCATCGTCCCGGATCCCTCGGCCTGCACACCCAACGCGGCGAACAGCGCGCCGGTGATCGCCTGCGAGG
+TTTCGACGTTGCCAGCGACCACCGCGGCGGGATGGGTTGGTGCGAGCATCGAGCCTTCGGGGACGACGAT
+ACGCAACGGGCGCAGGCAACCGTCGTTGAGCGGGATGTCGTCGGCGACCAGGGTCCGGAACACGTAGAGC
+ACCGCCGCATTCACCACCGAGGTCGGTGCGTTGAAGTTGGTGTCCAGCTGAGCCGAGGTTCCGGTGAAGT
+CGATGGTCGCGCTGCGGGCGGCGCGGTCGACGGTGATGCGCACGGCGATCGTCGCGCCCGAATCCATGCG
+GTAGCGGTAGGCGCCGTTGTCGAGCCGGTCGATGACCCGGCGGACCGCTTCCTCGGCGTTGTCCTGGACG
+TGGCGCATGTAGGCCGCCACCACGTCGCGGCCGAAGTGGTCGATCATTTTTCCGACCTCGTCGACGCCCT
+TTTGGTTGGCGGCGATCTGCGCGCGCAGATCGGCGAGGTTGGTGTCGGGATTGCGGGAACCGAACGGCGC
+CTCGGTAAGCAGGCGCCGGGTTTCGGCCTCGCGGAACCGTCCGTTCTCGGCGAGCAGCCAGTTGTCGAAC
+AGCACGCCCTCTTCGTGGATCTCGCGGCTGTCGGCGGGCATGGAGCCGGGGGTGATGCCGCCGATTTCGG
+CGTGGTGCCCGCGAGAGGCGACAAAGAATAGGACGTCCTCGCCGCCGGTGTTGAACACCGGGGTGATCAC
+TGTGATGTCCGGCAGGTGGGTGCCGCCGTGGTACGGGTCGTTGACGGCGTATACGTCACCGGGCTTCATG
+CCGCTCAAGCGCCGGCGGATCACTTCCTTGACGGTGGTGCCCATCGAGCCGAGGTGCACCGGAATGTGCG
+GGGCGTTGGCGACCAGGTTGCCGTCCGGATCGAACAGCGCGCAGGAGAAGTCCAGCCGCTCCCGGATGTT
+CACCGACTGGGCGGTGGCTTCCAGCCGGAAGCCCATCTGCTCGGCGATCGACATGAACAGGTTGTTGAAG
+ATCTCCAACAGCACCGGGTCGGCCTCGAAACCGGCCTCGAAACCGGCCCGAGTGGCCGCATCGGGCCGCG
+GCGGGGTGACCACTCGTTGCGCGAGCAGGTGCCCGGTCTCCGTCATCGTCGCCTGCCAGCCGTCGTCGAC
+GACGGTGGTGGCGTTGGCCTCGGCGATGATCGCCGGACCGGTCAGCACGTCGCCCGGCCGCATCGCCTCC
+CTACGCCGCAGCGGTGCGTCGCGCCACAATCCGTTCGAATAGATCCGCACGGTTTCCGACGAGCCGGTGG
+TGTCGTTGGCCTGATCGCCCAGCTGGGACAGGTCGGGCTGGTCGGTGAGCCCGGTCGCCTCGACCGAGAT
+CGCTTCGGCGATCAGCGGACGATCCAGCAGGAACGTGTACAGCGCGCGGTGGCTGCTTTCAAACGCCGTG
+GCCATGGTCTCGATCTCGGCCAGTTGCACGGGGATCGCGGTATCGGTTCCCTCATAGCGCAGGTGCACCC
+GGCGAACCACCCGGATGCGCTCACCCGGGACGCCCTCGTCCAGCAACTCGGCGCGGGCGGCTCGTTCGAG
+GGATTCCGCAACGCTGGCCAAACGCTGTGGCGCGGCGGGTCCGAGCGGGATCTCCACCGATTGTTCGCGC
+ATTGCGGTGGTGTCGGCCAGGCCGATCCCCAGCGCGGAAAGCACGCCGGCCATTGGTGGGATCAGCACCG
+TGCGGATGCCGAGGGCGTCGGCCACCGCACATGCGTGCTGACCGCCGGCGCCGCCGAACGTCGTCAGCGC
+GTACCGCGTCACGTCGTGTCCCTTTTGCACGGAGATCTTTTTGACCGCGTTGGCCATGTTCGCCACCGCG
+ATCCGCAGATATCCCTCGGCGACCTGCTCGGGTGACCGGTCGTCGCCGGTCCGCGCGGCGATGTCGGCGG
+CCAGGTCGGTGAAGCCACGCCGCACGGTCCCGGCGTCCAGCGGCTGGTCGCCGGAAGGACCGAATACGGA
+CGGGAAGTGGGTGGGCTGGATGCGGCCGAGCATCACGTTGGCGTCGGTGACGCACAGCGGTCCGCCGCCG
+CGGTAGCAGGCCGGGCCGGGGTCGGCTCCGGCCGAGTCCGGGCCGACTCGGTAGCGGCTCCCGTCGAAAT
+GCAGGATCGACCCGCCGCCGGCGGCCACCGTGTGGATGTCCAGCATCGGCGCGCGCAGCCGGACCCCGGC
+AACCTGGGTCGTGAAGACGCGTTCGTACTCGCCGGCGTAGTGCGACACGTCGGTCGAGGTGCCGCCCATG
+TCGAAGCCAATAACATGATCGAAGCCGGCCAGCGCCGACATCCGCACCATGCCGACGATGCCGCCGGCCG
+GACCAGACAGAATCGCGTCCTTGCCGCGGAAGTGCCCGGCCTGCGCCAGCCCCCCGTTGGACTGCATGAA
+CATCAGTCGCACACCCCGCATCTGGTCGGCCACCTGGTTGATGTATCGGCGCAGCACCGGGGACAAGTAG
+GCGTCGACCACGGTGGTATCCCCGCGCGGGACCAGTTTCATCAGCGGGCTGACCTCAGATGACAACGAGA
+TCTGGGCGAAGCCGATGCGCTGCGCCAGCGTACCGATTTCTCGCTCGTGTCCCGGGTAGAGGTAACTGTG
+CAGGCACACCACCGCGACCGCGCGGATTCCGTCCGCATGGGCCTGCCGCATCTTCTCGCCCAATGCCTCC
+AGGTCGGGTGCCCGCAGCACCCGGCCGTCGGCTGTGACCCGTTCATCGACCTCGACGACCCGCTCATAAA
+GCATCTCGGGCAACACGATCCGCCGGTCGAAGATGCGCGGACGATTCTGGTAGGCGATGCGCAGGGCGTC
+GCCGAAACCGCGGGTGATCACCAGCAGTGTGCGCTCACCCGTGCGCTCGAGCAACGCATTGGTCGCCACC
+GTGGTGCCCATCCGCACCGCGTCGACGCGCGTGCCCGCCTCGCCGTTCGCTAGCAGCGCACGGATGCCGG
+CCACCGCGGCGTCGCGATAGCGTGCCGGGTTGTCCGACAGCAGCTTGTGGGTCAGCAGCCGTCCGTCCGG
+CCGGCGCGCCACAACGTCGGTGAACGTGCCACCCCGGTCGACCCAGAAGTGCCACCCCGCGCCAACCACC
+CGGACTCCCCCTTCACGCTCGCAGCCGGTCCCGTCCTCACAACGGCAGACGGGCCGAAGCCACCTAAAGG
+TATCTCCGCTGTAACAGCGCGCATCCGGGCCGGTAACAGGGTCTCTTTAGCGTCGAGCCGTCATTACCGC
+TGATGTCGCCCGCTTGTCGACAGGAGACCTAACCGATGGCACTCACCACCGCCCCGGCAATCGATTATGC
+GCTGCCACGCCAGCAGGATGAGGGCGATCACTGGATCGACGACTGGCGCCCGGAAGACCCGGTGTTCTGG
+GAGACGATCGGCAGGCCGATCGCCCGCCGTAACCTGATCTTCTCCATCTTCGCCGAGCACGTCGGCTTCA
+GCGTGTGGATGCTGTGGAGCATCGTGGTTGTCCAGATGACCGCCGCCGCTCCCGGGCACCCCGCCGCGTC
+CGGCTGGGCGCTGTCCGCCAGCCAGGCCCTATGTTTGGTCGCCGTCCCCAGCGGTGTCGGGGCGTTCCTC
+CGGCTGCCGTACACCTTCGCGATCCCGATCTTTGGTGGCCGCAACTGGACGACCGTCTCGGCGGCGCTGC
+TGGTGATCCCGTGCCTGCTGCTGGCTTGGGCGGTGAGCCACCCTTCCCTGCCGTTCGCGGTGTTGGTGGT
+GATCGCGGCCACCGCCGGTTTCGGTGGCGGCAACTTTGCCTCATCGATGGCCAACATCTCGTTCTTCTAC
+CCGGAGAAGGACAAGGGTTGGGCGCTGGGCCTGAACGCGGCCGGAGGCAACATCGGGGTGGCGGTGGTGC
+AGAAGATCATTCCGCCCATCGTGGTCGCCGGCAGTGGGGTGGCACTGTCGCGTGCCGGACTGTTCTTCGT
+GCCCTTGGCCGTCGCCGCCGCGGTGTGCGCATTCCTGTTTATGAACAACCTCACGGAGGCCAAGGCCGAT
+GTGAAGCCGGTGTGGCAGTCGCTGCGGCATGCCGACACCTGGATCATGTCGCTGCTGTACATCGGCACCT
+TTGGGTCGTTCATCGGGTATTCGGCGGCCTTCCCGACGTTGCTCAAGACCGTGTTTGGCCGTGGTGACAT
+CGCGTTGGGTTGGGCCTTCCTCGGCGCGGGCATCGGTTCCCTGGTCCGTCCGCTGGGCGGCAAGCTCGCC
+GACCGGATCGGCGGTGCGCGGATCACCGCGGCCAGTTTCGTCATGCTGGCGGCCGGGGCGGCTGCGGCGT
+TGTGGTCGGTGCAGTCGGTCAATCTGCCGGTGTTCTTCGTCAGCTTCATGTTCTTGTTCGTTGCCACCGG
+CATCGGCAATGGTTCGAGCTACCGGATGATCTCGAGGATCTTCCAGGTCAAAGGCGAAGTCGCCGGCGGG
+GATCCGGAAACGATGGTGAACATGCGCCGACAGGCCGCCGGAGCGCTGGGCATCATCTCCTCGATCGGCG
+CGTTCGGCGGGTTTGTGGTGCCGCTGGCCTACGCCTGGTCGAAGGTGCACTTCGGCAATATCGAACCCGC
+CCTGCACTTCTACGTGGCGTTCTTCCTTGCCCTGCTCGTCGTCACCTGGTACTGCTACTTGCGTAGAACC
+ACCCCCATGGGCCAGGTGGGGGTGTAGTTAGCCCGGCGGCGGTCTCACGTTGTGAGCCACGCGCAAACTC
+AGACTCTGCCGATGTCAACGCCCAGCTCGGCACCGAGCTTGTCCAGCGGCATGGTGACGTGCTCTCGCTC
+GTGCACGCTGAGCCGGTCGCGCAGGTCTTCAAGCTCTTCCATTAGGCTCTCGTAGCGCTCAGCTGAGATG
+AGGATGGCTGCGGGTCGGCCATGATTCATCAACACGACGTCATCGTCGGCGGATTCACGCACAAGCCTCG
+ATAGGTGAGCGCGGGCTTCACTAATAGGCACTAGACTGCTGGTCATCGGTAGACCCCCCTTCGGTGTCCG
+ACGCGAGTAACGGTGATGACACGCGCTGCGTCGTCGACGATGTAAACAACGCGATAGTTGCCGAGGCGGA
+TGCGGTAAGTGGTGTCGAAGCCACTCATCTTCTCGCAGCCACGCGGGCGCGGTTCGTCGGCGAGCGCGGC
+GACGGCGGTCAGATGCGCCGCTGGTCGTGGCGGTGCAGCCGTTGGATTGCTTTAGCTGCCGAGTTCTCGA
+TTTCGACCGCGTACCCACTTGCCATACAAAAATGTACAGACTTCAGATGCGTAATATAAGCGCTAATTTT
+GCCGACGCGCTCTCACCGCGGCCACGGGCTGTAGTCGGCGATCAGCTCCTCCTGCGGCGGGCGCTGGTCG
+GCCGGGACGTGCTGCAGGTTGATCCGGATCCGATACCAGATCGAACTCGGCCCGCGCATGCCGTCGACCA
+GCACATCGGCGGGCCGCAGCAAAGCCGCGGCGCCGGGATACCGGTCGCGCCAGATGTCCAACGCCGCCAT
+CGCCTCGGCCCGCGTCTTGGCGCGGGCGATCTCGATCAGCGGCTTGGCGGATTGCGCCTTCTGCGGCGGA
+CCCAGTTCCTCGGCCAGCATCAACAGCCGGTCGAGCCGGCCAACCGCGTCATCCATCCCGGCCCAGGGGT
+CACCGATGTCGGCCAACCGGCTGGGCACGGTGGCCATGGTGAACACCGCCGGGTCGCAGCCGGGCACCTC
+CTCCCAGTGCAGCGGCGTGGACACCCGGGCATCCGGGGTGGCCCGCACCGAGTAGGCCGACGCGACCGTG
+CGGTCCTTGGCGTTCTGGTTGAAGTCGACGAACACGCCCTCGCGTTCTTCCTTCCACCAACGACTGGTTG
+CCGCGTCGGGTAGGCGCCGTTCGACCTCACGCGCAACGGTCTGGGCGGCCAGGCGCACCTGGGGAAACGA
+CCAGCAAGGCGCGATCCGGGCATAGACGTGAAAGCCCCGCGACCCGGACGTCTTCGGCCATGCGGTCAAC
+CCGTAATCCTCCAGCACCTCCCGGACCACCAACGCGACCTCGACGACCCGCTGCCACGCGACCCCGGGCA
+TCGGGTCCAAGTCCACCCGCAGCTCGTCGGGATGATCGAGGTCGCCGGCGAGCACCGGATGCGGATTGAG
+ATCCACACACCCCAGGTTGATCACCCACGCCAGCCCGGCGGCGTCGTGAATGACCGCCTCCGCGGCGGAG
+CGGCCCGACGCATAGTGCAGCTCGGCCACGTCCACCCAGTCTGGCCGGTTTGCCGGTGCGCGCTTCTGAA
+ACACCGCCTCGGCGGAGATGCCCTTGACGAAACGCTTGAGAATCATCGGCCGGCCGGCCACCCCGCGCAT
+CGCCCCCTCGGCCACGGCGAGGTAATAGCGGACCAGATCGAACTTGGTGTAGCCCTTTCGATCGTTGTGA
+GCGGGGAAGACGACCCTGCCCGGATGCGTGACGATGACCTGGCGTCCGTGCACGTCCAGCGACACCGGGG
+CGGCCATGCGGCTCATGGTAATTTGCGACCCGCCTCACATAGGGTGAGGTCATGCCTAACCTCACTGATC
+TGCCCGGGCAGGCCGTCTCCAAGCTCCAGAAGTCCATCGGACAGTACGTCGCGCGCGGCACTGCCGAGTT
+GCATTACCTGCGGAAGATCATCGAATCGGGCGCGATCGGGCTGGAGCCGCCGCTGAACTACGCCGCGCTC
+GCAGCCGATATCCGCAAGTGGGGGGAAGTCGGCATGCTGCCGTCGCACAATGCCAGGCGCGCCCCCAACC
+GGGCGGCCGTCATCGACGAAGAAGGCACGCTCACGTTTTCCGAACTCGACGAGGCCGCACACGCGGTGGC
+CAATGGCCTACTGGCCAAGGGTGTCCGCGCCGGGGACGGCGTCGCCATCTTGGCGCGCAACCACCGCTGG
+TTTGTCATCGCCAACTACGGGGCGGCCCGAGTGGGGGCCCGCATCATCTTGCTCAACAGCGAGTTCTCCG
+GCCCGCAGATCAAAGAGGTGTCGGACCGTGAGGGCGCCAAGGTGATCATCTACGACGACGAGTACACCAA
+GGCCGTCAGCTTGGCCCAGCCACCGTTGGGCAAGCTGCGGGCGCTTGGTGTCAATCCCGACGACGACAAG
+CCGTCGGGCAGCTCCGACGAAACGTTGGCCGAGCTGATTGCGCACAGCAGCACCGCGCCCGCCCCGAAGG
+CGAGCCGCCGTGCGTCGATCATCATTTTGACCAGCGGCACCACCGGCACCCCGAAGGGGGCGAACCGTAA
+CACACCGCCGACGCTGGCTCCGATCGGCGGCATTTTGTCGCACGTGCCGTTCAAGGCCGGCGAGGTGACG
+CTGTTGCCGTCGCCGATGTTCCATGCGCTGGGTTACATGCACGCCGCGCTCGCCATGTTCCTGGGCTCGA
+CGCTGGTGCTGCGGCGGCGGTTCAAGCCCGCGTTGGTGCTGGAAGACATCGAAAAGCACAAGGCGACATC
+CATGGTCGTCGTACCAGTGATGCTGTCGCGGATCCTCGACCAGCTGGAGAAAACCGAACCCAAGCCCGAC
+TTGTCGAGCTTGAAGATCGTGTTCGTATCCGGATCGCAATTGGGTGCCGAGCTGGCCACCCGCGCGCTGG
+GGGACCTCGGCCCGGTCATCTACAACATGTACGGCTCGACCGAGGTCGCGTTCGCCACCATCGCCGGCCC
+CAAGGATCTGCAGTTCAACCCCAGCACGGTGGGGCCCGTCGTCAAGGGGGTGACGGTTAAGATCCTCGAC
+GAGAACGGCAATGAGGTGCCGCAGGGTGCCGTTGGCCGGATCTTTGTGGGCAATGCCTTCCCGTTCGAGG
+GTTACACCGGCGGCGGTGGCAAGCAGATCATCGACGGCCTGTTGTCGTCCGGCGACGTCGGCTACTTCGA
+CGAGCGCGGCCTGCTGTATGTGAGCGGCCGCGACGACGAGATGATCGTCTCTGGTGGTGAGAACGTGTTT
+CCCGCCGAAGTCGAGGATCTGATCAGCGGGCATCCCGACGTGGTGGAGGCCGCCGCGATCGGCGTCGACG
+ATAAGGAGTTCGGTGCCCGGCTGCGCGCGTTCGTGGTCAAGAAGCCGGGAGCTGACCTCGACGAGGACAC
+CATCAAGCAGTACGTACGCGATCATCTTGCCCGCTACAAGGTGCCGCGGGAGGTGATCTTCCTCGACGAG
+CTACCGCGCAACCCCACCGGCAAGGTCCTCAAACGTGAGCTACGCAAGCTGTAGCTGCTCGCGCGGGTAC
+TTACGGGTCGCGGGGTAGGCCCAGCAACCGCTCGGCGATGATGTTGAGCTGGACCTCCGACGTGCCCCCG
+TAGATGGTGGTGGCCCGGCTGGCTAGCAGGTACTCGCCCCACTTGCCGGGCAATCGCTCTGTGTCGCCGA
+TCACCGCATCGGTGCCAAAGGACGACACCGCGAATTCGGCATAACCCTGGCCGGTGCGCATGGACAACAG
+CTTGGAGATCGCCGCCGGCGCCATCGGGTCACCCCCGGCCAGCGTCAACAGCGTGGAGCGCAAGTTGAGC
+AGCTTGGTGGCGTGGCCCTCGGCGATCAATTGCCCGGCACGGTGTCGCGCGACCTGGTCGAACTGTCCTT
+CGAAACGGTAATCGCGAACGAAGTCGACGAACTCGCCCAGGGTGGGGAGGAAGGTCGAATCGCTGCCGCC
+GATCGACACCCGCTCGGCCGTCAGGGTGTTGCGGCTGACCTCCCACCCCCGGTTCACCTCCCCGAGCACC
+AACTCGTCGGGGACGAACACGTCGTCGAGGTAGACGGTGTTGAAAAACTCCTTACCCGTGAGCTCGCGCA
+GCGGCTTCACTTGTACGCCTTCGCTTTTCATGTCCAGCAGGAAGTAGGTGATGCCGTTGTGCTTGGGCGC
+CGACGGGTCCGTCCGCGCCAGCAGCGCACCCCATTGGGAGTACTGCGCGCCGGTGGTCCAGATCTTCTGA
+CCAGTGATGCGCCAGCCACCGTCGACCCGGGTGGCCTTGGTTGCCAGGCTAGCCAGGTCCGATCCCGCGC
+CCGGCTCGGAGAACAGCTGGCACCAGAAAATGTCGCCTCGGAACGTTGGCGGCAGGAGGCGCTGCTTCTG
+ATTGTCGGTTCCGAACGCGACGATCGACGGCACGATCCACGTCGCGATGGCAATCTGCGGCCGCTTGACC
+CGCCCGGCGGTGAACTCCTGGGCGATGATGATCTGCTCGACCGGGCTGGCGGCCCGACCCCACGGCTTGG
+GCAGATATGGCAGCACCCACCCACCTTCGGCGATCGCGACAGTGCGCGGCTCTCGCGGCATCGCCTTCAG
+CGCGGCGACTTCGGCCCGGATCTGGGCCCGCAGCTTCTCGGTAGAGGGGTCCAGGTCGATGTCTACCGGA
+CGCATACCGGCAGTCGTCGCGGTGTCCACCACCCGCTGCGGATACTCCGAGCCGCGGCCAAAGCACGCGG
+CCAGCATCAACGCCCGGCGGTAGTAGACGTTCGTGTCATGCTCCCAGGTGAAGCCGATGCCGCCGTGCAC
+CTGAATGCAGTCCTGCGTGCAGCGCTGAGCGGTCGCCGGTGCCAGCGTCGCCGCCACCGCCGCCGCGAAT
+TCGACGTCGGAGCTAGATTCGCCCGCGTCGTCTAAGGCTCGCGCCGCGTCCCACACCGCGGCGGTGGCCC
+GCTCGGTGTCAGCGATCATCTCGGCGCACTTGTGCTTGATCGCCTGGAATTGCCCGATCGGCCGGCCGAA
+TTGTTCGCGGATCTTGGCATATGCCGACGCGGTGTCGGTCGCCCACCGCGCGACGCCAACGGCTTCAGCG
+GACAGCAGGGTGGACATCAGCGCGTGAGCGGTCGTCATCGTGAGGTTGCTCAGCAGGGCGTCGTCGCTGA
+CGTCGACCGCGTTGGCCCGAACATGCGCGATGGGCCGCAACGGATCCAGGCTCTTGACCGCTTCGATCTC
+GAGCTGATCGTTGCGCAGTACAACCCACTCGTCACGGCTTTCGATGGCCACCGGTAGCACCAGAACGGAG
+GCTTGCGCCGCGGCCGGAACCGCGCGGACTTCGCCCCGGATCACCAGCACGTCGCCATGGCGGGTGGCGG
+TCAGCCCGGAATCTAGCGCGTAGGCGGCGATGGCCGCACCGGTTGCCAGTTCGGCGAGGACTTTGGCTTG
+CGGATCATGGGCTGCGATCAGCGCGCTGGCGATCGCCGACGGCACGAACGGCCCGGGCACGGCGCCGTAG
+CCGAACTCGGCAAGCACCACCGCTAGCTCGAGGATGCCGAAACCCTGGCCGCCGACCGACTCGGCCAGAT
+GCACACCCTGCAAGCCTTGTTCGGCCGCGGCCTGCCAGTAAGGCGGCGGGTTTTCGACCGGTGATTCTAG
+CGCCGCGTGCAGCACCTCGGACGGCGCTACCCGCGCCACCAGGGAACGCACCGAATCGGCCAGCTCATAA
+TGCTCAGGAGTAATAGCGATCGACATTGCTCGCCTTCCCATGCTGTTGGACGTTTCGGCCAAGCACCTTC
+CAAGCTAACAACCGGTGGGTCGGTTATTAACGTTGGCTAGCGGATGGCCGGCGAAATGGGTGAGAACACT
+CAGCGCCACCGCTTGGCTATCCACTTGGCGATGGTGTCGGCCTGCTCGCTGCGGGCGCCCGGGGTGGTGA
+AGTAATGGTCGGTGTCGATCGAGACCTGAGTCTTGTCGCTGCTGGCGAGCCCGTCGTAGATCTGCTGGGC
+ATCCGACGGGAAGATTCCGGTGTCGGCCTCGGCGTTGAGCACCAGGGCCGGGCAGGTGATCCGGGCCAGG
+TGGGGTGCGGCACGGGTTTGGGCCACCCGCAGGCTCCACATGCCCAGCCAGCCGCGCAGCGTGCAGGCCG
+CGGCGATGCCGTGTGCGGAGCGGTTCGCCTTCACCGGCGTGCCCGCGTAGCACTGGTTGGGCCGACGCTT
+GGTCGGTTCGATGCTGGGATCGACCATGCGCGGGTCGGCCCAGGTACGCATCACGCTGAACGGCCGATCA
+GAAAAGCCAGCTGCGCGAACACGTTTGAGTTCGGATTCGGCCCAGTCGGTGATGGTGTGGTTGCGTTTGA
+CCTGCGCGGAGCGATACCGGCTGATAAACTCCGGTGAGTACGGCGGCCCGTTGCGTTCGTCGAACAGGTC
+AAGTTCGGGATCGGTTGCAACCGGATCATTTTCGTCAATGACGGCGGCGTCCATCCAAGCGGTGAGCACA
+TCCGGACGGCCGAGATGAGCTGCGGCGGCAACGTATGCGTCGGCGGCCGGCAATTCGGTTACCCCGGCTG
+CGGGTCGCATACCGTCCAGGGGAGTCACGTTCGGATCGACCGCTTGTGATTGGTAGGCGGCCATCAATGA
+GCCACCACCTGAATTGCCAAGCAACACCACTGTTTCCACGCCCTGAACTTCGCGGAGCCAGCGCACCCCG
+ACGCCGATGTCGACCAGTGCGTGATCGAGCAGAAAGCTGCTTTCGAAACCACGGAATCGGGTGTTCCAGC
+CCAGAAACCCGATGCCGCGGATCGCCATGTACTCGGCGAGATAGTGCTCGGAGAAATCGATCTGGTAGTG
+CGCGGCGATGAGCGCCACCTTCGGTTTGCGTCCCACGCTGTGGTGGTACAGCCCCTGGCATGGGTGCCCA
+CCGGCAGCCGCACGCCCCGCGGTTCGCGACGGCAGCCCGACGAACTCTCGGATGACCCCGGGCGTGGCAG
+CACGACCAGTCAATTTGAGCTGTCCTCCTTACTGTAGATGGCGCGGTAGTAAATGTTGGCCAAGGTCTGG
+ATGCACGCCTGATCGTCAGGTTGTCCACGGCGTGAACGCTTACCGCTGAGCTGCAGGTAGCAAAACTGGT
+TGAACATTGCCACAATCGCCTCGGCCATCAACTGGGGGTCATCGCCGACGCAATAGCCGTGCGCCTGAGC
+GCGTTTGACCGTCTCGGTGATGAACGATATTGGAATCTGGCATATTTCGGACCAGTATTGCGCGAAGTCG
+TCACTGACCATCGCCAACTGTGACACGCTGATCGCTTCTGCGAGGCGGTTGCGGTAGGTGTACCAATGGG
+CGGCAGCGGCTTCATACGCGCGCTCGCGGTCGGATAGGCCGTGCCGGATCACCGACAATGCCCGCTGGTT
+GGCGTCGTCGCGGAAGCGCAGCGCCCACTGCCGGACCATCGCCTCTTTGGAGTCGTAGTAGTTGTAAAAG
+GATGCCGCCGAGCGGCCGGCTTCGGCGGTGATGTCGGCGACGGTGGTCGCCAGGATTCCGTTGCGCACCA
+CGACCGTCCGCGCGGCGGCGTCGATTGCGGCCTGGGTCCGCCGACCGCGTTGCGTCGGGAAGTCCGGCAC
+CTGGGCACCTCCCTGGAACAAAACTGAACCTGATGTTAGATTCAGATTCAGAGCTTGGCCAGGCCGCCGT
+CCCGGGGAGCCAATGGGAGCCGCACGATGATCAAGCCGCACAACACCAACACCGAATTCGAGCTTGGTGG
+GATCAACCACGTCGCGCTGGTGTGTTCGGACATGGCGCGCACCGTGGACTTCTACAGCAACATCCTGGGG
+ATGCCGCTGATCAAGGCGCTCGATCTGCCCGGCGGCCAAGGGCAGCACTTCTTCTTTGACGCCGGCAACG
+GCGATTGTGTCGCCTTCTTCTGGTTCGCCGATGCACCTGATCGGGTGCCCGGTCTTTCGTCGCCGGTTGC
+CATCCCCGGCATCGGCGACATCACCAGCGCGGTGAGCACCATGAACCATCTGGCGTTTCATGTACCCGCC
+GAAAGGTTCGACGCCTACCGGCAGCGGCTCAAGGACAAAGGCGTGCGGGTCGGCCCGGTGCTCAACCATG
+ACGACAGCGAGACGCAGGTGTCCGCGGTGGTGCATCCCGGTGTGTACGTACGCTCGTTCTACTTCCAGGA
+CCCCGATGGGATAACTCTGGAATTCGCTTGCTGGACAAAGGAATTCACTACGAGCGACGCGCAGGCCGTG
+CCGAAGACGGCGGCTGACCGGCGACCTCCGGTGGCTGCGGATCGTTAGCCCCGGATTTGGCAGCTGTTGC
+CGCTACCCGGGGACGGGACAAGTTTGGGTCGGTGAGTTCATCGAGCAGCGCAGCTAGCTGATCGACCAGC
+TGGTCGGGATCGAGTCGCACGTCACCGGCCAGCCAGGCGCTGATGGTCTGCCCGACGCCGCCGACGGCGA
+AGTGTGCGACCGCCTTGACGTGGTCATTTGCCGGTGCGTGCAGGGTGTCGACGGCATGTTGGCCGGACAG
+CATGGCGAACAGGGCGCTGGATTCCGCACGCTTGCGGGTGATCACTGCGTTGGCCAGCTGTGTGCTGAAC
+AGCAGGCGTCCGACGCGGGCGTCTGCGGTGATGGTCCGCACGATGTTGGCCATGCCCGCGCGAGTCTGCT
+CCCGCGCCGGTACCGCCGTGACCGCGGCCTGAGTGGTGGCGACCAGCTCGGCCACCACCCAGTCGAACAC
+GCGGCCGACGAATTCGTCCTTGTCGGTGAAGCTTTCGTAGAAGTAGCGCACCGACAGGCCGGCCCGCCGG
+CAAATGGTGCGGATGGTTAGCTCGGCGATGTCGTGCTGGTCGGACCCCAACAGGTCCAGGCCGGCAGAGA
+GCAACTGGCGACGGCGCGTCGCCAGTCGCTCGGCGGCCTCGACGCCGCGGTAGGGTCGATCACTGCGCGT
+CATACGGATCATCTTGACACTCGGGCACGATACCGGCCAATATCAGGATACAGGTGTTTCCATAATTAGC
+GGCAGCGCCGGGAGGCCTTCGGATGGCGATTTCGCTGGTGGCTCACCAGCCCATCCCCCACGTCGAGCGT
+CCCATGGCCGACCCACCCCGTCTCCAGCTGGCCAGGCGCCGGCGATCGGCGGCCGGCCCCGGCGGTAACG
+AGGACAGCTTGATGGGAGTGGCGCTGCTAGCCGGCCCGGCCAACGTGATCATGGAGTTGGCGATGCCGGG
+TGTCGGCTACGGCGTGTTGGAGAGCCGTGTCGAAAGCGGCCGGCTGGACCGCCATCCGATCAAGCGGGCG
+CGCACCACCTTTACCTACGTTGCGGTGGCCGTTGCCGGCAGCGACGACCAGAAGGCGGCCTTTCGTCGCG
+CGGTGAATAAGGTTCACGCGCAGGTGTATTCGACTCCGGAGAGCCCGGTGTCCTACCACGCGTTCGATCC
+CGAACTACAGCTGTGGGTGGCGGCATGCCTCTATAAGGGCGGCGTCGACGTCTACCGCACCTTCGTCGGC
+GAGATGGACGACGAAGAGGCCGACCATCATTACCGCGCGGGCATGGCGATGGGCACCACGTTGCAGGTGC
+CGCCGCAGATGTGGCCACCGGATCGGGCGGCCTTCGACCGCTACTGGCGGCAATCACTGGACAGGGTGCA
+CATCGATGACGTCGTTCGCGACTACCTGTATCCGATCGTGGCGCTCCGAATTCGCGGGATCGCACTGCCG
+GGTCCGCTGCGGCGGCTGTCGGAGGGTATCGCGCTGCTGATCACCACCGGTTTCCTGCCGCAGCGGTTTC
+GCGACGAGATGCGGTTGCCGTGGGACGCGACCAAGCAGCGGCGCTTTGACGCGCTCATGGCCGTGCTGCG
+CACGGTGAATCGCCTGATGCCGCGGTTTGTCCGGGAGTTCCCGTTCAACCTGATGCTCTGGGACCTGGAC
+CGGCGGATGAGGCGCGGGCGCCCGCTGGTGTAATCGCCGGCTTCGCGTGGACCGTTGCCGGTAGACCGCT
+CGCTAGATTGGCGGGCGAATATGGCGCACAGAGGCAAACCGGGCGAAATCCCTATCCAGGCTCACCACGG
+CGCAGTGATGCTCCACGGCGATGGCCCCGAGTACCGCGTCAGGTATCAAGTCGCCCGATGCGTCGGCCTC
+GTCGCAGAGTTTTCGCAGCAGCACCAGGTGTCTGGGGCCGGGGCTTGTCGGAAGGTGATGGGGCTGGGCG
+TTGACGGCTTCGACGAATGCGAATGCATCCGCTCGTGGTGACGGAATCTCGAAGATGCGTCGATTCGTTG
+TTAGCCGGAGGAACGACGCCCACACTAGGTTCGGCACTGTGAAGGGGTCGTCGGCCGCAAGCAGTCGATC
+GAACCAGGGGCGGACGGTTCGGTGATTCGGATGGTCACCGCGGTGTGCAGCCAGCAGCACGTTGACGTCG
+ATGAGGAACATCGCCTATTTGTGCCTGTCCAGGCTCACTTCCGCGAGTTCAGTTCCAGACCCTCGTCGAG
+CACTTCGGACAACACCCTATTCGAGGTTAGGTCGATACCTGGCCGCGGACCGGTGCCGGCGTCAAAAACG
+GGGACGGTTGGCCGGGCGCCGCCGGTGCGGGCGGCGGCGAGCTCCCGCCGAAGGGCGTCTTCGATCACAG
+CGCCCAGCGATTAACCACGCTCGCGGGCCCGGCGTTTGGCGGTAGCCAGTAGTTCATCGGAGATTGACAC
+GGTGGTGCGCATGATGCTCAGGATAGCGCATCTACGGCATCATCTGCGGTGAGCAACTGATGCCCTCAAC
+GCCGCGTGTGGTCGCAGGTCTGCCTGCTATGGCAAGCCGTTGAGTCCGTTCTCGCCGAGCAGCAGCCCGC
+CGGTGCCGCCGGCACCGGGCGTGGCCCCGGCTTTGCCGGCGTTGCCGCCGTTGCCGCCGTTGCCGATCAG
+CACGGCGTTGCCGCCGACACCACCGCTGCCGCCGGTACCGGCGCCAAACCCGCCGGCACCCCCGTCACCG
+CCGTTGCCGAACACCCCGGCGTGGCCACCGTCACCGCCGGTGCCGCCGGTACCGGCGCCTAGAGCGTTGG
+CACCGCTGCCGCCGGCGCCGCCGGCGCCGGCGGAGCCGAAGAGCAAGCCGCCGTTCCCGCCGGCGCCGCC
+GGCGCCGCCTTGCTGGATGCTGGTAAGTGCTGCCCCGCCGTGCCCGCCGGCGCCGCCGGCGCCGCCGAAG
+CCGAAGAGTAAGGCGCCGTTCCCGCCGGTTCCGCCGGCCCCGCCGGCAAGGGAGCTGGCGCCACCGCTGC
+CGCCGGCGCCACCGGAGGCGCCGAGGGAGAGTAGGCCGGCGTTGCCGCCGTGCCCGCCGCCGCCGGTGGT
+GATCCCGGACCCTCCCGAGCCGGCGGCGCCGCCGGTGCCGCCGGCTCCGAACAGTCCGCCGTTCCCGCCG
+TTCCCACCGGCCCCGAAGTTCGTGCCGGCCCCGCCGGTGCCGCCAGTTCCGAACAGTCCGCCGTTCCCGC
+CGTTCCCGCCGGCTGCGTTGAACCCGCCGGCCCCTCCGGCTCCGCCGTTGGCGAACAGTCCGCCGTTGCC
+GCCGGCGCCGCCGACGCCGGCCGGGACACCGCCAGCGGCGCCGTGGCCGCCGGTGCCGGCCGCGCCGAAG
+AGCAAACCGGCGTCGCCGCCGCGCCCGCCGGCCCCGCCGATGCCAGCGACGCCTATGGAGTTCCCACCGT
+TGCCGCCGGTGCCGCCGGAGCCGATCAGCAAGGAGACCCCACCGGCGCCGCCGGCCCCGCCGATCCCTCC
+AGCACCGGTGGCTATCCCGCCGGTCCCGCCATTGCCACCGGTACCGAACAAGATCCCGCCGGCCCCGCCG
+GCCCCGCCCGTAGCCGTGGCGGCGGTGTTGGTCGCACCGTGCCCGCCGTTACCGCCGTTGCCGAACAACC
+ACCCGCCGGCCCCGCCGGCAGCCCCGGTCCCCGGGGTCCCGTTGGCGCCGTTGCCGATCAGCGGACGCCC
+AGTCAATGTCTGGAAGGGCTCATTCACCACATTGAGCGCTGCCTGCTGCAGGGTATGGACTGAGGTGCTG
+ACTGGAGCATTGGATCCGTCTAGTCCTATTAGCTGCCCGCCGAGGCCGCCGAGGCCGGCCTTGCCCGCGG
+CTGCGCCGGTCCCGCCGCTGCCGCCGTTGCCGCCGTTGCCGATCTGCACGCCGTTACCGCCCGCTCCGCC
+GTTGCCGCCGGTGCCGGTCACGCTGGCGCCGCCGTCACCGCCGTTGCCGCCGTTGCCGATCAAACCGGGT
+ATGCCACCGGCCCCGCCGGTGCCGCCTGGACCGGTGATAGCAGCGCCGCCGGCGCCGCCGGCGCCGCCGG
+AGCCGTTGAGCAGGCCGGCGTTGCCGCCGGTGCCTCCTATCCCGCCGGTGGTGCGGCCGAACCCGCCGGC
+GCCGCCGGCGCCGCCGTCCCCGCCGGTGGTAGCGCCGCCCCCACCACTGCCGCCGGTGCCGCCGGCGCCG
+AACAGTCCGCCGGCCCCGCCGGCCCCGCCGGCCCCGCCCATCCCGGCGACACCGGCGCCGATGGTGCCGC
+CGGCCCCGCCGGTGCCGCCGGCGCCGAACAGTCCGCCGTTTCCGCCGGCCCCGCCGGCCCCGCCGAACCC
+GCCTTTTCCGCCCACCCCACCGACCCCGCCGTCGGTGAACATCCCGCCGGCCCCGCCCGCACCGCCGGCC
+CCGCCGGAGGCGGTGGTGGCCAATGCGAACCCGCCGGCGCCGCCGACCCCGGCGGCGCCGAAGAGCAGGC
+CGGCGTTGCCGCCGTCCCCGCCCGCACCACCGGCCCCGCCGGTGGTGTTCGTTGAGGCTCCGCCGGCTCC
+GCCGGCGCCGAACAACACGGCGTTCCCGCCGGTACCGCCGGCCCCGCCGATCCCGCCGGTGTTGGTGGCG
+ACCCCGCCGGCGCCGCCCGCCCCGCCGCTGCCGAGCAGCCCACTGGCCCCGCCGGCCCCGCCAGTCCCGC
+CGGTGCCCCCAACGGCGTTGTTCGCCGCGCCGGATCCGCCGGCGCCGCCGTTGCCGATCAACCAGCCGCC
+GGGCGCGCCGTCGGCCCCGGTGCCGGGGGCGCCGTTGGCGCCGTTGCCGATCAGCGGGCGCCCGGTATTC
+GCCAGGAAGAACTCGTTGATCGGGGCGAGCAGCGGCGAGGTGGCGGCGGCCTCGGCGGCGGCGTACGCGC
+CGCCACCGGAGGTCAACGCCTGCGTGAACTGGGCATGAAACGCCTGCGCTTGGGCGCTGAGCGCCTGATA
+GGCCTGGCCGTGGGCGCCGAACAGCGCCGCAACCGCCGTCGAGACTTCATCGGCACCCGCGGCCAGCAGT
+GCTGTGGTGTTGGCCGCCGCGGCCGCGTTGGCCGCGGCGATGCTCGACTCGAGACTGGCTAAATCCGTTG
+CCGCTGCCGCGATAACCTCTGGCGCCGCAATCACAAACGACATCTGACACCTCCCGACGGGCATCACCGC
+TCTGTCGCGCCGACCTGGGCCTCCCCGGTCACCAGTGAAAATCGGCTGTAAGAAGCATCCCATTTCGAGG
+GGCAACACCTGGGGGGTTTGTCGAATTCTGGTAGGTAACTTCGCGGGCCGGGTAAACCCGGTGCGTCCTG
+TCAGGTGAGTCGAGGGCAGCCCGCAGGCTGATGCTGGGGTATCTGGGCCGGCCGACCATGGCTGGCCGGC
+GGGTGTTCTGAGGGCCGGTTCGCTGGCTATGGCAGGCCGTTGAGCCCGTTCTCGCCGATCAGCAGCCCGC
+TGGTGCCGCCCGCGCCCGGCGTGCCGCCGGCTTTCCCGCCGTTGCCGCCGTTGCCGCCGTTGCCGATCAG
+CACGGCGTTGCCGCCGACACCGCCATTGCCGCCGGTACCGGCGCCAAACCCGCCGGCACCGCCGTCGCCG
+CCGTTGCCGAACACCCCGGCCGTACCGCCGTTGCCGCCGACCCCGCCCTTGGCGGCACCGCTGGCGCCGC
+CGGTCCCGCCGGAGCCGCCGGAGCCGGAGAGCATGCCGGCGTTGCCGCCGGCCCCGCCGGCCCCACCAGC
+GCCGATGTTGCTGTACCCGCCGGCGCCGCCGGCGCCGCCGTAGCCGAAGAGCAAGCCGCCGGCTCCGCCG
+ACCCCACCGATCCCGCCGCTGTCGGTCAAGCTGGAGCCGCCGCTACCGCCGGCGCCACCCGAAGCGCCCA
+GGGAGAACAAGCCCGCGTTGCCGCCGGCCCCGCCGGCGCCGCCGGGGACCGCGGCGGGGGTACCGTGGCC
+GCCGGAGCCGCCGGTGCCGCCGGCGCCGAACAGCCCACCGTTCCCGCCGGCACCACCGGCCCCCGGGCCG
+AGGGAGCCGCCGGCGCCGCCGGTGCCGCCGGCGCCGAACAGCCCGCCGTTCCCGCCGGCCCCGCCTGTCC
+CCGCATCTCCGCCCAACCCGCCGCTCCCGCCGGCCCCGCCGTTGGCAAACAGCCCGCCGTTCCCGCCGGT
+GCCGCCGGTGCCGCCGGCTTTAGTGCTGGCGCCGGCCCCGCCGGTTCCGGCGGCGCCGAAGAACGATCCG
+GCGTTACCGCCGTCCCCGCCGTCCCCACCGGCGGTGAGGCCGGCGCCGCCGCTGCCGCCGTTACCGCCGG
+AGCCCACCAAGAAGGCCGCCCCACCGGCGCCGCCGTCCCCGCCGGTGCCCGTCGTGCCGACGCCGCCGGC
+CCCGCCGGTGCCGCCGGTGCCGAAGAAGATCCCGCCGGCGCCGCCGTCCCCACCGTCCCCGCCGTTGGTT
+CCGGTCGCCCCGGACCCGCCGTTGCCGCCGTTGCCGAACAGCCACCCGCCGGCCCCGCCGTCAGCCCCGG
+TTCCAGGAGTCCCGTTGGCGCCGTTGCCGATCAGCGGGCGGCCGGTGAGCGTCTGGAAGGGCTCGTTCAC
+CACATTGAGCACATTTTGCTGCAGGGTGTGCAGTGGCGAGGTGCTCGCGGGAGCATTGAATCCGTCTAGA
+CCGAGCAGCAGCCCGCTGACGCCGCCCACTCCGGCCTTGCCCGCGCCAATCCCACCGCTACCGCCGTTAC
+CGCCATTGCCGATCAACACGCCGGTGCCGCCGATCCCGCCGTTGCCGCCGGTCACCGCGCTGGCGCCACC
+GTTACCGCCGTTGCCGCCGTTACCGATCAGCCCGGGGGTGCCGCCAGCCCCACCGATCCCGCCGGCGAAG
+CCCTGGCCAACTCCGCCGTTGCCGCCGGCGCCGCCGGAGCCGAAGACCGTGCCGGCGTTGCCCCCGGGGC
+CGCCTTGCCCGCCGTCGGCGAAGCCGAATCCGCCGGCGCCGCCGGAGCCGCCGGAGCCGAAGAGCAGCCC
+AGCGTTGCCGCCGGCGCCGCCGGCGCCGCCTATGCCGCCGGCCGTGAGAGTACCGCCGTCCCCACCGATT
+CCGCCGGCGCCGCCCGCGGCGCCGAGGGCGAGCATGCCGGCATTGCCGCCGGCCCCGCCGTCCCCGCCGG
+CGACCAGGCTGTGTCCGCCGCTGCCGCCTTCCCCGCCTGCGCCGAACAGCCCGCCGGCCCCGCCGGCCCC
+GCCGACTCCGCCGAAGCTGCTGTCGGCGAACCCGCCATGCCCGCCGGTGCCGCCGGCGCCGAACAGCCCG
+CCAGCGCCACCGGCCCCACCGGCCCCGCCGGAGCTGCCGGCCCCACCGGATCCGCCGACCCCGCCGGTGG
+CGAACAGCCCGCCGGCCCCGCCGGCGCCGCCCGCCCCGCCGAGTGCACTGCCGTTCGTGAATCCGCCGGC
+CCCGCCCGTGAGGGCTACTACGCCGCCGCCGGCGCCGCCGGCGCCGCCGGCGCCGAACAGCATGGCGTTG
+CCGCCGGCTCCGCCGGACCCGCCGATCCCACTGCTGGCGACCCCGCCAGCGCCGCCGGCGCCGCCGTTGC
+CGATGAGCCCGCCGGCGCCGCCGTTGCCGCCGGCGCCGCCGTTGACGCCGGCCGCGCCGGATCCTCCGGC
+GCCGCCGTTGCCGATTAACCAGCCGCCGTCCCCGCCATTGGCCCCGGTGCCGGGGGCGCCGTTGGCGCCG
+TTGCCGATCAACGGGCGCCCGGTATTCGCCAGGAAGAACTCGTTGATCGGATCCAGCAGCGGCGACACCG
+CGGCGGCCTCGGCGGCCGCATAGGCGCCGCCACCGGAGGTCAATGCCTGCACGAACTGGGCATGAAACGC
+CTGCGCTTGGGCGCTGAGCGCCTGATAGGCCTGGCCGTGGGCGCCGAACAGCGCGGCGATGGCTGTCGAC
+ACCTCGTCGGCGCCCGCGGCCATCAGTGCCGTGGTGTTGGCCGCCGCGGCTGCGTTTGCCGCGCTGATGC
+TCGATCCGAGACTGGCCAAATCCGTTGCCGCTGCCGCGATAACCTCTGGCGCCGCAATCACAAACGACAT
+CTGACACCTCCCAATACGCATGACCGCTCTGTCATGCCGACCCGGGGAACGTCACCAGCAAAAATCGGCA
+GTAAGAAGCATCCCATTTCCAGCGACAACACCTGGGGGGTTTTGGTCAAACTCTGGTAAGCGACTTCGTG
+TACCGGGTGAACCCGGTGTGTCTTGAAGGACAGCCCGCAGGCTGATGCTGGGGGATCTGGGCCGGCCGAC
+CATGGCTGGCCGGCTGTTGGTCTGATGGCCGGTTCGCGGTTACAGGCCGTTGAGCCCGTTCTCGCCGATG
+ATCAGCCCGCTGGTGCCGCCGGCGCCGGGTGTGCCGCCGGCTTTCCCGCCGTTGCCGCCGTTGCCGCCGT
+TGCCGATCAGCACGGCGTTGCCGCCGGTGCCGCCGGTGCCGCCGGCACCGGTGCCAAACCCGCCGGCGCC
+GCCGTCGCCGCCGTTGCCGAACACCCCGGCCGTACCGCCGTCACCGCCGGTGCCGCCGCTGCTGCCGATG
+CCGCTGGAGCCACCGGTGCCGCCGGCACCGCCGAAGCCGAAGAGCGAGCCGCCACTGCCGCCGTTCCCGC
+CGACCCCGCCGGTCCCGCCGACATTTAAGGCGCTGCCGCCGCTGCCGCCGGCGCCGCCGGAGGCGCCGAG
+GGCGAGTAGGCCGGCGTTGCCGCCGCTGCCGCCGTTGCCGCCGAAGGTGCCGCCGCTGCTGCCGCCAGCA
+CCGCCAGTGCCGCCGGCGCCGAACAGCCCGCCGTGCCCCCCGGCGCCGCCGTCGGCGCCGAGCGTGCCCG
+CCCCGCCGGTGCCGCCGGCGCCGAAGAGCAATCCGTTCCCCCCGGTCCCGCCATTCGCGCCAAACCCGCC
+GGCCCCGCCGTTGGCGAACAGCCCACCGGTACCACCGGCTCCGGCGGTGCCGCCGGCACCGATAAAGTTT
+TGGGAGAGGGCGGCCTGGCCGCCGGTCCCTGCGGCACCGAGGAACAAGCCGGCGTCACCGCCGCGCCCGC
+CGGCCCCGCCGGTGTCCAGGCCAAACCCGCCGCTGCCGCCGGTGCCGCCGGAGCCGATCAGCAAGGCGGC
+TCCGCCGGTCCCGCCGGTCCCGCCTTGGCCCGTCGTTCCGATGCCGCCGGACCCGCCGGTGCCGCCAATA
+CCTGACAGGATTCCGCCGGCCCCGCCGGATCCGCCGTCTCCGCCGTCGGCGCCGGTCGCTCCGTGGCCGC
+CGTTGCCGCCGTTGCCGAACAACCACCCGCCGGCCCCACCGTCGGCCCCGGTCCCCGGAGTGCCGTTGGC
+GCCGTTGCCGATCAGCGGTCGCCCGGTGAGGGCTTGGGTGGGCTCGTTGATCGCGTTGAGGATTTGTTGC
+TGCAGGGTGTGCAGTGGCGTGCTGGCGGGGGCGTTGAATCCGTCTCGACCTAGTAGCTGCCCGCCTAAGC
+CGCCGGCGCCGGCCGTGCCGGCGGGTGCGCCAGTGCCGCCACTACCACCGTTACCGCCATTGCCGATCAG
+CACGCCGCTTCCGCCGGCGCCGCCGGCGGCACCGGCGCCGTTCGCGCTGGCGCCGCCGTTGCCGCCGTTG
+CCGGCGTTGCCGACGAGCCCGGGCGCGCCGCCGGCCCCACCGGTTCCGCCGGCGCCCGCGAAGGACCCGC
+CGCCGGCGCCGCCGGCACCGCCCGCCCCGCTGAGCAGACCCGCCTTTCCGCCGGCGCCGCCCGCCCCGCC
+GGCGTCGAAGCCCAGCCCGCCGACGCCGCCGGCGCCGCCGGAGCCGAACAACGTGCCGCCGTCGCCTCCG
+ATCCCACCGGCACCGCCGCCACCGTCCGGGCTGGATCCGCCGCTGCCGCCGGCGCCGCCGGCGGCACCGA
+GGCTGAGCATGCCGGCGTCGCCGCCGGCCCCACCGTTCCCGCCGACGTTGATTATGCTCGTCCCGCCACT
+ACCGCCGGTGCCGCCGGCGCCGAACAGCCCGCCAGAGCCGCCATCCCCGCCGGCGCCGCCGCCAAAGATG
+CCGAATCCGCCGGGCCCACCGGTGCCGCCGGCGCCGAACAGCCCGCCGTTTCCGCCGGATCCGCCGGCCC
+CGCCGGTGCCGGCGTCGGTTGCCCCGCCGGCGCCACCGACCCCGCCGTCGGCGAACAGCCCGCCGTTTCC
+GCCGGCCCCGCCGGCGCCGCCGGTGGCGCCGAAGGCGGCTGCGAATCCGCCGGGACCGCCGACCCCGGCG
+GCCCCGAACAGCATGCCGGCGGCCCCGCCGGCGCCGCCGGTCCCCGTGCTGGCCCTCCCGCCGGCGCCGC
+CGGCGCCGCCGTTGCCGATGAGCCCGCCGGCGCCGCCGTTGCCGCCGGCCCCGCCGTTGACGCCGGCCGC
+GCCGGATCCTCCGGCGCCGCCGTTGCCGATCAACCAGCCGCCGGGCGCGCCGTCGGCCCCGGTGCCGGGG
+GCGCCGTTGGCGCCGTTGCCGATCAGCGGGCGCCCGGTATTCGCCAGGAAGAACTCGTTGATCGGGGCGA
+GCAGCGGCGAGGTGGCGGCGGCCTCGGCGGCGGCGTACGCGCCGCCACCGGAGGTCAACGCCTGCACGAA
+CTGGGCATGAAACGCCTGCGCTTGGGCGCTGAGCGCCTGATAGGCCTGGCCGTGGGCGCCGAACAGCGCC
+GCAACCGCCGTCGAGACTTCATCGGCACCCGCGGCCAGCAGTGCTGTGGTGTTGGCCGCCGCGGCCGCGT
+TGGCCGCGGCGATGCTCGACTCGAGACTGGCTAAATCCGTTGCCGCTGCCGCGATAACCTCTGGCGCCGC
+AATCACAAACGACATCTGACACCTCCCGACGGGCATCACCGCTCTGTCATGCCGACCCGGGGAACGTCAC
+CAGCAAAAATCGGCGGGCTACAGAATAACTCCGGCCCGGGAAAGGGATTTGGTATTTCCCAAAATATCTC
+CCACATTTATGCGGTCGGCGCGTCGGCCGACGGGAGCTGGCAGCACCCGTGGGCCGGCGCCGAGCGTTCG
+CTGGTGTCCGGCTGGGACTTGCATTGCGGCGCGCCGTGGTGTGGAATAGTGGTAATGAAAATCATGTTCA
+TCAGTCCTCTGTGGTGTTTACGGCTATGACGCTGTGGATGGCCTCGCCGCCCGAGGTGCATTCGGCGTTG
+CTCAGCAGCGGGCCGGGGCCGGGCTCGGTGTTGTCGGCGGCCGGGGTGTGGTCGTCGCTGAGCGCCGAAT
+ACGCCGCGGTCGCCGACGAGCTCATAGGGCTGCTGGGCGCCGTGCAGACCGGCGCTTGGCAGGGGCCCAG
+CGCCGCGGCTTATGTGGCCGCCCACGCGCCGTACCTCGCGTGGTTAATGCGGGCCAGCGAAACCAGCGCG
+GAAGCGGCCGCCCGGCACGAGACCGTGGCCGCGGCCTACACGACCGCGGTGGCGGCCATGCCGACGTTGG
+TCGAGCTGGCCGCCAACCACACGCTTCACGGGGTCTTGGTGGCGACGAACTTCTTCGGCATCAACACCAT
+CCCGATCGCGCTCAACGAGGCCGACTACGCGCGGATGTGGACGCAGGCCGCCAGCACGATGGCGACCTAT
+CAAGCGGTCGCCGAGGCCGCGGTGGCGTCGGCACCGCAGACCACCCCGGCGCCGCCGATCTTGGCAGCCG
+AAGCGGCCGACGATGACCACGATCATGACCACGATCACGGGGGCGAACCGACCCCGCTGGACTATCTGGT
+CGCGGAGATATTGCGCATCATCAGCGGTGGGCGCCTGATCTGGGATCCCGCCGAGGGCACCATGAACGGA
+ATCCCGTTCGAAGATTATACGGACGCAGCCCAACCAATCTGGTGGGTTGTTCGTGCCATCGAATTCAGTA
+AGGACTTTGAAACGTTTGTTCAGGAACTGTTTGTCAATCCGGTGGAGGCATTTCAGTTCTACTTTGAGCT
+TCTATTGTTCGACTACCCGACCCACATTGTGCAGATTGTTGAGGCGTTGAGCCAGTCCCCGCAGTTGCTG
+GCGGTCGCACTCGGTTCCGTCATCTCCAACTTGGGTGCGGTGACCGGGTTCGCCGGGCTATCCGGCTTGG
+CCGGCATGCAGCCGGCGGCTATCCCGGCGCTAGCACCCGTCGCGGCGGCCCCGCCGACATTGCCGGCGGT
+CGCGATGGCCCCGACCATGGCCGCGCCGGGCGCGGCGGTTGCGTCGGCAGCCGCGCCGGCGTCCGCGCCG
+GCGGCCAGCACGGTGGCCAGCGCCACGCCGGCACCGCCGCCGGCACCCGGCGCCGCCGGGTTCGGCTATC
+CCTACGCCATCGCTCCGCCCGGCATCGGGTTCGGCTCGGGGATGAGCGCCAGCGCCAGCGCTCAACGCAA
+GGCACCACAGCCCGATAGTGCGGCGGCGGCGGCGGCCGCGGCGGCCGTACGTGACCAAGCGCGGGCGCGG
+CGGCGGCGCCGTGTCACGCGGCGCGGATACGGCGACGAGTTTATGGATATGAACATCGACGTCGATCCGG
+ACTGGGGCCCTCCGCCCGGCGAAGACCCAGTCACATCCACGGTGGCCTCGGATCGGGGTGCCGGACATCT
+GGGCTTTGCCGGGACGGCCCGCAGGGAGGCGGTTGCCGACGCGGCCGGGATGACCACGCTGGCTGGCGAT
+GATTTCGGCGACGGGCCAACGACGCCAATGGTGCCGGGTTCGTGGGATCCGGACCGGGATGCGCCTGGCT
+CGGCGGAGCCTGGAGATCGGGGCTGAGCTAGCCGCGTAGGGTCGATTGGGTGCGTACCGAAGGTGATAGC
+TGGGACATCACAACGAGTGTCGGTTCGACCGCGCTGTTTGTCGCGACGGCGCGAGCGCTGGAAGCCCAGA
+AGTCCGACCCGCTGGTCGTCGACCCATATGCGGAGGCGTTCTGCCGTGCCGTCGGCGGTTCGTGGGCCGA
+TGTGCTCGACGGCAAGCTTCCCGACCACAAGTTGAAGAGCACCGATTTCGGCGAGCACTTCGTCAACTTC
+CAGGGTGCCCGCACCAAGTATTTCGACGAGTATTTCCGTCGGGCCGCCGCCGCCGGCGCGCGGCAGGTGG
+TCATCCTGGCGGCGGGGCTGGACTCGCGCGCGTACCGGCTGCCTTGGCCCGACGGGACCACGGTTTTTGA
+GCTGGACCGCCCGCAGGTCCTTGATTTCAAGCGCGAGGTGCTCGCCAGCCACGGTGCCCAACCGCGCGCC
+CTGCGCCGCGAGATCGCCGTCGACCTGCGTGACGATTGGCCACAAGCCTTGCGGGACAGTGGTTTCGATG
+CGGCTGCACCGTCGGCATGGATTGCCGAAGGGCTGCTGATCTATCTCCCGGCCACCGCCCAGGAGCGGCT
+ATTCACCGGCATCGATGCCCTGGCCGGGCGCCGAAGCCACGTCGCCGTCGAGGATGGTGCCCCAATGGGG
+CCAGACGAATATGCGGCTAAGGTCGAAGAGGAGCGCGCCGCGATCGCCGAGGGAGCCGAGGAGCACCCGT
+TTTTTCAACTGGTCTACAACGAGCGATGCGCGCCGGCCGCCGAGTGGTTCGGCGAGCGAGGTTGGACCGC
+GGTCGCTACGCTGTTGAACGACTACCTCGAAGCGGTGGGTCGCCCGGTACCCGGACCGGAATCCGAAGCC
+GGGCCGATGTTCGCCCGCAACACCCTGGTCAGTGCCGCCCGCGTCTGACGGCGCACCGTTCGCGCTGCCG
+GCACCCCGGGCTCCATAATGAAAATCATGTTCAGTAAGCTACACTCTGCATATCGGGCTACCAACGAAAT
+GGAGTATCGGTCATGATCTTGCCAGCCGTGCCTAAAAGCTTGGCCGCAGGGCCGAGTCGATTGGTCGCGG
+TCGCCTCGACAGTTAGCTTATGCAATGCTAACTTCGGGGCAAAGTTCAGGCGGATCGGCCGATGGCGGGC
+GTAGGTGCAGGAGACAGCGGAGGCGTGGAGCGTGATGACATTGGCATGGTGGCCGCTTCCCCCGTCGCGT
+CTCGGGTAAATGGCAAGGTAGACGCTGACGTCGTCGGTCGATTTGCCACCTGCTGCCGTGCCCTGGGCAT
+CGCGGTTTACCAGCGTAAACGTCCGCCGGACCTGGCTGCCGCCCGGTCTGGTTTCGCCGCGCTGACCCGC
+GTCGCCCATGACCAGTGCGACGCCTGGACCGGGCTGGCCGCTGCCGGCGACCAGTCCATCGGGGTGCTGG
+AAGCCGCCTCGCGCACGGCGACCACGGCTGGTGTGTTGCAGCGGCAGGTGGAACTGGCCGATAACGCCTT
+GGGCTTCCTGTACGACACCGGGCTGTACCTGCGTTTTCGTGCCACCGGACCTGACGATTTCCACCTCGCG
+TATGCCGCTGCGTTGGCTTCGACGGGCGGGCCGGAGGAGTTTGCCAAGGCCAATCACGTGGTGTCCGGTA
+TCACCGAGCGCCGCGCCGGCTGGCGTGCCGCCCGTTGGCTCGCCGTGGTCATCAACTACCGCGCCGAGCG
+CTGGTCGGATGTCGTGAAGCTGCTCACTCCGATGGTTAATGATCCCGACCTCGACGAGGCCTTTTCGCAC
+GCGGCCAAGATCACCCTGGGCACCGCACTGGCCCGACTGGGCATGTTTGCCCCGGCGCTGTCTTATCTGG
+AGGAACCCGACGGTCCTGTCGCGGTCGCTGCTGTCGACGGTGCACTGGCCAAAGCGCTGGTGCTGCGCGC
+GCATGTGGATGAGGAGTCGGCCAGCGAAGTGCTGCAGGACTTGTATGCGGCTCACCCCGAAAACGAACAG
+GTCGAGCAGGCGCTGTCGGATACCAGCTTCGGGATCGTCACCACCACAGCCGGGCGGATCGAGGCCCGCA
+CCGATCCGTGGGATCCGGCGACCGAGCCCGGCGCGGAGGATTTCGTCGATCCCGCGGCCCACGAACGCAA
+GGCCGCGCTGCTGCACGAGGCCGAACTCCAACTCGCCGAGTTCATCGGCCTCGACGAGGTCAAACGCCAG
+GTGTCGCGGCTGAAGAGCTCAGTGGCCATGGAACTGGTCCGCAAGCAGCGTGGGCTCACGGTCGCCCAAC
+GCACGCACCACTTGGTGTTTGCCGGACCGCCCGGGACCGGCAAGACCACCATTGCCCGGGTGGTCGCCAA
+GATCTATTGCGGCCTTGGCTTGTTGAAGCGGGAGAACATCCGCGAGGTCCATCGCGCCGACCTCATCGGC
+CAACACATCGGCGAGACCGAGGCGAAAACCAACGCGATCATCGACAGCGCGCTGGACGGGGTGCTGTTCC
+TCGACGAGGCCTACGCCCTGGTGGCCACCGGCGCCAAGAACGACTTCGGGTTGGTGGCCATTGACACCTT
+GTTGGCCAGGATGGAAAACGACCGCGACCGGCTGGTGGTCATCATCGCCGGCTATCGCGCCGACCTGGAC
+AAATTCCTGGACACCAACGAGGGACTTCGGTCGCGTTTCACCCGCAACATCGACTTTCCCTCCTACACGT
+CCCATGAGCTGGTGGAGATCGCGCACAAGATGGCCGAACAGCGAGACAGCGTCTTCGAACAGTCCGCGCT
+GCACGATTTGGAGGCGTTGTTCGCCAAGTTGGCGGCGGAGTCGACACCAGATACCAACGGAATCTCGCGA
+CGTAGCCTCGACATCGCGGGCAATGGTCGGTTTGTGCGCAACATCGTCGAACGCTCCGAAGAAGAGCGTG
+AATTCCGGCTGGACCATTCCGAACATGCCGGATCCGGTGAGTTCAGCGACGAGGAGCTGATGACCATCAC
+GGCCGACGACGTGGGTAGATCGGTAGAGCCGCTATTGCGTGGCCTCGGGCTCTCGGTGCGGGCATGACGA
+ACCAGCAGCACGACCACGACTTCGACCACGACCGTCGCTCGTTCGCCTCCCGAACCCCGGTCAACAACAA
+CCCCGACAAGGTTGTCTACCGCCGCGGCTTCGTCACCCGCCATCAGGTGACGGGCTGGCGGTTCGTGATG
+CGCCGAATCGCCGCCGGAATCGCATTGCACGACACCCGCATGCTGGTCGACCCGTTGCGCACTCAGTCAC
+GCGCGGTGCTGATGGGTGTGCTGATTGTGATCACGGGGTTGATCGGCTCCTTCGTATTCTCGTTGATTCG
+GCCCAATGGGCAGGCGGGTAGCAACGCGGTGCTTGCCGACCGGTCCACCGCGGCGCTGTATGTGCGGGTG
+GGCGAGCAGCTGCACCCGGTGCTCAACCTGACCTCGGCCCGGCTGATCGTCGGCCGGCCGGTGAGCCCGA
+CGACGGTGAAAAGTACTGAGTTGGACCAGTTTCCGCGCGGAAACCTGATCGGCATCCCGGGTGCGCCGGA
+GCGGATGGTGCAGAACACCTCCACCGACGCGAACTGGACGGTGTGTGACGGCCTCAACGCACCGTCGCGG
+GGCGGTGCGGATGGCGTGGGTGTGACGGTGATTGCCGGCCCGCTGGAGGACACCGGCGCACGCGCGGCCG
+CGCTCGGGCCCGGGCAGGCGGTGCTGGTCGACAGCGGCGCCGGCACCTGGCTGTTGTGGGACGGCAAGCG
+CAGCCCGATTGATCTGGCCGATCATGCGGTCACCAGCGGCCTCGGCCTGGGCGCCGACGTGCCCGCGCCG
+CGGATCATCGCCTCGGGGCTGTTCAACGCGATACCCGAAGCACCGCCACTGACGGCGCCGATCATCCCGG
+ATGCCGGCAACCCGGCGAGCTTCGGTGTGCCGGCGCCGATCGGCGCGGTGGTGAGTTCCTACGCCCTGAA
+AGACTCGGGCAAGACCATATCGGACACCGTGCAGTACTACGCGGTGCTGCCGGACGGTTTGCAGCAGATT
+TCGCCGGTATTGGCGGCAATCCTGCGCAACAACAACTCCTATGGTCTGCAGCAGCCGCCTCGGCTGGGGG
+CCGACGAGGTCGCCAAGCTGCCGGTGTCGCGGGTGTTGGACACCAGGCGCTATCCCAGCGAGCCGGTAAG
+TCTCGTCGACGTTACCCGTGACCCCGTCACCTGCGCGTACTGGAGCAAGCCGGTGGGTGCGGCCACCAGC
+TCGTTGACTCTGTTGGCAGGCTCGGCGCTGCCGGTGCCAGATGCGGTGCACACCGTCGAGCTGGTCGGCG
+CCGGCAACGGTGGTGTGGCAACCCGAGTGGCGTTAGCGGCCGGTACTGGCTACTTCACCCAGACGGTGGG
+CGGCGGCCCAGATGCGCCGGGCGCCGGGTCGTTGTTCTGGGTGTCGGATACCGGGGTGCGTTACGGTATC
+GACAATGAGCCTCAGGGAGTGGCTGGAGGCGGCAAAGCGGTTGAGGCCCTTGGCCTGAACCCGCCCCCGG
+TCCCCATCCCGTGGTCGGTGCTGTCGCTGTTTGTGCCCGGCCCGACGCTGTCGCGTGCCGACGCGCTGCT
+GGCACACGACACCTTGGTGCCCGACAGCAGGCCCGCTCGTCCGGTATCGGCCGAGGGAGGGTACCGGTGA
+GCAGACTGATCTTTGAGGCTCGTCGCCGACTGGCGCCGCCGAGCAGCCACCAGGGCACCATCATCATCGA
+GGCGCCTCCCGAGCTGCCTCGGGTGATCCCACCGTCACTGCTACGACGAGCGCTGCCTTATCTGATCGGG
+ATCCTCATCGTGGGGATGATCGTGGCGCTGGTCGCCACCGGGATGCGGGTGATTTCTCCGCAGACGTTGT
+TCTTCCCATTTGTGCTGCTGTTGGCGGCCACCGCGCTCTACCGCGGCAACGACAAGAAGATGCGCACCGA
+GGAGGTCGACGCCGAACGGGCCGACTACCTACGTTACCTATCGGTGGTGCGGGACAACATTCGGGCCCAG
+GCCGCCGAGCAGCGGGCCAGCGCGTTGTGGTCTCATCCTGACCCGACGGCGTTGGCGTCGGTGCCGGGGT
+CACGTCGCCAATGGGAGCGTGACCCGCACGACCCCGACTTTTTGGTGTTGCGGGCCGGCCGGCACACGGT
+ACCGCTGGCTACTACGCTGCGAGTCAACGACACCGCCGACGAGATCGACCTGGAACCGGTGTCGCACAGT
+GCATTACGCAGCCTGCTCGACACCCAGCGCAGCATTGGCGACGTGCCGACCGGGATCGACCTGACCAAGG
+TTTCGCGGATCACCGTGCTGGGGGAGCGCGCACAGGTGCGCGCGGTGTTACGCGCCTGGATCGCTCAGGC
+GGTGACCTGGCACGACCCGACGGTGCTCGGGGTGGCGCTGGCCGCGCGTGATCTGGAGGGTCGCGATTGG
+AACTGGCTGAAGTGGTTACCGCACGTGGACATTCCCGGCCGCCTCGATGCGCTGGGCCCGGCCCGCAATC
+TGTCGACCGATCCCGACGAGCTCATCGCGCTGCTGGGGCCCGTCCTGGCAGACCGCCCGGCGTTTACCGG
+GCAGCCAACAGATGCGTTGCGGCACTTGCTGATCGTCGTCGATGACCCGGACTACGACCTGGGCGCATCG
+CCGCTGGCGGTGGGCCGCGCGGGTGTCACCGTCGTGCACTGCTCGGCCAGTGCGCCGCACCGGGAACAGT
+ATTCGGATCCGGAAAAGCCGATCCTGCGGGTGGCTCACGGCGCTATCGAACGCTGGCAGACAGGCGGCTG
+GCAGCCCTACATCGACGCCGCCGACCAATTCAGCGCTGATGAGGCCGCCCACCTGGCGCGCCGACTGTCG
+CGGTGGGACTCCAACCCCACCCATGCCGGGCTGCGCTCGGCGGCCACTCGCGGCGCGAGTTTCACCACAC
+TGCTGGGCATCGAGGACGCATCCCGACTGGATGTGCCCGCGCTGTGGGCGCCGCGACGACGCGACGAGGA
+GTTACGCGTGCCGATCGGTGTCACTGGCACCGGCGAGCCGCTGATGTTCGACCTCAAAGACGAAGCCGAG
+GGCGGGATGGGCCCGCACGGGCTGATGATCGGCATGACCGGTTCGGGCAAGTCGCAGACTTTGATGTCGA
+TTCTGTTGTCGCTGTTGACCACACACTCCGCGGAGCGGCTCATCGTCATCTACGCCGACTTCAAGGGTGA
+GGCCGGCGCCGACAGTTTCCGAGATTTCCCGCAGGTGGTTGCGGTGATCTCGAATATGGCCGAGAAGAAG
+TCGTTGGCTGATCGGTTCGCCGACACGCTGCGCGGCGAGGTGGCTCGTCGCGAGATGCTGCTGCGTGAGG
+CCGGCCGCAAGGTCCAGGGCAGCGCGTTCAACTCGGTGCTCGAGTATGAAAACGCCATCGCCGCAGGGCA
+TAGCCTGCCGCCCATCCCGACACTGTTCGTGGTCGCCGACGAGTTCACCTTGATGCTGGCCGATCACCCG
+GAATACGCGGAGCTGTTCGACTATGTGGCCCGCAAGGGTCGCTCGTTTCGCATCCACATCCTATTCGCGT
+CCCAGACACTGGACGTGGGCAAGATCAAAGACATCGACAAGAACACCGCCTATCGGATTGGGCTGAAAGT
+GGCCAGCCCCAGCGTTTCTCGCCAGATCATCGGCGTGGAGGACGCCTACCACATCGAGTCGGGCAAAGAA
+CACAAAGGCGTGGGCTTTTTGGTGCCCGCGCCCGGTGCCACCCCGATAAGGTTCCGCAGCACCTATGTCG
+ACGGGATCTATGAACCGCCGCAGACGGCTAAAGCCGTTGTCGTGCAATCCGTTCCGGAGCCCAAGCTGTT
+CACCGCCGCCGCGGTGGAACCGGATCCGGGCACGGTGATCGCCGATACTGACGAACAAGAACCCGCCGAC
+CCACCACGCAAACTGATCGCGACCATCGGCGAACAACTGGCCCGCTACGGTCCGCGGGCGCCGCAGTTGT
+GGCTGCCGCCACTCGACGAAACGATCCCACTGAGCGCGGCGTTGGCCCGCGCCGGGGTGGGCCCCCGGCA
+GTGGCGCTGGCCGCTGGGGGAGATCGACAGGCCCTTCGAGATGCGGCGCGACCCGTTGGTGTTTGACGCT
+AGGTCGTCGGCCGGAAATATGGTGATCCACGGCGGCCCCAAGTCCGGCAAATCCACTGCGCTGCAGACAT
+TCATCCTCTCAGCTGCTAGCCTGCACTCGCCGCACGAGGTTAGCTTCTATTGCCTGGACTACGGCGGTGG
+GCAGCTGCGGGCGCTACAGGATCTAGCGCACGTCGGCAGTGTCGCCTCAGCGCTGGAACCCGAACGCATC
+CGCCGCACCTTCGGCGAGCTCGAGCAACTGCTGTTGTCCCGGCAGCAGCGGGAAGTATTCCGTGACCGGG
+GTGCTAATGGCTCGACCCCCGACGACGGGTTCGGTGAGGTGTTCCTGGTCATCGACAATCTCTATGGCTT
+CGGCCGCGATAACACCGATCAGTTCAACACCCGTAATCCGTTGCTGGCCAGGGTAACCGAACTGGTCAAC
+GTGGGCCTTGCCTACGGGATCCACGTGATCATTACCACGCCGAGCTGGCTGGAAGTGCCGTTGGCGATGC
+GCGACGGGCTCGGGCTGCGTCTCGAGCTGCGACTGCACGACGCGCGCGACAGCAACGTGCGGGTGGTCGG
+CGCCCTGCGCCGCCCGGCCGACGCCGTCCCGCACGACCAGCCCGGCCGCGGACTGACCATGGCCGCCGAG
+CACTTCCTGTTCGCGGCTCCAGAACTGGACGCGCAAACAAACCCGGTGGCCGCGATCAACGCCCGCTACC
+CCGGCATGGCGGCTCCCCCGGTTCGGTTGTTGCCCACCAACCTTGCGCCGCACGCCGTCGGCGAACTGTA
+TCGGGGTCCCGACCAACTGGTGATTGGCCAGCGCGAAGAAGACCTGGCGCCGGTGATACTCGACCTCGCC
+GCCAACCCGCTGCTGATGGTGTTCGGCGATGCCAGGTCAGGAAAGACGACGCTGCTGCGCCACATCATCC
+GCACCGTCCGCGAGCACTCCACCGCCGACCGGGTCGCGTTCACCGTGCTGGACCGCCGGCTACACCTGGT
+CGACGAACCACTGTTCCCCGACAACGAGTACACCGCCAACATCGATCGGATCATCCCGGCGATGCTCGGG
+CTGGCCAACCTCATCGAGGCGCGCCGGCCGCCGGCCGGGATGTCTGCGGCCGAGCTGTCCCGCTGGACCT
+TTGCCGGGCACACCCACTACCTGATCATCGACGACGTCGACCAGGTACCGGATTCGCCGGCGATGACCGG
+TCCCTACATCGGACAGCGGCCGTGGACCCCGCTGATCGGTCTCCTGGCCCAGGCCGGCGACTTGGGGCTA
+CGGGTGATTGTCACCGGGCGTGCCACTGGATCGGCGCACCTGCTGATGACAAGTCCGTTGCTGCGCCGGT
+TCAACGACCTGCAGGCGACCACGCTGATGTTGGCAGGCAATCCGGCCGACAGCGGCAAGATTCGCGGTGA
+GCGGTTTGCCCGATTGCCTGCTGGACGAGCAATTCTGTTGACCGACAGTGATAGTCCAACCTACGTGCAG
+TTGATCAACCCGCTGGTCGATGCGGCCGCGGTTTCTGGTGAAACCCAACAGAAGGGGAGTCAGTCATGAC
+GTTGCGAGTGGTTCCGGAGGGGCTGGCCGCAGCCAGCGCTGCGGTGGAAGCGCTGACGGCGCGGTTGGCC
+GCCGCGCATGCGAGCGCAGCGCCGGTGATTACCGCGGTAGTGCCGCCGGCGGCGGATCCGGTGTCGCTGC
+AGACCGCGGCCGGGTTCAGTGCACAGGGCGTCGAGCACGCGGTCGTCACCGCCGAAGGTGTCGAAGAGCT
+GGGACGCGCCGGCGTTGGTGTGGGCGAATCCGGCGCCAGCTACCTGGCCGGTGATGCGGCCGCCGCCGCT
+ACGTACGGGGTCGTGGGCGGCTGAGCATGGCCGCGCCCATCTGGATGGCTTCGCCGCCGGAGGTACATTC
+GGCGTTGCTTAGCAATGGTCCGGGCCCGGGTTCGCTAGTGGCGGCTGCCACGGCCTGGAGCCAGCTGAGT
+GCCGAGTATGCCTCGACGGCAGCAGAACTCAGTGGGCTACTGGGGGCGGTACCTGGTTGGGCATGGCAGG
+GGCCCAGCGCGGAGTGGTACGTGGCCGCGCATTTGCCATATGTGGCGTGGCTGACGCAGGCCAGTGCGGA
+TGCCGCAGGAGCAGCGGCCCAGCACGAGGCCGCCGCGGCGGCCTACACCACTGCCTTGGCAGCCATGCCG
+ACATTAGCGGAGTTGGCCGCCAACCACGTGATTCACACCGTGTTGGTGGCGACGAATTTCTTTGGGATCA
+ACACGATTCCCATCACGCTCAATGAGGCCGATTACGTGCGCATGTGGTTGCAGGCGGCCGCCGTCATGGG
+TCTTTATCAGGCGGCTTCGGGTGCGGCACTGGCTTCGGCGCCGCGCACCGTCCCGGCGCCGACGGTTATG
+AATCCAGGTGGCGGTGCGGCCAGCACTGTCGGGGCGGTCAACCCCTGGCAGTGGCTCTTAGCGTTGCTTC
+AACAGCTCTGGAACGCCTACACGGGTTTCTACGGGTGGATGTTGCAGCTCATCTGGCAGTTCCTGCAGGA
+TCCCATTGGTAACTCGATCAAGATCATCATCGCCTTCCTCACGAATCCCATTCAGGCACTGATCACTTAC
+GGGCCGCTGTTGTTCGCGCTGGGCTACCAGATTTTCTTCAACCTGGTCGGCTGGCCGACCTGGGGCATGA
+TCTTGAGCTCGCCGTTCTTGTTGCCGGCCGGGCTCGGGCTGGGCTTGGCAGCAATAGCCTTTCTACCTAT
+TGTGCTTGCGCCCGCGGTGATTCCGCCGGCGAGTACTCCGCTGGCTGCTGCCGCCGTCGCCGCCGGGTCG
+GTGTGGCCGGCGGTCAGCATGGCCGTAACGGGGGCGGGCACCGCTGGGGCTGCGACGCCCGCGGCGGGCG
+CGGCTCCGTCTGCGGGCGCAGCGCCGGCCCCGGCAGCTCCCGCGACCGCCAGTTTCGCCTATGCGGTGGG
+TGGCAGCGGTGATTGGGGGCCGAGCTTGGGGCCGACGGTAGGTGGTCGCGGTGGTATCAAGGCGCCGGCC
+GCTACGGTTCCGGCGGCGGCCGCGGCGGCGGCAACTCGTGGGCAGTCGCGCGCGCGGCGGCGCCGGCGGT
+CTGAATTGCGGGACTACGGCGACGAGTTCTTGGACATGGATTCCGATAGCGGTTTCGGCCCCTCGACGGG
+CGACCACGGCGCGCAGGCCTCCGAACGGGGGGCCGGGACGCTGGGATTCGCCGGGACCGCAACCAAAGAA
+CGCCGGGTCCGGGCGGTCGGGCTGACCGCACTGGCCGGTGATGAGTTCGGCAACGGCCCCCGGATGCCGA
+TGGTGCCGGGGACCTGGGAGCAGGGCAGCAACGAGCCCGAGGCGCCCGACGGATCGGGGAGAGGGGGAGG
+CGACGGCTTACCGCACGACAGCAAGTAACCGAATTCCGAATCACGTGGACCCGTACGGGTCGAAAGGAGA
+GATGTTATGAGCCTTTTGGATGCTCATATCCCACAGTTGGTGGCCTCCCAGTCGGCGTTTGCCGCCAAGG
+CGGGGCTGATGCGGCACACGATCGGTCAGGCCGAGCAGGCGGCGATGTCGGCTCAGGCGTTTCACCAGGG
+GGAGTCGTCGGCGGCGTTTCAGGCCGCCCATGCCCGGTTTGTGGCGGCGGCCGCCAAAGTCAACACCTTG
+TTGGATGTCGCGCAGGCGAATCTGGGTGAGGCCGCCGGTACCTATGTGGCCGCCGATGCTGCGGCCGCGT
+CGACCTATACCGGGTTCTGATCGAACCCTGCTGACCGAGAGGACTTGTGATGTCGCAAATCATGTACAAC
+TACCCCGCGATGTTGGGTCACGCCGGGGATATGGCCGGATATGCCGGCACGCTGCAGAGCTTGGGTGCCG
+AGATCGCCGTGGAGCAGGCCGCGTTGCAGAGTGCGTGGCAGGGCGATACCGGGATCACGTATCAGGCGTG
+GCAGGCACAGTGGAACCAGGCCATGGAAGATTTGGTGCGGGCCTATCATGCGATGTCCAGCACCCATGAA
+GCCAACACCATGGCGATGATGGCCCGCGACACGGCCGAAGCCGCCAAATGGGGCGGCTAGCTCGCGCTAC
+ATGGATGCAACACCCAACGCCGTCGAGCTGACGGTCGACAACGCTTGGTTCATCGCTGAAACCATTGGGG
+CGGGGACCTTTCCGTGGGTGCTGGCGATCACGATGCCCTATAGTGATGCCGCCCAGCGGGGTGCGTTCGT
+CGACCGTCAGCGCGACGAGCTGACCCGGATGGGGCTGTTATCGCCGCAGGGTGTTATCAACCCTGCGGTC
+GCCGACTGGATCAAAGTGGTGTGCTTCCCGGACCGCTGGCTTGACCTGCGTTATGTGGGGCCGGCCTCGG
+CCGACGGCGCCTGCGAGCTGCTACGTGGCATCGTCGCGCTGCGCACCGGCACCGGTAAGACCTCCAACAA
+GACCGGAAACGGTGTTGTTGCGCTGCGTAATGCGCAGCTGGTCACGTTCACCGCGATGGATATCGACGAC
+CCCCGGGCGCTGGTTCCGATTCTTGGTGTCGGTTTGGCGCACCGGCCGCCGGCGCGGTTCGACGAGTTCA
+GCTTGCCGACGCGGGTGGGCGCGCGGGCCGACGAACGGCTGCGGTCCGGCGTGCCACTCGGGGAAGTCGT
+TGACTATCTGGGTATTCCGGCGTCCGCACGGCCGGTGGTGGAGTCCGTCTTCTCGGGGCCGCGCAGCTAC
+GTCGAGATCGTCGCCGGGTGCAACCGTGACGGCCGGCACACCACCACCGAGGTCGGCCTAAGCATCGTCG
+ACACCTCGGCGGGCCGGGTGTTGGTGAGTCCGTCGCGGGCATTCGACGGCGAGTGGGTCTCCACCTTCAG
+CCCTGGGACACCGTTTGCGATCGCCGTCGCGATCCAAACACTGACCGCGTGCTTGCCAGACGGGCAATGG
+TTCCCGGGACAGCGGGTGTCGCGGGACTTCTCCACCCAATCCTCGTAATCAGAAACCAGAAAGTGAGCAC
+GATGTCCCAGGAACGGTCCCGCTGATGTCCGGCACCGTCATGCAGATCGTCCGCGTCGCCATTCTTGCGG
+ACAGCAGGTTGACCGAGATGGCCCTGCCCGCGGAGTTGCCACTGCGCGAAATCCTGCCCGCGGTACAACG
+CTTGGTGGTTCCCTCGGCGCAAAACGGCGATGGTGGCCAAGCCGACTCCGGCGCTGCCGTGCAACTGAGT
+TTGGCGCCCGTCGGCGGGCAGCCGTTTAGCTTGGATGCCAGCCTGGACACCGTCGGTGTCGTCGACGGTG
+ATCTGTTGGTGTTGCAGCCGGTGCCCGCCGGTCCGGCCGCGCCGGGCATCGTCGAAGACATCGCCGACGC
+CGCGATGATCTTTTCGACGTCGCGGTTAAAGCCCTGGGGCATAGCGCATATCCAACGAGGAGCGCTGGCC
+GCGGTGATTGCCGTGGCTCTGCTGGCTACCGGTTTGACGGTGACCTATCGGGTTGCCACCGGTGTGCTGG
+CCGGGCTGCTGGCGGTGGCCGGGATCGCGGTGGCTAGCGCGCTGGCCGGATTGTTGATCACCATCCGTTC
+GCCACGTTCGGGTATCGCGCTGTCGATCGCCGCGCTGGTCCCCATCGGCGCGGCCCTGGCGTTGGCGGTG
+CCAGGAAAGTTCGGGCCGGCGCAGGTATTGCTGGGTGCAGCTGGGGTAGCCGCATGGTCGCTGATCGCGC
+TGATGATTCCCAGCGCCGAACGGGAACGCGTCGTCGCCTTCTTCACCGCAGCGGCGGTGGTCGGGGCGTC
+GGTGGCGCTGGCGGCCGGTGCGCAATTGCTGTGGCAGCTGCCGTTGTTGAGCATCGGCTGCGGGCTGATT
+GTGGCGGCGCTGTTGGTCACCATCCAGGCGGCTCAGCTTTCCGCACTGTGGGCGCGGTTCCCGTTGCCGG
+TGATCCCGGCGCCGGGGGATCCCACCCCGTCGGCCCCGCCGTTGCGCCTGCTGGAGGATTTGCCTCGGCG
+GGTGCGGGTCAGTGACGCCCATCAAAGCGGCTTCATCGCCGCGGCCGTGCTGCTCAGCGTGTTGGGGTCG
+GTGGCCATCGCGGTGCGCCCAGAGGCGCTCAGCGTTGTGGGCTGGTATCTGGTGGCGGCGACTGCGGCCG
+CGGCCACCCTGCGCGCGCGGGTGTGGGATTCGGCCGCATGCAAGGCGTGGCTGCTGGCTCAGCCCTATCT
+GGTAGCCGGGGTCCTGTTGGTGTTCTACACCACGACCGGACGCTATGTCGCCGCGTTCGGCGCGGTGCTG
+GTGCTAGCCGTGCTCATGCTGGCCTGGGTTGTGGTGGCACTGAACCCGGGCATCGCTTCGCCGGAGAGCT
+ACTCGCTGCCGCTGCGCCGGCTGCTGGGTTTGGTCGCCGCCGGGCTGGATGTTTCGCTGATCCCCGTCAT
+GGCCTACCTGGTCGGATTGTTCGCTTGGGTGCTCAACAGATGATCCGTGCCGCATTTGCGTGTCTGGCGG
+CGACCGTGGTCGTTGCGGGGTGGTGGACGCCGCCGGCGTGGGCGATCGGGCCGCCGGTGGTGGACGCCGC
+CGCGCAACCGCCCAGCGGAGACCCGGGACCGGTGGCGCCGATGGAACAACGCGGTGCGTGCAGCGTCTCC
+GGTGTTATCCCGGGCACCGATCCAGGCGTACCGACGCCCAGCCAAACGATGCTGAATCTGCCTGCGGCTT
+GGCAGTTTTCCCGGGGTGAGGGCCAGCTGGTGGCGATCATCGACACCGGGGTGCAGCCGGGCCCGCGACT
+GCCCAACGTCGATGCCGGTGGTGACTTCGTGGAGTCGACCGACGGGCTGACCGATTGTGACGGGCATGGC
+ACCCTGGTCGCCGGAATCGTCGCCGGCCAGCCCGGTAATGACGGCTTCTCTGGTGTGGCGCCGGCGGCGC
+GGCTGCTGTCCATCAGGGCGATGTCTACGAAGTTCTCACCGCGCACATCGGGGGGCGATCCGCAGCTGGC
+GCAGGCCACACTTGACGTCGCGGTGCTGGCCGGTGCCATCGTTCATGCGGCCGACCTTGGTGCCAAGGTG
+ATCAACGTCTCCACGATCACCTGCCTACCCGCCGATCGGATGGTCGACCAGGCCGCGCTGGGCGCGGCGA
+TCCGGTATGCGGCGGTGGACAAGGACGCGGTGATCGTGGCGGCCGCGGGAAACACCGGAGCGAGCGGATC
+GGTCAGCGCGTCGTGTGATTCCAACCCGTTGACCGATCTGAGCCGCCCAGACGATCCGCGGAACTGGGCG
+GGCGTCACCTCGGTGTCCATCCCGTCGTGGTGGCAGCCCTACGTGTTGTCGGTGGCGTCGCTCACATCCG
+CCGGGCAGCCATCGAAATTCAGCATGCCCGGGCCGTGGGTGGGCATCGCCGCACCCGGGGAAAACATTGC
+GTCGGTGAGTAACTCAGGCGACGGCGCCCTGGCTAACGGACTGCCCGACGCCCACCAGAAACTGGTGGCT
+CTCAGCGGCACCAGCTACGCGGCCGGCTATGTCTCCGGGGTGGCCGCGCTGGTCCGCAGCCGCTATCCCG
+GGCTGAACGCCACCGAGGTGGTGCGCCGGCTGACCGCCACCGCGCACCGCGGCGCCCGAGAGTCCTCCAA
+CATCGTCGGCGCCGGCAACCTGGACGCGGTGGCGGCCCTGACCTGGCAACTGCCCGCCGAACCCGGGGGC
+GGTGCCGCACCGGCCAAGCCGGTCGCCGATCCGCCGGTCCCGGCGCCCAAAGACACCACACCGCGCAACG
+TCGCATTCGCCGGAGCAGCCGCGCTGAGCGTGCTGGTCGGGCTCACAGCCGCGACTGTCGCGATAGCGCG
+CCGACGAAGGGAGCCCACCGAATGAACCCGATCCCTTCTTGGCCCGGCAGGGGCCGGGTCACGTTGGTGC
+TGCTGGCGGTGGTGCCTGTAGCGCTGGCCTACCCCTGGCAATCGACACGCGATTACGTGCTGCTGGGCGT
+GGCCGCCGCCGTCGTGATTGGGCTATTCGGCTTCTGGCGCGGGCTGTATTTCACCACGATCGCGCGCCGC
+GGGTTGGCAATCCTGCGCCGCCGACGCCGGATTGCCGAGCCCGCAACGTGCACGCGCACAACGGTGCTGG
+TGTGGGTTGGGCCGCCGGCATCGGATACGAACGTGCTGCCGCTGACGCTGATCGCCCGGTATTTGGACCG
+ATACGGCATCCGCGCCGACACGATTCGCATCACCAGCCGCGTCACCGCATCCGGCGACTGCCGGACCTGG
+GTCGGGTTGACGGTGGTCGCCGACGATAACCTGGCGGCGCTGCAGGCCCGGTCAGCGCGCATCCCCTTGC
+AAGAGACCGCGCAGGTCGCGGCGCGCCGGCTCGCCGACCATCTGCGCGAAATCGGTTGGGAGGCTGGTAC
+GGCCGCACCCGACGAGATCCCAGCGTTGGTGGCTGCGGATTCTCGCGAGACGTGGCGCGGAATGCGGCAC
+ACCGACTCGGATTACGTTGCGGCATATCGGGTCAGCGCCGATGCCGAGTTGCCCGATACGTTGCCCGCGA
+TCCGGTCGCGTCCGGCGCAGGAGACCTGGATCGCGCTGGAGATCGCATATGCCGCCGGGTCATCAACCCG
+CTACACGGTGGCCGCTGCCTGCGCATTGCGGACCGATTGGCGGCCTGGCGGCACCGCACCGGTGGCCGGC
+CTGCTCCCGCAACACGGAAACCACGTGCCAGCCCTGACAGCCTTGGATCCGCGATCCACCCGCCGACTCG
+ACGGGCACACCGATGCTCCTGCCGACCTGCTGACCCGGCTGCACTGGCCTACTCCTACCGCCGGCGCCCA
+CCGGGCACCGCTGACCAACGCCGTCAGTCGAACATGAGGCCCTGCAGGAACACGGTCATCCGCCGCAGAT
+AGTCCAACTGGCTCACATGCAGCAGGTGGCTGCCGGGGAACCAGTGCAGCGCACAGCGATCCCACTGCTT
+CCACAGCGTTACCGCGTGCTCGGGTGGAGCCATTCGATCGCCAAGGCCGGTGATGATCATCCGCCGGTCC
+TTAGGTAGCAGCGGCCGATAGTTCAGTGGGCCGTGGTAGGCCAGCCCGGCGATCAGCTCATCACGGCTGA
+TGTTGGTTAGCCGCAGTCCTAGCTTGACGAGCTTATTGGCCGGAAACCATTCGTCGAACAGCTTGGCGGG
+CATGACGACGGGGCAGTTGGGGATGACAGCCTCAAGCCGACTTTCGACCGAAGCCAGCAGCGCAGACGTG
+TAGCCCCCCAGGGATATACCCGTCAGGGCGATACGGTCGACGCCGATGTGGCGCAGGTAGTCCACGATGG
+AACGAAAGTCATACACTGCCTGCGCCATCGCCTCGGCGAAGCCGCTCAATCCGCTAGTGAAATAGCCGAA
+ACCGCTAAACGGCGAGAACTTTTCGGCCCGCTGGCCGTGAAACGGCAACGTGTACAGCAAAACGTCGTAG
+CCGGACCGGTAATACCAAGGCAGCGAAAAGAACAGCCCGTTGAGCAAGTATGACGATCCCATGAAGCCGT
+GGATGACGCACAGCGTAGGACGCGGGCCGTCGCGGTGGCGCCAGTGCTGCGCGTGCACAATGTTGTTGGC
+GGTCAATGCACTCCACCGCTGGCGCATCGTGGGGTTGATCGCCCGGAAGCCGCTGGCAAATGCGATGTTG
+TCCACGGTGCCGCGCGCAACCCATTCGGTGAGCGGGCTGGCCGGCCGCGAGGTGACCTTGGGCAACTCCG
+TCGGCGCCGGAAAGGACTTCGCCGGATCATGCGCTGCCGCAAGTTCGGCGTAGAAGTTCAGGTTGCTGCG
+CTCGCTGCCTTCGTTGACGTGACGTAGTGCGTTGGCGACAACGGCCGGAGTCACCGTCGCGGACAGCACC
+GACGCGACCGCGGTGCGCAGCGCGACATCGGCGATCGCCGAAGACTCGACGAGTATCCGCTGGCGGGCCG
+ACAGCACCGAGCGCGAGGGCAGGCCCTCGGCGCCGGCATCCGCGCCGGGGACGTCGGGAATGGGGACGGG
+CGGACCGATCGCGTCGGCAGTGAACGTCCCTGACATCTCGGACATCAATGTCGATGGTAATCGCCAATGT
+GGCTGACCGCTGAAGGTTTCGACTGTATCGTCAATTTCTCACTCGGTCGAGCGCTTGTCCAGGAGCACGT
+ACATGTGGGATCCCGACGTCTACCTGGCTTTTTCGGGTCATCGCAACCGCCCGTTCTACGAGTTGGTGTC
+ACGGGTGGGTCTCGAGCGGGCGCGCCGCGTGGTCGACCTGGGGTGCGGGCCCGGCCACCTGACACGCTAC
+CTGGCACGACGATGGCCCGGCGCGGTGATCGAGGCTCTGGACAGCTCACCGGAGATGGTCGCTGCCGCGG
+CCGAACGCGGGATCGACGCCACCACCGGTGACCTGCGGGACTGGAAACCAAAGCCCGACACCGATGTGGT
+GGTGAGCAACGCTGCGTTGCATTGGGTGCCTGAGCATTCCGACCTGTTGGTCCGGTGGGTCGACGAGCTG
+GCGCCGGGATCATGGATCGCTGTTCAGATCCCCGGCAACTTCGAGACGCCGTCGCACGCCGCGGTACGGG
+CGTTGGCCCGCCGCGAGCCGTATGCAAAGCTAATGCGCGACATACCTTTTCGTGTGGGCGCGGTGGTCCA
+ATCTCCGGCGTATTACGCGGAGCTGCTGATGGACACCGGCTGCAAGGTCGACGTGTGGGAGACCACGTAC
+CTACACCAGCTGACCGGCGAGCACCCGGTGTTGGACTGGATTACCGGAAGCGCGCTGGTCCCAGTGCGTG
+AGCGGCTCAGCGATGAGAGCTGGCAGCAGTTTCGGCAGGAGCTCATTCCGCTGCTGAACGACGCCTACCC
+GCCACGGGCCGACGGTAGCACCATCTTTCCCTTCCGGCGGCTGTTCATGGTCGCCGAAGTTGGTGGCGCG
+CGCCGCTCAGGTGGGTAGCCCCAGCCGCGGCGCCTCCGCTCGGTACCGGTCGACCCACTCATCAGAGCGC
+TGGTTGGCCTGCCGTTCCAGCATCGGTGCGGGCGCCAGTTTGGGATCCTGGCCGATGGCGTCAAGCACAC
+TGGCCACAATCGCGGTCAGGTTGCGCCATAACACCGGGTAGGCGATATCGATCGGATCGATGCCTTCCTC
+GGCAAACCAAGCGCGCCAGCCGTTTTCCTGATCGCGCAGATTCCTGATGATGTGGGCGATGGCACCGGCG
+TGGTAGACGGCCTGCGAGTCGCGCTTGGGGTCCGGATGGCCCCGCCAAACCTGGGTTTGCACGGCGCGCC
+AGAACGACACCGCTTGTGACACCACATCGGGCCGGTGGACGTGCACGAAAACCGGTTCGTTGCCAATGAC
+GTCGCGGATTGCCGCGCGCAAGCCATCCCCGGAGCGATCCGGCAATTGTGCTGCGCGTTGCTGCAGCAGC
+GCAGTCTGATTCCACATCAACTTGCCGCCCCAGACGCCGTTGGGCGTGCGACCGGAGGTGCGGACGTGCT
+CACGCCAGGCAACCGGCGTCGCGGTGTCCGGTGTACCGGGGTCCAGCGGATCGAGCAATTGCAGGATCGT
+GTCATCGTCGACCCCAGCGAACCACTCCCGGGGCTGGGGGGCCATCCCGGTGCTAGGCAGGTATTGGAAG
+AACTCCTGTGGTTCCCCGGCACAGCCCGTCGCGCGCAGCGATTCCACCAGCAGCGTGCTGCCGCTGCGTT
+GGGTGGCGAGCACCAGATACGGTCTCACAGCGCGGGACATCCGATGAGCCTAGCTGCAGTGTTCGTCGAT
+GCCGCGGTCGGCGGCGATCGCTGACCGGCCCGTTGGCGTCTTGCGGTGGATCCGCAGATACGTTTCGGTG
+TAGCGCTCGGCGATGCGGGAACCGGCGAAGTCCGACGGAATGACGTCGGCCGTGCGCTGTCGCCAATCAT
+GCAGTCGCACGGCCAGATCGGCCGCGATCGCGGCCACGCCCTGGGTGCTGTCGTCGCCGGCTAACAGGTT
+ATTGGTCTCGGTGGGATCGGCGCGTAGATCGTAGAGTTCCCGCTGCGGGCGGGGCGCCTTGACCAACGGT
+GCGACGGCCATGCCGGCCGGGCTTTCCTGGATATCCCACGGTAGGTCCAGCAGCGGCCGGGGCGCGTAAT
+TCTCGATGTAGCTGTATTCCTTGGTGCGGATTGCCCGAATCGGATCGAACGAGTCGTGATAGGTCTTGGC
+GGTGTATACGTGGTCACGCACCGCAGCGTTTTCAGTGTCCGGCGCGAGGAGGGCCGGTGCGTGTGACACA
+CCCTCGACATCGGCGGGTACCTCGAGTCTCAGCAGGTCCAATAGCGTCGGAACCAGATCGACGCCGCTGA
+AAAGCTCGTCATAGACGCGAGGCGCCATCGCCCGGCGAGTGGGCGGGCGGATGATCAGCGCGATACCGGT
+TCCGGCGTCATACAGTGTGGACTTCGCCCGCGGAAATGCCGGACCGTGATCGGTGACGAACACCACCCAG
+GTGCTGGCGTCTAGGCCGGTATCGGCCAGTGTGTCAAGTAGCCGGCCAACCGCCTCGTCGGCTGTGGCGA
+TAGAACCGTAGAACTCGGCGACGTCTTGGCGCACCTCGGGGGTATCGGGCAGATAGTCGGGCAGCTCGAC
+GGCCGCGCTGTCGGCCGGCCGGTAGCGCTCATGCGGATAGGGCCGGTGGGTTTCGAAGAAGCCGGCGGTC
+AACAGGAACCGTTGTCCGTCTAACGCGGGCACGCGATTATGCAGCCAGTCCTGGGCTTTGGCGACCACGT
+ATTCGCAGTAGGAGTTCGACACGTCGAATTCGTCGAAGCCCAGCCGCTTTGGGTAGGACGTCTCATGCTG
+CATACCGAAAAGAGCTGAGTACCAACCCGATTCGGATAGCAATTGCGGTAGGGTTTGGACCCCGGTGCGG
+TATTCCCAGCCGTGATGGGCCAGGCCGACCAACCCGTTGCTTTGCGGGTAGCGGCCGGTGAACAGCGAGC
+CCCGCGATGGTGTGCACAGCGGCGCGGTGGCATGTGCCCTGGTGAACAGGATGCCCTCGGCGGCAAGCCG
+GTCCAGCCGCGGGCTGTAGACGTCCGGATGGTGGTAGACGCCGAGATAGCGCCCCAGGTCGTGCCAGTGC
+ACGATCAGCAGGTTCTCGCGCTGCCCTGTGGCACGCTCACTCGTCACCTTTGCCACCTCTCCAGCGAACC
+GCACCCGGCGCCGAAGCCGGACAATAGAGCCTATACGTCGCGAGGCACTAGATACGCCACCGATGATGGC
+GGTAGGCTCGCTGATTGAATCGCGGCGACGGCGTAGGCGTGTTGTGTCTTGGCGTCCAGGAGTCACGAGT
+CGACGGGAGGTTCCCGTGTCCTTTGTGATCGCACAACCGGAGATGATCGCGGCGGCGGCCGGTGAGTTGG
+CCAGCATCAGATCGGCGATCAACGCGGCCAATGCGGCGGCCGCGGCCCAGACCACCGGAGTCATGTCGGC
+GGCCGCCGACGAGGTGTCTACGGCGGTTGCCGCGCTGTTTTCCTCGCATGCCCAGGCCTATCAGGCCGCC
+AGCGCGCAAGCGGCCGCCTTTCACGCCCAGGTGGTGCGGACCCTGACCGTGGACGCGGGAGCGTATGCCA
+GCGCCGAGGCCGCCAACGCCGGGCCGAACATGCTGGCCGCGGTCAACGCCCCCGCCCAGGCGCTGTTGGG
+GCGCCCACTGATCGGCAACGGTGCCAACGGGGCGCCGGGCACCGGGCAGGCCGGCGGCGACGGTGGGCTG
+TTGTTCGGCAACGGCGGCAACGGCGGGTCCGGCGCACCCGGACAGGCCGGCGGGGCCGGCGGGGCGGCCG
+GGTTCTTTGGCAACGGTGGCAACGGCGGGGACGGCGGGGCCGGAGCGAACGGCGGCGCCGGCGGCACCGC
+CGGCTGGTTCTTCGGCTTCGGCGGCAACGGCGGGGCCGGCGGGATCGGTGTTGCCGGCATCAACGGCGGT
+CTCGGCGGCGCCGGCGGCGACGGCGGCAACGCCGGGTTCTTCGGCAACGGCGGCAACGGCGGCATGGGCG
+GGGCCGGGGCGGCCGGCGTGAACGCCGTCAATCCCGGCCTGGCCACCCCGGTCACCCCGGCGGCCAACGG
+CGGCAACGGCCTCAACCTCGTCGGCGTTCCCGGCACCGCCGGTGGCGGCGCCGATGGCGCCAACGGCAGT
+GCCATTGGCCAGGCGGGCGGCGCTGGCGGTGACGGCGGCAACGCCTCCACGAGTGGGGGCATCGGGATCG
+CGCAAACCGGGGGCGCCGGCGGCGCTGGCGGTGCCGGCGGCGACGGCGCACCCGGTGGCAACGGCGGCAA
+TGGTGGCAGCGTCGAGCACACTGGCGCTACCGGCTCCTCTGCGAGCGGCGGCAATGGTGCCACCGGCGGG
+AACGGCGGGGTCGGTGCGCCCGGCGGTGCCGGCGGCAACGGCGGCCACGTCAGCGGCGGATCGGTCAACA
+CAGCCGGCGCCGGTGGCAAAGGCGGCAACGGCGGCACCGGCGGCGCCGGCGGCCCGGGCGGCCACGGCGG
+CAGCGTTCTATCCGGCCCGGTTGGCGACAGTGGCAACGGTGGTGCCGGCGGGGACGGCGGGGCCGGGGTT
+AGCGCCACCGATATCGCCGGCACCGGCGGGCGCGGCGGCAACGGTGGTCATGGCGGGCTGTGGATCGGCA
+ACGGCGGCGACGGTGGTGCGGGCGGTGTCGGCGGTGTCGGCGGGGCCGGTGCGGCTGGCGCGATCGGCGG
+CCACGGCGGCGATGGCGGCTCCGTAAATACCCCTATTGGCGGCAGCGAGGCCGGTGACGGCGGTAAGGGC
+GGCCTGGGCGGGGACGGCGGGGACGGCGCCGCCGGTGGCGACGGGGGCGCCGGCGGGGACGGCGGTGGGC
+GCGGGATATTCGGCCAGTTTGGGGCCGGCGGGGCCGGTGGTGCCGGAGGCGTCGGCGGCGCCGGCGGGGC
+TGGCGGGACCGGCGGCGGCGGCGGCAACGGTGGGGCCATTTTCAATGCCGGTACCCCCGGCGCCGCCGGC
+ACGGGCGGTGACGGCGGTGTTGGCGGGACCGGTGCGGCCGGCGGGAAAGGCGGGGCCGGCGGTAGCGGCG
+GCGTCAACGGCGCCACCGGCGCCGACGGCGCCAAGGGCCTCGACGGTGCCACCGGCGGCAAAGGCAACAA
+CGGCAACCCCGGCTGAGTCCGGATTCACCGAGTCTGTAGATACCGTGGTCCGCATTCGCAGTTTTGTGCG
+CCAACTACAGCCTCGATGACACGACCGCGGCGAATCCCGTTTCCCGGGTGCGGCGACACCGCGTCCTACG
+ATTAGTAGGATCTCTGGTATGACGAAAGAGAAGATCTCCGTGACGGTGGACGCGGCCGTCCTCGCGGCGA
+TCGACGCGGACGCCAGGGCGGCGGGTTTGAATCGGTCGGAAATGATTGAGCAGGCACTGCGCAACGAGCA
+CCTGCGTGTCGCTCTGCGCGATTACACGGCTAAAACCGTACCGGCGTTGGACATCGATGCCTACGCACAG
+CGGGTGTACCAGGCGAACCGGGCGGCCGGAAGTTGATCGCTCCCGGCGACATCGCGCCGCGCCGCGACAA
+TGAACACGAGCTCTACGTCGCCGTCTTGTCCAACGCGCTCCATCGGGCCGCGGACACCGGACGGGTGATC
+ACCTGCCCATTCATTCCGGGCCGGGTCCCCGAGGATCTCTTGGCGATGGTGGTGGCGGTCGAGCAACCCA
+ACGGCACGCTGCTGCCGGAACTCGTGCAGTGGCTTCATGTTGCCGCGCTCGGTGCGCCACTCGGCAACGC
+GGGCGTGGCCGCCCTACGCGAGGCTGCCTCGGTTGTGACAGCTCTGCTCTGTTAGCCCTGTCACCGGCGA
+AGATACCTGATATCGCCAGATATCATCGGAAGATGAGTGATGTACTGATTCGGGACATCCCCGACGACGT
+GTTAGCAAGCCTTGACGCGATCGCGGCACGCTTGGGCTTGTCGCGGACCGAATACATCCGTCGGCGTTTA
+GCCCAGGATGCGCAGACGGCTCGCGTCACCGTGACAGCCGCGGATCTTCGACGCCTCAGGGGTGCGGTTG
+CCGGTCTGGGCGATCCCGAGCTTATGCGTCAGGCGTGGAGGTGACTGACCAGCGCTGGCTGATCGACAAG
+TCGGCGCTGGTGCGGCTCACGGACAGCCCTGACATGGAAATCTGGTCGAACCGGATCGAACGCGGCCTGG
+TACACATCACGGGCGTGACACGCTTGGAAGTAGGGTTCTCGGCCGAATGCGGGGAGATAGCGCGACGGGA
+GTTTCGTGAACCGCCGCTGTCTGCGATGCCCGTGGAATACCTAACCCCGAGAATTGAAGACCGTGCGCTC
+GAGGTGCAGACCTTGCTTGCCGACCGCGGACACCACCGTGGCCCGTCGATCCCGGATCTGCTCATCGCCG
+CGACAGCCGAACTGTCGGGCTTGACGGTACTGCACGTCGACAAGGACTTTGACGCCATCGCCGCGCTTAC
+CGGTCAGAAAACAGAACGGCTCACGCATCGCCCGCCTTCCGCTTAAGGAGCCCGACCAACCCTTGTGATT
+GGCGTGGGGGGGCGCTAACGTAACTGTCTGTAACGTTCGATACAGAACTGGCGCCGGGGTGCGGCCGCGA
+CTCTACGAGCCGAGACAAGCCGGCGCAAGGATGGCGCACCAGTGGGCGTTCCCGCCAAGAAAAAACAGCA
+GCAGGGGGAGAGGTCACGAGAATCGATTCTCGACGCGACCGAACGCCTGATGGCGACCAAGGGCTACGCG
+GCGACCTCGATCAGCGACATCCGCGACGCGTGCGGGCTAGCACCCAGCTCTATTTACTGGCACTTCGGCT
+CCAAAGAGGGCGTGCTGGCCGCCATGATGGAGCGCGGCGCGCAGCGCTTCTTTGCCGCGATACCCACCTG
+GGATGAGGCCCATGGGCCCGTCGAGCAGCGATCCGAGCGCCAGCTGACCGAGCTGGTGAGCCTGCAGTCG
+CAGCATCCGGACTTCCTGCGCCTGTTCTACCTGCTGTCGATGGAACGAAGTCAGGATCCGGTGGTTGCCG
+CGGTGGTGCGCCGGGTCCGCAACACCGCGATCGCCCGATTTCGTGACAGCATCACGCACCTGCTGCCATC
+GGACATCCCGCCGGGCAAAGCCGATCTCGTCGTCGCGGAGCTGACCGCGTTCGCGGTTGCGCTGTCGGAC
+GGCGTCTATTTCGCCGGCCACCTTGAACCGGACACGACCGACGTCGAGCGCATGTACCGGCGGCTGCGGC
+AAGCGCTCGAGGCCCTGATTCCCGTCCTCCTGGAGGAGACATGAACACCGGAACCGCCGTCATCACCGGG
+GCCAGCTCCGGCCTCGGGTTGCAGTGCGCCCGCGCCCTGCTACGTCGCGACGCATCGTGGCATGTGGTGT
+TGGCGGTGCGCGACCCGGCGCGCGGCCGTGCGGCCATGGAGGAATTGGGGGAGCCAAACCGGTGTTCGGT
+TCTCGAGGTGGACCTCGCGTCGGTGCGGTCCGTGCGCAGTTTCGTGGAAACCGTGCGGACCACGCCGCTG
+CCGCCGATTCGTGCCCTGGTGTGCAATGCCGGCCTGCAGGTGGTGTCGGGCATCGCGTTCACCGACGACG
+GTGTCGAGATGACGTTCGGGGTAAACCACTTGGGTCACTTTGCTTTAGTGACCGGGATTCTCGACTGGTT
+GGCCCGTCCGGCGCGCATCGTTGTCGTCAGCAGCGGCACGCACGACCCGAGCAAGCACACCGGAATGCCC
+GACCCTCGGTATACCTGCGCCGCCGACCTCGCGCACCCGCCCACCGATCAGAACACGCCGGCCGAAGGCC
+GCCGTCGATACACCACGTCCAAGCTGTGCAACGTGCTCTTCACCTACGAGCTCGACCGCCGCCTCGATCA
+CGGAGAACAGGGCGTGATGGTCAACGCGTTCGACCCCGGCCTAATGCCGGGCTCCGGCTTGGCCCGCGAC
+TATCCGCCGATCCTGCGACTGGCGTACCGTCTCCTGTCGCCGATGCTGCGCGTCCTTCCCTTCGTTCACA
+GCACCCGGGTCTCCGGCGAACACCTGGCGGCGCTGGCGGTCGATCCGCGGTTCGCGGGCGTGACGGGCCA
+ATATTTCGCGGGCGCCAAGGCGATCCGGTCTTCCGCCGAGTCCTACGATCGGGCAAAGGCGCTCGACCTC
+TGGGAGACCAGTGAACGGCTGCTGGCCCAGGTGACATAGCTGCGCGTTATCCCCTAAAGAAACCCGCCAG
+GTTGGTGCCAAAGTTACCGATGCCGGAAAGGAACCCCGGCGTCGCGAGATCCAGCGCGCTGGCGTTCAAC
+CAGCCCGAGATGGTGTTGCCCACGTTGGCGACACCCGATCCCAGCGCGCCGGTATTGAGGTAGCCCGACA
+GGCCGGCACCGGAGTTCACGAATCCCGATACGCTTCCGGCGCCGCTGTTGAAGAAGCCCGACGACGGGCC
+GCCAGTGAGGTTGAAGTAGCCGGGGGTCACCGGAATGCCCAACAGCGGCAGGCCGATCAGGCCCTGATAG
+TCGCCACTCACCAAGAAGCCGTTGCTGTAGCTGCCGGTAATGAACGCACCGGTGTCCACATCGCCCGTGT
+TCGCCACGCCCGTGTTGTAGTCACCGGTGTTGAGGTAGCCCGTGTTGCCACTGCCCGGGTTGAAGCCGCC
+GGTGTTGAAGCTGCCCGGGTTGAAGCTGCCGGTGTTGAGGTCCCCGGGGTTGAACACGCCCGTGTTGGTG
+CTGCCCGCGTTGCCGATGCCGGTGTTGAAGCCGCCCGAGTTCGCGAGACCGAAGTTGCCGGTGCCGGCGT
+TAAAGATGCCGACGTTGCCGGTGCCCGAGTTGAAGAACCCGATGTTTCCGCTGCCGGAGTTGAACAGCCC
+GATGTTGTTGCTGCCCGAGTTGAGGCTGCCGATCCCGATCTGGCCGTTGCCGGTGAGCCCGACGCCGATG
+TTGTTGTTACCGGTATTCGCGAAGCCGATGTTGTAGCTGCCGGTGTTGGCAAAGCCCAGGTTGTCGCTGC
+CGAAGTTCGCGAAGCCGATGTTGTAGCTGCCGGCGTTGCCAAAGCCCAGGTTGTCGTCGCCCAGATTTGC
+CAACCCGATGTTGTAGCTGCCCAGGTTCGCCAAGCCGATATCGAAGATCCCGGTGTTGGCGATGCCGATG
+TTGTTACCGCCGATGTTGACCCCGCCGAAGTTGAGGTCGCCGAGGTTGCCGATGCCCAGGTTGGAGTCGC
+CGGTATTAACGAAGCCGATGTTGACGCTGCCCAGGTTCCCGATGCCCGCGTTGAGGCCGCCCTGGTTTGC
+GACGCCGAAGTTCAGCGTCAGGTTGCCGGTGTTGTCGAGGAACAGGCCGGCCAGGTTGGCGCCGATGTTT
+GCGATGCCCGAGCCGAAGGCGGGCGTCGCGAGGTCCAGCGTGCTCGTGTTGTAGACGCCCGAGATGGTGT
+TGCCCAGGTTCGCCAGACCCGACTGCAGCGCGCCGAAATTCAGTAGGCCCGAATTGCCCAAGCCGCCGGC
+GTTAAAGAAGCCCGAATTGCCAGCGCCGAAGTTCCCGAAGCCCGACATGTTGCCGGCGCCGAAGTTCCCG
+AAGCCCGATACATGGCCGGCGCCGGTGTGGAAGAAACCCGACGACGGGCCGGTGGTCGAGTTGCCGAAAC
+CCGGGGTACCACCGATGCTGATGCCGATGGGGATCGGGCCGAAGCCGCCGGTGCCAACCATGCTGATGGT
+TTGCTGAATGGGCGAATCGATGGCGATGACTTGATTGACATCGATCGTGATGGGGCCGATCATCTCGTTG
+ACAAGCACCGCCGCAGGACCAAGCAAGACTCGTATCTGGAAACCGGGAATGGTGAAACTGTTTGGCGTGG
+TGGCGACGACGGTGCCGGTGATGGGTATGTCGATTGGAACACTCAAGTCGTAGCGGTAGGGGATTTCGGG
+AATGGTGATCGTTGTGGAAAGGCCAATCAACCCCTGGTAGTCACCTCGCCAGAAGAACCCGTTGCTGTAA
+TTGCCGGAGATGAACGCGCCGGTGTTGACGTTGCCCGTGTTGGCCACACCCGTGTTGTAGTCACCCGCGT
+TGAAGTAGCCCGTGTTGTAGTCACCGGAGTTGAAGCTGCCGGTGTTGTGATCGCCGAGGTTGAAGCTGCC
+GGTATTGGTGCTGCCAGTGTTGAAGCTGCCGGTGTTGATGCTGCCGGTGTTGCCGACGCCGGTGTTGACG
+TTGCCCGGGTTGAACAGGCTCGTGTTGGTGCTGCCCGTGTTCCCGAGGCCGGTGTTGAAGCTGCCCGAGT
+TTGCGATGCCGAAGTTTGCGGTGCCGGTGTTTCCGATGCCCACGTTGCCGGTGCCCGAGTTGAAGAATCC
+TACGTTTCCGTCACCGGAGTTGAACAAGCCGATGTTGTGGCTGCCCGAGTTGAAGCTGCCGAACCCGATC
+TGACCGGTGCCGGTGAGCCCGATGCCGATATTGCCGCTACCGGTGTTGGCGAAGCCGATATTGGCACTGC
+CGGTGTTAGCAATGCCGATATGGTAGTTGCCCGAGTTGGCGAAGCCGACGCTGTAGTTGCCCAGGTTTGC
+CAAGCCAATGTTGTGGTTGCCCACGTTTGCGAAACCGACATTGAAGATTCCGGTGTTCCCGATCCCGAAG
+TTAGAGCCCCCGAGGTTTGCCAAGCCGACATTGAGGTTGCCGAGGCCGGCCAAGTCGAGGATCGTCGTGC
+CGGCGCCGCCCTGCAGCAGGCCGGCGATGTTTGCGAGGCCGGAGCCGAAGGCCGGCGTCCCGAGGTCCAG
+CGGGCTCGTGTTGTAGATACCCGAGATGGTGTTGCCCACATTCGCCACACCCGATCCCAACGCGCCGACG
+TTGAGCAAGCCCGAGACTCCTGAGGCTGCCGACGCAAGGTTCCACAGGCCCGATGTGTTGCCGCCGACGT
+TGCCGAACCCGGATGCGGTGCCGGCGCCGGTGTTGAAGAAGCCTGACGACGGGCTGGTGGTCGAGTTTCC
+GATGCCCGGCGCTGCCGGAATGTCGATGATCGGGATGGTGATGGGGCCGAGGCCGGCGGTGGCGCTGATG
+TTGATCGCGGTCGTGGGTCCGCCCACGGCGATCGCGAACGTGGGAACGCTGAGCACGAAGCTCGGGACAA
+TGATGGGACCGATGTCCGGCTCGGTATGGATGTGAAAGCTAAACGCGAAGGATTCGAAGCCGATGATGGG
+GATAGTGAAATTGTCCACCACGAGGTCGGTGAAACTGCCGGTGATCGGTATGTCGATTGGGATATTGACG
+TCCAAGTGCGCCGGAATCTCCGGAATAGTCAGCGCGTAGGAGTAACCGATCAGGCCCTGGTAGTCGCCCC
+GCCACAAGATGCCGTTGCTGTAGTTGCCGGAGATGAAAGCGCCGGTGCTGACGTCGCCCGTATTCGCGAT
+GCCGGTGTTGTAGTTCCCGGTGTTGAAGTGGCCGGTGTTGGTGTTACCCGCGTTGAAGCCGCCGGTGTTG
+AAGCTGCCGGTATTGAAATTGCCGGTGTTGAAGTTACCGGGGTTGAAGCCGCCGGTGTTGCCGTCGCCCG
+AGTTGAACAAGCCCGTGCTGGTGCTGCCCGAGTTGCCGATGCCGAAGTTTCCGGTGCCGGTGTTGCCGAT
+GCCGAAGTTCCCGGTGCCCGAGTTAAAGAAGCCGATGTTTCCGTCGCCCGAGTTGAACAAGCCGATGTTT
+CCGCTGCCCGAGTTCAGAGCGCCGATCCCGATTTGGCCGGTACCGGTGAGCCCGATGCCGATATTGTTGC
+TGCCGGTGTTGGCAAAGCCGATATTGTTGCTGCCGGTGTTGGCAACGCCGATGTTGTAGCTGCCTAGGTT
+GGCAAAGCCAGGTTGTCGTCGCCGAAGTTTCCGAAGCCGATGTTGTAGTTGCCCAGATTCGCCACGCCGA
+CGTCAAAGATCCCGGTGTTGCCGAAGCCGGCGTTATTGCTGCCCAGGTTTGCCAGCCCAAGGTTCAGAGT
+CATCGTGCCCATACCGTCGCGCATGAGACCGGAGGCAAAGGCCGGCGTCACGAGGTCCAACGCGCTCGCG
+TTGTAGAAACCCGAGACGGTGTGACCCACGTTAGTCACACCCGACCCCAGCGCACCGACATTGAGATAAC
+CCGAAATCCCTGAGGCGCCGGCGACCACGTTCAAAAAGCCCGACGCGCTGCCCGCTCCGGAGTTGAAGAA
+GCCCGACGACGGACTAGTGGTCGAGTTGCCGAAGCCCGATGTCGCGGGAATGTCGATGATCGGGATGGTG
+ATGGAGCCGATACCGGCGCTGGCGGTGATACCGATCGAGGTGGTGGGTCCGCCCACGGTGATCGCCGCCG
+TGGGCAAGGTGATATTGATGGTCGGGATGATGATGGGGGTGAAGTCGATATTATTTTCGGCAGCTACGAT
+GCTGAAGCCCTGGAGGGTGACGACCCCGGCGTCGATGTTGATGGGTATATGTATCGGGATGTCGACGCCA
+AAGGTTAGGGCGATTTCGGGAATCGCTAGCGCCGCGTGCAAGCCAATGAGGCCCTGATAATTTCCACTCC
+ACAAGAACCCGTTGCTGTAGCTGCCGGAGATGAAGGCGCCGGTGTCAACATCGCCGGTGTTTCCGAGTCC
+CGTGTTGTAGCTGCCTGGGTTGAAATCCCCGGTGTTGGAATCGCCCGGATTGAAGCTGCCGGTGTTGAAG
+CTGCCGGTGTTGCCGATACCGGTATTGACGTCGCCGGAGTTGAAGAAGCCGGTGTTGGTGCTGCCGGTGT
+TTCCAAGCCCGAAGTTTGCGGTGCCGGTGTTGCCGATGCCAACGTTTCCGTTGCCCGAGTTGAAAAAGCC
+GATGTTTCCGCTGCCCGAGTTGAACAAGCCGATGTTTCCGCTGCCAGAATTCAGGGAGCCGAACCCGATC
+TGGCCGTCGCCCGTGAGCCCAATGCCGATATTGTTGCTGCCGGTGTTCGCGAACCCGATATTGTTGCTGC
+CGGTGTTGGCGAAGCCCAGGTTGTCGTTGCCCAAGTTTCCGAAGCCGACGTTGTAGCTGCCGAGGTTTCC
+GAAGCCCAGGTTGTCATCGCCGAAGTTTCCGAAGCCGATGTTGTAACTGCCCAGATTTGCCAAACCGATG
+TCGAATATTCCGGTGTTTGCGCCGCCGATGTTGTTGCCACCGATATTGGCGCTGCCGAAGTTGGCGCTGC
+CGAGGTTTGCAAAGCCGATGTTGTAGTCGCCGAGGTTTGCAATGCCGACGTTGAGGGTGCCGTGGTTTGC
+CAAGCCCAGGTTGAGGACCATGGTGCCCGTGCTGTCGCGCAGCAGGCCGGCGATACTGGTGCTGATGTTG
+GCCAGGCCTGAATTGAAGGCCGGCGTCGCGAGGTCCGACGTGCTGGTGTTGTAGAACCCCGAGACGGTGG
+TGCCCACGTTCGCCAGACCTGATCCCAGGGCGCCGACGTTGAGGAGCCCCGACGCCCCCGAGGTCGCGGA
+GGCCAGGTTCCAAAAGCCCGAATTGGCGCCGCCGAAGTTGCCGAAGCCCGAGGCGCCGCCGGCGCCGGTA
+TTGAAGAAACCTGACGACGGGTTGGTGGTCGAGTTTCCGAAACCTGGCGCCGCCGGGATACTGATGAGCG
+GGATCCTAATGGCGCCACCGCCAGTTATGGTGATCGCGGTATTCGGCCCTCCTATGGCGACTGTCGTCGT
+GGGGCCGACAACCGTGATGTTCGGAATGGTAATGGGGCCAAAGTGGGCTCGCTGGCCCGCTATTGACGAA
+AGGACGATATCGCCGGTGGGCGGAATCGTGACGCCCATAAGGGTGATGTTGCCGGCCGAGGCGGTGATCG
+GGATATCGATGGGAATATTCACGCCGAGGCTTATGGGGAGAGGCATATCGATCACCAGGTTGAGGCCGAC
+CAGGCCCTGGTAATCGCCGCTTAAGAACAACCCGTTGCTGTAGTTTCCGGTGATGAAAGCCCCGGTGTCA
+ACGTCGCCGGTGTTGGCGATGCCGGTGTTGTAGTTGCCAATGTTGAGGTAGCCGGTGTTGGTATTGCCCG
+GATTGAAGCCACCGGTGTTGAAGCTGCCGGTGTTGAAGCTACCGGTGTTGAAGCTGCCCGGGTTGAAGGC
+GCCCGTGTTGACGTCGCCGGAGTTGAATAGGCCGGTATTGGTGTTGCCGGTGTTTCCGATGCCAGTGTTG
+AAGCTGCCCGAGTTTGCGATGCCGAAGTTGCCGCTGCCGGAATTGAAGAATCCGATGTTGTTGCTGCCCG
+AGTTGAACAAGCCGATGTTTCCGCTGCCCGAGTTGAAGCTGCCGAACCCGATCTGTCCGTTGCCCGTGAG
+CCCGATGCCGACATTGTTGCTGCCCGTGTTCCCAAAGCCGACATTGTTGCTGCCGGTGTTCGCAAAGCCG
+ATGTTGCCGCCGCCCGCGTTAGCGAAACCCAGATTGTCGTTGCCGACGTTGCCGAAGCCGATGTTGTAGC
+TGCCGAAGTTGCCGAAGCCCAGGTTGTCGTCGCCAAGGTTTCCGAAGCCGATGTTGTAGCTGCCCAGGTT
+CGCCAGGCCGACATCGAAGATTCCGGTGTTCCCGATGCCGACGTTGTTGTGGCCGATGGTGGCGCCGCCG
+AAGTTAAAGCCGCCGAGACTTGCGAAGCCCACGTTGAGGTTGCCGTGGTTGGCCAAGCCCAAGTTAATAG
+CCGCAGTACCCGCGCCGTCGCGCAGCAGGCCGGCAATATTGGTTCCGATATTTGCCAACCCGGAGTTAAC
+GGCGGGCGTCGAGAGGTCCGACGTGCCCACGTTGTAGATACCCGAGATGGTGTTGCCCACATTCGCCACA
+CCCGATCCCAGCGCGCCGACGTTGAGGAAGCCCGACATTCCCGACGTTGTGGAGACCAGGTTCATAAAGC
+CCGACGCGGCGCCCCCGAAGTTGCCGAAGCCCGAGGCGCTGCCAGCGCCGCTATTGAAGAAGCCCGACGA
+CAGTCCGCCGGTCGAGTTGCCGAAGCCTGGAGTCGCTGGAATATGGATAATCGGGATGTTGATGGCGTCG
+ACGCCCACAGTGGCGCCGATATTGATCGCGGTAGTGGGTCCACCCACCATGACCACAGGTGTGGGACCGG
+TTATCCGTATCACTGGGACGGTGAAGGGGTCGATATCGACGGGTCCGAAAAAAATAACAGTGACGGCTGT
+GTTCGGTGGAAGATCGAGCCCGCTGTATACGATGTCCGTGAAGCTGGCGGTGATCGGTATGTGAATCGGG
+ATATTCACGTCGACGCTCACAATCGGGATTTCGGGAATGTCGACGCCGATGGCGAGGTCGATCAGACCCT
+GGTTGTCGCCCCGCCACAGAAGGCCGTTGCTGTGGTTGCCGGAGATGAAAGCGCCGGTGTTGATATTGCC
+GGTGTTCGCCATGCCGGTGTTGTAGTCGCCGGTGTTGAAGTAGCCGGTGTTGTAGTTACCTGCATTGAAG
+CCACCGGTGTTGACGCTGCCGGTGTTGACGCTGCCGGTGTTATAGCTGCCCGGGTTCAAGCTACCCGTGT
+TGAGGTCTCCGGAGTTGAACAAGCCCGTGTTGGTGCTGCCCGCGTTCCCGATGCCGAAGTTTCCGGCGCC
+CGAGTTTCCGATGCCCCAGTTTCCGGTGCCCGCGTTTCCTATCCCGAAGTTTCCGCTGCCCGAGTTGAAC
+AATCCGATGTTTCCGTCACCCGAGTTGAACAAGCCGATATTGTGGCTGCCCGAGTTCAGGCTGCCGAACC
+CGATCTGGCCGCTGCCGGTGAGCCCGATCCCGATATTGTTGCTGCCGATATTCGCAAAACCGATATTGTT
+GTCACCCGTGTTCGCGAAGCCAAGATTATTGCTGCCGGTGTTCGCAAAGCCGATGTTGTAGCTGCCCGCG
+TGGGCGAAGCCCAGGTTGTCGCCGCCTAGATTGCCGAAGCCAATATTGTAGTCGCCCAGGTTTGCCAAGC
+CCACATTGAAGATTCCGGCGTTTGCACCGCCGACATTGTTGCCGCCGACGTTTGCCAACCCGAAGTTAAG
+GGTCATGGTGCCCACGCTGTGGTGCAGCAGGCCGGAGTTAAAGGCTGGCGTCGCCAGATTCGACGTGCTC
+GTGTTGTAGAGACCCGAGATGGTGTTGCCAACGTTAGCTACACCCGATCCCAGCGCGCCGACGTTCCCGA
+AGCCCGAAAGTCCCGAGGTTGCCGAGGCCAGGTTCCAAAAGCCCGAAGCGCCGCCGCCGAAGTTGCCGAA
+GCCCGAGGCGGTGCCGGCGCCAGCGTTGAAGAAGCCCGACGACGGGCTGGTGGTCGAGTTCCCGAAGCCC
+GGGGCCGCCGGAATCTTGATGAGCGGGATGCTGACGCCCCCCACCATGCCGGTGAGGTTGCCGTCGATCG
+TGGTGGTTGGTCCGCCCACGGTGATCGTCACCGTGGGAAGGGTGAGCGTGGATTGCGGGAGCTCGACCGG
+GCCGTAGTAAACAACGAAGGGAACAATGGATGTGAAGGGCAAACGCATGCCCGGAATCGTCATCACGCTT
+CCGGGCATGACCATCACCTGATGTATCGGCATGCTGAATAGCTGCGCGTTTATCGGAATGGCGGGAATCT
+CGAGGGCGATATCGGCACCGATCAGGCCTTGGTAGTCGCCCCGCCACAAGACGCCGTTGCTGTAGTTGCC
+GGCGATGAAGGCGCCGGTGTTGACGTTGCCGGTGTTGGCCACTCCAGTGTTGTAGTCGCCGGTGTTGAAG
+TAGCCGGTGTTGTAGTTACCTGCGTTGAAGCTGCCGGTGTTGTAGTTGCCGGTGTTGAAGTTCCCGGTGT
+TGTAGCTGCCCGGGTTGAAGCCGCCGGTGTTGACGTCGCCGGTGTTGAACCAGCCGGTGTTGGTGCTGCC
+CGTGTTGCCGAGGCCGAAGTTTCCGGTGCCGCTGTTTCCGATGCCGAAATTGCCGGTGCCCGAGTTGAAC
+AACCCGACGTTTCCGCTGCCGGAGTTGAACAGGCCGATGTTGTGGCTGCCCGAGTTGAAGCTGCCGAACC
+CGATCTGTCCGTTGCCGGTGAGCCCGATGCCGACATTGTTGCTGCCCGTATTCCCAAAGCCGACATTGTT
+GCTGCCGGTGTTCGCAAAGCCGATGTTGTGGCCGCCCAGGTTGGCCAAACCCAGGTTGTCGCTGCCCAGG
+TTTGCAAAGCCGAGGTTGTAGCTGCCCAAATTGCCGAAGCCGACGTTGAACACGCCGACGTTTCCGTTGC
+CCACGTTGTTGGCGCCGACGTTTGCCAAGCCGAGATTGAAGCCCGCCGCGCTCGGGGGGCCGGCAGCGGC
+TGCCGCGGCGCTGGTCAGCCGCTCCGATAGGCCCGCCAGCTTCTTCAGCTGCTGGGTGAACGGCATCAAC
+GCGGAGACGGCCGCCGACGCTCCAGCGTGATAGCCAACCATCGCGGCCACATCCTGGGCCCACATCCGCT
+CATAGGCGGCCTCGGTGGCCGCGATCGCCGGAGCGTTGAATCCCAGCAGATTCGAGCTCACCAGCGACAC
+CAGCACGGCGCGGTTGGCCGCGACGATCGCCGGATGCACCGTCGCTGCCCGCGCCGCCTCGAACGTGGCC
+ACGGCTACCCGTGCCTGAGCGGCGGCCTGCTCAGCCTGGGCCGTTGCCGAAATCAACCAGCCCAGGTAGG
+GGGCTACCGCGCGCGCCATCGCAACCGCCGCGGGGCCGCGCCACGCCGCATCCGCCAGGCCCGAGGTCAC
+CGACCCAAACCACGACGCCGCCACCGCCAGTTCGTCGGCTAGTCCGTCCCAGGCCGCCGCGGCCGCCAAC
+ATCGGCCCCGATCCGGCCCCGAGATACATCCGTAACGAATTGACCTCGGGCGCCGACACCACGAAATCCA
+TCCGTCATACCCGTTCGTCAGCTGGCCGTCGGAGGTACGTTCAGGCTAATCAATCGTCTACTACTCGACT
+AGCCCGTGAACGGGTGAAAAATGCTAGGACATTCACGTATTGGCCCGAGTGGGGCTGGTCGAGTATCAGG
+GGAAGCTTTATGGGGCAAAGTCAAGTTTGTGGTTCGTCGTATCGGGGCGATCCAACCGAGCACATGTTTA
+GTGCACCAGAACGACGGGCCGTGTATCGGGTGATCGCCGAACGCCGAGACATGCGCCGGTTCGTGCCCGG
+CGGTGTGGTGTCCGAGGATGTGCTGGCGCGGCTGTTGCACGCCGCACACGCCGCGCCCAGCGTCGGTCTG
+ATGCAGCCATGGCGCTTTATCCGCATCACCGACGAGACACTCAAGCGACGCATCCACGCGCTCGTCGACG
+ACGAACGCCTACTCACCGCCGAAGCCCTGGGAGCACGGGAAGAAGAATTCCTGGCGCTGAAGGTCGAGGG
+CATTCTCGACTGCGCCGAGCTGCTGGTGGTGGCGCTGTGCGACCGCAGAGGGTCCTACATCTTCGGCCGG
+CGCACCCTGCCCCAGATGGATCTGGCGTCGGTGTCGTGCGCCATCCAAAACCTGTGGCTGGCAGCGCGGT
+CCGAAGGCCTGGGCATGGGATGGGTGTCGCTGTTCGACCCACAACGTTTAGCGGCCCTGCTGGCGATGCC
+CGCCGACGCCGAACCGGTGGCCATCTTGTGCCTGGGGCCGGTGCCCGAGTTTCCGGACCGGCCCGCGCTG
+GAACTGGATGGCTGGGCCTACGCGCGGCCACTCGCGGAATTCGTCTCCGAAAACCGATGGAGTTATCCGT
+CGGCGCTGGCCACAGATCACCATCACGGCGAATAGGTCACGCCGACCGCGAGGTTGACGTATTCGGCCGG
+CACGTCAAAGGCCAGCGATCGCCGCGGCAAGCGGCTCAACACATCTTCACCGATAGTGGCCTTGAAGTGC
+AGCGCGAGCTGGCCGCTGAACTTCGGGTCGACATCGGCGACATCGAGATCGAGTTGCAGACCCGTCGGCG
+AGATTTCGGCGGTCGCGGCACCGGCCTGCGGCCCGTCCCAGCGCGCGTCGACGACCCGGCCGGCTAGCTT
+CGGCACCATCGACAGGGTTCCCAGCACCCGCTGTTCGGTGAACGCCAGCGCACCCACGTAGCTGGCGATG
+CTGTGCGATGCCCGCAGCCCCGGGATAACGCCGGTGAACCGCCTGGTGACGGCCACGTATTCGGCAAGGT
+AGATGAGTCCCTCAGCCTCAACCTGACAGCGTAGGTCAGCAGGCAGCCTGCCGAGACCAAACCACTTGCG
+AACAATGACAGCCATGAGGCCAGTATGGAGTCGTTTTGTCGGTGCCGCACCGATGCTGGTAGGAGTTAGA
+GCATGACTCGCCCGCAAGCGCTTCTCGCTGTTTCGCTCGCTTTTGTCGCAACCGCGGTGTATGCCGTCAT
+GTGGGTGGGGCACTCCCAGGATTGGGGTTGGCTGCATAGTTTCGATTGGTCGTTGTTGAACGCAGCGCAC
+GACATCGGGATAAAGAACCCTGCGTGGGTGCGCTTCTGGGATGGTGTATCCCTGATCTTGGGCCCAGTCG
+TGCTGCGGCCGCTGGGTTTGCTGGCCGCGATGGTCGCACTGGCGAAGCGCAAGATACGGATAGCGTTGTT
+GCTGTTGGCCTGTTTACCGCTCAACGCGATCATGACGATCGCGGCCAAATCCGTGGCCCACCGCCCGCGA
+CCGGCGACTGCGCTGGTATCTGCCCATTCGACTTCGTTTCCGTCAGGGCATGCGTTGGAGGCGACCGCAA
+GCGTACTCGCGCTGCTAACCGTCCTGTTGCCCATGCTGCACAGCAGGTTTACTCGGCACATCGCCATCAC
+GGTGGGCGCGCTGTGCGTGTTGACGGTCGGTGTTGCCAGGGTGGCGTTGAACGTGCATCATCCGACCGAC
+GTTGTTGCCGGCTGGGCGCTGGGGTACCTGTATTTCCTCGTGTGCCTGTGCGTATTTCGACCGCCGTCGA
+TATTCGGTGCCCAACGCGCGTCTCATGCTTTGTCGCCGCCAGTGGAGGTGTCGAGACAACCCGAACCGGA
+AGTCGACACGGCCCGCTAAAGCCATGGTGCGCTGTGCATTTCGCTTTGTCACCGCACAGTGACCCAGCCG
+GATTCTAACCTTGACTTGACCACACGAGGTGATTGTCTGACGATTGAGCGATGAGCCGACTCCTAGCTTT
+GCTGTGCGCTGCGGTATGCACGGGCTGCGTTGCTGTGGTTCTCGCGCCAGTGAGCCTGGCCGTCGTCAAC
+CCGTGGTTCGCGAACTCGGTCGGCAATGCCACTCAGGTGGTTTCGGTGGTGGGAACCGGCGGTTCGACGG
+CCAAGATGGATGTCTACCAACGCACCGCCGCCGGCTGGCAGCCGCTCAAGACCGGTATCACCACCCATAT
+CGGTTCGGCGGGCATGGCGCCGGAAGCCAAGAGCGGATATCCGGCCACTCCGATGGGGGTTTACAGCCTG
+GACTCCGCTTTTGGCACCGCGCCGAATCCCGGTGGCGGGTTGCCGTATACCCAAGTCGGACCCAATCACT
+GGTGGAGTGGCGACGACAATAGCCCCACCTTTAACTCCATGCAGGTCTGTCAGAAGTCCCAGTGCCCGTT
+CAGCACGGCCGACAGCGAGAACCTGCAAATCCCGCAGTACAAGCATTCGGTCGTGATGGGCGTCAACAAG
+GCCAAGGTCCCAGGCAAAGGCTCCGCGTTCTTCTTTCACACCACCGACGGCGGGCCCACCGCGGGTTGTG
+TGGCGATCGACGATGCCACGCTGGTGCAGATCATCCGTTGGCTGCGGCCTGGTGCGGTGATCGCGATCGC
+CAAGTAACCCCGGACCTCGATTGTGAACTGTGCGACGGGTTTTCGGCGTGTTGCGTCGTGAGATTCACGT
+TCGGCGTCAATCGGCCAGCGCGCGGCCCGGCCTGATGTTGAAGTTAAGGCCCGCCAACGACATGGTCGCC
+TCGTAGGTTCGGTCGTAGCCGGTGGCGCTGATCCGCCAGCCGTCGGTGGTTCGTCGGTACTGGTCGTGGT
+AGAACGCGGCGCCGATGAGCATGAAATTGAACTCGGCGACGATGACCCGGTCTTGCAGGTACCAGATGCC
+GGTTGCGGTATCGCCGGTCACGGTGATTTCCGGATGGGTGACCCGGTGTTCGGTGATGACACCCGGGCCG
+AGTGCCTGGCGCAGGTAGTCGACCAGGTCGGCGCGGTTGGTGAAGTGCAGCTCCGTACCGACCGATGACC
+CGTAATCGCCGGTGACATCCTCGGCCAGGGTGTCGGTGAAGTCGTCCCAATGCTTGGTGTCCAATGCCCG
+CAGATACCGGTATTTGAGCTGTTTGATCGCTGCAATGTCGGCTGGATCACCCGGAGTCACCACGCCATTG
+CAGCACACCGGCTCACGGGTAGCTTTGGGGTATGAGCCAATCCCGGTACGCGGGGTTGTCCCGCAGCGAG
+CTGGCAGTTCTGTTACCCGAGCTGTTGTTGATCGGCCAGCTGATCGACCGATCGGGCATGGCCTGGTGTA
+TACAGGCATTCGGCCGCCAGGAGATGCTGCAGATCGCCATCGAGGAGTGGGCGGGCGCCAGCCCGATCTA
+CACCAAGCGCATGCAAAAGGCGCTGAACTTCGAGGGCGACGACGTGCCCACCATCTTCAAGGGGCTACAG
+CTCGACATCGGCGCGCCGCCGCAATTCATGGACTTCCGTTTCACCCTGCACGACCGCTGGCACGGCGAGT
+TTCACCTCGACCACTGCGGTGCGCTGCTCGACGTGGAGCCGATGGGCGACGACTACGTCGTCGGCATGTG
+CCACACCATCGAAGATCCGACGTTCGACGCCACCGCGATCGCGACCAACCCGCGCGCGCAGGTGCGCCCC
+ATCCACCGGCCGCCCCGCAAGCCGGCCGACCGGCATCCGCACTGTGCGTGGACCGTCATCATCGACGAGT
+CCTATCCCGAGGCTGAGGGTATTCCGGCGCTGGACGCGGTCCGTGAAACCAAAGCTGCCACCTGGGAATT
+AGACAACGTCGATGCGTCTGACGACGGGCTGGTGGACTATTCGGGTCCGCTGGTGTCCGACCTGGACTTC
+GGGGCGTTCTCGCATTCCGCACTGGTGCGGATGGCCGATGAGGTCTGCCTGCAAATGCACCTGCTGAATC
+TGTCGTTCGCCATTGCCGTGCGGAAACGGGCCAAAGCCGATGCTCAACTGGCCATTTCGGTGAACACCCG
+CCAGTTGATCGGAGTGGCCGGGCTGGGCGCAGAACGCATTCACCGTGCGATGGCTTTACCCGGCGGAATC
+GAAGGCGCGTTAGGTGTGCTGGAGCTACACCCGCTGCTCAACCCGGCCGGTTACGTGCTGGCCGAAACGT
+CGCCGGACCGTCTGGTGGTGCACAACTCGCCAGCCCACGCCGACGGCGCCTGGATTTCGTTGTGCACACC
+GGCATCCGTGCAGCCGTTGCAGGCCATCGCCACCGCTGTAGACCCGCATCTGAAGGTTCGGATCAGCGGG
+ACGGACACCGACTGGACCGCGGAACTCATCGAGGCCGATGCCCCAGCGAGCGAACTGCCGGAGGTGTTGG
+TAGCCAAGGTCAGTCGCGGATCGGTCTTCCAGTTCGAGCCGAGGCGCTCACTGCCGTTGACCGTGAAATG
+AGCTCGATGCGATCTGTCAAGTCGGTGGCGGTACCGCTTCGGTGACACCACCGCATCGACCGCATACCAA
+TGAGGTTGTCACCGAACCGTATACGGCCCACCCGCCGCTATGGTTAACGCTGGCCACCGACCCCTATTGA
+CGAAAGCCTTCCGCTATGTACGACCCGCTGGGGTTGTCGATCGGGACCACAAACCTGGTCGCGGCGGGTA
+ACGGAGGTCCGCCGGTTACTCGTCGCGCCGTGCTGACCCTGTACCCGCATTGCGCACCGAAAATCGGTGT
+GCCTAGCCAGAACCCGAACTTGATCGAGCCGGGCGCCCTAATGAGCGGCTTTGTTGAGCGCATTGGAGAT
+GCGGTGGCGCTGGTGTCTCCCGACGGATCCGTGCACGATCCAGACCTCTTGCTGGTCGAGGCGCTGGATG
+CGATGGTGCTGACCGCCGGTGCGGACGCGAGTTCCTCGGAGATCGCCATTGCCGTTCCCGCGCATTGGAA
+GCCCGGAGCTGTACACGCACTGCGTAACGGTTTGCGGACGCACGTCGGCTTCGTCCGCAGCGGCATGGCG
+CCGCGCCTGGTTTCCGATGCGATCGCGGCGTTGACCGCGGTGAACTCGGAATTGGGCCTGCCCCACGGCG
+GTGTGGTGGGGTTGCTTGATTTCGGTGGCTCCGCGACTTACGTCACCTTGGTGGAGACCAAGTCGGATTC
+CAGGACGTCGGATTTCCAGCCCGTTAGTGCCACGGCACGGTACCAGGACTTTTCCGGTAGTCAGATCGAC
+CAGGCTTTGCTGCTTCGGGTCATCGACCAATTCGGGTACGGCGATGACGTCGATCCGGCCAGTACCGCCG
+CGGTCGGGCAACTCGGCCAACTCAGGGAGCAGTGCCGTGCGGCAAAGGAACGACTGTCCACCGACGTTGC
+CACGGAATTGTTCGCTGAGCTTGCCGGGTGCAGCTCGAGCATCGAGATGACTCGGGAACAGCTCGAAGAC
+CTGATCCAGGATCCATTGACCGGCTTCATCTACGCGTTCGACGACATGCTGGCGCGCCACAACGCGAGCT
+GGGCGGATCTCGCGGCGGTGGTCACCGTCGGCGGTGGTGCCAATATTCCCCTTGTGACTCAACGTCTTTC
+GTTCCACACTCGTCGACCTGTGCTGACCGCGTCGCAACCCGGGTGCGCGGCGGCGATGGGTGCGTTGCTG
+CTCGCCAACCGTGGGGGAGAGCGCGATTCGCGAACGCGGACGTCCATCGGCCTCGCCACGGCCGCAGCCG
+CCGGCACCAGTGTCATCGAGCTGCCGGCCGGCGACGTCATGGTCATCGACCATGAGGCCTTGACCGATCG
+CGAGTTGGCCTGGTCGCAGACCGACTTCCCAAGCGAAGCTCCGGCGCGTTTCGAGGGCGACTCGTATAAC
+GAAGGCGGCCCCTGCTGGTCGATGCGTCTGAACGCGGTCGAGCCCCCCAAAGGACCAGCGTGGCGGCGAA
+TCCGGGTGTCGCAGTTGCTCATCGGGGTGTCGGCGGTAGTGGCCATGACCGCGATCGGGGGCGTGGCATT
+GACGTTGACAGCCATCGAGAGACGCCCAAGCCCGCTACCAACCCCAATTGTGCCCGGCCTGGCCCCGATG
+CCGCCCGGATCCGTCGTGCCTAGCTCGCGCGCACCGACCCCGCCGCCACCGCCGTCGACCGTTGCGCCGC
+TTCCCAGTGCGGCACCGGCCCCGACGACGGTCGCGCCGGCACCGCCGCCGCCCACACAGGTGGTGACGAC
+CACGACAGCGCCACCCGTCACCACGACGCCGAGGCCGTCGCCGACCACCACAACGACCACCGCGCCACCG
+TCGACAACGACGACAACCGAGCTGCCGGTGACGACCACTTCGACGATTCCAACGATTCCGACGACTACGA
+CGACGGTGAAGATGACCACGGAGTGGTTGCACGTCCCGTTTTTGCCCGTTCCGATCCCGGTCCCGATTCC
+GCAAAATCCGGGTGCCGGCGAACCGCAGAACCCGTTCGGAAGCCTTGGCTCTGGGTGAGCCGCGTTCCCC
+GGAGCTGGCCCCGTCGGTGTCAGGTCCGTAGTATCGGTATGGGTTGCTGAGGAGGTCGTGTGGGCGACTA
+TGGTCCGTTTGGATTCGATCCCGACGAATTCGATCGGGTGATCCGGGAGGGGAGCGAGGGACTGCGCGAC
+GCGTTCGAGCGGATCGGCAGGTTCCTCAGCTCATCCGGCGCGGGAACGGGCTGGTCGGCAATCTTCGAGG
+ACTTGTCCCGGCGCTCGCGTCCGGCGCCGGAGACCGCCGGCGAGGCCGGTGACGGTGTGTGGGCCATCTA
+TACGGTGGACGCCGACGGTGGTGCCCGCGTTGAACAGGTGTATGCGACCGAGCTTGACGCCCTGCGCGCG
+AACAAGGACAACACCGACCCGAAACGCAAAGTCCGCTTCCTGCCATACGGCATCGCGGTCAGCGTCCTCG
+ACGATCCGGTGGACGAGGCCCAGTAACGTCAGCCCTGCTGGACGCTGTTGGAACCGCCGGCATTGCTGAT
+CTTCGGCGAGCCCGAGTGATACGTGACCTCGTTGTTGAAGCCGGCGGCTTCGATGGTGTCGACGGAGTCG
+GCGGTGACCGAGTTCCTCATGCCGGACACGGTGAGGCTGGTGCAGTGGCCGGTGATCACCACCGTGTTGG
+ACATGCCGCTGACGCTGACAATGCTGTCGTTGCAGGCGATTGTCCGGTTCACGTTGACGCCGGAGACGCT
+CAGGCTGGCGCCGGCCGGCGGAAGAGTGGTGGCCGGTTGCGCAGTCGGGGTTGGAACAGCCCGGGAGACA
+GACGGGGTGGGCGAGAGAACGACGAAGTTGCCTTGGGAAAGCCGCTGTGCGCTGAATGCGGCGATGCCAC
+CCACCAGAACCAGCACGCCGACAACGACGACCGCGGCCAGGATCCACCACGCCCTGTTGCCGGAGGACGA
+TCGCGGCGATGGGCCGCCGAACGGGCCGCCATAGCTATACGGCGGCGGTGGCGGGCCGGGTGGATAGGTG
+TAGCCGCCCGACTGCGAGCCGCCGAGTTCGGAGGCGCGTGCCACGTCGGCTAGCGGCCGCTCCAGTTCCC
+GGATTCGCGCCTCCGGGTCATCCTCTGGGTTCATGCACAGATGCTCCCACACGACGATCATGCCGCATAG
+GTAGTTGCGCCCGGCGGCACCACACGATTCGGCTTGGCCTGCTATCGTCCCATGCTTATGCCTGAGATGG
+ATCGTCGCCGAATGATGATGATGGCGGGGTTCGGCGCCCTGGCTGCCGCGCTTCCCGCCCCGACAGCCTG
+GGCCGACCCGTCCCGGCCGGCCGCGCCGGCTGGTCCGACACCGGCGCCCGCCGCGCCGGCTGCGGCAACC
+GGTGGGCTTTTGTTCCACGACGAGTTCGACGGGCCGGCCGGTTCGGTCCCGGACCCGTCCAAGTGGCAGG
+TGTCGAACCACCGGACGCCCATCAAGAACCCGGTGGGCTTTGACCGGCCCCAGTTTTTTGGGCAGTACCG
+CGACAGTCGACAGAACGTGTTCCTCGACGGCAACTCCAATCTCGTGCTGCGCGCTACCCGAGAGGGCAAC
+AGGTATTTCGGTGGCCTGGTCCACGGCCTGTGGCGGGGTGGCATCGGGACCACCTGGGAGGCCCGGATCA
+AGTTCAACTGCCTGGCTCCGGGCATGTGGCCCGCCTGGTGGTTGTCCAATGACGATCCTGGTCGCAGCGG
+CGAAATCGACCTGATCGAGTGGTATGGCAACGGGACTTGGCCGTCGGGAACCACCGTGCACGCCAACCCG
+GACGGCACCGCATTCGAGACCTGCCCGATCGGTGTGGACGGTGGTTGGCACAACTGGCGCGTCACGTGGA
+ATCCGAGCGGCATGTACTTCTGGCTGGATTACGCCGACGGCATTGAGCCCTACTTCTCGGTTCCGGCGAC
+CGGAATCGAAGACCTCAACGAGCCCATCCGCGAGTGGCCGTTCAACGACCCCGGCTACACGGTGTTTCCG
+GTGTTGAACCTTGCGGTTGGCGGTTCTGGTGGCGGCGATCCCGCGACGGGTTCCTATCCACAGGAGATGC
+TCGTCGACTGGGTGCGCGTCTTTTAACGCCTCGCGCTCTTGCCCGGGGTGCTACCCGGCTTGCTCGGAGA
+AAGCATGGAGTTTTTGGTCACCATGACCACCCGCGTTCCCGATAGCATGCCCGCGGACGCAGTCGAGCGG
+GTCCGTGCCCGCGAGGCTGCCCGCTCGCGCGAGCTCGCGGCACAGGGAAAGCTACTCCGCCTGTGGCGCC
+CGCCGCTGCGGCCGGGCGAATGGCGCACCCTGGGGCTGTTCGCCGCCGACGACAACGGCGAACTGGAGCA
+GCTGCTGGCCTCGATGCCGCCGCGGTCGTGGCGCACCGACGACGTCACGCCGCTGGGTGCTCACCCGAAC
+GACCCGGTTGGCCAGGGGATAACCATCGCGCCGGGTAAGGGTCCGGAGTTTCTGATCGCGACGACCATTA
+TGGTGCCACCGGGTACCCCGGCTCAGGTGGTCGACGACACCGTGGCGCGCGAGGCTCGCCGCGCGCCCGA
+GCTGGCCGGGCGGGGACACCTGGTGCGGTTGTGGGCACTACCCGACGGACCGGACGGCCAGCGCACCCTG
+GGGCTGTGGCGGGCTCGCGACCCTGGCGAGCTGATGGCCATCCTGGAATCGCTACCGCTTGCTGGCTGGA
+TGACCATCGAGACCACGCCGCTGAGTCCGCATCCCGATGATCCGATCCGCATGCCCTGACCGTTTCCGGT
+GTCGCCGGGCTCTTAGGCGCCGTCCCACTCGCCGCGGGCGATGAGAACATCACGAAGTAGGTCCGCGCGA
+TCGGTGATGATGCCGTCCACGTCCATGTCGAGAAGGGTGTGCATCACATCGGGTTCGTCGACGGTCCAGG
+CATGCACTTGGCGTCCCGCAGCATGAAAGCCGCGGACCCGTGCCGGCGTAATGACCGGTACACCGCCAAG
+CCGTGACGGTAGTTGCACGCAGTCGATGTCGCGCATCATCCGCCAGGCATATGCCCGGCTGCCCAGCGGA
+CGCGCGGTCAGCCACGCCAGCAGCGCGCCCGTTCCTGCCGAACTAGCGACCCGCTTGGTCAGCAGGCGCA
+ATGCGCGCCGGCGACGGCGCTCGGAAAACGAACCGATCAGCACCCGGTTGTGCGCGTTGCACCGCTCGAT
+GACGTTGACGGTCGGCTCGATCGCCGATGCGGCTTTAATGTCGATGTTGACCCGCATGTCTGGCAGCGCG
+GTAAGCAGGTCTTCCAGGGTTGGGATCGACTGCCCCGCACCCAGCTGCGCCTTGCGGACATCACGCCAAT
+CCAACCGGTCGACCGCGCCGGATAACCCCACCCCGGGCGCCAGCCTACGGTCATGCAGGATCACGGCTAC
+GCCGTCCCGGGTGGCGCGAACGTCGGTCTCGATGTAGCGGAATCCGAGCTTGGCCGCCTCCTGGAACGCC
+CCCATGCTGTTCATGGGCAATCTGAACGACGTAAATCCTCTGTGCGCCATGGCAATCCGCCCCCCATGGC
+GAAGAAATTCCACGGTAGGTGCGCCACCGTCGCTCATCAGGTCAGTATCACATAGCCTCGGCCGCCGGGG
+GCGTCCACGCCGGGGGCAGCACCGCTCTGTCGGCGACGGTTCCTGTGCACCAGCCGCTTCCGCATCGCAG
+TGGTAATGGGCGCTCCCATACGGCGCGGTCGGCGACGACGGTGCATGGGCCGGCCATCGTTTTGGGCCTT
+CCCCGCCTTGCCGCCGGGCCACCGACGTTCAGCATCACCATCAGCGTCGACGTGTCACATCGGAGCCGAT
+GACGGGAATCGAACCCGCGTATTCAGCTTGGGAAGCTGATGTTCTGCCATTGAACTACATCGGCACGGTT
+GCCTCGAAAGGCTAGCATCCAGAATCATTCCATCACCCCCAGGCCGTACAAGATCAGAAATCCGGCAAAG
+AACATCACGGCCATCCATGGCCGCTCCGGCGTTTCGTGCGCCTCGACAAGCAGTTCCTCCACGACCAGCC
+AGAGCAGCGCCGCCGCCGCGAACGCCAACACGAGGGTCAGGACGGTATTTCCCGCCCGGCCCAGCGCCAC
+GGCACCTGACACACCGCCCACCGCGATCACTAGGCTCAGGGCGCTTGTGGTCGCCGCGGCCCGGATCCTA
+GGCATTCCGGAGCCGGCCAGGCGCAGGGCCACCGCCAGACCCAGGAACAGCACCTCGACCGTCAGGGCGA
+TGGTGATGATGATCGCGGTGCGACTGGACACCGTCGCGCCCGTTGCGACCAGCAACCCGTCGATGAAGAG
+GTCAACCGCGACTACGGTGAGGAACCCGACGGGCAGTTCGCCCACGTCGTCGCCGTCTTGATGTTCCCCG
+TGGCCGTCAAATCGGCGCAGTGCAACGAGTACCGCGACGCCTGCACTGAAGCCCACAACGATCAGCCAGA
+GCGGACCTCTGCTGCGCAGGTCTGGTAGCACTTCCCCGGCCACGGCGGCCATGACAATTCCCGCGGCGAA
+ATGTTGGACGCCGCTGACCATCGCCGCCGACGGCGTGCGCACCGACGGGACCACGCCGCCGAGAATCCCG
+GCGAGAACCGGGAAGGTGACCAACGAGGCGGCCGTTGTGACGTTGCTGATGCCAACCTCCCGGTTTCGGT
+CGAAGATCTCGGCTCGGGCACGCTTGAACATTGTGACGGCTAGTGACAAATGCAGCGACTTTCGGGGAAA
+CGGGCATTGAAATAAGGAAGGAACAGCATGTCGAAGGTGCTGGTCACCGGATTCGGACCCTACGGCGTGA
+CGCCGGTAAATCCGGCACAGCTCACCGCCGAAGAGCTGGATGGTCGCACCATCGCCGGCGCAACGGTCAT
+CTCGCGGATCGTGCCCAACACGTTCTTCGAGTCGATCGCGGCAGCTCAGCAGGCCATCGCAGAGATCGAG
+CCAGCATTGGTGATCATGCTGGGCGAATACCCGGGACGCAGCATGATCACCGTCGAGCGACTCGCGCAAA
+ACGTCAACGACTGCGGGCGGTACGGCCTCGCCGACTGCGCCGGCAGGGTTTTGGTCGGTGAGCCAACCGA
+CCCCGCCGGCCCGGTCGCCTACCACGCGACCGTACCGGTTCGCGCGATGGTGCTGGCCATGCGAAAGGCC
+GGCGTGCCAGCTGACGTCTCGGACGCGGCGGGCACGTTCGTGTGCAATCACCTCATGTACGGCGTGCTGC
+ACCACCTCGCCCAGAAGGGTCTGCCCGTCCGCGCCGGTTGGATTCATCTGCCGTGCCTGCCCAGCGTCGC
+CGCACTGGATCACAACCTCGGTGTTCCGAGCATGTCGGTCCAGACGGCGGTCGCCGGGGTCACGGCTGGC
+ATCGAGGCAGCCATTCGGCAGTCCGCAGATATCCGCGAACCGATCCCGTCGCGATTGCAGATCTAGGGCG
+CAGCTGACGGCGGTCTTCTAGAGATTAGATATTTATTCTTCCGTTATCTTGTCGTAATCTGCTCAGCGTG
+GGCCGACATGAATTAGCTAGGGACCGGCGAAAGTCGTCAGCGGTCCTGGCTGCGGTCCTCGCCCCGGCCG
+CCGTGTTCTTCGCCACGGGCGGAGATGTCAGTACGCTTGCCGCCCGCGCCGATGCCAACCCGGTTCTCGG
+CGACGACGCGCCCTGTTGTGTGCAGATCGTGCCGGTTGCACCGCTGGCTTTCTCCTCACAGATATCCGGC
+GGTGAAATCGGGACGGGCCTTGCTGCCAGCCAGTTCGCTTCGGCATCGAGATGGCGCATCGTATCTCGGT
+ATTTGCCGGTAGGGGTGGCACCCGAGCAGGGTCTACAGGTCAAGACCGTCTTGACAGCCCGCAGTATCAG
+TGCGGCTTTCCCCGAAATTCGCGAAATCGGCGGCGTTCGGCCGGATGCGCTGAGATGGCATCCCAATGGT
+TTGGCGCTCGACGTGATGGTTCCCAACCCCGGCACCGCCGAGGGCATAGCGCTGGGCAACGAGATCGTCG
+CTTTCGTACTGAAGAACGCGACCCGATTTGGGATGCAAGATGTGATTTGGCGTGGCGCCTACTACACGCC
+CAACGGCGCGCGGACAACCGGGGCCGGCCACTACGACCACATCCACATCACGACCGTGGGCGGCGGGTAT
+CCCACCGGCGAGGAACTCTACATCCGCTGAGCCAGCGTGCGGCGACAGATACGCTCGTCGGGTGCTGCTC
+TCCGATCGTGATCTTCGGGCCGAGATCTCCTCCGGGCGGTTGGGGATCGACCCGTTCGACGACACCCTGG
+TCCAGCCGTCCAGCATCGACGTCCGGCTCGATTGCTTGTTTCGGGTGTTCAACAACACTCGCTACACCCA
+CATCGACCCGGCCAAGCAGCAGGACGAGCTGACCAGCCTGGTGCAACCGGTCGACGGGGAACCCTTCGTG
+TTGCACCCGGGCGAATTCGTGCTCGGCTCGACGCTGGAGCTTTTCACTCTGCCCGACAACCTCGCCGGAC
+GGCTGGAAGGCAAGTCTTCGTTGGGCCGGCTGGGCCTGCTGACGCATTCCACCGCGGGCTTCATCGATCC
+TGGCTTCAGCGGTCACATCACCCTGGAGCTATCCAACGTCGCCAACCTGCCGATCACTTTGTGGCCCGGC
+ATGAAAATCGGTCAGCTGTGCATGTTGCGCCTGACCAGCCCGTCCGAGCATCCCTACGGCAGTTCCCGGG
+CGGGGTCGAAATACCAGGGTCAGCGCGGGCCCACGCCGTCGCGCTCCTGCCAGAACTTCATCAGGTCTAC
+TTAGCATCCGGCGCGGCTAGGCCTGTCGCGGGTAGCTGTCACCTGCCGTTTGCCTGGTGCTCAGCGCCGC
+GATGCGGTTCGCTCATCGCAGCCACCTACACACAGTGGTGTGCGATGCAGCGTCTTCGGCACTGGGTATC
+TGGGTGCCACCCACGCCGTCGGTATGGCGCAACTGGGACACGAGGTCGTCGGGGTCGATATCGATCCCGG
+TAAGGTCGCCAAGCTCGCCGGGGGTGACATTCCGTTCTACGAACCCGGCCTGCGAAAGCTGTTGACTGAT
+AACCTGGCTGCCGGCCGCTTGCGGTTCACCACCGACTACGACATGGCGGCCGATTTCGCCGACGTGCATT
+TCCTGGGGGTCGGCACGCCGCAAAAGATAGGCGAATATGGCGCCGACCTGCGGCATGTCCACGCCGTCAT
+CGATGCGCTGGTGCCGCGTCTGGTCAGGGCGTCGATTCTGGTCGGCAAGTCGACAGTCCCAGTGGGCACC
+GCAGCCGAACTGGGACATCGGGCCGGTGCACTGGCACCCCGGGGAGTCGACGTGGAAATTGCCTGGAATC
+CGGAATTCCTGCGCGAGGGCTTCGCGGTGCACGACACCCTCAACCCCGACCGTATCGTCCTTGGGGTACA
+AGATGATTCGACGCGCGCCGAGGTAGCCGTCCGCGAGCTGTACGCGCCGCTGCTGGCAGCGGGCGTGCCG
+TTTCTGGTGACCGATCTGCAGACCGCGGAGTTGGTCAAGGTATCCGCCAATGCCTTTCTGGCGACCAAGA
+TTTCGTTTATCAATGCGATCTCCGAAGTGTGCGAGGCGGCGGGTGCCGACGTTAGCCAGCTGGCCGATGC
+GCTCGGATACGACCCGCGGATCGGACGCCAATGCCTCAACGCGGGCTTGGGTTTCGGCGGCGGCTGCTTG
+CCCAAGGACATCCGCGCTTTCATGGCCCGCGCCGGCGAACTGGGAGCCGACCAGGCGTTGACGTTCCTGC
+GTGAAGTGGACAGCATCAACATGCGCCGGCGCACCAAGATGGTGGAACTGGCCACCACCGCATGCGGTGG
+CTCGTTGCTGGGCGCCAATATTGCGGTGCTCGGCGCGGCGTTCAAACCCGAATCCGATGACGTGCGCGAT
+TCGCCCGCCCTCAATGTGGCGGGCCAGCTGCAGCTCAACGGCGCCACGGTCCACGTGTACGATCCAAAGG
+CCTTGGACAACGCCCACCGACTGTTCCCTACCTTGAACTATGCGGTTTCGGTTGCGGAGGCCTGCGAGCG
+CGCGGACGCCGTGTTGGTGCTTACCGAATGGCGGGAGTTCATCGATCTCGAACCCGCTGATCTAGCCAAC
+CGGGTGCGGGCCCGGGTGATCGTGGACGGCCGCAACTGCCTCGACGTGACCCGCTGGCGGCGGGCAGGCT
+GGCGGGTGTTCCGGCTGGGAGTGCCGCGATTAGGGCACTGACCGGCGCAGCCAGCGCAAGTACTCTCGGT
+CACCGAGCAGTTCCAGACGACGCCACAGCACGGGGTTGTCGGCGGACTGGGTGAAATGGCAGCCGATAGC
+GGCTAGCTGTCGGCTGCGGTCAACCTCGATCATGATGTCGAGGTGACCGTGACCGCGCCCCCCGAAGGAG
+GCGCTGAACTCGGCGTTGAGCCGATCGGCGATCGGTTGGGGCAGTGCCCAGGCCAATACGGGGATACCGG
+GTGTCGAAGCCGCCGCGAGCGCAGCTTCGGTTGCGCGACGGTGGTCGGGGTGGCCTGTTACGCCGTTGTC
+GTCGAACACGAGTAGCAGGTCTGCTCCGGCGAGGGCATCCACCACGCGTTGCGTCAGCTCGTTGAGCGGG
+ATCTGCGCTAGACCGTTATCCGGGTATGCGAGTAGTTGCACATGATCGACACCCAGGACCTGTGCCGCAG
+CGGCGAGTTCCTCCCGGCGCACCTCACCGAGGTTTCGGTCGGTCCGGCCGAGTGTGGAGGCCTCGCCGTG
+GGTGAAGCACAATCCTCGCAGCCGCGTTCCCTGCGCCGTGAAATCACCCAATACCGCCCCGAGCCCGAAG
+GACTCGTCGTCCGGATGGGCGAACACAGCAAGCACTTCGTGTGCGCAGGGGAGACGGTTGCAGCTGTTCA
+TCGATTCACCGTCCGGAGGATCCGTGCGCGCGGGTGGACAGCCGCCGCATATTATGTAGTTCCAATGAGC
+AATGGAATTATATTCCCAAGGATGACTGGAAATGGCTGGACAGTCCGATCGTAAGGCGGCGTTGTTGGAC
+CAGGTAGCGCGCGTGGGCAAGGCGCTGGCCAATGGGCGGCGATTGCAAATCCTGGACTTGCTCGCCCAAG
+GTGAGCGCGCGGTAGAAGCGATCGCGACGGCGACCGGGATGAACCTGACCACGGCATCGGCGAATCTGCA
+GGCGCTGAAGAGCGGCGGGCTGGTCGAGGCTCGCCGCGAGGGGACCCGGCAGTACTACCGGATTGCTGGG
+GAAGACGTGGCAAGGCTGTTCGCGCTGGTGCAAGTGGTTGCCGACGAGCATCTGGCCGACGTGGCGGTCG
+CGGCCGCAGACGTGCTCGGTTCGCCGGAGGATGCGATCACCCGTGCGGAGCTGCTGCGGCGGCGCGAAGC
+CGGCGAGGTCACCCTGGTCGACGTGCGACCGCACGAGGAATACCAGGCCGGCCATATCCCGGGCGCCATC
+AATATCCCGATAGCCGAACTGGCCGACCGGCTCGCCGAACTAGCTGGCGACCGCGACATTGTCGCCTACT
+GTCGTGGTGCCTACTGCGTCATGGCCCCCGATGCCGTCCGCATCGCGCGCGACGCGGGGCGGGAGGTGAA
+ACGCCTCGACGACGGAATGCTCGAATGGCGATTGGCCGGACTGCCGGTCGACGAGGGTGCACCGGTCGGG
+CATGGGGATTGATCGCCCGTGGGGCCGAAGGGAAGTCTACGTTTGGTGAAGCGGCAGCCAGAACTGCTCG
+TTGCCCAGCATGAACACTGGCAGGACACCTACCGAGCGCATCCGGTGCTGTACGGAACCCGCCCGTCAGA
+GCCGGGGGTATATGCCGCCGAGGTGTTCAATGCCGACGGCGTGCAGCGGGTGCTGGAGTTGGCGGCCGGT
+CATGGGCGTGACACCCTGTATTTCGCTGGCCAGGGCTTCACGGTGGTGGCCACCGATTTCAGCGACGTTG
+CCGTCGCGCAACTTCGCCGAAGTGCCCAAGCGCGCGGGGTCTCCGCGCGGGTGCAACCGATTGTGCACGA
+TCTGCGCCAGCCTCTGCCCGTCAAAACCGGTTCCATTGACGGCGCCTTTGCACACATGGCGTTGTGTATG
+GCGTTGTCCACCAGCGAAATTCATGCAGTCGTTGCCGAGGTCGGCCGGGTGTTGAGGCCGGGTGGGAAGT
+TCATCTACACCGTTCGGCATACCGGCGATGCGCACTACGGCGCCGGGCAGGCCCACGGTGACGACATCTT
+CGAGTGCGCAGGGTTCGCAGTGCACTTCTTCCGCCGTGAGCTGGTAGCGCGCCTGGCTACCGGTTGGGTA
+CTCGAGGAGGTACACGATTTCGAGGAAGGTGAGCTGCCCCGGCGGCTATGGCGGGTCACTGTCACCAAGC
+CCGCCTAGCCGGCGCTGTGGGATCAGCCGCAGGTGTGCACCGTGTTTGGGGACGGTGGTGATGTTGCGCA
+CCAACGGAGTCTCGCCTTTGGACGGGCCGGCGGCGGTGATGGTGAAGCGGCGGAAAATCTCTTGCAGGAT
+GACCGCTCCCTCGGTGAGGGCGAACCCGAAGCCGAGGCATCGGCGCACACCGCCGCCGAATGGCAGCCAG
+GTGTTGGGTGCCACGCTGCCGTCAAGGAACCGGCTAGGACGAAACTCTGTGGGTTTGGGGTGCGATACCT
+CGCTGGCGTGGGCCAACAGGATCGACGTGTTGACCACCGTCCCCGCTGGCAGTCGCCAACCACCGATCTC
+TGCCGGCGCGGTGACCTTGCGAGCGGTAGAAGCGATGACGGTGTGTCGGCGCATTCCTTCCTTGAGGACG
+GCCTCCAAGAATCCGTCGTCACCGCCGACGGCAGCCCAGACTACTTGGCTTTGGATTTCCGGAGCATGGG
+CAAGTTCCCACAACGTCCAGGACAGGGCGGCGGCGGTTGTCTCATGACCGGCCAGCAGCAACGTGATGAG
+CTGGTCGCGAAGCTCGGCATCGGTCAGCGGCTTAGTAGGCGTGTCCTTGGTTTGCAAAAGTCTGGATAGC
+ACGTCGGTTCGGGCGGTGAGATCGGAATCGATACGGCGGGAGGCGATCTCGCGGTAGAGGATCTCGTCTA
+TCTTGGTTTGGTTATGGAAGAAGCGCTTCCAGGGATTCATCCGCTTGAGCGACGGGTACGGAACGCCCGC
+GAGAATCGCGGGATGGATGTTTATGATCTGTTGCAGCCGACTAGTCAACTCGGCCTTGACTTTTGGGTCA
+GTGACCCCGAAAACGACCCGCAGGATGATGTCGAGGGTGAGCGCATTCATGTGGTCAAGACTGTTGATCG
+TTGCGTGGGGCCGCCAGCGCGTGATGTGTTCACGCGCAACGGAGGCGATCATGTCGCGGTATCCGCGCAG
+CGCGGCGCGGGTGAACGCGGGCATGAGCAGCGATCGCATCCGCGCGTATTCGGCTTCGTCGGTCATCAAT
+ACCGAGTGCTCGCCCATGACAAAACCAAGGATGTGGTTGCCTTCGCCCGCGTGCAGCGACCTCGGGTCGG
+CCGCGAAGATCTCTTTGATGTGTTCGGGGCGGGTATAGACCACGAGGTTGTCGGCATATGGGGGCACCCG
+CAAGGAGAACACGTCGCCGTACTTGCGATGCATCGCTGGCAGGAACCATTCCCGAAACCTCAGGTACAGC
+ACGCTCTGCAGGTAGCGGGGTAGCCGCGGCCCGGGTGGCAGGCCCGTCGTCAACGTGCTTGCCATGGCGG
+CTCCCTTCTGATAATCAAATGTTTGATGTAAACGAATGCTTATCACGATAGGATGCAGCTGTGCAACAGC
+AACGCACAAACCGCGACAAACTGCTCGACGGCGCTCTGGCTTGTTTACGAGAACGCGGCTACGGCAACAC
+CAGCTCGCGCGACATCGCTCGTGCGGCAGGGGTGAACATCGCGTCGATCAACTACCACTTCGGTAGCAAG
+GACGCGCTGCTCGACGATGCGCTCGGCCGGTGCTTTTCGACGTGGAACCAGCGTGTCCAGGAGGCATTCG
+ATCACTCCCGCGCCGCCGGTCCGGCCGGGCAGATCCTGGCGGTACTCGAAGCCACCGTCGATTCGTTCGA
+GCAGATCCGCCCCGCCGTGTATGCGTGTGTGGAGTCATACGCTCCGGCGTTGCGCTCAGAGGCCTTGCGG
+GAGCGCCTGGCCGCCGGATATGCCGACGTTCGGCAGCATTCGGTCGATCTGGCTGGCGCTGCGCTTGCCG
+GTACCGACATAGCACCGCCGGAGAACCTGTCGACCATCGTCTCGGTGTTGATGGCGGTCATCGATGGCCT
+CATGATCCAGTGGATCGCCGATCCGTCCGCCACCCCGCGATCGACCGAGGTAATCCGAGCGCTTGCCAGC
+ATCGGCGCGGTCGTCACGTCGCAGTTGCGGTGAACCACACGGTCGCCGGATGGTCTGCACTGCGCTTGAT
+GCCGACGTCGATGAAGCCGGCAGCGCCAAGCCACGCGGCGGTGTCGAGGGTGGGGGGCACGCGATAGATC
+GCGGGATCGAAACGGGCCGCCAGTGGTTGGTCATCGGATATCGATGTAAGGACGAGTCGACCCCCGGGCC
+GCAGGGCTCGAGCGATGTCGCAAAGGCTGGCGCGGGGATCGGGCGAGAAGTAAAAGTTGTGCACGCCGAG
+CACCTTGTCAAGGCTGTGGTCGGCAACCGGCAGGGTTACTCCATCGCCGTGATAAAGCGAGATCAGGCCG
+GCTGCAATGGCTTTCGCGTTGTGATGGGCCGCGATTGCGATCATGGTCGTCGACACCTCGACGCCGCTCA
+CTTGCGCGCCGGCGGCGGCGAGCAGCCCAAGGGTTCGGCCGGGGCCAAAGCCGATCTCGCAAACCCGCTC
+GCCCGGGCCGGGCGCGAGCAGCTCGACGGCGATGCGATTGACGTCGGCGGTCTCGGCTCGCCAGATCCGT
+CCCAGTAGGCGGCCGAACGCGCCTGTTGGCCGGGCAGCCTGACTGGATAGGTACCGTCGGGCCGGATGTG
+TGAGGCGCATGGGGACGACCTTTCGGTTGCAAGCGGTTAGTCCGAAGAAGCTGTGGTGGCCCGAACGACA
+AACTCGGCGAGGGTCGCAGCGATCGCATCGTCATCGATCACGCCAGGTTGCACGATCGACCAAGGCTCCG
+GTGACGGGTCGAAGTGAAGATGCACCGCCCACAACGCGCACAACTCGACGATGGTCCGGGCCACCATCGG
+TGCCGGCCCGGGCAGGATCAGAAGGCCGGCGCGCTCGCGGTGCACTAGGTATGCCTGGACCGCATCGACT
+TGGGCGTTCCGGCCGGTGCCGAACCAAACCTCGGCGAGGTCGGGTAGCTCGGGGGCACAGCGGTCGACCA
+GTTTGAGCGCGATCCGGTGCCGGGCCAGGCGGCTGTAGAGGTCGGTGACGATACCGGCGAGTTCTGCTCG
+CGCGTCTCCAGTCGTCGCACCCGGCGGCAAAGTCGCTCGCAACGCGTGCGTGAGCCGCATGTCGGTGACC
+TCGCCAGCCAGTCGGGCCGACACCACAGCTGCGATCTCGCCCGCAACGGGAGCGGCCACCGGCAGTTCGG
+ATGCCAGCGGAAGGGCTTCCTGAGCGTCGCCGTAGCGCACCGCCGCCGCGAACAGCGCAGCCTTGCCCTG
+GGCGTAGCCATACAGCGTGCCTTTGGCCAGGGCGAGTGCGTCGGCCACGTCCTGCACCTGGGTGCGCTGG
+TAACCGTGGGCGATGAACACCCGCGCCGACGCGGCGACAATCGCGGAAAACCGGTCCGCGGGAATGCTGC
+GGGCCATGGGCCGATAATAGTTTGACTGACTCGGTCAGTCACCCCAAGACCTTGCGCAAGACTGCGGCGG
+AATCTAATATTCCAAAGATATATGGAACTCGATGCGAAGGAATCAGGCTCATGAGCAAGACGGTTCTCAT
+CCTTGGCGCGGGTGTCGGCGGCCTGACCACCGCCGACACCCTCCGTCAACTGCTACCACCTGAGGATCGA
+ATCATATTGGTGGACAGGAGCTTTGACGGGACGCTGGGCTTGTCGTTGCTATGGGTGTTGCGGGGCTGGC
+GGCGGCCTGACGACGTCCGCGTCCGCCCCACCGCGGCGTCGCTGCCCGGTGTGGAAATGGTTACTGCAAC
+CGTCGCCCACATTGACATCGCGGCCCAGGTAGTGCACACCGACAACAGCGTCATCGGCTATGACGCGTTG
+GTGATCGCATTAGGTGCGGCGCTGAACACCGACGCCGTTCCCGGACTGTCGGACGCGCTCGACGCCGACG
+TCGCGGGCCAGTTCTACACCCTGGACGGCGCGGCTGAGCTGCGTGCGAAGGTCGAGGCGCTCGAGCATGG
+CCGGATCGCTGTGGCTATCGCCGGGGTGCCGTTCAAATGCCCAGCCGCACCGTTCGAAGCGGCGTTTCTG
+ATCGCCGCCCAACTCGGTGACCGCTACGCCACCGGAACCGTACAGATCGACACGTTCACGCCTGACCCGC
+TGCCGATGCCCGTTGCAGGTCCCGAGGTCGGCGAGGCTTTGGTCTCGATGCTCAAGGATCACGGTGTCGG
+CTTCCATCCTCGCAAGGCCCTAGCTCGCGTCGATGAGGCCGCAAGGACGATGCACTTCGGTGACGGCACG
+TCCGAACCGTTCGATCTGCTTGCCGTGGTCCCCCCGCACGTGCCCTCCGCCGCGGCGCGGTCAGCGGGTC
+TCAGCGAATCCGGGTGGATACCCGTGGACCCGCGCACCCTGTCCACTAGCGCCGACAACGTGTGGGCCAT
+CGGCGATGCGACCGTGCTGACGCTGCCGAATGGCAAACCGCTGCCCAAGGCTGCCGTGTTCGCCGAAGCC
+CAGGCCGCAGTTGTCGCCCACGGCGTCGCCCGCCATCTCGGTTACGACGTAGCTGAGCGCCACTTCACCG
+GCACGGGCGCCTGCTACGTCGAGACCGGTGATCACCAGGCAGCCAAGGGCGACGGCGATTTCTTCGCTCC
+GTCGGCGCCCTCGGTGACGCTGTACCCGCCGTCGCGGGAGTTTCACGAGGAGAAGGTCGCACAAGAACTG
+GCCTGGCTGACCCGCTGGAAGACGTGACACGCCGGTGGGCGCGGCTCCCTACCACGGCTCCTACCGGCGC
+CCCTGAAACACCAGACTGTGGATAACCGCTGTTGCGCAAGCCTGCTAGTAGCCTCGCCAAGGTGGACTAC
+TCGTCGGCATACCTGGAGCAGACCCACGCCTTCGGCGAACTGATCCGCAACGTCGATCAATCCACCCCGG
+TGCCGACCTGCCCGGGCTGGAGCCTGGGTCAACTATTCCGCCACGTCGGGCGCGGGGACCGCTGGGCGGC
+GCAGATTGTCCGCGATCGACTCGACCATTTCCTCGATCCACGCAGCGTCGAGGGCGGTAAGCCACCGCCG
+GACCCCGACGACGCGATCTCCTGGCTGTACGGCGGGGCGCGGCTGCTGGTCGACGCTGTGGAACAAACGG
+GTGTGGAAACGCCGGTGTGGACCTTCCTCGGACCGCGCCCGGCGGGCTGGTGGGTTCGGCGGCGGCTACA
+CGAGGTCGCAGTGCACCGCGCCGACGTGGCGATCACCGTCGGGGGCGAATTCACACTGGAACCGAACGTG
+GCAGCCGACGGGATCAGCGAATTCCTGGAGCGCATAGCGGTCCAGGCCGGCAGCGGCGGCACGCCATTAC
+CGCTCGAAGACGACGACACCTTACATCTGCACGCCACCGATCCGGGGCTTCTTGAAGCCGGCGGATGGAC
+GGTTCGTCGCGACGAGCGCGGCGTCACCTGGTCGCATCGGCACGGAAAGGGTGCCGTGGCACTGCGTGGC
+GGCGCCACCGAGCTGCTGCTGGCGATGGTGCGCCGACTCTCGGTTGCCGACACCGGCATCGAGCTGTTGG
+GGGATGCCGGGGTATGGCAAAAATGGCTGGATCGCACGCCGCTGTAGCCGCCGCACACGGTAACTTTCAG
+ACCATGACCACATCGGAGATCGCTACCGTGCTGGCCTGGCACGACGCCCTCAATGCCGCCGACATTGAGA
+CCCTCGTGGCGTTGTCTACTGACGACATCGACATCGGTGACGCGCACGGGGCTGTACAGGGCCACGATGC
+GCTGCGCGGGTGGGCCAGCTCGCTCACCACAACCGCAGAACTTGGCCGCATGTACGTGCACCACGGAGTC
+GTGGTCGTCGAACAAAAGATCACCAGCGGCGAAGATCCGGGCATCGCCAGGACCGGCGCCGCGGCGTTCC
+GTGTGGTCCAAGACCACGTCGCATCGGTTTTCCGGCACGAAGACTTGGCGTCGGCGCTGGCGGCCACCGA
+ACTCACCGAGGACGATTTGGTCGATTGAGGTCGGCGAACGGCAGTTAGGAGCCAGTTATGCGCGGGATCA
+TCTTGGCCGGCGGTTCGGGCACCCGGCTGTACCCGATCACCATGGGGATCAGCAAGCAGCTGCTGCCGGT
+CTACGACAAACCGATGATCTACTACCCGCTCACCACGCTGATGATGGCTGGGATCCGAGACATTCAGTTG
+ATCACCACCCCGCATGACGCGCCCGGCTTTCATCGACTCCTGGGCGACGGCGCGCACTTGGGAGTGAACA
+TCAGCTACGCCACCCAGGATCAGCCTGACGGTCTGGCGCAGGCGTTCGTCATTGGCGCCAACCACATCGG
+CGCCGATTCGGTGGCATTGGTGTTGGGGGACAACATCTTCTACGGCCCAGGTCTGGGGACCAGCCTGAAG
+CGCTTCCAATCCATCAGTGGTGGAGCAATTTTCGCCTATTGGGTAGCCAACCCGTCGGCCTATGGTGTCG
+TTGAGTTCGGCGCCGAGGGCATGGCGCTGTCTCTGGAGGAGAAGCCGGTGACCCCGAAGTCGAATTACGC
+GGTGCCGGGCCTGTATTTCTATGACAACGATGTGATCGAAATCGCCAGGGGTTTAAAGAAATCAGCGCGC
+GGGGAGTACGAGATCACCGAGGTCAACCAGGTCTACCTCAATCAGGGTAGGTTGGCGGTCGAGGTGCTGG
+CCCGCGGGACAGCGTGGCTGGACACCGGGACATTCGACTCGCTGCTGGACGCCGCCGATTTCGTCCGGAC
+CCTGGAGCGTCGGCAGGGCCTGAAGGTCAGCATCCCCGAAGAAGTGGCGTGGCGCATGGGCTGGATCGAC
+GACGAGCAGCTGGTGCAGCGAGCCCGTGCTCTGGTCAAGTCCGGATATGGTAACTACCTGCTGGAGTTGT
+TGGAGCGCAACTGATTTCGGCGGGTTATTGTCGGTGATTATGGAACCCCCTGGTAGCCCGTCCTGGATGA
+GCAGCCCACCGGACCAGCCATTGCCGAACAGCCCGCCGTTGGCGCCGTTGGCGATCAGCGGGCCCCAACA
+GCGCCTGGGTCGGCGCATCGGCGGTGGTCTCGGCGCTGGCACACGAGCCCGCACCCACGTTCAGGTTCTG
+TGCAAACTGGCCATGGAACGCCGCCGCCTGATTGTTGAGGGAGTGATGCCGCCGACCGTGTGCGGAAATC
+AGTGCCGCGACGGCCGCCGACACCTCGTCTTCGGCCGCCGCCAGCACGCGGGTCTTGTGGCGCTTCGGCG
+GGAAGTTGCTGATCCGAGATGCTGGCGGCTGGTTTCCTTGTGGTGGCCTGGGCCGGGTGGTGGCGCACAG
+TGGGCCCGGTGGGGTCGCGGCCGGCCGGGCAAGAACGCTGCGCCCTGGCCGGGCCATGAGCGGAGCCGGC
+AAGCTCGACGGCGCCCGGCATGCGCGGTGCAAGAACCCCATGGACCGCACCGAGTGCCGTGCTCGCCCTC
+GGCGGCTACCGAGCCGGTGTCTCCCTAGTCATCCACGTTATCCACAGCGCCTTGGGTTACCGGGCGCCGG
+TCGGGTAGCGATGGTAGTATCGAAAGTATGTTCGATCAGGTGCGGGGGCGCATGCCTTCACCGGAGGCGA
+TCGCTCATTTTGATGAGCGGTTTGAATGCCATGCTCCGCGGACCACGAGGGTGTCGGCGGCGTTCATCGA
+TCGGATCTGCTCGGCGACTCGGGCCGAAAACCGGGCCGCTGCGGCGCAGTTGGTGGCGTTGGGGGAGTTG
+TTCGCCTATCGGTGGTCGCGTTGCGGGGGCCGCGAGGAGTGGGTGATGGACACCATGGCGGCGGTGGCCG
+CCGAGGTGGCGGCGGCGTTGCGGATCAGTCAGGGTCTGGCGGCCAGCCGGTTGCGGTATGCGCGGGCGAT
+GCGTGAGCGGCTGCCTAAGACGGCTGAGGTGTTTAGCGCCGGCGACATCGGCTATCTGATGTTTGCCACG
+ATTGTGTATCGCACCGACTTGATCGTTGACCCTGATGTTTTGGCGGCGGTGGATGCGCAGTTGGCCGCCA
+ATGTGGCGCGTTGGCCCTCGATGACCAAGGCCCGCCTGGCTGGGCAGGTCGATAAGATCGTGGCGCGTGC
+CGATGCCGATGCGGTGCGGCGGCGCAAGGAGTATCAGGCCCAGCGCCAGTTCTGGGTCGGGGAAAGCCAA
+GACGGTGTGTGCCAGATCGGTGGCAGCCTGTTGGCCGTCGACGCACACGCCCTCGATGCGCGGTTGAGCG
+CGTTGGCGGGCACCGTGTGTGAGCACGATCCGCGCAGCCGTGAGCAGCGCCGCGCGGACGCGTTGGGGGC
+GTTGGCGGGCGGGGCCGATCGGCTGGGCTGTGGCTGTGGGCGCGCTGATTGTGCGGCCGGGAAGCGGCCT
+GCGGCCCCGCCGGTGGTGATTCACCTGATCGCCGAGGCGGCCACGATCAATGGCACGGGCTCGGCGCCGG
+CATCGCAGATGAACGCCGACGGGCTGATCACCGCCGAACTGGTGGCCGAGCTGGCCAAGACGGCCACGCT
+GGTGCCGCTGGTTCATCCCGGCGATGCGCCGCCCGAGCCGGGGTATGCGCCGTCGAAAGCGCTCGCCGAT
+TTCGTTCGCTGCCGGGATCTGACGTGTCGCTGGCCCGGCTGTGATGAGCCCGCCACCAATTGCGACCTGG
+ATCATACGATCCCGTATGCCGCTGGTGGGCCCACCCATGCGTCGAACCTGAAATGTTACTGCCGTACCCA
+TCACCTGGTGAAAACGTTTTGGGGATGGCGTGATCAACAGCTACCCGACGGCACCCTGATTTTGACCTCC
+CCGTCCGGGCATACCTATGTCAGCACCCCGGGCAGTGCGCTGCTGTTCCCCAGCTTGTGCCACTTCAGCG
+GCGGCATCCCGGCACCGGAAGCCGACCCACCCTACGACCATTGCGACCAGCGCACAGCGATGATGCCCAA
+ACGCCGGCGCACCCGCGCCCAAGACCGGGCCTATCGCATCGCCACCGAACGTCGACAAAACCACGCCGCC
+CGCCAGCGCGCCCAGGTGCTCACCCAGACCGCCGCGGCCACCGACACCCACGGCCCACCACCGGATCACA
+ACGACGACCCACCGCCGTTTTGATGTGGAACGGCCTGTCAAGTGGCCGATTAGTGCTTGTTGCCTCGGGG
+TTGTTTGGGGTTTCTGGCTTTGATCCGATGACGGGACCCTGCGGCGCTCCCTCGACGCCGCCGCGCCGGC
+TTAAGGGCGCCCGGCCGCGCTGCCACCCCCAGGGCATCACGTGCGTCGGCTGCTATTGCCGGTAACTGAC
+CAGGAAGTTACCCAGCCGCTCGATGGCGGCCGCCAGATCGCGGGACCATGGCAGCGTCACCAGGCGCAGA
+TGATCCGGTGCGGGCCAGTTGAACCCGGTGCCCTGGGTGACCAGGATCTTCTCCGACAGCAGCAGATCGA
+GCACGAGTTGCTCGTCGTCGTCGATGTCGTAGACCTCGGGGTCTAGCCGGGGAAACGCATACAGCGCGCC
+CGCCGGTTTGACGCACGACACCCCCGGGATCTCGTTGAGCTTGGTCCAGGCGATGTCGCGCTGCTCGAGC
+AGCCGGCCGCCGGGCAGCACCAGGTCCTCGATGCTCTGATGGCCGCCCAGTGCAACCTGAATGGCATGCT
+GGGCCGGGACATTTGGGCACAACCGCATATTGGCCAGCAGGCCGATGCCCTCGATGAAGCTGCTGGCGTG
+CTCCTTGGGTCCGGTGATCGCCAGCCAGCCGGCCCGGTATCCGGCGACGCGGTAGGCCTTCGACAGCCCA
+TTGAAGGTCAGGCACAACATATCCGGGGCGATCGATGCCAGGCTGATGTGCTTGGCGTCGTCGTAGAGGA
+TTTTGTCGTAGATTTCGTCCGCCAACAGCAGCAGTTGATGCTTGCGGGCCAGATCGACCATCTGGGTGAG
+GATTTCGCAGCTGTACACCGCGCCGGTTGGGTTGTTGGGGTTGATCACGACCAGCGCCTTGGTGCGCTCG
+GTGATCTTGGATTCCAGGTCGGCGATATCGGGCTGCCAGCCTTGGGTCTCATCGCACAGGTAGTGGACCG
+GAGTGCCGCCAGCCAGCGAGGTCGACGCCGTCCACAGCGGGTAGTCCGGTGATGGAATCAGCACCTGATC
+GCCGTTGTCCAGCAGGGCTTGCAGCGTCATCGTGATCAGCTCGGAGACCCCGTTACCCAGGTAGACGTCG
+TCCACGTCGAATCGGGGAAATCCGGGCACCAGCTCGTAGCGCGTGACCACCGCACGCCGGGCCGACAGGA
+TGCCCTGCGAGTCGGAGTACCCCTGCGCGTAGGGCAGCGCCTGGATGATATCGCGCATGATCACGTCGGG
+TGCTTCGAAGCCGAACGGCGCCGGGTTGCCGATGTTGAGTTTGAGGATGCGGTGACCTTCGGCTTCGAGC
+CGCGCGGCGTGCTGGTGCACCGGGCCGCGGATCTCGTACAGGACGTCCTGCAGCTTGGCCGACTGAGCGA
+AGGCGCGCTGCCGCTGATGGCTGGCGGTGTGCCAGGGCAGCTGGTGGGTTGTCACGTCCACAATGGTGCC
+ATCGTTGTCCACTGGAATTTGCTGTCAGGTGCCAAATCGTGATCAGCGTTTGCCCGGTGGACGGGCCCCG
+CGCGCAATGCCCAGCCCTTTCACCGGCGCGGCCGGTGCAGCCGGATCACCGTCGGTTTGCGGCTTTGGCG
+GTGCGGCGGGCTCCGGTTGCGGCTTTGCTTCGGGTTGCGGCTGGGCTGCTGGCTCGGCGAGCCCAGGAGC
+CGGGGGAGGTGTCTTTTTCGCCCCGGGCCGCTTGGCGCCGGCGGCAATACCCAGCCCTTTAACGGGCGCG
+GCGGGCGCAGCCGGGGCCGCGGGCGTTGGGGCCGCTTTCTTGGCGCCAGGCCGCTTGGCGCCGGCGGCCA
+TGCCGAGGCCTTTCACGGGTGCTGCGGGAGCGGCCGGCGCTGGCGCCTGTGGTGCCTCGGCGGGTGCCTC
+CACGGGCGTCACCGGTGCGGCAGCCTTAGGAGCGGCTTTCGGGGCGCGCTCCTGAGCCTGTTTGGCGGCC
+GTACCCTTGGCCGGCAGCTGCGCCTTGTCGTGGTCTAGTGATCCGAGTAGCACCTGGGCCACGTCGAGCA
+CCTCGACGCCGCTGCGGCCGGCTTCTTCCTGCCGATCGTTCACACCGTCGGTGACCATCACCCGGCAGAA
+TGGGCACGCGGTGGCGATTGCGGTGGCATCGGTGGCCAGCGCCTCATCGACGCGTTCATGGTTGATCCGC
+TTGCCGATGTGTTCTTCCATCCACATGCGGGCGCCGCCTGCGCCGCAACAAAAGCTGCGGTCGGCATGGC
+GCGGCATCTCGGTCAGGCTGGCCCCCGCGGCACCGATCAGCTCCCGTGGTGCCTCGTAGACCTTGTTGTG
+CCGACCCAGGTAGCACGGGTCGTGGTAGGTGATGTCCTGAGAAACCGGAGTGACAGGGACCAGCCTCTTG
+TCGCGCACCAACCGATTGAGCAGCTGGGTGTGGTGCAGCACGGTGTAGTTGGCGCCCAGCTGCCGATATT
+CCTTGCCGATGGTGTTGAAGCAGTGCGGGCAGGTGACAACGATCTTGCGGTCGACGGTCTCCACACCCTC
+GAACAAACCGTCCAGGGTCTCGACGGCCTGTTGTGCCAGCTGCTGGAAGAGGAACTCGTTGCCGGAGCGG
+CGCGCCGAGTCGCCGTTGCAGGTTTCCCCAGCGCCCAGCACCAAGTATTTCACCCCGGCGACGGCGAGCA
+GCTCGGCGACGGCCTTGGTGGTCTTCTTGGCCTTGTCGTCGTAGGCGCCCGCACAACCCACCCAGAACAG
+GTACTCGTAGCCGTCGAAGCTGTCGACGTCCTGGCCGTACACGGGGACGTCGAAGTCAACCTCGTCGATC
+CAGTTGGTGCGATCTGAGGCGTTCTGACCCCACGGGTTGCCCTTGGTCTCCAGGTTCTTGAACAGCACCG
+ACAGCTCGGAGGGGAACTCCGACTCCATCATCACCTGGTAGCGGCGCATATCGACGATGTGATCGACATG
+TTCGATATCCACCGGGCACTGCTCGACGCAGGCACCACAGGTCACACATGACCACAAGACGTCGGGATCG
+ATAACGCCACCCTGTTCCTCGGTGCCGACCAGCGGGCGAGTCGCCTGCTCCGGTCCATGCCCGGGCACTC
+GACCGAACCCCGATTCCGGCACGTGATGATGCTCTTGGTGACCGGCCTCGCCGCCCGCGCTGGCATCCTT
+TTGGCCCAGGATGTAGGGCGCCTTGGCCATCCAATGGTCGCGCAGGTCCATGATGACCAGCTTGGGCGAC
+AACGGTTTGCCGGTGTTCCAGGCCGGGCATTGCGACTGACAGCGTCCGCACTCGGTGCAGGTAGCGAAGT
+CGAGCATCCCCTTCCAGGTGAAGTCTTCGATCTTGCCGCGGCCGAATACGGCATCCTCGCTGGGATTCTC
+GAAGTCGATTGGTTTGCCATCGGCTTCGAGCGGCAACAGCGGGCCCAGCCCATCCGGCAGCCGTTTGAAC
+GTGACGTTAATGGGCGCCAGGAAGATGTGCAGGTGCTTGGAATGCAAAACGAGGATCAGGAACGCAAGCA
+TGACCCCGATGTGCAGCAACAGCGCTGTGGTTTCGATGATTTCGTTGGCGGGCTGCCCGAGGGGGCGAAG
+AATCGCGCCGAATAGCTGCGATAGGAAGGCCCCGTTGCCGTAGGGCAGGGTGCCGTTGTTGACCGCTGAG
+CCGCGGACCAACACGTAGGTCCAGATGACGTTGAAGATCATCAACAGGACGAGCCACGCGCCGCCGTTGT
+GCGATCCGTAGAACCGGGAGCTCCGACCGATCTCGCGGGGGTTGCGCAGGATACGGATGATGGCGAAGGT
+CGTGATACCGAGAAAGACGGCGGTGGCAAAGAAGTCCTGCAGGAAGCCCAACGCGTCCCACCGGCCGATG
+ACCGGGATGTGGAATCTCTCCTCGAACAGCAGGCCGTAAGCCTCGATATAGACGGTGAGCAGGATGAAGA
+AGCCCCACATGGTGAAAAAGTGCGCCAGGCCCGGGATCGACCATTTCAACAGTCGGCGCTGCCCTAGAAC
+CTCGGAGATCTGGGTCCAGATGCGGGTGCCGAGGTTGTCGGTTCGCCCGCTGGCCGGCTGCCCGGACATG
+ACCAGCTTGTAAAGCCACCAGACTCGCCGCAGAGCGAACACCCCCACAACCGCGGTCATGCTCATGCCCA
+GTATCAGCCTGATGAGCGTTTGCGTGGTCACGGAAGGTCACCCGAATTCGTAGCACTCAATGGAACCCCT
+GCATAACCTGCTCATCCTGACATCTGTGCGACTTTCGCCGCGAGAAAGGCTGTCCTAACCTACCGGTCGT
+CAACGCCTCTCATCTGCGGTTAAGCTCTCCGGGGCCAGCATGGCCCGCAGCATCGACAACATCTCCGACC
+GGGAGCCAGCGCCCAGCCGCTGGCGTATCCGGGCGACGTGGTGCTCGACCGTCTTCGCTGAGATGAACAG
+CCGGGCGCCAATGTCGCGATAGGGCATGCCCAGTAGCAGTAGCTCGGCGACTTCGCGTTCGCGATCGGAT
+AGCGGCGAGCCCGCCGGTGGCTGGCGCGGTGCCGGCGGGGTACCGGAAGCTGGTTCCGTGTCGCCGGCCC
+CGCTGGGGGGCTCGCCGAAATCGTTGCCCAGCTTAAGATCCCGTGCCAACTGCAGCATGGCACCGGACAC
+CCGTGCGTCGGATGTTTGCAATGCGGCCTGACCTGCCAGTCGGGTCGCATCCGACGTCAGGCCGACGTGT
+GACAGGGACCGCGCCGCCGCGGTGACCTCGTCGGCGTCGACGTTTTCGGCCAGGACCCGCAGCCAGGTGC
+GACCGGCATCCGACAGGGCCTGCGCGAGCGTGCTGTGGGCGACCATTGCACCGAGGGCCTGTCCGTGCGG
+TGCCACCGATTCCGGCGAATTGGCGAGGATTCCAGCGTGCACTCCAGCCCAATGCAGTGAGTTCGACCAC
+AGGGCGGGGTTGCCCAGCGAATCCAGCAGCGTGAGCGCCTGATCCAGGGTGTGTTGTAGCTGGTCAACCT
+GGCGCATTCGGGCGGCCGCGACCCACAGTTCACCAAGTGGCAGCAGGGCGAACAGATCGAGCGAATACTC
+GGCCAGCGCTTCCATCGCCGCATACCAATGCTGTTGCAGCGCACCGATATCGCCGGTGCGACGCGAGATC
+GCGGTTTGCAGTGCCGCGGCCCACAACGCGTCGCGCCGGTGCAGGTGCGTGCCGGCGCTGGCCGCCGCGA
+CGTCCGCGCTTGCCGACGGCAATTGCCCCTCTTGCATTTTGATCCAGCCGGAAAGCAGCAGGTGCCGACG
+CTGGAACAGCGGGTCGGCGCCGGCTCGCACGGCACGCCCGATCACACTGCGGGCGCGGACCGGATCGCCG
+GCGTGTATCGCGGCCAAGGTAACCAGCGCTGCCGGGCTGTCCGGAATGACTTGGCTGAGCGATTGTTCGG
+TGGCAATGGCTTGGCCCAGTTTTGCCATCGCGACCGGATACGGCTGATCCATGGTCAGCAGCAGCCCCTC
+GGCGAGGTTGCGCGCGCAACGCGCTGCCATCGTCGGTGGACCGGCATCCTTGAGTCGCAGGGTGGCACGC
+GCCGTCGCCAGGTCGCCGTTCGCGGCGAACACGATCGTGGCGGCCGAGCTCACCATCGTGTCCGGGTGTG
+GGCCCAGCCAGCCGAACAACTCGGCTGCGTGTCCCGTGTTGCCGTCGTGGACCGCGACGCTGGCCGCAAC
+CCGCACCGCGGCAGCGCGTTCGGTGGCATCCGGGGAGCTGAGCAGATCGTCGGCTAGTGTTGCCGCGGCC
+GTACAGTCGCCGGTGCGGGCCAGTGCGTCGGCCAGGCGGACCGTCAATCCTTTGGCGCCGGCATGGACCG
+CGGCGCGGTACAGCCGTGCGCAACGGACCGAAGCGTCGCGGGTGTCCGCGGCGTACCGCGTGAGGATGTC
+CGCCAGCCGCTCGTCGCGCAGCCCGTGTTCGGCCAGTCGCAGCGCTAGCTCCGCCGACACCGGCGAGATA
+TCGAGTTGTGAGCGTAACAGCGAGGTTTCGACCTCGTGGTGGTGTGCATTGCCGACGATCTGAGCGATCG
+CATCATGGACTGACTGCAGAAACGCCGCGGTGTGTGACGACTCGATCAGTCCGCTGGCGTGCGCACGATC
+GACCAATCCGCGGGCATCCGTTACCGAAATCCCAAGTGCAGCAGCTACATCGCTGACCCCTAGCTCGTGG
+GTTAGCGACATCATGAGCAGGGTGTCCAGAGTGGGTTCGTCGAGGCGGCGCAGCCGCTCGATGAGGGCCA
+CCTTGGCCGCTTGCGCGGGAGCCTGTGCCCTGGCGGAAACCGCATGAATGAGGAACGGCAGTCCCGCGGT
+GCAATCTCGCAGGTGCTCGGCAACCGGAAGTGGACCGAGCGAGATTCGTGGCCGGTCCCGTTCGAGCGCC
+ATCGTCAGGGCTCGTAGTGCCCGGTGGTGCTCGCGGGCTTCCGCGGCCGCCACCACCGTCAGCCGTGAAT
+CGGCCACGCGCTCGGTGAGCCGGAGCAATTCGGTATCGGTGAGCAACTGGGCGTCGTCGATGACGAGCGC
+GGTCTCCGGCGGTTCGCCGTCTGGCGGCGGGCATGCCAGCACGGTGAGTCCCGAGCGGCGCAGTGTGTCG
+CGGGCGGCAGCCAGAACGGTGGTCTTGCCCGTTCCGATGCCCCCGGTGATCAGGACCTTGACCGGTACCG
+TCGGGGCATTCGCGAGTTCCAGGAGGGCACGGCGTGCTGCCGGCGGGACCTCGGTGAGGGAATCGGTCAC
+CGATGCGTCGTATGCTTGGCCACGGTTCTTGCACCCCCTGTGCTGCACGGCTGGTCGGCGGCGGCTCCCT
+CACCATAGCCCCAGCCCGTCCCGCAGCCCCGCATTTCCCCTAATGCGGCCATCCCCTAACGGCGCCCCGG
+GGCCGGCGGGTTCCGCACCGAACACGGACGCGGCCTCAACCGATAGCATCGTGCTAACACGGGACTAACG
+GGGGTGGGGCAAGGAGGCGGGTAGTGGCAAACTCGTTGCTCGACTTTGTCATCTCGCTTGTGCGCGACCC
+GGAAGCGGCCGCACGTTACGCCGCGAACCCCGAGCGGTCGATCGCCGAAGCTCACCTTACCGACGTGACC
+AGAGCGGATGTGAACAGCCTGATCCCGGTGGTGTCGGATTCGTTGTCGATGTCCGAACCCATCGGAGCCG
+CTGGCGGGGCACACGCTGGCGATCGTGGCAACGTTTGGGCGAGCGGCGCGGCCACGGCTGCGCTTGATGC
+GTTCGCCCCACACGCCGATGCGGGTGTTGTCCAACAGCACGGTGCGGTCGGCAGCGTTCTCAACCAGCCG
+ACCCCACCCGGACCGGGCGTGACACCCACCGATCCGCGCCCCTTCCGAGCCGGTCCACATGAGACGTCGG
+CGCTGCTCACGAGCGCTGAAATACCCGACACGACCAGCGAGGACGGGGGATTGCCGACAGACCATCCGGC
+TGTCTGGAACCACCCGGTCGTTGACCCACATACCGTCGAGCCCGATCATCACGGCTACGACATCCACGGA
+TAAGTTCCGGACCGGCGTAGGGGTGCCCCATTTCCCCTAATCCCCTAACGCGGCGGCCAGGCCGATCCCG
+ATAGGTGTTTGGCCGGCTTGCGGATCAGACCCCGATTTCGGGGTGAGGCGGAATCCATAGCGTCGATGGC
+ACAGCGCCGGTCACGCCGGCGAACAGCTTCTTCGATTGAAGGGAAATGAAGATGACCTCGCTTATCGATT
+ACATCCTGAGCCTGTTCCGCAGCGAAGACGCCGCCCGGTCGTTCGTTGCCGCTCCGGGACGGGCCATGAC
+CAGTGCCGGGCTGATCGATATCGCGCCGCACCAAATCTCATCGGTGGCGGCCAATGTGGTGCCGGGTCTG
+AATCTGGGTGCCGGCGACCCCATGAGCGGATTGCGGCAGGCCGTCGCCGCTCGGCATGGCTTTGCGCAGG
+ACGTCGCCAATGTCGGCTTCGCCGGTGACGCGGGCGCGGGGGTGGCAAGCGTCATCACGACCGATGTCGG
+TGCGGGCCTGGCTAGCGGACTGGGTGCTGGGTTCCTGGGTCAGGGTGGCCTGGCTCTCGCCGCGTCAAGC
+GGTGGTTTCGGCGGTCAGGTCGGCTTGGCTGCCCAGGTCGGTCTGGGTTTTACTGCCGTGATTGAGGCCG
+AGGTCGGCGCTCAGGTTGGTGCTGGGTTAGGTATTGGGACGGGTCTGGGTGCTCAGGCCGGTATGGGCTT
+TGGCGGCGGGGTTGGCCTGGGTCTGGGTGGTCAGGCCGGCGGTGTGATCGGTGGGAGCGCGGCCGGGGCT
+ATCGGTGCCGGCGTCGGCGGTCGCCTAGGCGGCAATGGCCAGATCGGAGTTGCCGGCCAGGGTGCCGTTG
+GCGCTGGTGTCGGCGCTGGTGTCGGCGGCCAGGCGGGCATCGCTAGCCAGATCGGTGTCTCAGCCGGTGG
+TGGGCTCGGCGGCGTCGGCAATGTCAGCGGCCTGACCGGGGTCAGCAGCAACGCAGTGTTGGCTTCCAAC
+GCAAGCGGCCAGGCGGGGTTGATCGCCAGTGAAGGCGCTGCCTTGAACGGCGCTGCTATGCCTCATCTGT
+CGGGCCCGTTAGCCGGTGTCGGTGTGGGTGGTCAGGCCGGCGCCGCTGGCGGCGCCGGGTTGGGCTTCGG
+AGCGGTCGGGCACCCGACTCCTCAGCCGGCGGCCCTGGGCGCGGCTGGCGTGGTGGCCAAGACCGAGGCG
+GCTGCTGGAGTGGTTGGCGGGGTCGGCGGGGCAACCGCGGCCGGGGTCGGCGGGGCACACGGCGACATCC
+TGGGCCACGAGGGAGCCGCACTGGGCAGTGTCGACACGGTCAACGCCGGTGTCACGCCCGTCGAGCATGG
+CTTGGTCCTGCCCAGTGGCCCCCTGATCCACGGCGGTACCGGCGGCTATGGCGGCATGAACCCGCCAGTG
+ACCGATGCGCCGGCACCGCAAGTTCCGGCGCGGGCCCAGCCGATGACCACGGCGGCCGAGCACACGCCGG
+CGGTTACCCAACCGCAGCACACGCCGGTCGAGCCGCCGGTCCACGATAAGCCGCCGAGCCATTCGGTGTT
+TGACGTCGGTCACGAGCCGCCGGTGACGCACACGCCGCCGGCGCCCATCGAACTGCCGTCGTACGGCCTT
+TTCGGACTACCCGGGTTCTGATTCGCGAGCCGATTTCACGAACCGGTGGGGACGTTCATGGTCCCCGCCG
+GTTTGTGCGCATACCGTGATCTGAGGCGTAAACGAGCGAGAAAGTGGGGCGACACGGTGACCCAGCCCGA
+TGACCCACGTCGGGTCGGTGTGATCGTCGAACTGATCGATCACACTATCGCCATCGCCAAACTGAACGAG
+CGTGGTGATCTAGTACAGCGGTTGACGCGGGCTCGCCAGCGGATCACCGACCCGCAGGTCCGTGTGGTGA
+TCGCCGGGCTGCTCAAACAGGGCAAGAGTCAATTGCTCAGTTCGTTGCTCAACCTGCCCGCGGCGCGAGT
+AGGCGATGACGAGGCCACCGTGGTGATCACCGTCGTAAGCTACAGCGCCCAACCGTCGGCCCGGCTTGTG
+CTGGCCGCCGGGCCCGACGGGACAACCGCAGCGGTTGACATTCCCGTCGATGACATCAGCACCGATGTGC
+GTCGGGCTCCGCACGCCGGTGGCCGCGAGGTGTTGCGGGTCGAGGTCGGCGCGCCCAGCCCGCTGCTGCG
+GGGCGGGCTGGCGTTTATCGATACTCCGGGTGTGGGCGGCCTCGGACAGCCCCACCTGTCGGCGACGCTG
+GGGCTGCTACCCGAGGCCGATGCCGTCTTGGTGGTCAGCGACACCAGCCAGGAATTCACCGAACCCGAGA
+TGTGGTTCGTGCGGCAGGCCCACCAGATCTGTCCGGTCGGGGCGGTCGTGGCCACCAAGACCGACCTGTA
+TCCGCGCTGGCGGGAGATCGTCAATGCCAATGCAGCACATCTGCAGCGGGCCCGGGTTCCGATGCCGATC
+ATCGCAGTCTCATCACTGTTGCGCAGCCACGCGGTCACGCTTAACGACAAAGAGCTCAACGAAGAGTCCA
+ACTTTCCGGCGATCGTCAAGTTTCTCAGCGAGCAGGTGCTTTCCCGCGCGACGGAGCGAGTGCGTGCTGG
+GGTACTCGGCGAAATACGTTCGGCAACAGAGCAATTGGCGGTGTCTCTAGGTTCCGAACTATCGGTGGTC
+AACGACCCGAACCTCCGTGACCGACTTGCTTCGGATTTGGAGCGGCGCAAACGGGAAGCCCAGCAGGCGG
+TGCAACAGACAGCGCTGTGGCAGCAGGTGCTGGGCGACGGGTTCAACGACCTGACTGCTGACGTGGACCA
+CGACCTACGAACCCGCTTCCGCACCGTCACCGAAGACGCCGAGCGCCAGATCGACTCCTGTGACCCGACT
+GCGCATTGGGCCGAGATTGGCAACGACGTCGAGAATGCGATCGCCACAGCGGTCGGCGACAACTTCGTGT
+GGGCATACCAGCGTTCCGAAGCGTTGGCCGACGACGTCGCTCGCTCCTTTGCCGACGCGGGGTTGGACTC
+GGTCCTGTCAGCAGAGCTGAGCCCCCACGTCATGGGCACCGACTTCGGCCGGCTCAAAGCGCTGGGCCGG
+ATGGAATCGAAACCGCTGCGCCGGGGCCAGAAAATGATTATCGGCATGCGGGGTTCCTATGGCGGCGTGG
+TCATGATTGGCATGCTGTCGTCGGTGGTCGGACTTGGGTTGTTCAACCCGCTATCGGTGGGGGCCGGGTT
+GATCCTCGGCCGGATGGCATATAAAGAGGACAAACAAAACCGGTTGCTGCGGGTGCGCAGCGAGGCCAAG
+GCCAATGTGCGGCGCTTCGTCGACGACATTTCGTTCGTCGTCAGCAAACAATCACGGGATCGGCTCAAGA
+TGATCCAGCGTCTGCTGCGCGACCACTACCGCGAGATCGCCGAAGAGATCACCCGGTCGCTCACCGAGTC
+CCTGCAGGCGACCATCGCGGCGGCGCAGGTGGCGGAAACCGAGCGGGACAATCGAATTCGGGAACTTCAG
+CGGCAATTGGGTATCCTGAGCCAGGTCAACGACAACCTTGCCGGCTTGGAGCCAACCTTGACGCCCCGGG
+CGAGCTTGGGACGAGCGTGAGCACCAGCGACCGGGTCCGCGCGATTCTGCACGCAACCATCCAGGCCTAC
+CGGGGTGCGCCGGCCTATCGTCAGCGTGGCGACGTTTTTTGCCAGCTGGACCGCATCGGTGCGCGCCTAG
+CCGAACCGCTGCGCATCGCGTTGGCTGGCACACTCAAGGCCGGAAAATCCACTCTCGTCAACGCCCTTGT
+CGGCGACGACATCGCTCCGACCGATGCCACCGAGGCCACCCGGATTGTGACCTGGTTCCGGCACGGTCCG
+ACACCGCGGGTCACCGCCAACCATCGCGGCGGTCGACGCGCCAACGTGCCGATCACCCGTCGGGGCGGGC
+TGAGTTTCGACCTGCGCAGGATCAACCCGGCCGAGCTGATCGACCTGGAAGTCGAGTGGCCAGCCGAGGA
+ACTCATCGACGCCACCATTGTTGACACCCCGGGAACGTCGTCGTTGGCATGCGATGCCTCCGAGCGCACG
+TTGCGGCTGCTGGTCCCCGCCGACGGGGTGCCTCGGGTGGATGCGGTGGTGTTCCTGTTGCGCACCCTGA
+ACGCCGCTGACGTCGCGCTGCTCAAACAGATCGGTGGGCTGGTCGGCGGGTCGGTGGGAGCCCTGGGCAT
+CATCGGGGTGGCGTCTCGCGCGGATGAGATCGGCGCGGGCCGCATCGACGCGATGCTCTCGGCCAACGAC
+GTGGCCAAGCGGTTCACCCGCGAACTGAACCAGATGGGCATTTGCCAGGCGGTGGTGCCGGTATCCGGAC
+TTCTTGCGCTGACCGCGCGCACACTGCGCCAGACCGAGTTCATCGCGCTGCGCAAGCTGGCCGGTGCCGA
+GCGCACCGAGCTCAATAGGGCCCTGCTGAGCGTGGACCGTTTTGTGCGCCGGGACAGTCCGCTACCGGTG
+GACGCGGGCATCCGTGCGCAATTGCTCGAGCGGTTCGGCATGTTCGGCATCCGGATGTCGATTGCCGTGC
+TGGCGGCCGGCGTGACCGATTCGACCGGGCTGGCCGCCGAACTGCTGGAGCGCAGCGGGCTGGTGGCGCT
+GCGCAATGTGATAGACCAGCAGTTCGCGCAGCGCTCCGACATGCTTAAGGCGCATACCGCCTTGGTCTCC
+TTGCGCCGATTCGTGCAGACGCATCCGGTGCCGGCGACCCCGTACGTCATTGCCGACATCGACCCGTTGC
+TAGCCGACACCCACGCCTTCGAAGAACTCCGAATGCTAAGCCTTTTGCCTTCGCGGGCAACGACATTGAA
+CGACGACGAAATCGCGTCGCTGCGCCGCATCATCGGCGGGTCGGGCACCAGTGCCGCCGCTCGGCTGGGC
+CTGGATCCCGCGAATTCTCGCGAGGCCCCGCGCGCCGCGCTGGCCGCAGCGCAACACTGGCGTCGCCGTG
+CGGCGCATCCACTCAACGATCCGTTCACTACCAGGGCCTGTCGCGCGGCGGTGCGCAGCGCCGAGGCGAT
+GGTGGCGGAGTTCTCTGCTCGCCGCTGACGCGTCAGGCCCTCGGGTGTCACAGTGGTGGGCGTGACTGGT
+GGCGCCAACGCAACGGTGATCAGCCACCGGGTGGAACATGTTTTCGAGCCCAAGGGGCAGCGACGGCAGC
+TCGGGGCACAAGGGTCATAAGGGCATGCGCTCAGAATGTGTCGACCTTCTCGATGCTGACGAACATGCCA
+TGGCCCGTGCGGTTGTTCGTGAAGCGGGTGCCATCGGTGGTGGCGTCGATGGTCCAGCCCTGCGCTTCAT
+AGGTTCGGTAGTCGATGCTGACGGTGGGGATGGCGCCCAGATTGCCCAACACCCACTGCACGGAGCCGCC
+GGCGGTGATGTGGATGCCGTTGGCGTGCTCACCATCTCGCAAGGGGGAGTTGGTGAACGGTGCCTCGCAG
+CCAACGCTGTCCCTATTGATCTGGCAACGCGTCATTCCGGACTTGGTTTCGATGAAGACGTAACCGTTGG
+AGTCAGGCGGGAGCGGAATGGCGCCGGCCGGCGCGGTCGGGCTGACCGGTGTCGTCGGTAGCGTCGGGGC
+GGTGGTCCCCGGCGGCGCGGTAGTTGGCCTAGGCGTCGGAAAAGTCGGCTCGGTAGGTCCCGACCCTGGC
+GAAGCGACCGGCCTGCCGTCGATGGTGGTGTTGCAGCCGGCAACTAGCGCGGTAGCCGCCAGCAGGGCCG
+CCATACCCCGTGCAATGAGCGATAGCCGCACGCGCTACTCCCCGGAAATCTGAGATATCGGGAGTAGGTT
+ACGCGCGAGGTCCCGCAATTTACTGCAGTGACGCGCTTCTGCAACGGCCCGCATAATCGGAGAATGGCGT
+TGTTGCCGTCGACGGTCGTGGGAGTCTTGCTGGCCGCGGGTGCGGGCCGGTGGTATGGCAAGCCGAAAGT
+GCTGGTTGACGGGTGGCTGGACACCGCGGTCGGGGCGTTGCGCGACGGTGGTTGTAACGACGTTTTTTGG
+TGCTGGGTGCTGTCGAGGTGTCGGCACCGGCCGGTGTCACCGCGATTACCGCGCCGGACTGGCAGCAGGG
+GCTGAGCGCGTCAGTGCGTGCGGGTCTGGCCCAGGCCGACCGCGAGCACGCCGACTACGCCGTCCTGCAT
+GTGATCGACACGCCCGATGTCAATGCCAAGGTGGTGGCTCGAGTCCTTGGCCGTGCCTTGGTATCCCGCA
+GCGGTCTGGCAGGGCGCGGCCGCATACCTGCGCACAGTGCCCGACGTCGAGGCTGTTGAGTGCGGCGACT
+TGGCTAGTGGTCGCGATGTCGACGTGGACCTCAGATTGGATCCGCCGAATGGACGACCGCGACACTCTTG
+GTGTGGTCGATGGCGTGGTGCGCGACGGCCGTCACACGATTGCGGACCAAATACCAGCCACCGATGAGGG
+CCGGTACACCGATCACCGTTGCGGCGATCATCCAGGGACCGTGTTGTTCGTCGAAGTACATCAGGATCAG
+CACGCCGGCCAGGAAAGCCAGCGTCAGATAGCCGCTGAACGGTGAAAGCGGCATCCGGAATTTCGGCCGC
+TGCAGCTGCCCGGCGTTCGCCATCCGGTGGAGCCGCAGCTGGCAAGCCACGATCGTCGCCCAGGCCGCGA
+TGACTCCCGTCGCGGCGATGTGGAGCACGATCTCGAAGGCTTGGCTCGGTTTGATGGCGTTGAGAATGAT
+GCCCAACAGGCCGATACCGGCGGTGAGCAGGATCCCGCCGTACGGCACGCCGGTCTTCGACATTGGTGCG
+GTGAACCTCGGGCCGCTGCCGTTGATCGCCATTGATCGCAGGATCCGTCCGGTGGAATACAGTCCGGCGT
+TGAGGCTCGACAGCGCGGCGGTGAGCACGACGAGGTTCATCACGCTGCCCGCCGCGTCGATACCGATCTT
+GGAAAAGAAGGTCACGAACGGGCTGACATGTTCTTTGTAGGCGGTATAGGGCAGCAGCAGGGCCAGCAGG
+ACAGTCGACCCGACGTAGAAGCACGCGATGCGCAACACCACAGAGTTGATCGCGCGCGGCATGATCTTTG
+CCGGTTCGGCTGTTTCCCCGGCCGCGATGCCCACCAGTTCGATTGCGGCGTAGGCGAATACCACCCCCGA
+GGTGACCAGCACTATGGGCAGCAGACCGGTTGGCACGATGCCTCCATGGCTGCTCCACAGGGAGACCCCG
+GTCTCCTGGCCGTCGATCTTGTAGCGCCCAGCGAGAAAGACCGTACCGACGATCAGAAACGTAACCAGCG
+CGATCACCTTGATCAATGAGGCCCAGAACTCCAGCTCGCCGAAGAGCCTGACCGAGATCAGGTTCATCGA
+CAACACGACCAGCAGCGCGATCAACGCCAGCGTCCACTGGGGGATGGGTTGAAACGCCCGCCAGTAATGG
+CAATAGTGCGCGATCGCGGTGGTATCGACGATCCCCGTCATCGCCCAGTTCAGGAAGTACATCCACCCGG
+CGACGAAGGCCACCTTTTCCCCGTAGAACTCGCGGGCGTAGGACACGAATGACCCCGAGGACGGACGGTG
+CAGCACCAGTTCGCCGAGCGCGCGCAGGATCAGGAACACGAAGATGCCGCAGATCCCATAGACCAGGAAC
+AAACCGGGCCCCGCCGATGCAAGGCGGCCGCCGGCGCCGAGAAAAAGGCCGGTACCGATGGCACCACCGA
+GAGCGATCATTTGCAGTTGCCGGCTATGGAGGCCTTTGTGATAGCCCGTGTCTTCGCGCGTGAGCCGCTC
+GTCGGTGATGTCTAGCGGTGGCATTGAGCTCCCTGGGATGGTGGCTTCTTGGGACGCGCGTGAGATGGGG
+CACACCCAACGGACTGGCTGTCAGGCTATCCCACGCGGCTGCGAGGTGCCGCTTGGCAACCAATCGGAAA
+CAATCGATCGGTCAACGGTGCTTTGTTGTCGTGCCGACCGTCGCGGGTGGCCGCGTTGACAGTCGATATT
+GCGGTCACAGGCTGACGCGCCTGGCCAGCCAGACGCTCGCGAAGTGCGGGTCCGTCCTGGCCGCGAGGGT
+GTCGTAGCCGCGGTCGTAGTGTGAGACTCCGACACCTGATCCGCCAGCGCAGAGATGTGAGATCAACGGA
+CGGAAGGCGACGGTGCCCGGCGCGCGCGAGTTGACGCTGCGCGTCGAGCGCGGGGCTCTATTTCGGCGTC
+GATGGGCAGCATCGGCAGCGTCATCAGCTCGCGCAGCAATTCGTCGTGATCCGCGGCGCTGCGCGCTGGG
+TACCCGGCCTCGATGGGTATCATTTTTGGTTATCGTTCTGGTTATCATGAATGTTGTGACGGCCCATCCC
+AAGTACCCGAATGACCCTCTTGCGCTGGTATTGATTGAACTGCGCCATCCGCGGACCGAGCCGCCGGTGC
+CATCTGCTATCTCCATCCTGAAGGAGGAGCTGGCGCGATGGACTCCCATACTCGAACAGGAGGAGGTGCG
+GCAGGTCAACCTAGAAACGGGCGAACATACCGCACACTCACAGAAGAAGCTCGTTGCCCGTGATCGCCGC
+ACCGCGATCACGTTTCGACCCGACGCCATGACCCTCGAAGTCACCGACTACCCGGGCTGGGAGGAGTTTC
+GGTCCATCGTTCACGCGATGGTCACAGCCCGCCAGGACGTGGCCCCAGTCGATGGCTGCATCCGGATCGG
+TCTGCGCTACATCAACGAGATTCGGGCATCGCTGGCGGAGCCATCCGGCTGGGCGTACTGGGTGGCGGAA
+AGTCTCCTCGGGCCTGGGACACAGCTTGCCGATCTCAAACTCACCACCACCGCGCAACGGCACGTCATTC
+AGTGCGAAGGCCCGGAGCCAGGCGACTCCTTGACACTGAGGTACGCCGGTGCGCGCGGCGCGGTCATCCA
+GTCAACCCCGTTTCTCCAGCGGTTGAAAGAACCTCCGGCAGAAGGAGATTTCTTCCTCATCGATATCGAC
+AGCGCGTGGAGCGACCCCTGCAAGGGCATCCCAGCGCTCGACGCCCACCTGGTGGACGAGGTCGCCGAAA
+GGCTCCACACACCCATCGGCCCACTGTTCGAATCGCTGATAACTTCCGAACTCCGTACAAAGGTGCTGCA
+ACAACCTGGGCAGGAGTGACCATGACCATTTCGTTCTCTAGCTCGAATCTCCGAGACGACGCCACCTCTG
+GCAACGGCGATTACCGCCTCGACAAGCTGCCCGAAACCACCCCATCGACCTCGGTGTTCGACCGCGCCGA
+TGTCACCTACCGCCAATTCACGGAACTCCACGGGCAAGCCCGCGACACACGGCGGGAGGCGCACGTGGTT
+GAGCTGGAGTCCAAGACCGGCGAGCGGGCTCGGTGCGCACCCATGCATGCGCTTGAGCAGCTCGCGGACT
+ACGGCTTTGCCTGGCGGGACATCGCACGCGTTGTCGGAGTGAGCGTGCCCGCAATCACCAAATGGCGCAA
+GGGCGCTGGAGTTACCGGCGAGAACCGGCTAAAAATCGCCCGTCTACTCGCCCTCATCGACATGCTCTCG
+GACCGATTCATCGGCGAGCCCGCCTCCTGGCTGGAAATGCCGATCCAAGCCGGAGTGGGAATCACCCGAA
+TGGACCTCCTGGAGCGAGGTCGATATGACCTCGTATTGGCGCTGGCTAGTACCCACACTGGGGACGGTAC
+GGTCGAATACGTACTGAACGAGACTGATAAGGACTGGCGAGAGACCGTTGTAGACAACGCTTTCGAATCC
+TACACAGCCGAGGACGGCGTGATCTCGATAAGACCCAAGCGGTAACCGTGCCAGAGCTGGAGACGCCCGA
+CGACCCAGAGTCGATATACCTTGCCCGCCTCGAGGATGTCGGAGAACACAGACCGACGTTCACGGGCGAC
+ATCTACCGACTCGGCGATGGTCGCATGGTGATGATCCTCCAGCACCCATGCGCGCTGCGGCACGGCGTTG
+ACCTCCATCCGCGACTGCTGGTCGCTCCCGTAAGACCCGACTCGCTTCGTTCCAACTGGGCTAGAGCCCC
+GTTCGGCACGATGCCGCTTCCGAAGCTCATCGACGGTCAGGATCACTCGGCGGACTTCATCAATCTTGAA
+CTCATCGATTCACCAACGCTTCCGACCTGTGAGCGGATCGCGGTGCTCAGCCAGTCAGGCGTCAACTTGG
+TCATGCAACGGTGGGTGTACCACAGCACCCGGCTCGCCGTGCCCACGCACACCTACTCCGACAGCACCGT
+TGGCCCGTTCGATGAGGCAGACCTGATCGAGGAGTGGGTGACGGATCGCGTCGACGATGGGGCCGACCCG
+CAGGCGGCCGAACACGAATGCGCCTCCTGGCTCGATGAAAGAATCAGCGGCCGCACTCGGCGAGCGCTGC
+TCAGCGACCGTCAGCACGCCAGTTCAATACGGCGAGAAGCGCGTTCTCATCGAAAGTCGGTCAAGCTGGC
+GGACTGAGCACTGCTCTCCGGGCTTGACCGGGGCCTCTCCCAGCTACGCCCCGAGCGTGTGCCCTGCCGA
+CACGCGGGAACAAGACCCGCACGACCAGCGTTAGCATGCTCAGTAAGTTGAGTGCATCAGGCTCAGCTCT
+GAATTGACAGCACACCGCCGTCGAGGCAAGCTTGAGCGGGGTGCACTCATCATAGTGCAGGAAAGAAGCT
+CTACATATTCAGGAGGATTCACCATGGCTCGTGCGGTCGGGATCGACCTCGGGACCACCAACTCCGTCGT
+CTCGGTTCTGGAAGGTGGCGACCCGGTCGTCGTCGCCAACTCCGAGGGCTCCAGGACCACCCCGTCAATT
+GTCGCGTTCGCCCGCAACGGTGAGGTGCTGGTCGGCCAGCCCGCCAAGAACCAGGCGGTGACCAACGTCG
+ATCGCACCGTGCGCTCGGTCAAGCGACACATGGGCAGCGACTGGTCCATAGAGATTGACGGCAAGAAATA
+CACCGCGCCGGAGATCAGCGCCCGCATTCTGATGAAGCTGAAGCGCGACGCCGAGGCCTACCTCGGTGAG
+GACATTACCGACGCGGTTATCACGACGCCCGCCTACTTCAATGACGCCCAGCGTCAGGCCACCAAGGACG
+CCGGCCAGATCGCCGGCCTCAACGTGCTGCGGATCGTCAACGAGCCGACCGCGGCCGCGCTGGCCTACGG
+CCTCGACAAGGGCGAGAAGGAGCAGCGAATCCTGGTCTTCGACTTGGGTGGTGGCACTTTCGACGTTTCC
+CTGCTGGAGATCGGCGAGGGTGTGGTTGAGGTCCGTGCCACTTCGGGTGACAACCACCTCGGCGGCGACG
+ACTGGGACCAGCGGGTCGTCGATTGGCTGGTGGACAAGTTCAAGGGCACCAGCGGCATCGATCTGACCAA
+GGACAAGATGGCGATGCAGCGGCTGCGGGAAGCCGCCGAGAAGGCAAAGATCGAGCTGAGTTCGAGTCAG
+TCCACCTCGATCAACCTGCCCTACATCACCGTCGACGCCGACAAGAACCCGTTGTTCTTAGACGAGCAGC
+TGACCCGCGCGGAGTTCCAACGGATCACTCAGGACCTGCTGGACCGCACTCGCAAGCCGTTCCAGTCGGT
+GATCGCTGACACCGGCATTTCGGTGTCGGAGATCGATCACGTTGTGCTCGTGGGTGGTTCGACCCGGATG
+CCCGCGGTGACCGATCTGGTCAAGGAACTCACCGGCGGCAAGGAACCCAACAAGGGCGTCAACCCCGATG
+AGGTTGTCGCGGTGGGAGCCGCTCTGCAGGCCGGCGTCCTCAAGGGCGAGGTGAAAGACGTTCTGCTGCT
+TGATGTTACCCCGCTGAGCCTGGGTATCGAGACCAAGGGCGGGGTGATGACCAGGCTCATCGAGCGCAAC
+ACCACGATCCCCACCAAGCGGTCGGAGACTTTCACCACCGCCGACGACAACCAACCGTCGGTGCAGATCC
+AGGTCTATCAGGGGGAGCGTGAGATCGCCGCGCACAACAAGTTGCTCGGGTCCTTCGAGCTGACCGGCAT
+CCCGCCGGCGCCGCGGGGGATTCCGCAGATCGAGGTCACTTTCGACATCGACGCCAACGGCATTGTGCAC
+GTCACCGCCAAGGACAAGGGCACCGGCAAGGAGAACACGATCCGAATCCAGGAAGGCTCGGGCCTGTCCA
+AGGAAGACATTGACCGCATGATCAAGGACGCCGAAGCGCACGCCGAGGAGGATCGCAAGCGTCGCGAGGA
+GGCCGATGTTCGTAATCAAGCCGAGACATTGGTCTACCAGACGGAGAAGTTCGTCAAAGAACAGCGTGAG
+GCCGAGGGTGGTTCGAAGGTACCTGAAGACACGCTGAACAAGGTTGATGCCGCGGTGGCGGAAGCGAAGG
+CGGCACTTGGCGGATCGGATATTTCGGCCATCAAGTCGGCGATGGAGAAGCTGGGCCAGGAGTCGCAGGC
+TCTGGGGCAAGCGATCTACGAAGCAGCTCAGGCTGCGTCACAGGCCACTGGCGCTGCCCACCCCGGCGGC
+GAGCCGGGCGGTGCCCACCCCGGCTCGGCTGATGACGTTGTGGACGCGGAGGTGGTCGACGACGGCCGGG
+AGGCCAAGTGACGGACGGAAATCAAAAGCCGGATGGCAATTCGGGCGAACAGGTAACCGTCACTGACAAG
+CGGCGGATCGATCCCGAGACGGGTGAAGTGCGGCACGTCCCTCCCGGCGACATGCCGGGAGGGACGGCTG
+CGGCCGATGCGGCGCACACCGAAGACAAGGTCGCCGAGCTGACCGCCGATCTGCAACGCGTGCAGGCCGA
+CTTCGCCAACTACCGTAAGCGGGCGTTGCGCGATCAGCAGGCGGCCGCTGACCGAGCCAAGGCCAGCGTT
+GTCAGCCAATTGCTGGGTGTACTGGACGATCTCGAGCGGGCGCGCAAGCACGGCGATTTGGAGTCGGGTC
+CACTGAAGTCGGTCGCCGACAAGCTAGACAGCGCGTTGACCGGGCTGGGTCTGGTGGCGTTCGGTGCCGA
+GGGCGAGGATTTCGACCCCGTGCTGCACGAAGCGGTGCAACACGAGGGCGACGGCGGGCAGGGGTCCAAG
+CCGGTAATCGGCACCGTCATGCGGCAGGGCTACCAACTGGGTGAGCAGGTGCTGCGGCACGCCTTGGTCG
+GCGTCGTCGACACGGTGGTCGTCGACGCGGCCGAACTGGAGTCAGTCGACGACGGCACTGCGGTCGCAGA
+TACCGCCGAAAACGATCAAGCTGACCAGGGCAATAGCGCCGACACCTTGGGCGAACAGGCAGAATCAGAA
+CCGTCGGGCAGTTAACAACAAAAGAGGAAGGCGAGAGGGGGTGACGCGACATGGCCCAAAGGGAATGGGT
+CGAAAAAGACTTCTACCAGGAGCTGGGCGTCTCCTCTGATGCCAGTCCTGAAGAGATCAAACGTGCCTAT
+CGGAAGTTGGCGCGCGACCTGCATCCGGACGCGAACCCGGGCAACCCGGCCGCCGGCGAACGGTTCAAGG
+CGGTTTCGGAGGCGCATAACGTGCTGTCGGATCCGGCCAAGCGCAAGGAGTACGACGAAACCCGCCGCCT
+GTTCGCCGGCGGCGGGTTCGGCGGCCGTCGGTTCGACAGCGGCTTTGGGGGCGGGTTCGGCGGCTTCGGG
+GTCGGTGGAGACGGCGCCGAGTTCAACCTCAACGACTTGTTCGACGCCGCCAGCCGAACCGGCGGTACCA
+CCATCGGTGACTTGTTCGGTGGCTTGTTCGGACGCGGTGGCAGCGCCCGTCCCAGCCGCCCGCGACGCGG
+CAACGACCTGGAGACCGAGACCGAGTTGGATTTCGTGGAGGCCGCCAAGGGCGTGGCGATGCCGCTGCGA
+TTAACCAGCCCGGCGCCGTGCACCAACTGCCATGGCAGCGGGGCCCGGCCAGGCACCAGCCCAAAGGTGT
+GTCCCACTTGCAACGGGTCGGGCGTGATCAACCGCAATCAGGGCGCGTTCGGCTTCTCCGAGCCGTGCAC
+CGACTGCCGAGGTAGCGGCTCGATCATCGAGCACCCCTGCGAGGAGTGCAAAGGCACCGGCGTGACCACC
+CGCACCCGAACCATCAACGTGCGGATCCCGCCCGGTGTCGAGGATGGGCAGCGCATCCGGCTAGCCGGTC
+AGGGCGAGGCCGGGTTGCGCGGCGCTCCCTCGGGGGATCTCTACGTGACGGTGCATGTGCGGCCCGACAA
+GATCTTCGGCCGCGACGGCGACGACCTCACCGTCACCGTTCCGGTCAGCTTCACCGAATTGGCTTTGGGC
+TCGACGCTGTCGGTGCCTACCCTGGACGGCACGGTCGGGGTCCGGGTGCCCAAAGGCACCGCTGACGGCC
+GCATTCTGCGTGTGCGCGGACGCGGTGTGCCCAAGCGCAGTGGGGGTAGCGGCGACCTACTTGTCACCGT
+GAAGGTGGCCGTGCCGCCCAATTTGGCAGGCGCCGCTCAGGAAGCTCTGGAAGCCTATGCGGCGGCGGAG
+CGGTCCAGTGGTTTCAACCCGCGGGCCGGATGGGCAGGTAATCGCTGATGGCGAAGAACCCAAAGGACGG
+GGAATCCCGGACGTTTTTGATCTCGGTAGCCGCCGAGCTAGCCGGCATGCATGCACAGACCCTGCGTACC
+TACGATCGTCTTGGGTTGGTCAGCCCGCGGCGCACCTCCGGTGGCGGGCGCCGCTATTCCCTGCATGACG
+TCGAGTTGCTGCGCCAGGTGCAGCACCTCTCGCAGGACGAGGGGGTCAACTTGGCCGGCATCAAGCGCAT
+TATTGAACTGACCAGTCAGGTCGAGGCGCTGCAGTCCAGGTTGCAAGAGATGGCTGAGGAGTTGGCGGTG
+TTGCGTGCCAACCAGCGCCGCGAGGTCGCGGTGGTGCCGAAGAGCACCGCCCTGGTCGTCTGGAAACCGC
+GCCGGTGAGCGAGCGCGCGTAGCGGGGGAGCGAACGGCGCAGTTGGCACCAGCCGGTGAGCGAGCGCGCG
+TAGCGGGGGAGCGAACGGCGCAGTTGGCACCAGCCGGTGAGCGAGCGCGCGTAGCGGGGGAGTTAGGGTC
+CGCTACCGTTGTTGAGGATGCCGGAGAGTCGGGCTCCGTGGTTGCCGAAGCCGGAGATAAGGGCTTGGGT
+CGCGAGGTCCAGCATGCTCGTGTTGTAGAAACCGGAGACGGTATTGCCTAGGTTCGCCCAGCCCGACAGC
+AGGTTGCCGAAGTTTTGGAAGCCCGAATTCCCTACGCCGCCAGCATTGAAGAAGCCCGAAGTCTCGGTGA
+AGACGTTTCCCAGGCCCGACACGGCGGCTGCGGCGTCGTTGAGGAAGCCCGATGCGCCACCGGCGCCGGA
+GTTGAAGAAGCCCGACGACGGGGTTGTGGTCGAGTTGAAGAATCCCGGGCTCTGCTGCCAGCCGAAGCCG
+AAGGGGAACGCGCCCACGGTGCCGCTGCCGGCGAAATCGAGGGTTTGGGTGAAAGCCGTGTCGATGGGCT
+GGTCGGGGTTGATCGTGCTGGCATCGATTTCGTAGGGGCCGAGATGTTCGGTGGTGATGGGTATGGTGAC
+CGAGACATGCTTTACACACCCCTTGAAAGGGATGTAGATCACGCAGACCGACACCCGCAACTTGATGGGT
+ATTTCGAATTCGTCAATAGTGAACGCGTCCTGGGTGATGGCGTTGATGTCGCCCTCGATGGGTATTTCAA
+TGTTGGAACCTATGTCGTAGCTCCACGGGATTTCGGAAACGGCGCTCTGGTAGGCGAAACCGCCTAGGCC
+CTGGTAGTCGCCCCGCCAGAAGAAGCCGTTGCTGTAGTTGCCCGAATTGAAGGCGCCGGTGTTGACATCG
+CCGGAGTTGGCGAAGCCGGTGTTGGAGTTGCCCGGGTTGAAGTAGCCGGTGTTGTAGTTACCGGGGTTGA
+AGCCGCCGGTGTTGTAGTCGCCGGGGTTGAAGCTGCCGGTGTTGGTGTTCCCGGCGTTGAATAGGCCGGT
+GTTGTAGTCACCGGAGTTGCCAATGCCGGTGTTGACCAGGCCGGTGTTGAAGAAGCCGGAGTTGGTGCTG
+CCGGTGTTGCCGATGCCGGTGTTGTAGTCACCGGAGTTTCCGATGCCCCAGTTGCCGGTGCCGGAGTTGC
+CGAAGCCGATGTTGCCGGTGCCGGAGTTGAATAGCCCGATGTTGCCGGTGCCCGAGTTCCAGCCGCCGAA
+CCCGGTCATGGTGTCGCCGGTCAGCCCGATGCCGATGTTTCCGTTTCCGGTGTTGCCGAAGCCGATGTTG
+CCGGTGCCGGTATTGCCGATGCCGATGTTTCCGTTTCCGGTGTTGCCGAAGCCGATGTTGCCGATGGCCG
+CCGTCAGCCCCGGACCGACGTTGCCGAACCCGATGTTGGAGCTGCCGATGTTGGCGCTGCCCAGGTTGAA
+GTCGCCGATGTTGGCGCTGCCCAGGTTGAAGTCGCCGATGTTGGCGCTGCCCAGGTTGTAGACGCCGATG
+TTGGCGCTGCCCAGGTTGTAGTTGCCGATGTTTGCGCTACCCAGATTCCAGAACCCGAGGTTGGCCAAGC
+CCACGCTGAAGGTCGTCTCGGTCGGGCCGTTCTGCAACCACCCAGCCAGGTTGGTGCCGATGTTGAGCAA
+GCCCGAGACATTTGCCGGTGCTCCCAAGCCGGTGTTGTAGATGCCCGAGATGCTGTTGCCCAAATTCGCC
+CAGCCCGACTGCAGCGACCCATAGTTTTGGAAGCCCGAATTTCCCATGCTGCTAGTGGCGAAGTTGTAGA
+GGCCCGAGTTGTTGCCGAAGTTCAGCAAGCCCGATGCGCTGCCAGCACCCCAGTTGAGGAAGCCCGACGA
+CGGGCCGGTGGTGGCGTTGAAGAAGCCGGGCGCTGGCCGCAAGTCGATGATCGGAATGCTGATCGGGCCG
+GCGCCGGCGCCGCCCACGATGTTGATCACGGTGGAGCCGTCGGGCTTGCCGATGTTGAGGTTGATCGCCG
+GCGAGGGGCCGAAGTCAATTTCGATGGGTGTGTCCAGCGGGGCCGACGCGTCCCCGCCATGCAGGGTGAT
+CGGACCGACCGGGGCCAAGACGGTGCCACTGAGGATGCCTATGTCGACGCTTCCGCTGGCGTCGATTCTG
+GGGAACGTAATGGCGGGGATGGAGACATTGGTGATGTCGCCGGTGATGGGGATGTTGACCGGGATGTCGA
+CATTGAGGAACGCGGCAGGTCGCTCGATGGTGATGGTGTAGTTGGCCGCCAGCAGGCCCTGCCGGTCGGC
+GCGCCAGAGCAAGCCGTTGTTCATGCTGCCGGTGATGAACGCGCCGGTGCCGTAGTCTCCGGCGTTTGCC
+ATGCCGGTGTTGTAGCTACCGGTGTTGTAGGAGCCGGTGTTGTAGTGGCCCGGGTTGGCGATGCCGGTGT
+TGAAGGTGCCGATGTTGAACAGGCCGGTGTTGTGGTTGCCCGGGTTGGCGATGCCGGTGTTGACCAGGCC
+CGCGTTGAGCAAGCCGGTGTTGTAGTTGCCGCTGTTTCCGATGCCGGTGTTGCCGGTGCCGGTGTTGCCG
+ATGCCGACGTTGCCGGTGCCCGAGTTGCCGATGCCGACATTGCCGGTGCCCGAGTTAAACAAGCCGATGT
+TGAAACTGCCCGAGTTGGTGCCGCCGATGCCCACCTGGCTGTCGCCGGATAGGCCGACGCCGAAGCCGCC
+GGTGCCCATGTTGCCGATGCCGACGTTGCCGGTGCCCGAGTTGAACAAGCCGGTGTTGCCGGTGCCGGAG
+TTGAACAAGCCGGTGTTGGCGGTGCCGGAGTTGAAGAAACCGGTGTTGCCGGCGCCGGAGTTCAGGGAGC
+TGAAGCCGGACAAGCCGTCGCCGGTCAGCCCGATGCCGACGTTGTTGTTGCCGGTGTTGAACAAGCCGAT
+GTTGTTGTTGCCGGTGTTGGCAATGCCCTGGTTGAAGTTGCCCGCGTTGGCCATGCCAAAGTTGTTGTCG
+CCCAGGTTGAACAGGCCCATGTTGGCGATGCCGGCGTTCAGCGGGCCGAACCCGATCTGGTTGTCGCCGG
+ACAGGCCGATGCCGATGTTGTTGTTGCCGGTGTTGCCGAAGCCGATGTTGTAGTTACCGGTGTTGCCGAC
+ACCGATGTTGTAGTTGCCGGTGTTGCCGATACCGATGTTGTTGACAGCCGCCGTTAGCCCCGGACCGGTG
+TTTGCGATCCCGACGTTAAAGTCGCCGATGTTTGCGCCGCCGATGTTCGCGTTGCCAATGTTGCCGAAGC
+CGACGTTTGAATTGCCGAGGTTTGCACTGCCGAGGTTTGCACTGCCGAGGTTTGCACTGCCCACGTTGAA
+TTGGCCGAGGTTTGCCAGGCCCGCGTTGAAGGTCGACCCGTTCGGGCCGCGGAGCACGCCGGTCAGGTCG
+GCGCCGACGTTGGAGAGGCCCGAGAGGTTAGCCGGCGTCGCGAAGTCCGCCGCACTGGTGTTGTAGAAGC
+CCGAGACGGTGTTGCCCAAGTTCGCCCAGCCGGATTGCAGCGAGCCGAAGTTCTGCAAGCCAGAGTTTCC
+TATGCCGGCGAAAGCGGTGTTCCAGAAGCCCGAATTGTTGGCGCCGACGTTTCCGAATCCAGACGAGCTG
+CCGGTGCCGGAGTTGAAGAAGCCCGATGAGGGGCCGGTGGTCGAGTTTCCGAAACCGGGGGCCGGCGGGA
+TGTCCAGTAGCGGGATGACGACCGGGCCGGCGCCGCTGGTGATCGTGATGGGTATCGAGGATGAACCGCC
+GGGGTCGCCGATGTTGATATCGATCACCGGTAAGGTGCCGGCGATCCTCGGAACGATGATGGGTCCGACG
+CTGAAGTGGGTGACCCCGAGGGCGCGGAGGGTGATAGCCGGAATCTGGAAGCCGTTGACGGCAAGGGTAC
+CGAAGTCGAGATGGATGGGGATGTTGACCGGAATGTTGAGGCTAAAGTTCAGTAGCGGGATCTGGGGAAC
+AGTGATTGCGTAGTGTGCGCCCCACTGGCCTTGGTGATCGCTCTGCCAGAAGGCGCCGTTGCTGAAGTTG
+CCCCCGATGAAGGCGCCGGTGTTCACGTCGCCGGTGTTGTAGAAGCCGGTGTTGTAGTCGCCGGTGTTGT
+AGAAGCCGGTATTGAAGTCGCCGTCGTTGAAGCTGCCGGTGTTGGTGCTGCCGGTGTTGTAGCTGCCCGT
+GTTGGCGATGCCCACGTTGGCGATGCCGGTGTTGGTGCTGCCCACGTTGTAGCCACCGGTGTTGTAGGTG
+CCCACGTTGGCGACGCCCATATTGCCGGTGCCTGGGTTCCACAGGCCCCAGTTGCCGGTGCCCGAGTTCC
+CCAAGCCGGTGTTGCCGACACCCGGGTTGCCGATCCCGGTGTTTCCGATGCCCGAGTTGCCAATGCCGAT
+GTTTCCGGTGCCCGAGTTGAACAAACCGATGTTGTTGGTGCCCGAGTTGAACAGGCCGGTGTTGGCGGTA
+CCGGAGTTCCAGGAGCCGAACCCCTGTTGATTGTGGCCGGACAGCCCGATACCGATGTTGTTGTTGCCGG
+TGTTGGCAAACCCGATGTTGTTGCTGCCGCTGTTGGCGAAGCCCAGGTTGAAATCGCCGGCGTTGCCGAA
+TCCGAAGTTGTAGCTGCCCAGGTTGCCTAGGCCGATGTTGTAGTTACCCAGGTTTGCCGGGCCGATATTG
+TATGAGCCCCGGTTTCCGGAGAAGACGTTGAAGCTGCCGATGTTGCCATGGCCGACGTTCGCGTTGCCGA
+GGTTTCCGAGGCCGACGTTGGAGTCGCCGATATTGCCGTGGCCGACATTCCCGCTGCCTACGTTGCCAAA
+CCCGAGGTTGAGGATCTGGGTGTTGTTGACGAAGCCGGCGACCGTAGCACCGACATTCCCTCCGCCGGAG
+AGATTGGCCGGCATCGAAAGCCCAAGCGTGCTCGCATTGACAAGGCCGGAGACAGTGTTACCGAAGTTGA
+ACCCGCCGGAGATCAGCTCGCCGAAGTTCTGGACGCCCGAGATTCCCGAGCTTCCAGAGGTGAGGTCGAA
+GAAGCCGGAACTATTGCTGCCCACGTTGCCAACGCCCGACACGGTACCGGTACCGGCGTTGAAGAATCCC
+GACGACGGGGTGGTCGTCGAGTTCCCGAATCCCGGGGCCGCCGGTATATCGATGAGTGGAATCTTGATCG
+GCAATAGACCGCCGGTGCCGGCGATATCGATCAGCGGGTCCGGCCCGCTACCCAGGTTGATGCCGATATT
+GGGAAGGACAATCGAGATGTTCGGGAAACTGAATGCATCGAGTGTGGCGGCATTGAACGGTATGCCGATC
+AAGAAGATATCGCCGGTGATCTCCGGGAATCTGAAGCCATGAACGGTGAACGTGCCAAGTGTGCCGGTGA
+CCGGGATATCGAGGAAGATCGGCACGTGCAGTTTCACCGGAACGGCGGTGTCGGGCACGGTGATCGTTTG
+GCTGATCCCCGCCAGGCCTTGGTAATCGCCCCGCCACCAGAACCCGTTGCTGTAATTGCCGGTGATGAAG
+CCGCCGGTGTTGACATCGCCCGAGTTGGCCAGTCCGGTGTTGTAGCTGCCGGTGTTCAAATAACCCGTGT
+TGTAGCTACCCGGGTTGAAGCCGGCCGTGTTGAAGCTGCCGGCGTTGAAGCTGCCGGTGTTGTAATGGCC
+GGTGTTGAAGATGCCGGTGTTGACGTTGCCGGCGTTGAGCAAGCCGGTGTTGACGTCGCCGGTGTTGAAG
+ATGCCGGTGTTGGTGTCACCGGTGTTGGCGATGCCCCAGTTTCCGGTGCCCGAGTTGCCGATGCCGATGT
+TGCCGGTGCCCGAGTTGAACAAACCGATGTTGTTGGTGCCAGAGTTGAACAGGCCGCTGTTGCCGCTGCC
+GGAGTTCCAGCCACCGGCAAAATTGAAGCCCTGCTGGTTGTCGCCGGACAGGCCGATACCGATGTTGTTG
+TTGCCGGTGTTGGCAAACCCGATGTTGTTGTTGCCGGTGTTGGCGAAGCCCAGGTTGAAGTCGCCGGCGT
+TGCCGAATCCGAAGTTGTAGCTGCCCAGGTTGCCTAGGCCGATGTTGTAGTTACCCAGGTTCGCCGGGCC
+GATGTTGTATGAGCCCTGGTTTCCGCCGAAGACGTTGAAGCTGCCGAGGTTGCCGCTGCCGAGGTTGAAG
+CTGCCGATGTTCGCCAAGCCGGCGTTGCTGTCGCCTACGTTGGAGAAGCCGACGTTGAATTGGCCGATGT
+TTCCCAGGCCGAGGTTGAACATCGACATCCCGGTCGCCTGGTCGTGGAAGAACCCCGCGAGGTTGCTGCC
+GATGTTGAACATGCCCGAGACGTTGGCCGGTGCCCCGATGCCGGTGTTGAATACGCCCGAGACGGTATCG
+CCCAGGTTCGCCAGTCCCGATTGCAGCGAGCCGTAGTTGTTGAAGCCCGAGGTCGCGGAGTTCGCGACGT
+TCTGGAAGCCGGAAATGTTGGCGCCGATGTTGGCGATGCCCGATACGGTTCCGGGGCCGCCGTTGAAGAA
+GCCCGAGGACGGATCGGTGGTGGCGTTGAAAAAGCCCGTGGTAGCCGCAATGTTGACGAACGTGACATCG
+AAGGGACCGACGCTTGCGGTGGCCGGGATCCTGATCGCGGTCGAACCGCCAGGGTCGCCGATGTTGACCG
+TGATCGCGGGACCGGTCCCGGTGATGGGCGGGAGAACGGCCTTGCTGATTGCACCGGCCAGCAGGGGGAT
+CCCTGCGATGTCGATGGTGAAACCGAAGTTGATTTGCTCAAGCGTTATGCCGCTGTAGACGGTGTTGGTG
+AAGCTGGCGGTGATGGGGATGTTGACGGGAACTTCCACGGTGACGTGTGCGGGTATTTCGGGAACATGGA
+CCCGATAGCCCGCGCTGAATAGGCCCTGCTGGTCGCCGCGCCAGAAGGCGCCGTTGCCCATGTCGCCGGT
+GATGAAAGCCCCGGTGGCGATATCACCCTGGTTGGCAAAGCCCGTACTGAAATTGCCGGTGTTGTAGAAG
+CCCGTGTTGAAGTCGCCCAGGTTGGCGATGCCGGTGTTGGTGTCGCCGGTGTTGTACCAGCCGGTGTTGT
+AGCTGCCCGCGTTGGCGACACCGGTGTTGACGATGCCGGTGTTGAAGAAGCCCGTGTTAGTGCTGCCGGT
+GTTGCCGATGCCGGTGTTGCCGCTGCCGGAGTTGCCGATACCCCAGTTGCCGGTGCCCGAGTTGCCGATG
+CCGACGTTGTTGGTGCCGGAGTTGAACAAGCCGATGTTCGCGGTGCCTGAGTTCCAGCCGCCAGCAAAAT
+TGAAGCCCTGCTGGTTGTCGCCGGACAGCCCGATGCCGATGTTGTTGTTGCCGGTGTTGGCAAATCCGAT
+GTTGTTGTTGCCGGTGTTGGCAAAGCCTTGGTTGAAATCGCCGGCGTTGCCGAAGCCGATGTTGTAGTTA
+CCCAGGTTCGCGAAACCGATGTTGTAGTTACCCAGGTTCGCCGGACCGATATTGTATGAGCCCTGGTTTC
+CGGAGAAGACGTTGAAGCTGCCGACGTTTCCGCTGCCCAGGTTGAAGTCGCCGAGATTTGCGCTGCCGAT
+GTTCAACTGGCCCAGGTTGGCAAGGCCCGCGTTGAAGATCGTCCCGGTCGGACCGCGGAACACGCCGGAC
+AGGTTGGTGCCGATGTTGTTCAGGCCCGAGACATTGGCCGGCGTGGAGAGGTTCACCGTACTGGTGTTGA
+AAAAGCCCGATACGGAGTTGCCCAGGTTCGCCCAGCCTGACTGCAGCGAGCCGAGGTTCTGGAAACCCGA
+ATTCCCTATCGCGCTGCTCAAACCACTGTTCCAGACGCCTGAACTGCCGCCGCCGACGTTTTGGAAGCCA
+GATGTGCCACCGGTGCCCGAGTTGAAGAAGCCGGACGAGGGGTTGGTGGTCGAATTTCCGATGCCCGGCG
+CCGGATCGATCTTGAGGAAGGTAATCGTGCGGCTCTCCAGAGCACCGACAATGCTGATGGGGACGGTCAC
+CGTCGGTCCGCCGATGGTGAGGGTGATCGTCGGAACGGTCAGCGTGGATGCGCTGAGATTGACCGGGCCG
+AAGAAGAACAAACCGCTCAGATAGAAGGTTTGGGGGAAAACGGTCGAGGCCTCGGTGACCGTGATCATGT
+TGCCGCCGAAGGTCATTACGTTGTGTACGTCAATGACCATCTGCTCGTTTATGGGGATGAATGGAGTGGT
+GACCGAGAGATCGATGGCAATCTGGCCCTGGTTATCGCCCGCCACCAAGAAGCCATTGTTGAAGTCGCCC
+GTGTCGAAAGCGCCGGTATTGACGTTGCCGGGATTGAAGAAGCCGGTGTTGGTGTCACCCGGGTTATAGC
+TGCCGGTATTGGTGTCACCCACGTTGAAGTTGCCGGTGTTGGTGTTACCGACGTTGAAGCCGCCGGTGTT
+GTAGCTGCCCGTGTTGTAGAAGCCCGTGTTGAAGTCGCCGGCGTTGAGGATGCCCGTGTTGTAGCTGCCA
+GCATTGAGGATGCCGGTATTGTCGGTACCCGGGTTCCCGATACCCCAGTTCCCGGTGCCCGAGTTTGCGA
+TGCCGACGTTTCCGGTGCCCGCGTTGAAGATGCCAACGTTATTGGTGCCCGAATTGAACAGGCCGCTGTT
+GCCGGTGCCCGAGTTCCAGCCGCTAGCAATATTGAAGCCCTGCTGGTTGTCGCCGGACAGCCCGATGCCG
+ATGTTGTTGTTGCCGGTGTTGGCGAACCCGATGTTGTTGTTGCCGGTGTTGGCAAAGCCTTGGTTGAAGT
+CGCCCGCGTTCCCGAAGCCGACGTTGTAGTCGCCGACGTTTCCAAAACCGATGTTGTAGATCCCGAGGTT
+TCCGGATCCGATGTTGTAGTTTCCCAGGCTTCCGGAACCGACATTGAATACTCCGATGTTTCCACTGCCG
+ATATTGAAGCTGCCGACGTTGCCGCTGCCCAAGATGTTTTGGCTGCCGAGGTTGCCGCTGCCAAGGATGT
+TGAAGTCACCGACGTTTCCGCTGCCGAGAATGTTGTAATTGCCGATGTTGGCGTTGCCGAGAATGTTCAC
+GACGCCCCGGTTTGCCAGGCCGAGATTGAAGACCGGTGGGCCACCGAAAAATCCCGACATGTTGCTTCCG
+GTGTTGAAGAAGCCCGAGATCAAGGCCGGCGTTGTGATGGCCACCAGGCTCATGTTGAACAAACCCGATA
+CGGTGTTGCCCGAGTTGATCACGCCCGATACCAGCACGCCCGCGTTTGCCAGGCCGGAGTTACCGATGGC
+CCCCGACGAAGAGTTGAAGAAGCCAGAATTGTTGGCACCGGAGTTCAGGAAGCCGGACGCGCTACCGGCA
+CCGCTGTTGAAGAATCCCGACGACGGCGCACTGGTCGAGTTGAAGAAGCCGGGGCTCCCGAAAATCAGGC
+CTTGGTGGTCGCCGCGCCACAAGAAGCCGTTGTTGAAGTTGCCAGTAATGAAGGCGCCGGTGTTGACATT
+GCCGGAGTTTGCCAAGCCGGTGTTGTAGTTGCCGCTGTTCAGGTAGCCCGTGTTGTACTGGCCCATGTTG
+AAGCCGCCGGTATTGCTGTTGCCCGGGTTGTAGCTACCGGTGTTGTAGTTGCCGGCGTTGCCGACGCCGG
+TGTTGGCTATTCCGGAGTTGAAGAAGCCCGTGTTGGCGTCGCCGGAGTTGCCAAAACCGGTGTTGTAGCT
+GTTGCCCGAGTTGCCAATGCCCCAGTTCCCGGTACCCGAGTTGCCGATGCCGACGTTTCCGGTGCCCGAG
+TTGAACAGACCGATGTTGCCGGTGCCCGAGTTCAGGCCGCCGAACCCCAACAAACCGCTACCCGTGAGCC
+CGATACCTCGGTTGCCGTCTCCGGTATTGCCGAAGCCGATGTTGTTGCTGCCGGTGTTGCCAAACCCGAT
+GTTGTTGCTGCCGGTGTTGCCGAAACCGATGTTGTTCAGCGCTGCGGTCAACCCAGGACCCACGTTGCCA
+AACCCGATGTTGGAGCTGCCGATGTTGCCGCTGCCGATGTTGCCGTTGCCGATGTTGGCCGAGCCGAGAT
+TGAAGTTCCCGACATTACCGTTGCCGACGTTGCCCTCGCCGACGTTCGCCAAGCCCAGGTTGCGGAAGAC
+CCGCGTGGTCACCTGAGCCGCGGCCGCGCTGACCAGCGCACCGCCGCCCGCCACGGTCGGCAGCGCCTGG
+CCGAACGGTGTCAACGCCGAGACGGCCGCCGAAGCCCCGGCATGGTAGCCAAACATCGCCGCCACGTCCT
+GGGCCCACATCTGCTCGTAGGCGGCCTCGGTGGCCGCGATCGCCGGGGCGTTTTGGCCCAGCAGGTTCGA
+GACCACCAGCGACACGAACAGTGCCCGGTTGGCCGAGATGATCGCCGGATGTACCGTCGCCGCCAGGGCT
+GCCTCGAAGGCGGCCGCCGCCAGCCGGGTTTGGGTGGCCGCCTGCTGGGCCTGCGCCGCCGCCGCGCTCA
+ACCAGCCCAGATAGGGGGCGGCCGCTCCCGTCATCGCCGTCGACGCCGCGCCCAGCCACGAGGAACCTGC
+CAGCCCCGCCGTCACCGCCGAAAACGAGGCCGCGGCCGAACCCAATTCGTCGGCCAGTCCATCCCAAGCG
+GCCGCCGCGTCCAGCATCGGCGCCAACCCGGCACCCACGTACAGGCGCGCCGAATTGATCTCCGGGGGCA
+GCACCGCGAAGCTCATCTAGCGTCCCTAACCGGAACCGCTGACCACCACCGCGTGGTGGGTGGAGCCAAA
+CGTCCCGTTCCGCGCTTGGGTGTCTTGACAGTGACGATTATTCAACAGACGCCTGACGCAGGTTTGGCTT
+TGGAGTGTCGAGACAGAAAATCTCAGCTAGGGCTGGCCGGGCAGTAGCCGCACCATCAGGCCGTTGCCTT
+CGGCCAACAGCGTCTCGTCGCTGTCAAACAGTTCCGCGCACACAAACGCCTTTCGGCCCTCGGTATTGGT
+GACTCGTCCGCGTACGATCAACGGCACATCAATCGGGGTGATTCGGCGGTAATCAACGTGCAGAAAGGCG
+GTCCGGCTGATCGGCCGTCCCGCCGCATGCGAGATCATGCCGAACATGTGATCAAACAACAGCGGCAACA
+CGCCGCCGTGCACCGCGGAGTTGCCCCCGACGTGAAACCGGCTAAACGACCCCCGCATCTCAACACCGTC
+GGTGCCGTACCGGGTCACCGTCCATGGCGGTAGCAGCAGGCTGCCCATGCCGGGCAGGCCGGGGGTCCGC
+CCGGCCGGCGCCTTGCCTTCGTCGGCCTCAAATGGGCTCAGCAACTCGACGAGCGCGGCGGCGCGCTCGG
+CCGCCTCGTCCCACACGGCGTCGCCGGGGTCCGCCGCGACCGCCAGGTCCTGCAACCGGCGCATGGTCGC
+CACGAACTGGCCGAACCCCGCACCGGGACTGGCCGGACCGTACTCCGGAAATCCACCGTGGTGGTGATAC
+TCGGGATCGAGTTCGTCGGGGTGCACTGACGCATCTGTCACGGGCGATCCTGCAGGACGTCCCGGCGCAC
+GATGGTCTGTTCCCGCCCCGGACCGACTCCAATGCACGAAACCGGTGCTCCGGCAAGCTGTTCCAGTCGC
+AGCACATAATCACGCGCTTTGGCGGGCAGGTCGTCGAACTCGCGCGCCCCGGAGATGTCTTCCCACCAGC
+CCGGCAGCTCCTCGTAAACCGGCTTGGCGCGGCAAAGATCCCGCTGGGTCATCGGCATATCGCGGGTGCG
+CCGGCCGTCGATCTCATATCCGACGCAGACCGGCACCGATTCCAGGCTGGACAGCACGTCGAGCTTGGTC
+AGGAAGTAGTCGGTGATGCCGTTGACCCGGGCGGCGTAGCGGGCAATGACGGCGTCGAACCAGCCGCAGC
+GCCGGCGCCGGCCGGTGGTCACACCGAACTCGCGGCCAGTCTTGGACAGGTATTCGCCGTGTTCGTCGAA
+CAGCTCGGTGGGGAACGGGCCGGAGCCCACCCGAGTGGTGTAGGCCTTGAGAATCCCCAGCACGGTGCCG
+ATGCGGGTCGGGCCGATACCAGAGCCCACGGCCGCGCCACCCGCCGTCGGATTCGACGATGTCACATACG
+GGTAGGTGCCGTGGTCGACATCGAGCAGGGTGCCTTGAGAGCCTTCCAGCAGCACCGTTTCGCCGGCCTC
+CAGGGCAGCATTGAGTAGCAGCCGGGTGTCGGCGATGCGATGCTTGAAACCCTCGGCCTGCTCCAGCAGC
+GCGTCGACCACCTGCGCGGGGTCCAGGGCCTTGCGGTTGTAGATCTTGACCAGCACTTGGTTCTTGAACT
+CGCACGCGGCCTCGACCTTGTGGGTCAATTGTTCCGGGTCCAGCACATCGGCGACCCGGATCCCAATACG
+GGCGATCTTGTCCTGGTAGCACGGCCCGATACCACGGCCGGTGGTGCCGATCTTCTTGCTGCCCATATAG
+CGCTCGGTGACCTTGTCGATAGCAATGTGGTAAGGCATCAGCAGATGGGCGTCGGCGGAGATCAACAGCT
+TGGCGGTGTCCACGCCGCGGTCTTGCAGTCCCCGCAGCTCATTGAGCAGGACACCGGGATCGATCACCAC
+GCCGTTGCCGATAACGTTGGTGACCCCGGGCGTCAGCACACCCGACGGGATGAGATGCAATGCGAAATTC
+TCGCCGGTAGGCAAGACGACGGTGTGCCCGGCGTTGTTGCCCCCCTGATAGCGCACCACCCACTGCACGC
+GGCCACCCAACAGGTCGGTGGCCTTACCCTTGCCCTCGTCGCCCCATTGGGCGCCGATGAGGACGATCGC
+CGGCATGAGTTGCTCCCACCTGGTCTCGCAGGCTATGCCCGCTTATTGTGGTCCAGCCGGTGACCTACCC
+TACCCAGCAGGTTGCGAGGAGCTGTCATGTATACGGCCGAGAACGCACCCGGCGTCGCGGTGTTGCTCTC
+CGGTGATGCCGACGTGCCCGGCCCGTTGACCGGCTTGCCTACCCATCAAGACAACCTGGACACCGTCATC
+GGACGGTATTCGCGGCTCATCGTCGTCGGCGCCGACGCGGACCTGGGGGCGGTACTGACTCGGCTGTTGC
+GCACCGACCGGCTCGACGTCGAGGTGGGTTATGTGCCGCGCCGGCGCAGCCCCGCGACCCGGGCCTACCG
+CTTGCCGGCCGGGCGCCGGGCGGCGCGGCGCGCCCGGTGTGGCGTCGCTCGGCGGGTGCCGCTAATCCGT
+GACGAGACCGGGTCGGTAATCGTCGGCCGAGCACAGTGGCTGCCGGCCGAAGAGCAGGCCCTGATCCACG
+GCGAGGCGGTCGTTGACGACACCGTGCTGTTCGATGGCGATGTGGCCGGGGTGTGCATCGAGCCGACGCT
+GACCCTGCCAGGCCTGCGAGCTGCGGTAGACGGCGCCGGAAAGTGGCGGCGGTGGATCGGCGGGCGCGCC
+GCGCAGCTAGGCACCACCGGTGCTGCGGTACTTCGGGACGGTGTCGCGGCGCCCCGCCCGGTGCGCCGAT
+CCACGTTTTACCGCAACGTCGAGGGTTGGCTGCTGGTCCGGTAGTTTTCGACCGGTGAGCGAGACGGGCC
+AGCGCGAGTCGGTGCGACCCAGCCCGATCTTTCTGGGCCTGCTCGGATTGACGGCCGTCGGGGGCGCGCT
+GGCCTGGCTGGCCGGGGAGACGGTGCAGCCGCTGGCCTACGCCGGGGTGTTCGTCATGGTGATCGCCGGC
+TGGCTGGTGTCGCTGTGCCTGCACGAGTTCGGTCACGCGTTCACCGCTTGGCGTTTCGGTGACCACGACG
+TCGCAGTGCGCGGCTACCTGACGCTGGATCCCCGCCGCTACAGCCATCCCATGCTCTCGCTCGGTCTGCC
+GATGCTGTTCATCGCCCTGGGCGGGATCGGTCTGCCGGGTGCCGCGGTGTATGTGCACACCTGGTTCATG
+ACGACGGCGCGCCGCACCCTGGTCAGTTTGGCGGGGCCGACGGTCAACCTGGCGCTGGCCATGTTGCTGC
+TGGCGGCGACCCGGTTGTTGTTCGACCCGATCCACGCGGTGTTATGGGCCGGGGTGGCGTTCCTAGCATT
+CCTTCAGCTCACCGCGCTGGTGTTAAACCTGCTACCCATCCCGGGTCTGGACGGCTATGCGGCCCTGGAG
+CCGCACCTGAGACCCGAGACGCAGCGCGCCCTGGCGCCGGCCAAGCAGTTCGCTTTGGTGTTTCTGCTGG
+TCCTGTTCCTGGCGCCGACGCTGAACGGGTGGTTTTTCGGGGTGGTGTACTGGCTCTTCGACCTGTCTGG
+CGTGTCGCACCGGCTGGCCGCCGCGGGCAGCGTGCTGACCCGTTTCTGGAGTATCTGGTTCTGACCGTTC
+AGAGCCCAAGCGCCGGACGGGCCGCGGGGTCACAGTCGTCAAGCAGATCCAGGCAGCGTCCATACTCGTC
+GGTCTCGCCGATAGCGGCTGCGGCGCGCGCCAGCGCCGCCACACACCGTAGGAAACCCCGGTTGGGCTGG
+TGGGAATACGGCACCGGGCCGAAGCCCTTCCAGCCATGGCGGCGCAGCTGGTCCAGGCCGCGGTGGTACC
+CGGTACGCGCGTATGCGTAGGCCGTGACGGTCTTGTCGTCGGCCAGCGCCCCTTCGGCGAGCACCGCCCA
+GGCGACCGACGCCGACGGATGCGCGGCCGCGACGATGCTCGGACTTTCGTTGGCAAGCAGCTCCGCTTCG
+GCGTCGCTGTCGCCAGGCAACAGGATTGGCTCAGGTCCCAAGAGATCACCCATCGACGTCATGGGAGTTA
+TTGTGCGCTTGGTCACGTCACCTCGACGATGGGGCCAACCGAAGGCTGGGTCGCTAAGCTCCAAAGAGCC
+ACTCGATACCGGGAGGACAGCAGCACCCATGTCCAACGCACCCGAGCCAGACCGCTCAGCCGGTGAATCC
+GGGAGCGAACCGGCCGGCGAGCGGTCCGCCGATCCTGGCGAGGAACGCACCGAAAGCTACCCCCTGGTGC
+CTCACGACGCCGAAACCGAGACCGTGGTGATCACCACCTCCGACAACGATGCCGCGGTTACGCAACCGGA
+AGCGCAGCGCGAACGCCGTTTCACCGCGCCCGGCTTCGACGCCAAGGAGACCCAGGTGATCGTCACGGCC
+CACGAGGCAGCCACCGAGGTTTTCCAAACCAACCAGGCGCCGACCACCCCGCCGCGGATGCCAACCGGAA
+TGCCCCCGAAAACTGCTGTGCCACAATCAATCCCGCCACGGACGGAGGCGACGTCAGTCCGGCAACGCAC
+CTGGGGCTGGGCGCTGGCGGTGGTAGTGATCGTGCTGGCGTTGGCGGCAATCGCGATCCTGGGCACCGTG
+CTGCTGACCCGCGGCAAACATTCGAAGATGTCGCAGGAAGATCAGGTGCGGCAGGCCATCCAGAGCTTGG
+ACATCGCCATCCAGACCGGCGACCTGACCGCGCTGCGTTCCCTGACTTGTGGCTCCACCCGCGATGGCTA
+CGTGGATTATGACGAGCGTGATTGGGCCGAAACCTATCGCCGGGTTTCGGCGGCCAAACAATATCCGGTC
+ATCGCCAGCATCGACCAGGTCGTCGTCAACGGCGCGCACGCCGAGGCCAATGTCACCACTTTCATGGCGT
+TCGATCCCCAGGTCCGCTCGACCCGCAGCCTCGACCTACAGTTTCGCGACGATCAGTGGAAGATCTGCCA
+GTCCTCCAGCAACTGAAGCCAGGATTGGCTGGTTTGCCCGCATTTTGGCCATTGGTCAGTGCTAGGACCG
+GTCCGCATCACCGGCACGTCACCAGGACCGACTAGTCCGAACACCGAAACGAGCAACCGTAGCCGAAATG
+CGGCTGGATCCCGTCTGTGGCAATGTACTGGCGGCCTGTTCCCGCAGAGACGGCGGCATAGCGTCTCGAT
+CGTCAACGAGAGGCAGGTGATCGCCAGGTGAGCATCCGCCCCGCCGAGAACTCAACACTCGACATCCGCC
+ACGTCATCGGTATCGGCACCCCGAAAGCCGTCGATTTGTGGCTCGACGTCGTCACCGAGCTGCCGGATCG
+CGCCCGCGAACTCGGGTCGTTATCCAAAGCCGAACTCGGAAAGCTTGGCCCACTGCTCGACGGCACCAAC
+GCCGTCGAGCTATTCGAGTCGATCGACGACAAGCTGGCCGCAGAGGCACTGCACGCGATGGATCCGTCGC
+TGGCCGCCACCTTCCTCGAGGCCCTCGACTCCGACCACGCCGCCAACATCCTGCGCGAATTCAAGGAGCC
+CAAGCGGGAGGCGCTGCTGACGTTGCTACCGCTGGAGCGGGCGATGGTGCTGCGTGGCTTGTTGAGCTGG
+CCGGAGGACTGCGCCGCGGCCCACATGGTGCCCGAAACGCTGACCGTACGCCCGAACATGACGGTGTCGC
+AGGCCGTCGCCAGCGTGCGGGAACGCGCCTCGGGCCTGCGCAGCGATGCACGAACCACCGCCTACGTCTA
+TGTGACAGACGCCGACTCCCACCTGCTGGGTGTGATCGCCTTTCGCGCCCTGGTGCTGGCCAATCCCGAA
+CAGCGAGTCCGTGAGCTGATGGGTGACGACCTCATCGTCGTGTCGCCGTTGACTGACAAGGAGCTCGCGG
+CGCAGACAATCATGGGCCACAACCTGATGGCGGTTCCCGTCGTCGATGCCGACAACCGGCTACTGGGCAT
+CATCGCCGAAGACGAAGCCATCGACATTGCCGAGGAGGAAGCAACCGAAGACGCCGAGCGCCAGGGTGGG
+TCGGCCCCGCTCGAGGTGCCCTACCTGCGGGCGTCGCCGTGGCTGCTATGGCGCAAGCGGGCCGTCTGGC
+TCCTGGTACTTTTTGCTGCCGAGGCCTACACCGGCAGCGTCCTGCGGGCGTTCTCCGACGAAATGGAGGC
+GGTGATAGCGCTCGCGTTCTTCATCCCACTGCTGATCGGCACCGGCGGCAACACCGGCACCCAGATCGCC
+ACCACTCTGGTCCGCGCGATGGCCACCGGTCAGGTCCGGTTTCGCGATGTGCCTGCGGTGTTAGCCAAGG
+AGCTGTCAACCGGTGTGCTGGTCGGCCTCACTATGGCCGCCGCCGCGGTGGTGCGCGCCTGGACATTGGG
+CGTGGGCCCGCAGGTGACCCTGACGGTCGCGCTGACGGTGGCCGCCATCGTGGTGTGGTCGTCGCTGGTG
+GCTGCCGTCCTTCCGCCGCTGCTGAAGAAGTTGCGCATCGACCCGGCCATCGTTTCGGGGCCGATGATCG
+CCACCATCGTTGACGGCACGGGTCTGCTCATCTACTTCCTGGTCGCGCACCTGACGCTGACCGAGCTGCA
+CGGCTTGTGAGCGGCCCCGGTTTAGTGGGTTAGGGACTTTCCGGCGCAGTGCAGGTCATTGCACGCCTGA
+ACGACCCGCTGGCTCATCGAAGCTTCGGCCTTCTTGAGGTAGCTGCGCGGGTCGTAGACCTTCTTGACAC
+CCACCTCGCCATCGACCTTGAGCACTCCGTCGTAGTTGGTGAACATGTGACCGGCGATCGGGCGGGTGAA
+CGCGTACTGGGTGTCGGTGTCGACGTTCATCTTCACCACGCCGTAGCGCAGCGCCTCCTCGATCTCCGAC
+TTAAGCGAACCCGAGCCGCCGTGGAACACGAAGTCGAACGGCTTGGCGTCGGCCGGCAGTCCGAGCTTGG
+CCGCCGCCACCTGTTGCCCTTGCGCAAGGATGTCGGGGCGAAGCTTGACGTTGCCGGGCTTGTAGACGCC
+ATGCACGTTGCCGAACGTCGCGGCCAGCAGGTATTTGCCGTGCTCACCGGCGCCCAGCGCCTCGATGGTT
+TTCTCGAAGTCCTCCGGGCTGGTGTACAGCTTCTCGTTGATCTCGTTCGCCACGCCGTCCTCTTCGCCGC
+CGACGACGCCGATCTCGATCTCCAGAATGATCTTGGCGGCCGCCGCCGCCTTGAGCAGCTCCTGGGCGAT
+GGCCAGGTTCTCATCGATTGGCACTGCCGAGCCGTCCCACATGTGCGACTGGAACAAAGGATTGCCACCT
+TTGCTCACGCGTTGCGCCGAGATCGCCAGCAAGGGCCGGACATAGCTGTCCAACTTGTCCTTGGGGCAGT
+GGTCGGTGTGCAGCGCCACGTTGACCGGGTACTTGGCCGCGATAACGTGGGTGAACTCCGCCAAGGCGAC
+CGCACCGGTCACCATGTCTTTGACCCCGAGGCCGGAGCCGAATTCTGCGCCACCGGTCGAGAACTGGATG
+ATTCCGTCACTGCCGGCGTCGGCGAAACCTTTGATCGCGGCGTTGACGGTTTCCGAGGAGGTGCAGTTGA
+TAGCCGGGAAAGCGTACGAGTTTTGTTTGGCCTGACCGAGCATCTCCGCGTAGACCTCGGGCGTTGCGAT
+AGGCATGAAACGTTCCTCCTGACGACTCCGATCCACCCAGTATCGCAACACCGCAACCGAGCTTGTCGGC
+CTGTGCGTGATGGCCGGTATGTTGGGACGTCATGAGCACCGCCGTGACGGCCATGCCGGACATCCTCGAC
+CCGATGTACTGGTTGGGCGCCAACGGCGTATTCGGTTCCGCGGTGCTGCCCGGGATTTTGATCATCGTCT
+TCATCGAGACCGGTCTGCTGTTTCCGCTGCTGCCGGGCGAGTCGCTGTTGTTCACCGGCGGGCTGTTGTC
+CGCTAGCCCGGCACCACCGGTCACCATCGGGGTGCTCGCCCCGTGCGTTGCGCTGGTCGCGGTGCTCGGC
+GATCAGACCGCATATTTCATCGGGCGACGGATCGGGCCGGCGCTGTTCAAGAAGGAAGACTCCCGGTTCT
+TCAAGAAACACTATGTGACCGAGTCCCACGCGTTTTTTGAGAAGTACGGGAAATGGACGATAATTCTGGC
+TCGATTCGTGCCGATCGCGCGGACTTTTGTGCCAGTCATTGCCGGGGTGTCCTACATGCGGTATCCGGTG
+TTCCTCGGGTTCGACATCGTCGGCGGAGTCGCCTGGGGTGCGGGTGTGACGTTGGCGGGCTACTTTTTGG
+GCAGTGTCCCGTTCGTGCACATGAACTTTCAGCTCATCATCCTGGCCCTCGTGTTCGTCTCACTGTTGCC
+CGCACTGGTCTCGGCGGCGCGGGTCTACCGGGCGCGGCGTAACGCACCCCAGAGCGACCCCGACCCGTTG
+GTGTTACCCGAGTGAGCTGACCGCTGCGGCGCTGTGGGCGGCTTCCATCAGCATCCAACCCGATAGCTGC
+ACCGACAGATCTCGCTCGGCAATCGCCGAGCTATGCACCGCTCCTCGGACGGACCGCGCCTGCTCACCGC
+CGGCGGTGGGCAACTCGGCTTCGCGATCCCAGAACGCCCCGAACACCGGCAACCCGTCCACGGTTTGCCG
+GTAATCCCACGCCGATTGCGCGCTAGCCAGCACTATCGCGCGGGCGGTGTCGCGGGCGGCGGCGTCGTCG
+GCCGAGTCGCCCGGCAACGTGGTGGCGACCAAGGCGAGGTATCGGGCGGTGATCCCCGCGAACAGGCCAC
+CGTCCCCGCCGCCGGCGCCCCGTAACACACCCAATGGAGCCATGTGCTCGTTGACGGCCGCGACCAAGCG
+ATGAACGCGAGCGCAGTGCCGCGCTCTGGCTGCCGGACCGGTGCGCACCGCCAGCTCGGTTTCCAGCCCG
+AGCACAACCCCTTGGCAGTAGGTGTACTGCGCGCGGACCAACGACCCGGCCTTGATGCCGTCGAATACCA
+GGTGTGTCTCCGGATCGATCAGCGTGCGATCGATCCAGTCGGCCATCTGTTCTGCGCGCTTGAGCCTTTT
+CCCGTACTGGTCTGGGTAGCGGGCCAGGAATAGCCCGGCCGGGCCGTTGGCTGGGGCGTTGAAGAACTGG
+TCCTGCTTGCGCCACGGGATGCCGCCGCCGTCCTCGGGCACCCAGGCTTCGACGAACTGGTTGGTGAGCT
+TGGGCAGTGCGCGCCGGCGTCGTACCCCGGCGACCCGGTCGGCACGTTCCAGCGCTAACGCTAGCCACGC
+CATGTCGTCGTAATAGCTGTTGAGCCACGAGAAATTGTTGCGGACCCGGTGCGAGCGGACCTGGCGGTTG
+ATCCGGGCGCGCCGCTGCGGCTGCGGGTCGCGCAGCTGCGCGTCGACCAGGCAATCCAGCAGGTGTGCCT
+GCCACCAGTAGTGCCAGCTGCCGAACAACCGGTCGCGCCGGGTTGACGGCCAAGCCACCACCGCCAACTG
+GGTGCCCGGCAACGCCCAAAGCCGTCTCAGATGCCGTTGCGTGACGGCGGTTTCGGCGCTGGCTGCCCGG
+TTTGCCAGATTCATAATGCGATCCTGCCCTAGCCTGTCTTACGCCGTCTCAGGCCTGTTACTCCAGCGTG
+ACATCAAGGGTGGCGGCGTCCACGAAGGCCAGCATGCGCGCCCGATGATGCCACCCCCGCTGAACTGAGC
+GACGATCCGCGGGCCCGCGAGCCGGCTGTTGTCATAGACGGTGGCGCCGTCGGCCAGCGTGATGGCCTGG
+GCGACAAGCTCGGCCAGCCGGCGGTGACGCTCGCGGATCTTGGTCTCCGGCACATCGTGGCCGCCCGCGG
+CGACGCGATGCCTGACGCGCTCGACCGCCAGGCCTTCGGGGATAACCAACACGTGCAGTACGACGGTGTA
+GCCGGCCGTGCGCGCGGTGCGGATGAGCTCGAGCTTCGATGGGTGCGAGAACACCGTCTCGGCAATGAAC
+GGCCGGCCCAAGTCGATGAGCCTCGCGCGGGTGTCGGCGGCGACCTGCGCCGCCTGGTAGGCGTGCGATG
+TTGGGTCGTCGGGCCAGCGTTGTTTGGCGATTTCGTCGGCGTTGACGAAGACGATGCCGGGCAGCAAGGG
+CGCCAGCGTGAGGGCGACGAACGTCGACTTGCCGGCGCCGTTGGGCCCGGCGACCAGATCGAGCCGCTTC
+ACGCGTGGCGCGTTGTCTTCGAGCTGGCGATCACGGCGTGGCCGCCAGCACGACCGAGGTGCCGTCTGGC
+CGGTGCTCGACGATGTCGCCCGCGTCGTTCAGGGCGACCGTGGTGATGCCCTGCGCGGCGAGCACGTCGC
+CGTAGTTGGTTCGCGACAGGCGCTCCTCGATAGCTGCGGAGATCTCGGCGTTGAACACCACGCCCTCCTC
+CAGCGTCAGGTCCGTCATCGGCAGATGCCCCGCGAGCGCAGCTTCCACGCGGCGCCGCGACGCCGTGTGC
+TGGTTCGACACCGCCCGACCGACGCGGGCCCAGTGGTCGAGCTGCTGCTTGGCCGAACGGCTCTGACGAG
+CACCCTCGGCCGCCGCGCTGTCCACCAGATCCGCGGCGACGCGCGTGACGCGGTCGACGGCTTTGGGCAC
+GACATCTCTCCTCGGGTGTAGCGATCTGTTACAGCTTATAGCAAAGTGCTACACCGAGCTGTGGTGAGGG
+GCGCACACGGCTAGCGGGCACCGGCCAGCGCCAGCAGCAACTGGTGCAGGCCGGCCAGCGAGTGCGCCGG
+CAGGAACAGGTCGCAATAGGGCAGCGCCGCCGCCATCGAACTGGCACGCGGCTGGAACTCCGGATGTGCC
+GCGCGAGGGTTCAGCCAGACCAGCAACTCGGCGCGGCGACGCACCCTGGTCAGTGCGTGCACCAACACGT
+CGGGCGGATCGCTGTCCCAGCCGTCGGAGGCGATGATCACCACCGCGCCGCGTAACGCGTTGCCATGCGG
+CGGGGCCAGCAGGGCGGCGACACTACGGCCGATGAACGTACCGCCGTAGCGGTCGGTCACCCTAGCGTTG
+GCCCGATGTAGCGCCATCTCGGCCGAGCGATGAGACAGCACCGAGGTAAGTCGAGTCAGCGACGTCGAAA
+ACGCGAAAACCTCCGGGTGGCCCCCTGCCCGGCGCAGCACCGCCGCCCGCATCAGATGCAGATAGATGGC
+GGCGTAGGGCTGCATCGAGCGGCTCACATCGCAGAGCAGGAGCACCCGCCTGGGGCGTCGGCGGGGCCGG
+ATCCGTGCCAACAGCACCGACTCCCAGCCAGTCGACCGCGACGCGTTCATCGTCGCCCGCAGGTCGATGC
+GCTTGCCGTGCGGGCTGGACTCGAATCGCATGCTGCGCCGCCGCGGCCAGCGCGCCATCGTGGCCTCCAG
+CCAGGCGCCGAGCAGACGCAGATCGTCGGGATCGAACTGGTCGAATGGCTCGTCGGCCCGGGCGACAATG
+CGGCTGGGCAGGACATCGGGCAGTGTGCGGCTGGGTCCGCCCTGACCGGCGCTGGCCATCGTCAGCGAGC
+GAGTATCCCAGGGCAGATTCTGGGCTTGGGCGGCACAAGATCGCCGCTTGGCGCGGTGCCCGACGCCGGC
+CACCGGTGTGCGCGGGCCTGCAATGGGCGGTGGTGGGCGGTTGGCACCGTCGGGTTCGGCGCTGCCAAAT
+ACCCCGAACAGCGAAGCGAATACCGCATCGAACGTGGCCAGTTCGTCTACACGGCTGACCAGGGTCAACC
+GCGCGCCCCAATACAGCGCCGCCGGCGTACGCGGCACCAACTGCTGCAACGCCTGCACCAAACTCGCTTG
+ACCGCTGGCGGACACCGGTATCCCGGCGTCGCGAAGGCGCGCTGCCAGCGCTGCCGCGAACGCCGCGAGG
+TCGACGCCCGGCAACAGTGCAGGGGTGGCCATCCCATTCATCGCCGCCGGCGCAGCACCCAGATCAGCAG
+CAGCACGGTCAGCGCCGCCAGCAGCGCCGAACCGTACTTTTTGAGCTGGCCGCCGTCGGCCAGCTGCAGC
+AAGTCGATGGGCGCCGCTTCGGTAGCAGGGGGTGTGCCTTGCGGGCTTTCTGAACTCTGGGCCGCGAGCT
+CGGCTTCTAGCGAATCCACGAACTGGCCCAGCAGCTTCTCCGACACCTGCTGCAGCATGCCACTGCCGAA
+TTGCGCCAGTTTGCCGACAATCTTCAGATCGGTGTCGACGGTGACGCGGGTACGCTCTCCGACCTCGTGC
+AGCTGGGCAGCGACCGTGGCGGCCGCGTTGCCGGTACCGCGCGCCTCCTTGCCTTTGGCGTCGAAAACGG
+CGCGGTGCTGGTTGCGGTCCTGCTCGACAAAGTGCACCTTGCCGCTGAACTCGCTGGTGACCGGCCCAAC
+CTTGACCTTGACCTTACCGAGGTACTCGTCGCCCTCATGGCCGATCAACTGGGCTCCAGGCATCAGCGGA
+ATCATCTGCTCCAGGTCGCATAGCCTGCTCCAGGCCTGCTCGATCGGAGCGCTGACGGTGAACTCGTTGG
+CGATCTTCATCCTGTGCGTCCTCTCATGCGTGGCTGCACTCAGTAAAAGCTTGGTACGCATCGCGAATCT
+GCGTACGGTCGTCGGGCGTTTTGGCCAGGGCCCCAAGGCTGGCCAGAGCGGGACTCGAATCCGCTGCGGT
+GAGGTCTGCGACCCCGAGTGCCACCAAAGCCGCCACCCAGTCGATAGTCTCGGCCACACCGGGTGGCTTG
+TCCAGATCGAGATCCCGTGCAGTGCAAACGAATTGAGTGGCGTTCTCGATCAACGGCGCGGTAGCCCCGG
+GCACCGTGCGGCGCACGATCGCGGCCGCCCGGTCCGGCTCCGGGTAGTCGATCCAGTGGTAGAGGCAGCG
+CCGCCGCAGTGCGTCGTGCAGGTCACGGCTGCGGTTGGACGTGAGCACCGCGATCGGCGGGCACTCCGCG
+AGGAAAGTGCCCAGCTCGGGAACGGTCACCGCGGACTCACCAAGGAACTCCAGCAGTAACGCCTCGAATT
+CGTCGTCGGCCCGGTCGATTTCATCGATGAGCAGCACTGGAGGGGTCGGTCCGCGGTGCCGCACGCACCG
+CAGGATGGGCCGGTCCACCAGATACGCCTCGGTGTACAGATCCGCTTCCGATATGTCTGAGATACCCTTG
+CCGCGCGCCTCGGCCAGCCTGATGGACAATAGCTGGCGTTGGTAGTTCCAGTCGTAGAGCGCCTCGTTGG
+CCGTCAGCCCTTCATAGCATTGCAGCCGGATCAGCGTGGTATCCAACACGACTGCAAGGGTTTTCGCGGC
+TGTTGTCTTGCCAACACCGGGCTCACCCTCCAACAACAGCGGCCTGCCCAGCGTAACCGCCAGATAGATT
+GCCGACGCCGTGCCGGTATCCAGCAGGTAGTTCTGTTCGTCGAACCGGCGGATCACGTCGTCGGGACTTG
+CGAAGGTCACGAGGGCACCGATTCCAGCAGCCGTCGGTAGTCGTCCCAGGTGTCCACGTCAAGCGGCACG
+CAGCCGTCCACGGCGAGTTCGCGCACTGGGTGGCGGCCGGAGTGCACCAGCTTCCAGACACCCTTGTCGC
+CGTGCAGTCGCGCGAGTTCGCCGAACACGGTGCGGCTAAACCAGAATGGATGCCCGACGCCGTCGGCGTA
+GCGGCACACCATGATCTCGGTGGCCGGCCCGACGTCGATGATCCGCCGCAGTGTCGCCGGCGCCACCTGA
+GGCTGGTCGCCCAGCATCAGCACGATCCCGGTGGCCCGCGGATGCACCCGTGCCAACGCGACGCGCAGCG
+ATGCCGCACACCCGCGCTCGACATCCTCGACGACCACCACGTCGGTCCCGTCCAGCGCCATCGCGGCACG
+CACCGCCGACGCCGCACCGCCCAGGGTGAGGATCAGCTGGTCGAATCCGGCTTGCCGGGCAACGTCGAGG
+GTGGCCCCAAGCACCGTGGTATCCCGATATGGCAGTAGCTGTTTGGGCGTGCCCAACCGGTTGGAGCGCC
+CGGCGGCGAGTACCACACCGGTGATCTGGGTCGCGGTCATGCGCCGCCGTTCTCGTCCGCCAACGCCTTC
+CGGCCTCTGGGGCCGCCGCCGCGCAGCGTGGCGATCAGTTCCGCCGCAATCGACACCGCGATCTCCGCCG
+GAGTTTTGGCGCCGATGGCCAATCCGACCGGGGTATGCACCCGGGCCCGCTCGGCATCGGACAGGTCCAG
+CGAATCCAGGATGGACGCGCCGCGTACCGTGCTGGCCACCAGCCCGACATACCCAACGCCGTTATCCAGC
+GCCGTGCGGATGATTTCGGCTTCGGGCCCGCTGTGGCTGGCGATCACAATCGCAGTTGGCAAGGCGTCGG
+TGTCGGCCGGATCGGTGTCGCGGCGCGCGTCGTAGCCCAACAGGCCGCACAGTTCGATCAACGCGTCGGC
+GATCGGGGTTTCGCCGTAAATCTGGATCAGCGGGGCCGGCAGCTGCGGGGTCAGGAAGATCTCCAGGGAT
+CCGCCGGCCAGGCACGGGTTGACCACCACACACGCCCCGGGAGCTTCCGGGAAGTGCACGTCACCGTCGG
+GCAGCACGCGCAGCAGCACGCTCTCGCCGGCCTGCAACACGCCCATCGCCGCCTTGCGGACCGAGTTCTG
+CGCGCAGTGGCCGCCGACAAAGCCCTCGATGGTGCCGTCCGCCAACAGGATTGCCTCATCGCCCGGGCGG
+GCCGACGTGGGCTGCTGGGCCCGCACCACGGTCGCGCGCACGAACGGTGTCCGCGCGGCCACCAGCTGTG
+CGGCCCGGTCACTGATGGACATCGACGCCCTCGAGCTCCCCTAGATCGGTGGTGTGGCCCGGCCCTGCAT
+GGCCTCCCAGACCCGCGACGGCGTCAACGGCATGTCGGCGTGCCGAACCCCGAACGGCGCCAACGCATCC
+ACCACCGCGTTCACCACCGCCGGCGGGGAACCCACCGTGGCCGACTCACCGATGCCCTTGGCGCCGATCG
+GGTGATGCGGCGACGGGGTCACGGTGTGCCCGGTCTCTAGGTGTGGCACCTCGAGCGCGGTCGGGATCAG
+GTAGTCCATCAACGATCCGCCCAGACAGTTGCCGTCCTCGTCGAAGGCAATCATCTCCATCAGCGCCATG
+CCGATGCCGTCGACGATGCCGCCGTGTACCTGACCCTCGATGATCATCGGGTTGATCCGGGTTCCGCAAT
+CATCGACGGCCAAAAAGCGCCGCACCTTCACCACCGCGGTGCCCGGGTCGATGTCGACCACACAGAAGTA
+GGCGCCGTACGGGTAGGTCAGATTCGACGGGTTGTAGCAGACCTCGGCATCCAGCCCGCCCTCGATGCCC
+TCGGGCAGATCGCCGGCGCCGTGCGCGCGCATCGCGATGTCGGCGATGGTCACCGCGGCCGACGGGTCAC
+CCTTGACGTGGAACTTCCCTTTCTCCCACTGTAAGTCGGCGACCGAAACCTCGAGCATGCCCGAGGCGAT
+GATCTTGGCCTTGTCGCGCACCTTGCGGGCGACCAGCGCCGCGGCACCACCTGAGACGGGTGTGGACCGG
+CTGCCGTAGGTGCCCAACCCGAACGGTGTCTGGTCGGTGTCGCCGTGCACCACCTCGATGTCGTCGGGCG
+CAATCCCCAGCTCCTCGGCGACGATCTGCGCGAACGTCGTCTCGTGGCCCTGGCCCTGGGTCTGAACCGA
+AAGCCGCAGCACGGCTTTGCCCGTCGGGTGCACGCGCAGCTCGCAGCCGTCGGCCATGCCCAGGCCGAGG
+ATGTCCATGTCCTTGCGCGGCCCGGCGCCCACGGCCTCGGTGAAAAATGACATCCCGATGCCCATCAGCT
+CGCCGCGCGCTCGCCGCTGCTTTTGTTCGGCGCGTAACGCCTCGTAGCCGATCATGTTCATCGCCTTACG
+CATTGTGGTCTCGTAGTCGCCCGAGTCGTACACCCAACCAGTCTTGCTCTGATACGGAAACTGGTTGGGC
+CGCAATAGATTCCGCAAGCGCAGCTCGGCTGGATCCATCTTCAGCTCGAAGGCCAGGCAGTCCACCAGCC
+GCTCGACGAAGTAGACCGCTTCGGTGATGCGGAACGAACACGCGTAGGCGACCCCGCCGGGCGCCTTGTT
+GGTATACACCGCGGTCATGTGACAGTAGGCGGCCTCGATGTCGTAGCTGCCGGTGAACACCCCGAAGAAC
+CCGGCTGGGTACTTCGCCGGCGCGGCCTGGGCGTTAAACGCACCATGGTCGGCCAGCACATTGGACCGGA
+TCGCCAGGATCTTGCCGTCACGGTTGGCGGCAATCTCGCCGACCATGATGTAGTCGCGGGCGAATCCGGT
+GGACGTCAGGTTCTCGCTGCGGTCCTCCATCCATTTGACCGGCTTGTCCAGCAGCAGCGACGCGACAATG
+GCACAGACATAACCGGGATAGATCGGCACCTTGTTGCCGAAGCCGCCGCCGATGTCGGGCGAGATCACCC
+GAATCTTGTGTTCGGGCAACCCGGCCACCAGCGCGTATAGCGTGCGATGCGCGTGCGGCGCCTGGCTGGT
+GGTCCACAGCGTCAGCTTTCCGGTGACCGGATCTAGATCGGCCACCGCGCCACAGGTTTCCATCGGCGCC
+GGGTGCACCCGCGGGTAGACGATCTCCTGCTGGACAACGACGTCGGCCTTGGCGAACACCGCCTCGGTCG
+CCGCCGCGTCGCCGGTCTCCCAGTCGAAGATGTGATTGTCGCTCTTTCCCTCCAGATCGGTGCGGATGAC
+CGGCGCCGACGGGTCCAGCGCCGTGCGGGCATCCACGACGGGATCCCGCGGTTCGTAGTCGACGTCGACC
+AACTCGCATGCATCGCGGGCCGAATACCGGTCCTCGGCAACCACGGACGCCACCTCTTGGCCCTGGAAGC
+GCGTCTTGTCGGTGGCCAGCACGGCTTGTACGTCGTTGGCTAGTGTCGGCATCCAAGCCAGGCCCTTGGC
+GGCCAGATCGGCGCCGGTCACCACGGCCTTGACTTTCGGATGTGCCTGCGCGGCAGTCACATCGATGCGC
+ACGATGCGGGCATGCGCATACGGCGAACGCAGGATGGCCAGATGCAACATGCCCGGCAGCGCGACGTCGT
+CGACGTAGGTTCCGCGCCCGCGGATGAATCGCGGGTCCTCTTTGCGCATCATCCGGCCGTGCCCGCACGG
+CTGCTGAGCGTTGTCGGCTAGGTCTTCCGGCGACGGAGGGCGTGACTCGATCGTTGTCATGACTGCGCCT
+TTACGGTCTGGTGTGCTGCCGCCCACTGAATGGAGCGCACGATCGTGGTGTATCCGGTGCACCGGCAGAT
+CTGCCCCGAGATCGCTTCCCGGATGGTCTGCTCGTCGGGATCCGGGTTGCGGTCCAGCAGGGCGCGCGCG
+GTAATCAGCATTCCCGGGGTGCAGAAGCCGCATTGCAGCCCGTGGCAGCGCATGAACCCTTCCTGCACCG
+GGTCGAGCTGGCCGTCGGGCCCAGCCAAGCCCTCTACCGTGCGGATGCTGTGCCCGGAGGCCATCACGGC
+GAGCATCGTGCAGGATTTCACCGGCACGCCGTCGACCTCCACCACGCATGTCCCGCAGTTGCTGGTATCA
+CAGCCCCAGTGAGTTCCGGTGAGCCGCAGCTGATCACGGAGAAAATGGACCAGCAGCATCCGGGGTTCGA
+CCTCGGCGGTGACGGGCTCGCCGTTTACCGTCATGTTCACCTGCATGGTTGGTTCCCCTCTCAGGCCTCG
+GGGGCCGCCGGCGCGCCGAGCACGCGCCCGGCGGCGGTGCGCAGCGTGCGAACGGTCAGTTCACCGGCGA
+GGTGCCGCTTGTACTCCGCGGTGCCGCGGACGTCGGTCACCGGCGTGCAAGCTTGCGCGGCGCGCCGGCC
+CGCCTCAGCGAACACCTCTTCGGTAGCGGGTTGGCCGACCAGTCCCGCGGACAGCTCCGCCAGCGCGACC
+GGGTCGGGATTCACCGCGGTCAAACCCACCCGAGCGGCGAGGATCGTCTGGCCGTCGAGCGTGACCGCGG
+CACCGGCCGCGGTGATGGCCCAGTCGCCGACCCGCCGTTCCACCTTGGCGTACGCGCTGGAGGTGTTGTG
+CCGCAGCGGAATCCGCACCTCAATTAGGACCTCGTTGTGGGCGAGCGCGGTTTCGTACGGCCCGACCAGG
+AAGTCGTCGATCGCTATCTCACGTTCACCCGAGGGCCCTTTCGCCAGGCACACCGCATCCAGAACGGTGC
+ACACGGTCGACAGGTCCTCGGCCGGATCCGCCTGGCAGAGCGAACCGCCCAGGGTGCCGCGGTTGCGGAC
+CACCGGGTCGGCGATCACCCGCTCGGCATCGCGGAAGATCGGGCACACCGCCGCCAGCGCATCGGAGTCC
+AGAATCTCTCGATGGCGGGTCATCGCACCCAGCCGAACCAGGTTGGGATTGTTGATTCCGCCGACCACGA
+CGTAGCCGAGTTCGGGGGCCAGGTCGTTGATGTCCACGAGGTACTCGGGGTTGGCGATGCGCAGCTTCAT
+CATCGGCAGCAGGCTGTGCCCGCCGGCGACCACCCGCGCTCCCTCCCCCAACCGATCCAACAATCCGATG
+GCGTGGTCCACGCTGGTGGCACGTTCGTATTCGAAAGGCCCAGGTACTTGCATGCGCCCCAGTGTCGGCC
+GCCCGCGAAAAGGGCGTCAATGTCGAGTTAAGTAATCCTTGAACTCGCCCGCTACCTGCGCATCATGGTG
+GATCCGTCCGGCAATATCGGCCAGCGGGCGTCCCCCTCCGCCCCAACGTCGGGCGATGATGTCGGCCGCG
+ATCGAGACCGCGGTCTCCTCGGGGGTTCGGGCACCGAGATCCAGCCCGATCGGGCTGGACAACCGGCTCA
+GCTCGGCGTCGGTCAGGCCCGCCGCGCGTAGCCGATCCATCCGGTCGTCGTGCGTCTTGCGTGATCCCAT
+CGCCCCCACGTATCCGACACCCAGGCGCAGCGCCACCTCGAGCACCGGGACGTCGAACTTCGGATCGTGG
+GTGAGCACGCAGATCACCGTGCGCTCGTCGATACCACCCGCCTCCGCCTGGGCAGCCAGATAGCGGTGGG
+GCCATGCGACGACGACGTCATCGGCCGTCGGAAAGCGCGCTGGCGTGGCGAATACCGCGCGGGCGTCGCA
+GACGGTGACCCGGTAGCCGAGGAACGAACCCTGCCGCGCCAGCGCGGCGGCGAAGTCGATGGCACCGAAC
+ACCAGCATCCGCGGGCGCGGCGCGTGGCTGGACACGAAGACCTCCATGCCCTCGCCACGCCGCTGCCCAT
+CGGGCCCATATTCGAGGATCTCGCTGCGGCCCACCGCGAGCAGACCCCGCGCATCGTCGATAACCGCCGC
+ATCGGCACGCGCCGAACCCAGCGAACCCGTCACGGGGCTCTTTGTGTCGGGCCGGATCACCAGTCGGCGA
+CCCACCCGCCGCTCGTCCGGATGGGCGATGACGGTCGCGATGGCGACCGGGCGTTGCGCGCCGATGTCGT
+CGGCCAGCTCGCCCAGCTCGGGAAACGTGGCCCGCGATACGGGCTCGACGAAGACGTCGATGATGCCGCC
+ACAGGTCAGGCCTACCGCGAATGCGGTATCGTCGCTGACTCCGTAGTGTTCCAGCCGCGGTATCCCGGTT
+TGGGCCACCTCGGCGGCCAGCTCATATACCGCACCCTCCACGCAGCCGCCCGACACCGACCCACTTACCG
+AACCGTCCGGGGCTACCACCATCGCGGCCCCCGGGGGCCGCGGCGCTGACCGCAAGGTTCGCACCACCGT
+CGCGACCCCCGCGGTGTCACCGGCGGCCCAGATCGCCATCAGCTCGGCAAGCACTTCACGCACGCTTCCC
+AAAGTAGGCTTCAGTGCATGACCCCGGCTCAACTTCGGGCCTATTCGGCGGTGGTTCGCCTGGGCTCGGT
+ACGGGCGGCCGCCGCGGAACTCGGTCTTTCCGACGCCGGAGTCTCCATGCACGTCGCGGCGCTGCGCAAG
+GAACTCGACGACCCGCTGTTTACCAGGACCGGTGCCGGGCTGGCGTTCACGCCCGGCGGGCTGCGGCTGG
+CCAGCCGCGCGGTCGAAATCCTGGGCCTGCAACAACAAACCGCGATCGAGGTCACCGAGGCCGCCCACGG
+GCGTCGGTTGCTGCGCATCGCCGCCTCCAGCGCCTTCGCCGAACACGCCGCGCCGGGCCTGATCGAGCTC
+TTCTCGTCTCGGGCCGACGACCTTTCGGTCGAGTTGAGCGTGCATCCCACCAGCCGGTTCCGCGAACTGA
+TCTGCTCGCGCGCCGTCGACATCGCGATCGGCCCGGCCAGTGAGAGCTCGATCGGTTCCGACGGCTCGAT
+CTTTCTACGGCCCTTCCTGAAGTATCAGATCATCACCGTCGTCGCGCCGAATAGCCCACTGGCCGCAGGC
+ATTCCGATGCCCGCGCTGTTGCGTCACCAGCAATGGATGTTGGGTCCGTCCGCCGGCAGCGTAGATGGTG
+AGATCGCAACCATGTTGCGCGGCTTGGCGATTCCGGAGTCCCAGCAACGGATCTTCCAGAGCGATGCCGC
+CGCGCTGGAGGAGGTCATGCGCGTCGGGGGCGCCACGCTGGCCATTGGCTTTGCGGTCGCCAAGGATCTT
+GCCGCCGGACGGTTGGTGCACGTGACCGGTCCTGGGCTGGATCGCGCCGGCGAGTGGTGTGTGGCGACAT
+TGGCGCCTTCGGCCCGCCAACCCGCCGTCTCCGAGCTTGTTGGCTTCATCAGCACCCCGAGGTGTATTCA
+GGCGATGATCCGGGGCAGCGGGGTCGGGGTGACGCGGTTCCGCCCAAAGGTCCACGTCACCCTGTGGAGC
+TAGCTACTTCGACTTGAAAGGCTCGGCGCGCCGGTCCGCCCGTTGACGGGGCCCGGCTGCGAGGATTAGC
+CAGTTCCCTTGTCGCACAGGAGCGTTGAGGCTATCGCCGTACGCCTACTGCGTGCGATCAGCGCTTGCTC
+GTTCCATACCACAGGGTGCGGCCCAGGTGCAAGGTTCACTGTGCATCGTGCGCTGGAGCCTTTGGTGCCT
+GTTGCCCGTTGAACCGTGATCCAGCGCGGCTGAGGGTGTGGTGGTGTCGGGCCGCTGGGAGGCCGGGAAT
+GCGGACGGTAACGGTGGCTCCGCGGGGTTGATCGGCAGCGGCGGGGCCGGCGGCGACGGCGGTAGCGGCG
+GGGCCACCGGCGCCGGTGGCGAAGGTGGCGATGCTGGAGCAAGCGGGTCCATAAACGGCAACGCCGGCGA
+CCCCGGCAACAGCGGAGAACGCGGCGCAGTGGGCAAGCCCGGCGCACCCGGCTGACCCGAAAATCACCGC
+ATCACCGGGCTCGCTCACAACCGAGAGCGGACGCGGGCTCGGCGGGCTAGACGAATCGACGCGCCAACTT
+TCTCGGATCGAAGAAGCTATACGCTTTACCCCCATGAGTGTGTACAAGGTGATCGACATCATCGGGACCA
+GCCCCACATCCTGGGAACAGGCGGCGGCGGAGGCGGTCCAGCGGGCGCGGGATAGCGTCGATGACATCCG
+CGTCGCTCGGGTCATTGAGCAGGACATGGCCGTGGACAGCGCCGGCAAGATCACCTACCGCATCAAGCTC
+GAAGTGTCGTTCAAGATGAGGCCGGCGCAACCGCGCTAGCACGGGCCGGCGAGCAGACGCAAAATCGCAC
+GGTTTGCGGTTGATTCGTGCGATTTTGTGTCTGCTCGCCGAGGCCTACCAGGCGCGGCCCAGGTCCGCGT
+GCTGCCGTATCCAGGCGTGCATCGCGATTCCGGCGGCCACGCCGGCGTTAATGCTTCGCGTCGACCCGAA
+CTGGGCGATCGACACCGTGACCGCCGCGCCGGCACGGGCGTCGTCGGTAATGCCGGGCCCTTCCTGGCCG
+AATAACAGCAGGCATTCCCGCGGCAACGCGGTCTGCTCCAGGCGCGCCGCACCCGGGACGTTGTCCACCG
+CCACCACGGTCAAGCCGGCGCCCGCCGCGAACTCCAGCAGCCCGGTGGTGCTGTCGTGGTGGCATAACCG
+CTGATAGCGGTCGGTCACCATGGCGCCGCGCCGATTCCACCGCCGACGCCCGACGATGTGCACGGTGTGC
+ACGGCGAATGCATTGGCGGTGCGCACCACCGAGCCGATATTGGCATCGTGTCCGAAGTTCTCGATCGCCA
+CGTGCAAGGGGTGACGGCGCGTATCGATGTCGGCGATGATCGCCTCTCGGGTCCAGTACCGGTAGGCGTC
+GACGACGTTGCGAGCATCGCCGTCGCGCAACAACACCGGGTCGTATCGGGGGTCGTCCGGGAGGTCGCCT
+GCCCAGGGCCCCACGCCGCCGGTCGGCGCGCCCCATTCCGTAGGCCCGGGCCCAAGCGCACTCATCGCGA
+GGTCCACAACGCGGCGTGGGTTCCCACTGTCGCGACCGTCGCGTACAGCAACGCCTCGTTGATCTCGCCC
+TGCGTACACAGCGACGCGCTAATGTGGACCGCGTCCAGTAGCGCGTCAGGAAGGATCAGCACCGAGGATC
+CATACGTCGCGCACGCCGGGCTCAGTCCGCGGCCGGGCAGTGTCGGTGCGGCGAGCAGCATCATGGGACC
+GCCGCGGGCAGCGGAGTCGTCCCGATACCGATCCGGGACGGCGTCGACCTCCAGCCCCAGCAGCATGTAG
+CCATTACCGGTGAACGCCACCGGATCTCCGAGCTGGGGCTTACCCAGCTGCATGCCGTCGGCGCGCCAAG
+CCGAGACGCTGGTGGTCTTGACCACCAGACCGGCGTCGTTTTGATTGGTCGGCAGCATCCCCACCGGAAA
+CGCGGCCGGATAGGCCGCGGCAGTACCCGGGATCCGATCGCGGGGCGAGTACGTGTACACGCCGCGGACG
+GCGCTTCGCTCTTTCAGCGGACCCAGGCAGACCGTGCCGGTGAGCCGGCCGGCAGGCGCCGATAGCGGCG
+ACACGACGTCGCGCACGTGGGCCATCGCGTCGCCGCAGCTGCCGAGCGCAGCGGATTCCATCGGATGGGC
+CAACGCGCCGTACAGCCCGAAGCGAATGTCTTCGGGCTTGGCGTGCGGCGCATGCGGGTCCGTCGGGGAT
+GCATCCACGTCGATGAGCACATAGTCGCCGGACCAGCGCAGATTCGACACCGACATGTTCCAGCCCAGCA
+CCGCCAGCGATTCGCCGGTCCGGGCGCTCTGGGCGCCGTAGGTGCGACCGGAATGACTCGAACCCGAGCA
+GCCCGTCAGACCGGACAGGACGACGGCCCCGCAGGTGGCCCAGGCAACGAGAATGCGCACAGCGATGCCG
+CCGACGCCTAATCCAGCCCCAGATCGGCCAGGCCCAGCACGCTGCGGTAGCGCAGTCCCTCGGCTTCGAT
+AGCCTCTGCGGCCCCGGTGGCGCGATCCACCACGGTAGCCACGCCGACAACCTCACCACCCACGTCTTGG
+ACGGCGTGCACCGCCGTCAGCGCGGAGTTACCGGTGGTACTGGTGTCCTCTACCACCAGCACCCGCTGCC
+CGGTAACCTCCGACCCTTCGATAAGTCGCTGCATGCCATGGGCTTTCGCCGACTTGCGGACCACGAACGC
+GTCGATCGGACGGCCCGGGGCATGCATGATGGCGGTCGCCACGGGATCGGCCCCGAGTGTCAGGCCGCCG
+ACAACCGAATAGTCCCAGTCGGCAGTGAGTTCGCGCATTAGCCGGCCGATCAGCGCGGACGCCCGATGGT
+GCAAGGTGGCGCGACGCAGGTCGACGTAGTAGTCGGCCTCCCGGCCAGACGACAGCGTGACGCGGCCGTG
+CACCACCGACAGCCGGCGCACCAACTCAGCCAACTCTGCGCGGTCAGGTCCGGCCACGGCTTCTCCTCAC
+GCCGCCACGCGGGAGGCCGATCACATGCGGCGTCACCGCGGTGGCCTCGGGCGTGACATCCGCGGTCTCA
+GTGTTGGTAGTTGGTGGCCTGCTGGCCGTTGCGTCCGGCCGGCGGCGGGCGCCGAACGCCTTCGGAGCGG
+CCTTCATCGCGGCGGATCGGCTCGGGGGCCCGACGAGCCGGATCGGGCAGCACCGTGGTTGCCGGATCCG
+GCTGGGCGCGCCGCGGCGGTAACTCCGCGGGGCCGCCCGGGGCCACGGGTCGGCCAGGTGCCGCGCCGCG
+CGGTCCCACCCCGGTTTGTTGGGGCATCTCCTGCGGCAGCGGCGGCAACACGCGCAGCAAGTCGTTGAAT
+TGGCGCACGGTGCGCAGGCCCTCGTCCCACTGGGCACGGGTGCTGGCAATCGGCATGCTGACCAGCGTCC
+AGTTCTGCTCGTTCCACATGATTTCGGCGCAGTCGGGCGCGGTGTGCGCGAAGGTGACCATCCGCCGATC
+GCAGGCGCGCCGGGCCGCGTCTAGATTGGTGGAGTACACCATCCGTGGCCCGATCGCGCCCAGCAGCCAG
+ATGTCGCTTTCTCGTGGCTCTTTCAGGCCTTTGAGCCGCAGGTCGACCACGACATTGGTGCCCACCTTGC
+GATGCAGCGCGATCACGGTGGCGACTTCCTCGAGATCGAAGATGTACACCGCCTCGCCGCGGATCTGACC
+CAGCACCACGTTATGGGCGGCAACATCGCCAACTGTGGACATCACGCCGCGCGTCCAGCGCTTGAGTATC
+TCGGTGGATTCCCGTTCGTAGTCGAACCCGTGCGATCGCGCCCACGACTTGCGGCGTCTGCTGCGCCCGC
+GGCGTCGATCGATGTCGACGTACAGCAACACCACGGCACCGACGAAGCACAGTGCCGAGAGCGTGAACCA
+AAGCGGGACCATCGGTGCTTAGCCTATCCGCTGGCGGCCCGGAACCGAGAATGCGACCAGGTCACAACCC
+AGTCACCTTCCACGCCGAGCAGACGCGGAATCGCACTGCGCGGACCTCACGCGTGCGATTCCGCGTCTGC
+TCGTCAGACAAATCAGCCCAGGATCAGCGAGTCGGCGTCGGGGCTGACGTTGACCGGCACGGTATCGCCG
+TCGTGCACCTGGCCGGCCAACAGCATCTTGGCCAGCTGGTCACCGATGGCCTGCTGCACCAGCCGGCGCA
+ACGGCCGCGCCCCGTACACCGGGTCGAATCCGCGCTGCGCCAACCAGCGCTTGGCCGGCAGCGAGACCTG
+CAGCTGCAGCCGCCGCTGCGCCAGCCGCTTGCCCAGCTGCGCCAGCTGGATGTCGACGATGCGCACCAGC
+TCTTCGGGGTTGAGACCCTCAAAGATGAGCACGTCGTCGAGCCGGTTGATGAACTCCGGCTTGAACGTAG
+CGCGCACCGCGGCCAGCACCTGCTCGGCGCTGCCACCCGACCCCAGGTTGGACGTCAGGATCAAGATGGT
+GTTGCGGAAGTCGACCGTGCGGCCGTGCCCGTCGGTGAGCCGGCCCTCGTCGAGGACCTGCAGCAGCACG
+TCGAACACGTCCGGGTGCGCCTTCTCGATCTCGTCGAACAGCACCACCGTGTAGGGACGCCGGCGCACCG
+CCTCGGTCAGCTGACCGCCCGCCTCGTATCCCACATAGCCGGGCGGGGCGCCGATCAACCGAGCCACGGT
+GTGCTTCTCGCCGTACTCGCTCATGTCGATGCGGACCATCGCCCGCTCGTCGTCGAACAGGAAGTCGGCC
+AGCGCCTTGGCCAGCTCGGTCTTGCCGACACCGGTCGGGCCGAGGAACATGAACGCCCCGGTGGGCCGGT
+TGGGGTCGGACACCCCGGCCCGGCTGCGCCGCACCGCATCAGAGACTGCGGTAACCGCGGCCTTCTGCCC
+GATGACCCGCTTGCCCAGCTCGTCTTCCATGCGCAGCAGCTTGGCGGTCTCGCCTTCCAGCAGCCGACCG
+GCCGGGATGCCGGTCCACGCCGACACCACGTCGGCGATGTCGTCGGGACCGACCTCCTCCTTGAGCATCA
+CCTGCTCCCGGGCCTGCGCCTGCGGCAACGCCGCGTCGAGCTTCTTCTCCACCTCGGGGATGCGTCCGTA
+GCGCAGCTCGGCGGCCTTGGCCAGGTCGCCGTCGCGTTCGGCCCGCTCGGATTCCCCGCGCAGGGCTTCC
+AGCTGCTCCTTGAGGTCGCGGACGATTTCGATCGCGTTCTTCTCGTTCTGCCAGCGGGTGGTGAGCTCGG
+CCAACTTCTCTTTCTGGTCGGCCAGCTCGGAGCGCAGCTTGGCCAACCGCTCCGCCGACGCCTCGTCTTC
+TTCTTTGGACAGCGCCATCTCTTCGATCTCCAGCCGGCGCACCAGCCGCTCGACCTCGTCGATCTCGACG
+GGCCGCGAGTCGATCTCCATCCGCAGCCGGCTGGCCGCCTCGTCGACCAGGTCGATGGCCTTGTCGGGCA
+GGAAGCGGGCGGTGATATACCGGTCGCTCAAAGTGGCAGCTGCCACCAGCGCCGAGTCGGTGATGCGCAC
+CCCGTGGTGCACCTCGTAGCGGTCTTTGAGCCCGCGCAGGATGCCGATGGTGTCCTCCACCGACGGCTCG
+CCGACGTACACCTGTTGGAAACGGCGCTCGAGCGCGGCGTCCTTCTCGATGTGCTTGCGGTATTCGTCCA
+GCGTGGTCGCCCCGACCAGCCGTAACTCGCCGCGGGCCAGCATCGGCTTGATCATGTTGCCGGCGTCCAT
+CGCCCCCTCGCCGGTGGCGCCGGCGCCGACGATGGTGTGCAGCTCGTCGATGAACGTGATGATTTGGCCG
+GCCGAGTTCTTGATGTCGTCGAGGACGGCCTTGAGCCGTTCCTCGAATTCGCCGCGGTATTTGGAGCCGG
+CGACCATCGAGCCGAGATCGAGCGCGACGATGGTCTTGTCGCGCAAGCTCTCCGGCACGTCGCCGGCCAC
+GATGCGCTGCGCCAGGCCCTCCACGATCGCGGTCTTGCCGACGCCGGGCTCACCGATCAGCACCGGGTTG
+TTCTTGGTGCGACGGGACAGCACCTGCACCACGCGGCGGATCTCGTTGTCGCGGCCGATGACCGGGTCGA
+GTTTGCCTTCGCGGGCGCGGGCGGTCAGGTCGGTGGAGTACTTCTGCAGCGCCTGATAGGTCGCCTCCGG
+TTCGGGGCTGGTGACCCGGGCGCTGCCGCGCACCTTGACGAACGCCTCCCGCAGCGCCTGCGGCGAGGCG
+CCGTGGCCGGTCAACAGCTTGGCGACGTCGGAGTCACCGGTGGCCAGCCCGACCATCACGTGCTCGGTGG
+AGACGTACTCGTCGTCCAGCTCGGTGGCCAGCTGCTGCGCGGTGGTGATCGCCGCTAACGACTCGCGGGA
+CAGCTGCGGCTGCGTGCTGGCTCCAGTCGCCTGCGGCAAACGGTCGAGCAGGCGCTGGGTTTCGGCGCGG
+ACGGTGGCGGGCTCGACACCGACAGCCTCCAGTAGCGGTGCGGCGATACCGTCGTTTTGGGTCAGCAGCG
+CCATCAGCAGGTGAGCGGGCCGGATCTCGGGATTGCCGGCGGTCGAAGCCGCCTGTAACGCCGCGGTTAG
+CGCCGCCTGCGTCTTGGTCGTCGGGTTAAACGAGTCCACGACACCTCCATTCGGGGTCCGTTCGAAATGC
+TTGTCGGGTTGTTCAACGCCGTCAATGTTGAGTCTGTTCCGCTCAATTTTACCCACTTGTGCATCCGCCG
+CCGTTTCGCCGCGAGCTTAGAATCGAGGTCCGTGGGCCTCGAGGACCGGGACGCGTTGCGGGTGTTGCAA
+AACGCCTTCAAGCTCGACGACCCGGAACTGGTCCGCCGCTTCTATGCCCATTGGTTTGCCCTCGACGCCT
+CGGTACGCGACCTGTTCCCACCCGACATGGGCGCCCAGCGAGCCGCTTTCGGGCAGGCGCTGCACTGGGT
+GTACGGCGAGCTGGTGGCGCAGCGCGCCGAGGAACCGGTGGCCTTTCTTGCCCAGCTCGGCCGCGACCAC
+CGCAAATACGGTGTGCTGCCAACCCAGTACGACACGTTGCGCCGCGCGCTGTATACGACCCTGCGTGACT
+ATCTGGGCCATCCAAGCCGGGGCGCCTGGACGGACGCCGTCGACGAGGCCGCCGGCCAGTCGCTCAACCT
+GATCATCGGGGTGATGAGCGGTGCCGCGGACGCCGATGACGCGCCCGCCTGGTGGGACGGCACGGTCGTC
+GAGCACATCCGGGTGTCACGCGACCTTGCTGTCGCTCGGCTGCAGCTGGACCGCCCGCTGCACTATTACC
+CTGGCCAATACGTCAACGTGCATGTTCCGCAATGCCCCCGCCGGTGGCGATATCTCAGCCCAGCCATTCC
+GGCCGACCCGAACGGGCGGATCGAGTTTCACGTCCGGGTGGTTCCCGGTGGCCTGGTCAGCAACGCCATC
+GTGGGTGAAACTCGGCCCGGTGACCGGTGGCGATTGTCCGGTCCGCACGGAGCCTTTCGGGTGGACCGCG
+ACGGCGGCGACGTGCTCATGGTCGCCGGTAGCACCGGGCTGGCGCCGCTGCGGGCGCTGATCATCGACCT
+CAGCCGCTTCGCGGTGAATCCGCGCGTGCACCTGTTCTTCGGAGCACGCTATGCCTGCGAACTCTACGAC
+CTGCCCACGCTGTGGCAGATCGCGGCGCACAATCCGTGGCTGTCGGTCTCGCCGGTGTCGGAGTACAACG
+GTGATCCGGCTTGGGCCGCCGACTATCCCGACGTGTCGGCGCCGCGCGGTCTGCACGTGCGCCAGACCGG
+CCGACTACCCGATGTGGTCTCCCGATACGGCGGCTGGGGCGATCGGCAGATTCTGATCTGCGGTGGACCG
+GCCATGGTCCGCGCCACCAAGGCCGCCCTGATCGCCAAAGGCGCGCCACCGGAGCGCATTCAGCACGACC
+CACTGTCGCGCTAGCCGGGCGGAAATCCACCGTCCGGTGGCGTCGCTTCGACATGGCATACGGCCTTTGC
+TACCCGGTCACCGCTGGCTAGCATGAGTGCGACTGAGTGGAGCGGGGATGAGCAAGTTGCTGCCACGGGG
+CACAGTGACATTGCTGTTGGCCGACGTCGAGGGATCCACCTGGCTGTGGGAGACCCATCCAGACGACATG
+GGTGCTGCCGTGGCGCGCCTCGACAAAGCCGTGTCTGGTGTGATTGCCGCCCATGACGGCGTACGCCCAG
+TCGAGCAGGGTGAGGGTGATAGCTTTGTCCTCGCGTTCGCCTGCGCGTCGGATGCCGTGGCCGCCGCGTT
+GGACTTGCAGCGAGCGCGGCTCGCACCGATCCGGTTGCGCATAGGCGTGCACACCGGGGAGGTCGCGCTC
+CGCGACGAAGGCAACTATGCCGGTCCGACCATCAACCGGACCGCGCGCCTGCGTGACTTGGCGCATGGGG
+GCCAGACGGTGCTCTCGGGCGTGACCGAAAGCCTGGTCATCGATCGCCTCCCGGACAAAGCATGGCTGGT
+TGACCTGGGGACGCACGCGCTGCGGGATCTGTCGCGTCCGGAGCGGGTAATGCAGCTGTGTCATCCCGAA
+TTGCGTATCGATTTCCCGCCGCTGCGGGTGGCCAATGACGATGTGGCCCATGGTCTTCCGGTGCACCTGA
+CGCGTTTTGTGGGGCGCGGCGCGCAGATCACCGAGGTGCACCGGTTGGTGACCGATAACCGGTTGGTGAC
+CCTGACCGGCGCCGGCGGCGTGGGCAAGACACGGCTGGCGGCGCAGCTCGCGGCGCAGATCGCCGGTGAG
+TTCGGTCGCGCGTGGTTCGTGGATCTGGCGCCGATCACGGACCCCGACTTGGTGCCGGTCACGGTGGCGG
+GCGCGCTGGGACTGCACGACCAGCCGGGCCGCTCCACGACGGACACCGTGCTGCGCTTTCTTGGCGGGCG
+TCCAGCCCTGGTGGTGCTGGATAACTGCGAGCACCTGCTGGATGCGACGGCGGCCTTGGTGTTAGCGCTG
+GTGAAAGCGTGCCGGGGGGTGAGGTTGCTGGCAACTTGTCGTGAGCCGCTCCGGGTCGAGGGTGAGGTGA
+GCTACCGGGTGCCGTCGCTGTCACTGAGCGATGAAGCCGTTGAGATGTTTTGCTACCGGGCTCAGCGAGT
+CCGGCCGGACTTTCGCCTCACCGACGACAACTCCGCCGCAGTGACCGAGATCTGCAAACGGCTGGACGGT
+TTGCCGCTGGCGATCGAGCTGGCGGCTGCGCGGCTGCGGTCGATGACGCTTGACGAGATCATCGATGGCT
+TGCGTGACCGGTTCGCGCTGTTGACCGGCGGTGCGCGCACGGCCGCGCACCGGCAGCAGACGCTGTGGGC
+CTCGGTGGATTGGTCGTACACGCTATTGACCGAGCCGGAACGTACCTTGTTTCGCCGGCTTGCGGTGTTT
+GTGGGTTGCTTTTTTGTCGACGACGCACAGGCGGTTGCCTGCAGCGGCGATGTGCAGCGCTACCAGGTCC
+TTGACGAGATCACCCTGCTGGTCGACAAGTCACTGGTGATGGCCGACGACAACAGCGGCCGGACGTGCTA
+TCGGTTATGCGAGACGATGCGCCACTACGCGTTGGAAAAACTCTCCGAGGCTGGCGAGGTGGACGCCGTG
+TTTGCGCGGCACCGTGACTACTACACGGCGCTGGCTGCCAGGGTCGACAATCCCGGACCCTCCGATTATT
+CGCACTGCCTCGACCAAGCCGAAACCGAGATCGACAACCTACGTGCCGCCTTTGTGTGGAACCGGGAAAA
+TTCCGACACCGAGGGCGCCTTGGCGCTGGCGTCCTCCCTGTTGCGGGTATGGATGACGCGGGGGCGCATC
+CAGGAGGGGCGCGCCTGGTTTGACAGCATTCTTGCCGACGAGAATGCGCGTCATCTCGAGGTGGCGGCCG
+CGGTGCGCGCCCGGGCATTGGCCGACAAGGCCCTGCTCGACATCTTCGTCGACGCCGCCGCCGGTATGGA
+GCAGGCCCAACAGGCTTTGGTGATCGCGCGCGAGGTCGATGAACCGGCGCTGCTGTCCCGGGCGCTCACG
+GCCTGCGGCTTGATCGCGGTAGCGGTAGCTCGCGCCGATGCGGCCGCGTCTTATTTCGCCGAGGCGATCG
+ACCTGGCACGAGCGGTAGACGACCGGTGGAGGCTGGCCCAGATCCTTACCTTTCAGGCGGTCGATGCGGT
+CGTGGCGGGTGACCCGGTCGCGGCACGCCCGGCCGCCCAAGAGGCACGCGAGCTGGCTGCCGCGATCGGT
+GACCACTCCAATGCGCTGTGGTGCCGCTGGTGTCTCGGCTACGCCCAGCTGATGCGGGGGGAGCTGGCCG
+CGGCCGCCGCCCAATTCGGCGAGGTGGTGGACGAGGCCGAGGCGTCTCAGGAAGTGCTGCACAAGGCCAA
+CAGCCTGCAGGGCCTGGCCTTCGCGCTCGCCTACCAGGGTGAATTGAGTGCGGCTAGGGCGGCGGCCGAC
+GCCGCTCTCGAGGCCGCCGAGCTGGGCGAGTACTTCGCGGGTATGGGCTACTCGGCGTTGACCACGGCCG
+CGTTGGCCGCCGGCGACGTGCAGACGGCTCAACATGCCAGCGAGGCGGCCTGGCGGAACTTGAGTTTGGC
+GCTGCCCCTCTCGGCAGCGGTGCAGCGCGCGTTCAATGCCCAGGCTGCACTGGCTGGTGGTGACCTTAGC
+GCAGCGCGTCGTTGGTGTGACGATGCCGTGCAGTCAATGACCGGCCATCATCTGGCGATGGCGCTGGCGA
+CTCGCGCCAGGATCGCGGTCGCCGAGGGCAAGCGGGAAGAAGCCGAACGCGACGCGCATAAGGCGCTCGC
+GTGCGCGGCCGAGAGCGGGGCACACCTGGATCTCCCCGACGTGCTCGAATGCCTTGCCGGCCTGGCCAGC
+GACGCCGGCACCCACCATGCGGCGGCACGACTCTTCGGCGCCGCCGAGGCTATCCGACAGCAGATCGGCT
+CGGTCCGCTTCGCGATTTACCGCTCGGACTATGTGCAGTCGGTGACGGCTCTGCGAGATGCGATGGGGGA
+GAAAGACTTCGCCGCTGCATGGGCCGAAGGTGCCGCGTTGTCGATCAAGGAGACGATCGCCTATGCGCAA
+CGTGGCCACTCCTGGCGCAAACGACCGGCCACCGGTTGGGAATCGCTTACTCCGACCGAGATTGACGTCG
+TGCGACTGGTTGGCGAGGGACTGGCCAACAAGGACATCGCGACGCGGCTTTTCGTCTCACCGCGAACAGT
+GCAAACGCACCTGACGCACGTCTACACCAAACTCGGCTTCACCTCGCGACTGCAACTCGCTCAAGCGGCC
+GCCCGCCGTACCTGAGTGCTATTGATTGGCGTTCGGGGACGGCGGTACCACGATGATGGTCGCTCCGGGG
+ATCGCCGCCAGGGTCGCCGCAAGGTTGGCAACCACGCCGGGCGGCAAACCGGGCGGTAGGCCAGGTATGG
+CTGACCCGGCGGCCGCCGCGGGGACCGCGGGCGTCTGCTGGGCGGCGGGCCTGGTGGCAGCCGGGCCGGC
+TCCGCCGGCTCCGGCCGGGGCGGCTGCAGCCGGGGTCGGCGCGGAGCCACCGCGGGCGGCAAGACCGGCC
+AGACCGGTGCCGGCCAAACCCGCCGCTGCCAGGCCGGCGTAGGAGCCGTCCGAACTCCCCGTCATATACA
+TCGGAGTCGCGCCGGGGAACATCGCCGCAACTTGGCGCACCGCTGGCGGAAGATTCCAGCTGTGCGGCAC
+GGAGAGTCCGCCGATGTTAGCGGAGTAGCCGGTGAGCGCGGCGACCGGCGGCTGTGGCGGGCTGGTGACC
+CGTCCTCCGACCTCAGGGAGATCCCCGTCACCCGCGGCCCCAGCGGGTGTCTGGTCGGATTCGGCTGGGC
+AATGCGGCGCCTTTTGGGCCTCGTCGACCACGTCGTGGCGGTAGATCTCGCCGAGCTGCGCCGCCGATAC
+CCCCAAACTGCCAGCCGCGACGGCTACAGCTGCGGCTACGAGAACGTCAAGATCCTCGATGGGGTTCGGA
+ATGGCGTCGAAGGGCGGCGGTAGGAAGGACTGCAGGGTTGGTAGCAGGCTCACGTCGGTCGCCGCGGCGG
+CCGGTACTACCGCCTGAGCCGCTGTCGCGGCGGCGTCACTCAGCGACCCGGCCCCGCTGGTGGTCGCCGG
+TGGCGGGGTGAACGGCGGCAACTGCGACGCGGCCGCCGAGGCGCCCGCATAGCCCTCCATCGCCACGATG
+TCCTGGGCCCACATTGCGCCGTACTGCGCTTCACTAGTCGCGATCGCCGGGGTGTTCTGGCCAAAAACAT
+TGGTCTTGACCAGTGACAGCATTGTGCGGCGGTTGGCCGCGATTACCGTCGGGGGCACGGTCGCCGCGTA
+CGCCGACTCGTAGGCGTTCGCCGCGGCCACGGCCTGAGCCGCGGCCTGCTCGGCCGAGGCGGCGGTGGCC
+CTCATCCACGCGACATAGGGGACGGCCGCGGCCGCCATCGACAGTGCCGACGGGCCCAGCCAGTCATCGC
+CGGTGAGCCCGGAAATCACCGAGGAGTAGGAAGCCGCCGTCGCGGTCAGTTCGTTGGCCAGCCGTTGCCA
+GGCTGCGGCCGCTTGCATCAGGGGCCTGGAGCCGGGACCGGAATAGATTCTGGCGGAGTTGATTTCCGGT
+GGTAGCGCACCGAAATCCATGACTAGCCGCTCCTCACACCGGCAGCAGCCTCAGCGCTGCGTGGCTGGGT
+CGTCACGAAAGACACGGATTCTCCTTTGCCGAAGCTGTCCGGTCCGCGCAGGGTTCGTCGCTGCCGCGAG
+CCAGGCGACTGGGCGCATACCTATTCGGGTGGCGGCAACCATGTCGGAGCCGGATGGATGGCTAAGCGGT
+CATCAAGTTCGGATGGCTTGGGTTATCAGGTCACTCAGTTGCCCCCACCTCCTCATAGCAAAAGTACACA
+GGCAGATGTGAGCGGAGTTGCGAAAATAGACAAATAATTGAGCCGAGCAACGACCGAGCGAGAGGGTGAG
+CTGGTGATCGACGGCTGGACGGAAGGACAGCACGAACCCACCGTTAGGCATGAGCGCCCAGCAGCTCCCC
+AAGACGTTCGGCGGGTGATGTTGCTGGGTTCGGCCGAACCCAGCCGGGAGCTGGCGATCGCGTTGCAGGG
+CTTGGGCGCGGAGGTGATCGCCGTCGACGGCTATGTCGGCGCGCCTGCCCACCGGATAGCCGACCAGTCG
+GTGGTGGTCACCATGACCGATGCTGAAGAGCTGACGGCGGTGATCCGGCGGCTGCAACCGGATTTCTTGG
+TGACGGTCACCGCCGCGGTGTCTGTGGATGCTCTCGATGCCGTCGAGCAAGCCGACGGCGAGTGCACTGA
+GCTGGTGCCGAACGCCCGTGCCGTCCGGTGCACGGCCGACCGGGAGGGCCTGCGCCGGCTGGCCGCCGAT
+CAGCTCGGCCTGCCCACAGCCCCGTTCTGGTTCGTCGGATCCCTTGGCGAACTTCAAGCGGTGGCCGTCC
+ATGCTGGGTTTCCGTTGCTGGTGAGCCCGGTGGCAGGGGTGGCTGGCCAGGGTAGCTCGGTGGTCGCCGG
+GCCCAACGAGGTCGAGCCCGCCTGGCAGCGCGCGGCAGGCCATCAAGTACAGCCGCAGACTGGGGGAGTG
+AGCCCTCGGGTGTGCGCCGAGTCGGTGGTCGAGATCGAGTTTTTGGTCACCATGATCGTTGTGTGCAGTC
+AGGGCCCGAACGGGCCGCTCATCGAGTTCTGTGCACCTATCGGTCATCGCGACGCCGATGCCGGTGAGTT
+GGAATCCTGGCAACCGCAGAAGCTGAGCACGGCGGCGCTGGACGCGGCCAAGTCGATCGCCGCGCGCATC
+GTCAAGGCGCTCGGGGGACGCGGGGTTTTCGGCGTCGAATTGATGATCAACGGCGATGAGGTGTATTTCG
+CCGATGTCACCGTGTGTCCTGCCGGGAGTGCCTGGGTCACCGTGCGCAGCCAGCGGCTTTCGGTGTTCGA
+ACTGCAGGCCCGGGCGACCCTGGGTCTGGCGGTGGACACCCTGATGATCTCGCCGGGTGCCGCGCGGGTG
+ATCAACCCGGACCACACGGCAGGCCGGGCAGCGGTCGGCGCCGCACCACCTGCCGATGCGCTGACCGGTG
+CGCTCGGTGTGCCGGAAAGCGACGTCGTGATATTCGGCCGCGGGCTTGGGGTGGCGCTGGCCACCGCACC
+CGAGGTGGCAATCGCCCGCGAACGCGCCCGCGAAGTTGCATCTCGGCTAAATGTGCCAGACTCACGCGAG
+TGAGCTACGCCGGAGATATCACGCCACTTCAGGCCTGGGAGATGCTCAGCGATAATCCGCGGGCGGTCCT
+GGTCGACGTGCGCTGCGAGGCGGAATGGCGCTTCGTCGGTGTGCCCGACTTGTCGAGCCTTGGTCGTGAA
+GTGGTCTATGTCGAATGGGCGACGTCCGACGGGACGCACAACGACAACTTCCTCGCCGAGTTGCGGGACC
+GCATCCCGGCGGACGCTGATCAGCACGAGCGGCCCGTTATTTTCTTGTGTCGCTCCGGTAACCGCTCCAT
+CGGCGCGGCCGAGGTCGCGACCGAGGCGGGCATCACGCCGGCCTATAACGTGCTGGACGGCTTCGAAGGG
+CATCTCGACGCTGAGGGTCATCGAGGCGCAACGGGCTGGCGGGCGGTGGGACTGCCGTGGAGACAGGGAT
+GACCGACGAGTCTTCGGTCCGCACCCCGAAGGCGCTGCCCGACGGCGTCAGCCAGGCCACCGTCGGGGTG
+CGCGGCGGGATGTTGCGGTCGGGGTTCGAAGAGACCGCCGAGGCGATGTACCTGACGTCCGGATATGTCT
+ACGGCTCGGCGGCGGTTGCCGAGAAGTCGTTCGCTGGCGAGCTGGACCACTATGTGTACTCCCGCTACGG
+CAACCCAACGGTGTCGGTGTTCGAGGAGCGGCTGCGGCTGATCGAGGGTGCCCCGGCGGCGTTCGCCACC
+GCCAGTGGCATGGCCGCGGTATTCACCTCGCTGGGCGCGCTGCTGGGTGCCGGAGACCGACTGGTTGCCG
+CGCGCAGCCTGTTTGGCTCGTGTTTCGTGGTGTGCAGCGAGATCCTGCCGCGCTGGGGGGTGCAGACCGT
+CTTCGTCGACGGTGACGACCTCTCGCAATGGGAGCGGGCGCTTTCGGTACCCACGCAGGCCGTGTTCTTC
+GAGACGCCGTCCAATCCCATGCAGTCGCTGGTGGATATCGCTGCGGTGACCGAGCTGGCACATGCCGCGG
+GTGCAAAAGTGGTGCTGGACAACGTATTTGCCACACCGCTACTGCAGCAGGGCTTTCCGCTGGGGGTCGA
+CGTGGTGGTGTACTCGGGCACCAAGCACATCGACGGTCAGGGTCGGGTGCTGGGCGGGGCCATACTCGGT
+GACCGGGAGTACATCGACGGTCCGGTGCAAAAGCTGATGCGCCACACCGGTCCGGCGATGAGTGCGTTCA
+ACGCCTGGGTACTGTTGAAAGGCCTTGAGACGCTGGCTATTCGGGTGCAACACAGCAATGCCTCGGCGCA
+GCGGATCGCGGAGTTCCTCAACGGCCATCCCTCGGTTCGGTGGGTGCGTTACCCGTACCTGCCGTCGCAC
+CCACAATATGACCTGGCCAAGCGTCAGATGTCCGGTGGCGGAACCGTCGTTACCTTCGCACTCGACTGCC
+CGGAGGATGTTGCCAAACAGCGGGCCTTCGAGGTGCTCGACAAGATGCGGCTGATCGACATCTCCAACAA
+CCTCGGCGACGCCAAATCGCTTGTCACCCACCCCGCCACCACGACGCACCGGGCGATGGGCCCGGAGGGC
+CGGGCCGCGATCGGGCTCGGTGACGGTGTGGTCCGCATCTCGGTTGGGTTGGAAGACACCGACGACCTGA
+TTGCCGATATCGATCGGGCGTTGAGCTAACCCGCTGCCTCTTGCTCGGCGTGCTCGGCCTGTTCGGCGGC
+TGCCAGCGCTCCTTGTGCCTGCTGTTCCATCAAGGTCATCACTAACCTGGCGTAGATCATCTGGCTGGTG
+ATGGCCATCTGGCCGCGGGCGCGGCCCATGAAGGAGATCCCCCAGGCGAACAGGGCTGCGATGCGGTTCC
+GATAGCCGACCAGGTAGACCAGGTGCAGCACCAGCCACGCCAGCCAGGCGAAGTACCCGGCAAACTCCAG
+CTTGCCGACCTGCGCGACGGCGCTGTGGCGGGAGATCGTCGCCATGCTGCCCTTGTTGAAGTAATGGAAC
+GGCTTGCGATTGGCTGGGTCGTCATTGCCCTTGACCATGTGTTTGATCACCGTGGTGGCGTATCGGGCCC
+CCTGGATCGCGCCCTGAGCCACCCCGGGTACGCCGGGCACGAACATCAGATCGCCGACTACGAAGACGTT
+CGGATGTCCCTTGACGGTGAGATCGGGTTCCACGATCACCCTTCCGGCCCGGTCGATTTCGGTTCCGTCG
+GATCCCTCGGCGATCATCTTGCCCAGCGGGCTGGCCGCCACGCCGGCCGCCCAAACCTTGCACGCGCATT
+CGATGCGGCGTTCGCCGCCGTCCTTTTCCTTGATGGTGATGCCTTTGTAGTCGACCGCGGTCACCATCGC
+GTTGAGTTGAACCTCGGCGTCCATCTTTTCCAGCCGCCGTTGTGCCTTGAGACCCAGCTTTGGACCCATC
+GGCGGCAACACCGCGGGTGCGGCGTCGAGCAGGATCACCCGGCACTCACTGGGCGTGATGGTCCTAAACG
+CGCCTGCCAGGGTGCGCTCGGCGAGCTCGACGATCTGCCCAGCCACCTCGACGCCGGTCGGCCCAGCGCC
+GACGACGACGAACGTCAGGCGCCGCTCCCGTTCGGCATGGTCGGTGCTGACCTCGGCGGCCTCGAACGCG
+CCCAGGATGCGGCCGCGCAGCTCCAGCGCGTCGTCGATGGTCTTCATTCCGGGCGCGAAGGTGGCGAATT
+CGTCGTTGCCGAAGTAGGACTGCTGTGCGCCGGCGGCCACGATGAGGCTGTCGTACGGCGTCACCGTGGT
+CATGTCCATCAATTTCGACGTGACCGTCTGCGCTTTCAGGTCGATCGCGTTGACCTCGCCCAGCAACACC
+CGGACGTTCTTTTGCCGGCGCAGGATCAGCCGGGTGGTCGGGGCAATGTCGCCCTCGGACAAGATCCCGG
+TGGCCACTTGATACAGCAGCGGCTGGAACAGGTGGGTCGTTGTCTTGGAGATCAGCGTGATGTCGACATC
+CGCCCGTTTAAGCGCCTTGGCCGCATTCAGGCCGCCGAATCCACTACCGATGATGACCACGCGATGGCGC
+CCGCCGACGGCCGAGGGTTCACCAGATGAGAGCGTCATGGTCCTCCTTCAGTCTGGTCGCTGTGGCGCAG
+CTACACAGTACGACTCCCGTCATGCCAACGGCGTAACTTTTTGTGGGCCTTGTGGGCCTTGTGGGCCTTG
+TGGGCCTTTGTCGGGCCGCCTTCGGATCGGACGCTCGGGATGGCTGTTGGGCGCTGCGCAATCCCGCGCT
+TCGATCAGGCAGCGTCCGGCAGTGCCATCAATGGCGGCCAGGTACACCTCTCCGACGGCTCGACATCGCC
+GGCCCGGCAGTTACCTGCACCATGGCCGGGCGATGCGGGAGCGGCTGCCGAAGGTCGGGCAGGTGTTTGC
+TGCCGGGGAAATCGACTACCACATGTTTCAGACGTTGGTGTATCGCACCGATTTGATCACCGACCCGCAG
+GTGTTGGCGCGGGTGGATGCCGAGCTGGCGCTGCGGGTGCGGGGCTGGCCGTCGATGACCCGGGGCAGCT
+GGCCGCCGCGATAGATCGGATCGTGGCGGTGGCCGACCCCGATGCGGTGCGCCAGGTGCGGGAGCGGGCC
+CGCGATCGGGAGGTGTCGATCTGGAATTCCGCGGACGGCATGGGCGAGGTGTACGCCCAGTTGTATGCCA
+CCGACGCCCAAGCCCTGGATGCGCGGCTGAACGCCTTGGTGGCCACGGTGTGTGCCGGTGATCCGCGCAG
+CACAGATCAGCGCCGCGCCGACGCGCTGGGCGCGTTGGCGGCCGGGGCGGATCGGCTGGCCTGCCGCTGC
+GACAATCCCGACTGTGCCGCCGAGGGGCGCCCGGTGTCGGCGGTGGTGATTCATGTGGTGGCCGAGCAGG
+CCAGCGTCAAGGGCCACGGCCAGGCGCCGGCAGCGTTGCTGGGCGGCGACGGGCTGATCCCGGCCGAGCT
+GGTGGCCGAGTTGGCCAAGACCGCCGGGCTGCAGCCGATCCCGGTCCCGGCCGGGACCGAGCCGGGTTAT
+CGGCCCTCGGTGAAGCTGGCGGCGTTTGTGCGGGCCCGGGATCTGACCTGTCGGGCGCCCGGTTGCGACC
+GCCCGGCCACCCAGTGCGACCTGGATCACACCATCGCATTCGCCGACGGTGGGGCCACCCACGCGGCCAA
+CCTCAAATGCCTGTGCCGTCTTCATCATTTGCTGGCCACCTTCTGTGGCTGGCGCGCCCAGCAACTGCCC
+GACGGCACGGTGATTTGGACGCTGCCGGGTAACCAGACCTACGTCACCACCCCGGGCAGCGCGCTGCTGT
+TCCCGGCGCTGTGCACCCCCACCGGTGACCCGCCCGCACCCGAGCCGGCCCGCGCCGACCGCCGCGGGCA
+GCGCACCGCGATGATGCCGCGCCGGGCCAGCACCCGCACCCAAAACCGCGCCCATTGCATCGCCGCCGAA
+CGCCACCGCAACCACCAAGCCCGCCGGATTGCCCAAGCGGCCGTCATCGCCACCGAGACCCACGGCCCAC
+CACCCGATCCCGACGACGACCCGCCGCCTTTTTGATGAAGTGAGTCCGAATCATCTCGACGTGGACGGGT
+GCGGCGTCGGGTGGTCGCCGGTTGGCGCAGACCCTCCAGAGGGGAGGATGAGGAGCTCGGCACCTGCGTC
+GGCGGCCCTGAGATAGGCCAGCAGGCGGTGGCCGAAGTCGCTGACGTCGTGGATAAGGATGTGGCCGCTT
+TCTTCTGCCGGAGTCCCGGTGCCGTTGCCGTGCCAAACGGTTGTTGTCGCGATCGCGACGCCGGTTTGAA
+TGAGGGCCGCTAGCACCGGCACGGGCTCGACCTTACTCGCCGCCCTCATCACCTCGCGTCGCTGGATCTC
+GTCCTGGTCCGGTGAGGACTTGGCGGCTTTGGCCAGCCGAACGAGTGCATGGATATGCACGGGCTCAAGT
+TGGGAAAGCGTGGCCACGATGAGTGATGCCGGCTCGACCTTCTGGTCATCCTCGAGCGCGGCGGCGGCAG
+CTTGCGCGAGGAGCCGGCGCTTGGCCTCCATACTGGTGCGAGTGGCGGCCTCGATCGCCTGGCTGAGAAG
+CGGCTCGAGTTCGGGATTTTTGTCAATGCGGCTCAACACGGTGTCCGCGCCGCCGACGCTCTCGCATATC
+TCGCGCGTGGTTGTCTCGGCGCGGTGCCGGGTGCGTTCCTCGATGGCGTCGAACACGGTTTGTAGCGGGC
+CGCCGACCATCGGGATGGCGGATAGGCCGGCGCTGATCACGACAGCGAAGACAGGTCTGGGCTCAGTCAT
+AGCTCGAACAGTAGAGGCCGTCGCGGCAAGGACGGCCGACGGCGTGTTTTCGGCGTTGCGGGGTGGTCGC
+CGGACACGAGGAGGCAGACCGAGGCTCGATGGATTGGATGCCGCTCGGCGACTACGAGACTTTCCGGCAT
+TGGTCGGGGAAGCCCCGCGCATGGGGGCCGCAAGAGTCGGGGTGGCGCGCGTGGTTCGGCGGGAAGATAG
+TCGATGGGCTCTGCGAGGTACTCGACGAGCACCTCGCGGTGCGGCGTCGTGGTGTTCCAGCCGCGATCGG
+CTGCGTGCCCTGGCTGAGTAGCGAGGCGGTCGCCGAGACGCTGCTCGCATTGAGCGCCTTTTGCGTGGTG
+ATCGACAAGGGAACCTCGTTCCCGTCGCGACTGCGTAACCCTGACAAAGGGTTTCCCAACGTCGCCCTAT
+TGCGGCTTCGCGACATGGCGCCCTCCGAGCATGGCTCACGCTGCTCCTCGGCCCGTGGTCGTCTATGCCT
+GAGCATGAGCTAGGTCCGGTGCGGGCGCTCGGCTGGCTACGAGAGGACCGCAAGCCGCTGCTGAATGCCA
+AATTGCTCGTGCTCGGTCATCTGGCTTTGAACGTCTACGACCCCGATAACGGTTACGGCGAAGAGGTGTT
+GGACTTTGAGCCGCGGACGGTGTGGTGGGGATCGGCCAATTGGACCGTGCGGGCCGGGTCACACTTGGAA
+GTTGGCTTTGCATGCGACGACCCAACCCTCGTCGAAGAAGCTACAGCGTTTGTCGCTGACGTGATCGCGT
+TCTCCGAACCGATCGACACGACCTGTGCCGGTCCCGAACCGAACCTCGTGCAGGTGGAGTTCGACGACGC
+CGCGATGGCTGAGGCGATGGAGGAGATGGCCGAGCCCGATGATGACGGGGAGGATTGGTAGCGATGCTGC
+TTGATGAACCCAAAGGTCGTCACGGGCACGCTCAAAACGTTCTTCGTGTAATCGGTGCCATCATTTGCTG
+GCCACCTTCTGGGGCTGGCGCGCCCAGCAACTGCCCGACGGCACGGTGATTTGGACGCTGCCGGGTGACC
+AGACCTATGTCACCACCCCGGGCAGCGCGCTGCTGTTCCCGGCGCTGTGCACCCCCACCGGTGACCCACC
+TCGACCCGACCCGGCCCGCGCCGACCGCCGCGGGCAGCGCACCGCGATGATGCCGCGCCGGGCCAGCACC
+CGAGCGCAAAACCGCGCCCACTACATCGCCGCCGAACGCCACCGCAACCACCAAGCCCGCCGGATTGCCC
+ACGTGGTCACCCAAACCGCCACAACCGCCCCCGAGACTAACGGCCCACCACCCGATCCCGACGACGACCC
+GCCGCCCTTCTAACCGGTAGGCGCCTGCCCAAAACACGGGTATTGGGTAAAGGCACGGGGTCCTGATGTT
+GTTGTATTTCAATGCGATTCAGCTAAGGCCCGGAGCCCATGGCTCGTCCGGATGGTCGGTTGGGGTGATG
+TGTATGCCCCTCCTGCTCCATCCCGTTTCCTTGTATCCTCAAGTTTGTCGTTTGGCGCTGTTGCGACAGG
+AAGGCGTCGATCATGCACGCACTGAGGTTGGTCGGCTTGGCGATATTGACGGCGATCGCTCCAATCGCGG
+TCCTCATCGGAAGTAGCCCAGCGCATGCCGATACCGATATTGGTCAACCGTGCTCGCCGGAAGGCGCGAA
+ACTCTGGGGGAACCCCGGCCCGATATATTGCGAGCGCACGGCGGACGGGCAACTGCAATGGGTATCAATT
+CCTGCTTGGGCATTGTGTGTGGCGTTCTGCGACCGGCCTGGCGGGCCATAGGGGCCCACCAGCGGACCCC
+CACGGTCCGCCGGCCTGCTAGCCCGGCCATGAGCTCGCGGTGGTTCGGTAGTTCGCGTTGGGCGCACTGC
+AGAAGTCCGAGGCCGTGCCGGCCAGCAAGACGAAATAGCCCTCTTCGCCGCGGCGGGTGTCGGCGAACGG
+CGGGTAGGTCCAACCGTTGTTGCACATCGAAGTCGGCGTGCCCGCCGTGGCCTTGCGCCAACCGGACTTG
+ACGCAGGCCTTGAGGGCGTCGACGTCGGAAACGGTGCTCTTGGCGACGACCAGCATCGCGCCTCCCCATT
+GCCCGTCGGTTCGCCGGTAGGCGCGCGCCCCGAAGCCGGCCCCCGAGCCGGCTGTGTTCTGTTGGCAGCC
+CAACACCCGCTGCAGCGGCAAGAACACCGACGCCACATCGCGGTCCGCGACAGCGGCTGCGGCCGTGATG
+AATTGAGCCGCGTCCGAGCCGTCAACCTCCTGGACGGTGGGATCTCCGAAGCTAAACAGCTGCTGTGAGA
+TCCGCTGTCGCAGCGCGGCGTCACCGTCGCCGATGACCGGTCCGCTGCCGCTGGATGTCATCGGGGGCAG
+CGCGCCGGTGGGTTCCGCGCCCGCGGTGGGCGCGGCGGCCAGCACGGCCAGGGACAAACCGCACGCGGCG
+ACACCGACAACGCGGGCAATGACTCCCATGGCTACCTACCTCCCCGGCGGCATGGGTGGGGCGTCGTTCG
+GTGCTACCTCGGCACCGATCTTGCGAAATAGTATGTCGGCCTGGTTGCGGTAGTTGCCCTGGTCATCGAA
+GGCCTCGGGGGCGTAGGTGACTGCGACCGCCACCGCGACCCGTTGCGACGGCAGATAGGCCTCCACCGCG
+GCGTAACCGGCGAACATGGGATTTTGCAGCAGCCAATGGCCGGATATGACGATCCCGAGACCATAGCTGT
+AGCCGTCGTTCTGCTCGAAGCAGGTGGGGCAGCCCGGCTGGGCGCGGGTCTTGCCGCGCAGCTCGGTCGA
+CACCATCTTCTTGTACGAATCCGCCGAGAGCAGCCTGCCCGACCCGATCCCCACCGCGGTGGCCTCCATG
+TCGTAGATGGTGGTGGTTTGGATGGCGCCGTGGGTGATGGTCCACGACGGATTCCAGAAGGTCGATTCCT
+CGTAAAACGGCACGCCGGCAGGAATTTTCAAGGCCGCTCGGCGCTCGGAGGTGAATGCATGCAAGGCGGG
+CTCGGGGATGGCGGGGGTATCGGAGTTGGCGGTGGCCGTGAGGCCCAGGGGGGAAAGGACCTTGCGCTGC
+AGCAGGGTTGGCATGTCTTGGCCGGCGGCCTTCTCCAACGCCAGCCCCAGCAAGAGGTAATTGGTGTGCG
+CGTAGTTCCAGTTGGTGCCCGGGTCGTAAAGCAGTGGCCGTGAAGAGATTTGATCGAGTAACTCTTGTGT
+TGTCCACTGCCGGAACGGATTAGCGTAAAGCTCGGCATCAAACGCCTCGTTGCCGAGGACGTAGTCGGGG
+TAGCCGGATGTCATCTGCGCTAGTTGACCCAGCGTGACCCGGTCGGCGTGCGGAAAGTCGGGAAGCCACC
+TGGACAGCTTGTCGTCCAGGCGCAGCTTTTTTTCGTCGACCAGTTTGAGCAACAGCGTCGCGACATAGGA
+GATTGCGACCGCGCCGTTGCGAAAGTGCATGGCGGTGGTGGCCGGCACGCCGGTCATCGAGTCGCCGACG
+GCCCGCGTCACGACCTCCTTGCCGGCCACGGTGACCCGGACCAGCACCGCCTTCAGATGCGCTTGCGTCA
+TGAAGTCACGCACAATCCGGATGACCGCGTCGGCCTTGGCCCCGTTGTTGGTCGGCGACGAAGCCGGCCC
+GGTGCGGGGTGGGGCGCAGCCGGCCAGCAGCCCGAGAGCCAGGACCGAACACCCGAGGCGCCGCAAGACG
+GGCATGCGACGGTCCTACCGGAAGGCGGCCAAGCCCGTGAAGGCCTGACCGAGCACCAGCTGATGCATCT
+CGGGCGTGCCCTCGTAGGTGAGCACCGACTCCAGGTTGACCATGTGCCGGATGACCGGGTACTCCAGCGA
+TATCCCGTTGCCGCCCAGTATTGTTCGAGCGGTCCGGCAGATTTTGAGCGCTTCCCGGGTGTTGTTGAGC
+TTGCCGAAGCTGACCTGATCGGGGCGCAGGCCCACCCTGTCTTTGAGGCGCCCCAGATGCAACGACAGCA
+GCTGACCCTTGTGCAGTTCCACGGCCATGTCGACGAGCTTGGCCTGGGTCAGCTGGAAGCCGGCGATCGG
+ACGTCCGAACTGGGTGCGCTGTCTCGCGTAGTCGAGCGCGCACTGCCAGGCCGACCTGGCCGCGCCCATC
+GCTCCCCAGACGATCCCGTAGCGCGCCTCCGACAGGCATGCCAGCGGCGCCCTGAGGCCGGTCGCGCCGG
+GCAGCATGGCGTCGGCGGGCAGCCGGACATTGTCGAGCACCAGCTCGCTGGTGATCGACGCCCGCAGCGA
+CAGCTTGTGACCGATGGTGTTGGCGGTGAAACCCGGGGTGTCGGTGGGCACGATGAATCCGCGGATTCCG
+TCGTCGGTGGCGGCCCACACGATCGCCACGTCGGCGACCGAGCCGTTGGTGATCCACATCTTGCCCCCGG
+TGATCACCCAGTCCGGACCATCGCGTCGCGCCCGGGTTTTCATCGCGGCCGGGTCGGAGCCGACGTCGGG
+CTCGGTGAGCCCGAAGCAGCCGAGCAGGTCACCGGTGGCCATGCCGGGCAGCCACTGCCGCTTTTGCTCG
+TCGGAGCCAAAGCTCGCGATGGCGAACATCGCCAGCGAACCCTGTACCGACACCAGCGACCGGATGCCGG
+AGTCGGCGGCCTCCAGCTCCCGGCAGGCCAGGCCATAGTGCACCGCCGACGCGCCGCCACAGCCGTGGCC
+GTGCAGCTGCATTCCCAGCAGTCCGAGTTCGCCGAACTGTTTGGCCAAATCGCGCGCGACCGGTAGGTCG
+CCGTCCTCGAACCACGCCGCGACGTGCGGGGTGACGTGTTCGGCGCAGAACCGCCTGACGGTGTCGCGGA
+CGGCGATCTCGTCGCTGGATAGCGACGCGTCCAGTCCCAGCGGGTCGTCGCGGTCAAGGGCGGGTGGTGT
+CGGGGTGCTCATCACTCAATACTGCCCCGGCCCGGTAGCCTCGCGGCATGCGACCACGGCGCGCGCTGGC
+GGGGCTGGCCGCCGACGTCGTCGCCGTGCTGGTGTTCTGCGCGGTGGGACGTCGCAGCCACGCCGAAGGA
+CTGAGCGTCACCGGCCTGGCGGCTACGGCATGGCCATTTCTCACCGGCACTGGTATCGGTTGGGTGCTGG
+CTCGCGGCTGGCGGCGGCCGACCGCCCTCGCCCCCACGGGGGTGATCGTGTGGCTGTGCACCATCGTGGT
+CGGCATGGTGTTACGCAAGGTCAGTTCGGCGGGTGTGGCCGCGAGTTTCGTCGTGGTCGCGTCCGCGGTC
+ACCGCGGTGCTGCTGCTGGGTTGGAGAGCCGCCGTTGCGCTGATGGCACCGCACCGCGCGGACGGCTGAG
+AAGGCCAAATGTCGTCGGGGTGTTCGCCGACCCCGGGATTTCCGACGTCCGCCTCCGTGCCCTCGAAGTC
+TCAGTACCGAGCCAGATTTCACGGTCGAGACCCCAACCAACAGGTCAGCGCGGTGCCACCGCGATCGTGA
+TGTTGGCGCAGGTATGGGCCGCGACCTGTCGAGCTACGACCCGGGCCGTGCCGCTACTGCAGCAGCGCTG
+CGCGTTCCGCACTGAGCGCAGTGGTGCGACGAGGCCCGAGCACCTGGGGTTGTCGGGCTAGCCGATCCAC
+CCGACGTGGCCACCAGAACCAGCGGCCGAGCAGAGTTGCCAGCGCAGGCGTCATGTAAGACCGGACAACG
+AGGGTGTCGAACAGCAATCCGATCATGATCGTGGTGCCGATTTGGCCGACGACGCGTAGATCGCTGGCCA
+CCATCGAGCCCATGGTGAAGGCAAACACCAGTCCGGCGATGGTGACCACTCGGCCGGTGCCGGCCATGGC
+TCGGATCATGCCGGTTTTGAGGCCGGCCCCGATTTCTTCTTGGAATCGGGCTATCAAGAGCAGGTTGTAG
+TCGGATCCGACGGCCAACATGACAATGATGGCCATGGGCAGCACGAGCCAGTGCAGTGGCATATGCAGGA
+TGTGCTGCCAGATGAGGACCGACAATCCGAAGGCTGAGCCCAGCGAAAGGGCGACCGTGCCGACGATGAC
+GGCGGATGCGACCACGCTTCTGGTGATGCCGAGCATGATGATGAAGATCAGGCAAAGCGACGCCACGACG
+GCGATCATGACGTCATACAGGGTGCCCTCGTGGATGTCTTTGTAGGTGGATGAGGTGCCCGCCAGATAGA
+TGCTGGCAGCCTGTAGCGGGGTTCCTTTCACGGCTTCGTCGGCGGCCTGCATGATGGGGTCGATGTGTGA
+GATGCCTTCAGCGCTCGCGGGATCACCCCGATGGGTGATGACGAATCGAGCGCAGGTGCCATCGGGGGAT
+AGGAAGAGTTTCAGACCCCGCTGGAAGTCGGGGTTTTGGAAGGCCTCCGGTGGAAGGTAGAACGAGTCGT
+CGTTGTTGGCGGCGTCGAATGTTCGACCCATGACGGTGGCGTTGCGGGTCATGTCTTCCATTTGAGTGAC
+CAGTCCGGAGAACGCGCTGGTCAGTGTTTGGGCAAGGTCTTTGACGGTTTGCATGGTGGCGATCGTGGGG
+TCCAGTTGGGCGAGTAGTTGCCGCTGTGTGGTGTCCATGCGTTCGGTGTCGTCGGTGAGGTTGGCAAGGT
+CCTCGGTGAGCTTGTCGACGTTATCCATGCTGTTCAACAAGGAGCGCATCGACCAGCAGATGGGAATGTC
+GAAGCAGTGGCGCTCCCAGTACGTGAAACTTCTGAGGGGCGCCAGAAGTCGTCGAAATCGGCGATTCGAT
+CGCGTAGTTCGTTGGCGTTGTCTCGCATCTGCCTGGTATGAGCGTTCATATCATGGGTGGCATCGGTTAG
+CTGTCGCGTCAGCTCCTGGGTTCGCTGGGTGATGTCGATCATGCGTTGCAGTTGATCGGTAAGGGTGGAT
+AGATCAGCCACGCGGTCCTTGAGGTTCTGCAGGTTTTCGATGGTCATCGTGCTTTGCATGCCGAGCTGAA
+ACGGGATCGACGAGTGGTCGATCGGAGCCCCCAACGGTCTGGTAATGCTTTGCACCCGCGCGATCCCCGG
+CGTATGGAAGACGGTTTTGGCGATCCTGTCCAGGATGGGCATGTCGGTCGGGTTACGCAGGTCGTGATCG
+GCCTCGACCATCAGGACCTCCGGTTCCATGCGGGCTTGCGGAAAGTGACGGTCTGATGCGAGGTAACCGA
+TGTTGGATGGCGCCGCGCTGGGGATGTAGTAGCGCTCGTTGTAGTTGGTCTGGTATTTCGGCAAGGCGAG
+CAGTCCGATCAGCGCTATCAGCAGGGTGGCGGCCAAGACGGGGCCGGGCCATCGCACGACGACCGTGCCG
+ATCCGGCGCCAACGCCGTTTCGTTGTCGCTCGTTTGGGGTCGAATAGCCCGAATCGGCTGGCAACGGCGA
+TGATCGCGGGCGCCAGCGTCAGAGACGCCAACATCACCGTGACCAAACCGATCGCGCATGGCGATGCGAG
+GGTATTGAAGTAGGGTAGCCGGGTAAAGCCGAGGCAGTACATGGCGCCGGCGACGGTGAGGCCAGATGCC
+AGGACCACGTGTGCCGTCCCACCAAACATGGTGTAGTAAGCGGCTTCTCGGTTCTGGCCAGTCGCACGTG
+CCTCTTGATAGCGTCCGACGAGAAAGATGATGTAGTCCGTCGAAGCCGCGATCGTGAGCGCCACCAACAC
+GTTGACAGTGAATGTAGACAGGCCCATGAGGTCGTTGACGGCAAAAGTGGAGATGATGCCGCGGACCGCC
+AGCAGCTCGAGCCCGACCGTCAGCAGCATGATCAGAGCAGCAGAAAGCGAGCGGTAGGCGATGAACAACA
+TGATCGCGATCACCGCAATGCTGATGCCGGTAATCGTGTGAAGGCTGCGGTCGCCGTATACAACTCGATC
+GGCGCCGAGTGGACCCGGGCCTGTCACGTAAGCCTTGATCCCCGGCGGCGGTGGCACGCTGTCCACGATG
+CGTTGCACGGCGGCGACAGACTCGTTGGCCTGCGAGCCGCCCTGATCACCAGTGAGGTTCAGCTGGACAT
+ATGCTGCCTTGCCGTCAGCGCTCTGCGATCCCGCCGCGGTCAGCGGATCGCCCCAGAAGTTCTCAATGTG
+TTGGACGTGGGTGGTGTCTTGTGACAGCTTGGTCACTAGCACGTCATAGAAGCGGTGCGCCTCATCACCC
+AGCTTCTCTTGGCCCTCCAGCAGCACCATTGCAGTGGTGTCAGAATCGAATTGCTGAAAGTCCTTGCCGA
+TGCGCTTCATGGCGATCAGTGACGGAGCATCGTGGGGGCCTAACGCCACCGAATGTGTCCTAGCGACCGA
+CTGTAGCTGCGGCGCAACGACGTTCACCACAATAGTCAGCGCCACCCAGAACAGAATGATGGGTAGCGAC
+AACGCATGGATCGTCCGGGCGGCGGCCGACAGGTGCCCGGCTAGACGTTGGCTCCTCACGCGGATTTCAC
+CAGGCAACTGGTGTGCGCGTGGTAAGCATTCACAATGCGCTCCTCGCGGATCACCTCGTTGACAGTGATG
+CGACAGCCCAGGCTTGCACCGTCACCGCGGGCAACCACGTTGGCGACTACGGCGGTCAAGGTGGTCACGA
+TGGTAAATGACCACGGGACCGCGGCATTGACGACCTCATGCGGCTGGGCATCGGCATCCAGGTAATTGAT
+GCTGGCGACCGTCCCTGGCGGGCCGAAGACCTCGTAGAGAACATGCTTCGGGTAAAACGCGATGATCGGG
+TCGAGGTTGCCGGTGTCGGGCGCATGTTGATGTGAGCCAAACACCGAGTGCAGCCGCGAGACCGTCACGG
+CCGCGACAGCCACAACGATGACTATCACCATCGGGATCCAGAAGCGTTTGGCAACGCCGAACATTTACCT
+TCCTGATTCCATCGCTTCAACAAGCCGCCGCGTGAGGACGAACCCTACCGGGGAGACGCCACTCGTTGGG
+GCAGTTTTGTACACTCCGTTTACATCGTTTACGGCGAGGTCAAAAAATTTCGGTTAATCGTACAGGCTGC
+CGCTCGGTCATCTATAGTCATCGATCCAGAGCCGCTTCGACCAGCCTGTGGTCGAAGCGGATCAGTTGAA
+CCGGAGGAGTGGAAACATGAGCGGCCCGACGGGAAATTCGATGCCCAGACAGCTCGGCGGCCGGGTGGCC
+AGGATCGTTACCGGGTAAGGGATCGCCACTCCCAATGTCTGTTATATCCACGTTGCGCGACCGTGCGACC
+ACGACTCCAAGCGACGAAGCCTTTGTGTTCATGGATTACGACACAAAAACCGGCGACCAAATTGACCGAA
+TGACGTGGAGTCAATTATATTCTCGCGTCACCGCCGTGTCTGCGTATCTAATAAGTTATGGCCGGCATGC
+TGACCGACGAAGGACCGCAGCGATATCAGCTCCGCAAGGTCTGGACTATGTTGCAGGATTTCTAGGAGCA
+CTGTGCGCCGGATGGGCGCCGGTTCCGTTACCAGAACCGCTGGGCAGCCTACGCGATAAGCGGACTGGAC
+TGGCTGTACTCGACTGTGCCGCCGACGTCGTGCTGACGACGTCGCAAGCCGAAACGCGGGTCAGGGCCAC
+GATAGCTACACATGGGGCGTCTGTAACTACGCCGGTCATAGCGTTGGATACATTGGACGAGCCATCCGGA
+GATAACTGTGATCTCGATTCTCAACTATCAGACTGGAGTTCGTATTTGCAGTATACTTCGGGTTCAACGG
+CCAACCCCCGTGGTGTGGTTTTATCCATGCGTAACGTTACGGAAAATGTCGACCAAATTATCCGTAACTA
+TTTTCGCCATGAGGGCGGCGCGCCGAGGTTGCCCAGCTCGGTCGTTTCGTGGTTGCCGCTTTACCATGAC
+ATGGGTTTAATGGTTGGCCTCTTTATTCCGTTGTTTGTCGGATGTCCGGTTATCCTGACGAGCCCAGAGG
+CATTTATCCGTAAGCCTGCCAGATGGATGCAACTGCTTGCTAAACACCAGGCGCCATTTTCGGCCGCGCC
+GAACTTCGCATTCGATTTGGCCGTCGCTAAAACTTCCGAAGAGGACATGGCGGGGCTGGATTTAGGCCAC
+GTAAATACAATAATCAACGGCGCGGAGCAGGTACAGCCAAATACAATAACCAAATTCCTCCGCCGGTTCC
+GTCCCTACAATTTGATGCCCGCAGCGGTCAAGCCATCATACGGGATGGCTGAAGCGGTGGTTTACCTGGC
+GACGACGAAGGCGGGATCACCTCCAACGTCAACCGAGTTCGATGCTGATAGCTTGGCTCGAGGCCACGCG
+GAGCTAAGTACTTTCGAAACTGAGCGTGCAACGCGTTTAATACGCTACCACAGCGACGACAAGGAACCGT
+TGCTTCGGATTGTCGATCCGGACTCGAATATCGAGCTCGGACCGGGACGTATCGGCGAGATTTGGATTCA
+CGGTAAGAATGTGTCTACCGGATATCACAATGCAGACGACGCGCTCAATCGAGATAAGTTCCAGGCCAGC
+ATCCGGGAGGCCTCTGCGGGAACGCCAAGGTCGCCGTGGCTTCGCACGGGAGACTTGGGATTCATAGTAG
+GAGATGAGTTCTACATCGTCGGCCGTATGAAAGATCTCATTATCCAAGACGGTGTAAACCATTATCCCGA
+TGATATCGAAACTACGGTCAAGGAGTTTACCGGTGGCCGGGTCGCGGCATTTTCAGTATCCGACGACGGG
+GTGGAGCATTTGGTCATTGCGGCCGAGGTAAGGACTGAGCATGGGCCCGATAAAGTGACTATTATGGATT
+TCTCGACGATCAAAAGGCTGGTCGTATCGGCGTTGTCGAAATTACATGGCCTGCATGTAACAGATTTTCT
+TCTGGTACCGCCCGGGGCGCTACCGAAGACCACCAGCGGAAAGATTAGCCGGGCGGCATGCGCAAAGCAG
+TACGGAGCAAATAAGTTGCAACGAGTAGCAACGTTCCCATGACAGACGGTTCGGTCACTGCGGATAAGCT
+TCAAAAATGGTTTCGAGAGTACTTGTCCACGCATATCGAGTGTCATCCAAATGAGGTCAGCCTAGACGTT
+CCGATTAGAGATTTAGGTTTGAAATCGATTGATGTCTTAGCGATTCCCGGCGACCTCGGTGACAGATTTG
+GGTTTTGTATTCCCGATTTGGCCGTTTGGGATAATCCTAGCGCTAATGATTTGATTGATAGTCTGTTGAA
+CCAGCGTAGTGCTGACTCGTTAAGAGAGAGTCATGGACACGCCGACAGGAACACGCAGGGTCGGGGCAGC
+ATAAACGAGCCGGTTGCGGTCATCGGAGTGGGCTGTCGATTTCCGGGAGATATTGACGGCCCGGAACGGC
+TATGGGACTTTCTGACCGAGAAGAAGTGTGCGATAACAGCGTATCCAGATCGTGGGTTCACGAATGCTGG
+AACTTTCGCGGAGTCCGGAGGCTTTTTAAAGGATGTCGCGGGTTTCGATAATAGATTTTTTGATATCCCG
+CCGGACGAGGCTCTGCGAATGGATCCGCAACAACGGTTGTTACTGGAGGTCTCTTGGGAAGCGTTAGAGC
+ATGCAGGAATTATTCCTGAGTCATTAAGACTTTCACGTACGGGCGTATTCGTTGGGGTGTCGTCAACTGA
+CTACGTCCGGCTTGTGTCAGCTAGCGCTCAGCAAAAGTCTACTATTTGGGATAACACCGGCGGTTCTTCG
+AGTATTATTGCCAATAGAATCTCATACTTTCTCGATATTCAGGGTCCGTCCATTGTCATTGACACGGCAT
+GCTCGTCATCCCTGGTCGCCGTGCATCTAGCCTGTCGAAGTCTCAGTACCTGGGACTGCGATATCGCACT
+TGTCGGTGGGACGAATGTTCTTATTTCACCAGAACCATGGGGTGGGTTTAGGGAAGCGGGCATCTTGTCG
+CAGACAGGCTGCTGTCACGCGTTCGATAAATCCGCCGACGGGATGGTACGCGGTGAGGGATGCGGAGTTA
+TCGTGCTGCAGCGCCTCAGTGATGCACGCCTTGAGGGCCGGCGGATATTAGCGATTCTGACGGGTTCAGC
+GGTCAATCAGGACGGTAAGTCCAACGGTATTATGGCGCCAAATCCTAGTGCGCAAATTGGTGTTCTTGAA
+AATGCATGCAAGAGCGCTCGCGTCGATCCGCTGGAAATCGGCTACGTCGAGGCCCACGGGACCGGAACGT
+CGTTAGGGGATAGGATCGAGGCGCACGCCTTAGGCATGGTCTTTGGTCGCAAGAGACCGGGATCTGGGCC
+CCTGATGATCGGGAGCATCAAGCCGAATATCGGCCATCTGGAAGGTGCGGCTGGCATCGCCGGATTGATC
+AAGGCGGGTGTTGATGGTTGAGCGTGGCTCGCTGCTTCCGAGCGGGGGGTTTACGGAGCCAAATCCAGCT
+ATCCCATTCACGGAATTGGGCCTGAGAGTTGTAGACGAACTTCAGGAGTGGCCGGTGGTGGCGGGTCGGC
+CGCGCCGGGCTGGGGTGTCATCGTTCGGCTTTGGCGGCACCAATGCGCATGTGATTGTCGAGGAAGCTGG
+TTCGGTTGGGGCGGACACGGTTTCGGGCCGCGCGGATGTTGGCGGTTCCGGTGGTGGGGTGGTGGCGTGG
+GTGATTTCGGGGAAGACGGCTTCGGCGTTGGCTGCTCAGGCGGGTCGGTTGGGGCGGTATGTGCGGGCTC
+GGCCGGCGCTTGATGTTGTTGATGTGGGGTATTCGTTGGTGAGCACGCGGTCGGTGTTTGATCATCGGGC
+GGTGGTGGTCGGCCAGACTCGCGATGAGTTGCTGGCTGGGTTGGCTGGGGTGGTTGCTGGTCGGCCGGAG
+GCTGGGGTGGTCTGCGGTGTTGGCAAGCCGGCGGGCAAGACGGCTTTTGTGTTTGCCGGTCAGGGCTCGC
+AGTGGCTGGGTATGGGTAGCGAGCTTTATGCTGCCTACCCGGTTTTCGCCGAGGCCCTCGATGCTGTGGT
+GGACGAGTTGGACCGGCACCTGCGGTATCCGCTGCGCGATGTGATCTGGGGGCACGACCAAGATCTGTTG
+AATACCACCGAATTCGCCCAGCCGGCGCTGTTTGCGGTGGAGGTGGCGCTGTATCGGCTGCTCATGTCGT
+GGGGGGTGCGGCCGGGGTTGGTGCTGGGTCATTCGGTGGGCGAGTTGGCCGCGGCGCACGTCGCCGGGGC
+GCTGTGTTTGCCGGATGCGGCGATGCTGGTGGCCGCGCGTGGACGGTTGATGCAGGCGTTGCCCGCCGGC
+GGCGCCATGTTTGCGGTGCAGGCCCGTGAAGACGAGGTAGCGCCGATGCTGGGGCACGATGTGAGCATCG
+CGGCGGTCAATGGTCCGGCTTCGGTGGTGATCTCTGGTGCCCACGATGCGGTGAGCGCGATCGCTGATCG
+GCTGCGCGGCCAGGGCCGTCGGGTCCACCGGTTGGCGGTCTCGCATGCCTTTCACTCGGCGTTGATGGAG
+CCGATGATCGCTGAGTTCACAGCCGTTGCGGCCGAACTGTCTGTGGGCTTGCCCACGATCCCGGTCATTT
+CCAATGTGACCGGGCAGTTGGTGGCCGACGACTTCGCCTCAGCTGATTACTGGGCCCGGCATATCCGGGC
+GGTGGTGCGGTTTGGCGACAGTGTTCGTAGTGCCCACTGCGCCGGTGCCAGTCGTTTCATCGAAGTCGGG
+CCCGGTGGCGGCTTGACGTCGTTGATCGAGGCATCGCTGGCCGACGCGCAGATCGTGTCGGTGCCCACGC
+TGCGCAAAGATCGGCCCGAACCGGTCAGTGTGATGACGGCGGCGGCCCAGGGCTTCGTCTCGGGGATGGG
+CCTGGATTGGGCCTCGGTGTTTTCCGGGTACCGGCCCAAGCGGGTGGAGTTGCCGACGTATGCCTTCCAG
+CATCAAAAGTTCTGGCTCGCACCAGCCCCATCGGTCAGCGACCCCACCGCCGCCGGCCAGATCGGGGCTA
+GCGATGGTGGTGCTGAACTCTTGGCGTCCTCCGGGTTTGCCGCCCGGCTGGCCGGTCGGTCGGCCGACGA
+GCAACTCGCCGCAGCGATCGAGGTGGTATGTGAGCATGCCGCAGCGGTGCTGGGGCGCGACGGCGCTGCC
+GGACTCGACGCTGGCCAGGCGTTTGCCGATTCGGGATTTAATTCCTTGAGTGCCGTGGAGCTACGTAACC
+GCTTAACAGCCGTCACCGCAGTAACGCTGCCGGCCACCGCGATCTTCGATCACCCCACCCCGACCGAACT
+AGCCCAGTATCTGATCACTCAAATAGACGGTCACGGCAGCTCCGCCGCCGCAGCGGCAAACCCGGCGGAG
+CGAATCGATGCGCTCACCGATCTTTTTCTACAAGCTTGCGATGCGGGTCGGGATGCCGATGGTTGGAAGA
+TGGTCGCCCTGGCGTCGAATACGCGCGAGCGCATGAGCTCACCGGTTCGGAACAACGTATCGAAGAACGT
+CGCACTGCTGGCAGATGGTATCTCCGATGTGGTTGTAATTTGTATCCCAACTCTAACTGTGCTATCGGAT
+CAGCGTGAATATCGAGATATTGCGAATGCGATGACAGGCCGCCATTCGGTTTATTCGCTTACGCTTCCCG
+GGTTCGATTCGTCTGATGCACTGCCGCAAAACGCGGATATGATTGTTGAAACCGTATCTAACGCAATTAT
+TGATGTGGTAGGCGGCAGCTGCCGTTTTGTGCTGTCGGGCTATTCATCGGGTGGGGTGTTGGCCTATGCC
+CTCTGCTCCCATCTGTCGGTCAAGCACCAGCGGAATCCCCTCGGAGTCGCACTCATCGATACATATCTGC
+CTAGTCAGATCGCCAATCCTTCAATGAATGAAGGGTTCAGCCCCAACGATACTGGGAAGGGCCTTTCCCG
+TGAAGTAATTCGAGTGGCCAGAATGTTGAATCGGTTAACTGCCACCCGACTCACCGCGGCAGCCACCTAT
+GCTGCAATCTTTCAGGCCTGGGAACCAGGTAGATCAATGGCTCCGGTTCTTAACATCGTGGCGAAGGACC
+GAATAGCTACCGTCGAAAATTTACGCGAAGAACGAATCAACCGGTGGCGAACTGCTGCTGCAGAGGCGGC
+CTATTCTGTAGCCGAAGTACCCGGGGATCATTTCGGAGTGATGAGCACCTCGAGTGAGGCAATAGCTACC
+GAAATACATGATTGGATTTCTGGGCTCGTTCGAGGGCCTCATCCGTAGCTTTGCGAATCGGCCCGTGCCA
+CAGCTCGCCGTGACCAGGTGCCAGGATGTTGGTCTCTAGCAAAGCCAGCGCAGCCAGGCTGCGGATACTG
+TTCTGCTGGCTGTGGCTGAACACCGCGGGCAGTAGCTGTGGCCCGCGGTGACGCAACATCGGATGACCAG
+TGATCAGCGCATCGCCGCTGGCCAGCACACCGTCGACGACATACGAGCAGTGACCGCTGGTGTGTCCCGG
+GGTGAAAATCGCCATCGGTTGACCCGGCAGCCCGGCGGCCGCTTCGGCGGTCAGCGGCTGGGCGGTCGGA
+ATGCCGTCGCCGGTCAGGCCGCCGCGGCGAAGCAAGTGAATACCCCAGACCGCCACACGGGGCCGCCAGC
+TGCGCAGCGCAACATCGAAAACCGAGGCATTCTCCCGGTATTCCCGCTTGGCGTGACCTACCTCCTCGGC
+GTGGCAGTACACCGGCGTGCTGTGCTCACGAGCAAACCAGATTGCCGAGCCCAGGTGGTCGATGTGCGCG
+TGGGTGAGCACGATGGCGCGCACGTCACCCGGTGTGTAGCCCAGTTTGTTCAGCGAGGCCAGCACCTCCG
+CACGGTCGCCGGGATAGCCGGCGTCGATCAGCAGCACGCCGGTGTCGTCGGTGACTAGCACCCAGTTGAC
+CGCGTGGCCGCGAGCGAGGTGAACCTTGTCGGTGATCTGAACAAGCTCCGCCATGCCCGCGAGTCTAGGA
+GCGAGCGCGAGCGCGGCAAGCCGGGTGCCGCGGGTCGCGACCATGGGATATGGAGCGATCGCGAGCGCGG
+CGAAGCCGGGCGTGGCGGGTCGCGTTTATGGCATAGGAGTAGAAAGAACTGGTGGCTGAACTGAAGCTAG
+GTTACAAAGCATCGGCCGAACAATTCGCACCGCGCGAGCTCGTCGAACTAGCCGTCGCCGCCGAAGCCCA
+CGGCATGGACAGCGCGACCGTCAGCGACCATTTTCAGCCTTGGCGCCACCAGGGCGGCCATGCCCCGTTC
+TCGCTGTCCTGGATGACCGCTGTCGGCGAACGTACCAACCGGCTGCTGCTGGGCACTTCGGTGCTGACCC
+CCACCTTCCGCTACAACCCCGCCGTCATCGCTCAGGCTTTCGCCACCATGGGATGCCTGTACCCGAACCG
+TGTTTTCCTTGGCGTGGGCACCGGTGAGGCGCTGAACGAAATCGCCACCGGATACGAGGGCGCCTGGCCG
+GAGTTCAAGGAGCGGTTCGCCCGGCTGCGTGAATCGGTGGGGCTAATGCGGCAGCTGTGGAGCGGTGACC
+GCGTCGACTTTGACGGCGACTATTACCGGCTCAAGGGTGCCTCGATCTACGACGTGCCCGACGGGGGCGT
+GCCCGTCTACATCGCCGCCGGCGGCCCGGCGGTGGCCAAGTACGCCGGCCGCGCCGGTGACGGCTTCATC
+TGTACGTCCGGCAAGGGCGAGGAGCTCTACACCGAGAAGCTGATGCCGGCGGTACGAGAAGGCGCCGCTG
+CCGCTGACCGATCCGTCGACGGCATCGACAAGATGATCGAAATCAAGATCTCCTACGACCCCGACCCGGA
+GCTGGCATTGAACAACACCCGGTTTTGGGCGCCGCTGTCGTTGACAGCTGAGCAGAAGCACAGCATCGAC
+GACCCGATCGAGATGGAGAAGGCCGCCGATGCGCTGCCAATCGAACAGATCGCCAAGCGCTGGATCGTGG
+CGTCGGACCCCGACGAAGCCGTCGAAAAGGTAGGTCAATACGTGACATGGGGCCTGAACCACCTGGTATT
+TCACGCACCAGGACATGACCAGCGCCGGTTCCTGGAGCTCTTCCAGTCGGACCTGGCACCCAGGTTGCGG
+CGACTTGGCTGACTCCTCGGCGATCTACCTCGCCGCACCAGAATCGCAGACGGGTAAGTCGACGATTGCA
+CTGGGGCTTTTGCACCGACTGACCGCGATGGTCGCCAAAGTCGGTGTGTTCCGGCCGATTACGCGGCTCT
+CTGCGGAGCGGGACTACATCCTGGAACTACTGCTCGCGCACACCAGTGCGGGCCTGCCCTATGAGCGGTG
+TGTTGGCGTGACCTACCAGCAGCTGCATGCTGACCGCGACGACGCGATCGCCGAAATTGTCGATTCGTAT
+CACGCAATGGCCGACGAGTGTGACGCGGTGGTGGTCGTCGGCAGTGACTACACCGACGTCACCAGCCCCA
+CCGAGCTCTCGGTCAACGCCCGGATCGCGGTGAACCTCGGCGCGCCAGTGTTGTTGACGGTTCGGGCGAA
+GGACCGCACCCCCGATCAGGTCGCCAGCGTCGTCGAGGTCTGCTTGGCCGAGCTGGACACCCAGCGCGCT
+CATACCGCGGCGGTAGTGGCGAACCGGTGCGAGCTGTCCGCGATACCGGCCGTGACCGACGCGCTGCGCA
+GGTTCACCCCGCCTAGCTATGTAGTGCCCGAGGAACCACTGCTGTCGGCGCCGACCGTTGCCGAGTTAAC
+GCAGGCTGTGAACGGGGCGGTGGTAAGCGGTGATGTTGCGCTGCGCGAACGTGAGGTGATGGGCGTGCTG
+GCCGCGGGTATGACCGCCGACCATGTGTTGGAGCGGCTGACCGATGGCATGGCGGTGATTACTCCCGGCG
+ACCGCTCGGACGTGGTGTTGGCCGTCGCTAGCGCCCATGCGGCCGAAGGGTTTCCGTCATTGTCATGCAT
+CGTCCTCAATGGCGGGTTCCAGTTGCATCCGGCGATCGCCGCCCTGGTTTCCGGCCTGCGATTGCGGTTA
+CCTGTCATCGCCACCGCGTTGGGCACCTACGACACCGCCAGCGCTGCCGCGTCGGCCCGCGGGCTGGTAA
+CGGCGACGTCGCAACGCAAGATCGACACCGCGTTGGAGCTGATGGACCGCCACGTGGACGTCGCCGGTCT
+ATTGGCGCAGCTGACCATTCCCATCCCTACGGTCACTACACCACAGATGTTCACTTATCGGCTGCTGCAG
+CAGGCCCGTTCGGACCTCATGCGCATCGTCCTTCCCGAAGGGGACGACGATCGCATCCTCAAATCGGCGG
+GCCGCCTGCTTCAGCGCGGCATCGTCGACCTGACCATCCTGGGCGATGAAGCCAAAGTCCGTCTGCGGGC
+AGCGGAACTCGGTGTGGACCTGGACGGCGCCACGGTAATCGAGCCATGCGCAAGCGAACTGCACGATCAA
+TTCGCCGACCAGTATGCGCAGTTGCGTAAGGCGAAGGGAATCACCGTGGAGCATGCCCGCGAAATCATGA
+ACGATGCCACATATTTCGGCACCATGCTGGTGCACAACTGTCATGCCGACGGCATGGTATCGGGTGCTGC
+TCACACCACGGCGCACACCGTTCGTCCGGCGCTGGAGATCATCAAGACCGTTCCGGGCATATCCACCGTG
+TCCAGCATTTTCCTGATGTGTCTGCCGGATCGGGTACTGGCGTACGGCGACTGCGCGATCATCCCGAACC
+CGACGGTGGAGCAGCTCGCTGATATCGCCATCTGCTCGGCACGCACCGCCGCACAGTTCGGCATCGAGCC
+CCGGGTGGCCATGCTGTCCTACTCCACCGGTGACTCGGGGAAAGGTGCCGACGTCGACAAGGTCAGAGCG
+GCAACGGAGTTGGTGCGCGCTCGGGAGCCGCAGCTGCCGGTCGAGGGTCCCATTCAATACGACGCCGCAG
+TGGAACCGTCGGTCGCGGCCACCAAGTTGCGCGATTCGCCGGTGGCCGGCCGCGCGACGGTGCTGATCTT
+CCCCGATCTCAATACCGGCAACAACACCTACAAAGCGGTGCAGCGTTCTGCGGGTGCGATCGCGATCGGC
+CCGGTGCTGCAGGGCTTACGCAAGCCGGTGAACGACCTATCTCGGGGTGCACTGGTCGACGACATAGTCA
+ACACCGTGGCCATCACGGCGATTCAGGCGCAGGGCGTCCATGAGTAGCACCGTGCTGGTGATCAATTCCG
+GCTCGTCGTCGCTGAAGTTCCAGCTCGTCGAGCCGGTCGCCGGCATGTCACGTGCCGCCGGGATTGTCGA
+GCGGATCGGCGAGCGGTCATCCCCGGTTGCCGATCACGCCCAGGCGCTGCATCGCGCATTCAAGATGTTG
+GCCGAGGACGGAATTGACCTGCAGACCTGCGGGCTGGTGGCGGTCGGACACCGGGTGGTCCACGGCGGCA
+CGGAGTTTCACCAGCCGACGCTGCTGGATGACACGGTGATCGGCAAGCTTGAGGAGCTGTCGGCGCTGGC
+CCCGTTGCACAACCCGCCGGCGGTACTGGGCATCAAGGTGGCACGCAGATTGCTGGCCAATGTCGCGCAC
+GTCGCGGTGTTCGATACGGCCTTTTTCCATGACTTGCCCCCGGCGGCCGCGACCTATGCCATCGACCGCG
+ACGTCGCCGACAGATGGCATATCCGCCGCTACGGATTTCATGGCACTTCACACCAATACGTCAGCGAGCG
+GGCCGCCGCCTTCCTGGGCCGCCCGCTCGACGGTTTGAATCAGATTGTGCTGCATCTGGGTAACGGTGCC
+TCCGCCTCGGCGATTGCCCGCGGCCGGCCGGTGGAAACGTCGATGGGCCTGACACCGCTTGAGGGCTTGG
+TGATGGGCACCCGCAGTGGCGACCTGGACCCGGGCGTCATCAGCTACTTGTGGCGCACCGCGAGGATGGG
+TGTCGAGGACATCGAATCGATGCTCAACCATCGGTCCGGGATGTTGGGGTTGGCGGGGGAGCGGGATTTT
+CGCCGTCTACGACTAGTGATCGAAACCGGGGACCGGTCAGCACAATTGGCGTATGAGGTGTTCATCCACC
+GGTTGCGCAAGTACCTTGGTGCCTATCTGGCGGTGTTGGGCCACACCGATGTGGTGAGCTTTACCGCCGG
+GATCGGCGAAAACGATGCGGCGGTGCGGCGGGACGCGTTGGCTGGCCTTCAGGGGCTAGGTATCGCACTC
+GACCAAGACCGCAACCTGGGCCCGGGGCACGGCGCCCGGCGGATTTCGTCAGACGATTCACCGATCGCCG
+TGCTGGTGGTTCCCACGAATGAAGAACTGGCCATCGCCCGCGATTGCCTGAGGGTGCTGGGCGGACGCCG
+AGCGTGAATCATACGACAGCCCGCCGGCGTGTCGCGTCGTGCGATTCACACTCGGGCGGCTTAGAACGTG
+CTGGTGGGCCGGACCTTGTTGGCCATGTCCACCAGCGTGTAGCGATGCCGTTGAGTGGGAGCTACCCGGG
+CCAGGCTGCGCAGTGACGCCTCGACACCCAGCCGCAGCCCGTGACTGGTGAACGGGAAACCGAGGATGTG
+GTTGGTGCTGGCCTTGTTGTCCTTCAGCCAGTCCAGCGCGCCACCCAGCACCAGGGCGCGGATCTGCAGC
+ACGCGTGGTTCGGTCGGGGGCAGCGCCTCCACTCTTCGGGCGGCGTCGCGGATCTGTTCCTCGGTGACTT
+CACTCGTTGACCGGCCGGACAACAGAGTCACCGCGCTGGTCAGCCGTGCCGTGGTGAAATGCCGAGAAGT
+GGGCGGTACCTCGTCGAGCGTGCGCACGGCGCCGACCCGATCACCTTCGGCCGACCGGGCTCTGGCCAGT
+CCGAAAGCCGCCGAGATCACGCCGTCGTTGGTGCTCCACACCGTCTGATAGAACTTGTGTTCGTCGGTGT
+TGCCGGCTAGTTCGGCGGTGGCGGCCAGGGCGAGCTTGGGCGCCAGCTCGCCGGGAAAGGTATCCAGCAC
+CTCGGTGAAATGTTTGGTGGCCGAGTCATAGTCGCCGGTGAGCAGCTCGGCGACGGCCCGGTACCAGACC
+AATCGCCATCGCCAGCCAACGCGTTCGGCCAGATCGTCGAGTTTTCGGGTGGCCTTGGCCACATCGCCGA
+GATCCAGCAGCGCGCGGACTTCCATTAGCGGCAGCTCCACTGACTCGGAGAAGTCGACGCCGTCGGCGTC
+CAGCGCACCGTGGCGGGCCGCGCGCAGCGAGTCTAGGGTCTGCACCGGCTGGGAGAGCACCGTGGCCTGC
+AGGACCGAAGCTGCGACGTCGGTCGGATCGACCAGCGGCACCGACAGCGCGGTCACGATCTCGTTGGCGG
+TCAGCTTCTCCGCGTGCACCTGCCCGTCCAGATACACGTCGGTGTGCGCCACCAGCAGGTCCACTCCAAA
+TGTCGACCGACTGGGACTGAAGATCGTTGATAGCCCTGGCCGCGGCACCCCGGTGTCCTGGGCGACCACC
+TCCCGCAACACGCCCGTCAATTGCGCGGACATCTCTTCGGCGGTGGTGAACCGTTGCCGCGGATCGGGGT
+CGATGGCCCTGCGCAGCAACCGGCCGTAAGAGTCGTAGGTTTTCAGCACCGGGTCGTCTTCGGGTAGCCC
+ATCCACATAACGGCCATTGCGGGTGGGCAGGTCCAGCGTGAGCGCCGCGAGCGTGCGTCCCACGGTGTAG
+ATGTCGGTGGCCACCGTCGGACCGGTCCGCACGATCTCGGGCGCCTGGAAGCCTGGGGTCCCGTAGAGGT
+AGCCGAACGAGTTGATCCGCGATACCGCGCCCAGGTCGATCAGCTTGAGCTGTTCCTCGGTCAGCATGAT
+GTTTTCCGGCTTCAGGTCGTTGTAGACCAAGCCGATGGAATGCAGGTAGCTCAGCGCCGGCAGGATCTCC
+AGCAGGTAGGCGATGGCCTCCGCGACGGGCAGTTTCTGACCCTTGCTGCGTTTGAGCGATTGCCCGCCGA
+CGTATTCCATCACGATGTAGCCGACCGGATCCCCGTGCCTGTCGGTGTGCTCGACAAAGTTGAAGATCTG
+CACGATCGACGGGTGCACCACCTCGGCCAGGAACTGGCGTTCGGCCATCGCCATTGCCTGCGCTTCGGCA
+TCACCGGAATGCACCAGGCCCTTGAGCACCACCGGACGGCCGTTGACATTGCGGTCGAGAGCGAGGTAGA
+TCCAGCCCAGTCCGCCGTGCGCGATGCAGCCTTTGACCTCGTACTGGCCGGCGACGATGTCCCCGGGATT
+TAGCTGCGGCAGGAACGAATACGGGCTGCCGCAATAGGGACACCAGCCCTCTGAAGCTCCCTTGGTCTCC
+GAGTCGGACCGGCCGACGGGACGTCCACAGTTCCAGCAGAACCGCTTGGACTCCGGCACCACCGGGTTGG
+TCATCAGGGCCTCAAGCGGATCGATATCGGGCGCCCGCGGGATTTCCACCAGGCCGCCGCCCAGCCGTCT
+GACCGGTGGGCGCACCCGGCTGGTGGTGGCCATCCGGTCTTGCGGCTCGGTGTCCGGGCCGAGCGTCGGA
+TGGGGGAAGTTGTCCTCATCGCCGAAATCGGGGCGGAACACCGCCTGGGTGCTCAGGGGTCGAACCGTCG
+CGGACGTCGCGGTCTGGGCGTCCGCCGGTTGGGTGCCGGGGCCCGAACGTTCGGTCTCTGACGCTTTGGC
+CATCAGTCCACATACCTCGGCGTGGGCGGGGCGGGGGCTGGGCCGAGCACCGTCAGCCACTTGCGATACA
+ACGTGTTCCAGGTGCCGTCATTGCGGATGCGTTCGAGCGTGCCGTTGACGAACCGGACCAATCCGGTGTT
+GTCCAGGTTGATCCCGACGCCGTAGGGCTGGTCGGCCATGTCGGGCCCGACGATATGCAGGTAGGGGTCT
+TCCTCTACCAGCCCGGCCAGGATGGTGTCGTCGGTGCTGACAGCGTCGATCTCGCGCTGCTGCAAGGCCA
+CCAAGCAGTCCGCCCAGTTCACCACCGACACAATGACGGGAGGCGGTGCGATCTCCCGGATACGGCGCAA
+CGATGTGGTGCCCCTGGCCACACAGACCCGCTTGCCCGACAGGTCGGACACCTTTGTGATCGGCGAGTCA
+CGCGGGGCGAGGATGCGTTGGTTGGCGTCGAGGTAGACGGTGGAGAAGTTGACCAGCTTGCGCCGCTCGC
+AGGTGATCGACATCGTCTTGACGACGATGTCGACCTGCGACTTCTGCAGCGCGGTGACCCGCTCCGCGGC
+CGACAGGATCCGGTACTCGACATGTGACGGGACACCGAAGATGTCGCGTGCCACTTCGCCGGCGATGTCA
+ACGTCGAAGCCGGTGATCTCGCCGGTGATCGGGTCGCGGAAGCTGAACAGGTTGCTGCCGATGTCGAGTC
+CGACGATCAGCCTGCCGCGCGCGCGGATGTCGGCCACCGCGGCGTCGGCCTCGGCCTTGGTGGCAAAGGG
+GCGCAGGCTGGCGGTGGGATCGCAGTCCTGGCTCGAACTGTCCGGCGGCAGCGGGGGTTGCGGTGGCATG
+ATCTCCATGCCGACCGGTGTGGGCAGCGGCAGCGTCGGCGTCGCCTCCACCCCCAGCGTTTCCGAGTGGC
+CGCAACTGGCCAGCACCATCGCCAAGGCCAGCGGCGCGAGTGGGGCTGCCGCCCGCGCCAGGAGGGCCCG
+GCGCGTCATCACCGATACTCTTTCAGCCGGGGCCACAGGCCGAGCGCGACGGCAATGGCGGCACCTAAGC
+TGAGCACCACGCCGCCCACCTGCGCGCCTGCCAGCCCGCGATGCGCATTGAGGATGTCGTGGCGCAGTTG
+GGTGCGGCTTTGTCCCATGGCTTTGGTCAGTGCTTCGTCGAGCTTGTCGAATGCGGGGGTAGCATCGTCC
+TCGCCTTTACCCAGTGCCACCTGAGTGGCGGCCCGATAGTTGCCGACGGAGATGTAGGAATTGATCCGGT
+CGTTGGCCTGCCGCCAGCGCACCAACAGCTGGTCGGCGCCCTGCAGATCGGGTTTGTCGACGGCGTGGCG
+GCGGGCCATGTAGTCGTTGAGCTGGCGTTGCATGGCGTCGATGCGCTGATAGAAGGCCTGCTTGCGGACC
+TCTTCGTCGCCGCGCCGGATCAGCGACAGTGTCTCGTCGGCCCGTGCCTGTTGGGCGGTGATCGCCAGGT
+TGGTGATGGTCTTGAGTGACTCAGCCGCGGTATCTTTCGCGCTACGGCTGGCCGTTGTAGAGATGGTCAG
+CGCAGTTCCCACCCACACCACCATGACGAGAATACCGAGCGCGCCCACGACAAGACCGGGGTTAATCCGT
+CGCCTGGTGCGCCGGGCCAGCCAGCGATGTGCGAACGCACCGAAGACCACGGTGGTGGCGACCACCAGGA
+TCACCGGGGCCGGGATCTGGGTCGACGCGGTGGTTTCCCGATCTACCCGTGCTGATGTCGCCTGGTAGAG
+CCGTTGCGCGTCGGGCAGGATCGTCGATTGCATCAGCCCCGACGCCTCTGACAGATATGACGACCCGACC
+GGGTTGCCCGCCCGGTTGTTGGCGCGGGCGATCTCGACCAGGCCGGTGTAGACGGCCAATTCGGCGTTGA
+TCCGGCCCAGCAATTGCACCAACGATTCGTCGGTGAGCCCGCTCGAGGCCCGGGTTACCGCTACCGAGGC
+ATCGGTAATGGCCTGCTCGTAGCGCAGCCGAACGCCGCCCGGCTCGGCTTGGGCTATGAACGCGGTGGCG
+GCCGCGGCATCAGCCACCGACAGCGTGGTGTACAGCCGTCCAGCCGCGAACGACAGCGGCTCGGTGTGGT
+CGAGCACCGCGGTCAACACCTGCTGCCGGTGTTCGATGGTGGTGGAGGTAGCGAAGGCGCTGGCCACGCC
+GAGAGCCGCCAACACGATGCCGATCGTCATGATTCGGCCGGGTGTCGTCGAGATGAACCACCGCCGGGGA
+TGTGCCGGTTCGGCGGGCGAGCGTGATCCCAGCGGCTCGGTCGACGGGTGCGCCAGCTCAACCGTCACGT
+CTGTTAGGACCTCATCTTTCGGCTAACGCAACGAAACTCTATAAGCGAATTCTAAGAGAAGGTTCCGACA
+GATGGTGTTAGGCATACGCAATTGCCCAGTTGCCCGCCTGCATATTCTGAACAGGTGCGGGGCGACGGTG
+ACGGATGGGTGGTGTCCGACAGCGGCGTTGCGTACTGGGGCCGCTACGGTGCGGCCGGTCTGTTGCTTCG
+GGCTCCGCGGCCGGACGGCACCCCCGCGGTGCTGCTGCAGCACCGCGCGCTGTGGAGCCATCAGGGCGGC
+ACCTGGGGCTTGCCGGGCGGTGCTCGAGACAGCCACGAGACGCCGGAACAGACCGCGGTCCGCGAATCGA
+GCGAGGAGGCGGGCCTGTCCGCCGAGCGACTCGAGGTGCGGGCCACGGTGGTCACCGCCGAGGTGTGCGG
+GGTCGACGACACGCACTGGACCTACACCACCGTTGTCGCCGATGCCGGGGAGTTGCTGGACACCGTGCCC
+AACCGGGAAAGCGCCGAACTGCGCTGGGTGGCCGAGAACGAGGTGGCCGACTTGCCGTTACATCCCGGAT
+TCGCCGCCAGTTGGCAACGACTGCGGACCGCTCCGGCGACCGTGCCACTGGCCCGGTGCGACGAACGGCG
+GCAGCGGCTGCCGCGCACCATTCAGATCGAGGCCGGGGTTTTCCTCTGGTGTACGCCGGGCGACGCGGAT
+CAGGCGCCCTCGCCGCTGGGTAGGCGGATCAGTTCGCTGCTGTAAGCGCCGACCGGAGCTGCTCGGCCGC
+CGCACGTGGGTCGTCAGCCGAGGTGATCGCCCGCACCACCACGATCCGGCGAGCGCCGGCATCGAGCACG
+GCCGGCAGCCGTTGCGCGTTGATGCCGCCGATAGCGAACCACGGCTTGTCGTCGCCGCCGAGTTCGGCGG
+CGACCCGTACCAGCCCCAGACCCGGCGCCGCACGGCCAGGCTTGGTCGGTGTCGGCCAACATGGTCCGAC
+ACAGAAATAGTCGGCGTCGCCGGCGGCGGCCGCAGCAACCTGGTCGGGGTCGTGGGTGGACCGGCCGATG
+AGGGTATCCGGTGCCAGGATCTGTCGTGCGACGTTCACGGGCAGGTCGCGTTGACCCAGATGCAGCACGT
+CGGCGCCGGCCGCGCGGGCAATATCGGCGCGGTCGTTGACCGCGAATAGGGCGCCGTACCGGTGCGCTGC
+GTCGGCCAGGATCTCGCAGGCGGCCAGTTCGTCACGCGCCTGTAGCGGGCCGAACCGCAGCTCACCGGGT
+GAGCCCTTGTCGCGCAACTGGATGATGTCCACTCCGCCGGCCAGGGCGGCCTCGGCGAACTGAGCCAAGT
+CGCCGCGTTCCCGACGGGCGTCGGTGCACAGATACAGCCTTGCCGATGCCAGACGGGATTCGTGCACATC
+GTGACGCTAGCGCGCTAGCGTGGAACCCTGTAGACACGGGAGTCCCGGGAGCGGGGTCTGAGAGTGGGCG
+CGCCTGCCCTTACCGTCACACCTGATCCGGATCATGCCGGCGAAGGGAGGTCAAGGATGGCGTCCGACCT
+ACACACCGGGTCGCTGGCTGTCATCGGCGGCGGTGTCATCGGGCTGTCGGTGGCCCGCCGTGCCGCCCAA
+GCCGGCTGGCCGGTGCGGGTGCACCGCAGCGACGAGCGGGGGGCGTCCTGGGTTGCCGGCGGCATGCTGG
+CCCCACACAGCGAAGGCTGGCCCGGCGAGGAACGGTTGTTGCGGCTAGGCCTGCAGTCCCTGCGGCTTTG
+GCGTGAGGGCAGCTTTCTCGACGGGCTGGGCCCGCAACTGGTCACCGCGCACGAGTCGCTGGTGGTGGCC
+GTCGACCGGGCCGACGTCGCCGACCTGCGCACTGTCGCGGACTGGTTGTCCGCACAGGGGCACCCGGTGA
+TCTGGGAGTCGGCTGCCCGTGACGTCGAACCCCTACTGGCGCAAGGCATCCGGCACGGGTTTCGGGCGCC
+CACCGAACTGGCCGTCGACAACCGCGCCCTGCTCGACGTGCTGTGCCGTGACTGCGAGCGACTCGGAGTT
+CGCTGGAGCTCACAGGTGAGCAGCCTGTCCGACGTCGATGCGCACACGGTGGTGATCGCCAACGGCATTG
+ACGCCCCGGCCTTGTGGCCCGGCCTGCCGATACGCCCGGTGAAGGGTGAGGTGCTGCGGCTGCGATGGCG
+ACCAGGTTGTATGCCCTTGCCGCAGAGAGTGATTCGTGCCCGTGTGCGTGGACGACAGGTCTATCTGGTG
+CCACGTTCGGACGGGGTGGTCGTCGGCGCCACCCAATACGAGCACGGGCGCGACACCGCGCCGGTGGTAT
+CGGGAGTTCGTGACCTGCTAGACGATGCGTGTACCGTGCTGCCGGCGCTGGGTGAGTACGAGCTGGCCGA
+GTGTGAGGCCGGACTGCGCCCGATGACACCCGACAACTTGCCGCTGGTCCAACGCCTGGATTCGCGGACC
+CTGGTCGCGGCCGGTCACGGCCGATCCGGATTCCTATTGGCGCCGTGGACTGCCGAACAGATTGTGTCCG
+AACTCGTTTCGGTTGGGGCCGCCTCATGATCGTCGTTGTCAACGAGCAACAGGTCGAGGTCGACGAGCAG
+ACCACCATCGCCGCGCTGCTGGATTCGCTGGGCTTCGGGGACCGGGGTATCGCTGTGGCGTTGAACTTTT
+CGGTGCTACCACGATCGGACTGGGCCACCAAGATCTGTGAGCTGCGTAAGCCGGTGCGACTAGAGGTGGT
+GACGGCGGTGCAGGGTGGCTGAGTCCAAGTTGGTTATCGGTGACCGCAGCTTCGCCTCGCGGCTCATCAT
+GGGTACTGGGGGTGCGACCAATCTGGCGGTGCTAGAGCAGGCTCTGATCGCCTCAGGTACCGAGCTGACC
+ACCGTCGCGATACGCCGGGTCGACGCCGACGGGGGAACCGGCCTGCTCGACCTGCTCAACCGGCTCGGCA
+TCACACCGCTACCCAACACCGCGGGGTGCCGCAGCGCCGCGGAAGCGGTCCTGACAGCGCAGTTGGCCCG
+TGAGGCGCTGAACACCAACTGGGTCAAGCTCGAGGTGATTGCCGACGAACGCACCCTGTGGCCTGATGCG
+GTCGAATTAGTCCGGGCTGCAGAACAATTGGTGGACGACGGATTTGTGGTCCTACCGTACACAACCGACG
+ACCCGGTGCTGGCCCGCCGGCTAGAAGATACCGGTTGCGCAGCGGTGATGCCGCTGGGTTCGCCGATCGG
+CACCGGCCTTGGTATCGCCAACCCGCACAATATCGAGATGATCGTCGCCGGTGCCCGCGTTCCCGTGGTG
+CTGGACGCGGGCATCGGTACCGCCAGCGATGCCGCGTTGGCGATGGAGTTGGGTTGCGATGCCGTGTTGT
+TGGCCAGTGCGGTGACCCGGGCCGCCGACCCGCCGGCGATGGCCGCGGCGATGGCCGCCGCGGTGACCGC
+CGGATATCTGGCGCGTTGCGCGGGGCGGATCCCGAAACGCTTCTGGGCTCAGGCTTCCAGCCCGGCACGA
+TAACCAAAACGGTGAAGCCACGGGGTGCGGGCGGCCCGCTACCGGTCCGATTGCCCCGGATGTGGCAGCT
+TGCGCATACAGTGCAGCCTTATACACGCCGACCTGTTGGCTGCCGCCGACTACAACGTTGTGGGATTGGC
+GGCGGCGGTGCTATCGGTGTGGGCCTACTTGGCGTAGACCTATGGCCGACTGGTGGGACGACGAGTCCGG
+AGTTGGCAGCACCATCGCCAGTCTTCCGTAGCGGCATTGTCGCTGGTAGTGCTTTGGTTTGTGCTGTGTA
+ACCTCCGGTTTAGGCCATTCAACGCTCTGTTCGTTTGATTGGTCGGTGGGATGCGAAAGCTGCGCGGCGA
+CAGGCGCGGTCTAATCTGGGCGCGATGGTGAACAAATCCAGGATGATGCCGGCGGTGCTGGCCGTGGCTG
+TGGTCGTCGCATTCCTGACGACGGGCTGTATCCGGTGGTCTACGCAGTCGCGGCCCGTTGTTAACGGCCC
+CGCTGCCGCAGAGTTCGCCGTTGCGTTGCGCAACCGGGTGAGCACCGACGCGATGATGGCGCACCTATCG
+AAACTGCAGGACATCGCCAACGCCAACGACGGCACTCGCGCGGTGGGCACCCCTGGCTATCAGGCCAGCG
+TCGACTATGTGGTAAACACACTGCGCAACAGCGGTTTTGATGTGCAAACCCCGGAGTTCTCCGCTCGCGT
+GTTCAAGGCCGAAAAAGGGGTGGTGACCCTCGGCGGCAACACCGTGGAGGCGAGGGCGCTCGAGTACAGC
+CTCGGCACACCGCCGGACGGGGTGACGGGCCCGCTGGTGGCTGCCCCCGCCGACGACAGTCCGGGCTGCA
+GTCCGTCGGACTACGACAGGCTGCCGGTGTCCGGTGCGGTGGTGCTGGTAGATCGCGGCGTCTGTCCTTT
+TGCCCAGAAGGAAGACGCAGCCGCGCAGCGCGGTGCGGTGGCGCTGATCATTGCTGACAACATCGACGAG
+CAGGCGATGGGCGGCACCCTGGGGGCTAATACCGACGTCAAGATCCCGGTGGTGAGTGTCACCAAGTCGG
+TCGGATTCCAGCTACGCGGACAGTCTGGGCCAACCACCGTCAAGCTCACGGCGAGCACCCAAAGTTTCAA
+GGCCCGCAACGTCATCGCGCAGACGAAGACGGGGTCGTCGGCCAACGTGGTGATGGCAGGTGCGCATTTG
+GACAGCGTTCCGGAAGGACCCGGCATCAACGACAACGGCTCGGGAGTGGCTGCGGTTCTGGAAACGGCAG
+TGCAGCTGGGGAACTCACCGCATGTGTCCAACGCGGTACGGTTCGCCTTCTGGGGCGCCGAGGAATTCGG
+CCTGATTGGGTCACGAAACTACGTCGAGTCGCTGGACATCGACGCGCTCAAAGGCATCGCGCTGTATCTG
+AACTTCGACATGTTGGCGTCGCCGAACCCGGGTTACTTCACCTACGACGGTGACCAGTCGCTGCCGCTAG
+ACGCCCGCGGTCAGCCGGTGGTGCCCGAAGGCTCGGCCGGTATCGAGCGCACGTTCGTCGCCTATCTGAA
+GATGGCCGGCAAGACCGCGCAGGACACCTCGTTCGACGGTCGGTCCGACTACGACGGCTTCACGCTGGCG
+GGTATCCCTTCGGGTGGCCTGTTCTCCGGCGCTGAGGTCAAGAAGTCCGCCGAGCAAGCCGAGCTCTGGG
+GCGGCACCGCCGACGAGCCTTTCGATCCCAACTATCACCAGAAGACAGACACCCTGGACCATATCGACCG
+CACCGCGCTCGGTATCAACGGCGCTGGCGTCGCGTACGCGGTGGGTTTGTATGCGCAGGACCTCGGCGGC
+CCCAACGGGGTTCCGGTCATGGCGGACCGCACCCGCCACCTGATTGCCAAACCGTGATCCGGGCCTGATC
+TCGCCACTGACCCCGCACCGACCGATCTAGAATGGGATTTCCTTGGTGCATGCCGGGCGGGACGGGGTTA
+GGAGATGCATGGTCGCGGGCGGTATCGACCTCTGGTCCGCTGTGTTCGCCCTCGCCGGGTGGCCGCGTCG
+GTGCGGACCCCGATCGCCTGTCTAGCGGCGGTGGTCGTGATAGCCGGCTGCACGACCGTCGTCGACGGGC
+GGGCGCTGTCCATCCTCAACGACCCGTTCCGGGTGGGGGGTCTGCCCGCGACCAACGGTCCGAGCGGCGC
+CCGCCCCGACGCACCGGCTGCGTCGGGCACGGTGATCAACACCAACAACGGAGCGATCGACAAGTTGTCG
+TTGTTGTCGGTCAACGACATCGAGGACTACTGGATGGCGGTCTACAGCGAATCGCTGAAGGGCACCTTCC
+GGCCGGTCGGCAAGCTGGTGTCCTACGATTCCAACGACCCAAGTAGTCCGATCGTCTGCCACATTGACAC
+CTATCAGCTCGTCAACGCCTTTTTCAGCTCTCGGTGCAACTTGATTGCCTGGGATCGAGGGGTCTTCATG
+GCGGTCGCGCAAGAATACTTCGGCGACATGTCCGTCAATGGTGTGCTGGCACACGAATTCGGGCATGCTC
+TGCAAGTGATGGCGAATTTGGTTACCAGGAAAGATCCCACCATCGTCCGCGAGCAGCAAGCGGATTGCTT
+CGCCGGGGTCTATCTGTGGTGGGTGGCCGAAGGTAAGTCGACACGCTTTACGCTGAGCACCGCGGACGGG
+CTCGACCACGTGCTCGCCGGCATCATCACCACCCGAGACCCGGTGATGGAAGCCGATGCGGAAAACGACG
+ACGAACATGGGTCGGCCTTGGATCGGGTCAGCGCGTTCCAGCTGGGCTTCATCAACGGCACGCCGGCGTG
+CGCGGCGATCGACGAGGACGAAGTCGAGCGGCGCCGCGGTGACCTGCCGACGACGTTGCGGGTCGATGCC
+AGCGGCAACCCAGAGACCGGCGAGGTCGGAATCAACGAAGAGACCCTCTCGACGTTGATGGAGTTGATGG
+GCAAGATCTTCTCGCCGAAGAATCCGCCCACGCTGTCCTACCAGCCGGCCGGTTGCCCAGACGCCAAGCC
+CAGCCCACCGGCCGCCTACTGTCCGGCCACCAACACCATCGTGGTCGACCTGCCCGCCCTGGCGAGGATG
+GGCAAGGTGGCCTCGGCAGCGGAACACAGCCTGCCGCAGGGCGATGACACGTCGTTGTCGATTGTGATGT
+CGCGGTACGCGTTGGCGGTGCAGCACGAACGCGGGCTGCCGATGCAGAGCCCGTGGACCGCCTTACGGAC
+GGCGTGCCTGACCGGCGTTGCGCACCGCAAGATGGCCGTGCCCATCGACCTGCCCTCCGGCCAGCAACTC
+GTACTTACCGCGGGTGATCTCGACGAAGCGGTTTCCGGGTTGCTGACCAACCGCATGGTCGCCAGTGACG
+CCGACGGTGTCAGCGTTCCGGCCGGTTTCACTCGGATAGCCGCGTTCCGTGCCGGCGTGGGCGGCGACAT
+GGACGCATGCTATGCCCGGTATCCGGGATAGGACTGGCCCTGATGTTGATCGTTGTGCACCCACATCACC
+AAAAACCCGGTGACCAGCAACCACCCCAGGGCAACGGACGGGATCGCCCAGGCGCGACGTACGAGTAGTG
+CGGTGTCACAACGCGTGACCAGGGCCTGAGTGTTGTCGTTGCCGTCGGCGTACAGCGCCTGGGTGAGGTT
+GGAGCGCCAGCCGCTGCCACAGGTGACCTTGATGCCATACGCATCGTATTGATCCAGGTAGACCGGAAAC
+CACAGCGCCATCAGACCAATGACCGCCAGCAGCAGGCCAGTAATTCCGATGAACATCTGGCGACGATTCA
+CGGCTTCTTCATGTCTTGCGATGTGCATTCGGGATTCGGGCGCCGCAGCGCTCGCGTCATGCAAGCGCAA
+ATGCGGGCTTTGCCAACAAAGGCCGGGTGGCCACGCCCAGGCAAGTTGTGAGGGAGGCCCCCCGGGGCCG
+CAACCATGTTAACGCGCGTCCGCCTAAGCATTCAGCGCGCCGTGCCCTACCGGCACTACGCCCGGGCGTG
+CGTGCGGAACCTGACAGAGCTCACGCTATTTGGCCCGCCGACAGACGTAGCGCCGCATCGACCGCCAGCC
+TGGCGACATCGAGGGTCTTCGAGCCCAAGTCATGTCGGGCGCCGGTGATCTCGACGACCTCGGTCGGTGC
+CGAGACCATCGCCGCGGCGGAACGCACCTGGGCCAGCGTGCCGAACGGGTCCGCCGTTCCGTGGGTGAAC
+ACCGTCGGCACTGCGATCCCCGGCAAGTGCTCGGTACGGACGCGTTCCGGCTTTCCCGGCGGATGGACCG
+GATAGGAGAACAGCGTCAGCACGTCGACCGGTGCCTGCCCGGCCGCCACCACCATGGACGTCTGCCGACC
+GCCGTAGGAATGTCCCCCGGCGATCAGCGGACCCTCGGCAAGGCCGCGGCACAGCTGGATCGCTTCGACG
+ATGCCGGCACGGTCGCCTGACCCCGAGCCGGATGGCGGACCGGTGGGTCGGCGTCGGCGGTAGGGCAGGT
+TGTAGCGCACGGCCAGCCATCCTCGGCGGGTCCATTCGGCGCAAACCTGTTGCAACAGTGTGGATTCGCG
+GCTACCGCCCGCGCCGTGGGTAAGGACGACTACCCCGTGTGGTGGGCCGGCCGGTTGGTGTGCAACGCCG
+GCGATCTGATCAAGGTTCATGACAGCCGAAACAGCGGCGAAACGGGCCCGTGGCCGCGGCCCAGTGGATA
+GGCCGCGCGCAGGCATTCGGTAACCCATCGCTTCCCGAAGTCCACCGCGTCGGGCACGGTGAAGCCGTGC
+GCCAACGCGGCGGCGATCGCGGTCGCCAGCGTGTCACCACCGCCATGGTCATCGCCGGTGGGTAGTCGCT
+GCGCGTCGAACTGGTAGCAGCTGACGCCGTCATAGAGCAGGTCGCAGCTGCCGTCCGACGAGCGCAGGTG
+TCCGCCTTTGACCAGCACCCACTGCGGCCCCAGCGCATGCAGGGCTTTGGCCGCCGCACGCTGCGACTCG
+GCGTCGACTACCTCGATATCTACCAGCAGGCGCGCCTCGTCAAGGTTGGGGGTCAGCAGCGTCGCCAACG
+GGAACAGCTGACCGCGAAGCGAATCCAGGGCAGACGGTGCCAACAGCGGGTCTCCGTGCATGGATGCGCA
+TACCGGGTCGACGACGAGCGGAACGGACAGCTCGAGCCGACGCCAGGTCGCGGCCACGGTCGCAACGATG
+CGCGACGAGGCCAGCATCCCGGTCTTGGCGGCTTGAACGCCGATGTCGGTGACGACCGCCTCGATCTGGC
+CGGCCACCACATCGTTGGGAACTTCATGAATATCCTTGACTCCCAACGTGTTCTGTACGGTAACCGCCGT
+GACTGCGACGCACGCGTGCACTCCTAGCAGTGCCATCGTGCGCATATCGGCTTGGATGCCGGCACCGCCC
+CCGGAGTCCGATCCGGCGATGCTCAACACCCGCGGCGGCGTCATTCCCGGCGGTGCCAGCGGGAGGTAGT
+TCACTGGGTTATCGGGAGATACACCCGATTGCCGTGCTCTGCGAATTCACGTGACTTTTCGGCCATTCCG
+GCGGCGAGCACGGCTTCGATGTCCGCTTCGGTCTCAAGCCCGTGTTCGGCGGCGTACTCACGGACGTCCT
+GGGTGATGCGCATGGAGCAGAACTTCGGTCCGCACATCGAGCAGAAGTGCGCGGTCTTGGCCGGCTCCGC
+CGGCAGGGTTTCGTCGTGGAATTCCCGTGCGGTGTCGGGATCCAGCGACAGTGCGAACTGGTCGTTCCAG
+CGGAACTCGAAACGCGCCGTGCTCAAAGCGTCGTCGCGCTCCTGGGCGCGCGGATGGCCCTTGGCCAAAT
+CGGCCGCATGCGCGGCGATCTTGTAGGCGATCACCCCGTCCTTGACGTCCTTGCGGTCCGGCAACCCGAG
+GTGCTCCTTGGGGGTGACGTAGCACAGCATCGCGGTACCGGCTTGGGCGATGATGGCCGCACCGATCGCC
+GAGGTGATGTGGTCGTAGGCCGGCGCGATGTCGGTGGCCAGCGGACCCAGCGTGTAGAACGGGGCCTCCT
+CACACAGTTCCTCTTCCAGCCGCACATTCTCGACGATCTTGTGCATTGGGATATGGCCCGGCCCCTCGAT
+CATCACCTGTGCGCCATGGGCTTTGGCGATCTTGGTGAGCTCGCCCAGGGTGCGCAGCTCGGCGAACTGC
+GCGGCGTCGTTGGCATCAGCGATCGACCCTGGTCGCAGCCCGTCACCGAGTGAGAAGGTGACGTCGTAGC
+GGGCGAAAATATCGCAGAGCTCCTCAAAGTTGGTGTACAAGAACGACTCCCGATGATGTGCCAAACACCA
+CGCGGCCATGATCGAACCCCCGCGGGACACGATGCCGGTGACCCGCTTGGCGGTCAGCGGCACATACCGC
+AGCAGCACCCCGGCGTGCACCGTCATGTAGTCCACGCCTTGCTCACACTGCTCGATCACGGTGTCGCGGT
+AGATCTCCCAGGTCAGCTCGGTCGGATCGCCCTTGACTTTCTCCAGCGCCTGATAGATCGGCACGGTGCC
+GACCGGCACGGGAGAATTGCGCAGGATCCACTCGCGGGTTTCGTGGATGTTCTTGCCGGTGGACAGGTCC
+ATGATGGTGTCGGCCCCCCAGCGGGTGGCCCACACCATCTTGTCGACCTCCTCGGCGATCGAGCTCGTCA
+CCGCCGAGTTGCCGATGTTGGCGTTGACTTTCACCGCGAACGCCTTGCCGATGATCATCGGCTCGCTCTC
+GGGGTGGTGGTGGTTGGCCGGGATCACCGCGCGGCCGCGGGCGACCTCGTCGCGCACTAGCTCGGCGGAC
+ATGTCTTCGCGGGCGGCGATGAACGCCATCTCGGCGGTGATCTCCCCGGCGCGGGCCCGCTGCAGCTGGG
+TGCCCCGATCGCGAACCACTCCGGGCCTATGCGGCAGCCCCGCGGTCAGGTCGATCACCGTGTCCGTGTC
+GGTGTAGGGCCCGGAGGTGTCGTAGAGGTCGAAGTGGTCTCCGGTGGACAAGTGCACCCGTCGAAACGGG
+ACTTGGAGAGTAGCTCCGCTGCCGGGAGCCTCGATTTCACGGTAGGCCTTGGCGCTGCCCGCGATGGGAC
+CCGTGGTCACCGACGGTTCAACGGTGATGGTCATTTGCAACTCCCTACGCCGGCATTACCCGGTCAGGTT
+CGTACGGTCGACGGCCCCGAGCCGTCCTCTCAGCGCACTCGGCGTGCGCTCCCGCGTGGGTACCCCCACG
+CTAGCGCAGCGCGGCGCCGGTGTGCACGGACGGCCCGATGCCGCGTTAGGCCTCTTCCATCGCCTCGCCG
+AGTTCCTCGAGGACCCGGTTGTGGTGGTTATTTGCCAAGATATGTCCGGTGGCGATAACCAGGGCGACCG
+GCCAGTCGATGAGTTCGAGGGCAGCGAGTGCCGCCAGACCTCCGTAGTAGGCCAGGTGCTCTGGCCGCGG
+AATCTTCACTTGGCCGCAGATCGGGAGGTTCATCACAATAGTCTCCGCTTCGCGGATCTTAGCCACGGCC
+TCACGCTGAGATGTCGCTCGACGCGTATTCTTTTCGGCCATCATTTGCCTTTCAGTAACGAAGGGTTTGC
+CGTTGTGCAGGGTGGTGCGGTCACCGTCGGGGGTATGTCGACGAGGACCGATGCGCTGGCGGACCCTTTG
+GCTTCGTCGTTTGCCTTGTTGCTGACGGTGCCTTTACTGGAGCTTTACGCCGTGCTGTGGCGCGTCGGCG
+TCGTCGAGGTCCGGGGGGCGCACCGGGGGACGCGTCGCGGGAAAGCGCATCGGTCTCGGGTGGTTGCGGG
+TTCGGCTGGCCCGATTTGTCCCGACCCGTCAGCACACGGTTCAGCACGGCGACGGCGACGGTCGCAGCAG
+TCGCGGCTGCTGTCGCCTGCGCCCAGCCGAGTGGGTCGAGGGGGGTGCAGCCGAGCAACTGGCTGACGAC
+GGGGATGCTGATCAAGGTTGCCAGCGCGGCCAGTGAGCCCAGTGCGGTGAGCACAACCAGCCAGGCATGC
+GAGTCCACCAAGGTTTGACCCAACTGAGCGGCCACCAGCGCCACCAGCGCCACCGTGGATGCGCGGCGCG
+GCAAGCCGGTGAACCCCGCCATCACCCAGGCCACGGTGGCCGCGGCCGCCGTGGTCGCCCCGCGGATACC
+GACGGCACGCCATAGCTCGCGTTGATCGGGACCGCGGGTTGCCGGCGTTACCGGGTCGCTTGGCTTGCTG
+ACCGCGAGCGCCGCCGCGGGCAGTGCGTCGGTCAGCATGTTCACCAGCAGCAGCTGACGGGTGTTCAACG
+GCGAGGTCCCGGTGATAGCGCTGCCGATGATGGCAAAGGCCACCTCGCCCGCGTTGCCGCCGAGCAGCAC
+AGACACTGCCGCTTGCACCCGCTGCCAAAGCTGGCGTCCTTCCAGGATTGCGGGCAGCAATGACTCGATC
+CGGCCGTCGACCAACACCAGGTCGGCGGCGACTCGGGCCGGGTCGCTGCCGTGGGCGACGACACCGATGC
+CGACGGTGGCGGCGCGGATCGCGGCCGCGTCATTGGAGCCGTCGCCGACCATTGCGCACACCCGGCCGCT
+GTGTTCCAGCGTCTGCACGATCTGTACCTTGTTCTCCGGTGTCATCCGGGCGAAGATCACCCGCTCGGCT
+ACCGCTCGCTCCTGGTCCTTGCGTGACAGGGCATCCCACTCGGCACCGCTAATGACCTGCTCAGGGCTCA
+CTTGCATGCCGAGCTCCTCGGCGATGGCGGCGGCGGTAATCGGGTGATCACCGGTGATCAGCCGGATATC
+CAGATCGTGCTCGTGCAGGTCCGCAAGTAGGGCCGCCGCCTGGGCGCGGGGGGTGTCGGACAACCCAAGA
+AACCCCACCAGACTCAACTCGTCGCGGCACAATCTCGCGATCTCGTCGGGGTCGTCCACGACCGACTGTG
+CCTGTTGCGCGGTCAGCTGGCGGTGGGCCACCGCGATCACCCGCAATCCGTTGGCGGCCAGTTCAGCGAC
+CGCGTCGTCCATGCTCGAGCCGATGCCTTCGCACGCCGCCAGCACCACTTCGGGCGCACCTTTGACGGTC
+AGCTCGGTGCCGGACACCGAGGCGGAAAACGACCTACCGGAGCGAAATGGCAGGTGGGCGGCGGGTTCTG
+CGGCGCCGGGTTCGGCACCGTCGGTGCCACTGGCGGCAGCCGCTGCCGCAGCTTGCACGATCGCGACGTC
+GGTGGCGTGCACCTGCGGGCCGTTCGACGCCGGCGCAGCGTGCGCCGCGCAGCGCAGCACTTCCTCGCGC
+GAGTGCCCCGCCACCGGCCGCACCTGCGCCACCCGCAAACGGTTCTCGCTGAGCGTTCCGGTCTTGTCGA
+AGCAGACCATGTCGACACGGCCGAGCGCCTCCACCGAGCGCGGGATGCGGACCAGCGCACCGAAGTGACT
+TAGCCGTCGCGCGGATGCCTGCTGGGCCAGTGTGGCCACCAGCGGCATCCCTTCCGGCACTGCGGCCACT
+GTGACTGCGATACCGCTGGCCACCGCTTGGCGTAGGCCCCGCCGGCGCAACAGCCCAAGCCCGGTGACCA
+GTGCGCCGCCGGTCATGCTGACCGGCCAGGCCTGGTTGGTGAGCCGACTCAGCTGATGCTGCAGGCCGAC
+GCTGGACAGATCACCGGACACGAGCTCGGCCGCGCGGCGCTCCTGAGTGTCAGGACCCACCGCGGTCACC
+ACCGCGACCGCGGTGCCGGACACGACGGTCGTCCCGGCATAGAGCATGCAGCGACGTTCGATCAGGTCGA
+CACCCGGCGTGGGTTCGACTTGTTTGGTCACCGACAGCGACTCACCGGTGAGCGCGGACTCGTCGACCTC
+CACGTCGACCTCCTCAATCACCCGGGCGTCGGCGGGAACCACCTCGTGGGTCCGCACCTCGATGATGTCG
+CCGGGACGCAGCTCCTCGGCGCGGACTTCGATGTACCTCGGCTGGTCGTCCGCGCCGGCCAGCACCTTCC
+TGGCGGGTGGAATCTGCTGAGCCAACAAGCGATTCAGCCGACTTTCGGCACGCAGCCGCTGGCTGGCCGC
+GAGAATAGAGTTTCCGGTGAGCACCGAACCGACCATCACCGCGTCCACCGGCGAACCCAACACCGCACTG
+GCCATTGCACCAAGCGCCAGCATAGGCGTCAACGGGTCCGACAACTCCGCGCGCACGGCCTTGGTCAACT
+GCCAAAGCGCGTTCAAGGGTGCCTGGGTTATTTGTGCGCCGCGCTTCGCCGTGTGCAGGCCACCGGCCAG
+CGCACGGGCCGGATACGGCGAAGGCGGTGCCTTCGCCGGTGCCTGCTCGTCCGGCGACGGCAAAGCTTTG
+CGGACTTGCTCGACCGACATTGCGTGCCATTCATGAGCGGGTGCCGGTCGCGGTGCTTGCGCGTCGACGA
+CCTTGCGTGCCAGCAGGTATCCCGAGAGCAGTCCGGCCGCCGCGCCGGTGGTCACCGGGCCGGGCCCCAG
+TCCGCGGACCCCTGGCAGCATCAACAGGGCTCCCAAAGCCGATGCACCACCGGAAATTTCGTTACCTCGC
+TGGCGTGCGGCCCTGGCCGCCGGAATCGCGTGCAGCACCCTCCAGGCGGCTCCAAGATCGGGCAGCAGGA
+CATCTGCGTACCAGGGCGGTGCACCGGCTCCAGGTGGTGGCAGCACACCAAGCGCCACATCGGCAGCCGA
+AAGCGCTTGCTTACCAACCGATGACAACACCGCGACGGTGCGGCCCGCCTGGCGCAGCTCGGCCACCGCA
+CGGGCTAGGGCTTCGTCGAGGGACCCGCTGGCACCGTCGTCGAGGGGCCGGATGTCGTCGAACACCGGTC
+GCAACTCGCCCAGGGCGTCGACATCGACCGAAACCAGGTCCGCCCCGGTGCGATGTGCCTCGGCAACCAC
+CGCGGAGGCCAGCCGGTCGTGCATGGGGCGGAAAAGTGCCTCGACTGCCGAATCCGAACCGCTGGCCGAG
+ACACCGGGTACTCGGTGCCAGCCTGGGCGCAGGCCACTCTCCGTCAAAACGAGTTGCGCCCGATTCCACG
+CTGTGGACAGCTCGTCTGCGCCGCAACCGCGGATGCGCGCCACGCGCAGGTCATCGGTGCACAGCACGCG
+GGGGTCGATGACGATCGCATCGACCCGATCCAATCGGCGCAAACTCTCCGGCCGTAACGGCAACACCGCG
+TGCTGATCAGCCAAACCTTGGCCGAGCGCCGCGGCGAACGCCTCCGGCGTGGTCCGGCTGGCTTTGGGGG
+TGGCCACCAGCGTCGCGGTCGCGGCCATGTCCGCGTCGCGGGTCCCGGCGCCCACGAGCACCGCGCTCAG
+CGCTTGGATCAGCGCGAAACGCGCGACGCTGCGTTGGACAGGTTGCGTCGACCGTGCGGGACGCGGCCAA
+AGGGATTGGGGTTGGTCGGCCGGTTCGTCGGCGTGCAGCGCGAGCTGTGGTTCATGCCGGCGCCAGGCTC
+TGGCTCCGGCACGGCATTCCGCGGCTTTCAGCGCCTGGATCGTCAGATCCACCGACAACGCCGCCGGCGA
+CAGCGTGACCGTGTGTGCGGCGGCCATGGCCAGCTCAAGGACGGTGGCGGTCGCCGCCGTGCCTATTCGA
+TCCTCGAGTAGGCGGCGCAGCAACGGCTGGTGGTCCACGGCCGCCACCGCTGCCTCGATGACGAGCGGAA
+ATCGGGGCCAGCGCAGCGCCCGGCCGCCGAGCGCTAAGCCCAGCCCGGCCGCGGTGGCGGCTACCGTTAC
+AGCTCTGACCGCCAGCAGCACGCCGTCGCCCGGCAGGCTCCCCGGTGATTGCGCCAGCTGATCGGCGGCT
+TGATCTGGGTGGCGGTGTCTTTCGGCTTTTTCGGCGTCATCGACAATGCGGCAAAGTTCGCGCAGTGATG
+TGTCGGGATCGTCGATAGCGACGACGACACGGGACAACGGGTAGTTCAGGCTGGCCGACCCGACCCCGGG
+GTGGGCTTGGATTGCGTTGAGCACGACGCGCCCAAGTTCGTCGTCGCCTCCGCTGCGCAAGCCGCGCACT
+TCGATCCAGGCGCGACGCTCGCCACGCCAACAGTTCCGGCCGAGTGTCTCGCGGGACAGCTCGCCGGAAA
+GTGCCTTGGCTCCTGCGCGCAGCGGGATGATGGCGACCTTCATACCGGTTCCGACCCCGGTCTTGGCCAG
+GGTTGCCGAGACCGCTGTCGCGGCAGTGATCGATGCGCCGGTAAGGGTGGCGGTCGCCCGGAAGCCCGTG
+GCGACAGCACGCACCGGCATAGCCCGTGCGATGGATGCAGCAATGCTCAAGAGTTGCTCAACGCCGCCAG
+ACTAGTTGGTGCTGCGCAGCTCAGCGGTGCCCGCTCGGCGACCGCTCGTCTTCCTGGCTGTTGTCTTGCT
+CGCTTTGGCTGGCGCTTCCTTTGCGGCAGCCGGCTTGTCGGGCACCGGCGCAAGTTTCGCCTTCACCGGC
+GGTGCGGCCACCTCGGGGGTGCGGTTGAGCTTCCGCAATAGCAACGCTCCGCCGCCCACGGCCAACAGGA
+TCGGCCAATCGACGAGTCCAGCGACACCGATCGCACCGATGGCCAACGCGGCTGCCGCGGTCGACTTGCT
+GCCGCTGCTAAGCCCCTTCTGAATGCCTTTGGCGGCTCCGGTCACACCGCCGACGATGCCGCTCACGGCG
+GCGCCACCCACCGCACCCGCGGCCGCTGTGGTCGCCGTTGCTGCACCACTCACCGTTCGCCCCACGGTTC
+GAACTGTCCCGCCGACCACACTCATGATGACTCCCTGGCCCAAACTGCATTCGTTTACAAATGGTTTAGC
+TACAGTTCTACACTCGTTAACCCGCACCCTGCATTCGCACCGCTGACGAGATTTCTGTTCAGCGCTCTCG
+AAATGCAAGCCTGCCACGCCGCCCTGACTGAGACAACGCGCAACTGCCGCGTGCGGCGCGACTGCCGACT
+ACCGCCGTACGCCGCCTACCCGGCGTGCAGGTCGACGAGCACCGGAGCGTGGTCGCTGGGCGCTTTGCCT
+TTACGCTCCTCGCGTACGATCTGGGCGTCCATCACCCGGGCGGCCAACGCCGGCGAGCCGAGGATGAAGT
+CGATGCGCATGCCCTGTTTCTTCGGGAACCGCAGCTGCGTGTAATCCCAGTAGGTGTAAACCCCGGGTCC
+CGGGGTGAAAGGCCGTACTACATCGGTGAATTGCGCGTCGACAATGGCGTTGAACGCCTTGCGCTCGGGT
+TCGGAAACGTGCGTGCAGCCGGCGAAGAATTCGGTGCTCCAGACATCATCATCGGTCGGAGCGATGTTCC
+AGTCGCCCATCAGTGCGATTGGTGCGGCGGGATCGTCACGTAGCCAGCCTTCGGCCGTATCACGCAGCGC
+GGCAAGCCAATCCAACTTGTAGGTGTAGTGCGGATCGTCCAGGGCGCGCCCGTTGGGCACGTAGAGGCTC
+CACACCCGGATGCCGCCGCAGGTGGCGCCCAGGGCACGGGCCTCCGTCGTGGCGGCCACTTCCGGCTTGC
+CGCTCCAGCTGGGCTGGCCGTCGAACCCAACCCGCACGTCGTCGAGGCCGACGCGGGATGCGATCGCCAC
+GCCGTTCCACTGATCGAAGCCGACGTGTGCGACGTCATAGCCGAGTTCGAACAGCGGCAAGGCCGGGAAT
+TGGCCGTCCGGGCACTTGGTCTCCTGCATGGCCAACACGTCGACATCGGCGCGCCCAAGCCAATCGAGGA
+CACGATCCAACCGGGTGCGAATCGAATTCACATTCCAGGTGGCCAGCCGCAGCAGCGGCGATCGCAAGCG
+CGGCGAAGCCGGGCGTTGGGGGTGGCCGCCGTCAATTGTGCCGTCGGGCATGGCTAGAAGGTATCCCAGC
+CGACCGACTGGGCAGGAAGATAGCGGCAGTGATGGTGCAGCCGGAAGCCCAGGGACTCGGCGAGGACGGA
+TGTCGCGGTGTCGTGCACGCGCACGTAGCCGCGGGTCGCGCCGCGGCCCGCTCCCCAGCCCAACAGCGCT
+TCCCACAATTGGCGGCCAGCGGAGCCGGTCGCGGATTGCTCGTCGGCGGCACGCATTGCCGACAGACCCA
+CCCACCGGGTGCCGTCGGGTGCGTCGGTTACCGCTGCACGTGCGACCGCCACACCCAGGTAGCTGCCGAA
+TGCCAACTCGCCGTCGATGACGGGGGTCGCCATGTCGAGGGGTAGGCGTTGGTGGTAGAGCCGCAGCCAG
+GTGTCGTCGGGGTGGTCCAGCAACGTGACCGACCGGTCGGGTTCACCGGTGGACACGTCACGCACCAACA
+CTTGCTCTCGGCGCTCACCTGCCAGGCCGGCCGGTAGTGGCAGCAAGCGGTCCGGGACGGCCAGCCATGG
+CTGCAGATCGCGGCTCGCATACCATGCGCTGATTTCTGTGATGGTGTTCGTGTGTGCCGAGATATCCAGC
+GGTACTGCTGAATTAGCGGCCAGTACGGCCCCGTGTCCGGCTCGCAGGAGCCAGCCGTCCAGCCAGGTTC
+GTTCAACGCCGGGCCAGGCCGCCGCGGCGGCGTGTTCAAGTGCGCGGATCGCGGCGGTGCGCACCGGCGC
+ATCGGTCAGGACCCGCAGGGCCACCACATCGACGGGCGAGAACTCGACGATGGTCCCGGTCTTGGTCTGC
+ACTCGCACCGTCGGATCGACGGCTAGCAGCCGACCCACCGCATCGGTCAGCGGTGGCATCGATCCGGCGG
+GCCGGCGGTAGCGCACCGTTACCCGTGTCCCAAGCCCCGGCCACGAGACCATTAGTGACCGAACGGGTCG
+GGGTCCTCGCCGGGCAGCCACGACAGTCCGGGAACGCCCCAGCCATGTGACTTGACGGCCCGTTTGGCGT
+TGCGGGCGTACCGGCCGATGAGGCGGTCCAGGTACAGGAATCCATCAAGGTGCCCGGTTTCGTGCTGCAG
+CATCCGCGCGAACAGGCCGGTGCCCTCGATACTGACCGGACTGCCATCGGCGTCGAGTCCGGTGACTCGT
+GCCCACTTCGCGCGTCCGGTAGGAAATGACTCGCCGGGAACCGACAGACAGCCTTCGTCGTCGGTGTCCG
+GGTCGGGCATGGTCTCAGGTATTTCGGAGGTCTCAAGCACCGGATTGATGACCACACCGCGTCGGCGGGC
+GGTCATTGCGCGGTCCGCGGCGCAATCGTAGACGAAGAGCCGCAGGCTGCAGCCGATCTGGTTGGCAGCC
+AGGCCGACTCCGTTGGCGGCGTCCATGGTGTCGTACATGGTGGCGATCAACTGGGCGAGATCCGCCGGGA
+GTGAACCGTCGGCGGCGACCGTCACCGGTGTGGTCGCAGTGTGTAAGACGGGATCGCCCACGATGCGGAT
+GGGTACGACTGTCATGGTGGGCTAGCTTAAGCGCGCCGACGATACGCGCCGCGAGGCGGCGGGCTGAGGA
+GGCGGGCAATCGGCTTAGGCGCGCCGCGGGGCGGCGGGCATCATCGCCGGGTGTGAACCACACGACGGCT
+GGCCGGCATGTCGCGTCGCAGGATTCACACTCGGAGCATGAGCCGGCGCGCCGCGATCGGCAGTCGGGTG
+CAAGCAAGTCGGCCGACTCGCGGGCAGGATTACCGCCCGACGGTTCCTGGCGTGGTTCAATATTCGCCGA
+AGAAGCGCCTACGTAGGCCAAGTCATTCGTACACATTGAGAATTCGCCGGAAGGGCCCAGGGGAAAGCGA
+TATGGACAGCGCCATGGCGCGGGCAATTCGATCGGGGGACGACGCCGAGGTCGCCGATGGGCTGACCCGG
+CGCGAGCACGACATCCTGGCGTTCGAACGTCAGTGGTGGAAGTTTGCCGGTGTCAAGGAAGAAGCCATCA
+AAGAGTTGTTCTCCATGTCGGCGACGCGCTACTACCAAGTGCTCAATGCGCTGGTGGATCGGCCCGAGGC
+GCTGGCCGCCGACCCGATGCTGGTAAAGCGGTTGCGGCGGCTGCGCGCCAGTCGGCAGAAGGCGCGGGCC
+GCGCGACGCCTTGGCTTCGAGGTGACCTGACACTCTCCCCGCTTTTGCCGGTTGTGTCCCGGTGCTGGTT
+ACAGTGGGCTCGATGAATGAGCGTGTACCCGACTCTTCCGGGCTTCCCCTGCGGGCCATGGTGATGGTGC
+TGTTGTTTCTCGGCGTCGTCTTCCTGCTGCTCGGCTGGCAGGCACTGGGTTCGTCTCCGAACTCCGAGGA
+CGACTCGTCAGCGATTTCCACCATGACCACCACCACTGCGGCGCCGACGTCGACCAGCGTTAAGCCCGCG
+GCGCCCCGGGCCGAGGTGCGCGTCTACAACATCTCAGGCGCAGAAGGCGCCGCCGCGCGGACGGCCGATC
+GGCTCAAGGCGGCCGGTTTCACGGTCACCGACGTTGGGAATCTATCGTTACCCGACGTCGCGGCGACCAC
+GGTGTACTACACCGAAGTCGAAGGCGAACGGGCCACCGCCGACGCGGTAGGCCGGACGCTAGGAGCAGCG
+GTGGAGCTGCGACTGCCAGAGCTGTCCGACCAGCCGCCCGGGGTCATCGTCGTGGTGACCGGCTGACGCT
+GATTCGAACGCCAGGTTAGGCTCTCGCTATGCCAAAGCCCGCCGATCACCGCAATCACGCAGCTGTCAGC
+ACGTCGGTCCTGTCCGCGTTGTTTCTGGGCGCCGGTGCCGCGCTGCTGAGCGCATGCTCGTCGCCGCAGC
+ACGCGTCTACAGTTCCGGGTACCACGCCGTCGATTTGGACCGGATCGCCCGCGCCGTCGGGACTTTCGGG
+TCACGACGAGGAGTCGCCCGGTGCACAGAGCCTGACCAGTACCCTGACGGCGCCCGACGGCACGAAGGTA
+GCGACCGCGAAGTTCGAGTTCGCCAACGGCTATGCCACCGTCACGATCGCGACGACCGGCGTCGGTAAGC
+TCACGCCCGGCTTCCACGGCCTACACATCCACCAGGTGGGTAAGTGTGAGCCCAACTCGGTTGCCCCCAC
+CGGCGGTGCGCCCGGCAACTTTCTGTCCGCCGGCGGCCACTACCACGTGCCAGGGCATACCGGCACCCCC
+GCCAGCGGCGACCTGGCCTCGCTGCAGGTACGCGGTGACGGTTCGGCGATGCTGGTGACCACCACCGACG
+CCTTCACCATGGACGACCTGCTGAGCGGCGCGAAAACCGCGATCATCATTCACGCCGGCGCCGACAACTT
+TGCCAACATTCCGCCAGAACGCTACGTCCAGGTCAATGGGACTCCGGGTCCCGACGAGACGACGTTGACC
+ACCGGCGACGCCGGCAAGCGGGTGGCGTGCGGTGTCATTGGTTCCGGCTAGCTTGCCTGCCCGCAGGTCG
+GCCGCCCGAATTGATTTCGCAGGCTCACCGCGGCCCACCCTCGGTGTGGAGTGGGAGTTCGCGCTCGTTG
+ACTCGCAGACCCGCGATCTGAGCAATGAAGCCACCGCGGTTATCGCCGAAATCGGCGAAAACCCGCGGGT
+CCACAAGGAATTGCTGCGCAACACCGTAGAGATTGTCAGCGGTATCTGCGAATGTACCGCCGAGGCAATG
+CAGGATCTGCGCGATACCCTGGGCCCCGCCCGTCAGATCGTGCGCGACCGCGGGATGGAGCTGTTCTGCG
+CGGGTACCCACCCCTTCGCGCGGTGGTCGGCCCAGAAGCTCACCGACGCGCCGCGGTACGCGGAGCTGAT
+CAAACGCACCCAGTGGTGGGGCCGGCAGATGCTGATCTGGGGTGTACACGTGCATGTCGGGATTCGCTCG
+GCGCACAAAGTGATGCCGATCATGACGTCGCTGCTCAACTACTACCCGCATCTGTTGGCGCTCTCGGCCT
+CATCACCCTGGTGGGGTGGCGAAGACACCGGGTATGCCAGCAACCGGGCGATGATGTTCCAGCAGTTGCC
+CACCGCCGGGCTGCCGTTTCACTTTCAGAGGTGGGCGGAGTTCGAAGGTTTCGTGTACGACCAGAAGAAG
+ACCGGCATCATCGACCATATGGACGAAATCCGTTGGGATATAAGACCCTCACCCCATCTGGGCACCCTGG
+AGGTGCGGATCTGCGATGGCGTGTCCAACCTACGAGAGCTCGGCGCGCTGGTCGCGCTGACGCATTGCCT
+GATCGTCGATCTGGACCGCCGCTTGGACGCCGGCGAAACGCTACCGACCATGCCTCCCTGGCACGTCCAG
+GAGAACAAGTGGCGTGCCGCCCGCTACGGCCTGGACGCGGTGATCATCTTGGACGCCGACAGCAACGAAC
+GGCTGGTTACCGATGACCTCGCGGATGTGCTGACCCGGCTGGAGCCGGTCGCCAAGTCGCTGAACTGCGC
+CGACGAGCTTGCCGCGGTCTCCGATATCTACCGCGATGGCGCCTCCTACCAGCGGCAGCTGCGAGTGGCG
+CAGCAGCATGACGGCGATTTGCGCGCGGTAGTTGACGCGCTGGTTGCCGAGCTGGTGATTTAGCCGATGC
+GGGCTGGCTGAGTGTGACGTCCGCCAGCCGCGAGGAGATTGAGGTTTAGGTGATGGCCGATTTCGCGCCG
+GTTGAGTTGGCGATGTTCCCGCTCGAGTCGGCGCCGCTGCCCGACGAAGATCTGCCGTTGCACATCTTTG
+AGCCCCGCTACGCGGCGCTGGTCCGTGACTGCATGGACACCGCGGATCCTCGCTTCGGTGTTGTACTGAT
+CTCGCGTGGCCGCGAGGTCGGCGGCGGCGATACGCGATGTGATGTCGGGACGCTGGCCAGGATCACCGAA
+TGCGCGGACGCGGGTTCGGGTCGCTATATGCTGCGCTGCCGGGTGGGCGAACGGATCCGGGTGTGCGACT
+GGCTGCCCGACGATCCGTACCCGCGTGCGAAGGTACGGTTCTGGCCCGACCAGCCGGGGCACCCAGTGAC
+GGCTGCCCAGCTGCTGGAAGTCGAAGACCGGGTTGTGGCGCTATTCGAGCGGATCGCTGCCGCCCGGGGA
+GTTCGGCTGCCGGCCCGTGAGGTGGTATTGGGCTACCCGGTGGTTGACCCAGCCGATACCGGGCAGCGTC
+TGTACGCGCTGGCATGTCGAGTGCCGATGGGCCCGGCCGATCGGTACGCCGTGCTGGCGGCGCCGTCGGC
+GGCCGATCGATTGGTCCGCTTGGGTGACGCGCTGGACTCGGTGGCCGCGATGGTGGAGTTCGAGTTGTCG
+ACGTAACTGCCCTACGCGGTGCGTCTGACCCACTGGGCCTGAACCACATTCACTGCGCCGAGCACCATAT
+ACGGACCCGTCACCGCCGGCAAGCGCATCCGGGTGCGGAACCGGCTCGACAATGGTCAACGCCTTCGCAC
+CATTGCCGACCAGTACCCGCAATTGCTCGACTTCATCAGTGGTCGCTAGGACCGAAGGTCACCCTTGGTG
+CCGAACTTACGCAGCGACGCCACCTGCAGCGGATCCAGCGACGCGCGCACGGTTTCTCGCGCGGTCGCCA
+GGTCGGCGGCGGTGACGTTGGCGGCATCGATGGAACGCCGCATCGCGGTAAGCGCGGCTTCGCGCAGCAG
+CGCCACACAGTCGGCGGCACTATAACCGTCGAGTCCGGCTGCCACCTCGTCCAGGTCGACGTCGGAGCTC
+AGCGGGATCGACTTGCCAGCGGTGCGCAGGATTTCGCGGCGAGCGGCAGCGTCGGGCGGTTCAACGAACA
+CCAGCCGTTCTAGCCGCCCCGGGCGCAGCAGCGCCGGGTCTATCAGATCGGGCCGGTTGGTCGCGCCTAG
+CATGACGACATCCCGCAGCGGGTCAATACCGTCGAGCTCAGTCAGCAGCGCGGCCACCACCCGGTCGGAG
+ACGCCCGAGTCGAAGCTCTGACCGCGCCGTGGCGCCAGAGCGTCCAGCTCGTCGAGGAACACCAGTGACG
+GCGCGGAGTCGCGGGCCCGCCGGAATAGCTCGCGGACTGCCTTCTCCGAGGAGCCCACCCACTTGTCCAT
+CAGCTCCGACCCTTTGACGGCATGCACGCTCAACTGTCCGGTGCTGGCCAGGGCACGAACCACAAAGGTC
+TTGCCGCAGCCGGGCGGGCCGTACAGCAACACCCCGCGCGGCGGTTCGACACCTAGCCGAGCGAAGGTGT
+CGGGGTGCTGCAGCGGCCACAGCACCGCCTCGGTCAGTGCTTGTTTGGCCGCGGCCATGTCACCGACATC
+GTCGAGCGTCACGTCACCCACGGTGACTTCGTCGCTGGCCGAGCGGGACAGCGGCCGGATGACGGTCAAC
+GCACCGAGGAGGTCGTCTTGGTGCAGCATCGGTGGTCGGCCGTCGGCACTGGCTCGAGACGCTGCCCGCA
+GCGCCGCCTCGCGAACCAGCGCAGCCAGGTCGGCCACGACGAAACCCGGTGTGCGGGAGGCGATTTCGTC
+GAGGTTGAGGTCTCCGGTAGGAACCGGATTCAGCAGCGCCTCCAGCAGCGATTTGCGGGTGGCCGCGTCG
+GGCAGCGGCAGGCCAAGCTCCCGGTCGCACAACTCGGGGGAACGCAGCCGGGCATCGAGTTGATCGGGCC
+GTGCTGAGGTGGCGATCAATACCACACCGGCGGTGGCCACCGCGGTACGCAGCTCGGACAGGATCAGCGA
+GGCTACCGGCTCGGCGGCGGCTGGCAGCAGGGCGTCGGCATCGGTGATCAGCAACACACCGCCCTCATGG
+CGAACCGCCTGCACTGCCGAGGCCACGGCTTTGACCCGGTCTCCGGCGGCCAGAGCTCCAATCTCCGGAC
+CATCCAGTGTCACCAACCTTCGGCCGTCGCACACCGCGCGCACCAGCGTCGCCTTGCCCACCCCGGCCGG
+ACCCGACACCAGCACACCCAAATTGGTGCCGGCGCCCAAGGTCTGTAGTAGGTGCGGCTCATCGAGGGCA
+AGCTTGAGCCATTCGGTGAGCTTGGCAGCCTGCGGCTGGGCGCCCTTGAGCTCTTCGATCTGGATCTCCG
+GACTCGAGATGCTCACTTGCCCGGCCGTGGACGTACCCATTGCGGCCGGGACCCCAGCGCCCCAGGTGAC
+CAGCGAGTTGGGCTGCACGCTGACCGGCCCGTCGGGGTCGACGCCGGTAACGGTCAGCAGCTCCGAGGTC
+CAACTGATCCCGACCGCAGCTGCCAATGCGCGGCTGGCAGCCGACGTGGATGTGCCGGGGCCTAGATCGC
+GGGGCAGCAGCGAGACCGCGTCACCGACGGTCATCACCTTGCCGAGTAGGGCCTGCCGCAGCGTGACCGG
+CGGCACCGACTGGGTGGCCAGCGTTGAACCGCTCAGCGTCACCGATCGCGCTCCGTAGACGGTGACCGGG
+CTGACGATCACCTCGGTGCCTTCGCGAAGGCCCGCATTGGACAGTGTGACGTCATCGAGCAGCACCGTCC
+CGACCGCGGTGTCTGCCGCGGCCAGGCCGGCGACCGCGGCGGTTGTCCGAGAGCCGGTCAGCGACACCGC
+GTCCCACTCGCGGATGCCAAGGGCAGCAATGGCATTGGGGTGCAACCGAACGACGCCGCGGCGTGAGTCG
+ACGGCCGAGGTGTTCAGCCGGGCGGTAAGGGTGAGTTGGCGGGCCGGGTCCGGGTGGGTCACAGCCGTCG
+ACCCGGCTTGCGCAGGCCCAGCCGCGCCATCGACGGCCGGTAGGGATGCGCCCGGCGGCTCGCGCGCCGC
+ACCGCGCGCCGTTGCTTGGGCTTGTCGTCCCACACCTCAGGGTGTTGGGCAAGCCAGCGCTGGCTGCGCA
+CCGCGAAAGGAATATGGCACATGTAGGCGATGATGATCACCCAGATCAACAAGTAGGGGGCCAGGACTGC
+GGCCGCCGCGCAGATAGCCAGCACCGCCAGCAGGGCGGCCGCGTAGTTGGGTGGTACCGACACGGCGTGC
+ATCTTTTTCATCGGGATCCCGCTGACCAAGAGTATCGACGTTCCCGTCACCCAAAAGCTGAGGAACCAGA
+CCGAGGTCCACCATCCTTCGCCGAACTGCATTTTGAGGGCTAGCAGGCCGATCATGGAAACCGCGCCCGC
+CGGCGCGGGCATTCCGACGAAGAATTCATGCGCGTAGGCGGGCTGGGTTCCGTCGTCCTGCAGTGCGTTG
+TACCGCGCCAGCCGTAATACCACGCACACCGCGTAGAGCAGCACGACCACCCAACCGACCGGCCACTTCG
+ACAACATCGACACGTAAAGCACCAGCGCGGGTGTCACTCCGAAGTTCACCGCGTCGGCCAGTGAGTCGAT
+CTCTGCGCCCATCCGCGACTGGGCATCCAGGATGCGGGCCACCCGGCCGTCGAGCCCGTCGAGGATGGCC
+GCTGCGGCGATCAGTGCCATCGCGGCCTTCGGCTGGTGCTCGAGCGCAAACTTGATTGCGGTCAGTCCCG
+CGCAAATGGACAGCACCGTCATCGCGCTGGGCAGTATCTGCAGGTTTACCCCTCGCCTGCCGCGGGGCTT
+TCCGATCATCGACATTCGGCCAGCACGGTCTCGCCGGCGACCGCGCGCTGGCCGACGTTGACGATCGGCT
+CTGCGCCCGCTGGCAGGTAGGTATCCAGCCGGGAGCCGAACCGGATCAGGCCGTAGGTGTCACCGATGGC
+CAGCTTGTCTCCGACGTGTGCGTCGCACACAATGCGGCGCGCCACCAGCCCGGCGATCTGCACCGCGACC
+ACCTCGGCGCCGTTGGGCATGCGGATCCGCACACTGGTGCGCTCGTTGTCGTCGCTCGCCTCCGGTAGGT
+CGGCCGACCCGAACCGGCCCGGCCGGTGTTGCACGGCGATCACTTCCCCGCTCACCGGGGCACGTTGCAC
+GTGGGCGTCCAATATCGACAGGAAGATGCTGACTCGCGGTAACGGCGTGTCACCCATGCTGAGTTCGGCC
+GGTGGGGCCGCTGAGTCGATCGCGCAGATCACGCCGTCGGCGGGCGCGACAATGGCAGCCGGCCTGGTGG
+GCGGTACCCGCTGCGGGTGCCGGAAGAAGCCCGCGCAGGCAGCGGCCGCCAGCAGACCCGTGCCGCGCAA
+CCACCGGTAGCGGTGTCCGACGGCCGCAATCGCAAGGCCGGCGGCAATGAACGGCCGCCCGGCCGGATGA
+ACCGGTGGAACGGCGGACCGCACCAGGGCGAGCAGATGTTGCGGGCCGTCGGGGCGGGGGCGTCTGGCCA
+CGGGGTCATCTTACGGAGCTTCGTGCCGCAGGTTGGGTGCACGGCACTAGGATCGGTCCGGTTAGGTCAA
+GTCCCAGACTTGCAGCTGCGTTCCGGCAGCCACCTCCACGACGTCCTCCGGGATGTCCAGAAGTCCGTTG
+GCCGATGCCAACCAACGCAAATGGTGCGACGCCGGTGGGCCGTAGCTGATGACCGTGCCTGCCTGGTGAT
+CGAGTATTGCGCGTCGGAACTGACGTTTGCCGCGCGGCGATGTCAGGCTCGCGGTGAGTACCGCGCTTCG
+GTGCGGCCGGTACGGATCCGGCAGGCCCATGGCCATGCGCAGCGGGGGACGGATGAACACCTCGAAGGAC
+ACCAGCGCGCTGACCGGGTTGCCGGGAAGGGTGACGATCGGCGTACCTGCCACCCGCCCGACGCCCTGGG
+GCATTCCGGGTTGCATCGCCACCTTGACGAATTCGACACCGTGGTCGCCTCCCCGGTAGTCAGCGCTGCC
+GAACGCGTCTTTGACCACCTCGTAGGCTCCGGCACTGACACCGCCGCTGGTGATGATCAGGTCGGCGTCC
+ACCGCGTACCGGTCAAGGATCGCGCCGAACTGCGCGACGTCGTCGCCGGCGGTTGCGGTGGCGACCACAG
+CGGCGCCCGCATCGCGGACGGCAGCGGCCAGCATGATCGAGTTGGACTCGTAGATCTGACCCGGTTGTAG
+GGGCGTGCCTGGCGACGCCAGCTCCGACCCTGTGGAGATCACCAGCACCCGCTGACGGGGGAGCACCGGC
+AGCTCGGCCAAACCCAGCGCGGCGGCCAGGCCGAGCACCGCCGGGGTCACGATCTGGCCGTTGTGCAGCA
+CCGTGGTACCGGCGGCGACGTCTTCGCCCGACCGTCGGATGTGCTTGCCTGGGGTGGCCTGTTGGCGGAT
+CGCCACCGAATCGACGCCGCCGTCGGTGGCTTCGACCGGCACGATCGCCGTCGCACCGGTGGGCACTGGC
+GCACCGGTCATGATCCGGTGCGCAGTCACAGGCTGCAGCGTCAGCATGTCGGCGCGCCCGGCGGGAATGT
+CCTCGGCGACCGGCAACATCACCGGATTTTGCGGTGTGGCACCTGAGGTGTCTTCGGCGCGCACCGCATA
+GCCATCCATTGCGGAGTTGTCGAAAACCGGCAGCGACAGCGGTGCGACCACGTCGCCGCCCAGGACCAGA
+CCTTGAGCCTGGGTCAGCGGAACCGTAATCGGGCGACAGGCGCGGATCATCTCCGCTACGACACGTTGAT
+GCTCCTGGACTGACCGCACCCGGCCATTATCGGTCGTTCAGACTCCGAAGCTGACGCCGGTGAGTTCTTC
+GGAGACGGTCCAGAGGCGGCGCTGCAGATCTTTGTCGTGGGACTGCGCGCTGGATTGGACCACCTTCGGG
+TGACCGCGCTGCTCGCCGAACCCGTCCGGGCCGTAGTATTGCCCGCCCTGCGTGGTCGGATCGGTGGCGG
+CACGCAGTGTTGGCAGGGCGCCCATCTCTGGGCTTTGGAAAAGCAACGGCCCGAGCACGGTAGCGACGGG
+CCGGATAAGTCGCGGCAGGTTGCGAGTCAGCTCGGTGTTGGAGCCGCCAGGGTGAGCGGCGACGGCGATG
+GTGGATTTGCCCGCTTCGCCCAGCCGGCGTTGCAGCTCGTAGGTGAACAGCAGATTAGCCAGTTTGGCTT
+GTCCGTAGGCGGCGACGCGGTTGTAACGGCGTTCCCACTGCAAGTCGTCGAAGTGGATGGCAGCGTGAAT
+CCGGTGGCCCTGGCTGCTGACGGTCACCACCCGCGAACCGGGTACCGGCAGCATGTGGTCGAGTACCAGT
+CCGGTTAGTGCGAAATGACCGAGATGGTTGGTACCGAACTGCAGCTCGAAACCGTCCTTGGTGACCTGCT
+TCGGCGTCCACATCACGCCGGCGTTATTGATTAGCACGTCGATGCGCGGATAGGCCGTGCGTAACGCGTC
+GGCGGCTGCGCGCACCGAGTCCAGCGAGCACAGATCGAGTTGCTGCAGCGTGACGTGGGCGCCTGGGCGG
+GCGGCCATGATGCGGGCCCGGGCGGCGTTGCCCTTCTCGAGATTGCGGACGGCCAACACTACGTGTGCAC
+CGCGGTCGGCAAACACGGCGGCGGTGTGGTAGCCGATGCCGGTGTTGGCGCCGGTGACCACAACGACGCG
+CCCGCTTTGATCGGGGACGTCTGCGGCCGACCATTTACGGGTCTTGTTGTCGTTGGCGGTCATGGGCCGA
+ACATACTCACCCGGATCGGAGGGCCGAGGACAAGGTCGAACGAGGGGCATGACCCGGTGCGGGGCTTCTT
+GCACTCGGCATAGGCGAGTGCTAAGAATAACGTTGGCACTCGCGACCGGTGAGTGCTAGGTCGGGACGGT
+GAGGCCAGGCCCGTCGTCGCAGCGAGTGGCAGCGAGGACAACTTGAGCCGTCCGTCGCGGGCACTGCGCC
+CGGCCAGCGTAAGTAGCGGGGTTGCCGTCACCCGGTGACCCCCGTTTCATCCCCGATCCGGAGGAATCAC
+TTCGCAATGGCCAAGACAATTGCGTACGACGAAGAGGCCCGTCGCGGCCTCGAGCGGGGCTTGAACGCCC
+TCGCCGATGCGGTAAAGGTGACATTGGGCCCCAAGGGCCGCAACGTCGTCCTGGAAAAGAAGTGGGGTGC
+CCCCACGATCACCAACGATGGTGTGTCCATCGCCAAGGAGATCGAGCTGGAGGATCCGTACGAGAAGATC
+GGCGCCGAGCTGGTCAAAGAGGTAGCCAAGAAGACCGATGACGTCGCCGGTGACGGCACCACGACGGCCA
+CCGTGCTGGCCCAGGCGTTGGTTCGCGAGGGCCTGCGCAACGTCGCGGCCGGCGCCAACCCGCTCGGTCT
+CAAACGCGGCATCGAAAAGGCCGTGGAGAAGGTCACCGAGACCCTGCTCAAGGGCGCCAAGGAGGTCGAG
+ACCAAGGAGCAGATTGCGGCCACCGCAGCGATTTCGGCGGGTGACCAGTCCATCGGTGACCTGATCGCCG
+AGGCGATGGACAAGGTGGGCAACGAGGGCGTCATCACCGTCGAGGAGTCCAACACCTTTGGGCTGCAGCT
+CGAGCTCACCGAGGGTATGCGGTTCGACAAGGGCTACATCTCGGGGTACTTCGTGACCGACCCGGAGCGT
+CAGGAGGCGGTCCTGGAGGACCCCTACATCCTGCTGGTCAGCTCCAAGGTGTCCACTGTCAAGGATCTGC
+TGCCGCTGCTCGAGAAGGTCATCGGAGCCGGTAAGCCGCTGCTGATCATCGCCGAGGACGTCGAGGGCGA
+GGCGCTGTCCACCCTGGTCGTCAACAAGATCCGCGGCACCTTCAAGTCGGTGGCGGTCAAGGCTCCCGGC
+TTCGGCGACCGCCGCAAGGCGATGCTGCAGGATATGGCCATTCTCACCGGTGGTCAGGTGATCAGCGAAG
+AGGTCGGCCTGACGCTGGAGAACGCCGACCTGTCGCTGCTAGGCAAGGCCCGCAAGGTCGTGGTCACCAA
+GGACGAGACCACCATCGTCGAGGGCGCCGGTGACACCGACGCCATCGCCGGACGAGTGGCCCAGATCCGC
+CAGGAGATCGAGAACAGCGACTCCGACTACGACCGTGAGAAGCTGCAGGAGCGGCTGGCCAAGCTGGCCG
+GTGGTGTCGCGGTGATCAAGGCCGGTGCCGCCACCGAGGTCGAACTCAAGGAGCGCAAGCACCGCATCGA
+GGATGCGGTTCGCAATGCCAAGGCCGCCGTCGAGGAGGGCATCGTCGCCGGTGGGGGTGTGACGCTGTTG
+CAAGCGGCCCCGACCCTGGACGAGCTGAAGCTCGAAGGCGACGAGGCGACCGGCGCCAACATCGTGAAGG
+TGGCGCTGGAGGCCCCGCTGAAGCAGATCGCCTTCAACTCCGGGCTGGAGCCGGGCGTGGTGGCCGAGAA
+GGTGCGCAACCTGCCGGCTGGCCACGGACTGAACGCTCAGACCGGTGTCTACGAGGATCTGCTCGCTGCC
+GGCGTTGCTGACCCGGTCAAGGTGACCCGTTCGGCGCTGCAGAATGCGGCGTCCATCGCGGGGCTGTTCC
+TGACCACCGAGGCCGTCGTTGCCGACAAGCCGGAAAAGGAGAAGGCTTCCGTTCCCGGTGGCGGCGACAT
+GGGTGGCATGGATTTCTGACCCCGGCGAGAAGTCGCAGCGAGGAGCCCGGTCCCTTTGTGGGGCCGGGCT
+CCTCTGGTTGGGAGCTACGGTACCGAGAACACCACGCAGTCGTGTAGGCAACCTTTGGCCGCTGTGGGCG
+AGTCGGGGGCCGCGTCTCGGTGCAGCAGCGCGCGGATGGGTACGACACCGCAGCGGGCGGTGTCGTCATC
+GGGGCCTGCGTCCGACGCCTGGGCACGGCCGTCGACGATCAGCGAGTAGCCGCTAGGATCGGATGGCGGC
+CACAACAGGGTGACTTCGCTGCGGTGGGCCAGGTTTTGCCGCGTACGACCCCCGATCAGGCCGACGTCGA
+CCACTGCCCGGGGTCCATCGGGGCCGTCGGGGAGTTCGCGCAGCACCGGCTCGACTGCCACCGTGTGCAC
+GCGATGGCCATCATCGACGGTGATCAGGTAAGCGAACGGGTAGTCGGGCAAGGCGGCGGCCAGCCGTTTG
+AGGTCTACCTTTTTGGCACCCACGGATTCGAGGATAGGCGCCCGATGTGTTACTCCGAACCGACCGGCTG
+CCCGATCCGCGGGCTGGCGTAGGCGGATTCGCGGTCGGGGCTCGGGTAGAAGTTCGACTTGGGGATGCCG
+GAGCCGGGGGTACTCGGCTCACGCACGGCGGTATTCCGCAAGCCCGAGTCGTTGCTGCCCGAGTTGACGA
+AGCTCGGGTAGCTGGTGCCAGGGCTTCTAAGGCCCGGGTTTGCGCCCGAGCCAGCCGCGGCACTGCCGCT
+ACCGGGGTTCGGGTTGCCTGAGTCCAGGCCGCCAACAGGAGCACTGGCCGGGGCGGCGACGGGCGTGTTG
+GTCAGGCCCGAGTTGAGGACGTTCGCCAGGCCGTGTTGGAGACCGCCCGTTGATCCGAGGGCGGAGGCGA
+GGATGCCCGAACTCAAAGCCGCCGTGCTCATGCCGCCGGTGGCGTAGCCGGCGGAGCTGACCAAGGCCGC
+CTCCGAGCCAGCCGCGCTTCCTAAGGCGGCGTTTTGCATCCCCGCGTTCCAGAAGCTGGTGTTGAGGCTG
+CCTGCGCTGCCGAGGCCCGCGTTGATTGTCCCCGAGGTCCCGATGCCGCTGTTCAGGGAGCCCGAATTCC
+CGATGCCGATGTTTCCGCTGCCGGAGTTGAATAAGCCGACGTTGCCGGTGCCCGAGTTCCCGAAGCCGAT
+GTTGCCGCTACCCGAGTTGAAGCCGCCGAAACCCATCTGGTGATCACCGGTGATCCCGAACCCGATATTC
+CCGCTACCGGTGTTGCCGAAGCCGATATTCCCGTCGCCGAGGTTGCCGAGGCCCAGGTTGCCGCTGCCGG
+TGTTGCCGCTGCCGATGTTGCCGGTGCCGGTGTTGCCGCTGCCGATGTTGTTGTTGCCGATGTTGTTGTT
+GCCGATGTTGCCGCTGCCGGTGTTGCCGAAGCCCAGATTGATCTGGCCGTTCTTGCCGATGTCGATGCCG
+AGGTTCCGCAAGACCTGCTGCCAGGGCGCCAGTTGTGCGACGGCCGCAGACGCATCGAAGTGGTAACCAG
+CCATCGCCGCCACGTCCAATGCCCACATTTGCTCGTATGCCGCCTCGACGTCCATGAGCGCCGGAGCATT
+CTGCCCAAACCAGTTCGTAGCTGCCAGCAGCTGCATCAGGCCACGATTGGCCGCTACCACTGCCGGCTGC
+ACGGTGGCCGCCAGCGCCGCCTCGAACGCGGTCGCTATTGCCATGGCCTGTGCGGCCGCTTGTTCCGCCT
+GCGCTGCCGCCGTGCTGAGCCAGGCTAGGTACTGGGTTGCGACGGCCATCATCGCCGCCGCGGACGGACC
+CAGCCAGGCGCCACTAGTCAGTTCGGATGTGACGGAGCCAAGCGACGCTATTGACGCGAGCAATTCTTCG
+GCCAGCTCGCCCCAGGCGGTGGCCGCAGCAATTAGCGGTCCCGACCCGGGACCGGCAAACATCAGTGCCG
+AATTGATCTCTGGCGGCAACTACGCAAAATGCGGGCTTGTCACTGATCCAACTTAACTGTCAGCGACCGT
+TGCCGTGGCGGTATCGGCACTTCAATACCACTCATCTTTGGGGTCATCTTTGGAGCGCCCCTAGGAACCG
+CCAGCTTACCTAGTCCCGGGTAGGGGCCGACTGGCGGCCGGGATGCAGCTGAGGGTCTGCCACCTGCCCC
+GTAATGTCGCTGGTATGGCAAGCACCGACGCCGCGGCCCAAGAGTTGCTCCGCGACGCGTTCACCCGGTT
+GATCGAACATGTCGACGAACTCACCGACGGCCTCACCGACCAACTCGCCTGCTACCGCCCGACCCCCAGC
+GCCAACAGCATTGCGTGGCTGCTCTGGCACAGCGCCCGGGTGCAGGATATACAGGTCGCCCATGTGGCCG
+GCGTGGAAGAGGTGTGGACCCGCGACGGTTGGGTGGACCGCTTTGGGTTAGATCTGCCGCGGCACGACAC
+CGGATATGGACACCGTCCCGAGGATGTGGCGAAGGTACGGGCACCCGCCGACCTGCTGTCGGGGTACTAC
+CACGCGGTGCATAAACTGACCCTGGAATACATCGCTGGCATGACCGCAGATGAGTTGTCCCGTGTGGTGG
+ATACCAGTTGGAATCCGCCGGTTACCGTCAGCGCACGGTTGGTGAGCATCGTCGACGACTGCGCTCAGCA
+CCTCGGGCAGGCCGCCTACCTGCGGGGGATAGCCCGATAACGGCGACATCCGCCGGATCGCTGAGGCGAT
+GGTCAGCTACGCCGAAGATCGCCTGCACCGATGGTTACCTGACGCTAGCCGGCAGCGCCGCCCTAGTGGT
+ACCCGGCGTGTTCGTCGCGATGCTGGGCACCATTGTCGCGCCGAGACTGCGGTGAGGGGCCGGGGTGTGC
+GTCCTCGGCTCACCCGAGCGGCAGCTCGGCCAAGATGGTACCGGTGGGCTGTGGTGATCCGGTGCCGGGT
+TCGACGGTGAATGCCAGTGCGGTCGAGGCTCCGAGATCGGTCAGCGTCGCCGTCGTCGAGGGCGTCACCG
+CCGCGGTGCCCATCGTCTCCGCCGACCTCGGCCCTTTGGCCCCTCCCAGCAGCCACATCTGATACACGGT
+TCCCCGGGATGGTGGCGCCACATTGTTCATCACCAGCAGACCTGTGTTGCGGTCGCGGGAGAACACCACC
+GTGGCCGTCCCGGCGCCCAGTGGGCGAGAGACCGTCCGTACGTCCGGCGCCGTCAGAACTTGCTCGGCCA
+CGGTGGGGGGTGGCGATGGCCGGGTCAGCACCCCCAGGTCGAACGCCCCCAGCCCCACAGCGATCGCCGC
+TGCGGACGCAAAGGCTGCCGTACGCCAGCGTGATTGGCGCCTAACCTCGGGCTTGGTCGCATCCAGGATG
+GCCGTCCGCAGATGTGCTGGCGGCTCGGCGGTGGTGGCCGCCGAGACGACGGCCATCGTCTCGCGGACGG
+CTCGAACTTCGTCGTTGAAAGCCGCGGCTACCGGCGAGGGCGCGGCGGCCACCCGTCGGTCGATGTCGGC
+TCGTTCATCGTCGGACACAGCGTTCAGGGCATACGGGGTAGCCAGCTCGAGCAGCTCAAAATCGGTATGT
+TCAGTCATGAGCGCCGCTCTCCCAACGCATCGCTTCGCTCGGCCGGCGCAGTCATGACACGTCCAGGCAG
+TTGCGCAGGCTGCGCAGGGCGTCGCGCATGCGGGATTTGATGGTCGACAGATTGGCCGCTAACCGCCGCG
+AAACTTCGACATACGTCAGCCCGCCGTAGTAGGCCAGTTCGATGCACTGCCGCTGCGTGTCGGTCAACGC
+CTTGAGGCACTCGGTCACCCGGCGCCGCTCATCACCGGCGATCGCCAGGTCGGCGACGACGTCACTCGCG
+GGATCGACGTTGGCCGCACCATAGCGCACTTCCCGCTGGTTGCCGGCTTGCTCGCAACGGACTCGGTCGA
+CAGCGCGCCGGTGGGCCATGGTCAAAAGCCAGGCCAACGCGGAACCTTTGGCGGAGTCAAACTCCGACGC
+GTTCCGCCACACCTCAAGATAGATCTCCTGGGTGGTTTCTTCGCTGTAGCCGGTATCACGCAGCACCCGC
+ATCACCAGTCCATACACCCGCGACTTGGTGTGGTCGTAGAATTCGGCGAATGCGGCCTGGTCGTGACCAG
+CGACCCGGCGCAACAGGGCGTCCAGGTCGCTGCTCAGCCGTGGCGGTCCGGTCATCGATGGGTAGCCTAT
+CGCCAGCCGGCGCCGAGATGGTCAAGCCGGTCATCACCGACGCGCCGATCGCGGTGGCCGGGGCACGAAA
+TAGGCTGTTCGCCTTTGATATTCGGCGAAACCGGGGCGACCCTTCAGGTATCTCTCAGTCAGCCGGGCTC
+CGCTGACGTCCACCAGCAGGTAGGTCATCAGCAGCGGCGAACCCACCGTGGCCAGCGGCGCCCAGTCGTT
+GATCGTGATCAACCACAACCCCCACCAGACACAGGCATCGCCGAAGTAGTTGGGGTGACGCGTCCAGGCC
+CACAGGCCGCGGTCCATGATGACCCCGCGATTGGCCGGGTCGGATTTGAATACCCACAGTTGCCAATCTC
+CCACCGCTTCGAAGGTGATACCGACCAGCCACACGGCTAAGCCCACGCCCCCAACAGCCAGTAACGGCTT
+CGGCGTCGGCCCGGTGACTGCGGAAAGCTGCAGCGGGAATGAGACGAACAACGTCAGGAGGCCCTGTAAT
+CCGAAGACCTTGCGCAATGCCTGCACAGGCGTGGCACCGCGCAGCAGGTCGGCGTAGCGGGGATCCTCCC
+CCTGACCGGCTGTCTTGCGGTACATGTGCCAGCTCAGCCGCAGACCCCAGGTCGACACCAACGCTAGTAG
+CAGCCATCGGCGAACCGGGTCGCCGTGGCCGAGCGTCGCGGCGGCGACGGCGACGGCGACGAAACCCAAG
+CCCCATACCACGTCGACGACGTTGTACCGGCCGATGCGGCGGCCGATCGCAAACGCCACCGAATGCACCA
+CGGCCACAGCCAAAGCCGACACGCTGGTTACCACGACGATGTTCACGGGGGGCCCTCGCGGATCAACGTC
+CACTGGTAGACGTCCAGATAGCCCGACCGGAAGCCCGCCTCCGAGTACGCCAGGTACAGCTCCCACATCC
+GTGCAAACACCTCGTCGAAACCTAAATGCGCCAGCCCATCTCGCCGCTGCATAAATCGTTCCCGCCAGAG
+CCGCAGCGTCTCGGCGTAATGCGGTCGCAGCGAGGCCGCGTCGACGATGCGCAGCCCGGTGTGTTGCCCG
+GTGATGTCGATGATGGCCTGCGTGGACGGTAGCAGTCCGCCAGGGAAGATGTACTTCTGGATCCAGGTCT
+GGGTGTGGCGGGTGGCCAGCATTCGGTGGTGCGGCATGGTGATCGCTTGAATCGCTACCGGGCCACCCGG
+GCGCACCAACTGTTCTAGCGCGGCGAAGTACCGTGGCCACGAACGGTATCCCACCGCCTCGATCATCTCG
+ACTGAGACTACTGAGTCATACTGCCCGTCGACGTCGCGGTAGTCGCACAAGTCGATCTCTACCCGGTGGC
+CAAAGCCGGCCGCGGCGACCCGCTGCCGAGCCAGCCGTTGCTGCTCCACCGATAGGGTCACCGAGCGGAT
+GTGGGCCCCCCGTGCGGCCGCGCGAATGCACAGCTCGCCCCATCCGGTGCCGATCTCGAGAACGTGGCTG
+CCCTGCTGGACCCCGGCCACGTCGAGCAGCCGGTCGATCTTGCGGCGTTGGGCTGCGGCCAACTCGGTCC
+AGGCGGGAGTTGGCTGGGCCAGCAGGTCGGTGAACATTGCGCACGAATACGTCATGGTCTCGTCGAGAAA
+CGCGGCGAACAGGTCGTTCGACAGGTCATAGTGCACGGCTATATTGCGCCGGGCCTGATCTCGGCTGTGG
+TCTGGCCAACTAGGTCGAAAGGTCGGCGTGATCGGCCGCAGCCAGTGCAGCGAGCGCGGTACCAGCTCGT
+CCACCGACCCTGCCAGCACGGTCAACACCCGCGTGAGCTCCTTCGACGACCATTCGCCGGCCATGTAGGA
+CTCGCCGAAGCCGATCAAGCCGTGGCGCCCGATCCGGCGTGCAAGTGCGTCCGGCCGATGGATGAACAGG
+CTGGGTGCGCGCGGATCGGCGGCACCTGTTGCCGTTCCGTCGGAGTAGACCAATCGCAGCGGCAAGTGAG
+TGGCCGTGCGCCGAAGCAGCCGGTTGGCGATTGCCGCCGATGCCGCGGCTAGGGGACCGCGCGGCACCTT
+GGCAACCGCTGGCCAGCGATCCGAATCGATTGCTGCCGACGGTGTCTGGCTGGTTTCGACGGTCATCGCG
+GCACCACCGGAACTCGACGTAGCCACAGTCTGATCCCCTGTATCCTGATGCGCGCGGCCACCACCATCGG
+CGCCAGCGGTGAAATGATTTGCATCATCGCGATCTGTCTTGTCGTTGCCGGTCGCCGCTGCCCACGCAGG
+GTGGCTGTGAATTCCGGGCACACCTGCCGGCGGTCACGGTGCAGCGTCACCGTGACGTCGAGTTCGCGGT
+CGGGCCGTGGTGCCCGTATCAGGTAGTAGCCGGCTAGCTGATGAAACGGCGAAACGTAGAAGTTCTTGGC
+CGTCACCACGGGCAGGTCGGCCGGCGGTAGCAGGTAAGCATGGCGTCCGCCGTAGGTGTTGTGCACCTCG
+GCAATGACATGGCGCAGTTGGCCGTCGCGGTCGTGGCACCAGAAGATGCTCAACGGGTTGAAGACATAGC
+CGAGAACGCGTGCTTGCAGCAGCGCGGTGATACGGCCGTCGGGGACGGCAAGGCCGCGAGCGGCAAAGAA
+GGCGTCCAGCCGGTCACGCAGCGAGCTATGCGGCGGACACGAGAACGGGTCAGCGAAGTGGTCGTCGGCG
+TGGAACCGTGCGAACGGTCGCAGCCACCAGGGCAGCTGGGGGAGGTTGTCGACATCCACGTACCAGCTGT
+AGCTGCGGTATGCGAACGAGTGGTGCACCGGGACTTGTCTGCAGTGGCTGATCGTGGTGCGGTAGATCGC
+CGGCGTCAGGGTTTGAGTCAGCACGCGACCATCGCCTCCTGTGGGATCGCTGCCGGCCAGTCGGCGCCAA
+GGCGCCGGGCCGCCCGCAGACCCGAGGCGGCGCCGTCCTCGTGGAATCCCCAGCCGTGGTAGGCGCCGGC
+GAATACCACCCGATTGTCACCCAGCGTCGGCAATAAGCGTTGGGCTGCAACCGATTCCGGTGTGTACAGC
+GGATGGCTGTAGGTCATCTCGGCGATCACCGAGCTGGGATCAACCCGGTCGTGGCCGCCGAGGGTGACCA
+GATACCGGCGGCCACCGTCGAGGCGCATTAGCCTGCTGATGTCGTAGCTGACCACGACCTGGTGCTGCCC
+GGGTGTCACCAGGTAGTTCCAGGATGCGCGGGCGCGATGGTGGCGGGGCAGGACCGACTCGTCGGTGTGC
+AGCTGGGCGCTGTTGGTGGAGTATGCGATCGCGCCCAGGACCGCGCGCTCGGCCGGTGTCGGCTCGTCGA
+GCAACAGCAGCGCCTGGTCGGGATGGACCGCGACGACGGCCGCATCGAAACGCCGCGACGGCCCATCACC
+CGCGCCCACCAATACCCCGTCCGGCAGCCGGCGCAGCGAGTGCACTGGCGTGCGGGTCGACACCTCGTCC
+AGCTGAGCTGCGATCGCCTGCACGTAGTTGGCGGAACCTCCGGTGACGGTACGCCAGGTTGGCGACCCGA
+ACACCGACAGCATGCCGTGATGGTCGAGGAAGACGAACAGATACCGGGCCGGATAGCGCAAGGCGTCGGC
+CCCGCCGCAGGACCACACGGCGGCGACCAAGGGTGTGATGAAGTAATCGACGAAATACTGCGAGAAGTGG
+TGCCGGCTCAGGAAGGCTTCCAGCGTCTCCGGTTTGTCTTCCGCGTTGTCGGTCTCCTCACGCAGCAGGC
+GAGCCGCGGCGCGGTGGAAGCGGAGAATCTCGGCAAGCATGCACAGATACCGTGGCCGCAGCGATTGCCG
+GCAAGCGAACAGCCCGCGCGCTCCCAGTGCGCCGGCATATTCGAGTCCGATGTCGTCGGCGCGCACCGAC
+ATCGACATTTCCGACTCCTGGGTGGCCACACCCAGTTCGGCGAACAATCGGCACAACGTTGGATAGGTTC
+GGTCGTTGTGCACCAGGAACGCCGAGTCGACGCCGACGACGTCGGTGCCCCGGGGGCCGCCACCGTTGTC
+CAGATAGTGGGTGTGGGCATGACCGCCCAGCCGGCCGTCCGCCTCGTACAGGGTGACTCGGTCCCGTCCA
+GACAGGATGTAGGCGGCGGTGAGGCCGGCGACCCCACTTCCGACAACAGCCACCGATCGTCGGAGTGATT
+GCTGCACATCCTGTATTCGGAGCGGCCGGCTAGACGGACGGGCGGTTCAGCCGAGGCGGTCGCTGCTCAT
+CGCCAAGGGCCGGCCCGCGGGCTGGGTTTCGCTGGGTACGGTCGGGGTCCGGGCGGGCCGGGAACGCACC
+CGCAGCGGCCACCAGAACCAGCGGCCCAGTAGTGCGGCGATGGATGGCGTCATGAACGATCGCACGATCA
+ACGTGTCGAACAGCAAACCCAGACCGATGGTGGTGCCCACCTGTCCGATAACCCGCAGATCGCTGACGGC
+CATGGACGCCATGGTGACGGCGAATACCAGCCCTGCGTTGGTCACGACCTTGCCGGTGCCGCCCATCGAC
+CGGATGATGCCGGTCTTCAGCCCCGCTCCTATTTCCTGTTTGAACCGGGAGACCAAGAGCAGATTGTAGT
+CAGATCCCACCGCCAACAGAACGATGACCGACATCGCAAGCACGAGCCAATGCAGATGGATTGCGAGAAT
+ATGCTGCCAGAGCAGCACCGATAGTCCGAAAGAGGCACCCAGTGAAAGTGCGACTGTGCCCACAATGACG
+GCGGCGGCAATAAAGGCCCGTGTGATGATCAGCATGATGATAAAAATGAGACAGAGGGACGAAATTGCCG
+CGATAAGAAGGTCCCATTGGGCGCCCTCGGAGATGTCGTGGAAGACGGCCGCCGTGCCGGCCAGGTAGAT
+CTTGGCGTCTTCTAGTGGAGTTCCCTTGAGCGATTCCTCGGCCGCGGTACGAATCGCGTCGATACTTTTG
+ATGCCCTCGGGTGATTGCGGATCCCCCCTGTGCAGGATGATAAACCGGGCCGCGTGTCCGTCCGAAGACA
+GGAACGACTTCATGGCGCGCTGGAAGTCTTTGTTCTTGAAAACCTCGGGTGGAAGGTAGAACGAGTCGTC
+GTTCTTGGCGGCGTCAAAAGCCTTACCCATGGCTGTGGCATTGTCGCTCATTTCGAGCATCTGGTCGAAG
+ATTCCGGTCATGGTGCTGTGCATGGTAAGAATCATGGTCCGCATGTTTTCCATGGCCTCAATCTGCGGCG
+GGATCTGCGCGACCATTTGTGGCATGAGGCGATCCATCTCGCGCAAGTCGCCCAAGAGGACGCCTATTTG
+CTCGCTGAGCTTGTCGATTCCGTCCAGTGCATCGAATATCGATCTGAACGACCAACAGATCGGAATTCCG
+TAGCAGTGCTTTTCCCAGTAGAAATAGCTTCGAATTGGTCTCCAGAAATCATCAAAATCCGCGACGTGGT
+CGCGTAATTCTTCGGTGATCTCCTTCATCTCTTCGGTGTCGCCGACCATGCGGTGGGTAGTGCTGGCCAT
+CTCCGCCATCAGGCTATGCATCCGCGTCAACACCGCAATCGTCGTGGCCATCTCGTCGGCCTGCTTCAGC
+ATGTCGTTCGCCCGGTCGCGCTGGTACTTTATGGTCTGCAGCTGACCGGCATTTTGCATGCTGATCTGGA
+ACGGGATCGACGTGTGGTCCATCGTCGTTCCTTCGGGCCGGGTAATTGCTTGCACACGGGAAATGCCCGG
+GACCCGGAAGATGCCTTTAGCCAGCTTGTCCAGGACCAGAAAATCTGCCGGATTCCGCATATCGTGATCG
+GATTCAATCATTAGGATCTCGGGCTTCATCCTGGCCTGAGAGAAATGACGATCCGCGGCCGCATATCCTT
+GGTTGGCGGGTATGAAGTCCGGTAGGTAGTCACGGTCGTTGTAGCTGGTTTTGTATCCAGGCAGGGCGAG
+CAGACCGACTAGGGCGATCGCGCAGGTGGCGACGAGAACGGGCAGCGGCCAGCGAACCACCACGGTACCC
+ACCCGCCGCCAGCCACGGACTTTGAGGAGCCGCTTAGGGTCGAACAGGCCGAACCGGCTGCCGACGTGTA
+GGACGGCCGGACCCAGCGTCAACGCGACCGCCACTGCGACTAGCATCCCCACCGCGCAGGGGATGCCCAG
+GGTTTGAAAGTAGGGCATGCGGGCAAAGCTCAGGCAAAAGGTAGCTCCGGTGATGGTCAATCCAGAGCCC
+AGAATCACGTGGGCGGTCCCGCGGTACATGGTGTAGTAGGCGGCCTCTTTGTCCTCGCCGGCTTGGCGGG
+CTTCCTGGTAGCGCCCGATGATGAATATCCCGTAGTCCGTACCGGCCGCGATTGCCAGCGAAGTCAGCAA
+GCTCACCGCAAAGGTGGTAAGTCCGATAGCCCCGCTATGCCCCAGAACCGCTACGACTCCGCGCGCAGCC
+GTCAATTCGACCCCCACCGTGATCAGCAGGAGAACCACGGTGATTATCGACCGGTAGACGAGCAACAACA
+TAATAAAGATCACGGCGACCGTAACCATGGTGATCCTGGCCATGGATCTATCGCCACTGTGGTGCATATC
+CGCGGCGAGTGCGGATGGTCCGGTCACATAGGCCTTTATGCCCGGCGGCGCGGGCGTGCTTTCGACGATG
+CTGCGTACTGCCTCGACGGATTCGTTGGCCAGCGGCGTGCCTTGGTTGCCGGCAAGTGACAGTTGAACAT
+AGGCGGCCTTGCCGTCGTTACTTTGCACGCCCGCGGCGGTGAGTGGGTCCCCCCATAAATCTTGGACACT
+TTGCACGTGCTTCTTATCGGCCCTCAATTGAGCAACCAGGCCGTCGTAATACTTATGGGCAGCGTCGCCG
+AGGGGTTGGTTACCCTCTATTATGACCATCGCGAAACTGTCGGAATCGCCTTCCTTGAACACCATGCCGA
+TACGTCCCATCGCCTCAAACGACGGTGCATCCTTGGGACTCAGCGACACCGATCGCTCTTGGCCGACAGC
+TTCCAGTGACGGGACAAATACGGTGACAACGACGCAAACTGCCAGCCAGCCAAGGATGATCGGTACCGCA
+AAGGCGTGGATCATCCTGGCGATGAATGGCTTTTCGGGGCGAGCGTTGGTATTGGAGTCGTTCGCGAATT
+TAGTACTCACGCGGACTTCACCAAGCAGTAAGTATAGGCGTTGACTTCGTTGGAAACCCTCTCGGCCCTG
+ACCTTGCCGTCTACCGTGATTCGGCAGCCAATGCTGTCGCTATTACCTTGTGCCACGATATTTCCCATCA
+CCGCCGCGTCGTTTGTCGTGATATGCAATGACCACGGTAGCACCGCTCCATCGACCCGTTGCGGCTCGGA
+ATTGACGTCGAAATAACTAATGTCGGCGACTGTTCCGGGGGGTCCGAAGATCTCGTAAGTCAGGTGTTTA
+GGGTTGAATGGTTTGCTGTTTTCCAGGTTGGTGTCGGAGTACGACGGGCGGTTTTCGGAGCCGAAGAAGC
+CGCGGATCCGGTGCACGGTGAAGCCCCCGACGATGACCACCACCAGGATGACCAGTGGAATCCAAGTCCG
+CATTAGCACCTTGAAAATCTCAGATCCCCTTCACCGGTTGGCAGTGGTACGGCGGACGATACCCAACTTT
+CAAAATCCGTTCGAGCTGGTCGCTACTTGAACGCAACTAAGCCTAGCCTAAGTAAAACATGGTTTTAGGC
+CCGAGCTCTCGACTCCTTACCTCGTTCGCTGGAGTGTAACGCATATCACGTGCGTAACGGCACGCTACGT
+TATCGGCAGCCCTCTTACAAATCACACGGTGTGCGTTATCCTCTGGCGGTGGCGCAACTCGGCTTCCAGC
+GCGCCCGCACCGAGGAAAACAAGCGCCAACGTGCGGCGGCGCTGGTGGAAGCCGCGCGGTCGCTGGCGCT
+GGAGACGGGCGTGGCATCGGTGACGTTAACGGCTGTCGCAGGTCGTGCCGGGATTCACTACTCTGCGGTG
+CGCCGCTACTTCACCTCGCACAAAGAAGTGCTGCTGCACCTCGCCGCCGAGGGTTGGGCGCGGTGGTCGG
+GCACGGTATGCGAGCAGCTGGGCGAGCCGGGGCCGATGTCGGCACCGCGGGTGGCCGAGGCACTGGCCAA
+CGGTCTGGCCGCCGATCCGCTGTTTTGTGATCTGCTTGCCAATCTGCATCTGCATCTCGAGCAGGAGGTG
+GATGTCGACCGGGTCATCGAGGTCAAGCGGACCAGCATCGCAGCCGTGATAGCGCTCGTCGACGCGATCG
+AAAGCGCATTGCCGGCACTCGGGCGTTCTGGGGCATTCGACATCCTGCTGGCCGCTTACTCGCTGGCGGC
+CACCCTGTGGCAGATCGCCAATCCGCCGGAGCGGCTCACCGACGCCTATGCCGAGGAGCCAGAGTTGCTC
+CCACCGGAGTGGAACCTCGACTTTGCTGCCGCGCTTACTCGCCTGCTCACCGCTACGCTTCTCGGCCTGC
+TCGCCGGATCCCCATGCGAATGCCGGTCGCCAACGCGCTGAAGCGGGTGCGGGACGAAGGGGGCGCCGGA
+CTTGGGCCCGCTTGGCGGCGGTAGGTGACCAAACTCACGCTTCTTGGGCGTGCGCCGCAGCCGAACCACG
+ACTATTGCTAGTTGCAAACGATAGTCATAGTCAATTGTTGCCAGACGCACAGCTGGTGTTGGCGGGAGTC
+GCCGATAGAGGAGTGTTCGACATGACGTTGCACGTCGGTGCCGACGGCCTAGAGACCGCAACTACGGCGC
+GCGCCGTGGCGGTCGCTAGGTCCGGAATGGATTGTGTGGCCGGTGATGCGTCAGGGGCGACTTCGTGCCC
+ACGCGGTGAGCTATGACGAGCGCACTGATATGGATGGCCTCTCCGCCGGAGGTGCATTCGGCCTTGTTGA
+GTAGTGGGCCGGGGCCGGGGCCGGTACTGGCCGCCGCCACAGGGTGGTCGTCACTGGGCCGTGAATACGC
+CGCGGTTGCTGAGGAACTCGGGGCATTGCTGGCTGCGGTGCAAGCCGGGGTGTGGCAGGGGCCCAGCGCC
+GAATCATTTGCTGCCGCGTGCCTGCCGTATCTGTCTTGGTTGACGCAGGCCAGCGCCGACTGCGCCGCGG
+CGGCTGCCCGGCTGGAGGCGGTGACCGCCGCCTACGCCGCGGCTTTGGTGGCCATGCCCACCCTGGCCGA
+GTTGGCGGCTAACCACGCGACCCACGGGGCCATGGTGGCGACCAATTTCTTCGGGATCAACACCATACCG
+ATCGCGGTCAACGAGGCCGACTACGTGCGGATGTGGCTTCAGGCGGCCACCACGATGGCCACCTATCAAG
+CGGTCGCGGACTCGGCGGTGCGCTCGATCCCGGACAGCGTGCCTCCGCCGCGAATTCTGAAATCCAATGC
+CCAATCCCAACACTCGAGCTCGAATAATTCCGGGGGCGCGGACCCGGTGGACGACTTCATTGCAGAGATC
+TTGAAGATCATCACCGGCGGTCGCGTGATCTGGGACCCCGAAGCCGGCACTGTCAACGGCCTCCCCTATG
+ACGCTTATACCAACCCCGGCACACTCATGTGGTGGATTGCCAGAAGTCTGGAACTTCTTCAAGACTTTCA
+AGAGTTCGCCAAGCTGCTGTTCACCAATCCGGTGAAGGCTTTTCAGTTCCTTGTCGACCTCATCCTGTTC
+GACTGGCCTACACACATGCTGCAGCTGGCTACCTGGCTGGCCGAGAACCCGCAGTTGCTGGTGGCTGCGC
+TCACCCCAGCCATCTCCGGACTGGGAGCGGTATCGGGGTTGGCCGGGTTGACCGGCCTAGTCCCTCAGCC
+CCCCGTCGTGCCCGCGCCGGCACCCGATGCGGTCGTGCCCACCGTGTTGCCACTCGCCGGGACGGCCACG
+CCGACTACCGCGCCGGCCAGCGCCCCGGCCGCCGGAGCGGCGCCCGGGCCCCCGGCCGGTACCGCCACTG
+CCACATCGGCGTCGGTGCCAACGAGCGCCGGCGGCTTTCCCCCTTACCTCGTGGGCAGCGGTCCAGGCAT
+CGACTTCGACGCGGGGACGCCCGCCGGTTCCAGGAGAGCGCAGCCCGCCGCGGATAACGTCACGGCCGTG
+GCGGCAGCGCAGGTGTCGGCCCGTCATCAGGCACGTCGGCGCCGACGAGCGGCGGCGAAGGAACGTGGCA
+ACGCCGACGAGTTCGTCGATATGGACTCCGGCCCGGCGATTCCGCCGTCGGGCGAGCGGGACGCTTGGGC
+GTCCAATTCGGGCGTGGGCGGGCTGGGGTTTGCCGGCACCGCAAGCAACGAGACGGTGGCAGCGCCGGCC
+GGATTGACCACGCTGGCCGACGATGAGTTCCAGTGTGGCCCACGGATGCCGATGCTGCCGGGCGCTTGGG
+ACTTGGGAACTTGGGACCGCGGGGACTGATTACCCTACAACGCAGCGACGTCGCGCATGATGTCGGTGGG
+TTCGCGCACCGGCGCCCCACAGGTCAGGCAGAACGCGCCCGGGGAACGGGTGAGCCGACCGACTTGAAGC
+AGGACTTTGGCCTCGACGTGCCACAAGCAGGCAATGCACAGAATTTCGACGGTGTTCCCGAATGGGTCCA
+GGTCGGGGTCGTTACATTCGTCTACCGCATGCAGATGCACCACGTAACTCGCCCGGTTGGTGCACCCGGC
+TCCGGACTGGCAGGTGATTCCACCCCAGTCCAGGGCCGCCAGCGTGTGTGGGATCTCGTTGCCGGGCGCT
+TGACTCATGCGCCGCGCTCCAGTGTCCAGGCCATGCGGCCCACGATGTTTACCTCTGCCCCGCAACGGCA
+TGGTATCCCGGCGCGTGGCCGGTGGTGGCTGGGCTACCAAGAGCGAAGTCGGGCATGGCCTTAGTCCTAG
+TGGTACGCGATAGGTCGTCGAATTCCGTGGGTGATGGATATGACTATTTCGTAGCTGGTCGCCAGAATCA
+ATCCGCCGAACGGCGGCTGATGGGCCCAACGGGCTGTCCCCCGAATGGTGGACAACATTTCCGGGTTCGT
+TGCAAACGACCGCGCTTTGACGCCGGTTAGCTTTAGGCCGGACTTAGGCCCAGTTCCACACCGACATGTC
+GCCGGCTGGGTATCCATTGCACACCTCGGTCCCTTTAGCGACGACGCCCTTGTTGTTGAAGAAGATTTTC
+ATGTGATTGACCCAGGCAAACGTCAGCGGATCGCCATTGTAAAAGTGTTCGGAGTAGTCTCGGCGCTCCG
+CCGGTGACAGCGAGAAGAACCAGTGCGCCTTGTTGATCGTCGCTTGCTGAAGGTTTGCATGGTTGTTGAA
+GTCGATCATGTACCGCTGGTAGTACACCGGACTGGTATCCCGCACCGCCGCCAGATATTGTTCGGCGTCG
+CAGGTGGTTGCGATCATCCGGCGAGGTATTGGAAAGTCTTCCGTGGAGTCGGCTGCCGCGCTTTGTGGAA
+ATGTCGCAGCGGCGATGCCGAGAACCAGAAATGCCGCGCCGGCACGCAGGATGGAACTCAGCCGAGACAT
+AGTGGTTACCGTAGCACTTTTGGGGCGCCTCGAGGCGGGCAGACGACAAGGTTCATAGTCTGTCTCACTA
+CATGCTCCCATCAGGAGTGATGACGTGCGTGGGGTCGGGTCGCAGTTCCGGTGGGGCTTGGCTGTAGTCG
+CCGAACGGGCCGTCGCGGCGCTCGACCGCGGCTCGCACACCCTGGGTTTGGGCGGTCCGGATGAACTCGA
+GCGCGTCGGGGGTGTTGCGCATCAGCCCGTCGAGAATGCCGCCCAGCAGCTGGGTGGAGGCCAGGCCCAT
+GTTCTCGTAGGCCTGGTTGACGATCAGTTTCTGGGCTTGCAACTGTGACAACGGGATTCGTGCCAGCTCG
+GTGGCGATCTCGGCGACGCGAGCCTCGAGCCGCTCGAACGGCACCGCCTCGTTGATCAGCTCGGCTTCGG
+CGGCCTGCACACCGGTCAGCGGCCGGCCCGTCAGCGAGTGCCATTTGACCTTGGCAAGGCTGAGTCGATA
+CAGCCACATCCCGGTCAAATAGGCTCCCCACATGCGGCTATACGGGGTCCCGATCACGGCGTCCTCGCTG
+GCGATCACAATGTCGGCACACAGCGCGTAGTCGCTGGCCCCGCCGACGCACCAACCATGCACTTGCGCGA
+TCACCGGTTTGGACGCCCGCCAGATGGCCATGAATTTCTGCGTCGGTCCGGTCTCCCGCGCGGTGACCAT
+GGCGAAATCCTTGCCCGGATCCCATCGGCCGTCGGTCATCATGGCATCGCCCCAATGCTGGAAGCCGCCG
+CCGAAGTCGTAACCGCCGGAGAAGGCGCGGCCGGCACCGCGCAGCACGATGACCTTGATGTCCTGGTCGC
+GCTCGGCCAACCCGATAGCGGCCTCGATCTCGTCGGGCATGGGCGGGACGATGGTGTTGAGCTGTTCCGG
+GCGGTTGAGCGTGATGGTGGCCACCGGCCCGGCCGTCGTGTACAGCAGCGTCTGGAAATCGGGTGTCGGC
+ATAGCAGCAGCGAAGTCACTTCGGCCCTAAGGGTCAAGTGTCTCAGCGGGGATCGTGATAACGCCGCTGG
+TTCGAAGCTTCGGCCAACCCGGGCGCAGGGTTTCGCTAGCTGGCATTTGCATGCCTCGGGCATCGGTGTC
+CGGTTGCGCTCTTTGCTCCGACGTTAGCCGCAGGGCCCTGCGGCTAGGCGCGGCCGGTGCCGTTGGCCGC
+GGCGGCAATCGATGTTGCAGCAGTTACAACGCCAAATGGAGTCTGAGCGCATCGTCGAGTTCGATCAGCT
+CGGCAGGGGAGACGTTGCGCAGCGACGGATCCAACCTGCTGGGCCTGCGCCTTCGAATCGACGGCCAGGC
+CACCGCTCGCTGCCGGCAACAACACCTGGAATGGGGACCTTTTCGGTGTTGCTGGTAACCGGGACAACCG
+GCACCACGCCTCGGTCGAGACGTATCGCGGCAGCGTTGGCCCTGTCGTTGCTGACAATTACCGCTGGCCG
+CCGCATATTTGCCGCGCTGCCGCGGGCCGGATCCAGGTCGACCTGCCAGATCTCACCGCGCAGCATCTAC
+GCCGTTCGCTGCAAACCGCCGACTGCGACGGCAGGCCCACTCTCTTGGCATGCGTCCAATGCTGCGACGT
+CCTCGGTAGACAAGCTCACGCTTGGCTTCATGCCGCAGTCCTACCCATGTAGTAACAGATAGTAATACGT
+AGTAATAGGTAGTAATGCAGTATCAATCGGCTACAACTCGATAGCCACGTTATTTGGGCTAAGTCCACCG
+TTCGTGAATGCCGGTTAGCCGGCCAGCATCCGCCATAGGAACGCGAAACTCAGCGCCGATTTGAATGCGA
+TCTGTGCGTTGTCGGCTGCGCCGGCGTGCCCACCCTCGATGTTTTCGTAATACCAGACGGGGTGGCCCGC
+AGCCTGCAGGGCCGCCGTCATTTTGCGGGCGTGGCCGGGGTGCACCCGATCGTCGCGGGTAGAGGTCGTC
+ATGAGTACTGGCGGGTATTTCCGGTTCGCCGAAATGTTTTGGTATGGCGAATATTCAGAGATGAACTTCC
+AGTCATCCGGGTTATCCGGATCGCCGTATTCGGCCATCCAGGAAGCGCCGGCCAGCAGCAGGTGGTACCG
+CTTCATGTCCAGCAGCGGCACGTCGCAGACCAGCGCGCCGAACTTCTCCGGGTACCCGGTCAACATGATG
+CCCATCAGCAGCCCACCGTTGCTGCCGCCCCGCGCGCCGAGCTGCTCAGCGGTGGTGATGCCGCGGGTCA
+CCAAATCGGTTGCCACGGCGGCGAAGTCTTGGGCGACCTTGTCCCGGCCCTCGCGCATCGCCTGCGTGTG
+CCAGCCAGGCCCGTACTCGCCGCCGCCGCGGATGTTGGCCAACGCATAGGTGCCCCCGCGGGCCAGCCAC
+AGCCGGCCCAGGACGCCGTCATACGTCGGCGTTCTGGATGTCTCGAATCCACCGTAGCCGTTCAACAATG
+TGGGGCCGGGATTGTCCGCGTCGGTGCGTCGCACGACGAAATACGGGATCGATGTGCCATCGTCTGATGT
+CGCGAAATACTGTGTTACAGCCATGTTTTCCGCGTCGAAGAAAGCTGGCGCAGATTTGATCTCTGCTAGT
+CGGCCGTCATCGGTGCCGCGCATCAGCCGCGACGGCGTATCGAATCCACTGGAGTCGAGGAAGAACTCGT
+CGCCGTGGCTGTCGGCGGAGACGATGACGGTGTTGGTGGCGGCGGGGATACCTGAGAGTGGCTCACGTCG
+CCAGCTGCCGGGAGTTGCGATCTCGACGCGGCTCGCCACGTCGGCCAGGGTGACGATCAACAGCCGGTCT
+CGGGTCCAGGCGTATTGGTACAGCGCGGTGTGCTCGTCGGGTTCGAACACCACCTGTAATTCCGCTGAGC
+CGGCAAGGAATTCGTCGTATTCGGCGGCCAGCAGTGAGCCGGCAGTGTACCTGGTGGTGGCCACGGTCCA
+GTCGGTGCGCAGCTCGATCAACAGCCAGTCGCGGTGAATTGACACGCTCGCGTCGGTGGGGGCTTCGATT
+CGGATCAGCTCCGAACCACGCAATTCGTAGACCTCTTCGTTCCAGAAGTCGAGGGCCCGTCCCAGCAGGG
+TGCGCTCGAATCCGGGCGTGCGATCCGCTGACGCGTTGACGCGGACGTCGGTGCCCGCGCCCTCGAAGAT
+TGTCTCCGCATCGGCCAGCGGTTTGCCCCGGCGCCATCGCTTGATCACTCGCGGATAGCCGGAAGTGGTG
+AGCGAGTCGCCGCCGAAGTCGGTGCCCAGCAAGACAGTGTCCGGGTCCTCCCAGGTAATCTGGGATTTGG
+CCGGTGGCAGCTGGAACCCATCCTCGACGAATTCGCGTGTCAGCATGTCGAATTCACGCACAATGGATGC
+ATCCGAGCCGCCCGGGGACAGGCCGATCAGCGCGCGCGTGTAGTCGGGTTCGATGACACCGGCGCCGCCC
+CACACCCACTTCTGGTCGTCGGCGCGGCCCAGTTCATCAACATCGATCAGCACATCCCAGCCCGGCGAGT
+CGGTGCGGTAGCTGTCCAGCGTGGTGCGCCGCCACAACCCGCGGGGGTTGGCGGCATCGCGCCAGAAGTT
+GTAGAGATAGTTGCCGCGCCTGTTCACATAGGGGATTCGGGCATCGGTGTCGAGCACCTCGAGCGCCTCG
+ACGCGCATCCGCTCGAACTCTGCGTCGCAGAACGCCGCCGTTGTCGGCTTGTTGCGCGCGCGTACCCAAT
+CCAGCGCTTCCGCACCGGTGACGTCCTCGAGCCATAGGTAGGGGTCAGCGCCGTCTGGGGCAGGCTCAAA
+TGTCATGGAAGCCATTGTGGCCCCGGCGGTAGTGTGAGCTGTATTACATGATTTTGACGAGGAGCCGAAT
+ACGATGACTGTCTTTTCCCGTCCCGGTTCCGCCGGGGCGCTGATGTCCTATGAATCCCGGTACCAAAACT
+TCATCGGGGGCCAGTGGGTCGCGCCGGTCCATGGGCGCTACTTCGAGAACCCGACGCCGGTGACCGGCCA
+GCCGTTCTGCGAGGTGCCGCGCTCCGACGCGGCCGACATCGACAAGGCGCTCGACGCCGCGCACGCGGCG
+GCGCCGGGGTGGGGCAAGACCGCACCGGCCGAACGGGCGGCGATCCTCAACATGATTGCCGACCGCATCG
+ACAAGAACGCCGCCGCGCTGGCGGTGGCCGAGGTCTGGGACAACGGGAAACCGGTCCGGGAAGCGCTGGC
+CGCCGATATCCCGTTGGCGGTCGATCACTTCCGGTACTTCGCCGCGGCGATTCGCGCCCAGGAGGGCGCG
+CTGAGCCAGATCGACGAGGACACCGTGGCCTACCACTTCCACGAGCCGCTCGGCGTGGTGGGCCAGATCA
+TTCCGTGGAACTTCCCCATCCTGATGGCGGCCTGGAAGCTGGCGCCGGCGTTGGCGGCCGGCAACACGGC
+GGTGCTCAAACCCGCCGAGCAGACACCCGCTTCGGTGCTCTACCTGATGTCGCTGATCGGTGATCTGTTG
+CCGCCCGGGGTGGTCAACGTGGTCAACGGATTCGGCGCCGAGGCCGGCAAGCCGTTGGCCTCCAGCGACC
+GCATCGCCAAGGTCGCGTTCACCGGGGAAACCACCACGGGGCGGCTGATCATGCAATACGCCTCGCACAA
+CCTGATCCCGGTCACCCTGGAACTCGGCGGCAAGAGCCCCAACATCTTCTTCGCCGACGTGCTGGCCGCC
+CACGACGACTTCTGCGACAAGGCGCTGGAAGGCTTCACCATGTTCGCCCTCAACCAGGGCGAGGTGTGCA
+CCTGCCCGTCGCGCAGTCTGATCCAGGCCGACATCTACGACGAGTTCCTGGAGCTGGCGGCGATCCGGAC
+CAAGGCGGTCCGGCAGGGCGACCCGCTGGACACCGAAACCATGCTGGGTTCCCAGGCCTCCAACGACCAG
+CTGGAAAAGGTGTTGTCCTACATCGAAATCGGCAAGCAAGAGGGTGCGGTGATTATCGCCGGAGGCGAGC
+GCGCCGAACTAGGCGGCGACCTGTCCGGCGGTTATTACATGCAGCCGACGATCTTCACCGGCACCAACAA
+CATGCGGATTTTCAAGGAGGAGATCTTCGGGCCGGTGGTCGCGGTGACGTCGTTCACCGATTACGACGAC
+GCGATCGGCATCGCCAACGACACCCTCTACGGCTTGGGTGCCGGTGTGTGGAGCCGCGACGGCAACACTG
+CCTATCGGGCCGGGCGGGACATCCAGGCCGGCCGGGTGTGGGTCAACTGCTACCACCTCTACCCCGCGCA
+CGCGGCGTTCGGCGGCTACAAGCAGTCCGGCATCGGCCGGGAGGGCCACCAGATGATGCTGCAGCACTAC
+CAGCACACCAAGAACCTGCTGGTGTCCTACTCGGATAAGGCGCTGGGGTTCTTCTGATGAACGCTCCCGC
+GGGGGTGCTCATCACCGCCGAGGCCGCCGCGCTGCTGGCTGGGTTACAGGACCGGCACGGTCCGGTGATG
+TTCCACCAATCCGGCGGCTGCTGCGACGGGTCCGCGCCGATGTGCTACCCGCGGGCGGACTTCCTGGTCG
+GTGACCGCGACATCTTGCTGGGTGTGTTGGACGTCGGGGAAGACGGCGTGCCGGTGTGGATTTCGGGCCC
+GCAGTACCAGGCCTGGAAGCACACCCAGCTGATCATCGACGTGGTGCCGGGCCGCGGTGGCGGGTTCAGT
+CTGGAAGCGCCCGAGGGCGTGCGCTTTCTCAGCCGAGGTCGGGTGTTCAGCGACGCCGAAAAGGCGATGC
+GGGAGGCTGCGCCGGTGATCACCGGCGCAGCCTACGAGTGCGGCGAACGACCGTTAGTGCGGGGTCTTGT
+CGTCGATCTCGACGATCCAGATGCCACGCCGGGAGTGTGCCGCGCCAGTCGGCGGTAGCCGCAGTAAGGT
+CGTAGACCGTGATCCCCCTTCCGCGGTCATGGCAGCTGACCAGCGCGATGCTGGTTGGTAATGCGATCGG
+ACTGCTAGCGGGGGTGGCGTGCAGCGTGCTGGTGCATGCCCGGATCCGTCCGGACATCGTCATCGCAATG
+GTAGTCGGGATTCCCAGCGCGATCGGGCTGCTGGTCATCCTGTTCTCCGGACGTCGATGGGTGACGATGC
+TGGGCGCGTTCATCCTGGCGTTGGCGCCGGGTTGGTTTGGTGTGCTGGTTGCGATCCAGGTGGCGTCCAG
+TGGCTGACAACGATTACCGGTCGGCACCCGGAACCGAGCCGTTTGTGCCCGATTTCGACACCGGCGCACA
+CTCGCAGCGGTTCCTCTCGTTGGCCGGCCAGCAGGACAGGGCGGGGAAATCCTGGCCAGGCTCGACGCCG
+AAGCCGCAGGAGGACCCCGTGGGTGTCGCGCCTTCGGCCAGCGTCGAGGTGCTGGGGTCCGAGCCGGCCG
+CCACGCTAGCGCACTCGGTTACAGTACCCGGTCGATATACCTACCTGAAGTGGTGGAAGTTCGTTCTAGT
+GGTCCTCGGCGTATGGATCGGTGCTGGCGAGGTCGGCCTGAGCTTGTTCTACTGGTGGTATCACACACTC
+GACAAGACGGCCGCCGTGTTCGTCGTCCTGGTCTACGTCGTCGCGTGCACCGTCGGTGGCTTGATCCTGG
+CGCTGGTGCCGGGCAGGCCACTGATCACGGCGTTGTCCCTCGGAGTGATGTCGGGGCCGTTTGCCTCGGT
+CGCCGCCGCGGCGCCGCTCTACGGCTACTACTACTGCGAGCGGATGAGTCATTGCCTGGTCGGCGTCATT
+CCGTACTAGTCGGTTGTCGGACTTGACCTACTGGGTCAGGCCGACGAGCACTCGACCATTAGGGTAGGGG
+CCGTGACCCACTATGACGTCGTCGTTCTCGGAGCCGGTCCCGGCGGGTATGTCGCGGCGATTCGCGCCGC
+ACAGCTCGGCCTGAGCACTGCAATCGTCGAACCCAAGTACTGGGGCGGAGTATGCCTCAATGTCGGCTGT
+ATCCCATCCAAGGCGCTGTTGCGCAACGCCGAACTGGTCCACATCTTCACCAAGGACGCCAAAGCATTTG
+GCATCAGCGGCGAGGTGACCTTCGACTACGGCATCGCCTATGACCGCAGCCGAAAGGTAGCCGAGGGCAG
+GGTGGCCGGTGTGCACTTCCTGATGAAGAAGAACAAGATCACCGAGATCCACGGGTACGGCACATTTGCC
+GACGCCAACACGTTGTTGGTTGATCTCAACGACGGCGGTACAGAATCGGTCACGTTCGACAACGCCATCA
+TCGCGACCGGCAGTAGCACCCGGCTGGTTCCCGGCACCTCACTGTCGGCCAACGTAGTCACCTACGAGGA
+ACAGATCCTGTCCCGAGAGCTGCCGAAATCGATCATTATTGCCGGAGCTGGTGCCATTGGCATGGAGTTC
+GGCTACGTGCTGAAGAACTACGGCGTTGACGTGACCATCGTGGAATTCCTTCCGCGGGCGCTGCCCAACG
+AGGACGCCGATGTGTCCAAGGAGATCGAGAAGCAGTTCAAAAAGCTGGGTGTCACGATCCTGACCGCCAC
+GAAGGTCGAGTCCATCGCCGATGGCGGGTCGCAGGTCACCGTGACCGTCACCAAGGACGGCGTGGCGCAA
+GAGCTTAAGGCGGAAAAGGTGTTGCAGGCCATCGGATTTGCGCCCAACGTCGAAGGGTACGGGCTGGACA
+AGGCAGGCGTCGCGCTGACCGACCGCAAGGCTATCGGTGTCGACGACTACATGCGTACCAACGTGGGCCA
+CATCTACGCTATCGGCGATGTCAATGGATTACTGCAGCTGGCGCACGTCGCCGAGGCACAAGGCGTGGTA
+GCCGCCGAAACCATTGCCGGTGCAGAGACTTTGACGCTGGGCGACCATCGGATGTTGCCGCGCGCGACGT
+TCTGTCAGCCAAACGTTGCCAGCTTCGGGCTCACCGAGCAGCAAGCCCGCAACGAAGGTTACGACGTGGT
+GGTGGCCAAGTTCCCGTTCACGGCCAACGCCAAGGCGCACGGCGTGGGTGACCCCAGTGGGTTCGTCAAG
+CTGGTGGCCGACGCCAAGCACGGCGAGCTACTGGGTGGGCACCTGGTCGGCCACGACGTGGCCGAGCTGC
+TGCCGGAGCTCACGCTGGCGCAGAGGTGGGACCTGACCGCCAGCGAGCTGGCTCGCAACGTCCACACCCA
+CCCAACGATGTCTGAGGCGCTGCAGGAGTGCTTCCACGGCCTGGTTGGCCACATGATCAATTTCTGAGCG
+GCTCATGACGAGGCGCGCGAGCACTGACACCCCCCAGATCATCATGGGTGCCATCGGTGGTGTGGTTACC
+GGCTACATCCTCTGGCTGGCGGCGATCTCCGTCGGCGATGGTCTGACGACGGTGAGTCAATGGAGTCGCG
+TGGTGTTATTGCTGTCGGTCCTGGTGGCGGTGTGCGGCGCGGCGGGCGGCTTGCGGCTGCGCAGCCGCGG
+CAAGCTCGCGTGGTCGGCGTTTGCTTTCAGTTTGCCGATTCCTCCCGTGGTGCTGACCGTGGCGGTGCTG
+GCCGACATCTACCTTTGACGGCTACTGTGGGTTGTCCGGCGGGATGGCCAGGGCGGTGATCGTTGCGGCG
+ATCGCGTCGTATTGGGTTGCGAGTAAACAGAATTCGATCAACAGGCGCGGATCGAGGTGAGTTGCCAGCC
+GCTCCCAGGTGCCCGCGGTGATCGTGCGATCCTTGATCAATTCATCGGTAGCCTGTAGCAGCGCCTGTTG
+GCGGGCGCTGAGCACTTTTCGCGGTCCGTCTCCATCTGGAACGTCGGGCCAGGCGAATATCGTGGCCTGG
+GTGTTGGCGTCTAGGCCCCGACGGCGCGCCATTCGGCGATGATGCTGAAGTTCGTATTCGCAAGATCGTA
+GGTGTGCGACCCGAAGGATCACCAACTCGGTATCGACGCCGGGCAGCCGCCCGTGCAGTAGTCGGCCGGT
+GTAGATGGCAAAGGTCCAGAACAAGTACTGGCGGTAGCCCAGCGTGGTGAACAGGTGCATCTGCGGTGCC
+CCAACCGCACGTGCGGCCAGCTTGGCCACCAGCCAGTTGACCGGCCCCAGCTGGCGGAACTTCCCCGGGG
+AGATACGCGCGACTTGGCCGTTCTGACCGGTCATAGTTGTTTCACCAGATACGGGGACACCGTGCTGCGG
+TGTTCGTCGAGATCCAGTGCCCGCCCCAAGGCGGGGAAGGCGCGTTGCGGACAGTTGTCGCGTTCGCAGA
+CGCGGCAACCGGCGCCGATAGGTGTGGCCGCAGTATTCGGGTCACCCGACAAGTCGAGTCCTTCCGAGTA
+GACGAGCCGGTGCGCGTGGCGAAGTTCGCAGCCCAGCCCGATCGCGAAGGTCTTACCGGGCTGACCATAC
+CGGGCGGCCCGGAGCTCAACGGTGCGGGCCACCCACAGGTAGTTGCGGCCGTCGGGCATCTGGGCGATTT
+GCACCAAGATCTTCCCCGGGTTGGCAAACGTTTCGTAGACGTTCCACAGCGGGCAGGTGCCGCCGCTGGA
+GGAGAAGTGAAAGCCGGTGGCCGACTGACGTTTTGACATGTTTCCCGCTCGGTCCACCTGGACGAAGGTG
+AACGGGACCCCGCGCATCGAAGGCCGTTGTAGTGTCGACAGCCGGTGGGCGATGGTCTCGTAGCTCACCG
+AGTAGAACGCCGACAGCCGCTCGACGTCGTAGCGGAAATTCTCGGCGACGTCGTGGAACTGGCGGTAGGG
+CAGCACGGTGGCCGCGGCGAAGTAATTAGCCAGGCCCAGCCGGGCCAACGTCCGCGACTCGGCGCTGGTG
+AACTTGCCGTCGGTGACCATGGCGTCGATGAGGTCGCCGAACTCGAGATAGGCCAACTCGGCGGCCATCT
+TGAACACCTGCTGGCCCGGGGAGAGGTGACTGCTGATCTCCAGCGTGTTGGTCGCGGGGTCGTAGCGGTG
+CAGCACGGTGTCACCGAGGTCGATGCGCTTGTTGATGCGTACTCCGTGCACCTCGGTGAGCCGGCGGGTC
+AATTCGCGGGCCAGGTCGCCGTGGTGCATCCGCATCTGGGCCGTGAGGTCTTCGGCCGCGGTGTCCAGCG
+CATGTAGATAGTTCTGGCGTTGGTAGAAGTAGTCGCGCACCTCTTCGTGCGGCATGGTGATCGACCCTCG
+GCCACTGCCGTCGGAGAACCGCTCCTCGGTCGCGGCGGCCAGCTGCGCGGTGGTGATCCGGTAGCGCCGA
+TGCAGGTTGACCACCGCGCGGGCCAGCCCGGGATGAGCGCTGACCATTTCGGCCACTTCATGCGGGTCGA
+TGGCGATGTCTAGATCGCGGTCCAGGGTCACCTCCCTGAGTTCGGCAACCAGCCGGGTGTCGTCCTGGGA
+GGCAAAGAACGTCGCGTCCACCCCGAACACTTCGGTGATGCGCAGCAGCACGGCCACGGTCAGCGGCCGG
+ACGTCGTGTTCGATCTGGTCCAGATAGCTCGGCGAGATCTCCAGCATCTGGGCCAGCGCGGCCTGGCTGA
+ACCCGCGCTCGTTACGCAGTTGGCGGACCCGCGAGCCGACGTAGGTCTTGGACACCCAACCGAGCGTACC
+GGGTGTTGTGAAGACGCCATTCGCAGAGTTAGCAAGCGTGCTGCGATTGGTGTTTCCGCCACGGCGTTGG
+CATGATTCGCACCGGGACTCAAGGGTGAGCCTGAGGTACACGCGAGGAGGAAATGGGGAGAACGCCGTGA
+GCCTCGACAAAAAATTGATGCCCGTGCCCGACGGTCACCCCGACGTGTTCGACCGAGAATGGCCGCTGCG
+CGTCGGCGACATCGACCGCGCGGGCCGGCTGCGGCTGGACGCGGCTTGTCGGCACATCCAGGACATCGGT
+CAGGACCAACTGCGCGAGATGGGCTTCGAGGAGACCCACCCGCTGTGGATCGTCCGCAGGACCATGGTGG
+ACCTTATCCGGCCGATCGAGTTCGGCGACATGCTGCGGTGTCGGCGCTGGTGCTCGGGCACCTCCAACCG
+GTGGTGTGAGATGCGAGTTCGTGTCGATGGCCGCAAGGGCGGCCTGATCGAATCCGAGGCGTTCTGGATC
+CACGTCAACCGGGAAACCGAGATGCCGGCCCGCATTGCCGACGACTTCCTCGCGGGTCTGCACCGGACCA
+CGTCTGTTGATCGGCTGCGCTGGAAGGGCTATCTGAAGCCGGGCAGCCGGGATGATGCGTCGGAGATCCA
+CGAGTTCCCGGTCCGGGTCACCGATATCGACTTGTTCGACCACATGAACAACGCTGTCTATTGGAGTGTG
+ATCGAGGACTACCTGGCGTCGCATGCAGAGCTGCTGCGGGGCCCTTTGCGGGTGACCATCGAGCATGAGG
+CGCCGGTTGCGCTCGGCGACAAGCTGGAGATCATCTCCCACGTTCACCCGGCTGGTTCGACCGAGATATT
+CGGCCCGGGGTTGGTCGACCGCGCTGTTACAACGCTCACATATGTGGTTGGCGACGAGCCCAAGGCAGTC
+GCCTCGCTGTTCAATCTGTGACCGGATCCGCAGGACGTCGATCCGTGGGTTTACCTGCGGATTTGTCATT
+ACTGGCGGGTAGCTTCTGAAACGGTTCAGTTTTTGGGCGACTTCGCAAAATTTGCAAAAAGTCCGCAGGC
+CGTTGCCGAAATTCGCAAGTGAAATGGGTGGACCAGCGTTGACACGCTGTGCCATGGTCGAGTTAGCACA
+CCAGTGAAGCTGCGCCGTTGACACCGCCTGGACGACGGTAGGGCGTCAGCGTTTTCGGCAATGAAAGACC
+GTTAAGGAGTTGTCTATGTCTGTCGTCGGCACCCCGAAGAGCGCGGAGCAGATCCAGCAGGAATGGGACA
+CGAACCCGCGCTGGAAGGACGTCACCCGCACCTACTCCGCCGAGGACGTCGTCGCCCTCCAGGGCAGCGT
+GGTCGAGGAGCACACGCTGGCCCGCCGCGGTGCGGAGGTGCTGTGGGAGCAGCTGCACGACCTCGAGTGG
+GTCAACGCGCTGGGCGCGCTGACCGGCAACATGGCCGTCCAGCAGGTGCGCGCCGGCCTGAAGGCCATCT
+ACCTGTCGGGCTGGCAGGTCGCCGGCGATGCCAACCTGTCCGGGCACACCTACCCCGACCAGAGCCTGTA
+TCCCGCCAACTCGGTGCCGCAGGTGGTCCGCCGGATCAACAACGCACTGCAGCGCGCCGACCAGATCGCC
+AAGATCGAGGGCGATACTTCGGTGGAGAACTGGCTGGCGCCGATTGTCGCCGACGGCGAGGCCGGCTTTG
+GCGGCGCGCTCAACGTCTACGAGCTGCAGAAAGCCCTGATCGCCGCGGGCGTTGCGGGTTCGCACTGGGA
+GGACCAGTTGGCCTCTGAGAAGAAGTGCGGCCACCTGGGCGGCAAGGTGTTGATCCCGACCCAGCAGCAC
+ATCCGCACTTTGACGTCTGCTCGGCTCGCGGCCGATGTGGCTGATGTTCCCACGGTGGTGATCGCCCGTA
+CCGACGCCGAGGCGGCCACGCTGATCACCTCCGACGTCGACGAGCGCGACCAGCCGTTCATCACCGGCGA
+GCGCACCCGGGAAGGCTTCTACCGCACCAAGAACGGCATCGAGCCTTGCATCGCTCGGGCGAAGGCCTAC
+GCCCCGTTCGCCGACTTGATCTGGATGGAGACCGGTACCCCGGACCTCGAGGCCGCCCGGCAGTTCTCCG
+AGGCGGTCAAGGCGGAGTACCCGGACCAGATGCTGGCCTACAACTGCTCGCCATCGTTCAACTGGAAAAA
+GCACCTCGACGACGCCACCATCGCCAAGTTCCAGAAGGAGCTGGCAGCCATGGGCTTCAAGTTCCAGTTC
+ATCACGCTGGCCGGCTTCCATGCGCTGAACTACTCGATGTTCGATCTGGCCTACGGCTACGCCCAGAACC
+AGATGAGCGCGTATGTCGAACTGCAGGAACGCGAGTTCGCCGCCGAAGAACGGGGCTACACCGCGACCAA
+GCACCAGCGCGAGGTCGGCGCCGGCTACTTCGACCGGATTGCCACCACCGTGGACCCGAATTCGTCGACC
+ACCGCGTTGACCGGTTCCACCGAAGAGGGCCAGTTCCACTAGTCTGCCGAGCAGACGCAAAAGCACCCTT
+TTGCGGCGCAAAAGTGGCGCTTTTGCGTCTGCTCGCGCATTTGAGGAGGAACAGTGAGCGATGCGATCCA
+GCGGGTAGGGGTTGTCGGGGCCGGGCAGATGGGGTCCGGCATCGCCGAGGTCTCGGCTCGCGCCGGCGTC
+GAAGTGACGGTGTTCGAGCCGGCCGAGGCGTTGATCACCGCGGGACGCAACCGCATCGTGAAGTCGCTGG
+AGCGGGCCGTCAGCGCCGGCAAGGTAACCGAGCGCGAGCGTGACCGCGCCCTCGGCCTGTTGACCTTCAC
+CACCGACCTCAACGACCTATCCGATAGGCAACTGGTGATCGAGGCCGTTGTCGAGGACGAGGCCGTCAAG
+TCCGAGATCTTCGCCGAGCTCGACCGGGTCGTCACCGATCCGGACGCGGTGCTGGCGTCGAATACCTCCA
+GCATCCCGATCATGAAGGTCGCCGCGGCCACCAAGCAGCCGCAACGGGTTCTTGGCCTGCATTTCTTCAA
+TCCGGTCCCGGTGCTGCCGCTGGTCGAGTTGGTGCGCACGCTGGTCACCGACGAAGCCGCCGCCGCGCGC
+ACGGAGGAGTTTGCCAGTACTGTGCTGGGCAAACAGGTCGTGCGTTGCTCCGACCGCTCCGGATTCGTGG
+TCAATGCGCTCCTGGTGCCGTATTTGCTGTCGGCGATTCGGATGGTCGAGGCCGGGTTTGCCACCGTCGA
+AGATGTCGACAAGGCCGTTGTTGCGGGGTTATCGCACCCGATGGGTCCGCTGCGGCTTTCCGATCTTGTC
+GGCCTAGACACCCTCAAGCTGATCGCGGACAAGATGTTCGAAGAATTCAAAGAACCGCACTACGGGCCCC
+CTCCGCTGTTGCTGCGTATGGTTGAGGCGGGCCAGTTGGGAAAGAAATCGGGTCGAGGTTTCTACACGTA
+CTGAAGTGTATGAACGGCCCCCAGGCTTGACGCAAGGCGAGATCACAGACCGAGACGGTGTGGTTACGAT
+CGTGTGACAGCCGTTGCGTACATCGGGTAGTATTTCCGCGATCAACAGATGAGAGGTTCGGCCGGCATGA
+CTGAGTTAAGGCCCTTTTACGAAGAGTCGCAATCGATTTACGACGTTTCCGACGAGTTTTTCTCACTGTT
+TCTAGACCCCACGATGGCTTACACCTGCGCGTACTTCGAGCGTGAGGACATGACTCTCGAAGAAGCGCAA
+AACGCGAAGTTCGATTTGGCGCTGGACAAGTTGCATCTTGAGCCCGGGATGACGCTGCTCGATATTGGCT
+GCGGCTGGGGTGGTGGGCTGCAACGAGCGATCGAGAACTACGATGTGAACGTCATCGGTATCACGCTCAG
+TCGCAATCAGTTCGAGTACAGCAAAGCGAAATTGGCGAAAATTCCCACCGAACGCAGCGTCCAGGTGCGG
+CTGCAGGGCTGGGATGAGTTCACGGACAAGGTCGACCGTATTGTCAGCATCGGTGCCTTCGAAGCATTCA
+AAATGGAGCGTTATGCGGCATTCTTTGAGCGTTCCTACGACATACTTCCAGATGACGGCCGGATGCTGCT
+GCACACAATTCTGACCTATACGCAGAAGCAGATGCATGAGATGGGCGTCAAGGTGACGATGAGCGATGTG
+CGGTTTATGAAATTCATCGGCGAAGAAATTTTTCCGGGCGGACAGTTACCGGCGCAGGAAGACATCTTCA
+AATTTGCGCAGGCGGCGGACTTTTCGGTGGAGAAGGTGCAATTGCTGCAGCAGCATTACGCTCGGACGCT
+AAACATCTGGGCGGCGAATCTGGAGGCTAACAAGGACCGCGCCATTGCTCTTCAGTCCGAGGAGATTTAC
+AACAAATACATGCACTATCTGACCGGATGTGAGCACTTCTTCCGCAAGGGCATCAGCAACGTGGGACAGT
+TCACACTGACCAAGTAGCCCATCGCCGCCCGAGCACCCCAGGGGTTGCGGAGCTCACGCCGGGTGTGGCT
+TGACGCCCGGGCACCGGCCGGTGGGTAGCCAGCGCGCTTTGTCCGGTTACTTTTCGAGTGTGAACTGGTC
+GACGTCGGTGTAACCCTGGCGGAACAGCTTCGCGCAGCCGGTCAGGTACTTCATGTAGCGGTCGTAGACA
+GTCTGCGACTGGATCGCGATGGCCTGATCTTTGTTGGCCTCGAGCGCTGTGGCCCACATGTCCAGCGTCC
+TGGCGTAGTGCAGCTGCAATGACTGGACCGCGGTGACCCGGAAGCCGACCTTCTCGGCGTACTCGTGCAC
+CGTCGGGATGGACGGCAGCCAGCCACCGGGGAAGATCTCGGCCAGGATGAATTTGGTGAAGTGAACCAGT
+TCGTGGGTCAACGTCAGGCCCTTTTCCCTGCCTTCTTTGAAGGTGGGGCGCACGATGGTGTGCAGCAACA
+TCTTGCCGTCGGCCGGCAACGTGCGGTGGGTCACCTCGAAGAAATGGTGGTAGCGCTGGTGGCCGAAGTG
+CTCGAATGCGCCGATCGAGACGATGCGGTCGACGGGCTCGTCAAATTTCTCCCATCCCTCCAGCAACACT
+CGTCTGGAGCGGGGGGTGTCCATTTGGTCGAACATTTTCTGGACATGACCGGCCTGGTTCTCCGACAACG
+TCAGGCCCACGACATTGACGTCGTATTTCTCGATGGCGCGCCGCATGGTCGCGCCCCAGCCGCAGCCGAT
+GTCCAGCAACGTCATCCCGGGTTCGAGGTTCAGCTTGCCCAGGGCCAGGTCGATCTTGGCGATCTGGGCC
+TCCTGCAGCGTCATGTCGTCGCGTTCGAAGTAGGCACAGCTGTAGGTCTGGGTGGGGTCCAAGAACAGCC
+GGAAAAAGTCGTCGGAGAGGTCGTAATGAGCTTGCACGTTTCCAAAATGCGGCGTGAGCTGCACGGACAT
+ACCGATTGAGCCTTTCTGTGTTCCGAGGCCCGCATCCGCTTGCCTCGACGCACCCCTGATCTATCCCCGA
+TGCATCCCTTGCATGCTAGCTGCTGAAAGGCGGCCCAGTCGCAATCGGCGCCATGACCAGCTGTCGCAGC
+CGTCAGCGAAAATCACCAGGCGCGCCGCCAGGCACCGATCGCCAGGCCCACAACCAGCAGCGCACCGGCC
+TGACGCACGTGCAGCCAGGCCAACGCGGCATACCACAGCGGCCACACCGGAAACGCCGGTGGCGGCTGCT
+GGGGCCGCCGTCGCAGGAAATAGGGCCACACTTTCGCCAGCCGGGGCAGCGCCCCGGCGACCAGCAACGC
+GGCCAGGGCATGGCAGCCAGCATGACGTTTACGGCGATAAGTAGGTAGAAGCCGACCATCATGGCCAGTG
+TCACGGTGCGCGCGCACGTTTCGCCGAGTAGCACCGGCAGCGTTCGGATACCCAGCGGTTCGTCGTAACC
+GATCTTGTCGATGTGCTTACCCATCAGCACCGTGGTGCACAACAGCCCGTAGGGGAGCGACGCCAGCACG
+ACCTCCCAACCGCCCGCGCCCACCGCGGCGTAGTAGGTTCCAGCGCACGCTCGGGTGAGCCGCAGCTGGT
+GGTTCGTCGAGGCGTGGTATATGCGGCACGGTTGGCCCCGGTAGCGGCCGGGTGCTGGGCATAGCGGGCG
+CGCGCGTAGGTGGCGCTGTCAGTACCGACATCGGTGTCGTAGAGATCGTTCATAAGGTTGTTGGCGATGT
+GCGGCGCATGTGATTCCCACCACAGGACGAGCCAGCGCCAATCCAAGCCAGGCTCGCCGATCGCCAACAG
+CCCCGCGACCAGGCCGGAGACCAGGGTCATCGGCAGCACTGCGGCCCGGGTGACGACGAGCCACCGGGTG
+ACCGTGTCGGTCGGCCCGTCAGCTGGCGGGTTGGTGGTGCGAAGTGCGTAGGCCCACGATCTGAGCCGGG
+AGCCCGCGCCCGCGTCGGGCATCCCTAAAGCCTAGACCTGCCCCCAGGCAGGCACGATCGGCGAAGGATG
+CGGCTGCTCGCGAAACTTCTCCAACGATCCGCCGGCCTCGACGATGCCGCACAGTGCGCTCCAGCTCAGC
+ATCGTCAGGTAGTCGATCAGTTCGTCACTGCTCATGCGCGGGTCTGACATCCAGGAGTGGGTGGCCAGCT
+GCACGCCGCCCACGATCAGATATGCCCACGGCTCGACTCCGCCGGTGTCCATCCCGGCTTCTTGCATGCG
+GCGGCGCAGCATCACCGCGAGCATGCGGGCAATGATTCGCTCCGAGTCGGCAATCACTTTGCTTTTGCTG
+GCCGAGCTATTCGCCATCACGAACCGATACGGCTCCGGTTGGGCCGCCACGGTCTCGACATAGACCCGGA
+TGATTTCGCGGGTCAGTTCGAAACCATCCATATCGGCCGACAGCGCAGCGATCATGTTGGGGATCAAGGT
+GGTCTGCGTGAACCGCATCATCACGGCGGTCGTCAGGTCGTTTTTGTCGACGAAGTAGCGGTAGAGCACG
+GTCTTGGAGACCCCGATCTCGGCCGCTATCTCGTCCATGCTGAGGAAGCGGCCATGCCGGCGAATCGCCT
+CAATCGTGCCGTCCACCAGCTCATTGCGGCGCTCCACCTTGTGCTGGTGCCAGCGTCGCTTGCGACCATC
+CGTCTTCACGGTCACGGCCGGGATACGCTCTGCCACTGTTGCCAATTCCCATTCACTAGACGCTCCCGAT
+ACTACGGCCAATTGGGGGTCCTGCTGGCACATTGGACGCGCGCGCGGGGTGCGCAGGACAGTGTCGTCAC
+ATTAACTGGTGCCGGTGATAGCGGATGATGGTGTGGTGGCACATAGAGCCGAGGTGTCGGGCTCGCCGCC
+GCCACGGCTGAATTTGAGCACCCAGCCGACGGTGGCGCGGCGTGTCCGCGCCTCCTTCGCGGAATCCTTC
+GCCGCAGCCGATCCGGAGGCGGATGCCGCCCGGCGGATGGCGCTGCGTCGGATGAAAGTGGTGGCAGTGG
+GGTTTTTGGTAGGCGCCACCGGCGTGTTCCTCGCTTGTCGCTGGGCACAGGCCGATGGCGCTGACCACGC
+GTGGCTGGGTTATCTGGGCGCTGCGGCGGAAGCCGGTATGGTCGGCGCCTTGGCGGACTGGTTCGCGGTG
+ACCGCGCTGTTCAAGCATCCGCTAGGCATTCCGATCCCGCATACGGCGATCATCAAGCGCAAGAAGGATC
+AGCTGGGCGAGGGCCTGGGCACCTTCGTGCGGGAGAATTTCCTGTCGCCGCCGGTCGTGGAGACCAAGCT
+GCGTGATGCGCAGATACCGAGTCGGCTTGGCAAGTGGTTGTCAGAGGCCACGCATGCCCAGCGGGTGGCG
+GCCGAGACCGCAACGGTGCTGCGGGTGCTGGTGGAGCTGCTGCGTGACGAGGACATCCAGCAGGTGATCG
+ACCGGATGATTGTGCGTCGTATCGCCGAACCGCAGTGGGGTCCGCCGGCGGGCCGGGTGCTGGCGACGTT
+GCTGGCCGAGAATCGGCAGGAAGCCTTTATCCAATTGTTGGCCGATCGGGCGTTCCAGTGGTCGCTCAAC
+GCCGGGGTGGTGATCCAGCGGGTGGTGGAGCGTGACTCGCCGAGTTGGTCGCCCCGATTCATCGACCACC
+TGGTTGGCGACCGTATCCACCGTGAGTTGATGGAATTTACCGACAAGGTGCGCCGCAACCCCGATCACGA
+GTTGCGCCGTTCGGCTACCCGCTTCTTGTTCGATTTCGCTGACGACCTGCAACACGATCCGGCCACTGTC
+GCGCGCGCCGACGCGATCAAAGAGGAGCTAATGGCGCGCGATGAGATCGCCACTGCGGCCGCGGCGGCGT
+GGAAGACACTGAAGCGGTTGGTGCTCGAGGGTGTTGACGACCCGTCCAGTGCGTTGCGCACCCGCATCAC
+CGATGCGGTCATCCGGATCGGCGAATCGCTTCGTGACGATGCCGACCTGCGTGACAAGGTAGACAGTTGG
+ACGGTGCGGGCGGCCCAACATCTGGTCTCGGAGTACGGGGTGGAGATCACCGCGATCATCACCGAGACGA
+TCGAGCGCTGGGACGCCGAGGAAGCCAGCCGGCGAATCGAACTGCACGTCGGCCGAGACCTGCAGTTCAT
+TCGGATCAACGGAACAGTGGTCGGGGCGATGGCAGGGTTGGCGATCTATGCGATCGCGCAACTGTTGTTC
+TGACGGGTGCTAACAAACGCTTGCAATAGCAAGCACTTGGACGTACTCTGGTGGCCGTTGCACCGATCAC
+CCCGAGCTAGGAGTAGCCAATGTCGTCGGAGGAGAAGCTGGCCGCCAAGGTGTCCACCAAGGCCTCCGAT
+GTGGCTTCCGACATCGGCAGCTTCATCAGGTCGCAACGTGAGACGGCGCACGTCTCGATGCGGCAGCTCG
+CCGAGCGGTCCGGAGTCAGCAATCCGTACCTGAGCCAGGTTGAGCGCGGATTGCGTAAGCCGTCCGCCGA
+CGTGTTGAGCCAGATCGCAAAGGCGCTGCGGGTCTCGGCCGAAGTCCTTTATGTGCGCGCCGGGATTCTC
+GAGCCCAGCGAGACCAGTCAGGTGCGTGACGCCATCATCACCGATACGGCGATCACCGAGCGTCAGAAGC
+AGATTCTGCTCGATATCTACGCGTCATTTACCCACCAGAACGAAGCCACCCGTGAGGAGTGTCCGAGCGA
+TCCGACACCGACCGATGACTAGCCGTTGGCCGGCTGTTTTGCGCACCGGCTGGCGGGTAATCAAACCTGA
+AGGACAGTCATCTGGGTGAGGTCGACCGCAGGCTGATCCAGCCGATCGGCCGCGCTGGCCAACAGCGACT
+CCGTCGATGACGTGCAGCAAAGGAGACATGTAGTGACCGGATCAGCTGGGCCTGACATCTACGAACTCGA
+CCGACAACCGACCCGACGATCAGGAGGTTTCCCCGGCAAGTCGCGTGCCATGTCAATCCGCGGGTCTTGA
+CTAGTCCTCCCTGGAGGAGCCGACGCTTGCCCCAACGTCCAGACCAAAGATGTAAGAACGCCGATATCAG
+AAAATAGTTAATGAAAGGAATACCCATGGCTGAAAACTCGAACATTGATGACATCAAGGCTCCGTTGCTT
+GCCGCGCTTGGAGCGGCCGACCTGGCCTTGGCCACTGTCAACGAGTTGATCACGAACCTGCGTGAGCGTG
+CGGAGGAGACTCGTACGGACACCCGCAGCCGGGTCGAGGAGAGCCGTGCTCGCCTGACCAAGCTGCAGGA
+AGATCTGCCCGAGCAGCTCACCGAGCTGCGTGAGAAGTTCACCGCCGAGGAGCTGCGTAAGGCCGCCGAG
+GGCTACCTCGAGGCCGCGACTAGCCGGTACAACGAGCTGGTCGAGCGCGGTGAGGCCGCTCTAGAGCGGC
+TGCGCAGCCAGCAGAGCTTCGAGGAAGTGTCGGCGCGCGCCGAAGGCTACGTGGACCAGGCGGTGGAGTT
+GACCCAGGAGGCGTTGGGTACGGTCGCATCGCAGACCCGCGCGGTCGGTGAGCGTGCCGCCAAGCTGGTC
+GGCATCGAGCTGCCTAAGAAGGCTGCTCCGGCCAAGAAGGCCGCTCCGGCCAAGAAGGCCGCTCCGGCCA
+AGAAGGCGGCGGCCAAGAAGGCGCCCGCGAAGAAGGCGGCGGCCAAGAAGGTCACCCAGAAGTAGTCGGG
+CTCCGAATCACCATCGACTCCGAGTCGCCCACGGGGCGACTCGGAGTCGACGTGTTGGATGCAAACCGCA
+TAGTCTGAATGCGTGAGCCACCTCGTGGGTACCGTCATGCTGGTATTGCTGGTCGCCGTCTTGGTGACAG
+CGGTGTACGCGTTTGTGCATGCTGCGTTGCAGCGGCCCGATGCCTATACCGCCGCCGACAAGCTGACCAA
+GCCGGTGTGGTTGGTGATCCTGGGCGCGGCCGTGGCGTTGGCCTCCATCCTGTATCCCGTTTTGGGTGTG
+CTCGGGATGGCGATGTCCGCCTGTGCGTCCGGCGTGTATCTGGTCGACGTGCGGCCCAAGCTTCTCGAGA
+TTCAGGGCAAGTCGCGCTAACGGAATGAAAGCCCTGGTGGCCGTGTCGGCGGTGGCCGTCGTCGCACTGC
+TCGGTGTATCTTCCGCCCAAGCTGATCCCGAGGCGGATCCCGGCGCAGGTGAGGCCAACTATGGTGGCCC
+CCCAAGTTCCCCACGTCTTGTCGATCACACCGAATGGGCGCAGTGGGGAAGTCTGCCCAGCCTCCGGGTC
+TACCCGTCCCAAGTTGGGCGTACAGCCTCCCGCCGCCTCGGGATGGCCGCTGCCGACGCGGCCTGGGCCG
+AGGTTCTCGCGCTGTCACCGGAGGCCGACACTGCCGGCATGCGCGCGCAGTTCATCTGCCACTGGCAGTA
+CGCCGAAATCAGACAACCCGGCAAACCCAGCTGGAACCTCGAGCCGTGGCGGCCGGTCGTCGACGACTCG
+GAGATGTTGGCTTCCGGCTGCAATCCGGGCAGCCCTGAAGAGTCGTTTTAGTGCTCGGCCAACCGACTCG
+GGCGCAGTTGGCCGCGCTGGTAGACCACACCCTGCTCAAGCCTGAGACCACCCGTGCCGATGTGGCCGCG
+CTGGTCGCCGAAGCCGCCGAACTCGGCGTCTACGCGGTCTGCGTGTCGCCGTCGATGGTGCCAGTTGCGG
+TCCAAGCCGGTGGTGTGCGGGTTGCGGCGGTGACGGGCTTCCCGTCGGGCAAGCACGTGTCCTCGGTCAA
+GGCGCATGAGGCGGCTGCGGCCCTGGCATCCGGCGCCAGTGAGATCGACATGGTCATCGACATCGGGGCT
+GCGCTGTGCGGTGACATCGACGCAGTGCGCTCCGACATCGAGGCGGTGCGTGCCGCTGCGGCCGGGGCTG
+TGCTCAAGGTGATCGTGGAGTCGGCGGTGCTGTTGGGACAGTCAAACGCGCACACGTTGGTGGATGCGTG
+TCGTGCCGCCGAGGATGCCGGTGCCGACTTCGTCAAAACCTCGACTGGGTGTCATCCGGCCGGCGGGGCC
+ACGGTGCGTGCCGTCGAGCTGATGGCCGAGACGGTCGGCCCTCGGCTAGGGGTCAAAGCCAGCGGTGGGA
+TCCGCACCGCCGCCGACGCGGTCGCGATGCTCAACGCCGGTGCCACCAGGTTGGGCCTGTCCGGCACCCG
+GGCGGTGCTCGATGGGCTCAGCTGACAGCTGAGCGCGCGGGTGGCGGCGTCAAATGTGCGAGAAGCAGGG
+ATTCTGGATGCCGGTGGGGATAGCCGCGTCGCGAGTTGAGAACCGGCTCACCACGCCGGTCGAGGTGACT
+TGCACGCTGTCCGCGTGAATCCCCAACGGGTAGTTCTTGGTCAGGCTGGAGGTGAACTCGTTCAGCGTCG
+ACTGAACGGTTTCTTTCGGCAGCGAGAACCCGAGCGTGTTGAAATTGATGATCTGCAGCTCCAATCCTTT
+GCCAGCCACTATCGGCTTGGCTGTGATGTTGTTCAGCAGGCCCTTCAGTTCGACGGTGCCGTCTGCGGGG
+TGAGTGACCACGCTGCTGGTGACGAAAGCGCCCAGGATCGGAATCGCGTTTTGCACCGATTCCTTGATGC
+CTTCCGACGACCAGGTAATGGTGGCGTCCAGGGCGCCGATCGTGCCCCTAGAGTTGGGGGTGTTCTTGAG
+CCGGACGTTCTGGATCGTGAGCTTTATCTGCATGCCCTTGGCATCGCGGATCTGATTGCCCGCGGTTTCC
+ACCGAGATATTGGTGAAGTGCCGCGTAGCGACCTGCCACAGCAGCAGCGGCGCCACACCGAAGGATGCGG
+TGGCTTGGTCTTTGACCACGCATGCGACCGCTTGGGCGACCTTGCTATTGGCAACATGGCGAGCGTATAG
+CTCGCCTCCGATCAGCCCGGCGAGGACGAGCGAAAACACGATGATCAGGACAAGAAAGACGGTTAGCGGG
+TCGCGGCGGGCACGTCGTTTGGTCTTCACCGCCGCTGGCTCTTCCTCTTGCGCAGCCAGCAGGCCCGTTG
+GGTCCCACGCCTGGTGCGCAGCTTGGCGGCCGGATCGCCGTGTGTGGGCATGCGACGCAGCCAGATGCTC
+AGTTTGCGGCTGCTGCTCCGGTTGGGTGGGCGGACTCACCGGTTCTTGGATATGACCCGCGGGCTCGCCG
+GGGCGCAGTCGACCGGTGGATGCTTCGGACGATGCCGGGGGTCGGGCGAGCGGACCTTGATCCCCAGGGC
+GCGCCCAGGGCGACGGGTCGTTCGGTGGACCTTGCGGGTTGGTCACCCACGCGATTGTGCCTTATCGATC
+TGAACGAAGTCTGTCTGGTTGCGTAGCACCGCAATGCGGTCGCGAGCCGCGGCCACATTGTCGACATCGA
+TGTCGGCGACCAGCAGTTGCGGCTGGGTGCCAGCTGACACCACCACCTCGCCTAGCGGCGAGGCCACCAG
+GCTGCCGCCTACCCCGGTCGGTGCAGCCGAGCTCGCCCCCACGCCGGTGCGGGCATCACCTGGGTCTGCT
+TGGCCGGCCGCGGCGACGTAACTCATGGAGTCTAGCGCCCGGGCGCGGGCCAGCAACGTCCACTGTTCGA
+GTTTGCCCGGACCGGAACCCCAGGATGCACAGACCGCGATCAGTTGGGCCCCGCGCCGCGCCAGCTCGGT
+ATAAAGGGCGGGAAAGCGAATGTCGTAGCAAACGGTCAAACCCACCCGCACGCCGTCGACCACGACTACC
+ACCGGTTCGCGCCCGGGTGCGACGGTACGTGACTCGGTGAAGCCGAACGCGTCATAGAGGTGGATCTTGT
+GGTAGTGCGCGTCCGGCTGATTGGGCGTGCCCGGGCCGGCTGCGATCAGCGTGTTTGTTACCCGCCCGTC
+GCCGGTCGGGGTGAACATGCCGGCGATCACGGTGATGCCCGCCTCGGTCGCGATCCGTCGGACTCCGTTT
+GCCCAGGGTCCGTCGACGGGCTCGGCGACCTGCCGCAGCGGGACACCGAGCCGGCACATGGTCGCCTCAG
+GAAACACCACCAGCTGTGCGCCCGCGGTGGCGGCTTCGCCGGCGTACTTGCCGACCAGTTGCAGATTGGC
+GGCGGGGTCGGTACCGCTGCGGATTTGCGCCAACGCGATTCGCATGCGCGCCAGCCTAGGCCCGGCGACG
+AGCGCGCCGCACCGGCGCGCGCAGGAGCCGGGCAATCCAGCTTGCGCCCGGCGACGAGCGCGCCGCACCG
+GCGCGCGCAGGAGCCGGGCAAGCTGGCACCTCAGACGTTGTTCGTGATCCACAGCGTGGTGAAGCGCTGT
+TCGATGGTCACTAGCTGGCTTAATTGGGTGCCGATAAGCCTCTCCAGCTTCCCGCCAATGAACGGGATAC
+GCACCTGGATGGTGACCTGCAGCGTCATTCGGGAGCCACCCGACTCCGGTATGGGCGAGAGCACGGCGGT
+GCCCCACAAGTTCACCGGAGCGTCCACGATCGATCCCGCAATGGACGCGGTCGCGATGCCTTCCTTGACC
+GGGCCCCAGGTCTCCTCGCGCCGTACCGAAAGATCGCCCCGGTGCAACTGTGTGACCAGGCCGGGCAGAT
+TGTGACTGCGCACCATCTGCAGGGTGACGACTTCGATGGTGCCGTCGTCTCCGGAGTCGCCACCTACGCG
+TATCGACTCAAGGGTCGCGACGTCGACCGGCGTTTCGGCCAGTCTGGCTTTCCAGTAGTCCGCCTCGTAG
+AAAGCCCGATGAACCTCCTCGACGCTGCCCTCGTAGTCGGCCGACATGTCGAATGAACGCGGCATAGCAG
+GTCAGGCTACCCTTACGGGCCATGAAACGGAGCGGTGTCGGTTCGCTCTTTGCCGGTGCGCATATTGCCG
+AGGCGGTCCCGTTGGCGCCGCTGACCACTTTGCGTGTGGGCCCGATCGCCCGACGTGTCATCACTTGCAC
+CAGCGCCGAACAGGTGGTGGCTGCGCTGCGGCACCTGGATTCGGCGGCCAAGACCGGAGCTGACCGCCCG
+CTGGTGTTTGCTGGTGGCTCCAATTTGGTGATCGCCGAGAACCTGACCGACCTGACCGTGGTGCGGTTGG
+CCAATAGCGGCATCACCATCGACGGTAACTTGGTGCGGGCCGAGGCCGGTGCGGTCTTCGATGACGTGGT
+GGTTAGGGCCATCGAACAGGGTCTGGGCGGACTGGAATGCCTGTCTGGCATCCCAGGATCGGCCGGGGCG
+ACACCCGTGCAGAACGTGGGGGCGTATGGCGCGGAGGTGTCTGACACCATCACTCGGGTTCGGCTTTTGG
+ATCGGTGCACGGGTGAGGTGCGTTGGGTATCCGCGCGCGACCTGCGCTTCGGCTATCGCACGAGCGTGCT
+CAAACACGCTGATGGGCTTGCGGTGCCCACCGTGGTCTTGGAGGTGGAGTTTGCGCTGGATCCGTCGGGC
+CGCAGCGCACCGCTGCGCTACGGCGAGCTGATCGCCGCGCTGAATGCGACCAGCGGCGAGCGCGCCGACC
+CGCAAGCGGTCCGCGAAGCGGTGCTGGCCCTGCGGGCACGCAAGGGCATGGTGCTGGACCCGACCGACCA
+TGACACCTGGAGCGTGGGATCGTTCTTCACAAACCCGGTGGTCACCCAGGATGTTTACGAACGGCTGGCC
+GGTGACGCGGCCACCAGAAAGGACGGTCCGGTCCCGCACTATCCCGCGCCCGACGGCGTCAAGCTGGCCG
+CCGGCTGGCTGGTGGAACGGGCCGGCTTCGGCAAGGGCTATCCGGATGCCGGCGCCGCCCCATGCCGGCT
+TTCCACCAAACATGCGCTGGCGCTGACAAATCGTGGCGGGGCCACCGCCGAAGATGTGGTGACGCTGGCG
+CGCGCCGTGCGCGATGGGGTCCATGATGTGTTTGGTATCACACTAAAACCCGAACCCGTGCTGATCGGCT
+GCATGTTGTAGCTGCGTTTTCGCGGCGGGGCGGCGTGGCGCGCATTGCTTAGGGCTGGTTGCCAGGCGTT
+CTGTGGTCATTCGTGTGCTGTTTCGCCCGGTATCTTTGATACCCGTGAATAACTCCAGCACCCCCCAGAG
+TCAGGGGCCGATCAGTCGGCGTCTGGCGTTGACGGCCCTTGGGTTTGGGGTGTTGGCACCGAACGTTCTG
+GTCGCGTGCGCCGGCAAAGTGACCAAGCTGGCCGAGAAGAGGCCGCCACCGGCGCCTCGTCTGACTTTCC
+GGCCTGCCGACTCTGCCGCCGACGTGGTGCCGATCGCGCCGATCAGCGTCGAGGTCGGTGACGGCTGGTT
+TCAGCGGGTCGCGCTGACCAATTCGGCAGGCAAGGTCGTCGCCGGGGCATACAGCCGGGATCGCACCATC
+TACACGATCACCGAGCCGCTGGGCTACGACACGACCTACACCTGGAGCGGTTCGGCCGTCGGCCATGACG
+GCAAGGCGGTTCCGGTGGCGGGCAAGTTCACCACCGTGGCACCCGTCAAGACGATCAACGCGGGATTCCA
+GCTCGCCGACGGCCAGACCGTCGGGATCGCGGCGCCGGTGATTATTCAGTTCGATTCACCGATCAGCGAC
+AAGGCCGCCGTCGAGCGGGCACTAACCGTGACCACCGACCCGCCTGTCGAGGGCGGCTGGGCCTGGCTGC
+CCGACGAGGCGCAGGGCGCTCGCGTGCACTGGCGTCCTCGGGAGTACTACCCGGCGGGTACCACCGTCGA
+CGTCGACGCCAAGCTGTATGGGCTGCCGTTCGGCGACGGCGCGTACGGCGCGCAGGATATGTCGTTGCAC
+TTCCAGATCGGTCGTCGTCAGGTGGTCAAGGCCGAAGTCTCGTCGCACCGCATCCAAGTCGTCACCGATG
+CCGGCGTCATCATGGACTTCCCGTGCAGCTACGGCGAGGCCGACTTGGCGCGCAACGTCACCCGCAACGG
+CATCCACGTCGTCACCGAGAAATACTCGGACTTCTACATGTCCAACCCGGCCGCCGGTTACAGCCATATC
+CACGAACGTTGGGCGGTGCGGATTTCCAACAACGGCGAGTTCATCCATGCCAACCCTATGAGCGCCGGTG
+CCCAGGGCAACAGCAATGTCACCAACGGCTGTATCAACCTGTCGACGGAGAACGCCGAACAGTACTACCG
+CAGCGCGGTCTACGGTGACCCGGTTGAGGTGACCGGCAGTTCGATCCAGCTGTCCTACGCCGACGGTGAC
+ATCTGGGACTGGGCGGTGGACTGGGACACCTGGGTGTCGATGTCGGCGCTACCGCCACCGGCGGCCAAAC
+CGGCGGCGACGCAAATCCCGGTCACCGCCCCGGTCACGCCGTCGGATGCCCCCACCCCGTCCGGCACACC
+CACGACTACTAACGGACCGGGTGGGTAGCGCGACGGCTAGCTGATGCCTGGTCGCGGGGCCGGATGACGA
+TCTGGTCAAGGTTGACGTGTGAGGGCCGGGTGGCCACGAATCCGATCACCTCGGCGACGTCGGCGGCTAC
+TAGCGGTGTCATGCCGGCATAAACCGCGTCCGCGCGTTGCTGGTCGCCGTCGAAGCGGACCAGCGAAAAT
+TCGGTCTCGACCGCGCCTGGAGCGATCTCCGTGAGCCGGACCGGCTTCCCCAGCAGTTCGCCGCGCAGCG
+TGCGATGCAGCGCGCCCTGCGCGTGCTTGGCAGCGGTGTAGCCGGCGCCGCCGTCGTACACCTCGAGCGC
+GGCGATCGAGGTGACGGTGACGATCAGGCCGTCGCCGGAGTCGATCAGCTTGGGCAGCAGCGCGCGGGTT
+ACCCGCAGCGTGCCCAGTACGTTGGTGTCCCACATCCATCGCCAGTGCTCCAAATCGGCATCGGCGACGA
+ACTGAAGCCCCTTGGCGCCACCGGCGTTGTTGACCAGCACGTCCACCCGGCTCAGCGCGCGGGCCAACGC
+TTCGACGGCGGCGTCGTCAGTGACATCGGCCACAATTGCGGTTCCGCCGATCTGGTTGGCCAGCGCGGTG
+ATCCGGTCCGCCCGACGCGCCACCGCGACCACGTGAAACCCCTGGGCCGCAAGGGTTCTCGCGGTTGCCT
+CGCCGATACCGGAACTGGCGCCGGTGACCACGGCGACTCGCTTGCGGGTGCCGATTGTCGTCATCGGGAC
+AACTCTAATAAACGTGCTAAATTCTCGGTGTGTACCACAGCGCCTTGTTCCGCACGACGACCGCGTGTCT
+TTTCGCGGGCGCGTGTTGTTGCCGCCCCCTTTGCCGCGCCTGACCGATACACGTCAGCAGGTGTGGCCAA
+CAGGACCCGGCCATTGGAACTCGGAGAAGAACGCCCGTGTACTCGACTAACCGCACCTCACAGTCACTCA
+GCCGCAAGCCCGGCCGCAAGCACCAGCTGCGATCGCACCGTTACGTCATGCCGCCGTCGCTGCACCTGTC
+CGATTCCGCGGCTGCGTCCGTCTTCCGGGCCGTGCGTTTGCGTGGTCCGGTCGGTCGGGACGTAATTGCT
+GGATCTACGTCGCTGAGCATCGCGACGGTGAACCGCCAGGTCATCGCACTGCTGGAAGCGGGCCTCCTGC
+GTGAGCGGGCGGACCTGGCGGTTTCCGGGGCTATCGGGCGCCCACGCGTGCCTGTCGAAGTAAACCACGA
+GCCTTTTGTCACCCTGGGCATCCACATCGGTGCCCGGACCACCAGCATCGTGGCCACCGACCTGTTCGGC
+CGCACGCTCGACACGGTGGAGACCCCGACCCCGCGTAACGCTGCCGGGGCCGCGCTGACCTCACTGGCCG
+ACAGCGCTGACCGATACTTGCAGCGCTGGCGCCGGCGCCGTGCGCTGTGGGTCGGGGTGACGCTTGGTGG
+TGCAGTCGACAGTGCCACCGGTCATGTCGACCATCCGCGGCTCGGTTGGCGTCAGGCTCCGGTCGGACCC
+GTGCTGGCGGATGCCCTAGGCCTGCCCGTGTCGGTGGCGTCCCACGTCGACGCCATGGCCGGGGCCGAGC
+TGATGCTCGGCATGCGGCGGTTCGCACCGAGCTCGTCGACGAGCCTCTACGTCTACGCCCGCGAAACCGT
+AGGCTATGCGCTGATGATCGGTGGGCGGGTGCACTGCCCGGCCAGTGGTCCCGGCACCATCGCGCCCCTG
+CCCGTCCACTCTGAAATGCTCGGCGGTACCGGGCAGCTGGAGTCCACTGTCAGCGACGAGGCGGTTTTGG
+CTGCTGCCCGCCGGCTGCGGATCATCCCCGGCATCGCTTCGAGGACCCGGACCGGTGGGTCCGCTACCGC
+CATCACCGACTTGCTGCGAGTGGCACGAGCCGGTAATCAGCAAGCCAAGGAGCTGCTGGCGGAGCGGGCC
+CGCGTGCTCGGTGGGGCGGTCGCGCTGCTGCGTGACTTACTCAATCCCGACGAAGTGGTGGTGGGTGGCC
+AGGCGTTTACCGAATATCCCGAGGCGATGGAGCAGGTGGAGGCGGCGTTTACGGCAGGGTCGGTGCTGGC
+GCCGCGTGACATCCGCGTGACCGTTTTCGGCAACCGGGTGCAGGAGGCCGGGGCAGGCATCGTGTCCCTA
+AGCGGGCTCTATGCCGATCCATTGGGTGCCTTGCGGCGATCGGGCGCGCTGGATGCCCGGCTGCAGGACA
+CCGCCCCGGAGGCGCTCGCGTGATCGGCTGACGAGCCGCGTCCGCGCGTGTCACTTCGGTTCCTGCAAGG
+ATGGCAGGTGTGCGGCACGATGACGGTTCAGGGTTGATCGCCCAGCGCCGTCCGGTCCGCGGCGAGGGTG
+CCACCCGCTCGCGCGGCCCATCCGGGCCATCCAATCGGAATGTTTCGGCAGCAGACGACCCGCGCCGGGT
+TGCGCTGCTGGCGGTGCACACCTCACCGCTGGCACAGCCGGGCACCGGTGACGCCGGCGGCATGAACGTC
+TACATGCTGCAAAGTGCGCTGCACCTGGCCCGTCGGGGCATCGAGGTGGAGATCTTCACCCGGGCCACCG
+CATCGGCAGATCCACCGGTGGTGCGGGTGGCACCCGGGGTGCTGGTGCGCAACGTGGTGGCGGGGCCCTT
+CGAGGGTTTGGACAAGTACGACCTGCCCACCCAGCTTTGTGCGTTCGCCGCCGGGGTGCTGCGCGCCGAG
+GCGGTCCACGAACCGGGTTACTACGACATCGTGCACTCGCACTACTGGCTGTCGGGTCAGGTCGGCTGGC
+TGGCGCGCGACCGCTGGGCGGTGCCGTTGGTGCACACCGCACACACGCTGGCCGCCGTGAAGAACGCGGC
+ACTGGCCGACGGCGACGGACCCGAGCCGCCGCTGCGTACGGTCGGGGAGCAGCAGGTCGTCGACGAGGCG
+GATCGGTTGATCGTCAACACCGACGATGAAGCCAGGCAAGTGATTTCGCTTCATGGTGCCGATCCGGCAC
+GAATCGACGTGGTCCATCCCGGTGTCGATCTGGACGTGTTCCGCCCGGGTGATCGGCGCGCGGCCCGGGC
+CGCGCTAGGACTACCAGTTGACGAGCGCGTGGTGGCCTTCGTCGGACGCATCCAGCCGCTGAAGGCACCC
+GACATTGTGCTGCGTGCGGCCGCCAAGTTGCCCGGGGTGCGCATCATCGTGGCCGGCGGACCGTCGGGCA
+GCGGTCTGGCTTCACCGGACGGACTGGTCCGGCTCGCCGACGAACTGGGCATCTCTGCACGGGTGACGTT
+TCTGCCGCCGCAGTCCCACACGGATCTGGCCACCTTGTTTCGGGCGGCGGACCTGGTTGCGGTGCCGAGC
+TACTCCGAGTCGTTCGGCCTGGTTGCTGTGGAGGCCCAAGCGTGCGGCACACCGGTGGTGGCCGCGGCGG
+TGGGCGGGCTGCCCGTCGCGGTGCGCGACGGGATCACCGGCACCCTGGTGTCCGGGCACGAGGTCGGTCA
+GTGGGCCGACGCCATCGATCACCTGCTGCGGTTGTGTGCCGGGCCACGGGGACGGGTGATGAGCCGGGCG
+GCGGCACGGCACGCCGCCACGTTCTCGTGGGAGAACACCACCGACGCGCTGTTGGCCAGTTATCGGCGTG
+CGATCGGCGAGTACAACGCCGAGCGCCAGCGCCGGGGCGGCGAGGTGATATCGGACCTGGTAGCGGTGGG
+CAAGCCCCGCCACTGGACGCCGCGTCGCGGGGTGGGCGCGTGACTTCCTCCTTGCCGACCGTGCAACGTG
+TGATCCAGAATGCGCTCGAGGTCAGCCAGCTGAAGTACTCCCAACACCCCCGCCCGGGCGGGGCGCCGCC
+CGCGCTGATCGTCGAGCTGCCGGGCGAACGCAAGCTCAAGATCAACACCATCCTGAGCGTCGGCGAGCAT
+TCGGTGCGTGTCGAGGCGTTCGTGTGTCGCAAGCCTGACGAGAACCGCGAAGACGTATACCGGTTCCTGC
+TGCGGCGCAACCGCCGCCTGTATGGGGTCGCGTACACGCTGGACAATGTCGGCGACATCTACCTGGTGGG
+CCAGATGGCGCTGTCCGCAGTGGACGCCGACGAGGTTGACCGGGTGTTGGGGCAGGTGTTAGAGGTGGTG
+GATTCGGACTTCAATGCGTTGTTGGAGTTGGGATTTCGGTCGTCGATTCAACGAGAGTGGCAGTGGCGGT
+TATCTCGCGGTGAGTCGCTGCAGAACCTGCAGGCCTTCGCTCACTTACGCCCGACGACGATGCAGAGCGC
+GCAGCGCGATGAGAAGGAGTTGGGCGGTTAGGTCGAGCCCGACGACGATGCAGAGCGCGCAGCGCGATGA
+GAAGGAGTTGGGCGGTTAGGTCGAGCCCGACGACGATGCAGAGCGCGCAGCGCGATGAGAAGGAGTTGGG
+CGGTTAGGTCGAGCCCGACGACGATGCAGAGCGCGCAGCGCGATGAGAAGGAGTTGGGCGGTTAGGTCGA
+GCCCGACGACGATGCAGAGCGCGCAGCGCGATGAGAAATAGCACTCGTGGAGGTCAAGACGCCCGCCGGT
+GATGGGCTGGTGGCGCTCACCCCGTTCCGGACTCAGAAATTCGCGATCACAATTTGCGCGTTCAAGTCAT
+TGGCATGCATGTGATGGTTTAGCGTTCCGCTGTGCCTCTTCAGGTGTTTGTCGGCTTCGTTGCCATGATG
+ACGCTCAAGGTCGCGATCGGCCCGCAAAACGCATTTGTCCTGCGCCAAGGAATTAGGCGAGAATACGTGC
+TGGTCATTGTGGCGCTGTGCGGGATCGCTGATGGGGCACTGATTGCCGCGGGCGTTGGCGGCTTCGCTGC
+GCTGATTCACGCTCATCCCAATATGACTTTGGTTGCCCGATTTGGCGGCGCAGCGTTCTTGATTGGCTAC
+GCGCTATTGGCCGCGCGGAACGCGTGGCGCCCGAGCGGGCTGGTGCCGTCGGAATCGGGGCCGGCTGCGC
+TGATCGGCGTGGTGCAAATGTGCCTGGTGGTGACCTTTCTCAACCCACACGTCTATCTGGACACTGTGGT
+GTTGATCGGTGCCCTCGCCAATGAGGAATCAGATCTGCGGTGGTTTTTCGGAGCCGGTGCCTGGGCCGCC
+AGCGTCGTATGGTTCGCCGTGTTGGGATTTAGCGCGGGCCGGCTACAGCCATTCTTCGCAACTCCAGCTG
+CTTGGCGCATTCTTGATGCGCTGGTTGCCGTGACGATGATTGGGGTCGCCGTCGTTGTGCTCGTCACGTC
+ACCAAGTGTGCCGACGGCCAATGTCGCACTGATCATTTGACCACCTCGTAGGCCGCCCATGTATCGGCCT
+TGGTGAACCGGCCGTTACGGTGCCGACCACCTCGGCGGTATGAACGCGCTGCGCAGCGGACCGAGGAGAA
+TTCGGGCATTTTGGTCCACGATGAGGAGTGCGGGAGTGCGTGAGAGACTTGCCGGTATGGCAAACACTGG
+CAGCCTGGTGTTGCTGCGCCACGGCGAGAGCGACTGGAATGCCCTCAACCTGTTCACCGGCTGGGTCGAT
+GTCGGCCTGACGGACAAGGGCCAGGCAGAGGCGGTTCGAAGCGGCGAGCTGATCGCGGAACACGACCTAT
+TGCCCGACGTGCTCTACACCTCGTTGCTGCGGCGCGCGATCACCACCGCGCATCTGGCGTTGGACAGCGC
+CGATCGGCTCTGGATTCCCGTGCGGCGTAGCTGGCGGCTCAACGAACGCCACTACGGCGCGCTGCAGGGT
+TTGGACAAGGCCGAGACCAAGGCCCGCTATGGCGAAGAGCAGTTCATGGCCTGGCGGCGCAGCTATGACA
+CGCCGCCGCCGCCGATCGAGCGGGGCAGTCAGTTCAGCCAGGACGCCGACCCTCGTTACGCCGACATCGG
+CGGTGGCCCGCTCACCGAATGTCTGGCTGACGTGGTCGCCCGGTTTTTGCCATATTTCACCGACGTCATC
+GTTGGCGACTTGCGGGTCGGCAAGACGGTGCTGATCGTTGCCCACGGCAACTCGTTGCGCGCGCTGGTCA
+AGCACCTGGACCAGATGTCTGACGACGAAATCGTCGGACTGAACATCCCGACCGGAATTCCGCTGCGCTA
+CGACCTGGATTCCGCGATGAGGCCGCTGGTGCGCGGTGGTACGTATCTGGACCCGGAGGCGGCAGCCGCC
+GGCGCCGCCGCGGTGGCCGGCCAGGGCCGCGGGTAATTGTTTGAGATCCCACCTGCCGGCGGTTTCGGCG
+GCTGATGGTGTGCTTTGGTGCGCTGTTTGCCAAACAGCATGTGAACGGTAACCGAACAGCTGTGGCGTAG
+TGTGTGACTTGTCCGATTTTGGCCTTGCCGCGCTAGGGCGACGTTCACCGGATTTGTAGGATTTTCCTTG
+TGACTGTGTTCTCGGCGCTGTTGCTGGCCGGGGTTTTGTCCGCGCTGGCACTGGCCGTCGGTGGTGCTGT
+TGGAATGCGGCTGACGTCGCGGGTCGTCGAACAGCGCCAACGGGTGGCCACGGAGTGGTCGGGAATCACG
+GTTTCGCAGATGTTGCAATGCATTGTCACGCTGATGCCGCTGGGCGCCGCGGTGGTGGACACCCATCGCG
+ACGTTGTCTACCTCAACGAACGGGCCAAAGAGCTAGGTCTGGTGCGCGACCGCCAGCTCGATGATCAGGC
+CTGGCGGGCCGCCCGGCAGGCGCTGGGTGGTGAAGACGTCGAGTTCGACCTGTCGCCGCGCAAGCGGTCG
+GCCACGGGTCGATCCGGGCTATCAGTGCATGGGCATGCCCGGTTGCTGAGCGAGGAAGACCGCCGGTTCG
+CCGTGGTGTTCGTGCACGACCAGTCGGATTATGCGCGGATGGAGGCGGCTAGGCGTGACTTCGTGGCCAA
+CGTCAGTCACGAGCTCAAGACGCCCGTCGGTGCCATGGCTCTACTCGCCGAGGCGCTGCTGGCGTCGGCC
+GACGACTCCGAAACCGTTCGGCGGTTCGCCGAGAAGGTGCTCATTGAGGCCAACCGGCTCGGTGACATGG
+TCGCCGAGTTGATCGAGCTATCCCGGCTACAGGGCGCCGAGCGGCTACCCAATATGACCGACGTCGACGT
+CGATACGATTGTGTCGGAAGCGATTTCACGCCATAAGGTGGCGGCCGACAACGCCGACATCGAAGTCCGC
+ACCGACGCGCCCAGCAATCTGCGGGTGCTGGGCGACCAAACTCTGCTGGTTACCGCACTGGCAAACCTGG
+TTTCCAATGCGATTGCCTATTCGCCGCGCGGGTCGCTGGTGTCGATCAGCCGTCGCCGTCGCGGTGCCAA
+CATCGAGATCGCCGTCACCGACCGGGGCATCGGCATCGCGCCGGAAGACCAGGAGCGGGTCTTCGAACGG
+TTCTTCCGGGGGGACAAGGCGCGCTCGCGTGCCACCGGAGGCAGCGGACTCGGGTTGGCCATCGTCAAAC
+ACGTCGCGGCTAATCACGACGGCACCATCCGCGTGTGGAGCAAACCGGGAACCGGGTCAACGTTCACCTT
+GGCTCTTCCGGCGTTGATCGAGGCCTATCACGACGACGAGCGACCCGAGCAGGCGCGAGAGCCCGAACTG
+CGGTCAAACAGGTCACAACGAGAGGAAGAGCTGAGCCGATGACCTGCGCCGACGACGATGCAGAGCGTAG
+CGATGAGGTGGGGGCACCACCCGCTTGCGGGGGAGAGTGGCGCTGATGACCTGCGCCGACGACGATGCAG
+AGCGTAGCGATGAGGTGGGGGCACCACCCGCTTGCGGGGGAGAGTGGCGCTGATGACCTGCGCCGACGAC
+GATGCAGAGCGTAGCGATGAGGTGGGGGCACCACCCGCTTGCGGGGGAGAGTGGCGCTGATGACCTGCGC
+CGACGACGATGCAGAGCGTAGCGATGAGGTGGGGGCACCACCCGCTTGCGGGGGAGAGTGGCGCTGATGA
+CCTGCGCCGACGACGATGCAGAGCGTAGCGATGAGGAGGAGTGGCGCTGATGACCAGTGTGTTGATTGTG
+GAGGACGAGGAGTCGCTGGCCGATCCGCTGGCGTTTCTGCTGCGCAAGGAGGGCTTTGAGGCCACGGTGG
+TGACCGATGGTCCGGCAGCTCTCGCCGAGTTCGACCGGGCCGGCGCCGACATCGTCCTGCTCGATCTGAT
+GCTGCCTGGGATGTCGGGTACCGATGTATGCAAGCAGTTGCGCGCTCGGTCCAGCGTTCCGGTGATCATG
+GTGACCGCCCGGGATAGCGAGATCGACAAGGTGGTCGGCCTGGAGCTGGGCGCTGACGACTACGTGACCA
+AGCCCTATTCGGCACGCGAGTTGATCGCACGCATCCGCGCGGTGCTGCGCCGTGGCGGCGACGACGACTC
+GGAGATGAGCGATGGCGTGCTGGAGTCCGGGCCGGTTCGCATGGATGTGGAGCGCCATGTCGTCTCGGTG
+AACGGTGACACCATCACGCTGCCGCTCAAGGAGTTCGACCTGCTGGAATACCTGATGCGCAACAGCGGGC
+GGGTGTTGACTCGCGGACAACTGATCGACCGGGTCTGGGGTGCGGACTACGTGGGCGACACCAAGACGCT
+CGACGTCCATGTCAAGCGGCTGCGCTCCAAGATCGAAGCCGACCCGGCTAACCCGGTTCACTTGGTGACG
+GTGCGCGGGCTGGGCTACAAACTCGAGGGCTAGCGGACGCCGACAACCTTGGCGACTGTCTGGTCGGCTA
+CGGCCAGTGCCATCGCCATGATGGACAGCTGCGGGTTCACTTCCGGGCAGCTGGGCAGGATCGAGGCGTC
+GGCAACCCACACGCCCTCGACGCCGCGCAGCCGGCCCGTCGCGTCGACCGGACAAAGCTGCTCGTCGGCG
+CCGGCGGCCGCGGTGCCCGTCGGATGGAAGGCGGCCAGGTGCAGGCTTCTGGGGTTGGCTCGGCGCAGCA
+CATCCTGCAGCTCGGGCAGGGACCGCATCGGTGGGGCGCCGGGGATACCGGTCAGCACCTCCACCGCGCC
+GGCGGCAAAGAACAGCCGGCCAATGGCCTGCAGCGCGACCCGTAGCTTGGCGATCTCACCTGGAGCTATG
+TCATAGCGCACCACCGTCTCGCCGCGCACCGACCGCACCGTGCCGACGCCCCGATCGGCCACCATCGCCC
+CGAATGTTGCGATCTGCGGCGCCCGGTCGAGCCAGCGGAGCAGCTCGGCCCCGTAGCCGGGGAAGACCAT
+CGACCCCATGCCCGGCGGTGTGGAGGTGGCCTCGATCAGCACGCCGTCGGATTCGTGAAACTCGTGAACC
+GCCGCGCTCTGCAGCACCCCGCGCCACGCGAAGACGTCGTCGTCGAAGAGCCCGGCCAGCATAGTTGCCG
+GGTGCAGCGCAAGGTTGTGGCCCAGTCGCGGGTGCCCACCAAGACCGCTGCGCCGCAACAGCCCTGGCGT
+CTCCGTCGCACCGGCGGCGACGACGACCGCGTCGGCCAGCACGTCGAGTGTGGTGCCGTCGGGCCGGCGG
+GCTCGCACGCCATAGGCCCGCCCGGCGCGGTGCAGGATCCGTTCGACCCGCGCCCAGGAGATGATCCGCG
+CGCCGGCCGCGCAGGCTTGCGGCAGGGCGTTGAGGTGCACGCCGAACTTGGCGTTGCTGGGGCAGCCGAT
+CGCGCACTGGCAACAGCCACGGCACCCCGGCGCATTGCGCGGGATGGGCGCCGCCCGCCAGCCCAGCGAC
+TTGGCGGCCTGCAGCAACAGGCGCCCGTTGCGGCCCATGATCTCCAGCGGCACCGGCGCAACCCGCAGTG
+TTTGCTCCGCATCGTCAAGACGACGTCCCAGCTGGTCGGGGTCGGCCAGGCCGAGACCGAACTCGTCACG
+CCAGCGCCGCTGCACGGCAAGTGAAGGCCGAAAGCAGGTGCCGGAGTTGACGACGGTGGTGCCGCCCACC
+GCCCGGCCCATCGGCAGCACCACCGCCGGTCGCCCGAGCGCGACGGTGGCCCCGGCGCCACGGTACAACC
+CGGCATAACGGTCGACCGGGTGGGTGCTACGGAACTCCTCGACCGTCCAGCGCCGTCCCTCTTCGAGCAC
+GACCACGTCAAGGCCGGCCCGGGCCAGCGTGCGCGCGACCATCGCGCCGCCCGCCCCGGAGCCGACGACC
+ACCGCATCGGCCCTGGTGACGGATGGGCTGTCCGCCGACAAGATGACGGTCAACTCCGCGTCGGGGCGCG
+CCGCGTCATGTTCCTGGGCGCGGGCGAGCAATTCGTGCGCGTAGGTGTCGGCGCCGTTGGCCAACAGCAC
+GATCGCCTTCAACCCCTCCACGGCCGCAGCGACTTCCGGGCTCAGTGCGGCGATCCGGTGCAGCACCCGT
+GCCCGCTCGTCCGGGTGCAGTCGCGGTAGCGACCGGCCGGTGGTGAGGTAGCTGGCCGCCGCCAGTGAAG
+CCAGCCCGGCGCGCACCGCGAATCGTGAGGTCGCCGGCAGTCGTGTGACGTAGCGGTCAACGCGCTGCAC
+GAATTGAGCCGGCAACGGGCCGCCGAGCTCCGGCGGCAGCAGCGCGGCGCCGAACGAGGCCAACGGATAG
+GACTTAGCCCGATCGGCGAGCCGGCTCATATCCGGCGCCCGAGCCGGCGGCCGAGCTTTATGAAGAACGG
+ATACGTTGCGAAGATGGCAGCGGCCATCGCGTGCAGCGGCCACTCCGCGCGGGCCACATCCACGCTGAAA
+ACCCCGCTGTTCCACATGAAATCGCGGCCGTTCTGTGCGCGAAATGGCCGCCACAGCATCCCGAGCCCGG
+GTACGTTGTGGTACAGCCCGAACGAAGCGCCGAAGAAGACGCCCAGGGCGGCGGCCTCGGCGGCATCGCG
+GCGGTCCACGGGCAGGCGTCGCTCGATGAGCACTCCGCAGACAAACAGCAGCGGCGGGTCGAGCAGGAAA
+CTCATGCTGGCGTCCCTTCCTTGATAGCCGGTGCCGCGGTTCCCCGCAGGCCGACTTCGGCGTGTCCGGT
+GCCCAGCACCGACCAGTGCCGGCCGCCGAGCTCGATGTGGATGTCGGCTTGCTCGGTGTTGGTGCACACC
+GCCTTGGCCCCGTCGGGATCGGTGTATCCCAGGCTTACGCACCGCTCCGGCGGCTGGTCTACCCGGATTA
+GCGCCTCCCGGCCGCCGATGCGTCCTTCCAGTTGCCAGTGCCGCACGCCGAGCGTTGTCCGCATTCGCAG
+CGACGGTAAAGGACTTGCGGGCCAATCCTTTCCGTCGATGCGGAAGCGAACGAACGCTAGCGGCGCGAGC
+CTGCGTAGGCCCGGCTTGTGTGATACCGCGGTCACCACCTCTAGGACGTCGCCGTCGCCGAGATCGGCAT
+GGATCCATCCCCACCGCTTGGCATTGCCATGTCCGTAGATGTGGGCCACACCGCCGCGCCAGCTGTCGAC
+GCGGTGGGTGGTTTCGCCGACGGCCAAGGAGCCAGCGAAGACGGCGGTGGGTGCGATCACCACTTGGGCG
+CCGGGCAGCAACTCGCGCTCCCAGGCCACGCGAGGAAACGTCCACAGTGGCGCCGCGGTGTCCTTCCAGG
+ACAGCTCCCATGCGAGTGATCGGGTACGTCCGGTCAGCTCCGCTGGCGCCATTCGTACACCGGCGATGTC
+GAACCAGGCGGGGCCGGCCGCGGGTTGGGCGGGCTGGGGGCCGAAGCGCTCGGTGCCCGGCGGGGCATCC
+GGTGGAAACCAGGTCACCCAGCCGTGCGCGTAGGGCCCGCCTGTCGTCGGGGCCACCGTCTCACAGTGCA
+CCCATAGGCCGGTACGCGTCAGTGGATCCGACAGAGTCGCATACCAGACTTCCAGGCGCCCGGCTGCACC
+GCGCCACCGCGGCAAGGCCGCCGACCGCGTTTCATCGTCCACTGCGGCACCTCCTGCTGGCTGAGTTGTC
+GATTCGCCCACTATATTGGTTGAGCCAATGAACCAGTCAAGTGTCTTTCAGCCGCCGGATCGGCAGCGGG
+TGGATGAGCGGATCGCGACGACGATCGCCGACGCCATCCTCGACGGCGTCTTCCCGCCGGGCTCGACCCT
+GCCGCCCGAGCGAGACCTGGCAGAGCGGCTCGGTGTCAACCGCACCTCGCTACGCCAGGGTCTGGCGCGA
+CTGCAACAGATGGGCCTGATCGAGGTGCGGCACGGCAGCGGCAGTGTGGTCCGTGACCCCGAGGGGCTCA
+CCCATCCCGCGGTGGTCGAGGCGCTGGTGCGCAAACTGGGCCCCGACTTCCTCGTCGAGTTGCTGGAGAT
+CCGCGCGGCGTTAGGCCCGTTGATTGGCCGCCTGGCGGCCGCCCGGAGCACGCCCGAGGATGCCGAGGCG
+TTGTGTGCGGCGCTGGAAGTGGTGCAACAGGCGGACACGGCCGCGGCGCGGCAGGCAGCCGATCTTGCCT
+ACTTCCGGGTGCTCATCCACAGCACTCGCAACCGCGCATTGGGGTTGCTCTACCGCTGGGTGGAGCACGC
+CTTCGGCGGCCGCGAGCATGCGCTCACCGGGGCCTACGACGACGCGGACCCAGTGTTGACCGACCTGCGG
+GCGATCAACGGGGCGGTGCTGGCCGGTGACCCGGCGGCCGCTGCCGCGACCGTCGAGGCGTATCTGAACG
+CCAGTGCGCTGCGCATGGTCAAGTCCTACCGCGACCGCGCTTAGCTACTGGGCCGCACGCGTCGCCGGAT
+GTACGGCGATGAGCCCTAATTGACTGCGGCGCTTGCACATTGCTGCGAGTTCCCCATAGGCCTTCTCCCC
+GAGTAATTCGGTGAGTTCGTCGGCAAGGCTCTGCCACACCTGCTTGGTTCCGACATGGGCGGCCGGATCG
+CCGGTGCAATACCAGTGCAGGTCAGCACCACCCGAGCCCCAACCGCGGCGGTCATATTCGGTGAGGGTGG
+TCTTGAGGATTTCGGTGCCGTCGGGGCGGGTCACCCATTCCTGGCTGCGCCGGATCGGCAACTGCCAGCA
+GACATCGGGTTTCATCGTCAACGGCGGCACGCCCAGCTTGAGGGCTTTGCTGTGCAGCGCGCAGCCGGCG
+CCACCGGCGAACCCGGGCCGGTTCAAGAAGATACACGCGCCCTTGTGTTTGCGGGTGCGGTGCTGGGGTT
+GGCCGTCGTGCTCGTCGAGTTCCAGGTAGCCCTTGCGGCGCAGGCCCTTTGCCCGGAACTGCCAGTCGTC
+GTCGGTCAGCTTGTGCACCGCGTCGGCCAACCGGGTGCGGTCGTCGTCGTCGGACAGGAACGCACCGTGC
+GAACAACAGCCGTCGTTTGGCCGGCCCGCGACGGTGCCCTGGCAGGCGGGTGTGCCGAATACACACGCCC
+AGCGCGACAGCAACCAGGTAAGGTCGGCCGCGATCAGGTGCTCGGGATTGTCCGGGTCGTAGAACTCCAC
+CCACTCACGGGCGAAGTCCAACTCGACTTCTTGCCCCGGGTGCACCGGTCTCCGTCGCGAATTTGCCACG
+GATTCAACGTTAGACCACGAAGCCCGCCGCGGGATTCCGCCATAGCCCAGCACGGCCGGCACATGCCACC
+GGGCGCCTTGCGCGGGTCGCCACACGCCCGTATCTTCGCCCGGCTAGTTTGTTTTCGTGCGATTGGGCGT
+GCTGGACGTGGGTAGCAACACGGTCCATCTGCTGGTGGTCGATGCCCACCGCGGCGGCCACCCGACCCCG
+ATGAGCTCGACGAAGGCCACGCTGCGGCTGGCCGAGGCCACCGACAGCTCGGGCAAGATCACCAAGCGCG
+GAGCCGACAAGCTGATTTCCACCATCGACGAATTCGCCAAGATTGCCATCAGCTCGGGCTGTGCCGAGCT
+GATGGCCTTCGCCACGTCGGCGGTCCGCGACGCCGAGAATTCCGAGGACGTCCTGTCCCGGGTGCGCAAA
+GAGACCGGTGTCGAGTTGCAGGCGCTGCGTGGGGAGGACGAGTCACGGCTGACCTTCCTGGCCGTGCGAC
+GATGGTACGGGTGGAGCGCTGGGCGCATCCTCAACCTCGACATCGGCGGCGGCTCGCTGGAAGTGTCCAG
+TGGCGTGGACGAGGAGCCCGAGATTGCGTTATCGCTGCCCCTGGGCGCCGGACGGTTGACCCGAGAGTGG
+CTGCCCGACGATCCGCCGGGCCGGCGCCGGGTGGCGATGCTGCGAGACTGGCTGGATGCCGAGCTGGCCG
+AGCCCAGTGTGACCGTCCTGGAAGCCGGCAGCCCCGACCTGGCGGTCGCAACGTCGAAGACGTTTCGCTC
+GTTGGCGCGACTAACCGGTGCGGCCCCATCCATGGCCGGGCCGCGGGTGAAGAGGACCCTAACGGCAAAT
+GGTCTGCGGCAACTCATCGCGTTTATCTCTAGGATGACGGCGGTTGACCGTGCAGAACTGGAAGGGGTAA
+GCGCCGACCGAGCGCCGCAGATTGTGGCCGGCGCCCTGGTGGCAGAGGCGAGCATGCGAGCACTGTCGAT
+AGAAGCGGTGGAAATCTGCCCGTGGGCGCTGCGGGAAGGTCTCATCTTGCGCAAACTCGACAGCGAAGCC
+GACGGAACCGCCCTCATCGAGTCTTCGTCTGTGCACACTTCGGTGCGTGCCGTCGGAGGTCAGCCAGCTG
+ATCGGAACGCGGCCAACCGATCGAGAGGCAGCAAACCATGACGGGACCACACCCCGAAACAGAGAGCTCC
+GGTAACCGGCAGATCTCGGTGGCCGAGTTGCTGGCCAGGCAAGGGGTCACCGGCGCCCCGGCCCGACGGC
+GCCGGCGGCGACGCGGCGATAGTGACGCCATCACGGTCGCCGAGCTGACCGGTGAGATTCCGATCATTCG
+TGACGACCATCACCACGCCGGCCCGGACGCGCACGCGAGCCAGTCTCCGGCGGCTAACGGGCGAGTCCAG
+GTTGGCGAAGCTGCCCCACAGTCGCCGGCGGAACCAGTCGCCGAGCAGGTTGCCGAAGAGCCAACGAGAA
+CCGTGTACTGGTCGCAACCCGAGCCGCGCTGGCCCAAGTCCCCCCCGCAGGACCGGCGCGAGTCCGGGCC
+CGAGCTTAGCGAGTACCCGCGGCCACTGCGCCACACGCATAGCGACAGAGCACCCGCGGGGCCGCCGTCC
+GGTGCCGAACACATGAGTCCGGATCCGGTCGAGCACTACCCCGATCTCTGGGTGGATGTCCTGGACACCG
+AGGTGGGCGAAGCGGAAGCCGAGACCGAGGTGCGCGAAGCGCAACCTGGGCGCGGCGAGCGCCACGCCGC
+AGCGGCGGCGGCCGGCACCGACGTCGAGGGTGATGGTGCGGCCGAGGCGCGGGTTGCCCGTCGTGCCCTG
+GACGTGGTCCCGACGCTGTGGCGCGGCGCGTTGGTCGTGCTGCAGTCGATCCTGGCCGTTGCCTTCGGTG
+CCGGGTTGTTCATCGCCTTCGACCAGTTGTGGCGCTGGAACAGCATAGTGGCGCTAGTGCTATCGGTGAT
+GGTCATCCTTGGCCTAGTGGTCTCGGTGCGGGCAGTCCGCAAGACCGAAGACATCGCCAGTACGTTGATC
+GCGGTTGCGGTGGGGGCGCTGATTACCCTGGGACCGCTGGCCTTGTTGCAATCGGGCTAGCCGCCACCAC
+ACACAGTGCGCCCAGCAATCAAAGTCGGCTTGTCGACGGCCTCGGTGTACCCGTTGCGGGCCGAGGCCGC
+GTTCGAGTACGCCGACAGGCTTGGCTACGACGGGGTCGAGCTGATGGTCTGGGGTGAATCGGTCAGTCAG
+GACATCGATGCCGTCCGGAAGCTGTCGCGCCGCTACCGCGTGCCGGTGTTGTCGGTGCACGCTCCGTGCC
+TACTCATCTCGCAGCGGGTGTGGGGCGCCAATCCGATCCTCAAGTTGGACCGCAGTGTGCGGGCCGCCGA
+ACAACTGGGCGCGCAAACGGTCGTCGTGCATCCGCCTTTCCGCTGGCAACGACGCTACGCCGAAGGGTTC
+AGCGATCAGGTTGCCGCCCTAGAAGCGGCCAGCACCGTGATGGTGGCCGTTGAAAACATGTTTCCCTTCC
+GAGCGGACCGGTTTTTCGGGGCCGGCCAGTCCCGGGAACGGATGCGTAAGCGGGGTGGTGGCCCAGGTCC
+GGCGATCTCGGCGTTCGCGCCGTCCTACGACCCGCTGGACGGCAACCACGCGCATTACACGCTGGACCTC
+TCGCACACCGCGACTGCGGGCACCGACTCGCTGGATATGGCGCGGCGGATGGGCCCAGGGCTGGTGCACC
+TGCACCTGTGTGACGGCAGCGGCCTGCCCGCCGACGAGCACCTGGTGCCCGGCCGCGGTACCCAGCCGAC
+CGCCGAGGTGTGCCAGATGCTGGCCGGCAGCGGCTTCGTCGGCCACGTCGTGTTGGAGGTGTCCACCTCA
+AGCGCGCGTTCGGCCAATGAACGCGAATCCATGCTGGCCGAGTCGTTGCAGTTCGCCCGCACTCACCTGC
+TGCGTTGATATGCCGGGAACACTATGAACGCGTTGTTCACCACGGCGATGGCGCTGCGCCCGCTTGACTC
+CGATCCCGGCAATCCGGCGTGCCGGGTTTTTGAAGGCGAGCTGAACGAGCACTGGACCATCGGGCCCAAG
+GTGCACGGCGGTGCGATGGTGGCGCTGTGTGCCAATGCCGCCCGCACCGCTTACGGCGCGGCCGGACAGC
+AGCCCATGCGGCAACCGGTCGCAGTGTCGGCGAGCTTTCTGTGGGCGCCGGATCCGGGGACGATGCGGTT
+GGTGACGTCGATCCGCAAGCGTGGTCGCCGGATTAGCGTGGCCGATGTCGAGCTCACCCAGGGTGGCCGC
+ACAGCGGTGCACGCCGTGGTCACCCTGGGTGAGCCGGAGCATTTTCTCCCCGGCGTTGATGGGAGCGGCG
+GGGCCAGTGGAACCGCGCCGCTGCTGTCGGCGAATCCGGTGGTGGAGCTGATGGCACCGGAACCGCCCGA
+GGGAGTCGTGCCGATCGGTCCCGGCCATCAGCTGGCCGGGCTGGTGCACTTAGGCGAAGGCTGCGATGTC
+CGGCCGGTGTTGTCGACGTTGCGGTCCGCGACCGATGGGCGGCCACCGGTGATTCAGCTGTGGGCGCGTC
+CACGCGGCGTTGCTCCGGACGCGCTGTTCGCTCTGTTGTGCGGGGACTTGTCGGCCCCGGTGACCTTCGC
+GGTGGACCGCACCGGCTGGGCGCCTACAGTTGCGCTCACCGCCTATCTTCGGGCCCTGCCCGCCGACGGC
+TGGCTGCGAGTGCTCTGCACCTGCGTCGAAATCGGGCAGGACTGGTTTGACGAGGACCACATCGTCGTCG
+ACCGGTTGGGCCGCATCGTGGTGCAGACGCGCCAACTGGCGATGGTGCCTGCCCAGTAGCACGGATCGGC
+CGAGCTGTCTGCGATGCTTTTCGGCATGGCAAGGATCGCGATTATCGGCGGCGGCAGCATCGGTGAGGCA
+TTGCTGTCGGGTCTGCTGCGGGCGGGCCGGCAGGTCAAAGACCTGGTAGTGGCCGAGCGGATGCCCGATC
+GCGCCAACTACCTGGCGCAGACCTATTCGGTGTTGGTGACGTCGGCGGCCGACGCGGTGGAGAACGCGAC
+GTTCGTCGTCGTCGCGGTCAAACCAGCCGACGTCGAGCCGGTGATCGCGGATCTGGCGAACGCGACTGCG
+GCGGCCGAAAACGACAGTGCTGAGCAGGTGTTCGTCACCGTGGTAGCGGGCATCACGATCGCGTATTTCG
+AATCCAAGCTACCGGCCGGGACGCCAGTGGTGCGTGCGATGCCGAACGCGGCGGCATTGGTGGGAGCGGG
+GGTTACAGCGCTGGCCAAAGGCCGCTTTGTCACCCCGCAACAGCTTGAGGAGGTCTCGGCCTTGTTCGAC
+GCGGTCGGCGGCGTGCTGACCGTTCCGGAATCGCAGTTGGACGCGGTGACCGCGGTGTCCGGCTCGGGTC
+CGGCCTATTTCTTTCTGCTGGTCGAGGCCCTGGTGGATGCCGGAGTCGGGGTGGGCTTGAGCCGTCAGGT
+GGCCACCGATCTCGCCGCGCAGACAATGGCTGGCTCAGCGGCGATGCTGCTGGAGCGGATGGACCAAGAC
+CAGGGTGGCGCCAATGGCGAGCTGATGGGGCTGCGCGTGGACCTTACCGCATCACGGCTGCGCGCCGCGG
+TTACCTCGCCGGGCGGTACGACCGCCGCTGCGCTGCGGGAACTCGAACGCGGCGGGTTTCGGATGGCTGT
+CGACGCGGCGGTTCAAGCCGCCAAAAGCCGCTCTGAGCAGCTCAGAATTACACCGGAATGATTCACGAAT
+TTTGAACTGATTATCCCTCACCAGTACCAGTAACCCCACTAGTCCCGCTATTCTCCTCTTTGTAAGCGCG
+TGTGGGTGCCAGCGGAGGGGAAGCCGCTGGGACTGCGCGTGCCTGACACGATTGGGTTGCGATGACGTCT
+ACGAACGGGCCATCGGCGCGGGATACCGGTTTTGTTGAGGGCCAGCAGGCCAAGACACAACTTCTCACCG
+TGGCCGAAGTGGCGGCCCTGATGCGGGTGTCCAAGATGACGGTGTACCGGCTGGTGCACAATGGCGAACT
+GCCCGCGGTTCGGGTCGGGCGGTCATTCCGGGTGCATGCCAAGGCCGTCCACGACATGTTGGAGACTTCG
+TACTTCGACGCGGGCTAGTTGCCGGCCGCACGCGGCCGGAGTCCGCCTGACCGATCTGGCAATGCTCGGG
+CGCTGCCGGTTTGGTGTTCCGTGCGACCGCCCGGGTAGAGTGTCCGGGTCAGATAGCCGTATAGATGGCG
+GGGTCATGGGTTCAGTAATCAAGAAGCGGCGCAAGCGCATGTCCAAGAAAAAGCATCGCAAGCTGCTGCG
+TCGCACCCGGGTGCAGCGCAGGAAACTGGGCAAATAGGTTGCGAGCAGACCCCGCCAGCTCGACCGTCAC
+GCGCTTGTAACGCCGCCGTTTCGCCTGGCCGTTAGGCTGTCGGAGTGAGTTCGTCGAACGGGCGCGGTGG
+CGCCGGAGGAGTCGGCGGCAGCAGTGAGCACCCGCAGTACCCCAAAGTTGTGCTGGTGACCGGTGCTTGC
+CGTTTCCTAGGCGGCTACCTGACCGCACGGCTTGCCCAGAACCCGCTGATCAACCGGGTCATCGCGGTGG
+ACGCGATCGCGCCGAGCAAGGACATGCTGCGCCGGATGGGCCGAGCCGAATTTGTTCGCGCTGATATCCG
+AAACCCATTCATCGCCAAGGTGATTCGCAATGGCGAGGTGGACACGGTGGTGCACGCCGCGGCGGCCTCG
+TATGCGCCGCGGTCCGGCGGCAGTGCGGCATTGAAGGAACTTAACGTGATGGGCGCGATGCAACTGTTCG
+CCGCCTGCCAAAAGGCGCCCTCGGTCCGCCGGGTCGTGCTGAAGTCGACCTCTGAGGTTTACGGATCGAG
+CCCACACGATCCGGTGATGTTCACCGAGGACAGCAGCAGTCGACGTCCTTTCAGCCAAGGTTTCCCTAAG
+GACAGTCTCGATATCGAGGGCTACGTGCGCGCGCTGGGCCGACGCCGCCCCGATATTGCAGTGACTATCC
+TGCGGCTGGCCAACATGATCGGCCCGGCGATGGACACCACGCTTTCACGATATCTGGCCGGGCCGCTGGT
+CCCGACGATCTTCGGCCGTGATGCGCGACTGCAGTTGCTGCACGAGCAGGATGCGCTGGGTGCGTTGGAG
+CGCGCGGCGATGGCCGGCAAGGCCGGAACGTTCAACATCGGAGCCGACGGCATCCTCATGCTGTCGCAGG
+CGATCCGGCGGGCCGGGCGAATTCCGGTGCCGGTGCCAGGGTTTGGGGTATGGGCTCTGGATTCGCTGAG
+GCGAGCGAATCACTACACCGAGCTGAATCGTGAGCAATTCGCTTACCTGAGTTATGGCCGGGTTATGGAC
+ACCACCAGAATGCGCGTCGAACTGGGTTACCAGCCGAAGTGGACGACCGTCGAGGCGTTCGATGACTATT
+TTCGCGGCCGCGGCCTGACTCCCATTATTGACCCACATCGGGTACGCTCCTGGGAGGGTCGCGCCGTAGG
+TTTAGCGCAGCGCTGGGGTAGCCGAAATCCAATTCCATGGAGCGGACTCAGATAGGTTTGGATGGGTAAC
+GTGGCGGGCGAAACCAGAGCGAATGTCATTCCACTGCACACAAATCGGAGCCGGGTAGCGGCGCGCAGGC
+GTGCCGGTCAACGGGCAGAGTCCCGGCAGCATCCGTCGTTGCTGTCCGATCCAAATGACCGGGCGTCGGC
+CGAGCAGATCGCCGCCGTTGTCCGGGAAATCGACGAACACCGGCGCGCTGCGGGTGCCACGACCTCGTCC
+ACCGAGGCCACGCCCAACGACCTTGCGCAACTCGTCGCCGCGGTTGCTGGATTTCTCCGACAGCGCCTGA
+CCGGTGACTACAGCGTCGACGAATTCGGGTTCGACCCGCACTTCAACAGCGCCATCGTACGACCCTTGCT
+GCGATTCTTCTTCAAGTCATGGTTTCGGGTCGAAGTCAGTGGTGTCGAGAACATCCCGCGCGATGGTGCG
+GCGCTGGTGGTGGCCAATCACGCAGGTGTGTTGCCGTTTGACGGGTTGATGTTGTCGGTGGCCGTCCACG
+ACGAGCACCCGGCGCATCGGGATCTGCGGCTGCTTGCCGCCGACATGGTGTTCGACCTCCCCGTGATCGG
+CGAAGCCGCCCGCAAGGCGGGTCATACCATGGCGTGTACGACGGATGCGCACCGGTTGCTTGCCTCCGGC
+GAACTCACCGCGGTGTTCCCCGAGGGATACAAGGGGCTGGGTAAGCGTTTCGAGGACCGTTACCGGTTAC
+AGCGGTTTGGTCGCGGCGGCTTCGTATCGGCCGCGCTACGGACCAAGGCGCCGATTGTGCCGTGTTCGAT
+CATCGGCTCCGAAGAGATCTACCCCATGCTGACCGATGTCAAGCTGCTGGCTCGGCTGTTCGGCCTGCCG
+TACTTCCCGATTACGCCGTTGTTCCCGTTGGCTGGACCGGTCGGGCTAGTGCCGTTGCCCTCGAAATGGC
+GCATCGCGTTCGGTGAGCCGATCTGCACCGCCGACTACGCCTCCACCGACGCCGACGACCCGATGGTGAC
+GTTCGAGTTGACCGATCAGGTGCGCGAGACGATCCAGCAGACGCTATACCGACTGCTTGCCGGCCGTCGC
+AACATCTTTTTCGGCTGACCCTTATTTGACCAGAGTGAACTGGCAGACGTCCGTGTACTTGTCGCGGAAC
+AGGTCTGAGCAGCCACGTAGGTAGTGCATGTAGATGTCGTACGTCTCCTGGCCCTTGAGGGCGATCGCCT
+CATCTTTGTGCGCCTGTAGCGCATCCGCCCAGGCGTTCAGGGTCGGCACGTAGTTGGCCCCGATCCGGTG
+GTAGCGCTCGACCTTCCATCCGGCGTTGGAGGAGTAATAGTCCACCTGCGAGATCCTGGGCAGCCGCCCG
+CCCGGGAAGATCTCGGTCAGGATGAACTTGATGAAGCGCAGCAGGCTCATCGGAGACGTCAAGCCCAGCT
+CCTGGGCTTCCTCTTTGTCCGGGATAGTGATGGTGTGCAGCAGCATCCGGCCGTCGTCGGGCGTCAAATT
+GTAGAACTTCTTGAAGAAGGTGTCGTAGCGCTCGAACCCGGCGTCCCCGGCACCGTCGGCGAAATGCTCA
+AACGCACCGAGTGACACGATGCGGTCGACCGGCTCGTCGAACTCCTCCCAGCCCTGGATTCGCACCTCTT
+TTCGGCGGGGGCTGTCGACCTCATCGAACATCGCCTTGTCGTGGGCGTACTGGTTTTCGCTCAGGGTCAA
+GCCGATGACGTTGACGTCGTACTCGGCGACCGCGTGTCGCATGGTGGAACCCCAGCCGCAGCCGATGTCG
+AGCAGCGTCATGCCGGGCTCAAGGTTCAGCTTGTCCAGTGCCAGCTTGCGCTTCGCGTACTGCGCCTCTT
+CCAGCGTCATATCGGGACGTTCGAAGTAGGCGCAGCTGTACGTCATCGATGGGTCAAGCCAGAGCTTGAA
+GAACTCGTTCGATTTGTCGTAGTGGGATCGAACTGCTTCGACCGGCGGCTTGAGCTGCGTGCCGCTTGTC
+GTGTCGCCCTGTGACGTCATTGAACGGACCCTACTTTCCCCACTAGATCGATGCAATCGCCGCCACCGTT
+GCATCGGCATCGGCTTCGTGGTGGGCCGCTTCTCCCAACATGGTGACGACACTGGTGACCACAGGCTTTC
+CTTCGGCGTCGGTAACTTCGCTTCGGATCTCGGCGAGCACCGTGCCGTGGGATTCGATGACGGAGTCAAG
+ATAGGTGTCGAAGTACAGCTTGTCGTTGGCCAGGATCGGCCGGTGGAAGCGGAACTTCTGGTCGCGATGA
+AAGACCCGGGCGATGTTGATCGGGATATTGAACTTGGTGAAGATCTCCAGCTGCACGCGCCGGCCGGCGA
+TCGCCAGGAAGGTCAGCGGGGCTACCAGCGCGGGGTAACCGGCCGCTGCGGCATCCGGCTCGCTGTAGTG
+GGTCGGGTGGTCGTCTTTGACCGCGACCGCGAACTCGCGGATCTTCTCGCGCCCCACCAGAAAGTGGTCC
+GGCGCCCGATAATGCTTGCCGATCAGTGTCTGGGCTTCTTCGGGAACTGTCATGCCGCTGCCGCCCTCCG
+CTCGAATAGTTGCTAAGCCCTATTGCCCGGCTCCTCCTCGCCCCGCTGCGCGGGTCGCATCGTCGCCAGG
+CTGGGCCCTATTGCCCGGCTCCTCCTCGCCCCGCTGCGCGGGCCGCATCGTCGCCAGGCTAACGGCGCAG
+CTTATCAGCGTGATTGGCGTCTAGAGGCTAGAGCCGCCAACGCGCCGCCGGCCGCACCCAGCGCCAGGGC
+CGACGGAACCCCGATCCGAGCGGCCTTGCGGGCGATTCGGAAATCACGGATCTCCCACCCCCGTTCCCGG
+GCCAGGCTGCGCAGGCGGGCGTCGGGGTTGATGGCGACCGCGGTGCCCACCAGCGACAGCATCGGGACGT
+CGTTGTAGCTGTCGGAGTAGGCGGTGCAGCGTTTGAGATTGAGTCCCTCCCGGATGGCCAGCGACCGCAC
+CGCGTGTGCCTTGCCGGTGCCGTGCAGGATCTCGCCGACCAGTCTGCCGGTGAATATCCCGTCGACCGAC
+TCGGCGACGGTGCCCAGGGCGCCGGTTAGGCCGAGCCGGCGGGCGATGGTGGCCGCGAGTTCGTATGGGG
+TAGCGGTGATCAGCCATACCTGCTGGCCGGCGTCCAGGTGCATCTGGGTGAGTTCGCGGGTGCCGTCCCA
+GATCTTGTCGGCGATGATCTCGTCGTAAATCTCCTCTCCCAAGGCCACCAACTCCGCGACGGATCGGCCC
+TCGATGAACGCGAGCGCCTTGCGCCGGCCAGCGGCGACGTCGTTGCTGTTCTCCTTGCCAAGTAGCTGGA
+ACTTGGCCTGAGCGTAAAGAAATCCGAGGACGTCGCGGTAGGTGAAGTAGTGGCGAGCGGCTAGCCCGCG
+GCCGAAGTGCACCGCCGACGAGCCCTGAACCAAGGTGTTGTCCACGTCGAAGAAGGCGGCTGCGGTCAGG
+TCGATCGGCGGCTGCCGATCGCTGCCGGCGGCGGCGACGGGGGCCGGCATGTCCACCGGCGAGTGGCTGG
+CGCTGGCATCGGGTGGCGGCGGGTCGGCCGGCGAAGCCAGGTCGACGTGACCGGCCTGGTCTGGGCTACC
+CAGGTGGGAGGAAACCATCATTACTCCTAATCGCGGTGCCTGCCCGGTGGCCGATGCTGCGGCCGTTATC
+AACCCTATCCGGCAAATGCGCGGCGGAGCTCTTGGCTGGCGCGGATTGATCTGCAAGCCCAGCGCGGTAT
+CGAAATTCGCGAGGCCGCAGCGACTTTCGTCGTGAACACGACCCGCAGCGGTTCGGGGCCAACATGTCAG
+CCCCATACCGGTACGCGCAAAGCTGGGTACGTGAAATCCTGAATTCTTCAGCCTGTCAACGGTAGCGTCT
+ACGCTAGCTAACGCAACGAGACATCCGATTACTACGCACGTTAGGACATTTCAGGAGGTATCGGGAGGCC
+TAAGGGTCACTAGGTCCGCGCGATGGGCGGAACACGAGGGTGAGGATGATTTCGGTTAGCGGCGCCGTGA
+AACGCATGTGGTTGCTGCTGGCCATCGTCGTGGTGGCCGTTGTCGGGGGGCTTGGTATCTATCGGCTGCA
+CAGCATCTTCGGTGTTCACGAGCAACCCACTGTCATGGTCAAGCCTGATTTCGACGTCCCGCTGTTCAAC
+CCCAAGCGGGTGACCTACGAAGTCTTTGGCCCCGCCAAGACCGCAAAGATCGCCTACCTGGACCCTGATG
+CCCGGGTGCATCGACTCGATAGCGTGTCCCTGCCGTGGTCCGTCACGGTCGAGACGACGCTGCCCGCGGT
+CAGCGTCAACCTCATGGCGCAGAGTAACGCCGACGTGATCAGCTGCCGGATCATCGTCAACGGCGCCGTT
+AAGGACGAAAGGTCTGAGACCTCGCCGCGAGCGCTAACCTCCTGCCAGGTGTCATCCGGATGAGCGAAAG
+ACACGCCGCACTGACGTCACTGCCGCCCATTCTGCCGCGGCTGATCCGCCGGTTTGCGGTGGTGATCGTC
+CTGCTCTGGCTGGGCTTCACCGCCTTTGTCAATCTCGCCGTACCGCAACTGGAAGTGGTCGGAAAAGCAC
+ACTCGGTATCGATGAGCCCCAGCGACGCCGCATCGATTCAGGCGATCAAGCGCGTTGGTCAGGTGTTCGG
+TGAGTTTGATTCCGATAACGCGGTAACGATCGTGCTGGAAGGCGACCAGCCACTCGGTGGGGACGCGCAC
+CGGTTCTATAGCGATCTGATGCGGAAGCTTTCCGCCGATACCCGCCATGTCGCGCACATCCAGCACTTCT
+GGGGGGATCCGCTGACAGCGGCGGGATCCCAAAGTGCGGATGATCGGGCCGCCTACGTCGTGGTGTACCT
+CGTCGGTAACAACGAAACCGAAGCGTATGACTCGGTCCACGCGGTGCGGCACATGGTGGACACCACACCG
+CCACCGCACGGGGTGAAGGCCTATGTCACCGGTCCGGCAGCACTCAATGCCGACCAGGCCGAGGCCGGAG
+ACAAAAGTATCGCTAAGGTCACCGCGATCACGAGCATGGTGATCGCGGCAATGTTGCTAGTGATCTATCG
+CTCCGTAATTACCGCGGTTCTCGTCTTGATCATGGTCGGCATCGACCTCGGCGCAATCCGCGGATTCATC
+GCCTTGCTCGCCGACCACAACATTTTCAGCCTTTCAACATTTGCGACCAACCTGCTCGTTCTCATGGCGA
+TTGCGGCGAGCACGGACTACGCGATATTCATGCTCGGCCGTTACCACGAATCGCGCTACGCCGGCGAGGA
+TCGGGAAACGGCCTTCTACACGATGTTTCACGGGACCGCCCACGTGATCTTGGGTTCGGGTTTGACCATT
+GCCGGCGCCATGTATTGCCTCAGCTTTGCCCGGCTTCCGTATTTTGAAACGCTCGGCGCGCCCATTGCTA
+TCGGCATGCTGGTCGCGGTCTTGGCGGCGCTCACGCTCGGCCCGGCCGTACTGACCGTGGGCAGCTTCTT
+CAAGCTGTTCGATCCCAAGCGGCGGATGAACACTCGGCGGTGGCGCCGGGTGGGAACGGCAATTGTGCGT
+TGGCCGGGGCCGGTGCTCGCGGCGACATGCTTGGTCGCCTCCATTGGCTTGCTGGCCTTGCCCAGTTACC
+GGACAACGTATGATCTGCGCAAGTTCATGCCCGCCAGCATGCCGTCCAATGTGGGGGATGCGGCGGCTGG
+TCGACACTTTTCACGGGCTCGGCTGAACCCTGAGGTGCTGTTGATCGAGACTGACCACGATATGCGTAAT
+CCGGTGGACATGCTGGTGTTGGACAAGGTAGCCAAAAATATCTACCACAGTCCCGGTATTGAACAAGTGA
+AAGCGATAACCCGGCCCTTGGGAACAACCATCAAGCACACTTCGATACCGTTCATCATCAGCATGCAGGG
+CGTGAATAGTAGCGAGCAAATGGAATTCATGAAGGACCGAATTTATGACATACTGGTGCAGGTGGCCGCG
+ATGAATACCTCCATCGAGACGATGCATCGCATGTATGCACTCATGGGCGAGGTCATTGACAACACCGTCG
+ACATGGATCATCTCACGCATGATATGTCGGACATAACGGCTACGCTAAGAGATCATCTCGCGGATTTCGA
+GGATTTCTTCCGGCCTATTCGCAGCTACTTCTACTGGGAAAAACATTGTTTCGACGTTCCGCTCTGCTGG
+TCGATAAGATCGATATTCGATATGTTTGACAGTGTGGACCAGCTGAGCGAAAAGCTCGAGTACCTGGTCA
+AGGATATGGATATTCTGATTACACTGTTGCCGCAGATGCGCGCGCAGATGCCGCCGATGATATCTGCGAT
+GACGACGATGCGGGACATGATGCTTATCTGGCATGGCACGCTTGGCGCGTTCTATAAGCAACAGGAGAGG
+AATAACAAGGACCCCGGCGCGATGGGCCGGGTTTTTGACGCCGCCCAGATCGATGATTCGTTCTATCTGC
+CGCAGTCGGCTTTTGAGAATCCGGATTTCAAGCGGGGGCTGAAGATGTTTTTGTCTCCGGACGGCAAGGC
+AGCCCGCTTTGTCATTGCTCTGGAGGGAGATCCCGCAACGCCCGAGGGCATCTGTCGGGTCGAGCCGATC
+AAGCGGGAGGCTAGAGAGGCCATAAAGGGAACTCCATTGCAGGGCGCTGCGATCTATCTGGGTGGCACCG
+CGGCGACGTTCAAGGATATTCGAGAGGGCGCCAGATACGATCTGCTGATCGCCGGAGTGGCGGCGATAAG
+CTTGATTTTGATCATCATGATGATCATCACCCGAAGTGTGGTAGCCGCAGTGGTTATCGTGGGTACCGTC
+GTGCTTTCCATGGGCGCCTCTTTCGGGCTTTCCGTATTGGTCTGGCAGGACATTCTGGGTATCGAGTTGT
+ACTGGATGGTGTTGGCGATGTCGGTGATCCTGCTCCTGGCGGTGGGATCCGACTACAATCTGCTGCTGAT
+TTCCCGGTTGAAAGAGGAAATTGGGGCCGGATTGAACACCGGAATTATCCGTGCCATGGCTGGTACCGGG
+GGAGTGGTGACGGCTGCCGGCATGGTGTTCGCCGTTACCATGTCGTTGTTTGTGTTCAGCGATTTGCGGA
+TTATTGGTCAGATCGGTACCACCATCGGCCTGGGCTTGCTGTTCGACACCCTCGTCGTGCGCTCGTTCAT
+GACACCGTCCATTGCTGCGCTGCTGGGACGCTGGTTCTGGTGGCCGCTACGGGTGCGCCCGCGCCCGGCC
+AGTCAGATGCTTCGGCCGTTCGCGCCGCGCCGATTGGTTCGCGCCTTGTTGCTGCCGTCCGGCCAGCACC
+CGTCAGCGACTGGCGCCCATGAGTAGGCCCCAGGTGGAGCTTTTGACTCGCGCCGGGTGCGCGATCTGCG
+TGCGGGTAGCGGAGCAGCTGGCCGAACTGTCCAGCGAACTGGGCTTCGACATGATGACGATCGACGTCGA
+TGTCGCGGCGTCGACGGGCAATCCAGGGCTGCGAGCTGAGTTTGGCGATCGGTTGCCGGTGGTCCTGCTG
+GACGGCCGCGAGCACAGCTACTGGGAGGTCGACGAGCACCGGCTGCGTGCGGATATAGCCCGCAGCACAT
+TTGGTAGCCCACCTGATAAACGTCTACCGTAGACACCAGTTTTACTGGGGTAGTCGAGGGAGCTGGCCAG
+GTGGTGCTGCCGTGAGCGTGCTGCTCTTCGGGGTGTCGCATCGTAGCGCGCCGGTCGTCGTCCTTGAACA
+ACTCAGTATCGACGAATCCGATCAAGTCAAGATCATCGACCGAGTGCTGGCTTCGCCGCTGGTGACCGAG
+GCGATGGTGCTGTCGACTTGCAACCGCGTCGAGGTCTACGCCGTAGTGGACGCGTTCCATGGCGGCCTGT
+CGGTGATCGGGCAGGTGCTTGCCGAACACTCCGGTATGTCGATGGGGGAGCTGACCAAGTACGCATATGT
+CCGCTACAGCGAGGCAGCAGTTGAGCACCTGTTCGCGGTTGCCAGCGGCCTGGACTCGGCGGTGATCGGC
+GAGCAGCAGGTGCTTGGTCAGGTGCGCCGCGCCTATGCCGTCGCCGAATCCAACCGCACGGTCGGCCGCG
+TGCTGCACGAATTGGCCCAGCGGGCGCTGTCGGTGGGCAAGCGAGTGCACTCCGAAACCGCCATTGACGC
+TGCCGGTGCCTCCGTGGTGTCGGTCGCCCTGGGAATGGCCGAGCGCAAATTGGGCTCGTTGGCGGGCACG
+ACCGCGGTGGTGATCGGCGCCGGGGCGATGGGCGCGCTGTCGGCGGTACATCTGACCCGTGCCGGCGTCG
+GGCACATTCAGGTGCTCAACCGGTCGTTGTCCCGGGCGCAGCGGTTGGCCCGAAGGATCCGCGAATCTGG
+CGTGCCGGCCGAGGCGCTAGCGCTCGACCGCCTGGCTAATGTCCTGGCCGATGCCGACGTGGTGGTCAGC
+TGTACTGGGGCGGTGCGTCCGGTGGTGTCGCTGGCCGATGTGCATCATGCGCTGGCCGCCGCCCGCCGTG
+ACGAGGCCACCCGTCCGTTGGTGATATGCGACTTGGGCATGCCGCGTGACGTCGATCCTGCGGTGGCCAG
+ATTACCGTGTGTGTGGGTCGTGGACGTGGATAGCGTGCAACATGAACCCTCGGCACATGCCGCGGCTGCC
+GACGTTGAGGCCGCCCGCCACATCGTCGCCGCCGAAGTTGCCAGCTATCTGGTGGGGCAGCGGATGGCCG
+AGGTCACCCCAACCGTGACGGCGTTGCGCCAGCGAGCCGCCGAAGTGGTCGAAGCGGAATTGCTGCGCCT
+GGACAACCGGCTGCCCGGCCTGCAGAGTGTCCAGCGCGAGGAGGTGGCCCGCACCGTACGGCGAGTCGTG
+GACAAGCTGTTGCACGCGCCTACCGTGCGGATCAAGCAGCTCGCCAGTGCGCCCGGCGGTGACAGCTACG
+CCGAGGCGCTGCGCGAACTCTTCGAGCTTGACCAGACCGCCGTCGATGCCGTCGCCACTGCAGGTGAATT
+ACCGGTGGTGCCAAGCGGATTCGACGCTGAAAGTCGCCGCGGTGGAGGCGACATGCAAAGCAGCCCGAAG
+CGATCGCCGAGTAACTGATTGGCGCACGTGATCCGGATAGGTACCCGGGGCAGCTTGCTGGCCACCACTC
+AGGCCGCCACTGTCAGAGACGCCCTCATCGCTGGTGGCCACTCCGCGGAGTTGGTGACCATCAGCACCGA
+GGGTGACCGATCCATGGCGCCGATCGCCAGTCTCGGGGTTGGCGTCTTCACCACGGCGTTGCGCGAGGCG
+ATGGAGGCAGGCCTCGTCGATGCGGCGGTGCATTCGTACAAGGATTTGCCGACTGCCGCCGATCCAAGGT
+TCACGGTTGCGGCGATACCGCCGCGCAATGACCCCCGCGACGCGGTGGTAGCCCGTGACGGGCTGACGCT
+GGGGGAATTGCCGGTCGGATCGTTGGTGGGCACATCCTCGCCGCGGCGGGCCGCACAGCTTAGAGCATTG
+GGTCTCGGTTTGGAAATCCGCCCCCTACGAGGCAACCTAGATACCAGGTTGAACAAGGTAAGTAGCGGCG
+ATCTTGACGCCATCGTGGTGGCCCGGGCTGGTCTGGCGCGGCTGGGCCGCCTCGATGACGTGACCGAGAC
+GTTAGAGCCGGTGCAGATGTTGCCCGCGCCGGCTCAGGGCGCGCTCGCGGTCGAATGCCGCGCCGGCGAC
+AGCCGGTTGGTGGCAGTGCTGGCGGAGTTGGATGACGCCGACACGCGTGCGGCGGTCACCGCCGAGCGAG
+CCCTGCTTGCCGACCTGGAGGCAGGTTGCTCCGCACCGGTGGGAGCGATCGCAGAAGTGGTCGAGTCCAT
+CGATGAGGACGGCCGTGTCTTCGAGGAGCTGTCGCTGCGCGGGTGCGTGGCGGCGCTGGACGGATCCGAC
+GTGATCCGCGCGTCCGGCATCGGCAGTTGCGGTCGGGCACGGGAGCTGGGGCTCTCGGTCGCCGCGGAGC
+TGTTCGAGCTGGGCGCCCGGGAGCTGATGTGGGGAGTGCGGCATTAGCCCGCATGAAGAAGTGACTGGGA
+GTGACAATCATGACGCGAGGGCGTAAGCCGAGACCGGGCCGCATCGTTTTCGTGGGCTCCGGTCCGGGCG
+ACCCCGGCTTGCTTACGACACGGGCTGCCGCGGTGCTGGCCAACGCCGCGCTGGTGTTCACCGATCCCGA
+CGTACCGGAGCCGGTGGTGGCGCTGATCGGCACGGATCTGCCCCCCGTGTCCGGCCCGGCGCCCGCCGAG
+CCGGTTGCCGGGAACGGCGATGCGGCCGGCGGAGGAAGTGCGCAGGAACACGGCCGGGCCGCGTCCGCGG
+TAGTCTCCGGTGGTCCTGACATCCGCCCGGCGCTGGGCGATCCCGCCGATGTGGCCAAGACGCTGACCGC
+CGAGGCCCGTTCGGGTGTCGACGTGGTGCGGCTGGTGGCGGGCGATCCGCTCACGGTGGATGCGGTAATC
+AGCGAGGTGAACGCCGTCGCACGCACCCACCTGCACATCGAAATCGTGCCCGGCCTGGCCGCCAGCAGCG
+CGGTCCCGACCTATGCCGGGTTGCCGCTGGGTTCGTCGCACACCGTCGCCGACGTGCGTATCGACCCCGA
+AAACACCGACTGGGACGCGCTGGCTGCCGCACCCGGGCCGCTGATCCTGCAGGCCACCGCATCGCATCTA
+GCCGAATCGGCCCGCAGCCTGATCGATCACCAGCTGGCCGAGTCCACTCCGTGCGTGGTGACCGCACACG
+GCACCACCTGTCAGCAGCGTTCGGTCGAGACCACACTTCAGGGATTGACCGACCCGGCCGTCCTGGGCGC
+TACCGACCCCGCGTGCTCCGCAAACGGGAGGGACTCCCAGGCCGGACCGCTGATAGTGACCATCGGCAAG
+ACGGTGACCAGTCGGGCAAAGCTGAACTGGTGGGAGAGCCGCGCCCTCTACGGCTGGACGGTGTTGGTGC
+CGCGCACCAAGGACCAGGCCGGCGAGATGAGCGAGCGGCTCACGTCGTACGGCGCGCTGCCGGTGGAGGT
+GCCGACCATCGCCGTCGAGCCGCCGCGCAGCCCCGCGCAGATGGAGCGCGCCGTCAAGGGCCTGGTCGAT
+GGCCGATTCCAGTGGATCGTGTTCACCTCCACCAACGCGGTGCGTGCGGTGTGGGAGAAGTTCGGCGAGT
+TCGGTCTGGATGCCCGCGCGTTCTCCGGGGTGAAGATCGCCTGTGTCGGCGAGTCGACGGCCGACCGGGT
+GCGCGCCTTCGGAATCAGTCCCGAGCTGGTGCCCTCCGGGGAGCAGTCCTCGCTTGGCTTGCTAGACGAC
+TTCCCGCCCTACGACAGCGTTTTCGACCCGGTGAACCGGGTTTTGCTGCCGCGCGCCGACATCGCCACCG
+AAACGCTGGCCGAGGGACTGCGAGAGCGTGGCTGGGAGATCGAGGACGTCACCGCCTACCGGACCGTGCG
+GGCCGCGCCGCCGCCGGCCACTACCCGGGAAATGATCAAGACGGGCGGGTTTGACGCGGTATGTTTCACC
+TCCAGCTCGACGGTGCGAAACCTGGTCGGCATCGCCGGCAAGCCGCACGCGCGGACGATCATCGCCTGCA
+TAGGGCCAAAGACCGCCGAGACCGCAGCCGAGTTCGGCTTGCGGGTCGATGTCCAGCCGGACACCGCCGC
+CATCGGCCCGCTGGTCGATGCGCTGGCCGAGCATGCCGCCCGGTTGCGCGCTGAGGGTGCGCTGCCCCCG
+CCGCGCAAGAAGAGCCGCAGGCGCTAGTGGCCCACCCTCGTCAGGTGAGCGTGCGTGTCTGTACACCGAC
+ACGCCGACCGAGCTGGCATTTTGCGTACGCTCGCGGCTACGAATGAGCATGAGTTCCTATCCGCGGCAGC
+GACCGCGCCGGCTCCGCTCCACCGTCGCGATGCGCCGTCTGGTTGCGCAAACCTCGTTGGAGCCAAGGCA
+TTTGGTGCTGCCGATGTTCGTTGCCGACGGCATTGACGAGCCGCGGCCGATTACCTCCATGCCGGGCGTG
+GTACAGCACACCCGGGATTCGCTACGTAGGGCCGCGGCAGCCGCGGTGGCCGCCGGCGTGGGTGGGCTGA
+TGCTTTTCGGCGTGCCGCGCGACCAGGACAAGGACGGTGTCGGTTCGGCGGGCATCGACCCCGACGGGAT
+CCTCAACGTCGCCCTTCGCGATCTGGCCAAGGACCTGGGTGAGGCCACGGTGTTGATGGCCGACACCTGT
+CTGGACGAGTTCACCGACCACGGGCACTGCGGTGTGCTCGATGACCGGGGCCGGGTCGATAACGACGCCA
+CCGTGGCCCGCTATGTGGAACTGGCTGTGGCGCAAGCGGAATCGGGCGCCCACGTGGTCGGACCCAGTGG
+GATGATGGATGGCCAGGTAGCCGCGATCCGGGACGGTTTGGACGCCGCCGGCTACATCGATGTGGTGATC
+TTGGCCTACGCCGCGAAGTTTGCTTCGGCGTTCTACGGCCCGTTCCGCGAGGCGGTGAGCTCTAGCCTGT
+CCGGGGATCGGCGCACCTACCAGCAGGAGCCGGGCAACGCCGCCGAGGCGCTGCGTGAGATCGAGCTCGA
+TCTCGACGGAGGCGCCGACATTGTGATGGTCAAACCCGCGATGGGCTACCTCGATGTGGTGGCGGCCGCG
+GCGGACGTCTCGCCGGTCCCGGTGGCCGCCTATCAGGTCTCGGGAGAGTACGCGATGATTCGTGCGGCGG
+CGGCCAATAATTGGATCGATGAGCGTGCCGCGGTGCTAGAGTCGCTGACCGGTATCCGGCGTGCCGGCGC
+CGACATCGTGCTCACCTACTGGGCGGTAGACGCGGCGGGCTGGCTTACGTGACGGAGGCCTGACATGACA
+CCAACCGGGGATACCAAGCCCAAGTTGTTGTTCTACGAACCCGGCGCGAGCTGGTACTGGGTGCTGACTG
+GTCCGCTTGCGGCGGTGTCGGTGCTCCTCCTCGAGATATCCAGCGGCGCCGGGGTTGGGTTGATAACGCC
+GGCGATCTTTCTGGTGATGGTGTCGGCGTTCGTGGCATTGCAGGTGAAGGCGGCGCGGATTCACACGTCG
+GTCGAGCTGACGCATGATGCCTTGCGCCAAGGCACCGAGACCATCAGGCTGGCCGAAATCGTCAAAATCT
+ATCCGGAGGCAGACGGCCGCGAGACGTCCGGGGAAGAGCCGGCAAAGTGGCAGTCGGCGCGGACCCTGGG
+CGAGCTCGTCGGCGTACCGCGCGGCCGGGTGGGAATCGGGCTGAAGCTGACCGGAGGCCGCACCGCCCAG
+GCCTGGGCGCGTCGTCATCAACAGCTGCGGGCGGCGCTGACTCCGCTGGTTCAGGAGCGGCTCGGGCCCG
+TGGATTCTGATGTCGCCGACGTCAACGGTGACGACGCCGGGCCAGCGCGGTGATCGCCCGCTACCGGGCC
+GGGGCCGAACTGTTCCTGGCTTGTGCCGCGCTTGCCGGATCTGCGGCGAGCTGGTCGCGGACCCGCTCCA
+CCGTGGCCGTCGCGCCCGTCATCGACGGCCAGCCGGTCACCCTGTCGGTGGTCTATCACCCGCAACCGTT
+GGTGCTGACCCTGCTGCTGGCGACGATCGCCGGCGTGTTGTCGGTGGTGGGGACGGCCAGGTTGCGGCGC
+GCGCGAGCTGGCTTGAACGCACATCCGGACGGCTTGAACCAGCGTCCGCCCGGCGGTTGGTGTCATTGAG
+CCGTTTGCGTGGATCACTTCCGCTGCTGCTTGATCGGGCCCTGGTCTGTGTCGGCAGCGGCTGGTAGTAT
+CGAAAGTATGTTCGATCAGGTGCGGGGGCGCATGCCTTCACCGGAGGCGATCGCTCATTTTGATGAGCGG
+TTTGAATGCCATGCTCCGCGGACCACGAGGGTGTCGGCGGCGTTCATCGATCGGATCTGCTCGGCGACTC
+GGGCCGAAAACCGGGCCGCTGCGGCGCAGTTGGTGGCGTTGGGGGAGTTGTTCGCCTATCGGTGGTCGCG
+TTGCGGGGGCCGCGAGGAGTGGGTGATGGACACCATGGCGGCGGTGGCCGCCGAGGTGGCGGCGGCGTTG
+CGGATCAGTCAGGGTCTGGCGGCCAGCCGGTTGCGGTATGCGCGGGCGATGCGTGAGCGGCTGCCTAAGA
+CGGCTGAGGTGTTTAGCGCCGGCGACATCGGCTATCTGATGTTTGCCACGATTGTGTATCGCACCGACTT
+GATCGTTGACCCTGATGTTTTGGCGGCGGTGGATGCGCAGTTGGCCGCCAATGTGGCGCGTTGGCCCTCG
+ATGACCAAGGCCCGCCTGGCTGGGCAGGTCGATAAGATCGTGGCGCGTGCCGATGCCGATGCGGTGCGGC
+GGCGCAAGGAGTATCAGGCCCAGCGCCAGTTCTGGGTCGGGGAAAGCCAAGACGGTGTGTGCCAGATCGG
+TGGCAGCCTGTTGGCCGTCGACGCACACGCCCTCGATGCGCGGTTGAGCGCGTTGGCGGGCACCGTGTGT
+GAGCACGATCCGCGCAGCCGTGAGCAGCGCCGCGCGGACGCGTTGGGGGCGTTGGCGGGCGGGGCCGATC
+GGCTGGGCTGTGGCTGTGGGCGCGCTGATTGTGCGGCCGGGAAGCGGCCTGCGGCCCCGCCGGTGGTGAT
+TCACCTGATCGCCGAGGCGGCCACGATCAATGGCACGGGCTCGGCGCCGGCATCGCAGATGAACGCCGAC
+GGGCTGATCACCGCCGAACTGGTGGCCGAGCTGGCCAAGACGGCCACGCTGGTGCCGCTGGTTCATCCCG
+GCGATGCGCCGCCCGAGCCGGGGTATGCGCCGTCGAAAGCGCTCGCCGATTTCGTTCGCTGCCGGGATCT
+GACGTGTCGCTGGCCCGGCTGTGATGAGCCCGCCACCAATTGCGACCTGGATCATACGATCCCGTATGCC
+GCTGGTGGGCCCACCCATGCGTCGAACCTGAAATGTTACTGCCGTACCCATCACCTGGTGAAAACGTTTT
+GGGGATGGCGTGATCAACAGCTACCCGACGGCACCCTGATTTTGACCTCCCCGTCCGGGCATACCTATGT
+CAGCACCCCGGGCAGTGCGCTGCTGTTCCCCAGCTTGTGCCACTTCAGCGGCGGCATCCCGGCACCGGAA
+GCCGACCCACCCTACGACCATTGCGACCAGCGCACAGCGATGATGCCCAAACGCCGGCGCACCCGCGCCC
+AAGACCGGGCCTATCGCATCGCCACCGAACGTCGACAAAACCACGCCGCCCGCCAGCGCGCCCAGGTGCT
+CACCCAGACCGCCGCGGCCACCGACACCCACGGCCCACCACCGGATCACAACGACGACCCACCGCCGTTT
+TAGGCTGACCTGCTGATTAGCGGTAGCACCAGCTGACGGCGGCGGTCGATGGCGTCAGCCAGGTCGTGGA
+GCGCTTTATGCACCGAGCGCGCCATCGGGAACATGGATTCATGCTCGCCCTGGTCACAGCGGCCACCTAG
+CTGTTCGACTACTGCGGGGCTCGCGACTAATGCCCACTGGACGCCGGCGGCTCGGCAGTCCTCATCGAGG
+ATGCACAAGAGCGAGATGCCGGCCCCACTGAAGTGACTCAACTCGCTCAGGTCGAGCACCATCGGATTTG
+TTCCGAGGCTGAAACGCCGGACGTGCTCGCTGATCTGCTCGACATTGGCGGCGTCGATCTCGCCTCGGAT
+GGTCACCACTGTCGCCAGGTGATGCAGGTAGGCCCGAATCTGAGCGCCACCGTAGTCAACGGCGGCATTT
+CCGGGCCGCGTCGTGACGCTGCAAGCCGATTTTGACGTCGGGATCGTGGTAGTCATCAATAGCCTCGTTC
+TCCGTCGCGTTGCGGGCCGACCGATCGCCGGCTAAAGCTGCCTTTAACCAAACCCGCAAAATCTAAGGGG
+AGCGAAAGCCGCCTCTAACTCTTTGCTAAGAAGCGATTTTCGGGGTGCTCCCGGCGACCCACGCCGTCGC
+GGCCATGGCGCTGTTAGGCTGCGATGGCTGCCGGTTGCTAGTCGGGGGCTGATGATATGGCCGGTGGTAT
+GGATCAGCCGCCCGGTCAGCCTAGAAGGCGGACCAGACAGCAGAGTTCAGACGGAAAGAACGGCGTGCGC
+GCTGCAGAGATCACCGGAGAAATTAGGGCCCTGACAGGATTGCGCATCGTCGCGGCGGTGTGGGTAGTGC
+TGTTTCACTTCCGACCGATGTTGGGTGATGCGTCACCGGGCTTCCGCGACGCCCTCGCGCCGGTGCTCGA
+CTGCGGCGCGCAGGGTGTAGACCTCTTCTTCATCCTCAGTGGGTTCGTGCTGACCTGGAACTACCTCGAC
+CGCATGGGCCGGTCGTGGTCGGTCCGTGCCAACCTGCACTTCTTGTGGCTGCGGCTGGCCAGGGTGTGGC
+CGGTGTACCTGGTCACCTTGCACCTGGCCGCCGTGTGGGTCATCTTTACGCTGCACGTCGGTCACGTGCC
+GTCTCCGGAGGCAGGCCAGCTGACCGCGATCAGCTATGTGCGCCAGATCCTGCTGGTGCAGCTGTGGTTT
+CAGCCGTATTTCGATGGATCCAGTTGGGATGGACCGGCCTGGTCGATCAGTGCGGAATGGTTGGCCTACT
+TGCTGTTCGGTCTGCTCATTCTGGTCATCTTCCGGATGAAGCATGCCACCAGGGCGCGGGGCCTGATGTG
+GCTGGCCTTCGCGGCGTCGTTGCCGCCCGTGGTGCTGCTGTTGGCCAGCGGCCAGTTCTATACGCCATGG
+AGCTGGCTGCCCCGAATCGTGACGCAATTCGCCGCGGGAGCGCTGGCGTGTGCCGCCGTCCGCAGGTTGC
+GGCCGACCGATCGCGCTCGCCGCATCGCCGGGTACCTTTCCGTGCTGGTCGGCGTCGCGATTGTCGGCAT
+CCTCTACCTGTTGCACGCGCATCCGCTCGCCGGGGTCGAGGACAGCGGCGGGGTGGTCGACGTGCTGTTC
+GTTCCGCTGGTGATCAGCCTGGCGATTGGCGTCGGCAGCCTGCCGGCGTTGCTGTCGACGCGGTTGATGG
+TTTTTGGCGGGCAGATCTCGTTTTGCCTCTACATGGTGCACGAGCTGGTGCATACCGCCTGGGGATGGGC
+CGTGCAACAATACGAGCTTGCGCTGCAGGATCAGCCGTGGAAATGGAACGTCGTCGGTCTGCTCGCGATC
+GCCCTGGGGGCTGCGATCTTGCTGTATCACTTCGTCGAAGAACCGGACCGCCGATGGATGCGCCGGATGG
+TCGACGTCAAAGCCGCGAGTGCGAGAAGCGAGCCCGGGGAGCCGGTAGGCAGCACGCGTTATCAAATCGA
+CGATGCGCTGGAAGGGGTTTCGGCCCGCGCGGTGTGACGGTTGAGTGGGGCTGCAGCGGGTCGACGCGAG
+TTCACATCGGTTTCCTCGTACGATTCCCTTGATTTGGACGCGGCGCACGACCCGTTCAACTTTGAGCCGA
+GTCCAGTGGAGCCATCAGTGGAGTCAGTGTGAGTCGCCCGGGTACATACGTCATTGGTCTCACTCTCCTG
+GTCGGCCTGGTCGTCGGCAATCCAGGGTGCCCGCGGTCCTACCGCCCACTGACCCTGGATTACCGGCTTA
+ACCCGGTCGCGGTGATTGGCGACTCCTATACCACCGGCACCGATGAGGGCGGTCTGGGCTCGAAATCATG
+GACCGCTCGCACCTGGCAGATGCTCGCTGCACGTGGCGTGCGGATCGCAGCCGACGTGGCCGCCGAGGGC
+CGGGCCGGCTACGGGGTGCCCGGCGACCACGGCAACGTGTTTGAGGATCTGACCGCCAGGGCCGTCCAGC
+CCGACGATGCACTGGTGGTGTTCTTTGGCTCCCGCAACGACCAAGGCATGGATCCTGAGGATCCCGAGAT
+GCTGGCCGAAAAGGTCCGCGACACTTTCGATCTAGCGCGCCACCGCGCACCATCCGCGAGCTTGCTGGTG
+ATCGCACCGCCGTGGCCTACCGCCGACGTACCTGGCCCAATGCTGCGGATTCGCGACGTGCTGGGCGCTC
+AGGCGCGGGCCGCAGGAGCAGTGTTTGTCGACCCGATCGCCGACCACTGGTTTGTCGACAGGCCCGAGCT
+GATCGGCGCGGATGGCGTGCATCCCAACGATGCGGGACATGAGTATCTGGCGGACAAGATCGCGCCGCTG
+ATCAGCATGGAGTTGGTTGGATGAGTTGGGAGTCACGAGCCACGCAAAGGGTTAGCGTGACGACGGTCGA
+CGTGCTAGTCCTCTGCGTGCCGTTCGTAATCCCAACGCTCAAGGCGCGCCTGCAACTGCAGGAGACCAAG
+TCCGGCGAGTGGCGCCGCGGCGGTGAGGAAGGCCAGCAGCATCGGACTCATCTCAGAACCTCCAAAACCA
+TTTCATTCGTACCACGTTCGTCGTCGAGGGGTGGTTCTTTCGCGAAACATGTCCGTCCGAATTCAGCTGT
+CCTCAGCCACCGCCACGCTGCGCCACGTCAGCTAGGACGCCATCCAAGCCAGTTCGCCGGGCAACTGTTC
+GCGCCAGTACGACGCGTCGTGTCCTCCGGGCGAGAAGCTGCCGGCAGGCGGTTGGTGCAGTTGGTTGACG
+AATTGGCGAGTGGCGAAGTAGAAGCGGTCGCTGGTGCCGCAATCCACCCGTAGCGGGATTGAGTTCAGCG
+CGGGCAGGCCCAACACGCTGTGCTGCACATAGTCGTCGTAGCTGTCGAACGCCCCGGGTGTGCTGCCGGT
+GAACGACGTGAACAATGCCGGGCTGATGGCACAGATCCCCGCGGTTCTGGCCGGACCCAACCGGGCACCC
+AGGAGCAGCGCGCCGTATCCCCCCATCGACCACCCCAGGAATCCCACCCGGGAGGTGTCCATACCCATCG
+AGGTCAGCATCGGCAGCAGCTCGTCGAGCACCATCGCACCCGAGTCCCCGCCGGAAGAGCGACGGTGCCA
+GTAGGTGTTGCCGCCGTCGACGCCGACCACCGCGAACGCTGGCTTGCCCTCCTTGACCAGGCGGGCCAAC
+CCCTGCTCGACGCCGAGATCCAGCATCATGCCGGCGTTGCCGTCCTTGCCATGCAGTGCGATCACTGGCC
+GCAGCTGCCCGCTCTGGCCGGGCGGCATGGAGATCACCCAGTTGGTCTTGATGCCTCCGCGAGCCGCCGA
+GATGAACGAGCCGGAGATCCTGGTCGGCAAGCTGCTGCCCGCCGTCGGGGGCTCGAACGGCGCCGGGGCC
+GCCTGCGGCTCAAGTGGGTCCACCAGGGCGCCGAAGGCCCACACGCCGGCGGCTCCCGCGCCGGCGCCGG
+CACCCCAACGGAGCAGGGCACGGCGGGTCAGGTCTGCCATGGGCGTCATGATGCCGCGCCGATCGGTGTT
+GCCCGCACAGCCACGCCGTAGCACCGGCCAATCGTGACACCGGTAACGGCTGGCGAGTCGCCGTAGTGGG
+GGCCCGGCTGCGCAGCAGTGACGGCATGAAGAACTTTCGCAAAACTGGAAACGGCTGGTACCGGAAGTCG
+GTATTCTTTGCGCGGCAGCTGCGTGTCAATGATGACCGAGCGGTAGCCCGGTCGTCCCTGGTGTATGGGA
+GGGTGTTCGATCACCTGCCTCAACATCTCCGAAGTGCCGAACGAGACCAACCGTAAGAAGAACCGTCAGG
+CCGGACTCGACCGCAGTATCCGGGTGATTCATGGCAGCTTCGACGACATTCCCGAGCCGGACAGCGGCTA
+TGACGTCGTCTGGTCACAAGATGCGATCCTGCACGCGCCCGACCGCCGAAAGGTGCTCGAGGAGGCATTC
+CGGGTGTTGCGGCCCGGCGGCGAACTGATCTTCACCGATCCGATGCAGGCCGACGATGTTCCCGACGGTG
+TGCTGCAGCCGGTCTACGACCGGCTCAACCTGCGTGACCTTGGCTCGATGCGCTTCTATGCGTGAAGCCG
+CACAGGCACTCGGTTTCGAGGTGCTCGACCAAAGAGACCTGGTTCGCAATCTGCGGACGCACTACAGCCG
+AGTGTTCGAGGAACTCGAAGCCCGGCGTCTCGAACTCGAGGGGAAGTCCTCCCAGGAGTACCTCGACAAG
+ATGCGGGTAGGCCTGAAGAACTGGGTCGAGGCCGCCGACAACGGTCACTCTCGCGTGGGGCATCCAACAT
+TTCCGAGAACCCGCCTGACTCCGATATGCCAGCTGCCCACGGCCGCGATCGACTCGACGGCTGGTCGTCG
+CCGGTATCGTTGACCCCACGGACTGCGTGACAGCCGGGGGCACGGAGTTGCCCGGCGGCGCCAGTACTGC
+CCCCGACGGACCGGAAGGCAGGTGCCATAGCTACCACTTCAGGACTGCGCCCAGGACTGTCGCAGCGTCA
+GCTCAACATGATCGCTATCGGCGGCGTCATCGGTGCTGGCTTGTTCGTCGGGTCTGGTGTGGTTATCCGT
+GCGACCGGTCCGGCGGCATTCCTGACCTATGCGCTGTGCGGCGCACTGATCGTTCTGGTGATGCGCATGC
+TGGGCGAGATGGCCGCCGCCAATCCGTCGACTGGAGCGTTCGCCGACTACGCGGCAAAAGCCCTGGGCGG
+CTGGGCGGGATTCTCGGTTGGCTGGCTGTACTGGTACTTCTGGGTAATCGTCGTGGGGTTCGAGGCGGTT
+GCCGGCGGGAAGGTTCTAACCTACTGGATCGATGCGCCGCTGTGGTTGGCGTCGCTGTGTCTGATGATGA
+TGATGACCGCGACGAACTTGGTCTCGGTGTCATCCTTCGGTGAGTTCGAGTTCTGGTTCGCCGGAGTCAA
+GGTTGCCACCATCGTCGGCTTCCTGGTCCTTGGCACCGCTTTCGCCTTCGGGCTGCTGCCGGGCCATGGC
+ATGGATTTCAGCAACCTCAGCGCGCACGGTGGCTTCTTTCCCGACGGGGTAGGTGCCGTCTTCGCTGCCA
+TCGTGGTCGCGATCTTCTCCATGACTGGCACGGAAGTAGTCACCATCGCCGCGGCTGAAGCGCCGGACCC
+TCAACGAGCGGTCCAACGCGCGATGAGCACGGTGGTGGCACGCATCGTGATCTTCTTCGTCGGCTCGGTC
+TTCCTGCTCACGGTGATCCTGCCGTGGAACTCGTTGGAGCTTGGCGCCTCCCCGTACGTTGCCGCGCTGC
+GGCACATGGGTATTGGGGGTGCTGATCAGATCATGAATGCCGTCGTGCTTACCGCGGTGCTGTCCTGCTT
+GAACTCGGGCCTGTATACCGCGTCGCGGATGCTGTTCGTGCTCGCCGCCCGGCAGGAGGCGCCGGCCCAG
+CTGGTCAAAGTCAACCGGCGTGGAGTCCCCACCTTCGCGATCATGGGATCGTCCGTGGTGGGATTCCTGT
+GCGTGATCATGGCATGGGTCTCACCCGCAACGGTATTCGTTTTCCTGCTCAACTCGTCGGGCGCTGTGAT
+TTTGTTCGTCTACCTGCTTATCGCGCTGTCGCAGATCGTGTTGCGTCGCCAGACATCTGGCCAAAATCTG
+GGGGTACGGATGTGGCTTTTCCCGGGGCTGTCGATCGTCACGGTGACCGGAATTGTCGCCGTGCTGGCGC
+GGATGGCGTTCGACTACGCCGCGCGCAGCCAGCTCTGGCTCAGCCTGCTGTCCTGGGCAGTGGTCGTTGG
+GTGTTATTTGGTCACCACATTGGTGCGACGTCCCCTTAATCGGCCTTGGTGAGCAGTACGGCCTCGTCGA
+ACGGCAGTCTGGCAAAGACCGGCCGCCATCGGCTGCTGACATACGGCGCCGCCTCGGCCTTGGTGAGCCG
+CCGCGGGTTGGCGACACCAAAGGTTTTGCCGTAGCGGCGCATCCGGCCACCGCCGGCCGCGGTGATGTTC
+TTCAGCCAGTCGCGGTTCGGACCGTAGGTGAGCAAAATCGCCACGCCCGCCCGGCCGTCGACGTCCGCGC
+TGAACACGTTCAACGGGGTACGGTACGGCTTGCCCGAGCGGCGGCCCACGTGCTCAAGAATCGCGAACGC
+CGGGAGCCAGCCGGCCCATAGCCGCTGAATGGGGTTGGTGACATATCGATTGAACCGAGCCAGCCACTGC
+GGTAGTTGCATGCCCACCATCCAACTCGTGGACCGGCCGCGGCATCAAGCAAACCTCTGGTGGCTGCGGC
+AAACTCTTACACCCTGTAGTTGAGCGACCTGGGCAGGCTGGAACACTAGTCGTCATGGGCAGCACGGAAC
+AGGCCACCTCGCGGGTAAGGGGAGCCGCGCGCACATCGGCGCAGCTGTTCGAGGCCGCATGCAGCGTCAT
+ACCCGGCGGAGTGAACTCCCCGGTGCGGGCGTTCACGGCGGTGGGCGGCACCCCGCGCTTCATTACCGAA
+GCCCACGGCTGCTGGTTGATTGACGCCGACGGCAACCGCTACGTAGACCTGGTCTGCTCATGGGGCCCGA
+TGATCCTCGGTCACGCGCATCCGGCCGTCGTCGAGGCAGTGGCCAAGGCCGCAGCCCGCGGCCTGTCCTT
+CGGGGCCCCGACTCCCGCCGAAACCCAACTAGCCGGCGAGATCATCGGCCGGGTAGCTCCCGTCGAGCGG
+ATACGGCTGGTGAACTCCGGCACCGAGGCCACTATGAGCGCCGTGCGGCTGGCCCGCGGATTCACCGGCC
+GGGCCAAGATCGTCAAGTTCTCCGGCTGCTACCACGGACACGTCGACGCATTGCTCGCCGACGCGGGTTC
+GGGAGTGGCCACCCTGGGCTTATGTGACGACCCCCAGCGCCCGGCTTCGCCGCGCTCGCAATCGTCACGG
+GGCCTGCCGTCCTCCCCCGGGGTCACTGGCGCCGCGGCAGCCGACACGATCGTGTTGCCCTACAACGACA
+TCGATGCCGTACAGCAGACCTTCGCCCGGTTCGGCGAGCAGATCGCCGCCGTAATCACCGAGGCCAGCCC
+CGGCAACATGGGAGTCGTCCCGCCCGGGCCCGGCTTCAACGCGGCGCTGCGCGCGATCACCGCCGAGCAC
+GGCGCCCTGCTCATCCTCGACGAGGTGATGACCGGGTTCCGGGTCAGCCGAAGTGGTTGGTACGGAATCG
+ATCCGGTGCCCGCTGACCTGTTCGCCTTCGGCAAGGTGATGAGCGGCGGGATGCCCGCCGCCGCGTTCGG
+CGGGCGCGCCGAGGTGATGCAGCGGCTGGCGCCGCTGGGGCCGGTGTATCAGGCCGGCACGTTGTCGGGT
+AACCCGGTGGCGGTTGCCGCCGGGCTGGCAACGCTGCGGGCCGCCGACGACGCGGTCTACACCGCATTGG
+ACGCCAACGCTGACCGCCTGGCCGGCCTGCTCTCCGAGGCACTGACGGATGCCGTTGTGCCACACCAGAT
+TTCGCGGGCAGGCAATATGCTCAGTGTGTTCTTCGGCGAAACACCGGTGACCGACTTCGCGTCCGCGCGG
+GCCAGCCAGACCTGGCGTTATCCAGCGTTCTTTCATGCCATGCTGGACGCCGGTGTCTACCCGCCGTGCA
+GTGCCTTCGAGGCATGGTTCGTCTCGGCCGCTTTGGACGACGCGGCGTTCGGCCGGATCGCCAACGCGCT
+GCCCGCCGCGGCCCGAGCGGCGGCCCAGGAAAGGCCCGCCTGATGCCCGAGGAAACCCAAGTCCACGTGG
+TGCGCCACGGTGAGGTGCACAACCCTACCGGCATCCTGTACGGGCGGCTGCCCGGATTCCACCTGTCCGC
+AACCGGCGCGGCGCAGGCCGCCGCCGTCGCCGACGCGCTGGCCGACCGCGACATCGTCGCGGTAATCGCA
+TCGCCCTTGCAGCGTGCCCAGGAGACCGCCGCGCCCATCGCCGCCCGGCATGACCTTGCGGTGGAGACAG
+ACCCGGATCTGATCGAATCGGCCAACTTCTTCGAGGGCCGCCGCGTCGGCCCCGGTGACGGGGCATGGCG
+CGACCCGCGGGTGTGGTGGCAGCTGCGTAACCCGTTCACCCCGTCGTGGGGTGAGCCTTACGTGGATATC
+GCTGCCCGAATGACGACCGCGGTGGACAAGGCACGTGTCCGCGGCGCCGGCCATGAGGTGGTGTGCGTCA
+GCCATCAGCTGCCGGTGTGGACGCTGCGGCTGTATCTGACCGGTAAGCGCCTCTGGCACGATCCGCGCCG
+TCGGGACTGCGCACTGGCCTCGGTGACGTCGTTGATCTACGACGGCGACCGCCTGGTTGACGTGGTGTAT
+TCGCAGCCGGCGGCGCTTTGACCGCGCCGGCGACGATGCAGAGCAGAGCGACCAGAAGGAGCGGCGCTTT
+GACCATGCGCCGGCTGGTGATCGCCGCAGCGGTATCGGCATTGCTGCTCACCGGCTGTTCCGGGCGCGAC
+GCCGTCGCCCAAGGCGGCACGTTCGAATTCGTCTCGCCCGGCGGAAAGACCGACATCTTCTACGATCCGC
+CTGCCAGCCGCGGCCGCCCGGGCCCACTGTCTGGGCCGGAGCTGGCGGATCCGGCGCGCAGTGTGTCGCT
+GGACGACTTCCCTGGGCAGGTCGTCGTCGTCAACGTGTGGGGGCAATGGTGTGGGCCGTGCCGGGCCGAG
+GTCAGCCAACTACAGCGGGTGTATGACGCCACCCGAGGTGCGGGTGTGTCGTTCCTCGGGATCGACGTGC
+GCGACAACAACCGCCAGGCGCCCCAGGACTTCATCAACGACCGGCATGTGACGTACCCGTCGATCTATGA
+CCCGGCGATGCGCACCTTGATCGCATTCGGTGGCAAATACCCCACCAGCGTCATTCCGTCCACGCTGGTG
+CTGGACCGTCAGCACCGGGTCGCGGCGGTGTTTCTGCGCGAATTGCTGGCTGCGGACCTGCAGCCGGTGG
+TCGAGCGGGTGGCCGAGGAGGAGCCGTCGGGTCGGGCTCCGGTGGGGGCGCAATGACCGGGTTCACCGAG
+ATTGCCGCGGTGGGGCCACTGCTGGTGGCGGTGGGGGTATGTCTGCTGGCTGGTCTGGTGTCGTTCGCCT
+CACCATGTGTGGTGCCGCTGGTGCCCGGCTACCTGTCGTATCTGGCGGCCGTCGTTGGGGTGGACGAGCA
+GCTGCCGGCCGGCGTCGTCAAACCCCCGGTGGCTGCCCGCTGGCGGGTCGCCGGATCGGCGGCGCTGTTC
+GTGGCGGGGTTCACGACGGTGTTCGTGCTGGGCACCGTCGCCGTCTTGGGCATGACCACCACGCTGATCA
+CGAATCAGCTGCTGCTGCAGCGGGTCGGAGGCGTGCTGATCGTCGTCATGGGCCTGGTGTTCGTGGGGTT
+CATCGGAGCCCTGCAGCGCCAGGCGAGGTTCACGCCGCGCCAGTTGACGAGCGTAGCGGGGGCGCCGGTG
+CTTGGCGCGGTGTTCGCGCTCGGCTGGACACCGTGCCTGGGGCCGACGCTGACCGGGGTGATCACCGTTG
+CCTCGGCCACCGAGGGTGCCAGCGTGGCGCGTGGGATCGTGCTGGTGATTGCCTATTGCCTGGGGCTGGG
+GATTCCGTTCGTGCTTTTGGCGTTCGGTTCGGCGTGGGCGGTGGCGGGCCTGGGCTGGCTGCGCCGGCAC
+ACCAGGGCCATCCAGATCTTCGGCGGGGCGCTGCTGATCGCGGTCGGTGCCGCGCTGGTCACCGGGGTGT
+GGAACGACGTCGTGTCGTGGCTGCGCGACGCCTTCGTTTCCGACGTGAGGTTGCCGATTTGAGTGGGCAG
+GGTGCCGCGCAAAAGGCGCGCAACATGTGGCGGTCGTTGACGTCGATGGGCACCGCGCTGGTGCTGCTGT
+TTTTGCTCGCGCTGGCTGCCATACCCGGGGCCCTGCTGCCGCAGCGTGGCCTCAACGCCGCCAAGGTGGA
+CGACTACCTGGCCGCGCACCCACTCATCGGTCCGTGGCTGGACGAGCTGCAGGCCTTCGACGTGTTCTCC
+AGCTTCTGGTTCACCGCCATCTACGTGCTGCTGTTCGTGTCCCTCGTCGGCTGTCTGGCCCCGCGGACGA
+TCGAGCACGCCCGCAGCCTGCGGGCTACACCGGTCGCCGCCCCGCGCAACCTGGCCCGGCTGCCCAAGCA
+CGCCCACGCCCGGCTGGCCGGCGAGCCCGCCGCCCTGGCCGCCACCATCACGGGCCGGCTGCGCGGCTGG
+CGCAGCATCACCCGGCAACAAGGCGACAGCGTGGAAGTCTCCGCCGAGAAGGGCTACCTGCGCGAGTTCG
+GCAACCTGGTGTTCCACTTCGCGCTGCTGGGTCTGCTGGTGGCGGTGGCCGTCGGCAAGCTGTTCGGCTA
+CGAGGGCAACGTGATCGTGATAGCCGACGGCGGACCCGGTTTTTGTTCGGCGTCGCCGGCCGCGTTCGAC
+TCGTTTCGCGCCGGCAACACCGTCGACGGCACGTCGTTGCACCCGATCTGTGTGCGGGTCAACAACTTCC
+AAGCGCACTACCTGCCGTCCGGGCAGGCCACCTCGTTCGCCGCCGACATCGACTATCAGGCCGACCCGGC
+CACTGCTGACCTGATCGCCAACAGCTGGCGGCCCTACCGGCTGCAGGTCAATCACCCGCTGCGGGTCGGC
+GGCGACCGGGTGTACCTGCAGGGCCACGGCTATGCGCCCACCTTCACCGTGACGTTCCCGGACGGGCAGA
+CCCGCACGTCGACCGTGCAGTGGCGACCCGACAACCCGCAGACCCTGCTGTCGGCGGGCGTCGTGCGCAT
+CGACCCGCCGGCCGGCAGCTACCCCAACCCCGACGAGCGTCGCAAACACCAGATCGCCATCCAGGGCCTG
+CTGGCTCCCACCGAGCAGCTCGACGGCACCCTGCTGTCGTCGCGTTTCCCCGCGCTCAATGCCCCGGCGG
+TGGCCATCGACATCTACCGCGGCGACACCGGCCTGGACAGCGGGCGGCCCCAGTCGTTGTTCACCCTGGA
+CCACCGGCTGATCGAGCAGGGCCGGCTGGTCAAGGAAAAGCGGGTCAACCTGCGCGCCGGTCAGCAAGTC
+CGCATCGACCAAGGCCCGGCGGCCGGCACGGTGGTCCGGTTCGACGGCGCGGTGCCGTTCGTCAACCTGC
+AGGTCTCCCACGACCCCGGCCAGTCCTGGGTGCTGGTCTTCGCAATCACGATGATGGCGGGACTGCTGGT
+GTCGCTGCTGGTGCGCAGGCGCCGGGTGTGGGCGCGGATCACGCCGACGACCGCGGGTACGGTAAACGTC
+GAGCTGGGCGGCCTGACGCGCACCGACAACTCCGGGTGGGGCGCCGAGTTCGAGCGGCTGACCGGGCGGT
+TGCTGGCGGGTTTTGAGGCGCGGTCCCCGGACATGGCCGAAGCGGCCGCAGGGACCGGAAGGGACGTCGA
+TTGAACACGCTGCACGTCAACGTCGGCCTGGCCCGCTACTCCGACTGGGCGTTCACCTCGGCCGTGGTGG
+CGCTGGTGGTCGCGCTGCTGCTGCTGGCGTTCGAGTTCGCCCAGGTTCGCGGTCGCGGACTCGCGCCGCT
+GGCCGTGCCGGCCGGATCGGTGGCCACCGATAGCGCTACCCCTGGGATCGTGGCGGACCAACGGCACCGG
+CCGTTCGACGAACGCGTCGGGCGGGGCGGGCTGGCCGTCGCCTATCTGGGCATCGGGCTACTGCTGGCGT
+GCGTCGTGCTGCGCGGCCTGGCCACCCAGCGGGTGCCGTGGGGCAACATGTACGAGTTCATCAACCTGAC
+CTGCTTGTCCGGGCTCATCGCCGGCGCGGTCGTGCTGCGCCGTGCGCGATACCGGCCGCTGTGGGTCTTC
+CTGCTGGTCCCGGTGCTGATCCTGCTCACCGTGTCCGGACGCTGGCTCTACGCCAATGCCGCCCCGGTGA
+TGCCGGCACTGCAGTCCTACTGGCTGCCCATTCATGTGTCGGTGGTCAGCCTCGGTTCTGGGGTATTCCT
+GGTCGCCGGTGTCGCCAGCATCCTGTTCCTTGTGCGCACATCGCGGCTGGGTGAGCCAACCGGTGAAGGC
+GCGCTGGCGGGTATGGTGCGGCGGCTCCCCGATGCCCAAACCCTGGACGGAATCGCCTACCGGACCACGA
+TCTTCGCCTTCCCCGTTTTCGGCTTCGGGGTGATATTCGGTGCCATCTGGGCCGAGGAAGCCTGGGGCCG
+CTACTGGGGCTGGGACCCCAAGGAGACGGTGTCCTTCGTCGCGTGGGTGGTGTACGCGGCGTACCTGCAC
+GCGCGGTCAACGGCGGGTTGGCGGGACCGCAAGGCCGCCTGGATCAATGTCGCCGGCTTCGTGGCCATGG
+TCTTCAATCTGTTCTTCGTTAACCTGGTGACCGTCGGCCTGCACTCGTATGCGGGCGTGGGCTGACCGTT
+CGTCTGCAACCGACCCGAGGACCGCAGCAAGGGGGAGTGCTGGTGACCGAGCATCCGAGGACGGGCGTGG
+GAGCCCCCGATAGCGGCAACGGCGGCACGGATCATCCGACCGTGCAGTTGCCGCCCGTGCCATCCGTGGG
+GGCACCACCGGCTGCGGCCGGTGGTGAAACACCGACTAGGTCAGTTGCGGGATTCCGCACCCAGCGGCTC
+GACCCGACGGCCTACGGCGCCTACTACAGCGGCCCCGATGAGGGCCCGGCCAGCCCGGCTGAAAGGCCGC
+CGTATCGTCTCGAGCCGGTGCCCCATACGCCGTATCCGGAACTGGCCACCACCACGCTGCTGAGGCCGGT
+CAAGCCGCCACCGTCCGAAGGCTGGCGTCGGTTGCTCTATCTGCTGTCGGGTCGGCTGATCAACGCCGGG
+GAAGGCCCTCGGGCCGCGCACCTCAACGACCTGGTCGCTCAGGTCAACCGCCCGCTGCGCGGCTGCTACC
+GGATCGCGGTGTTGTCGTTGAAAGGGGGTGTCGGCAAGACCACGATCACCGCGACCCTGGGGGCCACCTT
+TGCCGACCTGCGCGGTGACCGGGTTGTCGCGGTCGACGCCAATCCCGACCGCGGCACACTGAGCCAAAAG
+GTCCCGCTCGAGACGCCGGCCACGGTGCGGCACCTGCTGCGCGACGCCGACGGCATCGAGCGCTACAGCG
+ACGTTCGCGGCTACACATCGAAGGGACCCAGCGGGCTGGAAGTGCTGGCATCGGACAGTGATCCGGCCTC
+CTCGGACGCATTCAGCGCCGACGACTACACCCGCACCCTGGACATTCTGGAGCGGTTCTACGGCCTGGTG
+CTCACCGACTGCGGTACCGGGTTGCTGCACTCGGCGATGTCGGCGGTTCTGCCTAGGTCCGACGTACTGG
+TCGTGGTCAGCTCGGGGTCCATCGACGGCGCCCGCAGCGCCGCGGCGACGCTGGACTGGCTGCAGGCCCA
+CGGCCACGACGACCAGGTGCGCAACTCGATCGCCGTCGTCAACGCGGTGCGGCCGCGCGCGGGCAAGGTC
+GACGTGGGCAAGGTCGTCGAGCACTTCTCCAGGCGTTGCCGTGCGGTGCGCGTGGTGCCGTTCGACCCAC
+ACCTCGAAGAAGGCGCCGAAATCGCGCTGGATCGGTTGCGGCGGGAGACCCGCGAAGCGCTCACCGAACT
+GGCAGCGGTGGTGGCCGCTGGATTCCCCGGCGACCCGCGGCGCTGCAAACCGAGCTTCACCTAGGAACGG
+TTATTGTCCCCGTGCCCCAACCGCCGCAGGAACTCTGGATCGTCGTCGGGCCCGATGACGCGAGTCTTGG
+GCCGGTTCATCTGTGCCCGTGCAGCGCGCCAGCCAAGGTAGATCAGCGTCGCCAAAATCAGCACGAGGAG
+CAGGTAGAGCACTCGACACCTCCTTGGACCGAATATACCCGCGCCGTAGGCTCAGGCTGTGTCAGAAGCG
+CCTAACGACAAGACCACTCGGGGTGTTGTCGACATACTGGTCTATGCGACGGCGCGGCTGCTGCTGGTGG
+TGGCGGTCAGCGCAGCGATTTTCGGGGTCGCGCGACTGATCGGGTTGACCGAATTCCCCGTTGTCGTGGC
+CACGCTGTTCGGGCTGATCATCGCGATGCCGTTGGGCATTTGGGTGTTCAGCCCGCTGCGGCGGCGCGCC
+ACGGCCGCGCTCGCGGTGGCCGGTGAGCGTCGGCGCGCCGAGCGGGAACGGCTGCGGGCCCGGCTGCGTG
+GCGAGTCGCTACCCGAAGAACAGTGAGCGCGGGGCGCCTGGTAGTCGGCATTGTGCACAAGTGGGTTGGG
+CATTCAGCACAGTGTTTGCGCTGATCGTGGCGATTCGCCTCGGCCGCGATTGGCGGCTCCTAACGTTGGC
+TGCACCGGGTGTGGGTTGCGGGAAGGTGTGCGATGTCTAATTTGCTGGTAACCCCGGAGCTGGTGGCGGC
+TGCGGCGGCGGATTTGGCGGGTATTGGGTCGGCTATCGGTGCGGCCAATGCGGCGGCCGGGGCCCCGACG
+ATGGCGCTGTTGGCCGCCGGTGCCGATGAGGTGTCGGCGGCGGTGGCGGCCGTGTTTTCCTCCTACGCCC
+AGCAATATCAGGCGCTGAGCGCTGCGGCGGCGGCGTTTCACGACCAGTTCGTGCGGGCGTTGGCCGCGGG
+TGCGGGTGCGTATGCGGGCGCCGAGGCCGCCAACGTGGAGCAGCAGTTGCTGAACGCGATCAATGCGCCC
+ACCCTCGCGTTGTTGGGGCGGCCGCTGATCGGCAACGGCGCCGACGGGGCGGCCGGGACCGGTCAGGCCG
+GCGGGGCAGGCGGGCTGTTGTACGGCAACGGCGGTAACGGCGGGTCGGGTGCGGCCGGGCAGGCCGGCGG
+GGCCGGCGGCGCCGCCGGGCTGATCGGCCACGGCGGGACCGGCGGGGTCGGGGGTACCGGTGCGGCCGGC
+GGGGCCGGCGGGACCGGCGGGTGGCTGTTCGGCAACGGCGGGGCCGGCGGGACCGGCGGGGCCGTCACCG
+GGGTCAGCACCACCGGCGGGCCGGGCGGTCACGGCGGTGACGCCGGCCTGTACGGGTTTGGCGGGGCCGG
+TGGCGCGGGTGGGTTCGGCCAGAGCGGGGCGGCCGGCGGGGCCGGCGGGGCCGGTGGGGCCGGTGGGTGG
+TTGTACGGCGACGGCGGCGACGGCGGCGCAGGCGGCAACGGCGGTAACGAGTCCGGCACCGGCGTCAGTG
+GCGTTGGGGGTGTGGGTGGGGCCGGTGGTGCTGGTGGGTTGTTGTTCGGTAACGGCGGCGACGGCGGCGT
+CGGCGGCGACGGCGGCGACGGCAGCAGCACCCAGGATTCCGGTGGTGATGGGGGTGCGGGTGGGGCCGGT
+GGTGCTGGTGGGTGGTTGCTTGGTAATGGGGGGGCCGGCGGGGCCGGCGGGGCCGCCTCAATCAAGGTTG
+CCACTGGTGGTCTGGGTGGTGATGGTGGCGATGCCGGGCTGTTCGGGTTTGGTGGGGACGGCGGCTGGGG
+CGGACGCGGAGTGGATGCTCGATTCGGTGCGGCTGGGGGTGCCGCTGGGGCCGGCGGTGCGGGCGGGTGG
+TTGTACGGCGATGGCGGCGCCGGCGGCGTCGGCGGTGTCGGCGGTGCTGTCTTCAGCCTTTCCTCCGGTG
+ACGGCGGGGCCGGCGGGGCCGGTGGCGGTGGTGGGTGGTTGTTCGGTAACGGCGGCGACGGCGGCGCCGG
+TGGCGGCGGCGGTGGCCGCTTCGGCAGCGGCAGCGGTGCCGGTGGTGATGGGGCTGTCGGTGGGGCCGGT
+GGTGCGGGCGCGTGGTTCGGCAACGGTGGCGCCGGCGGCGTCGGCGGCGGCGGTGGCCGCGGCACCACCG
+CCATCGGTGGCGACGGGGGTGCCGGTGGGGCCGGTGGTGCGGGTGGGTGGTTGTACGGCGACGGTGGCGC
+CGGCGGTGCCGGCGGCGGTGGTGGCCGCGGCGGCACCGGCAACGATGGTGGCGACGGCGGGGACGGCGGC
+CGCGGCGGTGATGCCCAGCTGCTTGGCAACGGCGGTGACGGCGGGGCCGGCGGGGCCGGCGGGCCCGCCG
+GGTTTGGCGCTTCCCCCGGGGCCGGCGCGGCCGGCGGGGGCGGCGGTGCCGGCGGTTCGCTGTTCGGCAG
+CCCCGGCACGACCGGCCCGCACGGCTGATCCCTGGCTAGCGCCGATCTTCGCGCGCTCAACCCTTCGGCA
+TTCGCACCACCTGGGCGGCATAGCTCAGACCGGCGCCGTAGCCGATCAACAGGGCCAGATCGCCGGGCTT
+GGCCGCGCCGGTCGTCAGTAATTCGGCCATCGCGAGCGGAATGGAGGCCGCCGAGGTGTTTCCGGTGTGC
+TCGATATCGTTGGCGACCACCGCGTCGGGCCGCAACTGCAGGTTCTTGACCAGCAGCTCGTTGATGCGGC
+TATTGGCCTGATGAGGGACGAACACGTCTATCTGGTCGGGTCGCACCCCGGCGGCGTCCATCGCGCGCCG
+ACCGACGTCGCCCATTTTGAACGCTGCCCAACGGAAGACCGCGGGACCTTCGAGCCGCACAAACGGGCGT
+GGGCCGCTGGGATTCTGGGCGAAAGTGATCCAGTCGATGTCCTGCCGTATGGCATCGGCCTGTTCGCCGT
+CGCTACCCGCCACGGTTGGTCCAATGCCTTGAAACGGTGTCTCGCCCACCACCACTGCGGCCGCGCCGTC
+GGCGAAGATGAAGCAGTTGCCGCGGTCGTACATGTCTATCGTGGGGGACAGTTTTTCCGTGCCGACCACC
+AGCATCGTGGCCGCACCTCCGCCCCGGATCATGTCGGCCGCTGCGCCAAGCGCATATCCGAATCCGGCGC
+ACCCCGCCGAAAGATCGAACCCGAGTATGCCCTTGGCGCCCAGCGACGCCGCGACCATTGGGGCGGCCGG
+CGGGGTTTGCAGGAAATGGGTGTTGGTGGTGACGATCACGCCATCGATGTCGGCCGCCGACAGGCCGGCG
+TTCGACAGTGCCCGTCGACAGGCCTCAGTCGCCATGGAAGCCGCCGACTCGTCGTCGGCGGCGAATCGGC
+GGGTCTTGATGCCGGTTCGGGTGTAGATCCACTCGTCGGACGAGTCGATGTGCTGGCATATCTCGTCGTT
+GGTGACCACGCGTTCGGGCCGGTACGCCCCGACACTGAGCAGCCCGACGCTCCTGGCGCCGCTGGTCGTG
+GCGATCTCCGTCATACCCGTCCTATCTGTTCTCGTCGAGTGTGCACCTACGGCGACGACACGCCGACGGA
+GCCCGCCCTGAGTGCACGTTCGAAGTTAGCTCAACTGACCAAACGCCAATGCCCCCGCCACCGCCAACGC
+CCACACCAGCATGGCCAGCCCAGTGTCACGCAGTACCGGGATCAGCTCGCGCCCGCCGCGCCCGGATCGC
+ACCGGTCCGGCAGCGCGCAGCGCCAAAGGCGCGGCCACCAAGCCCACCACACACCACGGCGTGGCCAGCA
+TTAGCACGAACGTCAGCACCCCGGCGACCGCCAGCAGGCCCTGGTAAAGCATCCGGGTCCGGGCGTCTCC
+CAGCCGCACCGCCAGCGTGATCTTGTCGGCCCGCGCGTCGGTGGGGATGTCGCGCAGGTTGTTGGCCACC
+AGCACCGAGCACGACAACGCACCCGTTGCTACCGCCTGTGCCAGCCCCACCCAGTCCACCCGCAATGCCT
+GCGTGTACTGGGTACCGAGCACGGCGACCGGCCCGAAGAACACAAACACCGCCAGTTCGCCGAAGCCCGC
+ATAGCCGTAGGGTTTTGACCCGCCGGTGTAGAGCCAGGCCCCGGCGATGCAGATCGCACCCACCGCAATC
+AGCCACGGCGCGCTGAGCAGCGCCAAAACCAGCCCGGCCAGCGCACCGAGCGCCAGGCTCGTCATGGCAG
+CGGTCAGCACCGAGCGCGGGGTCGCCAGCCGCGAGCCCACCAACCGCACCGGACCCACCCTGTCGTCATC
+GGTGCCGCGGATGCCGTCGGAGTAGTCATTGGCGTAATTGACCCCAATGACCAGCGCCACCGCAACAGCC
+AGTGCCAACAGCGCTTTCCACCACACGGCCGCGTGCAGCCAGGCCGCGGCGCCGGTGCCGGCAACCACTG
+GCGCGATCGCGTTCGGCAGCGTTCGGGGCCGCGCGCCGGAGACCCACTGTGCGAAACTGGCCACCAGGGC
+ATCCTGCCCTATGCACAACAATGGGCGCATGCTCGGAGTGATCGGCGGCAGCGGCTTCTACACCTTCTTT
+GGGTCGGACACCCGCACAGTCAATTCGGACACCCCCTACGGTCAACCCAGCGCCCCGATCACGATCGGCA
+CCATCGGGGTGCACGACGTCGCGTTCTTGCCCCGCCACGGCGCCCATCACCAGTACTCGGCGCACGCCGT
+GCCGTATCGGGCCAACATGTGGGCGCTGCGCGCGCTTGGTGTGCGGCGGGTCTTCGGGCCGTGTGCGGTC
+GGCAGCCTGGACCCTGAACTCGAGCCCGGCGCGGTCGTGGTGCCCGATCAGCTGGTCGACCGCACCAGCG
+GCCGCGCCGACACCTATTTCGACTTCGGCGGTGTCCATGCCGCCTTCGCCGATCCGTACTGCCCCACGCT
+GCGGGCCGCGGTGACCGGCCTGCCCGGTGTTGTCGACGGCGGCACCATGGTGGTGATCCAGGGTCCGCGG
+TTTTCCACCCGCGCGGAAAGCCAGTGGTTCGCCGCTGCCGGGTGCAATCTGGTCAACATGACCGGCTATC
+CCGAGGCGGTGCTGGCTCGCGAACTCGAATTATGCTACGCAGCAATCGCTTTGGTGACAGATGTGGATGC
+CGGCGTCGCTGCTGGCGATGGCGTGAAAGCCGCCGACGTGTTCGCCGCATTCGGGGAGAACATCGAACTG
+CTCAAAAGGCTGGTGCGGGCCGCCATCGATCGGGTCGCCGACGAGCGCACGTGCACGCACTGTCAACACC
+ACGCCGGTGTTCCGTTGCCGTTCGAGCTGCCATGAGGGTGCTGCTGACCGGCGCGGCCGGCTTCATCGGG
+TCGCGCGTGGATGCGGCGTTACGGGCTGCGGGTCACGACGTGGTGGGCGTCGACGCGCTGCTGCCCGCCG
+CGCACGGGCCAAACCCGGTGCTGCCACCGGGCTGCCAGCGGGTCGACGTGCGCGACGCCAGCGCGCTGGC
+CCCGTTGTTGGCCGGTGTCGATCTGGTGTGTCACCAGGCCGCCATGGTGGGTGCCGGCGTCAACGCCGCC
+GACGCACCCGCCTATGGCGGCCACAACGATTTCGCCACCACGGTGCTGCTGGCGCAGATGTTCGCCGCCG
+GGGTCCGCCGTTTGGTGCTGGCGTCGTCGATGGTGGTTTACGGGCAGGGGCGCTATGACTGTCCCCAGCA
+TGGACCGGTCGACCCGCTGCCGCGGCGGCGAGCCGACCTGGACAATGGGGTCTTCGAGCACCGTTGCCCG
+GGGTGCGGCGAGCCAGTCATCTGGCAATTGGTCGACGAGGATGCCCCGTTGCGCCCGCGCAGCCTGTACG
+CGGCCAGCAAGACCGCGCAGGAGCACTACGCGCTGGCGTGGTCGGAAGCGAGTGGCGGTTCGGTGGTGGC
+GTTGCGCTACCACAACGTCTACGGCCCCGGCATGCCGCGCGACACCCCCTACTCCGGAGTGGCCGCGATC
+TTCCGCTCGGCGGTTGAAAAAGGCAAGCCACCAAAGGTTTTCGAAGACGGCGGCCAGATGCGGGACTTCG
+TGCACGTGGACGACGTGGCCGCGGCGAACCTCGCCGCGGTGCATCTGGGTGAAGCGGACCGCGACGGGTT
+TACCGCGGTCAACGTCTGTTCCGGGCGCCCCATCTCGATCCTTCAGGTGGCAACCGCGATATGCGACGCC
+CGCGGTGGCTCGATGTCCCCGGCCATCACCGGGCACTACCGCAGCGGCGACGTGCGCCACATTGTCGCCG
+ATCCCGCGCGGGCCGCCCGCGTGCTCGGGTTCCGCGCGGCCGTCGATCCAGGCGAAGGACTGCGTGAGTT
+CGCGTTCGCGCCGCTTCGCTGACCGCTCGAGCTACGACGAGTGGTCCGGCGGCCGGTAGATCTTCGGCCG
+CACTGGGTGCGTCGACCCAGCTGACCTGAAAATCCGGGGGGATCCAGCAGGCCGGGACAGCGCCGGGGTG
+TGCGGGGGTTGCGGCAGCTGGCGCAGCCTGCCGATGACGATGGCCGCCGCGAGGATGCTGAGCGCCAGGC
+CGCACAGCACCACATCGAAGGTGCTGGTGATCTGCTGGGCAAGATCGTTTCCGTAGACGGGGTGAGCCGA
+CCCGCCCGAAGATGCCTGGAATCGCGGAGCCAGGACGACGCCGACGATGACGCGCGAAACGGTGAATGTG
+CATAGCAATCCGCACAGCGACGAGATCAGCCTCGCGGGCAGGGCCTCGGTCGCCATGTTGAAGCGAAGCC
+AGATCGCTAGGACCGCGGTGGCCAGATCGAACGCAGCCAGCGCCATGCTGTCGTAGCGCGAGAACGGATA
+ATTCAACAGCACCGCGACGACGAGGTCGGTCAACCGCATCGCTACCGAGCCCAGGCACCACACGGCGATG
+AGCAGCAAGCCGTTTCGGGACGCTGCCCGCCACACGGTTTTGTCGATCGGTGGCGCGTTCGGGGACCTGA
+ACAGGGTCAGCGGCGCACACATTGCCGCGGCCGCGGCCCACACCAGATAACCCTCGTATCCCACGCCGGC
+CGTCGACGTGTTTTGGGCAATGCCGTGGAACGCGTCGATCTCGCGGCCGATGGGAAGGCTCCACACGATG
+GACCCGGCGATCAGGGTGGAGCCACCCAGCGCCACGGTTGAGAGCGCTTCGGCCGCTGTAGGCCGAAGCA
+GCCACCGGGACGCGACCAGCACGGCGGCCAGGGCTACCACGCCGTACACCACCGCCGTGTCGATGACCGC
+GAGGTTCTGTTTGCCAAAACCGGACGCGCCGGCCGCGGGCTCCAACGCGTACCTGACCCGCCAGCTCAGG
+TTGAAACCGGTGCTGAGGGCCGCACCCAACATAGACGCGTAGCCGAGGAACTGGGTGGCCCGCAGCCACC
+TGCTGTGGCTGCCCTCATCGGTGGTAGCGCCGGTTAGCGCCGGTTGCGCGCTCAACAGCGCGCCGGTGAT
+CCCCAGCCATCCCCCCGGCCCGACACCACCGGGCACGTGGACGGTGCCGCCGAGTCGAATCGTCTGGATC
+GCGTCGAACACCACGAAGGCCAGCACCAGCAGCAGATAGGGGACGTTGAGGCCCAGGCGAAGCTGTGAGC
+GCCTCCCGGCGAAGGTCACGGCAAGCGATGCCAAAGAGAGCGATGTCACCGCCAGCAGCAACCCGAACAC
+GGTCTTGCTGCTGTCCGGGATTCGGAAACCGAAATACAGGTTCCATGGGAAAAACAGCGCACCGATGAGC
+AGGGCACCAGCGGCCAAGTCGCGGACGACCTCGCGTCGTCGGGTGTCGTCGCTGCTCAGGCCCACGATGC
+CCCCCGGGAATCAAGAACGGTTGGCGCCGAGTCGGTCCTGTGGTGGCGTGGGTGCACCCGGCCGGGCCGA
+CTGCGTTGCTCGCTTGCGAACATAGTCTCCGTTCCGACGACGCGGCAGTGGCGCAGAACACGCGGTTGGG
+CGGATCTCGTTTGCCCGGTGACCGTCCCGCTGTTTGCGAACCCGGTTACGCTGCGGTCATAGGCGAACGC
+TGTCGCCGAATTACCGATACTGCCGACGGTATCGCAGTGTAACGATGCCGGGACATTGCTGGTTGTGGGG
+TGGCCAGCCGAAGGAGAGCCGCGATGGACGTCGCTTTGGGGGTTGCGGTCACGGATCGGGTCGCGCGTCT
+GGCGCTGGTCGACTCGGCTGCGCCCGGCACCGTGATCGACCAGTTCGTGCTCGATGTGGCCGAGCACCCG
+GTCGAGGTGTTAACCGAGACCGTGGTGGGCACGGATCGGTCATTGGCCGGCGAAAACCACCGGCTGGTCG
+CTACCCGGCTGTGTTGGCCGGATCAGGCCAAAGCTGACGAGCTGCAGCACGCACTGCAGGACTCCGGGGT
+CCACGACGTTGCCGTGATATCCGAGGCGCAGGCCGCCACGGCGCTGGTCGGGGCGGCACATGCCGGCTCT
+GCCGTGCTGTTGGTGGGTGATGAGACGGCAACCTTATCGGTGGTTGGTGACCCGGACGCGCCGCCGACGA
+TGGTGGCCGTCGCGCCGGTGGCGGGCGCCGACGCCACATCGACCGTCGATACCCTGATGGCCCGGCTCGG
+CGACCAGGCCCTCGCCCCGGGGGATGTCTTCCTGGTGGGTAGGTCCGCCGAGCACACCACGGTTCTTGCC
+GACCAGCTGCGCGCGGCGTCGACGATGCGCGTGCAGACTCCCGACGACCCCACGTTCGCGCTGGCCCGTG
+GCGCGGCGATGGCGGCCGGCGCCGCTACGATGGCGCACCCTGCCCTGGTCGCGGATGCGACCACTTCGCT
+CCCCCCGGCCGAGGCGGGGCAATCGGGTTCTGAAGGCGAGCAGCTGGCGTACTCGCAGGCCAGCGATTAC
+GAGCTGCTTCCGGTCGACGAATATGAGGAACACGACGAATACGGGGCAGCCGCGGATCGCTCGGCGCCGT
+TGAGCCGACGGTCGCTGCTGATCGGCAACGCTGTCGTGGCCTTTGCGGTGATCGGTTTCGCCTCGCTGGC
+GGTGGCGGTGGCGGTCACCATCCGACCGACCGCGGCCTCAAAACCGGTAGAGGGACACCAAAACGCCCAG
+CCAGGGAAGTTCATGCCGTTGTTGCCGACGCAACAGCAGGCGCCGGTCCCGCCGCCTCCGCCCGATGATC
+CCACCGCTGGATTCCAGGGCGGCACCATTCCGGCTGTACAGAACGTGGTGCCGCGGCCGGGTACCTCACC
+CGGGGTGGGTGGGACGCCGGCTTCGCCTGCGCCGGAAGCGCCGGCCGTGCCCGGTGTTGTGCCTGCCCCG
+GTGCCAATCCCGGTCCCGATCATCATTCCCCCGTTCCCGGGTTGGCAGCCTGGAATGCCGACCATCCCCA
+CCGCACCGCCGACGACGCCGGTGACCACGTCGGCGACGACGCCGCCGACCACGCCGCCGACCACGCCGGT
+GACCACGCCGCCAACGACGCCGCCGACCACGCCGGTGACCACGCCGCCAACGACGCCGCCGACCACGCCG
+GTGACCACGCCACCAACGACCGTCGCCCCGACGACCGTCGCCCCGACGACGGTCGCTCCGACCACCGTCG
+CCCCGACCACGGTCGCTCCAGCCACCGCCACGCCGACGACCGTCGCTCCGCAGCCGACGCAGCAGCCCAC
+GCAACAACCAACCCAACAGATGCCAACCCAGCAGCAGACCGTGGCCCCGCAGACGGTGGCGCCGGCTCCG
+CAGCCGCCGTCCGGTGGCCGCAACGGCAGCGGCGGGGGCGACTTATTCGGCGGGTTCTGATCACGGTCGC
+GGCTTCACTACGGTCGGAGGACATGGCCGGTGATGCGGTGACGGTGGTGCTGCCCTGTCTCAACGAGGAG
+GAGTCACTCCCGGCGGTGCTGGCCGCGATCCCGGCCGGCTATCGGGCGCTAGTGGTGGACAACAACAGCA
+CCGATGACACCGCGACGGTGGCCGCCCGCCACGGTGCCCAGGTGGTTGTCGAGCCGCGGCCCGGATACGG
+CTCGGCGGTGCATGCCGGTGTGCTCGCCGCGACCACCCCCATCGTAGCGGTCATCGACGCCGACGGCTCG
+ATGGATGCCGGCGACTTGCCCAAGCTGGTCGCCGAACTCGACAAGGGCGCCGACCTGGTGACCGGTCGGC
+GGCGGCCGGTGGCGGGCCTGCACTGGCCATGGGTCGCCCGGGTGGGCACCGTGGTGATGAGCTGGCGGCT
+GCGCACCCGCCACCGCCTGCCGGTGCACGACATCGCGCCCATGCGGGTCGCCCGGCGAGAGGCCCTGCTG
+GATCTGGGCGTTGTCGATCGACGCTCGGGTTACCCGCTGGAGCTGCTGGTCCGGGCCGCTGCGGCGGGCT
+GGCGTGTCGTCGAACTCGACGTCAGTTACGGTCCCCGGACCGGCGGCAAATCCAAGGTCAGCGGTTCGCT
+GCGGGGCAGCATCATCGCGATCCTGGACTTCTGGAAGGTGATCTCGTGAGCTGCCTGCCGGTCAGCGTGC
+TGGTGGTCGCTAAAGCGCCGGAGCCGGGCCGGGTCAAGACCCGGCTGGCCGCGGCGATTGGCGATAAGGT
+CGCCGCCGACATCGCCGCGGCCGCACTGCTGGACACCCTGGATGCGGTGGCCGCTGCGCCGGTCACCGCC
+CGGGCGGTGGCGCTTACCGGCGACCTGGACTCCGCGGCCGATTCCGCGGAGATCCGCCGACGGCTTAAGT
+CCTTCACGGTATTTCGGCAGCGCGGTGACGCCTTCGCCGACCGGCTCGCCAACGCACACGTCGACGCGGC
+CGACGGCTATCCGGTGCTGCAGATCGGGATGGACACGCCCCAGGTGACCGCCGAGCTGTTGGCCGATTGT
+GCACGCCTGCTGCTTCAAATCCCCGCGGTGCTCGGCCTGGCGTTCGACGGCGGTTGGTGGGTGCTGGGGA
+TACGCACGCCTACTGCGGCCGAGTGCCTGCGCGCCGTCCCGATGTCACAGCCAGACACCGGCGAGCTCAC
+CTTGAAGGCGTTGCGCGACAACGGCATTGATGTGACGCTAGTGCAGCGTCTGGGCGACTTCGACATCGTG
+GACGACATCGCGCTGGTACGCGATTGCTGCGCTCCGGGGAGTCGGTTCGCGCAGGCTACCCGCGCGGCTG
+GACTCTGAGGCCGCGCCGGCGCATTTGCTTACCAGTTGGTGAAGATGATGCTGTTCAGCAGTAGGGCCCC
+GGCGGCGTTGACCGCCAGCCAGAGTCGGTGCGAGCGGGGCGGCAGCAGTGCGGGCGCCGCGGTCAGCCAA
+ATGGTGAAGGGCAGCCAGATTCGTTCGGTCTCGGCTTTGCTCAGCATGCTCAGGTCGGCCAAGGCGATGG
+CGGCCAGCACCGCCAGCAGCAGCAGATGGCAGCCGGATCGACGACTGATCGCGGCCCGGTCGAATACCCG
+GCTGAGACCTGCGACGCTGCCTAACCCGATAGCGCAGACCACGCACGCCAAGTTTGCCCAGGACCAATAG
+CCGAACGGCCGATCTTTGGCGATCCCCTGCCAATAGCGTTGCTGGACAAGGGTATAACCGTCGAACCAGG
+AGAATCCGGCAACCGCGAAGCTCACCGCGACCACCAGCGCCGCCAGCACGGCCGGCCCCAGTGCCCGCAG
+GACGGGCCGCCAATCTGCGGCGGCCAACACCGCCATCCCCGGCAGCACGATCAGCACGAGCCCGTAGTTG
+AGAAAGACACCCCAGCCGAGCAGTAGCCCCGCTCCGGCCGCCACCAGCGCCGGGAAGCGAGTGGCACCAT
+GCACCGCCACCGCCAACAGGGCGATACCCCACGCCGCCACACCGGCGAAATACCCGTCGGCCGAAACCGC
+GACCCAGATCGCCGTCGGCGCCACCGCGACGAATGGTGCCGTCCGCCGCGCCATCTGCTCACTGGCCAGC
+ACCCGCACGGCGATCAGCACCGCCGCCGCCGCGCTGGATCCCACCAGCAGGCACACCAGCCCCGCCCAAC
+CGCCACCGCGCAGCCCGATCCGATCCAGCCAGACAAACGTCAGCAGCGCACCCGGCGGGTGCCCGGAGAC
+GTGAGTCACCCAGGAATTGGGCTGGAAGTCGAGAATCCGGCTGGTGAACGTCCGCAACGTCGCCGGGATG
+TCGGCAATGCCGGGCACCTGCCACAGGTACTCGTCACGGGTGGTCAATCGGCCGGCAAAGCCGCGCTGCC
+AGCCGTCGATCATCGCCAGTGAGAACGCCCAGGCGGCGGCGGTGGCCCAGGTGCTCAGCGTCAGCACCCG
+CCAGGGGAGCCGGTGCGCCACTACCGGCCCCCACGCCACAACGGCCACTGCGGTAAGAACCGCCGGGGCC
+GTGCCCCAGCCAACATGGGCGTCCCAGTAGCCGAAGATCGGCGCGGCGCCGGCGCGCGTGGCAAACCGCT
+CCAAGCCGATATCGGATCGCGGTTTGATTCCCAGGTTCAACCGCGGCAGTACGAACGCGGCGCCGACCAG
+GACAAACCCGATCGCGACGGCCAATCCCTCGCGGCGACCGATCCTCACGACCGATCAGCCTATTGATCGG
+CTTCACCGGCGAACCGGCGCACCAACGCTGCCCGGTCCACCTTGCCGATGCCGCGTCGCGGTAGCACGTT
+CACGACATGTAGCTCTCGGGGCGCGGCGGTGACGTCCAGGGTGCGCGCGACATGCGCCCGCAGCGCTTCT
+AGCGTTGGTGGTGGGCATCCGTCGCCGACCACAATCGCGGCGACCACTCGCTGACCGAGTCGGTCGTCGG
+CAAGTCCAAAAACCGCGCAGTCACGCACCGCAGGGTGGGTGCCCAGTGCGGCCTCCACTGGCTGCGGCAG
+CACGGTGAATCCGCCCGTGCTGATCGCTTCGTCGGCTCGGCCCAGCACGGTCAGCACACCCGAATCACCC
+GATTCAAGGGCGCCAAGGTCGTCGGTGTGAAACCAGCCTGGCTCGGCGAACGGATCGGGCGAGACCGGGT
+TGCGATAGCCCTTGGCCAGGGTCGCACCGCCGATAGCTATGCGGCCGCCGGCCAGCACCCTCAGCCGGAC
+CCCGTCGAGCGGAACGCCGTCGTAGACACAGCCGCCCGAGGTCTCGCTCATGCCGTAGGTGCGCACCACC
+GTGATGCCGGCGGCGGCCGCGGCGTCCAGGATGGGCCGGGGGGCCGGCCCGCCGCCGATCAGCACCGCGT
+CCAATTCGGCCAGCGCGGCCGTGGCCGCCGGGTCGGTAAGTGCCTTGGCCAACTGTGCGGCGACCAGCGA
+CGTGTATCGCCGGCCAGAACCCAATCTCTTTATCGCGTTGGGTAATTCGGTGACATCGAATCCCGCGGAG
+ACGTTCAGTTCGACAGGAACTGATCCGGCGATCACGCTGCGCACCAGCACCGCCAGCCCGGCGATGTGAT
+ACGGCGGCACAGCCAACAGCCAGCTGCCCGGTCCGCCGAGCCGGTCGTGGGCGGCCGAGGCGCTGGCGGT
+CAAGGCCGCCGCGGTCAACATGGCGCCCTTGGGCGGTCCCGTGGTTCCTGACGTCGTCACTACCAGGGCG
+ACGTCGTCGTCAATCTGCTCGCCCACTCGCAAAGCGCCCAGCAAGGACTCATGCTGGGTGGGCACCGCGA
+CCAATGCCGGGTCGCTGCCACCCAGCACTCGTTGCAGGGCAGGCAGCAGCAGCGCGGTAGCAGAACCGGC
+CGGGACGTGCAGCGCACGCAGGATGGCTATGCGTGCTCCTCGCGGTCGCGGACGTCATCGAGTGGCCATC
+CCTGGGCGGCCAACCGCGCCCGGACGCGCTCAACATCCTCCGGTGACGGCAACTCGTCGGTGAAATGGGT
+GATCACCACGCCGATGTCGATCTGGTCGAAGTCACCGAGTCGCATCAGTTCGTTAGCCACCGCCTTGACC
+TCATCGTGGCTCAGCCGGCGGCAAAGCAGGGCGAGCACCGCAAAGGAGTCGGTCGGCGGAATGCCCTCGG
+GATATCCCGCGCGCAACCACGCGACGATCGAGGTGAGAAACCGGTTCACGCTGTTATATCTTCCCGTCGG
+GGCCGTCGCCAAACCCTATGTCGCGGCCATCTGCGACTCTACTTGGGTGTGGCGCCCAGGAAGGCCCAGC
+CGGTGTGATGCGCGATGAAGTCACGGGCGATATACAGCACTCCAATGATGACTACCGCAAGCACCAGCGC
+GAAGATCGCCCAACTGACGGCAACCAGCAGCGGGCGCCGGCGCGCGGTGGCGTCGGCACCGTCGCCGGCG
+GCCTGCAGCCGCACGCCCACCGCGAACAGGCCCGGTAGCAGCGCGCCGGCTAGCAGACTGAAGATCAGGA
+TCTTCAGGGTGGCCGTGTAGTTGAACCAGGCACTCACGGGGCGTTCCTCGTGGTGACGCCGAACTGTGGT
+GCTCGGTGGTTCGGTGGGGGAGTCGGAGCCGGCGGTGCAGGCACCGGCGGCCTCTGATCCGCAAGCGGCT
+GCGCACCCGCTTCCAGGCCGGCCGTCAGGTTGCCTTCCCAGTCGGCGTTGACGTTGGTGTGGTCGATCGG
+CGCCCTGCGCGACCGCAGCCAGATGGCGGTGGCGGTCAGCCACAACAGTGCGAAACCGAGGATCGCACCG
+GGGTAGCCACCGATGAAATGCACCAGCCCGTAGGTGAAGGCCCCGACCAGCCCGGCCAACGGGAGCGTCA
+CCAGCCACGCGACCACCATGCGGCCGGCTACCCCCCAGCGCACCTCGGCGCCGGGCTTGCCGACGCCGCT
+GCCCAGCACGGACCCGGTCGCGACCTGCGTTGTGGACAGCGCATAGCCGAAGTGCGCGGACAACAGAATG
+ACGGCGGCCGATGACGACTCGGCGGCCATACCCTGCGGTGGTTTGATCTCGACCAGCCCTTTGCCTAGGG
+TGCGGATGATGCGCCAGCCACCCAGGTAGGTACCGGCGGCCATGGCCACGGCGCAACTCACGATCACCCA
+CAGCGGCGGCACCGATGCCGTCGTGCTGACCGCGCCGTAGGACATCAACGCCAGGAAGATCACGCCCATC
+GTCTTCTGCGCGTCGTTGGTGCCGTGCGCCAGCGAGACCAGCGACGCCGAGCCGATCTGGCCGCGCCGGA
+AACCGCGTTCCGTACGCTTTTCGGCAACCCCGCGCGTCGTCCGGTAGACCAGCCAGGTGCCGACTGCTCC
+GACCAGCGTGGCCAGCAGCGCGGCTACCACGGCCGGCACGATCACCTTGGACACCACTCCGCTCCAGATC
+ACCCCACGCAGGCCGACGGCGGCAATTGTGGCGCCGACGATGCCGCCGATCAGCGCATGTGAGGAACTCG
+ACGGAATGCCCAGCAACCAGGTCAACAGGTTCCAGACGATCCCGCCGACCAGGCCGGCGAACACCAACTC
+CAGCGTCACCAGATTCGCGTCGATCAGACCCTTGGCGATTGTGGCCGCCACGGCGGTGGACAAAAACGCA
+CCGATCAGGTTCAGCACGGCAGAAAGTGCTACCGCTACCCGCGGTGCCAGGGCGCCGCTGGCAATCGAGG
+TCGCCATGGCGTTTCCGGTGTCGTGGAACCCGTTGGTGAAGTCGAACGCCAATGCCGTCACGACGACAAT
+GAGCAAAAGGAACAACTGAAGGTTCACAGGGCCTGATTCTGCTGGTCGGGATATTGCGTTGTCGATCAAA
+CGAGTACGCGAAATGCGGGTGTATCTCGACTCGTCGTCAGATGTTACCAATCACGTAACCCAGCGTTTTG
+CGGAGTTCACGCCCGGGTGTCTGTACGCAGCGGGTGACCCTCGGGAACCTCGACGAATATCAGTGTGATC
+CCGTCTGGGTCGGTCACATGCATCTCGTGCAGGCCCCACGGTTCGCGGCGGGGCTCGCGAGCGATCGACA
+CGCCTCGGCTGACCAGCTCGGTCTGGGTAGCCTCGAGGTCGCGCACCTGCAGCCACAGCGCGCCGGGAAA
+AGGTCCCCGCGAATGGTCCGGCTCGCCGTAACCGGCCAGTTCGAGCAGTGACTGACCGGCGAAAAACACT
+GTGCCGGCCCCGTATTCACGGGCAATCGCCAGCCCGATCTGGTCACGGTAGAAGCTCAGCGACCGCTGAT
+AGTCCGCCGGCCGAAGTAGCATCCGGCTGGCCAGGATTTCCATGGCCCTGTGTCTATCACGTAGCGGCAC
+GCCGGCGGCCGAGGGTCGGCAGGCCGGGACCCGGTTCAAGGGTTGAGCTGTTCGTTGCGGCGCTGCATGA
+GTGCATTGACCCAGCGGGGACCGATGCTGTCCAGCGCGTTGACGGCGACGGCAACCCGAGGCGCGATCCG
+CACCGGTCGGGTGCGGGCGGCGGTGACCATCCACTCGGCGGCTTCCGCGGCGGTCAGCGCCGGCAGCCCG
+TCGTAGGCCTTCGTCGGCGCAATCATCGGAGTTGCCACCAGCGGGTAGTACAGCGTCGTCGAATGCACGC
+CCTGACTACCCCACTCGGTTTCGATGATCCGGCTCACCGCCGACAGTGCGGCCTTCGATGCGTTGTACAC
+CGAGAACAGCGGCGAAGCCTCCGACAACACGCCCCAGGTGGCGACATTGATGATATGGCCGTCGCCACGC
+TCGAGCATCCCGGGTGCAAGCCCGCGGATAAGCCGCAGCGGGGCATAGTAGTTGAGCACCATGGTGCGCT
+CGACGTCGTGCCAGCGTTCCAGCGACTCGGCCAGCGGCCGCCGGATCGACCGGCCGGCATTGTTGATCAG
+GATGTCGATCCCGCCGATGCGCTTTTCGACGTCTTCGACCAGCGCGTCGATCGCTTCCATGTCCGAGAGG
+TCGCAGGGGAGCGACATCGCCGTGCCGCCGTCGCCGGTGATCCGGTCCGCCACCGCATCCAGCAGATCCT
+TACGGCGCGCGACGGCAACCACGACGGCGCGGTGCAGTCCGAACTGTTTGGTCGCGGCCGCACCGATGCC
+TGACGACGCGCCGGTGAGCAGGATGCGCTTGCCGGTGAGGTCGACGGGTTGCATCGCGGGCCGGTTGATC
+AGCAGTTGCGGCGAAATTGGTGGCCGCATGCCGGCCAATGTGATTTGTTCAGTCAACCAGCGCAGCGGTC
+TTTTGCTCACAGCTGGGGAGTCTAGTTTTGCCGAGCCTGTAGTTACTGTGGTGTCCCACTCGTCGGGCTT
+CTGCTCGGCAACTACAGCCTCGGCGAACGGCCGCGTTAGAAATAGCGCGGAAACGGGCTCCAGTCGGGGG
+GACGCTTCTGTAGGAAGGCGTCGCGGCCTTCGACGGCCTCGTCGGTCATGTAGGCCAGGCGGGTGGCCTC
+ACCGGCAAACAGTTGCTGACCCACCAGCCCGTCGTCGAGCAGGTTGAACGCGAACTTCAGCATCCGTTGC
+GCCTGAGGCGATTTCGCGTTGATCTCGGCCGCCCACTGCAGCCCCACTGTCTCCAGCTCGGCGTGTTCGG
+CCACCGCGTTGACCGCGCCCATCTGGTGCATCTGCTCGGCGGTGTAGGTGCGGCCTAGGAAGAAGATCTC
+GCGGGCAAACTTCTGGCCGACCTGACGGGCCAGATATGCGCTGCCGTAACCGCCATCGAAGCTGCCGACG
+TCGGCGTCGGTCTGCTTGAAGCGGGCGTACTCGCGGCTGGCCAGGGTGAGATCGCAGACCACGTGCAGGC
+TGTGTCCCCCGCCGGCCGCCCAGCCATTGACCAGACAAATGACCACCTTGGGCATGAACCGGATCAGCCG
+CTGCACCTCCAGGATGTGCAACCGGCCGGCGCGGGCGACATCAACCGTGTCCGCGGTGTCTCCGCTGGCG
+TACTGGTAACCGCTGCGCCCACGAATTCGTTGGTCGCCGCCGGAGCAGAACGCCCAGCCGCCGTCCTTCG
+GGGACGGCCCGTTGCCGGTCAGCAGCACCACTCCGACGTCGGGCGACATTCGTGCATGGTCGAGCACCCG
+GTACAGCTCGTCGACGGTGTGCGGGCGAAATGCGTTGCGCACTTCAGGGCGGTTGAACGCCACCCGCACC
+GTGGCATCGTCGACGTGGCGGTGGTAGGTGATGTCGGTCAGATCGTCGAACCCGTCCACGAGCCGCCACG
+CCTTGGCATCAAAAGGGTTGTCACTCAAGGCTGTTGAACTCCGTCCTTGTTCGCCGGCTGGAGCCACCAC
+GGCGATCTGATCCGTTCACCCATGCCTGCCACAGTAATCATGGCCGCTGGGCGTCAGCCGGACGGTATGG
+TGCCCGGGGCCTTGGTCACATGTGGTCGTGAGTTGGCGCCCGGGCGGCTTTCTGTGGAGGGTCACCGCGT
+ACTCGATCATGGCGCTGCTCGCAGTTCATCACTGAACCGGCACAGTGTCGCTCGGCAATGCGGTCTACTC
+GTGGGGCATGTTAAGCGCTCAACAGGGCGGCGCGCCCACCTTTCTCCAAGCCCCGCTGGACTCAGCCGAT
+GGCGTGAGCCGAGGGCCAGGCGCGTGCCAATCTTTCGTCGGTGGTCAACAACACCAGACCTGCCGTTTCG
+GCCAGCTCGACGTAGAGGGCATCGGTCAGGCGGAGGGTGTCGCGGCGCGACCACGCTCCGCAAGCAGCGA
+CGAAAGACCGTGTCGAGTCACCGGCACCTGTCGCAACTCCTCCAGTGCCGCATCGACATAGGCAACGGTG
+AGTGCGCCGGCGCGCTGCATGCGCCCCAGCGCCGACAACACCTCTGCATCGAAGTGCGCCGGCGCGTGCA
+TCGCGGTCCGAGCCAGCCGCGCGCGCACCGCAGAGCACCGATCGCTAGTGCGAGCCAGTAGATCCACCAT
+GGCACTCGCGTCGACGACCACCTGCTCCGGCGGCGAAGTGGGCGATGCTCTCACGCTTCGAACTCATCGC
+GAGCGGCATCGATCGCACCCAGCACGTCATCATGCCGAGCGCCGGTGCTTCTGGGTTCCAACCCCTCAAG
+CCACGCATCGGTTGCGGAGTTCTCCAACTCGGCACTGATCGCGGCCTGAGTCAGCGCCGAGACGTTCAAG
+CCCCGCGCCCTGGCGCGCTCCGCCAATTCGTCGGGCACATACACGTTCAACCGAGCCATACACACCAATG
+TACACACAACGATCGTTTTCGTGCGCCGGCTCAACAAGGCCTTCGGCGGGTTCTTTCGCCCGCCGCAGAC
+CGCGAAACCCGCTGTGAAGGTGGGTTATCCCGAGCATCGCCGGCATATCTGCACGGCATCGGCGGCGTCA
+AGTGCGCCGGCATCGCCAGGCCGAAGGCCGGGGTGAAGACTAATCCAGATCAGATGCGAGGGACCAGACT
+TCATGCAACGGCCAAGCCCTAGCCGACCGCGCGCCCAGCGCCTTCCCAGAACCGTGCGCGCACGGCCTTC
+TTGTCCGGCTTTCCTAGACCGGTCAACGGCAAAGAGTCGACGACCACCACCCGCTTGGGTGCCTGCACCG
+ATCCCTTGCGTTGTTTGACCGCTGCCTGGATCTCGGCGGTCATGGCCTCGATCGCGGGCTCATCGCGGGC
+CGCGTTGGAGCGCAACACCACCACCGCGGTGACGGCCTCGCCCCACTTCTCATCCGGCGCGCCAACCACG
+CACACCTGAGCAACCGCCGGATGCTCGGCCACCACGTCCTCGACCTCCCGGGGGAACACGTTGAAGCCGC
+CGGTGACGATCATGTCCTTGACGCGGTCGACGATGTAGTAGAAGCCATCGGAGTCCTCGCGGGCCAGGTC
+GCCGGTGTGCAGCCAGCCGTCTTTAAAAGTCCGCGACGTCTCGTCTGGCAGATTCCAGTAACCGCCCGCC
+AACAGCGGTCCGCTGACACAGATTTCGCCGACTTCGCCCTGCTTCACCGGCTTGCCATGCTCGTCTAACA
+GCGCGACGCGGGCGAACAGCGTCGGCCGCCCACATGAGGTCAGCCGCTTCTCGTCGTGATCGCCCTTGGC
+CAGATAGGTGATCACCATGGGCGCCTCGGATTGCCCGTAGTACTGGGCGAAGATTGGGCCGAACCGCCGG
+ATCGCCTCGGCTAGTCGCACCGGGTTGATCGCCGAGGCGCCGTAGTAGACGGTTTCCAGCGACGACAGGT
+CCCGGGTGTGCGAATCCGGGTGGTCCAGCAGCGCGTACAGCATCGATGGCACCAACATGGTCGCTGTAAT
+GCGTTGCTCCTCAATGATTCTGAGTACCTCGGCCGGGTCGAACTTCGCCAGCACTATCATCTCGCCGCCC
+TTGATCACCGTCGGCGTGAAAAACGCCGCGCCGGCGTGCGACAGCGGGGTGCACATTAAGAACCGCGGGT
+TGGCCGGCCACTCCCATTCGGCGAGCTGGATCGAGGTCATGGTGGCGATCGACTGCGCGGTGCCTATCAC
+GCCCTTAGGCTTGCCGGTGGTGCCGCCGGTGTAAGTCAGGCCGATAACTTGGTCGGGTGGCAGGTCGGCG
+GCGACCAGCGGCTGCGGCTGGTATTTGGCGGCCTCGGCGGATAGGTCGACTGCCACATGCTTGAGCGCAT
+CGGGCACCGGCCCAATGGTGAGGATTTGCTGCAGCGAGTCCACCTGCTCCAGCAGAGCCAGTGCGCGCTC
+GACGAACATCGGGTTGGGGTCGATGATCAGTGAGCTGATGCCGGCGTCGTTCAGCACGTAGGCGTGATCG
+GCCAGCGAGCCCAACGGGTGCAGCGCGGTGCGCCGATAACCGCGGGCCTGCCCGGCGCCGATGATCATCA
+AAACTTCAGGACGGTTGAGCGACAGCAGACCGACCGCCACCCCGGTGCCGGCACCTAGCGCCTCGAATGC
+CTGGATGTACTGGCTGATACGGTCCGCCAGCTGGCCACCGGTCAGCCTGGTGTCGCCGAGGAACAGCACC
+GGCTTGTTCTGGTGGCGCTTGAGCGCTCCCACTAGCAGATGGCCGTTGTGGGTCGGGCTGCGCAACAGCT
+CGCCCGAACAATCCTGGTCACGCATGGCGCCGCTCTCCCTCGCTAGCTGGGGTACCCCCACCGCATCGCT
+TCGTCCCCCGCAAGCGGGTGGTACCCCCACTGCATCGTCGCCGGCGGTGCTCATCTGGCAAGACTAGAAC
+GTGTTGCAATTTGGATCTGCCGTGCCCTCGTAATCTCGAAGGATCACTACGCTTGGAGCCCATGGCCGAT
+GCAGACCTCGTCATGACCGGAACCGTGCTCACCGTCGACGATGCGCGGCCAACGGCCGAGGCGATCGCGG
+TCGCCGACGGCCGGGTCATTGCCGTCGGTGACCGCTCCGAGGTTGCCGGCCTGGTTGGCGCCAACACCCG
+GGTCATCGATCTGGGTGCCGGGTGCGTCATGCCAGGATTTGTTGAGGCACACGGCCATCCGCTACTGGAG
+GCGGTCGTGCTGTCGGACCGGTTCGTCGATATCCGTCCGGTGACGATGCGGGACGCGGACGACGTCGTTG
+CCGCGATCCGCGGCGAGGTTGCACGGCGCGGCCCGGCCGGCGCCTATCTGGTCGGCTGGGATCCGCTGCT
+GCAGTCCGGTCTTGGCGAGCCGACGCTGACCTGGCTCGACAGCCTCGCGCCGAACGGGCCGCTGGTGATC
+ATCCACAACTCCGGACACAAGGCTTACTTCAACTCGCACGCCGCCTGGCTCAATGGGCTCACCCGAGACA
+CCGCGGATCCCAAGGGCGCGAAGTATGGCCGCGACGGCAATGGCGAACTCGACGGCACCGCCGAGGAAAT
+CGGCGCGATTCTTCCGCTTTTGGCCGGTGTAGCCGACCCCAGCAACTTCGGTGCCATGCTGCGCGCCGAG
+TGTGCTCGGCTCAACCGTGCCGGCCTGACCACATGCTCGGAGATGGCTTTTGACCCAGGGTATCGGCCGA
+TGGTCGAGGCGGTGCGCGCCGAACTGACGGTCCGGCTGTGCACCTACGAGATCTCCAATGCGCGGATGTG
+CACCGATGCGACGCCTGGGCAAGGTGACGACATGCTGCGCCAGGTGGGCATCAAGATCTGGGTGGACGGC
+TCGCCGTGGGTCGGCAATATCGATCTGACCTTTCCCTACCTGGACACCCCCGCCACCCGTGCCATCGGTG
+TACCGCCCGGTTCCCGCGGGTGCGCCAATTACACCCGTGAACAGTTGGCCGAAATCGTCGGGGCCTACTT
+TCCGCGGGGCTGGCAGATCGCCTGTCACGTGCACGGCGACGGCGGTGTGGACACCATCCTCGACGTCTAC
+GAAGAGGCACTGCGCCGCAATCCTCGAGACGATCACCGGCTGCGGCTCGAACACGTCGGGGCCATCCGGC
+CCGACCAACTGCGGCGCGCCGCCGAACTCGGTGTCACCTGCAGCATCTTCGTCGACCAGATCCATTACTG
+GGGCGATGTGATCGTCGATGACCTGTTCGGGGCACAGCGCGGGTCCCGGTGGATGCCGGCTGGATCCGCG
+GTGGCCGCCGGCATGCGTATCTCGCTGCACAACGACCCGCCCGTCACACCGGAGGAGCCACTGCGCAACA
+TCAGCGTGGCCGCAACCCGGGTGGCGCCCAGTGGCCGGGTGCTGGCACCGGAGGAGCGCCTGACGGTCGA
+GCAGGCGATTCGCGCGCAGACCATCGATGCCGCCTGGCAACTGTTCGCTGAGGACGCGATCGGCTCGCTT
+CAGGTCGGCAAGTACGCGGATATGGTGGTGCTGTCGGCGGATCCCCGGACGGTGCCGCCAGAGCAGATCG
+CTGACCTGGCGGTGCGGGCGACGTTTCTGGCCGGTCGCCAGGTTTATCGGCGGTGATACCCGTGCTGCCC
+CCCCTAGAAGCCCTGCTGGACCGCCTGTATGTGGTGGCCCTGCCGATGCGAGTGCGTTTCCGCGGCATCA
+CCACCCGTGAAGTGGCCTTGATCGAGGGTCCGGCCGGTTGGGGCGAATTCGGTGCGTTCGTGGAGTACCA
+GTCCGCGCAGGCGTGCGCGTGGTTGGCGTCGGCGATCGAGACCGCCTACTGTGCGCCGCCGCCGGTGCGA
+CGTGACCGCGTTCCGATTAACGCCACTGTGCCGGCCGTTGCCGCCGCCCAGGTGGGCGAGGTGCTGGCCC
+GGTTTCCTGGGGCCCGGACGGCCAAGGTGAAGGTCGCCGAGCCTGGGCAGAGCTTGGCCGACGACATCGA
+GCGTGTCAACGCGGTTCGGGAGCTGGTTCCCATGGTGCGGGTGGACGCCAACGGTGGCTGGGGTGTCGCC
+GAGGCGGTGGCCGCGGCGGCCGCCCTGACCGCCGACGGCCCGCTGGAATACCTTGAACAACCCTGTGCCA
+CCGTCGCCGAACTCGCCGAGTTGCGCCGGCGGGTGGATGTGCCGATCGCCGCCGACGAAAGCATCCGCAA
+GGCCGAGGATCCGTTGGCCGTTGTCCGCGCTCAGGCCGCCGATATCGCGGTGCTGAAGGTCGCCCCGCTG
+GGCGGTATTTCGGCGCTGCTTGATATCGCGGCGCGGATCGCCGTTCCGGTGGTGGTCTCCAGCGCGCTCG
+ATTCCGCCGTCGGAATCGCCGCCGGCCTGACCGCCGCCGCGGCCCTGCCGGAGCTCGACCACGCGTGCGG
+GCTGGGCACCGGCGGGCTGTTTGAAGAGGACGTGGCCGAGCCCGCAGCACCCGTCGACGGCTTTCTGGCA
+GTTGCGCGGACAACGCCCGACCCGGCGCGGTTGCAAGCCCTGGGTGCACCGCCGCAGCGGCGACAGTGGT
+GGATCGACCGGGTCAAGGCCTGCTACTCGTTGCTTGTACCGTCTTTCGGGTGATCAACCTGGCCTACGAC
+GACAACGGGACCGGTGACCCGGTGGTCTTTATCGCCGGCCGCGGCGGCGCCGGACGCACCTGGCACCCAC
+ATCAAGTCCCGGCCTTTCTGGCGGCTGGATATCGGTGCATCACGTTCGACAATCGGGGCATCGGCGCCAC
+CGAAAACGCCGAAGGCTTCACCACGCAAACCATGGTCGCCGACACCGCGGCGCTGATCGAAACCCTAGAC
+ATCGCCCCGGCGCGCGTTGTCGGGGTGTCGATGGGGGCATTCATCGCGCAGGAACTCATGGTGGTCGCAC
+CCGAGCTGGTCAGCTCGGCGGTGCTGATGGCCACTCGCGGCCGCCTGGACCGCGCCCGCCAGTTCTTTAA
+CAAAGCCGAGGCCGAACTCTATGACTCGGGTGTCCAGCTGCCACCCACATACGACGCGAGGGCTCGCTTA
+CTGGAGAACTTCTCCCGAAAGACGCTCAACGATGACGTGGCCGTTGGCGACTGGATCGCGATGTTTTCCA
+TGTGGCCGATTAAGTCCACCCCCGGACTGCGCTGTCAGCTAGATTGCGCTCCGCAGACCAACCGGCTGCC
+CGCCTACCGCAACATCGCCGCGCCGGTGCTGGTGATTGGTTTCGCCGACGACGTGGTGACGCCGCCCTAC
+CTGGGTCGGGAGGTCGCCGACGCCCTGCCGAACGGCCGTTACCTGCAGATACCTGACGCCGGTCATCTCG
+GGTTCTTCGAGCGGCCGGAAGCCGTCAACACCGCGATGCTGAAGTTCTTCGCCAGTGTCAAGGCCTGAGC
+GCGGCCCGGCCATACGGTCCGGCTGTGACACTCTGTACTGGTGAACCCCTCGACGACACAGGCGCGCGTC
+GTCGTCGACGAACTGATCCGCGGCGGCGTTCGCGACGTGGTGCTGTGTCCGGGCTCGCGCAATGCGCCGC
+TGGCCTTCGCGCTGCAGGACGCCGACCGGTCCGGCCGGATCCGGTTGCACGTTCGCATCGATGAACGCAC
+CGCCGGCTACCTGGCCATCGGGCTGGCAATCGGGGCGGGCGCGCCGGTGTGTGTCGCGATGACATCCGGC
+ACCGCCGTGGCCAACCTCGGTCCGGCGGTGGTGGAGGCAAACTACGCTCGGGTGCCGCTGATCGTGCTGT
+CAGCCAATCGGCCCTACGAGCTGCTGGGCACCGGCGCCAACCAGACCATGGAACAGCTGGGCTATTTCGG
+CACCCAGGTGCGCGCCAGCATCAGCCTGGGGCTGGCCGAGGACGCACCCGAGCGGACCTCGGCGCTCAAC
+GCGACCTGGCGATCGGCTACGTGCCGAGTGTTGGCGGCCGCCACGGGTGCTCGCACCGCCAACGCGGGCC
+CCGTGCACTTCGACATCCCGCTGCGCGAACCGCTGGTGCCCGATCCCGAGCCCCTCGGCGCGGTCACCCC
+GCCGGGCCGGCCTGCTGGCAAGCCGTGGACCTACACGCCGCCGGTCACCTTCGACCAGCCACTGGACATC
+GACCTGTCGGTCGACACCGTGGTCATCTCCGGGCATGGCGCTGGCGTGCACCCCAACCTCGCGGCGTTGC
+CGACCGTCGCAGAACCGACGGCGCCGCGGTCCGGGGACAACCCGTTGCACCCGCTGGCGCTGCCGCTGCT
+GCGCCCTCAACAGGTGATCATGCTGGGCCGGCCGACACTGCATCGTCCGGTATCGGTGCTGCTGGCCGAC
+GCAGAAGTGCCGGTATTCGCATTGACAACCGGTCCACGCTGGCCGGATGTCTCGGGTAACTCGCAGGCCA
+CCGGCACGCGGGCGGTCACCACCGGCGCGCCGCGGCCCGCGTGGCTGGACCGGTGTGCGGCGATGAACCG
+GCACGCGATCGCGGCGGTTCGGGAACAGCTCGCGGCGCACCCGTTGACCACCGGGCTGCATGTCGCGGCG
+GCGGTGTCGCATGCGCTGCGGCCCGGTGACCAGCTGGTGCTCGGGGCATCCAATCCGGTGCGGGATGTGG
+CGTTGGCCGGTTTGGACACCCGCGGCATCCGGGTACGGTCCAACCGTGGGGTCGCCGGCATCGACGGCAC
+CGTGTCCACCGCGATCGGGGCGGCCCTAGCTTATGAGGGGGCTCACGAGCGCACCGGCAGCCCGGACTCC
+CCGCCCCGCACCATCGCACTGATCGGCGACCTGACGTTCGTGCACGACAGCTCCGGGCTGTTGATCGGGC
+CGACCGAACCGATACCGCGGTCATTGACCATCGTGGTGTCTAATGACAACGGCGGCGGCATCTTCGAATT
+GCTCGAGCAGGGTGATCCCAGGTTCTCCGACGTGTCATCGCGAATCTTCGGCACCCCACACGACGTCGAT
+GTGGGCGCATTGTGCCGCGCCTACCACGTGGAATCTCGCCAGATCGAGGTCGACGAACTCGGACCGACCC
+TCGATCAACCCGGTGCCGGCATGCGCGTGCTCGAGGTCAAGGCCGACCGGTCGTCGTTGCGACAATTGCA
+CGCCGCCATCAAGGCGGCTCTGTGATATCACCGAAACCCCTGCTGCACATCCTGATTCATGGGCGCAGTG
+ATGAACTGCCCGATACTCGAGGCAGGATCGTGCTGCGCTGGTTACGAATCGCCGTCCTGATAGTGACCGG
+TTTGGTCACGCTGCAGTCGGTGCTTCTGGTGGCTGGTGCGTGGCGCAATGACATTGCGATCCAACGTAAT
+ATGGGGGTCGCGCAGGCTGAGGTGCTCAGCGCCGGGCCGCGGCGTTCGACGATCGAGTTTGTCACACCGG
+ATCGGATCACCTATCGGCCGCAACTCGGTGTGCTGTATCCGTCCGAATTATCCACGGGCATGCGAATTTA
+CGTTGAGTACAACAAGAGGGATCCCAACCTGGTCAGAGTGCAGCACCGTAACGCCGGACTGGCGATCATC
+CCGGCCGGGTCCATCGCGGTGGTGGCCTGGCTGATCGCCGCCGCCGCGCTGGTCGTGCTAGCGGTGCTGG
+ACAAGCGGTTGGAACGTCGTGAAAATTCGGCGTCTGCAACGGGCTGAGCAGCAGAGTTCGCACGCCGTAT
+GCCGCTACGCAACCATTTCGACAGCCGGCGCTGACAGTGTGTGTGGCGTGCGCGTTGCGATCGTCGCCGA
+GTCGTTCCTCCCGCAGGTGAACGGCGTCAGCAACTCGGTGGTCAAGGTACTCGAACATCTGCGTCGAACC
+GGTCATGAAGCCCTGGTGATCGCGCCCGATACGCCGCCAGGTGAAGACCGCGCCGAGCGACTTCACGACG
+GTGTCCGGGTGCACCGGGTGCCGTCGCGGATGTTCCCAAAGGTGACCACGTTGCCGCTCGGCGTGCCCAC
+CTTCCGAATGCTGAGAGCGCTGCGCGGATTCGATCCGGATGTCGTGCATCTGGCGTCGCCGGCGCTGCTT
+GGCTACGGCGGACTCCATGCCGCTCGGCGGCTAGGGGTGCCCACGGTCGCGGTCTACCAAACCGATGTTC
+CGGGTTTCGCGTCCAGCTACGGCATTCCGATGACAGCACGGGCGGCGTGGGCATGGTTCCGCCACTTGCA
+TCGCCTGGCTGACCGCACTCTGGCGCCGTCCACAGCGACAATGGAATCCCTTATTGCCCAGGGCATTCCG
+CGAGTACACCGGTGGGCACGCGGGGTGGACGTGCAACGTTTCGCGCCGTCGGCGCGAAACGAGGTGTTGA
+GGCGACGGTGGTCACCGGACGGCAAACCCATCGTCGGCTTTGTGGGTCGGCTTGCTCCGGAGAAGCATGT
+CGACCGGCTCACGGGTCTGGCGGCCTCCGGCGCCGTGCGGCTGGTGATCGTCGGCGACGGCATCGACCGG
+GCAAGATTGCAATCAGCAATGCCCACAGCGGTTTTCACCGGAGCACGGTATGGCAAAGAGCTCGCCGAGG
+CGTATGCCAGCATGGACGTCTTCGTACATTCCGGTGAGCACGAGACGTTCTGCCAAGTCGTGCAGGAAGC
+GCTGGCGTCGGGGCTACCGGTGATCGCTCCGGACGCCGGCGGACCGCGTGATCTGATAACCCCGCACCGC
+ACCGGGCTGCTGTTGCCGGTCGGCGAGTTCGAGCACCGGCTTCCTGACGCCGTCGCCCACCTGGTGCACG
+AACGCCAGCGCTACGCGCTGGCCGCCCGGCGCAGTGTGCTGGGCCGCAGTTGGCCGGTGGTCTGCGATGA
+GCTGCTCGGCCACTACGAGGCGGTGCGAGGTCGGCGCACGACCCAGGCCGCGTAACGGTAGCGTCGAGGC
+TATGAGTCGCGCCGCCTTGGACAAGGATCCCCGCGACGTGGCGTCGATGTTCGATGGCGTCGCCCGCAAG
+TATGACCTGACCAATACCGTGTTGTCCCTGGGCCAGGACCGGTATTGGCGGCGAGCCACTCGGTCGGCGC
+TGCGGATCGGGCCCGGCCAAAAGGTCCTGGACCTGGCCGCGGGCACCGCCGTGTCCACCGTAGAGCTCAC
+CAAATCGGGCGCGTGGTGTGTGGCTGCCGATTTTTCGGTCGGCATGCTTGCGGCGGGCGCTGCGCGCAAG
+GTTCCCAAGGTCGCCGGTGACGCCACCCGGCTGCCGTTTGGTGACGACGTGTTCGATGCGGTCACCATCA
+GTTTCGGGCTGCGTAACGTCGCAAACCAGCAAGCGGCGCTGCGGGAAATGGCTCGTGTCACCCGGCCGGG
+CGGGCGGCTACTAGTGTGCGAATTCTCCACGCCCACCAATGCGTTGTTCGCCACCGCCTACAAGGAATAC
+TTGATGCGGGCGCTGCCCCGGGTGGCGCGGGCGGTGTCTAGCAACCCCGAGGCCTACGAGTACCTCGCGG
+AGTCGATCAGGGCCTGGCCCGACCAGGCGGTGCTGGCGCACCAGATTTCGCGGGCCGGGTGGTCGGGGGT
+GCGGTGGCGCAACCTGACCGGCGGCATCGTAGCTCTGCATGCCGGATACAAACCCGGCAAACAAACCCCG
+CAGTGACCGGTAGGAAGACTTAGCGGGTGCCAGCCCGTTGCAGGACGCCCACATGCTCAGGGCAGTAGTG
+ATCGATCGCGGCGCCCAGGAACTGAAACGCTTGGCCCTGGGTGGTTCCGCGCGGCAGGTTGCGTTGCAGG
+AAAGTGGCCGACTTGTACGCATCGCCGTCAACGCCTCTGCTCAGCCGTTCGCAGCTGATCTTGGCAAGCC
+AAGCGTTGTAGTCCTGCGGGCCGTAGATCCCGAAGCGATGGATCGTGTTGTTGAAGGGGGCGTCGTAGTC
+GTCGGCCTGCGCCGGCGCTGCCAAACTAACGGCAGCCACCGTCATGCCGACGACAACAGCCAGCTTTGTT
+CCCTTCATTAGCCGGACTATACGCGTCGTTTGGGTGCGCCGTCAGCCCAGGTGGGCCGAGAGCAGCCAGC
+CACCGATCGACTGCAGCCCGTTGGGCTCTTCGCGGATGTCCAGGAGTGCGGGCATGCCGGCGAAGCCGGC
+CGGGAACCTCGCGTACAGCCGCGCGGGCTTGATCTCATCGATGATCCAGTACTTGGACACCGCCGCGCGC
+AGCTCGTCCTCGGTGACCGCATTGATCGGCCCCTCGGGTATCGCCGCCCGGTCGAATACCAACACGAAGT
+AGGAGGCGCCCGGTGCCGCCGCACGCACGATCGATTGCAGATAGCCCTCCCGGGACTCGACCGGCATGGA
+GTGGAACAGCGTGCTGTCGACGATGGTGTCGAACCTGCCGTCATAGCCGGTAAACGAACTGGCGTCGGCC
+ACCTCGAAGCTGGCATTGGCCAGGCCGCGCTTCGCTGCTTCATGCCGAGCCAGTTCTACGGCGGCGGGGG
+AGAGGTCCAGTCCGACCGTGGTGTGTCCCCGTTCGGCCAGTGCCAGCGAAATCGCGGCCTCCCCGCAGCC
+CACGTCGAGGACGTCGCCGCGGAACTTGCCCTGCACGATCAGGGCGGCCAGCTCGGGCTGGGGTTCGCCG
+ATGCTCCATGGCGGTCGGACTCCCTCCCCGAAGGCGACGGATTCACCGCGGTAGGCGGATTCGAACTCAA
+GATCCAGCGATTCAGTCATGTGTTCATATATATCAACGGCCCTGATATATGTCAACACAGTTGACATTCG
+CGCACCCTTGGTTGCCGGCCGTCAGCTGAACGGCGGTCGTCGATCGACGAGCCGGGACAATTGACCGCCA
+CCGCGCCACACCCGCGCCACCCAGTCGCGGTCGTCGTCGGTGACCAGATTGGACATCACCCGCACGGCGA
+TGTTCATCAATGCGGTGGAGCGCATCGTGATGGGCCCAGTCGTGGGTAGGAACCGTGGGAAGGTCAGTAA
+CAACGCTAGCCGGCGCGCAACCGAGAAGCCGCGACCGTAGCGGTCGGCCAGCAGCGACGGCCACAGCCGT
+GCCAGGTCACGCGAATCCAGCAGTTCGGCGGCCAGCCGCCCGGTTTCCAGCCCGTAGTCGATGCCCTCGC
+CATTGAGCGGGTTGACGCAGGCCGCGGCGTCGCCGATGAGCATCCAGTTGGACCCGGCCACTCCAGAAAC
+CGCGCCGCCCATCGGCAACAGCGCCGACGACACCGCGCGCGGCTGGCCGGTGAAGCCCCACTCGTCACGG
+CGCAGGTCGGTGTAGTAGGAGATCAGCGGGCGCAGGGCCAGATCGGCTGGCCGTCTTGAGGTCGACAACG
+CTCCCACGCCGATGTTCACTTCGCCGTTGCCCAGCGGAAAGATCCAGCCGTAGCCGGGTAGCACGGCGCC
+GTCGGGGGAGCGCAGTTCCAGATGCGACGTCAGCCACGGGTCATCGCTGTACGCCGTGCTCAGGTACCCC
+CGGACCGCGACGCCATAGACCGTCTCCCGATGCCATCGCCGGCCCAGCTTGCGTCCCAGCGGGGATCGGG
+CCCCGTCGGCAACGATCAGCTGGCGGCAGCCCACCTCAGTGCCGTCGGCCAGGGTCAGCGATACCACCCG
+CCTCGATGAATCATGGTGAACAGCAACGGCTTTAGCGCCAAGTAGCATGCGCGCACCGGTGTCCTCGGCG
+ACCTTTCGGATCCGGTCGTCCAGCTCGAGACGGGCCACCGCGCTGCCGTACGACGGGAAGCTCGGACCGG
+GCCAGTCCACTTCCACCTCGCCTCCGAAGCCGCTCATCCGCAACCCACGATGCCGGATGTGGTCCGCCAG
+CCACTTACCTAGTCCCAGCTGGTGCAGTTCGGCGACCGCGCGTGGTGTCAGCCCGTCGCCGCAAGGCTTG
+TCGCGGGGGAAGGTGGCGGTGTCGATGACGAGGACGTCGCGGCCCGCGCGGGCAGCCCAGGCGGCCGCAG
+CTGACCCGGCCGGTCCGGCGCCCACGACCACCACGTCGGCACTGTCATCCACGCTCACCAGTATGTTGGT
+CGAGTGAGGACTCCGGCGACGGTGGTGGCAGGCGTTGACCTGGGCGACGCTGTCTTTGCCGCGGCCGTGC
+GTGCTGGTGTCGCGCGAGTCGAGCAACTCATGGACACCGAGCTGCGCCAGGCCGACGAGGTGATGAGCGA
+TTCGCTGCTGCACTTGTTCAATGCCGGTGGCAAGCGGTTCCGTCCACTGTTCACCGTGCTGTCGGCGCAG
+ATCGGGCCGCAGCCGGATGCCGCAGCGGTGACAGTCGCCGGGGCGGTGATCGAGATGATCCACCTGGCGA
+CCCTCTACCACGATGACGTGATGGACGAGGCCCAGGTCCGCCGCGGCGCGCCCAGCGCCAACGCGCAATG
+GGGTAACAACGTCGCGATCCTGGCTGGCGACTACCTACTGGCCACCGCATCGCGGCTGGTGGCGAGGTTG
+GGACCGGAGGCGGTGCGGATCATCGCCGACACCTTCGCCCAGTTGGTGACCGGGCAGATGCGTGAGACGC
+GCGGCACGTCGGAGAACGTGGACTCCATCGAGCAGTACCTGAAGGTGGTCCAGGAGAAGACCGGCAGTCT
+AATCGGGGCGGCCGGCCGGCTGGGTGGGATGTTCTCCGGTGCCACCGACGAACAGGTCGAACGGCTGAGC
+CGCCTCGGCGGCGTGGTGGGCACCGCGTTTCAGATCGCCGACGACATTATCGACATCGACAGCGAGTCTG
+ACGAGTCGGGCAAGCTGCCCGGTACCGATGTGCGCGAAGGAGTACACACCCTGCCGATGCTCTACGCGTT
+ACGGGAATCAGGGCCCGATTGCGCTCGGTTGCGCGCACTGCTGAACGGACCGGTCGACGACGACGCCGAG
+GTGCGCGAGGCGCTGACATTGTTGCGGGCGTCGCCGGGCATGGCCCGGGCCAAAGACGTCCTGGCGCAGT
+ACGCGGCTCAGGCACGTCACGAGCTGGCCTTACTGCCCGACGTCCCGGGACGGCGTGCCCTGGCGGCGCT
+GGTCGACTACACCGTGAGCCGGCACGGCTAGGTTGCCCGGCCAGGCTCGATTGCGGAACCAGCGGATACC
+CCTCAGGCGTTGAACCAGCAGTAATCTCCCAAGTTGAGGTGTTCTAGGAGGACACGCACTGATGACTTGG
+CATCCGCATGCCAACCGGCTGAAGACGTTCCTGCTGTTGGTCGGTATGTCCGCGTTGATCGTGGCCGTCG
+GCGCGTTGTTTGGCAGGACGGCGCTGATGCTGGCGGCGCTGTTCGCCGTCGGAATGAACGTCTACGTCTA
+CTTCAATAGCGACAAGCTGGCGCTGCGGGCGATGCATGCGCAACCGGTTTCCGAACTGCAGGCGCCGGCG
+ATGTACCGGATCGTTCGAGAGCTGGCGACCAGCGCTCACCAGCCGATGCCCCGGCTGTACATCAGCGACA
+CCGCCGCACCCAACGCGTTCGCCACCGGCCGCAACCCGCGCAATGCCGCGGTGTGTTGCACGACTGGCAT
+CCTGCGTATCCTCAATGAGCGTGAGCTGCGTGCCGTGCTGGGCCACGAGCTGTCTCACGTCTACAACCGC
+GACATCCTGATCTCTTGTGTGGCAGGTGCGCTGGCAGCGGTGATTACCGCGCTGGCCAACATGGCCATGT
+GGGCCGGCATGTTCGGCGGCAACCGAGACAACGCCAATCCCTTTGCACTGCTTCTGGTTGCGCTGCTGGG
+CCCGATCGCGGCAACCGTGATACGGATGGCCGTGTCGCGATCGCGGGAGTACCAGGCCGACGAGTCGGGT
+GCCGTCCTGACCGGGGACCCGCTGGCGTTGGCGTCGGCATTGCGCAAGATCTCCGGCGGCGTCCAGGCGG
+CGCCGCTGCCGCCGGAGCCGCAGCTGGCCAGCCAGGCGCACCTGATGATCGCCAACCCGTTCCGGGCGGG
+TGAGCGGATCGGATCGCTGTTTTCGACTCACCCACCGATCGAGGACCGCATTCGCCGGCTGGAGGCGATG
+GCGCGCGGCTGATAACTGTGGGTATCGAGATGCCATCGGTGATGAGTCAGGCGCCGCTATCGAGGAGGCG
+GTCGATCAGTTCGTGGCTGGCATGCCGGCGTGCGGCGAGGACGCGCCCGTCCCACTGACCGAACGCAACA
+GCCGAACTATCGTTGTGCGGACATCACCGGCATGCGTGCCGGCAGCGGTGGCAAGCCTAAAACCCCGAGC
+CGTGCACCTCGTGTCCGGGGACCTCGGCGATCAAGCCTCTATACGCCTGCTCCACCGTCGAACCATGGTT
+GATGACGGCGTCGACCTCGCGGGCGATCGGCATGTTCAGCCCGAACTCGTTGGCGAACTCCATCACCACA
+CCGGCAGCTTTGACGCCCTCGGCGACCTGGCTCATCGATGCGATGATTTCGTCGATCGGCTTGCCTGCGC
+CGAGTTGTTCGCCCACATGCCGGTTGCGGCTGCGTTGGCTGGTGCAGGTGACGATCAGGTCGCCGAGACC
+GGCCAGTCCGGGGAACGTTTCGCTTTTCCCACCCATTGCCACACCCAGCTTCGTCATCTCGCGCAGCGCG
+CGGGCGATCACCAGGGCGCGGGTGTTTTCGCCGATACCCAGCGAATAGCCCATCCCGACCGCGATGGCGA
+AGACGTTCTTGAGGGCGCCCGCCGTCTCGACACCGACGACGTCGTCAGTTGTGTACACGCGGAAGCGCCG
+GGTGCGAAACATTGCTGATAGCCGGGTCGCCAGGTGCTGGTCGGGCATGGCCAGCACCGCCGCGGCCGCG
+TAGCCCTCGGCCACCTCGCGGGCGATGTTCGGGCCGGCCAGGATGCCTGCCGGATGACCGGGCAGTACCT
+CCTCGATGATCTGCGACATCCGCATATTGGTGCCCTGTTCGAGCCCCTTGACCAGGGACACCACTGGCAC
+CCAGGGTCGCAGCTCTTTGCTCAGCTCGACAAGCACTCCGCGGAAACCGTGCGAGGGCACCCCCATGACG
+ACGACGTCGGCGCAGTTGGCGGCCTCGGTGAAGTCTGTGGTGGCGCGCAGGGTGTCGCTGAGCACCACGT
+CGTTGCCGAGGTATCGGCTATTGCGGTGGTTGTCGTTGATGTCCTGCGCGGTGACCGCCGAGCGCACCCA
+CTGCAAGGTTGGTCCGCGGCGCGCACAGATGGAGGCGACGGTGGTGCCCCAGGAACCGCCGCCGAGGACA
+ACGACTTTGGGTTCGCGCTTGTTGGCTGCCATGGCGTTCAGCGTATTGCGGCAACCGGACATTTGATAGC
+CGTCGACGAACCGCAGGAGCAATCATGCCGCGCCGAACACCATTGCCTCCTCGATGCGGTCGAATCGGTA
+GTCGATGGCGTCGGCCAAGTAGTTCTGTCGTACATTCCACGGCCGCTTGGTGCCGGACTTGGGCAGCGCG
+TACGGCGCCCGCTTCACATAGCCGGCCTGAATGTCCCAGGACGGTTTCTCGTCCATCGGCTCGTCGCCCA
+GGTGCGGGGCGGCGCGCGTGTGTCCATGGGCGGCCATGTGTGCCAGTAGTTTTGCCGTCGCCCGGGCCGT
+CATGTCGGCGCGCAGCGTCCAGGACGCGTTCGTGTAACCCACACACCAGAACAGGTTGGGCACGTCTTCG
+AGCATGTGCGCCTTGTAGACAAAGCGATCCCGAGGGTCGATCTCGACGCCGTCGAGGCTGATCGCGGCCC
+CGCCAAGCGCTTGCAACTGCAGGCCGGTGGCGGTGACGATAATGTCCGCATCGAGGTGCCCACCGGATTT
+GAGTGCAATACCGGTGGCGTCGAAGTGGTCGATATGGTCGGTGACCACCTCGGCGCGGCCGCTGGTGATG
+GCGTTGTACAGGTCGGCGTCCGGGATCAGGCACAGTCGCTGATCCCACGGGTTGTACCGCGGCGTGAAGT
+GGGTTTCGATGTCGTAGCCCTCGGGCAGATTTTTGATCGCGGTACGGCGCAGCAGCCATTTCACGAACAC
+CGGTGTCTTGCGGGACAAGAACCAGAACACCGCTTCCAATAACGCGTTGTACATTCGGACAATCAAGTGA
+GAAGTTTTGGGAGGCAACGCTTTACGAACAACGGCGGCGAACGTGCTGTATTTGGATGCCGAGATCAGGT
+AGGTCGGGGATCGCTGCAGCATGGTTACCTTTTCGGCCCGGTCGGTCAGCGAGGGGATCAGTGTGACCGC
+GGTGGCCCCGCTGCCGATCACCACGATCTTCTTGCCGGTGTAGTCCAGATCCTCTGGCCAGTGCTGGGGA
+TGCACTACCGCGCCGCCAAACTTCTCGATGCCTCCGAAGTCGGGGGTGTAGCCCTCGTCATAGTTGTAGT
+AGCCGCTGCCGAAGAACACGAACCGGCTGCGGTAGTGCTTGTGCACGCCGTTCTGCTCGAAGGTGACGGT
+CCAGGTATCGGTGGATGAGTCCCAGTCCGCTGCGCGAACGTAGCTGTTGAACTCGATGTGGCGATCGATG
+CCGTACTTGTGGGCCATGTCGGTGAGGTACTCGCGGATGTGGGCGCCGTCGGCGATGCCTTCTTCGCGGG
+TCCACGGCTCGTAGGGAAACGACAGCGTGAAGATGCTGCTGTCGGAGCGCACGCCGGGGTAGCGGAACAG
+ATCCCAGGTGCCGCCGATCCGCGCACGCCTTTCCAGGATGGTGTAGGTCAGCTGCGGGTTGCGTTCGATG
+ATCCGGTAGGCCGCGCCCAGTCCGGAGATGCCGGCGCCGACGATGACGACGTCGACACAGCCGGCGTTTG
+GAGTCACGCTCATCGTGAACCTCGCTTGAAATCCTGGATCAGCGACCAGGGTAGCCAGGACATCCAGCCA
+GCCCCTCCAGATCGCCGCGACTAGCGGTAGTTCACAAACTGCAATGCCACGTCCAGGTCGGCCTTCTTCA
+GCATGGCGATGACGGCCTGCAGGTCGTCGCGCTTCTTGCTGGTGACCCGGACCTCGTCGCCCTGGATCTG
+GGTTTTGACGTTCTTGGGGCCTGCGTCGCGGATGAGCTTGGTGATCTTCTTGGCGTTCTCGCTGCTAATG
+CCCTGTTTGAGGGCGCCGGTAACTTTGTACGTCTTACCCGAGGCCTGCGGTTCTCCGGCCTCGAAGGCCT
+TCAGCGAGATGTCGCGGCGGATCAGCTTCTCCTTGAAGACGTCGACGGCGGCCTTGACACGCTCCTCGGT
+GGACGAGGTGAGCTCGACGGCCTCGTCGCCCTTCCACGCGATCTTGGTGTCGGTGCCGCGGAAGTCGAAG
+CGCGTGGCCAGCTCCTTGGCGGCCTGGTTGAGTGCGTTGTCGACCTCCTGCCGGTCGACCTTGCTGACGA
+TGTCGAACGATGAGTCCGCCATTCGGTTCGTCCCTCCTTCGCGAGATAGCCGTGTGTGCTCTGTCTACCC
+GGTCGTTGTACCCTGCTAGGCGGCAGGTTGCCCGAGCGGCCAATGGGAGCGGACTGTAAATCCGTCGCGA
+AAGCTACGCAGGTTCGAATCCTGCACCTGCCACCACGGTCAAGCTGGTATCCGGGCATGGGCGCCGGGCA
+TGGCCACGCCCGCGCGTTGGTGCCCCAACGTCGCCTACGGTCGGTAGACAGCGGCGCGACACCCGCACTC
+CAACAATTTCGGGAGGTCAAGTGGTGGAGTTGAGCCCGGATCGGATCATGGCGATCGGCGGCGGGTACGG
+CCCGTCTAAGGTACTGCTTACCGCGGTCGGGCTTGGGCTGTTCACCGAACTTGGCGATGAGGCCATGACC
+GCCGAGGCCATTGCCGACCGCCTCGGGTTGCTAAAGCGACCGGCGATTGACTTCCTCGACGCCTTGGTCT
+CGCTGGACTTGCTGGCGCGAGACGGCGACGGACCCGGGTCCCACTACCGCAATACACCGGAGACAGCGCA
+CTTTCTGGACGAGGCCCGTCCCACCTACGCGGGCGGCCTGCTGAAGATCTGGAACGAACGCAACTACCGC
+TTCTGGGCGGATTTGACCGAGGCGCTCAAGACCGGGAAGGCACAAAGCGAGGTCAAGCAAACCGGGCGGC
+CCTTCTTCGAGGCGCTCTATGCAGATCCTCGGCGGCTCGAGGCGTTCATGGCGGCTATGGACGCGGCGTC
+GCGACGCAACATCGAGCTCCTCGCGAAACGCTTTCCGTTCGAGCGCTACCGGCGTCTCTGTGACGTGGGC
+TGCGCGGACGGTCTGTTGTCACGAATCGTCGCGGCGGCTCACCCGCACTTGCAGTGCGTCAGCTTGGACT
+TGCCCGCGGTGACCGAGATCGCTCGACGCAAGCTGACAGCCGAGGGTTTGGGTGAGCGGGTGCAGGCGTG
+CGCCGGTGACTTTTTGGCCGACCCTCTGCCGGCGGCCGATGTCATCACGATGGGCCAGATTCTGCACGAC
+TGGAACCTCGACCGTAAACAGCAGTTGGTCGCTAAGGCCTACGAGGCCCTGTCCAAGGAGGGGGCTTTCA
+TTGTGATCGAGACATTGATCGACGACGCGCGACGCGAAAACACAACCGGCCTGATGATGTCACTGAACAT
+GCTTATCGAGTTCGGTGACGCGTTCGACTACTCCGCCGCCGACTTCCGGGGGTGGTGTGGCGAGGCGGGA
+TTCCGTTCGTTCGAGGTGATCCCGCTTGCCGGCGGCTCCAGCGCGGCGGTGGCCTATAAATAGCGGGCAA
+TGACATGGTGGGTGGCCGACCAACGTGAACTGAGGACGGCAAATCGGCCTCAGTTCACGCTCGGCGCTTT
+GAGCAACAAATTGAACACATAGAATCGTGTCGATGAGCGGCACATCGTCGATGGGATTGCCGCCGGGACC
+TCGACTTTCCGGCTCGGTGCAGGCCGTGTTGATGTTGCGCCATGGGCTGCGTTTTTTGACGGCCTGTCAA
+CGCCGTTACGGCAGTGTTTTCACGCTGCATGTCGCGGGGTTCGGCCACATGGTGTATCTGTCCGATCCGG
+CCGCCATCAAGACAGTGTTTGCCGGCAACCCGAGTGTCTTTCACGCCGGCGAAGCCAACTCGATGTTGGC
+CGGACTGCTCGGCGACAGCTCACTGCTGTTGATCGACGACGACGTGCACCGCGACCGGCGTCGCCTGATG
+TCGCCGCCGTTCCATCGCGACGCGGTCGCGCGCCAGGCCGGGCCGATAGCCGAGATTGCCGCCGCCAACA
+TCGCCGGGTGGCCGATGGCTAAGGCGTTCGCGGTGGCGCCCAAGATGTCTGAGATCACCCTTGAGGTGAT
+CCTGCGGACCGTCATAGGCGCCAGCGATCCGGTCCGGCTCGCCGCGCTGCGCAAGGTCATGCCGCGGCTG
+CTCAACGTGGGCCCGTGGGCGACGCTCGCACTGGCCAACCCGAGCCTGCTGAACAATCGGCTCTGGAGCA
+GGCTGCGACGGCGGATCGAAGAAGCCGACGCCCTGCTGTACGCCGAGATCGCCGACCGCCGAGCCGATCC
+CGATCTGGCCGCACGCACCGACACGCTGGCCATGCTGGTTCGGGCCGCCGACGAAGACGGACGGACGATG
+ACCGAGCGCGAGCTGCGCGACCAGCTGATAACGTTGCTGGTCGCAGGTCACGACACCACCGCGACGGGAC
+TGTCGTGGGCACTGGAGCGGTTGACCCGCCACCCGGTCACCCTGGCCAAGGCCGTGCAAGCGGCCGACGC
+CAGCGCGGCCGGCGATCCAGCCGGCGACGAGTACCTGGACGCGGTGGCCAAAGAGACACTGCGGATCCGC
+CCGGTGGTGTACGACGTGGGCCGGGTCCTCACCGAGGCGGTGGAGGTGGCCGGTTACCGGCTGCCGGCCG
+GGGTCATGGTGGTCCCAGCGATCGGGCTGGTGCACGCGAGCGCGCAACTGTATCCGGATCCGGAACGGTT
+CGACCCTGATCGGATGGTTGGCGCCACTTTGAGCCCGACCACCTGGTTGCCGTTCGGCGGCGGCAACCGC
+CGCTGCCTCGGCGCCACCTTTGCCATGGTCGAGATGCGGGTCGTCCTTCGGGAGATCCTGCGCCGCGTCG
+AGTTGAGCACCACCACGACCTCCGGCGAACGGCCGAAGCTAAAGCACGTCATCATGGTGCCGCACCGCGG
+CGCGCGCATCCGCGTCCGGGCAACCAGGGACGTTTCGGCCACGTCGCAAGCGACAGCCCAGGGTGCCGGA
+TGCCCAGCCGCTCGCGGTGGCGGGCCGTCCAGAGCCGTCGGCAGCCAGTGACCAGCTGGGGTATCCGCAT
+GGGGTCGCCCAGCGGGTCCCGAGGGGACTTTTGGCCACCGGCGCTGGTGGCCTACTGCCCTCCCGCCGTT
+GCGCCGGGTGCGTGCACGATTGAAGTCCCCAAGGAAGGGACGCTCATGAAGGCAAAGGTCGGGGACTGGC
+TGGTGATCAAAGGCGCGACGATAGATCAACCGGACCACCGAGGGTTGATTATTGAGGTGCGCTCATCCGA
+TGGTTCGCCGCCGTATGTGGTGCGCTGGCTCGAGACCGACCATGTGGCGACGGTGATTCCGGGTCCGGAT
+GCGGTCGTGGTCACTGCGGAGGAGCAGAATGCGGCCGACGAGCGGGCGCAGCATCGGTTCGGCGCGGTTC
+AGTCGGCGATCCTCCATGCCAGGGGAACGTAGGCGATTCGCTCAAGCGACGAAGTCGGTGGGTGTCAGCT
+GGCCGGCGAAAGTCCGGCGCCGGGATGGAACGCTGGTGCCGTTCGACATCGCGCGGATCGAAGCAGCGGT
+GACGCGGGCAGCGCGCGAGGTGGCTTGCGACGACCCCGATATGCCGGGCACCGTAGCGAAAGCCGTCGCC
+GACGCACTCGGGCGCGGTATCGCTCCCGTTGAGGACATTCAGGACTGCGTGGAGGCCCGGCTGGGGGAAG
+CCGGTCTGGATGACGTGGCCCGTGTTTACATCATCTACCGGCAGCGGCGCGCCGAGCTGCGGACGGCTAA
+GGCCTTGCTCGGCGTGCGGGACGAGTTAAAGCTGAGCTTGGCGGCCGTGACGGTACTGCGCGAGCGCTAT
+CTGCTGCACGACGAGCAGGGCCGGCCGGCCGAGTCGACCGGCGAGCTGATGGACCGATCGGCGCGCTGTG
+TCGCGGCGGCCGAGGACCAGTATGAGCCGGGCTCGTCGAGGCGGTGGGCCGAGCGGTTCGCCACGCTATT
+ACGCAACCTGGAATTCCTGCCGAATTCGCCCACGTTGATGAACTCTGGCACCGACCTGGGACTGCTCGCC
+GGCTGTTTTGTTCTGCCGATTGAGGATTCGCTGCAATCGATCTTTGCGACGCTGGGACAGGCCGCCGAGC
+TGCAGCGGGCTGGAGGCGGCACCGGATATGCGTTCAGCCACCTGCGACCCGCCGGGGATCGGGTGGCCTC
+CACGGGCGGCACGGCCAGCGGACCGGTGTCGTTTCTACGGCTGTATGACAGTGCCGCGGGTGTGGTCTCC
+ATGGGCGGTCGCCGGCGTGGCGCCTGTATGGCTGTGCTTGATGTGTCGCACCCGGATATCTGTGATTTCG
+TCACCGCCAAGGCCGAATCCCCCAGCGAGCTCCCGCATTTCAACCTATCGGTTGGTGTGACCGACGCGTT
+CCTGCGGGCCGTCGAACGCAACGGCCTACACCGGCTGGTCAATCCGCGAACCGGCAAGATCGTCGCGCGG
+ATGCCCGCCGCCGAGCTGTTCGACGCCATCTGCAAAGCCGCGCACGCCGGTGGCGATCCCGGGCTGGTGT
+TTCTCGACACGATCAATAGGGCAAACCCGGTGCCGGGGAGAGGCCGCATCGAGGCGACCAACCCGTGCGG
+GGAGGTCCCACTGCTGCCTTACGAGTCATGTAATCTCGGCTCGATCAACCTCGCCCGGATGCTCGCCGAC
+GGTCGCGTCGACTGGGACCGGCTCGAGGAGGTCGCCGGTGTGGCGGTGCGGTTCCTTGATGACGTCATCG
+ATGTCAGCCGCTACCCCTTCCCCGAACTGGGTGAGGCGGCCCGCGCCACCCGCAAGATCGGGCTGGGAGT
+CATGGGTTTGGCGGAACTGCTTGCCGCACTGGGTATTCCGTACGACAGTGAAGAAGCCGTGCGGTTAGCC
+ACCCGGCTCATGCGTCGCATACAGCAGGCGGCGCACACGGCATCGCGGAGGCTGGCCGAAGAGCGGGGCG
+CATTCCCGGCGTTCACCGATAGCCGGTTCGCGCGGTCGGGCCCGAGGCGCAACGCACAGGTCACCTCCGT
+CGCTCCGACGGGCACCATCTCACTGATCGCCGGAACCACCGCGGGCATCGAGCCGATGTTCGCCATCGCG
+TTCACCCGCGCCATCGTCGGCCGGCATCTGCTGGAGGTCAATCCGTGCTTCGACCGACTGGCCCGCGATC
+GGGGCTTTTATCGTGACGAGCTGATCGCCGAGATCGCTCAGCGTGGCGGAGTCCGTGGCTATCCGCGGCT
+GCCTGCTGAGGTGCGGGCCGCGTTCCCGACCGCGGCGGAGATCGCGCCGCAGTGGCATCTGCGCATGCAG
+GCCGCGGTGCAGCGCCACGTCGAGGCCGCCGTGTCCAAGACGGTCAACTTGCCCGCCACGGGACGGTCGA
+TGACGTCCGCGCCATCTATGTGGCCGCCTGGAAGGCAAAGGTCAAGGGCATCACGGTGTATCGCTACGGC
+AGCCGGGAAGGACAGGTACTGTCCTACGCCGCGCCGAAACCGCTACTGGCGCAGGCTGACACGGAGTTCA
+GCGGCGGCTGTGCGGGCCGCTCCTGCGAGTTCTGACGGCGGCTCCCATGGCGCGAGCAGACGCAGAATCG
+CACAAAATCAGCGATTTTGATGCGATTCTGCGTCTGCTCGCGCAGGGATCGCAGGGATCACCCCGGCCGG
+CTAGCGGTTTAGCCGCTTGGGCCTGGGCCGCACAAGTGGTCGATGAACCAATCGCACGCCAGCTTGGCAA
+CCTGTTCCAGCGTGCCTGGTTCTTCGAATAGGTGTGTGGCGCCGGGGACCACGGTGAGTTGGCATTTCCC
+GGGTATTACCGCTTGCGCTCGTTGGTTCAGCTCGAGGACCACCTGGTCGCGTCCACCCACGATCAGCAGC
+GTCGGTGCCACCACGCTCCCCAGCGAATCACCCGCGAGATCGGGCCGGCCGCCGCGGGACACCACCGCCC
+GCACGTTCACGCGCGGATCGGCGGCCGCGACCAGCGCCGCACCCGCTCCCGTGCTGGCGCCGAAGTAGCC
+GACCGGCAGCGATGCGGTGTCGGGCTGGGTGGCCAACCAACCGGTCACGTCGATGAGTCGGGAAGCGAGC
+AGCTCAATGTCGAAGACGTTGGCGCGGTTGCGTTCTTCTTCGGGCGTGAGCAAGTCGAATAACAGCGTCG
+CAAACCCGGCCCCGGTCAAGACCTCTGCAACGTACCGATTGCGGATACTGTGCCGGCTGCTGCCACTGCC
+ATGTGCGAAAACCACAATTCCCCTGGGTTTTTCGGGGACAGTCAGGTGCCCTGCCACCGGTACTGGACCG
+GCAACGACCTGGACCTCCTCATCGCGAAGCGGTGGGTCAGCGGCGGCATCGATCGCACCTGCCTCGGCGA
+AGTCGCGGTGAGCACGATCCAGAAACGCCACCACCTCGTCGTCGGAGGTCTGGGTGAAGTTGCGGTAACC
+CTGCCCGACGGCGAAGAACAACGCCGGCGTCGCCAAACACACCACCTCATCGGCGTACCCGGCGAATCTC
+GCCACGATGTCGTCTGGGCCGATCGGGACCGCCAGCACCACCTTGTCCGCACCGTGCGCCCGGGCGACCT
+GGCACGCCGCCTTGGCCGTCGCTCCGGTGGCGATGCCGTCATCGACGATCACCGCGATCCGCCCGGTCAA
+CGGGATGCGGTCACGCCCGCGGCGGAAGCGTTCCGCGCGGCGTTGTAGCTCGATCAGCTGCTTGCGTTCG
+ACCGCGTCCATGGCGGCAGCATCGAGGTGTGTCCCGCGGACGACGTCGTCGTTGAGCACCCGCACGCCGT
+CCTCACCGATGGCGCCGAAAGCCAATTCGGGTTGGAACGGCACGCCAAGCTTGCGCACGACCAGGACGTC
+GAGTGGCGCTTGCAGTGACTTGGCGACCTCAAAGGCCACCGGTACCCCGCCGCGCGGCAAGCCAAGGACG
+ACGACGGCCTTGCCGGATAGCTGCGCCAGGCGTTGCGCCAACTGGCGTCCAGCGTCGCCACGATCGTCAA
+AGAGCTTCATCTGCCGAGTGTGTCGCCATCTCATGGCTCCAAATATGGAATTAGGTCCCTGGGCCGACTG
+ACGACAGTCCCTCAGCGACCGGATTGCGCATCCCGCCTTGTACGCTACTCCGCAAATCCCGGGCTTGCGT
+CCGCGGAAGCGAACTCGGCGGCGCTACGGTGGTGGCTCACTTCGGCCGTGCGCACTCGGATCGACGGGCC
+GATGGCGGCCGGGCCCGCGCGCTTCATAGGTCATCGGATTGAGGTGATCGACTCGGCGATGAGTGTTCGA
+AAGATGACTCAGTGGTGTGCCTTCCGTCGGTGAGCTGCACGACATATGTGCGGTCGTCGGCGTCGTACTC
+AACCGTGCCGCCCGAGACAACCATCCCAACCAACGCATTGCCGTCCTGGAAGTAGTACGCGTTCTTTTCT
+CGGCGCATGGAATCCAGGTGGCAACCGGGCACTATGAGGACGCTCCTGCGGGGATCGTCGGTGAGGACCA
+GAATCCGCGCGCCCCGTTTCTGGGCTAGGGGATGCTTCGTAGGCTTCCGTTGCCGCATGTGCCGCTTGAT
+GGCGTGCTCACCCATTTTGGTTTTGCCCTCTCACTTGACGCTGCGTTGCCTAGCATGCCAACCGGCTAGC
+TTCGCGGAACGTGCTCCCCGGGGTGCGGGCATTCACCGGGCACGTGAATCAGTACTGCGCCGTCATCGAC
+GATCCCGGCTTGACCGCGGCGATGGGCGGTGATGTATAGCCATCCGGGTTCGATGGTTTGCTTGCAGCGT
+GTACATTGCGGGTCGGCGGCCATGTGCTCCTCGCTTCCCTAGCCTCACGGTTTGCGCCGTCGGTCGACAG
+GCGAACTGCTCTTCGCCGATGTACGTCACTGCTTCGGCGGCTAAACCCCTTGTCCAGCACGACAAGTCCA
+ACCGGCCTGCGTCGGCGGAGTTTGGCCTCGTGCTCGGCTGGCGGTGCTCATGGTGTCCCTCCGGAACTCG
+GGGTAACGGCAAGCTTTCGATGCGTCGGCAGTCCGAAATCTAGAGACGACGAACTTGTTGTTCTAGGGTC
+GTTTGGCCTTCGCCCCGACGACGTTGGACCCGGGGTGGGCTTCGGCCGTGTCGGCGTGCCGCAGCCGGGC
+GAGTTCGCCCACGATCCTGTCGCTGACCGCCACCGGATACGAGTAGCCGGTGTCCTCGAGCGAGCGCAGC
+TCCGGCGGGAGCGCGTCGATCTGCTGGCGGGCCCAGTCCCGCGCGCCGTCCAATGTGGGTGCATGCTGCC
+GGATGCGTCGGCCGTTGGTCATGATGGGCACCAGCAACGGGTCCCCGGGAAGGTTTTCACCGTGCTCGCC
+GAGCGTGTCGCCGCAAAAGACTCCGTGCTCGAGCTTACGGAACACCTGCTTGCGTCCCGGGTAGATCACC
+TTGCCGCTGGAGAACTTGGTGCGCCCGCTGCCGTCGTATGCCACCAGCTTGTAGGCCATGTCCAGCGCGG
+GCGCGTCTTGAGCCACGACGAGCTGGGTGCCCACGCCGAAGCCGTCGATCGGACAGCGGGCAGCCAAAAG
+CGCGGCGATGCGGTTTTCGTCGAGGCCCGACGACGCGAAGATCTCGACCTGCTCGAGACCGGCGGTGTCG
+AGCCGTGCACGGGTCGCCTTGGACAGCTCATCGAGGTCGCCGGAATCCAGCCGGACCGCGCGCACATCGA
+AGCGATTGCCCAGCCGCTTGGCCAACTCGATGACGTGATCGACGCCGCGTAGCGTGTCGTAGGTGTCCAC
+GAGCAGCATGGTGGCTGGGTAGAGCCGGGCGAACGCCTCGAACGCGGCCACCTCACTGTCGAAGGCTTGA
+ACAAAGCTGTGCGCCATGGTGCCGAACGTCGGGATCCCATATTGGCGGGCCGCGAGCAGATTCGACGTGC
+CCGCAGCGCCCGCGAGATAACTGGTGCGCGCGACCTTGCAGGCCGCGTCGGTGCCGTGAGCGCGCCGCGC
+GCCGAAATCCACCACCGGTCGTCCGCGCGCGGCGGCGACCACCCGCGCGGCCTTGCTCGCGAGCACGCTT
+TGCAGATGAATCTGGTTCAGCACGAACGTCTCGACAAGCTGGGCCTCGATGATTGGCGCGATCAGCTGGA
+CCGCGGGTTCGTTCGGAAAAATCACGGTTCCTTCCGGCGCGGCCCAGACATCTCCGGTGAAACGCACTCC
+GGCCAGCCACCTCAGGAACTCGTCGGAAAACTGGCCCAGGCCACGCAGGTAACGCAGATCCTGCTCGTCG
+AATCGAAACGCTTCGAGGAACTCGACCACATCGGCCAGCCCGGCGGCCATGATGTAGGACCTGCCAGGCG
+GAAGCTTGCGGAAGAATATCTCGAAAACCGCTGTGCCCGACATTCTTTCGGCCCAGTAGGCCTGGGCCAT
+CGTCACCTCGTACAGGTCGGTGAACAGCGCGCCGACGTGTTGGCGGATCGCCATGGTTGCCGGTTACTCC
+TTGCTCGTTAGGTTGGCAGCGGGAACGACCTCCAGCAGGTTGTCGGGTCGAGTCACGACTCGAATCCCGA
+ACCGGCGGCTGATGCGCTCAATGGTGTTGCGGAGCCATTCGGTGTCGGTCTGGGAGGCACGCTGTAGGCG
+CATCCGCGACACTCGCAGTGGAAGCATCTGCAGCGAGATCAGGTTCCCGCTGGCGGGATCGGTGACGGTC
+AGATACAGCAGTCGCAGTTCACTGCGGAACGACTCGTGCCCGCCGATGCCTTCGTAGTCGTCAACGACGT
+CACCGCATCCGTACAGGATCGGTTTACCGCGATATATCTCGATTGGCCGCGGATGGTGCGAGGAATGTCC
+GTGGACCATGTCGATGCCGGCGTCGATCAGTCGGTGCGCGAACGCGACGTCGCCGGGTGCGGTCGCATAG
+CCCCAATTGGATCCCCAATGCATCGAGACTATGGCGATATCGCCGGGGCGTTTGTCCGCCAGCACCTGTG
+CCGCCACATCGTCGGCGACGTCGCGTTGCGCCGGATCCCGGATCAACCACACTCCGGGCCGGTCGCGGCG
+GGCGGCCCAGGATTCGGGGACGCCGCTGGATTCCGCCGCTACCGAGCCGACGATCACCCGGCGTTCATGG
+CCAACCGTGACTAGCGCCGAGCGGCGAGCGGCGAGCAAATCGGCTCCCGCCCCGACACTCTGGATCCCCG
+CACCGGCGAGAGCCGCGACCGTATCGGTCAGCCCCTGGTAGCCGAAATCGAGAATGTGGTTGTTGGCCAG
+CGCGCACACGTGCGGCCGCAATGCCGTCAGCGCCGGCACGTTATCCGGGTGCATCCGGTAGCAGACCGGT
+TTGCGGTCGGCGAATTCACCGTCGGCGGTGATCGTCGTCTCCAGATTGATCAAACAGACGTCGGTCGCGG
+TGTTCTCAAGGACCGCCAACGCCTCGCCCCAGGGCCAGCGCCAATCCACGGGGAGCGGAATGCGCCCGTT
+CACCCGCTCGGCCAGGCGAACATAGCCGGTCGCATCCCGCATATACCGTTCGCGCAATTGCGGTTTGCCG
+GGATGAGGCAGGATCTGATCGACGCCACGGCCGAGCATGACGTCACCGCCCAGCAGCACCGTCACCACAT
+CAGGCTTGCCAGCCACTCCGGACCACCGCCGCCTTCAGGTAATCGCCGTAACACGCACCCTATGGCGTAC
+ATTGCACGTCATACGATCGGCCGGCGGCGGCCTCGTGGGTGGGGCCGAAGGTCCTCAAGACCGCGCCCAA
+AGGTCACATTGCCGGCGACAAACCGTGCCTACCTGGCGGAGAGGTGCCCGTCGGCGGTGGTCACCAGGTG
+TAGTCGGGCAGCTCGAAGTCGTCACGCACGCTGCCGGCGAACAGCGTCGCCAGCGGGCCGAAGTTCATCG
+TGCGCATCGCAACGTTGCGAAACCACAGGCCGAATCGGGTTCGGGTGGCGGAAAAACCAGATGAACTTCG
+CCGCACTGGCTTGCTTGCCCTCGATGAAGGGACGCAGGCGCTTCTCGTAGGCGTCGAAGGCGCGACGGTG
+GTCGCCCCCGGCGCGGGCGAGCTCCCCGGCCAGCACGTAGGCCTCGGTGATCGCCAGGCCGGTGCCCTCG
+CCGCCGAGCAGCGAGATGCACCCGGCCGCGTCGCCGATCAGCAGCACCCGACCGCGTGACCAGCGGTCCA
+TCCGGATTTGGCTGACCACGTCGAAGTACAGGTCCTCGACGTCGTCGAGGGCGGCCAGAATGTCCCGGCT
+TTCCCAGCCCACGTCGCCGAATTGGTCGCGCAGCTCATCTTTGGGTGCCACGCCGGGGTTGTCGTGTTCG
+GCGCGGAAGACGAACAAGAACATGGTGCGGTCGCCGCGCAGCGCGAACCGCGCCAGCTGTCGGTCGACGG
+TGTTGTAGAGGACATAGCTGCGCTCGTCGCGGGGCCGGTAGCCGTCGACCACGCAGGCCGCGACCTTGCA
+GCCCAGGTAGTGCTCGAAATCCCGCTCCGGCCCGAAGACCAGCCGGCGCACGTTGGAGTGCAGTCCGTCG
+GCACCGATGACCAGGTCGAAATCGCGCGGGGCGGTCCTTTCGAAGGTGAGCCGGACGCCGTCGCGGTGCT
+CGTCGATGGTGGCGATGCTGTCGTCGAAGATCGTTTCCACCTGGTCTTCGATCGTCGTGTAGATCGCGGC
+GGCGAGATCGCCGCGCGGCAAGCTGGTGAAGTCGTCGCCGACCATGCGGCGAAAGACGTCGACGCCCAGG
+TCGGCTTTGACCTTGCCGGTGGGACCGACGGAGCGGACGTGTTCCATGTGGTAACCCGCCGCTGCGATCT
+GGTCCGTGATGCCCATTCGTTTGGCCACCTGGTAGCCGACGCCCCAGAAGTCGATCATGTAGCCGCCGGT
+GCGGAACTTCGGCGCCCGCTCGATCACTGTCGGGGTGTGGCCGGTGCGCTGCAGCCAGTGGGCGAGCGCC
+GCTCCTGCCACGCCGGCACCGCTAATCGCTACTTTCACACTGCAATTGTGCTCTTCGGCAATAGTTTAGA
+ACAAGACCGGTCGCTCGTTGCCCCTTGATCAATACGTTAGTGAGCGCTAACGTATTGGCGTGTGCCCGAC
+ATGCTGGAAGTCGCGGCAGAGCCAACCCGGCGCCGGCTGCTACAGCTCCTGGCACCGGGTGAACGCACCG
+TTACCCAGCTTGCGTCGCAGTTCACGGTCACCCGTTCGGCGATATCGCAGCACCTCGGCATGCTCGCCGA
+AGCGGGATTGGTTACCGCCCGCAAACAGGGCCGGGAACGGTACTACCGGCTCGATGAGCGCGGGGTGCTG
+CGGCTTCGTGCGCTCATGGAGTCCTTCTGGAGCGACGAGCTGGACCGTCTTGTCGCCGATGCCGCCCACT
+ACCCGCCGTCACAAGGAGACTGTGCCATGCCGTTCGAGAAAGCGGTCGTCGTGCCCTTGGATCCGACCAG
+CACCTTCGCGCTCATCACCCAGCCCGACAGGCTTCGGCGCTGGATGGCCGTCGCCGCGCGTATCGAGCTG
+CGCACCGGTGGCGCTTATCGCTGGACGGTGACTCCGGGGCATAGCGCGGCCGGCACCGTCATCGACGTCG
+ACCCCGGCAAGCGGGTGGTCTTCACCTGGGGTTGGGAGGACCACGGCGACCCCCCGCCGGGCGGGTCGAC
+GGTGACCATCACGCTGACCCCGGTCGACGGCGGCACCGAGGTCCGGCTGGTCCACGACGGGCTGACCGCG
+CAGCAGGCCGCCCGGCACGCCAAAGGGTGGAACCACTTCCTGGACCGGCTGGTCGTCGCCGGCCAACACG
+GTGACGCCGGTCCCGACGAATGGGCCGCAGCGCCCGATCCGCTCGACGAATTATCTTGTGCCGAAGCAAC
+ATTGGCCGTTCTTCAGCACGTACTGCGCGGGATAGGCGCCTCTGACCTGACCAGGCAGACACCGTGTACG
+GAATATGACGTTTCGCAACTGGCGGATCATTTGCTGCGCTCGCTGGCGATCATCGGCGCTGCGGCGGGCG
+CGCAGCTGGCGCCCCGCGATGTGGACGCGCCACTGGAAACCCAGGTGGCCGACGCGGCGCAGGCCGTGAT
+GGAAGCCTGGCGGCGGCGTGGCTTGGCGGGCACGGTGGAGCTGAACTCGAACCAGGTGCCTGCGACGGTG
+CCGGTCGGCATCCTGTGCCTAGAATTTCTGGTCCACGCTTGGGATTTCGCGATTGCCACCGGTTCTCAGG
+TGATCGCGTCCGAGCCGGTGTCGGAGTACGTACTGGCGGTGGCCGGCAAGGTCATCACCCCGGCAACCCG
+TAACTCCGCGGGCTTCGCCGCGCCGGCGGCGGTCGGTTCCTTTGCCCCAGTCCTCGATCGCCTCATCGCC
+TTCACCGGCCGCCAGCCGACCGCAGGCCACGTGTCCGCCACCTAACGAAAGGATGATCATGCCCAAGAGA
+AGCGAATACAGGCAAGGCACGCCGAACTGGGTCGACCTTCAGACCACCGATCAGTCCGCCGCCAAAAAGT
+TCTACACATCGTTGTTCGGCTGGGGTTACGACGACAACCCGGTCCCCGGAGGCGGTGGGGTCTATTCCAT
+GGCCACGCTGAACGGCGAAGCCGTGGCCGCCATCGCACCGATGCCCCCGGGTGCACCGGAGGGGATGCCG
+CCGATCTGGAACACCTATATCGCGGTGGACGACGTCGATGCGGTGGTGGACAAGGTGGTGCCCGGGGGCG
+GGCAGGTGATGATGCCGGCCTTCGACATCGGCGATGCCGGCCGGATGTCGTTCATCACCGATCCGACCGG
+CGCTGCCGTGGGCCTATGGCAGGCCAATCGGCACATCGGAGCGACGTTGGTCAACGAGACGGGCACGCTC
+ATCTGGAACGAACTGCTCACGGACAAGCCGGATTTGGCGCTAGCGTTCTACGAGGCTGTGGTTGGCCTCA
+CCCACTCGAGCATGGAGATAGCTGCGGGCCAGAACTATCGGGTGCTCAAGGCCGGCGACGCGGAAGTCGG
+CGGCTGTATGGAACCGCCGATGCCCGGCGTGCCGAATCATTGGCACGTCTACTTTGCGGTGGATGACGCC
+GACGCCACGGCGGCCAAAGCCGCCGCAGCGGGCGGCCAGGTCATTGCGGAACCGGCTGACATTCCGTCGG
+TGGGCCGGTTCGCCGTGTTGTCCGATCCGCAGGGCGCGATCTTCAGTGTGTTGAAGCCCGCACCGCAGCA
+ATAGGGAGCATCCCGGGCAGGCCCGCCGGCCGGCAGATTCGGAGAATGCTAGAAGCTGCCGCCGGCGCCG
+CCGCCCCCGCCTGCGCCCCCGGCCCCGCCGCGGCCGTCGGCGCCGGGGCTGCCGAACTGGCCAGGCTGGC
+CGGATTGGCCGATGATGGCCAGGGGCCCGAGGTGTGCGGTGCCGCCGGTGCCACCGGTGCCACCCTTACC
+GCCAGCCCCAGGGATCGGGAATAAACCGCCGGGGTCGGCCCCTTTGCCGCCGTCCCCACCTCGCCCGCCC
+GCCCCAGCGGTCCTGAAGCCGTCGCCACCGTGCCCGCCGTCCCCGCCATTCCCACCGGAACTGGCATCAA
+GGCCGTCGCCGCCGAAGCCGCCCCTTCCGCCGTCACCGCCGGCGCTGACGGTGCTGGTGCCGCCGGCGCC
+GCCCATGCCGCCGGTGCCGCCGGGGCCAAAGGCGGAGCCAAGGCCGCCACTGCCGCCGACGCCACCGTTT
+CCGGCGCGGCCGGCCGCCCCTGTCGCACCGGTCGCGCCCAGGGTGGAACCGGTGCCGCCGGCACCGCCGG
+CACCACCGGTGCCGCCGGTGCCGCCGGTGCCGCCATTTCCGCCAGTCCCGCCAGTGCCAGCGAGGCTGCT
+GAAGAGAGTGCCGTGGGCACCTCTGCCGCCGTCGCCGCCGGTGCCGCCGGTGCCGCCGGTGCCACCGGCC
+CCACCATCTCCGCCGGCGCCTTGGCTGCCGTTGTTGCCCGTTGGCGACAGCGCTTTGCCGCCGGCCCCGC
+CGTTGCCGCCGCCGCCGCCGGCGCCGCCGGTCCCGCCAACCCCGCCGGTGCCACCGTTACCGCCGTGACC
+GTCCGCGCCAGCGTCGAATGTGCCGGTCGCACCGGTGGCGCCGGTGGTGCCCCGCAGGCCCGTCCCGCCC
+GTGCCGCCGGCCCCGCCCCGGCCGCCGTCAGCGCCGTCGCCGGCGACGCTCCCACCTTGCCCGCCTACGC
+CGCCGTCGCCGCCGCGGCCGCCGCTGCCGGTAATGGCTCCGGGATTGCCGTCACTACCGGTGCCGCCGTC
+TCCGCCATTGCCGCCCGCTCCGCCGTTGCCAATCTGCCCGGCGTTTCCGCCGGCGCCACCGGTTCCGCCG
+TCACCGCCCATGCCCCTGCTGGCATTGCCGCCGTTGCCGCCGTGGCCGCCGGCCCCACCGCTGCCGCGCA
+GGCTGCCGTTGCCGCCGTTGCCGCCGTTGCCGCCGGCCGCGCCGTTGCCGCTGAGGGCATGGTCGCCGTT
+GCCGCCGTTGCCGCCGTTGCCGCCGTTGACGTGAATGCTGCTGCTTGAGCCGGTCGCACCGAAAGTGGAG
+CCGGCGCCGCCACTCCCGCCGGCCCCGCTGGGGCCGGCGTTGCCGCCGTTGCCGCCGTTGCCGCCGATGC
+CGTTGTTGGTGAACACGCTGCCGTTAGCGCCGTTGCCGCCGTCACCGGGGTCCCCGCCGGTGCCGCCGCT
+GCCGCCGTTGCCGCCGGCGCCTTGGCTGCCGGTTGTGCCCGCCGGCCCGGCCCCGCCCGGCCCGCCGGTC
+CCGCCTCGGCCGCCCTTTCCGCCGGCCCCGCCGGCGCCGCCATCCTGGCCGCGGGCACCCGCGGTGGCGC
+CGTCGGCGCCGTCAATGCCGCGGCCGCCGTTACCGCCAACTCCGCCGGTCCCACCGTCGCCGCCGGCACC
+GCCGGGGCCTTGGCTGCCGGCGACGCCGTTGGGTGCGGCCCCGCCGTCCCCGCCGTCCCCACCTTTTCCG
+CCGGTACCGCCAACTCCGCCGGTGCCGCCGGGGTGCCCGTCCGCGCCCGCGCTGGAACCGTTGACACCGT
+CGCTGCCGGACCCTCCAGTCCCGCCGACGCCGCCGGTGCCGCCGGCCCCGCCGGTGCCACCGTTGCCCGC
+CCAGGCGCCGCCGGATCCACCGGCCCCACCGTTTCCGCCGGTGCCGCCATCCAGGCCGGGGTTGCCGAGC
+CTGCCCAGACCGGGCAGGCCTTTGCTGCCGTTGCCGCCGGCGCCGCCGGCGCCGCCGTTGCCGACCAAAC
+CGCCATCACCGCCCCTGCCGCCGGACGCGCCGGTCTGGCCAAAGCCGGTGGCATCGGCGCCTCTGCCGCC
+GTTGCCGCCGTTGCCGCCGCTGGTGGGGGTGTTGCCGGGTGCGCCGTTGGCACCGGGGGTGGAGCCGCTT
+CCGCCCTGGCCGCCGGCACCGCCGACACCGGGATCACCGCCGTGGCCACCGGCGCCACCTACACCACCGT
+TGACACCGAGCGCGCCGGCGGCGCCGTGACCGCCGTTGCCAGGAGTCCCGCCGTTCCCGCCGGCTCCGCC
+GTCACCGCCAGCGCCCTGGCTGCCGTTCTGGCCCGAGGCGGCCAACGCGAGACCGCCGGCCCCGCCCTCG
+CCGCCGGCTCCGCCAGGCCCACCGTTACCGCCATTCCCGCCGGGTGAGCCTGCGGCCCCGGGAGCGGACG
+CATTGAAGCCGATGCTGCCAGCACCTCCGGATCCGCCATCGCCGCCGGCCCCGCCAGCACCTCCGGTGCC
+GCCGTCACCGGCCTGAGTTCCGCCGTTGCCGCCGGCCCCGCCGGTGCCGCCGGCCCCGCCGGGGCGACCG
+GGCGCTTCGGATCCAAATCCGAGACCGCCGGCCCCGCCGCGGCCACCGGCCCCACCGGCACCGCCATTAC
+CCACCTGACCGCCGTCGCCACCCCTGCCACCGTTCGCGCCGGTCTGTCCGCTGCTGATAGCGTCGGCGCC
+TTTGCCGCCGTCGCCGCCGTTACCACCGCTGGTGGAGGTGGTGCCGGGCGCGCCGTTCGCGCCATGCGCG
+CTGCCGCCGACGCTGGCGCCACCGGCGCCACCGGCCCCACCGGCGCCCGGGTTGCCGCCATTGCCACCGG
+TCCCGCCGGCACCAAGGTTGTGACCCCACGTCCCGGTAGCGCCGTTGCCGCCGTCACCGGGAGCTCCGCC
+GTCACCGCCGCTACCGCCAGCCCCGCCGGCGCCGTGGCTGCCGCCGAGGCCGAGCAGACCGTGGCCGCCG
+CCGGGCCCGCCGACCCCGCCGGTCCCGCCAGCCCCACCATTCCCGCCGTTTCCGCCGGCTTGACCGTCAG
+CGCCCAAGTTGGTGGCGTGGGCGCCGCTGGCGCCCGCACCGCCGGCGCCGCCGGGCCCGCCCTCGCCGCC
+GGCCCCGCCGTTGCCGCCGTTGCCCATCAGCACCCCGCCGGCCCCGCCGGCCCCGCCGTTGCCGCCGATC
+CCGCCGGCCCCGCCAGCGGTGCCGGATCCACCCGGTGTGCTGGCCGACGTACCCGTGACACCGGCGATGC
+CGTTGCCTCCGGCCCCACCGGCCCCGCCGACACCGAACAACCCGGCGGTACCGCCGGCCCCGCCGTTGCC
+GCCGACCGCCCCGGCCCCGCCAAAACCCCCGGCGCCTCCGTTGCCATACAGCCACCCGCCCGCGCCGCCG
+TGACCACCGGCCCCGCCGGTGGTACCCACGCCGCCGGCTCCACCGTTGCCGCCGTTACCGATTAGGCCCG
+CCGCCCCGCCGGCCCCGCCTCGTTGTCCTGGCGCCCCAGACCCGCCGTTGCCGCCGTTGCCGTACAAGAT
+GCCGCCTGGCCCGCCGGCCTGCCCGGTCCCGGGGGAGCCGTCGGCGCCGTTGCCGATCAGCGGGCGTCCG
+AACAGCGCCTGGGTGGGCGCATTGACCGCGGCTAGCAAACTCTGTTCAACGTTGACCGCCTCGGCGGCCA
+CGTACGAGCTCGCGGCCGCGGACAGGGTCTGCACGAACCGGTCATGAAACGTCGCCACTTGGGCGCTGAC
+GGTCTGATATTCCTGGGCGTGCGTGCCGAACAACGCCGCAACGGCCACCGACACCTCGTCGGCTGACGCG
+GGCAGCACTTTCGCCACCGCGGCCGCTGCGGTGTTGGCCGCAGTGATCGTCGAACCAATTTTCGCCAAAT
+CCGTTGCCGCCGTGGTCAGCATCTCCGGCGTCGCGATTACGAACGACATCTCGCTCCCCAGGTCAGGTCA
+GCCCGGTGTTGCCCGGCGTGGCAAGGAATTGTGTGGCTGTCCCGGCGATCTACCATGTGGAGCGAATCTT
+CGGGATCCCAACTCCAACGATCCCTTGTTGACGCTATCGTCAAAAGGGCAAAACCCCAAACTTTACGCGA
+ACGAACTATCCACAGTGCACCCTCGATTTCCGTCGACACGTGCAAACGGCCAGACCTCGACGGTGCTAGC
+CCCGCGGCGATATTGCAGGTCTTCGAGCCGGTCGCGCCCCGGGGCGCGAACTCCGTTGCCCTCCCGCGAC
+CCTGCGGGAGAGGATAAGGAATGGTCGGCTATGTGGATGTCCGGGCATACGCCGAGCTCAACGAGTTCGT
+GGAGCTGCAGGCGCGCGGTCTGACGGTGCGCCGGCCGTTCCGCAGCCATCAGACGGTCAAAGATGTGCTG
+GAGGCGATGGGCATTCCGCATACCGAGGTGGATCTCATCCTGGTGAACGGCGATCCCGCGGACTTTTCCT
+ACCGGCCGGTCGCCGGCGACCGCATTGCCGCCTACCCTATGTTCGAGGCCCTCGACATCGGGTCGACCGC
+CAGGTTGCGCCCAGCGCCGTTGCGTAACCCGCGCTTCGTCGTCGACGTCAACCTCGGCCAGCTGGCGCGG
+CTGCTTCGGCTGTTGGGCTTCGACACACGGTGGTCGAGTGCCGCCGATGATCCGACGCTGGCCGATATCA
+GCCTGGGCGAGCAGCGAATTCTGCTGACCCGCGACCGCGGCCTGTTGAAGCGCCGGGCAATCACCCATGG
+TCTGTTCGTCCACTCCCAGCACCCGGAGGAGCAGGCGCTCGAGGTGCTGCGGCGGCTAGACCTCAACGGG
+CGGCTGGCACCGCTATCCCGGTGTCTGCGATGCAATGGTGAGCTGGCCGCGGTTTCCAAAGACGAGGTGA
+TTGGCCAGCTGGAGCCGTTGACCCGCCGGTACTACGAGTCATTCAGCCGCTGCTTCGGTTGCGGGCGGAT
+CTACTGGCCGGGATCACACCACGCACGGTTGGTTCGCCTCGTCGAACGACTGCGGGACCAGCTAACTACT
+TCGACCTGACCCGCACGGTGGTGCGCGCGTCGATCGTCGCCAGCTGACACGCCGAAGGTGCAACCACGGC
+GGCATCGAGCGGCGTGTCCCCGCCACCAATGCACGTTCGGCGCGGCCGGCGCACGCTCGGCGCGGAGCTA
+CGAATTGTCGGCCGGAGTCAACCGAATGGCTACCAGCTTGAGCCGGTCCACCGCCTCGGCGAACTCCTCG
+AGCGTGGGTATGCGCCGGTCGCGGAAGCTCAACCCCAGCATGCGTTGGCCACGCTTGACGCCATAGGCCT
+GTGCGGCGCGCAGGAAAAGTTCAGAAACGACCGCACGGTCCCGGATGAGCTCGCCACGCATAGCGGTCGT
+CTTGCCGTCGTAGACGACCTGGGCGGCGGCACCGTCGGAGAAGTTGTGCTTCCATCCGGCCTCGGTCAGC
+GCGTAGAGGTCGTTGTCGATGACGTGCGCGCTCAAGGGAATCGAGAAGTGCCGCCCAGTCTTTCGCCCGG
+TGAAGCTCACCACCATCAGCTGTGTGCGTAGCGGGCCGGCAAGCGGGGTGTGCAGCAGGGAGCGCAGGAT
+CGGGTTGACGAGGCGAAGGAGGGCCGCCGGTGGGTGTGCGATGTCTACCGCATACGACTGATCTGTCATG
+CCTTCACCGTAGATCCGATCGGGGTTCGCGGCTACGCCGACAAGTTGGTGACGCAACAAGATATATGGCG
+CCACCGGTAGTACCATACGTATGTGGACAAGACGACGGTCTACCTGCCGGATGAACTCAAGGCGGCCGTG
+AAGCGCGCCGCTCGGCAGCGCGGAGTCTCCGAAGCGCAGGTAATCCGGGAGTCCATCCGGGCGGCGGTCG
+GCGGCGCCAAGCCGCCGCCGCGCGGGGGTCTATATGCGGGTTCGGAGCCCATCGCGCGGCGAGTCGACGA
+GCTGCTGGCTGGCTTCGGTGAGCGGTGATCATCGACACGAGTGCGCTGCTTGCCTATTTCGACGCCGCCG
+AGCCAGACCACGCCGCAGTGTCTGAGTGCATCGATAGCTCCGCAGACGCGCTCGTCGTATCCCCTTATGT
+GGTAGCGGAACTCGACTATCTCGTCGCCACCCGGGTAGGTGTCGATGCCGAGCTCGCCGTCCTGCGTGAA
+CTCGCCGGCGGGGCCTGGGAGCTCGCCAACTGCGGTGCCGCCGAAATCGAGCAGGCCGCCCGCATCGTCA
+CGAAATACCAGGATCAGCGGATCGGGATCGCGGATGCGGCCAACGTCGTGCTGGCCGACCGATACCGCAC
+GCGCACGATCCTCACCCTGGACCGTCGGCACTTCTCGGCGCTGCGGCCGATCGGCGGTGGGCGCTTCACC
+GTCATTCCGTAAACCGCAACCGATTCGGTGCTGCACCGCGGCGTGTTCGTCTTCCGCGTGCGATCCGTCC
+CTTAGGGCGTGATGGTCGTCTGCTCGTCGATGACGTTGGCGGCGTCCATCAACGTCATCGTCTCGTCGTC
+GAGCGCGTCGGCGTTGAGTTGAAGCACGAACACCGCACCTTGGCTGGGAATCACCACCGTCTTCTGCGCG
+ACGGTCCGCAACTTGCCGTTCTTGCTGTATGAACCACCGAGCTGCCATGCTGAAAAGCCGCCGAGCGTGG
+CTGCACTTCCGTCGCCGCTGCCTTGGAAGCCGGGCAGGTTTTTCAACTCGCCGGGTGCGAATTGGAGGAC
+CTTCGCGGGGTCGATGTCACCGGTGAGTTTGGAGAGGATCGCAACGATGGTGGGGGGATCGTTGGGATCG
+GCGGGCTGGGTGTAGACGATGCCGCCATAGGGTGCGCGGGAGCTTTCCGGAAGCAGCCGCCAATCGTCGG
+GCACCGGCAGGTCGATGGTCGGGGAGCCGGGGTCGCCGTGGTGCACTGGGGTCTCCTGGATGTGGTTGTC
+CCGGATATAGTCGGCGATGGTGTAGTTGGGCCCCGCTGCCTGAGCCGAGGTGGTTGCCGACGTAGTCGTT
+GTCGACGTCGTCGGGGACGTCGTGGTTGGCGACGTGGTTGGCGCGCTGTCGGTCTTGATGTTGAAACTGC
+AGCCAGCCAGTGCCAGGCTCAGCGCCACCGTCGCGACGGCCGCCGTGAAGTGCTTCATTGCGCGCTCCCG
+AAGATTGGACCGGCACTTCCGGCCGGTGAGGTCGGATTGAGACTAGTCCAACTGGTGTGCGCGCGACCCT
+ATCACTGCAATCCCACCTCGATTGACCGCAAAACACCGCGGGAACAGGCGTCTATGCAGTAAGAGACAGC
+TATGCGGGCACGCAGGTTGCGCAGAGCCCTGGCCGCGCTCTTGGCGGTGGCGGGTCTGTTTGTTCCGTTC
+ATTGTTGGCGTGCCCACGGCCTACGACGGTGAGCCGGTGTTCGTCGCCATTCCGGTCGAGCATGTCAATA
+CGCTCATCGGCACCGGCACGGGAGCCGCGATAGTGGGGGAGATCAACAACTTTCCCGGCGCCTCGGTGCC
+GTTCGGCATGGTGCAGTACTCGCCGGACACCGTCGACAACTACGCCGGCTACGACTACGGCAACCCGCAT
+TCCACCGGATTCAGCATGACGCACGCGTCGGTGGGCTGCCCGGCGTTCGGCGACATCTCGATGTTGCCCA
+CGACCACCCCGCTCGGCTCGCAGCCGTGGAGCGCCTGGGAGGAGATCGCCCACGACGACACCGAGGTCGG
+CGTGCCCGGCTACTACACCGTACGGTTCCCCGGTACCGGGGTGATCGCCGAGCTCACCGCCACCACCCGC
+ACGGGCGTCGGCCGGTTTCGCTACCCCCGCAATGGGTGGCCGGCGCTGTTTCACGTGCGCTCCGGCGCAT
+CGTTGGCGGGCAACTACGCCGCGACACTGCAGATCGAGGACAACACCACAATCACCGGCTCGGCGACCAG
+CGGCGGGTTCTGCGGCAAGAAGAACCTGTACACGGTGTACTTCGCCATGAAGTTCAGCCAGCCGTTCAGC
+TCGTATGGCACCTGGGACGGCTACGCGGTCTATCCCGGTTCACACAGCATGAATTCGAGTTACAGCGGGG
+GGTATGTCGGGTTTCCGGCCGGCTCGGTGCTCGAGGTGCGGACCGCCCTGTCCTATGTGAGCGTGGACGG
+GGCGCGAGCCAACCTGGACGCCGAAGGCGGAGCAAGCTTCGACGACATCCGTGCGGCGACATCGAGCGAA
+TGGAACGCCGCGCTATCGCGAATCGCGGTGGCCGGCAGGGGGCCTGGCGACGTGGACACCTTCTACACTT
+GTCTTTACCGGTCACTGTTGCACCCCAACACCTTTAACGACGTGGACGGACGTTACATCGGATTCGACGG
+TGTCATCCACAGCGTTGCCAGTGGGCACACCCACTACGCCAATTTCTCCGACTGGGACACCTACCGCAGC
+CTCGCCCCACTGCAGGGACTGTTGTTCCCGCAACGGGCCAGCGACATGATCCAGTCGTTGGTGACCGACG
+CGGAGCAGAGTGGTGCGTATCCGCGTTGGGCGCTGGCGAATTCCGCAACCGGCATGATGAGCGGAGACAG
+TGTGGTACCGCTCATCGTAAACCTCTACGCCTTCGGCGCCAGGGATTTCGACCTCAAATCCGCGCTGCAC
+TACATGGTGAATGCAGCGACCCAGGGCGGTGTCGGACTTGACGGTTTCCTGGAGCGGCCGGGAATCGCCG
+CCTATCTGAGGCTCGGCTATGGACCACAAACGGCGGAATTCCGCGCCAACGGTCGTATCGCCGGCGCCTC
+GGTCACGCTGGAGTGGTCGGTCGATGACTTTGCCATCTCCCGATTCGCTGATTCGTTGGGCGATACCGCA
+ACTGCCGCCGTCTTCCAGAACCGGTCGCAGTATTGGCAGAACCTGTTCAATCCCACCACCGGCTATATCT
+CGCCCCGGAGCGCGGCCGGTTTCTTCCCCGACGGTCCCGGGTTCGTGGCATACCCCTCGGGCTTTGGGCA
+GGACGGATACGACGAGGGCAACGCCGAACAATACCTGTGGTGGGTGCCGCATAACGTGGCCGGTTTGGTG
+ACCGCGCTTGGTGGCCGCACGGCCGTCGTCAAGCGGCTCGACCGCTTTACCAAAAAGCTCAACGTCGGCC
+CCAACGAACCCTATCTGTGGGCCGGTAACGAGCCCGGTTTCGGGGTGCCCTGGCTGTACAACTACATCGG
+CCAACCGTGGAAAACCCAGCGGACGGTCGACCGGGTCCGCGGGCTGTTCGGCCCGACACCTGGCGGTGCG
+CCGGGCAACGACGACCTCGGCGCCCTGTCCAGCTGGTATGTCTGGGCTGCCCTTGGCCTGTATCCGAGCA
+CCCCGGGAACCACCATCCTGACCGTGAACACACCGCTTTTCGATCGCGCCGTGATCGCGCTCCCCACCGG
+AAAGTCCATTCAGATCACCGCGCCGGGCGCATCCGGGCGGAACCGCCTGAAGTACATCGACGGCCTGACC
+ATCGACCGCCAACCGAGCAACCAGACGTTTCTTCCGGAGTCGATCGTGCGCACCGGAGGCGACCTGACCT
+TCTCGCTCGCCGGCACACCCAACAAGGTCTGGGGAACCGCGGCGTCTGCCGCGCCGCCGTCATTCGGTGC
+GGGCAGCTCGGCGGTGACGGTAAATATCGCCCGGCCCATCATCGGGATCGTGCCGGGAGCGACCGGGACC
+GTGACCGTCGACGCGCAACGGATGATCGACGGCGTCGACGACTACACTGTCACCCCAACGTCCTACGTTG
+TTGGGATTGCGGCGGAACCGTTATCCGGGCAATTCGACGATGACGGAGCCGTGAGCGCGTCGGTCGCGAT
+CACCGTAGCTCGATCGGTGCCGTCGGGGTATTACCCGATCTATGTCACCACCAGCGCCGGGGATAGTGCC
+CGGACATTGATCGTGCTGGTCGTGGTCGCCGAGGCGGTGGAATGATCATTGCGCAAGCGCAGAGGAGTTA
+GATCATTTCGTGTCTGGTCAGCCAGTGCATCACCTGCCAGCCGGCGAATACCGGTAGCCAACAGGTCAAT
+AGTCGATACAGCAGCACCGACGGCACACCCAATGCTGCAGGTACACCGAAGGCGGCGAGCCCACCGATCA
+GCGCCGCCTCCACCGCGCCAACCCCGCCCGGGGTGGGGGCGGCCGAGGCGAGGGTGCCGCCGACCATCGT
+CACCACGGTCACCGTGACGAACGTCGTTCCGCCGCCAAAGGCTTCGATACTGGCCCACAGTGCCAACGCA
+GCTCCGAGCGTCGTTCCGGCACAACCGAGTACGATCAACGCCAGTCGCTTCGGCTCCCGGGCCAACGCAA
+TGAGGTCATTCGTTACCTCCCTGAGCTTCGGCCGCACCGCCGTCGCTAGCCAGCGTCGCAGCTTCGGCAC
+GAAGAGGAATGTCCCGACAATGCCTAGGGCCACACCGGCAATGAGGTAGAGCACCGTGGCATTCGGGACG
+AAATGAGATAGGTCGGTCGAGGTGCCGGCCAGGGCGCTGAACAGGATCAGCAGCACGAGGTGGACGATCA
+CCTGTACCGACTGCTGCAGTGCCACCGCCGCGGTGGCCCGCACTGCGGTCAGCCCTCCCTTCTGCAAGAA
+CCGGGTACTCAACGCTAGCCCGCCGACGCCGGCCGGGGTAGTCGTTGCAGCAAAAGTGTTGGCTACCTGC
+ATGATTGACAGCTTCCAGAAGCCCACCAGCCCATCAGCGCAGGCCCACAACGCCGCTGCCGCACCGACAT
+ACGTCAGCGCCGACACCGCTAGGCCCAGTAGCGCCCACCACCAGTTCGCGGTTCGCAGCTGGGAAAAGAA
+CGTGGGCACGGTACTGATGAAAGGGTAAGCGACATAGACCAGAGCACCGATTAACACCAGTTGAATGAGC
+TGGCCGCGGCTGAACCGGGTGATCGTTTCGGCTTTGATCTGATCCGCGCCCGTTTGCCGCATCACCTCGG
+CGCGTGTGCTGGCGATGACCGCATTTGGGTCGGTTATCGACTCTCGGATTCGTTTTGGCACAGCGGATTT
+GGTAAGTCTTCGCGATGCCGCCAGGATGGCTTGCTTGCCGAACGTGTCAATGGCTGCGGTCACGGCGGCC
+TCGGCGTCATACAGCGCCGACGTCGTCACCAAGAGTTGGGCCAGGTCGGATTGGAGTTGGGCGTCGGTGG
+CGCCGTACTCGGCCTCACCGAACCCGCCGAACAGCACCGCGCCGTTGTCGACGGTGATCTCGGCACTACA
+CAGGTCCCCGTGGGAGATCTGCTGGTCGTGCAGGGTCCGTAGCGCCTCCCAGACATGGGCAGTCGGCGTG
+GTTTTGGTGCATTCGCTGATGCCGATTCCGCGAGCGGGCCGGTGTGCATACAACGTCCATCCCCGGTCGA
+GCGGGGACACCGCGATCACCGTCGTGTTGGCCATGCCTAGATCGCCGAAGGCAATGGCCATCAGCGCGCG
+ATGCTCGACCGCACGGCGCATGGAGGCTTGCAGGGGTGCGGTCTCGGTGCCGCGCAACGTCAGCTTCAGC
+CAGAGTTGGCGCAGCGCGCCGCCGCCACTTTGGTGCGGGCCGTACAACTCGATCAATGCCTCGCTGCACG
+CCCCGGCGTTGGGCTGCTCGCAAGCGGCCGACAGTACCAGTGGCCCGGGCCCGGCCGGCCGCACAACCGC
+GAGCCCGGACACCGCGAATCCGCGTTTTGCCAACGCGCGAATGGCACCATCCAGTGGCACTTCAAGCGCT
+GGTGTGCCGACGACCAGGACCACCAACGCGCCGACCAACCACCCCACCGCCAGCCCCAACAATGAGCGGG
+CCGGCACAATCGCGCTGACAACCAGATGGATCGGCACGAATGCCAACAGCAGCGCCCACCACCAGTGCCG
+CCAGCGCGCGGGCAGCCAGGGACCCGACACGGTGAGCACCGCCGCGAGTATCGCGATCCATCGCGGGTCA
+TCGAGAAACTGGGCCAGCAATGTGGCGAGCCGGTCGGAAAGGTCAAAGTGCCATCGGGGTGCCGCGATGC
+GGCTACTGCTGATCGACAACGGGAGAACGGCCATAAGTCCGGCGGCCGCATACGCGCCCAGCAGCTTCCA
+CTGCCGGGAAACGATCAGGCCAATCAGGATCACGAACGGCAACGCCAAAATCGCCAGGCCGTACCCCAGG
+TACACCAGATCGGATTGCGACGGGGACAGCACCCCGACGATCTCCGAGATGGATTTCTCCAGCGCCACCC
+ACTGCGGGCGGGTGATCAGCGAACTCGTGATCACCGCCACGAGGTAGATCGCCGCCAGCACCGCCCGGAT
+GATGTCGTTGGTGCGCCGGGTCAGTGGTTGCAGCAAGTTACCGGAAACGCCGATGTCGCGTCCGTCAACT
+CGCATGTTCTAACGATCTTCCGGATCAGGGCCCGCGGTGTCTGGTGCCGTTTCGCGGCTCCGCGGACAAC
+TTAGCCCGATAACTGCGTGGGGTGTCGGTCTGACCACTTGACGTCTTACCAATCTTCATTCACACTGGGC
+GCATGGCGCTGCAGCCGGTGACTCGCCGATCGGTGCCCGAAGAGGTCTTCGAGCAGATCGCTACCGATGT
+GCTCACCGGCGAGATGCCGCCCGGCGAGGCGTTGCCCAGCGAGCGTCGGTTGGCTGAGTTGCTCGGAGTG
+TCGCGACCCGCGGTCCGCGAGGCGCTCAAACGGCTGTCGGCCGCAGGTCTGGTCGAGGTGCGTCAGGGCG
+ACGTCACCACCGTGCGTGACTTCCGGCGGCACGCCGGCCTGGATCTGTTGCCCCGATTGTTGTTTCGCAA
+CGGTGAGCTGGATATCTCCGTCGTCCGCAGCATCCTCGAGGCCCGGCTGCGCAATTTTCCGAAGGTCGCG
+GAACTAGCGGCCGAACGGAACGAGCCCGAGTTGGCGGAATTGCTGCAGGATTCGCTGCGTGCGCTGGACA
+CTGAGGAAGATCCGATCGTGTGGCAACGCCACACGCTCGACTTTTGGGATCATGTGGTCGACAGCGCCGG
+TTCGATCGTAGATCGATTGATGTACAACGCATTTCGTGCTGCTTACGAGCCGACGCTAGCTGCTCTGACC
+ACCACGATGACCGCTGCGGCTAAGCGTCCGTCGGACTACCGGAAACTCGCGGATGCGATCTGCTCAGGTG
+ATCCCACCGGAGCGAAGAAAGCCGCCCAAGACCTACTCGAACTTGCGAACACATCGTTGATGGCCGTACT
+CGTTAGCCAGGCGAGTCGGCAATGACCACCCACGCCGTGATCATCACCTATCTCCGCGACCAGACGCAGC
+CCGCCGTCGATGCGATCGGCGGGTTCTACCGGACATGCGTACTGACTGGCAAGGCGCTGGTTCGGCGGCC
+CTTCCATTGGCGTGAGGCGATCGAGCAGGGCTGGTTCATTACCAGCGTCTCGTTGCTGCCAACCCTGGCG
+GTGTCGATTCCGTTGACCGTGTTGATCATCTTCACGCTCAATATCCTGCTGGCCGAGTTCGGCGCCGCCG
+ACATCTCCGGCGCCGGCGCGGCGCTAGGCGCGGTCACCCAGCTGGGCCCGCTGACCACCGTGTTGGTGAT
+TGCGGGCGCTGGAGCCACAGCGATCTGCGCCGACCTGGGTGCCCGCACCATCCGGGAAGAGATCGATGCG
+ATGGAGGTGCTGGGCATCGACCCCATCCACCGGCTGGTGGTGCCTCGGGTCGTTGCCGCGACCATCGTCG
+CCGCACTGCTCAACGGCGCGGTGATAACCATTGGCCTGGTTGGTGGTTTCGTCTTCAGTGTCTTCATCCA
+ACACGTCTCGGCCGGCGCCTACGTGGGCACGCTCACCTTGGTCACCGGTCTACCCGAGGTGATCATCTCG
+GTGGTCAAGTCGGCGACGTTCGGCCTGATCGCTGGCCTAGTCGGCTGTTACCGCGGGCTGACCACGAAAG
+GCGGCCCCAAGGGAGTTGGAACCGCCGTCAACGAAACCCTGGTGCTGTGCGTGATCGCGCTGTTCGCGAC
+CAATGTGGTGTTGACCACGATCGGCGTGCGGTTCGGGACGGGACACTAGCATGGTGGAGTCTTCAACGGC
+ATCAGCGGCAGCCGTATTGCGGGCCCGCTACCCACGCACAGCCGCCAGCCTTGACCGCTACGGCGGCGGC
+ACGGCCCGAAGACTTGAGCGGACAGGGACTTTCGCGAGATTCACCCGGATCAGCGTCGTGCAGATCGGCT
+GGGCACTGCGTCGCTATCGCCGGGAGACGCTGCGCCTGGTCGCCGAGATCGGGATGGGCACCGGCGCGAT
+GGCCGTCGTCGGCGGCACGGTCGCGATCATCGGTTTTGTGACGCTGTCCGGCGGCTCGCTGATCGCCATC
+CAGGGCTTCGCGTCGCTGGGCAACATCGGTGTCGAGGCGTTTACCGGATTCTTTGCCGCACTGGCCAACA
+CACGCGTCGCTGCGCCCATTGTCTCCGGTGTCGCGCTGGCCGCGACGGTGGGCGCCGGCGCCACCGCACA
+GTTAGGTGCCATGCGGATCAGTGAGGAGATCGACGCGCTGGAAGTGATGGGCATCAAGTCGATTTCGTTT
+CTGGTCTCCACTCGGATTCTAGGAGGGCTGGTGGTGATCATGCCGCTGTACGCGCTCGCTCTCGACATGG
+CTTTCACCTCTGGTCAGGTGGTCACAACCGTGTTCTACGGCCAGTCCAACGGCACCTATGAGCACTACTT
+CCGCACCTTCCTGCGCCCAGAGGATGTGGGTTGGTCGGTCGTGGAGGTGGTGATCATCGCGGTGGTGGTG
+ATGATCACCCATTGCTACTACGGGTACACCGCCAGCGGTGGCCCGGTTGGGGTCGGCCAGGCGGTTGGTC
+GATCGATGCGTTTCTCGCTGGTCTCGGTGGTGGTCGTTGTCCTGCTGGCCGAGTTGGCGCTCTACGGCGT
+CGACCCGAACTTCAATCTCACGGTGTAGCCGCGGTGCCAACGCTGGTGACGAGGAAGAACCGACGTGCGT
+GGCTGTATGTGGAGGGTGTTGTCCTGCTGTTGGTGGGCGCGTTGGTGCTCGTATTGGTGTACAAGCAGTT
+TCGTGGGGAATTCACGCCGAAGACCGAGCTGACTATGGTCGCCTCCCGGGCTGGGCTGGTTATGGAAGCT
+GGATCCAAAGTCACCTACAACGGGGTGGAGATCGGCCGGGTGGGCAGCATTTCGGAGATTGAGCGTGACG
+GCCGGCCGGCGGCGAAGCTGGTTTTGGACGTGAATCCTCGCTACATCAGCCTGATTCCGGTCAATGTGGT
+GGCCGATATCGAGGCGGCCACCCTGTTCGGCAACAAGTATGTTGCGCTGTCCGCGCCGAAAATTCCTCAA
+CAGCAGCGGATTTCCTCACATGACGTGATTGATGTGGGGTCGGTGACCACCGAATTCAACACGTTGTTCG
+AGACGATCACCTCGATCGCCGAGAAGGTGGATCCGATCGAGCTGAACGCGACGCTGTCCGCGGTAGCACA
+GGCGCCGGATGGGCTGGGCGGCAAGTTCGGTGAGTCGATCGTTAATGGCAATCAGATTCTGGCGCAATTA
+AATCCGCGGCTGCCGCAGCTCGGCTATGATGTTCGGCGGTTGGCGGATCTCGGTGAGGTCTATGTCGATG
+CTTCGCCGGATCTGTGGTCCTTTCTGCAGAACGCACTGACCACTGCGCGCACATTGACCAGCCAACAGCG
+CGATCTGGATGCCGCGTTGTTGGCGGCTACGGGTGCGGGCAACACCGGTGAAGACGTTTTTGCTCGAGGC
+GGGCCGTATCTTGCGCGCGCAGCCGCCGATCTGGTGCCCACCGCTACGCTGCTGGACACCTACAGTCCCG
+AACTGTTCTGCATGATCCGCAACTTTCACGACGCTGCGCCCAAAGTCGCGGACGCGGTGGGCGGCAACGG
+CTATTCGCTAGCGGCCGCCGGAACGATTTTGGGAGCACCCAATCCCTATGTCTATCCGGACAATCTGCCG
+CGGGTGAATGCCCACGGTGGACCCGGGGGCCGACCGGGCTGCTGGCAGACGATCACCCGGGAGCTGTGGC
+CGGCACCCTATCTGGTGATGGACACCGGTGCCAGCCTCGCACCGTACAACCACGTCGAGCTCGGCCAACC
+GATGTTCACTGAATACGTATGGGGACGCCAATACGGAGAGAACACGATCAACCCATGAAAACCACAGGCA
+CAACTATCAAACTCGGCATCGTCTGGTTGGTGCTGTCGGTGTTCACCGTGATGATCATCGTGGTGTTCGG
+GCAGGTGCGGTTCCATCACACCACCGGGTACTCCGCGGTGTTCACCCATGTCAGCGGGCTGCGGGCCGGG
+CAATTTGTCCGCGCTGCGGGCGTAGAGGTCGGCAAGGTCGCCAAGGTAACGCTGATCGACGGGGACAAGC
+AAGTATTGGTGGACTTCACCGTGGATCGCTCGCTGTCACTGGATCAGGCGACGACCGCCTCGATCCGCTA
+CCTCAACCTGATCGGCGACCGGTACCTTGAGCTCGGCCGCGGTCACAGCGGTCAGCGGCTGGCGCCGGGT
+GCCACGATCCCGCTCGAGCACACCCATCCGGCCTTGGATCTCGACGCTCTGCTCGGCGGGTTTCGCCCAC
+TCTTCCAAACGTTGGACCCAGACAAGGTCAACAGCATCGCCTCCTCGATCATCACCGTGTTCCAAGGGCA
+AGGCGCCACCATCAACGACATCCTCGACCAGACCGCCTCGCTGACGGCAACGCTGGCCGACCGGGACCAT
+GCGATAGGTGAGGTCGTCAACAACTTGAACACCGTGCTGGCCACCACCGTCAAGCATCAAACGGAATTCG
+ACCGCACGGTCGACAAGCTAGAGGTGCTGATCACTGGACTGAAGAACAGGGCGGACCCGCTGGCCGCGGC
+GGCGGCACACATCAGCAGCGCCGCGGGAACCCTAGCCGACCTGCTGGGGGCGGATCGTCCATTGCTGCAC
+AGCAGCTTCGGGCACCTCGAGGGCATCCAGCAGCCGCTCATAGACGAGCTGGCAGAACTCGACCACGTGT
+TGGGCAAGCTGCCGGACGCCTACCGGATCATCGGCCGCGCCGGCGGCATATACGGTGACTTCTTCAACTT
+CTATCTGTGTGACATCTCACTGAAAGTCAACGGATTACAGCCTGGAGGTCCGGTACGCACCGTCAAGTTG
+TTCGGCCAGCCGACCGGCAGGTGCACACCGCAATGAGAACGCTGACCGAGTTCAACCGCGGCCGTGTCGG
+GATGATGGGTGCGGTGGTCACGGTGCTCGTCGTTGGTGTTGCGCAAAGCTTCACCAGCGTGCCGATGCTG
+TTCGCCACACCTACCTACTATGCGCAATTCGCCGACATGGGTGGCATCAACACGGGCGATAAGGTGGAAA
+TCGCTGGGGTGAACGTCGGGCTGGTGCGCTCGCTGGCAATCCGCGGCAACCGCGTGTTGATCGGATTCTC
+GTTGCCCGGCAAGACAATCGGGATGCAAAGCCGGGCAGCAATTCGCACCGACACCATTCTTGGCCGTAAG
+AACCTGGAGATCGAACCCCGCGGTTCGGAGCCGTTGAAACCCAACGGTTTCCTGCCGTTGGCGCAGACCA
+CTACGCCATACCAAATCTATGACGCGTTCGTCGATGTCACGAAGGCGGCGACGGGCTGGGACATCGATGC
+CGTCAAACGCTCGCTAAACGTGTTGTCGGAGACATTCGATCAGACCGCCCCGCATCTAAGTGCCGCCCTC
+GAGGGTGTCAAGGCATTCTCCGACACCGTCGGCCGGCGCGGCGAGCAGATCGAGCAACTGCTGGCGAACG
+CCAACAGGATCGCGCGCGTGCTCGGCGACCGCAGCGAGCAGGTCAACGGGCTGCTGGTGAATGCCAAGAC
+GCTGCTGGCCGCGTTCAAGCAACGCAGCCAGGCACTGCGCATTCTGCTAACCAACGTGTCGGAGGCATCA
+GCCCAGGTATCTGGCCTGATCACAGACAACCCCAACCTCAACCATGTGCTGGCCCAGTTGCGCACGGTCA
+GCGAGGAGCTGGTGAAGCGCAAGAACGAATTGGCCGATGTAGCCGTCTTGCTCGGCAGATACACCGCGGC
+CCTGACAGAGGCCGTCGGTTCCGGACCGTTCTTCAAGGCGATGGTGGTCAATCTGCTGCCCTACCAGATT
+CTTCAGCCCTGGGTTGACGCGGCGTTCAAAAAGCGGGGCATCGACCCGGAGAACTTCTGGCGCAGTGCGG
+GTCTGCCGGAATTCCGCTGGCCCGACCCCAACGGCACCCGGTTCCCCAACGGCGCGCCGCCGGCGGCGCC
+ACCGGTGCGGGAGGGTACACCCAAGCATCCGGGACCGGCCGTCCCGCCGGGAACGCCGTGCTCCTACACA
+CCGGCGGCGGGCGCGTTGCCACGGCCCGACAACCCACTACCCTGCGCGGGCGCCACCGTTGGCCCGTTCG
+GTGGACCCGACTTCCCGGCACCGCTCGATGTCCAGCCGTCGCCGCCTAATCCCGATGGGCCGCCGCCGAC
+GCCGGGCATCCTAAGTGCTGGGCGGCCGGGCGAGCCGGCTCCGGCTGTTCCGGGCATACCGATGCCGCTG
+CCGCCGAACGCGCCGCCGGGTGCCCGCACCCAACCGCTGGAGCCGTTTCCTGACGGGACGGGAGGTAGCA
+ACCAATGAGCACCATCTTCGACATCCGCAGCCTGCGACTGCCGAAACTGTCTGCAAAGGTAGTGGTCGTC
+GGCGGGTTGGTGGTGGTCTTGGCGGTCGTGGCCGCTGCGGCCGGCGCGCGGCTCTACCGGAAACTGACTA
+CCACTACCGTGGTCGCGTATTTCTCTGAGGCGCTCGCGCTGTACCCAGGAGACAAAGTCCAGATCATGGG
+TGTGCGGGTCGGTTCTATCGACAAGATCGAGCCGGCCGGCGACAAGATGCGAGTCACGTTGCACTACAGC
+AACAAATACCAGGTGCCGGCCACGGCTACCGCGTCGATCCTCAACCCCAGCCTGGTGGCCTCGCGCACCA
+TCCAGCTGTCACCGCCGTACACCGGCGGCCCGGTCTTGCAAGACGGCGCGGTGATCCCAATCGAGCGCAC
+CCAGGTGCCCGTCGAGTGGGATCAGTTGCGCGATTCCATCAATGGGATCCTCCGCCAGCTCGGCCCGACG
+GAGCGGCAGCCGAAGGGGCCGTTCGGCGACCTCATCGAATCGGCCGCGGACAACCTGGCCGGCAAGGGCA
+GGCAGCTCAACGAAACGCTGAACAGTTTGTCGCAGGCGTTGACCGCGCTGAACGAGGGCCGGGGAGACTT
+CGTTGCGATCACGCGAAGCCTGGCGCTATTTGTCAGCGCGCTCTACCAGAATGATCAACAGTTCGTTGCG
+CTCAACGAAAACCTTGCCGAGTTCACCGACTGGTTCACCAAATCCGACCATGACTTGGCCGACACGGTGG
+AACGGATCGACGACGTTCTCGGCACCGTCCGAAAGTTCGTGAGCGACAACAGATCCGTGCTGGCTGCCGA
+TGTCAACAACCTCGCCGACGCGACCACTACACTAGTGCAACCCGAGCCGCGGGACGGTCTGGAAACCGCG
+TTGCACGTGTTGCCGACCTACGCCAGCAACTTCAACAACCTTTACTATCCACTGCACAGCTCTCTGGTGG
+GCCAGTTCGTGTTCCCCAACTTCGCGAACCCAATTCAGCTCATTTGCAGCGCTATTCAGGCCGGCAGCCG
+ACTCGGCTATCAGGAATCCGCCGAGCTGTGCGCGCAGTACTTGGCACCGGTTCTGGACGCTCTCAAGTTC
+AATTACTTGCCGTTCGGCTCAAACCCGTTCAGTTCGGCGGCCACTTTGCCCAAGGAGGTGGCTTACTCCG
+AGGAGCGGCTCCGCCCGCCGCCCGGGTACAAGGACACCACTGTCCCAGGGATCTTCTCGCGGGACACACC
+GTTTTCACACGGCAACCATGAACCGGGCTGGGTCGTTGCGCCCGGGATGCAGGGTATGCAGGTTCAGCCG
+TTTACCGCGAACATGCTCACCCCGGAATCGCTGGCAGAGCTGCTGGGTGGTCCGGATATTGCCCCCCCCG
+CCGCCGGGAACCAACTTGCCCGGACCGCCGAATGCGTATGACGAGTCCAATCCGTTGCCGCCGCCGTGGT
+ACCCGCAGCCCGCGTCCCTCCCGGCTGCGGGCGCCACAGGACAGCCAGGCCCGGGCCAGTGAGGTGCGGC
+GTGAGCGCGGGTAGCGCGAACGGCAAGCCGAACCGTTGGACCCTGAGGTGCGGCGTGAGCGCGGGTCACC
+GTGGATCGGTGTTCTTGCTGGCGGTCTTGCTGGCCCCGGTGGTTTTGACTTCGTGTACCTGGCGTGGCAT
+CGCCAATGTGCCGCTGCCGGTCGGCCGGGGTATGGGTCCGGATCGCATGACGATCTACGTGCAGATGCCT
+GACACGCTGGCGCTGAACACTAACAGCCGGGTCAGGGTTGCCGACGTCTGGGTCGGTACGGTGCGTGACA
+TCAGCCTGAGGAACTGGATCGCGACCCTGACGCTGGAGCTCGAGCCGACCGTGCGGCTACCGGCAAATGC
+GACCGCGAAGATCGGCCAGACCAGCCTGTTAGGCACACAACATGTCGAGCTGGCCGCACCGCCAATCCCG
+TCACCGCAGCCGCTGAAAAGCGGCGACACCATCGGCCTGAAGAACTCCTCGGCCTACCCTACCGTCGAAC
+GGACCTTGGCCAGCGTCGCGTTGATCCTCACCGGCGGCGGCATCGTCAACCTCGACGTGATTTAAACCGA
+GATCCTCAACATCCTTGACGGCCATGCCGGTCAGATTCGCGAATTCCTCGAGCGGCTAGCCACTTTCACC
+GCCGAGCTGAACAACCAACGCGGCGATCTGACTCGCGCAATCGACTCAACCAACCAACTCCTGACCATCA
+TCGCCAACCGCAACGACACGCTGGATCGGGTGCTCACTGACGTCCCACCGCTGATCGAGCATTTCGCCGA
+CACCGGTCAGCTGTTCGCTGACGCCACCGAATCCTTGGGGCGGTTCAGCGAAGTCGCCAACCGGGCGCTG
+GCGGCTACCCGGCCTAACCTTCACCAGACGCTGCAGTCGTTGCAGCGGCCGTTAAGGCAATTGGAACGGG
+CTTCGCCGTATGTGGTCGGCGCGTTGAAGCTAGGCCTCACCGCTCCGTTCAACATCGACGAGGTGCCAAA
+CGTTATCCGCGGCGACTACGTCAACGTGTCCGCGACGTTCGACGTGACGCTTTCTGCACTCGACAACGCA
+CTGCTGAGCGGAACGGGCATCTCGGGAATGTTGCGTGCGCTCGAGCAGGCGTGGGGACGGGATCCGGACA
+CCATGATCCCGGATGTCCGCTACACGCCGAACCCGAATGACGCGCCGGGCGGACCGCTGGTGGAAAGGGC
+TGAGTGAGGAGATGCTGACTCGCGCTATCAAGACCCAGCTGGTGTTGTTGACGGTGTTGGCGGTCATCGC
+GGTGGTGGTCCTTGGTTGGTATTTCCTGCGGATACCCAGCCTGGTCGGCATCGGTCGATACACGCTTTAT
+GCCGAATTGCCTCGGTCCGGGGGTCTATACCGAACAGCCAACGTCACATATCGGGGCATCACCATAGGGA
+AGGTCACCGGCGTCGAACCAACCGAGCGGGGCGCGCGAGCAACCATGAGCATCGACAATGGCTACCAGAT
+CCCCACCGACGCCTCGGCCAATGTGCACTCAGTGTCGGCGGTCGGCGAGCAGTTCGTTGACCTGGTGTCG
+ACCCGCACCAGCGGTCCGTATCTGCGGCATGGGCAGACGATCACCACGACTACGGTCCCCAGCCAGATTG
+GCCCGGCGCTGGACGCCGCCAACCGTGGATTGGCAGTGCTGCCCAAAGACCGGGTCGCGTCGGTGCTGCA
+CGAGGCGTCGGAGGCCGTGGGCGGGCTGGGATCCTCACTGAATCGCCTCATCGAAGCCACCCAGGCAATC
+GCCCACGATGTCAGGGGCAGCCTCGAGGACATCGACGACATCATCGAGCGTTCGGCGCCTATCATCGATA
+GCCAGGTCAATTCCGGCAACGAGATCGCCCGCTGGGCCGCCAACCTCAACACGCTGGCCGCTCAGACCGC
+GCAGACCGATCCGGCGGTGCGAAGCATTCTGGCCAACGCGGCACCGACTGCCGATCAGGTCAACGCCACG
+TTCAGCGACGTGCGGGAGTCGTTGCCGCAGACGCTGGCCAATCTCGAGGTCGTAATCGATATGCTCAAGC
+GCTACCACAACGGCGTCGAGCAGGCGTTGGTGTTCTTGCCGCAGTCCGGCGCGATCGCCCAGTCGGTTAC
+TACAGAGTTCCCCGGCCAGGCCGGACTGGGTGTCGGCGGCCTGGCGCTCAACCAACCACCGCCGTGCCTG
+ACCGGCTTCCTGCCGGCGTCGGAGTGGCGGTCACCTGCTGACACCAGCACCGCACCGCTACCCAAGGGCA
+CCTACTGCAGGATTCCGATGGACGCGAGCAATGTGGTTCGTGGAGCACGCAACAACCCGTGTGTAGACGT
+GCCCGGCAAGCGGGCGGCGACCCCGCGGGAATGCCGCAGCAATGAAGCTTATGTGCCCGGGGGCACCAAT
+CCCTGGTATGGGGACCCCAACCAGATGCTCAGCTGTCCCGCGCCGGCCGCGCGTTGTGACCAGCCGGTGA
+AGCCAGGCCAGGTGATCCCGGCGCCGTCAGTTAACAATGGCATCAACCCGCTGCCCGCCGATCAGCTGCC
+AGGCACACCTCCACCGGTCAACGATCCTTTGCAGCGACCTGGGTCAGGCACCGTCCAGTGCAATGGGCAA
+CAACCCAACCCGTGCGTCTACACCCCGAGCACATTTCCTACAACCATTTACGACGTGCAGAGCGGCAAAG
+TCGTAGCACCCGACGGTGTGGTGTATTCCGTTGAGGCTTCGACTCATGCCGGAGCCGACGGATGGAAGGT
+GATGCTGGCACCAACCGGCTGAGCCGGCGCGATCAGGTACCGGCGGATTCGCGCTGGTCAAGAAAGGCAA
+CCGTCAGATCGTTATGACCTCGACGTCGGGCATGGCGGCGTAGTCGTTGTCTTGGGTCAGGATCGCAATG
+CCGTGCGCCACGGCTGTGGCCGCAATCCAGCTGTCGTTGATCGGCACGCGCAGTTTGGCGGCGCGCAGCT
+TGGACACCAGTAATGCCCATGCTTCGGAGACCGCCTCGTCGATGCCTAGTGGTTCGAACCGTTGCGCAAG
+CTGGTAGGTGGAGAGCCGACGTGCGGCGGCCTCGGGGCCGGAGGCTTGCAACACCCCGAGCCGCAGCTCG
+CCGAGTGTGACTACCGAGACGCCCCATTCGTATCCCGCAAACCGGTCCGGGTCGAATCGTGTCGCCTCGA
+TGCCAATGAAAACGGATGTGTCGGCGAGGGCGCGCCGTACGTTCACCACCGCACATCGTCCGTGGTTTGC
+GTCAGCGTCTCTCGCAGCTCCTCGCCCAGATTGGTGGTATCGGGGCCCAAGCGCACCAGTTCGCCGATCA
+CCTCGGCAGCTGGCAACCATTGGCGGCGCCGCTTGAGCGGAACGATGCGCGCTACGGGGCGATTGTCCTT
+GAGCACCTCGATTTCCTCGCCGGCGGCAACTCGCCGCAGTACCTCGGCGGTGTGGTTGCGAAGATCGCGA
+GCGGGTATCGTAGCAGACATGCTACGAGTGTAGCGGAGCTGCTGTCGCGCCGCCTCGTCTCGATGTCTGC
+GGTCACGATCTCCGCAGGTTACGGCCGCTGCTGTGCCCGCAGTCGCCCGCGATGGTGGGCCCGTCGGGGT
+AGATTGCGAGCGCGCCCGGACGGAGGCCGCCGATGCCGAAGTGCCGTGATTTGTTCGAAGAGTTAGCCGG
+CCCAGAGCGTGCTAACGGGTAACGCCGCGAGCGTTGGGCCGAACGGGGTGGCTTCCGGCGCGGCGGTGAG
+CAGCACGCCGAACTGAAATCGATCATCGAGCCGCTCGGCCAGATAACGTAGGCCACGCAGGTCCTCGGCT
+CGCGGCGTGCTGGTCGCCTTGACCTCGATGCCGCAGACCCGACCATCGGGATGTTCGAGCACCAGATCGA
+CCTCGGCGCCGCCGCGGTCGCGAAAATGCCACAGACTCGGCCGTTCGGTCGACCAGGTGAGCTGTTTGCG
+AATCTCGTTCGCCACGAAAGTCTCCAGTAGCGGGCCGAGTGGACGGCCGGGGCGATCCAGCGTCGCACCG
+GTAACGCCGAGCAGGTGACACGCCAGGCCACTGTCCGAGACCACCAGTTTCGGTCGGCGAATCACCTTGC
+GGCTCAGGTTGGTCGACCAGGCCGGCACCCGGTGGATAAGGAACGCCGCTTCCAGCAGGGCCAGATAGCC
+AGCGGTGGTGCGAGCCGGGATCGACAGGTCGTTCGCCAGTGCGCTCACGTTGAGCTCGGCGCCGGTACGC
+GCGGCGCAGAGCCGAAGCACACGCGGCATTTCGGCAAGCCGCTCGATCGGCGAAATCTCGCGGATCACCG
+ACTGCGTCGCCGTCGTGAGATAGTTGTCGAACCACGCGCGACGCCTCGACGGCGATCGGGCGACGATGTC
+CGGGAAGCCTCCGGTGGCGATCCTGTCGACCAGATCGGCGCGGCGCATATCGGAGCCGTGGATCAGCTCG
+CGTGGTGCGGTGAACAGCGCATCGACGAAACCGTCCGCGATTCCGGCCCGCTCACCTTGCGAGAACGGCC
+AGAGTTCGATGATTTCGACCCGCCCGACGAGCGCGTCGGCCATGTCAGGAGCCGAGAGCAGCCTCGCTGA
+ACCCGTGAGCAGGAACCTGCCCGGCCTGCGATCCCGGTCGACCTCTGCCTTGATCGCCCGAAACAGCCCC
+GGCTCGAGCTGGGCTTCGTCGATGACGAGCGTGTCCACCGGCCGGGATACGAATGCGCGGGGATCGTCGC
+GGGCGGCGTCGCGGTTGGCGACGTCGTCAAGCGAGACGACTTCGCTGGATCCCGGATAGTCAAGTCGCGC
+GACCAGTGTTGTTTTGCCGACCTGACGCGCGCCGTTGACAACGACGACCGGGGTGTCGGCGAGCGCGGCC
+AGCACCGAGGGCGCGATCGCGCGTTCGACGACTCCCATGCGGACAGAATACGCTGCCGATTTGTCTACCT
+ATTGGCTGCCGATTCGTCCCCATTAGCGGTGCGGATTAGTCCACATCATCGCTGCGGATCCGTCCGACGG
+CGGCCCTGAGCCACGTGGCCGACGAAGAACGCTCGGAGGCGCTGCTGCGGGAGCGCTCGCTGCACTACGT
+GGCCAGTAGCCGGGCGGGGGACATGTTGGTGGTGACCTGGAGCGGACAGCGGTCGGAGTTGTTGAGTCAG
+CTGAAGATTCACGCGGCGACAACGACGTGGACGCCGATCTTTTCGTAAGTGTCCTTGGCTCGAGCATCGC
+GTGTGGCGAGTTCAGCCCGGTGCTCGGCGGCGGCAAGGGCCACGAGAGCGTCATAGACCGCGCCACCAGT
+GATCTCGAATTGGGCCAGCACGCGTGGGAGATGTTCAGTGGTGCGGGAACTCAACAACAGCGGTGCCGCA
+AAGCGTTCGGTAAGAAGCCGCGCGGCGTCCATCGGTGCCAGTCGTAGGTCACGCGGCAGGCGGGTCAGCA
+CGGAGTAGGTTTCGGCCAGGGCGTGCCCGCACAGCGCGGCCTCCCGATGTGCCCACCAGGCGACAACCGC
+CGCATGCGCGGTATGGGTCCGTACCAGCAACGGAATCGCGACGCTGGTGTCCACTGCCAGCGGCGGTTTC
+ACTTCCGGCCGCTATCGATAAGGCCGAACACGACCTCATCGTCGATCGTGGTCTCACCGGTGGCCACCAG
+TACGCCATTCTCCTCTTCGAGACGCGCTGTTCGTCCGGTGGGAATCAGGTGGAGACCAGCGCCATAGCGG
+GATATTTCCACGGTGGACCCCGGTTGCAGCCCCAAGGCTTCGCGCAGCGGTTTGGGTACGACGATGCGGC
+CAGCCGCATCCACAACAGCCTTCATGGGAATACGATACCAATGGCTTCCCACTCAGGTGCGGAAGTCGAC
+TCACCGCCGTTACCACGACCCCGACGACCACACCGTCAGCTGCGGCGCGGCGTGGCGACTATTGGTCGCT
+AGTGTCGTGCTCCCGATTCGGGTCCTTTGTATCTGATGACGTGATCCGCGGAAGCTCCTCGTGGAAGGGC
+GGCCGCGGTGTGGGGAGGGTGATGCGGAGTTCGGCCCCGCCGTCGGGGTGGTTGGTGGCGTTGGCATGTC
+CGCCGTGGGTGGTGGTGAGGGCGGCGACGATGGCCAGGCCGAGGCCGCTGCCGCGACCGCCGCGGGCGGT
+GTCGGCGCGGGTGAATCGGTCGAAGGCGACGGGAAGAAAGTGGTCGGCGAATCCGGGGCCGTGGTCGCGG
+ACGCCGATGTCGACTGCACCGTCGCGGGCGTGCGCGGTGACAGCGATTTCACCGTCCCCGTGGGTGATGG
+CGTTGTCGAGCACGGCGGTGAGGATTCGGCGCAGGTGGTCCGGATCGATCGAGACGAACAGGTCCGGTTC
+CGCGCGTGTGGTGATGTCCGCTCCAGTAGCGGCGAAGCGGGCCACGCTCTCGTGCAGCAGGGGAGTGATC
+GGCACCGCTTTGGCGGAGGGGTGGGATTCGGGGCGGTCGGCGCGGGCCAGGGTGAGCAGTTGGTCGGCCA
+GTCCGCTGAGCCGGCGGGTTTCTTCGAGCGCGGAGCGCAGGGCGGCGCTCAGCTGGTCGGCGGGTCTGGG
+CCGGCGCAGCGCAGTTCGAGTTCGGTGGTCAGCAGTGCCAACGGGGTGCGTAATTCGTGGCTGGCGTCGG
+CGACGAACTGTTGTTCGTGGGCGAGGGCCCGTTGCAGTCGGGTGAGCATGGTGTTGAGAGTCGTTGCTAG
+CCAAGCGATCTCGTCGTCGGTGGGAGGTACCGGCAGCGGCGCGTCGGTGTCGGGGTGCGGCGTGGTGGTC
+AGTGTTTGCGCCGCCGCGCGGATCCGGTCGACGGGCCGCAGCGCGGCGCGGCTGAGCAGGTAGGCGGCCA
+CCGCGGCGATGACGAGCACGATCGGCAGGATGGTCACCAATTCCCGGACCAGATCGGCGGTGATGTCGTC
+GGTGAGCCCGCGCAGCGCGCCATCGGGGTCGGCTTCGTGAGCGGCGTCGCGGAACTGGACGACGGTGACG
+GCACCGGCTGCTGCCAGAACGAGCGCCATGGCGGCGCTGAAGACGAGGGTGAGTCGCCATCGGATGGGCC
+ACTCAGCGGGGGAGCGCATGCCGTCCTCCGTCCTTGCGCAGCCGGTATCCGGCACCGCGAATGGTTTCCA
+GCGAGGTGACGCCGAAGGGCCGGTCGATCTTGTCGCGCAGGTAGCGGATGTAGACGTCGACGATGTTGGA
+GCGGGCCTCGTAGGCGGCGTCCCAGCAGCGTTCCAGCAGCTGGGCGCGGGTGTGGACGATGCCGGGACGG
+CGGATCAGGGCTTCCAGCAGGGTGAATTCCTTGTGACTGAGCCGGATTTCGGTGTCGGCACGCCAGACTC
+GGTGTTCGCTCGGGTCCAGGCGTAGATCGCCGGCCTCCAGCGTCGGTGGGCGTGGGATGGGCCCGCGCCG
+TGACAGCGCGCGCAACCGGGCGAACAGTTCGTCGAGGTTGAACGGTTTGGTGAGGTAATCGTCGGCGCCG
+CCGTCTAGGCCCGCGATGCGGTCGGTGACCGCGCCGCGGGCGGTAAGCATCAGCACCGGTGTCCACACCC
+GCTGCCGTCGCAGCCGCGCGCATACCTCGAACCCGTCGATACCGGGCAGCATCACATCCAGCACCACCGC
+GTCGTAGTCACCGCCGTCGACGGCCGCCACCGCATGGCGGCCGTCGGCAACGGTGTCGACCGTGTGGCCC
+TCCTCGGTCAGCGCCCGCGCCAGCAGCGCCGTCATCTTGGGCTCGTCCTCGATCACCAGGATGCGCACAC
+CCGACACCCTGCCGCATGCCCGGCCCGGGCCGCGACCAGCTCTCATCGTCGTTTCATCTGCCACCCCTAC
+CGTCGGAGCCGCACACCGTCACAGCGAGGTAGACAGATCAGGAGAAAGCGATGAATCGCATCGTGCAGTT
+CGGAGTTTCCGCCGTGGCCGCGGCGGCGATCGGCATCGGAGCCGGGTCGGGGATCGCGGCGGCGTTCGAC
+GGCGAGGACGAGGTGACCGGCCCCGACGCCGACCGCGCGCGCGCCGCCGCGGTGCAGGCGGTCCCGGGCG
+GCACCGCCGGAGAAGTCGAGACCGAGACCGGCGAAGGCGCCGCCGCCTACGGCGTGCTGGTCACCCGGGC
+CGACGGCACCCGTGTCGAGGTCCACCTGGACCGGGATTTCCGGGTTCTGGACACCAAACCGGCCGACGGG
+GACGGCGGTTAGCATCGGCGCATGCCCGCACCGGGCCACCGATAGCCTCCGGGTGCGCACCGATGAGATC
+TAGCGAGGAGACCATGATCAGGCGACGAGGCGCCCGTATGGCCGCGCTGCTGGCGGCGGCCGCGCTGGCA
+CTGACCGCATGCGCGGGCAGCGACGACAAGGGCGAACCCGACGACGGCGGGGACCGGGGCGCATCCTTGG
+CCACCACCAGCGATGCGGACTGGAAGCCGGTGGCCGACATTCTCGGCCGAACCGGCAAGCTGAACGATGG
+CAGCGTCTACAAAATCGGGTTTGCGCGCTCGGATCTGAGCGTGCAGACCAAGGGGGTGACCGTCGCCCCC
+GCGCTGTCACTCGGGTCGTGGGTCGCGTTCGCCCGCACCCCCGACGGGCAGACCATGCTGATGGGAGATC
+TGGTGGTCACCGAAGACGAGCTGGCCTCGGTGACCGACGCCGTGCAGGCCGGCGGCCTGCAGCAGACCGC
+GCTGCACAAGCACCTGCTCGAGCAGTCGCCGCCGATCTGGTGGACCCACATCGCCGGCCACGGCGACGCC
+GCCGACCTGGCCCGTGCGGTCCGGTCGGCGCTGGATGCCACCGACACACCACCGCCCGCCCCGGCAACTT
+CCGGCCAGACCAGCTTGGACCTGGACACCGCGGCCATCGATGAGGCGCTGGGCCGCTCCGGCACCATCGC
+GGGCGGGGTGTACAAATTCTTCATCGCCCGCCGCGATCCGGTCACCATGTCCGGCATGCTCATCCCCCCG
+TCCATGGGTCTGGCTACCGCCCTCAACTTCCAGCCCACCGGCAACGGCCGCGCGGCGATCAACGGCGATT
+TCGTCATGACCGCCGCCGAGGTCCAAGACGTCGTCCAAGCACTGCGCGGCGGCGGAATCGACATCGTCGC
+CATACACAACCACGGGTTCGACGAACAACCACGCCTGTTCTACATGCACTTCTGGGCCGAGAACGACGCC
+GTCGCACTCGCCCGCACGCTACGCGCCGCGGTGGACGCCACCGCGGCCCGGTGACCCCGCGCCCCGGCGC
+ATACCGACCCGCCGCGAACCACCGGTGGCGGACGTGGTCATGCAGGCGTCGTGCGATGACGTCCTCGTTC
+AATGGGCCATGTTCGGCCGGGATCCTCGCCACGGCACGGTCGCATGGAACGCTTCGGCCACGGTGGCCAC
+CCTATGCCGCGTCGAGCCGGGGCTGCCAACTGTTGCGCGGTGAGTGGTCGGTAGTTGTCGGTGGCGTGCT
+GTAGGAACAGAGGTATGAATCTCGCGGCGTGGGCCGAGCGCAATGGCGTCGCGCGGGTGACCGCGTATCG
+CTGGTTCCACGCTGGGCTCTTGCCGGTCCCGGCCCGGAAGGTTGGTCGACTCATTCTGGTCGACGAGCTG
+GCTAGCGAGGCTGGCGCGCAGCCAAAGACTGCGGTGTACGCGCGGGTGTCGTCGGCTGATCAGAAGTCTG
+ATTTGGATCGGCAGGTGGCGCGGGTGACTTCGTGGGCCACAGCCGAACAGATCCCGGTCGACAAGGTTGT
+CACCGAGGTCGGGTCGGTGCTCAACGGGCACCGACGTAAGTTCCCTGCGGTGCTGCGCGATCTGTCGGTC
+ACGCGGATTGTGGTTGAGCATCGGGATCGGTTCTGCCGGTTCGGTTCGGAGTATGTCCACGCTGCGCTGG
+CCGCTCAGGGTCGGGAGTTGGTCGTGGTGGACTCGGCCGAGGTTGACGATGACCTGGTATGGGATATGAC
+CGAGATTCTGACCTCGATGTGCGCAAGGTTGTATGGCAAACGTGCTGCTCAGAACCGGGCCAAGCGGGCC
+GTCGCGGCTGCCGCTGTCGATGATCATGAGGCGGCCTGAGATGCCGCGTTTGGAGATCCCCAACGGCTGG
+TGTGTGCAAGCGTTCCGGTTCACACTCGATCCGACCGCCGAGCAGGCACACGCGTTGGCGCGGCATTTCG
+GCGCCCGCCGCAAGGCCTACAACTGGACCGTCGCGCAGCTGAAAGCCGATATCCAAGCGTGGCGCGCGAC
+CGGCGCCCAGACGGCGAAGCCGTCGCTTCGGGTACTGCGGAAACGCTGGAACACGGTGAAAGACGAGGTG
+TGTGTCAACGCCGAGACTGGCACCGTGTGGTGGCCGGAATGCTCGAAAGAGGCCTACGCCGACGGGATCG
+CGGGCGCGGTCGACGCGTACTGGAACTGGCAGCAGAGGCGTGCTGGCAAGCGCGACGGCAAGAGAATGGG
+CTTCCCTCGATTCAAGAAGAAGGGCCGCGACGCCGATCGCGTGTCGTTCACCACGGGTGCGATGCGCGTT
+GAGCCCGACCGTAGACACCTCACTTTGCCGGTGATCGGCTGCGTGCGTACGCATGAGAACACCCGCCGCA
+TCGAGCGCCTCATCGCCAAAGACCGGGCGCGGGTGCTGGCGATCACGGTGCGCCGCAACGGCACCCGGCT
+GGATGCGAGTGTGCGGGTACTGGTGCAGCGCCCCCAGCAACCCAACGTGGAACTGCCTGAGTCGCGAATC
+GGTGTCGACGTGGGTGTTCGTCGTCTGGCCACGGTCGCCACCGCGGACGGCGCATGCTGCCCGGTCCTGG
+TGCCAGACGGCTAACGCTGGGCATTATCCCCGAGGGCGGCGCCCATATCGACGTGCCCCGAAAGACCGTG
+GGCGCCTGGCAAACAGCCGACACCATGGGCATCTTCCAGGCCCTTCCCGACGTCTGGGGCGGGTGGCGGA
+CCGAATGCTGGGAAGACCGCTTCGAAGAGCAGCTGATTCGATGCAACGGGGCGCTGCGGCTTCCCGAGCT
+GGATTTGGCCGCGGGCATGGACAGCGCCCGGGAGTGGCTCCGTGACAGGATATTTCAGCGCTTCTCGGAC
+AGCCCGGCAGGCCAAATTCTGAAACTCTCCGAGCTGCTGGCCGATGTCGGACCCGGTCTGGTCGTCAGCG
+ACGATGCCGTGACGAATGGCGGGGCTCGCCCAAACAACGAAGAGTGGGCGCGTTTCGTTGCGGCGTGCGA
+TCTGGTGCGTGGGGCTCACGCCGAATCGGCCTGACTTCGGGGATAGTGGTACCATCACTTTGGTAGAAGG
+GTACTAACATGGCGTTGAACATCAAAGATCCGTCGGTTCACCAGGCGGTCAAGCAGATCGCGAAAATCAC
+CGGCGAATCTCAGGCTCGGGCGGTGGCGACCGCGGTGAACGAGCGTCTGGCCAGACTGCGCAGCGACGAT
+CTCGCCGCCCGGCTCTTGGCTATCGGCCACAAGACCGCGAGCAGGATGAGCCCGGAAGCAAAGCGCCTCG
+ACCACGATGCTCTGCTGTATGACGAGCGAGGGCTGCCGGCGTGATCGTCGACACGTCGGCGATCATCGCG
+ATTCTGCGCGACGAGGACGACGCCGCGGCCTACGCCGACGCGCTCGCCAACGCCGATGTCCGCAGACTGT
+CTGCGGCCAGCTACCTGGAATGCGGGATAGTCCTTGACTCCCAGCGTGATCCGGTCATCAGCAGAGCACT
+GGATGAACTTATCGAAGAAGCCGAGTTCGTCGTCGAGCCGGTAACCGAGCGCCAGGCCCGCCTGGCCCGA
+GCGGCCTACGCGGATTTCGGCAGAGGCAGCGGCCACCCCGCGGGCTTGAATTTCGGCGACTGCCTGTCCT
+ATGCACTGGCGATCGATCGACGTGAGCCGCTGCTGTGGAAGGGCAACGACTTTGGGCACACCGGCGTCCA
+AAGGGCACTGGATCGGCGGTGATCGACGTCAGCCTGGCGCGGCGGTGCGAGGCTCACGGGTACGACTATT
+TTCGTTCCGACGATCCGGTGGCAGCGGCGGGCTTTGTGGTGTCCGCTGTGTGGAGTTGTGGGCGTGGACC
+TGGGAACGCCACGGGTTCCGGGCGTTTGCCGAAACCGCTGCGCCACAGTTGATTTGGCGGGAGTACAGAC
+CCGGCTGGACCCGATACGGCGACGGATCTGTGGCGCAGGTCAAATCGATCTTCGACGCTCCGCGCGGTTA
+CCTCAATGCGGCGTGTCGTCGGCGTGTTGTACATTGGGCATCGGGACTCCTGAGAAGGATCCTGTAGGCC
+GCAGCCCCACCCACGGGTGGGGCTGACGTGCGTCCAAGGGGGCCAGATCTGGCAGACCTTCATCTTGTTT
+GCGACGATGTCCCATAATCGTTGGTGGTCTTCACCGACCGGGCGTCTTTGACGTCTGACCGACGCCTCCG
+AAAGTGGAGGTAGGACACAAGGTCGGCAGCTTGCAGCAGGCGACGGTGTTTCGAGGGCGCGAAATGCAGT
+GCGTCGACGCCCGCTATTCCTCACCGCCGCGGTTTCCTCGGTGGCAATCTCACTTCGTCGAGCCGCGGGC
+ACGGCTTTCGAGATAGAGGTCGATATGCCCACAAGTCTCGCAGGCAACGGCGTTGACCTGGGTGCCGCGA
+TTGAAGTGGCCGGCACCTTCGCGCTTGAAACGCAGCGGCGCGTTCCAGACGACGGCCCCTTCGACGAGCT
+GGTCGCCCCCGCATCTCACGCACTTCTCGTCGGTCACGACGCCTCCCCTTCTCTGCGGCTGGCCAGGCTA
+CGCCCAGCGCTTGATGCCCAGGAAATCCACGGCGCCGCCGCTAGTTTCACCTGAACGACGCCGCGCGATC
+ACGAAGCTTTCGGATCGCCCGTGCGGTAAACGCTTGCGGCTCCAGATGCCACAGGTGCGCGCCTTCAGGT
+GTGCGCAACGCCGCGAAAGGAACCCGCTCACCACACACGAGCTTCTCCAGCTCGAGTGCCCAGCCTACGG
+CCAGGGCGGCACGCTGCCGGTGCCAGGCGTCAGCGCGCCACGTCAGCCGGGGCAAGCCGGCGAGTTTGCT
+CTGGATGCTTTGGCGGAGTTTGCCGGCGCAGAGGATCCGGGACGGAACCGAGCCCAGACCTTCGGTGTCG
+GACGCCGGAGCGACGCGGGTGAACGCGATCTCCCGGCGGTCGTAGTTCCACCAGGCGCGCGCGACGGTGA
+CCTCGCCGACCGGGGTCGCACGGTTGGACAGTTCGCGCTTTTCTTGACGCGCCCCATGCTGATCCAGCCA
+CAGATGGATTTCGGCAACCGTGCGGGCGGGCAGTGGCTCGGCGTTCGGGCGCGGATCGCATCCGGCGACC
+AGCATCGCGGGGACGTGCGGCGGCCACAGCTGGGCGAGTGGACGCAGCGGATTGAGCCGAACGCCGTCGA
+AGTCGCTGCGTTTGGCGAGGTCGCCCCAGAGTGCGGGACCCAACCGCACGACGTCGAGTCCGCGGTGTCG
+CTCGGTTCGCCGGAATGTCGCCGCCGCGTCCGGCGCGGTCATGATCGTGATGACGTCCAACCCGTCGGCG
+CGGTGAACGGCGGGCCGGCCGGTGCCCGGGGAGACGGCAACCCACCACGGCCCTTCGTACAGCAAATCCC
+GCTGGCCGGGGCCCGGTTTGGCAACGGCATCCTCGAGCTCGACCGTGCGCGCCCAGCTCTGCAGCTCGGG
+CAGCGCACCCGGCCGGAACGCCGAACCCCACGGTTCGTCGGGATCGAATGACAGGCCACCGACGAGCGGA
+GCGATGTCGCGAACCAGTTCCAGGCCGGAATATTCGCGGCCGTCCGACGCCGAACTCTCGGCGATGAGCA
+TCGGTGTGCCGTCATCGAGCGCCACGGTCTCGAGTTCGCCGTCTATCTCGGCGACCCGCCACTTCGGGTA
+GCGCAGTATCGCGCGCCGCGCGTCGTCGGCGGAGAGTTCTCCGCGCGCATATCGGGCCAGTAAGCCCCGT
+AGCTCGTCGTCCATCGGCCATCACCCGGTCGGGTTGCAGCATCCGCCACAGAACAAAGCGGACGACTACG
+CCACCTCGCGGACATGCGGAATCTCCCGCCGCCGTCGTGGTCGGATATCGTCGCCGGCCAACGTGACGAC
+CGCTACCGTGCAGCCGTTCGCGGCGGTAAAGTCGACTTCGTAGCCACCCGCGGCGTAGCGCCCGACGACG
+GCACCGACGTCTCCGGCGATGAGGGATTTGTCGGGAACATCCCGTGTTAGCACCACAACATCGTGTTCTG
+CGTACATCGGTCCGCTCCTAGCGTGGATAGGCGGTAACCAATCGAGGCACGCCGTCGGGTTCGTCGCTGA
+TCCACACTGTACGCAATGCAACCATCCGGCCGCACCGTGATTCCACGACACCATCGACGATTGCCGTGAC
+GCCGTAGGGTGTTGGGGCCGATCCGGCAACCGCGCCTGACGGTGCGGCCAGGGCGGCTGCCGGGGATGAT
+CGCCGGCGTGGCGGCGAAACGAATGAACCGCGAACAGTTCTTCCGCGCGGCGTCGGGGCTCGATGAGGAT
+CGCCTACGGAAGGCGCTGTGGAACCTCTACTGGCGCGGCACCGCAAACATGCGGGAGCGCATCGAGGCCG
+AGCTGGCCAGCGCCGGGCGCGCTCGCCCGGCGCGCAAAATAAAGCCGCCGGCCGATCCGGACATCGTGGG
+TTGGGAGGTCGACGAGTTCGTGTCACTGGCGCGGTCGGGTGCCTACCTGGGCGGGGACCGGCGGGTGTCG
+CCGCGGGAACGATCGCGCTGGCGTTTCACCTTCAAGCGGCTCGCCGCGGAAGCCCAGGACGCCCTGCGAG
+CCGAGGACGCCGAGCCCGCGGCATCCGCACTGGAGCAACTGATCGACCTGGCGCGCGAGGCCGACGGGTA
+CGACTACTTCCGCTCCGACGATCCGGTGGCAGCGGCGGGTTTCGTCGTGTCCGATGTGGCGGCGGCGGGC
+CACCCACACTTCCGTGAGTTCGCCGCCGAGATCGGTGCGGCGATCCCGCCGTGAGTACCGCCCGCCCGGC
+TACTACAAGCCCAAAGCGGTGCGCAGCCGGTCGGCGTCCATCCCGCCACGGGCGCCCGCGCCGGCGGGAA
+ACGTGTCCAGGAGCTTGATCAGGTCGGCGCGGCGGGTGGGGTCGTCGGCGGCCTGCCGCGGCGTGTGCCC
+GTCCAGCGCGGGGATGGGTTGATCGAGCCAGCTGGTCTCGTAGTCGCGGATGAATTCCTCGAGCGCGGCG
+GCCAGCTCGGGGCTGTCGGGGTCGGGCGCGCCCGCGCCGGTAACTGGCATCTGCTCGGCCAGCGCGGCGG
+CCTCGCGGGTGTTGCGCAGCGGACGGCGGTCGTCGTCGAGCACCGTCATCGCCGGGTCGAGGCGGGTCAG
+CGTGGCCAGCACGCGATCCATCCGCGGTTCGCTGTTGGTTTCCACCCGCAGCGTGTCACCGTCGAGGACC
+AGCGTGGCCCGGACCCGCAGCATGCCGTCGTTGGTGACGTGTTCGATCCACCGCGGCGGCTCCTCGCCGT
+CAACCCGGTCGTAGACCCCGTCGAGCGCGCCCTGGATCCCGGCCGGATCGTCGACTCGCACGCTGGCCTC
+GCAGATTGCCAGCGAGTCGCCCTCGGTGTTGACCAGTGTCGGCGGCGCGAACCGGCGGCTCAGCTGGGCC
+ACCAGTGTCACCGGGTCGGGCTCGTCATCGAGCAGCTCGATCAGCACGGCACGCTCGTGCAGCGCGACCG
+GCTCGATCCCGCCGAAGAACACCATGGTGTCCCCGGCGGGCACCGGGCGCGCGCAGATCAGCTGCCCGGC
+TCGCAGCTGGCGGCTGGCCGCCCGCTCATGCACCTCATGGGTGTCGCCGGTGCGTACGTCGCGCACGATC
+ACGCCCTCGCCAGGTTGCACGTGCTCGACCTCGAACACCGACCGCTCCACGAGCAGCCATTGCTCGGCAA
+GCAGCCGCTCGTCGTCGGGTAGCAGCGAACCGCGCACTTCGAGGAACTCCGCGAACGCGCCGCCCTCGAA
+CAACACCGCGTCCAGCACCAGCGGATCGGCCAGCGCCGCGGCCAGCGCGTCCTCATCGTCAGAGTCGGCA
+TACCGGAAGCGCTCATAGCTGACTTCGGCCAGCAGGCCGGTCCAGTCGCCCGACAGTGCGTGCTGGGATG
+CCTTGGCATACAGCCAGTCCACCCGCTCGGCCAGCGGCAGCGCCTCACGGCCGAGATGGCATTTCTTGTA
+CTTGCGGCCCGACCCGCACCAGCACGCCTCGTTGCGGCCCAGGTCGCGGCGCGGCTGGGCTCGGTGCCGC
+TCCAGGAGCCGCACCAGCGGGTGGTCGGGTTCGGTGCCGGCGCGGCGCAGCAGTGCCAACCCGCGCTCGG
+CGTCGCCGCGATCGGAGGCGATGCGGGCCAGGTCGAGCAACGGCAGCGGCCACTCGGTGTCCATCGACTC
+GGCCGCCAGCAGCTCACGTTCGGCCGCCTCGACATCACCGATCCGGTCCAGCGCGACCGCGCGCAGCCAG
+CGCACCGCCACCCGCGCCGCGCGCGGCACCTTGGGCTCCAGCATCTCGGTGAGCAGGCCCAGCGCGGCCG
+CCCCGCCGGAGTCGGTGCCCACCGTCTCTGCCACCAGCAGCTCGGCCAGCAGCGGGTCGGCCAGCGCCGC
+CCCAATGTCGCCGAGCAGATCGACCAACGAGTCGGAGCCGGTTTCCGTCGCGGTCTCGGCGGCTGTGGCG
+AGCACATCCCGCGGCAACTCGTCCGGGTCGGTTGCTTCGAGCAGCAGCGACATCGTCTCGTGCAGTTTGA
+TCAGCGTGTACAGCGCGACCGCGTCGTTGGGGTCGAGGTCGTGGCGAAAGGCCAGCAGTTCGCATCGGTT
+CTCGAAACGCCAAGCGTCGAAATTGAATCCGCCAGGTGCTAGCCAGTCGTCTTCGTGCGTGAGGCCGTGC
+TGGTCGAGGATCTCGCGCAGCGGTGCCACTGGCTCGGTAAATGCCGCCGGGTCGTCGACGCACGCCGTCC
+AGACCGCCGCGGGGAAGAACGCGGGCTCGTCGGGGTCGACCAGCTCGGCCAGCCGGGCGCCGACGGAGGT
+GTCCGCACCGGCTGTGCCGATCCGCTCGAGCACCAGCCCTGCGGCGGTCAGCCGCACACCGACCAGATCC
+CCCGCGGCGGCCCCCAACGTCGCCAGCGTGCCCGGCTCCAGCAGCAGTGCCCCGCCGGGGTCGATGGCCT
+CGTCCGGGATGCCCCGTCGTTCGAGCAGCTCCTCGTCGTATCCGGCCAGCACGATCCGCGCCGCCGAACC
+GTCGGCCAGCCGGCCATACTCCTCGTGCTCGCAGAGCGTGGTGATCGGGTCCAGGTCCGGGGTCACGCCG
+AGCATGTCGTGGACCGCCTCGTCCGCGCCGAGCCGATGGGTGAATACCCGCCCGGCTAGCAGCGTCGGCA
+GCCACACCCACCGATCGTCGACCAACTGCCTTGCCGGCCATTCCGTTTCAAGGCGAAGCGCGCGCAGGAC
+GGCGTCCGGGTCGGCCACGCCGCTGTCCAGCAGGCGTCGTGCGATGTCGTCCTCGCTCAATGGGCCATGT
+TCGGCCAGGATTCTCGCCACGGCTTGGGTCGCATCGAACGCTTCGGCCACGGTGGCCACCTTATGCCGCG
+GCCAGCCGAGGCTTGACGTCGGGCACCAGCCGATGGGGCTGGCCTCGCCTAGGGTTCGGCGTTGTGACGG
+CGCCGACGCGGTGGACCCTGGCCGACGGACGTGAGCTGCTGTTCTTTTCGCTGCCCGGGCCCCGCACCAG
+CGGCACCGCCGCAGAACGGGTGGCTCGCCACGCTCAAGCGCAAACGTTCGCCGGCGATATCCGCCAGCGC
+GCCATACAGCTGGTCGTGTCCGAACAAGAAGTGGCAAGCAAAATCACCGCCGCTACCGCCGGAATCGCCA
+CCACCACCTTCCCGGAAACACCCAGCATCGACGACACCATCATCGGCAACGACAACCGCGACACTGGGGT
+CCGGTTGGTCGACGTCAAACAAGATGGCGGCACTAGTCCCCCGCCCCCATTTGCGCCGTGGGACACCCCT
+GATGGAACACCGCCGCCGGGCACTGGCCTAAGCCCTACGCTGCAGCAGATGATCCTCGGCGGTGATCCAG
+CTAATCTGACCGGCCAGGGTCTTGCGGACAACGTGCAACGGTTCGTACAGTCGCTGCCCGCAAACGACCC
+CAACACAGCGTGGTTGCGCGGTCAGGTTGCGGATCTGCAGGCGCACGTCGCCGATATTGAGTACGCCCGC
+ACCCATTGCAGCACCAACGACTGGATCGACCGGACCGCCCAGTTCGCCTCGGGCGCCATAGTCTTCAGCA
+TCGGCGTGTTGACCGCAGAGACCGGGGCGGGGGTCGTGGCTGCCGCGGCCGGTGGTGTCGGCGCGGCCAC
+GGCGGGCGTGAGTCTTCTACAATGCCTGGTGGGGAGCAAGTGATGGACGTATTGGCTGCTGGGATCGCGG
+CTGGCGCGCTCACGCTGGCGGCGTGGGGCGCCTGGCGCCCGCACTACCGGGCGGCGTCCTACCTCGTGGC
+CGGTGCCGTAGAGCTGGCACTGATCGGGCTGCTGGTGGTGACCGGGCAAACATTGATGGCCATCTCGGTG
+GCCTTCCTTGTGGCGCTGGGCGGTCCGTTGGTGGTGGTCAACCACCGCAGAGCTGAACGCAGCCGAGGTT
+AGATGAACGAAGAGGGCCTGTAGGTCGCACTCATCGCGCGGCTAGCCTGTGAGGCCAGCCCTCGGGCCGC
+CACCCAACACGGCTCGTGCGCTGTCTCGGCCGGCTCGTCTGCCGCACGGCCAGCATGATCAGTCCCGTTG
+GAATACCGGTGAGCGTCGGCGCGCGCATCACGATGCAGCGATGTTAGGATGAGGCGGTGCGCACTACCAT
+CGACCTGCCGCAAGACCTGCACAAGCAGGCACTGGCGATTGCCCGGGATACGCACCGCACGTTGAGTGAA
+ACGGTCGCCGACCTCATGCGACGAGGCCTGGCCGCCAACCGCCCTACCGCGTTGTCCTCAGACCCCAGAA
+CGGGATTGCCTTTGGTGAGCGTCGGGACCGTCGTGACCTCCGAGGACGTGCGTTCATTAGAGGACGAGCA
+GTGACGGTGCTGCTCGACGCCAACGTGCTGATCGCATTGGTGGTCGCCGAGCATGTGCATCATGATGCTG
+CAGCGGACTGGCTCATGGCGTCCGACACCGGATTTGCGACCTGCCCGATGACACAAGGAAGCCTGGTTCG
+ATTCCTGGTGCGCTCGGGACAGTCCGCGGCGGCGGCTCGGGATGTCGTCAGTGCGGTCCAGTGCACGAGC
+CGCCACGAATTCTGGCCCGATGCACTCTCTTTCGCCGGTGTCGAGGTCGCTGGTGTGGTTGGGCACCGGC
+AGGTGACCGATGCCTACCTTGCCCAGCTCGCGCGAAGCCACGACGGGCAGTTGGCGACGCTCGACAGCGG
+CTTAGCACACCTGCACGGCGACGTCGCGGTACTCATTCCAACGACCACCTGATGTGCATCGTCTCCCGGC
+GGCGCGGCGAGCCGCCCCAAAACCAACGATTGGGCCACGATGCGTAGGCATAGCTGAGGTGGCGTCGCGG
+CCCTCACCGGCGACACCACAGAGGATCTCGGGCCGATCCGATGAGCGCCACGCCACCGCCCGGAGGACTC
+GACGCGTCGGTGTTCATCGCGAACGAACGCGGTCGGCAACTCGACGAGGCGCTCCCAGTAGGGTTCTGCG
+TTGTGACGGCGCCGACGCGGTGGACCCTGGCCGATGGCCGTGACCTGCTGTTCTTTTCGCTGCCCGGACA
+CGTCCCGGCGCCGGTGTCGGATCGTCGGCCGCTGCCCGAACGTGACCCGGCTCCCTCGCGGCTGCGGTTC
+GACCGGGCCACCGGCCAGTGGGTGATCGTCGCCGCACAGCGCCAGGATCGCACCTACAAGCCGCCGGCCG
+CGCGCTGCCCGCTGTGTCCGGGGCCGACCGGTCTGAGTAGCGAGGTGCCCGCCCCCGACTACGACGTTGT
+CGTCTTCGAGAACCGGTTTCCCAGCCTGGCCGGGGCCGGCATCGCCCCAATCGGCGCGCCCGACGGTGAC
+GGGTTCGTATCCGCTCCGGGGCACGGACGCTGCGAGGTGATCTGCTTTTCGGCCGATCACACCGGTTCGT
+TCGCGGGCCTGGACCCGGCGCATGCCGGGCTGGTCGTGCACGCGTGGCGGCACCGCACCGCCGAATTGAC
+GGCCCTGCCCGGGGTAGCGCAGGTGTTCTGCTTCGAGAACCGTGGTGAGGAGATCGGGGTGACCCTGACC
+CACCCGCACGGCCAGATTTACGCCTATCCGTATCTGACGCCGCGCACCGCGGCGATGCTGCGCCAGGCTC
+GTCGGCACCGAAAGCGTCACGGTGACAACCTGTTTGCCAGCCTGCTGGCACGCGAGGTCGCCGACGGCAG
+CCGCATCGTGGTACGCGGCGAGCTGTTCACCGCATTCGTACCGTTCGCCGCACGCTGGCCGGTGGAGGTG
+CACATTTACCCAAACCGGTTGGTGCGCAACCTCACCGAGCTCAATGACGGGGAGTTGGATGAGTTCGCCC
+GGATCTATCTGGACGTGCTGCAGAGGTTTGATCGGATGTATTCTTCACCGCTGCCGTACATGTCGGCGCT
+GCACCAGTTCAGCGAGGTCCAGCGCGATGGCTACTTTCACGTCGAGCTCATGTCGATCCGGCGCAGCGCC
+ACCAAACTGAAATATCTGGCGGCCGCCGAGTCGGCGATGGACGCGTTCATCGCCGACGTTATCCCGGAGA
+GCGTGGCCGCCCGGCTGCGCGAGCTGGGCCCATGACGGTCAGCTACGGCGCACCCGGGCGGGTCAACCTG
+ATCGGCGAACACACCGATTACAACCTGGGTTTCGCGCTGCCGATTGCGTTGCCGCGGCGCACCGTTGTCA
+CGTTCACCCCCGAGCACACCGGCGCGATCACCGCGCGCAGCGACCGCGCCGACGGCTCGGCGCGGATCCC
+GCTCGACACCACGCCGGGGCAGGTGACCGGCTGGGCAGCCTATGCGGCCGGGGCGATCTGGGCGCTGCGG
+GGCGCCGGCCACCCGGTGCCCGGCGGGGCGATGTCGATCACCAGCGACGTCGAGATCGGGTCGGGGCTTT
+CGTCGTCGGCGGCGCTGATCGGCGCGGTGCTGGGCGCGGTCGGCGCCGCCACCGGCACCCGCATCGACCG
+TCTCGAGCGGGCCCGGCTCGCACAGCGAGCCGAGAACGACTACGTCGGTGCCCCAACGGGTTTGCTCGAC
+CACCTGGCCGCGCTGTTCGGAGCGCCGAAGACCGCGCTGCTGATCGACTTTCGCGACATCACCGTGCGCC
+CGGTGGCCTTCGACCCGGACGCCTGCGATGTGGTGCTGCTGTTGATGGATTCTCGAGCCCGACACCGTCA
+CGCCGGCGGGGAGTATGCGCTGCGCCGGGCGTCGTGTGAACGGGCGGCCGCCGATCTGGGGGTGTCCTCG
+TTGCGCGCTGTGCAGGATCGCGGGCTGGCGGCGCTGGGCGCGATCGCCGATCCGATCGACGCGCGCCGCG
+CCCGGCACGTGCTGACCGAGAATCAGCGGGTGCTGGATTTCGCGGCCGCACTGGCTGATTCGGATTTCAC
+CGCCGCCGGGCAGCTGCTGACCGCGTCGCATGAGTCCATGCGCGAGGACTTCGCCATCACCACCGAGCGG
+ATCGATCTGATCGCCGAGAGCGCCGTACGGGCCGGTGCGCTGGGCGCCCGGATGACCGGGGGCGGCTTCG
+GGGGCGCCGTGATCGCACTGGTGCCTGCCGATAGGGCGCGCGACGTGGCCGACACGGTGCGACGGGCGGC
+GGTCACCGCCGGCTACGACGAGCCGGCGGTGAGCCGGACCTATGCCGCGCCCGGCGCGGCCGAGTGCTGT
+TGAGCGGGTTGGCGAAGCGTCATGTCCACAGTGAGCAGATCGGTGCGGGTCCGCCACTGCCCTTGACCTC
+GAAGCCGAACACCGGCTACGAGACCGCTGCCGCGGTGGATCTGGTGTCTGGGGCTTAGCCCGCTTCGCTG
+ATACCCAGAACCAGTGCGAGCGCGTGGTCGGTCTGGCGCATCCTGCCAGGTGCCAGGGCTCCCAATCGTT
+CGAGCAGGCGGGTGACGAGGATCGCCGACTGGTCCTGCGCGCGAGTATTGGTTGTCGCCGCGGTATCCCG
+GGGCCATGAAGACGCAGCCTTCGATCTTGGCTTCGCTCGACTCCCGATGCCGCCCCAACTCGATCGCTCT
+TGGGTTTGTCCGACCGCGGGCGTAGCCTTTGCCTCGAGGTGCAGCCGATGGCAGGCGATCGAGGCGCTGA
+CCCCGGTCCGGCGAATGTGACTCCGGGTGCGGATGACCATGCACAGCATGCGTCGCCGACGGTGCTATGT
+CCCCAGGGTCACGTGAACGCATGGGACTACAGGTTCTGTGAGCGGTGCGGCTCGCCGATCGGCGTGGTGC
+CCTGGCCGTCGGAGGAATCAGGCACACGCCAGACGGCGCCCGCGCGATCCTTCGTCCCCCTCGTCGTCCT
+CGCGGCGACGCTGCTCGTGGTCGCCGTCGTCGTGACGGCCGTCGGCTACGCGGTGACGCGACCGGCTCGC
+AACGACCGTGAGGAGCCCAGTTCCGCGCGGGGCGCCGCCACGACGGGTGTGCCGTTCGCACAGGCCGAGG
+CCGCGAGTTGCCCGGACGATCCGGTGCTTGAAGCGGAGTCGATCGACCTGACGTCCGACGGGCTTGCGGT
+GAGTGCCGCGTTCATGTCGGCATGCGCCGGCGGCGATGTCGAGTCGAACTCGGCGCTCGAGGTCACCGTC
+GCCGACGGACGGCGCGACGTGGCGGCCGGAAGCTTCGACTTCTCGGCAGATCCGCTGAGGATCGAGCCCG
+GCGTGCCCGCCCGTCGAACCCTGGTCTTTCCGCCCGGAATGTATTGGCGAACGCCCGACATGTTGTCCGG
+CGCACCGGCATTGGCGGCCACACGGAAGGGCAGGTCCGATCGTTCGGCCGCACGAGGCGGATCGGCACGG
+ACGACCATGGTCGCGGCCGCGTCCGCGGCACCGGCTTACGGCAGCATCAACGCCGTTGCCGGGGCGGTGC
+TGGTGGAGCTACGTGACTCGGACTTCCCCTACGTGCGAGTCGGTATCGCCAATCGCTGGGTGCCGCAGGT
+GAGTTCGAAGCGCGTCGGCCTGGTCGCCGCGGGGAAAACGTGGACGAGCGCCGATATTCTTCGCGATCAC
+CTGGCCCTGCGGCAGCGGTTCGGGGGCGCCCGCCTGGTGTGGTCGGGGCACTGGACCACCTTCAGCGGAC
+CCGATTTCTGGGTGACGGTGGTTGGGCCGGCGCAGCCCACCGCAGCTGAGGCCAATCGCTGGTGCGACTC
+GAACGGGTTCGGCGCCGATGACTGTTTCGCGAAGTTCATCAGCACCCTCGTTGGCGCGAAGGGCACGACG
+GTGTACCGGAAGTGACGACGCTGCCATGAGTTTCTGCGTGTATTGCGGTGCCGAGCTTGCCGACCCGACC
+AGGTGCGGGGCGTGCGGCGCATACAAGATTGGTTCAACCTGGCATCGGACCACGACGCCGACGGTCGGCG
+CCGCGACGACGGCAACGGGATGGCGACCCGATCCCACCGGTCGCCACGAGGGACGCTACTTCGTCGCCGG
+GCAGCCGACCGACCTCGTTCGCGAGGGCGACGCCGAAGCCGTTGACCCACTTGGTCAGCAGCAGCTGGAT
+CAGTCAGGTGCCGTTGGTGTTTCGCCGTCAGCGGTGTCGGGGTGGGTGCGTTCTGGGCACCGTCGACTGT
+GGTGGGCGCTTGCGGGCGTGGTGGCGTTTCTCGGGCTGGTGGGAGCCGGTGTCGTCGGGACGCTGTTCCT
+GAATCGAGACCGGGAGTCCATCGACGACAAGTACCTCGCCGCCTTGAGGCGGTCCGGACTCACCGGTGAG
+TTCAACTCCGACGCGAACGCCATCGCCCGCGGCAAGCAGGTGTGCCGCCAGTTGCAAGACGGTGGCGAAC
+AGCAGGGGATGCCGGTCGATCAGGTCGCCGTGCAATACTACTGCCCGCAGTTCAGCGATGGCTTCCATAT
+CCTGGAAACCATAACTGTCACTGGAAGTTTCACCCTCAAGGATGAATCGCCAAACGTGTACGCACCGGCG
+ATCACCGTGTCGGGCTCCGGGTGCTCAGGGTCAGCCGGCTACGCCGACATCGACCGGGGAACGCAGGTGA
+CGGTGAAAAACGGTCAGGGGGACATCCTGGCCACGGCCTTCCTGCAGGCGGGTCAGGGCGGCCGATTCTT
+GTGCACCTTCCCTTTCTCGTTTGAAATCACCGAGGGCGAAGACCGCTACGTCGTGTCGGTCAGTCGTCGA
+GGCGAAATGAGTTACTCGTTCGCCGATCTGAAGGCCAATGGGCTATCGCTCGTCTTGGGCTGAGTCACCG
+CGGTATTCGGCACGGCGCACCGCTGCGCAACCAGCTAGCGCTGACCGTGTGATCTAGAATCTAGCTACTA
+GTATAGAATCGAGACATGGCGCTGAGTATCAAGCACCCGGAAGCCGACCGGCTCGCGCGAGCGCTTGCGG
+CGCGCACCGGCGAGACGTTGACCGAGGCAGTGGTTACCGCGTTGCGCGAGCGGCTCGCTCGTGAGACTGG
+GCGTGCCCGTGTTGTCCCGTTGCGCGACGAGCTTGCCGCGATTCGGCACCGGTGCGCAGCGTTGCCGGTG
+GTCGACAACCGGTCCGCTGAGGCGATTCTCGGCTATGACGAGCGCGGATTGCCGGCCTGATGGTGATCGA
+CACGTCCGCGCTCGTTGCGATGCTCAGCGACGAGCCAGACGCAGAGCGGTTCGAGGCCGCCGTCGAAGCC
+GACCACATCCGGCTGATGTCGACGGCGTCTTACCTGGAAACGGCACTCGTGATAGAAGCCCGCTTCGGTG
+AACCGGGCGGACGTGAGCTGGATCTGTGGCTTCATCGCGCCGCGGTCGACCTTGTTGCCGTGCATGCCGA
+CCAAGCGGATGCCGCGCGCGCCGCCTACCGCACGTACGGCAAGGGAAGGCATCGTGCGGGGCTCAACTAC
+GGCGACTGCTTCTCATACGGCCTCGCCAAGATCAGCGGCCAGCCACTCCTGTTCAAGGGCGAAGATTTCC
+AACACACCGACATCGCCACGGTCGCGCTGCCCTAATTCTTAGTCAGCCAGGTGTTCGCCGCACCGGCTTT
+CGGCAGCGTCAACGGTGTTGTTAAGTGCGGCAGAAGGTTCACAAGGCATGTCGACCGCTCAGCGTGCTCC
+GACTTCGCGATCCGGATCCTCGACGCCGCCGTCCGCGCCGTCGCCACGGGCGTGTGCACGCCACTGGCGG
+TACCCGTGTCGCGCCGCGAACGCACCGATGATGGCGGTGACGCACCACACCGCGATCGCGCAGGACGCCA
+GCAGCGGTGAGCGATCGCCGATCGCCGCACCCAATGCGGTGTAGGCGAATGCCCGCGGCGCGGAACCGAT
+GAATGCACCGACGGCCATCTGCCACAACGGAACTCCGAACGTCCCGAACGCATAGGAGGCGAACGCATCC
+GATATGCCGGGGACAAAGCGTTGGCCGACGACGGCCCACAGGCCGCATCGTTCGATCAGCGCGTCGGTGC
+GATCGGCACGTTCCCCGCCCAGCAGGGCTCGCGCGCTGGCCCGGCCGGCTCGACGGCCGACCAGGCTCGC
+GACGACGGCGGTGCCCACCGTGGCACCCAGCGTCACGAAGACCCCCACTAGCGGACCGAACAGCAGCCCG
+CTGCTTGCGGCCAGGATCGGGCCCGGGACGAACAACGCGCCGAGCACGGCCGACACTACGACATAGGTCA
+GCGGCGCCGCCGGCCCGGTCGCCGAGACCGCGCCCCGCACCGCGGCCACATCGATGACGTCCGTGGCGGC
+TACCAGGTAGAACATTCCTACAAGGAAGCCGGCGAACACGACAAGCCGCACGATGTGGCGTCGCCGGGAT
+GTCGGTGCGGAATCGTTGTGAGTGCTCATGCTGACCGTGATTGTTCCGCACCGACGCTGGCCGCGCCCGT
+CGTCCCCGGCGTTGGCTGGGGAACCTCGGCTGCGCGGGCGCCGTCCGGCGAGCAACCCGTTTGTCCTACG
+ATTGAGCTACGATCGTAGGCATGTCTGAGGTGGCCTCGCGTGAGCTGCGTAACGATACGGCCGGCGTGCT
+GCGCCGCGTGCGGGCAGGGGAGGACGTCACCATCACCGTCAGCGGCCGTCCGGTCGCGGTGCTTACCCCG
+GTTCGTCCGCGGCGCCGGCGTTGGCTGAGCAAAACGGAGTTCCTGTCGCGGTTGCGCGGCGCTCAAGCCG
+ATCCCGGGCTCCGTAACGACCTCGCGGTCCTTGCCGGCGACACGACCGAGGATCTCGGGCCGATCCGGTG
+AGCACGACGCCGGCCGCCGGAGTGCTCGACACGTCGGTGTTCATCGCGACCGAAAGCGGCCGGCAACTCG
+ACGAGGCGCTGATCCCCGACCGGGTCGCCACCACCGTCGTCACCCTCGCCGAACTGCGCGTCGGCGTGCT
+GGCCGCGGCGACGACCGACATCCGGGCTCAACGCCTGGCGACCCTGGAATCCGTTGCCGATATGGAAACG
+TTGCCCGTCGACGACGATGCCGCCCGAATGTGGGCCCGATTGCGGATCCATCTTGCCGAGTCCGGTCGCC
+GGGTGCGGATCAACGACCTGTGGATCGCGGCCGTCGCGGCATCGCGAGCGCTGCCGGTCATCACCCAGGA
+CGACGACTTCGCCGCCCTCGACGGTGCGGCCAGTGTGGAGATCATTCGGGTCTGACTCGGTGGCCACGCG
+TCTCTCGCGCTGTTGTCCGCACCCGCAGGGCGTCCCGGTGGGTCAACGCGGCGGCCTCAGTCGACGAACA
+GCGCCATCGACGCGGTAAACCCGTGCAACGCGTTGTGGCCCGCGACCGGGCCGATCTCCCCGGCGGCGAA
+GAAACCGGCCAGCGGAATCCCGCCCAGCAGGTCCTCGATCGTCGACGCGTCGTGGTCGGTGACCCCGAAC
+ATTCGTCGTCCGCGCCCGTTGCAGGTGAACAGCAGCCCACCGACCGGGGGCCCGGGCAGCTCCGCCGCCG
+CCCGCTCGACGGCCAGGCGCAGGTCCTTGTCGGCCGCCGCCGCGTCCCGGACCTGGAATTGCACGGTCGC
+GCCGACCTCGACAACCTCGCCGATCCCGATCGCCCCCGTCGTTGGGTCGGCGCCGAGCAGCCCGCGGATC
+AAAAAGTCGCCCTGACCCGGCACCGCCAGGTGCTCGTCGACGACGATTCCGATCTGCAGGCCGCGGCTGA
+CCAGTTCCTGCTCGTCGGGCGCCATCCCCAAGACGATCTCCCGCAGGCGGTGCAGCGGCGGTCGGCCGCC
+CAGCTCGGTGATCACGGCACCGTCCGCGCCGGTGACAATGTACGGTTCCCCGATCGGCCGGCAGCCCTGC
+GACACCACGGAAACGCTGTGCGCGCCGGGCAGGCGCACGCCGACCAGCCCGGAGGTGAGCACGTCGCGGT
+CACGAAACAGCCGGGTGTCGCCCCGCCGACGCCCACCGCTCACCACCCCGCCGACGACGGTCGTTCCCGG
+CAGGTCGGTGTTGAGGTGCTCGATGAGCAGATTCGACGGGAACGAGTACGGGTCCGGCAGCAGCAGGTGC
+AAGTCGTGCGCGGTCCGGTCGAAGCGGTAACCGGTGATCAGAGCGCCCGAGCCGGTGCGAACGAAGTCCA
+GGTGGAATGTCTCCGCGGGTGGGCCGGACGCCAGCCACACCGCTACCGCGGGCTCGTTCTCCAGCTCGTG
+GCGACCGGCGACGATGCCTTGGGCCACGCAACCGATCAGCGCGGCCGGCTCGACCGACGCCTGCACCGCA
+GCCAGCAGGTCCACGGCCTGGTCGGTGTGTGACCGCGATCCGAGGAGCACGGCCAGCGCCGGCGTCCCAC
+CCGCGAGCTCCTCGCGCGCGTGCGCGGCAGCCTCCGCCGCGGCCCGGCGCACGTCCGGCGCGGTGGAAAC
+CCCGACTCCGATCCGCACACATCCATGATGCGCCGTCGCCGTGCTGTTCGTGTATGCGATGTCAAAGTCC
+GGGCGCGGTTACCCGACGAGCCGAGCACATCCCCGACGAGTCAGCCACACCCCGTCGACTGTAACCGCAT
+CCGCAACCCGCTGGCCCGCACCGCCCGGCGTGCGATCGCGGCCCGCACCGAAGCTTCGGACCCGACCACC
+CGGACCTTGCGTTTGGCCCGGGCCACCGCGGTGTACAGCAACTCCCGGGTCAGCAACCGCGAATCCTCTT
+GCGGCATCAGCACCGTCACCTCGTCGACCTGGCTGCCCTGACTCTTGTGGATGGTCATCGCGTGCATGGT
+CTCGACGTCGCCGAGGCGGCCGGTGGCAACGTCAAGTGGCCCGGATGCACCAGAAATGACGGCCCGCAGA
+CCGGTGGGGCCGGCCAGCACGACACCGGTGTCGCCGTTGTAGACGCGAAGGCCGTAGTCGTTGGCCGTCA
+CCAGCAGCGGACGCCCGGCGTACCACGGCGTCCAGGGCGGCTGGCCGGTCTCCTCGGCGAGCCAGGCTTG
+AACCCGGCGGTTCCAGTGCAGCACGCCGGTGGGCCCGTCCCGATGCGCACACAGCAGCCGGTGCTCGTCC
+AGGGTGGCCAACGCGACGTCGGAGGCACCCAACAGCGCCGCCTCGCGCAGCCGCAACGCGTGTGGCACCA
+GCACCGCGCGCAACCGCGGCGCCGGATCCTCGTCGTCGACGAACTCGATCCGCTCCTCACCCGAGCGCAG
+CAGGCCCAGTACGGCATCGCCATCGCCGGCCCGGATCGCTTCGGCCAAGGTACCGATCACCTTGCCGAAC
+CGATGCGACGTTCGCAGCTGCGCCACCAGCGCGTCGTCGCGTACCGAGAAGCCATCGACCAAATCCGCCA
+GCACCGCTCCGGCTTCCACCGACGCCAACTGGTCGGCATCGCCGACGAGGATCAACCGGGCGCCCGGGCG
+CACCGCCTCGGCCAGCCGGGCCATCAGCGTCAGCGACACCATCGAGGTCTCGTCGACCACGATCACGTTG
+TGAGGCAACCGGTTCTGGCGATCCTGGCGAAACCGCGCTCCCGGTTTGGCACCCAGCAGACGATGCAGCG
+TGACCGCGTGCAGGTCGCCGAGCCGTGCCCGGTCGGTGGCGTCGAGCTTGGCCATCTCGCGCCGTACCGC
+CTCGGCCAGCCGGGCCGCCGCCTTGCCGGTGGGTGCGGCCAGCGCGATCCGCGGCCGCGGCTCACCGGCC
+AGCTCCGCCTGCTCGGCAACCAACGCCAGCAGCCGCGCGACCGTCGTCGTCTTTCCGGTGCCAGGCCCGC
+CAGTCAACACCGTAACACCTTGCGAGAGCGCGATTTCCGCCGCGCGCCGCTGCTCGTCAAAGCCGGTCGG
+GAACAGTCGCCGCAAGTCGGGTACCCCGGCCGGTCGCCTGGATGTCAGCAACGCGAGCAGGTCCGCGCAC
+ACCTGCTCTTCTTCGCGCCAGTAGCGGTCCAGATAGAGCAGCCGATCGTCATACAGGTGCAGCACGGGTG
+GATCGGCGAGCAACGGACTGGCCCGCACCGCCGCCAACCAGTCCGCCGGATCCGGCCACGGCAGGTCGTC
+GTGTCCAGCAACCCGCGCGATCGACAACAGATCCACACACACCGAACCGGCCCGTAGCGCGCGGACCGCC
+ACCGCTACCGCCAACGCCACCCGCTCGTCGCTCTCCCCGGCCAGTGCACAGAGACGTTGCGCCACATGCA
+CATCCGACACGTCCAGCACACCGGCCTGGTTGAAGGCCCGCACCATCCCGGAGGCCTCGACGGCAAAATC
+GACGTCGGTGAGCTTCACGACTGCAGCCTTCCCCGGTCGAGCAGATCCGAGAGCGCCACCACCAACGCCG
+TGGGCGGGTTCCAGGTGAACACACCGGCCGGATGCCCGGCCGTCACCGGCGTCGCCGCACCGCACATGCC
+CCGCACAAACAGGTACAGCACCCCGCCGAGATGGCGCGCCGGAGCGTAATCCCGCTGCCGCCACCGCAGG
+AAGCGGTGCAGCACAACAACATACAGCAGCGCCTGCAGTGGGTAGTCCGAATGCAGCATGGCCTCGGTCA
+ACCGCTCGAAGCCGTAATCGGCGGCGGTGTCACCAAGGTGATTGGTCTTGTAATCGACCACCAGATATCG
+CTGCCCGGGTAGCCGCAGCACCACGTCGATCGACCCCGCCAGGTAGCCACGCAGCGGTTGATCACCCAAC
+CCGGCCGAACCAAGCCGATCGGCGTAGGGCGACAACGGGTCGTCGCCGGGCAGGTGCGACGCCAGCAGCT
+CACCCACGTCGGCCAGCGACACGTCCGGGGACCGGCCGCGCAGATCGCCCCCGGCCAGCGGCATCTCGAA
+GTCCAACTCCCGCAGACGATCACGCACACCGATCTGCCGCAATGTCAGTGCGGCGGCGGCGGGTCCCAGC
+GGCGTGTCGTGCATCGGCAGCAACGCTCGGGCCAGTTCGGGAGCCAGCTGCGCGTGGTCGACGTCCACGG
+TCCACCACGGCGCGTGCCGGGCACCTGGGCTTCCAGTTCGGCAGCCAGATCGGGAGCGGCTGGGTCCGCG
+GTCTCGAGCACCGCGTGCACCAGCGAGCCGAACGACGCCCCCGACGGCAGCGCGGCCAGCGGTGATGTCA
+GATCGGCGCCGGAACCGGGCGCGGCGAAGACGGCGATCTCCACCTCGTCCGCACGGCCGCCGGCCGCCGG
+CTCGCTGGTGACGGTGACGGCTTCCGAGCCCCGCACCAGATCCGAGTACGAGGTCCGCCGCCACGTGGTG
+TCGATCCGGCGGTGAAAGTGCCGAACCTCGAAACCGGGTACGGGCACCGGCTTTTCGAGGGAACTGCGAG
+CACCGATGACCGATTCCTCGACCGACGGCCCGCCCGCGGCCTCCCACTGCGCGAACACCGCCCAGGCCTG
+CTCGTCGGTGACGCGTGGTGTACACCGGTCCGGTACCTGCGACTGGCCGGGCCGGCGCCCGCGCAGCAAC
+CGCGACAACCCGCCGTTGACCTCGTCGAACGTCGGTGCCCACCACGCGACGACCTGCGATTGCGCGCGGG
+TAAGCGCGACATAGGTGAGCCGGAGGTTGTCGTGGGCCGCCTCGACGCGGTTCAGCCCCTCAACGGTGCG
+CCGCTGAGCACCGCCGTCCTTGCCGCCGATGTACAGGCAGCGGGTGCCGTCGTCGTGATACAGCAGGATG
+TCGTCGCTGCGGACGTTGCGGTTGAAGGCGAACGGCAGATACACGATGGGAAACTGCAGTCCCTTGGCCA
+CGAAGACGGTCATGATCTGCACCGCCGCGGCGTCGCTGTCCAACCGGCGATTGTGTTCCGGCGGGCCGGC
+ACCCGCCTTGGCCTGGCGGCGCAGCCAATCGCGCAGCCCGGGCAGGCCGAGCCGCTCGCGATGAGCGGCC
+TCGTGCAGCAGCTGCGCAATGTGCGCCAGGTCTGTCAGGTCCCGTTCGCCGCCGCGCTGGCTCAGCACGC
+GCCGGCCCATCCCGGCCAGCTGAGCGGCCTGAAACACCGCGGCCACACCGCGATGGCGTGCGTGGTCGGC
+CCACTCGCGCAACGTGCCGGCCACCCGATCGGTCAGCGCATCGCCCTCGGCGGCAAGCGATTCCGCGGTC
+TCACCGAAGAACATCGTGCACGCGGCGGCGCGGACCAGCCCGCTGCGCTGCGGCGCGTCGAACGCCTCCA
+GCAGGCACAGCCAGTCCTTGGCGGCCTGCGAGGCGAACACGTCGGTGTCACCGGTGTAGATCGCCGGGAT
+GCCCGCCTCCGCCAACGCATTCCGGCACGCCCGCGCGTCTTTGTGATGCTCGACGATCACCGCGATGTCT
+GCGGCCACCACGGGCCGCCCGGCGAAGGTGGCCCCGCTGGCCAGTAGCGCCGCGACGTCGGCGGCCAGGT
+CGTCGGGGATGTGCCGGCGCAGCGCCTCGATCGGGACGTGGGCGGTCCCGTCATACCCGAGCGTGTGCCG
+TTTGACCACGCGCAACCGAAACGGCGCCGGGCGCGGCGCCGAGGCCAGGCGGTGCCCGGCGTGGTGGGCG
+TCGGTGCCGCGGACGACGATGTCGGCGTGACCCAGGGTCGCATCGCGCAGCACCGTCTGCAGGCTCTCGA
+CCAGCGCCCGGTCGCTGCGCCAGTTGACGCCCAACGTGTAGCGGGCATCGGCGGTGCCGGCCGCCTTGAG
+GTAGGTGTGGATGTCGCCGCCGCGAAAGCCGTAGATCGCCTGCTTGGGATCGCCGATCAGGATCAGCGCC
+GAATGCCGGCTAAACGCGCGCTCGAGCACCCGCCACTGCATGGGGTCGGTATCTTGAAACTCGTCCACCA
+GCACGATCCGCCAGCGTTCCCGCATCCGATCGCGAGCTGGCGAGTCGGCCGCCTCGAGGGCTGTCGCCAA
+ACGGATCAGCAGATCGTTGAATCCTTGCGCACGCAGCCGGCCCTTGCGGCGCTCGAGTTCCTCGAGCACC
+TCGGCGGCAAAGCGCAGCCGCACCGCTGCCTTGCTGCCGGGCTCGGGATCAGGCGGGCGCAGTTGGGCGC
+ACGGGTCGTCGACGACGGCAAGGGCCAGGGCCAGCGCCTCGGCGTAGGTCAGCTCCGGATCGGTCTCCTG
+ACGACCGAAGTTCGCCAGATAGCGATCGTCCACGATCTCAGTGACCAGGTCGGTAAGGCTCTCCTTGAGC
+TCCACGTCGGCGGCGTTGTCACCGGCCACACCGAGGGATTTCAACACCGAGCCGCAGAACTCGTGGGTGG
+TGGCGATGGTTGCCGCGTCGAAGTTGGCCAGCGCGTCACGCAGCCGCGACCGCTTCTGGGCGCGCTCGGC
+GTCGCTGCCGCGCAGCAGGTGCTCGACGAGCTCGCCGCTCGGCGGCGCGTCGCCTTGTAGCGCGCCCAAG
+GCCTCGACGATCTGCCCGCGCACTCGCTCGCGTAACTCCCGGCTGGCCGCACGGTTGAACGTGATCAACA
+ACATCTCGTCGAGCGTCGCGGCGGTTTCGGCCAGATAGCGGGTGACCAGACCGGCCAGCGCGAACGTCTT
+ACCGGTGCCGGCGCTGGCTTCCAGCACGGTGGTGGTGCCCTCCCTCGGCAACGGGCCCAGCAGCTCGAAG
+CGGTCCATCAGACCGACCCTTCGGCGGCCAACAGCGGCAGCCATAGCCGGGCGGCCAGCGCCCCTAGCCG
+GGTCTCTTCCCCGGCGACCTCTTCGCCCGCGCGGGGCTTGCCGAGCAACACCTCGAAGGGTGCGCGCGGG
+CCCCAGGCTCGCACGTGGGCGGGCGCGTCGTCGTCGCCCGGCCGGAACCTGTTGGTCTGCCAGCATTCGC
+GGGCGGGCGGGTAGGGGTCTTGGCCGTCTCGGCGTGCCTGGGCCCACGCGCAGGACGTCTTCAGCGGCAG
+CGGCAGTGGTTCGCGCCGGCCGGCGTCGTACAGCAACACCAGCTCCCGCAATACCGCCACCGGGTCCGGC
+GGCGGCACGAAAAGCCTTCTGGCGATGTGGTTCCTGGTCTTGCTGCGGCCGATGCACAGCGCCGACCACT
+CGCGGCCAGGCTCTTGGGCGGCCAGCGTAACCAGGCCGATCCACGCCGGCAACACATGCTTGGGCGCCAG
+CTTTGAGTAGGTCACCGACACCGTGCGCCCGCCGAACACGGGTGTCACCGTGCCGCTCAGTCGCCGCCCG
+TCGCCGAGGTCGACGTCGACGTCGTGCGCCTGGCCGTGGCCGTCGCGGTGCGCCAGCGCGGCGGCCGCCA
+GATCGCGCGCGCGGTTCCGGATTTCCTTCGCCCGTCGCACGCCGAGGCGCCCGGGCGGCAACGTGCCGCG
+ACGCCATTCGGAGTGAGCGGCGTCGTCGAGGTGCAGGCCGCGGAGCATGTCGCGCAACATCCGCTCGCCC
+ACCGTCCACTCGGCCAAGGCGTCGACCTGGACCGGTATCGAGTCCTCGACGGTGTCGACGTCCCAGGGCA
+GCGTGTAGTCCAGCGCCCGGAAGAACCCCTTGACCGGATCCTTGAAGAAGTCGAGCAGGTCCGCCAGCGT
+CACGTCGGCCGCGGGTGGTGCGGGCAGCCGACCGGAGATGAAAGCCGTTGGTGGACAGCGCTTCCCGGCG
+GCGGCCTGGGCGGCGGCGAGCGCGGCGGGGTCGAACGTGAACGGCTTGGCGCCCAGCAGTGCGCCGGGGG
+TGACGTTCTTCCGGTCGAACGGCTGCAGTGGGTGTGTGACCAGGATCCGCTCACGCACCGGCGCTGACGT
+CGTCTGGTCGAGCGCGTCGAGCAACTCGGCCAGCGGCACCGCGGGTGGGCGCGGTTGCCCGGTGCGCTCG
+TCGGCGCCGGTGTAAGTGATCACCAGGGTCTGGGTGGCCGCACCTATCGCGTCCAGCAGCAATTGCCGGT
+CCTCCGAACGGATGTCACGTTCACCCGTCATCGGTTCTCGGGCCAGCACGTCGTCCCCGTCGGGATGGCT
+CAGCCGCGGAAACACGCCGTCGTCCAGACCCACCAGGCACACCACCCGGTGCGGCACCGAGCGCATCGGG
+ACCATCGTGCAGACGGTCAGCGTGCCGGTGCGAAAGTTGGCCCGGGTCGGGCGCCCGGCCAGCTGCGCGT
+CCAAAAGCGCTCGCACGTCGGGCAGCCGCAACAGCGGCGCCGCGCGCGAACCGGCGCGCGCCAGCACGTC
+GGCGAACTCCCGCTGCACCTGCGCGCGTTGCCAGCCGTCGTTACAGGCGGTCAGCAGATCGATCCCCGTG
+GCCAGCGCATCCAGCCATGCGACCAACGGCCGTGCACCGCTGAGTCCGCCGACGACATGATGCAACCGTT
+CGACGAACTCGGCCAGCCTCCCGGCCAGCTCGACCCGATTGCTGCCGACGTCATCAAGGGGCAGCGCGGT
+ATCCAGCCACGCTTGGGAATCCTCGGACATGGCCACCCCGGTGAGGATGCGGTCGAGTCCGAACCGCCAC
+GTGTTGTGCACGACGGTGTCGAGGCCATAGCGTCGCCGGTGCGTCGGGTCGAAGCCCCAGCGGATGTTCG
+ATTCGCGCACCCACGTGGTGATGGTGTCCAGGTCGTCGTCGGCGAACCCGAATTTGGCGCGCACCGGAGC
+GGCCTGCGCGAGGTTGAGCAGTTGGCTGGCGGTGGCCCGGGTTTCGGCGATGGTGAGCAGTTCGGCGGCC
+ACCGAGAGCAGCGGATTGGTCTGGGTCAGGGCGCGGTCGGCCAGACGCACCCGCAGCCGGTGTGCGGGGT
+GGCAGTCGCCGGCCACCTCACCGAGGCCGAAGCCGGCGACGATCAACGGTGCGTAGGTGTCGATGTCGGG
+GCACATCACCACGATGTCGCGCGGTTGCAGCGTCGGGTCGTCCTCGAGGAGGCCGAGCAGCACCTCGCGC
+AGCACATCGATTTGCCGCGCCGGGCCGTGACAGGCATGGACCTGCACCGATCGGTCGGCATCCGACAAGC
+TACGCTCGGCGGGTCGCGGCGCGTTGCCGGCGATGTCGGCTTGCAGCCATCCCAGCAACGTGTCGGGTTT
+GGTTGTGGCACCAAGGAATTCGTCGGTGGCCCGGGCGGCGGGCAGCGCGCGCTGCAGTTCGCGCACGTCG
+CGGCCCAGCGTTTCCAGCAGCGGGTGCTGGGCGGCCCGCCGGCTGGTGTCCTGCCGCCGCGGCAGCAGGC
+CATCAGCGCCCTGGAAGCCGGCCAGCGCCCGCCACAACTCGTCGCTGGGGTGCGGCAGCCACAGGTGCAG
+GTCGTGGTGGACGGCCAGCGCATCCAGCAGCTGCACGTCGGTGCAGGCCAGGCGGGTGTGGCCGAACAGC
+GAAAGCCGAGCCGGCAGGTCGGCGGGGCCGTCGCGCAGCCGGGCGATGGTCTTGTCGTGGCGGACATGCG
+GGGGATCGGCCCCGACCGTGGTCACCAGGGCGCGCCACAGTGGCGGTTGCCAGGCCAAGTCGCCGGGCAG
+CTCGCCGAGGTCGCCGTCCAGCCAAGCGGCCAGCAACCCGGGACGCTGGCGTGCATAGGACGCGAACAGC
+CCGGCTAGCCGGCGCGCCACCGAATAGCGCCGGCCGCGGCGCAGCTCCGCCTCGGCATCGGTCGTCGCGA
+AGTGCCCCAAGTGGGATGCCAGCGTGCGGCACCACGGTTCGTCGAGGCTGGCGTCGATCACCGCCAGCAG
+CGGCCACGCCAGGGCTTCCGGCGACCACGGGTCGTCGTCGAGGGTGCCGGTGATCTCGGCGATCAGGGAC
+TGCGGATTGCGGAACGCGATGCCGGCGCACACCCCGTCGGCGCGGCCCGGCCCGCAGCCCAACACGAGCG
+AAAGCCGTTGGCTCAGCCAGCGTTCCACGCCGCGGGCAGCGACCAGCACCAGTTCCTGCGCGAAAGGGTC
+GGGCTGGGGATCGGCCAGCAGCGCGCCGAGCCCGTCGGCAAGCAGATCGGTGCGCTCGGCACGGTGCAGG
+TGAAGCGCCATCGGGCGTCACCCTAGTCGAGCGGCCGGCCGCCGACATGCATGCTGGCGTGCATAAACAG
+ACGCGAGATCACCGAACGACAAGGGCTACCAGTCGGTACGGGCCTTCTTGTCGACCTGGAACTGGGTCAG
+ATATCGAACCGTTCCGGGATTTCATCAACGCGCTGGGGCGTGCCGCGATGTCGGCATGACGAGCCGCCTC
+GGACGTGACACACTTCGAGATGGAGGAGGCGGTGTAGGTGTGAGGCGGTTGCCCAAAGCAACCGCGTCAC
+CCACCACTTACAGCCCGAACTCGGCTGCTATCCCGTCGATCCCGGCCCGAATCGCAGTGAGCGCGTCGGC
+GCGGGAGCGCAACTTGGTCGCGGCATGGGCGTGTTGGTTGAGACCGGCGAACTCTCGTGCGGCTTCCTCG
+GCGCGGCTGACCACCACCTCCGGCAGGGCGATCTCGTCGATAAACCCGGCGGCCAGCGCGGTTTCCCCGA
+AGAACGTCTTGGCCAGCCCGGTTGCCTGCTGGTATGCCGACCGGGTCAGTCGCAGCTTCATGATCTCTAA
+CGCCGCGTACGGAATGGTCATGCCGATCGCGACCTCATTGGCCTGGATGTTGTATGCGTGGGCCGCCACC
+CGATGATCGCCGCAGGACAACAGAAACGCGCCCATGGCGATGGCGTGACCGGTGCACGCCATCACCACCG
+GTTTGGGGTAGGACAAGAGGCGATACGCCAGCTCGAAGCCGCCCCTGAGCATGTCGATCGCGGGCTGCAC
+TTCACCGGAGGTGAGGATCTTCAGGTCGAAGCCTCCGCTGAATACCCGACCATTACCGGTGATCACCAGC
+GCCCCAACATCATCACGGTCCGCGTTGTCGATCGCTGCATTGAGGGCTTGTTGCATCGCCGGGCCCAGTG
+CGTTGACCTTGCCGTCGTCCATACTGATGACGGCGATGGAATCCTTGCGGGTATAGCTGACCGGGTCGCT
+CATGCTCTCGATTGAATCAGATCAGCATTGGGGGATCTTGTGCGCCCGCAGTTAGCCTGCCGGTATCCGC
+GTGGGCTGTGGCCCTTGCCCCTCCGAGCGCTGGCTGACCTCGGTGGGCACCTCGACCTGCCGAGCGCGCC
+ACCTGTCCTGGGTTTCGGCCGCGGCGCGGTTGATCCGGTCGATCTCGCTGCGGAACACGTCGGGACGCGT
+CTCCTTGCTCGCGTAGTGAAAATACGTCAACAGACTACGTAACAGCTCCAGCTTCTGCTTTTCCCGCTTC
+GCCAGGTCGTGGGTGGTCATCAGCTCGATGCGCGCAACGGGCGGCAGGGCATCCCAGTCCAGCACCACTT
+TGGTCTCCAACGGACGCCGTCCGCGCCGCCAGAACCGCCATCGGCGCGGCTGCTCGGGTCGGTCGTAGTA
+GGTCACCGTGCCCGGGAAGCGAGACTCGATGCCCCGCCCGATCTCGGCGCGATCGAGCGCTGAATCCCAC
+ACCATCCGCCACTCCTGACCGGGAGCCAGCATCGGCAACTCTTGGGGCAGCCGAAGTTCCACGACATCGG
+CGTAGCCGTTGGCGGCATTCTCGTATTGGGCCACGGTTGGTGGGTTGGGGAACGAGAACCGGACGTCGTA
+GGCGGCTGTGCGACCGAAGTTGCGGACTACCAGCTCGATCACGTGCCAGTCCGCGACGTGGGGCTCCATA
+AACATGGCCACGTAGGGCCGAGTCTGCTCCGCAGCCAGTCGACGATTGCGTTGGATTTGCCGCTTGGTCA
+CCACCAGGGCGACCACACCGAGCCCAAGCGCCGCCCACGCCAACCAGGTGCCGGAGTCGACGCCGGTGAC
+CTCATGCCAGCTGCTCAGGACCCACCCCATGGAATCCACCATCCGCTTATACCACAGTGACATCGGACCG
+AGAAGTTAGCTGACAGGATCCCAGAGGCGCCTGGGCACTGGTCGCTGGCTGCCGAATCGTTGGCGGAAGC
+GCCGCTGGACACGTCGCTGGACCCGGGCCGGAACGGGAGAGGCTTGCCCAGTCCTTCAGCCGCCCATCAA
+CATTCGCCATTGATCGAGACTTGCGGGGCGATAAACGTAATTGGAACGCTTGACCTCCGACAGCGACGCA
+CTTGGCTCGGCCGAATACCAGTGCCCGGGAAAGACGGTTGGGTCACCCGGAAGCTCGGCGAGCTGTCGCA
+GGCTGCGGTACATCTCGTCGGAATCACCGCCGGGAAAGTCTGTGCGTCCACAGCCTTCCAGGAATAGCGT
+GTCACCGGCGACCAGCCGGCCGTCGAGTAGAAAGCACTGACTGCCTGGGGTATGCCCGGGTGTGTGCAGC
+AGCTCGATGTCGATGTCGCCGACGCTGACCTTGTCCCCATGCTCATGGGTGATCAGGTCGCCGACAGGAA
+TCCCAGTGACTCGCGAAACCCACAGCGCTTCATGGGTGTTCACGTGCACGGGTACAGATGCCCGCTCCAG
+CAGCTCAGCCAGTCCCGGCAGCTGAAAACCCATCATCGAGCCGCCCACATGGTCTGGATGATGGTGGGTC
+ACCAGCACACCCGATAGCTGCATATCGTCGGATTCGAGCGCGTCGAGCAGATCCCCGGCAGCGTAGGCCG
+GGTCGACCACCACGCAGTCCCCGGTTGTGCGATCTCCGATCAGGTAGGCAAAGTTGCGCATTTGCGTCGC
+GAACATGTCGCCGACGGCGAAATCGCGACCGGAGAGCAGTTGACGGAAGTACAGCCGGTCCTTGGACACG
+CAACCAGCCTATGTCTTGTCCATCGCCGCCCAGACCGCGTCTTGGCGTTTGCAGCCCGGGACACGTTAAT
+GCGGAGTCTTGGGGTCTGACTGTGGGTGCGGTGGGTATCTTTGGTCCATGCTGAAGAGGGTCGAGATAGA
+GGTTGATGACGACCTTATCCAAAAGGTCATCCGGCGGTACCGTGTGAAGGGTGCGCGCGAGGCTGTCAAC
+CTTGCGCTGCGAACGTTGCTCGGCGAGGCGGATACCGCGGAGCATGGGCACGATGACGAGTACGACGAGT
+TCAGCGATCCCAATGCCTGGGTTCCGCGGCGGAGCCGCGACACAGGGTGATCCCGTCCAATCTTGGACGA
+CTTGGTCCGTAGCTGCATGGGTGGCACCGGTGGTTTGGTGGCGTTGCGCGCCAGGCTGTACCCTCTTTTA
+GGCCCGCGGCACGACCCGACTGGTCGCTACGGGTGAGCGGCCCCCTTAGCTCAGTCGGCAGAGCGTTTCC
+ATGGTAAGGAAAAGGTCAACGGTTCGATTCCGTTAGGGGGCTCGGCGGACGCCGGGCAGGCTGGCGGTGC
+GTACCAGAGGCGATGTAGCTCAGTCGGTTAGAGCGAACGACTCATAATCGTTAGGTCGCCGGTTCGAGTC
+CGGCCATCGCTACAACACAACAGCAAGACTCGTTAGAGAGAACGGATATGGCTTCCAGTACCGACGTGCG
+GCCGAAGATCACTTTGGCATGCGAGGTGTGCAAGCACCGTAACTACATCACCAAAAAGAACCGCCGCAAC
+GACCCGGACCGGCTGGAGCTGAAGAAGTTCTGCCCGAATTGCGGCAAACACCAGGCGCACCGCGAGACGC
+GGTAACCGCCGACCCGCGAGCAGTTGCTGAGACTGACTAGGTAGGTTCTACAGCCGTGGCGTTGAGCGCA
+GACATCGTTGGGATGCATTACCGGTATCCCGACCACTACGAGGTGGAGCGGGAGAAGATTCGCGAGTACG
+CCGTCGCCGTTCAAAACGACGACGCGTGGTATTTCGAGGAGGACGGCGCCGCCGAACTCGGGTATAAGGG
+CTTGCTGGCTCCGTTGACGTTTATCTGTGTGTTCGGCTACAAGGCCCAGGCGGCGTTCTTCAAGCATGCG
+AACATCGCGACCGCGGAGGCGCAGATCGTCCAGGTAGACCAAGTGCTGAAATTCGAGAAACCGATCGTGG
+CGGGCGACAAGCTGTACTGCGACGTCTATGTGGATTCGGTGCGTGAGGCGCACGGCACCCAGATCATCGT
+GACCAAGAACATCGTCACCAACGAGGAAGGTGACCTCGTGCAGGAGACCTATACGACCCTGGCGGGCCGT
+GCCGGCGAGGATGGAGAGGGATTTTCTGATGGCGCTGCGTGAGTTCAGCTCGGTGAAGGTCGGAGACCAG
+CTTCCGGAGAAGACCTACCCGCTGACCCGCCAGGATCTGGTGAACTACGCCGGAGTTTCGGGTGACTTGA
+ACCCGATTCACTGGGACGACGAGATCGCCAAGGTCGTCGGGCTGGACGCCGCGATCGCTCACGGCATGTT
+GACGATGGGGATCGGCGGTGGCTACGTCACATCCTGGGTTGGCGACCCGGGCGCGGTCACCGAGTACAAC
+GTGCGGTTCACTGCGGTGGTTCCGGTGCCCAATGACGGCAAGGGCGCCGAGCTGGTGTTCAACGGTCGGG
+TGAAATCGGTTGATCCTGAGAGCAAGTCGGTGACCATCGCACTCACCGCTACTACCGGCGGCAAGAAGAT
+TTTCGGGCGGGCCATCGCCTCGGCGAAGTTAGCGTAGTTTATGGCGCTCAAGACCGATATCCGCGGGATG
+ATTTGGCGGTACCCGGACTACTTCATCGTGGGCCGTGAGCAATGCCGCGAGTTTGCCCGAGCTGTCAAGT
+GCGACCACCCGGCCTTTTTCAGCGAGGAAGCGGCCGCCGACCTCGGTTACGACGCGCTGGTTGCTCCGCT
+GACCTTCGTGACGATCCTCGCCAAATATGTGCAACTGGACTTCTTCCGCCACGTCGACGTGGGCATGGAG
+ACGATGCAGATCGTTCAGGTCGACCAGCGGTTCGTGTTCCACAAACCCGTGCTCGCCGGGGACAAGTTGT
+GGGCTCGGATGGACATCCATTCGGTGGACGAGCGGTTCGGCGCAGACATCGTCGTTACCAGAAACCTCTG
+CACCAACGACGACGGTGAGCTGGTCATGGAGGCCTACACCACGCTGATGGGCCAGCAGGGTGATGGTTCC
+GCCAGACTCAAATGGGACAAGGAATCCGGGCAGGTCATCAGGACCGCGTAATTAGCAACTGGCCGCTGCG
+GCCATGTACACTCGGACCTCGGGGTTTTCCCAACATCGGCGCGCTTTCCGTGAGTTCAACGAGCGGAGTG
+TCGTCTCCACTTTCGGTTCGCGATCACCGAACGGAGGGCGCGCGTGTCATGTGAGCCCCGGCGTAGTGGG
+TTGGCCAGGGCCTGGTCTGGTCTTGCCTGCCAACCGCGAAGGGGCGTAGCTCAACTGGCAGAGCAGCGGT
+CTCCAAAACCGCAGGTTGCAGGTTCAAGTCCTGTCGCCCCTGCTGAAGGCGAACGTTCGACGACGATGCA
+GGCACGGCCTGAAGAGGAGACGGACCATAGGTATGTGCCATGGTGGACACTGGAAGGTGCCCCACCAGAG
+CGGAACGGCTCGCGGGGTAGCTAGTAAACGAAGGAGCATGCGGTGAGCGACGAAGGCGACGTTGCCGACG
+AGGCCGTAGCCGACGGCGCCGAGAATGCGGACAGCCGCGGGAGCGGTGGCCGGACGGCCCTGGTGACAAA
+GCCGGTGGTGCGGCCGCAACGTCCCACCGGCAAGCGGTCGCGGTCGCGTGCGGCAGGAGCCGACGCAGAC
+GTCGACGTCGAAGAGCCGTCGACCGCGGCTTCGGAAGCTACCGGGGTCGCCAAGGACGATTCGACCACCA
+AGGCCGTGTCGAAGGCTGCCAGGGCAAAAAAGGCCAGTAAACCGAAGGCCCGGTCGGTTAACCCGATCGC
+ATTCGTCTACAACTACCTCAAGCAGGTCGTTGCCGAGATGCGGAAGGTAATCTGGCCGAACCGCAAACAA
+ATGCTTACCTACACGTCGGTGGTGCTGGCGTTTCTGGCCTTCATGGTGGCGCTGGTCGCCGGTGCTGACT
+TGGGCCTGACCAAGCTGGTGATGTTGGTGTTCGGCTGAGGCTCGAGAGTGACAGAGAGGACTGAAAACCG
+TGACTACCTTCGACGGTGACACGTCCGCGGGTGAGGCGGTCGATCTAACAGAGGCCAACGCCTTCCAGGA
+TGCAGCGGCCCCGGCTGAAGAGGTCGATCCGGCCGCCGCGCTCAAAGCGGAGCTGCGCAGCAAGCCCGGC
+GACTGGTACGTCGTTCACTCCTACGCAGGGTACGAGAACAAGGTCAAGGCCAACCTGGAAACCCGGGTGC
+AGAACCTTGATGTCGGCGACTACATCTTCCAGGTGGAGGTGCCCACCGAAGAGGTCACCGAGATCAAAAA
+CGGCCAACGCAAGCAGGTCAACCGTAAGGTGCTGCCCGGCTACATTCTGGTGCGGATGGACTTGACCGAC
+GACTCCTGGGCCGCGGTGCGTAACACGCCGGGGGTCACGGGGTTCGTTGGGGCAACATCTCGCCCGTCAG
+CGCTCGCCCTCGACGACGTGGTGAAGTTTCTGCTTCCGCGGGGGTCGACGAGGAAGGCTGCCAAGGGTGC
+GGCCAGCACGGCTGCCGCCGCCGAGGCGGGCGGGCTAGAGCGTCCGGTCGTCGAGGTCGACTACGAGGTG
+GGCGAATCGGTAACCGTCATGGACGGGCCGTTTGCCACATTGCCGGCCACGATCAGCGAGGTCAACGCCG
+AACAGCAGAAACTCAAGGTGCTGGTCTCCATCTTCGGCCGCGAAACACCGGTGGAGCTGACCTTTGGCCA
+AGTCTCCAAGATCTAGCCCAGCAGGGCAGGCCACACAGGCTGAAACAAGGAAGGACATCGACACGTCATG
+GCCCCGAAGAAGAAGGTCGCCGGGTTGATCAAGCTGCAGATCGTGGCGGGCCAGGCCAACCCTGCCCCGC
+CAGTGGGCCCCGCGCTCGGTCAGCACGGCGTCAACATCATGGAGTTCTGCAAGGCGTACAACGCCGCGAC
+GGAGAACCAGCGCGGCAACGTCATCCCGGTGGAGATCACCGTTTATGAAGACCGTAGCTTCACTTTCACG
+CTGAAGACGCCGCCCGCCGCCAAGCTGCTGCTTAAGGCCGCTGGTGTGGCGAAGGGTTCGGCGGAGCCGC
+ACAAGACCAAGGTCGCCAAAGTCACCTGGGATCAAGTCCGCGAAATCGCCGAGACCAAGAAGACGGACCT
+CAACGCCAACGACGTCGACGCTGCGGCCAAGATCATCGCCGGTACCGCTCGGTCGATGGGCATCACCGTC
+GAATAGGGCCCTACCCGTGGGAGGGCCAGCTTCGGCCCGCTGAGTAACCACGACCCATAGATTGGATATC
+AAATGAGCAAGACCAGCAAGGCATATCGCGCCGCCGCCGCGAAGGTGGACCGCACCAACCTCTACACCCC
+GCTGCAGGCGGCCAAGCTTGCCAAAGAGACCTCGTCGACCAAGCAGGACGCGACCGTCGAGGTGGCGATC
+CGGCTTGGCGTCGACCCGCGTAAGGCAGACCAGATGGTTCGCGGCACGGTCAACCTGCCACACGGCACTG
+GTAAGACTGCCCGCGTCGCGGTATTCGCGGTTGGTGAAAAGGCCGATGCTGCCGTTGCCGCGGGGGCGGA
+TGTTGTCGGGAGTGACGATCTGATCGAGAGGATTCAGGGCGGCTGGCTGGAATTCGATGCCGCGATCGCG
+GCACCGGATCAGATGGCCAAAGTCGGTCGCATCGCTCGGGTGCTGGGTCCGCGCGGCCTGATGCCCAACC
+CGAAAACCGGCACCGTCACCGCCGACGTCGCCAAGGCCGTCGCGGACATCAAGGGCGGCAAGATCAACTT
+CCGGGTTGACAAGCAGGCCAACCTGCACTTCGTCATCGGGAAAGCGTCGTTCGACGAGAAGTTGTTGGCG
+GAGAACTACGGCGCGGCGATCGACGAGGTGCTGCGGCTCAAGCCGTCCTCGTCGAAGGGCCGCTACCTGA
+AGAAGATCACCGTGTCGACGACGACGGGCCCGGGCATTCCGGTCGACCCATCCATCACCCGCAACTTCGC
+GGGGGAGTAGTTTCCCCGGCGAGCAGACGCATAAGCCCCCGCACGCACGGCGTGTCGGGGGCTTATGCGT
+CTGCTCGCCGGGCTTAGGCCGCGGCACCTGGCTTGAGGTAGGTCACCAGGCTGCAGTCGAGCATCTCGTC
+GGTGAAGTAGTGCTCGCAGCCACGCAAATACTTCATGTAGCGGTTGTAGACCTCTTCGGAGGTGACCTCG
+ATGGCCTTGTCCTTATTGGACTGCAGCGTGTCCCCCCAGATCCGCAGCGTCTTGATGTAATGCGGGCGCA
+ACGAGAGCGGCTCCGGGACGGTGAAACCGGCCTTCTCGCCGTGTTCGACCATCATCTCGGTGGACGGCAG
+GCGGCCGCCGGGAAATATCTCGGTGACGATGAACTTGATGAAACGCGCCGTCTCGAAGCTCAGCTTCTTA
+CCGCGGGCCGCCATCTCGTAGGGGTGGTAGCTGACGCTGCTCTGGACGGTCATCCGGCCGTCGGCGGGCA
+TGATGTTGAAACACCGCTTGAAGAAGTCGTCGTAGTTCTCGTGCCCGAAGTGCTCGAAGGCTTCGATCGA
+CACAATCCGGTCGACGGGTTCGGCGAAATCCTCCCAGCCTTGCAGCAGCACTTGACGTGAGCGGTTGGTG
+TCGATCGAAGCCAGCACTTGCTCGCAGCGGGCGTGCTGGTTCTTGGACAACGTCAGGCCGATGACGTTAA
+CGTCTAACCGCTCGACGGCGCGCCTCATGGTGGTGCCCCAACCGCACCCAATGTCCAGCAGCGTCATGCC
+CGGCTTGAGGTCCAGCTTGTCCAGGTTGAGGTCGACCTTGGCGTATTGGGCTTCTTCGAGCGTGAGCTCC
+GGTGGCTCGAAGTAGGCACAGCTGTAAGTTCGGGTCGGGTCCTGGAACAGGGCGAAGAAATCATCGGAGA
+CGTCGTAGTGCGCTTGGATGTCTTCGAAGCGTGTCCGTGTCTTGGTTGGGCTAATCGGTTTCTCGGCCAT
+TCTCGTCATGTTCTCCTGGATGGTGTCAGTTACCGGTGGCTGTGCACCCATAGCCCGTCGGTGGCACGAA
+AGTCTACTTGGCCAGCGTGAACTGGTTGCAGTCGATGTAGCCCATTCGGAACGCCTTGGCGCAGCCGGTC
+AGGTATTTCATGTACCGCTCGTATACCTCTGCGGACTGGATCTCGATGGCCTCGTCCTTGTGCGCTTGAA
+GCGCCTCGGCCCACAGGTCAAGAGTCCTGGCGAAGTGCGGTTGCAGGGACTGGATATCGGTAATGGTGAA
+ACCGGCCTTCGTCACATGCTCCTCGATCGTCTCGATCGTCGGCAACCGGCCGCCCGGGAAGATGTCGGTC
+ACGATGAACCGGATGAATTTGGCCATCTCCATGGTCAACGGTATGCCGCGCTCGATGACCTGCTTTACGT
+GCAAGCCGGTGATCGAGTGCAGCAGCATCACGCCGTCCGCGGGCATCGCGTTGTAGGCGAACTTGAAGAA
+GTCATCGTAGCGCTCGAAACCGAAGTGCTCTATCGCTTCGATGGTTACGATGCGGTCCACCGGCTCGCTG
+AAGTTGGCCCAGTCGCTCAGCAGTACCCGGTGCGAGCGGTTGGTGTCGACCTTGTCGAGCACTTGCTGGC
+AGTAGGCGTGCTGATTTTTCGACAGGGTCAAGCCGACGACGTTGACGTCGTAGCGCTCGACGGCACGCTT
+CATGACCGAACCCCAGCCGCAGCCCACGTCGAGCAGTGTCATTCCCGGTTCTAGCCCCAGCTTGCCCAGG
+GTTAGGTCCAGCTTGGCGACCTGTGCTTCGTGCAAGGTCATGTCGTCGCGCTCGAAGTAGGCGCAGCTGT
+AGGTCCGAGTCGGATCCTGGAACAGCGCGAAGAACGCATCTGAAAGGTCGTAATGGGCTTGGACGTCGTC
+GACATTGGACCGAGACTTTGTGGTGCCCGTTGAGTTATCAGACATGTGTCCTCCCACTGTGAGGGGCACC
+TTCAGCAGGTGGCCATCCCCGGCACCCTACACGGTGCATGGCACATCGCCCGCATTCGCGCTCGCATGCG
+CCGGTCTTTCTCGATCGGGATTTGCCAGATATCACCCTGGCCGGCGCAATCACTACTTCGCCAGCGTGAA
+CTGGTTGACGTCGATGTAGCCGACCCGGAACAGCTTGGCGCAGCCGGTCAGGTATTTCATGTACCGCTCG
+TAGACCTCTTCGGACTGGATCGCGATGGCCTCGCTTTTGTGTTCCTGCAGCGCCTCGGCCCACAGGTCGA
+GGGTCCTGGCGTAATGCGGCTGCAGCGACTGGCGGCGAGTCAGCGTGAAACCCGTCTTCGCCGACTGTTC
+CTCAACCATTTCAATCGTCGGAGGTTGGCCCCCCGGGAAGATTTCGGTCGCGATGAACTTGAGAAAGCGG
+GCCAGCCACAACGTGAGCGGCAAGCCGTGGTCGACCATCTGCTGCCTGGTCAGGCCGGTGATCGTGTGCA
+GCAGCAACACGCCATCGGGCGGCAGGATTTTGTGGGCCCGGGCGAAGAAGTCGGCGTGACGATCGTGGCC
+GAAGTGCTCGAACGCGCCGATCGACACGATGCGGTCGACGGGCTCGTTGAACTGCTCCCATCCCGCCAGC
+AACACTCGCCTGTCGAGCGGGGTGTCCATCTCGTCGAACGACTTCTGCACATGGGCGGCCTGGTTCTTCG
+ACAATGTCAGGCCGACGACGTTGACGTCATACTGCGCGATCGCGCGCCGCATGGTGGCGCCCCAGCCGCA
+ACCGATATCGAGCAGCGTCATGCCGGGCTGCAGACCTAGCTTGCCCAGCGCCAGGTCGATCTTGGCGATC
+TGGGCCTCTTCCAGCGTCATGTCCTCGCGTTCGAAATGCGCGCAGCTGTAGGTCTGGGTCGGATCCAGGA
+ACAGCCGGAAGAAGTCGTCGGACAGGTCGTAGTGTGCCTGCACGTCCTCGAAGTGCGGCGTTAGGTCGTT
+GACCATGAGGTGTAATGCCTTTCCGGACCCTAGGTGGCCTTTCGGTGCTTGCACGGAACGCACCGATGCT
+TCCCCCTCCCCGCATGCTCGAGGCATGCTATCCGATACAGGGCCGCCGCACTAAACCGCGATCGAATTTG
+CCCAGGTCAGGGAACGGATATGAGCGGACGAGCTACTTGGTCATGGTGAACTGGGCGACGTTGATTAGGC
+CTCTGCGGAAGCGCTCCGCGCATCCGGTCAGATAGTGCATGAAGTTGTTGTAGACCTCTTCGGACTGTAC
+GGCGATGGCGCGTTCGCGGGCAGCCTGTAGGTTGGCGGCCCATGCATCGAGAGTCCGTGCGTAGTGCTGC
+TGCAGCAGCTGGACATGCTCGATGGTGAAGCCCGCGGCCTGCGCATTGTCGACAATGTCGGGCTCCGATG
+GCAGCTCGCCGCCCGGGAAGATCGACTCCCGCAGGAATTTGAGGAATCGAAGGTCGCTCATCGTCAGCGC
+AATGCCCTGTTCGTGCAGCCACCTGCGGTCGTAGGTGAACAGGCTGTGCAGTAGCATCCGCCCGTCATCG
+GGCAGGATGTCGTAGGAGCGTTCGAAGAACGTCAGATACCGCTCCTTTTTGAACGCGTCGAATGCCTCAA
+AGCTGACGATCCGGTCGACGTTCTCTTCAAACTCTTCCCAGCCCTGCAGCCGGGCCTCGGCGCGCCGTTG
+CGTTCCGATTGCGGCCAGGCGGTCTTTGCTGCGTTCATAGTGATTCCGGCTGAGCGTGAGGCCGATGACA
+TTGACGTCGTACTTCTCCACGGCCCGAACGAGCGCCCCGCCCCACCCGCAACCCACGTCGAGTAGCGTCA
+TCCCCGGTTCGAGGTTCAGCTTGTCCAACGCCAGATCCACCTTGGCCAGTTGCGCCTCTTCCAGCGTCAT
+ATCGTCACGCTCGAAATAGGCGCAGGTGTAGACCCAGGTGGGATCGAGGAACAACGCGAAGAAGTCATCC
+GAAATGTCGTAAGCCGACTGTGACTCTTCGTAATATGGTCTCAGCTTGGCCATAGGCGACAACCTCCCGC
+GCCAACCGTACAACGCCTCGCCGACCGGCTCAGCCGGCCTCAGAGAAGTTGCGCGTCAACTCGCCGATCA
+CCCGATCCCACAGCTGTCTGGGCAGGTCATGGCCCATGCCGTCGATGAGCACCAGGCGCGCGCCGTTGAT
+TGCTCGCGCGACCGCGCGGCCGCCGAACGGCCGCATCAGCTTGTCCGCGCGCCCGTGGATGACGACGGTC
+GGTGCGACGATGCGCCGGTCGTAGCGCAGCAGGCTGCCGCTGCCCAGTATCGCGCTGAACTGCTGGGCGA
+TTCCCCAGGGATGGAAGTTGCGGTCGTAGCTTTCGGCGGCCTCGGCTCGTACCTGGTCTTCGGGAATCGG
+GTAGGCCGGGCTGCCGATGATCTTGCTGACCCGGACGGCGTTGTCGACAATGACGTCGCGTGGCGAATCC
+GGCGGCGGACCCGTGAGCAGCGCCAGCAGCGCGCGTGGCGCCGGCGGTGGCAGAAACCGGTGATTGTTGC
+TGGAGAAGATGACCGCCAGGGTTTTCGTCCGCTGCGCGAATCGCGCGGCGAAAATCTGGGCGATCATGCC
+GCCCATCGACGCCCCGACGACGTGCGCGTGCTTGACGTCGAGGTGATCGAGCAACGCCGCGGCGTCGGCG
+GCCATGTCTTCCAACGTGTAGGCAGCCTGGCTGGGCAGACCGAGCCAGGACCGGACCAACCGCGTGGCCA
+GTGGCTGTCCCGGGCGGTGGCGCTCGGTCTTGGTGGACAGGCCGACATCGCGGTTGTCGTAGCGGATGAC
+GCGCAGGCCCTTCGCGACGAGCCGCGCGCAGAAGTCGGTCCGCCACAGCAGCATCTGGGCGCCCAGGCCC
+ATGATCAGCAACACCGGCGGGTGGTCGAGGTCACCCATGTCCTCGTAGTACAGCTTCACATCACCGGAGA
+CCGCGGTGCCGCTACGGATGTCCACCGAGACCTCGCCTAAACCTCGATGTCGGATTGATGTTCGCGGCTG
+ACCTCGACCATGAAGTTGGCGAAATATCCGGTCAGCTGCGGGTCCGACATCATCTGCCACCTCGGCGCCA
+GCAGCTTCATGTAGCGCTCCACGTACAGGAACTGCTTGCCGATCAGCACCAGCTCGCGGGGCAGCTTGAC
+GTCGTAGGCGTCGGCCAGCGCCGAGAGCTGGCGGCCGATGTCGGCATATGACATGTCGCCCAGCGATTGC
+ATGGTCAGCGGGGTGGCGAAGCGCTCCAGGTCTTTGGCGGCCTGGGTCTCGGGCTTCATGGTGCCGACGG
+CGCCCATGAGCACGACGATCTTGCCGGCGGCTGCGTGGTCCTTCTTCACCAGCAGCGCATACACCAGCTC
+GCGGAGTAGCCAGCGGGTGCGTGGATCGATGCGGCCCATGATCCCGAAGTCGAAGAACACGATGCGGCCC
+GCCTCGTCGACGTAGAGGTTGCCCGCGTGCAGGTCGCCGTGGAACAGCCCGTGCCGCAGGCCGCCCTCGA
+ACACCGAAAACAGCAGTGCCTTGACCAGCTCGACACCGTCGAACCCGGCCTTGCGGATCGCGGCGGTGTT
+GTCGATGCGGATGCCGTGCACCCGTTCCATCGTCAACACCCGCTCGGTGGTGAAGTCCCAGTGCACCTGC
+GGCACCCGGATGTTTTTGCCCAGCGGCGAGGCGTGTAGGTGGGAGACCCAGGCCTCCATGGACTGCGCCT
+CGAGGCGAAAGTCCAGCTCCTCGGCCAGGTTGTCGGCGAAGTCGGCGACCACGTCTTGTGCCGAGAGCCG
+CCGGCCCAGCTTGGCCAGTTCGACGGTCTGCGCGAAGCGCTTGAGGATCTGCAGGTCGGCGGCAACGCGG
+CGGCGGATGCCCGGCCGCTGGATCTTGACCACCACCTCCTCGCCGCTGCGCAGGGTCGCGTAGTGCACCT
+GGGCGATGGACGCCGACGCGAACGGCTCTTCCTCGAAGGAGGCGAACAGCCGGGCCGGCTCGTCGCCGAG
+TTCCTCGACGAAGAGCTTGTGCACCTCGTCGGTTTTTGCGGGCGGCACCCGGTCGAGCAGGCCGCGGAAT
+TCCCGCGACAGCGACTCACCGAATGCTCCCGGGCTGGACGCGATGATCTGGCCGAACTTCACGTATGTCG
+GTCCCAGATCGGCGAAGGTCTGCGGGAGCTCCTTGATCACCTTCTGTTGCCAGGGCCCTTTTCGGGGGAG
+CCTGCCGATGAACCGGACGGCGGTGCGGGTGACCTGCCAACCGGTGGCCGCCACCCGGGCAGCTTCGACC
+GGCAGCGGTACCCGGTCAAGCTTGGCCACCTCGCGGTGTGTGGTGGAACCCATCTGAGCAGTGTGCCAAA
+CCGGGGCAGACAGCTCCCAATTGACGTGAGCCCGCTCACTTGCTGGGTAAGCGTCGCCGAATGTGTAATG
+AGGGCGGAAATCCGGCCCGATTTCCGCCCTCATTACACATTCGGCGACGCTCGGTTGGCCCGCTGCTGGG
+CCGGAGGCGTTCCTTTATCGCAACGATTGGTCGCCGTAAGGTGCGGTCATGCGGGTGGTTTCGGCGGAAT
+CGACCGAGCTTTTCGTCGGCCCGTCGGATGCGCCGCTGCAGCTGGTCCGCGTCGCGGTCACCGGGTGCAC
+CGAACCGCCGCCGATCCGCATCCATGGTGACGGCTTGGCCGGCGAGGCGGCCGCCCGCCCCGGCGACGAC
+GTCATCGAGGTTGCGGTCGCGGTTGAGTCCCCGGTCGTCGGTGAGCGGCGGACCGCGCGGGTACACACCC
+CCGATGGTCCGAGCCTGGCGTTCGAGTTCACCGTGGCCGAGCCCGGCTGGACGATGTTCATGATCAGCCA
+CTTCCACTACGACCCGGTCTGGTGGAACACCCAGGGCGCCTATACCAGCCAGTGGCGCGAAGACCCGCCC
+GGGCGAGCCCGCCAGGCCAACGGCTTCGAGCTGGTGCGCGCGCATCTGGAGATGGCGCGCCGCGAGCCCG
+AGTACAAGTTCGTGCTAGCCGAGGTGGACTACCTCAAGCCGTACTGGGATACCCACCCGCAGGACCGCGC
+CGACCTGCGCCGGTTCCTCGCCGATGGCCGTATCGAAGTGATGGGCGGAACCTACAACGAACCCAACACC
+AACCTCACCAGCCCGGAGACCACCATCCGAAACCTGGTGCACGGCATCGGTTTTCAGCGTGACGTGCTGG
+GCGCCGAGCCGGCCACCGCGTGGCAGCTCGACGTGTTCGGCCATGACCCGCAATTTCCTGGGCTGGCCGC
+CGATGCCGGGCTGACGTCGAGTTCCTGGGCCCGCGGGCCACACCACCAGTGGGGTCCGGCCCAAGGCGGG
+GTAGACCGCATGCAGTTTTGCAGCGAGTTCGAGTGGATCGCGCCGTCGGGTCGCGGCCTGTTGACCCATT
+ACATGCCGGCGCATTATTCGGCGGGCTGGTCGATGGACTCGTCCACCTCGCTGGCCGACGCTGAGGCCGC
+CACCTACGCGCTGTTCGACCAGCTCAAAAAGGTCGCGCTGACCCGCAACGTGCTCCTGCCGGTGGGCACC
+GACTACACCCCGCCGAACAAGTGGGTCACCGCCATCCACCGCGACTGGGGTGCGCGCTACACCTGGCCGC
+GCTTCGTGTGCGCGCTGCCCAAGGAGTTCTTCGCCGCGGTGCGCGCCGAACTGGCCAAGCGTGGTTGGGT
+GCCGTTGCCGCAGACCCGCGACATGAACCCGATCTACACCGGCAAGGACGTCTCCTACATCGACACCAAA
+CAAGCCAACCGGGCCGCCGAGAACGCCGTCCTGGAAGCCGAGCGGTTCGCGGTGTTCGCCGCGCTGCTGA
+CCGGCGCCGAGTATCCGCAGGCGGCGTTGGCCAAGGCGTGGGTGCAACTGGCCTACGGTGCGCACCACGA
+CGCCATCACCGGCTCGGAGTCCGACCAGGTCTACCTCGACCTGCTGACCGGGTGGCGTGACGCGTGGGAG
+CTGGGCCGCGCGGCCCGGGACAACTCGCTGCGGTTGCTGTCCGGCGCGGTCGCCGCGTCGCACGATCGCG
+TCGTCGTGTGGAACCCGCTGACCCAGCGGCGCACCGACATCGTCACTGCCAGGGTCGACCCGCCGCTGCA
+GGCCGGCGTGCGGGTGTTCGATCCCGACGGGGCTGAGGTGGCCGCGCTCGTCGAGCACGACGGACGGTCG
+GTCACCTGGCTGGCGTGCGACGTGCCCTCGCTGGGCTGGCGGGTTTACCGGTTGGTGCCCGCCGACGAGG
+CGCCAGGCTGGGAATTGGTACCCGGCACCGACATCGCCAACGAGCACTATCGGCTGGCCGTCGACCCCGA
+GCGTGGCGGGGCGTTGTCGTCGCTGGTGCAGGACGGCCGCCAGCTGATCGCCGCCGGCCGGGTAGCCAAC
+GAGCTGGCCCTCTACGAGGAATACCCGTCGCACCCGACTCAGGGGGAGGGTCCGTGGCATCTACTGCCCA
+CGGGGCCGGTGGTGTGCTCCTCGGCATGCCCGGCGCAGGTGCAGGCATACCGCGGCCCGCTCGGTCAGCG
+GTTGGTCGTGCGGGGGCGGATCGGCACCCTGCTGCGCTACACGCAGACACTCACCTTGTGGGACGGCGTC
+GACCGGGTGGACTGCCGCACCAGCATCGACGAGTTCACCGGGGAAGACCGCTTGCTGCGGCTGCGCTGGC
+CGTGTCCGGTACCCGGCGCCATGCCGATCAGCGAAGTGGGGGACGCCGTCGTCGGGCGGGGTTTCGCGTT
+GCTGCACGAGGGGCCCGAATCGGTGGACACCGCCCAGCATCCGTGGACCCTGGACAACCCGGCCTACGGC
+TGGTTCGGGTTGTCCTCGGCGGTGCGGGTACGCGCCGGCGATGGGGTGCGCGCGGTGTCGGTGGCCGAGG
+TGGTGTCGCCGACGGAGACGGTGTCCGGCCCGATGGCGCGCGACCTGATGGTCGCGCTGGTCCGCGCGGG
+CGTCACCGCGACCTGCAGCGGCGCCGACAAGCCGCGCTACGGCCACCTCGATGTCGATTCCAATCTGCCG
+GACGCCAGGATCGCGCTCGGTGGGCCGGACCGCAACACGTTCACCAAGGCCGTGCTGGCCGAGGCCGCCC
+CGGCCTACACCGCCGAACTGCAGCGGCAGCTGGCGAAGACCGGCACGGCCAGGGTGTGGGTGCCGGCCGC
+GAACCCGTTGGCGCGGGCCTGGCTGCCCGGCGCGGACTTGCGGGCACCGTGCGCGCTGCCGGTGCTGGTG
+ATCGACGGCCGAGACGAGAAGCACCTGCGCGCCGCGGTGGCGTCGCTGGCCGACGACCTGGCCGACGCCG
+AGATCGTCGTGCACCAGCGGGCCGCGCCGCAAATGGAGCCGTTCGAGGATCGCACGGTCGCGCTGCTCAA
+CCGTGGGGTGCCCAGCTTCGCCGTCGACTCCGAGGGCACCCTGCACACCGCGCTGATGCGGTCGTGCACC
+GGCTGGCCCTCCGGGGTCTGGATCGACCAGCCGCGACGCACCGCCCCGGATGGCTCGAATTTCCAACTCC
+AGCACTGGACCCACCACTTCGACTACGCGCTTGTCTGCGGCGGCGGCGATTGGCGGCGCGCCGGCATCCC
+GGCGCGCAGCGCGCAGTTCTCCCACCCACTGCTTGCGGTGGCGCCGCGACGGCCACAGGGCGAGCTGCCG
+GCGGTCGGCTCGCTGCTGCACGTCGAGCCGGCCGACTCGGTGCAGCTGGGCGCGCTCAAGGCGGCCGGCA
+ACCGGCTGGCAGCCGGCAGCGCGCGGCCGGTCCAACCCGCCGCGGTGGCGCTGCGATTGGTGCAAACGAC
+AGGAGCCGACACCCCGGTCACCATCGGCTGCGAGCTGGGCAAGGTAGGCGCCCTCCGGCCGGCCGACCTG
+CTGGAAACGCCGCTCGCAATGGCAAGGGCGCGCAAGTCGTCCATCGACCTGCACGGCTATCAGGTCGCCA
+CCGTGCTGGCCCGGCTCGACGTGGCCGCTGATATGGCTAACGTGCTGGCGGCCGACGACGTGGCGTTGGC
+GCCGCACGCCGAGACCGCTCAGCCGCAGTACGCGCGCTATTGGCTGCACAACCGCGGCCCGGCGCCGCTG
+GGCGGGCTGCCCGCGGTCGCCCACCTGCACCCGCGGCGGGTGCGCGGCCAGCCCGGTGACGACGTGGTGC
+TGCGCCTGACCGCGGCCAGCGACTGCACCGATTCGGTGCTGGGCGGCGTGGTCGACGTCGTGTGTCCGCT
+CGGCTGGCCGGCCACACCGGCTCGGTTGCCGTTCACGCTGGGCGCCGGGGCGCACCTGCAGGCCGACATC
+GCGTTGAGCATTCCCGCCGGCGCGCCGCCGGGACCGTATCCGGTCCGCGCGCAGCTGCGCGTCGTCGACA
+CGGCGGTACCGGCCGCCTGGCGCCAGGTGGTCGAGGACGTGTGCGTGGTCACCGTCGGCGCCGACTCCGA
+TCTGGAGGAGCTGGTCTACCTCGTCGATGGGCCGGCCGACATCGAGCTGGCCGCCGGCGACCGGGCCCGG
+CTGGCGGTGACGATCGGCAGCCGCGCTCACGCCGAGCTGGCCCTGGATGCGCACTCGATCAGCCCCTGGG
+GCACCTGGGAGTGGATCGGCCCGCCCGCGCTCGGCGCCGTGCTACCCGCCCGGGGCATGGCCAAGCTGGC
+TTTCGATGTGACCCCGCCGGCCTGGCTGGAGCCCGGGCAGTGGTGGGCCCTGGTTCGGGTCGGTTGCGCG
+GGTCAGTTGGTCTATTCGCCGGCGGTGAAGGTGAGCGTGACATGAGCGGGCGAAGCCGATTGCCCGGCTC
+CTCCTCACGCCGCGACGCGGCGCGCATCGTCGCCGAGCGGGTGGTCGCGACCGTCGCCGGTGTCGCGGTA
+GCGGTCGACGAGGTCGACGCGGCCGAAGCGCGGCTGCGCGACGGACCGCGCGCGGCCGCGCTGCCGGCGA
+GCGGCACCAGCGAGGGACGCCAACTGCGGCGCTGGCTCACCCAACTGATCGTGACCGAGCGGGTGGTAGC
+CGCCGAGGCCGCCGCACGTGGTCTGACCGCGGCGGGCGCCCCCGCCGAGGCGGACCTGCTGCCCGACGCG
+ACGGCTCGGCTGGAGATCGGCAGCGTCGCCGCCGCGGTGCTGGCGGATCCTTTGGCGCGGGCGTTGTTCG
+CCGCCGTCACCGCGCGGGTCGCGGTCACCGACGACGCCGTGGCCGACTACCATGCCCGCAACCCGCTGCG
+GTTCGCCGCGCCATGTCCCGGCCAGCACGGCTGGCGTGCCCCGGCGGCGGCCGCCCCACCGCTGGATCAG
+GTGCGCCGCGCGATCACCGAGCATCTGTTGGGGGCCGCGCGCCGCCGCGCCTTCCGGGTGTGGCTGGACG
+CGCGCCGGAACGCCCTGGTGGTGCTGGCCCCCGGCTATGAGCACCCCGGCGACCCGCGCCAACCCGACAA
+CACCCGCCGGCACTGATGCTCACCCTTTGCCTCGACATCGGCGGCACCAAGATCGCCGCGGGCCTGGCCG
+ACCCGGCCGGCACGTTGGTGCACACCGCCCAACGTCCCACCCCGGCGTATGGCGGAGCCGAACAGGTCTG
+GGCCGCGGTCGCCGAGATGATCGCCGACGCGCTCGGCGTGGCGGGGGGCGCGGTCGGTGGTGTGGGGATC
+GCCTCGGCCGGTCCTATCGACCTACACAGCGGCCGCGTCAGCCCGATCAACATCGGATCCTGGGGCGGCT
+TTCCGCTGCGGGATCGGGTCGCCGCCGCGGTCCCGGGGGTTCCGGTGCGGCTGGGGGGTGACGGGGTGTG
+CATGGCGCTCGGCGAGCACTGGCTGGGAGCCGGACGGGGTGCGCGCTTTCTGTTGGGTTTGGTGGTGTCC
+ACCGGGGTGGGCGGCGGGTTGGTGCTCGACGGCGCCCCCTGTCTCGGCCGCACCGGCAACGCCGGTCACG
+TCGGCCACGTGGTGGTGGATCCGGATGGCTCGCCGTGCCCGTGCGGGGGGCGTGGCTGTGTGGAGACCAT
+CGCGTCCGGCCCGTCGCTGGCGCGCTGGGCGCGGGCCAACGGCTGGTCCGCGCCGCCCGGGGCCGGCGCC
+AAAGAGCTGGCCGAGGCGGCTGGGGCCGGAGACCCGGTGGCGCTGCGGGCCTTCCGCCGCGGCGCCGCGG
+CGCTGGCCGCGATGATCGCCTCGGTGGGCGCCGTGTGCGACTTGGATCTCGCCGTCATCGGCGGCGGCGT
+GGCCAAGTCGGGTCGCCTGCTGTTCGAGCCGTTACGTGCGGCGCTAGCCGACCACGCCCGGCTGGACTTT
+CTGGCCGGCCTGCGGGTGGTGCCTGCCGAGCTGGGCGGCGCCGCCGGCCTGGTGGGTGCGGCCAGGCTCG
+CGGCCATCGCATAATGCCGATTGTGAATCTGGCGACGCGACACGCCGGTGCGGCGTCGCGGGATTCACAC
+TCGGCGATACGTGTCGCCGTTTTGGCTGACCGGACCGGGCCAGGCTATTGTGGTTGCCGATCCACCGAAG
+ACCGTCGGTCACCGAGCAATCGGTTGAAGGTCCGGGAGCATCCCGGCGACCCACGCAGGAGGACGAGGCA
+GCACCGCCGGCGCGCGCCGGCCTAGTTCCACGCCCCGACCGCTTCCTGCGTCGGGGCGTTCGTCGTTCCC
+GGGTGGTCGCAGACGGCACGTCGTACCCCGACTGCCACCAGACTTGCACCGTCAGGAGGTATGCATGGCC
+AGGGCTGACAAGGCCACCGCCGTCGCAGACATCGCAGCGCAGTTCAAGGAGTCGACCGCGACGTTGATCA
+CCGAATACCGCGGCTTGACGGTGGCCAACCTGGCCGAGCTACGCAGGTCTCTGACGGGGTCGGCGACCTA
+CGCGGTGGCCAAAAACACACTCATCAAGCGGGCGGCCTCCGAGGCCGGCATCGAGGGCCTCGACGAACTG
+TTTGTGGGCCCCACCGCGATCGCGTTCGTCACCGGTGAGCCGGTCGACGCCGCCAAGGCCATCAAGACCT
+TCGCCAAGGAGCACAAGGCGCTGGTCATCAAGGGCGGCTACATGGACGGCCACCCATTGACCGTGGCCGA
+AGTCGAGCGCATCGCCGACCTGGAGTCCCGCGAGGTGTTACTGGCCAAGCTGGCCGGTGCGATGAAGGGC
+AACCTGGCCAAGGCGGCCGGGTTGTTCAACGCGCCGGCCTCGCAGCTGGCCCGGCTCGCGGCCGCCCTGC
+AGGAAAAGAAGGCCTGCCCAGGCCCAGACTCAGCCGAGTAGTCACCCAGTACCCCACACCAGGAAGGACC
+GCCCATCATGGCAAAGCTCTCCACCGACGAACTGCTGGACGCGTTCAAGGAAATGACCCTGTTGGAGCTC
+TCCGACTTCGTCAAGAAGTTCGAGGAGACCTTCGAGGTCACCGCCGCCGCTCCAGTCGCCGTCGCCGCCG
+CCGGTGCCGCCCCGGCCGGTGCCGCCGTCGAGGCTGCCGAGGAGCAGTCCGAGTTCGACGTGATCCTTGA
+GGCCGCCGGCGACAAGAAGATCGGCGTCATCAAGGTGGTCCGGGAGATCGTTTCCGGCCTGGGCCTCAAG
+GAGGCCAAGGACCTGGTCGACGGCGCGCCCAAGCCGCTGCTGGAGAAGGTCGCCAAGGAGGCCGCCGACG
+AGGCCAAGGCCAAGCTGGAGGCCGCCGGCGCCACCGTCACCGTCAAGTAGCTCTGCCCAGCGTGTTCTTT
+TGCGTCTGCTCGGCCCGTAGCGAACACTGCGCCCGCTCGGGTGAATCTCCCAGCGCGACAAGCAGGTTCA
+CCGTCATCGCGGCGAGCACCGGTTCGACGGCCGCGCCTCGATCGCCGTAGAAGCCGGCCAGCTCGAGCAT
+CACGAAGCCGTGGATCTGTGACCAAAACTGCGCCGCGGTGGCAACTATTGCCGTGTCGTCGTCGGCTCCA
+AGCGCGGTCGCGAACCGGCCGGCCAGCAGGCACCGGTGCACCGCTCGCACCACATGCGCGAAACTGGGGT
+GCTGGTGTTCGATCTCGGCAACCTTGAGGGTCAACACGTCGCGCGCTGGCACGTTGATGCCGTGTGCGCT
+GGTGCTGCCGAACATTAGCCGGTACATGTGCGGGCGCTCGATGGCGTAGCGCCGGTAGGCGGTGCCGATG
+GCCAGCAGGTCGGCGACCGGATCGGCGGTCTGCGGGACCGTCAGCGCGACATCGAACTGGCGTAGCCCTT
+CTTCGGCTATGGCGGCGATCAGTCCGCGCATCCCGCCGAAATGGGTGTACACCGCCATCGTCGAGGTGCC
+TGCTGCGGCGGCCACCTTGCGGGTCTGCAGCGCGTCGGGCCCGTGATCGTCGAGCAGTCGCACGCCGGCG
+TGCAGCAGCTCGTCGCGAACACCGGTCTGCGAGGTCATCCTTGCCATGTTCTCACCAAGGGCGTACCGTT
+CCAATATCAGTGAAATAACAATGTTATAGGAGATCGGCATGACCACCGCACAAGCCGCCGAATCCCAAAA
+CCCATATCTCGAGGGCTTCCTGGCGCCGGTGAGCACCGAGGTAACTGCCACCGACCTGCCGGTCACCGGC
+CGCATTCCGGAACACCTCGACGGGCGTTATCTGCGTAACGGCCCCAACCCGGTCGCGGAGGTCGACCCGG
+CCACCTACCACTGGTTCACCGGCGACGCCATGGTGCACGGAGTCGCGCTGCGCGACGGGAAGGCCCGCTG
+GTATCGCAATCGCTGGGTCCGCACACCCGCGGTGTGCGCCGCCCTGGGCGAGCCCATTTCGGCCCGGCCT
+CACCCGCGCACCGGGATTATCGAGGGCGGTCCCAACACCAACGTGCTGACCCACGCCGGACGCACCCTGG
+CCTTGGTTGAGGCCGGCGTGGTCAACTACGAACTCACCGATGAGCTGGACACCGTGGGACCCTGTGACTT
+CGACGGCACCCTGCACGGCGGTTACACCGCCCATCCGCAGCGTGATCCGCACACGGGTGAACTGCACGCG
+GTGTCCTACTCGTTCGCCCGCGGACACAGAGTGCAGTACTCGGTGATCGGCACCGACGGACACGCTCGTC
+GGACGGTTGATATCGAGGTGGCGGGATCGCCGATGATGCACAGCTTCTCCCTGACCGACAACTACGTGGT
+GATCTACGACCTGCCGGTGACCTTCGACCCAATGCAGGTGGTGCCGGCGTCCGTGCCACGCTGGCTGCAA
+CGGCCCGCCAGGTTGGTGATCCAGTCGGTCCTGGGCCGTGTCCGCATCCCCGACCCGATAGCGGCGTTGG
+GCAACCGGATGCAGGGTCACTCCGATCGCCTCCCGTACGCCTGGAACCCCAGCTACCCGGCGCGCGTCGG
+TGTCATGCCGCGCGAGGGTGGCAACGAGGACGTGCGGTGGTTCGACATCGAACCCTGCTACGTATACCAC
+CCACTTAACGCCTACTCGGAGTGCCGGAACGGCGCTGAGGTGCTGGTGTTGGACGTGGTGCGCTACTCAC
+GGATGTTTGATCGCGACCGGCGGGGTCCCGGCGGTGACAGCCGGCCCTCGCTGGATCGCTGGACCATCAA
+CCTGGCGACCGGTGCGGTGACCGCCGAATGCCGCGACGATCGGGCGCAGGAGTTTCCCCGCATCAACGAG
+ACTCTGGTGGGTGGGCCGCATCGCTTCGCCTACACCGTCGGCATCGAGGGTGGGTTTCTCGTCGGCGCCG
+GCGCTGCGTTGTCGACTCCGCTGTATAAACAGGACTGCGTGACCGGGTCCAGCACGGTCGCCTCGCTCGA
+TCCCGACCTGCTGATCGGCGAGATGGTGTTCGTGCCGAACCCGTCGGCGCGTGCAGAAGATGACGGGATT
+CTCATGGGCTACGGCTGGCACCGCGGCCGCGACGAAGGCCAGCTGCTCTTGCTGGATGCCCAGACTCTCG
+AGTCGATCGCCACCGTGCACCTGCCACAGCGTGTGCCGATGGGCTTCCACGGCAACTGGGCGCCGACCAC
+CTGACGGCGCCTCGGGTGCGATACAGTGACTCATACCACACAACGGGCCGGTGGCAGCCACGAGCGTCGA
+CAGAAGGGTTTCCCATGGGCGTCAGCATCGAGGTCAACGGACTAACGAAGTCCTTCGGGTCCTCGAGGAT
+CTGGGAAGATGTCACGCTAACGATCCCCGCCGGGGAGGTCAGCGTGCTGCTGGGCCCATCGGGTACCGGC
+AAATCGGTGTTTCTGAAATCTCTGATCGGCCTCCTGCGGCCGGAGCGCGGCTCGATCATCATCGACGGCA
+CCGACATCATCGAATGCTCGGCCAAGGAGCTTTACGAGATCCGCACATTGTTCGGCGTGCTGTTTCAGGA
+CGGTGCCCTGTTCGGGTCGATGAACCTCTACGACAACACCGCGTTCCCCCTGCGTGAGCACACCAAGAAA
+AAGGAAAGCGAGATCCGTGACATCGTCATGGAGAAGCTGGCCCTAGTCGGCCTGGGTGGGGACGAGAAGA
+AGTTCCCCGGCGAGATCTCCGGCGGGATGCGTAAGCGTGCCGGCCTAGCGCGTGCCCTGGTCCTTGACCC
+GCAGATCATTCTCTGCGACGAGCCCGACTCGGGTCTGGACCCGGTTCGTACCGCCTACCTGAGCCAGCTG
+ATCATGGACATCAACGCCCAGATCGACGCCACCATCCTGATCGTGACGCACAACATCAACATCGCCCGCA
+CCGTGCCGGACAACATGGGCATGTTGTTCCGCAAGCATTTGGTGATGTTCGGGCCGCGGGAGGTGCTACT
+CACCAGCGACGAGCCGGTGGTGCGGCAGTTCCTCAACGGCCGGCGCATCGGCCCGATCGGCATGTCCGAG
+GAGAAGGACGAGGCCACCATGGCCGAAGAGCAGGCCCTGCTCGATGCCGGCCACCACGCGGGCGGTGTCG
+AGGAAATCGAGGGCGTGCCGCCGCAGATCAGCGCGACACCGGGCATGCCGGAGCGCAAAGCGGTCGCCCG
+GCGTCAGGCTCGGGTTCGCGAGATGTTGCACACGCTGCCCAAAAAGGCCCAGGCGGCGATCCTCGACGAT
+CTCGAGGGCACGCACAAGTACGCGGTGCACGAAATCGGCCAGTAAGGCGCGCGGGGATGCGACCGCCGGA
+CCGCCGCAATCGGATGATTTCGCGTAACTTGCCGCATATCACCCGGAGACCGAATCGGGTCGGCCGCTGG
+AGGCGGCGCCTGTTCGGGAGCTGATCACGCAACGTTTGTATCTGCTGCCGACCTTCCGTTGGCGGCTCGC
+GTAGGTGGCACAGTCCGCGAAGTGCTTGGGCCGCTGATCAAGGCGCTCCCGGAGCACAATCCAGACATGT
+CAGGCCGTCACCGACGCACAGGCGACGGCCCTCGAGCAGCGTGGGAAGAGCCGGGCTCGTCGAGTGGATC
+ACACATTTCGAGGCGCTCTCGTGTATCGAGCGGCACATCAGCCATGCGTGTCTCCTTGTCCTGCCTTCTC
+CAGAGGAAACCGCTAGTCGTCGGCGCTGACGACCCTCCGCACTCTGATGTCGGGAAGGTGACGCTCTGCG
+AGTTCGTAGTCGGCATCGTCGTGGAGGACTACTAGGCCCCTGGCCGCCGCAGTGTCGCAGATCAGCAGAT
+CGACAACCGACAGGGCACCCACCGCTCCCGCCCGGGCGAGGCGGTGCTGTGCCGAATCGATCCACCGCCA
+CACGGATTTCGGCACTGGCACATCGGGGTAGACGTCACCAAACATCCGGCTCATCTGGTCGAACTCGTCC
+GCATTCCGCGCTGATCGGCAGAACTCGGCTCGTTGCGGTTCGCACGACCCGACGGCCCGCTGAGCAGCGC
+GGAGTTCCAGGCCTCGGTGGGTTCCGGTTGTCGTTGCAGCCGCCAAACCGCTGAGGAATCCACCAGGAAA
+TAGATCAAATCCCGAGGGCCTTCTCGTCGTCCCGCGCGGCCACCCAGCCCTTGTAGTCCCAGCCTTTCGC
+CTACTCGCGCGAGCGGGCCAGGGCCTCGATGCGCCGAAACCGTTCGACGTAATCGCGCATCGCGAGGTTC
+ACGGCTTCCTTCTTTGTGTGCACGGCGGCGATGCGCATCACATCGGCCAGCGCTTCGTCGTCGAGGTCGA
+TCTGGGTCACCGACACGACGGCCTCCTATGTTGAAGACATATCACATAAACATACGTAACCAACATCGCG
+AGGAGACCGTCTCGCGCCTGCTCAGGGCAACGATATGGCGCCAGTCAGACCAAGCAGCAATACGATCCCG
+GGCAATAGGTTGGTCACTTGGTGCGTGACGATGCTGGCCAGTAGACCGCCGGAATAGAACCGTGCCAGCG
+CGATCGGGATGGCCACCACCACCAGCAGTGGAGCTCGGGCGAACTCGAGATGGGCCAATGCGAAGACCAC
+GGTGGTAACCACCAGCGCCGCCCACCGACCCCAGCGCCGATCCACAGCACCCCAGAGCAGCCCGCGGTAG
+ATGATCTCTTCGCACAGTGGCGCGACGAACACCACGACCAGAAAGACGACCAGCGCCCACGGCCAGGACG
+CCCGAACGCCACCGAAAATCCTTACTACAGCGGAATTCGCTTCTGGCCCAACGATAGCGGTGTAGACCAG
+CGACGCCGGAATCGTGACCAGCATTCCGCCGAAACCGAACATCAACCCGAGCCGCAGTCCGCGCCACGAC
+CAGCGCAGCCGCAAGTCGGTGCGGGGGCCGTTGCCGCGGAGCCTGGTGATGAGGATGGCCAGCCCGGCGG
+CGACCACCGTGGGGGCGGCTAGCGCAAGGGCCAGCACCCCGGCAGACACCGGGCCGTGACCGGTAAGGAC
+AACCGCTAACGAAGTCGAGGCGACCAGGAATACCAGCTCGACGACCAAGAAGGCCCCAAGTCCCCAGCGG
+TGACTGGGGGCTACGGTATCGGCACGGCCCGCTTCCACGGCTCCGACGGTATCGAAGTGTCACCGCCACC
+GGCGCTGACGTCGAGCCGGCGGACGGCCGGCTGCTACGCGCGCGGTACCTCGTCGGGCGGATCGGGTTCG
+GTCGATCGACGCGAAATATGTTGGCGACTGGCAACTTCCGGTGCTTGCCACGGTCTCAACTCTCACCGCC
+GTGTTGATCCGGACCGACGGATGTGTCGCCGAACCGACCATATCGTGGGCTTGCTGACGCGCTCATCAGT
+CGGTTCGGGTGGCCACGTGCAACCAGCCCCCGCTCAACACCCCGTGCTCGCCCGGAGTGTTTGACAGGCT
+TCGTGCAGGCGGGCCGGGGACAGCCGGGTGATGCGGCGTCGGAATGCGGTGCGTGGCAACGTATGAATGT
+TGTCGAAGTTGACGACGCAGTCGCTCGGAACACGGTTTTCGACGGCCGTGAGCTCCAATTCCGACACCAG
+GCCTCGGCGGGTGCGGGTTAGGGCCACCACAACGACCGCGCCGATGCGGTCTGCCACCGGATCTCTGGTA
+AGGACAAGTACTGGTCTGTCACCACCAGGTGTGGCGGCAAACCACAATTCACCGCGCCGCATCGGCCCAG
+TCGGCCCAGTCCTCCGCCGGCCCCCAGTCGGCGATCTCAGCCAGTGCGTTCTCGTCGTCCGTCAACGGTC
+GCTCGGTGTAGGCCTGGACATCCTGGTCCGCGGCCAGCGCGGCCAAGTGACGTCGCAGCGCATCGCGCAG
+CAGCTCGGAGCGGCCGATGTGTAGGCGACGCGCCCACGCGTCGGCCAGGTCGACGTCGTGGTCGTCGGCG
+CGGAAGCTGAGCATCGTCATACATCGAGTTTAGAGCGTATGACATTGTCGGCCGGCGAGCAGACGCATAA
+GCCCCCGCACGCTCGGCGTGTCGGGGGCTTATGCGACTGCTCGCCCGGGGCCGTCAGCGGTCGCCGAGCA
+GGCTGACCATCCCGGCCGCGTCGGGAATGACGTGCACGACATCCGACAGATCGGCGAACGCCGGGTCAGC
+CGAGACAAGAGCGGTCGCGCCGGCGCTTGCGGCAACCGCCGCGAGCACCGCGTCGCAGGCTTCAAGCCCT
+GGCGTTGTCTCGAACAGCGTCAGGCCGCGCTTCGAGGTGGCCTCGATTGATGGTGAGTAGCGGCGAGAGC
+AGTTCGGCATAGTCACACGGCCCAGCGCGGCGGCGTCGCTGCGGTCGCGCCGGCGGGCGCGTACGTGGAC
+GAACTCCTGGATCACCTCGGCGGTGGTGGTCGCAGCGATGCGTTCGTCGGCGATTGCCGCGACGAGATCG
+CGGCAGGGATCGCGGAGTGGATGCTCGGCGCCTTTGGCATAGACGAGGACGGTGGTGTCGAGCACTATCA
+TCCGCGGCGCGCCCGGAGGGCCTCGAGTTCCTGCTTCAGCTCCCGCGGCTCGGGAACGGACATGTCGGCG
+GCGTCGAGCAGGCGCCTGCCCGCGGACTTGCGGCGACCGGCGGGGCTGACGAGGCCTCGATCAATGGCCT
+CACGCACGACGGTTGCGACCGGGACGCCTCGCTCGCGCGCCACCGCGGTGATGCGGCGGTGGCACTCGTC
+GTCGAGCAGGATCTGGAGCCGATGCGCCAGACGCATGCTCATACATTTAGCATGCTGAAATTTGGGCGGC
+GGCTGCCATTGCGGTCGCGTTGACCCGCGGACGGCCCAGACGCTGCGGTTGTAGCGTCGATAGGCACGCG
+TATTAGGGAGGAACAATGCCGCAGCCAAGAACGCATCTGCCGATTCCCAGTGCTGCTCGCACCGGGCTGA
+TCACGTATGACGCGAAGGATCCCGACAGCACCTATCCGCCGATCGAGCAGCTGCGCCCACCGGCGGGTGC
+CCCGAATGTGTTGCTGATCCTGCTTGACGATGTCGGGTTCGGTGCGTCGAGCGCGTTCGGAGGCCCATGC
+AGGACGTCGACGGCGGAACTGCTTGCCGGTAACGGGTTGCGGTACAACCGGTTTCACACCACCGCGCTGT
+GCTCGCCGACGCGTCAGGCGTTGTTAACTGGACGCAACCATCACTCCGCCGGCATGGGCGGTATCACCGA
+AATCGCCACCGGTGCACCGGGATACAGCTCAGTACTACCGAACACCATGTCGCCGATCGCGCGGACGCTA
+AAGCTCAACGGCTACAACACCGCCCAGTTCGGCAAGTGCCACGAAGTCCCGGTCTGGCAGACCAGCCCGG
+TCGGGCCGTTCGACGCGTGGCCCAGCGGCGGCGGTGGTTTCGAATACTTCTACGGGTTTATCGGTGGCGA
+GGCTAACCAGTGGTATCCGAGTCTGTACGAGGGCACCACGCCGGTCGAGGTGAACCGCACGCCCGAGGAG
+GGTTACCATTTCATGGCGGACATGACCGACAAGGCCCTCGGCTGGATCGGACAGCAGAAGGCACTGGCCC
+CCGACCGGCCGTTCTTCGTGTACTTCGCCCCGGGCGCCACCCACGCGCCCCACCACGTTCCGCGGGAGTG
+GGCCGACAAGTACCGGGGCCGCTTCGATGTGGGCTGGGACGCACTGCGAGAGGAAACCTTCGCCCGGCAA
+AAGGAACTCGGGGTGATCCCGGCGGACTGCCAGCTGACCGCGCGGCACGCCGAAATCCCGGCGTGGGACG
+ACATGCCGGAGGACCTCAAACCCGTGCTATGCCGGCAGATGGAGGTCTACGCGGGCTTTCTGGAATACAC
+CGACCACCACGTCGGCCGGCTCGTCGACGGCCTGCAGCGCCTCGGTGTGCTCGACGACACGCTGGTGTTC
+TACATCATCGGCGACAACGGCGCCTCGGCCGAGGGCACGATCAACGGCACCTACAACGAGATGTTGAACT
+TCAACGGCCTGGCCGACATCGAGACGCCGCGGTTCATGACCGACCGGCTCGACAAGTTCGGCGGGCCGGA
+GTCCTACAACCACTATTCGGTGGGTTGGGCGCATGCGATGGATACCCCCTATCAGTGGACCAAACAAGTG
+GCCTCGCACTGGGGTGGCACGCGTAACGGCACGATTGTGCACTGGCCCAACGGAATTGCCGCCAAGGGGG
+AGATGCGCTGGCAGTTTCACCACGTCATCGACGTGGCGCCGACCATCCTGGAGGCGGCGGGGTTGCCGGA
+ACCGTTATTCGTCAACGGCGTGCAGCAACACCCCATCGAAGGGGTCAGCATGGCCTATTCGTTCGACGAC
+GCGCAGGCGCCGGATCGGCACGAGACGCAGTATTTCGAGATGTTCGGAAACCGGGGCATCTACCACAAGG
+GTTGGACCGCGGTGACCAAGCACAAGACGCCGTGGATTTTGGTTGGCGAGCAGACCGTCGCGTTCGACGA
+CGACGTGTGGGAGCTCTACGACACCACCAAGGATTGGAGCCAGGCCAAAGACTTGGCCAAGGAGATGCCG
+GAAAAGCTGCATGAGCTGCAGCGGCTGTGGCTGATCGAGGCGACGCGCTACAACGTGCTTCCGCTGGACG
+ACGACACCGCCAGCCGCATCAACCCCGATCTGGCGGGCAGGCCGGTGCTCATCAGGGGCAACACCCAGGT
+GCTGTTTTCGAACATGGGCCGGTTGTCGGAGAACTGTGTGCTCAACCTCAAGAACAAATCGCACACGGTG
+ACCGCTGAGGTCGAGGTGCCCGAGACCGGTGCTGAGGGCGTGATCGTCGCGCAGGGCGCCAGCATCGGCG
+GCTGGAGCCTGTATGCCAACGACGGCAAGCTCAAGTACTGCTACAACCTGGGTGGTATCAAGCACTTCTA
+CGCCGAGTCCGCCGACCCGCTGCCGGCCGGCGCCCATCAGGTGCGCATGGAATTCGCTTATGCCGGTGGC
+GGTTTGGGCAAGGGCGGCGAGGTAACTCTTTATGTCGACGGCCAACAGGTCGGCGAAGGACATGTCGAAG
+CCACCCTTGCCATCGTCTTCTCGGCCGACGACGGCTGCGATGTCGGCATGGATTCGGGCTCGCCCGTCTC
+ACCCGACTATGCCCCGGGGAGTAACGCGTTCAACGGGCGGATCAAGGGCGTGCAGCTCGCGATCGCCGAG
+GCCGCCGCTGCTGCGGGCCATCTGGTCGACCCGGAGCACGCGATCCGCATCGCGCTGGCGCGCCAATAGG
+GCCGCACAGTCAAACGGGGAGGGGACGGCGATGGAAAAGTCACGGTGCCACGCTGTCGCACATGGAGGTG
+GGTGTGCGGGATCTGCGAAATCGCACAAGTCAGGTGGTCGATGCGGTCAAGGCCGGGGTGCCGGTGACTC
+TCACGGTACACGGGGAGCCGGTCGCCGATATCGTGCCGCATCGGCGCCGCATCCGCTGGCTGTCGGGGCG
+CATCTGCGCGATGAGCTCGCCAAGCGCTCGGCCGACCCGCGCCTCACCGATGAACTCAACGACTTGGCCG
+GTCATACCCTCGACGACCTGTGACCGAGGGCGAGGTCGGGGTAGGCCTGCTAGATACGTCGGTCTTCATT
+GCGCGCGAGAGCGGCGGTGCAATCGCGGACCTGCCTGAACGCGTGGCGCTTTCGGTTATGACGATCGGTG
+AGCTGCAACTCGGTCTGCTCAATGCTGGCGATTCGGCGACCCGATCACGACGCGCCGACACCCTCGCGCT
+AGCGCGCACGGCCGATCAGATCCCTGTCAGTGAAGCGGTGATGATTTCGTTGGCTCGACTCGTCGCGGAC
+TGCCGAGCCGCGGGCGTGCGGCGGTCGGTGAAGCTGACCGACGCTCTCATTGCGGCAACCGCGGAGATCA
+AGGTGTGACACCGAGGACTGATGAAGGTGCCGCTGCACCCTGCCTGATGCCTGACGTCACGATGCCCGTG
+AAGCGTGGTGATGCCCGGGGAGCTTTGGGTGTGGGTCCAGCTTTGTTCGTGGTGAGCGTGAGCAGCTCGC
+TGGTGAGGGCCAGGAGCTGTCGTTGCACGGCGGATTGATCGATTCGACCGCATCCATCTGGAGCTACTGC
+CCCAGACCGGACTCGCAGCCTTGGCAAGCCGCTACGCGGGCATTCTCACCTGAGGCAACGAAGGGCGCTA
+TGCGCGCATTGTGGGTGAGTCAACGCGAGGACTTGACGGCAGACGCTAAACGGGTCAATCTGTTGGGCAG
+CATGCGCCGCATGTGGCCAAAGGAAGTCGAGATCGCCAGCTAGCGCCGATATCCGGGGATGGTTATTGCC
+GGGTATTTGAGGAATGCGCCGTCCTGCGCTATTGTTGGACGTTGCGCTGGCTACTTCCTGCCCACCTCAC
+CCGCCACTTGACACCGTGGTCTTAGTCTGAGCCCAGTTTGCGGCTCAGCGGTTTAGTTGCGTGCGTGAGA
+TCCGGACAGATCGTTCGCCGGCCGAAACCGACAAAATTATCGCGGCGAACGGGCCCGTGGGCACCGCTCC
+TCTAAGGGCTCTCGTTGGTCGCATGAAGTGCTGGAAGGATGCATCTTGGCAGATTCCCGCCAGAGCAAAA
+CAGCCGCTAGTCCTAGTCCGAGTCGCCCGCAAAGTTCCTCGAATAACTCCGTACCCGGAGCGCCAAACCG
+GGTCTCCTTCGCTAAGCTGCGCGAACCACTTGAGGTTCCGGGACTCCTTGACGTCCAGACCGATTCGTTC
+GAGTGGCTGATCGGTTCGCCGCGCTGGCGCGAATCCGCCGCCGAGCGGGGTGATGTCAACCCAGTGGGTG
+GCCTGGAAGAGGTGCTCTACGAGCTGTCTCCGATCGAGGACTTCTCCGGGTCGATGTCGTTGTCGTTCTC
+TGACCCTCGTTTCGACGATGTCAAGGCACCCGTCGACGAGTGCAAAGACAAGGACATGACGTACGCGGCT
+CCACTGTTCGTCACCGCCGAGTTCATCAACAACAACACCGGTGAGATCAAGAGTCAGACGGTGTTCATGG
+GTGACTTCCCGATGATGACCGAGAAGGGCACGTTCATCATCAACGGGACCGAGCGTGTGGTGGTCAGCCA
+GCTGGTGCGGTCGCCCGGGGTGTACTTCGACGAGACCATTGACAAGTCCACCGACAAGACGCTGCACAGC
+GTCAAGGTGATCCCGAGCCGCGGCGCGTGGCTCGAGTTTGACGTCGACAAGCGCGACACCGTCGGCGTGC
+GCATCGACCGCAAACGCCGGCAACCGGTCACCGTGCTGCTCAAGGCGCTGGGCTGGACCAGCGAGCAGAT
+TGTCGAGCGGTTCGGGTTCTCCGAGATCATGCGATCGACGCTGGAGAAGGACAACACCGTCGGCACCGAC
+GAGGCGCTGTTGGACATCTACCGCAAGCTGCGTCCGGGCGAGCCCCCGACCAAAGAGTCAGCGCAGACGC
+TGTTGGAAAACTTGTTCTTCAAGGAGAAGCGCTACGACCTGGCCCGCGTCGGTCGCTATAAGGTCAACAA
+GAAGCTCGGGCTGCATGTCGGCGAGCCCATCACGTCGTCGACGCTGACCGAAGAAGACGTCGTGGCCACC
+ATCGAATATCTGGTCCGCTTGCACGAGGGTCAGACCACGATGACCGTTCCGGGCGGCGTCGAGGTGCCGG
+TGGAAACCGACGACATCGACCACTTCGGCAACCGCCGCCTGCGTACGGTCGGCGAGCTGATCCAAAACCA
+GATCCGGGTCGGCATGTCGCGGATGGAGCGGGTGGTCCGGGAGCGGATGACCACCCAGGACGTGGAGGCG
+ATCACACCGCAGACGTTGATCAACATCCGGCCGGTGGTCGCCGCGATCAAGGAGTTCTTCGGCACCAGCC
+AGCTGAGCCAATTCATGGACCAGAACAACCCGCTGTCGGGGTTGACCCACAAGCGCCGACTGTCGGCGCT
+GGGGCCCGGCGGTCTGTCACGTGAGCGTGCCGGGCTGGAGGTCCGCGACGTGCACCCGTCGCACTACGGC
+CGGATGTGCCCGATCGAAACCCCTGAGGGGCCCAACATCGGTCTGATCGGCTCGCTGTCGGTGTACGCGC
+GGGTCAACCCGTTCGGGTTCATCGAAACGCCGTACCGCAAGGTGGTCGACGGCGTGGTTAGCGACGAGAT
+CGTGTACCTGACCGCCGACGAGGAGGACCGCCACGTGGTGGCACAGGCCAATTCGCCGATCGATGCGGAC
+GGTCGCTTCGTCGAGCCGCGCGTGCTGGTCCGCCGCAAGGCGGGCGAGGTGGAGTACGTGCCCTCGTCTG
+AGGTGGACTACATGGACGTCTCGCCCCGCCAGATGGTGTCGGTGGCCACCGCGATGATTCCCTTCCTGGA
+GCACGACGACGCCAACCGTGCCCTCATGGGGGCAAACATGCAGCGCCAGGCGGTGCCGCTGGTCCGTAGC
+GAGGCCCCGCTGGTGGGCACCGGGATGGAGCTGCGCGCGGCGATCGACGCCGGCGACGTCGTCGTCGCCG
+AAGAAAGCGGCGTCATCGAGGAGGTGTCGGCCGACTACATCACTGTGATGCACGACAACGGCACCCGGCG
+TACCTACCGGATGCGCAAGTTTGCCCGGTCCAACCACGGCACTTGCGCCAACCAGTGCCCCATCGTGGAC
+GCGGGCGACCGAGTCGAGGCCGGTCAGGTGATCGCCGACGGTCCCTGTACTGACGACGGCGAGATGGCGC
+TGGGCAAGAACCTGCTGGTGGCCATCATGCCGTGGGAGGGCCACAACTACGAGGACGCGATCATCCTGTC
+CAACCGCCTGGTCGAAGAGGACGTGCTCACCTCGATCCACATCGAGGAGCATGAGATCGATGCTCGCGAC
+ACCAAGCTGGGTGCGGAGGAGATCACCCGCGACATCCCGAACATCTCCGACGAGGTGCTCGCCGACCTGG
+ATGAGCGGGGCATCGTGCGCATCGGTGCCGAGGTTCGCGACGGGGACATCCTGGTCGGCAAGGTCACCCC
+GAAGGGTGAGACCGAGCTGACGCCGGAGGAGCGGCTGCTGCGTGCCATCTTCGGTGAGAAGGCCCGCGAG
+GTGCGCGACACTTCGCTGAAGGTGCCGCACGGCGAATCCGGCAAGGTGATCGGCATTCGGGTGTTTTCCC
+GCGAGGACGAGGACGAGTTGCCGGCCGGTGTCAACGAGCTGGTGCGTGTGTATGTGGCTCAGAAACGCAA
+GATCTCCGACGGTGACAAGCTGGCCGGCCGGCACGGCAACAAGGGCGTGATCGGCAAGATCCTGCCGGTT
+GAGGACATGCCGTTCCTTGCCGACGGCACCCCGGTGGACATTATTTTGAACACCCACGGCGTGCCGCGAC
+GGATGAACATCGGCCAGATTTTGGAGACCCACCTGGGTTGGTGTGCCCACAGCGGCTGGAAGGTCGACGC
+CGCCAAGGGGGTTCCGGACTGGGCCGCCAGGCTGCCCGACGAACTGCTCGAGGCGCAGCCGAACGCCATT
+GTGTCGACGCCGGTGTTCGACGGCGCCCAGGAGGCCGAGCTGCAGGGCCTGTTGTCGTGCACGCTGCCCA
+ACCGCGACGGTGACGTGCTGGTCGACGCCGACGGCAAGGCCATGCTCTTCGACGGGCGCAGCGGCGAGCC
+GTTCCCGTACCCGGTCACGGTTGGCTACATGTACATCATGAAGCTGCACCACCTGGTGGACGACAAGATC
+CACGCCCGCTCCACCGGGCCGTACTCGATGATCACCCAGCAGCCGCTGGGCGGTAAGGCGCAGTTCGGTG
+GCCAGCGGTTCGGGGAGATGGAGTGCTGGGCCATGCAGGCCTACGGTGCCGCCTACACCCTGCAGGAGCT
+GTTGACCATCAAGTCCGATGACACCGTCGGCCGCGTCAAGGTGTACGAGGCGATCGTCAAGGGTGAGAAC
+ATCCCGGAGCCGGGCATCCCCGAGTCGTTCAAGGTGCTGCTCAAAGAACTGCAGTCGCTGTGCCTCAACG
+TCGAGGTGCTATCGAGTGACGGTGCGGCGATCGAACTGCGCGAAGGTGAGGACGAGGACCTGGAGCGGGC
+CGCGGCCAACCTGGGAATCAATCTGTCCCGCAACGAATCCGCAAGTGTCGAGGATCTTGCGTAAAGCTGT
+CGCAAAATTACTAAACCCGTTAGGGGAAAGGGAGTTACGTGCTCGACGTCAACTTCTTCGATGAACTCCG
+CATCGGTCTTGCTACCGCGGAGGACATCAGGCAATGGTCCTATGGCGAGGTCAAAAAGCCGGAGACGATC
+AACTACCGCACGCTTAAGCCGGAGAAGGACGGCCTGTTCTGCGAGAAGATCTTCGGGCCGACTCGCGACT
+GGGAATGCTACTGCGGCAAGTACAAGCGGGTGCGCTTCAAGGGCATCATCTGCGAGCGCTGCGGCGTCGA
+GGTGACCCGCGCCAAGGTGCGTCGTGAGCGGATGGGCCACATCGAGCTTGCCGCGCCCGTCACCCACATC
+TGGTACTTCAAGGGTGTGCCCTCGCGGCTGGGGTATCTGCTGGACCTGGCCCCGAAGGACCTGGAGAAGA
+TCATCTACTTCGCTGCCTACGTGATCACCTCGGTCGACGAGGAGATGCGCCACAATGAGCTCTCCACGCT
+CGAGGCCGAAATGGCGGTGGAGCGCAAGGCCGTCGAAGACCAGCGCGACGGCGAACTAGAGGCCCGGGCG
+CAAAAGCTGGAGGCCGACCTGGCCGAGCTGGAGGCCGAGGGCGCCAAGGCCGATGCGCGGCGCAAGGTTC
+GCGACGGCGGCGAGCGCGAGATGCGCCAGATCCGTGACCGCGCGCAGCGTGAGCTGGACCGGTTGGAGGA
+CATCTGGAGCACTTTCACCAAGCTGGCGCCCAAGCAGCTGATCGTCGACGAAAACCTCTACCGCGAACTC
+GTCGACCGCTACGGCGAGTACTTCACCGGTGCCATGGGCGCGGAGTCGATCCAGAAGCTGATCGAGAACT
+TCGACATCGACGCCGAAGCCGAGTCGCTGCGGGATGTCATCCGAAACGGCAAGGGGCAGAAGAAGCTTCG
+CGCCCTCAAGCGGCTGAAGGTGGTTGCGGCGTTCCAACAGTCGGGCAACTCGCCGATGGGCATGGTGCTC
+GACGCCGTCCCGGTGATCCCGCCGGAGCTGCGCCCGATGGTGCAGCTCGACGGCGGCCGGTTCGCCACGT
+CCGACTTGAACGACCTGTACCGCAGGGTGATCAACCGCAACAACCGGCTGAAAAGGCTGATCGATCTGGG
+TGCGCCGGAAATCATCGTCAACAACGAGAAGCGGATGCTGCAGGAATCCGTGGACGCGCTGTTCGACAAT
+GGCCGCCGCGGCCGGCCCGTCACCGGGCCGGGCAACCGTCCGCTCAAGTCGCTTTCCGATCTGCTCAAGG
+GCAAGCAGGGCCGGTTCCGGCAGAACCTGCTCGGCAAGCGTGTCGACTACTCGGGCCGGTCGGTCATCGT
+GGTCGGCCCGCAGCTCAAGCTGCACCAGTGCGGTCTGCCCAAGCTGATGGCGCTGGAGCTGTTCAAGCCG
+TTCGTGATGAAGCGGCTGGTGGACCTCAACCATGCGCAGAACATCAAGAGCGCCAAGCGCATGGTGGAGC
+GCCAGCGCCCCCAAGTGTGGGATGTGCTCGAAGAGGTCATCGCCGAGCACCCGGTGTTGCTGAACCGCGC
+ACCCACCCTGCACCGGTTGGGTATCCAGGCCTTCGAGCCAATGCTGGTGGAAGGCAAGGCCATTCAGCTG
+CACCCGTTGGTGTGTGAGGCGTTCAATGCCGACTTCGACGGTGACCAGATGGCCGTGCACCTGCCTTTGA
+GCGCCGAAGCGCAGGCCGAGGCTCGCATTTTGATGTTGTCCTCCAACAACATCCTGTCGCCGGCATCTGG
+GCGTCCGTTGGCCATGCCGCGGCTGGACATGGTGACCGGGCTGTACTACCTGACCACCGAGGTCCCCGGG
+GACACCGGCGAATACCAGCCGGCCAGCGGGGATCACCCGGAGACTGGTGTCTACTCTTCGCCGGCCGAAG
+CGATCATGGCGGCCGACCGCGGTGTCTTGAGCGTGCGGGCCAAGATCAAGGTGCGGCTGACCCAGCTGCG
+GCCGCCGGTCGAGATCGAGGCCGAGCTATTCGGCCACAGCGGCTGGCAGCCGGGCGATGCGTGGATGGCC
+GAGACCACGCTGGGCCGGGTGATGTTCAACGAGCTGCTGCCGCTGGGTTATCCGTTCGTCAACAAGCAGA
+TGCACAAGAAGGTGCAGGCCGCCATCATCAACGACCTGGCCGAGCGTTACCCGATGATCGTGGTCGCCCA
+GACCGTCGACAAGCTCAAGGACGCCGGCTTCTACTGGGCCACCCGCAGCGGCGTGACGGTGTCGATGGCC
+GACGTGCTGGTGCCGCCGCGCAAGAAGGAGATCCTCGACCACTACGAGGAGCGCGCGGACAAGGTCGAAA
+AGCAGTTCCAGCGTGGCGCTTTGAACCACGACGAGCGCAACGAGGCGCTGGTGGAGATTTGGAAGGAAGC
+CACCGACGAGGTCGGTCAGGCGTTGCGGGAGCACTACCCCGACGACAACCCGATCATCACCATCGTCGAC
+TCCGGCGCCACCGGCAACTTCACCCAGACTCGAACGCTGGCCGGTATGAAGGGCCTGGTGACCAACCCGA
+AGGGTGAGTTCATCCCGCGTCCGGTCAAGTCCTCCTTCCGTGAGGGCCTGACCGTGCTGGAGTACTTCAT
+CAACACCCACGGCGCTCGAAAGGGCTTGGCGGACACCGCGTTGCGCACCGCCGACTCCGGCTACCTGACC
+CGACGTCTGGTGGACGTGTCCCAGGACGTGATCGTGCGCGAGCACGACTGCCAGACCGAGCGCGGCATCG
+TCGTCGAGCTGGCCGAGCGTGCACCCGACGGCACGCTGATCCGCGACCCGTACATCGAAACCTCGGCCTA
+CGCGCGGACCCTGGGCACCGACGCGGTCGACGAGGCCGGCAACGTCATCGTCGAGCGTGGTCAAGACCTG
+GGCGATCCGGAGATTGACGCTCTGTTGGCTGCTGGTATTACCCAGGTCAAGGTGCGTTCGGTGCTGACGT
+GTGCCACCAGCACCGGCGTGTGCGCGACCTGCTACGGGCGTTCCATGGCCACCGGCAAGCTGGTCGACAT
+CGGTGAAGCCGTCGGCATCGTGGCCGCCCAGTCCATCGGCGAACCCGGCACCCAGCTGACCATGCGCACC
+TTCCACCAGGGTGGCGTCGGTGAGGACATCACCGGTGGTCTGCCCCGGGTGCAGGAGCTGTTCGAGGCCC
+GGGTACCGCGTGGCAAGGCGCCGATCGCCGACGTCACCGGCCGGGTTCGGCTCGAGGACGGCGAGCGGTT
+CTACAAGATCACCATCGTTCCTGACGACGGCGGTGAGGAAGTGGTCTACGACAAGATCTCCAAGCGGCAG
+CGGCTGCGGGTGTTCAAGCACGAAGACGGTTCCGAACGGGTGCTCTCCGATGGCGACCACGTCGAGGTGG
+GCCAGCAGCTGATGGAAGGCTCGGCCGACCCGCATGAGGTGCTGCGGGTGCAGGGCCCCCGCGAGGTGCA
+GATACACCTGGTTCGCGAGGTCCAGGAGGTCTACCGCGCCCAAGGTGTGTCGATCCACGACAAGCACATC
+GAGGTGATCGTTCGCCAGATGCTGCGCCGGGTGACCATCATCGACTCGGGCTCGACGGAGTTTTTGCCTG
+GCTCGCTGATCGACCGCGCGGAGTTCGAGGCAGAGAACCGCCGAGTGGTGGCCGAGGGCGGTGAGCCCGC
+GGCCGGCCGTCCGGTGCTGATGGGCATCACGAAGGCGTCGCTGGCCACCGACTCGTGGCTGTCGGCGGCG
+TCGTTCCAGGAGACCACTCGCGTGCTGACCGATGCGGCGATCAACTGCCGCAGCGATAAGCTCAACGGTC
+TGAAGGAAAACGTGATCATCGGCAAGCTGATCCCGGCCGGTACCGGTATCAACCGCTACCGCAACATCGC
+GGTGCAGCCCACCGAGGAGGCCCGCGCTGCGGCGTACACCATCCCGTCGTATGAGGATCAGTACTACAGC
+CCGGACTTCGGTGCGGCCACCGGTGCTGCCGTCCCGCTGGACGACTACGGCTACAGCGACTACCGCTAGG
+TGGGCGAGCAGACGCAGAATCGCACGCGAAATGCCTGCGCGATGCGATTCTGCGTCTGCTCGCCGTGGTG
+GATGAGCCGGTCTTGCATCGCCAATGCGGGAAACCCATGCATGCGTTGGGGCACGACGCCGGCCTGGCCG
+CCAGATTGGCGCTGCCCGCCGCCCCGTTCAACATGAGTGGCAATCCCGCCATCTGCCTGCCTGCGGGGGA
+CACGTCGTGAGGAACCCCGGTCGGGGTTTAGTTTATCGGCCGTGAATTCGCCGAACGGTTGCTCGTCCAA
+GCCGGCCACGCATTCCAGCAGGCCACTGCGTTCCATCGCCGACGCCCAGGCATGGCCTGGGTTGGTGATT
+GCGGCCGCCGAGTCAAACAACCGTGAACTCGCGCGTCGTCGCGCTGAACGCTGTAAGCATGCCGTTGCGA
+TCGCGTGCGGTGCCGTGGTGGACGATGCGGTATTGCCCGGGCGTGGTATCGCCGGGAACATCCCAGCGAA
+TGCTGACATGCGATCCGGCCCGCCCTTGGCGCTGCCAGCGAAAGCTCGTGGCCCAGTCGCCGTCGTCAGC
+AATCCGCACCCAGCTGGCACCTTCCCGGCGGACCACTTCGAGGTAGGTGCCGCCGCGGCGCAGATCGTTA
+TTGGGCAGCGCGCTGACGAAAACGGCTTCCACCGCCTGACCCGGTCGGTACGTCGCCGAGGGCTCGGCGA
+TGACCGCTCCGAACGACCCGGCATCGGCGGGCGCGCCGCGCACCCAGCTCAGCTCCCGGGTGGGCCGCGG
+CCGGCGACCGAGCGTCACCGGACGGCCGTCGCGCATGGCCTCGGCGAGTTCGGCCACGGTCTGCATGAGG
+GCGCACAGTTCCCATCGACCGAACAACGTGCTGCCGCCCTCGTAGCGCTGTTCGAGATACTCTTCGGGCG
+TTGTCACGTAATGGATGTAGGCGTTGGTGTAGCCCACGCAGAGCACGTCGGCCAGGTCGGCGCCAACAAT
+CGAAGCCACCATGCGGCGCAGCCTAAGCCCCGCGACGATGGTCGGTTCGCCCGGAATACCGATCAGATAG
+AGGCGACCGATTCGCACGAGCTGAACGGGAACAATTTCCTGGACAAAGGGGTGTATCCGGTTCGGCAGGC
+GTGCGGGCATCACAATGCCTTTGGGGGCCTGTGCCGCTGCCGTCGGCCTTGCCAGCCGGTACATGGCGCG
+GGATAGTCTGTCCCAGAACGGGTTTCGCCCTTGGCGAAAGCCATGGAAGCCCGGGCCCTCGTCGGTGCCT
+GCCATGGCCCCGGCGCCAAACATCGGACGCCCGGTGCGGCGCTCTTCACCGTCTGGTGTGTACTCGCCGC
+GCACGAGCACAGAACCGAGATCGACATAGGTGAACCGGGCATCAATGCCAGCGCCGATGGGCGTCGCTCC
+GCTCAACTGCGTGAAAGCATCCTCGAACTGGCACAACCCGGTACGACGGGTGTTGTCGAATTCCCGGTCT
+GGTGGGGCCTCGGGAGAAAGGGGCCCGTCGACATTCGGGCTCATGTCGCCCGGATTCGTCTGTGCGAAGG
+CGGCGATGAAGTCGGGCTGGCCGGCGAGATAATCCGCGCCGCCCACGGTGCGTTCCCAGTGATAGGCCGC
+GAAACCCTTGTTGTCTCCGGAGATGAGGTGGTTGCGATTCGTCATGCTCGTACCGTGGGTAGCGAAGAAA
+TGGATCACGCCCACGGTGGCCTCGCCCCGGTCGATACGCACGAGCGTGGTATGCGGGTCGACGCGTTTCG
+GGAAGAACGCCTTGTCGGCCGGCGGGTTGCGGTCGAACGCTGATGGGGATCGATTGATGCTTGCGCCGTA
+CAGCTCGCCGTGCGAGAGCGGAACCTCGGCGGGCGCCACATCGGCATGCGCATGTTCCACCGATTCGACA
+ATTCCGTCGACGATCGCCGCAAAGGTTGCCGGCCGAAAGCCGCTCGTGGTCAGGTTGTACAGCAGGTATC
+CGCAGTACCCGCCAGGCCCGGCGTGGGTGTGGGTCGCCGTGATCAGTGTGTTCTGCTCCGAGTAGGTATC
+GCCATACAAATCGGCCAACCGGCGCAGCACTTCCTCATTCACGTTTTGCATGGGCAGCGGCAGTTCGGCG
+ACAATCAGCAGCAACCGCGCGTCCCCGTCCTGGGAATCGTCCCGGAACACAAACGCCCGTGACCTAAGTC
+GCTGGTGAATGCCGGCGGTGCGCTGGTCGGACTTGCCGTAGCCGAGCATGCCGCAGTCCGCCGCCTCACC
+AGTGATGTCGGCGATGCCGCGCCCTACACTAAGCATTGCCTAATCCTCCGCACCAGCAGCAAATTTCACG
+AGCGCTGACTACGCGCTGCTCCGGGGAAACGTATCCCACAAGGAGAACCACTTTATGCGCCGGGGCCCAC
+GAATACGGACGGCAGCATCCCGTGCCGCGGCTGGCCGGACGTGATCCGAGGGTGTGGGTCTCACCAGATC
+GGTCTCACTAGACTTGGGTTGTGCTCATTGGTTCGCATGTCAGCCCAACCGATCCGCTGGCCGCAGCGGA
+GGCCGAAGGCGCTGACGTAGTGCAGATTTTCCTTGGCAATCCGCAGAGCTGGAAGGCTCCCAAGCCGCGG
+GACGACGCCGCCGCGCTGAAAGCCGCGACCCTGCCCATCTACGTGCATGCGCCCTACCTGATCAACCTTG
+CGTCGGCGAACAATCGCGTGCGGATCCCGTCGCGCAAGATCCTGCAAGAGACCTGTGCTGCGGCGGCCGA
+CATTGGCGCAGCGGCGGTGATCGTGCACGGTGGGCACGTCGCCGACGACAACGACATCGACAAGGGCTTC
+CAGCGCTGGCGCAAGGCGCTGGACCGGCTGGAAACCGAGGTTCCCGTCTACCTGGAAAACACCGCCGGCG
+GCGATCACGCGATGGCGCGCCGCTTCGACACCATCGCCCGGCTCTGGGACGTCATCGGCGACACCGGAAT
+CGGGTTTTGCCTGGACACCTGCCACACCTGGGCGGCCGGCGAGGCGCTGACCGATGCCGTCGATCGGATC
+AAAGCAATTACCGGCCGCATCGATCTGGTGCACTGCAACGACTCCAGGGACGAAGCAGGATCGGGCCGTG
+ACCGCCACGCCAACCTCGGCAGCGGCCAGATTGATCCTGACCTGCTGGTGGCTGCCGTCAAGGCGGCCGG
+CGCGCCGGTGATCTGCGAAACCGCCGACCAAGGTCGCAAGGACGACATCGCGTTTCTGCGGGAAAGAACC
+GGCAGCTGACTTCAAGCCCCGCGGCACCTACCGTTGACTTATGCTCCGCAGGGTCGCCATACTGCTCGCC
+GCTGTGCTTGCGTTCGCGGGCTGCTCGGGGGGAACGAGGTTGGCGGCGGGCTTCGGCAATGGCAATAGCG
+TGCACACCCTCGATGTCGATGGAGCCGGCCGCAGCTACCGGCTTTATAAGCCCGTCGGGTTGCCGTCCTC
+GGCGCCGCTGGTCGTCATGTTGCACGGCGGGTTCGGCAGCGCCAAGCAAGCCGAAAGGTCTTATGGCTGG
+GACGAATTGGCCGACTCCGAGAAGTTCCTCGTCGCCTACCCCGATGGCTATCACAGGGCTTGGAATGCCA
+ATGGCGGAGGCTGCTGCGGCCGGCCCGCACGTGAAGGCGTCGACGACATCGGCTTCGTCCGCGCGGTCGT
+CGCCGACATCGCCAACAATGTCAGCATCGACCCCGCCCGGGTCTACGTCACGGGCATGAGCAACGGTGCC
+ATCATGTCCTACACGCTGGCCTGCAACACCAGCATCTTCGCGGCGATCGGCGTCGTTTCGGGCACGCAAC
+TAGACCCCTGTCAGTCCCCGCGTCCGGTGTCGGTCATCCACATCCATGGCACGGCCGATCCGCTGGTCCG
+CTACCACGGCGGGCCCGGCGCCGGGTTCGCGCGCATCGACGGTCCGCCGGTGCCCGATCTCAATGCGTTC
+TGGCGCGAGGTCAACCGGTGCGGCGCGCTGGATACCACGACCGAAGGTCCGGTCACCACATCGGGCGCCA
+CATGCGCCGACAATCGCCGTGTCGTGCTGCTCACCGTCGATGACGCCGGCCACCGATGGCCGTCATTTGC
+CACCCAGACACTGTGGCGATTCTTTGCAGCGCACTTCAGATGAGGACAAAACCATCCGTTACATTCTCTT
+GTGCAGTTGTAGAAAAAACGTAACATGGTGGCATGTCAGATACGCATGTCGTCACCAACCAGGTTCCGCC
+CTTGGAGAACTACAATCCCGCGTCATCCCCGGTGCTCATCGAGGCTCTGATCCAGGAGGGTGGCCAGTGG
+GGCCTGGATGAAGTAAACGAGGTCGGGGCAATTTCTGCCAGCTGCCAAGCCCAACGCTGGGGAGAGCTTG
+CAGACCGCAACCGGCCCATCCTGCATACCCACGACGCTTACGGGTACCGGGTCGATGAGGTGGAGTACGA
+CCCGGCCTACCACGAGCTGATGCGTACCGCGATCACCCATGGCATGCACGCCGCACCGTGGGCTGACGAC
+CGCCCGGGTGCGCACGTGGTGCGAGCGGCCAAGACATCGGTGTGGACCGTCGAGCCGGGCCATATCTGCC
+CCATCTCGATGACCTACGCCGTCGTTCCGGCGCTGCGGTATAACTCCGAGCTGGCTGCGGTCTACGAGCC
+GCTGCTGACCAGTCGTGAGTACGACCCGGAGCTGAAGCCGGCGACCACGAAGGCCGGCATCACCGCCGGC
+ATGTCGATGACCGAGAAGCAGGGTGGCTCCGACGTGCGCGCTGGCACCACCCAGGCGACCCCGAATGCGG
+ACGGCAGCTACAGCTTGACCGGCCACAAGTGGTTCACTTCGGCGCCGATGTGCGACATCTTCCTGGTGCT
+CGCGCAGGCACCGGACGGGCTGTCGTGCTTCCTGCTGCCGCGGGTGCTGCCCGACGGCACCCGCAACCGA
+ATGTTCTTGCAGCGGCTCAAGGACAAGCTCGGCAACCACGCAAACGCCTCGAGCGAGGTCGAATACGACG
+GTGCCGTCGCGTGGCTGGTGGGCGAGGAGGGCCGCGGCGTGCCGACCATCATCGAGATGGTCAACCTCAC
+CCGGCTGGACTGCGCTCTGGGCAGTGCCACCAGCATGCGCACCGGCCTAACCCGCGCCGTCCACCATGCC
+CAGCATCGGAAGGCGTTCGGCGCCTACCTGATCGACCAGCCGTTGATGCGCAACGTGCTGGCCGACCTGG
+CGGTGGAGGCCGAGGCCGCCACCATCGTGGCAATGCGGATGGCCGGTGCCACCGACAACGCGGTGCGCGG
+GAACGAGACCGAAGCGCTGCTGCGTCGCATCGGCCTGGCGGCCGCCAAGTACTGGGTGTGCAAGCGCTCC
+ACCGCTCACGCCGCCGAAGCGCTGGAGTGCCTGGGCGGCAACGGTTATGTCGAGGATTCCGGGATGCCCC
+GGCTCTACCGGGAGGCGCCGTTGATGGGCATCTGGGAGGGCTCGGGCAATGTCAGCGCGCTAGATACCTT
+GCGCGCCATGGCAACCCGGCCCGCATGCGTCGAGGTGCTGTTTGACGAGCTGGCCCGCAGCGCAGGCCAG
+GACCCCAGGCTGGACGGCCACGTCGAAAGGCTGCGTCCGCAGCTAGGCGATCTTGACACGATCGGTTATC
+GAGCCCGCAAGATTGCCGAAGACATCTGCCTGGCGTTGCAGGGATCGTTGTTGGTGCGCCACGGACATCC
+CGCCGTCGCCGAGGCGTTTCTGGCCACTCGGCTCGGCGGCCAGTGGGGCGGAGCGTACGGCACCATGCCG
+GCCGGTCTGGATCTCGCGCCCATCCTCGAGCGTGCGCTGGTAAAAGGCTGAGCGGCCGCTGATGACACAC
+GCGATCAGGCCGGTCGATTTCGACAACCTGAAGACGATGACCTATGAGGTCACCGGTCGGATTGCGCGGA
+TCACCTTCAACCGGCCGGAGAAGGGCAACGCGATCATCGCAGACACCCCGCTGGAGTTGTCTGCTCTGGT
+GGAGCGTGCCGATCTGGATCCAGGCGTGCATGTCATTCTGGTGTCCGGTCGCGGCGAGGGATTCTGTGCC
+GGCTTCGACCTGTCCGCCTACGCCGAGGGGTCGTCGTCGACCGGGGGCGGCGGCGCATACCAAGGCACGG
+TGCTAGATGGCAAGACCCAGGCCGTCAACCACCTACCGAACCAGCCGTGGGACCCGATGATCGACTACCA
+GATGATGAGCCGGTTCGTGCGCGGATTCGCCAGTCTGATGCATGCCGACAAGCCGACGGTGGTCAAGATC
+CACGGCTACTGCGTGGCCGGCGGCACCGACATCGCGCTGCACGCCGATCAGGTGATCGCCGCCGCCGACG
+CCAAGATCGGCTACCCGCCCACCCGGGTGTGGGGGGTGCCGGCGGCGGGCCTGTGGGCGCACCGGCTCGG
+CGACCAGCGGGCCAAACGGCTGCTGTTCACCGGCGATTGCATCACCGGCGCGCAGGCCGCCGAGTGGGGC
+CTGGCGGTCGAGGCGCCGGAGCCGGCTGACCTCGACGAGCGGACCGAGCGACTGGTGGCCCGGATCGCCG
+CACTGCCGGTCAATCAATTGATCATGGTCAAGCTCGCGCTCAATTCCGCTCTGCTGCAACAGGGTGTGGC
+CACCAGCAGGATGGTCAGCACCGTGTTCGACGGCGCCGCTCGGCACACACCCGAGGGGCACGCGTTTGTC
+GCCGACGCGGTCGAGCACGGCTTCCGGGATGCGGTGCGGCGCCGTGACGAGCCGTTTGGCGACTACGGCC
+GTCAAGCATCGCGGGTGTAACCATGCCGGCCATGACCGCCCGTTCGGTGGTACTCAGCGTGCTGCTCGGT
+GCTCATCCCGCGTGGGCCACCGCAAGCGAATTGATCCAGCTGACAGCGGATTTCGGTATCAAGGAGACGA
+CGTTGCGGGTCGCGCTGACCCGCATGGTCGGTGCCGGGGATCTGGTCCGGTCCGCGGACGGCTACCGGCT
+CTCGGATCGGTTGCTGGCCCGCCAGCGCCGACAAGATGAGGCCATGCGCCCACGGACCCGCGCTTGGCAC
+GGAAACTGGCACATGCTGATTGTCACCAGCATCGGCACCGATGCTCGTACCCGGGCCGCACTGCGAACCT
+GCATGCACCACAAGCGTTTCGGTGAATTGCGGGAAGGGGTGTGGATGCGGCCGGACAATCTCGACCTCGA
+CTTGGAGTCCGACGTTGCGGCCCGGGTTAGGATGCTGACGGCCCGCGACGAGGCCCCCGCCGACTTGGCC
+GGGCAGCTGTGGGATCTGTCGGGGTGGACCGAGGCCGGCCACCGGTTGCTCGGCGACATGGCAGCGGCCA
+CCGACATGCCCGGGCGATTTGTGGTGGCTGCGGCGATGGTGCGCCACCTGCTCACCGATCCGATGTTGCC
+CGCTGAACTGTTGCCCGCCGACTGGCCGGGCGCCGGGTTACGGGCGGCGTACCACGACTTCGCCACTGCA
+ATGGCGAAACGACGCGATGCAACTCAACTCCTGGAGGTGACATGAGTGATCTGGTGCGTGTGGAGCGCAA
+AGGTCGGGTGACCACGGTGATTCTGAACCGGCCGGCCTCCCGCAACGCGGTCAACGGCCCGACCGCCGCG
+GCGTTGTGCGCGGCGTTCGAGCAATTCGACCGGGACGACGCCGCGTCGGTGGCCGTACTCTGGGGTGCGG
+GTGGAACCTTTTGTGCGGGAGCCGATTTGAAGGCCTTTGGCACACCGGAGGCCAACTCTGTGCACCGGAC
+GGGTCCCGGCCCGATGGGGCCGTCACGAATGATGCTGTCCAAACCTGTGATCGCCGCCGTCAGCGGCTAC
+GCCGTCGCCGGGGGGCTGGAATTGGCACTGTGGTGCGACCTGCGGGTGGCCGAGGAAGACGCCGTGTTCG
+GTGTGTTTTGCCGTCGCTGGGGGGTACCGCTCATCGACGGCGGCACCGTGCGACTGCCACGGCTGATCGG
+GCACAGCCGCGCGATGGACATGATCCTCACTGGCCGTGGGGTGCCGGCCGACGAAGCGCTGGCCATGGGG
+TTGGCCAATCGGGTGGTGCCCAAGGGTCAAGCCCGACAGGCGGCTGAGGAGTTGGCGGCGCAATTGGCCG
+CGCTGCCGCAGCAGTGTCTGCGATCGGATCGGCTGTCGGCGCTGCACCAGTGGGGCCTGCCCGAGTCCGC
+GGCGCTCGACCTCGAGTTCGCCAGCATCGCGCGGGTGGCCGGCGAGGCGCTAGAGGGGGCGAGACGGTTC
+GCCGCGGGTGCCGGTCGGCATGGGGCCCCGGCACCTCGGGCCGAACAGGGCGACACGCTTTAGGCGGGTA
+CGGCTCAGACCAAGGCGAAGGTCCGTGCCGATGCCGGCGAGGGCCACGGCTGCGGAACGGGTCGTTGCCG
+GACAACCTGGGGCCACCAGAACCACTTTCCGAGGAGGGCCGCGATCGACGGTGTCATGAACGACCGGACG
+ATCAGGGTGTCGAAGAGCAGGCCCATACCGATGGTGGTGCCAACCTGGGCCATCACGGTCAGCTCGCTGA
+CGGCAAACGACATCATGGTGAAGGCAAACACCAGCCCGGCGGCGGTCACCACCGACCCGCTGCCACCCAT
+CGCACGGATGATGCCGGTGTTGATTCCGGCGTGGATCTCCTCCTTGAGCCGGGCAACCAGCAGCAGGTTG
+TAGTCCGCGCCGACGGCCAGCAGGATGATGACCGCCATCGCCAACACCAACCAGTGCAGCTCGATACCCA
+GGATGTGTTGCCAGATCAGCACCGACAGCCCGAACGAGGCGCCCAGCGACAACACCACGGTGCCGACGAT
+GACGGCGGCCGCGACGACGCTGCGGGTGATGATCAGCATGATGATGAAGATCAGGCAGAGTGCGGAGATT
+CCGGCGATCATCAAGTCATAGGTGTTGCCGTCGGACAAGTCCTTGAACATCGCCGCGGTACCGCCCAGGT
+AGATCGCGGATCCCTCCAACGGTGTGCCCTTGATGGCTTCCTTGGCGGCGGTCTTGATCTTGGCGATGCG
+CGCGATGCCCGCCTGGCTCATCGGGTCGCCTTCGTGGCTGATGATGAACCGCACCGCGTGCCCGTCCGGC
+GAGAGGAACTGTTCCAGGCCGCGTTGGAAGTCGGGATTGTCGAAAACCTCGGGAGGCAGATAGAACGAGT
+CGTCGTTGCGCGAAGCATCAAAGGCTTCGCCCATCGCCGCCGAATCCTCCTGCATCGCGGCCATCTGATC
+CTGCAGCCCTTCCTGGGTGGAATGCATGCTCAGCATCTGCGCCTTCATGCTCTTCATGGTCTGGATCATC
+TCGGGCATCATCGCGGTCAGCTGGGGCATGAGCGTGTCCAGGCGCTGCATGAGCGGCAGCAGGTTGTTGA
+TGTCTTCGGTCATGACGTCGATTCCGTCGAGGGTGTCGAACACCGACCGCAGCGACCAGCAGACCGGGAT
+GTCGTAGCAGTGCTTTTCCCAGTAGAAGTAGCTGCGGATGGGGCGGAAGAAATCGTCGAAATCCGCAATA
+TGGTTGCGCAACTCCTCGACATCGACCACCATCCCCGTCATCTGAATGACCATTTCGTGGGTGACATCGG
+CCATCTGCTGGGTGAGGCTGTGCATCCGCTCCATCTGGTCGATGTTGGACTGAATGTCGTTGACCTGCTC
+CAGCATCCTGGCCGTCAGGTCCTGGTTGTATTTCTCGGTCAGTTTCTGGCTGGTGCCCTGCATGCTGATC
+AGGAACGGGATTGAGGTGTGCTCGATCGGTTTGCCGTCCGGCCGGGTGATGGCCTGCACCCGGGATATCC
+CCTCCACGGCGAAAATGGCCTTGGCGATCTTGTTGATCACCAAAAAGTCGGCCGAATTACGCATGTCGTG
+GTCGCTTTCGACCATCAGCACCTCGGGGTTCATCCGGGCCTGGGAGAAATGGCGCTCCGCGGCCGCATAG
+CCTTCGTTGGCCGGTAGGTCGGCGGGCAGGTAGTTGCGGTCGTTGTAGTTGGTCCGGTAGCCCGGCAGGG
+TCAGCAGACCGACGAGCGCCAGGGCCACCGCACCGACCAGGATGGGGCCGGGCCAGCGGACGATGGCGGC
+CCCGACCTTGCGCCAGCCCCGCACCCGCGCCATCCGCTTGGGCTCGAGCAGCTTGCCGAACCGGCTCGTC
+ACGGCGATTATCGCCGGGCCCAGGGTGAGTGCGGCGGCGACGACGATGACCATCCCGATCGCCAACGGCA
+CACCGAGGGTCTGAAAGTACGGCAGTCGGGTGAAGCTCAGACAGAACGTGGCACCCGCGATGGTCAGACC
+CGAGCCCAGCACGACATGGGCGGTGCCGCCGAACATGGTGTAGTACGCCGACTCCCGGTCCTGGCCGAGC
+CCGCGTGCTTCCTGGTAGCGGCCGATCAGGAAGATGGCGTAGTCGGTGGCGGCCGCGATCGCCAGCACCA
+CGAGCAGGTTGGTCGCGAAGGTCGAGAGCCCAATGATCCGGTGGAAACCGAGGAAAGCCACGCCCCCGCG
+GGTGGCGAGCAGCCCGAGCACCACCATCGTCAGCATGATCGCCGACGTGATGATCGACCGGTAGACCAGC
+AGCAACATCACGATGATCACGGTGAACGTGACCGCCTCGATCACCTGCAGACTACGGTCGCCGGCCTGCT
+GCTGATCGGCGACCAGCGCGGCCGAACCGGTGACGTACACCTTGACACCGGGTGGCGGCGCAAGGCGCTC
+GACGATGGTCTTGACCGCTTCCACGGACTCGTTGGCCAGTGACTCGCCCTGATTGCCCGCGAGTTTCACC
+TGAACGTAGGCGGCCTTGCCGTCGCTGCTCTGGGCGCCGGTGGCGGTCAGTGGATCCCCCCAAAAGTCCT
+GCAAGGACTGGACGTGGGTGGTGTCGGCTTGCAGTCTGCCGATCATCTGGTCGTAAAACGCATGGGCGGC
+GTCACCGAGCGGCCGCTGGCCCTCCAGCACGATCATCGCCGCGCTGTCGGAGTCTCCCTCCTCGAACACC
+TTGCCGATGTGTTTCATCGAGATCATCGACGGTGCCGCGTCGGGGCTCATCGACACCGCCTGTATCTGTC
+CGACCGTTTCCAGTTGCGGCACAGTGACGTTGAGGACGGCGATGGTGACCAACCACCCAAGGATGATCGG
+CACCGCGAAGGTACGGATCATTCTGGGGATGAACGGTCGCGCCGCGTGCCTGTCGGGCGGGACGGAGCCC
+GTCGGCGCAGCTGTCCTTTGCACGATCATGCGGATTTCACAAAGCAGTAGGTCAGGGCATCCACGCCGGT
+TGCGGTCCGCTCGTCCTTCACTTCGCCATCGACGGTGATTCGGCAGGTGATGGAAGTGCCGTCGCCTTGC
+GCGAGGATGTTGGGGGCCGCGGACGGCGCCGTGGTCTTCAAGGTGAGCGACCACGGCAGGGCTGCGCCGT
+CGATCCGCTGTGGCTTGGCGTCGAGGTCCAGGTAGTTGATGTTGACGTAACTACCGGAGCCGGAAACTTC
+GTACTCCACCACCTTGGGGTCGAACGGCTCCGGGTCATCGGCGAAGACCTTCGGCGTCACCAAGATGCCT
+TCGGAACCAAAGAAAGTGCGGATCCGCTGCACCGTGAAGCCGGCGATGGCGACCACAACCAGGATGAGCA
+GCGGTATCCAGGCACGCTTGAGAGTTCCAATCATCGCCCTCCGCCTCTGCCGCATGAAGTTCACGCCGGT
+CTGGTGACGCATACCGAACGTCACAGATTTCAGAGTACAGTGAAACTTGTGAGCGTCAACGACGGGGTCG
+ATCAGATGGGCGCCGAGCCCGACATCATGGAATTCGTCGAACAGATGGGCGGCTATTTCGAGTCCAGGAG
+TTTGACTCGGTTGGCGGGTCGATTGTTGGGCTGGCTGCTGGTGTGTGATCCCGAGCGGCAGTCCTCGGAG
+GAACTGGCGACGGCGCTGGCGGCCAGCAGCGGGGGGATCAGCACCAATGCCCGGATGCTGATCCAATTTG
+GGTTCATTGAGCGGCTCGCGGTCGCCGGGGATCGGCGCACCTATTTCCGGTTGCGGCCCAACGCTTTCGC
+GGCTGGCGAGCGTGAACGCATCCGGGCAATGGCCGAACTGCAGGACCTGGCTGACGTGGGGCTGAGGGCG
+CTGGGCGACGCCCCGCCGCAGCGAAGCCGACGGCTGCGGGAGATGCGGGATCTGTTGGCATATATGGAGA
+ACGTCGTCTCCGACGCCCTGGGGCGATACAGCCAGCGAACCGGAGAGGACGACTGATGAGCAACCTCGCA
+ATCTGACCGAGGTGGCGAGCAAGACGGCGATTGGCCTGTGGTCACTCCTTGTTGATGCGGTTGCCCGCGC
+CGAGGTTATCGATTGTGGGGTCACCGTTTTTGTAGGTGACCGTGTTGTCCAGCCCAACAACAACGAGGCG
+CTCGTCGATCCTGTCGAAGGCGATCTTGTTGTTCGCACCACCGACGGTCACCGTTTCGCAGGTGCCGTTG
+ACGGTCAGCGTGTTGTCCGAGCCGGCCACGTTCAGTGACTTGCCGTCAGCGCAGTCAAGGGTGGCGGTAG
+TCCCGATGGATCCGTAGGTCAGCATGTCACCGATCTGGATCGAAGCGGTTGTGGATTCTCCGGTCGTCAC
+GGTCGGCGCCGCGGTCGGGCCGCTCGTCGCTGTCGTGGTGGTGGCGGTCGCGGGCGTCGTGGTAGCTGCC
+GGCGGGTTGGCAGTGGAACTGCAGCCGGCCAGCGGCAACGCTGCGGCAGCCAGCGCCAGAGCAAAGGTCG
+CCAACCGGGAGTGGGTAGCGCGATCGGCGCGCAACGGTTTCTCGACCACCTCAGCCGACCCGCTGCAGTC
+GGTTTACCATTCCTAGTTCCCGGCCACGGTCCCAGATGAACGGATCACCATTGCGGAAGAACACCGTTTC
+GTCCCAGCCGTAGACGGTGATGTCGTTGATGATCGTGTCGGCGACAACGGTGTTGGACGAGCCCATCACG
+GTCACCGCCCAGCAGGTTCCCAGCGCGGTCACGATGTTCTGAGTGCCGTTGACCAACAAGGTGGATTCGT
+TGCAGTCCAGCGTCCGCTCGATGCCCTGCCCGGTGACATGGGTGTCGCCGTTCTTGGCGTGTGCGGCCGG
+CGGTGGGGCGGCCAAGGCGACAGCGATGGTGATGACACCGGCAGCCAGCGACGCGGCGACGGTGTTCCAC
+TTCACGGCGGGCCCCCCTTCGACTGGGCGGGTGATGCTTGACTGAGCCTTGGTCGGGCCTTGATTGAGCG
+TACGTGCATTCGCCCGGGCGACGACAGACCTGAGTGCATTTGCCGGGCAGGCACCCCGCGTCTGATGTCA
+GCTACTCCACAACCCGGTCGCTAGAGTCATTAGTTGGCCCTAACGTCCCCCGAAGACCGGTGCGGACCCA
+AAGCCGATCACCCCAACCGAAGGGCGAACCGCCATGGCAGCTCAGCCGCAAGCACCGTCAGCGGGCGGCC
+GCCCGCGCGCGGGGAAAGCGGTGAAGTCCGTGGCTCGCCCGGCCAAACTGAGCCGTGAGAGCATCGTCGA
+GGGCGCCCTGACCTTTTTGGATCGGGAGGGGTGGGACTCGCTGACCATCAATGCGCTGGCGACCCAGCTC
+GGGACCAAGGGGCCGTCGCTGTACAACCACGTGGACAGCCTCGAGGATCTACGCCGGGCGGTGCGGATTC
+GGGTGATCGACGACATCATCACGATGCTGAATAGGGTCGGTGCGGGTCGCGCACGCGATGACGCGGTGTT
+GGTCATGGCCGGTGCCTACCGCAGCTACGCCCACCACCACCCGGGTCGGTACTCGGCGTTCACCCGGATG
+CCGCTGGGCGGTGACGATCCCGAATACACCGCTGCGACTAGGGGCGCAGCCGCGCCCGTCATCGCCGTGC
+TGTCCTCGTACGGCCTCGACGGTGAGCAGGCTTTCTACGCGGCGCTCGAGTTTTGGTCGGCACTGCATGG
+GTTTGTGTTGCTGGAAATGACCGGCGTCATGGACGACATCGATACCGATGCGGTGTTCACCGACATGGTG
+CTGCGGCTGGCGGCGGGCATGGAAAGGCGCACCACACACGGTGGTACCGCGTCAACGTAGCGCCCTGCTT
+CGGCCGCAACGCCCGCTTTGACCTGCCAGACTGGCGGCGGGTATTGTGGTTGCTCGTGCCTGGCGGCTTA
+CGCCTGATGTAGGGGCGTGGATGCCGGGCCAATTCGCATGTCCGCGATGCCTCGGATGAGACGAATCGAG
+TTTGAGGCAAGCTATGCGACACACCCGGCCGCGGGTAACCGTGGCGGGGCATGGCCGACAAACAGAACGT
+GAAAGCGCCCAAGATAGAAAGCCGGTAGATGCCAACCATCCAGCAGCTGGTCCGCAAGGGTCGTCGGGAC
+AAGATCAGTAAGGTCAAGACCGCGGCTCTGAAGGGCAGCCCGCAGCGTCGTGGTGTATGCACCCGCGTGT
+ACACCACCACTCCGAAGAAGCCGAACTCGGCGCTTCGGAAGGTTGCCCGCGTGAAGTTGACGAGTCAGGT
+CGAGGTCACGGCGTACATTCCCGGCGAGGGCCACAACCTGCAGGAGCACTCGATGGTGCTGGTGCGCGGC
+GGCCGGGTGAAGGACCTGCCTGGTGTGCGCTACAAGATCATCCGCGGTTCGCTGGATACGCAGGGTGTCA
+AGAACCGCAAACAGGCACGCAGCCGTTACGGCGCTAAGAAGGAGAAGGGCTGATGCCACGCAAGGGGCCC
+GCGCCCAAGCGTCCGTTGGTCAACGACCCGGTCTACGGATCGCAGTTGGTCACCCAGTTGGTGAACAAGG
+TTCTGTTGAAGGGGAAAAAATCGCTGGCCGAGCGCATTGTTTATGGTGCGCTTGAGCAAGCTCGCGACAA
+GACCGGCACCGATCCGGTGATCACCCTCAAGCGGGCTCTCGACAATGTCAAACCCGCCCTGGAGGTGCGC
+AGCCGTCGCGTCGGCGGCGCGACCTATCAGGTGCCTGTCGAGGTGCGCCCCGACCGGTCGACCACGCTGG
+CGCTGCGCTGGCTCGTCGGCTACTCGCGGCAACGCCGTGAGAAGACGATGATCGAGCGCCTGGCAAATGA
+GATCCTGGATGCCAGCAATGGCCTTGGGGCCTCCGTCAAGCGGCGTGAGGACACCCACAAGATGGCCGAG
+GCGAACCGAGCCTTTGCGCATTATCGCTGGTGAGAAGCGCCGGTTAGCCAGCCAGGGCGCAAACCGACAG
+TGATAGACAGCTAACTAGCAACCGAAAGAGTGGGAAGACTTCTGTGGCACAGAAGGACGTGCTGACCGAC
+CTGAGTAGGGTCCGCAACTTCGGCATCATGGCGCACATCGATGCCGGCAAGACCACAACCACCGAGCGCA
+TCCTGTACTACACCGGTATCAACTACAAGATTGGTGAGGTGCACGACGGCGCAGCCACCATGGACTGGAT
+GGAACAGGAACAGGAGCGCGGCATCACCATCACCTCTGCGGCCACGACCACGTTCTGGAAAGACAACCAG
+CTCAATATCATCGACACGCCAGGGCATGTGGATTTCACCGTCGAGGTGGAGCGCAATCTGCGCGTGCTCG
+ACGGCGCGGTCGCGGTTTTCGACGGCAAAGAGGGTGTCGAACCGCAGTCCGAACAGGTGTGGCGGCAGGC
+CGACAAATACGATGTCCCCCGAATCTGCTTCGTCAACAAGATGGACAAGATCGGTGCGGACTTCTACTTC
+TCGGTTCGCACGATGGGGGAGCGGCTTGGGGCCAACGCCGTGCCCATTCAGCTTCCCGTCGGTGCAGAGG
+CCGACTTCGAAGGCGTCGTCGACCTGGTGGAGATGAACGCCAAGGTGTGGCGCGGCGAGACGAAACTCGG
+CGAAACCTACGACACCGTGGAAATACCGGCCGACCTGGCCGAGCAGGCTGAGGAGTACCGGACCAAGCTG
+CTCGAGGTGGTCGCCGAGTCCGACGAGCACCTGTTGGAGAAGTACCTGGGCGGTGAGGAGCTCACCGTCG
+ACGAGATCAAGGGCGCGATCCGCAAGCTGACAATCGCCAGCGAGATCTACCCGGTGCTGTGCGGCAGCGC
+GTTCAAGAACAAGGGCGTGCAGCCGATGCTGGATGCCGTCGTCGACTACCTGCCGTCGCCGCTGGACGTT
+CCGCCGGCGATCGGGCACGCGCCCGCCAAGGAGGACGAGGAGGTGGTGCGCAAGGCGACCACCGACGAGC
+CCTTTGCGGCCCTGGCGTTCAAGATCGCTACTCACCCGTTCTTCGGCAAGCTCACCTACATCCGGGTGTA
+CTCGGGCACCGTCGAGTCGGGTAGCCAGGTCATCAATGCCACCAAGGGCAAGAAAGAACGGCTGGGCAAG
+CTGTTCCAGATGCACTCCAACAAGGAGAACCCGGTCGATAGGGCTAGTGCCGGTCACATCTACGCGGTGA
+TCGGTCTCAAGGACACCACCACCGGTGACACCTTGAGCGACCCGAACCAGCAGATCGTGCTGGAGTCGAT
+GACCTTCCCCGACCCGGTGATCGAGGTGGCCATCGAGCCGAAGACCAAGAGCGACCAAGAGAAGCTGAGT
+CTGTCGATCCAGAAGCTCGCCGAAGAGGATCCGACCTTCAAGGTGCACCTGGATTCCGAGACCGGCCAGA
+CCGTCATCGGCGGCATGGGCGAGCTGCATCTGGACATCCTGGTGGACCGCATGCGCCGGGAATTCAAGGT
+CGAGGCCAACGTCGGCAAGCCTCAGGTTGCCTACAAGGAGACCATCAAGCGGCTCGTGCAGAACGTCGAG
+TACACCCACAAGAAGCAGACGGGTGGCTCGGGCCAGTTCGCCAAGGTCATCATCAACCTCGAGCCGTTCA
+CCGGTGAAGAGGGCGCGACCTACGAGTTCGAGAGCAAAGTCACCGGCGGGCGTATCCCGCGGGAGTACAT
+CCCGTCGGTGGATGCCGGCGCACAGGACGCCATGCAGTACGGCGTGCTGGCCGGCTATCCGCTGGTGAAC
+CTGAAGGTCACGCTGCTCGACGGCGCCTACCACGAGGTTGACTCCTCGGAAATGGCGTTCAAGATCGCGG
+GCTCGCAGGTGCTCAAAAAGGCTGCCGCACTTGCGCAGCCGGTGATCCTGGAACCGATCATGGCGGTCGA
+GGTGACCACACCCGAGGACTACATGGGTGACGTGATCGGCGACCTGAACTCCCGCCGTGGCCAGATCCAG
+GCCATGGAGGAGCGGGCTGGTGCGCGCGTTGTTAGGGCGCACGTGCCGCTGTCGGAGATGTTCGGCTACG
+TCGGTGACCTTCGGTCCAAGACTCAAGGCCGGGCAAACTACTCCATGGTGTTCGACTCGTACTCCGAAGT
+GCCGGCGAACGTGTCGAAGGAAATCATCGCGAAGGCGACGGGCGAGTGAGCGCAAGCTCACGAGTGAGGA
+GCCGAGCAATGGGTACAGCGAAGGCGACGGGCGACTAGGCGATGCGAAGACGACCGCTAGTGAGCGAAGC
+TCACGAGCAATGAGCAGCGCGAAGGCGACTGGCGAGTAGATACAACCATACGAGTAGGCTGGCCCGGTTA
+CGACCGCGGCATAACTGAAAACATCAACACTGCTTTTATAAGCACTAACAAGTCCAGGAGGACACAAAAG
+TGGCGAAGGCGAAGTTCCAGCGGACCAAGCCCCACGTCAACATCGGGACCATCGGTCACGTTGACCACGG
+CAAGACCACCCTGACCGCGGCTATCACCAAGGTCCTGCACGACAAATTCCCCGATCTGAACGAGACGAAG
+GCATTCGACCAGATCGACAACGCCCCCGAGGAGCGTCAGCGCGGTATCACCATCAACATCGCGCACGTGG
+AGTACCAGACCGACAAGCGGCACTACGCACACGTCGACGCCCCTGGCCACGCCGACTACATCAAGAACAT
+GATCACCGGCGCCGCGCAGATGGACGGTGCGATCCTGGTGGTCGCCGCCACCGACGGCCCGATGCCCCAG
+ACCCGCGAGCACGTTCTGCTGGCGCGTCAAGTGGGTGTGCCCTACATCCTGGTAGCGCTGAACAAGGCCG
+ACGCAGTGGACGACGAGGAGCTGCTCGAACTCGTCGAGATGGAGGTCCGCGAGCTGCTGGCTGCCCAGGA
+ATTCGACGAGGACGCCCCGGTTGTGCGGGTCTCGGCGCTCAAGGCGCTCGAGGGTGACGCGAAGTGGGTT
+GCCTCTGTCGAGGAACTGATGAACGCGGTCGACGAGTCGATTCCGGACCCGGTCCGCGAGACCGACAAGC
+CGTTCCTGATGCCGGTCGAGGACGTCTTCACCATTACCGGCCGCGGAACCGTGGTCACCGGACGTGTGGA
+GCGCGGCGTGATCAACGTGAACGAGGAAGTTGAGATCGTCGGCATTCGCCCATCGACCACCAAGACCACC
+GTCACCGGTGTGGAGATGTTCCGCAAGCTGCTCGACCAGGGCCAGGCGGGCGACAACGTTGGTTTGCTGC
+TGCGGGGCGTCAAGCGCGAGGACGTCGAGCGTGGCCAGGTTGTCACCAAGCCCGGCACCACCACGCCGCA
+CACCGAGTTCGAAGGCCAGGTCTACATCCTGTCCAAGGACGAGGGCGGCCGGCACACGCCGTTCTTCAAC
+AACTACCGTCCGCAGTTCTACTTCCGCACCACCGACGTGACCGGTGTGGTGACACTGCCGGAGGGCACCG
+AGATGGTGATGCCCGGTGACAACACCAACATCTCGGTGAAGTTGATCCAGCCCGTCGCCATGGACGAAGG
+TCTGCGTTTCGCGATCCGCGAGGGTGGCCGCACCGTGGGCGCCGGCCGGGTCACCAAGATCATCAAGTAG
+GTCTACCGGCCACCAGACGCAAAAGAACATGATGGGCGCACCAGCGCCCATCATGTTCTTTTGCGTCTGC
+TCGCGAAAATGCCCAGCGTGCGGCGCTACGCTGACATGGACCCTCCGACGAGGCAAGGAGCAGGCACGTG
+TTAGCGCGCTACATCAAGATGCAGTTATTGGTGCTGTTGTGCGGTGGTCTGGTCGGGCCGATCTTCTTGG
+TCGTCTACTTCACGCTCGGACTGGGCAGCCTGATGTCGTGGATGTTCTATGTCGGTCTGATCATTACCGT
+TGCTGACGTGCTGGTCGCGCTCGCATTGACCAACTACGGGGCAAAGACCGCTGCCAAGACCGCGGCACTT
+GAACGGAGTGGAGTGCTGGCGCTCGCCCAAAGCACCGGGCTCAGCGAGACAGGGACCCGGATCAACGATC
+AACCGCTGGTAAAGGTGCACCTGCACATCTCGGGACCCGGCATCACTCCGTTCGACACGGAAGACCGGGT
+CATCGCCAGTGTGACCCGGCTGGGCAATCTCACGGCTCGAAAACTGGTGGTATTGGTGAATCCCGCCACG
+CAGCAATACCTGATCGACTGGGAACGAAGCGCTTTGGTCAACGGCCTGGTGCCCGCCCAATTCACCGTCG
+CCGAAGACAACAAGACCTACGACTTGAGTGGGCAAACCGGCCCGCTGATGGAGATCTTGCAGATTCTGAA
+GGCAAACAACGTTCCGCTGAACCGGATGGTTGACATCCGCTCGAATCCGGCACTGCGTCAGCAAGTCCAA
+GCGGTGGTGCGGCGGGCAGCCGAGCGGCAGGCGCCGGCGGCCGAGCCAGCGTCGCAAGGATCGATCGCCG
+AGCGGCTTGCGGAGCTGGAATCGCTGCGCGCCAGCGGTGCGGTCAACGCGGCGGAATACGAGAGCAAGCG
+CGCCCAGATCATCTCCGAAATCTGAGGCGAGCTGGGGCACCATCCGCGGCGAGCAGACGCGAAAGCCCGC
+GACACGCCGAGGCATCGGGGGATTTTGTCTGGTGGGCGGGAATCTGGGGCACGTTAGAACACGTTACAGT
+TTCGCTGCTAGCCTGACAGTCGGCGAGAGGGGCGTATGTGTCTGCGCGGGGAGGATCACTGCACGGCCGG
+GTGGCATTTGTCACCGGCGCCGCCCGCGCCCAAGGACGGTCGCACGCGGTGCGGCTGGCGCGCGAGGGGG
+CCGATATCGTCGCGCTGGACATCTGCGCGCCAGTATCCGGCAGCGTGACTTACCCGCCGGCCACGTCCGA
+AGATCTCGGCGAGACCGTCCGCGCGGTGGAAGCCGAAGGCCGCAAGGTGCTCGCCCGCGAGGTGGATATT
+CGCGACGACGCCGAGTTGCGGCGGCTGGTGGCCGATGGTGTCGAGCAGTTCGGCCGGCTCGACATCGTGG
+TGGCCAACGCCGGGGTGCTGGGTTGGGGCAGGCTCTGGGAACTCACCGATGAGCAGTGGGAGACCGTTAT
+CGGGGTCAACTTGACGGGTACGTGGCGCACCTTGCGGGCCACCGTGCCCGCGATGATCGATGCCGGCAAT
+GGGGGTTCGATTGTGGTTGTCAGCTCGTCGGCGGGGTTGAAGGCGACACCGGGCAACGGCCACTACGCGG
+CCAGCAAGCATGCACTCGTAGCGCTGACCAACACGTTGGCGATAGAGCTCGGTGAATTCGGCATACGGGT
+CAACTCCATTCATCCTTACTCGGTCGACACCCCGATGATCGAACCGGAGGCAATGATTCAGACGTTCGCC
+AAGCATCCCGGATATGTGCATAGCTTTCCACCAATGCCGTTGCAGCCCAAAGGTTTTATGACACCAGACG
+AGATATCCGACGTCGTTGTCTGGTTGGCCGGCGACGGCTCGGGCGCACTGTCGGGCAATCAGATCCCGGT
+CGATAAGGGTGCCTTGAAGTATTGACGCGCGATCGTGTATGAACGCACACGTGACCAGTCGTGAAGGCGT
+CAATGAGTTTGACGATGGAATTGTGATCGTCGGCGGCGGATTGGCAGCTGCGCGCACCGCCGAGCAGTTG
+CGTCGTGCGGGCTATTCGGGTCGCCTCACGATCGTCAGCGACGAGGTGCATCTGCCGTACGACCGTCCGC
+CGCTATCCAAGGAGGTGCTGCGCAGCGAGGTCGACGATGTGGCCCTCAAACCCCGCGAGTTCTACGACGA
+AAAGGACATCGCACTTCGGCTGGGGTCGGCTGCCGTCAGCTTGGACACGGGAGAACAGACGGTAACGCTG
+GCCGACGGTACGGTGCTCGGCTACGACGAGCTCGTCATCGCGACTGGTTTGGTGCCCCGGCGTATTCCAT
+CGCTTCCCGACCTTGATGGCATTCGGGTGCTCCGGTCGTTCGACGAGAGCATGGCACTGCGCAAGCATGC
+ATCCGCCGCACGGCACGCCGTGGTGGTGGGGGCCGGTTTCATCGGCTGCGAGGTGGCTGCCAGTCTGCGC
+GGTCTCGGTGTGGATGTGGTGCTGGTTGAGCCGCAGCCGGCGCCGTTGGCCTCGGTGCTGGGCGAGCAGA
+TCGGCCAGTTGGTGACGCGGCTCCATCGCGATGAGGGCGTTGATGTTCGCACGGGTGTGACAGTGGCCGA
+GGTACGTGGCAAGGGGCATGTCGACGCGGTGGTCCTGACCGACGGTACCGAACTGCCGGCTGATCTGGTG
+GTTGTGGGCATTGGGTCGACCCCGGCGACCGAATGGCTAGAGGGTAGCGGCGTCGAGGTCGACAACGGCG
+TGATCTGTGACAAAGCCGGGCGGACTAGCGCGCCGAATGTGTGGGCGCTCGGTGACGTCGCCTCCTGGCG
+AGATCCGATGGGACACCAAGCACGCGTGGAACATTGGAGCAACGTCGCCGACCAGGCCCGAGTCGTGGTG
+CCCGCGATGCTCGGGACCGATGTGCCCACGGGCGTGGTCGTCCCGTATTTCTGGAGTGACCAGTATGACG
+TCAAAATCCAGTGCCTGGGGGAGCCGCACGCCACCGACGTTGTGCATCTGGTCGAGGACGACGGGCGCAA
+GTTCCTTGCCTATTACGAGCGCGATGGCGTGCTGGTTGGCGTGGTCGGTGGCGGGATGGCCGGCAAGGTC
+ATGAAGGTGCGCGGCAAGATCGCCGCGGGCGCGCCCATCGCCGAAGTGTTAGACCAAACTCAGGCCTAGA
+GCTGACCTAGGTGGCAGCGGGCGCCCTGGTCGTCGGCGCATTCGGCGGACATATCGTCTGGCTGTCGGGA
+CGGCTCGGCCAGCGCGCCGGCCGCACGCACCCGTGCGACCGCCGCGTCGATATCGCCACCGTCCATATCG
+GCACGGCGCTCGGATGCGGGCTGCGGCCCGCTGCACCGGGCCATCAGATGCACGCCCGGCGCCTGCCAGC
+CATCCGCGACGCGGCCCGGTTTGACGGTCCACCCCAGCACGTGGCGTAGAAGTCGCGGATGACGTCGGAA
+TCGGCTACCTCGTAGCTGACATTCGCCGTTTCACTGAGCCGGCATCTGTTGAGCTCTGGGCGTTTCCGGC
+ACGGGCTCGGCTTCAAGACCGCGAATGCCGCGCTTCGGTTGTCGGTAGCATCGAGGATGGCTCCGTGCTC
+GGATTGACCTGTTTGTCCCGCGGCGCCGCTGGCTGCGGTGATCGCCTCGCGCGTGGCGACCAGGCCTGCG
+ACGGCCTAGCAGCAACCAGGGTGGGACAACCGGAGCCGGCGAATATGCCGGTCGGGAGCTCGGTTGTTCG
+TGGGAGCTCGGTGACCGGCATGGGGACATGACGGCGGCTGATCGTGGTCAGCCAGCTTGTGTCGCGCCAC
+GCAGCCATGAAATCGCGATTGGCGGCGGATCGCTTCCATGCGCGGCATCCGTTGCAGCCCGAAATGTCTC
+CGACGTCAGGTCCTCGGCCGTGCCACGGGCGCCGCAGAGCCGCCCATACCGTCGCCGCGCTGGCGTGAAT
+TCCGACGGGTTGGTCAGGAAAATATCCGGCGAGCTGCTACCGTGGCGGCGCCAACACTGTGCCGACCCAA
+CTCGGGGATCGCAGATCGCTCGTCATTGCCAGGTCACCGGTGGGCCGTGTGGATGGCATTCACCCAAGAC
+CCGGGCGTGACCACCCGGCCAACTGCGCATACGTACCAGGTACTTGATTTGGGCGCCGGGCCGCTGGTGG
+GCAGGCTCCAAGGTGAGGTGCACGAACGGGCAGTGGGCATCGGCTTGCGCGGCTAATGCGTCGATTCCGG
+CGCGGATCGCTGCGCGTTCGTCGGCGGGCAGGTACTGCCAGGTGATCGAATGCCACAACACGGTGAGTGC
+ATCGTCGGTCAGAGTCATGCCGGCGACTGCGGCGTGCGCCGCCTGCCGATGGAGGTCCGCGGGAATGTTG
+CGGGCGACGGCGATGGCGCCCCGCAACCGCTCCAACCGATCGGTCTGGTCCGGCCAGATGTAGCTCAACG
+CGTTCAGCTCCCCGTCGGGGCTGGTGACGTCGATGGGCGCGATGTCGTATCCGTGTCGTTCGACGATCCG
+CACCGTGGCCGTCGGCGGCAATTCGCCCAGCCAGGCATTGTCGATTCGCACCGGTGAGTCGGCCAGGCCC
+CATTCGCCGCCGAGATAACGGTAGCGGTACCGATCTGGTCGCAGGTTCAGCCCTGCACTGGACCCTATCT
+CGAAAAGCCTTATTGGCAAGTCGAATTGGAGGCAGGCGATGAGAAGTCCACCGATCAACGCCGCCGAGCG
+CCCTACCTCGTTGGTCTGCGGTGGCCGATCGAGAGCCGCACGCAGCGACTCCGGCTGGTCGGTCGCGGTG
+CGGACGATATCGGGCCAGGCTGCCTCCGCCTGCCAGGTGCCGCCGGTGCTGGGGTACCAGCGGCGCAACA
+CCGGTGCGCGGCCGTCGAGCACCATCCGGTGCAATCCGCCGAGCAGCCGAAGCGGCACCGCCTGGCCCTC
+CGGAGCACCCTTCTGGTCGGCCAAGATGGACGCGAAGACGCCGCCGCTTTCGACGTCAGCTGCCACGAGC
+TCAAGTAGCTCGCGGTACATCGGGGAGCCGGAGGAGGTGCACACCCGCCCCTGTGACCGCAGGGTGTGGA
+CCAGGTGTTCGGTGCCCGTCACTGGTTGAGTCGGTCCAGACCGGCGCCGACGACGTCAAACGCGGCCCCG
+AGCGCTTCGGTCAAGGAGACGGATTCGTCGCGCAGCCAATGTTCATAGGCGCTCAGAGCGACCCCCAGCA
+TTGTCCAGGCGACGGTTTGGGGCATAAAGTCTGTCGTCTTTCCACCCGATCTGCGGGCAACGAATTTGGC
+GATCACCTCGCGCCAGCCAGCATACATGGTCATCGAATAGGCCTGCAGTTCAGGAGTTTGCAAGATGACC
+CGCATGCGCTTGCGGTGTCGGATGGTTTCGGATTCGTCAAAGGTGTTGAAGGCCAACAGCGCTGCGCGCA
+ACGCGTCCCTCAGCTGAATCCGTGAATCGATATTGTCGAGTAGACCTTGTAGCTGTGCAAGGTGGGTGCT
+GAAGTCACCCCAGGGGATGGCGTTCTTGGAGGCGTAGTAGCGAAACAACGTTCTGCGGGCGATGCCGGCC
+GCCCGGGCGATGTCGTCCACGCTGACATCGGTGAAACCGTGGGCAGCGAACAGTTCGATGGCAACATCGC
+TGATGTGGTGCGGTGTGGTTGAGCGCCGTCGGCCCACCCGCGACTCGTGCGGCATCACATTCGCCCTTCC
+ATTTCGGCACTCGATGCCATATTGTGTCCAGATCGACGGATCGCTGTCGAGACCTGCTGGCGAAAGGCAA
+TCCAGATGGACTACGAAACCGATACCGACACCGAGCTTGTCACCGAGACCCTGGTTGAAGAGGTGTCCAT
+CGACGGAATGTGTGGGGTTTACTGACCGTGCCGGCGCCCGCGCAGGCTCGCCGGGCTGATTCCAGCGAAT
+TCGATCCCGATCGCGGCTGGCGACTACACCCACAGGTGGCGGTCCGGCCGGAGCCTTTTGGCGCGCTGCT
+CTATCACTTCGGCACCCGTAAGTTGTCATTTCTGAAAAATCGCACCATCCTCGCGGTGGTGCAGACGCTG
+GCGGATTATCCCGATATCCGGTCGGCCTGCCGCGGCGCCGGCGTCGACGACTGTGACCAGGATCCGTACC
+TGCACGCCCTGAGTGTGCTCGCCGGTTCGAACATGCTGGTTCCTCGGCAGACAACATGACGAGCCCCGTA
+CCCCGACTCATCGAGCAGTTCGAGCGGGGGCTCGACGCGCCGATCTGCCTTACCTGGGAGCTGACCTACG
+CCTGCAACCTAGCTTGCGTGCACTGCCTGTCGTCCTCGGGCAAACGCGATCCCGGCGAGTTGTCCACCCG
+CCAATGCAAGGACATCATCGACGAACTGGAACGCATGCAGGTGTTCTACGTGAACATCGGCGGCGGCGAA
+CCAACCGTGCGCCCGGACTTTTGGGAGCTGGTAGATTACGCCACCGCACACCACGTCGGGGTGAAATTCT
+CCACCAACGGGGTCCGGATCACCCCCGAGGTGGCCACGCGGCTGGCAGCCACCGACTACGTCGACGTTCA
+GATCTCACTCGACGGCGCCACGGCCGAGGTCAACGACGCCATCCGCGGCACCGGGTCGTTCGACATGGCG
+GTGCGCGCGCTGCAGAACCTGGCAGCGGCGGGATTTGCCGGCGTCAAGATCTCGGTTGTGATCACCCGGC
+GCAACGTCGCCCAGCTCGACGAATTCGCCACGCTGGCAAGCCGTTACGGAGCGACGTTGCGGATAACCAG
+GTTGCGACCGTCCGGGCGCGGGACTGACGTATGGGCCGACCTGCACCCCACCGCCGACCAGCAGGTGCAG
+CTTTACGACTGGCTGGTTTCCAAAGGAGAGCGGGTGCTCACCGGCGATTCCTTCTTCCACCTGGCGCCGC
+TCGGCCAGTCGGGGGCTCTGGCCGGCTTGAACATGTGCGGAGCCGGGCGGGTAGTGTGCCTGATCGACCC
+GGTGGGTGACGTGTATGCGTGCCCATTCGCCATTCATGACCACTTCTTAGCCGGAAACGTGTTGTCCGAC
+GGCGGATTTCAAAATGTCTGGAAGAACTCGTCGCTGTTTCGCGAGCTCCGGGAGCCCCAGTCCGCAGGCG
+CCTGTGGCAGCTGCGGACACTACGACAGCTGCCGGGGCGGCTGCATGGCGGCGAAATTCTTCACCGGCCT
+GCCGCTGGACGGGCCGGATCCCGAATGCGTGCAAGGCCATAGCGAGCCGGCGCTGGCGCGCGAGCGCCAC
+CTACCGCGGCCCCGCGCCGACCACTCCCGCGGTCGGCGCGTCAGCAAACCGGTGCCCCTGACGCTGTCGA
+TGCGGCCACCCAAGCGCCCGTGCAATGAAAGTCCGGTGTAGCCGTGGCCGAAGCGTGGTTTGAAACGGTA
+GCCATCGCGCAGCAACGCGCGAAGCGGAGGCTGCCGAAATCGGTTTACTCGTCCCTGATTGCGGCCAGTG
+AAAAGGGAATCACGGTCGCCGACAATGTCGCAGCATTCAGCGAGCTCGGGTTCGCGCCGCACGTCATCGG
+GGCGACAGATAAACGTGACTTGTCGACGACCGTTATGGGGCAAGAAGTTTCGTTGCCAGTGATTATTTCG
+CCGACCGGTGTTCAGGCGGTCGATCCCGGCGGTGAAGTCGCCGTCGCGCGGGCCGCGGCCGCCCGGGGTA
+CTGTGATGGGATTGTCCTCGTTTGCCAGCAAGCCGATCGAGGAGGTCATTGCCGCCAACCCCAAGACCTT
+CTTCCAGGTCTACTGGCAGGGCGGGCGCGACGCGCTCGCTGAACGCGTCGAACGGGCGCGGCAGGCCGGC
+GCGGTCGGCCTGGTCGTCACCACCGACTGGACGTTCTCGCACGGGCGCGACTGGGGCAGCCCCAAGATCC
+CCGAAGAGATGAACTTGAAGACCATCCTGCGGCTATCCCCGGAGGCGATCACCCGGCCGAGGTGGTTGTG
+GAAGTTCGCCAAGACGCTACGGCCACCGGACCTACGGGTGCCCAACCAGGGCCGGCGCGGCGAGCCCGGC
+CCACCGTTCTTCGCAGCCTACGGCGAATGGATGGCAACACCTCCGCCGACCTGGGAAGATATCGGCTGGC
+TGCGCGAACTGTGGGGCGGACCGTTCATGCTCAAGGGCGTCATGCGGGTCGACGATGCCAAAAGAGCTGT
+GGATGCCGGGGTTTCGGCGATCTCGGTATCCAACCATGGTGGCAACAATTTGGATGGGACGCCAGCATCG
+ATCCGGGCCCTGCCCGCGGTCTCGGCGGCGGTCGGCGATCAGGTCGAAGTGTTGCTCGACGGCGGCATCC
+GGCGGGGCAGCGATGTCGTCAAGGCGGTGGCGCTGGGCGCGCGCGCGGTAATGATTGGTCGCGCTTACCT
+GTGGGGCTTGGCCGCCAACGGCCAAGCCGGGGTCGAGAATGTACTCGACATCCTGCGCGGTGGTATCGAC
+TCGGCTCTGATGGGTCTCGGGCATGCCTCTGTCCATGACCTCAGCCCAGCCGACATCCTCGTTCCCACCG
+GGTTCATCCGCGACCTGGGTGTGCCCTCCCGACGGGACGTTTAGCCGGATGTTGAGCTGGGCCCAAATTG
+GGGTTGGCCCTCCCATTACCACAGAGATGCTCGCGACGGAATGACGTTTTTAGAAATTCTGATACGGGCG
+TGGCAGCCGTGGCGGGCGAGCAGGATGTGTGGCCGGTAAGTCATCACGACGAAAAAAATTTCGGTAGAAG
+ACATAACAATTGGTGCACGCCAGGTGAATTCGTCCTACCATCGGCGAGTGCCGGTAGTCGGGGAACTCGG
+GAGTGCGACGTCGAGCCAGCTACCAAGCACGTCGCCGTCGATAGTGATCCCGCTGGGGTCCACCGAGCAG
+CACGGTCCCCACCTGCCGTTAGATACCGATACCCGGATCGCGACCGCCGTGGCCCGGACCGTCACCGCGA
+GGCTGCACGCCGAGGACCTGCCCATTGCTCAGGAGGAATGGCTGATGGCGCCCGCCATTGCCTACGGCGC
+CAGCGGCGAACACCAGCGTTTCGCTGGAACGATCTCTATCGGCACTGAAGCCCTGACGATGTTGCTCGTG
+GAGTATGGCAGGTCGGCCGCCTGCTGGGCCCGGCGCCTGGTCTTCGTCAACGGGCACGGCGGCAATGTCG
+GCGCTTTGACCCGAGCGGTAGGCCTGCTGCGCGCTGAAGGTCGCGACGCCGGATGGTGCCCGTGCACCTG
+CCCGGGCGGTGACCCCCACGCCGGCCACACCGAAACATCCGTGCTGCTGCATCTTTCGCCGGCCGACGTG
+CGCACCGAACGGTGGCGCGCGGGTAATCGCGCACCGCTGCCCGTGTTGTTGCCGTCGATGCGCCGAGGCG
+GGGTCGCGGCCGTGAGCGAGACAGGAGTGCTCGGGGATCCGACCACGGCGACCGCGGCCGAGGGGCGGCG
+GATCTTCGCGGCGATGGTCGACGACTGTGTGCGCCGAGTCGCCCGGTGGATGCCACAGCCCGACGGGATG
+TTGACATGACCGCGCCGGCGACGATGCAGAGCGAAGCGATGAGGAGAAGCGGCGCAGATGACCGCGACCC
+GACTGCCTGACGGGTTCGCCGTCCAGGTTGACCGTCGCGTGCGAGTGCTTGGCGACGGCTCGGCCCTGCT
+CGGTGGCTCACCGACCCGGTTGCTGCGGCTGGCTCCCGCCGCACGAGGCCTGCTCTGTGACGGCCGCCTT
+AAGGTCCGCGACGAGGTCAGCGCGGAGCTGGCCCGCATCCTGCTGGACGCCACGGTGGCGCATCCACGGC
+CGCCGAGTGGGCCGTCACATCGTGACGTCACCGTCGTTATACCAGTACGGAACAACGCATCTGGTCTGCG
+GCGTCTGGTGACCTCGTTACGCGGATTACGCGTCATCGTGGTCGACGACGGTTCGGCGTGCCCGGTCGAG
+TCGGACGACTTTGTCGGCGCACATTGCGACATCGAAGTACTCCACCACCCCCACAGCAAGGGGCCGGCCG
+CGGCTCGCAACACCGGGCTAGCGGCCTGCACCACCGACTTCGTGGCGTTCCTGGATTCCGACGTGACGCC
+GCGGCGGGGATGGTTGGAATCCTTACTCGGCCACTTCTGCGATCCCACCGTCGCACTCGTCGCACCTCGC
+ATCGTCAGCTTGGTGGAAGGCGAGAACCCGGTAGCTCGCTATGAGGCCCTGCACTCGTCGTTGGACCTTG
+GTCAGCGCGAAGCGCCGGTGTTACCGCATAGCACAGTCTCTTACGTGCCGAGCGCCGCCATCGTTTGCCG
+GAGTTCAGCCATCCGCGACGTCGGCGGCTTCGACGAGACCATGCACTCCGGGGAAGATGTCGACTTGTGC
+TGGCGGCTCATCGAGGCTGGTGCTCGGCTGCGCTACGAGCCAATTGCGCTGGTCGCCCATGACCATCGGA
+CCCAATTGCGGGACTGGATCGCGCGCAAGGCGTTTTACGGCGGTTCGGCGGCTCCGCTAGCTGTGCGGCA
+CCCGGACAAGACCGCGCCGCTGGTGATTTCGGGCGGGGCGCTGATGGCGTGGATCCTCATGTCGATCGGC
+ACAGGCCTTGGTCGACTGGCGTCGTTGGTGATCGCGGTGCTGACTGGTCGCCGGATCGCCAGGGCCATGC
+GCTGCGCCGAGACGTCGTTCTTGGATGTGCTTGCCGTCGCCACCCGCGGGTTGTGGGCGGCCGCGCTGCA
+GCTGGCGTCGGCCATCTGCCGGCACTATTGGCCACTGGCATTGCTCGCGGCCATCCTGTCGCGCCGCTGT
+AGGCGGGTGGTGTTGATTGCGGCGGTAGTGGACGGTGTGGTGGATTGGCTTCGCCGCAGGGAGGGCGCCG
+ACGATGATGCTGAACCGATTGGGCCGCTGACCTACCTAGTGCTGAAGCGCGTGGACGACTTGGCTTATGG
+CGCTGGCCTGTGGTACGGGGTGGTGCGCGAACGTAACATCGGCGCGCTCAAGCCGCAGATTCGTACCTAG
+TGTGACTGCGGCGGTCCGGCATAGCGATGTGCTGGTCGTCGGTGCTGGAAGTGCTGGATCGGTTGTTGCC
+GAGCGTCTTTCCATGGACTCGAGCTGTGTGGTGACCGTGCTTGAGGCTGGCCCCGGGCTGGCCGATCCGG
+GGTTGCTGGCTCAGACGGCCAATGGGTTGCAACTGCCGATCGGAGCTGGCAGCCCTCTGGTTGAGCGTTA
+TCGGACGCGGCTCACCGATCGACCGGTTCGCCACTTGCCGATCGTGCGGGGTGCGACGGTCGGCGGTTCC
+GGCGCAATCAACGGCGGCTATTTCTGCCGCGGACTGCCCAGCGATTTCGACCGTGCCTCGATACCAGGCT
+GGGCATGGTCTGACGTTCTGGAGCACTTCCGGGCTATCGAGACAGATCTGGATTTCGAGACGCCTGTGCA
+TGGCCGTAGTGGCCCCATCCCAGTTCGCCGCACACACGAAATGACTGGCATCACTGAAAGTTTCATGGCT
+GCCGCAGAGGACGCAGGGTTCGCTTGGATCGCTGACCTCAACGATGTTGGGCCGGAAATGCCTTCGGGTG
+TAGGCGCGGTCCCGCTCAACATCGTTAACGGCGTACGCACCAGCTCGGCGGTCGGCTATCTGATGCCCGC
+GCTGGGACGGCCGAATCTGACACTGCTGGCCCGGACGCGGGCGGTGCGGTTGCGCTTTTCCGCCACCACC
+GCGGTGGGTGTCGACGCGATCGGCCCAGGAGGCCCGGTAAGCCTGAGCGCTGACCGAATCGTATTGTGCG
+CCGGAGCGATTCAGTCAGCTCATCTGTTGATGCTCTCGGGCGTCGGCGAGGAGGAGGTGTTGCGATCCGC
+CGGTGTGAAGGTGCTTATGGCGTTGCCGGTTGGCATGGGCTGCAGTGACCACCCGGAATGGGTGATGCCG
+ACCAACTGGGCGGTGGCTGTCGATCGGCCGGTGTTAGAGGTGCTGCTGAGCACTCATGACGGCATCGAAA
+TAAGGCCGTACACAGGCGGCTTCGTTGCGATGACCGGCGACGGTACAGCCGGGCATCGCGATTGGCCGCA
+TATCGGGGTGGCGCTCATGCAGCCGCGGGCACGCGGACGCATCACGTTGGTCTCGAGTGATCCCCAGATA
+CCAGTCCGCATCGAGCACCGATACGACAGTGAACCTGCCGATGTCGCGGCCCTGCGCCAGGGTAGCGCAT
+TGGCCCACGAATTATGCGGTGCGGCAACGCGCATCGGTCCAGCCGTATGGGCGACATCGCAGCATCTGTG
+TGGTAGTGCCCCAATGGGCACCGACGATGACCCACGAGCCGTCGTCGACCCGAGGTGTCGGGTCCGCGGC
+ATCGAAAACCTATGGGTGATAGACGGATCTGTCCTTCCGTCGATCACCAGTCGCGGTCCACACGCAACGA
+TCGTAATGCTGGGCCACCGCGCGGCCGAATTTGTTCAGTGACTTTCGTCGAGTGGGGCGACCACAGCGGT
+CGCTGCCGAATGTGCATTTCGGTCAGGCATTGAGCAGGGGACCGAATAGCGTAGCTCCGCATCGGACTGC
+AGTCGTCAGGTCGACGATGATGGCGCTGACATCGGAGGTGGGCCGCGGCCCAGGCTTCGCGGTTTGGCGG
+CCTGCGAAGAAGTGGCTCTTCTGACACTTCCGTGGGTGGACTTCTGGTTTGAGTAGGCGCACGTCGTTGT
+CGCTTAGGGTTTCTGGCTTGTCAAAGGACAGGACCAGCGCAGATCACTGTAGTCTTAGCTGATGCTGCCG
+CCCGGATTGCCGACGTCGTGGCCCAGCGGTGCCCCAACGCGGTCCGCCGCGTCGATCCTTTCCACGTGGT
+GGCCTGGGCCACCGAGGCTCTAGAGGCTGAACGGCGCCGGGCCTGAAACGACGCGCGAGCGCCTGCCCGG
+ACCCCGAGTCATTGGGTCGCAGGGGTAACCGAAGGGTGCACGTTGACCGCGTGAGGCTAACCGGCACCGA
+GCGTGAACTGAGGGCGGAGAATCAGAGCCCCCCGATTTTCCGCCCGCAGAACACGTTGGGCGACGGCGCC
+AACGGGCTGCCACTGGCCGTGTGCACCACGACGGCTCACACGTGCCACACTTCCCATACTCACCCATCGC
+GGTGGACCCCAAACCCAGTGCCGGCCACCAAGGGCGTCCCCGCTGGATTGGTGCAAGCAACCTTCATCAT
+CGAAAACCTTGACCCCGGCAACAACGACACGCCGACCCCCCTACACCCAAACTGCGATTAGCCCGAAAAC
+CTGGGCACCATAGGCGATCTGAATACGATGCGGATTCGGTGCTGCGGAGAAAGGATACATCGCGCCGATG
+CGTCCAGGCGGATGACGTCCGATGCGTGCAGCTGGTCCAGGATCCGCGGCGCGGACGTGTCGAACTCGGT
+GGTTACCGCGCCGAGCTTACTGTTGGCCGACGGGCGGCGGTGAATTGCCAACGCCCGCAATATGGTGCGG
+ATGGATGGCCCGTTCGGTTGGGTTGCGGGGTAGGCGGCGCCGCGCGAGGCGATCAGCGCTGAGGTCGGGA
+ATTCACCTCCGGTCGCGGGAGTACAGCGGTCGGCTGGGGTGCCGCCGGTGTCTGTCGGGTAGAGGCGGCA
+GGACACGCTCGCCGTCAAAACGGCTTCGGCAAACGGGTCTTCGCCGTCGACAGGCAGGGTTGGTGATCCC
+GGCCTCGGCGGCGACGGTCTGGTCATTGATTGTGCGATGGGTGATCGTCGTGTCGATCTGCTCGCGGCGA
+AGGACTCGGAGATCCGGCGCTCGATGGGGGCAGTACCGGTCGGCGCGGGAAGCTCGCAGGTGGCGACGAG
+TTGGGCGAGTGATCGTTGCATCCGCTGTCGGGCGGCGATTCTGTCGGCCGACTGTGCCAACTTGGCTAGG
+GCCAATTCGCGGGGCGGTCTGGCAGTCGGCGGGTCCGCTGTCAGCTAGCTGCAGCAGCTCCTCGATCTCG
+TCGAGGCTGAATCCATGGGACTACGCGCGTCTGACGGACGAGACCACCGATACCGCATCGGCGCGATACC
+GCGATAGCCCTGAGAACGACCGGGCCGGCGCGGCTAGCAGGTCCTCCGCTCGTAATAGCGCAGCGTCTGG
+CCGTTGATCCCAGCCCGCGCGGCAACCTGGCTACTCCGCATTCCGCCATTCCGAACCCTGTACTCGACTG
+TCGAGTCAAGGGTGTGTGTTGTCAGTGCCGGGTCAGGTGCCGATAGCAACCGGCCGCCCGCCGCTGCACC
+CGAGCCAGCGGCGATTTGGCCGAAGCGGTGATCTGGGGCATACTGTTCAGGTTGCCCTGCGCCAGGTTTG
+CGTCTGGCCGGGCATACGACCAGCGCCCACACGGGCGCGTCCGGTCCCACCCTTGAAGCGCGACGATTTC
+GGCCTTGAAATTGATCGCGACAAGGCTGTGTGCGGGCGACACGCCCGAGCGCGGGGCCGGTGGACCTACG
+ACAGGTAAACAGCGGCGCAGTATTCGGCGCAACGCTAGATCGGTCCAGAAGGACCGGGTCGATCGGCGCG
+CCGGGGAGCACCGGACCCGGATACGGGCTCGAGTGGGAGTGAGGTAGGAGAAGCGTGGCGGGACAGAAGA
+TCCGCATCAGGCTGAAGGCCTACGACCATGAGGCCATTGACGCTTCGGCGCGCAAGATCGTCGAAACCGT
+CGTCCGCACCGGTGCCAGCGTCGTAGGGCCGGTGCCGCTACCGACTGAGAAGAACGTGTATTGCGTCATC
+CGCTCACCGCATAAGTACAAGGACTCGCGGGAGCACTTCGAGATGCGCACACACAAGCGGTTGATCGACA
+TCATCGATCCCACGCCGAAGACCGTTGACGCGCTCATGCGCATCGACCTTCCGGCCAGCGTCGACGTCAA
+CATCCAGTAGGAGATTGGACAGAGCAATGGCACGAAAGGGCATTCTCGGTACCAAGCTGGGTATGACGCA
+GGTATTCGACGAAAGCAACAGAGTAGTACCGGTGACCGTGGTCAAGGCCGGGCCCAACGTGGTAACCCGC
+ATCCGCACGCCCGAACGCGACGGTTATAGCGCCGTGCAGCTGGCCTATGGCGAGATCAGCCCACGCAAGG
+TCAACAAGCCGCTGACAGGTCAGTACACCGCCGCCGGCGTCAACCCACGCCGATACCTGGCGGAGCTGCG
+GCTGGACGACTCGGATGCCGCGACCGAGTACCAGGTTGGGCAAGAGTTGACCGCGGAGATCTTCGCCGAT
+GGCAGCTACGTCGATGTGACGGGTACCTCCAAGGGCAAAGGTTTCGCCGGCACCATGAAGCGGCACGGCT
+TCCGCGGTCAGGGCGCCAGTCACGGTGCCCAGGCGGTGCACCGCCGTCCGGGCTCCATCGGCGGATGTGC
+CACGCCGGCGCGGGTGTTCAAGGGCACCCGGATGGCCGGGCGGATGGGCAATGACCGGGTGACCGTTCTT
+AACCTTTTGGTGCATAAGGTCGATGCCGAGAACGGCGTGCTGCTGATCAAGGGTGCGGTTCCTGGCCGCA
+CCGGTGGACTGGTCATGGTCCGCAGTGCGATCAAACGAGGTGAGAAGTGATGGCTGCGCAAGAGCAGAAG
+ACACTCAAAATCGACGTCAAGACGCCGGCGGGCAAGGTCGACGGCGCTATCGAGCTGCCGGCCGAGCTGT
+TCGACGTCCCGGCCAACATCGCGCTGATGCACCAGGTGGTCACCGCCCAGCGGGCGGCGGCACGCCAGGG
+TACCCACTCGACGAAGACGCGCGGCGAGGTCAGTGGCGGTGGCCGCAAGCCCTACCGGCAGAAGGGGACC
+GGTCGTGCCCGGCAGGGCTCGACGCGGGCGCCGCAGTTCACCGGCGGTGGCGTGGTACACGGTCCCAAGC
+CGCGCGACTACAGCCAGCGCACACCCAAGAAGATGATCGCCGCGGCGCTGCGCGGGGCGCTGTCCGACCG
+GGCCCGCAACGGGCGTATCCACGCGATCACCGAGCTAGTGGAAGGTCAAAACCCGTCGACCAAGAGCGCC
+AGGGCATTTCTGGCCAGCCTGACAGAACGTAAACAGGTGCTGGTGGTCATCGGGCGCAGCGACGAGGCCG
+GCGCGAAAAGCGTGCGCAATCTGCCGGGCGTGCACATCCTGGCGCCGGACCAGCTCAACACCTATGACGT
+GCTGCGTGCCGACGACGTGGTGTTCAGCGTTGAGGCGCTGAATGCCTATATCGCGGCCAACACCACGACG
+TCCGAGGAGGTTTCGGCCTGATGGCGACGCTCGCTGACCCCCGCGACATCATCCTGGCCCCGGTGATCTC
+GGAGAAATCCTATGGGTTGCTGGATGACAACGTGTACACGTTTTTGGTGCGCCCGGATTCCAACAAGACG
+CAGATCAAGATCGCCGTCGAGAAGATTTTTGCCGTCAAGGTCGCATCGGTGAACACCGCGAACCGGCAGG
+GCAAGCGTAAACGCACCCGGACCGGATACGGCAAGCGCAAGAGCACCAAGCGCGCCATCGTCACCCTGGC
+GCCGGGCAGCAGGCCGATCGACCTGTTCGGGGCACCGGCCTAGCCCGGCGACGATGCAGAGCGAAGCGAT
+GAGGAGGAGCAGGGCAATGCGGCCTAGCCCGGCGACGATGCAGAGCGAAGCGATGAGGAGGAGCAGGGCA
+ATGCGGCCTAGCCCGGCGACGAGAGCGTGAGAGAAAGACCTGATTAGACATGGCAATTCGCAAGTACAAG
+CCCACGACGCCTGGTCGTCGCGGCGCCAGCGTATCTGATTTCGCCGAGATCACCCGGTCAACCCCGGAGA
+AGTCGCTGGTGCGCCCGCTGCACGGTCGCGGTGGACGCAACGCGCATGGCCGGATTACCACCCGGCACAA
+AGGCGGCGGTCATAAGCGCGCTTACCGGATGATCGACTTTCGCCGCAATGACAAAGATGGTGTCAACGCC
+AAGGTCGCGCACATCGAGTACGACCCGAACCGTACCGCACGGATTGCGTTGCTCCACTATCTCGATGGGG
+AGAAGCGCTACATCATTGCACCCAACGGACTTTCGCAAGGGGATGTGGTGGAATCCGGCGCTAACGCCGA
+CATCAAGCCGGGCAACAACCTGCCATTGCGCAACATCCCGGCCGGTACCTTGATCCACGCCGTGGAGCTC
+CGCCCGGGAGGTGGCGCTAAGCTTGCGCGCTCGGCCGGGTCGAGCATCCAGCTGCTCGGCAAGGAGGCCA
+GCTACGCGTCGCTGCGTATGCCCAGCGGTGAGATCCGCCGGGTCGACGTCCGCTGCCGCGCGACCGTCGG
+CGAAGTGGGCAATGCCGAGCAGGCAAACATCAACTGGGGCAAGGCCGGTCGGATGCGGTGGAAGGGTAAG
+CGCCCGTCGGTCCGGGGCGTGGTGATGAACCCGGTCGACCACCCGCACGGCGGTGGTGAGGGTAAGACCT
+CCGGCGGCCGTCACCCGGTTAGCCCGTGGGGCAAGCCTGAGGGGCGTACCCGCAATGCGAACAAGTCGAG
+CAACAAGTTCATCGTCCGACGCCGGCGCACCGGCAAGAAGCACTCGCGTTAGCCGCGCAATCAGATCTAG
+GGAGTTTCAGGAGTAGCCAACCATGCCACGCAGCCTGAAGAAGGGCCCGTTCGTCGACGAGCATCTGCTC
+AAGAAGGTCGATGTCCAGAACGAGAAGAACACCAAGCAGGTCATCAAGACCTGGTCGCGTCGGTCGACCA
+TCATTCCGGACTTCATCGGCCATACCTTTGCGGTGCACGACGGCCGCAAGCACGTCCCCGTGTTCGTCAC
+CGAATCGATGGTGGGCCACAAACTTGGTGAGTTCGCGCCGACACGCACCTTCAAGGGCCACATTAAAGAC
+GACCGAAAGAGCAAGCGGCGATGACTGCGGCTACTAAGGCTACCGAGTATCCCTCGGCGGTCGCCAAGGC
+CCGATTTGTGCGGGTGTCGCCAAGAAAGGCGCGCCGGGTGATCGATCTGGTGCGTGGCAGGTCGGTGTCA
+GACGCGCTCGACATCCTGCGCTGGGCGCCGCAGGCCGCCAGCGGTCCGGTGGCCAAAGTGATCGCCAGTG
+CGGCGGCCAACGCGCAAAACAACGGCGGGCTGGACCCGGCAACCTTGGTGGTGGCCACCGTGTACGCCGA
+CCAGGGACCGACCGCCAAGCGCATCCGTCCGCGCGCCCAGGGCCGCGCGTTCCGCATCCGCCGGCGCACT
+AGCCACATCACGGTGGTGGTGGAAAGCCGGCCGGCCAAAGATCAACGGTCGGCGAAATCGTCGCGGGCCC
+GCCGCACCGAGGCCAGCAAGGCCGCCAGCAAGGTCGGGGCTACGGCGCCGGCCAAGAAAGCGGCCGCCAA
+AGCGCCCGCCAAGAAGGCACCCGCCAGTTCCGGCGTTAAGAAGACACCCGCAAAGAAAGCGCCCGCCAAG
+AAGGCGCCCGCCAAGGCTTCTGAGACTTCTGCAGCGAAGGGAGGCTCAGACTAGTGGGCCAAAAGATCAA
+TCCGCATGGCTTCCGGCTGGGCATCACCACCGACTGGAAGTCGCGCTGGTATGCCGACAAGCAGTATGCC
+GAGTACGTCAAGGAGGACGTGGCGATCCGCCGGCTGCTGTCCAGTGGCCTAGAGCGTGCTGGGATCGCCG
+ATGTAGAGATCGAGCGGACCCGCGACCGGGTCCGGGTGGACATTCACACCGCGCGTCCGGGCATCGTCAT
+TGGTCGGCGTGGGACCGAGGCCGACCGGATTCGTGCCGACCTGGAAAAGCTGACCGGCAAGCAGGTCCAG
+CTCAACATCCTGGAGGTCAAAAACCCGGAGTCGCAAGCGCAATTAGTGGCCCAGGGGGTAGCCGAGCAGT
+TGAGCAACCGGGTGGCGTTCCGCCGCGCAATGCGCAAGGCGATCCAGTCGGCGATGCGTCAGCCCAACGT
+CAAGGGAATCCGGGTGCAGTGCTCGGGCCGCCTCGGCGGCGCGGAAATGAGCCGCTCGGAGTTCTACCGC
+GAGGGCCGCGTCCCGCTGCACACCTTGCGGGCAGATATCGACTACGGCCTATACGAGGCCAAGACCACCT
+TCGGCCGGATCGGTGTGAAGGTGTGGATCTACAAGGGTGACATCGTGGGCGGCAAACGTGAATTGGCTGC
+CGCCGCGCCAGCGGGCGCCGACCGTCCGCGCCGTGAGCGGCCGTCGGGCACGCGCCCCCGTCGCAGCGGT
+GCTTCGGGCACCACGGCGACCGGTACCGACGCGGGTCGGGCCGCGGGTGGCGAAGAGGCCGCGCCTGACG
+CCGCAGCGCCCGTTGAAGCGCAGAGCACGGAGAGCTGAATCATGTTGATTCCCCGTAAGGTTAAACATCG
+CAAGCAGCACCATCCTCGCCAGCGCGGCATCGCCAGCGGCGGCACCACGGTGAACTTCGGCGACTACGGC
+ATTCAGGCCCTTGAGCACGCCTATGTCACCAACCGGCAGATCGAATCGGCGCGTATCGCCATCAACCGGC
+ACATCAAGCGTGGCGGCAAGGTTTGGATCAACATCTTCCCTGACCGCCCGCTGACCAAGAAGCCCGCCGA
+AACCCGCATGGGTTCGGGCAAGGGCTCGCCGGAGTGGTGGGTAGCCAACGTTAAGCCGGGCCGGGTGCTG
+TTCGAGCTCAGTTACCCCAATGAAGGTGTCGCCCGGGCCGCGCTCACCCGAGCGATCCACAAGCTGCCGA
+TCAAGGCACGCATTATTACTCGAGAGGAGCAGTTCTGATGGCAGTGGGTGTCTCGCCGGGCGAACTGCGT
+GAGCTCACCGACGAGGAGCTGGCCGAGCGGTTGCGCGAGTCCAAGGAAGAGTTGTTCAACTTGCGTTTCC
+AGATGGCGACCGGCCAGCTCAACAATAACCGCCGGCTCCGTACGGTGCGTCAGGAAATCGCGCGCATCTA
+CACCGTGCTGCGCGAACGAGAACTGGGTCTGGCGACTGGGCCCGATGGTAAGGAATCGTGATGGCAGAGG
+CTAAGACCGGCGCGAAGGCGGCGCCTAGGGTGGCTAAGGCCGCCAAGGCGGCCCCCAAGAAGGCCGCACC
+CAACGACGCTGAGGCCATAGGTGCGGCCAACGCGGCAAACGTTAAGGGGCCCAAGCACACTCCGCGTACT
+CCGAAGCCACGCGGCCGCCGCAAGACACGAATCGGCTATGTGGTGAGCGACAAAATGCAGAAGACCATTG
+TGGTGGAGCTGGAAGACCGCATGCGGCACCCGCTATACGGCAAGATCATCCGGACCACTAAGAAGGTCAA
+GGCACACGACGAAGACAGCGTTGCCGGCATTGGCGACCGTGTCTCGCTGATGGAGACGCGTCCGCTGTCG
+GCGACCAAGCGCTGGCGGCTCGTCGAGATCCTCGAGAAGGCTAAGTAAGCCTGACGAGCAGTCGCAAAAG
+CCCCCGACACGCGCGGCGTGCGGGGGCTTTTGCGACTGCTCGCCCAACCAGCGCGGCGTCAGTGCGGAAA
+TCCTCAGCTGATTCCTACCCTGTGCGTGTAGTGTACACAACCGTTCATTAACTCCACGGGGAAGTGAGGC
+TGGCTTATGGCACCCGAGGCCACCGAGGCGTTCAACGGCACCATCGAGCTGGATATTCGTGATTCGGAGC
+CGGATTGGGGCCCATACGCAGCGCCGGTGGCACCGGAGCACTCACCAAACATCCTTTATCTGGTCTGGGA
+CGACGTCGGCATCGCGACCTGGGACTGCTTTGGCGGCCTGGTCGAGATGCCCGCGATGACGCGCGTCGCC
+GAGCGTGGCGTGCGACTGTCGCAATTTCACACCACCGCACTGTGCTCGCCGACCCGGGCGTCGCTGCTGA
+CCGGTCGCAACGCCACCACCGTAGGCATGGCTACCATCGAAGAGTTCACCGACGGGTTCCCCAACTGCAA
+CGGGCGGATCCCGGCTGACACCGCGTTGCTCCCAGAGGTGCTGGCCGAACATGGCTACAACACCTACTGT
+GTGGGCAAGTGGCACCTGACGCCACTCGAATAATCCAATATGGCGTCGACGAAGCGGCACTGGCCGACCT
+CGCGTGGGTTCGAGCGGTTCTACGGATTCCTAGGCGGGGAGACCGACCAGTGGTATCCCGACCTGGTATA
+CGACAACCACCCAGTGAGTCCTCCCGGCACACCCGAGGGTGGCTACCACCTGTCAAAAGACATCGCCGAC
+AAGACGATCGAGTTCATTCGTGATGCCAAGGTGATCGCGCCCGACAAGCCGTGGTTCAGCTACGTGTGCC
+CAGGCGCCGGGCATGCGCCGCACCACGTCTTCAAGGAATGGGCGGACAGATACGCCGGCCGATTCGACAT
+GGGGTATGAGCGCTATCGCGAGATCGTGCTGGAAAGGCAAAAGGCGCTAGGGATCGTGCCACCCGACACC
+GAACTGTCGCCCATAAACCCTTATCTGGATGTGCCGGGGCCAAACGGCGAGACCTGGCCGCTGCAGGACA
+CGGTGCGGCCGTGGGACTCGCTGAGCGATGAAGAAAAGAAGCTGTTTTGCCGGATGGCCGAGGTGTTCGC
+CGGCTTTCTGAGCTACACCGACGCCCAGATCGGACGGATCCTGGACTACCTCGAGGAATCCGGCCAGCTG
+GACAACACCATCATCGTGGTGATCTCCGACAACGGCGCCAGCGGCGAGGGCGGACCCAACGGATCGGTCA
+ACGAAGGCAAGTTCTTCAACGGCTACATCGACACCGTCGCTGAAAGCATGAAGCTCTTCGACCACCTCGG
+TGGCCCGCAGACCTACAACCACTACCCCATCGGGTGGGCAATGGCCTTCAACACCCCCTACAAGCTGTTC
+AAGCGCTACGCCTCGCATGAAGGCGGCATTGCCGACCCGGCAATCATCTCCTGGCCCAACGGCATTGCCG
+CACACGGTGAAATCCGCGACAACTACGTCAATGTCAGCGACATCACGCCCACCGTCTACGACCTGTTGGG
+CATGACACCGCCGGGGACCGTCAAGGGGATTCCGCAGAAACCGATGGACGGCGTGAGCTTCATAGCGGCC
+CTTGCCGACCCGGCCGCCGACACCGGCAAGACCACCCAGTTCTACACCATGCTGGGCACCCGCGGGATCT
+GGCATGAAGGTTGGTTCGCCAACACCATTCACGCGGCCACGCCCGCCGGCTGGTCGAATTTCAACGCTGA
+CCGCTGGGAACTGTTCCACATCGCAGCAGACCGCAGCCAGTGCCACGACCTGGCCGCCGAGCATCCCGAC
+AAACTTGAGGAGCTCAAGGCGCTGTGGTTCTCCGAAGCCGCCAAGTACAACGGGCTGCCGCTGGCCGATC
+TGAACCTCCTGGAAACGATGACTCGGTCGCGGCCTTACCTGGTCAGCGAACGAGCCAGCTACGTCTACTA
+TCCCGACTGCGCTGACGTCGGCATCGGCGCGGCCGTAGAGATTCGCGGGCGCTCGTTCGCCGTGCTGGCC
+GATGTGACCATCGATACCACCGGCGCCGAGGGCGTGCTGTTCAAGCACGGCGGCGCCCATGGCGGGCACG
+TGCTGTTCGTCCGGGACGGACGCTTGCACTACGTCTACAACTTCCTCGGTGAGCGCCAGCAGCTGGTCAG
+CTCGTCGGGTCCGGTCCCGTCGGGAAGACATCTACTCGGGGTTCGTTATTTGCGGACCGGAACCGTGCCC
+AACAGTCACACGCCGGTGGGCGATCTTGAGCTGTTCTTCGACGAGAACCTGGTCGGCGCCCTGACCAATG
+TGCTGACCCACCCTGGAACGTTCGGGTTGGCCGGCGCCGCTATCAGCGTTGGCCGCAACGGCGGTTCGGC
+TGTGTCCAGCCACTACGAAGCGCCGTTCGCGTTCACCGGCGGTACCATCACCCAGGTCACCGTCGACGTG
+TCAGGCCGACCGTTCGAAGATGTGGAATCCGATCTTGCGCTTGCTTTTTCGCGTGACTGAGCGGTCTGCT
+GTGACGCGGGACGGCGTGGTCGGCATACGCTGAAGTCGTGCTGACCGAGTTGGTTGACCTGCCCGGCGGA
+TCGTTCCGCATGGGCTCGACGCGCTTCTACCCCGAAGAAGCGCCGATTCATACCGTGACCGTGCGCGCCT
+TTGCGGTAGAGCGACACCCGGTGACCAACGCGCAATTTGCCGAATTCGTCTCCGCGACAGGCTATGTGAC
+GGTTGCAGAACAACCCCTTGACCCCGGGCTCTACCCAGGAGTGGACGCAGCAGACCTGTGTCCCGGTGCG
+ATGGTGTTTTGTCCGACGGCCGGGCCGGTCGACCTGCGTGACTGGCGGCAATGGTGGGACTGGGTACCTG
+GCGCCTGCTGGCGCCATCCGTTTGGCCGGGACAGCGATATCGCCGACCGAGCCGGCCACCCGGTCGTACA
+GGTGGCCTATCCGGACGCCGTGGCCTACGCACGATGGGCTGGTCGACGCCTACCGACCGAGGCCGAGTGG
+GAGTACGCGGCCCGTGGCGGAACCACGGCAACCTATGCGTGGGGCGACCAGGAGAAGCCGGGGGGCATGC
+TCATGGCGAACACCTGGCAGGGCCGGTTTCCTTACCGCAACGACGGTGCATTGGGCTGGGTGGGAACCTC
+CCCGGTGGGCAGGTTTCCGGCCAACGGGTTTGGCTTGCTCGACATGATCGGAAACGTTTGGGAGTGGACC
+ACCACCGAGTTCTATCCACACCATCGCATCGATCCACCCTCGACGGCCTGCTGCGCACCGGTCAAGCTCG
+CTACAGCCGCCGACCCGACGATCAGCCAGACCCTCAAGGGCGGCTCGCACCTGTGCGCGCCGGAGTACTG
+CCACCGCTACCGCCCGGCGGCGCGCTCGCCGCAGTCGCAGGACACCGCGACCACCCATATCGGGTTCCGG
+TGCGTGGCCGACCCGGTGTCCGGGTAGTGCCAACTTCGCATGAGGAACTGCACACCCAGCAGGGCGTCAG
+TCGGCGCGACGAGTCACTCCCGGGGGCTACGCATGAATTCGACTACCGGAGCGGGCCTGGCTGGGCGTGG
+GCGCGCGCAGTTGTACGGCCCCAACGGCGTGTCGCTGTACAAACACACGCCCTCGCTGGTCCGGTTGCCC
+CAAAAAGCCAAGCCCCCCAAACCAGTTGCTCGCCAGCAATGACGCCGGTTGCTACCATCTGACTCCGTGT
+CGCTTCCCGGGGCAGGCCTGGGGCAGTGGGTTATCCGGTGATGACCGATGGCCGGTAGCGACCCACCAAC
+AGGTGGGCCGGCGTCGCAGGCGGGTTCAGACGCGGGAGCCTCGCCAGAACACAAACACATGTCGCGGCGA
+AAGCACCTCGTGCTCGATGTCTGCATCATCCTGGGTGTTCTCATTGCCTACGTCTTTTCGCTGCTCGGCT
+ACGACTGGTTGGCCCACACACCGGGTCCGCTTCCGCAGCCGGACGTGGGCACGACTGACGACACCGTGGT
+TTTGATCCGCTTCGAGGAGCTGCACACTGTGGCAAATCGCCTCGATGTGAAAGTGCTGGTGCTGCCCGAC
+GATTCGATGATCGACCATCGCCTCCAAGTGTTGACTACCGACACCTCGGTGCGGTTGTATCCGGAGAACG
+AACTCGGAGATCTGCAGTACCCGGTAGGAAAGCTGCCCGCGCAAGTAGCGACCACGATCGAGGCGCACGG
+CAACCCGGGCGCCTGGCCATTCGATACATACACCACCGATACGGTCCAGGCCGATGTGCTCGTCGGCGCT
+GGCGACAACCGTCAATACGTACCCGCCCGGGTCGAAGTGACCGGATCGCTGGAAGGCTGGGACATCAGCG
+CCGTCCGCGTCGGGGAAAGCAGCCAAACCTCTGATCGCCCGGACAATGTCATCATCACCCTGAAGAGGGC
+CAAGGGTCCGCTGGTTTTCGACCTGGGCATCTGCCTGGTGCTGATCACATTGCCGACGTTGGCCTTGTTC
+GTGGCCATCCAGATGATTACCGGCCGCAGAAAATTCCAACCACCGTTCGGCACTTGGTACGCCGCGATGT
+TGTTCGCTGTCGTGCCGCTGCGCACTATTCTCCCGGGCTCGCCGCCGGCGGGTGCGTGGATTGACCGGGC
+CGTTGTGATCTGGGTGCTCATAGCGCTGGCGGCGGCGATGGTGGTGTACATCGTCGCCTGGTACCGAGAA
+TCGGACTAGGGCGGGCGTCAGATGGCTTCTGTCGACGCGTCCGGAGGGTTTCCGCTGGATTTCATAAACA
+GGCGCTAGCGCGGTGTCCAACGATACGATTGGGGCCCATGCGGCCCGACGAGATCGGCTCGCTGCGGGCC
+GGCCTGGCGGCTGTTGCGCGGTGAACTCAAAACGCGTTGACGCCGGATCAGCTATCCGATGATTCAGGCG
+GAGATCTCGACGATCGTGGGCGCTACCGCCAATCCGGTATCCGGGTAGATCATGATCGACATGGGTTGAT
+CTGCCCTGGTGGGGCGGACTCACATTAGCGAAATTTTGCGCTGAGTAGGTCGTCCCCTAAACTTCAGGGG
+TTGCCGTGAGCAGACCTCGGCCGGCGCGCATAAGCTTTGCTTGGTCGGCCCCGCGTGCCCGTCGGCGACA
+AAGACCGCGCACGTCAGGGATGGTCCTGGCTGGCTCCTCCTACCGTGCACACGTCAACCAGGTCAGGAGA
+TCTAGTGATTCAGCAGGAATCGCGGCTGAAGGTCGCCGACAACACCGGCGCCAAGGAGATCTTGTGCATC
+CGGGTGCTGGGCGGTTCGTCGCGACGCTACGCCGGCATCGGTGACGTCATCGTCGCCACCGTGAAGGACG
+CCATTCCGGGCGGCAACGTTAAGCGGGGGGATGTCGTCAAGGCCGTCGTGGTGCGCACAGTCAAGGAACG
+CCGACGTCCCGACGGCAGCTACATCAAGTTCGACGAGAACGCCGCGGTGATCATCAAGCCCGACAACGAC
+CCGCGCGGCACCCGCATTTTTGGACCGGTCGGTCGCGAGCTGCGGGAGAAGCGGTTTATGAAGATCATTT
+CGCTGGCCCCGGAGGTGTTGTAGATGAAGGTCCACAAAGGCGACACCGTGCTGGTGATTTCGGGCAAAGA
+TAAAGGGGCCAAGGGCAAAGTCTTGCAGGCGTATCCGGACCGCAACCGGGTATTGGTCGAGGGTGTCAAC
+CGGATCAAGAAGCACACCGCGATCTCGACCACCCAGCGGGGCGCGCGTTCGGGTGGGATCGTCACCCAGG
+AAGCGCCGATCCATGTCTCCAACGTGATGGTGGTTGACTCCGACGGCAAGCCCACCCGAATCGGCTATCG
+GGTCGACGAGGAGACCGGCAAGCGCGTCCGTATCTCCAAGCGCAACGGCAAGGACATTTGATGACCACTG
+CACAGAAGGTTCAGCCGCGCCTCAAGGAGCGCTACCGCAGTGAGATTCGGGATGCGCTGCGCAAGCAGTT
+CGGCTACGGCAATGTCATGCAGATCCCGACGGTGACGAAAGTCGTCGTCAACATGGGTGTCGGCGAGGCC
+GCCCGGGACGCCAAGTTGATCAACGGGGCGGTCAACGATTTGGCGCTGATCACCGGGCAGAAGCCGGAAG
+TCCGCCGGGCGCGCAAGTCCATCGCGCAGTTCAAATTGCGTGAGGGCATGCCGGTGGGCGTCCGAGTCAC
+GCTGCGCGGTGACCGGATGTGGGAGTTCCTTGACCGGCTCACGTCGATCGCACTGCCACGCATCCGTGAC
+TTCCGTGGGCTTTCGCCCAAACAGTTCGACGGTGTGGGCAACTACACCTTCGGGCTGGCCGAGCAGGCGG
+TATTCCACGAGGTCGACGTGGACAAGATTGACCGGGTCCGTGGCATGGACATCAACGTCGTCACTTCCGC
+GGCGACCGACGACGAAGGCCGAGCGCTGTTGCGGGCCCTCGGCTTTCCCTTCAAGGAGAACTGAGCAGAT
+GGCGAAGAAGGCACTGGTCAACAAGGCCGCAGGCAAACCGAGGTTTGCCGTGCGCGCCTACACCCGTTGC
+AGCAAGTGCGGCCGCCCGCGTGCGGTCTACCGCAAGTTCGGGCTGTGCAGGATTTGCCTGCGCGAGATGG
+CGCACGCGGGTGAGTTGCCCGGCGTGCAGAAGAGCAGCTGGTAACGGGACACGGGGACTAGAACATATGA
+CCGCGCTGACGACGATGCAGTGGGGGTACCCCCAGACGCGCAGCGGCGAGGGGGCCGCAAGCGATGAGGA
+GGAGTAGCGCTCGATGACCGCGCTGACGACGATGCAGAGCGCAAGCGATGAGGAGGAGTAGCGCTCGATG
+ACGATGACGGACCCGATCGCAGACTTTTTGACCCGTCTGCGTAACGCCAACTCGGCGTATCACGACGAGG
+TCAGCTTGCCGCACTCCAAGCTCAAGGCCAACATCGCGCAGATTCTCAAGAACGAGGGGTACATCAGCGA
+CTTCCGAACCGAGGACGCTCGGGTCGGTAAATCGCTGGTTATCCAGCTCAAGTACGGCCCTAGCCGGGAG
+CGCAGCATCGCCGGGTTGCGGCGGGTGTCCAAGCCCGGCCTGCGGGTGTACGCGAAATCCACCAATCTGC
+CGCGGGTGCTCGGCGGCCTGGGCGTGGCGATCATCTCGACCTCCTCGGGCCTGCTGACTGACCGGCAGGC
+AGCTAGACAGGGCGTGGGCGGCGAAGTCCTCGCATATGTCTGGTGAGAGTGTGGTGAGAGGAAGCAACCA
+TGTCGCGTATTGGTAAGCAGCCGATTCCGGTGCCCGCCGGGGTCGACGTCACGATCGAGGGACAGAGCAT
+CTCGGTTAAGGGGCCCAAGGGCACCCTAGGACTGACGGTCGCCGAGCCAATCAAAGTGGCACGCAATGAC
+GACGGCGCTATCGTGGTCACCCGTCCCGACGATGAGCGGCGTAATCGCTCCTTACACGGGCTGTCCCGTA
+CCCTGGTGTCCAACCTGGTCACTGGCGTGACGCAGGGGTACACCACCAAGATGGAGATCTTCGGGGTTGG
+CTATCGGGTGCAGCTCAAGGGCTCCAATCTGGAGTTTGCGCTGGGGTACAGCCACCCGGTGGTGATCGAG
+GCTCCCGAAGGAATCACGTTCGCCGTCCAGGCACCGACGAAGTTCACCGTTTCCGGGATCGACAAACAAA
+AAGTCGGCCAGATCGCCGCCAATATCCGCCGTCTTCGCCGTCCCGATCCGTACAAGGGCAAGGGCGTGCG
+CTACGAGGGCGAGCAGATCCGCCGCAAGGTCGGAAAGACAGGTAAGTAGCCATGGCGCAATCAGTTTCCG
+CGACTCGACGAATCTCCCGCCTGCGCCGGCACACGCGGCTGCGGAAGAAGCTCTCGGGCACCGCGGAGCG
+CCCGCGGCTGGTGGTGCATCGGTCCGCGCGGCACATCCACGTGCAACTGGTGAACGACCTCAACGGCACC
+ACCGTGGCCGCCGCTTCGTCGATCGAGGCCGATGTGCGCGGCGTGCCGGGTGACAAAAAGGCCCGCAGTG
+TGCGGGTCGGCCAGTTGATCGCCGAGCGGGCCAAAGCCGCCGGCATCGACACCGTGGTATTCGACCGCGG
+CGGGTATACCTACGGCGGACGAATCGCCGCGCTGGCCGACGCCGCACGCGAGAACGGATTGAGTTTCTGA
+TGAACGGGAGGACCGCATAATGGCGGAGCAGCCGGCCGGACAGGCAGGCACTACCGACAACCGTGACGCA
+CGGGGTGATCGGGAGGGCCGGCGCCGCGACAGCGGCCGCGGCAGTCGTGAACGGGATGGCGAGAAGAGCA
+ACTATCTAGAGCGGGTCGTCGCCATCAACCGCGTCTCCAAGGTGGTCAAGGGTGGTCGGCGCTTCAGCTT
+CACCGCTTTGGTCATCGTGGGCGACGGTAACGGGATGGTCGGTGTCGGCTACGGCAAGGCCAAGGAAGTA
+CCGGCCGCGATCGCCAAGGGCGTCGAAGAGGCGCGCAAAAGCTTCTTCCGGGTACCGCTGATCGGCGGCA
+CCATCACGCACCCGGTGCAGGGCGAGGCGGCCGCCGGTGTGGTGTTGCTACGGCCGGCCAGCCCGGGTAC
+CGGTGTGATCGCCGGTGGTGCGGCCCGCGCGGTGCTGGAATGTGCGGGGGTGCACGACATCTTGGCCAAG
+TCGCTGGGCAGTGACAACGCGATCAATGTGGTGCACGCCACCGTGGCCGCGCTCAAGCTGCTGCAGCGTC
+CGGAGGAGGTGGCGGCGCGCCGCGGTTTGCCGATAGAGGACGTCGCCCCGGCCGGGATGCTGAAGGCGCG
+TCGGAAAAGTGAAGCGCTGGCCGCCAGCGTTTTGCCGGATAGAACGATATAGCCATGTCACAGCTGAAGA
+TCACCCAGGTGCGCAGCACCATCGGAGCACGCTGGAAGCAGCGCGAGAGCCTGCGCACTCTGGGCTTACG
+AAGGATTCGTCATTCGGTGATCCGTGAAGACAACGCAGCGACTCGCGGACTGATCGCGGTGGTGCGTCAC
+CTCGTGGAGGTTGAGCCCGCGCAGACCGGAGGGAAGACATAGTGACGCTCAAGCTGCATGACCTGCGCCC
+CGCGCGGGGGTCCAAGACCGCCCGCACCCGAGTCGGTCGAGGTGACGGCTCCAAGGGCAAGACGGCCGGC
+CGTGGCACCAAGGGCACCAGGGCCCGCAAGCAGGTGCCGGTGACCTTCGAGGGCGGGCAGATGCCGATCC
+ACATGCGGCTGCCCAAGCTCAAGGGCTTCCGTAACCGGTTTCGCACCGAATACGAAATTGTCAACGTCGG
+CGACATCAACCGGCTGTTTCCGCAGGGTGGTGCCGTCGGCGTGGACGACCTGGTGGCCAAGGGGGCCGTC
+CGCAAGAACGCTCTGGTCAAGGTGTTGGGTGACGGCAAGCTGACCGCCAAGGTCGACGTGTCCGCGCACA
+AGTTCAGCGGCAGCGCGCGCGCGAAGATCACCGCAGCGGGCGGTTCAGCCACCGAGCTCTAGTTTCGGGC
+GAGCAGACGCAAAATGCCCCCGAAATGCCCATTTTCGGGGGCTTTTGCGTCTGCTCGCGGGCCCTTGGCG
+GCCGGTGGGTACGCTGGGTGAATATGGTTGCCTTTCTGCCTTCCATTCCCGTTGTCGAGGACCTACGCGC
+CCTGGTCGGCCGGGTTGATACCGCCCGCCACCACGGTGTACCCAACGGCTGCGTGCTCGAATTCAACCTG
+CGGTCGGTGCCGCCGGAGACGACGGGCTTCGACCCTCTTACGGTGCTCACCGGGGGTGGGCGGCCGATGG
+CGCTGCGCGATGCGGTCGCCGCGATCCACCGTGCCGCCGAGGACCCCCGGGTAGCCGGGCTGATAGCCCG
+CGTGCAGCTTCCGCCCTCGCCGGCGGGGGCGGTTCAGGAGCTGCGGGAGGCCATCGCGGCCTTCAGTGCG
+GTCAAGCCGTCGCTGGCCTGGGCCGAAACTTATCCGGGCACCCTGTCCTACTATCTGGCTTCGGCGTTCG
+GTGAGGTCTGGATGCAACCCTCGGGGAGTGTGGGGCTGGTCGGCTTCGCCACCAACGCCACATTCCTGCG
+CGACGCCCTGCACAAGGCGGGCATCGAGGCCCAGTTCGTCGCCCGGGGCGAATACAAGTCGGCGGCAAAC
+CTTTTCACCGAGGATGGCTTCACAGACGCCCACCGCGAAGCGGTCACGCGGATGCTGGACAGTCTGCAGG
+ACCAGGTGTGGCAGGCGGTCGCCAAGTCGCGCAATATCGGCGTCGATGCGCTTGATGAGCTGGCTGACCG
+GGCTCCGCTATTGCGGGACGACGCCGTGACTTGCGGTCTGATCGACCGGATCGGATTTCGCGACCAAGCC
+TACGCCCGTATGGCGGAATTGGTTGGTGTGGAAAAAGGTTCACCGGAATCCAGTGGCTCGCAAACAAGCC
+CAGACGAAAAGCCGCCGCGGATGTACCTGGCGCGCTACGCCAGTTCGGCCCGGCCACGGCTGACGCCCCC
+CGTCCCATCGATTCCTGGTCGCCGGTCCAAGCCGACGATCGCGGTGGTGACCCTGGAAGGCCCGATCGTC
+AACGGTCGTGGTGGGCCCCAGTTTCTGCCGCTCGGTCCGTCGAGCGCCGGCGGTGACACCATCGCGGCAG
+CGCTGCGGGAGGTGGCCGCCGACGATTCGGTGTCGGCGATAGTGCTGCGGGTCGACAGTCCGGGGGGCTC
+GGTCACCGCATCGGAGACTATCTGGCGTGAGGTGGCCAGGGCCCGCGACCGTGGCAAACCGGTGGTGGCG
+TCGATGGGTGCGGTCGCCGCCTCCGGTGGCTATTACGTGTCGATGGGTGCCGACGCCATCGTGGCCAACC
+CGGGCACCATCACCGGGTCGATCGGTGTGATCACCGGAAAGCTGGTGGTTCGGGATCTCAAGGACCGGTT
+GGGTGTCGGGTCGGATGCGGTGCGCACCAACGCTAATGCCGATGCCTGGTCGATCGACGCACCCTTCACC
+CCGGACCAGCAGGCCCATCGCGAGGCGGAGGCGGACTTGTTCTACAGCGACTTCGTGGAACGCGTCGCCG
+AGGGCCGCAAGATGACTACCGACGCCGTGGACGTCGTTGCGCGAGGCCGGGTCTGGACCGGTGCCGACGC
+TCTCGATCGCGGCCTGGTCGACGAACTCGGCGGCCTTCGAACCGCGGTGCGTCGCGCGAAGGTGCTAGCC
+GGACTAGATGAGGACACCGAGGTTCGCATAGTCAGTTATCCGGGGTCGTCACTCTGGGACATGGTGCGAC
+CGCGTCCGTCGTCACGACCGGCAGCGGCATCGCTGCCGGATGCTATGGGTGCGCTGCTTGCCCGTTCGAT
+CGTCGGCATCGTCGAGCAGGTGGAACAGACTCTCAGTGGTGCCAGCGTGTTGTGGCTGGGGGAGTCGCGC
+CTCTAGCCGTTCAAACGACCGCTGATGAAGATGATTTCGCCGAGCGGATCGTCGTCGTGTGGGGCGGGAA
+CGGGCAAACCATTGCGCCTGAATAGGTCGGTCCGCACTGTGCCCTCAACGTCCCAGCCCTTGGCGCGCAG
+GTAGTCGACGACGTGGCTGCGTTCGCCGGAATACACCAGCGACGCCATGTCGATGTCCACGCCGTGCTTG
+CGAAACGAATCCGCCATTTCTCGTACCCGGCCTGCGTCGAAATCCACAATGCCCGGGACAAGTTCGGTAG
+CGATCGTGCTGCCCGCAACACTGAGTTCGGTGCTGTTGTCGAACAACCGGTCCTGGGATCCGGCGGCAGG
+TAGATCAGCATGCCTTCGGCCAACCATGCTGTCGGTGCCGTCGAGTCCAGGCCGGCAGCTTGCAGTGCCG
+CCGGCCAGTCCGCGCGCAAGTCGATGTACACCGTGCGCCGAATGGCGGTGGGCTTGGCGCCGATGCCGGC
+CAAGGTGGTTGTCTTGAAGTCGATCACCTGTGGTTGGTCGATCTCGTAGACCACGGTGCCGGCCGGCCAC
+GGCAACCGATAGGCGCGCGCGTCCAACCCGGCTGCCAGGATCACCACTTGTCGCACTCCGCCGTCCGTGG
+CAGTGCGGAAGTAGTCGTCGAAGTACTTGGTGCGCACCGCTATCCCGTCGATCATCGCCTGTGCCCGCCC
+CGGCGAAAGGTTCCCGGTCGTCGCGATATCGAGCTCGCCGTCGATCAACTTGGTGAAGAAATCCAGCCCG
+ACCGCGCGCACCAGCGGTTCGGCGAACGGGTCGTTGATCAAACCTCGTGGATCCTTGGTCGCCAACGCGC
+GTCCGGCAGCAACCATGGTCGCGGTAGCCCCGACGCTGGAGGCTAGATCCCAGTTGTCGTCGTGAGCGCG
+CGGCATCTGCGCCCTATGTCCGGGTCGCAGCGACGTAGTTCATTGTGCCGGGACGGCCGCTGCAGCGCTG
+AGGTCGGCCAGTGTACGCGACCGCCAACTCAGCCGGTAAGCCCTGGCGGCGGTGGAGCAGTCGTCGAAGC
+CTGGTGAGCATCACTGCGAGTCATCGTGTAGGCGGCCGATTTCGACAGTTCATTGACGGGGCAAGCGGTA
+TGGCGCCACGAAGGTGCTGGCTTGCGGTGTGCTGGGTACTGTCTGTGTTTCCGTTGCAACCTGGCGCTGA
+CATAGAAGAAATCAGGCAACGGCACTTCTTCGTCCTCGAACGGTTGAAATCCGTTGGCGGTCAGCAGGTC
+CTGGGATTTGATCTCGGTCAGCAGCCAACCATTGTCGGATAGGTACGAGGCGGGCTCGTTGCGGTCGCCG
+AAGTACACCAGCTCATTCATGTCTAGATCGAAACCGTATGCGCGCCAACGATTGGCGAGGATCGTCATGC
+GCTCCCTCATCCGTTCCTCATGATGCGGCTTGAAGTTGCGTATGCTCTCGGTTGCAAACCTGCTGTCCGG
+CACACTGAGCGCGGTGACATTGTCCAACAAGCGGTCCTGCGCTTCCGGCGGGAGGTAGCGGAGCAACCCT
+TCAGCGCTCCACGCGGTGGGCTGGGTCGGGTCGAATCCCGCCGCGCCCAACGCGGTGGGCCAATCCGCAC
+GCAAATCGGCGGTGACCACGCGCCGGTCGGCGGTGGGCGTGGCGCCCAGTTCGGCGAGTGTGCGAGTTTT
+GAACTCCATGACTTGCGGTTGGTCGATCTCATACACCACGGTCTGGGCGGGCCAGGCCAGCCGGTATGCC
+CGGGAATCCAATCCTGAGGCCAGGATCACGACCTGCCTGATGCCCGCGCGTGTCGCATCCATGAAGAACT
+CGTCGAAGAACTTGGTGCGGACGGCATGGTGTTCGGCCATACGGACCATGGACGCATTCGGGCGTTCCGG
+ATCGTCGATGTCTGAGGCCGTCAATTCCCCGCTCGCGAGCCGGGTCAGAACGTCCACCCCCACCGCCCGG
+ACCAGCGGCTCAGCGAACTGATCGTTGATCAGTGGGTTGGCGGCGCGGGTCGCCATCGCGCGAGCCGCCG
+CAACCATCGTGGCGGTCGCCCCGACGCTGGATGCCAGATCCCAGGTGTCCCCTTCGCACCTGATGGAACC
+GGTGTATGTCATGCACGGCCTCTCTTCAAAAAGCGGGGATAATTCCTTAGTAAAGTTAACAACAGGCGAC
+AAATTCCGCGACTTGGAAAGGCTGGCGCGATCGGCGGCGTCGGGGTGCCGCCATAGGGGGCGCACGTGGG
+GGTCCTGGCTGTTGAGCGTGAATACCGCGATGGGTTTTCGGCGTGTCGCGTGGTGCGATTCACTCTCGGT
+GCGGCTAGAGCGGATTCGCGCGCAGATAGCCGTAGACGCCCGTGAAGTTACGGCACACGTCCTCAGGAAT
+TGGCACCGGTCCACCGAGAGCGCGGGCACCCCAAACGATTTGTGCGGTGCGCTCAACAAGGGCGGTGACG
+CGCAGCACCTGGTCGGGGCGGGGCCCCACGGCCACCAGGCCGTGGTTGGCGATCAGGGCGGCGGCGCGGC
+CCTCAAGCGCGCGCACCGCGTTGCGGCCGACCTCGGGTGTACCGGACGCGGCGTACTCGGTGCAGCGAAC
+GTCCCCGCCGCAGTAGATCGCGAACTCGTCGATGCAGGCGGGAATCGGCTCATGGGCGACGGCGAACATG
+GTCGCCCACACCGGGTGGCTGTGGATCACGCTGCCAATGTCGTCGAATGCGCGATAGCACGCCAGGTGTA
+GGTTTAGTTCGGTCGACGGCGACCGGCCGTCCTTGGCGTGCAGCACCGCACCGCCGGCGTCGACTAGCAC
+CAGATCGTGGAGCAGCATCTCGGCGTAGTCGACCGAGGACGGCGTGATGACCACGTTGCCGTCCGAGCGC
+CTGGCTGAGATATTTCCGGCGGTCCCCTCGACCAGGCCCCGACGCAACATGTCCTTGGCGGCCGCCAGCA
+CCGCGGATTCCGGGTCGTCAACGAAGTTCATGAGCCCAATACCTCCGGGTTGACGACATGGGCGGGCCTG
+TTGCCGGACAGCAGTGCGCCCAGGTCGTCGGCGACCATCCGCGCCTGCCGGGCCTCGGTGTTCCAGGTGG
+CCCCGCCGATGTGGGGGGTGAGGACGACATTGGGCATGCTCACCAAAGGGTGATCGGTCGGCAGCCATTC
+ACCGGTGAAGTGGTCCAGGCCGGCGGCGGCCAGCTTGCCGCCACGCAGGGCGTCGACGAGCGCATCGGTG
+TCGTGCAGCTGGGACCGGGCGGTGTTGAGAAACACCGCACCGTCGCGCATGGCCGCGAACTGCTGGGCAC
+CGATCATCCCGATCGTGTCGTCGGTGACCGCCGCGTGCATGGAGACGATGTCAGCCTCGGCCAGCAGCTC
+GTCAAGGCTGTGGCCGGCGTCGTCGCGGTAAGGATCGTGCGCGATGACCCGCAGGCCCAGCCCGGACAGC
+CTCCAGCGCACCGCGCGACCGACGGCACCCAGGCCCACCAGCCCGGCAGTCAGCCCGGCGATTTCGGCAC
+CGCGGAACCGCTGATAGGGGATGGTGCCGTCGCGAAAGATGTTGCCGGACCGCACATCTGCGTCCGCGGG
+AATCAGGTGCCGGGCGACGGCCAGCAACAGGGCCACCGTCATCTCGGCGACAGCGTCGGCGTTGCGAGCC
+GGGGTGTGCAGCACCGGTATGCCGGCCGCGGTGGCGCCGGGGATGTCGACGTTGCTGGGATCCCCGCGGG
+TGGCGGCGACCACCCGCAACCCCCGCTCGAACACCGGGCCACCGACCGAGTCACTTTCCACCACAAGAAC
+ATCGGCGGCGACGGCGGTGATCCGGTCAGCTAGCTGCTCGGCGCTGTAGATTCGCAGCGGTCGCTGATCG
+ATCCACGGGTCGTATACCACGTCGGCTAGCCGCCGGAGCTGGGCGAACCCCGGTCCACGCAATGGAGCCG
+TCACCAGAGCACGCGGTCGAGGCGTCACGTTTGCCAATGCTGGCGTACGGTGGCGCCCGTGTCACGCGAC
+GACGTCACAATCGGCATCGATATCGGCACCACCGCCGTCAAAGCGGTGGCCGCCGACGACAACGGTCGGG
+TGACGGCGCGGGTACGGATTGGCCACCAGCTGGCGGTGCCGGCCCCCGACCGGCTGGAGCACGACGCCGA
+CGAAGCGTGGCGGCGGGGACCATTGGCAGCACTGGACCGGCTGGTCGGACCCGACACCCGGGCACTGGCC
+GTTGCCGCGATGGTGCCATCGCTGACCGCTGTCGATCCCGCTGGCCGGCCGATCACACCCGGGCTGCTGT
+ACGGCGACGCCAGGGGTCGGGTACCGAACGCCTCGGTGGCACGGGCGCAGTCGGTGCCGTCGGTGGGTGA
+GACCGCCGAGTTTCTGCGCTGGACGGCCGGCCAAGCGCCGGATGCGTCCGGGTACTGGCCGGCGCCGGCG
+GTGGCCAATTACGCCTTGTCGGGCGAAGCGGTCATCGACTATGCCACGGCCGTCACGACTCTCCCGTTGT
+TCGACGGGACGGGATGGAACGCGACCGCTTGCGCCGACTGCGGTGTGACCGTTGACCGGATGCCGCGGGT
+GGAGACGTTCGGAGTGGGAGTGGGGCAGGTGCGCGGCACCGGCGCGGTGCTGGCGGTCGGTGCCGTCGAT
+GCCCTGTGCGAACAGATCGTGGCCGGCGCCGACCGCGACGGCGACGTGTTGGTGCTATGCGGCGCCACCT
+TGATCGTGTGGACCACCATCTCCGCGGCTCGTCAAGTGCCGGGTTTGTGGACCATCCCGCATACGGCACC
+GGGCAAGAGCCAGATCGGAGGGGCCAGCAACGCTGGTGGGTTGTTCCTCAACTGGGTGGATCGTGTTATT
+GGACCGGGCGATCCAGCGCTAGCCGATCCGCGGCGGGTGCCGGTGTGGCTGCCCTATATACGCGGCGAGC
+GCACCCCGTTCCATGAGCCCGATCGCCGGGCCGTGCTCGACGGTGTGGATCTCTCCCAGGACGCCGCATC
+GGTGCGGCGGGCCGCCTACGAGGCGTCGGGCTTCGTCGTGCGCCAGCTCATCGAGCTAAGCGGGGCGCCG
+GTGGCGCGCATCGTGGCGGCAGGCGGCGGCACCCGGATACAGCCTTGGATGCAGGCTATCGCCGACGCGA
+CCGGCCGGCCGGTGGAGGTGTCCAGGGTGGCCGAAGGGGCGGCACTGGGAGCGGCTTTCCTCGGCCGCTT
+GGCGGCCGGATTGGAATCGTCGATCGCCGACGCTGCCCGGTGGGCCTCAACCGACCGCATTGTCGAACCC
+AGTGCCGACTGGGCGGGGCCGACCAAGGAACGCTATCGCCGGTTCCTGGCGCTCAGCGGCTCGAAGTTGG
+CCTGACGGTGGACCAAGATGCATGGCGCAAGAACTGGTGTGTCGTTCTACGCTTATGCAATGACAGATCA
+CGACCAGACCGCGGCCCGTCGAGAGATCGCCGATGCCCTGCTCGCCGCGCTGGAACGTCGGCATGAGGTC
+GCAGACGCCATCGTGGAGGCCGCCAACAAGGCCGCCGCCGTCGAGGCGATCGTGAACTTGCTGGGCACCT
+CGCACTTGGCCGCCGAAGCGGTGATGAGCATGTCTTTCGATCAGCTCACCCAGGATGCGCGCACAAAGAT
+CATCGCCGAGCTCGACGACCTGAACAAACAGCTGAGCTTCACCGTCAAGGAGCGTCCAGCCAGCTCTGGT
+GAGGGCCTGGAGCTGCGGCCGTTCTCCCCAGATGAGGACCGCGACATCTTCGCTCGACGAACCGAAGAAA
+TGGGCGCCGCCGGCGATGGATCCGGGGGACCCGCCGGCAGCGTCGACGACGAGATCCGAGCCGCACAGAA
+GCGCGTCGACGACGAGGAGGCGGCTTGGTTCGTGGCTGTTGATTCCGGCGTCAAGGTCGGGATGGTGTTC
+GGCGAGCTTGTCCACGGCGAGGTGGACGTCCGGATCTGGATTCACCCCGATCATCGAAAAAAGGGTTACG
+GAACCGCGGCATTGCGCAAGTCGCGCTCGGAGATGGCCTGGGCGTTCCCGGCCGTGCCGATGGTCGCCCG
+CGCGCCCGCGGCCCAACCCGCCCAGCCGGGAAGTGCCGGCCGGTAGCATCCGGTTCGGTCTGGCAGGCGG
+TCGCCAGGCCGATCGGCGGCGAATCCGCGGCGCCAACGCTGCCGCCGGATCCCAACTGGCTTAATCAGCG
+TGTGTCTTGGTGTTTCTGCTTCAGTTCGGCGGAGACATAGATCACCTCGCCGAACGGGGCGTCGTCGCCG
+TCGATCGGCGGCAGTCCGTGTTCAGCCAGCAAGTCGGTGGTGCTCGCGCTGGCGGTTCGCCAGCCGTGGT
+CGGCCAGATAGGTCCGCGCGTCCGTGCGGTCGCCGAAATACACCAGGCCCGACATGTCGAGGTCGAGGCC
+ATGGCGCCTGAACCGCTCCGCCAGGCGCCGCATGCGTCCCCGCAGTTCTTCTTCGTTGAGCCGATTGATG
+TCGCGCAGGACTTCGGTGGCGAACTGGCTGCCCGGTACGCTCTGGGCGGTGATCTGGTCAAGCAGCCGGT
+CCTGCGCCTCGGCGGACAGATAGCCCAGCAGCCCCTCGGCGATCCAGGCGGTCCGCTGCGCGTTGTCAAA
+GCCGGCTTTTTGCAGGGCGGTGGGCCAGTCGTCGCGCAAATCGACCGCCACGGTGCGCCGGTCGGTCGTG
+GGTGCCGCACCCAGGCCGGCCAGCGTCGTGGTCTTGAAGTCGATCACCTGCGGCTGATCGACTTCGAAGA
+CGATGGTGCCGGCTGGCCAGCGCAGCCGGTAGGCGCGGGAATCCAGGCCGGAAGCCAAGATGACGGCCTG
+CCGAATCCCGGCTCGGGTGGCATCCAGAAAGAAGTTGTCGAAGTAGTGAGTGCGAATGGCCATCGCGTCG
+GCGAACCGCCGCAGGCCGTTGGCCTCGTCTTCGGCTAGCTCGTCGGGATCCAGTTCGCCACTGGCCATGC
+GTACGAAGAAGTCGACGCCGACCGCGCGGACCAGCGGTTCCGCGAACTGGTCGTTGACCAGCGCGCCGGG
+AGCCCGGCCGGCTACCGCTCGGGCCGCCGCCACCATGGTGGCCGTCAAACCCACACTGGACGCCAAGTCC
+CACGAATCGCCCTCAAAGCGGGCACTGCCCGTTTGCGTCATCTGTAACCCCTTCGATAGCTCGCACCGTG
+GCGGCCCGGAACGGGCCAGTCCATACCAGCTGTTAGTCTCTTACACGATTTGGCGCGCGACGCCGTACGT
+CCTGGCCTGCGGGTGTTGGGCGCGTGATGCAAGATGACCCCGGGCTGCGCAGGAGGATAGAGTGCTTTCG
+GCTTTCATCTCGTCGCTGCGAACAGTCGACTTGAGACGAAAGATCCTCTTCACGCTGGGCATCGTCATTC
+TCTACCGTGTCGGTGCCGCGCTGCCGTCCCCCGGTGTCAATTTTCCGAACGTGCAGCAGTGCATCAAAGA
+AGCCAGCGCGGGCGAAGCCGGACAGATCTATTCCCTGATCAACCTGTTCTCCGGCGGTGCGTTATTAAAG
+CTCACGGTGTTCGCGGTGGGGGTGATGCCCTACATCACCGCCAGCATCATCGTGCAGCTGCTCACCGTGG
+TCATCCCGAGGTTCGAGGAACTCCGGAAGGAAGGCCAGGCGGGTCAGTCGAAGATGACCCAGTACACCCG
+TTACCTAGCGATCGCGTTGGCTATCCTTCAAGCCACCAGCATCGTGGCGTTGGCTGCCAACGGCGGGTTG
+CTACAAGGTTGCTCGCTGGACATCATCGCCGACCAGAGCATTTTCACACTGGTCGTCATCGTGCTCGTGA
+TGACGGGCGGCGCCGCGTTGGTGATGTGGATGGGCGAGTTGATCACCGAACGCGGCATCGGCAACGGCAT
+GTCGCTGCTGATCTTCGTTGGCATCGCTGCCCGCATCCCGGCCGAAGGTCAAAGCATCCTGGAAAGCCGC
+GGTGGAGTCGTCTTCACCGCGGTCTGCGCGGCCGCGTTGATCATCATCGTCGGTGTGGTGTTCGTCGAAC
+AGGGTCAGCGCCGGATTCCAGTGCAATACGCCAAGCGCATGGTGGGCCGGCGGATGTATGGCGGGACTTC
+GACTTATCTGCCGCTCAAGGTCAACCAGGCCGGCGTTATCCCGGTTATCTTCGCGTCGTCGCTGATCTAC
+ATTCCGCACCTGATCACCCAGCTGATTCGCAGCGGCAGCGGTGTCGTGGGAAACAGCTGGTGGGACAAAT
+TCGTCGGCACGTACCTGTCCGACCCGAGCAACCTGGTCTACATCGGCATCTACTTCGGCCTCATCATCTT
+CTTCACCTACTTCTACGTGTCGATCACCTTCAACCCCGACGAACGTGCCGACGAGATGAAGAAGTTCGGC
+GGCTTCATTCCGGGAATTCGGCCGGGCCGTCCGACCGCAGACTATCTGCGCTATGTGCTGAGCCGGATTA
+CCTTGCCGGGCTCGATTTACCTCGGCGTGATCGCCGTGCTGCCCAACCTGTTCCTCCAGATCGGCGCCGG
+TGGAACCGTGCAGAACCTGCCCTTTGGGGGTACCGCGGTGCTGATCATGATCGGTGTCGGTTTGGATACG
+GTCAAGCAGATCGAGAGTCAGCTCATGCAGCGCAACTACGAAGGGTTCCTCAAGTGAGAGTTTTGTTGCT
+GGGACCGCCCGGGGCGGGCAAGGGGACGCAGGCGGTGAAGCTCGCCGAGAAGCTCGGGATCCCGCAGATC
+TCCACCGGCGAACTCTTCCGGCGCAACATCGAAGAGGGCACCAAGCTCGGCGTGGAAGCCAAACGCTACT
+TGGATGCCGGTGACTTGGTGCCGTCCGACTTGACCAATGAACTCGTCGACGACCGGCTGAACAATCCGGA
+CGCGGCCAACGGATTCATCTTGGATGGCTATCCACGCTCGGTCGAGCAGGCCAAGGCGCTTCACGAGATG
+CTCGAACGCCGGGGGACCGACATCGACGCGGTGCTGGAGTTTCGTGTGTCCGAGGAGGTGTTGTTGGAGC
+GACTCAAGGGGCGTGGCCGCGCCGACGACACCGACGACGTCATCCTCAACCGGATGAAGGTCTACCGCGA
+CGAGACCGCGCCGCTGCTGGAGTACTACCGCGACCAATTGAAGACCGTCGACGCCGTCGGCACCATGGAC
+GAGGTGTTCGCCCGTGCGTTGCGGGCTCTGGGAAAGTAGTCATGCGCCCACTGGCACGGCTGCGGGGTCG
+CAGGGTCGTGCCGCAGCGCAGTGCCGGCGAACTCGACGCGATGGCCGCGGCGGGCGCCGTCGTTGCCGCC
+GCGCTGCGGGCGATCCGTGCGGCAGCGGCTCCCGGCACATCCAGCCTGAGTCTCGACGAGATCGCCGAGT
+CGGTGATCCGCGAATCCGGCGCCACCCCGTCGTTTCTGGGCTATCACGGCTACCCGGCCTCGATCTGCGC
+GTCGATCAACGACCGGGTGGTTCATGGCATCCCGTCGACCGCCGAGGTGCTCGCGCCCGGTGATCTGGTA
+TCCATCGACTGCGGTGCGGTGCTGGACGGTTGGCATGGCGATGCGGCGATCACTTTCGGGGTTGGCGCCC
+TGAGCGACGCCGACGAAGCGCTGTCGGAGGCGACAAGGGAATCGCTTCAGGCCGGCATCGCCGCGATGGT
+GGTCGGCAATCGGTTGACCGACGTCGCGCATGCCATCGAAACGGGTACCCGTGCCGCCGAGCTCCGTTAT
+GGACGCTCGTTCGGGATCGTCGCCGGTTACGGGGGCCACGGCATCGGCCGCCAGATGCATATGGATCCGT
+TCTTGCCGAACGAGGGTGCGCCGGGGCGCGGTCCGCTGCTGGCTGCCGGCTCGGTGCTGGCCATCGAACC
+GATGCTGACCCTCGGTACCACCAAAACGGTGGTGCTCGACGACAAATGGACGGTCACGACCGCCGATGGG
+TCACGTGCGGCACACTGGGAACACACCGTGGCGGTAACCGACGACGGGCCCCGAATTCTGACGCTCGGTT
+AGCGCGGCTGCCGGCGCGGGCAGTGGTGAACCAAACTCTTACTCGACTCGTGTCAGTAAGCGGGAGGTGA
+TCGCGTGGCTCGTGTGTCGGGCGCCGCGGCCGCTGAAGCCGCGTTGATGAGGGCGCTCTACGACGAGCAT
+GCCGCCGTGTTGTGGCGTTACGCGCTGCGCTTGACCGGGGATGCGGCCCAAGCCGAAGACGTCGTCCAAG
+AGACGCTGTTGCGGGCGTGGCAGCATCCGGAGGTGATCGGCGACACCGCGCGGCCGGCAAGGGCGTGGTT
+GTTCACCGTCGCGCGCAACATGATCATCGACGAGCGGCGCAGCGCCCGGTTCCGCAATGTGGTCGGTTCG
+ACCGACCAATCGGGCACACCCGAGCAGTCGACGCCGGACGAGGTGAACGCCGCACTGGATCGGCTGCTGA
+TCGCCGATGCGCTGGCCCAACTGTCCGCCGAGCATAGGGCCGTGATCCAGCGGTCCTACTACCGCGGATG
+GTCGACCGCACAGATTGCCACCGACCTCGGAATTGCCGAAGGAACGGTGAAGTCGCGATTGCACTACGCC
+GTGCGCGCGTTGCGGCTCACTCTGCAGGAACTGGGAGTTACTCGATGACGGCAGAGCCCATTCGCATGGC
+TGCCGGCTCCGGATACGTGAGGGTGACAGGAGAGAGATGACATGACGATGCCGCTACGAGGACTTGGCCC
+GCCCGATGACACCGGTGTGCGCGAGGTGTCGACGGGTGATGATCACCACTACGCGATGTGGGATGCAGCT
+TACGTGTTGGGAGCATTGTCTGCGGCCGACCGCCGCGAATTCGAAGCGCACCTGGCCGGTTGCCCCGAAT
+GCCGGGGGGCCGTCACCGAACTCTGCGGGGTGCCCGCCCTGCTGTCCCAGCTCGATCGTGACGAAGTGGC
+CGCGATTAGCGAATCCGCCCCGACTGTGGTGGCTTCGGGGCTGTCGCCGGAGTTGTTGCCGTCGTTGCTG
+GCGGCGGTGCACAGGCGTCGGCGCCGTACCCGGCTGATCACCTGGGTGGCCTCGTCCGCCGCTGCCGCGG
+TGCTGGCGATCGGTGTGCTAGTCGGTGTGCAGGGCCACTCCGCGGCACCGCAGCGGGCGGCCGTGTCGGC
+GCTGCCGATGGCCCAGGTCGGCACGCAGCTGTTGGCGTCCACGGTGTCGATCAGCGGCGAGCCTTGGGGG
+ACGTTCATCAACCTGCGGTGCGTCTGCCTGGCGCCGCCGTATGCTTCCCACGACACGCTGGCCATGGTTG
+TGGTGGGTCGTGACGGCAGCCAGACACGGCTGGCGACTTGGTTGGCCGAACCCGGTCACACCGCGACACC
+CGCCGGCAGCATTTCGACACCGGTTGACCAGATCGCCGCCGTGCAAGTGGTTGCCGCCGATACCGGCCAG
+GTTCTGCTGCAGCGTTCGCTCTAAGACTGAGCTTTAGGCACCTGGCGCCCTGCTATTGGCACGCCCTACA
+AGCACCAGGTGGTCGGGCGTCGACCACCTGCTCGGAGTGGGCTGCATGATGCCGCGCATCTTCAGTCGTC
+GATCACCGTGGTGCTGGCCAAACACGAGTTCTCCGCTGCCACGGTGGCCGACGGGTACAGCCGCAGCGGG
+GCCGGGTTCGGGGTCGCGGCGGCGGCCTCCGGTGGCGGCACTTTCCTCGGTCAGAAATGCGCCGCAGCAA
+CGGCAAGCTGAATTCCGTAAGGTTGGCCCGCGTCGACGCATGTGCGATAAGAAGGGGCGTGGCCTCAGAT
+AATCGCGACCCCATCGCCGCAGCACGGGCCAACTGGGAGCGTTCCGGGTGGGGTGATGTGTCGCTAGGCA
+TGGTGGCGGTGACGTCGGTGATGCGTGCGCATCAGATTCTGCTGGCCCGCGTCGAGACGGCGCTGCGCCC
+CTATGACCTGAGTTTCTCCCGCTTCGAGCTGCTGCGGCTGCTGGCGTTCAGCCGTATCGGAGCGCTACCG
+ATCACCAAAGCGTCGGACCGATTGCAGGTTCACGTGACCAGCGTCACCCACGCGATCCGCCGGCTGGAGG
+CCGATGGATTGGTGCGGCGGGTTCCGCACCCCACCGACGGGCGGACCACACTGGTGCAGATCACCGAGCT
+GGGTCGCTCCACGGTCGAGGACGCCACCGTCACCCTCAACGAGCAGGTGTTCGCCAACGTTGGGATGGGC
+GCCGAGGAATCGCAGGCGCTGGTGTCGGCCGTCGAAACGTTGCGGCGCAACGCCGGCGACTTTTGAGGGC
+GGGCAGACGCGTAAGCGCCCAATGTCGTGCCGAAATGGGCGCTTATGCGTCTGCTCGCGCCCGGCTTGGC
+GCGCAGCCGGCGACATTCCATGACCAGTTTGTGCGGGCCTTGACGCGGGCGCGGGCTCGTATGCGACCGC
+CGAGGCCGGCCGGCTTGCTGCTGGGCAATGGCGGGGCTCGGCGGTATCCGGCGGCGGGCAGCTAACCGGA
+CTGCCCCGAAACCCACTGCGTGGTCAACGATTTCAGGACAAGCTGTTAGCAGGACGTGCCCGCGCTGCGC
+TATCCAAAAACGTCATGGGCACGCATGATGGTGAAATGCGGCGGACACCAATTCAACCGCGAAAGGCAGG
+ACAGTGGACCCACTGATGGCTCACCAGCGCGCTCAGGACGCGTTCGCCGCGCTCCTGGCCAACGTCCGCG
+CTGACCAGCTCGGCGGCCCCACGCCCTGCTCGGAGTGGACGATCAACGATCTGATCGAGCACGTCGTCGG
+CGGCAACGAGCAGGTCGGGCGATGGGCGGCCAGCCCCATCGAGCCACCCGCCCGGCCCGATGGCCTCGTT
+GCCGCCCACCAAGCCGCGGCCGCGGTCGCCCACGAGATCTTCGCGGCGCCGGGCGGGATGTCCGCCACAT
+TCAAGCTGCCGTTGGGCGAGGTTCCCGGGCAGGTGTTCATCGGGTTACGCACCACCGATGTGCTGACCCA
+CGCGTGGGATCTTGCCGCCGCCACCGGCCAATCCACCGATCTTGATCCCGAGTTGGCCGTCGAGCGGCTC
+GCCGCCGCGCGTGCCTTGGTGGGGCCGCAGTTCCGCGGGCCGGGAAAGCCCTTCGCGGACGAGAAGCCTT
+GCCCGCGTGAGCGCCCGCCCGCCGATCAGCTGGCGGCATTTTTGGGCCGCACGGTGCGGTGAACCCGCGA
+ATTCGGCTGCCGCGCAACGTGTGGATCACCGCGCTGCGGTCCAGGGCGCCGTGGTCGGCGGCGAATCTGG
+CGTAGATTTCGGCGGGGTGGCCACCTAGCGGCGCCGCCGCACCGGTCGAGGCCACCGCTTCCATGGCCAG
+GCCCACATCTTGATCGGCGTGGTGGCCACGCCCGGTGTGAAGTGCTGTTGGCCGTGATGTCGGATTACAG
+TCTCGGCGTGCCCGACGAGACAGGCCTTGGTGCTGACGCGGCGCGCGCGCGTGAAGTGGCGCTGACACAG
+CACATTGGGGTATCCGCGGAGACCGATCGGGCCGTCGTCCCCAAGCTGCGCCAGGCCTATGACAGCCTGG
+TGTGCGGTCGCCGCCGGCTTGGCGCCATTGGAGCCGAGATCGAGAACGCGGTGGCCCATCAGCGCGCGCT
+GGGCCTTGACACCCCGGCCGGTGCCCGTAACTTCTCCCGGTTTCTCGCCACCAAAGCACACGACATCACG
+CGAGTGCTGGCAGCAACCGCCGCGGAATCCCAGGCCGGCGCGGCGCGGTTGCGATCCCTGGCTTCGTCCT
+ATCAGGCTGTGGGATTTGGCCCCAAACCCCAGGAGCCGCCTCCGGATCCAGTGCCATTTCCGCCCTACCA
+GCCGAAGGTGTGGGCGGCGTGCCGGGCGCGTGGCCAAGACCCGGACAAGGTCGTCAGGACGTTCCATCAC
+GCGCCGATGAGCGCGAGATTCCGCTCGCTACCGGCCGGAGACTCCGTGTTGTACTGCGGCAATGACAAGT
+ACGGGCTGCTGCACATTCAGGCCAAGCATGGACGCCAATGGCACGATATTGCGGATGCACGATGGCCGAG
+TGCAGGCAATTGGCGCTATCTCGCCGATTACGCAATCGGTGCCACACTGGCCTACCCGGAGCGAGTGGAG
+TACAACCAAGACAACGACACGTTCGCCGTATACCGGAGAGTGTCGTTGCCAGACGGCAGATACGTTTTCA
+CAACCCGCGTCATTATTTCGGCACGCGACGGGAAGATCATTACGGCCTTCCCGCAGACGACGTGATGCGT
+CGGTTGGGAACTAAGGGAAGGTGATGGCGTGACCGGGCCACCGCGAAGCTATACAGGGCGCCGGGATCTC
+ATCGCGGAGAAGCTGGAGCCGTACTTTCAGATCAGCGCCATGCTGCCGAAGAACACCAGACCCACCTCGG
+AAACCGCCGAAGAGTTCTGGGACAACTCGCTGTGGTGCAGCTGGGGCGACCGAGAAACGGGATACACCCG
+CACCGTCACGGTTTCGATCTGCCAGGTGGCGGACGGCGAACGTGAGGCCGAAGGGGTTCGGGACATGATG
+CGGCTGGAGTGTCCGGCTGGGCTGGATCTACGGACACCCAACCCGGAGGCATACGAGATTACCGGTCAGC
+GGCCCGGAGAATTCGTGTTCGTGCTCGGCTATCTGGGGCATGTGCGGGCCATCGTGGGCAACTGTTACAT
+CGAGATCATGCCGATGGGCACCAGGGTCGAGCTGAGCAAGTTGGCCGATGTGGCATTGGATATCGGCCGC
+AGTGTCGGATGCTCGGCCTACGAGAACGACTTCACGCTGCCGGATATTCCAACGCAGTGGCGCAACCAGC
+CGCTGGGCTGGTACACGCAGGGCCTTGCCCCCTACCTGCCGGGGCTGTCGGACCCGAAAGACGCCGCCGA
+GGGCTGATGGGTGTGCCGGCGACCTCTGAGGGCGAGCAGACGCATAAGCGCCCAATTTCGGGCTCTTCTG
+ACCCTTCCGTGGGTGGAACCTTGGTCTGAGTAGGCGCACGTCGTTGTAGCTTAAGGTTGCTGGTTTGTCA
+AAGGTCCGAAACCAAGGGGAGCGAGCAACGACGTGCGCAATGCGAGGTTGTGGCGTGAACTGCTGGGTGT
+TGATAAGCGGACGGTGGCCTACGCCAGGTGTTTTCGGTCAAAGGCGAAGAAGGCAAGCAGGCACTGGATC
+GGTGGATCTCCTGGGCGCGGCGCTGCCGCATCCCCGTCTTCGTGGAGCTGGCCGGCGGCATCGTGCGACA
+CCGCCAAGCCATCGACGCCGCCCTTGACCACGGCCTATGGCAAGGACTGATCGAATCCACCAACACCAAG
+ATCCGACTCCTAACCCGGATCGCGTTCGGATTCCGCTCCCCCGAAGCACTCATCGCCTTGGCCATGCTCG
+CCCTCGGCGGCCGCCGCCCCGCCCTACCGGGCAGAACCAAACACCCACGGATCAGTCAGTAGAGCCGGAA
+AACCTGGGATTTCGCTGCCCGTTGGACGGTGCAATGCGCTTCTGTCCATGAGTCGCTGGAAGACCTGGGC
+ATCTCGCCCGGGTTGTCCTGGCTTATTGGGCCATGACCTCTTGGGAGGTGTCACATATCGTTTGTGATCG
+CGGCGCCGGAGGCCATCGCGGCAGCGGCCACGGATTTGGCAAGCATCGGTTCGACGATCGGGGCGGCCAA
+CGCCGCGGCCGCGGCCAACACGACGGCGGTGCTGGCCGCGGGCGCCGATCAGGTGTCGGTGGCCATCGCG
+GCGGCTTTTGGGGCGCACGGCCAGGCCTATCAGGCGCTCAGCGCGCAGGCGGCGACGTTTCATATCCAGT
+TTGTGCAGGCCTTGACCGCGGGCGCGGGCTCGTATGCGGCCGCCGAGGCCGCCAGCGCCGCGTCCATAAC
+CAGTCCGCTGCTCGACGCGATCAACGCGCCCTTCCTGGCGGCGTTGGGGCGCCCGCTGATCGGTAACGGC
+GCCGACGGGGCGCCGGGGACCGGGGCCGCCGGCGGGGCCGGCGGATTGTTGTTCGGCAACGGCGGCGCGG
+GCGGGTCCGGCGCGCCCGGCGGGGCCGGCGGATTGTTGTTCGGCAACGGCGGCGCCGGCGGCCCCGGCGC
+GTCCGGCGGCGCGCTGGGCTGATCGGCAACGGCGGTAACGGCGGTAAGGGCGGGCTTGGGGTCCCGCCGG
+GTGTCGGTGGTACCGGCGGCGCCGGGGGGCTGCTGCTCGGCCTGGATGGGTTGACGTAGGCGGCGGCCCG
+CAGCCCGCCGGGCTCCACGTCATCTGGCGCTGCTGGCAGACCAACGCTCCCTACGAGCCCACGCGCCACC
+GAGCCCTCCAGGGCCCTGCTGGCCCAACATCAACGAACGGATACCTGGGACAGGACGACTGGAAGGCGGG
+CAGTTGACCCATGCCGAATACCGGTGGCAGCCTGCTGCACATCGCATCCACTTCCGGGCGACCAACACGT
+CGAGCAGCCGCGACATCCGCGGCATGCAATGCTGGCGGCGCGACAGGTGCTAGGAGGAGTGGTTGCCCGC
+ACCGTAGTAGTTCAGCCAGGCCGCAATGCGTTGACCGATACGCGGGTCGGTTTCCTCCGGCAGCAGCAAA
+ACCCGAGCCTGGATCACACCCACGTCGAGCAGGCCGCTTCGGATGAGGGCGGCCACGAAAGCTTTGTCCT
+TCTCGCGTCCGGCGGCAAGTTTCGCCACCGCGAGGTCGTGCGGTTCCAGAAAGCGTGGTTTCGCCGGGCG
+CGAGGATTCGACGGTCCAACTGACCAGCCGGTCCCGCCACCCGTTAGGCAGGATCGCGGTGTCGATATGT
+ACGCCCTCGGCATAAACGCCATTGCTGCGGTGAAAATCGGACATCTCGCCGATTGCCACGTCGACATGAT
+CCGCTTTGTCCCGCGCCGGGTCGTTGACAAACGCGATGTCGGCCTCCTGGGAGGCGGTGGCCTGCGGCGG
+TAGTTCGTTTTCATCAAATGACCCCAGGATCGACTGCGACCCGAGTACCAGCACGTCCACATCGCCCACA
+ACAGCACAGGCGCGGCGGAGGAGATGTGCAAGTTGCTGACGCGTCATTCCGTCATGGCCCGCTCGTGCTC
+GCGATCCCAGTGATCCTTGAACGACCGCAGCACCGCGACCCTCGTCGCCTCCGGCAGTATGCCCGCGAAC
+GGGGAGTTCTGCCGCATCTCCCGAGCGTCCTCCGAAGGGCTGGTCAATACGTGCATGACCGCGTCGAGGC
+CGTCGTTAAGGACACGCTGCCACTTCGTGAAATACCACCCCGCCATGCCGTCCCGACGATGCATACCCGA
+CCAGCGACGCAAGTTCTCTCGTGCGGCGGAGACGACCGTATCCGGTTCGGTCAACAGCGGGCTCAGCAGG
+GCGCGATGCAGCCACAGCGACCTTTCCTCCTCGCGGGTCAACCGGCGGCTCGTGACGCGCTCGACTTCGC
+TACTGGGCACCCGCCGATGGCTGCCGACGTGCACGCACACCATCTCGCCGCGGTCACACATGTTGACGAC
+ATGCTGCCGCGATACCCCGAGTATCTGCGCGGCCTCACTCGTCTTCAGCAGAGTCTCCATGTCCCAATGC
+TGGCTAGTAAACCCAAAAAACACAACATCGTTGCGGAGCGTGATCGCACCGGCTGTCGCTAGAGCGAGGG
+CCCCAGTTCCGCGGCCGACAGGTGGCAGTGAGCTAGCTGCCGCGCAGCGTCTCGATCACTGCGCTGAAGT
+CCAAGTCGGCGTGATCGGCGGCGAACTTGGCGTAGATCTGGGCGGCGTGGCTGCCCAGTGGGGCCGCCGC
+ACCGGTCGAGGCCACCGCTTCCATCGCCAGGCCCAACATGCCAGGTGCTGCCGACTACGGCGGTGATCCA
+CACGGTCACGGCGGAAGCATTGGGCCGCATCGGTATTGATGCGCCGCGGATTCCTGGATCGTTGGACGTC
+GCCGCGCATGCGGCGATCGGGCTGCTGCCGTTGGTGGCCGGCTGCGACCGCCGACATCGGCGGCCTGTCC
+GCGGTGCTCGGGCCGGACGGGCTGCCCAAGTGTCTTTGTGTATGACGGCTATCCGGGTGGAGCCGGTTTC
+GTCGAACGCGGTTTGCACCGGCCCCGCGGCGCAGGTGGGTGACCAGTCACGCTCACCGCAGCGCGATTAC
+GCGCACCAGGCCTTGCAACCCGATGTGCCGCGGCGCCGCGCGCGGCGGCACAGACCCCGCCGGTGTTCGG
+CAAAAACGGGGTCGTCGTCTTCGACGATGCGGTGTACTTGTCATCAGAATCAGTGTCTATGGTCATCGGG
+GGTGTCGTGGGCGCTGGCCCGCTGACTCGGGTGGGAGGTGGCACATGTCGTTCGTGCTGGCGATGCCGGA
+GGTGTTGGGGTCGGCGGCAACGGATCTGGCCGCTCTGGGCTCGGTGCTGGGCGCGGCCGATGCGGCCGCG
+GCGGCTACGACGACGGGCATCGTGGCCGCGGTCCAGGATGAGGTGTCGGCGGCGATCGCGGCGTTGTTTT
+CCGCCCACGGCCGGGCCTATCAGGTGGCCAGTGCGCAGGCGGCGGCGGTTCACGCCCAGTTCGTGGAGGC
+GTTGAGCGCGGGTGCGGGGGCCTACGCCAGCGCGGAGGCCGCCGGCGCGGCGGTGCTGGCCAACCCGGCG
+CAGAGCGTGCAGCAGGACCTGCTGGCCGCCGTCAATGCGCAAAGTGTCGCGCTCACGGGGCGCCCGTTGA
+TCGGCAACGGCGCCAACGGGGCCCCGGGCACGGGGGCCAATGGTGCGCCGGGCGGGTGGTTGCTCGGTAA
+TGGTGGGGCCGGCGGGTCCGCCGCCGCTGGCTCGGGCCTGCCCGGCGGGGCCGGCGGGGCCGCCGGGTTG
+TTCGGCACCGGCGGGGCTGGTGGGGCCGGCGGGAGTTCCACGGTAGGTGATGGCGGGGCCGGGGGTGCCG
+GTGGGTCAGGTGGCTGGTTGTTGGGCACCGGTGGGGTCGGCGGGGTCGGCGGGCTCGGGGCCGGCGCCGG
+TGGGGCCGGCGGGGTTGGTGGGGCCGGCGGGCTGTTGGGTGCTGGCGGGCACGGCGGCGCCGGCGGGCTC
+GGCGCCGTCACCGGTGGGGTCGGGGGAGCTGGCGGAGCCGGTGGGCTGCTGGCCGGGCTGCTGGCCGGGC
+CGGGCGGGGCCGGCGGGACCGGCGGACGTGGCTTTCTCAACGACGGTGGGGTCGGTGGGGCTGGCGGCAA
+CGCCGGGCTGCTGTTCGGTGCCGGCGGCACCGGTGGATCCGGCGGAGCCGGCCTAGGTGGTGACGGTGGG
+GCCGGTGGGGCCGGCGGCAACGCCGGTGTGCTGTTCGGCAACGCCGGATCCGGGGGGACCGGCGGGTTCG
+GCGATACCGACGGGGGAGCCGGCGGTGCCGGCGGTGACGCCGGCTGGTTGGGCTCCGGTGGGGTCGGCGG
+GGCCGGCGGGTTCGGCGAAACCGGTGACGGGGGTGTCGGCGGGGCCGGCGGCAAGGCCGGGTTGCTGATC
+GGTAACGGCGGGGCCGGCGGCGCCGGGGTGCTGATCGGCAACGGCGGCAACGCCGGCATCGGCGGAACCG
+GACCGACCGCGGGTGATACCGGCGCGGGTGGGATCAGTGGGCTGCTGCTGGGCGCCGACGGCTTCAACGC
+CCCGGCCAGCGCCTCTCCGCTGCACACCCTGAAACAACAGGCGCTGGCCGCGATCAACGCGCCGACCCAG
+ACACTGACCGGGCGACCGCTGATCGGCAACGGCACCCCCGGGGCGGTCGGCAGCGGGGCCACCGGGGCCC
+CCGGTGGGTGGCTGCTCGGCGACGGCGGGGCCGGCGGGTCCGGCGCGGCGGGCTCGGGCGCGCCCGGCGG
+GGCGGGCGGGGCTGCCGGGCTGTGGGGTACCGGCGGGGCCGGCGGGGCCGGCGGCTGGCTGCTCGGCGAC
+GGCGGGGCCGGCGGGATCGGCGGAGCCAGCACCGTACTCGGCGGCACCGGCGGGGGAGGCGGGGTCGGTG
+GGCTGTGGGGCGCCGGTGGGGCCGGCGGGGCCGGTGGAACCGGCCTTGTTGGTGGCGACGGCGGGGCCGG
+TGGGGCCGGCGGGACCGGCGGACTGCTGGCCGGGCTGATCGGTGCCGGCGGAGGTCACGGCGGGACCGGC
+GGGCTCAACACTAATGGCGACGGCGGGGTTGGCGGGGCCGGCGGGAATGCCGGAATGCTCGCCGGGCCGG
+GCGGCGCCGGCGGAGCCGGCGGTGACGGCGAAAACCTGGACACCGGTGGGGACGGCGGGGCCGGCGGTAG
+CGCAGGGCTGCTGTTCGGCAGCGGCGGCGCCGGCGGCGCCGGCGGATTTGGTTTCCTCGGTGGGGACGGC
+GGGGCCGGTGGCAACGCCGGGCTGCTGTTGTCCAGCGGCGGGGCCGGCGGGTTCGGCGGGTTCGGCACCG
+CCGGTGGGGTCGGTGGGGCCGGCGGCAATGCCGGCTGGCTGGGCTTCGGCGGGGCCGGGGGCATCGGCGG
+AATCGGCGGTAACGCTAACGGGGGCGCCGGTGGGAACGGCGGCACCGGCGGTCAGTTATGGGGTAGCGGC
+GGCGCCGGCGGCGAAGGCGGCGCAGCCTTAAGCGTCGGCGACACCGGCGGGGCCGGTGGCGTCGGCGGCA
+GCGCCGGGCTGATCGGCACCGGCGGCAACGGCGGCAACGGCGGCACCGGCGCCAACGCCGGCAGCCCCGG
+AACCGGCGGCGCCGGCGGGTTGCTGCTGGGCCAAAACGGGCTCAACGGGTTGCCGTAGCCGGGCGGCACG
+GCATGGCTTCCGGGCGTCAACCACTCGCCGGTGATGCAGATCGGCTGCGGAGCGGGCCGCCAAAATGGGG
+GCCGCCGCGCCAGGTATCTCGGCGAAGATCCCCGGCGCTCGAGCGCTTTGTCAGAGGCCCGTCGCGGGTC
+GTCGTGACGACGGCTATCCGGGCGGTGCGGGTTTCGCGGCGCGCCCTGTGCCCGGCACCGCCGCCCGTTT
+GTCGGCAACGCCGCCGCGACCCGTGAGCCGTCCAGCAGCTGGCGCCTGCGAAACGTGTGGAAGCGCTGCA
+TGCGGTGCCGGATCGCGATATCGTTGATTTCTGCAATTAATTCCTACCCGTACGGGTGTGTCGCTGGTAG
+TCGGGCACCAGGCCGTGAGGGGTTGGGAGGCATGCGATGTCATGGGTGATGGTTTCGCCGGAGCTGGTGG
+TGGCGGCGGCAGCGGATTTGGCGGGGATCGGGTCGGCGATTAGCTCGGCTAATGCGGCGGCGGCCGTCAA
+CACGACGGGATTGTTGACCGCGGGTGCCGATGAGGTGTCGACAGCGATTGCGGCGTTGTTCGGTGCCCAA
+GGCCAGGCCTACCAGGCGGCGAGCGCACAGGCGGCGGCGTTTTACGCCCAGTTCGTGCAGGCCCTGAGCG
+CCGGCGGAGGCGCGTATGCGGCCGCCGAGGCCGCCGCCGTGTCGCCGCTGCTGGCCCCGATCAACGCGCA
+ATTCGTGGCGGCCACCGGGCGCCCGCTGATCGGCAACGGCGCCAACGGCGCCCCCGGGACCGGAGCCAAC
+GGCGGGCCCGGCGGGTGGTTGATCGGCAACGGCGGCGCCGGCGGGTCTGGCGCCCCCGGCGCTGGGGCCG
+GCGGTAACGGCGGGGCCGGCGGGCTGTTCGGCAGCGGCGGGGCCGGCGGGGCCGGCGGAAACGCCTTCGG
+CGCTGGCGAGGTCGGCGGGGCCGGCGGGGCCGGCGGGAACGCCATGCTGTTCGGCGCCGGCGGGGCCGGT
+GGGGCGGGCGGGGCCGGCGGAAACGCCGGCATGCTGTTCGGCGCCGCCGGGGTCGGCGGCGTCGGCGGAT
+TCTCGAACGGCGGTGCCACCGGCGGGGCAGGCGGGGCCGGCGGGGCCGGCGGGCTGTTCACCACCGGCGG
+CGTCGGCGGGGCCGGCGGGGCAGGCGGGGACGGCGGGGACGGCGGGGCCGGAGGGTTGTTCGGTGCCGGC
+GGCACCGGCGGGGCCGGCGGATTCGGAACCGCCGTTCTGGCTGGCACCGGTGGGGCCGGCGGGCCCGGCG
+GGGCGGGCGGGCTGTTTGGCGCCGGAGGGGAAGGCGGCAGCGGCGGGTCGGGCAACCTCACTGGCGGGGC
+CGGCGGGGCCGGCGGCAACGCCGGGACGCTCGCCACTGGTGATGGCGGGGCCGGCGGGACCGGCGGCGCT
+AGTCGCAGCGGCGGATTCGGCGGGGCCGGCGGAGCCGGCGGCGACGCCGGCATGTTCTTCGGCTCCGGTG
+GCTCCGGCGGCGCCGGCGGGGCCGGCGGCTCCGGCGGGTTTGGCCTCCCCAGCGGGGGGAAAGGGGGGGC
+CGGCGGCGACGCCGGCATGCTCTTCGGCTCCGGCGGCTCCGGCGGCGCCGGCGGCATTAGTAGAAGCGTC
+GGGGACGGCGCCGCCGGCGGGGCCGGCGGGGCCCCCGGGCTGATCGGCAACGGCGGCAACGGCGGCAACG
+GCGGCGCGAGCACCGGCGGCGGGGACGGTGGGCCCGGCGGGGCCGGCGGCACCGGCGTGTTGATCGGCAA
+CGGCGGCAGCGGCGGGACCGGCGCGACCCTGGGCAAGGCCGGCATCGGCGGTACCGGGGGGGTGCTGTTG
+GGCCTGGACGGCTTTACGGCCCCCGCCAGCACCTCGCCCCTGCACACCCTGCAGCAGGACGTGATCAATA
+TGGTGAACGACCCCTTCCAGACGCTCACCGGGCGTCCGCTGATCGGCAACGGCGCCAACGGCACTCCGGG
+GACCGGGGCTGACGGCGGAGCCGGCGGCTGGTTGTTCGGCAACGGCGGAAACGGCGGGCAGGGAACGATC
+GGCGGCGTCAACGGCGGGGCCGGCGGGGCCGGCGGGGCCGGCGGGATCTTGTTCGGCACCGGCGGCACCG
+GGGGCAGCGGCGGGCCCGGCGCCACCGGCCTCGGCGGGATTGGCGGGGCCGGCGGAGCCGCCTTGCTCTT
+CGGCTCCGGCGGGGCCGGCGGAAGCGGTGGTGCCGGCGCGGTCGGTGGCAATGGCGGGGCCGGCGGCAAC
+GCCGGTGCGCTCTTGGGCGCCGCCGGGGCCGGCGGGGCCGGTGGTGCCGGCGCGGTCGGTGGCAATGGCG
+GGGCCGGCGGTAACGGCGGGCTGTTCGCCAACGGGGGAGCCGGCGGGCCCGGTGGGTTTGGCAGCCCCGC
+TGGGGCTGGCGGGATCGGCGGGGCAGGTGGGAACGGCGGGCTGTTCGGCGCCGGCGGGACCGGCGGGGCC
+GGCGGGGGAAGCACCCTCGCCGGCGGCGCCGGCGGGGCGGGCGGCAACGGCGGGCTGTTCGGCGCCGGCG
+GCACCGGCGGCGCCGGCAGCCATAGCACCGCCGCCGGAGTTTCCGGAGGGGCCGGCGGGGCCGGCGGCGA
+CGCCGGCTTGCTCTCCCTCGGCGCCTCCGGCGGGGCCGGCGGCAGCGGCGGTTCCAGCCTGACCGCCGCC
+GGCGTGGTCGGCGGCATCGGCGGCGCCGGAGGCTTGCTCTTCGGCTCCGGCGGCGCCGGCGGGAGCGGCG
+GGTTCAGCAACTCTGGCAACGGCGGGGCCGGCGGGGCCGGCGGCGACGCGGGTTTGCTCGTCGGCTCCGG
+CGGGGCCGGCGGGGCCGGCGCCTCCGCCACCGGCGCCGCCACCGGCGGGGACGGCGGGGCCGGCGGCAAG
+TCCGGAGCGTTCGGTCTCGGAGGTGACGGCGGCGCCGGCGGCGCCACCGGTTTGTCCGGTGCTTTCCACA
+TCGGCGGCAAGGGCGGCGTCGGCGGCAGCGCCGTGCTGATCGGCAACGGCGGCAACGGCGGCAACGGCGG
+TAACAGCGGTAACGCCGGGAAATCCGGGGGTGCACCCGGCCCCAGCGGCGCCGGCGGCGCCGGCGGGCTG
+CTGCTCGGTGAGAACGGGCTGAACGGCTTGATGTAGCCGGCGGGCCTGCGACCGCGCGCGGCGTTGACAG
+CATCGCTTCGGCCGCTCGACCGCAGATGATGCTGTTGATGCGTTACCGTGTGCATCATGCGCACCACGGT
+GTCAATCTCCGATGAAATACTCGCTGCCGCCAAACGCCGGGCCCGCGAGCGTGGTCAATCGCTGGGCGCT
+GTGATCGAGGACGCCCTTCGGCGGGAGTTCGCCGCCGCCCACGTCGGCGGCGCCCGCCCGACCGTCCCGG
+TTTTCGACGGCGGCACCGGTCCGCGGCGAGGCATCGACCTGACCTCGAATAGAGCGTTGTCCGAAGTGCT
+CGACGAGGGCCTGGAACTGAACTCCCGGAAGTAACCCCCAATAGGCGCAGAACGGCAATGTTCCTTCTCG
+ACGCCAACGTGCTGCTGGCTGCACACCGCGGTGACCACCCGAATCACCGAACCGTCCGCCCCTGGTTCGA
+TCGACTGCTCGCGGCTGACGACCCCTTCACAGTGCCGAACCTGGTATGGGCGTCGTTCCTCCGGCTGGCA
+ACGAATCGACGCATCTTCGAGATTCCGTCACCGCGAGCAGAGGCATTCGCATTCGTCGAAGCCGTCACCG
+CCCAGCCCCATCACCTTCCGACGAACCCCGGTCCCAGACACCTCATGCTGCTGCGAAAACTCTGCGACGA
+GGCCGACGCATCGGGCGACTTGATACCTGACGCGGTACTCGCGGCCATAGCAGTGGGGCATCACTGCGCC
+GTGGTGAGCCTGGACAGGGATTTCGCCCGGTTTGCCTCGGTGCGCCACATTCGCCCGCCGCTCTAGCGAG
+CGGTCCTCAAGTACAGTCGGCGACCGGACAAACCGCTGCGCCAGACGATTCACCGTCCTCGCGTCAATTC
+GAGCAGCTACGGCCGAAAGCCAAGGGCCTTCTTCGTCGGGGTGAAAAAGTTCAGACGCAGCGACACCAGC
+TGCCACAGCTGGTTGAGCAACTCCAGTTCCTCGGTGCTGTCGTAGCGCCAGTGGAACGCGTGTTTGCGCA
+CCACACGGTTGTTCTTTCGACTCCACGTGCGCCTGGTCGTTCGTCTGGTACACCAGGCTACCGGGCTATC
+GGATTCGGCCCCAAACCTCAGGAGCCGCCTCCGGATCCGGTGCCGTTTCCGCCCTACCAGCCGAAGGTGT
+GGGACTAAACTATCTAGGGCAAGTGCGGGCCATAGTGGGCGACTGCGTCATCCACATCATGCCGATGGGC
+ACCGGGGTCGAGCTGAGCAAGTTGGCCGATCTGGCATTGGATATCGGCCGCAGTGTCGGATGCTCGGCCT
+ACGAGAACGACTTCACGCTGCCGGACATTCCAACGCAGTGGCGCAACCAGCCGCTGGGCTGGTACACGCA
+AGGCCTTGCCCCCTACCTGCCGGGGCTGTCGGACCCGAAAGACGCCGCCGAGGGCTGATGGGTGTGCCGG
+CGACCTCTGAGGGCGAGCAGACGCATAAGCGCCCAATTTCGTGTCGAAATGGGCGCTTATGCGTCTGCTC
+GCGCGCGCAACGTGTGGATCACCGCGCTGAAGTCCAGGTCGGCGTGGTCGGCGGCGAATTTGGCGTAGAT
+GTCGGCGGCGTGGCTGCCCAGCGGGGCCGTCGCACCGGTGGCGGCCACCGCATCCATCGCCAGGCCCAGG
+TCCTTGTTCATCAACGCGGTCGAAAACCCGGGCTTGAAGTCGTTGTTGGCCGGTGAGGTGGGCACCGGGC
+CCGGCACCGGGCAATTGGTGTGCACCGCCCAGCAATTGCCGGTCGCGCCGGTGATGACGTCGAACAACGA
+TTGTGCGGACAGCCCGAGCTTCTCGGCCAGCACGAACGCCTCGGCGATCGCGATCTGCTGCACCGCCAGC
+ACCATGTTGTTGCACACCTTGGCGGCCTGTCCGGCACCGGCGGCGCCGCAGTGAATGATCTTGCCCGCCA
+TGGGCTCTAGTACCGGGCGTGCCCGCCGTAGCGTGGACTCGTCGCCGCCGACCATGAATGCCAGCGTCGC
+GGCGGCGGCGCCCTTCACCCCGCCGGAGACCGGCGCATCCAGTTGGAGCATGCCGTGCGATTCGGCCAGC
+GCGTGCACCTCACGGGCATCGGTGACCGAGATCGTGGAGCTGTCGATGAACAGCGTTGCCGGACGCGCGG
+CGGCCAGCACGTCGGTGTAGCAGCGCCGGACCACCTCGCCGGTGGGCAGCATGGTGATGACCACGTCGGC
+CTCGGCCACCGCTTCGGGCGCGCTACGAAACACCGCGACACCGTGCGCGGCGGCGCCGGACGCCGCCGTG
+GGTGCCGGGTCGAATCCACGCACGACGTGGCCCGCACCAACCAGATTCGCCGACATCGGCGCACCCATGT
+TGCCCAAACCTAGGAAGGCGATGGTCGTCATCTGAGCCTCTCTAAACGGTGGCGCGGAACCGCGCGGCCT
+CGGCCCGACCGATGACCAGCCGCATGATCTCGTTGGTCCCTTCCAGGATGCGATGCACCCGCAGGTCGCG
+GACGATCTTCTCCAGACCATACTCGCGCAGATAGCCATAGCCGCCGTGCAGCTGCAGGGCCTGGTCGGCG
+ACCTCAAAGCAGGTGTCGGTGACGTAGCGCTTGGCCATCGCACACAGCTCGACCTTGTCGGCGTCGTCGT
+CATCGAGCGCACTTGCGGCCCGCCACAACAACATTCGCGACGTCTGCAGCCCGGTAGCCATGTCGGCCAG
+GGTAAACCGCACGGTGGGCTCGTCGAGCAGCGATCCGCCGAAGGCCTGTCGGTCGCGAACGTAGGCGCCC
+GCTTTGTCAAAGGCGGCCTGCGCGCCACCCAGCGAGCATGCTGCGATATTGAGCCGGCCGCCGTTGAGGC
+CGCTCATCGCGATACCGAAGCCGGCGCCTTCGCCGTCGGCGCCGCCCAGCATGGCCTCGGCGGGTACCCG
+CACCCCGTCCAGCACCACCTGCGCGGTGGGTTGGGCATGCCAACCCATCTTCGCTTCGGGCGCGCCGAAA
+CTCAGCCCCGGTGTGCCCTTTTCGACGACGAACGCCGACACGCCGCGCGGACCCTCGGCGCCCGTGCGCG
+CCATCACCACATACACGTCCGATGCTGCGGCCCCGGAAATGAATTGTTTGACGCCATCGAGCACGTAGTC
+GCCGCCTTTTCCTGAGCCGTGCCTGACGGCGCGGGTGCTCAGTGCGCCGGCATCGGATCCGGCGCCCGGT
+TCGGTCAGGCAGTAGCTGGCGATGACGCCCATGGTGGCCAGTCGCGGAATCCAGTCCTTGCGTTGCTCGT
+CGGTGCCGAAGCTGTCAATCATCCACGCGCACATGTTGTGGATGGACAAAAACGCGGCGGTCACCGGGTC
+GGCGATCGCCAACTGCTCGAAGATGCGCGCGCCGTCGAGCCGGCGCAGCCCACTGCCGCCGACGTCGTCG
+CGGCAATAGATCGCGGCCATGCCGAGTTCGGCCGCTTCCCGCAACACGTCCACCGGAAAGTGTTTGGCGG
+CATCCCATTCCAGGGCGTGCGGAGCCAGGCGTTTGCCGGCGAAGGCGGCCGCCGTCTCGACGATCACCCG
+TTCGTCGTCGTTAAGGACAAACATGACACGCTAACTCATTGTGGGGATGACGAATTCGGCACCGTCCTTG
+ATGCCTGACGGCCATCGCGACGTGACGGTCTTGACCTTGGTGTAGAACTGGATTGCCGCCGGGCCGTGCT
+GGTTGAGGTCGCCGAAGCCGGAGCGCTTCCAGCCGCCGAAAGTGTGGTAGGCCACCGGCACCGGGATCGG
+CACGTTGACGCCGACCATGCCCACCTGCCCCCGGGAGACGAAGTCGCGGGCCGCGTCGCCGTCGCGGGTG
+AAGATCGCCACCCCGTTGCCGTATTCGTGCTCCGACGGCAGCCGCAACGCCTCTTCGTAGTCGCGGGCGC
+GAACCATGCACAACACCGGCCCGAAGATTTCGTCGGTGTAGATCGACATGTGGGCAGCGACATGGTCGAA
+CAGGGTCGGCCCGATGAAGAAGCCGCCCTCCAGGTTCGCATCGCCTTCAGGCAGCCCAAAGGTCAGGTCG
+TCGCTGGCGCGGTCGCGGCCGTCAACGACCAGCTCGGCACCGGCGGCCACACCCTGGCCGATGTAGTCGC
+GCACCCGCGCCAGCGCCGCCCCGGTGACCAGCGGGCCGTAGTCCGCCTTGGGGTCCAGGCTGTGTCCCAC
+CCGCAAGTTATTGATCCGCTCGATCAGCCTGGCGCGCAACCGCTCCGCGGTCTGATCGCCCACCGGCACG
+GCGACGCTGATCGCCATGCAGCGTTCGCCGGCGCTGCCGTATCCGGCGCCGATCAGTGCGTCCACGGCCT
+GATCCAGGTCCGCGTCGGGCATCACGATCATGTGGTTCTTGGCACCGCCGAAACACTGCGCCCGCTTGCC
+GGTGGCGGCGGCACCAGCGTAGATGTACTGAGCGATATCCGAGCTGCCGACGAAGCCGACGGCCTTGATG
+TCGGGGTGGTGCAGGATGGCGTCGACGGCCTCCTTGTCGCCGTGCACCACCTGGAACACGCCCGCCGGCA
+GGCCCGCCTCGATGAACAGCTCGGCCAGCCTCACCGGAACCGACGGGTCGCGCTCACTTGGCTTGAGCAC
+GAAGGCGTTGCCGCACGCTAGGGCCGGGCCGGCCTTCCACAGCGGAATCATCGCCGGGAAGTTGAACGGG
+GTGATCCCCGCGACCACACCCAGGGGCTGCCGCAGCGAATAGACGTCGATGCCGGGGCCGGCACCCTCGG
+TGTACTCGCCCTTGAGCAGGTGGGGAATGCCCAGGCAGAACTCGATTACCTCGATGCCGCGCTGGACGTC
+GCCGCGGGCGTCGGCCAGCGTTTTGCCGTGCTCACGCGACAACAGCTCGGCCAACTCGTCGATGGTGTCG
+TTGACCAGTTCGATAAACCGCATCAACACCCGGGCACGGCGCTGGGGATTCCATGCGGCCCAGCCCTTTT
+GGGCCTCGACCGCGGAGGCCACGGCCGCGTCGATGTCTGACTTGCCGGCCATCGGTACCTTCGCCTGGAT
+CTGGCCGGTGTTGGGGTCGAAGACGTCGGCCGAGCGCGTGGACTGGCCGGCGGTGCGTTGTCCGTCGATG
+AAATGTGAAATCTGTGTGGTCATGGTTGTCCTGTGCAAGCCGGTGGCGGCGGGGAATCCCGATACTTGGA
+TATCCTAGTAACTGTGGCGGATGGCTCGCAAGGCGACCGAGCCGACAGCGTCCTAGCGGGAGACGCTTGG
+ATGCTCGTTGCATTTTGGCCGATACCCGCATCTGTTCCGGCGCTGCGCTCCATCATGGCTAGTACGCGAC
+AACACCCGGGGGTAAGCGATGTCATTTGTGATCGTGGCGCGGGACGCGTTGGCGGCGGCCGCGGCGGATC
+TAGCGCAGATCGGTTCGGCAGTGAATGCGGGCAATCTGGCCGCAGCCAATCCGACGACCGCTGTGGCGGC
+GGCGGCCGCCGACGAGGTATCGGCGGCACTCGCGGCGCTGTTCGGCGCGCATGCCCGGGAGTATCAGGCG
+GCGGCGGCGCAGGCAGCGGCGTATCACGAGCAGTTTGTGCACCGATTGAGCGCGGCAGCGACATCGTATG
+CGGTTACCGAGGTGACCATCGCGACGTCGCTCCGGGGGGCGCTGGGCTCGGCGCCCGCGTCCGTTTCCGA
+CGGGTTCCAAGCGTTCGTCTATGGTCCGATTCACGCGACCGGCCAGCAATGGATCAACAGCCCGGTCGGC
+GAGGCGCTCGCCCCGATTGTCAATGCGCCGACAAACGTGCTGCTCGGCCGCGATCTGATCGGCAACGGCG
+TCACCGGGACGGCGGCAGCTCCCAACGGTGGCCCCGGCGGTTTGCTATTCGGTGACGGTGGGGCCGGCTA
+TACCGGCGGTAACGGTGGGAGTGCCGGGTTAATCGGCAACGGGGGTACCGGTGGCGCCGGCTTTGCCGGC
+GGAGTGGGCGGCATGGGCGGCACCGGCGGCTGGTTGATGGGCAACGGCGGCATGGGTGGCGCGGGCGGTG
+TCGGCGGTAACGGCGGCGCCGGGGGCCAGGCGCTGTTGTTCGGCAACGGCGGCCTGGGCGGAGCCGGCGG
+GGCTGGCGGGGTCGATGGGGCTATCGGTCGTGGCGGGTGGTTCATCGGTACCGGCGGCATGGCCACGATC
+GGTGGTGGCGGCAACGGGCAGTCGATCGTCATCGACTTCGTGCGGCACGGCCAGACGCCGGGCAACGCCG
+CAATGTTGATCGACACGGCGGTGCCCGGACCCGGACTCACCGCGCTGGGCCAGCAACAGGCGCAGGCCAT
+CGCCAACGCGCTCGCGGCCAAGGGCCCCTATGCCGGGATCTTCGACTCGCAGTTGATCAGAACGCAGCAG
+ACCGCCGCGCCGTTGGCGAACTTGCTGGGGATGGCCCCGCAGGTATTGCCCGGGCTCAACGAGATCCATG
+CCGGCATCTTCGAGGACCTGCCGCAGATCAGCCCCGCGGGCCTGCTGTATCTCGTCGGCCCGATCGCCTG
+GACGCTCGGATTTCCCATCGTGCCGATGCTGGCCCCGGGCTCCACCGACGTCAACGGGATCGTCTTCAAC
+CGAGCCTTTACCGGTGCGGTTCAAACGATCTACGACGCTTCCTTGGCCAATCCGGTCGTGGCCGCAGACG
+GCAACATCACGTCGGTCGCTTACTCCAGCGCATTCACCATCGGGGTCGGGACGATGATGAACGTCGACAA
+TCCCCATCCGCTACTGCTGCTCACCCACCCGGTGCCCAACACCGGCGCCGTCGTGGTACAGGGCAATCCC
+GAGGGCGGCTGGACGCTGGTCAGCTGGGACGGGATACCCGTCGGGCCGGCGTCGCTGCCGACCGCGTTAT
+TCGTCGACGTGCGCGAGCTGATCACGGCGCCGCAATATGCGGCCTACGACATTTGGGAGTCCCTGTTCAC
+CGGCGATCCGGCGGCGGTCATCAACGCGGTGCGAGACGGTGCCGATGAGGTCGGCGCGGCTGTGGTCCAG
+TTCCCACATGCGGTGGCTGACGACGTGATCGACGCTACGGGCCACCCCTATCTAAGCGGCCTGCCGATCG
+GTCTGCCCAGCCTGATCCCATGACCGCGAGCGACCAATAGGTCCCCACATGGCCCGGAGGCCGCTGCCAG
+CATTGACCCGACGATGCCGGCCCGCAGGCTTCCCCGATCGTGCGGAACCTGCTCGGCCGTGCATGGGACA
+TCCAGATCGGATTGCCTCCGGGTACGGCGTACGCCGGACCCGGTCGCCGGGACGATACCGGGCTAGTGTT
+AGCTAGCGGTGGAAAAAGCCCGACACGAAATCGATCGAATTAAAGCCACCAGAATCCTGCTTTCCAGAGT
+TCCCGAAACCCGATGTGGCGCTGTTGTTGTCGGGATTGGCTTCAAGATTACCGAAGCCCGACTGTAGAAA
+ACCCGTATTGCCAAAGCCCGACATGAATCCACTGAACAGGCCGGTTCCCTTGTTCCCGAAACCCGATGTT
+ACACTAACCGAATTGTTGTAACCCGTTACCGATTGGCCCGAGTTGGCGAAGCCCGAGATTTGTAAATTAC
+CAACGTTTTGGGCGCCGGAGTTTCCCTTACCAGAATTATTGAAACCCGAATTTCCACTGCCGGCGTTTCC
+GAATCCCGAGTTTTCGCCCAGCCCATCGGTAGTATTGCCGAAACCGGTGTTCAGGTTGCCCGCGTTAAAG
+CCGCCCGTGTTGATATTGCCAGAATTTGCGAAGCCGGTGTTCGTCAGGCCAGAGTTCAAGAAACCAGAAT
+TAGCGTCTCCTCCGTTGAAGCTGCCTGAGTTGAATGCACCCGAGTTGAAGCTACCGGTGTTAATGATGCC
+GCCGTTGAAGTTGCCGGTGTTGAAATCGCCCGCGTTCCCTATGCCGGTATTGGCCTGACCTGAGTTGCCA
+AAGCCAGTGTTGACGCTTAACGCGTTCCCGAAGCCGGTGTTGATAAAGCCGGAGTTTCCGAAGCCGGTGT
+TGATGTTGCCTGAGTTGGCTACGCCCGTGTTGGTGACGCCCGAGTTGCCCACGCCGAAGTTGCCGCTGCC
+CGAGTTGAAGAAGCCGATGTTCCCGGTGCCCGAGTTACCAAATCCTATATTACCGCTACCGGAATTCAGT
+CCGCCAAAGCCGATCTGATTGCTGCCGGTTAACCCAATGCCGATATTATTGTTGCCGGTGTTCCCGAAGC
+CGAAGTTGTAGCTGCCGCTGTTCCCGAAGCCAACGTTGCCGTCGCCTACGTTTCCCAGACCGATATTTGC
+GTTGCCCGTGTTACCACCGCCGAAGTTTCCATTGCCACCGTTGCCAATCCCGACATTCCCATTGCCGGGG
+GTGGGCACGGCGGGGGAACTCATGTTTGGACCTGCATTTCCGATACCAATGTTGGCATTGCCAAAGTTCC
+CGAAGCCGAAGTTGTTGTCGCCAGAGTTGCCACCCCCGACGTTCGCATTACCGATGTTGCCGCTACCCAC
+GTTAAAGCTGGACGGTCCGATGCCAACGTTTCCGTTTCCGCTACCCAGGTTGAAGTTGCCGATGTTGCCG
+CTACCCACGTTGAAGCTGGAAATCTGGCCGTGGAAGGCGCTTCCGTTTCCGCCGCCAAAGTTGGCGTTAC
+CGAGGTTTCCATTACCCAGGTTGTAATCGCCGGTATTACCATTGCCGACATTGAGGTTGCCGATATTGCC
+GACACCCAAATTGATGTTTGGCAACGCCGGCTGCCACGACGCCAGCTGTGCCGCTGCCGCCGAGGATGCG
+GCATGGTAGCCGGCCATCACCGCCACGTCTTGTGCCCACATCTGCTCGTAGGTGGATTCCATGGCCGCTA
+TGGCCGGCGCGTTTTGCCCGAACACATTCGACACCGCCAACAACCACGTCCGAACACGATTGGCCTGCAC
+CACCGCCGGATGCACCACGCCGGCCAGCGCCTCCTCAAATGCACCCGCCGCCGCCCGAGCCTGCCGCGCT
+GCCAGCTCGGCCTGGGCTCCAGCCGCGGTCAACCAGCTCGCATACGGCCCCGCGGCATTCGCCATCGCGG
+CCGACGCCGGTCCCTGCCAAGCGCCGCCGGCCAACTCCGACGTCACCGACCCGAACGACGACGCCGCCGC
+GTGCAACTCCTCGGCCAACCCGTCCCAGGCCCCCGCCGCCGCCAATAGTGGCCGTGACCCCGCACCCAGA
+TACATCCGTAGCGAATTGGTCTCCGGAGGCAACCACGCGAAACCGACCATCACGGCCCCCTCACACCATT
+GACAAACCAGGACGCCTCGAGCCTAACTACACAACGCGAAGGGATTGGGACTTCTATCGGAATTGCGCCG
+CGTGCACTGGCCGCCGGCCTTTCCCCGCCAGCCTCGGTGTTTCATGCCGCTTGCCGTGGTCTGCCACCTG
+CGAGTTCGCATTTGTGCAGAGTCCCGTCGGGAGTTGTCAAAACTAAAACGGGCGATCTTGATCGCATCGG
+AAGCGCGAGATTGCGCCCTGAGCTGCGCCTTCGTGGAGCCCCCGGTCAGGATTGAACGGACGACCGCTCG
+CTTATAAGGCTGTTCCGGTACCGATCCTTAAGCCATCGAGGCCCTCGGCCTCATAGCGGGCCAACCAGGT
+ATGCAGCGTCTGCCGCGACACCCCAACTTTCTCGGCAACCTGCGAGATCGACAACCCGTCGCTGATCACC
+GCCAACACGGCTTGATACCGCTGTTCTGCCACACTCAACTCCTTCATCGAAGGAGTGTCAAGGATCAGCC
+GAACCAACTGTCAAGCATCAGCCGAAACATCGTCAGGCATCACCCGAACCCAAAACGTCAAGCATCAGCC
+GAGGTACTACACGAACGCTTGAGCCCCCTGTCAGGATTGAACTGACGACCGCTCGCTTACAAGGCGAGTG
+CTCTACCACTGAGCTAAGGAGGCCGATGAAATCGCTGTGAGTCTAGCCGCTCACTCGCTGTCGACGACGC
+GTTGCGAACGCACCGACCGCGACGACGAGCGGCGCGCGGGACGGCGCCCGGGCAGTGGAATGCGCTCGGC
+GATGCTGCTCAGCGGGTTGACCACCATGGTAAGTGCGATCACAGCGTCTTGCAGCGTCGCGATGGCCGGC
+TCGAGCGCCTCCATCCCGGGTGTCAGCCGCGCCAACGTGTCGGCGACGTCGGCGAGCTGTTCGAGCGGTC
+CGTCCTTGGCCGTTATCTTGTCGATCAGTCCGCCTTCGGCCAGCAGCCGGTCGGCCAGCCCGTCTTCGGA
+GAGCACCCGCTCGATAAGTCCGTCCTCGGCGAGCAGCTGGTCGGCCAGTCCGCCCGGTTGCAGTGCGCGC
+TGCATGGCGCCGCCTTCAGCGGTCAGGCGGTCGAGTAAGCCGCCGGGCTGGGTCAGCAGGTCGACCACCC
+CGCCGGGCCGCAGCATCCGGTCCATCGGCCCGTTGGGCGCGATGGCGCGTCCCAGCGGCATATCGTCGTC
+CAATAGCCTGGCCAGCCGGTTGGCGCGGGCAATCGTGTCATCGATTCCCAGCATGTTGGCCATTGAGGTC
+GACCCGCTTGCGCCGCCGGCATCACCCAACGCTTGTTTGGCCATGTCAACCGCCGCGCCGGCCATGTTCA
+AACCGGTGTCGGCGGCGGCGAGCCCCGCTCGTGCGGGCCAGGTCGCAATACCCACGAGGGTTTGGCCGAG
+GTTCATTCTGCGAGTGTATTCACGGCGCGCCGTGGATTGAGCGGCAACGGTCCAAGCTGATTTGGCGATT
+CCTGGCAGACTGTTAGCAGACTACTGGCAACAAGCTTTCAGGAATTACACAATGACTGTGAAGGTAACGT
+TCAACCAATGCGGAAAGGGGTTGATCTCGTGACGGCGGGAACCCCAGGCGAAAACACCACACCGGAGGCT
+CGTGTCCTCGTGGTCGATGATGAGGCCAACATCGTTGAACTGCTGTCGGTGAGCCTCAAGTTCCAGGGCT
+TTGAAGTCTACACCGCGACCAACGGGGCACAGGCGCTGGATCGGGCCCGGGAAACCCGGCCGGACGCGGT
+GATCCTCGATGTGATGATGCCCGGGATGGACGGCTTTGGGGTGCTGCGCCGGCTGCGCGCCGACGGCATC
+GATGCCCCGGCGTTGTTCCTGACGGCCCGTGACTCGCTACAGGACAAGATCGCGGGTCTGACCCTGGGTG
+GTGACGACTATGTGACAAAGCCCTTCAGTTTGGAGGAGGTCGTGGCCAGGCTGCGGGTCATCCTGCGACG
+CGCGGGCAAGGGCAACAAGGAACCACGTAATGTTCGACTGACGTTCGCCGATATCGAGCTCGACGAGGAG
+ACCCACGAAGTGTGGAAGGCGGGCCAACCGGTGTCGCTGTCGCCCACCGAATTCACCCTGCTGCGCTATT
+TCGTGATCAACGCGGGCACCGTGCTGAGCAAGCCTAAGATTCTCGACCACGTTTGGCGCTACGACTTCGG
+TGGTGATGTCAACGTCGTCGAGTCCTACGTGTCGTATCTGCGCCGCAAGATCGACACTGGGGAGAAGCGG
+CTGCTGCACACGCTGCGCGGGGTGGGCTACGTACTGCGGGAGCCTCGATGAGTCTTGGTAGTTAATCGGA
+TCGGCAGCCCGAGGAGAACGCGGCAATGGCCAGACACCTTCGAGGAAGGCTGCCCCTACGGGTACGCCTG
+GTCGCAGCCACGCTGATCCTGGTGGCCACTGGACTTGTGGCCTCGGGGATCGCGGTCACCTCGATGTTGC
+AGCACCGGCTGACCAGCCGGATCGATCGGGTGTTGCTCGAGGAAGCCCAAATCTGGGCGCAGATCACGCT
+GCCCTTGGCGCCGGACCCCTACCCTATTCATAACCCCGATCGGCCGCCGTCGAGGTTCTACGTTCGGGTG
+ATCAGCCCCGACGGCCAGAGCTATACGGCACTCAACGACAACACTGCCATACCGGCGGTGCCCGCCAACA
+ATGATGTCGGCCGGCACCCGACGACGCTGCCATCGATCGGCGGATCCAAGACTTTATGGCGCGCGGTCTC
+GGTGCGCGCGTCGGATGGCTACTTGACCACCGTCGCCATTGATCTGGCCGACGTCCGGAGCACCGTGCGG
+TCACTGGTGCTGTTGCAGGTCGGCATAGGCAGTGCGGTGCTGGTTGTCCTCGGGGTGGCGGGCTACGCTG
+TGGTTCGCCGCAGCCTGCGGCCGCTGGCAGAATTCGAGCAGACGGCCGCGGCGATCGGCGCGGGGCAGCT
+GGATCGCCGGGTCCCGCAGTGGCATCCGCGAACTGAGGTCGGCCGGCTTTCGTTGGCGCTCAACGGAATG
+CTGGCACAAATTCAGCGGGCGGTGGCGTCCGCGGAATCTTCCGCCGAAAAGGCCCGGGATTCAGAGGACC
+GGATGCGACAGTTCATCACCGACGCCAGCCATGAACTGCGTACCCCGTTGACCACTATCCGCGGCTTCGC
+GGAGCTGTACCGACAAGGAGCCGCCCGCGACGTGGGCATGCTGCTGTCGCGGATTGAGAGCGAAGCGAGC
+CGGATGGGGCTGCTGGTGGACGATTTGCTGCTGCTTGCCCGGCTAGATGCGCACCGGCCGTTGGAACTGT
+GCCGGGTGGACCTGCTGGCGCTGGCCAGTGATGCCGCGCACGACGCGCGGGCGATGGACCCCAAACGCAG
+GATCACCCTGGAGGTCCTTGACGGCCCCGGCACCCCGGAGGTCCTCGGCGACGAATCGCGGCTTCGGCAG
+GTGCTGCGCAATCTCGTTGCAAATGCCATACAGCACACCCCGGAAAGCGCCGACGTCACCGTGCGAGTCG
+GCACCGAGGGCGACGACGCCATCCTCGAGGTCGCCGATGACGGTCCGGGCATGAGTCAGGAGGATGCGCT
+GCGGGTGTTCGAGCGGTTCTATCGCGCCGACTCGTCGCGGGCGCGCGCCAGCGGCGGGACCGGACTGGGG
+TTGTCGATCGTCGACTCTTTGGTGGCGGCCCATGGCGGAGCGGTCACCGTGACGACCGCGCTCGGGGAGG
+GTTGCTGCTTTCGTGTCTCGCTGCCGCGCGTCAGTGACGTGGACCAGCTGAGCCTCACGCCAGTTGTGCC
+AGGGCCGCCCTGATCTTGGCCTGCGCTTCGTCCAGCGATCCCGGTGAGGGGTTGCGGTCGACGTTGGCAA
+AGCCGAAATCACTGAGGCTGCGGGTGGGAAACACGTGGATGTGTAGGTGGGGCACTTCCAGCCCGGCAAT
+GATCATCCCGGCGCGTTGGGTTGAAAACGCCCGGCACACGGCCTTGCCGATCAGCTGGCTCACCGACATG
+ACGCGGCCAAATAACGCGGGATCCACGTTTTGCCAGTGGTCGATTTCGGCGCGTGGCACCACCAAGGTGT
+GGCCTTGCGTCATCGGCTCAATCGTCAAGAACGCCACGACGTCGTCGTCCTCGTAGACGAAACGGCCGGG
+CAGTTCACGGTTGATGATCTTGGTGAAGATCGACACCCGTTGAGCATATGACGTCGCAACGGCCCCCCCC
+AGGTTTCATTCCTGGTTACCGAAGGTCATCATGTCGAGGTTCCAGTACCCACGCATGTTGGTGATCAAAC
+CGGCCTTATTCACCCGGTAGGTGAACACGCCGCGGACCTCACTGGTAAAGCCGCCGTCAAACTCGCTGTG
+CAACACCAGAATGTGGGCGATCTCGTCCGGTGAGCTGGACGGGAACGTCTCCTCGCAGGTGACCGTCAAC
+CGATTGGCCGCAATGTGTGTGTCGAAAAAGGCGCCGACGGCCTCCTTACCTTTGATGCCGCTGCCATCGG
+GATTGGTGACGGACTTGCCGATCGGATCCTCGATGACGACGTCGTCGGCCATCAGCGCCAGCCAGCCCTC
+CCGGTCGTGGGCTTGGACGCACCGCCACGACGACTGCGACGCGATCAGGGCCGGGGATTGGGTCGTTTGG
+GTCATGGCTATCTCCGGCTAGCGGTCGTCGTCCGTGTACCGGATCACGCCGCGAATGTTCTTGCCGTTCA
+GCATGTCCTGGTATCCGTCGTTGATCTGCTCCAGCTTGTACGCAGTGGTCACCATGTCGTCGAGGTTGAG
+TTTGCCGGCCTTATACATCGACAACAGCTTCGGAATGTCGTAGTGCGGGTTGCCGCCGCCGAAGATGGTG
+CCCTGGATGTTCTTTTGCAGCAGGGTCAACATCGCGAGGTTCAGCGTCACCTGGGTGTCGACCAGGCTGC
+CGATGGCCGTCAGCACGCAGGTGCCGCCCTTGGCCGTGATGGTCAGATAGCTGTCGACGTCGGCGCCATC
+GAGCTTGCCGACGGTGATGATCACCTTCTGCGCCATCAGGCCGTAGGTGACCTCGGCAATGCCCATCAGC
+GCGGCGTTGATGTCCGGGTAGACGTGGGTGGCACCGAATTTCAGAGCCTGATCACGTTTCCATTCCACCG
+GCTCCACCGCGAAGACGTAGCGGGCGCCCGCGCTGACCGCGCCCTGCAACGCCGCCATGCCGACCCCACC
+CAAGCCGACGATGGCCACGTCGTCGCCCGGCCGGACGTCGGCCGTGCGGACCGCCGAACCATAGCCGGTG
+GTGACGCCGCAACCAACCAGGCAGGCGACTTCGAAGGGCACCGACGGGTCGATCTTCACCACCGAGCTGC
+GGTGCACCACCATGTACGGTGAAAACGTTCCGAGCAGGGTCATCGGGTAGACGTTCTGGCCGCGAGCCTG
+AATCCGGAAGGAGCCGTCCGTCACAGATTCCCCGGCGAGCAGCCCCGCCCCCAGGTCGCACAGATTCCGC
+ATTCCAGCCTGGCAGGACGGACACTTGCCGCAGGACGGGATGAATGCCAACACCACGTGATCGCCCGGGG
+CGAAGTCGTCGACTCCCGGGCCGACCTCGGTGACGATGCCCGCGCCCTCGTGTCCGCCCAGAACGGGAAA
+GCCCGCCATCGGGATGTCGCCCGTCACCAGGTGATGGTCGGAGCGGCACATCCCAGCCGCTTCCATCTGG
+ATCTTGACTTCGTCCTTGCGCGGGTCGCCGATTTCGATCTCTTCGACGGACCATGGCTGGTTGAACTCCC
+AGATCAGTGCGCCCTTGGTCTTCACCGCAAACCTGCTTTCATCGTTGAACTTCGGCTACGAGTGGTCCCT
+AGCCTCGGCCGGAACGCCGACTGGCTGAGTGTAGGTCAACGGCGCTAGGGCGTTTACCACAGTGGCACCG
+GCGTCTTGCCGAGCGGGTAATAGCCCGGCACTTTGTTGCCCGACACGGCGCGTTCGATGCGCTTCTGCAT
+GCCTGGCGATAGCTTGCCGGCCTTGATCAATTCCAGGTAGAGCGCGGAAACATGACCGAAGTCGAAGAAA
+TCGCGTTGCCAGTTCCATTTCCCGCCGCCGGCATACCGGAACCAGCTGCCGCCAATGCCGTACACCTCCT
+GCTCGGCGCCATTGGCGTCGGTGGCAACCTGTTTCCAGAACCCAACCACCTCGCCCTGTTTCTCGTCGAT
+GACGACCCGTTGATAGGGGTAGCGCCAGCCCTGCAGGCCGTCCATTTCCTGGCCCAGCGCAATGTCGCGG
+ATCTCGTCGATGCCGACGCACATCACGTCCTCGTTGGGACCGACGTTCCAGCCGTAGGTGGCGTCGTCGG
+TGTAGAAGTCGGCCAGCAACGTCCAGTCGCCGCGCCGCTCCGCCGTACGGTTGGCCTGTAACCAGCGGTG
+AACCACATCTTCGAGTTCGTCGCGAGGATAGCCGGCCACGGTTACTCTCCCGTTTCTCGGATGGACAGTG
+CCTGGGTGGGACAGGCCCACACGGCATGCTTGATCACGCCGCGGGCTTCCTCGGGCGGCTCGGGGTCGAG
+GATTTCGACCTGGCCGCGCTTGGGCACCCGGAAATACTCGGGTGCCTCCAGCTCGCACATCGCGTGTCCT
+TGGCACAGATCCCGGTCGGCTTCGACTCGATAGCCCATCGTTAAACTCCCGTTCGCCGGCGGTAGCGCAC
+GCAAGCGGGCTGGGCCAACTGCACCACCATCTTCGAATGGTCGTTACGATAGCTTTCTGGCGGTTGCGCC
+ATCTCAAACTCATACTCGCGCAACAACACCGAGAAGATCGCTTTGATCTGCATGATGGCGAACGCCGCCC
+CCACGCAACGATGCCGGCCGGCGCCGAACGGAATCCACGTCCAGCGGTTGAGCAGATCTTCCTGGCGCGG
+CTGCTCGTATCGTGCTGGCACGAAGTCGTGGGGATCGGGGAAGTCTTCGGGGATCCGGTTGGAGATCGCC
+GGGGAGGCCGCCACCAGATCGCCCTCATGAATCCGGTGGCCTTGCACCTCGAACTCGCCCTTGGCCACTC
+GCATGAGGATGATCAGCGGAGGGTGCAGGCGCAGCGTCTCTTTCAGCACGTTTTCCAGCTGCGGAATCTG
+GCGCAGCGCATGGAAACTCACCGATCGGCCGTCGCCGTACAGCTCGTCGAGTTCGTCGATCACGGCCGCG
+TAGGCGTCGCGATGGCGCATCAACTCGATCAGCGTCCACGAAGCCGTACCCGAGCTGGTGTGATGGCCGG
+CGAACATCATCGAGATGAACATGCCGGTGATCTCGTCGGCCGAGAACCGGGGAGTGCCGGTCTCAGCCTT
+GACGGCGATGAGCACGTCGAGCATGTCACGGTCGCTCTTGTCGGTGGGTGGGTTGGCGATCCGGCCGTTC
+ATGATGTCCGCAACCAGTGCCACCAGACCATTGCGGGCTTCGTCGCGGCGACGGAAGCTCTCGATCGGCA
+GATACGGGTCGACGTAGGCTAGTGGGTCGGTGCCGCGCTCCAACTCGTGATAGAGCTTGGCGAATCGCCC
+GTCGAGCTGGTCGCGGAACTTCTTGCCGATCAGGCAGGCCGAGGAGGTGTAGATGGTCAGCTCGGCGAAG
+AAGTCCAGCAGATCGATCTCGCCGGCCTCACCCCAGTCGGCGATCATCCGTCGGACTTGATCTTCGATGG
+TGGCGGCGTGGCCCTTCATCTGCTCGCCGCGTAGCGCGGCATTGTGCAGCATCTCTTTACGCCGTTCCGG
+GCTGGCGTCGAACACCACGCCCTCGCCGAAGATCGGCGTCATGAACGGGTATGCCTTGGCCTGGTCCAGG
+TCGTCGTCGCCCGCCCGGAAGAAGAATTCGTTGGCGTGCGAGCCGGACAGCAGCACGACCTGCTTCCCGG
+CCAGCTGGAAGGTACCGACGTCTCCGCATTCGTCGCGGACCCGTTGCATCAGCCCGATCGGATCGGTGCG
+GAACTCCTCGAGGTGGCCGTGTTCGTCGTGGCCACCCGAAACCCGGGGTAGTGCAACAGCGCTCATTAGC
+CCGGCATCCCCTCTTCGCCCAGTACTAGCTTCTGACGGTGCGCGGGCGCATCCCTCAGCGGGGCCTCCGG
+TTGAATCTCCATGTTCACCACGACACACCCGCGCGGCGTTTCTGCGACGAACGCGATAGCGCGTGCCAGG
+TCGCTGGGTCGCAAGAAGTAGTTGTGCCGGGCCTGCCCCCACTTTGCCCAGTCCGCCAGCATTGGGCCGA
+CTTGTTCGGCCGACAGCTGCCAGCCCATACCGGTCAGCGTGGGTCCCGGATGCACGATCGATGCGCGAAC
+ACCGGTGCCTTCCAACTCCATCTGCAGGTTGGTGACCATAGCGGCCAGACCGGCCTTGGCGGCGCCGTAG
+GCACCCATATGCGGGCGTTGGCGCAGGCCCACATCGGATCCGACGAAGATGAGGTCACCTCGCCGGCGTG
+CCACCATGGCCGGTAGCACGGCCGTGGCCAGCCGGTTGGCACCGACCAGGTGTATCTGAACCTGCTCTGC
+AAAGGCCTCGGTGCTGACCTCGTGCAGCTGTCCCGGGAGCATGTCGCCTGCACTGGACACCAGCAGTTCG
+ACCTCGCCGAGTGCCTCGACCGTTTGCGCCACAAACGATTTCACCGACTCGGGATCGGTCACGTCGAGGG
+GGAAGGCTACCGCCTCGCCACCGTCGGCGCGGATTTTGTCGACCAGCTCGGCCAACTTGTCCATGCGGCG
+GGCCCCCAAGGCGACCGGAAACCCGCGGCCGGCGAGTTCGGTTGCGGTGGCCGCGCCGATGCCCGACGAT
+GCGCCGGCGACGACGGTGGTCCGCCGGGCGGGGTGAGGTTCGAAGCGTGGCATTACCTGGCCTGCACGCT
+GATCGGCAGATGGGCAAATCCGCGCACGTTGCTGGAATGGACGCGCACGACGTTGTCGTCGTCGACTTCG
+TAGTTGCGGATCCGACGCAGCAGCGCGCCCAGGGCCACCCGGGCTTCCATCCGGGCCAGGTGAGCCCCCA
+GACAGAAGTGGGCACCGCTGCCGAAACTGACTAGTTTGCAGCCGATTTCGCGGCCGATGCGATAGTCGTC
+CGGGTCGTCGAACACCCGGTCGTCACGGTTGGCCGATCCCGGTAGCAGCAGCAACACCTCACCCTCGGGG
+ATCGTGGTGTCGTACAACGTGAGATCGTGCGCGACGGTGCGGGCCAGAATCTGGCTGGACGTGTCGTAGC
+GCAGGGTTTCCTCCACCCACATCGGAATCCGGGAGTGGTCGGCGAATACGCGGGCCAGCTGGCCAGGGTG
+GTGGGCGGCCCAGTAGACGGCATTGGCCAGTAGCTTGGTGGTGGTCTCGTTGCCGGCGATCACCATGAGA
+AACAGGAACGCCATGATTTCCTGGTCGGAAAGCCGGTCGCCGTCGAGCTCGGCTGCCAGCAGTGCCGACG
+TCAGATTGTTCGCGGGCCGCCGCCGGAATTCCGCGATCAGGTCAGCGTAATATCTCATCAGCTCGATCGA
+CGCCGCCATCGCCGGCGGGGGCACATCGGCCACGCCGTCCTCGCGGTGCAGCACCGCATCGGCCAGCGCG
+CGGATGCGGGCCCGGTCGGTGTCGGGCACGCCTATCAGCTCTGAAATCACATCCATCGGCAGCTTGCCAG
+CGAATTCTGCTACGAAATCGAAACTTTCGGTTTGCAGGGCCGAATCCAGGTGAATGCGGGCAAGTTCGAG
+CACCTGCGGCTCGAGTTCACGGATCCGCCGTGGGGTGAAGCCCTTGGACACCAAGGTACGCATCCGCAGA
+TGTGCGGGGTCGTCCATGGCCAGCATCGACATTACCCGGTACGCCTCAGAAGTGCGTGAGGACGGATCCA
+GGGATACCCCATAGGCATTCGACAACGCCGTGCTGTCCCGGAAGCCTTGCAGCACGTCGTGGTGCCGCGA
+CACCGCCCAGAAATTGCGTTCCTCGTTACGGTACAGCGGGGCCTCGTCCCGCAGCCGACGATAATACGGG
+TACGGGTCTTCGTGAAAGTCGTAGTCGTAGGGGTCCAGGACCAGTTCGGGGTCACCGACGCGGACGGTCA
+TTCGCTGCCACCAGTGCTCGGCTCGTTAGCTCCGGCCAAGATCAGGCCCACCACGTACCCGAGTCGATCG
+GCGATCTCGTGGTAGGTGAAGGTGCCGCTGCCGGCCTGTACGAGCGCTCCGAAGAACGCCATCTCGAGTG
+CGAACACGGTACCGGGATCGGCGCCAGGTCCGATCGCCGATGTGATGCGGCGGTGGATCTCGGCGCCGAT
+TCGGTCGCGCACCGCACGCACCGCGGGGTCGGCGCCGCCGTCGAGCAGCGCCGCCGTGCACGCCGCGCCG
+ATTTCGGGTTCGTCGGCAACCACCAGCGCCAGGTGTCGCAACGAGCTCGTCACCCGGATAGGCATCGGGA
+CGTTGACGTCGGTGACGCAGGGGACCTGGCGGACCAGGTCGAGGTAGACCTCGGCGATCAGATGGTTCTT
+CGACGAGAAGTATGTGTAGGCCGTCGCCGGGGCTACCTTGGCGCGGGCCGCCACCAGGCGCACCGTCAGG
+TCGGCGTATGACTTCTCCCGCAGGGTCGCCATGGCGGCAGCTAGCACCTTGCGGAAGGTTGCCTGCTGGC
+GGCGGTTGCGTGACACCGCTTCGGCGTGGGGTTCGGTTTGGCGCTGGGCCGGGGTGGTAACCAGTACATC
+GCTGGACACATGTCCAAGCTATCGGATGGTCGCGGCAGGAGGCAAGCCAGTCTGCTAAACATGCAGCTAA
+CATGGGACTGTCCGCGACGCGACGTGGCCCCTGGTGCATCGGTCAGGACGGTGTAGCGGCCTTGCGGATA
+CGGTCTCGATGAGGCAATATCGGACAAGTGTCCAATCGATGATGAGAGTCGGAGAAGTTGGGAGCGGTAG
+ATGGCCCTGTGGGGCGACGGAATTAGTGCGCTGCTCATCGACGGCAAACTATCGGACGGCCGTGCGGGCA
+CCTTCCCGACGGTCAATCCGGCCACCGAGGAAGTGCTGGGAGTCGCCGCCGACGCCGATGCCGAGGACAT
+GGGCCGCGCCATCGAGGCCGCGCGGCGGGCGTTCGACTCGACCGACTGGTCCCGCAATACCGAACTTCGG
+GTGCGGTGTGTTCGGCAACTGCGCGACGCAATGCAACAGCACGTCGAAGAACTACGCGAACTGACGATCT
+CCGAGGTGGGCGCGCCGCGGATGCTCACCGCCAGCGCCCAGCTGGAAGGCCCGGTCGGGGATCTATCGTT
+TGCGGCGGACACGGCCGAGTCCTACCCGTGGAAGCAGGACCTCGGCGAGGCATCGCCGTTGGGCATCGCC
+ACCCGGCGCACCCTCGCACGGGAGGCCGTCGGTGTCGTCGGCGCCATCACCCCGTGGAACTTCCCGCACC
+AGATCAATCTCGCCAAGCTAGGTCCGGCGCTAGCCGCGGGTAACACCGTCGTTTTAAAGCCGGCGCCTGA
+CACACCGTGGTGCGCAGCAGCGCTCGGGGAAATCATCGTCGAGCACACCGACTTCCCACCGGGCGTTGTC
+AACATCGTCACCTCCAGCAGTCACGCTTTGGGGGCGCTGTTGGCCAAAGACCCTCGGGTGGACATGATTT
+CGTTCACCGGTTCTACTGCGACCGGCCGTGCCGTAATGGCCGATGCCGCGGCCACCATCAAAAAGGTTTT
+TCTGGAACTGGGTGGCAAGTCGGCGTTCGTCGTGCTCGACGACGCTGACCTAGCCGCTGCCAGCGCGGTA
+TCGGCGTTCTCGGCTTGCATGCACGCCGGGCAGGGGTGCGCAATCACGACCCGGCTGGTGGTGCCACGGG
+CCCGTTATGAAGAGGCGGTTGCCATCGCGGCAGCCACCATGTCGTCGATCAGGCCCGGCGATCCCAACGA
+CCCCGGAACCGTTTGCGGGCCGTTGATTTCGGCCCGACAACGGGATCGTGTGCAGGGCTACCTCGACCTG
+GCGGTCGCCGAAGGCGGAAGGTTCGCATGCGGTGGCGCGCGGCCGGCGGATAGAGAGGTCGGTTTCTACA
+TCGAGCCCACGGTCATCGCAGGGTTGACCAATGACGCCAGAGTCGCCCGAGAGGAGATCTTCGGACCGGT
+GCTCACGGTGATTGCCCACGACGGTGACGATGATGCGGTGCGCATCGCCAACGACTCGCCATACGGCTTG
+TCGGGCACCGTGTATGGCGCCGACCCGCAGCGCGCCGCGAGGATTGCCTCGCGGCTGCGGGTAGGCACCG
+TCAACGTCAATGGGGGTGTCTGGTACTGCGCCGACGCGCCGTTCGGCGGCTACAAGCAATCCGGTATCGG
+ACGCGAGATGGGTCTCCTCGGCTTCGAGGAGTACTTAGAAGCCAAACTCATTGCTACCGCTGCAAATTAG
+CTAGCGGGTTGACAGCGCAGAAAGGAAGCCATGTTCGACAGCAAGGTGGCTATCGTCACCGGGGCTGCCC
+AGGGTATCGGGCAGGCCTACGCTCAGGCGTTGGCCCGCGAAGGTGCCTCGGTGGTCGTCGCTGACATCAA
+CGCCGACGGTGCCGCGGCGGTAGCCAAGCAGATTGTCGCCGACGGCGGTACTGTGATTCATGTGCCCGTT
+GACGTGTCCGACGAGGATTCCGCTAAAGCCATGGTCGACCGCGCCGTCGGTGCTTTCGGCGGCATCGACT
+ATCTGGTGAACAATGCGGCGATCTACGGTGGCATGAAGCTCGATCTGTTGTTGACCGTGCCGTTGGACTA
+CTACAAGAAATTCATGAGCGTCAACCACGACGGCGTGCTGGTGTGTACCCGCGCGGTGTACAAGCACATG
+GCCAAACGGGGCGGCGGCGCGATTGTCAACCAGTCCTCGACCGCGGCCTGGCTGTATTCCAACTTCTACG
+GCCTGGCCAAGGTCGGTGTCAACGGGCTGACGCAGCAGCTGGCCCGCGAGCTGGGCGGAATGAAGATAAG
+GATCAATGCGATCGCACCCGGACCGATCGACACCGAAGCTACCCGCACCGTCACCCCCGCAGAGCTGGTC
+AAGAACATGGTGCAGACCATCCCGCTGTCGCGGATGGGTACACCGGAGGATCTGGTGGGCATGTGCCTGT
+TCCTGCTGTCGGATTCGGCATCGTGGATCACCGGGCAGATCTTCAATGTCGATGGCGGACAGATCATCCG
+GTCATGACCGGCGCCGGCGCCGATGCAGAGCGGGGCGATGAGGTGGGGGCACGCCCCCACAAGTGGGAGG
+TACCCCCATCCGCTGGCGGGGGAGAGCGGCGCTCATGACCGCTCACCCGGAGACACCACGCCTGGGATAT
+ATCGGCTTGGGTAATCAAGGCGCGCCGATGGCTAAGCGTCTGCTCGATTGGCCTGGCGGACTGACCGTTT
+TCGATGTGCGGGTCGAGGCCATGGCACCGTTCGTCGAGGGCGGCGCCACCGCAGCGGCAAGCGTCTCCGA
+CGTCGCCGAAGCCGACATCATCAGCATCACCGTGTTCGACGACGCGCAGGTGAGTTCGGTGATCACCGCC
+GACAACGGACTGGCGACGCACGCCAAGCCCGGCACTATTGTCGCGATTCACTCCACCATCGCCGACACGA
+CAGCAGTCGATCTGGCCGAAAAGCTCAAGCCGCAGGGGATCCACATCGTGGATGCACCGGGCAGCGGCGG
+CGCGGCGGCGGCCGCCAAGGGTGAGTTGGCCGTGATGGTCGGCGCTGACGACGAGGCGTTCCAGCGGATT
+AAAGAGCCATTTTCGAGGTGGGCTTCGCTGTTGATTCATGCCGGGGAACCGGGCGCTGGCACCCGGATGA
+AACTGGCGCGCAACATGTTGACTTTCGTCTCTTATGCCGCCGCCGCCGAGGCGCAGCGGCTGGCCGAAGC
+CTGTGGCTTAGACCTCGTGGCGCTCGGGAAGGTGGTGCGGCACAGCGACTCATTCACCGGCGGCGCGGGA
+GCGATCATGTTCCGCAACACCACTGCGCCGATGGAGCCGGCTGACCCGCTGCGGCCGTTGTTGGAGCACA
+CCCGCGGCCTGGGTGAGAAAGACCTGAGTCTGGCGTTGGCCCTGGGCGAGGTGGTATCGGTCGACCTGCC
+GCTGGCCCAGCTGGCGCTGCAACGGCTGGCCGCCGGCCTCGGGGTACCGCACCCGGACACCGAGCCAGCA
+AAGGAGACATGATGGACGAGCTGCGCCGCACCGGCCTGGACAAAATGAACGAGGTTTACGCCTGGGACAT
+GCCCGACATGCCAGGTGAGTTTTTTGCCCTGACCGTCGATCACCTATTCGGCAGGATCTGGACCCGTCCC
+GGCCTGTCCATGCGGGACCGGCGGATGGCCGTGATCGCGGTGCTGACCGCTCAAGGCCAGTCGGATCTGC
+TCGAGGTCCAAGTCAACGCCGTCCTGCATAACGACGAACTCACCATAGACGAGCTGCGTGAACTCGCTGT
+GTTCATTACCCACTATGTCGGCTTCCCGCTGGGCTCGCGGCTGAACAGTGCGATCGAGCGGGTAGCGGCC
+AAGCGTAAGCAGGCGGCCGAGAACGGCTCGCTGCCCGACACGAAAGCCAACGTCGCCGAAGTTCTTGCTA
+AGGAATCTGGTAAATCGAGCTAGTCTGACGTGTCGTGCGCGTCCTGGTAATCGGTTCGGGTGCCCGCGAA
+CATGCGCTATTGCTGGCGCTCGGCAAAGACCCGCAGGTTTCGGGGCTAATCGTTGCTCCCGGCAATGCAG
+GCACCGCTCGGATCGCCGAGCAGCACGACGTCGACATCACCTCCGCCGAGGCGGTGGTCGCCCTGGCTCG
+CGAAGTCGGCGCTGACATGGTGGTGATTGGCCCCGAGGTACCGTTAGTGCTCGGGGTGGCCGACGCCGTG
+CGCGCGGCCGGCATCGTGTGTTTCGGGCCCGGTAAGGACGCGGCTCGCATCGAAGGCTCCAAAGCATTCG
+CCAAGGACGTCATGGCGGCGGCCGGTGTGCGCACCGCGAACAGCGAAATCGTAGACAGCCCAGCGCACTT
+GGACGCGGCCCTGGACCGGTTCGGGCCGCCTGCCGGTGACCCGGCCTGGGTGGTCAAAGACGACCGGCTA
+GCCGCCGGCAAGGGTGTGGTGGTGACAGCGGACCGCGATGTCGCGCGCGCACACGGAGCTGCCCTGCTCG
+AGGCCGGGCACCCGGTGTTGCTGGAGTCCTACCTGGACGGCCCGGAGGTATCGCTGTTCTGTGTCGTCGA
+CCGCACCGTCGTGGTGCCGCTGCTGCCGGCACAGGACTTCAAGCGAGTCGGTGAGGACGACACCGGACTT
+AACACCGGCGGTATGGGCGCCTACGCGCCGCTGCCGTGGTTGCCCGACAACATCTATCGGGAGGTGGTCA
+GCCGGATCGTCGAACCCGTTGCGGCCGAACTAGTCCGGCGTGGAAGCTCGTTTTGCGGATTGCTGTATGT
+TGGTCTCGCGATTACCGCCCGCGGGCCGGCGGTGGTCGAGTTCAACTGCCGATTCGGCGATCCGGAGACC
+CAAGCCGTGCTGGCCTTGCTGGAGTCTCCGCTCGGCCAACTGCTTCATGCCGCCGCTACCGGGAAGCTGG
+CCGATTTCGGCGAGTTGCGGTGGCGTGACGGTGTGGCCGTAACAGTGGTACTGGCGGCCGAAAACTATCC
+CGGGCGCCCCCGGGTCGGCGACGTCGTTGTCGGCTCCGAAGCCGAGGGGGTGCTGCACGCCGGAACCACG
+CGGCGCGACGATGGCGCGATCGTTTCGTCCGGTGGCCGGGTGCTGTCGGTGGTGGGCACCGGTGCCGACT
+TGTCCGCAGCACGCGCACACGCGTATGAAATCCTCAGTTCAATTCGGTTGCCAGGAGGTCATTTCCGCAG
+CGATATCGGTTTACGGGCGGCCGAGGGGAAGATCAGCGTCTAGCAGGCTGCGGCTTGGCCATCACGGCGG
+GGATCGCTGGCCGCGAGGTACCCATCGTCGAGCCGCCAGATTGCCTGACAACTCCCGAACTGGCTGTAGT
+CCGCTACTGCGACCAAGTCATGCCCACGCTGCCGCAGTTCATCGAGAGTTGAATCCGGGAAGCCGTTTTC
+GAAACTGACCCGCATACCGTTCACCCAGCGGAACCGAGGGCCGTCACAGGCCGCCTGGGGGTTCTGGCCG
+TAGTCGGCGATGCGCACCAGCACCTGCACGTGACCCTGGGGTTGCATCATGCCGCCCATCACCCCGAAGC
+TCATCACCGGCGCACCGTCGCGGGTCACAAAACCTGGGATGATCGTGTGATAGGGGCGCTTCCGTGGCCC
+AACCCGGTTCGGATGTCTCGGCACCACAGTGAAATCCGAGCCGCGATTGTGCAGCGAAATGCCGGTGCCG
+GGCACCACCACACCGGAGCCGAACCCAAGGTAGTTCGACTGAATCATGGACACCATCATTCCCGCAGCAT
+CGGCGGCGGCCAGATAGACGGTGCCGCCTCGCGGGATGCCGGTGGCCGCCGGCATTGCCCTCTTTGGATC
+GATCAGCGTGGCGCGCTGCCGCAGATACTCCTTGTCGAGCAGGCGCTTCGGGTGCACCGGCATGTAGTCG
+ATGTCGGCGACACACGCTTGCGCGTCGGCGAAGGCAAGCTTCAGTGCTTCGATCTGCACGTGCACACTTT
+CAGCGGAATCCACTGACCACGATGACATATCGAAATGCTCGAGGATTCCGAGGGCGATCAAGGCCACGAT
+GCCCTGGCCGTTGGGCGGTATCTGGTGGATGGTGTACCCGCGGTAGGTTCCCGTGATCGTGTCGACCCAG
+TCCACGCGATGGGCGGCGAGGTCGTCGGCACGCATCACCCCGCCGTTTGCCGCCGAGTGCGCCTCGAGTT
+TGGCGGCCAGCTCTCCCCGGTAGAACTCCTCACCGTTGGTCGCCGCGATCTTCTCTAGCGTCGCCGCGTG
+GTCAGGAAAGGTAAACAGCTCACCGGGTTTCGGCGCTCGTCCGCCGGGCATGAACGCATCGGCGAATCCG
+GGCTGGGATGCGAACAACGGCACCTGTGCCGCCCATTGTGCCGCGACGGTCGGTGAGACCAGAAAGCCGT
+TGCGGCCGTACGAGATGGCGGGCTCGAAGAGTGTTTCGAATGGTAGCCTGCCGAACCTGGCGTGCAGTTC
+CACCCAGGCCGACACCGCACCGGGCACCGTCACGGAGTTCCAGCCGAGCACGGGAACGGCGTTGCCGCCG
+AAGTACTCTGGCGTCCACGCCGAGGGTGAGCGGCCGGACGCGTTCAGGCCGTGCAGTTTTTGCCCGTCCC
+AGACGATGCTGAAGGCGTCCGAGCCGATGCCATTGGACACCGGTTCCACCACGGTGAGGGTGATGGCTGT
+GGCGACGGCGGCGTCGACCGCGTTGCCGCCGTCGGCCAGCATCCGAAGACCCGCTTGCGCGGCCAGCGGT
+TGTGACGTGCACACGACGTTTGTCGCCAGGATGGGCATGCGCGGCCAAGCGTAGGGGAAGGTCCAACCAA
+ACGGCGTGCTCACGCCGCTTAACCTGTGAGCAGCGGCGCGAACCAGGTCAGCTCGGCGGGTAGCTGTGCG
+CTCCAGAACCCACCGTTGTGCCCGCCAGGGGAGAAGCCGCCCGCCGGCGGGTGGGGCAGCTGCGCCACGA
+ACTGCTTGGTTGCGGCATAAAACGGATCGCTGTTGCCGCAATCGACCCGGATCGGGATGGACCCCAATGC
+GGGGAGTCCGAAAACCGAGTTCGCCGACCAGTCGTCGGGTCCGTCGAAGGAGCCGGGTGCGACGGCACCG
+GCGGATAGCCACAGTGCCGGGCTGACCGCGCAGATCGCTGCGGTGCGTGCCGGTCCAAGGCGGCTGCCGA
+GCAGCAAAGCGCCGTAGCCGCCCATCGACCAGCCCAGAAACGCTACCCGGGAGGTGTCCAGCCGCTGGGT
+GTCCAATAGCGGAATGAGCTCGTTGAGCACCATTGCCCCCGCGTCCTCGCCAGAAGCCCGCTGGTGCCAG
+TAGCTGCTGCCTCCGGCCACGGAGACCACCGCGAACGGTGGCAACCCGGCGTTGACGGCCTGGGCCAGGC
+CCTGCTCGACGCCGCCGTCCATCACGGCCGATGCGCTACCGCCCAAGCCGTGCAGTGCGATCACGGGCCG
+CAACGCCTGGGTCTGGCCGGGTGGGCGGGCGATGGCCCAGTTGGTCATCTTCCCGGCGCGCGCTGCCGAC
+ACGAACGAGCCGGTGGACATCGTCGGCGCCGCCTGAGCCGGGGGGGCCGGATCGAGTGCTGGTGTCGGCG
+CCAATGGAACGTTTGTGCCAATCGCCGCCGCCGGTGCGGCATGTGAAGTTCGGGGCTGCAACAGCATGTC
+GATCGCATACGCTGAGGTAGCGCCAAGGACCGTGCCGGCGCCGAGACCGAGCACGGCGCGGCGGCTCAAC
+TCTGGCATGCGGGCCATCATGCCATGGACGTTTGGCCGAATTGGCAATGCAGTACCACTTTGACTGGCAG
+CATGGATGGGCGTGACAGCAGCGGTCACTCCAAAAGGAGAACGTCGGCGGTATGCGTTGGTCAGCGCCGC
+CGCGGAGCTGCTCGGCGAGGGCGGGTTCGAGGCGGTACGCCACCGGGCGGTGGCGCGGCGGGCCGGTTTG
+CCGTTGGCGTCTACCACCTACTACTTCTCGTCGCTCGACGATTTGATCGCTCGCGCGGTCGAACACATCG
+GAATGATCGAGGTGGCTCAGCTGCGAGCCCGGGTCAGTGCGCTGTCCCGGCGACGTCGGGGGCCCGAGAC
+CACCGCCGTTGTGCTGGTTGACCTGCTGGTGGGGGAAATGTCCAGTCCGGGGCTTGCCGAGCAGCTGATC
+TCACGATACGAGCGCCATATCGCCTGTACCCGCCTGCCTGACCTGCGCGAAAGCATGCGCCGCAGCCTGC
+GTCAGCGCGCTGAGGCCGTGGCCGAGGCCATCGAGCGCTCCGGCCGCTCCGCACAGATCGAACTGGTGTG
+TACGTTGATCTGTGCGGTCGACGGATCGGTGGTCTCGGCGCTGGTCGAAGGGCGGGACCCGCGTGCCGCT
+GCGCTGGCGACGGTGGTCGACCTCATCGACGTGCTCGCGCCCGTCGACCAGCGTCCGGTGCCGTTCTGAA
+GTCGGTGGGCAGCGACGGCGTGACAATGTACCCGGTGGTGAAGTCCCCATAGATCGTGACATCGGCGGGC
+CGGCGTTGGGCGTACAACGCCACGTAGGCGCATACGACGGCGTCGATCGGATCCTCGGCGGCCCGCAGGT
+CGCTTTTTCGCTGCGCGACCGTCACCTGCCGGCGCAACGAGACCCAATCCGGCTGACCGGCTACCTGCAT
+CCGAACCCCGGCCTGGGCGAGCCCCTCGACGCCGTCCATCAGTCGCAATAGCTCCGATTTGAGCAGGTCA
+ACGCTGCGTCCCGGCTTGGCCTTGTACTTCAGCGCGCGGGGTAGCCGAAACAGCGCCACCGTAGCCGGGT
+GCGGATAGACCTCGATGGCCCGCCGCGTGGCGGACGAAAGAGGATCCATATCCAGCGCCAGTTGGCGGGC
+CAGCCGGGCGGCGCGTGGAACGTCGGCAAACTCGGGCTTTTCGGTGTTGGCCGGATACGCGCCGGCCTCG
+AATTGTCGGAAGTCTCGATTCAGTGCGGCCTCCGCCGGCCGCTGGCCGGTGCGGTTGGCCACCACCAGCG
+GCGCGTCGAAGGCGACCAGGCAATCGCCCACAACGTAGGGCCGCAGCGCCGCCAGCACGGAGGCATCGTC
+GCGAGCGGCACCGACCCCCACCAGACACCCGTCCGCGTCGACAGCCGCGACACCGGTCGGATTGCGGCCG
+GCCCAGGCGAGGTCCACGCCGACGAAGTACATCTGCCCAGGGTATGGCGGGGCCGCGGCGTATGTGCTGT
+GGTGTCACATCCGTCACTTGCGCCTCTGTCAGAGGGATGCGCGTTGTGCCCGTCTCATAGCGACATCGCC
+CGGGCGGCACCGGGACCGGGCGTTGCCGAGTTGTCGCGATGAGTCGGGCACATCGGGTGCTCCCTGGCGC
+CGGGACTCGTGTGACAACTGCGACTACTAGGCCCGCGACCGTAAGCTGTGTCTTTGTGAGGGCCAAGTGA
+GCATTCCCAACGTGCTGGCCACCCGATACGCCAGCGCCGAGATGGTCGCGATCTGGTCGCCGGAGGCCAA
+GGTGGTCTCGGAGCGGCGGTTATGGCTGGCCGTATTGCGGGCACAGGCAGAGCTGGGGGTAGCGGTTGCC
+GATTCGGTGCTCGCCGACTACGAACGTGTGGTCGACGATGTGGACTTGGCCTCGATCTCAGCCCGGGAGC
+GGGTGCTGCGCCACGATGTCAAGGCCCGCATCGAGGAATTCAACGCATTGGCCGGTCATGAGCACGTGCA
+CAAGGGGATGACCAGCCGCGACCTGACCGAGAACGTGGAGCAACTGCAGATTCGGCGGTCGCTGGAAGTG
+ATTTTCGCCCATGGGGTGGCGGCGGTGGCGCGGCTGGCCGAGCGGGCGGTGAGCTACCGTGACCTGATCA
+TGGCCGGGCGCAGCCACAACGTGGCCGCTCAGGCCACCACCTTGGGCAAGCGGTTCGCCTCGGCGGCCCA
+AGAGATGATGATCGCGTTGAGGCGGTTGAGGGAGTTGATCGACCGCTACCCCCTGCGTGGCATCAAGGGC
+CCGATGGGCACCGGTCAGGACATGCTCGATCTGCTGGGCGGTGACCGTGCGGCGCTGGCCGATCTCGAGC
+GGCGCGTCGCCGACTTCTTGGGCTTTGCAACTGTTTTCAACAGCGTGGGGCAGGTGTATCCGCGTTCATT
+GGACCACGACGTGGTTTCGGCTCTGGTGCAGCTCGGCGCGGGGCCGTCATCACTGGCACACACGATTCGA
+TTGATGGCCGGCCACGAGCTCGCCACCGAGGGTTTCGCGCCGGGTCAGGTCGGTTCGTCGGCGATGCCGC
+ACAAGATGAACACCCGCAGCTGCGAACGGGTCAACGGGCTGCAGGTTGTGCTACGCGGCTATGCATCCAT
+GGTGGCCGAGTTAGCCGGTGCACAGTGGAACGAGGGTGATGTGTTTTGCTCCGTGGTGCGCCGGGTTGCG
+TTGCCGGACAGCTTCTTTGCCGTCGACGGGCAGATCGAGACGTTTTTGACGGTGCTGGACGAGTTCGGCG
+CCTACCCGGCGGTGATCGGCCGCGAGTTGGATCGTTATCTGCCGTTCCTGGCCACCACTAAGGTGCTAAT
+GGCGGCCGTGCGCGCGGGGATGGGTCGCGAGTCCGCGCACCGGTTGATCTCCGAGCACGCGGTGGCGACG
+GCGCTGGCCATGCGAGAACACGGCGCGGAGCCCGACCTGCTGGACCGGTTGGCCGCCGATCCGCGGCTGC
+CGCTGGGACGAGACGCTTTGGAGGCCGCGCTGGCCGACAAGAAGGCATTTGCCGGTGCCGCGGGTGACCA
+GGTCGATGATGTGGTCGCGATGGTGGACGCGCTGGTGAGCCGTTACCCGGACGCGGCTAAATACACGCCG
+GGTGCAATTCTTTAGTGTCATGACTACCGCCGCCGGGCTTTCGGGCATCGATCTGACCGATCTGGACAAC
+TTCGCCGACGGCTTCCCCCATCACCTCTTCGCCATCCACCGTCGTGAAGCGCCGGTGTATTGGCATCGGC
+CGACCGAGCACACCCCGGACGGGGAGGGCTTCTGGTCGGTGGCTACCTACGCCGAAACCCTTGAGGTGTT
+ACGTGATCCGGTGACCTATTCGTCGGTCACCGGGGGCCAACGTCGGTTTGGGGGCACGGTGCTGCAGGAT
+CTGCCGGTCGCCGGCCAGGTGCTCAACATGATGGATGATCCCCGGCACACCCGTATCCGGCGGTTGGTCA
+GCTCGGGCTTGACACCACGGATGATCCGGCGGGTCGAAGACGATCTGCGCCGCCGGGCGCGTGGATTGCT
+CGATGGCGTAGAACCCGGAGCGCCTTTCGACTTCGTGGTCGAGATCGCTGCCGAATTGCCCATGCAGATG
+ATCTGCATTCTGCTGGGTGTGCCGGAGACGGATCGACATTGGTTGTTCGAGGCGGTTGAGCCGGGATTCG
+ATTTCCGCGGCTCCCGCAGGGCGACGATGCCGAGGCTGAACGTCGAGGATGCCGGATCGCGGTTATACAC
+CTACGCATTGGAGCTGATCGCCGGTAAACGCGCCGAACCTGCCGACGACATGCTGTCCGTCGTCGCCAAC
+GCTACCATCGACGATCCGGACGCGCCGGCGCTGTCCGACGCCGAACTGTACCTGTTCTTCCATCTACTGT
+TCAGCGCCGGCGCGGAAACCACCCGTAACTCCATTGCCGGCGGGCTGCTGGCGCTGGCCGAGAACCCTGA
+CCAACTGCAAACGCTGCGAAGCGATTTTGAGTTGTTGCCGACTGCGATCGAAGAGATCGTGAGGTGGACG
+TCGCCGTCACCATCGAAGCGGCGCACGGCGTCCCGTGCGGTCAGCCTGGGCGGCCAGCCGATCGAGGCGG
+GTCAGAAGGTTGTGGTGTGGGAGGGCTCGGCCAACCGTGATCCCAGCGTGTTCGACCGCGCGGACGAGTT
+CGATATCACCCGAAAACCCAATCCGCACCTGGGTTTCGGTCAGGGGGTGCACTATTGCCTGGGCGCCAAT
+CTGGCTCGGCTGGAACTGCGGGTGCTGTTCGAGGAACTCTTGTCCCGCTTTGGCTCAGTGCGGGTGGTGG
+AACCCGCGGAATGGACACGTAGCAACCGGCATACCGGCATCCGGCACCTAGTCGTTGAATTGCGCGGAGG
+CTAGTCCCCGCGCAGCGGGATTCCGGCGGCCCGCAACTCGAGCGCGGCCAGCGCACGCATGGTGGCGGGA
+TCCTCTCGTCGCCAGGCGCCGACCGGATCGGTGCTGACGGCGGCCAGTTTGCCCGGCGGCCGGTTCGCCA
+ATGCGCGCAGCGCCAGCAGCTGGCGACCGGCTGGGGTCGCCGCCAGGGTGGTAACGGTCCACTTGCGCCG
+GCAGAACCGCAGCCGCAGGAACAGCCAGGGCATGGCCACGGCAAGAATCGGCGTCGCGGCGACCGCCAGC
+GCGAGCACTACCGCAAGCCAGCCGGCCGTGGTGTCCAGGTTGTGGCCGGCGCCGGCGATGTCAAGGGCGG
+CCTGGCTTGCGGCGGTGATGGGGTTGCTGAGCGCGTCGCCCACCACCGGGATACGCTGGGCGTCCTGGCC
+CGCGGCCGCCAGGTTGCCGGCAATCCCGTGCGAGCCGATTTCGATTTGGCGGCCGGCCTCGCCGATTATC
+GAGATGGCGTCGTGCACGGCGAGGCCGACGAGCATCCATAGCGTCGTCCACACCGCGACAGTGATATCGC
+TGATCAGTTGGGCCAGCAGTCGGCCGGGCGTGGTGGCATACGGCAAGAAGCGCGATCTCATACCAGAGAT
+ACCAGCACAGGGCGCCGTCGTGCGGCGGATAGGCTGGCGCGATGCGCCCCGCATTGTCCGACTACCAGCA
+TGTGGCCAGCGGTAAGGTCCGCGAGATCTACCGTGTCGATGACGAGCACCTGCTGCTGGTTGCCAGCGAC
+CGGATCTCGGCGTACGACTACGTCCTGGACAGCACCATCCCGGACAAGGGCCGCGTCCTGACCGCCATGA
+GCGCATTCTTCTTCGGGCTCGTCGATGCCCCTAACCATCTGGCCGGGCCGCCGGACGACCCGCGTATCCC
+CGACGAGGTGCTGGGCCGCGCGCTGGTGGTGCGTCGGCTGGAGATGCTGCCGGTGGAATGTGTGGCCCGT
+GGCTACCTGACCGGTTCGGGGTTACTGGATTACCAGGCAACCGGGAAGGTATGCGGTATCGCGCTGCCGC
+CGGGCCTGGTCGAGGCCAGTCGGTTCGCCACACCGCTGTTCACCCCGGCGACTAAAGCCGCGTTGGGGGA
+CCACGACGAGAACATCTCGTTTGACCGGGTGGTGGAGATGGTAGGCGCGTTGCGTGCCAACCAGCTGCGT
+GATCGTACTCTGCAGACGTATGTGCAGGCCGCCGATCACGCTCTCACCCGCGGAATCATTATCGCCGACA
+CCAAGTTTGAATTTGGCATCGACCGCCACGGCAACCTGCTGCTGGCCGACGAAATCTTCACACCGGACTC
+GTCGCGGTACTGGCCTGCCGACGACTACCGGGCCGGCGTGGTCCAGACCAGCTTCGACAAACAGTTTGTC
+CGCAGCTGGCTCACCGGCTCCGAGTCCGGCTGGGATAGAGGCAGCGATCGGCCGCCGCCTCCGCTCCCCG
+AGCATATCGTCGAGGCCACGCGTGCCCGTTATATTAATGCATACGAACGGATTTCCGAACTAAAATTCGA
+CGACTGGATCGGCCCTGGCGCATGATGCACCGAACCGCACTACCCTCACCGCCCGTGGCCAAGCGGGTGC
+AGACCCGCCGGGAGCACCACGGCGACGTCTTTGTCGACCCATATGAATGGTTGCGCGACAAGGACAGCCC
+TGAAGTAATCGCCTACCTCGAAGCTGAAAACGACTACACCGAACGGACCACCGCGCACCTTGAGCCATTG
+CGGCAAAAGATCTTCCACGAAATCAAAGCGCGTACCAAGGAAACCGACTTATCGGTGCCGACGCGACGTG
+GCAACTGGTGGTACTACGCGCGGACCTTTGAGGGAAAGCAGTATGGCGTACACTGTCGTTGCCCGGTAAC
+CGATCCCGACGACTGGAACCCACCAGAGTTCGACGAGCGCACCGAAATACCCGGTGAACAGCTTCTGCTC
+GACGAGAACGTGGAAGCTGACGGCCACGACTTCTTCGCACTGGGCGCGGCCAGCGTCAGCCTGGACGATA
+ACCTCTTAGCGTATTCCGTTGATGTCGTAGGTGACGAACGATATACCTTGCGGTTCAAGGATTTACGCAC
+CGGAGAACAGTACCCGGACGAGATCGCCGGGATCGGAGCGGGAGTCACCTGGGCAGCTGACAACCGCACT
+GTCTACTACACCACCGTGGACGCGGCCTGGCGTCCGGACACAGTGTGGCGATACCGACTAGGGTCCGGCG
+AATCGTCGGAGCGGGTTTACCACGAAGCCGATGATCGGTTCTGGCTCGCGGTGGGGCGTACTCGCAGCAA
+CGCCTATCTGCTGATTGCGGCGGGGTCGTCCATCACTTCGGAGGTCCGTTACGCGCACGCGGCAGATCCG
+ACAGCGCAGTTCAGCGTGGTGCTGCCGCGCCGCGACGGCGTCGAGTACTCGGTGGAGCATGCGGTCATAG
+CTGGCCAGGACCGGTTTCTGATCCTGCACAACGACGGCGCGGTGAACTTCACACTGGTAGAGGCCCCGGT
+CGAGGATCCTGCGCGGCAACGCACCCTCATCGCCCACCGCGACGACGTCCGACTCGACGCGGTGGATGCC
+TTGGCCGGCCATCTGGTAGTCAGCTATCGGCGCGAGGCGCTGCCGCGGGTTCAACTGTGGCCGATCGGGC
+CTGACGGAAACTATGGTGAGCCCGAAGAGATCTCGTTCGACTCCGAGCTGATGTCGGCCGGACTGGGGCC
+CAACCCCAACTGGGATTCGCCCAAACTGCGGGTCGGTGCCGGATCTTTCGTCACCCCGGTGCGGATCTAC
+GACATCGACCTGGTCACTGGCGAGCGTACCTTGCTGAAAGAACAGCCCGTACTGGGCGGCTACCGCCGCG
+AAGACTATGTGGAGCGGCGTGACTGGGCGTACGGAGACGACGGCACCCGGATCCCGGTCTCGATAGTGCA
+CCGAGCCGATATCGAATTCCCGGCACCTGCGTTGATCTATGGCTACGGCGCCTACGAGATCTGTGAGGAT
+CCGCGGTTTTCCATCGCTCGGTTGTCGCTGCTGGATCGCGGGATGGTGTTCGTCGTCGCCCACGTTCGCG
+GCGGCGGTGAGATGGGCAGGCTGTGGTATGAAAACGGCAAGCTACTGGACAAGAAGAACACGTTCACCGA
+CTTCATCGCGGTGGCAAGACATCTGGTGGACACGGGACTTACTTCCCAGCAGCAGCTGGTGGCATTGGGG
+GGTAGCGCGGGCGGTCTGCTGATGGGCGCGGTGGCCAACATGGCACCGGATCTCTTCGCCGGAATCCTTG
+CGCAGGTGCCGTTCGTGGACCCGCTGACCACCATCTTGGATCCATCGTTGCCGCTGACCGTCACCGAGTG
+GGACGAATGGGGAAATCCGTTGAACGACAGCGATGTCTATGCCTATGTGAAATCGTATTCGCCGTACGAG
+AACGTCACGGCCCAAAAGTACCCGGCCATCCTGGCAATGACGTCGCTGAACGACACCAGGGTCTATTACG
+TGGAGCCGGCCAAGTGGGTGGCCGCGTTGCGGCACGCCAAGACCGACGGCAATTCCGTGCTGTTGAAGAC
+CCAGATGCACGCCGGTCATGGTGGGATCAGTGGCCGCTACGAGCGCTGGAAGGAGACCGCGTTTCAATAC
+GGGTGGTTGCTAGCTACTGCCGACAGCGACCGTTACGGCGGCGGCCAGGGAAACGACCTCGATGGCGCTG
+CGCCAGCATAGCCGGTGGGATCGGCCATTCGGGATGCGTAGACATTGGCTCCGAACATGGCCAGCATCAG
+CGCCAGCGAGCATACCGCCGCTGCCATGCGGGTGTCGGGCAGCAACAGGCCCACGGCGACCAGGAGCCTC
+CAGCGCACCGGTGATGGTGACCAGCAGGCCGGGCGCAAGCAGCCCGGGTGAAACGATGGCGATGAGGTGG
+CCGCGCAGGGGCGGCGTGAAGTGAGCTCGGCTGCTCGACGGCTCCGATTCCGAACTGGTCGACGCCGAGA
+CCGCCGCTGCCGCCGAGCTGGCGCGCGGGGTGGCGGCGCTGCGCGATCCCAACGCCCGGGCGAATCCGGC
+GGGTGCCGAGCTGGCGACCTGGTCGCTGGTGCACGGCTTTTCGACGCTGTGGCTCGACGATGCGGTCAAC
+GCTGACGTGAAGCAGACGTCATGCGGATAGCAACGGTGCTCTTCGATGACTAGCCTGCTGTTTCGGCAGG
+AATGCCGCGGGGATCAGCGTCGAGACCACTAGCGCGGTCGCTATCACGAATACCACCGCGTAGGCGTGCG
+AAAGGTCATGCAGCAGTTGGGCCGCGAAGTTGGTTTGGCGCGGTAGCGAGGAAGGGTCAACCGCCGCCCC
+CCGCCCGGCGCCACTCTCTGGGGTCAGTGCGACTTTCTTTGCAGTAGCGATGATTTCGCTGTGATTGAAC
+TGGTAGGTGAGCAGCACCGACATCAGTGCGGTCCCTATCGAACCGCCCACCTGCTGGTTGACGCTGATCA
+GCGTCGAACCGCGAGCGATCTGATGTGGGGCCAGGGTCTGCACTGCCGCCCCGGACAGTGGCATCATGGA
+GCAGCCCATGCCCATGCCCATGATTGCCAGCCCGGTCGGCAGAATGGGTAAGTAGTCCGCTTGCCGCGCG
+ACACCAAAGGCGAAGGTGCCCAACCCCGCAGCGATCAGCATGATCCCAACCAGCACGATCTTGGCCGGTC
+CCCGTCGGTCCATCATCGCTCCGGCGATCGGCATCGCCAGCATGGCACCGAGGCCCTGTGGGATGATATG
+CACCCCCGATTGCATCGGTGATTGGTGCAACACTTGCTGGAGGTAGCTCGGGAGCAGCAAGAAGGAGCCA
+AACAGCCCGAGGGAGAGCACCGTCATCGTCATGTTGGCCTGCGCGACCGCTCGGTTCTGGAACAAGCGCA
+TGTCTATGAGCGGATGTTCTGTGCGGTACCACGAATGTGCGACGAATGCCGCGATCAACGCCAGGCCGGT
+GATCGCCGGTATCAACACGTGCCGATCGGCCATCGTTCCACGGGCGGGGCTAGATGACACCCCGAACAGG
+AAGGTCGCCAAACCCGGCGACAGCAACAAGAGGCCCATGTAGTCGAAGTTTTCCGACGCTGCCGGGCGAT
+CTCTTGGGAACACGATCGCCGCCAAGACGAGCGCGGACAGCCCGACCGGCAGGTTGACCAAGAAAATCCA
+ACGCCAGCCGTAGGCCCCGATGAGCCAACCACCCAGGATCGGCCCACCGACCGGGCCGAGCAGCATCGGA
+ATGCCCACCACCGCCATCACGCGCCCCAGCCGCTTCGGGCCCGCCTCACGGGCCAAGATGGCAAAGGACA
+CCGGCGTCAGCATGCCCCCACCGAAACCCTGGACAACACGAAATATGATGAGCAGCAAGATGTTTGGTGC
+TACTGCGCACAGCAGTGAGCCGAGGGTGAACGCCAATACCGAACCCATGAAAAGCCGCCTGGTGCCGAAC
+CGGTCGGCCGCCCAACCGGCTGTCGGGATCACAGTGGCCAACGCGAGCATGTAGCCGGTCATGGTCCAGG
+CCACGACGGCCTGGGTGGACCCGAAATCGGCAACGAAGGTGCGTTGCGCGACGCTGACCACGGTGACGTC
+CACATGTGCCATCACCGAGGCCAGGACACACACTCCGGCGGTCCGAAGCAACCCCACATCGAGCCTATCG
+GGATAGCTGCGTTGGCCAGAGCGGGGCCGCCCCGCGGGGGTGATGGGCACCGGGGCATCGCCTTCCGCGG
+GACACGCTTCAACCATGGCGTTGCCGAGCATATCGATACCGGTCACGGGTACCGCGCGAGGATGTCGGGC
+GGTGCTTGGTTCCGGCGTCGGGTCATGGCCCTGGCGCCGAGCCGACGTGCGCTCGTTCTGCGCTGGTCAG
+GGTCCAGATATACGCCTGCTGTCCGCGTGTCCTTCACCGTCCGGAAACCTGGAATCGGCAGACTGCAAGC
+GTGTCTGGAAAACTGCTCGTGTCGGTCTCGGGGATAGGTGAGAGCACCCTGGCCGATGTCGACGCGTTCT
+GCGCGGAAATGGACGCCCGCTCGGTGCCGGTATCGTTGCTGGTGGCTCCGCGTATGCGCGATGACTACCG
+GCTCGACCGCGACCCACGCACCGTCGACTGGCTGACCGGTCGCCGGGCCGCCGGCGACGCTCTGGTACTG
+CATGGCTACGACGAAGCGGCCACCAAGAGGCGGCGCGGCGAATTCGCAATGCTGCGCGCACACGAGGCCA
+ACCTGCGGCTGATGGCCGCCGACCGGGTGCTCGAACACCTTGGGCTGCGAACCCGACTGTTTGCGGCACC
+GGGCTGGCTGGTATCACCAGGTGTCCGTACAGCGTTGCCGGCCAATGGATTTCGGCTGCTTGCGGATCTC
+CATGGAATCACGGATCTGGTTCGGCTCACCACCGTGCGTGCCCGCGTGCTGGGCATCGGCGAGGGTTTCC
+TGGCGGAGCCCTGGTGGTGCCGGATGGTGGTGATGTCGGCCGAGCGGATCGCCCGGCGTGGGGGCGTCGT
+CCGGATTGCGGTGGCCGCCCGTCATTTGCGCAAGTCCGGTCCGCTGCAGGCGATGCTCGATGCCGTCGAC
+CTGGCGATGCTGCAGGGGTGCACACCGATGGTGTACCGGTGGCGAGCCGATGCGGCGGTACTCGACGCGG
+CCTGACCGAGCGCCTGATCGGTGGCGTTAACCTGTACCGACATGAGCGATGCTGTAGCCGGTTCAGATGC
+CGAGGGGCTCACCGCTGATGCCATTGTCGTGGGAGCCGGATTAGCGGGCCTGGTAGCCGCTTGTGAGTTG
+GCCGACCGCGGCCTACGGGTGCTGATCCTCGACCAGGAGAATCGGGCCAACGTGGGCGGGCAGGCCTTCT
+GGTCGTTCGGCGGTTTGTTCTTGGTCAACAGTCCCGAGCAGCGCCGCTTGGGCATCCGTGATAGCCATGA
+GCTTGCTCTGCAGGATTGGCTGGGGACGGCGGCGTTCGACCGGCCCGAGGACTACTGGCCCGAACAATGG
+GCGCATGCTTACGTCGATTTCGCGGCGGGGGAGAAGCGCAGCTGGCTGCGGGCCCGCGGGCTGAAGATCT
+TCCGCTGGTGGGCTGGGCCGAGCGTGGTGGTTACGACGCGCAGGGGCACGGCAACTCGGTGCCCCGTTTC
+CACATCACCTGGGGTACTGGGCCGGCTCTGGTCGACATATTCGTGCGTCAGCTGCGTGATCGCCCCACGG
+TGCGCTTTGCGCACCGCCACCAGGTCGACAAACTGATCGTCGAGGGTAACGCGGTGACAGGCGTTCGGGG
+TACCGTGCTGGAGCCCTCGGATGAGCCGCGCGGCGCGCCTTCGTCGCGAAAGTCTGTGGGGAAATTCGAG
+TTTCGCGCGTCAGCGGTGATCGTCGCCAGTGGTGGTATCGGTGGCAATCATGAGCTGGTGCGCAAAAACT
+GGCCGAGACGGATGGGCCGCATTCCCAAGCAACTGTTGAGCGGGGTGCCCGCGCACGTTGATGGCAGGAT
+GATCGGCATCGCTCAAAAGGCCGGGGCTGCGGTGATCAATCCGGACCGGATGTGGCATTACACCGAAGGC
+ATTACCAACTACGACCCGATCTGGCCGCGGCACGGTATCCGGATTATTCCGGGGCCGTCGTCGCTATGGC
+TGGATGCCGCGGGCAAGCGGTTGCCGGTACCGTTGTTTCCCGGGTTCGACACCCTCGGCACATTGGAGTA
+CATCACCAAGTCTGGACATGACTACACCTGGTTCGTGTTGAATGCCAAGATAATCGAGAAGGAATTCGCG
+CTGTCCGGTCAGGAGCAGAACCCTGACTTGACCGGTCGGCGCCTGGGCCAGCTGTTGCGCTCTCGGGCTC
+ACGCCGGCCCGCCCGGACCGGTGCAGGCATTCATCGATCGTGGTGTGGACTTCGTCCACGCGAACTCGTT
+GCGCGAGTTGGTGGCCGCGATGAACGAGTTGCCCGATGTGGTGCCGCTGGACTACGAGACGGTGGCAGCC
+GCGGTCACTGCGCGCGATCGTGAGGTGGTCAATAAGTACAGCAAGGATGGACAGATCACCGCGATTCGTG
+CCGCTCGCCGCTACCGAGGCGACCGATTTGGCCGGGTGGTGGCGCCACATCGGTTGACCGATCCGAAGGC
+CGGGCCGCTGATCGCGGTCAAGCTGCACATCCTGACTCGAAAGACGTTGGGTGGCATCGAAACTGACTTA
+GATGCTCGGGTGCTCAAGGCCGACGGTACGCCACTGGCCGGGTTGTATGCAGCCGGCGAGGTCGCCGGGT
+TCGGCGGGGGCGGTGTCCATGGCTACCGGGCCTTGGAGGGCACCTTCCTGGGTGGATGCATATTTTCCGG
+CCGCGCTGCCGGCCGCGGGGCCGCCGAGGATATCCGCTAGTTGTGGCCGCTTGACATAGGAGCTATTGCT
+CGCGCTAGAAGGTGACCGCGCTTTCCTCGGGCAACACCTGAAAGTCGGTGGTGGTCATCTCGGTGAGCCG
+GCCGTAGTAGATACCCCTGGCGTCCGGAGCGACGATGGCTTGGTGGATGGGTACCGCTCGTGCCGGAGCT
+ACGGCCCGCAGGTAGTCGACCGCCTCGGAGATCTTCATCCATGGGGCCGCGGCGGGAGTGGCCAGTACGT
+CCACCTGCTCGCCGGGAACGAACAACGCGTCACCGGGATGCATCAGTCTTGCCCGATGTTTACTGTCGCC
+CACCAGATACGAAATGTTCTCTATCACAGGGATTTCCGGGTGGATCACCGCGTGGCAACCGCCGACCGCA
+CGGACGGTCAGCTCCGCTAACGGCAGCTCGTCGCCAACGTGCACCGCCCGCCATGGCTCGCCCAGCTGCG
+CCGCCGTCTGCGGATCGGCGTACAGCTCGGCAGCCGGGTTGTCCTCGAGCAGGGTCGGCAGCCGCGTGAC
+GTCTATGTGATCGGGGTGCTGGTGGGTGATCAAGATCGCGGACAAACCGGTGATTCCCTCGAAGCCGTGC
+GAGAAAGTACCGGGATCGAAGAGCAGGCGGGTTTGACCGAACTCAGCGAGGAGGCAGGAATGGCCGAAAT
+GCGTGAGTTGCATGTTTACGATTGTGCCCTTATGGGGGCGTTTCCGATGCGGTTGATCCTGGCGACGATG
+CTGGTCGCCGGTCGCTTGTTGGCGACGCTCATGGCCGCGCCTAGCGCCCAGGCTGAGCCGGAAACCTGCC
+CGCCGATATGCGACCAGATTCCTGCTACCGCGTGGATCAGCACCCACGCCGTGCCGTTGAACTCGCAATA
+CCGTTGGCCGGCAATGGCCGGCGCGGCAGTGGCGGTGACCAGGGCGACACCACGTTTCGGGTTCGAGCAG
+GTGTGCGCCACGCCGGCGTTCCCGCACGACAGCCGCGATTGGGCGGTCGCGGGCCGGGTCACGGTGGTCC
+ACCCCGACGGCCAGTGGCAGTTGCAGGCTCAGGTGCTGCACTGGCGCGGGGACACCGCCCGCGGTGGCCA
+GATCGCGGCGTCGGTGTTTGGCACCGCCGTCGCCGCGTTACGCGCCTGCCAGCTGGGCGCACCGCTGCAG
+TCGCCGTCGGTCACCGACGACGAACCGACCCGGATGGCCGCGGTGATCAGCGGGCCGGTCATCATGCACA
+CCTACCTGGTCGCGCACGTATCAAGCAGCACGATCAGCGAACTCACCTTGTGGTCGTCCGGGCCGCCACA
+AGTTCCGTGGCCTACGGTTGCGGACTCCGCGGTTCTGGACGCCCTGACCGCGCCGTTATGCGAAGCCTAC
+ATCGGCTCGTGCCCGTGACCAGGCGGGGCACCTGCCGCCGGTAGAGTTGGCGCGGGAATCATTGCCCGGC
+TCCTGGCGGCCGCTGTCGCCGGGCGCGGCGGGCAGATCTGAGGAGGAGCGCCGGTGGCCAGGGTGGTCGT
+GCATGTGATGCCCAAGGCGGAGATTCTTGACCCGCAGGGCCAGGCGATTGTCGGTGCGCTGGGGCGGCTT
+GGGCATCTCGGAATATCAGATGTGCGTCAGGGCAAGAGGTTTGAGCTGGAGGTCGACGATACGGTTGATG
+ACACCACGCTTGCCGAGATCGCAGAATCACTGTTGGCCAACACCGTGATCGAGGACTGGACGATCAGCCG
+GGACCCGCAGTGACGGCGCGCATCGGTGTCGTCACGTTTCCCGGCACGCTCGACGACGTCGACGCCGCGC
+GCGCGGCGCGGCAGGTGGGCGCCGAGGTGGTCAGCCTGTGGCATGCCGACGCCGACCTTAAGGGTGTCGA
+CGCCGTAGTGGTGCCCGGCGGATTTTCCTACGGTGACTACCTCCGGGCCGGAGCGATCGCCAGATTCGCT
+CCGGTGATGGACGAAGTGGTAGCTGCCGCGGACCGCGGCATGCCGGTGTTGGGGATTTGCAACGGCTTTC
+AGGTGCTGTGTGAGGCCGGGCTACTACCTGGTGCCCTGACCCGCAACGTGGGATTGCACTTCATCTGCCG
+GGATGTGTGGCTGCGGGTAGCGTCGACGTCGACGGCGTGGACATCGCGTTTCGAGCCTGACGCCGACCTG
+TTGGTTCCGCTGAAGTCCGGCGAGGGCCGTTACGTGGCGCCGGAGAAGGTGCTTGACGAACTAGAAGGCG
+AAGGCCGGGTGGTGTTCCGCTACCATGACAACGTCAACGGCTCGCTGCGCGACATCGCCGGCATCTGCTC
+AGCCAACGGCCGTGTCGTCGGCCTGATGCCGCACCCCGAACATGCGATTGAAGCGTTGACCGGGCCGTCC
+GACGACGGACTGGGTCTGTTCTATTCAGCGCTGGATGCCGTTCTGACGGGCTGAGGTCACCCGCTCACGC
+TCACCCGGCGTCTCGCAGCAACGGCGGCGTCGCGGTTGGAGGTAATCCGGCTGCCGTCAGCTGACCGAAG
+AGCTCCGTCGCGGCCGAGACGGCGTTGTCGACGAAGGTGGCGAAATCGTCGAACCGGATGCGGTCCCTGA
+TCAAGGACCGCTCTGCGGCCACGCCGATGCGGTGCGGATCAGAGGACCCGTGCACGATCGCGGTGACCTC
+GTGGTTCTGCAGGTTCCACGCGTTGACGATCTCCGCCAACCGGGTGTGGTCGGTGGCGGGGAAGAAGTAT
+GCGGGACTGACCCTGATCGTGAACACGTCGCGGTAGGCGGGAGAGATTTCTAGGTGGACGTGCAGCCGCA
+GGTGGGCGTTGGCGACGAAGAAGAACTCGGCGTCGTGGTGGCCACGGAAGTATCGCCGGCCGCGGGCGCG
+CAGGTAGCGCTCGATCAGGTTGGTGCTCAGCGGCTCGCCTATCGACTCAGTCATGAACTCATGATGCGGC
+CGGCGCCTTGGTGAATCCTTTGAGCTGGGAACCCGGTTGCGAAGAACAAGATGAGAATTCCCTGAGCGAC
+GCGGGGCAGCCCGGCCACTGTGAATGGCACGACGCGACACGCGGCGGAGGCGTCGTGAGATTCACAGTCG
+GTGGGTTGCGTCGGCCAATTCAACCGGGGGGCCGGTCCACAGTTCCTCGTCAGCGGCTACCAAGGCGTGT
+ACTTCGGTGGACTGCAACGCCTTCAGGACCGACTGAGCGATTCGTTCGTACCATTGCGCGACCGCGCTGG
+GATAGTCGGCGTAGCTGCCGTTTTCCCGCAGGATGGTTCCTTCCACCGTCGGGATCGGGGTAGCTCCGTC
+GAATTCTTGCCGGTAGGGCTTGCCGAGGCGGGCGGCGGTGGGTGCGTCGATGGTGGCGTCCAGCTTGACC
+CATCGCCGACCAAGATATGCCTCACCCAGCGAGTGCCACGGGAAGGGCCGGCCAGTTCGGCCTCCCCATA
+GGGCACGTACCTGCGGGGACAGAAACTCCTTATCGGGGGCGTCGATCGTCTGGAACGCGATACGGGCCGG
+GACACCGGCGGCTCGGCACAGGGCGACGAAGGAACTTGCCTTGCCCATGCAGAAGGCGACCCCGTGGCCG
+ATCACGTCGCTGGCGCGGTGATGTCCCTGCGCGAGGTAGCGAAAGGACGCGAGGACGTCGTATGGCACGT
+CGCGCACGTAGTAGTAGATCCGCCTGACCCGCTCGGTATCCGACACCGCGTCCCGGATGAGGGTTGCTGC
+CGTCGTACGAACGAGCGGATGGCCCGCGTCGAGGTACTCCGTGGGCGTCAGAAAGTGGTCCATGCCGGTT
+CCATTGTTGGCTAGCGTCATGGAATCGTGACCTCAGTTTTGACCCGCGGAATGATGTCACTGCCGATGAT
+GTGCAGATAATCGGACTTCACGACGTGTGGAATCGTGAAGAGAAAATGGCCGACACCGCGGTCCTGGTAT
+TCACGAATGCGCTCGACACACCTGTCGGGTGTCCCGACGATGAGCCCCGGCTCGGGGATGGACGCGAATT
+CTTCGCGGATCCGGACTTCTTCCTCGCCGGACTGGGTGGGTGCCAGCAGCAGCGTGACCGACAGTCGCAG
+CGTGTCGGGGTCACGCCCGGCCGCCTCCGACGCCTGGGTGAGAAATCCGCGGCGTTGGGTGACTTGCTGC
+GGCGACCACCAGCGCACGTTCAGGCCCTGGGCATGCTTAGCGGCGATGCGCTGGACCCGGTCGCCTTCCC
+CGCCGATCCACAACGGAGGATGTGGCCGTTGCACCGGCGGCGGATCGCAGGTGGCGCCGTCCAAGGTGTA
+AAACCGGCCGGCGTAGGTGGGGTTTGGCTCGGTCCACACGGCCTTGATGACCTGCAGCGACTCGGCAAGC
+GCGGAGACTCGGTCGCCAACCGGCGGGAACGGGATGCCGTAGGCTTGCGACTCGCGCCGAAACCAGCCGG
+CGCCCAATCCCAGATCGAGACGTCCCTGGGAAATGACGTCCAGCGTCGCAGCCATCTTGGCCAGCACGGA
+AGGATGACGGTAGGAATTGCACAGCACGCTGGTGCCCAACCGCAGCTTCGTGGTGTCGCGGGACAATGCC
+GCAAGTGCGGTCCAGCACTCGAGCAGGGGCAGCGACCTCGAAGGGGCGCACTGGCCCGCCCCGCCGGTTT
+CGGTGCCGGTCGCGGAGCCGGTGTCGGCGGCGATGCCGGCGACCTTCGCATACTCGCCGGGGCTTATCGT
+CAGGAAGTGGTCGCATAACCACACTGAATCGAATCCGTATTCTTCCGCCGTCTGCGAGACGACAACCATT
+TCGCGGTAACTGCCGACCGCCAGGCCATTAACCGTCGCAGCCAACATGAGTCCGAAGTGCGGGTCGTCTT
+TGGCGTTCATGCGAAATCTCGTTTCTCGATAATTCCGGCACCTGATCCGGGCAACGTTCGGGGTAACGTG
+ACGGAGAACTGGTACCGCTCGGGGCGATGGTGGAACACGACCACTTCAAGGGGCTTGCCGTCATTGGTGT
+AGCTGGTGCGGTCGACGACCAGTACCGGCGAACCCACCGCCAGACCCAACGCGTCGGCTACGTCGGGGGA
+GGCCCCGGCGGCATGGATTTCGTGGGTAGCCTGTGCAATGCGTACACCCAGTCGCCGCTCCCACATCGCA
+TATGTGGTTTCGGTGTCCGCGCTGCCCGATAGCAACGGCTCGACGGCTGGGCCCACGCCGGGCGGAAGAT
+AGGCCGTGACCAGGGCCAAGGGTTGATCGCCAGTGCGGATGCGCCGGCGAATACAGAGGACCTCAACCAA
+ACCCAGCGTCTCGGAAATCCGTTGCGGCGCCGGTCCGGTCTGGTGTGACAGCACGTCGACCTGCGGGGTA
+ACACCACAGCTCAACAACACCTCTGTGATGGTGCGCACGCCGCAACTGAGCTCCTGTTCCACCGGATCGG
+CGACGAAGGTACCCAAGCCTTGCCGGCGCACTAGCCATCCCTGACGTTGCAGCATGCCGACCGCCGCGCG
+CACGGTCACGCGGCTCAAACCGGAACGGTCGATCAATTCTCGTTCGCTGGGCAAGCGCCCGCCGCGCGGC
+AGCCGCTGCTGGATGATCTGGGCCTTTAGCGCCTCGGCAAGCTGGGTACTCGCCGGCACGCTGCCACGCG
+ATATCCGCAGATCGGCAGCGTCCAGGTCCAGCTTGACAGATGTCATAAGACGTATTAAAACGTCTTATAC
+TCACCACGTCAAGCGTGCGTGCGCGGTAGCAGCGGAAGAAGGTCAGCCATGACGTCACCCGTCGCGGTCA
+TCGCCCGGTTCATGCCACGGCCTGACGCTAGGTCGGCCCTGCGCGCTCTCTTGGACGCAATGATTACCCC
+GACACGGGCCGAGGACGGATGCCGTAGCTACGACCTCTACGAGAGCGCCGACGGCGGCGAGCTGGTGCTT
+TTCGAACGGTACCGCAGCCGCATCGCGCTCGACGAGCACCGCGGTTCGCCGCACTATCTGAACTACCGGG
+CACAGGTCGGTGAATTGCTGACCCGGCCCGTCGCGGTGACTGTGCTCGCGCCGCTCGACGAGGCTTCTGC
+TTAGAGCGGGTAGCACCCAGGCAGCTTGATCCACGCCCGGCACCGGCCGAGCGCTCGGGAACCGCCGCAG
+ACCACCGCAGTCCCCCCGTGGGTTCAGCGGCGCGGCGGCGGGTTGGCTATACCAGCAGGTAAAACGAATC
+TCGGTAGGATTCAAGAAGTCTCAGCCACAGTTCGCTGATGGTCGGGAAGCACGGAACGGCGTGCCACAAC
+CGATCGATTGGCACCTGGCCGGCGACGGCGACGGTGGCCGAATGCAACAGCTCGGCGGCGCCCGGGCCAA
+CCATGGTCACGCCCAGCAGATGGCCCCGATCGACGTCGACCACCATGCGCGCCCTGCCGGTGTATCCGTC
+GGCAAAGAGCTTGGCTCCCATAACGACATCGCCGATTTCGACATCGATCGCTTTGATCCGGTGACCAGCC
+TGTGCGGCCTGATCAGCTGTCAGGCCGACCGCTGCGGCTTCGGGGTCGGTAAAGAATGCCTGCGGCACCG
+CGTGATGGTCGGCGGTGGTCGCGTGCATGCCCCACGACGTGGTGTCTAGCGGTCGTCCGGCGGCACGGGC
+GCCGATCGCGGTGCCGGCGATCCGCGCCTGGTATTTGCCTTGGTGGGTCAGCAACGCGCGATGGTTGACG
+TCGCCGGCGGCATAGAGCCAGCCGTCGTCAACAGCCCGCACTCGGCAGGTGTCATCGACGTCCAGCCAGC
+TGCCCGGCGTCAGTCCTATTGTCTCCAAGCCGATGTCGTCGGTTCGCGGTGCTCGGCCGGTGGCGAAGAG
+TACCTCGTCGACCCGCAGCTCGGTACCGTCGTCCAGCTCGAGGACCACTGGGCCAGTGGGTTGGGGCGGC
+CCAGCGCGCGTACCGATACTCCCACGCGCACGTCAACGCCGGCGTCGGCCAGTCCGCGACCGATGAGTTC
+CCCCACAAACGGTTCCATTCGGGGCAGCAGGCCAGATCCCCGAGCCAGCAGGGTCACCGAGGCGCCCAGT
+CCCTGCCAGGCGGTCGCCATCTCCACACCGACGCCGCCGGCGCCGACGATCGCAAGCCGGTCGGGGACCG
+TACTGTTGTCGGTGGCTTGGCGATTGGTCCATGGCCGGGCTTCGGTGATGCCAGGAAGGTCGGGGAGTGC
+TGGCCGGCTTCCGGTGCAGATGACAACGGCATGCCGGGCGGTCAGCGCCACGCTTTCGCCGCTCGACTTG
+GTGACGACGACGCGGCGCGGACCGTCCAATCGCCCGTCACCGCGTATCAGCGTCGCGCCGATTCCACTCA
+CCCAGTCGGCCTGGCCGGTGTCGTCCCAGTGGGCCACATAGCGGTTGCGGCGGCCAAAGACGCCGGCTGT
+GTTGATCGAGCCGTCGACTGCTTCGCGCGCGCCGTCGACCCGTCGGGCGTCAGAGATCGCGATGACCGGA
+CGCAGCAAGGCTTTGCTGGGCACACAGGCCCAATAGGAGCATTCACCCCCGACGAGTTCGCGCTCCACCA
+CCGCGACACGCAGGCCCCCCGCGCGGGCACGATCGGCGACGTTCTGTCCAACGGGTCCCGCGCCGAGCAC
+GACGACGTCATACGTTTCACCCTCACGGCAGCCGGGTGTTGCCATTGGCGCCTGGTCCTGTTGGGCCGCG
+GTCATAATCAAAGATCCTTTCGTCGGACTCTGCCAGCGACGCTACGCGCGCCTAGCGCCGGTGAGCCGTG
+CCGGCCTATCGCCCACCAGACGCAAAAGCTCTCGACACGCCGTGCGAAAAGGGACCTTTATGTCTCAGTG
+TCGGTGTTGTGTGTGCCGCGAGGTGGGTGTGTCGGTGTGACAGACGCCGTGTCGCGGTGGTTTGTTCCGG
+ATCACCTGGTGTCTGGCTCACTTTGCGTCTGCCGTCCTCTTGGGGTTGGCGTTGAGCAGTATTGCCGGCA
+CTAGGTGAGAAGGACCGGCCGGCGTGACTTGATAGGAGCGTGGCTTTCGCCCCGACTGAGATGTGTCCGC
+CGACCGGCCCAACCTCAACACCCCCTCAAGTGAAGGAGGCAACCACCATGGTTGTTGTTGGAACCGATGC
+GCACAAGTACAGCCACACCTTTGTGGCCACCGACGAAGTGGGTCGCCAACTCGGTGAGAAGACCGTCAAG
+GCCACCACGGCCGGGCACGCCACAGCCATCATGTGGGCCCGTGAACAGTTCGGCCTCGAGCTGATCTGGG
+GCATCGAGGACTGCCGCAACATGTCGGCGCGTCTGGAGCGTGACCTACTGGCGGCCGGCCAGCAGGTGGT
+GCGGGTACCCACCAAGCTGATGGCCCAGACCCGCAAGTCGGCGCGCAGTCGGGGCAAGTCGGATCCGATC
+GATGCGCTGGCGGTGGCGCGGGCGGTGCTGCGTGAAACCGACCTACCCCTGGCCACCCACGACGAGACGT
+CGCGGGAGTTGAAGTTGTTGACTGACCGTCGAGATGTCCTTGTGGCCCAACGCACGTCGGCGATCAACCG
+GTTGCGCTGGCTCGTCCATGAACTCGATCCCGAGCGGGCACCGGCAGCACGCTCGCTCGATGCCGCCAAG
+CACCAGCAGGCCCTGCGGACCTGGCTGGACACCCAGCCAGGATTGGTCGCCGAACTCGCGCGCGCCGAGC
+TGACCGACATCATCCGGCTCACCGGCGAGATCAACACCCTGGCCCAGCGCATCAGCGCCCGAGTCCACCA
+GGTCGCCCCCGCACTGCTGGAAATCCCTGGCTGCGCGGAGCTGACTGCAGCCAAAATCGTCGGCGAAGCC
+GCCGGAGTGACCCGGTTCAAAAGCGAAGCCGCCTTCGCCTGCCATGCCGCAGTGGCTCCCATCCCGGTGT
+GGTCGGGCAACACCGCCGGCCAGATGCGGCTCAGCCGCTCGGGCAACCGCCAGCTCAACGCCGCCCTACA
+CCGCATCGCACTGACCCAAATCCGGATGACCGACAGCCGGGGCCAGGCCTACTACCAAAGGCTGCAAGAC
+GCCGGGAAAACCAAACGCGCAGCACTACGCTGCCTCAAACGCCGCCTAGCCCGCACCGTCTTCCAGGCCC
+TGCGCACCGTCCATCAGCCCAGCTCCGAACACACCCAACCCGCGGCCGCTTGCCATAGGAGCTATTGCTC
+GCGCTCGTGCCTTAGTGGCTGAGCGCGACCGACGCCTCGGCGGTGTAGCAAAGGAACGTCAGCGTCTCCT
+GCAGGTAGAGGCGCACGGTGTCCGTGTCGTGGCTGGCGTACCCGATTGCAACGTCGGTGCCCAGCTGTAG
+GTCGAAGTCGCCGCCTCGAGTGGTCAGCACGAACGCGCCGTCGATGGCCGGGGCCCAAATGATGTCCCCG
+TCCACCAGCCGGTTCAGATGCTCACGGATGGGATAGCCGTGATCGGAAGTCTCGCTAACCTTGGTGTAGA
+CGTCAGCAGAGAGCAACACCGAATACGGTCCGTCCACACCGGCCAACCGCAGTTCGGACAATGCCTGGGA
+GATGACATCAGGGATTTCACGGGGATCCTCGGGCAACGTCAGCGCCGGGTTCGAACTCGCGCTGCGGATC
+CCTTCGATTGATGCGGCGCTGTAGCCTTCGAATATTGTGCGGTCCTCGACGAAGGCCAGCTTCTTGGCCG
+CCTCCTTTACCGGTTCCCAATCGGAGTCCTTAGAGCCACGTTCCACGTCGTCGATCTCGTTGCGCGACAG
+GGTAAACGGAACCCGTAGCCGGACAAGGGGTTTGCTGGCCCGCAGGTGGGCGATCACGCCGTTGGTTGGT
+GCCTTAACATCGATCAGCCGGCCGGTGCTGACCGCCGCGGTGACGGGCCCCCCGGGATCACTGACATCGA
+CCACCCGGCGCCCGGCGATGTGTCGCTTGAACGTCCGCGCCGCCTCCAATTCGATTTCCGCCCAAGCGGC
+TTCGGTGACCGGTGCCAAATCGCGGTAGAGATTGTTCATCGGGGGCTTCCTTTCAAGCTGCCGATCGATA
+GCGACCCGGCTGCCAGAGTTGGCGTCGCCGCCTGCGGTAGGGGCGGTGGATGGTCGAGAAAGTCGATGGT
+GGGTGAGAAGAACAGTCCGCCGGTCACCGCGGTGGAAAAGTCAAGCACTCGATCGGTGTTGCCTGCCGGA
+TCGCCGAGAAACATGTTGCGCAGCATCTGCTCGGTCACCGTTGGCGTGCGCGAATATCCGATGAAGTAAG
+TGCCGTACTCGCCCTTGCCGACTTCGCCGAACGGCATGTTGTGTCGCACGATCTTGCGCTCGGTGCCGTC
+GTCGTCGGTGATGACGTTGAGCGCTACGTGTGAATTGGCTGGCTTCGCGTTGTCGTCGAGTTCGATGTCG
+TCGAGCTTGGTCCGGCCGATCACACGCTCCTGCTCGGTGACCGAGAGGGATTCCCACGAGGCCATATCGT
+GCACATACTTCTGCACGTGCACATAACACGAGCCGGCGAAATTTCGATCCTCGTCACCGATCGTGGTGGC
+CTTGATGGCGATTGGGCCACTTGGGTTTTCGGTGCCATCGACAAAGCCCAGCAGATCACGGTTGTCGAAA
+AACCGGAAGCCGTGCACTTCGTCGACAACGGTCACCGCATCGCCCATCGACTTGAGAATGCGGCCAGCCA
+ACTCGAAGCACACGTCCATGGTCTCGGCCCGGATGTGGAACAACAGATCGCCGGGAGTTGCCGGGGCGGT
+ATGCCGTGGTCCGGTCAGCTCGACGAACGGATGCAGCTCGGTGGGTCGAGGTCCGGCGAACAAGCGGTCC
+CAGGCGTCGGACCCGATCGAGACGACCACGGACAAGTGTTTGGTCGGGTCACGGAAGCCGATCGCACGCA
+CCAGGCCGGAGATCTTCGACAGTGCGTCGTGCACCGTCGCCTCGCCGTCGGCGCCGATGGTGGCGACCAG
+GAAGATCGCGGCCGGAGTCAACGGCGCCAGAATCGGCTGCGGAGAGACAGCAGGCACAGCCACGACCCTA
+ACGTCCCTGCAATACCGGTGATGCTAGACATGGCTACATGGCGGCCACGGCACACGGCCTGTGCGAATTC
+ATCGACGCGTCCCCGTCGCCGTTTCACGTCTGCGCGACGGTGGCGGGACGGCTGCTCGGCGCCGGATACC
+GCGAGCTGCGCGAAGCGGATCGCTGGCCGGACAAACCGGGCCGGTACTTCACCGTCCGGGCTGGCTCGCT
+GGTGGCGTGGAACGCCGAGCAGAGCGGGCACACGCAGGTCCCATTCCGGATCGTCGGCGCGCACACCGAC
+AGCCCCAATCTGCGGGTCAAGCAGCATCCGGACAGGCTCGTCGCCGGCTGGCACGTGGTGGCGCTGCAAC
+CGTATGGGGGAGTTTGGCTGCACTCCTGGCTGGATCGCGATCTGGGCATCAGCGGGCGGCTATCGGTGCG
+TGACGGTACCGGGGTCAGCCACCGGCTGGTCCGGATCGACGACCCGATCCTGCGGGTGCCGCAGCTGGCG
+ATTCACCTGGCCGAGGACCGCAAGTCGCTCACGCTCGATCCGCAACGACACATCAACGCTGTATGGGGCG
+TGGGAGAGCGGGTGGAGTCCTTTGTGGGGTACGTCGCTCAGCGCGCCGGGGTGGCGGCGGCCGACGTGCT
+GGCCGCGGACCTGATGACCCATGACTTGACCCCGTCGGCGCTGATCGGCGCTTCGGTCAACGGCACTGCC
+AGCCTGCTCAGCGCGCCGCGGCTGGACAACCAGGCCAGTTGCTATGCCGGGATGGAGGCACTGCTGGCCG
+TGGACGTGGACTCGGCGTCGAGCGGATTCGTGCCCGTGCTGGCGATTTTCGACCACGAGGAGGTGGGATC
+GGCCTCGGGCCACGGCGCACAGTCCGATCTGCTATCCAGCGTGCTCGAACGCATCGTGCTCGCGGCGGGC
+GGCACCCGGGAGGACTTCCTGCGCCGACTGACCACCTCGATGCTCGCCTCGGCCGACATGGCGCATGCGA
+CGCACCCCAACTACCCGGACCGTCACGAGCCGAGCCACCCGATCGAAGTCAACGCGGGTCCGGTGCTCAA
+GGTGCACCCAAATCTGCGCTACGCCACCGACGGACGCACCGCGGCGGCGTTCGCACTGGCCTGCCAGCGC
+GCGGGAGTGCCTATGCAGCGTTACGAACATCGCGCCGATCTGCCGTGCGGGTCGACGATCGGGCCGTTGG
+CCGCGGCGCGCACCGGAATCCCCACGGTCGACGTCGGCGCCGCCCAGCTGGCGATGCACTCCGCGCGAGA
+GTTGATGGGCGCTCACGACGTAGCCGCCTATTCGGCGGCACTGCAAGCGTTTCTTTCCGCCGAGCTATCC
+GAGGCATAGGGTCGGGCGGTATGGCACTCAAGGTAGAGATGGTCACTTTCGACTGCAGCGACCCTGCGAA
+GCTTGCCGGCTGGTGGGCCGAGCAGTTCGATGGCACGACGCGTGAACTGCTGCCCGGCGAATTCGTCGTG
+GTCGCCCGGACCGATGGACCGCGGTTGGGATTCCAGAAGGTGCCCGATCCCGCCCCTGGGAAAAACCGCG
+TGCACCTCGACTTCACGACCAAGGACCTGGATGCCGAGGTGTTGCGCCTGGTCGCCGCCGGAGCCAGCGA
+GGTCGGGCGGCATCAGGTCGGCGAGAGCTTTCGCTGGGTGGTGCTGGCTGACCCCGAAGGCAACGCTTTT
+TGCGTGGCGGGTCAATAACGAGGCGGTTCCAAGGGGCCGAAAAGCGGCCGGCAGCGGTCGAACCCGTCCA
+CCCGAACCTCAACAGTGCGATGGCGCTGCCAATCGTCGCGGGTCAGCCGGAATAACAGCGCCTCTGCCAT
+AGCCCCTTCGCGTGCCACGCGATCTAGGCCGTTGTCGCGGTATCCGTTACGGCGGGATACCGCGATCGAG
+GCCGGGTTATCCACGAACGACCTCGACGTCGCGACCTGCGCCTCCAGCTCGGCAAACGCGAAATACAGTA
+CAGCCGCCCGCATCTCGGTGCCGTAGCCGTGACCTTGGTAACGCAACCCGAGCCATGATCCAGAATCCAC
+CTGACGGGTGATTGGGAAATCCTTGGAGCTCAGGGCCTGTACGCCTACGGCCCTACCGTCGACGAGGACG
+GCCAGCGGCAGCGACCAGTCATCCCGCTTGAACCCGGCCAGTTGCTGCCATAGGTGCGACAGCGTGTTGA
+ACGGCAGGTCCTCGCGCGATGCTCGCGTCCACGGAACCGAAAACGGCATTCGGTCGGGGTCGTGGACTCC
+CTCCAGGATGGTGTCGATCAGCTGGTCGCACAACTCCTCGGTGGGCAGTTGCAACTGGAGCCGCGGCGTG
+GTGATGCGCAGGTCGAACAACGGCCAGTGACGAGACATGGTTCCATTTTGCGCACCACCATCCTGAGCGC
+CCGCCCCGATGTCAGCCCGACGGCTGATGCCACCGGGGTTCTTGCCGCGGGCATACCTATCCGTCGGCTT
+GTCCGTGTCAACGCGGCCGCAGCGCGATGGGGCCTAGCTAGACTGCCTCCGTGATGTCTCCGCTCGCCCG
+GACCCCGCGCAAAACGTCGGTGCTGGACACCGTCGAACACGCCGCGACCACACCCGACCAACCACAACCG
+TATGGTGAGCTGGGCCTCAAAGACGACGAGTACCGGCGGATTCGCCAGATCCTGGGCCGCCGGCCCACCG
+ACACCGAGCTGGCCATGTACTCGGTGATGTGGAGCGAACACTGTTCGTACAAGTCCTCCAAGGTGCACCT
+GCGCTACTTCGGTGAGACCACCTCCGACGAGATGCGCGCGGCCATGCTGGCCGGCATCGGCGAGAACGCC
+GGCGTCGTCGACATCGGCGACGGCTGGGCGGTCACCTTCAAGGTGGAGTCACACAACCACCCGTCCTACG
+TCGAGCCCTACCAGGGCGCGGCCACCGGGGTGGGCGGCATCGTCCGCGACATCATGGCCATGGGCGCCCG
+ACCGGTCGCCGTGATGGACCAGCTTCGGTTCGGCGCCGCCGACGCCCCCGATACCCGCCGCGTGCTCGAC
+GGCGTGGTCCGCGGCATCGGCGGATACGGCAACTCCCTGGGCCTGCCCAACATTGGCGGAGAGACCGTCT
+TCGACCCGTGCTACGCCGGCAACCCCTTAGTGAACGCGTTGTGTGTCGGCGTATTACGGCAGGAGGACCT
+GCATTTGGCGTTCGCCTCCGGCGCCGGCAACAAGATCATCCTGTTTGGCGCGCGCACCGGGCTCGACGGT
+ATCGGCGGGGTGTCGGTGCTGGCGTCGGACACCTTCGATGCCGAGGGATCCCGCAAGAAGCTGCCCTCGG
+TGCAGGTCGGCGACCCGTTCATGGAGAAGGTGCTCATCGAATGCTGTCTCGAGCTCTACGCGGGCGGCCT
+GGTGATCGGCATCCAAGACCTGGGCGGAGCCGGATTATCTTGTGCCACATCGGAGTTAGCATCCGCCGGT
+GATGGCGGAATGACGATCCAGCTGGACAGCGTCCCGCTGCGGGCCAAGGAGATGACGCCCGCCGAGGTGC
+TCTGCAGCGAATCGCAGGAGCGGATGTGCGCGGTGGTCTCCCCGAAGAACGTCGACGCATTCCTGGCGGT
+GTGCCGCAAGTGGGAGGTGCTGGCGACGGTGATCGGCGAGGTCACCGACGGCGACCGGCTGCAGATCACC
+TGGCACGGCGAGACGGTGGTCGACGTGCCGCCGCGCACCGTAGCTCACGAAGGTCCGGTATATCAGCGCC
+CGGTCGCCCGCCCCGATACGCAGGACGCGCTGAACGCCGACCGCTCGGCCAAGCTGTCACGGCCGGTCAC
+CGGCGACGAGCTGCGCGCGACTTTGCTTGCGTTACTTGGCAGCCCGCACCTGTGCAGCCGCGCGTTCATC
+ACCGAGCAGTACGACCGCTATGTGCGCGGCAACACGGTGCTCGCCGAGCACGCCGACGGCGGCATGCTGC
+GCATCGACGAGTCGACCGGCCGGGGCATCGCGGTATCGACCGACGCGTCGGGACGCTACACGCTGCTGGA
+TCCCTACGCTGGCGCGCAACTCGCGTTGGCCGAGGCGTACCGCAACGTCGCCGTCACCGGCGCCACCCCG
+GTCGCGGTGACCAACTGCCTGAACTTCGGTTCCCCCGAGGACCCCGGCGTGATGTGGCAGTTCACGCAGG
+CGGTCCGCGGTCTGGCCGATGGCTGTGCGGACCTCGGGATTCCGGTGACCGGTGGCAACGTGAGTTTCTA
+CAACCAAACCGGTTCGGCGGCAATCCTGCCCACGCCGGTGGTCGGGGTGCTCGGCGTCATCGACGATGTG
+CGTCGGCGCATCCCTACCGGCCTGGGCGCCGAGCCCGGGGAAACGTTGATGCTGTTGGGCGACACCCGCG
+ACGAGTTCGACGGTTCCGTGTGGGCGCAGGTGACCGCAGACCACCTGGGTGGATTGCCGCCGGTAGTCGA
+TCTGGCGCGGGAGAAGCTGCTGGCCGCGGTGCTGAGCTCGGCGTCGCGGGACGGGCTAGTGTCCGCGGCG
+CACGATCTGTCCGAGGGTGGGCTGGCCCAAGCCATCGTGGAATCGGCGTTAGCGGGTGAAACCGGTTGCC
+GCATAGTGCTTCCCGAAGGGGCTGACCCGTTTGTGCTGCTGTTCTCCGAGTCGGCGGGTCGGGTGCTGGT
+CGCGGTGCCACGCACCGAGGAGAGCCGGTTTCGCGGGATGTGTGAGGCGCGGGGACTTCCCGCGGTCCGC
+ATCGGCGTCGTCGATCAAGGTTCGGACGCGGTTGAGGTGCAGGGCTTGTTCGCGGTGTCGTTGGCCGAAC
+TGCGTGCGACATCCGAGGCGGTGTTGCCGCGATACTTCGGATGAGTCGGCTTCGCGCCCTGTCTTTGGCC
+GCCGGCCTGGTCGGCTGGAGTCTGGTCAGCCCGCGGCTGCCGGCGCCGTGGCGGATTCCGTTGCAGGCGG
+GGCTGGGGAGCGTGTTGGTGCTGGTTACTCGTGCGACGATGGGCCTTTGGCCGCCGCGGCTGTGGGCCGG
+GCTGCGGCTGGGCTGGGCCGCGGGGGCGGCGGCGGCGACCGCGATCGCGGCAACGACGCCGGTGCCGATG
+GTGCGGTTGTCGATGTCGGCTCGTGAGTTGCCGGCGTCGGTGCCGGTCTGGCTGGTATGGCACATACCTG
+GCGGCACGGTGTGGGCCGAGGAGGCCGCGTTTCGCGGGGCGCTGGCCACTATCGGTGCCCGGGCCTTCGG
+TCGGTCGGGTGGACGGATACTGCAGGCCGGCGCCTTTGGTTTGTCTCACATCGCCGACGCGCGCGCGACG
+GGCGAGCCGCTGGTGCTCACGGTGTTGGCCACCGGTATCGCCGGCTGGATGTTCGGTTGGCTGGCCGACC
+GGTCCGGCAGTCTGGCAGCACCGCTGCTGACGCACTTGGCCATCAACGAGGCCGGTGCGGTCGCCGCGGT
+GCTGGTCCAGCGGCGTTCTGGTATCTCGACTCGACTGTGATCGCGGGGTCGGGCCCCTGGTGATCGTGGA
+ACGGCTCACAACAGCGCGGACCTGGTCGGCGGCGCCGCTATACTGATTGGTCACTGTCTAACCAATCAAT
+GGAGAGGGTTGGCACCTCAGGTGCATAGACTTAGGGCCGCGGAGCATCCGCGGCCGGATTACGTTCTCTT
+ACATATCAGCGACACTCATCTCATCGGGGGGGATCGTCGGCTCTACGGGGCGGTGGACGCCGACGACCGG
+CTGGGCGAACTGCTCGAACAGTTGAACCAATCCGGCCTTCGTCCCGATGCGATCGTCTTCACCGGCGATT
+TGGCCGATAAGGGCGAACCGGCGGCATACCGCAAGCTCCGAGGCCTGGTCGAGCCGTTCGCGGCGCAGTT
+GGGCGCCGAGCTCGTCTGGGTGATGGGTAACCACGACGACCGGGCCGAACTACGCAAATTCTTGCTGGAC
+GAAGCGCCATCGATGGCGCCGCTAGACCGGGTGTGCATGATCGACGGTCTGCGCATCATCGTGTTGGATA
+CCTCGGTACCCGGACATCATCACGGCGAAATCCGCGCGTCCCAATTGGGTTGGCTTGCTGAAGAGTTGGC
+CACGCCAGCGCCGGACGGCACCATTTTGGCGTTGCATCATCCGCCGATTCCGAGTGTTTTGGATATGGCC
+GTCACGGTGGAGCTGCGCGACCAGGCTGCGCTTGGGCGAGTGCTGCGGGGCACTGACGTTCGCGCCATTT
+TGGCCGGGCACCTGCACTACTCGACGAATGCCACCTTCGTCGGGATCCCAGTGTCGGTTGCCTCGGCGAC
+TTGCTACACCCAGGACCTGACCGTCGCTGCTGGAGGAACGCGTGGCAGAGACGGCGCCCAAGGTTGCAAC
+CTGGTGCACGTCTATCCGGACACCGTCGTGCATTCGGTGATTCCGCTGGGCGGCGGAGAAACGGTCGGCA
+CCTTTGTCTCACCCGGGCAGGCGCGACGCAAAATCGCCGAGAGCGGCATTTTCATCGAACCGTCGCGTCG
+CGATTCGCTATTCAAGCACCCTCCGATGGTGCTGACGTCCTCGGCACCGCGAAGTCCCGTCGACTGACGT
+CCGCGGCGATCTTCTCCCAGGGAGCCGGTATCGGGAAATAGCGCTCCAGGAAACTGACGACTCGTTCTGC
+GCGCTGCGCTGCGGGGACTTCAGGAAAGCTACCGTCGTTGAGGCAGAAGAAATCGTATCCGCGGTGCTTC
+CGCAACTTAGGAAGTAGCCGAAGACCCGCATAGCTGGTGGTGTCGACATAGAGGACTTTAGCCTTTTCCT
+GCGGGACGGCGCGTCCGGTCATCAGCGCGTAATAGTGGTAGAACGAGTTGGTCACCGAGATGTCGGTGTC
+GGAGCGGAACGGGCTGGCCGCGGTGCGGGCGAATTCCTCCGGGAATTCCCGCTCCATCTCGATCAGCACA
+CTCTTGCGCAACGGTACCGCGGTGTGCTCGAGATGACGGGTAATCACCTGCCCGAACCGGTCGAAGAGCA
+GCTGGCGGTTCACCCGGGCCGCGTTTTCAAAGCCACTACGCGCTGGGTTGTTGGCGCCGAGCCCGATCCG
+GGTCTTGGCTTCGATGAACCTGGTGACTCCACCGGGAGAGAAGAACATACTGGCCTTGAGCGGCCGGCCG
+AAGAACATGTCGTCGTTGGAGTACAAGAAGTGCTCGCTGAGCCCCGGGATGTGGTGCAGCTGGCTCTCCA
+CCGCATGCGAGTTATAGGTCGGCAACGCGGAACGGTCGGAAAAGTGGTCCTCGGCGCGAACGATGGTGAT
+TTTAGGATGTTCGGCCAACCATGGCGGCGGGGTTGAATCCGTCGCGATGAAGATGCGACGTATCCACGGA
+GCAAACATGTTCACCGACCGCAGCGCGTATTTCAACTCGTCGATTTGGCGGATCCGCGCTTCGGCGTCGT
+CGCCCTCGCCCACCACGTACTGCGACATTTGAGCCATGCGGCGCGCCCGGAACTCGGGGTCACTACCGTC
+CACCCAGGAGAACACCATGTCTATGTCGAACACGACGTCGCTGGCGTGCGGGGCAAACATCCCGTCAAGG
+GTCGGCCATTTGTACCCGTAGAGTTTGACATTTGTCGGCGTTATTTCGTTTCGGGGCAGCACTTTGCGGC
+TAAGCGAGTTTTCGACAGGGCAGCGGATCACCGTCTCCTCGTATACCCAGAATTGCAGTTCCACACCGAA
+CGCCGGGCCGTAGCGAAATCCGCCCGGCGCGATCCGGCGTCGATACAACCGCACGACACGCGGGTCAACC
+AGCTGCGACAGCCCGTCGGTGGCGACCAAAACAGGAGAAAGGCCAGGCTCATCAATAGTTTTGGCGTACA
+TCGGTTCGGTTGCACATGCGGCCGCAAGAGCGCGCTCGAGGCCGGCACGTAGTTCGATGTTGATGGCAAG
+CACCGGCCGGTTCTTGTGGTTTCGGATCAGTAGATAGGGAATATCAGCCCTGTTTAACACCTTTCGCAGA
+AAGACCAGATCTTCGATCTGGGCCTCCTGGGGGGTCAGGCCGGATTCCAGGCGGGCGATCTTGCCGCGCC
+GGGTAACGATGATGGGATTCACGGTGCGCTGAGCGGGCCGACCGCCGTCGCGCGAAGAGATTTTGGGCAT
+CGGGTCACCGCCTTGGGAACTCAGGGAGAAATGATTAGGTCACCGAAAGAATCTCACAGATCGCGGGTCG
+GCGCAGGTTGACCGCGCTGGCGCGGGGTCCATACAGAATTGTGCGGTCAAGGCGATAACTCTTGCAAGAC
+ACCAGATCTAGCGATCTAAGAACATCGGCCGGAAACCTGGTTGTTGCGGCCGCGCCATGTCAAGTTCAGT
+TCGGAACTGGGCTCGCATACAACCCGATCCCAGTCTCAGCAGCGGCGCTTGGCCGCCATCTGGATGGATC
+CACCGATTCTTGAGACCCTAAGGTATGAGCGCTCGTGATCGAGTCGATCCGGCGAAGACTCGGCAGGTCG
+TGTTGGCCCTCGCGGACTGGTTGCGCGACGAAACGTTGCCAGCACCCGACACCGACGTGTTGGCGGCGGC
+GGTTCGGCTTACGGCGCGCACGCTCGCTGCGCTGGCCCCTGGCGCCAGCGTCGAAGTCCGGATCCCACCG
+TTTGCTGCGGTGCAGTGCATTTCTGGGCCCCGGCACACTCGCGGCACACCCCCCAACGTCGTGCAGACCG
+ACCCACGGACCTGGCTCCTGGTGGCTACCGGGCTGTCGGGGGTGGCGCAGGCCCGGGGCAGTGGCGCGCT
+GCAGCTCTCCGGCTCGCGGGCCGGTGAGATCGAGGCCTGGTTGCCACTGGTGGATCTCGGCTGATTCCGG
+CGTGCTGAGCTGCGGCTATGGTGTGTGAGGGTGGCGCCGGGGTGCCCGACACGTAAGCCGAATTCGGCGG
+TGCAGACGTCGTGGCCGTAGACTCGGATTACGTCACCGACCGCGCCGCAGGGAGCCGCCAAACCGTGACC
+GGCCAGCAACCCGAGCAAGACCTGAACTCGCCCCGGGAAGAGTGCGGTGTCTTCGGGGTCTGGGCCCCGG
+GTGAAGACGTCGCCAAACTCACCTACTACGGCCTGTACGCGTTGCAGCATCGCGGCCAGGAAGCCGCCGG
+GATCGCCGTCGCCGACGGCTCCCAGGTGCTGGTCTTCAAAGACCTCGGCCTGGTCAGCCAGGTGTTCGAC
+GAGCAGACGTTGGCGGCCATGCAGGGCCATGTCGCCATCGGGCACTGTCGTTACTCCACCACCGGGGACA
+CGACGTGGGAGAACGCCCAGCCCGTGTTCCGCAACACCGCCGCTGGCACCGGTGTTGCGTTGGGCCACAA
+CGGAAATCTGGTCAATGCCGCTGCCCTTGCCGCCCGCGCCCGCGACGCGGGGTTGATCGCCACCCGCTGC
+CCAGCCCCGGCGACGACGGACTCCGACATTCTGGGGGCGCTGCTGGCCCACGGTGCTGCCGATTCCACCC
+TCGAACAGGCGGCGCTGGACCTGCTGCCCACAGTGCGGGGAGCGTTCTGTCTGACGTTCATGGACGAAAA
+CACGCTTTATGCGTGCCGCGACCCGTACGGGGTGCGCCCGCTATCGCTCGGGCGTTTGGACCGTGGCTGG
+GTGGTGGCCTCCGAAACGGCCGCACTCGACATCGTCGGCGCCTCGTTCGTCCGTGATATCGAACCGGGCG
+AATTGCTGGCTATCGACGCCGACGGGGTGCGGTCCACCCGCTTTGCCAACCCCACGCCCAAGGGCTGCGT
+ATTCGAATACGTCTACCTGGCGCGGCCGGACAGTACGATCGCCGGCCGGTCGGTACACGCCGCGCGGGTG
+GAGATCGGTCGCCGACTGGCTCGGGAATGCCCGGTCGAGGCCGACTTGGTGATTGGTGTGCCGGAATCCG
+GCACACCCGCCGCGGTCGGCTACGCGCAGGAGTCCGGCGTTCCATATGGGCAGGGTCTGATGAAGAACGC
+CTATGTCGGGCGCACCTTCATCCAGCCGTCACAGACCATCCGTCAGCTCGGCATCCGGCTGAAGCTCAAC
+CCGCTCAAAGAGGTGATCCGCGGCAAGCGGCTCATCGTCGTCGACGACTCGATCGTGCGGGGCAACACCC
+AGCGTGCGCTGGTACGCATGCTGCGCGAGGCCGGTGCGGTCGAATTGCATGTGCGCATCGCCTCGCCACC
+GGTGAAGTGGCCGTGCTTCTACGGTATCGACTTCCCCTCGCCGGCCGAGTTGATCGCCAACGCCGTGGAA
+AACGAGGACGAGATGCTGGAGGCGGTACGGCATGCCATCGGGGCCGACACGCTGGGATACATCTCGCTGC
+GGGGCATGGTGGCGGCGTCCGAGCAGCCCACGTCGCGGCTGTGCACCGCCTGCTTCGACGGCAAGTATCC
+AATAGAGCTGCCCCGCGAGACCGCGCTAGGCAAAAATGTCATCGAGCACATGCTCGCCAATGCGGCCCGC
+GGAGCCGCGCTGGGCGAACTCGCCGCCGACGACGAAGTCCCCGTTGGGCGCTGACAAAACGCACGCGCGG
+TAGCCTTTATCGCGATGACGGATCTCGCAAAAGGCCCCGGAAAAGACCCGGGTAGTCGGGGTATCACCTA
+CGCGTCGGCCGGGGTCGACATCGAAGCCGGTGACCGCGCCATCGACCTGTTCAAGCCGCTCGCTTCGAAG
+GCCACCAGACCCGAAGTGCGCGGCGGGCTGGGGGGATTCGCCGGACTGTTCACTCTCCGCGGCGACTACC
+GCGAACCGGTGCTGGCGGCCTCCAGCGACGGCGTCGGCACCAAACTCGCGATCGCTCAGGCGATGGATAA
+GCACGACACGGTGGGCCTGGACCTGGTGGCGATGGTGGTCGATGACTTGGTGGTTTGCGGCGCCGAGCCG
+CTGTTCCTGTTGGATTACATCGCCGTCGGTCGGATCGTGCCGGAGCGACTCAGCGCGATCGTCGCCGGTA
+TCGCCGATGGGTGCATGCGTGCCGGCTGTGCGCTGCTTGGCGGCGAGACCGCAGAACATCCGGGCCTGAT
+CGAGCCCGATCACTACGATATCTCTGCCACCGGCGTCGGCGTCGTCGAGGCGGACAATGTGCTGGGTCCC
+GACCGGGTCAAACCCGGCGACGTCATCATCGCGATGGGCTCGTCGGGTCTGCATTCCAATGGGTACTCGC
+TGGTCCGCAAGGTGTTGCTGGAGATCGACCGGATGAATCTGGCCGGTCATGTGGAGGAGTTCGGTCGCAC
+CTTGGGCGAAGAGTTATTGGAGCCGACTCGCATCTACGCCAAAGACTGTTTGGCCTTGGCCGCCGAAACC
+CGTGTCCGGACGTTTTGCCACGTCACCGGCGGCGGGCTCGCCGGCAACCTGCAACGGGTCATCCCGCATG
+GCCTCATCGCCGAGGTCGACCGCGGCACCTGGACACCCGCGCCGGTATTCACCATGATTGCCCAGCGCGG
+CCGGGTCAGGCGCACAGAGATGGAGAAGACGTTCAACATGGGTGTCGGCATGATCGCCGTCGTTGCCCCC
+GAAGACACGACGCGCGCCCTGGCCGTCCTGACCGCGCGGCACCTGGACTGCTGGGTATTGGGAACCGTCT
+GCAAAGGCGGAAAACAAGGCCCGCGGGCAAAACTGGTTGGGCAGCACCCGAGATTCTAAGAACCAGACCT
+AACCGGGTCTAATGAGGTCAACGCCACGCCGATGGGAACCGAATCGGCACCGTGCGGGGGGCAGCTCCGT
+GGTGCTAGCGCCGCCAGTCGTCCTCATCGTTCCACGAGTCGTCGTCCGACGGGCCGTCGCCGTCCAGTCG
+GTCGGTACCGGTACCTGACAGCTCACGCTGAAGCCGCTGGAAGTCGGTCTGCGGGGAGCTGTATTTCAAT
+TCTCGAGCAACCTTGGTCTGCTTTGCCTTAGCCCGGCCGCGCCCCATGGGGGAACCCCCTCGCGAAATAA
+CGGAGCGGCCTAACGAGTAGGCGGCTCCGATCTCTGGTGTCGTTTATTGTCCTGCCGACAGTTTACCGTG
+CCGCCCGGTCGGGCGCGGGGCGGCCTGCCCGCCGTTACGGAGGGCACGGGTAATCACCGAATACCGCCGC
+GCAGCCGCTCGACGGCCCGCCGTCCGGCGCCCACATCGTCGGCGGGCGGCAGCGAGTCGACGTCGATCAC
+CGCGGCAACCTCGGCTTCCGGACCGGTTACCAGGGCGGTGTCGCCCGGCAGACCCCGTTTGAGCAGGGCC
+AGTGCCACCGGCCCTAGCTCTACGTGCTCGACCACCGTTCCCAGTCGTCCCACCGTGCGACCGCCGGCCA
+GCACCGCATCGCCCGTCGACGGCCGCTGCACTGACTCGTCCAGATGCAACAACACCAGCATCCGGGGTGG
+TCTACCCAGGTTGTGCACCCGTGCGACGGTCTCTTGCCCTCGGTAACAGCCCTTGTTCAGGTGGACGGCT
+CCGGCGCCGGGGCCACCGATCCAACCCACTTCGTGAGGGATGGTGCGTTCATCGGTGTCAACGCCCAGCC
+GCGGGCGCCTAGCCGGCACCCGGTGAGCCACTCGATGGGCTTCATAGGCCCAGATGCCGGCCGGGCGCAC
+ACCCGCCTGAGTCAGGCGACGCTGCCAGTCGGCACGATCGCCGCGCTTCACCACCACGTCCAGTTCGATT
+TGGCCCGCTAGGCCGTCGGGCATCCGGCGGACAATCCCGCCGCCGGCAAGCGGCACGGCCAGCCACTCAG
+CGGGCAAGACATCTAGACCCAGCGCGTCGAGCACTCGTTCCTCAGCCAGCCGCGGCCCCAATAGCGACAA
+CACCGCCATATCAGCGGCACGAGGAGTGACCATCGACCAAAAAACCATCTTGCGCAAATAGGCCAGCAGC
+GGTTCACCCCGCCACGGCTCGGTATCGAGATAGGTCGTGCCACCCAGCTCGGTCTGTATCCAGTGATCCT
+CAACTCGGCCTTGTCCGTCCAGGCTGAGATTTTGGGTGCTGGCGCCCTCAGGCAGGTCGCTGACGTGTTG
+TGTGGAGATGCTGTGCAGCCAGGTTTGCCGATCGCCACCGTCGAGGGTGAGCACGGCGCGGTGCGAGCGA
+TCCACCAGCACGGCATCGGCTTGCCCCGCGCGTTGCTCGCCCAGCGGGTCGCCGTAATGCCAGATCGCAC
+CCGCGTCGGGTCCGGGGTCTGGGGCAGGGACTGCGGCCACACAACAACTCTACGAAAAGCCGCGCTCGGC
+CTCGTTGACCAGCGTGCAGCTAGGCTGCAGGGACATGTTGAGGCAGACGGGCGTGGTGGTCACGCTTGAC
+GGTGAGATCCTGCAGCCGGGTATGCCGCTGCTGCACGCCGATGATCTTGCCGCTGTGCGGGGGGATGGCG
+TTTTCGAGACACTGCTGGTGCGCGACGGCCGAGCCTGTCTGGTTGAAGCGCACCTGCAGCGGCTGACCCA
+ATCAGCCAGGTTGATGGACCTTCCCGAACCGGATCTCCCCAGGTGGCGCCGCGCGGTCGAGGTGGCAACG
+CAGCGGTGGGTGGCTAGCACCGCTGACGAGGGCGCGCTGCGCTTGATCTACAGTCGCGGTCGGGAGGGCG
+GCTCGGCGCCGACGGCCTATGTCATGGTCAGTCCGGTCCCGGCGCGAGTTATCGGGGCCCGCCGCGATGG
+TGTGTCGGCGATCACGCTGGACCGCGGTTTGCCGGCTGACGGTGGCGACGCCATGCCGTGGCTGATGGCC
+AGCGCCAAAACACTGTCCTATGCGGTGAACATGGCCGTCCTGCGTCATGCCGCCCGGCAGGGCGCCGGCG
+ACGTCATCTTCGTCAGCACGGACGGCTACGTCCTGGAAGGCCCTCGCTCGACGGTGGTGATCGCCACCGA
+CGGTGACCAAGGGGGCGGGAACCCCTGCTTGCTGACGCCGCCTCCGTGGTATCCAATCCTGCGGGGAACC
+ACGCAACAAGCGCTCTTCGAAGTGGCCCGCGCGAAAGGCTACGACTGCGACTACCGTGCCCTACGCGTCG
+CCGATCTCTTCGATTCCCAAGGTATTTGGTTGGTATCGAGCATGACTCTGGCCGCCCGCGTACACACCCT
+GGACGGGCGGCGATTACCCCGCACCCCGATCGCTGAGGTGTTTGCCGAATTGGTGGACGCCGCTATTGTC
+AGCGACCGGTGATACGGCAACCTCTGTTGTGGTCAGCGCCGGCCATACCGCTCGCCGTTATCCGACGAAC
+CGGGACAACCGCGCCGACAGATGTGGTACCAGCCCGCCGTCGGCATCGACGCGTTCCTCGACGTAGGCCA
+GGTCGCCACCTTCGACGATGCCGTAGAGTCGTTTGGCGCCGCCGACCAGAACGCCAGACCGACTGCGGGC
+CAGCGCATCGGTCACCAACTCCCACGAGGACTGGGTGCGCGGCCGCCCGTAGAACAGTTCGACATAACCG
+GCCGAATGCGCCAATAGCAACTCGATCGCCTGAGACTCGCTCGGATCGTACGGGTCGGCGACGAACCGCC
+AGAATCCCGCTTCTCGTAAGCCTGGTTCCTGGTAGTCGCCCGTGGCGGTGAGCCGCCAGGACCGGGATTC
+CCAATTCAGATAGTCGCCGCCGTCGTGTGACACAACGATCTGCTGGCCGAACCGGTAGTCGCCGTCGGGT
+CCGCGGCCCTCGCCTTCGCCGCGCCACACGCCGACCAGTGGCAGCAGCGCCAGCAGTGCATTGTTCAGGT
+CGGCACCTTCGCGCAGGTTTGCGGTATCTGCGGGAACCGGCAAATCGTCGAAGGCAGGGATATTGCGCGC
+GGCGGTCGCCTTGGCCCGCTCGACGGCAGCGGCGACCGCACGGTCGCCGGAGCCCGCAGCATGGACGCCG
+CCGGCCCCGGTCGCATCCGAGCCCGCGCCGGAACTCACGACTCGTCGGTAACGAGCCGGTACAGCGTGTA
+CAGCGCGAACCAGGAGATAACCACGGTCGCCAAGACCAGCATGATCTCGAAGAACAGCACCACGGGGACG
+AGTGTATGCGGCCGCGGCCGCTTCCGTGGCCCTGGCTCGTCTGGGCCTGATTGGGGCCGGTCAGGTGATC
+TTGACGTCTACCTCGTGGATGCCCGCGCCCGAGGGCTGCACCACCGCGTCGCCGTTGCCGGCCGCCGACA
+GCGCGCGCAGCGTCCAGGATCCGGGCGCGGCGAAGAACCGGAAATCGCCGGTGGCCGACGCGACGACCTC
+CGCGGTGAACTCGTCGGAGGAGTCCAGCAGCCGCACGAACGCGCCGCCCACGGCCTGGCCGTCACCGTCC
+ACTACGCGGCCGGTGATCACCGTTTCTTTTTCCAGGTCGACGCTGGCCGGCAATGTCAGTCCTTGCTTGG
+GTCCAGAGCACATATCAGCTTCCCAACTCGATCGGGGCGCCCACCAGGGAGCCGTATTCTGTCCAACTGC
+CGTCGTAGTTCTTGACGTTTTGGTGTCCGAGTAATTCCCGCAACACGAACCAGGTGTGCGAGGACCGTTC
+CCCGATTCGGCAGTAGGCAATCGTTTCCTTGCTGTTGTCTAGGCCGGCGTCGGCGTAAAGCTTGGCCAAC
+TCCTCATCGGACTTGAAGGTGCCGTCCTCGTTGGCGGCCCTGCTCCACGGCACGTTGATGGCACCAGGAA
+TGTGTCCGGGCCGCTGGCTTTGTTCCTGCGGCAGGTGCGCGGGGGCCAGGATCTTGCCGGAGAACTCGTC
+GGGAGAGCGCACGTCGATGAGGTTCTTGACGTTGATGGCCGCCAGGACCTCGTCGCGGAATGCCCGAATC
+GTGTTATCCGGCGGGGAGGCGGTGTAGGAGGTCACCGGCCGGCTGACCGGGTCGCTGGACAGCGGGCGTC
+CGTCGAGCTCCCACTTCTTGCGGCCGCCGTCGAGCAACTTGACCTTCTCATGGCCGTAGAGCTTGAAATA
+CCAGTACGCGTAGGCGGCGAACCAATTGTTGTTGCCGCCGTACAGGATCACCGTGTCCTCGTTGGCGATG
+CCACGCTCGGACAGCAGCTTGGAGAATTGCTGGGCGTCGACGAAGTCACGTTTGACCGGATCCTGCAGGT
+CGGTGCGCCAGTCCAACTTGATCGCGCCGGCAATATGGTCACGGTCATATGCACTGGTGTCCTCGTCCAC
+TTCGACGAAAACGACCTTCGGCGCGTGCAGATTGCTCTCAGCCCAGTCGGCGGAGACCAGGACATCGCAG
+CGTGCCATGGCGGGAATCCTTTCGCATAGTTCGGTGACCAGCGTGGTCAACTGGTTAGGCGGGACGGGGA
+GTGTTACTGCTTGACTGCTCCTTGGGACGTCTGTTGCACAGAAACGGCGGGCGACACGCTACGGTGGGGC
+TCCTAGGCTGCTCTAAGTGCTGCGCGGACGTGCGCGGCTACTCAGCAGCTACAGCAACAGCAACAACCCG
+CTAGGCGGCACAGATCAACTGCGCGACGCTTGGTGAGCATGGGCTCGATGCGGGCTGACACGTCGGACAG
+CTTACCCAATCGCATAGTGCTCAAGCCAACAGTGGTTTCAGGGCAGAGCGCAGGTCGGCGGCCTTGGGGA
+CCCCGGAGGTCCGGTAGCGCTGTCGCCCGTCGACATCGAAGATCAACGTGGTGGGCAGCGAAAGCACCGA
+AAATCGCCGCGCTGCCTGCGGGTTGGAGTCCAGGTCGACCTCGATGTGAGCAACATCTCCCAGATCGGCG
+CAGACGTCGCCGACCCCTCGGCGTACCCGGTCGCAGGGCGCACACCCTGGGGCCCTGAAATGCACGACGG
+TCGGCCCGGCCCCGGACAGGCCCAGTTCCGCGGTGCGCGCCGGAGCCGCCGGTGTCGTTTCCGGACCAAC
+CTCCCGCAGGATCACTGACCGCCGGGTCAGCAACCACCGGGCAATGGTCGCCAGCGCACCTGTAGCAACG
+GAAGCGACGATCATGGTCGTCATGACTGTTTGAACTCGTCGAGCGAGATCGTTACTCCCCGGGTAATGCC
+TTCGATGATGACGTCCGATCCGCGCGCCCCCACGGTGTTTGGCACCACCCCGAACGGCAGCTTCTGGTTG
+GGCAGCTTGCTGGCGAAGGCGTGCAGCACCGCATCCCGCTTGTCATCCGGAACCGGTTGGTCCGCGGTGT
+CGGGTCCGGTCACGACGGCGGTGGGGGTGATAACCAAGGTCGCGCGGTCGTCCGAGGCAACGGACAGGTC
+CACCAAGACGCTGACCCGGTGAGCGAAGTTGGCCGATATGGGCGTGCCGCTGAACACCAGCCCGCGGCTG
+CCAGATATCCCGGACTCGGTAGTGCCGCCGGTGGCGTCGTTGCTCTCCTGACGGGGCGCGGCGACCATAA
+GGTCGCTAATGCCCAGGTAGCGGCCCAGGTGCATGGAGTCGATGATGATGCGACTCTCCAGCTCGCCGAC
+CGGGAGCTTGGCATCGGGCCTGATCAGCCAGGACGCGTAGGACAAGTCGATCGAATGCATAGTGGCCTCC
+AGAGTGGCCGTGCCACTTCCGGCGTGCTCCACGGCAAATGCCTTGATTTCTAGCTCCGCGTAGTGTTCCC
+GCATCGCCTGCGGGATGAATGGGAACCGCAGGATGGCGACGAACGGGTCTGACCTCAGGTTTGCCGCTTT
+GCGCACAGTGGTCGACAGCCGGTACTCGGCATAGATGCTGGCCCCGAAATCGGCGCCGACGGCGCCCACG
+ATGAGAACGGCCACGACGATCGCCGCCCCGGTCACCCCGACCAGCACCTTGCGCATCGGCATATTGTCGC
+CCAGCGCTCGAGCCCGTCCCGGAGCGCCTCGTCAGGCGGCACGTTATCGTTAGATGAGCTGCCGCTACCG
+TCACATGGCGCGATGAACTGGGAGACGCCTTTCCCACGACGCTGGAGGGGCTTGTTGGAGTTATTACTGC
+TGACCTCGGAGCTGTATCCGGATCCGGTCCTGCCGGCGCTGTCGCTGCTGCCCCACACCGTGCGGACGGC
+GCCGGCCGAGGCGTCTTCGTTGCTGGAGGCGGGAAACGCAGACGCTGTGCTCGTCGACGCGCGCAACGAC
+CTGTCGTCCGGGCGAGGCCTGTGCCGCCTGTTGAGCTCGACCGGCCGGTCGATCCCGGTACTGGCGGTGG
+TGAGCGAAGGCGGGCTGGTGGCGGTCAGCGCTGACTGGGGGCTGGACGAGATCCTGCTGCCCAGCACCGG
+GCCCGCTGAGATCGACGCCAGACTGCGGCTGGTGGTTGGCCGGCGCGGAGATCTGGCTGACCAGGAGAGT
+CTGGGCAAGGTGAGCCTGGGCGAGCTGGTGATCGACGAAGGCACCTACACCGCCCGGCTGCGTGGCCGCC
+CGCTGGATCTCACCTACAAAGAGTTCGAGCTGCTGAAATACCTGGCGCAGCATGCCGGCCGGGTGTTCAC
+TCGGGCGCAGCTGCTGCACGAAGTATGGGGGTATGACTTCTTCGGGGGCACCCGGACTGTTGATGTGCAC
+GTGCGGCGGTTGCGGGCCAAACTCGGCCCCGAGCATGAAGCGCTGATCGGCACGGTGCGCAACGTCGGAT
+ACAAAGCTGTTCGGCCGGCGCGCGGCCGACCGCCGGCCGCGGACCCCGACGACGAAGACGCCGATCCCGG
+CCGGGATGGTATGCAAGAACCACTGGTCGACCCGTTGCGCAGTCAGTGACGGCGCTTGACTGGCGCTCCG
+CTCTGACCGCCGACGAGCAGCGCAGCGTGCGTGCACTGGTCACGGCGACAACAGCAGTCGATGGGGTAGC
+ACCCGTGGGTGAACAGGTGCTGCGGGAACTGGGCCAGCAACGCACCGAGCATCTGCTGGTGGCCGGTTCG
+CGACCGGGCGGCCCGATCATCGGCTACCTCAACCTCAGCCCACCCCGGGGCGCGGGTGGTGCGATGGCGG
+AGTTGGTGGTGCATCCGCAGTCTCGACGGCGCGGTATCGGCACCGCCATGGCCCGCGCGGCATTGGCCAA
+GACCGCCGGCCGCAACCAGTTCTGGGCGCACGGCACGCTGGATCCCGCTCGGGCGACCGCGTCCGCGCTG
+GGTCTGGTCGGCGTCCGCGAACTGATCCAGATGCGACGCCCGCTGCGTGATATCCCCGAACCGACGATCC
+CCGACGGGGTGGTGATCCGCACCTACGCGGGCACGTCCGACGACGCTGAGCTACTCCGGGTCAACAACGC
+CGCGTTCGCCGGACACCCGGAACAGGGTGGGTGGACCGCGGTCCAGCTTGCCGAGCGGCGTGGCGAGGCG
+TGGTTCGATCCAGACGGCCTGATCTTGGCCTTCGGTGATTCGCCACGTGAACGGCCTGGCCGGTTGCTGG
+GTTTCCATTGGACCAAAGTGCATCCCGATCACCCGGGATTGGGCGAGGTGTACGTGCTGGGCGTCGATCC
+GGCGGCGCAGCGCCGCGGTCTCGGCCAGATGTTGACGTCGATCGGTATCGTCTCGCTGGCCCGTCGGCTG
+GGCGGTCGGAAGACCCTCGACCCTGCGGTCGAACCCGCCGTGCTGCTCTACGTGGAGTCGGACAATGTGG
+CGGCCGTGCGAACCTACCAGAGCCTGGGCTTCACCACCTACAGCGTCGATACCGCCTACGCGCTGGCTGG
+CACGGATAACTGACCGAAGATGTTCCCCCCCAAGAAGTCGTAAGCAGGAGCTTAAGTGGCCAAGCGGTTG
+GACCTCACGGACGTCAACATCTACTACGGGTCATTTCATGCGGTCGCTGATGTGTCGCTGGCGATTCTGC
+CCCGCAGCGTCACGGCGTTGATCGGTCCCTCGGGCTGCGGCAAGACGACGGTGCTGCGCACCTTGAACCG
+GATGCATGAGGTCATCCCCGGAGCTCGAGTCGAGGGTGCCGTACTGCTCGATGATCAAGATATCTACGCC
+CCCGGTATCGACCCGGTCGGTGTCCGCCGGGCAATCGGGATGGTGTTTCAGCGGCCGAATCCATTCCCCG
+CCATGTCGATTCGCAACAATGTGGTTGCCGGCCTGAAGCTGCAGGGTGTGCGCAATCGCAAGGTGCTCGA
+CGATACGGCCGAATCCTCGCTGCGCGGCGCAAACCTGTGGGACGAGGTCAAGGATCGACTGGATAAACCC
+GGCGGCGGATTGTCTGGGGGGCAGCAGCAGCGGTTGTGCATCGCACGGGCAATCGCCGTGCAACCCGACG
+TGTTGCTGATGGACGAGCCCTGCTCCTCGCTGGACCCAATCTCGACCATGGCCATCGAAGACCTGATCAG
+CGAGCTCAAGCAGCAGTACACCATCGTCATCGTCACCCATAACATGCAGCAGGCTGCCCGGGTGAGTGAT
+CAGACGGCATTCTTCAACCTGGAAGCGGTGGGAAAGCCGGGGCGGCTGGTAGAGATCGCCAGCACCGAGA
+AAATCTTCTCCAACCCGAACCAGAAGGCCACCGAGGACTACATCTCCGGGCGCTTCGGCTAGGCCCGATG
+CCCTCGATGGCCAGGCTGGCGTCACCGCGGGTGGATGTTTGCTCGGCCTAGGGAAAGGCGCCGGTCGCCT
+GGAAGATCACGCGTCGTGCCACTTCCACGGCGTGGTCGGCAAAGCGCTCGTAGAATCGGCTCAGCAACGT
+CACGTCGACGGCGGCCGCCACTCCGTGCTTCCATTCGCGGTCCATCAGCACGGTGAACAAATGCCGGTGC
+AGGTCGTCCATCGCGTCGTCTTCTTCGCGGATCTGGGCGGCCTTTTCCGGGTCGTGCGACAACACGACCT
+CTTGGGCACTGTTGCCCAATTCGACTGCAACTCTTCCCATTTCGGCAAAATAACCGTTGACCTCTTCGGG
+CAGCGCGTGCTGTGGATGCCGACGGCGGGCGATCTTGGCGACATGCAGCGCCAACGCCCCCATCCGGTCG
+ATGTCAGCCACCATCTGGATGGCGCTCACAATGGCTCTGAGGTCACCGGCGACCGGTGCCTGCAACGCCA
+GAAGAACGAATGCACTCTCCTCGGCCCGGGCGCTTAGCGTCGCGATCTTTTCGTGGTCGGAGATCACTTG
+CTCGGCCAGCACGAGATCGGCCTGCAGCAAGGCTTGGGTGGCCCGCTCCATGGCGATGCCTGCTAGCCCG
+CACATTTCCCCGAGACGCTCGGATAATTCCGAGAGTTGCTCATGGTAGGCGGTCCGCATGTGCTAAAGCC
+TACGTTCCCGACCTTGGAAAATGCCGTAAGCGTCGTGTCAATGCGGCTACTCGCAGGTGGTGTCGGCGGC
+GTTGGTGACCGTCAGGTCCTCGGGCAGCTTGGTCGGTGGGCTGGAGGAGTTGCGGCTTATCTGCACGCTG
+ACGGTGGAGCCACTCGGCAGGGGAGCGCGCACCGCGCTGAAGTCTTGGCCCAGCACCACCTGGACCAGTT
+GGCCGATCCCGGTCACCCGCTCGATCTTTGACTGGCCGAACACGGCGGCCACGGTGGCGGCAGCCTGTTC
+GTTGCCGGGCGAAAAAAACACTGTGGTGGCCAGCAGCGAACTCGGGTAGTCGTCCGGAGCCATCACGTTG
+AAGCCGTTCCGCTTGAGCTGATCGGTGGCGGTGGTGGCCAAACCGGCCTGGCCGGTCGAGTTAGAGACCT
+GCACTGTGACCTCTTTTGGCGAGGTCGTCGTAACCTGCTGGTGCTGAATCTCGTTGGTCAGACCCGCCTG
+CGGCGCCTTCTTGGTGGTGGTCGGCGGGGTCGACGGCGTGTTGCCCAGACGCTGGGCGTTGTGATCGTTT
+TCCAGGGGCAGCGGATCGTCGTCGATGATGGCGGTGAAAAGCGCCTTCATGTCGGAGGTACGCGGGGGCT
+CGTCGCCGTTCTGGTCGGTTATACCGGTCGGAACGGTCACGAACGTGACGTGCCCGGCCGCCATATGCTG
+CAACGATCGACCGAGTTCGACCAGGTCTTTGGTCTTGACGTTGTCCACGTAGCTGTTACCGATGAACATG
+TTGACGACGTTGTTGAGCCTGCTGAGGTTGAACAAGGTGTCCGTCGAGATCATCGAACGCAGCAGCGACG
+ACAAAAACAACTGCTGGCGTTTGATGCGCCCGTAGTCGCCATTGCTCTCGGTGGTGACCTGGCGAGCGCG
+CACATAGTTCAGCGCGGTCGGCCCGTCAATGACCTGGCGTCCGGCGTGCTCCAGCACCGTGCCCAGTTCG
+TAGTCCCGCAACGGGGTGGTGCTGCATACCTCGACGCCGCCGAGGGCCTCGACCATCCGCGCGAAACCGA
+CGAAGTCAATCGCGATGAACCGGTTGATGCTCAAGCCCGACAGTTTCTGAATGACCTTCACTAGACACTT
+AGGCCCGCCGAAGGAGAATGCCGAGTTCAGCTTGGTCTCCGTGTACACCAGTCTGGGACCCATCGTTCCC
+GTCTTCTCGTCGTAGATGGGTCCGTACTTACCGGTCTCGGGGTTCCACGCCTCGCATTGGATTGGAGTGA
+TCGCCAGGTCGCGGGGGAACGACACCGCGACGACCCGCTCGCGGCTGGCCGGAATGTTGACCAGCATGAC
+GGTGTCCGAACGTGCGCCGCCGGCGTCCTCGGCGTCGCCGGCGCCGATATTGGCGTTCGCCCCGGCACGA
+GAGTCCATACCGACGAGCAAGAAGTTCTCGTCGCCATGCTGCCCGCTGGGGTTGACGATGTCGCCCGAAT
+GCGGGTCGAGCGCGCTTACCATGTTCAGCCGGCTGTTCTTCGACGCGCTCCACTGCCATGCCCCGCCGGT
+CAGCGCCAACGCCAGAGCGGCAAACAGAGCCGCCAGCGAGCGCGCGGCCAGCACCATCGGGCGCCGGCCG
+GAGTTCGGCGCTGGCTTGGCGGGCGCGGGCGACGTTCGGCGGATCCGCAATGGCCGCACTCGAGCCGATC
+CGGTTAGCTGCTTGCCGGGTAGCTCGGGTTCACGGCGGGCGTGGTCGGCGCGCGGATAGTTGGCTGCCCG
+GAGGTCGGGAAGCTCCGAGAGGAACTCGAGCGAGTGGGCCGGGATGGCGATAGCCTCGGTGTCCTGCTGG
+TCGTCGGCGTCGTCGGGGACCTTCGGGCCGCGGCCGGATGGCTCGGGTTCGGGGGCGACATGGCGGTGCG
+TGGGGAGGTCAGGAAAAGCGGGGCCGAGCCTGGCGATCAGATCGGCCACACTAACGGCGCCGGTGGCATG
+ACAGCCGACATTCTGGGTGTCCCGCGGACCCTGGGCTGCCACCCATGTGGCGGGCGGTACCGTGATCCAT
+CGGTCAACACCATCGGGGAATGCTGACTCGGAGAGCCGTGCCCACGGCGCGGCGCTCTCGCCGTCACTCA
+TGTCCTACCGGCCTCCGAGAGTCTAGGTGGCGGACGCCCACGGTGTTGGCTGCGTGTCCTACGCGCACCT
+TCGCGCAGCACCGCCACGAGTCGGCGCCGCACAATGCAGCAAGGCCCACATCGTACTGATTTATCGGTCC
+AGACGCGATTTCGACAGGGTCTCGATTCAGCCACCCGACCCCATGGCGTCCGCCCCTTCCGGCACTCGGC
+AGTCGTCGGGGTCGGTTAGCCAGCCGTCGGGAAGGGCCACCCGGGCGGGGGAACCCTGCCGGCCCCGGGC
+GCCAGTCGCGGAGTCCGGGAACGGTACCGTGCCGTCCAACCGGTCCAGCAGGCAGTCGAGCTCGTCGAGC
+GTCTTGACCATTGCTAACGCCCGCCGGAGCGCGGAGCCCGCCGGGAAGCCATGTAGATACCAGGCGATGT
+GCTTGCGGATATCGCGCATGCCCTTGTCCTCGCCGAAGTGTGCGGCCAGCAAGGTGCCGTGACGGCGGAT
+GATGTCGGCGACTTCGCCGAGCGTGGGTGGGGTGGGGGCCGGGCTGCCGGTGAAAGCCGCGGACAACTCG
+GCAAATAGCCAGGGACGGCCCAGGCAGCCACGGCCGATGACCACGCCGTCACAGCCGGTGGTGGACATCA
+TGGCCAGTGCGTCGCCGGCATCGTAGATGTCGCCGTTGCCGAGCACCGGAATCGTCCGGACATGCTGCTT
+GAGCCGGGCGATCTGTTCCCAGTCGGCGGTGCCGGAATAGCGTTGTGCCGCGGTACGGGCGTGCAGCGCG
+ACCGCAGCGGCTCCTTCGGCCTCAGCGATGCGGCCGGCATCCAGATGTGTGTGGTGGGCGTCATCGATGC
+CAATGCGAAACTTGACCGTCACCGGTATATCGGTGCCTTCGGTGGCGCGCACAGCCGCGGCCACGATCTG
+ACCGAATAGCCGCCGTTTGAACGGTAGCGCCGCCCCGCAGCCGCGCTTGGTGACTTTGGGCACTGGGCAG
+CCGAAATTCATGTCGATGTGATCGGCTAACCCTTCGCCAGCGATCATCCGAGCGGCCGCATACGTGGTGT
+CCGGATCGACGGTGTACAGCTGCAGCGAGCGTGGTGATTCGTCCGCGGAGAACGTTGTCATGTGCATGGT
+GACCGGGTGCCGCTCGATGAGCGCACGTGCGGTCACCATCTCGCAGACATACAGTCCGCTGACCGTGCCG
+ACCTTCGACTGTTCCAGCTGACGACACAGCGCCCGGAATGCGACGTTCGTCACACCGGCCATCGGAGCCA
+GCACAACCGGGCTGGCGAGCTCGATCGGGCCGATGCGCAACGCCGGGCTGGGTTGGATTGCCCGCCTCCT
+GCTCATCGCGCTGCGCGCTCTGCATCGTCGCCGGGCTGGGTTGGATTGCCCGCCTCCTGCTCATCGCGCT
+GCGCGCTCTGCATCGTCGCCGGGCTAACGACGGCTCATCGCCAGTTTGCCAGCGGTTTTATGCAGCTCGT
+GTGCGCTGACCTTCTTGCCCGTACGGGCTTCCCGGTCGAGTTGGCGTTGCTTGGACACCTCGAACTTGTC
+GCAGGCCAGCTCGAGGTCCTTGATCACCAGGGCCAGCTCGTCGCGCAGCTTAGCCCCCTCGCCGGTGAAG
+TCCTCGCGCTCGAAGATACGCCATTTCTTCAGTACCGGCATGACGACTTCGTCGAGGTGGATGCGCGGGT
+CGTAGACACCCCCGACGGCGATGACCACGGCTTTGCGCCGGAACTCGGGTACTTGGAAGCCGGGCATCTG
+GAAGTGGCTCAAAATCAGGTGCAGCGACTTCATGGCCTGGTTGGGCACGAGGTCGAACGCGGCCTCGCTG
+ACGTCGCGGTAGAAGATCATGTGCAGATTCTCGTCTGCCGAGATCTTGGCCATGAGCTGGTCGGCGACGG
+GGTCGTTACATGCCTTGCCGGTATTGCGGTGCGAAATCCGGGTTGCCAGTTCCTGGAAACTGACATAGAG
+GACGGAGTCGGTGAGGCTCTCCGCGAAATAGTGGCCCTGGTGGTTTTGGCCTGGGCTGAAGCCCCGGTTG
+ACTACCTCGAGGCGAAGTTTCTCCAACTCGACAGGGTCGACCGATCGGGTCACCACCAGGTAGTCGCGCA
+GCGCGATGCCGTGCCGATTCTCCTCGGCGGTCCAACGGTTGACCCACTGCCCCCACGCGCCGTCCATGCC
+CATGTTCATCGCGATCTCGCGGTGATACGACGGCAGGTTGTCCTCGGTGACCAGGTTCTGCACCATCGCC
+ACCTGGGCGACATCAGAAAGCTTGCTCTGGTCGGGGTCCCAATCCTGCCCGCCGAGCGCGTAGTAGTTCT
+TCCCGTCCGACCACGGGATGTAGTCGTGCGGGTTCCAGGGCTTGTGCATGCTCAGGTGCCGGTTCAGGTA
+CTTCTCGACGACCGGTTCAAGTTCGTGCAGCAGCTGCAGGTCGGTCAGCTTGGCTGACATGGCGCCTCCA
+GTTATCTGTGTCTAATGGTTGCAGTCAATATATCTGTGCCTCTCGGTAGCATCAAGTTTGGGCTTCGCGC
+GGCATGTTGAGCTGCCAGCAGCGGGCAGGATGCTGGCATCGGCGGGCCCCGGTGGCCGCGTGGGGTGAAC
+CCCAGTCGTCCTCAGTTGTGCGGCCCGGCTGGGATGGAGTGTTCGGATTCTCCCCGCTCGCGGTGCGGTG
+CGTAGGTGGCGGCGGTGCTGAGCAACATGTTGACGCAGTAGTCGATGAATTGCTTGCGGGTGGCTCCCAG
+CCGTCCGTTCAGATATGCGGTGAACAGACCGGTAAGAGCGCCGATCAAGCTGGTGGCGACCAGTTTCTGC
+AGAACTGGATCAACGATGCGGGACAACTTGCGTTGCAGCAACTCGATGAAGTTGGGCATCCACTCCGCGC
+CCGACCGGGTCAGGGCCGGTTCTACCGCCGGCGCCAGCAACAGCACGCGCCCGCGCACCGGATCGTCGAC
+CATCAGCTCGACGAATTGCTCTACGGCCTCGCGCGGGGTTTGCGCGGACGTGAGGGTTGCCATCGCTCGT
+GTGCAGACGTCGTCGTAGACCGCGCGAACGAAATGTTCACGGTCGGCGAAGCTTTCGTAAAAGTAGCGTT
+CTGTCAGGCCGGCGTGGCGGCACACTGCGCGGACGGTGAGTGCGGGTCCGCCTGCGCCGCCGAGCAACTG
+CACGCCGGCGGCGACGAGGTTGTCTCGACGTAGGGCGTGCCGACTTTCCAAGGGGACACCGGACCAGCGG
+CCCCGGTTTTGACCGGTCTGCACAGCTCTCCTAAACTCCATAGTGACAACGTGCGTAGTCAGAATTCGTG
+TGGCCAATGAAGATTCAGCAGGCAAAACCACCAGTGACCCAAGATACGTCTGCTACCTGTCCGCTGACCA
+GCACCGTGCAGGATTCCTCGCCGGTTGCGGGCCAGCTTGGCAGGCCTATAGGGTTCCGCGGACTGGCCGG
+CGGTTGCCCCGTGTCACCGCTGGGTTACGAATCGCCGCCGCTGCCGCTGGGGCCGGATTCGCTGACGTGG
+CGATACTTCGGTGACTGGCGTGGGATGCTGCAGGGACCGTGGGCGGGATCCATGCAGAATATGCATCCGC
+AGCTGGGCGCGGCGGTCGAAGATCATTCGACGTTCTTCCGGGGACGCTGGCCACGGCTGCTGCGGTCGTT
+GTACCCGATCGGCGGAGTTGTCTTCGACGGCGATCGAGCCCCAGTCACCGGTGTGCAGGTGCGTGACTAC
+CACATCACCATCAAGGGTGTCGACGGTGCGGGCCGTCGCTACCACGCGTTGAATCCCGACGTCTTCTACT
+GGGCGCACGCCACCTTCTTTGTCGGCACGTTGCATGTGGCCGAGCGGTTCTGCGGTGGCCTGACCGAGGC
+GCAGCGGCGCCAGCTATTTGACGAGCACGTCCAGTGGTACCGCATGTACGGCATGAGCATGCGGCCGGTG
+CCGGCGACCTGGGAGGAGTTTCAGGACTACTGGGACCACATGTGCCGCAACGTGCTGGAGAACAACTTCG
+CGGCGCGTGCCGTGCTCGACCTGACCGAACTACCCAAACCGCCATTCGCCCAACGAGTTCCGGATTGGCT
+GTGGGCCGCGCCGCGCAAGTTGCTGGCCCGGTTCTTCGTCTGGCTGACCGTCGGACTCTACGATCCGCCC
+GTGCGCGAGCTGATGGGCTACCGGTGGTTGCGCCGCGACGAATGGTTGCACCGCCGCTTTGGCGACATCG
+TCCAGCTCGTCTTTGCCTTGGTGCCATTCCGGTTTCGCAAGCACCCGCGGGCTCGCGCCGGCTGGGACCG
+TGCCACCGGCCGCATCCCCGCCGATGCGCCGCTAGTACAGACGCCCGCGCGCAACCTGCCGCCGCCCGAC
+GAGCGTGACAACCCGACGCACTACTGCCCTAAGGTCTGACCCCGGACCTGCGGCGCAACCGGGGCGTGGT
+TGTGCTCACCGTTAATTGGCTTACCCGACATCCTTGGTAGCCGATGCCTTAGCGACCGACTGCAGTCCGC
+CGGCAGCACGGTGGTGGCGGGGAATCCCGGGACCGGCGTGCTCGGCGTTGAAAACGGCGTCGATGACGAG
+CTGGCGCACGTGCTCGTTCTCCAGACGGTAAAAGATCGTGGTTCCATCGCGGCGGGTGCGCACCAGCCGC
+GCCATTCGTAGCTTTGCCAGGTGCTGGGAGACCGACGGCGCGGGCTTGCCCACCTGCTCGGCGAGTTCAT
+TGACCGACATTTCGCGGTCTGCCAGCGACCACAGCACCTGCACGCGGGTCGCGTCGGCGAGCATTCGGAA
+CACCTCGACCACCAAGCAGACCTGATCGTCAGGCAACGGGTCAGGTCCACTATCTGCGTACATACGCAAA
+CAATAGAACGCGGGCGTGGTGGGCTGTCAAGGTCGCGGGTCGGCGCCCGCTCAGCCCGTCGGAGCGGCGA
+TCGCGCTGCGCTCACCGCCGTTGGGTTCCTGCCGGAACCGGTAGACATCCACCGCGCCAGCCCTGATATC
+GGGCCGGTGCTCTTGGCGCATCGGCAGGCGCCGGTCCTGCCATTCCTTGGCGAACTCGTCGTAGAAGGTG
+GCGGGCTCGAAGTACCTGCGGTCATCGACGTAATGCGGTTCATAGGCGTCACGCGACGTCAGGAAGACAA
+CCTCATCGGGTGAGCAGTAGTACAGCGATCCATAGCACATCGGACACGGATGGGCCAGCACGTTGAGAGT
+GGTACCGACCAGGTGCTCAGTGCCCAGCTTGGTGCACGCGGCACGGATGGCAAGGCTCTCGGCGTGGGCG
+GTCGGATCATTGGTTTGGGCCCATCGTCGAAAACCTGCCATGCCTGCCGGCATGTGCAAGACATCGGCTG
+GGACGAAAAATGGCAATGCGACGGCTGTTCGATCACGCACCAACGTGACGACAACGCCGCGATCAACCTC
+GCACGCTACGAGGAACCACCTAGCGTCGTCGGCCCAGTTGGGGCCGCCGTCAAGCGTGGAGCCGACCGTA
+AGACCGGGCCTGGCCCGGCGGGTGGCCGTGAAGCGCGGAAGGGAACCGGCCACCCGGCTGGCGAACAACC
+CCGAGACGGGGTGCTAGTCGCGTGACCACTAAAGATCACTCACTTGCAACGGTAGTTCGCAGTGGAGACC
+ACGGTAGTAGCTAGACTATCTACATTTATCGCATATCCGTTTTGCTTGAGGGGGCAACGATGGTACGCGC
+CGATCGTGATCGCTGGGATCTCGCGACGAGTGTCGGGGCGACGGCTACCATGGTCGCCGCCCAGCGCGCG
+CTGGCTGCCGACCCGCGATATGCGCTGATCGATGATCCATATGCGGCGCCGTTGGTGCGTGCCGTTGGTA
+TGGACGTCTACACGCGGCTGGTGGATTGGCAGATCCCCGTCGAGGGGGATTCCGAGTTCGATCCGCAGCG
+AATGGCCACGGGGATGGCCTGCCGCACCAGGTTCTTCGATCAGTTCTTCCTTGATGCCACCCACAGTGGC
+ATCGGCCAGTTCGTCATCCTGGCGTCCGGGCTGGACGCCCGGGCTTACCGCCTTGCCTGGCCGGTGGGCA
+GCATCGTCTACGAAGTGGACATGCCGGAGGTGATCGAGTTCAAGACCGCCACGCTGAGCGATCTGGGCGC
+CGAGCCGGCCACCGAACGCCGGACTGTCGCGGTCGACTTGCGCGACGACTGGGCCACCGCACTTCAGACG
+GCGGGTTTTGATCCGAAGGTGCCAGCGGCCTGGAGTGCTGAAGGGTTGCTGGTATACCTGCCGGTCGAAG
+CTCAGGATGCGCTGTTCGACAACATCACCGCGTTGAGTGCTCCCGGTAGTCGGCTGGCGTTCGAATTCGT
+GCCGGATACCGCGATTTTTGCCGATGAGCGATGGCGCAACTATCACAATCGGATGAGCGAGCTCGGATTC
+GACATCGACCTCAACGAGCTGGTGTACCACGGTCAGCGTGGTCACGTTCTCGACTATTTAACCCGCGATG
+GCTGGCAGACCTCGGCGCTTACGGTCACGCAGTTGTACGAGGCAAACGGCTTTGCCTATCCCGACGACGA
+GCTCGCGACGGCGTTTGCCGACCTCACCTACAGCAGCGCGACGCTCATGCGCTAAAGCAAGCGATCTGAC
+CGCTTACTGGCGAAGCAGCTCATCTTTCAGGCGACTGGTGATCATCTCCTGAAACACGACCTGGGCCGGA
+CCGTACAGGTCCTGGAATGTCGACACTAAGGCGTCCCTGTTGTACTCGGGAATGGAGCCGCCACTGGGAG
+TCCAAAAGCTATCGATGTCCAGCAGGAAGAATGGTCCGGTTTGGGCGGGTGTTATTCGGCGCAGATGGTA
+ATTGGGATCAAGCGCTTGGCCCATACCCGGGCCGTAGCGCACGATGAGCGATTTGCCTGGTTGTAGCTCA
+CGGTAGACTGCGGCACCCTGCCACTCGGTCAGGACCAGGCCGCCGGGAGTGAAACGCTGCGGCCCGAGCA
+GCTGCTCGTCGATCCAGTTGCTCCACGTGATCCGGCCGTCGACACCCGCGGGGACGCGGATCTCCAGAAC
+AAAGCGAAGACCGATACGCTCCAACCCAACGATTGACGAGACCTGCGCGCGAGCATCCACGACCCGCATC
+ACAACGTCGGTAAAGGCCTCAAAGCTGCGGTAGGCGGTGGTCTCCACGACTATCGCCTGGTTCTTCAGTG
+AAGCGGCGGTGGTGTTATCGCGATTGACATAACGAACGAAACGATCCGCGACCGGGGTGGGGGCTCCACC
+GGGCGCCGTCATCCCCCAGCTGACGTCCTGCGCCTGGCGTTCGATCGGTAGATCATTGATAAGCAGGTGT
+TTGAGCTCCCGGTTCGCTGATTCGGTGAGCGAATCCGTTGTCGGGTGACGGATTTCCACCGTCACCAGGG
+CAACGGGTGCGTTGGGCTGGACCTCATCCTGATTTGTCTCGGGGAGCATAGACAGCAAGCATAGCCAGGT
+TGCTTTGCTCAGATCGCCGGACCGTGCATCGGGAGGGAATCGGCGATGCGCACGGCTTCGTGCCCCTGTT
+TGTGCCCCCACCAGGACTCGAACCTGGGACCTGCGGATTAAAAGTCCGTAGCTCTACCAACTGAGCTATA
+GGGGCGCGAAGACTCAGGATACTGCGTTGGCGTCGGCCGCTCGTTTGAGGAATAGGCTGGGGGTGACCTA
+AGCTGGCGTGGCTCCCAACGGTCACCACGTTGCGAGTGCCCCGGAGAGATTCGGTTCTGCCCCCTTCGTC
+TAGACGGCCTAGGACGCCGCCCTTTCAAGGCGGTAACGCGGGTTCGAATCCCGTAGGGGGTACCTGCGAC
+GCGGTATCGCGGAGCACACAACACAGCAAGGCCCTGTGGCGCAGTTGGTTAGCGCGCCGCCCTGTCACGG
+CGGAGGTCGCGGGTTCGAGTCCCGTCAGGGTCGCCAGGACGGTGAGGCACATGCTGCCTTCCGGCCAGGT
+AGCTCAGTCGGTATGAGCGTCCGCCTGAAAAGCGGAAGGTCGGCGGTTCGATCCCGCCCCTGGCCACCAT
+GGTCTACCTAGATAGGCACTGTGGCGGCACTGCTACGTAGCCGACCTCCCTGGGTCTGGGTGATTGGTCC
+CGGGCTGCGATGGTCGTGAGCACACGCCCGGATCACCGATGCCGTCCCGCCCCGGTAGGCCATCGCGGCG
+ATGATCGAGATTGCCGGCCGGGTTGATCGCTGCGGATTCCACCCGGGTCGAACGGCGGGTCCATCTGCTC
+CTCGATCGCTCGTGAAAGACCTGATTGTTCAGCCATTTCCAGCATCACAGGCGCCAAACCCATTGGCCGA
+CATCAAATTCCGCTCGTCAACCACCGCCGGCTCGGTGGTGAACGCATGCAGTGAATGGGTCAAAAGTGTG
+GTCTTGGACTGTAGAGAAATGCGACGTGAGCGCTGGTGTTGTCCCAGGCCAGAAGGCCCAGAAGACTTGT
+CGCGGTTCGCACGCCGATCGAGTCACCGGACCATCCATGGGCGATGCGCCGGAAAACCAGACGCGCGCAA
+GCCTCGAAGGCCTTGGCGTGGCGAAGGGCCGCCGGCTAGGGCAACCCTCGTATTCCCGGATGTTGGCGGC
+CCGACGGGATTACACTGCTTCCTGCTGATTCCTCCCTGCGATCGGTCGATCGCAGGATCGGTTGGCATCG
+AGGTCATGTCGCTGTGGGAGGAGATGTCGCGTGTCTTATGTGAGCGTGTTGCCCGCTACGCTGGCCACAG
+CGGCAACAGAGGTGGCCCGCATCGGCTCGGCGCTCAGTTTGGCTAGCGCGGTCGCGGCGGCCCAGACCAG
+CGCGGTGCAGGCCGCGGCCGCGGATGAGGTGTCGGCGGCGATCGCTGCGCTGTTTTCCGCCCACGGGCGG
+GATTTTCAGGCGCTCAGCGCGCGGGCGGCAGCGTTTCATCACGAGTTTGTGCAGGCCCTGGCCGCGGGTG
+CGGGGTCCTATGCGGTCGCCGAGATTGCCGCCGCATCGCCGTTGCAGAGCCTGATCGACGTGTTCAACGC
+GCCCATCCAGGCCGCCACCGGGCGCCCGCTGATCGGCAACGGCGCCAACGGCCAGCCGGGCACCGGGGCC
+CCGGGGGGCCCGGCGGGTGGTTGATCGGCAACGGCGGGGCCGGCGGGTCCGGGGCGCCCGGCGCCATCGG
+TGGGGCCGGCGGGCCCGCGGGGTTGATCGGTGTCGGAGGTGCCGGCGGGGCCGGTGGAGACTCCGCGGTC
+GCGGGTGTCATCGGAGGGGCCGGTGGGGCAGGCGGGGCTGCCCTGCTGTTCGGTGCCGGTGGGGCCGGCG
+GGGCCGGGGGTTCCGGCGGTTCCGGCGCAGCTGGTGGGGCCGGTGGCGCCGGTGGGGCCGGCGGGCTGTT
+CGCCAGCGGCGGCAGCGGCGGGTTCGGCGGGTTCGCATCGACGGGCACCGGTGGGGCCGGCGGCACCGGT
+GGGGCTGGTGGGTTGTTCGCCAGCGGCGGGGTCGGCGGTACTGGCGGGGGAGCCGGGTCCGGCGGTACCG
+GTGGGGTTGGTGGGACGGGTGGGGCCGGAGGGCTGTTCGCTAGCGGCGGCGCTGGCGGGGCCGGCGGGTC
+CGGCGGTACCGGTGGGGCTGGTGGGACGGGTGGGGCCGGCGGGCTGTTCGGAGCCGGTGGCGCTGGCGGG
+CTCGGCGGGCAAGGCAACCACACCGGCGGGCACGGTGGGGCCGGTGGCAGCGCCGGCCTGCTCGCCCTTG
+GCGACGGCGGCGCTGGCGGGGCCGGCGGGGCCGCTACCACCGGAACCGGCGGGGCCGGCGGGGCGGGTGG
+CAAGGCCGGCCTGCTGTTCGGCTCCGGTGGGGCCGGTGGGTCCGGTGGGGCTGCCGGCACCTTCGGTGAC
+ACCGGTAACTCCGGCGGGGCCGGTGGGGCGGGTGGCAAGGCCGGCCTGCTGTTCGGCTCCGGTGGGGCCG
+GTGGGTCCGGCGGCGCTGGGGGCTTCGCCAACGGCTCTACCGGCGGTGCCGGCGGGGCCGGCGGCGGGGC
+CGGGCTGATCGGCAACGGCGGCAACGGTGGCAGCGGCGGCACGTCGGTTGCCACCGGGGGGGCCGGGAAC
+GGCGGTGCCGGCGGCGCCGGCGGCGGGGCCGGGCTGATCGGCAACGGCGGCAACGGCGGCAGTGGCGGAA
+TGGGCGATGCCCCGGGCGGCACCGGCGTCGGCGGCATCGGTGGGCTGTTGTTGGGTTTGGACGGCGCCAA
+CGCCCCGGCCAGCACCAACCCGCTGCACACCGCGCAGCAGCAGGCGTTGGCCGCAGTCAACGCGCCCATC
+CAGGCCGTGACCGGGCGCCCGCTGATCGGCAACGGCGCCAACGGCGCCCCGGGCAGCGGGGCCCCCGGCG
+GGCACGGCGGGTGGTTGTTCGGCGGCGGAGGGACCGGCGGGTCCGGCGTCAGCGGCGGGGCGGGCGGAGA
+TGGCGGGGCCGGCGGGATCTTGTTCGGCGCCGGCGGGGCCGGCGGCGCGGGCGGGGCCGTCACGGGAACC
+GGCGCCACCGGCGGGTCCGGTGGGGCCGGCGGTGGAGCCTTGCTGTTTGGGGCCGGTGGGGCCGGTGGAG
+CCGGCGGGTCCAGCGGGATTGGCGGGTTCGCCGCGGGCGGGGCCGGTGGGCCCGGAGGGGCCGGTGGGCT
+GTTCAACGGCGGCGGGGCCGGCGGGGCCGGCGGGTCCGGCGTCAGCGGCGGGGCTGGCGGGGAGGGCGGG
+GCCGGCGGGGCCGGTGGCCTGTTCGCCGGTGGCGGGATCGGCGGGGCCGGCGGATTCGGCGGATTCCGCG
+GCGGGGAGGGCGGGGCCGGCGGGGCCGGTGGCCTGTTCGCCGGTGGCGGGGCCGGCGGGGCCGGCGGATC
+GGGCAACAACGTCGGGGGGGCCGGCGGGGCCGGTGGGGTCGGTGGGCTGTTCGGGGCCGGCGGGGCCGGC
+GGATCCGGCGGCGGCGGTAGCGTTGCTGGCGACGGTGGGGCCGGCGGCAACGCGGGCTTGCTCGCCCCCG
+GTCTCGCCGGCGGTGCCGGCGGTGGCGGCGGGCAGGGTTTTGACACCGGCGGGGCCGGCGGGCCCGGCGG
+CGACGCCGGCCTGCTGGTCGGCTCCGGCGGGGTCGGAGGTGCCGGCGGATTCGGCCTCACTACGGGTGGG
+CCTGGGGCGGCCGGCGGCGACGCCGGCCTGCTGTTCGGCTCCGGCGGCGCTGGCGGGGCCGGCGGCTCCG
+GCCGAACCGACCTCGGCGGCGCTGGCGGGGCCGGCGGCAAGGCCGGGCTGATCGGCAACGGCGGTAACGG
+CGGGGCCGGCGGGGCCGGCGGGGCCGGCGGGCCCGGTGGAGCCGCCTTCGGGCTCGGTAACGGCGGCAAC
+GGCGGCAACGGGGGGACCGGCACGTCCGCGGGCAGCCCCGGTGCCGGCGGCGCCGGTGGTTCGCTGATCG
+GCGCGGAGGGGCTGCCCGGGCTGCTGCCCTAGCCGGCCCGGTTGGACCACGTGATCGACGACCGTCACAA
+GTCGACACGCCGAACGTGCAACCACGGCGGCATCACCTGGCGTGTCGCCGCCACCAGCGCACGCTCGGCA
+CGGAGTTTAGCAACTACTCATCCAGAAGCCGGCCACTACGGCCTGGCCACCTGGTTTACCCGCATGGACG
+CGATGACCGCACCGACCTGAGTCGGCATTGCTGGTTGCGCTCACCCGGTTATGGCAAGCCGTTCTGTCCC
+GGCGCGCCAAACACCCCGGCCTTGCCACCGGTACCGCCGGCTCCGCCGTTGACGCCGTTGCCACCGTAGC
+CGAGGGTAGACGGGGCGAGCATGCCGTTGACAACTATCGTCGTGTCGCCGCCGTTGCCGCCGGTGTTAGC
+CCCGAAGCCGGTGCCGGCGTTGCCGCCGTTCCCACCCACGCCGACTAGTCCGAGGGCGTCGCCGCCGTTG
+CCGCCGGCGCCGCCGATGCCGATGCCCAGGATCACGGGTGAGCTCAACCCGCCACCGCCACCGGCCCCCC
+CGTTGCCGCCGGTCCCGGTGGCGGTGCCGCCAGCTCCGCCGGCGCCGCCGTGCAGCACGGAGAACCCTAG
+GAAGTTTGCGATGCCAGCGCCGGCGCCGCCGAAGCCTCCGGCTCCGCCGGTGGCGCCGTCCCCGGTGGCG
+GCACCACCAGCCCCGGCGGCGCCGCCAAAGCCTAGGCCGAGGACAGCAATGCCCTCGAAGACGCCGTCAC
+CGCCGGCTCCGCCGGTGGCGCCGCTAGTGCCGGCGCCGCCCTGCGCGCCCGCACCGCCGATGGCGATGGC
+GATCCCGAAGGGGCTGCTGGCGGTGCCCGTGCCACCCGGACCGCCGGGTCCGCCGACTCCCGTGGAAGCG
+TCGCCGCCGGCGGCTCCAGCGCCGCCCAGGGCAAAGATCAGGCCGCGGGCGCTGCCGCCAGCACCGCCGA
+ACCCGCCGGTTCCGCTGGTGGCGTCCCCGCCGGCCGCGCCGGCCCCGCCGACGGCCGCGAGTGCGCCGGT
+AGCGCTGCCGCCGTTGCCGCCGTTGGCGCCGTTAACCCCGACTCCGGTGCCGGCGTTGCCGCCGTTGCCA
+CCTGCGCCGACGAATCCGAAGCCGTCACCGCCGGCACCGCCGCTGCCGCCGGTACCAACCGAAGCCCCGC
+CGCCGTGCCCACCGGCGCCGCCCACGCCGCCCAGCAGCCCGGTCCCGCTGCCTCCGGCGCCGCCGTTGCC
+GCCGGTGTCGGTGGCGGCTCCGCCAACCCCCCCGACGCCGCCGATGCCGGCGCCGATCAATCCGAGGGCA
+TCGCCGCCGGTCCCGCCATGGCCGCCGCTACCAGCCGAAGCGGCGCCGCCGGGACCGCCGGCGCCGCCGG
+CGCCGCCCAGCAGCCCGACGCCCAATCCGCCGGCGCCGCCGATGCCGCCGGTCTCGGTGGCGGCCCCGCC
+AGCCCCGCCGGCGCCGCCGACGCCCACGCCCAGAGCCGCGAAGCCGCCGGCACCAACGCCACCGGTCCCG
+CCGGTGCCGCCGGCACCGGTCGCAGCCCCACCAAGCCCGCCGGCCCCGCCGTAGGCCGCGCCGAACCCGA
+TGAAGTCGGGGGCAACAGCGAAGCCGCCAGTGCCGCCGGCCCCGCCGGTCCCAGTGGTAGCTGCGCCACC
+ATTGCCGCCAGCACCGCCCCAGCTCAAGTCGAGCGCGAAAACGGTGCCCGAGGAACCGCCGGCACCGCCG
+GCGCCGCCGGCACCGCCGTTAGTACCTGCGCCGCCGTGCCCGCCGGCACCGCCGATGCCGATGTCGATCC
+CGAAGGGGCTGGCGGCGCCACCAGAGCCACCGGCACCGCCGGCACCGCCGCTTCCCATGGCCGAGTCGCC
+GCCCTGACCGCCGGACCCGCCCAGGCCAAGGAACAGCCCCAATGCGTTGCTGCCGGCGCCGCCGGCACCG
+CCGGTTCCAGTGGTAGCGGCCCCGCCGGCGCCACCGGCGCCACCGATGGCTACCAGTGCGCCGCCGGCTC
+CACCGGCGCCGCCGACCCCGCCGTTCCCGACTCCGCTGGCGGCCCCGCCAGCTCCGCCGTTGCCGCCAAT
+GCCGAACATCAGCGCGTTGCCACCCGCCCCACCGGACCCGCCGCCGGACCCGCCGGCCCCGCCAGCTCCG
+CCGCTACCCCACAGCCACCCGCCGGTGCCGCCTTTGCCACCCGAGGCGCCGGTGCCTCCGGCCCCACCGG
+TCCCGCCATGGCCCAGCAGCCCGGCGGCACCCCCGGCACCCCCGGTCTGCCCCGGAGCACCCGAACCGCC
+GTTGCCGCCGTTGCCCAACAACCAGCCTCCAGGCCCACCGGCCTCCCCGGTCCCCGGGGCGCCGTTGGTG
+CCGTTGCCGATAAAAGGTCGGCCCGACAACGCGGCGGCGGGTGCATTGATGGCGCCTAGCAAGCCCTGCT
+CGAGGGTCTGCAACGGCGACGCGTTGGCCGCTTCGGCGGCCGCATAGGCGCCCATAGCCCCGGCCAGTGC
+CTGCACAAACCGGGCATGAAACGCCGCCGCCTGCGCGCTCATCGCCTGATACTGCTGACCGTGGCTGGAA
+AACAACGCCGCGATGGCCGCCGACACCTCATCGCCAGCAGCGGCCAACAGCCCGCTTGTCGGGACGGCGG
+CCGCCGCATTGGCAGCGGTCAGGGACGCGCCGATGCCTGCAAGATCCTCCGTGGCCATCGCCACCAAGTC
+CGGCGCTGCAATCACGAAAGACATCCGACACCTCCCAGCTGGCCGGTGTGATCTGACTGTCGCCCATCGT
+TACGATACGCGCATATAGCGCCTACCGGGAGACGAAGTTGACACTCGTCAACATCCGATGGCCGCCGGAG
+ATCCGGCACGGCTCGGCGGTCGTTTGGGCGGGCGTTGGCCCCGCACGTTCGACAGATTCGACAAGTTCGT
+GCGCCTCGCGCAACGAGACAACCGGCGACGCCGCCTAAGGTCAAGGGCGGCGTGCGTTAGCACTTCCGTC
+ACTCTTGTCAATTAGCCGCAGCAAACGCCAGTCGCCCGTACGATGGCGGCAACGGCGTCGGCGGAGCGGT
+TTCCCGCTTGGCCAACGCCGAAGTCCCAGCATGACCGATCGCGGACGCCAGTCCGCAGAAGCCGGCTTAT
+CGACAATGAGGCCAAAGAGCTCAACCCGTCAGCGGACATGTGGCGCGCGCTGGCCAGTGTGGCGATCAGT
+CGTGTGTTGCTCCACTGCTGCCAAGTCGGCCGTCATCGTCTGCTGTGCGGCCATCGCGACCACGGCATGC
+TCGTTTCAAGCCACATCGACCCAGCCGAGCACCGCACCCCCGACATCGCGGGTCGATTCGTTGATCGTCA
+GCATCGAAGACGTACGGCGCATCGCCAACTACGAGGAGCTCGCCGCACATTTTCAGACCGACTTGCGTGA
+ACCGCCGGAGGCGGACACGAACGTTCCGGGCCCCTGTCGTGTGGTGGGCAGCAGTGATCGCACCTTCGGA
+ACCGACTGGTCAGAGTTCCGTAGCGCGGGTTACCACGGCGTTACCGACGACCTCAGACCGGGCGGGCCGG
+TCATGGTCGAGACGGTTAGCCAGGCGATAGCGCTGTACCCGGACCCGAGTACGGCGCGCGGTGTGTTCCA
+TCGGCTCGAGTCGTCGCTGGCAGAATGTGCTGGCTTGCATGACCCCTACTTCGATTTCATCCTCGGCAGG
+CCGGACGCCTCCACCGTGAGGATCGGCGCTGCGGGTTGGAGTCATGTGTATCGCCTGAAATCGTCGGTAT
+TCATATCCGTTGGCGTGTTGGGTATTGAACCGGCAGAGCCGATCGCCAACGTCATCTTGCAGACGATCAG
+CGATCGCATCCAGTAGTTAGCCGAGGACTGGAAAGCAGCAGCGGCGGCGACGAGCGCAGCGTGTTGAGGG
+CTGTTGACGCCACGACGCCCACCGTTGCGAAGAAGAAGGCGAGAAGCGTCGCTTCGGCACCGACTGCTGT
+CACCGCAACCGAGCTGTAACTACGGGGATCTATTGGATGCGAGGCGTAATCAAGCAGCGTGGCGATGGGT
+CTGGTGTCCACCGCAAAGGAGAAGACATGCCATATGGGGGAAAGCTTGACCCACGAGAGCGCTGTCCCGA
+ACAACTCGGTGCCTGTCAGAAGGATCAGCGCACTGGCCGCTATCCAGGCCGTCAGGCGTGCCGGGGATAT
+CACGACGCCGAATGTCTTTCGTTGGTTATCCCAGACTGTCGAGCGACGTTGTTTTTGCACTGAACGTCGA
+ATCTTCTGAGACTGCCGCCGCTTTCGCCGGCGCCAAGTCTCGGGCTTACTTAACCAGGCGAGCCGCCACC
+GTACGACAGTCGCAGTCGCTAAGACTTGCTGCTGCATCCAACTCGTGGCGGCCTTCATTGATCCCGACTA
+CCACCCTGCCTAACCAATTCTGTATGACGCGCCGTTTGAGAACGTACATTTGTGATTGCGGTTCGCATTT
+AGGAGCCCGGCGTGAGCTGGTCGAGTAACGCCTCGACCAGAGGGCGCCGCGAAGCTGTGGTGGTGGGCCA
+GCCCGGTCGACCCACGGCGAAGTGCTGGGCCAGCAGGTCGTGGTCGGCCTGTGTGGCGCGCGTCGCCAGC
+ACGGCGGCCTCCGGTGCGCTGACACTGGCGCGCATGTCGTGGCCGAGCAGCGCGGCAGCGGCGGTGCGTA
+GGTCGAAGTCGTGACGGCGTAGCGCCCACTGGTCTGGTTTGGCGTAAAGCCGGTCGAGGTCGCCGGCGTA
+CCAGTGCACCACCAAGGCCAGATCTGGGCCGTCTTTGTAGTCGTGGTCCGCGGACCGATCGAGCCATGCG
+TGCAGTTTGAGGACCGCATAGTTCGGCGGTTGGGGAAGGTGGACTGTCAGGCCGCCAGGGAGAGGCAGAA
+CATCGGCACGCAGGTAGGCGTCGGTGCATCCGTGGACGTTCATGAGCTGGTTGCCTGGGGGATGGCGGGT
+TGTGCCGGTGGGCGACTCCACCTCGCCGAACGGGAGGGCATCGACGGCGCGGTCGGCGATCAGGAATCGG
+TGCCCGGTGCTGCCCAGGGCGCGGAAGGTGGCCCGAATTGCCTCGAAGTGGTCCCAATTGTTCAGGGTCC
+CTGCGATATCGGTGTCGTTGGTGGCCCGCGGCGGCACCCCGCGGCAGAAGCGCCAGTGCAGTAGATCGCG
+GCACTGTGCCCCGACGAGCATCAGCTGTTCAGCCGGCACGACGTCGGCAAGTGCTGTGACGATCGGTGTC
+ACCCAGGCCAGGAGGACCGGGTCATAATCGGGCGAGTCGCTCATCCTGCCTTCTCATGAGGTGGGCGACT
+TCGACCTGGCGCGGCTCGCGCGAGGCAAGGAGGTCGGCATAGATCAAGGCCGTGGGAGCCAACCCCGGTT
+GCTCGTCAGGTAGGTTGCGCCAGAATAGCTTTCGGATCACGATGCTGCCGTGTGGGTCGCGGTGCCAGCG
+GTTGTGTATAAGCAGGTCGGCGGGTAGCCCGGGCGCTGGGGTGTCGACGTAGAGCATCAGTGATTCGGGA
+TTGCGGATTTCGTCGGGCAGGGCCTGTTCCCCGCTGACCGCCACTGCGAGTCCGTCGGGTGCGGACCACG
+TGTGGATATCACCACTGGCGACCAGGAGTTTGTTGGCCCGGCCCAGACCCCCCGGATAGGCAGCCGCCCA
+CAGGTCCAGCAGCTCATCGGTGCGCACCAGCCTGCGGCGGGAGCCGAGGTGTTCGAAGAAGCCGGTAGTG
+CGCAACGTATCCATCGTCTCCTTGGCCATACCGACCGAGACGCCGGCGCTCGCGGCGATCGCACGCAGCG
+GCGCGTCGACCAGTTGCGGTGCGTCAAGCAGTACGCAGACAACCTGCGCGCGCTTGGGGGTAAACGGGTT
+ACGCGGTCCATCGCTGTGCAGTCCGTCACCGAGGGTGCCCGGTTGTGCGGACACAGCTGACCGTCGGCCG
+CGCACGTCGATGAGCAGTCCACCCTGGTGCCGCAAATAAGCGTTCCCAGCTCCGTCGATGTACCAGAGTC
+CGCGAGCCCGCAGCGTTTCAGCGCTCGACGGATGCAGACGCGGGCCCACCACAAGCAGCGGCGAACCAGC
+GCCGGCGGTATCCCAGGCCTGCAGTGCTGCCGTTGCCGACAGGTGAGGAAGGTAGAGGGCAGTGATCGTG
+AGGGGGTGAGCGTCGATCTCAAGGTCTAGTGATTCGGGATGCGCGGAGTTCAATGCTGATAGGCCACCGA
+GCACCCGCACTCCGTATTCGGTGAGGTGACGCTCGACGGCCTCAGCGAGGTCAGCCCCGATCTGATCCAT
+GCGTTCAGTATATCCGTACGTTCAGTTTTATTGAACATAATGATTTATTGAACATATCAGGTCGGAGCTG
+GTCGACTTGGAAGGTGTAGCGGTATCCGAGTCGCACTCACTGCCTCCTGCCATGACTCACCCCAAGGGTG
+CAGGTTGTGCGGCAGTCTGATGAGTTGCCGCAGCATCGTTGCCGCGGCCTCCTCGTTGGCTATCTGAAAC
+CTCGTCTGCAGTCGAGGGGTGGTCAGCACGCGCCGGGCCAGACGGACTGGTCTACTGCGCCAAAGCTTGT
+CGCTGCGCTTGGAGGTCAGGCCGAGCAGGCGCGAGGAACGACGAACCCAACAAGCCATGGTGGTTGGCGC
+CGTCGAGAGGTCGGCGGTCGCCACAACGGGAAGATCGCCTTGAGCGTCGCTCGACCGCCGCCTCGAGTTG
+GGTCATAACGAAGTAGCTGATGCCGATCATGTCGACGTTTCCGTCGCATCAGCGTGCAGCGGCGACCCAC
+TCGACGAGGTCTCGGTGCCGCCGCGGCCAGGGCACCAGCAGTGACGAGTCCAGGCGCCGTCGGGCCAAGC
+AGTCGCGGTGCCAGCCGTGTTGGGTCGGGCGATGGTTGGGTGTGCTCATTTCGGGAACGCCAGGGCGATC
+AGCGTCGGCAAACTCGCGTCGATGTGCCCGCGGCGCAACAATCCGCGACAATGATCGGGTGCGTCTGATC
+GGGCGGCTCCGTCTGCTCATGGTGGGGCTGGTCGTCATCTGCGGGGCTTGCGCATGTGACCGCGTGTCGG
+CCGGCCGTTGGTCCGAGTCGCCGAGTGCGACCTCGTGGCCCGTCCGGCCGGTAAACACCACAACGCCATC
+CGGTCCTGTGCCGCCAGTCAGCGAGGCGGCGCGGGCAGCCGGGTTGGTCGATGTTCGCGGTGTTGTTCCC
+GATGCCGCCATCGACCTGCGCTACGCGACGGCGAACAATTTCACCGGCACACAGCTGTACCCGCCCGGGG
+CAAGATGCCTGGTGCACGAGTCCATGGCCGAGGGTCTCGCGGCCGCCGCGGCGGTGCTGCGCCCACACGG
+GCAGGTGCTGGTCTTCTGGGACTGCTATCGGCCCCACGACGTTCAGGTCAGGATGTTCGATGTGGTCCCC
+AACCCGGCCTGGGTGGCGCGGCCGGGCAAGTACGCGCATAGCCATGAGGCGGGGCGTTCGGTCGATGTGA
+CGTTTGCCAGCGCTCAGCGGCAGTGCCCATCAGTGCGGCGATCCGGCGAATTGTGCCTGGCCGACATGGG
+CACCGACTTCGACGACTTTTCTTCGCGGGCGACAGCGTTTGCAACGCAGGGCGTCAGTGCTGAGGCCCAG
+GCCAACCGTGCCCACCTGCGAGCCGCCATGCAGGCCGGGGGGTTGACGGTGTACTCCGGTGAGTGGTGGC
+ATTTCGACGGCCCCGGCCCCGGCGCCGGCGTCGATCGCCCGATTCTCGAAGTGCCAGTTGACTGACGTCT
+CATATAGTGAAATAAATGTCCACTATTTGGGCGCAGTGGCGGTAGGCTTTGAGCCGAACACCTCGACCAT
+GGGACCGCACGGTGAACGACAAACGTCGGGCGATTTATACGCACGGATATCACGAGTCGGTGCTGCGCAG
+TCACCGGCGACGCACTGCGGAAAACTCCGCCGGCTACCTGCTGCCCTACTTGGTGCCGGGGTTGTCGGTG
+CTCGACGTCGGTTGCGGCCCCGGGACGATCACCGTCGACCTCGCCGCTCGGGTCGTGCCGGGATCCGTGA
+CCGGCGTCGAGCCAACCGATGACGCCTTAAGCCTGGCCCGCGCCGAGGCCCAGCTGCACCGCCTGTCAAA
+CATTTCGTTCACCACTTCCGACGTGCATAAGCTCGACTTCCCTGACGACGCGTTCGATGTCGTCCACGCA
+CACCAGGTGCTGCAGCACGTCGCCGATCCGGTACGGGCACTACAGGAGATGAGGCGGGTGTGTACACCAG
+GCGGCATCGTCGCAGCTCGCGATGCCGACTATTCGGGGTTCATCTGGTTCCCGAAGCTTCCGGCGCTGGA
+CCGGTGGTTGGACCTTTATGAACGGGCGGCTCGAGCCAACGGCGGCGAACCGGATGCCGGCCGGCGGCTG
+CTGTCCTGGGCCCGTGCGGCAGGATTCGACGACGTCACGCCGACGGCCAGTGTCTGGTGTTTCGCGACGG
+CCTCGGCCCGCGAATGGTGGGGCCTAGTGTGGGCCGACCGGATTCTGCAATCCGATCTGGCTCACCAGCT
+GGTGGATTCGGGTCTGGCCACTGCCGCGCAACTCGAGGAGATCTCCACGGCGTGGCGAGAGTGGGCCGCG
+GCCCCGGACGGTTGGCTGGCGATACCCCACGGTGAAATCCTTTGCCGGGCATAAACTCAGGCACACGCGC
+GAGGCTCGCGCGGTTGGTTGCCGACGACGGGCAGGACGTGGCCCGGCGAGATCAAATATCGTGCAGCCGA
+AGGAATTCACGCATCACCCGGTCGAATCGCGCCGGCTCTTCGATGAACGGCATGTGGGAACTGGACTCGA
+AGAATTCCAATCGCGAGCCCGCAATCCGGCCCTGCATTTCTCGCATGTGCTCAGGCGAACATTCGTCGAA
+ACGGCCCACCACCAGCAAGGTCGGCACCGCGATGTCGGCCAACCGGTCGACGACGTCCCAGTCTCGAACA
+TTCCCAACGATGCGAAAGTCGCTGGGCCCAAACATCGTCTCGAAGATCTCGGTTCCCATGTTGGCGAATG
+CTTCCGTGAGTTCCCGGGGCCAGGGGCGGGTGCGGCACAGATAAGTCTCGTTCCAGGTTCTGATCGCGGC
+CTGGTATTCGGCGGAATGGGTGGTGCCGGCCGCCTCGTGACGGTCAATTGCCGAGCGAGTTGCCACGTCC
+AAGCACGACTTCAAGCTGACCAGACTGGCCGAAAATTCGGGTATCGAAGCCGTGCTGTTCGCGATGGTCA
+GACTGACGGCGTCAGGCGCCTTGTCGAGCACGTACTGCTGTGCCAGCATCCCACCCCACGAATGGCTGAA
+GATGTGAAAGCGGGTAAGGGCAAGGGCTTCCGCCACGGTTGCCATCTCGGCCACTGAGCGGTTCATCGTC
+CAAAGGTCTACGTCTGACGGACATGCGGAATTTCCGCAACCGAGCTGGTCCCAGAAGATGACCTCCCGCT
+CATCAGACAACCGTCGCAGTGGGGCCAAGTAGTTGTGCGGCAAGCCCGGCCCACCGTGCACTACAAGCAG
+CGGACGACCAGGACCGCCACCAATCCGCTGGAACCAGACGCGTCCACCCGGGACCGCGATTGTCCCCTCC
+ACTTGACCTCCGATTTCGGTTGACCAACAGACGCAGAATCGCACATTCGCCCCTTCGGGGGAGTGCGAGT
+TTGCGTCGCCTCGCCGGGCATGTCGGTCAGCGATGGCGCGGTCGAGACCAGACGGCCCGAGGCGGTTTGG
+GTGGATCGACAGTATCGGTCGCGCAGTTACCGGCGGACTCGGCTTCTGCTGGCCGGCCGGTCGGGTGTGC
+CCGTGCATACCGCTCTCGGCTTCACCGTGGCTGTGGCCGTGTGCACACCGGGTGAGACGCCCGGTTCGTG
+GTTGCGGCCAGCATCGTGCACCACAGCGCTGCGCCGGCCAACCGCGGTCGCTACCACGGAATCTGGTCGA
+TGACCCCTGTATTTGCTTCGGTGGTTGTGCCAATCATGGCTTCCTACGGCCCGATTCATGGTGCTCATCT
+CTTGGCCGCGGTGGTCGTGGGGTCGGCCGGTGCCGCGCTGTGCCTGCCGTTGGCGCGGGCCCTGCGCCGA
+CCGACCCCCAGTGCAATGACGACGGATTGACGGTGCGGAGCCCGGGGATGTGCTGAGGGCACCAATGTGG
+TGAAAGTTGCACGCAAGCAGCACAATCGGAGCCCAGAATGGGCACTGGGCGCAGAACCCGAGCCGCAGAA
+GTAATGTGCTGGAGGGGTTACTGCAGCAACCACACCCCCGGGTGTCCTCCGATCGGGGGAAGGGGCTTTC
+GTCATCGTTTCAGGCCGATCGGAGGACGCCGGCACAGGTCAACGATCCTAACTTGAGTTAGTGACCACAG
+CGGCGGCCATCGCCCGCGAGGACCGGTTGCGTTACACCGGTCCGGAGCGCTGCTCGGGGGACGGACAAGT
+TCGAGCGGCCGGGGATCGCTATTCGACGGTGATCTGGCTGCTGGGCGGCAACTTGCTGGTGCGCTCGGCC
+GGATTCGGCTATCCGTTCCTGGCCTACCACGTGGCTGGACGAGGACATGGTGCGGGAGCGGTCGGCGCGG
+TCGTGGCGGCCTACGGCCTGGGTTGGGCGGTGGGGCAGCTGCTGTGTGGGTGGTTGGTGGACCGTGTCGG
+GGCGCGGGTGACGCTGGTATCCACCATGCTGGTGGCCGCCGCCGTGCTGGTGCTGATGGCCGGGCTACAC
+ACCGTGCCGGGATTGCTGGTTGGGGCCATGATCGCCGGCCTGGTTTGCGATGCCCCGCGTCCGGTGTTGG
+GTGCGGTGATCGCGGAGTTGGTTGCCGACCCACAGCGGCGGGCACAACTCGACGGCTGGCGATACGGTTG
+GGTGCTCAATATCGGTGCTGCGATCACCGGCGGGGTCGGCGGTGTGGTCGCGGGCTGGTTGGACACCCCG
+GTGTTGTACTGGATCAATGGCATCGGGTGTGCGATCTTCGCGGGGTTGGCAGGCCGCTGTATACCTGCCG
+ATGTGTGCCGTAGGACCGAGTCCGGCCTTCGAGCTTGCACCGCCATGTCGAAAGTTGGCTATCGGCAGGC
+ACTCTCGGACAAGCGCCTGGTCCTGTTGGCCGTCTCGGGTCTGGCAACGCTCACGACGCTGATGGGTTTC
+TTCGCGGCGGTACCGATGCTGATGAGCGCGAGTGGACTGGGTGTCGGGGCGTACGGCTGGGTGCAGTTGA
+TCAACGCCCTAGCGGTTGTCGCGGTGACCCCGCTGTTGACGCCGTGGCTGAGCAAGCAGCTCGCACTTGG
+TCCACGGCCAGACATTCTGGCCGGCGCGGGAGTGTGGGTGACTCTTTGTATGGCGGCTGCCGGGCTCGCC
+CGCACCACGGTCGGTTTCAGTGTGGCCGCGGCTGCCTGCTCGCCGGGCGAGATTGCCTGGTTCGTGGTTG
+CCGCCGGCATCGTGCACCGGATCGCCCCTCCCGCGCACGGTGGGCGCTACCACGGGATCTGGTCGATGGC
+CGTCGCGGCGTCGTCGGTGGCCGCGCCTATCCTGGCTGCTTTCAACCTGGCTAATGGTGGGCGCCTAGTG
+CTGGCGGCCACCACGGTGACGGTTGGTTTCTTCGGGGCCGCTTTGTGCTTGCCGCTGGCTCGTGTTCTGG
+CAGCTGCCAGTTGCGGTCCGTTGAGCAGCAAGGAGCCGTCGCGTGACTCGTACCAGTGAAGGGTTGGCTG
+CGTTCGTGGTCGATCAGCTGGAGGAGCTGTATCGCCGGATGTGGGTGTTGCGACTGCTCGATATGGCGTT
+GGAGCAGTTGCGCATCGAAGGCCTGATCAACGGGCCGCTGCAGGGTGGCTTCGGCCAGGAAGCAGTAAGT
+GTCGGTGCCGCGGCGGCGCTGGGCGAAGGCGATGTCATCATCACCACCCATCGTCCGCATGCCCAACACG
+TTGGTACTGACGCTCCGCTGGGCCCGGTGATCGCCGACATGCTGGGTGCGACCGCAGGCGATCTAGAAGG
+CGCTGACGAGGATGCGCACATTGCCGATCCTCGGGCCGGGCTACCGGCTGCAATACGCGTGGTCAAGCAA
+TCGCCGCTGTTGGCTATCGGACACGCCTACGCCCTGTGGCTGCGCGACACCGGACGGGTCACACTCTGCG
+TGACCCAAGACTGTGATGTTGATGCCGATGCCTTCAACGAGGCCGCGGACCTAGCGGCCGTGTGGCAACT
+TCCGGTGGTGATTCTCGTCGAAAACATTCGTGGTGCCCTAAGTGTGCACCTGGGCAGGTACACGCACGAG
+CCTCGGGTTTATCGCCGGGCTGTGGCCTACGGAATGCCGGGGGTATCGGTGGACGGCAACGACGTCGAAG
+CGGTCCGTGACTGTGTGGCCAACGCGGTGGTTCGGGCTCGCGCTGGTGGCGGCCCCACGCTGGTCCAAGC
+CATCACCTACCGCACCACCGATTTCTCTGGATCTGACCGCGGCGGCTATCGCGACCTGGCCGGATCCGAG
+CAGTTTCTGGATCCGCTGATCTTCGCGAGAAGGCGGCTGATTGCTGCTGGCACGACCCGCGGTCGGCTCG
+ACGAGCAGGAGCGGGCGGCATGCCAACAGGTGGCCGATGCCGTGGCGTTCGCCAAGGACAGGGCGCGGCC
+CAACGGCGGTGGGCCAATCAGCCGACCAACATCCGGCTGGCACCAACAACCAAAGACCCGGTTCTGAGGC
+CTAGATGTACGTTGGCCGCGGACAACGCGGTCGGTACATGCCGTCGCGCCGCGGCCCCAGCTAGTCGAGC
+AGCCTCTGCCGCATCGCCTCGGCGACCGCGGCAGCTCGGTCGCTGACGCCGAGCTTCTCGTACAACCGTT
+GCACGTGGGTCTTTACCGTCGACGGCGCCACATATAGCTCGGCTGCGATCGCGGGGATGCTTTGACCGCA
+CGCAATGCGATTGAGCACCTCGCGCTCGCGCGCGCTGAGCACCGGGGCCACGGGTGCCGCGCGCTGGCGA
+ATCTCCCCGGCGAGGCCCCCGACCAGCGAGGGCGCCACCACGTCGCGGCCCTTCGCGCAATCGAGCACCG
+CCTTGACGATCTCGGTGCGAGTCGAATCCTTGAGCAGGAATCCGGCGGCGCCCTGTTGGAGTGCCTGGTA
+GACGATCGCCGGCTCGTCGTGCGCGGAAATAAGCAGCACCCGGGTTGGCAACTCGTAGCTGCGCACCGCC
+GCCGGAACCTGCGCGCCGTCCATGCCGGGCATGCGGTAGTCCAGCAATGCGACGTCGGGCAAATGGGCCT
+TGATCAACTCCAGGGCCGCGGCGCCGTCGTCGGCCTCGCCGACCACGTTCACCGAGCCACTCAACGAAAG
+CGCTCGCACAACGCCCTCGCGAAATAACGGGTGGTCGTCGCCGACCACCACGCGCACTTTCTCCGGCTGC
+GGATTGCTCATGGCGCGCCGACCATGGCGATGAGTTTAGCTGCTCGTCGGCAACCAGCCGCTGGCAGTCG
+CTGGACATTGATTTGCACTCCGACGTGCCCAGCTACGGCAACCTCGGACGTTTGGGCGGTCGCCATGAGT
+ACGGTGTCCTAGTGGCAATGACCAGCTCGGCGGAACTGGACCGGGTTCGTTGGGCGCACCAGTTGCGCTC
+CTACCGAATTGCTTCGGTATTGCGGATCGGTGTCGTGGGGCTCATGGTCGCCGCGATGGTCGTTGGAACC
+AGCCGGTCCGAATGGCCACAGCAAATCGTGTTGATCGGCGTCTACGCGGTCGCTGCATTGTGGGCTCTGC
+TGTTAGCGTATTCGGCGTCCCGGCGATTCTTCGCTTTGCGACGCTTTCGCAGTATGGGCCGGTTGGAGCC
+ATTTGCTTTCACCGCCGTCGACGTTTTGATATTGACGGGCTTTCAGCTGCTGTCCACCGACGGGATCTAT
+CCGCTGCTGATCATGATCCTGCTGCCGGTCCTGGTGGGCCTTGACGTGTCGACGCGACGGGCGGCGGTGG
+TGCTGGCCTGTACGCTAGTCGGATTCGCAGTCGCGGTGCTGGGAGACCCCGTGATGCTGCGCGCGATTGG
+ATGGCCCGAGACAATATTTCGGTTCGCGCTCTATGCGTTCCTGTGCGCCACGGCCTTGATGGTGGTTCGC
+ATCGAGGAGCGGCATACCCGTTCGGTTGCCGGCCTGAGTGCGTTGCGGGAGGAACTGCTTGCCCAGACGA
+TGACGGCCTCGGAGGTGCTGCAGCGGCGGATTGCGGAAGCCATTCACGATGGACCGCTGCAAGACGTGCT
+GGCCGCGCGTCAGGAGCTCATCGAGTTGGATGCCGTAACCCCCGGCGACGAGCGCGTCGGACGCGCGTTG
+GCCGGACTGCAGAGCGCGTCGGAGCGGCTGCGGCAGGCCACCTTCGAGCTGCATCCGGCAGTGCTTGAGC
+AAGTTGGGTTGGGGCCGGCGGTAAAACAGTTGGCGGCCTCTACCGCTCAGCGTTCGGGTATCAAGATCTC
+CACCGATATTGATTACCCAATACGTAGTGGGATCGACCCCATCGTTTTCGGTGTGGTTCGCGAACTGCTG
+TCCAACGTCGTGCGGCATTCCGGAGCTACCACCGCCTCGGTCAGGCTCGGAATCACCGACGAAAAATGCG
+TTTTGGATGTGGCCGACGATGGCGTGGGGGTCACCGGTGACACTATGGCGCGCCGCCTGGGTGAGGGACA
+CATCGGTCTGGCTTCGCATCGGGCTCGGGTGGATGCCGCCGGCGGAGTTTTGGTTTTCCTGGCCACCCCC
+AGGGGGACCCATGTCTGCGTGGAACTACCACTGAAACGGTGAATGGCCGTTGTTGCCGGTCAACCGATGT
+GCCGGTGGCAGCGACGTGACCCCCGCGCAGGTCGAAAGCCTTGCTGGATCGATGGTTCCGCCGGTGCCCG
+CCATGGGCCCGGCCGGTCACGCCGGCCAGTCCGCAACCGGCTGTCCAGGGCCATCTCACGGGCAACGTCC
+TGGGAGGCGCTGGCAGCGGCCCGGTTCAGCCCACAAGCCGCCTGTCACAGAATGTAGTCCAGGCGGGTCG
+CCATTCCGGCGACCTGGTGATAGTTGTTGTGGCAGTGCATCACCCACACGCCAGGATTGTCGGCGACCAG
+GACGGCGCGCATCTTCTGCTTGGGCAGCACTATCACGGTGTCCTTGCGGGCGCCGGGGCTGCCGTCGGCC
+TTGATCATCTGAAAGGTATGGCCGTGTAGGTGGATTGGGTGATACATCATGGTGGTGTTATCGAACATCA
+GGGTTGGCCGTTGGCCTAGCCGCACGTGCAGTGGATTGGTCGTGCTGTGGGGTTCCCCGTTGATTGTCCA
+GTCGTACTTGGCCATGGTGCCGCCCAAGGTGACCGGGAGGTCGTGGGTGGGTTCGGGCCGGCCCAGGTTG
+GCAGTCGTTGCGGCGGTGAACATTTCCACGGTACCCACTCGCCAGTTGAGTTCATCCGGCCGAAACTGCG
+GGTCGGGTGGGCTGCCGGCGCCGGTAGACAGCAGCGCACGCGCCAGCGCGTTCTTGCCTTCCGCGAGTGC
+GACCAGGGGAAAGACGCCGCCAGCGGCGGTCACCATGACGTCGTAGCGTTCGGCCATGCCGATCAGCAGA
+GCGTCGACTTCGGTGGGAATCACTGGGTAACCGTCGGTGTGGGTGACCGTCATCGAATGCCCGGCCAGCG
+CGATGCGGAACGCGGTGTCGGCGGCGCTGTTGATGATGCGGATCCGGATTCGCTGGCCAGGCTTGGCCTT
+AAAAGACGTGGCCGCCACGGGGATTCGCCCGTTGATCAGATAGTACGGGTAGGCGATGTCCCCTCCGTCG
+CCGCCGAGCAGGTTGCTGTCAACGCCTTCGCCTTCGGGCATACCTGTTGTGTTTTGCATGGTGGGTTTGT
+TCGGGTCGGTCAGCTCGCCGTAGAGCTGTTGCGGGGACTTCCCGATGCCGTCCGTCCAATCGTCGAGGAT
+GATGATCCATTCGGCGTCGTAGTGGCCTGGCTCAGTCGGATCGTCGACGACGACAGGCAGATATAGGCCG
+TGGTCGCCTTGAAGACCGACGTGCGGATGGGCCCAGTAGGTGCCCGGATCCGGCACGGAGAACCGGTACG
+TAAAGTCACCGCCGGGGCCGATGTTCGCAGTCGCGGGCTCGGTGCCATCCATATCGTTGCGCAGCGCGAT
+GCCGTGCCAATGCACCGACGTCGGATCACCCAGACGGTTGGTCACCGAGACGACAATCTCATCCCCGACG
+GTGGCCCGGATCAGTGGTCCGGGGATGGTGTTGCCGTAGGTCAGCGTGCTGACGATCGGCCCACCCAGGT
+CGATCCTCGCCGGCTGGGGGGTCAGCGTGGCGGTAACCGTTCGCCCACTGTGCGGCCGGGCCGCCTCGGC
+CGCGTCGATTGCAGCGGTCATCCCGGCGGCGCCGGATGCCGTGGGCTTCGAGGCGCAAGCGGCTAGCGCA
+AAGCCGCTGGCGATGCCGGCGCCGAGGAAGCCGCGCCGGCTGAACCGCCTCTTGTCGAAGGCGTTACCGC
+TCGTGGCCAGCTCGGGCATCGATCGCTCCTCGTCTGGATTTGGTCTCGCTCTTCGTACCCTGCCCAGACA
+TCGGGCAGTACGCAACGGTTGATGATCACCACGCCATCATCCGCCCTTACGCCCTACCCCTATAGGGTAT
+ATAGTGGGCCACGTGGAAAGCGGGCACGTGGTGTGGATGCGATCGGCGATTGTCGCGGTCGCGCTGGGGG
+TGACGGTAGCCGCCGTCGCCGCTGCATGCTGGCTCCCCCAGCTCCACCGTCATGTGGCTCACCCAAACCA
+CCCGTTGACGACGTCCGTAGGTAGCGAATTCGTCATCAACACCGACCACGGGCACCTGGTGGACAACTCG
+ATGCCACCGTGCCCGGAACGGCTCGCGACGGCGGTGCTGCCGCGCTCCGCCACTCCGGTGTTACTACCAG
+ACGTCGTGGCGGCTGCGCCCGGCATGACAGCCGCGCTTACCGACCCCGTCGCGCCGGCCGCGCGCGGTCC
+GCCGGCGGCGCAGGGATCCGTTCGCACCGGTCAAGACCTGTTGACCCGGTTCTGCCTGGTTCGTCGCTGA
+GGGGTCAGCGCCAGGCGGTGGTGGCCATTCGCCATCGCCGGTGACCGCTGACCCCCATCCAGTGCCGCGT
+GTGACTTCCGGCCCCGATGCAGAAGCGACGATCACTATGAACAACAACCTGCCGCTGGCAAATCCGGTAA
+ACCCAACAAGCATCACCTCCAACCCGCAGATACTCCTGGCCAACCGGGCGCACCGCACCTTGGTGAGGTC
+GCGGCAGACCCGCGACCGGTACCGCCTCCTCCCGGAGGGATATCAAGTCACTCCTGGCCGGAATCGCCAC
+CCGGGCACCATGGTTGGCAATACCCCGGTGCTTTGGATACCTGAGCTGTCGGGGACCTCAGACCCTGACC
+GTGGATTTTGGGCCAAGCTAGAAGGATTCAATCCCGGGGGTATGAAAGACCGCCCCGCGCTGTACATGGT
+CGAATGCGCGCGCGCCCGGGGCGATATCGCGCCCGGTGCCGCGATAGTCGAATCAACCAGTGGCACTCTG
+GGATTGGGCCTAGCCCTCGCTGGTAAGGTGTACCGGCACCCGGTCACCCTGGTCACCGACCCGGGGCTGG
+AACCCATCATCGCGCGCATGCTGACCGCCTACGGCGCCGGCGTCGATATGGGGACGCAGCCGCACCCGGT
+CGGCGGATGGCAACAGGCGCGCAAGGACCGGGTTGCGCAGCTGATGGCCGAATACCCCGGCGCGTGGAAT
+CCGAACCAGTACGGCAACCCCGACAACGTCGGCGCCTACCGGTCGTTGGCGCTGGAGCTGGTCGCTCAGC
+TTGGCCGGATCGATGTCCTGGTGTGCTCGGTGGGGACGGGTGGACATTCAGCAGGTGTCGCCCGAGTGCT
+ACGGGAGTTCAACCCGGACATGCGGTTGATCGGCGTGGACACCATCGGGTCCACGATCTTTGGGCAGCCC
+GCGTCGAACAGGCTGATGCGCGGGCTGGGCTCGAGTATTTATCCGCGCAATGTCGATTACCGTGCATTCG
+ACGAAGTGCACTGGGTTGCTCCCCCCGAAGCCGTCTGGGCGTGCCGCTCCCTGGCCGCAACCCACTACGC
+CAGCGGCGGCTGGAGCGTCGGGGCGGTCGCCCTGGTAGCCGGCTGGGCAGCACGCAACTTGCCGGCGGAC
+ACCACGATTGCCGCGGTCTTTCCCGACGGCCCACAACGCTACTTCGACACCATCTACAACGACGCGTACT
+GCAACGAACACGAACTGCTAGGCGGACAACCTCCCACCGAGCCCGACGAGATTGCCTCGCCGCTAGACGC
+CGTCGTCACCCGATGGACACGCAGCACCACGGTGATCGATCCAACCCAGGTGGTGTCGTAATGGGAGCGC
+GCGCTATATTCCGCGGGTTCAACCGCCCGAGCCGGGTGTTGATGATCAACCAGTTCGGCATCAACATCGG
+CTTCTACATGCTGATGCCGTACCTGGCCGACTACCTAGCCGGGCCACTGGGGCTAGCCGCGTGGGCGGTG
+GGTCTGGTGATGGGCGTGCGCAATTTCTCCCAGCAGGGCATGTTCTTCGTGGGTGGCACGCTGGCCGATC
+GGTTCGGCTACAAGCCACTGATCATCGCCGGATGTCTGATCCGCACCGGCGGGTTTGCCTTGCTGGTGGT
+CGCCCAGTCGCTGCCCAGTGTGCTGATCGCCGCGGCTGCCACGGGCTTTGCCGGCGCGCTGTTCAATCCC
+GCGGTGCGCGGCTATCTCGCGGCCGAAGCCGGGGAACGCAAGATCGAAGCGTTCGCGATGTTCAACGTCT
+TCTACCAGTCGGGGATCCTGCTCGGCCCGCTGGTTGGATTAGTATTGCTGGCGCTGGATTTCCGGATCAC
+GGTGCTGGCCGCCGCCGGTGTGTTCGGCCTACTCACCGTCGCGCAGCTGGTCGCACTGCCCCAACACCGG
+GCCGACTCGGAGCGCGAAAAAACATCGATCCTGCAGGACTGGCGGGTCGTCGTTCGCAACCGTCCGTTTC
+TGACGTTAGCCGCCGCCATGACCGGATGCTATGCGCTGTCGTTCCAGATCTATCTGGCTCTGCCCATGCA
+GGCGTCGATCCTCATGCCACGCAACCAATATCTCTTGATTGCGGCGATGTTCGCGGTATCGGGTCTGGTC
+GCCGTCGGCGGGCAGCTGCGCATCACCCGCTGGTTCGCCGTCAGATGGGGGGCCGAGCGCAGCCTGGTAG
+TCGGCGCGACGATTTTGGCGGCCTCGTTCATCCCGGTTGCAGTCATCCCAAACGGCCAGCGGTTCGGCGT
+CGCCGTTGCGGTCATGGCATTGGTGCTGTCGGCGAGTCTGCTGGCGGTTGCCTCGGCAGCGTTGTTTCCT
+TTCGAAATGCGTGCCGTGGTCGCACTGTCGGGCGACCGGCTGGTGGCGACCCACTACGGGTTCTACAGCA
+CCATCGTGGGCGTCGGAGTCCTCGTCGGAAATCTGGCGATCGGATCGCTCATGAGCGCCGCGCGCCGCTT
+AAATACCGATGAAATTGTTTGGGGCGGATTGATTCTGGTGGGCATCGTTGCGGTGGCCGGGCTCCGTCGG
+TTGGACACATTTACCTCGGGTTCCCAGAACATGACCGGCCGGTGGGCTGCACCCCGGTGACCCGCGATCC
+ACACAGCCCGGACTGCGGGCGCGAGGGCAGCTACCGCGACACCATCACCCGCCCGTTGACCGACCTACCG
+GTGGCCGGCTATCCGTTGGTGCCGCGGGTCGCGTCGCCCCGCTACCGGTGCACAACGCCGCAGTGCGGGC
+GTGCGGTATTCAATCAGGATCTCGCTAACGTCGACCAGTACCTCGTTGTCAATCAACTGGCGCACCAACT
+CATCGACGGTTCTTCCCTCATACCCGATGCTGACAAGAGATGGGATGCGCGACGACATGCCGACATGACG
+CACCATCTGACATCGAGCCTTAAGGAAAATCAAAGCTAATGCCGCCACCCCTCGGCGGCCTGTTCGTCGA
+AGGTGCGGTCAATGCGCTCGAACCTGCGGCGGATCGAAGCGCGCGAGGCCGCATGCGGAAGGACGTAGAG
+GCGGTTGGCCAGAATCGCATCGGCTGTTAGCTGGGCGATATCGTCGACGCCCAGGTTGTCGTCCTGCAGG
+GGGAGTGGACCGGGCGATCCCGTCGTTGAGGACTGCGCGCAAGCCGCGCCTCGGATTCGTTCAGAGTTGG
+CAACCAGATTGGTTTCGACGACCATCGGGCAGAGCACCGACACCCCAATGCCGTCGGCGGTGACCTCGCG
+GGCCAGCGTCTCCGCCAGACCGACAACCCCGTACTTGGCAACGCCGTATGCGCCGAGTCCGGCATTGGGC
+ACCAGCCCGGCAAAGGACGCGGTGAACACCACATGCCCGCCCGTGCCCTGCTCAAGCAACCTCGGCAGGA
+ACGCTTCGACCGTATGGATCGAGCCCCACAGGTCGACGTCGATCACCCAACGCCAGTCGTCGTGCGTCAT
+CTCCACGATCGGACCGCCGACAACGATGCCGGCGTTGCTGAATACGACATCGAAGTGGCCGAGCAGGCGG
+AAAGCCTCGTCCGCGAGGTGAGTGACCTCTTCTCGATGCCGGACGTCGCACATCACGCCGTGCACATCGA
+ACCCCTCGGCACGCAGGTGGTTCACCGCCTGCCGAAGTCCCGGCTTGTCAACGTCCCCTAGCACGACTCT
+GGCTCCGCGGCGGGCGAACTCGGTGCCGGTAGCCAACCCGATGCCACTGGCACCGCCAGTGATGACCGCA
+CCGCGCCCGGGAAACCCGTCCACAGCACGCAACCCTATTTCAGGCAGTCACCCGCGTCGACTGCGCCGGG
+CGAGCGTGATTCTGGCGACGCCACAGCGGCATGTTGCGTCGCGGTGTTCACAATCGGTTACAGCTGCGCT
+AGTCGCGGCGCAGATTCATGGTTGATCCGCAGGTGCAGTGTCGTGCAAGGTTGTCTCGACGATCCAGGTG
+CCACTGTGGAGGCAATCGATGACGACGGATGGCCGCACACCGGCGATCCTTGCAGCCCGAATTCGGCGGC
+CTCCGGCAAATATGGTGAAAGACCAGCTTCGGTGAGTACCGGCGACATTCATTCGTTGGTGATCGCTTCG
+GACTATCGGGTCCCTGATCCCGGTAGAGTGTGGCCGCTGCTGCAGCGCAACAAATCGGCTCTGGCCGACA
+TCGGCGCACACCACGTTCTGATCTACGCGTCAACGCACGACTCTGGCCGTGTGCTGGTAATGATCGGAGT
+ACGCAGTCGTGAGCCGATCGTGGAATTGCTCCGCTCACGGGTCTTCTTCGACTGGTTCGACGCCATGGGC
+GTCGACGATATCCCGGCGGTCTTCGCCGGCGAGATCGTCGACCGATTTGTCGCGGCGCCTACTACGACTC
+AGTCCACTCCACGGGTTCCTGGCGTTGTGGTGGCCGCGTTCGCGTCGGTGAACAACGTGTCCAACCTGAC
+CGCCGAGGTCCGTTCTGCGATAGCCAGGTTTACCGCCGCGGGGATTCGAAAGACCTGGGTTTTCCAGGCT
+TTCGACGATGCGCACGAGGTTTTGATCCTGCAGGAGTTTGCCGATGAGGCGGGCGCGCGGCAGTGGATCG
+AGCATCCCGACGCCGCCGCCGAATGGATGAGCGGGGCGGGAGTGGGAGCCTACCCACCGCTGTTCGTCGG
+CCGGTTCTTCGACATGATGCGGATCGAGGCGCTGCAGTGAGCGCATCGCTGGGCACTCGGCCCGGCCCGG
+GTCAGCGACCTCACTGCGGCGCCATGGATCCCACGAGTTGGCCAAGCAGGCGGGGGATCTCGAGCCGCGG
+CAACACCACCTCGACGAGCACCATCCGGTCCCGCCGTGCCGCGGCGACGGTGAGGGCGTCGTCGAGTTGG
+CCATAGGTTTGGGCACGGAACGCGAGGTGATTGGTCACACCCAGCGCGCTGGGAAGCTCGGTCCAATTCC
+AGCTCACGATGTCGTTGTACGGGGCCGTCTCGCCGTGGATGGCCCGTTCGACCGTGTAACCATCGTTGTT
+GACCACCACGATGACCGGGGACAGCCCTTCGCGGGAGAACGTGCCGAGTTCCTGCACGGTCAATTGTGCG
+GCCCCGTCGCCGATCAACAGCACCGTACGGCGGTCCGGATGCGCAACCGCGGCCCCGACTGCCGCGGGCA
+GCGTGTAACCGATTGAGCCCCACAAGGGTTGGCCGATAAAGGTCACTCCTTGCGGCAACCGGTGGTCCGC
+CATGCCGTAGAACGACGTCCCCTGGTCGGCGAGCACCACGTTTCCGGGTGTGAGCGCTGAGCAAACCCGG
+TCCCACACCATCTGCTGGGTGAGCGGCTCATCGCGCGCCGGCATCGCCGGCGGCGGTTCGGCGGGCGGCG
+GTACCACCGGCGGCGAACTGATTCCGCGCCCGGTCAGGATGGTGGCCAGCGCCTGCAGCGCGGCACTCAT
+TTCCAGTGGTGCGAACACCTGGTCGGCCACGCTGCTCTGGTATTGCCCGATGTCGATGGTCCGGGCCGGG
+TCGATCCGCTGGCTGAAGAAGCCGCTGACCATGTCGGTGAACACCACTCCGGCGGTCACCAGCACCGGCG
+CCCCTTCGATCGCGGCGCGCACCCGTTCGGCGCTGGCCGCGCCGGCGTAGATTCCCAGGAAGTTCGGCGA
+GCTCTCGTCGAGCAGGCTCTTCCCCCACATCAACGTGGCGTGCGGCACCACGTCGGCGGCCAACAGCGCC
+TCGAGTTCTTTGACGGCCTGCAGGCGATGAACCAACAGATCGGCGAGCACCGTCAACTGGTGGTCGGCAA
+TGAGTTCGATGGCGGCCTTGGTGAACAGCGACAGCGCGCGCGGGCTGGTGCCGCCGGGGTAGCGGGGCAA
+CGGCGCAGCGGGCGGTTCAGTGGGGAAGCGTGCTACGTCGCTGGACAGCAATATATATCCTGGACGCTTC
+TGCTCCCGTACCTCGGACAGCACCCGATCTATTTCTCTACCGGCCGTTGCCGGCATGAGATTGGCTTGGG
+CACAGGTGATTTCACGGCTGATCCGGAGAAAGTGCTCGAAGTCGCCGTCGCCGAGGGAATGATGCAATGC
+CCGGCGAGTGCCCTGGGCGTCTTTGGTCGGGCCGCCAACAATGTGCACCACTGGCACATGCTCGGCGTAA
+CTGCCCGCGATCGCATTGGTCACCGAGAGCTCGCCGACCCCGAATGTCGTTACCACCGCTGACATCCCAC
+GCAGCCGCCCGTACCCGTCGGCGGCATACCCGGCATTCAGTTCGTTGGCGCTGCCCACCCACCGGATGGT
+CGGGTGGGCCACGATGTGGTCGAGGAATTGCAGGTTGTAGTCGCCGGGAACGCCGAAGATCTCAGAGACG
+CCGAGTTCGGCGAGCCGGTCGAGTAGGTAGTCGCCGACGGTGTAGACGGGATCGCTGCAGGCATCGCTCT
+TCTGGGGTGTCACGAAGACGACCGTACGCCGGATTGAGGCTATTCCCGACTGGACGCCGATTCGCTATCG
+TGCGGCCATGGCCATCAAGGAGTCGCGCGACATAGTTATCGAAGCAAGTCCCGAGGAGATCCTGGATGTC
+ATTGCCGACTTCGAAGCGATGACCGAATGGTCGCCAGCCCATCAGAGCGTCGAAATACTCGAGACCGGAG
+ACGACGGGCGGCCCAGCAAGGTGAAGATGAAAGTCAAGACCGCCGGCATCACCGACGAGCAGGTGGTGGC
+CTATAGCTGGACCGACAGATCAGTGCGGTGGACGCTGGTCAGCTCCACCCAGCAGCGCTCGCAGGATGGA
+AAGTACGAGTTGACACCCAAGGGCGACAACACCCTGGTCCAGTTTGAGATCACCGTCGACCCGCAGGTGC
+CACTGCCCGGCTTCGTGCTGAAACGTGCGATCAAAGGGACGATCGACACGGCCACCGAGGCGTTGCGCAG
+CCAGGTGTTGAAAGTGAAGAAGGGTCAATAGTCGCGGTGACGACCGGGGGGCCCCTGGCCGGGGTGAAGG
+TCATCGAACTCGGTGGTATCGGACCGGGGCCGCACGCCGGGATGGTGCTCGCCGACCTGGGTGCTGACGT
+GGTGCGGGTGCGCCGCCCGGGTGGCCTGACGATGCCGTCCGAAGACCGCGACCTGCTGCACCGTGGGAAG
+CGGATCGTCGACCTGGACGTCAAAACGCAACCGCAGGCGATGCTGGAGCTGGCCGCCAAGGCCGATGTGC
+TGCTGGACTGTTTCCGGCCCGGCACTTGCGAGCGCCTCGGCATCGGACCCGACGACTGTGCGTCGGTCAA
+TCCGCGACTGATCTTCGCCCGCATTACCGGTTGGGGACAGGATGGCCCGTTGGCCTCGACGGCGGGTCAC
+GACATCAACTACCTGTCGCAGACCGGTGCGCTGGCGGCGTTTGGCTACGCCGACCGGCCTCCGATGCCGC
+CGCTAAACCTGGTTGCCGACTTCGGCGGCGGCTCGATGCTGGTGCTGCTGGGCATTGTGGTGGCCCTCTA
+CGAACGGGAACGTTCGGGTGTGGGTCAGGTCGTCGATGCTGCGATGGTCGACGGGGTTAGCGTGTTGGCG
+CAGATGATGTGGACCATGAAGGGGATTGGCAGCCTGCGCGACCAGCGCGAATCTTTCCTGCTCGACGGCG
+GCGCCCCGTTCTACCGCTGCTACGAAACGTCCGACGGCAAGTACATGGCCGTTGGGGCAATCGAGCCGCA
+GTTCTTCGCGGCGTTGCTGAGCGGGCTCGGCTTGTCGGCCGCTGACGTGCCGACTCAGCTCGATGTGGCC
+GGCTACCCGCAGATGTATGACATCTTCGCCGAGCGATTTGCCAGCCGAACCCGCGACGAGTGGACGCGGG
+TTTTCGCCGGCACTGACGCATGTGTTACGCCGGTGCTGGCGTGGAGCGAAGCCGCCAACAACGATCATTT
+GAAGGCACGATCGACGGTGATCACCGCCCATGGTGTCCAGCAGGCCGCGCCCGCTCCCCGATTTTCCCGG
+ACACCGGCCGGGCCGGTCAGGCCGCCGCCGGCCGCAGCCACACCGATCGACGAAATCAACTGGTAACCAC
+GGTGGCTGCCGAACACCGCCCACCAACGGCGCGGCGTTGCTAGCGTCAACGTCAGTGGCCGTAAAAGCAT
+CGCGGGAATTTGTCATCGACGCGCCTCCAGAAGTGGTGATGGAGGCGCTGGCAGATGTCGGCGTCCTGGC
+TTCGTGGTCACCGCTGCACAAACAGGTGGAAGTGATCGACTACTACCCGGATGGCCGGCCGCACCATGTG
+AGGGCAACCGTCAAGATTCTGGGGCTCGTCGACAAAGAGGTCCTCGAATATCACTGGGGCCCGGACTGGG
+TGTGCTGGGATGCCGATCAGACCTTCCAGCAACATGGACAGCACATCGAGTACACCGTGAAACCTGAGGG
+TGTCGATAGGGCCCGGGTGCGCTTCGACATCACCGTCGAGCCGGCGGGACCGATCCCCGGCTTCATCGTC
+AAGCGGGCAAGTGAGCATGTGTTGGATGCCGCGGCGAAAGGGCTGCAGAAGTTGATCGCGGGTGCCGGCG
+ATCAAGGAAACGCGAAATCGTGACGATGTGACGGGTCCGCGTAGCGGATCGTGATTGCTAATTTGGTAGC
+AGTGGCTATCCGAGCATCGCGCGAAGTCGTCATCGAAGCGCCTCCGGAAGTGATCGTGGAGGCGCTCGCC
+GACATGGACGCTGTGCCGTCTTGGTCTTCAGTGCACAAACGGGTCGAAGTCGTCGACACTTACTCCGACG
+GTCGACCACATCACGTGAAGGTCACCATCAAGGTGGCGGGCATCGTCGACACGGAGTTACTGGAGTATCA
+CTGGGGACCCGACTGGGTGGTGTGGGATGCCGCCAAGACCGCGCAGCAACACGGCCAGCACGGCGAGTAC
+AACCTGCGCCGTGAGGATAACGACAAGACCCGAGTGCGATTCACCCTCACGGTCGAACCCTCGGCGCCCC
+TGCCGGCGTTTTGGGTCAACATTGCCCGCAAGAAGATCCTCCATGCGGCGACGGAAGGACTGCGAAAGCA
+GGTGGTGGGGCGCCGACGGTTCACGTCGGGCTAGGTAGCGGGTCGCTCGGCGAGCACGCTCAGTCGCCTG
+ATTGCCTCGTCGAGGGTGTCGTCTCGTTTGCAGAAGGTGAAGCGCACCAGGTGGTTCCACACATCGGCTT
+GTTGTGAGGCCTGTCCTGCGGCGGGGTCGCAGAACGCCGACATCGGGATGGCGGCCACCCCGACTTTCTC
+CGGTAGCGCCGCACAGAATTCGGTGCTGTCGTCATAACCCAACGGGCGCGGGTCGGCGCATAGGAAGTAC
+GTGCCGTAGCTGTCGTGCACTGCGAAGCCGATCTCCGTCAGGCCCGCTGCCAGCCGGTCGCGCCGGGCCC
+GCAACGAGTTCCGAAGGGCCGCCACCCAGGCGTCTTCGGTGTCTAGCGCGAGGGCGACCGCAGGCTGAAA
+CGGTGCGCCGCCCACATAGCTCAGGTACTGTTTTGCGGCGCGCACCCCGGCGATGAGTTCGGCTGGGCCG
+CAAGCCCATCCGATTTTCCAGCCGGTGCAGTTGAACATCTTGGCCGCACTGGAAATGGTGATCGTGCGCT
+CGGCCATGCCGTCGAAACCCGCCAGCGGCAGGTGTCTGGCGTGGTCAAACACTAGGTGCTCGTACACCTC
+GTCGGTGATCACCACAAGGTTCGCCGCCACCGCGATCTCGGCGATGGCTGCGAGTTCCGTCGCGCTCAGC
+ACCGCACCGGTCGGATTGTGCGGCGAGTTAATGATCAGCGCCCGAGTTCGCGGGGTCACCGCGCGTCGCA
+GCGCGTCGGCGTCTAGGGCGAAGCCGCGGCCATCGGGCACCAGCGGTACGGTCACGCGGTGGGCGCCGGC
+CATCGCCACCACCGGCGAGTAGGAGTCGTAGAACGGCTCGATCAGCAACACCTCCGAGCCCGGTTCGACC
+AGTCCGAGCACCGCTGCGGCGATGGCCTCGGTGGCTCCGACCGTGACCAGCACCTCGGTCTCGGGGTCGT
+AGTCGACGCCGAAATGGCGCCGCCGCTGGGCGGCGATGGCCCGCCGTAGCGGAGCGCTTCCAGGGCCGGG
+CGGGTACTGGTTGACGCCGCCGGCGATGGCGTCTTGGGCGGCCTGCAGCATCTTCGGCGGGCCGTCCTCG
+TCGGGAAAGCCCTGTCCCAGGTTGACCGCGCCGATACGGGTGGCCAGCGCGGACATTTCGGCGAACACCG
+TGGTCGCATACGGCCGCAGCCGCGACACCGTCATGGCGGTCGAGCCTATCCGGGCGACGATGCGCGCCGC
+AGCGATACCTTGCCCAACCAACAGGTTGGCCGGGGGCCCTGTTAGGGTGCCGGTACGGGACCTAGTCTTG
+AAGAAGGATCCAAACCCCCTTTTGTGGAATTTGTGGAACAGGAAATCGACATGTCCGAAGAAGCCTTCAT
+CTACGAGGCCATCCGCACCCCGCGCGGCAAACAAAAGAACGGATCGTTGCACGAAGTCAAGCCATTGAGC
+CTGGTCGTCGGCCTGATCGACGAGCTGCGCAAGCGCCATCCCGACCTCGACGAGAACCTGATCAGCGACG
+TCATCTTGGGCTGCGTCTCACCGGTGGGCGACCAGGGCGGCGACATCGCCCGCGCCGCAGTGCTGGCATC
+GGGCATGCCGGTCACCTCCGGCGGTGTGCAGCTCAACCGGTTCTGCGCGTCCGGCCTGGAGGCCGTCAAC
+ACCGCCGCGCAGAAGGTGCGTTCGGGCTGGGATGACCTGGTGCTGGCCGGCGGCGTGGAGTCGATGAGCC
+GGGTGCCGATGGGCTCCGACGGCGGCGCTATGGGCCTGGACCCGGCGACCAACTACGACGTCATGTTCGT
+CCCGCAGGGCATCGGCGCCGACCTGATCGCCACCATCGAGGGCTTCTCCCGCGAAGACGTCGACGCCTAC
+GCGCTACGCAGCCAGCAAAAGGCCGCCGAGGCGTGGTCGGGCGGCTACTTCGCCAAGTCGGTGGTGCCGG
+TGCGCGACCAGAACGGCCTGCTGATCCTCGATCATGACGAACACATGCGGCCGGACACCACCAAGGAGGG
+TCTGGCCAAGCTGAAGCCGGCCTTCGAAGGCCTGGCCGCGCTGGGCGGTTTCGACGACGTGGCGCTGCAG
+AAGTACCACTGGGTGGAAAAGATCAACCACGTACACACCGGCGGCAACAGCTCGGGGATCGTCGACGGTG
+CCGCGCTGGTGATGATCGGTTCCGCGGCCGCCGGCAAGTTGCAGGGCCTGACTCCGCGGGCGCGCATCGT
+CGCCACCGCCACCAGCGGCGCCGACCCGGTGATCATGCTCACCGGCCCCACCCCGGCCACCCGCAAGGTG
+CTCGACCGCGCCGGGCTGACCGTCGACGACATCGACCTGTTCGAGCTCAACGAGGCGTTCGCGTCGGTGG
+TGCTGAAGTTCCAGAAGGACCTCAACATTCCCGACGAGAAGCTCAACGTCAACGGTGGCGCCATCGCGAT
+GGGCCACCCGCTGGGTGCCACCGGCGCGATGATCCTGGGCACCATGGTCGACGAACTGGAGCGCCGCAAC
+GCCCGACGTGCACTCATCACGCTGTGCATCGGGGGCGGCATGGGTGTCGCGACGATCATCGAGAGGGTTT
+AACAGCATGCCAGACAACACAATCCAGTGGGACAAGGATGCCGACGGCATCGTCACGCTGACCATGGACG
+ATCCCTCCGGGTCAACCAACGTGATGAACGAGGCCTACATCGAGTCGATGGGCAAGGCCGTCGATCGCCT
+TGTCGCCGAAAAGGATTCGATCACCGGAGTGGTAGTCGCCAGCGCGAAGAAAACCTTCTTCGCCGGCGGC
+GACGTCAAGACGATGATCCAGGCCAGGCCCGAGGACGCCGGCGATGTATTCAACACCGTCGAGACCATCA
+AGCGGCAGCTGCGCACCTTGGAGACATTGGGTAAGCCGGTCGTCGCGGCCATCAACGGGGCGGCGTTGGG
+CGGCGGCCTGGAGATCGCGCTGGCGTGTCATCACCGGATCGCCGCCGACGTCAAGGGCAGCCAGCTCGGT
+CTGCCGGAGGTGACGCTGGGTCTGCTGCCGGGTGGCGGTGGGGTGACCCGCACGGTACGGATGTTCGGCA
+TCCAGAACGCGTTCGTGAGCGTGCTGGCGCAAGGTACCCGGTTCAAGCCGGCCAAGGCCAAGGAGATCGG
+TCTGGTCGACGAGCTGGTGGCAACGGTCGAGGAGCTGGTGCCCGCCGCCAAGGCTTGGATAAAGGAGGAG
+CTCAAGGCCAACCCCGACGGTGCCGGGGTGCAGCCGTGGGACAAGAAGGGCTACAAGATGCCCGGCGGCA
+CCCCGTCGTCGCCGGGTCTGGCGGCGATTTTGCCGTCGTTCCCGTCGAACCTGCGCAAGCAGCTCAAGGG
+TGCCCCGATGCCGGCGCCGCGGGCCATCCTGGCCGCCGCGGTCGAGGGGGCACAGGTCGACTTCGACACC
+GCCAGCCGCATCGAGAGCCGCTACTTCGCGTCGTTGGTCACCGGCCAGGTCGCCAAGAACATGATGCAGG
+CGTTCTTCTTCGACCTGCAGGCCATCAATGCCGGCGGGTCTCGGCCCGAAGGCATCGGCAAGACCCCGAT
+CAAGAGGATCGGTGTGCTGGGTGCGGGCATGATGGGCGCCGGCATCGCCTACGTCTCTGCCAAGGCCGGC
+TATGAGGTGGTACTCAAAGATGTCAGCCTTGAGGCCGCCGCTAAAGGCAAGGGCTACTCCGAAAAGCTGG
+AGGCCAAGGCGCTGGAGCGGGGCCGCACCACACAGGAGCGCAGCGACGCCCTGCTGGCGCGCATCACCCC
+GACCGCCGACGCCGCCGATTTCAAGGGCGTTGATTTCGTGATCGAGGCGGTTTTTGAAAACCAGGAGCTC
+AAGCACAAGGTGTTCGGCGAGATCGAAGACATCGTCGAGCCCAACGCGATCCTGGGATCCAACACCTCGA
+CGCTGCCGATCACCGGTCTGGCGACCGGCGTCAAGCGGCAGGAAGACTTTATCGGGATCCACTTCTTCTC
+GCCGGTCGACAAGATGCCGCTGGTGGAGATCATCAAGGGCGAGAAGACTTCTGACGAGGCCCTGGCCCGG
+GTGTTCGACTACACCTTGGCCATCGGCAAGACCCCGATCGTGGTCAACGACAGCCGCGGCTTTTTCACCT
+CGCGGGTCATCGGCACGTTCGTCAACGAGGCGCTGGCGATGCTCGGTGAGGGTGTCGAGCCGGCTTCTAT
+CGAGCAGGCGGGGTCGCAGGCCGGGTATCCGGCGCCGCCGCTGCAGCTGTCCGACGAGCTCAACTTAGAG
+CTGATGCACAAGATCGCCGTCGCCACCCGTAAGGGTGTTGAGGACGCCGGCGGCACGTACCAGCCGCATC
+CGGCGGAGGCCGTGGTGGAGAAGATGATCGAGCTCGGCCGGTCCGGCCGGCTGAAGGGCGCGGGCTTCTA
+CGAGTACGCCGACGGCAAGCGATCCGGGTTGTGGCCCGGCTTGCGCGAGACGTTCAAGTCGGGCTCGTCG
+CAGCCGCCGCTGCAGGACATGATCGACCGCATGCTGTTCGCCGAGGCGCTGGAAACCCAGAAGTGCCTCG
+ACGAGGGGGTGCTGACGTCGACGGCCGACGCCAACATCGGCTCGATCATGGGCATCGGCTTCCCGCCGTG
+GACAGGTGGCAGTGCCCAGTTCATCGTCGGCTACTCCGGCCCGGCCGGTACCGGTAAGGCGGCTTTCGTG
+GCCCGGACCCGCGAGCTGGCGGCCGCCTACGGCGACCGCTTCCTGCCGCCGGAGTCGCTGCTAAGCTGAG
+CGCGAGCAGACGTAAAAGCCCCCGCACGCTCGGCGTGTCGGGGGCTTTTACGTCTGCTCGCGCAACCTAA
+ATTGCCGGGCCCAGCAGGTCGTCGGCGTCGCGGATGATGTAACCGTAGCCCTGCTCAGCTAAAAACCGCT
+GCCGGTGTGCGGCGTACTCGGCATCCAGGCTGTCGCGGGCCACCACCGAGTAGAAGATGGCACCGCCCCC
+GTCGGCCTTGGGTCGCAATATCCGGCCGAGCCGTTGCGCCTCTTCCTGGCGTGAGCCGAATGTTCCCGAA
+ACCTGTACCGCCACGGCGGCTTCCGGCAAGTCGATGGAGAAGTTAGCCACCTTGGACACCACGAGCGTAG
+CGACCTCGCCGCGGCGGAAGGCGTCGAACAGTGCCTCGCGTTCGCTGGTCCTTGTCGACCCCTGAATCAC
+CGGAGCGCCGAGCTCGGCGCCCAGCTCGTCGAGCTGATCCAAGTACGCTCCGATGACCAGGGTCTGCTCA
+TCCGGGTGCTTCGCCAGAATCGACTTGACCACAGCAATTTTGGTGTGCACCGTCGAGCAGATCCGGTAGC
+GTTCTTCGGGTTCGGCGGTGGCGTACATCATCCGCTCGCTGTCGGTCATCGTGACCCGGACTTCCACGCA
+CTCAGCTGGCGCGATCCAGCCCTGCGCCTCAATGTCCTTCCACGGCGCGTCATAGCGCTTTGGTCCGATA
+AGGGAAAACACGTCGCCCTCGCGTCCGTCTTCACGGATCAACGTGGCGGTCAGCCCCAGCCGCCGTTTGG
+ACTGCAGGTCAGCGGTCATCCGGAAGACCGGTGCCGGCAACAGGTGCACCTCGTCATAGATGATGAGCCC
+CCAGTCGCGGCTGTCGAACAGTTCCAGATGGCGGTACTCGCCCTTAGTGCGGCGGGTGATCATCTGGTAT
+GTCGAGATGGTGGCAGGTCGGATTTCCTTGCGTTCTCCCGAGAATTCGCCGATCTCATTCTCGGTGAGCG
+AGGTGCGCGCGACCAGCTCTCGTTTCCATTGCCGGGCCGCGACGATATTGGTGACCAGGATCAACGTCGT
+CGCGCCGGCTTTGGCCATTGCGGCCGCACCGACCAGCGTCTTGCCGGCCCCACATGGCAGCACCACCACC
+CCGGAGCCGCCCGCCCAGAACGAGTCCGCGGCCAGCCGCTGGTAATCGCGCAGCTGCCAGCCCTCCTGGT
+GCAGGCTGATCGGGTGCGCTTCACCATCGACGTAGCCGGCGAGATCCTCTGCGGGCCAACCGATCTTGAG
+CAGCAGCTGCTTGACCCGGCCGCGTTCGCTGGGGTGGACGACGACGGTGTCGTCATCGATGCGGGCGCCA
+AGCATCGGCGCGATCTTCTTGTTGCGCAGCACTTCCTCAAGCACCGCGCGGTCCAGGCTCACCAGCGTCA
+GGCCATGGGCCGGGTTCTTGACCAACTGCAGTCGTCCGTAGCGGGCCATGGTGTCGACGATGTCGACGAG
+CAAGGGTTGCGGCACCGCGTAGCGGGAGTAACTGACCAGCGCGTCGACGACTTGCTCGGCATCATGGCCG
+GCGGCGCGAGCATTCCACAGTGCCAGCGGTGTGATGCGGTAGGTGTGGACATGTTCGGGTGCACGTTCCA
+GCTCGGCGAACGGCGCGATGGCGGCGCGTGCAGCGCCGGCCAGTTCATGGTCGACTTCCAACAGCACCGT
+CTTATCGGACTGCACTATCAATGGTCCGTCAGTCAATGGCGCCGCTCCTCCTCATCGCTGCGCTCTGCAT
+CGTCGCCGGCGGTAGTCAATGGCGCCGCTCCTCCTCATCGCTGCGCTCTGCATCGTCGCCGGCGCGGGGG
+TCATGGGCTCCATTATCGGTCGTGGGCCGACACCACCGACGTGATGCGGTGGATGGCGAAGTCACGCAGT
+CGCCCGGATGACGAGTCGAACGCCACCAGCTGGCCGCCCCGTAGCGTGATCGGTGCGACCACCCGCTGAG
+TGGCAACGCCGGCGGCATCGAGGTAGCTGATCACCAAGGTGGCCTGGTCCTTGGCCGCGCGCTGCAACAG
+CGACATGGTGACCGCCGGGTCGACGCGGACATTAGCGAACGGCGCTGCGGTCACCTCACGCAGCACGGCA
+ACCACGGCTTTCAACGCCTCGCTATTGGGTCTCGGCGGCGGTCGGTATGGCCGGCGCCGTTGCGGTGTGG
+GCACCCGGGCGCCGCGGGTTCGCACGTCGACAACGGCTCCGGTGGAATCTTCGGCGGCCGGGGCAAAGCC
+CGCGCCGCGCAACGTGACGAGGACTTCGGATATCGGAGCGGGGGACACCGCCACCGTTGGGGCCAGGGCC
+CGCAGTGCCAGCCCGTCGGCTTCGGGCGCCGCCACGACCTGGGCCAGTAGCGTTGGGTCCTCGCACCGCA
+CGAACGATGCGGCCATGCCGATCCGAAGCTGGCCGTGCCGGCGCGCGACATCGTCGATGAGATATGTAAG
+CCCTTGTGGTACAGGAGTTTTAGAACGATTTGCGAAGAATTCCTGCAACCAGTCGCGGGACTTGCCGACA
+TCGAGGGCATGCCGGATCGACTGCTCGCTGACGCGGTACACCATCGCCGTGCCGGCCGATTCCACGGTGG
+CGACGGTGGTCAGGTCGTCGGCCAGTTCGCGCTGCAGCGGCCCTGGCACCACGACGGTCAGGTCGGCCTG
+CACCAGGAAGTGATCGATGGGCTTGGGCAGCGCCCGAGCCATCACGCCGACCGCGGCGGCAGGGGCAGTA
+GCTGGCTCTAAGGCCTCGTCCAACAGTGCGCGAGCAGGCGTGCTGATCGCCCCGCGCCCCACCAGACCCA
+GCGCATGGCCCTCTGTCAGCAGATCCGCGATAGGCGCAGGTTGCAATCGCCTGGCCCAACGTGGGCGGCG
+CCAGATCAGTGTCGCCGACGCCCGGGACGCATCGACGCCGGCGCCGGCGGGCAGCTCGGCGAGCATGCCT
+AGCAATAGCCGGCGATCCAGTGGGGCCGCCGTGGAGAACAGCGAATCCGACAGGGCGCCATAGGGTTTGG
+CGTCGGGTCCGCGGGTACCGATTAACGCCGGCCGGCCCGGAAGGTCAAGCCAGGCGCTGGCCAGCAAGTG
+CCAACGCTCGGCGGGTGACATCGTGGCGAATCGATCGGCGGCCACCGTTGGCGCCCAAAAAGGTCCGTCA
+CTGTGGGGCGGTTCGGGATCGGGCATGCCGCTGGCGATCAGTCCAGCCGCGGCCGCAATCTCGAGGATTA
+GGCCCAGCCGCGGCTCGTCGATTCCCGTTGCCTTGGCCAGCCGCTTGAATTCACGAACCCCCAGTCCGCC
+GCTGCGTAGTTCGGCAACCGGTGTGGCGCCGAGGTTTTCGAGCAGTACGTCGACTTCACGCAGTAGGTCG
+ATGACGGCTCCGGCCGCCGCAGCGTCGGCGTCGTCGGGTGTGGTGGTGGAAACTACCGGGTCCGGCGCGG
+TCAACTCCATCGGACCGGGTTGTTCGCCGCGCAGCACCTGCCCGACGTGGCGGGGCAAGATCACCGTTTC
+GGCATCGATTCGTCGCAGCAAGCCCATCGCCAGCAACCGCGGCACGGGTCGATCAGATGGCGCGCCGGGT
+GCGGCGTCGCGAGTGCGCCCCACGGGTGACCCTTGGAGCAATTTGTCCAGAACGTCACGCTGCGCGGGGT
+CGAGGCCGGCGATCAGGTCGGCGAGCTGATCCCCGGAACGCGAACTTCCCTCGAGGGTGACCTGGCCGGG
+ATGCCACGGCAACGCCGTACCTGCGTCTGTCGCCACCCGGACTGCGGTCTCGCCCCAGGCCAGGGCACGT
+TGTTTAAGGTCAGCCAGCGCGCCAAGCACGTCGGCTTGGGCGGCGCGGTCGCCGATCACTGCCAGCAGCC
+GGACGATCGGCACCGGTGCGGTATCTGCCTGCAGCACCAGCAGTGCGTCGAACACCGCCAGCCGCAGGAA
+GTCGAGCTCGTCGGTGGCCGCCTTGACCGACTGGCGGGCCTGGGCACGGGCGGCCAGCGCGGCGATGCTG
+CCGGGTGGTGGCTGGGCAAGGTCGGGCCGCAGCTCCAACAGCTGGGTCAGCCGTTCATCGGGCAAGGCGG
+CCAGCCAGGACCCCAGCGGGATATCCGGGGTGTGTTCGGTCATTGCTGATCAGCGTAGGCCGGACCAGCC
+TTGTGGCGTGGGCGGGTGCAAGACCTGTCAGAATGGTTTCGTGGCTGACATTGCTGAAGGTAAGGCACGC
+AAGACCAGGTACGTGGACCATGGTTGGCCGACCACCGATCCAGACGACCATGCGGTGAGCGAACTCGTGA
+CCGACCGCACGGGTGCGCTATCACCCTTCGGTGAATTGACGTTCCCGGTACCGTCCGACGACCTGCCCTA
+CATCCACCCGGTGACCGTCATCAATCGGTAAGCCGCCAGGATGGCCAGGGCTTCTGGGGCATCCGACTAC
+CGCTCGGGCGAGCTGTCGCACCAGGATGAGCGGGGGCAGCGCACATGGTCGATATCACCGAGAAGGCAAC
+CACGAAGCGAACAGCCGTTGCCGCGGGCATCTTACGTACCTCGGCGCAGGTGGTGGCGCTGATCTCGACT
+GGCGGGCTGCCCAAAGGGGATGCGCTGGCCACCGCGCGGGTGGCGGGCATTATGGCGGCCAAGCGCACCA
+GCGACCTGATCCCGCTGTGCCATCAACTCGCGCTTACCGGAGTCGACGTCGATTTCACCGTCGGCCAGTT
+GGATATCGAGATCACAGCGACGGTACGCAGTACCGACCGAACGGGCGTCGAGATGGAAGCGCTGACCGCT
+GTCAGCGTGGCCGCCCTCACGCTCTACGACATGATCAAGGCGGTCGATCCGGGCGCGCTTATCGATGACA
+TCCGGGTGCTCCACAAAGAAGGCGGTCGTCGCGGGACCTGGACGAGGCGATGAGCACCCGGTCCGCTCGA
+ATTGTCGTTGTGTCGAGCCGCGCGGCGGCCGGTGTGTATACCGATGATTGCGGGCCGATTATCGCTGGAT
+GGCTTGAACAGCATGGGTTTTCGTCCGTCCAGCCGCAGGTGGTTGCCGACGGGAACCCAGTCGGCGAGGC
+GCTACACGACGCGGTCAACGCCGGAGTCGACGTGATCATCACTTCCGGCGGCACCGGTATCTCGCCCACC
+GATACCACGCCCGAACACACGGTCGCCGTGCTGGACTACGTCATTCCCGGGCTGGCCGACGCGATCCGCC
+GCTCCGGCCTGCCCAAGGTGCCGACATCGGTGCTGTCGCGCGGGGTGTGCGGCGTGGCTGGGCGGACCCT
+GATCATCAATCTGCCGGGATCGCCTGGAGGTGTACGTGACGGCCTCGGGGTGCTCGCCGATGTGCTGGAC
+CATGCTCTCGAGCAGATCGCCGGTGGAGATCACCCGCGATGACGCAGGTCCTGCGCGCCGCGCTGACAGA
+TCAACCGATCTTTCTGGCCGAGCACGAGGAGCTGGTGAGCCATCGGTCGGCTGGCGCCATTGTCGGGTTC
+GTCGGAATGATCCGCGACCGTGACGGTGGACGGGGGGTGTTGCGGCTGGAGTACTCCGCGCACCCGTCGG
+CCGCACAGGTCCTTGCGGATTTGGTGGCGGAGGTAGCTGAAGAGTCCAGTGGCGTGCGTGCGGTGGCGGC
+CAGCCACCGGATCGGCGTCTTGCAGGTCGGGGAGGCCGCCCTGGTGGCGGCGGTTGCCGCCGATCACCGG
+CGGGCGGCGTTTGGCACCTGTGCGCACCTGGTGGAGACCATCAAGGCGCGGCTTCCCGTGTGGAAGCACC
+AGTTCTTCGAGGACGGTACCGACGAATGGGTGGGTTCGGTTTAAAGTCCGGCCTCAGCCCGTCAGCCGAT
+GACGTACGGCTGTGCGAGCGAGTCCAGCGCATCGTTGCCGCAGACGTCCTGGGCCCGAATCGCCTGCCAC
+AGCTTCTTCGTATAGGCGATGTTCGAGACTTGGGGCGTTTCGGCGGGCGCCTCGGTGACGTCGCCGGGCG
+GCGGTGCGTCAGCTGGTTGGGGGTCGGGCTCGGGGAGTTCCAAATCGGTGGCAAGGCCAACCGGGCCGCC
+TGGAGCTGTGGCGGGCTGATCGCCCGGCGCGGTTTGCTCGTTCACCGCAGCGGGTGGTGCCAGGTCGGCG
+GGCGCGGGTGGCGCCAGTTCGGCGGGCGCGGGTGGCGCCAGGTCGGCGGGCGCGGGTGGCGCCAGGTCGG
+CGGACGCGGGTGCCAGATCGGCGGGTGGCGCCAGTTCGGCGGGAGCTGCCGGGAGGGGTTCACCCAGCGG
+CGCGGGCAGGTCGTTTACGGCAAGTTCCACGGGTGGTGCCAGGTCGGCGGGCGCGGGTGGCGCCAGGTCG
+GCGGGCGCGGGTGGCGCCAGGTCGGCGGGCGGCGGGGCCAGCGGTGCTGGTTCGCCGTTGACCGCGGCCG
+CGTCCAACGGAGCGTCCATCGCTGCCGAAGCGGGAAGCACTTCGCGGGGTGTTGCGTTCGATAACCCGCG
+GCCGCACACCGGCCAGGCGCCGCGACCCTGGGTGGCCAGCACCCGCTCACCGACGGCAATCTGCTGCTCC
+CGGCTGGCCAGCTGAGCCGACGGGGCGAACTCGCCGCCACCATGTGCGGCCCAGGTGCTTTGAGTGAACT
+GCAAGCCACCGAGGTAACCGTTGCCGGTGTTGATCGACCAGTTGCCGCCCGACTCGCAGCGGGCCACCTG
+ATCCCATTCCCCGTCGGTGGCCGCGGTCGCCTGAGCGGCCATGGCGATGCCGCCGCCACCGAGTACTGCG
+CCGGTAAAGGCGATCTTGGCGACGCTGACGTTGGATGTGGTGGGCTTACGGTGGCGTCCACTCATACGTT
+AGGTAATTCCTCTCGGTACACGCCTACGAGGTCAGCTGTCGGGTTCGGGTTGGATTCGCCGTGGAGAGGA
+TCACCCGGCCGCGGTCGTACATCGGCGAACGACGTTGGCTTCACCCCAAGGAGCCGTATGCGGCTCCGGT
+CCGATCTCGGCGGACCTGGTGGGTCCCCCGCCTCCATCCGCGGTCGGAATCCCTCGCCCACTGGATGGAG
+TTCGGCGTGCTATCGGCGAGGGAGGGCACGTCATTTTGGGTTAGGTTGACGAGCCTCCCGAGACGGTAGC
+GGTTTCAGGCGATTCCGTCACGTTTAAGAAAAGTCGGCGTTTCCGTCACAATCGCCGGCAAGAACGCCAA
+GAAATATAGGCATTTGCGCAGGTAGTAAGCCCTCGCAATCGGAGCGTGTCCGCCCCGTTATCGTTCCGTT
+ATGTGGGTAATGTCACATGGCCTTAGCCGCCGGCGAAAGGGGGTAGTACGTCAATCGTGTCGCCGGCGGA
+TAACGCGACGGCGTCATCTCGGACGACAATCCCGTCGCGCAGGTAGGAGCATCGACTCAACACCGTCGCG
+AGGCGAACATCGCGGACCGACAGGCCGTCTATCAGCTCGGCGACTGTGGCGCCAGATCGCAGGGTGACTT
+TCTCCGACCCGGCACCAGCGGCCGCTCGGGCGGCCGCGAAGTAGCGGACAGTCACCTGAATTCCGGCGGA
+TTCGTCGGACACCTGCGTCACCGGTTAGCCACCGATCGCGCTCATCGGGCGGTCGGGCTGAATGAAATCG
+GGGGCGTTGATGCCGTGGCCGGCGGGTTTGCTCCACATCGCGGCACGCCATGCCGCCTCGATCGCGTCGT
+CGTCAGCACCGCCGCGCAGTAGGCGGCGCAGGTCGGTCTCCTCGGTGGAGAACAGACAGCTGCGGATCTG
+GCCATCGGCGGTCAGCCGGGTGCGGTCGCACGTCGAACAGAAGGCGTGCGACACCGAGGCGATGACACCG
+AACCGTCCGCGTGGCGTGTTCGGTCCGGCGTCGACCAGCCAGAGTTCGGCCGGGGCCGAACCGCGCGGTG
+CCGGGTCGGGCCGTAGCCGGAAGTGGGGCCGCAGCGCCGCCAGCACGTCGTCGGCGCTCAGTGCGATGTT
+CCGCCGCCAGCTATGCCCCGCGTCCAGCGGCATCTGCTCGATGACTCGCAATTGATAACCGCGCTCTAGG
+CAGAACCTCAGCAGGTCGACGACATCCTCGCGGCCGGTCGTGGGGTCGAGGACGGCGTTCACCTTGACGG
+GTGTCAACCCGGCTGCCTTGGCGGCGGCCAAGCCGGCCAGCACATGCGCAAGCCGGTCCCGACGGGTGAT
+AGCAGCGAAGTGGGCGCGGTCGATGCTATCCAGCGAGACGTTGACCCGGTCCAGGCCCGCTTCGGCCAGG
+GCGCCCGCCCGCCGCGCCAGTCCCACCCCGTTGGTGGTCAGCGAGATCTCCGGGCGCGGCCGCAGCCTAG
+CTGTCGCTGCGACCACCTCGTCGAGGTGGTGGGCCAATAGCGGCTCGCCGCCGGTGAACCGCACGCTGGT
+GACGCCGAGCCGAGTTACCGCGATGTGTATCAGCCTGGCCAGTTCGTCGGGCCGCAGCAGTTGCTCGCCG
+GGCAGCCACCTCAGCCCTCGCTCAGGCATGCAGTAGCTGCACCGCAGGTTGCAGCGGTCGGTTAGCGACA
+CCCGCAGATCGTTGGCGACCCGGCCGAACGTGTCCACCAAAGGGCCAGTGGTGGGTACGACCCGCGGGTC
+GGCAATGCCGTTGGTGCGGCTGCGCAGCGCCGGCATGCCCAGCGCGGTCAGTGTCATGTGGGCACCTGTG
+AGTTGACCCCGACGATGTCCTTGCCCAGCGGCACCAGCGACACCGGGATCAGTTTCAAGTTGGCCAGTGC
+TAGCGGAATGCCGATGATCGTGACTGCCATTGCCGCGGCACTCACCAAATGCCCGAGGGCCAGCCAGATC
+CCGAACAGCAGCACCCAGATGACGTTGCTGATCAAGGCCCCGGTCCCGGCGGTTGGCTTTTCGACGATCG
+TCCGGCCGAACGGCCACAACGCGTACGACGCGATGCGCAGCGCCGCGAAGCCAAACGGAATGGTGATGAT
+GAGCAGGAAGCAGACAAGCGACGCCAGCAGGTACCCGAGGGCCAGCCAGAGGCCACCGAACACCAACCAG
+ATAACGTTCAGGATTAGTCGCATATCGCCTCCAGCGGTAGCGCAAGCCTACCGCGTGAGGGGTAAGCAGG
+GGTGCTCGGCGGCCGACGATCCGAGTAGGATCTTCAGATCGTCATCGCGTCCCGCGCAGGCGGGACGCGT
+CTTCTGTTGCCAATCCGAGCGATCCGTCAGACAAGCAGGTGAGACCAGTGCCGACCGGCAAGGTGAAGTG
+GTACGACCCCGACAAGGGGTTCGGCTTCCTGTCACAGGAGGGTGGCGAGGATGTCTACGTCCGCTCCTCG
+GCGTTGCCCACGGGTGTCGAGGCACTCAAAGCCGGGCAGCGGGTGGAATTTGGCATCGCCTCCGGGCGGC
+GCGGACCGCAGGCATTGAGTCTCAGATTGATCGAACCGCCGCCCAGCCTCTCCCGGCCGCGCCGTGAGCC
+GGCGGCCGAGCACAAGCACAGCCCCGATGAGCTGCACGGCATGGTCGAGGACATGATCACGTTGCTGGAA
+AGCACCGTGCAGCCGGAGCTGCGTAAGGGGCGCTACCCGGATCGCAAGACTGCTCGCCGGGTCGCCGAGG
+TTGTCCGGGCGGTGGCGCGGGAGTTCGAGTCCTAACGGGGTCGGGTGGTGCGCTGGCCCAATTGCGCCGA
+GCTGGCAACGCCGCGCCGTTCCAGGGTCACGGTCGGATCGATTCCGCCGCACTCGGTTTGACGAGACGAC
+GACCGGCTAGCAGTTAGCCGGGTTGGCCGGGTTGGCCGGCGCTGCCCGGGCTGCCGCCCATGCCGGGATT
+GCCGTCGGTGGTTTTCCCGTCGCCGCCCGTGCCGCCCTCACCGCCTGTGCCGCCGGCGCCACCCGCGCCG
+CCCGCTCCTCCGGCACCAACGCCACCGTCGCTGCCCGCGCGGCCAATCAGCCCGCCGGACCCGCCCTTGC
+CGCCGAGGGCGCCGGGGGCGCCGCCGTTGCCGCCGTTGCCGCCGGTGTTGCCGTTACCGCCAAACGCTGC
+GCCCGGACCACTGTTGGTGCCGCCACCACCGGCGCCTCCGGCACCTCCAGCACCACCGGAACCACCAGTA
+CCACCGGCACCGGCCGTGCCGCCGACACCACCGGCGCCGCCGTTGCCGATGAGCAGCCCGCCAGCACCCC
+CGTTACCGCCCTGGCCGCCGATACCGCCTTCGCCACCGGTGCCGAGGGCGCTCGCGCCGTCACCGCCCAC
+ACCGCCATCGCCCCCGAACGCCTTGCGTGAACTGCCGGCGCTGTCGGTGTTGGCGGCACCGCCGTCGCCC
+CCGGCGCCGCCGCCGCCGGGGGCACCGCTACCACCGGTACCACCGACTCCGCCCGCGCCGCCGGCGCCGC
+CGTCGCCGATCAGCAGCCCGCCGCGGCCACCGGCGCCCCCGGTTCCGCCCGCTCCGCCGGTACCGCCGGA
+AGCGAAGCTGTCGAAGCCGTTGCCGCCGCTGCCGCCGTTACCGGCTTCCGCGTTGCTGGGAGAATTGGTG
+CCCACCTGGGCATCCCCGCCTTCGCCGCCGGCGCCCCCCACACCGCCGGGGGCCTGGGCGTTCCCGCCGG
+CACCGCCGTTACCTCCTATGGCTGCATTGCCGATGGAAGCGGCGCTGCCGCCGGCGCCGCCAGCGCCGCC
+ATAGGCGCCCTCACCCCCTTTGCCTCCCTCACCGCCCACGGCGTCGCCGTTGACGGTTGAGACGGCGTTC
+CCGCCAGACCCGCCAGCGCCGCCGGACGTCATCGCGTCGCCGGCATCGCCGGGGCCACCGTTACCGCCTA
+TGGCGTTGCCGCCCAGCGTCTGGTCGGTGCCGGTACTGCCGGCATCAGCGGTGCCGGTGGGTGTGGGGTT
+GACGCCGTCTGCCCCGGCTGCCCCCATACCGCCCTGCCCGCCCGCGCCGCCAGAACCGAACAGGTAGGCG
+TTGCCGCCGGCACCTCCTGCTGCGCCCATACCGCCATTGACGCCGGCCACCCCGGTCCCCCCGAGCCCGC
+CGGCCCCGCCATTGCCGTATAACCACCCCCCGTTGCCGCCGACGCCGCCGACCGCGCCGGCCCCTCCGGC
+CCCCCCGGTCCCGCCGATGCCGATCAACCCGGCGCTGCCGCCGGCTCCGCCGGCTTGGCCGACCCCGCCG
+GACCCGCCATTGCCGCCGTTGCCATACAACAAGCCACCCGGCCCGCCGGCCTGCCCGGTACCCGGCGCAC
+CATTGGTGCCGTTGCCGATCAGGGGGCGCCCAAGCAGCGTCTGCGTGGGCGCGTTGATCACATTCAACGC
+TTGCTGCAGCGGGGAGGCATTTGCGGCCTCGGCGCTACCATATGCGCCCGCAGCCGTGCTCAAGGCCTGG
+ATAAACCGTTCATGAAACGCGGCCGCCTGCGTGCCGAGTGTCTGATAGGCCTGGGCGTGCCCGGAAAACA
+GCGACGCCACCGCTGCCGACACCTCGTCGGCGCCCGCGGCCAGCACTCCGGTGGTCGGGGCCAGCGCCGC
+GGCATTGGCCGCGCTCAACGTCGAGCCGATCTGCGCCAAATTGTTTGCTGCCGCTGCCACCATCTCCGGC
+GTCGCCAATACATACGACATCGCTGTCCTCCCGCAGGGTCTTCGTTGACCGATCGGCTGTTACTAACGTT
+AGCGCGAACGCGGGTCGGCGTCTCCAGTTTCTATTTCTTGACATGGAAAAACGGCGGCCCCGACCCTGCC
+TCAGCGTCGCAGCCGTCGTTGGCGGCGAGCACCGGTGACCGTGACTTTGGTAGCGGCCCGTCCGCAGTGG
+GTGCCACGTAGTATTCGGACAGATAGGTAGTGGTAGGCAACCTTCGTGATTCGTCAGCGAGGAGGCGGCG
+ATGGCACAGCAAACTCAGGTCACCGAGGAGCAAGCGCGGGCCCTTGCCGAGGAATCTCGCGAAAGTGGTT
+GGGATAAACCGTCCTTCGCCAAAGAACTCTTTCTGGGCCGCTTTCCCTTAGGGCTCATACACCCATTTCC
+CAAGCCGTCGGACGCCGAGGAGGCCCGAACCGAGGCGTTTCTGGTCAAACTGCGGGAATTCCTCGACACC
+GTGGACGGCAGCGTCATCGAGCGTGCTGCCCAGATCCCCGACGAGTACGTGAAAGGCCTGGCCGAGCTGG
+GCTGTTTCGGCTTGAAGATTCCGTCCGAGTACGGCGGGTTGAACATGTCGCAAGTCGCCTACAACCGCGT
+GCTGATGATGGTCACGACGGTTCATTCCAGTCTTGGCGCGTTGTTGTCGGCGCATCAGTCGATCGGGGTA
+CCTGAACCGCTCAAGCTTGCCGGGACTGCGGAACAGAAGCGGCGGTTCCTACCGCGGTGTGCGGCCGGCG
+CGATATCGGCCTTTTTACTAACCGAACCCGATGTGGGCTCCGATCCGGCGCGCATGGCATCGACGGCGAC
+GCCGATCGATGACGGCCAGGCTTACGAGCTTGAGGGTGTGAAGTTGTGGACCACCAACGGTGTGGTAGCG
+GACCTGCTAGTGGTTATGGCGCGGGTACCGCGCAGTGAAGGGCACCGAGGGGGAATCAGCGCCTTTGTCG
+TCGAGGCTGATTCGCCCGGGATCACCGTGGAGCGGCGCAACAAGTTCATGGGACTGCGTGGCATCGAAAA
+CGGCGTGACCCGGCTTCATCGCGTCAGGGTGCCCAAAGACAACTTGATCGGCAGGGAAGGCGACGGTCTG
+AAGATCGCGCTGACCACACTCAACGCCGGACGGCTGTCCCTACCGGCGATCGCAACCGGAGTTGCGAAAC
+AGGCGCTGAAGATAGCGCGGGAATGGTCCGTCGAGCGAGTGCAATGGGGCAAGCCGGTTGGCCAACATGA
+AGCGGTAGCCAGCAAGATCTCGTTCATTGCCGCCACCAATTACGCGCTCGATGCGGTGGTCGAGCTGTCC
+AGTCAGATGGCCGACGAAGGCCGCAACGACATCCGGATCGAGGCTGCGCTGGCTAAATTGTGGTCCAGTG
+AGATGGCCTGCCTGGTTGGCGATGAGTTGCTACAGATCCGCGGTGGCCGCGGATACGAGACCGCCGAATC
+CCTCGCCGCGCGCGGTGAGCGGGCGGTACCAGTGGAGCAGATGGTGCGGGACCTGCGGATCAACCGGATC
+TTCGAAGGGTCCAGTGAGATCATGCGGCTGCTCATCGCGCGTGAAGCGGTCGACGCGCACCTCACTGCCG
+CGGGTGATCTGGCGAACCCTAAGGCCGATCTGCGGCAGAAGGCCGCGGCGGCGGCCGGCGCCAGCGGATT
+CTACGCGAAGTGGTTGCCGAAGCTGGTTTTCGGCGAAGGCCAACTACCCACGACGTACCGCGAGTTCGGC
+GCCCTGGCGACACATCTGCGTTTTGTCGAACGCTCGTCACGCAAATTGGCCCGCAACACCTTCTACGGGA
+TGGCGCGCTGGCAGGCCAGCCTGGAGAAAAAGCAAGGGTTCCTCGGCCGCATCGTGGATATCGGCGCCGA
+GCTATTCGCCATCTCCGCGGCGTGTGTGCGCGCCGAGGCGCAGCGAACGGCCGATCCGGTCGAGGGTGAG
+CAGGCATACGAACTGGCCGAGGCGTTCTGCCAGCAGGCCACGTTGCGGGTGGAGGCGCTGTTCGACGCGT
+TGTGGTCCAACACCGACAGCATCGACGTTCGGCTGGCAAACGATGTGCTGGAGGGCCGCTACACCTGGCT
+GGAGCAAGGGATACTCGATCAGTCCGAAGGCACCGGACCGTGGATCGCGTCCTGGGAACCGGGTCCATCC
+ACCGAGGCCAATCTGGCTCGGCGGTTCTTGACGGTGTCGCCATCGAGCGAAGCGAAACTTTAGGGCGCCC
+GCGTGGCCGGTCACGTCCGCGGGGGACCGCCCGAGTCTCGTCGGGTACCACGCTGGCGCGTATCGCGTCT
+GGGTGCAGGTTCTATTCCATGTCGTCGACAAACAGCGCCATCGATGCGGTGAATCCGTGCAGGGCATTGC
+GGCCCGCGATCGGGCCGATCTCTCCGGCGGCGAAGAAGCCGGCAAGCGGAATTCCGCCTAGGAGTTCCTC
+GATCGTCGACGCGTCGTGGTCGGCGACCCCGAACATCCGCCGCCCCCGCCCGTTGCAGGTGAACAACAGC
+GCTCCAGCCGCGCGTCCGGGCAGCCGCGCCGCGGCCCGCTCCACGGTCAGGCGTAGGTCCTTGTCGGCCC
+CGGCCGCGTCACGGACCTGGAACTGCATGGTGGCGCCGACCTGGACAACCTCGTCGATCTCGATCGACCC
+GGTCGACGGGTCGGCGCCGAGCAGCCCGCGGATCACGAAATCGCCCTGACCCGGAGCCGCCAGGTGCTCG
+TCGACGACGATCCCGATCTGTAGGCCGTGGCTGACGAGTGCCCTTTCGTCGGGCGACAGCCCCTCGACGA
+TCTCACGCAGTCGCTGCAACGGCGGACGGCCGCCGAGCTCGGTGATCAGTATGCCGTCCGCGCCGGTGAC
+GATGTATGGGTAGCCGATCGGCCGGCAACCCTGCGACACGACCGGGACACCGCGCATCCCGGGCAGGCGC
+ACGCCGACGACGCCGGAGGTGAGCACGTCGTGATCGCGGAACAGCCGGGTGTCGCCCCGCCGGCGCCCGC
+CGCTCACCACGCCGCCCACGACGGCGGTGCCCGGCAGGTCGGTGTTGGGGTGCTCGATGAGCAGGTTCGA
+CGGGAATGTGTACGGGTCCGGCAGCAGCAGATGCAGATCCCGGGCGGTGCGGTCGAACCGATAACCGGTG
+ATCAGGGCACCCGAGCCGGTACGGACAAAGTCCAGCTGGAATGTCTCGGCGGCCAAGCCGGACGCCAGCC
+ACACCACCACCGCGGGCTCGTCCTCGATCTCGTGGCGGCCGGCGACGATGGCCTGGGCGATGCAACCGAC
+AAGCGCGGGCGGATCGATCATCTGCAGCACCGCGCTCAGGACGTCGGCAGCCCGGTCGGTGTGTGCACGC
+GATCCAAGCAACACCGCCAGCGACGGCGCCTCACCCGCCAGCTCGTCGCGCGCCTGGCCCGCAGCCTCCA
+CCGCGGCCTGCCGCGCATCGGGCGTGGTGCAAACCCCGACTCCGATCCGCACAGTTCCATGATGCGCCGA
+TGTGCCCCGGGTGTCGGCGGCTCTTCGGACCGTTGGCGCCGACCGCGCTTAAGCGCGGTCGGCCGTCGAG
+CCGCGGCCTCGTCAAAAGATAAGGCGCACCGACCATTCCGCGTGCGGAACGTCGCGTAGTTCACCCGAGT
+GGTCGACCACCAACGTCAGCAACTGCACGACAATCCCGGTCAGCCGCCCGCGCTGCGGGTCGACAGTGGG
+GATGGTGACCGCCAACCGGGTGTCCGGCCGAAACAAGGTGCTGGTGGTGTTGGCGGGGTCCTGGTATACC
+TGCAGCAAACGCCACGGCGCCCGGGAAATGACTTCGGGTACCGAGAGCTGCACGGGATAGCGTTCGCTTA
+CCGGCAATTCGCCCTGCGCCTGCGGGGTCTGACAGTCGTCGAGGTCGACCACGTTGCAGTACAGATAGGG
+CCCCACGCGGGTCAGGTGCCCGTGCGAGTAAGCGCTGATCTCGGGTTGCTGCGGACCGTGTCCGCGTACT
+AGCAGCCATGCACCGGCCCCGGCCGCCACCGAGAGCAGAATCACCAGGATCACCGGCAGCGTTGCGACAC
+CGCGCTTCACTGCGGCGCCACCGCCGCACCACGACGGGTGGTTTCTTGCTCGGCCATCACGGGCCGATTA
+CCGCCCAGGCCAGGGATCAGCGAATCGCCGCGGAAGCTGACGATGGTCTGAGCCAGACCCAGGATCAGCA
+GCGCGCTCACCGCAGTGAAGCCCACCCACAGCTCGGTGTACACCAACACGCCCACCGCGCCGCCCAGCAC
+CCAGGCCAGCTGAAGAGTCGACTCGGAACGCCCAAACCCCGATGCCCGCGACTCCTCGGGCAGGTCGTGC
+TGCAACGAGGCGTCCAGCGAGGCTTTAGCAATGGCACTGGACCCTGCCGTGATCAGGGTGGCAATCGCTG
+TCGCTGCCAGGCTGCCGGCCACCGCGGCCGCGATGGCTAACACGGTAACTAGCACGGTGCAGCGCACCAC
+CAGCACAGCTGGCCTGCCTAGCTGCAGGCGTGCGCTGGTGAAATTGCCGGCGAAGTTGCCGACCGCGGCC
+GCCGCGCCGATCAGGCCCAGCATGCCCAATTGCACCCACCCGTTGGCTTCGTGCGCCTTGGCGACAAACG
+CCGGATACAAGAACAGAAAGCCGACCATCACCTTGATGGTGCAGTTACCCCACAGGGAGGTAATGATGTT
+GCGGCCCAACGGTTGTCGGAGTGTTCCGCCGAGGTTCTTGACTTCCTCCGGCCAGCGTCGCCGTAGTCTG
+CCCCTATCCCGGTGGTAGCTCAATGTGGCCGGGACCTCACCGCTGGTCACCTCGACCCAGCGCGGAATGC
+GCATCGACAGCGAAGCGCCAGCGATGGTGATCGCGACGACGACGAACAACGCGCCCGGCAGCTGGAACAG
+GTGGGTGCAGACGAATTCGACTCCGGCCGCAATCGCGCCACCAGCGATGGTGCCGCCGAGCAGGCCGAAC
+ACGGTCAGCCGTGAGTTGACCCGGACCAAGTCGATGGTTGGCGGCATCACCCTCGGTGTCACTGCGCTGC
+GCAGCACGCTGAACGACTTCGAGAACACCATCATGGCCAGCGCACAGGGATAGAGCACCCATGACGGGAA
+GCTGCCGGTGGCGCCGTCGTAGTTCATGATCAGCACCACCGCCAACGCGGTCCGAAGTCCGAATGACAGC
+GCCAAGGCGACGCGACGGCCATGCTGCAGCCGGTCGAGTGCCGGACCGATGAGTGGAGCGATCACGGCGA
+ACGGCGCGATGGTGATCAACAGGTACAAGGCGACCCTGGACTTGCTCTCCCCGCTGGCGGCCGCAAAGAA
+TAGTGTGTTTGCCAGTGCTACCGCCATTGCCGAGTCGACCGCGAAGTTCGCCATTACCGGCCAGGTCAAT
+GCCGTCAGTCCAGACTTGTCGGCGCCGTCTGCGGTAGCGGCCCGGTGCACCAGCAAGTACATCCGAGAAC
+CCATTTCGCGGCTGCGCATGGCCGCGGCGCGGGTGACGGTGATCCGCTCGCCCGCCCTTGTAGTCCGTGG
+CGGTACGCGGCTGCGTTCAGGTTCGGGCTGCTCGCCCAGCGGCGGGAGATAGCGGTTGGCACTGGGCATC
+GGCGGAGGTCGACGCGATCGGCGATAGTTGGCGTCGCCGGGAGGGTAGTTGGCCATGCCAGGGTGCCCGT
+TGACCGATCCGTTTCGGGTCCGGCGGCCCGGGGTTGGGGCCATCCGGCCCGGATGATCACCTCGCCGTCC
+GGACACAAATCAATTCTGTCCTATCCGGACTCCTGGCGTAGCCAACCGGGTGTGGCTTGCCGGCCGTGTC
+TTCCGGCAGTATTGGAAGCGCGTTACAGAGAGGGGACAGCGTGACCGGGCCCACCGAGGAGTCTGCCGTG
+GCGACTGTGGCCGACTGGCCCGAGGGGTTAGCGGCGGTGCTCAGGGGTGCGGCCGACCAAGCCAGGGCCG
+CCGTTGTGGAGTTCAGCGGCCCGGAGGCGGTGGGAGACTACCTGGGCGTCAGCTACGAGGATGGCAACGC
+CGCCACCCACCGGTTCATCGCGCATCTGCCTGGCTACCAGGGATGGCAATGGGCCGTCGTGGTGGCGAGC
+TATTCCGGTGCGGACCATGCCACGATCAGCGAGGTGGTGCTGGTCCCGGGGCCTACCGCACTGCTGGCGC
+CGGATTGGGTGCCGTGGGAGCAACGGGTGCGGCCGGGAGACTTGAGCCCCGGAGATCTGCTGGCGCCGGC
+GAAGGATGATCCGCGGCTGGTTCCGGGTTACACCGCCAGTGGTGATGCGCAGGTTGACGAGACCGCCGCA
+GAGATCGGGTTGGGTCGGCGCTGGGTGATGAGCGCCTGGGGTCGCGCCCAGTCGGCCCAACGGTGGCACG
+ACGGCGACTATGGTCCCGGCTCTGCTATGGCGCGGTCGACGAAACGCGTCTGCCGCGACTGCGGTTTCTT
+CCTGCCGCTGGCCGGGTCGCTGGGCGCAATGTTCGGGGTATGTGGTAACGAACTGTCCGCTGACGGGCAT
+GTTGTCGATAGGCAATACGGCTGTGGCGCCCATTCCGACACCACTGCGCCGGCCGGTGGCAGCACACCCA
+TTTATGAGCCGTACGACGACGGTGTGCTCGACATCATCGAGAAGCCGGCTGAATCATAGGTTTTCTCTCA
+CCCGCTGTTCCCTACTTTTTTTGGGGGGGGGCACCAGTCGAAGAAACCCGACTGATTATCACCCGTATTG
+AACACTCCCGAGCTGTTGTCGCCCGAGTTCGCCACACCTGAAGTCTGGAGGGTGCCCGTATTGGCCAAGC
+CCGAGGTGAATCTGCCCACGTTGAAGAAGCCCGAGTTAACGCGGTGCCTGCATTCTGGAAGCCGGAGCTA
+GTGTCGCTCGCGTTTCCGAAGCCGGAGCTGCCGTTGCCCAAGTTCTGGAAGCCGGAGCCACTATTGCCGG
+AGTTAAAGAAGCCCGAGTGACCGGTGCCCGTGTTGCCGAAGCCCGAGTTCGCGACGCCTTGAGTGACCGG
+GCTGCCGATGCCGGTGTTCAGGTCCCCCGAGTTGAAGCCGCCCGTGTTGGTGTCGCCCGAATTACCCCAT
+CCCGTGTTGTCGTCGCCGGCGTTTCCGAAGCCGAGGTTTCCAGAACCTTCGTTTCCACTGCCGATGTTGA
+GGAAGCCGGCATTTCCGCTGCCGAAGTTGGTGTTGCCGTCGTTTCCGTTGCCGAAGTTGAAGAAGCCGGC
+GTTTCCGCTGCCCAGGTTTGCATTGCCGATGTTGCCGTTGCCGAGGTTGGCGTTGCCGATATTCCCGATG
+CCGAAGTTGTAGTCGCCGGTGTTGCCGCTGCCCACGTTGTTGTTGCCGATGTTGCCGATGCCCAAGAAGT
+TCCCCACGCCGATGTTCTCGACGCCCAGGGCCGGGATCGCGAGCGCTGCTGGGACCCCCACCGCACCGGC
+CGGCGCGGCGGTCACCACGGGCGGCAAGACACTCAGCAGCTGCTGCCACGGGGTCAACTGCGAAGCCACC
+GTCGAGGCTCCACCGTGATAACCCACCATCGCCGCCACATCCTGTGCCCACAACTGCTCATAGGACGCCT
+CGGTCGCTGCGATCGCTGGCAAATTCTGCCCAAACAGATTCGAGAGCACCAACGACAGCAACTGGTTGCG
+ATTGGCCGCCACCAATGCTGGATGTGCGGTCGCTGCCCGCGCGGCCTCATATACTGCGGCCGCAGCCTTG
+GCCCCGGCAGCCGCCCCCTCAGCGCGTGCCGTCGCCGCGTTCAGCCAACTCAGATACGGTGCGGCCGCGG
+CCGCCATCGCGGCCGCCGCCGGACCCTGCCACGCCGAACCCGGCCCAGCCGTTAGGCCTGAGATCAGCAA
+CGAAAACGAGGCCGCTGCCATCCCCAGCTCGGCGGCCAGCCCATCCCAGGCCACCGCCGCCGCCAGCATC
+GGGGCCGGCCCCGCACCGGCGTAGATCCGCGCCGAATTAACCTCCGGCGGCAGCACCATGAAATTCATCA
+CGCCATCCCTTCTCAGCTGGCCACCCCCGGCCTAGCCACCACGACGGCGGGACCCGGCTGCCGCGATCCG
+CGCCGGCGGGCCTCGGTCGACTACAGTGGCGCGATCGCTCGACAACTTGAGCACCTTGGCAAACGACGGT
+ATGTCCAATCGCGGCACATTGTCGGGGTTTTCATCGAAATCCTGTCGCCAACCCCGACAGCCGGGTTCCG
+GGAAGCCGGGTGTCGCAGTGGTTTAGGTGTCGACGTTGAACACCCGGGCAGGCAACCGGCCGTGGCTATT
+TCGGGTCGAGATAGGTTTCGAGTCCGGCTTGTGCGCCGCGTGCGCCACGGCGGGCAGCGGCGAGCTGCCA
+GACGAAGATGGTCGTGCCGAGCAACCCTGTTGCCAGCCCGGCCACTGTCACCGGACGCCAACTTGCGAGG
+CCAGGCACGACGAATGCGGCCACCGCGGCGACCAGCCAGGCGAGCGCGCCGACCGCGATCACCGGCCACA
+CCTCGAGCAGCACGGGTGGTAGCGGTGGCGGCTCGCGAATCTGACTATTTTCGACGCTCATCCCGAGTCA
+ACATAGCGCGGCGATGATGCGTCGGCGAACGGCCCGGGGTGGGTGGCTTCCGCACCAGCGGGAGGTACCA
+CCACCTGCTGGTGGGTCGTCGGCCGGCAATGGGTGGAACCGAAATCGTCGTTCGCCGTTTCAGATGCCCT
+AGTCTGAACTTCCGTTGTAACCTCAGCTGTGCTTGACAGCGATGCGCGGCTGGCCAGCGACTTGTCATTG
+GCGGTCATGCGGCTCTCCCGCCAACTGCGGTTTCGGAACCCGTCATCGCCGGTCTCGCTGTCCCAGCTCT
+CAGCGTTGACGACGCTGGCCAATGAGGGCGCGATGACCCCGGGTGCGTTGGCGATTCGTGAACGGGTCCG
+GCCACCGTCGATGACCAGGGTGATCGCCTCATTGGCCGACATGGGTTTTGTAGACCGCGCCCCACACCCC
+ATCGACGGTCGGCAGGTGCTGGTCTCGGTGTCGGAATCGGGCGCCGAATTGGTCAAGGCGGCACGGCGGG
+CCCGGCAGGAGTGGCTGGCTGAGCGGCTCGCGACGCTGAACCGCAGCGAGCGTGACATCCTGCGCAGCGC
+CGCCGATCTGATGCTGGCTCTGGTCGACGAAAGCCCGTGACCGAAGGCCGTTGTGCCCAGCACCCCGACG
+GCCTCGATGTTCAGGACGTCTGCGATCCCGACGACCCACGGCTCGACGATTTCCGTGACCTGAACAGCAT
+CGACCGTCGTCCCGATCTGCCGACCGGCAAGGCGTTGGTGATCGCCGAGGGTGTGCTGGTGGTGCAGCGC
+ATGCTGGCCTCACGGTTCACGCCGCTGGCGCTGTTCGGCACCGACCGCCGGCTGGCCGAGCTCAAGGATG
+ATCTGGCCGGTGTCGGCGCGCCGTACTATCGAGCGTCGGCTGATGTCATGGCACGGGTGATCGGCTTCCA
+TCTCAATCGTGGGGTGTTGGCAGCCGCGCGCCGGGTGCCGGAGCCGAGCGTTGCTCAGGTGGTCGCCGGG
+GCGCGCACCGTCGCAGTGTTGGAAGGCGTTAACGACCATGAGAACCTGGGCTCGATCTTCCGCAACGCGG
+CAGGGCTGAGCGTGGACGCGGTAGTGTTCGGCACCGGCTGCGCTGATCCGCTCTACCGTCGTGCGGTCCG
+GGTATCCATGGGACACGCGTTATTGGTGCCATATGCACGCGCGGCCGACTGGCCCACCGAACTTATGACG
+TTGAAAGAGAGCGGCTTTCGACTGTTGGCGATGACCCCACACGGCAACGCGTGCAAACTACCGGAGGCCA
+TCGCCGCGGTGTCGCACGAACGGATTGCGCTACTGGTGGGCGCGGAGGGCCCGGGCCTAACGGCGGCCGC
+ACTGCGGATTAGCGATGTGCGGGTGCGCATTCCGATGTCCCGAGGGACCGACTCCCTCAACGTCGCGACG
+GCGGCCGCATTGGCTTTCTACGAGCGGACTAGGTCGGGCCATCACATTGGGCCCGGCACGTGAACGATCA
+GCGCGACCAAGCCGTGCCCTGGGCAACGGGTTTGGCGGTCGCCGGCTTCGTCGCCGCAGTCATCGCGGTT
+GCGGTCGTGGTGCTGAGCCTCGGCCTGATCCGCGTGCATCCGCTGTTGGCCGTCGGTCTCAACATTGTGG
+CGGTCAGCGGGTTGGCCCCTACGCTGTGGGGCTGGCGCCGCACCCCAGTGCTGCGCTGGTTCGTGCTTGG
+CGCGGCAGTGGGCGTGGCGGGCGCGTGGTTGGCGCTGCTCGCCTTGACGTTGGGGGACGGCTAGCGACGC
+CCGCCTGAGCGCACCCCGAGCAGCACATCTTCCCAGGCAGGTATGGCGGGTTTGCCTCGTCGGTTGCTGA
+CCGGCTGTGCGGACGGCACCGTGAGCGTCGGCTGTGCGGGCTCGGGCTCATCGAAGTCGAGATGGGCGAC
+CGGCGCCAACGGCCGTAGCGGGCGATTGAAGGTGGGGTTGATCAGCTCATGGGCCGTGTCGTCGATCGCG
+GTGGCGGTTCCGCCGTGGGCGCCGGGGGTGAAGCGGAAATGCGCCAGGTTGTCGGAGCGGCCAGCCTTCC
+AGGCAAGCTGCACCGTCCAGCGACTGTCCTCGTTGCGCCACGCGTCCCAGGTGAGGCTGTCGGGGTTAAG
+GCCGCGTGCCACCAGGGCCGCGGCGACGGTCTCCTGCATGGTCAGCACCGCCGGGCCGTCGGCCAGGACC
+GGGTGCGCCGCGGTTGCCAGCTCGGCCGCGCGCGAGCGTTCCAACAGTACCGGGTGGGCAAACCGGCGGA
+TACGGGCGATGTCGGAGCCCGATGCCGCAGCGACCTGTTCGACAGACGCGCCGGCCCGAATTCGGGCCTG
+AATCTCCTTGGGGCTCAGCACGTTGGTGACCTCGATGTCCAGCTGGGCTTGCTCCGGCTGGACGGAGTCG
+TCCCGTAGCGCCGCCCGCAGTCGGTCGTCGACCGGCAGCTTGAACTGTTCGGACGGGATGGCACCCTGGC
+AGATGATGTTTTTGCCGTCGGCATCGAGCCCAACGACTTTGAGTTCCCGCATGGCTTCTCCTCGCAGGCT
+CCGGGCAGGACAACGCCGGACCTGTTACGTGCGCACTCTAGTGCGGTAAACGCCGTTAGCCTCGTTGACA
+CGCGGAGGTGTCTTGCCGGCATGGCGCTGGTGACCGGAATGCCCGGTCACAGCCGCACTAAGGCAGCGCT
+AAAGCCGCTCGACCACCCAGTCGACGCACTCGGTGAGGGCGCTGACGTCGTCCGGCTCGACCGCGGGGAA
+CATCGCGACCCGCAGCTGGTTTCGGCCCAGTTTGCGATACGGCTCGGTGTCGACGATGCCGTTAGCCCGC
+AGGATCTTCGCGACGGTCCCGGCGTCGACGTCGTCGACGAAGTCGATCGTGCCCACCACCTGCGACCGCA
+ACCCGGGGTCGGTGACAAATGGCGTGGTGTAGGGCCGCTCTTGCGCCCACGAGTACAACCGCTGCGACGA
+GTCCGCGGTGCGTTTGACCGCCCAGTCCAAGCCACCGTTACCCACCAGCCAGTCGATCTGTTCGGCCAGC
+AGCGCCAGCGTGGCGATGGCCGGTGTGTTGTATGTCTGGTTCTTCAAGCTGTTCTCGACCGCGATCGGCA
+GGGACAGGAAATCAGGAACCCAGCGACCGGTCGCGGCGATGGCCTCGATCCGGCTCAGGGCGGCCGGGCT
+CATGATGGCCAGCCACAGGCCGCCGTCGCTGGCGAAGTTCTTCTGCGGTGCGAAGTAGTAGGCGTCGGTC
+TCGGCGATGTCGACCGGTAGGCCGCCAGCACCGGAGGTGGCGTCGATGACGACCAAGGCGTCATCGGAGC
+CCTCCGGACGGCGCACCGCAACCGCGACCCCGGTCGAGGTCTCGTTGTGGGCCCAGGCGATCACATCGAC
+TGACGGGTCGGTTTGCGGCTCCGGAGCACTGCCGGGATCCGACGTGATGATGATCGGCTCGCCGACGAAC
+GGGTTCTTGGAAACGGCGGAAGCGAACTTCGCGCTGAACTCGCCGTAAGTCAAGTGCAGTGAGCGTTTGT
+CAATCAGCCCGAAGGCGGCCGCATCCCAGAACGCCGTGGCACCACCATTGCCCAGTATCACCTCATAGCC
+GTCCGGCAACGAGAACAGCTCGGCCAGGCCTGACCGAACCCTGCCCACCAGATTCTTGACCGGCGCCTGT
+CGGTGCGACGTGCCGAACAATGCCGCTGCGGTGGTGGTCAGCGTTTGCAGTTGCTCAAGCCGGACCTTCG
+ACGGGCCCGACCCAAAGCGGCCGTCGCGGGGTTTGATGGCGGTGGGAATTTCCAGGTGGGGGGTGAGCTG
+GTCGGCCATGCCATCAGGGTAGTGAGGGGTACCGAACCGCGGCGACTCGAGCGGAACGAAAGCCTGCCGG
+CACAGGCGCGTAGTGTGAACAAGCTCACATGCAAGCCCTGGCTGGTGGCTGGGTCATAGTGTCGCCAAGG
+GTCTGGATAATTCCCGGTACCAGCGGTACCGTGTTCGATACCCGTGCGGACGCACACCTCGGTGGGGAGG
+CTTCGAATGGACAGGACGCGCATAGTTCGGCGGTGGCGCCGCAACATGGACGTGGCCGACGACGCCGAGT
+ACGTGGAAATGCTGGCCACACTGTCCGAGGGGTCTGTGCGGCGGAATTTCAACCCGTACACCGATATCGA
+CTGGGAGTCGCCGGAGTTCGCCGTCACGGACAACGATCCCCGGTGGATCCTCCCGGCGACCGATCCGTTG
+GGCCGCCACCCCTGGTACCAGGCGCAGTCGCGGGAACGCCAGATCGAGATCGGGATGTGGCGCCAGGCCA
+ACGTGGCCAAGGTCGGGCTGCACTTCGAATCCATCCTGATTCGCGGCCTGATGAACTACACGTTCTGGAT
+GCCCAACGGCTCACCGGAATACCGGTATTGCCTGCACGAATCGGTCGAAGAGTGCAACCACACCATGATG
+TTCCAGGAGATGGTCAACCGTGTCGGCGCGGACGTTCCGGGGCTGCCACGGCGGCTGCGGTGGGTTTCAC
+CGCTGGTTCCGCTGGTGGCCGGACCATTGCCGGTGGCCTTCTTCATCGGCGTGCTCGCTGGGGAGGAGCC
+CATCGACCACACGCAAAAGAACGTGTTGCGCGAAGGCAAGTCGCTGCATCCGATCATGGAACGAGTGATG
+TCCATTCACGTGGCCGAGGAAGCGCGGCACATCTCGTTCGCCCACGAGTACTTGCGTAAGCGGCTGCCGC
+GCCTGACCCGGATGCAGCGGTTCTGGATCTCGCTCTACTTCCCCCTGACGATGCGGTCGTTGTGCAACGC
+GATCGTGGTGCCGCCCAAGGCATTCTGGGAGGAATTCGACATCCCGCGCGAGGTCAAGAAGGAGTTGTTC
+TTCGGCTCGCCGGAGTCGCGAAAGTGGTTGTGCGACATGTTTGCCGACGCCCGCATGCTGGCCCACGATA
+CCGGATTGATGAACCCGATCGCTCGGCTAGTGTGGCGACTCTGCAAGATCGACGGCAAGCCGTCGCGCTA
+CCGCAGCGAGCCGCAGCGTCAGCACTTGGCTGCCGCGCCGGCCGCATAGCTTGCTACGAGTGCACGCATG
+CCGCACGTAATTACTCAGTCGTGCTGCAACGACGCGTCCTGCGTCTTCGCATGTCCGGTGAACTGCATCC
+ACCCGACGCCGGACGAGCCGGGCTTCGCGACCTCGGAAATGCTCTATATCGATCCGGTGGCCTGCGTGGA
+CTGTGGTGCCTGCGTAACCGCCTGCCCGGTCAGCGCGATCGCGCCGAACACCCGGTTGGACTTCGAGCAG
+CTGCCGTTCGTCGAAATCAATGCGTCGTATTACCCGAAGCGGCCCGCCGGCGTGAAGCTAGCGCCGACGT
+CGAAGCTGGCTCCGGTGACTCCGGCCGCCGAGGTGCGTGTGCGCCGGCAGCCGCTGACGGTAGCCGTCGT
+CGGGTCCGGGCCCGCGGCGATGTATGCCGCCGATGAGCTGCTGGTCCAGCAGGGAGTGCAGGTCAACGTC
+TTTGAGAAGCTGCCGACACCCTACGGGCTGGTGCGCTCCGGGGTGGCGCCGGATCACCAGAACACCAAGC
+GGGTCACGCGACTATTTGACCGGATCGCCGGTCATCGCCGCTTCCGGTTCTATCTCAACGTCGAGATCGG
+CAAGCATCTAGGCCATGCCGAGCTATTGGCCCACCATCACGCCGTGCTGTACGCGGTCGGAGCGCCCGAC
+GACCGCCGGCTGACGATTGACGGGATGGGACTGCCGGGCACCGGTACCGCCACGGAGCTGGTCGCGTGGC
+TCAACGGACATCCCGACTTCAACGATCTGCCAGTCGATCTCAGTCACGAACGCGTGGTGATCATCGGCAA
+CGGGAATGTCGCGCTCGACGTGGCGCGCGTGCTTGCGGCCGATCCGCACGAGCTGGCCGCCACCGACATC
+GCCGACCACGCGTTGTCCGCGTTACGCAACTCGGCGGTCCGTGAGGTGGTGGTCGCCGCCCGCCGCGGTC
+CTGCCCATTCGGCGTTCACCCTGCCCGAGCTGATCGGGCTCACGGCCGGAGCCGACGTCGTGCTTGACCC
+GGGAGATCATCAGCGAGTACTCGATGATCTGGCAATCGTTGCCGATCCGTTGACCAGGAACAAGCTGGAG
+ATCTTGAGCACGCTGGGGGACGGGTCGGCGCCTGCGCGACGAGTCGGGCGCCCGCGGATCCGGCTGGCCT
+ATCGGCTCACGCCGCGGCGCGTCCTCGGCCAGCGGCGGGCCGGCGGAGTTCAGTTCTCGGTCACCGGAAC
+CGACGAGCTGCGCCAACTGGATGCTGGCCTGGTGCTGACGTCGATTGGCTACCGCGGCAAGCCGATTCCC
+GACCTGCCGTTCGACGAGCAGGCCGCGCTCGTGCCCAACGATGGTGGACGGGTCATCGACCCGGGCACCG
+GCGAGCCGGTGCCCGGCGCATACGTCGCGGGTTGGATCAAGCGCGGGCCCACCGGGTTCATCGGCACGAA
+CAAGTCCTGCTCTATGCAGACCGTTCAGGCGTTGGTGGCCGACTTCAACGACGGCCGGCTGACCGATCCG
+GTGGCTACACCGACGGCGCTGGATCAGCTGGTGCAGGCCCGCCAGCCCCAAGCCATCGGCTGTGCGGGAT
+GGCGGGCCATCGACGCGGCCGAGATTGCGCGCGGCAGCGCCGACGGCCGGGTCCGCAACAAGTTCACCGA
+CGTCGCCGAGATGCTCGCGGCAGCAACCAGCGCGCCTAAGGAACCGCTTCGGCGGCGCGTGCTGGCCCGG
+CTGCGTGACCTGGGGCAGCCGATCGTGCTAACCGTCCCCTTGTGATGACATGGCGGCTTGGATCTCATCC
+ATGTTGACCTCGCGCACCGGCTGGCCCAGCGACCAGTGGTGGCCGAACGGGTCGGCGACCACCCCGTAGC
+GGTCTCCCCAGAGCTGGTCCTCCAAGGCGGTCACCACCGTGGCGCCCGCGTTCAGGGCACGCTGGAACTT
+GGCGTCGACATCGGTGACGGTCAAATGAATGGTGACCGGTGTTCCGCCCAGCGAGGTGGGCGTCATCGAC
+TTGCCGCCGCACATCTGCGGGACGTCGTCGTTGAGCATCACCGTAAAGCCGTTGATGCGTAGTGCGGCGT
+GGATCAGTTTGCCATCGGGACCGGGGACGCGCCCCAGTTCGACGGCGTCAAAGGCCTTGACGTAGAAGTC
+GATCGCCGAGGCAGCGTCGTCGACGACAAGGTGTGGTGACAGAGCGGGTTCGACGTTGATCGCCATGGTG
+TCTCCTTGTTGTTGGTGTGCTCGGCCAATCCGGGGCCCGGACAGGCTCACGGATATTGACTCCCGGCGCG
+ATGGAAAATCATCGCGGTGCCGTCATTCAATCGCCGGACACGTGGCCACCGCCCAGCGGTGTGGCCAGCA
+AGCCGAATCTCAACCGCAGGTGTGTTCAATGAATACTTTTCCGTCACAACGTGATTGCTGCTTTGTGTCG
+ACAAGCGCACTTTTCGGTCTCGACACGAATGCTCTTCCGTTACAGCGCAAGTTGAAACTTTCTGCACGCA
+ACCCATGCCGACCATGTCCGCGCCACCCGCTCAAGCGCCGGTATGTGGCGCCTTGGCGGCTAGGCCAACC
+GCCCCCGGCAACGCCAGCTGCACACGCCCAGCGAAGCGCGATTGTCGGTACGGGTCGCGCTGCGAAACCT
+GCCTCCCATTCGCACTAGCAAAAGACTGTCGACAAGCGAGCAGTCGACTTCAGGCCGCGACCGAACCCGA
+CGAGACGACAACAACATCTGTCATCTCAATGCGCTCACCAGGATCGCTACAATATCAGCCAGCTACATGA
+GCCGATGTATATCCAGGAAGGCTCTGCCGCCGACATGTTGGATCGCTCGCGCGGACAGCTGTACCGGCTC
+TACCTGGCTAGTAGGTGAATTCAATGGCGCGTTCGCTCATTACTCACCCATGTGCACAATAGGTTCGCGT
+GCGGCTCGCCGGCAACGTTGGCAACATCCCGATTCCCATTGATTGCACGTTGCGCGGCCTAACCCAATAT
+TCCCGGACGAACAACGCCGAGGTCGTGCAGAGCGTCGAGACACACCACCGTCCCGCTAACTTTGATGCCC
+TCACCTGAGGAAAACCACAGGAGCGTCAGGTACTCACCCACTGCGGGAATTGCGATGACGTTCAAACCGA
+TCGAGGCCGCGCAGCTACGCCAGCGCGCAGTGAACAGGCCGTAACTGGACCGCGCTTGCGCAACGTTCGA
+AAAGGGATCCGGTGGAGCGGCCCGACGACACCAAATAGGCCATATCCCCCAAAGACTGGTATTGACAACC
+GTTCTGATGCCGCGTCAGACTTCCCACCACGCCACGGACCGTCCAACGCCAGAACTCAATACCGTCTCGT
+CCCAGGCGAAACCGTGAGCCTAGCCGATGATCTCCTGGCATTGGTCGGACTGGACTTGATCTGCTCGCTG
+ACAAGCATACGTATCAGTGCTACGAACCGTTCACGCGGTGAACCTGCTGGGCGCACAAGGAGAATCGATG
+GATTACGCCAAACGCATCGGCCAGGTTGGGGCGTTAGCCGTTGTCCTGGGGGTGGGGGCGGCGGTGACTA
+CCCACGCGATCGGCTCTGCCGCGCCGACGGATCCGAGCTCCTCGAGCACCGATTCGCCGGTCGACGCGTG
+CTCGCCGTTGGGTGGGTCCGCCAGTTCGTTGGCTGCGATACCGGGCGCCAGTGTGCCACAGGTCGGCGTG
+CGACAGGTAGACCCCGGAAGCATCCCCGATGACTTGCTCAATGCCCTGATCGACTTTCTGGCCGCGGTAC
+GCAACGGGTTGGTGCCCATCATCGAAAACCGCACTCCGGTAGCGAATCCGCAACAAGTCAGCGTCCCTGA
+GGGGGGCACCGTCGGCCCGGTCCGGTTTGACGCCTGCGACCCCGATGGCAACCGGATGACCTTCGCGGTG
+CGCGAGCGCGGTGCACCCGGTGGACCCCAGCATGGCATCGTGACCGTCGACCAACGAACGGCCAGCTTCA
+TCTACACAGCCGATCCGGGTTTCGTTGGCACCGATACCTTCAGTGTGAACGTCAGCGATGACACCAGCCT
+GCACGTGCACGGTCTGGCGGGATACCTGGGTCCGTTCCATGGGCACGACGACGTCGCCACCGTGACCGTG
+TTCGTCGGCAACACCCCGACCGACACCATCAGCGGCGACTTCAGCATGCTCACCTACAACATCGCGGGGC
+TGCCCTTCCCGCTATCCAGCGCAATTCTGCCCCGGTTCTTCTACACCAAAGAGATTGGGAAGCGGCTCAA
+CGCCTACTACGTCGCGAACGTCCAGGAGGATTTCGCCTACCACCAATTCCTCATCAAGAAATCCAAGATG
+CCCAGCCAGACCCCGCCGGAGCCGCCTACCTTGCTGTGGCCTATCGGTGTGCCCTTCTCCGACGGGCTCA
+ATACCCTCTCGGAGTTCAAGGTGCAGCGGCTGGACCGGCAGACATGGTATGAGTGCACATCCGACAACTG
+CCTCACCTTGAAGGGCTTCACCTACAGCCAGATGCGGCTTCCCGGCGGTGACACGGTCGACGTCTACAAC
+TTACATACCAACACCGGTGGAGGGCCGACCACCAACGCCAACCTCGCGCAGGTCGCCAACTACATCCAGC
+AGAACTCGGCGGGCCGCGCGGTCATCGTCACCGGCGACTTCAACGCGCGGTACTCCGACGACCAAAGCGC
+TCTGTTGCAATTTGCGCAGGTCAACGGGCTCACCGATGCCTGGGTGCAGGTAGAACACGGCCCCACCACA
+CCGCCGTTCGCGCCCACTTGCATGGTCGGCAACGAGTGCGAGCTGCTCGACAAGATCTTCTATCGAAGCG
+GCCAGGGAGTGACGTTGCAGGCCGTCAGCTACGGCAACGAGGCGCCGAAATTCTTCAATTCCAAGGGTGA
+GCCACTGTCGGATCACAGCCCGGCGGTGGTCGGCTTCCACTACGTCGCGGACAACGTGGCCGTACGGTGA
+CAGCGGTTGATCGCCAACTGGTTTGCCGTCGGCCTCAGGCGGTGGTGAGTACCCGCTCCCAGCCGTCGAC
+CGATTCCGGGCTGCGCGGGCCCGGTCCCACGTAAATGGCCGACGGGCGGACCAGCTTGCCGAGTCGCTTC
+TGCTCGAGAATGTGGGCACACCAGCCGGCAGTGCGCCCACAGGTGAACATTGCTGGCATCATGTTGGCCG
+GTACCCGGGCAAAGTCCAGGACCACTGCGGCCCAGAATTCGACATTGGTCTCGATCGCCCGATCCGGACG
+GCGCTCTCGCAGTTCTGACAGCGCAGCCTGCTCCACCGCGACCGCGACCTCGTAGCGGGGGGCGCCCAGC
+CGCTCGGCGGCCGCCCGCAGCACCCGCGCCCGCGGGTCCTCGGCGCGGTAGACCCGGTGCCCGAACCCCA
+TCAGTTTCTCGCCGCGGTCCAGGATTCCCTTGACCACGCTGCGGGCATCGCCGGCGCGTTCGACCTCGTC
+GAGCATCGGCAGGACGCGCGCCGGCGCGCCACCATGCAGCGGTCCGCTCATCGCCCCGATTGCGCCCGAC
+AGCGCTGCTGCCACATCCGCCCCAGTTGAGGCGATCACACGCGCGGTGAATGTCGAAGCGTTCATGCCGT
+GCTCGGCGGCCGACACCCAGTAGGCGTCAATGGCCTCGATGTGTCTGGGGTCTGGCTCGCCCTGCCAGCG
+CGTCATGAAACGTGCTGTGACCGTCGAGCATTCATCGATGATTCGCTGCGGGACCGCCGGCTGGTAGATG
+CCCCGTGCGGATTGCGCGACATAGGACAGCGCCATCACCGATGCCCGGGCCAGCTGTTGGCGGGCGGTGG
+CGTCGTCGATGTCGAGCAGCGGCGCATATCCCCAGATGGGCGCCAGCATCGCCAGGCCGGCCTGGACGTC
+GACGCGCACATCGCCGGAGTGAATCGGCAGCGGGAACGGTTCAGCCGGCGGCAGCCCGCTGCCGAAGTTG
+CCGTCCACCAGCAGCGCCCACACATCGCCGAAGGTGACCCGCTGACTTACCAGGTCTTCGATGTCGACGC
+CACGGTAGCGCAGGGCCCCGCCGTCTTTGTCCGGCTCGGCGATCTCGGTCGTAAAGGCCACCACGCCGTC
+GAGGCCGGGGACGAAATTCTCCGGGACCACTGTCATACGAGAATTCTCACACCTGGCCCCGGCAACGACG
+CTACCGGCTGGTGCCAATCACGGTGCCGGCGATGAGCGTGCCGCGAGAATCGTCACGAGGGTGAGCCGCG
+GCGTGCCGCCTCGTCTACCAGTTGTACTCGGGAGGCCAAGCCAAGTTTGGCGTAGACGTGGGTGAGGTGG
+GTTTGCACAGTGCGCGGCGAGACGAAAAGCCGTTTTGCAATGTCCTTGTTGGATAACCCCTCGCTGACCA
+ACCGCACGACGTCGCGTTCGGTCGGGGTCAACGAGCCCCACCCGCGGGCCGGTCGCTTGCGTTCACCGCG
+ACCGCGTTGTGCATATGCGATCGCCTCGTCGGTGGACAAGGCGGCCCCCTCGGCCCAGGCGCGGTCGAAA
+TCCTCATCACCCATCGCCTCACGAAGCGCCGTCACCGAGGCCTGGTAGCCGGCATCCCAAATCTTGAAGC
+GGACCTGACGTGTCTGTTGCCGAAGGGCGGCTGCGGCACCGAGAAGGCGGACACCTTCGGAGTGACTGCC
+GACCTCGCCGGCCAGGCCGGCGAGGAGTTCCATGGCATCTGGCATGCCCTGGTAGATGTGCAGCTCGGCG
+CCGCACGCCAGCGCAGCATGAGCATCATCGCGCGCCAGTTCTGGTTCGCCCCGTGCGGTGGCTACGCGCG
+CGCGTATTGTCAACGCCACCATTCGGTGCCACCCATTGGTCGCATCGACGGCGTCGTTGGCGAACTGTCG
+TGCGGCGATCGCATCACCTCCTGCCAGGGCTAACTGCGCCATCAGGACCTGGTGCATGGTCACCTGGTCG
+GGCTGGGCCCTAAGAATCGGCCGCGCCGCGTCGCTGGCCTCGAGCGCTGCCGTGACATCACCGGCGGCCA
+GCGCGGCGTACGTCATCGCCGCATAACCAATGCCTTGGTACACACCGCCTAACTCCGTCGCGGCTGCAAT
+GCACGCCCCGGCTATGGCGTGGGCCGCGCTGGCGCCGCAATACGCCAGCACCTGGGCTTGGGTATATAGG
+CCGAGAACCTTTGTCGGCACATCGTTGGATGCCTCGGCCTCGGCAGTGATTTCCCTGGATAGCTCGAGGG
+CTTCGGTCAGATTGCCAGCCCACATCTGCGCCAAACTAAGCCACAAGCTGCAGTGACGTGAGACGAACCG
+GTCGCCGATGGTGTCGGCCAGGTCGCGGCATTCTTCTGCCGCGGCTCGCAAAGCATTCGGGTCACCTGAT
+ATGCAGGTCCCCACCCCCCGCCAGTAGAGGATTTGACACAGCGTCCATTTGTCGTCAATAGCGCGTGCCA
+GGTCGGTCGCTTCGGCGAAATAGGGCGCAGCGGCCTCCGCGTTGTAGCCACTGCTACAGCCGCAGGCGGT
+GAGCGCCCGCACCAACGCGGCGGGGTCGCCCACCTCACGTGCCATCGCCAGCGCTTGTTGTGCGGGAGCG
+ATGATGTCGGTGGCGCCTACCGGACTGGTGGCCAGCCAGGTACTGAGCATTGCCTTGTCAGCGAGCGCTC
+GCGCCCGTACTGCTGTTGACACAGCGAGCCGGTGGAACCTTTGGTCTTCCAGGATCGAGTTGAACCAGGA
+CAACCCCTCGCGCAGGTGCGCCCGCCCGAACCAGATTGGTTGCAGCGAAGATGCGAGCTGTAACGCTTCG
+GTGATATGGCCATTTTCCCGGCTCCAGGCGAACGCGGCGCGCAGGTTGTCGATCTCGGTCTCAGCCCGGG
+CGACAAGCCGTTGGTGATCGTTGTCCGCAGGAGTGTTGAGTGAGGCGGCCAGCGCCGTGTAGTAGTCACG
+GTGACGTGCGTGCACATCGGCCTCGCCGGAGTCGCCCAGTTTTTCCAGCGCGTACCGACGCACCGTTTCC
+AGCAGCCGGTACCGCGTGCGGCCCTGGCAGTCGTCGGCCACCACCAGCGACTTGTCTACCAGCAGGGTCA
+GCTGATCAAGCACCGAAAACGGATCCAGGTCGCTACCGGCGGCGACCGCCCGCACCGCGGCGAGGTCGAA
+CCCGCCGACAAATGGCGCCAGTCGCCGAAACAAGATTTGCTCGGTCTCGGTCAGCAGTGCATGCGACCAA
+TCGATCGAGGCGCGAAGTGTCTGCTGGCGCTGCACCGCGCCCCGCACACCGCCGGCCAACAGCCGGAAAC
+AGTCGTCCAGACCGTCGGCAATCTCGAGCGGTGACATCGACCGCACCCGTGCGGCAGCGAACTCGATCGC
+CAGCGGTATGCCGTCTAGCCGCCGGCAGATCTCGCCGACGGCCGCGGCGTTGTGATTGGCGATGGTGAAC
+CCGGGCTGAACTCGGCTGGCTCGGTCAGCAAACAATTCGACTGCTTCGTCGGTTATCGACATCGACGGTA
+CGCGCCAGGTGATCTCGCCGGCCATCCCGATCGGCTCCCGGCTAGTCGCTAAGATCGTCAGCTCCGGACA
+GGCCCCCAATAGCTCAACGACCAACGCTGCGCACGCATCGAGAAGATGTTCACAGTTGTCCAACACCATG
+AGCATGCGGCGATTGCCGATGAATCGGCGAAGACTATCCATGGTTGAACGGCCCGGCTGATCGGGCAGAC
+CCACGGCGCGCGCAGCCGTGGCTGCGACGATCCCGGATTCAGTGATCGGGGCCAGATCGACAAAGCACAA
+ACCGTCGCGAAGTTCGGATGCACTCGCGATCTGGATTGCCAGACGGGTCTTGCCGACACCGCCGGTTCCG
+CATAGCGTCACGAGCCGGTTCTGCGCCAACAGTGCCCGCACCTCAGCTTATTTGCGCACGGCGGCCCACA
+AATGTGGTGAACTGCGCCGGGAGAATCGATGTCGGGCTGGATTTGGCCGTGCGCAGTGGGGGAAACTTTT
+CGCGAATGTCGGGGTGGCACAACTGCATGACCCATTCGGGACGAGGTAGACCGCGCAGCGGGTGGCGGCC
+GAGATCGACAAGCCATGCATCGGCTGGGAGCCGGCCAGTCACTAAATCACCTGTCGCAGCTGACAGGACA
+ACCTGACCCCCGTGTGCCAAATCGCGGAGACGCGCCGTCCGGTTGATAGTGGGGCCGACATAGAGTTCGT
+CGCGCAACTGTACCTCGCCTGTATGAAGACCTATACGTAGTCGGATCGGCGCGAGCGAGGTCCGCTGCAG
+ATCCAGCGCGCATGCAGCGGCATCGCTAGCGCGAGTGAAAGCCGCAACGAAGCTATCACCCTCGTACCGT
+TTGACCGGCTGCACCCCACCGTGATTCGTGATAGCTTCCGACACAGTGTGATCCAAGTGCGCGATGGCGG
+TCGCCATGTCCTCTGGGCACATTTGCCATAGGTGGGTCGATTCCTCGACGTCGGCTAAGAGCAATGTCAC
+CGTGCCCGTCGGCGGCAATCTGCTCACGTCTAATCCCTGGTTGGCTATAAGGACGCGTCTGCGTGGGGGA
+ACGAACTCACATCGGCCAACATCTGGTGGAGCCGCATAGCAGCGGAGCGAATGGTACCGGAGATCCAGCG
+ATCCTAGCGCAGATATACGACCCCTGGCGACGCACTTTGCGCATGTTGGCGGATGATCTTCGCCCCGCAG
+GATCGCATGGTCGATGTCGATGTTGGGAGGAAGGCTGTTATGAACTGCGTTGAAGAGCACGATACGTGTC
+TGACCACTGCTATCACGTCATCGCAACACCTTCGCGGCGCCGCGAAGCCAATAAGCACACTACAGTTCGG
+GGAAGACACCTGGCCCATCCTCGAAACAGGCCTCTCGCAGCGATGTTCATTACCGCCCAAAGAGATTGTC
+TTCGGCGCTGCACGGTGGGCGCTCGCGGCGGCCCGCGGGATGCTACCGCGGCCCACGACCGACAGCCCAC
+CGCAGCGTCAGCGCTACCCGAAGCGCTACCGATTCCTGGAGCACTCCTGCCTAGAACGCGAGATGCGTCG
+ACTATAGAACAGCGTCGCGTGTTTGTCTCGGTAGCTGCTCTGTATAGTATGCGTTGCTTAACCGCATGTG
+GGAGGGTGATTTTGGGCTGTTCTGGGGGGTCGGAGCGATGACCGGGCGATGTCCGACGGTTGCCGTGGTC
+GGAGCGGGTATGTCCGGAATGTGCGTCGCAATTACGTTGCTGAGCGCAGGGATTACTGATGTCTGCATCT
+ATGAAAAGGCCGACGATGTTGGCGGAACGTGGCGCGATAACACCTATCCAGGTCTGACATGTGATGTGCC
+GTCCCGGCTCTATCAGTACAGCTTTGCCAAGAATCCGAACTGGACCCAGATGTTTTCACGCGGAGGCGAA
+ATCCAAGATTACTTGCGTGGGATCGCCGAGCGCTACGGGCTGAGGCACCGGATTCGGTTTGGCGCCACGG
+TTGTCAGCGCCCGATTCGACGACGGCCGGTGGGTGTTGCGCACCGATTCCGGAACGGAGTCGACAGTAGA
+CTTCTTGATTTCGGCCACCGGCGTTTTACATCATCCCCGAATACCGCCGATCGCTGGTTTGGACGACTTC
+AGGGGGACGGTGTTTCACTCGGCTCGCTGGGATCACACGGTTCCGCTGCTGGGACGCCGAATCGCGGTGA
+TCGGTACCGGGTCCACGGGCGTACAACTCGTCTGCGGCCTGGCTGGGGTCGCGGGTAAAGTCACCATGTT
+CCAGCGCACCGCACAATGGGTGCTGCCGTGGCCTAACCCTCGATACTCGAAGCTGGCGCGTGTTTTCCAC
+CGCGCTTTTCCGTGTCTGGGTTCGCTGGCCTATAAGGCATATAGCCTTTCCTTCGAAACGTTCGCGGTTG
+CGCTCAGCAATCCAGGTTTGCACCGAAAGCTGGTAGGGGCCGTGTGTCGCGCCAGCTTACGTCGGGTGCG
+TGACCCCCGACTGCGTCGGGCACTGACGCCTGATTACGAGCCGATGTGCAAACGGCTAGTGATGTCCGGC
+GGATTCTATCGGGCGATTCAGCGTGACGACGTCGAATTAGTCACCGCCGGTATCGATCACGTCGAACATC
+GGGGCATCGTCACCGATGATGGTGTGTTGCACGAGGTGGACGTCATCGTGCTTGCCACGGGGTTTGACTC
+TCATGCATTTTTCCGGCCGATGCAGCTGACCGGTCGCGACGGCATCAGGATCGACGATGTGTGGCAAGAC
+GGTCCGCATGCTCATCAAACCGTCGCAATACCTGGATTTCCGAACTTCTTTATGATGTTGGGGCCACACA
+GCCCAGTGGGAAACTTCCCGCTGACAGCGGTCGCCGAATCTCAGGCTGAACACATAGTGCAGTGGATAAA
+GCGATGGCGCCATGGTGAATTCGACACCATGGAACCGAAGTCAGCTGCTACCGAAGCATATAACACGGTG
+TTGCGGGCCGCGATGCCGAACACCGTCTGGACCACCGGCTGCGACAGCTGGTACCTGAACAAAGACGGTA
+TTCCTGAGGTTTGGCCATTTGCACCGGCCAAACACCGCGCCATGCTCGCTAACCTACATCCCGAAGAATA
+CGACCTGCGACGCTATGCTGCGGTGCGCGCAACTAGTCGGCCTCAAAGCGCTTGAAGCCTATCGAGGTGC
+TGGACGGTGACGTTCGCGCGGGATCGGCCACTAATCCCGTTCTGACGGCGCTGACAAAGGTTATAGCGGT
+GACCATTGGCGCAGCTTCGGTATCGGCTTCGGGCACCGCTCGGCCGACGCGGCGCAGATACTCGGCCAAT
+GGAGTAGCGGTCGCGCGCCAGCCTCGCTCATCGAACCATTCCGTGGCCCGCGCCCACCGCTCGTTGTAGA
+CCATTTGAAAGAACCTGCGCGGGTCGCCTTGGGCGTTCGCGGCGCGTTCTCGTTCGAGCTTCGCTGCGAA
+TTCGCAAGGGTCCAGTGGAGTTGCTTCCTCGACAGCAACGTGGCTACCGGGGCTAGCCAAGGTGTCGATG
+CCGATAAACAGGCGCTGCTGGGCCTCGGCCGAGAGATAGACCAGCAGGCCCTCGGCGATCCAAGCCGACG
+GCCGGTTGGCATCAAATCCGTTGTTACACAAGGCTATCTGCCACTCATCGCGCAGATCGACAGCAACCGA
+CCGACGTTGGGCTCGCGGCCGTATGTGATAGTCGGCGAGCACCGCGTTCTTGAAGTCGAGGACCTGAGGT
+CGATCCAACTCGAAGATTGTTGTCCCGATTGGCCATTGCAATCGGAATGCACGGGAATCCAATCCTGCAG
+CCAAGATGACCACCTGCTTCATGCCGGCGGCCGTTGCCCGGGAGAAATACTCGTCGAAATACCTGGTGCG
+GGCACCTTGGAAGTTGACGAAATGCTCACCGAAGTCCCCGGTTGTCAGATAGTGATCGGGCAGCTTGCCG
+TCCAATACGTCGGCCCATTCACCACCTGCGGCACGGCAGAAAACCTCGGCATAGGGATCGATGGCCAGCG
+GATCGGCCTTCTGCGTCTCCAATGCTCTTGCGGCGGCTACCAATAGTCCTGTCGAACCAACACTCGTGGT
+GACATCCCAGCTATCGTCCTCGGTCCGCATTCATCGAACTCTAGTTGCTCCAGTCCGCCCACCGCTGTCG
+GTATCCCAGCGCAGTCGGCCGTGCACACATATCTGCGCGGTGGACTTGGTACTTCTACGCGCATTCGCCG
+ATGTTTTGCGATCCGCGGCGGGTCTATGGTGCCATTTATGTGCCAGGATCGGTCTTCAATAACAACGTCG
+CGAAGCGAGGGGTCGTGACGTGAGAGGGCTCGCTTATGCCGGCGGTGGATGCCCAGTAGGGCGACGGTCC
+AGGAATTCTCAGACAGTTATCCGTTCTGCCACAATGGATTCCGGCCGATCATGATGCCAAAGATCGTCTC
+CGTCCAACATTCCACTCGCCGCCACTTGACGAGCTTTGTCGGTCGCAAGGCTGAGCTGAACGACGTGCGG
+CGGCTCCTGTCCGACAAACGACTGGTGACGCTTACCGGTCCGGATGGGATGGGGAAATCCCGTCTCGCGC
+TGCAGATCGGCGCCCAGATTGCACACGAATTCACTTATGGCCGTTGGGATTGCGACTTGGCTACGGTCAC
+TGACCGAGACTGCGTGTCCATCTCGATGCTGAATGCCTTGGGCTTGCCTGTCCAGCCGGGTTTGTCTGCG
+ATCGACACGCTCGTCGGTGTCATCAATGATGCTCGGGTGCTGCTGGTGTTGGACCATTGTGAGCATTTGC
+TGGACGCGTGTGCCGCGATAATTGATTCGCTGTTACGTTCCTGTCCGAGATTGACGATCCTGACGACAAG
+TACCGAAGCGATCGGGTTGGCGGGCGAGCTGACCTGGCGGGTGCCCCCGTTGTCGCTGACCAACGATGCC
+ATCGAGCTGTTTGTCGACCGGGCACGCCGAGTGCGGTCGGATTTTGCGATTAATGCCGATACCGCGGTGA
+CGGTCGGGGAAATCTGCCGACGCTTGGACGGTGTGCCACTGGCGATCGAGCTGGCCGCGGCGCGAACGGA
+CACCTTGTCGCCGGTGGAGATCCTTGCTGGTCTAAATGACCGATTCCGGCTGGTGGCCGGTGCTGCGGGC
+AACGCGGTGCGCCCCGAACAGACGCTGTGTGCCACGGTGCAATGGTCGCATGCTCTGTTGAGTGGACCTG
+AGCGTGCGTTGTTGCACCGGTTGGCAGTCTTCGCCGGCGGGTTCGACCTTGACGGCGCCCAGGCGGTCGG
+TGCCAATGACGAGGACTTCGAGGGCTACCAGACACTCGGCCGGTTTGCCGAGTTGGTGGACAAGGCATTT
+GTCGTCGTCGAAAACAACAGGGGCCGAGCGGGATACCGGTTGCTGTATTCGGTGCGTCAGTACGCGTTGG
+AGAAGCTCAGTGAGTCGGGAGAGGCCGACGCCGTGCTTGCGCGTTACCGCAAGCACCTCAAACAACCCAA
+CCAGGTAGTGCGTGCTGGGTCAGGCGGGGTTCGGTACTGATGCGTGAACGTACCTTAACCGTCGGTGGGA
+ATTGACCGCGCCACCCATAGCAGTCGAGAGGAACACCCGCAGCAAAGTGCGCCAACAACAGGAGGCTGAC
+GTCGTTGCCCTGGGTCGAAAGCCAGGGCTGCTATGTGTGCCGGAAAGGTTCCGTGCAATGGATCTTCCGA
+TGGCAGCCGCCGATGCCTTATTCCTATGGGCCGAGACGCCGACGCGGCCGCTGCATGTCGGCGCGTTGGC
+CGTGCTGAGTCAGCCCGACAACGGGACCGGGCGTTACCTGCGCAAGGTGTTCTCCGCCGCGGTGGCCCGT
+CAGCAGGTGGCGCCGTGGTGGCGCCGACGCCCGCACCGGTCGCTCACCTCGCTCGGGCAGTGGTCTTGGC
+GCACCGAGACCGAGGTGGACCTGGATTACCACGTGCGGCTTAGCGCATTGCCGCCACGGGCCGGTACCGC
+CGAGCTGTGGGCGTTGGTTTCTGAACTACACGCCGGCATGCTGGACCGCTCCCGCCCGCTATGGCAGGTG
+GACCTGATCGAGGGTCTACCTGGCGGGCGGTGCGCGGTCTACGTCAAGGTCCACCATGCGCTGGCGGACG
+GAGTCTCGGTGATGCGGCTTTTACAACGGATCGTCACCGCGGACCCGCATCAGCGTCAGATGCCCACCTT
+GTGGGAGGTGCCAGCGCAGGCGTCGGTGGCCAAACACACGGCACCGCGCGGTTCGTCGAGACCACTGACG
+TTGGCCAAGGGGGTGCTGGGTCAAGCCAGGGGCGTCCCGGGCATGGTGCGCGTAGTGGCCGATACCACGT
+GGCGGGCAGCGCAATGTCGCAGCGGGCCGCTGACACTGGCCGCACCACACACCCCGCTGAACGAGCCGAT
+CGCCGGGGCCCGGTCCGTGGCAGGTTGTTCCTTTCCGATCGAGCGGCTGCGACAGGTCGCCGAACACGCC
+GATGCCACCATCAACGATGTCGTGCTGGCCATGTGCGGCGGGGCGTTACGTGCGTACCTGATCAGCCGGG
+GAGCGTTACCGGGTGCGCCGCTGATAGCGATGGTGCCGGTTTCGCTGCGCGATACCGCAGTTATCGACGT
+GTTCGGCCAGGGTCCAGGCAACAAGATCGGTACGTTGATGTGTTCGCTGGCGACGCACCTGGCCAGTCCG
+GTCGAACGGCTGTCGGCGATACGGGCAAGTATGCGCGACGGCAAAGCCGCGATCGCCGGCCGAAGCCGAA
+ACCAGGCGCTGGCTATGAGCGCATTGGGCGCCGCCCCGCTCGCCCTTGCGATGGCCCTGGGGCGCGTGCC
+CGCGCCGCTGCGCCCACCAAATGTGACGATCTCCAACGTGCCGGGCCCGCAGGGCGCGCTGTACTGGAAC
+GGCGCTCGCCTGGACGCGCTCTACCTGCTCTCGGCACCTGTCGATGGCGCGGCGTTGAACATCACCTGTA
+GCGGCACCAATGAGCAGATCACTTTCGGTTTGACGGGCTGCCGTCGTGCCGTCCCCGCGCTGAGCATCCT
+GACCGACCAGCTCGCCCACGAACTCGAGCTACTCGTTGGCGTCAGTGAAGCCGGCCCAGGGACCAGACTT
+CGAAGGATCGCAGGGCGCCGTTAAACGGACGCCGCGAGTCATCACCCGGCCGAGCGCGCAGCGGCTTACC
+TTACGCGCGGCCGCCCATGGTGCCAGAGACCCCACCCCGGGCAGGCGGGTCATCCCGATAGCGACTACCT
+TCAGCTATAAGCACTTAGTGGGGCAGCCATATCAGCCAAAGCGCGAAGGGGTTCTCGTGGCCGACACCGA
+CGACACCGCAACCCTCCGTTACCCGGGAGGCGAGATCGACCTGCAGATCGTGCACGCCACCGAAGGCGCC
+GACGGCATTGCGCTCGGGCCGCTGCTGGCAAAAACCGGGCACACCACGTTCGACGTCGGCTTCGCCAACA
+CGGCCGCCGCTAAAAGCTCCATCACCTACATCGACGGAGATGCCGGCATTCTGCGTTATCGCGGCTACCC
+GATCGACCAACTGGCGGAGAAGTCAACCTTCATCGAGGTCTGCTACCTGTTGATTTACGGCGAGCTGCCC
+GATACCGACCAGCTTGCCCAGTTCACCGGCCGGATCCAGCGCCACACCATGCTGCACGAGGATCTCAAGC
+GGTTCTTCGACGGCTTTCCGCGCAATGCCCACCCGATGCCGGTGTTGTCCAGCGTGGTCAATGCGCTGTC
+GGCGTACTACCAGGATGCTCTGGACCCCATGGACAACGGTCAAGTCGAGCTGTCGACCATTCGGCTGCTG
+GCCAAGCTGCCCACCATCGCCGCGTACGCCTACAAGAAATCGGTCGGCCAGCCCTTCCTCTACCCAGATA
+ACTCACTGACGCTGGTGGAGAACTTCCTACGGTTGACGTTCGGATTTCCCGCCGAGCCCTACCAGGCCGA
+CCCCGAGGTGGTGCGGGCGCTGGACATGTTGTTCATCTTGCACGCCGACCACGAGCAGAACTGCTCGACG
+TCGACGGTTCGGCTGGTTGGCTCGTCGCGAGCCAACCTGTTCACCTCGATCTCGGGTGGCATCAACGCAC
+TATGGGGTCCGCTTCATGGCGGCGCCAATCAGGCTGTCCTGGAGATGCTCGAGGGCATTCGCGACAGCGG
+CGACGACGTCAGCGAGTTTGTACGCAAGGTCAAGAACCGCGAGGCCGGGGTCAAATTGATGGGTTTCGGT
+CATCGTGTCTACAAGAACTACGATCCGCGGGCCCGCATCGTCAAGGAACAGGCCGACAAGATCCTGGCCA
+AGCTCGGCGGCGATGACTCCTTGCTGGGCATCGCCAAGGAGCTCGAAGAGGCGGCGCTGACCGACGACTA
+CTTCATCGAACGCAAGCTTTACCCCAACGTCGACTTCTACACCGGCCTGATCTACCGGGCCCTCGGCTTC
+CCGACCAGGATGTTCACCGTGTTGTTTGCCCTGGGCAGGCTTCCCGGCTGGATCGCGCACTGGCGTGAGA
+TGCACGACGAGGGCGACAGCAAGATCGGCCGGCCCCGCCAGATCTACACCGGCTACGCGGAGCGCGACTA
+CGTCACCATAGACGCGCGGTAGGCCGGCGAGCAGACGCAAAAGCCCCCTAAACCGGCAGGTATTAGGGGC
+TTTTGCGTCTGCTCGCCAGGCAAGCCAGCACTGCCATCGCGGCGTTGTGACCGCCGATGCCCGACACCGC
+CCCGCCGCGACGGGCACCCGAGCCGCACAGCATGATCCGCTCGTGGTCGGTGGCTACGCCCCACTGCCGT
+GCCGGTGTGTCCAGCGGATCGTCGTTGTCAGCGAACGGCCAGGACAACGCACCGTGGAAGATGTTGCCGC
+CGGTCATCCCAAGCGTCCGCTGCAGGTCCAGGGTGGTCGTCGTCTCGATGCATGGCTTGCTCTGCGCATC
+GGTCCAAAGCACGTCCTGAATCGGTTCGGCCAGAACGGAATTCAGCGACGCTAGGACGGCTGCCGTCAGC
+CGTTCGGCTAAGCCTTCGGTGTCGCCGAACACCGAGTGCGGTGTGTGCAAGCCGAACACCGTCAGCGTCT
+GAGCGCCGGCATCGCGCAACCGGGCGGACAGGATGCTCGGGTCGGTCAGCGAATGGCAGTAGGCTTCGCA
+GGGTAGGGGATCCGGCAACCGCCCGCTGGCTGCTTGCGAGTACGCGGCATCCAATTGGCTCCATGTCTCG
+TTGACGTGGAACGTCCCGGCAAATGCTTGCTGCGGTGTGACACTGTCGTCGCGCAACCGGGGGAGTCGGC
+GCACCACCATGTTGACCTTGACCTGTGCGCCCGGGGCCAGTGCCGCAACCGGTTCACCGAGCAGGCTGGC
+CAGCACCGCCGGTGTGACCCCGACCAGAACGAACCGGCCCCGGACCAAATGCTCGGCACCGTCGCTACCG
+TCGCTGTGGTAGCGCACCGTACCGTCTGGATCAAGGGCGAAAACGTCTGCACCGGTGACTATTTCGGCGC
+CGTGGCGGGCAGCTGCCGTGGCCAGGGCCGAGGTCACCGACCCCATGCCGCCGATTGGGACGTGCCAGAC
+TCCGGTGCCCCCACCGACCAGGTGATACAGGAAGCAGATGTTCTGCATCAGCGACGGTTCGTGCATGCGG
+GCGAAGGTGCCGATCAGCGCGTCGGTGGCGATCACCCCGCGTAGCAGGTCATTGGCCACCGCGCCGGCGA
+TGGCATGCCCGATCGGCTCGTCGACCATGGCTTGCCAGGCAGCGGCCGCCTCGTGGCCGCCGTATTCCAC
+AATGTCGCGGCGGGCCTGCTCGCGGGTGCGCAGCGGCTCGATCAGGGTGGGCCACAGCCGTGCGGTCACC
+AGCCGGCAGCGCCGGTAGAACGCGGCGAAGCCGTGCGCATCCGGCGCGGCGCCGATCGCCGCGAGGTGCG
+CTGCGCGTGGTTCGCCGGTGGGCCCGATGAGCAGGCCAGAGCGCCCGGCCGTGGCTGGGGCAGGGGTGTA
+TGAGGAAAATGGCCGCCGCGCCAACCGCACCGGAGCGCCGAGGTCGGCGACGATGCGCGACGGCAGCAAG
+CTGACCAGGTACGAGTAGCGTGACAGCGCGACCTCGACACCGTCGAAGGCCTGTATCGACACCGCGGCCC
+CCCCAGTCTGTGCCAGCCGCTCGAGCAGTCGCACTCGAAGCCCGGCCCGGGCCAGGTAGGCGGCCGCGAC
+CAAGCCGTTGTGACCGCCGCCAACCACGACAACGTCGAAGTCCCTGTCGTGATCGCTCATAGTGACGGCG
+GCTATCGAGACGGATCTAGCCGGTGTACCCCTCGACTTGGTCGGCGGGACGCACGACTGCTTCGCGCGGG
+TCACCACCGGTTTGGCGCAATGCCCGTCGCTGTCGGAGCAGGTCCCAGCACTGGTCGAGTTCGATCTCGA
+TGCGGCGCAGTTGCTGCTGCTCCTCGGACTCGCTGATGCCACCGTGCCGCAGCTGCGCTCGCAACGCCTT
+CTCCTCGGCCACCAGGTCACGGATGTGTGCCAGGGTCTCGCTGTCTGTCGGTTTGCGTCCCTTGCCCATG
+GCTCCAGTGTGCCCGATTTGACGCGGTGTCCCGGCACCGACTCGGTAGGCTGCATATCGCCTGCAGCACG
+GACGAGACGCGTTCGACGACCTGAGGGAGTGGCGTAGTGGCTTCTAAGGCGGGTTTGGGCCAAACACCCG
+CGACCACCGACGCGCGACGAACTCAGAAATTCTACCGGGGCTCGCCGGGCCGTCCGTGGCTGATTGGCGC
+GGTGGTTATTCCGTTGCTGATAGCGGCAATCGGTTACGGTGCATTCGAGCGGCCCCAGTCCGTTACCGGA
+CCGACCGGTGTGTTGCCGACACTGACACCGACCAGCACCCGGGGCGCTTCTGCGTTGTCCTTGTCTTTGC
+TGTCAATTAGCCGCAGCGGCAACACCGTTACTCTGATCGGTGACTTCCCCGATGAGGCCGCCAAGGCGGC
+CTTGATGACGGCGCTCAACGGCTTGCTTGCTCCGGGCGTGAACGTCATCGACCAGATTCACGTCGATCCC
+GTTGTGCGATCACTTGATTTCTCAAGTGCGGAACCAGTTTTCACCGCCAGCGTGCCGATTCCTGATTTTG
+GCCTCAAAGTCGAAAGGGACACCGTCACCTTGACCGGAACTGCCCCTTCATCCGAGCACAAGGACGCAGT
+GAAGCGCGCGGCGACCAGCACCTGGCCTGACATGAAAATCGTTAACAATATTGAGGTTACGGGGCAGGCA
+CCGCCAGGACCCCCGGCCTCCGGCCCATGTGCCGACCTGCAATCAGCCATCAATGCCGTGACGGGTGGAC
+CCATCGCGTTTGGCAACGACGGGGCTAGTCTGATCCCAGCCGACTATGAAATCCTGAACCGGGTAGCCGA
+CAAGCTCAAGGCATGTCCGGACGCTCGGGTGACGATCAACGGCTACACCGACAACACCGGCAGCGAAGGT
+ATCAATATCCCGTTGAGCGCTCAGCGAGCCAAGATAGTCGCCGACTACCTGGTTGCCCGCGGAGTTGCCG
+GCGATCACATTGCCACCGTGGGTCTCGGTTCGGTGAATCCGATCGCCAGCAACGCCACACCCGAGGGGCG
+CGCCAAGAATCGTCGCGTCGAGATCGTGGTCAACTAAGGAGAACCCAGCATGGATTTTGTGATCCAGTGG
+TCGTGCTACCTGCTGGCGTTCCTGGGGGGCTCGGCTGTTGCCTGGGTAGTCGTCACTCTGTCGATCAAGC
+GCGCCAGCCGTGATGAGGGTGCTGCGGAGGCGCCCAGTGCAGCCGAGACAGGCGCACAGTGATGGAACAC
+GTGCACTGGTGGCTGGCGGGCCTGGCGTTCACGCTCGGGATGGTGCTGACGTCGACGCTGATGGTCCGGC
+CCGTCGAACATCAAGTGCTGGTAAAGAAATCGGTCCGCGGGTCAAGCGCTAAGTCCAAGCCGCCAACGGC
+GAGAAAACCCGCCGTCAAGTCGGGCACCAAGAGAGAGGAGTCGCCGACGGCGAAGACCAAGGTGGCAACG
+GAGTCTGCTGCGGAGCAGATCCCGGTTGCCGGGGAGCCCGCGGCGGAGCCGATCCCGGTCGCCGGCGAGC
+CGGCGGCGCGTATTCCGGTGGTTCCGTACGCGCCGTACGGCCCGGGCTCGGCGCGCGCTGGTGCCGATGG
+CAGCGGACCGCAGGGGTGGCTGGTGAAGGGCCGCTCGGACACCAGGCTCTACTACACTCCCGAAGATCCG
+ACGTACGACCCTACTGTCGCCCAGGTTTGGTTCCAGGACGAGGAGTCGGCAGCGCGGGCGTTTTTCACGC
+CGTGGCGCAAGAGCACACGGCGGACATGAGGTCAGGGCCGCAGGGCTAACTGGGCCCGGGAAGGCGCAAC
+ACGAGGCGCGCGCCACCCAGCGGGCTGTTCTCCAGCGACGCGGTGCCGCCGTGCAACTGGGCCTGTTGGG
+CCACCAACGCCAGCCCGAGACCCGACCCCGAATGAGATGCCGTGGACCCGCGGGAGAACCGCTCGAACAC
+CACTTGGCGCTCACCTTCGGGCACTCCGCTGCCGTTGTCGTCGATGGCGATCTCCACGCCGGCCCGCGAG
+CTGACCGCGGAGAGTTGAACCAGGGTGGCGCCGCCGTGCTTGACCGCGTTGGCGATGGCGTTGTCGACGG
+CCAGGCGCAACCCGGCCGGCAAACCCACGATGATGCAGGTCGGCGACGGCACCAGCGATACATCGAGATC
+GGGGTAGATCCGGGCCGCGTCGTGGGCGGCGCGGTCGAGCAGGTCGGTGATATCGACCGGCACGTGATCG
+TCCGAGGTCGACAGTTCGCCCTGGGCCAACCGCTCCAGCGCGCTCAGGGTGGCCTCAATGCGCGACTGGG
+TGCGGATGACGTCGTTGAGCACTTCTTTGCGCTGGTCGTCGGGCAGATCCAGGGTGGACAGCACCTCCAG
+GTTGGTGCGCATCGCGGTCAGCGGAGTGCGCAGCTCGTGGGAGGACACCGCCGCGAAGTCACGCGCCGAC
+GCAAGCGCCTCCTTGGTTCGGTTCTGCTCGTTCCAGATGCGCTGCAGCATGCCGCGCATCGCCTCGGCGA
+TCTCGATGGCTTCGCTGGCGCCGTGTACTTCCACGCGTGGCGCCTCGTCGCCCGCGTCGATGGACCGGGT
+CTGCTCGGCGAGCTGCTTGAACGGGCGTACCGCGAACGCGGCCAACAGCCAGGCGAACACCGCCGCCGCG
+CCGATGGCGAAGGTACAGATCAGCAGCACCCGGCGGTGCAGGTTGTTGGTCTCGGCTACGGTGGCGTCAT
+ACGTCGCGCCCACCGCCACCGACGTCGGCTCGGGCCCGGGGATCTCCACCGTGCGCACGCGGTAGCGCAC
+CCCGCGGACGTAGGTGTCGGCGTAGTCGTCTTGCAGTTTGGGCAGCGTGATGTCGGAATTCGACTTGATC
+ACGTTGCCACGGCGGACCGTGATGAGGGCGTCCTGGTCGTTCGGTGAGCGCGGGATCTCGTCGAGGCCAC
+GCGGCACGAACGGGATCGCGAAACCCGCGGCCTCGTCGAGCCGGCGGTCCAGCCGCTCCTTGCGGTCGTT
+GGTGATCCCGACCCAGACGACGGTGCCGACAATGAGTACCGGGATCGCGGCGCCGATCGCCGTCGCGACC
+ACCACCCGGGTTCGCAGCGAGGGCGTACGGGCGAAGATCCGCGACAGAATATTCATGCATGCCCCGTCAC
+TGCATACGCAGCACGAATCCGACTCCGCGGACGGTATGCAGCAGCCTAGGGCCACCGCCGGCCTCCAGTT
+TGCGCCGCAGGTACCCGATGAAGACGTCCACCACGTTGGTGTCGGCGGCGAAGTCGTAGCCCCACACCAA
+TTCCAGGAGTTGCGCTCGGGAGAGCACCGCGGTCTTGTGCTCGGCCAGCACCGCGAGCAGGTCGAATTCG
+CGCTTGGTCAGGTCGACGTCGACGCCGTTGACCCGGGCCCGCCGGCCGGGGATGTCCACCTCCAGCGGGC
+CCACCGTGATGGTTTCCGAGGACGACGTTGCAGTGGAGCCGCGGCGGCGCAGCAGCGCCTTCACCCGTGC
+CACCAGCTCGGCCAGCACGAACGGTTTCACCAGGTAATCGTCGGCGCCGGCCTCCAATCCGGCCACTCGG
+TCATCGACAGAGCTGCGTGCGGATAGCACACAGACCGGGACGTCGTTGTCCATCGCGCGTAGTGCCGTCA
+CGACGCTGACTCCATCGAGCACTGGCATGTTGATGTCGAGCACGATCGCGTCCGGCCGGTTCTCGGTGGC
+GCTGCGCAAGGCCTCGGCGCCGTCCACCGCGGTCGCTACCTCGAATCCGGACAGCCGTAAGCCGCGTTCC
+AGCGAGGCGAGCACATCGGAGTCGTCGTCGACGACCAACACCCGAGGTGAGGTCACACCAGTGTCCATGC
+CGCCCATTTTGCCTGATTACCGTCCAGCAGGGTGGGAGGGTGAGCCGCCGGGTCGCGTGCTGGGCGAGCA
+GACACAGAGTCGCATCAAAACCGCCGATTTTGTGCGACTCTGTGTCTGCTCGCGGGGTGCGCGCGGGTTA
+GTCGCGGGGCAACCCGATCCGGCGGTAGCGTTGCAACCGAGTCGCGAGGCGTTCCGGGGCCGGTATCTTC
+CGTAACGCGTGCACTTCGGCGGCGATGGCGTTCGACAGTCGTAGGGCGAACTCGATCGGCTCGTCTGCGG
+CGTCGGGGTACTCCGGCACGATGGTGTCGACAATCCCCGACTTCAGTAGGTCGGCCGACCGGATGCCTTG
+GGCGGCAGCGAGTTCGGCGGCATGAGCAGTGTCTCGGAACACGATCGCGCTGGCTCCTTCGGGAGGCAAG
+GGCGCCAGCCAGCCGTGGAGTGCGGCCAGCACCCGGTCGGCGGGCAACATCGCCAGCGCCGGCCCGCCGC
+TGCCCTGGCCCAGCAGGATCGACACGGTCGGGGTATCCAGCGTGACGAGCTCGGCCAGGCAATGCGCGAT
+CTGGCCGGCCAGCCCGCCCTGTTCGGCTGCGGCCGACAACGCGGGTCCGGCCGCGTCAATGACCAGCACC
+AGCGGCAGGCACAGCTCGGCGGCGAGCGCCATCCCGCGTCGGGCTTCGCGTAACGCAGCGGGCCCGACAG
+TGCTTCCCCCGCCGCCTACTGCCCTTTGCTGGCCGAGGACCACCGTGGGTTGGCCGCCAAAGCGGGCCAG
+CGCCAGCAGCGTGGTCGCCGCTTCGCCTTGATCGGTTCCTGACAACAACACCCGGTCGGTGGCGCCGTGT
+CGCAGTAGCTGCCTGACGCCCGGCCGGTCCGGCCGGCGCGATGCCACCACCGAGTCCCACGTGGGCACAT
+CGGGTACGGGCGCGGGCGTCTGCGGTGCCGGAAGCGGTTCGGGAGCGTCGATGAGCACCGTCAACGCACG
+ATCCAGCATCGGTCGTAGCCGGTCCAGTGCAACGACGCCGTCGATGATCCCATGCCGCCGTAGATTCTCG
+GCGGTTTGGACGCCGGATGGGAAGGGGTCGCCATAGAGCAACTCATAGACCCGTGGTCCCAGAAAGCCGA
+TCAGGGCGCCCGGCTCGGCGACGGTGAGATGCCCCAGCGAGCCCCACGACGCGAAAACTCCACCCGTGGT
+CGGATGGCGCAAATAGACCAGGTAGGGCAGGCGCGCCTGGTTGTGCAGCTGGATGGCCGCAGCGATCTTC
+ACCATCTGCAGAAACGCGACCGTGCCTTCTTGCATGCGGGTGCCTCCCGAGCTTGGTGACGCCAGTAGCG
+GCAGCCGCTCGGCGGTCGCCCGCTCGACGGCGGCGGTGATCCGTTCGGCCGCTGCCACCCCAATCGAGCC
+GCCCAGGAAGTCGAACTCACAGGCCACCACGGCCACCCGCCGCCCGAATACGCGTCCCTCACCGGTCTGC
+ACCGATTCGTCCGCGCCGGTGGCCGCCCGAGCGGCGGCCAGCTCCCGCGCATAGGAGTCGGCTACCGGCA
+CCGCCAGCGGCTCGCTATCCCAGCTGACGAAAGATCCCCGGTCTAGCACCGCGTGCCGCAGTTGGTCGGT
+CGTGATACGACTCACGCGATGAGGCTATATAGGCTGACCCAATGATCGGTATCACCCAGGCAGAAGCCGT
+GCTGACCATTGAGCTGCAACGCCCGGAGCGCCGCAACGCCTTAAATTCCCAGCTGGTCGAGGAGCTTACG
+CAGGCCATCCGGAAAGCCGGGGATGGATCGGCTCGGGCGATCGTGCTGACCGGCCAAGGCACCGCGTTCT
+GCGCTGGCGCGGACCTGAGCGGAGACGCATTCGCCGCCGATTATCCCGACCGGCTCATCGAGCTGCACAA
+GGCGATGGACGCCTCCCCGATGCCAGTGGTCGGCGCGATCAACGGTCCCGCCATCGGCGCCGGCTTGCAG
+CTTGCCATGCAATGCGACCTGCGGGTTGTCGCGCCCGATGCCTTCTTCCAGTTTCCGACGTCGAAATACG
+GTCTGGCCCTGGATAACTGGAGCATCCGCCGGCTGTCGTCGTTGGTTGGGCACGGACGTGCCCGCGCGAT
+GCTGCTCAGCGCGGAAAAGCTGACCGCCGAGATCGCACTGCACACCGGAATGGCGAATCGCATTGGCACT
+TTGGCCGACGCCCAGGCCTGGGCCGCCGAGATCGCCAGGCTGGCACCACTGGCTATCCAGCACGCCAAGC
+GGGTGCTCAACGACGACGGCGCTATCGAGGAAGCGTGGCCGGCCCATAAGGAACTCTTCGACAAAGCCTG
+GGGCAGCCAGGATGTCATCGAAGCGCAGGTTGCCCGGATGGAAAAGCGGCCGCCGAAGTTCCAAGGGGCT
+TAACCGCCATGGTGCGCCGAGCGCTACGACTGGCGGCCGGCACCGCCTCGCTGGCCGCCGGCACGTGGCT
+GTTGCGTGCGCTGCACGGCACGCCGGCCGCGCTCGGTGCCGACGCGGCGTCGATCAGGGCTGTGTCGGAG
+CAATCGCCGAACTATCGTGACGGCGCCTTCGTCAACCTGGATCCCGCGTCGATGTTCACCCTGGATCGCG
+AGGAGCTTCGGCTCATCGTGTGGGAGTTAGTGGCCAGACACAGTGCGAGCCGGCCGGCGGCGCCGATCCC
+GTTGGCCTCGCCGAATATCTACCGGGGTGACGCCAGCCGGCTCGCCGTCAGCTGGTTCGGTCACTCGACG
+GCGCTGCTGGAAATCGACGGCTACCGGGTGCTTACCGATCCGGTGTGGAGCGATCGGTGCTCACCGTCCG
+ACGTCGTCGGCCCCCAGCGCCTGCATCCGCCGCCGGTGCAACTGGCAGCTCTCCCGGCCGTCGACGCCGT
+GGTCATCAGCCACGACCACTACGACCATCTCGATATCGACACCGTGGTTGCGCTGGTCGGCATGCAACGG
+GCCCCGTTCCTTGTGCCGCTCGGGGTCGGCGCCCACCTTCGGTCGTGGGGTGTTCCGCAGGATCGCATTG
+TTGAGCTCGACTGGAACCAGAGCGCTCAGGTCGATGAGCTCACCGTGGTCTGCGTGCCGGCACGGCACTT
+CTCGGGACGGTTCCTGAGCCGCAACACCACACTGTGGGCCTCGTGGGCGTTTGTTGGGCCGAACCATCGC
+GCCTACTTCGGTGGTGATACCGGATACACCAAGAGCTTCACCCAGATCGGCGCGGACCACGGACCGTTCG
+ACCTGACCCTGCTGCCCATCGGGGCCTACAACACGGCGTGGCCGGACATCCACATGAACCCCGAGGAGGC
+GGTCCGGGCGCACCTGGACGTCACCGATTCGGGCTCGGGAATGCTGGTGCCGGTGCACTGGGGCACCTTC
+CGGCTGGCCCCCCATCCGTGGGGCGAGCCGGTCGAGCGGCTACTCGCGGCGGCTGAACCCGAGCACGTCA
+CGGTAGCCGTGCCGCTACCCGGTCAGCGGGTCGACCCGACCGGGCCCATGAGATTGCACCCATGGTGGCG
+GCTGTAATTCCCCGCAGCGCCCGGCTAATGGTGCTAGGGGGCGAGCCGAGGCGATCAAACCACCGAGTGT
+TCCGGCCGCGTTGGCTACTATCTGCGGCCATGACCAAACGAGCGGCAACGGCCGCCATGGTGATGTTGCT
+GACGTTAACGGGTTGCGGATCCACGCACCAGGCACTTGGCCCGCCGTCCGGGTTGCCCGATGCCTCTCCC
+AATGAGAGGTCAGCGATACAGATCCCCGCTGGCCGCATCGACGATGCCGTGGCAAAGGTCGACGGCCTGG
+TCGGCGAGCTGATGCAGAATACCGGCATACCCGGAATGGCAGTGGCGATAGTCCATGGCGGAAAGACGTT
+GTATGCCAAAGGGTTCGGTGTCAGAGACGTGGGCAAAGGTGGTGGTCCGGACAACAAGGTGGACGCCGAC
+ACCGTCTTTCAGTTGGCGTCGGTGTCCAAATCGGTCGGCGCCACGGTGGTGGCGCATGCGGTAACCGACA
+ACGTCGTGACCTGGGATACGCCCGTCGTATCGAAGCTGCCGTGGTTTGCCCTTCGCGATCCCTACGTCAC
+CGGCCAGGTAACCATTGCTGACCTCTACTCGCATCGCTCCGGCCTGCCCGACCATGCGGGCGATCTGTTG
+GAGGATTTGGGTTATGACCGTCGACAGGTACTGCAGCGGCTGAAATACCTGCCGCTGGCACCGTTTCGAA
+TCAGCTATGCCTACACCAACTTTGGTGTGACCGCGGCGGCCGAAGCGGTCGCGGCCGCGGCCGGCCAGTC
+CTGGGAGGACCTGTCCGACGAGGTGCTCTACCGCCCGTTGGGGATGGGGTCTACGAGTTCCCGGTTCACC
+GACTTTCTGGCCAGGCCCAACCATGCGGTCAACCACGTCAAGGTCGCAGACCGATGGGAGGCGCGCTACC
+AGCGCGATCCCGACGCCCAATCACCTGCGGGCGGGGTGAGTTCGTCTCTTAACGACATGACGCACTGGCT
+GGCCATGGTGCTGGCCGACGGCGTGTACAACGGCCGTCGGATCACGTCGCCGGAGGCCCTGCTCCTCGTC
+TACACGCCGCAGGTGATCTCTCGACACCCGGTGTCACCGAGAGCGCGGGCCAGCTTCTATGGCTACGGAT
+TCAACGTGGGGGTAACCTCTTCGGGACGCACCGAGTACAGCCATTCCGGCGCCTTCGGGCTGGGTGCCGC
+GGCGAATTTCGTGGTGCTGCCCTCCGAAGACCTGGCCATCATCGCGCTGACCAACGCCGGGCCCATCGGC
+GTGCCGGAGACGCTGACCGCCGAATTCATGGACTTGGTGCAGTACGGCCAGGTACGCGAGGACTGGGCGG
+CCCTGTACAAGAAGGCATTTGCCCCGCTGAACGAGCTCGCGGGCTCGCTGGTCGGCAAGCAATCCCCGGC
+CAACCCAGCGCCGAGCAGACCGCTGAACGACTACGTCGGCGTGTACGCCAACGACTACTGGGGGCCCGCC
+ACCGTGACCTACCACGACGGCCAACTGCGCCTGTCGCTGGGGCCGAAGAACCAGACGTTCGATTTGACGC
+ACTGGGACGGCGACACTTTCACGTTCACGTTGTCGACCGAAAACGCATTGCCCGGATCGATTTCCAAGGC
+CACCTTCGCCGGCGACACGTTAAACCTGGAATACTACGACGCCGACAAGCTGGGAACGTTTACCCGATGA
+CCCGTTCGGCTTCGGCGACAGCCGGTTTGACCGATGCCGAAGTGGCGCAACGGGTCGCCGAAGGCAAGAG
+CAACGATATCCCGGAACGGGTCACCCGCACCGTCGGGCAGATCGTCCGGGCCAACGTATTCACGCGGATC
+AACGCGATTCTGGGCGTTTTGCTGCTCATCGTCTTGGCGACGGGCTCGTTGATCAACGGGATGTTCGGCC
+TGCTCATCATCGCCAACAGCGTCATCGGCATGGTCCAGGAGATCCGTGCCAAGCAGACGCTGGACAAACT
+CGCGATCATCGGACAGGCGAAACCGTTGGTGCGCAGGCAATCCGGAACGCGCACGCGGTCGACCAACGAG
+GTGGTGCTGGACGACATCATCGAACTTGGGCCCGGGGACCAGGTTGTCGTCGACGGCGAGGTCGTCGAGG
+AGGAAAACTTGGAGATCGACGAATCATTGCTGACCGGCGAGGCCGACCCGATTGCCAAAGACGCTGGCGA
+TACCGTGATGTCGGGCAGTTTCGTCGTCTCCGGTGCCGGCGCCTACCGCGCCACCAAGGTCGGCAGCGAA
+GCATATGCAGCCAAACTGGCCGCCGAGGCCAGCAAGTTCACCCTGGTGAAATCCGAATTGCGCAACGGCA
+TCAACAGGATTCTGCAGTTCATCACTTACTTGTTGGTGCCGGCCGGCCTGCTGACCATCTACACCCAGTT
+GTTCACCACACACGTGGGATGGCGGGAATCCGTGTTGCGGATGGTGGGCGCGCTGGTGCCGATGGTTCCC
+GAAGGCCTGGTGCTGATGACCTCGATCGCCTTCGCCGTCGGGGTGGTCAGGCTCGGCCAGCGTCAATGCC
+TGGTGCAAGAGTTGCCCGCCATCGAGGGGTTGGCGCGGGTGGACGTGGTCTGCGCCGACAAGACCGGCAC
+ACTGACCGAAAGTGGCATGCGGGTCTGCGAGGTCGAAGAGCTCGACGGGGCTGGTCGACAGGAAAGTGTC
+GCCGATGTGCTGGCCGCCCTGGCCGCCGCCGACGCCCGTCCCAACGCGAGCATGCAGGCAATCGCCGAGG
+CCTTTCACTCGCCGCCGGGCTGGGTCGTGGCCGCGAACGCGCCTTTCAAGTCGGCCACCAAGTGGAGCGG
+CGTCTCCTTTCGCGATCACGGTAACTGGGTGATCGGCGCGCCCGACGTGCTGCTCGATCCGGCTTCGGTG
+GCGGCCAGACAGGCCGAGCGGATCGGAGCGCAGGGATTGCGGGTGCTGCTGCTGGCTGCTGGCAGTGTGG
+CCGTCGACCATGCCCAAGCGCCGGGTCAGGTCACCCCGGTAGCGCTGGTTGTGCTGGAGCAGAAGGTGCG
+GCCCGACGCCCGTGAAACGCTGGATTATTTTGCTGTTCAGAATGTTTCGGTCAAGGTGATCTCCGGTGAC
+AACGCGGTGTCGGTTGGTGCGGTCGCCGACCGGCTCGGGCTGCATGGCGAGGCGATGGATGCGCGTGCGC
+TGCCGACGGGCCGCGAAGAACTGGCCGACACACTGGACTCTTACACCAGTTTTGGCCGTGTGCGGCCGGA
+CCAGAAGCGTGCGATCGTGCATGCTCTGCAATCACACGGGCATACCGTGGCGATGACCGGCGACGGCGTC
+AACGACGTGCTTGCCCTCAAGGACGCTGATATCGGTGTGGCGATGGGCTCGGGCAGCCCGGCCTCGCGTG
+CGGTGGCACAGATCGTGTTGCTGAACAACCGGTTTGCCACGCTGCCCCATGTGGTCGGCGAGGGGCGTCG
+GGTCATCGGCAATATCGAACGGGTCGCCAATCTATTCCTGACTAAGACGGTGTATTCCGTGTTGCTGGCG
+CTGCTGGTGGGTATTGAGTGCTTAATTGCCATACCGCTGCGGCGTGATCCGCTGTTGTTCCCGTTCCAGC
+CGATCCACGTCACCATCGCGGCCTGGTTCACTATCGGGATCCCAGCGTTCATCCTGTCCTTGGCGCCCAA
+CAACGAGCGGGCCTATCCGGGCTTCGTTCGGCGAGTTATGACGTCTGCGGTGCCGTTCGGACTAGTCATC
+GGTGTCGCGACTTTCGTCACCTATCTGGCCGCTTACCAGGGTCGCTACGCCTCGTGGCAGGAGCAGGAAC
+AGGCGTCGACCGCTGCGCTGATCACGTTGTTGATGACCGCGTTATGGGTGCTGGCGGTGATCGCACGCCC
+CTATCAGTGGTGGCGACTGGCGCTGGTGCTTGCCTCCGGACTGGCCTATGTGGTGATCTTCAGCCTTCCG
+CTGGCGCGGGAGAAGTTCCTGCTGGATGCCTCGAACCTGGCGACGACGTCAATCGCGCTGGCGGTTGGCG
+TGGTGGGTGCGGCGACCATTGAGGCGATGTGGTGGATCCGAAGCAGGATGCTCGGTGTGAAACCGAGAGT
+GTGGCGATAACCGCGAATCGCCGCGCATTAGCGCCCGCAGTTCGGGCAATCCGAGGGCGTTGCGGCGTAG
+TGCATCCAGGCGGCCATTGATGGCTTCGGTAGGGCTGGTCTTGCCGCGGCGCCGGTCGGGGTGGGCGTAG
+GCGGCGATCAGGCGCTGGGAGAAGCCCCAGCACATTTTGCCGTGTGTTGAGCGGTGGGTAGCGCGTGCGC
+GGGGTGTGTCGTACTCGGTAGAGCGGATCTCCGCGCGGCCCCGGTGACCGCCCGTGAGCTGTTGGATGGT
+TGGTGGTGCATATCGTCGGTCTGTCGATCGAGACCACAGCACCGACCGACTCCGCGATTACTCCCATCAT
+GGTCCGGGAAATCAACATCGGTGAGATCCCCCTAGGCCTCAGGCTGGGCAGCGACACCACACTGCTCGAC
+GCCGCTCTCGCGGGTGGGTAACACCGGCAGCCAGCTTTCGGGCTTTTCCCGACCGGCTCTAAGGGCTGGT
+TGCAGTCAACCGCACCGCGACAAGTAGGGTTCACCAGAGGATACTGGGGCCAAGCTCGTGGCAAGAAACG
+GTACGCATGGGAATCCTGGACAAGGTAAAGAACCTGCTGTCGCAGAACGCCGACAAGGTCGAGACGGTGA
+TCAACAAAGCGGGCGAATTCGTCGACGAGCAGACGCAAGGCAATTATTCTGACGCCATCCACAAGCTGCA
+GGACGCGGCCAGCAACGTCGTCGGCATGAGCGACCAGCAGAGCTAGCACGCATGGCGAAACTGTCCGGAT
+CCATCGACGTACCGCTGCCACCGGAGGAAGCCTGGATGCACGCCTCCGATCTGACTCGTTACCGAGAGTG
+GCTGACCATCCACAAGGTATGGCGCAGCAAGTTGCCCGAAGTGCTCGAGAAGGGCACGGTCGTCGAGTCG
+TATGTCGAGGTCAAGGGCATGCCCAACCGGATCAAGTGGACGATCGTGCGGTACAAACCCCCGGAGGGCA
+TGACGCTCAACGGCGACGGTGTGGGTGGTGTCAAAGTCAAGCTGATCGCTAAGGTAGCGCCGAAAGAGCA
+CGGCTCCGTCGTCAGCTTCGATGTGCACCTCGGCGGCCCGGCCCTGCTCGGGCCGATCGGCATGATCGTC
+GCCGCTGCATTGCGAGCCGACATCCGCGAATCGCTGCAGAACTTCGTCACGGTGTTTGCCGGCTGACCGG
+CGAACGTGATCGGTGTCGATGAGTTTCAGACTCCGGGGCGGTCGGTACCTGTGAACCCTGATCCAGGGCC
+CGACACAGACTAGGAGGTCATCCGTGCCTACTCGTAGTAGCGCGCCGCTGGGCGCACCCTGCTGGATCGA
+CTTGACGACTTCGGACGTCGACCGTGCCCAAGATTTCTACGGCACGGTGTTCGGCTGGGCGTTCGAGTCC
+GCGGGACCCGACTACGGCGGATACATCAATGCCGCCAAGGGCGGTCACCCGGTCGCCGGCCTGATGGCCA
+ATCGGCCCGAGTTTCAGTCTCCCGACGGCTGGGCCACCTACTTTCATACCGTCGACATCGGTGCGACCGT
+GGCCAAGTTGGCTGCCGCGGGCGGTTCGTCGTGCCTGGACCCGATGGAAGTACCCGGCAAGGGCTTCATG
+AGCCTGGCGGTCGATCCGTCGGGTGCGGCCTTCGGCCTGTGGCAGCCGCTGCAGCACCACGGCTTCGAGG
+TGATCGGTGAAGCCGGCTCGCCCGTCTGGCATCAGCTGACGACGCGCGACTACCGTTCCGTCATAGACTT
+CTACCGCCAGGTCTTCGGGTGGCGCACCGAACAGATTTCCGACACTGACGAATTCTGCTACACCACAGCA
+TGGTTCGACGATCAGCAATTGCTCGGTGTGATGGACGGCAGCTCCTGTCTCCCCGAAGGCGTTCCGTCGA
+ATTGGACCATATTCTTTGGTGCCGAGGACGTTGACGAGACGTTGCGGGTGATCTGCGACAACGGCGGAAG
+TGTGGTGCGGGCCGCCGAGAACACCCCGTATGGCCGATTGGCCGCGGCAGCCGACCCGATGGGCGTTGTC
+TTCAATTTGTCGTCTCTGCAGGCGTAATGGCGAATCGGGCTGCCGCGTGGCGCGCGGCGACCCGCCCATG
+CGCAGTATTAGTGTCACAACCATGACGCGCCGCCTGCGCCCTGGTTGGCTCGTGGCACTTTCCGCCGCGG
+TCATCGCGGCCAGCACCTGGATGCCTTGGCTGACGACGACCGTCGGCGGTGGAGGCTGGGTCAACGCCAT
+TGGGGGCACACACGGCAGCCTGGAGCTCCCGCACGGGTTCGGCCCGGGTCAGCTCATCGTCTTGCTTTCC
+TCGACGCTGCTGGTGGTTGGCGCGATGGCGGGACGCGGCCTGTCGGTGAAGCTTTCCTCGATTGCCGCGC
+TGGTCGTCTCGCTGCTCATCGTGGCACTCACGGTGTGGTACTACAAGCTCAACGTCAACCCACCCGTGTC
+AGCCGAATACGGGCTGTACTTCGGTGCCGCCGGCGGGGTGTGCGCGGTGGGTTGCTCGTTGTGGGCTGCG
+GTGTCGGCCGCTTCGCCTGGGCGTCGTCGCCATCGTGAAGTGGTGCGGTAGAACATTTCAGCCCGGCGGA
+ACTCGTGTTTTCCCCGTGCGGGGCTGGCTCCCGATTGGGTAGCCCCGTACACGAAAGGCGCAAACACAAC
+CTCGCGGCCATCCGGGTCGCGATAGATGACGGCTCCGGTAGCTTCTCAAAGGGGGCGTTGTTCCACCGGC
+TGGGTCGCCACCTCTTGCAGGCCAGTAAGTGCGGCTTGCTGCCCCCGCTTGTCCGAGCAATACCGGCACA
+GCTGTTCGTGATGGTCTGTTTCGACGATTTCCAGCGTCAGGCTCGAGCTGGGAAGGCCGAATATCGCGCC
+GTTGCTTCCGTAGCTTTCGGCGAAGGTCTGGTCGAGCATTCCCACCAGATCACGGTAGAACCGCACTGTC
+TCTTCCAAGTTCGACGGGCGGGGCCGATTGACGCCAATCCCTCGGGCCAGTGCGTTGTTCGGCGGCGCTT
+TTCGTTGTCCACCGCTACTCCGTTTCGCCGAGGCTGCACTTCTGCAGGCCGCTACTCGCAGTTTTGCTGC
+GGATTTTCCGGCTCGGTGCAATTCATAGCCCAACGGCAGCCGCCGGCGACTCTGCGTGATCCCAGCGACG
+CAACTCGGCGCCCGGCACCCACGCCGAATGCGTGCCGCTGGAAATACGTTCCGGCAGTGCAAGCTTGCAT
+ATCGGGCCATCGCCGGGGCGCGCCGCGTCGAAAACCAGGCAATACGATGCGTCGTCGTTCATGTCGGTGG
+TGAGGGTGACCAGATAGCCGTCGTCCTCGGCGCTGCTGCCCACCCGTGGAGCCATCGCGGTCTCACTTCC
+GTAGACGCCGTCACCGAACGAGTAACACTCGTGGTTGCCGGTGAGCAGATCGTGCTTAACCAGTCCGTCG
+AACAGGAACCAACTCGGTTTGCCGGTAGCGGCATAGGTGTAACGGTAGCTGCTGGCCGCGTAATCGGCGT
+TGATGGTTCCGAACTCGGTGATGGACTCGGACAGTTGCTCCTCGTGGACTGCCCCGGTCACCATATTGAG
+CCGCCACCGATGTAGCCGGGACTGCAGCCGATCCAGAGCCAGGAACCGAAACAGCTTCTCCCACTTCGTT
+CCTCCGGTGTCAAGTGGCTGCGGATCGCCTTCGTAGAAGCCGTCGAGCACGATCTCGTCGCCCTGCTCGT
+AGGCGTTGGTGAAGTGCAACACGAACGTTGGATCGGCTTCGAACCAGCGAATGTCGTTGCCTCGGCGAGC
+AACAACCGCAAACCGAGATGGAATCTCCGGATAGAAGCGTGGTAGGTGCACGTCGCGCTCGAGCAGCCTG
+GGATCCCAGAACAGTGGAAAATCGTTGAGGATTACGTAATTTTCGGTGAACGCCATGTCATGCAGTAGCC
+GCGGCCCGGGCAGCGGAACATCGACATAGTGCACAAGCTCATTGTTCTGGTCGACAACGCCGTAGCGCAT
+ATACGGCTCTTGCTTGCTGTAGTTGAAGAACAACAGTTCGCCGGTCTTGTTGTCTACCTTCGGATGTGCC
+GACACGCCCCAGTCGAACGGAAACCTTCCGTGCCAGCTCTCCTTGCCGAGCGTATTGGCCGAGTACGGGT
+CGATCCGATACAGATCGCCGCACTGGTAGAAGCTAGTCAGCGCGATACCTCGGTGGACGATGACGTCGGT
+GCTCGACGCGTCCTTCATGAGGCCACGAGCGCCCCAGCCGTGTTCCCGCTTGGCCAGTTGCACCGGTTCT
+GCCAGACCCGGCCACAGCGGCCCGCCGGCCTCGTTCTCGGCCAAGAATCCATCGGTGCGAATAAATCGGT
+TGCGGTAGAAGGCTTTTCCATCACGGAAGCCGACGACATGGATCATGCCGTCGCCATCGAAGGGGTGGTA
+GGTCGCGAATGCCGGGTGTAGCGGGTTCTCGGTGTTGCGCAGGTAGATGCCGTCCAGGTCGGCGGGGACT
+TCGCCTGTCACGGTGGTCAGGTCGTCGGCATCCCATTCGGTGGTCTGTGGTCGCCACGGACCGGTGCGAT
+AGGGGTGGTCGTCGTCTTCGGGAAGGGTCGACAAGTACTTGCCGACAATCGTGATGTCCATTTCACGATC
+CTCGTGTGGTGCTGACAACGAAACTGACCGTGGTGGCCGTGCTGCCACCGAAATTCAGCGTGCCGAACGC
+TTCGGCGTTCTCGACCTGATAGTCACCGGCAATGCCGCTCACCTGTTTGGCCGCGTCGAGCAGCATCCGC
+ACACCGGAAGCCCCGACCGGATGTCCGCCACCGATCAGTCCTCCGCTGGGGTTGATGGGTAGCCGCCCGC
+CGATCTCGATCTCTCCGTTCTCGATGGCCTTCCAAGATTCCCCGGGGCCGGTCAACCCGATGTGATCGAT
+GGCCAGGTATTCGCTGGGGGTGAAGCAGTCGTGCACCTCGATCCCGTCCAGATCGTCGAGGGTCACCCGG
+GCGCGGCGCAGGGCGTCCAGCACTGTGGCCCGCACGTGCGGCAGTAGGTAGGGGGCCGAGTCGCCCTGGG
+CGACGCGGTCCAGTTTCTGCCGCAGACCCAACCCGACGGTGCGATGTCCCCAGCCGTCGATGCGGCCGAT
+CGGGCGCGCGTCGCGATGGTCGCGCAGATAGGCATCGCTGACCAGGACCAATCCCGCGCCGCCGTCGGTC
+ATCTGGCTGCAATCAAACCGTCGCAGCCGGCCTTCGGTAAGAGGGTTGGTCGCGTCGTCGTCGGTGATCG
+GGTCGGGGATCGTCCAGCCGCGGGTCTGCGCGTTGGGGTTGCGGCGCGCGTTGGCGAAGTTGAGTTGAGC
+GATGGCCCGCAGGTGAGTGTCATCCAAACCGTATCGCCGGTCGTATTCGTCGGCGACCTGAGCGAACATC
+GACGGCCATAAGTAGCGGGCCTCGGCTCCTTCGTGCCCGGTCCAGGCCGCGGCACTCAGATGCTCGGCCG
+CGGTGTCGCCGGGCACGGTCTTCTCCAGCTCTAGGCCCACGACGAGCGCGACACGGTACGCGCCTGATCG
+CAGGTCGGCCATCGCCGCGAGCGTCGCCACGCTGCCGGATGCGCACGCGGCCTCGTGCCGGGTGGCCGGC
+GTGTCCCAGAGATCGTCGCAGACAGTGGCCGGCATCGCGCCGAGGTGGCCTTGACGGGCGAACATCTCGC
+CGAAGGCGTTCGCGACGTGGACGACTCCCGCAGCGGCTAGGTCGGCGGCGTCCACCTTGGCCGCGGTGAG
+CGTGCCGTCGACGACCTCCCTAGTCAGGTCGGCGAAGTCGCGGTTCTCTTTGCTGAGGTTGCGAGCAAAA
+TCGCTCTGATAGCCGCCGAGAATCCAGACACCGTCGTCCATAGCCGTACGCTACTACAAGCGGTGTGAAC
+GGCCCGTCGGATAGCCACGCTCACCAGGCATTTTCCGCGCGGCGACGAACGGTTGCCGGACTTTTACCGC
+GGGGGGTTTCCGGGCGGCGGCTGCTCTCTAATCACAACTACCGGGGGTTTGCGGCCGTCCTCTTGGCCGT
+CAGTGCTGGTGCCGCTACGGGTGCCGCCACCGCCCGTCGTGCCGCGTGCGGCCAGGCTCGCCAAAGCCAT
+CCCGCTGAGCAGGCCTGCCGGCATCCCGTTTAGGGCCGTCGGGTCGGCGCCGGCGCTGGAGCTGAAGGTG
+GGTGTTGCCTGAACGGCGAGCTGGATCTCCGGGGCGGCCGTGGTCCAGCTGTGCGGCACCGACAACGCTC
+CGACTAATGCTGCGTGGCCGACGCCCGCGGACACCGGCGCCGCGCCCCCGAAGGGGCCCCAGTGCGGCTC
+CGGCTCGTCGGTCGCCGAACTCAGTGGATGGCCCTGCGTCGGTCCCAGCCCGCCGGCGTTCCCGTATAGG
+CCGATGTGCCAGGGTCTGGCCGTGTTCGTGATCGCGAGCGCAATGCTGCCGGTCGCGATGGATGCAATGT
+AGAGCGCGATCACGTCCAATTCCCCTATCGGGGTGGGGATCACTATCGGCTGAGCGGATCCGACTTGCGG
+GTTGAGGGTCGACGCGATCCCCAACAGTCCCGATGTCAGCGGATCAGCGTTGGCGGCCAATGCGGACAGA
+ATGTCGCTCAGGATCCCCGGGGGCAGCTGGGCCAGTGTCGCCTGTGCATCCGCAACGGCGCCCGCACCGG
+CGGCTTGGGTCGCCGCGGCTGCGGCCGCGGGCCCGGCCGGGCCGGTGCCTTGCACGGGTGGAGTGAACGG
+CGGCAACGCCGACGCGGCCGCAGATGCCCCCTCATAGCTGTACATCACGGCAGCGTCTTGGGCCCACATT
+TCGGCATACTCGGCCTGGGTAGCCGCGATCGCCGCACTGTTTTGCCCCAGAATGTTCGCCGCGACCAGCG
+ACATCAACCGGCTGCGGTTGGCCGCGACGAGGGATGGTGGCACCGTCATCGCGAACGCCGTCCCAAACGC
+TTCCGCCGCTGCCCTCGCCTGTGTGGCCGTCTCCTTCGCCAGCGCCGCCGTGGCGGCCAGCCACCCCACA
+TACGGCGTTGCCGCGGCCGCCATCGCGGCCGCCGCCGGCCCCATCCACGGCTCAACGATCAGCGTCGACA
+CCACCGATCCATACGAGACCGCGGCGGAAGTCAACTCCGCGGCCACACCGTCCCAGGCGGCCGCGGCGGC
+TAGCATCGACTCCGGCCCCGGACCGGAATACATTCGGCTTGAATTCACTTCCGGAGGTAAAAGCCCGAAA
+TCCATTGCCAGCAACCTCCTTAACCGGTCGCGACCACATTGACGGCCTCGGTGGTCGCATACGCATCGGC
+GGTGGCCGCCGGGAGGGCCACGAACATGCCATGGACCAGCGCGGCCGGCTTACTCACCACTCGGTAGTGC
+TTGGTGTGCGCGGTGAACCGGGCCGCCGTCAGGACCGACACGTCATTGGCAGCAGGGGGTAACACCCCCG
+TCGTCGGGGCACAGACGGCTGTGTTCCGAGCACTCACGGCGGTACCGATCGTCGGCAAGTCCCCCGTCGC
+GGCTGCCAAGACCACCGGCTGGATGGTCACAAAAGACATCGGATACCACCTGACGCGGATCGCTTCATCT
+GATCGGTCGACATCTTCTACATAACCACGGAAATGTCTGCTTTATAACGGAATTAGACTACTTTGTGTTG
+TCTGGCGTTGCTCTGCACCGACGGCATGGGTAAACGTCTGAGATGCGGGTGTCGGCGGTAGCTGAAAAAC
+CGTGCTGACAACCATGATTCGCCATTCCCGAACGACCTGCGAACTTTGTCGCCTAGCGTAACGCCGTGGC
+GAGATTTGGCTCGATTGTTCGCAGTGGCGTTACGCTCGCCACGCGTGAGCCTGGATCAGGCAAACGCGGC
+TCCACCTGGCCATTTGCTGTCCGAGACGGTAGTTACTCAGCATGGTGCACAGGTCTGTGCTTGTCTGGTT
+GATGGTGATTTGGCGTTGCGGTGGCCGTGATGAGGACGCGGTGAGAAACGGAGCTTGAAGATATGTCAGC
+GAAAGAACGCGGTGACCAGAACGCCGTCGTCGACGCCCTGCGGAGTATTCAGCCCGCAGTCTTCATTCCG
+GCTTCAGTGGTCATCGTCGCCATGATCGTCGTTTCCGTGGTGTACTCGAGCGTCGCCGAGAATGCGTTCG
+TTCGGCTGAACTCCGCGATCACCGGCGGCGTCGGGTGGTGGTACATCCTGGTTGCCACCGGGTTTGTGGT
+ATTCGCGCTGTACTGCGGCATTTCCCGGATTGGCACTATCCGGCTGGGCCGCGACGATGAGCTCCCCGAG
+TTCAGCTTCTGGGCATGGCTGGCAATGCTGTTTAGTGCCGGTATGGGTATCGGCCTGGTCTTCTACGGGG
+TGGCCGAGCCGCTCAGCCACTACCTGCGGCCACCGCGGTCACGCGGCGTGCCCGCGCTTACTGATGCGGC
+GGCTAACCAGGCGATGGCGCTGACAGTGTTCCACTGGGGCCTGCACGCCTGGGCAATTTATGTCGTGGTT
+GGCCTCGGTATGGCGTACATGACCTATCGGCGGGGTCGCCCCTTGTCGGTGCGCTGGCTGCTGGAGCCGG
+TCGTGGGTCGGGGCCGTGTAGAGGGCGCCTTGGGGCACGCGGTGGACGTCATCGCCATTGTCGGAACACT
+CTTTGGTGTCGCCACGTCACTGGGCTTCGGTATCACTCAGATCGCCTCCGGCCTGGAATATCTCGGCTGG
+ATCCGGGTGGACAACTGGTGGATGGTCGGCATGATCGCCGCCATCACCGCCACTGCGACGGCGTCGGTGG
+TCAGTGGGGTCAGCAAGGGTTTGAAGTGGCTGTCGAACATCAATATGGCGCTGGCCGCCGCATTGGCCCT
+GTTCGTGTTGTTGCTCGGGCCGACACTTTTCTTGCTGCAGTCGTGGGTGCAAAATTTGGGAGGCTACGTC
+CAGTCGCTTCCGCAATTCATGCTGCGCACCGCGCCGTTCTCGCACGACGGCTGGCTCGGCGACTGGACTA
+TCTTCTACTGGGGTTGGTGGATCAGCTGGGCTCCGTTTGTCGGGATGTTCATCGCGCGGATTTCGCGGGG
+ACGGACGATCCGGGAGTTCATCGGGGCGGTGCTGCTCGTTCCCACCGTGATCGCCTCGCTATGGTTTACG
+ATCTTCGGTGACTCGGCGTTGTTGCGGCAACGCAACAACGGCGACATGCTCGTCAACGGGGCGGTAGACA
+CCAACACATCGCTTTTCCGATTGCTGGACGGTTTGCCTATCGGGGCTATTACCAGCGTTCTTGCTGTGCT
+GGTGATCGTGTTCTTCTTCGTTACGTCGTCGGACTCCGGTTCGTTGGTCATCGACATCTTGTCAGCGGGT
+GGTGAGCTGGACCCGCCCAAGCTGACCAGGGTCTACTGGGCGGTGTTGGAGGGGGTAGCCGCGGCCGTTT
+TGCTCCTGATCGGAGGTGCTGGGTCACTGACCGCGTTGCGGACGGCCGCTATTGCCACGGCCCTGCCGTT
+CTCAATCGTCATGGTGGTGGCGTGCTATGCGATGACCAAAGCGTTCCACTTCGACCTGGCCGCCACACCT
+AGGCTGCTGCACGTCACCGTGCCTGACGTGGTTGCGGCAGGAAACCGGCGACGCCACGATATCTCGGCGA
+CGCTGTCGGGGCTCATTGCCGTCCGTGATGTCGATAGCGGCACATATATAGTCCACCCCGACACCGGCGC
+TCTCACCGTCACTGCACCACCAGATCCGTTGGACGATCATGTTTTTGAGTCTGATCGGCACGTAACGCGA
+AGAAACACAACATCATCGAGATGATGTGTTATCGACCTGCCGGGTCGCCGCTGCCTGGACCGGAGCCGGC
+TACTTCCGGTAAACGCGCACCGCTGGATGAATCGCCGCGGCATGAGAAGCTCGACGGTGGTGCCGGGATC
+GTCGCGCACGATGTCATGCTCCAGGGTGCTGGTCAGCCGATGGCCTTTGGTGTGCCACTGACCGGGTCGA
+TCTCCGCGGCCGGCGACCACGCCACGGTCGCGTCCATAGCACAGGTCGCGCGGCGCGCGACGGCGTGACC
+CGACATCAAGTCCTTATCGGAGGAGCTTGGCCCCTCGCGTTGGTCCGCGGCAGGCTCGGTCGGCAAATCC
+TCAAATCGGCCCCAAGTTGCACCGAGCGGGAGCGGCGGTGACGGCCAACGTGTGGTGTCGTGCGGGCGGC
+ATTCGGATGGCGCCACGGCCGGTCATCCCGGTGGCTACGCAGCAGCGCCTGCGGCGGCAGGCGGATCGCC
+AGAGCCTGGGTGGTAGCGGCTTGCCAGCGTTGAATTGTACGCCTATCAGGCACACAATTGATGTCATGGC
+TACCAAGCCTGAGCGGAAGACCGAGCGTCTTGCAGCGCGCCTGACCCCTGAGCAGGACGCGCTGATTCGT
+CGTGCTGCCGAGGCCGAGGGGACTGACCTCACCAATTTCACGGTTACAGCGGCGTTGGCGCACGCGCGCG
+ACGTGCTGGCCGACCGCCGGCTCTTCGTACTCACCGATGCCGCGTGGACTGAGTTCCTCGCCGCGCTGGA
+CCGGCCCGTCTCACACAAGCCTCGGTTGGAGAAGCTGTTCGCCGCGCGGTCCATTTTCGACACCGAGGGG
+TGAGCGGCTACAGCGCGCCGCGACGTATCAGCGACGCCGATGACGTCACGAGCTTCAGCAGCGGCGAGCC
+CAGTCTGGACGATTACTTGCGCAAGCGGGCGTTGGCCAACCATGTGCAGGGAGGGTCGCGCTGTTTCGTG
+ACGTGCCGTGACGGTCGGGTAGTCGGCTTCTATGCGCTAGCGTCAGGGTCGGTCGCACACGCTGATGCTC
+CGGGACGGGTGCGCCGCAATATGCCTGACCCCGTGCCGGTGATCCTGCTGTCGCGGTTGGCGGTTGATCG
+CAAAGAACAGGGCAGGGGCCTGGGCAGTCATCTGCTGCGTGATGCGATCGGTCGCTGTGTCCAGGCTGCG
+GACTCGATCGGGCTGCGGGCGATTCTTGTTCATGCGTTGCACGATGAGGCCCGCGCGTTCTACGTCCACT
+TCGACTTCGAGATCTCGCCGACCGATCCGCTGCACCTAATGCTGTTGATGAAAGACGCTCGCGCGCTAAT
+TGGCGACTGATGCTACGCGATTGACTATCGAGAGCCAGGCTACGTCATCTGATACCAACCAATCACCGAC
+CACAGCACCGACCAGAACAAGCCACGACCACTCGGCTGACACCTGAAAACCATGGCTGAACTGCGCAAAC
+ACAGAGTGCCCCCGGCAGGATTCGAACCTGCGACACCGGCTTTAGGAGAGCCGTGCTCTATCCCCTGAGC
+TACGAGGGCGGGGACGCCTTTGAATACCTGACTAAAACCTAGCCGTTCGCCGCGCCGGCCGGGACTGTCC
+GATATTCGGTGTAAGTGGCGTTTCTCGGGATTTTTCTTTCGGTCAGCGTTCTTCGGCGGCTGGCATGCGA
+TCGGCGAACGTGATCGCCAGGGCGTTGAGCGCTGGCTTCCAGCGTACGGCCCACTTGGTTTGCCCGGTGC
+CCTTGGGATCCAGGGAGCGGGTGACCAGGTAGAGCGTCTTGAGTGCTGACTGTTCGTTCGGGAAGTGTCC
+ACGTGCCCGCACCGCCCGCCGGTAGCGCGCATTGAGACTTTCAATTGCGTTGGTAGAACACGGGACTCGC
+CGTATTTCGACATCATAGTCCAGGAACGGAATGAACTCTTCCCACGCGCTGTCCCACAGCCGTGTGATCG
+CCGGGTAAGGCTTACCCCATTTCTCGGCGAACTCCTCGTAGCGCAACCTGGCCTCAGCGGCACTGGCTGC
+GGTGTAGATCGGCTTGAGGTCGACGCTGATCTTGTCCCAGTACTTGCGGGAGGCATACCGGAAAGTGTTG
+CGGATCAGATGGATGATGCAGGTCTGCACCGTGGCCAACGGGAACGCCGCGGACACGCTGTCGGGCAACC
+CTTTGAGGCCGTCGCAGACCAGGAAGAAGATGTCTTTGACCCCACGATTGCGCAGTTCGGTGAGCACTGC
+CAGCCAAAATTTGGCTGACTCACCGTCGCCTTCGCCGGCCCACATCCCCAGGATGTCCTTGTGGCCGTCG
+AGGTCGACGCCGATCGCGGCGTAGACCGGCCGGTTGCGGACCTGCCCGTCGCGGATCTTGACCATGATCG
+CGTCGATGAACACCGCGGCGTAGACCTTCTCCAGCGGCCTGGACCACCACGCCTGCATCTCCTCGATGAC
+CCGGTCGGTGATCCGCGAGATGGTGTCCTTGGACACCGACACCCCGTAAACGTCGGCGAAGTGAGCCGCG
+ATCTCGCCGGTGGTCAGGCCTTTGGCGTACAGCGACAACACCACCCGGTCCACATCGGTGACCCGGCGCT
+TACGTTTGCCCACGATCACCGGCTCGAAGGTGCCGTTGCGGTCACGGGGCACCGCAATCTCGACCTGTCC
+GCACGCATCGGTTATCACCTTCTTGTTACGAGATCCGTTGCGTGAGTTTCCACTTCCACGCCCGGCTGCG
+GCGTGCCTGTCGTAGCCGAGGTGTTCGGTCATCTCCTCTTGCAGGGCGGCTTCGAGCACCGTCTTGGTCA
+GCGCCTTGAGCAACCCGTCAGGGCCGGTCAATGCGACCCCCTCAGCGCGTGCCTGGCGTACCAGATCACC
+CACCAGCGCCCGCTCGGCACCGGAGAGCTCACGGGCCGCAACGGCCGCCTCATCCACGTCCTGGCCGGCG
+TGAGCCGGCTCTATCACCTGAGCAGCATCCATGCCCTTGAGTGTGTTTGGTCATAGCAGTGATTCCTTCT
+GCCCCACGCCGGGGGCGGTCAGAACCACTTACACCGAATCAGCGATAGACCCCTCCGGCGGCGGGGGGGT
+TGGCGGTGTTTGTGGCGTCCGGTCGTCGGGGTGCGGCGGGTGTGAGTGTAGCGGGCGCAACGAGGGCCAC
+CTGACGCTCGGGCGTGTGTGGTGGGCGCTTGTCGGCCAACGCTCTGGGGTTCAGAGCTGTTGCGTGTTGA
+GTGTGTTTTAGTGTGCGTTAGTGTGTTCTAATTGGCGGCGTGAATCTGGCGGATTGGGCGGAGTCGGTGG
+GGGTGAATCGACATACCGCTTATCGCTGGTTTCGGGAGGGGACGTTGCCGGTGCCCGCGGAGCGGGTTGG
+CCGGTTGATCCTGGTCAAGACGGCCGCCTCGGCGTCGGCCGCAGCGGCGGGAGTGGTGCTGTATGCGCGG
+GTGTCAAGCCATGATAGGCGTTCGGATCTGGATCGGCAGGTCGCGCGTCTAACCGCGTGGGCCACCGAGC
+GTGACTTGGGGGTGGGGCAAGTGGTGTGCGAGGTCGGTTCCGGCCTGAACGGCAAGCGACCCAAGCTGCG
+GCGCATCTTGTCGGACCCCGATGCGAGAGTCATCGTTGTGGAGCATCGGGATCGGCTGGCGCGTTTCGGG
+GTGGAGCACCTCGAGGCGGCGCTGTCTGCTCAGGGCCGGCGGATTGTGGTCGCCGATCCTGGTGAGACGA
+CCGATGATCTGGTGTGTGACATGATCGAGGTCTTGACCGGTATGTGCGCGCGGCTGTACGGGCGTCGCGG
+TGCGCGCAACCGGGCGATGCGTGCGGTCACGGAGGCCAAGCGTGAGCCGGGGGCGGGGTGATGATCGTCA
+GGATGCGTAGCTGCGCTCAGGCCGCGAAGGTGGCCGAGGCCACCGGTGGTGTGCAGCTGGCGGGCAAGCC
+GAAACCCGATGGGACACCGACGTTCTCCCGGTATGTGGAGATCGGCGTGGATTTTGAGGCGCACCGGCCG
+GTGGTGGAGTCGGTTTCGGTGCTGTTCGAGCTTTATGACGGCGACGCCAACAGTTATGCCGCGACCGGGG
+GGCCGGGTGCCCAACTGCCGTCGGGCTGGATGGTCACGGCGGCGAAATTCGAGGTCGAGTGGCCCGCCGA
+CCCGCAGCGGGCGGGTTTGGTGCGTTCACATTTCGGCGCCCGCCGCAAAGCTTTCAACTGGGGCCTGGCC
+CAGGTGAAGGCCGACCTCGACGCCAAAGCCGCTGATCCGGCACATGAGTCGGTGGACTGGGACTTGAAGT
+CGCTGCGATGGGCGTGGAACCGAGCCAAAGATGACGTGGCGCCGTGGTGGGCCGAGAATTCCAAGGAGTG
+CTACTCGTCGGGGTTGGCCGATCTGGCCCAGGGCCTGGCTAATTGGAAAGCTGGCAAGAACGGGACCCGC
+AAAGGCCGGCGGGTGGGCTTCCCGCGATTCAAATCCGGGCGGCGTGATCCTGGCAGGGTGCGGTTCACCA
+CCGGCACCATGCGCATAGAGGATGACCGGCGCACGATCACGGTCCCGGTGATCGGGCCGCTGCGGGCCAA
+GGAGAACACCCGCCGGGTGCAACGCCACCTCGTGAGCGGGCGCGCGCAGATCCTGAACATGACCTTGTCG
+CAGCGGTGGGGCCGGTTATTCGTGGCGGTCTGCTACGCGCTGCGCACCCCGACCACCAGATCACCGCTCA
+CCCAGCCGACTGTGCGCGCCGGAATGGACCTGGGAGTCCGGACCCTGGCCACGGTCGCCACCCTCGACAC
+CGCCACCGGCGAGCAGACCATCATCGAATACCCAAACCCGGCCCCGCTCAAGGCGACACTCGTCGCCCGT
+CGCAGGGCCGGCCGAGAACTTTCCCGCCGCATCCCCGGCTCCCATGGGCATCGGGCAGTGAAAGCCAAGC
+TGGCCCGCCTGGATCGCCGGTGCGTGCACCTACGGCGGGAAGCAGCCCACCAGCTCACCACCGAGTTGGC
+GGGCACCTATGGCCAGGTCGTGATCGAAGACCTCGACGTGGCCGCGATGAAACGCAGCATGCGCCGGCGG
+GCGTTTCGCCGATCGGTCTCCGATGCCGCAATGGGTTTGGTCGCGCCGCAGCTGGCTTACAAAACGGCCA
+AGTGCAGCGGCGTGCTGACGGTGGCGGACCGCTGGTTTGCCTCCAGCCAAATCCACCACGGCTGCACCAG
+CCCCGACGGCACACCGTGCCGGCTGCAAGGCAAGGGCCGCATCGACAAACACCTGCTCTGCCCTGTAACG
+GGCGAGGTAGTCGACCGCGACAGAAACGCTGCTTTGAATCTCCGTGACTGGCCGGATAACGCCAGTCGTG
+GTCCAGTCGGGACCACGGCCCCATCGGCACCCGGGCCAACCACCACGGTTGGTACAGGCCATGGCGCGGA
+CACCGGATCATCCGGCGCCGGCGGAGCATCCGTAAGACCCCGCCCACGCAGGGCCGGACGCGGCGAGGCC
+AAAACCCAAACCCCGCAAGGGGACGCCGCATGAGAGTGCAACTAAAACACACTCAACGGCAACGGTGTCG
+TCGGGATGCCAGCGCCGCCCACGCATCTTCACTTGATCGAGATCGATCAGGTGATCGGCCGCTCATTGGC
+GGCCGCGGCATCATGCAGATGGTTGACGAGCTGCGTGCGGCCGCTTCCGGTCCAAAATCGCCAGACAGCT
+ACCAGGAACGGGCCGCAGTTACCAGGCCCTGTACCAGGGTAGCGGTGACCGGTGACATGCCGCCGACGCC
+GGGGAGGGTACTGCGTGGGCCCAGACCCCTTACCCGAATCGATAGTTCCAGCTGGGTCCCGCCGTCGCGG
+ACCCGGTTGACCGGATTGTCTGGATGCAGGCCGCGGAGCTCCTCCGGGATGGCGGCCAGATCGGTGACTA
+CCCGATAGCCGGGCAGCTGGATGTGCCGCGCGAGATGGGCGGCAAGCGCGCGGTTGCGGCCCCCGGCCAA
+CAGCTGGGTGCTGCGCCCGATGCGGTCGTAGCCGTGCAGCGACACGGCGACGTCAACGTGGTCAAGGAAT
+TCGGCGAGGCGCGCCGATTCCGCAGGGTCGAACCGGGCCGACGGCAGGTGGTGCGGGTAGTTGTCCGGAT
+GGCGCAGCAGGTACACCGAAGCGCCCGCAGCCTCGGCGGAGCGTTCGGCGATCAGGTCGGTCACCTGCTC
+CAGGCCGCCCCCGTGGATGGCGAGGAAGCCGAAGCGGGACCGCAGCTGGCTCGTCTCGATGACGCCGGGC
+TGGCTTAGCAACTCCGAAAGTGATTGTGGCGCAGGCCCAGATCTCGATGACGGTAACACTGGCAGGGGCC
+ACCGCGCGGGGTCCCAGCGGTGCAGATAGTCGATCCAGCGTTGCGGCAGCCCGTGGTGTCGAGCGCCGTC
+GATGACGCGCGGTAGATAGCCCGGCCGCGGCCGGCCCGGCATCACCCGGTGGTCAATGTAGACCCAGGCC
+GGCAACGCTGTGTCGTCGGTGTGCACGGTCAACCGTTCGCGCCGGTAGCGCACCGGCACGCCTTCGGCGC
+TGTCCAACCTGACCAGGTCGCGCTCGGAGAGCTGCCATAGCACGCCATGCACCTTGTTTCCGGCGAAGGG
+TTCGACGGTGGCCACGCCGCGCTGGTTGATCAGCCAGTTGTGATCGCTGAGCACTGCCGGCCGCGGAGCA
+CCGGCGTCGGGACAGCGCGACGCCATCTGGTGGGCGCACAGGTTGGACCCGTAGGCGAAGTAGGGATGCC
+GGCGGTCCGGCATTCAGCCGGTCACCGTGAGATAGATCAGCATCACGTTGAGCAGACTAACCATCACCGC
+GACCACCCAGCCAACCCAAGTCGTGGCGCGATGGTTGGTGTCGCCGCCCATCACCGCGGGGCTGCCGGTG
+AGTTTGACCAGTGGAAGTACCGCAAACGGAATACCGAACGACAGCACCACCTGTGAGAGCACCAATGTGC
+GGGTGGGGTCGAAGCCCAGCGTAAGTATCGCCAACGCGGGGCCCAGCGTGATTAGGCGGCGCACCAGCAT
+GGGAACGCTCCAGTGCAGCAGCCCCTGCATGATCATCGCGCCGGCGTAAGCACCCACCGACGACGACGCC
+AAGCCGGACGCCAGCAACCCGACCGCGAAGAGCACCGCGATCGTCGCCCCCAAGGTGTCGTGGACGGCGT
+GGTAGGCGCCTTCGATCGAGGCGGTGTCCCCACGGCCCCGCATGTTCAGCGCGGCAACCAGCAGCATCGC
+GGCGTTTACCCCGCCGGCTATCAGCATCGCCAGGCCGACATCCCAGCGGGTGACGCGCAGCAGCCGGCGC
+CGCTGAGGGCCCGGATCGGGATGCCCGTGCCGGTCGCGCGCGAGACCTGAATGCAGGTAGACGGCGTGCG
+GCATGACGGTCGCCCCCATGATCGCCGCGGCCAAAAGAACGCTCTCGGTTCCCTGAAAGCGCGGTGCCAA
+ACCGCCGAGGACCGCATTGGGGGGTGGTGTCACGACGAAGAAACTGGCGGTGAAGCCGATGGCAATCACC
+AGCAGCAAGGCGGTGATGACGCGCTCGAACAAACGTTGACCGCGCCGATCCTGGATCGTCAGCAGCAGCA
+GCGAGACCACCCCGGTGATGATCCCGCCGATCGGCAGCGGCAGGTTGAACATGATCCGCAATGCGATAGC
+TCCGCCGATCACTTCGGCCACATCGGTTGCCATCGCGACGATCTCGGCCTGTGCCCAGTAGGCCAGCCGG
+GCCGGGCGTCCCATTCGCTTGCCGATCGCTTCCGGCAGTGAGCGTCCGGTCACCAGCCCGAGCTTTGCCG
+ACAGGTACTGCACCAGGGCGGCCATCACGTTGGCGGCGACGATCACCCATAACAACAGGTAGCCGAACTG
+GGCGCCGGAGCTGACGTTGGCTGCCACGTTCCCGGGGTCGACGTAGGCGATGGCCGCGACAAAGGCTGGC
+CCGAGCAGATACCAGCTCGTCTTCAGGGAAGTCCGGGTGTCCTGGGCCAACTCACCGACTTTCGATCCAC
+GCGAACAAAGATGCGAGAGTAACCGAAATTCGCCCGCCACCAACCACCGGGCTACTCGGGACCTCCGCTG
+GCTATCGGTAGTCGGGGTTGGCGAAGTCCGGCCGGCAGCCGGCGTCCCACTTGGTGCGTTGATTGCCGTA
+GGCCGGGATGCCGCCGGCGCCCGCAACATCTGCGCGATGTGCATCAGATTGAACGTCATGAATGTGGTGT
+TGCGGTTGGTGAAGTCGTTCTCTGGACCGCCGGATCCGGGGTCGAGATACGACGGTCCCGGCCCCGCTTC
+ACCGATCCAGCCGGCATCCGCTTGCGGCGGGATGGTGTATCCCAGGTGTTGCAGGCTATAGAGCACATTC
+ATCGCGCAATGCTTGACGCCGTCCTCGTTTCCGGTAATGAGGCAACCACCGGCGCGGCCGTAGTAGGCGT
+ACTGTCCATCCTCGTTGAGCAGGCTCGAGCATGCGTACAGGCGCTCGATAACCCGTTTCATCACCGAGCT
+GTTGTCGCCCAGCCAGATCGGCCCGCACAGCACCAGGATGTGCGCATCGAGGACACGCCGATACAGGGCG
+GGCCATTCGTCGGTCGCCCAACCGTGTTCGGTCATGTCCGGCCATACGCCGGTCGCTATGTCATGGTCAA
+CTGCGCGCAGAGTGTCGACCTGGACGCCATGCTCACGCATGATCCCCGAGCTGCGCTCAATGAGCCCGTC
+GGTATGGCTGAGCTCTGGCGAGCGCTTCAGTGTCGCGTTGATGAACAGCGCACGCAGCCCGTCGAATCGG
+GGTGGGGCCGCGGCGTTCTGGTCAGAGGTTGTGGTCATACGTCATACCCACCTGCCTGTCATCGTCGTGC
+CGGGTTGCCGCTGGGCGGCGGTGCTGGTGCCAAGAAATGACCGATCAGGCAGCAGCGTACCGCCCTTCAC
+CGGTGATCAGGGGTAGGTCGAGGGTTGTCCGGATACCCGGTTCGGCGGCCACCACTGCAGGGATCGCGTT
+GACGATGCGCATCGCGGTGGCGACCAGTCCGGCGTGGTTGTGGTCCCCGTGGCGGCTGCTCAGGCAGATG
+TCCATGGCGTAGCAGGGCTCGCCGGAGATTTCGATGCGGTACGAGCCGCCCGGCTGGGCGGGCTGCGGCC
+ACTCGGGACATAGGTCCGCGCGCAACCGGGTCACGTGTTCCAGGACTACCGCTGGCACGCCGTCGACCAG
+GCCGAGCACCTCGAAGCGCAGGGCGGCGGCGCTGCCCTTAGGAATATGGCCCGATGCAATGTTGAAGGCC
+TCCGGCGCCGGCTCCCGGACATACATTTCCTCGACCCCGTCAAGTGAAATGCCAAGGCCCGCAGCAAGTT
+GTCGGACCACTGATCCCCAGGCCAGGCTGAGCACACCTGGCTGCAGCAGCATCGGGATCTGGTCCATCGG
+CTTACCGAAGCCCATCACGTCGAACATGACTACGGCGCTGTCATAGGTGGCGTAGTCGACGATCTCCATG
+CAGCGTATCTGCTCGATGCTTTCACAGGTGCCGGCCAACGCCATCGGCAACAGGTCGTTGGCGAAACCCG
+GATCGATGCCGTTCACGTACAGACTTGAATTTCCTGCGCGCGCAGCGTCTTGCAAAGGCTTGATGATCTC
+GTCGGGGATCACCTGCCACGGATATTGCAAGAACACCGGGCCGCTGCCGACGATATTGATCCCTGCCGCC
+AAGATTCGGCGGTAGTCTTCCAGCGCCTCGGGCAGCCGATTGTCGGCCATCGCGTTGTAGACGGCGCACC
+GCGGCCCGGTGGCGAGCACGGCGTTCAGATCGGTGCTGGCCCGCACACCCGTCGAATCCGCCAGCCCGGC
+AAGCTCTGCCGCATCCTTGCCGGCTTTGGCGTCCGATGACACCCAGACACCGGTGAGCTCGAACTCCGGG
+TCGGCGATGAGCGCACGCAACGAGTGCACGCCAACGTTGCCGGTGCCCAATTGAACGACGGGTATGGCCA
+TGGCGGGCTCCTTAGCGGTAGGGGTCAGACTGCGACTGCTCGCGCATCATCGGTTCACAGGTCCGGAATG
+GGAAGGTCGAGATTGGGGAAGGTGAGTCCGCCGTCGACCTCCAACGTCTTGCCGGTCAGGAAGCTGCCCG
+CCGGAGAGGCCAAATACACTGCCGCAGCTGCAATGTCGACGGGGTCACCGAGCCGGCGCAGTGGTGTCGC
+CTGCTCCATCGGCGCACGCAGCTCGTCGTTGGCGGCTACCACCTCCAGCGCCGAGGTCAGGATGGAACCC
+GGCGCGATCGCATTGACCCGGACGCGTGGGCACAGGTCCAGCGCCGCCAGCCGGGTGTAGTGGGCCAGTG
+CGGCCTTGGCGGTGCCGTAGGCGGCGAAACCCCGCGCCGCCAGCCGGCCCATGGTGGAGCTGATGTTGAT
+CACGCTGCCGCCGCCGGAGTGTTCCAGCATCAGCGGCACCGCCGCGACGGTCAGCGCGTGGGCGGTGCCC
+ACGTTGAAGGCGAAGGCGTCCGCGAGGTCCTTGGTCGAGGTGCTTAGCAGCGTGTTGGGCATGGTGCCGC
+CAACGTTGTTGACGACGATGTCGAGCTTCCCGAAAGCTCCGACGGCCTGACCAGCCAGCTGCGCGGTCAC
+CTCGGGATGGGCCAGATCGGCGGCAACGGTGTGGGCGCGGCGGCCGGCAGCGCGGATCTGTTCGGCGACA
+GCGTCAAGCTCGGATGATGTTCGTGAAGCGATGAGGACATCCGCGCCGGCCTGGGCGAAAGCCAATGCGA
+TGGCTGCTCCCAGGCCGCGGCCGCCGCCGGTGATGACGGCAACCTTGTCGTCAAGACGGAACATATCCAG
+GATCATGGCGCCCTCTTTTCCGGCTGTCGGCCGAAACGGTAACAAGCTTGCTGCAGCTTCCTGTGACTGC
+TCCCGAAACCTGGGGGTGTGCCTGCTGTGTATGCACGGCATACGGACATCCTTCCCCTGAGACCCGCGGT
+CGAACCAGCCACGTGTCCATCATCAGGGGTCAACCCCGGCCAAGGGCGACGGCACGCCAAGTTCGCCGAC
+CGTTAACCTAGTGCTGTTAGCTTCATTTGCTGCGAGCAAAACAGCTGGTCGGCCGTTAGGAACTGAATTG
+AAACTCAACCGATTTGGTGCCGCCGTAGGTGTCCTGGCTGCGGGTGCGCTGGTGTTGTCCGCGTGTGGTA
+ACGACGACAATGTGACCGGGGGAGGTGCAACCACTGGCCAGGCGTCGGCGAAGGTCGATTGCGGGGGGAA
+GAAGACACTCAAAGCCAGTGGGTCGACGGCGCAGGCCAACGCGATGACCCGCTTTGTCAACGTGTTCGAG
+CAGGCCTGCCCCGGCCAAACCCTGAACTACACGGCCAATGGTTCGGGCGCTGGAATCAGCGAATTTAATG
+GCAACCAAACCGATTTCGGTGGCTCAGATGTACCCCTGAGCAAGGACGAGGCCGCAGCGGCGCAGCGGCG
+TTGCGGCTCGCCGGCGTGGAATCTGCCGGTGGTGTTCGGCCCGATCGCGGTTACCTACAACCTCAACAGC
+GTTTCCTCGCTAAATTTGGACGGCCCCACGTTGGCGAAGATCTTCAACGGCTCCATTACGCAGTGGAACA
+ATCCCGCGATCCAGGCGCTGAACCGCGACTTCACGCTGCCAGGTGAGCGGATTCACGTGGTGTTCCGCAG
+CGATGAGTCGGGGACCACGGACAACTTCCAGAGGTACCTGCAGGCCGCGTCCAACGGTGCGTGGGGTAAG
+GGCGCTGGAAAGTCGTTCCAAGGCGGCGTCGGTGAGGGCGCGCGGGGTAACGATGGCACGTCAGCGGCCG
+CGAAGAACACCCCGGGGTCGATCACCTACAACGAGTGGTCGTTCGCCCAGGCGCAGCACCTGACCATGGC
+CAACATCGTCACTTCGGCTGGTGGGGACCCGGTGGCGATTACTATCGACTCGGTCGGCCAGACGATCGCC
+GGGGCCACCATCTCCGGGGTGGGCAACGACCTGGTGCTCGACACGGACTCGTTCTACCGGCCGAAGCGTC
+CCGGCTCCTATCCGATCGTGTTAGCGACATACGAAATCGTTTGCTCGAAGTATCCCGACTCGCAGGTTGG
+CACGGCTGTGAAGGCGTTCCTGCAGAGCACTATCGGCGCCGGTCAAAGCGGCCTGGGGGACAACGGATAC
+ATCCCAATTCCGGACGAGTTCAAATCGAGGCTGTCGACTGCGGTCAACGCGATCGCCTGATCTGAGGTTG
+ACGTGGTCACCGAGCCGCTCACAAAGCCGGCGCTAGTGGCGGTCGACATGCGCCCCGCGCGGCGCGGCGA
+GCGGCTGTTCAAGCTGGCCGCGTCGGCCGCCGGTTCGACGATCGTCATCGCAATCCTGCTGATCGCGATA
+TTCCTGTTGGTCCGCGCCGTGCCGTCGTTGCGGGCGAATCACGCCAATTTCTTCACCAGTACCCAATTCG
+ACACGTCGGACGATGAGCAGCTGGCGTTTGGTGTCCGGGACTTGTTCATGGTCACGGCGTTGAGTTCGAT
+AACGGCTCTGGTGTTGGCGGTGCCGGTGGCTGTCGGGATCGCGGTGTTCCTCACCCACTACGCGCCGAGG
+AGACTGTCGCGTCCATTCGGCGCGATGGTGGATCTACTGGCCGCAGTGCCGTCGATCATCTTCGGGTTGT
+GGGGGATCTTTGTGCTGGCGCCCAAGCTCGAGCCGATCGCGAGGTTTCTCAATCGCAACTTGGGCTGGTT
+GTTCCTGTTTAAGCAGGGCAACGTGTCGTTGGCCGGCGGCGGCACGATTTTCACCGCGGGCATCGTGCTG
+TCGGTGATGATCCTGCCTATCGTCACATCGATATCACGCGAAGTGTTCCGGCAGACTCCGCTGATCCAAA
+TCGAAGCAGCGCTGGCGCTAGGCGCGACGAAATGGGAGGTAGTGCGGATGACCGTGCTGCCATACGGGCG
+AAGCGGGGTGGTCGCGGCCTCCATGCTGGGTTTGGGGCGGGCTCTGGGCGAAACCGTGGCCGTGCTGGTC
+ATCCTGCGCTCGGCCGCGCGGCCGGGGACCTGGTCGCTGTTCGACGGCGGTTATACGTTCGCTTCCAAGA
+TCGCCTCCGCTGCTTCAGAATTCAGCGAACCGCTGCCGACCGGAGCCTATATTTCGGCGGGATTTGCGTT
+ATTCGTGCTGACGTTCCTGGTCAATGCGGCCGCTCGCGCAATCGCCGGCGGGAAGGTCAACGGGTGAGTC
+CCTCAACGAGCATCGAGGCGCTCGACCAGCCGGTAAAGCCGGTGGTGTTTCGTCCGCTTACGCTGCGACG
+GCGGATCAAAAACAGCGTCGCGACAACGTTTTTCTTCACCTCGTTCGTGGTCGCGTTGATACCGTTGGTC
+TGGCTGCTTTGGGTGGTGATTGCCCGGGGTTGGTTTGCCGTCACCCGATCGGGCTGGTGGACCCACTCGC
+TGCGCGGCGTGCTGCCAGAGCAATTCGCCGGTGGGGTGTATCACGCCCTGTACGGCACGCTGGTGCAGGC
+CGGGGTGGCCGCCGTGCTGGCCGTGCCGCTGGGCTTGATGACCGCGGTTTACCTAGTGGAATACGGGACT
+GGTCGAATGTCGCGGGTGACTACCTTCACCGTCGACGTGCTTGCCGGCGTGCCCTCTATCGTGGCGGCGT
+TATTCGTCTTCAGCCTGTGGATCGCCACCCTAGGATTTCAGCAGAGCGCCTTTGCCGTGGCGTTGGCGTT
+GGTCCTGCTGATGTTGCCGGTGGTGGTTCGGGCAGGCGAGGAGATGCTCAGGTTGGTGCCCGATGAACTG
+CGAGAAGCCAGCTACGCGTTAGGCGTTCCGAAATGGAAGACGATCGTGCGGATCGTCGCCCCGATCGCGA
+TGCCGGGCATCGTGTCAGGCATCTTGTTGTCCATCGCGCGCGTCGTCGGTGAAACCGCACCGGTTCTGGT
+GCTGGTCGGGTACAGCCACTCCATCAACCTCGACGTCTTCCACGGCAACATGGCCTCGCTGCCGTTGCTG
+ATCTACACCGAACTCACCAATCCCGAGCACGCCGGCTTCCTGCGCGTCTGGGGCGCGGCGCTGACCCTGA
+TCATCGTGGTCGCCACGATCAACCTGGCCGCGGCGATGATCCGGTTCGTCGCAACCCGACGGCGGTGACT
+CCCGTTATGACGTGAGTTTCACCACTCGGTCGTTGCCGCGGTCGGCGACGTAGACGGTCCGGTCGCTGTC
+CACTGCCACCGCGAGGGGGGTGTTGAGGCCGGTGAACGGTAGCACTGTCGAGGTGGTCGACCCGGCCAGG
+AGTTTGACCACCTGGTTTGTGTTGTGCTCGGTGACGTAGACGGTTCCGGCTTCGTCCACCGCGATGCCCC
+ACGGTGCGGTGATATCCGTGAATGGCAGCACGACCTGGTTATTCGACTCGGCCTCTAGCTTGACAACCCT
+GTTGTTGTCGGTGTCGGTGACATAGACGTTGCCGGAGTTGTCGACGGCCACCCCGTCGGGGTCGTTGAGG
+CCGGTGAACGGCAGCACGGTCTGGGTCTTGGATCCGGCCGCCAACTTCACCACCCTGTTGTTGCCCCGGT
+CGGCGACGTATACCGCACCCTGGGTATCCACCGCGAGACCTTCGGGGTAGTTGAGGCCGTCGAACGGTAG
+CACGGTCTGGTTGTTGGACCCGGCCGCTAACGTCACCACCCGGTTGTTGAAATCGGTGACGTATACGGTG
+CCAGCGCCGTCCACCGCCAACCCCTGCGGCTGGTACAGCCCGTTGAACGGTAACACCGTCGTGCCGGTTG
+ACCCGGTGGCCAACTTGACCACTCGGCCGTACATGCCCTCACTGGTGACGTACACGTTGCCGGCGCTGTC
+CACTGCCACCCCACTCGGCGAGAGGCGGAAGTCGATGCCGGTGAACGGCAACACGGTCTGTCCGGATGCC
+TGCGTCGGCGACCACGAAGGTCGTAAGACCAGGTAGCCGGCGGCGGCGACGATGGCCACCAGTACGATCG
+CGGCAGCGCCGACGACGGCCCACACCTTCCGTTTGTTGCCGGCCGGCGGCACAGCGTGTCCCAGGGAGGC
+CTGGAGCGCATTCGGGACGGCAGGGGAGTGTCCGGTTTGGCTGGGCCAGTTCCCGCCGCGGCTGTCCGCT
+GCCAGGGGTCCGGCCACGGTCGCGGAGTCCCCGGGCGACCATCGGGCAGCACCCGGGGTCGGTGGGCCGG
+TGCCCGCCCCGGCAATGCCGGACTCGGACTGGCTCAAGCCCGTATCGGCCGGAGTGGCCAGCAAGGTTGC
+GTTGTCACCGCGCCGCAGAATCGTCGTGGCCTGGTGTTGCTCGGATGTGGTTGAGTGCGTCATGGGCGGC
+GATGGCCAGATCACCAGCGCTCATAAAGCGCTCCGCGGGGTTTTTGGCCATGCCTTTGGCGATCACCTGA
+TCCAGGGCCGGCGGCACGCGCCCGGGCCGTAGCTGGCTGGGCTGCGGGGCAGGGTCCATTAGATGCGCGG
+CGATCAACCGCTCAACGCTGTCGGCCCGATACGGTGGGGCACCGGTCAAACACTCACCCAACACGCACGC
+CAACGCATAGATATCTGCGCGATAGGTGACCTCATCGCCGGTGAACCGCTCCGGGGCCATGTAGTTGTAG
+GTTCCCACGGCGGTCCCGGTCTGGGTCAGCCCCGGGTCGGAGGCGGCACGGGCAATACCGAAATCGACCA
+GATAGGCGAAGTCGCTCGCGGTGACCAGAATGTTTTCCGGTTTTACGTCGCGGTGCGTTACGCCGTTGGC
+ATGCGCGGCATCCAAAGCGGCGGCGATCTGGCGCACGATGGCCACAGCTCGGGCCGGGGTCAGCGGACCA
+TACTGTTTCAATAGGGCGCGTAAAGAGGTGCCGTCGATCATGCGCATTTCGACAAAGAACTGTCCGTTGA
+TCTCGCCGTAGTCATGGATCGGCACGATGTGTGGCTCGGTCAGCCGTCCCGCGGTGTCGGCCTCGCGTTG
+CATCCGTGCTCGAAACACCGCATTGTCGGAGTACTGCGGCGAGATCAACTTCAGCGCCACCACCCGGTGC
+TTGCGGGTGTCCTCGGCCTCATAAACCTCGCCCATCCCGCCTCGGCCCAGCAGCCGCAATAGCTGATACG
+GCCCAAATTGCGACCCTACCTGCGGAACGGCATCGCTCACCGTCGAATTCCCTTCACTAGGTCAAGAAAT
+AGCATTCACCGCGGCCGCCAATTTTGCTTGGAACGATTTGGGCAACGGAATGGAGCCGTATTGGTCCAGG
+CCTTCTTGGCCTGGACCAATCGCGGCTTGCATAAACGCCCTTACCGCAGTACCGGTCGTCGCATCCGGGT
+ATTTCGAGCAGACGATCTCATAGGTCGCCAGCACGATCGGGTAAGAGCCAGGCTGGGTGGGCCTGTAGAA
+CGACGACGTGTCCAATACCAGGTCGTTGCCTTGTCCCATGATCTTGGCCCCGGCGATTGTCTTGCCGACC
+GACTCGGTGGTGATCGCCACTGGATCCGGACCCGCCGACGTGATGATCTGGGCCATGTTCAACTGCTTAC
+CCACCGCAAACGACCACTCGTTGTAGGTGATCGACCCGTCGGTCGTCTGCAGTAGGGCCGACGTGCCGTT
+GTTCCCGCTGGCGCCGACGCCGACGCCCCCGTTGAACGTTTCGCTGGCGCCTTTGCCCCACGCCCCGTTG
+GATGCGCCGTCGAGGTATTTCTGGAAGTTGTCCGACGTACCGGACTTGTCGCTGCGGAAGATAACGCTAA
+TCGGTGTTGGCGGCAGGTCGGTGCCGGAGTTGAGGGCTTGGATCTGTGGATCATTCCACACGGTGATGGT
+GCCGTTGAAAATCTTGGCGGTAGTGGGTCCGTCAAGATTCAGCGTGCTCACGCCCTTGATATTGTAGGTG
+ATCGCGATCGGGCCGAACACCGTCGGCAGGTCCCATGCCGGGGAACCGCACCGCTCCGCCGCCCGGTCAG
+GTTGACCGGTCGACGGATTCAACGGGACATCCGAGCCGGCGAAATCGGTTTCGTTGTTGAGAAACTGGGT
+CACCCCGGCACCGGACCCGTTGGCGTTGTAGTCCAACGTGTAGCCCGGGCACGATCGCACGTAGGCATAG
+ACGAACTGCTCCATGGCATTTTCTTGTGCGGTCGAGCCGCTGGAGTGGAGCTCCTTCTTGCCGCCGCAGT
+GCACCGACCCAGACGTGCCGCCTGCGCCTGACGACGAGCTGTTGGTGCCACCGCCGCATGCTGTCAACAC
+CAGTGTGCCGGCGGCCAACAGGCTTACCGCTGCGCCGGATCGGGCGAACTTCACGCAACTCCTCTCGAGG
+GGGTCGTGGTGGCGGATCCACTCGCCACCGGTGGTCGCCGAGCCACCGACCCGGGGTCGGTATTCGAGCC
+GTCACCGTTGTGCATCGAAAGAGGTCTGATCATTGAAATCCTAGCGTTCAGGAGGGGCCGCTGATACTGA
+GGGTCGACGGCGCGCTTTGTCCAAGGAGCATCCCAAGGAGCATGTAGTACCCTGCGCCGATGGCGTGTGA
+ACGGCTCGGCGGCCAGAGCGGTGCTGCTGATGTCGACGCCGCTGCGCCGGCGATGGCGGCGGTGAACCTC
+ACCCTGGGTTTCGCTGGCAAAACCGTGCTCGACCAGGTGAGTATGGGCTTTCCCGCTCGTGCGGTGACGT
+CGTTGATGGGACCGACCGGTTCAGGTAAGACGACTTTTTTTGCGCACCCTAAACCGGATGAATGACAAGG
+TCTCCGGTTACCGCTACAGCGGTGATGTGCTGTTGGGCGGACGCAGCATCTTCAACTACCGCGACGTGCT
+GGAGTTTCGCCGCCGGGTTGGCATGCTGTTCCAGCGCCCGAATCCGTTCCCGATGTCAATCATGGACAAC
+GTGCTCGCCGGCGTGCGTGCCCACAAACTGGTGCCGCGCAAGGAATTCCGTGGCGTCGCGCAGGCTCGGC
+TTACCGAGGTCGGCCTCTGGGACGCGGTCAAGGATCGGCTCAGCGATTCACCGTTTCGACTCTCTGGTGG
+TCAGCAGCAGTTGTTGTGCCTAGCCCGTACGCTTGCGGTGAATCCGGAGGTGTTGCTGCTCGACGAGCCC
+ACCTCCGCGCTGGACCCGACTACCACCGAGAAGATCGAAGAGTTCATCCGATCGCTCGCTGATCGCCTCA
+CGGTGATCATCGTGACCCATAACCTTGCCCAGGCCGCCCGCATCAGCGACCGGGCGGCCCTGTTCTTCGA
+CGGCAGGCTGGTGGAGGAAGGGCCCACCGAACAGCTGTTCTCCTCGCCGAAGCATGCGGAAACCGCCCGA
+TACGTCGCCGGACTGTCGGGGGACGTCAAGGACGCCAAGCGCGGAAATTGAAGAGCACAGAAAGGTATGG
+CGTGAAAATTCGTTTGCATACGCTGTTGGCCGTGTTGACCGCTGCGCCGCTGCTGCTAGCAGCGGCGGGC
+TGTGGCTCGAAACCACCGAGCGGTTCGCCTGAAACGGGCGCCGGCGCCGGTACTGTCGCGACTACCCCCG
+CGTCGTCGCCGGTGACGTTGGCGGAGACCGGTAGCACGCTGCTCTACCCGCTGTTCAACCTGTGGGGTCC
+GGCCTTTCACGAGAGGTATCCGAACGTCACGATCACCGCTCAGGGCACCGGTTCTGGTGCCGGGATCGCG
+CAGGCCGCCGCCGGGACGGTCAACATTGGGGCCTCCGACGCCTATCTGTCGGAAGGTGATATGGCCGCGC
+ACAAGGGGCTGATGAACATCGCGCTAGCCATCTCCGCTCAGCAGGTCAACTACAACCTGCCCGGAGTGAG
+CGAGCACCTCAAGCTGAACGGAAAAGTCCTGGCGGCCATGTACCAGGGCACCATCAAAACCTGGGACGAC
+CCGCAGATCGCTGCGCTCAACCCCGGCGTGAACCTGCCCGGCACCGCGGTAGTTCCGCTGCACCGCTCCG
+ACGGGTCCGGTGACACCTTCTTGTTCACCCAGTACCTGTCCAAGCAAGATCCCGAGGGCTGGGGCAAGTC
+GCCCGGCTTCGGCACCACCGTCGACTTCCCGGCGGTGCCGGGTGCGCTGGGTGAGAACGGCAACGGCGGC
+ATGGTGACCGGTTGCGCCGAGACACCGGGCTGCGTGGCCTATATCGGCATCAGCTTCCTCGACCAGGCCA
+GTCAACGGGGACTCGGCGAGGCCCAACTAGGCAATAGCTCTGGCAATTTCTTGTTGCCCGACGCGCAAAG
+CATTCAGGCCGCGGCGGCTGGCTTCGCATCGAAAACCCCGGCGAACCAGGCGATTTCGATGATCGACGGG
+CCCGCCCCGGACGGCTACCCGATCATCAACTACGAGTACGCCATCGTCAACAACCGGCAAAAGGACGCCG
+CCACCGCGCAGACCTTGCAGGCATTTCTGCACTGGGCGATCACCGACGGCAACAAGGCCTCGTTCCTCGA
+CCAGGCTCATTTCCAGCCGCTGCCGCCCGCGGTGGTGAAGTTGTCTGACGCGTTGATCGCGACGATTTCC
+AGCTAGCCTCGTTGACCACCACGCGACAGCAACCTCCGTCGGGCCATCGGGCTGCTTTGCGGAGCATGCT
+GGCCCGTGCCGGTGAAGTCGGCCGCGCTGGCCCGGCCATCCGGTGGTTGGGTGGGATAGGTGCGGTGATC
+CCGCTGCTTGCGCTGGTCTTGGTGCTGGTGGTGCTGGTCATCGAGGCGATGGGTGCGATCAGGCTCAACG
+GGTTGCATTTCTTCACCGCCACCGAATGGAATCCAGGCAACACCTACGGCGAAACCGTTGTCACCGACGG
+CGTCGCCCATCCGGTCGGCGCCTACTACGGGGCGTTGCCGCTGATCGTCGGGACGCTGGCGACCTCGGCA
+ATCGCCCTGATCATCGCGGTGCCGGTCTCTGTAGGAGCGGCGCTGGTGATCGTGGAACGGCTGCCGAAAC
+GGTTGGCCGAGGCTGTGGGAATAGTCCTGGAATTGCTCGCCGGAATCCCCAGCGTGGTCGTCGGTTTGTG
+GGGGGCAATGACGTTCGGGCCGTTCATCGCTCATCACATCGCTCCGGTGATCGCTCACAACGCTCCCGAT
+GTGCCGGTGCTGAACTACTTGCGCGGCGACCCGGGCAACGGGGAGGGCATGTTGGTGTCCGGTCTGGTGT
+TGGCGGTGATGGTCGTTCCCATTATCGCCACCACCACTCATGACCTGTTCCGGCAGGTGCCGGTGTTGCC
+CCGGGAGGGCGCGATCGCGCTGGGGATGTCGAATTGGGAGTGTGTCCGCAGGGTCACCCTGCCGTGGGTG
+TCCAGCGGCATCGTCGGTGCGGTGGTGCTAGGGCTTGGCCGTGCGCTGGGGGAGACGATGGCGGTAGCCA
+TGGTGTCCGGCGCGGTGCTGGGGGCCATGCCCGCCAACATCTACGCGACCATGACCACCATCGCCGCCAC
+CATCGTGTCGCAGCTGGATTCGGCGATGACCGATTCCACCAACTTCGCGGTGAAGACGCTCGCCGAGGTG
+GGTTTGGTGCTGATGGTGATCACGTTGCTGACTAATGTGGCCGCGCGCGGGATGGTTCGTCGGGTGTCAC
+GCACCGCGCTTCCGGTGGGACGCGGCATCTGACATGGGCGAATCGGCTGAGTCCGGGTCCCGGCAGCTAC
+CGGCGATGTCCCCGCCGCGGCGATCGGTAGCCTATCGGCGCAAGATCGTCGATGCCCTGTGGTGGGCGGC
+GTGCGTGTGTTGTCTGGCGGTGGTGATCACCCCGACGTTGTGGATGTTGATCGGAGTCGTCAGCCGCGCT
+GTACCGGTTTTCCACTGGAGTGTGCTGGTGCAGGACTCCCAGGGCAATGGCGGCGGCTTGCGCAACGCCA
+TCATCGGTACCGCAGTGTTGGCCATCGGGGTGATCCTGGTGGGTGGCACGGTGAGTGTGTTGACCGGGAT
+TTATCTGTCCGAATTCGCCACCGGCAAAACACGGTCCATTCTGCGCGGCGCCTACGAGGTGTTGTCCGGT
+ATTCCGTCGATCGTGCTCGGCTACGTCGGCTATTTGGCCCTGGTGGTGTACTTCGATTGGGGGTTTTCGC
+TGGCGGCCGGGGTGTTGGTGCTGTCGGTGATGAGCATTCCCTACATCGCCAAGGCCACCGAGTCCGCGCT
+GGCCCAGGTGCCGACGTCGTATCGGGAAGCGGCTGAGGCACTCGGGTTACCAGCCGGCTGGGCGCTGCGC
+AAGATCGTGCTGAAGACGGCGATGCCCGGAATCGTCACCGGGATGTTGGTCGCGCTGGCCCTGGCGATCG
+GCGAGACGGCGCCGCTGCTGTACACGGCGGGGTGGTCGAATTCGCCGCCGACCGGACAACTCACCGACTC
+GCCGGTCGGCTACCTGACCTACCCAATTTGGACGTTCTACAACCAGCCATCCAAGTCGGCTCAGGATCTG
+TCCTATGACGCGGCTCTCTTGCTGATCGTGTTCCTGCTGCTATTGATCTTCATTGGCCGGTTGATCAACT
+GGCTGTCACGGAGGCGTTGGGACGTTTGAGTTGGCCTTCGAGCGCGCCTTCACGCTGGCCTCCAGCTTGG
+CGAGCAGGTCGGAGACGTCTTCGGGCTCGTCCAGCAACCTCGGTTGGTCCTCGGCGGTAAATGCCTGCCC
+ACCTTCGAGTTTGGTGTCGATCAGCTCCTGTAACTGCTCCTGGTAGGTGTCGTGGTAGCGGTCCGGATTG
+AAGTCGTCGGCCATCGAGTCCACCACCTGGCCGGCCATCTTGAGTTCCGCGGGTTTGATCTCCACCTTCT
+GGTCCAGCACCGGGAAGTCGGGGTCGCGGATCTCATCGGGCCACAGCAACGTGTGCACCATCATCACCTC
+TCGCTTGCCGAAATCCTTGACGCGCAACGCCGCCAGCCTGGTCTTGTTGCGCAGCGTGAAATGCACGATC
+GCCATCCGGTCGGTCTCGGCGAGTGTCTTAGCCAGCAGCACATACGATTTCGACGACTTCGAATCAGGCT
+CCAAAAAGTAGCTGCGGTCGAACATCATCGGGTCCACGTCGGCGGCGGGGACGAACTCCAACACCTCGAT
+CTCCCGGCTGCGTTCTTCAGGCAAGCTGGCGATGTCGTCGTCGGTGATCGCCACCATTTGGCCGTCGCCG
+GACTCGTAGGCCCGGGCAAGATCGCGGTAGTCGACCACCTCGCCACACGCCTCGCAGACGCGCTTGTACC
+GGATGCGTCCGTTGTCCTTGGCGTGCACCTGGTGGAACCTGATGTCGTGGTCTGCGGTAGCGCTGTACAC
+CTTGACCGGCACGTTCACCAGCCCGAAGGCGATCGAACCCGTCCAAATGGCTCGCATGTAAGTGAGTATG
+CCTTGATTGTCCGCGAGCGGAACGTCACGGCGAAATTCCACGCGATATTTGACCGTGACGTTACGCTCGC
+GACTTGTGTGACCGACAGGCTACGTTGAAAGCATGGGTTCGGCGTCGGAGCAACGGGTGACGCTGACCAA
+CGCCGACAAGGTGCTCTATCCCGCCACCGGGACCACAAAGTCCGATATCTTCGACTACTACGCCGGTGTT
+GCCGAAGTCATGCTCGGCCACATCGCGGGACGGCCGGCGACGCGCAAGCGCTGGCCTAACGGCGTCGACC
+AACCCGCGTTCTTCGAAAAGCAGTTGGCGTTGTCGGCGCCGCCTTGGCTGTCACGTGCAACGGTGGCGCA
+CCGGTCCGGGACGACGACCTATCCGATCATCGATAGCGCAACCGGGCTGGCCTGGATCGCCCAACAGGCG
+GCGCTGGAGGTGCACGTGCCGCAGTGGCGGTTTGTCGCCGAGCCCGGATCAGGTGAGTTAAATCCGGGCC
+CGGCAACGCGTTTGGTGTTCGACCTGGACCCGGGCGAAGGCGTGATGATGGCCCAGCTGGCCGAGGTGGC
+GCGCGCGGTTCGTGATCTTCTCGCCGATATCGGGTTGGTCACCTTCCCGGTCACCAGCGGCAGCAAGGGA
+TTGCATCTGTACACACCGCTGGATGAGCCGGTGAGCAGCAGGGGAGCCACGGTGTTGGCCAAGCGCGTCG
+CGCAGCGATTGGAGCAGGCGATGCCCGCGTTGGTCACCTCGACCATGACCAAAAGCCTGCGGGCCGGGAA
+GGTGTTTGTGGACTGGAGCCAGAACAGCGGCTCGAAGACCACCATCGCGCCGTACTCACTACGTGGCCGG
+ACGCATCCGACCGTCGCGGCGCCACGCACCTGGGCGGAGCTCGACGACCCCGCACTGCGTCAGCTCTCCT
+ACGACGAGGTGCTGACCCGGATTGCCCGCGACGGCGATCTGCTCGAGCGGCTGGATGCCGACGCTCCGGT
+AGCGGACCGGTTGACCCGATACCGCCGCATGCGCGACGCATCGAAAACTCCCGAGCCGATTCCCACGGCG
+AAACCCGTTACCGGAGACGGCAATACGTTCGTCATCCAGGAGCATCACGCGCGTCGGCCGCACTACGATT
+TCCGGCTGGAACGCGACGGCGTGCTGGTCTCGTGGGCGGTACCGAAAAACCTGCCCGACAACACATCGGT
+TAACCATCTAGCGATACACACCGAGGACCACCCGCTGGAATACGCCACGTTCGAGGGCGCGATTCCCAGC
+GGGGAGTACGGCGCCGGCAAGGTGATCATCTGGGACTCCGGCACTTACGACACCGAGAAGTTCCACGATG
+ACCCGCACACGGGGGAGGTCATCGTGAATCTGCACGGCGGCCGGATCTCTGGGCGTTATGCGCTGATTCG
+GACCAACGGCGATCGGTGGCTGGCGCACCGCCTAAAGAATCAGAAAGACCAGAAGGTGTTCGAGTTCGAC
+AATCTGGCCCCAATGCTTGCCACGCACGGCACGGTGGCCGGTCTAAAGGCCAGCCAGTGGGCGTTCGAAG
+GCAAGTGGGACGGCTACCGGTTGCTGGTTGAGGCTGACCACGGCGCCGTGCGGCTGCGGTCCCGCAGCGG
+GCGCGATGTCACCGCCGAGTATCCGCAATTGCGGGCATTGGCGGAGGATCTCGCCGATCACCACGTGGTG
+CTGGACGGCGAGGCCGTCGTACTTGACTCCTCTGGTGTGCCCAGCTTCAGCCAGATGCAGAATCGGGGCC
+GCGACACCCGTGTCGAGTTCTGGGCGTTCGACCTGCTCTACCTTGACGGCCGCGCGCTGCTAGGCACCCG
+CTACCAAGACCGGCGTAAGCTGCTCGAAACCCTAGCTAACGCAACCAGTCTCACCGTTCCCGAGCTGCTG
+CCCGGTGACGGCGCCCAAGCGTTTGCGTGCTCGCGCAAGCACGGCTGGGAGGGCGTGATCGCCAAGAGGC
+GTGACTCGCGCTATCAGCCGGGCCGGCGCTGCGCGTCGTGGGTCAAGGACAAGCACTGGAACACCCAGGA
+AGTCGTCATTGGTGGCTGGCGCGCCGGGGAAGGCGGGCGCAGCAGTGGCGTCGGGTCGCTGCTCATGGGC
+ATCCCCGGTCCAGGTGGGCTGCAGTTCGCCGGGCGGGTCGGTACCGGCCTCAGCGAACGCGAACTGGCCA
+ACCTCAAGGAGATGCTGGCGCCGCTGCATACCGACGAGTCCCCCTTCGACGTACCACTGCCCGCGCGTGA
+CGCCAAGGGCATCACATATGTCAAGCCGGCGCTGGTTGCAGAGGTGCGCTACAGCGAGTGGACTCCGGAG
+GGCCGGCTGCGTCAATCAAGCTGGCGTGGGCTGCGGCCGGACAAGAAACCCAGTGAGGTGGTGCGCGAAT
+GAAGTGGGTGACGTATCGAAGTGACCACGGCGAACGAACGGGAGTGCTTTCCGGTGACGCCATCTACGCG
+ATGCCGCCGGACGTGTCGTTGCTGGATCTGGTCGGGCGCGGCGCCGACGGTCTGCGCACGGCGGGCGAAC
+GGGCAGTGCGCTCACCGGCCGCGGTGGTAGCGCTCGACGAGGTTACGCTGGCGGCGCCGATTCCGCGCCC
+GCCGTCGATCCGGGACTCGTTGTGCTTTCTGGACCACATGCGTAACTGCCAGGAAGCGATGGGGGGCGGC
+CGGGTGCTCATGGATACTTGGTACCGCATCCCGGCGTTCTACTTCGCGTGCCCGTCAACGGTTTTGGGAC
+CGTACGACGACGCACCCACCGCACCCGGAAGTGCGTGGCAGGACTTCGAATTGGAGATCGCGGCGGTTAT
+CGGAACCAGCGGCAAAGACTTGACCGTCGAGCAGGCCGAACGGTCGATCATCGGCTATACCATTTTCAAC
+GACTGGTCCGCACGGGACCTGCAGATGCTGGAGGGCCAGCTGCGCATCGGACAGGCCAAGGGCAAAGACA
+GCGGTATCACCCTGGGCCCCTATCTGGTCACACCGGATGAGCTGGAGCCCTATTGCCGGGGCGGGAAGCT
+AAGCTTGCGGGTGATCGCCTTGGTCAACGGCACCGTGATCGGATCGGGGTCGACCGCACAGATGGACTGG
+AGCTTCGGCGAAGTCATCGCCTATGCCTCGCGGGGGGTGACGCTGACCCCGGGTGACGTGTTCGGCTCGG
+GCACGGTGCCCACCTGCACGCTCGTCGAGCACCTCAGGCCACCGGAATCATTCCCGGGCTGGCTGCACGA
+CGGCGACGTGGTCACCCTCCAGGTCGAAGGGCTGGGCGAGACGAGGCAGACCGTCCGGACGAGCGGCACT
+CCTTTTCCGTTGGCTCTTCGGCCGAATCCGGACGCCGAACCCGACCGGCGCGGGGTCAACCCGGCACCGA
+CGCGGGTGCCGTTTACCCGCGGGCTGCACGAAGTCGCCGACCGGGTATGGGCGTGGACGCTGCCCGACGG
+GGGATACGGCTTCAGCAACGCCGGGCTGGTCGCCGGGGACGGCGCGTCGCTGCTCGTGGATACCCTGTTC
+GACCTGGCACTGACACGCGAGATGTTGGCCGCGATGAAGCCGGTCACCGAGCGGGCGCCCATCACCGACG
+CCCTGATCACGCACTCCAACGGCGACCACACGCACGGCACTCAACTGTTGGACCGCTCAGTGCGCATCAT
+CGCCGCCAAGGGCACCTCCGAGGAGATCGAGCATGGCCCGGCACCGGAGATGCTAGCCCGGATCCAAACC
+GCCGACCTGGGCCCCGTTGCGACGCGGTATCTGCGTGATCGCTTCGGTCACTTTGACTTCAGCGGCATCA
+AGCTGCGCAACGCCGACCTGACGTTCGACCGCGACCTGGCCATCGAGCTCGGCGGCCGGCGAGTCGACCT
+GCTCAACCTCGGTCCCGCGCACACCACCGCCGACTCGGTCGTGCACGTGGCCGACGCCGGTGTGCTGTTC
+GCCGGGGATCTGCTGTTCATCGGTTGCACCCCGATTGTGTGGGCGGGCCCGATCGCCAACTGGGTGGCGG
+CCTGCGACGCGATGATCGCGCTGGACGCGCCCACGGTGGTGCCTGGGCATGGTCCGGTCACCGGCCCGGA
+CGGGATCCGTGCCGTCCGTGGCTATCTGGCGCACATCGCCGAACAGGCCGAGGCGGCCTACCGCAAGGGG
+CTATCGTTGCCCGAGGCCGTCGAGACCATCGACCTGGGCGAGTACGCGAGCTGGCTGGACTCCGAACGGG
+TAGTGGTCAACGTCTACCAGCGTTACCGCGAATTGGATCCCGACACCCCGCGCCAGGACTTGCTGGCGTT
+GCTGGTGATGCAGGCCGAATGGGCGGCGCGCCACTGTACGTAGCCACTCGGGCGCGTTTGTCACGGGAAT
+CTGCGGACCGGCGGGCGCATGGTTTGCCTGTCCACGAGCGACAAAGCCAGCGCGCCAAGGATTCCCGATG
+GCAGCCATCACTTTGTCGCGCTGAGGCGGGCACGAAGAACATCCCGTCCAGACAGCGGCCAATGTGGCGG
+GTGTGAAAGGCGCCGCCGAGCATGGCACCGGGTCCAACGGCTCTCACGAAGCTGATCGGGGATCGATCCG
+TTGTGATGCTTAAACTTTCGCGATGACGTTCTCGGCGAACATCTCCAGATTGCGGATCTTGGTCTGCAGC
+GGCTCGGTGTCGGGGCCCATGGTGTACGGGACACGGAAACCGACGATGACGTCCGTCACCCCTTTGTCCT
+CGAGCCGCTTGACGCCGTCCACGGTGAAACCGTCCAGGGAGATCACGTGGATTTCGAACGGGCTGGTTTT
+CCCCGCTTCCTCGCGAAGCCGCTTGACCCTGGCGATCAGCCGGTCGAGTTCGTCCGGATCGCCGCCGCCA
+TGCATCCATCCATCGGCGCGCGCCGCCCGTCGCAGTGCTGCATCGGCGTGGCCACCGACCAGGATCGGGA
+TCGGCTGGGTGGGCGCCGGGGTCATCTTGGTCTTGGGTATGTCGTAGAACTCGCCGTGGAACTCGAAGTA
+ATCGCCGGTGGTAAGGCCACGCACGATCTCGATGCATTCGTCAATCCGCTTGCCGCGCTTAGCGAACGGG
+ACGCCCATCAGCTCGTAATCCTCCGGCCACGGGCTAGTGCCGACACCCAGCCCGACCCGGTTGCCGATCA
+GGGCGGCTAGGGAACCGGCCTGCTTTGCCACCAGAGCCGGCGGGCGGATGGGCAGCTTGAGGACGAAGAA
+GTTGAACCGCAGCCTCGTCGTGACTGCGCCCAATGCTGCTGTCAGGACAAAGGTTTCGATGAAAGGCTTG
+CCGTCCATGAATTCGCGGTTGCCGTCGGGTGTGTACGGGTACTTCGAGTCGGATTCGAAGGGGTAGGCGA
+TGCTGTCGGGAATCGTCATGCTGCTGTATCCCGCCGCTTCGGCTGCCTTGGCCAGCGGGATGTAGAACGT
+GAAGTCGGTCATTGCCTCCGCGTAGCTGAACCGCACGTGATTGCCTTCCTCGAAGTGGCCGTCCCCAACG
+AGATTAGAACGTGTTCTAATTTGACGTGCAAGCGGGGCGCAACGGCTTGGTCAGAGTTGGTTCTCCGGCC
+CAATAATTGCCCAGACCGTCTTGCCCGACGAAGTGGGACTGCTGCCCCAGGCGCGGGACAACGCGGCAAC
+GATCGCCAGGCCGGAAACGTCGATGCCCTTCGGTGGGGACGCCAGCCGAACCGCCGGAGCGCTGCTGCCG
+TCGGAAACCGCGATGGTTGCCGTTGGGCCATCGCTTTCGATCCGCATCACCGGGTCGCTTCCGGTGTGTT
+TCAGCACGTTCTCCACGAATACGTTGACGACGACCAACGCGACTGGAATAAGCCCGGGACGTGACCATTG
+GGTGAGCCATTCGCGGACCAACTGGCGTGACTCGCGAAGGCTGTTCAGGTTGGCGGGCAGTTGTGCGTCC
+GAACGCTTGAAATTGCGGCGCGCGAGCCGACCGATGGCCTTGCTCGCCGCTTTTTCGGTCGGGTACACCG
+GCATGAAGCGGGCGACCCCGGTGCGGGTGACCGCCGCGCGGCCGGCCCGATGGCCGCAGACCAGCAAGAC
+CGGTACATCCGCTCGGAAGTCGGCCTGCCAGCGGGCGCTGATAAAGACCGACCATGCCGATTCCTCGGCG
+ACTTGCAGCTCGGTGACATTGACGATAACGGCGGACGGCTGCTCGAGCGTCGCCCTCGTGAGGCTGTCCC
+GGAGCAGTGCAGAACTGCTGGAGTCAAGCGCACCGTCGGCGGTCAAGATGACCACCGAATCCTGTGTACG
+TACCGCAATGGCCAGCGCTGTCGGTGACTTGGCTGCCGTGCTCACCGCGACCACTTCCTTGCGTCCCTTG
+CCCCGGCGTCAGGTGCACATCGCAACTTGGGTCGGAGTGCCACCATAGCCATGGTTCCGAAACGGCGGGA
+CGCCATGAACCGGCATTCCGGTCCCATCCTGTCGTCCGGTTTCATAGCCAGCTCCTCGAACTCCTGTCCC
+GCCAATAGCTTGAGGATGCCGTCCGCCTTGGCGGCAGAAACCCTATCTTTTGATGATCGCGCCGTCCGGC
+GCAGCACCCATCACCCAGGGGGTGGTTACCCACAAAAACACGCGATCAACCTCCAGTCCGGGCTATGCCC
+AGCCTATGCAAACGCCAGCAGGTAGGGCCCGGGAATCCGGCCAACAAAGATCAACGAACGCCGCGCCGGC
+GCCGGGATGCGTTCAAGTGGTGGCCGAGGCTGGGCCGCTTCGGGCATAGGGCGGTGGGCCCACTCCGGCG
+ACCGAGTGGGTACCCCACGGTGTTTGTTCAGTGATGCGTGCGGGTGCGCTACGTCCGCCGATGGTTAACG
+TCGCCGCCCGGGCATGGGTGAGTGAAGTCTCGGGCAAGGAATCGAATACGGTGCCCTGCCAGTGGTAGTT
+GCCGTCGATCGGATCGAGGTGACCGGTAAGCCGGACGCGGACCCGAAAGCGGGCACCAGCGAGCGTTAGC
+GTCGCCGCACCGTCGTAGGTCTGATCGTCCTCGGTCGCCGCGGATGACAAGTCGAACGCTTCGAGGCCCC
+CAGTCTGCCGATGGGGCTGAGCGGGTTTGAGTTGGGCGCGCTCGTTGAATACCTGCTGGCTGCTGCGGCG
+CACCTCGATGCGGCGGCTGGCCGTGCGCTCCATGAGCTTCATGCATTCGACGACGCAGCGTGCCTGCGCG
+GCGGTATCGGGCCCGGTGATGAAGAAGTAGTTGGGGAAACCGTGAACGGCGACGCCGAGGTAGGGCTCCA
+TGCCATCGTCCCAGGCTTGGCGGATGGTCACACCGCCGGCACCGACCAGGGTCTGATCGCCGACCTGATC
+GGCGATCGCGAACCCGGTGCCGTAGATGATGGCGTCGACGGGGTGTTCCACGCCATCGCTGGTGCGGATG
+CCCGAGGAGGTCAGCGCGTCGATCGCCGCCGTCGCCCAGGCGACCGCTGGATGCTCAGCCCCGGTGCGGC
+GACGTAGCCAGCGTTTGGCGCGTGTCGTCCACAGTGGTACTCCGGTGACGACGCGGCGCGGTGCCTGGGT
+GAAGACCGTGACCGACGCCGCCGATTCAGACAACCGGCTGATGTAGTGGGCGGCGGCGGCATCGGTGCCG
+ACCACCGCGATGCGTTTGCCGGCCGGGTCGAAATCGCGGTCCCATGCCGCCGAAGTGGGCCTGATGGGCC
+CGATCGCCCGTCGCGCCTGGAAACGCACCAACTTTCTGTGACCGCGACGCTCGGCCTCGCTGACGCCGGC
+CACCGCATTGTCATCGTCGGCAGGGGTGCTGGTGGCCGGGACGCCGCAGCCGCGCGCGCTCGGGCCCGAT
+GCGCTGGACGTCAGCACCGACGACCTGGCCGGGCTGTTGGCCGGCAACACCGGCCGGATCAAGACCGTCA
+TCACCGACCAGAAGGTAATTGCCGGCATCGGCAACGCCTATAGTGACGAAATCCTGCACGTCGCGAAGAT
+CTCGCCGTTCGCCACGGCCGGCAAGTTATCCGGCGCACAGCTCACCTGCCTGCATGAGGCGATGGCGTCG
+GTGCTGTCGGACGCGGTGCGCCGGTCCGTCGGCCAGGGCGCGGCCATGCTCAAAGGGGAGAAACGTTCTG
+GGCTTCGAGTACATGCGCGCACCGGGTTACCCTGCCCAGTGTGCGGTGACACTGTGCGGGAGGTGTCCTT
+CGCGGACAAGTCTTTTCAGTACTGTCCAACGTGTCAGACCGGTGGCAAGGCGCTGGCCGACCGGCGTATG
+TCGCGGCTGCTCAAGTAGTCGATATGCTCACCGGAGTGACTCGCCAGAAGATCCTGATCACCGGCGCCAG
+TTCCGGCCTGGGCGCCGGGATGGCCCGATCCTTCGCCGCCCAGGGCCGCGACCTGGCGCTCTGCGCCCGC
+CGCACGGATCGGCTGACCGAACTGAAAGCCGAACTGTCGCAACGGTATCCCGACATCAAGATCGCTGTCG
+CGGAGCTGGACGTCAACGACCACGAGCGGGTGCCCAAGGTATTCGCCGAACTCAGCGATGAGATTGGCGG
+CATTGACCGTGTGATCGTCAACGCCGGAATCGGCAAGGGTGCCCGGCTGGGCTCGGGCAAGCTGTGGGCG
+AACAAGGCAACCATCGAAACCAACCTGGTCGCCGCACTCGTGCAGATCGAAACGGCACTGGACATGTTCA
+ACCAGCGCGGTTCGGGGCATTTGGTGCTCATCTCCTCAGTGCTCGGCGTCAAAGGGGTGCCGGGCGTCAA
+AGCCGCGTATGCGGCAAGCAAAGCCGGTGTGCGCTCGCTAGGCGAATCGCTGCGCGCCGAGTACGCCCAA
+GGCCCCATCAGGGTCACGGTGCTGGAGCCGGGTTATATCGAGTCGGAGATGACGGCCAAATCGGCGAGCA
+CAATGTTGATGGTGGACAACGCAACTGGCGTCAAGGCGCTGGTGGCCGCCATCGAGCGCGAGCCCGGACG
+CGCCGCGGTCCCCTGGTGGCCATGGGCGCCACTGGTGCGGCTGATGTGGGTGCTGCCGCCGCGGCTGACC
+AGACGCTTCGCCTAGCGGGCGCTCGGCCACCTAGCCCGCGCGGCCACGTTCGGTGCGGTAGCGGCGCACC
+AGCCCGTCGGTCGAGCTGTCCGACTGCGGTGGCGGTGAACCGGCGCCGGTGATTACCGGAAGCAGCGCCT
+TGGCCTGCGTCTTGCCCAGCTCCACCCCCCACTGGTCGAACGAGTCGATACCCCACACCACACCCTCGGT
+GAACACCTGATGCTCGTAGAGCGCGATCAACTGCCCCAGCACCGACGGCGTGAGCCGACTGGCCAGAATT
+GAGGTGGACGGCCGGTTGCCGGGCATCACCTTATGCGCTACCACGTGGGCGGGGGTGCCGTCGGCGGCGA
+TCTCCTCGGCGGTCTTGCCGAACGCCAGCACCTGGGTTTGGGCGAAGAAGTTGCTCATCAGCAGATCATG
+CATGCTGCCGGTGCCCTCGGCGGTCGGCAGGTCGTCGAGGGGTTGAGCAAAGCCGATGAAATCGGCTGGC
+ACCAGCCGGGTGCCCTGGTGCAGCAACTGGTAGAAGGCGTGCTGGCCGTTGGTTCCCGGTTCACCCCAAA
+AGATTTCACCGGTGTCGGCGCTGACCGGGCTGCCGTCGGCGCGCGTGGACTTGCCGTTGGATTCCATGGT
+CAACTGCTGAAGGTAGGCCGGAAAACGCGACAAGTCATTGGAATACGGCAGCACGGTGCGTGATTGCGCA
+CCGAAGAAATTGGAGTACCACAGTCCGATCAGGCCAAGCAGCACCGGCGCGTTGGATTCCAGCGGAGCGG
+TCGCGAAATGGCGGTCGATGATGTGGAATCCGGCCAAGAAATCGGCGAAGGCGTCGCGGCCGATCACCGT
+CATCAACGACAGCCCGATCGCCGAATCCACCGAATAACGCCCGCCGACCCAATCCCAAAAACCGAACATG
+TTGTCGGTGTTGATGCCGAAGTCGTCGACCAGGCGCTTGTTGGTGGACACCGCGACAAAATGCCGCGACA
+CCGCGGCGTCGCCCAGCGCATCGGTCAGCCAGCGACGCGCCGCGGTCGCATTGGTCAATGTCTCCAGCGT
+CGAGAACGTCTTCGACGCGACGATGAAAAGCGTTGTGGCGGGGTCTAGATCGGCGAGCGTGGCGATCAGG
+TCGGCGGGATCGACGTTGGACACGAAGCGCGCGGAAATGCCCGCGTCGGCATAGTGGCGCAACGCTTGGT
+ACACCATCACCGGACCCAAATCCGAACCACCGATGCCGATGTTGACGACGGTGCTGATCCGCTTTCCAGT
+TGCTCCGGTCCACTCGCCGCTGCGCAGGCGGTCGGTGAAGGCGCCCATCGCGTCGAGCACGGCATGTACG
+TCGGTGACGACGTCTTGGCCGTCGACGACGAGTTCGGCGTCTCGGGGCAGCCGCAGCGCGGTGTGCAACA
+CCGCTCGATCCTCAGAGGTGTTGATATGCACACCGGCGAACATCTGGTCGCGACGCTCTTCGAGGTGGGC
+CGTCCGGGCCAGATCGATCAGCAGCGCCAGCGTCTCGCGGGTGACGCGGTGTTTGCTGTAGTCGATGTAG
+AGATCGCCGACGCTGACGGTGAGCTCCCGGCCGCGACCCGGATCGTCGGCGAAGAACTGGCGAAGATGGG
+TGTTTCCGATCTGATCGTGATGTCTGCGCAGGGCGTCCCATGCCGGGGTAGCGGTGATGTCGGGGATTGG
+CGCGGAGGTCATGGTTCGACCCTAATGCCGTGGAGTGGCGTCGATCAGAGCCGCTGTCTTCGCCGAGCCT
+TTAGTTATCGTGCTCGGCGGCACTCGCCGTTTGTCGCGGTATCTACAGGCTCGGCGATGCGGGCCTGCGC
+TCTCGCGGCCTCGGCCCCCGCCGAGGCCGCTGACCGTCGCCCAGCACCCGCTGCAGATCAGGCAGCATGG
+CCTGCAATGGCGCACGCCAGTACGCCCAGGTGTGGGTTTCGCCATCCGGGAAGTTGAACCGCCGTTGCGC
+CGCTTGGTACTTGCTTTGCAAAGCCTGTCGCCTATTGCCGCTCAACTCCGCCGAGGGCGTGCCGTTGCCC
+GAATACGCCCAGATACGGGGTGCTGTTGGCCACCAGCTTCGCGGCATTGACCGTTGGCTCGCTGTGGGCC
+CACGCCGGATCGGTCGGCGGGCCCCCGGATCAATGACGCGGATCCGGCAACCACGCCATTTCCACTCGGG
+ATGATCCCCTCACTCGCCGCCAGCCAGTCGGCCAGCTCTTGGGCCATATCCCGCCGTTGCCGACCGCCGG
+CCGGTGCCAGTTGGAATAGAACTCGCCATGCCACCGGTGGGCATGGCGAGCGACAGACCGGTCTGGTCAA
+CCGAATACCGGCAGGTGTATATCCCGGCCGTTGTAGTCGTCTCGGGCGAGTATGCCGTCGGACAAGTACC
+ACGCATGAGGGCCGCCACCTTGAAACTCCACCTTGATTAGGCGATGCATCGACCGCGACGGGACCATCAG
+TCGATGGGTAGACCCCGCCGCGACTACGTTGACGAGGTTGTCGAGCTGGCGCCTTGCCCGAGCAGCGCGA
+TCAAAGCTGCCGCCCATATGACCATCAACCGGCGCAATTGTGAAACTCCAGCTGCCTTTGCTGCATCCAT
+TTCGGCGGAAATTCAGCGCAGCGATGCAGAAATTCCCGGCAAACAGCGGCGGAAGTGACCCATTAGTGAC
+CGAGGCGGCCCCTGCCCAATCGCAAAAGCAGGATGGCCAGATCCTTACCGTCGGGTCCCAGCTCGCTGTA
+GCGTTCGATGACCTTCATCTCCCGGCTGTGTACCAGCCGAGTGCCACCGGACGCCATCCGGGCCTTGCCG
+ATGGCCTTGGAAACCTCAGCGCGTCGCTTGACTAACGCGAGGATTTCGGCGTCTAGCCGGTCGATCTCTT
+CGCGCAGCGTGTCGATCTCGGGGACAGGTTGGGACTCGAGCATTTCCAGGTTCATGGCTGCTAACTCCGC
+GTTCTCGTGATGTGGGGGTTCTGGTCTCATCCGGTACTGGGCCTCACACAAGAGACGAGCCCCGAATCCG
+GAAGCGGACCACGGGGCTCTGCGAAAGCAGCTAGACCACGGGCACCGCTGGCCGGTACCCGTAGAAAAAT
+CGGCGCTGCGCGTTGAGCACGAACCGAGTGTGCCATCAACGGACGCGCCCGCGCAAAAACTTGGCGGGAA
+AAGTGCACCCAAAATTGGGTGGTGGCGCCGAAGGACCTGCCGCGTGGCGATGAGCCTGGCCAGGCTATGC
+CGCGGTCCGCCGACTCGTCGCCGCGCGGCGGTAAGTTTGGACCGACATGAGTGTGCACGCGACCGACGCC
+AAGCCTCCCGGTCCATCCCCAGCGGACCAACTGCTCGACGGCCTCAACCCGCAACAGCGCCAGGCGGTCG
+TGCATGAGGGTTCGCCGCTGCTGATCGTCGCGGGCGCGGGTTCGGGTAAGACCGCGGTGTTGACCCGCCG
+CATTGCCTATCTGATGGCGGCCCGCGGCGTCGGGGTGGGCCAGATTCTGGCCATCACCTTCACCAACAAA
+GCCGCCGCCGAGATGCGCGAACGGGTGGTGGGCCTGGTTGGGGAGAAGGCCCGGTACATGTGGGTGTCGA
+CGTTTCACTCCACCTGCGTGCGTATCCTGCGCAACCAGGCGGCGCTGATCGAGGGCCTCAACTCCAACTT
+TTCGATCTATGACGCCGACGATTCGCGGCGGTTGCTGCAGATGGTGGGCCGCGACCTGGGCCTAGACATC
+AAGCGGTACTCGCCGCGACTGCTGGCTAACGCCATCTCCAACCTGAAGAACGAGTTGATCGACCCGCATC
+AGGCGCTGGCCGGCTTAACGGAGGACTCCGATGACCTAGCGCGCGCCGTGGCGTCGGTTTATGACGAATA
+CCAGCGGCGGCTGCGGGCGGCCAACGCGCTGGACTTCGACGACCTGATCGGCGAGACCGTCGCGGTGCTG
+CAGGCCTTCCCGCAGATCGCCCAGTACTACCGTCGGAGGTTCCGGCATGTCCTGGTTGACGAATACCAGG
+ACACCAACCACGCCCAGTACGTATTGGTGCGCGAGCTGGTCGGCCGCGACAGCAATGACGGTATTCCCCC
+CGGCGAGTTGTGCGTCGTCGGGGATGCCGATCAGTCGATCTATGCGTTCCGCGGCGCCACCATCCGCAAC
+ATCGAAGACTTCGAACGTGACTACCCCGACACCAGAACCATTCTGCTGGAACAGAATTACCGCTCGACGC
+AGAACATCCTGTCGGCGGCCAACTCGGTGATTGCCCGTAACGCGGGGCGCCGGGAGAAGCGGTTGTGGAC
+CGACGCCGGCGCCGGGGAGTTGATCGTTGGCTATGTCGCCGACAACGAGCACGACGAGGCCCGGTTCGTG
+GCCGAGGAGATCGATGCGCTCGCCGAGGGTAGCGAGATCACCTACAACGATGTCGCCGTCTTCTACCGCA
+CCAACAACTCGTCGCGGTCACTGGAAGAGGTGCTGATCCGCGCCGGTATTCCGTACAAGGTCGTTGGGGG
+AGTGCGCTTTTACGAGCGCAAGGAGATTCGCGACATCGTTGCCTACCTGCGCGTGCTGGACAACCCGGGC
+GACGCGGTCAGCCTACGGCGCATCCTTAACACCCCGCGCCGCGGTATCGGGGATCGTGCCGAGGCGTGTG
+TGGCGGTGTACGCCGAGAACACCGGCGTCGGCTTCGGTGACGCGCTCGTCGCCGCGGCCCAAGGCAAAGT
+ACCGATGCTGAATACCCGGGCGGAGAAGGCGATCGCGGGTTTCGTCGAGATGTTCGACGAGCTGCGGGGC
+CGCCTCGATGACGACCTGGGGGAGCTGGTCGAGGCGGTGCTGGAACGCACCGGATACCGCCGCGAGCTGG
+AAGCGTCCACCGATCCACAGGAATTGGCCCGCCTGGACAACCTCAACGAATTAGTCAGCGTCGCACACGA
+ATTCAGTACCGACCGGGAGAATGCCGCCGCACTTGGCCCAGACGACGAAGACGTCCCCGACACCGGTGTG
+CTGGCGGATTTTCTGGAACGGGTGTCGCTGGTCGCCGACGCCGATGAGATCCCGGAGCATGGCGCGGGTG
+TGGTTACCTTGATGACCTTGCACACCGCCAAGGGTTTGGAGTTCCCGGTGGTGTTTGTGACCGGCTGGGA
+GGACGGGATGTTCCCGCACATGCGGGCGTTGGACAACCCGACCGAGTTGTCCGAGGAGCGGCGGCTGGCC
+TATGTCGGCATCACCCGCGCCCGGCAGCGGTTGTACGTGAGCCGGGCGATCGTGCGTTCGTCTTGGGGCC
+AGCCGATGCTCAACCCGGAGTCGCGGTTTCTGCGGGAAATCCCGCAGGAGCTCATCGACTGGCGGCGCAC
+CGCCCCGAAGCCGTCGTTCAGTGCCCCGGTGAGTGGCGCCGGTCGGTTCGGTAGCGCGCGTCCATCACCG
+ACCCGCTCGGGGGCGAGCAGGCGCCCGCTGCTGGTGCTTCAGGTCGGCGACCGCGTGACCCATGACAAAT
+ACGGCCTGGGCCGTGTCGAGGAGGTCTCCGGTGTCGGCGAATCGGCGATGTCGCTGATCGACTTCGGTAG
+CTCGGGGCGGGTGAAGCTGATGCACAACCACGCCCCTGTCACCAAGCTCTGAGATTTCGCGCCGAGCGTG
+AAGTCACGGCGGCTATTTCGCGGATTTCTCGCCCTGAGAACACGTTCGGCGTCGTTGCCGGGTCAACCGG
+TGTAATTGCCGACGCTAAGTCCCCGCTTGGCGAGCCACGGCACTGGGTCCACGCGCTCGGTGCCGCCCAG
+GAGCACCTCGAAGTGCAGGTGCGGGCCGGTGGAAAAGCCACGGCTGCCCATGGTGGCGATCTGGTCGCCT
+GCCATCACGCGCTCACCGACGCTGACCAACGTGGTATTGACGTGGCCGTATAGCGTGACCGTGCCGTCGG
+CGTGCAGCAGCTTGACCCACATTCCGTAGCCGGCGGTGGGGCCGGCGTCGATGACGACGCCGTCGGACAC
+CGCATAAATCGGGGTTCCGATCGCGTTAGCCAGGTCGATACCGGCGTGCAGTACACCCCATCGATAACCG
+AAACTCGACGTGAAGATGCCCTTCGTCGGCATGACATACAGCGGGCGCTGTAGTCGCGCCTCGCGCTCGG
+CGCGCTCCTCGGCGAAGGCAACCCCCCTGGCGAACTCCGCGTTGTGCACCGCAGCACTCGCCGCCGGCTG
+GGCGGCGATGACCTGGACGCCCCGCGGTGGGTTGCTTCCCGACCCTTCGTTGAGCGCCGATGCATGAGCG
+GTCAGCACGGTCTCGGTGCGTGGGGTTTCCGACTGTTGGATCGCCGTATGCGCTGCTGCGGCCGCCGCGC
+CCGCGGCCATCGCCGAGATCAGCAGGCGCCCCCGGGCCGCACCGATCGGTTGCTTGCGGTGCTGCCCGAC
+GCGCCGGGACACCGGGGTGACCTCCGGGGTCAGCACGACCGTGGGGGCTACCAGCCATTCGGGGGCCAGA
+TCGTCGGCGTCGTCCAGGTCGTCGAGTTCTGGAGCCGCTAGCAACTGCGCTTCGTAGTCGAAGACGCAGT
+CGTCCCCTAGGTCCAGGTCATCGAGCTCTGCGAAATCCAGCTCATCGTAGAGTGCTAAGCCGTCGAGGAA
+TCCGTCCAGCGGGATGATTTCGGTGACTTCGTTACGGTGATGATGCGGCCAACGATCGCGAGGTGTGCGA
+ATCGCTGCCATGGCAGCAGAACGGGCGATACGGTGCTGGGACAAATCTGAAATGTCCTCGGATCGTGACC
+ATAACGTTATCTGGACCCTGAGACGTTATCCGCAACCGGATGGTAGTGGCAACTTCAGCGCGGAATTCGG
+CTGTGATTGTGAGTTGGATCACGTTTCGGCTGGACAAACATATCGGTGAGCTGTGCCACACCGGGTGGAT
+GCGGCCGCGGAGTTAATCGGCGGTCTCGATACAGTTCTCCGTGCGAGTCGCCGATTTCGGCACCGCCTAC
+CTATTGGTCGAGCAGTAAGCCGAGCGAAGACGGTGAGCCCATGGATCTTTTCGAGTATCAAGCCAAGGAG
+TTATTCGCCAAGCACAACGTGCCCAGCACGCCGGGTCGGGTGACCGACACAGCCGAGGGTGCCAAGGCTA
+TCGCCACGGAGATCGGGCGTCCGGTGATGGTCAAAGCGCAGGTCAAGATCGGCGGCCGGGGCAAGGCCGG
+TGGCGTCAAATACGCCGCGACCCCACAAGACGCGTACGAGCACGCCAAGAACATCCTCGGCCTGGACATC
+AAAGGACACATCGTCAAGAAACTGCTGGTCGCTGAGGCTAGCGATATCGCCGAGGAGTACTACCTATCCT
+TCCTGCTCGACCGGGCCAACCGCACCTACCTGGCGATGTGCTCGGTGGAGGGCGGCATGGAGATCGAAGA
+GGTAGCGGCCACCAAACCCGAGCGGCTCGCCAAAGTCCCGGTGAATGCCGTCAAGGGCGTTGACCTAGAT
+TTCGCGCGGTCCATCGCCGAACAGGGTCATCTTCCGGCCGAGGTGCTCGACACCGCAGCGGTCACCATCG
+CCAAGCTGTGGGAGCTCTTCGTCGCCGAGGACGCGACGCTGGTTGAGGTCAACCCGTTGGTGCGGACGCC
+TGACCACAAGATCCTCGCGCTGGATGCCAAGATCACCCTCGACGGCAACGCCGATTTCCGTCAGCCTGGC
+CATGCCGAGTTCGAGGATCGAGCTGCCACCGATCCACTGGAGTTGAAGGCCAAGGAGCACGACCTCAACT
+ACGTCAAGCTGGACGGTCAGGTGGGGATCATCGGCAATGGCGCGGGCTTGGCGATGTCGACTCTCGACGT
+CGTCGCGTATGCCGGTGAGAAGCACGGCGGAGTCAAGCCGGCCAACTTCCTGGATATCGGCGGCGGCGCT
+TCGGCCGAGGTGATGGCCGCGGGTCTGGACGTGGTGCTGGGCGACCAGCAGGTCAAGAGCGTGTTCGTCA
+ACGTCTTCGGTGGCATCACCTCGTGCGATGCGGTGGCGACCGGGATCGTCAAGGCGCTGGGCATGCTGGG
+TGACGAAGCCAACAAGCCGCTGGTGGTTCGGCTCGACGGCAACAACGTCGAGGAAGGCCGTCGCATCCTG
+ACCGAGGCCAACCACCCCCTGGTGACACTGGTGGCGACGATGGACGAAGCCGCCGACAAGGCCGCTGAGC
+TGGCGAGCGCCTGAGCGAAAGGACCCATGACTCACATGTCCATATTTCTGAGCAGGGACAACAAGGTCAT
+TGTGCAGGGCATCACCGGCAGTGAGGCCACCGTCCATACCGCGCGAATGCTGCGGGCGGGCACGCAAATC
+GTCGGCGGTGTGAACGCACGCAAAGCGGGCACCACCGTCACGCATGAGGATAAGGGCGGCCGGCTGATCA
+AGCTGCCGGTGTTCGGCAGTGTCGCGGAGGCGATGGAAAAGACCGGCGCCGATGTGTCGATCATCTTCGT
+GCCGCCGACGTTCGCCAAGGACGCCATCATCGAGGCCATCGACGCCGAAATTCCGCTGTTGGTTGTGATC
+ACCGAGGGAATTCCGGTGCAGGACACCGCCTATGCCTGGGCCTACAACCTCGAGGCTGGCCACAAGACCC
+GCATCATTGGCCCCAACTGTCCTGGCATTATCAGTCCCGGTCAGTCGCTGGCCGGTATCACGCCGGCCAA
+CATCACCGGACCCGGTCCAATTGGTCTGGTGTCCAAGTCGGGGACGTTGACCTACCAGATGATGTTCGAA
+CTGCGCGACCTTGGATTCTCCACGGCGATCGGCATCGGTGGTGATCCGGTGATTGGCACTACCCACATCG
+ACGCCATCGAGGCCTTCGAGAAGGATCCGGACACCAAGCTCATCGTGATGATCGGCGAGATCGGTGGTGA
+CGCCGAGGAGCGGGCCGCAGACTTCATCAAGACCAACGTGTCCAAGCCGGTCGTCGGCTATGTCGCCGGA
+TTTACCGCACCCGAAGGCAAGACGATGGGCCACGCCGGCGCCATCGTCTCCGGCTCGTCTGGCACAGCGG
+CGGCCAAGCAAGAGGCCCTGGAGGCCGCCGGTGTGAAGGTCGGCAAGACCCCATCGGCGACCGCGGCGCT
+GGCCCGGGAGATCTTGCTCAGTCTCTAGGGCGAGCAGACGCATAAGCCCCCGCACGCTCGGCGTGTCGGG
+GGCTTATGCGTCTGCTCGCCCTATACGCAACAGGCCAACTTGGCGGCCAGCCGCTCCACGTACGCGGCTG
+CGTCGTCTGCAGACCTGTCCGGCATACCGAACAGCACCTCCGTAACGCCAAGCTCGGCCCAGCGCGCCAG
+CTTGTCGGGCACCGGTTTGACGTCCAGGGCCACGATCTGTGGAAGCCCGTCGCGGCCGGCGGCCGCCCAG
+ATGTCTTGCAGTAACTTCACCGGCTCGTCGATGTCGACGTCGCGTGGAGTGGTGATCCAGCCGTCGGCGC
+TGCGCGCGATCCACTTGAAGTTCTTCTCCGTCCCCGCAGCGCCTACCAGCACCGGGATGTGCGGCTGCAC
+CGGCTTGGGCCAGGCCCAGCTAGGTCCGAACTTGACGAACTCGCCGTCATAGCAGGCCTCCTCTTGGGTC
+CACAACGCCCGCATCGCCTCGAGGTATTCGCGCAGCATGGTGCGGCGGCGTCCGGGTGGCACACCATGAT
+CGACGAGCTCGTCGGTGTTCCAGCCGAACCCGACCCCGACGCTGACCCGGCCGTGCGACAAATGATCCAG
+CGTCGCAATGCTTTTCGCCAGCGTGATCGGATCATGCTCGACCGGCAGCGCCACCGCGGTGGCAAGCCGG
+ATCCGCGACGTCACCGCCGATGCTGCTCCCAGGCTCACCCACGGGTCCAACGTGCGCATATAGCGGTCGT
+CCGGCAGCGAAGCGTCACCCGTCGTCGGATGGGCCGCCTGGCGCTTGACCGGGATGTGGGTGTGTTCGGG
+CACGTAAAACGTGCGAAACCCGTGGCTTTCAGCAAGTCTGGCGGCCGCGGCCGGGGTGATGCCGCGGTCG
+CTGGTGAACAGCACAAGTCCGTAGTGCATGCACCGAATTAGAACGTGTTCCACCTGCGCCGGGCAAGCGG
+CCGTCCAGTCGTTAATGTCGCGAGCGCCGGTCGCTCCGGCAGCGGCACCCGAACGTGCGCTAGCGTGGTT
+GATCGAATCGCGTCGCCGGGAGCACAGCGTCGCACTGCACCAGTGGAGGAGCCATGACCTACTCGCCGGG
+TAACCCCGGATACCCGCAAGCGCAGCCCGCAGGCTCCTACGGAGGCGTCACACCCTCGTTCGCCCACGCC
+GATGAGGGTGCGAGCAAGCTACCGATGTACCTGAACATCGCGGTGGCAGTGCTCGGCCTGGCTGCGTACT
+TCGCCAGCTTCGGCCCAATGTTCACCCTCAGTACCGAACTCGGCGGAGGTGATGGCGCAGTGTCCGGTGA
+CACTGGGCTGCCGGTCGGGGTGGCTCTGCTGGCTGCGCTGCTTGCCGGGGTGGCTCTGGTGCCTAAGGCC
+AAGAGCCATGTGACGGTAGTTGCGGTGCTCGGGGTACTCGGCGTATTTCTGATGGTCTCGGCGACGTTTA
+ACAAGCCCAGCGCCTATTCGACCGGTTGGGCATTGTGGGTTGTGTTGGCTTTCATCGTGTTCCAGGCGGT
+TGCGGCAGTCCTGGCGCTCTTGGTGGAGACCGGCGCTATCACCGCGCCGGCGCCGCGGCCCAAGTTCGAC
+CCGTATGGACAGTACGGGCGGTACGGGCAGTACGGGCAGTACGGGGTGCAGCCGGGTGGGTACTACGGTC
+AGCAGGGTGCTCAGCAGGCCGCGGGACTGCAGTCGCCCGGCCCGCAGCAGTCTCCGCAGCCTCCCGGATA
+TGGGTCGCAGTACGGCGGCTATTCGTCCAGTCCGAGCCAATCGGGCAGTGGATACACTGCTCAGCCCCCG
+GCCCAGCCGCCGGCGCAGTCCGGGTCGCAACAATCGCACCAGGGCCCATCCACGCCACCTACCGGCTTTC
+CGAGCTTCAGCCCGCCGCCACCGGTCAGTGCCGGGACGGGGTCGCAGGCTGGTTCGGCTCCAGTCAACTA
+TTCAAACCCCAGCGGGGGCGAGCAGTCGTCGTCCCCCGGGGGGGCGCCGGTCTAACCGGGCGTTCCCGCG
+TCCGGTCGCGCGTGTGCGCGAAGAGTGAACAGGGTGTCAGCAAGCGCGGACGATCGGGCGGCCGGCGCTC
+GTCCAGCTCGCGACCTCGTCAGGGTTGCGTTCGGCCCAGGTGTGGTGGCGTTGGGCATCATCGCCGCGGT
+GACGCTGCTCCAATTGCTGATCGCCAATAGCGACATGACCGGTGCGTGGGGCGCCATCGCCAGCATGTGG
+CTGGGCGTGCACCTGGTGCCGATCTCGATCGGTGGCCGCGCACTGGGCGTCATGCCGCTGTTGCCGGTCC
+TGTTGATGGTGTGGGCCACCGCGCGCAGCACGGCGCGGGCCACATCCCCACAGTCGTCAGGGCTCGTTGT
+TCGCTGGGTCGTCGCGTCGGCCCTGGGCGGACCGCTGCTGATGGCGGCGATTGCCCTGGCGGTCATTCAC
+GACGCGTCATCAGTGGTCACCGAGCTGCAGACGCCCAGCGCCCTGCGCGCGTTCACTAGTGTGCTGGTTG
+TGCATTCCGTTGGGGCCGCGACCGGGGTGTGGTCCCGGGTAGGTCGACGGGCGCTAGCCGCCACGGCACT
+GCCCGATTGGCTGCATGATTCGATGCGTGCCGCCGCCGCTGGGGTGCTGGCGTTGCTCGGGCTTTCCGGC
+GTGGTGACGGCGGGGTCGCTGGTTGTGCATTGGGCGACGATGCAAGAGCTCTACGGGATCACCGATTCGA
+TATTCGGCCAGTTCAGCCTCACTGTACTTTCGGTGCTTTACGCACCCAACGTCATCGTCGGCACCTCGGC
+CATCGCGGTTGGGTCCAGTGCTCACATTGGCTTCGCGACGTTCAGTTCGTTTGCAGTTTTGGGCGGCGAT
+ATCCCGGCACTGCCGATCCTGGCCGCGGCCCCGACGCCGCCGCTCGGCCCGGCATGGGTTGCCTTACTCA
+TTGTGGGTGCTTCGTCGGGTGTGGCGGTCGGTCAGCAGTGCGCCCGCCGCGCCCTGCCGTTTGTTGCGGC
+TATGGCCAAGCTGCTGGTCGCTGCCGTTGCCGGGGCATTGGTAATGGCGGTTCTGGGTTACGGCGGTGGC
+GGCCGGCTGGGCAATTTCGGCGATGTCGGCGTGGACGAGGGCGCCTTGGTGTTGGGCGTGCTCTTCTGGT
+TTACGTTCGTAGGATGGGTCACGGTGGTGATTGCCGGCGGGATCAGCCGCCGCCCCAAGCGGCTCCGGCC
+GGCCCCGCCGGTCGAGCTGGACGCCGATGAATCTTCGCCACCGGTAGACATGTTCGACGGGGCAGCGAGC
+GAGCAGCCGCCCGCTTCGGTCGCGGAAGACGTCCCGCCTAGCCACGACGACATCGCCAACGGCCTCAAGG
+CCCCTACTGCCGACGACGAGGCGCTGCCCTTGTCCGACGAACCGCCGCCGCGGGCCGACTAATCTGCGGT
+TGGTGAGGCCGCAACTGTCTGAGGCCTTTACTCACGGTACTGAGTCTGCACTGGGATGCAGGCTGGTGGT
+GCTCACACGCTTTGAGGAGCCAGACTAGGCTCGCCGTGTGCAGGAACCGCTTCGTGTACCCCCGAGTGCA
+CCTGCGCGGCTGGTAGTACTCGCGTCTGGCACCGGTTCGTTGCTGAGATCTCTACTCGATGCCGCTGTCG
+GCGACTACCCGGCACGGGTAGTCGCCGTTGGTGTGGATCGCGAATGCCGGGCCGCCGAAATCGCCGCGGA
+AGCATCGGTGCCGGTGTTCACCGTTCGGCTCGCCGACCACCCCAGTCGCGATGCCTGGGACGTCGCCATC
+ACCGCCGCCACCGCAGCCCATGAGCCCGACCTCGTCGTTTCTGCGGGCTTTATGAGAATCCTTGGACCGC
+AGTTCCTTTCACGATTCTACGGGCGCACCCTCAACACCCACCCGGCGCTGCTGCCGGCCTTCCCCGGCAC
+GCACGGTGTCGCTGACGCGCTGGCCTACGGGGTGAAGGTCACCGGCGCTACGGTGCACCTGGTAGACGCT
+GGCACGGACACCGGGCCAATACTGGCGCAGCAACCTGTGCCGGTGCTCGACGGTGACGACGAAGAGACTT
+TGCATGAACGAATCAAGGTCACCGAACGACGGCTGTTGGTAGCGGCGGTGGCCGCACTGGCCACCCACGG
+CGTGACGGTGGTCGGACGAACAGCGACGATGGGACGAAAGGTAACCATAGGATGAGCACCGACGACGGAA
+GACGGCCGATCCGCCGTGCGCTGATCAGCGTGTACGACAAGACCGGGCTGGTAGACCTGGCACAGGGCCT
+GAGCGCGGCCGGCGTCGAGATCATCTCGACTGGGTCAACGGCCAAGACCATTGCCGACACCGGGATTCCG
+GTGACCCCCGTGGAGCAGCTGACCGGCTTTCCCGAGGTGCTCGATGGCCGGGTCAAGACACTGCACCCGC
+GAGTGCATGCCGGGCTGCTGGCTGACCTGCGCAAGTCCGAGCACGCCGCGGCCCTCGAGCAACTCGGGAT
+CGAGGCTTTCGAACTCGTTGTAGTCAACTTGTATCCGTTCAGCCAGACCGTCGAATCCGGCGCCAGTGTC
+GACGACTGCGTCGAGCAGATTGATATCGGCGGGCCGGCGATGGTGCGGGCCGCCGCCAAAAACCATCCCA
+GCGCGGCGGTGGTCACCGATCCGCTTGGGTACCATGGCGTGCTTGCCGCACTGCGCGCCGGCGGATTCAC
+CCTCGCCGAGCGCAAAAGGCTGGCGTCGTTAGCGTTTCAGCATATAGCCGAGTACGACATCGCCGTCGCG
+AGCTGGATGCAACAGACCCTAGCGCCCGAACATCCTGTTGCCGCCTTTCCGCAGTGGTTCGGCCGAAGCT
+GGCGCCGCGTGGCGATGCTGCGCTACGGCGAGAACCCGCACCAACAGGCCGCTCTCTACGGCGACCCCAC
+CGCCTGGCCGGGGCTGGCCCAGGCCGAGCAACTGCACGGAAAAGACATGTCCTACAACAACTTCACCGAT
+GCGGACGCAGCCTGGCGGGCCGCCTTCGACCACGAACAAACGTGCGTGGCGATCATCAAGCACGCCAACC
+CGTGCGGCATCGCAATCTCGTCCGTTTCGGTCGCCGACGCGCATCGCAAGGCTCACGAATGCGATCCGCT
+GAGCGCCTACGGCGGGGTCATCGCCGCCAATACCGAGGTCAGTGTCGAAATGGCCGAGTATGTGAGCACC
+ATCTTCACCGAAGTCATCGTCGCGCCTGGCTACGCCCCCGGGGCCCTCGATGTGCTGGCCCGCAAGAAGA
+ACATCCGGGTGCTGGTAGCCGCCGAGCCACTGGCCGGTGGCAGCGAGTTGCGTCCGATCAGCGGTGGACT
+GCTGATACAGCAGAGCGACCAGCTTGACGCGCACGGTGACAACCCGGCGAACTGGACCTTGGCGACCGGG
+TCACCTGCGGACCCCGCGACGCTGACCGACCTGGTCTTCGCGTGGCGAGCCTGCCGTGCGGTCAAGTCGA
+ACGCGATAGTGATAGCTGCCGACGGCGCCACCGTCGGCGTCGGGATGGGTCAGGTCAACCGTGTCGACGC
+CGCCCGGTTGGCCGTCGAACGCGGCGGCGAGCGGGTTCGCGGCGCGGTGGCAGCCTCGGATGCGTTCTTC
+CCCTTTCCCGACGGCCTGGAAACGTTGGCCGCCGCGGGGGTCACCGCGGTCGTCCACCCCGGTGGCTCGG
+TGCGCGACGAGGAAGTGACCGAAGCGGCGGCCAAGGCCGGTGTCACCCTATATCTCACCGGGGCGCGGCA
+CTTCGCGCACTGAGGCCGCTGGCCGCGACAGTGAAATCCACGACGTGACACGCCGGAAACGCGTCGTGAC
+ATTCACTCTCGTGGCCAGAAGAAAGACGGCGTCGTAGCGTGGAACGGTGATGTCACCCAGTAACCTGCCC
+CGCACCGTGGGCGAGCTGCGTGCCGCCGGTCATCGGGAACGGGGGGTCAAGCAGGAAATCCGGGAAAATC
+TGCTGACCGCGCTGGCCGACGGCGACAACGTCTGGCCGGGCATCCTGGGTTTCGACGACACCGTGATTCC
+CCAGGTGGAGCGGGCCTTGATCGCCGGTCACGACTTTGTCCTGCTCGGCGAACGCGGCCAGGGCAAGACC
+CGGCTGCTGCGCGCACTCGCGGGTCTGCTGGACGAGTGGACGCCGGTGATCGCCGGCGCCGAACTGGGCG
+AGCACCCCTACACGCCGATCACGCCGGAGTCGATCCGGCGGGCCGCGCAGCTCGGCGACGACCTACCGGT
+GGCGTGGAAGCACCGCAGCGAGCGCTACACCGAGAAGCTGGCCACCCCCGACACCAGCGTCGCCGACCTG
+GTCGGCGACGTCGACCCGATCAAGGTTGCCGAGGGCCGCAGCCTCGGGGATCCCGAAACCATCGCCTACG
+GGCTCATCCCGCGGGCGCACCGCGGCATCGTCGCGGTCAACGAGCTGCCCGACCTCGCCGAACGCATCCA
+GGTGTCGATGCTCAACGTCATGGAGGAGCGCGACATCCAGGTCCGCGGCTACACGCTGCGGCTGCCGCTG
+GATGTGTTGGTGGTCGCCAGCGCCAACCCCGAGGACTACACCAACCGTGGCCGCATCATCACGCCCATCA
+AGGACCGGTTCGGCGCCGAGATCCGCACCCACTACCCACTGGAGCTGGAGGCGGAGATGGGCGTCATCGT
+CCAGGAGGCGCACCTGAGTGCACAGGTGCCCGACTACCTGATGCAGGTGCTCGCGCGGTTTGCCCGTTAC
+CTGCGAGAATCCCGCTCGATCGATCAGCGCTCCGGGGTGTCGGCGCGGTTTGCCATCGCAGCGGCCGAAA
+CCGTGGCGGCTGCCGCCCGGCACCGCGGGGCGGTGCTGGGGGAGACAGACCCGGTGGCCCGGGTGGTCGA
+TTTGGGCACGGTGATCGACGTGCTGCGCGGCAAGCTGGAATTCGAGTCCGGCGAGGAGGGCCGCGAACAG
+GCGGTGCTCGAGCATCTGTTGCGTCGCGCCACCGCCGATACCGCGTCCCGGGTGCTGGGCGGTATCGACG
+TTGGCTCGTTGGTGACCGCGGTCGAGGGCGGTTCGGCGGTGACGACGGGCGAGCGGGTCTCGGCCAAGGA
+TGTGCTGGCGGCGGTGCCGGGCCTGCCGGTGGTGGACAGGATCGCGCGCAAGCTGGGCGCCGAATCCGAG
+GGGGAGCGTGCCGCGGCACTGGAACTGGCGTTGGAGGCGCTATACCTGGCCAAGCGCGTTGACAAGGTCT
+GCGGGGAGGGCCAGACCGTCTATGGCTAAGTCTGATGGTGACGACCCGCTGCGCCCGGCTTCGCCGCGCT
+TGCGATCGTCACGACGGCACTCGCTACGCTACTCGGCGTACACCGGCGGGCCCGACCCGCTGGCCCCGCC
+GGTGGATCTGCGGGATGCGCTGGAACAGATTGGCCAAGACGTCATGGCGGGCGCCTCGCCGCGCCGGGCG
+CTGTCCGAGCTGCTGCGGCGGGGCACCAGGAACCTGACCGGCGCCGACCGGCTGGCGGCCGAGGTGAACC
+GCCGCCGACGGGAGTTGTTGCGCCGCAACAACTTAGATGGCACCTTGCAGGAGATCAAGAAGCTGCTCGA
+CGAGGCCGTGCTGGCCGAACGCAAGGAGCTGGCCCGCGCGCTAGACGACGACGCCCGCTTCGCCGAGCTG
+CAGCTGGACGCGCTTCCGGCCTCGCCGGCCAAGGCAGTACAGGAGCTGGCCGAATACCGCTGGCGCAGCG
+GGCAGGCCCGCGAAAAGTATGAGCAGATCAAGGATTTGCTCGGCCGTGAGCTGCTCGACCAACGCTTTGC
+CGGCATGAAGCAGGCGCTTGCCGGTGCCACCGACGACGATCGCCGGCGGGTCACCGAGATGCTCGACGAC
+CTCAACGACCTGTTGGATAAGCACGCCCGCGGTGAAGATACGCAGCGGGACTTCGACGAGTTCATGACCA
+AGCACGGCGAGTTCTTCCCGGAGAACCCGCGCAACGTCGAGGAGCTGCTGGACTCGCTGGCCAAGCGAGC
+CGCCGCCGCGCAGCGGTTCCGCAACAGCCTGAGCCAGGAACAGCGGGACGAGCTGGACGCGTTGGCGCAG
+CAGGCATTTGGCTCTCCGGCGTTGATGCGGGCGCTGGACCGTTTGGATGCGCATCTGCAGGCCGCCCGTC
+CCGGCGAAGACTGGACCGGCTCGCAGCAGTTCTCCGGTGATAATCCGTTCGGCATGGGGGAAGGCACCCA
+GGCGCTGGCCGACATTGCCGAGCTGGAGCAGCTGGCCGAGCAGCTGTCGCAGAGCTATCCGGGCGCCAGC
+ATGGACGATGTCGACCTGGACGCGCTGGCCCGTCAGCTCGGCGACCAGGCCGCCGTCGACGCCCGGACGC
+TGGCTGAATTGGAACGCGCGCTGGTCAATCAGGGCTTCCTGGACCGCGGTTCCGACGGCCAGTGGCGGCT
+CTCGCCGAAGGCCATGCGCCGCCTCGGCGAAACGGCGTTACGCGATGTGGCGCAACAACTTTCCGGGCGC
+CACGGCGAGCGTGATCACCGGCGTGCCGGCGCCGCGGGCGAGCTGACCGGTGCGACGCGGCCCTGGCAGT
+TCGGCGACACCGAGCCGTGGCACGTCGCCCGCACGCTGACCAATGCCGTGCTGCGCCAAGCCGCGGCCGT
+GCATGACCGCATCCGGATCACCGTCGAGGATGTCGAGGTCGCCGAGACCGAAACGCGCACCCAGGCCGCT
+GTTGCGTTGTTGGTGGACACCTCGTTTTCGATGGTGATGGAGAATCGCTGGTTGCCGATGAAGCGCACGG
+CGCTGGCGCTGCACCACCTGGTGTGCACCCGGTTCCGCTCGGATGCCTTGCAGATCATCGCGTTTGGGCG
+CTACGCCCGCACGGTGACGGCGGCCGAGCTGACGGGGTTGGCGGGTGTCTACGAGCAGGGCACCAACCTG
+CACCATGCGCTCGCGCTGGCCGGCCGGCACCTGCGCCGGCACGCAGGCGCCCAGCCCGTGGTGCTGGTGG
+TGACCGACGGCGAGCCGACCGCCCACCTGGAGGACTTCGACGGCGACGGTACGTCGGTGTTCTTTGATTA
+CCCGCCCCATCCGCGCACCATCGCCCACACCGTGCGCGGGTTTGACGACATGGCGCGGCTGGGTGCGCAG
+GTGACGATCTTCCGGTTGGGCAGTGACCCCGGTCTGGCTCGGTTCATTGACCAGGTTGCGCGACGGGTGC
+AGGGCCGCGTGGTGGTGCCCGATCTCGACGGGCTGGGCGCGGCGGTGGTGGGCGACTACCTGCGCTTCCG
+GCGGCGCTAGTTTGTTGCAATCATGGTGCTAGCATCGTGCTAGCAATATGCTAACATAGTGCGATGAAGA
+CGCTGTATCTGCGCAATGTGCCGGACGACGTGGTCGAGCGACTCGAGCGCCTCGCCGAACTCGCCAAGAC
+GTCGGTGTCCGCGGTTGCTGTGCGTGAGCTCACCGAGGCTTCTCGCCGCGCCGACAATCCGGCGCTTCTT
+GGGGACTTGCCCGATATCGGCATCGACACGACCGAACTGATCGGTGGTATCGACGCCGAGCGCGCCGGTC
+GATGATCGTCGTTGACGCCTCGGCCGCGCTGGCCGCGCTGCTCAACGATGGACAAGCTCGACAATTGATC
+GCTGCCGAGCGCCTGCATGTCCCGCATCTGGTCGATTCGGAAATCGCGAGCGGGCTCCGCAGGCTAGCGC
+AGCGGGATCGGCTGGGCGCGGCCGACGGACGGCGGGCCCTCCAAACGTGGCGCCGCCTCGCGGTGACGCG
+TTATCCGGTGGTGGGCCTTTTCGAGCGTATCTGGGAAATCCGCGCGAACCTGTCGGCATACGACGCCAGC
+TATGTGGCCTTGGCGGAAGCCCTGAACTGTGCGCTCGTCACAGCGGATCTGCGGCTCAGCGACACCGGCC
+AAGCCCAGTGTCCGATTACCGTTGTGCCCAGGTAGCCGTGGCACGGATGTTCGAGGATCCGTATATCACA
+ACGCGATAGGTCCTGTTGACACAAGGGAAGCGCGGGGCGCCGTCGGCGGTTCGTCTCGTCGAAATGCGAC
+AACAACGCCGTGCGCGGCACATCCCAGTTTGTGAGACACTGTGCGCGTGCCCTCGCAGTGGATGATCTCA
+TCCCGGGTAACGGTAGCCTGGAACATCGTCGGCTACCTCGTGTATGCGGCCCTGGCTTTTGTCGGCGGGT
+TTGCGGTTTGGTTCTCCTTATTCTTCGCGATGGCCACCGATGGTTGTCACGACTCAGCTTGCGACGCAAG
+CTATCACGTGTTCCCGGCCATGGTCACCATGTGGATCGGAGTTGGCGCGGTCTTGCTGCTCACCTTGGTG
+GTCATGGTTCGCAACTCGTCGCGAGGCAACGTCGTGATCGGATGGCCTTTTGTTGGGTTGTTGGCGCTTG
+GCCTTGTCTACGTGGCTGCCGATGCGGTCTTGCACTGATCGACGTGGGGTTCTGCGTCAGTAGGCGTCGC
+GGGTTCGGCCGCCGGGGGATCCGTACAGGTACGGGTAGTGCACGTCGGGGTCGTTGGCCGGTCGCATGTT
+CAGCGGTGGCGGCGCGGTGCGCCAGGCGGCCGGGAGATGGCAACCGGTGTTGTAGGAGTAGCCGAGTGGG
+CCGCGGTTGTCGCCATTGACGAGGTTTATCGTGACGCCGTCATCGCGGATTTGAGAGTAATTCGGGGCGC
+CCAGCGGCTGTGGCGGGTCGCCGGGTACGGAGTTGTTGGGCCGAAAACCCGCCGCCTTGAACACCGGGGC
+TAGCTCGGTGACAATTTGCAGCCATTGCTGCGGAGTGGGCGCTGGACGGCCAAAGAATAACTCGCTTGCC
+TCTTGTCGACCGATGGTGCGGGTGAACGGGTCGTTGCAGCCGTTGGTGAGATGGCTCACTGTGACGCCTG
+TTGAGAACCGGGTCTGCGGTGAATATTTCGCGATCATCGCCCTGATGGTGGCGTCGAGGTTGGCGAGCTG
+CTGCTGGACTGTCTCAAGATCGGGTCGTCCGTTGACGATTTTCTGCCGGCGGTCCAGCTCGCCCCGCCCG
+GGATTGGCGTAAGGGTCGAACGTATTGGGTTTGATACACCCGGCCAGCAGTGCGGCGATGCCGAGGAGCG
+CCGCGGTCAGGCTGCGGGATGTTCGCTTCATGGGTGATAGTTCGGGTTGGGTATTGGCAATCCGAACGGG
+CCGGGCCCACTGGGCATCGTCGGTGGCGGCAGCACAGGGGGTTTGATGAGGTCGTCGGGCAATCCCGCCA
+GCACGGCGGCCAAGTTGTAACCACTCATCCGAAGCTGATCATTGTCTCCGTTACGCGCGTACTCAGAGTG
+TCCTTATGCTCGCTCGTGAAGTTGGCCGTCGCCCAAGAGCGGGCCGGGCGCCAAACCGGTGTTGACCGAC
+AGTTGTGTCATGCCGGGTACGTCCTGGGGTGCGGAGCCGAATGCGCCGAATTCGGGGATGGTATTGGCGA
+CATGGTCGTTGACGCCGATCATGTAGAAGGCATGCCCTGGCTCAACGCCCAGCTGCGACGCGTGCGTGAG
+CTCGGTGCCCGGTGAACCGTACAAAACGACGTCGCTGACCGGTGCCCCCTGCTGCAGCGCCAGACTGGTT
+ACCAGGGATCCGTAGGAATGCCCGAACGCGGTGATGTGCTGATCGCTGACATTCGTGGTAGCGGCCAAGC
+CTTTGTCGAAGCGGTTCAACGGCCCCGCGGCATCGCGAGCCGACCAGTCGTGCATCACGTCTTTGAGGCC
+GTCCGGCGCGTCATAGCCCAGCCACGCAATGGATGCCACCGCATCGTAATTTGGCCATCCGGCTCGTTCC
+CTCAGTTCGGCTGCCTTTGCGCGCTGAATTCCAGCTTCCTTGACCATGTCCCCAACGCTCGAACTCACCC
+GCGTGTTCAGGCCGCCCATCGTGACGCCGACGCGTTCGGCGTTGTCGACGTCGCCAACTCCCACAGCCGC
+CAACACCTTTCGCGGGTCACTGGCGGTGTCCAACAGAATGAGGCTGGTGCCGGGATGGGCTGCCAGAGTA
+TCCCGCAACGCTCGCAGATCCGCCAGCTTGTCGGTGTCGGTGTGCCAGACTCCATCTCTGCTCAACCAGC
+CGTTCTGCAGCCGGGTGAGTTCTCGTTGCAGCACTGAAAGATTCAGTTCGTTGCGAACGGCGATGGGAAT
+GCCGTCGCGATTACGCAGGGTATTGGGGAACCATTGCTTGACCCGATCCTGCTGGCCCGGGGTCAGCGAA
+TGCCACCACCGCTTGACCTCCTCAGGGTCGCTGTCCGGCGGCGGCATCTGCGGCATTGTGGGTGGCGCAT
+GGCTGAGTTGGGCATTGACCTGCTCGCGCGACAAGTCCCCGGCGGCGCATCGAATCGCCGCGGCCAGATC
+CTCATCGGCGGTCTCGGCGTCGGCCAGCAGACGTTTGATGCCCTCCGGATTGCGGTGTTGAGGATGGCCT
+GCTGATCGGCCGGGGAATACGACGACAAGTCGGGTGGTGGCAACGCCGTACCGGTCGCGTAAGCGATCGT
+CAGGTGATGCTCACGCGCGGCATCGCGGATCACTTGTAGCCGCATCTTGATCGCGGCGACCTCCTCGGCC
+GCCTTTTCCGCGGCCCGCGCGACCGCTTCACACGCGCCGGCATGGTGATCGAGCAGCACCGTTGTGTGAT
+GGGTTGCTACCTGTGCCGCCTCGGCGGCCGCACCGCCAAAGCCGAGCAGCCCCATGGTGTCACGCAGCGC
+CGCCGATGCGGTGCGTGTGCCGTGCGCGCGGTCGATCGCGGCCTGAACACCGTCCTGATCGCTGTGGGAT
+CCCAGCGCTCAATGTCAGCTAACGTCAACGCCGTCGCATCGGGCGCTTCCACCGCCTGTTGGATAAACCG
+CGGCCAGTGCCGCGGCGTTGTGTTCCTCCATCTCGGCGAACCCGACCGCGGCCAGATGCATGCCGTAAGA
+ATGGTCCCCGATGTGGGCCGCGTGGGCGGTGCTGGCCTCCGCCCAGCTATCCAGCAATCCCGACAGCGCG
+CCCGCCGACGAACCGACCCATCCCGGCCGCGCCCCTTCGGCCGCACCCAGGCAGCAGTGGTGTGACGTCA
+GCAAAGACTCGCCGTGGTCAGCCTGCTGATAACCGACCTGGGACAGGACTTCAGGAATCGCCCGCAACGT
+TCTGCCATACCAACTCGCTTCCACACGAACCAAACTTTCGGCGGAGTATGGCACACGAGCACATTGCGGG
+CGATTCACCCGCATCGAGCTGACCGGGCGGCGCACCTTGCTATTTGCGGCTATTTGCGTGGCTTGCGGGG
+TTTGCGCTTGATGCCCACATCACCCCCCAGCGAGAAGCCGCGGATCCTCACCGTCGGCGCGCCACGGGTG
+CCCTCCCCGACCACCTTGCGGTCGAAGCCGCCCATCACTCGGTGACCGTGGATCTCCACGTTGACTTCGG
+GTGGCAGCAGAATTGTCTGCGCCCCCATGATCGAGTACGCACGGATGTCCACCTCGGTCGAGGTGAAGTC
+GGCGTAGCGCAGATCCAGCACCCCGCTGCCCCACAAGGTGAACGTGGTCAGCTTCTTCGGCACGTTCCAG
+CGGCCGCGTCGTTCGAATCCGCCCAGTAGCGCCAGCAGCAGCGTGGACGGCGCCGGATTGCATTCGCCAC
+CCCTGCGCGGGCCTATCGCCGCCCCCGGCAGATCGGCCCGCAGCCGATCCAGCTCCTGGTAGGTGGTTGC
+CGCATAGGCCCGCGCCAGCCGGTCTTCATAATCGGTCAGCTGCAGGCGGCCCTGCTCGGCCGCGTAGGCC
+AGCAACTGCGCAATCTGTATCCGGTCGGTGTCCGACGCACGCGCGGACTCGTCGCGCGAGTTCCTCGCGT
+CACGCTGCGCCGAGTTGCTCATCGTCCACGAGCCTACGACGTCAAGAATTTGCTTCAAGAGGTGTTGGCG
+AAACTGCAAATGTTGCCAGGTTCGACTCCTTGGGTAGCCCACCCCCAGTGGGGTGGGATACCATGAACGG
+GTGAGGGATTAGGGGCAAGCCATGAGCAAGGAATTGACCGCAAAGAAGCGCGCGGCGCTGAACCGGCTGA
+AGACGGTTCGGGGCCATCTTGACGGAATCGTTCGGATGCTGGAGTCCGACGCCTACTGCGTGGACGTGAT
+GAAGCAGATTTCAGCGGTTCAGTCCTCGCTGGAGCGGGCCAACCGGGTGATGCTGCACAACCACTTGGAG
+ACGTGCTTTTCCACGGCGGTGCTGGATGGTCATGGGCAAGCGGCCATCGAAGAGCTCATTGATGCCGTCA
+AATTCACGCCGGCGCTGACCGGTCCACACGCGCGGCTCGGCGGTGCCGCGGTCGGCGAGTCGGCCACCGA
+GGAGCCGATGCCGGATGCCAGCAACATGTGACGAGCGCCGGACTCCGGTGTTTCTCGGGACAACGACATA
+CGAAAGGAGCATCCGCGATGGTGTGGCATGGATTCCTAGCGAAGGCGGTACCCACCGTGGTCACCGGCGC
+GGTGGGGGTCGCGGCGTATGAGGCGCTGCGCAAGATGGTGGTGAAGGCTCCGCTGCGGGCGGCAACCGTG
+TCCGTTGCCGCCTGGGGCATACGCTTAGCACGTGAAGCCGAGCGCAAGGCCGGGGAGAGCGCCGAGCAAG
+CTCGACTGATGTTCGCCGACGTGCTAGCCGAAGCCAGCGAGCGCGCCGGGGAAGAAGTTCCACCACTGGC
+GGTGGCGGGTTCGGACGACGGTCATGACCACTGACGTTCTTTCTGACACCGACGTCTCGCTGAAGGTGGT
+CTCCAACGCGTCGGGGCGGATGCGCGTGTGCGTCACCGGGTTCAATGTCGATGCGGTTCGGGCCGTCGCG
+ATTGAGGAGACGGTCTCCCAAGTGACCGGGGTGCACGCCGTGCACGCCTATCCGCGAACAGCGTCGGTGG
+TGATCTGGTACTCGCCAGAGCTCGGTGACACCGCCGCCGTGCTGTCGGCGATCACCAAAGCGCAGCACGT
+CCCGGCAGAATTGGTGCCCGCCCGTGCCCCGCACTCAGCGGGTGTGCGCGGCGTGGGCGTGGTGCGGAAA
+ATCACCGGCGGGATCCGCCGCATGCTAAGTCGCCCGCCGGGCGTCGACAAGCCCCTGAAGGCGTCGCGTT
+GCGGCGGCCGCCCGCGCGGGCCGGTCCGCGGGAGCGCCTCGTGGCCGGGCGAGCAGAACCGGCGCGAGCG
+GCGGACGTGGTTGCCGCGGGTGTGGTTGGCCTTGCCGTTGGGGCTACTGGCGCTGGGTTCGTCAATGTTC
+TTCGGTGCTTACCCGTGGGCGGGGTGGCTGGCCTTCGCCGCGACGCTGCCGGTGCAATTCGTGGCCGGGT
+GGCCGATTCTGCGGGGGGCGGTGCAACAGGCGCGGGCGTTGACCTCGAACATGGACACGCTGATCGCGCT
+GGGTACGCTGACCGCGTTTGTCTACTCCACGTATCAGTTGTTTGCCGGTGGACCTCTGTTCTTCGACACC
+TCGGCGCTGATCATCGCGTTCGTGGTGTTGGGCCGCCATCTCGAGGCCAGAGCAACCGGAAAAGCGTCCG
+AGGCGATCAGCAAGCTGCTGGAGCTGGGCGCCAAGGAAGCCACGCTGCTTGTCGACGGCCAAGAGCTCCT
+GGTGCCGGTCGATCAGGTCCAAGTCGGAGACCTGGTGCGGGTGCGGCCCGGAGAGAAGATCCCGGTCGAC
+GGTGAGGTCACCGATGGGCGCGCCGCCGTCGACGAGTCGATGCTCACCGGCGAATCCGTCCCGGTCGAGA
+AGACGGCGGGTGACCGCGTTGCCGGCGCAACGGTCAACCTCGACGGGCTGTTGACCGTGCGCGCCACCGC
+CGTCGGGGCAGACACCGCGCTGGCGCAGATTGTGCGACTGGTCGAGCAGGCACAGGGCGACAAGGCGCCG
+GTGCAGCGGCTGGCCGACCGGGTTTCGGCGGTGTTTGTCCCGGCCGTCATCGGCGTTGCCGTCGCGACCT
+TTGCGGGATGGACACTGATCGCCGCCAACCCGGTGGCTGGTATGACCGCCGCGGTCGCGGTGCTGATCAT
+CGCGTGCCCGTGTGCGTTGGGCCTGGCTACCCCCACGGCCATCATGGTCGGCACCGGCCGGGGCGCCGAA
+CTGGGGATCCTGGTCAAGGGAGGCGAGGTGCTGGAAGCGTCGAAGAAGATCGACACCGTGGTGTTCGACA
+AGACCGGCACCCTCACCCGCGCCCGGATGCGGGTGACCGATGTGATTGCCGGCCAGCGGCGCCAGCCTAA
+TCAGGTGCTGCGGCTCGCCGCCGCGGTCGAATCGGGCTCCGAACACCCCATCGGTGCGGCGATCGTTGCC
+GCTGCACACGAGCGCGGGTTGGCGATACCGGCCGCCAATGCGTTCACCGCCGTCGCCGGGCACGGGGTGC
+GGGCGCAGGTCAACGGCGGGCCGGTGGTGGTCGGACGGCGCAAGCTCGTCGACGAACAACATTTGGTTCT
+GCCCGACCACCTCGCTGCGGCGGCCGTGGAGCAGGAAGAGCGCGGCCGCACCGCGGTGTTCGTCGGCCAA
+GACGGCCAGGTTGTGGGTGTGCTCGCGGTAGCGGACACGGTCAAAGACGACGCCGCGGACGTGGTCGGTC
+GGCTGCACGCCATGGGGCTACAGGTAGCCATGATCACCGGCGACAACGCCCGCACGGCTGCCGCGATCGC
+CAAGCAGGTCGGCATCGAGAAGGTGCTGGCCGAGGTGTTGCCGCAGGACAAGGTAGCTGAGGTTCGGCGG
+CTGCAGGACCAGGGCCGGGTGGTCGCGATGGTGGGTGACGGCGTCAACGACGCGCCCGCCTTGGTACAAG
+CCGATCTGGGCATTGCGATCGGCACCGGTACCGACGTGGCCATCGAGGCCTCCGACATCACGCTAATGTC
+CGGCCGGCTCGATGGTGTCGTGCGCGCGATCGAACTCTCCAGGCAGACCCTGCGCACCATCTACCAGAAT
+CTCGGCTGGGCCTTCGGCTACAACACCGCCGCGATCCCACTGGCCGCGCTGGGCGCGCTGAACCCGGTCG
+TGGCGGGCGCGGCGATGGGGTTCTCCTCGGTCAGCGTGGTGACCAACTCACTGCGGTTACGCCGCTTCGG
+CCGCGACGGCCGAACCGCATGATCCATGACCTGATGCTTCGTTGGGTGGTTACCGGCCTGTTCGTGCTGA
+CCGCCGCCGAATGTGGTCTGGCAATCATCGCCAAACGCCGACCGTGGACGTTGATCGTCAACCACGGGTT
+GCATTTCGCAATGGCCGTTGCGATGGCGGTGATGGCCTGGCCGTGGGGCGCGCGGGTTCCGACGACGGGA
+CCTGCGGTATTTTTCTTGCTGGCGGCCGTGTGGTTTGGGGCGACGGCCGTCGTTGCGGTCCGCGGGACCG
+CTACGCGTGGACTGTACGGATATCACGGCTTGATGATGCTGGCCACAGCCTGGATGTATGCCGCCATGAA
+TCCTCGTTTGCTCCCTGTCCGCTCGTGCACCGAATACGCCACCGAGCCGGATGGGTCAATGCCGGCTATG
+GACATGACTGCGATGAACATGCCGCCGAATAGCGGGTCACCCATCTGGTTCAGCGCGGTGAACTGGATCG
+GTACGGTCGGCTTCGCGGTTGCGGCGGTTTTCTGGGCATGCAGGTTTGTCATGGAGCGGCGGCAGGAGGC
+GACCCAGTCCAGGTTGCCGGGCAGCATAGGCCAAGCGATGATGGCGGCCGGTATGGCGATGTTGTTCTTC
+GCCATGCTGTTTCCGGTCTGAGGCAGTTCGCCGCCTGTGTGTCCGAACCGCAAGGTAATTCGGAATAGGC
+TGTTCCCAACCTCCTGCGTCGTAGGCGGGGGCCCGGCGGGCCTAGTCAGCGGCCCGCATCGTCGCCGGCT
+GGACCCAGCGGGGCGGACGTTTCTGCAGGAAGGCCAGCATCCCTTCGCGCGCTTCGTCGGAGACGAACAG
+CCTGGCCGACTCCTCGGTCAGGCGTTCGGCGTCGCGGTCGAACCCTTCGAGCACGGCGGCCGTGGTCAGC
+GCCTTCGACGCGGCCAGGCCTTGTGGCGAGCCGCGGCCCACGTCGGCGACCAGCGCGGCCACCGCGGCGT
+CCACGTCGTCGGCCGCCATGGTGATCAGTCCGATGTCGGCGGCTTCGCGGGCGCCGAACTTCTCGCCGGT
+CAGGTAATAGCGGGCCGCGGCGCGCGGCGAAAGCTTGGGCAGCAGCGTCAGCGAGATGATCGCCGGTGCC
+ACCCCGATCCGTGCCTCGGTCAGCGCGAACGTGCTTTCCGGTCCGGCGACCACCATGTCGCACGCACCGA
+CCAGGCCGAACCCGCCGGCCCGCACATGCCCGTTGATGGCGCCGACCACCGGCAGCGGCGACTCGACGAT
+GGCGCGCAACAGCGCCGTCATTTCCCGCGCCCGCGCCACCGCCATCCGGTACGGATCACCACCACCACCG
+CCGGCCTCGCTGAGGTCCGCGCCGGCGCAGAACGTTCCGCCGGTATGCCCCAGCACGACCAGCCGCACCG
+CCGGATCTGCTTCGGCCGCACTCAGCCCTTGATGTAGTTGGCTGACCAGCGTGCTCGACAGCGCGTTGCG
+GTTGTGCGGAGAGTTCAGTGTCAGCCTGGCGAAGGGGCCGCCGCAGGCGGCCGGGCCAGCGTAGTCGACG
+GGGCTGTCCATCAGTAGGACCGGGGCAGACCCAGCGATGTCTGCGCAACGAAGTTCAGCACCATCTCGCG
+GCTGATCGGGGCGATCCGCGCCAAGCGGGCCGAGGTCATCATCGCTGCCACGCCATATTCCTTGGTGAGG
+CCGTTGCCGCCCATCGACTGTACGGCCTGATCGACCGCGCGGCTGGATGCCTCGGCCGCAGCGTATTTGG
+CCATGTTGGCCGCCTCGGCCGCACCGAAGTCGTCACCATGGTCGTAGAGTGTGGCGGCTTTCTGGGTCAT
+CAGCTTGGCGAGTTCGACCTCAATGTGGCACTGCGCCAACGGATGTGCCAGGCCCTGGTGCGCGCCGATC
+GGGGTGGACCACACCTTGCGGGTTTTGACGTAGTCGACGGCCCTGCCGAGTGCGAACCGGCCCATGCCCA
+CCGCGCTAGCCGCACCCATGATGCGCTCGGGGTTCAGGCCCGCGAAAAGATGTGCGATCGCCGCGTCTTC
+GGCTCCAACCAGCGCATCGGCGGGTAGCCGGACGTCGTCGAGGAAAACCTGGAACTGGCGTTCGGGGCTG
+ACCAGCTCCATCTCGATCGGGGTGTAGCTGAACCCGGGAGCGTCGGTGGGCACCACGAACAACGCGGGGC
+GTAGCTTGCCGGTTTTGGCTTCCTCGCTGCGGCCCACGACCAGCACCGCCTGCGCCTGGTCGATGCCAGA
+AATAAAGACTTTCTGGCCCTTGATGATCCAGTCGCTGCCGTCGCGACGCGCGGTGGTGGTGATCTTGTGT
+GAGTTGGAGCCGGCGTCGGGCTCGGTGATGGCGAACGCCATGGTCAACGAGCCGTCGGCGATGCCCGGCA
+ACCAGCGCTTCTTCTGATCGTCGGTGCCGAACTTGGCGATGATGGTTCCGTTGATGGCCGGTGACACCAC
+CATCAGCAGCAGCGCCGAGCCGGCGGCGGCCATCTCCTCCATCACCAGCGACAGTTCGTACATGCCTGCG
+CCGCCGCCGCCGTACTCTTCGGGCAGATTCACCCCCAAAAAACCGAGTTTGCCTGCCTCGGCCCATAACT
+CGCTGGTGTGTTCGTGTTTGCGCGCCTTGTCCAGGTAGTACTCGTGGCCATAGTTGGCCACCCAAGAGGC
+CACCGCCTTGCGCAGCGCCTGACGTTCCTCGCTTTCGATAAAGCTGGTGTCTGTCACGGTGAATCTCCTT
+CTGCTGGGCCATTTTGAGGTGCTTCTACTCGTGCGAGAATGGCGCCTACTTCGACCTGTTGACCCGTGTT
+GACGCTGACGTGGGTGAGCACGCCGTCGGCAGGCGCGGCGATGGTGTGTTCCATCTTCATGGCCTCCAGC
+CAGATCAACGGCTGACCGGCCGTGACCGTGTCGCCAACCTCGGCGCCGATCCGGATGACGTTGCCGGGCA
+TGGGGGCCACCAGCGAGCCTTGCTCGACGGCCGAGCTCGGCTCGGGGAAGCGTGACAGTGCCACCAGGTG
+AACGGGTCCGCGCGCCGAGTCGACGTAGACGTCGGGGCCGTGGCGGGCAACCGTGAAGCCGTGTGCGACC
+CCGTCCTGGGCGAGCACCACCTGGTCCACGTCAGCCGAGACCAGCTGTACCACCGGATCGCCGGGAAGCG
+CCAGACCCGTTCTGGTGAACCGGTATTCGACGCGGTGTTCGGTGTCCGCGTCGTCACGATAGGTCTTGAC
+CTGATAGCCCGAGGCCAGGTTGCGCCAGCCGCTGGGAATCGAGCTGAACACGCCCGCGCTCGCCCGATTG
+TGCTCGGCGTCGGCCAGCGCGGCGGCGATCGCCGACAACCGGAGGGTCGCGGTGTCGGCCAGCGGTGTCG
+ACAACTCGGCCATGCCGTGCGTGTCGAAAAACCCGGTGTCGGTGGCGCCGTCGAGGAACGCCGGATGACG
+CAGCACGTTGACCAAGAGCTCACGGTTGGTGCGCAGACCGTGCAGCCGGGCGCGTACCAGCGCATCGGCC
+AACACAAGCGCGGCCTGCCGGCGGGTGGCACCGTAGGAGACGACCTTGGCCAGCATTGGGTCGTAGTGGA
+TCGACACTGTGGAACCGTCGACGATCCCGGAATCCAGCCGGATGCCGGTCCGCTGTCCCAACGAGTCGAA
+CTGCGCCCGAACCCCCGGAACCTCAATCGTGTGCATCACGCCTGCCTGTGGCTGCCAGCCATGCGCGGGA
+TCCTCGGCGTAGAGGCGGGCCTCGATCGAATATCCCTGGGCGGGGGGAGGTTCGGTGTCGAGTCGCCCGC
+AGTCGGCAATCATGAGCTGCAGTTCGACCAGATCCAGCCCGGTGGTCTCTTCGGTGACCGGGTGCTCGAC
+CTGTAGCCGGGTGTTCATCTCCAGGAAGTAGAACTCACCTTCCCGGCCAGGTGAGTCATCGGCGAGGAAC
+TCCACCGTGCCTGCCCCGGTGTAGCCGATCGCGCTGGCCGCCAGCCGGGCCGCGTCGAACAGCTTGGCCC
+GCATCCCCGGTACGCGTTCCACCAGCGGCGACGGTGCCTCTTCGATGATCTTCTGGTGGCGGCGCTGAAA
+CGAGCATTCCCGTTCCCCGACCGCCCACACGGTGCCATGGGTGTCGGCCATGACTTGCACTTCGACGTGG
+TGCCCGGTGGGCAGGTAGCGCTCGCAGAATACGGTCGGGTCGCCGAACGCGGATTGGGCTTCACGTCGCG
+CGGCTTCGACTTCGGCCGGCAGGGCCGATAATTCGTGAACCACTCGCATGCCGCGACCGCCACCGCCCGC
+CGACGCCTTCACCAGCACCGGCAGCTGCGCGGTGGTGACGGCGTCGGGGTCGAGTTCCTCGAGCACCGGC
+ACCCCGGCGGCGGCCATCAGCTTCTTGGACTCGATTTTGGAGCCCATCGCGCGCACCGCGTCCACCGGTG
+GCCCGACCCAGGTTAGGCCGGCCTCCTGCACGGCGGCCGCGAATTCGGCGTTCTCCGAGAGGAATCCGTA
+GCCGGGATGCACCGCGTCGGCTCCGGCTGCCTGCGCGGCCGCGATGATCGCCTCGGCGTTCAGATAGTCG
+GTGGTCTGCGGCAGCCGGACCCGGGCGTCGGCCTCGGCGACATGCGGTGCCGCGGCATCCGGGTCTGTGT
+AGACGGCGACGGTGCCGAGCCCCAGCCGGCGGCAGGTGGCGAACACCCGCCGGGCGATCTCGCCGCGGTT
+AGCAACCAATACTCGAGTGATTCCCATCAGCATCACATCCGGAAGACGCCGAAGTTCGACGTCCCCTTGA
+TCGGGCCATTGGCGATGGCGGACAAACACATTCCCAGCACGGTGCGGGTGTCGCGCGGGTCGATCACCCC
+GTCGTCGTAAAGCATCCCGGACAGCACCAACGGTAGCGACTCGGCTTCGATCTGGCCCTCGACGGCGGCC
+CGCATCGCCGCGTCGGCGGCTTCGTCGACTTGCTGCCCGCGGGCTTCGGCTGCCGCCCGGGCCACGATGG
+ACAGCACGCCCGACAGCTGGGCGCCGCCCATCACCGCGGACTTGGCGCTGGGCCAGGCGAATAGGAAGCG
+CGGGTCGTAGGCGCGCCCGCACATGCCGTAGTGCCCGGCGCCGTAGGACGCGCCGATCAGCAGCGAGATG
+TGCGGGACGGTCGAGTTGGACACGGCGTTGATCATCATCGAGCCATGCTTGATCATCCCGCCTTCCTCGT
+AGTCCTTGCCCACCATGTAGCCGGTGGTGTTGTGTAAGAACAACAGCGGCGTGTCGGCCCGGTTGGCCAG
+CTGGATGAACTGGGTGGCCTTCTGTGATTCCTCGCTGAACAGCACGCCGCGGGCGTTGGCCAGGATGCCC
+AGCGGATAGCCGTGCAACCGAGCCCAGCCGGTCACCAGAGACGACCCGTACAGCGGCTTGAATTCGTCGA
+ACTCGGAGCCATCGACGATGCGGGCGATCACCTCGCGCGGGTCGAATGGGATGCGCAGATCCGGGGGCAC
+GATGCCGATTAGCTCCTCGGCGTCGAACAGCGGCTCGGTCACCGGAGCGGGTGCGGGTCCCTGTTTGATC
+CAGTTCAGTCGCGCCACGATGCGGCGTCCGATGCGGATCGCGTCGAGCTCGTCGAGCGCAAAATAGTCGG
+CCAAACCCGATATGCGGGCGTGCATTTCGGCGCCGCCCAGCGACTCGTCGTCGGACTCTTCGCCGGTGGC
+CATCTTCACTAGCGGCGGGCCGGCCAAAAACACCTTGGAGCGTTCCTTGATCATCACCACGTGATCGGAC
+ATGCCGGGGACGTAGGCACCGCCCGCGGTGGAGTTGCCGAAAACCAGCGCAATGGTCGGGATCCCGGCCG
+CCGACAGCCGGGTCAGGTCGCGGAACATCTGTCCGCCGGGGATGAAAATCTCTTTCTGGGTGGGCAGATC
+GGCCCCGCCGGATTCCACCAGCGAAATGACGGGAAGCCGGTTTTCGAAGGCGATCTGGTTGGCCCGCAGT
+ATCTTTCGAAGCGTCCACGGATTGCTGGTGCCGCCCTTGACCGTCGGGTCGTTGGCGACGATCATGCATT
+CCACGCCGCAGACCGCGCCGATGCCGGTGACCAGGCTGGCGCCGATCTGGAAGTTGCTGCCGTAGGCGGC
+CAGCGGGCTCAGCTCCAGGAACGGGGAGTCCGGGTCGACGAGCAGCTCGATGCGTTCCCGTGGTGTCAGC
+TTGCCGCGGGCGTGGTGCCGGTCGACGTATTTGGGGCCACCGCCGGCGAGCGCCTTGGCCAGTTCGGCGT
+TGATCTCGTCGAGCTTGCCGCTCATCGTCGCGGCCGCCTCGTCGTAGGCGGAAGCGTTCGGGTCCAGTGT
+GGATTGCAGCACGGTCACGATTGATACCCCAGGGTTTTGGCGGCCAAAGCGGTCAGTATTTCGGTGGTGC
+CGCCTCCGATACCGAGGATTCGCATGTCCCGGTATTGGCGTTCGCTTCGGATTCGGCCATGTAACCCATG
+CCGCCGAACAGCTGTACGGCCTGGTTGGCAACCCACTCCCCGGCCTGCACGGCGGTGTTCTTGGCGAAAC
+ACACCTGCGCGATCAGGTCGGTCTCGCCGGCGAGCTGGCGTTCCACCACATGGTGCGCATAGACCCGGGC
+GACGTCGATGCGGCGGGCCATCTCGGCCAGCGTGTTCTGCACCGACTGGCGTGAAATCAGCGGCCGACCG
+AACGTCTCGCGGTCCCGGCACCACTGCGCGGTGAGGTCCAGGCACCGCTGGGCGCTCGAATACGCCTGGG
+CGGCAAGGCCGATGCGCTCGGAAACAAATGCCCGGGCGATCTGGGTGAAGCCGCTGTTCTCGGCGCCCAC
+GAGGTTAGTCGCCGGCACGGCCACGTCGGTGTAGCACAGCTCGGCGGTATCCGAGGAACGCCAGCCCATC
+TTGTCCAGCTTGCGGGTCACCTCAAAGCCGGGGGTGTCCTTTTCCACCACCAGCAGCGAAACCCCGGCGG
+CACCGGGTCCACCGGTTCGCACCGCGGTGACCACGTAGTCGGCCCGCACGCCGGAGGTGATGTAGGTCTT
+GGCGCCGTTGATCACGTAATGGTCGCCGTCCCGTACCGCGCTGGTCCGTAGATGCCCGACGTCGGAGCCG
+CCGCCGGGTTCGGTGATGGCCAGCGCGCCGATCTTCTCCCCGGCCAAGGTGGGCCGCACGTACGTGGCGA
+TCAGCCGTTCGTCGCCGGATGCGACCATGTGCGGTACGGCGATACCGCAGGTGAACAGGGACGCATACAC
+CCCGCCCGGGGCGCCGGCCTGGTGCATCTCCTCGCAGATGATGACGGGGTCGGCGCCGTCACCGCCGCCA
+CCACCGACCGCCTCGGGAAAGCCGGCGCCCAGCAGCCCGGCGGCCCCGGCGAGCCGGTGCAGGCCGCGGG
+GCAACTCGCCGATCCTTTCCCACTCGTCGACGTGCGGCAGGATCTCGCGCTCGGCAAAGGCGCGCACCGT
+TTTTCGCAGCTGTTGGCGCTCCGGTGTGGTCCAGATGTTCACAACAGGGTCTCCGGGATCTCGACGTGGC
+GGCTGCGCAGCCACTCACCCAGTCCCTTGGCCTGCGGGTCGAAGCGGGCCTGGTAGGCGACGCCCTGGCC
+GAGGATTGCCTCGATGACGAAGTTCAGTGCCCGCAGATTCGGCAGCACGTGACGGGTGACGACCAGGCCT
+GCCGTTTCTGGCAGCAGCTCCTTGAGTAGCTCGACGGTCAGCGTGTGCGCCAGCCAGCGCCACTGCTCGT
+CGGTGCGTACCCACACGCCGACGTTGGCCGATCCGCCCTTGTCGCCGCTGCGGGCGCCAGCGATCAGGCC
+CAGCGGTACGCGCCGGGTCGGGCCAGCCGGCAGCGGGTCGGGCAGCGCCGGGGGATGTGCCGGCGCCAGC
+TCCAACGTCTCAGTGGCGCAGGGAATCTCGGTGCGGGTGCCGTCGGCGTGCACGGCGATGTGCGCCACCT
+TGCCGGCGTCGACGTAGCCGGGGGTGAACACGCCATACACCTGGCCGTCACCGGGCGGGGCGGTGGCGGT
+GAACCCCGGGTAGCTGGCCAGCGCCAATTCGACCGCGGCCGAGGAGAATTGCCGACCCACATTGGCAGGG
+TCGGGATCGCGGGCGACGCAGGTGAGCAGCGCGCTGGCGGTTTCTTCGGTGTCGGCGTCGGGGTGGTCGG
+TGCGGGCCAGCGTCCATTGCAGCTCAGCGGGTTTGACGGTCAGCGCGGCCTCGAGCTGGCGTCGCACCAA
+GTCGGCCTTGGCATCGATGTCCAGGCCGGTCAGCACGAATGTCATGGCGTTGCGGAAGCCGCCGATGCTG
+TTCAGCGACACCTTGTAGGTCGGCGGCGGCGGTTCGCCGATCACGCCGCTAATGCGCACTCGATCCGGCC
+CGTCGGGCGACAGTTCGACGCTGTCCATCCGGGCCGTCACATCCGGGTTGGCATACCGAGCGCCCGTGAT
+CTCGTAGAGCAGCTGCGCGGTGATGGTGTCGACGCTGACCAGGCCGCCGGTGCCGTGGTGCTTGGTGATC
+ACCGACGAGCCGTCGGCAGCGATCTCGGCCAGCGGGAAGCCGGCGTGAGTGAGGTCGCCTATCTCGGTGA
+AGAACGCGTAGTTGCCGCCGGTGGCCTGGACTCCGCATTCGATCACGTGCCCGGCCACCACGGCGCCGGC
+CAGTCGGTGGTAGTCGGTGCGGCCCCAGCCGAAGTGCGCGGCCGCCGCCCCGACGACCACCGAGGCGTCG
+GTGACCCGGCCGGTGACCACGACGTCGGCGCCGCGCTCGAAGCAGTCGACGATGCCCCATGCGCCCAGGT
+AGGCGTTGGCCGTCAGTGGCGTCCCCAGCCCCAGTTCGGCCGCCCGTGGTTGCAGGTCGTCGCCTTCCAC
+GTGGGCGACCTGCGCCGGAATGCCCAGGCGCGCGGCCAGCGCCCGCACCGCGTTGGCCAGCCCGGCGGGG
+TTCAGGCCACCGGCGTTGGTGACGATGCGCACCCCGCGGTCATGGGCCAGGCCCAGGCAGTCCTCGAGCT
+GGGCCAGGAAGGTCTTCGCGTAGCCGCGATCGGGGTTTTTCATGCGGTCGCGACCGAGAATCAACATGGT
+CAGCTCGGCCAGGTAGTCGCCGGTGAGATAGTCCAGCTCGCCGCCGGTCAGCATCTCGCGCATGGCGGAG
+AGGCGGTCGCCGTAGAAGCCCGAGCAGTTTCCGATACGCACGGCACCACAGTCAGGGGCCATGCGATTCC
+TCCCTTGGGATCGGCGACGCTACCAACCAACCGGTAGGTTAGCACTGCCCTGTTTCGCGACGGAGATCGC
+TTCCTGAGTCGAAGCGGCCCGGTCTGCGCCGTCCATTGGAGTAGAGTCCGTTTCGCTACGGGACGCCGGG
+TGCTTTGCCGGCCCCAGGAGGTCAGCGCCATGTCCTTCGTGGTCACAGCACCGCCGGTGCTCGCGTCGGC
+GGCGTCGGATCTGGGCGGTATCGCGTCCATGATCAGCGAGGCCAACGCGATGGCAGCGGTCCGAACGACG
+GCGTTGGCGCCCGCCGCCGCCGACGAGGTTTCGGCGGCGATCGCGGCGCTGTTTTCCAGCTACGCGCGGG
+ACTATCAAACGCTGAGCGTCCAGGTGACGGCCTTCCACGTGCAGTTCGCGCAGACATTGACCAATGCGGG
+GCAGCTGTATGCGGTCGTCGACGTCGGCAATGGCGTGCTGTTGAAGACCGAGCAGCAGGTGCTGGGTGTG
+ATCAATGCGCCCACCCAGACGTTGGTGGGTCGTCCGCTGATCGGCGATGGCACCCACGGGGCGCCGGGGA
+CCGGGCAGAACGGTGGGGCGGGCGGAATCTTGTGGGGCAACGGCGGTAACGGCGGGTCCGGGGCTCCCGG
+ACAGCCGGGCGGCCGGGGCGGTGATGCCGGCCTGTTCGGCCACGGCGGTCATGGCGGTGTCGGGGGGCCG
+GGCATCGCCGGTGCCGCTGGCACCGCGGGCCTGCCCGGGGGCAACGGCGCCAACGGCGGAAGCGGCGGCA
+TCGGCGGCGCCGGCGGCGCCGGCGGCAACGGCGGGCTGCTATTCGGCAACGGTGGTGCCGGCGGCCAGGG
+TGGCTCCGGCGGACTTGGGGGCTCCGGCGGGACGGGCGGCGCGGGCATGGCTGCCGGTCCCGCCGGCGGC
+ACCGGCGGCATCGGGGGCATCGGCGGCATCGGCGGCGCGGGCGGGGTCGGCGGCCACGGCTCGGCGTTGT
+TCGGCCACGGGGGAATCAACGGCGATGGCGGTACCGGCGGCATGGGTGGCCAGGGCGGTGCTGGCGGCAA
+CGGCTGGGCCGCTGAGGGCATCACGGTCGGCATTGGTGAGCAAGGCGGCCAGGGCGGCGACGGGGGAGCC
+GGCGGCGCCGGCGGGATCGGTGGTTCGGCGGGTGGGATCGGCGGCAGCCAGGGTGCGGGTGGGCACGGCG
+GCGACGGCGGCCAGGGCGGCGCCGGCGGTAGTGGCGGCGTTGGCGGCGGCGGCGCAGGCGCCGGCGGCGA
+CGGCGGCGCGGGCGGCATCGGCGGCACTGGCGGTAACGGCAGCATCGGCGGGGCCGCCGGCAATGGCGGT
+AACGGCGGCCGCGGCGGCGCCGGTGGCATGGCCACCGCGGGAAGTGATGGCGGCAATGGCGGCGGCGGCG
+GCAACGGCGGCGTCGGTGTTGGCAGCGCCGGAGGGGCCGGCGGCACCGGCGGTGACGGCGGGGCGGCCGG
+GGCGGGCGGCGCGCCGGGCCACGGCTACTTCCAACAGCCCGCGCCCCAAGGGCTGCCCATCGGAACCGGC
+GGGACCGGCGGCGAAGGCGGTGCCGGCGGCGCCGGTGGAGACGGCGGGCAGGGCGACATCGGCTTCGATG
+GCGGCCGGGGTGGCGACGGCGGCCCGGGCGGTGGCGGCGGCGCCGGCGGTGACGGCAGCGGCACCTTCAA
+TGCCCAAGCCAACAACGGCGGCGACGGTGGTGCCGGCGGTGTTGGGGGAGCCGGCGGCACCGGCGGCACG
+GGTGGGGTCGGGGCCGACGGGGGTCGCGGGGGGGACTCGGGCCGCGGCGGCGACGGCGGCAACGCCGGCC
+ACGGCGGCGCCGCCCAATTCTCCGGTCGCGGCGCCTACGGCGGTGAAGGTGGCAGCGGCGGCGCCGGCGG
+CAACGCCGGTGGCGCCGGCACCGGTGGCACCGCGGGCTCCGGCGGTGCCGGAGGTTTCGGCGGCAACGGT
+GCCGATGGCGGCAATGGCGGCAACGGTGGCAACGGCGGCTTCGGCGGAATTAACGGCACGTTCGGCACCA
+ACGGTGCCGGCGGCACCGGCGGGCTCGGCACCCTGCTCGGCGGCCACAACGGCAACATCGGCCTCAACGG
+GGCCACCGGCGGCATCGGCAGCACCACGTTGACCAACGCGACCGTACCGCTGCAGCTGGTGAATACCACC
+GAGCCGGTGGTATTCATCTCCTTAAACGGCGGCCAAATGGTGCCCGTGCTGCTCGACACCGGATCCACCG
+GTCTGGTCATGGACAGCCAATTCCTGACGCAGAACTTCGGCCCCGTCATCGGGACGGGCACCGCCGGTTA
+CGCCGGCGGGCTGACCTACAACTACAACACCTACTCAACGACGGTGGATTTCGGCAATGGCCTTCTCACC
+CTGCCGACCAGCGTTAACGTCGTCACCTCGTCATCACCGGGAACCCTGGGCAACTTCTTGTCGAGATCCG
+GTGCGGTGGGCGTCTTGGGAATCGGGCCCAACAACGGGTTCCCGGGCACCAGCTCCATCGTTACCGCGAT
+GCCCGGCCTGCTCAACAACGGTGTGCTCATCGACGAATCGGCGGGCATCCTGCAGTTCGGTCCCAACACA
+TTAACCGGCGGTATCACGATTTCTGGAGCACCGATTTCCACCGTGGCTGTTCAGATCGACAACGGGCCGC
+TGCAACAAGCTCCGGTGATGTTCGACTCCGGCGGCATCAACGGAACCATCCCGTCAGCCCTCGCCAGCCT
+GCCGTCCGGGGGATTCGTGCCGGCGGGAACGACCATTTCGGTCTACACCAGCGACGGCCAGACGCTGTTG
+TACTCCTACACCACCACCGCGACAAACACCCCATTTGTCACCTCCGGCGGCGTGATGAACACCGGGCACG
+TCCCCTTCGCGCAGCAACCGATATACGTCTCCTACAGCCCCACCGCCATCGGGACGACCACCTTTAACTG
+ACGGCCCCTCCCTGGCTCGTGATAGGGAAGGGGCGTCTGCAGCGGGCGTTCTCGATTGTCGCCGCGCTCA
+TCTGCGCGCGGAAGCTCATACCAAAGAGGAAGGCCCACCATGGCTGTGCCCACGCGCAGAAAGTCGCGCG
+CGAACACCCGAAGCCGGCGCTCGCAGTGGAGGGCCCGGCCGGACGGGTGCGGGCCGAACACACCGGGCGG
+GCTGGTGTCAGCTGATTACCGACACCGTGTCGCCGGCGAAGTTGGTGACATAGACCTCGCCGGTGACGGG
+GTTGACCGCCACCCCGGTCGGAGCGGTGCCGACGGTGATGGGGGAGCCGGTGACGGTGTTGGTGGTCGGG
+TCGATCACCGACACCGTGTTGCTGTCGAAGTTGGTCACGAAGACCAGGCCGGTGACGGGGCTGACCGCCA
+CCCCGCTTGGACCGTTGCCGATGGTGATGGGGGAGCCGGTGACGGTGTTGGTGGCGGGGTTGATCACCGA
+CACCGTGCCGCTGCCGAAATTGGTGACGTAGACGTTGCCGCCCGGGTTGACCGCCACCCCGTGCGGATCG
+TTGAAGCTGGCGTGGGTGATGGTGGTGACGGCGCCGGCGGCCCCACCGGCACCGCCGACCCCACCCGCAC
+CGCCGATACCGCCGACCGGGCCGCGGCCGGCACCGCCGGCCGTGCCGGCGCGGGCGAGGCTGACCGCGCC
+GCCGGTGCCGCCGGCCCCACCGTTGCCGATCAACCCGGCCGCCCCGCCGGCGCCGCCGGCCTGTCCGGGT
+GCCCCCGACCCGCCATTGCCGCCGTTGCCCCACAAGATGCCGCCGGCCCCGCCGGCCTGCCCGGTGCCGG
+GCGCCCCGTGGGCGCCGTCACCGATCAGCTTGCGCCCCACCAGCGCCTCAGTCGGCGTGTTGATCACCCC
+CAACAGGGCCTGCTCGATCTGCTGCAGCGGTGTTGCGCTGGCCGCTTCGGCGACCGCGTAGGTGCTGCCA
+GCTTGGCTTAAGGCCAGCACGAACCGTTCCTGATAGGCCGCGACCTGCGCGCTGATCGCTTGATAGTGCT
+GGCCGTGGCTGCCGAACAGCGCCGCGATCGCCGTTGACACCTCGTCTTGGGCGGCGACCAACACCTGGGT
+GGTCGCCGCCGCCGCGGTGTTGGCGGTGTTGATCGCCGAGCCGATCCGCGCCGCATCGGCCGCGGCTGTG
+GACACTAACTGTGGGGCCACGTTGACAAACGACATCGAAATCCTCCTGACCGCCACGATGTTGAGATGCG
+GGCGGCCCACCGCCTGTTACCCCTGCGGTGGGTAACCGTTTATTCGGACGATCCCTGCCGTTCCACGCCT
+GGGCGCAGGCGCAAACCGCACCAACATTGGTGGAACGTGGTGCACACTGCACCTGGGGTTCTGCCCTCAT
+CGTGTGTCAGCAGGCGAAACCCGCGCGGACGAGAACTCCTGCGTTAAGCAGCACAAATCGCTGCTCACGC
+TCACCGGTCAGCGCACTGAACCGGCCCCATGTCGACGACCGGTGAGGCGACCGCTCAACTCGTCGGCGTC
+AACTCGGCCATTGCCACCCTGGTCGCCGATTCCTGTCCCACAGCCCCACCACCATCGGGGCGACAACCGT
+GAACTGACGGTCACGCCCGGGCCCAACCCCGGCCCGGAATTGGGCCGGGCCGTCTTCAACCGGTATCCTC
+CACGTCATTGTCGACGCGATTGTCGCCGCGCCCACCTGCGTGCGGAAGCCCATACCAAAAGAGGAAGGCC
+CACCATGGCTGTGCCCAAGCGCAGAAAGTCGCGCTCGAATACCCGAAGCCGGCGCTCGCAGTGGAAGGCC
+GCCAAGACCGAGCTGGTCGGTGTGACCGTCGCCGGTCACGCCCACAAGGTGCCTCGGCGCTTGCTCAAGG
+CCGCCCGGCTCGGCCTCATCGATTTCGATAAGCGCTGACGCGCCGGCGGCCGACGATCATATGGCCGCCG
+AACACACCGAGCGCGCCGGCTCTCCGGTGATCACCGACACCGTGTCGTCGAGAGAGTTAGTGACGTAGAC
+CACGCCGGTGACGGGGTTGACCGCCACCCCTGTCGGGTCGAGTCCGACGGGGATGGGGGAGCCGGTGACG
+GTGTTGGTGGCCGGGTCGATCACCGACACCGTGTTGCTGAACTGGTTGGTGACGTAGATGTTGCCGCCTG
+GGTTGACCGCCACCCCATACGCACCGGTACCGACGGGGATGGAGCCGGTGACGGTGTTGGTGTTCGGGTC
+GATCACCGACACCGTGTTGCTGTCGAAGTTGGTCACGAAGACCAGGCCGGTGACGGGGCTGACCGCCACC
+CCGCTTGGACCGTTGCCGTCGGTGATGGAGCCGGTGACGGTGTTGGTGACCGGGTCGATCACCGACACCG
+TGTTGCTGCCCTGGTTGGTGACGTAGATGTTGCCGCCCGGGTTGACCGCCACCCCGTGCGGATCGTTGAA
+GCTGGCGTGGGTGATGGTGGTGACGGCGCCGGCGGCCCCACCGGCACCGCCGACCCCACCCGTACCGCCG
+ATACCGCCGGCCGGGCCGCCGCCGGCGCCGCCGGCGGTGCCGGCGCGGGCGAGGCTGACCGCGCCGCCGG
+TGCCGCCGGTCCCGCCGTCCCCGCCGTGTCCACCCACACCGATTAACCCGCCGTGACCACCAACCCCGCC
+GGTGCCACCGTCACCGCCGGCCACACCGAAGGTTGTGCCGGCTCCGCCGGCCCCGCCGACACCACCGGCC
+CCGCCGTTGCCGAACAGCCATCCACCGGCGCCGCCGGCTCCGCCGTTCGCGCCGGCCTCAAAGGGTAGGC
+CCTGGCCGCCAGCTCCGCCGGCCCCACCGTTGCCGATCAACCCGGCCGCACCGCCGGCCCCGCCGGCCTG
+CCCGGGTGCCCCCGACCCGCCGTTGCCGCCGTTGCCCCACAGCCACCCGCCGTTACCGCCGGCTTGCCCG
+GTCCCGTCGATCCCGTTCGCGCCGTCGCCGATCAATGGGCGCCCGGTCAGCGACTGAACGGGTGCGTTGA
+TCGCATCGAGCACGTTCTGCAGCGGTGTTGCGCTGGCCGCTTCGGCGACCGCGTAGGTGCTGCTAGCTTG
+GCTTAAGGCCAGCACGAACCGTTCCTGGTAGGCCGCGACCTGCGCGCTGATCGCTTGATAGTGCTGGCCG
+TGGCTGCCGAACAGCGCCGCGATCGCCGTTGACACCTCGTCTTGGGCGGCGGCCAACACCTGGGTGGTCG
+CCGCCGCCGCGGTGTTGGCGGTGTTGATCGCCGAGCCGATCCGCGCCGCATCGGCCGCGGCTGTGGACAC
+TAACTGTGGGGCCACGTTGACAAACGACATCGAAATCCTCCTGACCGCGACGATGTTGAGATGCGGGCGG
+CCCACCGCCTGTTACCCCTGCGGTGGGTAACCGTTTATTCGGACGATCCCTGCCGTTCCACGCCTGGGCG
+CAGGCACAAACCGCACCAACATTGGTGGAACGTGGTGCACACTGCACCTGGGGTTCTGCCCTCATCGTGT
+GGCAGCAGGCGAAACCCGCGCGGACGAGAACTCTTCCGCCAAGCAGCACAAATCGCCCTACTCTTGACCA
+CCAAACAAAACCCGTCCATGGGGCCAATGTGGCTGATGTGGCTAAACCTCGTCGAACAAACCCGCATACC
+ACGGCGCGCCTCTCAGGCCAGTCTCAGGCGCTGCGACGACACTGGTGTCCGTGCGAATTCTTGTCGTTGA
+CGACGATCGTGCGGTGCGCGAGTCGCTGCGCCGGTCGCTTTCCTTCAATGGCTATTCGGTCGAACTGGCC
+CACGACGGGGTTGAGGCGCTCGACATGATTGCCAGCGATCGCCCCGACGCGTTGGTCCTGGATGTCATGA
+TGCCGCGGCTGGACGGCCTCGAGGTGTGCCGTCAGCTCCGCAGCACCGGCGACGACCTGCCGATTCTGGT
+GCTGACCGCGCGCGACTCGGTGTCCGAGCGGGTGGCCGGGCTGGACGCCGGTGCCGACGACTACCTACCA
+AAGCCGTTCGCCCTCGAAGAGCTGCTGGCACGGATGCGGGCGCTGCTGCGCCGCACCAAGCCCGAGGATG
+CCGCCGAGTCGATGGCCATGAGGTTCTCCGACCTGACGCTGGACCCGGTAACCCGCGAAGTCAACCGTGG
+ACAGCGCCGGATCAGCCTGACCCGCACCGAATTTGCATTGCTGGAGATGCTGATCGCCAATCCGCGGCGA
+GTGCTGACGCGCAGCCGTATCCTGGAAGAGGTATGGGGATTCGACTTTCCCACCTCGGGCAACGCGCTGG
+AAGTCTACGTCGGGTATCTACGCCGCAAGACCGAGGCCGACGGCGAGCCGCGGCTGATCCACACTGTGCG
+CGGAGTGGGTTACGTGCTACGTGAAACACCACCCTGATGTGGTGGTTCCGCCGCCGAGACCGGGCGCCGC
+TGCGCGCCACCAGCTCATTATCCCTGCGGTGGCGGGTCATGCTGCTGGCGATGTCCATGGTCGCGATGGT
+GGTTGTGCTGATGTCGTTCGCCGTCTATGCGGTGATCTCGGCCGCGCTCTACAGCGACATCGACAACCAA
+CTGCAGAGCCGGGCGCAACTGCTCATCGCCAGTGGCTCGCTGGCAGCTGATCCGGGTAAGGCAATCGAGG
+GTACCGCCTATTCGGATGTCAACGCGATGCTGGTCAACCCCGGCCAGTCCATCTACACCGCTCAACAGCC
+GGGCCAGACGCTGCCGGTCGGTGCTGCCGAGAAGGCGGTGATCCGTGGCGAGTTGTTCATGTCGCGGCGC
+ACCACCGCCGACCAACGGGTGCTTGCCATCCGTCTGACCAACGGTAGTTCGCTGCTGATCTCCAAAAGTC
+TCAAGCCCACCGAAGCAGTCATGAACAAGCTGCGTTGGGTGCTATTGATCGTGGGTGGGATCGGGGTGGC
+GGTCGCCGCGGTGGCCGGGGGGATGGTCACCCGGGCCGGGCTGAGGCCGGTGGGCCGCCTCACCGAAGCG
+GCCGAGCGGGTGGCGCGAACCGACGACCTGCGGCCCATCCCCGTCTTCGGCAGCGACGAATTGGCCAGGC
+TGACAGAGGCATTCAATTTAATGCTGCGGGCGCTGGCCGAGTCACGGGAACGGCAGGCAAGGCTGGTTAC
+CGACGCCGGACATGAATTGCGTACCCCGCTAACGTCGCTGCGCACCAATGTCGAACTCTTGATGGCCTCG
+ATGGCCCCGGGGGCTCCGCGGCTACCCAAGCAGGAGATGGTCGACCTGCGTGCCGATGTGCTGGCTCAAA
+TCGAGGAATTGTCCACACTGGTAGGCGATTTGGTGGACCTGTCCCGAGGCGACGCCGGAGAAGTGGTGCA
+CGAGCCGGTCGACATGGCTGACGTCGTCGACCGCAGCCTGGAGCGGGTCAGGCGGCGGCGCAACGATATC
+CATTTCGACGTCGAGGTGATTGGGTGGCAGGTTTATGGCGATACCGCTGGATTGTCGCGGATGGCGCTTA
+ACCTGATGGACAACGCCGCGAAGTGGAGCCCGCCGGGCGGCCACGTGGGTGTCAGGCTGAGCCAGCTCGA
+CGCGTCGCACGCTGAGCTGGTGGTTTCCGACCGCGGCCCGGGCATTCCCGTGCAGGAGCGCCGTCTGGTG
+TTTGAACGGTTTTACCGGTCGGCATCGGCACGGGCGTTGCCGGGTTCGGGCCTCGGGTTGGCGATCGTCA
+AACAGGTGGTGCTCAACCACGGCGGATTGCTGCGCATCGAAGACACCGACCCAGGCGGCCAGCCCCCTGG
+AACGTCGATTTACGTGCTGCTCCCCGGCCGTCGGATGCCGATTCCGCAGCTTCCCGGTGCGACGGCTGGC
+GCTCGGAGCACGGACATCGAGAACTCTCGGGGTTCGGCGAACGTTATCTCAGTGGAATCTCAGTCCACGC
+GCGCAACCTAGTTGTGCAGTTACTGTTGAAAGCCACACCCATGCCAGTCCACGCATGGCCAAGTTGGCCC
+GAGTAGTGGGCCTAGTACAGGAAGAGCAACCTAGCGACATGACGAATCACCCACGGTATTCGCCACCGCC
+GCAGCAGCCGGGAACCCCAGGTTATGCTCAGGGGCAGCAGCAAACGTACAGCCAGCAGTTCGACTGGCGT
+TACCCACCGTCCCCGCCCCCGCAGCCAACCCAGTACCGTCAACCCTACGAGGCGTTGGGTGGTACCCGGC
+CGGGTCTGATACCTGGCGTGATTCCGACCATGACGCCCCCTCCTGGGATGGTTCGCCAACGCCCTCGTGC
+AGGCATGTTGGCCATCGGCGCGGTGACGATAGCGGTGGTGTCCGCCGGCATCGGCGGCGCGGCCGCATCC
+CTGGTCGGGTTCAACCGGGCACCCGCCGGCCCCAGCGGCGGCCCAGTGGCTGCCAGCGCGGCGCCAAGCA
+TCCCCGCAGCAAACATGCCGCCGGGGTCGGTCGAACAGGTGGCGGCCAAGGTGGTGCCCAGTGTCGTCAT
+GTTGGAAACCGATCTGGGCCGCCAGTCGGAGGAGGGCTCCGGCATCATTCTGTCTGCCGAGGGGCTGATC
+TTGACCAACAACCACGTGATCGCGGCGGCCGCCAAGCCTCCCCTGGGCAGTCCGCCGCCGAAAACGACGG
+TAACCTTCTCTGACGGGCGGACCGCACCCTTCACGGTGGTGGGGGCTGACCCCACCAGTGATATCGCCGT
+CGTCCGTGTTCAGGGCGTCTCCGGGCTCACCCCGATCTCCCTGGGTTCCTCCTCGGACCTGAGGGTCGGT
+CAGCCGGTGCTGGCGATCGGGTCGCCGCTCGGTTTGGAGGGCACCGTGACCACGGGGATCGTCAGCGCTC
+TCAACCGTCCAGTGTCGACGACCGGCGAGGCCGGCAACCAGAACACCGTGCTGGACGCCATTCAGACCGA
+CGCCGCGATCAACCCCGGTAACTCCGGGGGCGCGCTGGTGAACATGAACGCTCAACTCGTCGGAGTCAAC
+TCGGCCATTGCCACGCTGGGCGCGGACTCAGCCGATGCGCAGAGCGGCTCGATCGGTCTCGGTTTTGCGA
+TTCCAGTCGACCAGGCCAAGCGCATCGCCGACGAGTTGATCAGCACCGGCAAGGCGTCACATGCCTCCCT
+GGGTGTGCAGGTGACCAATGACAAAGACACCCCGGGCGCCAAGATCGTCGAAGTAGTGGCCGGTGGTGCT
+GCCGCGAACGCTGGAGTGCCGAAGGGCGTCGTTGTCACCAAGGTCGACGACCGCCCGATCAACAGCGCGG
+ACGCGTTGGTTGCCGCCGTGCGGTCCAAAGCGCCGGGCGCCACGGTGGCGCTAACCTTTCAGGATCCCTC
+GGGCGGTAGCCGCACAGTGCAAGTCACCCTCGGCAAGGCGGAGCAGTGATGAAGGTCGCCGCGCAGTGTT
+CAAAGCTCGGATATACGGTGGCACCCATGGAACAGCGTGCGGAGTTGGTGGTTGGCCGGGCACTTGTCGT
+CGTCGTTGACGATCGCACGGCGCACGGCGATGAAGACCACAGCGGGCCGCTTGTCACCGAGCTGCTCACC
+GAGGCCGGGTTTGTTGTCGACGGCGTGGTGGCGGTGTCGGCCGACGAGGTCGAGATCCGAAATGCGCTGA
+ACACAGCGGTGATCGGCGGGGTGGACCTGGTGGTGTCGGTCGGCGGGACCGGGGTGACGCCTCGCGATGT
+CACCCCGGAAGCCACCCGCGACATTCTGGACCGCGAGATCCTCGGTATCGCCGAGGCCATCCGCGCGTCC
+GGGCTGTCCGCGGGAATCGTCGACGCCGGGTTGTCGCGCGGCCTGGCGGGTGTCTCCGGCAGCACGCTGG
+TGGTCAACCTCGCGGGTTCGCGTTATGCGGTGCGCGATGGAATGGCGACGCTGAATCCGCTAGCGGCACA
+GATCATCGGGCAGTTGTCGAGCTTGGAGATCTGAATCCGGATCGAGTGTCGGGCTATTGCGATTCTGTGC
+TCGCGCGAGGCCCGTCGGTTGGCGATGGTGTCCCACGGCCGCCGTGCCTCCCCGGCGAGTCCCCGTTCGT
+TTGCGCGAGCAGATCGCGGATTTCGGTGAGCAGCACGACTTGGGTGTCGCCCGGCTGCTCGACCTCCCCC
+TTCTTGCGTAGTGTGTTGTAGGGCAGCACGACTAGGAAGTACACCGCGAACGCGATCAGGAAAAAGTTGA
+TCGCTGCCGACAACAAGACGTTCAAGTCAATGGTCTGACCACCGCCGATACCGATCCGCAAGATGCCGAC
+GTCGGACTGTGCGTTGACGCCGATCCGGTTGATCAGCGGCGTAATGATGCTGTCGGTGAACTTGGTGACC
+AACGCCGTGAACGCTGTGCCGATTACCACCGCGACAGCCAGGTCGACGATATTACCCCGCGCGAGAAACT
+CCTTGAATCCTTTGAGCATGCGATGTCCTTTCTGCAGTCGGCGGCCGGCAGTCCGCGAGTGGAACACCTA
+GAAAAACTAGACCAGGTGGTGTCAATGGCCACGACGCTGGGATCGCCGTTGCCATGGGGAGCTGACGCTG
+CCGGGATCCGGTGCTGTTGTTTGTTGACGGGATGCCCTTGACTTCGCTGACCGTGGTGTGCGCGTAACCG
+GCCGGTCGGGAACGCGGCGACGGATGGCGCGGTGGCCAGGACAGTGATCGAGATGACATCACGCCAACAA
+CGCCTTCAGCTGTGAGCGATCCGGGCTAGACTACCGCCGAAATATCCAACAAAGGACCTACATGAACCGG
+CAACCTATCGTTCAGCTGAGTAACTTGAGCTGGACATTCCGAGAAGGCGAAACCCGACGACAAGTCCTAG
+ACCACATCACCTTCGATTTCGAGCCCGGTGAGTTTGTCGCGCTGCTGGGGCAAAGTGGAAGTGGTAAAAG
+CACTTTGCTGAACCTCATCAGTGGCATAGAAAAGCCCACCACAGGTGACGTCACAATTAATGGGTTCGCT
+ATCACTCAGAAAACCGAGCGAGACCGGACGTTGTTCCGGCGCGATCAGATTGGCATCGTCTTTCAATTTT
+TCAACCTGATTCCCACTCTTACCGTGTTGGAAAATATTACGCTGCCTCAGGAACTGGCCGGAGTTTCTCA
+GAGGAAAGCGGCCGTGGTCGCTCGTGACCTTCTCGAAAAAGTGGGCATGGCCGACCGTGAACGCACCTTT
+CCCGATAAACTCTCCGGCGGAGAACAACAACGGGTCGCTATTTCCAGAGCGTTGGCGCATAATCCCATGC
+TGGTGTTAGCCGATGAGCCGACCGGCAACCTGGACTCCGATACCGGGGATAAAGTCTTGGATGTTCTGCT
+TGATCTCACCCGCCAAGCAGGTAAAACCTTAATCATGGCTACGCATAGCCCGTCGATGACGCAGCATGCC
+GACCGGGTAGTCAACTTACAGGGCGGCAGGTTGATACCTGCCTTGAACCGAGAAAATCAAACCGACCAGC
+CGGCCAGCACGATCCTATTGCCCACGTCATATGAATGACCAAGCTCCCGTTGCTTATGCACCACTATGGC
+GCACGGCGTGGCGTCGGCTGCGTCAGCGGCCGTTTCAATATATTCTGCTGGTCCTGGGAATTGCGCTAGG
+CGTTGCCATGATCGTGGCTATCGATGTATCCAGTAATTCGGCGCAACGTGCCTTCGATCTCTCTGCCGCG
+GCCATCACCGGAAAATCTACTCACCGGCTGGTCAGTGGCCCCGCCGGGGTGGACCAACAGCTTTATGTCG
+ATCTGCGCCGACACGGGTACGATTTTTCCGCTCCGGTAATCGAAGGCTATGTGTTGGCCCGCGGACTGGG
+AAACCGAGCTATGCAGTTCATGGGCACCGACCCATTTGCGGAGTCAGCTTTTCGCTCGCCTTTATGGTCC
+AACCAAAATATCGCCGAGTTGGGTGGCTTTTTGACTCGACCCAACGGTGTCGTGTTAAGCCGACAAGTGG
+CACAGAAGTATGGCTTGGCTGTGGGCGATCGCATTGCTCTGCAAGTGAAAGGTGCGCCTACCACAGTAAC
+CCTGGTGGGATTGCTGACACCTGCAGATGAAGTTAGCAATCAAAAATTGTCCGACCTTATCATTGCTGAT
+ATTTCCACGGCCCAAGAGTTGTTCCATATGCCCGGAAGACTGAGCCACATCGATTTGATCATCAAAGATG
+AGGCCACTGCAACACGCATCCAACAAAGACTGCCGGCCGGTGTGCGTATGGAAACGTCGGATACCCAACG
+GGACACCGTCAAACAGATGACGGACGCTTTTACGGTCAATTTAACCGCTCTCAGTTTGATTGCCTTGTTG
+GTGGGTATCTTTTTAATCTACAATACCGTGACATTTAATGTCGTGCAACGGCGACCGTTTTTCGCCATAT
+TGCGCTGTTTGGGTGTAACCCGAGAGCAGTTATTTTGGCTGATAATGACGGAATCCCTCGTTGCCGGGCT
+GATTGGTACGGGCTTGGGCCTCTTGATTGGAATTTGGCTCGGCGAAGGTTTGATCGGCCTGGTGACTCAA
+ACCATCAATGATTTCTATTTTGTCATCAATGTTCGCAATGTGTCCGTCTCCGCCGAAAGCTTGTTGAAGG
+GGCTGATCATCGGCATCTTTGCCGCCATGTTAGCCACACTGCCACCGGCTATAGAAGCGATGCGCACCGT
+CCCTGCCAGCACATTGCGGCGCTCCTCCCTGGAAAGCAAGATAACCAAGCTCATGCCGTGGTTGTGGGTG
+GCGTGGTTTGGTTTGGGTAGCTTTGGTGTATTGATGCTGTAGTTGCCGGGCAACAACCTGGTTGTGGCCT
+TTGTCGGTCTCTTTAGTGTGCTGATTGCCCTGGCGCTTATTGCCCCGCCGCTGACCCGGTTTGTAATGTT
+GCGCTTAGCTCCTGGCTTAGGACGGCTGCTCGGTCCAATAGGTCGAATGGCGCCACGCAATATTGTGCGC
+TCGTTGAGTCGCACCTCTATCGCCATCGCCGCCCTGATGATGGCCGTGTCCTTGATGGTAGGCGTCTCCA
+TATCGGTGGGGTCGTTTCGACAGACGCTGGCCAATTGGCTAGAGGTGACTTTGAAGTCGGATGTCTATGT
+GTCTCCGCCGACCTTAACATCCGGTCGCCCCAGCGGTAATCTGCCTGTGGATGCCGTCCGGAATATAAGC
+AAATGGCCAGGAGTGCGTGACGCAGTTATGGCTCGGTATAGTTCCGTTTTTGCCCCGGACTGGGGGCGTG
+AGGTGGAACTAATGGCGGTGTCGGGTGATATTTCCGACGGCAAGCGACCATATAGGTGGATCGACGGCAA
+TAAAGACACGCTCTGGCCACGTTTCTTGGCGGGGAAAGGGGTGATGCTATCGGAGCCAATGGTATCGCGA
+CAACACTTGCAGATGCCGCCAAGGCCGATCACGCTAATGACGGATTCGGGGCCACAAACGTTCCCCGTTC
+TGGCGGTTTTCTCTGACTACACCTCAGATCAAGGTGTGATTTTGATGGATCGCGCCAGTTATCGGGCCCA
+TTGGCAGGATGATGACGTGACGACCATGTTTCTTTTTTTGGCATCGGGTGCGAATAGCGGTGCCTTGATA
+GATCAACTACAAGCCGCGTTCGCGGGTCGGGAAGACATTGTTATTCAATCGACTCATAGTGTCCGCGAAG
+CATCAATGGTCATATTTGATCGTAGTTTTACCATTACCATCGCGTTGCAACTGGTGGCCACGGTGGTGGC
+TTTTATTGGCGTACTGAGCGCGCTGATGAGTTTGGAATTGGACCGGGCTCATGAGTTGGGTGTTTTTCGC
+GCCATTGGCATGACTACCCGCCAATTATGGAAGCTGATGTTCATTGAGACCGGCCTAATGGGCGGGATGG
+CCGGCTTGATGGCCTTGCCAACTGGTTGTATTCTAGCGTGGATTCTTGTCCGCATTATCAATGTCCGCTC
+ATTCGGCTGGACCTTGCAGATGCACTTTGAGTCGGCGCATTTTCTTCGAGCCCTGTTGGTAGCGGTGGTG
+GCCGCCCTGGCGGCGGGTATGTACCCCGCTTGGCGTTTGGGGCGGATGACGATTCGCACGGCGATTCGTG
+AGGAATGACGGTACATGAGAAAAGCAGGATTGACCGGTGTTGTACTGGTTCTGACGCTGACGCTGGTGGC
+TTTCTGGTGGTGGCAACGTCCGCGAACGAATGCTGTGGCTGCTGACTCTTTAGTTGGCGTTTTGGTCGAT
+GAGAATAACGCCGGATATTCCTTGGCCACAGTGCCGGGAGCCATTCGGTTTCCCCGGGATTTGGGTCCTC
+ATTACGATTACCAGACGGAATGGTGGTATTACACCGGTAATCTGGAAACTGCTGACGGTCGGCTTTTCGG
+CTACCAGCTTACTTTTTTCCGCAGGGCTCTCGCACCACCCGGCGAGGGGGTCGCCATAGCGGATGCTTCT
+TCATGGCGCACGACCCAGGTCTATATGGCCCACTTCGCGATAAGTGATATTTCGAACAGGGGCTTTGATC
+CGGCTGAGAAATTCAGTCGGCAGGCGTTGGGTTTGGCTGGTGCTAGCTCGGAGCCGTATGCGGTGTGGCT
+AGACGATTGGTATGCGCGTGAATCCAACAACAATTCGGTGCAATTGTTTGCTCGAACTCAGAACACGGTG
+TTGGATTTGACATTGACGCAAACGCTGCCGCCTATCTTGCAAGGAAATGCTGGGTTAAGTGTGAAAGGCG
+CGCAACCGGGAAACGCGTCCAACTACTACTCGTTAGTTCGTCAAGAATCGCGGGGCACTGTCAGTGTTAA
+TGGCGACACATTCATGGTTAGTGGTTTGAGCTGGAAAGATCATGAGTACATGACCAGTGCGCTGGCCCCT
+GAAGATGTGGGTTGGGATTGGTTCGGGCTCCAATTTTACAATGGCACCGCTTTGATGCTTTTTCAGATTC
+GACAGGCGGATGGGAGTGTGACCCGATTTTCCAGCGGTACCTTTGTTGCCGGGGATGGTGGCGTGATCCC
+TCTCGAGTCGTCCGATTTCCGCATCAAGACGACTGATCGTTGGACCAGTGACCAGAGTGGCGCCACCTAT
+CCGATTGCATGGGAAATCGAAATTGAACGGATAGGTTTGACGCTGCGCGGGGCCGCATTAATGGCTAATC
+AAGAACTGCGGTTATCGAGGACTTACTGGGAAGGGGCGGTTGCCCTTGAGGGTCGTTATCAAGGAATGCC
+GATCAGTGGTCGGGGATACGTTGAAATGACCGGCTATGTACAACGGCTGTCTTGAAGTCGGGTAATTGCC
+GGTGATTCTTGGTTTAGAGGCTCTCGAATGGTCGTCGGGCAGTTGTGATATCGCTGCAAACCCTAGAGTA
+CTTATTCGTCGTTGTGTCAACAGGTAGTTGCTGGGGTGTGTCGCTAGTCGCACGCAGATACCGCGTGGTC
+GATCAATGTCGCAAGGGCTCGGCGAGGTTGGCGGTCAGGCAAATAGGGGAGCTCCTCTCGCGCCTGTGCG
+GCATAGGCGGCTACCACATTCTTGGCCTTTCCTATGCCCGGTGAGCAACGCAGCAGTGTGAGGGCTTCGG
+CGACGTGGTCGTCGTGGATCGGTCCGGCCAGCAACTCACGCAGCCGGCTTGTGTCGGGTGTCTGCTCACG
+CAGCGCGTAGAGCATCGGCAGCGTGTGGACAGCTTGGCCAAGGTCGGCGCCCGATAGCGTAGCGGAGTCA
+CCGGAGATGGCGATGATGTCGCGCGAGATCTCAAACGCAGCACCGATCATGCGCCCCAAGCGCGCTACGC
+GGCGGATCTGCTCTTCGGCGGCGCCGGAGAGTGCCGCTCCGAGCTGTCCGGATGCTGCGATGAGAGAGCC
+GGTCTTCTCGTGCACGACTCGGAGGTAATGCTCGATCGTGTCGATATGCGAGGCGGGGCCCCGGGTCGCG
+CGCATCTGCCCGGTGATCAGCTCGGCGAACGCCTCGGCGACGACCGCGAAGGCCTCGGGGTCCAGCCGCG
+AGGCTAGCTGTGAGGCCGTCGCGAATCGGTAGTCACCGGCGAGGATTGCGAAGTTGTTGGTCCAGCGTGT
+GTTGTCGCTAGGTGTCTTGCGGCTCATGTCGGACTCATCCACGACTCTGTCGTGACAAAGCGTCCCCAGG
+TGCATCAACTCGATGGCTGCCCCCGCGACCGTGACCTCCCATCCGTCGGGGTCGGAGCCCAGTTGCGCCG
+CAAGCACCGTGAAAAGCGGTCTAAACGGGGTGCCGCCGGCGTCGACAAGGTGCGCCACCGTGTCGCGCAT
+AACCTCGTCGGCCTGGGAGAGTTCGCTATTGATCAGCTCTGTAATCCGGGCAATCCCGTCGTGGACGTTG
+GCGGTGAATTGCGGGTCACCCAGGCTGACTGCCGGGATCATGCTCGTGGCCGTAGGCATGCGCACAACAT
+TGACACGTGTACAAGATAAGGTATGGCGTGTTCAGTGCAGGGTCAGCGTCACCGTCTGACCCAGCGCCGC
+ACCGGCTACCGTATTGGCCAGCCGGGCTGGCAGCGCCACCAAAACGACCCGGTCACTATCAGCCGCCTGG
+GCCTTCTGCTGGGCCGAGACCAGGACCACGATGGCGTCGGTGGCCAAGAGCCGTAGAGCTGCCGGCGAAT
+CGGTTACCGGCGCGGCCAGCACGTCGACCACATCCCCGACCCGAACAAGGTCGACCAAAGCGCTGTCAGC
+CAGATGCAGCGGCACGATGCGGGCGTCCGGGCCGGCAGTCGACTCGGCCAACCGGCTGCCCAGTAAACGC
+ACGTCGGTGAGCACCTCGCCACGGCGTGTCGGGCTGGCCAGCGTCGAACCCACCACTGCGTCCAGGTCAG
+CTTGCGACCCGTCGGGAAGCGTGGTGGCCGAACGTTTTTCCAGCCTGACATCACCGGGAGTCAATGCGGT
+ACCGGGGCGCAGATCGTGCGCGGCCACCACCACCTCGGCGCGATCATCCTCTGGATTGGACCGCAGCGCC
+GCAACGCCGGCCAGCATGACCAGCCCGGCCGCGGCGAAGCGCCGGGCCCGCACGGTCCGGGTCCAGTCCG
+GGCGCAAAAACGCCGATATCCGGCTGACCAGGCTCGGATTCAGGGAGGATTCCGCCACACCGCAAACGGT
+AGGCGCAGCGCCGTGCTAGGCAGCGCCGGTCAGAAATCCCCTTGTGGATAACCTCTCAACTCAGACGGCC
+GCGGCGGCGGTTGTGGAGCTGGTTGACTTCTCGGTTGACCCCGAAGCCTTGCTTTCACTCGAGCCAGAAC
+TCCCCGAACTCCCCGAACTCTTCGTCGACTCGCTGGTCGAGGATCCGTTGGTCTGGCTCTTGGACTTCTT
+GCCCGACTCGCGGCTGTCGGTGCGGTAGAAGCCGGTGCCTTTGAACACCACGCCGACCGCATTGAACAGC
+TTGCGCAGCCGGCCAGAACACCGCTCGCACGTGGTCAGCGCATCGTCGGTGAAGGCCTGCACAACATCGA
+AGCGGTTGGCGCACTGGGTGCACTCGTAGCTGTAGGTTGGCACAAGAACCTCCGGAAATGTCACTCGGCG
+TTAGCACTCTACCGTCTCAAGTGCTAGAACCGCTAGGTGAGTTCCGTCATTCCCCGCACGGCAGCGCGAT
+CAGCCCGCGCTCCGGTGTGAGCGCATGAGTCATGGGTACGTCGTGCGGCTCCGACGGCAACACGTCGACC
+AGTTCGACAGTGCGCACCACCGCGACTAGACGAGCGTGCGGGTCGCGGCACCGCAGCGAGCGATCGTAGA
+AGCCGCGACCTCGGCCCAGTCGCACGCCCTGGCGGTCGACAGCCAGCGCCGGCACCAGCACCAAGCTGGC
+CTGCGCCAGCGCGGCTTCCGGCAGCCAAGGTTCGGGTGGTTCGAGCAGTCCCCAGCGTGCGCGCGCGAGT
+CCGCCGGCACGGTACTCGCCCCACCGCAACGGCAACGGGAGGTCACCGCCGGCGGTGCGCGCCACCGGCA
+ACAGCACTCGCCCCGCGCGGCGCAGCAACACATCCAACATCTCGATTGACCCCGGCTCGCCGCCTACCGG
+CACATACGCGCAGACGGTGCTGTCGCTGGTGACCATGCGCTCCAGGTGTCCACGCAACATCCGGGCCTCG
+GCGGCGCGCACGTCGTCGGCAACGCGGCGTCGGGCCGCCAGGAGCTGGTCGCGCAACGCCGACTTGCTCG
+CGATCGCCATGTCCTCAACGATGACACAGCCCCGGCCGTCCCGCGCGAGCGCCGGGACAGCGCCAACGAA
+GAGGCGGGCAATCAGCACGCTGCGGGTTATCGTGTGAACGATGTCACGCCCAGAAGTACTAACGCCGTTC
+ACGGCAATCGTCCCGGCAGCCGGCCTGGGTACGCGCTTTCTGCCGGCCACCAAGACGGTGCCCAAGGAGC
+TGCTGCCCGTCGTCGACACTCCCGGTATCGAGCTGGTGGCCGCCGAGGCGGCCGCGGCCGGTGCCGAACG
+GCTGGTGATCGTCACCTCCGAGGGTAAGGACGGGGTGGTCGCGCATTTCGTGGAAGACCTGGTGCTGGAG
+GGCACGCTCGAGGCCCGAGGCAAGATCGCCATGCTGGCCAAGGTGCGTCGCGCCCCGGCACTGATCAAGG
+TCGAATCCGTGGTGCAGGCCGAGCCGCTGGGACTGGGACACGCCATCGGCTGTGTGGAGCCGACGCTGTC
+GCCCGACGAAGACGCTGTCGCGGTGCTGCTGCCTGACGACCTGGTGCTGCCGACCGGCGTCCTGGAGACG
+ATGTCGAAGGTGCGAGCCAGCAGGGGCGGCACCGTGCTGTGTGCTATCGAGGTGGCGCGCGAGGAGATCA
+GTGCCTACGGGGTTTTCGATGTCGAGCCGGTCCCCGATGGTGACTACACCGACGATCCCAACGTGCTGAA
+GGTCAGGGGCATGGTCGAAAAGCCCAAGGCCGAAACGGCGCCGTCGAGGTATGCGGCGGCCGGCCGCTAC
+GTTCTAGACCGTGCCATCTTCGATGCGTTACGCCGCATCGACCGGGGTGCAGGCGGTGAAGTGCAGCTCA
+CCGATGCGATCGCGCTGCTGATTGCCGAGGGCCATCCCGTCCATGTCGTCGTCCACCAAGGGTCCCGACA
+CGACCTGGGAAATCCGGGCGGGTACCTCAAGGCTGCGGTTGACTTTGCATTGGATCGTGACGACTACGGC
+CCGGACTTGCGGCGATGGTTGGTGGCGCGACTGGGTCTGACAGAGCAGTAGCCTGGCGACGATACGGCAC
+GGACGGTTCCGGGGTGGGGGATGCCCGGCCCCATGGCTCGACGGAAAGGCGGGCGCTGTGCGTTCTGTGG
+AGGAGCAGCAGGCTCGGATATCGGCCGCTGCGGTAGCCCCGAGGCCGATACGCGTTGCGATCGCCGAGGC
+GCAGGGATTGATGTGCGCCGAAGAAGTGGTCACCGAACGTCCAATGCCCGGTTTTGATCAGGCCGCCATC
+GACGGCTACGCGGTGCGCAGTGTCGATGTGGCCGGTGTCGGTGATACCGGTGGTGTCCAAGTCTTTGCCG
+ACCACGGCGATCTTGACGGTCGCGACGTGCTGACCCTACCGGTGATGGGAACCATCGAAGCCGGAGCGCG
+CACCCTGAGCAGGTTGCAGCCTCGCCAAGCGGTCCGGGTGCAGACCGGCGCGCCGCTTCCCACCCTGGCC
+GATGCGGTCCTGCCGTTGCGGTGGACCGATGGCGGAATGTCTCGGGTGCGGGTGCTGCGCGGGGCGCCGT
+CGGGCGCCTACGTGCGGCGTGCGGGCGACGACGTGCAGCCCGGTGATGTGGCGGTGCGCGCGGGGACGAT
+CATCGGCGCAGCCCAGGTGGGGTTGCTGGCGGCGGTCGGCCGTGAACGGGTGCTGGTGCACCCTCGTCCG
+CGGCTGTCGGTGATGGCCGTCGGGGGCGAGTTGGTCGACATCTCGCGGACCCCGGGCAACGGGCAGGTTT
+ATGACGTCAACTCCTATGCCTTGGCTGCGGCGGGCCGGGATGCCGGTGCGGAGGTGAACCGGGTTGGCAT
+CGTCAGCAACGACCCTACGGAACTTGGCGAAATCGTCGAGGGCCAGCTCAATCGGGCTGAGGTCGTGGTG
+ATCGCCGGCGGGGTGGGCGGTGCGGCGGCAGAAGCGGTCAGGTCGGTGCTTTCCGAGCTCGGTGAGATGG
+AGGTCGTGCGGGTCGCCATGCATCCGGGATCCGTGCAGGGCTTCGGACAGCTCGGCCGTGATGGTGTACC
+GACCTTTCTGCTGCCGGCCAACCCGGTCAGCGCCCTGGTGGTCTTCGAGGTGATGGTTCGGCCGCTGATC
+CGGCTGTCGCTGGGTAAACGGCATCCGATGCGACGGATCGTGTCGGCGCGCACGCTGTCGCCGATCACGT
+CGGTGGCCGGGCGCAAGGGCTACCTGCGTGGCCAGTTGATGCGTGATCAGGACAGCGGCGAGTACCTGGT
+GCAGGCGCTGGGCGGCGCTCCGGGGGCGTCATCGCACCTGCTCGCGACGCTTGCCGAAGCGAACTGTCTG
+GTTGTGGTTCCCACCGGGGCCGAGCAGATTCGCACGGGTGAGATCGTGGATGTCGCCTTCCTGGCTCAGC
+ACGGCTGAGCCGAACCACGGCGACTCTGGTGAACTTATGGCGCTCGAATCCCCGGCATCCGGGATGGCCG
+ATGGCCGTCGGGCCGCTGCGGGTCTCGGCAGGCGTGATTCGGCTGCGGCCGGTGCGGATGCGTGACGGCG
+TGCATTGGAGCCGGATCCGGTTGGCCGACCGTGCACATCTTGAGCCGTGGGAGCCCAGCGCGGACGGCGA
+GTGGACCGTCCGGCACACGGTTGCTGCCTGGCCGGCGGTGTGTTCGGGTCTGCGTTCGGAGGCTCGCAAC
+GGCCGCATGCTGCCGTACGTGATCGAGCTGGATGGGCAGTTCTGCGGCCAGTTGACCATCGGCAATGTCA
+CCCACGGGGCCTTGCGGTCGGCCTGGATCGGCTATTGGGTACCAAGCGCGGCCACTGGCGGAGGGGTGGC
+CACCGGAGCGTTGGCGTTGGGTCTCGACCACTGCTTCGGTCCGGTCATGCTGCATCGAGTCGAGGCCACC
+GTGCGCCCGGAGAATGCGGCCAGTCGCGCCGTGCTGGCAAAGGTTGGCTTCCGCGAGGAGGGGCTGTTGC
+GCCGTTACCTTGAGGTTGACCGGGCATGGCGAGACCATCTGTTGATGGCGATCACCGTCGAAGAGGTTTA
+CGGGTCGGTGGCCTCGACGCTGGTCCGTGCCGGGCATGCCAGCTGGCCCTAACGCGGAATCGCAACCAAA
+CTGTGACTGGCGCGACACGTGTGGCGTGTGGTGCTTGTGAGAGATGAATTACAGGTGTGTAATTGCCCTG
+GGCGCTTTGACCCGGCCGCGCTGGCCAACGATGGGGCCTCGCGGGGATCGGAACCGAAGAGAGCAGGTCA
+TCATGCCAAGCATCCCGCAGTCGTTGTTGTGGATATCGCTCGTGGTGCTCTGGCTGTTCGTGCTGGTTCC
+CATGCTGATCAGCAAACGTGATGCCGTTCGGCGCACCAGCGATGTGGCTTTGGCGACTCGGGTACTCAAC
+GGTGGCGCTGGTGCGCGCCTGCTCAAGCGAGGTGGTCCCGCCGCGGGACATCGCTGGGGGTACCTCCCGC
+CCGAAGGGCAGGGGGACGACCCGGACTGGAAGCCGGAGGAAGACTGGCGCGACGACCCGGTCGAGGGCGG
+GTTCGCCGACGTCGAGCATGACATCGACGAGGACCAGGAGGCCGACGATGCGCGCCGTCGGGGTGCGGTT
+GTCATGAAGGTTGCCGCTCCGCAGACCGCAGGTGCCGACGAGCCGGACTACTTAGACGTCGATGTGGTCG
+AAGAAGACTCGGAGGCGCTTCCGGTGGGGGCTGGCGCTGCGGTCGGCGAGTCCGCCGACGAGGCCGATGC
+CGAAGCTGCTGACGGAGTTGCGGGCCACGCCGACCCGGAGGCCGACCCGGTCGAATACGAATACGAATAC
+GAATACGTCGAGGACACCTGCGGTTTGGAGCTCGAGGAGGACGACCAGGAAGCGCCACCGACCGTCGCAT
+CCGGCACGTCACGGCGGCGCCGATTCGACACCAAGACCGCCGCCGCGGTCAGCGCCCGCAAGTACACCTT
+CCGCAAACGTGCGTTGATCGTGATGGCGGTGATCCTGGTTGGCTCTGCCGCCGCGGCCTTCGAGCTGACC
+CCGGTCGCGTGGTGGATCTGTGGTAGCGCCACCGGTGTGACGGTGCTCTACCTGGCATATTTGCGTCGGC
+AAACCCGCATCGAGGAGAAGGTGCGTCGGCGGCGGATGCAGCGGATCGCGCGGGCGCGGCTCGGTGTACA
+GAACACCCGTGACCGCGAGTACGATGTGGTGCCGTCGCGGCTGCGCCGTCCGGGCGCGGTGGTCCTGGAG
+ATCGACGACGAGGACCCGATCTTCACGCACCTGGAGAGCGCGGCCCCGATACGGAACTACGGCTGGCCCA
+GGGACCTGCCCCGGGCGGTGGGTCAGTAGGGCGCGCAGTTCGGCCATCGGCGCCGCTGCTGGTAGCCTGC
+TACCGATCAGGGGCTATGGCGCAGTTGGTAGCGCGACTCGTTCGCATCGAGTAGGTCAGGGGTTCGAATC
+CCCTTAGCTCCACCATCTAATCAGTAGCCATCGGCAGCCTCGTTGGCTGTGCCGCCGCGGACGTGGTTGA
+GACGGCGAGCACAGCCCTCGGGGCAATCCTGGCAGGTCGCAATGCGGTGGTGCCGCCACGGTGTCCACGT
+CGAGGCGCCGGCCTTGTGGTACCGGTAAAGTGCTGTGGCGACCGCGATCTGGCGCGAAGCCTGATGAAGA
+TCGAATATTCGGCTGAATATTCGCTAAGACATGTGTGGCGGCGTCCGATCCTGTCACAACCTGCCCCTAG
+GGTCGGTGCATGAGCACGAAATACTACCTGCAGAAGGTCCCTGTCGAAGCCGTCCAGCCGGGCTTTTCGC
+TGGCCATTCCACACGATGGCGACTATCGCCTTTTCCAGGTCGACTGCACGCAAATGTGCCAGCGAAGTGG
+CCAGCCGGTGATGATCAGACTCATGTCGGAGTCCGTCGATGGTGGCCAGCCGTGGGTCTTGGAATATGAA
+GCGGGCACGGCGGTAATCCGGCTTCTCGGTGTTTGCCAGGCCGCTTCGTAGGGTGGCGTGTGCTCGCTAA
+CCGGGCTTGGCGGCGGCTACAAACGGCAACGCGCGTTGTGTCTACTGCTCGACGTCCACTAGCCCGGCCG
+ACCGAGACAGGTTGACGAAGGCATTCCGGTCAAACATCGTGAGTCCGATGTTGCCGGCGGCGGCGTTCGG
+CGCGTAGCGCATCGGCGGGCATTGGCCGGCATAGCTGGTGTGGATCGTGATCCGCCCGGCTGGCCGCAGC
+ACTCGCACCTTCTCGCGGGCGATCCGGAACGGTTCCGGCATCAGCTACAGCGCGCCGAAACAACAAACAG
+CATCGAATGTTTCGTCGCCGAATGGCACCATGCGGGCGTGGCCGCGGATATGACACGTCCGTGGCCCACG
+GTTGTCCAGGGCGGTGCTGGTCAGCGTCGGCGCAGAGATGTCGAACCCGACCGCAAGACCCCCGTCCGGT
+GGATGTCCGGACAGCGGCTCAGTGAAATTACCTGGCCCACAACCGATATCGAGCACTCTGTGGGCGCGGC
+CGAGGTGCAGAGACACCGCGGCGCGGTGCCGCTCGGTTCGGGTGGTGATGCGGCTGGCAAGGTGGAAGGA
+GGCCGGACGCCACAACCGTTCGTACAACCGTAAGCTGGGCTTGGCGCCGGGCCGGATTGGACGGGATAGC
+CGAATTGACCGGCGCACGAGTCGAAGATCTTGCGGGGATGGACGTCTTTCAGGGATGTCCGGCCGAGGGT
+CTGGTGTCATTGGCGGCGAGCGTTCAGCCGTTGCGGGCCGCTGCCGGCCAGGTGCTGCTGCGGCAGGGCG
+AGCCGGCGGTTTCGTTTCTGCTTATCTCGTCGGGTAGCGCAGAAGTCAGCCATGTTGGCGACGATGGTGT
+TGCGATCATCGCTCGGGCGCTGCCGGGCATGATCGTCGGCGAAATCGCGCTGCTGCGCGATAGCCCGCGC
+AGCGCGACGGTCACCACCATCGAGCCGCTGACCGGCTGGACGGGTGGCCGCGGCGCTTTCGCCACAATGG
+TGCACATCCCCGGGGTCGGTGAGCGATTGCTGCGCACCGCCAGGCAGCGTCTCGCCGCCTTCGTCTCCCC
+GATTCCGGTACGGCTTGCCGACGGGACTCAACTGATGCTACGCCCCGTGCTGCCCGGTGACCGCGAGCGG
+ACCGTGCACGGACACATCCAGTTCTCCGGCGAGACGCTGTATCGACGGTTCATGTCGGCTCGTGTTCCCA
+GTCCGGCGTTGATGCACTACCTGTCGGAAGTCGACTACGTCGACCACTTCGTCTGGGTGGTGACCGACGG
+AAGCGACCCCGTAGCCGACGCGCGTTTTGTGCGGGATGAAACCGATCCGACGGTCGCCGAGATCGCGTTC
+ACGGTTGCCGACGCGTATCAGGGCAGGGGGATTGGAAGCTTTCTCATCGGTGCGTTGTCCGTGGCCGCCC
+GGGTCGACGGCGTCGAAAGGTTTGCCGCGCGCATGCTTTCCGACAATGTGCCGATGCGAACGATCATGGA
+CCGCTACGGGGCGGTGTGGCAGCGCGAGGACGTCGGAGTCATCACCACCATGATCGATGTGCCGGGTCCG
+GGTGAGCTGAGCTTGGGGCGCGAGATGGTCGACCAGATCAACCGGGTAGCCCGGCAAGTGATCGAGGCCG
+TCGGCTGATCACCGACCCCGGGTCGGTGCGTCCGCCGCTGGCACCGCAGTTCGCCGCTGATCTGCTAGTC
+AAAACGGTGTCGACGTTGCGCAGCTCAGGGGCTGCGTTGGGTAGATTGACCACGATGCGCAAGGCGGTAC
+TGGCAGTCGGATCGGTGTGCTGGCTTGTCGGCTGCTCATCAGGGGCCAGCTCCACCACCGCCTCGACCGG
+CGACATCGCCAAGGTGGCCGAAGTGAAGTCGGGCTTTGGACCTGAATACACCGTCACCGATGTCACTCCC
+AGGGCCATCGATCCCGGGTTCTTTTCCGCCCGCAAACTGCCCGACGGGCTGAGTTTCGATCCGGCGAACT
+GTGCGCAAGTGGCGGCCGGGCCCCAGCTGCCGACCGGGTTGCAGGGCAACATGGCCGCCGTCTCCGCCGA
+GGGCAACGGCAACCGGTTCGTCGTCATCGCGGTGGAGACGTCCCAGCCGCTGCCGGCCCCCAGCCCCGGG
+AAAGACTGCAGCAAGGTGACTTTTTCCGGGACGCAGCTGCGGGGCGGCATCGAGGTGGTCGATGTACCGC
+ACATCGACGGGACACAGACGCTGGGCGTGCATCGCGTGTTGCAGGCGGTCGTCGGCGGGTCAGCGCGCAC
+CGGCGAGCTCTATGACTATTCCGCTCGGTTCGGGGACTACCAGGTGATTGTCATCGCCAATCCACTGGTA
+ATCCCTGGACGGCCGGTTGCGCGGGTCGATACGCAACGCGCCCGCGATCTGCTCGTACAGGCGGTGGCCG
+CGGTCCGGGGTTGACCGAGTTAGCGGACGTCGCGCGGCCGGAACTGGATGCTCACGCGCGGACCCGTCGG
+CGCCGATGTCTTGGGCACCGCATGCTCGAAGGTGCGTTGACACGATCCGCCCATCACCAATAGATCGCCA
+TGCGCCAACGGCAGTCGCAACGATGGACCGCGGCCACGCGGCCGCAGCGCGAAGACGCGGGTGGCGCCGA
+GGCTGACGATCGCCACCATAGTGTCCTCAGTGCTGCCGCGACCAATGGTGTCGCCATGCCAGGCGACGCT
+GTCAGAGCCGTCGCGGTAGTAGCACAGCCCGGCGGTGGTGAAGGGCTCACCCAGTTCGCCGCCGTAGATG
+TCGTTGAGCCGCCGGCGCATCCGCGCCAGCTGCGGATGCGGCGGATCTTCGATGGTCAGGTCGTGAAAAC
+TCACCAGCCGCGGCACATCGACCACCCGGTCGTACATCTGACGGCGCTCGGCTCGCCACGGCACCGTCGA
+CAACAACGCGTCCAGCAGTTCTTCGCCGCCGGTCAGCCAGCCCGAACGGATGTCGATAAAGGCTCCGTCG
+CCGAGCTGTCTTCGCTCGTTGTGCTCGAAGAGCGCGCCTTGAACCGCGATCGCCACGCCGCCAAGCTTAT
+CGCACATTCGTTCGATGGCGCCGCCCCGGCTACGGTTTGACCTGTGGGTGTCGAATTGGGGTCAAATTCC
+GAGGTCGGCGCGCTAAGAGTGGTCATCCTGCACCGCCCGGGGGCCGAACTGCGCCGGCTCACACCGCGCA
+ACACCGACCAGCTGCTGTTCGACGGCCTGCCCTGGGTATCCCGCGCGCAGGACGAGCACGACGAATTCGC
+CGAGCTGCTGGCTTCCCGCGGTGCGGAAGTGCTGTTGCTGTCGGACCTGTTGACTGAGGCACTACATCAC
+AGCGGGGCCGCCCGCATGCAGGGGATCGCCGCTGCCGTCGACGCACCGCGGCTGGGACTGCCGCTGGCGC
+AAGAGCTTTCGGCCTACCTGCGTAGTCTCGACCCAGGCAGGTTGGCGCATGTGCTGACGGCCGGCATGAC
+CTTCAACGAGCTCCCGTCGGACACGCGGACCGACGTGTCGTTGGTGTTGCGTATGCACCATGGCGGAGAC
+TTCGTCATTGAGCCGTTGCCGAACCTGGTGTTCACCCGCGACTCGTCGATATGGATCGGGCCGCGGGTGG
+TGATCCCGTCGCTGGCATTACGGGCACGGGTGCGCGAAGCGTCGCTGACCGACCTCATCTATGCTCATCA
+CCCGCGGTTCACCGGTGTGCGGCGTGCCTATGAATCGCGCACCGCTCCGGTCGAGGGTGGCGACGTGTTG
+TTGCTCGCCCCGGGTGTGGTCGCTGTCGGAGTGGGCGAGCGGACTACACCAGCAGGCGCGGAAGCATTGG
+CGCGCAGCCTTTTTGACGATGATCTTGCGCATACCGTGCTCGCCGTGCCGATCGCTCAGCAGCGCGCGCA
+AATGCATCTGGACACGGTGTGCACGATGGTCGACACCGATACGATGGTGATGTACGCCAACGTTGTCGAC
+ACGCTCGAGGCGTTCACGATCCAGCGCACACCCGACGGCGTGACCATCGGCGATGCGGCCCCGTTCGCGG
+AGGCGGCTGCCAAGGCGATGGGAATCGACAAGCTGCGGGTAATTCATACCGGAATGGACCCCGTCGTCGC
+TGAACGCGAACAGTGGGACGACGGCAACAACACGTTGGCGTTGGCGCCCGGTGTCGTTGTCGCCTACGAG
+CGCAACGTACAGACCAACGCCCGCCTGCAGGACGCGGGCATCGAAGTGCTTACCATCGCCGGCTCCGAAT
+TGGGTACCGGCCGTGGCGGGCCCCGCTGCATGTCCTGTCCGGCCGCCCGCGATCCGCTTTAGGAGTGGCG
+ATTTCGGCGCCTGGCGGCGCCGCAGATCACCGCCAGCTGGGCAGCCAGATCTCCAGGTTCCAGGTCTGTT
+GTGAGATTGGCAGACCGGTGAGCACCGGATACAGCCACGCAAAGTTCGTCACCACGAGGGCCACGTAGCA
+GCAGACGACGATCAGCCCCAGTGTGCGTCGTTCGGAGCCCTGACCGGGGTGATAGAGGATATCGCCGAGA
+ACCAGCGAAATGCCCATCACCAGAAATGGCGCCATGGTCGCTGCGTAGAAGAAGTACATCTGCCGGTCGA
+TGTCGGCGAACCACGGCAGCCAACCGGCGCAGTAGCCGACCAGGACCACCGCATAACGCCAGTCCCGGCG
+CACAAACATACGCCACCCCGCGTATGCCAGGACTGGCACCGCCAGCCACCACATCGCGGGCGTGCCGACC
+AGCATCTCGGCCTTGACGCACGACTGTGCGCCGCAGCCTGCAACGTCTTGCTGGTCGATGGCGTACAGCA
+CCGGCCGCAACGACATGGGCCAGGTCCACGGTTTGGATTCCCAAGGGTGGTAGTTGCCTGCGGAATTCGT
+CAGGCCCGCGTGGAAGTGGAACGCTTTGGCGGTGTAGTGCCAGAGCGAGCGCACGGCGTCGGGCAGCGGA
+ACAACCGAGTTGCGACCGACCGCTTGACCGACCGCATGCCGATCGATCGCGGTCTCGGACGCGAACCACG
+GAGCGTAGGTGGCCAGATAGACCGCGAACGGGATCAACCCCAGCGCATACCCGCTGGGAAGCACGTCACG
+CCGCACTGTCCCCAGCCACGGTCTTTGCACTTGGTACTGACGTCGCGCCGCCACGTCGAACGCCAGCGCC
+ATCGCGCCGAAGAACAGCACGAAGTACACGCCGGACCACTTGGTGGCGCAAGCCAATCCCAGCAGCACCC
+CGGCGCCGAACCGCCACCAGCGCACACCCACCCGCGGTCCCCACACGGTGGCGGCGCTGCGGCCGGCCAG
+CAGAGCGATGTGCATCCGTTCGCGAACCTGATCGCGGTCGACGATGAGCGCGCCGAACGCCGCGACGACG
+AAGAACGTCAGGAAGCCGTCCAGCAGCGCGGTCCGCGCGGTGACGAAGCTGACCCCGTCGCAGATCAGCA
+GCACCCCGGCGATGGCGCCGACCAATGTCGACCGGCTGATCCGCCGCACGATCCGCACCACCAGCGCCAC
+CAGGAGCACACCCAGCAGGGCGCCGGTGAACCGCCAGCCGAATCCGTTGTAACCGAAGATGGCCTCCCCG
+ATCGCGATCAGCTGCTTACCGACCGGCGGGTGAACCACCAGGCCGTACCCGGGGTTGTCTTCCACCCCAT
+GGTTGTTCAGCACCTGCCAGGCCTGGGGTGCGTAATGCTTCTCGTCGAAGATGGGGGTGCCGGCATCGGT
+CAGCGAGCCCAGGTTCAGGAACCGGGTCACCGTGGCCAGCAGCGTGATCAGGCCGGTCACGATCCAGCCG
+CGTAACCGGTCCAGGGGCCCGAAATCCGCGACCGGCACCAGCGGGCCGGGGCTGACGACGGGTACCACAG
+GCTCCTCGGGGCGGTCCTTGGCCAGGACACAGGATTCTGGGGGCCGGGCGGTCATCGGTGTCGATCGTAG
+GCTGTCCGTCATGTCCTCTGGTCGCCTGTTGCTCGGCGCCACCCCGCTGGGCCAGCCGTCGGATGCGTCA
+CCACGCCTGGCGGCCGCGTTGGCCACCGCCGATGTGGTGGCGGCCGAGGACACCCGGCGGGTGCGGAAAT
+TGGCCAAGGCTCTTGACATCCGGATTGGTGGACGGGTGGTCAGCCTGTTCGACCGGGTGGAGGCGTTGCG
+CGTGACGGCCCTTCTCGACGCGATCAATAACGGTGCGACGGTGCTGGTGGTCAGTGACGCCGGGACCCCG
+GTGATCAGCGATCCCGGCTATCGGCTGGTCGCGGCGTGCATCGACGCGGGGGTTTCGGTGACGTGTTTAC
+CCGGGCCGTCCGCGGTGACCACCGCGCTGGTGATGTCCGGTCTGCCGGCGGAGAAGTTCTGCTTCGAGGG
+TTTCGCCCCGCGCAAGGGTGCGGCGCGCCGGGCCTGGCTGGCCGAACTGGCCGAGGAGCGGCGCACCTGT
+GTTTTCTTCGAATCCCCGCGCCGGTTGGCTGCGTGCCTTAACGATGCCGTCGAGCAGCTCGGTGGTGCCC
+GTCCGGCGGCGATCTGCCGGGAGCTGACCAAGGTGCATGAGGAAGTGGTGCGCGGATCGCTTGACGAGTT
+GGCGATCTGGGCGGCCGGTGGTGTGCTCGGCGAGATCACCGTGGTGGTGGCGGGCGCCGCCCCCCACGCC
+GAACTGTCGTCGCTGATAGCCCAAGTGGAGGAGTTCGTCGCGGCGGGTATTCGTGTCAAGGACGCCTGCA
+GCGAGGTAGCGGCGGCACATCCGGGGGTGCGCACCCGCCAGCTTTACGACGCGGTGCTGCAATCACGGCG
+GGAAACCGGCGGGCCAGCGCAGCCGTAGTCGGTCAGGTTAGGGGATACACACCCCGATGGGACCGAATCC
+GGGTGTGCACAGACGCGACGGGAGCGCCGGCAGCGGAGGCGGTCCCGGCAGTGGGGGAGGTGCCGGCAAT
+GCGGGCACGGCCGGTAACGGCGGCAGACCCGCTGGCAGTGCCGGCAGGCCGGCCGCCAGCGCCGGCAGCG
+CCGCAGCCAGCGCCGCAGGATCCACGCCTGGCAGCGCCGGGAGGCCCGGCGGTAGACCACCTGCCGCCAG
+CGCCGGCAGCGCCGCAGCCAGCGTCGCCGGATCCACCCCCGCCAGACCAGCCGGCAGACCAGCGGCCGCC
+AGCATCGGCAGACCACCTGCCACCAGCGCCGTCAGCTCCGCCGGCGACATCCCCGCCAGACCCGGCAAAC
+TCGTCGGCAGACCGGCCGCGGCCGCCATCGCCATCAGGTCGGTCGGCGACACACCTGGCAGACTCGGAAA
+ACCCACGCCTGGCAGGCCGGCGGCCGCCGCCATCGCGAGCAGACTCGCCGGCGTCACGCCCGGCAGGGCG
+GGCAGCCCCACAGCCGGCAGAGCGGCCGCCGCCGATTGCGCCCCGGGCAGCAGCAGGGAGGCCACCGTGC
+TGGCTGTTCCGCGGGCCGTCGGCAGGATGCCGGAAGACTCCAGCGCGTTAACCGCAAGCACGAGATAGGT
+GACGGCCACCGCGCTCGCGGTCACCACCCCCGCCGCCGTGCCTCCCACACCCAGGACACCGTTCACGACC
+GCGGCAGCGGTGTTCACCCCGGTGATTGGGTCGGGTACGCCGGGGATGCCGATGCCCGGGATGCCGATGC
+CCGGGATGCCGATGCCCGGGATGCCGACGCCAGGTACGCTCGGCGCGGCCAGGTTCGGCAGGGCCGGTGG
+GGGAGGCAGGGCCGGGCCGGCCGCACCGGGAATGTTGGGTAGGCCGGGAACGGCTGGCGGGCCCACCCTG
+GGCACGGCGGCAGCCGCCGGTACACCCGGCCGCGGAACCAATCCCGGCGCGATCGTGTCGGCGACCGGCT
+CGAACGGCGCCGGCACCGCGTGCTCCGCTGCGGCCGGCCCCGATGGTGTCGCGGTGTCGGGCATCAGGAC
+CGCAGCCAGCCGATCGCACTGCTGGCCGGCGCTGCAGGTGCCGCCCGCGACCCGCTCCGGGGTGGACAAC
+GTCAACGGTGCCACCGCCAGCGTTCCCCCTATCGCGGCAGCAGCCGCGGTGCCCACGATCGCGAGTCTCA
+TTACAAACCCCTCTCGAACTCGACACGAGATAGACACGCGTCGATGGCCCGAGCTTAGGCGCACCCGGCA
+CACCATGTGGGCGTTATGCCAATTTCCGCCGCCCGCTGGGCTACCGCACTTTGCTGGCTAACCGAGCCGG
+GGTGGTGCGCGTGGCGGCCGGCAGCCCGACGATGGGAGCGGCTTTGTGCAGGCACTCCGCCCATTCGGCG
+TCCGGATCGGAGTCGGCGGTGATCCCGCCGCCAACGCCCAGCACGGCGTTGCCTGCGGTATCGAATTCGA
+CGGTGCGGATTGCGACGTTGAGCTCGCATCCGGCGACCGGTGACGCCAAACCGACTGTGCCGCAATATAT
+CCCGCGGCGATATCGCTCCCATTGTGAAATCAATTGGCGAGCCCGCAGTTTAGGTGTGCCGGTGACCGAG
+GCCGGCGGGAAGGCGGCGTCGAGCAGCGCTGACATCGGTTCCTCGAGCGGAACCCGCGCCGACACCGTGG
+ACACCAGGTGCCACACTCCCGGCGCTGGTCGCACCACCAACAGCTCGGGCACCGTCACGGTACCGGTAAC
+CGCTACCCGGCCGAGGTCGTTGCGGACCAGATCCACGATCATGATGTTCTCGGCCACCTCTTTGGCCGAT
+GCCCGCAGCGCCGACGGCGGGGCGTCCAGCGGCAGCGTGCCCTTGATCGGGCTCGATGTCACCACGGACC
+CGCGGCGGCGCAGGAATAGCTCCGGGGATAGCGATGCGACGGCTCCCCACGGTCCGGCGACAAAGGCGGA
+CCGGGACGGAGCGGTACGACCGAACCCGTCGATGAAGAAGTCCAGCGGGGATCCGGTGACCGTCCCGGCG
+AATTGGGTGCACACGCACGCTTGATAGACCTCGCCCGCGCCGATAGCTTCCAGACACGCCAGTACCCCGT
+CGCGGTGCGCTGCCCGGTCGGCCGGTTCCCAGTCGATCCGGCATGCCGGTGCCGGTCTGGCGACCGATGC
+CCGAGTGGTCGCCAACGCGCTGGCCAGCCAGTCCGCTATCGGCGCACCGGACAGGCTCTCATACCACCAC
+TGGCCGTCGCGGTCGCGGCGCAGCACGCAATCGGTCCAGCCGCCGGCGGCCTCGGGGATCCGGTGGGGTC
+GCCCGTCGGCGCCGGCGTCCGGGTAGGACAGGTAGCCGACCCAGCCGCCGCCCACCGCCCCGGTGGCATC
+GGGCCCGCCGGTGCCCGGCGGGCCCGAGAACACGTCGTCGCCGCTGACCGGTTGTATAGACACACTCGGT
+GCGATCACCGCCAGCGCACCGAACCATTCGCCGGTCAGCGCCGCCGGTGGTGGCAAGTCGAGTCGACTGG
+TGGCGCGGCCGACCGCCCGCAGCACCGCAGGCGCTCCGCCAAGATCGCCGAGTCGGTCGATTCGCACCGT
+TCTAGCTTGACAGAACTGTGGATTTTCGCAGCGCAAGTGGCTGCGTGGGGATTTCGTCCGCGTGCTAAGC
+TCCCACGCTAAGTTCGATCCGTGACCGGCTCCGGTCTCCGTCCCGGGGGGTGTTGCTGTGCGAGCAGCCA
+ATGCCAATGCCGTTTCTCGCTGACCGCGAGACGTTGACGCTCGGTGTGATCTTGAAGTAGCGATGGTTTT
+AAGAAGTAGGAAAAGCACGCTCGGCGTTGTCGTGTGCTTAGCGCTGGTGCTCGGTGGGCCGCTCAGCGGT
+TGCAGCAGCAGCGCGAGCCACCGCGGTCCACTGAACGCAATGGGAAGTCCGGCCATACCGTCGACGGCGC
+AGGAGATACCCAACCCGTTGCGCGGTCAGTACGAAGACCTCATGGAACCGCTGTTTCCGCAGGGGAACCC
+CGCGCAGCAACGCTATCCGCCTTGGCCCGCGTCCTACGACGCGAGTTTGCGAGTCTCCTGGCGGCAGCTG
+CAGCCTACGGATCCGCGCACTCTGCCCCCGGATGCTCCGGACGACCGCAAGTACGACTTCAGCGTGATCG
+ACAACGCGTTGACCAGGCTCGCCGACCGCGGCATGCGGCTGACGCTGCGGGTGTACGCCTACAGCTCGTG
+CTGCAAGGCTTCCTATCCGGACGGCACTAACATCGCGATTCCCGACTGGGAGCGCGCTATCGCCAGCACC
+AACACCAGTTATCCAGGGCCGGCGACCGATCCCTCGACCGGGGTGGTGCAGGTGGTGCCGAATTTCAACG
+ATTCGACCTATCTTAACGATTTTGCGCAGTTGCTCGCCGCGCTTGGTCGCCGCTACGACGGTGACGAGCG
+CCTCAGCGTGTTCGAGTTCTCCGGGTACGGGGACTTCAGCGAAAATCACGTCGCATACCTGCGCGACACG
+CTCGGTGCGCCGGGTCCGGGCCCGGATGAAAGCGTGGCGACCCTGGGCTATTACAGCCAGTTCCGTGATC
+AGAACATCACCACCGCGTCCATCAAACAGCTAATCGCGGCGAACGTCAGCGCCTTCCCGCATACCCAACT
+GGTGACCAGTCCCGCTAATCCGGAAATCGTGCGAGAACTGTTCGCCGACGAGGTCACCAACAAGCTTGCC
+GCGCCGGTGGGTGTCCGCTCGGATTGCCTGGGCGTCGACGCGCCGTTGCCGGCCTGGGCCGAGTCCAGCA
+CTTCGCACTATGTGCAGACCAAAGACCCGGTGGTCGCCGCGCTGCGGCAGCGGCTGGCAACGGCGCCGGT
+GATCACCGAGTGGTGCGAGTTGCCGACCGGCAGTTCGCCGCGGGCTTACTACGAGAAGGGCCTGCGCGAC
+GTCATCAGGTATCACGTGTCGATGACGTCGAGCGTTAACTTCCCCGACCAGACGGCGACCTCGCCGATGG
+ACCCCGCGTTGTACCTGGTGTGGGCGCAAGCTAACGCCGCCGCAGGCTATCGGTACTCGGTCGAAGCGCA
+GCCGGGGTCGCAAGCGCTAGCGGGCAAGGTCGCGACGATCTCGGTCACCTGGACCAACTACGGCGCTGCT
+GCCGCCACCGAAAAGTGGGTGCCCGGCTACCGGCTGGTGGATTCCACCGGACAGGTGGTTCGGACGCTGC
+CGGCAGCGGTGGACCTGAAGACGCTGGTCTCCGACCAGCGCGGCGATCGCAGCAGCGACCAGCCGACACC
+GGCGTCGGTCGCCGAGACGGTTCGCGTTGATCTGTCCGGCTTGCCCGCGGGCCACTACACGCTGCGGGCC
+GCGATCGACTGGCAACAGCACAAACCGAACGGCTCCCATGTGGTGAACTATCCGTCCATGCTGTTGTCCC
+GCGACGGCCGCGACGATTCCGGGTTTTATCCCGTCGCCACGCTCGACATCCCACGCGACGCGCAGACCGC
+GGTCAACGCTTCGTAGGTGGCTTTCCCGTCGCTGCGGTCCGCTCACTTGCCTTCGGGTGGTTGCGGCGGC
+TGGTAGCGGGGAAATACCCCGGTGGGCGGCGGCAGCGCTGTGCCGGGGGTCAGCCGAACACCTACGGCGG
+CGAACGACCGCTGGTTTGGGGCCTGGCCGAGCAGGTCCAAAATTTTGCCGGCCGACTCCGGCATCACCGG
+CTGGATCAGCAGTGCCGCGATGCGGACTACCTCGCAGGTGACGTAGAGCGTGGTGCGGAACCGGGCCTGA
+TCGGCTTCGGACTCGCTCTTGCGCAGTACCCACGGCTGCTGCACCGAAAAGTACTTGTTCGCGTCGCCGA
+GCATCAGCCAGATCGCCTCCAGCGCCAGGTGCATCGCCTGTGCGTCGAAGTGACCGCGCACTCGCTCCAA
+CAAGCCATCGGCGGTCGCAAGCAGCGCGGCGTCGGCGTCGGCGAACTCACCCGGGTTGGGCACCCTGCCG
+TCAAGGTTTTTGGCCACCATCGACAACGAGCGTTGGGCCAAGTTGCCGAGCTCGTTGGCCAGATCGGTGT
+TGATCCGAGTGACGATGGCCTCGTCGCTGTAACTGCCGTCCTGGCCGAACGGGACCTCCCGCAACAGGAA
+GTAGCGGACCTGGTCCACCCCGAGCGCTTCCGCCAGGGCAACCGGGTCGACGATGTTGCCCACCGATTTA
+CTCATCTTCTCGCCGCGGTTGTGCAAGAACCCGTGCGCGAAGATCCTTCGCGGCAACTCGATTCCGGCTG
+ACATCAAAAACGCCGGCCAATAGACGGCATGAAACCTGATGATGTCCTTGCCGATCATGTGCAAATCGGC
+GGGCCAGTAGCGGCGGAACAACTCCGAGTCGGTATCCGGGAAGCCCGCCCCGGTCAGGTAATTGGTCAGC
+GCGTCGACCCAGACGTACATGACGTGGTCGGGGTGCTCGGGCACCTGCACACCCCAGTCAAACGAGGTGC
+GCGAGATCGACAGGTCGTCCAGGCCGCCGGAGACGAAGCTGATCACTTCGTTGCGCCGCGTCTCCGGCGC
+GATGAAGTCGGGGTTGGCGTGATAGTGGGCCAGCAGCTTGTCGGTATAGGCCGACAGCCGGAAGAAGTAG
+GTCTGCTCCTCGGTCCAGGTCACCGGCGTGCCGGTCTCTACCGTCAGGCGCGTGCCGTCGACAAGTTGGG
+TCTCCGATTCGACGAAGAACCGCTCGTCGCGCACCGAGTACCACCCGGAATAGTTGTCCAGATAGATGTC
+GCCGGCCGCCGACATCCGTCGCCAGAGTTCCTTGGACGCCTCGTGGTGGTCGGCATCGGTAGTGCGGATG
+AATCGGTCGAAGGAGATGTTCAGCGCCTCCTGCATGCGCTGAAACACGTCGGAATTGCGCCGGGCAAGCG
+CCGCGGTGGGCACGCCCGCTGCCGCGGCGGCTTGTGCGACCTTCAGGCCATGCTCGTCGGTCCCGGTCAG
+GAAGCGCACGTCATAGCCATCCAGCCGTTTGAACCGGGCGATCGCGTCGGTGGCGATGTATTCGTAGGCG
+TGACCTACGTGGGGTGCAGCGTTGGGATATGCGATCGCGGTGGTGACGTAATAGGGCTTCATTTCGACAC
+CACCCTATTGTGTGCGGGTGAGCTCCGACCGCCCAGCCAGACGAGATCCACCGCCCGCTCCGGAACCCCT
+GGCGCCGTTGGTCGACGCCCACACCCATCTCGACGCGTGCGGTGCACGAGACGCCGATACGGTGCGGTCG
+CTCGTCGAGCGAGCCGCCGCGGCCGGCGTGACCGCGGTGGTCACCGTCGCCGACGACCTGGAGTCCGCGC
+GCTGGGTCACCCGCGCGGCCGAATGGGATCGGCGAGTCTATGCCGCGGTGGCGTTGCACCCGACCCGCGC
+CGATGCGCTCACCGACGCTGCCCGTGCCGAGCTCGAGCGATTGGTTGCCCACCCCAGGGTGGTGGCCGTC
+GGTGAGACCGGAATCGACATGTACTGGCCGGGTCGCCTGGACGGGTGTGCGGAGCCGCACGTCCAGCGGG
+AGGCCTTTGCCTGGCATATCGATCTGGCCAAGCGGACCGGTAAACCGCTGATGATCCACAATCGTCAGGC
+CGACCGCGACGTGCTGGACGTGCTGCGGGCCGAGGGCGCGCCGGACACCGTGATCTTGCACTGCTTCTCG
+TCGGACGCGGCGATGGCCCGCACGTGTGTGGACGCCGGGTGGCTGCTCAGCCTGTCCGGGACGGTGAGCT
+TCCGTAACGCCCGTGAACTACGGGAAGCCGTCCCGCTGATGCCGGTGGAGCAGCTTTTGGTGGAAACCGA
+TGCACCGTATTTGACCCCGCATCCCCACCGGGGCTTGGCGAACGAACCGTACTGCCTGCCCTATACCGTG
+CGGGCGCTGGCTGAACTGGTCAATCGGCGCCCCGAAGAGGTGGCGCTCATCACCACAAGCAACGCTCGCC
+GAGCTTATGGGCTAGGGTGGATGCGCCAATGAGCGCGCCGAGCGGCCCATAACACCCGCGCGCCGGAGTT
+GCTCAACATTGGCCGGTTCGTTACCGTCTTGTGATCGAACGGGTGGGGCCTCTAGGTTTCGGAGGGCCCA
+TTTTGCTTTTTGTTCGCTGTGTAGGTGGTTGAGTGTTGCCGAGGTCGGGGATATAGCGCGTTGACTCTAC
+TTACCAAACTTCATCAGACCCAATCACCGATGTTGCGCCTGGTAGTCGGTGCGCTGCTGCTGGTGTTGGC
+GTTCGCCGGTGGCTATGCGGTCGCCGCATGCAAAACGGTGACGTTGACCGTCGACGGAACCGCGATGCGG
+GTGACCACGATGAAATCGCGGGTGATCGACATCGTCGAAGAGAACGGGTTCTCAGTCGACGACCGCGACG
+ACCTGTATCCCGCGGCCGGCGTGCAGGTCCATGACGCCGACACCATCGTGCTGCGGCGTAGCCGTCCGCT
+GCAGATCTCGCTGGATGGTCACGACGCTAAGCAGGTGTGGACGACCGCGTCGACGGTGGACGAGGCGCTG
+GCCCAACTCGCGATGACCGACACGGCGCCGGCCGCGGCTTCTCGCGCCAGCCGCGTCCCGCTGTCCGGGA
+TGGCGCTACCGGTCGTCAGCGCCAAGACGGTGCAGCTCAACGACGGCGGGTTGGTGCGCACGGTGCACTT
+GCCGGCCCCCAATGTCGCGGGGCTGCTGAGTGCGGCCGGCGTGCCGCTGTTGCAAAGCGACCACGTGGTG
+CCCGCCGCGACGGCCCCGATCGTCGAAGGCATGCAGATCCAGGTGACCCGCAATCGGATCAAGAAGGTCA
+CCGAGCGGCTGCCGCTGCCGCCGAACGCGCGTCGTGTCGAGGACCCGGAGATGAACATGAGCCGGGAGGT
+CGTCGAAGACCCGGGGGTTCCGGGGACCCAGGATGTGACGTTCGCGGTAGCTGAGGTCAACGGCGTCGAG
+ACCGGCCGTTTGCCCGTCGCCAACGTCGTGGTGACCCCGGCCCACGAAGCCGTGGTGCGGGTGGGCACCA
+AGCCCGGTACCGAGGTGCCCCCGGTGATCGACGAAAGCATCTGGGACGCGATCGCCGGCTGTGAGGCCGG
+TGGCAACTGGGCGATCAACACCGGCAACGGGTATTACGGTGGTGTGCAGTTTGACCAGGGCACCTGGGAG
+GCCAACGGCGGGCTGCGGTATGCACCCCGCGCTGACCTCGCCACCCGCGAAGAGCAGATCGCCGTTGCCG
+AGGTGACCCGACTGCGTCAAGGTTGGGGCGCCTGGCCGGTATGTGCTGTACGAGCGGGTGCGCGCTGACC
+ATCCGGCTGCTCGGGCGCACTGAGATCAGGCGGCTGGCCAAAGAGCTCGACTTTCGGCCGCGCAAATCTC
+TCGGACAGAACTTCGTGCACGACGCCAACACGGTGCGACGGGTGGTTGCCGCCTCCGGGGTCAGCCGTTC
+CGACCTGGTTTTGGAGGTCGGGCCGGGCCTGGGATCGCTGACCCTGGCACTGCTCGACCGCGGCGCGACC
+GTCACCGCGGTCGAGATCGATCCACTACTGGCTTCTCGGCTGCAACAGACCGTGGCGGAGCACTCGCACA
+GCGAGGTTCACCGACTAACGGTGGTCAATCGCGACGTCCTGGCCCTGCGCCGGGAGGATCTAGCCGCGGC
+GCCGACCGCGGTGGTTGCCAATCTGCCGTACAACGTAGCGGTACCGGCGTTGTTGCATCTGCTTGTCGAG
+TTCCCGTCGATCCGTGTCGTGACGGTGATGGTGCAGGCCGAGGTCGCCGAACGGCTCGCCGCCGAGCCGG
+GCAGCAAAGAGTACGGCGTGCCCAGCGTTAAGCTGCGCTTCTTCGGGCGGGTTCGCCGCTGCGGCATGGT
+GTCGCCGACCGTTTTCTGGCCCATTCCGCGTGTCTATTCCGGGCTGGTACGCATCGATCGATATGAGACC
+TCGCCCTGGCCCACCGACGACGCTTTTCGACGGCGGGTATTCGAACTCGTGGACATCGCATTCGCGCAGC
+GGCGCAAGACTTCTCGCAACGCGTTTGTGCAGTGGGCGGGCTCGGGAAGCGAGTCGGCGAATCGATTGTT
+GGCGGCCAGCATCGACCCCGCCCGTCGCGGTGAGACGCTGTCCATCGACGACTTCGTGCGGCTGCTGCGA
+CGGTCCGGCGGCTCCGACGAGGCCACCAGCACCGGCCGGGACGCCAGGGCGCCGGACATTTCGGGGCACG
+CGTCGGCGAGCTGACGGGGCGCCGCCGCGTGTGGTCGGCGCGTCACAGCGATAGTCTGCTGCGGTGTCCG
+CATCTGACGGCAACACCGCTGAATTGTGGGTGCCCACCGGGTCGGTCACCGTTCGGGTGCCCGGAAAGGT
+CAACCTCTATCTGGCGGTCGGCGATCGCCGCGAGGACGGCTATCACGAGCTGACCACGGTATTTCATGCC
+GTCTCGCTGGTCGACGAGGTAACCGTTCGTAACGCTGATGTGCTCTCGCTCGAGTTGGTCGGCGAGGGGG
+CCGACCAGCTGCCGACCGACGAACGCAATCTCGCCTGGCAGGCGGCCGAGCTGATGGCCGAACACGTGGG
+CCGGGCGCCGGACGTCTCGATCATGATCGACAAATCCATTCCGGTCGCCGGCGGCATGGCCGGTGGCAGC
+GCGGACGCTGCGGCGGTCCTGGTTGCGATGAACTCGTTGTGGGAACTCAATGTGCCCCGCCGCGACCTGC
+GCATGCTCGCCGCGCGGCTAGGCAGCGATGTGCCGTTTGCCCTGCATGGTGGTACCGCGCTGGGGACGGG
+TCGCGGCGAGGAGTTGGCCACCGTGTTATCCCGCAACACCTTCCACTGGGTCCTGGCGTTCGCCGACAGC
+GGGTTGCTCACCTCCGCGGTGTACAACGAGCTCGACCGGCTCAGGGAGGTGGGGGATCCGCCCCGGCTTG
+GTGAGCCCGGGCCGGTTCTGGCTGCCTTAGCTGCGGGTGATCCGGATCAGCTGGCGCCGTTGCTGGGTAA
+TGAAATGCAAGCGGCCGCGGTGAGCCTGGACCCGGCGCTGGCTCGTGCGTTACGCGCCGGTGTGGAGGCC
+GGCGCGCTCGCAGGCATCGTGTCCGGTTCGGGTCCCACGTGTGCCTTCCTGTGCACCTCGGCGAGCTCGG
+CGATCGATGTCGGCGCGCAGCTGTCGGGGGCGGGAGTTTGTCGCACCGTTCGAGTCGCCACCGGGCCGGT
+ACCCGGCGCCCGCGTGGTGTCTGCGCCGACCGAAGTGTGACCGAATTCTTGGGAGCATGCCTCGGGCGGC
+CAGGGGTATCCGCGCGTGCCGAGGCCGGTGGGTCGATCGGCTGGCGCACCAGCATGCCAGCGGTAGGGCC
+GCAGGCATCCGCCCTCGCGGAGGTCGGTGGCGCGCATCAAAGCCAGGCGCAAAAGCCATACCATGATGCG
+ACAGAGCCGCTCGGCGAGAACCTCCGCTACCGGCCAGCTCACGGCGATAGCTGCATCAACGGCCATCGAG
+ACAACCCGTCGGCACGGGAATCCTCGCAGTTCACCGCGGGGAGTACGGCAAAGGCTGTGACCAAGCTGTG
+ACATCGCCCTCAAACCTCGGCAGAGTTTGGCAGCTACTTAAGAGTTGCTTAAGATAATCCGCGGTGTTGG
+GTCGTGGGCTCATCACCGAACCGAGACCCAACCGCTCCCCAACTGTGTGCGCGCGCCTGTCGCGATGTGG
+CATCCGGTAGGCGGACCATGAAAACCCGGACCTTGGGGACAGCACCGGAACCGAGGAGGTTGCCTTGAGC
+AGGTTCACCGAGAAGATGTTCCACAATGCCCGCACCGCGACGACGGGCATGGTCACAGGTGAACCGCACA
+TGCCCGTCCGCCACACCTGGGGCGAGGTCCATGAGCGTGCTCGTTGCATCGCGGGCGGCCTGGCCGCCGC
+GGGTGTCGGTCTTGGTGACGTTGTTGGGGTGCTGGCCGGCTTCCCGGTGGAGATCGCCCCCACGGCGCAG
+GCCCTGTGGATGCGCGGGGCCAGCCTGACCATGCTGCACCAGCCCACACCGCGCACCGACTTGGCCGTGT
+GGGCCGAGGACACCATGACCGTCATCGGCATGATCGAGGCCAAGGCCGTGATCGTCTCCGAGCCCTTCCT
+CGTGGCCATTCCCATCCTTGAGCAGAAAGGCATGCAGGTCCTTACCGTCGCTGACCTTTTGGCGTCGGAT
+CCGATCGGCCCCATCGAGGTCGGCGAGGACGACCTGGCGTTGATGCAGCTGACGTCCGGATCTACCGGCT
+CCCCTAAAGCCGTCCAGATCACCCACCGCAACATCTACTCCAACGCCGAGGCAATGTTCGTCGGCGCCCA
+GTATGACGTCGACAAGGACGTCATGGTCAGCTGGTTGCCCTGCTTCCATGACATGGGCATGGTGGGCTTC
+TTGACTATCCCGATGTTCTTCGGTGCGGAGCTGGTCAAGGTCACGCCAATGGACTTCCTGCGCGACACGC
+TGCTGTGGGCGAAGCTCATCGACAAGTACCAGGGCACCATGACCGCGGCGCCCAACTTCGCCTACGCGCT
+GCTCGCCAAGCGGTTGCGGCGCCAGGCCAAGCCCGGCGACTTCGATCTGTCGACCCTACGCTTCGCGCTG
+TCCGGCGCCGAGCCCGTCGAACCCGCCGACGTCGAGGACCTGCTCGACGCGGGCAAGCCGTTCGGCCTGA
+GGCCCTCAGCGATCCTGCCGGCCTACGGCATGGCCGAGACCACGCTGGCGGTGTCCTTCTCGGAGTGCAA
+CGCCGGCCTCGTCGTGGACGAGGTTGACGCCGACCTGCTGGCGGCTCTGCGCCGGGCCGTTCCCGCCACC
+AAAGGCAATACCCGCAGGCTGGCCACGCTAGGTCCGCTGCTGCAGGACCTAGAGGCCCGCATCATCGACG
+AACAGGGCGATGTCATGCCCGCCCGCGGCGTGGGTGTCATCGAGCTGCGCGGCGAGTCGCTAACTCCCGG
+CTACCTGACTATGGGTGGCTTCATCCCGGCCCAAGACGAGCATGGCTGGTACGACACGGGCGACCTCGGC
+TACCTCACCGAGGAGGGCCACGTGGTGGTATGTGGCCGCGTCAAGGATGTCATCATCATGGCCGGGCGCA
+ATATTTACCCGACCGACATCGAGCGGGCGGCCGGCCGCGTCGACGGCGTTCGTCCGGGTTGCGCGGTGGC
+CGTGCGTCTCGATGCCGGACATTCGCGCGAATCCTTTGCCGTCGCGGTCGAGTCGAACGCCTTCGAGGAT
+CCCGCCGAGGTTCGTCGCATCGAGCATCAAGTGGCCCACGAGGTGGTTGCCGAGGTCGACGTGCGGCCTC
+GCAACGTCGTGGTTCTTGGACCCGGGACCATTCCGAAGACGCCGTCGGGCAAGCTGCGTCGGGCCAACTC
+CGTCACCCTGGTCACCTAAGGCCGCCGAGCAGACGCAAAATCCCCTCGACACGCCGGTTGCGAGGGGATT
+TTGCGTCTGCTCACGCGGGTCGTTACCAGGCGTGGACGCGGTTTTGTGCGGGCTCCATGCCCTGTTCGAT
+AAGCAGCTCGGTGGCATCGGCGGCCTGCTCGCAGATCGTGGGGACCTCGGCGCGCTCGGCCGGGGTAAAG
+TTCTCCAACACAAACGCCGCCGGGTCCTTGCGGCCGGGCGGGCGGCCGATCCCGATACGCACCCGCTGAA
+AGTCTTTGGTACCCAGCGCGGCCACCACCGAGCGCAACCCGTTGTGGCCGCCTTCGCCGCCGCCGATCTT
+GAGCCGGATGCGGCCGAACTCGAGGTCAAGGTCGTCGTGGATGACGATGATGTTGGCCGGCGCCACCGAG
+TAGAACTTCGCCAGCGGCCCTATCTGGCGGCCGGACTCGTTCATGTAGCAGCGCGGCTTGGCCAAAACCA
+GGGAGCGCCCGGCTGATCTACCAGTGGCGACTTCGGCGCCGGAACGCTTGTGTGCCTTGAACTTCGCGCC
+TAGTCGCGCGGCGAGCAGATCGGCGACCACGAACCCGAGGTTGTGCCGGGTACGGGCGTAATTGGCTCCA
+GGGTTGCCGAGGCCGACCACGAGCAACGGCTCGGCCATGTCGCAAGCCGTCTACTCGGACTCGCCAGCGG
+CCTCGGCTTCGCCGGCTTCTACCGCGGCTTCCTCGGCTTCCTCGGCTCCTGCGACTTCGCCCTCCAGCTC
+CTCGGCGGTTGGCGCCTTCACCACGTTGACCACCAACAGATCAGGGTCAGAAATCAGGCTGACACCGGCC
+GGCAGCGCGATCTGCCCGGCGGTGAGCTGGGTGCCTGGTTCGGCACCTTCGATGGACACGGTCAACTGCT
+CGGGAATCGACAGCGCCTCGGCCTCGATCTCGATGCTGTTGGTCTCTTGGGTGACCAGGGTGTCGGGTCC
+GGCCTGGCCCTCGACGACCACGCTGACTTCGACGACGACCTTCTCGCCACGGCGCACGACCAGTAGGTCG
+GCATGCTGGATGGTGCGGCGGATCGGATGGATATGAAGTGCCTTGGTCAGTGCCAGCTGTTCCTTACCGG
+CGATGTCGAGGGTCAACACCGCGTTGGTGCCGGAATGCCGCAGTACGGCCGCATAGTCGTGTCCGGGCAG
+CTCCAGGTGCTGTGGCTCGGCGCCGTGGCCATACAGCACAGCGGGTATCTTGCCGGCGCGCCGGGCCCGC
+CGGGACGCGCCCTTGCCGGTCTCGGTACGCACCGTGACGCGCAGCTGGTTGCTTGCGGATTTGGCCATAT
+GTCGCTCCTGGGTGGCTCGGTTACCTCGTTTGGGGGCACGGCCAGGGTCGCGACAGCTTGTCGGCCTCCG
+TCGATAACGGTGTTCTGCCGGCCTGCTGTAGACCGCCGACCACCCTCGCCGTGACGCCCGGCTAGGCTAA
+CCCATGGCTACTGCATTGGGGAAATTCGATCCTTGTGAGCTGCTCGGATAGCTGTGCCCCAACCGTGCGG
+ACAATTACTTTGCCGCGACGACGAATCCGGCGATGATCGCCTCGATGTCGGAAGCGTGCTTGACGGCCTC
+GTTGGCCAGACTCGTGATGGTGAGCTGCACCAGGTAGCGCTGCTTGGCCGGCGCCGGTTGGGAAGACGAT
+CCGGTTCCAGGTGTGCAGTCGCCTGCCGTGCAGGTCATAACTGCCCTGAATCATCGAGGACGGAAACCCG
+TTGAAGTCTGCCGTCGAGGAGTCCAATTCGGTGAAGTTCGTCGACAGCCGGGCATCGGCAGTGCCATGCT
+TGAGCGCTTCGGCGATATCGAAGTCCCGGTGCAGCTTGAACACCATGAGCATGGCCGTTGGATAGCTTTC
+GCCCTTGGCGATCATCTCCGTGTTCGGGGTGATGTTCGGATTTTTCATCGGTGCCCAGCCCGGTGGTGTC
+GGAATCGACACGGTCAGGTCGGTCAGGCTGCTCGGTGCCACCGGCTCTCCGGTGACGCCGACGCTTTCCA
+GATACTTCCACAGCGGGACCGGCACTTCCGTCGTGGTCGAGACGGCGCTGGTGGTTGGGCTCGTGGACAA
+AATCGACTGGAAGTCAGGCGATTTCGGTCCGCAAGCGACCGCTGACATTGCCAGCGTGGCTACCGCGACC
+GCGACCGCCAAGGGTCTCACAGAATCTTGCGGACAGCGTCGACCGGCCAAGCCCGCCGGATGCCCTCAAG
+GATGACGGCTGCCATCTATGCGTCCCCGTCGAAAAGTCCTGTTACTGAGCCGTTTTCGAAGACCGCCCGG
+ATTGTGCTGGCCAGCAGCGGCGCGATGGACAAAACGGTGAGCTGGGGGAAGCGCTTGTCTTCGCCGATCG
+GGAGCGTGTTCGTGACGATCACTTCGCGGGCGCCGCAGGAGGCCAGCCGCTGCGCAGCGGGGTCGGAGAG
+CACGCCGTGGGTTGCCGCGATGATCACGTCACCGGCGCCGTCGTTGTGCAGCAATGCCACCGCGCCGGCG
+ATGGTGCCGCCGGTGTCGATCATGTCGTCAATCAGGACACAGGTGCGCCCGGCCACGTCGCCGACGACGC
+GGTTGGACACCACTTGGTTGGGTACCCGCGGATCACGGGTCTTGTGGATGAAGGCGAGGGGAACACCACC
+TAATGCGTCGGCCCACTTCTCGGCGATGCGTACCCGGCCGGAGTCAGGGGAGACGACCACCATGTTGCCG
+TCCGGGTAGTTGTCTCTGATGTAACCGGTCAGCAGGTTCTGACCGCGCATATGATCGACCGGCCCGTCGA
+AGAAACCCTGGATCTGGTCGGTGTGCAGGTCGACCGTCACGATCCGGTCGGCGCCCGCGGTCTTGAGCAG
+GTCGGCGATCAGTCGCGCGGAGATCGGTTCGCGGCCACGGTGTTTCTTGTCTTGCCGGGCATACGGATAG
+AACGGCATGACGGCGGTGATCCGTTTGGCGCTGCCCCGTTTGAGCGCGTCGATCATGATCAGCTGTTCCA
+TCAGCCACCTGTTCACCGGTGCCGGGCAGGATTGCAGGACGAAGGCGTCGCAACCGCGTACCGATTCGTG
+GAAGCGCACGAAGATCTCGCCGTTGGCGAACTCCCGCGCGTCCTGAGAGGTGACGTGGACGTCGAGCTCT
+TTGGCTACCTGCTCGGCCAGCTCCGGATGGGCGCGGCCGGCAAAGAGCATCAGGTTTTTGCGATTATCGG
+TCCAGTCGTGGCTCAACGCGCTGCCCTCGCCGTTTGGGATCGAATTGGATTACCCATGGTACGTAGCGCA
+CCGCCCGGATTTGTCGCCGGGTAGCCGGGATGCGACTTCACGGTGTCTGATCAGCGTCGGGTGGTTGTGT
+GGGCTGTTGGCAGGCCATTTCTGAGGCTCTTTTTGAGGCCTGAGCCGCTGGGCTGCCGGGGCGTTTGCGC
+TGCACCCAGTTCTCGATGTTGCGTTGCGGACCCGCCGACACTGCCAGCGCCCCCGGCGGGACATCCTCCC
+GCACCACTGTGCCGGCCCCGGTATACGCGCCGTCGCCGATGGTTACTGGGGCCACGAACATGGTGTCGGA
+CCCGGTCCGTACGTGCGAACCGACGGTGGTGCGCCGTTTGGACGTACCGTCGTAGTTGACGAACACGCTG
+GAGGCGCCGATGTTGCTGTACTCGCCGATGTCGGCGTCGCCGACGTAGGTCAGGTGCGGCACCTTGGTGC
+CGGTGCCGATGGTGGAGTTCTTGACCTCGACGAACGCGCCCAGCTTGCCGTCGGCGCCCAACGCGGTTCC
+GGGCCGCAGGTAGGTGAAGGGCCCGACCGCGGCGCCATCCCCAATCGACGACGACGAACCGTGGGTGCGC
+ACCACCGAGGCACCGTCGCCGACGGCGACGTCGGTCAGGGTGGTGTCGGGACCGACGACACAGCGACCGC
+CGATCTGGGTGCGGCCCAGCAACTGGGTACCCGGGTGAATGACGGTGTCGCGGCCGATGGTGACGTCGAC
+GTCGATCCAGGTGGTAGCCGGGTCGACGACGGTGACGCCGGCCAGCTGGTGAGCGGCCACCACCCGCCGG
+TTGAGTTCGGAGGCCAGCTGGGCCAGCTGGACGCGATTGTTGACGCCGGCCACCAACGCGCTGTCGTCGA
+CGTGGCTGGCATGTACGGTCTGGCCGTCGGAGCGCAAGATGGCGATGACGTCGGTGAGGTAGAGCTCCTG
+TTGGGCGTTGTTGGAGCTCAGCCGGCTCAGTGCGGACCGCAGCGCGGCGATGTCGAAGGCGTAGACGCCG
+GCGTTGACTTCGCGGATTTCCCGCTGCGATGGTGTCGCGTCGGTTTGCTCCACGATCGCCATGACTCCGT
+GATCCTGGGTGCGCAGGATGCGGCCGTAGCCGAAGGGATCATCCAGCGTCGTGGTCAGCACCGTCACCGC
+AGCCGACACCGCGCGGTGGGTGGCGATCAAGTCGGCCAGCGTGTCGGCGTCCAGCAGCGGGGTATCTCCC
+GAGGTGACCACGACGTTGCCGGCGTAGTCATCGGGCAGCGCGGACAGCCCGCAGAGTACCGCATGCCCGG
+TCCCTAGCGGTCGATCCTGCAGGGCGACGTCGATCGTTCGGCCTAGGGTGTCGGCGAGTTCACCGACTAG
+CGGCGCGATGCGCTGGTGATCGTGTCCCAGCACCACGATTAGACGCTGCGGCGCCAGCTTGGCGATCGCA
+TGCAGTACATGCGACAGCATGCTGCGACCGGCGAGTGTGTGCAGCACCTTGGGGGTGTCCGAACGCATCC
+GGGTCCCGGGCCCGGCCGCTAGGACCAGGACCGCGGTGTCACCAGGAAACGTCATCAACCCTCCTTGAAG
+CTCCGTCGCCAGGACTCGAACCTGAACTATCTGAACCAAAATCAGAGGTGCTGCCGATTACACCACGACG
+GATTGCACATCGATGTGACTTTAGACGGTGTCAACGCCGTCAGCACAGTCAACGCTGTCGCCGTCTACCC
+ACCGGCCCCACGCAAACCGATACCCTTGTTGATGTGGCCGGACCGGATAAAGGGCCGGATAAGGCGCCGG
+AAAACCCGACGCGGGTGACGCGCGCCAGGATGACGGGGACCGAGCGCCGTCACCAGCTCATCGGCATCGC
+GCGATCGCTGTTTGCCGAACGCGGTTACGACGGGACGTCGATCGAAGAGATCGCGCAGCGCGCCAACGTA
+TCCAAGCCGGTCGTCTACGAACATTTCGGTGGCAAGGAGGGCCTGTACGCGGTGGTGGTCGATCGGGAGA
+TGTCGGCGCTGCTGGACGGAATCACCTCGTCGCTGACCAACAACCGATCCCGGGTGCGGGTGGAGCGGGT
+CGCGCTGGCGTTGCTGACCTACGTCGAGGAACGCACCGACGGCTTCCGCATCATGATTCGCGACTCGCCG
+GCCTCGATCAGCTCGGGCACCTATTCCAGCCTGCTCAACGACGCCGTCAGCCAGGTCAGCTCGATTCTGG
+CTGGAGACTTCGCCCGGCGCGGCCTGGACCCGGACCTGGCACCGCTGTATGCGCAAGCATTGGTGGGTTC
+GGTGTCGATGACGGCGCAATGGTGGCTCGATGCGCGCGAACCGAAGAAGGAAGTGGTGGCCGCGCACCTG
+GTCAACCTGGTCTGGAATGGCCTGACCCACCTGGAGGCCGATCCGCGGCTACAGGACGAGTAGCGGGCGG
+GGAAGCCGGGCCCAATGTTGACTAACCTCGGCGCCCTAGAATGGCCGCATCATGACCGCACCGGGGCCTG
+CCTGCTCAGATACCCCGATCGCGGGGCTTGTCGAATTGGCGCTGAGCGCGCCGACATTCCAACAGCTCAT
+GCAGCGCGCCGGGGGTCGACCCGACGAATTGACGCTCATCGCGCCGGCCAGCGCGCGGCTGTTGGTCGCC
+AGTGCGCTGGCTCGGCAGGGGCCATTGCTGGTGGTCACCGCCACCGGGCGGGAAGCCGACGACCTGGCCG
+CCGAACTGCGTGGTGTGTTCGGGGATGCGGTGGCGTTGTTGCCGTCCTGGGAGACACTGCCGCACGAACG
+GCTCTCACCCGGTGTTGACACCGTCGGCACTCGCCTGATGGCGCTGCGCCGGCTGGCCCACCCCGACGAT
+GCCCAGCTGGGCCCACCGCTGGGGGTAGTGGTGACCTCGGTGCGCTCGCTGCTGCAGCCCATGACGCCGC
+AGCTGGGCATGATGGAGCCCCTCACGCTGACCGTTGGCGACGAATCCCCCTTCGACGGCGTGGTGGCGCG
+GCTGGTCGAGCTGGCATATACCCGGGTGGATATGGTCGGCCGGCGCGGCGAGTTCGCTGTGCGCGGCGGG
+ATTCTGGACATCTTTGCCCCGACGGCCGAACATCCGGTGCGGGTCGAGTTCTGGGGCGACGAGATCACCG
+AGATGCGGATGTTCTCGGTAGCCGACCAGCGCTCGATTCCGGAGATCGACATTCACACACTGGTTGCCTT
+CGCCTGCCGTGAACTGCTGCTGAGCGAGGACGTGCGGGCGCGGGCCGCCCAACTGGCCGCACGGCATCCC
+GCGGCCGAGAGCACCGTCACCGGCAGTGCTTCCGACATGCTGGCGAAGCTCGCCGAGGGCATCGCGGTCG
+ACGGCATGGAGGCGGTGTTGCCGGTGCTCTGGTCCGACGGGCACGCGTTGCTGACCGATCAGCTGCCCGA
+CGGCACGCCGGTGTTGGTGTGCGACCCGGAAAAGGTGCGCACCCGCGCCGCGGATCTGATCAGGACTGGC
+CGTGAATTCCTGGAAGCCTCGTGGTCGGTCGCGGCGCTGGGAACTGCAGAAAATCAAGCCCCCGTCGACG
+TCGAACAACTGGGTGGGTCGGGGTTCGTCGAACTGGACCAGGTGCGGGCCGCGGCGGCCCGAACGGGTCA
+TCCGTGGTGGACGTTGAGCCAATTGTCCGACGAGTCGGCGATCGAGTTGGACGTTCGGGCCGCGCCGTCG
+GCGCGCGGGCACCAGCGTGACATCGACGAAATCTTCGCGATGCTACGTGCCCACATCGCGACCGGCGGGT
+ACGCCGCGCTGGTCGCGCCGGGCACCGGAACCGCACACCGCGTGGTGGAACGGCTGTCCGAGTCCGACAC
+CCCCGCGGGGATGCTCGATCCCGGCCAGGCGCCCAAGCCGGGAGTCGTCGGGGTGCTCCAGGGCCCGCTG
+CGTGACGGCGTCATCATTCCCGGCGCCAACCTGGTCGTCATCACCGAGACCGATTTGACCGGCAGCCGGG
+TCAGCGCCGCCGAGGGCAAGCGGCTGGCGGCCAAGCGGCGCAACATCGTCGACCCGCTGGCGCTGACGGC
+CGGTGACCTGGTGGTGCACGATCAGCACGGCATCGGCCGGTTCGTGGAGATGGTCGAGCGCACGGTCGGG
+GGCGCCCGCCGGGAGTATCTGGTGCTGGAGTATGCCTCGGCCAAGAGGGGTGGCGGGGCGAAAAATACTG
+ACAAGCTCTATGTCCCGATGGATTCGCTGGACCAGCTGTCGCGGTATGTCGGCGGGCAGGCGCCGGCGCT
+GAGCCGGCTGGGCGGCAGCGACTGGGCCAACACCAAGACCAAGGCGCGCCGCGCGGTGCGCGAGATCGCG
+GGCGAGCTGGTCTCGCTGTACGCCAAACGGCAGGCCAGCCCCGGGCATGCGTTCTCGCCGGACACGCCGT
+GGCAGGCCGAGCTGGAGGACGCGTTCGGCTTCACCGAGACCGTGGACCAGCTCACCGCCATCGAAGAGGT
+CAAGGCGGACATGGAAAAGCCGATCCCGATGGACCGGGTGATCTGCGGCGATGTCGGCTACGGCAAGACC
+GAGATCGCGGTGCGGGCGGCGTTCAAGGCGGTCCAAGACGGTAAACAGGTCGCGGTGCTGGTGCCCACCA
+CGCTGCTGGCCGACCAGCATCTGCAGACGTTCGGCGAGCGAATGTCCGGATTCCCGGTGACCATCAAGGG
+TCTGTCGCGGTTCACCGACGCCGCCGAGTCCCGCGCCGTGATCGACGGCCTGGCCGACGGGTCGGTGGAC
+ATCGTGATCGGCACCCATCGGCTGCTGCAGACCGGGGTGCGCTGGAAGGATCTGGGCCTGGTGGTGGTCG
+ACGAGGAGCAGCGGTTCGGCGTCGAGCACAAGGAGCACATCAAGTCACTGCGCACCCATGTCGACGTGCT
+GACCATGAGCGCCACCCCGATCCCGCGCACGTTGGAGATGAGCCTGGCCGGGATTCGCGAGATGTCGACC
+ATCCTGACGCCGCCCGAGGAGCGCTACCCGGTGCTGACCTACGTCGGACCGCACGACGACAAGCAGATCG
+CCGCGGCGCTGCGCCGGGAGCTGCTGCGCGACGGGCAGGCGTTCTACGTGCACAACCGGGTCAGCTCGAT
+CGACGCGGCCGCCGCCCGGGTGCGTGAGCTGGTGCCCGAGGCGCGGGTGGTGGTCGCGCACGGGCAGATG
+CCCGAGGACCTGTTGGAGACCACCGTGCAACGGTTCTGGAACCGCGAGCATGACATCCTGGTTTGCACCA
+CCATCGTGGAGACCGGCCTGGACATCTCCAACGCCAACACTTTGATCGTCGAGCGCGCCGATACCTTCGG
+GCTGTCCCAGCTGCACCAGCTGCGTGGCCGGGTGGGCCGCAGCCGGGAGCGCGGCTACGCCTATTTCCTC
+TATCCACCGCAGGTGCCGCTGACCGAGACCGCTTACGACCGGTTGGCGACGATCGCGCAGAACAATGAGC
+TGGGCGCGGGCATGGCCGTGGCGTTGAAGGACCTAGAGATCCGCGGTGCCGGCAACGTGCTCGGCATCGA
+GCAGTCCGGACACGTCGCCGGCGTCGGATTCGACCTGTACGTGCGGTTGGTCGGCGAGGCCCTGGAGACG
+TACCGGGACGCGTACCGGGCGGCCGCCGACGGCCAAACCGTGAGGACCGCCGAAGAACCCAAGGATGTGC
+GAATCGACCTGCCCGTTGACGCGCACCTGCCACCGGACTACATCGCCAGTGATCGGCTGCGGCTGGAGGG
+CTACCGGCGGCTGGCGGCCGCCTCCTCTGATCGCGAAGTGGCGGCCGTTGTGGACGAGCTAACCGATCGG
+TATGGGGCCCTGCCGGAGCCGGCCCGGCGGCTGGCGGCGGTGGCACGGCTGCGGCTGCTGTGCCGTGGCT
+CCGGCATCACCGACGTGACGGCGGCGTCGGCAGCGACCGTGCGGCTGTCCCCGTTGACGCTGCCGGACTC
+CGCCCAGGTGCGGCTGAAGCGAATGTATCCCGGAGCGCACTACCGTGCCACGACGGCCACCGTGCAGGTT
+CCCATTCCGCGAGCCGGTGGCCTCGGCGCGCCGCGAATCCGCGACGTCGAGCTGGTTCAGATGGTGGCCG
+ATTTGATAACCGCGCTCGCTGGGAAACCGCGCCAGCATATTGGTATAACGAACCCTAGCCCGCCAGGCGA
+AGACGGCCGTGGTCGCAACACGACGATTAAGGAGCGACAACCGTGATGATTGTCGTCCTGGTCGACCCCC
+GGCGTCCGACACTGGTGCCTGTTGAAGCGATCGAGTTCCTGCGCGGCGAGGTGCAATACACCGAGGAAAT
+GCCGGTCGCGGTGCCCTGGTCGCTACCAGCGGCTCGTTCGGCGCACGCCGGAAACGACGCGCCGGTGTTG
+CTGTCGTCTGACCCCAACCATCCTGCTGTCATTACTCGACTGGCCGCCGGTGCCCGGCTGATCTCGGCAC
+CGGATTCTCAGCGTGGCGAACGACTCGTCGACGCCGTCGCGATGATGGACAAGCTGCGCACCGCCGGACC
+GTGGGAAAGTGAGCAGACTCACGACTCGCTGCGCAGATACCTGCTGGAGGAGACCTACGAGCTGTTGGAC
+GCGGTCCGCAGCGGCAGTGTTGACCAGCTGCGCGAAGAGCTTGGTGATCTCTTGCTGCAGGTCCTCTTTC
+ACGCCCGGATCGCTGAGGATGCGTCGCAATCGCCGTTCACCATCGACGACGTCGCCGACACACTGATGCG
+AAAGCTCGGCAATCGGGCGCCAGGAGTACTTGCGGGCGAATCGATTTCGCTCGAAGATCAACTGGCGCAA
+TGGGAGGCAGCCAAGGCCTCGGAAAAGGCGCGAAAGTCGGTAGCCGACGATGTCCATACGGGCCAGCCGG
+CATTAGCGCTGGCGCAGAAGGTTATTCAGCGTGCCCAAAAGGCTGGGCTGCCCGCTCACCTGATCCCCGA
+TGAGATCACTTCTGTTTCGGTTTCAGCTGACGTAGATGCGGAAAACACGCTGCGCACTGCCGTTTTGGAC
+TTTATTGACAGGCTGCGCTGTGCCGAGCGGGCAATTGCCGTCGCACGCCGGGGCAGCAACGTTGCCGAGC
+AGCTCGATGTGACGCCGCTGGGTGTGATCACCGAGCAGGAGTGGCTCGCGCATTGGCCAACTGCTGTCAA
+CGATTCCCGCGGCGGGTCCAAGAAACGTAAAGGCATGCGATAACCGCCCCGAGTGCGACGGGGTAGTCAA
+CAAACCCATGGGACGATGATCGTGACGGAAGCCGGTATAGGTGCCCTACGAGGGAGAGTTGTGTCGCCGA
+GACGCTGGTTGCGGGCGGTCGCCGTGATAGGGGCGACCGCGATGCTGTTGGCGTCGAGCTGCACTTGGCA
+GCTGAGCCTTTTCATCCCCGACGGCGTGCCGCCTCCGCCCGGCGATCCGGTGCCGCCGGTGGATACGCAC
+GCCGGCGGCCGGCCCGCGGATCAGTTGCGCGAATGGGCGGAGAAACGTGCTGCGGCATTGGGAATTCCGG
+TCATCGCGCTGGAGGCCTACGCCTACGCCGCTCGCGTCGCCGAGGTCGAGAATCCCAAGTGTCATCTTGC
+GTGGACCACGCTGGCGGGCATCGGGCGGGTGGAGAGTCACCACGGAACCTACCGGGGCGCCACGATTGCG
+CCCAATGGGGATGTAAGCCCCCCGATTCGGGGCGTCCGCCTCGACGGCACCGGCGGCACCCTGCGCATCG
+TGGACAGGGACGGGGGCGGCCTGGACGGTGACGCCGCGGTGGAGCGTGCGATGGGGCCAATGCAGTTCAT
+TTCGGAAACCTGGCGGTTGTACGGGGTCGCTGCCAGAAACGACGGCATCGCCAACGTCGACAACATCGAT
+GATGCTGCCCTCTCGGCAGCGGGCTATTTATGCTGGCGTGGAAAGGATCTCGCGACACCGCGAGGGTGGA
+TAACCGCGCTGAGGGCCTACAACAACTCCGTTATCTATGCGCGGGCGGTCCGGGACTGGGCGACCGCGTA
+TGCGGCGGGTCATCCGCTGTAGCAGGATGAACCGCTAACCCAGGCTTTACGCTAACAGCGGTCGGGGCCA
+GCCAACCCAAGACCGTCCGTGCAGCAGCTACGACGCAAGGAGAACCCAGTGCCGATTATCGAGCAGGTTG
+GGGCCCGAGAGATCCTCGATTCCCGCGGCAACCCGACGGTGGAGGTCGAGGTGGCGCTTATCGACGGGAC
+ATTCGCCCGGGCCGCGGTGCCGTCGGGCGCCTCGACCGGGGAGCACGAGGCCGTCGAGTTGCGCGACGGC
+GGCGATCGCTACGGCGGCAAAGGCGTGCAAAAAGCCGTGCAGGCTGTTCTTGATGAGATCGGCCCGGCCG
+TCATCGGACTCAACGCCGACGACCAGCGATTGGTCGACCAGGCGCTGGTGGACCTAGACGGCACCCCCGA
+CAAGTCCCGGCTGGGCGGCAACGCGATCTTGGGTGTCTCGCTCGCTGTTGCCAAGGCGGCGGCGGATTCG
+GCGGAGCTGCCGTTGTTCCGTTATGTCGGGGGGCCAAACGCGCACATTCTGCCGGTACCGATGATGAACA
+TCCTCAACGGCGGCGCACACGCCGATACCGCTGTCGACATTCAAGAGTTCATGGTGGCGCCAATTGGCGC
+GCCCAGCTTCGTCGAGGCGTTGCGCTGGGGCGCTGAGGTGTACCACGCGCTCAAGTCGGTCCTGAAAAAG
+GAGGGGCTGTCCACCGGCCTGGGCGACGAAGGCGGCTTCGCCCCGGATGTGGCCGGCACCACCGCGGCGT
+TGGACCTGATCAGCCGGGCCATCGAGTCGGCGGGCTTGCGACCCGGCGCCGACGTGGCGCTGGCCCTGGA
+CGCGGCGGCCACCGAGTTCTTCACCGACGGCACCGGCTACGTCTTCGAGGGCACCACCCGTACCGCAGAC
+CAGATGACCGAGTTCTACGCGGGCCTGCTCGGCGCCTACCCGCTGGTGTCGATCGAAGACCCACTGTCCG
+AAGACGATTGGGACGGCTGGGCCGCGCTGACGGCCTCGATCGGTGACCGGGTGCAAATCGTCGGCGACGA
+CATCTTTGTCACCAATCCCGAGCGGCTCGAGGAGGGCATCGAACGGGGCGTGGCAAATGCGTTGCTGGTC
+AAGGTGAACCAGATCGGGACGTTGACCGAGACACTCGACGCGGTCACGCTGGCTCACCACGGCGGATACC
+GCACGATGATCAGTCACCGCAGTGGCGAGACGGAGGACACCATGATCGCCGACCTCGCGGTGGCCATCGG
+CAGCGGGCAGATCAAGACGGGCGCGCCTGCTCGCAGTGAGCGCGTCGCAAAATACAACCAGCTGCTGCGG
+ATCGAAGAGGCGCTTGGCGACGCGGCCCGCTACGCGGGCGACCTGGCATTTCCTCGGTTCGCGTGCGAGA
+CGAAATAGGTACATGCCCGAAGCGAAACGGCCCGAATCGAAGCGCCGGTCGCCGGCATCGCGCCCGGGGA
+AGGCCGGCGACTCGGTTCGGGGCGGTCGCGCCACCAAGCCTTCCGCAAAACCCTCCACGCCCGCACCGCA
+CGCCAGCCGCAAGACCACTCGCACGCCGCATGAGCACATTGTCGAACCCATCAAACGGGCGATCACCGAA
+TCGGTCGAGAAGCGCTCCGAACAGCGGCTGGGGTTCACCGCGCGGCGCGCAGCGATCCTCGCCGCGGTTG
+TATGCGTGCTGACGCTGACCATTGCGAGGCCGGTACGCACCTACTTCGCGCAGCGCGCCGAGATGGAACA
+ACTGGCTGCGACCGAGGCCATGTTGCGCCGCCAGATCGCTGACCTGGAGGAACAGCAGGTTAAGCTCGCC
+GATCCGGCGTATATTGCGGCTCAGGCCCGCGAACGGCTCGGCTTTGTGATGCCTGGAGACATCCCGTTTC
+AGGTCCAGCTTCCGTCGACGCCGTTGGCGCCGCCGCAACCGGGGTCAGACGCGGCTACTGCGACCAACAA
+CGAACCCTGGTACACCGCGCTGTGGCACACGATCGCCGACGACCCGCACCTGCCGCCTGCCGCGCCACCG
+GCACCGGAGCCCGGACGTCCGGGCCCGCTGCCGCCGGCCTCGCCAAACCCCGAGCAGCCCGGTGGTTGAT
+CGTGCCGATCTGGAGGTGGTCACGCGGCAACTCGGCCGTGCACCCCGGGGTGTGCTCGCGATCGCCTATC
+GTTGCCCCAACGGTGAACCCGGCGTCGTGAAAACTGCGCCGAGACTGCCCGACGGCACGCCGTTTCCGAC
+CCTGTACTACCTGACGCATCCGGTGCTCACGGCGGCGGCCAGCAGGTTGGAGACCACGGGACTCATGCGC
+GAGATGAACCGGCGGCTGGGCCAGGATGCGGAGTTGGCCGCCGCCTATCGACGGGCACACGAGTCGTATC
+TGTCCGAGCGTGACGCTCTCGAGCCGCTCGGGACAACGGTCTCCGCGGGGGGCATGCCCGACCGGGTCAA
+GTGCCTGCATGTGCTGATCGCGCATTCGCTGGCCAAGGGCCCGGGGTTGAACCCATTCGGTGACGAGGCG
+CTGGCGTTACTGGCCGCCGAGCCACGGACGGCCGCGACCCTGGTGGCTGGGCAGTGGCGCTAACCCGGGT
+CGCCGCGATCGACTGCGGTACCAACTCGATTCGCTTGCTGATCGCCGACGTGGGAGCCGGGTTGGCGCGC
+GGAGAGCTGCACGATGTGCATCGTGAGACCCGGATAGTGCGCCTGGGCCAGGGAGTCGACGCCACCGGTC
+GGTTCGCGCCGGAGGCGATTGCGCGGACCCGGACCGCCCTGACCGACTACGCCGAACTGCTGACGTTTCA
+CCATGCCGAGCGGGTGCGGATGGTCGCCACGTCGGCCGCCCGCGATGTGGTCAATCGCGACGTTTTCTTT
+GCGATGACGGCCGACGTGTTGGGCGCCGCGCTGCCCGGCTCGGCCGCGGAGGTGATTACCGGCGCCGAGG
+AGGCCGAGCTCTCCTTCCGTGGAGCGGTGGGCGAATTAGGCAGCGCCGGTGCGCCTTTCGTCGTCGTGGA
+CCTCGGTGGCGGTTCCACCGAGATCGTGCTGGGCGAGCACGAAGTGGTTGCCAGCTACTCGGCGGACATC
+GGATGCGTCCGGCTGACCGAACGCTGTTTGCACTCCGACCCGCCGACGTTGCAGGAGGTGTCCACGGCCC
+GCCGGCTGGTTCGCGAGCGGCTCGAGCCCGCACTGCGCACCGTGCCGCTGGAGCTGGCCCGGACCTGGGT
+CGGGCTGGCTGGAACGATGACCACACTGTCCGCGCTGGCGCAGTCCATGACGGCGTATGACGCTGCGGCC
+ATTCATCTTTCGCGGGTGCCCGGTGCTGATCTGCTCGAGGTTTGCCAGCGGCTGATCGGCATGACTCGCA
+AGCAGCGGGCCGCGCTGGCGCCGATGCACCCGGGCCGGGCCGACGTGATCGGCGGTGGCGCGATCGTGGT
+CGAAGAGTTGGCGCGCGAGCTGCGCGAGCGGGCCGGCATCGACCAGCTGACCGTCAGCGAACACGACATC
+TTGGACGGCATCGCGTTGTCACTGGCCGGATAAGTCACATCTGCCACACGCGTATCTGCGCGGGGGGACA
+CTCTTCTGCCCGCCTCGTAGCGACAACCTTGGCCGATGTCAGACCCGCATGGGAATGTTCGGCCATGACC
+AGACAACTGCATGGAATTGAGCTTCGATACGTGCTCACCCTGCACCTGGCCGTCCATGGACCGGCGGCCA
+TTACCGAAATGATCTAAGGCCTGGGCTGGCACGGCTTTGGAGTCCGGGGCAGGGCATCCAAGGTGGTGTC
+GGAGGCACTGCGCTGGGAAATCGGACGGGGCCGGGTATACCGGCTCGGGCGCGGACGCTACGGGCCGGGG
+TACATCCCGCGCTCCACCGAATACCGGATTCACCAACGCGTGTTGGCGTTGCGGGCATCCGCCAACGTGT
+CGCTGCGAGGCGGGCAAAGTGTACATCCGCTCCCAGCGGAAACGCCTGTGGCAGATGTGATTTAGGCTTC
+GAAGCGGTAGCCCATCCCTGATTCGGTCAGCAGATGTTTGGGGTGCGACGGGTCATCCTCCAATTTGCGC
+CGCAGCTGCGCCAGATACACCCGCAGGTAATGGGTTTCAGTCGCATATGCCGGTCCCCACACTTCTTTGA
+GAAGCTCCCCGCGGCCGACCAACTTGCCGCGGTTGCGGGCCAGCATTTCCAGCATGCCCCACTCGGTCGG
+CGTGAGATGCACTTCGGCACCGTCTTTGATGACCTTCTTGCCGGCCAGATCGACGGTGAATGAATCGGTT
+TCGATCACCGGCTGCTCCAACTCGGCGGCCGCGGTGTTACGCCGTACCGCTGCGCGCAGCCGAGCCAGAA
+ACTCGTCCATTCCAAACGGTTTCGTCACGTAATCGTCGGCGCCCGCATCGAGGGCCTGGACCTTGTCCGA
+CGAATCGGTACGCGCCGACAACACGATCACCGGTGCCGTCAACCAGCCACGCAGCCCGCCGAGCACGTCG
+ATACCCGACATGTCCGGCAGGCCGAGGTCGAGGATCACCACATCGGGCGGATGCTCAGCGGCGGCGCGCA
+GCGCACCCGCACCCGTCGAGGCGGTGATGACCTGGTAGCCACGCACGGTCAGGTTGATACGCAGCGCGCG
+CAGGATCTGGGGTTCGTCGTCAATCACCAAGACGAGGGTCATGGGCGGTCCTCGGGAGCCGCTAGATCGA
+TCACCACTGTGAGCCCGCCGCCCGGGGTATCGGTAGCCGAAATCGTGCCGCCCATAGCCTCGACGAAGCC
+GCGTGCCACCGACATCCCCAGACCGACACCGGTGGTGTTGTCGTGATCCCCCGGCCGCTGGAACGGGGCA
+AAGAGTTGCTCCTCGGTCCCGCGCGGGACCCCTGGGCCCTCGTCGATGACATTAATCAGGACCCGCTCAC
+GCACCCGTCCCGCGTTGACCCGGACCACGCAGTCGGGCGCATATCGCAGCGCGTTGTCGATCAGGTTGGC
+TAGCACCCGCTCCAGCAACCCGGCGTCGGCCATCGCCACGGCGTCTCCCACGTCGACCTTGACCCGGTCG
+ATGCCGGATCGGTAAAAACCGGTGGCGCCCTTGCCGATGCTGACCAAGGCCCGTTGCACCGCTTCTTCCA
+GGTATGCCCGGCGCAGCTGGGGGCGAATCACGCCGGCAGCCAACCGCGACGAATCGAGCAGGTTTGCGAC
+CAGGGCGGTGAGTTGGTCGATGGACTCCTCGATGGTGGCCAACAGCTCGGCGGTATCCTCGGGGGAGAAA
+GCGACGTCTTCGGTGCGCAAGCTGGACACCGCAACCTTGGCCGCCGCCAGCGGGGTGCGCAGGTCGTGGC
+TGACCGCCGACAGCAGCGACCGGCGCAGCTCATCGGCCCTAGCGATGGCCTCGGCCTGGCCGGCCTCTTC
+CGCCAGCTCGCGCTGCTTCACCAGACCCGCGGCCTGTGTCGCGACCGCGGTCAGCACTCGGCGGTCGCGG
+GCGGCCAACTTGCGGCCTGCCATCAGCATCCAAAACTCGTCGTCGCCGACTTCGATTGCGGTGTCGGCGG
+AGTCGACGTCCCGACACGGGTTTGTCCCGACGCACGCGACGGTTTCGCCTGTCGATGCGCCCTGCCGGAC
+ACGCAGCATGGTCACGGCCCGTTGGGAATACGTTTCGCGGACCCGCTGCAGCAGCGTGGCAAGGTCTGCG
+CCGCGCAACACCGAACCGGCAAACAGGGCCAGCAACTCAGCCTCCTGGGATGCGCGCCGAGCCTCACGGG
+TTCGGCTAGCCGCGCCGTCCACCAACACCGCCACCGCAACGGCCATCGCCAACAACACGAATTCGGTTAC
+TGCGGCGTCCGGTTCGGCGATGGTCCAGGTGTAGCGGGGCTCGGTCAGAAAGTAGTTCAGCAGCATGCCC
+GACAGCAAGGCCGACAATGCGGCGGGGGCGACGCCGCCCAGCAACGCCACGATCAGCACGCCGATGAAGA
+ACAACGCGCTCTCGCCGCCGATGCCCATGAATCGGTCGAGCCAGGCCACCGTGATGGCGCAGATCACCGA
+GGGCACCACCAGCGCGGCCAGCCACGACGCGATATGCCGCTCGCGCGGGGAGACCCGCGACCACCCGGAG
+GCCCGGCTGGCCGCGGGATGGGTGACCATGTGAACGTCGATGCCGCCGGACTCCTGGACGGTGCGGGCGC
+CGATCCCCTCGTCAAACAGGCGTGCCCATCGCGATCGCCGCGATGTGCCGACGACGAGCTGCGTGGCGTT
+CATCTCGCGGGCGAAGTCCAGCAGCGCGGTGGGCACGTCGTCGCCGACCACGGTGTGCATGGTCGCACCG
+AGGCTTGTCGCCAGCTCGCGGACCCTGCCCAGCTGCGGCGCGGACACCCCCGCCAGGTCGTCGCCACGGA
+TAACGTGAACCACCATCAGCTCGGCGCTGGACTTCGACGCGATCCGCGATGCCCGTCGCACCAACGTCTC
+CGACTCCGGGCCGCCGGTCACGGCGACGACGACGCGTTCCCGCGCCTCCCACGTGGCGGTGATCTTTTTG
+TCTGCGCGGTACTTCTCCAGGGCCGCATCAACTTGGTCGGCCAGCCACAGCAACGCGATCTCGCGCAGCG
+CGGTCAGATTGCCCGTGCGGAAGTAGTTCGACAGCGCGGCATCGACCCGTTCGGCTGCATAGACGTTGCC
+GTGAGCAAGCCTGCGCCGCAACGCTTCCGGTGTGATGTCGACCAGCTCGACCTGATCGGCCGCGCGGACG
+ATCTCGTCGGGGATCTTCTCCTTCTGCTCGATGCCGGTGATTTGCTCCACGACATCGTTTAGGCCCTCCA
+AGTGCTGGATGTTGACCGTCGAGATCACCGTGATGCCGGCGTCGAGGATTTCCTGAACGTCCTGCCAGCG
+CTTGGGGTTCTTGCTGCCAGGTGTGTTGGTGTGGGCGAGTTCGTCCACCAGCACCACCTGAGGATGACGT
+CGCAGTACTGCCTCCACATCGAGTTCGGGAAACCTGGCACCCCGATATTCGACGTAGCGCGGCGGGATCA
+TCTCGATGCCCTCGAGCAGTTTCGCGGTCTTGTTGCGTCCGTGTGTCTCGACGACCGCGGCGACCACGTC
+GGTGCCGCGCTCCAGCCTGCGGTGCGCCTCGCCGAGCATGGCGTAGGTTTTGCCCACGCCGGGGGCCGCG
+CCCAGATAGATCCGCAGCTGCCCGCGCTTGGTGGTCACATGCTCAATCATCCACCGGTAGGGCGTAAAGA
+TCGCGCAAAGATCGGCGAAGAGCAACGTCACGGTCGTGTTCCTGGGGGGCTCGGCAACTACCATCCTGCT
+GGGCTATCTGATGCGCTGCGATGCCGGTGCACAAGAATCGAGAGGACTCACATGGCCGACTTGGTGTTGG
+TGCTGACCGTGATGGCCTTTGCCGGGCTTTGCCTGCTCTACGTCCGTGGCTGTGAACGGATCATTCGCCG
+CGACGAAATCGGGGAAACAACAGTCGAACTCACGCGAGCGCCGGCCGAATGGCGATGACTACGGTCGACA
+ACATCGTCGGGTTGGTGATCGCGGTGGCGCTAATGGCGTTCCTATTCGCGGCGCTGCTGTTTCCGGAGAA
+GTTCTGATGTCCGGGACGAGTTGGTTGCAGTTCGCGGCGTTGATCGCGGTGCTGTTGCTCACCGCGCCAG
+CGCTGGGCGGCTACCTGGCCAAGATCTACGGCGACGAGGCCAAAAAGCCCGGCGATCGGGTGTTTGGGCC
+GATCGAGCGCGTGATCTACCAGGTATGCCGAGTCGATCCCGGCAGCGAGCAACGGTGGAGCACCTATGCC
+CTGTCCGTGCTTGCGTTCAGTGTTATGTCCTTCCTGCTGCTGTATGGGATCGCGCGGTTTCAGGGCGTGC
+TGCCGTTCAATCCGACGGACAAGCCGGCGGTGACCGACCATGTCGCCTTCAACGCCGCGGTCAGCTTCAT
+GACCAATACCAACTGGCAGTCCTACAGCGGCGAAGCCACGATGAGCCACTTCACCCAGATGACCGGGCTG
+GCCGTGCAGAACTTCGTCTCCGCGTCCGCCGGCATGTGCGTGCTGGCGGCCCTGATCAGAGGTCTGGCCC
+GCAAACGGGCGAGCACGCTCGGCAACTTCTGGGTAGACCTCGCCCGCACCGTGTTGCGCATCATGTTTCC
+GCTGTCGTTCGTGGTGGCGATCCTGTTGGTCAGCCAGGGCGTGATCCAGAACCTGCATGGTTTCATCGTC
+GCCAACACGCTGGAGGGCGCCCCCCAGCTCATTCCAGGCGGGCCGGTGGCCAGCCAGGTCGCGATCAAGC
+AGCTCGGCACCAACGGCGGCGGGTTCTTCAACGTGAACTCCGCGCATCCGTTCGAAAACTACACGCCGAT
+AGGCAATTTCGTCGAAAACTGGGCGATCCTGATCATCCCGTTCGCGCTGTGCTTCGCCTTCGGCAAGATG
+GTGCACGACCGTCGTCAAGGCTGGGCGGTGCTGGCCATCATGGGCATCATTTGGATCGGAATGTCAGTCG
+CGGCAATGTCATTCGAGGCCAAGGGCAACCCGCGGCTGGATGCGCTGGGGGTGACACAGCAGACGACGGT
+CGACCAGTCCGGCGGCAACCTGGAGGGCAAGGAGGTGCGCTTTGGCGTCGGTGCGTCTGGGTTATGGGCG
+GCGTCGACGACCGGCACCTCCAACGGCTCGGTCAACTCGATGCACGACAGCTACACACCACTGGGCGGCA
+TGGTCCCGCTGGCGCACATGATGCTCGGCGAAGTCAGCCCGGGCGGCACCGGCGTCGGATTGAACGGCCT
+ACTGGTCATGGCGATCCTGGCGGTTTTCATCGCCGGCCTCATGGTAGGCCGGACACCGGAGTATCTCGGC
+AAGAAGATCCAGGCCACCGAGATGAAGCTGGTGACGCTCTACATCCTGGCGATGCCCATCGCCCTGCTGA
+GTTTCGCCGCCGCGTCGGTGCTGATCTCCTCCGCGCTGGCGTCGCGGAACAACCCTGGGCCGCATGGTCT
+TTCGGAGATTCTATACGCCTACACGTCGGGCGCGAACAACAACGGGTCGGCCTTTGCCGGTCTGACCGCG
+TCTACCTGGTCATATGACACCACGATCGGAGTGGCGATGTTGATCGGTAGGTTCTTCCTGATCATTCCGG
+TGCTGGCGATCGCCGGCTCCCTGGCACGTAAAGGCACGACGCCGGTTACCGCCGCCACCTTCCCGACGCA
+CAAGCCGCTCTTTGTTGGCCTGGTCATTGGGGTCGTACTGATCGTCGGCGGCCTGACGTTCTTCCCCGCC
+CTGGCGCTGGGGCCGATCGTCGAGCAGTTATCGACCCAGTGATGATCGCACGCATGGAGACCTCCGCAAC
+CGCCGCGGCAGCGACGTCGGCACCCCGGCTCCGGCTGGCCAAGCGCTCGCTGTTCGATCCGATGATTGTG
+CGCTCGGCGCTGCCCCAGAGCCTGCGCAAGCTGGCTCCGCGGGTACAGGCCCGTAACCCGGTCATGTTGG
+TCGTGCTGGTCGGTGCCGTGATCACCACACTGGCGTTCCTGCGCGACCTCGCATCCTCGACAGCCCAAGA
+GAACGTCTTCAACGGTCTGGTCGCCGCGTTCCTCTGGTTCACCGTCCTGTTTGCCAACTTTGCCGAGGCC
+ATGGCCGAAGGACGCGGCAAGGCTCAGGCGGCGGCGCTGCGCAAAGTCCGGTCCGAAACGATGGCCAACC
+GGCGCACGGCTGCGGGCAACATCGAATCGGTCCCTTCGTCGCGGCTGGACCTCGACGACGTGGTGGAGGT
+TTCGGCTGGCGAAACGATCCCGTCGGACGGCGAGATCATCGAAGGCATTGCCTCCGTCGACGAGTCTGCG
+ATCACCGGCGAATCGGCACCGGTGATCCGCGAGTCGGGCGGCGACCGTTCCGCGGTGACGGGTGGCACCG
+TGGTGCTGTCGGATCGGATCGTCGTGCGGATCACCGCCAAGCAGGGACAAACATTCATCGACCGGATGAT
+CGCGCTGGTGGAGGGCGCCGCACGGCAGCAGACACCGAACGAGATCGCGCTGAACATCCTGCTGGCTGGG
+CTGACGATCATCTTTTTGCTCGCGGTGGTGACGCTGCAGCCGTTCGCCATCTATTCCGGCGGGGGACAGC
+GGGTGGTCGTGCTGGTGGCGTTGCTGGTGTGTCTCATTCCGACCACGATCGGTGCGCTGCTGTCCGCGAT
+CGGCATCGCGGGGATGGACCGGCTGGTGCAACACAACGTGCTCGCCACATCTGGGCGGGCGGTGGAGGCG
+GCCGGCGACGTGAACACGCTGCTGCTGGACAAGACCGGCACCATCACCCTCGGTAACCGGCAGGCCACCG
+AGTTCGTGCCGATCAACGGTGTGAGTGCCGAGGCGGTCGCCGACGCCGCCCAGCTGTCGAGCTTGGCCGA
+CGAAACTCCGGAGGGCCGCTCGATCGTCGTGCTGGCGAAGGACGAGTTCGGGCTGCGCGCCCGCGACGAG
+GGCGTGATGTCACACGCCAGGTTCGTGCCGTTCACCGCCGAAACCCGGATGTCCGGGGTCGATCTCGCCG
+AGGTTAGCGGCATCCGTCGGATCCGCAAGGGTGCCGCGGCTGCGGTGATGAAGTGGGTTCGCGATCACGG
+TGGCCACCCCACCGAGGAGGTGGGTGCCATTGTCGACGGCATCAGCTCCGGCGGGGGGACACCCCTAGTC
+GTTGCGGAATGGACCGATAACAGCAGCGCGCGGGCCATCGGCGTCGTCCATCTGAAGGACATCGTCAAGG
+TGGGCATACGGGAACGCTTCGACGAAATGCGCCGAATGAGCATCCGCACCGTGATGATCACCGGTGACAA
+CCCGGCGACCGCCAAGGCGATTGCACAGGAGGCCGGCGTCGACGATTTCTTGGCCGAGGCCACGCCCGAG
+GACAAGCTTGCGCTCATCAAGCGCGAACAGCAGGGCGGTCGGCTGGTCGCCATGACGGGTGACGGGACCA
+ATGACGCACCCGCGCTCGCGCAAGCCGATGTCGGGGTGGCGATGAATACCGGCACCCAGGCGGCCCGGGA
+AGCCGGCAACATGGTCGATCTCGACTCCGACCCCACCAAGCTCATCGAGGTCGTGGAGATCGGCAAGCAG
+CTGCTGATCACGCGGGGCGCGCTGACGACGTTTTCGATCGCCAACGACGTCGCGAAGTACTTCGCCATCA
+TCCCTGCCATGTTCGTCGGCCTGTATCCGGTGCTCGACAAGCTGAACGTCATGGCGCTGCACTCACCAAG
+GTCGGCGATTCTGTCGGCGGTCATCTTCAATGCGCTGGTGATCGTCGCCTTGATCCCATTGGCGTTGCGG
+GGCGTGCGGTTTAGGGCGGAAAGCGCGTCGGCGATGCTGCGGCGCAACCTGCTGATCTATGGGCTGGGCG
+GTCTCGTCGTCCCGTTTATCGGCATTAAACTGGTCGATCTCGTCATCGTCGCCCTCGGGGTGTCCTGATG
+CGTCGTCAATTACTGCCCGCGCTCACCATGCTGTTGGTGTTCACCGTCATCACCGGCATCGTCTACCCGC
+TTGCCGTGACCGGCGTCGGGCAACTGTTCTTCGGTGACCAGGCGAACGGCGCGCTGCTCGAGCGGGACGG
+GCAGGTCATCGGCTCCGCCCACATCGGCCAGCAGTTCACCGCCGCGAAGTACTTCCACCCGCGCCCCTCG
+TCGGCAGGCGACGGTTACGACGCTGCGGCGAGCTCGGGCTCCAACCTGGGACCGACGAACGAGAAGCTGC
+TGGCGGCCGTCGCTGAACGGGTCACCGCCTACCGCAAGGAAAACAATCTGCCGGCCGATACGCTGGTTCC
+GGTCGACGCGGTTACCGGCTCGGGTTCCGGGCTGGACCCGGCCATATCGGTGGTCAATGCCAAGCTGCAG
+GCACCGCGGGTGGCGCAGGCGCGCAATATCTCGATAAGGCAGGTCGAGCGTCTGATCGAGGACCACACCG
+ACGCGCGTGGTCTCGGCTTCCTGGGCGAGCGCGCGGTGAACGTGCTCAGGCTGAACCTCGCATTGGATCG
+CCTCTGACTCTCAGGCGGTAGTGGCGATCTGCTGCTCGATCATCGGGAGCCGCACCCGAAACACCGTCTG
+GCCGTTGCCCGACTCGGCCGTGACCGAGCCGCGATGCGCCTTGACGATCGAGCTGACGATGGCCAGGCCC
+AAGCCGTGGCCGGACCCATTGGACCGAGACTTGCTGGCCCGCACGAACCGGTCGAAGAGGTGGGGCAGGA
+TCTCCGGGTCGATGTCGGGGCCGTCGTCGGTCACCGACAATTCAACACACGGCGCGTTGGGACCAGTGCG
+GTGGCAGGTGATCCCGATGGTCACTGTGACGCCGGGCTGGGTATGCACCCAGGCATTGGTGAGTAGATTG
+CTGACGAGTTGATGCAAGCGGGCATGATCCCCGTTGACCCAGACCGGCTCGTCGGGCAGATTCTTCACCC
+AACGGTGGGTGGGCGCCGCAACCGCCGCGTCATTCACCGCGTTGATGACCAGGTCGGTCAGGTCGAGGTC
+CTCGGTTTCTAGATCTTCGCCCTCGCTGAGACGGGAGAGCAGCAGCAGCTCGTCGACCAGCAGCGTCATC
+CGCCGCGCCTCGGATTCGATGCGGGCCAGCGCGTATTCGGTGGTGGGCGGTAGGTCCGAGCTATCCTGAC
+GTGTCAGTTCGGCATAGCCCTGGATCGCCGCCAGGGGAGTACGCAGCTCGTGGCTGGCGTCGGTGATGAA
+CTGCCGCATCCGCAGATCGGAATCGACGCGATGCGCCAGCGCACCATCGACGTTGTCCAACAAGCGATTC
+AGCGTGTGCCCGACGATTCCGACCTCGTTATCCGGGTCGGTATCCCCCGGACGGACTCGCACGCTGATCT
+GGTGGTCGTCATCGGTAAGTGGCATGGTGGCGACCTCGGCGGCGGTCGCGGCGACCCGGCGCAGCGGGCG
+TAGCGCATATCCCACCACCCACACCGTCAGTGCTGCGGTAACCACCAGTGCGGCCCCAACAAGCGCGACG
+GTGGTGACTTTCTTGCGGGCGATGATCTGGTTGGCCAGGCTTAGCGATACGCCGACGAACAGTCGATCGG
+CGCCAGCGGCGCTGCTGTCAACCTGGTAGGCGCCCAGGCTGCCCAGGCTTTCGACACGCGGCGGGCCGCC
+GTCCCACACTTGCGCTTCGATCGCGCGGATGACGTCGGGCGGAGCGGGTCGTGCTCCGTCTTCGGAGAAA
+ACGGCCGATCCGATCACCACGCCGTCGTGCAGCACGGCAATGAGGTTTCCGGGCGTCTGGCCGGTGAACT
+CCAGCACCGCTTGTGACATCGGGAGGTTGCCGGTGGGCGTGGATGTTTGCGCACTGTCGCGGTATCTGGT
+GTAAGAGTGGTTCAACGCGTGCAGGGATTCGACTAGCTCGGCGTCGTTCATCGCGGTGACATAGCCGCTT
+AGGCTCAGCACGGAGACGACACCGACGGCCACCAGCACAACGGTAACGACCGCCAACACGCCGAGCAGCA
+ATTGCTGGCGTAACGAGCGGGGTCGCCAGCAGGGGGCTTTTCTGGACCGAGTGTTTCGGTCCGGGATCAT
+GCCAGGCTCATTCCGGCGGACGCAGCATGTATCCAATGCCGCGGACCGTATGGATCATTGGCTCCCGGTC
+GGAGTCGATCTTCTTCCTCAGATAGGAGATATACAGGTCGACAATGCTGGTGCGGCCTGCGAAGTCGTAG
+TTCCAAACCCGATCCAGGATCTCGGTACGGCTCAGTGCTCGTCGGGGATTGCGCATCAGGAATCGAAGCA
+GTTCGAACTCGGTCGAGGAGAGCGAGATCGGCGTACCGTCGCGGGTTACCTCCCGGCTGGCCCCGTCGAG
+CGTAAGGTCTCCGACCCGGAGTGCCTCATCGGCGGGCCTTTCCAGATGGCTGGAGCGGCGCAGCAACCCG
+CGCAACCGGGCGACCAGCTCCTCGAGGCTGAACGGCTTTGTCATGTAGTCGTCGGCGCCCGAGGTCAGAC
+CGGTGACCCGGTCCATCACGGAATCGCGCGCGGTGAGGAACAGCGTGGGTGTGTAGACGTCGGATTCTCG
+GACCCGTCGCAGGATTTCCAACCCGTCCACATCGGGAAGCATGATGTCGAGGACCAGCACATCGGGGCCG
+ACCTTGTCGAACTTGGCTATGGCCTCTTGCCCGTCGTGGGCGACTTCGACATCCCAGCCTTCGTAGTGCA
+GCGCCATCTTGACCAGATTGGTCAGCGCTGGTTCGTCATCGACCAACAACACCCGGATCGGTGATCCATC
+CGCGCGATGAATCCGTGGCAGCTGCCCCAGGATGGCTTGCCGCGGACGTTGACTGCGCGTGTACCCCGAC
+ATCGTCGTCATGCTCCCGTATCCTCTCAAGTCCTGTGCAAGCGCACATGCAGTTGTCACGGGATTCATAA
+ATTTTTCAAATGTCGCTTATGTAGTTACTTCGGCCTGAAAAGGTGACCGGGCGGGATGTCGGGCTTCGGC
+GGTGAGAAAGCGGATCTCGGTTTCCGGGTATACGGAGCCCCCGGTGGACCGGTTATGCGGGGAGGGCGCT
+GATCGTGACCAGGTTGTGGGCGAACACGCCGTGTCCGACCCAGGTCCGGGTGCCTTCGAGACCGCCGATC
+CGGCCGCGGTCCCAGCCGTAGCCGCGTTTGAGGTGGCTGATCCGGCCTTCGCATCCGGTCCGCCATTTGA
+TGGTGCGGCGGAACGCTTTTCGGTGTTCTTCGGCGCGTCGATCCTGCGAAGGTTTGCCTTTGCGCGGGAT
+CAGCACATTCTTGACGCCCACCTCGGTGAGCTGCTGGTCGACGGCGGCTTCGCCATAGCCGCGGTCGGCG
+GTGACGGTGCGCGGCGTGCGTCCGGCGCGCTTTTTCACCCACGCCACCGCTGGCGCCAGCTGCGGCGCAT
+CGGGTGGGTTGCCCTGCTGCACAGTGTGATCCAGCACAATCCCGTCATCGTTGTCGACGACCTGGGCCTT
+GTGCTCAAACTCGACCGGCTTACCGAGCCGACCCTTGGTGATCGGGGCGGGCATCACCGTCGTGCAGGCT
+GACCCGTCGACTCGCCCCGTCCGAAGTGATGCCCGCGACCCGCTGGCGGGTCTGCGCCACAATCTGACGC
+GTCGCGTTGAGCAGCTCGGTTAGGTCGTTGACCGCGCGCACCAGCCCACCACAGCGGCGACCCGCGACCG
+CATCACGCTCACCGCGGGCGGCCAGCGCGGCGGCCTTGGCCTTGGCCCGGAGCACCGCCTGCTTGGCGTT
+GTCCAGCAGCTGCTGGGCCTCCTGAGCAGCGGCTTGGGCCAGCTCGGCCAGCTCGCCGGTGAACCTCAGT
+ACCGCGGCCCGCGCTTCGTCACGCCCCAGCTCCGCACGCGAGCGCAGTTTCGCTGCGACCGCGTGCGCGC
+GCCGACCGGCCGCGCGGGAGCGGTCGCCAACCCGGGTGCGCACCGCGCCGCCAGCGGCCTGAATCCGTTT
+GCCGGTTGCGGCGATCCGGCGCATTGCCTTGGCCAACAGACCCAAGTCGGTCGGATAAGACACGTTCGCC
+CGCGCCACCGTGGTATCGGCCCGGATCCGATTGGTGCCCAGCAGCTTGGCCTCGGCCGCCTTGGCCAACA
+ATGCCTCGTTGAGCCCGTCGATCGCCGCCGATCCGCAACGCGTGGTGAGCTTCATCAATGTGGTCGGATG
+CGGCACCGACCCGTCCAGCGCAATGCGGCAAAACCGCCGTCAGGTGATCGAATCAGCCACCTCCCGGCAC
+AGCGACTCATAGCCCAGCCGGTAGCGGAACTTCACAAACATCAACTGCAGATAGACCTCCATCGGCGTCG
+ACGGCCGGCCCCTGCGCGGGTCGAAGAACGGCACGAACGGGGCGAAGAACGCCGGATCGTCCAACAATGC
+GTCCACCCGGGCCAGTTCCTCGGGCAGTCGGCGCACCTCGTCGGGCAGCAGCGACTCCCACAACCAGCAC
+TGATCGCCTAAAGTACGAAACACGATGGCCTCAATCCCTTCCGCAACAAGGGCATTGAGGCCATCTTCCC
+AGTTCAGCACCATCCGACCGGGGATCAACGCGCCGACTTTAGCAGGTCGAAGTAGTTAGTCGTTCAGATA
+ACAACGTGGCCACACACCAACCGGTGTGCGGCCACGTTGTAATTGACGGCGCGGGCCTTAAGCCAGCTTT
+AGGCCCAGCTGGAGCCGACGGCGCTGTCGGTTTGTGCCATGTTGTTGCCGGCAGCCTGCACCTTCTGCCC
+GTGGGCGTTGGCCTGCTCGTAGATCACCTGGAAGTTACGGCCCAGCTGGGTAATGAACCCCTGGCAGGCC
+GCCGAACCGGCGCCGCCCCAAAAGTCACTCGCGGTCAACACATCAGAAATGATGGCCTGATGCTCGGCCT
+CCAGCGACCCGGCCAGAGCGCGGATCATGGCGCCGTGAGCGTCGACGTCCCCGAATTGATAGTTGATGGT
+CATGTGTCCTCCTGAGTCGTCGGGCCGGGTCAGCTGCTGAGGATCTGCTGGGAGGCCTGCTCTTGCTGTT
+CGTAGTTGTTGGCGTCGCGAACCAGCCCGTCACGCACCCCGTGCAGCATGTTCACGATGTTGCGAAACGC
+CTGATTCATCTGGGTCATGGTGTCTAGCGAGGTCGCCTCGGCCATGCCACTCCAGCCCGCGCCCGAGATG
+TTTTGCGCGGACGCCCACATCCGGCGAGCCTCGTCCTCCACCGTCTGGGCGTGCACCTCAAAACGGCCCG
+CCATGTCCCGCATCGCGTGCGGATCCGTCATAAAACGCGAGGCCATGCTGCTGTCTCCTTGTCTCGAAGT
+CGTCACGTTGTTGAAGTTCTAGCGGCTGTGATCGGCGCGGTGGTGGCCGCGTGGCGGACAGGTTATGACT
+CAACGGTTAATTGCTGGCCTCAAACGAGTGAGATGTCCCCCTTTGTCCGCATCACACGACGACCTGTTTG
+GGCATGACAGTGGGCTTGAATCCGTACCGCGGCCCGGCATAGGCACCGGTGCCCTTGGCGGCCGAGGCCA
+TTCCCGGCATCATCCCGGTAACTGGGCCGGCTTCTTCGGCGGCGACGGTCCAGCCGCTGCCTTCGAGCGC
+TGTGGCGCCGGCGGTTGTCGCCGGTGCGGCCGTAGACCAGGCCGCCGGCACTGACAGCCGGCCGACCAGG
+GTGGCCTCGCCTAAACTTGCGCCGAGCCCCGCTGGCGTCACCGAGTCCGCCAACCCCGCGGCGGCCGCAC
+TGGCGGCACCCTCGGCAGCCTCGATGGCGCCTTCGGCGATCGCTACCGGCGCCCCACTGTTCAGGGCATT
+TGCTAGGAATATCGCGGTGGGGATGGCGGCGTTGACATACCAAGCGGCGGTGTTGACTGCGCTGTTGATG
+ATGTTTGCCACGAACGGGGTCGCGAGCAGGGCGTCGATGTCGGCAATGATTCCGCTCAGCCCCGTCGAGT
+CGAGAACCGATGTGACTGGGGAGGCGAGCCCACTCACCGCGTTGGGCAGGCTACTGATCAGGTCCGCTAC
+GCTCACCTGGTTGACGGCGGCGGTGGCGGCAGCCGAGCCGACCGCGGCGGACTGGGCGGCCAGCCCGCCC
+GGGTTGGTGGTCTGCGACGGCGGGCTTAACGGTTGCAGCATCCCGGCGGCTCCCGAAGCGGCCGCGTAGC
+CGTACATAGCCAGAGCGTCCTGAGCCCACATCTCGGCATAGAGGGCTTCGGTCGCCATGATTGCCGGTGT
+GTTGATCCCCAGGACGTTCGTCGCGACCAGGGCCGCCAGCAGCGCCCGGTTGGCCGCGACCACCTCCGGC
+GGCACTGTCATCGCATAGGCCGCCTCGTAGGCGGCCGCCGACGCCATGGCCTGCGAGCCGGCATGCGCAG
+CGGCTTCGGCGGTGTAGGTCAACCAAGCCAGATAGGGCTGGGCTGCGGCGACCATCGCCATCGAGGCCGG
+ACCCATCCACGACTCGGTGGTCAGCCGGGTGATCACCGACTCATACGACGCGGCCGTCGTACCCAACTCG
+GCGGCCAGGCCGTTCCATGCGGCCCCGGCGGCCATCATCGGTCCTGCACCCGCGCCGGCGTACATGCGTG
+CGGAGTTGATCTCAGGGGGTAAAGCTCCGAAATCCATGGGGTATTCCGTTTCCGTGGAGTTATTTGGCTG
+AATTTCGTTGTTGGTTGAGCGTGGCCGCCCGTACGTCTGCCGCCTAGACGGTTGCTGGCTTGGGCATGAC
+GATGGGTTTGACGCCGTAGCGCGGTGCACCGAAGCCGGCGCTGTTGCGTGCGGCCGAGGCCACCCCTGGC
+ATCCCGGGGATGAACGTCCCCGCGGCGGCCTGCGGCGCGGCGGCGGTCCAGCCCGCGCCCGGCAGTGTGC
+TGGTGGTGGATACCAGGGTCGCCTGTCCGGCCCAGGCGGGCGGCACCGACAACATGCCGATCGCGGATGC
+GCTGCCCAGGCCGGCCGCAATTCCGGCCTCGCCGAGGGCGGCTTCGGCCGCGCCCAATGCACCCAATTCG
+CCCAAGGCGGCTTCCCCACCGAGAGCCGAGGCGGCCTCGGCCGCCTCCTCTGCAGGCAGGAGGCCGCCGC
+CGGCAAGGCCGATCAGCGTAGACGTGGCGGAGGCCCAGTTCCCGGCCCCGATGTTGAGGATGTTGCCAAT
+GCCACCCGAGAGTTCGGGCGGGAACAACCCCGTCGTCGCTTGGATGATGGCCGACGCTTCCCCTGTGATC
+CCCGAGAGTGGCGAGGCGGCAGCCGATGAGTTGAGCGACTCGGTGACGCCGTAGGTACCGGCGCTGATCC
+CCAGAGTGTTGACAAACATGTCATGCATAGCCTGAGCTTCGGCGCTGACCTGCTGGTAGAAGGTGCCGTA
+CGCAGTGAAGAGCGCCGCCTGCAGCGCCGAAACCTCATCGAGGGCCGCCGGAGCGATGGCTGTGGTGGGC
+GCCGCGGCGGCAGCGTTTTGGGCTGCCATCGCAGCACCGATGGTCCCGAGTTGCGCGGCCGCAGCCGTCA
+ACTCTTCAGGCACTGTCTTGAGGAATGACATCCATTGCTCCTTGTGTGTGAAACCTGCCGGCCGCTAGCA
+CCCCGGGCCGACCCTGTGTGTTTGCGTACGGCTGCCTGTGGATTGGCGTAACGCTAACCGGCCAAGCCTC
+CACAGTCGCGACCGAAAGGCATGGGACGCCCGACGTTTACGGTTTTTTAACGTTTACGTCAGCATCCTTA
+ACAAGGTCTTGGCGGCTGACATGGCGGTGTGATCTGGTGCCCGGGCTAGCACACTTCGGCACACAAATGA
+GACGCGCGGCGCGCGGATTCTAGGCGAATGACGGCTCTTTCGCACCTGGCGTGTCGCGGTAGGGTTGGTG
+CACTGGATCGGGTCCAAGCGCTACATTCGCCGTCAAGCCTCCACAGCCCGATTAGCAGAGGCAGCGGACA
+ATCCGCGCTCACGGGTGCTGGCGTTTGCTAGTGCCGGTAATCTTCGAAAGAGTCGCTTCTAACTGCCAAT
+ATGCCGGGTCGAAGCCACTGTCCAGCACTGTCGGCATCCAGATGGGGGCGTTGGCGCGCTGATCGATACG
+CCGTCTGCGCGGCTCCCGGCACAATGAGTTCGTGCCCGATTCCTGGCCGGTCGTTTGCGTTGACGACTGG
+TCTGTTGCCGGCCTGGAGACCCAGGGGCAACACCCGCACGATTGGCTCAAACATTCTTCGCAGAAGCGGA
+CGTGGCTCTTCAAGCCGGCGCGACCGGAGCGCGATCGTTTACTCGGCGAAGACGTGGCAGAAAAGCTCGC
+CAGCGAGTTGGCGCGGCTACGCGATGTCTCCACAACAAGAGGGGAAGCTCACCCGTCGTGCAAATGCTGA
+GCGGGGGTCTGGTCGGTCAGCGTGAACCCGAGGCTGGCCGCGTGGTCGAACGATGGGCACAGCGCCTCCA
+CATACTTTGTCTCCAGTGGCGGCACATGGACCGCCCAGTTGCGGTCGTGACGATCACCGTGGGCGATCAA
+TGCGTCGAACACGAGGTAGGTCGAAAGCGCGGAACGTGGGTAGGAGCGCTTGGTCGGCAGGTGCTGCGAA
+CCGAGCAAGCGCCTGCTGGATCGCCTCGACGTTGTGCCCACGTTGCCCGGGATCGTCCCGGTCGCAGTTG
+AGCACAACCTCGGGCATCAATGCTTGCGGCAACCGCACGTCCTTGACCAGCGCACCGCGCACGCCGTCAC
+GGACAGCCAGCTGGACCGGTGCCGCAGGTATCCCGGCTAGGGCGTGTCTCCCAATTTCGGAGTTCCCACT
+CGGGCGTGGATGACGGCGCAGGCCAGCAGGACGCCGCCGAGGTAGGTCAGGGCGTATTTGTCGTAGCGGG
+TTGCGATGCCGCGCCACTGCTTGAGTCGATGGAAGCCGCGTTCGACGGTGTTGCGTAGCCCGTAGAGCGC
+GGCGTCGAATGCTGGTGGCCGCCCGCCGGCAGACCCCTTGGCCTTGCGCCGGTCGATCTGATCTTGGCGT
+TCGGGGATGGTGTGCTTGATCTTCTTAGACCGTAATGCGGCACGGGTACTTGGGTGTGAGTAGGCCTTGT
+CGGCGAGTAAGCGGAAATCCGTGCTGCCCAGGGCGTATTCGGTGCTGGCATGGCGATAGTCGTCGAGCAG
+GGGCAGCAGTTGCGGGTTGTCGCCGGCCTGGCCTGCGGTCAACCGGATCCGCACCGGGGCTTCGCGCTGA
+TCGGTCAGGGCATGGATCTTGGTGGTCAGCCCGCCGCGCGAGCGGCCGATCGCATGATCGTCGGGTTCAT
+CGGCGGATTTCTTGTAATTCGACAGTGCCCCCTGTGGCGAGCGTGTCCGAGCAGGCGCCCGCCGAATGCT
+GGTGTGCCCGCACGTTCGTGGAATCCACCGACAGCAGCTTCTCGATATCCTCGGCCACCTCAGCGTCCAC
+CCCGAACACCGCGGCAACGTGGGCGAACACCTCGTCGCAGGTACCATCCAGCGACCAACGGTGATGGCGC
+TTCCACACCGTTTGCCACGGCCCGAACTCAGCGGGCAGGTCCCGCCACGGACTTCCCGTACGGAACCGCC
+ACGCGATCCCTTCCAGGATAAGCCGGTGATCGCTAAACCGTCTGCCGGGCTTGCCCTCATGCGACGGCAT
+CAACGGCTCGACCACGGCCCAGAACTCGTCCGAAATCACACCCACTCGCGTCACCGGCCAATCCTCGCTG
+GCCAGTAACCTAAAAATTTGGGAGACACGCCCTAGGCGCGGGCTGCAGCGGTAGTACTTTGGCCTGTTCG
+GCGCATCTCCTATGGCTGCGGCCCGCTGGCTCAAACCTTGCCTTGCCACGCCAAGCCATTCCTAGCCTTG
+CCTAGCCACACCATGCCCTGCCTAGACACAGCGAGCCTACGCCGCGTCGAGTTCGGCGAAAATCAAACTG
+ACCCACTACCACCGGATTGAAGGGTTTGGTGCGTGTTGATACGTCCCGGGTTGTGCCTATGGGAGGGTGT
+CCATCTCCACGATGCCGCCGAAGTCGAGTTCGTCGAGTGCTCGGATCACTTCGCTCGACGGGATGCCGCG
+ATAGAAGGGTGCCGCGTTCGGTCCGGTGCCCGTCGACGGTGCTTCCGCAGAGTCCTCGACCACGAGGCCG
+ATCACACGGCCGTCTTGCGCAACGATCGGACCGCCGCTGTTGCCCGGCCGCGCGATTGCCGAGTAGAGGA
+AAATCTTCTGCCGGCAGGGGATAGTCGTCGCGGCCGGGTTGACCACCTCGCCACGCTGCACCGTGATCGC
+CATCTCCGCAGTCATCGGCACCCGCGGGTAACCGAACACGTAGACCTCATCCGCCCAGTCGGGATCACGG
+AACGCCATGCCGCCAAGCCGCGGGATGTACTTGCCTTCGGGCATCTCGAATTTGATTACTGCGACGTCGA
+GCGTGGGGTGCGGGTGAGCGGTGCCCGAGAAGTTCACCAACTCGGCTTCGGCGTGGTTGCTTGACGGATA
+GACGGACAGACCTGCGCTCGTGCCCGCGAGCCCGGTCACGACATGTTTGTTGGTGATGACGTGATTGTGG
+TCGACGACGAGGCCGGTTCCCCAACTATCCACCGGATTGCCAGCGTCGTCGTGACCGGCGAGTTGAACGG
+TCACCGCGTTGTAGCTCGGGATGATGAGCTCGGCACCGAACACCTCGGACAACCAGAGGTTGCCGCCACG
+CTGTCCCTTCGATATCGTCCCCTGCGAGATGTACTTCTGCCCCATGACTGGCAATCGCGGGTCCCAACCG
+AGCGGCAGCAGAAGTCCCGCGCGTTCCATCGAGCTGAGGATGCGGTGGAGGGTCACCGCGTCGCCCGCGG
+CGGGCAGGCCGAGGGTGCTCAGGTATCGGGAGAAATCTGCGACCGACCACGGTTCGAAGGGCACCGTCGT
+CGGCAGACCGATATCCGAGTCAACCGGTGGTGGTTCGGGTTTGCCGATCGCCGCCGCAACCACCGGGTTG
+TGGACCAGCCCGAAGAATTGATGGGCGCACATCGCCACGTTCACACGCCACGCAGGAGTCCCGGGCTTCA
+GGTCGGCCGCCGTGAGCTGTCGCGGTCAGGTGCTTTCCGCGCCATCCGCCGTCACCTCTGCCATGGTCCA
+TCTACGGTATCTGCGACAAGGGCAGCGTCGATGCCTCGACATGCAGAGTCGGTGTTCGCTTCACGCGAAC
+TAGGCGCGCCTAGCCTGGACGAGTCCCCGGGCCGACATTCGCCCGAGGCCTTGGCCTCCATCACCTAATT
+GTGTGCAAAACCGTATCTAATTGATACGATTGCGCACATGGCTATCTGGGATCGCCTCGTCGAGGTTGCC
+GCCGAGCAACATGGCTACGTCACGACTCGCGATGCGCGAGACATCGGCGTCGACCCTGTGCAGCTCCGCC
+TCCTAGCGGGGCGCGGACGTCTTGAGCGTGTCGGCCGAGGTGTGTACCGGGTGCCCGTGCTGCCGCGTGG
+TGAGCACGACGATCTCGCAGCCGCAGTGTCGTGGACTTTGGGGCGTGGCGTTATCTCGCATGAGTCGGCC
+TTGGCGCTTCATGCCCTCGCTGACGTGAACCCGTCGCGCATCCATCTCACCGTCCCGCGCAACAACCATC
+CGCGTGCGGCCGGGGGCGAGCTGTACCGAGTTCACCGCCGCGACCTCCAGGCAGCCCACGTCACTTCGGT
+CGACGGAATACCCGTCACGACGGTTGCGCGCACCATCAAAGACTGCGTGAAGACGGGCACGGATCCTTAT
+CAGCTTCGGGCCGCGATCGAGCGAGCCGAAGCCGAGGGCACGCTTCGTCGTGGGTCAGCAGCTGAGCTAC
+GCGCTGCGCTCGATGAGACCACTGCCGGATTACGCGCTCGGCCGAAGCGAGCATCGGCGTGACCAAGCCC
+TATTCGTCGCCGCCAACGAACCTGCGCTCACTACGAGATCGGCTCACCCAAGTAGCGGAACGGCAAGGTG
+TCGTGTTCGGTCGACTGCAGCGGCATGTCGCGATGATTGTTGTCGCACAGTTCGCGGCCACGCTCACCGA
+CGACACCGGCGCTCCGCTGCTGTTGGTCAAAGGCGGATCGTCGCTGGAACTGCGCCGGGGAATTCCCGAT
+TCGCGGACCTCCAAAGACTTCGACACGGTCGCACGTCGCGATATCGAATTAATCCATGAACAGCTCGCTG
+ACGCGGGCGAGACGGGGGGGGAAGGATTCACTGCAATCTTCACCGCCCCCGAAGAAATCGATGTTCCTGG
+TATGCCGGTCAAGCCGCGCCGATTCACCGCCAAGCTGAGCTACCGAGGCCGGGCTTTCGCAACTGTTCCG
+ATCGAGGTCTCCTCCGTCGAAGCCGGCAATGCCGACCAATTCGACACCCTCACCTCAGACGCGCTCGGCC
+TCGTGGGCGTACCCGCAGCAGTCGCCGTACCCTGCATGACCATTCCCTGGCAAATCGCGCAGAAGCTGCA
+CGCAGTAACTGCCGTGCTCGAAGAACCGAAGGTCAACGACCGCGCTCACGACCTGGTGGACTTGCAGCTT
+CTTGAAGGACTGTTGCTCGATGCCGACCTCATGCCGACGCGCAGCGCGTGCATCGCGATATTCGAAGCGC
+GCGCCCAGCATCCTTGGCCACCGAGAGTCGCCACGCTGCCGCACTGGCCGCTGATCTATGCAGGTGCGCT
+GGAGGGGCTTGACCACCTTGAACTCGCCAGGACGGTCGACGCGGCGGCCCAGGCAGTGCAGCGATTCGTT
+GCGCGGATTGATCGGGCGACGAAAAGATGAGTGCTGGCGCGGCCTGCGGCGCACGGGAGAACACAGGGAC
+CACCCCGGTTCCATAGTCAACGTCAGCGGTGCGGGTGTCGATCAGACGACGAATGGAATCGCCCTCGCAT
+TCCTCGCGATCGAGTGCCTATGAGCCGCGCTCCTGCGGCCTAGGCGAGCGCTTTCCGGGGCTCTCAGACA
+TCGGCCTCGTGGCGGTGTGCGCGGCGGCATGTGGCTCTGTGATCTCTTGCGCGAGCGCCGATTGCGAATT
+TCGTCCGGCGAAAAGTGACCGCTCCGTGACCTTAATGCAAGAGGTGTGTGGTGTGGAGAGGGGCGGGAGG
+AAGGGAGTGAGGCGACGGTGTCGAGATGCAGCGAGGATTGGTGGACTTCCGGTAGTTGTTTAACAAGGCC
+CCGGAGACCAGGGGGCGAGGGAGAGCGCGGGCCGACTTGGGTGGGTGAGCCTGGCTTGGGCTGGTGCGTG
+AGCGGAGGATCGCTGGTGGCCCCGTAGTTGGCGTTGGCCTGCGGACGTGCCGCGCCTGCGAGGGATTCGT
+CAATCTTCCTGTTGATGTCGCCCGTGCCACGTCGGTGAGATGTCGAAGGGATGTGACCTGGTGCGTTCGC
+GAACAGCTGCTGACCACGGCCACCGACGGCGCTCAACTGTCGTCGATTCCATCCCACCCGTGCTTGGACT
+TTCAAACTGTCCGGCGCCGATGGGGAAACCTGGTGTTTGGCCGGAACGTGGCGCCGAGCCTCGATAATAT
+CAGCAGTTACGTCCAGGGGTGTGGTGTACGGGCAGGTAAGGCCGGTGGGCGTGTCGTAGCCCAGTAGTGG
+GCGGTCATCGCGTGATCCTTCGAAACGACCAGCAAAAGTCAATCGAAGGAAATGACGCAATGACCTCTTC
+TCATCTTATCGACACCGAGCAGCTTCTGGCTGACCAACTCGCACAGGCGAGCCCGGATCTGCTGCGCGGG
+CTGCTCTCGACGTTCATCGCCGCCTTGATGGGGGCTGAAGCCGACGCCCTGTGCGGGGCGGGCTACCGCG
+AACGCAGCGATGAGCGGTCCAATCAGCGCAACGGCTACCGCCACCGTGATTTCGACACCCGTGCCGCAAC
+CATCGACGTCGCGATCCCCAAGCTGCGCCAGGGCAGCTATTTCCCGGACTGGCTGCTGCAGCGCCGCAAG
+CGAGCTGAACGCGCACTGACCAGCGTGGTGGCGACCTGCTACCTGCTGGGAGTATCCACTCGCCGGATGG
+AGCGCCTGGTCGAAACACTTGGTGTGACAAAGCTTTCCAAGTCGCAAGTGTCGATCATGGCCAAAGAGCT
+CGACGAAGCCGTAGAGGCGTTTCGGACCCGCCCGCTCGATGCCGGCCCGTATACCTTCCTCGCCGCCGAC
+GCCCTGGTGCTCAAGGTGCGCGAGGCAGGCCGCGTCGTCGGAGTGCACACCTTGATCGCCACCGGCGTCA
+ACGCCGAGGGCTACCGAGAGATCCTGGGCATCCAGGTCACCTCCGCCGAGGACGGGGCCGGCTGGCTGGC
+GTTCTTCCGCGACCTGGTCGCCCGCGGCCTGTCCGGGGTCGCGCTGGTCACCAGCGACGCCCACGCCGGC
+CTGGTGGCCGCGATCGGCGCCACCCTGCCCGCAGCGGCCTGGCAGCGCTGCAGAACCCACTACGCAGCCA
+ATCTGATGGCAGCCACCCCGAAGCCCTCCTGGCCGTGGGTGCGCACCCTGCTGCACTCCATCTACGACCA
+GCCCGACGCCGAATCAGTTGTTGCCCAATATGATCGGGTACTCGACGCTCTGACCGACAAACTCCCCGCG
+GTGGCCGAGCACCTCGACACCGCCCGCACCGACCTGCTGGCGTTCACCGCCTTCCCCAAGCAGATCTGGC
+GCCAAATCTGGTCCAACAACCCCCAGGAACGCCTCAACCGAGAGGTACGACGCCGAACCGACGTCGTGGG
+CATCTTCCCCGACCGCGCCTCGATCATCCGCCTCGTCGGAGCCGTCCTCGCCGAACAACACGACGAATGG
+ATCGAAGGACGGCGCTACCTGGGCCTCGAGGTCCTCACCCGAGCCCGAGCAGCACTGACCAGCACCGAAG
+AACCCGCCAAGCAGCAAACCACCAACACCCCAGCACTGACCACCTAGACTGCCACCCGAAGGATCACGCG
+AGGAACCTTCACTCGTACACCACGTCCCTGGCCTTGGCCGAAGGTAGAACGCCAGCACGACTTGCTGTTG
+TCAACTCTTGCGAGTTACGTGAGTGCGGCCGGAGCACACGCTCGTATCGTCGTCACAGTCGAAGGGCGCG
+ATCTTGAGTTCGACATATCGACCTTCGCCCTTGTGGGCCCGCAGCAGCTGCCCGAAGTCGAGCCGTCGCA
+GTAGTGACCGGGGGCCCAGTTAGCGATGGCTTTGTCACTGTGGAGGGTCTCCCTCCCGTAGTGATGCACC
+ACTCGCACGAGAGCCAATTCGGCCGCCCGTCGCGCCGCAGCAGAGCGCGGTGGCTCTTCGTCGTTCATTT
+GGTCATCGCCTCGCGTAGATGTTCCGCCGCGTCTTCGCCGCGGACGCCGGCCGTGCGTAGGTCGGCGTAT
+ACCCTCGGCCATAACATCGACCTAAACCCCTGCAGGTTCTGTTCGGTCAGCCGGGCGCACGCTGGGGTCG
+GGAAGAAGCGCAATATCAACCGACCGCCGGCGATTTCCTGCAATCCCGCAGCCATTGCTGCACGGCGAAG
+ATCGCTCCATGATCGCCCGGGCACGTAGATTTCCATCGGAGCTATTTCCGTCTGCATTGGCGCGAGCAGG
+CTCGCCGACAACGCGCTTGTGGCTGCCCACTCAATGCCTGCGGCATCCCACAACTGGCCGGCCTTGACCA
+CGCCGGCAGTCGGATCGCGCCACAGCACACCAGTCGAAATAGAAATCGGCGACCGAAGCTTGTCTGCTGC
+CTCAGCGTATGCATCCAACAGCGCATCGCGATCAACGATCAGGCGCGCCGATTTCGGGCCGCGGGCAGTG
+GCACTGGCCAGATGGCCGTTTTTTTCGAGAAACTTCAACGCCTGAGCGCTGCTTCCCATCGAGAGACCGG
+TGGCCTCTACAACCGAGGCGACAGTTGGACCGGCGATGTTCGCCAGCAGCGCTTCACATACGGCAAGTGT
+GGCGCGGCGCCAGCCTATGCGCGCGTCGAGTGGGGCAGGTGGCGCGCCTTTCGTCTCGATCACCAGAGTG
+GTTCCAGTTGATGTGTTTCGGTAGTGGATATCGGCAGCGCCCGACTCGTCCACCCACCCAACACCGGCGT
+CATGTGCCGCCTTCCGGGCACCAGGAGACATCGTGGGTGCAGCCAAAATGTCGGGCCGGGATGTGGCGTG
+GAGTGCCTCGGCTACCTGACGGGGCCAACCAGTCGTGAGCCAGCGAACCAGGAACTCTGCGCCGTCGAGC
+GACACAATCACGTCGCGATGAGGGCCGTTTACGCGTCGTGCGCGCACTTCGCTGCGAAACGCGCCTTCCA
+GCGCACTCACGGTGCGTTCGTCCCAAGACATGGAGGCATCATACTTCACTAAGGGACGATACTCTACTGT
+TTCAGTGAAGTACCATCTACGGATGAAGTTCGATTGCCACGTGCGATCCGACGCTTGCACTTCGCTGGCG
+GGCCGCGAACCCGATCAGCTCCTCCAGGTCGTCGGCACGGGTCAGCAAGGCGGCGCTGTCCGGGTGGGCG
+CGCATGCCAAACACCAGTCGCTCACCGTCGGGGTCAAGCAACACCAGGTCGCGGAGCATGGTGGCGGGCG
+GAACCCACACTTCGGGCTAGCTCTAGGGGGCAGGGCTTTGACGGGTCTTGACAAATACGTGTAGCTACAC
+GAGTCTGGAGTAATGGGCAAAGGGGCGGCGTTCGACGAATGCGCTTGCTACACCACCCGGCGGGCGGCCC
+GACAGCTCGGCCAGGCCTATGATCGCGCGCTGCGGCCGAGCGGGTTGACGAACACCCAATTCAGCACGCT
+GGCCGTGATCTCGCTGTCGGAAGGCAGCGCCGGGATCGACCTCACGATGAGCGAGCTTGCCGCCCGCATC
+GGCGTTGAACGCACGACGCTAACCCGCAACCTCGAGGTGATGAGGCGCGACGGACTGGTGCGGGTCATGG
+CGGGTGCCGACGCGCGGTGCAAGCGCATCGAGCTGACCGCGAAGGGCCGCGCGGCACTGCAAAAGGCGGT
+GCCCCTATGGCGCGGGGTGCAGGCGGAGGTGACCGCAAGCGTCGGTGACTGGCCACGGGTGCGACGCGAC
+ATCGCGAATCTGGGTCAGGCGGCGGAGGCGTGTCGGTGATCTTTTTGCGCATATATGTGTAGTTACACCC
+AACTGAGGAGCAAATGATGGCTAGGCAGAGATTTCGTGACCAGGTGGTGTTGATCACCGGTGCCTCCAGC
+GGCATCGGGGAGGCGACCGCGAAGGCATTCGCCCGTGAGGGCGCCGTGGTCGCCTTGGCGGCGCGCCGCG
+AGGGTGCGTTGCGCCGGGTTGCCCGGGAGATCGAGGCCGCGGGTGGGCGGGCGATGGTCGCCCCGCTCGA
+CGTCTCGTCGTCGGAGAGCGTGCGCGCCATGGTTGCCGACGTGGTCGGCGAGTTTGGTCGCATTGACGTC
+GTGTTCAACAACGCCGGCGTCTCGCTGGTAGGCCCGGTCGACGCAGAGACCTTCCTTGACGACACTCGCG
+AGATGCTGGAGATCGACTACCTCGGCACGGTGCGCGTGGTGCGGGAGGTCTTGCCGATCATGAAGCAGCA
+ACGATCGGGACGGATCATGAACATGTCGTCGGTGGTGGGTCGCAAGGCCTTTGCGCGATTCGCCGGCTAC
+TCCTCCGCCATGCACGCGATCGCCGGTTTCTCCGATGCGTTGCGCCAAGAGCTGCGGGGTAGCGGAATCG
+CCGTCTCGGTGATCCACCCGGCGCTGACCCAGACACCGCTGTTGGCCAACGTCGACCCCGCCGACATGCC
+GCCGCCGTTTCGCAGCCTCACGCCCATTCCCGTTCACTGGGTCGCGGCAGCGGTGCTTGACGGTGTGGCG
+CGGCGGCGCGCCCGCGTAGTCGTTCCATTTCAGCCGCGGCTGCTCATGGTGGGTGACGCGTTCTCGCCGC
+GGTACGGCGACCGGGTGGTCCGCTTGCTCGAGAGCAAGATATTCGGTCGCCTGATCGGTTCCTATCGGGG
+TTCGGTATACCGCCATCAGCCGACCGAATCAGCGAAGGCACAGGCGGCCCAGCCCGAGCGCGGGTACTCG
+TCGGCCCGGTGAGGTTGGTTGGAGCCAGGCTCCACGTCGCTGAGGCGAGCGGCGTGCGCAGCGCGTAGCG
+GCTCGTCGGCACGGTGTCGATGGTCTCCTTGGCGCTGAATCGCGACGTGCTGGCGATCACCCGGGCAAGC
+CGATCACGCAGTTCGTCGTCGGGCGCCAGCTCAACGTCGAGTTGCGCTCTCCCGCTTTGAGATCCAGCGC
+GACACCTCGTCGCGCCGGTACACGACGCGCCGTCCCAAGGTGAAGCTCGCCGGTCCGATGTCCGAGTGCC
+GCCAGTGCCGTAGAGTGCCGACGGGAACGCCGATCATCTCCGAAACTTGTTTTGCGTCCAGCAGATCCAT
+GTTTCTCCTCCCGACATGGGCTGGTTTCCAATGTCTCCAACAGTGCTGGCAGCGTCCGTGTTCGGTCGCC
+CATTTCGCTTGCGCGACTGCGCCATAACCGGCCAGGTGAGGCGCGACGGGTTCGAGAGTGGCGCCGCGGT
+ATTGTGCGACTGCCCTGGCCGAGCGGAGCAGCTCGTCGTCGTCGATGCCCCGGCGGTCGAGTTGGACGAT
+GTCGACGTAGTCCCGCCAGCGGGTGCTGGTGATGCCGCGTTCGAGGATGGTCACTCCCTTCTCGGCGATG
+ATGGTCTCGGGCGCGTAGCCCAGGAGTGTGATCGGCTCGCCGAGGATCCGGTCGATGGTCACCCGTGTGG
+GCCACGGCGCGATCGGTTCGCCGGTGGACACATCCCAGGCCGCGATGCCCTGCCACGGTCCGACCGACAT
+AGCGACTCGCACGCGCAGGCCCGGGTAGTCGGCCCGCTCGCGAATTTCCTGCACGCTGCTCGTGTCGAGG
+TTGAACGCCACCCCGTCGTCGATGTCGATCACGGCGATGTCGCGAACCACCTGGGTGAGATGCTCGGCGG
+TGACGTCGGCGCGCATGGCGTTGGAGTCGGTGTCCTTCGTCGGGTGCCGAACGCCGTAGGCGGCCAGCAG
+GATCCGGCCTTTGAGGACGAAGTCTGCAGCATGCGAGGTGCGGGTGAGCCGATCCAGGAACGATTCGAGG
+GTGTGTCGAGTCAGGTACTCCTGCGTCGGTGCGCCGGTCCCGCACTTCGAGGCAGTAGAACGAGCGAGGA
+TTGGATCCGGCGGGACACCGTGTCGCCGGAGCTCACGCCAGCATCGCCAATGTTTGTAAGACCGGGGACT
+TCTCCCGCGGTAGGCGGGTGGCGATCTCGATCAGCCGGGCGGGTTTGCCGCCTCGGCGCAGCCACTCTCG
+CAGCGCGTCACGCGCCAGTTCGTAACCGACTTCGTAGCGGAGCCGGAATGTATCGGCGATCGAGCGCTCG
+GGTGAGTTAGATTCCGATTGTCTGATCCGATCCCGGGATCGTGATCTCGTCGCGTCCGATCTAAAATGTG
+GCCCGGTCGAAGTGGTGCCACGCAATCGCGCCTGTGCTGGCCGGTGTCCTCGACCAGCGGGGGATGGCGA
+TGTCCAGCGCGGCGGGGATCGCGTCGGTCAGGTCGTGGTGCGTGAGTGCGGAGGCCAGGCAGATCGTAGC
+GTCGGGGCGGCGCGTGGCGGCCTCGATCCGATCCCAGTCGGCGGTCGACGCGTCTACGGGTAGGTAGATG
+CCGCGGGCGATGCGGTCCCAGCGGCCTGCCTGCGCGCCGCGGTAAAGCGCGCTGCGCGAGGCCGGCCCGC
+CCCGCAGTGCTCGGTGTCAGGGCTTCCACGGCGCCTATCCCACTCGTCTTTGGTACGGAACGTAGGCAGA
+TAACTCTATGTGTAGACGTTTCGTATCGATGCCTGAGGAAATCGGGAACAGGCCCCGCGGGCGCATGGCT
+ATTGGGAGTACGGCGGGGCACTGACATTGCGAGGCCACCGTCGGTTGGCGCCGGTAGCATGGGGATTTGT
+CGATGCTTGGTGAAGGAGCAACCGTGGGCGGTGAGACGCCTAAGAAGGTGGTCGTCTCATGGACTGCTGT
+GAAGAACGCGGGGTCGCGCGCCACAAGGGCCTCAGCCAAGTTGGAACGCCGGGTTGTCCCCGTTGGTCAC
+AAGCGGTCAGCTGCCGTTGCAGCGCATATCGAGAAGCAGCGGTCACCGCAGTCCAGATGCCGCTGACGCC
+CGGCTACGGTGAGACCCCGCTTCCGCACGACGAACTGGCCGCGTTGCTCCCCGAGGTTGTCGAGGTGTTG
+GACAAGCCGATCACGCGCGCTGATGTTTATGACCTCGAACAGGGCCTTCAGGACCAGGTTTTCGATCTAT
+TGATGCCGACGGCTGTTGAAGGCTCGTTGTCGCTTGATGAGCTTCTCAGTGACCATTTCGTCCGCGATCT
+CCACGCGCGTATGTTTGGTCCGGTATAGGACTGGGCCGGGCGGTGGTGACGACGTGAACTCAACATCGGT
+GTTGCACCGGAGCAGGTCGCCGTCGAGGTACGCAACGCGCTCGACACCATCGCGTACCGCTGGGTGCACA
+CCGATGATTGGACCGGTCGGCAACTGGGTATTGTTGTTCATGCAGACCTTGTGCGAATCCATCCGTTCAC
+CGATGGAAATGGGCGCACCACAAGGCTTCTCGCTGATTTGGTGTACGCGACGGTTCAGAATCCCACCGAG
+CTGCAGTATGACTGGGAGCTCGATAAACTGCGCTTACGTCGAACTACTTCGCGGCTACGACCGAGACCGG
+GACATTGCGGCGCTCGCCGCCTTCATCGGTGTGCGGCCCATCGAGACATAGGCAGGCTGTCTTGTTGAAG
+CCGGCGACCGGGCGACCCAAGCGGAGGAGGTACCGCGGATCACTGCGGTACCGTCGACGCGGTGGCAACC
+AGGCATCAACGGGCGGGGATTGACGACCGCTGGCATAAGCGGGTCAAAGGGCCGGACGGGAACAGGCGAA
+CCGTGCGGTCTGCTGTCTGCGGCAGGGTTTCGCGCTGGCGCGTCAGGTGGGTTGACGGCGGCGGAGAGGA
+GCACAGCAAGAGCTTCCAGCGCAAACCTGACGCGCAGGCACCTGACCCATGCCGAACTGTTGATGCTCGC
+CAGGGCCACGGGCCGGTTCGAAACGCTCACCTTGGTGCTCGGCTACTGCGGCTTACGGCGGTTTACGGTT
+CGGTGAGGCTGTTGCCCTGCGGCGCAAGCATGTGGGGGATCGCGTGCTGACCGTCCGATCGTCCCCTACG
+GCGGTGACCGGCAAGGGCATCGTTGAGTCGACGACCAAGACGAAGCGGGATCGTCACGTACCAGTGCCTG
+AGCCTGTTTGGCGCAGGCTCCATGCCGAGTTGCCCACCGACCCGAACGCCTTGGTGTTCCCCGGCCGTAA
+GGGCGGATTCCTGCCTCTCGGTGAATACCGCTGGGCATTCGACAACGCCGGCGACCAGGTCGGGATCGAA
+GGCTGGTACCGCACGGTCTGGGGCACACCACGGCCTCGCTGGCGATCAGCGCAGGCGCTAACGTCAAGGT
+CGTGCAACGGCTCCTTGGACACGCAGCAGCGGCGATGACGCTCGACCGGCACGGCCATCTGCTCAACGAC
+GATCTAGCGGTGTGGCCGATGCGCTGTGCAAAGTCATCGAGAACACTGCGGTATCACTGCGGTATGCGGA
+GACGGAACAGAGTCGGGCTCCGGGCATGAGATAGCGCGTCTGAACTGCAACGCCCCCATAGCCCAATTGG
+CAGAGGCAGCGGACTTAAAATCCGTCAAGTGTCGGTTCGAGTCCGACTGGGGGCACGGGGAAATCGTTGT
+TGGCAAGTCATGGCGTTGGGCACTGCTGCTGCTCGCCGCTCAAGCCAGCAACCCAACCTGGCGATACGTT
+GGTTTGAGCGGGGCGACTCCCGTCGGGCCACCTACGCCCCGCCTGTTGCTATGGCCGGACAAGGAGCATC
+GCGATGAGCGTGGATTACCCCCAAATGGCTGCTACCCGGGGAAGAATAGAACCGGCCCCGCGGCGAGTTC
+GCGGCTATCTCGGACATGTGCTCGTCTTCGACACCAGTGCGGCGCGCTATGTCTGGGAGGTTCCCTACTA
+CCCGCAGTACTACATCCCGCTGGCGGATGTCCGCATGGAGTTCCTGCGCGACGAGAACCACCCGCAGCGA
+GTGCAGCTGGGTCCGTCGCGGCTGCACTCCTTGGTAAGCGCCGGTCAGACCCACCGATCGGCGGCGCGGG
+TATTCGATGTCGACGGCGACAGCCCGGTGGCGGGCACCGTGCGTTTCAACTGGGATCCGCTGCGGTGGTT
+CGAGGAGGACGAGCCGATCTACGGCCATCCGCGCAATCCCTATCAGCGGGCCGATGCGCTGCGCTCGCAC
+CGACACGTCCGTGTCGAGCTGGACGGCATTGTGCTCGCTGACACCCGATCGCCCGTTCTGCTATTCGAAA
+CCGGGATACCCACAAGGTATTACATCGATCCGGCCGACATCGCTTTCGAGCATCTGGAGCCCACCTCGAC
+GCAGACGTTGTGTCCGTACAAGGGGACGACGTCGGGCTATTGGTCTGTGCGCGTCGGCGACGCCGTGCAC
+CGCGACCTGGCCTGGACGTATCACTATCCACTGCCCGCCGTTGCCCCGATCGCCGGCCTGGTGGCGTTTT
+ACAACGAGAAGGTCGACCTCACCGTCGACGGCGTCGCCCTGCCGCGGCCGCACACTCAGTTCAGCTAGTG
+CTTGGTTTGTTCGCCGGTTGGCGGCCGCCAGCATGGTCAACCTCATCTAGGGCGTGGGTGTCGGGGCGCA
+GCAGGCTGCCGGCGATCTCGCGGACACCGTCTTGGCTGTGCCCAATCTAGATTCCGATCGGCCTGAGTCT
+TCTTCTGCCGGCGCAGCGCATCGGCGCGGGCCACGATTGCATCGACGTGGACGGCCAGCCGGCGCTGGGT
+CATCGACGGCCAGCGAGCCGCCCTGAGAGCGAGCTCGGCGGCCACGGCGCCAACACCTCACCGTCGACGG
+TCAGATCGCTGCGACACACGATCGTTTGAAACATCCGGTAGTCGATGTCGCCGGCGGTGAAGACTTGGCC
+GACCATGGCTAGGCACTCGCGCATACCGCAGCTGGCTGGCCGTTGGCCCCTGGCTGATCCGCAAGGCCGC
+ACCGACCTCAGCGATCACCGCCGCCTGTGACCACTAACCAGTCTCATCGAAAATATATTCGATACAGCCA
+CTTGCCGTCGACATTGACCATGAGGCGTTCACGTCGCAGGGCCGACGAAATATGCTGAGACCTGCCTACT
+CGTGTGCAATGTGATATTAGCCTCATTTTGATTTGAATTATGAGAATTTCTTATTTCCCAGTTATGGGGA
+GCGTGTGCTGGTTGTTAGCGAAGTACGCTAAAACTGCAGTTACTGCTCATAGCACTGGTTTGCCACATAC
+CCCGTATCGGGATACGTCATGATCGGTATCCTGAGCGGAACATAAGGCGGTCACGTGACCTAGGTAACAG
+CGTCTAATTCGTGAAATTTTTGATCAGAATTTGGTCGCTAGACTTATTCCAGCCCAGTATGAATCAGCGC
+TTTTGGTGCCGAAATGCGGCGAATCCCGGGCAGTCGGCGTCGCACAGCACGGTTGCTGTGCTGTCGCAAG
+CCTGGAGGCCCGCAGACACAGCAAGCGAGGAGCGGCGCGTATGAGCCGCGCCGGCGACGATGCGGAACGA
+AGTGATGAGGAGGAGCGGCGCATGAGCGTTATGAACGGCCGGGAGGTCGCTCGAGAGAGCAGAGATGCCC
+AGGTCTTCGAGTTCGGCACCGCACCGGGCTCCGCCGTGGTCAAGATTCCGGTGCAGGGCGGTCCGATCGG
+TGGCATCGCCATCAGCCGCGACGGCAGTCTGCTGGTAGTGACCAACAACGGCACCGACACCGTCTCGGTC
+GTCGGCACCGACACCTGCCGGGTCACCCAGACCGTCACCAGTGTCAACGAACCGTTCGCGATCGCCATGG
+GCAATGCGGAAGCCAACCGCGCGTACGTCAGCACGGTGTCGTCGGCGTACGACGCGATCGCGGTCATCGA
+CGTGGCCACGAACACCGTTCTCGGCACCCATCCGCTGGCGCTCAGTGTGAGCGACCTGACACTCAGCCCG
+GACGACAAGTACCTGTACGTCAGCCGAAATGGCACTCGCGGTGCTGACGTTGCGGTGCTGGACACGACGA
+CGGGCGCACTGATCGACGTCGTAGACGTTTCCCAGGCGCCGGGCACCACCACGCAATGCGTGCGGATGAG
+CCCGGACGGAAGTGTCCTGTACGTCGGCGCCAATGGGCCATCCGGCGGCCTGCTCGTCGTGATCACGACC
+CGCGCGCAGTCCGACGGGGGACGCATCGGGAGTCGCTCGCGTTCGCGGCAGAAGAGCTCCAAACCCCGGG
+GTAACCAGGCGGCGGCGGGCTTGCGCGTGGTGGCGACCATCGACATCGGGTCATCGGTCCGCGACGTCGC
+GCTCAGCCCCGACGGTGCCATCGCCTACGTCGCCAGCTGCGGCTCCGACTTCGGGGCAGTGGTCGACGTC
+ATCGACACTCGCACCCACCAGATCACCAGCTCGCGCGCGATCAGCGAGATCGGCGGGTTGGTCACCCGGG
+TGAGCGTTAGCGGCGACGCGGATCGCGCCTACTTGGTCAGCGAGGATCGGGTGACCGTGCTGTGCACCCG
+TACGCACGATGTCATCGGCACGATCAGGACCGGCCAGCCGTCGTGCGTGGTCGAGAGCCCGGACGGAAAG
+TACCTGTACATCGCCGACTACTCCGGCACCATCACCAGGACAGCGGTTGCCTCGACCATCGTGTCCGGGA
+CCGAGCAGCTGGCGCTACAGCGCCGCGGGTCTATGCAGTGGTTCTCGCCTGAGCTGCAGCAGTACGCGCC
+GGCGCTCGCCTAGCTCGAACGCGCTTCTCGGGGGAACCCGTTTCTCATGACTTCTCGCGGCGATAGCATT
+CGCCCGAGGAGGACATGAGGCGCGCCGAGACCCGTAAGGCGGTACATCGATGTACGGCACGATGCAGGAC
+TTTCCGTTGACGATCACCGCGATCATGCGCCACGGCTGCGGTGTCCACGGGCGACGCACGGTCACCACCG
+CGACGGGTGAGGGCTATCGGCACAGTAGCTATCGCGATGTGGGGCAACGAGCTGGCCAGCTGGCAAATGC
+GTTGCGCCGCCTCGGTGTTACCGGGGACCAGCGGGTTGCCACGTTCATGTGGAACAACACCGAACACTTG
+GTGACCTACTTCGCGGTCCCGTCGATGGGCGCGGTGCTGCATACCCTCAACATCCGGCTCTTCCCCGAGC
+AGATCGCCTATGTCACCAACGAGGCCGAAGACCGCGTCATTCTGGTCGACTTGTCATTGGCCAGACTGCT
+CGCGCCGGTGCTGCCCAAACTCGACACCGTGCATACCGTGATCGCGGTAGGAGAGGGCGACACGACGCCG
+CTGCGGGAAGCTGGCAAGACCGTGCTGCGCTTCGCCGAATTAATTGACGCCGAATCCCCCGACTTCGGGT
+GGCCGCAGATCGATGAGAACTCCGCGGCCGCAATGTGTTACACCAGCGGTACTACCGGCAATCCCAAAGG
+CGTTGTATACAGCCATCGTTCGAGCTTTCTGCACACGATGGCGGCCTGCACCACAAACGGTATCGGGGTC
+GGGTCCAGTGACAAGGTGCTGCCGATCGTGCCGATGTTTCATGCCAACGGGTGGGGGCTACCGTATGCGG
+CCTTGATGGCGGGTGCGGACTTGGTGCTACCCGATCGGCATCTCGACGCCCGCTCGCTGATCCACATGGT
+GGAGACGCTGAAGCCGACGTTGGCCGGCGCGGTGCCAACCATCTGGAACGACGTCATGCATTACCTAGAG
+AAGGACCCCGATCACGACATGTCATCGCTGCGTCTGGTCGCCTGCGGCGGATCGGCGGTTCCGGAATCGC
+TGATGCGCACCTTCGAGGACAAGCACGATGTCCAGATTCGGCAGCTGTGGGGCATGACGGAAACATCGCC
+GCTGGCCACCATGGCCTGGCCGCCACCTGGCACCCCGGACGACCAGCATTGGGCATTCCGCATCACTCAG
+GGCCAACCGGTGTGCGGGGTGGAGACCCGGATCGTCGACGACGATGGCCAGGTGCTGCCCAACGACGGCA
+ACGCCGTTGGCGAGGTGGAGGTTCGCGGGCCCTGGATTGCTGGCTCGTATTACGGGGGACGTGACGAGTC
+CAAGTTCGATTCCGGCTGGTTGCGCACCGGTGACGTCGGCCGCATCGACGAGCAAGGCTTCATCACCCTG
+ACCGACCGCGCCAAAGACGTCATCAAGTCCGGCGGTGAATGGATCTCCTCGGTTGAGTTGGAGAACTGCC
+TTATCGCGCACCCGGACGTGCTCGAGGCCGCGGTCGTCGGCGTTCCCGACGAGCGCTGGCAGGAACGGCC
+GCTGGCGGTTGTCGTAGTTCGGGAAGGGGCCACCGTTAGTGCTGGTGATCTGCGAGCATTCCTGGCGGAC
+AAGGTCGTTCGCTGGTGGTTGCCGGAGCGGTGGGCGTTTGTCGACGAGATTCCCCGCACCAGCGTGGGCA
+AGTACGACAAGAAGGCCATCCGTTCTCGCTACGCCGAAGGTGCCTACCAGATCACCGAGGTGCACACTTG
+ACCCGCGCGAGCAGACGCAAAATCGCCCATTTTCGTGTCGAAATGGGGGCTTTTGCGTCTGCTCGCGGGT
+AGAAAGGTGACCATGAGCCTGCGGGTCATTCAATGGGCGACGGGATCGGTCGGTGTGGCGGCGATCAAAG
+GCGTGCTGCAGCATCCCGAACTCGAACTCGTAGGCTGCTGGGTGCATTCGGCGGCCAAGAGCGGCAAAGA
+CGTCGGCGAAATCATCGGTTCACCACCATTGGGCGTGATCGCGACTAACAGCATCGACGACGTTTTGGCG
+CTGGACGCCGACGCGGTGATCTACGCGCCATTGCTGCCCAGCGTCGACGAAGTCGCCGCGCTGTTGCGTT
+CGGGCAAGAACGTGGTCACTCCGCTTGGGTGGTTCTATCCGAGTGAAAAGGAGGCCGCCCCACTGGAAGT
+CGCCGCGCAGGCCGGCAATGCGACGCTGCACGGCGCCGGAATTGGGCCCGGGGCTGTCACCGAGCTGTTC
+CCGTTGCTCCTGTCGGTGATGTCCACCGGTGTGACTTTTGTTCGCTCCGAAGAGTTTTCGGATCTGCGCA
+GCTATGGAGCGCCGGACGTGCTGCGCTATGTGATGGGTTTCGGCGGCACACCGGACAGCGCGTTGACCGG
+ACCGATGCAGAAAATTCTGGACGGGGGCTTCCTGCAGTCGGTACGGCTGTGTGTCGACCGGTTGGGCTTT
+GCCGCCGACCCCCAGATCCGCACTTCGCAGGAGGTGGCGGTTGCGACCGCCCCGATCGACTCGCCGATCG
+GAGTAATTGAGCCCGGACAGGTGGCCGGACGCCGCTTCCATTGGGAGGCGCTGGTCGAGGACACAGTGGT
+CGTCCAGATCGCCGTGAACTGGTTGATGGGATCGGAAAATCTGGATCCCCCTTGGTCATTCGGGCCGGCC
+GGAGAACGCTACGAGATCGAAGTGCGCGGCAGCCCGGACACCTGCGTCACCATCAAGGGTTGGCAACCGC
+AGACCGTGGCGGCCGGCTTGAAGAGCAACCCCGGGATCGTGGCAACCGCGGCGCACTGCGTCAACGCGAT
+CCCGGCAACCTGCGCCGCCCCGGCGGGGATCCAGAGCTTTTTCGACCTGCCGCTCATCACCGGCCGGGCC
+GCTCCCGGGCTGGCACGCTAGAGTTGCTGGCGGCGTCCCCGGCCGGGATGTCGAGAATCGGACGGGTAAT
+CCAATGGCAAAGTCTGTCGTCGTCGAGCAATCGCGAGCGATTCCGGTGCAATCCGAGGATGCGTTCGGTG
+GCACGCTGGCGGCAGCGCTGCCGGTGATTTGTTCGCACTGGTACGGCCTGATCCCACCAATCAAGGAGGT
+CCGGGATCAAACGGGTGCTTGGGATTCTGTCGGACAGGCCCGTGTCATCACGATGGTCGGCGGCGGGCGC
+GTGCGCGAGGAGCTGACCAGTGTCGACCCGCCGCGGTCGTTCGGCTACACGCTCACCGACATCAAGGGCC
+CGTTGGCGCCGCTGGTCGCGTTGGTGGAGGGCAAGTGGAGCTTCGCTCCCGCGGATACCGGAACCACGGT
+GACCTGGCAATGGACCATCCATCCTAGATCGGCGCTGGCCGCGCCGGTGTTGCCGGTGTTCGCCAGGATG
+TGGCGGGGCTACGCGCGCGGGGTGCTCGAGAAGCTTTCCGCTTTGTTGGTGGGCTGAGCGGCGCTGCCGG
+CTTCGTCTACCGTCGGGGTCATGTGCCGACTCTTTGGCTTGCACTCCGGAACCGATGCTGTCACCGCGAC
+GTTTTGGTTGCTGAACGCCTCGGATAGCCTGGCCGAGCAAAGCCGACGAAACCCCGACGGCACCGGCCTT
+GGTGTATTCGACGAACACCACCAGCCGCGGCTACACAAGCAACCAATAGCGGCCTGGCAAGACGCCGACT
+TCGCCACCGAAGCCCACGAGCTGACCGGCACGACGTTCGTCGCCCATGTTCGCTACGCGACGACCGGGTC
+GCTCGACATCCGCAATACCCACCCATTCCTGCAAGACGGGCGGATCTTCGCACACAATGGGGTGGTCGAA
+GGACTGGATGTCCTCGACGAACGGCTGCGCGAGGTCGGCGCCGATGACCTGGTGTTGGGCCAGACCGACT
+CCGAGCGCGTATTCGCTTTGATCACCGCTTCGATCCGCGCCCGGGACGGCAACGAATCAGCCGGTCTGAT
+TGACGCGCTGAGGTGGCTCGCGGCGAATGTGCCGATCTATGCCGTCAACGTGTTGCTCAGCACCGCGACC
+GATGTATGGGCACTGCGGTATCCGGAGTCCCACGAGCTGTATATCTTGGACCGCCGCGGCGACGGTGCGC
+CCGAGTTCCACTTGCGAAGCAAGCGAATCCGCGCACACTCGACGCACTTGCGCGAACGGTCGTCGGTGGT
+GTTCGCGACTGAACCGATGGATGACAACCCGCGTTGGCGCCTGCTGGACGCGGGGGAGCTGGTCCACGTG
+GACGCCGCCCTGCGGGTCAACAGGAGTCTGGTGCTACCTGATCCACCCAGACATCCGATTCGCCGGGAAG
+ATCTCAGCGAGCCGGTACTGCATGCGCAACACACGTCGGCGTGAACTCGTGACAACTAGACGCGCGCTGG
+TATTGGCCGGCGGAGGACTGGCCGGAATCGCCTGGGAAACAGGTGTTTTGCGCGGCATCGCGGACGAATC
+GCCGGCGGCGGCCCGGCTGCTACTGGATTCGGATGTGTTGGTCGGGACATCGGCCGGTGCAACGGTCGCC
+GCGCAGATCAGCAGTGGCTGCCCGCTCGACACGCTGTACGAACGGCAGCTCGCCGAGACGTCGGCCGAGA
+TCGATCCCGGTGTCGACATCGATGCCATCACTGATCTTTTCCTGACTGCCGTGACCGAGCCGCACATTTC
+GACGCGCCGGCGGCTACAACGGATCGGTGCCGTGGCGTTGGCGGTCGACACCGTTCCGGAGTCCGTCCGC
+CGTCAGGTGATCGCCCAGCGCTTGCCGTCGCACGACTGGCCGGACCGGGTGTTGCGGGTCACCGCGATCG
+ACATCGCCACCGGCGAATTGGTTGTTTTCCATCGCGAGTCGAATGTGGCGCTGGTCGACGCGGTGGCGGC
+CAGTTGCTCGGTGCCGGGGGCGTGGCCTCCGGTGACAATTGCCGGCCGCCGCTACATGGATGGCGGGGTG
+GCCAGCTCGGTCAACCTTGGTGTCGCCGACGATTGTGATGCCGCCGTGGTTTTGGTGCCCGCCGGCGCCG
+ACGCGCCGTCGCCCTTTGGCGGCGGGGCGGCCGCGGAGATCGCGGCAGCCACCGGCATGGTGTTTGCCGT
+GTTCGCCGACGACGACTCGTTGGCGGCTTTCGGGCCCAACCCGCTGGATCCGCTCTGCCGTGTGAACTCG
+GCGATGGCCGGACGTCAGCAGGGCCGCCGCGAAGCGCAAGCCGTTGCCAGGCTGCTCGGCGTTTGATCAG
+CCCTCGATGGTCGCAGCGGCAGATTCGTCGTCGTCGATCTCGAATGCTTCCAAGGCTTGGGTGGCCAGCG
+CGCGGCCGACGGCGATCACCTCCACCGCGCGGTGAAATTCCAGGCTTCGGCACGTTGAACGCGGTACCTC
+GATCAGCAGGTCGGCCGGATAGCCCGCCAGCGTATGGCGCGCCAGTGCGGATTGGGCGATATCGATCGTC
+CGATTCATCACCTCGAAACTGCCCATTTTGGGTAGCCCGGGTGTGTCAGCGGCTTCCTCGCGGTCAGCTG
+GTGGGCCGGCTGGACGCTGCTCGATCTCCGGAGCTTGCGACCAGGAATCCGATTCCGCGGCCGCCGCGCC
+GAAGCGACTCAGCACCGCCCGCGCCGTAGGCCGGTCGAGCAGCGACCGGGCGGCGCTGACGTCAAACAGC
+GCGGAAGTGCTGCGCACCATGCGGTTCAACCACTCGGCGGTGACGTTGGGCTCCGCATCGCGAGCGGGGC
+CGGCCTCACTGCCGTTAAGGCTGACCGCGATGGTCAGGTCGGCGTTGACCCCGGCGATCGGCGCCATCGG
+CAGTGGATCCAGGATTCCGCCGTCGGCCAGCAGGCGTCCGTCGACTTCGTGTGGGGCGATCACCCCGGGT
+ATGGCGATGGACGCCCGGATCGCCGCGTCGAGGGGGCCGCGCTGAAACCACACCGACTTGCCGGCCAGTA
+GGTCGGTGGCCACCGCGGTATAGGGGATCGGCAGCTGCTCGATGGCGACCGGGCCGACGATGTCGCGCAC
+CGCGTCGAGAATCTTTTCTGCCCGCAGGATGCCGGCCGCGCTAATAGACGGATCCAGCAGCCGCAAGATG
+GTGCGCTGCGTCAGGGACTTGGCCCAGTGGGCGAACTCGTCGAGTCGGCCGGCCGCATGCACCCCACCGA
+CCACCGCGCCCATCGACGAGCCGGCGATCCCAACGATGTCATAGCCGCGCTCCCGCAGCGCCTGGATCAC
+TCCGATGTGGGCGTAACCCCGGGCGCCGCCGCTGCCGAGCGCCAGTGCGACGCGCGGCGAAGACGACCCT
+CGCACCCGGAGGGCAGCTGGTGCGGGCATGCTTTCATTCTGCTCGGCGAGGTGCCCTTATCGGGATCCGG
+CCACTAGTTTCTTGCACCCCTGATCTCAATTGCCGAGCGTTATCCGCATTCCGCGTTGGCGGCGGCGCGC
+GCCGCGACGATCACGGCCGCCTGCCGTGCCGGGGTCAGCGCCGCCCAGCGGATGTGCCAGCTGCCGGCAA
+CTCCGGATGGCGATGCTTGGACCACCGCCAGATACGGCTCGATTAACGACTCGCCGGAGCCGGGCTGGGC
+ATCCATCCACAGCCTTGCGGCGTGACAGGCCTGGTAATACTCCTCCTCGGTCGATTCCGCGGGAGCGTCA
+ACCCTGGTGGTCACGCCGGCCGGGGAGACGCCGACGACGCCCGCCGGCAACGTACCGGCAACGCTTGACG
+AACGTCCGGCTTTGCTGCTGCCGCCGCGAGAGCAGCCGGCAACGGCCGACAACCACGCCAGCGCCAAAAC
+CATTGCGCACAGCAGGGGGGCATAACGGCTCGGGCGCACCGTCCCAATCTATGCAAGACTGACCGCGTGA
+TGGAGCGCTACGGATTTTGTGGGTGTTGTCGGCCCTGACCTGCCGTCCGCCCTGTCCGTTCGACTCTTTG
+GAGTTCTCCCGTGGTTATGCCTCTTGTCACGCCAACCACCGCGGTTCCATCACCGGGACCCACACGGCTG
+CGTGTAGCCGATCTCCTGCGCGCCACCGACCAAGCCGCAGACGACGTGCTTGGCGGGCGCTGCGACCACC
+TGCTACCCGACGGTGGTGTCCCGCAGACGCAGCGCTGGTACACCCGCATCCACGGTGACGAGGAGCTGGA
+TATCTGGCTGATTAGCTGGGTTCCCGGTCAACCGACCGAGCTGCACGACCATGGCGGGTCCCTGGGAGCG
+TTGACCGTGCTGAGCGGGTCGCTCAACGAATATCGTTGGGACGGCCGTCGGTTGCGACGGCGCCGCCTCG
+ATGCCGGTGATCAGGCAGGGTTCCCGTTGGGTTGGGTGCACGACGTGGTGTGGGCGCCCCGGCCGATTGG
+GGGGCCTGATGCGGCCGGGATGGCTGTGGCGCCAACCCTGAGCGTGCACGCCTACTCGCCGCCGCTGACG
+GCGATGTCGTACTACGAGATCACCGAACGCAACACGCTGCGCCGCCAGCGCACCGAATTGACCGACCAGC
+CCGAAGGGTCGGGATGAGCCGAATCGACCGGGTGCTGGAGGCCGCTCGCCGCCGGTATCGGCGCCTTGCG
+GCCGACCAGGTGCCCGAGGCGGCGCGGCGCGGCGCGGTGCTCGTCGACATCCGGCCCCAAGCCCAGCGGG
+CCCGGGAGGGCGAGGTGCCAGGGGCGCTAGTGATCGAGCGCAACGTCTTGGAATGGCGCTGCGATCCCAC
+CAGCGACGCCCGGCTGCCCCAGGCCGTCGACGACGACGTCGAGTGGGTGATCCTGTGCTCGGAGGGCTAC
+ACCTCGAGCCTGGCGGCAGCGTCGCTGCTGGACTTGGGGTTGCACCGGGCCACCGATGTCGTCGGTGGCT
+ATCGTGCGCTGGCGGCCGGCGGCGTGCTGGCCGAGCTTGGTGGTGCCGTGGGCGGGTAGTTTGGCTCGCC
+GCTGCTGGCTGGGTCGTTACTGCCCCGGCGTGCCGGCGTTGCCGAAGATGAGTCCTCGAGTTCCGCCGGC
+GCCGCCGGCGCCGTCGAGTCCGGCGATCAGGCCGGCGCCACCCTTGCCGCCGTTGCCGCCGTTGCCGCCG
+TCACCGACCAACTGGGCGTCGCCGCCCTTGCCGCCGTTGCCGCCGTTGCCGCCGTTGCCGTCGACACCGC
+CGGCGGCGGCGCCCAGACCGCCTTGGCCGCCGCCCCCGCCGTTGCCGCCGGTGCCGCCGCCGAGCAGGCC
+GGCGCCGCCGCCGTTGCCGCCGTGACCGCCCGCGTGACCGCTGCCGCCGTTACCGCCGGCGGCTTGAAGC
+CCGGTCGGCGGGTTGGTGCCGCCGCTGCCGCCGCTGCCGGCGGTGCTGCCCGTTCCGCCGGCGCCGCCGG
+CGCCGCCGCCACCGAACAGCCTGGCGGCCGATCCGCCGTTGCCGCCGTTGCCGGCGTTGCCGGTGTCCCC
+GCCGTTGCCGCCGATACCGGGATTGATGGCCAGACCGTTGGGGGTGTCGCCGCCCTTTCCGCCGGCGCCG
+CCGGCTCCGGCGCTGCCGCCGCTACCGCCGGCGCCGCCGTTGCCCGACAGCCAGCCGGCCGACCCGCCGG
+TGCCGCCGGCCCCGGCGTTGCCGCCGACACCGCCACCGCCACCGTTACCACCTAGTGCGGCGTTGAGCCC
+GGTGCCGCCGTCGCCCCCGGAGTTGCCGGCGCCGCCGGCCCCGCCGTTGCCGCCGGCCCCGCCGTTGCCA
+TACAGCAGCCCACCGCCACCACCGGCGCCGCCGCCGCCGTCGCCGCCGACACCACCCGTACCACCCTTAC
+CGGCGGTGGCCATGACATGTTCGCCGCCGGCGCCGGCGGCCGCGCCGTTGCCGCCGGCGCCGCCGTGCCC
+GGCGTTACCTCCGTGACCGAACAGCACGGCGCCTCGTCCGCCGTTGCCGCCGGCGCCGGCGGTGCCGCCG
+GTGCCGCCGGTGCCGCCGTCTCCACCGAATTGGCCGCCGTTGCCGGCACCGCCGGCGGTGCCGCCGCCGC
+CGCCGTTGCCGGCGTCACCGCCGTTGCCGGACAGCCAGCCGGCCGACCCGCCGTCGCCACCGCGGCCACC
+GGCGCCGCCCGCACCACCGGCGCCGCCCGGTTGGCTGGGTGGGCCGGGGGCGCCGGGACTGGCTTGTCCG
+CCGGCCCCGCCGGCGCCGCCGTCACCGCCGGCGCCGCCGTGGCCGTGGATCCAGCCGCCGGCACCGCCCG
+CCCCGCCGGCGCCGGCGTCACCGCCCTTGGTGCCGCTGGCCCCGGCGCCGGCACCGTTGCCGCCTTGTCC
+GCCGTCACCGCCGACGCCGCCGACACCGCCGTTGCCGAACAATCCGGCCGTTCCCCCGGCCCCGCCGGCA
+CCACCCGCGACGCCCGGCGCGCCGATGGCTCCGGCGGGGCCGGCGCCGCCGGCGCCGCCATTGCCGCCGC
+TGCCGTAGAGCCAGCCGCCGTTGCCGCCCGCGCCGCCGTTGGCGCCGGCTCCGCCGGCCCCTCCGTTGCC
+GCCGTTGCCGATCAACCCGGCCGACCCGCCGGTACCCCCGGTGAGCCCGGCGGTGGTTTGGGAAAACCCG
+TTGCCGCCGTTGCCGTACAACAACCCACCGGCGCCACCGTTGGGATTGGCCGCGGTCCCATCGGCGCCGT
+TGCCGATCAGCGGACGCCCCCACAGCGCCTGGGTGGGCGCGTTGATCAAACCCAGCACCTGCTGCTCGAC
+ATTGGTCGCCTCGGCGCTGGCATACGCGCTCGCCGCCCCGGTCAATGCCTGCACGAACTGCTCGTGAAAC
+AGCGCTGCACGCGCGCCCAGCTGTTGATACTGGCCGGCGTGGGCGGAAAACAGTGCCGCGACCGCCGCGG
+ACACCTCATCGGCACCGGCCGCGGCCAGCACCGACGTCGGGGCCAGGGCGGCCGCGTTGGCCGCGCTGAT
+TGCCGAACCGATACCGGCCACATCGGCCGCCGCGGCCATCAGCTGCGACGGAGACACCAACACAAACGAC
+ACGGTTTCCTCTCCCTGATTTGCTGATATGTAGTTGCGATGTTAACTAGCGCACACCGCAACTGGGGCGG
+TTTTCCGCCATTGTCTGGTCGCACGTATACATTTTTGTGAATTCTTTGAGCGGAATTGCTCGTGCGATCC
+GGCTACGTTTTCGAGGTGAGATCTGGGTGGGCGGCGATGCCCCGTGCTTCGATGATCAATTTGGGGATCT
+GAAATGTCAAATGTGTTGACATTCATTGGGTGATCTTTCGCGCCACCCGGCGACGTCAAATACTTGGACA
+TAAGCCACTCGTCGTTGTGTGATACGTCGTCACACCGGATCTGGCCGTGCGGGTTTATTGCCCGGGCGTG
+CCGGGGTTGCCGGAGATCTGCCCGCGACTACCGCCGGCGCCTCCAGTGCCGTTGATTCCGGGCATCAGGC
+CGGTGCCGCCTTTGCCACCGTTGCCGCCGTTACCGCCGTTACCGATCAACTGGGCGTCGCCGCCCTTGCC
+GCCGTCGCCACCGTTGCCGCCGTTGCCTTTGGCGCCGCTGCCGGCGCCCAGACCGCCGTTGCCGCCGTCG
+CCGCCGGTGCCGCCGCTGCCGAGCAGGCCGGCGGTGCCGCCGCTACCGCCGGCACCGCCCGCGTGGCCGT
+TGCCACCGTTGCCGCCGGTGCCGCCGCCGAAGCCGCCGCCACCGCCGGTGCCGCCGGTGCTGCCCATCCC
+ACCGGCGCCGCCGGCGCCGCCGTCGCCGAACAGCTTGGCGGCCGATCCGCCGTGGCCGCCGTTGCCGGCG
+TTGCCGGTGTCTGCGCCCTGGCCGCCGTTACCGGGATCAATACCGCTGTTGCCGTTGCCGCCTTGGCCGC
+CGGCGCCGGCGGTGCCGCCGCCTCCGCCGGTGCCGCCGTTGCCCGACAGCCAGCCGGCTGACCCGCCGTT
+GCCGCCGTTGCCGGCGTTGCCGCCGACACCACCGGCGCCACCGTCACCACCTTGCGCGGTGCCAGACCCC
+GCGCCGCCGTCGCCGCCTCTGGCGCCGGCGCCGCCGCTGCCCCCGGTGCCGCCGGCCCCGCCGTTGCCAT
+ACAGCAGGCCGGCGTCGCCGCCGGTGCCGCCGGCACCGCCGCCGCCGCCACCACCCGTACCACCCTTACC
+ACCGACGGCTGTGATGCTGCTTCCGCCGTTTCCGCTGACCGCGCCGTTGCCGCCAGCGCCGCCGTGGCCG
+GCGTTACCGCCGTGGCCGAACAGCACGGAGCCTCGTCCACCGTTGCCGCCGTTGCCGGCGTTGCCGCCGC
+TACCACCGTTGCCACCGTCACCACCTTGTGCGGTGCTAAGCCCGGGGGCACCGATCCCGCCTTTGCCGGC
+GGCGCCGCCGTTGCCGCCGTTGCCGCCGGCCCCGCCGTTGCCATACAGCAGCCCGCCGTCGCCGCCGGTG
+CCGCCGGCACCGGCGCCGCCGCCGCCACCACCCGTACCACCCTTACCGGAAATGCCTAGCTGAGTGTCTG
+CGCCGTTTCCGCCGGCGGCGCCGTTGCCGCCGGCGCCGCCGTGGCCGGCGTTACCGCCGTGACCGAACAG
+CGCGGCGCCGCGTCCGCCGTTGCCGCCGCCGCCAGCGGTGCCGCCGGTGCCGCCGTTGCCGCCGTTGCCG
+CCGAAGATGCCGCCCTCTCCGCCGGCACCGGCGTTGCCGCCGCCGCCGCCGGTGCCGGCGTCGCCGCCGT
+TGCCGGACAGCCAGCCGGCCGACCCGCCGTCGCCACCGCGGCCGCCGGCGCCGCCCGCTCCGCCGGCGGC
+GCCGGTGTCGCCGGGCTCGCCCTGGACGCCGTCCCCGCCCTGACCGCCGGTTCCGCCGTCGCCGCCGACG
+CCGCCGTGGCCGTGGATCCAGCCGCCGGCACCGCCCGCCCCGCCGGCGCCGGCGTCACCGCCCTTGGTGC
+CGTCGGCCCCGCCGATGCCGGCGCCGCCTTGTCCGCCGGCCCCGCCGGCACCGCCGGCACCGCCGTTGCC
+GAACAATCCGGCCGATCCCCCGGCCCCGCCGGCACCACCCGCGACGCCCGGCGCGCCGATGGCTCCGGCG
+GGGCCGGCGCCGCCGGCGCCGCCATTGCCGCCGCTGCCGTAGAGCCAGCCGCCGTTGCCGCCCGCGCCGC
+CGTTGGCGCCGGCTCCGCCGGCCCCTCCGTTGCCGCCGTTGCCGATCAACCCGGCCGACCCGCCGGTACC
+CCCGGTGAGCCCGGCGGTGGTTTGGGAAAACCCGTTGCCGCCGTTGCCATACAACAACCCACCGGCGCCA
+CCGTTGGGATTGGCCGCGGTCCCATCGGCGCCGTTGCCGATCAGCGGACGCCCCCACAGCGCCTGGGTGG
+GCGCGTTGATCAAACCCAGCACCTGCTGCTCGACGTTGGTCGCCTCGGCGCTGGCATACGCGCCCGCACT
+TGACGTCAGGGCCAGCGTGAACTGGTCATGAAACGCTGCCATCTGCCGGGCGATCGCCTGATAGCCCTCG
+CCATGTCCGCTAAACAGTGCCGCAATGTGGGCCGACACTTCGTCGGCGGCGGCCGGCAACAACCTCGTCG
+TCGCGGCCGCGGCCGCCCTCGTTGAGGCATTGATCGACGATCCGATGCTGGCCAAATCCCCAGCCGCCGA
+GCTGAGCATGTCTGGCACCGCAATCATGTAGGACATTTCGCGCATCTCCCTCATCGCCGGGCGACGGATA
+TCGGGACCGGAGTCAACGTGATGGCGCGAGTCTAAGCACGCCCGGAACGGAAATGCAGAGTGTTCGACAA
+ATCTTTCCCCAAGACATTTTTATTGGTCGCACGATGGGCGTCGTCGTCGAGCGGTATGGCAGCACCGATT
+TGTCTTCCAGGGGAATGTTCGTACCGTTTCATGACGTCGACTGTGTCCAATAGCTTTACATTTCCCGTTT
+TTATTTGCTGATGATGTCTAACACCTAGACAAACACCGTCTTGTCGTCCATCGATATGGGCTCGGGCTAG
+CCGCCACGCCGACGGCGCACGCCAAACCGGCCGACCCGCTGCCCGCCCTACGAGCCGAAGGGCTTGGCGT
+TGGCGTGCAGCAATGGCTGCAGCCGCTCCGTCTTCTGCTGTGTCCAGCCGGGCGGCGAGAGCACCGCGGC
+CCAGCCGTCGGCCACGGTGGCGACGTAGCGGTGACCATGCCCGTCCGGCACATGCGTAGCCACCGCCATA
+TCGGCCGAAACCTGGACGAACGTCACCACCGGGATCCAGCGTGTCTGGGGAAGGACGTCGTAGCCCCGTT
+GCTCCCGCAGCCAGTCCGGCTCCCGAAACAGCAGGCGGGGAGTCCACCAGGCGATCGGATCAGAGGCATG
+CTGCAGATACACCACCCGCGGTCTGCCCCACGGCGCATCAGGGCGTTGCAGGTCGCGTGCGCGGGCCACG
+AAACGCACGTTGCGGCCGTCGTCGTAGATGGGCAGCCACTGCGGTGATCCGGCATCGCGGTTCGCAGTCA
+AGGAGTTCCAAACGGTGTTGTTGAACGTCGGTCCGCTGAACAACGCGCCGTCGGTGCGGGCGAGGATGTT
+GTTGAGGTTCATGAACGGCGCTTCACCGCCGAACGATCCCAGGCTCTCGCCGAACACGACCAGCTTCGGG
+CGCTGCGACTCGGGCAGTTGACGGATCAGCTTGTCGACCGCCTCGAACAGCGCCTCGCCGGCGTGCCGGG
+CATTCTCCTTGTCCACCAGGAAAGACAGCCAGCTCGGCAAGAACGAATACTGCATGCTCACGATCGCGGT
+ATCGCCGTTGTACATGTACTCCAGCGCGGAGGCTTCCGCCTCGTTGATCCAACCGGTTCCGGTGCTCGTG
+GCCACTGCCACAACGGCGCGGCGCAAGCCACCGGTGCGCGCTAGCTCGCGCGCCGCCAGCTCCGCGGTGG
+CCATGATGCCGTCCGCCGAGTTCAACCCCGCATAGGTTCGGATCGGCTCGACGGCCGGGGTGCCGTTGAA
+CGCGGTGAGGTCGGCGATGGTGGGACCGCTGTGGACGAAAATTCGGCCCTGATGGCCCAGCGACTCCCAC
+GACACCAGCGATCCCGGGCCACCCGATCGCAGCGGGGTTTTCGGCGGTGCCGAATCCGGATTCATCTCAT
+TGTTGACCGCAGCGAACGTGCTGTTCATGGAATTCATCGCGAACTTGAGCACCACACCGTTGAGCAGTGT
+GATGGTCAGCACCACGAGCAGCACCACCACAATGGCCGCCGAAACTCGGAATGGCGCAATGCGATCGACC
+TGTCCCACCAGAAAACGGAACAGCCATCGGATGAACTGGCCGATTTCGACCAGCGTGAACAGCACGACCA
+GCGACAATGCGGCGGCCAGCGGGTAGTCGTACCACCGCAGGTGCTCGACACCCATTAGGTCGCGCACATC
+GTCTTGCCAGACATGAAACTGCACTGCCATACCCACCATGCCGACCGCGCCGACTGCGATCAGCGGCGGC
+CACGCCCAGCGTGGTGGCGGCGGGCTGGAATTGTGCGAGCGCATGTAGCGGACCAGCCAGACGGCGAAGA
+CTCCCAAGCCGTATCCGAAGGCGCCGCAGATTCCGCTGACCAGTCCCTGAAACAGCGGACCACGCGGCAG
+CAGCGACGGCGTCATCGAGAACCACACGAAAACGAGGCCCATCGCGGTGCCGGTGAATGTGTAGTGGCGA
+ATCCACCAAGTGCTGCGGATCGGTTGCGGTTCAGGGGTTTGTGGAGTTGCTGCGGTGTCGACCGCCTGCT
+CAGCGCCGGTAGCTGGTTCGTCGCTGGCGTTGGTGGTCGTCGCTGCAGCCGGTTCCGTCATCGGTGGGTG
+AACTGGGGAGCGCGTTTCTCGATGAACGCTGCCATACCTTCGGATTGGTCTTCGGTCGCGAAAGCCGAAT
+GGAAAAGCCGGCGTTCGTAGAGCAGCCCCTCGGACAAACTGGATTCGAAAGCCCGGTTGACGGCCTCCTT
+GGCCATCCGGGCCGCCGAGGCCGACATCTGCGAAATGGTCGTGGCAGTGGCCCTGGCTTCGGTCAGCAAG
+TCGTCGGCCGGCACCACCCGTGAAACCAGACCGCTGCGCTCGGCCTCGGCGGCGTCCATGGTGCGCCCGG
+TCAGGATGAGGTCCATCGCCTTAGCCTTGCCGATAGCCCGGGTCAGCCGCTGGGAGCCGCCCATGCCTGG
+CAGCACGCCCAGCTTTATCTCGGGCTGTCCGAACTTCGCGGTGTCGGCGGCGATCAGCACGTCGCACATC
+ATCGCCAGCTCGCAGCCACCGCCGAGCGCGTATCCCGCCACCGCGGCGATCGTCGGGGTGCGCACGGCGG
+CCAGCTTGCCCCAGGTGGCGAAGAAGTCGGCGGTGAACGCGTCGGCGAACGTCAGGTCGGCCATTTCTTT
+GATGTCGGCTCCGGCGGCAAACGCTTTGGCCGAACCGGTGATGATGATCGCCCCAATGTCCGGGTCATCG
+TCCAGTTCGGTTGCAGCGCTGGTGACCTCGTTCATCACCTGGCTGTTGAGCGCGTTCAGTGCCTGGGGAC
+GGTTCAGCGTGATAATGCCAACTCGCTGATCGCGCTCGACCAGGATGGTTTCGTACGTCATGCGCTACCT
+CTCTAGAAACTCAAGTCATCGTCGACCGGTTCGAAATAGGCTTCGATGTCGGCCGCCGTGATCGCGTCCA
+GGGTTGCCGGCGACCAGTTCGGGTTGCGATCCTTGTCGATCAACTGCGCGCGGATGCCCTCCACCAGGTC
+ATGCGAGCGCAGCGACGCCGATGACACCCGATAGTCCTGGATCAACACGTCTTCTAGCGTGTCGAGTTTG
+GCGGCGCGACGCACTGCCTGCAACGTCACCGACAGCGCGATGGGGGAGCGGCTGGCAATCAGGTCGGAAG
+CATTTACGGCTGGTTCGCCGCCCTGTTTCCGCAGCGCCGCAACGATGTCGGCGACGCTGTCGCCGGCATA
+GCATTCGTCGATCCAATCACGTTGGGCGGCAAGCGTGCTCGGTGGAGGTTCGACGGCGTGGGCGGCCAAT
+GCGCTCTCCACGCCGCCGGTGACGATCTTCTGCGTGAACGCATCGAGGTCGCCGTGTGGCACGAAGTGGT
+CGGCGAATCCCAGCGCGATGGCGTCGGCGCCGGAAAACGGCGCTCCAGTCAGGGCGGCGTGCAGACCCAG
+CGCGCCGGGTGCACGCGACAGCAAATACACCCCGCCGACGTCGGGGATGAACCCGATGCCCACTTCGGGC
+ATCGCGACCTTGGAGGTATCGGTAACCACCCGGGTGTTCGCGTGTGCGCTGACGCCGACGCCGCCGCCCA
+TTACGATGCCGTCCATCAACGCCACGTAGGGCTTGGCGAACCGGCCGATCAGGGCGTTGAGCAGATACTC
+GTGGCGCCAGAACCGCCGCGCCTCGACCCCGTCCTTGCGGGCACTGTGGTAGACGGCCACCACGTCCCCG
+CCGGCGCAAAGTCCGCGTTCGCCGGCTCCGGAGAGCACCACCGCGTGCACCGCGTCCTCATGCTCCCAGC
+TCATGAGCACTGTGGCCAGCAGGTCGACCATGGTTTGGTTCAGTGAGTTGATCGCCTTGGGGCGGTTGAG
+CGTCACGAATCCGACACCGCCCTCGACGTTTGTCAGGACCTCATGCGATTCGCCGGTCACGGGCCTCGCC
+TCCCCTGAAGAGTTTGACCAGCAATCTAGATCGTGGCTCGCCCAGCGGTGCCCGCGGGGGCTAAGGTTTA
+TCGTGTACCCGGATGACAACGCTGGCCGGGAACCCGGGCCTACTACTGATCGTTGAGCGGATGTTCGCAC
+AGCTCGTAGCCATAGCCATCAAGAGAGGATCCGACGGTGCGGGAGACAAGCAACCCGGTATTTCGTTCGT
+TGCCTAAGCAGCGGGGCGGATACGCGCAATTCGGAACTGGCACCGCCCAGCAGGGATTCCCAGCCGATCC
+CTACCTGGCGCCCTATCGGGAAGCAAAGGCCACCCGCCCGCTGACCATCGACGATGTCGTGACCAAGACG
+GGCCTGACGCTGGCTATGTTGGCGGGCACCGCCGTCGTCTCCTACTTCCTGGTTGCGTCGAACGTCGCAC
+TGGCCATGCCGCTGACCTTGGTGGGGGCTTTGGGTGGTTTGGCGCTGGTGCTGGTGGCCACCTTCGGCCG
+CAAGCAGGACAACCCGGCGATCGTGCTCAGCTACGCGGCGCTCGAGGGCCTGTTCCTGGGTGCCATCTCG
+TTCGTCTTGGCTAACTTCACGGTGGCGTCCGCGAATGCTGGGGTGCTGATCGGGGAGGCCATCTTAGGGA
+CGATGGGTGTGTTCTTCGGCATGCTCGTCGTCTACAAGACAGGGGCCATCCGGGTCACCCCCAAGTTCAC
+CCGAATGGTGGTCGCTGCGCTGTTCGGCGTGCTGGTCTTGATGCTCGGCAACCTCGTGCTGGCGATGTTC
+AATGTCGGCGGCGGTGAAGGCTTGGGCTTACGCAGCCCCGGACCGCTGGGGATCATCTTCTCGCTGGTGT
+GCATCGGCATCGCGGCGTTCAGCTTCCTGATCGACTTCGATGCGGCTGATCAGATGATTCGCGCGGGAGC
+ACCGGAGAAGGCGGCATGGGGCGTCGCGTTAGGCCTGACCGTAACGCTGGTCTGGTTGTACATCGAGATC
+CTGCGCCTGCTCAGTTATCTACAGAATGAGTAGCGCTCGTTGGCCGTTGATTCTGCGTCCACCAGGCTGA
+CCACTCGCACTTTTGCGTGGTAGACGCAGGATCAACGGCTGTGTCGGTGGGTGCTGACACCATGCCCGCA
+TGCGGGAGATGGGGGCGCAGCCGTTCATCGGCAGCGAGGCGTTGGCGGCGGGACTCATCAGCTGGCATGA
+GCTGGGCAAGTACTACACCGCGATCATGCCCAACGTCTATCTGGACAAGCGGCTGAAGCCCTCCCTGCGG
+CAACGCGTTATCGCGGCCTGGCTGTGGTCGGGCCGCAAAGGGGTGATCGCCGGCGCTTCGGCATCAGCGC
+TGCACGGCGCGAAATGGGTCGATGACCACGCATTGGTGGAGTTGATCTGGCGCAACGCCAGGGCGCCGAA
+CGGGGTGCGGACTAAGGATGAGCTACTGCTCGACGGCGAAGTCCAGCGCTTGTGCGGGCTTACTGTGACT
+ACCGTTGAACGTACGGCCTTCGACTTGGGCAGGCGTCCACCCTTAGGTCAGGCGATAACCAGACTGGATG
+CGCTTGCCAATGCCACCGATTTCAAGATCAACGATGTTAGGGAGCTCGCGAGGAAGCACCCCCATACTCG
+CGGGCTGCGTCAACTAGACAAGGCGCTGGATCTCGTCGACCCAGGTGCGCAGTCGCCGAAGGAGACGTGG
+CTGCGGCTCTTGCTGATAAACGCCGGCTTTCCACGGCCGTCCACTCAGATCCCCTTGCTCGGCGTCTACG
+GGCATCCAAAGTATTTCCTCGACATGGGATGGGAGGACATCATGCTCGCGGTCGAGTACGACGGCGAGCA
+ACACCGTCTCAGCCGAGACCAGTTCGTCAAAGACGTCGAACGCCTGGAATACATCCGGCGCGCCGGCTGG
+ACTCACATCAGGGTGCTGGCAGACCACAAGGGACCCGACGTCGTCCGCCGGGTTCGGCAGGCTTGGGACA
+CGTTGACATCACGACGTTGACTCTGCGCCCACCACGTGTCCTACTCGCACTTTTGCGTGGTGGACGCAGA
+GTCAACGCGATCGAGCGCCTCGCTCACGCGAGGCGCTCGATCACCATCGCCATGCCCTGGCCGCCACCGA
+CACACATGGTTTCCAGACCGAACGTCTTGTCGTAGGTCTGCAGGTTGTTCAACAGCGTGGTGGTGATGCG
+CGCACCCGTCATACCGAACGGGTGACCTAGGGCGATCGCGCCACCTGAGATGTTGAGCTTGTCCTCGTCG
+ATGCCCAGCTCGCGCGCCGAGCCCAGGACCTGCACCGCGAAGGCCTCGTTGATCTCGACCAGGTCGATGT
+CGGTGATCGCCATCCCGGCTCTTTCCAGCGCCTTCTTGGACGCCTCGATCGGCCCTAAGCCCATGATCTC
+CGGGGACAGCCCGCTGACCCCGGTGGACACAATGCGCGCCAGCGGTGTCAAGCCTAATTCCTTGGCCTTG
+GTGTCGCTGGTGATCACCACCGCGGCGGCCCCGTCGTTGAGCGGACAGGCATTCCCCGCGGTCACGGTGC
+CATTCGGCCGGAAAGCCGGCTTGAGCTCGCTGACCTTTTCGTAGGTGGTACCCGGTCGCGGGCCGTCGTC
+GGTGCTGACCGTGGTGCCGTCCGGAAGGGTGACCGGCGTGATTTCTCGTTCGAAGAACCCGTTCTTGATC
+GCCTCTTCGGCCCGGTTCTGGCTGCGCACGCCCCAGCGGTCCTGTTCTTCGCGGCTGATGCCGGTCATGA
+TGGCGACGTTTTCCGCGGTCTGGCCCATCGCAATATAGATGTCCGGCAGCTTCTGATCGGTGCGGGGATC
+GTGCCATTCGTCGGCGCCGGCGGCTGCCGCGGCCGAACGTTCCTGAGCCCCGTCGAACAGCGGGTTCTTG
+GTGTCCGGCCAGGAGTCGGAGTTTCCCTTGGCGAACCGGGAGACGGTTTCCACGCCCGCGGAGATGAACG
+CGTCGCCCTCACCGGCCTTGATCGCGTGGAAGGCCATCCGGGTGGTCTGCAGCGACGACGAACAGTACCG
+GTTGACCGTGGTGCCCGGCAGGAAGTCATAGCCGAGCGCGACGGCGACGACACGGGCGATGTTGAAACCG
+GACTCACCGCCTGGCAGGCCACAGCCCATCATGAGGTCGTCGATCTGATGGGGGTTCAGTGCCGGAACCT
+TGTCGAGCGCGGCGCGCACCATCTGGACGGCCAGGTCGTCGGGCCGCATGCCGACCAGCGATCCTTTCAT
+GGCCCGGCCAATCGGCGAGCGGGCAGTCGAGACGATGACAGCTTCTGGCATGACGGCTCCCGGCATGGAC
+AAGACGTGGTGAAGTTTAGGTCAAATGTAGTCGCTACCCACCGGTCGGCACGGCCCGGGCCGGCCGGGGC
+CGCCGCAGCCGCGACATCATGCTGTGTCGCGTGTGGCCCGGCTCGAGGGTGGCCGTTCCAGGCCGGGACG
+GCGTTTCATGAATTGGGATATCGAGCTTTTCGGTCAGCGCATCGCGCAGCGCAAGGAACAACAGATCGGC
+CGCCAGGGCGTACGCGGGCGCCGACGGGTGGTAGCGGTCGGCGGAGAACATCAGCTCGGGCATTGCCCGG
+AATTTGGGAGCCAGTAGATGTCCTAGCGGCACCGGCACCCCACCGGCCGCCTTGACGGCTGCCGTTTGGG
+CGCGGGCCAGCCGCACACCACGGGTGTGCGCTAGCGCGCGCAGCGGCTGCGGGATGGCGGTAATGACGCC
+GAGGTCGGGGCAAGTGCCGACCACCACTACCGCTCCGCGGGTGCGCAACCTGCGTACGCAGTCGGCCAGC
+CGTTGCGCAGAGGGGCCAATGCCGTTGAGTGCCGTTATGTCGTTGGCGCCAATCATGATTACCGCCGCAT
+CCGGCGGCGGACCGACCACGAACATCGCATCGACTTGACCGCAGACGCCTTTCGAGGTGGCGCCGACGAT
+GGCTTTGGTGCTCAGCCGGATCCGCTTGCCGGTCTGCTCGGCGAGTCCGCGGGCGATCAACACGCCCGGT
+ACTTCCTCAGCGCTAGCGCAGCCGTATCCCGTCGCCGTCGAGTCACCAAAGATCATCAGGTGCACGTCGA
+AGGGCACTTCGCGTCGCCACCGTTGCACGGGCCCACCGCCGCGGGTGTATACGCCGTCGGCGCGGGGCGG
+TGCGTCGAAGGATTTGGGAATTACCGTGCGCGCGTGGGTCGCCTGACCGACCAGCAGGTTGCGTGCGCCC
+AGATAGGCCGTGCCCGTCGAGGCGAGTGCACCCGCGGTGGCCAAAGCGATCGTGGAACGCCGTGGCACGC
+GCATGCTCACGGGATCAGTTTAGGACGGTTGTGCCGATTTCGTGGGTAGCTGACGAACAAACCCGTCACG
+GTGTGGACCAAATGTGGTATCGAATCAGACTCTTTGGCTGTGGCACCTAAAAAAGACTGTCAAGCTAAGT
+TCGCGGGGTTGGCTGAGCCAGAGGCTCAGCCGCTTCGTCACATGCTGTATCGGACTACAACGGCGTAGGA
+AGTGTTGGGCATGACTGCACCCAGTAAGGTATCCGGCTCACCCAGAGTTGTCATTTCGCCGCGCGACGTG
+TTGAAGGCACGTAGACTCGAGGCACGCAAGTTTGCGATCAGCGACGGCGCCCCGGTGGAGGTCGTCGAGT
+CTGGTCCAAGTCTTGTTGCGCGATTAGCTGCGCTGGCGTCACGAGTGGCGGTCCGGCCGGTGCTAGCGGT
+CGGTAGCTATCTTCCGCATGCGCCCTGGCCGTGGGGTGTCATCGACCAGGCTGCCCGGGTTCTGCTCCCA
+GCGTCAACGACCGTAAGGGCCGCGGTGAGCCTGCCTAATGCGTCCGCCCAACTGGTTCGGGCGTCGGGTG
+TGTTGCCGGCGGACGGCACTCGACGCGCCGTCCTGTACCTGCACGGCGGCGCGTTTCTGACGTGTGGAGC
+AAACTCGCATGGACGACTCGTCGAGTTGCTCTCTAAGTTCGCTGACTCGCCTGTTCTGGTGGTCGACTAT
+CGGTTGATTCCCAAGCACTCGATCGGGATGGCGCTCGACGACTGTCACGACGGCTACCGGTGGCTGAGGC
+TGTTGGGCTATGAGCCGGAGCAGATCGTGCTAGCGGGCGATTCCGCGGGCGGGTATCTTGCGCTCGCTCT
+CGCGCAGCGGCTACAGGAAGTGGGGGAGGAGCCGGCGGCTCTAGTCGCGATCTCGCCACTGCTGCAGCTA
+GCAAAGGAACACAAGCAGGCGCATCCCAACATCAAAACCGATGCGATGTTCCCGGCAAGGGCGTTCGATG
+CGCTTGACGCATTGGTTGCTAGCGCAGCAGCGAGGAACCAGGTAGACGGCGAACCCGAAGAGCTCTATGA
+GCCCTTGGAGCACATCACACCGGGGCTGCCGCGGACACTGATTCACGTGTCGGGCTCCGAGGTATTGCTG
+CACGACGCTCAGTTGGCGGCGGCCAAACTGGCGGCGGCCGGGGTGCCGGCCGAGGTCCGGGTATGGCCGG
+GCCAGGTCCACGACTTTCAGGTTGCGGCGTCGATGCTGCCCGAGGCGATCCGCTCGTTGCGTCAGATCGG
+GGAGTACATCCGCGAGGCCACCGGGTAGCGGGATGCCGACGGAGCGCGTGTGCCTGGCCGGCAGGCGCCT
+GAGACGATGAACGCATGCGGATCGCGCAACATATCAGTGAACTCATTGGTGGTACCCCACTGGTTCGGCT
+GAACTCCGTGGTACCCGACGGCGCCGGAACCGTGGCCGCAAAGGTCGAGTATCTCAACCCTGGCGGCAGC
+TCCAAGGATCGGATCGCGGTGAAGATGATCGAAGCCGCCGAGGCCAGCGGTCAGCTGAAGCCGGGTGGCA
+CCATCGTCGAACCCACGTCCGGCAATACCGGCGTTGGTCTGGCGTTGGTCGCTCAGCGCCGCGGCTACAA
+GTGCGTGTTCGTCTGCCCGGACAAGGTCAGTGAGGATAAACGCAATGTGTTGATCGCCTACGGCGCCGAG
+GTCGTGGTGTGCCCGACGGCGGTCCCGCCGCACGATCCGGCCAGCTACTACAGTGTGTCGGACCGGTTGG
+TCCGTGATATCGACGGTGCCTGGAAGCCCGACCAGTACGCCAACCCGGAGGGACCGGCAAGCCATTATGT
+GACCACCGGCCCGGAAATCTGGGCCGATACCGAGGGCAAGGTCACCCATTTCGTGGCTGGCATCGGCACC
+GGCGGTACCATCACCGGCGCTGGCCGGTACCTCAAAGAGGTGTCCGGGGGCCGAGTACGCATCGTCGGCG
+CCGACCCGGAGGGATCGGTCTATTCGGGCGGTGCCGGCCGACCGTATCTGGTCGAGGGGGTCGGCGAGGA
+TTTCTGGCCGGCGGCCTATGACCCGAGCGTGCCCGACGAGATCATCGCGGTGTCCGACTCCGACTCGTTC
+GACATGACCAGGCGGCTGGCCCGCGAAGAGGCGATGTTGGTCGGCGGGTCGTGCGGGATGGCGGTGGTTG
+CCGCGCTCAAGGTCGCCGAGGAAGCCGGGCCCGACGCGTTGATCGTCGTCCTGTTGCCCGACGGCGGCCG
+GGGCTACATGTCGAAAATCTTCAACGACGCGTGGATGTCGTCCTATGGGTTCCTGCGCAGCCGCCTTGAC
+GGGTCGACCGAGCAATCCACCGTCGGTGATGTGTTGCGCCGCAAGTCCGGCGCGCTGCCCGCCCTGGTGC
+ACACCCATCCGTCGGAGACCGTGCGCGACGCCATCGGGATTCTTCGCGAGTACGGGGTGTCGCAGATGCC
+GGTGGTCGGCGCCGAGCCGCCGGTGATGGCCGGCGAGGTCGCCGGTAGCGTCTCGGAACGCGAGCTGCTC
+TCGGCCGTGTTCGAGGGCCGCGCCAAGTTGGCCGACGCCGTGTCGGCACACATGAGCCCGCCGCTGCGGA
+TGATAGGCGCCGGTGAATTGGTCAGTGCGGCCGGCAAGGCGTTGCGTGATTGGGATGCGTTGATGGTGGT
+GGAGGAAGGCAAGCCGGTTGGGGTCATTACCCGGTACGACTTGTTGGGCTTCTTGTCGGAGGGGGCGGGA
+CGGCGGTAGTCGCGCAGGCAGGCGCGCCGCAATTTAGTTCGGCTACAAACAATTACGGCAGGCGGCCAGT
+GCCGCACAGGTCGTGGGCACTGACCCATTGGGCCCCGTGGCTCATCTCACCGCCGGGCGTTCCGGTGAAT
+CCGGTCCTCAGGTACTGTAGTCCCGCCTAGTTCACCCTAGTTCAGCTGAACCTCAGTGGAAGGTGTGCCC
+ATGACCGAACAGCCGCCCCCCGGCGGGTCGTACCCACCGCCCCCGCCACCGCCTGGGCCGTCCGGTGGGC
+ATGAGCCACCTCCCGCTGCACCACCCGGCGGCAGTGGTTACGCTCCGCCCCCTCCGCCCTCGAGCGGCAG
+TGGCTACCCGCCTCCGCCGCCACCGCCTGGCGGGGGGGCCTACCCGCCGCCTCCGCCGTCGGCCGGCGGT
+TACGCGCCGCCGCCGCCCGGACCGGCGATTCGTACGATGCCGACCGAGTCCTACACGCCGTGGATTACCC
+GGGTGCTGGCGGCATTCATCGACTGGGCCCCATACGTAGTGCTGGTTGGCATCGGTTGGGTGATCATGCT
+GGTCACTCAGACGTCGTCGTGCGTCACCAGCATTAGTGAGTACGACGTCGGCCAGTTCTGCGTTTCCCAG
+CCGTCGATGATCGGCCAGTTGGTGCAGTGGTTGTTGTCGGTGGGCGGATTGGCTTACCTGGTCTGGAACT
+ACGGCTATCGCCAGGGCACCACCGGGTCGAGCATCGGCAAGTCGGTGCTGAAGTTCAAGGTGGTCAGCGA
+GACCACCGGGCAACCAATCGGCTTCGGGATGTCGGTGGTACGCCAGCTTGCCCACTTTATCGACGCGATC
+ATCTGCTTCGTCGGGTTCCTGTTTCCGCTGTGGGACGCTAAACGGCAAACGTTGGCGGACAAGATCATGA
+CGACGGTGTGCGTGCCGATCTGATCCGGGACTGCACTGCCCACCCGACCGTCCGATGAGCGAAGACCGCA
+CGGGACACCAGGGAATCAGCGGACCGGCCACCCGCGCCATCCACGCTGGCTACCGCCCGGATCCGGCGAC
+CGGGGCGGTGAACGTGCCGATCTACGCCAGCAGCACCTTCGCCCAAGACGGCGTCGGCGGTCTGCGTGGC
+GGTTTCGAATACGCACGCACCGGCAACCCCACCCGGGCCGCATTGGAGGCCTCGCTGGCGGCAGTCGAGG
+AGGGTGCTTTCGCGCGGGCATTCAGTTCCGGGATGGCCGCGACCGACTGCGCCCTGCGGGCGATGTTACG
+GCCCGGAGACCACGTCGTCATTCCCGATGACGCCTACGGCGGCACATTCCGGTTGATAGACAAGGTGTTC
+ACCCGGTGGGATGTCCAGTACACGCCGGTGCGGCTTGCCGATCTGGATGCGGTGGGTGCCGCGATTACTC
+CGCGCACCCGGCTGATTTGGGTGGAGACGCCCACCAATCCGCTACTGTCGATCGCCGATATCACGGCCAT
+TGCCGAGCTGGGCACAGACAGATCGGCAAAAGTATTGGTGGACAATACCTTTGCCTCACCCGCGTTGCAG
+CAGCCGTTGCGGCTGGGCGCCGATGTGGTGTTGCACTCGACTACCAAGTACATCGGCGGCCATTCCGACG
+TGGTGGGAGGTGCGCTGGTCACCAACGACGAAGAGCTGGACGAGGAGTTCGCTTTCTTGCAGAACGGCGC
+CGGCGCGGTGCCCGGACCATTCGACGCCTACCTGACCATGCGCGGCCTGAAGACCTTGGTGCTGCGGATG
+CAGCGGCACAGTGAAAATGCCTGTGCGGTAGCGGAATTCCTCGCTGATCATCCGTCGGTGAGTTCTGTGT
+TGTATCCGGGTTTGCCCAGTCATCCCGGGCATGAGATTGCCGCGCGACAGATGCGCGGCTTCGGCGGCAT
+GGTTTCGGTGCGGATGCGGGCCGGTCGGCGTGCGGCGCAGGACCTGTGTGCCAAGACCCGCGTCTTCATC
+CTGGCCGAGTCGCTGGGTGGGGTGGAGTCGCTGATCGAACATCCCAGCGCCATGACCCATGCGTCGACGG
+CCGGTTCGCAATTGGAGGTGCCCGACGATCTGGTGCGGCTTTCGGTCGGTATCGAAGACATTGCCGACCT
+GCTCGGCGATCTCGAACAGGCCCTGGGTTAACTACCGCGAGCAGACGCGAAAGCACCCCAAAACCGCCGG
+TTTGGGGGCTTCTGCGTCTGCTCGCGGGTACCTAGGAGTGGTACGGCTCGGCGCTGACTAGGGTCACCGA
+CACGGTGCTGCCGTTGGGCACCGTGTAGCTGCGGGTCTCGCCGACCTTGGCGTCGATCAGGGCCCCACCG
+AGCGGTGAATTCGGCGAGTAGACCTCGAGCTTGCCGTCGCTGACGCCCTCCTGGCGGGTGGCGATGAGGA
+ACGTTTCGCTGTCCGACTTGTCGCCATTGTAGTACACCTTGACCACAGAACCGGGTAATGCGACGCCGGA
+TTGCTTGGGTGCCTCGCCAACCTTTGCGTTGCTGAGCAAGTCCTGCAGCTGGCGAATGCGGGCCTCCTGC
+TGGCCCTGCTCCTCGCGGGCGGCGTGGTATCCGCCGTTCTCGCGCAGGTCGCCTTCTTCGCGGCGGTCGT
+TGATTTCGGCGGCGATGACCGGGCGATTCGCAATCAGCTGGTCGAGCTCTGCTTTGAGTCGGTCATGTGA
+CTCTTGGGTCAACCAGGTGACTTGAGTATCCGTCATCTCGTCGCGCTCCTCGTGTTGTCGTTCCCGCGTA
+GTCGGGCAAGTTTCGGATCCCTGCCAGCAGCACTGTCGGGAATATTTGGGGTCTCACCCCGGGTTGCCGC
+CGCTCCGTTCTGCGTACGGCCGTTAATGCAGCAATACACGGCCCCGGCAGGACCGTGCATCGATCCATGC
+TACCACCACGGTCAGGGGAGGCGCAGGTAGCTGGGCACTTCGGTGCCACAACCGTATACGTCCGCCATCA
+CCGGCGGCTGGGAGGATTTCACGGTCGTCGTCACCTGCACGGTGGTTGCCTCGGACGGTGGGACTAGCAG
+CTCACGTCTGCCGGTCTCGCTGCCGTTTGTTGCCCGAACTCGCACGATGCAGGCCACCGGTCGGGACGGG
+TCCGAACGTGTCACGCTGATGGTGACCGATGCCGTCTCGTCGTCGACCAGTCGATAGCCCACCAGCGAAC
+CGGTGACGGCGCTGGTGCTGATCCGTTGGTAGCCGATGACGGCAATGACGATGCCGGCCGCGGCGACCAG
+CACCCCCAGGGCGATCGCGACACGGCGCCGCGCTCGGCGGGACAGTCGCGGGCGTCCGTAGCGGGCGTCT
+GGTCGCGGAATGGGGGTGTGGGTCATGCCTGGGTTCACGCCGGCGGGATGCAACGCTTCGACAAACCGGA
+ATTATAGGGTCACTTATAGGCTTAAGGGGGCAGCCAGGCGGACGGACAAGGGGGCACGTGAGCGAACTGC
+GGTTGATGGCGGTGCACGCCCACCCCGATGACGAGTCCAGCAAGGGCGCGGCCACCCTGGCGCGCTACGC
+CGACGAGGGTCATCGCGTGCTGGTGGTGACGTTGACCGGTGGTGAGCGCGGCGAGATCCTCAACCCGGCG
+ATGGACCTGCCGGACGTGCATGGGCGCATCGCCGAGATCCGGCGTGACGAGATGACCAAGGCGGCCGAGA
+TCCTCGGTGTCGAGCACACCTGGCTGGGCTTCGTCGACTCCGGGCTACCTAAGGGTGATTTACCGCCACC
+GCTGCCTGATGACTGCTTCGCGCGGGTACCGCTGGAGGTGTCCACCGAGGCGCTGGTGCGGGTGGTTCGC
+GAGTTTCGGCCGCACGTGATGACCACCTACGACGAGAACGGCGGCTACCCACATCCCGACCACATTCGCT
+GCCATCAGGTTTCGGTGGCTGCCTACGAGGCGGCCGGTGACTTTTGCCGGTTTCCCGACGCGGGTGAGCC
+GTGGACGGTGTCCAAGCTGTACTACGTCCACGGCTTCCTGCGGGAGCGGATGCAGATGTTGCAGGATGAG
+TTCGCCCGGCACGGCCAACGCGGCCCATTCGAACAATGGCTGGCGTACTGGGACCCCGACCATGACTTTC
+TCACCAGCCGAGTGACCACCCGGGTCGAGTGCTCGAAATACTTCAGCCAACGCGACGATGCGTTGCGCGC
+GCATGCCACCCAGATCGACCCGAACGCCGAATTCTTCGCCGCCCCGCTTGCCTGGCAGGAGCGGCTGTGG
+CCGACCGAGGAATTCGAGTTGGCTCGCTCGCGTATCCCCGCGCGCCCACCGGAGACCGAATTGTTCGCCG
+GGATCGAGCCGTGAACCAGATTCTGCTCAGCGTGATTGCTGAGGGCGGGCCCGGTAACACCGGACCCGAT
+TTCGGGAAGGCTAGCCCGGTGGGGTTGCTGGTGATCGTGCTATTGGTGATCGCCACGTTGTTTCTGGTGC
+GTTCGATGAACCAGCAACTGAAGAAAGTTCCCAAGTCGTTCGACCGGGATCACCCCGAGCTCGACCAGGC
+AGCCGACGAGGGCACCGACCGCGACGGACCGGCCCGACCACCGGGACCCCCGCATGAGTCCGGCTAATCC
+GTCCGGGACGAATACCCTCGCGCTGGCCACCAGCCCGTACCTGCGCCAGCACGCTGATAACCCGGTGCAC
+TGGCAGCAGTGGACGCCGCAGGCACTGGCGGAGGCGGCCGCGCGCGCGGTGCCGATCCTGCTGTCCGTCG
+GCTACGCCGCCTGCCACTGGTGTCACGTCATGGCCCACGAGTCATTCGACGACGACGAGGTGGCCGCGGC
+CATGAACGCGGGCTTCGTCTGTATCAAGGTCGACCGGGAGGAGCGGCCCGACATCGACGCGGTCTACATG
+AACGCCACCGTCGCGCTCACCGGGCAGGGCGGCTGGCCGATGACATGCTTTCTCACCCCCAACGGCCGGC
+CGTTCTTCTGCGGCACCTACTACCCGAAAGCGGCTTTCCTGCAACTTCTTTCGGCCATATCCGAAACCTG
+GCGGGAACGCCGCGCTGAGGTGGAGCAGGCATCTGACCATATCGCTGCCGAGTTGCGCTCGATGGCTTCG
+GGGCTGCCCGGGGGTGGCCCGGAGGTGGCGCCGGAGCTGTGTGACGACGCGGTGGCAGGAGTGCTGCGTG
+AGCAGGACACGGCGCACGGCGGATTTGGCGGTGCGCCGAAATTCCCGCCGTCGGCACTGCTGGAAGCGCT
+AATGCGGCACTACGAGCGCACCCGATCACCGGCGGCGCTGGAGGCGGTCGCACGCACTGGAAACGCCATG
+GCCCGTGGCGGCATCTATGACCAACTCGGCGGCGGTTTCGCCCGATACAGCGTCGACGGTGCCTGGGTGG
+TACCGCATTTCGAGAAGATGCTGTACGACAACGCGCTGCTGCTGCGCGCCTACGCGCACTGGGCCCGCCG
+TACCGGGGATCCGTTGGCCCGCCGGGTCGCCGCCCAGACCGCGCGATTTCTGCTCGACGAGTTGGGCAGC
+AAAGCACCGGCCGACATGTTCACCTCGTCGCTGGATGCCGACGCCGACGGCCGCGAGGGTTCGACCTACG
+TTTGGACGCCGGTGCAACTGACCGAGGTGCTCGGCGGCGACGACGGCCGTTGGGCGGCAGAGGTTTTCGG
+GGTGACCGAGGCCGGCACCTTCGAGCACGGGACGTCTGTGCTGCAGTTGCCCGCCGACCCCGACGACGCG
+GCGCGTCTGGACCGGGTCCGCGCCGCGTTGCTGGTGGCCCGCCTGGCCCGGGCCCAGCCCGCCCGCGACG
+ACAAGGTCGTCACGTCCTGGAACGGGTTGGCGATCACCGCGCTGGCCGAAGCCAGCGTGGCCCTGGACGA
+CCCCGCGTTGGCGCACGCCGCGCGGCGCTGCGCGACCAGGCTGCTGGACCTGCACGTCGTCGACGGCCGC
+CTGCGCCGGGCCAGCCTGGGCGGGGTGGTCGGCGACAGCGCCGCCATCCTGGAGGACCACGCGATGCTGG
+CCACCGGGCTGCTGGCGCTCTACCAGCTGACCTCCGAGGGCGCGTGGCTGACGGCGGCTACCGGATTGCT
+GGACACCGCGGTGGCGCATTTCGGCGACCCGCAGCGCCCCGGTCGCTGGTTCGACACCGCCGACGACGCC
+GAGCGGCTGATGCTGCGGCCCTCCGATCCGCTGGACGGGGCGACACCGTCGGGCGCTTCGTCGATCGCCG
+AGGCGCTGCTGACGGCGGGCCATGTGGTCGACGGTGCTCGCGCCGAGCGGTATTGGCAGCTGGCGGCCGA
+CACGCTGCGGGCGCATGCGGTGCTGCTGGCTCGGGCGCCGCGGTCGGCCGGGCATTGGCTGGCGGTCGCC
+GAGGCGGTGGTGCGCGGACCGCTGCAGATCGCCGTCGCGTGCGACCTGCCGCGGTCGTCCCTGCTGGCCG
+ACGCGCGCCGGCTGGCCCCGGGCGGGGCGATCGTCGTGGGCGGCGCGGCGGGTTCGTCGGCGCTGCTGGT
+CGGCCGGGATCGGGTGGCCGGCGCCGACGCCGCCTACGTATGCCGGGGCCGGGTCTGCGATCTGCCGGTG
+ACCAGCGCGGCCGAACTCGCCACCGCTTTGGGCGTACCCGGCTAGCGGACTCGGGTGGCACCCGTCCACC
+GTGAAATCCGCGACGCGGTGTCGGCGTGTCGCGTCGCAATTTTCACGCTCGCGACCGCCCTGGGCGTGCC
+GGGTCAGAACACCACGAACCACATCGCGATGTAGTGGCAGATCGCCGCCACCGCGGTGCAGGCGTGGAAG
+AACTCGTGGTAGCCGAACGTCGTCGGCCACGGGTCGGGCCAGCGTACCGCGTAGAGAATGCCGCCGATGC
+TGTACAACGCGCCGCCAACAAACAGCAACACCAACGCGGTCACCCCGGCGTTGTGCAGGATCGTCGCGGT
+GTACCAGACCGCCACCCAACCCAGCAACAGGTACAGCGGAACCCCGACCGAGCGCGGCGCCGCCGGCCAA
+CACATCTTCAGCAAGATTCCGGCGATCGCACCGCCCCAAACAATCGACAACACCACGCGCCCGTCGTGGG
+CCGGCAAGGCCAGCAGCGCGAACGGCGTGTAGCTGCCGGCGATGAACACGAAGATCATCGAGTGGTCGGC
+CCGCTTCATCCAGTTGCGGGCCGTCGCGGATTTCCAATTGACCCGGTGATAAGTGGCGCTGACGGTGAAC
+ATGGTGATCGTGGCCGCGGTGTAGGCCAGCGTCGTCAGGCCCGCCTTGGCGGAACCCACCGCCCACGACA
+CCGCGACCAGCGACGCACCGGCCAACACCGCGGTGCCGGCGGAATACACGTGGATCCAGCCGCGGAAGCG
+CGGTTTGGTCAGGACACGGGCGACACCTTCGACGAGGTGGTGGGCAGCGTGGGCCGGCGTCCTTGCTTCC
+GCGGTGGTGGCGGTGTCGGCCTGGCCGCTCATTTCGCCTGTTGCCTCGTCTTGTGCTTGCCGGTGGGTGT
+CGTCGAACACAGTAGTCGGGCCAGGTAGCGGACATCTGACTCGACGTCTGGGTCACAGTAGTCTGGGTAT
+CTGTGGAGATCATCCCGCCGCGGCTCAAAGAGCCGTTGTACCGGCTCTACGAGCTGCGCCTGCGGCAGGG
+CTTGGCCGCCTCGAAATCCGACCTGCCCCGGCACATAGCCGTGCTGTGCGACGGCAACCGGCGATGGGCG
+CGCAGCGCGGGCTACGACGACGTCAGCTACGGCTACCGGATGGGTGCGGCCAAGATCGCCGAAATGCTGC
+GGTGGTGCCACGAAGCCGGCATCGAACTGGCCACCGTCTATCTGCTGTCCACCGAAAACCTGCAGCGCGA
+TCCCGACGAGCTTGCAGCACTCATCGAGATCATCACCGATGTCGTGGAAGAGATCTGCGCACCGGCCAAC
+CACTGGAGTGTGCGGACGGTCGGGGATCTGGGGTTGATCGGCGAGGAACCGGCCCGGCGGCTGCGCGGTG
+CGGTGGAATCCACCCCGGAGGTGGCCTCGTTTCATGTCAACGTTGCTGTTGGCTACGGCGGGCGCCGCGA
+GATCGTCGACGCTGTGCGCGCGTTGTTGAGCAAGGAACTCGCCAACGGGGCCACCGCGGAGGAACTCGTC
+GACGCGGTGACCGTCGAGGGTATCTCGGAAAACCTGTACACCTCAGGCCAACCCGACCCCGATTTGGTGA
+TACGCACCTCCGGCGAGCAACGCTTGTCCGGGTTCTTGCTGTGGCAAAGCGCCTACTCGGAGATGTGGTT
+CACCGAGGCGCACTGGCCGGCGTTTCGCCACGTCGATTTTCTACGCGCGCTGCGTGACTACAGTGCGAGG
+CATCGCCGCTACGGCAGGTGAATCCGGCGCAGGACGCCTATGTTGCGCTGTTCGGCTGCCTGCGCAGAGT
+GCACATTAGCCGGCTCGTCATGCTGTGCAATCTGCCCAGGTGAAACCCGGTGTTTGGGATCCTGGATAGC
+GATACCATCGACTGATCCATGCGGGACATCCGATGCTGGACTGATCGGAGTAAGGCGATGTCGTTTGTAG
+TCGTGGCGCCGGAGGTGTTGGCGGCGGCCGCTTCGGATCTAGCGGGCATCGGGTCGACACTGGCGCAGGC
+CAACGCCGCGGCGTTGGCGCCGACCACCGCGGTGTTGGCCGCGGGTGCTGATGAGGTTTCCGCGGCAATC
+GCGTCGCTGTTTGGGGCGCATGGTCAGGCGTATCAGGCGGTGAGCGCCCAAATGTCGGCGTTTCACGCCC
+AGTTCATGCAGGCGTTGACGGGTGCCGGCGGGGCTTATGCGGCTGCGGAGGCGGTCAACGTCTCGGCGGC
+GCAGAGCGTGGAACAAGACCTGTTGGCCGCGATCAACGCTCGCTTCGAGCGGATTTTTGGGCGCCCGCTG
+ATCGGTGATGGCGCCAACGGCGGGCCGGGACAAGACGGCGGGCCCGGCGGGTTGCTGTACGGCAACGGTG
+GCAACGGCGGCACCAGCACGACCGTGGGGATGGCCGGCGGCAACGGTGGTGCCGCCGGGCTGATCGGCAA
+CGGTGGGTTCGGGGGCGGCGGCGGGCCCGGCGCGGCCGGCGGCAACGGCGGCGCCGGCGGGTGGCTATTC
+GGCAACGGCGGCGCCGGCGGTGCCGGCGGCCTCGGCGTAGCGCCCGGCGTGCCCGGCGGCGCCGGCGGTG
+CCGGCGGCGCCGGCGGTGTCGGCGGACCCGCCGGGTTGTGGGGCCACGGGGGTGCCGGCGGGGCGGGTGG
+TGCCGGCGTGGCTGGCGCCGGCGGCTTCGAGGGGACGATCGGTGCCGGCGGTGCCGGCGGTGTCGGCGGT
+GCCGGCGGTGTCGGCGGTGCCGGCGGTGCCGGCGGGTGGCTGTACGGCGACGCCGGTGCCGGTGGGGATG
+GTGGTGTCGGCGGTGCCGGCGGCACCGGCGGGTTAGGCAACCGTGGCGGCGCCGGTGGCGCCGGGGGCGC
+CGGTGGTGTCGGCGGCGCCGGGGGTGCCGCCGGGCTGTGGGGCGGCGGTGGTGCCGGCGGGGTGGGTGGG
+ACCGGCGGCGGCGCCGGCCTCGGTGCTCAGAGCGTCACCTTCAGTAGTAGCTTAAGTGGCCTTTCCGGTG
+GCGACGGCGGCGCCGGCGGGGCCGGTGGCGCCGGTGGCGCCGGTGGCACCGGTGGGTGGCTGTATGGCGG
+CGGTGGTGCCGCCGGATCCGGCGGGGACGGTGGTACCGGCGGTCAGGGCGGCGCCGGCGGCGCCGGTGTA
+TTTAGCCTATTCGGATCCGGTGGCGGCCCCGGCGGCAACGGCGGCGTCGGCGGCGTCGGCGGTGTCGGCG
+GTGCTGGCGGGCGTGCCGGCTTGTTCGGCGTCGGGGGCCTCGGCGGCGCGGGTGGCGACGCCGGTGACTC
+CGGCGAAGGCGGCTTCGGCGGGCCGGGGCTCGCCGGCGGGCTGTTCGGCAACCCCGGCAACGGCGGCGTC
+GGCGGGATCGGCGGCGACGCCGCAGCCGGCGGCGCCGGTGGGGCCGGAGGCAACGGTGGGTGGTTGTTCG
+GCAATGGTGGTGCCGGCGGCTCCGGTGGCGACGGCGGCGCCGCCGGCCGTGGCGGTGCCGGCAACTTGGG
+CTCGGCCGGGGGTATCAACGCCCCCGCCGGTAACCCCGGTAGCGGCTCGGTCGGCATCGGCGGTGCCGGT
+GGTGCCGGCGGCACCGCCGGGCTGTTCGGCGACGGTGGGGCTGGTGGTGCCGGCGCCGCCGGCGGCTTCG
+GCGGCATCAGCGCCGCCACCCCCTCGGCGGGCAGTGAGGGCGCCATGGGTGGGGCCGGTGGTGTTGGCGG
+CAACGCCAGGCTGTTGGGCACTGGTGGCGCCGGTGGAGTCGGCGGCGGCGGCGGGGCCGGCGGCGACGGA
+GGCCGCGGCGGAGTCGCAACCCCCGGCGGTCAGGGCGGTGACGCTGGGGACGGTGGCGCCGGCGGGGCCG
+GCGGCAATGGCGGCGGCGGCGCCAGCGGCGCCGGCGGGTGGCTGTTGGGGACCGGTGGTGCCGGTGGTGC
+CGGTGGTAACGGCGGCAATGGCGGAAAAGCCGGTTTTAGCCCTGGGCCGACCAACTTCGGTCTCAACGGC
+GCCGGTGGTGGTGGTGGTGTCGGCGGCAACGGCGCCACCGGACCCTGGCTGTTCGGCGACGGCGGCGCCG
+GTGGCGGCGGCGGGGCCGGCGGCATCGGCGGCGACGGCGGCCCCACCCCAGGCAGCACCGGTGCCGGTGC
+GGCCGGTGGTCACGGCGGCGACGCCCAGCTGATCGGCAACGGCGGCCACGGCGGGGCCGGCGGCACCGGG
+GTGCCGAACGGGTCAGGTGGTGCCGGCGGCCTCAGCGGGCTGCTGTTCGGCGAGCCGGGGGCGAACGGGT
+AGGTTCGGCGCCGCTGCCGTGATCGCGGCGAGGCGTCGGTGTCCGCGTCCGTGCGGGCGAATCCAGTCCG
+GTCTGAGTGCGTCTACTACAGCTTGCGCAGCCGTAGCCGCTTGATGGCATCGGACTGGTTACCGTCTGCC
+TGCTGTCCACAGAAAACCTGTGTGCGATCCCGACGAGCTTGCCGTGCGTGGGCTACGGCGACCGTCGCGA
+ATTCGTCGACGCGGTGGCCGTAGAAGCCATCTGCGAAAACCTGAATACCTCGGGGCAACCCGATCCCGAC
+CTGGTGATCCGCACCTCGGGGGAACAACGCTTGTCCGGCCACCGAGGGCCCACTGGCGGAGTTTCGCGAC
+GTCGACTTCTGCGCGCGCTGCGTGACTACAGTACGCCACACGCGTCGATCCCCTACGTTCCGCCGCCCTA
+TCGAAGCGACGGGATCCACGCTTCCCGGCTGGCGGTTGAATCGGTTTTCGATGCATTGGCTGGGCGCGTC
+GAACTCTAAAGACTTTATGGAAATTAGTTGTACAGTGATAAAACCGTTATAGGGTCCGTTGTCAAACAAT
+GATAATCACGTGATAGGAACGTGATTCATCGGTCTGAAGTGCTTATGATGATTTATATATAAAACCGTTA
+TATGTGGGTAAAGGATTGCGGATGTCATACATGATTGCCACACCAGCGGCGTTGACGGCGGCGGCAACGG
+ATATCGACGGGATTGGCTCGGCGGTTAGCGTTGCGAACGCCGCGGCGGTCGCCGCGACAACCGGAGTGCT
+GGCCGCCGGTGGCGATGAAGTGTTGGCGGCCATCGCTAGGCTGTTCAACGCAAACGCCGAGGAATATCAC
+GCCCTCAGCGCGCAGGTGGCGGCGTTTCAAACCCTGTTTGTGCGCACCTTGACTGGGGGGTGCGGAGTCT
+TTCGCCGGCGCCGAGGCCGCCAATGCGTCACAGCTGCAGAGCATCGCGCGGCAGGTGCGGGGCGCCGTCA
+ACGCCGTCGCCGGTCAGGTGACGGGCAATGGCGGCTCCGGCAACAGCGGCACTTCGGCTGCGGCGGCCAA
+CCCGAATTCCGACAACACAGCGAGCATCGCCGATAGGGGCACAAGCGCCATCATGACCACGGCAAGCGCG
+ACCGCGTCTTCCACGGGCGTCGATGGCGGAATAGCGGCGACGTATGCGGTCGCCTCGCAATGGGATGGTG
+GCTACGTGGCCAATTACACGATCACCCAATTCGGGCGCGACTTCGATGACCGATTGGCGGTTGCAATTCA
+CTTTGCCTGAAAATGCCTCTATTTCGAACGCGTGCTGCGCTCAACTTGCCCAGTCGGGCACGCAGTACAC
+TCTTGACGCCCGAGAGCTATAACGGCACCCCCCGTGGACTCGATCACCGTCGGCTACCAAGCAGCGCAAA
+CCGGCGGCTACTCGCCACCGACAAATCTGCTGATCAACGGTCAAGCCGTCACCATCGACCAGACCCCCAT
+CACCTCGTCGCCAACGACTCCGCCACCCACCACACCACCCGAGATCCCGACCGGTGGAACGGTGATCTCC
+ACCTAGTTCGGGACGACTACGGTCACCGGAGGCTACGTGGTGCAGAACAACGCGTGGAACAACCCCCGCC
+GGGCAGACCGTCAACGTCAGCCAAACCGGGTTCACCATCACCGAGATGAACGGTGCTGCCCCAACCAACG
+GCGCCCCGCTGAGTTACCCCTCGATCTGCGAGGGCGTGCACTGGGGCCACCTCGTCGGTGGGCACCAACC
+TGCCTACTGAGGTGGGCCAGATTTTGTCGGCGCCGACCAGCATCGACTACAACTACCCGACGACCGGGGT
+ATGGGACGCCTCCTACGACATCTGCCTGGATTCCACACCCAAGACGACCGGGGTCAACCAGCAGGAGATC
+ATGATCTGGTTCAACCACCAGGGCTCCATTCAGCCGGTCGGCTCCCCGGTGGGCAACACCACCATCGAGG
+GCAAGAACTTCGTGGTGTGGGATGGCAGCAACGGCATGAACAACGCGATGGCCTATGTCGCGACCGAGCC
+GATCGAGGTCTGGAGCTTCGACGTGATGAGTTTCGTCGACCACACCGCCACCATGGAGCCGATCACCGAC
+TCGTGGTACCTCACGAGCATCCGGGCCGGCTTGGAGCCCTGGAGCGACGGTGTGGGTCTGGGGGTCGATT
+CGTTCTCGGCGAAAGTCAACTAAAGACCACGTTGACACCCAACCGGCGGCCCGGCATGGGCCGTCGCGGC
+GTAGAAGCTTTGACCGCGGCGCGAAACGTTCGCTGCTGCGGCCCATGCAGATCGCACACGCTTGCTTGAA
+CATCGGGTGGAGCCGGTGGTAACGCCAGGCTTTGGGTGTCGGCGCGGCTCGGCGGTCAGCTGCGCGGACG
+CGGTCGGCCATCGTGACGACGAGATGCTGGCGGCATGTACGGCAACCGCTGGCTCGTCTTAGAGCCATTT
+GCTGAGGCGCATGCTTTGCGTCATGCAAAGTGCATATGCCGCCAGCGGGATGGTGTGCATTCTGTCCATG
+GGAAACCGGGTTGATGGTGGGCGCGTCAGCGATACGATCTGTGCACCCTGACGACATGGCCGATGCATGA
+TTGATCGGAGGTAAACGATGTCGTTTGTGATTGCTGCGCCGGAGGCGTTGGTCGCGGTCGCTTCGGATCT
+GGCGGGCATTGGGTCGGCGCTGGCGGAGGCCAACGCCGCGGCGTTGGCCCCGACGACGGCGTTGTTGGCC
+GCGGGTGCCGATGAGGTGTCGGCGGCGATCGCGGCGCTGTTTGGCGCGCACGGGCAGGCGTATCAGACGG
+TTAGCGCCCAGGCGTCGGCGTTTCATGCCCAGTTTGTGCAGGCGTTGACTGGCGGCGGCGGGGCGTATGC
+GGCTGCCGAGGCCGCCAACGTCTCGGCGGCGCAGAGCACCGACCAGCGGCTGCTCGATCTGATCAATGGG
+CCCACCCAGGCGTTGTTGGGGCGTCCACTGATCGGTGATGGCGCCAACGGCGGGCCGGGGCAAGACGGCG
+GGCCCGGGGGGTTGCTGTACGGCAACGGCGGCAACGGCGGCACTAGTACCACCGCCGGGGTGGCCGGCGG
+CAACGGTGGCGCCGCCGGGCTGATCGGCAACGGCGGGGCCGGGGGCGGCGGCGGGGCCGGCGCGGCCGGC
+GGCAATGGCGGTGCGGGCGGGTGGCTGTATGGCAACGGCGGCGCCGGCGGGGCCGGTGGGACATCGGTGA
+TACCCGGTGTCGCCGGCGGCAATGGCGGGGCTGGCGGGTCCGCGGGACTGTGGGGTACCGGCGGGGCCGG
+TGGCGACGGCGGCAACGGCCGGTCGGGGCCAGTCAACGTCGCCGGCAGCGCGGGCGGCAACGGTGGCGCT
+GGTGGCGCCGCCGGGTTATTCGGTGACGCCGGGGCCGGTGGCAACGGCGGCAAGGGCGGTGCTGGCGGCG
+CCGCCTTTAGCATTAACTTCACCGCAGGCGATGGCGGTGCGGGAGGTGCCGGTGGGTCCGGCGGCCACGC
+ATTGCTGTGGGGCGCCGGCGGAGCCGGGGGTAACGGCGGATCCGGCGGCACGGGGGGTGCCGGCGGCAGC
+ACCGCTGGCGCTGGCGGCAACGGCGGGGCCGGGGGTGGCGGCGGAACCGGTGGGTTGCTCTTCGGCAACG
+GCGGTGCCGGCGGGCACGGCGCCGCCGCCGGAAACGGCTTAGCCGCGGGTAATGGCGTCAGCAGCAGCGG
+CGGCGGCGGTGCCGGTGGGACCGGCGGGGCCGGTGGGGACGGTGGCGCCGGCGGGGCCGGAGGCAACGCC
+AGGCTGTGGGGCGTCGGTGGCGCCGGCGGGGCCGGCGGGGACGGTGGCGCCGGCGGGGCCGGCGGCAAAG
+GCGGCTCTGGCCTCAGCGGTAACGCCAACGGCGGGGCCGGCGGCGACAGCGGCCGTGGCGGCACGGGCGG
+CGCCGGCGGCGAGGGCGGCGCCGCCGGGCTGCTGGTGGGCACCGGCGGGCACGGCGGTGACGGCGGGGCC
+GGCGGCGCCGCCGTCAAGGGCGGTGACGGCGGGGCCGCCGCCGGCACGGGCATCGCCGGCGCTGGCGGCC
+GTGGCGGCGCGGGCGGCAGCGGTGGCAGCGGTGGTGACGGCGGGGGCGGGGCCGCCGGCCCCGCCGGGTG
+GCTGTTCGGCGATGGCGGGGCTGGCGGGAACGGCGGGGCCGCGGCCGCCGGCGGCGCCGGCGGCCAAGCC
+GGCGGTGGCGGCGGGAACGGCGGCAATGGCGGCAACGGCGGCAATGGCGGCAATGGCGGCAACGGCGCCA
+CCGGGGGGTGGCTGTACGGCAACGGCGGGGCCGGCGGCCAGGGCGCCACCGCCGGAGCCGGCGGAGCCGG
+CGCTAACGGCGTCAGCAGCACCAATGGCGGCGGCAACGGGGGGATCGGCGGGACCGGTGGGTCCGGCGGG
+GCCGGTGGCAACGCCGGGCTGTTGGGCGTGGGCGGCGCCGGCGGGCACGGCGCCTCCGGCGGCGCCGGCG
+ATAGGGGCGGCGCTGGCGGTACCGGGTTCATAAGCAGTGACGGCGGTGCTGGCGGTGATGGCGGTGATGG
+CGGCAACGGCGGGGCCGGCGGCACCGGTGGGCTGTTGTTCGGTGCCGGCGGCAATGGTGGCCCCGGCGGG
+TCTGGCGGTGCCGCCGATATTGGCGGCAACGGCGGCGCCGGTAACGGCGGGGGCACCGACGGGAACGGCG
+GTAATGGCGGGTCCGGCGGCGGCGCCGGCAGCGGCGGTGACGGCGGCGGGGCTGGCGGCAACGGTGCGTG
+GCTGTTCGGCAATGGCGGCGCCGGCGGGGGCGGCGGAAAAGGCGGCAACGGTGCCGGCGGCGGGCTTGGC
+GGCGGTTCATTCGGCCTCCCCGGCCTGAACGGCAGCGGCGGCGACGGTGGCGACGGCGGTAACGGTGCCC
+CCGGCGGGGTGCTGTATGGCAATGGCGGCGCCGGCGGCCAGGGGTCAAGCGGTGGCATCGGCGGCCCCGG
+CGCCACCGGCGGTGCCGGCGGCAAAGGCGGTGATGGTGGCGATGCGCAGCTGATCGGCGACGGCGGCAAT
+GGGGGCAACGGAGGCGCGGGCGGCACCGGGGGCACCCCGGGGCCCGGCGGACCCGGCGGGTCCGGCGGGC
+TTGGAGGCCTGCTGTTCGGCCAAACCGGCACGGCTGGCGTGTCGCCGTAGCCGGTAGGCTGGCCGCCTCC
+GCGGCATTGGCGTCGTCGCAAACTTCGCGCACGCCCTGGTGTCGATCGTTGCCGCTGAATTGGCGCCGAT
+GACCGCAACCGGTATCGCCGCTACGCCGGCCCGAGGCGGGTACACCACGGTTTTCGAGGGATGGCAATAT
+CCGGGAGTGCGCCGGCTGGCGGCCTAACTCGCCTGCACCCGGCGATTGGACCGCCAATTACAGCTTGCGC
+AGCCGCAGCCGGTTAATGGAATGATCGGCGTCCTTGCGCAGCACCAGGGTGGCCCGGGGACGGGTCGGCA
+GAATGTTCTCCACGAGGTTGGGCCGGTTGATGGTCCGCCAGATCTCGCGCGCGGCGACGACGGCCTGCGA
+GTCAGAAAAAGCCGCGTAGTGGTGGAAGTGTGATTCCGGGTCGGCGAACGCCGTGGTGCGCATGGCCAAA
+AACCGTGATACGTACCACTGCTCGATGTCCTCGATCCGGGCGTCTACATACAACGAAAAATCGAACAGAT
+CCGACACCATGAGCGTGGGGCCGGTCTGCAAGACGTTGAGCCCCTCCAGGATCAGGATGTCGGGATGGCG
+GACCACTTGTTCTGCCCCCGGGATGATGTCGTAGTGCAAATGCGAATACACCGGCGCACATGCGTAGTCG
+GAGCCGGACTTCACCGAGGTGACAAACCGCATCAGTGCCCGGCGGTTATAGCTTTCCGGAAAACCTTTGC
+GATGCATGAGGTTTCGCCGCTGCAGCTCGGCGTTGGGGTAGAGAAAGCCGTCGGTGGTCACCAGATCTAC
+CCGGGGGTGGTGATCCCAGCGAGCCAGCAGCGCCTGCAGCACGCGGGCGGTGGTGGACTTGCCGACCGCC
+ACACTGCCGGCCACACCGATGATGAACGGCACCGGCCGGTCCGGGTTTTGTTGGGGCTCGCCGAGAAATT
+CCGCGGTGGCCGCGAACAGCCGTTGGCGGGCGGCGACTTGCAGGTGAATCAGCCGGGCCAGCGGTAGGTA
+GACCTCTTCGACCTCCAACAGGTCGATCTGCTCACCGAGACCGCGCAGGCCAACCAGTTCTTCTTCGGTG
+AGGGCTAGCGGAGTCGACATACGGAGCGCGCGCCACTGCCTTCGGTCGAACTCGACATATGGGCTCGGCT
+CGCTAAGCCGCGACATGGTGTCAGTCTTGCAGGGACGGGTGCGGGGCCTGATGGCTGGGCTGGCGAAGTG
+CGGTGCTGGCAGACTCCGTGTCGGTGCCGAGGGCCGGGGGTACCCCCTGGGCTTAGCTGGGCACTGGGGC
+CAGGGCGCGGTGTTTCGATGGAATTCAGCTGTGGCCCTGTGAATTTCGCACGCTGACGCCGGTTGATGCT
+GTGAGTCGGGCACAAACCGCCCACCGCTACTCGTGACCTACGTGGCAGCTGGGGCACTAGTGGCTGCCGT
+TTGCGGTGCAGACGTGCAACGGTGGATGGCGTGTGCTGCATTAAGGGTAATCAGCCCGGGAGCGGCTCGC
+TGGATACACTGGCGCCCGTGACTGCTGCACCTGACGCTCGCACTACCGCTGTAATGTCTGCCCCGCTCGC
+TGAGGTTGACCCCGATATCGCCGAGTTGCTGGCCAAGGAGCTTGGTCGGCAACGAGACACCCTGGAGATG
+ATCGCCTCGGAGAACTTCGCACCGCGCGCTGTGCTGCAGGCCCAGGGCAGTGTGCTGACCAACAAGTACG
+CCGAGGGACTGCCCGGGCGGCGCTACTACGGCGGTTGTGAGCACGTCGACGTGGTGGAAAACCTCGCCCG
+CGACCGAGCCAAGGCGTTGTTCGGTGCCGAATTCGCCAATGTGCAACCGCATTCGGGCGCTCAGGCCAAC
+GCCGCGGTGCTGCATGCGCTGATGTCACCCGGCGAGCGGCTGTTGGGTCTGGACCTGGCCAACGGTGGTC
+ACCTGACCCATGGCATGCGGCTGAACTTCTCCGGCAAGCTCTACGAGAATGGCTTCTACGGCGTCGACCC
+GGCGACACATCTGATCGACATGGATGCGGTGCGGGCCACCGCACTCGAATTCCGCCCGAAGGTGATCATC
+GCCGGCTGGTCGGCCTACCCGCGGGTGCTCGACTTCGCGGCGTTCCGGTCGATCGCCGACGAGGTCGGGG
+CCAAGTTGCTCGTGGACATGGCGCATTTCGCGGGTCTGGTCGCCGCGGGGTTGCACCCGTCGCCGGTGCC
+GCACGCGGATGTGGTGTCCACCACCGTGCACAAGACGCTCGGCGGCGGCCGCTCCGGCCTGATCGTCGGT
+AAGCAGCAGTACGCCAAGGCGATCAACTCGGCGGTGTTTCCCGGGCAGCAGGGCGGTCCGCTCATGCACG
+TCATTGCCGGCAAGGCGGTCGCGTTGAAGATCGCCGCCACACCCGAATTTGCCGACCGGCAGCGGCGCAC
+GCTGTCCGGGGCCCGGATCATTGCCGATCGACTGATGGCTCCCGATGTCGCCAAGGCCGGTGTGTCGGTG
+GTCAGCGGCGGCACCGACGTCCACCTGGTGCTGGTCGATCTGCGTGATTCCCCACTGGATGGCCAGGCCG
+CCGAGGACCTGCTGCACGAGGTCGGCATCACGGTCAACCGCAACGCCGTCCCCAATGATCCCCGACCGCC
+GATGGTGACCTCGGGCCTGCGGATAGGCACGCCCGCGCTGGCGACCCGCGGCTTCGGCGACACCGAGTTC
+ACCGAGGTCGCCGACATTATTGCGACCGCGCTGGCGACCGGCAGTTCCGTTGATGTGTCGGCGCTTAAGG
+ATCGGGCGACCCGGCTGGCCAGGGCGTTTCCGCTCTACGACGGGCTCGAGGAGTGGAGTCTGGTCGGCCG
+CTGACGCGGGCCTGTCGTTGGCGCGCATAAGCGCGAGAGCGCCGATCACCGCGCGACACGGCGGCGCCCG
+ATTTCACGAAATCTGTGTATGCGAGTTACAGTTACCGCATGGCACAGAAACCTGTCGCTGATGCGCTGAC
+CCTTGAGCTCGAGCCGGTGGTCGAAGCGAACATGACCCGCCACCTCGACACCGAGGACATCTGGTTCGCC
+CACGACTACGTCCCGTTCGATCAGGGGGAGAACTTCGCATTCCTCGGCGGACGCGATTGGGATCCATCCC
+AGTCGACGCTGCCCAGAACGATCACCGACGCATGCGAGATCCTGCTGATCCTCAAGGACAACCTGGCCGG
+TCATCACCGTGAGCTCGTCGAGCACTTCATACTCGAGGATTGGTGGGGCCGCTGGCTCGGCCGGTGGACC
+GCAGAGGAGCACCTGCACGCCATCGCACTGCGCGAATACCTGGTGGTGACCCGGGAAGTCGACCCGGTCG
+CCAACGAGGACGTTCGAGTCCAACACGTGATGAAGGGCTACCGAGCCGAGAAGTACACGCAGGTCGAGAC
+CCTGGTGTACATGGCGTTCTACGAGCGCTGCGGCGCGGTGTTCTGTCGTAATCTGGCCGCGCAGATCGAA
+GAGCCCATCCTGGCCGGACTCATCGACCGCATCGCCCGAGACGAAGTGCGACACGAGGAGTTCTTCGCCA
+ACCTCGTTACGCACTGCCTGGACTACACGCGTGACGAGACGATCGCGGCGATCGCCGCCCGTGCCGCCGA
+CCTCGACGTCCTCGGGGCCGACATCGAGGCCTACCGAGACAAGCTGCAGAACGTGGCCGACGCTGGCATT
+TTCGGCAAGCCGCAGCTACGGCAGCTGATCTCGGACCGCATCACGGCATGGGGCCTGGCTGGGGAGCCCT
+CCCTCAAGCAATTCGTCACGGGCTAGACACCCGTCGGCGCGCCTGCCCTGCGGGGGTACGGCCGGCGGAG
+TAGCGTCGCACTCGATGGCTAGCGACATGCTCTGCTGCCAGGGCGGCACCTTCCGTCACGACGGCTGTCA
+TGACAAGGGCAGGACCGGCCCCGGTCCTGGTGTCGCTGCCCCCGCCGACATGCTCGGGTGGGTCCGCTCG
+AGCGCCGTTAGCTCGAGGAGCGCTCCGTGACCGATACCCGCACGTACGTGCTCGACACCTCTGTGCTGCT
+GTCCGATCCGTGGGCGTGCAGCCGGTTCGCCGAACACGATGTGGTGGTTCCGTTGGTGGTGATCAGCGAG
+CTAGAAGCCAAGCGCCACCACCACGAGCTGGGATGGTTCGCCCGCCAGGCGTTGCGTCTGTTCGACGATC
+TGCGCCTAGAACACGGGCGGTTGGATCAGCCGATTCCGGTTGGCACCCAAGGCGGTACGCTGCACGTCGA
+ACTCAATCACACCGACCCGGCGGTGCTGCCCGCAGGCTTTCGCACCGACAGCAACGACTCGAGGATCTTG
+AGTTGCGCCGCCAACCTCGCCGCCGAGGGCAAGCGGGTCACGTTGGTCAGCAAGGACATTCCGCTGCGCG
+TTAAGGCCGCCGCGGTGGGGCTGGCCGCCGACGAGTACCACGCGCAGGACGTCGTTGTGTCCGGATGGTC
+GGGGATGCACGAGCTCGAGACCGCTTCCGCGGATATCGATGCGTTGTTCGCCGATGGCGAGATCGACCTG
+GTCGAAGCCCGGGACCTACCGTGTCACACCGGGATTCGGTTGCTGGGCGGCGGTTCCCACGCGCTGGGCC
+GGGTCAATGCGCATAAACGTGTTCAGCTGGTGCGAGGTGACCGTGAGGCGTTCGGTCTGCGTGGCCGCTC
+CGCCGAGCAGCGGGTGGCGCTGGATTTGCTGCTCGATGAGTCGGTGGGCATCGTGTCGCTGGGCGGCAAA
+GCCGGCACGGGCAAGTCCGCTTTGGCGTTGTGTGCGGGTCTGGAAGCCGTGCTGGAGCGACGCACCCACC
+GCAAGGTGGTGGTCTTCCGCCCGCTGTACGCGGTCGGCGGCCAGGAGCTGGGCTACCTGCCCGGTAGCGA
+GAGCGAGAAGATGGGCCCGTGGGCGCAGGCGGTCTTCGACACCCTCGAGGGGCTGGCCAGCCCGGCGGTG
+CTCGAGGAAGTGCTGTCCCGTGGCATGCTCGAGGTGCTGCCGCTGACCCACATCCGGGGCCGCTCGTTGC
+ATGACTCGTTCGTCATCGTCGACGAGGCACAGTCGCTGGAGCGCAATGTGTTGCTGACCGTGCTGTCCCG
+GTTGGGGACCGGTTCCCGGGTGGTGTTGACCCACGACATCGCCCAGCGCGACAACCTGCGGGTCGGCCGC
+CACGACGGGGTCGCCGCGGTGATCGAGAAGCTCAAAGGTCATCCGTTGTTCGCCCACATCACCTTGCTGC
+GCAGTGAGCGCTCGCCGATCGCCGCGCTGGTCACCGAGATGCTCGAGGAGATCACCGGGCCGCGCTGAGT
+GCGCCTCCCGCGAGCAGACACAGAATCGCACTGCGCCGGCCCGGCGCGTGCGATTCTGTGTCTGCTCGCC
+GGTAGACTTCCTGGGTGCCGAAGCGACCCGACAACCAGACCTGGCGCTACTGGCGCACGGTTACCGGTGT
+CGTGGTCGCCGGTGCGGTGCTGGTGGTGGGCGGGCTTAGCGGCCGGGTCACACGGGCGGAGAACCTGAGC
+TGTTCGGTCATCAAGTGTGTCGCGTTGACCTTCGACGACGGTCCGGGGCCCTATACCGACCGGCTGCTGC
+ACATCCTGACCGACAACGACGCCAAAGCCACCTTCTTCCTGATCGGCAACAAAGTGGCCGCCAACCCCGC
+CGGCGCCCGGCGCATCGCGGACGCGGGCATGGAGATCGGTAGCCATACCTGGGAACACCCCAATATGACC
+ACGATTCCGCCCGAGGATATCCCCGGCCAATTCTCCAGGGCCAACGATGTGATCGCCGCGGCGACCGGCC
+GCACGCCGACGTTGTATCGCCCGGCCGGCGGACTGTCCAACGATGCGGTACGCCAGGCCGCGGCCAAGGT
+TGGGCAAGCCGAAATCCTTTGGGACGTTATACCTTTCGACTGGATCAACGACTCCAACACGGCAGCAACC
+CGGCACATGCTGATGACGCAGATCAAGCCGGGTTCGGTGGTGTTGTTCCACGACACCTACTCCAGCACCG
+TCGACGTGGTGTACCAGTTCATCCCGGTGCTCAAAGCCAACGGCTATCGCCTGGTGACCGTCAGCGAGCT
+GCTCGGGCCGAGGGCGCCAGGAAGCAGTTACGGCAGCCGGGAAAACGGTCCACCCGTCAACGAACTGCGT
+GACATTCCGGCCAGCGAGATCCCGCCGTTGCCCAACACCTCATCGCCCAAGCCGATGTCCAACTTCCCGA
+TCACCGATATTGCGGGTCAGAATTCGGGCGGGCCAAATAACGGTGCGTAACCTCAGGACTTGTTGACCTT
+CAGCGCCTCAATGACCCTCTCGACGGTGGCGCGCGAGGTTGCATCACCGATGGGGGTGGCGCCCAGGAAG
+ACGGTGACCGGCTTGGTGTCGACCGCGATGATCGTGACCGAATCACCTTTGACGTTGCGTGAACTGTCGG
+CGATTGTGATATCGGCGTCTACCCGGGCGGCCCTGACCCCGTCGACGGTGATCGACGACGTCTTGGTCGG
+GCCCAGGGTGGGCGACGAGCCTGCGTAGCCGGGGCCGTCGGCCACGCATTGCATCAACTTCGATGCTTGC
+GCGGCGACGTCCATGGTGGTGACGAAGTTGGTTATCGCAACCTCGGCTTGCATCATCCACTGGTCGGCAC
+CGGCCACCTCGTGGCCGACGCCCACCGCGTCGATGAGGTTCGGGTTCTGGTCGTCGGAGAACGCCGACCA
+CCCGGGTGCCGCGCTGGTCGGGAACGACAGCTTACCCGCACTGATCGAATCGCCGATGGGCTGCACACCG
+CCGGACACATTTGGGGTACAACCGGTTGCGGTTTGCTGGGAAAACGGTTGCGACGTGGGAGCACTCGTCG
+CCGGAGAGGTTGCCGTGGTCGACTTGTTGTCGCCGCGGAGGCCGATCACCAGGATCACCACCAGTAGGAT
+GACACCCAGCACCGCGAGGCCGGCGAGGATCAGCCACGGTGTCTTCGATCCTGGCCCGGGCGGAGGTGGT
+CCTGGCGGATAGGGCCCCGCCGGCCAGCCGGGCGGATACTGCTGGGGTGGGTAGGCCGGCGGATAGGAGC
+CGCCCTGCGGTTGGCCTCCCCAATACAGGTCCTGCCCATACGTATTCGGGCCGTAGGGGTAGTTGCCGTA
+GGGGCCAGCGGGAGGAACCGTCATAGCCGATCGCTGTCGAGCTGCTCGGCCTTGGCCATTGCCAGCACGT
+CCAGACGGCGGTCCAGATCCTCGATCGACAGCCTGTCGCCGATCAGGCCACGGTCGATCACGGTTTGGCG
+AATCGTTTTGCGTTCCTTGAGTGCTTGCTTGGCGACGGCGGCCGCCTCCTCGTAGCCGATGGCCGAATTC
+AACGGTGTCACGATCGACGGTGAGGACTCGGCCAGCCGCCGCAGGTGCTCGACGTTGGCGGTCAGCCCTG
+CTATGCAGCGCTGGGCGAACAGCCGTGACACATTGGTCAGCAGCTTGAAGGACTCGAGGATGTTGCGGGC
+CATCATCGGGATGTAGACGTTGAGTTCGAATGCGCCGTTGGCCCCACCCCAGGCGATGGCGGCGTCGTTT
+CCGATCACCTGCGCGGCGACCTGCGTAACCGCCTCCGGCAGAACCGGATTCACCTTTCCCGGCATGATCG
+AGCTGCCCGGCTGCAGATCTGGCAGTTGGATCTCGGCCAGGCCGGTCAATGGGCCCGATCCCATCCAGCG
+GATGTCGTTGGCGATCTTGGTCAGCGATACCGCGATCGTGCGCAGCGCCCCGGACGCCTCCACCAGCCCG
+TCGCGGGCAGCCTGAGCTTCGAAAGAATTAGCCGCCGTACGCAATTCCGACAGACCGGTCTGCGCGACCA
+GCACCGCGACCACTCTGACGCCGAAGTCGTCGGGAGCGTTGAGGCCGGTACCCACCGCGGTGCCGCCGAT
+CGCCAGCTCGCCCAGCCTGGGCAGACACGCGCGCACCCGCTCGATGCCGGCCTCGATCTGGCGGGCATAT
+CCGCTGAACTCCTGGCCGAGTGTCACCGGAACGGCGTCCATCAGATGCGTTCGGCCCGACTTCACCACCG
+TGTGCCAATCAAGAGCCTTGGCGGCCAATGCGTCGTGCAGCTGCTGCAGCGCTGGGATGAGATGAGCGAC
+CGCGGCCTCGGTGGCCGCGATGTGGGTGGCCGTCGGGAAGGTGTCGTTGGACGACTGCGACATGTTCACG
+TCGTCGTTGGGATGCAACGTGACCCCGCCCTTGGCCGCGATGGACGCAATCACCTCGTTGGTGTTCATGT
+TGGAGCTGGTGCCCGAGCCGGTCTGGAAGACGTCGATGGGAAACTGGTCGTCGTGTTGACCGTCGGCGAT
+CTCGGCGGCCGCGGCGATGATGGCGTCGGCTTTCTCCGGCGCCAGCAACCCGAGGTCGGAGTTCACCTGC
+GCGCAGGCGCCTTTCAGCAGGCCTAGCGCGCGGATCTGGGTGCGCTCCAACCCGCGGCCGGATATCGGGA
+AGTTCTCCACCGCGCGCTGGGTTTGCGCGCGCCACAACGCTTTTGCCGGCACCCGGACTTCGCCCATGGT
+GTCGTGCTCGATGCGGTAATTGGCGCTGTCGGCGTCAACGGCCATTGATCGGGTTCCTTGTGTGTCGTGG
+GTGTGTTAGGGCAATGGGTACACGGCGCTGCTGTCGCCGGTGAAGTCGATCGCGGAGTATTCGTTGAGCT
+TTGAAAGCCGGTGGTAGGCCTCGATCATCCGGACGGTGCCGGACTTCGAGCGCATCACGATCGAATGGGT
+GGTGCAGCCGCCGGGGTAGTAACGCACTCCCTTGAGCAGGTCGCCGTCGGTGACCCCAGTGGCGCAGAAG
+AAGACGTTTTCCCCGGACACCAGATCTTCGGTGGTCAAGACCTGGTTCAGGTCGTAACCGGCTTCTAGGG
+CCTTGCGGCGTTCCGCGTCGTCGCGCGGGGCGAGCTGCGCCTGGATCGCCCCGCCCATGCAGCGGATCGC
+CGCGGCGGCGATGATTCCCTCCGGGGTGCCGCCGATCCCAGCTAGCAGGTCGGTGCCGGAGTGCGGTCGG
+CACGCCGAGATCGCGCCGGCGACGTCGCCATCGGTGATCAGCCGGATCCGGGCCCCGGTGGCGCGGACGT
+CGTGGATGAGTTGCGCGTGCCGCGGCCTGTCCAGGATGCACACCGTCATGTCTCGCACCGACAGGTCCTT
+GACCTTGGCGACCGCTCGGATGTTTTCCGAGATCGGCGCGGTGATATCCAGCACGTGTGCGGCATCGGGG
+CCGACGGCGATTTTGTTCATGTAGAACACCGCCGACGGGTCGAACATGGTGCCGCGATCGGCTACCGCCA
+GCACCGAGATGGCGTTGGTCATGCCCTTGCTCATCAGCGTGGTGCCGTCAATGGGGTCGACGGCAAAGTC
+GCATTCCGGTCCGTCGCCGTTGCCCACTTCTTCGCCGTTGTAGAGCATTGGTGCGTGGTCCTTTTCGCCT
+TCGCCGATGACCACCACCCCGCGCATGGAAACCGAGTTGACCAGTTCGCGCATCGCGTCGACCGCCGCGC
+CGTCGCCGCCCTCCTTGTCGCCGCGGCCTACCCAGCGGCCCGCGGCCATGGCTCCGGCCTCGGTCACCCG
+GACCAGCTCCATGGCCAGGTTGCGGTCCGGGGCTTCCCGGCGCGATGGCCTGGTGTGCGACGGGTCGTGG
+CTGGCCACCGCGGCCGTCGACGAACCGGATCCCTCAGCTGTCATGGTTGGTGATTGTCCCAGAAGCCGAA
+CCGTGCGCTGGAGCTGGGATACTGGCCATGTGACCGCCGAGCCGCAGCCGACCCCTAGGCCGGCTAAACC
+GCGGTTGCTGCAGGACGGCCGCGACATGTTCTGGTCGCTCGCGCCGCTGGTCGTGGGGTGCATCCTGTTG
+GCGGGCCTGGTTGGGATGTGCTCGTTTCAACTGGGCGGGACCAAGCGGGGACCGATCCCGTCCTACGATG
+CGGCCCAGGCGCTGCGGGCAGACGCCAAGACGCTGGGATTCCCGATACGGTTGCCGCAATTGCCAGGCGG
+CTGGACGCCCAACTCCGGGGGTCGCGGCGGCATCGAGAACGGGCGAGCGGACCCGGCAACCGGTCAACGC
+CGCAACGCGGCGACCTCAATCGTGGGATTCATCAGCCCGACCGGGAGATATCTGAGCTTGACCCAGAGCA
+ACGCCGACGAGGACAAGCTGGTCGGCTCCATCCACCCGTCGATGTACCCGACGGGGACGGTCGACGTGGG
+CGGCACCCGTTGGGTCGTTTACGAGGGTTCGGACGAAAACGGTGCCGTCGAGCCGGTATGGACGACACGG
+CTCACCGGACCGGGCGGGGCCACCCAGCTGGCAATCACCGGTGCCGGCAGCATCGATCAGTTCCGCACGC
+TGGCGTCGGCGACGCAATCGCAGCCCCCGTTGCCCGCACGATAGCGGGTCTCACTCAGCGGTTGACGGAG
+GCGGGGCGTTTCTTGACGTGGCCGGGCCTCGACGCGGCAGCCACCTGCGGCGGACGGGTGGTGCGTCGAA
+CTGTTCCAGTTCGACGCCTTTGTACACCGCGAGGTAGACGTCGATGGTGGTGACGATGAGGATCATCAGC
+ACCGGGCCGATGATGATACCCCAGGGGCCGAACATGGTGATACCGGCGAACACCGACAGCAACATCAGCG
+CCGAGTTCAGCCGCGCGTCGCGCGGCACCAGGATCGGCCGCAGGACGTTGTCGATGTTGGTAACCACCAG
+CAGATGCCACAGCAGCACGAAGATTCCCCCGGCGATATTGCCGTAGAAGATCATCCCGATGCCGAACGGA
+ATCGTCACGATGCCGCCGCCCAGCGGGATGATCGACAACGCGGTGAGCACGATGGCGAAGATGAAGAAGC
+CGTGGTGAAATCCGGCGATGTAGATCGATGCGGCGCCGGCGACTCCCTGGCACGCCGCGATGACGAACTG
+GCCGTTCACCGTGCCGCGGACCATCGAGCCCATCTTCTGCAGGTACAGATCCGTGACGTCTTCGCCGAGC
+GGGTTGAGCTGGCCGATCAGTGTCCTTAGCTTCTCGCGGTTCACCAAGAGCGCGACGAACACGTACACAA
+AGATGATGGCCGACGTGATGACACCGGCGAGGCTTCCGGCGGCGTCGCGCAGGAAGTGCAGCAGCCATTC
+GCCGACGTTCTGTGCTACCGAAATCATCGCTTTGCGCAGTGCGTCCGCGGTAACCGTGATGTGCAGGAAC
+GGCACCCGGTCAAACAAGCCGTTGACGAATTGCAGGATCTTGTCGCCGAGGGTGCTCAGATCGGTCGTCC
+GCACCCAGTCGGCGACGGAGTCGACCATGCGAGCGATCTGCACGATCGCCAGCCCCACCAAGGCTCCCAC
+CGGCACGACGACGGCGGCCAGCGCCGACAACAACGTGCAGGCGGCCGACAGGCCGGTATTGAAGCGCTTG
+GTGAACCACTTGAAAAGTGGCGTGAACAATAGGCGCCGACGGCTGCCACCACGATCAGAACGAAATAGTT
+ACGCAGGAAGTACGCACCGAACAGCAAAGCGATCAACGTGAGGATCGCCAGGGCGCGCTTCTGAGTGAGC
+GTGAATTCGGTGTTCAAAGCGGGTCCGCCCTTCGCTTCTTGGTGCTGACTCTGCGTCCAGCAGGCGGGTT
+ACTCGCACTATTGCGTGGTGGATGCAGAGTCAACGGATGTCGGTGCAGTGCTGTAGACCTATGCCACCAC
+CCAATCGAGGTCGAACGCGTTGCCGATGGCCTCGGCTAGAGCCGGCTCCTGCGACGCGAGCAGGTAGCCG
+ATTTGACGACCAAGGTCACACACCGGGATCGTTTGGATGTTGTCGCAGCTGACGACTGACGGTTGATTCA
+GCCCGTTCACCGCGTCTACCGGGACTTCGGTGGCTAGCCCACGCACGGTTGTCGTGATCGGGGCGACGGT
+GACGTTCGTGAGGTGCGGACGTACGACCTCGCGGGTAAGGATCAGGACGGGTCTAGCCTTGTCAAGCTGT
+GCGATGTGGATAGGTCGCATCAGTCGATGTCGAGGGCGGTACGAGCGCAGTGGCCGGCCAGCGTATCCAG
+ATCACCCGTGGCTGACGTGTTGGTGGCGAGGATCTCCGCGTCGCGTTCGGCGAGACGACGGCGGCGTTCC
+CGTTCCAGCGCCCGCAGCACGACAGCCGCACGGCTACGGGCATGCTGTCCCCGGACTTCGTCGTCGATGA
+ACGCGACAATCTCATCGGGCAAGCGAACCGCAATCTGTGTACTCACTTCACAGATGGTACCAGTTTGGTA
+TGCACCCGCCCCAAAACCGTTCGCGCCGCCGGCGAGGACGACCCCCCAGGGTAGGTACATTCCAGAAGTA
+TGGTCGTCGACAGCTGCGTGGCCGAATCCCGCTATGGTCCGGTCCGGGGCGCCGATGATGGCCGCGTCAA
+AGTGTGGAAAGGCATCCGGTATGCCGCGCCACCACTAGGTGACCTGAGGTTCCGGACGCCCGAACCTCCC
+GAACGGTGGACCGAGGTCGCCGACGCCACAACCTTCGGTCCGGCCTGCCCGCAGCCGGCCATCCCCAACA
+TGCCGCTCGATTTAGGGGCGTCGCAGAGCGAGGACTGTTGGAGCCTGAACATTTGGGCGCCGGCGGACAC
+CGAGCCCGGTGACGGAAAACCCGTGATGGTGTGGCTGCACGGGGGCGCCTACATCCTGGGATCGGGCAGC
+CAGCCGCTCTATAACGGCCGCAGGTTGGCCGCCAGCGGCGACGTGGTCGTGGTGACGGTCAACTACCGGC
+TCGGAGCGCTTGGCTTCCTGGACTTGTCGTCGTTCAACACGTCACGGCGACGGTTCGACTCGAATATCGG
+CCTGCGTGACGTGCTGGCCGTGCTGCGCTGGGTAGCAGACAACATCGCGGTGTTTGGCGGCGATCCCGAG
+AAGGTCACGCTGTTCGGTGAATCCGCGCGGGAATCGTCACGACCCTGCTCGCCACCCCGGCGGCCGCGGG
+TCTGTTCGCGGCGGCGATCGCCCAGAGCTCACCGGCGACATCGGTCTACGACCAGGTGAGGGCTCGGCGC
+GTCGCGGTTTGCGTCCTCGACAAGCTGGGAATCGACCCGTCCGATGTGCACAGGTTCATGAAGTGCCGAC
+CGCGGCAATCCTTTCCGCGTCCAGCGAAGTGTTCAACGAAGTGCCGGTTCGTAACCCCGGCACGCTGGCG
+TTCGTCCCGATCGTCGACGGCGATCTGCTGCCCGACTACCCGGTCAAGCTGGCGCAGGAGGGCCGCTCAC
+ACCCGGTTCCCTTGATCATCGGCACCAACAAGCACGAGTCGGCGCTCTTTCGGTTGATGCGCTCGCCGCT
+GATGCCGATCACCCCGCGCGATCACGTCGATGTTCACCCAGATTGCCGCCGAACAGCCCGATCTGCAAGT
+GCCAACCGAGGAGCAGATCGGCTCCGCGTACTCGCGATGGCGGCGCAAAGCACGCTCATTGAGTATGGCT
+ACCGACGTCGGCTTCCGGATGCCGTCGGTGTGGCTCGCTGAAGGGCACAGCGGGGTGGCGCCGGTGTATC
+TGTATCGGTTTGACTACTCGACTCCGCTGCTGAAGCTGCTGCTGGTCCGGGCCGCCCATGCCACCGAATT
+GCCTTACGTCTGGGGCAATCTCGGAGGATCCCAGGACCCTGCATTGAAGTTGGGCGACGCCAAAGCCGCC
+ATAGCGGTGTCCCGGAGGGTACGGACGCGGTGGATCAATTTCGCGACGCGGGGCAAACCCACGGGTCCCG
+ATGGCGAGCCAGACTGGCCATGTTACGAGGAGGCCCATCGTGCCTGCCTGATTATCGGCAGGCGAGACGC
+CGTCGTGCACGACGTCGACGCACACATCCGAGCGACCTGGGGCAGCAAGTGGTGAGTTTCAGATAATTCT
+GGCTACGGCTTGACTGTGGCGGCCGTTTTTTCCGCCCGGGCCTCGTTCTTCATCTGCTCAAACAGACTCA
+CGTAGTACGGCAGGCATTCGGTCAGCGCCTGCTGGGTGGTGAACAGCGGCTCATAGCCCAGGTCGCGGCG
+TGCCTTAGCGATCGAAAAGTAGTTGTCCAGGTACAGTCGTTCGACGGCCAGCGGCTCGAGCAGCGGCGCG
+GGGAATCCGAACCGGAAGTGCAGCCGCTGCCACCCCGTCATTACCCAGCGGACCGCGGGGCCGGAAATCC
+GCATCTTCGGCCAGCGCTGCCCGCACGCCTCGAGCACCGGCCGAGCGAACTCGAACATATTGATCGGCTC
+TGCGTCGTTGATGAAGTAAGCCTGCCCGGGCGCTGTGCCGTCCGGCACCAGATGGGCAGCGGCCAAGATG
+AAACCGTGAATCAGGTTGTGCACGTAAGAGTTATCCAGCCGGGCCGACTTGCGCCCGACCAGCACCTTGA
+CGTGGCCCTTGAGCACACTTTCGAACAGCTTGCGGAACATCGTCTGATCGCCGTTTCCCCAGATGCCGCT
+GGGCCGGATCGCGCACGTCAGCATGCCGTCGACACCGTTCTGGGCCAACACGAATCGCTCGGCAACCACC
+TTGGTCTCGGTGTAGAGGTCGTTGAACCGGTCGGTATAGGGCAGCGTCTCGTCACCGCCGGCGATGTTCT
+GGCCGCCCATCACCACACTGTTGGATGACGTGTAGACGAACCGCTGCACCCCGGCCCGCTGGCCGGCGTG
+CAGCAGGTTCTCGGTGCCGCCGACGTTGACCGCAAAGCTACGTTGGCGGTACTCGTCGGTGACCGACGCG
+CCGCCCATCAGCTCGATGATCGCTGCGGTGTGGAAGATCGTGTCGATGCCGTCCACGGCCGCGGCGCAGA
+CGTCCGCGTCGGTGATGTCCCCTTGCAGCACCTCCAGTTGCGGATGCGCAGGCAACAGCGACGGCGCGCG
+GTCGAAGGAACGCACCCAGTGCCCGCGGTCCAGCAAGGTGGTCACCAGGTTGGCGCCCACGAAGCCCGCG
+CCGCCGGTGACCAGAACGCGGCCGAGCTCGGTTGTCAGCGATGCATCACCCATGCGGCGAAGCATAACCT
+TGCCTTAGCCGTTTTGGGCCTCGTCGCCGGCCAGCACATCGGACACCCGCTGGCGTGCACCAGCTAAGTG
+CTCCTCGCACCTTTTGGCGAGTTGCTCCCCTCTTTCCCACAGTCGCAGCGACGCATCGAGGTCCAATCCG
+CCCTGCTCCAGAAGCCGCACGACTTCCATCAGCTCGTCCCGGCAGGCTTCATAGCCAAGCTGACTGACAG
+GCACAGTTGCGTGGGTTCTGCCCGTGTCATCGCCGTTGGGGTCACAGACCATTGGTTTGTCCTTCACTGA
+CCGCCGCTAGGGCTCCGTCGGCAACCCGCACGCGCAGCTTGGTGCCTTCCGGTGCGTCGTGGACCGACCG
+CAGCACCTGTGGTTCGGATCCGCCCTCGGGTCCCGTCTGAGCAACGGTCTGCACTATGGCATAGCCGCGG
+GCGAGCGTGGCGGCCGGACCCAGCGTGGCCAGGCGTGCGGCCAGATGACCGATGCGTTCGGTCTCGGCGG
+CGACCATCAGGGTGAGGTTGCGACGAAGCGTCGAGCGGGCTCGGTGGACCTCCTCGGCGCGCACGCTGAC
+CATCGTCATCGGATCGGCCAGCACCGGGCGGCTACGCAACTGCGCGACTGCCCGTTGCTCGCGGGAAACC
+CAGTTGCGCAACGCCTGGGCGCTGCGCCGGCGCAGATCGTCGATCAGCCGCTGCTCGGCTGCGGTATCGG
+GAACCACTTTCTTGGCGGCGTCGGTGGGGGTGGCGGCGCGCAGGTCGACGACCAGATCGCACAGCGGATT
+GTCGGGTTCGTGACCGACGGCGCTGACCACGGGCGTACGGCAGGCCGCGATCGCGCGGCACAACGTCTCG
+TCAGAAAACGGCAGCAGGTCCTCGACGGAGCCGCCGCCCCGGGCCAGCACGATCACGTCGACGTCCGGGT
+CTCGATCGAGCTCGCGCAGCGCCTCGACGATCTGGCCGACGGCGTTGGGGCCCTGCACGGCGACGTTGCG
+GACGGCGAAACGTGCCGCTGGCCAGCGCGCCGAGGCCACCGTCGTAACGTCACGTTCGGCGGCACTCGCA
+CGGCCGGTGATCAGACCGATCATGTTGGGCAGGTACGGGATCGGCCGCTTGAGGCGGGGGTCGAAGAGCC
+CCTCGGCGTCCAGCAGCCGGCGCAGCCGGTCGATGCGTGCCAGCAGCTCGCCGATGCCGACAGCGCGAAT
+CTCGCTGAGCCGCAAGGAGAATGTGCCACGTCCGGTGTAGAACGAGGGCTTGCCGCAGACCACTACCTGA
+ACGCCTTCGGCCAGCTTCACCGGCGCGGACAGCACCAGGTCGCGGGAACACGTCACGGTCAGCGACATGT
+CGGCCGCAGGATCGCGCAATACCATGAACACCGTCTTGGCGTCTGGGCGCATTGTGATCTGGGCCAATTG
+CCCCTCCACCCAGACCGCGCCCAGCTTGTCGATCCAGCCCGCGACCCGGATTGCCACCGCGCGAACCGGG
+AACGGATTCTCCGCCGAATTCTGGGTCACTTCGCAGTCGCGCGGGTGATCCTGTTGGCGAGCAGCGTCTG
+GAACGGGGCACGGGCCTTGGTGGCCTGCTCGTAGGCCAGCAGGGCCTCGAGCTCGGGGACATCGAGCGTG
+TGCAGCCTGGCCCGCAGCTGGGCCAGCGTCAGCGCCGGATAGTCGAGTTCGGCTGCCACCGCAGGCGTCG
+GAACTGTCGGCTTGGCCGCCGACTTGGGGTGCTTGGCGGTTTTGGGATTGGTCGAGCGATCCGCACTCCT
+GGATGCTGTCGTCGTTTCCGGCGTATCGGATACCGAGTACAACGCGAACCGCCCGTCGGACCGGCGATCG
+TCGTTCTTGGCTTCGCTGGCATCCGACAAGCCGAGCAATGGAATCGAAGTCCCTTCGAGCGCGTCGGGCA
+AGTCCTCGTCGAATGTTGCCCACTCCGGCTTCTCGTCCTTGGGCGGAAACAGCGTCTCCAGGGTGTTGTC
+GCCCTTGATCACCAGTTCGGCCAGGCCCTGTTGGAATCGCATCACCACGTGCGCCGCCTGGCTGGCCAGG
+GTCATTGGGTACATCAGGATGGTTCGTGGCAGCTTCATCGTCTCCTCAACGGCGACTGTCGCCGCGCCGA
+CCAATAGCCGAACCCCATACGGTGCAGTAGCCATGGATCCAAGACTGCCTCAAGCAGCGGCTAACTCCAA
+GCCGGTGGCCGTGAGCTGGCGGGTTCGTGTCGGCCCAAAGTACCCTGAATGCCATGGTTCCGACGGTCGA
+CATGGGGATTCCCGGGGCTTCGGTATCGTCGCGATCGGTGGCCGACCGTCCCAACCGTAAGCGGGTGCTG
+CTGGCCGAGCCGCGTGGCTACTGCGCTGGCGTGGATCGGGCCGTCGAAACGGTCGAACGCGCGCTTCAAA
+AACACGGCCCGCCTGTCTACGTGCGTCACGAGATCGTGCATAACCGCCACGTGGTTGACACCCTGGCTAA
+GGCCGGTGCGGTTTTCGTCGAAGAGACCGAGCAGGTTCCCGAGGGAGCGATTGTGGTGTTCTCCGCGCAC
+GGGGTCGCGCCTACGGTGCACGTCAGCGCCAGCGAGCGCAACCTGCAGGTCATTGACGCCACCTGCCCGC
+TGGTCACCAAGGTGCACAACGAGGCCAGGCGGTTCGCCCGGGACGACTACGACATCTTGCTGATCGGTCA
+TGAGGGCCACGAGGAAGTCGTCGGTACTGCTGGGGAAGCTCCCGATCATGTGCAGCTGGTCGACGGGGTG
+GACGCCGTCGACCAGGTGACCGTCCGTGACGAGGACAAAGTGGTTTGGCTGTCGCAGACCACCCTGTCCG
+TCGATGAGACCATGGAGATTGTCGGGCGGTTGCGTCGGCGTTTCCCCAAGCTGCAGGATCCGCCCAGCGA
+CGACATCTGCTATGCGACCCAGAATCGGCAGGTCGCGGTCAAGGCGATGGCGCCCGAGTGCGAGCTGGTC
+ATCGTGGTCGGCTCGCGCAATTCGTCGAATTCGGTTCGGCTGGTCGAGGTGGCGCTGGGTGCCGGGGCGC
+GGGCCGCCCACCTGGTGGACTGGGCCGACGATATCGACTCGGCCTGGCTGGACGGCGTTACCACGGTCGG
+CGTTACGTCGGGGGCATCGGTCCCCGAGGTGCTGGTGCGCGGTGTGCTGGAGCGGCTGGCCGAATGCGGC
+TACGACATCGTGCAACCGGTGACAACGGCCAACGAGACGTTGGTGTTCGCATTGCCCCGGGAGCTCCGCT
+CACCTCGCTGAGCACATCCGCTCACGGTTAGACGTCGTATTCCCAGGATTCAGCCGGTGGTCTGCGCGGT
+GCCCGCGAACGATCCCGCCGATCGAACCGCTGCTCCTCGCGGTAGTTGTCCCGCCGCGCGTCGCGAGTAG
+CTGACCCGCGGTAGCGGACCTGCGAGATCGGATGGTGTGTCGGGTTGGTTGGCTCGCTGGGACGGGCGCG
+TCGGCGTTGGGGCTCGTAGGTGGGCTCGTAGCGCGCATAGGGCTGGTATCGAGCACCCCGACGTTCGTAC
+CGGTTGACGGGCTCGGCAGGCCCGGAGGGTTCGGACGGCTGGTAGCTGCGGTAAGAATCGAAGCGGCTGC
+TGCGCGGTGCCGGCCGTTCGTGGGCATTGCGGCGCGGGTGCGGATCATTCTGCGGCCTAGGGCGGCGGCG
+CGATCGACGCTCGGCTATGGGTTCGCGGTTGTCCTCCGACGGGGGTCGGGCGTGTCGGGAACGAGTACGG
+GCAGGCCGCTGGGCCGACCGCCGGCCGCCGTCGTCGTCCGAATCGCCGGTCATCAGCGAGCTGAGCTTCC
+TGGCGATGCTGTCGAACAGAGCCGTCCCGAGATACCACCTGACCAGTCCGATCAGCAGCACGCCGGCAGC
+CGTGCCCAGCATCAGCGGGAAACGTTCGATGAGCGAGTAGCCGCAGTTGATCAAGAGGTCTTTGAACTTG
+CCGATCGTGCCCCCGTGGAACAGCCAGTAGGCCCCGGGCACGGCGCAGAAAAGTATCAGTGGCGGCTGGA
+CGAGCGCGGTGAACAGGTCCGACTGCCGGACGGCCAGGACCGCCCCCACGCAGCCGGCGATATAGCAGCC
+GGTAAAGACGAGGGTTAGCGCCTTGTGGCCCGATCCGGCGTCGATTGCATACCCGATCGCCGTCGCGGTG
+ACGGCGATCAGGATGGCAGCCCACCACGGCACACCTGGGATGTGGGGGTGAATCGAGCGGTGACTTGCCT
+GTACCGCCGACCTCGCCCGCTGCGCTGACACACGTCGACCGTACCGGCAATGGCGCCGAAGGCGGCACCG
+CCTCGCCTTAAACTTGGCTCTCTGTGAGCTTGAGCCTGGGGATCGTGGGCCTGCCCAACGTCGGCAAGTC
+GACACTTTTCAACGCGCTGACCCGAAACAACGTGGTCGCGGCCAACTACCCGTTCGCGACGATCGAACCG
+AACGAAGGTGTCGTCTCCCTGCCCGATCCCCGCCTGGACAAGCTTGCTGAGCTTTTCGGATCGCAGCGAG
+TCGTACCCGCGCCGGTCACCTTCGTGGATATCGCCGGCCTGATCAAGGGGGCGTCCGAGGGAGCCGGGCT
+GGGTAACAAGTTCCTGGCTCATATCCGCGAATGCGACGCCATTTGTCAGGTGGTGCGGGTGTTCGTCGAC
+GACGACGTGACTCATGTCACCGGACGGGTCGATCCCCAGTCCGACATTGAGGTCGTCGAGACCGAGCTGA
+TCCTGGCAGATCTGCAAACCCTGGAGCGGGCCACGGGCCGGCTGGAGAAGGAAGCGCGCACCAACAAGGC
+GCGCAAGCCGGTCTACGACGCGGCACTGCGTGCCCAGCAGGTGCTCGACGCCGGCAAGACGCTGTTCGCC
+GCGGGGGTGGATGCCGCCGCGTTGCGCGAGCTGAACCTGCTGACCACCAAGCCCTTCCTGTATGTGTTCA
+ACGCCGACGAGGCGGTGCTCACCGACCCGGCGCGAGTCGGTGAGCTGCGCGCGTTGGTGGCGCCCGCCGA
+TGCGGTGTTCCTGGACGCCGCCATCGAGTCGGAGTTGACCGAACTGGACGACGAGTCGGCCGCGGAGCTG
+CTGGAGTCCATCGGGCAGAGCGAGCGCGGGCTGGACGCGCTGGCCCGGGCGGGTTTTCACACCCTGAAGT
+TGCAGACCTTTTTGACCGCGGGCCCCAAGGAAGCGCGGGCGTGGACCATCCATCAAGGCGACACCGCGCC
+GAAGGCGGCCGGGGTGATCCACAGCGACTTCGAGAAGGGTTTCATCAAGGCCGAGATCGTGTCCTACGAC
+GACCTGGTGGCCGCGGGTTCGATGGCGGCGGCCAAGGCGGCCGGCAAGGTCCGGATCGAAGGCAAGGACT
+ACGTGATGGCCGACGGTGACGTAGTGGAGTTCCGATTCAACGTGTAGGCGGGAAAGCCGGGACGCAGCCA
+GAGCCCAGATCCCATGGCATCATTGCTTGCATCGAGTGATGCATGTATTGATGGGAGTTGGTGAATGAGG
+ACGACGGTGACCGTTGACGACGCCTTGTTAGCCAAAGCGGCCGAATTGACTGGGGTGAAAGAGAAGTCGA
+CGCTCCTGCGCGAGGGGTTGCAGACACTGGTCCGGGTGGAGAGCGCCCGGCGGTTGGCGGCTCTCGGCGG
+CACCGACCCGCAAGCTACCGCGGCGCCGAGACGCCGGACGTCGCCCCGGTGATCCTGGTCGACACTTCGG
+TATGGATTGAGCACCTGCGCGCCGCCGACGCGCGACTCGTCGAGCTGCTGGGCGATGACGAGGCCGGTTG
+CCATCCGCTCGTCATCGAGGAGCTGGCGCTTGGCTCGATCAAGCAGCGAGACGTTGTTCTCGATCTGTTG
+GCCAACCTCTACCAGTTTCCGGTGGTGACCCACGACGAAGTGTTGCGGCTTGTCGGTCGGCGGCGGTTGT
+GGGGTCGGGGACTCGGTGCCGTCGATGCCAACCTTCTTGGTTCGGTGGCTCTGGTTGGCGGCGCGCGACT
+ATGGACGCGGGACAAGCGGTTGAAGGCGGCGTGCGCGGAAAGCGGTGTTGCGCTGGCTGAGGAAGTGTCC
+TGAGTTGTATACCGTCAGCGTTGCTGGGAGTAATCGACCCGGTGCCGCGTGGCGCATGTTCGGCCATGTT
+CATTGCCCGATTTGGCGCGATAGCGTGATTTATGTTGATTTGTTACATTCGCACTGAACCCTTCCGTATC
+TATTTTTATATTGTTGCGTGACATATCCGCTGTACGCGTGGGACGGGCCATTATTTGGATAATGCGTGAT
+AAGCACCACAAGAATTGATTTCCTATGGATATTGTCGGTAGCGTTCGCGCCCATGATTGCTCTTGCAACG
+CTGTTGACGCTTATCAATCAAGTCGTCGGCACTCCGTATATTCCCGGTGGCGATTCTCCCGCCGGGACCG
+ACTGCTCGGAGCTGGCTTCGTGGGTATCGAATGCGGCGACGGCCAGGCCGGTTTTCGGAGATAGGTTCAA
+CACCGGCAACGAGGAAGCCGCCTTGGCGGCTCGGGGCTTTCAACAGGGAACCGCCCCCAATGCCTTGGTG
+ATCGGTTGGAATGGCCACCACACGGCGGTGACGCTGCCCGATGGCACGCCCGTATCCAGTGGTGAAGGCG
+GTGGCGTGCGGGTCGGTGGCGGTGGCGCCTACCAGCCCAAATTCACCCACCACATGTATCTGCCGATGGA
+TGTGGACGCGGGAGAAGACCAGCCGCCGGCGCCAGATGAGCCGGTCACCGCGGTCGACGACGTGGAACCG
+GAAATGCCTGCACCGTGCCCGACCCAGCGCCCGCCGGTGACCCCGAGACATAACCTGTGCAACAAACTCC
+GGACTATGCCAGGGGCGCTCTCGGCCGCGCTGGCCGCGGCGGCGCCGGTCTGGCCGGCCCCTATAAGCGG
+CTGCCGCGGGTTCAGCACGTCCCTCTTAGCAAAAAGAAATCACCCAGTAATCGTCGGGAAATAGAGTGTA
+CCCAAACCAATCCTTCCGTGGCGGAAATATTCTTGGCGCTTCTCCAACGCCTTCGCCAAATCGTTGTCCA
+CGGAACGATTTCACTTATGCAAGCACGGCGCTGCCATACGGATGTGTAGTCGAATGGCCGACGAACCGCG
+CTTAGAAGCCGGCGCGCACCCCTTCGAAGAGGGCCGGGACAAGGCCCCCGAACTTCGTGCCACTCAGATG
+GACCATGTCCGGTTCACCGAAGGTCGGCGTGAACGTAACCGTGACCGGCTCGAGCGGAGCCAGCAGTTCC
+GCCAACCGGGTCGCTGACAGCGACCAACTCGTATCCGTACTCCGGTGACACGTCAATCGACTGCGATATC
+GACGTCTGGCCGAACAAGAAACCGTTGACGGCGTTGCCCGGAGCCTGCAGAACCGCACCGGTGGCCCCCA
+ACAGGTTCCCGCTATGCAGCGCACCGACAAATGCCGTGTTGCTGTCCTGCAACCCCCTGACCGTGCCCAG
+GGCACCCATACGTCATCGTCGAGCACACAGCGTAGCCGCCGGGCGCTCCGGCTCTGGGTGAAATGACGCT
+GGGGCCTCAAGGCCAGCACCGGTTACCCACTTCTCGGCCCCGGGAGCGCACCATGCGCACGGCGATGTCG
+CCCCGTCAGGCATGTGCCCAAACCGTGGACAACGCACGTTGTCACCGTTTATCGTGAGCGCAAAGTGGGA
+GTATGGAGTGTACGTGCCCGGCCCGGGTACCCTGAGCGGCAATGATCTTCATCGTCGTCAAGTTCGAGAC
+CAAACCCGAGTGGACCGAGCGCTGGCCGGATTTGGTCGCATCGTTCACCGCGGCCACGCGTGCCGAAGAG
+GGCAACCTATGGTTCGAGTGGTCCCGCAGCCTCGACGACCCGGCCGAGTACGTCCTGGTCGAATCCTTCC
+GTGACGGCGAGGCCGGCGGCGTACACGTCAACAGCGATCACTTCAGGCAGGCCATGCGGGAACTGCCGAA
+GGCACTGGCGTCCACCCCCAAGATCATCAGCCAAACCATCGATGCGACGGGTTGGTCGGCGATGGGGGAG
+ATGACGGTCGGGTAACCGGCGAGGCCCGATCAGCCGCCCACGTCGACCGCGATTTCGTGACCCAGCCGAT
+AACCCGGCGCCAGGGGCAGCGAGTCACCGCTCCAGAACTTGCCGGGGTCGAACCAGTGCGCGTCCTTGTC
+GGTGACCAGCAATCCCATTTCCTCATAGGTGATGGCCACCGTCTCCGCGCAATATGCCGTCGCCAGGCCC
+ATCGTGCGCTGCTGTTGCTTACGTCGCTGGGTTTGTTCGCGCACCTTGCGGTCCAGCACCGGTATGCCGC
+GCAGCCAATCGTTGAGGGTCGGAAGCCGGCCGCGCAGCCACCGGCCGGTCAACCGGGCGGTGGTTGGGAA
+AGGCGTGCCGTTCATCCGCGCGATGACCCGCAGCAGTTTGTCCTCCTGGTCGCGATTGGCGTGCGGTGTC
+AGTTGACGCAGCCAGCACCGCTGCCGATAACGGCCGGCCCACTGCTGCACGACTTGGCGGGCGTCGTTGA
+GCTGCACGCCGCGGTGGTTGGTGCCGGTCCATACGTCGAGCAGCTTGTCGCCCAGTTCGGCATGCCAGAT
+CAGCGGCGGCAAGTCGTCGATGGCCACCGTCATGCCGACGTGGTTCACCGGGGCGTTCGTCAAGGTCTGG
+ATCGCCCGGTCGGGTCGGGAACGGCCGCGAAACAGCCAGAGGTCGCCGGTGCGGGTTTCGTTCAGCGCTC
+GATCCAGCGCTAGCGTGCTCGGGTCCACCCCATGCACCATAGGCGGATATAGCCTGTCGGGGTGCGCAAC
+GTGTGGAAGTGGGTCGGGCTGGCCGGTGTCGCCGGCGTCGTCGCGGGTGGCGCCCTGGTGGCGCGCGATC
+AACGGAAACGACGTGCCTACACGCCCGACGAGGTGCGGGCCCGATTGCACCAGAGGCTGGACGAATCCGA
+CGTCGACGGTTATCAGTCCAGGTCCGGCCCGGGTGCCGCGTCGAGCGAGAACAGGCGATAGCTGCCGAAA
+CGGATATCGGCACAGTCGCTGACGGCGTCGTGCACCGGTTCGCCTACCAGGATCTGGCCGCCGACCGCTT
+GCCCCGCAACCCGAGCGGTCATTGCGACGTTGCGGCCGAACAGATCGTCACCGTGCCGCACCGAGCGCCC
+CATGTGGTGCCGATCCGCACCCGAATTCCCTGGTTCCGCTTACGCTTTGCGCTGTTGCGCAGCGCGTCCT
+GGATGTCGATGCCGCACCGCACCGCCTGTTCGGCGCGGGCGAACGCGATCATGAACCCGTCACCCTGACT
+CGTGACCATGTGCCCGGACCAGCGCCGCACCAGCTCATGAACCAGCTTGTCATGCGCGCCAATCAACTTG
+ACCCATGTGCGATCCCCGATTCGTTCGTCGAGCGCGGTGGACTCCTCGATGTCGGAGAACAGGATCACCA
+CCCGGGCGTCCGGGGTTACCCGAGCCAGGTCGGGACGCTCTACCTCGGCCCAGTCGGCGGGGTCCTCGAT
+CGAGCTGCGCACGGCCGCTCCGAACCCTTCTTTGCGCACCAGGTTCGCGGTCTGCCAGACCGTCTTTACC
+GCTTCACGACCACCCGACAGCATTGCGGGCGTCGAGCCGCTCCCGCGGTTGCTCGGTTTCCTGGCGTATC
+CGCCTCAGCCGGATGCGCATCGGGACGAGTCCGCCGGCCTCGATCGTGGCGATCCCGGCCAGGATGTAGA
+CCGCGATCTGCAGCGTCGGGTTGTCGGGCCAATGGGCTAGGGTTGAGTTCGGCCGCCGCGGGAAAGCAAG
+TCTGGAGGTGCGGGTTTGGTTGACGGCGGAGGTGGCGCGTCAGATCTGTTGGTGATCTTCGGAATTACCG
+GTGACCTGGCCCGCAAGATGACCTTCCGCGCGTTGTATCGGCTCGAGCGCCACCAGTTGCTGGACTGCCC
+CATCCTGGGTGTGGCCAGTGACGACATGTCCGTCGGGCAGTTGGTCAAGTGGGCTCGCGAGTCCATCGGT
+CGTACCGAAAAGATCGACGATGCGGTGTTCGACCGGTTGGCGGGCCGGTTGTCCTACCTGCACGGTGACG
+TCACCGACAGCCAGCTCTACGATTCGCTGGCCGAACTGATTGGCTCGGCCTGTCGGCCGCTGTATTACCT
+GGAAATGCCGCCGGCGCTGTTCGCGCCGATTGTCGAAAATCTCGCGAACGTGCGGCTGTTGGAGCGCGCA
+CGCGTTGCCGTGGAAAAGCCGTTCGGCCACGACCTGGCCTCCGCGCTCGAACTCAACGCCCGGCTGCGAG
+CGGTGTTGGGCGAAGACCAAATCCTGCGTGTGGACCACTTTCTGGGCAAGCAGCCCGTCGTCGAGCTGGA
+GTACCTGAGGTTCGCCAATCAGGCGTTAGCCGAGCTCTGGGATCGCAACAGCATCTCCGAGATCCACATC
+ACCATGGCCGAGGACTTCGGGGTGGAGGACCGCGGCAAGTTTTACGACGCCGTCGGTGCCCTGCGTGACG
+TGGTGCAAAACCATCTGCTGCAGGTGCTGGCGCTGGTGACGATGGAACCGCCGGTCGGTTCCAGCGCCGA
+TGACCTCAACGACAAGAAGGCCGAGGTCTTCCGGGCGATGGCGCCGCTGGATCCCGATCGGTGCGTGCGT
+GGGCAGTACCTCGGCTACACCGAAGTTGCGGGCGTAGCAAGCGATTCGGCGACCGAAACGTATGTCGCGC
+TGCGAACCGAGATCGACAACTGGCGCTGGGCCGGGGTGCCGATCTTCGTGCGGGCCGGAAAAGAGCTGCC
+CGCGAAGGTCACCGAAGTACGGCTATTTCTACGCCGAGTTCCGGCATTGGCCTTTCTGCCCAACCGCCGA
+CCGGCCGAGCCCAACCAGATTGTGCTGCGTATCGACCCCGATCCGGGTATGCGACTGCAGATTTCGGCCC
+ACACCGACGACTCGTGGCGAGATATCCACCTGGACTCCTCGTTCGCGGTGGACCTCGGTGAACCGATACG
+ACCCTATGAGCGGCTGCTGTATGCCGGATTGGTCGGCGATCACCAGTTGTTCGCCCGCGAGGACAGCATC
+GAGCAGACGTGGCGGATCGTGCAGCCGCTGCTCGACAACCCGGGTGAAATCCATCGGTACGATCGCGGTT
+CCTGGGGTCCGGAAGCCGCGCAGTCGTTGCTGCGCGGTCACCGCGGTTGGCAGTCGCCGTGGCTGCCCCG
+CGGCACGGACGCATGAGTTCAAGGAGACGAAAAGGCGATGCAACTAGGAATGATCGGTCTGGGCCGGATG
+GGTGCGAATATCGTCCGCCGCTTGGCCAAAGGTGGACACGACTGCGTGGTCTACGACCACGACCCCGACG
+CGGTCAAGGCGATGGCCGGGGAGGACCGGACCACCGGGGTGGCCTCGTTGCGTGAGTTGTCTCAGCGGCT
+CTCCGCCCCGCGAGTTGTCTGGGTGATGGTGCCCGCGGGGAACATCACCACCGCGGTGATCGAAGAGCTG
+GCCAACACGCTCGAGGCCGGCGACATTGTGATCGACGGTGGCAACACCTATTATCGCGACGATCTGCGGC
+ACGAAAAGCTGTTGTTCAAGAAGGGAATTCACCTACTCGACTGTGGCACCAGCGGCGGTGTGTGGGGTCG
+GGAACGTGGCTACTGCCTGATGATCGGCGGGGATGGCGACGCGTTCGCGCGCGCGGAGCCGATCTTCGCC
+ACCGTCGCGCCGGGGGTGGCGGCCGCCCCGCGCACCCCGGGCCGAGACGGTGAGGTCGCGCCATCGGAAC
+AAGGCTATTTGCATTGTGGGCCTTGCGGTTCGGGTCACTTCGTGAAGATGGTCCACAACGGCATCGAATA
+CGGGATGATGGCCTCCTTGGCGGAGGGATTGAACATCCTGCGCAATGCCGACGTCGGCACCCGCGTGCAA
+CACGGTGACGCCGAAACCGCGCCGCTGCCGAATCCCGAGTGCTACCAGTACGACTTCGACATCCCGGAGG
+TCGCCGAGGTATGGCGGCGGGGCAGCGTGATCGGCTCCTGGCTGCTGGATTTGACCGCGATCGCGCTGCG
+CGAATCACCTGACCTAGCGGAATTCTCCGGACGGGTCTCCGACTCTGGCGAGGGCCGGTGGACCGCCATC
+GCGGCGATCGACGAGGGCGTGCCCGCGCCGGTGCTGACCACCGCGCTGCAGTCCCGCTTCGCCTCGCGTG
+ACCTCGACGACTTCGCCAACAAGGCGCTGTCGGCGATGCGCAAGCAGTTCGGCGGACACGCCGAGAAACC
+GGCTAACTAAGTCGCCTGACGAAGTCCACCACGACGTCGGTGAACGCGTCGTTGTCGTCGCCGGCGGCGG
+TGCGCCCCGCGTTGGACAATTCGACGAACTCCGCGTTGGGCACCTTGGCCAGGAAGTCCCGGGCACCGTC
+GGAACTGACCACGTCGGACAGCTTTCCGCGAATCAACAGGACCGGGATCGTCAGGCCCATGGCAGCCCGT
+TCGAAGTTCTCGGTGCGCAGCTGCGGGTCGTGCCCCGGCGCGGTCATCATGGCCGGATCCCAGTGCCAGT
+GCCAGCGTCCGTCTCGCAGGCGCAGATTCCTCTTCAGGCCCTCGGGACTGCGCGGCTTGTCGCGGTGCGG
+CAGATACTCGGCGACTGCGTCGGCGGCTTCCTCGAGCGAACCGAAGCCGTCGATGTTGCCCAGCATGAAG
+TCCCGGATACGGGCGTTGCCCTCCTTCTCGTAACGCGGCACCACGTCGACCAATACCAGTCCGTTCACCG
+TCTGCGGACCGGCGCGCTCGGCGACCAGGATGCCAGTCAGTCCGCCCATGCTGGCCTCGACCACCACCAC
+ACGGCGGCCGATCGCCTCGACGACGTGTAGCACATCGGTGGTCGGGGTCTCCACGGCATAGTCGGCGCCG
+GGAGCGCGGTCGCTGTCACCGGGTCCGCGGGTGTCCAGCGCAACGACGTGGTGCCCCTCGTCGGCCAGGA
+TCTGGCCGGTGTTTTTCCAGGAAAACCGGTTTTGGCCGCCACCGTGCAACATCAGGATCGTCGGCCGATC
+GGCCGCTGCGGCGCCCCGATTCCACTCGTCGGCGACCAGGGTAATCCCACGAGCACCGGAAAACGCGACC
+GCTTGGGGACTGCTGCTCACGGCGCTCACGGGTCCTGACGTTACCTTGCTGGGCACGCGCCAAATCGTCA
+TCGCCGACCTGGAGGATGCGGTGATCAAGGTGCCCTAGCTACTGGCCTCTTGGGTTCCGCCGGTTACGTT
+GGACCATGCGGGCTGGACGCGGCGAACGGGAGTCAACATGGCGGACGACAATGGCTGAACCACACTGGAT
+TGACGTGAAGGGTCCCAACGGCGACCTGAAAGCCTTGACCTGGGGGCCGGCCGGCGCGCCAGTTGCGTTG
+TGCTTGCACGGCTTTCCGGATACCGCCTACGGGTGGCGCAAGGTCGCACCCCGGCTGGCCGAGTCCGGCT
+GGCACGTCGTGGCGCCGTTCATGCGTGGTTATGCGCCGTCTTCGATTCCGGCCGACGGCAGCTATCACGT
+CGGTGCGTTGATGCACGACGCCCTGCGGGTGCGCTCGGCTGCCGGTGGCACCGAGCGCGATGTGATCATC
+GGCCACGACTGGGGCGCGATCGCCGCTACCGGCCTGGCCGCCATGCCCGACAGCCCGTTTGCCAAGGCGG
+TGATCATGTCGGTGCCGCCGTCGGCGGCATTTCGCCCGCTGGGCCGGGTGCCCGAGCGTGGCCGGTTGCT
+GCGTGAGTTGCCGCATCAGCTGCTGCGCAGCTGGTACATCCTGTACTTCCAGTTGCCCTGGCTGCCGGAG
+CGATCCGCCTCCTGGGTGGTGCCGCTGCTGTGGCGGCGTTGGTCGCCGGGCTATCACGCCGAGGAAGACC
+TGCGGCATGTCGACGCCGCGATCGGGACGCCGGAGGGCCGGCGGGCGGCCTTGGGACCGTATCGCGCCAC
+CATGCGCAACACCCGGGCCCCGGCGGACTATGCCGACTTGAATCGGCTGTGGACCGAGGCGCCGAAGCTG
+CCGGTTCTGTACCTGCATGGCCACGACGATGGCTGTGCCACATCGGCATTCACTCATTGGACGGCAAGGG
+TGTTGCCCGCCGGCAGTGAGGTGGCCGTAGTGGAACACGCCGGGCACTTCTTGCAGCTCGAGCAGCCGGA
+CAAGATTGCAGAGTTGATCGTGGCGTTCATTGGCTCACCCGGCTGAAGTCGTGGCCGGGCACCGGATGGC
+GGCCGTCGACGCGCAGTTCTACTGGATGTCGGCCAAAGTCCCCAACGACCAGTTCCTGCTGTATGCGTTC
+GATGGTGAACCCACCGATCTGGAACGTGCCGTCGCGCAGGTCTACCGTCGAGCCCGTGGGTGTCCGGGCT
+TAGGGATGCGAGTTCAGGACCGTGGTGCTCTGGCCTACCCGCAGTGGGTGCCCACACCCGTGCAACGTGA
+CCAACTGGTCTGCCACGACCTGGCCGATCGCAGCTGGCAAGGTTGTCTGGCGGCCGTTGTCGGCCTCGCC
+GGCAAGCAGCTGGATATGCGCCGGATGCCCTGGCGGCTGCACGTGTTCACCCCGGTGCACGACGTTCCGG
+GCGTCAGCGGCCTCGGCACCGTCGCCGTCATGCAGTTCGCGCATGCGCTGGGCGACGGCGCGCGGGCTTC
+GGCGATGGCCGCGTGGCTGTTCGGCCGGCCGGCCGCGGTTCCCGAAATAGCCAGGTCGCGTGCGGGTTTC
+CTGCCGTGGCGGGCCGCCCATGCGGCCCGCGCTCATCTCCGACTGGTTCGTGATACCAATGCCGGGCTGG
+TAGCGCCAGGTGTCGGATCCCGGCCGCCGCTGTCCACGAATGCCCGCCCCGAAGGTGTCCGCGCGGTGCG
+CACCCTGCTGCGGCGGCGCTCGCAACTAGCCGGTCCCACGGTGACCGTCACGGTGCTCGCCGCGGTGTCC
+ACCGGGCTGTTGGGTCTGCTTGGCGGGGATGTGGACACGCTAGGCGCCGAAGTACCCATGGCCAAACCGG
+GTGTGCCACGGTCATATAACCACTTCGGCAACGTTGTCGTTGGGCTGTACCCGCGGCTGGAGCCCGATGA
+GCGGGTGCGGCGGATCGCAACCGATTTGGCCAACGCCCGCCGTCGCTTTGAACATCCGGCGATGCTCTCC
+GCTGACCGGGCCTTTGCGGCGGTACCGGCGGCGCTGCTGCGTTGGGGCGTATCGCAGTTCGACGCTGAGG
+TGCGGCCGGTGCGGGTGGCCGGCAATACCGTGGTGTCCAGTGTTTATCGCGGGGCTGCCGATCTGAGCTT
+CGGGGACGCTCCGGTGGTGCTGACGGCCGGGTATCCGGCGCTGTCGCCGGCGATGGGTCTAACCCATGGC
+GTGCACGGCATCGGTGATACCGTCGCGATCAGTGTGCACGCGGCCGAGTCTGCGGTGTCTGACATCGACG
+CCTACATGCGGCTGCTGGACGCGGCTCTGCAGTGAAAACTACTGGGCATCACCGGATTTAGCCGCTTCGT
+CTCGTGTCAGCCCGACGGCCTGGATCAGCTCCTCGTGTAGTTCGAACCACACGGTGTGGTAGGAGTCGAT
+GAGTGGGCGCGTCAGCCAGGCGATGTCGCCCGCTTTGACCTTGTCCAGCGCCGCACGCAATTTCACCGGG
+TACCTGCTCAACCGCGGCAGCTGCATGGCCACCGTACCGATGATCGGGCCCACCCGCCGGTGTACGCCAT
+CGAGGCGGGACAGCACCGCGGCGTCGTATTCGGCGTCGTCGTGTGTGTTAGGCTTTTCGCCCTTGAGCTG
+CCAGTCGGTGACCAGCCTCTTGAAATCGGCGTTGACGGAACGGAAATCGCGGTAAGCGGCAGCCAGCACG
+GTCGAATCGGCCCGGTTGCGCTCCTCGGCAAGCAAGTCGTCGAGCCTCATCCGGCCGCTGGGACTGATCC
+GCAACGGCGTGGCGTCGACCAGGAGGCCGGCCGCGGTCAGCCTGTCGACGGTCGCGGCGACGTCGGCAAG
+GTCTTCACCCAAGGTCTGCGCCAGGTCGGTGGTGATCACCCGGCCCTTGAGCCGCACGGCCTGCAGTACC
+GTCAACTCGCTCATGAACTGATCCGTTGCGCGATGTCGGCCAGCTCGCGCAACTCCGGCGTGTCACTTTC
+CGACCAGGCAGACAATGCCAGAACGCCTTGGCGCACTTCGCCTTCATAGCCGTCGACGGTGATCTCCTTG
+CCGGCCAGTGCCGCCGCGACCCCGGGACCGCAACCCACCACGGCCACTCGACCGAGCTCGCGGCTAACCA
+CCGCCGCATGACTGGCGGCACCCCCCACCTCGGTGACAATGCCTTGCGCGGCAAGCATGCCCATGACGTC
+CTCCGGTCTGGTGTGATCTCGCACCAAGATGACCGGCTCGCCCCGGTCCGCAGCGTCCAGCGCCTCGTCC
+ACCTCGGTGTAGGCGGTCCCGGATACCACGCCCGGGCAAGCGGGCAGGCCCTTGGCCAAAAGCGGTGCGG
+CCAACCGTGTTTCCGGCTGCAGCGACGGCCGTAGCAAAGTCTCGATGTGCGTCGGAGTCACCCGGCGCAG
+TGTCTCGGTGTCGTCGATGAGTCCCTCGTGATGCAGTTGCAGCGCCAGTCGCACGGCGGCCTGCGCCGAG
+CGTTCCGCCCCGCGGGTCTGCAGCAGCCACAGCTGGCTGTCCTCCACGGTGAATTCGATCTCCTGGACGT
+CGCCTGCCATGCGCTCCAAACTGCGGGCGGCCGCCATCAGTTGGTCGTAGACGGCCGGCTGCTGGTCGCG
+CAGGGCGGTGATCGGTGCGACGGCGACCAATCCGGACACCACGTCGTCGCCTTGGCCGCCGGGTAGCCAT
+TCGCCGAACGGTTCGTTGGCTCCGGTGATCGGGTTGCGTGAGGACAGCACCCCGGCGCCCGAGTTCGCGG
+TGAGGTTGCCGAATACCATCGCCTGCACCACCACCGCCGTACCGCCTTGGTCGTCGAGGCCGTGATGGTC
+GCGATAGGCAACGGCGCGAGGTGAGTTCCAGGAGGCGAATACCGCCTCGATGCTCGCGCGCAACTGGGCA
+TACGGGTCGTCGGTAATGGGACCGGCGCTGCCGACGATGCGCCGATACATGCTGGTGAATCGCCGTCTGG
+TGTCGTGGGCGAAGTCGGCGGCACCCGGCCTGGCAAGTACTCGTTCGACCGCGTCGGTCATGCCCACGTC
+CAGAATCGTGTCCATCATGCCGGGCATCGACTGGGTGGCTCCCGAGCGCACGCTGACCAGCAGCGGATTC
+GGGCCACGGCCGAACGTGCACGAGGTTTCTGTTTCCAGCCAGCTCATCCGATCCAGCACGTCATCCCAGA
+TCGCGGCGATCGTGGATTCGGGCGCGGCGAGATAGCGCACGCCCACCTCGGTGGTAATGCAGAATGCAGG
+CGGCACCGGCAGATGGTGCCGGCGCATCATGTCGATGCCGTGGCCTTTGTTGCCCAGGATCTCGCGTGGG
+TAGTTCGCGCCGCCGTCCAGCGCCACAACGGCGTTTTCGAGAGTTCCGTCGGGGCAACCATTGGCTCGGG
+TGATACGAGTCATGGGCACCCCTTGATGCTACTTATGGGCAACGCCAGACCGCCCACTGTGGGCCCACAG
+GGGGCGCCTTGGTCAGCGGTCGGACTACTCAGCTTGTGTCTGGTGTTGGGCCTTACCCATGCTGCGAGAC
+AACGCCGGCTGCCGGTGATGGTGGCTGGCGGCGTGGACAGCGCACCGGCCCAACGGCTTGGTTCGACCGG
+CTCCCCCGCCTAACGCTACGGGTCGCCTTCGTCGTCTGCCAGGAGCTTTTCCGGGTGATGGAACGTATTG
+ACTCGAGGTTGGCCGTGGTCGAGATGTGGCGGCGGTAGCCACTCGGTGTCGCCGTGGGCGTTCTTGCGGG
+TCGTCCAGCCACGTTCGGCTAACGGATGATGGCCACCGCAGCCGAGTGTCAGGTCATTGACGTCGGTGTT
+GCGGCACTGGGCGTACGGCGTGACATGATGGACTTCACAGTAATAGCCGGGCACGTCGCAACCAGGTGCG
+CTGCAGCCACTGTCCTTGGCGTACAACATAATTCGCTGCGCCGGGGAGGCCAGGCGCTTGGTGTGGTAGA
+GCGCCAGGGCCTTGCCTCGATCGAATATCGCGAGGTAGTGGTTTGCGTGGCGGGCCAGCCGGATCACATC
+CGATATGGGCAAGATCGTACCCCCGCCGGTGAGGCCCGCGCCGGCCGCGGCCTCCAAGTCCTTCAGCGTG
+GTGGTCACGATGATGCTGGCCGGTAATCCGTTGTGCTGGCCCAGATTGCCACTTGTCAACAAACTACGTA
+ATCCGGCGTTGAGCGCGTCGTGGTTCCGCTGTGGGCAGCTGCGGGTGTCTCGCCGCGCCTGCTCCTTCGA
+GGGCGCGCCGTTCACACACGGTGCCTTCTGCTCGGGGTTGCACATACCCGGGGCGGCCAGCTTGGCCCAC
+ACCGCCTCGATAGTGGCGCGCAGCTCGGGGGTCACATATCCGCTGAGCCGCGACATCCCATCGACATCTT
+GCTTTCCTAACGTCAAGCCGCGGCGGCGGGCGCGGTCCTCGTCGGTGTAGTCGCCATCGGGGTTGAGGCA
+GTCCATGATCCGCGCGGCCAATTTGGCCAGCTGGTCGGGACGGTACTGGGTGGCCTGCTTAGCCAAGTCC
+CGTTCGGCCTTCTCCAGGGTCTTGAGGTCTACCCAGGATGGTAGGCGGTGCACGAAAGCACGGATTACTT
+CAACATGGCCGTCACCAATTAACCCGTGGCGCTGTGCCTTTGCGGTGGCGGTGAGTAGCGGTGGCAGCGG
+CTCGCCGGTCAGCGCACGGCGCTGGCCAAGGTCGGCGGCCTCGGCCACTCGCCGCTTGGCCTCGCTGCGG
+GTGATGCGCAACCGGTCGGCCAGCGTCAATCCCAGCTTGCCGCCCAGCTCCTCCTCGGTGGATTGTTCGC
+CGATCTGATTGATCAACGTGTGTTCGACGCTGGGCAGCTGGCGTCGCGCGGTCTCGCAGTGCTCCAGCAG
+CGCCAGGCGCTCCGGGGTGGTCAATGCGTCAAAGGTCAGCCCCAGCACGCGGGACAGCGCGGTAGCCAAT
+GACGCGAAGGCCTCCGTGATCTCCTCCCGAGTGGAACACATGACTGAATGCTATGTGCAGGCACCGACAA
+CAATGCTTGCCCAGAGCCTGCTGAAACCACAGTAATATAAGGGGTTTCGTTGTCTGCTGTGGCGTCGGGC
+GGTCAAACCGATTGCTCGGTCGACGAATAAGGCAAGCTGCTGCCCGCGTTCTCGTCGACCGCGACGCGAC
+CACCGAGATAGGGGAACGCACGTTGGGCGCACGACGTTCGGTTGCAGATCTTGCAGCCCGCCCCGATCGG
+GACCTCCGTGCTCGGGTCGTCCAGGACGACACCGGTGGAGTAGACGAGTTTATGGGCGTGCGCGAGGTCG
+CAGCCCAGCCCGACCGCGAAGTTCTTGTGCGGGCCCAGATACCCGAGCCCGTCGGCAGCGGTGGTCTTGG
+CCACCCAGAAGTACGACCTGCCGTCGGGCATTTGCGCCACCTGGCGGACGATCCTCTCTGGCTGGGCGAA
+CGCGTCGTGGACCACCCACAGCGGGCAGCTGCCGCCGACCCGGCTGAAGTGAAACGCCGTCGCGGACTGT
+CGCTTTGAGATGTTTCCGGCCTTGTCGGTGCGGACGAAGATGAACGGTATCCCTCGCTGCCGCGGGCGCT
+GCAGTGTGGAGAGCCGGTGGCAGACGGTTTCGAAGCCCACTCCGAACCGGCGGCCCAGCAGGTCGATGTC
+ATAGCGTAACTGCTCTGCGGCACGGTGGAATTCGCGGTAGGGGAGCAGGAAGGCGCCGGCGAAGTAGTTG
+GCCAGTCCGATGCGCGCGACGCCGCGGGCTTCGGTGCTGAGCTGGTCATCGGTGGCCACGATCGACGAGA
+TCAGGTCTGACTGGCCCACCAGCGCCAGTTGGGTGGCGATCTGGAAGGCGCGCTGTCCGGGCATCAGCCA
+GTGGGCGACCCGAAGGACCTTGGTGTCGGGGTGGTAGCGGCGCTTGGCGGTGTCGGGCAGATTGTCATCG
+ATCACCACCGAGATGCCGAACCGGTCCCGCATCAGCTCGGCCAGCTGGATGTCCAATCCGCCGGTCCGCA
+TCCCGCTTTCGGTAAACATCCGCTCCGCCGCCATGTCCAGGTCGTGGATGTAGTTGTTGCGGTCGTAGAA
+GAAGTCGCGGACCTCCTCGAACGGCATCGGCCGCGCGGGCGGTAGCTCGGTTTCGGCGGTCGCACGAGAT
+CGGTAGCCCTCTAGTTCCTCGGTGGCGGCGCGCAACCGGCGGTGCACGGCAACCAGGCTGTGGCCGACCT
+CGGGCATCCGGGCGACGAATTCTTCGATCTGGGCGCCGCTGACCGCGTGCTCGACGCCGATGTCGGTGAA
+GACGTCGGACAGGTCGGCCACCAACCGTGCGTCGGAATCCGAGGAGAAATACTGCGCCGACAGGTCAAAC
+CGCTCGGTAAGCAGAAGCAGCACGGGCACGGTGATGGGCCGCTGGTCATTCTCCAACTGGTTGACATAGC
+TTGTGGATAAGTCCAGGGCCTTGGCCAGCGCCACCTGGGTGAGCCCGCGCTCTTGACGTAACCGCCGCAG
+GCGGGCACCGGAAAACGTCCTCGAATACGTCCTAGCCACCGGTAAGACATTACTCCGCGTCATGTTCGCA
+AAATTTGCAAAATGTGCCGGGTCAGGACACAAAAGTACGCCTTTTCAGGGTCTTTTGTTGGTGTCCTGTG
+CTGCGTATGGTGCGGATTATGTTGATGCATGCGGTCCGGGCGTGGCGCAGCGCCGACGATTTCCCGTGCA
+CCGAGCACATGGCCTACAAGATCGCCCAGGTGGCTGCCGATCCGGTTGACGTCGACCCGGAGGTAGCGGA
+CATGGTGTGCAACCGCATCATCGACAACGCTGCGGTGAGCGCCGCATCAATGGTGCGCAGACCGGTCACC
+GTGGCCCGCCACCAGGCACTGGCGCATCCGGTGCGACACGGGGCGAAGGTATTTGGCGTCGAGGGCAGCT
+ACTCGGCGGACTGGGCGGCCTGGGCCAACGGCGTCGCCGCGCGTGAACTTGACTTTCACGACACGTTTCT
+GGCCGCCGACTATTCGCACCCGGCGGACAACATACCCCCACTGGTGGCGGTCGCCCAGCAGCTCGGCGTG
+TGCGGCGCGGAGCTGATCCGCGGTCTGGTAACCGCCTATGAGATCCACATCGACCTAACCCGCGGAATCT
+GCTTGCACGAGCACAAGATCGACCATGTCGCCCACCTGGGCCCGGCGGTGGCCGCCGGCATCGGGACCAT
+GCTGCGGCTCGACCAAGAGACCATCTACCACGCGATCGGCCAGGCCCTGCATCTGACCACCAGCACCCGT
+CAATCCCGCAAGGGCGCCATCTCCAGCTGGAAGGCGTTCGCGCCGGCGCATGCCGGCAAGGTCGGCATCG
+AGGCGGTCGATCGGGCGATGCGCGGCGAGGGCTCACCGGCTCCGATCTGGGAGGGCGAGGACGGGGTGAT
+CGCCTGGCTGCTGGCCGGACCCGAGCACACCTACCGGGTGCCGTTGCCCGCACCTGGTGAACCCAAGCGC
+GCCATTCTGGACAGCTACACCAAGCAACACTCCGCGGAGTACCAGAGCCAGGCGCCGATCGACCTGGCCT
+GCCGGCTACGTGAGCGTATCGGCGATCTCGACCAGATCGCGTCGATCGTGCTGCACACCAGCCACCACAC
+CCATGTAGTGATCGGAACGGGATCCGGCGATCCGCAGAAGTTCGACCCGGACGCGTCACGCGAAACCCTC
+GACCACTCGCTGCCCTACATCTTCGCCGTGGCACTGCAGGACGGCTGCTGGCACCACGAGCGCTCCTACG
+CGCCCGAGCGGGCGCGCCGTTCCGACACGGTGGCACTGTGGCACAAGATTTCCACCGTCGAGGATCCCGA
+GTGGACCCGCCGCTATCACTGCGCCGATCCGGCCAAAAAGGCGTTCGGGGCGCGCGCGGAGGTGACGCTG
+CACAGCGGTGAAGTGATCGTGGACGAACTGGCGGTGGCCGACGCCCATCCGCTGGGCACCCGGCCGTTCG
+AGCGCAAGCAGTACGTAGAGAAGTTCACCGAGCTCGCCGATGGTGTAGTGGAACCCGTTGAACAGCAACG
+TTTCCTGGCCGTAGTAGAGAGTCTCGCCGATCTCGAGAGCGGTGCCGTGGGTGGGCTGAACGTGTTGGTC
+GATCCGCGGGTGCTGGACAAAGCGCCGGTGATTCCACCAGGAATCTTTCGATGACCGGGCCGCTCGCGGC
+GGCCAGGTCCGTCGCTGCCACGAAATCGATGACCGCGCCCACCGTTGATGAGCGGCCCGACATCAAAAAG
+GGCCTCGCCGGCGTGGTGGTGGACACCACCGCCATCTCCAAGGTGGTGCCGCAGACCAATTCGTTGACCT
+ACCGGGGATATCCGGTCCAGGATCTGGCAGCCCGCTGCAGTTTCGAGCAGGTCGCCTTCCTGCTGTGGCG
+TGGTGAGTTGCCCACCGATGCCGAGCTGGCGTTGTTCAGCCAGCGCGAACGAGCCAGCCGTCGGGTGGAC
+CGCTCGATGCTGTCATTGCTGGCCAAGCTGCCGGACAACTGCCACCCGATGGACGTGGTGCGCACCGCGA
+TCAGCTATCTCGGTGCCGAGGACCCGGACGAGGACGACGCCGCGGCCAACCGGGCCAAGGCGATGCGCAT
+GATGGCGGTGTTGCCGACGATCGTGGCGATCGACATGCGGCGCCGACGCGGGTTGCCCCCGATCGCACCG
+CACAGCGGGCTCGGTTATGCGCAGAACTTCCTGCACATGTGCTTCGGGGAGGTACCCGAAACCGCCGTCG
+TGTCGGCGTTCGAGCAGTCGATGATCCTCTACGCCGAGCACGGATTCAACGCGTCGACGTTCGCCGCCCG
+GGTGGTGACCTCGACCCAATCCGACATCTACAGCGCGGTGACCGGCGCGATCGGCGCCCTCAAGGGGCGG
+CTACACGGCGGCGCCAACGAAGCCGTCATGCACGACATGATCGAGATCGGCGATCCGGCCAACGCGCGGG
+AGTGGTTGCGCGCCAAGCTCGCCCGCAAGGAAAAGATCATGGGCTTCGGGCATCGGGTGTACCGGCACGG
+CGACTCCCGGGTGCCGACCATGAAACGGGCGCTGGAGCGCGTGGGGACCGTTCGCGACGGCCAGCGATGG
+CTGGACATCTACCAGGTGTTAGCGGCCGAGATGGCGTCGGCCACCGGGATCTTGCCCAACCTCGATTTTC
+CGACCGGGCCCGCGTACTACCTGATGGGATTCGACATCGCCAGCTTCACCCCGATCTTCGTGATGAGTAG
+GATCACCGGCTGGACCGCACACATCATGGAACAGGCCACGGCCAACGCGCTGATCCGGCCGCTGAGCGCA
+TATTGCGGGCACGAGCAGCGGGTGTTACCGGGCACCTTCTAGTCTTATGGGCCATGGGATTTCTCCAGCC
+CCGACTTCCCGACATCGACCTGGCCGAATGGAGCCAGGGCTCCCGCAGCCAGAAGATCCGGCCGATGGCC
+CAGCATTGGGCCGAGGTGGGTTTTGGCACTCCGGTGCTGCTGCACCTGTTTTACGTCGCCAAGATCCTGT
+TGTACGTCCTTGTCGGCTGGCTGATCGTGTTGACCACCAAGGGGATTGATGGATTCACCGATGCGGCAGC
+GTGGTACGCCGAGCCGATCGTGTTCGAGAAGGTCGTGCTCTACACCATGCTGTTCGAGGTGATAGGGCTG
+GGCTGCGGCTTTGGGCCGCTGAACAACCGATTCTTCCCGCCGATGGGCTCGATCCTGTACTGGATGAGGT
+TCGGCACCATCCGGCTGCCGCCGTGGCCGGATCGAGTGCCGTGGACCCGCGGCACCAAGCGCAAGCCGGT
+GGACGTTGCCCTCTACGCACTGCTGGTGATGATGTTGCTGTCGGCGCTGTTCACCGATGGCGCCGGCCCC
+ATACCGGAGCTGGGCACCATGGTCGGGCTGCTGCCCGCCTGGCAGATCGTGCTGATCCTGCTGCTTCTCG
+GTGTGCTGGGCCTGCGCGACAAGGTGATCTTCCTGGCCGCCCGCGGCGAGGTCTACGCGACGCTGACGGT
+GACGTTTTTGTTCGGCCGCTTGAACGGTATAGACATGATCGTGGCCGCCAAACTGGTGTTCCTGGTGATC
+TGGATCGGTGCGGCGACATCGAAACTCAACCGGCACTTCCCTTTTGTGATCTCCACGATGATGTCCAACA
+ACCCGCTGTTTCGGCCGCGGTTCATCAAGCGGATGTTTTTCAAGAAGTTCCCCGGCGACCTGCGGCCCGG
+GCTGTTGTCGCGGATTGTCGCCCACGTCAGCACTGTTATCGAGATGTGTGTGCCCGTGGTGTTGTTCGTT
+GCGCACGGCGGCTGGCCGACGGTGGTGGCCGCGACGATCATGGTCTGCTTTCACCTGGGGATTCTGACGG
+CCATCCCGATGGGGGTGCCGCTGGAGTGGAACGTGTTCATGATCTTCGGCGTCCTGTCGCTGTTCGTCGG
+CCACGCCTGCCTCGGGTTAGCGGACGTGAAAAACCCGGTGCCGCTGGCGATCCTGATCGCCGTTGTCGCG
+GGAATCGTCATTGCGGGCAACGTGTTTCCCCGCAAGATCTCGTTTCTAGCCGCCATGCGCTATTACGCCG
+GCAACTGGGATACCACGCTGTGGTGCATCAAGCCCTCCGCGGAGGACAAGATCAACCGGGGCATCGTCGC
+GATCGCCAGCATGCCGGCCGCTCAGCTGGAGCGCTTCTACGGCAAGGACCGAGCCCAGATCCCGATGTAT
+CTGGGATACGCGTTTCGTGCGATGAACTCCCATGGCAGGGCGCTATTTACGCTGGCGCATCGGGCGATGG
+CCGGCCATGACGAAGACGACTACGTCATCACCGACGGCGAACGGGTCTGCAGCACTGCCGTCGGCTGGAA
+CTTCGGCGACGGCCACCTGCACAACGAGCAACTGATCGCGGCGATGCAACAGCGGTGCGGCTTCCAACCC
+GGTGAGGTGCGGGTGGTGCTGCTCGACGCGCAGCCCATCCATCGGCAAACCCAGGAGTACCGGTTGGTAG
+ACGCGGCGACCGGGGAGTTCGAGCGCGGCTATGTCCGGGTGGCCGACATGGTGAACCGGCAGCCCTGGGA
+CGACGACGTGCCGGTCCACGTGCTGCCGGGCTAGCTGCTCGTCAGCTAGCCCGCGCGCACCTCCCGGGCG
+GCGGCGACCATGTTGTGCAGCGACGCGGTCACCTCGTCGACATTGCGGGTCTTCAGTCCGCAGTCGGGGT
+TGACCCACAGCCGCTCGGCCGGCACCGCGCGCAACGCGGCCCGCAACGAGTCGGCCATCTCCTCAGCGGA
+GGGCACCCGTGGCGAGTGAATGTCATAGACGCCCGGGCCCACACCGTTGGCGAAGCCGATCGCGTTCAGG
+TCGTCGAGCACCTCCATGTGTGACCGGGCCGCCTCGATGGACGTGACGTCCGCGTCCAGATCGGCGATCG
+CGCCGATCACCTCGCCGAACTCCGAGTAGCACAGATGCGTGTGGATCTGGGTGGCGTCCGAGACGCCGGA
+GGTGGCCAACCGGAAAGCCCCTACCGCCCAACGCAAGTACTCGGCCTGGTCGGCGCGACGCAGCGGCAGC
+AGTTCACGCAGCGCAGGCTCGTCGACCTGGATGACCGCGATGCCGGCGGACTGCAAATCCACGGTCTCGT
+CGCGAATCGCCAGCGCCACCTGGTTGGCGGTATCGGCCAACGGCTGGTCGTCACGCACGAACGACCACGC
+CAGAATCGTCACCGGCCCGGTCAACATGCCCTTCACCGGTTTGTCGGTCAGCGACTGCGCGTAGGTGATC
+CACTCGACCGTCATCGCCCGCGGCCGGGACACGTCGCCGTACAGGATCGGCGGACGCACACAGCGGCTGC
+CGTAGGACTGCACCCAGCCGTTCTGGGTAGCGAAGAAACCCGCCAATTGCTCGGCGAAGTACTGCACCAT
+GTCGTTGCGCTCCGGTTCGCCGTGCACCAGCACGTCGAGCCCGAGCCGCTCCTGTAGCGCGATCACCTCG
+GTGATCTCTTGCCGCATCCGGCGCACGTACTCGGCCTCGTCGATCTCACCGGCCCGCAGCGCCGCACGCG
+CAACGCGGATCGCCGAGGTCTGCGGGTAGGAGCCGATCGTCGTGGTCGGCAGCGGCGGCAGGTGCAGTCG
+CGCGTCTTGGCTGGCGCGGCGCTGGGCGGCATTGCCGCGGTGGGCTCCGGACGCGACGATCGCCTCGATG
+CGCGCCCGGATTTGCCCATTGTGTAACCGCGGGTCGCGCTTGCGGGACGCGATGGCGGCGCGGGACGACG
+CGATCTCGTCGGCGACCGCGTCGTGTCCGTCGCGCAGGGCACGCGCGAGAACGACGACTTCGCGCACCTT
+TTCGGCACCGAACGCCAGCCAGCTCCGCAACGCGTCATCCAGGTCGGTTTCCGGTTCCAGCGAGTACGGC
+ACGTGCAGTGTCGAGCACGACGTCGAGACGGCCACGGTAGCCGCCGAACCCAGCAGGGTCGCCAACGTGC
+CCAACGCCGCCTCCAGGTCGGTGCGCCAGACGTTGCGCCCGTCGACGACCCCGGCCACCAGCGTCTTGCC
+GGCCAGCTCGGGTACCCCGGCCACCGAGGTGTCGGCACCGGCCACTAGGTCGACGCCGATGGCTTCGACC
+GGGGTGCGAGCCAGCGCCGGTAGGGCCGCGCCCGGGTCCCCGAAGTAGGTGGCGACATAGATCGCAGGCC
+GGTTGCTCACCGAGCACAGCGCGGTGTACACCGCTTCAGCCAGGGCGGGCGCGTCGGGGGAGAGGTCGGT
+CACCAGCGCCGGCTCGTCGAACTGCACCCACTGGGCGCCGCCGTCGGCAAGCAGCGACAGCAGCTCCGAA
+TAGACCGGAACCAACTCTTCGAGGCGTTCGATCGGCGCCCCCGCGCCGTCGACGGCCTTGCTCAGCAGCA
+GGAAGGTGATCGGCCCGATGATCACCGGACGTGCGGGAATGCCTTGCCCTAACGCCTCTTTGAGTTCGGC
+GAGCACCTTGCCGGGGTGCAGCGTGAACGTGGTCGACGGCCCGATCTCGGGTACCAGGTAGTGGTAGTTG
+GTGTCGAACCACTTCGTCATCTCCAGCGGCGCGATCTGGTCGGTGCCCCGCGCCGCGGCGAAATAGCGGT
+CCAGCCCGTCGGAAACCGGGCTCACTCGGGGCGGCAGCGCGCCGAGCAGCACCGCGGTATCGAGCATTTG
+GTCGTAGTAGGAGAAGGTGTTCACCGGCACCGAGTCCAGACCGGCCGCGGCCAGGGCCGACCAGGTGTCG
+CGGCGTAACGTGGCGGCGACGGCCTCCAGCTCGGATCGGCTGGTACGTCCGGCCCAGTAGCCTTCGGTGG
+CGCGCTTGAGTTCGCGGCGCGGGCCGATGCGCGGGGAGCCGGTGATGGTTGCGGTAAAGGGTTGACGACG
+TACAGGCTGGGTCACGTGCTGTCCTTCGATCGACGGGTGGTTCACCGCCCGCGGACGCGCAGCCGATCCG
+ATTGAGGTGCACACCGATGCACCCGGCAACAGGCACGGCCAAACGCCCATTCCACGAGGCGATGAGCCGC
+CGGGCGCGGCGCGTCCGGCACGGCTGGCAGGTCTTCGGACTCGCAGGCTCGCACCCGGTGGGTGCTCCTA
+CTGGCCGTCGCTTCCCAGTCGTTGAGACCAGTGCTTGTCTACTTCCAAGACGGCGGTCGTTCCTGCATAC
+CGCTGCGGGACAGTCCCGGATTCTCACCAGGTTCCCTCTCGCGAAGCATCGTTGCCCCGCTCGATGCCGA
+CGCCCTTTCGGACGCCAGCAGACCAGCTGCGTGGTCAAGGCTACTCCGGTGACATCGGCCGGCATGGCCC
+GGCCGGCGGCAAAATCGCTCGGCGCCGGATGTCCTCATCGGGCCCGCCGCGATCGTCATGTGGGTGAGAT
+TCGGGATAGGCCCGGACCATGATGGGTCAACAGGCCGCAATACGCCGCACTCACCTGCACCAGAGACGTC
+GACTGGTCGGCCCCCGAGCAGGCCGCTGACATGGCCGCCTACCAGAAGTTCGGGCAGGAGCACGCCGCCG
+CGATCCGTGGCGGCGCCGTGCTGCACCCGACGGCCACCGCCACGACGGTCCGGGTAACCGGCGCCCGCGG
+CGGCGACGTCGTCACCGGCGACGGTCCGTACGAGGCGGCCGACCTGGACGAGCAAGGGCCATTCCCGATG
+GAGACGGTCTACCTGTGGGAGGACGGCCCGAACGGTACGACGAGGATGACGCTGTAAAACCGTGGTGAGC
+CTTCCCGCTTCGCGGGAATCGCCGCACCCGCCATGACGGTGGCGGTCAGGCGGGCCAACGCGAAGGATCT
+CGCGCGGCGCAGGCTGCTGGAATCCGGGGGCTAACCGTCGAAGAACCCGGACTGGTCATTACCGGCGTTG
+AACCCGCCTGAGCTGTTGTCGCCGGAGTTGGCCACCCCGGAGGTGGTGGTGAAGGCGGCGTTGGTGGCCG
+AGTTTCCGATGCCGGTGTTGTTGAAGCCGGTGTTGAACAGGCCCGTGTTAAAGCCGGTTCCCGAGTTGCT
+GATGCCCACGTGCTGGCCGCCGCCGGAATTGAGCAGACCCGAGTGACCGATGAAGAAGGCGCCGGTGTTG
+GTGTTCTGGAAGCCGGAGTTCGCGTCGCCGGAGTTATTGAAGCCCGAGTTGCCGGTGCCGATGTTGCCGA
+AGCCGGAGTTCATCACCGGTTGGTCCACCGGGCTGCCGAACCCGGTGTTCAGGTCTCCGGAGTGGAAGCC
+GCCAGTGTTGATATCGCCCGAGTTGGCCCAGCCGGTATTGAAGTCGCCCGAGTTCAAGTCTCCGGTATTC
+AAGGTGCCCGAGTTGAAGCTGCCCGTGTTGTAGGCACCCGAGTTGCCGACACCCATGTTCTCAAATCCCG
+AGTTGCCGAACCCGAAGTTGTTGTTGCCTGCGTTCCCGAAACCGAAGTTGCCGCTGCCCGCGTTCCCGAA
+GCCGGTGTTGGTGAAGCCCGCGTTCCCGAAACCGGTGTTGGTGTCACCGGAGTTGAAGAAGCCGAAGTTG
+CTGTCGCCGGAGTTGAAGAAGCCGATGTTGTTGTTGCCGGAGTTGAACAAGCCGATGTTGTTGTTCCCGG
+AGTTGCCGAAGCCGAGGTTGCCGATGCCGGAGTTCAGTGCGCCGATGCCGATCATGTTGTCGCCGGTGAG
+CCCGATACCGATGTTGTTGTTGCCGAGATTCGCAATGCCCAGGTTGTTGTTGCCGAGATTCGCAATGCCC
+AGGTTGTTGTTGCCGAGATTCGCAAAGCCCACGTTGGGAGAGCCGTGATTTGCGCTGCCCACGTTGAAGG
+AACCGGCGTTGGCGGTGCCGAAGTTGAAGCTGCCGACGTTCCCGCTGCCCCGGTTGCCATCGCCGATATT
+CCCCAGGCCGAAGTTACCGTTGCCGTCGTTGCCGCTGCCCAGGTTGAGGTTGCCGAGGTTCCCGCTACCG
+AAGTTGGTGTTGGCGGTGTTGCCGCTGCCAAAGTTGAAGAAACCGGTATTGCCGCTGCCCAGGTTGGCCT
+GGCCCGTGTTTCCGCTGCCTAGGTTTGCGTTGCCGGTATTGCCGTTGCCTAGGTTGTAGTCGCCGATGTT
+GCCGATGCTGAAGATGTTGCCGATGCCGGTGTTGCCGATACCCAATGCCGGGATGGCCAGGGCAGCGGGG
+CCGGAGGCCAGTGCGGGCGCCGTCGGGTTGGGCAGGGCGCGCACCGCCTGTGCCCACGGGGCCAGCTGGG
+CGGCCACCGCCGAGGCCCCGCTGTGGTAGCTCACCATGGCCGCGACATCGGCGGCCCACAATTGTTCGTA
+GGCTGCCTCGGTCGCCGCGATCGCCGGGGCGTTTTGGCCGAACAGGTTTGATAGCACCAGCGACACCAGC
+TGGTGGCGGTTGGCGGCGACCAGCAGTGGATCCACGGTGGCCGCCCGCGCGGCTTCATACACCGCCGCGG
+CCGCCTTGGCCTGTGCGGCCGCGCTTAGCGCGCGTGTTGCTGCCGTGCTTAGCCAGCTGGCATAGGGGGC
+TGCCGCGGCGGCCATCGCCGTCGCCGCCGGACCTTGCCAGGCGGTGTCGGCCAGCGCTGCGGTGGCCGAC
+GAAAACGAGTTCGCCGCTTGGCCTAACTCGGCGGCCAGCCCGTCCCAGGCCGCCGCGGCGGCCAGCGTCG
+GGCCTGAGCCCGCACCGGCAAACATCAACGCGGAATTGACCTCGGGAGGCAACACCAGAAAACTCATCAC
+GCCATCCCTTCCGCAGCTGGACGTGCCCGGGCCATCCCCTCCCGTGACCACAAACCTCCGCTGGCTGAAT
+ACGCACAGCCCGATCCTCCCGGCGCGAAGCAGCGCCGCGGTCCCGCCTGCTTGACCCCAGATTCCATGGC
+GCGCCTCCCACCACCAACACTGGGCCGATCGCTCGACACCTCATGCAGCTTGGCAATCAAAACACTATGA
+GATTCGCAGGGCGGCCTCAGCGTTTTCGCCAAAGCGCTTACCCCCTGTTCAACCCCAACAGCGCGATCGC
+GCTTGGCCACCCATTCGGCGGCTCGGGGGCACGGTTGATGACTACAGTGCTACACCACATGCCGGACAAG
+GGAATTCGCTACGGCTTACAGACGATGTGCGAGGGCCGCGGCCAAGCCAATGCCACCATTGTGGAGTTGC
+TGTGACAGCGACCGATAGCCAGCCGGCGGCGTTGTCGAGTACCGCGACAATGTCATGGTCATTACGATCA
+ATCGGCCGGAAGCCCGCAATGCGGTCAATGGTGCCGTCAGCATCGTGGTTGGAGACGCGCTGGAAGAAGC
+GCACGACAACCCCGATGTGCGGGCCGTGGTGATCACCGGCGCCGGCGACAAGTCGCTTTGCGCCGGTGCC
+GACCTCAAGGCGATCGCACGCCGGGAGAACCCGTACCACCCGCATCACGGCGAGTGGGGCATCGCCGGTT
+ACAGGCACCATTTCATCGACAAGCCGACCAGCGCCGCGGTCAGTGGCACGGCCTTGGACGACGGTGCCGA
+GCCAGCGCTGGCCAGCGACCTGGTGGTGGCCGACGAGCACACCTAATTCGGGTTTGCCGGAGGTCAAACG
+CGGGCTGATCGCCGCCGCCGGGGGTGTACCGGTGAGCCGCTGACCGCATCCGACGACTGGGAGTGGGGCC
+TGATCAACCGGGTCGTCAAGGAGGGTTCGGTCGTCGAGGCCGCCCTCACCTGGCCGTGCGGGTGACCGTC
+AACGCGTCGCTGTCGGTGCAGGCCAGCAAGCGGATCGCCTGTGGTGTCGATGACGGGGTCGTCGTCGACG
+AAGGGACTCCGCACCCAGCGCGAGATGGGTTCCCTGATGAGATCGCAGGACCTCGGGCGTTCGCCGAGAA
+ACAGGAACCGGTGTGGCGGGCCCGCTGCATCGTCTCGGCGCCTTGGATGGGCTTGGCGGGCGTACCGTCA
+GCCAGCACTGTCGCATTGCCAACGTTTGTGGGACTTATCCCGATGCCGGGGCGCAGTGTCGCGCTGAGGT
+GGGCACAACGAGCATCCTTCCCGGGAGAACCAATGTGGCGGATGTGACAACGCGCCGACAACACCAGATC
+CTGGGCTGTCTCAGTACGCCAGGATGTTCACCCCGTACCGGAATGCCGTGGGCAGAAGTGCGCACAGCGG
+CACGATGGCACGGCGTGCCGCGCGTGGCGTACTGGCCAGCACCAACCCGCGGGTGACTAGCCGGTAATCA
+CGAGTGATCCGGTGCCACGCGGCCTCATACGACGCCGGTGTGTCGTCGACGATGGCGCTCACCGCCGCGG
+CGGCCTGCTTGACGGCAAGGCTGATGCCTTCGCCGGTTAGGGCATCTTCGTACCCGGCCGCGTCACCGAC
+CAAAAGCACCCGCCCCGCGACGCGCCGGGAGACCACCTGGCGCAAGGGACCGCAGCCACGTGCGTGTCCG
+CGGCTCGCGTCTTGCAGATGGTGTGCAAGGCTGGGAAACCAGGCAAGTTCGGGTCGTTGGCGGGACAAGA
+TCGCGACGCCGACCAGATCCGGTTCCACCGGAGTCACATAAGCCTCACCCCAACGGGACCAATGCACTTC
+GACGAAGTCCGACCACACCGGCAGCCGGTAATGCCAGCGCACCCCGTATCGCCGTGGTGTCCCGGCGGTG
+GCTTTGATCCCGACGGCGCGCCGGACGGCCGAATGCAGTCCATCGGCTGCCACCAACCATTTCGCGCGAA
+CGCCGGCGGCGGTCACACCATGTGCGTCTTGCTGAATAGTGGCTACCCGCGACCGGATCCATTCAGTGTC
+TTGCTCTTTGGCTCGTGCCGCCAGTGCCGCATGCAGCGTGGTGCGTCGCACGCCCCGCCCCGGCCCGGTG
+CGAAACCGCGCCTGCACCCGACGATGTTCACCAACGTAGGCAATCCCATGAAAGGGCAGACCGACCGGGT
+CCACGCCTAGCGAGGTCAATTCGGCCAGGCCACCGGGCATCAGCCCCTCGCCGCACGCCTTGTCGATGGG
+ATTCTCGCGAGGCTCGGCCACGATCACCGAAAGTCCACGCGCGCGTGCGTGCAATGCCGTGGCGAGTCCG
+CCGGGGCCGCCGCCGACGACCAACAGGTCGGTGTCGTAGCTGGTCATATGTAGCCCAGAACGGAGTTCTC
+CACCCGCAGACGAACGGTCAGCAAGGTCGCATTGGCCAGGGTGAAAACCAGTGCGGTCAACCACGCCGTG
+TGCACCAGTGGCAACGCGAACCCTTCGGCCACCACCGCAACATAATTCGGATGCCGCATCCACCGGTAGG
+GGCCCCGCCGCACCAACGTGGCGTGCGGCAACACGATTACCCGGGTGTTCCACCGCTTGCCCAGCGATTT
+GACGCACCACCAGCGCAGGCCCTGGCTTGCCACCACTACGGCCAGCATCGGCCAGCCGAGCCACGGTATG
+AAAGGCCGGTGCAAGGCCCACGGTTCGACGACGCAGCCCAGCAGTAGGGCGGTGTGCAGGATAACCATCA
+CCACATAGTGTGGGCGGCCAAACTCTTTGCCGCCCTGCGCGAAAGACCACCGCGCGTTACGCTGGGCCAC
+CACCAGCTCCGCCAGCCGTTCGAAGACGACCGCCAGGATCAGCAGGTAGTACACGGCCCTACCACCTAAG
+AAGCACCGACTCGGAGGAAAAACCCGGGCCTATGCACACTATCCTGGCGGGACCGGCGATGCAGCCCAGC
+CCGAACGGTGGAATAGCTCCCCCTGCGATCGACTCCATATTGTCAGCCACGTTACTGGCGCCGGATGGGT
+TCAGATTCTGGCGAGTGGGACCGCCATTGCCGGGCCGTTCCACGGCCCGTATCGTCGCCGCGCTGTGCTG
+GATTGCGCGGCTTCTCCTCGGGCCGTTCCACGGCCCGTATCGTCGCCGCGCTAGGTTGGACGCTGTGCGG
+ATCGTGGTGAGCAGTGCCACCAGAAATGCGGGTTCGTACACCTGTGTCAGCACCGGCAGCGCTGGATGCC
+GCGAGATTACACCGCCCCTCGCTGGGCCCACGCCTGGGCCGGTGAACCCCGGCCCGCCCGCTGGCACCCT
+GCGAACCAGCCTGCACATCCTGACCACTCCAACCGCGAAAGTCCGGCCTGCATGAGCCAATCCACCACTC
+CATACCGCAGCAGCGTGCTTGCCGAGTTTCGTCGTGCGATCACCAATGTCGCTGTGCCCCATCATGAACC
+GCCGGGAATCGTGCGCCGCCGCCGTGTGGTCGTCGGCGTCACGTTGGTTATCGGCGCTGTGATGCTGGGC
+TTTTCGCTGAGGCGGACGCCCGGCGAGTCGAGCTTTTACTGGCTGACGCTCGCGCTGGCAGCCGTGTGGA
+TCGCCGGCGCACTGATGTCTGGACCGCTGCATCTGGGTGGCATCTGTTGGCGCGGTCGCAATCAGCGTCC
+GGTCATCACCGGGACCACTGTCGGGCTGCTGCTAGCAGGCATCTTCGGGGTGGGTGCAATGATCGTCAGG
+GCAATTCCTGGCGCAGCTGAACCGATAGCCCGCGTCCTGCAATTCGCCCATCAGGGAACTCTGCTGCCGA
+TCCTGCTGATCACCTTGATTAACGGCATCGCCGAGGAGATGTTCTTTCGCGGTGCGCTCTACACCGCGCT
+GGGACGACGCTATCCGGTGACCATCTCAACCGTCCTGTACGTCGGCGCCACCATGGCCAGCGCGAATCTG
+ATGCTCGGCTTCGCAGCGATCTTCGTCGGTACGGTGTGTGCGTTGGAGCGCCGGGCCAGCGGTGGAGTGC
+TGGCACCGATCTTGACCCACTTCGTGTGGGGCCTGATCATGGTGTTCGCGCTGCCCCCGCTGTTCGCGGT
+CTGACGCGCGTTCAGGAACCGGTGAAGTTGGGGGTGCGGCGTTGCAGGAACGCCGCTGCGCCCTCGGCGA
+AGTCGTGTGTTCGCAGCAGGACTTCCTGTCCATCCAATTCGCGCGCGAACGTGGGTTCCAATTCGGTGAG
+GGCGGCTGCATTGATGGCGTTTTTGGCCTGGGCGAACGCCAGCGCCGGGCCGGCCAGCAACCGTGAAATC
+ACCTTGTCCACCTCGGCCTCGAAGTCGCTGTCCGGATATACCGCGCTGATCAGGCCCCAGGCCAGTGCCT
+CGCGGGCCGGCAGTTGCTCGGCCAGCAGCGCCAGCCGCATCGCCCGGATCCGGCCGGTGGCCGCGGCGAC
+TAACGCCGATGCGCCGCCGTCGGGCATCAACGCTACCTTGGTGTTGGCGAGCATGAAAAATGCACTATCA
+GAAGCCAATATGAAGTCACACGCCAGCGCTAGCGAGACAGCGACGCCGACCGCTGGTCCTTGAACGACAG
+CTACAACCGGGTGCGGTAGCGCGGCCACGGCGCGTACTGCGCGGTTGGCCTCTTCGACGATGGCGGTCGG
+CGGCCCTCCGCCCCACACATCGTCCACAGACATAGACACTCCGGAGCTGAAACCGCGGCCCACCCCGCCT
+AGGCGCACCACCTTGACCACGGGATCGGCCGCCGCGCGCTCCAGCGTGTCGGCGATCCCCGTCAGGATTG
+GCACGGTCAGCGAGTTGAGACTGCTAGGGCGGTTGATGCGCACCGACAACACTCTGTCGGTCAGGGTGAC
+GTTGAGGCCTGTGACCGGCGTTAATGCGGCAATCCCGGAATCTGGCATGTGCAGCATCCTAAATGAGGGC
+CAGCTACACAGAGTGGTTAATGATGCTCCGCAAACATGCCCAACCAGCAGTTGGAGTAATCGGTGAGTAC
+ACGGGCATCGACGCGGCCCAGTCGCGGGACCGCTAGCGGGCCGAGAGCGCTCAACGGCCGGTGAACATGG
+GGGTCCGGCGCTGCTGGAATGCCGTTGCGCCCTCGGCGAAGTCGTCAGTACGCAGGAGGAGGGCCTGGCC
+ATCCAATTCGCGCAGGAGAGTGGGTGCCAACTCGGTGAGCGTGGCCGCATTGATCGCGTTCTTCGTCTTG
+GCGATAGCCAGCGCTGGGCCGGCCAACAGCCGTGAGATCAACTTGTCCACCTCGGCATCGAAGTCGGCGG
+CCGGATAGACGGCGCTGACCAGGCCCCAGGACAAGGCCTCGGCGGCCGGCACCCGGTCCGGCAGCAGCGC
+CATATGCATGGCGCGGATGCGGCCGATCGCGGCCTGAACCAACGCCGACGCGCCGCCGTCGGGCATCAAC
+CCCACGTTGGTGTGAGCGAGCATGAAAAACGCATTGTCGGAGGCCAATACGAGGTCACAAGCGAGCGCCA
+GGGAGACGCCACAGCCGACGGTTGGTCCCTGCACGACGGCAACGACCGGTTGTGGTAGTGCCACAATGGC
+ACGCACCGTGCGGTTGGCCTCCGCGACGGTGTCGGTAGGCGGGCCACTGGCCCACACATCGTCAACGCTG
+ATTGCCCCTCCGGAGCTGAAGCCGCGACCGGCGCCCCCGAGGCGCACCACCTTCACCCGTGGGTCGGTGG
+CCGCGCCCTCGATCGCGTCGGCCATCCCTGCCAGCACCGGCTTGGTCAGCGAGTTGAGACTCTCCGGGCG
+ATCGATGGTCACCGACAGCACCCCGTCGGCCAGGGTGACGGCGAGACCCGGGACAATTGTCCGAGTGTCG
+ATCCGGTAGTTCGACATGTGGTTAACACTAATCGACGACGCCGTCACCGAGCTGCGGCGACATGATCTTC
+GTCGATACGCCGTCGAGGGCGTCAATGGGAGACGAAAGGCCGGTACATTCATGGCGGGTCCGCTGAGCGG
+GTTGCGAGTTGTCGAGCTGGCGGGCATCGGGCCGGGCCCGCACGCAGCGATGATCCTGGGGGACCTCGGT
+GCCGACGTGGTGCGCATCGATCGCCCGTCAAGTGTCGACGGTATTTCGAGAGACGCCATGTTGCGTAACC
+GGCGTATCGTGACCGCCGACCTGAAGTCCGATCAGGGACTCGAGCTTGCGCTCAAACTCATCGCCAAGGC
+CGACGTGTTGATCGAGGGTTACCGTCCCGGCGTCACCGAACGGCTGGGATTGGGTCCGGAAGAATGTGCG
+AAGGTCAACGACCGGCTGATCTACGCGCGGATGACCGGCTGGGGCCAAACCGGCCCGCGTAGTCAGCAGG
+CCGGTCACGACATCAACTACATCTCGCTGAACGGCATTTTGCACGCCATTGGCCGGGGCGACGAGCGACC
+GGTGCCGCCGCTGAACCTGGTTGGTGACTTCGGCGGCGGCTCGATGTTCCTGCTGGTCGGCATCCTGGCC
+GCGCTATGGGAGCGGCAGAGCTCCGGCAAGGGCCAGGTCGTCGATGCGGCGATGGTCGACGGGTCCAGCG
+TGCTGATTCAGATGATGTGGGCGATGCGAGCGACGGGCATGTGGACCGACACAAGAGGGGCCAACATGCT
+CGACGGCGGGGCACCCTACTACGACACCTACGAATGCGCCGACGGCCGCTACGTCGCTGTCGGCGCCATT
+GAGCCGCAGTTCTATGCGGCCATGCTGGCCGGATTGGGTCTAGACGCCGCCGAGCTGCCCCCGCAAAACG
+ACCGCGCCCGTTGGCCCGAACTGCGGGCGCTGCTGACCGAAGCGTTCGCGAGCCACGACCGTGACCATTG
+GGGCGCGGTGTTCGCCAATTCCGATGCCTGTGTGACGCCGGTGCTGGCGTTCGGTGAGGTGCACAACGAG
+CCGCACATCATCGAGCGAAACACCTTTTATGAAGCCAACGGCGGATGGCAACCCATGCCGGCTCCGCGGT
+TCTCCCGCACCGCTTCGAGCCAGCCACGCCCGCCGGCCGCCACGATCGACATCGAGGCAGTGCTCACCGA
+CTGGGACGGATAGGAAGGATTCGTATGAAGACCAAAGACGCCGTAGCCGTTGTCACCGGTGGCGCCTCAG
+GCCTGGGTCTGGCCACCACCAAGCGGCTATTGGACGCTGGGGCACAGGTGGTCGTCGTGGACCTCCGCGG
+CGACGACGTGGTTGGCGGGCTCGGCGATCGCGCGCGTTTTGCGCAAGCCGACGTCACCGACGAAGCCGCC
+GTCAGCAACGCGCTAGAGCTGGCGGATTCGCTCGGCCCGGTGCGGGTCGTCGTCAACTGCGCCGGCACCG
+GCAACGCGATTCGCGTACTGAGTCGCGACGGCGTGTTCCCGCTGGCCGCGTTCCGCAAGATCGTGGACAT
+CAACCTAGTCGGCACCTTCAACGTGCTGCGACTGGGCGCCGAGCGGATCGCCAAGACCGAACCGATTGGG
+GAAGAGCGCGGCGTCATCATTAACACCGCCTCGGTGGCGGCATTCGACGGTCAGATCGGCCAGGCCGCCT
+ACTCGGCGTCCAAGGGCGGCGTAGTTGGCATGACCCTGCCGATCGCCCGCGATCTGGCCAGCAAGCTGAT
+CCGGGTGGTCACCATTGCGCCGGGTCTGTTCGACACCCCGCTGCTGGCTTCATTGCCGGCGGAGGCCAAG
+GCCTCACTGGGCCAACAGGTGCCGCATCCCTCGCGGCTGGGCAACCCCGACGAGTACGGGGCGCTAGTTC
+TGCACATCATCGAAAACCCGATGCTTAACGGCGAGGTCATCCGTCTGGACGGCGCCATCCGCATGGCGCC
+GCGCTAAGCCGCACCAAAAGAAAGACCCCCGCGTTGCGGGGGACCGGAATCGGGAACAAGAACTTACCGA
+CGAAACCATCGGCTGACGGCTGGTTCGGCCATGAGGAGCCGTGCAAGCATGCCCATGGTGTCGCTCAGCT
+CGCGGTGGGCAGCGGGTGCAAGTCTTCGAGCTGCTCGGAGGTGTCGCCCTCTACCAGCATGTCGCCGTGG
+TAGAGAGCCTCGAAGTCAGCCTTGATGACGTCGGCACTCGAGTCGTCGATCCACATGACAGCGAGCCTAA
+AAGCCGCCATTAAGGAATTAGTGAGTCACGATTCGGAAAACAGTGGCAATTCCTACCGGTCGGTAGGGTG
+CTGCGCCGGCATGGTGGCCGGCATCGCGGGCATGCGGCAGGTGAACCACTCGAGCGCCCGCATCCGTATC
+TATGGCAGGCGTTGTTTGACAGTTGTAACTTATCGCAGATAAGTCATCGCGGATTTGGTGCGGGTCCGCG
+CGACCAGCACCGGCTGCGGAGGAAACGCAACATGCTGCAGAGGATCGCTCGGCTCGCCATCGCTGCGCCG
+CGCCGAATCATCGGGTTTGCGGTCTTCGTCTTCATCGCCGCAGCGGTCTTCGGTGTTCCGGTGGCTGACA
+GCCTGTCGCCCGGGGGTTTCCAAGATCCGCGATCGGAGTCGGCACGGGCAATCGAGGTGTTGACCGACAA
+GTTCGGCCAGAGCGGTCAGAAAATGCTGATCGTGGTTACGGCAGCCGCGGGCGCCGACAGCCCACCTGCC
+CGCGAGGTCGGGACTGACATCGTCGAGGTGCTGCGGCGGTCGCCGTTGGTTTACAACGTGACCTCGCCGT
+GGACTGTGCCACCGACTGCCGCCGCCGACCTGCTCAGCACCGACGGAAAATCGGGGTTGATCGTCGTCAA
+CGTCAAAGGCGGCGAAAACGACGCGCAGAACCACGCCCAAACCCTGTCAGACGAAGTCGCCCATGACCGC
+GACGGCGTCACCGTCCGTGCCGGCGGCTCGGCGATGGAGTACGCCCAGATCAATCGGCAGAACAAAGACG
+ACCTGCTGGTGATGGAGTTGATCGCGATTCCGCTGAGCTTCCTGGTGCTGATCTGGGTGTTCGGTGGGCT
+GTTGGCCGCCGGGCTGCCGATGGCCCAGGCCGTACTGGCCGTTGTGGGATCGATGGCCGTATTGCGACTC
+GTTACGTTTGCCACCGAGGTGTCGACCTTCGCGCTCAACCTGAGTACAGCGTTGGGCCTCGCGTTGGCTA
+TCGACTACACGCTGCTCATCGTCAGTCGCTATCGCGACGAGCTCGCCGAGGGCAGTGATCGAGACGAAGC
+ACTGATCCGGACCATGGCGACTTCGGGGCGCACGGTGTTGTTTTCGGCGGTCACCGTGGCGCTGTCGATG
+TCGGCGACTGCGCTGTTCCCGATGTACTTTCTGAAGTCGTTCGCCTACGCCGGCGTGGCTACCGTGGCAT
+TCGTCGCGACCGCGTCGATCGTGATCACCCCGGCCGCGATTGTGTTGCTAGGTCCTCGGCTAGATGCGTT
+GGACGTGCGCCGACTGGTGCGTCGGCTGCTGGGCCGGCCCGATCCGGTGCACAAACCGGTCAAGCAACTG
+TTCTGGTACCGGTCGAGCAAGTTCGTGATGCGCCGTTGGCTGCCGGTCGGTACGGCTGTTGTCGCGCTGC
+TGGTGCTGCTCGGGCTGCCGTTCTTGTCGGTGAAGTGGGGTTTCCCGGACGACCGGGTGTTGCCGCGGTC
+GGCGTCGGCCCGTCAAGTCGGCGATATCTTGCGCGATGACTTTGGCCACGATCCTGCGACGCAGATACCC
+ATCGTCGTCCCGGACGCTCGTGGTCTCGGCCCGGTCGAACTTGACAGCTACGCAGCCGAGTTGTCCCGGG
+TGCCCGACGTATCCGCGGTAGCCGCCCCGACGGGCACGTTCGTAGACGGCAGCTGGGTGGGAACGCCGCG
+CGGGGCCACCGGGTTGGCTGAGGGCAGCGCGTTCCTGACGGTGAGCAGCACGGCGCCGCTGTTTTCGCGA
+GCCTCCGATATCCAGCTCAAGCGGTTGCACCAGGTGGCAGGGCCGGCCGGTCGATCCGTCGTGATGGCCG
+GTGTCGCGCAGGTCAACCGCGACAGTGTCGACGCGGTGACCGATCGGCTTCCGATGGTGCTAGGGCTAAT
+TGCCGCGATCACCTACGTACTGTTGTTCCTGCTCACCGGCAGCGTGGTGCTGCCGGCGAAAGCGTTGGTT
+TGTAATGTGTTATCGCTGACCGCGGCGTTTGGCGCGTTGGTGTGGATCTTCCAGGAAGGCCATTTCGGTG
+CCCTGGGAACGACTCCGAGCGGGACGTTGGTGGCGAATATGCCGGTCCTACTGTTTTGCATCGCATTCGG
+TTTGTCCATGGACTACGAGGTGTTTCTGGTCTCCAGGATTCGGGAGTACTGGTTGGAATCCGGAGCCGCG
+CGACCCGCGCGAAGAAGCGTCGCAGAGGTGCACGCCGCCAACGACGAGAGCGTCGCGCTCGGCGTGGCCC
+GCACCGGTCGGGTGATCACCGCGGCAGCGTTGGTGATGTCCATGTCGTTCGCCGCGTTGATCGCTGCGCA
+CGTGTCGTTCATGCGGATGTTCGGCCTCGGCCTGACTTTAGCCGTGGCTGCAGACGCCACACTGGTGCGG
+ATGGTCGTGGTCCCAGCATTCATGCATGTGACGGGCCGCTGGAATTGGTGGGCACCGAGACCCCTGGCGT
+GGCTGCATGAGCGGTTCGGTGTCAGCGAGGCAGCAGAGCCGGTTTCGAGGAGACGTTCCCACGCCGGTGG
+GTTGGGCAAGATTGCCGGACGAAGCGACGGTCAGACGATCCCTGCCTCGCTGACGCGCAATGGTTGACGT
+CTCGATGAATGGTCTTCGCCGGCAACGTGCCCGGCGGGGCCCCAACGCCACATTACGGCAGCTGGCGGAC
+TGGGTGCAGGCACGTCGCCCATCGGAGAAACGACGAGGACCATCGGAGGAATCCTGGCCATGACGTCAGG
+CGCGGCCGCTTCGGCGTCCAGGGTCGACCACCCGCTTTTCGCCCGGATCTGGCCCGTGGTCGCCGCACAC
+GAAGCCGAAGCAATACGAGCCCTCCGCCGGGAGAATCTGGCCGGTTTGTCGGGGCGGGTGTTGGAAGTCG
+GGGCCGGCGTCGGGACGAACTTTGCCTACTACCCGGTGGCCGTCGAACAGGTCATCGCCATGGAGCCCGA
+GCCGCGGCTTGCTGCCAAGGCCCGCATCGCGGCCGCTGACGCACCCGTTCCGATAGTCGTGACGGACAAG
+ACGGTCGAGGAGTTCCGCGACACCGAGACGTTTGACGCGGTGGTTTGCTCGCTGGTGCTGTGCTCGGTGA
+GCGACCCGGGCGCGGTGCTGGCGCACCTGCGTTCGCTACTACGGCGAGGCGGGGAGCTGCGCTATCTCGA
+GCATGTGGCCAGCGCCGGCGCTCGGGGCCGGGTGCAGCGGTTCGTCGACGCGACATTTTGGCCCAGGCTG
+GCGGGCAACTGTCACACGCATCGCCATACCGAACGCGCGATCCTCGACGCCGGATTCGTGGTGGACAGCT
+CCCGGCGGGAGTGGGCATTTCCCGCCTGGGTGCCGCTACCGGTGTCAGAGTTGGCTCTGGGCCGCGCGCA
+CCGGACCTAGCTATAGCTAGTACTGCAGCCGTAGATAGGGATTGCTGATGCTGGCGTGTCTGCGCTGGTC
+AGGGCGGTGACCGCGGCATTGTTTTCAGTTTGTGACAACTTCTCAATATGCCGCGGTCGCCGCGGCTCAT
+AGCGTAGACCCTGATCGGTGGCAGGCGGAGTTCTCGGCGGTGCTGGATCGGATCGCGCCGCGTTTCGCCC
+GGCACCAGCCGTTGCGCCATGCCGGTGAACTCATGGCCGGGATGGTTTCGGGCTTGGACCGCAAGAATTG
+CTGGACCATCGCCGAGCACCGCGGTGATACCACCCCGATGGGTTGCAGCATCTGTTGGCACGGGCCAGCT
+GGGACGCCGACGATGTCCGTGACGATCTGCGTGACTATCGCCATTGATCGATGGCGAAGGACCAGGCCAC
+CAGTATATCGATGATTTGAATAGTCCAGCGCCGACATTGATGATATCTGTTGACGAATACGCTTGATTTA
+CGATGTTCGGCCGCGGGCAGCGCGCTCCACCAGACCGAGCACAGCGAGGACGCGACGGCCGTCAGCGGCG
+TGCTGTGCCTCAACAGCGCCGACCAATAGCGAAGAAATCAAGTCCGTGCTCACCCGTGACCAGGGTGTCA
+TGTTCGTCGACGGGTAGAAGCTTGTCGCCGCGGCGATCGGCTGCTCTGGTGCCGGCTGTGCCGACGGGTC
+GGTCCGCATCTGCTTCAGTGATTCTGTGATGCGACCGGCAACGTCTTCGTTGTTGGGTGTCAATGTGGTT
+CGTCGTCGTCTTGTTCGCACAGGATTTTCGCGGGGTGGTGGTATCGATTTATTCGCGGTTGGCCGTGGTC
+GAGGTGTGGTGGTGGTAGCCATTCGGTGTCGCCGTGGGCGTTTTTGCGGGTCTTCCAGCCTTTTTCGACA
+AGGCGATTGTCGGGGCCGCAGGCCAGCGTGAGGTCGTTGATGTCGGTACGGTGGGTGGTTGTCCACGGCG
+TTACGTGGTGGACCTCACTGTGGTAGGCCGGGGCGTCGCAACCCGGCCTGGAGCAGCCACGATCCTTCGC
+GTACAACATGATTCGCTGCGCCGGGGAAGCTAACCGCTTGGTGTGATACAACGCCAACGGCTTAGCGCCG
+TCAAACAATGCCAGATAGTGGTTGGCGTGGCTCGCCATCCGGATAAGGTCCGACATCGGCACCCGCGAAC
+CACCACCGGTTACCCCCTTGCCGGTGGCGGCTTCCAGCTCCTTTAGCGTGGTGCTCACCACGATCGTTAC
+CGGCAGCCCCTTGTGTTGGCCCAGCTCACCGGAGGCCAACAGGCCCCGCAGCGCGGCCAAAAACGCATCA
+TGATTGCGTTGCGCCTGGCTGCGGGTGTCGCGGCGCACCGCGTCCGCATCCGGTGTGTCATCCACGAGCG
+GGGTCTGGTCATCGGGGTTGCACGCCCCCGGTGCGGCCAGTTTGGCCAACACCGCCTCGATGGTGGCCCG
+CAACTCCGGGGTCAGCAGACCGCTGATACGTGACATCCCGTCAAATTCCTGCTTACCCATCGTGATGCCG
+CGCTTGCGGGCACGCTCCTGGTCGGAAAAGTTGCCGTCGGGGTGCAGCCAGTCCATCAGCTGCGTGGCCA
+GGCCATGCAGGTGATCGGGACGCCGACTGGTGGCCAGTTCGGCCAGCTGGGCCTCGGCGGCCTCGCGGAT
+ACCCAGATCCACCGCGGCGGACAACTCCTTGAAGAAGGCCTGGATCTCCTTAATGTGTTCTCGGCCGATC
+TTGCCCTCACGTTGAGCGGCCGCGGTCGCGGTCAACTGCGCTGGCAGCGGTTCACCGGTCAGGGCGCGGC
+GCTCACCGAGGTCTTCGGCTTCGGCGATGCGGCGGCTGGCCTCACCGGGAGTGATGTGTAGCCGGTTGGC
+CAACGCCGTGCGCAGCGTCCCGCCGAGCTCTTCCTCGCAGGCTTGCCCAGCGAGTTGGTTGATCAAGGCG
+TGCTCGGCGGCGCCCTGGCGGCGCCGTTCGACCTCGAGTCGCTGCAAACAGGCCAGCAATTCCGGGGTGG
+TCAACGCATCGCACTTGAGATCGAGCACCCGCGACAACGAGGCGTGGTAGGCATCCAACGCCGCGGAGAT
+CTCCTCGCGCGTGTCCGACCTCATGCCTCGGATTCTACGAAGCACCACTGACAAGAACCGGGCCGTCATA
+GGCTCGGAATGATCAGTGAGGCAGAACGTTTCGCTCACAGCGAAAACAGCCGCGCCATAGCGACTGCCGC
+CACCAAATGCCGCGTGCACGCAGACACGCCAGCGTCAGCAATCCCTATCCACGGCTGCAGTACTAGGGCG
+TGTCTCCCAAATTTTTAGGTACTGGCCAGCGAGGATTGGCCGGTGACGCGAGTGGGTGTGATTTCGGACG
+AGTTCTGGGCCGTGGTCGAGCCGTTGATGCCGTCGCATGAGGGCAAGCCCGGCAGACGGTTTAGCGATCA
+CCGGCTTATCCTGGAAGGGATCGCGTGGCGGTTCCGTACGGGAAGTCCGTGGCGGGACCTGCCCGCTGAG
+TTCGGGCCGTGGCAAACGGTGTGGAAGCGCCATCACCGTTGGTCGCTGGATGGTACCTGCGACGAGGTGT
+TCGCCCACGTTGCCGCGGTGTTCGGGGTGGACGCTGAGGTGGCCGAGGATATCGAGAAGCTGCTGTCGGT
+GGATTCCACGAACGTGCGGGCACACCAGCATTCGGCGGGCGCCTGCTCGGACACGCTCGCCACAGGGGGC
+ACTGTCGGATTACAAGAAATCCGCCGATGAACCCGACGATCATGCGATCGGCCGCTCGCGCGGCGGGCTG
+ACCACCAAGATCCATGCCCTGACCGATCAGCGCGAAGCCCCGGTGCGGATCCGGTTGACCGCAGGCCAGG
+CCGGCGACAACCCGCAACTGCTGCCCCTGCTCGACGACTATCGCCATGCCAGCACCGAATACGCCCTGGG
+CAGCACGGATTTCCGCTTACTCGCCGACAAGGCCTACTCACACCCAAGTACCCGTGCCGCATTACGGTCT
+AAGAAGATCAAGCACACCATCCCCGAACGCCAAGATCAGATCGACCGGCGCAAGGCCAAGGGGTCTGCCG
+GCGGGCGGCCACCAGCATTCGACGCCGCGCTCTACGGGCTACGCAACACCGTCGAACGCGGCTTCCATCG
+ACTCAAGCAGTGGCGCGGCATCGCAACCCGCTACGACAAATACGCCCTGACCTACCTCGGCGGCGTCCTG
+CTGGCCTGCGCCGTCATCCACGCCCGAGTGGGAACTCCGAAATTGGGAGACACGCCCTAGCCGAGACCGG
+CGAGCGTGCATCCAGGGCGAGATTCCGCCCGGCAAACCGTCGCCCTGAGTTCACGTTCGGCGCCCATAGG
+CGACTATTTCAGCAGGGCGGGCAGGCGCTCCAACAGCCCCGGCAACGCTTGGCTGGCCGACTCGCGGATG
+CTGATCGTCGCGCTGCCGGACAACGGCGTGGGCTCGGGATTGACTTCGATCACGGCAGTGCCGCGCGCCA
+GCGCCAGGTCGGGTAAACCGGCCGCCGGGTAGACGATCGCCGAGGTCCCCACCACGACCATCACGTCGGC
+GCTCCCTGTCGCCTCGACCGCGCTCCGCCACGGCTCCTCTGGCAGCGGCTCACCGAACCATACGATGTCG
+GGCCGGATCAGACCGCCGCAGTCGCAGACCGGCGGCTCCACTTCGATCGCAGGCTCGGGCATCTCCGGAA
+GGGCGTCGGTGTAGGGCACACCACAACGTGCACAACGAAATTCGAAAAGGCTGCCGTGCAGGTGATGCAC
+CGCACCGCTGCCGGCGCGCTCGTGCAGATCGTCGACATTCTGGGTGATGACGCTGACCTCAGCATGGTCC
+TGCCAGGCGGCGATCGCGCGATGCCCGTCGTTGGGTTCGACGTTGGCCACCAGATAATGGCGCCATAGGT
+ACCATCCCCAGACCCGCTCGGGGTTGCGCAGCCAGCCTTGCGTGCTGGACAGCTCGTAAGGGTCGAATCG
+GGCCCACAATCCGTTCTTGTCATCGCGGAACGTCGGTACACCGCTTTCCGCGGAGATCCCCGCGCCGCTG
+AGCACCGCCACTCGCATCCCACAAACATAGCTGTGCTTGGTAGATACTGGGTACGTGGAGCTGCGGGATT
+GGTTACGGGTCGACGTGAAGGCGGGAAAGCCGTTGTTCGACCAGCTCAGAACCCAGGTGATCGACGGAGT
+CCGCGCCGGCGCATTGCCGCCCGGCACCCGGCTCCCGACGGTGCGTGACTTGGCCGGGCAGCTGGGCGTG
+GCGGCCAATACCGTGGCCCGCGCCTACCGCGAGTTGGAATCGGCGGCGATCGTCGAAACGCGGGGACGCT
+TCGGCACTTTCATTTCCCGCTTCGATCCGACCGACGCCGCGATGGCTGCCGCGGCCAAGGAATATGTCGG
+CGTGGCGCGAGCGCTGGGGCTGACGAAGTCCGATGCGATGCGCTATCTCACCCACGTGCCGGACGACTGA
+ATTCCAGCAAAGTCAGGCACGGCCGCAGCGGATCGAATACGGGCAGGCGGTAAACGGTCGACAGCGCCAT
+ATTGACCCACAGGCCACGGCCCGGTGGCACCCGCAGATCGCGGACCGCGACGACACCAGGCACCTTATTT
+ACCAGGTCCGCGGCCTGCGCGACGGACATGCTGAACGGCATGCGCGGCACCTTGTAGCGCAGCGAGGTTC
+GTAACCCGAGCCGGCTCCACCCAGCGAACCAGCGCGGCGGCAGGTCGAAGAGCATTTGGCCGCCAGGAAA
+CGTTTGAGCGCATTGGGCGATTAACCCCAGTGCCTGTTCGGGTTGTAGGTACATCAGTAATCCTTCGGCG
+GTGATGAACACCCCGCCGGCGGGATCGACGGAATCCATCCAGCTGTAGTCCAGCGCAGACTGGGCACACA
+CCGACACGCGCGGCGAGCTCGGCAGCAGCCGTGTCCGTAAATCGACGATCGGTGGCAGGTCAACTGTCAG
+CCAACGGAACTGGCCGCCCGGGATGGCCACGTCCAAACGCCAAAAGCTGGTTTGCAAGCCCTCCGCCAAC
+GCCACCACGGTGGCCGCTGGGTGCTGATCGAGATAATGCTGTGCCGCCATGTCGAAGGCCCGTGCTCGTA
+GGGCGAAGCCCTGGCCGGTAGGGCCGAACTTCGCGAAGCCGAAGTCGATCGACTCGACCAGGGCTACCGC
+CATCGGATCGTCGATAATGGTATCGCGGCGGCGGGCCTCTGCGGCCCGGGCGTTCAGCGTCAGCAAGGCG
+GTCTCGGAGACTCCGGTGAGTGCGACCCGCTGTTTGGCGGGCTTATGGGCACTCACCGCAACACCTTAGC
+CAGCGTGCGCAGGTTGCGGGTCGTGGTCGACGACTTGTAGCGCTTCTTGCCCATCGTCTGGCCGATGGTG
+CTGTCCAGGGTGCTGCCCTTGGGTACCTGCCAGTAGAGGACGCCAAGAGGGTCGGGTCCACGACTGATGT
+TCTCGTCAGGGCCGGCTGTGTCGGCGAGTGCGGATAGCTCGTCGAGTATCGCGGCGTCGGCAACGAAGGT
+GACGTACGACTGGTATCCCTCGAGCTCGCATTCAAATGGGTATGCCGCCACGATGGTGCGCACCGTATCG
+ACGTCGTAGATCAACGCCCACGCGTCGTAGCCGAATCGTTCGCGTAGCGTGGCTTCGGTCTTCTCGCGCA
+CTTCCGCGGCACCGCACGTCGACTCCAGCAACACGTTGCCGCTGGCCAGGATGGTGCGCACATTGCAGAA
+TCCCGCATCGGTCAACGCCGTCGCCACCTCGGCCATCTTGAGGTTGACGCCGCCGACGTTGACACCGCGC
+AGAAACGCCGCGAACTTGGCCATACCCGATTGCACCAGGCCGCCGGAGAATGACGCAACGGCGACGTAGG
+CTCTTGGCATGGCCCGCCAAGTCTTCGACGACAAGCTGTTGGCCGTAATCAGTGGAAACTCCATTGGGGT
+GCTGGCCACCATTAAGCACGACGGGCGCCCCCAGTTGTCCAACGTGCAATATCACTTCGACCCGCGCAAA
+CTGCTGATACAGGTATCGATCGCCGAGCCGCGAGCCAAGACTCGCAACCTGCGTCGCGACCCACGGGCTT
+CGATCCTGGTCGACGCCGACGACGGATGGTCATACGCCGTTGCTGAGGGCACTGCGCAACTGACACCTCC
+TGCGGCGGCGCCCGATGACGACACCGTGGAGGCGCTGATTGCCTTGTATCGCAACATCGCTGGCGAGCAT
+CCGGACTGGGACGACTACCGGCAGGCGATGGTCACCGATCGGCGTGTGTTGCTGACGCTGCCGATCTCGC
+ACGTATACGGCCTGCCGCCCGGTATGCGCTAACCCCCGGGGCTGCGGACCTACGGACTGGGTCGGATTGC
+CTCGCTGCTCGGCGGGCCGCATCCTGCGGCCCGCATCGTCGCGAGGCTGGGTCGGATTGCCTCGCTCCTC
+GCCGTGCCGCATCCTGCGGCCCGCATCGTCGCGAGGCTAGGCTGCGGGTATGGGTGAATCGAAGTCCCCG
+CAAGAGTCCAGCTCAGAGGGTGAGACCAAGCGCAAGTTCCGGGAAGCCCTCGACCGCAAGATGGCACAGT
+CGTCGAGCGGATCCGATCATAAGGATGGCGGCGGCAAGCAGTCGCGGGCGCACGGTCCGGTGGCGAGCCG
+TCGGGAATTCCGCCGCAAGAGCGGCTAGCCACGGGGCGCGGCTGCTCAGCGGCGACCCGAACGTTGCCGA
+AGATGCTCATCAAGAGGTCCGTCCCGACAGCTCTACACTGAGGACGTGCCAAATCTGCAGCTTGTCCAAG
+AGCCGGCAGCCGACGCGCTGCTGAACGCCAACCCATTCGCGTTGCTGGTGGGCATGTTGCTCGACCAGCA
+GGTGCCGATGGAGACCGCCTTCGCCGGGCCGAAGAAGATCGCCGATCGGATGGGTAGCTTTGACGCCGGC
+GACATCGCCGACTACGACCCGGATAAGTTCGTCGCACTGTGCTCGGAAAGGCCTGCTATACACCGATTTC
+CGGGCTCGATGGCCAAACGCATCCAGGCGCTCGCGCAGATCATCGTGGACCGCTACGACGGGGATGCGGC
+CGCATTGTGGACCGCCGGCGAACCTGACGGGAACGAGTTGCTGCGGCGGCTTAAGGGGTTACCCGGCTTC
+GGTGAGCAGAAGGCGCGGATCTTTCTCGCGTTGCTTGGCAAGCAGTACGGAGTGACGCCGAAGGGTTGGC
+AGGTGGCAGCCGGGGAGTTCGGTCAGCCCGGCACCTATCTATCCGTCGCCGATATCGTCGACGCCGGGTC
+GCTTGGGCAGGTGCGATCGCACAAGAGGCAAAGGAAAGCGGCGGCCAAGGCAGAGGGAAAGGCGCCAACG
+TGAAGACACACCTGACGTGTCCGTGCGGCGAAGCCATCACCGGCAAGGACGAGGACGAGCTGGTCGAGCT
+GACTCAGGCCCACCTTGCCAGCGTTCATCCCGGCCTGGAGTACGACCGCGACGCCATATTGTTCATGGCG
+TACTGATGGACCATTCCCGCTGGTGCTAGGGCACCACCGTTGAGCCGATCGTCGGCATGAACTGGCACTG
+CCGGTCCTTGGTGGTCACCTGCCCGAAGATCGTTGACATGATGCTGCCTGAACCGGTGTCGGCGATTACG
+GTCAACGTGGTCGGTCCGTCCGGATTGATGTCCGAACGCGGCCGCAGGGTGGCGCTGCCGGACTTTCCCG
+TGGTCAGGTTCACCCACGTGACGTTCAGCGGCAACCTCTGCACGTCGGCGGGCCCCGGCGTGCCGACGGC
+CGTGAACACGTAGGCGGTCTGGCCGGGTCCGGGACCGGGCAGCGGGATCTTGGCGGGCCCCGCCACCGAC
+AGCGCGGTCGCGATGGAATTGCTGCCGTCCGCCACACAATTGGGGCCGATCGAGGGGTACATGAAGTCCT
+GTGTGGGCGGAGCGTCGGCGCCGAAGCCCGAGGCAGGCGCCGGAGCGGCCGCTGGCGCCGGTGCCGCCGA
+GGCCGGCGCCGGAGCGGCGGCGCGCGGCGCAGGTGGCGCCGGTGGCGGCCCCGGTACCGCAACCGGTTGG
+GCTGCGTCAGGTGCTGGTGCCGGCGCGGAAGCCGGCGGCGCGGCGACCGGCGGCGTAACCGTAGGTGCCA
+CAGCGGGTGCGGGGCCCGCGGCGTGGGATGGATCGATGCCGGTCGGAAGATGTGCCTGCACACCTGGCTC
+GGCGCCCAGTGGGGGCACATGCGGCACCGGGATGGCCTCGGGCAGGGCGACACCATGAGGCGCCGGCACA
+CCCAGGGCAGCAGAGTCGGGATTGGTCGGCTCAGCCACAAACTGGTTCACCGAGGAAGCGACGTTCTTGG
+ATTCGGTGGGCACTGCCGGATTGCCGGCGAACGCAGACGCTGCGGCCATGAGCAGTTGCGTCGCCTGTGC
+CGGGTTCATCGCCGCTTGCTGGATTATCGGACTCAGCTGGGCCAACGCCGGCAAGCCCGGTAGCTGTTGA
+GTGGGGTTGGGCTGCGGCGTCGCCGGGTCGGCTGCCGCGTTCGGACACAGCGCGAACGCGGCAGCCGAGG
+TGATGACGACGGCGGCCAAACCTTTGCACACACTCCAAGTGCTTGCCACGGTGGTGTTCTCCCGGTGTTC
+GGTGTTGGTCAGCCTTCTCACAGATGCGTCAGGGCAGCGCGGCGAGCAACGACGGCGGCCCGGGCGGTAA
+CGCGGGCGCGCCGGGAGCCGGCGGCGTCGGCGCGATGGGCGCTGCCGGAATGACCCCCGATGCGAGCGCC
+GGTAGGTCGGCTGGCAGCGAAAGCTGTTGCGGCACTTGGAGCGGAAGGTAGGGCAGCTGCGGTAGGTCGA
+CCTTCGCCGACGGCACGCCGGGAACGGAGGCCGGCACCGCGGCCGCCGCCGGGGCCGGTGCGGTTATCCC
+CGGGATCGGGGCGTTCACTCCGGGAATGGTCGGAGCTGCCGCCGGGGCGGTGACGGGGAGCGCCGGTGCC
+GCCGGGGTTATCCCCGGGATCGGGGCGTTCACTCCGGGAATGGACGGAGTTAGCGCGGGGGCCGCGGCTG
+CCGCCGGTGCGGCCGGCGTCAGTCCTGGAAAGGTGGCGGTTATCCCGGGGGCGGCGGGTGCGGGTTCCGC
+AACTTTGGGGGCGCTCAGCGGCGGAGTGGCGCCCAGAGCCGTCGCGAGGTTTTGCAGGATTTGCGGTGCG
+TTGGCGGCCGAGCTGATCAGCTGCTGCGGAATGTTGGGAGCAGGCGCCGGCGCCGGTGCCGGATCTGCGT
+GAGCGATACCGCCCGTAAGTAGTGCGGCGGACGAACCGACCAAGACGGCGGCGGCGCGGACAAACGTCCA
+GATGGTTGGCATGTCTCTCCCTGGTTAGCGGTGACGGGTCTCGCCGAACGTATCGCGGTGCAGATGTGAC
+TCAAGTGACACGTGTGGCATTTATGTGATTGTTACGGATACGAGTGGTTGTGGTGACCGGGCACCCGAGT
+GATGTGCCGCACCCTGATCGACGGCCCGGTGCGCTCGGCGATCGCTAAAGTCAGGCAGATAGACACCACC
+TCATCCACCCCGGCGGCCGCCAGGCGCGTGACCTCACCACCGGCCCGGGAGACACGCGCCGCCGTGCTGC
+TACTGGTCCTCAGCGTCGGTGCGCGACTCGCCTGGACCTATCTGGCGCCCAACGGCGCAAACTTCGTCGA
+CCTGCACGTTTACGTGAGCGGTGCAGCGTCCCTCGACCATCCCGGCACCCTGTATGGCTACGTCTACGCT
+GATCAGACCCCGGACTTCCCGCTGCCGTTCACCTATCCGCCGTTTGCGGCTGTGGTCTTCTACCCGTTGC
+ATTTGGTGCCGTTCGGTCTGATCGCGCTGCTGTGGCAAGTAGTGACGATGGCCGCGCTCTACGGCGCGGT
+TCGGATCAGCCAGCGCCTGATGGGGGGCACCGCTGAGACCGGTCATTTCGCCGCGATGTTATGGACGGCG
+ATCGCCATCTGGATCGAGCCGTTGCGCAGCACCTTTGACTATGGGCAGATCAACGTGCTGCTGATGCTGG
+CGGCGCTTTGGGCGGTCTACACCCCGCGGTGGTGGCTATCGGGACTGCTGGTCGGGGTGGCCTCGGGTGT
+CAAGTTGACGCCGGCGATTACCGCTGTCTACCTCGTCGGCGTTCGGCGGTTGCATGCGGCCGCATTTTCG
+GTGGTCGTGTTCCTTGCCACCGTCGGCGTGTCGCTACTGGTCGTCGGCGATGAAGCCCGCTACTACTTCA
+CCGACCTGTTGGGCGACGCAGGCCGGGTTGGGCCCATCGCCACCTCCTTCAATCAATCCTGGCGCGGCGC
+GATTTCCCGGATTCTCGGTCACGACGCCGGTTTTGGTCCGCTGGTTCTGGCTGCGATCGCCAGTACGGCG
+GTATTGGCCATCCTGGCCTGGCGTGCGCTCGACAGGTCCGATCGGCTGGGCAAACTATTGGTGGTCGAGT
+TGTTCGGCCTGCTGCTCTCGCCGATCTCCTGGACTCACCACTGGGTGTGGCTAGTGCCGCTGATGATCTG
+GCTGATTGACGGGCCAGCGCGTGAGCGCCCGGGCGCCCGGATTTTGGGCTGGGGCTGGTTGGTGTTGACC
+ATCGTCGGCGTGCCGTGGTTGCTGAGCTTTGCTCAACCGAGCATCTGGCAAATCGGCCGGCCGTGGTATT
+TGGCCTGGGCCGGTCTGGTCTACGTGGTGGCGACGCTGGCGACCTTGGGCTGGATCGCCGCCTCCGAGCG
+TTACGTGCGCATTCGGCCGCGGCGCATGGCCAATTAGGCCCCAAACATTGCGTCGATATCGTGCGCCATC
+GCAATGTCGTTTTCCGTGATACCACCTACCGCATGCGTAACCAGCGCGAAAGTTACTGTTCGCCAACGGA
+TATCGATGTCCGGATGATGATTTACCTCCTCGGCTCGCTCGGCCACCCGGCGTACGGCGTCGATACCGGC
+CATAAACGTCGGAAACTTGATTGACCTACGCAGGACACCACCGGCGCGCTGCCAGCCGTTGAGGTCGTGC
+AGTGCGGCGTCGACCTGCTCATCCGTTAACACAGCCATACCTCGACGGTATACCGTCACAGGTCATGCTG
+AATCAGATCGTGGTTGCCGGAGCCATCGTCCGCGGTTGCACGGTCTTGGTGGCGCAACGCGTTCGGCCAC
+CGGAGTTGGCGGGTCGTTGGGAACTTCCCGGCGGTAAGGTCGCCGCCGGCGAAACCGAGCGCGCCGCGCT
+GGCCCGAGAGCTCGCCGAAGAACTGGGACTCGAGGTCGCCGACCTCGCGGTGGGCGACCGTGTGGGCGAC
+GATATTGCGTTGAACGGCACGACGACGCTGCGGGCCTATCGCGTGCATCTGCTTGGCGGCGAACCGCGTG
+CGCGTGACCACCGGGCGCTGTGCTGGGTGACGGCGGCCGAACTGCACGATGTCGACTGGGTACCAGCCGA
+CCGCGGCTGGATTGCGGACCTGGCGCGAACCCTCAACGGGTCCGCCGCAGATGTCCACCGTCGCTGTTAG
+GAAACCGACGGTGTGGTTGACGGTGGCCGCCGTCAACTTGGTTAGAACAACGTGACAAAACGTTAACTTG
+GGTTTGCATGCCCGTAGCGATCACGATGGTTTTCTGGACGCGTGGCGACAACTTCCGGGCAGGACGCTGA
+CGCCCATCCATCGAGATACCCGATGTTGACGAGAGGGGTCCCCGACCCGGCGGACCGGGGCTTGACGGGC
+GCAATGCGGCGCGGCCGGCCAGCCCGTAACGTCCAGCGAGTGCGGTCGCGCGCCGACGGCCCGGCCCCAC
+ACCGCTCATGACGAGGAGGGTCATCCCGTGACCGTTACACCTCACGTCGGTGGACCGCTCGAAGAGCTGC
+TGGAGCGCAGCGGGCGCTTCTTCACCCCAGGTGAGTTCTCGGCCGACCTGCGCACCGTAACCCGGCGCGG
+CGGCCGCGAAGGTGACGTGTTCTACCGCGATCGGTGGAGTCACGACAAAGTGGTCCGATCCACGCACGGA
+GTCAACTGCACCGGATCCTGCTCATGGAAGATCTACGTCAAAGACGGGATCATCACCTGGGAAACCCAGC
+AGACCGACTACCCGTCGGTGGGCCCGGACCGGCCCGAATACGAGCCACGAGGTTGTCCCCGTGGCGCGTC
+GTTCTCCTGGTACAGCTATTCGCCGACGCGGGTGCGCTATCCGTATGCCCGGGGCGTGCTGGTTGAGATG
+TACCGGGAAGCCAAGACCCGCCTGGGCGACCCGGTGCTGGCGTGGGCCGACATTCAGGCGGATCCCGAGC
+GCAGACGCCGCTATCAACAGGCCCGCGGCAAGGGTGGGCTGGTCCGGGTGAGCTGGGCCGAGGCCAGCGA
+GATGGTGGCCGCCGCCCACGTGCACACCATCAAGACATACGGCCCGGACCGGGTCGCCGGCTTCTCGCCG
+ATTCCGGCGATGTCAATGGTCAGCCATGCCGCGGGGTCCCGGTTCGTGGAGCTGATCGGCGGCGTGATGA
+CGTCGTTCTACGACTGGTACGCCGACTTGCCGGTGGCCTCGCCGCAGGTGTTCGGCGACCAGACCGACGT
+GCCCGAATCCGGCGACTGGTGGGATGCGTCGTATTTGGTCATGTGGGGCTCCAACGTCCCGATCACCCGG
+ACGCCCGACGCACATTGGATGGCGGAGGCCCGTTACCGCGGCGCTAAAGTCGTTGTCGTCAGCCCGGACT
+ACGCCGACAACACCAAGTTCGCCGACGAGTGGGTGCGGTGCGCCGCCGGTACCGATACCGCGCTGGCGAT
+GGCGATGGGCCACGTGATCCTGTCGGAATGTTACGTCCGTAACCAGGTTCCGTTCTTTGTCGACTATGTG
+CGCCGCTACACCGACCTGCCGTTTTTGATCAAGTTGGAAAAGCGGGGCGACCTGCTGGTTCCCGGAAAGT
+TCTTGACCGCGGCCGACATTGGTGAAGAAAGTGAGAACGCGGCGTTCAAACCCGCCCTGCTGGATGAGCT
+TACGAATACCGTTGTCGTGCCGCAGGGCTCACTGGGATTCCGTTTCGGTGAGGACGGTGTTGGGAAGTGG
+AACCTGGACCTGGGTTCGGTGGTGCCGGCGCTAAGTGTGGAGATGGACAAGGCTGTCAACGGCGATCGCA
+GTGCTGAACTGGTTACGCTGCCCAGCTTTGACACCATCGACGGGCACGGTGAGACGGTGTCGCGTGGGCT
+GCCGGTGCGCCGGGCGGGCAAGCATCTGGTGTGCACGGTGTTCGATCTGATGTTGGCCCACTACGGGGTG
+GCGCGTGCGGGGCTGCCCGGCGAATGGCCGACCGGCTACCACGACCGAACCCAGCAGAACACCCCGGCCT
+GGCAGGAGTCGATCACCGGTGTGCCGGCCGCGCAGGCAATCCGGTTTGCCAAGGAATTCGCCCGCAACGC
+GACCGAATCCGGAGGACGGTCGATGATCATCATGGGCGGCGGAATCTGTCACTGGTTCCACAGCGATGTC
+ATGTACCGCTCGGTGTTGGCGCTGCTCATGTTGACCGGATCGATGGGACGCAACGGCGGCGGGTGGGCGC
+ACTACGTCGGCCAGGAGAAGGTGCGTCCGTTGACCGGGTGGCAGACGATGGCGATGGCCACCGACTGGTC
+GCGGCCGCCGCGTCAGGTGCCCGGCGCGTCGTACTGGTATGCGCACACCGACCAATGGCGCTACGACGGC
+TACGGCGCGGACAAGCTTGCCAGCCCGGTGGGTCGCGGCAGGTTCGCCGGCAAGCACACCATGGACCTGC
+TGACCTCGGCCACGGCGATGGGCTGGAGCCCGTTCTATCCACAATTCGATCGGTCCAGTCTCGATGTCGC
+CGACGAGGCCCGCGCCGCGGGCCGCGACGTGGGTGATTACGTCGCCGAACAACTTGCCCAGCACAAGCTG
+AAGCTCTCGATTACCGATCCGGATAACCCGGTCAACTGGCCGCGGGTGCTCACCGTCTGGCGGGCGAACC
+TGATCGGCTCGTCGGGCAAGGGCGGCGAGTATTTCTTGCGGCATCTGCTGGGCACCGACTCCAACGTACA
+GTCCGACCCTCCCACCGACGGTGTGCATCCCCGGGATGTGGTGTGGGACAGCGACATTCCAGAGGGCAAG
+CTCGACCTGATAATGTCGATCGACTTCCGGATGACGTCGACGACGCTGGTGTCGGATGTCGTGTTGCCCG
+CCGCGACCTGGTACGAGAAATCCGACCTGTCCAGTACCGATATGCACCCGTACGTGCACTCGTTCAGTCC
+GGCGATCGATCCGCCGTGGGAAACCCGTTCGGACTTTGGCGCATTCGCCGCCATCGCGCGTGCTTTCAGT
+GCGCTGGCGAAACGTCATCTGGGCACTCGCACCGATGTGGTGCTGACCGCGCTGCAGCACGACACCCCGG
+ATGAGATGGCATATCCCGATGGCACCGAACGTGATTGGCTGGCGACCGGAGAAGTCCCGGTGCCAGGCAG
+GACGATGAGCAAGCTCACTGTGGTGGAGCGGGACTACACCGCGATCTACGACAAGTGGCTGACCCTGGGA
+CCGCTCATCGACCAGTTCGGGATGACCACCAAGGGATATACCGTCCATCCCTTCCGGGAGGTCAGCGAGC
+TGGCAGCCAACTTCGGGGTGATGAATTCCGGTGTGGCGGTGGGTCGTCCGGCGATCACCACGGCTAAGCG
+GATGGCTGACGTGATCCTGGCGCTGTCCGGCACATGCAACGGGCGACTCGCGGTCGAGGGATTCCTCGAG
+CTGGAGAAGCGTACCGGGCAGCGGCTGGCTCATCTGGCCGAGGGCAGCGAGGAACGCCGCATCACCTACG
+CCGATACCCAGGCGCGTCCCGTGCCGGTGATCACCAGCCCGGAATGGTCGGGCAGCGAGAGCGGTGGCCG
+CCGCTACGCGCCGTTCACGATCAACATCGAGCATCTTAAGCCGTTTCACACGCTCACCGGGCGTATGCAC
+TTCTACCTGGCGCATGACTGGGTCGAAGAACTCGGCGAGCAGTTGCCCGTCTATCGGCCGCCGCTGGACA
+TGGCGCGGCTGTTCAACCAGCCCGAGCTCGGACCGACCGACGATGGACTCGGGCTCACCGTGCGCTATCT
+GACGCCGCACTCCAAGTGGTCGTTTCACTCGACCTACCAGGACAACCTATACATGTTGTCGTTGTCCCGT
+GGCGGTCCGACGATGTGGATGAGCCCGGGTGACGCGGCGAAAATCAATGTGCGCGACAATGATTGGGTAG
+AGGCGGTCAATGCCAACGGCATCTACGTGTGCCGGGCAATCGTCAGCCACCGGATGCCCGAGGGTGTGGT
+GTTCGTCTACCACGTGCAGGAGCGCACCGTGGACACGCCGCGCACCGAGACCAACGGCAAACGCGGCGGC
+AACCATAACGCGCTGACCCGCGTACGAATCAAACCCAGCCACCTGGCCGGTGGCTACGGCCAGCACGCGT
+TCGCGTTCAACTACCTGGGTCCGACCGGTAACCAGCGTGACGAGGTGACCGTGGTGCGCCGCCGCAGCCA
+GGAAGTGCGGTACTGACCAATGAAGGGCCCGAGCGACGCTTGCGGAGCGAGACGATGAAGGTCATGGCGC
+AGATGGCGATGGTGATGAACCTCGACAAATGCATTGGTTGCCATACCTGCTCGGTGACCTGCAAGCAGGC
+CTGGACCAATCGCTCGGGAACCGAGTACGTGTGGTTCAACAATGTCGAAACCCGTCCGGGTGTGGGCTAC
+CCGCGCACCTACGAGGATCAGGAGCGGTGGCGCGGGGGGTGGGTGCGCGACAAGAAGGGCCGGCTGCGGC
+TGCGCGACGGCGGCCGGATCCATAAGCTGTTGCGCATCTTTGCCAACCCCAAGCTGCCCACTATCGGCGA
+CTACTACGAGCCGTGGACCTATGACTACGAAAACCTGACATCGGCGCCGGCGGGTGACACCTTTCCGACC
+GCGGCGCCGCGAAGCCTGATCAGCGGCAATCCGATGAAGGTGTCGTGGGGATCCAACTGGGACGACAACC
+TGGCCGGGTCGCCAGAGATCGTGCCGAACGACCCGGTGCTAAAGAAGGTCAACCAAGTCAACCAAGAGGT
+CAAGCTGAAGCTTGAAGAGACCTTCATGTTTTACCTGCCGCGGATCTGCGAGCACTGCCTGAACCCGTCG
+TGTGTGGCGTCGTGTCCGTCGGGGGCGATGTACAAGCGCACCGAGGACGGCATCGTGCTCGTCGACCAGG
+ACCGCTGCCGCGGCTGGCGGATGTGTGTGTCCGGGTGCCCATACAAGAAGGTGTATTTCAACCACAAGAC
+CGGCAAGGCCGAAAAGTGCACCCTGTGCTATCCGCGCATCGAGGTGGGGTTGCCGACGGTGTGCTCGGAA
+ACGTGTGTGGGGCGGCTGCGCTATCTGGGTCTGGTGCTCTATGACGTCGATCAGGTGCTGCAGGCCGCGT
+CGGTGGAAAGCGACACCGACCTCTACGAGGCGCAGCGCCGGATCCTGCTGGACCCGCACGATCCGCGGGT
+GATCGCCGGGGCGCGCGCGGAAGGCATCGCCGACGAGTGGATCGAGGCCGCCCAGCGGTCCCCGGTGTAC
+GCGTTGATCAACACCTACCGGGTGGCGCTGCCGCTACATCCGGAGTACCGGACCATGCCGATGGTCTGGT
+ACATCCCGCCGCTGTCGCCGGTGGTCGACGCGGTCAGCCGCGACGGGCACGACGGGGAGGACCTGGGCAA
+TTTGTTCGGCGCGCTGGACGCACTGCGGATTCCGATTGCCTATCTGGCCGAGCTGTTCACCGCGGGCGAC
+ACCGAGGTGGTCGCGGGCGTGTTGCGGCGGCTGGCGGCGATGCGCTGCTACATGCGCGACATCAACCTGG
+GCCGGGAGACCCAGCCCCACATCCCGGAATCGGTCGGGATGACCGAGGAGCAGATCTACCAGATGTACCG
+ACTGTTGGCTGTGGCGAAATATGAAGAGCGCTATGTCATTCCGACGTCGTACGCGGGGGAGCTGCCGGCC
+GCGGCGATGACCGACGATATGGGGTGCTCGTTGTCGGTCGACGGCGGACCGGGAATGTACGAGTCCGGTC
+CGTTCGGGCAGGGCAGCCCTACTCCGGTGCCAATCGCCGTGGAGAGCTTCCACGCTCTGCAGCATGCCGG
+TAGCGCGGCCACCGGCGGCGCTGGCCGATCCCGGGTCAACCTGCTCAACTGGGACCCCAACGGCGCAGCG
+GCGGGGCTCTTCCCGGAGCCTCAGCCCAGCAAGGATGTGGTCCAGCGATGAAGTTGCTGTCTCGTGTCCG
+AGAGCGGTCGAGCGCCACCACAATGAGGGACCGACTGGTGTGGCAGTCGGCCTCGCTACTGCTGGCCTAT
+CCGGATGACGGGCTGGCCGAGCGGCTGCACATGGTCGATGCGCTGCGCGCCCACCAAACGGGCCCGGCGG
+CGGCGCTGCTAGGGCGAACGGTAGCGGAGTTGCGTGCCCTGGCGCCGATGGCCGCGGCGGCGCAGTACGT
+CGAGACCTTCGATATGCGACGCCGATCCACGATGTATCTGACGTACTGGACCGCCGGGGACACCCGCAAC
+CGCGGCCGGGAGATGCTGGCGTTCGCCACCGCCTATCGAGACGCCGGCGTCAAGCCGCCGCGTACCGAGG
+CGCCCGACTACCTGCCCGTCGTGCTCGAGTTCGCCGCCACCGTCGACCCCGAGGCCGGACGTCGGCTGCT
+GACCGAGCACCGTGTGCCGATCGACGTGTTGCGCGGCGCGCTGGCCGACGCCAAGTCACCCTATGAGTAC
+ACCGTGGCGGCGATCTGCGAGACACTGCCCGCTGCCACCAACCAGGAAGTGCGTCGGGCACAACGCCTAG
+CTCAGTCGGGGCCGCCCGCGGAAGCCGTTGGTTTGCAACCGTTTACCTTGACCGTCCCGCCCAAGCGCGC
+CGAGGGGGCCTGACCTTGGCCGTCTTGGACTTGGTTGAGATCTTCTGGGATGCCGCGCCTTACGTCGTTG
+TGGCGATCGCGGTGGTCGGCACCTGGTGGCGGTATCGCTACGACAAGTTCGGCTGGACCACACGCTCGTC
+GCAGCTCTACGAGTCGCGGTTGCTGTCGATCGGCAGCCCGATGTTCCATTTCGGCAGCTTGCTGGTGATC
+ATGGGCCACGTGATGGGCCTGTTCATTCCGGATTCCTGGACCAGAGCGTTCGGCATGAGCGATCACCTGT
+ACCATCTGCAGGCGCTGCTGCTTGGCGCGCCCGCCGGTTTCGCCACTCTGCTCGGTATCGGGTTGCTGAT
+CTATCGGCGGCGCATCCAGACACCGGTGTGGCTGGCTACCACTCGGAATGACAAGCTGATGTACCTGGTG
+CTGGTGTGCGCGATCGTGGCTGGCCTGGCATGCACGCTGATGGGCGCCACCCATGAGGGCGATATGCACG
+ATTACCGGCGCTCGGTGTCGGTCTGGTTCCGCTCGATCTGGATGCTAGCGCCGCGTGGCGATCTGATGGC
+CCAGGCGACGCTGTACTACCAGGTGCATGTGCTGATCGCGCTCGCGCTGTTTGTGCTCTGGCCGTTTACC
+CGATTGGTGCACGCGTTCAGCGCGCCGATCGCCTACCTGTTCCGGCCCTACATCGTGTACCGCAGCCGCG
+AGGTGGCGGCCAAGCACGAATTGATCGGTTCCGCGCCGCGTCGTCGTGGGTGGTAGTTCTCTGCCACAAT
+CACCGTCGTGCCATTCCGCAACGTTGCCATCGTCGCGCACGTCGACCACGGCAAGACCACCCTGGTTGAC
+GCCATGTTGCGGCAGTCCGGGGCGCTGCGTGAACGCGGTGAGCTGCAGGAACGGGTGATGGACACGGGCG
+ATCTGGAGCGGGAGAAGGGCATCACCATCCTGGCCAAGAACACCGCCGTGCACCGCCATCACCCGGATGG
+AACCGTCACCGTAATCAATGTCATAGATACCCCGGGGCACGCGGACTTCGGTGGCGAGGTGGAGCGCGGG
+CTGTCCATGGTGGACGGGGTGCTGCTGCTGGTCGACGCCTCCGAGGGTCCATTGCCGCAGACGCGGTTTG
+TTCTGCGTAAAGCGCTGGCCGCCCATTTGCCGGTGATTCTGGTGGTCAACAAGACAGACCGGCCCGACGC
+CCGCATCGCCGAGGTCGTGGACGCCAGCCACGACCTGTTGCTAGATGTCGCGTCCGACCTTGACGACGAA
+GCGGCCGCAGCGGCCGAACACGCGCTGGGCCTGCCGACGCTGTACGCATCCGGGCGCGCCGGGGTGGCGA
+GCACCACGGCGCCGCCCGACGGCCAGGTTCCCGACGGCACCAACCTGGATCCGTTGTTCGAGGTGCTCGA
+AAAGCATGTGCCGCCGCCGAAAGGAGAGCCGGACGCACCGCTGCAGGCGCTGGTCACCAACCTGGACGCG
+TCGACCTTTCTGGGTCGGTTGGCGCTGATCCGCATCTACAACGGCCGCATCCGCAAAGGCCAGCAGGTTG
+CGTGGATCCGTCAGGTGGATGGTCAGCAGACCGTCACCACTGCCAAGATCACCGAATTGTTGGCCACCGA
+AGGCGTGGAACGCAAACCAACCGACGCTGCCGTCGCCGGCGATATCGTCGCCGTCGCCGGCCTGCCCGAG
+ATCATGATCGGCGACACGCTGGCCGCTTCCGCGAATCCCGTTGCCCTGCCCAGGATTACCGTGGACGAGC
+CGGCGATCTCGGTCACCATCGGCACCAACACCTCGCCGCTGGCGGGCAAGGTGGGTGGTCACAAGCTCAC
+CGCGCGCATGGTCCGAAGCAGGCTGGATGCCGAGCTGGTGGGCAACGTGTCGATTCGTGTCGTCGACATC
+GGCGCCCCGGACGCCTGGGAGGTACAGGGTCGCGGCGAGCTGGCGCTGGCGGTGCTGGTCGAGCAGATGC
+GCCGAGAGGGTTTCGAATTGACCGTGGGTAAGCCACAGGTGGTGACCAAGACCATCGATGGCACGCTGCA
+CGAGCCATTCGAGTCGATGACCGTCGACTGCCCCGAGGAGTACATCGGCGCGGTCACGCAATTGATGGCC
+GCGCGCAAGGGCCGCATGGTGGAGATGGCCAACCACACCACCGGCTGGGTCCGCATGGACTTCGTGGTTC
+CCAGTCGCGGCCTGATTGGGTGGCGCACCGACTTCCTCACCGAGACCCGTGGCTCCGGTGTCGGGCATGC
+GGTGTTCGACGGATACCGGCCATGGGCGGGGGAGATCCGGGCCCGCCACACCGGTTCTCTGGTATCGGAC
+CGGGCCGGCGCCATCACACCGTTCGCGTTGCTGCAACTCGCCGATCGGGGGCAGTTCTTCGTCGAGCCCG
+GCCAACAGACCTACGAGGGCATGGTCGTCGGGATCAACCCCCGTCCGGAGGACCTCGACATCAATGTCAC
+CCGGGAGAAGAAGCTGACCAACATGCGCTCATCGACCGCGGATGTCATCGAGACGCTGGCCAAGCCGCTG
+CAGCTGGATCTCGAGCGCGCCATGGAGTTATGTGCGCCCGACGAATGCGTCGAGGTGACCCCGGAGATCG
+TGCGGATCCGCAAAGTCGAGCTGGCCGCCGCCGCCCGGGCTCGCAGCCGGGCGCGCACCAAGGCGCGTGG
+CTAGCAACTTGGCGCGCTGGCCGCGCGAGCGTAACGCCACTGCGAAATCCAGCCCGGCTTTTCGCAGCCG
+GGTTACGCTCGTGGGGGTACTGGATAGCCTGATGGGCGTGCCCAGCCCAGTCCGCCGCGTCTGTGTGACG
+GTCGGCGCGTTGGTCGCGCTGGCGTGTATGGTGTTGGCCGGGTGCACGGTCAGCCCGCCGCCGGCACCCC
+AGAGCACTGATACGCCGCGCAGCACACCGCCCCCGCCGCGCCGCCCTACCCAGATCATCATGGGCATCGA
+CTGGATCGGCCCCGGGTTCAACCCGCATTTGCTGTCCGACCTGTCGCCGGTGAACGCCGCAATCAGTGCG
+TTGGTGTTGCCCAGCGCGTTCCGGCCGATTCCGGATCCCAACACGCCGACCGGTTCGCGCTGGGAGATGG
+ACCCGACCCTGTTGGTTTCCGCCGACGTGACCAACAACCACCCGTTCACGGTGACCTACAAGATCCGGCC
+CGAGGCGCAGTGGACGGACAACGCCCCGATCGCCGCCGACGACTTCTGGTATCTGTGGCAGCAGATGGTC
+ACACAGCCGGGCGTCGTCGACCCCGCCGGATACCACCTGATCACCAGTGTCCAGTCGCTCGAGGGCGGTA
+AGCAGGCCGTCGTTACGTTCGCACAGCCCTACCCCGCTTGGCGTGAGTTGTTCACCGACATCCTGCCGGC
+GCACATCGTCAAGGACATACCAGGGGGCTTCGCGTCCGGTTTGGCTCGAGCGCTGCCGGTGACAGGTGGA
+CAGTTTCGGGTGGAAAACATCGACCCACAGCGCGATGAGATCCTGATCGCCCGCAATGACCGTTACTGGG
+GCCCACCTTCCAAACCCGGCATCATTCTCTTCCGCCGGGCCGGGGCGCCGGCCGCGCTGGCCGATTCGGT
+ACGTAACGGAGACACCCAGGTCGCCCAGGTGCATGGTGGCTCGGCGGCCTTCGCCCAGTTGTCGGCCATC
+CCCGACGTGCGGACCGCCCGGATCGTGACACCGCGGGTCATGCAGTTCACGCTGCGGGCAAACGTTCCCA
+AGCTGGCCGACACCCAGGTTCGCAAGGCGATTTTGGGGTTGCTGGACGTGGACCTACTTGCCGCCGTGGG
+CGCCGGCACCGACAACACCGTCACCTTGGACCAGGCGCAGATTCGTTCGCCGAGTGACCCGGGTTATGTT
+CCGACCGCGCCTCCCGCAATGAGCAGCGCCGCCGCGCTGGGTCTGCTGGAGGCATCGGGATTCCAGGTCG
+ACACCAACACGTCGGTGTCGCCGGCGCCGTCGGTCCCCGATTCGACGACCACGTCGGTGAGCACCGGGCC
+GCCGGAAGTCATCCGCGGCCGGATCAGCAAGGACGGCGAACAGTTAACGCTGGTCATCGGGGTGGCCGCG
+AACGATCCGACCTCGGTGGCGGTCGCCAACACTGCTGCCGACCAGCTGCGCGACGTCGGCATCGCCGCGA
+CTGTGCTGGCGTTAGACCCGGTCACGCTCTATCACGACGCGCTGAACGACAATCGGGTAGACGCCATTGT
+GGGCTGGCGCCAAGCCGGCGGAAACCTGGCGACGCTGCTGGCCTCTCGTTACGGCTGTCCCGCATTGCAG
+GCGACGACGGTCCCGGCTGCGAATGCGCCGACGACGGCCCCGTCCGCTCCCATTGGCCCTACGCCGTCCG
+CCGCGCCCGACACCGCGACACCGCCACCAACGGCGCCGCGCCGCCCATCCGACCCGGGCGCGCTGGTAAA
+AGCGCCGTCGAATCTCACCGGCATCTGCGACCGCAGCATCCAGTCGAACATCGATGCCGCACTCAATGGC
+ACCAAGAACATCAACGACGTGATCACCGCGGTCGAACCGCGACTGTGGAATATGTCGACCGTGTTGCCGA
+TCCTGCAGGACACCACGATCGTCGCGGCCGGCCCGAGCGTGCAGAACGTCAGCCTGTCTGGTGCGGTGCC
+AGTGGGCATCGTCGGCGACGCCGGCCAATGGGTGAAGACCGGGCAATAGCCCTGGTCACGCCGGCGGAAT
+CGTCGGCTAGCTCTCGCGGCGTTCGCCGGTGGTGAGGATCATGGCGTCGATAATGCGTGTGAGCTGCTCA
+CGGTCCGGCGGGGATCCGGTAAACAAGACATGCTGATGGATCAAGGCCGGTCCGATTCGTGCGGTCATCG
+GAGTCAGAGTTGCCGGGTCGATTTCGCCGGAACGCACGCCCGCCTGCAGGATGGACTCGACAATTCGCAG
+CCGCGGGGCCCACACCGAGTTGATGAAGATGGCGCGCAGCTCGGGCTCGTGTAGGAGCTGGCTGACGATT
+TCCATGCTGGGGAGGGCCGTCTTGCCGGCCAGGATTTCGCAGTTGGCGGTGAACACCGCCAGCAGATTCT
+CCCTTGCCGACCGGTCAGCGCGCGGCTCGGGTACCGGCGGCAAAGCGTATTGCACCGCGGCCAGCACCAG
+CTCACGTTTGCCGGCCCACCGCCGATACAACGCGGCTTTGCCGGTTTGGGCGCGTGCCGCGATGCCTTCC
+ATGGTCAGCCCGCCGTATCCGGCGGATTCGAGTTCGGCCAGCGTCGCATCGTAGAGCGCACGCTCAAGCA
+CCTCGCCGCGCCGCCGGTACGGGTTGGCCTTTGCGGGTGCGCTCACCGTCATGCTGCGATACTAGCCAAC
+TGCGGCTTTTCCGCCGGCGCGGTTCGATCGATGCATCAGGTGAGGCCCTTTTGCTAGCCGGCGGCGGGTG
+ACCGCAGTATCACTCCGGAACGGGTTCTTGCCGCGACGGCGCCCACAGCGCCCCCGGCCAGGCTTGCCAA
+TCCCAGCTGGGCCCACGAGGTTCCCGACGGACCGCCCGGCGCGGAGGTCGGGACGGCTTTGGCCAACGGC
+GTAATCGATTTGTCCGCAACCCAGCTGGGGGGCACCGACAACCCCCCGATCGTATCCGCATTTCCCAATG
+TTGCCGACACCGCGGGCCTGACCGCGTTGGGTAGCAACTCCAGCGGGCCCTTGAGCGTGGGTGTCAGGCT
+CCGCATGGCGAGGTTGCCCATCATCTGGCCCATGTTGCTGCCCTCGACAAAGGCCAACACGTATTCCACG
+GGTATCGACGAGATTCGCGCGGCTGTGAGCGGGTAGGTGCCCTTCGTCAACAGCGTCCACAGCTTCGAAG
+GCAGATTCTTGGTCGCCGGCGCGGCGAATGACCCCACCGTCTCGGACACCGAACCGATCAGTTCATAAAG
+TCTGGCCAGCGCGCCCGGGTTGGCGATCGGCGCCGGGGGGCGAGAACGGTGTCAGCCGTGCGGCGGCCGC
+CGCCATTGTGGCGTAGAGGTTCATCGCCTCGCCATCTTGGGACCAGTACTGGGCATACAGTGCATCGAGG
+GCAAAGATCGCGGGGGTGTGAATCCCGAAAATGTTGGTCGTGGCGAGAGCGAGGCGCGTCAGTCGGTTGG
+TCTCGATCACCGGCAGCGGCACGTGTGCTGCGTGCGCCGCTTCATAGGCGCCTGCCACGACGCTGATGTG
+GTCGGCGACGAGTTCAGCCAGGGAAGCGGTCGTGACAATCCAGGCCCGAAATGGGGCGACCGCAGCTGCC
+ATGATCGTCGACGATGGCCCCCGCCACGATGTGATCAGCCCGTTGATCTCACTCTCGAACCGACTGGCCG
+CGTAGCTCAGCTCGTTGGACAGATTCTTCCAGGCGTTCGCGGCTACTAGAAACGGACGAGCGCTACCTTG
+GATGTTGAGGGAGTTGAACTCCGGCGGAAAAATTGTGAAATCCATTGTCGCTCAACCGCTGTCTAGGTGG
+AGGTGCCCGCGCGGTTGGCTAATTCGGTGAGCCAATACGAAGTCTTGCTGGTCTGAAGTGTTTGGACAAA
+TGACTCGTGGATCACATGGGCCTGGCGCGCGATCGCCTTGTACAGCTCGCCGTGCATGGAAAACAGCATC
+GACGTCACGATGGACACAAGATCGTGGGCGGGGGATTCCACATTGGTGATCAGCGGCGTGACCCCGTCAT
+CATGGGCGCTCATCGTCACCCCGATCTCGTGGAGGTTGGCGGCCGTTTCCCCAATCGAATCGGGCCGTGT
+GGTGACAAAAGACACGCGTGCATCTCCTTCCACTGACGTGGTCTGATGGTGGGGGTCAGCGACGACTTGG
+GGTTCCGCACGGCATTGTAGACGGAATCGTTCACTAAGGTATTTTCACCATAACGGCTTCGGTCACAAAA
+CGGTAGCGATTCTGTTGAGGAATTTTTTCGACGCTCGCCCGGTAGGGTGCCTCCATGTCTGAGACGCCGC
+GGCTGCTGTTTGTTCATGCACACCCCGACGATGAGAGCCTGAGCAACGGCGCAACCATCGCGCACTACAC
+CTCCCGTGGCGCACAGGTCCATGTCGTCACGTGCACCCTGGGTGAGGAGGGCGAGGTCATTGGCGATCGC
+TGGGCTCAACTCACCGCCGATCATGCGGACCAACTCGGTGGCTACCGCATCGGCGAGCTCACCGCGGCGT
+TGCGAGCGCTCGGGGTCAGCGCACCGATCTACCTTGGCGGCGCGGGTCGCTGGCGCGACTCCGGCATGGC
+CGGCACAGACCAGCGGAGTCAGCGGAGATTCGTCGATGCTGACCCCCGGCAGACCGTCGGGGCATTGGTC
+GCGATCATTCGCGAGCTGCGGCCGCATGTCGTGGTGACCTATGACCCCAATGGCGGTTACGGTCATCCTG
+ACCACGTGCACACCCACACCGTCACTACCGCCGCGGTGGCCGCAGCGGGTGTTGGGTCCGGTACCGCAGA
+TCACCCCGGCGACCCGTGGACGGTGCCGAAGTTCTACTGGACGGTCTTGGGTCTGAGCGCGCTCATTTCG
+GGCGCGCGAGCCCTGGTCCCCGACGATCTGCGACCCGAATGGGTGTTGCCGCGGGCCGACGAGATTGCAT
+TCGGGTACTCCGACGACGGTATCGACGCCGTCGTCGAGGCCGATGAGCAGGCGCGAGCCGCCAAGGTTGC
+GGCACTGGCTGCCCATGCCACCCAAGTTGTCGTCGGCCCGACCGGCCGGGCCGCCGCCTTGTCGAACAAC
+CTGGCACTGCCCATCCTGGCCGATGAGCATTACGTGCTCGCCGGCGGCTCCGCGGGCGCCCGCGATGAAC
+GTGGCTGGGAAACTGATCTGCTCGCCGGTCTGGGCTTCACCGCGTCCGGCACGTAGGCTGCCAACCAGGC
+AGCCACGGAAGGAACCCCATGGACCCCGACCTGGACCCTAACCTGCAGCATTGGCAGGACCGACTCGACA
+GCCTGCAGTGGGTCATCGGGTCGATACTCTCTCAGATCGACAGCGTGCCAACCTGACCACCGGCGCGACA
+GATCGAGCAATCCGTTTGGTTGTCCTGGCCCTGTTGACTGTCGACGGGGTCGTGTCTGCGCTTGCCGGGG
+CTCTGCTGATGCCCTGGTATATCGGCTCGGCTCCGTTTCCGATCAGTGCCTTGATCAGTGGATTGGTCAA
+TGCTGCGCTGGTGTGGGCCGCAGCGCGATGGACCACATCGTCGCGGGTGGCCGCGCTGCCCCTGTGGGCG
+TGGCTACTGACGGTAGCGGCGATGAGCTTCGGCGGCCCTGGCGACGATGTCATTCTGGGTGGCCAGGGCC
+TGCTGGTCTACGGCGCGCTGGTGTTCGTCGTGGCAGGGGCCGTGCCACCGGCGTGGGTGCTGTGGCGGCG
+CAGGGTCCAAGCTGACGGATCTGGCTAGTCCGAAGTTAGGGCAAAGACGGGAATCCCGGCGGGCTGATTG
+GCGGCAACGGCGGCAGGAAGCCGCGTATCCAGTTGATCTCGGTGTTGATGAATTGGTTGATCGATGCCGC
+GGTGGCCGTTTCGATATTGGTTAGTGCCTGGCTGAAAGTGACTGTCCCGTCCACGAAGTCGATCGCATTG
+AACAGGACTGCCTGCACGATGGGCTCGCCGAGGTAATAGAAGAAGTTGATCTGCGGTGCCAGTATGCCGA
+TGTAGGGCAGCCATCCCACCGCCCATGCGGTGAGGTTGAAGCCGTACTGCACCCACGGTTCGACGGCGTT
+GTAGAGATTCTTGATTGCGTTGCCGATCGACTCGGCGGCCAGAGCCGGCAGCGCCGCGGCGGCGGCCGCT
+CCGGCGCGCGGCAGCAGGGCGCCGACGGCGGACAAACCGCTGGCCCCACCGGTGGGTTGGAGCTGCAGTG
+CACCGCTGGCAGCGGCATTTGCAGCGGCGCTACCGCCAAGTGCACTGGAGCCGCCAGTGCCGAGGAACAT
+GCTGTGGACCCGGCTCAGCGCGTTCGAGCCCCCACCCGTCGAGGCGTCGGCGCTAATCAGTGGATGCCCC
+AGCAACGCTCTTGCGGGCGCATTCACGGCGTTCACCATGGTCTGCGCGGCGCTGGCCTCGGCGGTTGCAT
+ACGCGTCTGCACTTGCTCTCAGCGCCTGCACGAACTGGTCGTGGAAGGCTGTCATCATCTGCCGGCTGAG
+CTGCTGATACCCCTGAGCATGCGCGGAAAGCAGCGCGGCGACCTGAGTCGAGACCTCGTCCGCGGCTGCG
+GCCAGGACTCCGGTGGTGGGAACCGCCGCAACCACATTGGCGGCGTTAAGAGTCGAACCGATACCGGCCA
+TGTCCGCAGCGGCCGCCGCCAGTGCCTCTGGCGCCGCGAACACAAACGACATCTCGTACCTTCTCCTGGT
+TCACCACGCGGCGGCTGTCGCCGGGGGCTTGTTCAGACGCTGGCCTCTCACGGATGGTATCGCGATCGGC
+TGTGACCTGCGCCTTACTCCACCAAACCGTTGGTGCCGGACGGTCGACGGCGTGCCGAGCTCGGCCTGGC
+GCTACTGTTGCGCTTATGGCGCCAAGGTTGGCCAGCATCTCACCTGGTGGGGCGTGCGGGTGATATCAGA
+TTGCAGGGAAGGTATACCAACGTGCCGCAGCCTGTAGGTCGGAAGTCCACCGCTCTGCCGAGTCCCGTTG
+TACCGCCCCAGGCAAATGCCTCAGCGTTGCGGCGGGTACTGCGACGGGCCCGAGATGGTGTCACGCTGAA
+CGTGGATGAGGCGGCCATAGCGATGACCGCACGCGGTGACGAGCTGGCCGACCTGTGCGCGAGCGCCGCG
+CGGGTGCGCGATGCGGGTCTCGTGTCGGCCGGCCGGCACGGGCCCAGCGGCAGGTTGGCGATCAGCTATT
+CGCGCAAGGTGTTTATCCCGGTCACCCGGTTATGCCGGGACAATTGCCACTATTGCACGTTCGTCACCGT
+GCCGGGCAAGCTACGCGCCCAAGGTTCCAGCACGTATATGGAACCCGACGAGATCCTCGACGTTGCCCGC
+CGAGGTGCCGAATTCGGTTGCAAGGAAGCGCTATTCACTCTCGGTGACCGTCCGGAGGCGCGTTGGCGCC
+AGGCACGCGAATGGCTCGGCGAACGGGGCTATGACTCCACGTTGTCCTACGTGCGCGCGATGGCAATCCG
+TGTGCTGGAGCAAACCGGGCTGTTGCCGCACCTGAACCCGGGTGTGATGAGCTGGTCGGAGATGTCGCGG
+CTCAAACCGGTGGCGCCGTCGATGGGCATGATGCTGGAGACGACCTCGCGACGGCTGTTCGAAACCAAGG
+GGCTCGCCCACTACGGCAGCCCTGACAAAGACCCGGCGGTGCGGCTGCGTGTCCTGACCGACGCCGGCCG
+GTTGTCCATTCCGTTTACCACCGGTCTGTTGGTCGGCATCGGCGAGACGCTATCCGAGCGCGCCGATACG
+TTACATGCGATTCGCAAGTCGCACAAGGAGTTCGGGCATATCCAAGAAGTGATCGTGCAGAACTTCCGCG
+CCAAGGAACACACCGCGATGGCCGCCTTCCCCGATGCCGGAATCGAGGATTACCTGGCGACGGTTGCGGT
+GGCGCGGCTGGTGCTGGGCCCGGGCATGCGCATCCAGGCGCCGCCGAACCTGGTGTCTGGCGACGAATGC
+CGGGCGCTGGTTGGCGCCGGGGTCGACGACTGGGGCGGTGTCTCACCGTTGACGCCCGACCATGTCAACC
+CCGAACGGCCCTGGCCCGCTTTGGACGAGCTGGCGGCGGTCACCGCCGAAGCCGGCTACGACATGGTGCA
+GCGGCTGACCGCGCAACCCAAATACGTACAGGCGGGCGCGGCGTGGATCGACCCGCGGGTGCGGGGACAT
+GTGGTGGCGCTGGCGGATCCGGCGACCGGCCTGGCCCGCGACGTCAACCCGGTGGGCATGCCGTGGCAGG
+AGCCCGACGACGTGGCGTCCTGGGGCCGGGTCGATCTGGGCGCAGCGATCGACACTCAGGGCCGCAATAC
+CGCAGTGCGCAGCGACCTGGCCAGCGCCTTCGGTGACTGGGAATCGATCCGCGAGCAGGTGCACGAGCTG
+GCGGTCCGCGCTCCGGAACGCATTGACACCGATGTGCTTGCCGCCCTGCGATCGGCGGAGCGTGCGCCCG
+CCGGCTGCACCGACGGCGAGTATCTGGCGCTTGCCACCGCCGACGGTCCTGCGCTGGAAGCCGTTGCCGC
+ACTGGCTGATTCGTTGCGCCGCGATGTCGTCGGCGACGAGGTGACCTTTGTGGTCAACCGTAACATCAAC
+TTCACCAACATCTGCTACACCGGTTGCCGGTTCTGCGCGTTCGCCCAGCGAAAGGGTGACGCCGACGCCT
+ACTCGCTGTCGGTCGGAGAGGTCGCCGACCGGGCATGGGAGGCCCACGTCGCCGGGGCCACCGAAGTATG
+CATGCAGGGCGGTATCGATCCCGAGCTACCGGTCACCGGCTACGCCGATCTGGTTCGTGCCGTCAAGGCG
+CGGGTGCCCTCCATGCATGTGCACGCGTTTTCCCCGATGGAGATCGCCAACGGCGTCACCAAGAGCGGGC
+TGAGCATTCGCGAGTGGCTGATCGGCCTGCGCGAGGCCGGGCTGGATACCATCCCGGGTACCGCCGCGGA
+AATCCTGGACGACGAGGTTCGCTGGGTGCTGACCAAGGGCAAGCTGCCGACGTCATTGTGGATCGAAATC
+GTGACGACCGCCCACGAGGTGGGTCTGCGGTCATCATCGACGATGATGTACGGGCATGTGGACAGTCCAC
+GGCACTGGGTCGCCCATCTTAACGTGCTGCGCGATATTCAGGACCGTACCGGCGGCTTCACCGAGTTCGT
+CCCGTTGCCGTTCGTGCACCAGAATTCACCGTTGTACCTGGCCGGTGCGGCGCGCCCCGGGCCCAGCCAT
+CGCGACAACCGCGCGGTACATGCTTTGGCGCGGATCATGTTGCACGGCCGCATCTCGCACATTCAGACCA
+GCTGGGTGAAACTTGGAGTGCGGCGCACCCAGGTGATGCTCGAAGGTGGCGCCAACGACCTGGGCGGCAC
+GCTGATGGAGGAGACCATCTCGCGGATGGCCGGTTCCGAACACGGATCGGCCAAGACCGTCGCTGAGCTG
+GTCGCGATCGCCGAAGGCATCGGCCGCCCGGCGCGCCAGCGCACTACCACATACGCCCTGCTTGCGGCCT
+AGCCCCGGCGACGATGCCGGGTCGCGGGATGGGGCCCGCATGGGCTTAATAGTTGTTGCAGGAGCCGGCA
+ACCGACTCGACAAGGCCGATGTACTGTGCCGCCCCCGGCACAGCTTGCAATTGCGCGGCCATGGCAGCGC
+GCTGAGGTGGCGGTGCGGCGAGGAAATTGCGCAAATAGGACTGCGCCACCGGTGAGGCGTTGAACTGTGC
+GGCAGCCCCCGGATCCGTCGCGTTGAGCGCAGCTACTACCTGCCCGTAATTGCAGGTGGTGTTAATGACC
+GCGTCCACGGGATCTGCGGAGGCGACCCCGGCCCCGACGGTCAACGACATTGCCACGGCGCCTACACCGG
+CGCTCAATGCGGTCAACGACAGCCTCATTTATGGACACCTTCCCCAAACTATTGCACCGTCGTTAAGACG
+GCGACGACATCTGCCCAGCGGTTGCCGTCTGCGGTCGAGGGTACCAGGCGCCGTGGGCTTGCTTCTCTCA
+AACTGGTTATCGGGCGACACTGCGCGGCCATACCAATCTGCAGGTCAGCAGCGATGAAACAACGTTGTTT
+ACAGCCCGAGAAATGAGTTTATAGCCTGGCCGCAAGTTCGGTGCCTTGCTTGATGGCGCGCTTGGCGTCC
+AACTCGGCGGCAACCGCCGCGCCACCGCTGATGTGCGGGTTAATGCCGTGCCGGCGCAGTTCACTCTCCA
+GATCTCGCACCGGTTCCTGGCCGGCGCAGACCACTACGTTGTCCACCGCCAGCAGCTGGGGCCGCCTGCG
+CTTCGGGCCGAAGCTGATGTGTAGGCCGTCGTCGTTGATCTGTTCGTAGTTCACCCCAGACAGCTGATGA
+ACGCCCTTGGCCTTCAACGACGCCCGGTGGACCCATCCGGTGGTCTTGCCGAGCCGCTTGCCCTGCGGGC
+CTTTGGTGCGCTGCAGTAGGTACACCTCACGGGCGGGCGGCGCCGGCAGTGGAGTCGTCAACGCTCCGCG
+GGCTTCTCGCGGATCAGCGACCCCCCATTCGGCCTTCCACTCTTTGAGGTTGAGGGTGGGTGAGGAGTCG
+GTGACCAGCAGTTCGGTGACGTCGAAGCCAATGCCGCCGGCGCCGACGACAGCCACGGTTCGCCCGACCG
+GTCTGACACCGGTGATGGCTTCGGCGTAGGTTAACACCATGGGGTGGTCGATGCCGGGGATGGCCGGAAT
+GCGCGGTGCCACGCCGGTGGCCAAGACGACCTCGTCGTAGCCGGTCAACTCCTGGGCGGCCACCCGAGTG
+CCCAGTCGCACCTCGACACCGTGTTTGGCCAGAATCGTCGAGAAATACCGGATGGTTTCGCTGAATTCCT
+CTTTGCCGGGAATGCGGCGGGCCATGTCAAACTGTCCACCGATAAAGTCGTTGGCCTCGAACAGCGTGAC
+CCGGTGACCCCGTTGCGCGGCGTTGGCCGCCGTGGCCAGCCCGGCTGGTCCAGCCCCGACGACGGCCACC
+GAGCGGGCGCGCCGGGTCGGGGACAGCACCAACTGCGTCTCGCGCCCGGCGCGTGGATTGAGCAGACACG
+ACACCGTTTTCCTGGCAAATGCGTGGTCCAGGCAGGCTTGATTGCAGGAGATGCAGGTGTTGATTTCGTC
+GACCCGATTGGACTGCGCCTTGAGCACCCAGTCCGGGTCGCTCAGCATCGGCCGGGCCATTGATATCAGC
+CGCACCTGGGTTTCGGCCAGAATCCGTTCCGCGGCCTGCGGCATGTTGATCCGGTTGGACGCCACCACCG
+GGATAGTGACGTGTTCGGCGACGGCGCTGCTGATGTCGACAAACGCGCCGCCCGGCACTGAGGTGACGAT
+AGTGGGCACCCGGGCCTCGTGCCAGCCGAAGCCGGAGTTGATGATGGTTGCGCCTGCCCCTTCCACTTCG
+GTTGCCAGCGCGACGATTTCATCCCAACTCTGGCCTTCTGCAACGTAGTCGGCCATTGACAGCCGGTAAC
+AGATGATGAAGTCGGATCCGACGGCGGCGCGGCTGCGTCGGATGATCTCGACCGGGAACCGGCGACGGTT
+GGCCGGTGTGCCGCCCCACGAGTCGGTGCGCTTGTTGGTGCGCGGCGCCAGGAACTGATTGAGCAGATAC
+CCTTCGCTGCCCATGATTTCGACGCCGTCGTAGCCGGCATCGCGGGCCAACTGCGCGCAGCGGGCGAAAT
+CCGCGATGGTCGCTTCGACCCCGCGAGCCGATAGTGCTCGCGGACGAAACGGGGTGATCGGCGCCTTGAT
+CGGCGAGGCGCTGACCGCAAGTGGGTGGTAGGCGTAGCGTCCGGCGTGCAGGATTTGCAGCAGGATCTTT
+GCACCCGAATCGTGGACCGCCCTGTTGATTCGGCGGTGCCGTCGGGCTTGCGCCGAAGTGACGAGTTCGG
+AGGCGAACGGCAGCAGCCATCCGGTGCGGTTGGGCGCGTAGCCACCGGTGATGATCAGCCCGACGCCGCC
+GCGTGCACGTTCGGCGAAGTAGTCGGCGAGCCGATCGATATGGCGGGCCCGGTCTTCCAGTCCGGTGTGC
+ATCGAACCCATAACCACCCGGTTGCGCAGCGTGGTAAACCCAAGGTCCAACGGGGACAGCAGATTTGGGT
+ATGGATTTGTCATCGCTTCTCCTGGAGCGCTTCAGCTACTTCGTCGAGCCAATCGATGGCACTTTCTTCG
+GCTCGGATTCCGCCGCGCAGCACGAGGTATTGATGCAGTGCGGCGCCATCGAGCGCCGACGGATCTGCGA
+AGGTGCGCTTCTCGATACCGCGATAGGTGTCCAGTGACTTGACACGCTCGGCGCGCAGCGCGGTGACTTG
+GGTATACAGCGCGGCAACGTCTCCGTAGCCGGCGCCACGCAGCTTGACGGCGATATCGCGCGTGCTGCTG
+TCGGTCAGCGCACTGCCGCGGCCGGGCCTGGTCGGGCTGAGCGGCTCGGCGATCCAGCGAGCCAGCTCGG
+CCCGGCCGCTGTCGGAGATCGCGTATACCTTCTTGTCGGGCCGGCCATGCTGGAGCACGGTCGTCGCGCG
+CACCCAGTTGTTGTTCTCCATCACCCGTAACGTCCGATAGATCTGCTGATGGGTTGCGGTCCAGAAATAG
+CCGATGGAGCGATCGAATCGGCGGGCCAACTCGTAGCCCGAGCTGGCCTGTTCACACAGCGACACCAAGA
+TCGCGTGGGGTAGCGCCATCCGGGCAGCATAGACGGCAAGCCGGATTGCTATGCAACTAGGTGCATATTG
+ACCGTGTACGCCGACGCATGTGCCAAGTGGTCGACGTGTATGTGCAACGTCTAGTATCAGTAACCGAACG
+CATTGCCTCAGCAGGGCCCGGAGGAAGCCTTGGCGAGGTGGACAGCAGCCCACACATAGCGGTATCTGGA
+AGACATGTTGAGGAGACGTCCGTGACGTACACGATCGCCGAACCCTGTGTCGACATCAAGGACAAGGCAT
+GCATTGAGGAGTGCCCGGTCGATTGCATCTACGAGGGCGCCCGGATGCTGTATATCCACCCCGACGAATG
+CGTCGACTGTGGGGCTTGCGAGCCGGTCTGCCCCGTTGAAGCTATCTTCTACGAAGACGATGTGCCCGAA
+CAGTGGAGCCATTACACCCAGATCAACGCCGATTTCTTCGCCGAGCTGGGATCGCCGGGCGGTGCGGCCA
+AGGTTGGCATGACCGAGAACGACCCGCAAGCGGTCAAGGATCTGGCGCCGCAGAGCGAGGACGCCTGAGC
+CGGCTGGGGGCAGCACCCGCTCGCGGCGGAGTGTCGGCGTCTCTGCCCGTCTTCCCCTGGGACACCTTGG
+CCGACGCGAAAGCGCTGGCCGGGGCCCATCCGGATGGCATCGTCGACCTCTCCGTCGGCACTCCGGTCGA
+CCCGGTCGCACCGCTGATCCAGGAGGCGCTGGCGGCGGCCAGTGCCGCCCCTGGCTATCCGGCGACCGCC
+GGCACCGCACGGTTACGTGAGTCTGTGGTGGCAGCGCTGGCTCGCCGCTACGGCATCACCAGGCTGACCG
+AGGCGGCCGTGTTGCCGGTTATCGGCACCAAGGAACTCATCGCCTGGTTGCCGACGTTGTTGGGCCTGGG
+CGGTGCGGATCTGGTCGTCGTGCCCGAATTGGCATATCCGACTTATGACGTCGGCGCCCGCCTGGCCGGA
+ACGCGGGTGCTGCGTGCGGATGCGCTGACCCAGCTGGGTCCGCAATCCCCGGCACTGCTCTACCTGAACT
+CGCCGAGCAACCCGACCGGACGGGTGCTGGGTGTCGACCATTTGCGCAAGGTGGTCGAGTGGGCCCGGGG
+CAGAGGCGTTCTCGTGGTTTCCGACGAGTGCTACCTGGGATTGGGCTGGGACGCCGAACCGGTTTCGGTG
+CTACATCCCTCGGTGTGCGACGGCGACCACACCGGGTTGCTGGCTGTGCACTCACTATCGAAGAGCTCAT
+CGCTCGCCGGCTACCGAGCGGGTTTCGTCGTCGGTGACCTCGAGATCGTTGCCGAGCTACTAGCGGTGCG
+CAAACACGCCGGGATGATGGTGCCGGCGCCGGTACAGGCGGCTATGGTGGCCGCGCTGGACGACGACGCG
+CACGAAAGGCAACAGCGGGAGCGCTACGCACAACGGCGTGCCGCGCTGTTGCCGGCGCTGGGCTCCGCGG
+GTTTTGCGGTCGACTATTCGGACGCCGGATTGTATCTATGGGCCACTCGCGGCGAGCCGTGCCGCGACAG
+TGTCGCGTGGCTGGCGCAGCGGGGCATCCTGGTGGCACCGGGTGATTTCTACGGCCCGGGTGGGGCTCAG
+CACGTGCGGGTGGCGCTGACGGCCACCGACGAGCGGGTTGCGGCGGCGGTCGGACGGCTCACCTGTTAGC
+GCGAACAGACGCAACTTGCGGCCGGGTCACCGCCAGGTCGTGCGCAGCTGGGTTGTCACCGAGAGCGGGT
+TATCGCCGCGGAACAGATCGAGGATGGCTTGCCCTTGTGGGGAGTCTGCTGGCAGTTGTCGGGGTGGGCC
+GATGTGCTTTCGCCATGCCTGTGCCAGATGTTGCCGCCGATCCTTGTTTCGTGCGAACCAGCGGGGCACG
+GCGTGCCAGGCAACCGTGCCGGGCAGCGATAGCCCGACGACGGCACGAACCGCGAACAGCCTCCGGGCAA
+CGGGCCGGGCGGGCGGCGTGAGGATCTTGCGTCCGATGAGGTAGCGCGGTTCGGCAAGCGGCGCCAGTAG
+CTCGTCGAGGGCCGCGGTGAACCGCAGGGACTGCTCGGTGGGCACGCCGTCGAGTTGACACCGGATCCAG
+CCTTCGGGGTCGGAGGCCAACCGTAGTGCCGCGGATCCTCGCTGTGCGCCGCCCGCGGCGTACAGCGCAT
+CCGCGACGACGGCGGCCAGTTGCTCGAGCGCGTTGGGCGCGTGGTCCAGGCGGCGGCTTTCGGCCGCCGC
+AGCGGTTGCCACCAGGCCAACACCCGCCGCGACGATGGCGCCGGCCGTGCCGGCACCCGCCAGCATGCCG
+AGATTGGCGGAGGCAACTGCGGTGGCGGTGCTGGCGCCGACCACGGAAACGGCGGCCACGGCACCCCTTG
+CCAGGCGGACCGGACTGAACTGTCCCGGCACCGGTGGGGTCAATGCCGAGGCGGGGATGCGGGGTGCGGC
+GACCCCGAGCGGCTGGCGGGAGCGCACGCGGATGGTTGCGACGTCGACTCCTTCGTAGGGCTCGCCGATT
+CGCCACCAGGATCTCGCCTGGGCGCGTTCGGCGACGCGCTGCAGCGCTCGCGCCGTGATGGCGTGGGTAT
+CGGTGACCGGAGGACCGTACGGCGACAGCGACGGATCGCAGTGCGTCACACCCGATTCGATGAGCCCCTG
+CGGGGTTGCCGCGTAGTACCCGTCATGTTTGCGCACCAGGCGCAGGTAGTCGGCATCACCGCGCGGGTGT
+TCTGTGGCGATACAGCAGACCGACCAGTTGTCCGCCACCTTGTGACCGTCCGAGGGGTCGTTGCGGATGG
+CGCGGCCGCGCATCTGAGTGATCGCTGCCTGGGTGGTTGCGCTCGTCAGGTCGATATTGACGTTGACCGC
+CGCGCAGTCCCACCCTTCACCTAGTAGCGAACGGGTGCCGACCAGGACGCGGGCGCGGCCGGCCAGGAAG
+TATTCGGTAGCCAGCGCGACCCACGTACGTGGCGTGAAGCCGCCGGTGCCGCGCATGACCCGCAGACTAG
+GGTGGGCGTCAAGCGGCTCGGCGGTGACGAGCGCGCCGCGCTCGGCGCAGAAGGCGATCAGGTCATCTTC
+GATCGCGGCCGGGCAGGCGAAGGTTTGACCTGTTACCAGAAGGGCGTGCAGTGGGGTGCGGCGGCGGTGA
+TCCGACGCGGCGAGCATGGCGGCAACCAGCTGGGCCGAACCCGACTGCTCGCTGACGGGTGCGCCCTTCA
+GCGATGTGGGAAGGGCGCCGGTCATCGATTCGAAATCGCAGAGCACCAGCGCCCGCAACCGCGCCCCCAA
+GACGGCGTCCTCGGTGTCGAGGATGTGCGCGGTCGCGGCGATCTTGGATTCGGACAGCGCGCACAGTCTG
+TCTACTGGCGAGGTCGCGACGCGTACGCCGCGACTGGTCAGCCGGTAGCCCAGGCCGGGTAGCACCCGCT
+TGATCGCGGTCAGCGCGTGCGCGTCGCGCGGATCCGCGCTTTGTTGCAGGTGCCCGACGCTGAAGTCGGT
+CAATACGTTAACCCAGTCCTGGGCATCGGGCGCAATTCGGTGCTGCTCGCGCAGGCGCACGCCGTCGGGT
+AGTGGAATCAGGCCGTCGTAGGCGAAGCGCAGGCCGCTGCACGCGAGGTCGGGTTCGGCACGCTCGAACG
+TCGACCAGGCGATCTGATTGCCCTCGCGCGTCGCTCGATCCACGATCCGGGTGTGCAGCCACGCGGCCAA
+CGACATGCTGCCCACCTTTTGGTCGATGAGGGCCAGCATGAGGTCGGCGAAGCGCGCCCGGTGGGTGCCG
+ATCCAGGCCTGCTCTTCGGGCGTCGGTTGGGTCAGATAGACCAACTCTTGGTAGGGAGCCAGGTCGCCTT
+CCCTAACCAGAGCGGGTGTCGGGATCACGAAGTCGGCGGTGCCGAACAGCTCATCATGCAGGGTGTGCTG
+CCACGCGGTGAGCTCTGTGGCCGGGGTCGCCGTTAGACCGATCAGCGCGGTCTGCGCTCCGAGGACCGAC
+GCCAACGCACTGACCAGGGCGCCCCACGTAGCTAGCAGATGGTGGCACTCATCGAGCACCAGCGTCCACG
+GGCCTAGCGTCGCCGCCCGCTCGATCACCGCCCTCCCGTTGGGGTGCAGGAGATCCAGCAACGCTTGCTG
+GTCGCGGTTGCGCAGGACTTCCCGCCGGACTGTCGAATCGGTTTCGGCGTCGATGACGGCAAGCGACTGA
+TACGTCAGGACGTTCATCGCCGAGGCAAGGCCACGCTCGGTTCCACACTTCGATGCCGACCGGTCCGACG
+ACGGAAAACTGTTATCCCACGCGGCGGCCCACTGCGCCTGCACCGCCGTGTTGGGAACCAACACCAAACT
+CCGGCGCCCCAGCCGGCGCGCTGCTTCCAGGCCGATCATCGTCTTGCCCGCACCCGGCGGCAGCACCAGA
+TAGGCACGGTTGTCGCCGGCAGCGACGTCGGCGTCGAACGCGTCCAACGCTTGCTGTTGGTATACCCGCC
+AGTTGCCGGCAAAGGCCCGCGATTCCAGGTCGCGGTGAGGATCCACAAGGATTCACCCTAGCCAAGCACC
+CACGTTGGGCGCGAGCAGACGCAAAAGGCCCCGAATCCAACGGATTTCGGGGCCTTTTGCGTCTGCTCGC
+GCCCGTGCGGCTCGTGCGGATCACACGCGCGGTGCATGCTGCTGTGGCTGTCGAGCAGTGTTGCTACCTT
+AACTTTCCCAGGCCTACGACGTCTGGTAGCGGCATGGCAACGGCCTGTGAGTTGGCTGGATAATGTGTTC
+TTCGTCGTGCTGTGGCCTGCAGATTAACAAGTCCCACAACAGTTTTCCCGTTGTATCGGACCTTGCAGCA
+TGCGATGCTTTCGTCTTGAGCCACTACCATGAAGTTAGTACGCTAAACAATCCTGAGCCCGAATGTGTTG
+GTAAATGGGGTTTGGGAGCATTCACCCACGGCTGGTACAGGGGGACTGCGTAGTGCGCACCGCAACCGCC
+ACATCGGTCGCCGTTATCGGCATGGCTTGCCGGCTCCCGGGCGGCATCGATTCCCCACAACGCCTCTGGG
+AAGCGCTGTTACGCGGCGACGATTTGGTGGGTGAGATTCCCGCTGACCGGTGGGACGCGAACGTGTACTA
+CGACCCCGAACCTGGTGTCCCTGGTCGATCGGTATCGCGTTGGGGCGCCTTTCTGGACGACGTCGGCGGG
+TTTGACTGCGATTTCTTCGGCCTGACCGAGCGGGAGGCGACCGCGATCGACCCACAGCACCGCTTGCTGC
+TGGAAGTGTCGTGGGAGGCTATCGAGCACGCGGGTGTGGACCCGGCGACGCTCGCTGAATCACAAACAGG
+TGTCTTCGTAGGACTGACACACGGCGACTACGAGCTGCTGTCCGCGGATTGCGGCGCCGCGGAAGGACCG
+TACGGATTCACCGGCACCAGTAACAGTTTCGCGTCCGGGCGAGTGGCCTACACACTCGGACTGCATGGCC
+CCGCGGTCACGGTGGACACCGCGTGCTCGTCCGGGTTGACGGCTGTGCATCAAGCCTGCCGCAGCCTGGA
+TGACGGTGAAAGCGATCTCGCTCTTGCCGGTGGTGTGGTTGTCACGCTAGAACCGCGGAAGTCCGTCTCG
+GGTTCCCTGCAAGGCATGTTGTCGCCTACCGGGCGTTGCCATGCCTTCGACGAAGCAGCTGATGGCTTCG
+TGTCCGGTGAGGGGTGCGTGGTCCTGCTGCTGAAGCGGCTACCGGATGCGGTGCGCGACGGTGATCGTGT
+GCTGGCGATCGTTCGTGGCACCGCAGCCAACCAGGATGGCCGCACCGTGAATATCGCGGCGCCGTCGGCG
+CAGGCTCAGATCGCGGTGTATCAGCAAGCGTTGGCTGCAGCGGGCGTCGAAGCGTCGACGGTGGGGATGG
+TCGAAGCCCACGGCACCGGCACCCCCGTTGGAGATCCGGTCGAATACGCGAGCCTGGCCGCGGTGTACGG
+AACCGAGGGTCCGTGCGCGCTGACGTCGGTGAAAACAAACTTCGGTCACCTGCAGTCGGCATCGGGGCCC
+CTGGGGTTGATGAAGACAATCCTGGCGTTGCGGCATGGGGTTGTGCCGCAGAACCTGCACTTCTGCCGGC
+TGCCTGATCAGCTGGCTGAGATTGACACTGAACTCTTTGTGCCGCAAGCGAATACATCCTGGCCGGACAA
+CACCGGACAGCCACGTCGCGCTGCGGTTTCCTCGTATGGAATGTCGGGTACCAACGTGCATGCCATCTTG
+GAGCAAGCGCCGGTATCAGAACCAGCGGCTTCGGGACCTGAGCTCACTCCCGAAGCCGGTGGGCTGGCGT
+TGTTTCCGGTGTCGGCTACCTCGGCTGAGCAACTACACGTCACGGCCGCCCGGCTGGCGGATTGGGTCGA
+CCAGAACGGCAACGCGGGCAGTCGAGTTAGCATGCGGGACCTGGGCTACACGCTGTCCTGCCGCCGTGCA
+CACCGACCCGTCCGGACGGTTGTGACGGCGAGCAGTTTTGACGAGCTGAGCGCGGCGCTGCGGGACGTCG
+CTGGCGATCAGATTCCCTATCAGCCCGCAGTGGGGCACGACGACCGCGGGCCGGTGTGGGTGTTCTCCGG
+GCAAGGCTCTCAGTGGCCCGGGATGGGCACTGAACTGCTGGTAGCCGAACCGGTGTTCGCCGCCACCGTC
+GCGGCGATGGAGCCGGTGATCGCTAGGGAGTCAGGGTTTTCGGTGACCGAAGCGATGTCGGCGCCACAGA
+CGGTCAGCGGTATTGACCGGGTGCAGCCCACCATCTTCGCGGTGCAGGTCGCCCTGGCCGCGGCCCTGAA
+GTCGTATGGGGTACGTCCTGGTGCCATCATCGGGCACTCGCTCGGCGAGGCTGCGGCAGCCGTGGTCGCC
+GGAGCACTGTCGCTGCACGACGGATTGCGAGTCATCTGCCGGCGCTCGCGGCTGATGTCGCGCATCGCCG
+GTAGTGGCGCGATGGCATCGGTGGAACTGCCCGGCCAACAAGTGTTGTCAGAACTTGCGATTCGTGGGAT
+CTCCGACGTCGTGCTCTCGGTGGTTGCCTCTCCGACCTCAACCGTCGTCGGCGGCGCCACGCAGTCGATA
+CGTGACCTGGTGGCGGCCTGGGAGCAGCAGGATGTGCTGGCACGCGAGGTAGCTGTGGACGTCGCTTCAC
+ATACACCGCAGGTCGATCCCATCCTGGACGAGTTGCTCGAGGTCCTGGCCGAGGTCGATCCGACGGCGCC
+GGAAATTCCGTATTACTCCGCAACGTTGTGGGATCCGCGCGAGCGACCGTCGTTCACCGGCGAGTACTGG
+GTGGAAAACCTGCGGTACACGGTGCGATTCGCGGCGGCGGTACAGGCCGCGCTCAAGGACGGGTACCGAG
+TGTTCGGCGAGCTGGCTCCGCATCCGCTGCTCACCTACGCGGTCGAGCAGAACGCCGCCAGTCTCGACAT
+GCCGATCGCAACGCTTGCCGCGATGCGGCGCGGGGAACAGCTGCCGTTCGGGTTGCGCGGCTTCGTCGCC
+GACGTGCACAACGCCGGCGCCAAGGTGGACTTCTCTGTCCAGTACCCTGATGGGCGCTTGGTGGATGCGC
+CATTGCCGAGCTGGACGCACCGCACCCTGATGCTCAGCCGTGAGGATTCACACCGCTCGCACACCGGCGC
+GGTCCAGGCGGTTCATCCGCTGCTTGGGGCCCATGTGCACCTGTTGGAGGAACCGGAGCGTCACGTCTGG
+CAGGCCGGGGTTGGCACCGGGGCGCATCCGTGGCTCGGTGACCATCGGATACACAACGTGGCTGCGTTTC
+CCGGTGCGGCCTACTGTGAGATGGCATTGGCCGCGGCGCGCACCACTCTTGGCGAGCTGTCGGAGGTGCG
+CGACATCAAGTTCGAGCAGACGCTGTTGCTGGACGAGCAGACGGTGGTCTCATCGGCCGCGACGATCGCC
+GCGCCTGGGATCCTACAGTTCGCAGTCGAGAGTCATCAGGAAGGCGAGCCCGCACGGCGGGCCAGCGCGA
+TGCTGCACGCATTGGAGGAGATGCCGCAGCCGCCCGGGTACGACACGAACGCTCTGACCGCCGCCCATGA
+GTCCAGCATGAGCGGTGAGGAACTGCGAAAAATGTTTAACAGCTTAGGTATTCAGTATGGTCCGGCTTTT
+TCAGGCCTAGTTGCGGTGCACACGGCGCGCGGGGCCGTCACCACAGTGCTCGCCGAGGTCGCGCTGCCTG
+GAGCCATCCGATCTCAGCAGTCGGCATATGCCAGCCACCCGGCCCTGCTTGATGCGTGTTTCCAGTCGGT
+GCTTGTTCATCCCGAGGTCCAGAAGGCGACTGTCGGTGGTCTGATGCTGCCCGTGGGCGTGCGTAGGCTG
+CGCAACTATCACTCGACGCGCAGCGCGCACTACTGCCTCGCCCGGGTCACGTCATCGTCGCGAGCCGGCG
+AATGCGAAGCCGATCTCGACGTGTTCGACCAGGCCGGAACGGTACTTTTGACCGTCGAGGGATTACGGCT
+GGCCGCAGGGATTTCCGAACATGAACGCGCGAACCGGGTGTTCGACGAGCGATTGTTGACCATCGAGTGG
+GAGCGGGGTGAGCTGCCTGAGGTGCCGCAGATCGATGCGGGATCCTGGCTGCTGCTCAGTGCGTCCGAAG
+CTGATCCGCTGACCGCGCAACTCGCCGACGCGTTGAATGCCGTTGGTGCCCAGAGCACTAGCGTGGCTTC
+GGCGTCGGATGTCGCACAATTGCGTTCGCTGCTCGGAGGCAGGCTCACCGGTGTTGTCGTGGTGACTGGC
+CCGCCAACGGGTGGTTTGACACAGTGCGGCCGCGACTATGTGTCACAGCTGGTGGGTATTGCCCGCGAGC
+TCGCGGAGCTGCCCGGTGAGCCGCCGCGGCTGTTCGTGGTGACCAGGAGCGCGGCGAGCGTGCTGCCGAG
+CGATCTTGCCAACTTGGAACAGGCGGGATTGCGTGGACTGATGCGGGTGATCGATTCCGAGCATCCGCAC
+CTGGGTGCCACCGCAATCGACGTCGACAACGACGAGACCGTCGCTGCCCTGGTGGCCAGCCAACTACAGA
+GCGGGTCGCAGGAGGACGAAACCGCTTGGCGCAATGGCATTTGGTACACCGCCCGGCTGCGTCCCGGTCC
+GTTACGCCCGGCCGAACGGCGAACCGCCGTCGTCGAATACAGACGCGACGGTATGCGCCTGCAGATCCGC
+ACTCCCGGCGACCTCGAGTCGTTGGAGTTCGTCACATTCGACCGGGTCGCGCCGGGACCGGGCGAGATCG
+AGGTCGCGGTGACCGCATCGAGTGTCAACTTCGCCGACGTTCTGGTCGCTTTCGGGCGGTATCCCACCTT
+CGAGGGCTACCGACAGCAGTTGGGCATCGACTTCGCCGGTGTGGTGACCGCGGTCGGGCCGGATGTCACC
+GAGCATCGGATCGGTGATCACGTCGGCGGCATGTCCGCCAATGGCTGCTGGAGCACATTCGTCAGATGCG
+ATGCCCGGCTGGCGGTGACGCTCCCGCCCGAGCTGCCGGTGGCCGCCGCCGCCGCGGTACCGACCGCCTC
+CGCGACGGCTTGGTACGCCCTGCACGATCTGGCTCGCATCTGCTCGGACGACAAGGTGCTGATTCACTCG
+GGGACCGGTGGTGTCGGGCAGGCGGCGATCGCGATCGCACGGGCCGCCGGATGCGAGATCTTCGCCACCG
+CGGGCAGTGCCCAGCGGCGACAACTGCTGCACGACATGGGTGTCGAGCATGTCTACGACTCACGGAGCAC
+CGAGTTCGCCGAGCAGATCCGAGGCGACACCGATGGGTATGGTGTCGACGTCGTACTCAACTCGCTGCCC
+GGCGCCGCACAACGTGCTGGGATCGAATTGCTGGCCTTTGGCGGGCGATTCGTGGAGATCGGCAAACGTG
+ACATCTACGGCGACACTCGGCTCGGGTTGTTCCCGTTCCGCCGCAACCTGTCGCTGTATGCCGTCGACTT
+GGCGCTGCTGACACACAGCCACCCGCACACCGTCCGGCGCCTGCTGAAAACCGTCTACCAACACACGGTC
+GAGGGCACGCTGCCGGTGCCGCAGACCACGCACTATCCCATTCACGACGCTGCCGTTGCCATTCGTTTGG
+TCGGCGGAGCCGGGCACACCGGAAAAGTGGTGCTCGATGTGCCGCGTACCGGTGAAGGCGTGGCCGTGGT
+GCCCCCCGAACAGGTCCGCACGTCCCGGCCCGACGGCGCCTATCTCGTCACCGGTGGTTTGGGCGGCCTC
+GGCCTGTTCCTTGCCGGCGAGCTGGCGGCGGCGGGCTGCGGACGCATCGTGCTCAACTCCCGTTCGACGC
+CCAGCCCGCACGCCACCAGGGTCATCGAGCGGCTCCGCGCCGCCGGTGCTGATATCCAGGTGGAATGCGG
+TGACATCGCTGATGCCGCAACGGCCCACCGAGTGGTGGCGGTGGCCACCGCCTCGGGCTTGCCGGTGCGC
+GGCGTGCTGCACGCGGCGGCGGTGGTCGAGGACGCTACGTTGGCCAATGTCACCGACGAACTTATCGACC
+GCTGTTGGGCGCCGAAGGTACACGGCGCGTGGAACATTCATCGGGCCACCGCCGCGCAGCCACTGGAGTG
+GTTCTGCTTGTTCTCCTCGGCCGCGGCCTTGGTGGGCTCGCCGGGTCAAGGCGCATATGCGGCGGCCAAC
+AGCTGGTTGGACGCTTTTGCCCACTGGCGGCGGGCGCAGGGCCTTCCGGCTACCTCAATCGCCTGGGGAG
+CATGGGCCGAGATTGGCCGCGCTACCGCGCTGGCCGAAGGCACCGGCGCAGCGATCGCGCCCGCCGAGGG
+TGCTCGAGCCTTCCAGACGCTGCTTCGCTACGGCCGGGCGTACTCCGGCTATGCCCCGATCATGGGTACC
+CCATGGTTGACGGCCTTTGCGCAACGTAGCCGATTTGCCGAAGCGTTCCACGCCACGGGCCAAAATCAAC
+CGGCCACCGGGAAATTCCTCGCCGAACTGGGCAGCTTGCCCCGCGAAGAGTGGCCCCGCACAGTCAGGCG
+GTTGGTATCGGACCAGATCAGCCTGCTGCTGCGGCGAACCATTGATCCGGACCGGCCGCTGTCCGACTAT
+GGTTTGGATTCCTTGGGCAACTTGGAGTTGCGGACCCGCATCGAAACCGAAACGGGTATACGCGTCAGTC
+CCACAAAGATCACCACGGTTCGCGGCTTGGCCGAGCACGTGTGCGACGAGCTGGCAGCCGCCCAATCTGC
+GCCGGTCTGATGACGGCCCGGGTGAAGTCGTTGCGGAAGTTTGAGATCGAGCCGAGGAGGGCATGTTGCG
+GGTTGGACCGTTGACAATAGGCACGCTGGACGACTGGGCGCCGAGCACGGGTTCGACTGTGTCATGGCGA
+CCTTCGGCTGTCGCGCACACGAAAGCGTCGCAGGCGCCGATCAGCGATGTTCCGGTCAGTTATATGCAGG
+CGCAACATATTCGGGGCTATTGCGAGCAAAAGGCAAAGGGACTCGACTACTCGCGGTTGATGGTCGTCAG
+CTGCCAGCAGCCCGGCCAGTGCGATATCCGGGCGGCCAACTACGTGATCAACGCCCATCTCCGACGGCAC
+GATACCTATCGCAGCTGGTTCCAATACAACGGCAACGGACAAATAATCCGGCGTACGATCCAGGATCCCG
+CCGACATCGAGTTCGTACCAGTTCATCATGGTGAGCTCACGCTGCCGCAAATTCGCGAGATCGTGCAGAA
+CACGCCGGATCCCCTGCAATGGGGTTGTTTTCGGTTTGGGATCGTGCAAGGCTGCGACCATTTCACATTC
+TTTGCAAGTGTGGATCATGTGCATGTGGACGCGATGATCGTCGGTGTCACGCTCATGGAGTTCCACCTGA
+TGTACGCAGCGCTGGTGGGCGGCCATGCCCCTCTCGAGCTACCGCCGGCAGGCAGCTACGACGACTTCTG
+CCGCCGACAACACACGTTCAGCTCCACCCTCACGGTGGAGTCGCCCCAGGTTCGCGCCTGGACGAAGTTC
+GCCGAAGGTACTAACGGTAGCTTTCCTGATTTTCCACTCCCACTTGGTGACCCATCGAAACCCAGTGACG
+CGGATATTGTCACCGTGATGATGCTCGATGAAGAGCAGACGGCTCAATTCGAGTCCGTCTGCACGGCTGC
+CGGCGCTCGGTTCATCGGTGGCGTACTAGCCTGCTGCGGCCTGGCTGAACACGAGTTGACCGGTACGACA
+ACCTATTACGGACTAACGCCGCGCGACACGCGCCGCACTCCAGCGGATGCCATGACCCAAGGTTGGTTCA
+CCGGCCTAATTCCGATCACCGTCCCCATCGCCGGCTCGGCGTTCGGCGATGCCGCCCGAGCCGCGCAGAC
+CTCGTTCGACTCGGGCGTGAAGCTCGCCGAAGTACCCTACGACCGCGTCGTCGAATTGTCGTCCACGCTA
+ACCATGCCACGACCGAACTTTCCCGTCGTCAACTTCCTCGACGCAGGCGCGGCTCCGCTTTCGGTACTGC
+TCACCGCGGAGTTAACCGGTACGAACATAGGAGTGTACAGCGACGGTCGCTACTCTTATCAACTGTCCAT
+CTACGTCATCCGCGTCGAGCAGGGGACGGCAGTGGCGGTCATGTTCCCCGACAACCCGATCGCCCGGGAA
+TCGGTTGCCCGCTACCTGGCAACGCTGAAGTCTGTGTTCCAACGAGTCGCCGAGAGCGGGCAGCAGCAGA
+ATGTTGCCTGATTCATTCCCGGTGGTGAACCCATCTTCGCGCGGCTAGGTGAACTCGTCGCCCGGCGGCC
+TTGGGTTGTGGTCGGCTGTTGGGTCGCGCTCGCCCTGGTACTGCCGATGGCGGTGCCTTCACTGGCGGAG
+ATGGCTCAGCGACATCCCGTCGCGGTCCTGCCTGCCGACGCGCCCTCCAGCGTCGCTGTTCGCCAGATGG
+CCGAGGCGTTCCACGAATCCGGCTCCGAGAATATCTTGGTAGTGCTGCTCACCGACGAGAAAGGCTTGGG
+AGCGGCGGACGAAAACGTCTACCACACATTGGTGGATCGTCTGCGAAACGACGCTAAAGACGTCGTGATG
+CTGCAGGACTTCCTGACTACTCCGCCATTGCGTGAGGTGCTCGGTAGTAAAGATGGCAAGGCATGGATTC
+TGCCGATCGGTCTCGCGGGCGACCTGGGTACACCCAAGTCCTACCACGCTTACACCGACGTCGAACGCAT
+CGTGAAACGAACTGTGGCCGGAACCACGTTGACGGCAAACGTGACAGGACCCGCAGCCACGGTGGCAGAC
+CTGACCGACGCTGGGGCTCGGGATCGGGCTTCAATCGAGCTGGCGATCGCCGTGATGTTGCTAGTCATCT
+TGATGGTCATCTATCGCAACCCGGTTACCATGCTGTTGCCCCTGGTGACGATTGGCGCATCCTTGATGAC
+CGCGCAGGCGTTGGTTGCCGGCGTGTCGCTCGTCGGCGGTCTAGCCGTATCCAATCAAGCGATCGTGTTG
+CTCAGCGCAATGATCGCTGGTGCGGGAACGGATTACGCCGTTTTCCTAATCAGCCGCTATCACGAGTATG
+TGCGGCTCGGTGAGCATCCCGAGCGTGCCGTCCAGCGGGCGATGATGTCCGTCGGGAAGGTGATCGCCGC
+GTCCGCGGCAACGGTCGGAATCACCTTCCTCGGCATGAGATTCGCCAAACTCGGTGTGTTCTCAACGGTT
+GGCCCGGCTCTGGCGATCGGGATCGCGGTGTCGTTCTTGGCCGCGGTCACCCTGCTGCCCGCCATCCTGG
+TGCTGGCCTCACCGCGCGGGTGGGTCGCACCGCGCGGTGAACGCATGGCGACATTCTGGCGGCGGGCCGG
+AACGCGAATAGTGCGGCGGCCCAAAGCTTATCTAGGCGCCAGCTTGATTGGTCTGGTTGCATTGGCCAGC
+TGCGCGAGCCTGGCTCACTTCAACTACGACGACCGCAAACAATTGCCGCCTTCGGATCCGAGTTCGGTTG
+GGTACGCGGCAATGGAGCACCATTTCTCGGTGAATCAGACTATTCCTGAGTACTTGATCATCCACTCTGC
+ACACGACCTGCGAACCCCGCGCGGCCTTGCCGACCTGGAGCAGCTGGCGCAACGTGTGAGCCAGATCCCA
+GGCGTTGCCATGGTTCGCGGTGTGACCCGGCCAAACGGGGAAACCCTTGAACAGGCCCGGGCGACATACC
+AAGCCGGCCAAGTTGGCAACCGGCTGGGCGGCGCGTCGCGAATGATCGATGAGCGCACCGGCGACCTGAA
+TCGGCTGGCATCGGGTGCCAACCTGTTGGCCGACAATCTCGGTGACGTTCGCGGTCAAGTCAGCCGGGCC
+GTTGCGGGTGTCCGCAGCCTTGTCGACGCCCTCGCTTACATCCAGAACCAGTTCGGTGGCAACAAAACAT
+TCAACGAAATCGACAACGCTGCAAGGCTTGTCAGCAATATCCACGCGCTCGGTGACGCTCTGCAGGTAAA
+CTTTGACGGTATCGCCAACAGTTTCGATTGGCTTGACTCTGTTGTCGCCGCTTTGGATACCAGCCCGGTC
+TGTGACAGCAACCCTATGTGTGGCAACGCGCGCGTTCAGTTTCACAAGCTGCAAACCGCACGTGACAATG
+GCACTCTCGACAAGGTTGTCGGCCTGGCGCGTCAGCTGCAGTCCACGCGGTCACCGCAGACCGTGTCGGC
+GGTGGTGAACGATCTGGGGCGATCGCTGAATTCGGTAGTCCGCTCGCTGAAATCACTGGGGTTGGACAAT
+CCGGACGCCGCCCGGGCGCGCCTGATCAGCATGCAAAATGGAGCTAACGACCTCGCCAGCGCCGGTCGTC
+AGGTCGCAGACGGCGTCCAGATGCTGGTCGACCAGACCAAGAACATGGGCATCGGGCTGAACCAGGCGTC
+AGCCTTTCTGATGGCGATGGGCAACGATGCGTCGCAACCGTCGATGGCGGGTTTCAATGTCCCGCCGCAA
+GTGCTGAAGTCCGAGGAGTTCAAAAAAGTCGCCCAGGCGTTCATCTCGCCAGACGGGCATACCGTGCGGT
+ACTTCATTCAGACCGACCTCAACCCGTTCAGCACTGCGGCCATGGATCAGGTCAACACGATCATTGACAC
+AGCCAAAGGTGCACAGCCAAATACCTCCCTGGCTGACGCGTCGATATCAATGTCGGGTTACCCGGTCATG
+CTGAGGGACATCCGCGATTACTACGAGCGCGATATGCGGCTCATCGTCGCTGTGACCGTCGTCGTGGTGA
+TCCTGATCCTCATGGCACTGCTGCGTGCGATAGTGGCGCCGCTGTACCTGGTCGGTTCGGTGGTCATCTC
+GTACATGTCGGCGATCGGGCTTGGTGTGGTGGTGTTCCAGGTGTTCCTGGGGCAGGAATTGCACTGGAGT
+GTGCCCGGCCTAGCGTTTGTGGTGCTGGTCGCCGTGGGTGCGGACTACAACATGCTGCTGGCGTCGCGGT
+TGCGGGACGAGTCGGCATTGGGAGTGCGTTCCAGCGTGATTCGCACGGTGCGTTGCACGGGCGGAGTGAT
+CACGGCAGCGGGTCTGATATTTGCCGCTTCGATGTCCGGCCTGCTGTTCTCCAGCATCGGAACCGTCGTC
+CAAGGCGGCTTCATCATTGGGGTCGGGATCCTGATAGACACGTTCGTGGTGCGGACCATCACCGTGCCTG
+CCATGGCCACGCTGCTCGGACGCGCAAGTTGGTGGCCCGGACACCCTTGGCAGCGGTGCGCACCCGAAGA
+AGGCCAGATGTCAGCCCGGATGTCAGCGCGCACGAAGACGGTATTTCAAGCCGTGGCAGACGGATCAAAG
+CGGTAGTGTTTAGCCGCCGAAGGCGGGGGAGCCCAGTAAGCCACGGGCACCTTCCACGATCGAGCCCGGA
+GCGGTCAGCGGATCCAGGCCTCGCACCGGATCCACGGAGACCGGCCGGGTGAACCAATTGTCGTTGCGTG
+CATAGGCCGCGTCGATCTGTGGTTGCAGCACACTGTCGATTTGATCGACTTCGGCGTCGGACATGCCGAG
+GTAACGCAGCGGCAAGGTCAACGGGAGGTGGTTCACGGGGACCAGATACGTCGTCGTGGTAGCGCCTCGT
+GAGTTGACGGTGGTCCTGATGTTCTGCGGGGGTACGTCACCGGGTCCGGTGAACCCGATTGGGGTGTGCG
+CGATGGCAGCGCCGATGGCCGCATTGGCGACCGCTAACAGATTGTCCGGCCGGTCCGGGAAGTCGCTGAA
+GCCGTCGTATGCGGTGACGACATGGTTGGTGTCGTACTGGCTATCCACCTGCTGGGGCATCGTATATTCG
+ATGAAGGGAATCGGAATGTGGCTACCGGGGGGAAAAATTCGGGCCAGGAAGCTCGCTCCGAACGCATGAC
+GTCCGGTGGGGTCGCCGAACGTCGTGAACTGCAGCTTGTCCGGTGCAGGTGCCGTCGGGTCGTTGGCGAG
+CCGCGCCTGCTCCTGGTCGAGCACGAGGGAACCCTGGGATAGGCCGACGGCCGCGGCTGGATCGGTTCCG
+TGATGAATTGCGTTATCAAGGCTGTTTGTCCCATCTTTGACCGCCACGCCCACCGTCATGTTGTCTTGGT
+GGCTCCCTGGCGGCAAAAGCATGGTGGGCCACCAGCTGAAGGCCGCTCCGGCGGGATAGTCGATGAGATC
+GTGCTTTGCGTTTGGGAAATATTGAGAGCCAGCCTGGTTCGTGTACTCGTACCAGGGAATGCCCGGCATT
+CGCGCGCCCCCGAGGGCGTAGACGACTTTGGCGGTTGAAGCGTCGCCCACCGGAGAGGGGGACGGAGGTG
+GCCCAGGAGCCCACGGGTACGCGGGTTCGCTTGCCGCAATAGCGGTTCCGAATCCACCGGCCCAACCCAC
+GAGCCAGACCGCGAATGCTCCCGCAATCACTCGCTTCATCTGCCTCTGCATCGAGAATCGCGTGCGTGAA
+AGCATAGGAAAGCAGCTATCGTTCGGCGGTTTTCGGGCGGTTATGTCGCCATATCTTAGTCAGCCACGTC
+CCGGCCGACATTAAAGTTGGCAGCCAACAAGCTGTGAATCGCCCTGGGTCAGCCCCGACTAGCTCAGCCG
+TCCAACCGGGTGAATTGCTGCAGCCGGTATTGCTCTACACAGGCGGCCCTTCTGATCTTGCCGCTGGTTG
+TGGTGGGGATCGACCCGGGCGGGACCAAGACGAGGTCCGCCACGTTGAGACCGTGCGAGCGTGATATCGC
+GGCTGTGACGTTGTTCTTGATGACATCGAGTTCGTCCATCGCTTCGCCGGCGGAATCGCCGAGGAGCTTG
+AGCTCGATGACAGTGACTAACTTCTCTGTGTGATCGACCGGAACTGAAATCGCAGCGACCCGACCACCAG
+TGATCTCCTGGACGGTCGACTCGATGTCCTCGGGGTAGTGATTGCGCCCGTATACGATCAGCATGTCCTT
+CATACGGCCCACGATGAACATCTCGTCCTCGGAGAGGAATCCGAGGTCTCCCGTTCGCAACCAGGATCCA
+TCAGGAGTACCTGCCGAGGGGTGGACCAGCATTGCGCCAAAGGTGTGCCGTGTCTCGTCCGGTTTGTTCC
+AGTAGCCTTCGGCGACGTTGTCGCCCTTCACCCAGATCTCGCCGATCGTTCCCGCGGGGCACTCAATGCA
+GGTGTCGGGATCCACAATTCGCACTGTTGGTGATGTCGGCATGCCATAGCTCAGCAGCGGTGTGCCGGTC
+TTGGGTTCACATCGATTCGCACTGCCCGTGGACAGCTTGTCAGGTTCGAAGTAGACGACTTCTGGCTTGT
+CACCCGAATTGCGGCTGGCCACATAAAGAGTCGCTTCCGCCAGACCGTACGAAGGCCGTATCATGTCTTC
+GCGGAAATTGTACGGTGCAAACCGGTTGCAGAATCTACTGAGCGTGTTGGGGTGGACTCGTTCAGCACCA
+CTGGTGATGCCCAGGACGTTGCCGAGGTCGAGGCCTTCTATGTCGGCATCTGTTGTCTTGCGGACGGCCA
+ATTCGAAGGCGAAATTCGGTGCGGCCGACCACGAAGGACTTCCGTTGGCCAGCGAATGTAGCCAACGCGC
+TGGCCGTTGCAGGAACGCCAGCGGGCTAGTGAGTTCACTGCGGTAGCCGCCCAGGATCGGTGCGATGATG
+CCAAGGACCAAGCCCATGTCGTGGTAGAACGGCAGCCACGACACGATGGTAGTGTCAGGTGGCGCCACAC
+CGTTGCGGTCGCCGAAGTAGTTCGACATCAGCTGTTGGAAATTCGCCTGAAGGTTCCGATGCGAGATCAT
+GACCCCAGCCGGAGCGCGGGTGGAGCCAGAGGTGTACTGCAAGTACGCGGCGCTTGGCAGATCCTTCACC
+CGAAAGCTCGGTGAATTCCCGGTCAAGTCCAATGAATCGATTTCGATGATCGGCCCTACGTTGTTCGTGT
+TCGGCCGGTGGATGTGCTCGGCAACCGCTTCTGCGACCGCAGATGTTGTCAGGATGACCGAAGGTGACGC
+GTCGGCAAGCACCGCGCTGACACGTTCGTCGTGAGAGCCGATCTGCGGGACTGACAACGGAACCGCTATC
+GCTCCGGCCTGCATCGAACCTAGGAAAGCCGCGATGTAGGCCAGGCCCTGCGGAGCCAGAATCACGGCTC
+GGTCTCCGGTCGTGCAATGCCGCCTGACTTCGTGAGCAACGATGCGGGTCCGTCGAAACACCTCTGACCA
+CGTGAGCGTCTCGGTGATGCCGGCCCAATCCTGTTCGTAGTCGATGTACGTGAACGCGGCGTCGTCGGGC
+TGCAGGCCGGCACGCTCGCGCAGCAAGGACAAGACAGAAGAGTCGGACATTGGTGCTACATTACCGTTTC
+GCGCGATCTCCGATAACCCAAGCGGGCAGGGGGATGGTTGGCGATAGCGATGCTGATCATAACGTTCTGC
+AATGCTGTGCATGTGCTGAAACAGGTTGACGCAGAGTCGAAGTCGGTGTACGCAGGGGCGCCGTGAGGGG
+CGTCACGGTCGAGTTGCTAAGCCGTGCGTTCCATGGCCCGCAGCCCCAGCGAAAAGAGCAGCCGCACATC
+CGGATCGCCCAGCGAGGTCGACAACAGCTGCTCGATCCGCCTTATCCGGTAGCGAACGGTGTTGGGATGC
+ACTTGCAGTGACCGTGCGGCGGCGCCGATGTCGCCGAAGGCATCCAGGTAGGCACGCAGGGTCTGAGCCA
+GCACCGGATCCTGGGCGCCCAGGTCACGTATCCGAGGATCGACGAGCCGCTGGTCGGTGCCGACCAGGGT
+GACGATTTCGTCGAGCAGAACGGTGGTGCGTGCCTCGGCCAGCGATGTCACCTGCCCCAAGATCGGGTGG
+CGCTCGGCACTCTCGAGTACCCGATCCACCTCGACGCGTGCCGGGTTGACTTCGGCAAGTCCCGCGACCG
+GCCCCGCGATGGCTGCCCGTAGTGCTACTCCCAGCTCGGCGCGCAGTGCGCTGATTGTGCCGCGGACCCA
+CGAGGTGACAGCTCGGCCGGTCGTGGTTTGGGGCAGCAGCACATAGATCCGTGAGCCGTTGGCGGCAACC
+TGAGCGTCGTGGCGAAAAGCGCTGGCGCTCAATGCCATGACGTCAACAAGCCGAACATGGCGGACTGCGG
+TATCGCGGTTTTCCGCGGTGTCGAAACCGATCAGCGTTGCGTTGCCCTCGGCGGCGACGCCGAGTTCACG
+GGCGATGGTCGATACGTCGACGGGTGCTGTGGTTGCGTTCAGCTCGGCCAGGCCCAGTAGTTGCTGTACC
+CGCAGCGCGTGCGTATTGGGCTGGGTCGCCAGTCGCGACATGATCCGGGCGGCCAGCACCGCAGCACCCC
+GCAACATCTCCTCGGCATCGTCGGCCAACGGCTGCGAGCCTTGCTGGACCCAGATCGTGCCGGCGAACAC
+CGGTGGCCGCAGCGCACCGACCCCCGGCTGATGAATCCCGATGGCTAGCCGAGGACGCAACCCCAGCTCG
+GGGCGCTCGGCCACCCGCACCACCTCACGGCCGGCCCGCAGGGCATCGAAGATGCCCCATTGACCTATCC
+ACTGCAGATGCTCGGGCGGGCCGGCGCGGCCCAGGATGGACAGCCGACGCAGCTCGTCGGCCTCGTCGTT
+GGAGGCCGAGTAGGCGAGCACGTGCGACTGGGCGTCCTCGATGCTGATCATGCCGTGGATGCGGTCGGCC
+AGGGACTGTGCCAACCCGAACAGGTCGGTTCCGGAATCGTCGGTGGGGTCGGCCCGGTCACCATGATGCT
+CCAAGACATGATTCACCAAGTGGTACAGCCGTTCCCAGCGGGCCCGCGGCTCCACGGCTACCACCGCCGA
+GCCGGCGCGGACGGCCCCGGCCACCACCGAGTCCGACGGGTGCTTGACGAAGATCGCCACCGGCGCCCGT
+TGGCGTGCCTGATCGTCGACCCAGCGCACCGCCTCGTCGTCGGTGACCCCGATCAGGAAGAACACATCGG
+CCGAGCCCGCCGCGGCCGCCAGGCCCAGCCGCACGTCGTCGGAATCGATCAGCGCCGTCGACGCCACCGG
+CAGGTCCAGGCCGCGCGGGGCGTCCACCAGGCTGACCACGGTCGCATCCAGCGCCAGGAGCAACTGGCCG
+AGCCCCACGCCGGCGATCCGCATGTTGTCCGATCCTACTAGCAAGTCCGCCAGATCTTGTCTGATCGGCC
+AAACATTTGCGATGCCTGGGCGGGGATGCTGGCAGGCATGGACGCGATCACCCAGGTGCCGGTTCCGGCC
+AACGAGCCGGTGCACGACTATGCGCCGAAATCCCCGGAACGGACCCGGCTGCGCACCGAACTGGCCTCCC
+TGGCCGATCACCCCATCGACCTGCCGCACGTCATCGGCGGCCGACACCGGATGGGCGACGGCGAGCGAAT
+CGACGTCGTGCAGCCGCACCGGCACGCCGCCAGGCTGGGCACCCTGACCAACGCCACCCACGCCGACGCC
+GCGGCCGCCGTCGAAGCCGCCATGTCTGCCAAAAGTGACTGGGCGGCACTGCCGTTCGATGAACGTGCCG
+CGGTGTTCCTGCGCGCCGCCGATCTGTTGGCCGGGCCGTGGCGGGAAAAGATCGCCGCCGCAACCATGCT
+CGGCCAATCCAAGTCGGTGTACCAGGCCGAGATCGACGCGGTCTGCGAGCTGATCGACTTCTGGCGGTTC
+AACGTCGCTTTCGCCCGACAGATTTTGGAGCAGCAGCCGATCAGTGGCCCGGGGGAATGGAACCGGATCG
+ACTACCGCCCGCTGGACGGTTTCGTCTACGCGATCACGCCGTTCAACTTCACCTCGATCGCCGGCAATCT
+GCCGACCGCCCCGGCTCTGATGGGCAACACCGTGATCTGGAAGCCGTCGATCACCCAGACGCTGGCGGCC
+TATCTGACCATGCAACTGCTCGAGGCCGCCGGGTTGCCGCCCGGGGTGATCAACCTGGTCACTGGCGACG
+GATTCGCGGTTTCCGATGTGGCACTGGCCGATCCACGGCTGGCCGGCATCCACTTCACCGGGTCGACGGC
+TACCTTCGGCCACCTATGGCAGTGGGTGGGTACCAATATCGGCCGCTACCATAGCTATCCGCGACTGGTC
+GGCGAGACCGGGGGCAAGGACTTCGTGGTGGCGCACGCCTCGGCCCGCCCGGATGTGCTGCGCACGGCCC
+TGATTCGCGGAGCATTCGATTACCAGGGCCAGAAGTGCTCGGCGGTGTCGCGAGCGTTTATCGCGCATTC
+GGTGTGGCAGCGGATGGGCGATGAGTTGCTGGCCAAAGCCGCCGAGCTGCGCTACGGTGACATCACCGAC
+CTGTCCAACTACGGTGGTGCGCTGATCGACCAGCGCGCCTTCGTCAAGAACGTCGACGCCATCGAACGGG
+CCAAAGGCGCGGCCGCGGTCACCGTCGCCGTCGGCGGCGAATACGACGACAGCGAAGGCTATTTCGTGCG
+CCCCACGGTGTTGCTCTCCGACGACCCGACCGACGAGTCGTTTGTCATCGAGTACTTCGGTCCGCTGCTG
+TCGGTGCATGTCTACCCCGACGAGCGCTACGAGCAGATCCTCGACGTCATCGACACCGGATCCCGCTACG
+CGCTGACCGGCGCGGTCATCGCCGACGACCGGCAGGCCGTGCTGACCGCGCTGGATCGGCTGCGGTTCGC
+GGCGGGGAACTTCTATGTCAACGACAAGCCGACGGGGGCGGTGGTGGGGCGTCAGCCGTTCGGCGGTGCA
+CGCGGATCGGGCACCAACGACAAGGCCGGTTCGCCGTTGAACCTGCTGCGGTGGACGTCGGCGCGCAGCA
+TCAAGGAGACGTTCGTCGCGGCCACCGACCACATCTACCCGCACATGGCGGTCGACTGATGGCCGGCTGG
+TTCGCGCACACGCTGCGCCCGGCAATGCTTGCCGCCGGCCGCTCGGATCGGCTGGGCCGCATCGTCGAGC
+GCTCGCCGCTCACCCGCGGGGTGGTGCGCCGGTTCGTGCCCGGCGACACGCTCGACGACGTGGTGGATAT
+CGTTACCGCGCTGCGGGATTCGGGCCGCTACCTCAGCATCGACTACCTGGGCGAGAACGTCACCGATGCC
+GACGACGCTGCCGCCGCCGTGCGGGCGTACCTGGGGCTCTTGGACGTGCTGGGCCGCCGCGGCGATATCG
+CATGCGACGGGGTGCGACCGCTCGAGGTGTCGCTCAAGCTGTCGGCGCTCGGGCAGGCCCTCGATCGCGA
+CGGCCAGAAGATCGCGCTGGACAACGCCCGCGCCATCTGTGAGCGGGCCGAGCGGGTGGGCGCCTGGGTC
+ACGGTGGACGCCGAAGACCACACCACCACCGATTCCACATTGTCGATATCGGGCGATTTGCGCGTCGACT
+TTCCTTGGCTGGGCACGGTTGTGCAGGCCTATCTGCGGCGCACGCTGGCCGATTGCGCGGAGTTGGCGGC
+CGTGGGCGCCCGAGTCCGGTTGTGCAAGGGCGCCTATGACGAACCCGCATCGGTGGCCTACCGAGACGCC
+GCGCAGGTCACCGACTCCTATCTGCGGTGCCTTCGGGTATTGACGGCGGGGCGAGGCTATCCGATGGTGG
+CCACCCACGACCCGGTGATCATCGCGGCGGTACCGGGGATCACGCGCGAATCAGGGCGTAGTCAAGGTGA
+TTTCGAATACCAGATGCTCTACGGCGTCCGCGACGACGAACAACGACGACTGACCGGCGCCGGTAACCAC
+GTGCGGGTGTATGTGCCCTTCGGCACCCGGTGGTACGGGTATTTCCTGCGGCGGCTGGCCGAACGCCCGG
+CCAACCTGGCGTTCTTCCTGCGGGCGCTGACCGACCGCCGACGCGCGCGGGGGTGCGCCGAGCGCTGAAA
+TCGCCGGTTGCTGTCACATTCGGCGGGGCTGTCTCGTCCTTGATGTTATGAATTCCAGCATGGGTCGGCG
+GGAGGACACATGTCGCAACACGACCCGGTAAGTGCGGCCTGGCGGGCGCATCGGGCCTACCTGGTGGACC
+TCGCGTTTCGTATGGTAGGTGACATCGGCGTGGCCGAAGACATGGTGCAAGAGGCATTTTCCCGCTTGCT
+GCGGGCTCCGGTCGGCGACATCGACGACGAGCGTGGCTGGCTGATCGTGGTCACCAGCCGGCTGTGCCTG
+GATCACATCAAGTCGGCGTCGACACGCCGGGAGCGCCCGCAGGACATCGCCGCATGGCACGACGGTGACG
+CCAGCGTGTCATCGGTTGACCCGGCTGACCGGGTGACTCTCGACGACGAGGTCCGGCTGGCTTTGCTGAT
+CATGCTCGAGCGCCTCGGCCCCGCGGAGCGGGTGGTGTTCGTGCTGCACGAGATCTTTGGGCTGCCCTAC
+CAGCAAATCGCCACGACGATTGGCAGCCAGGCCTCCACATGCCGGCAGCTGGCTCATCGGGCCCGTCGCA
+AGATCAACGAATCGCGCATTGCGGCCAGCGTGGAGCCAGCCCAGCATCGCGTCGTCACCAGAGCTTTCAT
+CGAAGCCTGCTCCAACGGAGACCTGGACACCCTGCTCGAGGTGCTGGATCCGGGTGTCGCCGGCGAGATC
+GACGCCCGCAAAGGCGTTGTCGTCGTGGGCGCGGATCGGGTTGGCCCGACCATCCTGCGCCACTGGAGTC
+ACCCCGCCACCGTCCTGGTAGCCCAGCCGGTGTGCGGTCAACCGGCGGTGCTGGCCTTTGTCAACCGAGC
+GCTTGCCGGCGTGTTGGCCCTGTCGATCGAGGCCGGCAAGATCACAAAAATCCATGTCTTAGTGCAGCCT
+TCAACATTGGACCCGTTACGGGCCGAACTCGGCGGCGGTTAGTTAGGTATCGGAGGTATGACCATGAAAT
+CACTTGCCGCGCTTGACCGGCCGAGCTGGTTGTCATCGTCGGCGTGGCCCTGGCAGCCCTACCTGCTGAG
+CCACCATCAGGGCGGCATCGCGGTTACCGATATCGGCGACGGGCCGGCGGTGCTGTTCGTTCACGTCGGC
+AGCTGGAGCTTTGTCTGGCGTGACGTGTTGTTGCGTCTAGCCAACGATTTTCGGTGTGTTGCCATCGACG
+CACCGGGTTGTGGGCTCAGCGACCGGCTCTCAACCCCGCCAACACTTGCCCAGGCGGCCGATGCAATCAC
+CTCGGTCATTGATGCGCTGCAGTTACGTGACCTCACCCTGGTAGCCCACGACCTGGGCGGCCCGGCCGGC
+TTCCTGGCCGCCGCCCGTCGCGGCGACCGCGTCGCGGCACTGGCCGCGGTCAACTGCTTCGCATGGCGGC
+CCACGGGTCCGCTGTTCCGGGGCATGCTCGCGGCGATGGGCAGCGCCCCCGTGCGTGAACTGGACGCGGC
+CATCAATGCGCTTGCCCGCGCGACGTCGACGCGGTTCGGGGCCGGTCGGCACTGGAGCCGCGCAGACCGC
+GCGGCTTTTCGGGCGGGAATCGATGCGCCGGCCCGCAGGGCGTGGCATGCCTACTTCCGCGATGCGCGCC
+GTGCCCATGCCCTCTATACCGACGTCGACGCCGCGTTGCGGGGGGGTCTGGCCGATCGGCCACTGCTGAC
+CATCTTCGGTCAGTTCAACGATCCGCTGCGGTTTCAGCCGCGCTGGAAAGAGTTGTTTCCGACGGCACGC
+CAACTGCAGGTCCGCCGGGGCAACCACTTTCCCATGTGTGACGACCCAGACTTGGTGGCCGGGGCACTCA
+CGTCTTTCGTGCAACGGTCAACGTGAGCCGCCGACTGCCGTCACACCTGGTACACCTTGCGGTTTGCCGC
+CGCGCCGCCACATGCCAAGCTACTCGCCATGGCCGTCGCTATTGCCCGTCCGAAATTGGAAGGAAACATC
+GCCGTCGGCGAGGACCGCCGGATCGGCTTCGCCGAGTTCGGCGCCCCGCAGGGTCGTGCGGTCTTCTGGC
+TGCATGGCACCCCAGGGGCCCGGCGGCAGATCCCGACCGAAGCCCGGGTCTACGCCGAGCACCACAATAT
+TCGTCTGATTGGCGTCGATCGGCCCGGCATCGGCGCCTCGACGCCGCATCAGTACGAAACCATCTTGGCG
+TTCGCCGACGATCTGCGGACCATCGCCGACACGCTCGGCATCGACAAGATGGCCGTGGTGGGCCTGTCGG
+GCGGGGGCCCATACACCCTGGCGTGCGCCGCCGGGCTGCCCGACCGGGTGGTCGCCGCCGGTGTCCTCGG
+CGGCGTCGCGCCGACGCGCGGCCCGGACGCGATTAGCGGCGGTTTGATGCGCCTTGGTTCGGCGGTGGCG
+CCGCTGCTGCAGGTGGGCGGCACCCCGCTGCGGCTGGGTGCGAGCTTGCTGATCCGGGCGGCCCGGCCCG
+TCGCGTCCCCTGCCCTCGACCTGTATGGCCTGCTCTCACCGCGGGCCGACCGGCATTTGCTGGCTCGGCC
+CGAGTTCAAGGCGATGTTCCTCGACGATCTGCTCAACGGTAGTCGCAAGCAGCTCGCTGCGCCGTTCGCC
+GATGTCATCGCCTTTGCCCGCGACTGGGGATTCCGGCTGGACGAGGTGAAAGTCCCCGTCCGCTGGTGGC
+ACGGAGACCACGACCACATCGTCCCGTTCTCCCACGGGGAACACGTCGTATCCCGGCTTCCCGACGCGAA
+GTTGTTGCACTTGCCCGGCGAAAGTCATCTCGCTGGGCTTGGCCGTGGTGAAGAGATTTTGAGCACCCTG
+ATGCAGATTTGGGACCGCGACCTGCGGAAATGATCGGGCGTGTGACCGAGCTCGCATGGGCGGGCCGCAC
+TGCTTTGCATCGCCATTTGTGCCTATTGACGGCCTTAATATGACATGCTGTTGCCTGTGTTAGAGCCCGC
+TGACCGCCCCTGTGATGCCCCCGGATGGTTTCTCTACCTCACCGACATACCGCGCGCGGGTGTCGAGTAC
+GGGCAATTGCTCGCCGTGCTGCCGCTGCAGCGGATGCTGCCGGCCGGCGACGGACATCCGGTACTGGTGC
+TACCTGGCCTGCTGGCCGGCGACGGTTCCACCTGGATCCTGCGACGGATCTTGCGTCGCCTCGGGTACGC
+GGCCTACGGCTGGGGGCTCGGCCGCAACATCGGGCCGACGGCCAAAGCGGTATCCGGGATGCGGGACCTC
+CTCGACAAGCTCCACTCCCGGTACCACACCCCGGTGAGCCTGATTGGGTGGAGCCTGGGTGGCATCTTCG
+CGCGCGGCCTCGCCCGCGACCATCCGTCGGCGGTGCGCCAGGTGATCACACTGGGCAGCCCGTTTGGCAT
+GAGGGACACCTGTGAGACGCGCTCCGCGTGGAGCTTCAACCGGTATGCGCATCTGCACACCGAGCGGCAC
+GAGTTGCCGCTGGAAATGGAAAGTGAACCTTTGCCGGTGCCGACCACCGCGATCTACTCGCGCTGCGACG
+GCATGGTCGCCTGGCAGACGTGCATGAATTCGCCATCGGAGCGCGCGGAAAACATCGCGGTGCGCAGCAG
+CCACATCGGCTACGGCCACAATCCGCCGGTGGTGTGGGCCATCGCCGACCGGCTGGCACAGCCCCAGGGT
+GCATGGGCGCCGTTTCGGCCGCCGAAGGTGTTGAGCCCGCTGTTTCCGCGACCGGATACACCGGCAGAGG
+CGGTCAGCACCCCCCAGACGCGACCGGCCTGACGGGGCAGGCGATCACGGCGCCGGGGTAGCCTCGCTCA
+CGTGCTGCTGGCCTCCCTGAATCCTGCTGTCGTCTCCGCCGCCGATATCGCGGACGCGGTCCGCATCGAC
+GGCGACGTGCTGAGCCGTAGCGACCTGGTCGGCGCGGCAACGTCGGTGGCCGAGCGGGTCGCCGGTGCGC
+ACCGGGTCGCCGTGCTGGCCACGCCGACCGCGTCGACGGTGCTGGCGATCACCGGCTGCCTGATCGCCGG
+CGTGCCGGTTGTGCCGGTACCCGCCGATGTGGGCGTCACCGAACGCCGGCACATGCTCACCGACTCCGGC
+GTCCAGGCATGGCTGGGCCCGTTGCCCGACGACCCAGCGGGGCTGCCACACATCCCGGTGCGCACGCACG
+CGCGGTCCTGGCACCGTTATCCGGAGCCCTCACCCGGGGCCATCGCCATGGTGGTCTACACGTCCGGCAC
+CACCGGGCCGCCCAAAGGCGTGCAGCTGAGCCGGCGGGCGATCGCCGCCGACCTCGATGCATTGGCAGAG
+GCCTGGCAGTGGACGGCCGAGGACGTGCTGGTCCACGGTCTGCCGCTGTATCACGTTCACGGCCTGGTGC
+TGGGCTTGCTCGGGTCGCTGCGGTTCGGAAATCGCTTCGTGCACACCGGTAAACCAACGCCGGCCGGCTA
+CGCCCAGGCCTGTTATGAAGCGCACGGCACGTTGTTTTTTGGGGTGCCGACGGTGTGGTCACGAGTGGCG
+GCCGACCAAGCTGCCGCCGGGGCGCTCAAACCGGCGCGGCTGCTGGTGTCCGGGAGTGCGGCACTACCCG
+TGCCGGTGTTCGACAAGCTGGTGCAGCTCACCGGGCACCGGCCCGTCGAACGCTACGGTGCTTCGGAGTC
+GCTGATCACCCTATCGACGCGGGCTGACGGTGAGCGTCGCCCGGGCTGGGTCGGCCTGCCGCTGGCCGGT
+GTGCAGACCCGACTGGTGGACGACGATGGCGGTGAGGTCCCGCACGACGGGGAAACCGTTGGAAAGCTTC
+AGGTTCGCGGTCCGACCCTGTTCGACGGCTACCTGAATCAACCCGATGCCACCGCCGCGGCGTTCGACGC
+CGACAGCTGGTACCGCACCGGCGACGTCGCGGTGGTCGACGGCAGTGGGATGCACCGCATCGTGGGACGC
+GAGTCGGTCGACTTGATCAAGTCGGGTGGATACCGGGTCGGCGCCGGTGAAATTGAAACGGTGCTGCTCG
+GGCATCCGGACGTGGCGGAGGCGGCAGTCGTCGGGGTGCCCGACGATGATCTAGGCCAGCGGATCGTTGC
+CTACGTAGTCGGCTCAGCGAATGTCGATGCGGACGGGCTTATCAACTTTGTTGCCCAACAACTTTCGGTG
+CACAAGCGCCCGCGCGAGGTGCGTATCGTAGATGCGCTGCCGCGCAACGCGTTGGGGAAAGTGCTCAAGA
+AGCAGTTGCTGTCAGAAGGCTGAGCTACGGCGAATTATCGTGTACCGCTGGACAGTTACGCTGGCACACT
+GTTACTCCGACGGCCCGGTGAGCTTAGCGCATGGGCCTTGTTGCCGCGCCACTGTAGGGCTTCCAGGGCG
+ACGGCCACATGGACGGAGGTGTGGTCGAGCGGTCGCGGTAGCAGCCGCTGAGCGGACTCGAGTCTGCGCA
+GAAATGTATTGCGGTGAGTGTGGAGACGTTTTGCGGCCCGGGAGGCGTTGCACTGCTCGTTGATGAAGGT
+CAGCAGGGCCGTTTGTAGATCTGGGCTGGCAGACTCGAGGTCTCCAAGCGTACTCGTGATGAATTCGCTT
+GCAGCATCTGGATTTTGGCTGATCAATGCGACCATCTTAACGTCGGCAAAGAAGGCGACCCGCTGGGTCG
+ACCGTAGCCGTGACAAGGTGCGCTGGGTGATGAGCGCTTCGAGGTGGCTGCGCCGGAACCCCTCCACCCC
+GTTGGCGGTGGTCCCGATGGCGATGCGCGCCCCGGGTGCGTTGTCCACCGCCGCCTGCACTGTGTCGATG
+TCGAGTCCGTCGGCGTCGGTCACCCACGCCCAGCGGCTCGCCGCCCCGGCGACCACCGTCAGCGGTCGTG
+TCGATCCCACGGCGTGGCAGAACAGATCAGCCGCCCGGTCGAGGTAGCTGTGGTCACCGTCGAGCTCGTC
+GCTCCAGATGATGGCAGCGGTATGGGCACGACTCAGCGGGTAGCCCAATTTCGCTTCGGCCCGTTCGGGG
+CTGATAGGGGCGCCATCGAGAATCAGCCCGACGACCTCGAGGCGTTCGGCATGGGTGCTGCGGGTCAGTT
+CGTCGTGTTCCGACTGCACTTGCGCGGCGATACCGGTCAGCGTGGCCTCGATGAAGTCGTTGACGGAGCG
+GGCCGACACGTCTAGCAGCTCGCGCAGCTCTTGGGGGTCGGAAGTGAGTTCGAACGCAATCCCCATCCAG
+AACCGCCACCCGATGTGCTCACCGGTTCGATAGATGTTGAACGCTACTGTGTCCAGCCCCCGGCGCACCA
+GGTCTCGGGCCATCCGCAGTGGCTCGGTGCCGAGATTGGCGGGCACCCGAGCACCAGGGTCACGCAGGTT
+GGCCGCAGCCCAGTACACCAGGTTGGCGCGATTGGCCGTCTGGACAACCTTCGCAAGCACCGGATCGTTG
+GCGATCGCCGGATTGGCCGCAATCGTGGCACGGTCCAGTTCCTCGATCCACTCCGGGCTGGGATTGAGGG
+CGATGCGTGCTCCCTCGCGGATCAGCTCACGAATTCGCGGCGAAGGTTGTTGCCATGCCACGCGCCGATC
+TTAGGGCCAGCGGGTGCAATTTGCACACTATGTTGGCACTATTGTGCCGGATTCACACTGCACGGCCGGT
+GTGTGCGCGAAATCACGGTGTGGGTCTGCTGGATGAGTCGACCGTGTTGAACAACTTGCGACACACCGCA
+ATTTGCGAAATCCGCCACCGACCGGGCATAGTAACCCAGCTAGTCGTCGTTGTCGCGTCGAACCACATGG
+TGAACTGTGCGGCGGGTGCATTTTGCACATCAAGTGGGCGCTGATTGGGAAGATTTACCCTTCGGCGGCG
+GCGGTAGGTGCAGATTGCACTTTGGCTCCTGCTGATTGAAATTTTTTGACCTGTTGCGGTCCTTGCGGGC
+TCGCCATCATTGGCGGCAGTTCGTCACCGACGAATCGGGGCCAAGGACGTAGGCGACCAGTTCGCTTGAC
+TGCTAACCGCTCCTGATCGTACCCGTGCGAGTGCTCGGGCCGTTTGAGGATGGAGTGCACGTGTCTTTCG
+TGATGGCATACCCAGAGATGTTGGCGGCGGCGGCTGACACCCTGCAGAGCATCGGTGCTACCACTGTGGC
+TAGCAATGCCGCTGCGGCGGCCCCGACGACTGGGGTGGTGCCCCCCGCTGCCGATGAGGTGTCGGCGCTG
+ACTGCGGCGCACTTCGCCGCACATGCGGCGATGTATCAGTCCGTGAGCGCTCGGGCTGCTGCGATTCATG
+ACCAGTTCGTGGCCACCCTTGCCAGCAGCGCCAGCTCGTATGCGGCCACTGAAGTCGCCAATGCGGCGGC
+GGCCAGCTAAGCCAGGAACAGTCGGCACGAGAAACCACGAGAAATAGGGACACGTAATGGTGGATTTCGG
+GGCGTTACCACCGGAGATCAACTCCGCGAGGATGTACGCCGGCCCGGGTTCGGCCTCGCTGGTGGCCGCG
+GCTCAGATGTGGGACAGCGTGGCGAGTGACCTGTTTTCGGCCGCGTCGGCGTTTCAGTCGGTGGTCTGGG
+GTCTGACGGTGGGGTCGTGGATAGGTTCGTCGGCGGGTCTGATGGTGGCGGCGGCCTCGCCGTATGTGGC
+GTGGATGAGCGTCACCGCGGGGCAGGCCGAGCTGACCGCCGCCCAGGTCCGGGTTGCTGCGGCGGCCTAC
+GAGACGGCGTATGGGCTGACGGTGCCCCCGCCGGTGATCGCCGAGAACCGTGCTGAACTGATGATTCTGA
+TAGCGACCAACCTCTTGGGGCAAAACACCCCGGCGATCGCGGTCAACGAGGCCGAATACGGCGAGATGTG
+GGCCCAAGACGCCGCCGCGATGTTTGGCTACGCCGCGGCGACGGCGACGGCGACGGCGACGTTGCTGCCG
+TTCGAGGAGGCGCCGGAGATGACCAGCGCGGGTGGGCTCCTCGAGCAGGCCGCCGCGGTCGAGGAGGCCT
+CCGACACCGCCGCGGCGAACCAGTTGATGAACAATGTGCCCCAGGCGCTGCAACAGCTGGCCCAGCCCAC
+GCAGGGCACCACGCCTTCTTCCAAGCTGGGTGGCCTGTGGAAGACGGTCTCGCCGCATCTGTCGCCGATC
+AGCAACATGGTGTCGATGGCCAACAACCACGTGTCGATGACCAACTCGGGTGTGTCGATGACCAACACCT
+TGAGCTCGATGTTGAAGGGCTTTGCTCCGGCGGCGGCTCAGGCCGTGGAAACCGCGGCGCAAAACGGGGT
+CCGGGCGATGAGCTCGCTGGGCAGCTCGCTGGGTTCTTCGGGTCTGGGCGGTGGGGTGGCCGCCAACTTG
+GGTCGGGCGGCCTCGGTCGGTTCGTTGTCGGTGCCGCAGGCCTGGGCCGCGGCCAACCAGGCAGTCACCC
+CGGCGGCGCGGGCGCTGCCGCTGACCAGCCTGACCAGCGCCGCGGAAAGAGGGCCCGGGCAGATGCTGGG
+CGGGCTGCCGGTGGGGCAGATGGGCGCCAGGGCCGGTGGTGGGCTCAGTGGTGTGCTGCGTGTTCCGCCG
+CGACCCTATGTGATGCCGCATTCTCCGGCGGCCGGCTAGGAGAGGGGGCGCAGACTGTCGTTATTTGACC
+AGTGATCGGCGGTCTCGGTGTTTCCGCGGCCGGCTATGACAACAGTCAATGTGCATGACAAGTTACAGGT
+ATTAGGTCCAGGTTTAACAAGGAGACAGGCAACATGGCCTCGCGTTTTATGACGGATCCGCACGCGATGC
+GGGACATGGCGGGCCGTTTTGAGGTGCACGCCCAGACGGTGGAGGACGAGGCTCGCCGGATGTGGGCGTC
+CGCGCAAAACATCTCGGGCGCGGGCTGGAGTGGCATGGCCGAGGCGACCTCGCTAGACACCATGACCCAG
+ATGAATCAGGCGTTTCGCAACATCGTGAACATGCTGCACGGGGTGCGTGACGGGCTGGTTCGCGACGCCA
+ACAACTACGAGCAGCAAGAGCAGGCCTCCCAGCAGATCCTCAGCAGCTAACGTCAGCCGCTGCAGCACAA
+TACTTTTACAAGCGAAGGAGAACAGGTTCGATGACCATCAACTATCAATTCGGGGATGTCGACGATCATG
+GCGCCATGATCCGCGCTCAGGCCGGGTTGCTGGAGGCCGAGCATCAGGCCATCATTCGTGATGTGTTGAC
+CGCGAGTGACTTTTGGGGCGGCGCCGGTTCGGCGGCCTGCCAGGGGTTCATTACCCAGTTGGGCCGTAAC
+TTCCAGGTGATCTACGAGCAGGCTAACGCCCACGGGCAGAAGGTGCAGGCTGCCGGCAACAACATGGCGC
+AAACCGACAGCGCCGTCGGCTCCAGCTGGGCCTGACACCAGGCCAAGGCCAGGGACGTGGTGTACGAGTG
+AAGGTTCCTCGCGTGATCCTTCGGGTGGCAGTCTAGGTGGTCAGTGCTGGGGTGTTGGTGGTTTGCTGCT
+TGGCGGGTTCTTCGGTGCTGGTCAGTGCTGCTCGGGCTCGGGTGAGGACCTCGAGGCCCAGGTAGCGCCG
+TCCTTCGATCCATTCGTCGTGTTGTTCGGCGAGGACGGCTCCGACGAGGCGGATGATCGAGGCGCGGTCG
+GGGAAGATGCCCACGACGTCGGTTCGGCGTCGTACCTCTCGGTTGAGGCGTTCCTGGGGGTTGTTGGACC
+AGATTTGGCGCCAGATCTGCTTGGGGAAGGCGGTGAACGCCAGCAGGTCGGTGCGGGCGGTGTCGAGGTG
+CTCGGCCACCGCGGGGAGTTTGTCGGTCAGAGCGTCGAGTACCCGATCATATTGGGCAACAACTGATTCG
+GCGTCGGGCTGGTCGTAGATGGAGTGCAGCAGGGTGCGCACCCACGGCCAGGAGGGCTTCGGGGTGGCTG
+CCATCAGATTGGCTGCGTAGTGGGTTCTGCAGCGCTGCCAGGCCGCTGCGGGCAGGGTGGCGCCGATCGC
+GGCCACCAGGCCGGCGTGGGCGTCGCTGGTGACCAGCGCGACCCCGGACAGGCCGCGGGCGACCAGGTCG
+CGGAAGAACGCCAGCCAGCCGGCCCCGTCCTCGGCGGAGGTGACCTGGATGCCCAGGATCTCTCGGTAGC
+CCTCGGCGTTGACGCCGGTGGCGATCAAGGTGTGCACTCCGACGACGCGGCCTGCCTCGCGCACCTTGAG
+CACCAGGGCGTCGGCGGCGAGGAAGGTATACGGGCCGGCATCGAGCGGGCGGGTCCGAAACGCCTCTACG
+GCTTCGTCGAGCTCTTTGGCCATGATCGACACTTGCGACTTGGAAAGCTTTGTCACACCAAGTGTTTCGA
+CCAGGCGCTCCATCCGGCGAGTGGATACTCCCAGCAGGTAGCAGGTCGCCACCACGCTGGTCAGTGCGCG
+TTCAGCTCGCTTGCGGCGCTGCAGCAGCCAGTCCGGGAAATAGCTGCCCTGGCGCAGCTTGGGGATCGCG
+ACGTCGATGGTTGCGGCACGGGTGTCGAAATCACGGTGGCGGTAGCCGTTGCGCTGATTGGACCGCTCAT
+CGCTGCGTTCGCGGTAGCCCGCCCCGCACAGAGCGTCGGCTTCAGCCCCCATCAAGGCGGCGATGAACGT
+CGAGAGCAGCCCGCGCAGCAGATCCGGGCTCGCCTGTGCGAGTTGGTCAGCCAGAAGCTGCTCGGTGTCG
+ATAAGATGAGAAGAGGTCATTGCGTCATTTCCTTCGATTGACTTTTGCTGGTCGTTTCGAAGGATCACGC
+GATGACCGCCCACTACTGGGCTACGACACGCCCACCGGCCTTACCTGCCCGTACACCACACCCCTGGACG
+TAACTTGACACCAATCCACAGCACCGAGCAGTGACAGAAGGTGCCCCAAGGTGTGGTGAAACTCGCTGGA
+CGGTCCCCAGGATGTTGGCAGCACATTCACCGGACATGACCGGAGCAAGACCGGACATCCTCCCATACCG
+TCGTCGCCGTGTACATCCGTAGCCCGTCCTGGCAGGTGCTGGGTTGACCAAAATCAGCCCAACACCTGCC
+ACGACGATGAAGCGGGTTGCGCTGGCATGTCTTGTCGGCTCGGCGATCGAATTCTACGACTTCCTTATCT
+ACGGCACCGCTGCGGCGCTGGTGTTTCCCACCGTGTTCTTCCCACACCTGGATCCCACGGTGGCCGCCGT
+GGCCTCGATGGGGACATTTGCTGTGGCGTTCCTATCCCGGCCGTTCGGCGCGGCCGTCTTTGGATACTTT
+GGAGACCGCCTCGGCCGCAAGAAGACCCTGGTCGCCACACTGTTGATCATGGGCCTGGCAACCGTGACTG
+TCGGGCTGGTTCCAACGACAGTGGCCATCGGCGCCGCGGCCCCACTGATCCTGACGACCATGCGGCTGCT
+GCAAGGGTTCGCGGTCGGCGGCGAGTGGGCCGGTTCGGCGCTGCTGAGCGCCGAGTACGCGCCCGCCAGC
+AAACGTGGCTGGTACGGGATGTTCACCGTTGTGGGTGGCGGCATCGCGCTGGTACTGACCAGCCTGACCT
+TTCTGGGCGTGAACTACACCATTGGCGAAAGCAGCCCCACATTCATGCAGTGGGGGTGGCGCATACCGTT
+TCTGGTCAGTGCGGCGCTGATCGCCGTCGCCCTATACGTGCGGTTCAACATCGACGAGACCCCGGTGTTC
+GCCCGGGAAAGGGCAGACGAAAAAACCCGTTTGGGCCCAGCCGAAACGCCGATTGCCCAAGTACTGCGGC
+GGCAGCGGCGAGAGATAGTCTTGGCCGCCGGCAGCGCCGTTTGCTGCTTCGGCTTCGTCTACCTGGCCAG
+CACTTACTTGGCCAGCTACGCTCAAACCCGACTGGGGTATTCGCGCGGCAGCATCCTGTTCGACAGTGTG
+CTGGGTGGACTGCTGTGCATCGTGTTCACCGCGCTTTCTTCCGCTCTTTGCGACCAACTCGGGCGCCGCC
+GCGTCCTATTGGCCGGGTGGGCGGTGGCTCTACCCTGGTCGCTGTTGGTCATGCCGCTGATCGACTCCGG
+CAGCCCCAGTTTGTTCGCGGTGGCTGTCGTCGGCATGTATGCCATCGGCGGATTCGGTTTCGGACCCACG
+GCATCGTTCATCCCAGAACTGTTTGCTACTAGCTACCGATACACGGGCAGCGCGCTCGCGGCGAATCTCG
+CTGGGGTTGCCGGCGGCGCGCTACCGCCGGTGATTGCCGGCGCGCTGGTGGCAACCTATGGCAGCTGGGC
+GATCGGTGTCATGCTGGCCATCCTCGCGTTGATCAGCCTGGTATGCACCTATCGGTTGCCCGAAACCGCC
+GGATCGGCCCTCGTCAGCCGCTAGTTGGCGTGCAGGTCCTCGTTGAGGGCAATGCCCTGACCGTCGCGGG
+CCAGCACTTCGACCGCCCCGCTGACGGAATTGCGGCGAAACAGCAGGTTGCTGCTCCCGGAGAGCTCACG
+CGCCTTGACCGAATTGCTGTCGGGCATGGTGACCCTCGTGCCGGCGGTCACGTACAGCCCGGCCTCCACC
+ACGCAGTCGTCGCCCAGTGAGATGCCCAGACCGGAGTTGGCGCCGAGCAGACAACGCTTGCCGATCGAAA
+TGACGTGTGTTCCACCGCCAGACAGCGTGCCCATGATCGACGCTCCGCCGCCGACATCGGAGCCGTCGCC
+CACCACCACACCCGCCGAGATGCGGCCTTCCACCATCGAGGCGCCCAGGGTGCCGGCGTTGTAGTTGACG
+AAGCCCTCATGCATCACGGTGGTGCCCGGCGCCAGGTGAGCGCCCAACCGCACGCGGTCGGCATCGGCGA
+TACGTACGCCGGTGGGCACGACGTAGTCGACCATCCGGGGAAACTTGTCGACGCCGTACACAGTCACCGG
+TCCGCGGCGGCGCAGCCGCGCCCGCACCGCCTCGAAACCGTCTATGGCGCAGGGTCCGTGATTGGTCCAC
+ACCACATTGGTCAGCACCCCAAACAAGCCGCCGGCGTTCAACCCATGGGGCGCCACCAGGCGGTGCGACA
+AGAGGTGAAGCCGCAGGTAAGCATCGTATGGGTCAGCGGCGACATCGTCGAGCGAGCCGATGACCGTACG
+GACCGCGATGGTCTCGGTGCGGCGGTCGTCATCGCGGCCGATCAGCGCGGCCAGCTCGACAGGAACGTCG
+GACACCGCCAGTCGTGACGTCGCGCTGGTGCCCGATTCGGTCAGTTCCGGCGCGGGAAACCAGGTGTCGA
+GGACCGATCCGTCAGCGGCGAGGGTAGCCAGGCCGATGCCTGCTGCTCCAGTCACGGTCGACACGCTACT
+TGTGCCGCCGAACAGACACAAAACCACCCTATTTCGACCAGAATCGGGTGCTTTTGCGTCTGCTCGGCCA
+ACTAAGCTAGCGCCGTGCTGGATTTGCGCGGGGACCCGATCGAATTGACCGCGGCGCTGATTGACATCCC
+CAGCGAGTCGAGGAAGGAGGCACGCATCGCCGACGAGGTGGAAGCGGCGTTGCGCGCTCAGGCATCGGGG
+TTCGAGATCATCCGCAACGGCAACGCGGTGCTGGCGCGTACAAAGCTGAACCGGTCCTCGCGGGTGCTGT
+TGGCCGGACACCTGGACACCGTGCCAGTGGCCGGCAACCTGCCTAGCCGCCGCGAGAACGACCAGCTGCA
+CGGCTGCGGCGCAGCCGACATGAAATCCGGCGACGCGGTCTTCCTTCATCTGGCCGCTACACTGGCCGAA
+CCGACGCACGATCTAACACTGGTGTTCTACGACTGCGAGGAAATCGATTCGGCGGCAAACGGTTTAGGCC
+GCATCCAGCGCGAGCTGCCGGACTGGCTATCCGCGGATGTAGCCATCTTGGGTGAGCCCACCGCCGGCTG
+CATCGAGGCTGGTTGCCAGGGCACGTTGCGTGTCGTCCTCAGCGTGACCGGAACTCGCGCGCATTCAGCG
+CGTTCGTGGTTGGGTGACAACGCAATCCACAAGTTGGGTGCTGTGCTGGACCGGTTGGCCGTCTACCGGG
+CACGCAGCGTCGACATCGACGGTTGCACCTATCGGGAGGGCCTCTCGGCGGTGCGCGTAGCAGGCGGCGT
+CGCCGGCAACGTGATCCCTGACGCGGCCTCGGTCACGATCAACTACCGCTTTGCCCCCGACCGGTCGGTG
+GCCGCGGCATTGCAACATGTCCATGACGTGTTCGACGGGCTCGACGTGCAGATCGAGCAGACGGACGCCG
+CGGCCGGTGCGCTGCCTGGCCTGTCCGAGCCCGCGGCCAAGGCGCTGGTCGAGGCCGCCGGCGGGCAGGT
+CCGGGCCAAGTATGGCTGGACTGATGTGTCGCGCTTTGCCGCTTTGGGCATACCGGCGGTCAATTACGGC
+CCGGGTGATCCCAACCTGGCGCACTGCCGCGACGAACGGGTGCCCGTCGGCAACATCACCGCGGCCGTGG
+ACTTGCTGCGCCGATACCTGGGTGGCTAGCGCTGCTGTGGCCCCAAGCGTGCTGCCGCCTTGGTCGCGTC
+GGCTGCCGCGGCTGCCATCCCGATCCCGGCCAGCTCCTCAGCCACCGCGGTCAGCTCGGCAGCATCTCCG
+TCGGCCAGGCCACGGGCGTGCTTGACGAGGATATTTCCTACGGTGCAGTCGATTTCGGCGGCGAGGCGAG
+TCACCGGGTCCACCGCACGGATGTCGCCCAACCGAACCGCGTTATGCCAGGCGCATAGGGCCACCGCCGC
+CTGCCCGGCCCGCTCAGCCGTCCGGGCGGCCTCCCGGGCCGCCGCGATGGCCCCTGTCATGTCCTGGGCC
+GCCGCCCTGGTCCAGGCCCTGGCCAGCCCGAGCTCGGGTGCGAACAACGCGGACTTCGTTCCGTGCCGAG
+CTTCAGCGCGCTGCAGTGTTTTTGCAGACTCGGCGATATGGCCTTGCTGCGCGATGGCCGTTGCCAACAA
+CATCAGCGACAGCGGACCCCACGAGTAGCCGGTTCGTTCCAGTGTGGCGGCGGCCGGCTCCAGCATCGAT
+GCCGCGGCGCCGAATTCGCCTTTGGTGATCAGTACGTACGCCAACAACACTTCACCGATGGACCGGCCAG
+GTTGCTGCAGCTAGGCGAAGTCGGTGAACCGCTTGGCCAGCTCCTGAGCCGGCGCGACGTCGCCTGCCAG
+CAGCAGCGACGTGATCTGAGCCAGGCCCACGGTGAACCGCAGCAGCCCCGGATGTTCGGCGGCCGACGCC
+CGTTCGGCCAGCCGGTCAACGTCGCCGAACCGGCCCATTCGTGCCGATGATAACGCGGCAGCGCTGGCGG
+CCCAGGCCACGGCCATGTCGTCGGCAGCCGGTCCGGATAGCACCTCGGTGGCCAGCGTGATGGCCCGCGG
+CAAGTTTCCGGAGTTCATCGCAAACGTGGCCGCCAGCGCATCCAGGGTGCTGCGGGCCGTGGGCTCGGTC
+ACTCGGCTGCGGGTCGTCTGCAGAAACGCCGTGGCGCGCTCGGGCTCGTTGAGCATCCAGAACCGATTCG
+CCGCCCGGGGTATCGCCCAGGCCATCAGCTCGGTCTCGGTCAATTCGGCGGGATTCACCGCCGCCAGCAC
+CGCGTCAGCTTCGCGACCGCGACCCTGCCAACCGAGTGCGTAAGCCAAGGGCAGGCGTGCCGCCAGGGCG
+TCCGACCTATCCAGCGCTGCCCGCGCCAACCGTTCGGCAAGCCGGACGTCGCCGAGCCGCAGGGCCTGCC
+CGGCTGCGGTCGCCGCATCCGTGACCGCGGCCGGGGTAGCACTGGCGGGGACGTCGATGGCCAGTGAGGA
+CAGCCGTAACTGATCGCTGACATGGTCGGATGGGTGCTTGGCCAGCTGCGCGACCAGCGACACGCGCAAT
+GCATGCGCGTGCTCGGCCGTCAATACGGCGCGTGCGCGGTCGGCGTACAGCGGATGGCCGACAAAAATCT
+CGCTGGTATCGCTGTCGGGACCCACCCGCACCGCGCCGGCGGCTTCGGCTTGGCCGAGCGTGTCCAACTG
+CTCGCCACCGACCAGGGCCACCAGGTCGGTGCGCGCCAACGGTTCGGCGATGGCGAGGTAGTCGACAACG
+GCGCGGGCCGGTTCCGGCAGGGCGCACAGGTACTCGTCGATCACGCCGGACAGCGGCCGACGATCCTCGT
+CTCGACAGCGCCACCGGCCGTCCACGTGTTCGAGACCACCGCCGTCGATGAGGTGGCGCAGATACAACGG
+GTTGCCAAGGCTGCGCCGAAAGAGCTCGTCGGCGTCGGCGACGTCCAGTGTCGCGTCCAGCGCCGACTCC
+ACGAACGCCGCGGTTTGGGCCCTGTCGAGCGGCTCGATGGCGACCCGGGTGAGCAGGTCATCGGACCAGA
+GCGCAGCTATAGCGTCCGGTGGCTCGGCCTCCGAGGCGACGGTGACCACCAGCCGCGCCGCCCCGGCCCG
+CGCCAGCTGGTACACCAAGGTGGCCGACAGCGGATCCAGGTTGTGCGCGTCGTCGACCACCAGCAGCAGA
+TCGCCAGCATCACCGGTCAGGGAACTACGCGCCGCCCGCAGCAGCGCCGCGGGCCGCCCAATGTCGGCTC
+CGGAGGCGGGCAGGCTGATCAAATGGCGGAAAGCGCCGAACGGGATGGCCCGCCCTGGAGCGGTTCCCAC
+CACCCAGCGAGCCCGGCCGCTCCTGCCGTCCTCGGACATGACCTGCTCGGCAGCCAGTTGCGCCAGCAGC
+GTCTTGCCGACGCCGTGTGGCCCGACCAGCACCACCCCGCACCGATCCGGACTGTCGACGGCCGCCTCCA
+CGTGTTTCCAGACGCGCATCGCCGGATTTTATGGCGGTTGCGCCCAACGACATTCGAGCGGGGGATAGGC
+CAAAAATGTACGCGGTTCACATCGGTGGTCTACGTTCTGGTGTATGTCGGCGAAAATCGACATTACCGGT
+GATTGGACTGTGGCCGTGTATTGCGCGGCCTCGCCAACGCACGCGGAGTTGCTAGAGCTGGCCGCCGAAG
+TCGGCGCGGCAATCGCCGGACGTGGCTGGACGCTGGTGTGGGGAGGTGGCCATGTTTCGGCGATGGGGGC
+TGTCGCCTCGGCGGCGCGAGCCTGCGGCGGCTGGACCGTCGGCGTGATTCCCAAGATGCTGGTGTACCGC
+GAACTGGCTGATCACGACGCCGACGAGCTAATCGTCACCGACACCATGTGGGAGCGCAAGCAGATTATGG
+AAGATCGCTCAGATGCGTTCATCGTGTTGCCGGGCGGTGTCGGCACCCTAGACGAGCTGTTTGACGCATG
+GACCGACGGGTATCTCGGTACCCATGACAAACCCATTGTGATGGTAGATCCCTGGGGGCATTTCGATGGA
+CTGCGGGCATGGCTGAACGGATTGCTCGACACCGGTTACGTCTCACCCACGGCGATGGAACGGCTGGTGG
+TAGTCGATAACGTCAAGGACGCTCTGCGGGCCTGCGCACCTTCCTGAGGTTGGTCGACAACCAATTCGAC
+ATTTCGCAAACGAATCGAGGGCTTACGTGTCCGATTACTACGGCGGCGCACACACAACGGTCAGGCTGAT
+CGACCTGGCAACTCGGATGCCGCGAGTGTTGGCGGACACGCCGGTGATTGTGCGTGGGGCAATGACCGGG
+CTGCTGGCCCGGCCGAATTCCAAGGCGTCGATCGGCACGGTGTTCCAGGACCGGGCCGCTCGCTACGGTG
+ACCGAGTCTTCCTGAAATTCGGCGATCAGCAGCTGACCTACCGCGACGCTAACGCCACCGCCAACCGGTA
+CGCCGCGGTGTTGGCCGCCCGCGGCGTCGGCCCCGGCGACGTCGTTGGCATCATGTTGCGTAACTCACCC
+AGCACAGTCTTGGCGATGCTGGCCACGGTCAAGTGCGGCGCTATCGCCGGCATGCTCAACTACCACCAGC
+GCGGCGAGGTGTTGGCGCACAGCCTGGGTCTGCTGGACGCGAAGGTACTGATCGCAGAGTCCGACTTGGT
+CAGCGCCGTCGCCGAATGCGGCGCCTCGCGCGGCCGGGTAGCGGGCGACGTGCTGACCGTCGAGGACGTG
+GAGCGATTCGCCACAACGGCGCCCGCCACCAACCCGGCGTCGGCGTCGGCGGTGCAAGCCAAAGACACCG
+CGTTCTACATCTTCACCTCGGGCACCACCGGATTTCCCAAGGCCAGTGTCATGACGCATCATCGGTGGCT
+GCGGGCGCTGGCCGTCTTCGGAGGGATGGGGCTGCGGCTGAAGGGTTCCGACACGCTCTACAGCTGCCTG
+CCGCTGTACCACAACAACGCGTTAACGGTCGCGGTGTCGTCGGTGATCAATTCTGGGGCGACCCTGGCGC
+TGGGTAAGTCGTTTTCGGCGTCGCGGTTCTGGGATGAGGTGATTGCCAACCGGGCGACGGCGTTCGTCTA
+CATCGGCGAAATCTGCCGTTATCTGCTCAACCAGCCGGCCAAGCCGACCGACCGTGCCCACCAGGTGCGG
+GTGATCTGCGGTAACGGGCTGCGGCCGGAGATCTGGGATGAGTTCACCACCCGCTTCGGGGTCGCGCGGG
+TGTGCGAGTTCTACGCCGCCAGCGAAGGCAACTCGGCCTTTATCAACATCTTCAACGTGCCCAGGACCGC
+CGGGGTATCGCCGATGCCGCTTGCCTTTGTGGAATACGACCTGGACACCGGCGATCCGCTGCGGGATGCG
+AGCGGGCGAGTGCGTCGGGTACCCGACGGTGAACCCGGCCTGTTGCTTAGCCGGGTCAACCGGCTGCAGC
+CGTTCGACGGCTACACCGACCCGGTTGCCAGCGAAAAGAAGTTGGTGCGCAACGCTTTTCGAGATGGCGA
+CTGTTGGTTCAACACCGGTGACGTGATGAGCCCGCAGGGCATGGGCCATGCCGCCTTCGTCGATCGGCTG
+GGCGACACCTTCCGCTGGAAGGGCGAGAATGTCGCCACCACTCAGGTCGAAGCGGCACTGGCCTCCGACC
+AGACCGTCGAGGAGTGCACGGTCTACGGCGTCCAGATTCCGCGCACCGGCGGGCGCGCCGGAATGGCCGC
+GATCACACTGCGCGCTGGCGCCGAATTCGACGGCCAGGCGCTGGCCCGAACGGTTTACGGTCACTTGCCC
+GGCTATGCACTTCCGCTCTTTGTTCGGGTAGTGGGGTCGCTGGCGCACACCACGACGTTCAAGAGTCGCA
+AGGTGGAGTTGCGCAACCAGGCCTATGGCGCCGACATCGAGGATCCGCTGTACGTACTGGCCGGCCCGGA
+CGAAGGATATGTGCCGTACTACGCCGAATACCCTGAGGAGGTTTCGCTCGGAAGGCGACCGCAGGGCTAG
+CGGATTCCGGGCGCAGTCTCGATACCCGCACTGGACGCTCGACGGTGACCAGGCACTATGGATGCGTGCG
+TTCAACACCGCCGGCCTCAGCCGGTCGTTCAACACCGCCGGCGTTAGCCGGCCATTCAACACCGCCGGCG
+TTAGCCGGCCATTCAACGCTGTGCGGCCGTCCAGTCGCAGGTGATCGTGCGCTGATCATGGCGATCGTCA
+ACCGCACCCCGGATTCGTTTTACGACAAGGGTGCGACTTTCAGCGACGCGGCTGCCAGAGACGCGGTCCA
+CCGGGCCGTCGCCGACGGTGCCGACGTCATCGACGTCGGCGGTGTCAAAGCCGGCCCGGGTGAACGCGTC
+GACGTCGACACCGAGATCACGCGGCTGGTGCCGTTCATCGAATGGCTCCGCGGTGCTTACCCGGACCAGC
+TGATCAGTGTCGACACCTGGCGCGCGCAGGTGGCGAAGGCGGCCTGCGCGGCGGGGGCGGACCTGATCAA
+CGACACCTGGGGTGGCGTCGACCCGGCCATGCCCGAGGTGGCCGCCGAGTTCGGCGCGGGCCTGGTGTGT
+GCGCACACCGGCGGCGCGCTGCCACGCACGCGACCCTTCCGGGTGAGCTACGGTACGACTACCCGCGGTG
+TGGTGGATGCTGTGATTAGCCAGGTCACAGCCGCCGCCGAGCGGGCCGTCGCGGCCGGGGTGGCCCGCGA
+GAAGGTGTTGATCGACCCGGCACACGACTTCGGCAAGAACACCTTCCATGGGCTGCTGCTATTGCGACAC
+GTGGCCGATCTTGTTATGACCGGGTGGCCCGTGCTGATGGCTTTGAGCAACAAGGACGTTGTCGGGGAGA
+CTCTGGGCGTGGATTTGACCGAACGGCTTGAGGGAACGCTGGCAGCCACCGCGTTGGCTGCGGCCGCCGG
+GGCGCGCATGTTTCGGGTGCATGAGGTCGCCGCCACCCGGCGGGTGCTGGAAATGGTGGCATCGATTCAG
+GGGGTCCGGCCGCCGACGCGCACGGTGAGAGGACTCGCATGACAGCATCGGAGCTGGTCGCCGGCGATCT
+CGCCGGTGGCAGGGCCCCTGGCGCGCTGCCCTTGGACACTACTTGGCACCGTCCCGGCTGGACGATCGGG
+GAGTTGGAAGCGGCAAAGGCCGGACGGACGATTTCGGTGGTGCTGCCGGCCCTCAACGAGGAAGCGACCA
+TCGAATCGGTGATCGACAGCATCTCTCCGCTGGTCGATGGCCTGGTCGATGAATTGATCGTGCTGGACTC
+CGGTTCCACCGACGACACCGAGATCCGGGCCATCGCCTCCGGCGCCCGGGTTGTCAGCCGTGAACAGGCG
+TTGCCCGAGGTGCCGGTACGGCCCGGCAAAGGTGAGGCATTGTGGCGTTCACTGGCGGCCACCAGCGGCG
+ACATCGTGGTGTTCATCGACTCAGACCTGATCAACCCGCACCCCTTGTTTGTGCCATGGCTGGTCGGTCC
+GCTGCTCACCGGCGAAGGCATTCAGCTGGTCAAGAGCTTTTACCGACGGCCGCTGCAGGTCAGCGACGTG
+ACGAGTGGGGTGTGCGCCACCGGCGGCGGGAGGGTCACCGAGCTGGTGGCGCGGCCACTGTTAGCCGCGC
+TGCGGCCCGAGCTGGGTTGTGTACTGCAGCCGCTGAGCGGTGAGTATGCGGCCAGCCGGGAGCTGCTGAC
+ATCGCTGCCATTTGCCCCCGGCTACGGCGTGGAGATCGGCCTCTTGATAGACACGTTCGACCGGTTGGGC
+CTGGACGCAATCGCCCAGGTCAACTTGGGCGTTCGGGCGCACCGTAACCGGCCCCTAGACGAGCTCGGCG
+CGATGAGCCGCCAGGTCATCGCGACCCTGCTGTCGCGCTGTGGAATTCCCGATTCCGGTGTCGGGCTGAC
+CCAGTTCTTGCCCGGCGGCCCGGACGATAGTGACTACACGCGGCACACCTGGCCGGTATCACTAGTCGAC
+CGGCCGCCGATGAAGGTGATGCGGCCGCGCTGACCGACACCGCGTCGGCGCCTTAGGGCAAGATCGATGA
+CGTGGCGTTGGTGTTGGTGTACCTGGTGGTGCTGGTCCTGGTGGCGATCGTGCTGTTCGCTGCGGCGAGC
+TTGCTATTCGGCCGTGGCGAGCAGTTGCCGCCCCTGCCGCGGGCGACGACGGCGACGACGCTGCCGGCGT
+TCGGGGTCACCCGCGCCGACGTCGACGCGGTCAAGTTCACGCAGGTGCTGCGCGGGTACAAGACCAGCGA
+GGTGGACTGGGTGCTGGAACGGCTCGGCCGTGAGCTCGAGGCGCTACGCTCTCAGCTCGGGGCGATCCAC
+GCCTCGTCGGAAGACGCCGAGGCCGAGTCTGACGCGTCAAACCCTTCGCGCGGCGAGACCGTCGTGCACT
+ACCGTTCTGACCCCGCGTGAGCGGCGACGGGCTGGTTCGCTGCCCCTGGGCGGAGGTTCGTCCAGGGCCC
+GATGCCCAGCTGTACCGCGACTATCACGACAACGAATGGGGGCGTCCGCTGTACGGCCGGGTGGCTTTGT
+TCGAGCGAATGAGCCTGGAGGCCTTCCAGAGTGGCCTGTCATGGTTGATAATCCTGCGCAAGCGGGAGAA
+TTTCCGGCGCGCATTCTCTGGGTTCGACATCGACAAGATCGCTCGCTACACCGATACCGATGTGCGACGG
+CTACTCGCCGATGACGGAATCGTGCGCAACCGCGCCAAGATTGAGGCGACGATCGCCAACGCGCGCGCAG
+CTGCCGATCTGGGGTCGTCCGAAGACCTATCCGAGCTGCTGTGGTCGTTCGCGCCACCGCCTCGGCCCCG
+GCCCGTCGACGGTTCCGAAATTCCCTCGGTCAGCACGGAATCGAAGGCTATGTCGCGTGAGTTGAAGCGG
+CGCGGGTTCCGTTTCGTCGGGCCCACCACCGCCTATGCGTTGATGCAGGCGACCGGGATGGTCGACGACC
+ATATCCAAGCATGCTGGGTGCCCACTGAGCGACCTTTTGACCAGCCGGGCTGCCCGATGGCGGCCCGGTG
+AAGTCATTGCGCCGGGGCTTGTGCACCTGATGAACCCGAATAGGGAACAATAGGGGGGTGATTTGGCAGT
+TCAATGTCGGGTATGGCTGGAAATCCAATGGCGGGGCATGCTCGGCGCCGACCAGGCTCGCGCAGGCGGG
+CCAGCCCGAATCTGGAGGGAGCACTCAATGGCGGCGATGAAGCCCCGGACCGGCGACGGTCCTTTGGAAG
+CAACTAAGGAGGGGCGCGGCATTGTGATGCGAGTACCACTTGAGGGTGGCGGTCGCCTGGTCGTCGAGCT
+GACACCCGACGAAGCCGCCGCACTGGGTGACGAACTCAAAGGCGTTACTAGCTAAGACCAGCCCAACGGC
+GAATGGTCGGCGTTACGCGCACACCTTCCGGTAGATGTCCAGTGTCTGCTCGGCGATGTATGCCCAGGAG
+AACTCTTGGATACAGCGCTGGCGTCCGGCATGCCCGTAGCGCTCCGCCGTTGCCGGGTCGGCGACCAAGG
+CATTGACCGCCTCAGCCAATCTGGCCTGGTAACCGGTCGCGTCGTCGGCGTCGTAATGCACCAGTGAGCC
+GGTGATCCCGTCGGCGACCACCTCGGGGATCCCGCCGACGTCGGAGGCCACCACGGCGGTTGCGCACGCC
+ATCGCTTCCAGGTTTACGATACCCAGCGGCTCGTACACCGACGGGCACACGAAAACTGTTGCTGCCGAAA
+GTATTTCTCGTAGTTGTCCGATGGTAAGCCGGTCTTGGATCCAAAACACGCCAGTGCGATTGCGGGCCAG
+TTCGGCCACCGCGACGCGCACTTCGTCGGCTACTTCCGGCGTGTCCGCAGCACCCGCGCAGAGCACTAGC
+TGTACGTCCGATCTGAATCGGTGCGCGGCTGTTACCAGGTGGACGACTCCCTTTTGCCGGGTGATTCGCC
+CGACGAACACCGCCATGGGCCGGTTCGGATCGACCCCGAGCTCGGCCAGCACCGACCCGGTACGCGCGGG
+CCCGGCCGGATACCACGTCTCGGTGTCGATCCCGTTCCGGATGACGTGCACCAGGTTCGGATCCAGGCTG
+GGATAGACCCGCAACATGTCGTTGCGCATTGCAGAACTGACCGCAATGACCGCGTTGGCGGCCAGCACCG
+CGGTCTGCTCGACCCATGTCGATACCTGGTAGCCGCCGCCGAGTTGCTCCTTCTTCCATGGCCGCAACGG
+TTCGAGCGAATGTGCGGTCAAAATATGCGGGATGTCGTAGAGTATCGCGGCCAGATGCCCCGCCAGAGCG
+GTGTACCAGGTGTGTGAATGCACGACGGTGGCCGCGCTGGCGGCATTGGCCATCACCAGGTCCGCGGACA
+AGGTGGACAGCGCCGCGTTGGCGCTGCCTAGCCTCGGGTCGGGCCGATAGGCAAATGCGCCCGGGCGGGG
+TGCGCCCATGCAGTGCACGTCGACCGCGCACAGCCGGCGTAGGTAGGCAACCAGTTCGGTGACATGTACC
+CCGGCTCCACCGTAAACCTCCGGTGGGTATTCCCGAGTCAACATCGCCACCCGCATACCCCGCACCGTAG
+TGCGGTGACGGGGCGGCCCGCGTGGCGGGCCGAGGAGGAGGCGGAGGCGGCACAGCACCCGTCGAACGGG
+GCCAAACACCTTGACGGACAGCCCGTCAGAGCAGTAGCCAGGGGCGGATTCCCCTTGGCAGTGGTTTGCG
+GGGGCCGATAGGTTTGAGCCATGAGAGAAGTGCCGCACGTGCTGGGCATAGTCTTAGCCGGCGGTGAGGG
+CAAGCGGCTTTATCCGCTGACCGCGGACCGGGCCAAGCCCGCGGTTCCTTTTGGCGGCGCCTATCGATTG
+ATCGATTTCGTACTCTCAAACCTCGTCAACGCCCGGTATCTGAGGATCTGTGTTCTCACCCAATACAAGT
+CGCATTCACTGGACCGCCATATCTCGCAGAACTGGCGGTTGTCTGGTCTGGCGGGTGAGTACATCACCCC
+GGTGCCGGCACAGCAGCGCCTCGGCCCGCGCTGGTATACCGGCTCCGCCGATGCGATCTATCAATCGCTG
+AACTTGATCTACGACGAAGATCCAGACTACATAGTGGTTTTCGGCGCCGACCACGTCTACCGTATGGATC
+CCGAACAGATGGTCCGGTTCCACATCGACAGCGGTGCCGGCGCGACGGTGGCCGGCATACGGGTTCCACG
+TGAAAATGCGACCGCGTTCGGTTGTATCGACGCCGATGACTCCGGCCGTATTCGCAGCTTCGTTGAGAAG
+CCGCTGGAGCCGCCCGGAACCCCCGACGACCCCGACACCACGTTCGTCTCAATGGGCAACTACATTTTCA
+CGACCAAGGTGCTTATCGACGCGATTCGCGCCGACGCCGACGACGACCACTCGGACCACGACATGGGTGG
+TGACATCGTTCCGCGGTTGGTGGCCGACGGTATGGCGGCGGTCTATGACTTCTCCGATAACGAAGTGCCT
+GGTGCCACCGATCGCGACCGAGCATATTGGCGCGACGTCGGGACGCTTGACGCGTTTTACGACGCACATA
+TGGACCTGGTGTCGGTGCACCCGGTGTTCAACCTGTACAACAAGCGGTGGCCGATCCGCGGGGAGTCGGA
+GAACCTGGCGCCGGCGAAGTTCGTCAATGGCGGCTCCGCACAGGAGTCGGTGGTTGGTGCCGGCAGCATC
+ATCTCGGCGGCCTCGGTGCGTAATTCGGTGCTGTCGTCGAACGTCGTGGTCGACGACGGCGCGATCGTTG
+AGGGCAGTGTGATCATGCCCGGCACCCGCGTTGGGCGCGGGGCGGTGGTGCGCCACGCGATCCTGGACAA
+GAACGTCGTCGTCGGGCCCGGTGAGATGGTCGGCGTGGATCTGGAGAAGGACCGGGAACGCTTCGCGATC
+AGCGCCGGCGGCGTGGTCGCCGTGGGCAAGGGTGTTTGGATCTAGGTCCGGTTAGCGGCGCGAGCAGACA
+CAGAATCGCCCATTTCGGCACGAAATTGGGCGATTCTGCGTCTGCTCGGCGCGGTGGGGCGCGCCGGCTA
+GGGCCCTGGCGGCCCGGGTTGGCCGAACAGCTGCCCGCCAGCGCCGCCGCGAGCGCCGGCCGCGGCGGCC
+CCGCGCCACCTCCCACGCCGCCGTTGCCGATCAACCCCCCGGGCCCGCCGTCTTGGCCCGGTCCGCCATT
+GGCGCCGTCACCGATCGAACAGTGCCTGGGTGGGAGCGTTGATCACATTCAGCACGTCTTGCTGCACGCT
+CTGCGCCACAGCAGCGTTGACGGCTTCGGCAGCCGCATAGGCCCCGCCAGCGCCGGTCAGGGACGAACTG
+CTGATGAAACGCCGTCGCCTGCAAGCTAAGCGCCTGATAGGCCTGAGCGTGTCTGGCGAACAGTGACGCC
+ACGACCGCCGATACTTCATCGGCACAGGCGGCCAGCATCGCGGTGGTTGGGGCTGCCGCGGCGGCATTGG
+CCGCGCTCAATGCCGAGCCGATGCCCGCCAAATCCGTTGCCGCCGATGCCAGCACGTCCGGGGCGCCACC
+AGATACGACATGGCCACACCTTATCGTGGGCTCGTTACGGCATGCGGTGTTTTCGACGGACTCGTCACCG
+ACGCCGCGCGTGTGACGCGCGCCGTCAGCCAGCGCTCGGCAACCCGGGCTACCCAGGGACCTCCGGTATC
+AGCAGGTGCGCGTCGTAGCGTGGGCCCCAGTGCAGCGTGACACGACCACGCGGCGGGCGTGGGTAGGCGG
+CCGGGAATTGGCCGGTGAGCGGGTTGCGGGGGGACAACCAGCGTCCGCCAACCACCAGTCGTAACTGTTC
+GCCGGCGCGGAACAATGTCGCCGACGGGCCAAGCGCGACATCGACGGCGACGACCTCGCCGGCGGTGACC
+GGCCGGGGCCGAGCACACGCCGGGACCGGCTCCCATGGCTGCGAGAGCTCGGGGTCGAGCTCGCGCAGCG
+AGACCCGCTGCCAGCCGGTGGTCACCCGGTCACGGCCCCAGCCGTAGGACCCCTCAAACGCAACGAACTG
+GCCATCGCGCCACTTCTCCACTCCGACGAACAGGTTCGCGTCGTCGCAGCCATCCAATTGAACCCACAGG
+CGGGCGGCCATCGGGCCGGTCAACTCGATGTCTTCGGGGATCGTCCAATTGAATGCTGCTGCCCGAGAGC
+GAGTTTGGAACCTGATGCTGCCCGCCGTCGGCGGCGGCTCGGTTGCCAGCAGCCCCGGCCCGGCGAGATA
+CATTGGCCGCCAACGCGTGCCGGCAAGCGGCCACTGGGTCTCTTCACGCACCGCGGTGATGGTGTCGCGA
+TCCTCACGCACCTCGAGGCGAACGCTGCGCGAACCGGAGGAGCCGGCCAGCGCGTCTCGCAAGAACTTCA
+GCTGCTCGGACAGCGCGGTCGCTGAGTAGAAGGTCTCCCATTTGCCCCCGCGATGGGTATACAGCCGGGC
+GTGACCGCAGCCGCTGCGGGTAAAAGCGCGGATCGACCCGCGGCTGTGCAAGTTGTTGTCCGAGAAGCTA
+CCGCAGACCAGCATCGGAACCTTGATCGCCGACAGGTCGGGTACTCGCGAGCGCCAGAAATCGTCGCGCA
+GCGGGTGAGCCTCTTGCATCTGCTCCATGTCGTAGGTCTGACGTGTGCGACGTCGCACCCCGCGCGACCA
+CAGCCGGGTGAACCCTGACTCCCGGATGCCGCCGGGAAAGGCCAAGTCGCGGTAGGCGTCGGTGAAACCC
+TCCCACGGGCAGATCGCCCGCAGCGCCGGCGGTTGCAGCGCGGCCACGGCGTACTGGCTAATGGCCAGAT
+AAGACACCCCCAGCATGACGACGCGCCCATCACTCCATGACTGGTCGGCGAGCCATCCCACCAGGTCGTA
+GGTGTCCTCGGCTTCCTGGTGTGACAGCAGGTCTCCGGTACCGTCGGAGCGGCCGCAGCCGCGCGAATCC
+GCATTGACCACGACGAAGCCCTGCGCGGTCCACCACGCCGGGTCCGGCGCCTCCCAGCCGGTCAGCGCCG
+AGAAGGTCAGCGGCTTCGGCTGGCGCAGCATCCGGTATTGTGGTGAGAACGTCCACCGGTTGCCCCGCCG
+CCGCGGCAGGGCGTCCTTGCCGTAGGGATGGATGCTCGCGATCACCGGCCTAGCCCCACCTTCGGCGCTA
+CGAAAGACGTTGATCCGCAGCAGCGTTCCGTCGCGGGTAGGCACCTCGACGTCGCGTTCTATGACGACGT
+CGGCCGGCGGATCGGTGACGGTGATCGGCGGCTTGGCGACGCCGCGAACCCGCTCCAGCGCATACCGGAG
+AGCACCGGGACGTCGCCACGGCCGGTCCAAGGCAGGTGACGGGTTTCTGGCCACGCCCGTTACCCTAAAG
+CTATTCGACCGCTACCACACGTAGGGCACCAACCGGTAGCGCACCAGTTGCCGGTATTCGCGGTACCCGC
+TGAGTTCTTGCGTCAGTAGTTTTTCCTCGTCGAGGATGCGGAACACCAACACCAGTGTGCCGGGGACGAG
+GATGAACATCGCCCAGTAAGAGCCCAGTGCCAGCGGTATGCCTGTCATCATGACCACGTTCCCGGCGTAC
+ATCGGGTGTCGGACAATTTTGTAGAGACCGTCGGAGGCCAATATCTGGCCCGCCTCCACCCTGACCGTCG
+AGGCGGCATACCTGTTCTGGATGACCACCAGCATGGCGATGCCAAGGCCCGTCATCACTAGGACGTCGCC
+GATCACGCACACCGCGGCTGGCACTGACGACCAACCATAACGATGGTCGCACGCGCTCAGCACCATCATC
+GCGAAGAACCCCAGAAAAGCGCCGATGACGATGAACTTCTGAATCGTTCGGCCCTCCGCGAGCGGACCGC
+TGCGCATGCGACGTTGAAGGGCCGCGGGATCGTTGCGAGCCAGATAGATTGTGGGGCCAATCGTGGTGCT
+CACAAATGCGGCGAGGAACACCCACGCCTGCCAATAGTCGAACGTGCCGGCTGGCCCGAATAGGAGCGCG
+CCGAAAACGACGAGTCCTAACACGCCCCATATGAATATCTTCAGCCCAATGTGCATGGCTCCTCCTAGCA
+GCGAACGTCACGCCGTCGGAAGGCCATGGCGCCCAGGGTGATCAGGGCCGCATCTATGGCCAGCAGCCAC
+AGCAACGGCACCGCGGTGAAATCGCCGCCGCCGACCCGCGGGATGTGGGCGAACGGCTCCAGGTTGAGCA
+GCATCTGCGGGAACCCCGCCAACGAGCCGAGCAGGTACAGCGCGATGAACCCGACCAGCACGCCCCACGC
+CACCGGCGTGAACCGCGGCGCCAACCCGAACAATCCCACGGTCACCGCCGATAACAACCACACGGCCGGC
+AGTTGCACGGCCGCGGTGCCGACCACGGTGGGCAGCTTGCCGCCGACGTCACCGACGGTCATGCCGTAGG
+CGAGTCCGGCCGCCACGCCGGAGATCAGGGTCGCCACCGCCGATCCGGCCAGCGCCATCGCCAGATGGCT
+TGCCAGCCAATGGGTCCGGGAAACCGCCCCGGCGAGCAGGGTCTCGGCCCGCAGCCCGGTTTCCTCTTGG
+TGCAGTCGTAGGGTCAGCGAGACGGCGAATGCGGCGGCGACCATGCCGATCATGGTGAAGGCCAGCGCAA
+GGAAGGCCTGTTCCAGTGCGCCGGTGCCGCCCATCCGGGTGACGATGTCACGCACCGCGGTGTTATCGCC
+CAGCTGATCCCCGATGCCGTGCACCACACTGCCCATCACCAGCCCGTACAGGCACAGGCCGACGGTCCAC
+AACAGCAGGGAGCCGCGATTGAGCCGCCATGCCAGCCCGAAGGGCTCGCTCAGCATGGGCCCGGCGGTGC
+CGGCGCCGGGGCGTTCGGCGATCAGTCCGGCACCGACATCACGGCCGGCGCGTAATCGATAGGCCAGCAC
+GGTAAGCACGGCCGCGGTCGCCAGCGACAGCAGCAGCACCCACCAACGCTCTCCCGCGTAGGGTCTGACC
+TGCAGCGACCACCCCAGCGGCGAGCACCAGGACAGCGTGCCCGAGCCGGCATCACCGATGGCACGCAGCG
+CGAACGCGGTGCCCAGGACGGCGAACGCGACCGCGCGGGTGAATCGGGCGCTCGGCGACAGCTGCGCGGC
+CACCGCGGCCACCGCCGTGAAGACCATCCCGGAGGCCGCCAGCGCCACGCCAAACGCTACCGACCCGGCC
+GGAGCCACATCGGTGGCAAGCAGACCCAATGCACCGATCGCGCCGGTCGCGATCGACGCACCGAACGACA
+GCAGCAGCGCGCCGGTGAGGTTGGTGTAGCGCCCGACCACGGTCGAATCGATCAATTCGGCACGGCCGCT
+TTCCTCGTCCGCGCGGGTGTGCCGAATCACCGTGAGGATGACCGCCACCGCGATGAGGGTGTGAAACATC
+CCGGCTTTCCAGATTCCGACCGCACCCAGGCTGTCGTTGTAGACCGGCCCGTAGAGCGCGCGCTGTGCCG
+GGCTGGCCATAATGGCGGCCGCCGCGGCGGCGCGGGCGGACCGGTCGGGGTAAACCGTTTCGACGCTGGC
+GATGTACACGGTGGCCAGCGGCACCGACAGCAGCAGCACCCACAGCGGCAACGACACCCGGTCGCGGCGC
+AGGTACAGGCGCAGCAACCCCAGTGTGCCGGTGAAGCCCGAACCGCGGTGTGGTGCACGGTGTCCTGCGG
+GTCTCGCGCGATCGATGACCGTACTGCTCACGGCGTTGCCACCTGTTGCTCGGCTGCGACCTCGGGGCCC
+AGGCTGTAGTGGCGCAGGAACAGCTCCTCCAGGGTGGGCGGCTGACTGACCAGGCTGCGCACACCGGCGT
+GGCCGAGCACTTGGATGAGTTCTCTCAGGCTTTCGCTGTCGACCTGGGCGCGCACTGTGGTGCCCTCGAT
+GCTGATGTCCTCGACTCCCTTGATTCGGCTGAGGTCTCCTGGATCACCGATCATTTCGGCCTTGATCGAG
+GTGCGGCTGAGGTGCCGCAAGGCGTCTAGTGAACCGCTTTCGACGGTCTTGCCGGCTCGGATGATGGTCA
+CCTTTTCGCACAGCGCTTCGGTCTCGGCCAGAATATGGCTGGACAACAGCACCGTCACACCGCGTTGGCG
+TGCTTCGCCGATGCACTGCTGAAACACGTTTTCCATCAACGGGTCCAGGCCGCTGCTCGGCTCATCCAAG
+AGCAGCAGAGTGGCGTGCGACGACAATGCCGAGATCAGGGAGACCTTTTGGCGGTTGCCCTTGGAGTAGG
+TGCGCGCCTTCTTGGTTGGGTCCAGGCCGAAGCGCTCGATCAGTTCCGCGCGACGAGCGTTGTCGATGCC
+GCCTCGCATGCGGGCCAGCAGGTCGATGGTCTCACCACCGGTCAGCGACGGCCACAATGTGACATCGCCT
+GGAACATAGGCGATGTGGCGGTGCAGGTCGACGGCGTCGGTCCAGGGGTCACCGCCCAGCAACCGCACGC
+TTCCGCCGTCGGCCTTCACCAGGCCTAGCAGGATGCGCAGGGTCGTGGACTTGCCCGCGCCGTTGGGGCC
+GAGGAAGCCGTGCACTTCGCCCTCGCGCACCGTGAGGTCGAGCCCGTCGAGCGCCCGCACCGACCCGAAG
+TGCTTGGTCAGTCCGCGAATCTCGATGGGCACCTGGTGGTTGTCAGCCGACATGTGCTTCTCCTTGTTGA
+GCTTCGGCCAGGAAGGCCTCGTACATGGCGCGGTCGGCCAGCAGGCCTTCGGTGTAGACCTCCAGGGAAG
+GCAGCACCATGTCGTGCGCGTAGTCGCGTAACGCTGCACGGAGATCGGTTGGGTTTTCGTGCATTTGCAG
+ATAAAGCAGGAAGCCTCCGCCTCCGGTGATCGCCAGAAACCGAGCACGGGCGCGCGGGTCGCGGCTGGGC
+TTGACCGTACCGGCGCGTACTCCTTCGTCCAGGTACTCCTCGGCGTTGTCGATCATCTTCTGCCACAGCA
+TCTTCGCCAGCTCGCCGCCGGATTGCATGCTGCGCACCAGGTATGCCATCAGCGGTGCGTAGGATTCGAT
+CTCGGCCATCTGCGCGAGCCAGGTGGTCGGGTCGTTGGACTTCAGTGCCGCAGCCTTGCTGCTGCGGATC
+TCTTCGGCGACGAAGTCGTCGCAGGCCTTGCGCAGACCTTCCTTGGAACCGAAATGGTGGATGACCAATG
+CCGCGCTCACCCCCGCCGCTTCGGCGATGGCTCGCAGCCCGACACCGAATCCGTGCCGACCGAACTGTTC
+GATGGCCGCCTCTCTGATCCTGGCGTGCGCGGTCAGATCGGCTGAACGCATGTTCAGGATATTAAACGTA
+CGTTCATCCCCGGTCAAGGGAGGGCGCCGTTGGGAATCCGTGAAGGCCGCGAACTTTGCCGAGCAGACGC
+AAAATCGCCCTGGAACGCACGGTTCAGGGCGATTTTGCGTCTGCTCGCCGAATTAGTCCCGCACGGCTGC
+CAGCACGCCGTCGCCCAGCGGCACCAGTGCCGGAGTGAGCCGTTCATCCTCGGCGATAAGCCGGGCCGCC
+TCGCGAACCGCGATCACCTCGGCGTCGCGCGCCCCGGGATCACCGGCCCGACCGCCCAGCGCCGCCCGGT
+GCACGACGATGACCCCGCCGGATCGCAGCAGCCGCACCCCCTCGGCGACGTAATCTGGCTGGTCGATCGG
+GTCGGCGTCGATGAATACCAGGTCGTAGGATGCGTCGGCGAGCCGGGTCAGCACCTCTTGGGCGCGGCCG
+CTGATCAGCCTGGTACGCGACGGCCCGATGCCCGCCTCGGCAAAGGCCTGCCTGGCAAGGCGTAGATGCT
+CGGGCTCGATATCGATGGTGGTCAAGACGCCGTCGTCGCGCATGCCCGACAACAGCCACAGGCCGCTGAC
+GCCGGCCCCGGTACCCACTTCGGCCACCGCCTTGCCTCCGCTGAGCTTGGCCAGCAAGCACAGCAACGCA
+CCCACCGCCGGTGTTACCGCCCCGGCCCCGATGTCGGTTGCGCGCTCGCGGGCGCCGGCCAGGATCACGT
+CTTCAGATATTGACCCCTCGGCGTGCGCCCAGAGTGATTCGCCTCGGCTGGGGGCCGGCTGGCCAGGCAT
+GTCGTCGTGTCCGGGGGTGCCGTCCATGCCCGCAGCGTATGTCCAATTGGCGACGCCGTCGGGCAGGCGC
+GCCTGGTTCGAACGCCGGCCGAGCACCGAGCTGGACGCTTGCGGCTGTACCCGACACGCCCGGCGTGCCG
+GACGCGACGAAGGTCACTTTGACTCGATATTCCCTGGACAGCGCAGGTAACGGTATGGTTTCTAAGCCAA
+AGCTCAGATTGCTCATATATGGCCCATACGCCGGTACGCGACGGTAATTCCCATGGAACTCCTCGGCGGA
+CCCCGGGTTGGGAATACGGAATCGCAACTTTGCGTTGCCGACGGTGACGACTTGCCAACTTATTGCAGTG
+CAAATTCGGAGGATCTCAATATCACGACCATCACGACCTTGAGTCCGACCAGCATGTCTCATCCCCAACA
+GGTCCGCGATGACCAGTGGGTGGAGCCGTCTGACCAATTGCAGGGCACCGCCGTATTCGACGCCACCGGG
+GACAAGGCCACCATGCCGTCCTGGGATGAGCTGGTCCGTCAGCACGCCGATCGGGTGTACCGGCTGGCTT
+ATCGGCTCTCCGGCAACCAGCACGATGCCGAAGACCTGACCCAGGAGACCTTTATCAGGGTGTTCCGGTC
+GGTCCAGAATTACCAGCCGGGCACCTTCGAAGGCTGGCTACACCGCATCACCACCAACTTGTTCCTGGAC
+ATGGTCCGCCGCCGGGCTCGCATCCGGATGGAGGCGTTACCCGAGGACTACGACCGGGTGCCCGCCGATG
+AGCCCAACCCCGAGCAGATCTACCACGACGCACGGCTGGGACCTGACCTGCAGGCTGCCTTGGCCTCGCT
+GCCGCCGGAGTTTCGTGCCGCGGTGGTGCTGTGTGACATCGAGGGTCTGTCGTACGAGGAGATCGGCGCC
+ACACTGGGCGTGAAGCTCGGGACGGTACGTAGCCGGATACACCGCGGACGCCAGGCACTGCGGGACTACC
+TGGCAGCGCACCCCGAACATGGCGAGTGCGCAGTTCACGTCAACCCAGTTCGCTGAACTACTCAACGGCC
+GCCGAGCGCGTCGGTTCGGCTACCGCATGGTTGCCAATCGGTCCCGAATCCTGGGGTTTTACCGGCTGGC
+GATGGTTTTCCGGCACCGCGCCGCGCTACATTCGAGATACCGGTGGCTCGCTAGGTGGCGGAAGGAGGTG
+GTGATGGCCGACCCCGGAAGCGTGGGACATGTGTTCCGGCGCGCGTTTTCCTGGCTCCCGGCGCAGTTCG
+CCTCCCAGAGTGACGCGCCGGTCGGCGCGCCGCGGCAGTTCCGTTCCACCGAGCACCTGTCAATCGAGGC
+CATCGCGGCTTTCGTCGACGGCGAGCTGCGGATGAACGCGCACTTGCGGGCCGCGCATCACCTTTCGCTG
+TGTGCCCAATGCGCGGCCGAAGTGGACGACCAAAGTCGTGCCCGCGCCGCTCTGCGCGATTCCCACCCGA
+TCCGCATCCCCAGCACGTTGCTCGGATTACTGTCCGAGATCCCGCGTTGTCCACCTGAAGGTCCATCTAA
+AGGTTCGTCTGGAGGTTCATCCCAGGGCCCGCCCGACGGGGCTGCGGCAGGCTTCGGCGACCGCTTCGCT
+GACGGCGATGGCGGGAATCGGGGCCGGCAATCGCGGGTGCGTCGCTAGCCGGTGAGCCACTTGTCGCAGC
+GCATGGCGGGGGGTTGCTGCGAGTTCATGGCGAGTGGTCGCGATCCGTGGATACTAGGGTGGACACGGAC
+AACGCGATGCCTGCACGTTTTAGCGCCCAGATTCAGAATGAGGATGAGGTGACCTCCGACCAAGGCAACA
+ACGGCGGCCCGAACGGCGGAGGCCGCCTGGCGCCGCGCCCGGTTTTTCGGCCACCGGTCGACCCGGCGTC
+GCGTCAAGCGTTCGGGCGTCCGTCCGGGGTCCAAGGGTCCTTTGTGGCCGAGCGTGTGCGCCCGCAGAAG
+TACCAGGACCAGTCTGACTTCACACCGAACGATCAGCTTGCTGACCCGGTGCTTCAGGAGGCGTTCGGTC
+GTCCGTTCGCGGGCGCCGAATCGCTGCAGCGCCATCCCATCGATGCCGGAGCGCTGGCAGCTGAGAAAGA
+CGGTGCCGGCCCCGACGAGCCCGACGATCCGTGGCGCGACCCCGCGGCCGCGGCCGCGCTGGGGACGCCA
+GCGCTAGCCGCGCCGGCACCGCACGGTGCGCTGGCCGGCAGCGGCAAGCTGGGTGTGCGCGACGTGCTGT
+TTGGCGGCAAGGTGTCCTACTTGGCGCTGGGCATCTTGGTCGCTATCGCACTGGTGATCGGCGGCATCGG
+CGGTGTCATCGGCCGCAAGACCGCGGAAGTAGTCGATGCGTTCACCACGTCGAAGGTGACCCTGTCGACC
+ACTGGCAATGCCCAGGAACCGGCCGGCCGGTTCACCAAGGTGGCGGCCGCCGTGGCCGATTCGGTGGTGA
+CCATTGAGTCGGTCAGCGACCAGGAGGGCATGCAAGGTTCCGGCGTCATCGTCGATGGCCGCGGCTACAT
+CGTCACCAACAATCACGTGATCTCTGAGGCGGCCAACAATCCCAGCCAGTTCAAGACGACCGTGGTGCTC
+AACGACGGCAAGGAGGTGCCCGCCAATCTGGTGGGTCGTGACCCCAAGACCGACTTGGCCGTCCTCAAGG
+TCGACAACGTCGACAATCTGACCGTGGCCCGGCTCGGTGATTCCAGCAAGGTACGGGTCGGTGACGAAGT
+CCTCGCGGTCGGCGCGCCCCTGGGGCTGCGCAGTACGGTGACCCAGGGCATTGTCAGCGCGCTACACCGC
+CCCGTTCCGTTGTCGGGCGAGGGCTCTGACACCGACACCGTCATTGACGCAATTCAGACCGACGCCTCGA
+TCAACCACGGTAACTCCGGCGGTCCGCTAATCGACATGGATGCCCAGGTGATTGGCATCAACACCGCCGG
+TAAGTCACTGTCGGATAGCGCCAGCGGGCTGGGCTTTGCGATCCCGGTCAACGAGATGAAATTGGTGGCA
+AATTCTCTGATCAAAGACGGAAAGATCGTGCATCCGACGTTGGGCATCAACACCCGGTCAGTAAGCAACG
+CGATCGCGTCGGGCGCGCAGGTGGCCAATGTAAAGGCGGGAAGTCCCGCGCAGAAGGGCGGGATCTTGGA
+GAACGATGTGATCGTCAAGGTCGGTAACCGCGCGGTCGCCGACTCCGACGAGTTCGTCGTCGCCGTGCGC
+CAGTTGGCTATCGGCCAGGACGCTCCGATAGAGGTGGTCCGCGAGGGTCGGCATGTGACGCTGACGGTGA
+AACCGGACCCCGATAGCACCTAGAGTGTTCGCCAACATCGGTTGGGGGGAAATGCTCGTCCTCGTCATGG
+TCGGGCTGGTGGTGCTTGGCCCGGAGCGGCTCCCGGGTGCCATCCGCTGGGCGGCAAGCGCTCTGCGGCA
+GGCGCGCGACTATCTCAGCGGTGTGACCAGCCAGCTACGTGAGGACATTGGACCCGAATTCGATGATCTG
+CGGGGACATCTCGGTGAGCTGCAGAAGCTACGGGGAATGACTCCGCGGGCTGCGTTGACCAAGCACCTAC
+TGGATGGCGATGATTCCCTGTTCACCGGAGACTTCGACCGACCGACGCCGAAGAAACCGGATGCGGCGGG
+CTCGGCGGGGCCGGACGCTACTGAGCAGATCGGTGCGGGGCCCATCCCGTTTGACAGCGATGCCACCTAG
+ATCGGTGACGGCCGGCGGTCGGGCCCGGCGAGCTAACACCCGAGCAACGGCGGCAGGCCGGCCACCGAGT
+CGATCACGTGGTGCGGCCGGGTCGCGCTGGCGCCGGCCAGCCAGCGATCCAGCGTTTGCTGGCGGAACTT
+GCCGGTGCGCACCAGCACACCCGTCATGCCCACCGCCTGGGCGGCCAGCACGTCGTTGTGCAGATCGTCG
+CCGATCATGACCATCTGCTGTGGATCGACACCGACGCGGTCGGCGGCCGCCAGGAATCCCTCGGCCGCAG
+GCTTGCCGATGGCGGTGGCGGTCTTGCCGCAGGCCTGTTCCATTCCGGTCAGGTACATCCCGGTGTCGAT
+GCGCAGCCCGTCGGTGGTGTTCCAGGTCATATTGCGGTGCATCGCCACCACCGGAACGCCGTCGAGCATC
+CACCCATAGACCCGGCTGAGCGTGCGGTGATCGAACTGGGGGCCGGCACTGCCGAGCACGACGACGTCGG
+GGGCTTCGGGGCAATCCTCGGGACCGATCTCGGTCGACAAGACGACGTCGATGCCGGGCAAGTCCTCGGT
+GATGTCGCCGTTGTTCACCAGGAAGCACCGCGCGCCGGGATAGGCGCCGTGCAGGTACTCGGCCGTCAGC
+ACCCCGGCCGTGATCACGTCGTCGGCGGCGACGGGGATCCCCGCGGCACCCAGCGCCTCGGCGATCTGCC
+GGCGGGTGCGCGTCGTGGTGTTGGTCAGATACGCGCAGGCGATTCCCCGATGGGTCAGTTGCCGCACGGT
+CTCGGCGGCCCCGGGAATCGCGCGCCACGACAGCACCAGCACGCCGTCGATGTCGAACAGCACCGCCGCG
+GCCATCAGATGCGCCACGTCCACACGATATCCGTCAGTTAGACCGTCGACATCGACACCAGCGCGGAAAA
+ACCCCAGTGAGCATCGCGCTGACGTCGATCTCGACGGTGAGGTTCATCCTGGCTCAGGATCCCTCAAGAT
+CCGTGGCGCAACCACACACTGTCGGCCACCCAGGGCGACGCGGCGCCGGCCACCGACCACGCCAGCTCCG
+CGGGCACATCGAGCACCTGATAACCCTTGCGGCCCGCCGCGGTGGCCGCCACGAGCGTCGCCACCCCCGC
+CCTCCGCTGGAACAGTGTCTGGCGCACCGTCCAGCCGATGATGCCGGTGCAGGCGATGCAATCGCGGCGA
+CGCTGTAGGCTGCCGGCGCGCGCAACCAACCAGCCGTCGGCGACGCGGTGCCCGAGTGATCGGACCCGAT
+CGACGGCCAGCCCAGCGCAACCCGCGGTCAACACCGCCCACAGTGTCCACGCCCACCCCGGCACGCCGAG
+AATCGGCGCCGCTGCGATCAGCGCAACTCCGGCCAGCGTCGGGACCAACAGCGCCCGGGTCCACCTGCGC
+CGGGCGGCGGCCGGGCCGTGCCGGCGCAGCGGCCCCGCTGCCGCGTCGGTGTTGTCGATCAGGTCGGTCA
+GCACGGCCGTCGCGGTCTCGAACGGACATGGTGGCAGCAGCATCGACGACTGGCCCTCGCCATGCACGCC
+GGTCATCACTGCGTCCAGCCGAGCACCGCGCAATAACCGCACCAGCAGTGGTTCACGCAAGGTGGCGCCA
+CGCAGCCGGCGCATGTCGTAGGTGTGCTCGCGCACCCGCAGCAGCCCGTGCCGCAGGTGTAGCACCCCTT
+CTTGACCGCTGCCGCCGCGGCGCAGCAGCAGATTGCCGTAGGTCAACCAGGAGAACAGCACCGCCAACAG
+TGCCGATACACCCACCACCAGCAGCACAGTGACCGCCACCACCAGTACCACCCCGGCGCGTTGCGCGGCG
+TCCACCGCGGACCTGGCGAAACCGGATTCCGGGAGTCGCACGGCCAGTCCCGTTTGGTAGCCAAGCCCGA
+TCACCGCCCCGATCATCACCAGGCCCGAAAAGCTCAGCGGCGCATACCGCAACCACGACGACTGCCACCG
+GGCCAGCACCCGACCGGTCGGCTCGACGGGTGCCAGCGACTCGGCCAGCAGCAGCGCGCGCAGCCTGGGC
+ACCCGTGCCGAGTCGACCGCGTCCAGTTCGAAGGCGGCCTCACCGCGGGCCTCCTGGCCGGTGCCCACCC
+GCAGCACCGTCAACCCCAACAGCCGGTGCAACAGCCGCGCCTCGGTCTGCACCGAGCGAATCCGGTTGCG
+CGGCACGGAGACCGCGCGCCGGCTGAGTATGCCGGTACGCAGCGACACGTTTTCGTCGTCGATGCGGTAG
+GTGGTGAAAAACCAACGCAGCACGCCGAATACGACCGTCACGCCGAGCGCCGCCAGCGGCCAGACCGGGT
+TGCCGGTTGCCGACCCCAGCACCACGGACCCGATGAGTACCGGGAGCTGGCGCAGCATCTCGTGCACCGG
+ATGCACCAGCAGCATCCGCGGGCTGAGGCGGTGCCAATCGTGTGGCCGGTCGGTCATGTCGCGTCCTCGC
+CGCGCAGCGCGGCGATGTCGGTCAGCTGCGCCACCACCCGATCGGCGACGTCGGTGTCCAACGCCTCGAT
+GTGCACCGCGCCCGCCGAGGACGCCGTGGTTACGGTGACGTTGGCCAGCCCGAACAGCCGGTCCATCGGG
+CCGCGGTAGGTGTCGACGGTCTGCACCCGGGAAATCGGTGTGATGCGGCGCTCCTGCACGAGCCAACCGG
+TGCGGGTGAATACGGCCTGCGGGCTGATCTCCCAACGGTGTACCCGGTAACGCCAGAGCGGGACCACCCC
+GATGTGCACCACCATCGCCACCGCGGTGAGAGCGGCCGCGGCCAGGTGCGGCCAGGGCGGCTGGGGATGC
+ACCGCCCACCACACCAGCTGCGCGATCACCGGGAGTATCCAGCCCAGCGACGCGGACAGCGCCCACATCA
+CCGGCGCCTGGCTGCTCGGTCGATGGGCCGGCTCGGCGAGCGCGAGGTGATTTCTCTGCGGTCCGGTTGC
+GCTTGGCACATTTCGAGCATGGTCCAACGGAAACCGAACACAGTGATCGGGGGTCGTGGTTATCGTTTGA
+GCTAGCGCTCAACAAGATGCGTGCCAACTCACCCTGCCCCGGGGAGGCGCGATGAGTCGACAGTGGCACT
+GGCTGGCAGCGACGCTGCTCCTGATCACCACCGCCGCGTGCAGTCGTCCGGGCACCGAGGAACCGGATTG
+CCCGACGAAAATAACCTTGCCGCCCGGTGCTACGCCCACCACGACCCTCGACCCGAGATGCATAGTGCGC
+GCGACCACCACCGGCACAGCCGACGGCGATGCGGCGTCGCGCTGGACCGGAACCGTGCGGATCGCCGGGT
+TCTATGCCTCGATCTGCAACGCGGTATGGGACGGGAACGTCAGCCTTGCGGGAAAGGACGAGCTGACCGG
+CAAGGCTACGCTTATCCTCGTCGAAACCAGTTGCCCGGGCAAGGTTGTCGCCGGCGAACTCGTGCTGAAG
+GGGAACGTCGGTTCGGACAGCCTCGCGATCACCTGGGCGCACCCCGAACTCCCGCAGCGGGCGTTCGACC
+TCGGCGCCGGACAGGGCACGATCCGCCGATCGGGCGACCGTGCCGAGGGAACGTTCAACTCGGATATGGG
+TGGGGGCACCGAGTTCTTCTTGACGTGGTCGCTGACGATGCGTAACTGACGATCACAACGTGCCCACCAA
+AAACAGAGTAGACAACAGTCGACAATTCCCTTGTACTCCGGCGCTATGAAGTCGATCTCCGTCGGTGAGC
+TGCGCCAGAATCCCGCTCCCATGATCGCCGACCTCGACCGGGGTGAGCCATACGCGCTGACCCGCCACAA
+CCACCGGATCGGAACGATCATTCCTGCCGTCTCGTCGGCAACACTCATTCCCCGGAAAGCCTAGTACGCC
+GAGCAGACGCAACGGCACCCAATTTCGACCAGAATCGGGTTCTTTTGCGTCTGCTCACGCGGTCAACGCT
+AGCGTCGTGTCGGGTCCAACCCCAGCGACATGCCCGCCAATCCGCGTCGTCGAGTCGACAAGCCGTCGGC
+GATGCTATGCAGTTCCTTGCCGATCGCCGAGTCCGGCGAGCTCAACACGAGCGGTACGCCCGAATCGCCG
+GCGGCCACCAGTGCGGGGTCCAGCGGGATCTGACCCAGCAGCGGCACGTCGGCGCCGACCGCACGCGACA
+ACCGCTCGGCGACCAGCCGGCCACCGCCCTCGCCGAACACCTGCATCGTGGTGCCGTCCGGCAGCGTGAG
+CCCCGACATGTTCTCCACGACGCCGACGATGCGTTGGCGGGTTTGCAGCGCGATGCTGCCGGCCCGTTCG
+GCCACCTCCGCGGCGGCCAGCTGCGGGGTGGTGACCACCAGGAGTTCGGCGTTGGGGATCAGTTGAGCCA
+CCGAGATGGCGACGTCGCCGGTTCCGGGCGGCAAGTCCAGCAGCAGCACGTCCAGATCCCCCCAGTACAC
+GTCGGCCAGAAACTGCTGCAACGCCCGGTGCAGCATCGGCCCGCGCCACACCACCGGGGTGTTGCCCTGG
+GTGAACTGGGCTATCGAGATGACCTTCACCTGGTGGGCGATCGGCGGCAGGATCATCGACTCAACCTGGG
+TAGGCCGGTCGGTGGTGCCCATCATCCGGGGGATAGAGTGGCCGTGGATATCAGCGTCCAGCACCCCGAT
+CGACAGGCCGCGGACGGCCATCGCGGCGGCCAGGTTGACCGTGACGGTGGACTTTCCGACTCCGCCCTTA
+CCGGAAGCCACGGCATACACCCGGGTCAAGGAATCGGGTTGCGCGAACGGGATGACGGGTTCGCGGGTAT
+CGCCACGCAACTGCTTACGCAGCTCGGTGCGCTGCTCGTCGCTCATCACGTCCAAGCTGACCCGCACCGC
+CGAAGTGCCTGGCACGTCGGCGACCGCCCGGGTGACACGCTCGGTGATTTCGGACTTCTTCGGGCAGCCG
+GCGATGGTCAGGTAGATCTCGACGTGCACGCTCCCATCCGGGCCGGTGTCGATGCTTTTGACCATCCCCA
+GTTCGGTGATGGGGCGCCGCAATTCGGGGTCGATTACCTTGCCCAGCGCGGTGCGTATCGCCGCGTTCAG
+GTCGCCATCACGAGTTCCGGACATCACCGCCGAGTGTAGGCGGCTTGGCATACGGCCGAGTGGTCAGCCG
+GCAGGAGCCGGCGCCGGCGGCGCCAGGCCCGCGTCGCCAGGCGGGCCGGCCAATGGATCCGGAGGTGGGG
+GAGCGGCAGGTAGGAATGGAGGTGGGGGAGCGGTAGGCGGGAACGGCGGCGCGCCCACTGGCGGGCCATG
+TGAGCCAATGCAGATCAGCGTGCAGCCGGGCATCGGCGCCGATGGGTCAGGTGCCATCCACGGGAACATC
+GGCGGTGGATTGAGCGCCGCCTGGCGCGGGGTCAAGTCGATCAGCGGCAGGTGCGCCATGGGGCCATCGG
+CGGTCAGGCCGTTGACATTGATCGGCAAGCCGGGCCCGAGACCCTCCGGATTCTCGAGGTGCGCGTCGCC
+GAGTGGTGGTGGCGGACCGGTGATCGGGGGCAAGTCAACCGGGAACACACCGGTGGCGTAGCCGGCGGCC
+CAGCCCAGTACGTTCTGGGCGTAAGGCATCGAGTTGTTGTAGCGCAGGAGCGCGGCCATGACCTGCGCCG
+GGTCGCGCAGGTTGAGCCCACCGCTACACAGGTAGCGGGCTGCGGCCAACGTGGAGTCGAACAGGTTCTG
+CGGGTCAGCCACACCGTCGTCATCGCCGTCGGTGGCGTACCGAGCCCAAGTGCCGGGCAAGAACTGCATT
+GGCCCCATCGCGCGGGCGTACGTGACGCGATTGCCGACGCTGCTTTGGATGATGATCTCGTTGCCTGGCA
+GGGTGCCGTCCAGCGTTGGGCCGTAGATCGGCTGGATCGCGGTGCCGCGCGCGTCGGTGGCGCCGCCGTT
+TGCGTGCATCGACTCGATGCGCCCAATCCCGGCCAGCAAGTTCCAACTGACGCCACAGCCAGGGGCGGCA
+GCGGCCATCTTCAGCTCGGCGTTGCGGTAGGCGGACAGTGCCATGGCCGGAATGCCAAGCGCACCAGGCG
+AATTCACGATCATCGGTGGTGGTGGAGCCGGTATGGTAGCTACCGCCACGCGGAAGCTGGTCGGCGGGCG
+CTTCATGGCGATGACGACCGGACCGGACAGGTCTATGCCGGACGCGGCGACCGCGGCCACCGGGGTGATA
+ACGGCGTGCACCGGCGCGGTTCTCCCGGGGAATACCGGAGCCGCGCCGCCGACCGCACTGGCGAATACCA
+ACGGGGCAATCGCTGCCACGCCGAATGCCGGCGCCCGCGTTAGGCGACAAGCTCCCCGCCGCACTGCAGC
+GACGGCCGGGCGTGCACCCCAGCGTCCCCCAATGTGCACTCGACCGTCCTCAGTGTGTGAGCCGTCGGAA
+ACCTATGTCTTCTTAGCTTCTTTCTTCGTTTCGTGAACTAGATCACCATACATAACTCTTGTCACGGGAG
+TGGCGCAATGGCCGACTCGGTAATCACCCCGATTTCTTGGCGTGCTGCTCCGCCTCGTCGGCCACCCGCG
+GCTGCGCCACATCCGGATCCGTCGGCTGCAGCTCCGCCAACAGAGCGCGCAGGCTGTCCAGTTCGTGGCG
+CAGGTAGTCGCGCGTGGGGACCTCGCCGATGGCCAGCCGCAGCGCTGCCAGCTCGCGGGCGTTGTACTCG
+GTGTCGGCCTTGGTCTGTGCGGCCCGCCGACGATCCTCTTCGAACACCGCGCGGTCACGCTTTTCCTGAC
+GGTTCTGGGCGAGCAGAATCAGCGGTGCGGCGTACGAGGCCTGCGTGGAGAAGGCCAGATTGAGCAGGAT
+GAAGGGGTACGGATCCCAGCGCAAGCCGACCGCAAACAGGTTCAGCACGATCCATGTCAGTACGAGCAGC
+GTCTGCACCAGCAGGTAACGGCCGGTTCCGAAAAACCGTGCGATGGATTCGGTTGTCCTGCCGACGGCCT
+CGGGATCCAGCCGCGGGGCGAGCGTGCGCGATGTGCGTGGGGTGTACAGACGGCGCGGCGCGAAGGGTTT
+GCTCACCGTGGTCCTCCGGGTCTGTCCGGTGCTCCGGAGGGGTCGAGCTCCGGCATATCTACACGCCAGT
+CATGCGGCAATAGATGGTCGAGCAGGTCGTCCACGGTCACCGCTCCCAGCAGGTGGTTCTCGTCGTCAAC
+CACCGGTCCGCACACCAGGTTGTAGGCGGCGAAGTAGCGAGTCACCGCGGCCAGCGGGGTCTCCGGAGTG
+AGCGTGAGCAGGTCAGTGTCCACAACTCCGCCGACCAGCTCGGCCGGCGGGTCACGAAGCAGCCGCTGCA
+AATGCACACAACCCAGGTAGTGCCCAGTGGGCGTGGCCGTGGGCGGGCGCGCGACGAACACCATTGACGC
+CAGGGCGGGGGTGAGATCGGGATCGCGGACCCGCGCCAACGCCTCCGCAATCGAGGTGTCCGGGGTCAAC
+ACCACCGGATCGGAAGTCATCAATCCGCCCGCCGTGTCGGGGGAGTGCGTCAGCAGCCTTCGCACCTGCC
+CGGAGTCGCCGGGATCCATTCGTGTCAGCAGCAACTCGGCTTCGGTCGGATTCAGGACCGCGAGCAGATC
+GGCGGCGTCGTCGGGATCCATCTCCTCCAGCACGTCGGCCGCGCGTTCGGTGCCCAGTTGCGACAACACC
+TCGGCCTGATCCAGTTCGGGCAGCTCCTGCAGGACGTCGGCCAAGCGCTTGTCGTGGAGCGCCTTGAACA
+CCTCGTGGCGGCGCTTCGGCGGCAGCCCGCGGATGGCGTCGGCCACGTCGACCGCTTTCCATCCCTCGAA
+CTGGTCGAGCAGCTGTGCCACGTCTTGACCCGGCATCGCCAAGGCCGACGGCGTCAACCCCGCCACGTTG
+TGCCAGTCCACGACGTGCACTGGGCCGCGCCGTCGGAGCCGACGTTGGGTGCGGACGGCGACCCTAGTCA
+CCATCCAGTCGCGACTTCGGGTTTGCTCGACACCCAGGTCGGTGACCACGACGTCGACGCCGGCCAGCTC
+GGGTAGTGCGGGATCGTTGACCTTCACCAGGGTGTCGAGCACTTGACCCAGCGCCAGAGCCTCGCCTGGC
+CGCTGCTCGAAGCGGTGCAGTGACACGTTGCCGGTGCTCAGTGTCACCGCGTGCGGCTCGATCGCGGCGA
+CCCGCAGAATCGGTATGAATATCTTGCGGCGGGTCGCCAAATCGACCACCAGCCCGAGCACTCGCGGTTG
+TTGGCGGACAATGCTGATGCTGATCACGACATCGCGAACGCGCCCGAAGGATTCGCCGAGCGGTCCCAGC
+ACCGACATCCGCGAGAGCCGCGCCAGGTACACCCTGTTGACCGATCCCATGATTGAGAGCCTAGGCAGCT
+GCCTTCCGGATCAACCGAGGGTGGGCCAATGTCGCCTAATGCTAAGGGATAGCGAAGATCCCCGCGATCA
+TGTAGACCAGCAGGGTCGCGATGCCAATCACAATGCCGGCCACCGCCAGGCCGTAGCCTTCTTCGCGTGT
+CTGCTTGATCTGGTTGATGGCGATCGCGCCGAACACGATGCCCACGATCGAGCCGATGCAGCAAAGCACA
+CCGACGAGCGCCGAGATCAGTGAGACGAGCGCCATGGTGTTCATGCCGGGCTGCGATGGGCCGTAGCCGT
+CTAGGTAGCCCGGCTCCGGGTAGTAGCCGCCCGGAGATCCACCGTATGGCGGAGGCATGGGCGGGTATGG
+TATGTCGCCGTAGCCTGCTGAAGAAGTGCCGGGGGGTGGATATCCGGGCGGCGCATAGCCCCCGGGTGGC
+ATCGGCGGTGGATAGTCGGTCGGATACCCGGGCTGGTAAGCAGGCGGGTAACCGGACGGCGGATACGCCG
+GGGGCGGGTGGTCGGCCATCGGCGAAGATGCCGGCGGCGCCCAAGGAGCGTCAGCAATGGGCTGTTCGGG
+GGGCCGCTCACCGACCGGAGGCGGTCCACCCGCGGCGTCGTGCGCACTCTCGCCAGAGGAGCCGCTGGGA
+GCCGTCATGGTGATCAACCTATCCCGGCAACGATGCTCGCCGTTCGGTGGGCCTCGGTCGCTCGCGGGTT
+GAGTGGATAGTGTGCCGGGAGTAGCTGGACCTGACTGGACATGAAACGATGGCGCTGAAAAAGGGGGGCG
+GAGGAGAATGAGAACCGATGACTAGCCCATTCCAGCCCAGACAGGTTCCCGGTTCAACACCCGCCGCCGC
+AGGTGCGGGTCGACGTGGTGTGCCCGCATTGCCCACCCCGCCGAAAGGTTGGCCAGTCGGGTCGTATCCC
+ACCTATGCCGAGGCGCAACGTGCGGTCGACTATCTATCCGAGCAGCAGTTCCCGGTCCAGCAGGTGACCA
+TCGTTGGCGTGGACCTCATGCAGGTTGAACGGGTCACAGGCCGGCTGACCTGGCCCAAAGTGCTTGGTGG
+CGGCGTGCTGAGTGGCGCCTGGCTGGGCCTGTTCATCGGGTTGGTGCTCGGGTTCTTCAGTCCCAATCCA
+TGGTCCGCGCTGGTTACCGGCCTGGTGGCCGGGGTGTTCTTCGGGCTGATCACCTCTGCAGTGCCGTACG
+CAATGGCTCGCGGCACAAGGGATTTCAGCTCGACCATGCAACTGGTTGCCGGTCGCTACGACGTACTTTG
+TGATCCGCAAAATGCGGAAAAGGCACGGGATCTGCTGGCGCGTCTGGCGATCTGAAGCCCGGACGAGAGG
+CAAATGTGGTCATGAGTCGCGGGCGGATACCGAGGCTGGGCGCTGCCGTACTGGTGGCGTTGACGACCGC
+GGCGGCGGCGTGCGGGGCCGATAGCCAGGGGCTGGTGGTCAGCTTCTACACACCGGCCACCGACGGCGCG
+ACGTTCACCGCAATTGCCCAACGCTGCAACCAACAGTTCGGCGGCCGGTTCACCATTGCGCAGGTCAGCT
+TGCCCAGGTCCCCCAATGAGCAACGGTTACAGCTGGCCCGACGGTTGACCGGTAACGACCGCACCCTGGA
+CGTCATGGCGCTGGATGTGGTGTGGACGGCGGAGTTCGCCGAAGCGGGGTGGGCGCTGCCGCTGTCGGAC
+GACCCAGCGGGGCTGGCCGAGAACGACGCCGTCGCCGATACCCTGCCAGGCCCGCTTGCGACGGCCGGCT
+GGAACCACAAGCTGTACGCGGCACCCGTCACCACTAATACTCAATTGCTTTGGTACCGACCAGATTTGGT
+AAATAGCCCGCCAACGGATTGGAATGCCATGATCGCTGAGGCGGCCCGGCTGCACGCGGCGGGCGAGCCT
+AGCTGGATCGCGGTACAGGCCAATCAGGGCGAGGGCTTAGTGGTGTGGTTCAACACGCTGCTGGTGAGCG
+CTGGTGGATCGGTGCTCTCCGAGGACGGCCGGCACGTCACCTTGACCGATACTCCCGCACACCGAGCGGC
+TACGGTCAGCGCGCTACAGATCCTCAAATCGGTGGCTACCACGCCCGGCGCCGACCCCTCGATCACCCGC
+ACCGAAGAGGGCAGCGCGCGGTTGGCCTTCGAACAGGGCAAGGCCGCGCTCGAGGTCAATTGGCCGTTCG
+TGTTTGCGTCCATGCTCGAGAACGCGGTGAAGGGTGGTGTGCCCTTCTTACCGCTTAACCGGATTCCGCA
+GTTGGCCGGCAGCATCAACGACATCGGGACGTTCACGCCCAGCGACGAGCAGTTCCGCATCGCGTATGAC
+GCCAGCCAGCAGGTGTTCGGTTTCGCGCCCTATCCGGCTGTAGCGCCCGGCCAGCCAGCCAAGGTGACGA
+TCGGCGGGTTGAACCTGGCGGTGGCCAAGACGACCCGCCATCGAGCGGAGGCATTCGAAGCGGTGCGTTG
+TCTGCGTGACCAGCACAATCAGAGGTACGTCTCGCTCGAGGGGGGTCTGCCCGCGGTGCGGGCGTCGCTG
+TACTCCGATCCGCAATTCCAGGCGAAGTATCCGATGCACGCCATTATTCGGCAGCAACTCACCGATGCCG
+CGGTGCGGCCGGCGACGCCGGTGTACCAGGCGTTGTCCATCCGGCTCGCGGCGGTGCTGAGCCCGATCAC
+CGAGATCGACCCGGAGTCCACGGCCGACGAACTTGCCGCGCAGGCGCAGAAAGCCATCGACGGCATGGGC
+CTGCTCCCGTGACCTCCGTTGAACAGCGGACCGCCACCGCGGTCTTTTCCCGTACCGGGAGCCGCATGGC
+CGAACGGCGACTGGCGTTCATGCTGGTCGCACCCGCCGCGATGTTGATGGTGGCGGTGACGGCCTATCCC
+ATCGGTTACGCGCTGTGGCTTAGCCTGCAGCGCAACAACCTGGCCACCCCGAACGACACCGCGTTCATCG
+GGCTGGGCAACTATCACACGATCCTGATCGACCGGTATTGGTGGACGGCGCTGGCGGTGACGCTGGCGAT
+CACGGCGGTTTCGGTGACGATCGAATTCGTCTTGGGGTTAGCGCTCGCCCTGGTAATGCACCGCACGCTG
+ATCGGCAAGGGGTTGGTGCGCACCGCGGTGCTCATTCCGTACGGCATCGTCACGGTGGTCGCCTCGTATA
+GCTGGTACTACGCCTGGACGCCGGGCACCGGGTATCTGGCCAACCTGCTGCCGTATGACAGTGCGCCACT
+GACGCAACAGATCCCGTCGTTGGGCATCGTGGTGATCGCCGAGGTCTGGAAGACGACGCCGTTTATGTCG
+CTGCTGCTTTTGGCCGGGTTGGCGCTGGTCCCCGAGGATCTGCTAAGAGCAGCGCAGGTTGACGGCGCCA
+GCGCCTGGCGGCGGTTGACGAAGGTCATCTTGCCGATGATCAAGCCGGCGATCGTGGTTGCTCTGCTCTT
+CAGGACCCTGGACGCTTTCCGGATTTTCGACAACATCTATGTGCTGACCGGCGGCAGCAACAACACCGGA
+TCGGTGTCGATCTTGGGCTACGACAACCTGTTCAAGGGGTTCAACGTGGGCCTTGGTTCGGCGATCAGCG
+TGCTGATCTTTGGCTGCGTGGCCGTCATTGCGTTCATTTTCATCAAGTTGTTCGGCGCCGCGGCGCCCGG
+GGGTGAGCCAAGTGGGCGTTGAACGGGTGGGCGCGCGGCGCGCCACGTATTGGGCCGTCCTGGACACTTT
+GGTCGTGGGGTACGCGTTGCTCCCGGTGCTGTGGATTTTCAGCCTGTCACTCAAGCCGACGTCAACGGTC
+AAGGACGGCAAGCTGATTCCGTCGACGGTGACTTTCGACAACTATCGTGGCATCTTCCGGGGCGACTTGT
+TCAGCTCAGCGCTGATCAACTCCATCGGAATCGGCCTGATCACCACCGTGATCGCGGTGGTGCTCGGCGC
+GATGGCGGCCTACGCGGTTGCCCGGCTGGAATTTCCGGGCAAGCGGCTGCTAATCGGGGCTGCCTTGCTG
+ATCACGATGTTCCCGTCGATCTCTTTGGTCACACCATTGTTCAACATCGAACGTGCCATCGGCCTGTTCG
+ACACCTGGCCGGGGTTGATCTTGCCGTACATCACCTTCGCGTTGCCGCTCGCGATCTACACCCTGTCGGC
+GTTCTTCCGGGAGATCCCTTGGGATCTGGAAAAGGCGGCCAAGATGGACGGTGCAACGCCCGGTCAGGCT
+TTCCGGAAGGTGATCGTACCGCTGGCGGCGCCGGGCTTGGTGACCGCTGCAATCCTGGTGTTCATTTTCG
+CCTGGAACGATCTGCTGCTCGCGTTGTCGCTGACCGCTACCAAGGCGGCGATTACCGCGCCGGTGGCCAT
+CGCCAACTTCACCGGCAGTTCGCAATTCGAGGAGCCGACCGGCTCGATCGCGGCCGGCGCGATCGTGATT
+ACGATCCCGATCATCGTCTTTGTTTTAATCTTCCAACGACGGATTGTCGCCGGGTTGACCTCTGGCGCTG
+TGAAGGGATAGCGCGATGGCCGAGATTGTGTTGGACCACGTCAACAAGAGTTACCCCGACGGTCACACAG
+CGGTGCGCGACCTCAACCTCACCATCGCCGACGGCGAATTTCTGATCCTGGTAGGGCCTTCCGGTTGTGG
+CAAGACCACGACGCTGAATATGATTGCTGGGCTTGAAGATATCTCGTCGGGAGAACTGCGCATCGCCGGT
+GAGCGGGTAAACGAGAAGGCGCCAAAGGACCGTGACATCGCGATGGTGTTCCAGTCGTACGCGCTTTACC
+CGCATATGACGGTGCGCCAGAACATCGCGTTCCCGCTGACCCTGGCGAAGATGAGAAAGGCCGACATCGC
+GCAGAAGGTCTCCGAGACTGCAAAAATCCTTGACCTGACCAACCTTCTGGATCGCAAGCCCTCACAATTG
+TCGGGTGGTCAGCGACAGCGGGTCGCGATGGGCAGGGCAATCGTGCGCCATCCCAAAGCATTCCTGATGG
+ACGAGCCGCTGTCGAACTTGGACGCGAAGTTGCGGGTCCAGATGCGCGGCGAGATTGCCCAGCTGCAGCG
+GAGGCTGGGTACCACCACCGTCTACGTCACCCACGACCAGACCGAGGCAATGACGCTGGGCGATCGCGTG
+GTAGTGATGTACGGGGGCATCGCACAGCAGATCGGCACCCCTGAGGAGCTTTACGAACGGCCCGCCAATC
+TGTTTGTCGCGGGCTTTATCGGCTCGCCGGCCATGAATTTCTTCCCTGCCAGGCTGACCGCGATCGGACT
+GACCCTGCCGTTCGGTGAGGTGACGCTGGCCCCCGAAGTCCAGGGGGTGATCGCAGCGCACCCGAAACCG
+GAAAACGTCATCGTAGGCGTGCGGCCGGAGCATATCCAGGACGCAGCATTGATCGACGCGTATCAACGCA
+TCAGGGCGCTGACCTTCCAGGTGAAGGTCAACTTGGTCGAGTCTTTAGGCGCCGACAAATATCTGTATTT
+CACTACCGAGAGCCCGGCTGTGCACTCGGTTCAGTTGGACGAGTTGGCGGAGGTAGAGGGGGAGTCGGCG
+TTACACGAAAATCAGTTCGTGGCAAGGGTTCCCGCCGAGTCCAAGGTAGCCATCGGGCAGTCGGTCGAGT
+TGGCTTTCGATACCGCCAGACTTGCCGTCTTCGACGCCGACTCCGGTGCGAACCTGACCATTCCGCACCG
+CGCCTAATGGCGGCGAGCGGACACATAAGCCCCCGCCACGCCGAAGGATTTGGAGCTTTTTGCGTCTGTT
+CGCCGACGCGAAGCTAGAGCCAGTTTCTGTTGCGGAAGACGTGGTAGAGGAACAGACAGATAAGGACCAT
+CCCGCCGATCACTGTCGGGTAACCCCACCTGGAGTCCAGCTCGGGCATGAAGTGAAAGTTCATGCCATAG
+ATGCCCGCGATCATGGTGGGGACCGCGATGATACCTGCCCACGCGGATATCTTGCGCATGTCCATGTTTT
+GCTGCATGCCGACCCGGGCGAGCGCGGCCTGCACCAGCGAGTTGAGCATGTCGTCGTAGCTGGCGATCTG
+GTCGGCGGCCTCGGTCTGGTGGTCGGCGACGTCGCGCAGGTAGCGCCGCACTTCTTTCGAAATGAGGTCT
+TTGCTCTCGGTCTGCATGCGCTGGAATGCGGTCGATAGCGGATTCACGCACCGGCGCAACTCGACCACTT
+CCCGCTTGAGCAGATAGATCGGTTCGATGTCGAGCTTGCGGCCCGGCGCGAACGCTACTTCCTCGATGCT
+GTCGATATCGGTCTCCATGAGATTGGTCACCTCGAGGTAGCGGTCGACCACGTAGTCGGCGATCGCGTGC
+ATCACCGCATACGGTCCCAACCGCAAATGTTCGGGGTCGGCATCCATCCGCTTACGCACCTCGGATAACC
+CGCCGTGTTCGCCGTGGCGGACGGTGACCACGAAATCCTTGCCGACGAAGATCATGATCTCGCCGGTTTC
+GACGATCTCGCGGGCCAGTACCACCGATTCGTGCGGGACGTAGTTGACGGTCTTGAGGACGAGGAACAGC
+GTCTCGTCGTAGCGCTCCAACTTGGGTCGCTGGTGCGCGTGCACGGCGTCCTCAACGGCTAACGGGTGCA
+ACCCGAAAACGTCTGCTACGTCCTGCATCTGGTTTTCATCGGGCTCGTGCAGCCCGATCCAGACGAACGC
+CTCCTGCCCGGTCAGTTCGATCTCGCGCACCTCGCGCAGCGCGGCGGCGTAGGTGTACTTGCCGGGCAGT
+CGCTGGCCGCAGACGTAGACACCGCAGTCGACCAAGGCTTGGGCCGGTGGCTGGGCAACGGGGTGTGCGT
+TCGGCGGCTGGGGTCGCGCGACCGGTCGCAGCACTTCGGGCAATGCGTCAAACCCTGGGAACACGTCAAC
+CTCCGATCGCGGTGGATCTGATCGGGCGGTGCTCCAGGTTACGCGTCCCGGTATGGAACTTGGTAAACGT
+CAGTCGTAGCTGTGGGGGTTGGACCCCAGATGTCCGTCCGGTGCCGGTGCGCTAGTTTCAACCCGAAGCC
+AAGTCCGTAAGGAGCAGAACCGACGTGAGCGCTAGTCCTCTCAAGGTCGCCGTTACCGGCGCCGCCGGCC
+AAATCGGCTACAGCCTGTTGTTCCGCCTGGCCAGCGGCTCTTTGCTGGGCCCTGACCGTCCGATCGAGCT
+GCGGCTGCTCGAGATCGAGCCGGCACTGCAGGCGCTCGAGGGTGTGGTGATGGAACTCGACGACTGCGCT
+TTCCCGCTGTTGTCCGGGGTGGAGATCGGTTCCGATCCCCAGAAGATCTTCGATGGTGTGAGCCTGGCCC
+TGCTGGTCGGAGCCCGCCCCCGGGGCGCGGGCATGGAGCGAAGTGACCTGCTGGAGGCCAACGGCGCGAT
+CTTCACCGCTCAGGGCAAAGCCCTCAACGCTGTCGCCGCGGATGACGTTCGCGTCGGGGTGACCGGCAAC
+CCCGCCAACACCAACGCGCTGATCGCGATGACCAATGCGCCCGACATTCCCCGCGAGCGGTTCTCGGCGC
+TCACCCGGCTGGACCACAATCGGGCGATCTCGCAGCTGGCCGCCAAGACCGGCGCGGCGGTCACCGACAT
+CAAGAAGATGACGATCTGGGGCAATCACTCGGCCACCCAGTACCCCGACCTGTTCCACGCGGAGGTCGCC
+GGAAAGAACGCGGCCGAAGTGGTCAACGACCAGGCCTGGATCGAGGATGAATTCATCCCGACGGTCGCCA
+AGCGCGGTGCGGCGATCATCGATGCGCGCGGCGCGTCGTCGGCCGCCTCGGCCGCGTCGGCAACCATCGA
+CGCTGCCCGGGACTGGTTGCTGGGGACGCCGGCGGACGATTGGGTCTCGATGGCCGTCGTCTCCGACGGG
+TCCTACGGGGTGCCGGAGGGCTTGATCTCCTCGTTTCCGGTCACCACCAAGGGCGGCAACTGGACGATCG
+TGAGCGGCTTGGAGATCGACGAGTTCTCCCGCGGCCGGATCGACAAGTCAACCGCCGAGTTGGCTGACGA
+GCGCAGCGCGGTCACCGAGCTCGGCCTGATCTGAGCGCAGGTCAGCCGCGCACTGAGCGGAGCCCGAGTC
+ATCTTGACGTGTGTTTGTCCAGGCATCATGATGACCTGTATGCGCACCACCTTGACGCTCGATGACGACG
+TCGTCCGGCTGGTCGAAGACGCAGTGCATCGCGAACGCCGCCCGATGAAGCAGGTCATCAACGATGCGCT
+GCGCAGAGCGCTGGCGCCGCCGGTGAAACGGCAGGAGCAGTATCGGTTGGAGCCGCATGAGTCGGCTGTG
+CGTTCCGGGTTGGATCTGGCCGGCTTCAACAAGTTGGCCGACGAACTGGAGGATGAGGCGCTGCTGGATG
+CCACGCGTCGGGCCCGGTGATCATCCCTGACATCAATCTGCTGCTCTACGCGGTCATCACCGGATTCCCG
+CAGCACCGGCGCGCGCATGCGTGGTGGCAAGACACCGTCAACGGCCACACCCGTATCGGGCTGACGTATC
+CGGCGTTGTTCGGGTTCCTACGGATCGCCACCAGTGCCCGCGTGCTCGCCGCGCCACTGCCAACCGCGGA
+TGCGATCGCCTATGTGCGCGAGTGGCTTTCGCAGCCGAACGTGGACCTACTCACGGCGGGTCCGCGCCAC
+CTGGACATCGCGTTGGGCCTGCTCGACAAGCTCGGCACAGCCAGCCACCTAACCACCGATGTGCAACTGG
+CCGCCTACGGCATCGAATACGACGCCGAGATCCATTCCAGTGACACCGACTTTGCCCGATTCGCCGATCT
+GAAGTGGACCGACCCGTTGCGCGAATAATGACTGCCGCTCTGCCCTCGGGTCAGCCGTTCAGGCCGTGCT
+GACCGTTGGCGCCGGTAGCGCCTTGAGTACCGGGATCGCCGGGGGCGCCGGGGTTGAACCCGGTCCCGCC
+GCCGCCGCCCGCGCCGCCGTTGCCGCCCGCGCCGCCGAGGCCCCCGGCCGCGCCGGAGCCGGGGCTGCCC
+GACTGTCCGAACAGTCCGCCCGCACCGCCGGTCCCGCCGTTTCCGCCGACGCCACCGGCCCCGCCGGCCC
+CGCCGTCGCCGCCGTTGCCGCCGTCACCGCCGTCGCCGTCCTGGTTGGCCATGCCGTCGGCGCCGATCCC
+GCCGTTGCCGCCGTTGCCGCCGCTGCCGCCTTGAGCGCCGATGCCCCCGTCGCCCCCGACGCCGCCGTCG
+CCGCCGGCGCCGCCCGTGCCGAGCAGTAGCCCGCCGCGACCCCCGCTGCCCCCAAAGCCGCCGGCGCCAC
+CAACGTCAGCCGAGGCACCGACGCCGCCGTCGCCGCCGGCACCACCATTGCCCCCGGTGGAGTTGCCCCC
+AGGAGGATTATCTTGATTGGCATTTCCTCCGGCGCCGCCGGCACCACCGGGAGCGCCGATACCGCCGTTC
+CCGCCGGCGCCACCGTTGCCCCCTATGCTGTTGCCAGCATTTGCAACATTGGCGCTGCCACCCGCTCCGC
+CCAGCCCCCCGCCGCCGCCGGCTCCGCCGTTTCCGCCGGCGCCGCCATTGCCGCCGACAGCGTCACCAAA
+GCCGCTTTGAGCGGCGCCACCGTTACCGCCGGCACCTCCGGAGGCGAAGTTGGCGCCGTCGCCGCCGTCG
+CCGCCGGCACCCCCGGACACGTCGGTCTGCCCAAGGTTGGTTCCATCCCCGCCTATGCCGCCTGCACCAC
+CGCCCACGCCGGGGTTGACTGCGTTGCTGCCCGAGCCGGCGTCGGTCCCGTTGCCATCGGGTCCGGTAGT
+GCCGTCGGCGCCATCGGTCGCGTGCGTGACCTGATGGGACACCGGGTTTTGCCCGTTGGCGCCGGCCGCT
+CCTGCCGCTCCGGCTCCACCCGCCCCCCCGTTGCCCCATAGCCCGGCGTTGCCGCCGTGGCCTCCGTTGC
+CGCCATTGCCCCCGATCTGGGTGGCCGCCCCACCGTTGCCGCCGAGCCCACCGTTGCCGTATAGCCACCC
+GCCGTTGCCGCCGGCACCGCCGTTCGCGCCGGGCCCGCCGGCTCCCCCGGCGCCACCGTTGCCGATCAAC
+CCGGCCGCGCCGCCGCGACCGCCGGGCTGGCCTGGGGTGCTACTCGAGCCGCCGTTGCCGCCGTTGCCGT
+ACAACAAGCCACCGTCGCCCCCGTTTTGTCCCGGCCCGCCGTTGGCGCCATCGCCGATCAGCGGGCGCCC
+CAGCAACAGCTGGGTGGGCCCATTGACCACATCCAGCACCGCTTGCATCGGGGAGGCATTGGCGGCCTCG
+GCCGCCGCATACGAGCCGGCCGCCGAACTCAGTGCCCGCACAAACTGCTGATGAAATGCCGCCGCCTGTG
+CGCTCAGCGCTTGATAGGCCTGGGCGTTCCCGGAAAACAGCGACGCGATGGCCGCTGATACCTCGTCGGC
+ACCCGCGGCCAGCAGCCCCGTGGTCGGGGCCTCGGCCGCCCTGTTAGCTGCGGCCAGCGCCGAGCCGATG
+CCCTCCAAATCAGCGGCCGCGGCCACCAACACGTCCTGCGCTGCAATCAGATACTCCATCGCGGGGCCTC
+TCTCGCGGCGAGATTGACCAACGGGTCGGCACGAAGCGTGTCCCGTTGCTTGACGGTGCATTGCGTGTTT
+GCCTGGATCCCCGCGCCGACGGTGTGGATCGGGCCCAGTACCCTCAAGCCCGTGCCAACTGCATCTGTCG
+CGGTGACTATCGGCTCAGACACTTCGGTGTGAGAATCACCAGGATCCTCGCGCTGCTGCTTGCCGTCCTG
+CTTGCAGTGTCTGGCGTGGCTGGTTGCTCGGCCGACACCGGCGATCGCCACCCGGAGTTGGTGGTCGGAT
+CCACGCCGGACTCCGAGGCGATGCTGCTGGCCGCCATCTACGTCGCGGCGCTGCGGTCGTACGGTTTTGC
+GGCGCACGCCGAAACCGCCGCCGACCCGGTGGCGAAACTGGACTCGGGCGCGTTCACCGTCGTACCCGCT
+TTCACCGGTCAGATGTTGCAGACCTTGCAACCCGATGCGTCGGTGCGCTCGGATGCCCAGGTATACCGCG
+CCATCGTCTCGGCCCTTCCCGAGGGCATAGCCGCAGGCGACTACACCACCGCCGCAGAAGACAAACCCGC
+GTTGGTGGTGACTCAATCCACCGCCAAGGCCTGGGGCGGCGGCGATCTCAGCGAGCTGCCCAGCCACTGC
+CGCGGGTTGTTGGTCGGGCGCGTTGCCGGCGCCCACACACCCGCGGCCGTGGGACCGTGCCGGCTGCCCG
+CCCCGCGTGAGTTTCGGAATGACGCAACAATGTTCGCCGCGCTGCGGGCCGGACAGCTGGTCGCGGCCTG
+GACCACCACCGCCGACCCCGACATCCCCGCGGACCTGATCATGCTGACCGACGGCAAGCCCGCGCTGATC
+CGGGCCGAGAACATCGTTCCGCTGTATCGTCGCAACGCGCTGACCGAGCGGAAACTGCTGGCCGTCAACG
+AGGTCGCCGGCGTGCTGGACACCACGGCCCTGATCGGGATGCGCCGCCAGGTGGCCGCGGGGGCCGACCC
+GGCGGCGGTGGCCGCCGGCTGGCTCGCCGAACACCCGCTGGGACGTTGAGCCGCCACGAGCGTCCGGGTC
+GACGCGATGACACACCGCGTCGGCCGAACAACCTTCGGGCGCGCTTTCCTCACCAGCCGTCAGCGCGGGC
+GGGGTATCAACCGGCCGGTGATGATCGGAAAGATCCGCTGATATCCGGAACCGGTCAGCCGGACCACCAG
+GTCCAGTACCTTGGCGTCGACACCCACCAACACCCGGGCCTTGTTCTTGGCCACCCCCGTCAGGATGATC
+TGCGCGGCCCGCTGTGGGCTGAGATGGGCCACCCGCTTATCGAACGTCTCGGCCAGCTCGGCCTGGTCAA
+GTCCCTCGGCGGCGGTGGCGTTACGGGCGATCGCGGTCTTGACACCGCCGGGGTGCACCGTCGTCACCTT
+CACCGGGTGACCCGCCAACGCCATTTCCTGGCGCAGCGCCTCGGTAAAGCCGCGGACGGCGAACTTGGCC
+GAGTTGTAGGCCGCCTGACCCGGCGCCGAAAACAACCCGAACACGCTGGAGATGTTGATGACGTGGCCGT
+CCCCGGAGGCGATCAAATGCGGCAGGAACGCCTTGGTGCCGTTGACCACACCCCAAAAATCGACGTCCAT
+CACCCGTTCGATGTCCTTGAACTGGCTGACCTCGATATCGCCGGTAAAGGCGATGCCGGCGTTGTTGTAG
+ATCTGGTTCACAGTGCCGAAGTGCTCGTTGACCGCATCGGCGTAGGCTAGGAAGGCTTCGCGTTCGGTTA
+CGTCGAGTCGGTCCGTCTTGACCGGCGTGCTGATCGCCTTTAGCCGGTGCTCGGTGTCTGCCAGGCCGTC
+GGTGTCGACGTCGCTGATGGCCACCTTGGCGCCCGAGCGGGCCAGCTCGATTGCCAGCGCCTGCCCGATG
+CCCGATCCCGCGCCGGTGACAACGGCGACCTTTCCGGCGAACCCCTCCATGACGTACCCTCCCTTGTCTC
+GGCTGCCATCAGGTTAGCCGGTACCCGGGGTACGGCTTAACGTGGCCGGCACGGGTTCATTCGGTAGCTG
+GCACTGCGACGAGCGATGTGGATGATCTCGACTCGGTGGTGGCCGTCGTCGATGGCGTAGACGACGCGGT
+AATCACCGCGGCGGGCTGAGTGGAGGCCTTCAAGGTCATTGCGCAGCGGCTTGCCCAACCTATGCGGGTT
+GTTAAGCAGCGGTCCGAAAACAAACTCGACACATGCGGCGGCGATCTTTTCGGGTAAGCGTTGCAGGTCG
+CGTGCCGCTGTCGCGGTGATCGCCACGTGGTAGGGATGGTCGTCGCTCACCGCGCGGTGTAACGGTTGCG
+GATCTCGTCGTTGCTCACGAAGCGCCCTGCGGCAACATCGGCGAGGCCTTCACGAATGGCCTCGCTGGCG
+CCAGGGGTGCGTAGCACCTCCAGCGTTTCCTCGATGGACGCCAGGTCATCGGCCGAGATCAATACCGCCG
+CCGGATGACCGTGCCGGGTTATCGTGATGCGCTCGTGTGTCAGCTCAACTTCGGCGACGTACTCAGAGAG
+GCGATTGCGGACTTCGCCCAGTGGGACAACAGCCATAACCGCGATTGTAGCTAAAAGTATGGCTAAACCC
+TGTACGCCGAGCATCGGCTTACCGAGCCGAACGCCTCGTCGCTGTTTGATGTCTCCTCGAGCGTTCGGCT
+GAGCGAACTCAGCCGAACGCCTCGTCGAGGATCTCCTGCTGTTCGACGGCGTGCACCTTCGACGAGCCTG
+ACGACGGGGCTGACATCGCCCGGCGCGAGATTCGCTTGATCCCGGCCAACTTGTCAGGCAGCAGCTCGGG
+TAGTTCGAGCCCGAATCGCGGCCACGCACCCTGGTTGGCCGGTTCCTCTTGGACCCAGAAGAACTCCTTG
+ACGTTCTCGTAGCGGTCCAGCGTTTCACGCAGTCGACGCCTGGGCAGCGGGGCGAGCTGTTCAAGCCGCA
+CGATCGCGAGGTCATTGCGGTTGTCCTTGGCCTTGCGGGCGGCCAGCTCGTAATACAGCTTGCCACTGGT
+CAGCAGGATCCGGCTGACCTTGTTGCGGTCTCCGATGCCGTCCTCATAGGTGGGTTCCTCCAGCACTGAG
+CGGAACTTGATCTCGGTGAAGTCCTTGATTTCGCTGACGGCGGCCTTGTGACGCAACATCGACTTGGGCG
+TGAACACGATCAGCGGGCGTTGGATGCCGTCCAGGGCATGCCGGCGTAGCAGGTGGAAGTAGTTCGACGG
+AGTCGACGGCATCGCGATGGTCATCGAACCTTCCGCCCACAACTGCAAGAAGCGTTCGATCCGGGCAGAA
+GTGTGGTCGGGTCCCTGCCCCTCGTGCCCGTGCGGTAACAGCAGCACGACGTTGGACAATTGGCCCCACT
+TGGCCTCACCGGAGCTGATGAACTCGTCGATGATCGACTGTGCGCCGTTGACGAAGTCGCCGAACTGCGC
+CTCCCAGAGCACCACGGCGTCCGGATTGCCCACAGTGTAGCCGTACTCGAAGCCGACGGCGGCGTACTCC
+GACAGTGGCGAGTCGTAGACCAGGAACTTTCCGCCGGTCGGGCTGCCGTCGGAGTTGGTCGCCAGCAGCT
+GCAGTGGTGTGAACTCCTCGCCAGTGTGGCGGTCGATGAGAACCGAATGCCGCTGGGAGAAGGTGCCGCG
+GCGGCTGTCCTGCCCCGACAAGCGCACCAGCTTGCCTTCGGCCACCAGCGAGCCCAGCGCCAGCAGCTCG
+CCAAAGGCCCAGTCGATCTTGCCTTCATAGGCCATCTCCCGGCGCTTCTCCAGCACCGGTTGGACTCGCG
+GGTGCGCGGTGAAGCCGTTCGGCAAGGCGAGGAACGCATCGCCGATCCGGGCCAGCAGCGACTTGTCCAC
+CGCAGTGGCCAGCCCCGCGGGAATCATCTGGTCGGACTCGACCGACTCGCTCGGCTGCACACCGTGCTTC
+TCCAGCTCGCGCACTTCGTTGAACACCCGTTCCAGCTGGCCCTGGTAGTCGCGCAGCGCGTCCTCGGCCT
+CCTTCATCGAGATGTCGCCACGTCCGATCAGGGCTTCGGTGTAGCTTTTGCGGGCCCCGCGCTTGGTGTC
+GACGACGTCGTACATGTAGGGGTTGGTCATCGACGGGTCGTCACCCTCGTTGTGCCCGCGGCGGCGGTAG
+CACAGCATGTCGATGACGACGTCCTTCTTGAACCGTTGTCGGAAGTCCACCGCCAACCGCGCCACCCAGA
+CACACGCCTCCGGGTCGTCGCCGTTGACGTGAAAGATCGGTGCCCCGATCATCTTTGCGACGTCGGTGCA
+GTACTCGCTGGACCTGGAATACTCGGGCGCGGTGGTGAAGCCGATCTGGTTGTTGACGATGATGTGGATG
+GTGCCGCCGACGCGGTAGCCCGGCAGATTCGCCAGGTTCAGCGTCTCGGCGACCACACCCTGACCGGCGA
+ACGCGGCATCGCCATGCAACATCAGCGGCACCACCGAGAACGCCCGTTGGCCGTCGCTGTCGATGCTTCC
+GTGGTCGAGCAGATCCTGCTTGGCCCGCACCAATCCCTCCAGCACCGGGTCGACGGCCTCCAGATGCGAC
+GGGTTGGCGGTCAGCGACACCTGAATGTCGTTGTCGCCGAACATCTGCAGGTACAGCCCGGTGGCGCCCA
+GGTGGTACTTGACGTCACCGGAGCCGTGCGCCTGCGACGGATTCAGGTTGCCCTCGAACTCGGTGAAGAT
+CTGCGAGTACGGCTTGCCGACGATGTTGGCCAGCACGTTGAGCCGGCCCCGGTGCGGCATCCCGATGACC
+ACCTCGTCGAGGCCGTGCTCAGCGCACTGGTCGATCGCCGCGTCCATCATCGGGATCACGCTTTCGGCGC
+CTTCCAGCGAGAACCGCTTCTGGCCGACGTACTTGGTCTGTAGGAACGTTTCAAAGGCCTCGGCGGCGTT
+GAGCTTGCTGAGGATGTATTTCTGTTGGGCCACAGTGGGTTTGACGTGCTTGGTCTCGACCCGTTGTTCG
+AGCCACTCCTTTTGTTCGGGGTCGAGGATATGGGCGTACTCCACGCCGATGTGGCGGCAGTAGGCATCGC
+GCAGCAAGCCCAGCACGTCGCGCAGTTTCTTGTACTGCGCACCGGCAAAGCCGTCGACCTTGAACACCCG
+ATCGAGATCCCACAGCGTCAGGCCGTGGGTCAGCACTTCGAGGTCGGGGTGACTGCGGAACCGAGCTTTG
+TCCAACCGCAGCGGGTCGGTATCGGCCATCAGATGGCCGCGGTTGCGGTAGGCCGCGATCAAGTTCATGA
+CGCGAGCGTTCTTGTCGACGATCGAGTCGGGGTTGTCGGTGCTCCAGCGCACCGGCAGATATGGGATGCT
+CAGTTCGCGGAAGACCTCGTCCCAGAAGCCATCCGAGAGCAGCAACTCGTGGATGGTGCGCAGGAAGTCG
+CCCGATTCCGCGCCCTGGATGATGCGGTGGTCGTAGGTGGAGGTCAAAGTGATCAATTTGCCGATGCCCA
+GCTCGGCGATGCGTTCCTCGCTGGCGCCTTGAAACTCGGCGGGGTATTCCATGGCGCCCACGCCGATGAT
+GGCGCCCTGGCCGGGCATCAGCCGCGGCACCGAATGCACGGTGCCGATGGTTCCGGGATTGGTCAGCGAA
+ATCGTCACGCCGGCAAAGTCTTCAGTGGTCAGCTTGCCGTCGCGGGCCCGGCGTACGATGTCTTCGTAGG
+CCGTGACGAACTGCGCGAATCGCATGGTCTCGCACCGCTTGATGCCGGCCACCACCAGGGAACGCTTCCC
+GTCCTTGCCTTGCAGGTCGATCGCCAGGCCGAGATTGGTGTGCGCCGGCGTGACCGCGGTGGGCTTGCCG
+TCGACTTCGGTGTAGTGCCGGTTCATGTTCGGGAATTTCTTCACCGCCTGCACCAGGGCGTAGCCCAGCA
+AATGCGTGAACGAGATCTTGCCGCCGCGGGTCCGCTTCAACTGGTTGTTGATGACGATCCGGTTGTCGAT
+CAGTAGCTTGGCCGGGACCGCCCGGACGCTGGTCGCCGTCGGCACCTCCAACGACGCGGACATGTTCTTG
+ACGACGGCCGCGGCGGCGCCGCGCAGCACCGCTACCTCGTCACCTTCGGCTGGCGGGGGAACGGCAGTTT
+TGGCGGCCAGTGCGGCGACCACGCCGTTGCCCGCGGCCGCGGTGTCGGCCGGCTTGGGGGGTGCCTGCGG
+GGCGGCCGCAGCGGCCCGCTCGGCAACGAGTGGCGAGGTAACCCGGGTTGGTTCGGCAGCTGGTTGGGAG
+GTGGGTTCGGGGCTGTAGTCAACCAGGAACTCGTGCCAGCTGGGATCGACCGAGGAGGGGTCGTCGCGGA
+ACTTGCGGTACATCGCTTCGACCAGCCATTCGTTTTGCCCGAATGGTGAACTTATGTTGGCCACGGCCGC
+TGTTCGCCTCGATTCTTCTGCTAGTTGAAGTCCTGCAAGCGCATTGCGCGGCGCCTGCTGGCAGTCGGTG
+AACGGTCTGCCCCATAAAGGCTAACGCTTTGCCAGCGATTCGCCAGAGAGACCGGGCAACGCGCGCTAGC
+TGGCATCCCGAACGGTCGGTAGCACGTGCAGGGTGACCGGCCAGCGCGCCGGCGGGGTGCCGAATGCCGA
+TCGCGCATTACGGACGAGCTTCTTGCCGACCAGCCGATTGCCGATGGCGCCGATGATCGCGCCGATACCC
+ATCGGCACCAGCTTGCCAAACATGAGCGCGCCGCGTTTCAGCGCGAATCGTTTGACGACGTATTTGAGCA
+TTCGCGAGTTCAACGACGATATCGCCGGCAGCGGCAGCGAGGCCATGGTCTCCGACACCCAGCCGCCGCT
+GGTTCGGCCCGGACCGAGCAGATCGGCCACCGCAGTAGTGTTGTCGCCGACCAGCACCGCCAAGACCAGG
+GCACGGCGCCGTTCTCGGTGGTCGAGGGGAATGGCGTGTACCGAGGCCAGCGCCAGCACGAACAGCGCGG
+TGGCCTCGAGGAACACGACAACCTCTCCGGCCGCGGCGAACCATGCGGCCAGGGTGCCGATCCCCGGTAA
+GGTCGCGGCCGTACCTACCGCCGCTCCACTGGCCGTCACCACCGACAAGAAGCGTTTCTCGAGCTTGGCT
+ACGATCTTGGCGGGGCTGGCCCCCGGGTGGGCGCGACGCAGGCGGGCCACATACGCCTGTGCTGCCGGGC
+CCTGTATCCGCGAACTCCGTTCGATGACCTGCGCCAATGCCCGCGTGGACACTTTGGGCCGCCCGCCGGT
+CCCGGCCAGCTGCGGGTCCGGCTCAGCTGCATTTGCGGATCGATTGTCGAACCTTTTCCAAGACCTGATT
+CGTCGAGCGCTCATCTTCTCTCCTGCGAATGGCGTCCCCTCAGGCTAATGCCGGTTCAACGATCCGAGCA
+TGTGTTTCGGTAGCGGCGCGGTTCACCGCTCGAAGCGGAATAATGCGGCGTGGACATTGGTGACGATACG
+GGTTGCCCTGGTGCATGCCGTGACGCCCGTGACCCAATGCCACCGCTAGCAAGCCAAACGAGGTGCGTGT
+ATGACTACGGCGATACGCCGGGCGGCCGGGAGCAGCTACTTCCGAAACCCCTGGCCTGCGCTGTGGGCGA
+TGATGGTTGGCTTCTTCATGATCATGCTCGACTCCACCGTCGTAGCCATCGCGAATCCGACCATCATGGC
+CCAGCTACGCATCGGTTACGCCACCGTGGTTTGGGTGACCAGCGCCTATCTGCTGGCCTACGCGGTGCCA
+ATGCTGGTGGCCGGCCGGCTTGGCGACCGGTTCGGCCCGAAGAATCTCTACCTGATTGGCCTGGGGGTAT
+TCACCGTTGCGTCGCTGGGGTGCGGTCTGTCGAGCGGTGCCGGCATGCTGATTGCCGCTCGAGTGGTGCA
+AGGCGTCGGCGCCGGATTGCTTACCCCGCAGACGCTGTCGACGATAACGCGGATCTTCCCGGCTCATCGC
+CGCGGTGTCGCGCTGGGCGCATGGGGCACCGTCGCCAGTGTCGCCAGCCTGGTGGGACCGTTGGCCGGCG
+GCGCGCTGGTCGACAGCATGGGGTGGGAGTGGATTTTCTTCGTCAACGTTCCCGTCGGCGTCATCGGCCT
+GATCCTGGCGGCCTATCTGATTCCGGCACTACCCCACCACCCGCATCGGTTCGATTGGTTCGGCGTCGGA
+TTGTCTGGTGCGGGAATGTTTCTGATTGTCTTCGGACTACAGCAGGGCCAGTCCGCCAATTGGCAGCCTT
+GGATTTGGGCGGTGATCGTCGGCGGTATCGGGTTTATGTCGCTGTTCGTTTACTGGCAGGCGCGGAACGC
+CCGCGAGCCGCTGATCCCACTGGAGGTCTTCAACGACCGGAACTTCAGCTTGTCCAACCTCGGGATAGCG
+ATCATCGCCTTCGCGGGGACGGGGATGATGCTGCCGGTGACGTTTTATGCGCAGGCGGTGTGTGGGTTGT
+CGCCGACCCACACGGCCGTGCTGTTCGCGCCGACGGCGATCGTCGGTGGCGTGCTGGCCCCGTTCGTCGG
+CATGATCATTGACAGGTCCCATCCGTTGTGCGTACTGGGTTTCGGCTTCTCGGTGCTGGCGATCGCAATG
+ACATGGCTCTTATGCGAGATGGCTCCGGGCACGCCCATCTGGCGGCTGGTGTTGCCGTTCATCGCGTTAG
+GCGTTGCTGGGGCGTTCGTGTGGTCGCCGCTGACCGTCACCGCGACCCGCAATCTACGGCCGCACCTGGC
+CGGTGCGAGCTCAGGTGTGTTCAACGCCGTCCGGCAGCTGGGGGCTGTGCTGGGGAGCGCGAGCATGGCC
+GCGTTCATGACGTCGCGCATCGCCGCCGAGATGCCCGGTGGTGTGGACGCCCTTACCGGTCCCGCCGGGC
+AGGACGCTACCGTGTTGCAGCTGCCCGAGTTCGTGCGCGAACCCTTCGCGGCCGCGATGTCGCAATCGAT
+GCTGTTGCCCGCCTTCGTCGCCCTATTCGGGATCGTTGCCGCGTTGTTCCTGGTTGACTTCACCGGTGCT
+GCGGTTGCCAAAGAGCCGTTGCCCGAATCCGATGGCGACGCTGACGACGACGACTATGTCGAGTACATCC
+TTCGTCGGGAACCGGAAGAGGATTGCGACACCCAGCCGCTGCGGGCGTCGCGCCCGGCAGCGGCCGCAGC
+GTCACGCAGCGGTGCTGGGGGTCCGCTGGCGGTCAGCTGGTCGACGTCAGCCCAAGGAATGCCCCCAGGT
+CCACCAGGCCGTCGGGCGTGGCAGGCAGATACTGAGTCAACAGCTCCGAGCGCACTATAACCGCGGCATA
+CTGTGCCCGACTGACCGCGACGTTGAGCCGATTCCGGTTGAGCAGGAACGAGATTCCGCGTGGAACATCG
+TCGGCGGACGAGGCCGTCATCGAGATGAAGACCACCGGTGCCTGCCCGCCCTGGAATTTGTCGACGGTGC
+CTACCCGTACTCCGTCAGCCCCGCCAAGTCCGGCAGACGCCAACCGCCGACGGACCAGCGCCACCTGGGC
+GTTGTACGGCGCGAGCACAAGCACATCGGAAGCGGCCAGTGGCCGGGTGCCGTGCTCGTCGGTCCACGGC
+GAGCCGAGCAGCTGCCGCAGCTCGGCGAGGATCGCCTCGGCCTCTTCGGGGCTTTCGATCGAATTGCCCT
+TGTGGTGCACGCCACGCGTATGCACCCCCGGGGGATACCCGTCGAGGCGGCGCACGGCGGTGCGCTCGGT
+GTGGGAACACAGCCTGCCCTCGTAGGACAACGCCGACACGGCCGCGCACACCGCCGGGTGCATCCGGTAC
+GAGCGGTCTAAGAAGTAGCCGCGTTCGTCGGGCAGCGTGTGTTGCCCATCTACCAGCCACGACAATGCGG
+AGGTGTCGACGGGTTCGGGATGTGTGCCCTGACTTACCTGAGGCAGTTGCTGTGGATCGCCAAGCAGCAA
+CAGGTTTGTGGCCGCGGGCGCCACGGCGATGGTATTGGCCAGGCAGAACTGGCCAGCCTCGTCGATCACC
+AGCAGATCCAGGCTGGCTTTCGGCACCCGATTGCCGTTGGCGAAGTCCCACGCCGTGCCGCCGATCACGC
+ATCCGGCGGTGTCGCGGATGAATTCTGTGTACTGGCTCCCGTCGATCGACTGCCAGCGCCCAGCGGTGTG
+GTCGTGCGGCTTTTTGGCGACCTGCCCCGGGTCCAGGCCAGCGCTGATCACACCTTCCAACAGGTTCTCC
+ACCGTGGCGTGCGACTGGGCGACAACGCCAATACGCCAGGCATGCTCGGTGACCAACTCCGCGATCACCC
+GGGCCGCGGTGTACGTCTTGCCGGTCCCCGGAGGGCCGTGCACCGCCAGGTATGACGAGTCCAAGTCCAG
+CGCCGCCGCGGCGATATCGGTGACTGGGTCACTGCTGCGGGGCAATGCGGCGCCGCTGCGCGTGCGAGGA
+GGGCGACGCAGCAGCACGTCCATTAGCGCGGTGCTGGGCAGTTGCGGCGATCCGGAAGCCACGGCAGCGG
+CCGTCGATTCGATCGATTCCCGCAGGGCCGTCGTCGGCACCGGCGGCCCGGGAGCGAGCGCGAACGGGAG
+CTGCTGAAATGTGTTGCCGTCACTGCCGGTTCGTTCGACGATGACCACCTCGGTGGGCACAGTGGGGTCG
+TCGGTCTCAACCACTGCGGCGGGGCCCGCGGCTCGGCGATCAGGATTGTCGGTCATGCCCGGCGGCGCCG
+GGGGTTCGTAGAGGGCAAACACATTCCCGTTGAGGTCCCCACGTGCCAGTTCACCGGTAAGCCGGACCCG
+CCGCTGCGGCTTGCGCGCGCGAGGCGGCATATGCCAGTCGACGGTGACCGAAGCCTCGCTGGCAAGGAAG
+ACGTCCGTGCTGTCCGACCATTCGTCGACGGGGTAGTTGAGCCGGTCGAAGTGCGCCCACCAGAACGGCT
+TGTCCTCGCGGCGATGATAGCCGCGGGCAGCGGCCAGCAAGGCGACCGCTGTCTGTTCCGGCGTGCGCTC
+GCCGGCGGCGGCATCGCCGGTGAACTTGGACAGTACCGACGCCAGCGAGTCACCGTCGTCGATAGGGTCG
+GCGTCCGGAACTGGTTGAGCGCCAATGGGTGTGACGCCGGCTTCCCAGGCGCGCATGAGCAGCCAGTCAC
+GCAGCGCGCGGGTGGACCGGCAGTCGTAGTGGTTGTAGCCTTCGATCTCTTTGAGCACGGTTGCCGCCTC
+ATCGATGCGGCCGGCCGCGCGCAGTTCGCAGTACCGGGCATAGGAGTTGATCGAGTCGGCGGCGGTGGTG
+ACGTCGCCGGAGCGTGGCTGCGTCCCGAGGTACAGCGGCTCCAGCGCCTTCAAGCTGAACGAGTCGGTGC
+CCACCCGAATGCTCTTGCGTACCAACGGGTATAAGTCCACCAGGACTCCGTTGCGCAGCAAGTCGTCGAC
+GTCGTCCTCGCCGATGCCGTAGCGTCCGACCAGCCGCAGCAGCGCGGTCTTCTCGTAGGGCGCGTAGTGG
+TAGATGTGCATGTTGGGGTGGCGCCGGCGCCGTCTGGCGACTATCGCCAGGAAATCGGTCAGCGCCTGGC
+GTTCGGCTGTCCGGTCATGCGCCCACAATGGTCGGAATACTCCCGCCCGTCCGGCTTCCAGCACCCCGAA
+CAGGTATTCCAGGCCCCACTGTTTGCCGTCGGCGGTCCACAGCGGGTCACCCTCGAAGTCGAAGAACAGG
+TCGCCGGGGTTTGGCTCCGGCAGCAGTGTCAGCGGCCGCGGGTCGACGATCTCGAACTGTGGTGCTCCCG
+TATCGCGTTGGCGGATTTGCAGTTTGGCCTGTGCGGTCAGCTTGCCCAGCGCGTTCGTGGTCAGGCCGGG
+AACCGGCGCGGTGTGATCTGCCAGTTCGGCGATCGTGGTGATGCCGGCCTCAAGGAGCTTGTCGCGCTGG
+CGGACTCGCATCCCTCCGACCAGTAGCAGATCGTCGCTGGCGCGCAGCCGCTCGGTGCACTGCGGACAGC
+GGAAGCACGCCTGCACGCGTTCGTCGTCCCAGCGCACCGCGGTGCCCGCGGTGTAGTGGCCGTCCAGCAA
+TCGCTGTAAAAGCGCACGCTGGGACCGGTAGACCGGGATGAGCTCGCCGACGCGGTAGCGCACGATCGTG
+CCGTCGCCGAGTTCGAGCTCGGCGTCGGCAGCCACCGGAACGCCCGAGTGAACCAGCGCATCGGCATAGG
+CCGCCAGCTGTAGCAGCGCGGTCACGGTTGGCGAGCGGGCGAGCTTGGTGTCGGCGACCCGGTACCGGTG
+ACCGTCGCGGATCAGGAAGTCGGCGAACCCGACGAAGCGGCCGTCGAACATGGCGGCCTGATACACCACC
+GGGGCGTGGTTGGCGATGGCACGTCGCGTCGCGTCGGCGGCTGCCGCCAGCCCGGCGGGCGTGTAGGCCG
+GCCGGCCAATGATAGCCACCGCGTCGCCGAACTCGTGGCGCAGTTGGTCGAGTCGGCGTCCTTCATGCGC
+GCTACCGAGAACGGCGGCTCGCGCCATCAGTTCGTCGTCAACTGCGACGGCCGGTCCCCGGCCTAGTTTC
+GCGTCGAATTCACGGAGCAGTGCGTACTGGCACCGGGCGGCGGCTGCGAGATCCGAAGCACTGTAGACGA
+TGCTGTCACCGGTGACGAACACAGCAGCAACTCCTCGGTGAGACAACGGACAGGCAAACTGGGCTGCACC
+CGTCGGCTTAACCGCCGGTGGTGTTGCCGATCAGCTCGACGCCGCCGCCGTTCCAGCGGAACTTGACAAC
+GTTGTTCAACCCGATGCCGCTGGCATACGTCAATGCCACCGTGTCTCCCGTGCACTGCGAGGTGTCGATG
+CCGGTGAACCCATAGGTATCGGGCACCCCCTGCGGTATGTACTTGCCGAGGTGGAACATCACCGCGCGGG
+TGGTCGGATTGCCGGCGTTCGTGTTGGCCTTGATGACCACCGCCGACAGCTGGGCACACTCGTTGTAGTT
+GCCGGCCAGCGGTTCTGGGTTCCAGGGCTGCTCACTGCGCGGATCGCGAGGAAGTTCGGAGACGACTTTG
+GCGATTGTGGGCGAGGCGAGGTTCACCGCACACGGGTCGACCGGCGCGGCGCTGTGGTTGCTGGGTGGGG
+CAGCTGTCGCGGACGGCGGGCTCGGTTCGCTGCTCGGCGGGGCCGGGTGAGCAGTTGACAGGGATGGGGT
+GGCCTCCGGCGTCTTAGCGACCGTGGAGTCGCCCGAACCGCAACCGGTCAACGTCGCGGCGACCAATGCA
+GCGACCACGCCAACACGCGGCGTGGTGGGGCAGGGTGGTGACCACACACCGGGCACCGTACCGCCATCGG
+GCCCGCGGGTGCGGTAGGCGTGGCCGGGTCACCACTAAACTTGACGGCCTGATGGCCTTCCCGGAATATT
+CGCCTGCGGCGTCCGCTGCGACGTTTGCTGACCTGCAGATTCATCCCCGCGTCTTGCGGGCGATCGGCGA
+CGTCGGTTACGAGTCACCGACGGCTATCCAGGCGGCTACGATCCCGGCGTTGATGGCAGGCTCCGACGTG
+GTGGGGCTGGCGCAGACCGGCACCGGCAAGACGGCGGCATTTGCGATTCCGATGCTGTCCAAGATCGACA
+TCACCAGCAAGGTGCCCCAGGCGCTGGTGCTGGTGCCCACCCGGGAGCTGGCTCTGCAGGTGGCCGAGGC
+GTTCGGCCGCTACGGTGCCTATCTGTCGCAACTCAACGTGCTGCCGATCTACGGCGGATCGTCGTATGCC
+GTGCAACTGGCCGGATTGAGACGCGGCGCGCAGGTGGTGGTTGGCACCCCCGGTCGTGTGATAGACCATC
+TCGAACGGGCGACCTTGGACCTGTCGCGGGTGGACTTTCTAGTGCTCGATGAGGCCGATGAGATGCTGAC
+CATGGGTTTCGCCGACGACGTTGAGCGCATTCTGTCCGAGACCCCCGAATACAAGCAGGTCGCCCTGTTT
+TCCGCGACCATGCCGCCGGCGATCCGCAAACTCAGCGCCAAGTATCTGCACGATCCGTTCGAAGTCACTT
+GTAAGGCGAAAACCGCTGTGGCCGAGAATATTTCGCAGAGCTACATTCAGGTAGCACGGAAGATGGACGC
+GCTCACCAGAGTGCTCGAAGTCGAGCCGTTCGAGGCGATGATCGTCTTTGTCCGCACCAAGCAGGCGACC
+GAGGAGATTGCCGAAAAGCTGCGTGCCCGAGGGTTTTCCGCGGCTGCCATCAGCGGTGACGTCCCGCAGG
+CGCAGCGGGAGCGGACCATCACGGCGCTGCGGGACGGCGACATCGATATCCTGGTCGCCACCGATGTGGC
+GGCGCGCGGACTCGACGTGGAGCGGATATCACACGTGCTTAACTACGACATCCCGCACGACACCGAGTCC
+TACGTACACCGGATCGGGCGCACCGGCAGGGCCGGGCGTTCGGGAGCCGCGCTGATATTCGTCTCGCCAC
+GGGAGCTTCACCTGCTCAAGGCGATCGAAAAGGCTACGCGGCAAACGCTTACCGAGGCGCAATTGCCCAC
+CGTCGAGGATGTCAACACCCAGCGGGTGGCCAAGTTCGCCGATTCCATCACCAATGCGCTGGGCGGTCCG
+GGAATCGAGCTGTTCCGCCGACTGGTCGAGGAGTATGAACGCGAGCATGATGTCCCGATGGCTGACATCG
+CCGCGGCACTGGCCGTGCAGTGCCGCGGCGGTGAGGCATTCCTGATGGCACCCGACCCGCCGCTTTCGCG
+GCGCAACCGCGACCAGCGTCGGGACCGTCCGCAAAGGCCCAAGCGTAGACCGGACTTGACCACCTACCGC
+GTCGCCGTCGGCAAGCGGCACAAGATCGGTCCAGGCGCCATCGTCGGCGCCATCGCCAATGAGGGTGGGC
+TGCACCGCAGCGACTTCGGTCAGATCCGTATCGGGCCAGACTTCTCGCTAGTAGAATTGCCGGCGAAGCT
+GCCCCGCGCGACGCTCAAAAAGCTTGCACAGACCCGTATCTCGGGTGTGCTGATCGACCTTCGGCCATAC
+CGGCCGCCCGACGCGGCGCGCCGGCATAATGGCGGCAAACCACGGCGGAAACACGTCGGATGACCCTGCC
+CAAGGAAAGAGCCGCCCAGGGCGGACTCGAGCGGATCGCCCACGTGGACCGGGTGGCGTCGTTGACCGGG
+ATCCGTGCTGTTGCCGCATTGCTGGTCGTCGGCACTCATGCGGCCTACACCACCGGCAAGTACACCCACG
+GCTATTGGGGCCTGATGTCGTCCCGCATGGAGATCGGCGTTCCGATCTTTTTCGTGCTGTCGGGGTTCCT
+GCTATTCCGGCCATGGGTTAAGTCCGCCGCTACCGGCGGCCCCCCGCCGTCGTTGAGCCGCTATGCGTGG
+CACCGGGTCCGGCGGATCATGCCCGCCTACACCGTCACCGTTCTGTTGGCCTACCTCGTCTATCACTTCC
+GCACGGCGGGGCCCAACCCCGGGCACACCTGGGTCGGGCTGTTCCGCAACCTCACCTTGACGCAGATCTA
+TACCGACGGCTATCTGGGTGCGTTCCTGCATCAGGGTCTGACCCAAATGTGGAGCCTCGCGGTGGAGGTT
+GCCTTCTACCTGGCGTTGCCGGCGTTGGCATACCTACTGTTGGTGCTCGTCTGCCGGCGGCGATGGCAGC
+CCAGGTTGCTGTTGGCCACCATGGCGGGGCTGACGATGATCAGCCCGGCATGGTTGATCCTGGTGCACAA
+CACGCACTGGATGCCCGACGGCGCTCGGCTGTGGCTACCCACCTATCTGGCTTGGTTCGTCGGCGGCATG
+ATGCTGGCCGTGCTGGCGGCGATGGGCGTGCGCTGTTATGCATTCGTGGCCATACCGTTGGCGGTCATCT
+GCTACTTCATCGTCTCCACTCCGATCGCGGGCGCGCCCACGACGTCGCCCACAGCGCTGGCCGAGGCGCT
+GGTCAAGACCGCCTTCTATGCCGTGATCGCCGTGCTGGCGGTGGCACCGCTGGCCTTGGGTGACCAGGGG
+TGGTATGCCCAGTTGCTGGCCAGCCGGCCGATGGTGTTTCTTGGTGAGATCTCCTACGAGATCTTCCTGA
+TCCATCTGGTGACCATGGAGATCGCCATGGTGGACGTGCTCGGGTATCGGGTTTACACCAGTTCGATGGT
+GAACCTTTGTCTCGTGACGCTGGTGCTGACGATCCCATTGGCGTGGTTGTTGCACCGTTTCACTCGGGTC
+CAGGGTGACCGGCCTTCCTAGCGGCGGCAGAAGCAGGTGTCACGATCGGGACGACGAACTCCGCGATCAT
+CGCTCGTTCGTCGGCTTCGTCACGGCCGGGGAACATCAGCAGCGATGTGAGCATCCGGACCACCCAGCGG
+GCGCGCCGTGGCCGGATGATTGCCAGCGGTTTGCCGGCCGAAGGGTCAAAGGCCCGGTCTTGCCGGTAGC
+CGTCGGTGACGGCGGGGTCGGTGACCACCATCCCCTCGGGCAGCTCGGCCATCAGGCCAGCCAGCACATC
+GGTATTCACTGAGCCGATCCTACGGGCCGATCGATGTCCGCTTGGGGCGCCAGATCCAGTTCGCGCAGCG
+CGGGCAGCCGGATCGCGACCAGCCCGGTGCACACGATGGGCAGTGCCAACGCGAGAAACGTGGCATGCAG
+TCCAGCGGCGTCGGTCAGTGGACCGGCCAGCAACAGACCCAACGGGCCGGCGGCGTAGGCCAGCGACGTC
+ATCACCCCGACTACCCGGCCGCGCAGATGCTGTGCTGCCCGCGTCTGTATCACGTAGTTATAGATCGGCT
+GGATGGGTCCGTACACCAGGCCGACCACCGCGCACAACACCATGATGACCGGCAGTGGCGGCAGGAACGC
+GATGACCATCGATGCCAAACCCAGGGTAAGAACCGCGGTCGACATGGTCACGCGACGGGGAACGCGGATA
+GCCAACACGGCATACCCCAGCGCTCCCACCAGGCCGCCGCCGGCGATCGCCATCAACGCCCAACCCAGCT
+GCACCGGTTGCTGGTGGTCGGTGAAGTATTTCGGGAACAGCACGCTCTCCATCGGCAGATACAGCGCGGT
+GACGGTCAGGTCAATCATCCCGAGGGTGCGCAATACCCGCAGGTTCCAGACGAAGCGCAGCCCCTCGGCG
+ATCCCGGATACCAACCCTTGGGGCCGCGAGGTGTGGTGCGGCTTGCCGGCACCCTCGAGTTGCAGGGCGG
+CAATCGCGAGGATGGACAACCCGAATGCCGTCGCGGTAATCCACATTGTGGTGATGCCGCCAACCGTCGC
+GATCATCAAGCCACCGATGGCCGGGCCGACAATAAAGGCCAGGTTGAGGATCGCCTCGTAGGCGCCGTTG
+ATGCGGTCCAACGACCAGCCTGCCCGAGCGGCGGCCTCGGGCAGCATCGAGTCACGAGCCGTCATGCCTG
+CCGGGCCGAAGGCGGCCGCCAGGGCGGCCAATACGGCCAGCACCAGCACGTTGACCGCGTCGCCGCCGTA
+CCCCCACGCCACCAGGGGGACGCCGGCCACCGCCGCACCCGACAGCGCATCGGCCACCATCGACACCCGG
+CGACGCCCGAAGTAGTCGACCGCGGTGCCGGCGACCAGCGTGGCGAACAACAGCGGCAGCATGGTCGCAC
+TGGCCACGATCGAGGCCTGCCCAGCGCTGCCCTCGCGCTGCAACACCAGCCACGGAAACGCGACTATCGA
+GACGCCATCACCCGCGGCCGCCATCAGCGTTGCGAACAGGATCAGGAATGCCGGGCCGCGGTTGCTGTTT
+CTCATGAATATCGCGGCTGAATCTAGCGCCAAACCGGTATGGGGGCCACCGAATTTCTGCGCTGCCGCAG
+CCCGGATGCAGGATGTTCGTGTGCTCATGCATCCGAAGACCGGCCGGGCGTTCAGGTCCCCGGTAGAGCC
+CGGTTCCGGCTGGCCAGGTGATCCGGCGACACCGCAGACCCCGGTGGCTGCCGATGCCGCGCAGGTGTCA
+GCGCTGGCCGGGGGCGCTGGCTCGATCTGCGAACTCAACGCGCTGATCAGCGTGTGCCGGGCGTGTCCCC
+GGCTGGTCAGTTGGCGTGAGGAGGTCGCCGTCGTCAAGCGCCGTGCCTTCGCCGACCAGCCCTACTGGGG
+GCGCCCGGTGCCGGGGTGGGGGTCGAAGCGGCCGCGGTTGCTGATCCTCGGGCTGGCGCCCGCCGCGCAC
+GGGGCCAACCGGACCGGACGAATGTTCACCGGCGATCGGTCGGGAGATCAGCTTTATGCAGCACTGCATA
+GGGCCGGCCTGGTGAACTCACCGGTCAGCGTCGACGCCGCGGACGGGCTGCGGGCCAACCGGATTCGGAT
+CACCGCACCGGTGCGGTGTGCGCCCCCGGGCAACTCGCCGACACCGGCCGAGCGGCTGACATGCTCACCC
+TGGCTAAATGCGGAATGGCGGCTGGTGTCCGATCACATCCGTGCGATCGTCGCCCTCGGCGGGTTCGCCT
+GGCAGGTCGCGTTGCGCCTGGCGGGCGCGTCGGGGACACCCAAGCCGCGGTTCGGCCACGGCGTCGTTAC
+CGAGCTGGGAGCCGGTGTGCGGCTACTGGGCTGCTACCACCCGAGCCAGCAGAATATGTTCACCGGTAGG
+TTGACTCCTACGATGCTCGACGACATTTTCCGTGAGGCCAAGAAGCTGGCCGGGATTGAGTGACGTGAAG
+ACGGTTGTGGTTTCCGGCGCCAGTGTGGCCGGTACGGCGGCGGCGTACTGGCTTGGGCGGCACGGCTATT
+CGGTAACGATGGTGGAGCGCCATCCCGGGCTGCGACCAGGGGGGCAGGCTATTGATGTCCGAGGTCCGGC
+GCTGGATGTGTTGGAACGTATGGGGTTACTGGCAGCCGCCCAGGAACACAAGACGAGGATTCGGGGCGCC
+TCCTTCGTCGATCGTGACGGCAATGAGCTGTTCCGGGACACCGAATCGACGCCCACCGGCGGTCCAGTCA
+ACAGTCCCGATATCGAGCTGCTACGTGACGATCTTGTCGAATTGCTCTACGGGGCAACTCAACCCAGCGT
+TGAATACCTGTTCGACGACAGCATTTCCACATTGCAGGACGACGGCGACTCGGTGCGGGTGACCTTTGAG
+CGCGCGGCGGCCCGCGAGTTCGACCTCGTTATCGGTGCCGACGGACTGCATTCCAACGTGCGCAGGTTGG
+TTTTCGGTCCGGAGGAGCAGTTTGTCAAGCGATTAGGAACTCACGCGGCGATTTTTACCGTGCCCAACTT
+CCTGGAGTTGGACTACTGGCAGACCTGGCATTACGGTGACTCCACCATGGCTGGCGTTTACAGTGCGCGC
+AACAACACCGAAGCCCGCGCTGCACTAGCCTTCATGGACACCGAACTGCGGATCGACTACCGCGACACCG
+AAGCTCAGTTCGCCGAACTGCAACGTCGGATGGCCGAGGACGGCTGGGTGCGCGCGCAACTGCTGCACTA
+CATCGCAGCGCACCGGATTTCTATTTCGACGAAATGTCGCAGATCCTGATGGATCGCTGGTCGCGGGGCA
+GGGTAGCGCTCGTTGGCGACGCTGGTTATTGCTGCTCGCCCTTGTCGGGGCAGGGGACCAGCGTCGCCCT
+GCTGGGTGCCTACATCCTGGCCGGCGAACTCAAGGCGGCCGGTGACGACTACCAACTCGGATTCGCCAAT
+TACCACGCCGAATTTCACGGCTTTGTCGAGCGCAACCAATGGTTGGTCAGCGACAACATCCCCGGTGGTG
+CGCCGATACCGCAGGAGGAGTTCGAACGAATCGTGCATTCCATCACGATCAAGGACTACTGAGCGCCTTC
+ACCCGGGCGCAGCCAGGATGGCGCTCGTCGGCCGCTTCACCGAACCTGAAGATCTGCAGACGAAGTACGA
+GTAGGGGCCGGCAAATTTACCGGCTCGACGCGCAGAAGCGCCGAGATTTAGCGGCGGGTCAATACGACGA
+CCGGGATTGGCCGTGACGTCCGGCTCTGGTAGTTGGTGTATCGGTTGGCGTTGTTCTCGTTGACGATCTG
+CCAGAGCCGCGCGTAGTCCGGGTCGTGGGGCTGCACCGGTTTCGCTGTCACACCGAATCGCTTGGGCCCG
+ACGTTGATTTCGACGTCCGGGTTGGCCTTGAGGTTGTGGTACCAACCCGGCGAGCGGGGATCGCCACCTT
+TGGACGCCACGATCAGGTACGCGTCGCCGTCGCGAGCATAGGTGAGTGACGTGGTTCGCGGCTGGCTCGT
+CTTGGCGCCGGTGGTATGCAGCAGCAAACTCGGTGGCGCGCCGGGGATTCGGTGTCCGATCCGACCGTTA
+GTGCCTCGGTAGATCGCGTCGTGCAGCCTGAGCAGCTGCACGCCTACGTGGCGCTCAAGCCATCGGGAAA
+TGTCCATGGGGTCAGTCTTGCGCAGCGGCATCCTGTTGCGCCAGCGCCTCCCGCAGGATCCGTCCGGTGG
+CTTCCCGGTCCGGGTCGCGGCGCAGCATCATTCCCTTGGCGACCGACAGCTTGTCGCCGTTGCGCCGCGG
+TAATACGTGCAAGTGAACGTGGAACACCGTCTGAAAAGCGGCACGGCCGTCGTTGATGGCGATGTGTGTC
+GCGTCAGCCAACTTCGTGGCGCGGGCCGCCCGCGCGATGCGTTGGCCGATGGCGACCATGTCAGCCAACG
+CCTCCGGCGGGGTGTCGGTGAGGTCAACGGTGTGTCGCTTGGGCAGCACCAGCGTGTGGCCGCGGGTGAA
+CGGGCGGATGTCGAGGATCGCGAGATAGCCGCCGTCCTCGTAGATCCGGATGGCCGGAGCCTCCCCGGCG
+ATGATCGCACAGAACACGCAGGGCATGTCGCTACGGTACTGGACCTCTCGGAGACCGCCCAAGTGAACGG
+GATACGCTGCCGCCGTGGACCCTACTGACCTGGCCTTCGCCGGTGCCGCGGCACAGGCGCGGATGCTGGC
+TGACGGTGCACTCACCGCGCCGATGCTGCTCGAGGTCTACCTGCAACGAATTGAGCGTCTGGACAGCCAC
+CTGCGCGCCTACCGGGTGGTGCAGTTCGACCGGGCGCGTGCGGAGGCCGAGGCCGCCCAGCAACGCCTCG
+ACGCCGGTGAGCGGCTGCCGCTCCTGGGCGTGCCGATCGCCATCAAAGATGATGTCGACATCGCCGGGGA
+GGTGACGACATACGGCAGCGCCGGGCACGGTCCGGCCGCGACGTCCGACGCAGAGGTGGTTCGCCGGCTG
+CGCGCGGCAGGCGCTGTCATCATCGGCAAAACCAACGTGCCTGAGTTGATGATCATGCCCTTCACCGAGT
+CGCTGGCCTTCGGGGCCACCCGGAATCCGTGGTGCCTCAATCGAACCCCTGGCGGCAGCAGCGGCGGCAG
+CGCTGCGGCGGTAGCGGCCGGGCTGGCGCCAGTGGCACTGGGATCCGATGGTGGCGGATCGATTCGTATC
+CCGTGTACCTGGTGCGGTCTGTTTGGGCTGAAACCACAGCGCGATCGGATTTCCTTGGAGCCGCACGACG
+GGGCCTGGCAGGGGCTGAGCGTCAATGGCCCGATCGCGCGGTCGGTAATGGACGCGGCGTTGCTACTGGA
+CGCGACCACAACGGTGCCTGGTCCCGAAGGCGAGTTTGTGGCCGCGGCCGCACGCCAACCCGGCCGGCTG
+CGAATTGCCTTGAGCACCAGGGTGCCAACCCCGCTGCCCGTTAGGTGCGGCAAGCAAGAACTGGCAGCCG
+TCCACCAGGCAGGTGCGTTGCTACGTGATCTGGGCCACGACGTCGTCGTCCGCGATCCCGACTATCCGGC
+TTCGACCTATGCCAACTACCTGCCCCGCTTTTTCCGCGGTATCAGCGACGACGCGGACGCGCAGGCGCAC
+CCGGACCGCCTCGAAGCACGTACCCGAGCCATAGCGCGTCTAGGGTCGTTCTTCTCCGACCGGCGGATGG
+CGGCCCTGCGGGCCGCCGAGGTGGTGCTGAGCAGCCGGATCCAGTCGATCTTCGACGATGTCGACGTAGT
+TGTGACGCCAGGCGCCGCGACCGGCCCGTCCCGCATCGGCGCCTACCAACGCCGGGGTGCAGTTTCGACG
+TTGCTGCTGGTGGTGCAGCGGGTTCCGTACTTTCAAGTCTGGAATCTGACCGGCCAGCCCGCGGCCGTGG
+TGCCGTGGGACTTCGACGGCGACGGCCTGCCCATGTCGGTTCAACTCGTCGGCCGGCCGTATGACGAGGC
+GACGCTGCTGGCACTGGCCGCACAGATCGAATCTGCCAGACCCTGGGCCCATCGGCGGCCGTCGGTGTCA
+TGACATTGCAGTCGCCCGCTCGTTTTTCACGTTTTTGCCCGGCCGCAGGACATGTGCGGCGGCGTTAACG
+TTGACTGGTGACAGACCACGTGCGCGAGGCGGACGACGCGAACATCGACGATCTGTTGGGCGACCTGGGC
+GGTACCGCGCGCGCCGAGCGTGCGAAGCTTGTCGAGTGGTTGCTCGAGCAGGGCATCACCCCCGACGAGA
+TTCGGGCGACCAACCCGCCGTTGCTGCTGGCCACCCGCCACCTCGTCGGCGACGACGGCACCTACGTATC
+CGCAAGGGAGATTAGCGAGAACTATGGCGTTGACCTCGAGCTGCTGCAGCGGGTGCAGCGCGCTGTCGGT
+CTGGCCAGAGTGGATGATCCTGACGCGGTGGTGCACATGCGTGCCGACGGTGAGGCGGCCGCACGCGCAC
+AGCGGTTCGTTGAGCTGGGGCTGAATCCCGACCAAGTCGTGCTGGTCGTGCGTGTGCTCGCCGAGGGCTT
+GTCACACGCCGCCGAGGCCATGCGCTACACCGCGCTGGAGGCCATTATGCGGCCGGGGGCTACCGAGTTG
+GACATCGCGAAGGGGTCGCAGGCGCTGGTGAGCCAGATCGTGCCGCTGCTGGGGCCGATGATCCAGGACA
+TGCTGTTCATGCAGCTGCGGCACATGATGGAGACGGAGGCCGTCAACGCCGGAGAGTGTGCGGCCGGCAA
+GCCGCTACCGGGAGCGCGACAGGTCACCGTTGCCTTCGCCGACCTGGTCGGTTTCACCCAGCTAGGCGAA
+GTGGTGTCGGCCGAAGAGCTAGGGCACCTCGCCGGGCGGCTGGCCGGCCTCGCGCGTGACCTGACCGCTC
+CGCCGGTGTGGTTCATTAAGACGATCGGCGACGCGGTCATGTTGGTCTGTCCTGATCCGGCGCCATTGCT
+GGACACCGTGCTGAAGCTGGTCGAGGTCGTCGACACCGACAACAACTTTCCCCGGCTGCGAGCCGGCGTC
+GCCTCCGGGATGGCGGTTAGCCGGGCCGGCGACTGGTTCGGCAGCCCGGTCAACGTGGCAAGCCGGGTGA
+CCGGGGTGGCGCGCCCGGGTGCCGTGCTGGTCGCGGATTCGGTGCGGGAGGCCCTTGGTGATGCCCCCGA
+AGCCGACGGATTTCAGTGGTCCTTCGCCGGCCCCCGTCGCCTCAGGGGAATCCGGGGTGACGTCAGGCTT
+TTTCGAGTCCGGCGAGGGGCCACTCGCACCGGCTCCGGCGGCGCGGCCCAAGACGACGATTTGGCCGGCT
+CGTCACCGTAGGCAGGCACACCGGTACACATGGGCAGACCCGGCGTGACTCTCGGGGGGCGTCTGACACC
+GTCTTCTGCGGGTCTTGCGCGGCCGGCCTTCACCCCGTCTTCCGGCACTTTCGATTGGTCACTAACCGGG
+CCTGCTTCGATACCAAAAATACAACGTCGAATGGCTGATCACAATGGTTCTCGCCAGGCCGGACGCTGTT
+TTCGCGCCGGCCAGGAACCGGTGTCACGTTTCGCTGCCGGTGAACGCGATGTCATTAAAGATGAAAGTAT
+GTAATCATGTAATTATGAGGCACCATCACATGCACGGGCGGCGCTACGGTCGCCCCGGCGGCTGGCAGCA
+AGCTCAGCAACCAGATGCCAGTGGGGCGGCGGAATGGTTCGCTGGCCGCCTGCCCGAGGACTGGTTCGAC
+GGCGACCCCACCGTCATCGTCGACCGTGAAGAAATTACGGTGATTGGCAAGCTGCCTGGACTCGAGAGCC
+CCGAGGAAGAAAGTGCGGCCCGAGCCTCGGGCCGCGTGTCGCGATTCCGCGACGAAACCCGACCGGAGCG
+AATGACTATCGCCGATGAAGCCCAGAATCGCTACGGACGCAAGGTGTCCTGGGGCGTCGAGGTCGGTGGT
+GAGCGAATCTTGTTCACGCACATCGCAGTACCGGTGATGACGCGGTTAAAGCAGCCGGAACGGCAGGTGC
+TGGACACCTTGGTCGACGCTGGCGTGGCTCGTTCCCGCTCGGATGCCCTCGCGTGGTCGGTCAAGCTGGT
+CGGCGAGCACACCGAGGAGTGGCTGGCCAAGCTGCGCACCGCCATGTCGGCGGTGGACGATCTGCGCGCG
+CAAGGCCCGGATCTTCCGGCCTAAACGGCCACCGCCGAATGCGTCATTCCTTGTTGACTTTGTCAACGAT
+CTTGGCGGCGATCTGGCCTGCTTGATTGGTGATCTGGTACCCGCATGCGTTGACGTCGACGACCACATTG
+TTGGCCACGCTCATCGCGCGTTGGCATTCCCAGCCCTCAGCGCCTTCTTGGGTGTCTATCACCGTGATCG
+TCGGCGGGCTGCCTTTGACGTCGGCAAACGTCCACCGGTAGGTCTTGGCCTTATTCGTGACGGTGACCGT
+CTTGCCTGCGCAGTTCTTCCATTTGTCGGCCGAAGTCTGCACGAACGCGCGGGCTTTGTCGGCGGTCGGA
+AAGGCGACGACGGCTTGGTTCACCCAATGTTCGTAGTTGTCGCCCGGCTCGGATGAAATCAAGCCGTTGA
+TGGCGGTGTAGCCGGTGCCGGCATACACCGGATCCTGGCTGGTATACAGCGCGCCCTGGCAGTCCGGCAG
+GGACACCGTCACCGGCGAAGAGTCCATCGATGTGATCGGTTTGCCCGGCTGCATGGACGACGAGCCCATC
+ACGGCGTTGACTTCTGAGGAGTTCAGCAGTAGGGCGCTAAGGCGCTCCTCCGCAACCGGCTGAGGCGGCT
+GTACCGGCTTGGGTCGGTTGGCGATCCAGATGCCGATGGCGCCCAACACGAGGACGAGCACGACGGCGGC
+GGCGCCGGCCACTAAGGGCCACGGGTTGGTTTTGCGTGGGGTCTGGGCCCAGGGGCTGGGGCCGCCGGAC
+GGCGGTGCGCCCCAGCCGCCGCCCTGGTAGTACTGCGGGGTGGGAGTGGGTCCGCTGGCCGGCATCGGGC
+CGCTATTGGGCGCCCAGGACGGCTGGCCGGTCGGCGCGGCCTGGATGGGCGGCGGTGTGACGGTGGGCAT
+GGTCGGCGGCTGCGCGGTTACCGCCGCGGTGCCGGGCAGGGTGGATTCTTGGCTGCGGCGCAGGATGTCG
+GCGGCGTGGTCTTGGTCGGGGTCGCTGAGCGCTTCGTGGGCGGCCAGGGCCAGGTCGCCGGCGCTGGCGT
+AGCGGTCTTCGGGCTTTTTGGCCATGCCGCGGGCGACCACGGCGTCAAAGGCTTTGGGGATGCCCGGGCG
+GATGGCGCTGGGCTGGGGGATGGGTCCCATCAGGTGGGAGCTGACCAGTGTGCCGGCGCTGTCGGCGCGA
+TACGGCGGGGCCCCGGTCAAGCATTCGTGCAGCACGCAGGCCAGCGCGTAGATGTCGGCGCGGTAGGTTA
+CCTCGTCGTTGGAGAACCGTTCGGGGGCCATGTATTTCCAGGTGCCCACCGCGGTGCCTAACTGGGTCAG
+TTTCTCGTCGGTGGTCGCACTGGCGATCCCGAAGTCGACCAGATAGGCAAAGTCGTCGCGGGTGATCAGA
+ATGTTTTGCGGTTTGACGTCGCGGTGCATCACCCCGTCGGCGTGTGCGGCATCGAGCGCCGAGGCGATCT
+GGGTGATGATGGCCACCGCGCGCGGTGGGGTCAGCGGGCCGAAGCGTTTGAGCACGCTGTCAAGGTCGGT
+GCCCTCCACCAGGCGCATCTCCAAAAACATTTGGCCGTCGACTTCGCCGTAGTCGTGGATGGGCACCACG
+TGAGGTTCCTGCAACCGGCCGGCGATGCGGGCTTCGCGTTTCATCCGCTCGCGAAACACCGGGTCCTTGC
+TGAATTCCGCGGTCATCAGCTTGACGGCGACGGTCCACTCCTTGACGGTGTGCTCGGCCTCGTAGACCTC
+GCCCATCCCGCCCCGGCCCAACAGCCGTTTGAGGTGGTAGGGCCCAAACATCGAGCCCACCCGCGAGTCC
+TGTGCGTCGCTCATCGCTGATCCTCCCAACCAACCCGCTGCCGCCGACACTATCAACAACGTCACCAGGT
+TCCGTGTGGCTTGTGGCAATCGCGCCCGCCGAAAGCTGACTGCTGGACACCGCGCCGAGGTTTGCTAGCC
+AGCGCGCAGCCAAGGATTCGTCAAGGATGCGGAAAGTGCGGGGGCGGACGCGTTCTTAGGCGCTGAACCG
+AGGCTTGCGCGTTGAACAAATGACCGGCTGGTCTACGCCTGGTCGGTTCACTTACGAGCTTTGCGTTGCG
+GCTCGATGCGTTTGAGCTGCAGCGCGATCAAGATCACCAGCACGAGCGCCTGTACGGCGCAGGCCCCCGC
+GGCCATCAACCAGCTACCGACGTTGTAGTCCCACAGTGGATCTTGGTCTCCACCGGCGGTCCGGCGCAGG
+TCGTTGAGGTCGACGGTGGCTGCGGCCATGGCGTAGGCCCACCGCGACGGGGACAGCCACGACAGCTGCT
+CTAGCGGGGGTCGACCACTCACACCGAACATGCCCCCGCACAGCACCAATTGGGCCATGACCACCAATAC
+CAGCAGCGGCATGCCGCGGTCGGCGTTGCCGATCATCGCCGAGATCAGCAGGCCGATCATCATCGAGACC
+ACGGTTACGGCGACGACGGCCACGGCCACTTCGACGCTGGGCCAAGGCAATATCACCGATTGATCGGGTG
+GGGGCAGCAACGCGACACCGAGGAATCCCAGGATCAGCGCTTGCAGGCTGGTCAGTGCTGTAAGGACCAC
+CAATTTGGATGCCAGGTAGGCGCCGCGTGACAAGCCGATGCCGTGTTCGCGCCGATATATTGCTCGTTCT
+TTGACGATTTCACGGATCGAGGCAGCACAGCCCATGAGTGCACCGCCGATGATCAGCAACACCAGTAGTT
+GCGACGGCTGGGTCGACTTCAGCTCGATGGCCTTAGCCAGCGACAACCCGGCCTGGCCCGGGACGGCATG
+GGCAAACAGACTCAACAGCAGCGGCAGGACTAGCAAGAACACCGCATACTGGCGGTCGGCGGCGATGACG
+GCCAGATACCGTCGGCACAGGATGGCGAATTGAGCGAACGCACTTTGCTGAGCGACGGGCCTGGCGTGCC
+GCGCGGCGGCCGGCCGCGCGGGGCGCATGGCGGGGTGGCCGATGAGGGCCTCCCGTAGGGGTGAGGCGTT
+GAACCGGCCGGTCCAGTCGGTGGAGGTGTCGTGTTCGAGGAGGGTGAACAGGTCGGCGAAGTCGGTGCAG
+TTGAAGTAGCCCAGGGCCTGTTGCGGCGGACCAAAGTACGCGAGGCGACCTCCGGGGGCCAGGATGAGCA
+GCCGGTCGCACATGTTGAGGTGGGCGATGTTGTGGGTGACCACCACCACCGAGCGGCCGTCGTCCGCCAG
+TTTGCGTAGGGTCTGCATGACGGACTTTTCATAGCCCGGGTCCAGGCCGGATGTCGGTTCGTCGAGGAAC
+AACAGCGACGGTTTGGTCAGCAGTTCCAACGCGACGCTAGTCCGTTTCCGCTGACCACCCGACAGGCTGT
+CGATTCGTTGATCGGCTTGGGTGGAAAGGCCGAGTTCGACCAGCACCTCCTCGATGCGCTGGTTGCGTTC
+GTCGACGGAGACATCCTGCGGGAATCGAAGCCGCGCCGCGTAGTTCAGCGCTCGCCGCACCGTCAGCGGG
+GTGTGCAGGATGTCGTCCTGTGGCACGAACCCGATCCGGTGCCGCAGCTCGGCGTAGTTGTCATACAGGT
+CGCGCTCGTCGTAGCGCACGGTTCCGTTGCCGGCCGGCCGGAACCCGGTCAGCGCGCCCAGCAGTGTCGA
+TTTCCCGGCACCGCTTGGCCCCACTACCGCCAACAAGCTGCGTTGCGGCAGAACGAAACTGACATCGGCC
+AGCAACACACGACCCTTGTTGGTGACCACCCGCAGATTTGACGCCTGGTAGGAGATATCGCCGGTGTCGA
+CGTATTCCACGAGCCGATCGGCGGATAGGTGCAGCAGCTGATGGCCGATGCCGACGATGTCAGTCGGTCC
+GATGACCGCACGGCTGATGCGGTGGCCGTTGACGTAGGTTCCGTTGGCACTGGCATTGTCGCTGAGCTCC
+CATCGGTTACCGGTTCGCCGCAGGATGGCGTGCCGGCGGGAGACCAGCAAGTCGTTGAGGACCACGGTGT
+TCTCGGGTGCGCGGCCGATCGTGACGACCAACTGGTCAATGGCATGGAATGCGGTCGGTGGCCGGGCGAC
+CGTCGTCTCACCCTGCCGTTGAGCCGGTTTGGGCGTTGCCGGCCGTGGCGGGGCTGGTGGGTGCGACGCA
+GGGGTGGGCGTGGGTGACTGGGCAACCGGGTACAGTTGCACCCGCTGCCCGGAAGACGCCGAACCAAGAA
+AAATCGTGATGGGCTGACGTACCGTCAGGCGTTCCACCCGCTGTCCGTCCACGAATGTGCCATTGGTGCT
+CAGGTTGACCAGAACCCATCCCTCAGGTGTGGCTTCCAGCACTGCGTGTTGGCGCGACACCCGCGGATTG
+TCCAGTCGGATATCGGCTTCACTGGCGCGGCCAATGCTCCACTCGCGGCCGGCGACGGCATGCCAGGTGC
+GCCCCGCGGCCCGCAGTTCCAGCCGCGGTGCATTGGGGGTGATCATGTCGGCCGTGTCTGTCATGCCTAG
+CCTCTTACCCGTACTTGGCCCACCAGTTGTGCAGATCCTCAATGGTCGCGGGATCCCCGAAGACGTCGCT
+GAGCGTTAGCTTGGCCTCGTTGCTCCAGATCACGTTCGGGCGATTCTTATAGGTGCCGCACGCGATCATG
+CCTGCGGTCACGTCTGGGGTCTGGTTGTAATGCCAGCCATCCGGTGATGGTCCTTCACCGGGACAGTTCA
+TCAGCTCCACGGCGGCGATATCGTCGTTGAAGGCCTGTTTCAGCTTGTCGGGATTGGCGAACAATCCATA
+GATGGCGCGACTTGGCCCACCCTGGTTGGTGTTTTGCCCGCAGTCGACCATCGCCACGGCGTTCACCCAT
+ATGCTGTTCGGCTTCGGCGTGGTCGGTTTACAGGTGCCGGTCGGATAGCCCGACGGCAACATGCTGAGCA
+GCCTGGTCTGCGGGTCGCTGGCCGGTGCTGTGGTCGGCGTTGTGGTCGCGGGTAGCGAGGTCGTTGCCGT
+GGTGGTGGGGGTGCCTGGGGAGGTCGCGATGTTCCGTTTTGGGTTGTCGTCCGGTCGGTTGGCGATCCAG
+ATGCCGATGGCGCCCAACACGAGGACGAGCACGACGGCGGCGGCGACGGCCACAAAGGGCCACGGGTTGG
+TTTTGCGTGGGGTCTGGGCCCAGGGGCTGGGGCCGCCGGACGGCGGTGCGCCCCAGCCGCCGCCCTGGTA
+GTACTGCGGGGTGGGAGTGGGTCCGCTGGCCGGCATCGGGCCGCTATTGGGCGCCCAGGACGGCTGGCCG
+GTCGGCGCGGCCTGGATGGGCGGCGGTGTGACGGTGGGCATGGTCGGCGGCTGCGCGGTTACCGCCGCGG
+TGCCGGGCAGGGTGGATTCTTGGCTGCGGCGCAGGATGTCGGCGGCGTGGTCTTGGTCGGGGTCGCTGAG
+CGCTTCGTGGGCGGCCAGGGCCAGGTCGCCGGCGCTGGCGTAGCGGTCTTCGGGCTTTTTGGCCATGCCG
+CGGGCGACCACGGCGTCAAAGGCTTTGGGGATGCCCGGGCGGATGGCGCTGGGCTGGGGGATGGGTCCCA
+TCAGGTGGGAGCTGACCAGTGTGCCGGCGTGTCGGCGCGATACGGCGGGGCCCCGGTCAAGCATTCGTGC
+AGCACGCAGGCCAGCGCGTAGACTGTCGGCGCGGTAGGTTACCTCGTCGTTGGAGAACCGTTCGGGGGCC
+ATGTATTTCCAGGTGCCCACCGCGGTGCCTAACTGGGTCAGTTTCTCGTCGGTGGTCGCACTGGCGATCC
+CGAAGTCGACCAGATAGGCAAAGTCGTCGCGGGTGATCAGAATGTTTTGCGGTTTGACGTCGCGGTGCAT
+CACCCCGTCGGCGTGTGCGGCATCGAGCGCCGAGGCGATCTGGGTGATGATGGCCACCGCGCGCGGTGGG
+GTCAGCGGGCCGAAGCGTTTGAGCACGCTGTCAAGGTCGGTGCCCTCCACCAGGCGCATCTCCAAAAACA
+TTTGGCCGTCGACTTCGCCGTAGTCGTGGATGGGCACCACGTGAGGTTCCTGCAACCGGCCGGCGATGCG
+GGCTTCGCGTTTCATCCGCTCGCGAAACACCGGGTCCTTGCTGAATTCCGCGGTCATCAGCTTGACGGCG
+ACGGTCCACTCCTTGACGGTGTGCTCGGCCTCGTAGACCTCGCCCATCCCGCCCCGGCCCAACAGCCGTT
+TGAGGTGGTAGGGCCCAAACATCGAGCCCACCCGCGAGTCCTGTGCGTCGCTCATCGCTGATCCTCCCAA
+CCAACCCGCTGCCGCCGACACTATCAACAACGGTCAGGTATCACGTCGGCTGCGATCGCCGGGCCCAGCA
+ACCTTGCCAGGCAACAATGACGCTAGGCCTTCGCCGGCTCGACCGCACGAAAATCTGCCACATCTTCGCG
+GGATGTCGGCGACTGCGGTGGCTGTGCCATTCGCTGGTACGCGCCGCTGTTCGGCTACCGAAAAGTGTTG
+TGGTAATTGGTTACCGCAGCCCAGCGCCGGCGGCCAGCGCGCGACGTTGCCACGAAAAGCTTTGTGTAGC
+AGTCATATCCGTGGACATCGGTGTTAAGGGCTTGTGTCCACGGATCTACGTGCCGCCATGCGTCCCCGCG
+CTGATCTGGAACGTGAATTCATGGTCACAGATGCGAATGTGGTCGCCGTCGTTCAGCGTGACCGCGGAGC
+GGATTCGCTCGTGCTGCACATGCACGCCGTTGGACGATCGGAGGTCGTTGATGACGTAGTTGGTGCCCGT
+GTCGACGATGACGGCGTGGTGGCGGCTGACGTTGGCGCTGTCTAGGACGATGTCGTTGTCATGCAGACGC
+CCGATCCGGGTCGCCGCGGCTTGCAGTGGGTAGCCGCGACCCGAGGCGATGTCGTGCAGGTAGGCCACCG
+CCTGCTGGCCCGACGCCATGGTGCGCTGATCGAGCACCGTGACGGTGCCGGCAGCGGTGGTTTTGGCGGA
+CTTCTTGGCATCCAGCGGTTGCTGACGCAGAATCCGCTCGTTGAGAGCGCGCAACGTCGGACCGGGGTCG
+ATGCCGAGGTCGTCGGCCAGTGTTGTCTTCACCCGGCGATAGGCGCCCAGCGCATCGGATTGCCGGTCGG
+AGAGGTAGTAGGCGGTGATCAGCTGTGTCCACAGCGGCTCCCGGTAGGGGTGTTCGAATGTCAGAGCCTC
+GAGCTCGGCGATCACTGCGCTGGCCCGCCCACACGCGATTTCGGCCTCCGCCTTGGCGGTATGGGCAAGA
+ACCTTGTCTTCTACCAGCGCCGTGGCAAAGGGTTCGACGAACTGGAAGTCGCGCAGGTCATCGAGCACCG
+GCCCACGCCATTCTCTCAATGCGGCCGACAGGTGGCGGCTGGCTTGTTCGAACCGGCCGGCGGCGGCCGC
+GTGCACGCCCGCGGTTTTTTCGGCAACAAACCGCCCCAGATCGCAAGTGTTGTCGGGGATGCTGAGCCGA
+TAACCCGGCGGCGCTGCGGCCAACACCACCCGTGGGTCGATCCCGGCGCCACCGAGGAGCTTACGCAGAT
+TAGACACGTAGGAGTGGATACTCGCGCGTGCGCCCGAGGGTGGCCACTCCTCCCAGAGGGCGGTGATTAG
+GGCGTCGACTCCTACGGGCCTGTTGCGGTTGATGACCAACATGGCTAGCACAGCCCGTTGCTTGGGGGTG
+CCCGATGGCACCGGGGTGCCGTCGATAGTCATCTGCAATGGTCCAAGCAGGCCGAAGTCGAGCCGCTTCT
+CCACTGTCGCGCTACCAGCCATTGCGGGTCCTCCGTGGCTTGCGGTGCCAAGGTGCCAATAGGGTGTCGC
+TACCGGTCATTGTGATACCACGTTTCGCCGATGCGGTAAGAACCCAGGATCTCGGCACGCCGTGCGATGT
+ACCGGGTCGGTGGCCCTTGACAGCGGCATCGGCTGTTTCCATGCGGGTGAAATGCTGGCCCTGTAAAGAT
+GATCGTGAATGTCCCACGCGAATCCTGTTGGTGCTCATCCAAACATGCGATCGGCGGGCAGCCGACCCGG
+TGTTCTTGCAACGAGTGGCTGCCCGCTGTGGTGATCGACATTCGAGCGCGGTTCAGGTGGTGACGGCCAT
+GAAGTCGTGGCTGGTGGCCCACGCCTCGACGAAGGTTTCCATCGGGATCTGCTCGTCGCGGCCCGTGGGG
+GTACCGCTGTCGTTGAGGTGAACAATGCCGTTTTCGGTATCGACACCGGTCACCACCACGGCGTGGTCAG
+ACCGCGGGTTGCCGGCACTGTCGGTTTCCTCGACGGGCTGGCCCCAGATCATCTCGGCGTTGATGCTGAC
+GATCACGGCGTGCCCGCTGCCCAGATACTGCTCGAGGGCGGCCATGCCGGTGGCGACTCCGGTGGCTGTG
+GCGTGGTCCTCGTCGGTGATAACGGCGTCGACGCCGTAATGCGCCAGCAGCGTCGGTATGTCGGCCACGC
+TGGTACCCATTCCCGAGTTCGGGTGCTCGGCGTCGGCCGGCTTTGTGTAGATGGACCCGGGGTGCACGAC
+GCTGGGTGTCGACTGGGCCACTTTGATGATGGCGCGCTCGGAAGGCTCCCTGCCGGTCACTTGACCGATC
+ACGTCCGCGGCCGACATCAGGACGCAGTCGTCGTATGTCTGCTGGCGCCAGTACTTGGCGGCGGCTGCCG
+GGTCGCCATACATGGTGCCCGCCGCTGCGTCGGCGGGGCTGGCCAATCCCAGTGCAACGGCACCGGCGGC
+CAGCGCGAAGGTGGCGGTCTTGAAGGCGGTGGCGATTTTGCTGGTCGTCATCGTCGGTCCTTTTCTCGTT
+CCGCTATGCGGAGTGGATGTTGAGAAAAGGTTCCGATGGTGACCTTTTTGTTATCTCTAGGAATTCTTGG
+AGTGATCTGCAGTGGTCAGCCGAGGTTCACCGGTCGCGGGCAGGCCGATCTGCGCGGGCGCAGTCGACAG
+CGTTGCTACCGGGATGCACGGCGGTACCGACGATCGGTCGGCTGCCTAAGCGGGCGTGCGGGATTAGTTG
+CAGGCCCAGGTGTCGATGTAGCCGCCGCCGAGCTTGGTCAGGGCGTCCTTCATGGCGGCGGCCAAGGTGG
+GTCCAACTCCTCCCTGGTATGCCCTATCGTTGGCGGCGACGGCGCCGCAGGCGGTGAAACTGGTGAGCAC
+CTTGCAGTCGGAGTAGCCACACGACTTGACGGCGGTGGCTTCGGCAGCCGCCCGGGTTGGGTAGTCCCAC
+GATCGGCCCCACGAGCCGTTGCCGGAGTAGGCAATTGCGCCATAGACATCGGCGGCATTTGCTGGTGCGG
+GAGCCAGGGTGACGGTCGTCGCGGCGGCAGTGGCGACGCCGGCGACGGCCACCGCGAACCGTCGCCGAAG
+AGTAATCATCGTCGTCATTGGTGAGTCCTTTCCGAATGCCGGCGGTGCGGCGGTTTCAACAAGCAATTAG
+GACGATGGCTAGACCGGTTTGGTGGCGGTGACCTGCTTACCCCAGTCGGACATCGTCAACGTCACCGACG
+TGTCTTTGGTGGGAGCGATCTGGATCTGGACCAAGTGCGAGGATCCATCCGAAGCGATCCAGACGGTGGT
+GGGCACCGTTTTGACGTCTTCGGAGGTCAGACGTGAGCCGGCCAGCGTCGCGATGTCGTCAGCAGACGAG
+TTCCCGGTGATCTTGGTGGTCGCGACACCGTCCGCCTGCTGGCTGCCGGCAACCGACGCGTCCTTGAGGT
+TAGCCAACAGGTTGGCCAGGCCCTTGTTGGGGTCGAGGAGCACCGACACGTTGTAGATCGAGGTGCCGTT
+GCCGAAATCGGTGTAGGTGCCGGGCTGGCCTAGGTCGGAGTACAGGTGACCGTCAACATAGACGAACTTC
+GCGTCTTCGCTCTTGTTGCCGACGAGCAATGTCGCGCTACCGGTGGCAACCGTCTGCGGTGTGTTGGAGA
+TATCGCCTTCGAGCTTGGTCACCCGCAGGTTTGGCACGTCGCCTGTCACCGCAAGTCTGACGTGCATTCC
+GGTGACCTTGCGCATCGCATCGGTGGCCTGCTTGAGTAGCATGGCCGCATCGCCGTTGGATGCCGTGGCC
+GCGGTGTCAGACGCTTTGCCGGCGTCCCCTTCGGTTGAGCAGCCGCCGATCGCCAGGACGACGGCGAGTA
+TGGCGGTGGCGGCGGCAACAACGGAACAAGGTGGATGCTTCATCGAAATCTCCTCATGTTGGCCCACAGC
+TTCGTACTGCATAGCAATCCCGTTGCGGCAGAGTCAACAGCCGACACCGAGTCCGAGTGAGCGCCGCACG
+GCACCGCGAGTCGAATCGGCCGAATTGAATGGCGTTTCAAACGCTTTCGTTGTCCGGCGGCAAAGCGAAT
+GCGGGGATCCCGGTTGACGGGATCCCCGCATCGGGTGGGCAGCGGCTAGGTGAGCTGGCTGGCGTATTGC
+GGGCAGTAGGCCTTGGTTGCGTCGACGACGAAGTAGGCTGCCTGCTTAGTGGTCAGGTTGGTTTGGCTGA
+GGACCTCCTCGGCGATCTCGGTGCCGGTTTCGCCGCTGGCCAGCTTCTTGCAGACCAGCTGGGCTTGCTG
+GGTGGCCACCTGCGGTGAGGAGAAGGTGACGCCAATGGACTCCATCTGAGCAATGAAGGCTTCGTCTTTG
+GTGTTGGCGCCGGCGGTGCCGGCGGTGGCGACGGCAAGTCCGATGGCGGCGGCGCCGACTGCAGTGGTGA
+ACGCTGCGATAATGCGAGGCGATAACGGCGATAACATGGTCAAGATCCTTCGCGGTCGGGATTTCCCTGG
+ATGACCTCAGCTTGCGGGGGGCGCCTTGGCGGATTCTCAACAACTTCTTGGTAACCTCGTGGGCCCGCGT
+CGGGCTAGGCCCGCGTCATCTGGTAATAGACCCCGCGCCGGGCCAACAGCTCGGCGTGGTTGCCGCGTTC
+GACGATCTGGCCGGTCTGGACCACCAGGATGTGGTCGGCATCGCGAATCGTCGAAAGTCGGTGGGCGATA
+ATGAAACTCGTACGATCCCGGCGAAGCTCGCGCATCGCTCGCTGGATGAGCAGCTCGGTGCGGGTATCGA
+CCGAGCTGGTCGCCTCGTCCAGGATCAACAGCTGCGGGCGGGCAAGAAAGGCGCGGGCGATGGTAATGAG
+TTGCTTCTCGCCGACGCTGATGCTGCCGCCGTCGCCGCTGACCCGTGTCTGGTAGCCAGCAGGCAGTGTG
+TTCACAAACCGGTCGACATGGGCCGCCCTGGCGGCTTCTACTATCTCGTCTGTGGTGGCCTCCGGCCGTC
+CGTAGGCGATGTTCTCCGCGATGGTCCCGTCGTAGAGCCAGGTGTCTTGCAACACCATGCCGATTCGCGA
+TCGCAGCGACTGCCGGCTTACCGAGGCGATATCCACCCCGTCGATCAGGATTCGTCCGGAACCGATCTCG
+TAGAACCGCATTAGCAGGTTCACCAGCGTGGTCTTGCCGGCTCCCGTCGGTCCGACGATCGCCACCGTGC
+TACCCGGTTCGGCCACCAGCGACAGGTCGCGGATCACCGGCGTGCCCGGGAGGTAAGCAAAGTTCACGTG
+CTCAAACTCGACCCGTCCGGTTAGGTTCGGCAGCTCCGGCTCAGGCTCCGGCGACTCCTCGGGCTCGTCG
+AGCACGTCGAACACCCGCTCCGCGCTGGCCACCCCGGACTGCAGGGCGTTGTACATCCCGGCCAGCTGGC
+TCAGCGGCATGTTGAACTGGCGGATGTACTGGATGAACGCCTGGATGCTGCCGAGCGTGATCTGCCCGGT
+GGCTACCTGCAGGCCACCGGCCACCGCGACCGCGACGTAGCCGAGGTTGCCGATGAACGCCGTCGCCGGC
+TGCACGAGACCAGAGAGGAACTGGGCGCCGAAACCGGCCTGGTAGACGTCGTCATTCAACTCGTGGAACC
+GTTCTCGTGCGGCCGCTTGGTGGCCGAACGTCTTGACTACCGTGAACCCGCTGTAGGTCTCTTCGAGATG
+GGCGTTGAGGCGCCCGGTGCTGGTCCAGTGAGCTACGAATAGGGGCTGTGACCGCCGGGTGATCGCGCGT
+GTCACCAGCAGCGACAGCGGCACCGTCAGCAGTGTGATCAGCGCCAGCAGGCCCGAGATCGACACCATCA
+TGGCCAGCACCGCCACCATGGTCAGAATCGACGTCACCAGCTGGCTGATCGTCATTGACAGCGACGACTG
+GAGGTTGTCGATGTCATTGGTGACCCGGCTCAGCAGCTCACCGCGCTGTTGTCCGTCGAAGTAGGACAGC
+GGCAGCCGGTGCACCTTGTCTTCGACATCGGTCCGCAACCTGACCATCGTTTTCTGCACGGTGAGGTTGA
+GCAGCCGGGCTTGTGCCCAAATCATCAGCGCTGCAGCCAGATACAGCGCCAACGCCAGCGCCAGTGTTCG
+CTCCACCGCGGCGAAGTCCACACCTTGGCCCGGCACCACGTTCATCCCGGACAGCAGGTCGGCGAAGGTG
+TTGTCACCACGGGCCCGAGCCGAAGCGACGGCCTGTGCCTTGGTGATTCCCCCCGGTAGCCCTCGCCCGA
+TCACGCCGTTGAACAGCAAATCGGTGGCATGGCCGAGGATCCGTGGAACGATGACGCCGATCGTCGTGCC
+GGCGATTCCCAGTGTGATCACCGCGATGCTCAGCCGGCGTTGTGGCGCCAGCCGTTTCACCAGTCGGGCT
+GCCGATCCCCAGAAGTCGCGGGACCGCATGTTCGGGGGCGGGCTTGCGGCACGGGGGCGTGCGCCCGGTG
+GCGCGGTCACCCTACACCCCCGACCGTGGCGCTCAGCGATTGTGAGGCGGCGAATTCGGCATAGGTGGGG
+CAATCGGCCAGCAGCGTTTCGTGGGTGCCCGTGCCGACGATCTTACCGTTATCGACAACGATGACCTGGT
+CGGCCTGAGCGGCATTCGAAATCCGTTGTGTAACAACAATGATGGTTGCATCACCAGATACCTGTCGCAG
+CGATGCGTGGACTTTGGCGTCGGTGTGCACGTCAAGTGCGGAGAACGCGTCGTCGAACACATAGATGGCC
+GGACGTCGGATGACCGCTCGGGCTATCGCCAGCCGTTGGCGCTGCCCGCCGGAGAAGTTGACACCACCTT
+GGGCGACACGCGTCTGCAGCCCGTCTGTTTGTACAAAGCCGTCGGCCGCGGCGACCCGCAGCGCCTCCCA
+CATCTCCTGCTCGGTGACTACCTGGTCTGGGCCCCCGCCGTAGCGCAGGTTGTCCGCGACGGTTCCGGAG
+AAGAGGTAGCTGCGCTGGGGCACCAGCCCGATCGCTGACCAGAGCCGCTCGGTGTGGTACTCGCGGACGT
+CGATACCGTCAACCAAGACCGCGCCAGCGGTGACGTCGTAGAGCCGGCAGATCAACGACACCAGTGTCGA
+CTTGCCCGAACCGGTACTGCCGACGATCGCGGTGGTGGTACCGGGCCGCGCAGTCAACGAAATGTCCTGC
+AGCACCGGGCAGTCGGCGCCAGGATAGGTAAAGGTTGCGCCAGCCAAGCGCACTACGCCCGTGACCCCGT
+CCGTCGGGAACTTGGGATTGTCGGGGTTACCGAGTGCGGCGGGCGTGGAAAGCACCTCGGTGATGCGTTC
+GGCGCAGACCGACGCTCGTGGCAGCACGGCCAGCGTCATGGTCGCCATCAACACCGCCATCAGGATCTGG
+GCGAAGTAGGACAGGAAGGCGATCAGGGAGCCGACCTGCATCTGGCCGCTGTCGATGCGTAGCCCACCGA
+ACCAGATCAGTGCGACGCTGGATGCGTTGATGGTCAGCGTGGTCACCGGCAGCATCAGTGCTTGCCAGTT
+GCCGGCGCTCAGTGCGGCATTCGACAGCGCCGTATTGGCCTGCGCGAACTTGTCGCGTTCATAGCCTTCG
+CGGGTGAAGGCGCGGACCACTCGCACCCCGGACAGCTGATCGCGCATCACCCGGTTGATGCCGTCGATCA
+GGCTCTGCATGCGGCGGAAGAGCGGCAGCATGTGGGAGATGATCCAGTAGTTTGCTACGGCCAGAATCGG
+AACGCTGACCAGCAGCAGCCATGTCAGCGCGGCCTCCTGGTGGATGGCCATGATGATTCCGCCGACGCAC
+ATGATCGGTGCGGTGACCAGCACGGTGGCGGTCATCTGGACCAGGAACAGGATCTGCCGGACGTCGTTGG
+TGCTGCGGGTCAACAACGTCGGAGCGCCGAATCGGGCGGTCTCGCGTTCCGAGAAGGTGATGATGTGTTC
+GAACATTGCCGAGCGCAGGTCACGGCCGAAACCCGCCCCGGTCCGGGAGCCCAGATAGACTGCCCCGATC
+GCGCACAGCACCTGCAATCCGGTCACCCCAAGCATCACCGCACCCAGCCGTACGATGGTGGCGGTGTCGC
+CCTTGGCGACGCCGTCGTCGACGATTGCGGCGTTGACCGTCGGGAGGTATAGCGAAGCCAGGGTGCTGAC
+CAGCTGCAGCATCATCAGCATCGCGACCAGCCGGCGGTACGGTCGGATGTGCTGGCGCAGCAGGGCCAGG
+AGCATTGGGTAACTGTCGCACACTGCGCATGCTGCCTACCCGCGCCAGGCATGAGTCTTAGGCCGAAATG
+CCTGGTTAACTGGCGTGTCGTGGTTGACCCGCGGGCCTGCGGCTACAGTGCATGCTGTGATCGGCAGTGG
+GAGAGGTAGCGGTGCGGCGTAAGGTGCGGAGGTTGACTCTGGCGGTGTCGGCGTTGGTGGCTTTGTTCCC
+GGCGGTCGCGGGGTGCTCCGATTCCGGCGACAACAAACCGGGAGCGACGATCCCGTCGACACCGGCAAAC
+GCTGAGGGCCGGCACGGACCCTTCTTCCCGCAATGTGGCGGCGTCAGCGATCAGACGGTGACCGAGCTGA
+CAAGGGTGACCGGGCTGGTCAACACCGCCAAGAATTCGGTGGGCTGCCAATGGCTGGCGGGCGGCGGTAT
+CTTGGGCCCGCACTTCTCCTTCTCCTGGTACCGCGGCAGCCCGATCGGGCGGGAACGCAAGACCGAGGAG
+TTGTCGCGCGCGAGTGTCGAGGACATCAACATCGACGGCCACAGCGGTTTCATCGCCATCGGTAACGAGC
+CCAGTTTGGGTGACTCACTGTGTGAAGTCGGAATCCAGTTCTCCGACGACTTCATCGAATGGTCGGTGAG
+TTTCAGCCAGAAGCCGTTCCCGCCGCCGTGCGACATCGCCAAAGAACTGACCCGCCAATCGATTGCGAAT
+TCGAAATGAGACGTGTCCTGGTCGGTGCGGCCGCCTTGATCACCGCACTGCTTGTCTTGACCGGCTGCAC
+GAAGTCGATTTCGGGTACCGCCGTCAAGGCGGGTGGGGCCGGTGTCCCGCGCAACAATAACTCCCAGGAG
+CGCTACCCCAACCTGCTCAAGGAATGTGAGGTCCTGACCACCGACATCCTGGCCAAGACCGTCGGTGCCG
+ATCCGCTCGACATCCAGAGCACGTTCGTCGGCGCGATCTGCCGGTGGCAGGCGGCCAACCCGGCCGGTCT
+GATCGATATCACCCGGTTCTGGTTCGAGCAGGGCAGTCTGAGCAATGAGCGCAAGGTCGCCGAGGGCCTG
+AAGTACCAGGTCGAGACCCGCGCGATCCAGGGCGTGGACTCGATTGTGATGCGGACGGGCGATCCCAACG
+GCGCCTGCGGCGTCGCCAGCGACGCGGCGGGAGTGGTCGGCTGGTGGGTCAATCCCCAGGCTCCTGGTAT
+CGACGCCTGCGGGCAGGCGATCAAGCTGATGGAGCTGACGCTGGCAACCAACGCCTAGCGCTGGGCGAGG
+CGGGAGCGTGGGCATGAGCGCGCGCAGTTGTACGGCACTAACGGCGTGTCGGGGTACAGACACGCGCGCT
+CGCGGGTTCGGCTGCCTTCAAAAGGAAGTACGCGGCTGACGGTTTGCGGAGCAAGAGCACCTCTACCGTG
+GCACGTGAAAGCCGACCAGCGCGGCACACCCCGGTTCGACGTCTGCCCAGTGTCCGGCGACGCGTAGCAC
+GGCGATCCCCGACGTCGGGAACTTCTCCGAGATGCGTTCCGCGACAGCGGCGTCGGTGCCGCTGATGCTG
+GCCAGGACGATGGCAAGGGCCGACGTCGTTGGCTCGTGCCCGACCACAAGCAGTGAGGTGACGTTGTCGC
+CAACCCGGTTGATCTCCTCGATCACTGTTCCGGGTGCCGCGCCGTAGAGCCGCTCGGCGTAGCGAGCGGG
+TGCGTCGATGCCGGTGTGCGCCAAGGTCTGCCGGGCGCGCGTAGCCGTGGAGCACAGCACGGCATCGACG
+GCCGGCAGGTTGGCGCGCAGCCAGCCACCGGCCAGCCCGGCCTCCCGGATACCCCGCGGCGCTAGCGGCC
+GGTCATGGTCGGCGATCCCGTCCGGGTACGCAGACTTCGCGTGTCGCATCAGCACCAGGTTGCGGTATTG
+CTCATTCACTGGGCTGACGTTAGTTCAGTGACGTGCCCGGGATCGCTACGGTTGGTCGTCGTCCTGGTCC
+CCGCCGCGCTCCGCTGGCATGGGACAGACTTCGTTGCGATCGCCTAGCTCGAGCCGAGGCGTCAGCCATA
+GGGCGCTGATAGGTAGGGCGAGCATTCTGTGCCCAAAGGATAGGGCTGGCATCGCCCGGGCAAGCACGGG
+CGGCATGCTGCCCCGCCGGTGAGTCCGCGCCCGGGACCTGCCGGGCGAGGTCCCGCGCCTTGTCGGTGTG
+CAGACCTACACTCGCTTTGCGTTGACAGCCACGCACTCAGGAGGGATGGGATGCGATTCCTGCACACTGC
+CGACTGGCAGCTCGGCATGACGCGTCACTTTCTCGCCGGTGACGCCCAGCCGCGATATTCTGCTGCCCGC
+CGTGACGCAGTCGCTGGACTAAAAGCGCTGGCCGCCGATGTGGGCGCCGAATTCGTCGTAGTCGCCGGTG
+ACGTCTTCGAACACAATCAGCTCGCGCCACAGATAGTCGGTCAATCCTTGGAAGCCATGCGCGTGATCGG
+CCTTCCGGTCTATCTGCTGCCGGGTAACCATGACCCGCTGGACGCTTCGTCGGTGTACACCAGCACGCTG
+TTTCGAGCCGAACGGCCGGACAACGTTGTGGTGCTCGACCGAGCTGGCGTCCACGAGGTCCGGCCGGGAG
+TCCAGATCGTCGCGGCGCCGTGGCGGTCCAAGGCGCCCACCACCGACCCGGTTGCCGAGGTGCTGGCCGG
+CCTGCCCACAGACGCCGCTATTCGGCTGCTCGTCGCCCATGGGGGTGTCGACGCGCTGGACCCCGACCAC
+GACAAACCGTCGCTGATCAGGCTCGCCGCACTCGACGACGCGCTGACTCGACAGGCGATTCATTATGTGG
+CCCTAGGTGACAAACATTCGCTTACCCAGGTCGGCAGCAGCGGGCGGGTCTGGTACTCCGGTGCACCGGA
+AGTCACCAACTTCGACGACGTCGAACCGGACCCCGGTCACGTCCTAGTGGTCGACATCGACGAAAGCGAC
+CCGCGACATCCCGTCACCGTCGACGCCCGTCGCATCGGCCGCTGGCGGTTCGTTACGTTGCACCACCAGG
+TCGACACCAGCCGGGACATCGCCGACCTGGACCTGAACCTGGATCTGATGACGGACAAGGACCGCACCGT
+GGTGCGGCTGGCCCTGACCGGTTCGCTGACGGTCACTGACCGCGCCGCATTGGATACCTGTCTGGACAAG
+TACGCGCGGTTGTTCGCCTGGCTGGGTCTGTGGGAACGTCACACCGACCTAGCGGTGATACCCGTCGACG
+CCGAGTTCACCGACCTCGGCATCGGGGGGTTCGCCGCCGCGGCCGTCGACGAGCTAGTCGCGACCGCGCG
+CGGGGGTGACGACGAGTCCGCCGTCGATGCCCAGGCGGCGCTGGCACTGTTGCTGCGGCTCGCTGACCGG
+GGAGCGGCGTGAAGCTGCACCGGCTGGCCCTGACCAATTACCGCGGCATCGCACACCGTGACGTCGAATT
+TCCCGATCATGGAGTGGTGGTGGTGTGCGGCGCCAACGAGATCGGCAAGTCCTCCATGGTCGAGGCGCTG
+GACCTGCTGCTCGAGTACAAGGACCGCTCGACGAAGAAGGAAGTCAAGCAGGTCAAGCCGACCAACGCTG
+ATGTCGGCTCCGAGGTCATTGCCGAAATCAGCAGCGGCCCTTATCGTTTCGTCTACCGCAAGCGTTTCCA
+CAAGCGGTGCGAGACGGAGTTGACCGTGCTGGCACCGCGCCGCGAGCAGCTGACCGGCGACGAAGCGCAC
+GAGCGGGTCCGGACGATGTTGGCCGAAACGGTCGACACCGAACTGTGGCATGCCCAGCGGGTGCTGCAGG
+CCGCCTCGACGGCCGCGGTGGATCTGTCTGGCTGCGACGCGCTCTCGCGTGCGCTCGATCTCGCCGCCGG
+TGATGACGCCGCGCTGTCGGGCACCGAGTCGCTGCTCATCGAGCGGATCGAGGCCGAGTATGCGCGCTAC
+TTCACCCCGACCGGGCGCCCCACCGGAGAATGGTCCGCGGCGGTCTCTAGGCTGGCGGCCGCCGAGGCCG
+CGGTGGCCGACTGCGCGGCGGCGGTAGCCGAGGTCGACGACGGGGTTCGTCGCCACACCGAGCTCACCGA
+GCAGGTGGCTGAGCTGTCGCAGCAACTACTTGCTCACCAGCTGCGGCTCGAAGCTGCGCGAGTCGCCGCC
+GAGAAGATCGCCGCAATCACCGACGACGCCCGCGAAGCCAAGCTGATCGCTACTGCCGCGGCCGCGACCA
+GCGGCGCTTCCACCGCCGCACACGCCGGACGGCTGGGCCTGCTCACCGAAATCGACACGCGCACTGCGGC
+CGTCGTTGCTGCGGAGGCAAAAGCGCGGCAGGCCGCAGACGAGCAGGCGACGGCGCGCGCGGAGGCCGAG
+GCCTGCGATGCCGCGCTCACGGAGGCAACCCAGGTATTGACGGCCGTCCGCCTTCGCGCCGAGTCGGCCC
+GGCGCACCCTCGACCAGCTCGCCGACTGCGAGGAGGCCGACCGGTTGGCCGCCCGGCTGGCCAGGATCGA
+CGACATCGAGGGTGATCGCGACCGGGTCTGCGCGGAGCTGTCCGCGGTCACGCTGACCGAGGAGCTACTG
+AGTCGGATCGAACGTGCTGCGGCAGCCGTCGATCGCGGCGGTGCACAGCTGGCGTCGATCTCCGCGGCGG
+TGGAGTTCACCGCCGCCGTCGACATCGAGCTCGGCGTCGGCGATCAACGGGTGTCGCTGTCCGCGGGCCA
+AAGCTGGTCGGTCACTGCCACCGGCCCCACCGAGGTCAAGGTTCCCGGCGTCCTGACCGCACGGATCGTC
+CCGGGCGCGACCGCACTCGACTTTCAAGCCAAATATGCTGCAGCACAACAGGAATTGGCTGATGCGCTGG
+CGGCTGGAGAGGTCGCTGACCTAGCCGCCGCACGCTCCGCCGATCTGTGCCGACGCGAACTGCTGAGCCG
+CCGCGATCAGCTGACCGCCACTCTGGCCGGCCTGTGTGGCGATGAACAGGTCGACCAACTGCGTTCCCGC
+CTGGAACAGTTGTGTGCCGGTCAACCGGCCGAGCTCGATCTGGTTTCGACGGATACCGCTACGGCCCGCG
+CTGAATTGGATGCGGTCGAGGCGGCTCGAATCGCCGCGGAGAAGGACTGCGAGACCCGCCGTCAGATCGC
+TGCTGGCGCCGCTCGCCGGCTCGCGGAGACATCCACGCGGGCAACGGTTCTACAGAACGCAGCGGCCGCC
+GAAAGCGCCGAGCTCGGTGCGGCCATGACTCGGTTGGCCTGTGAGCGGGCGTCCGTGGGCGACGATGAGC
+TCGCCGCCAAGGCCGAGGCCGACCTGCGGGTACTGCAGACGGCCGAGCAGCGAGTGATCGACCTGGCCGA
+CGAGCTCGCAGCTACGGCGCCGGACGCGGTAGCCGCCGAGCTGGCCGAGGCCGCCGACGCCGTCGAGTTG
+CTGCGCGAACGTCACGACGAGGCCATTCGCGCGTTGCACGAGGTCGGCGTCGAACTCTCGGTGTTCGGCA
+CCCAGGGCCGCAAGGGCAAGCTTGATGCCGCCGAAACCGAGCGTGAGCACGCCGCCAGCCACCACGCGCG
+GGTCGGGCGCCGGGCCCGGGCCGCCAGGCTGCTCCGCTCGGTGATGGCACGCCACCGCGACACCACCCGG
+CTGCGCTACGTCGAGCCATACCGGGCGGAGCTACATCGGCTCGGCCGCCCAGTGTTCGGGCCCTCTTTCG
+AGGTCGAGGTCGATACCGATTTGCGCATCCGCAGCCGCACCCTGGACGACAGAACCGTGCCCTACGAGTG
+CTTGTCGGGCGGGGCCAAAGAACAGCTTGGCATCCTGGCGCGATTGGCCGGCGCGGCGCTGGTCGCCAAG
+GAGGACGCCGTTCCGGTGCTGATCGACGACGCGCTGGGGTTCACCGATCCGGAGCGACTAGCCAAGATGG
+GGGAGGTCTTTGACACCATCGGCGCCGACGGACAGGTGATCGTGCTGACGTGCAGTCCCACCCGATACGG
+CGGTGTCAAAGGAGCGCACCGCATCGATCTGGACGCCATACAGTGAGCCCGAAACGGGGACATGCGATGG
+ACACTCAGAGCGACTACGTCGTGGTCGGTACCGGCTCAGCCGGGGCGGTTGTGGCCAGCCGGCTTAGCAC
+CGATCCGGCCACGACGGTGGTGGCCCTGGAGGCGGGGCCGCGTGACAAGAACAGATTCATCGGCGTCCCA
+GCGGCGTTTTCCAAGCTGTTCCGCAGCGAGATCGACTGGGATTACCTAACCGAACCGCAGCCGGAGCTCG
+ACGGCCGCGAAATCTATTGGCCTCGTGGCAAGGTGCTCGGTGGCTCGTCGTCCATGAACGCAATGATGTG
+GGTGCGTGGATTCGCATCAGACTACGATGAGTGGGCCGCGCGAGCCGGTCCGCGGTGGTCGTACGCCGAC
+GTGCTCGGCTACTTTCGCCGCATCGAGAACGTCACCGCTGCCTGGCACTTTGTCAGCGGTGACGACAGCG
+GAGTAACCGGTCCGTTGCATATTTCCCGGCAACGCAGCCCAAGATCGGTGACCGCAGCGTGGCTGGCAGC
+CGCACGTGAGTGCGGATTTGCCGCTGCGCGGCCGAATTCCCCTCGACCGGAAGGCTTTTGCGAGACCGTC
+GTCACCCAGCGCCGCGGTGCTCGATTCAGTACTGCCGACGCCTATCTGAAGCCCGCGATGCGCCGTAAAA
+ACCTCCGTGTGCTTACCGGCGCCACTGCTACCCGGGTGGTCATCGACGGCGACCGGGCCGTCGGCGTGGA
+ATACCAAAGCGACGGTCAAACCCGCATCGTCTACGCCCGCCGCGAGGTGGTGCTCTGCGCTGGTGCCGTC
+AACAGCCCTCAGCTGCTGATGCTCTCCGGCATCGGCGACCGCGACCACCTCGCCGAACACGACATCGACA
+CCGTTTACCACGCGCCCGAGGTCGGGTGCAACCTGCTCGATCATCTCGTCACGGTGCTGGGTTTCGACGT
+CGAAAAGGACAGCTTGTTTGCCGCCGAGAAGCCCGGCCAGTTGATCAGCTACTTACTGCGACGCCGCGGC
+ATGCTCACCTCCAACGTCGGCGAGGCGTACGGATTTGTCCGCAGCCGACCCGAACTGAAGCTGCCCGATT
+TGGAGTTGATTTTTGCCCCGGCGCCGTTTTACGACGAAGCGCTGGTTCCACCGGCTGGTCACGGTGTGGT
+ATTCGGCCCGATTCTGGTCGCGCCGCAAAGCCGTGGCCAGATCACGCTGCGGTCCGCCGATCCGCATGCC
+AAGCCTGTCATCGAACCGCGTTACCTGTCCGATCTCGGTGGCGTAGACCGGGCCGCCATGATGGCGGGCC
+TGCGGATATGCGCGCGGATCGCGCAGGCCCGCCCGCTCAGAGATCTCCTTGGGTCCATCGCGCGACCGCG
+CAACAGCACCGAGCTGGACGAGGCCACTCTCGAGTTGGCGCTGGCCACTTGTTCGCACACCCTGTACCAC
+CCGATGGGCACCTGCCGCATGGGCAGCGACGAGGCCAGCGTGGTGGATCCGCAGCTGCGGGTCCGCGGTG
+TCGACGGACTCCGCGTCGCCGACGCGTCGGTGATGCCCAGCACGGTTCGTGGGCATACGCATGCGCCGTC
+GGTGCTGATCGGGGAGAAGGCCGCCGACTTAATCCGCAGCTGAGCTGGTCGCCGCCGGCTCAGCGTCGCA
+TGAACCCGATGGCGGTGTAGTCCAGGTCTGCCAGACCCGTCGCGCCGAAGTTGGCCAGCGTGCTGCGGAC
+CGCAACGGTGCCGGGCGACTGGGTAAGCGGCAGGCTGAATCCTTCGGCCCAGATCAGCTCGTCGACCTGG
+TTGGCCAAGGCCCTCGCCTTGCCGGGATCGAGTTCTGCCAGCGTTCGCTCGATCGCGGCGTCGATTTGCG
+GGCTACCGATCTTGCCGAAGTTGCTTTCCCCGTCCGAAGCGTAGATCTGGGTGAGCGATGACAGCGGAAA
+CGCGTCGCCCACCCAGCCGAACTGTGCGATGTCGAAAGCCCCCACGTTGACGTAGTCGCTGAAGAAACCG
+CTGCCGGACTTGGCCTGAAGTTCGAGTTTGACGCCGATCTGCGCCAGGGTGTGTTGGGCGATCTGGGCGA
+ACTGCCGGGTGCTTTGTGCGTCGTAGAACAGATCGCGGATGACGAGCTGGCGACCGTCCTTCTCCCGGAA
+CGCGCCGCTTCGCCTCCAGCCCAGGGCGTCCAGCTCCCGTTTCGCTTGTTCCGGGTTGTAGGCGACAACG
+CCGCTGTTGTCCTGGTAGCCGTCTTGGCCGGCGACGAAGACGTGGTTGTTCAGTGGCACCGGGTCGCTGG
+TGAGGCCGTATTGGGCGACCCTGGCGATGGTGTATCGGTCGATGCCCTTGGCGATCGCCAGGCGCAGCGC
+CTTGTCGGCGAGGATCGACCCAGGCGCACCGTTGAGGGTGAAGTGATACCAGCTGGGCCCGGGGGCGCGC
+CGGATCGAGATGCCCTTGGTGCGCGCCGCGATGGTCAGCTGGTCCAGTGTGCCGACGCCGGTGGCGTCGA
+TTGTGTTGTTCTGCAGCGCCGGCAGCCGGGCGGCATCATCGAGCACCAGGTATGTGATGCTGTCCAGGCG
+TGGCCGTGCCCCCCACCATCTCGGGTTACGGGTCAACACGATTCGCTGCGCGGTGCGGTCCAGGGCAGAC
+ACGACGAACGGACCCGCCGACGGACCGGGCCCATCGAGTTGACCCTTATTGAATGCCTCGGGTGTGGCGG
+TCATACTGGCCGGCAGCAGCATGCCGTTGCCCGCGAACATACCGCGCCACTCCGCGTACGGCTTGGCGAA
+CGTCACCACGGCCTGCCGGTCGTCGACCCCTCTGGTTACCGACGCCACACGCTCGGCGCCGCTGCTAGAA
+GCGATCTCGAATGCCTTGTCGGCGCCGCTGATCGCATGAATCTGGCTGGCGATGTCCCGCCAGGTGATCG
+GGGTCCCGTCGGACCACACCGCCTCGGGATTGATGGTGTAGGTGACCACCTGCGGGGCGGTCCTGGTCAG
+CTCGATGCTGGTGAAGTAGTTGGTGTCGACCGTCGTCGAGCCGTCCGGTCCGATGATGAACGCGCGCGGC
+AAGGTGGCTTTCATCATCGCCGCGACCTCGGCGTTGTTGCCGTCGATGTGCAAGATGTTGAAGTTGGGCG
+GAAAGTCGGTGAGCGACAGGCGAAGATTGCCGCCGTCTTGCAACGTGGCGGGATCCTGCTGATTGATGTC
+GCTGGTGGTGCCAACCGCGGCCCTGCGGTCCGCAGTGGGCGCGAGTTCGAGTTGGGTACCGGAGGCCGAG
+CATCCGGTGAGCACCATAGCCACGACGAGCGGTGTTAATAACGCGAAAGCCCAATATCGAGTCTGCGTCC
+AGGGTCTGGATTTCCCCTGAAACGACGCCCTGAGCGCAGACGCGATGCCCGGGGCGCAGCCTCGTCGCTG
+GCCACGGTCAGCCACGACGGGCCGGATCCGGTTGCGGTACCGCGCCCAGCAGTCGCCTGGTGTACTCGTG
+TTTCGGATTGCCGAAGACCTCCTCACTGTCGCCCTGCTCAACAACGGTACCGGCAAGCATGACCGCCACC
+TGGTGGGCGAGGTGTTTGACCACCGAAAGATCGTGGGAAACAAATAAATATGACAACCCGAACTGCTCTT
+GGAGGTCGAGCAGCAGGTTGATGATCCCGGCCTGAATGGAGACATCGAGTGCCGACACCGGTTCGTCGAG
+TGCCAGGATCTTGGGTTGGAGCGCCAGTGCCCGCGCGATGCCGATGCGCTGCTTCTGACCGCCGGAGAAC
+TCGGCGGGATAACGACTGGCGTCGCCGTGGCGCAGTCCGACGATATCGAGCAGCTCGGCGACCCGCGCGT
+GAGTCTCGTTCTTGCCGAACCCATTGGCCTGCAATGGTTCGGCAATCAGATCGAAGACCGGCAGCCGCGG
+GTCTAAGGACGCCACCGGGTCTTGGAAGACCACCTGGATGTCGCGGCGCAGCGATCGGCGTTCCGCTGTC
+CCCAGCGTGGCGACGTCAGTGCCGAGGACTTCGATCGATCCCGATTGCGGCGCAGCCAGCTCCAGGATCT
+CGTGCAGGGTGGTCGACTTGCCCGAACCGGATTCGCCGACGATACCCAACGTGCGGCCCTGCCGGAGTTC
+GAGACTGATGCCGTCGACCGCGCGGACCTCGCCGATCGCCCGGCGCAGCACCACGCCCTTGGCCAGCCGG
+TAGGTTTTGACTAGATGACGTACCCGCACGACCACCGAGGCGTCGCCGAGTGCAGCCGGGCGGGCCTCGG
+TTTTGACCCGGTAGATGTCGGCGGCGCTGCGCCCGGTGACCAGCTCGGTGCGGATGCAGGCCGCCCGGTG
+ATCGGTAGCGACGTCAAGCAATTCGGGTTCCGCGGTAAGGCATTCGTCGATGACTAGCGGGCAGCGCGGC
+GCGAACGGGCAACCCGGTGCCAAGCCCGCCAGCGACGGGGGCGCACCCGGTATCGGCACCAGCCGGGTGC
+CCTGCGCGGCATCCAGCCGGGGGACCGAGCCTAAAAGCCCCACGGTGTAGGGCATCCGGCGATCGCGGTA
+CAGATCATTCACCCCGGCCGACTCGACGACCCGTCCGGCGTACATCACCAGCGCCCGGTCGGCGAACTCG
+GCCACGACGCCGAGGTCGTGGGTGATGATCAGCACCCCGGCGCCGGTGACGTCGCGCGCCGCCTTGAGGA
+CGTCGAGGATCTGCGCCTGCACCGTGACGTCGAGCGCCGTGGTCGGTTCGTCACAGATCAACAGGTCGGG
+ATCGTTGGCGATCGCGATGGCGATCACCACGCGTTGGCGTTCGCCACCTGAAAGCTCATGCGGAAACGCA
+CGGGAACGCCGCTGCGGCTGCGAAATACCGACCAGGTCAAGCAGTTCCACCGCACGCCGACGAGCGGCCT
+TCTTGCCAACACGGGGCTGGTGCACCTCGATGGCCTCGGCGATTTGGTCGCCGACGGTGTAGACAGGGGT
+GAGCGCAGACATCGGATCCTGGAACACCGTGCCGATCGCCTTGCCTCGAAACCGGGACATCGCGTTGTCG
+GCAAGCCCCAACAGTTCGGTACCCTGTAGCCGAACCGAACCACGCACCTGCGCGTACTCGGGCAGCAGGC
+CCACCACCGCCATCGCCGCTGCGGACTTACCTGAACCCGATTCGCCCACCATCGCGACCACCTCGCCGGG
+CTCGACGCGGTAGCTGATCCCGCGCACCGCGGTCACCGGATCGCCATCGGTCCTGAAGGTGACGGCCAAA
+TCGGTCACCTCGAGCAGGGGGCTCATCGCACACCACGGCGCAGGGATCTGCTGGCTGGGTCCAGCGCGTC
+GCGCAGGCCATCGCCGGTCAGGTTGGCGCACACCAGAATCAACACCAGGATACTGGCGGGAAACAAGAAC
+ACCCACGGGAACGCGGTCGCGGATGCGGTGCCGTCGGCGATCAGGGTGCCCAGCGACACATCCGGCGGTT
+GAATACCGAAACCAAGGAAGCTCAACCCGGTTTCGGCCAGGATGGCGGCGGCAACATTGAGGGCGGCGTC
+GATGATCAAGATGGATGCGACGTTGGGCACCACATGGCCGACGATGATCCGGCGGCTGGAGACACCCATA
+TATCGTGCGGCCCTGATGAATTCGCGTTCTCGCAAGCTCATCGTCATCCCGCGCACCATGCGAGAGCTGA
+TCATCCAGCCGAAGCCGGCCAACAACAAGACAAGAAACATGATGTTTGCCGAGTTCTTGGTTCGCGGGGT
+AACGATGGCGATCAGGATGAAGCTGGGCACTACTAGCAGCAGATCGACCACCCACATCAGTGTCCGGTCC
+CGCCAGCCGCCGAAATATCCCGAGATCGCTCCAACCGTGGCAGCGATACCAGTCGAGATCACCGCAACGC
+AAACACCAATCAGCATCGACTTCTGCATGCCACGCAGCGTCTGCGCCAGCAGATCTTGGCCCAGCGCGTT
+AGTGCCCAGCCAGTGCTTGGTGCCCGGCGGCTGCAGCAATGCGTTGAAATCAAGGTCGTCGTAGGAGTAG
+GGCAATAGTGGGGGCAGCGCATAAGCGCTGACGAACAGCAGGAGCAGCGCCGCCAGCGACGCCACCGCGG
+CCCGATTGCGTAGGAACCTGCGCACCACTAGGGTGCGCCGCGAGGCGAATTCCGTCATGACACCCGTACC
+CTCGGGTCCAAAGCCGCGTAGATCACGTCCGAGAGCAAACCGGCCAGCAACACGACCGCGCCGGAGAACA
+CGGTAATTGCCGCGACGATGTTGGTGTCCTGAGTCGAGATACCGCGGACCATCCATTCACCCATGCCGTG
+CCAGCCGAAGATCTTCTCGACGAAAACCGCTCCGGTGACCAACCCGGCCACCCCGTAGGCGAACAGCGTG
+GCCATCGGTATTAGCGCCGTTCGCAGGCCATGCTTGAGTAGGGCCCGTCGTCGGGTCAGCCCCTTGGCGC
+GGGCGGTGCGAATGAAATCCTGGCCGAGGACATCCAGCATCGCGTTGCGCTGGTAGCGGCTGAACCCGGC
+GGCGGCCGCCAGCGCCAACGTCAGCGATGGCAGGATCAAATGCTGCAACCGGTCGCCTAGCCGATCCCAC
+ACCCCGCCGGCAACGCCGGGTGACGTCTCCCCGGTGTAGTCGAAAAGCTGGATGCCCACTGCCCAGTTGA
+CCCGCAGGGCGCCCAGGATCAACAGGTTGGCCACCACAAACGTCGGTGTGCTCAACACCAGCAGCGCCAG
+CGTGGTCATGACGCGGTCGCTGAGCCGGTACTGCCGGATGGCACCCCACGCCCCGATCACCACACCGGCC
+ACCGTGCCGAATACCGATCCAACGACCAGCAGCCGCAGGCTGACTCCGATCCGGCGCCCCAGTTCGGTAC
+CGACAGGCTGGCCGGTGATGGTGGTTCCGAAGTCGCCACGGACGGCATGCGATACCCAGTTGGCGTAGCG
+GGCCAGTATGGGTCTGTCCAAGCCGAGATCGTGTGCCTTGGCATCGATAACCGCTTGCGGTGGGCGCGGA
+CTGCGTTGCATCAGGCTTTCCAGCGGCGAGAACGCCAGCGAGGTCAGGCAGTACGTCAAAAACGACGCCA
+GCGCCAGCAGCACCAGGTAGTTGAGCAACCGGCGGGCCAGATAGCGCGTCATGCCCAACCACCGCGTCGC
+ATTGGGACAGGGTAGCGAGCCCGGCGATGGCGTGCCGCCAGCGCGCCGGTTGATGGGGTCACCCGTGATC
+CGGATGGTTCCGCTCGGGCCGATTCTGATGCGTGAAAACTGGGTAACCGGTTGTTAAAATTCACCGCGGC
+GTCGATCTGAGTAGCAAAGTCCACACCGCGATACCCGAGGAGGCCCGCGTGACGGTTACCGACGACTACC
+TGGCCAACAACGTGGACTACGCGAGCGGTTTCAAGGGCCCGCTACCGATGCCGCCGAGCAAACACATCGC
+AATCGTGGCGTGCATGGACGCCAGGCTGGACGTCTACCGCATGCTGGGCATCAAGGAGGGCGAGGCACAC
+GTCATCCGCAACGCCGGATGCGTGGTCACCGACGATGTGATCCGTTCACTGGCCATCAGCCAGCGGCTGC
+TGGGAACCCGCGAAATCATCCTGCTGCACCACACCGACTGTGGGATGCTGACTTTCACCGACGACGACTT
+CAAGCGCGCCATCCAGGACGAGACCGGCATCAGACCCACGTGGTCGCCCGAGTCGTACCCCGACGCCGTC
+GAGGACGTCCGTCAGTCGCTGCGCCGCATCGAGGTCAACCCGTTCGTCACCAAGCACACGTCGCTGCGCG
+GCTTCGTCTTCGATGTCGCCACCGGCAAACTCAACGAGGTCACGCCCTAGCAGCCCGAGCCGTCAGCCTA
+GGGCGCACTGGCGCACCGGCAGCCCGCCGAGATGGGGCTGCGTTGACAGCGATAGGGAAGCCTGGTTGCA
+TAGATGGCAATAACCATAAATATGGTCAATCCTACCGGATTTATCAGGTATGAGGACGTGGAACAGGAAG
+CCATGACCAGCGATGTGACGGTGGGCCCCGCACCCGGCCAGTACCAACTGAGCCATCTGCGCTTGCTGGA
+GGCCGAAGCCATCCACGTCATCCGGGAGGTGGCCGCCGAGTTCGAGCGGCCAGTGCTGTTGTTCTCGGGG
+GGCAAGGACTCCATCGTCATGCTGCACCTGGCGCTGAAGGCGTTTCGGCCCGGGCGACTGCCGTTCCCGG
+TCATGCACGTCGACACCGGTCACAACTTCGACGAAGTTATCGCTACCCGAGACGAGTTGGTCGCCGCGGC
+CGGGGTGCGGCTGGTGGTGGCGTCGGTGCAGGACGATATCGATGCCGGTCGGGTCGTCGAGACCATCCCG
+TCGCGAAATCCGATACAGACCGTGACGCTGCTGCGGGCCATCCGGGAGAACCAATTCGACGCGGCATTCG
+GGGGAGCCCGGCGCGACGAGGAGAAGGCCCGCGCCAAGGAGCGGGTGTTCAGCTTCCGCGACGAGTTCGG
+CCAGTGGGACCCGAAGGCTCAGCGGCCGGAACTGTGGAACCTCTACAACGGACGGCACCACAAGGGCGAG
+CACATCCGGGTCTTCCCGCTGTCCAACTGGACCGAATTCGACATCTGGTCCTACATCGGCGCCGAGCAGG
+TCAGGCTGCCGTCCATCTATTTCGCCCACCGGCGCAAGGTGTTTCAGCGCGACGGCATGTTGCTGGCCGT
+GCACCGGCACATGCAACCGCGAGCCGACGAGCCGGTGTTCGAGGCCACGGTGCGATTCCGCACCGTCGGG
+GATGTTACCTGCACCGGGTGCGTCGAGTCGTCGGCATCGACGGTCGCGGAAGTCATCGCCGAAACTGCGG
+TGGCCCGCTTGACGGAGCGCGGGGCGACCAGGGCTGACGACCGGATCTCGGAGGCTGGAATGGAAGACCG
+CAAGCGGCAGGGATACTTCTGATGACGACGCTATTGCGGCTGGCGACAGCGGGTTCCGTCGACGATGGCA
+AGTCCACGCTGATTGGGCGGCTACTCTACGACTCCAAGGCTGTGATGGAAGACCAGTGGGCGTCGGTGGA
+GCAAACGTCCAAGGACCGGGGCCACGACTACACCGACCTGGCTCTGGTCACCGACGGCCTGCGGGCCGAG
+CGGGAACAGGGCATCACCATCGACGTTGCCTACCGCTACTTCGCCACTCCCAAGCGGAAATTCATCATTG
+CCGACACCCCGGGACACATCCAATACACCCGCAACATGGTGACCGGTGCGTCCACCGCCCAACTGGTGAT
+CGTACTGGTGGATGCCCGGCACGGCTTGCTGGAGCAATCCCGCCGGCACGCCTTCCTGGCGTCGCTGCTG
+GGCATCCGCCACCTGGTGCTCGCGGTCAACAAGATGGACTTGCTTGGCTGGGACCAAGAGAAATTCGACG
+CGATTCGAGACGAATTCCACGCCTTCGCGGCCCGCCTCGACGTGCAGGACGTCACCTCCATCCCAATCTC
+CGCGCTGCACGGCGACAACGTGGTGACCAAATCCGACCAGACGCCCTGGTACGAGGGACCGTCGCTGCTG
+TCGCATCTCGAAGACGTCTACATCGCCGGTGACCGCAACATGGTCGACGTGCGATTCCCGGTCCAGTACG
+TCATCCGGCCGCACACCCTCGAGCATCAAGACCACCGCAGCTACGCGGGCACCTTGGCCAGTGGGGTAAT
+GCGTTCAGGCGACGAAGTTGTCGTGCTGCCGATCGGTAAGACCACCCGGATCACCGCGATCGACGGCCCG
+AACGGCCCGGTGGCAGAAGCGTTTCCGCCGATGGCGGTTTCGGTGCGGCTCGCCGACGACATCGATATCT
+CGCGTGGTGACATGATCGCTCGCACCCACAACCAGCCCAGGATCACACAAGAATTCGACGCGACCGTGTG
+CTGGATGGCCGACAACGCGGTGCTAGAGCCCGGCCGCGACTACGTTGTCAAGCACACCACCCGAACCGTC
+CGTGCGAGGATAGCCGGGCTGGATTACCGGCTCGATGTCAACACCCTGCATCGCGACAAGACCGCAACGG
+CGTTGAAACTCAACGAACTGGGCCGTGTTTCGCTGCGCACCCAGGTGCCGTTGCTGCTTGACGAGTACAC
+CCGCAACGCTAGCACCGGCTCGTTCATCCTCATTGACCCCGACACCAACGGAACGGTGGCGGCGGGCATG
+GTGTTACGCGACGTCTCGGCCCGCACGCCTAGCCCGAACACGGTGCGGCACAGATCGCTCGTCACTGCGC
+AAGATCGGCCGCCCAGGGGCAAGACGGTGTGGTTTACCGGACTGTCCGGCTCCGGCAAGTCGTCGGTGGC
+CATGCTGGTTGAGCGGAAGCTACTCGAAAAGGGCATCTCCGCTTACGTTCTGGACGGCGACAACCTACGG
+CATGGCCTCAACGCCGACCTGGGCTTTTCCATGGCCGACCGCGCGGAGAACCTGCGCCGGCTGTCGCATG
+TGGCCACACTGCTCGCCGATTGTGGCCACCTGGTGCTGGTGCCGGCGATCAGCCCCCTTGCTGAGCACCG
+TGCCCTGGCTCGTAAAGTGCACGCTGATGCGGGAATCGACTTTTTCGAGGTGTTCTGTGACACCCCGCTG
+CAGGACTGTGAGAGGCGTGATCCCAAAGGGTTGTACGCCAAAGCGCGTGCGGGTGAGATCACGCACTTCA
+CCGGGATCGACAGCCCATATCAGCGGCCCAAGAACCCAGACCTACGGCTTACGCCGGATCGCAGCATAGA
+CGAGCAGGCGCAGGAGGTTATCGACCTGTTGGAGTCATCGTCTTAGGCCGGCCTGGTTGCTCTGCTGTCC
+CTGGCAAGCGGGTGGCACAATCCTGAAGCATGCGGATGTCAGCTAAGGCGGAGTACGCGGTGCGGGCGAT
+GGTCCAGCTCGCCACGGCCGCCAGTGGCACCGTGGTCAAGACCGACGATCTGGCTGCGGCCCAAGGCATA
+CCACCGCAGTTTCTCGTCGATATCCTGACCAACCTGCGCACCGACCGCCTGGTGCGAAGCCACCGCGGTC
+GCGAGGGTGGTTATGAATTGGCGCGTCCGGGCACCGAGATCAGCATCGCCGACGTATTGCGCTGCATCGA
+CGGACCGCTGGCTAGTGTCCGCGATATCGGACTTGGCGACCTGCCCTACTCGGGCCCCACTACCGCGCTG
+ACCGACGTTTGGCGCGCGCTGCGCGCCAGTATGCGGTCGGTGCTGGAGGAGACCACGCTGGCTGACGTTG
+CCGGTGGCGCGCTGCCCGAGCACGTCGCCCAGCTCGCCGACGACTATCGCGCGCAGGAGAGCACGCGGCA
+CGGCGCCTCGCGCCATGGTGACTAGCCGCCAGAGCCATCGGCAGGGCCTGCCTGAGCCAGGTGCAACCGA
+AGGAGTCAACGAATGGTCAGCACACATGCGGTTGTCGCGGGGGAGACGCTGTCGGCGTTGGCGTTGCGCT
+TCTATGGCGACGCGGAACTGTATCGGCTGATCGCCGCCGCCAGCGGGATCGCCGATCCCGACGTCGTCAA
+TGTGGGGCAGCGGCTGATTATGCCTGACTTCACGCGATACACCGTTGTTGCCGGGGACACGCTGTCGGCA
+TTGGCTGCGCGCTTCTATGGCGACGCCTCCCTATATCCGCTTATCGCCGCCGTCAATGGCATCGCCGATC
+CTGGCGTCATCGACGTCGGGCAGGTACTGGTCATATTCATCGGGCGTAGCGACGGGTTCGGCCTAAGGAT
+CGTGGACCGCAACGAGAACGATCCCCGCCTGTGGTACTACCGGTTCCAGACCTCCGCGATCGGCTGGAAC
+CCCGGAGTCAACGTCCTGCTTCCCGATGACTACCGCACCAGCGGACGCACCTATCCCGTCCTCTACCTGT
+TCCACGGCGGCGGCACCGACCAGGATTTCCGCACGTTCGACTTTCTGGGCATCCGCGACCTGACCGCCGG
+AAAGCCGATCATCATCGTGATGCCCGACGGCGGGCACGCGGGCTGGTATTCCAACCCGGTCAGCTCGTTC
+GTCGGCCCACGGAACTGGGAGACATTCCACATCGCCCAGCTGCTCCCCTGGATCGAGGCGAACTTCCGAA
+CCTACGCCGAATACGACGGCCGCGCGGTCGCCGGGTTTTCGATGGGTGGCTTCGGCGCGCTGAAGTACGC
+AGCAAAGTACTACGGCCACTTCGCGTCGGCGAGCAGCCACTCCGGACCGGCAAGTCTGCGCCGCGACTTC
+GGCCTGGTAGTGCATTGGGCAAACCTGTCCTCGGCGGTGCTGGATCTAGGCGGCGGCACGGTTTACGGCG
+CGCCGCTCTGGGACCAAGCTAGGGTCAGCGCCGACAACCCGGTCGAGCGTATCGACAGCTACCGCAACAA
+GCGGATCTTCCTGGTCGCCGGCACCAGTCCGGACCCGGCCAACTGGTTCGACAGCGTGAACGAGACCCAG
+GTGCTAGCCGGGCAGAGGGAGTTCCGCGAACGCCTCAGCAACGCCGGCATCCCGCATGAATCGCACGAGG
+TGCCTGGCGGTCACGTCTTCCGGCCCGACATGTTCCGTCTCGACCTCGACGGCATCGTCGCCCGGCTGCG
+CCCCGCGAGCATCGGGGCGGCCGCAGAACGCGCCGATTAGCCGCACCACGTATACGCCGCGGGCAGGTGG
+CCGCTGGCCGATAGCCTCATGTGTGTGAGCGTGGGCGAGTCAGTTGCGCAGTCGCTGCAACAGTGGGATC
+GCAAGCTGTGGGACGTGGCGATGCTCCACGCGTGCAACGCCGTCGACGAGACCGGCAGGAAGCGCTATCC
+CACGCTGGGCGTCGGCACTCGATTCCGGACGGCGCTACGGGATTCACTCGACATTTACGGAGTGATGGCC
+ACGCCTGGCGTCGACCTGGAAAAGACTCGCTTCCCTGTCGGGGTGAGATCGGACTTGCTGCCGGATAAGC
+GCCCCGACATCGCCGACGTCCTGTATGGAATTCACCGGTGGTTGCACGGTCATGCTGACGAATCCTCGGT
+TGAATTCGAAGTAAGCCCGTACGTGAACGCCAGTGCCGCACTCCGCATTGCCAATGACGGCAAAATTCAG
+CTGCCAAAGTCCGCAATACTGGGTTTGCTGGCCGTTGCCGTGTTTGCGCCGGAGAACAAGGGCGAGGTCA
+TTCCCCCGGACTATCAGCTCAGCTGGTATGACCACGTGTTCTTCATCAGTGTTTGGTGGGGGTGGCAAGA
+CCATTTCCGCGAAATCGTCAACGTCGACCGGGCATCGCTGGTCGCCCTCGACTTCGGCGACCTGTGGAAT
+GGCTGGACGCCAGTTGGGTAATCCTGGTCGCTTGTCGCCCCGCCGGGCTGGGTTAGATTGCCCGGCTCCT
+CAACCCGCCGTTTCGGCGTGCATCGTCGCCGGGCTAGGTTAGATTGCCCGGCTCCTCAACCCGCCGTTTC
+GGCGTGCATCGTCGCCGGGCTAGCCGTCTCGGTCAGCGGACCGGATCGTCGACGCCGCCGCCTGCGCGGC
+GGCTACCTGGCCGAACGTGGACGGCGGCGGCGCTAGAGTCCCGGGGCGCTCGACGACCTCGGTCGCCCGC
+GCCGCGGCACCGAGAACCATGGCCCGGTCGGATTCGTCCGCGAACTCGCGCTGTGCTGCCCGCACGACCA
+GGGCAATTTGGGTTTGCACCGCTACACGGCGCGACGGGTCGACGCAGTTCTGGGCGACCGCGCTGAGCAG
+CTGCAGCAGCGCAGTGAGCACCAGCGGCTCACGCGAGCCGTAGCGGCGGATCTGGGCACATCCGACGTGC
+AGGTAGGTGGCGAAGCTGGGGTACGGCAGCCAGAAGAGGAGCTCCCCGGCGCGGTCGCGGCGCACGTCGT
+CCGGCAGCGCCCGCGATGCCAGCACCGACTCCACGGCCGAAAGATGGTGCACGACTTGGATCGCCGTGTA
+CGGGTCGTTGAGTGCGGGCGATAGTGCCCGCAGCGCGATATCCACCATCTGCCGCAATCCGAAGCGGATG
+TCCTGCTGCAGGGTGCGCTCGAATCCGATGTGCACATGACGTAAGCAGCGTTGCGGGAAGTCAGACCCTG
+GCGCGCCCGGCGCGGTGCCCCTGCGCCAGCACCAGCCGAGCAGGCCCCCGGCGGTGACGTAATCGCCGAC
+GAAGGTAACCAGCAGCGCCGTATACCGGCTGGCTGCCGCCAATTCGGCGATGTCGTCGACGTCGACGGTT
+TGTAGGTAACCCGAGTGCGGGGCCAACAGCGGCACCGCATCAGCCGGGGGGCTGGGCGGTGTCTCTACTT
+GTCGATCCGCCGTATCCGATTCCGGATACAACTGGTCAACCAGCCCCAGCGTGCGCAGCCGCACCTTGTC
+CATGATCGTGTCTATCTGGATCGAGTGCATGAGGTGGTGCAGGAAGTAGATCAGCGCGGCGATGCTGACG
+AATGCCAGCGCGAGTGACCCGGTGACCGCGACTTTGGGAATGAACGCCCCGCCGTCGCGGTGCTCCCCGA
+CGGTGTGTAGCCCACCGGTGCTGTAGGCGAAGGTGCAGGCAAAGATCGCCAGCACCACCTGGTTGGGCAC
+ATCGCGCAGGAAGGTTCGTAGCAACCGCACCGAGAACTGGCTGGAGGCGATCTGTAGGGACAGCACCGTC
+AGCGAGAAGACGATGCCGATGGTGGTGATCATCGTGGCCGACACCACGATCAGCACGCCTCGGGCGTCGC
+CTGGGGTGCCCTGAAACATCAGCTTGTCGATCAGCGTGCCGGATTTCACGGGAATCATCGACAGGACCGC
+TCCCGACCCCAGACCGATCGCAACGCCGAATGTCGGCAGCACCCAGACTGCGCCCTGTAAGTAATCCAGT
+ATGGCTTTGCGACGGTTGAGCATGCTGGTTGCGGTCACCGAATAAGCATGCACCCATCCGCGAGCACTAG
+GCGGAACTACGTAACACTTCGATGCGGCAGTAGAAGCATTTTTCCGCTCTCGCTTCGCCGAGCGTGCACT
+CATGGCGAGTTTCCGGCCGTTAACCCCAAGTGATCGCTGCAACACTTGGCCAGAGGTGTTGGCGCTGCAT
+GGGTTATCAGAAGGGGTTTCGGGGTCGGGGGGATCGGGTGGCCGATGGGGTGCAGGGGAAGTTCTGGAAG
+GCGCTCGAATCGGGGTTATCGCCGACGGTGTGTCCTGCTTTCCTACCAAGGCCGACTGCAGGCGGATCCG
+TGGCGTGCCGGTGTTCGACGGCTATACGCGGATGGTCGCCCGGCTGATGGGATCGCTCGCCGTGTTGCGG
+TCGGTGAGCATTCCAAAGGGCTACCGGGACTTCGGCTTTGGCAGTCTACGTGCGGTGGCGCCGAAAAACT
+GCCCGGACGTGAGTGGCTGAGGCGGCCCAATTTCGGACTAGGATTTCTGGCCGCTGGAAGTCACTGATGA
+CACCGTACGTCACCCTTGATCGACAAGTGCGGATGTGGGGACCCGTCCGGGGTCCCCACATCGTGGTGGT
+CGCTGTTTAGCTCGAGGTCACGTACTGCGGGCAGTAGGCCGACGCGGCGTCAACGGCGAACGTCTTGGCG
+CCCTTGGCGCTCAGACCGGTCGCCTTGGCCACCGCCTTGATGACCGCTTTGGCCGAGTGACCCTCGTCGA
+GGGCGTCGCAGACGGCGTGCGCGTCCTTGATGGCGCGCGCTGCGCTCGGCGGAGTGATCCCGTCCGCCTG
+CAGCTGCGCGAGGAACGCTTCGTCGGTCGAGCTTGCGCTGGCGGTCCCGGCGAAGCCGAGTGCGGCCAGG
+CCCAAAGTGGCGGCAGTCAAGGTGGTGCCAACCATGGAGGCGGCGAAACGGCGAGTGAACATTGATGATC
+TCCTTGTGCTGATGTCATCGGAGGTTGCGCTGGTTTGCGTGCCCTCAGAATCAGCACCGGGCCTTGACAG
+ATTCTCAATAAATCCTTGGCAATATCGATACCGGTTCGACGGTGTCCCGACAGTGCAAGGAGAACGGTCC
+GCCATGGCTGTGCCGGAGCGCGTCAGGCGAATGAGACAACACGGAACGTGCACTCGGCGCACCGGGTCGC
+CAGCAACGCGGCACGCGGGGCGCCCTGGTTCTTACCCCGACGAATTTGAGAGCGAGACCACGAAGCCAAC
+TATGCGGCCGCCCTCGCGGGTGGCGCCGATCACATTGTTGTAGCCATGCGTGAGGCTAGATCAACCCTTG
+TGCCCCCGGCAGGATTCGAACCTGCGGCCTTCTGCTCCGGAGGCAGACGCTCTATCCCCTGAGCTACGGG
+GGCGCACGACGACACGTTGCGCCATGGGGCCCCGCCAGAGTAGCGCATCGCGGCTACCCACTGACCACCG
+CAACGGATTCGAAGCCCAACCACCTCAGCCCATAGGATGGACGTTCGTGACCCCCGCTGACCTGGCTGAG
+CTGCTCAAAGCGACCGCGGCCGCGGTGCTGGCCGAGCGCGGCCTCGATGCCTCCGCGTTGCCGCAGATGG
+TCACGGTGGAACGCCCGCGCATTCCCGAGCACGGCGACTATGCCAGTAACCTGGCGATGCAGCTCGCCAA
+GAAAGTCGGCACCAACCCGCGTGAGCTGGCCGGATGGCTTGCCGAGGCACTGACAAAGGTCGACGGTATC
+GCCTCGGCGGAGGTGGCCGGGCCGGGCTTTATCAACATGCGGCTGGAAACCGCCGCCCAGGCTAAAGTCG
+TTACCAGCGTTATCGACGCCGGCCACAGCTACGGTCACTCGCTGCTGCTGGCCGGGCGCAAGGTCAACCT
+GGAATTCGTCTCCGCCAACCCCACCGGACCGATCCACATCGGCGGTACCCGTTGGGCCGCGGTCGGTGAC
+GCGCTGGGCCGTTTGCTCACCACCCAGGGCGCCGACGTGGTCCGCGAATACTATTTCAACGACCACGGCG
+CCCAGATCGACCGATTCGCCAACTCCCTGATCGCCGCGGCCAAGGGCGAACCCACGCCCCAAGACGGCTA
+CGCGGGCAGCTACATCACCAACATCGCCGAGCAGGTGCTGCAGAAGGCGCCTGACGCGCTGAGTCTGCCA
+GACGCAGAGTTGCGCGAGACCTTCCGCGCAATCGGCGTCGACTTGATGTTCGACCACATCAAACAGTCTC
+TGCACGAGTTCGGTACCGACTTCGACGTCTACACCCACGAAGACTCGATGCACACCGGCGGCCGGGTCGA
+GAACGCCATCGCCCGACTCCGCGAAACCGGCAACATCTACGAGAAGGACGGCGCAACCTGGTTGCGCACC
+AGCGCATTTGGTGACGACAAGGACCGCGTCGTGATCAAGAGCGACGGCAAACCGGCATATATCGCCGGTG
+ATCTCGCCTACTACTTGGACAAACGCCAACGCGGTTTTGACTTGTGCATCTACATGCTCGGCGCCGACCA
+TCACGGCTACATCGCCCGGCTAAAGGCCGCGGCCGCCGCCTTCGGTGACGACCCGGCCACCGTCGAGGTG
+CTCATTGGGCAGATGGTGAACCTGGTCCGCGACGGCCAACCGGTCCGGATGAGCAAACGTGCAGGCACCG
+TGCTCACCCTCGACGACCTGGTCGAGGCGATCGGCGTGGACGCCGCACGTTACAGCCTGATCCGCTCCTC
+GGTGGACACCGCGATCGACATCGACCTGGCGCTATGGTCCTCGGCGTCGAACGAAAACCCGGTCTATTAC
+GTGCAATACGCGCATGCCCGGCTCTCAGCGCTGGCTCGCAACGCCGCCGAACTCGCCCTGATCCCGGATA
+CAAACCACCTCGAACTGCTTAACCACGACAAGGAGGGCACGCTGCTGCGCACCCTCGGCGAATTCCCGAG
+GGTGCTCGAGACCGCGGCCTCCCTGCGGGAACCGCACCGGGTCTGCCGCTACCTGGAAGACCTGGCCGGC
+GACTATCACCGGTTCTACGACTCGTGCCGAGTGTTGCCGCAAGGCGACGAGCAGCCCACCGACCTGCACA
+CCGCGCGCCTAGCGTTGTGCCAGGCCACCCGTCAGGTCATCGCCAACGGGCTGGCGATCATCGGCGTCAC
+CGCACCGGAGCGAATGTGAACGAGCTGCTGCACTTAGCGCCGAATGTGTGGCCGCGCAATACTACTCGCG
+ATGAAGTCGGTGTGGTCTGCATCGCAGGAATTCCACTGACGCAGCTCGCCCAGGAGTACGGGACCCCGCT
+GTTCGTCATCGACGAGGACGACTTTCGCTCGCGCTGCCGAGAAACCGCCGCGGCCTTTGGAAGTGGGGCG
+AACGTGCACTATGCCGCCAAGGCGTTCCTGTGCAGCGAAGTAGCCCGGTGGATCAGCGAAGAAGGGCTCT
+GTCTGGACGTTTGCACCGGTGGGGAGTTGGCGGTCGCGCTGCACGCTAGCTTTCCGCCCGAGCGAATTAC
+CTTGCACGGCAACAACAAATCGGTCTCAGAGTTGACCGCTGCGGTCAAAGCCGGAGTCGGCCATATTGTC
+GTCGATTCGATGACCGAGATCGAGCGCCTCGACGCCATCGCGGGCGAGGCCGGAATCGTCCAGGATGTCC
+TGGTGCGTCTCACCGTCGGTGTCGAGGCGCACACCCACGAGTTCATCTCCACCGCGCACGAGGACCAGAA
+ATTCGGGTTATCGGTGGCCAGCGGCGCGGCCATGGCAGCGGTGCGGCGCGTTTTCGCCACTGATCACCTG
+CGCCTGGTTGGGCTACACAGCCACATCGGTTCGCAGATCTTCGACGTGGACGGCTTCGAACTCGCCGCGC
+ACCGTGTCATCGGCCTGCTACGCGACGTCGTCGGCGAGTTCGGTCCCGAAAAGACGGCACAGATCGCGAC
+CGTCGATCTCGGTGGCGGCTTGGGCATCTCGTATTTGCCGTCCGACGACCCACCGCCGATAGCCGAGCTC
+GCGGCCAAGCTGGGTACCATCGTGAGCGACGAGTCAACGGCCGTGGGGCTGCCGACGCCCAAGCTCGTTG
+TGGAGCCCGGACGCGCCATCGCCGGACCGGGCACCATCACGTTGTATGAGGTCGGCACCGTTAAGGACGT
+CGATGTCAGCGCCACAGCGCATCGACGTTACGTCAGTGTCGACGGCGGCATGAGCGACAACATCCGCACC
+GCGCTCTACGGCGCGCAGTATGACGTCCGGCTGGTGTCTCGAGTCAGCGACGCCCCGCCGGTACCGGCCC
+GTCTGGTCGGAAAGCACTGCGAAAGTGGCGATATCATCGTGCGGGACACCTGGGTGCCCGACGATATTCG
+GCCCGGCGATCTGGTTGCGGTTGCCGCCACCGGCGCTTACTGCTATTCGCTGTCGAGTCGTTACAACATG
+GTCGGCCGTCCCGCTGTGGTAGCGGTGCACGCGGGCAACGCTCGCCTGGTCCTGCGTCGGGAGACGGTCG
+ACGATTTGCTGAGTTTGGAAGTGAGGTGACCCGTGCCCGGTGACGAAAAGCCGGTCGGCGTAGCGGTACT
+CGGTTTGGGCAACGTCGGCAGCGAGGTTGTCCGCATCATCGAGAACAGCGCCGAGGATCTCGCGGCTCGT
+GTCGGTGCCCCATTGGTCCTGCGGGGCATCGGCGTGCGCCGCGTGACGACCGATCGCGGCGTGCCGATCG
+AATTGTTGACCGACGACATTGAAGAGCTCGTGGCCCGCGAGGATGTCGATATCGTGGTGGAAGTGATGGG
+GCCGGTGGAACCGTCGCGCAAGGCGATCCTGGGCGCCCTTGAGCGCGGCAAGTCCGTCGTTACGGCGAAC
+AAGGCTTTACTCGCCACCTCCACCGGCGAATTGGCACAGGCCGCCGAAAGCGCCCATGTTGATCTGTATT
+TCGAGGCGGCCGTGGCGGGCGCCATTCCGGTCATCCGTCCGCTCACCCAGTCGCTGGCCGGCGACACGGT
+GCTGCGAGTGGCCGGGATCGTCAACGGCACCACCAACTACATCCTCTCGGCGATGGACAGCACCGGCGCT
+GACTATGCCAGCGCCCTGGCCGACGCAAGTGCGCTGGGCTATGCGGAGGCTGATCCCACCGCAGACGTCG
+AAGGCTACGACGCCGCGGCCAAGGCAGCGATCCTGGCATCCATTGCCTTCCACACCCGGGTGACCGCAGA
+CGACGTGTATCGCGAAGGCATCACCAAGGTCACTCCGGCCGACTTCGGATCCGCGCACGCGCTGGGTTGC
+ACCATCAAACTGCTGTCGATCTGTGAGCGCATAACCACCGACGAAGGTTCGCAGCGGGTATCGGCCCGCG
+TCTATCCGGCCCTGGTACCTCTGTCGCATCCGCTTGCCGCGGTCAACGGCGCGTTCAATGCCGTGGTGGT
+CGAGGCCGAGGCCGCGGGCCGGCTGATGTTCTACGGCCAGGGCGCGGGCGGCGCGCCGACCGCCTCTGCG
+GTGACCGGTGACCTAGTGATGGCCGCCCGCAACCGGGTACTCGGCAGCCGCGGCCCCCGTGAGTCTAAAT
+ACGCTCAACTTCCGGTGGCACCAATGGGTTTCATTGAAACGCGCTATTACGTCAGCATGAACGTCGCCGA
+CAAGCCGGGCGTCTTGTCCGCGGTGGCGGCGGAATTCGCCAAACGCGAGGTGAGCATCGCCGAGGTGCGC
+CAGGAGGGCGTTGTGGACGAAGGTGGTCGACGGGTGGGAGCCCGAATCGTGGTGGTCACGCACCTCGCCA
+CTGACGCCGCACTCTCGGAAACCGTTGATGCACTGGACGACTTGGATGTCGTGCAGGGTGTGTCCAGCGT
+GATACGACTGGAAGGAACCGGCTTATGACCGTCCCGCCGACGGCCACTCACCAGCCGTGGCCGGGAGTGA
+TTGCCGCGTACCGTGACCGGCTGCCGGTGGGTGACGACTGGACTCCGGTGACCCTGCTCGAGGGTGGTAC
+TCCCCTCATCGCGGCAACTAATCTCTCCAAGCAGACGGGCTGCACGATCCACCTCAAAGTGGAGGGCCTC
+AACCCCACCGGCTCCTTCAAGGATCGTGGCATGACGATGGCGGTCACCGATGCCCTTGCCCATGGTCAGC
+GGGCGGTCTTGTGCGCATCGACCGGAAATACCTCGGCGTCGGCGGCGGCCTATGCCGCCCGGGCCGGCAT
+CACCTGCGCGGTGCTGATACCGCAGGGCAAGATCGCGATGGGCAAGCTCGCACAGGCGGTCATGCACGGC
+GCCAAGATCATCCAGATCGACGGTAACTTCGACGACTGCCTGGAACTGGCGCGCAAGATGGCCGCGGACT
+TCCCGACGATTTCGTTGGTCAACTCGGTAAACCCGGTGCGCATCGAGGGCCAGAAAACGGCAGCGTTCGA
+GATCGTCGACGTGCTAGGTACCGCGCCGGACGTGCATGCTCTGCCGGTTGGCAACGCCGGCAACATCACC
+GCGTACTGGAAGGGCTACACCGAGTATCACCAGCTGGGCCTGATCGACAAGTTGCCCCGCATGCTGGGCA
+CTCAGGCCGCGGGCGCGGCGCCCCTGGTGCTCGGCGAACCGGTGAGCCACCCGGAGACCATCGCAACCGC
+GATCCGCATCGGCTCGCCGGCGTCGTGGACTTCGGCCGTCGAGGCACAGCAGCAGTCCAAGGGCCGCTTC
+TTGGCCGCCTCCGACGAGGAGATACTGGCCGCATATCACCTGGTGGCTCGTGTCGAAGGCGTATTCGTGG
+AGCCCGCGTCCGCAGCCAGCATTGCGGGTCTCCTCAAAGCGATCGACGACGGCTGGGTGGCGCGTGGTTC
+GACGGTGGTGTGCACGGTAACCGGCAACGGTCTTAAGGATCCCGACACCGCGCTCAAAGACATGCCGAGC
+GTGTCTCCGGTTCCCGTGGACCCGGTAGCCGTCGTCGAGAAGCTAGGGCTGGCCTAGTGGCGATCGCAAG
+CGCGGCGGAGCCGGGTGCGGCGGGTCGGCACGGTTTGGATTGGGTGGCGATCGCAAGCGCGGCGGAGCCG
+GGTGCGGCGGGTCGGCACGGTTTGGATTGGGTGGCGATCGCAAGCGCGGCGGAGCCGGGTGCGGCGGGTC
+GGCACGGTTTGGATTGGGTGGCGATCGCAAGCGCGGCGGAGCCGGGTGCGGCGGGTCGGCACGCATGGTG
+ACTCAAGCATTGTTGCCTTCTGGGCTGGTGGCCAGTGCGGTGGTGGCGGCGTCCAGTGCAAACCTGGGCC
+CGGGCTTCGACAGTGTCGGTTTGGCGCTGAGTCTCTACGACGAGATCATCGTCGAGACAACAGATTCCGG
+CTTGACGGTGACTGTAGACGGCGAGGGCGGCGACCAGGTGCCGCTGGGCCCCGAGCACCTCGTGGTCCGC
+GCCGTGCAGCACGGGTTACAGGCAGCGGGGGTCAGCGCCGCCGGCCTGGCGGTGCGCTGCCGCAACGCCA
+TCCCGCACTCCCGCGGCCTCGGCTCCTCCGCGGCAGCAGTTGTGGGCGGTCTTGCGGCCGTTAACGGTCT
+TGTCGTACAAACGGATTCGTCACCATCGAGCGATGCTGAGCTGATTCAGTTGGCTTCGGAGTTCGAGGGT
+CATCCCGACAACGCGGCGGCCGCGGTTTTGGGTGGTGCCGTGGTTTCGTGGACTGACCACAGTGGTGACC
+GGCCCAACTATTCGGCCGTATCACTGCGGCTTCATCCCGATATCCGCCTGTTCACTGCGATTCCCGAGCA
+GCGTTCGTCGACCGCGGAAACGCGGGTGCTATTGCCCGCGCAGGTTAGTCACGACGACGCACGGTTCAAT
+GTCAGTCGCGCGGCGCTGCTGGTGGTTGCGCTCACCGAACGGCCCGATCTGCTGATGGCGGCCACCGAAG
+ATCTGCTTCATCAGCCGCAACGTGCCGCGGCAATGACAGCCTCCGCGGAATATCTTCGGCTGTTGCGGCG
+TCATAACGTGGCAGCAGCACTGTCCGGGGCAGGTCCTTCGTTGATCGCCCTGAGTACAGATTCAGAGTTG
+CCGACCGACGCCGTGGAGTTCGGAGCCGCAAAGGGATTTGCCGTTACCGAGCTGACTGTTGGCGAGGCGG
+TTCGCTGGAGCCCGACAGTAAGAGTTCCCGGTTAATCCGCAAGGTTGCGGGGGTTTGCTTGCTTCCGGCC
+AGGAAGCGGGCTATCCTCGGAGCCGTCCAGCAATCGCAGCATCTGCATACGTACTGCCTTGCCGCTAGGA
+CAGCCACCAATTCTTCTTGTGGACGAGGTTCGCCGTATTCGCCGCTGATGGCGATCACCGTTGCAAAGTC
+GATGATTGGCGCACTCGGCGATTTGGCTGACTGCAACAAAACCCCGTATGACGTGATCAGCGGGGGAAGG
+AAAGGAAATCCGTGACCGATACGGACCTCATTACGGCTGGCGAAAGTACCGACGGCAAGCCGTCGGATGC
+CGCTGCCACAGATCCCCCAGACCTCAACGCCGACGAGCCGGCCGGCTCGCTGGCCACCATGGTGCTGCCC
+GAACTGCGTGCGCTGGCTAATCGAGCCGGCGTGAAGGGAACATCGGGTATGCGGAAGAACGAACTGATCG
+CTGCGATTGAGGAGATCAGGCGACAGGCCAACGGCGCCCCAGCCGTTGACCGGTCGGCTCAAGAGCACGA
+CAAGGGCGACCGGCCGCCCAGTTCCGAGGCACCGGCCACCCAGGGGGAACAGACCCCGACCGAACAGATC
+GATTCCCAAAGCCAACAGGTCCGCCCGGAGCGGCGCAGCGCCACCCGTGAAGCGGGACCCTCCGGCTCCG
+GTGAGCGTGCGGGCACAGCCGCAGACGACACCGACAACCGCCAAGGCGGTCAACAGGACGCCAAGACCGA
+GGAGCGTGGCACCGACGCGGGTGGCGACCAAGGGGGTGACCAGCAGGCTTCGGGCGGTCAGCAGGCGCGC
+GGCGACGAGGACGGAGAAGCGCGTCAGGGCCGGCGCGGACGCCGGTTCCGCGATCGGCGGCGCCGCGGTG
+AACGATCCGGCGACGGCGCCGAGGCTGAACTGCGTGAGGACGACGTCGTCCAGCCGGTAGCCGGCATACT
+CGACGTCCTGGACAACTACGCGTTTGTGCGCACCTCCGGCTACCTACCCGGTCCGCACGACGTGTATGTG
+TCGATGAACATGGTGCGCAAGAACGGCATGCGCCGTGGTGATGCGGTGACCGGTGCGGTGCGGGTGCCCA
+AGGAAGGGGAGCAACCCAACCAGCGGCAGAAGTTCAACCCGCTGGTCCGCCTGGACAGCATCAACGGCGG
+ATCGGTCGAAGACGCCAAGAAGCGGCCCGAGTTCGGCAAACTGACGCCGTTGTACCCCAACCAGCGGCTT
+CGTCTGGAAACCAGTACCGAGCGGCTGACCACCCGGGTCATCGACCTCATCATGCCGATCGGCAAGGGTC
+AACGCGCGTTGATTGTGTCGCCGCCCAAAGCGGGCAAGACAACGATCCTGCAGGACATCGCCAACGCGAT
+CACCAGGAACAACCCGGAATGCCACCTCATGGTCGTGCTCGTCGACGAGCGGCCTGAGGAGGTCACCGAT
+ATGCAGCGCTCGGTCAAAGGCGAGGTCATCGCTTCAACTTTCGACCGGCCGCCGTCGGACCACACGTCGG
+TCGCCGAGCTGGCGATCGAACGCGCCAAGCGGCTGGTGGAGCAAGGCAAGGACGTCGTGGTGCTGCTCGA
+TTCAATCACCCGGCTAGGCCGCGCTTACAACAACGCGTCGCCGGCGTCGGGCCGGATCCTGTCCGGTGGT
+GTCGATTCCACGGCGTTGTACCCGCCCAAGCGCTTCCTGGGGGCCGCGCGCAACATCGAAGAGGGCGGGT
+CGCTGACCATCATCGCCACTGCGATGGTCGAGACCGGGTCCACTGGTGACACGGTCATTTTCGAGGAGTT
+CAAGGGCACCGGCAACGCCGAGCTCAAGCTGGACCGCAAGATCGCCGAGCGGCGGGTTTTCCCTGCGGTC
+GACGTGAATCCTTCTGGAACCCGCAAGGACGAGCTACTGCTGTCGCCCGACGAGTTCGCTATTGTGCACA
+AGCTGCGCCGCGTGCTATCGGGCCTGGATTCCCACCAGGCCATCGACCTGCTGATGTCGCAGCTGCGTAA
+GACGAAGAACAACTACGAATTCCTTGTTCAGGTGTCCAAGACCACGCCAGGGTCCATGGACAGCGACTGA
+TCCGGCGAGACGGCTCGCCGGGAATGTCCGCACGCATCTCGGTGTTTGGGGTGATAGCGGTTGACCTGGC
+ATAATCGATGCTCAACGAGTTGGAACCGGACCAGGTTCTCGGCACGCCACGACGGGCGGCCACCGATCAC
+AGAGGGCAGCATGAAATCTGACATTCATCCGGCATATGAGGAGACCACCGTGGTCTGCGGATGCGGCAAT
+ACCTTCCAGACGCGTAGCACCAAGCCGGGAGGTCGTATTGTGGTTGAGGTTTGTTCGCAGTGTCATCCGT
+TCTACACCGGCAAGCAGAAGATCCTCGACAGCGGCGGCCGGGTGGCTCGCTTCGAGAAGCGGTACGGCAA
+GCGCAAGGTCGGAGCTGACAAGGCGGTTTCAACCGGCAAATAGCTGGCTTACCGACGCCCGAACTGTGCA
+CCAGCGGTACAGGACGGGCGTCGGTTCGCGTTAGGGTCCGCGCTCGCGGGAAGAAGGTTGACATGACGCA
+GCCAGTGCAGACGATTGACGTGTTGCTCGCCGAACACGCCGAGCTCGAGCTTGCGCTGGCAGATCCCGCG
+CTGCACAGCAATCCGGCCGAGGCGCGCAGAGTCGGGCGCCGGTTTGCCCGATTGGCCCCGATCGTCGCAA
+CCCACCGCAAGCTGACGTCCGCGCGCGACGACCTCGAGACCGCGCGCGAGCTGGTGGCTTCCGACGAGTC
+GTTCGCCGCCGAGGTTGCCGCATTGGAGGCTCGGGTGGGCGAACTGGATGCCCAACTCACTGACATGTTG
+GCACCGCGTGACCCGCACGATGCCGATGACATTGTGCTGGAAGTCAAATCCGGCGAGGGGGGCGAAGAAT
+CCGCGTTGTTCGCCGCCGATTTGGCCAGGATGTATATCCGCTACGCCGAGCGGCACGGCTGGGCGGTGAC
+GGTGTTGGACGAGACCACCTCGGATCTGGGTGGGTACAAGGACGCGACGTTGGCGATTGCCAGCAAAGCC
+GACACCCCCGACGGGGTGTGGTCGCGCATGAAGTTCGAGGGCGGGGTGCACCGCGTACAACGGGTCCCAG
+TGACGGAATCCCAAGGCCGCGTGCATACTTCGGCGGCGGGTGTGCTGGTCTATCCGGAGCCCGAGGAAGT
+CGGCCAAGTGCAGATCGACGAGTCGGATCTGCGTATCGACGTTTTCCGGTCGTCCGGCAAGGGCGGGCAG
+GGAGTGAATACCACCGACTCCGCGGTGCGTATCACCCATCTGCCCACTGGAATCGTCGTCACCTGTCAGA
+ACGAACGGTCGCAGCTGCAGAACAAGACGCGTGCGTTGCAGGTGCTGGCCGCTCGGTTGCAGGCAATGGC
+CGAGGAGCAGGCGCTGGCCGACGCGTCGGCCGACCGGGCTAGCCAAATCCGCACTGTGGACCGTAGTGAA
+CGCATTCGCACCTACAACTTCCCGGAGAACCGGATCACCGACCACCGGATCGGTTACAAGTCACACAATC
+TCGATCAGGTGCTGGATGGCGATCTTGACGCGTTGTTCGACGCTCTGTCCGCCGCGGACAAGCAATCCCG
+GTTGCGACAATCATGACCTCCGCGCCGGCGACGATGCGGTGGGGGAACCTCCCGCTTGCGGGGGAGAGCG
+GCACAATGACCCTGCGTCAGGCGATCGACTTGGCTGCTGCGCTATTGGCCGAAGCGGGGGTCGACTCGGC
+GCGTTGCGACGCTGAGCAGTTGGCCGCTCACCTAGCGGGCACAGACCGCGGTAGGCTACCCCTGTTCGAG
+CCGCCCGGCGACGAGTTCTTCGGGCGCTATCGCGACATCGTCACCGCTCGTGCGCGGCGGGTGCCGTTGC
+AGCATCTCATCGGGACTGTGTCGTTTGGGCCCGTGGTGCTGCATGTCGGCCCGGGTGTGTTTGTACCGCG
+TCCGGAGACCGAAGCCATTTTGGCCTGGGCCACCGCGCAGTCGCTGCCGGCGCGGCCGCTGATTGTCGAC
+GCATGCACGGGATCTGGCGCGTTGGCGGTCGCATTGGCCCAGCACCGGGCCAACCTTGGACTAAAGGCCC
+GCATCATCGGCATTGACGACTCCGACTGCGCCCTTGACTATGCCCGCCGCAATGCGGCGGGTACCCCGGT
+AGAGTTGGTGCGTGCCGACGTCACCACGCCCTGCCTGCTCCCCGAACTCGACGGACAAGTCGACCTGATG
+GTTTCCAACCCGCCCTACATCCCTGATGCTGCTGTTTTGGAACCTGAAGTAGCGCAACATGACCCGCATC
+ACGCGTTGTTCGGCGGTCCCGACGGGATGACGGTGATATCCGCGGTCGTCGGGCTTGCTGGGCGCTGGCT
+GCGTCCCGGTGGCCTGTTCGCCGTCGAACACGACGACACCACGTCGTCGTCAACTGTCGATTTGGTCAGC
+AGCACAAAACTTTTCGTGGACGTACAAGCCCGGAAAGATCTGGCCGGACGGCCGAGGTTTGTGACGGCGA
+TGAGGTGGGGGCACCTCCCGCTTGCAGGGGAGAACGGCGCCATTGACCCGCGCCAGCGACGATGCAGAGC
+GAAGCGATGAGGAGAAGCGGCGCCATTGACTGAGACGTTCGACTGCGCCGACCCCGAGCAGCGTTCGCGT
+GGAATCGTCTCTGCGGTAGGGGCAATCAAGGCGGGCCAACTGGTGGTGATGCCTACGGACACGGTGTATG
+GGATCGGCGCCGACGCCTTCGACAGCTCCGCGGTGGCCGCGTTGCTGTCGGCAAAGGGGCGGGGTCGCGA
+TATGCCGGTAGGTGTGCTGGTCGGCTCTTGGCACACGATCGAGGGGCTGGTCTACTCTATGCCCGACGGT
+GCCCGCGAACTGATTCGCGCATTCTGGCCCGGCGCGCTCAGCCTGGTGGTCGTGCAAGCGCCGTCGCTGC
+AATGGGATCTTGGCGATGCCCATGGCACCGTGATGCTGCGAATGCCGCTGCACCCGGTCGCCATCGAGTT
+GTTGCGTGAGGTGGGTCCGATGGCGGTATCCAGCGCCAACATCTCGGGCCACCCACCCCCGGTCGACGCC
+GAACAGGCACGCTCTCAACTCGGCGACCACGTCGCGGTCTATCTCGACGCGGGGCCATCCGAACAGCAGG
+CCGGCTCCACGATCGTCGATCTGACCGGAGCCACCCCACGCGTCCTGCGGCAGGGGCCGGTCAGCACCGA
+GCGGATCGCCGAGGTACTTGGTGTGGACGCGGCCAGCTTGTTCGGCTAGCCGCCGAACGTGCACGCACTG
+CGAAGATTCGGCCAATTGTTCGCAGCTGTTGCACGTTCGGCGAGTGTTCAGCTCTCAGGTTGGTGCAGTA
+CGGTCTCGAGGTGTCCAGCGATGTGGCCGGCGTTGCCGGTGGCTTGCTCGCCCTGTCCTATCGCGGCGCC
+GGTGTCCCGCTGCGTGAGCTTGCGCTGGTCGGGCTGACCGCGGCGATCATCACCTATTTTGCGACCGGTC
+CGGTGCGGATGCTGGCCAGTCGCCTGGGAGCCGTCGCCTACCCGCGGGAGCGAGATGTGCACGTCACGCC
+TACCCCTCGGATGGGTGGGTTGGCGATGTTCCTGGGCATTGTCGGCGCCGTCTTTCTTGCCTCCCAGCTT
+CCGGCACTCACCCGGGGGTTCGTCTATTCCACCGGCATGCCCGCGGTGCTGGTGGCCGGTGCGGTGATCA
+TGGGCATCGGCCTGATCGATGATCGTTGGGGTCTGGATGCACTGACGAAGTTCGCCGGCCAGATCACGGC
+GGCGAGCGTTCTGGTCACCATGGGTGTCGCCTGGAGTGTCCTGTACATCCCGGTGGGTGGTGTGGGCACC
+ATCGTCTTGGACCAGGCTTCCTCGATCCTGCTTACCCTGGCGCTGACCGTTTCGATCGTCAACGCGATGA
+ACTTTGTCGACGGTCTCGACGGGCTGGCCGCCGGCCTGGGCCTGATAACGGCGCTGGCAATCTGCATGTT
+CTCGGTGGGTTTGCTTCGTGACCACGGTGGTGACGTTTTGTACTACCCGCCGGCGGTGATTTCGGTGGTC
+CTGGCCGGGGCCTGCCTGGGCTTTCTGCCACACAACTTCCACCGGGCCAAGATCTTCATGGGCGATTCCG
+GGTCGATGCTGATCGGCCTGATGCTGGCCGCCGCTTCCACCACCGCGGCCGGGCCGATCTCGCAGAACGC
+CTACGGCGCTCGTGATGTATTTGCTTTGCTGTCGCCGTTCCTGCTGGTGGTGGCGGTCATGTTTGTGCCA
+ATGCTCGACCTGCTGCTAGCGATCGTCCGTCGCACCCGCGCCGGCCGCAGCGCGTTTAGCCCGGACAAAA
+TGCACCTGCATCACCGGCTGCTGCAGATCGGTCATTCCCATCGGCGCGTGGTCCTGATCATCTACCTGTG
+GGTGGGCATCGGTGCCTTCGGCGCCGCGAGCTCGATCTTCTTTAACCCGCGCGACACCGCGGCGGTGATG
+CTGGGCGCGATCGTGGTCGCCGGCGTCGCGACACTGATCCCCCTGTTGCGCCGCGGCGACGACTACTACG
+ACCCGGACCTGGACTAGCCCGGAGCCGAGAACTACGACAAGGAGTAGTAGTGGTGTCTACCTTGTGGTAC
+GGTGCGGCTAGAACCCCGAAGGAGACCTCGCGGGTTGCCGGCCCCCGGCCCATCGGATGCGTATCCGGTC
+GCGCCGATTCACGACCGACATAGGGAGCTACCCCTTGGGTGATTCCGGTGCGACGACTGCGATACGCTCG
+GCGGGCCACCGATCAGTCGATCGGGTGGTTTCCGCTCCATCAGCCCGGAATTGAGGTGCCGCAGTGACGA
+CACCAGCGCAGGACGCGCCGTTGGTGTTTCCCTCTGTTGCTTTCCGTCCGGTTCGCCTTTTTTTCATCAA
+CGTTGGACTGGCCGCAGTGGCGATGTTGGTCGCCGGCGTGTTCGGTCACCTGACGGTCGGGATGTTCTTG
+GGTCTCGGGTTGCTGCTGGGTTTGCTCAATGCCCTGCTGGTGCGGCGTTCGGCCGAGTCGATCACCGCCA
+AAGAGCACCCGTTAAAACGGTCGATGGCCCTCAACTCGGCATCGCGACTGGCGATTATCACCATCCTCGG
+GCTGATCATCGCCTACATTTTCCGGCCCGCTGGATTGGGCGTCGTGTTCGGGCTGGCATTCTTCCAGGTG
+CTGCTGGTGGCAACGACGGCCCTGCCGGTCCTGAAGAAGCTGCGCACTGCGACCGAGGAACCGGTCGCAA
+CTTATTCTTCCAATGGCCAGACCGGGGGATCGGAAGGAAGGAGCGCCAGCGATGACTGAGACCATCCTGG
+CCGCCCAAATCGAGGTCGGCGAGCACCACACGGCCACCTGGCTCGGTATGACGGTCAACACCGACACCGT
+GTTGTCGACGGCGATCGCCGGGTTGATCGTGATCGCGTTGGCCTTTTACCTGCGCGCCAAAGTGACTTCG
+ACGGATGTGCCAGGCGGGGTGCAGTTGTTTTTTGAGGCGATCACCATTCAGATGCGCAATCAGGTCGAAA
+GCGCCATCGGGATGCGGATCGCACCCTTCGTGCTGCCGCTGGCGGTGACCATCTTCGTGTTCATCCTGAT
+CTCCAACTGGCTGGCAGTCCTCCCGGTGCAGTACACCGATAAACACGGGCACACCACCGAGTTGCTCAAA
+TCGGCAGCAGCGGACATCAATTACGTGCTGGCGCTGGCGCTTTTCGTGTTCGTTTGCTACCACACGGCCG
+GTATTTGGCGGCGCGGTATTGTCGGACACCCGATCAAGTTGCTGAAAGGGCACGTGACGCTCCTCGCGCC
+GATCAACCTTGTCGAAGAAGTCGCCAAGCCAATCTCGTTGTCGCTCCGACTTTTCGGCAACATTTTCGCC
+GGCGGCATTCTGGTCGCACTGATCGCGCTCTTTCCCCCCTACATCATGTGGGCGCCCAATGCGATCTGGA
+AAGCATTTGACCTGTTCGTCGGCGCAATCCAGGCCTTCATTTTTGCGCTGCTGACAATTTTGTACTTCAG
+CCAAGCGATGGAGCTCGAAGAGGAACACCACTAGTACCGGATGCTGGTAACGGCTACCAGAGCCATCAAG
+GAGGATAAGGAAATGGACCCCACTATCGCTGCCGGCGCCCTCATCGGCGGTGGACTGATCATGGCCGGTG
+GCGCCATCGGCGCCGGTATCGGTGACGGTGTCGCCGGTAACGCGCTTATCTCCGGTGTCGCCCGGCAACC
+CGAGGCGCAAGGGCGGCTGTTCACACCGTTCTTCATCACCGTCGGTTTGGTTGAGGCGGCATACTTCATC
+AACCTGGCGTTTATGGCGCTGTTCGTCTTCGCTACACCCGTCAAGTAATTCGACGGCAAATGGTTGCAAT
+AGGTAGCAATGGGTGAAGTGAGCGCGATTGTCCTGGCCGCCAGTCAGGCGGCAGAGGAAGGCGGCGAGTC
+CAGCAACTTCCTCATTCCCAACGGCACGTTTTTCGTTGTGCTGGCCATCTTCCTGGTGGTGCTCGCTGTC
+ATTGGCACTTTCGTGGTGCCGCCGATCTTGAAGGTCTTGCGGGAACGTGACGCTATGGTCGCCAAAACGC
+TGGCCGACAACAAGAAGTCGGACGAGCAGTTCGCCGCCGCACAGGCCGATTACGACGAAGCCATGACGGA
+AGCCCGAGTCCAGGCGTCGTCCTTGCGCGACAATGCCCGGGCAGATGGCCGTAAAGTCATCGAGGACGCA
+CGCGTCCGGGCCGAACAACAGGTGGCATCGACGTTGCAGACCGCCCATGAGCAATTGAAGCGGGAGAGGG
+ACGCCGTGGAACTCGATCTGCGTGCCCACGTGGGCACCATGTCGGCGACTCTGGCCAGTCGAATTCTCGG
+TGTTGACCTCACCGCTTCAGCCGCGACGAGGTAACCACGAATGTCGACGTTTATCGGACAGCTGTTCGGG
+TTCGCGGTCATCGTTTATCTGGTGTGGCGATTTATCGTGCCGCTCGTAGGGCGTTTGATGTCCGCACGGC
+AGGACACGGTGCGCCAACAGCTGGCGGATGCGGCGGCGGCCGCCGACCGGCTGGCGGAGGCGAGTCAAGC
+TCACACGAAGGCGCTGGAAGACGCCAAGTCGGAAGCGCACCGTGTTGTGGAAGAGGCCAGGACAGATGCC
+GAACGCATCGCAGAACAACTAGAGGCCCAGGCCGACGTCGAGGCGGAGCGCATCAAAATGCAGGGTGCCC
+GTCAGGTCGACCTCATCCGGGCACAGCTGACCCGTCAGCTTCGCCTCGAGCTCGGTCACGAATCGGTCCG
+CCAGGCAAGGGAATTGGTACGCAATCACGTGGCCGATCAGGCACAACAATCGGCCACCGTCGACCGCTTC
+CTGGATCAGCTCGATGCGATGGCGCCGGCTACGGCCGATGTCGATTACCCACTGCTGGCCAAGATGCGCT
+CAGCCAGCCGGAGGGCATTAACCAGCCTGGTGGATTGGTTCGGCACCATGGCCCAGGACCTCGACCATCA
+AGGTCTGACCACCCTCGCCGGCGAGCTGGTGTCGGTAGCAAGACTGCTGGACCGCGAGGCCGTCGTCACC
+CGCTATCTCACCGTGCCAGCCGAAGATGCGACGCCCAGGATCCGGCTGATCGAACGGCTGGTGTCCGGCA
+AGGTCGGCGCGCCAACGCTCGAGGTGTTGCGCACAGCCGTATCGAAGCGCTGGTCGGCCAATTCCGATTT
+GATCGATGCGATCGAACACGTGTCGCGGCAGGCGCTGTTAGAACTCGCCGAACGTGCGGGTCAGGTCGAC
+GAGGTGGAAGACCAGTTATTCCGGTTTTCCCGCATTCTCGACGTGCAGCCCCGGCTTGCCATCCTGTTGG
+GTGACTGTGCCGTTCCGGCCGAAGGCCGAGTCCGGTTGCTGCGCAAGGTGCTTGAGCGTGCCGACAGTAC
+CGTCAACCCGGTCGTGGTCGCGCTGTTGTCTCACACCGTCGAGCTGCTGCGGGGTCAGGCAGTTGAGGAA
+GCGGTGCTGTTCCTGGCCGAAGTTGCGGTGGCTCGCCGCGGCGAAATCGTCGCGCAGGTCGGCGCGGCGG
+CCGAGCTCAGCGATGCTCAGCGCACTCGCCTCACCGAAGTGCTGAGCCGTATCTACGGTCACCCCGTGAC
+CGTGCAGCTGCATATCGACGCCGCGCTGCTGGGCGGATTGTCCATCGCGGTCGGTGACGAAGTGATCGAC
+GGTACGCTCTCGTCTCGTCTAGCTGCGGCCGAGGCACGACTGCCCGACTGAACCCGAACTAGTCAGCACA
+AACCGAAGTAGGAAGACGAAAAGCTATGGCTGAGTTGACAATCCCCGCTGATGACATCCAGAGCGCAATC
+GAAGAGTACGTAAGCTCTTTCACCGCCGACACCAGTAGAGAGGAAGTCGGTACCGTCGTCGATGCCGGGG
+ACGGCATCGCACACGTCGAGGGTTTGCCATCGGTGATGACCCAAGAGCTGCTCGAATTCCCGGGCGGAAT
+CCTCGGCGTCGCCCTCAACCTCGACGAGCACAGCGTCGGCGCGGTGATCCTCGGTGACTTCGAGAACATC
+GAAGAAGGTCAGCAGGTCAAGCGCACCGGCGAAGTCTTATCGGTTCCGGTTGGCGACGGGTTTTTGGGGC
+GGGTGGTTAACCCGCTCGGCCAGCCGATCGACGGGCGCGGAGACGTCGACTCCGATACTCGGCGCGCGCT
+GGAGCTCCAGGCGCCCTCGGTGGTGCACCGGCAAGGCGTGAAGGAGCCGTTGCAGACCGGGATCAAGGCG
+ATTGACGCGATGACCCCGATCGGCCGCGGCCAGCGCCAGCTGATCATCGGCGACCGCAAGACCGGCAAAA
+CCGCCGTCTGCGTCGACACCATCCTCAACCAGCGGCAGAACTGGGAGTCCGGTGATCCCAAGAAGCAGGT
+GCGCTGTGTATACGTGGCCATCGGGCAGAAGGGAACTACCATCGCCGCGGTACGCCGCACACTGGAAGAG
+GGCGGTGCGATGGACTACACCACCATCGTCGCGGCCGCGGCGTCGGAGTCCGCCGGTTTCAAATGGCTTG
+CGCCGTACACCGGTTCGGCGATCGCCCAGCACTGGATGTACGAGGGCAAGCATGTGCTGATCATCTTCGA
+CGACCTGACTAAGCAGGCCGAGGCATACCGGGCGATCTCGCTGCTGCTGCGCCGTCCGCCCGGCCGTGAG
+GCCTACCCCGGCGATGTGTTCTATCTGCATTCGCGGCTTTTGGAGCGCTGCGCCAAACTGTCCGACGATC
+TCGGTGGCGGCTCGCTAACGGGTCTGCCGATCATCGAGACCAAGGCCAACGACATCTCGGCCTACATCCC
+GACCAACGTCATCTCGATCACCGACGGGCAATGTTTCCTGGAAACCGACCTGTTCAACCAGGGCGTCCGG
+CCGGCCATCAACGTCGGTGTGTCGGTGTCCCGAGTCGGCGGCGCGGCGCAGATCAAGGCTATGAAAGAGG
+TCGCCGGAAGCCTCCGCTTGGACCTTTCGCAATACCGCGAGCTAGAAGCTTTCGCCGCTTTCGCTTCTGA
+TTTGGACGCCGCATCGAAGGCGCAGTTGGAGCGCGGCGCCCGGCTGGTCGAGCTGCTCAAGCAGCCGCAA
+TCCCAGCCCATGCCCGTTGAGGAGCAAGTGGTTTCGATCTTCCTGGGCACCGGCGGTCACCTGGACTCGG
+TGCCCGTCGAGGACGTCCGGCGGTTCGAAACCGAATTACTGGACCACATGCGGGCCTCCGAAGAAGAGAT
+TTTGACTGAGATCCGGGACAGCCAAAAGCTCACCGAGGAGGCCGCCGACAAGCTCACCGAGGTCATCAAG
+AACTTCAAGAAGGGCTTCGCGGCCACCGGTGGCGGCTCTGTGGTGCCCGACGAACATGTCGAGGCCCTCG
+ACGAGGATAAGCTCGCCAAGGAAGCCGTGAAGGTCAAAAAGCCGGCGCCGAAGAAGAAGAAATAGCTAAC
+CATGGCTGCCACACTTCGCGAACTACGCGGGCGGATCCGCTCGGCAGGGTCGATCAAAAAGATCACCAAG
+GCCCAGGAGCTGATTGCGACATCGCGCATCGCCAGGGCGCAGGCTCGGCTCGAGTCCGCTCGGCCCTACG
+CTTTTGAGATCACCCGGATGCTTACCACCCTGGCCGCTGAAGCCGCACTGGACCATCCGTTGCTCGTCGA
+GCGCCCGGAGCCGAAACGAGCCGGCGTGCTGGTGGTGTCGTCCGATCGTGGTTTGTGCGGCGCATACAAC
+GCCAATATTTTCCGTCGCTCCGAGGAGCTGTTCTCCCTGCTGAGGGAGGCCGGAAAGCAGCCGGTGCTGT
+ATGTGGTGGGCCGTAAGGCGCAGAACTACTACAGTTTTCGGAACTGGAACATCACCGAGTCGTGGATGGG
+TTTCTCCGAGCAACCCACGTACGAGAACGCCGCCGAGATCGCTTCGACCTTAGTGGATGCGTTCCTGCTC
+GGCACCGACAACGGCGAGGATCAACGGTCCGACAGCGGCGAGGGCGTCGACGAACTGCACATCGTTTACA
+CCGAGTTCAAGTCGATGCTGTCGCAATCGGCGGAGGCTCACCGGATCGCCCCCATGGTGGTGGAGTACGT
+CGAGGAAGACATCGGACCGCGCACGCTGTACTCGTTCGAGCCCGACGCGACGATGCTGTTCGAGTCATTG
+TTGCCGCGCTACCTGACTACCCGGGTGTACGCGGCGCTGCTGGAGTCCGCGGCGTCGGAGCTTGCCTCGC
+GGCAACGTGCGATGAAGTCGGCCACCGACAACGCCGATGACCTCATCAAGGCCCTGACGCTGATGGCAAA
+CCGCGAGCGGCAGGCCCAGATCACCCAGGAGATTAGTGAAATCGTCGGTGGCGCAAATGCGCTCGCCGAA
+GCCCGCTAGGCCCAAGCTAGGTTAGCCCCACGAGGAAGCGAAGAAGATATGACTACCACTGCCGAAAAGA
+CCGACCGGCCGGGAAAGCCGGGAAGCTCCGACACCAGCGGCCGCGTGGTACGGGTCACTGGGCCCGTCGT
+CGACGTCGAGTTTCCTCGCGGTTCCATCCCCGAGCTGTTCAATGCACTGCACGCTGAGATCACCTTCGAG
+TCGCTGGCGAAAACCCTCACCTTGGAGGTGGCGCAGCACCTCGGCGACAACCTGGTGCGCACCATCTCGC
+TGCAGCCGACCGACGGCTTGGTGCGCGGCGTCGAGGTGATCGACACCGGGAGGTCGATCTCGGTGCCGGT
+CGGTGAGGGTGTGAAGGGCCACGTCTTCAATGCGCTGGGAGATTGCCTGGACGAGCCGGGATATGGCGAA
+AAATTCGAACACTGGTCGATTCACCGCAAGCCGCCGGCGTTCGAGGAGCTGGAGCCTCGGACCGAGATGC
+TCGAGACCGGTCTGAAGGTGGTCGACCTGCTGACTCCGTATGTTCGTGGCGGCAAGATCGCACTGTTCGG
+CGGTGCCGGGGTGGGCAAGACGGTGCTGATTCAGGAGATGATCAACCGCATCGCCCGTAACTTCGGTGGT
+ACGTCGGTGTTCGCCGGAGTGGGCGAGCGCACCCGCGAGGGCAACGATCTGTGGGTCGAGCTTGCCGAAG
+CCAACGTGCTCAAGGACACCGCGCTGGTATTCGGACAGATGGACGAGCCGCCGGGCACCCGTATGCGTGT
+TGCGCTGTCTGCGCTGACGATGGCGGAGTGGTTCCGTGACGAGCAGGGTCAAGACGTATTGCTGTTCATC
+GACAACATCTTCCGGTTCACCCAGGCTGGGTCGGAAGTGTCGACGCTTCTCGGCCGGATGCCGTCGGCCG
+TGGGATACCAGCCCACGCTGGCCGACGAGATGGGCGAGCTGCAGGAGCGCATCACCTCGACGCGGGGACG
+CTCGATCACGTCGATGCAAGCCGTCTACGTGCCCGCCGACGACTACACCGACCCAGCGCCGGCGACCACG
+TTCGCCCACCTGGACGCCACGACCGAGCTATCCCGTGCGGTGTTCTCCAAGGGCATCTTCCCCGCCGTGG
+ACCCGCTGGCGTCCAGCTCGACCATCCTGGACCCCAGCGTTGTCGGGGATGAGCACTACCGCGTGGCCCA
+GGAAGTCATCCGGATCCTGCAGCGTTACAAGGACCTTCAGGACATTATCGCGATCCTCGGTATCGACGAG
+TTGTCGGAGGAGGACAAGCAGCTGGTGAACCGCGCCCGGCGTATCGAGCGGTTCCTATCGCAGAACATGA
+TGGCAGCCGAACAGTTCACCGGCCAGCCGGGTTCGACCGTCCCGGTGAAGGAGACCATTGAAGCGTTCGA
+CCGCTTGTGCAAGGGCGATTTCGATCACGTACCCGAACAGGCCTTCTTCTTGATCGGTGGCCTTGATGAC
+CTGGCCAAGAAAGCCGAGAGTCTCGGCGCCAAGCTGTGACGGGAGTTGTGGCATGGCCGAATTGAACGTT
+GAGATCGTCGCCGTCGACCGGAACATCTGGTCGGGTACGGCGAAGTTTCTGTTCACCCGCACCACCGTCG
+GTGAGATCGGCATCCTGCCCCGCCACATTCCGTTGGTGGCCCAATTGGTCGATGACGCCATGGTGCGGGT
+CGAGCGGGAGGGAGAAAAGGACCTGAGGATCGCGGTCGACGGCGGGTTCCTGTCGGTGACCGAGGAGGGC
+GTCAGCATTCTCGCCGAATCTGCCGAGTTCGAGTCGGAGATCGACGAGGCCGCCGCCAAGCAGGATTCCG
+AATCCGACGATCCCCGCATCGCTGCCAGGGGCCGCGCCAGATTGCGCGCCGTCGGCGCGATCGACTAACC
+CGCCGATGAGCGTGCCCATGATCGGCATGGTCGTGCTCGTCGTTGTCCTGGGATTGGCCGTTCTCGCACT
+GAGTTATCGTCTGTGGAAGCTGCGCCAGGGGGGAACGGCTGGGATCATGCGGGACATCCCTGCGGTTGGA
+GGTCACGGCTGGCGCCACGGCGTAATCCGCTATCGCGGCGGCGAAGCCGCGTTCTACCGGCTTTCTAGTC
+TGCGCTTGTGGCCGGATCGCCGGCTCAGTAGACGGGGTGTGGAGATCATTTCCCGGCGCGCGCCCCGTGG
+CGACGAATTCGACATCATGACCGACGAGATTGTCGTTGTGGAACTGTGCGACAGCACCCAGGACCGAAGG
+GTAGGTTACGAGATCGCGCTCGACAGGGGCGCGTTGACCGCATTTCTGTCGTGGTTGGAGTCCCGGCCGT
+CGCCGCGCGCGCCGCCGTAGTATGTGACGCACTGGTCAGCAGACGCAAAAGCCCCCATTTCGGGCTCTAC
+TGACTGATCTGTGGGTGGTTGTGTCGGCCTGGCAGGGTGGGGCGGTGGCCGGCGAGGGTGAGCATGGCTA
+GGGCGATGAGGGCTTGTGGTGAGCGGAATCCGAACGCGATCCGGGTCAGTAGGCGGATCTTGGTGTTGGT
+GGATTCGATCAGGCCTTGGGATAGGCCGTGGTCGAGGGCGGCGTCGATGGCCACCCGGTGGCGTTTGATG
+CGGGCGGCAAGCTCGACGAATACCGGGATGCGACAGCGCTGGGCCCAGGAGATCCACCGGTCCAGGGCCT
+GTTTACCTTCCTCGCCCTTGACCGAAAACACATGCCGCAGGCTCTCTTTGAGCAGGTAGGCGCGATACAG
+ACGGGGATCGGTCTTGGCGATCCAGGCCAGTTTGGCGCTTTGGCGTTCGGTGAGGTCCTCGGGGTTCTTC
+CACAGCGCGTAGCGGGCGCCCTTGAGCCGCCGTGCCCGCTCGCGGCCCGGACGTGGTGCGGCGTTCTTAC
+CGGGCCGGCCCCGGCCCCACTTGGGTTCGGTGCGCGCGATCGCCCGTGCGTCGTTCCAGGCTCGGCGCCG
+CTCGACGTCGAGCGCCTCGGTGGCCCAGGCCACCACATGAAACGGATCGGCGCATTGAATCGCATCCGGG
+CAGCGCTCGGTGACCACGTCAGCGATCCAGTCCGCGGCATCGGCCGAAACGTGAGTAATCTGGGCGGCCC
+GCTCAGCGCCCAGGGCATCGAAGAACAAGCCCAGGGTGGCTCGGGGCGGCCCACACCAACCGGCCGCTGT
+CGTGATCGACGACCACCGTCAGGTACCGGTGGTGGCGCTTGTAGGAGATCTCATCGATACCGATGCGGCG
+CAAGTTCGCGAACCGGTCAATGCGCTTTTCGGTGTCGGCCCAGACCCGGGCCACGATCGCCCCGACGGTG
+CGCCAGGCGATCCGCATCAACTCGCACACCGCGGTCTTCGAACACGCCACCGCCAGCCAGGCCACCGTGT
+CATCGAAAGCATACGTGTGCCCGGCATGATGACGCGCCCACGGCACCGCCACCACCGTCGGCCCATGGGT
+GGGGCAGTTCACCCGCGGCGCCTCGGCCTCCAAGAACACCTCGACGGTGCCCCAATCCAGACTGCGCCAT
+TGGCGCAGGCCCGCACCGCGGTCATACCAGGACGCCTTGCGACCGCAGCGACCACAGCGGCGCAACACTG
+CACTTCGTGGCCGCACCCGGGCGATCACCCGCGCACCGTCTCCGGCGTCATCCTCCTCGAATTCGATGTC
+CTCAATCACGGTGCGCTTGTCGACACCCAGCAGCGCACGAAATAGCCTCACATTGCGCACGTCGTTGTCG
+GCTCCTTGTGTTTCTGATCCTTGACAAGCCAGAAACCTTAAGCCACAACGACGTGCGCCTACTCAGGACA
+CAAACTCACCCACGGAAGTGTCAGAAGAGCCCAAAAACCGTGGGTATTGGGGGCTTTCGCGTCTGCTCGC
+ACGCGGAAGGTGCCGCTAGCTCGCCGTCCTATCACCACCGGGCCGCCACAGCACGTCACCGTCGGGATTG
+GCTACCCGCGACAGGATGAACAGCAGATCCGACAGCCGGTTCAGGTATTTCGCCGGCAGTACGCTGACGC
+CTTCCGGGTGAGCGTCGACCGCGGCCCACGCGGATCGCTCGGCCCGGCGAACGACGGTGCGAGCGACGTG
+CAACAGCGCCGACAGCGGTGAACCACCAGGTAGTACAAAGGATTTTAGTGCAGGCAGGCCCGCGTTGTAT
+GCGTCGCACCACCCTTCGAGCCGATCGATATAGGACTGTGCGATTCGCAGCGGAGGGTGCTTCGGGTTTT
+CCACTATCGGAGTCGACAGATCCGCACCGGCATCGAACAAGTCGTTCTGGATCTGCCGCAGCACATCCGT
+GATTTGAGTGTCCGGGTGGCCCAGCGCCAGGGCGGCCCCGATCGCGGCGTTGGCCTCGTCGCAATCCGCG
+TATGCCACCAGTCGGGCGTCGGTTTTGGCGACACGGGACATATCGCTCAATCCCGTCGTTCCGTCATCGC
+CGGTTCGGGTATAGATGCGGGTCAGGTGGACTGCCATGAGCAAACGGTACTCGCTGACTGGCTTGGCTCA
+CTGACAAGGCAAAACCCCTTTACTACACTGACCGGGTGGCCGAGCGTTTCGTCGTGACTGGGGGCAACCG
+GTTATCAGGCGAAGTGGCCGTCGGCGGCGCCAAGAACAGCGTGCTCAAGCTCATGGCTGCGACGTTGTTG
+GCCGAGGGCACCAGCACGATCACCAACTGTCCCGACATCCTCGATGTGCCGCTGATGGCGGAGGTACTGC
+GTGGTCTGGGCGCCACCGTCGAACTCGACGGTGACGTGGCCCGGATCACCGCACCTGACGAGCCGAAGTA
+CGATGCCGACTTCGCTGCGGTGCGGCAATTCCGCGCCTCGGTCTGTGTGCTGGGACCGCTGGTCGGGCGG
+TGCAAACGGGCCAGGGTCGCGCTGCCGGGCGGTGACGCGATCGGGTCGCGTCCGTTGGATATGCACCAGG
+CGGGCCTACGGCAATTGGGTGCCCACTGCAACATCGAGCACGGCTGCGTGGTAGCCCGAGCGGAAACGTT
+GCGCGGTGCGGAGATTCAGTTGGAGTTCCCCTCGGTGGGAGCCACCGAGAACATCTTGATGGCCGCCGTG
+GTGGCCGAGGGAGTCACCACTATTCACAATGCGGCTCGAGAACCCGACGTCGTCGACTTGTGCACGATGT
+TGAACCAGATGGGCGCACAGGTCGAAGGTGCGGGTTCGCCGACAATGACCATCACCGGTGTCCCGCGGCT
+GCATCCAACCGAGCACCGGGTGATCGGAGACCGTATCGTTGCCGCCACATGGGGCATCGCTGCCGCAATG
+ACCCGTGGTGATATATCAGTGGCGGGCGTAGACCCGGCGCATCTGCAGCTGGTGCTGCACAAATTGCACG
+ACGCGGGCGCAACCGTCACCCAGACTGACGCCAGCTTCCGGGTGACCCAGTACGAGCGTCCGAAGGCTGT
+CAACGTTGCGACCTTGCCGTTTCCCGGGTTTCCCACGGATCTGCAGCCGATGGCTATCGCTTTGGCGTCG
+ATCGCCGACGGCACATCGATGATCACGGAGAACGTGTTCGAGGCGCGGTTCCGCTTCGTTGAAGAGATGA
+TCCGGCTCGGTGCAGACGCTCGGACCGACGGGCACCACGCCGTGGTGCGGGGCCTCCCGCAGCTGTCGAG
+CGCTCCGGTGTGGTGTTCGGACATCCGTGCCGGGGCCGGCTTGGTGCTGGCGGGGCTCGTTGCCGACGGC
+GACACCGAGGTCCACGATGTATTCCACATCGATCGCGGATATCCGTTGTTCGTGGAGAACCTGGTGAGTC
+TCGGTGCCGAGATCGAACGGGTATGCTGTTAGGCGACGGTCACCTATGGATATCTATGGATGACCGAACC
+TGGTCTTGACTCCATTGCCGGATTTGTATTAGACTGGCAGGGTTGCCCCGAAGCGGGCGGAAACAAGCAA
+GCGTGTTGTTTGAGAACTCAATAGTGTGTTTGGTGGTTTCACATTTTTGTTGTTATTTTTGGCCATGCTC
+TTGATGCCCCGTTGTCGGGGGCGTGGCCGTTTGTTTTGTCAGGATATTTCTAAATACCTTTGGCTCCCTT
+TTCCAAAGGGAGTGTTTGGGTTTTGTTTGGAGAGTTTGATCCTGGCTCAGGACGAACGCTGGCGGCGTGC
+TTAACACATGCAAGTCGAACGGAAAGGTCTCTTCGGAGATACTCGAGTGGCGAACGGGTGAGTAACACGT
+GGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCGGATAGGACCACGGGATG
+CATGTCTTGTGGTGGAAAGCGCTTTAGCGGTGTGGGATGAGCCCGCGGCCTATCAGCTTGTTGGTGGGGT
+GACGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGTGTCCGGCCACACTGGGACTGAGATACG
+GCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCC
+GCGTGGGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCACCATCGACGAAGGTCCGGGTTCTCTCGGAT
+TGACGGTAGGTGGAGAAGAAGCACCGGCCAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCGAGC
+GTTGTCCGGAATTACTGGGCGTAAAGAGCTCGTAGGTGGTTTGTCGCGTTGTTCGTGAAATCTCACGGCT
+TAACTGTGAGCGTGCGGGCGATACGGGCAGACTAGAGTACTGCAGGGGAGACTGGAATTCCTGGTGTAGC
+GGTGGAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCAGTAACTGACGCTGA
+GGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGGTGGGTACTAG
+GTGTGGGTTTCCTTCCTTGGGATCCGTGCCGTAGCTAACGCATTAAGTACCCCGCCTGGGGAGTACGGCC
+GCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGTGGATTAATTCGATGC
+AACGCGAAGAACCTTACCTGGGTTTGACATGCACAGGACGCGTCTAGAGATAGGCGTTCCCTTGTGGCCT
+GTGTGCAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGC
+AACCCTTGTCTCATGTTGCCAGCACGTAATGGTGGGGACTCGTGAGAGACTGCCGGGGTCAACTCGGAGG
+AAGGTGGGGATGACGTCAAGTCATCATGCCCCTTATGTCCAGGGCTTCACACATGCTACAATGGCCGGTA
+CAAAGGGCTGCGATGCCGCGAGGTTAAGCGAATCCTTAAAAGCCGGTCTCAGTTCGGATCGGGGTCTGCA
+ACTCGACCCCGTGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACGCTGCGGTGAATACGTTCCCGGG
+CCTTGTACACACCGCCCGTCACGTCATGAAAGTCGGTAACACCCGAAGCCAGTGGCCTAACCCTCGGGAG
+GGAGCTGTCGAAGGTGGGATCGGCGATTGGGACGAAGTCGTAACAAGGTAGCCGTACCGGAAGGTGCGGC
+TGGATCACCTCCTTTCTAAGGAGCACCACGAAAACGCCCCAACTGGTGGGGCGTAGGCCGTGAGGGGTTC
+TTGTCTGTAGTGGGCGAGAGCCGGGTGCATGACAACAAAGTTGGCCACCAACACACTGTTGGGTCCTGAG
+GCAACACTCGGACTTGTTCCAGGTGTTGTCCCACCGCCTTGGTGGTGGGGTGTGGTGTTTGAGAACTGGA
+TAGTGGTTGCGAGCATCAATGGATACGCTGCCGGCTAGCGGTGGCGTGTTCTTTGTGCAATATTCTTTGG
+TTTTTGTTGTGTTTGTAAGTGTCTAAGGGCGCATGGTGGATGCCTTGGCATCGAGAGCCGATGAAGGACG
+TGGGAGGCTGCGATATGCCTCGGGGAGCTGTCAACCGAGCGTGGATCCGAGGATTTCCGAATGGGGAAAC
+CCAGCACGAGTGATGTCGTGCTACCCGCATCTGAATATATAGGGTGCGGGAGGGAACGCGGGGAAGTGAA
+ACATCTCAGTACCCGTAGGAGGAGAAAACAATTGTGATTCCGCAAGTAGTGGCGAGCGAACGCGGAACAG
+GCTAAACCGCACGCATGGGTAACCGGGTAGGGGTTGTGTGTGCGGGGTTGTGGGAGGATATGTCTCAGCG
+CTACCCGGCTGAGAGGCAGTCAGAAAGTGTCGTGGTTAGCGGAAGTGGCCTGGGATGGTCTGCCGTAGAC
+GGTGAGAGCCCGGTACGCGAAAACCCGGCACCTGCCTAGTATCAATTCCCGAGTAGCAGCGGGCCCGTGG
+AATCCGCTGTGAATCCGCCGGGACCACCCGGTAAGCCTAAATACTCCTCGATGACCGATAGCGGATTAGT
+ACCGTGAGGGAATGGTGAAAAGTACCCCGGGAGGGGAGTGAAAGAGTACCTGAAACCGTGTGCCTACAAT
+CCGTCAGAGCCTCCTTTTCCTCTCCGGAGGAGGGTGGTGATGGCGTGCCTTTTGAAGAATGAGCCTGCGA
+GTCAGGGACATGTCGCAAGGTTAACCCGTGTGGGGTAGCCGCAGCGAAAGCGAGTCTGAATAGGGCGACC
+CACACGCGCATACGCGCGTGTGAATAGTGGCGTGTTCTGGACCCGAAGCGGAGTGATCTACCCATGGCCA
+GGGTGAAGCGCGGGTAAGACCGCGTGGAGGCCCGAACCCACTTAGGTTGAAGACTGAGGGGATGAGCTGT
+GGGTAGGGGTGAAAGGCCAATCAAACTCCGTGATAGCTGGTTCTCCCCGAAATGCATTTAGGTGCAGCGT
+TGCGTGGTTCACCGCGGAGGTAGAGCTACTGGATGGCCGATGGGCCCTACTAGGTTACTGACGTCAGCCA
+AACTCCGAATGCCGTGGTGTAAAGCGTGGCAGTGAGACGGCGGGGGATAAGCTCCGTACGTCGAAAGGGA
+AACAGCCCAGATCGCCGGCTAAGGCCCCCAAGCGTGTGCTAAGTGGGAAAGGATGTGCAGTCGCAAAGAC
+AACCAGGAGGTTGGCTTAGAAGCAGCCACCCTTGAAAGAGTGCGTAATAGCTCACTGGTCAAGTGATTGT
+GCGCCGATAATGTAGCGGGGCTCAAGCACACCGCCGAAGCCGCGGCACATCCACCTTGTGGTGGGTGTGG
+GTAGGGGAGCGTCCCTCATTCAGCGAAGCCACCGGGTGACCGGTGGTGGAGGGTGGGGGAGTGAGAATGC
+AGGCATGAGTAGCGACAAGGCAAGTGAGAACCTTGCCCGCCGAAAGACCAAGGGTTCCTGGGCCAGGCCA
+GTCCGCCCAGGGTGAGTCGGGACCTAAGGCGAGGCCGACAGGCGTAGTCGATGGACAACGGGTTGATATT
+CCCGTACCCGTGTGTGGGCGCCCGTGACGAATCAGCGGTACTAACCACCCAAAACCGGATCGATCACTCC
+CCTTCGGGGGTGTGGAGTTCTGGGGCTGCGTGGGAACTTCGCTGGTAGTAGTCAAGCGAAGGGGTGACGC
+AGGAAGGTAGCCGTACCAGTCAGTGGTAACACTGGGGCAAGCCGGTAGGGAGAGCGATAGGCAAATCCGT
+CGCTCACTAATCCTGAGAGGTGACGCATAGCCGGTTGAGGCGAATTCGGTGATCCTCTGCTGCCAAGAAA
+AGCCTCTAGCGAGCACACACACGGCCCGTACCCCAAACCGACACAGGTGGTCAGGTAGAGCATACCAAGG
+CGTACGAGATAACTATGGTTAAGGAACTCGGCAAAATGCCCCCGTAACTTCGGGAGAAGGGGGACCGGAA
+TATCGTGAACACCCTTGCGGTGGGAGCGGGATCCGGTCGCAGAAACCAGTGAGGAGCGACTGTTTACTAA
+AAACACAGGTCCGTGCGAAGTCGCAAGACGATGTATACGGACTGACGCCTGCCCGGTGCTGGAAGGTTAA
+GAGGACCCGTTAACCCGCAAGGGTGAAGCGGAGAATTTAAGCCCCAGTAAACGGCGGTGGTAACTATAAC
+CATCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGCGTAACGACTTCTCAAC
+TGTCTCAACCATAGACTCGGCGAAATTGCACTACGAGTAAAGATGCTCGTTACGCGCGGCAGGACGAAAA
+GACCCCGGGACCTTCACTACAACTTGGTATTGATGTTCGGTACGGTTTGTGTAGGATAGGTGGGAGACTG
+TGAAACCTCGACGCCAGTTGGGGCGGAGTCGTTGTTGAAATACCACTCTGATCGTATTGGGCATCTAACC
+TCGAACCCTGAATCGGGTTTAGGGACAGTGCCTGGCGGGTAGTTTAACTGGGGCGGTTGCCTCCTAAAAT
+GTAACGGAGGCGCCCAAAGGTTCCCTCAACCTGGACGGCAATCAGGTGGCGAGTGTAAATGCACAAGGGA
+GCTTGACTGCGAGACTTACAAGTCAAGCAGGGACGAAAGTCGGGATTAGTGATCCGGCACCCCCGAGTGG
+AAGGGGTGTCGCTCAACGGATAAAAGGTACCCCGGGGATAACAGGCTGATCTTCCCCAAGAGTCCATATC
+GACGGGATGGTTTGGCACCTCGATGTCGGCTCGTCGCATCCTGGGGCTGGAGCAGGTCCCAAGGGTTGGG
+CTGTTCGCCCATTAAAGCGGCACGCGAGCTGGGTTTAGAACGTCGTGAGACAGTTCGGTCTCTATCCGCC
+GCGCGCGTCAGAAACTTGAGGAAACCTGTCCCTAGTACGAGAGGACCGGGACGGACGAACCTCTGGTGCA
+CCAGTTGTCCCGCCAGGGGCACCGCTGGATAGCCACGTTCGGTCAGGATAACCGCTGAAAGCATCTAAGC
+GGGAAACCTTCTCCAAGATCAGGTTTCTCACCCACTTGGTGGGATAAGGCCCCCCGCAGAACACGGGTTC
+AATAGGTCAGACCTGGAAGCTCAGTAATGGGTGTAGGGAACTGGTGCTAACCGGCCGAAAACTTACAACA
+CCCTCCCTTTTGGAAAAGGGAGGCAAAAACAAACTCGCAACCACATCCGTTCACGGCGCTAGCCGTGCGT
+CCACACCCCCCACCAGAACAAATTTGCATAGAGTTACGGCGGCCACAGCGGCAGGGAAACGCCCGGTCCC
+ATTCCGAACCCGGAAGCTAAGCCTGCCAGCGCCGATGATACTGCCCCTCCGGGTGGAAAAGTAGGACACC
+GCCGAACATACAAAAACACCCCGGTAACGGTGGTGTTTTTGTATGTTTATATCGACTCAGCCGCTCGCGA
+GCGGGCGAATTATGGCTTCGATTTTCGCAATGACGATACCCTCGCGGGCGGGGGCGCTCAGTCGAAGAGC
+GTCAAGTCTGCGGGCGCCCGGCTTTTCTCCAACTCGAGCAGAGCTCGTTTCCGGTTGATTCCACCGCCGT
+ACCCGGTGAGCTTTCCGCTGGCGCCGATCACGCGGTGGCACGGGACGATGATGGCGATGGGATTGTGGCC
+GTTGGCCAATCCCACGGCGCGTGCGGCGCCGGGGGCGCCGATCTGGTCGGCGATTTCCCCGTAGGACCGG
+GTTTCCCCGTACGGGATTGTCAGCAATGCTTTCCATACTCGTTGCTGAAAGTCGGTTCCCCGGAGGTCAA
+GTTCCACATCGAATTCGGTGAGCTCGCCGGCGAAATAAGCGTTGAGTTGGTCGACAGCGCCAGAAAATGC
+GCCGGGGTCGGGTGTCCAGTGTGTGCGGCTTGGCTCATACGTCTGCTCGAGCATCCGCAGGTTCGTCAAC
+ACCGAGCCATGCCCGGCCAGGGTTAATGGCCCGATGGGGCTATCGATGGTGCGGTAGTGAATCATGCGAT
+CTTCTCCTGCGGTGGCCATTGGTTTACCGGATGTTCCAGGGTGGTCCACAGGTGCTGGGTGGCATAGGAG
+CGCCAGGGGCGCCAGCGAGCGCTGTGCACCGTCAGGGCTCGTCGTTGTGCAGGCAGGCCCAGCTTTTTGG
+CGGCCAGCCGCAGGCCGAGATCACTGGCCGGAAAGGCGTCCGGGTCACCGAGGCCGCGCATGGCGATGAC
+CTCCGCGGTCCAGGGGCCCACTCCGGGCAGCGCTAGCAACTGCCCGCGGGCGCGTTGCCAGTCACATCCG
+GCGTCCAGGACCAGACTTTTGTCGGCAAGGCTGGCGACGAGCGCGTTTATGGTCCTTTGACGCGCCTTGG
+GGACGGCCAGATGGCCGGGATCGATCTCAGCGAGCTGCTCGATCGACGGGAAGGTGTGGGTCAAAGCGCC
+GTGGCGATCGTGGACCGGCCGTCCGTAGGCGGCGACCAGTCGGCCCGCGTGAGTGCTTGCGGCCTTCGTC
+GATACCTGTTGGGCGAGGACCGCCCGCACGGCGAATTCTGCCTCGTCGACTGTGCGGGGAATGCGTTGCC
+CGGGTGCCTTGCCCACCACTGCGCGCAGATCCGGATCGGCGCCCAGCGCCTCGACGATCGCTTCGGGATC
+GGCGTCGAGGTCCAGCAGCCGTCGGCAACGTGCAGTGGCCGTCATTAGGTCGCGGAAATCATCGAGCACA
+AGCAGGCAGCGCACATGATCGGGTGCCGGCGTCAGGCTGACGATGCCGTTGCCCCATGGGAGCCGTAGCG
+TGCGTCGGTACGCACCATCGCGGACCTCTTCGCAACCCGGCACCGCGGTGGCGGCCAGATGGCCGAAAAC
+ACCCTCGAAGGCGAATGGTGCACGGACGGGTAGCCGCAGCGACACCGTGCCCGCTGATGCGGTGGCAGAC
+TCGAATCGGGCGGCCGCGCGCGCACGCAATGCCGTCGGTGTGCCGTCGCACGCCAGGCGAACGGTGTCGT
+TGAACTGACGGATGCTGGAAAACCCGGCGGCGAATGCGACATCGCCGAACGGCAGGTTCGTGGTCTCGAT
+CAGCACCCGGGCGGTCTGCATGCGTTGGGCGCGGGCCAACGCGAGCGGACCGGCGCCGACCACGGCCTGC
+AACAGCCGCTCCAGCTGGCGAATGGTGTAACCGAGCTGGGCCGCGAGGCCGCTGACACCGTCGCGGTCCA
+CCGTTCCGTCGGCAATCAGCCGCATCGCCCGCGCCACGACGTCACTACGCACATTCTATTCCGGAGACCC
+AGGCGAGGCGTCGGGGCGGCACCGTTTGCAGGCCCGGAATCCCTCCCCCTGAGCGGCCGCCGCAGTCGGC
+AGGAACCGGACATTGCGCGCGAACGGTGGCCGGACGGGGCAACTCGGCCGGCAGTAGACACCGGTGGTCA
+AAACCGCGACGACGAACCAGCCGTCGAACCGGGCGTCTTTGGACTGGACCGCCCGGTAGCAGCGTTCGAA
+GTCGTCGTGCACCCTTCAACAATTACACCCGCCCACCGACATGACTGGCGGAAAAACGACATTGTGATGG
+GGTCGTCGTGGGTTCGGGCAGGTTACCTACGCGGCTTGGTCAGCCCGACCGGCTTGGCCAGCCGGACCGG
+TTGGTCGTGCCCACGAAGTTTCACATGCCTACCCAAAGACCAACGGGCGCGCTCCTCTTCGCTTGCGGCG
+TCCACGGCCTGTGCCGAAGCCAGCAACTTGCCGGGACGCGATTTGGCCAGTTCGCACAATCGGGCCGCCT
+CGTTGACCGGCTCCCCGATCACGGTGTACTCGAACCGTTCTCGGGCACCCACGTTGCCGGCAATGACCTG
+CCCCGCCGCCACGCCGATCCCGGCCTGGCACTCGGGCATTTCGTTGACCAGCCGATCGGCTATCGCCCGC
+GCGGCGGCCAGTGCCTTGTCTTCGGGACAGGGAAGCCGGTTCGGGGCGCCGAAGATGGTTAGCGACGCGT
+CCCCCTCGAACTTGTTGACCAATCCGTGGTGGCGGTCGACCTCGTCGACGACAATCGCGAAGAACTTGTT
+GAGCAGCTTGACGACGTCGGCCGGCGGCCGGCTGGTCACCAATTGCGTCGAGCCGACGATGTCGATGAAC
+ACGACGGCGACGTGGCGTTCTTCGCCGCCCAGTTTCGAACGTTCACGCTCGGCGGCGGCGGCGACTTCGC
+GTCCGACGTGGCGGCCGAACAGATCGCGCACTCGTTCGCGCTCCCGCAGTCCGGCGACCATCGCGTTGAA
+ACCACGCTGCAGCTCGCCGAGTTCGGTGCCGTCGAAGACCACCAGGTTGGTCCGTAGCTCGCCCCGCTCG
+ACGCGCCGCAGCGCCGCACGCACCACCCGCACCGGGGTCGCCGTCAGCCAGGCCAGGATCCACATCAGGA
+TGAACCCGAACACCAATGTGACCATCGAGATGATCAGCACGCCCGTCGCGAACTGCATCCGAGTGAGATT
+GAGCAGCACCATTTCGAACATCGCCATCAGGGCGATGCCGACGACGGGTACTCCCGAACCGAGCAGCCAC
+ACCACCATGGTCCGGCCCAGGATTCCCGGCGCCAACCGGCGTGGCGGCGGCCCGGCCTCGAGCGCCTGGG
+CGGCGAACGGGCGCAATGCGAACTCGGTATGCAGATAGGTTGCGGTTGCGACCAATACGCCGCAAAAGCT
+GACCGCGAACAGGAATCGCGGGATGAACGCGTTGTTGATCAGGCCGTAGAGTGTCGTCAAGAGCGCCGTG
+CCAACACCCCAGAACATGAGGTGGCCCACGGCGACTCGCCAGGGGGCCAGGAAGGTGCGGCGCTCCTCCT
+CACGAGTCGGTTTCCGTCCTTCGATCGCCCAGCGCAGGGCTTGCACGGTCTGCCTGGTCAGTGCGTAGCT
+ACCCAAAGCGAGGGCTAGCAGGACATAGCCCGGTACCACCCCGAACGTGAGCCACCGTGGCGTGTCGCGA
+ACGATGCTCGGTTCGGGGATGGCGATCGTCACCAATAGCAGGGCAACCCCGATGCCGAGCAGGTTCGCGG
+TCACGACCAGCGCGGTCAGCATGACCTGGATCCGTACCCGTCGGCGCCGTTGGCTTTCCGAAACCCGCCC
+AAGCAGCCAGGAGCCGTACGCGGGAGTTTCTGGCAGCCGGCCGCTCTGCCGGGTCACCGTCTCCAGCACC
+CGACCCAAGCGTTGCGCCGTGCTCTTCTTGGCCGACATTGTGGCGTCAGACTAGTTTGTCGAAGAGTCGG
+GTGCGACCGGTTGGCGCGCTCGTGTTGTTTGCCCGGCTTAGGTGGGCACGGCCAGCCGAGTCGGCTGCTC
+ATGTCCGCGCAGCGTCACCGTCTCGCCCAAAGACCAATGGGCACGCTCGGTTTCGCTGGCAGCGTGCAGT
+GTGTCCGAGGATGCTAGCAATCGCGCGGGGTGTGATTTGGCCAGTTCGCACAATCGGGCCGCCTGGTTGA
+CCGGCTTGCCGACCACTGTGTATTCGAATCTTTGCTTGGCGCCGACATTGCCGGCGACGATCTGGCCTGC
+CGCCACCCCGATGCCGGCTTGGACCTCGGGCATCTCGTTGGCCAGCCGATCGGCTATGGCCCGGGCGGCG
+GCCAGCGCGGCGTCTTCGGGACGGTCGAGGCGGTTCGGGGCTCCGAAGATGGCCAGGGCGGCGTCGCCTG
+CGAACTTGTTGATCAGTCCGTGGTGACGGTCGACCTCGTTGACGACGATCGCGAAAAACCGGTTGAGGAG
+CTTGACCACGTGGGCGGCAGGTTGGTTGTCCACCAGCTGGGTGGAGCCGACGATGTCGACGAAGACGACG
+GCGGCGTGGCGGTCTTCGCCGCCTAGCTGTGGTCGTTCACGCTCGGCGGCGGCGGCGACTTCGCGTCCGA
+CGTGGCGGCCGAAAAGGTCGCGCACGCGTTCGCGCTCGCGCAGGCCGTTGACCATCGCGTTGAAACCACG
+CTGCAGCTCACCGAGTTCGGTGCCGTCGAACACCACCAGATCCCCTCGCAGATCCCCCTGCTCGACACGC
+TTGAGCGCAGCGCGCACCACTCGCACCGGCGCCGCCGTCAGCCAAGCAAGAATCCACATCACGAGAAACC
+CGAAGATCAACGTGGTTATCGACAGGATCAACACCGCCGACGCGAGCTGCGTTTCGGTCAGATTGTGCAC
+CAATAGGACGTAGAGCGCTGTCGTGGCGATGCCGGTCACAGGCACGCCTGAACCTAGCGACCACACCGTC
+ATCGTTCGGCCCATGATGCCCGGTGCAAACCGTCGTGGCGGTCGTCCCGCTTCGAGTGCTTTAGCGGCTA
+CGGGTCGCAGCGCGAACTCGGTGAACAAGTAGCAATTGGTGGCTACCAAAACGCCGCAGATAGTCACCGA
+GAACAAAATTATGGTGACGAATACGCGGTTGGCCAGCCCGTAGAGCGTGGCCAACAACGCCCCGCCGATA
+TCCCACAGAATGAGGTGGACGGCTGCCACTCGAAACGGGAGCAGCAAGGTGTTGCGCCCGTCGGCCTGGC
+TCGGCGCGCGTTCCTCGATCGCCCACCGTATGGACGCTCTGACGATTCGCGTGGTTATCCAGTAGGTGCC
+GATGGCCAGTGCGAGCGTCGCATAGGCCGGTGCGACCCCGAAGGTGACCCACCATGGGGCGTCGGTGTAG
+ATGCTAGGCACCGGAAAAGCGAAGGTCACCACTAGCAGCGCGACCACGATCCCGGTCAGGTTCGCCGTCA
+TGATATAGACGGTCACGATGCGCTTGATGCGTACCCAGCGACGCGACGGGCTTTCTGACACCCGCCCAAG
+CAACCAGGAGCCATACGCCGGGGTCTCGGGCAGCTGGCCGCACTGACGGGTCATCGTCTCGAGTGCCTGG
+CCCAGGCGTTGCGCCATGGTCTTTTTCGCCGGCATGGTGGCGTCAGCCTAATCTGTCGGATGCGCCCCAC
+GGTAAATCGTGTGGGTCTGGTGATCGCCCAGTGCACCGCCGACTATGTCGGCCGACTGAGCAGGCATCTG
+CAGCTGTTGAACTGGCGACGCCAGCCGGATGGGCTGGTCGTGCCCGCGAAGTGTCACGGTCTCGCCTAAA
+GACCAACGGGCACATTCGTTTTCACTGGCACCGCGCAACGTTTGCGACGACGCCAACAATCGGCTCGGGT
+ATGATTTTGCCAGTTCGCACAGTCGTGCAGCCTCGTTGACCGGTTCGCCGATCACGGTGTATTCGAACCG
+TTCGTGGGCGCCGACATTGCCGGCGACAACCTGACCTGCCGCTACCCCGATGCCGGCTTGGCACTCCGGC
+ATTTCGCTGGCTAGCCGGTCGGCGATGGCTCGTGCGGTGGCCAGCGCGGCATCTTCGGGATGGCTCAGGC
+GGTTGGGGGCCCCGAAGACTGCCAGCGAGGCGTCTCCCTGAAACTTGTTGACAAGTCCACGGTGATGGTT
+CACTTCATCGACGATTACCGTGAAGAACCGGTTGAGTAGCATCACGACCTCTGCCGCAGGCCGGCTGGTG
+ACCAATTGAGTTGAACCGACGATGTCGACGAAGACGACGGCGACATGGCGCTCTTCGCCGCCCAGTTTTG
+GTCGCTCGCGTTCGGCTGCTGCGGCGACCTCGCGACCGACGTGGCGGCCGAAGAGATCGCGTACGCGTTC
+GCGCTCGCGCAGGCCCTCGACCATTCTGTTGAAACCACGCTGTAGCTCACCGAGTTCGGTCCCGTCGAAT
+ACGACCAGATCGCCGCTTAGATCGCCCTGCTCTACGCGGTTGAGCGCCTCGCGGACCACGCGCACAGGCG
+TGGCCGTCAGCCAAGCGAGAATCCACATCAGGATGAATCCGAAGATCAACAGTGGTGCCCACAGGATCAG
+CACTGTGATCATGAATTGATCATTGGAGAGTTCCCAAAACGTATCGTCGAAGATGGCGGTGAGGGCGACA
+CCGACATTGGGTACGCCTGAACAGAGCAGCCACACCAGCATGGTTCGGCCCACGATGCCTCGCACCAGCG
+ATCGTGGTGTTGCTCCCACTTCGAGCGCCTGGGCGGCCATCGGGCGAAGCGCAAACTCGGTTAACAGATA
+GCAGCTGGTGGCTGCGACAACGCCGATGACGCCCATCGAAAACAGGAACCGCGGGATAAACAACCGGTTG
+GCCAGGCCGTAGATTATCGTCCACAACGCTGCGGCGGCGCCCCACAGGAAAAGAACTGCCAACGCCACTC
+GCAGTGGGACTAGGAAAGCGCTGCGCGCCTCATCATGGCTGGGGGTGCGTTCCTCGATTGCCCACCGCAA
+CGCTCGAGCCGTTTGCCTGGTGAGCCAGTAGGTGCCCAGTATGAAGGCGAGCACGCAGTATCCCGGAACG
+ATCCCGAACGACACCCAATGCGGGGCGTCCAAAATCACGCTTGGTTTCGGAAAGGCGACCGTCAGTAGCA
+TGGCACCGACAATGAGCCCGATCACGTTCGTGACCAAAATGGCGACGGTCAGCATGCCCTGGATACGTAC
+CCGCCGCATCCGTGGGCTCTCCGACACGCGCCCAAGCAGCCATGAGCCGTATGCGGGCGTCTCTGGCCGT
+CGTCCAGTGCGCGGGCTGAGAGTCTCGACGGCCCCTGGCAAGTGTCGAGTGGTGGCCTTCTCGGATGGCA
+TGGTGACGTCAGCGTAGTGTGTCGGTCACGCTCTAAGGAACAACGTCGTTGCGCGCTCTAAGGTGAGTCG
+GGTGCGTCTAGTCATCGCCCAGTGCACTGTCGACTACATCGGCCGGCTCACCGCGCATCTGCCGTCCGCG
+CGCCGGCTGTTGCTGTTCAAGGCCGACGGATCGGTCAGCGTACATGCTGACGACCGCGCCTACAAGCCGT
+TGAACTGGATGAGTCCGCCGTGCTGGTTGACCGAAGAGTCCGGCGGCCAGGCGCCAGTGTGGGTGGTCGA
+GAACAAGGCCGGCGAGCAGCTGCGCATCACTATCGAAGGAATCGAGCACGACAGTAGCCACGAGCTGGGC
+GTGGACCCCGGGCTGGTCAAGGACGGCGTCGAGGCCCACTTGCAGGCGTTGCTCGCCGAGCACATCCAAT
+TGCTGGGCGAAGGGTACACGCTGGTCCGCCGCGAGTACATGACCGCGATCGGACCCGTCGACCTGCTGTG
+CCGCGACGAACGAGGTGGCTCGGTCGCGGTGGAAATCAAGCGGCGTGGCGAGATCGACGGCGTGGAGCAG
+CTGACCCGCTACCTCGAGTTGCTCAACCGCGACAGTGTGCTCGCGCCGGTCAAGGGGGTGTTTGCCGCTC
+AACAGATCAAGCCGCAGGCTCGGATTCTGGCCACCGACCGCGGGATCCGTTGTTTGACATTGGATTACGA
+CACAATGCGCGGGATGGATAGCGGCGAGTACCGGCTGTTCTGAGTTGCGCGATTAAACTGATGCGATGGC
+TCGGCGCCGCAAACCGCTGCACCGGCAGCGGCCGGAACCGCCGTCGTGGGCCCTGCGCCGAGTGGAAGCG
+GGGCCCGATGGCCACGAGTATGAAGTACGACCGGTCGCTGCGGCCCGCGCCGTCAAGACCTATCGCTGTC
+CGGGGTGTGATCACGAAATCCGTTCCGGTACTGCACATGTGGTAGTGTGGCCGACTGACTTGCCGCAAGC
+CGGCGTCGATGACCGGCGTCACTGGCACACCCCGTGCTGGGCGAACCGAGCAACCCGCGGTCCGACTCGA
+AAATGGACCTAGGCTTTTGGCGGCTGGTGCGCCCTGCTGGTGCGCCTTAGGGGGCCGGCTCCACCAACTC
+GATCAGAACCCCGCCGGCGTCTTTCGGGTGGATGAAGTTGATCCGTGAGTTCGCGGTGCCACGCCTGGCC
+GTCTCGTAGACCAGCCGGACGCCCTGGGAGCGCAGCCGCCGACACATGGCGTCAAGATCGCTGACCCGGC
+ACGCCAGCTGTTGGATGCCTGGCCCGCGCTTGTCCAGGAACTTCGCTATCACCGAGGATTCGTCGAGCGG
+GGCCATCAACTGGATTTGCGCCGCGGAGCCCGGCACCGCCAGCAGTGCCTCGCGGATGCCCTGATCGTCG
+TTGATTTCCTCGTGGACCAGGATCATGCCAAGGTGGTCGTGATACCACTCGATGGCAACGTCCAGGTCGG
+CGACCGCAATACCGACGTGATCGAGTCCAGTTACCAACGAGGTAGCCAGCATGTGACGGGCGTGGACTTG
+ATCGGTCGTCATCACACAACGGTAACCTGAAGGGAAAGAATCTGCTTCTCCGGGTCGGTCAGATCGGCTT
+TCGGGTGCGCTGAGGAGGTAGTCATAACGACATCGGTGATTGTTGCTGGCGCGCGTACACCCATCGGCAA
+GTTGATGGGCTCCCTGAAGGATTTCAGCGCCAGCGAGCTGGGTGCCATCGCCATTAAGGGCGCCCTGGAG
+AAGGCCAACGTGCCGGCGTCCTTGGTCGAGTACGTGATCATGGGCCAGGTGTTGACCGCGGGTGCCGGGC
+AAATGCCCGCACGGCAGGCGGCAGTGGCGGCCGGCATCGGTTGGGATGTCCCTGCGCTGACGATCAACAA
+GATGTGCCTGTCCGGCATCGACGCAATCGCGCTGGCTGATCAACTCATTCGGGCCAGAGAGTTCGACGTG
+GTGGTGGCCGGCGGTCAGGAGTCGATGACGAAGGCGCCCCACCTGTTGATGAATAGCCGGTCGGGTTACA
+AGTACGGCGACGTTACGGTTTTGGACCACATGGCCTACGACGGTCTGCACGACGTGTTCACCGATCAGCC
+GATGGGCGCGCTCACCGAGCAACGCAACGACGTCGACATGTTCACCCGCTCCGAACAGGACGAGTACGCG
+GCTGCGTCCCACCAAAAGGCGGCCGCGGCATGGAAGGACGGCGTATTCGCCGACGAGGTGATCCCGGTGA
+ACATCCCGCAGCGCACGGGCGATCCACTGCAGTTCACCGAGGACGAGGGGATCCGCGCCAACACCACCGC
+CGCCGCGCTGGCCGGTCTGAAGCCGGCGTTCCGTGGCGACGGCACCATCACCGCCGGGTCGGCGTCACAG
+ATCTCCGACGGTGCGGCCGCGGTGGTGGTCATGAACCAGGAAAAGGCCCAGGAACTGGGGCTGACCTGGC
+TAGCCGAGATCGGCGCCCACGGTGTGGTGGCCGGGCCGGATTCCACACTGCAATCGCAGCCGGCCAACGC
+GATCAACAAGGCGCTGGATCGCGAGGGCATCTCGGTGGACCAGCTCGACGTGGTGGAGATCAACGAGGCG
+TTCGCTGCGGTGGCATTGGCCTCGATACGCGAACTCGGGCTGAACCCCCAGATCGTCAACGTCAACGGTG
+GTGCGATTGCCGTCGGGCATCCCCTCGGCATGTCAGGGACGCGAATCACGCTACATGCGGCGCTGCAGTT
+GGCACGCCGGGGATCGGGCGTCGGGGTTGCCGCATTGTGCGGGGCTGGCGGGCAGGGCGACGCACTGATA
+TTGCGGGCCGGATAGCGGTTGAGGGGTCGGTGGCGGCCAGTGTGATCTTGGTCATACCAACCGATCGCGG
+TATGTCGGCTCCTGCCGCAGGGTCGGCGCCACCGGGTGGATCGATGACCGCAGCGGCATGACAGACTTGA
+CGGCGTGACGCGTCCGCGACCCCCGCTCGGGCCGGCCATGGCCGGTGCTGTTGACCTCTCCGGCATCAAA
+CAACGTGCCCAGCAAAACGCTGCGGCGAGCACGGATGCCGACCGGGCACTGTCGACGCCGTCCGGTGTGA
+CCGAGATCACCGAGGCGAACTTCGAGGACGAGGTGATCGTCCGGTCCGACGAAGTGCCGGTGGTGGTGTT
+GCTGTGGTCACCCCGCAGCGAGGTATGCGTCGACTTGCTTGACACGCTGTCCGGCTTGGCCGCTGCCGCT
+AAGGGCAAGTGGTCGCTGGCGTCGGTTAACGTTGACGTCGCACCCAGGGTGGCACAGATATTCGGCGTCC
+AAGCGGTTCCGACCGTGGTGGCCTTGGCTGCGGGACAGCCGATCTCGAGCTTCCAGGGCCTCCAGCCCGC
+GGACCAACTGAGTCGCTGGGTGGATTCCCTGTTGTCTGCGACAGCCGGAAAGCTCAAGGGCGCAGCGAGT
+TCCGAGGAGTCCACCGAAGTCGATCCAGCGGTGGCACAGGCGCGCCAGCAGCTCGAGGATGGCGACTTTG
+TTGCCGCGCGCAAGTCATATCAGGCGATTTTGGATGCCAACCCAGGAAGCGTCGAAGCCAAGGCGGCCAT
+CCGCCAGATCGAATTCCTCATCCGCGCAACCGCACAACGGCCCGACGCCGTCTCGGTCGCCGACAGCTTG
+TCGGATGACATCGACGCCGCGTTTGCGGCAGCCGACGTGCAAGTCCTCAACCAGGATGTGAGTGCGGCCT
+TCGAGCGCCTGATCGCGTTGGTGCGTCGGACATCTGGAGAAGAGCGCACCCGGGTGCGCACCCGGCTGAT
+CGAGCTGTTCGAGCTGTTCGACCCCGCCGATCCCGAGGTCGTGGCCGGTCGGCGCAACCTCGCCAACGCG
+CTGTACTGAGGCCGGCTGGCGAGCAGACGCAGAATCGCCTAAACCCGCACGGGTTTAGGCGATTCTGCGT
+CTGCTCGCGCTGGGCGGCTACGACAACCCGGGTGATCCGTTCAGGCCGAGCAGCCCGGCGGTGCCGCCGG
+CGCCACCCTTACCCGGCGCACTGCCGACTCCGCCGTTTCCGCCGTTGCCTCCATTGCCGATCAGGGTGGC
+GTTGCCGCCGGAGCCGCCGACACCGCCGTTTGCCACCACGCTTGCGCCGCCGGCGCCGCCGTCGCCGCCG
+TTGCCGACCATCCCGGCCTTGCCACCCTTGCCGCCGTTCCCCCCGTCGCCGGCGATGCCGAGTCCGCCGG
+CGCCGCCGGCGCCGCCATCGCCGTTGAGCAGGCCGGCGTTGCCGCCGGCCCCACCGTCGCCGGCGGTCTC
+GCCGAACCCGCCGGCTCCGCCGGCCCCGCCCGCACCCGAGAGCCCGGCGGCGTTGCCGCCGGCCCCGCCG
+GCCCCCCCGACCGACCCGAATTCGATGCCAGTCCCGCCGGCGCCACCAGCGCCGCCGTCACCGATCAACC
+CGCCGGTGCCGCCGGTGCCGCCGCTACCGGCCGCGCCCCGGACGCTGTCGCCGCCGGTACCGCCGGCGCC
+GCCGTCGCCGATCAGCTTGGCGGCCCCGCCGCTGCCACCGGACCCGCCGATGCCGCCGGCCATTTGGTCC
+GCACTGGAGGCGCCGAACCCTCCGGTGCCCCCGGCGCCGCCGGGACCGAACAGTGCGCCGGCACCGCCGA
+TGCCGCCGACGCCTCCTTTGCCGCCGGTGCCGCCGGGGTCGGGCGCGCCGAGACCGGTTCCGCCGGTGCC
+GCCAATGCCGCCAGCGCCGAAGAGGATGCCGGCGTTGCCGCCCGCCCCGCCGGCCCCGCCCTCACCGCCC
+ACGAGTTGGTTACCGGTGCCAGTTCCGCCGGCGCCGCCGGTCCCGCCGTTGCCGGTGAAGATGCCGCCGT
+CGCCTCCGGTGCCGCCGTTCCCTCCGGCCGAGCCGGAGACTCCGAACCCGCCGGCGCCGCCGGCACCGCC
+ATTGGAGAACAGCCCGCCGCCCCCGCCGGTGCCGCCGGTGCCACCGGTGCCCCCGTTGACGCTCAACCCG
+CCGGTGCCGCCGGCACCGCCGGCGGCCAACACCTCGAACAGCCCGCTGCGACCGCCGGCCCCGCCGGCGC
+CACCGTTGAAGCCTGGCCCGCCGGCCCCGCCGATGCCACCGGCTCCGAACAGCCCGGCCGCCCCGCCGTC
+GCCGCCGAGCCCGCCTGTGCCGGTGTTCCCGACTCCGCCGGGCCCACCGGCGCCGCCGGAGCCGAACAGC
+AGCCCGCCGGCCCCGCCGGCCCCGCCAGCCGCGCCGTTGCCCGGGCCGTCACCCCCGGCCCCACCCGCCC
+CGCCGTTGCCGAATAGCCCCGCGGCTCCACCTGGGCCGCCGGCCTGGCCGGGCGCCCCGGACCCGCCGGC
+CCCGCCGTTGCCGTACAGCAGCCCGCCGGCCCCGCCGGCTTGCCCGGTCCCCGGTGCGCCGTTGGCGCCG
+TTGCCGATCAGCGGACGCCCCAGCAACAGCTGGGTGGGCGTGTTCACAATGTTGAGCAGGCCCTCCAACG
+GCGCCGCGGCGGCGGCCTCAGCGCTCGCGTACGCGCCAGCGCCCGCAGTAAAGGTTTGAACGAACTGGGC
+ATGAAACGCCGACATCTGAGCGCTCACCGCCTGATAGGCCTGGCCATGCGCGGCGAACAGCGACGCGATG
+GCCGCCGACACCTCATCAGCACCGGCTGCCAGAAGTTCCGTCGTCGGGCCCAATGCCGCGGCGTTGGCGG
+CCCCCAGCGTCGACCCGATGTTCGCCAAATCCGAAGCGGCCCTCACCAGCGTCTCGGGAGCGGCGATTAC
+AAACGACATGCTTTCCTCCGATCAGCTGTGCGTCGAGTATCCAGCTCGAGTTAGCACAGGGTAGCGCTAT
+CGCTTAGCCTTTCTGATCAATCTCGGAGTGCAGTGTGCAGAGTGCATCGAATCGGCTCATCAGGCATGTG
+CAATCTGCTCATGGCAGGCGCTAGGCGGGCGTCAGCCACAGCGCCGAAGTGGGCGGCAGCACCAGCACCG
+CGGACGCCGGGCGGCCATGCCAGGGGTCGTCGGTGGCGTCCACGCCGCCGAGGTTGCCGATCCCTGAGCC
+GTGGTAGATCGTCGCGTCGGTATTGAGCACCTCGCGCCAGCGGCCCGCGCGCGGCAGCCCGAGTCGATAG
+TCACGGTGTTCGGCACCTGCGAAATTGAACACGCAGGCCAGCACCGAGCCGTCGCTGCCGTAGCGCATAA
+AGCTCAACACATTGTTGGCGGAGTCGTTGGCGTCGATCCAAGAATAGCCTTCGGGGGTGGTGTCTAAGCT
+CCACAGCGCCGGGTGGCATCGGTAGATGTCGTTGATGTCGCGCACCAGCCGCTGAATCCCGTTGGAGAAG
+CCGTTTTCGTCGAGTTGGAACCAGTCCAGGCCGCGCTGCTCGGACCATTCGGCGCGTTGGCCGAATTCCT
+GACCCATGAACAGCAATTGCTTGCCGGGGTGTGCCCATTGGTAGGCAAGCAGGCTACGCAGGCCGGCGGC
+CTTGACGTGATTGTTGCCCGGCATCCGCCCCCACAGCGTGCCTTTGCCGTGCACCACCTCGTCATGACTG
+AGCGGCAACACGTAATTTTCGCTGAACGCATACAGCATCGAGAACGTCATCTCGTGGTGGTGGTAGCTGC
+GGTACACCGGATCTCGGCTGACGTAGTCGAGCGTGTCGTGCATCCAGCCCATGTTCCACTTCATCGAAAA
+GCCCAGGCCGCCAATGTTGGTCGGGCGGGTCACCCCAGGCCACGACGTGGACTCCTCGGCGATGGTGACG
+ATTCCCGGCGCGACCTTGTGCGCCGTGGCGTTCATCTCCTGCAGGAACTGCACTGCTTCCAGGTTCTCCC
+GGCCGCCGTGGACGTTGGGGGTCCAGCCGCCCTCGGGTCGCGAGTAGTCTAGATAGAGCATTGAGGCCAC
+CGCGTCCACCCGCAGGCCGTCGATGTGGAACTCCTGTAGCCAGTACAACGCATTGGCTACCAGAAAGTTG
+CGCACTTCCGGGCGGCCGAAGTCGAACACGTATGTGCCCCAATCCAGTTGCTCGCCGCGTTTGGGATCGG
+AATGTTCGTAGAGCGGAGTGCCGTCGAACCGTCCCAGGGCCCACGCGTCCTTCGGGAAGTGCGCTGGGAC
+CCAATCCACGATGACGCCGATGCCGGCCTGGTGCAGGGCGTCGACCAGCGCCCGGAAGTCGTCGGGTGTG
+CCGAATCGTGATGTCGGCGCATAGTAGGACGTGACCTGATACCCCCATGATCCGGCGAATGGATGCTCGG
+CGACGGGCAACAGCTCCACATGGGTAAACCCTTGATCCACAATGTAATCCGTCAACTCACGAGCAAGCTG
+GCGGTAGCTGAGTCCAGGCCGCCACGAACCGAGATGGACTTCGTAGGTGCTCATCGCCTCGTTCACCGGG
+TTGCGCAGCGCACGCCCAGCCATCCAGTCGTCGTCACCCCAGGTGTAGTCACTCGACGTCACCCGCGATG
+CGGTCTGCGGCGGCACCTCGGTGCCGAACGCGAACGGGTCGGCCCGATCGGTAACCACGCCGTCGGCGCC
+GTGCACGCGGAACTTGTACAGACCGTCGCAAGGGAAGTCGGGCCAGAACAATTCCCATACCCCTGATGGG
+CCGAGCACCCGCATGGGGGCTTCGTGGCCATTCCAACCGTTGAACTCGCCGATCAAGCTGACGCCCTTGG
+CGTTGGGCGCCCACACGGCGAACGACACGCCACTCACCACACCGTCGGCCGTGGTAAACGAGCGGGGGTG
+GGCACCCAGGACTTCCCAAAGCCGTTCGTGGCGGCCCTCGGCGAACAGGTGCAGGTCGACCTCGCCCAGG
+GTGGGCAGGAATCGGTACGCATCGGCCACGGTGTGTGGCTCGCAACCTTCATAGGTCACCTGCAGGCGGT
+AGTCGATGAGGTCGACGAACGGCAATGCGACGGCAAACAGGCCAGAATCGAGGTGCTGCAACGAGAACCG
+GTCCTTACCAACGAGCGCGACGACCTCGACGGCATGCGGACGGAACGCTCGGATGACGGTATGGTCGCCG
+TATTCGTGGGCGCCCAGGATGCCGTGCGGGTTGTGATGTGTACCCGCCACCAAGCGCGCCATTTCGGCCG
+GCTCGGGTGCAAGGTGCTCCCCGGTGAGTTTCTCGGATCGACTCATGAGCCCGTCACCTCCTGCGCAGCA
+GCGTGTTTCGGCTCTCGTAGGGCACGGCTGGCATGTTGATGATGTGGGCGACTGCCCGTGCTGGGTCGAT
+GCGGATGTAATTGGCTTGCCCCCATTGGTATTCTTCGCCGGTTATCTCGTCGCGCACCCAAAACCGGTCG
+TAGTCCTCCATGCCCAACGCCGCCATGTCCAACCACAGCGTAGCTTCTTCAGGACCAAATGCGTTGAGTG
+TCACCACCACCAACACGCAGTCGCCGGTGGCCGGGTCGAACTTGCTGTAGGCCAGCAATGCGTCGTTGTC
+AACGTGGTGAAAATGAATGGTACGCAACTGTTGAAACGCCGGGTGCAGCCGGCGAATTATATTGAGCCGT
+GTGATGAACGGCTGCAAAGATCTACCCTGGTCCAGCGCGCTGGCAAAGTCGCGGGGACGCAATTCGTACT
+TCTCCGAGTCCAGGTACTCCTCGCTGCCCTCGCGCACCGCACGGTGCTCGAAAAGCTCATAACCGCAGTA
+CATCCCCCAGGCTGGGCTCATGGTGGCGGCCAGCACCGCGCGGATGGCGAACATGCCTGGACCGTTGTGC
+TGCAGCACCGCGTGCAGGATGTCCGGGGTGTTGACGAACAGGTTGGGCCGACGGTAGTCGGCGAGTTCGG
+CTATCTGGTTGCCGAATTCGGTGAGCTCCCACTTGGTCGTGCGCCAGGTGAAATAGCTGTAGGACTGCGT
+GAAGCCGAGCTTGGCCAGCCCGTACTGGCGGGCGGGCGGGGTGAAAGCCTCGGACAGGAACAGCACGTCG
+GGGTCGACGGTCTTCACCTGCGCGATCAGCCAGGCCCAGAAGTTGGGTGGTTTGGTGTGGGGATTGTCGA
+CGCGAAAGAACTTGACGCCGTGGTTAACCCAATGTTGCACCACGCGCAGCACTTCGTCGTACAGGCCCTC
+GGGATCGTTGTCGAAGTTGAGCGGATAGATGTCCTGGTACTTCTTCGGTGGATTCTCCGCGTAGGCGATG
+GTGCCGTCCGGCAGCTCGGTGAACCACTGCCGGTGTTCGCGGGCCCACGGATGATCCGGTGCGCATTGCA
+GCGCCAGGTCCAGCGCGACCTCCATGCCCAGATCGCGTGCCGCGGAGACGAAGTCGTCGAAGTCGTCGAT
+GGTGCCCAGGCTGGGATGAACGGTATCGTGACCGCCCTCATCGCTACCGATCGCCCACGGCGATCCCACG
+TCTGTCGGTGCGGCGGTGGGCGAGTTGTTGCGACCCTTGCGATGCACCTTGCCAATTGGATGGATCGGCG
+GCAGGTACACCACGTCGAACCCCATGCCGGCGATGCGCGGAAGTTCTGCCGCAGCGGTGGCGAAGGTGCC
+GTGTACCGGGTTGCCGTCGTCGTCCCACCCGCCGGTTGAGCGCGGAAACATCTCATACCAAGCGCCGAAC
+CGGGCCAACGGCCGATCCACCCAGACGCCGAATTGCTCGCCCCGGGTGACCAGGTCCCGCAGCGGATAGT
+CGGCCAGCAGCTCTTCGATTTCCGGTGTCAGGGCCAACGCGGTGCGGGTCACCGGGTCACCGGGGGTCCG
+CAGCGCTGCCGCGGCCGCCAGGAGGGGATCGCGTAACCCGCGCGGCACACCGGTCGCCGCGCGCTCCAAC
+AGCACCGCGCCTACCAACAGGTCGTTGGACAGCTCGGTCTCTCCCTGGCCGGCATCTAGCTTGGCTATCA
+GCCCATGGCGCCAGGTGTGGATCGGGTCACCCCAACCATCCACCCGGAAGGTCCACAATCCGACCCGGTC
+GGGGGTGAACTGGCCGTGGAAAACGAAGGGCTCCTGGCCGCTCGTCATCGGGATCAGCAGCGGCTTGACG
+CGTTGTTGGGGCTCGCTCGGCGTCGGAAGCACCCTGGCCCGGGGTCTGTCGGTGAGGTGTGGGTAACGCA
+CTCCGAGGTAGCGCACGACCAGCGTCGCTGCGACGGCCTCGTGGCCTTCACGCCAGACCGCCGCGCTGAC
+CGGGACCACCTCGCCGACCACCGCCTTGGCGGGATATACGCCGCACGAAACGACGGGCGCGACGTCATCG
+ATTTCGACACGACCGGGCACCCACCACTCCGTTTCCGTTCCGATTGCCCGGCCACTCACCGGGACATCTT
+GTATGTGTCGTTCCTTGTGTGTCCTTCTTGCGCCCGATACCCACCCTAGTATCCGATCACACCCGCGAAG
+GCACAGCGGTCGGCGGGCGCACTGCACGCGGTGGCATCCTCAGTAAGGTAAGGACGCGTGAAAGCCCTTC
+GCCGGTTTACCGTCCGAGCCCACCTACCCGAACGTCTTGCCGCCCTGGACCAGCTGTCTACCAATCTGCG
+GTGGTCCTGGGACAAACCGACACAGGATCTGTTCGCGGCGATCGACCCTGCACTGTGGGAGCAATGCGGT
+CATGATCCGGTGGCGCTGCTGGGCGCGGTGAACCCAGCGCGTCTCGACGAACTTGCGCTGGACGCAGAAT
+TTTTGGGCGCCCTCGATGAGCTGGCGGCCGACTTGAACGACTACCTGAGCCGTCCGCTGTGGTATCAGGA
+GCAGCAGGACGCCGGGGTAGCCGCACAAGCCCTGCCGACCGGGATCGCGTACTTCTCGCTGGAGTTCGGG
+GTAGCCGAGGTGTTGCCTAATTACTCGGGCGGTCTTGGGATTCTCGCCGGCGACCATCTGAAATCCGCGT
+CCGATCTGGGCGTGCCGCTGATCGCGGTGGGGTTGTACTACCGCTCCGGCTACTTCCGGCAATCGCTTAC
+CGCGGACGGCTGGCAGCACGAGACCTACCCATCGCTGGACCCGCAAGGGCTGCCGTTGCGTCTGCTCACC
+GACGCCAACGGGGATCCAGTGCTGGTCGAGGTCGCCCTGGGAGACAACGCCGTGTTGCGCGCCCGGATCT
+GGGTAGCGCAGGTGGGTAGGGTTCCGTTGCTCTTGTTGGATTCTGATATCCCGGAGAACGAGCACGACCT
+GCGCAACGTCACCGACCGCCTCTACGGTGGCGACCAGGAACATCGCATCAAACAAGAGATCCTGGCCGGC
+ATCGGCGGGGTGCGGGCGATTCGTGCGTACACCGCCGTCGAAAAGCTCACCCCGCCTGAGGTCTTCCACA
+TGAACGAGGGCCACGCCGGATTCCTCGGCATCGAACGCATCCGTGAACTGGTCACCGATGCGGGTTTGGA
+TTTCGACACCGCATTGACTGTGGTGCGGTCCAGCACGGTGTTCACCACTCATACTCCCGTCCCCGCCGGG
+ATCGACCGGTTCCCGCTCGAGATGGTGCAGCGCTACGTCAATGACCAGCGCGGCGATGGCCGGTCTCGGC
+TGTTGCCTGGGTTGCCGGCCGACCGCATCGTCGCGTTGGGCGCCGAGGACGATCCGGCCAAATTCAACAT
+GGCACACATGGGCCTGCGGCTGGCGCAGCGGGCCAACGGCGTCTCGTTGCTGCATGGCCGGGTCAGTCGT
+GCCATGTTCAACGAGCTGTGGGCGGGATTCGACCCCGATGAGGTGCCGATCGGCTCCGTCACCAACGGTG
+TGCACGCGCCCACCTGGGCGGCGCCGCAGTGGTTGCAGCTGGGCCGCGAGCTGGCCGGGTCGGACTCTTT
+GCGCGAGCCCGTCGTTTGGCAGCGACTGCATCAGGTCGATCCTGCTCATCTGTGGTGGATCCGCTCACAA
+CTGCGGTCGATGCTGGTGGAGGACGTCCGGGCGCGGTTGCGGCAATCATGGCTGGAACGTGGTGCAACGG
+ATGCCGAACTGGGTTGGATCGCGACGGCATTCGATCCGAATGTGCTCACCGTCGGCTTCGCCCGGCGGGT
+CCCGACCTACAAGCGGCTGACGTTGATGTTGCGCGATCCCGGTCGGCTCGAGCAACTGCTGCTCGACGAA
+CAGCGGCCGATCCAGCTGATAGTGGCTGGGAAGTCGCACCCGGCCGACGACGGGGGCAAAGCGCTGATCC
+AGCAGGTGGTGCGGTTCGCCGACCGGCCGCAGTTCCGCCACCGCATCGCCTTCCTGCCGAACTACGACAT
+GTCGATGGCCCGGCTGTTGTACTGGGGCTGCGACGTCTGGTTGAACAACCCGCTGCGGCCGCTAGAGGCG
+TGTGGTACCTCGGGCATGAAAAGCGCGCTTAACGGCGGGCTGAATTTGTCGATCCGTGACGGCTGGTGGG
+ACGAGTGGTACGACGGCGAAAACGGTTGGGAGATACCGTCTGCCGACGGTGTGGCGGACGAGAACCGTCG
+CGACGACCTGGAGGCCGGCGCGCTCTACGACCTGCTGGCACAAGCCGTGGCACCGAAGTTCTACGAGCGC
+GATGAACGCGGGGTGCCGCAGCGGTGGGTAGAGATGGTCCGGCATACCCTACAAACGCTCGGGCCCAAGG
+TGCTGGCTTCTCGAATGGTGCGCGACTACGTCGAGCATTACTACGCGCCGGCGGCGCAGTCTTTTCGCCG
+GACCGCGGGCGCCCAGTTCGACGCGGCCCGCGAGCTGGCCGACTACCGCCGGCGCGCGGAAGAAGCGTGG
+CCCAAGATCGAGATTGCCGACGTCGACAGCACCGGTCTGCCGGATACTCCACTGCTCGGGTCCCAGCTGA
+CCCTGACGGCAACCGTGCGGCTGGCCGGGCTGAGGCCAAACGACGTGACGGTGCAGGGGGTGCTGGGCAG
+GGTCGACTCCGGCGATGTGCTAATGGATCCGGTCACCGTCGAGATGGCGCATACCGGCACCGGCGACGGC
+GGCTACGAGATCTTCTCGACGACGACGCCGCTGCCGCTGGCGGGGCCAGTCGGATACACCGTGCGGGTGC
+TGCCTCGCCACCCGATGCTGGCCGCCAGCAACGAGCTCGGCCTGGTCACCCTGGCCTGACCCGCCGAGAA
+GACGCAAAAGCTCCTAAATCTGGCCGATTTAGTGGGCTTTTGCGTCTGCTCGCGCAAGGCGCCGCAGGGC
+CGCGCGCACTTGCGTGGCGTTGGTGGTCTGCCAAAAGGGCGGCAGCGAGGCTCGCAGGAATTCGCCATAG
+CGGGCGGTAGCCATCCGTGAATCGAGCACCGCAACCACGCCCCGATCGGTGACGCGCCGTAACAGCCGGC
+CGGATCCCTGTGCCAGCAGCAGCGCCGCGTGGCTGGCGGCGACCGTCATGAAGCCGTTGCCGCCACGGGC
+GGCCACCGCACGCTGGCGGGCACTCAGCAGGGGATCGTCCGGCCGGGGGAACGGGATGCGGTCGATCAAC
+ACCAACGACAGCGACGGTCCCGGCACGTCGACCCCCTGCCACAGCGACAGCGTGCCGAACAGGGAGGTCG
+CCGCATCGGCGGTGAACTTCTCCACCAGCGTGGACGTACTGTCGTCGCCCTGACACAACACCGGCGTGGA
+CAGCCGTTCGCGCATGGCCTCGGTGGCTGCCCGGGCGGCCCGCATGGACGAGAACAGCCCCAGGGTGCGC
+CCACCTGCAGCGGTGATGAGTTCGGCGATCTCGGTCAGTTGTTCGGCCGAGCCGCTGCCGTCTCGGCCCG
+GCGGCGGGAGATGGGCGGCCACGTAGAGGATTCCCGACTTTGCGTGCTGGAAAGGCGAGCCCACGTCCAG
+GCCACGCCAGGGCGTGTCTGCAGTCAGGCCCCATGCCGTGGCCATCGCGTCAAACGACCCGCCGATTGTC
+AGCGTTGCCGAGGTCAATACGGTCGTTGCACGGGCGAACACCTGGGTGGCCAACAGCTCGGCCACCGATA
+GCGGAGCCACCCGCAGCACCGCGCGAGCCGATTCGTGGTTGTCCTCGTGCTCCAGCCAAACCACGTCGCT
+GCGGTCAGGGATAGCGGGGGCGAACGACGCCAGGATTCGTGACGCGGTATCGGATATTTCGGTCAGTACC
+GCGCCCGCTTCGGCGCGCACGGACGCCGTCGTGGTGTCGCTGCCGGTATCGATCGCTGAGCGCGCCGCAC
+TGGCCGCATCGCGCAGCGCGCTCAGATAGGTCGCCATCTCGTCATCGAGGCAATCAATGCGGCCCGGTCT
+GGCGTCGTGAATCGCCGAACTGAAGGTAGCCGAAGCCGCCTGAAGCCGCTGGGTCACTTTCGGGTCGACC
+AGCCGGGTGATCCGTCGTGCGGCCATACCGAGCGTGGCAGACGTCAGCTCAGCGGCGGCTACCGAGGTCA
+CCCGGTCGGCCAATTCGTGAGCCTCGTCGACAACCAGCAGCCGATGTTCTGGCAGTACCGCCGATTCGGC
+GACGGCATCGATGGCCAGCAGCGCGTGGTTGGTGACGACGACATCGGCCAGGCCGGCCGCTCCACGAGCC
+CGTTCGGAGAAGCACTCCGAGCCAAACGGGCAGCGGGCCACGCCGAGGCATTCCCGCGCCGAAACGCTGA
+CCTGCGACCAGGATCGGTCTCCCACACCGGGCTTAAGGTCGTCGCGATCACCAGACACGGTCGTCGAAGC
+CCAGGCGGTTAGCCGTTGCACATCGCGTCCCAGCGCGGTGACCGCCACCGGGTCGAAGAGCTCCTCCTGC
+GGCCGCTCGTCGTCATGGTCACTGGCTGTGACTGAGTTGTGGATCTTGTTCAGGCACAGGTAGTTCCGTC
+GACCTTTGAGCAGGGCGAACTTCGGTCGGCGGGGGAGCGCATTGGTGAGCGAATCTACCAGCTGGGGCAG
+GTCACGATCGACGAGTTGACGTTGCAAAGCGATCGTCGCCGTCGACACCACGACCGGCGCGTCGTCGCAA
+AGAGCGCGGATGATCGCGGGAACCAGATACGCCAGCGACTTGCCGGTTCCGGTGCCGGCCTGGACCACCA
+AGTGCTCACCGGTTTCAAACGCATGCGCTACCGCGGCGGCCATCTCTTGCTGGCCGCGACGCCGGGTGCC
+GCCAAGTGCCGCCACGGCGATGGCAAGCAGCTCAGGCACAGACATGGATACCGACTCGGACACGGGACGT
+GGTCACATCCTTGCGCTCAGGCCGGGATCGTGCGTGTCGGAATCGCCGGCTCGCCGGGTGCCAATTTCAG
+CCCGTCGGCTGGCAGGCTGCGCAATCCGGATGCCACCAGCTGCCGTGCCGCGGCCAGGCTGGTATCGGCT
+ACCGGTTGCCCGGCGCGGACCAGTGGCAGCGTCAAAACCCGGTGCGGCTCGACAATGACCGGCGGACGGC
+CCGCCGGATGCACGAGCTCCTCGGTGATGGTGCCCGTCGCACGGGAGCGCCGCAGTGCCTCTTTGCGGCC
+GCCGGGGGATTTTTTGTAGCTGCTGCGCTTTTGCACCGGTACACCGTCTACCTCGACCAGTTTGTAGACC
+ATGTTGGCGGTCGGCGCGCCCGACCCGGTGACCAGCGACGTGCCCACGCCGTAGCTGTCGACGGGTTCAC
+CGCGCAACGCGGCGATGCTGAACTCGTCAAGGTCGCCGGACACCACGATGCGCGTCCGGGTGGCTCCTAG
+CCGGTCGAGCTGCTCCCGCGCTTGGCGGGCCAGTACCCCAAGCTCACCGGAATCGATGCGGATCGCGCCG
+AGCTCAGCGCCGGCGGCGGCAACGGCATTGGCCACACCGGTCGTGACGTCATAGGTATCCACCAGCAGCG
+TGGTACCGGGTCCCAGCGCTTCGACCTGGGCGCGGAATGCGGCTCGCTCGGCTAGTTCGGTGGGGCCGCC
+ATGCTGGGCGTGCAACATGGTGAATGCGTGTGCCGCGGTGCCGTGCGCGGGCACTCCGTAGCGTCGCTGC
+GCCGCCAAGTTGGATGACGCGGCGAAACCGGCGATATACGCCGCCCGGGCCGCTGCCACCGCGGCGCGTT
+CGTGGGTGCGCCGCGAGCCCATCTCGATCAGTGGGCGCCCCCCGGCGGCGCTGACCATGCGCGCCGCTGC
+CGAGGCGATCGCTGTGTCGTGGTTGAAGATTGACAGCACCAGCGTTTCGAGCAGGACGCATTCGGCGAAG
+CTGCCGCGTACCGAGAGCACCGGTGACCCGGGAAAATACAGCTCCCCCTCGGCATAGCCGTCGATATCGC
+CGCGGAACCGGAATTCGCGAAGATACCGCACCGTGGCCGGGTCGAGGAATTGGGCCAGCAACTCGCACGC
+GTCAGCGTCGAACCTGAACTGCGGCAACGCTTCCAGCAACCGGCCGGTTCCGGCGACAACTCCGTAGCGA
+CGGCCGGTGGGGAGTCGGCGAGCGAACACCTCGAATGTGGTGGGGCGATTGGCGCTGCCGTCGCGCAGGG
+CAGCCGCCAGCATGGTCAACTCGTACTTGTCGGTCAACAGCCCGGCTGGGTCTTGATTGTCGGGCTCTCC
+CTCTCGCCGCCTGGCGGCTGGGGGTGGCCCCACAGCGGTCCGACGCGGTCCGCAGCGTCGCCCGGTTGGG
+ACCCAGTCGTTCACACCGCCACGGTATCGGCTCGCGGCCACGGTGCGCTGGGTATCCTGGGGCCATGGCT
+GTTGTGTCAGCGCCCGCCAAGCCAGGTACCACCTGGCAGCGCGAGTCTGCTCCGGTCGACGTGACGGACA
+GGGCATGGGTCACCATCGTGTGGGACGACCCGGTCAACTTGATGAGCTACGTGACTTACGTGTTTCAGAA
+GTTGTTCGGCTACAGCGAGCCGCATGCCACCAAGCTGATGTTGCAGGTGCACAACGAAGGTAAGGCGGTG
+GTGTCCGCGGGCAGCCGAGAGTCCATGGAAGTCGACGTGTCCAAGCTGCATGCCGCCGGTTTGTGGGCGA
+CGATGCAGCAGGACCGGTGAGATTCGAGGATATTCGGGATCCATCGTGCGCAGGTGGAAGCGCGTCGAGA
+CCCGCGATGGTCCCCGCTTTCGATCGTCGTTGGCTCCGCATGAGGCCGCCCTGCTCAAGAACCTGGCAGG
+CGCGATGATCGGGCTGCTCGACGATCGCGACTCTTCTTCGCCGTCAGACGAACTCGAGGAGATCACCGGC
+ATCAAGACCGGGCATGCGCAGCGTCCGGGTGACCCGACCTTGCGTCGGCTGTTGCCGGATTTCTACCGGC
+CCGATGACCTGGATGACGATGATCCGACGGCCGTCGACGGCTCCGAGAGCTTCAACGCTGCCCTGCGCAG
+CCTGCACGAACCTGAGATTATCGACGCCAAACGTGTTGCCGCGCAGCAGTTATTAGACACGGTTCCGGAC
+AATGGCGGCCGGTTGGAGCTGACGGAATCCGACGCCAATGCTTGGATCGCCGCCGTCAACGACCTTCGGC
+TGGCGCTCGGAGTGATGCTTGAGATCGGCCCGCGTGGGCCGGAGCGCCTGCCGGGGAACCACCCGTTGGC
+CGCGCACTTCAATGTCTACCAGTGGCTGACAGTCCTGCAGGAATACCTCGTGCTGGTGCTGATGGGGTCT
+CGATGATCTGCGCGGCGGCCCGATGAACTCCATCACCGACGTCGGGGGCATCCGGGTTGGCCACTACCAG
+AGACTGGACCCCGACGCGTCCCTCGGCGCCGGGTGGGCTTGTGGCGTCACGGTGGTGTTGCCGCCGCCCG
+GGACGGTCGGTGCGGTCGATTGCCGCGGCGGCGCCCCTGGAACCCGCGAGACTGATCTGCTGGACCCGGC
+CAACAGCGTGCGCTTCGTCGACGCCCTGTTGCTCGCCGGCGGCAGCGCCTACGGTCTGGCCGCCGCCGAT
+GGCGTCATGCGCTGGCTAGAGGAACACCGGCGCGGCGTCGCGATGGACAGCGGCGTGGTGCCCATCGTGC
+CGGGCGCGGTGATTTTCGACCTTCCGGTCGGCGGCTGGAATTGTCGGCCGACAGCCGATTTCGGCTATTC
+GGCCTGTGCGGCAGCCGGAGTCGACGTCGCGGTCGGGACGGTGGGCGTGGGGGTTGGGGCGCGCGCCGGA
+GCGCTCAAGGGCGGTGTCGGGACTGCATCGGCTACCCTGCAGTCCGGTGTGACCGTCGGTGTCCTTGCTG
+TGGTAAATGCCGCTGGCAACGTCGTCGATCCAGCCACCGGCTTGCCGTGGATGGCCGACCTAGTCGGCGA
+GTTCGCGTTGAGGGCCCCGCCGGCCGAGCAGATTGCTGCGCTGGCGCAGTTATCGTCCCCGCTGGGAGCC
+TTCAACACCCCGTTCAATACGACGATCGGTGTGATTGCGTGTGACGCCGCGCTGAGCCCTGCGGCTTGCC
+GGCGCATCGCGATTGCCGCCCACGACGGGTTGGCCCGCACCATCCGGCCGGCACACACCCCCTTGGATGG
+CGACACGGTTTTCGCGCTGGCCACCGGCGCGGTAGCGGTGCCGCCGGAGGCCGGCGTGCCGGCCGCATTG
+TCTCCGGAGACTCAGCTGGTCACCGCGGTCGGTGCGGCGGCGGCTGATTGCCTGGCTCGTGCGGTGCTGG
+CCGGCGTGCTCAATGCTCAGCCGGTAGCCGGAATACCGACCTACCGTGACATGTTTCCCGGAGCATTCGG
+GTCCTGAAACTTCGGTGTTGCTTAGGAAAGGAACCGTCTACGTGCTGGTGATTCGCGCAGACCTGGTGAA
+TGCGATGGTGGCCCATGCGCGTCGCGACCACCCCGACGAAGCCTGCGGAGTGCTGGCCGGACCCGAGGGC
+TCTGACCGTCCCGAGCGGCATATCCCGATGACCAATGCCGAGCGCTCGCCGACCTTCTACCGGTTGGATT
+CCGGTGAGCAACTGAAGGTGTGGCGGGCTATGGAAGATGCCGACGAGGTCCCGGTCGTCATCTATCACTC
+GCACACTGCGACCGAAGCGTACCCGAGCCGTACGGACGTGAAGCTTGCCACCGAACCCGACGCGCACTAC
+GTGCTGGTGTCCACCCGCGACCCGCACCGGCACGAGCTACGCAGCTACCGCATCGTCGATGGCGCTGTCA
+CCGAGGAACCTGTCAATGTCGTCGAGCAGTACTGAACCGTTCCGAGAAAGGCCAGCATGAACGTCACCGT
+ATCCATTCCGACCATCCTGCGGCCCCACACCGGCGGCCAGAAGAGTGTCTCGGCCAGCGGCGATACCTTG
+GGTGCCGTCATCAGCGACCTGGAGGCCAACTATTCGGGCATTTCCGAGCGCCTGATGGACCCGTCTTCCC
+CAGGTAAGTTGCACCGCTTCGTGAACATCTACGTCAACGACGAGGACGTGCGGTTCTCCGGCGGCTTGGC
+CACCGCGATCGCTGACGGTGACTCGGTCACCATCCTCCCCGCCGTGGCCGGTGGGTGAGCGGAGCACATG
+ACACGATACGACTCGCTGTTGCAGGCCTTGGGCAACACGCCGCTGGTTGGCCTGCAGCGATTGTCGCCAC
+GCTGGGATGACGGGCGAGACGGACCGCACGTGCGGCTGTGGGCCAAGCTCGAGGACCGCAATCCGACCGG
+GTCGATCAAGGACCGCCCGGCTGTGCGGATGATCGAGCAGGCCGAGGCCGACGGGTTGTTGCGGCCGGGC
+GCCACCATCCTGGAGCCCACCAGCGGAAACACCGGCATTTCGCTGGCGATGGCGGCCCGGTTGAAGGGGT
+ACCGATTGATCTGCGTGATGCCGGAGAACACATCGGTTGAACGGCGGCAGCTGCTCGAGCTCTACGGCGC
+GCAGATTATCTTCTCGGCGGCCGAAGGCGGGTCCAACACTGCGGTGGCCACCGCCAAAGAGCTGGCCGCG
+ACCAACCCGTCATGGGTGATGCTGTACCAGTACGGCAATCCCGCCAACACCGACTCGCACTACTGCGGCA
+CCGGCCCCGAGCTGCTGGCCGACCTGCCCGAAATCACGCACTTCGTCGCCGGCCTAGGCACCACGGGCAC
+GCTGATGGGCACTGGCCGTTTCCTGCGCGAGCACGTTGCCAACGTCAAGATCGTGGCGGCCGAACCCCGC
+TACGGTGAGGGGGTATACGCCCTGCGCAACATGGACGAAGGCTTTGTGCCCGAGCTGTATGACCCGGAAA
+TACTGACCGCGCGATATTCTGTCGGCGCGGTGGACGCAGTGCGCCGCACCCGCGAGTTGGTGCACACCGA
+AGGCATCTTTGCGGGCATCTCAACCGGCGCGGTGCTACACGCCGCACTCGGAGTCGGGGCCGGCGCCCTG
+GCGGCCGGCGAGCGGGCCGACATTGCGTTGGTGGTCGCCGACGCCGGGTGGAAGTATCTGTCCACCGGCG
+CCTACGCCGGTAGCCTGGATGACGCCGAGACCGCTCTGGAAGGGCAACTATGGGCATGACCCCGCGCCGG
+AAGCGACGGGGAGGAGCGGTGCAGATAACACGGCCCACAGGCCGTCCGCGAACACCGACAACGCAGACGA
+CGAAGCGCCCGCGCTGGGTGGTCGGCGGGACGACGATCCTCACCTTCGTCGCGCTGCTCTATCTCGTCGA
+ACTGATCGACCAGCTGTCCGGGAGTCGGCTGGACGTCAACGGCATCAGGCCGCTGAAAACAGACGGCCTG
+TGGGGCGTCATCTTTGCGCCACTTTTGCACGCGAACTGGCACCACCTAATGGCCAATACCATCCCGCTGC
+TGGTGCTGGGGTTTCTTATGACGCTGGCCGGGCTGTCCCGGTTTGTCTGGGCCACCGCGATCATTTGGAT
+TCTGGGCGGCTTGGGCACTTGGCTGATCGGCAATGTGGGCAGCAGCTGTGGCCCGACCGACCATATCGGC
+GCCTCTGGCCTGATCTTTGGCTGGCTGGCCTTCCTATTGGTGTTCGGGCTTTTTGTGCGCAAGGGATGGG
+ATATCGTCATTGGGCTGGTGGTCTTGTTTGTCTATGGCGGCATCCTGCTCGGCGCGATGCCGGTGCTGGG
+CCAGTGTGGTGGCGTGTCATGGCAGGGTCATTTAAGTGGTGCGGTTGCTGGCGTCGTGGCGGCGTATCTG
+TTGTCCGCTCCGGAGCGTAAGGCCCGTGCACTGAAAAGGGCCGGCGCGCGTTCCGGGCATCCGAAGTTAT
+GAATTCGCCGTTGGCGCCCGTCGGAGTCTTTGATTCCGGCGTCGGGGGACTGACGGTCGCGCGGGCCATC
+ATCGACCAACTGCCCGACGAGGACATCGTCTACGTCGGCGACACCGGCAACGGCCCGTACGGTCCGCTGA
+CCATCCCGGAGATCCGGGCGCACGCGCTGGCCATCGGCGACGATCTGGTCGGCCGAGGCGTCAAGGCGTT
+GGTGATCGCCTGCAACTCGGCGTCGTCGGCGTGCCTGCGGGATGCTCGCGAGCGCTACCAGGTGCCCGTC
+GTCGAAGTGATACTGCCGGCGGTGCGGCGTGCGGTGGCCGCCACCCGCAACGGCCGCATCGGGGTAATCG
+GCACGCGGGCGACCATCACTTCACACGCCTATCAGGACGCGTTCGCTGCGGCCCGCGACACCGAAATCAC
+CGCGGTGGCTTGCCCTCGCTTCGTGGACTTCGTCGAGCGCGGCGTCACCAGCGGTCGTCAGGTGCTCGGT
+CTGGCGCAGGGCTACCTGGAACCGCTGCAGCGCGCCGAGGTCGACACGCTAGTGCTGGGCTGTACGCACT
+ATCCACTGCTGTCCGGACTGATTCAACTGGCGATGGGCGAGAACGTCACGCTGGTCTCCAGCGCCGAGGA
+GACCGCTAAGGAAGTGGTCCGGGTGCTCACCGAGATCGACTTATTGCGTCCGCATGACGCGCCGCCGGCA
+ACTCGGATATTTGAAGCTACGGGCGACCCCGAAGCGTTTACCAAATTGGCCGCACGATTCCTGGGTCCGG
+TGCTCGGTGGTGTGCAACCCGTTCACCCATCGCGCATTCATTAGGCCATGGAAGAGATTCTCGTCACCGA
+ATGCGTCGATGTATTCCGCATCGTTGTATCGGGCATGGCACAGTAGTGTCCGTGCGAATAACCGTGCTCG
+GATGCTCCGGTAGCGTCGTGGGGCCGGATTCGCCTGCGTCGGGGTATTTGCTCCGAGCGCCGCACACACC
+GCCGTTGGTTATCGACTTCGGCGGGGGTGTGCTCGGCGCGCTGCAACGGCACGCGGATCCCGCGTCGGTG
+CATGTGCTGCTGTCGCATCTGCATGCGGACCATTGTCTGGACTTGCCGGGACTTTTTGTGTGGCGGCGTT
+ACCACCCGTCGCGTCCCTCTGGCAAGGCATTGTTGTACGGCCCCAGCGACACCTGGTCGCGATTGGGGGC
+GGCGTCGTCCCCGTACGGTGGGGAGATTGACGACTGTTCGGATATCTTCGATGTTCACCACTGGGCCGAC
+AGTGAGCCAGTGACGTTGGGCGCCCTTACGATAGTGCCGCGGCTGGTTGCCCACCCGACTGAGTCGTTTG
+GCCTGCGGATCACCGATCCGAGCGGTGCGTCACTGGCTTATAGCGGCGACACCGGCATTTGTGACCAGCT
+CGTCGAGCTGGCTCGCGGCGTCGACGTTTTCCTCTGCGAGGCCTCCTGGACACACTCGCCCAAACATCCA
+CCCGATCTACACCTGTCGGGCACCGAAGCCGGTATGGTTGCCGCGCAAGCCGGCGTTCGTGAGCTGCTGC
+TGACGCATATCCCGCCGTGGACTTCGCGTGAGGACGTCATCAGCGAGGCCAAGGCCGAGTTCGACGGCCC
+GGTGCACGCGGTGGTATGCGACGAGACGTTCGAAGTCCGGCGAGCCGGCTAGGTCTAGGGTTGGCGTCGT
+GTCCAAGCGAGAAGACGGCCGGCTCGACCACGAGCTTCGCCCGGTGATCATCACCCGCGGTTTCACCGAA
+AACCCGGCGGGATCGGTGCTCATCGAATTCGGTCACACCAAGGTCCTGTGCACCGCCAGCGTCACCGAAG
+GGGTGCCCCGGTGGCGTAAAGCAACCGGTCTGGGGTGGCTCACCGCGGAGTACGCCATGCTGCCGTCGGC
+CACCCACAGCCGCTCTGATCGCGAGTCGGTGAGAGGCAGGCTTAGCGGGCGTACTCAGGAAATCAGTCGG
+CTCATCAGCCGGTCGCTGCGCGCATGCATCGACCTGGCGGCGCTGGGGGAGAACACGATCGCTATCGATT
+GTGATGTGTTGCAGGCCGATGGTGGCACTCGAACCGCGGCCATCACCGGCGCCTACGTGGCATTGGCCGA
+CGCAGTGACCTACTTGTCGGCGGCGGGTAAGTTGTCCGACCCCAGGCCATTGTCGTGTGCCATCGCCGCG
+GTCAGCGTCGGTGTTGTCGACGGCAGGATCCGGGTGGATCTGCCCTACGAGGAAGATTCGCGCGCCGAGG
+TCGACATGAACGTCGTCGCTACCGACACCGGAACCCTGGTAGAGATTCAGGGCACCGGCGAAGGCGCGAC
+GTTCGCACGTTCGACACTGGATAAGCTGCTGGACATGGCACTGGGCGCCTGCGACACGTTGTTTGCCGCA
+CAACGCGACGCGTTGGCGCTGCCGTATCCGGGTGTGCTGCCGCAGGGACCGCCACCGCCGAAGGCGTTTG
+GCACCTGACCGCGCCGCGACGATGCAGAGCGGAGCGATGAGGAGGAGTGGCGCTTGTGACCAAGCTTCTG
+GTCGCCAGCCGCAACCGCAAAAAGCTGGCCGAACTGCGCCGGGTGTTGGACGGCGCCGGACTATCGGGTT
+TGACGCTGTTGTCGCTGGGCGATGTGTCGCCGCTGCCTGAAACACCAGAAACCGGTGTGACATTCGAGGA
+CAACGCGCTGGCCAAGGCGCGCGACGCGTTCTCCGCGACCGGACTTGCCAGCGTTGCCGACGACTCCGGT
+TTGGAGGTGGCCGCACTGGGCGGCATGCCTGGCGTGCTGTCGGCCCGGTGGTCCGGCAGGTATGGCGACG
+ATGCCGCGAACACCGCGCTGTTGCTGGCGCAGTTGTGCGATGTGCCCGATGAGCGGCGCGGAGCAGCGTT
+CGTGTCGGCCTGCGCGTTGGTCTCGGGGTCCGGCGAAGTTGTCGTGCGCGGTGAATGGCCCGGCACGATC
+GCCCGTGAGCCGCGCGGTGACGGCGGGTTCGGCTACGACCCGGTCTTCGTCCCGTACGGTGACGACCGCA
+CAGCGGCCCAGCTGAGCCCGGCGGAAAAGGACGCGGTATCCCATCGCGGTCGCGCGTTGGCTCTGCTGCT
+GCCGGCGCTGCGCTCCCTGGCGACAGGCTAAAGCCCGAAGCGGGCCTTGATCTCTTTGGTCTGGAAGTGC
+TCGACGACGATGCCGAGCAGCGGAATTGTGCCGGCGAGCAGAACACCGGCTGTTTTGCCGAGCGGCCAGC
+GGACCTTGACCGCCAGGTTCAACGTCAGAAGCAGATACGTGAAGTACACCCAGCCGTGCACCACACCGAT
+CCACGTCGGCGGATTGTCAACCTTGACGACGTAGCGGACCACGATCTCGTAGCACAGTGCGATGAGCCAG
+AGGCCCGTCGTCCACGCCATGATCCGGTAGCCGAGCAAAGCGGTGCGAATCCTCTCGACGGCGATGGCAG
+GCTCGGCGTGCTGCGCCGCGGGCGTTTCGGGTGCGGTCATGCGGTGGTCCTGTTCTGCTTCCTGGCATCG
+TCCTTGGCTAGCTCGGCTAGGTAGGCGTTGTATTCCCGTAGTACGGGATCGTCGGGTGGCTGCTGCGCCG
+GCTTCGGCCGCTCGGGCAGCAATCCGGCAGGTATCGCGGCGGCGGCGCCGCCGGTGGGCGGTTGCGGGGG
+CGTCTCTTCATACCGAACGAAGTTGCGGTACGCGTAGACGCAGAACCAAGCAAACAATGGCCACTGCAAC
+GCGTAACCCAGATTTTGAAAGGTGCCCGAGGTCGATTGAAACCTGGTCCACTGCCACCAACCCAGGGCCA
+GGCAACCACAGGTCGCGATGATCACCAACGCGATCAGCGCGGGTCTGCGACGGCGGGTAGTGGACACCCC
+ACGACGTTACCGCGCACTGCTCTATTGGGCGCCCGGGCGCGATGTGGCGATATCCACTAAGTACAAGGCT
+AGCCTTGCCTAATACCCCAGGTGTAGCCTCCTTCGCCATGACCTCATCGCCGTCCACCGTCAGCACTACG
+CTGCTGAGCATCCTGCGCGACGACCTCAACATTGACCTGACTCGAGTCACGCCTGATGCCAGGTTGGTCG
+ACGATGTGGGACTGGATTCGGTGGCCTTCGCGGTCGGTATGGTGGCCATCGAGGAGCGGCTCGGAGTCGC
+ACTGTCCGAAGAGGAGCTCTTGACGTGCGACACGGTCGGAGAACTGGAGGCAGCGATCGCGGCCAAATAC
+CGCGATGAGTGAGCTCGCGGCCGTGCTCACGCGGTCCATGCAGGCCTCTGCCGGCGACTTGATGGTCCTC
+GACCGCGAGACCTCGCTGTGGTGTCGGCACCCGTGGCCCGAGGTACACGGGCTGGCCGAGAGCGTAGCGG
+CCTGGCTGCTAGACCATGACCGACCCGCCGCGGTGGGTCTGGTCGGCGAACCGACGGTCGAGTTGGTCGC
+CGCGATCCAGGGTGCCTGGCTTGCCGGCGCTGCCGTGTCGATCCTGCCCGGGCCGGTACGTGGCGCCAAT
+GACCAGCGATGGGCGGACGCGACGTTGACCCGTTTCCTCGGGATTGGGGTGCGCACCGTATTGAGCCAGG
+GTTCCTACCTTGCCCGCCTGCGATCGGTCGATACGGCCGGCGTAACGATCGGAGATCTCAGCACGGCGGC
+GCACACCAATCGTTCGGCCACACCGGTGGCGAGTGAAGGGCCCGCGGTCCTTCAAGGTACCGCGGGATCG
+ACGGGCGCGCCCCGTACCGCCATCCTTTCGCCGGGCGCGGTGCTCAGCAACTTGCGTGGGCTCAATCAGC
+GCGTGGGCACCGATGCTGCGACCGACGTCGGTTGCTCATGGTTACCGCTGTACCACGACATGGGGCTCGC
+TTTCGTGCTCTCTGCTGCGCTGGCCGGTGCGCCGCTCTGGTTGGCCCCGACGACGGCGTTCACGGCGTCG
+CCGTTCCGTTGGTTGAGTTGGCTCTCGGACAGTGGTGCCACCATGACCGCGGCACCGAACTTCGCCTACA
+ACCTCATCGGCAAATACGCCAGGCGGGTATCCGAGGTCGACCTGGGTGCCCTGCGAGTGACGCTCAACGG
+TGGAGAGCCGGTTGACTGCGATGGGCTGACGCGGTTCGCGGAGGCGATGGCACCGTTCGGATTCGATGCC
+GGCGCCGTGTTGCCCTCCTACGGGCTCGCCGAGTCGACGTGCGCGGTGACCGTGCCGGTCCCCGGAATTG
+GGTTGCTTGCCGACCGTGTCATCGACGGCAGCGGTGCGCATAAGCACGCGGTCCTGGGTAACCCCATCCC
+CGGTATGGAGGTACGGATCTCGTGCGGTGATCAGGCGGCAGGCAATGCGAGCCGTGAAATTGGCGAAATC
+GAGATTCGCGGTGCGTCGATGATGGCGGGTTACCTGGGTCAGCAGCCGATCGACCCTGACGATTGGTTTG
+CCACCGGCGACCTCGGCTATCTTGGCGCTGGCGGCCTGGTGGTGTGTGGTCGCGCGAAGGAAGTCATCTC
+CATCGCGGGACGCAACATCTTTCCGACGGAGGTCGAGCTGGTGGCAGCGCAAGTTCGCGGAGTGCGCGAA
+GGCGCCGTGGTCGCCTTGGGCACCGGTGATCGCTCGACCCGCCCCGGTCTGGTGGTCGCGGCCGAGTTCC
+GCGGCCCAGACGAGGCGAACGCCCGCGCCGAACTGATCCAACGCGTTGCGTCCGAGTGCGGTATCGTCCC
+GTCCGACGTCGTCTTCGTGTCGCCTGGATCACTGCCCCGGACGTCGTCTGGAAAACTGCGCCGCTTGGCA
+GTCCGGCGCTCCCTGGAGATGGCGGACTGATGACGGCCGGCTCCGACCTCGACGACTTCCGCGGTTTGCT
+CGCCAAAGCGTTCGACGAGCGGGTGGTGGCATGGACCGCAGAAGCGGAAGCGCAGGAACGTTTTCCGCGC
+CAGTTGATCGAACACCTGGGTGTCTGCGGCGTATTCGATGCGAAGTGGGCGACCGACGCCCGTCCCGACG
+TCGGTAAACTCGTCGAACTCGCTTTCGCGTTGGGCCAGCTGGCCTCTGCCGGCATCGGTGTGGGTGTCAG
+CTTGCATGACTCGGCGATCGCGATTTTGCGCCGGTTTGGTAAGTCGGACTACTTGCGGGATATCTGCGAT
+CAGGCGATCCGTGGCGCCGCGGTGCTGTGCATCGGAGCCTCGGAGGAGTCCGGCGGATCCGACCTGCAGA
+TCGTCGAAACCGAGATACGGTCCCGTGACGGTGGTTTCGAGGTCCGCGGCGTCAAGAAATTCGTGTCGCT
+GTCTCCGATCGCCGACCACATCATGGTGGTGGCCCGCAGCGTCGACCACGATCCGACCAGTAGGCACGGC
+AATGTCGCGGTCGTGGCCGTGCCGGCCGCACAAGTCAGCGTGCAGACCCCCTACCGCAAGGTCGGTGCGG
+GACCGCTGGATACCGCCGCGGTCTGCATCGACACCTGGGTACCGGCCGATGCACTGGTTGCGCGGGCCGG
+CACGGGGCTGGCAGCCATCAGTTGGGGACTGGCTCATGAGCGGATGTCGATCGCCGGGCAGATCGCAGCG
+TCGTGTCAACGGGCGATCGGAATCACCCTGGCCCGCATGATGAGTCGACGTCAGTTCGGTCAGACGCTGT
+TCGAACACCAGGCGCTGCGGCTGCGTATGGCGGACCTGCAGGCGCGTGTCGATCTGCTGCGGTACGCGCT
+GCACGGCATCGCTGAACAGGGGAGACTGGAACTGCGCACGGCGGCAGCGGTCAAAGTCACCGCCGCCCGG
+CTCGGTGAGGAAGTCATCTCCGAATGCATGCACATCTTCGGTGGGGCGGGTTATCTTGTCGACGAAACGA
+CGCTTGGCAAATGGTGGCGGGACATGAAGCTCGCCCGGGTCGGCGGCGGCACCGACGAGGTGCTGTGGGA
+ATTGGTGGCTGCCGGCATGACGCCCGATCACGACGGTTACGCAGCCGTGGTCGGAGCTTCCAAAGCGTAG
+AGCGCCATGCGCCGGTTTGTCGTGTCATGCTCACCGAGGAACTTGCATCCGGCCCACTCACACAACCGAC
+GGGTCGCGGTGTTGCGGTGATCGGGGTCGAACATGATCCGCCGGCAACGCGGCTCGTTGGCAAAGACGCT
+GGCCACGATCCGCGGTAGCAGCAGCGGGCCGAAGCCCCGATTGACCTTCGACAAGTCCGCGATGGCCGCG
+TGCAGCCCCAAATCGTAGGGGTCTGCGTCGTAGTAGTGAGAAATCAAATCCTTTGCTGCCCAGTATAATT
+CGAGATAACCACCATCTGTTCCGTGCCAGCTGCCGATCAATGGCAACGAATAGGTTCCCTCAAGTTGGGC
+GTTCAGGTGTTGACGCCAACGTGACGCCGGCCAGTCGTACTCCCAGGCCGCCGCCAGATGAGGACGGTTC
+ATCCACTCCGCCAACATCTCCGCGTCGGTCAGCTGTGCGACCCGCAACCCGTATGGCGGCTCCAACGATG
+GAACGGGCGGGCGGGCGAGGCGTCGTACCTGGTCAGGTAGGTCGAATCGCTCGCGGGCTAGCCGAACCAG
+CGCGTCGTCGGCCTGGCCAGCGGATGTGGGTTTGGTCATTGCGGGCCGAGCTTACCGGAGGGCTCGCTGC
+TTAGGTTAGGCATGCCATACATGCGTGAGCCGGGATCACGTCGCCCGCTGCCCGGCTGTCCGGGGGTCGA
+GGCGGTACGATCGCTACGCCCGCGGGCGTGATGAAATTGGCAAACATGCCGGTTTTAGGTGCCGGTGCTC
+GAAAGAGTTTGAGGGTTCGAGTCCCTCCGCCCGCACTCCATGGTCCCCGAGTTTGACCTTCGGTAAGGCA
+ACCCTTAGTTTGGACGAGATCGTCCGACTGGGGCCGACTGGGTTGTATGCGCGGGCTGAGTATCAGCGCG
+GTCGCGGCGCAGCTCGGGGTATCGGCGGAGCGCGACGCCGTTGCACGCCGGTTGGCCGGTAACCCAGCGT
+TCGTGGTCGCCCGATCTGAGAAGTCGTGGCGGATTAGGCCGCCGCGAGAGAGGACCGCTGATGGCACGCG
+GGTTGCAGGGTGTGATGTTGCGCAGTTTCGGCGCGCGCGACCACACCGCAACGGTGATCGAAACCATTTC
+GATTGCACCGCATTTCGTGCGGGTCCGGATGGTTTCGCCGACGCTCTTCCAGGATGCGGAGGCTGAGCCC
+GCCGCATGGCTGCGGTTCTGGTTCCCCGACCCGAACGGGTCCAACACCGAGTTCCAGCGCGCCTATACGA
+TCTCCGAAGCTGACCCCGCCGCGGGCCGCTTCGCGGTCGACGTTGTATTGCATGACCCGGCGGGTCCGGC
+CTCGTCGTGGGCGCGCACCGTCAAACCTGGCGCAACCATAGCGGTCATGTCGCTGATGGGCTCATCGCGG
+TTCGACGTGCCCGAGGAGCAGCCCGCCGGGTATCTGCTAATCGGCGACTCGGCGTCGATTCCGGGGATGA
+ACGGGATCATCGAAACGGTCCCGAACGACGTCCCGATCGAGATGTACCTTGAACAACACGACGACAACGA
+CACGTTGATCCCGCTCGCAAAGCATCCCCGGCTGCGGGTGCGCTGGGTTATGCGCCGCGACGAGAAATCG
+CTGGCCGAGGCGATCGAGAACCGCGACTGGTCGGACTGGTATGCGTGGGCGACGCCAGAGGCTGCCGCGC
+TGAAATGCGTCCGGGTGCGGCTGCGCGACGAGTTCGGGTTCCCTAAGTCCGAGATCCACGCTCAGGCTTA
+CTGGAACGCCGGGCGTGCCATGGGCACCCACCGAGCAACCGAACCGGCGGCCACCGAACCTGAGGTGGGC
+GCAGCCCCGCAGCCAGAATCGGCGGTGCCTGCCCCGGCGCGTGGCAGCTGGCGCGCTCAGGCTGCCAGCC
+GGCTGCTGGCGCCGCTAAAGCTGCCGCTGGTGCTCTCGGGTGTGCTTGCGGCTCTGGTCACGCTGGCGCA
+GTTGGCGCCGTTCGTGCTGTTGGTCGAGCTGTCAAGGCTGCTGGTCTCCGGCGCCGGCGCGCACCGGTTG
+TTCACGGTCGGGTTCGCCGCGGTGGGGTTGCTGGGGACCGGGGCCTTGCTGGCAGCCGCCCTCACGCTGT
+GGCTGCACGTGATCGATGCCCGCTTCGCCAGGGCGTTGCGCTTGCGGCTGCTGAGCAAGCTGTCCCGGTT
+GCCGCTGGGCTGGTTCACCAGCCGCGGGTCCGGATCGATCAAAAAATTGGTCACCGACGACACGCTGGCG
+TTGCACTACTTGGTCACCCATGCCGTTCCGGACGCGGTCGCCGCGGTTGTCGCCCCGGTGGGGGTGCTGG
+TCTATCTGTTCGTCGTGGACTGGCGAGTGGCGCTGGTCTTGTTCGGGCCGGTTCTGGTCTACCTGACCAT
+CACGTCATCGCTCACGATCCAATCCGGGCCCCGCATTGTTCAAGCGCAGCGGTGGGCAGAGAAGATGAAC
+GGCGAAGCGGGTAGTTACCTCGAGGGTCAGCCGGTGATTCGCGTCTTCGGCGCCGCGTCATCGAGCTTCC
+GTCGCCGGTTGGACGAGTACATCGGATTCCTGGTCGCCTGGCAGCGGCCGCTGGCCGGCAAGAAAACCCT
+GATGGATCTGGCCACTCGCCCAGCAACGTTCCTGTGGCTCATCGCCGCTACCGGCACCTTGTTGGTAGCC
+ACGCATCGAATGGATCCGGTGAATTTGTTGCCGTTCATGTTCTTGGGTACCACGTTCGGTGCCCGCCTGC
+TCGGGATCGCCTACGGGCTCGGCGGCCTACGCACGGGACTTCTGGCGGCCCGGCACCTGCAAGTCACACT
+CGACGAAACCGAACTCGCCGTGCGGGAACATCCGCGCGAACCGCTCGACGGCGAGGCGCCAGCAACTGTG
+GTGTTCGACCACGTCACCTTCGGGTACCGCCCTGGAGTGCCGGTGATCCAGGATGTATCGCTTACGCTGC
+GGCCGGGCACGGTCACCGCGCTCGTCGGCCCGTCCGGCTCCGGCAAGTCGACACTGGCCACCCTGCTGGC
+TCGATTCCACGATGTCGAGCGAGGTGCGATACGCGTTGGTGGACAGGATATTCGATCACTGGCCGCGGAC
+GAGCTGTACACGCGAGTCGGCTTTGTGCTACAGGAAGCCCAGCTTGTGCATGGCACCGCCGCCGAAAACA
+TCGCGCTGGCGGTACCGGATGCCCCCGCCGAACAGGTCCAGGTCGCGGCCCGCGAAGCGCAAATCCACGA
+CCGGGTGCTTCGGCTGCCGGACGGCTACGATACCGTGCTCGGAGCCAACAGTGGTCTTTCGGGCGGGGAG
+CGACAGCGGCTCACCATTGCCCGTGCCATCCTCGGCGACACTCCGGTCCTCATCCTCGACGAGGCCACCG
+CGTTTGCCGATCCGGAATCGGAATACCTTGTGCAACAGGCGCTTAACCGGCTGACCCGGGACCGCACCGT
+GCTGGTAATCGCCCATCGACTGCATACCATCACCCGGGCCGACCAGATCGTCGTGCTCGATCATGGTCGG
+ATCGTCGAACGCGGCACCCACGAGGAGTTGCTTGCCGCGGGCGGACGCTACTGCCGGCTGTGGGACACCG
+GCCAGGGCAGCCGGGTGGCGGTCGCCGCAGCGCAGGACGGCACCCGATGATCCGCACCTGGATAGCCCTT
+GTTCCGAACGACCACCGCGCCAGGCTAATCGGCTTTGCGCTGCTCGCGTTTTGTTCCGTTGTCGCGCGAG
+CGGTGGGCACCGTGTTGCTGGTGCCGCTGATGGCGGCGTTGTTCGGGGAGGCGCCGCAGCGCGCGTGGCT
+GTGGCTGGGCTGGCTGTCCGCCGCGACCGTGGCCGGGTGGGTGCTAGACGCCGTGACCGCACGCATCGGT
+ATCGAGCTGGGTTTCGCCGTCCTTAACCACACCCAACATGATGTGGCGGACCGGCTTCCGGTTGTCCGGT
+TGGATTGGTTTACCGCCGAAAACACCGCGACGGCACGGCAGGCGATCGCGGCCACCGGGCCGGAACTTGT
+TGGCCTGGTGGTTAATCTGGTGACACCGTTGACCAGCGCGATCCTGCTGCCGGCAGTGATCGCGCTGGCC
+CTGTTGCCGATCTCCTGGCAGCTCGGCGTGGCTGCACTGGCCGGCGTGCCGTTGCTGCTGGGGGCGCTGT
+GGGCCTCCGCAGCCTTTGCGCGGCGTGCCGATACCGCAGCAGACAAAGCCAATACCGCGCTCACCGAACG
+GATTATCGAGTTCGCTCGGACTCAACAGGCATTGCGGGCCGCCCGGCGCGTCGAGCCGGCTCGAAGTCTG
+GTCGGCAACGCTCTGGCCAGCCAGCACACCGCGACGATGCGGTTGCTGGGCATGCAGATACCGGGCCAGC
+TGTTGTTCAGCATCGCCAGCCAACTGGCTTTGATCGTGCTCGCCGGCACCACCGCGGCGCTGACCATCAC
+GGGAACGCTCACGGTTCCCGAGGCCATCGCCCTGATCGTGGTGATGGTCCGTTACCTCGAGCCGTTCACC
+GCTGTCAGCGAGTTGGCGCCGGCCCTCGAGAGCACCCGCGCGACCCTGGGGCGCATCGGATCGGTGCTTA
+CCGCACCGGTCATGGTGGCCGGGTCTGGCACGTGGCGTGACGGCGCCGTGGTCCCGCGTATCGAGTTCGA
+CGACGTCGCCTTCGGCTACGACGGCGGCAGCGGGCCGGTCCTCGACGGGGTCAGCTTCTGCTTGCAGCCG
+GGAACCACGACGGCGATCGTCGGACCGTCTGGCTGCGGAAAGAGCACGATCCTGGCGCTGATCGCGGGCC
+TGCACCAGCCCACTCGCGGTCGTGTCCTCATCGACGGCACCGATGTCGCGACGCTGGATGCCCGGGCGCA
+GCAGGCGGTCTGCAGTGTCGTGTTCCAACATCCTTACCTGTTCCACGGGACGATCCGCGACAACGTGTTC
+GCTGCAGACCCGGGCGCTAGTGACGATCAGTTTGCGCAAGCCGTCCGGCTGGCGCGGGTGGACGAGCTCA
+TCGCCAGGCTGCCAGACGGCGCAAACACAATCGTTGGCGAAGCCGGCTCGGCGCTGTCCGGCGGCGAGCG
+GCAACGCGTAAGCATCGCACGGGCTCTGCTGAAAGCCGCTCCGGTGCTACTGGTCGACGAGGCGACCAGC
+GCACTGGACGCCGAGAATGAGGCCGCGGTGGTCGACGCGCTTGCGGCCGATCCGCGATCACGCACCCGGG
+TGATCGTCGCCCATCGGTTGGCAAGCATCCGTCATGCCGACCGCGTCCTGTTTGTTGACGATGGCCGAGT
+GGTCGAGGACGGTTCGATCTCCGAGTTGCTCACCGCGGGTGGGCGTTTCAGTCAGTTCTGGCGCCAACAG
+CACGAGGCCGCCGAGTGGCAGATCCTCGCCGAGTAACGCGAGAAACCACCGCGCCACGCAGATAGCCACT
+TCCTCCGTGAATCTGCATCGCGAGGTCGGCCACCTTGCCAGCTAGTTCGGTGTAGAAGAGCTTCGCCGCC
+GACGGTGCAAAATATGATATTCGCATGGCGTCATTGCTGAACGCTCGGACTGCCGTAATTACCGGCGGTG
+CACAAGGGCTGGGGTTAGCTATCGGCCAGCGATTCGTTGCCGAGGGTGCACGGGTTGTGCTTGGTGATGT
+GAATCTCGAAGCGACCGAGGTCGCAGCCAAGCGGCTGGGCGGCGATGACGTTGCTCTGGCGGTGCGGTGC
+GATGTGACTCAAGCCGACGACGTCGACATCCTCATCCGGACCGCTGTCGAGCGTTTCGGCGGTCTGGATG
+TCATGGTCAACAACGCCGGGATCACCCGCGACGCAACGATGCGCACGATGACCGAAGAGCAGTTCGATCA
+GGTCATCGCGGTGCATCTGAAGGGAACATGGAACGGTACCCGGCTGGCGGCGGCAATCATGCGGGAACGC
+AAGCGGGGCGCCATTGTGAACATGTCTTCGGTGTCAGGCAAGGTCGGTATGGTCGGCCAAACCAACTACT
+CAGCGGCCAAGGCCGGCATCGTAGGAATGACCAAGGCGGCCGCCAAAGAACTTGCACACCTCGGCATTCG
+GGTAAACGCAATAGCTCCGGGGTTGATCCGTTCAGCGATGACAGAAGCTATGCCGCAACGCATTTGGGAC
+CAGAAGCTTGCCGAAGTTCCGATGGGTCGCGCCGGCGAGCCCAGCGAAGTCGCTAGCGTGGCCGTGTTCT
+TGGCTTCGGATCTATCCTCGTACATGACCGGCACCGTGTTGGACGTGACTGGCGGCCGGTTCATATGACA
+CCGAGATCATTGCCACGGTACGGCAATTCGTCAAGAAGGAAATCTTTCCCAATGCACCGGCCCTCGAACG
+TGGCAACAGCTACCCGCAAGAAATCGTCGATCGGCTGGGTGTTATTGGCTTGCTCGGTCGCCGGCTGCAA
+GGGTATCGACACCACCGAGTTCATTCTCGGGCGTGCCGGCGCATTCGAGCTGGCGGTGCGCGCTGCCCAG
+CACCGTCATAGGTACTTGACGATGGTCAACGTCGGACGAGCGCCACCACGTCGCTGCCGAACGGTATGCA
+TGGCGGCTACCGATACTCCGCGGAATATCAGATTGAACGGCTGATGCCTGATGCGCCCGTTGCTGCTCAG
+CGGAGCGGGAACCAGCGCGATCCAGAAGCCTCTGAGGACTCGAAGGCTGGCCTCCGGAGTCCATCGATGA
+TGTGCAGTTGCATCGCGATTGCCGCCAGGGGCGTTGTCGCTTGAGCACATCTGGGCATAGGCTGCCATCT
+TGGAGGGCAGGCAACCTGCATGATAGGGAGGAGAATATGGCCCGCACGCTTGCGTTGCGCGCATCGGCGG
+GACTCGTCGCGGGTATGGCAATGGCCGCGATCACGCTCGCACCTGGGGCCCGCGCCGAAACCGGTGAGCA
+ATTCCCCGGGGATGGGGTGTTTCTCGTGGGAACTGACATTGCGCCAGGCACCTACCGCACGGAGGGGCCG
+TCGAATCCCCTTATTTTGGTGTTCGGCAGGGTGTCCGAGCTCTCAACCTGCTCATGGTCGACACACAGCG
+CACCCGAGGTGAGCAATGAGAACATTGTCGACACCAACACCTCTATGGGCCCGATGTCAGTGGTGATCCC
+GCCGACCGTGGCAGCCTTCCAGACGCATAACTGCAAGCTTTGGATGCGGATCTCATAGGGGCCGGCGTAC
+CCGGTACCGGCCGCGGGCCTACCACGTGCCGGAACTGGAAGCGCAGTAAGCCCTCAACGCGCCACCGCTT
+TGGCCCGCGCGCCCGGCGTAGGCGCATCGGCGGTGGCCGTGGGGCGGCGCACTGCGACCTCACCAGCGGC
+TTTCGAGCTTTGTTCGATCAACCGGCCAGCATGGTCGAGGATGCATTCGAGACCATATTCGAAATTGGTT
+TCATCGGGGGCCCCGATCCGATGCCCCCTCCCAGTTGCGTGAGCAAGCAGCGGAGTCGTCGCGGGATCGA
+TGGCCACGGGGTGTTCAATGGCGGATGGTCCGCTGCCCGCCGACTGGCTCTTGCGGGAGAGCCGATCTAG
+CACCACCGATCCGCGCACGTGGACCGAAACCGCCGAGTAGATGTCGAAAGCGTCTTCGAGCGACAGGCCC
+GCCGTCACCAGATTGGCGATGGCCTTCTCCATCTCTTGGGCGCCCAACCGCGCCGTTTTCGGGGACAGCG
+CCGCTCGAATCAGTATCAGATCGCACAGTACGGGGTTGTCCGCGAACGTCTTCCGCATCGAGCGGGCATG
+ATTGCGCAACGTTTCGCGCCAGTCGCCGGCTTCGATGTACGGGGTAGCGAACACGTACTTGCTCAAAGCG
+CGGTCGGTCATCGCGTTGAGCAGATCGTCCTTCTTGCGGAAGTACCAGTAGATGCTGGTGACCCCGACGC
+CAAGGTGTTTGCCGAGCAATGGCATGCTCAAGTTGTCTATCGATACCTGCTGGGCGAGTTCGAATGCGCC
+GCTGATGATGTCCTCGGGGTTGATGGATCCGCGCTGCCGTCGTTGACGCTTGCCTGGGGTTGTCTGCATT
+GCCGTTACGGCACCTCCATCAAGATAACGCCGGGTCAGTTGCAGGTATGCAGGTCGGCGGTAGTCGTCGT
+GCGGACAACATGTGCCGCATGGCCTCCCCGGGGACAGGCCGGGAGAACAAGAAGCCTTGCGCACGGTAAC
+AGCGCTGATCCAATAGAATTCTGGCGGCAGCCTCGGTCTCGACGCCTTCGGCTACTACATCGAGTTGGAA
+GCCTTCGGCGAGTGTCATGATGCCGCGCACAATGACCAGATCGCTAGTGTTGGTTCCGAGTTGCCGCACG
+AATGTTTTGTCGATCTTGAGCGTGTCGATCGGTAGCGTCTGCAACAGTGATATGGCGCTATAGCCGGTGC
+CGAAATCGTCGATAGCGATGTGAACGCCGACTTCTTTGAGTCGAGCCAGGGTGGCTCTGGCGGTATGTAG
+GTCTTGCACCACAACGTTTTCGGTGATTTCCAAACACACGGACGAGGCGTCCAGACCGTGCTGGCCGATC
+GTGTCTGCGACGAAGTCAACAAACCCGCCCGTCACCAGCTGTCCAGCTGAGACGTTGATACGCAGCAGCG
+CGTCGTGGCCCAAACCGGCTGACTGCCACTCGGAGAATTCATTGCAGGCCCTCCGCAGCACCCATCTATC
+CAATTCGCCTGCAAGGTTGATGGATTCGGCCACAGGGATGAAGCAGCCCGGTGCCAGCAGCCCACGGGTG
+GGGTGCTGCCACCGGACCAATGCCTCGGTCCCGACAATGTCGCCGGTCCGTAGGTCGACCTCGGGTAGGT
+AGACCAGGCGAAGGGCGTCGGATTCGATACCACGTCGAAGGTGTAGTTCAATATCGTTGCGCAGTTCGCC
+GCTGACCGACATGTCCGCGGTGAAAATCGCGACGCTATCTCCGCCGGCGTGTTTGGCTGCCAGAGCGGCT
+TGGTCGGCTCGGCGCAGGAGGTCCGACGGTGTGTGCTGTCCGGGAGTCCCTGAGGCGACACCGATACTGA
+CGGTGCGGGTGAGCACCTCACCGCCGATAGCGACGTGGTCCTTGAGCTGGTCGCGAAGACGTTCGGCGAG
+CGGTTGAGCGGCATCGGCACTCATTGGAGATGCGGGTATGAGGACGAATTCGTCGCCGCCGAGTCGGGCG
+ATCAGGCTCTCGCCAACGAGTGCGTCACCGATCCGTTGGGCGAACACATGGATGAACTGGTCACCGGCGG
+CGTGGCCCAGGTAGTCGTTGATGGCCTTGAGGCGGTCCAAGTCGAGAAATAGCGCCGCGACCGGGCCAGG
+TTGTCCGGGGGCCAGTCTTTGGTCCAGGTGCTGCAGCAACGCGCGACGGTTATGCAGTCCGGTCAGATCG
+TCATGGTCGGCCAGATAGCGAAGCCGCGCCTCGGCGGCGACGCGAGCCTGCACCTGGGCGAAGAGTGTAG
+CGATGGTCATGAGGGCGTTAAGCTCGGCCTCGTGCCATTTCCGATCACCGAACTTGATGAACCCCAGCAG
+TCCAGTGGTGATCTCGCCAGATACCAGCGGCACGGCGGCAGCCGACGTTACCGGAACCCCGCGGGCTTCT
+TCGATGAGGCGTTGATAGTCCTCGGTGGCCGGCTCGGGCCGGAACACGAGAGGCTCTTTGGCGTGTTCGC
+ATAGCGCAAACACCGGGTCGGCATCAGCGAAGTAGATCAGCCTGAGCGGATCGGGGTCCGGTATGTTGAG
+GCGAGGTGGCCATTCGGCCACCAGCCTCGTCGCGCGCCTGTCGCGATCGTTATGACGCAAAAAGCTGACA
+TCTACGCCCAGCTGTTCCACTAGATAGGCCAAAACGCGCTGACTGACTTCGGCTGACGTGGCAGCGTCGA
+CTGTCATGAGCTGGTTGGCTACGGTGGTGACGAGCTCCTCAAGCTGCGGCGTCGCGGTGTCGTTGCACAT
+CTCGGATGCTATCTGTGCGGCTCTGGTATGGCGTGCCGTACGCGTCGGCGGCTACACACCGACGGCGGTG
+GCGCGTGGAACAACCTGAAGATCAACACCTCGTGCCCTTCTTTGCCCGGCTTGACCAGTTCCCGAAAGTC
+GAGTTGCAGGCGGTGCAGCTGTGCGGCGAAATGGGGTGACGCTTGGTCGAGGTCGTGGCGGCCACGTGCA
+TACAGGAAGATCGGTGACATCGGTTGTACGGCCAGTCCATGTTGTTGGGCCACAATCCACACCGCCTGCA
+TGGCTGATCCGCCACGCGCAAAATCGGTGAGCGTGGCGCCATCAACGTAGACGATTGCGAGCGCTGAACT
+CGCCGACACGCGCTCATTGGTGTTGTCTTCGAGGGCTGTTCCGCAATCCCATTGCGCTAGCCGTGCCACG
+ACGTCGGAGCGTCGCAGGATATCGAGAACCCGCAATTCGCCGGAATCCAGTTCGAGGCTTCGGACATCGA
+TGCCCGCATCGAGCGAAGGGTCGCCCGGCCACCGGAGCTCGGACATCATTTCCTCATGTAGCCTCGGGGT
+GAGATAGCGGATTCGGTCTGCAGCCGCTAAAATTGTTGCAGCCCGGTCGATCTCGTTTCGTGACAGCAAC
+AGCTGTAACCGCGCACCCTCAGCCGCGGCGGTGTTCGTTAACAACTCAACGGTCGCGGGGTGGACGTGAC
+CGGGCATACCGTGGTGGCGATTGGTCGTTCTGAGCAGCATCGGCCGGTAAAGGGCCGCAAGGCTTGGATC
+ATCACCACGGCCAAAATGCATTGTCGCTTGCAGCGGCGAGTCGGGCTGGGATTCGTCGAACTCTACTGAT
+CCCAGGACCCGGTGTGCAGCGGCAGCGACACGCGCGTTAAACATGGCCGCGCCGACGGCCACTGCGCTAC
+CACGAAACGCGATATCCATTGCGCTGGTGTGCTCAGGTGCTAGTCGGATGGTCAGCGAATGCTGTTTGGC
+CACAACATGCCATGGCTGAACGTTGCCCCCTGAAGGCGCGCGAATCGCCGCCTGAGCCACGATTTCGCTG
+GTTGGCTGCGGCTCGGCTGGCGCTGTTGGCGGCACGGACTCGAGCAACCATCCGTTCCCGCGAGACGGCA
+TGGGCGGTTGATCGAGGCGATCTAGCGCTGCGGACACATCCACCCGTACCCGGCCAGACTCAAGTGGTTC
+TCCCAGACCGATTCTGCGTACCGCTTCAGCTACCGTCGCTGCGCCCACCCAGATATCGCCTGCCAACTGC
+GGCCATCCCCACAACGTCTGGTCAACTTCGATCATCGACGCCGCACAACGCGCCGAGAGCTCTTGGCAAT
+CAAGGATGTTGAGAACGTGGGGGACTTTGTCTTTTGTGGTCAGTCCACACAGCTTGTCGGCGTCGATGTC
+GCCCAATAGCCCATGAAAGATCGGTCGCCCAGGTTCGACGTCGTAGCGTTCGACATCGACCAGGCCGCGG
+TCACTGGTCGCCATCAGTACGGGGACACCACGGGCGCACGCGGCTTGTCGCAGTATCACTTTGATATCCA
+GCGAGTCGCATTCTTCGATAACGACGTCAAGGCCGTCGAGGAACTCGTCGACGGATTCCGGCGAGAGCCC
+GGATGTAACGAGGTCCACGGCCAGGTAGGGATCCAGCTCCGCGATCCTGCGCGCCGCAATCATCGCCTTG
+TTGAGGCCAATGTCGAAGACGCCGACCGGCACGCGATTCAGGTTCGACAGCTCAATTTTGTCGAAATCGG
+CCAACCGCAGTGTGCCACAGGCACCTTCGGCGGCAAGGGTGTATGCGATCGCATGGCCGGCGCTGAGTCC
+GACGACGCCGACCCGTAGCGCGTGCAGTGCGCGTTGTTCCTCAGCGGTGATGAGGTGCCTGTTGCGGTCC
+AAGCGCACGGCACGGAACCCCCGGGGACCCAGAATGGCAACAACCATGCGCCGCCAGGGATAATAGGCCC
+ATCGCTTCGCTTCTTCTAGCAGATCTGGATCAGGCTGTGGCAGCAGGCGCCGCACGCCCGCTAGCTGTTC
+TGCGAATCGGTCGACGAACTCGATGCTCGGATCTGAGCGTAGTCGATCGAGCACCAGGACATCGTCGTGG
+TCATCGTCACGAAGGACGAGAATGCCGGTGCTGCCGCCCTCGTGTGGGATGGTCACTGTTCGGCTCCAGC
+GGTCGCTGCGGTGGTTGCGCTCAACGCTTCTACATCGCGCAGAAGCTTGCGCGACTCGACAAGCATTCTT
+GACAGTTGTTTTGGCTCGGCATGGTTAGCCAAGGTTCTGCGGTCCCACCAGATCATCTTGGTCCGGTAGC
+GCTCGTCCGGGTATGCTGCCGCCGGGATTCTCGCTGCTATTACTCCCCCCGAAGAACGCCACCGGTCCAG
+CGCGTGGGCCGCCGCGGTCCCCATCACAAACTGAACCCCCAACAGGGACATGCTTAGCGGTAGGGCGCGC
+GCCAAGGCGGCAGCAATCGCATCACTGCGCTGCGCGTCACTATTAACCCACCCGGACTTCACTTCCACGA
+CCCCGAATGGCGCCCGGTCATTGATCATCTTGCGCACCGCGGATAATCCGGGATTGCCAGCCCATTCGAC
+TACCGCATGCGAGTCATCGGCTGACCGCAGCGGTCCGATTACCCGAGCGCCCCCGACTACATCTCCTCCA
+ATATCAATGGCGGCAAAGAACAACTGTGTATCGGAACCGTCACTGATGGCGTCGAGATCTAAGGTACACT
+CGACTCCGTGCTTACTATAGGCGCGAAGCGCACCCTGAAGGTATGTATTCCACAACGTGGGATCGAGCGC
+GGGTTGCGATACCACAAGCCGGCATTGCGCATCAGAAACCCACACACTGAGATTTTCCGAAAAATGCAAC
+TTCTGCGGTGCGATAGGACGAAGTTGAGCGGTGGTCATGATTCTCCAATCTGTTAGGTATCCGGCAATTA
+ACACGAGATTTGCTGCCCCTGTATCGAGCAGCGCAGACGTTGGGGCTGCGCCCGGAGAATTGCTGCCGTT
+GCGCAGAACGGCGCCGCACGGCAGGGTTCAACGCCCGGCCGCGCTGGTATTTATCGAGTCGCTGCGAGAG
+CCGTGAACAAATTGTCACGAAATCGTGCGCACGCGCGTTCACAAATACCACGCGCACGCGCTCGAAAACT
+ACATGACCAGATAGCCAGATTTTTCCGGACCGGCAAAGCGTTGTTCAGTGTTGGTCACGGCTCTTGATCG
+TATTTACCCCGGGTGGCGTAGACCCTATCGATGGTGGACCCCGTTCATCGGGGTAATCGAATGGATCATG
+CAAAATATTACTTTGACGAGTATTCATTCCGATTCAACCGGTCCCACCCACCTCTCATGCGTGCGGGGCA
+TACTGTTCTACGGCTTGGTGAAACACGCCGTTGCCATCGATCTACACCCACGCGACCTACTCTCTGAAAA
+AGTCGACCGGCAGTGCCTTGGCAAAGTGCCAGCCTTGTGCGGCTTTACAGCCGAAGGCGCGCAACCGGGC
+GGCTTGGCTGGGGGTTTCGACTAGCTTTGCAGTGACGGTGATACCGAGCTTGTCGCCAAGGTCGATCATT
+GCCCGGGTGATCTGTTCGTTGGCCAGCCGAGCTTGAATGTCGCCATCGAGGCACTCGATGAACTTTCCCC
+CGAGTTTGACCACGTCGACGGGGAGGCGGGGAAGGTAGGCGAGGCTGGAGAATCCAATGCCGAAGTCGTC
+GATGGCGATGCCGACGCCGAGAGCGGACAATTCTTGTAGCCTGGTCACCGCCTTCTCGTCTCTGCTAAGG
+CGCGCGTCCTCGGCCAGTTCGAGCTGCAGGGCATGGGCGGGCAGGCCGGTTTCGCCGAGCACACCTTCGA
+CCAGCACCAGGAAGCCGGGATCGCAGATGGTGCTGGCGGAGACGTTGACGCTGACAAACGGTTGCGGGTC
+GGTGCTGTGGTCACGCCAACTGCGGACGTGGCGGCAGGCCTGCTCGAGCACGAAGGCCGTGAGCGGCACC
+ATCAGTCCGTTGTTCTCGGCACGGTCGATGAACCGGCCCGGGAGTAGCGTGCCCAACGTCGGGTGTTCCC
+AGCGCAGCAGGGCCTCGGCGCCGATGATGCGGTTGTCGGCAAGCCGGATGATTGGCTGGTAGACGAGGAA
+GAATTCACCGCGATCCAGTGCCACGCGCATCGAAGTGGACAGATAATGGCGAGTGTTGACCTGGTCGCGG
+TCGGAGTCCGCCCATTGGTCAGGATTGGCTACCATCGCTCGCGCTTGCATCGCGCCCCTAAACATCTCTT
+CGTAGTCGATCAACTTGGTCGGCCTGAGCGCGCAAGCGAACGCTGTAGCGCGCTGACAACAACGATCCAT
+CCAAGGGCTGCATCAGGATTCACAGCCCGGTGGGCACCTCGCCGACCGCGGTGGCAACGCGAAGCACACC
+ACCGAAGTCGTCTTGACCCGAACCGTCGCAGTAGATTCTGGAGTCCTGGGAGGCAAAGATCGTCAGCGAT
+AATGCGTAAAAGTCCGTCACGTACTACGTAGAAGGTCCGTGAGTGCAGCCGTTCCGGGCATGCACGAACC
+GGCGCTTACACGTCGAAGGCGGCTGCGCGGCAATCAGTCTCGGTGGGTAACCCATTGTCGGCGGGCGATC
+GGTTACCTCTCGAATCGACGGCCGCCCGCATCTGAGTTAGCCAGGCCAGCGGTTTCCTACGGGCGCTGGG
+TGCAAAGATACGACTTCCGGGTGCAATAGTTACGCGCTATCGCTGATGTTCTTGTCCGCACCGGCCTTCA
+GAGTTGAGCCAACGCGTAGTCGCCACTCGGCACTACGGTGGGCGCGTCATCGACGCTTCGCTGACGTCCC
+GAGGTGGCAGATGTTGCGCTCGCTGCAGATCGCCGATCAAATCGCTCGTACGGGTCACATGCCAGTGAGG
+CGTCTTGATCTGATCTGGATCAGCGCACGAAACGCCGCGAGAAGGGAGCTTGATCTGGGCGTGGCTGCGC
+TGGTGGAGGCTGTGACGTTGCTCACTGCTGACGTCGAGGGCTCGACACGGCTGTCGCAGACGCGACTCAA
+CGAGCTAGCGGCCGATTACCCAACCTTGGATCAGAACATATCGGAAGCTGTCGCGGCCCATGGCGGGGTG
+ACGCGACCGGTAGACCAGGAGGTGGGTAGCGGTCTCGTCGTCGCGTTCCTGCGTGCTGGCGACGCGATCG
+CGTGCGCTTTGGAACTGCAGCTCTCAACGTTGGCGCCTATGCGGCCGCGTGTCGGTGTGCACACCGGCGA
+TGTCCGGCTGCGCGGCGACGGCACCATCACCGGCTCCGCGATCAACGAGAGTGCGTGTCTGCGCGACCTC
+GCACACGAAGGCCAGACTTTGCTTTCAGCCGCCACTGGCGATCTGGTCATCGACCAGCTTCCGGCAAATA
+CCTGGCTGACCGACGTCGGCAAGTACCCCCTGCGGGGTTTGCATCGCCAAGAACGGGTTATCCAGTTGTG
+TCATCGAGACCTACGCAATGAGTTTCCGCCGCTGCGGATGTCGGTCGGTAACAGATCCAGCCTTCCGGCC
+CAGTTCACCACTTTTGTAGGCCGTGACGCACAGATCAACGAGGTGCAAGAGGTCCTGACGAACTACCGGC
+TGGTGACGCTGCGCGGCGAGGGCGGTGTAGGTAAGACGCGTCTGGCGATCCAGATCGCGGCCGCGTCGGA
+ATTTCGCGATGGTCTGTGTTTCGTCGACTTGGCACCGATTGCCGATCCCGGCATGGTGTCCACCACCGCG
+GCCCATGCTCTAGGTCTGATCGATCGGCCGGGCAGCTCAACATTCGACACTCTTAGTCATGCCATCGGCA
+ACTGCCACATGCTAATGGTGTTGGACAACTGTGAGCACGTGTTGGATGCGTGCGCCGAGCTGGTCGTTGA
+GCTGCTGGGTGCCTGCCCGGAGTTAAGCATTTTGGCGACCAGCCGCGAGTCGATCGGCGTGACCGGCGAG
+GTCACATGGGTGGTGCCGTCGTTGTCTCCGGCGAACGAAGCAATCCAGTTGTTCACTGAACGTGCGCGCC
+TAGTCCAACCCAATTTTGAGATCGTTGCTGACAACTTCGCCGCCGTGAGCGAGATCTGCCGGCGGCTAGA
+CGGTATGCCCCTGGCAATCGAGTTGGCCGCGGCACGATTGCGGTCGTTGTCGCCAAACGAGATCGCCAAC
+AGTTTGGATGACCGATTCCGCCTGCTGACCGGTGGTGCTCGCAGTACGGTGCAGCGCCAGCAGACATTAC
+GGGCATCTATGGATTGGTCGTACGCACTGCTGACTGACACCGAACGGATCCTGTTCCGCCGCCTTGCGGT
+GTTTGTGGGCGGTTTCGACCTCACCGCGGCGAGCGAAGTCGCCGCCGCCGGCGGCGACGACTTCGTCGAG
+CGGTATTCAGTGCTTGATCAACTGACGCTGCTTGTCGACAAGTCGCTGGTGGTAGCCGAAGAAAGCCGAG
+GCAGTACGCGCTATCGGCTGTTGGAAACCGTACGCCAGTATGCGCTAGAAAAACTGAACGAATCCGAAGA
+AATCGACGGGGTGCGCGCTAGGCACCGGACCCACTACGCAACCATGGCGGCAGGGCTGAACGTTCCCGCC
+TCCACCGACTATGAACAACGCCTCCTGCAGGCTGAAGCCGAAATCGATAATTTGCGTGCCGCATTCACCT
+GGAGCCGTGGAAACGGCGATATTGCAGCCGCATTGCAGCTCGCATCCGCATTGCAACCGCTGTGGTCGCA
+GGGGCGCATGCGCGAAGGGCTGGCCTGGCTCGAATCCATCCTCGAGCGGGAAGGCGACAATCATCTTGTG
+CCGGCGGGGGTTTGGGCGCGGGCGCTTGCGGAGAAGGTAATACTCAAGGCTTGGCCGGCCACGAGCCCGA
+TGGGCGCCCCCGACATCGTCGCGCAGGCTCACCATGCCTTGGCGCTGGCACGCGACGCAGGCGACTGCGC
+AGTGTTGGCTCGAGCGCTCGTCGCATGTGGCTGCGGCAGTGGTTGCGACACGGAAGCCGCTCAACCCTAC
+TTCGCCGAGGCGATCGAGCTGGCGCGCGCCATTAACGATGAGTGGACATTGAGCCAAATCGATTATTGGC
+AGGTGGTCGGGATCTTCATATCGGGTCAGCCAATTCCTTTGCGAGCTGCGGCCGAACAAGCTCGAGAGCT
+CGCCGACAGCATCGGAAACCGGTTCGTCTCACGTCAATGCCGCCTGTTTGCCTGCCTGGCGCAGATATGG
+GAAGGCGACGCGAACGGAGCATTGGCACTATCTCGCGACGTTACCGCCGAGGCCGAGGTGGCAAACGATG
+TCGTTACTAAGGTACTCGGTTTGTATGTCGAAGCCATGGCACTGTCTTACATCGGCGACAGCGCCGCCCG
+GACCATCGCTGGTGCGGCTCTCGAAGCTGCCACCGAGTTAGGCGGGATTTACCAAGATCTGGGTTACGGA
+GCGATAACTCGCGCGGCGTTGGCCGCGGGCGACGTAGCGGCCATTGAGGCTAGCGAAGCGAGCTGGGATC
+TTCGCAATCAACACAACGTGGTAACGGCACACCACGAGCTGATGGCGCAGGCAGCCCTGGTTCGCGGCGA
+TGTGACCACGGCAAGACGTTTCGCCGACGAAGCTGTGCTTGCGAGCACCGGATGGCATCTGATGATGGCG
+CTGATAGCACGGGCGCGAGTGGCGATTGCGCAGGACGAGCTGGGAAAGGCACGCGATGACGCCCACGCCG
+CGGTGGCGTGCGGCGTCGGTGTGCAGACGTACCTCGCGATGCCGGATGCCCTAGAACTTCTCGCAGGTCT
+GGCCGGTGAGGCCGGTAACCACGGTCAAGCAGTGCGCCTTTTCGGCGCGGCCGCGGCCCAGCGGCAGCGT
+ACGGGGGAGGTTCGCCACAAGATTTGGGACGCCGGCTATGAGGCCGCCACGGCGGCGCTTCGTGATGCGA
+TGGGCGACGAAGATTTCACTGCCGCCTGGGCTGAGGGTGCCGCGGCCCCCTTGGACGAGGCGATCGCCTA
+CGCACAACGCGGTCGCGGCGAACGCAAACGCCCAAGCAACGGCTGGGACGCGCTGACCCCGGCCGAGCAC
+AAAATCGTAAAGCTCGTCACCGAAGGACTGGTCACCAAGGACATCGCCGCGAGGCTTTTCGTCTCACCGC
+GTACCGTGCAAACACACCTCACCCACATCTACACCAAGCTCGACGTCACCTCCCGTGTCCAACTTGTACA
+GGAGGCCGCGCAACACTCGACCTAGGATTGCGCGGCCAGCGCAGGCCCGGAGTTCGAATCGGATGCAATA
+CGCAACCAATCTGGGCTCTTCTGCGCGTTGTCGCTGATGTTCATGGCTCTTCGCGCCCCCATGCTTGAGC
+GCATGAACGGTTTGCATACAGATGACGCGCCGGTCAATTGGCTCGAGCGGCGAGGTGGCCGGCTTACGTC
+GAGGCGGAGGGTGACGTTGCTCCATGCTGGAGTGGAACACCCGATGCGGCTGTGGGGCGTCCAATCCGAG
+GCGATAACTGCCGCGATGGTGCTTAGCCGGAAGGTATCGGCCATCATTGCCGGACACTGCGGTGTGCGCC
+TAGTTGATCAGGGCGTGGGCGATGGCTTCGTCGCCGCGTTCGCCCATGCCAGCGATGCCGTCGCATGTGC
+TCTGGAGTTGCACCAGGCTCCGTTGTCCCCGATCGTCCTGCGCATCGGGATTCACACCGGTGAGGCGCAG
+TTGGTCGACGAGCGCATCTACGCCGGCGCCACAATGAACCTGGCTGCAGAGCTACGGGATTTAGCCCATG
+GTGGGCAGACCGTGATGTCGGGTGCTACCGAGGATGCGGTACTCGGCCGGCTTCCCATGCGCGCTTGGCT
+AATTGGCTTGAGGCCCATGGAAGGGTCCCCGGAAAGGCATAACTTCCCCCAGTCACAACGCATAGCACAA
+TTGTGCCATCCGAACCTTCGCAACACCTTTCCGCCGCTGCGCATGCGCATCGCCGATGCGAGCGGAATTC
+CTTATGTGGGGCGGATTCTGGTTAACGTTCAGGTAGTTCCCCACTGGGAAGGAGGGTGTGCCGCAGCGGG
+GATGGTCCTTGCTGGGTGAAGCGCCATTGAGGGCCAGACGATAGGTTGGCCAGCGACGTCCTCAACTCAG
+ACTCTCGGCGCGACCTGACCGGCGGTTACGATCATCTGCTCGGACATTCGCAAGAGAGCGTGCTCGCCCA
+CTCCCTGCGGCAAGGTGTAGGCCAGCTCGCGCAACTTAACCGCGCACTCGTAGAGCGTCTGGCGGAAATG
+CGTTTCGGTCATCGGGGTGCCTTCGCTCGTCGGCGAGATCGGCAGCGGTGTCTTGTGCTCATACAGATCA
+ATCTCATTCATCAGAGCCATCATTCGCCGGCTAGCAGCTGCAAATCATCAGCACATCCACGTATGTCGTC
+GGCTGCCCAGCGCGCAATGTGTGGCACGGCGAGTTGATGTTCAACCTCGGCGTGTCCTGCATACTGGATT
+TCTTACTGTAAAGTCACCCAAATGGGTGGTGCCCGCCGGCTCAAGCTCGACGGGAGCATCCCCAACCAGC
+TCGCCCGGGCGGCCGACGCGGCCGTCGCACTTGAGCGCAATGGTTTCGATGGGGGCTGGACAGCTGAAGC
+CAGCCATGATCCCTTTCTCCCGCTGCTACTGGCTGCCGAGCACACGTCGCGACTTGAGCTTGGCACCAAC
+ATCGCGGTAGCGTTCGCGCGCAATCCGATGATTGTCGCCAACGTGGGCTGGGACCTACAGACGTACTCGA
+AGGGAAGATTGATCCTCGGTCTGGGAACCCAGATCCGGCCGCACATCGAGAAACGATTCAGCATGCCCTG
+GGGTCATCCGGCACGTCGGATGCGTGAATTCGTCGCCGCGCTGCGTGCGATCTGGTTGGCTTGGCAGGAC
+GGGACCAAGCTTTGCTTCGAGGGTGAGTTCTACACCCACAAGATCATGACCCCGATGTTCACACCCGAGC
+CGCAGCCCTATCCCGTTCCGAGAGTCTTCATCGCCGCTGTCGGTGAAGCGATGACCGAAATGTGCGGCGA
+AGTCGCCGACGGCCACCTCGGTCACCCTATGGTCTCGAAACGGTACCTCACCGAGGTGTCGGTGCCGGCG
+CTGCTACGTGGCCTGGCGCGATCGGGTCGCGATCGCAGTGCCTTCGAGGTGTCGTGCGAGGTGATGGTGG
+CCACTGGCGCGGACGACGCCGAACTGGCGGCCGCCTGCACTGCCACGCGCAAGCAAATCGCCTTCTACGG
+ATCCACGCCGGCTTACCGCAAAGTCCTCGAGCAGCATGGCTGGGGCGATCTGCACCCGGAGCTGCACCGC
+CTCTCCAAGCTGGGTGAGTGGGAGGCCATGGGTGGGCTAATCGACGACGAGATGCTCGGTGCTTTCGCGG
+TGGTCGGTCCGGTGGACACGATCGCCGGTGCCCTTCGCAATCGTTGTGAGGGCGTCGTCGACCGCGTCTT
+GCCGATTTTCATGGCCGCATCTCAGGAGTGTATTAACGCCGCACTGCAGGACTTTCGCCGTTGAGCGCGC
+CATCGGTGGATGAGGCCACCAAGATCGCTGCCCGCATAGAGGGCCCGCATTGCGTGCGGATCGGCGTTAC
+CCGGCGGCGGGCACACGGGGCATTACGTACGCCCGCGGCGGCATCCGCAACGCATTGCTAACCCCGCCGA
+ACCCGCCGCCGCTATTGGTCAGTTGCCCCAGCGGTAGCCCGCCCAGCATGTGTCCGGGGGCGGTTTGGGC
+GGCGCTGGTCAGGCTGGTCAGCGGCAGCGCCCGCGCCGCCGGGGTGACCGCCTGGTTGGCCGCGGCCCAT
+GCTGGCGGCACCGACAACGAACCGACCGAGGCCGCCCGACCCAAGTTGGCGGCCACCCCAGCGCCCAGAC
+CTGAAGAACCCAGCGACGAACCCAGCTGGCTGCCCAGCGAGCTCATCGCCTGGACCCCGTTTTGCGCCGC
+GGTTTCCACGGCCTGAGCCGCCGCCGGAGCAAAGCCCTTCAACATCGAGTGCAAGGTGTTGGTCATCGAC
+ACACCCGAGTTGGTCATCGACACGTGGTTGTTGAGCATCGACACGATGTTGCTGATCGGCGACAGATGCG
+GCGAGACCGTCTTCCACAGGCCACCCAGCTTGGAAGAAGGCGTGGTGCCCTGCGTGGGCTGGGCCAGCTG
+TTGCAGCGCCTGGGGCACATTGTTCATCAACTGGTTCGCCGCGGCGGTGTCGGAGGCCTCCTCGACCGCG
+GCGGCCTGCTCGAGGAGCCCACCCGCGCTGGTCATCTCCGGCGCCTCCTCGAACGGCAGCAACGTCGCCG
+TCGCCGTCGCCGTCGCCGCGGCGTAGCCAAACATCGCGGCGGCGTCTTGGGCCCACATCTCGCCGTATTC
+GGCCTCGTTGACCGCGATCGCCGGGGTGTTTTGCCCCAAGAGGTTGGTCGCTATCAGAATCATCAGTTCA
+GCACGGTTCTCGGCGATCACCGGCGGGGGCACCGTCAGCCCATACGCCGTCTCGTAGGCCGCCGCAGCAA
+CCCGGACCTGGGCGGCGGTCAGCTCGGCCTGCCCCGCGGTGACGCTCATCCACGCCACATACGGCGAGGC
+CGCCGCCACCATCAGACCCGCCGACGAACCTATCCACGACCCCACCGTCAGACCCCAGACCACCGACTGA
+AACGCCGACGCGGCCGAAAACAGGTCACTCGCCACGCTGTCCCACATCTGAGCCGCGGCCACCAGCGAGG
+CCGAACCCGGGCCGGCGTACATCCTCGCGGAGTTGATCTCCGGTGGTAACGCCCCGAAGTCCACCACTTC
+GATAATCCTTCCGCTCGGCCATAACTAGCACCAATGATGGACAGCAAACAACGTCGGCAACAGGTCAAAT
+TCTCTCAAGTAGTCACAACCCCAGATGCAAAGTGCACCAGCCGCCCTGCCGCGAAGCTAAATCCAGCTGA
+ACAATCTGAACATCAGGTAAATACAGTGGCAACTAATCTTAAATAACCCGGCCGATTAGACAGCGGCCGA
+GATCTGTTTGAGGTCGGGCCGTGATTGTCCGGAGAACGGCCGGTATCTCGCACGAGCAGCCACCCGCGCC
+CCCGTCAGACTTGGCGACCGCCTACGGCAACCTAAACCGGGGTGAACTTGGTGATCAGCCAATTGCCGTC
+GACCTTGGCTAGGGTCACCATCACGCTGCTGGCCGCCATCGACGGATTGGGGCTGTCCTTACTGGTAGTG
+CTCTGGTCGACAAAAACCAGAACGACGGCCGAATCCGGATGTAGCTCCGACACGGCCGCGCGCACCACCT
+TGGCGGTGGTTTTCAGTGACTTCTGTTTGGCCGCCGGAGCCACGATCTGCTGCGTGAACTGGTCGTAGTA
+GGACAGGAAATCGCCGGCGAGGTGCGACCTGGCGGTAGCGAAGTCTTGGTCGAGCGTGTCGGGTGAATAC
+GACAACAGCGCGATTGTCCCGTCAGACGCCGCGGCGCCGGCAGCACGGGCGGCGCCGGAGTCCGTCTGCT
+GATCGGGTCGGTATTGCTCAAGGTATAGCCATCCCGTCGCGCCCCCAGAGATCAACATGAGCAGGATGAG
+AATCACCGGAACGGGTTTCAAGGTAACCTGCATTCGCCACAGGTCACGGTGCCGCTGACCCTTCTGCGCG
+GTAGATTCCGTTGCAGAGTCGGTGTCAAATGCCTCGGTCGCCGAATCACCGGCTTCGCCTGCGGCTGAGT
+CGATCTCAGCGACTTCGGTGGCGTCAGTGGTTTCGGTGTTGACGTCGCGTACGTCATCGGTCACGGTACG
+AACTCAACTTTCGACATCTTGTACTGTCCCCCCTCTTCGGTCACGGTCACTTTGAGCCGCCACGCACGTG
+GTTCGTCTTTCGCCCCAGCGGAATTGGTGACCCGTGAAGTCGCCGCGACGAGCACCACGGCGGAATGCTC
+GTTCATGGATTCGACGGCTGTCGCGTTCACCGTGCCTTCGGTGACCACTTTGGACTGTTCGACAACCTTG
+GTGAAATCGGCTGCCCGCTGCTGGAAGTCATCCCTGAATTCGCCGGTGGAGCTGTCGATCACACGCGCGA
+CGTCTTCTTTGGCCTTGTTGAAGTCCAGCGAGTTCATGTTGATGACACCTTGCTTGGCTCCGGCGGCGAA
+CGCCGCGGCGCGCTGCTGGCGTTCGGTGGCCTCATGGTGTTGCCACACAATGTATCCGCTGAGCCCGGTG
+AAGCCGCAGATGATGACGACTGCGGCCGCCATGGCAATCGTGGACAGTCTTGGTAACCGCACCCGCAACC
+GCCGTCGCCAGGATGCCGACCGTGCGGCCTCCTGGTCTGCGGCCTCATAGTCGTCATAGTCGTCATAGTC
+TTCGGCGTCTTCCCAGTCTGCATACTCCTCGGGGACGTTCTCGTCCTCGGCTGGGGCCATCGCCAGCGCC
+TCACGCTTCAACCGGGCGGCACGGGCACGGGCCCGCGCCGCGGCGGCCAGCGCTTCGGCTTCGGCGGCTT
+CGGCTTCGGCGGCCAACGCCATCGCGTCGGCTTGCGATGTCCCCGCGTCCGACGGTGGTTCGGTTGTCTC
+AGCCATCGTGGATACAGCCCGTCAGTATCATTCTCGACTGAACTCCGGTATCGCTCACAGTATTGCCCAT
+TGCTAACATTCGAGGCCCCAGCGAACTCCTACGAGGACCGATCAGGCAGACGATCACCCACCTGAGTTTT
+CCCCGGCAGCATGACTGGTGTTGACTCTCTCGAAAACATACTCTTTACTTCGACCCTCCAAGCGTTTCTC
+CAAAAGATTCCCGGTTGTGCCATGTCGTGTCGTGAACGCGTGCAGGCGATGGTCGACGGAACGCCCGTGC
+AGGCTCGTTGAGCCGCCTACTCCTGGGCGAAGATGTCCTCGGTGTCGGCGCCGACAACGGGCAGCTGGAC
+CAGCGACAAGACATGGTGCGCCGGGCTGCCGGGTGGGGCCACCAGCACGCACTCGGTCCCCTGTTTGCGT
+GCCCGGTCACAAGCGGCAGCGAGGGCGCCGACGCCGGCCGAACCAAGGTGGGTGACGGCACTGAGGTCGA
+TCGTCACGGGTGCTATGCCAGAACGGCTTTCGACGGCGATCTGGCGGTCCAATGTGGCTGCGGTGGTCGA
+ATCGACGTCGCCCCGGACAACGATGCGGCCGGATTCAACTAGGGAGACGAATTCGCTGTCGATGGTTTGT
+TGGAAAGCTGCCCGGCGAACCATCGTGTCGGTGACAAACCGCGCCGGCCGCGACAGGCGATGCGTAAGTG
+TGGCAGTCGTTCCGCCGGCGCCATGCATGATGCGCGCCTCCGACACTAGGGCCTCGGCCATCGCCAGGCC
+GCGCCCACGGCCACGGGCGCCGTCGCGGTGGTCCTTCCATTGGCCCCGGTCGATTACCGATGCCCGCACG
+TTGCCGTCGCCGGCCAGCGCGGCCTCGACAACGATGCCCTTGGAGACGTCCGTGGCGTATCCGTGTTCGA
+CCGCGTTCTCGACGAATTCGGAGATCGCGTGCACGATATCGGCGATGTCGGAGTGGTCGGCGCCGATCTC
+TGCCAGCCACTCACGAAGCTGGGCTCGAACGGTTCGTGCCGCGTTGATCGTCGCATCCAGCGTTATGTGC
+AGCGGCGGCGTTGGCGCCCGGCGTTGCATCGCAAGCAGGGTCACATCGTCGTTGTAGCCGGTGGACCGCA
+GCAGCAATTCAAGTGTGTCCGAACAGAGTCGGTCGATGGGCCGTGCCGGGGCGTCGAGCACAAAGCCGCC
+ACTGCCGCTGGCGATGCTGGCCGCTAGGTCGGCAAATTCGGCGGTGCTGGCCTCGAGCGGCCGACCGGGC
+CGCTCGATCAGGCCGTCAGTGTAAAAGAGGATCGCGTCGCCGATGTTGAGCACTTCACTGCGCACTGGAA
+ATCCGGTTCCGCTGCCGAGCGGACCCGCGCCGGTTGGTTCGACATACCGCGCACTCGCGTCCGCGGTCAC
+CAGCAGCGGTGGCGGGTGTCCGGCTGTGCAGTACTGGAATTCGCCCGAGGTGAAGTCGAGCGAGCCGACA
+CACATGGTGGCCGATTTCGATCCAGGTACCTGTTTATGGAAGCGGTCCACTGCCTCAAGCGCCTCGACGA
+CCGTGTACCCCGTCGAGATCTGCATGCGTAACGCCGTACGTAATTGCGACATGACCGCTGCGGCCTCCAC
+GCCGTGGCCCACGACGTCGCCAACGACGAGCACCAACCGATCCCCGAGGGCCAGCGCGTCGAACCAGTCG
+CCGCCGGCCGCGGTATCCTCGGCGGCGACCAGGTACTCGGCGGCTATGTCGGCGCCGGGAACCACGGGCA
+CCGACGCGGCCAGCAACGCCTGCTGCATAACGGTGGCTGAATCGCGCACATTGCGATAGCGCTCGGACAG
+TTCCTCCACGCGCGCCTCGGCCGCCTGCCGGGCTCGCACTCGGCTGGTGACGTCGTCCACAATGAGCTGC
+ACGCCCTCGATCGATCCGTCCGCCCGGCGGCGCGGTGTGACGACAAAGTCGAAGTATCGTTCCTCAACTC
+CGGAACCGTCGTAATCAGTTTGTAGTCGCCACTCCGATCCTGATTGCGGCTCACCGGTTTGATAGACCCG
+GTCCAACATTTCGTAGATCTGCTGACCCTCCAGTTCGGGATAGACCTCCCGAGCGGGCTGTCCCACGGTG
+TCAAGCAATGGACTGAAGCCGCGATAGGCCGCGTTCACTGCGACAAAGCGATGGTCAGGCCCCTCGAGGC
+CAACCAGAATCGCAGGGATGTGCTCGAAAATGCGTCGTACATCCTCGGCCGCACCGACCGTTTTGTCCCA
+GTCCATTTCGGCCGCCATTTGGCCGTCCCTCCTACGGACCGATGTAGCAAACGGGTCAACGTGCGCAGAC
+CAATTCGCCAGGCAACGCAACCAGGTTATCAACGTGCCCTACCAGCTTGCCGGAAAAGCAAAAGTGCGTT
+TGGGGCAGGCCGCCACTTATGTCGCTGACAGCGCGGACTCCGTGGTCGGGTGTACGGGCAGCACGTCGCC
+GTATCCGCAGGCGTGGATGATGCGCGCGACAGCACGGTCGCGGCTTACCAGGCGCACGTCCACGCCCCGG
+CGTCGACACCGTTCGGCCTTGTGAGCAAGGACGGCGACTGCGCAGCAGCCCATGAAATCGAGGCCGTTGA
+GGTTGACCACGAGTGGTTCCGGCGCGGTGGTGGCCGCGGCCGCCTTCGTGACCAGATCTTGCCAAGTGTG
+CTCATTGGCGGCGTCGATCTCGCCACGCGCATGGATAATCACAGCCGAGTCGTGGTGCTGGATGGTCGCC
+TTGAGCGCGTTGCTCACCGGAGTAGTGAATGACCCTGCCTGAGTCGGGTTCATGGTGCACTCCTCATCGG
+CGGCACCCGAGCCCCCAATTGGATTGCCGGTCCTGCGCGCCGCGGAAAACCGTCGTCTTTGTATAGCAAG
+GCCGGCCCGCTCCGTCTATAGCGCCGAAGCCGGCGGCCAATGAGCTTCTCGGCGTCCTCGGAGCCGACCC
+CATTCTCCGCGCGGGTGGCCCCGCAGATGCGATCCAGCAACCCCGCCGACTCGCTCCGGACAGGTGGTGG
+TAGCCCTCGTAGGCTCAGCAATCGTGGACTTGCATTCACGACCACCGTGGTCGAACAACGCGGTGCGTCG
+TCTTGGCGTGGCACTGCGCGACGGAGTTGACCCGCCGGTCGACTGCCCGTCGTACGCCGAGGTGATGCTG
+TGGCATGCGGACTTGGCCGCCGAAGTCCAGGACCGGATCGAGGGCCGGAGTTGGTCTGCGTCGGAGTTAT
+TGGTTACCTCACGTGCGAAGAGCCAAGACACCCTGCTAGCAAAGCTGCGGCGTCGGCCTTACCTGCAACT
+GAACACCATCCAAGACATCGCAGGTGTCCGCATCGATGCCGACCTCCTGCTGGGCGAGCAGACGAGACTT
+GCTCGCGAGATCGCCGACCACTTCGGTGCTGACCAGCCCGCTATTCATGATCTGCGTGACCACCCGCACG
+CCGGCTACCGGGCCGTTCATGTCTGGCTTCGGTTACCTGCCGGTCGTGTCGAGATACAGATTCGCACCAT
+TTTGCAGAGCCTGTGGGCCAACTTCTACGAGCTTCTCGCTGACGCGTACGGTCGGGGCATCCGCTATGAC
+GAGCGGCCGGAGCAGCTAGCGGCCGGCGTTGTCCCGGCACAGCTTCAAGAGCTGGTAGGGGTTATGCAAG
+ACGCTTCAGCGGATCTGGCGATGCATGAAGCCGAGTGGCAACACTGTGCAGAGATCGAATACCCCGGCCA
+GCGGGCGATGGCGCTTGGCGAGGCGAGCAAGAACAAGGCGACGGTGCTCGCAACGACCAAGTTTAGGCTG
+GAAAGGGCCATCAATGAGGCCGAGTCGGCAGGGGGAGGTGGGTGAGGTGGCTGGCTATGTCGTCGAATAC
+AACCGGCGCACCCACGTGCGTCGCATCACCGAGTTCGCCACCCCGCAAGAAGCGATGGAGCACCGGTTGA
+AGCTGGAAGCCGAGCGCACCGACAGCAATATCGAGATCGTTGCGCTCGTCAGTAAGTCGTTGGGAACCCT
+GAAGCAAACGCATTCGCGGTACTTCACTGGTGAAGAGCTGAACGTCGGAAACGGCGCGCGGTAGGCCCTT
+GGGTTTCCGCGAGTGTGCCGGGTCCGGTCGACATGGGGAGGTTCGGTCAACATGTCTACCCAGCACTAGA
+GCCCGAGCGCCCGATAGGTGCGGCGGACGAATTTTGGTTGCGCGGTCCGCAGTTTCGCCAGGGATGGGTT
+ACCCGCGACGGCCGCGGCAGCGTCCACGGACAGATCGGGACAATGCTGGATCAGATACAGCAGTATCAGG
+TCGGCGCTCGGGTCGGCCTGCCACCATGTCCCGTACGCGCCGGGCCAGCTGAAGGTCCCGAGCCCGCCCG
+GCCCGAACAGCGGCCTGGACTTCGCCGGATCGGTCACCACCGATAGGTTCAGCCCGAAGCCGCGGCCCAC
+CCAGAACGGCGCCCCCAGAAAGCTGTGCCGTTTCTGCTCGTCGGTCAGCCGGTCGGTGCGCATCAGGCGC
+ACCGATTCAGGTGACAACACCCGGACCCCGTCGACCGTCCCGTCGCCCAACAGCATCCGCACGAACCGCA
+GGTAGTCATCGGCGGTCGACCACAACCCGCCGCCGGCGTTACAGAACGACGGCGGCGTGACGTGTGGCGG
+CCCCATCACGTCGTGCCGCAACCGGTCTTGTTCGTCGAGCCGGTACATGGTCGCGGCCCGTCGCTGCGCG
+TCGGCCGACACGTAGAAGCCGGTGTCGGTCATTCCTGCCGGACCCAGCACTCGCTCGTCGATGACCTGGT
+ACAGCGGTGCGTCCTCGATGCGGGAGACAATGACACCCAAGACGTCGATGGCGTGGCTGTAGGTCACCCG
+GTCGCCAGGTTGGTGCACGAGCGGAAGGGTTGCCAGCGCTGCCAGCCAAACGTCGGGACCCTGGCCGAAC
+GGCAGTCGCTGATAGGCCCGCGAAATTGGCCCCGACACCGAGAAACCGTAAGCCAGGCCGCTGGTGTGAG
+TGAGCAGGTCCTCGATCAAAATGGCTCGTCGCGCGGGATGTGTGCGATCCAGCGGGCCGGCGGCATCGTC
+CAGCACGGCCACCTTGCAGAGCTCCGGTGCCCAACGCGTGATCGGGTCACGCAGTGCCAGTTTGCCCTCG
+TCGACCAGGCTCATCGCCGCCGCCACCGTGACCGGCTTGGTCATCGACGCGATGCGAAACAGCGTGTCGC
+GTTGCATGGGCACGCCCGCGTCGATATCGCGATAGCCGATCTCGTTGACTTGCAACAATTTTTCGCGCTG
+CCAGACCATGGTTACCGCGCCGGAAAGCAGGCCCGCGTCGCATACCTCGCGGATGGACGCCTGATTGCCG
+TCGAGATTCACCCGGTTCAGGATACTGTCCGAGCCAGCGCGGCTCGGCGGATTACTGATTGTGCGAACGT
+TTTCCCGCGCACCGGTCGCGTGTTACTGTCGCGCTCTCCGGCGAATGTGATCTGGGGAACATGCTGTGAG
+CGCGGCGGCATGCTAGTGACGATGGTGTCGCTGCTGGTGAACCAGGGTGTGGGTAGGCAGTCACCGAGAC
+CCGCAACCATGGACGGGGCTGGATTCGAGGCTCCGTGCATGCCGTACGACTAGGGGTAGCGCCCAGCTGC
+TCAATACCATCGGTTGGATAACAAAGGCTGAACATGAATGGCTTGATCTCACAAGCGTGCGGCTCCCACC
+GACCCCGGCGCCCCTCGAGCCTGGGGGCTGTCGCGATCCTGATCGCGGCGACACTTTTCGCGACTGTCGT
+TGCGGGGTGCGGGAAAAAACCGACCACGGCGAGCTCCCCGAGTCCCGGGTCGCCGTCGCCGGAAGCCCAG
+CAGATCCTGCAAGACAGTTCCAAGGCGACGAAGGGCCTGCATTCCGTCCACGTGGTGGTGACGGTAAACA
+ATCTCTCGACCCTCCCGTTTGAGAGCGTCGATGCCGACGTGACCAACCAACCGCAGGGCAATGGCCAGGC
+GGTGGGCAACGCCAAGGTCAGAATGAAGCCCAACACCCCGGTGGTGGCCACCGAGTTCCTGGTCACGAAC
+AAGACCATGTACACGAAGCGGGGCGGCGACTATGTCTCGGTGGGTCCGGCGGAGAAGATCTATGACCCGG
+GCATCATCCTGGACAAGGACCGGGGGCTGGGCGCGGTCGTCGGGCAAGTGCAAAACCCGACAATCCAGGG
+ACGTGACGCCATCGACGGCCTGGCCACCGTCAAGGTGTCCGGGACCATCGACGCCGCGGTGATCGATCCG
+ATCGTGCCTCAGCTAGGTAAGGGTGGGGGCAGGCTCCCGATAACCTTGTGGATCGTCGACACCAACGCCT
+CAACGCCGGCACCCGCCGCGAACCTGGTGCGGATGGTCATTGACAAGGACCAAGGCAACGTCGACATCAC
+GCTGTCCAATTGGGGTGCGCCGGTCACCATCCCGAACCCGGCGGGATAACAGGCGCGAACCGGCCCGGTC
+CAGCCCCATCGCTGGTCGATGGCCTGGCCGGTCCGGTACTCGTCCGCGGGCGGAGGCCGCCTTCGAAGAA
+ATCCTTTGAGAATTCGCCAAGGCCGTCGACCCAGCATGGGGTCAGCTCGCCAGCCGCGCCGGCTGGCAAC
+CGTTCCCGCTCGAGAAAGACCTGGAGGAATACCAGTGACAAACGACCTCCCAGACGTCCGAGAGCGTGAC
+GGCGGTCCACGTCCCGCTCCTCCTGCTGGCGGGCCACGCTTGTCAGACGTGTGGGTTTACAACGGGCGGG
+CGTACGACCTGAGTGAGTGGATTTCCAAGCATCCCGGCGGCGCCTTCTTCATTGGGCGGACCAAGAACCG
+CGACATCACCGCAATCGTCAAGTCCTACCATCGTGATCCGGCGATTGTCGAGCGAATCCTGCAGCGGAGG
+TACGCGTTGGGCCGCGACGCAACCCCTAGGGACATCCACCCCAAGCACAATGCACCGGCATTTCTGTTCA
+AAGACGACTTCAACAGCTGGCGGGACACCCCGAAGTATCGATTCGACGACCCCAACGATCTGCTGCACCG
+GGTCAAAGCGCGGCTAGCCGAGCCAGCGCTGGCCGCCCGGATCAAGCGCATGGACACACTCTATCAACGC
+CATCGTTGCAGTACTGGCCGTGGGTTATTTCGCGGTTCAGGGTGTGCGGTTGGTGGAACCGAGCTGGATG
+CCGCTGTGGGCCTTCGTGATTGCGATGGTTCTGCTGCGCAGTTCGTTGGCCGGGTTCGGTCATTACGCAC
+TGCACCGCGCGCAACGAGGCCTCAACCGGGTTTTCAACAATGCCTTCGATCTCAACTATGTGGCCTTGTC
+CTTAGTCACCGCCGACGGACACACCCTGCTGCACCACCCGTATACCCAGAGCGAGGTGGACATCAAGAAG
+AACGTGTTCACGATGATGATGCGGCTACCGTGGTTGTATCGCGTTCCCGTACATACGATTCACAAATTTG
+GCCACATGCTCAGCGGCATGGCGATCCGGATCGTCGACGTCTTCAGGATCACGCGCAAGGTAGGTGTCGA
+GGAATCCTACGGAAGCTGGCGTGCCGCGCTTCCACACTTCCTTGGATCGGCCGGGGTGCGCTTGCTTCTG
+GTGAGTGAATTGGTGGTCTTCGCGATCGCCGGCGACTTCTGGCCCTGGGCACTGCAATTCGTAGCGACGC
+TGTGGGTTAGTACCTTCTTGGTGGTGGCGAGCCATGAGTTCGAGGACGACACCCAGGGCGGTGCCGTCAA
+CGGCGAGGACTGGGGCATAGATCAACTCGAGCACGCTAATGACCTAACGGTGATCGGGAACCGCTACGTC
+GACTGCTTCCTGTCAGCCGGCCTGAGCTCCCACCGAGTCCATCACGTGCTGCCGTTTCAGCGCAGCGGCT
+TCGCGAACATCGTCACCGAGGACGTTTTGCGTGAGGAAGCAGCGAAGTTCGGTGTCGAGTGGCTTCCCGC
+AAAGGGTTTCATCACCGATCGGCTGCCGAGGCTGTGTCGGAAGTATCTGTTGACGCCGTCGCGCCAAGCC
+AAGGAGCGTCATTGGGGTTTCGTCCGCGAGCACTGCTCGCCGGCGGCATTGAAAGCCAGTGCCAGCTACG
+TGGTTGCGGGTTTCGTCGGAATCGGGTCGGTATGAACGTCTCAGCTGAGAGCGGTGCGCCGCGCCGGGCC
+GGCCAGAGGCATGAGGTTGGCCTTGCCCAGTTGCCGCCGGCTCCGCCCACCACGGTGGCGGTGATTGAAG
+GGCTTGCGACGGGCACGCCGCGTCGGGTAGTCAACCAGTCCGACGCCGCCGATCGGGTCGCCGAGCTTTT
+CCTCGATCCCGGTCAGCGGGAACGGATTCCGCGGGTGTATCAAAAATCGCGGATCACCACGCGCCGGATG
+GCGGTCGACCCGCTCGACGCCAAATTTGATGTCTTCAGGCGGGAACCTGCGACGATCCGTGATCGGATGC
+ATCTGTTCTACGAACACGCGGTTCCGCTGGCGGTGGACGTGAGCAAGCGTGCCCTGGCCGGCCTGCCATA
+CCGTGCCGCCGAGATCGGGCTGCTGGTGTTGGCCACCAGCACCGGATTCATCGCGCCGGGCGTGGACGTT
+GCGATCGTCAAAGAGCTCGGGCTCTCCCCGTCGATATCACGTGTCGTGGTCAATTTCATGGGATGTGCCG
+CCGCGATGAATGCCCTGGGCACCGCCACCAACTATGTTCGTGCCCACCCGGCCATGAAGGCGCTGGTGGT
+GTGTATCGAATTGTGCTCGGTGAACGCTGTTTTTGCCGACGACATCAACGACGTCGTCATTCACAGCTTG
+TTTGGCGACGGGTGCGCGGCGTTGGTGATCGGCGCCAGCCAGGTTCAGGAGAAGCTCGAGCCAGGCAAGG
+TGGTAGTCCGCAGTAGTTTCAGTCAGCTGCTCGACAACACCGAAGACGGTATCGTGCTTGGCGTCAATCA
+CAACGGCATCACCTGCGAGCTGTCGGAGAATCTCCCCGGCTACATCTTCAGCGGGGTCGCACCGGTGGTG
+ACAGAGATGTTATGGGACAATGGATTACAGATATCCGATATCGATCTCTGGGCGATCCATCCGGGTGGCC
+CCAAGATCATCGAGCAGTCGGTGCGCTCGCTGGGGATCTCCGCGGAGCTGGCGGCGCAGAGCTGGGACGT
+GCTCGCCCGCTTCGGCAACATGCTCAGCGTATCGCTTATCTTTGTGCTAGAGACGATGGTGCAGCAGGCG
+GAGTCGGCCAAAGCCATCTCGACGGGGGTGGCGTTCGCGTTCGGGCCGGGCGTCACTGTCGAAGGCATGC
+TGTTCGACATCATCCGACGGTGACCGCCATGAATTCAGAACACCCGATGACCGACCGGGTTGTGTATCGA
+TCGTTGATGGCCGACAACCTGCGATGGGATGCCCTGCAATTGCGCGACGGCGACATCATTATCTCGGCGC
+CGTCCAAGAGCGGCCTGACCTGGACACAGCGCCTGGTGTCCCTGCTGGTGTTCGACGGGCCCGACTTGCC
+CGGACCCTTGTCGACGGTGTCCCCGTGGCTCGACCAGACCATTCGGCCCATCGAGGAAGTGGTCGCTACT
+CTCGATGCCCAGCAGCACCGCCGGTTCATCAAGACCCACACGCCGTTGGACGGCCTGGTGCTCGACGACC
+GCGTCAGCTACATCTGCGTAGGACGCGACCCGCGCGATGCCGCGGTGTCAATGCTGTACCAATCGGCCAA
+CATGAACGAAGACCGGATGCGGATTCTGCACGAGGCCGTAGTGCCGTTTCACGAGCGAATCGCCCCCCCC
+GTTTGCGGAACTCGGTCATGCGCGCAGCCCGACCGAGGAGTTCCGGGATTGGATGGAGGGGCCGAATCAG
+CCTCCCCCTGGCATAGGTTTCACACATCTGAAGGGGATCGGCACTCTGGCCAACATCCTGCACCAGCTAG
+GCACGGTATGGGTCCGCCGTCACCTACCCAACGTGGCCTTGTTTCATTACGCCGATTACCAGGCGGACTT
+GGCGGGCGAGCTGCTCCGGCTGGCAAGGGTCCTCGGTATCGCCGCGACCCGCGATCGAGCCCGGGACCTG
+GCGCAGTACGCCACGCTGGATGCGATGCGCTCCCGCGCGTCAGAAATCGCTCCTAACACCACCGACGGCA
+TCTGGCACAGTGACGAGCGTTTCTTCCGCCGGGGCGGGAGTGGCGACTGGCAGCAGTTCTTCACCGAAGC
+CGAGCACCTGCGCTACTACCACCGCATCAACCAGCTGGCGCCACCTGATCTGCTGGCCTGGGCACACGAG
+GGCCGCCGGGGATACGACCCGGCCAACTGAGGTTCAGTGCCGCATTCTCTCCTGTCAGTTGCTGCACTTT
+AGACGCTCAATGCGCTGCGACAACATTAAATGTCAGCAGTCACACCCAGTGTGGGGGAAATTTGCATATG
+CGATTTAGTTGTGTGTAGCTTGCTTTGCTGTCTGTACGACTGCACCGAGGGGTGAGCGCGTGTCGCACGA
+AAGTCTGTTCGAAGAAAGCGAAGCGCCCTACGCGGCGCTGTGCGTAGTTGCCAACTTCACGACAGACGGC
+GAGTGAGCAGGCGCTCATCACCAGGGCTACGAGCCCAGCACAGGGGACGCGGTGAAGCGCATGTCCCACG
+AATCCGTGTTCCAACAGAGTGAAGCGCTCTACACGGCATATTTTTCGCCCAACGGCGAATGAGCGAGCGC
+CGATCGGTGCGTTAGGCCGGGCGGGCGACCGCCCCCGTCGCCCCTTTAAGTGCGCATGTGCGTAGTCCAG
+TCGAGGGTCGGGAGCTGGCCCAGTGCCCCAAGATGCGATGCGGCTGGCCACATTCTCATCCGCAACGCTA
+GTTACCACAAGTCACACCATACCCATTTTGGCAGAAACTATTGCACATACAGATAATTGTCGGTAGCTTG
+TCTTGCGGTGCAGAGAACGGAGGAGGGAATCGCGTGCCCCACGAAATCTTGTTTGACGCGGACGAAAAGG
+CATTCTCGGCGTTTTGCATTATCTCGTTTACGACCGACAGCGAGTGAAGCTGCGGTCATCGGGGGCGCCA
+CTCCCAGAGAGGAGAGGAGGTGAATCGCATGTCACAGGAAACCTTGTTCCAAGAAAGCCAAGCGCTCTAC
+GCCGCGTATTTCTTTGCGGCCGACGGTGAATGACCGGTCGCCGATTGGCGCGATTCCCCGCATTCAGGGC
+TGGCGTAGCGCAAGACGATGACGTGGGGTCGACCCTGAGTCAGGGCTCGACGACAGGTGTGTTGTCGGGC
+CCGAATTGGTCGTACTGGCCAAGCCGTGTATTAGGGTCTGCGGACCCGACGACGATCGCTCACCGGCACG
+GCACCCACCGCATCACTAGCCCGGACGAGACCTGGCTGGCCCTGCAGCCCTTTCTCGCGCCAGCAGGCAT
+TACCAGGGTCGCCGACGTGACATGGCTGGATTGTCTTGGCATTCCAACGGTTCAGGCGGTGCGCCCAGCA
+TCGCTGACGTTGTCGGTCAGCCAGGGCAAAGCCGCCAGCTATCGGGCTGCCCAGGTCTCGGCGGTGATGG
+AGTCCTTGGAGGGATGGCACGCCGAGAACGTCACTGCCGACTTGTGGTCTGCGACCGCCCGGGATCTCGA
+GGCAGACCTGACTTACGACCCCGCCCAACTTCGCCACCGGCCGGGCAGCCTCTACCACGCCGGCGTCAAG
+CTCGATTGGATGGTCGCGACGACGTTGCTGACCGGTCGCCGGACCTGGGTACCGTGGACGGCGGTGCTGG
+TGAACGTGGCAACCCGCGATTGCTGGGAACCGCCGATGTTCGAGATGGACACCACCGGACTGGCCTCCGG
+CAACTGCTACGACGAGGCCACCTTGCACGCCTTGTACGAGGTGATGGAGCGGCATAGCGTGGCTGCAGCG
+GTCGCCGGAGAGACCATGTTCGAGGTGCCAACTGACGATGTCGCCGGCTCTGACAGCGCCCACCTGGTTG
+AGATGATCCGTGACGCCGGGGACGATGTGGACCTTGCCCGCATCGATGTCTGGGACGGTTACTACTGTTT
+TGCCGCCGAGCTCACCTCCGCGACGCTGGAGGTGACCTTCGGCGGGTTCGGGTTACACCACGACCCTAAC
+GTGGCGTTATCGCCGGCGATCACCGAAGCCGCCCAGTCGCGCATCACGGCAATCAGCGGAGCCCGCGAGG
+ACCTCCCGTCGGCGATCTACCACCGGTTCGGCCGGGTGCATACATACGCGAAGGCGCGAAAGACGTCGTT
+GCGGCTGAACCGCGCGCGGCCGACACCGTGGCGGGTGCCCGATGTCGACTCGCTGCCCGAGTTGGTGGCG
+TCGGCGGCGACGGCGGTGGCCAACCGATCCGGCACCGAGCCGCTGGCGGTCGTGTGCGACTTCGCCGATG
+CCTGTGTCCCCGTGGTGAAGGTGCTCGCCCCGGGCCTCGTGCTGTCGAGCGCATCGCCGATGCGCACACC
+CCTACAGGAGGCTGAATGACGGCCTGCGGCAGGATTGTCGTCACCGCTGGGCCCACGATTAGCGCCGCGG
+ACATCCGCTCGGTGGTGCCGGATGCCGAGGTGGCGCCGCCGATTGCGTTTGGCCAGGCGCTCTCCTATGA
+CTTGCGGTCGGGTGACACGCTGCTGATTGTCGACGGATTGTTCTTTCAGCAGCCGTCGGTTCGACATAAG
+GAGCTTTTGACGTTGATGGCCGACGGTGTCCGAGTCGTCGGATCGTCGAGCATGGGCGCCCTGCGGGCCG
+CTGAGCTGCATCCATTCGGCATGGAGGGCTATGGCTGGGTCTTCGAAAGCTACCGAGATGGGGTACTCGA
+GGCCGACGATGAGGTCGGCGTGGTGCACGGCGACGCCGACGACGGCTACCCGGTCTTCGTCGACGCGCTG
+GTGAACATGCGCCACACCCTGGCGCGGGCCGTCGCAACTGGTGTGGTGTGCTCCGAGCTGGCCGAGCGGA
+TCATCGAGACCGCGCGGGCCACACCGTTCACCATGCGCACCTGGGCGCGGCTGCTGAGTGAGGTCGGCGC
+CCCGGACCAGCGCGGCCTCGCCGCACAGTTGCGGTCACTGCGGGTCGATGTCAAACACGCCGATGCGCTG
+CTGGCGTTGCGGCAGCTCGGCCAGCGCCCCCGGGTGGAGCCGCTTCGTCCGGGTCCGCCGCCCACCGTGT
+GGTCGCGGCGGTGGCGGCAGCCATGGGCACCGCCCACCTCCGTCGCCGCATCGGCCGACCACGGCGAGTC
+TTTTGTCGACGTCACCGACTTGGAGGTCTTGTCGTTTTTGAGCGTGAGCTCGGTTGACTACTGGGCCTAC
+CGGCCAGCACTGCAACAGGTCGCTGCCTGGTACTGGACGTTGAAACACCCCGAACAATCCGGAAGCGTCG
+GTGAGCGTGCCGCACGAGCCGTCGCCGAGGTGGCATCGGAGGGCTACGGGCGCGCCCTGGAATTCATTGC
+CTATCGCTACGCACTTGCCACCGGCATCATCGACGAGACCGGCTTTCCCGAGGCGGTCGCAGCGCATTGG
+CTCACCACCGAAGAGCGCCACGGCCTGGGCAATGACCCCATCTCGATCTCGGCGCGAGTGATCACCCGCA
+CGTTGTTCGTCGTCCGGTTATTGCCGGCGATCGACCATTTCCTTGACCTGCTGCGGAAGGACTCCCGACT
+GCCCCGATGGCGTGCCATGGCGGCCCACGCACTCTGCAAGCGCGACGATCTGGCCCGGCAAAAGCCGCAC
+CTGAACCTGGGCCGGCCCGATCCGACGCAATTGAAGCGCCTCTTTGGGGCCCGATGGGGGACCCAGGTGA
+ACCGCATCGAGTTGGCCCGGCGTGGACTGATGACCGAGGACGCCTTCTATGCTGCCGCCACCCCGTTCGC
+CGTCGCGGCCGTCGACGACCAACTGCCGCGCATCGAGGTCGGCACCTTAGGACCCGCGCCGCTGAGCGCG
+GACGTTCCAGAACGCCATTTCGACTTCGGTTCCGTCTAACTCGCGGCGCACGGTGGCGGGCTCCAGCGAC
+TCGATATCCCAGCCAGCGCCACCGAGGACGTCGCGCAGCGTTTGCTCGGATACCGTCGACCGCGGCCATT
+CCTCATCGGGCGGCATGGCGTTGGAGAAGCAGCTGAGTAGCAGGGTGGCGCCCGGTCGGGTGGCCCGGTG
+CACCGAGGCGGCGTAGCTGCGCTTGCCGTCGTCGTCTAGGCAGTGGAACATCCCGCAGTCGATCACGGTA
+TCGAACGCGCCGGTGTAGCCGGTCAGCTTGGTGGCGTCACCCACTGCGAACTTGACATCGACTCCGGCGT
+CGCTGGCTCGCCGTTTGGCGGTGGTCAGCGCGGTGGGAGAGATGTCCAACCCGGTCACCTGGTAGCCGTT
+CCTGGCGAGGTAGATCGCGTTGTCACCGAGCCCGCACCCGATGTCGAGCACGTCGCCGTGCACCCAGCCG
+CCGGTGTGCCAGCCGATGACATTGTCCTTGGGCGCTTTGGTGTCCCACGGCGGTGTCGTGATCGGCGGGA
+GGCCCTCGCCGGGGCTTTCGCCACGGTAGAGCGCGTCGAAATCTATACCTGGCATGCTGGCCAGCTTAGG
+CGGCGTGTAGGTGGGTGAGGGCGACACCGATTCTGGCTTCCACCTGGCTAACGTCTATCTCCAACGGCCC
+GGGCAGTGGTGGCGCGGTGCAGTGATAGTACATCCCGGTGGGCGTGGTGAATTCAGCTGTGTGACGGCCG
+GTTTCGTCCGTGTCGGTGCTGACGCGCCAGCCGGGAGCTTCCTTGACGTAGTTACAGCGTTCACACGATC
+CGAGGCCGTTGGTCGCGGTGGTCGGGCCGCCTCGATGATGCGGCTGGGCGTGGTCACGGTGGCGGATCGG
+GGCATCGCAGTAGGGCATGCGACAGCGCTGATCGCGCAACCCGATGAACGCGGCCAGCCCCTTCGGGAAC
+CGGCGTGCCCGCGATTCCATCGCCACCAAGGCCCCCGAGCGCGGATGACGGTAGAGCCGGCGCAGCGTGG
+CCCGTGACCGCGTATCGGCAACCGCGTCGCGCACCAGGTTGCGGGCCACGGCCGCCGGGATGGGGCCATA
+CCCGTCGACCACCGCCGGGGCGCGGTCGCCAGCTAACAGTGTCTCGTCGGAGAGCACCAGGTTGACCGCT
+ACCGGTTGGGCCGCCTCGGCGGGTTGTCCGGTGACCCGCTCGACCAACGTGTCGGCCATTACCTGGCCCC
+GTGTCCGATCGTCGAATGTCGTGTCGGCGGCCCGCTTGAGCGCCGCATAGACCGACACGCCTCGGGCCAC
+CGGAAGCAACGCCGTCACCCAGGTCATGGTGTCGGGGGCCGGGCGGATCGTCACCGTGCGTTCGGTCTCG
+GCCCTGGCGGCCCGCTCCACCACCGCCTGGGCATCGAGCCGGTAGGCAATCGCCCGGGCCGCGGCGGCGA
+TCCGCGCATCACCCATCCCGTCCAATGCGGACATGTCGGCGCACAGCTCGGCGTCGAGTGCGCGGCGATC
+CTCGACGTCCAGGCAGGCCGACTCCCGCACGATCAGCGTGGCCCGCCACTCCGATAGCCGCCCGACCTCG
+AGCGCGGCGAGTGTGTGCGGCATCTCATACACCAACGCCTTCGCGAACCCCAGGTGGCGCCCGCCGCGCG
+CCGGCGAATCCCGTCGCGCCAGCGCTACTTCACTGGCCACCCCACGCCCGCGCCGCCGTGCCGGCACCCC
+CGCATCCGCCTCATTGCAGCGACGCAACTTGTCCAGCGCCGCCGCAGCACGTGCCTGACCGGCGGCCGCG
+GCCGATTTGACCCGCTCCAGCTCGGCGATCCGCGCGGTCAGGCTCGCCTCATCGTCGCGCGAATCCACGC
+CCGCGAGGCTCACTAAATCGAACATGTGTTCGAGTATAGCAGGCCTGGGCCACCACGGCCACCGCACCGC
+GGGCCCGCAGCGTGCGAGTGCTACGCTGCCGAGCGGTCGACATCCTTTAACGATCCGTCCAGAGAGGTGG
+AGAAGGAGGTCAAGGTTTCCCATGGGTGCTGCGGGTGATGCCGCAATCGGCCGGGAGTCCCGCGAGTTGA
+TGTCCGCGGCCGACGTCGGCCGCACGATTTCGCGCATCGCGCATCAGATTATCGAGAAGACCGCGTTAGA
+TGACCCAGTCGGACCCGACGCGCCGCGGGTGGTGCTGCTGGGAATCCCGACCCGTGGCGTGACGCTGGCG
+AATCGCCTGGCCGGCAATATCACCGAATACAGCGGCATCCACGTCGGCCATGGCGCGCTGGACATCACCC
+TGTACCGCGACGATCTGATGATCAAGCCGCCGCGGCCCTTGGCGTCGACGTCGATCCCGGCCGGTGGGAT
+CGATGACGCGCTGGTGATCCTGGTCGATGACGTGCTCTACTCCGGGCGCTCGGTGCGTTCCGCCCTGGAC
+GCGCTGCGCGACGTGGGCCGGCCGCGGGCGGTGCAATTGGCGGTGCTGGTCGACAGGGGTCACCGGGAAC
+TGCCGCTGCGCGCCGACTATGTGGGCAAGAACGTTCCGACCTCGCGCAGCGAGAGCGTGCACGTGCGGCT
+GCGCGAGCACGACGGCCGTGACGGCGTGGTGATCTCGCGATGACCCCAAGGCACCTGCTGACCGCCGCCG
+ACCTCAGCCGCGACGACGCCACCGCCATCCTCGACGACGCCGACCGGTTTGCGCAGGCGCTGGTCGGTCG
+CGACATCAAGAAGCTGCCGACGCTGCGGGGCCGGACCGTCGTCACGATGTTCTATGAGAACTCCACCCGC
+ACCCGGGTGTCGTTCGAGGTAGCGGGTAAGTGGATGAGCGCCGACGTGATCAACGTCAGCGCTGCCGGAT
+CTTCGGTAGGCAAGGGTGAGTCGCTGCGGGATACCGCGCTGACCCTGCGCGCGGCCGGGGCTGACGCGCT
+GATCATCCGCCATCCCGCGTCCGGCGCCGCCCATCTGCTGGCGCAGTGGACCGGCGCCCACAACGATGGG
+CCGGCGGTGATCAACGCCGGTGACGGCACTCATGAACACCCCACGCAGGCGCTGCTTGATGCGCTGACCA
+TCCGTCAGCGCCTCGGCGGCATCGAAGGCCGGCGCATCGTGATCGTCGGCGACATCCTGCACAGCCGGGT
+CGCCCGCTCCAACGTCATGCTGCTGGACACCCTGGGCGCCGAGGTGGTGCTGGTGGCGCCACCCACATTG
+CTACCGGTCGGGGTGACCGGCTGGCCGGCCACCGTCTCCCACGACTTCGATGCCGAGCTGCCCGCCGCCG
+ACGCGGTATTGATGCTGCGGGTACAGGCCGAGCGGATGAACGGCGGTTTTTTCCCGTCCGTACGGGAGTA
+CTCGGTCCGCTACGGGCTAACCGAGCGGCGCCAGGCGATGCTTCCCGGCCACGCCGTGGTGTTGCACCCG
+GGACCGATGGTGCGTGGCATGGAGATCACATCTTCGGTCGCGGACTCGTCGCAATCGGCTGTGCTGCAAC
+AGGTTTCCAATGGAGTCCAGGTGCGGATGGCGGTGCTGTTCCATGTGCTGGTGGGAGCGCAGGATGCCGG
+TAAAGAGGGTGCGGCGTGAGCGTGCTGATTCGTGGTGTGCGGCCCTACGGCGAGGGGGAGCGGGTCGACG
+TACTCGTCGATGACGGCCAGATCGCCCAGATAGGACCGGATCTGGCGATCCCCGATACGGCCGATGTCAT
+TGACGCCACCGGACACGTGCTGCTGCCCGGGTTCGTCGATCTGCACACCCATCTGCGCGAGCCGGGCCGC
+GAGTATGCCGAGGACATCGAAACCGGTTCGGCCGCGGCCGCTTTGGGCGGCTACACCGCGGTGTTCGCGA
+TGGCCAACACCAACCCCGTGGCCGACAGCCCGGTGGTCACCGACCACGTCTGGCACCGCGGCCAGCAGGT
+CGGCCTGGTCGACGTGCACCCCGTCGGCGCGGTCACCGTCGGGCTGGCCGGAGCCGAGCTGACCGAGATG
+GGCATGATGAACGCCGGCGCCGCCCAGGTGCGGATGTTCTCCGACGACGGGGTCTGCGTGCATGACCCGC
+TGATCATGCGCCGCGCCCTGGAATATGCCACCGGTTTGGGCGTGCTGATCGCCCAGCACGCCGAGGAGCC
+CCGGCTGACGGTCGGCGCCTTCGCGCACGAGGGACCCATGGCGGCGCGGCTGGGCCTGGCGGGATGGCCG
+CGGGCCGCCGAGGAATCGATCGTCGCCCGCGACGCCTTGCTGGCCCGTGACGCCGGCGCCCGGGTGCACA
+TCTGTCACGCGTCGGCCGCGGGCACCGTCGAAATCCTGAAATGGGCTAAGGACCAGGGTATTTCGATCAC
+CGCCGAGGTCACCCCCCACCACCTGTTGCTCGACGATGCCAGATTGGCCAGCTATGACGGCGTGAACCGG
+GTCAACCCGCCGCTGCGCGAAGCTTCCGACGCGGTCGCCCTGCGACAGGCGCTGGCCGACGGGATCATCG
+ACTGTGTGGCCACAGATCACGCCCCGCATGCCGAGCACGAGAAATGCGTCGAATTCGCCGCGGCCCGGCC
+CGGCATGCTCGGGTTGCAGACGGCATTGTCGGTGGTGGTGCAGACAATGGTGGCGCCCGGCTTGTTGAGT
+TGGCGCGATATCGCGCGGGTGATGAGTGAGAACCCGGCGTGCATCGCACGCTTGCCCGATCAGGGCCGGC
+CACTGGAGGTGGGGGAGCCGGCCAACCTGACGGTGGTGGACCCCGACGCCACCTGGACGGTCACCGGCGC
+CGACCTGGCCAGCCGGTCGGCCAACACGCCGTTTGAGTCGATGAGCCTGCCCGCCACCGTGACCGCGACC
+CTGCTGCGCGGGAAGGTGACCGCGCGCGACGGGAAGATCCGGGCATGAACTCCGGCACGCTGGCGGGGTC
+GCTGATCTTCGCGGCGGTGCTCGTCATGCTGATCGCGGTGCTCGCTCGGCTGATGATGCGCGGCTGGCGG
+CGCCGTTCGGAGCGGCAGGCGGAGCTGCTCGGCGACTTGCCCGACGTGCCCGAGCACGTGAGCTCGGCCA
+CGGTCACCACCCGCGGCCTGTACGTGGGCGCCACGCTGTCGCCGGCCTGGAACGAGCGGGTCACCGTCGG
+TGATCTCGGGTATCGCAGCAAGGCGGTGCTCACCCGGTATCCGTCGGGCATCATGGTGGAACGCGCACGG
+GCTCAGCCGATTTGGATTCCTACGGAGTCGATCGCCGCCATTCGCATGGAACGCGGCGTCGCCGGCAAGG
+TGGTGGCCGGCATCGGGATACTCGCGATCCGTTGGCGACTGCCGTCCGGCACCGAGATCGATGTCGGGTT
+TCGGGCAGACAACCGCGACGAATACCAGGAGTGGCTGGAGGAACCCGTTTGAGCAAAGCCGTATTGGTCC
+TCGAAGACGGCCGGGTGTTCACCGGCAGGCCGTTCGGCGCGACCGGACAAGCGCTCGGGGAGGCCGTGTT
+TTCCACCGGCATGTCCGGTTATCAGGAGACGCTGACCGATCCCAGCTATCACCGTCAGATCGTGGTGGCC
+ACCGCGCCGCAGATCGGCAACACCGGCTGGAACGGCGAGGACTCCGAAAGCCGAGGGGAGCGGATCTGGG
+TCGCCGGTTACGCGGTGCGCGACCCGTCGCCGCGCGCGTCCAACTGGCGCGCCACCGGCACGTTGGAAGA
+CGAACTCATCCGCCAGCGCATCGTCGGGATCGCCGGCATCGACACCCGGGGCGTGGTGCGCCATCTGCGC
+AGCCGCGGGTCGATGAAGGCGGGGGTGTTCTCCGACGGGGCGCTGGCCGAGCCTGCCGACTTGATCGCGC
+GGGTGCGAGCACAACAGTCGATGCTGGGCGCCGATCTGGCCGGCGAGGTCAGCACCGCGGAGCCGTATGT
+CGTCGAACCCGACGGGCCACCGGGTGTTTCGAGGTTCACCGTGGCCGCCCTAGATCTTGGTATCAAGACC
+AACACTCCGCGTAACTTCGCCCGGCGCGGGATTCGCTGCCATGTGCTGCCGGCATCGACCACCTTCGAGC
+AGATCGCCGAACTCAACCCGCATGGCGTGTTCTTGTCCAACGGCCCCGGCGACCCGGCCACCGCCGATCA
+CGTCGTCGCGCTTACCCGCGAGGTGCTGGGCGCCGGAATCCCGTTGTTCGGCATCTGTTTCGGCAACCAG
+ATCCTGGGCCGCGCGCTGGGCCTGTCGACCTACAAGATGGTGTTTGGGCACCGCGGCATCAACATCCCGG
+TCGTCGACCACGCCACCGGTCGGGTGGCGGTGACCGCGCAAAACCATGGCTTCGCCCTTCAGGGGGAGGC
+GGGCCAATCCTTCGCCACCCCGTTCGGTCCCGCGGTGGTCAGCCACACCTGCGCCAACGACGGTGTGGTC
+GAAGGCGTCAAGCTCGTTGACGGGCGGGCGTTTTCGGTGCAATACCACCCGGAAGCCGCCGCCGGCCCGC
+ACGATGCCGAGTACCTGTTCGACCAGTTCGTGGAGCTGATGGCAGGGGAGGGCCGCTAGTGCCCCGTCGC
+ACCGATCTGCACCACGTGCTGGTCATCGGCTCCGGGCCGATCGTCATCGGCCAGGCGTGCGAGTTCGACT
+ACTCCGGGACTCAGGCGTGCCGGGTGCTGCGCGCCGAGGGCTTGCAGGTCAGCCTGGTGAACTCTAATCC
+GGCCACCATCATGACCGACCCGGAGTTCGCCGACCACACCTACGTAGAGCCCATCACCCCGGCGTTCGTG
+GAGCGGGTTATCGCCCAACAGGCCGAGCGGGGCAACAAGATCGACGCCCTGCTGGCGACCCTGGGTGGGC
+AGACCGCGCTGAACACCGCGGTCGCGCTGTACGAGAGCGGGGTGCTGGAAAAGTACGGCGTGGAACTCAT
+CGGCGCCGATTTCGACGCCATCCAGCGCGGCGAGGACCGGCAGCGGTTCAAGGACATCGTCGCCAAGGCC
+GGTGGCGAATCCGCCCGGAGCCGAGTGTGTTTCACCATGGCCGAAGTGCGTGAGACGGTCGCCGAGCTCG
+GCCTGCCGGTGGTGGTGCGGCCGAGCTTCACCATGGGCGGGCTGGGTTCGGGGATAGCGTACTCCACCGA
+CGAGGTCGACCGGATGGCCGGCGCCGGGCTGGCGGCCTCGCCCAGCGCCAACGTGCTCATCGAGGAATCG
+ATTTACGGCTGGAAGGAATTCGAACTCGAGCTGATGCGCGACGGCCACGACAACGTGGTGGTGGTGTGCT
+CGATCGAAAACGTCGACCCGATGGGTGTGCACACCGGCGACTCGGTCACCGTCGCGCCGGCGATGACGTT
+GACCGACCGGGAATACCAGCGGATGCGCGACCTGGGCATCGCGATCCTGCGCGAGGTGGGTGTGGACACC
+GGCGGCTGCAACATCCAGTTCGCGGTCAACCCGCGCGACGGTCGGCTGATCGTCATCGAGATGAACCCGC
+GGGTGTCGCGTTCCAGTGCGTTGGCGTCCAAGGCGACCGGCTTTCCGATCGCCAAGATCGCCGCCAAACT
+GGCCATCGGTTACACCCTCGACGAGATCGTCAACGACATCACAGGGGAAACGCCGGCCTGTTTCGAACCC
+ACCCTGGACTACGTGGTGGTCAAGGCGCCGCGGTTCGCGTTCGAGAAGTTCCCCGGTGCCGATCCCACCC
+TGACCACCACCATGAAATCTGTCGGTGAGGCAATGTCGTTGGGCCGCAACTTCGTCGAGGCGCTCGGCAA
+GGTGATGCGCTCGCTGGAGACGACCCGCGCCGGGTTCTGGACGGCACCGGATCCCGACGGCGGCATCGAG
+GAAGCCCTGACCCGGCTGCGGACCCCGGCCGAAGGCCGGCTCTACGACATCGAGCTGGCGTTGCGGCTGG
+GTGCGACGGTGGAACGGGTGGCCGAGGCCAGCGGTGTCGACCCGTGGTTCATCGCGCAGATCAACGAGCT
+GGTCAATCTGCGCAACGAACTCGTCGCGGCACCCGTGCTGAACGCCGAGCTGCTGCGGCGCGCCAAGCAC
+AGCGGACTATCGGATCACCAGATCGCGTCGCTGAGACCGGAATTGGCCGGCGAGGCCGGCGTGCGGTCAC
+TGCGCGTGCGCCTGGGCATCCACCCGGTATACAAGACGGTGGACACCTGCGCGGCGGAGTTCGAAGCCCA
+AACCCCCTACCACTACAGCAGCTACGAGCTCGACCCCGCCGCCGAAACAGAGGTGGCCCCGCAGACCGAA
+AGGCCCAAGGTGCTGATCCTCGGTTCGGGGCCCAATCGGATCGGCCAGGGTATCGAGTTCGACTACAGCT
+GCGTACACGCGGCAACCACGTTGAGCCAGGCTGGCTTTGAGACCGTGATGGTCAACTGCAACCCGGAGAC
+GGTGTCCACCGACTACGACACCGCGGACAGGTTGTACTTCGAGCCGTTGACGTTCGAGGACGTCTTGGAG
+GTCTACCACGCCGAAATGGAATCCGGTAGCGGTGGCCCGGGAGTGGCCGGCGTCATCGTGCAGCTCGGCG
+GCCAGACCCCGCTCGGGCTGGCGCACCGGCTCGCCGACGCCGGGGTCCCGATCGTGGGCACCCCACCGGA
+GGCCATCGACCTGGCCGAGGATCGCGGCGCGTTCGGCGACCTGCTGAGCGCCGCCGGACTGCCGGCGCCA
+AAGTACGGCACCGCAACCACTTTCGCCCAGGCCCGCCGGATCGCCGAGGAGATCGGCTATCCGGTGCTGG
+TGCGGCCGTCGTATGTGCTCGGTGGTCGCGGCATGGAGATCGTGTATGACGAAGAAACGTTGCAGGGCTA
+CATCACCCGCGCCACTCAGCTATCCCCCGAACACCCGGTGCTCGTCGACCGCTTCCTCGAGGACGCGGTC
+GAGATCGACGTCGACGCGCTGTGTGATGGCGCCGAGGTCTATATCGGCGGGATCATGGAGCACATCGAGG
+AGGCCGGCATCCACTCCGGTGACTCGGCCTGTGCGCTGCCACCGGTCACGTTGGGCCGCAGCGACATCGA
+GAAGGTGCGTAAGGCCACTGAAGCCATTGCGCATGGCATCGGCGTGGTGGGGCTGCTCAACGTGCAGTAC
+GCGCTCAAGGATGACGTGCTCTACGTCCTGGAAGCCAACCCGAGAGCGAGCCGTACCGTTCCGTTTGTAT
+CCAAGGCCACAGCGGTGCCACTCGCCAAGGCATGCGCCCGGATCATGTTGGGCGCCACCATTGCCCAGCT
+GCGCGCCGAAGGCTTGCTGGCGGTCACCGGGGATGGCGCCCACGCGGCGCGAAACGCCCCCATCGCGGTC
+AAGGAGGCCGTGTTGCCGTTTCACCGGTTCCGGCGCGCCGACGGGGCCGCCATCGACTCGCTACTCGGCC
+CGGAGATGAAATCGACCGGCGAGGTGATGGGCATCGACCGCGACTTCGGCAGCGCGTTCGCCAAGAGCCA
+GACCGCCGCCTACGGGTCGCTGCCGGCCCAGGGCACAGTGTTCGTGTCGGTGGCCAACCGGGACAAGCGG
+TCGCTGGTGTTTCCGGTCAAACGATTGGCCGACCTGGGTTTTCGCGTCCTTGCCACCGAAGGCACCGCAG
+AGATGTTGCGCCGCAACGGTATTCCCTGCGACGACGTCCGCAAACATTTCGAGCCGGCGCAGCCCGGCCG
+CCCCACAATGTCGGCGGTGGACGCGATCCGAGCCGGCGAGGTCAACATGGTGATCAACACTCCCTATGGC
+AACTCCGGTCCGCGCATCGACGGCTATGAGATCCGTTCGGCGGCGGTGGCCGGCAACATCCCGTGCATCA
+CCACGGTGCAGGGCGCATCCGCCGCCGTGCAGGGGATAGAGGCCGGGATCCGCGGCGACATCGGGGTGCG
+CTCCCTGCAGGAGCTGCACCGGGTGATCGGGGGCGTCGAGCGGTGACCGGGTTCGGTCTCCGGTTGGCCG
+AGGCAAAGGCACGCCGCGGCCCGTTGTGTCTGGGCATCGATCCGCATCCCGAGCTGCTGCGGGGCTGGGA
+TCTGGCGACCACGGCCGACGGGCTGGCCGCGTTCTGCGACATCTGCGTACGGGCCTTCGCTGATTTCGCG
+GTGGTCAAACCGCAGGTGGCGTTTTTTGAGTCATACGGGGCTGCCGGATTCGCGGTGCTGGAGCGCACCA
+TCGCGGAACTGCGGGCCGCAGACGTGCTGGTGTTGGCCGACGCCAAGCGCGGCGACATTGGGGCGACCAT
+GTCGGCGTATGCGACGGCCTGGGTGGGCGACTCGCCGCTGGCCGCCGACGCCGTGACGGCCTCGCCCTAT
+TTGGGCTTCGGTTCGCTGCGGCCGCTGCTAGAGGTCGCGGCCGCCCACGGCCGAGGGGTGTTCGTGCTGG
+CGGCCACCTCCAATCCCGAGGGTGCGGCGGTGCAGAATGCCGCCGCCGACGGCCGCAGCGTGGCCCAGTT
+GGTCGTGGACCAGGTGGGGGCGGCCAACGAGGCGGCAGGACCCGGGCCCGGATCCATCGGCGTGGTCGTC
+GGCGCAACGGCGCCACAGGCCCCCGATCTCAGCGCCTTCACCGGGCCGGTGCTGGTGCCCGGCGTGGGGG
+TGCAGGGCGGGCGCCCGGAGGCGCTGGGCGGTCTGGGCGGGGCCGCATCGAGCCAGCTGTTGCCCGCGGT
+GGCGCGCGAGGTCTTGCGGGCCGGCCCCGGCGTGCCCGAATTGCGCGCCGCGGGCGAACGGATGCGCGAT
+GCCGTCGCCTATCTCGCTGCCGTGTAGCGGGTGCCCTGCCACCGCGCCGCTAAATCCCACCAGCATGGGG
+TGGTGAGCCCAGCGCTCGTGTGACCAAACTCACCGCCCTGGGCCGTCGTCACGCTGTGTTAACCTCTCGT
+TCAAATGATATTCATATTCAATAGTGGCACTAAGTGTCCGGTTGAATCCCCGTTGAACCCCCAACAGATG
+GAGTCTGTGTCGTGACGTTGCGAGTCGTTCCCGAAAGCCTGGCAGGCGCCAGCGCTGCCATCGAAGCAGT
+GACCGCTCGCCTGGCCGCCGCGCACGCCGCGGCGGCCCCGTTTATCGCGGCGGTCATCCCGCCTGGGTCC
+GACTCGGTTTCGGTGTGCAACGCCGTTGAGTTCAGCGTTCACGGTAGTCAGCATGTGGCAATGGCCGCTC
+AGGGGGTTGAGGAGCTCGGCCGCTCGGGGGTCGGGGTGGCCGAATCGGGTGCCAGTTATGCCGCTAGGGA
+TGCGCTGGCGGCGGCGTCGTATCTCAGCGGTGGGCTATGACCGAGCCGTGGATAGCCTTCCCTCCCGAGG
+TGCACTCGGCGATGCTGAACTACGGTGCGGGCGTTGGGCCGATGTTGATCTCCGCCACGCAGAATGGGGA
+GCTCAGCGCCCAATACGCAGAAGCGGCATCCGAGGTCGAGGAATTGTTGGGGGTGGTGGCCTCCGAGGGA
+TGGCAGGGGCAAGCCGCCGAGGCGTTTGTCGCCGCGTACATGCCGTTTCTGGCGTGGCTGATCCAAGCCA
+GCGCCGACTGCGTGGAAATGGCCGCCCAGCAACACGCCGTCATCGAGGCCTACACTGCCGCGGTAGAGCT
+GATGCCTACTCAGGTCGAACTGGCCGCCAACCAAATCAAGCTCGCGGTGTTGGTAGCGACCAATTTCTTT
+GGCATCAACACCATTCCCATTGCGATCAATGAGGCCGAGTACGTGGAGATGTGGGTTCGGGCCGCCACCA
+CGATGGCGACCTATTCAACAGTCTCCAGATCGGCGCTCTCCGCGATGCCGCACACCAGCCCCCCGCCGCT
+GATCCTGAAATCCGATGAACTGCTCCCCGACACCGGGGAGGACTCCGATGAAGACGGCCACAACCATGGC
+GGTCACAGTCATGGCGGTCACGCCAGGATGATCGATAACTTCTTTGCCGAAATCCTGCGTGGCGTCAGCG
+CGGGCCGCATTGTTTGGGACCCCGTCAACGGCACCCTCAACGGACTCGACTACGACGATTACGTCTACCC
+CGGTCACGCGATCTGGTGGCTGGCTCGAGGCCTCGAGTTTTTTCAGGATGGTGAACAATTTGGCGAACTG
+TTGTTCACCAATCCGACTGGGGCTTTTCAGTTCCTCCTCTACGTCGTTGTGGTGGATTTGCCGACGCACA
+TAGCCCAGATCGCTACCTGGCTGGGCCAGTACCCGCAGTTGCTGTCGGCTGCCCTCACTGGCGTCATCGC
+CCACCTGGGAGCAATAACTGGTTTGGCGGGCCTATCCGGCCTGAGCGCCATTCCGTCTGCTGCGATACCC
+GCCGTTGTACCGGAGCTGACACCCGTCGCGGCCGCGCCGCCTATGTTGGCGGTCGCCGGGGTGGGCCCTG
+CAGTCGCCGCGCCGGGCATGCTCCCCGCCTCAGCACCCGCACCGGCGGCAGCGGCCGGCGCCACCGCAGC
+CGGCCCGACGCCGCCGGCGACTGGTTTCGGAGGCTTCCCGCCCTACCTGGTCGGCGGTGGCGGCCCAGGA
+ATAGGGTTCGGCTCGGGACAGTCGGCCCACGCCAAGGCCGCGGCGTCCGATTCCGCTGCAGCCGAGTCGG
+CGGCCCAGGCCTCGGCGCGTGCGCAGGCGCGTGCTGCACGGCGGGGCCGCTCGGCGGCGAAGGCACGTGG
+CCATCGTGACGAATTCGTCACGATGGACATGGGTTTCGACGCGGCAGCTCCGGCCCCAGAGCACCAGCCG
+GGTGCCCGGGCGTCCGACTGTGGTGCGGGACCTATCGGATTTGCTGGCACGGTGCGCAAAGAGGCGGTCG
+TGAAAGCGGCGGGGTTGACCACGCTGGCCGGTGACGACTTCGGCGGCGGCCCAACGATGCCGATGATGCC
+CGGCACCTGGACCCATGATCAGGGCGTGTTCGACGAGCATCGCTGATAGCTGACTGGGCAGTGGCTGGCA
+AACAGCTGAGAGAGCACTCGAGAGCTATCGTCAGGGCAATGTCCGATGATGCTGAGCACCCGCGTTTGGG
+GCACTAGCAGCCACGATGATCCTTGTTGGGTTGCACCGCGGAGATGTCGGCGAAAATTGGCAGGGTTGCG
+TTGACGCAACCATGGCGCGACACGCGCGATAGGTCGCCCAACCGCGAGTGATCCCCGGCACTGCGAGTTG
+CGACGCCACCTGCCGCCACCAGTCGTCGGCCGTCGTCGACCGGTTGAGCAGGTCCGGAAAGCCGAAATCC
+ATTGTTAGGCAACACTATTCATGTTCCATGCCAGCCATGCCGGCACGGACACGGGGCTCCGTCGAGAGGC
+CTTCGAGGTCGCCCGGCGGACCGCTGGCCGGTGGCACGTGCTACTCCCACGCTGCACGTTTGTCCCCAAA
+ACCAGGGGGTCGGGTTAGATTTCGTCAGGAAGCCTGAGTACGGTCGTCTGCGCTGGCCGGCGTACCCGGC
+CGGGACAAACAACGATCGATTGATATCGATGAGAGACGGAGGAATCGTGGCCCTTCCCCAGTTGACCGAC
+GAGCAGCGCGCGGCCGCGTTGGAGAAGGCTGCTGCCGCACGTCGAGCGCGAGCAGAGCTCAAGGATCGGC
+TCAAGCGTGGCGGCACCAACCTCACCCAGGTCCTCAAGGACGCGGAGAGCGATGAAGTCTTGGGCAAAAT
+GAAGGTGTCTGCGCTGCTTGAGGCCTTGCCAAAGGTGGGCAAGGTCAAGGCGCAGGAGATCATGACCGAG
+CTGGAAATTGCGCCCACCCGCCGCCTTCGTGGCCTCGGTGACCGTCAGCGCAAGGCCCTGCTGGAAAAGT
+TCGGCTCCGCCTAACCCCGCCGGCCGACGATGCGGGCCGGAAGGCCTGTGGTGGGCGTACCCCCGCATAC
+GGGGGAGAGGCGGCCTGACAGGGCCAGCTCACAATTCAGGCCGAACGCCCCGTGGGGGGAACCCGCCCAG
+GAGCGCCAGTGAGCGTCGGCGAGGGACCGGACACCAAGCCCACCGCGCGTGGCCAACCGGCGGCAGTGGG
+ACGTGTGGTGGTGCTGTCCGGTCCTTCCGCGGTCGGCAAATCCACGGTGGTTCGGTGTCTGCGCGAGCGG
+ATCCCGAATCTGCATTTCAGTGTCTCGGCCACGACGCGGGCGCCACGCCCGGGCGAGGTCGACGGTGTCG
+ACTACCACTTCATCGACCCCACCCGCTTTCAGCAGCTCATCGACCAGGGTGAGTTGCTGGAATGGGCAGA
+AATCCACGGCGGCCTGCACCGGTCGGGCACTTTGGCCCAGCCGGTGCGGGCGGCCGCGGCGACTGGTGTG
+CCGGTGCTTATCGAGGTTGACCTGGCCGGGGCCAGGGCGATCAAGAAGACGATGCCCGAGGCTGTCACCG
+TGTTTCTGGCGCCACCTAGCTGGCAGGATCTTCAGGCCAGACTGATTGGCCGCGGCACCGAAACAGCTGA
+CGTTATCCAACGCCGCCTGGACACCGCGCGGATCGAATTGGCAGCGCAGGGCGACTTTGACAAGGTCGTG
+GTGAACAGGCGATTAGAGTCTGCGTGTGCGGAATTGGTATCCTTGCTGGTGGGAACGGCACCGGGCTCCC
+CGTGACCCACGTCGTGACTAGTCAGTATTTAGCTTTCCAAGCCGCTCTACGCCGCCAGGAGAAATTTCAC
+GTGAGTATCTCGCAGTCCGACGCGTCGTTGGCCGCCGTCCCCGCCGTGGATCAGTTCGATCCGTCGTCAG
+GTGCATCAGGTGGCTACGACACCCCGCTGGGCATCACCAATCCGCCCATCGACGAGTTGCTGGACCGCGT
+CTCGAGCAAATACGCCCTCGTGATCTATGCGGCAAAGCGTGCCCGGCAGATCAACGACTACTACAACCAG
+CTTGGCGAGGGCATCCTCGAATATGTCGGTCCGCTGGTTGAGCCGGGGTTGCAAGAGAAGCCGTTGTCCA
+TCGCGTTGCGCGAGATCCACGCCGATCTGCTCGAGCACACCGAGGGCGAGTAGCAGGGCAGGCCTGAGGT
+GGTGGACCATAAACGGATCCCCAAGCAGGTAATAGTCGGTGTCTCCGGGGGCATCGCCGCCTACAAGGCG
+TGCACGGTTGTTCGTCAACTCACCGAGGCCAGTCATCGCGTCCGAGTCATTCCCACCGAATCCGCCCTGC
+GCTTCGTCGGTGCCGCGACCTTCGAGGCGCTCTCCGGTGAGCCGGTGTGCACCGACGTTTTCGCCGACGT
+TCCGGCGGTCCCGCATGTTCACCTCGGCCAGCAGGCCGATCTGGTCGTAGTGGCGCCGGCCACCGCCGAC
+CTGCTGGCCCGCGCGGCGGCCGGTCGAGCCGACGATCTGCTGACCGCGACGCTGCTGACGGCGCGGTGTC
+CGGTGCTGTTCGCGCCGGCGATGCACACCGAGATGTGGTTGCATCCGGCCACCGTCGACAACGTGGCCAC
+GCTGCGCCGCCGCGGCGCGGTGGTGCTCGAGCCCGCGACAGGACGGCTTACCGGCGCCGACAGCGGGGCC
+GGCCGACTGCCCGAGGCGGAGGAGATCACCACCCTCGCCCAGCTGCTGCTGGAGCGGCACGACGCCCTGC
+CCTACGATCTCGCGGGGCGAAAGCTGCTGGTTACCGCCGGTGGCACACGCGAGCCGATCGATCCGGTGCG
+CTTTATCGGCAACCGCAGCTCCGGCAAGCAGGGCTATGCGGTGGCGCGGGTGGCCGCCCAGCGCGGCGCC
+GACGTTACTTTGATCGCTGGGCATACCGCAGGGCTCGTCGATCCCGCCGGCGTCGAGGTGGTGCACGTCA
+GCTCGGCCCAGCAACTCGCCGACGCGGTGTCCAAGCACGCTCCGACCGCCGACGTATTGGTGATGGCGGC
+GGCCGTCGCCGACTTCCGGCCCGCGCAGGTTGCCACCGCCAAAATCAAGAAAGGCGTCGAAGGCCCACCG
+ACCATCGAGCTGCTGCGCAACGACGACGTGCTGGCCGGGGTGGTGCGGGCCCGAGCCCATGGACAACTGC
+CCAACATGCGGGCCATTGTGGGCTTCGCAGCCGAGACCGGCGACGCCAATGGCGACGTGCTCTTTCATGC
+CCGAGCTAAACTGCGACGCAAAGGCTGCGATCTGTTAGTCGTCAATGCCGTCGGCGAAGGCAGGGCCTTT
+GAGGTAGACAGCAACGACGGCTGGCTACTGGCGTCCGATGGTACCGAGTCGGCATTGCAGCACGGCTCCA
+AGACACTGATGGCGAGCCGTATCGTTGATGCAATCGTCACGTTCCTGGCAGGCTGTAGCAGCTAACGGGT
+CCGGCGGCCGGTTCTGTACGGGTCCTGGACAGGTGCTGGACGATCCCTTGCTCGATTGGACGAGCTGAGA
+TTGATGCCTGAGGATATAATTCGGCTAACTATTTATCGGAAGGATGACGATAGTGAGCGAAAAGGGTCGG
+CTGTTTACCAGTGAGTCGGTGACAGAGGGACATCCCGACAAGATCTGTGACGCCATCAGCGACTCGGTTC
+TGGACGCGCTTCTAGCGGCGGACCCGCGCTCACGTGTCGCGGTCGAGACGCTGGTGACCACCGGGCAGGT
+GCACGTGGTGGGTGAGGTGGCCACCTCGGCTAAGGAGGCGTTTGCCGACATCACCAACACGGTCCGCGCA
+CGGATCCTCGAGATCGGCTACGACTCGTCGGACAAGGGTTTCGACGGGGCGACCTGCGGGGTGAACATCG
+GCATCGGCGCACAGTCACCCGACATCGCCCAGGGGGTCGACACCGCCCACGAGGCCCGGGTCGAGGGCGC
+GGCCGATCCGCTGGACTCCCAGGGCGCCGGTGACCAGGGCCTGATGTTCGGCTACGCGATCAATGCCACC
+CCGGAACTGATGCCACTGCCCATCGCGCTGGCCCACCGACTGTCGCGGCGGCTGACCGAGGTCCGCAAGA
+ACGGGGTGCTGCCCTACCTGCGTCCGGATGGCAAGACGCAGGTCACTATCGCCTACGAGGACAACGTTCC
+GGTGCGGCTGGATACCGTGGTCATCTCCACCCAGCACGCGGCCGATATCGACCTGGAGAAGACGCTTGAT
+CCCGACATCCGGGAAAAGGTGCTCAACACCGTGCTCGACGACCTGGCCCACGAAACCCTGGACGCGTCGA
+CGGTGCGGGTGCTGGTGAACCCGACCGGCAAGTTCGTGCTCGGCGGGCCGATGGGCGATGCCGGGCTCAC
+CGGCCGCAAGATCATCGTCGACACCTACGGCGGCTGGGCCCGCCACGGCGGCGGCGCCTTCTCCGGCAAG
+GATCCGTCCAAGGTGGACCGGTCGGCGGCGTACGCGATGCGCTGGGTGGCCAAGAATGTCGTCGCCGCCG
+GGTTGGCTGAACGGGTCGAGGTGCAGGTGGCCTACGCCATCGGTAAAGCGGCACCCGTCGGCCTGTTCGT
+CGAGACGTTCGGTACCGAGACGGAAGACCCGGTCAAGATCGAGAAGGCCATCGGCGAGGTATTCGACCTG
+CGCCCCGGTGCCATCATCCGCGACCTGAACCTGTTGCGCCCGATCTATGCGCCGACCGCCGCCTACGGGC
+ACTTCGGCCGCACCGACGTCGAATTACCGTGGGAGCAGCTCGACAAGGTCGACGACCTCAAGCGCGCCAT
+CTAGCGTCGAGGGCGCGAGCAGACGCAGAATCGCACGCGGAAAGGCTTCCGCGTGCGATTCTGCGTCTGC
+TCGGCGCTAGCTGCTGATGCGGTAGTCGCCGAGGTCGAACCGCCGGCTGCGCCAGTAGGCTTCGACCGTG
+GTGGTCGGGCGCAACGGGACGTCACCGTTCTTGTCGAAGTAATAGCTGTTGGCCAGCCGACAACTGTCCT
+GCCAGAAGACCTGGCGGTGCCGGCGGCGCATCACCTCCGCGAAATAGCGAGCGTTGGCTTCTTCGGTCAC
+CTCGATGCGGGTGGCGCCGGTGCGGCGGGCTCGCTTCAGGCACCGGATGATGTGGTGTGCCTGCGTCTCG
+ATGAGCGCGAAGTACGACGACCCGACGTAGCCGTACGGTCCGAACACGGTGAAGAAGTTCGGGTAGCCGG
+GAACGCTGACGCCCTCATAGGCCTGCAGCCGATGCTCGTCCCAGAACCGGCTCAAGGACGCACCGCCAGT
+TCCGGTGACGGCATAGGTCGGGATGCTGTCGGTGTCTAGCACCTTGAAGCCGGTCGCCAGCACCAGCACA
+TCGATCTCGTGGCTGGCGCCGTCGGTGGTGGCCACCGCAGTGGGTGTGATCTTGTCGATCGGCTCGGTGA
+CCAGCCGCACGTTGTCCCGGTTGAACGTCGACAGATAGGTGTTGTGGAAGCCGGGCCGCTTGCACCCCAC
+CGCGTATCGGGGGGTGAGTTGCTCGCGCACCACCGGATCGTGGACCTGTTGGCGCAGGTAGCGCCGTCCC
+GCTGACTCCATGTGCTTGGCCAACGGAAACACCGCGAAGTAGTGCGCCGCGATGGGGAACGTTGCTTCCA
+CGAAGGCCTGGCTGAGCAGCCGGTGGACGGCTTTGCCGCCGGGAATCCGCATCGCCCAGCGGACGGCTGT
+GGGCAGTGGAACGTCGAATTTGGGGAAACACCAAATAGGGGTGCGCTGAAAAACGGTGAGGTGGGAGACA
+ATTGGCGCCATCTCGGGAATGACCTGCACCGCCGAGGCCCCGGTGCCGATGATCCCGACGCGCTTGCCGG
+TCAGGTCCTGGGTGTGATCCCAGCGTGCGGTGTGCATGGTGACGCCTTCAAACGAGTCCACCCCGTCGAT
+GTCGGGTAGTTTGGGCACCGTCAGAATGCCGCATGCGCTGATCAGGAACCTGGCTGTGATTTCGCCGCCC
+GGGTCCGTTTGCACCCGCCACAGGCTGTGCTCGTCATCGAACTCGGCGGCAAGCACCTTGGTGTTCAACC
+GGATCCGCGACCGGATGCCGTATTTGTCGACGCAGTGTTCGGCGTAGGCCTTCAGCTCGTGTCCGGGTGC
+ATAGGTGCGCGACCAGTGCCGGCTCTGCTCGAAAGAGAACTGATAGGAGAAGGACGGAATATCCACGGCG
+ATACCGGGATAGGTGTTCCAGTGCCAGGTCCCGCCGACACCGTCGCCGGCTTCGACCACGAGGTAGTCGC
+TGAATCCCGCCCGGTCGAGCTTGATTGCGGCGCCGATCCCGGAGAACCCGGCGCCGACGATCAGTGCGTG
+GTAGTCGGGCATCATCGCCTCCTCCCGATGACGTGTACTCCGTGCTTGGGTCGCAGGGTCAGCGTCGCCT
+CGAGTTCGACGTGATAGCCAGGGGCGAGGTCAAAGGTGAAGTGTTGACTCATGATTGCCGCCATCAAAAC
+CATCTCCATCAGGGCGAAGCTCTGTCCGATGCAGATGCGTCGGCCGCCACCGAACGGCAGGTATGCGCAG
+CGAGGACGGTCCGTGGGGCACCGCAAAAACCGGCCAGGATCGAATCTATCCGGGTCGGGCCACCAGCGCG
+GGTCGTGGTGAATGTGGTGAATCGGGATGACGACGGTGGTGCCGCGGCGAATTCGGTGTCCGTCGATGAT
+GTCATCATCGACGGCCTCGCGCGCGATTATCCACACCGACGAGAAGTAGCGTTGCGATTCCTGCAGGCAC
+GCGGTGGTCCAGGCCAGCTTGCCCAGGTCGTCGGCGGTCGGGCGGCGCATGCCCAGCACGTCGTCCAGCT
+CGGTGAGCATGTGGTCGCGGGCCTGCGGGTTCAGCGCCATCAGATACCAGAACCAGGACATGGCGTTGGC
+GGTGGTTTCGTGGCCGGCGAGCATGAACGTCAGAGCTTCATCGCGTACTCGCTGGCGGGGCCAGATTCCG
+CCGTCGGCGCTCAGCAACACGTTGAGCAGGTCCGCGGAGTTAGTCGGCTCGGCCAGTCGCCGATCGATCA
+CCGAGTTGATGGCGCGATCCAGGGTCAGCGTGATCTCTTGCATTTCCCGCAACGGCGGCGGCAGATGAAC
+ACCCGAGTAGATACACCAGATCAGCGTGTCGTAAACCGTCCGCGGCATCAGCCCCCACAGCCCCAGCCGC
+TCCAGCTTTTCCGCCCGCCGCAGGCCGCGAGTCGCAAGATCGTGCATGGACTGCACCAACGGCCCGAAGT
+CCTGGCTGAACAGGGCGTTGGCGACTACCCGCAATGTCGTCTCGACCATGCTTTGGTGCATGTCGAACTG
+CGCGCCGGGCACCAGCGCGGCGGTGACGTCGGCGATTGGGTCGATCATCAGACCGACGAGTCCGCGCAGG
+TGGCGCCGGGCGAAGGTCGAGTTTAACGCGCCGCGATGTCTTGCCCATGAGTCGCCCTCGTCGGTGAGCA
+AGTTAAGACCGGCGGTGGCCCGGATCGGTCCGTATTCGTCGGATTTGACATATTTCAGGCGGGCCTCGTG
+CAGCACATGGTCGACGTAGTCGGGGTGACTGATCGAGACAAAACGTCTGCCAGCACAACGAAATCGGGTG
+ATGTCGCTGCCGCGTAGCCGGCCCAGGAAGCCGTCGCCGGCGTCGAATCCGATGGTGATGGCTTCCCGGG
+TCATCGTCCAGGTGCTCATCCGCTTGGCCGGTCCCTTCAGGGGCCGCTGGGTGGTGGCGGTGGCCATGAC
+TTCACTGTATGGATGACGCTGACTGGCCCGAAATGAGACTATGGGACAAAGTGTTGTGAGTTTAGGACAG
+CCTCGTGGGACATCTACCGCCTCCGGCCGAGGTGAGGCATCCGGTGTATGCGACCCGGGTGCTGTGTGAG
+GTGGCCAACGAGCGCGGGGTGCCGACCGCTGATGTGCTGGCGGGCACGGCGATCGAGCCGGCCGACCTCG
+ACGATCCGGACGCGGTGGTCGGTGCGCTTGACGAGATCACCGCGGTGCGCCGGTTGCTGGCCCGATTGCC
+CGACGACGCCGGTATCGGGATCGACGTAGGCAGCCGGTTCGCGCTCACCCACTTCGGGTTGTTCGGGTTT
+GCCGTGATGTCATGTGGCACCCTTCGCGAACTGCTTACCATCGCGATGCGCTATTTCGCGTTGACCACCA
+TGCACGTCGACATCACGTTGTTTGAAACCGCCGACGATTGCCTGGTCGAACTGGATGCCAGCCACTTGCC
+GGCCGATGTCCGTGGATTCTTCATCGAGCGCGATATTGCCGGAATCATCGCGACGACAACGAGTTTCGCG
+CTTCCGTTAGCCGCGAAGTATGCGGATCAAGTATCGGCCGAACTGGCGGTTGACGCGGAATTGTTGCGCC
+CGTTGCTCGAGCTTGTGCCGGTGCACGACGTCGCATTCGGGCGCGCGCACAACCGGGTGCACTTCCCGCG
+TGCCATGTTCGACGAGCCGTTGCCGCAGGCCGACCGCCATACGTTGGAAATGTGTATTGCACAATGCGAC
+GTGCTGATGCAACGCAACGAGCGACGCCGTGGCATCACGGCCTTGGTGCGCAGCAAGCTGTTTCGCGATT
+CCGGGCTTTTCCCAACGTTTACCGACGTTGCTGGCGAACTTGACATGCATCCGCGGACGCTGCGGCGTCG
+ACTTGCCGAGGAAGGCACTTCGTTTCGGGCCTTGCTGGGCGAGGCGCGCTCCACCGTGGCCGTCGACCTG
+CTACGCAACGTCGGGCTGACGGTGCAGCAGGTGTCCACCCGGCTGGGCTACACCGAAGTCTCGACGTTCT
+CGCATGCGTTCAAACGCTGGTATGGCGTTGCGCCCAGCGAATATTCGCGCCGCGGGTAGACCAGCCCTTT
+TCAGGGTTTCGCGGCCCGCGTCGGTTTGGTCGGGTTAGGCGGGGCCGGGCTGGCCGGGCGGACCGGGTTG
+GCCGGGCTGGCCGAACAGGGTTCCCCCGGTCCCGCCGACGCCGCCGCCCCCGCCGTTGCCGGGGGTGCCA
+TCGTTGCCGGCCCCACCGTTTCCGCCGGCGCCGCCGCCCCCGCCGTTGCCGATTAGGACGGCGGCCCCAC
+CGTTTCCGCCGGTCCCGCCGTTGCCGCCGGTACCGTCCTCGCCGGCGGTGCCGCCCTTTCCGCCGGTCCC
+GCCGGTCCCGGCGTCGCCGATCAGGCCGGCGGCACCGCCTCGCCCGCCGGTCCCGCCGGCGCCGCCCTTG
+CCGAACACGCCGAAGCCGTCGCCGCCCTTGCCGCCGGTGCCGCCGGCACCGCCGTTGCCGATGAGCCCGC
+CGGTACCGCCGGCACCGCCCGCGCCCCCGAAGTTATTCTCCCCGACTTTGCCTCCAACCCCAGTTTGCCC
+GCCGTGCCCGCCGGCCCCGCCGCTGCCCGACAGGCCGCGGCCGTCGCCGCCGGTGCCGCCGGCCCCGCCG
+TTGCCTCCTGAGCTGACGCCGGTTCCGCCCTGCCCGCCGTGTCCGCCGGCGCCGCCGTCGCCGTGCAGCC
+AGCCACCACCGCCACCGGCGCCGCCGATACCCCCCGTGCCGCCGTCGCCGGACTTGCCGCCACCGACCCC
+CCCTTGCCCGCCGGTGCCGCCGGACCCTCCGCTGCCCCACAATCCGGCGGCGCCGCCGGCACCGCCGGCA
+CCGCCGACACCACCGGGGTCGCCGGCCACCCCGACCCCGCCATTGCCGCCGGCCCCGCCGTTGCCCCACA
+GCCATCCGCCGGCCCCGCCGGCACCACCGGACGCGCCGGTGCCACCCAGGCCGCCGGCCCCGCCGTGGCC
+GATCAGCCCGGCCGCCCCGCCCGCACCGCCGGCCTGACCGGTGGCGCCGGACCCGCCGTTGCCGCCGTTG
+CCGTACAGGATCCCGCCGGCCCCGCCGGCCTGCCCGGTCCCCGGCGCCCCGTCGGCGCCGTGGCCGATCA
+GCGGGCGCCCCAGCAGCGCCATGGTCGGCGCGTTGATCGCACCCAGCAGCTGCTGCTCGACGTTGGCGGC
+CTCGGCGCTGGCATACGCGCCTGCCGTGCTCGTGAGGGTCTGCACGATCTGCTGGTGAAACGCCGCCGCC
+TGAGTGCTCAGCGCCTGATAGGTCTGCGCGTGGCCGCTAAACAGCGCCGCCACGGCGGCGGACACCTCAT
+CGGCACCGGCGGCCAGCACACGCGTCGTGGCGGCCGCGGCCGCAGCATTGGCCGTGCTGATCGCCGAGCC
+GATGCTTGCCAGATCCGTCGCCGCCGCGCCCAGCATTTCCGGCTGTGCAAACAAAAACGACATGACCGTC
+CCCCTGAATCCTGTGGGTATGAGCAGACTTGTCGTGATCGTGCAGCATAAGCGCAGGTGATATAGGCCAT
+CATTGGTAATGTTATAGAAACGTTATAGGTGATTTTGACCTTGTCAAATTGTTCGACAAGGAGTGCGGTC
+TTATTGCAACTTTGTTTATTAATGTCGCGCGGCCCGCGGCCTGGGACCTCCGTCGGACAGCGGCGACACG
+ATGCAACTATGGGGGCCGCAGCGAGGTGTCGTCGGTGTCATGCCCGCGGTCGGTGCCCCGGCACCGCAAA
+TGGTGGTTTCAGCTGCTCGAACATGGGGAAATGCCACACGTTGAGGGTTGCCAATTGCAGGCCCTGGACG
+TCGGCGGTAGCAGCTATCAGATAGTCGCCAAGTCCAATCCGGTTGTGGCTGCGACGATATCGGCGCATCA
+TGTCGCCGGCGCGGCGTGCGATTACCTCGGTTGCTGGCTGTACCCGAAACGATGCAAGCAGGCGCCACAC
+CTCGCGCCGTTCGGCGGTCCGCATTCCGCCGATGAGTTCGGCGGTGGACACCACGCTGATCGCCAGCGGT
+CCGTCCTTGCGGGCGCTGACAAGCCAATCGCGAGCAGCAACGACACCCCGCAAATGCGCGATCAGCACAT
+CGGAGTCGACAAGGATCATGAGGTGGCGCGCCACACCTGGGCAAGGTGCTGTTCACGACCACCGGAGCGA
+CGCACCGGCGGATCCAGGTGGCGAAGCGTGCCGAACGAATCGTTTATAGCCTGCAGGTCCGATGCAAGGT
+CGTCCCCAGCGGTGGTGAGGGCTCGGTTCAGCAGGAGGCGGATCAGCTCGGCGCGCGAAACACCTTCTTG
+CGCGGCCAACTTGTCGAGGCTTGCCGTCTGCTCCTCGTCGAGGTAGATGTTGGTCCGCTTCATACACCAT
+ATCATACATCACAATGTGCGGCCCGGGCGGCACCGCGGCGGGCGGCGATTCAGCCGACCGGGCATGCCGC
+CGACGTTATGCGTGCAACGCCCTCTTCAGCGCCGCCAAGCCGCGGCCGGTGGCTTCGGCCGCGGCGGGCA
+CCACCAGGGCGAAGTTGACGTAGCCGTGCACCATGGTGGGCTCGTTGCTTAGCTCTACGGAAACCCCTGC
+GGCCGTGAGCAATTCGGCGTAGCAAGCACCGTCGTCGCGCAGCGGATCATGCTCGGCGGTGCCGATGAAG
+GCGGGAGGCAGGCCGGACAGGTCAGCGTTTCCCGGGGCCAGTGTCGTGGGCAGCATCGTGTGATCACTGA
+TGTCCAGCCCCGGCACATACCAGGCCAGGAACGCGTCGATGACGTCACGGTCCAGGATTGGCGCATCGGC
+ATTTTCGGTGAAAGACGGCAGCGACAGGTCGGCCATGGTCGTCGGGTACCACAGCAGCTGGAACACCAGC
+GGCGGTCCGCCGACATCCCGGGCCAACTGCGCCATGACCGCCGAGATGTTGCCGCCCGCAGAGTCACCGG
+CCACGGCGATCCGGCTCGGGTCACCGCCCAGTTCGGCGGCGTTTTCGCCGACCCAGCGCAATGCCGCCCA
+GCTGTCGTCGATCCCGGCCGGGTAGGGATGTTCCGGGGCAAGCCGGTAGTCGACGGACACCACGATGGCC
+TGCGCGCCGACGGCGTGGGCGCGGGCGACGGGGTCGTGGGTGTCCAGACCGCCGAGCGACCAGCCGCCAC
+CGTGGTAGTAGACAACCACGGGCAGGTTGTCGCGAACGACCGGCGGCCAGTAGACGCGGACCGGAATGTC
+GGTGAGCCCGTCGTAGCCAACGGTCCGTTCCTCGATCCGTAGCTCCGGCAGCAACTCCGGGGGTGTCTTC
+AGCTGGCGGAGCCGCGCGCGGGCGACTTCGACACCGTCGGCCGCGGTGAAGGTCACCGGAAAGGTATCGA
+GCAGCATCTTCAGCACGGGATCGATATCAGGCCGGGCGACGGTCGGCTCTGTCATGGGCCTACCGTACGA
+CCGCCAGGCCTATCCGTGTAGCACAACCCGTAGCGCCACCAGCCCACGGTTGGTGGCCTCGGTGGCGGCG
+GGCACCACACCGGCATAGCCAACGTAGCCGTGCACCAGCGTCTGGGCGTTGTGCACCTCGACGGGAACAC
+CGGCGGCGGCCAGCAGCTCGCCGTACCGAATCCCGTCGTCGCGCAAAGGGTCGTAGCCGGCGACAGCGAT
+GTAGGCCGGCGGCAGGTCGGCCAGGTTCTCCGCTCGGCCGGGCGCCATTGGCGCTGGCGGGTTGTGCAAG
+TCGATTTCGCCTGCGTACCAACGGGAGAACGCGGCAATTGCCTTGACGTCGAGGATCGGTGCGTCGGCAT
+TCTCGGCCAACGACGGCAGCGATTGGTCCCACAGAGTGGAGGGATACCACAACAGCTGAAACACAATGGG
+CGGGCCGCCCATATCGCGGGCTCGCTGCGCGATCACCGCGGCGATGGTGCCGCCGGCGGAATCTCCGGCG
+ACGGCGATGCGGCCGAGGTCAGCACCGACCTGGCGGCCATGCTCGGCGACCCACCGCGTTGCGGCCCAAG
+CATCTTCGATGGCAGCGGGGTAGGGGTGCTCAGGCGCCAGCCGGTAGTCGACGGACACGACAATCGCGTC
+AGCGCCGACGGCGTGCTGGCGGCAGGTGCCATCGTGCGTGTCGAGGTCGCCCATGACGAATCCGCCGCCA
+TGGAAATACAGCACAACGGGCGCCTCGGCTTGATCGGGACACGTTGGCGGCCAATAGATCCGGGTCCCGA
+TCGGCCCCGCCGGTCCATCGATCGCAAGGTCAACGACCCGCAGCTCGGGGTGCACCGGCTGGCGCGGTAG
+ATCGCGCAACCGCTGGCGCACGGCCTCGATCCCATCGTCGATCGATAGCCGAAACGGAACCGCATCCAGT
+ACCTTCAGCAGGATGGGGTCGATCGCGGGTTTCTCGTCGGCGGTGTTGTCCAAACTGGGCATACCGGTAC
+CGTACGCACCTCGCTTGCTGGCCGGCGGCTGGGTGGTCGCCGGCTGGGCGGGCCTCGCCTACGGCGTGTA
+CTTGACCGTGATCGCATTGCGCTTGCCACCGGGCAGCGAGTTGACCGGGCACGCGATGTTGCAGCCCGCG
+TTCAAGGCATCGATGGCGGTGCTGCTGGCCGCGGCCGCGGTTGCCCATCCCATCGGCCGCGAGCGGCGGT
+GGTTGGTACCGGCGCTGCTGTTGTCGGCCACCGGCGACTGGTTGTTGGCGATCCCCTGGTGGACGTGGGC
+GTTCGTGTTCGGCTTGGGGGCATTCCTGTTGGCGCACTTGTGCTTCATTGGTGCCCTGCTGCCACTGGCG
+CGGCAGGCGGCTCCATCGCGTGGCCGGGTCGCTGCCGTGGTGGCGATGTGCGTTGCGTCCGCGGGGCTGC
+TGGTGTGGTTCTGGCCGCACCTGGGGAAGGACAACCTGACCATCCCGGTCACGGTATACATCGTCGCGCT
+GTCGGCGATGGTGTGCACCGCGTTGCTGGCACGGCTGCCGACGATTTGGACCGCGGTCGGGGCGGTGTGT
+TTCGCCGCGTCGGACTCGATGATCGGCATTGGCCGGTTCATCCTCGGCAACGAGGCGTTGGCGGTGCCGA
+TCTGGTGGTCCTACGCCGCAGCCGAGATCTTGATTACGGCCGGGTTCTTCTTCGGCCGCGAGGTTCCTGA
+TAACGCCGCAGCACCTACGGATAGCTAGCGGACCGGTTGTCTAGCAGCGGATCTCGCGGTCAAGCCCGCA
+CGCCCGTCGAAGTAGAGCCGATCGCGCGGGTGCTGCCGATGTTGTCGGTGCCGCACCTGGACCGCGACTT
+CGACTACTTGGTGCCCGCCGAACACTCCGACGATGCCCAGCCGGGGGTGCGGGTACGGGTGCGGTTTCAC
+GGTCGGCTGGTCGACGGGTTTGTCCTAGAGCGCCGCAGCGACAGCGATCACCACGGCAAGCTGGGCTGGC
+TGGATCGTGTGGTGTCGCCCGAACCGGTGCTCACCACGGAGATCCGCCGGTTGGTCGATGCGGTGGCGGC
+GCGCTACGCCGGGACCCGCCAGGACGTATTGCGGCTCGCAGTGCCCGCCCGGCACGCACGGGTGGAGCGG
+GAAATCACCACGGCCCCGGGTCGGCCGGTGGTAGCGCCGGTCGACCCGTCGGGTTGGGCGGCCTACGGTC
+GCGGTCGGCAATTCCTGGCCGCGCTGGCCGACTCGCGCGCTGCGCGGGCCGTTTGGCAGGCGCTACCGGG
+CGAGCTGTGGGCGGACCGATTCGCCGAGGCTGCCGCGCAGACCGTACGTGCCGGGCGCACGGTACTGGCG
+ATCGTGCCCGATCAGCGGGATCTGGACACCCTGTGGCAGGCCGCGACGGCCCTCGTCGATGAGCACAGTG
+TGGTAGCACTGTCGGCCGGCCTGGGCCCGGAGGCACGCTATCGGCGCTGGCTGGCCGCGTTGCGGGGCAG
+CGCGCGGCTGGTGATTGGCACCCGCAGCGCGGTGTTCGCGCCGTTGAGCGAGCTGGGCCTGGTCATGGTC
+TGGGCCGACGCCGACGACTCCCTGGCTGAGCCGCGGGCACCCTATCCGCACGCCCGTGAGGTGGCGATGC
+TGCGGGCGCATCAGGCGCGGTGCGCAGCGCTGATCGGCGGCTACGCCCGCACGGCCGAGGCCCACGCGCT
+GGTGCGTAGCGGCTGGGCGCACGACGTGGTTGCACCCCGGCCGGAGGTGCGTGCACGCTCTCCTCGCGTG
+GTTGCCCTCGACGACAGCGGATACGACGACGCGCGAGACCCGGCCGCCCGCACCGCACGGCTACCGTCCA
+TCGCGCTGCGCGCCGCGCGCTCAGCGCTGCAGTCCGGGGCGCCGGTGCTGGTGCAGGTGCCGCGGCGCGG
+GTACATCCCCTCGCTGGCCTGCGGGCGCTGCCGGGCGATCGCTCGTTGCCGGTCGTGCACGGGTCCGCTA
+TCGCTGCAAGGCGCCGGCTCGCCCGGTGCGGTATGTCGCTGGTGTGGACGGGTGGACCCGACACTGCGAT
+GCGTGCGCTGTGGGTCGGACGTGGTGCGTGCCGTGGTGGTGGGGGCCCGGCGCACTGCCGAAGAGCTCGG
+CCGGGCATTCCCGGGTACGGCGGTGATTACGTCGGCCGGCGACACCCTGGTGCCCCAGCTCGACGCCGGC
+CCAGCCCTGGTGGTCGCCACTCCAGGAGCCGAACCCCGGGCGCCCGGCGGGTATGGGGCGGCGCTGCTGC
+TGGATAGCTGGGCGCTGCTGGGCCGTCAAGACTTGCGCGCGGCCGAGGACGCGCTGTGGCGCTGGATGAC
+GGCGGCCGCCCTGGTTCGGCCGCGCGGGGCGGGCGGTGTGGTGACCGTGGTCGCCGAATCGTCCATTCCG
+ACAGTGCAATCGCTGATCCGGTGGGATCCGGTCGGTCACGCGGAGGCCGAACTGGCAGCCCGAACCGAAG
+TCGGCCTGCCGCCAAGTGTGCACATCGCTGCTCTTGACGGCCCTGCCGGCACCGTGACGGCATTGCTGGA
+GGCGGCTCGGCTGCCCGACCCGGATCGCCTCCAAGCCGATCTGCTGGGCCCGGTGGACCTGCCACCCGGC
+GTCCGTCGCCCGGCGGGCATCCCCGCCGATGCGCCGGTCATCAGGATGTTGCTGCGGGTGTGCCGCGAGC
+AGGGCCTGGAGTTGGCGGCGAGTCTGCGGCGCGGCATCGGTGTGCTCAGTGCGCGGCAAACCCGGCAAAC
+CCGTAGCCTGGTTCGGGTACAGATTGACCCGCTGCATATCGGGTAAACGGAGTAACCGCTAGCTCAACAC
+TTCCGGGCGGTGAAGATAAGGTATTCCCACTGCATCACGCCGTCGCAGAGGTATTCGCGACAAAGTTCGG
+TGATTTCGGCGTCGAGTGTGGCGACGCACTCGGGGCTGTCGGCGATGGAGCGGTAGGCGTTGATCGCCGG
+GCCGTAGAAATTCTTGAAATAGTCGCGACATTCGTCCGGGCAACCGAACCGGTCCACTGTCAGCGATCCT
+CGCCGGGTACGGATGTCGGACACATGGTCGCGAAACAGGCCACTCACGTAATCCTCGCTTCCCCACCACA
+CCTCGTGCGGCGCTCCCGCCGGCAGCGTCGGCCGGTACGGTCTGATGGTGGACAGCAATTTGCCGTAGAA
+ACCCTCGGGGGTCCAGTTCAGGGTGCTGATCTTGCCGCCGCGCCGGCAGACCCGGGCCAGTTCGTCGGCG
+GTGCGCTGATGACGCGGGGCGAACATCACCCCGATGGTCGAGAGCACCGCATCGAATTCGCCGGCGCTAA
+ACGGGAGGGCTTCTGCGTTGGCTTCCCGCCAGCCGAGCTCCAGTCCGGCTGCCGCAGCACGCGCCTGGGC
+GCGGCGCAGCAGCTCGGGCGTCAGGTCGCTGGCAGTGACGTGGGCACCTGCCATGGCTGCCGGGATCGAT
+ACGTTGCCCGAGCCCGCGGCCACGTCAAGCACGCGATCGCCGCGGCGAATACCGCTGGTGGAGACTAGGA
+TTGGGCCAAGCGGGGCCAACAGCTCCTCGGCGATGGCGGCGTAGTCGCCCAATGCCCACATTTGCCGATG
+CGTGGTCGCCGGCGCCTGGCGCTCGCTGGTGGGTGTGTAGACAGTCATCGGAACTCCTGCGAGACGTCGG
+GTGAGGCTGGTACCGAATTGTGTCAGCAGACAACAGTATACGTTCTAAATAATCAATGTCGACGATGGTC
+AGATGCTAGACTTTCCTGACTTACCCGCACGGTGTACGACGAAGTTGACGCCGGGGACGGCCCCGGGAAA
+GGGGTAATGATGCCAACGGAATATCCGGCGACAGCCGAGGAATCCGTGGACGTGATCACCGATGCATTGC
+TGACGGCGTCCCGGTTGCTGGTAGCCATCTCGGCCCATTCAATCGCTCAGGTCGATGAAAACATCACCAT
+CCCGCAGTTCCGGACCCTGGTGATTTTGTCTAATCACGGTCCGATTAACCTGGCTACGCTGGCGACGTTG
+CTGGGTGTGCAACCGTCGGCCACCGGCCGCATGGTCGACCGGTTGGTCGGCGCCGAACTGATCGACCGGT
+TACCGCACCCCACCTCTCGACGGGAGCTGCTGGCGGCGCTGACCAAGCGTGGACGAGATGTCGTCCGTCA
+GGTCACCGAGCACCGGCGCACCGAGATCGCCCGCATCGTGGAACAGATGGCACCGGCGGAACGCCATGGG
+CTGGTGCGTGCCCTGACGGCGTTCACCGAGGCGGGCGGTGAGCCCGACGCACGCTACGAAATCGAGTAGC
+TAGCGGCCGAGCCCGTGTCGGGCCGTCCGTTACGTGCTGGGACGACCCGACACAGGCCGGATTGCCCGCC
+TCAGCGCTTTTCGGCGGTGAGCAGCAGGTACTCCCATTCCATGACACCGTCCGACAGGTATTGCGCTGCG
+AGTTCGACAAGCTGGCGGTCGAGCTCGGCGGCCAGCACCGCGTTGTCACCGATGTGCGCGTAGGCCTCGA
+TCGTCGGGCCATAGTTGTTCTTGAAGTAGTCGTGGACGGCCTGGGCGGTGTCGAACCGCTTCACTTCCAA
+CAAGCCACGGGCCGTCTTGAGGCCAGTGACTCCATCGCCCAGCAGACCAGTGACATAGGCCTCACGTCCC
+CACAACGCCGACGGCGGCAGATCCGCCGACACGCTGGGCCGGTATGGCCTAATGGTTGCCAGCATCCGGC
+CGAAGAATCCCTCGCACGTCCAGCTGATCACACCGATCGTCCCGCCAGGCCGGCAGACGCGGACCAGCTC
+GTCGGCCGCGGCCTGATGATCCGGTGCGAACATCACGCCGATCGCTGAGATCACCGTGTCGAACTCGTCG
+TCGGCAAACGGCAGGGCTTGCGCGTTGGCTTCCTGGTATTGCAGGGTCAGCCCCTGTTGGGCGGCCCTGG
+CCTGGGACCGCTGCAGCAGCTCGGGCGTCAGGTCGGTGGAAATGACCGTGGCACCCGTCTTGGCTGCGGG
+CAGCGAAATATTGCCAGAGCCAGCGGCGACGTCGAGCACCCGAACACCCGGCCCGATGCCCGCGGCGGCA
+ACCAGGATCGGGCCGAGTGGCGCCATCACCTCTTCTGCCATCAGGGCGTAGTCACCCAGGGCCCACATCG
+CCCGGTGTGTGGCCGCAAGCGTTTGGTCCTCGCGAGCAGGTGTGTCGATAGTCATCAGGTCTCCTGAGAA
+GTAAGTGATGTGGCTGCGAACTTCGACATCGTTGTCGCGGGCACGGCGGGAGCCTGGGCAGTAGCGCGCC
+TTGCGTACCCACCGGATACAGTATGCATCAGAAATAGTGTATTCCTCTAACTATCGCGCGTGTCGGAATT
+GTGGCCCACGCCACGTCGGCGGCGCTTCTTAGACTGGGCGCGTGCGCCTTGTCTTTGCCGGCACCCCCGA
+ACCCGCGCTGGCCTCGCTGCGCAGGCTCATCGAATCGCCCAGTCACGACGTGATCGCCGTGTTGACCCGT
+CCGGATGCCGCCTCCGGCCGGCGGGGCAAGCCGCAGCCGTCACCGGTGGCCCGTGAGGCGGCAGAGCGCG
+GCATTCCGGTGCTGCGGCCATCGCGACCGAACTCGGCAGAGTTCGTCGCCGAACTGTCGGATCTGGCGCC
+AGAGTGCTGCGCCGTGGTTGCCTACGGAGCCCTGCTCGGCGGTCCCTTGCTGGCCGTGCCGCCGCATGGC
+TGGGTCAACCTGCACTTCTCGCTGCTGCCGGCCTGGCGTGGCGCGGCGCCGGTGCAGGCCGCCATCGCCG
+CGGGAGACACGATCACCGGAGCCACGACGTTCCAGATTGAGCCAAGCCTGGACTCGGGACCGATATACGG
+TGTCGTCACCGAGGTGATCCAGCCGACCGACACCGCGGGCGATCTACTTAAGCGACTGGCGGTATCGGGG
+GCAGCGCTGCTATCGACCACGCTGGATGGCATCGCCGATCAGCGGCTGACGCCGCGGCCGCAACCGGCAG
+ACGGGGTCAGCGTGGCGCCGAAAATCACCGTAGCGAATGCCCGGGTGCGATGGGACTTGCCGGCGGCGGT
+CGTGGAGCGGCGGATCCGCGCCGTCACTCCCAACCCCGGCGCCTGGACGCTCATCGGTGACTTACGGGTC
+AAACTTGGACCGGTGCACCTCGACGCCGCTCACCGGCCATCGAAGCCCTTGCCGCCCGGTGGAATCCACG
+TGGAACGCACGAGCGTGTGGATCGGCACCGGCTCGGAACCGGTGCGGCTGGGCCAGATTCAGCCGCCCGG
+CAAGAAACTCATGAACGCGGCCGACTGGGCGCGGGGCGCACGGCTGGACCTGGCCGCACGGGCAACATGA
+CCCCTAGATCGCGTGGGCCGCGCCGCCGGCCGCTGGACCCGGCGCGTCGTGCGGCCTTCGAGACGCTGCG
+GGCGGTTAGTGCGCGCGACGCCTACGCGAACCTGGTGTTGCCCGCGCTGCTGGCCCAACGCGGTATCGGC
+GGTCGCGACGCCGCGTTCGCCACCGAGCTGACATACGGCACCTGCCGAGCCCGCGGCCTGCTCGACGCGG
+TCATCGGTGCGGCCGCCGAGCGTTCGCCGCAGGCGATCGATCCGGTGCTGCTAGACCTGTTGCGGCTCGG
+CACCTACCAATTGCTGCGCACGCGGGTCGACGCACACGCCGCAGTGTCGACCACCGTCGAGCAGGCCGGA
+ATCGAATTCGATTCGGCGCGAGCAGGTTTCGTCAACGGTGTACTACGAACGATCGCCGGCCGAGACGAGC
+GGTCCTGGGTTGGCGAACTCGCTCCTGATGCGCAGAACGATCCGATCGGGCATGCCGCGTTCGTGCATGC
+GCATCCCCGATGGATCGCCCAGGCCTTTGCTGACGCGTTGGGCGCGGCGGTCGGGGAGCTCGAGGCAGTT
+TTGGCCAGCGACGACGAACGGCCAGCGGTGCACCTGGCGGCACGCCCCGGGGTGCTGACCGCCGGCGAAC
+TGGCCCGCGCGGTGCGCGGAACCGTCGGTCGGTATTCGCCGTTTGCGGTGTATCTGCCGCGCGGTGACCC
+GGGGCGACTGGCGCCGGTGCGCGACGGCCAAGCGCTGGTCCAGGACGAGGGCAGCCAGTTAGTCGCCCGA
+GCATTGACCCTGGCGCCAGTCGACGGCGATACCGGACGGTGGCTGGACCTGTGTGCCGGACCGGGCGGCA
+AGACCGCGCTGTTGGCCGGGCTGGGTTTGCAGTGCGCAGCCCGGGTGACCGCGGTGGAACCCTCGCCACA
+CCGCGCGGACCTGGTAGCACAGAACACCCGCGGGCTGCCGGTTGAGCTCTTGCGTGTCGACGGGCGGCAC
+ACCGACCTCGACCCGGGTTTCGACCGGGTGCTGGTGGATGCGCCCTGCACCGGGCTGGGCGCGTTACGCC
+GTCGGCCGGAGGCCCGTTGGCGTCGTCAGCCGGCGGACGTAGCGGCACTGGCCAAGCTACAACGCGAGTT
+GTTGAGCGCCGCCATCGCGCTGACTCGGCCCGGCGGTGTCGTGCTCTATGCCACATGCTCGCCGCACCTG
+GCCGAGACTGTGGGTGCTGTCGCCGACGCGCTACGCCGACATCCGGTTCACGCGCTCGATACCCGCCCAC
+TGTTCGAGCCGGTGCTCGCGGGGCTGGGGGAGGGGCCCCACGTTCAGCTGTGGCCGCACCGGCACGGTAC
+CGACGCCATGTTCGCCGCGGCGTTGCGCCGCCTGACGTGAGGTTCGCCGCAGCGGCTCAGTAATGTGTCG
+CTCATGGCCGGTAGCACGGGGGGACCGCTGATAGCGCCGTCGATCCTAGCCGCTGATTTCGCCAGACTCG
+CGGACGAAGCGGCCGCGGTCAACGGCGCCGACTGGTTGCATGTAGACGTGATGGACGGTCACTTCGTGCC
+AAACCTGACCATCGGCCTGCCGGTGGTGGAGAGCCTGCTGGCGGTCACCGACATCCCGATGGATTGCCAT
+CTAATGATCGACAACCCGGACCGGTGGGCTCCGCCGTATGCCGAGGCGGGCGCCTACAACGTCACCTTCC
+ACGCGGAGGCCACCGACAACCCGGTCGGCGTGGCCCGCGATATCCGGGCCGCGGGGGCCAAAGCCGGGAT
+CAGCGTGAAGCCGGGGACCCCGCTGGAGCCATACCTGGACATCCTGCCCCATTTCGACACCCTGCTCGTC
+ATGTCGGTAGAGCCTGGCTTCGGTGGCCAGCGGTTCATTCCCGAGGTGCTGAGCAAGGTGCGTGCGGTGC
+GCAAGATGGTCGACGCGGGCGAGCTGACGATCCTGGTCGAGATCGACGGCGGCATCAACGACGACACGAT
+TGAGCAGGCTGCCGAGGCCGGCGTCGACTGCTTTGTCGCCGGATCGGCGGTGTACGGCGCCGATGACCCG
+GCCGCGGCGGTTGCGGCACTACGGCGACAGGCCGGTGCCGCCTCACTCCACCTGAGCCTATGAACGTGGA
+GCAGGTCAAGAGCATCGACGAGGCTATGGGTCTCGCCATCGAGCACTCCTACCAGGTCAAAGGCACGACT
+TATCCAAACCCCCCAGTGGGGGCCGTCATTGTGGATCCCAACGGTCGGATCGTCGGCGCCGGCGGCACCG
+AGCCGGCCGGTGGCGATCATGCCGAGGTGGTGGCGCTGCGCCGGGCCGGCGGATTGGCTACCGGCGCCAT
+CGTGGTGGTCACCATGGAACCCTGTAACCACTACGGCAAGACTCCGCCATGCGTGAACGCTCTGATCGAA
+GCCAGGGTGGGGACGGTGGTCTACGCCGTCGCCGACCCGAACGGGATCGCTGGGGGTGGCGCGGGCCGGC
+TGTCAGCAGCGGGCCTACAGGTGCGGTCCGGGGTGTTGGCTGAACAGGTGGCGGCCGGACCGCTGCGGGA
+GTGGCTCCACAAGCAACGCACCGGTCTGCCGCATGTCACCTGGAAGTACGCCACCAGCATCGACGGCCGC
+AGCGCCGCCGCCGACGGCTCCAGCCAGTGGATCTCCAGCGAGGCCGCACGCCTGGATCTGCATCGCCGCC
+GCGCCATCGCCGACGCGATCTTGGTCGGCACCGGCACCGTCCTCGCCGACGACCCGGCCCTGACCGCGCG
+GCTGGCCGACGGCTCGCTGGCGCCGCAGCAGCCGCTGCGCGTGGTGGTGGGCAAGCGCGACATACCGCCG
+GAAGCACGGGTCCTCAACGACGAGGCACGCACCATGATGATCCGCACCCACGAACCTATGGAGGTGCTCA
+GGGCGTTGTCGGATCGCACCGACGTGCTGCTGGAAGGAGGTCCCACCCTCGCCGGCGCCTTCCTACGAGC
+GGGTGCGATCAACCGGATCCTGGCCTACGTCGCACCGATCCTGTTGGGCGGTCCGGTTACCGCGGTCGAT
+GACGTCGGGGTGTCCAACATCACCAACGCGTTGCGTTGGCAGTTCGACAGCGTCGAAAAGGTCGGACCGG
+ATCTGTTGCTGAGCTTGGTGGCTCGTTAGAGCGGCTCCACTTGGGGCGCCAGGGTCGGTTGCTCCTGGAC
+TTCCGGTTCATCGGCATGTTCCTTGCGGCCGCTGATCAACAGACCTAGCACCGCGCCGAACACGCACACG
+ATCGCGGTGATGGTGAATATCTCGCCGTACATCAGCGCGAACGCCTGCTGGTACCGGGCTCCAATTGCGG
+CCGCGCGCTCGAGCAGGCTGGCGTTGGGCGGGATGGCCGCCGACAACCCCGCCAGGATCTGGTTGAACCG
+GTACAACCCCCAGGCGCTCAGCGCGGCCACGCCGATCAACATGCCGGTCATCCGGGCGACCACCACCGCC
+GCCGAAGCGATGCCGTGCTGGGCCGACGGGACAACCCGTAGGGTGGCCGACGATAGCGGCCCGATCACCA
+GCCCCAACCCTAAACCAGCCACCACCAGGTCGGTGTGCATCGCCGGCACGGTGAACAATCCGAGGATGTT
+GTGCCGATCGGCCAACAGGTCCACCGGCCAGTGGGAAATAAGCCAGTAACCGTACGCCGCAATAAGCAGT
+CCGGCAAAGGCCACCGCACGGTCACCGGCCCTGGTGGCGATCCACCCGCCCGTCACTGCCCCGATCGGTA
+GGGCGATAAGGAACCACAGCAGCATTCCGGCCGCCTGAGCCTGGTCCATCTGCAGCACGCCCTGGCCGAA
+CAGCTCGACATCAACCAGCGTCACCATCAGCGCCGCGCCGGCGGCGACGGAGGCACCCAGCGCGGACAGG
+AACGGCCGGAAGTGCACACCGGCCGGGTCGATCAGCCGGGTGCGAGCGAAACGTTCCCAACCGAAGAACG
+CCACCGCGGCAACGAGAGCGCCGACCAGCAACGGAGCCCCGTAGTCCGGCAGTACGTGTTTGCCGTCGGG
+ATTGGGGTTGTACAGCCCGATGACGGCGAGGCCCAACGCGAGTGCCAGCAGCAGACCACCGACCAGGTCG
+ACTCGCTCGGGCTCCGTGCTGCGGTCGTGTGAGGGCAGGCTGAAGTGGATCATTACCATGGCGATCGCGG
+TCAACGGGACGTTGATCCAGAACACGTCACGCCAGTCGTGCAATAGCCAAACGATGAAGATTCCGTACAA
+CGGGCCCAGAACGCTGCCGAGCTCCTGCGCGGCGCCGATACCGCCGAGCACGCCGGCGCGGTTGCGCTGC
+GACCACAAATCGGCGCCCAGCGCCAGCGTGATCGGCAATAGCGCGCCGCTGGCAACACCCTGGATCGTGC
+GGCCCGCGATCAGCATGTGGAAATCGCCAAAATGCCCGGCCAGCGCGGTCACTACCGAGCCGATGATGAA
+CCCGGCCAGGCTGACCTGCAGCATCAGCTTGCGCCCGAATCGGTCGGAAGCCCGGCCCAGCAACGGCATG
+GCGGCGATGTAGCCCAGGAGGTACATCGTGACGATCCAGGTGATCCGGTGGAGTTGGTTGATCGGTATAC
+CAACGCTGTTCATGATGTCGCGCATGATGGTGACCACGACATAGGTGTCCAGGGCGCCCAGCAGTACTGC
+CAGGCTGCCCGCGCTAATCGCGACTCGACGTCCTGCTCGCATGCTGATCAGCTCACCGGGGGCTTCGTGA
+CCTGGACCTTCTCGCCCCATTTCGACAAGGTCATCTGGACGGAATTGCCCGAGCCGCGGTCCAACTGGGC
+CTGTGCCAGTTGATGATCGCCGGTCTCCTGAATCCAGACGGTCGCCGGCACCGGCTGCGTCGCGTTGAAC
+GGCGGCGCTATCTGGTTCACCGCCTGTGCCGATACCTTCCCGCTGATGCGGATGGTGTTCTGGCCGTTGA
+TGGTATCCCGCCCTTCGGCTTTTGCGTCGGCGAAATTCGCCAGCACGTTGGCCAGGCCGGTATCCGGATT
+CAGCACCTGGGCGGGGTCGTAGATGTCGGCGGCGGGACCGAAATCGCTCCACTGGTTGGGCGTCAGGGTG
+GCGTACAGGATCCCGTCGAACACCACGAAGTCGGCATCGATATCAGACCCACCCAGCGTGAGCTTGACGT
+TTCCCGTCGCGGCGGTGGGGTTGGTGGTGAGATCGCCGCTCAGCGTCTTCAGAGACAGTCCCGGGATCTT
+GCCGTTGACCGTCAGCACCATGTGCGCGCTCTTGAGAGCCTTGGTCTGCGCGGTGGCCTCCTCGACCAGC
+GGCTTCGCGTCCGGAAGTGGTCCGCCGCTTGGCTTCGAGCCCGACGAGCAGCCGGCAACGACAGTGGCGG
+CGATGCTAACGGCGGCGAGGACGGCGATGCGACGGCAGTGGCGTCTGGGGGTCCGCATACCCTGCATCGT
+AGAGGGTGTCTGTGAGTTGGCCGGTCGGCGAGTGGGGTGCGGGTCCGCGGGATTGCTGCCTAACCTGGTG
+CGATGTTCACCGGAATTGTTGAGGAACGCGGAGAAGTGACCGGGCGTGAGGCCCTGGTCGATGCGGCGCG
+GCTGACCATCCGCGGTCCGATGGTTACCGCCGACGCCGGCCACGGCGACTCGATCGCTGTCAACGGCGTG
+TGTCTGACGGTCGTCGATGTATTGCCCGACGGCCAATTCACCGCCGACGTGATGGCCGAGACACTGAACC
+GGTCCAACCTGGGTGAGCTACGGCCCGGCAGCCGGGTGAACCTGGAACGCGCCGCGGCGCTGGGCAGCCG
+GCTCGGCGGGCACATCGTGCAGGGACATGTGGACGCCACCGGTGAAATCGTGGCTCGTTGTCCCTCCGAG
+CACTGGGAAGTGGTGCGCATCGAGATGCCGGCTTCGGTGGCTCGCTATGTCGTCGAAAAGGGCTCGATCA
+CCGTCGACGGGATTTCTCTGACGGTCTCCGGGCTCGGCGCCGAACAGCGGGACTGGTTTGAGGTCTCGCT
+GATCCCGACGACCCGGGAGCTGACCACGCTGGGGTCCGCTGCGGTGGGAACCCGGGTGAACCTCGAAGTC
+GACGTAGTCGCAAAGTATGTTGAGCGGTTAATGCGGAGCGCCGGCTGACATCGCTCGCCGAGGGAGGGAG
+CCCCATGTCTTGCATTCCGGACGAGATCGATACGCCCGACGTGCTGATCGACCGCGACATCCTTGACCGC
+AACATCGGGCGAATGAGTTCCGCCGTCGCCGCGAAAGGGATCGCCCGGCGTCCCCACGTGAAGACGCACA
+AGCTGCCTGAGATCGCCCATATGCAACTCCGCGCGGGCGCGCGGCCTGACGGTGGCCACCATCGGGGAAG
+TCGAGGTATTCGTCGACCACGGCGCCGACGACGTATTCATCACCTACCCATTGTGGATCGGCACACGCCA
+AGCCGACCGGCTCCGTCAGCTGGCTGACCGCGCTCGCATCGCTGTCGGTGCGGGCACCGCCGAGGGCGCT
+TCGAACACCGGCGCACGGCTCGCAGACGCCGCTGGCGCGATCGATGTTCTCATCGAAATCGACAGTGGCC
+ATCACCGCAGCGGCGTCCGTGCCGAACAAGTGTTGGAGGTCGCCCACGCCGTCGGTGAGGCTGGGCTTCA
+CCTGGTGGGGGTGTTCACCTTCCCCGGTCACAGTTATGCGCCAGGTAAACCCGGCGAAGCCGGCGAGCAA
+GAGCGGCGCGCTCTCAACGACGCGGCGAACGCGCTGGTCGCGGTGGGCTTCCCGATCAGCTGCCGCAGCG
+GTGGGTCCACTCCCACCGCATTGCTCACCGCCGCGGACGGGGCCTCCGAGACGTCCCGGCGTCTATGTGC
+TCGGTGACGCCCAGCAACTGGAACTCGGGCGCTGCGCGCCGGCGGACATCGCGCTGACCGTTGCCGCCAC
+CGTAGTGAGCCGCCAGGACTGCAGGTCCGGCTTGCGCCGAATTGTCCTTGACTGCGGTAGCAAGATTCTC
+GGCAGCGATCGTCCGGCCTGGGCGACTGGGTTCGGCCGTCTGATCGACCACGCCGATGCGCGCATCGCGG
+CGCTGTCGGAGCATCACGCCACCGTTGTCTGGCCCGACGACGCCCCGCTCCCGCCGGTGGGAACACGTCT
+GCGGGTGATTCCCAACCACGTGTGCCTGACCACCAACCTCGTAGATGATGTCGCCGTGGTGCGCGACGCA
+ACCCTGATTGATCGCTGGAAAGTCGCCGCCCGCGGTAAGAACCATTGATCCTGTCGCACTTGGTCACGGC
+AATACCGCCTGGCTCAATGGTTCATACTGAATGGAACACGTGGGCTTCGCGTGCGGCCAGGCCTGACAGC
+TAGGTAGCAAAGATGACGAGGTTGGACTCCGTCGAGCGGGCGGTTGCCGACATTGCGGCGGGTAAGGCCG
+TCATCGTCATCGACGACGAAGACCGGGAGAACGAGGGTGACCTGATCTTCGCCGCCGAGAAGGCAACGCC
+GGAGATGGTGGCCTTCATGGTCCGCTACACCTCCGGATACCTGTGCGTTCCGCTGGACGGTGCCATCTGC
+GACCGGCTGGGCCTGTTGCCCATGTACGCGGTGAACCAGGACAAGCACGGGACGGCATACACCGTCACAG
+TCGATGCACGGAATGGCATTGGAACTGGCATTTCGGCGTCCGATCGGGCTACCACCATGCGGTTGCTGGC
+CGATCCGACCAGTGTGGCCGACGATTTCACCCGCCCCGGTCACGTGGTCCCCTTGCGGGCCAAGGATGGT
+GGGGTTCTGCGCCGGCCCGGCCACACCGAGGCCGCCGTGGACCTGGCCCGGATGGCCGGGCTGCAACCCG
+CGGGGGCGATTTGCGAGATCGTCAGCCAAAAAGATGAGGGCTCGATGGCGCACACCGATGAATTGCGGGT
+GTTCGCCGATGAGCACGGTCTGGCGCTGATCACCATTGCTGACTTGATCGAATGGCGGCGCAAGCACGAG
+AAGCACATTGAGCGGGTCGCCGAGGCGCGGATTCCGACTCGTCATGGGGAGTTTCGCGCCATCGGCTACA
+CCAGCATCTACGAGGACGTGGAACATGTCGCGCTGGTCCGCGGCGAGATCGCCGGGCCCAACGCCGACGG
+TGACGACGTGCTGGTCCGGGTGCATTCGGAGTGCTTGACCGGCGATGTGTTTGGGTCACGCCGCTGCGAT
+TGCGGGCCTCAGCTGGACGCCGCGCTGGCGATGGTCGCCCGTGAGGGGCGCGGCGTGGTGCTGTACATGC
+GTGGCCACGAGGGCCGCGGCATCGGCCTGATGCACAAACTGCAGGCCTACCAACTGCAGGACGCCGGTGC
+CGACACCGTTGACGCCAATCTCAAGCTTGGACTACCTGCCGACGCAAGGGATTACGGGATCGGCGCACAG
+ATCCTGGTCGATCTTGGGGTACGTTCGATGAGGCTGCTGACCAACAACCCGGCCAAGCGGGTGGGACTGG
+ATGGATACGGATTGCACATCATCGAGCGCGTGCCGCTGCCGGTGCGGGCCAACGCGGAGAACATCCGTTA
+CCTGATGACCAAGCGTGACAAATTGGGGCACGACTTGGCTGGGTTGGACGATTTTCACGAATCCGTGCAT
+CTGCCCGGAGAATTCGGCGGTGCCTTGTGAAGGGTGGCGCCGGGGTGCCGGATCTGCCGTCGCTGGATGC
+GTCTGGTGTGCGGCTGGCGATTGTCGCCAGCAGCTGGCACGGAAAGATCTGCGACGCGCTGTTGGACGGC
+GCCCGCAAGGTGGCCGCCGGGTGTGGCCTCGATGACCCGACTGTGGTTCGGGTGCTCGGCGCGATCGAGA
+TTCCGGTGGTGGCGCAGGAATTGGCCCGCAATCATGATGCCGTCGTCGCACTTGGCGTCGTGATCCGCGG
+TCAGACACCACATTTCGACTACGTGTGCGATGCGGTAACCCAGGGACTGACCCGGGTATCGCTGGATTCC
+TCGACGCCGATCGCCAACGGCGTGCTGACCACCAACACCGAGGAGCAGGCGCTGGATCGGGCGGGGCTAC
+CGACGTCGGCCGAGGACAAGGGCGCCCAGGCGACTGTGGCAGCCCTGGCCACCGCGTTGACCCTGCGCGA
+GCTGCGCGCTCACTCGTGACCGCCGCACCGAACGACTGGGACGTCGTGTTGCGTCCTCACTGGACGCCGT
+TATTTGCCTACGCTGCAGCGTTTCTGATCGCGGTAGCGCACGTCGCGGGGGGCCTGCTGCTCAAGGTCGG
+GTCCAGTGGCGTGGTCTTCCAGACCGCTGATCAGGTGGCAATGGGTGCCCTGGGGCTGGTCCTCGCCGGG
+GCGGTGCTACTGTTCGCGCGGCCGCGGCTGCGGGTGGGTTCTGCCGGGCTTTCGGTGCGGAATCTGTTGG
+GTGACAGGATCGTTGGGTGGTCTGAAGTGATCGGTGTGTCGTTTCCCGGCGGTAGCCGGTGGGCGCGGAT
+CGACCTGGCCGACGACGAGTACATCCCGGTGATGGCGATCCAAGCAGTGGATAAGGACCGCGCCGTGGCC
+GCCATGGACACGGTGCGCTCGTTGCTGGCTCGATACCGGCCTGACCTGTGCGCCCGCTGAAGCGACTTCC
+CGTACGATCGCGAAATGGCATGTCTTGGGCGCCCTGGCTGTAGGGGTTGGGCGGGGGCGAGCTTGGTCCT
+TGTGGTGGTGTTGGCCCTGGCTGCTTGCACCGAGTCGGTAGCGGGCCGCGCGATGCGTGCTACCGACCGG
+TCGTCCGGGCTGCCCACATCCGCCAAGCCGGCGAGGGCGCGCGACCTGCTGCTGCAGGACGGGGATCGCG
+CTCCGTTCGGCCAGGTAACCCAGTCTCGCGTCGGCGACAGCTACTTCACCAGCGCCGTTCCACCCGAGTG
+CTCGGCGGCGCTGCTGTTCAAAGGTTCCCCGCTGCGGCCTGACGGCTCGTCGGACCACGCCGAGGCGGCT
+TATAACGTCACCGGTCCGCTGCCGTACGCAGAGTCGGTCGATGTCTACACGAATGTCCTGAACGTCCACG
+ATGTGGTCTGGAACGGGTTCCGCGACGTGTCCCACTGCCGTGGCGATGCCGTCGGAGTGAGCCGGGCCGG
+CAGATCGACGCCCATGCGACTCAGGTACTTCGCTACGCTGTCAGACGGTGTCCTGGTATGGACCATGAGC
+AATCCGCGCTGGACGTGTGATTACGGATTGGCTGTGGTCCCGCACGCGGTGCTGGTGTTATCGGCGTGTG
+GCTTCAAGCCCGGATTCCCCATGGCGGAATGGGCGTCGAAACGGCGGGCCCAACTGGACAGCCAGGTTTA
+ACGCCAGCCCCCATGCTCTTCGCGGGCGGGTTTGAACCGGCCAAACGGGGTCAAAGTCACGGCGGCCTGG
+GCATACTCAAATGTGTCCCACGGCCCACCATCGGATCCCGACGACGGCCCACTGTGAACTGTGCCGCTCG
+TGGTGCATTACCCAGACCACGATGAGAGAATGGCGGGGAAATGGGTGAATTACGGTTGGTGGGCGGTGTG
+CTCCGGGTCCTTGTCGTGGTCGGTGCGGTGTTCGATGTGGCGGTGCTAAACGCCGGTGCGGCTAGTGCCG
+ACGGCCCGGTCCAGCTGAAGAGCCGATTGGGCGATGTTTGCCTGGACGCCCCGAGTGGGAGCTGGTTCAG
+CCCGCTGGTGATCAACCCCTGCAATGGGACCGACTTTCAGCGCTGGAATCTCACCGATGACCGGCAGGTC
+GAGAGCGTGGCCTTCCCCGGGGAATGCGTGAATATCGGAAATGCTTTGTGGGCGCGCCTGCAGCCCTGTG
+TGAACTGGATCAGCCAGCACTGGACTGTCCAGCCCGACGGCCTGGTCAAGAGTGATCTTGATGCCTGCCT
+CACGGTTCTCGGCGGTCCGGATCCTGGGACCTGGGTGTCCACCCGCTGGTGCGACCCCAATGCACCCGAC
+CAACAGTGGGATAGCGTGCCGTAACCGGCCTGCCCGGCGAACCCCCGCCTTTCTGGGCGCCGTCGAAGCG
+ACCACTAGCCTAGATACGTGCCAGATCCCGCAACGTATCGCCCCGCGCCCGGGTCCATCCCGGTCGAGCC
+GGGCGTGTACCGATTCCGGGACCAGCATGGGCGAGTCATCTACGTCGGCAAGGCCAAGAGCCTGCGTAGC
+CGGCTGACGTCCTATTTTGCCGACGTGGCCAGCCTAGCGCCGCGGACCCGGCAGCTGGTGACCACCGCGG
+CCAAGGTCGAATGGACGGTCGTGGGGACCGAGGTTGAGGCACTGCAGCTGGAATACACCTGGATCAAGGA
+GTTCGATCCGCGATTCAACGTCCGCTACCGCGACGACAAGTCCTACCCTGTGCTGGCGGTCACCCTGGGC
+GAGGAATTTCCCCGGTTGATGGTCTATCGCGGTCCGCGGCGCAAGGGTGTGCGCTATTTCGGGCCGTACT
+CGCACGCGTGGGCAATCCGGGAAACGCTGGATCTGCTCACCCGGGTGTTTCCGGCGCGAACTTGCTCGGC
+GGGGGTGTTTAAGCGGCACAGGCAGATCGATCGTCCATGCCTGCTCGGCTACATCGACAAATGTTCCGCG
+CCGTGTATTGGCAGGGTCGATGCGGCCCAGCACCGCCAGATCGTGGCAGACTTCTGCGACTTTCTGTCCG
+GCAAGACCGACCGGTTCGCCCGCGCCTTGGAACAGCAAATGAACGCCGCGGCCGAGCAACTGGACTTCGA
+ACGAGCGGCGCGGCTTCGCGACGACCTGTCCGCACTGAAGCGTGCCATGGAAAAGCAGGCCGTGGTGCTC
+GGGGACGGCACCGACGCCGACGTGGTGGCATTCGCCGACGACGAACTCGAGGCGGCGGTGCAAGTGTTCC
+ACGTGCGCGGCGGACGGGTCCGCGGCCAGCGTGGCTGGATTGTCGAAAAGCCAGGAGAGCCAGGAGATTC
+CGGAATCCAGTTGGTCGAGCAATTCCTGACACAGTTCTACGGCGACCAGGCGGCGTTGGACGACGCCGCC
+GACGAATCCGCCAACCCGGTTCCCCGCGAGGTGCTGGTGCCCTGTTTGCCGTCCAACGCCGAGGAGCTGG
+CCAGCTGGCTGTCCGGCCTGCGCGGCTCAAGGGTCGTGCTGCGGGTGCCGCGCCGCGGGGACAAGCGGGC
+ACTGGCCGAAACGGTGCACCGAAACGCAGAAGATGCACTGCAACAACACAAGCTGAAGCGGGCCAGCGAT
+TTCAACGCCAGATCCGCTGCGCTGCAGAGCATTCAGGACTCGTTGGGCCTGGCAGACGCACCCTTGCGGA
+TCGAGTGTGTCGACGTCAGCCATGTGCAGGGCACCGACGTGGTCGGGTCACTGGTGGTGTTCGAAGACGG
+CCTGCCGCGCAAGTCGGACTACCGCCACTTCGGGATCCGGGAAGCCGCAGGCCAGGGGCGCTCCGACGAC
+GTGGCCTGTATTGCCGAGGTGACCCGGCGCCGCTTCCTGCGGCACCTGCGCGATCAGAGCGATCCGGATC
+TTCTTTCTCCGGAAAGGAAGTCGCGTAGATTCGCCTATCCGCCCAATCTGTACGTCGTCGACGGCGGCGC
+GCCGCAAGTCAACGCGGCCAGTGCGGTAATCGACGAACTCGGTGTTACCGACGTCGCGGTGATCGGCCTG
+GCCAAGCGGCTGGAAGAGGTATGGGTGCCGTCGGAGCCGGACCCGATTATCATGCCGCGCAACAGTGAGG
+GACTCTATCTGCTGCAGCGAGTGCGAGACGAGGCACACCGGTTCGCTATCACCTACCATCGCAGCAAGCG
+GTCGACGCGGATGACTGCCTCAGCGCTGGACTCGGTGCCGGGATTGGGGGAGCATCGCCGCAAAGCGCTG
+GTCACCCATTTCGGATCGATCGCTCGCCTCAAGGAGGCCACCGTCGACGAAATCACCGCTGTTCCCGGTA
+TCGGCGTGGCCACGGCCACGGCCGTCCACGACGCACTGCGACCTGACTCATCGGGGGCCGCGCGATGATG
+AACCATGCTAGGGGCGTCGAGAATCGTTCGGAAGGCGGCGGTATCGACGTCGTCTTGGTAACCGGGCTGT
+CCGGGGCCGGGCGCGGCACGGCGGCTAAAGTGCTGGAAGACCTGGGCTGGTATGTGGCCGACAATCTGCC
+GCCCCAGCTGATTACCCGCATGGTGGACTTCGGGCTGGCCGCCGGATCACGGATCACCCAGCTGGCGGTG
+GTAATGGATGTGCGATCGCGCGGATTCACCGGCGACCTCGATTCGGTCCGCAACGAGCTGGCCACGCGTG
+CCATCACCCCGCGTGTGGTGTTCATGGAGGCGTCCGATGACACGTTGGTGCGCCGCTACGAACAGAATCG
+CCGCAGTCATCCGCTGCAGGGTGAGCAGACTCTGGCCGAGGGCATTGCCGCAGAGCGCAGGATGCTAGCA
+CCGGTTCGCGCCACCGCCGACCTGATCATCGACACGTCGACACTGTCGGTGGGGGGCTTAAGGGATAGCA
+TCGAGCGTGCCTTCGGCGGTGATGGCGGCGCGACCACCAGCGTCACCGTTGAATCCTTCGGGTTCAAGTA
+CGGCCTGCCGATGGACGCCGACATGGTCATGGACGTGCGGTTCCTGCCGAACCCGCACTGGGTGGACGAG
+TTGCGGCCACTGACCGGCCAACATCCGGCCGTGCGCGACTATGTGCTGCACCGGCCGGGCGCGGCTGAGT
+TCCTCGAGTCCTACCATCGGTTGCTATCCCTGGTTGTCGACGGCTACCGTCGAGAGGGGAAGCGCTATAT
+GACAATCGCCATCGGCTGTACCGGTGGTAAGCATCGCAGCGTCGCGATCGCTGAAGCACTGATGGGACTT
+CTGCGCTCCGATCAGCAACTGTCGGTGCGGGCGCTGCACCGGGATCTGGGTCGCGAATGACCGATGGCAT
+CGTCGCGCTGGGCGGCGGACACGGCTTGTATGCGACGCTGTCTGCGGCCCGCCGGTTGACACCCTACGTT
+ACCGCCGTGGTGACCGTCGCCGATGACGGTGGCTCGTCGGGCCGGCTGCGCAGCGAGCTCGATGTGGTGC
+CGCCGGGCGATCTGCGAATGGCCTTGGCGGCGTTGGCATCCGATAGCCCGCACGGACGCCTGTGGGCAAC
+TATTCTGCAGCACAGATTCGGCGGCAGTGGTGTGCTGGCCGGACATCCGATCGGCAATCTGATGCTAGCG
+GGCCTGTCCGAGGTGCTGGCCGATCCGGTCGCGGCTCTTGACGAACTCGGGCGCATCCTCGGGGTGAAAG
+GCAGGGTGCTGCCGATGTGCCCGGTCGCGCTTCAGATCGAGGCCGATGTCTCCGGTCTGGAGGCCGACCC
+GCGCATGTTCCGCCTGATCCGTGGCCAGGTGGCGATCGCGACCACGCCCGGAAAGGTGCGCCGGGTGCGG
+CTGCTGCCGACTGACCCGCCGGCGACCCGGCAGGCTGTCGACGCCATCATGGCTGCCGATCTGGTGGTCC
+TGGGGCCCGGGTCGTGGTTCACCAGCGTGATACCCCATGTGCTGGTGCCGGGTCTGGCCGCAGCGCTGCG
+AGCAACGTCGGCCCGCCGTGCCCTGGTGCTCAACCTGGTGGCTGAACCGGGAGAGACGGCCGGTTTCTCG
+GTGGAGCGTCATCTGCACGTGCTAGCCCAACACGCGCCCGGGTTCACCGTTCACGACATCATCATCGACG
+CCGAACGAGTGCCGAGCGAACGGGAGCGGGAGCAACTGCGCCGCACGGCGACGATGCTGCAGGCCGAGGT
+CCACTTCGCCGATGTCGCCAGACCTGGTACACCTTTACATGACCCGGGCAAGCTGGCGGCGGTCCTCGAC
+GGGGTGTGTGCGCGCGACGTCGGCGCGTCGGAGCCTCCGGTGGCGGCCACACAGGAGATACCGATCGACG
+GTGGACGACCGAGGGGTGACGACGCGTGGCGATGACGACCGATGTCAAAGACGAGCTGAGCCGACTGGTG
+GTGAAGTCCGTCAGCGCGCGGCGCGCGGAGGTCACCTCTCTGCTGCGATTCGCCGGCGGGTTGCACATCG
+TGGGCGGCCGCGTGGTGGTCGAAGCCGAGCTGGACCTGGGCAGTATCGCACGGCGGCTGCGTAAGGAGAT
+CTTCGAGCTCTACGGCTACACGGCGGTGGTGCATGTGTTGTCGGCCAGCGGGATTCGCAAGAGCACCCGC
+TACGTGCTGCGGGTCGCCAACGACGGCGAGGCGTTGGCACGCCAAACCGGACTGCTTGACATGCGCGGTC
+GTCCCGTGCGGGGTCTGCCGGCCCAGGTCGTCGGCGGCAGCATCGATGACGCTGAAGCTGCGTGGCGAGG
+AGCATTTTTGGCGCACGGGTCGCTGACTGAGCCGGGACGCTCCTCGGCGTTGGAGGTCAGTTGCCCGGGC
+CCGGAGGCCGCGCTGGCGCTGGTGGGTGCGGCACGCCGGCTTGGGGTCGGCGCCAAGGCTCGTGAGGTGC
+GCGGTGCCGATCGCGTGGTGGTGCGCGACGGTGAGGCGATCGGCGCACTGCTGACCCGGATGGGGGCCCA
+AGACACCCGGCTGGTCTGGGAGGAGCGGCGGCTGCGTCGTGAGGTGCGTGCGACGGCCAACCGGCTCGCC
+AATTTCGACGACGCCAATCTGCGCCGCTCGGCGCGGGCCGCGGTTGCCGCGGCCGCCCGGGTGGAGCGTG
+CCTTGGAGATCCTCGGCGATACGGTGCCCGAGCACTTGGCCTCGGCCGGCAAATTGCGTGTCGAGCACCG
+GCAGGCGTCGCTGGAGGAGCTGGGCCGGCTTGCCGATCCTCCGATGACGAAAGACGCTGTAGCCGGACGT
+ATTCGGCGATTGTTGTCGATGGCGGATCGTAAGGCGAAGGTGGACGGCATCCCCGATACGGAGTCCGTAG
+TGACGCCCGATCTGCTGGAAGACGCCTAGCGGGCTGACTTACTTCGGTGCCACGCACACCAATTGGCTGC
+TTGCCGGGGGTATTGCTGGCCCTTCGATTTCCTCGGGCGGCTGCAGAGAGACTGACGCGGAATCGCAGCG
+CCCTCCGGCACCGAGGCTCTTGATCTCGGTGACGACGAATCGGCTGAACTCCCGGTTTGCAGAACGTGTT
+CCAGGCACAAGCGCGGTGGCTACCCGCGGTGAAGGCAGCGATTCGTCGCACGCCGACGGCGCGTACAGCA
+GCACGGATGGCGGCTTGCCGGGGGTCGTCACCGCCGGATAGCAGTATCCGACCCGCACCAGGTACTTCAG
+GCAGTAATACGCCCGATGGTTCTGGGTGATCAATTCGTAGTCGATCCGCATGCAACTCGGAGCGTTGGCA
+TGGAATCCGTCATTGCGGATCCGGGCCTCCCGGCTATCGCAAGCAACGACCTGCGGACGAGACGGCGCCA
+GCTTGGAGTCGTAGGTGAACCGGTTCAGGCACATCCCCAAGTCCATGGAGAACACCAACTTCAGCGTCGC
+ACGATCGTAGCCCCGCGGCTCGTTGTAACCCGAAGCGGAAGCGGTCTGGCACGCACTCAGCAGCAGCGTG
+AGAATCCCCAGCAACACTGGGAAAACGAGCTTCTCGGCTGGCGGTCGCCGGTACGACGGGAAGCTATACC
+GCCTCGCCGATGTTTGGGCCGAAGCTTGCACACATTGACGATAACTTGGTCGCGAGACCGCAGAAGCTGG
+CCTCGACGGCGCGCCGGGGACTACGGTCATACCATGAAGCGGCTTTCGAGCGTTGATGCTGCGTTTTGGT
+CCGCGGAAACCGCAGGCTGGCATATGCACGTGGGCGCACTGGCGATCTGCGATCCCAGCGACGCGCCCGA
+ATACAGCTTTCAGCGGCTCCGCGAGTTGATCATCGAACGGCTGCCGGAGATCCCGCAGTTGCGGTGGCGG
+GTCACCGGCGCCCCGCTCGGACTGGACCGGCCGTGGTTCGTCGAGGACGAGGAACTCGACATCGACTTTC
+ACATCCGCCGCATCGGTGTTCCGGCTCCCGGTGGGCGGCGCGAACTCGAGGAGCTCGTCGGACGGCTGAT
+GTCCTACAAACTGGACCGTTCCCGGCCGCTGTGGGAACTGTGGGTCATCGAGGGCGTCGAGGGCGGCCGC
+ATCGCCACGCTGACCAAGATGCATCACGCCATCGTCGACGGTGTCTCCGGTGCCGGGCTGGGCGAAATCC
+TGTTGGACATCACACCAGAACCACGACCACCGCAACAGGAAACGGTCGGCTTCGTGGGATTCCAGATTCC
+GGGCCTGGAACGCCGGGCGATAGGTGCGCTGATCAACGTGGGCATCATGACGCCCTTCCGCATCGTCAGG
+CTGCTGGAGCAAACCGTGCGTCAACAGATCGCGGCATTGGGTGTGGCCGGCAAACCGGCGCGATACTTCG
+AAGCGCCCAAGACGCGGTTCAATGCGCCGGTGTCGCCGCACCGGCGGGTTACCGGCACACGCGTCGAGCT
+GGCTAGGGCCAAAGCGGTCAAGGACGCGTTCGGCGTCAAGCTCAACGACGTCGTCTTGGCGCTGGTGGCC
+GGGGCGGCCCGGCAATACCTACAGAAGCGTGACGAGCTGCCCGCCAAGCCGTTGATCGCGCAGATTCCGG
+TCTCCACCCGCAGCGAGGAAACGAAGGCCGACGTCGGGAACCAGGTCAGCTCGATGACCGCGTCGCTGGC
+AACCCATATCGAGGATCCGGCCAAGCGCCTGGCGGCCATCCACGAGAGCACCCTCAGCGCCAAGGAAATG
+GCTAAGGCGCTCTCCGCGCACCAGATCATGGGGCTGACCGAGACCACGCCACCGGGTCTGCTGCAGCTGG
+CCGCCCGGGCCTATACGGCCAGCGGGCTGTCACACAACCTGGCCCCAATCAACCTCGTCGTCTCCAATGT
+CCCCGGTCCACCCTTCCCGCTATATATGGCCGGCGCGCGGCTGGATTCGCTGGTGCCCCTGGGGCCGCCG
+GTGATGGACGTGGCGCTGAACATCACCTGCTTCTCCTACCAGGATTATCTGGATTTCGGCCTGGTGACCA
+CACCCGAGGTGGCCAACGACATCGACGAGATGGCCGATGCCATCGAACCGGCACTGGCCGAGCTGGAGCG
+TGCCGCGGAATAGCAATAGCTGGCCTATAGCTGACTACGTGGCCGGCGGGTTGGTCGCGTACACCCAAGA
+CAGGAAGCGGGCCACGGCCTCGGCGGTGTGATGCGCCCGCGGGGAGCCGAAGACGTCGAAGGCGTGTTGG
+GCGTGGGGCAGGTCCGCGTAGGCGACGGGCGACTTCGACACCGCCCGCAGTTCCTCGACGAACGCATGGG
+CTTCGGCCACGGGGATCAGGGAGTCGTGGCGGCCGTGCAGAACGAAGAACGGTGGGGCGTCGGCCCGCAC
+ATGGTGGATCGGTGAGGCATCGACGAAGATGTCGCGGTGCGTGCTGAATTTCCGTTTCACCACGAACGTT
+TCGAGCAACCCGACGAATTCCCGACGCCCCGGCGCATCGGTCGTAAACCAGTCGTAACGCCCGTATACCG
+GAACCGCTGCCGCCACCGAGGTGTCGACCTGTTCGAACCCGGGCTGAAATCGCGGATCGTTGGGGGTCAA
+CGCCGCCAGGGCGCACAGATGGCCGCCGGCCGAACCGCCGCTGATGGCAACGAAATTCGGATCCCCGCCG
+TAGGCGGCGATGTTTTCCTTGACCCACGCCAGCGCGCGCTTCACGTCGACAATGTGGTCGGGCCAGGTGT
+GGCGCGGCGACACCCGGTAGTTCAGCGACACGCATACCCAGCCGCGCGCAGCCAGATGGCTCATCAACGG
+ATACGCCTGCGGGCGGCGCCACCCCAGTACCCAGGCGCCGCCGGGCACCTGTACCAGCACCGGTGCCTTG
+GCGTCGCGTGGCAGGTCGCGGCGGCGCCAGATGTCGGCCAGGTTGGCCCGCCCGTATGGGCCGTAGCACA
+CGACGTTCGTCGTCTCGACGTAGCGCCGGCGTGCCATGGCGGTACGCAGCGGGAGATTGCGACCTCTGCT
+ACGCATCGGTTCCGTGGGCAGGGTAGCGAGTTCCTTAGCGTAGTCGGGCCCGAGCTGTTCGGTCAGGCCC
+GCTTCGAGCACCGGTCCAGGGGTGGTGGCGCCGCGGTAGCGGATCACCGCAAGGATCACCCAGGCCGCTG
+CCGTTAAGGCCAGTGCCGCCTTTCCTTTCAGCCCACCGAAGTCGCCTCGGCGGCCGCGGCGCAGTGCGTC
+CAGCACGGAGGCGCCTAGGTACACTCCTGGCACTTCCGACGTCGGCCAGCCCAACCAAAACGCCAGAACC
+GTGCTGTAGCCGCTACCGGACAGTGGGCGTAATCCGTTGGCGGCATTGAGCAATTCCACCGCTGCACGTG
+TTAACGGTCTCGGGCGTGCCATCCGCCGAAATCGCATTAGCTGCCGACCCGTGATTGCAGCTCGGTGCGC
+AGGATCTTGCCGGTAATGCCGCGTGGCAGCTCGTCGAGGACGGCGATGTCGCGCGGTACCTTGTAGTTGG
+CCAGGTTGTCTCGGACATGCTGCTTGAGGGTTTCCGGGGTGGCCGAAACACCGGGCTTGAGCACCACGAA
+GGCCGCCAGCCGCTGGCCGTACTGCTGGTCGTCCACGCCGATCACCGCGGCCTCGGCCACGTCGGGGTGG
+GTGGCCAGCGTCTTCTCCACCTCGATCGGGTAGATGTTCTCACCGCCGGAGACGATCATCTCGTCGTCGC
+GCCCGACGACGAACAGCCGGCCGTTCTCGTCGAGGTAGCCGACGTCGCCCGATGACATGAACCCGGCATG
+GAAATCCTTTGCGGCGCCAGATGTATAGCCATCGAATTGGCTGTCGTTGCGGACGTAGATGGTGCCGACC
+TCGCCGGTGGGCACCTCGGTGAACTGCTGGTCCAGGATCCGGATTTCGGTTCCTTCGGCGGGCCGACCCG
+CGGTGTCGGGTGCGGTCCGCAGGTCCGCCGGTGTGGCGGTGGCGATCATCCCGGCCTCGGTCGCGTTGTA
+GTTGTTGTAGATCACGTCGCCGAATTGGTCCATGAATGCGATCACGACATCGGGCCGCATCCGAGAACCC
+GACGCGGCGGCGAACCGCAACGACCGGCCGTCGTAGCGGTTTCGAATCTCGGCCGGCAGGTCCATGATGC
+GATCGAACATCACCGGCACCACCACCAGACCCGTCGCGTGGTGGCGGTCGATCAGGTCCAGCGTCGCCTC
+CGGGTCGAACCTGCGTCGCGTGACGATCGTGCAGGCCAGCGAGGAGGCCAGCACCAGCTGCGAGAAGCCC
+CAGGCATGAAACATCGGCGCCACGATCACGGTGACCTCCTCGGCCCGCCACGGCGTGCGGTCCAAGATCG
+CCTTCAGTGTCCCGATGCCACCGCCAGAATGCCTGGCGCCCTTGGGTGTTCCGGTGGTTCCGGAGGTCAG
+CAGGATCACTTTTCCGTGGCTGCCGGTGTGCTCGGGCCGCCGTCCGGCGTGCGCGGCTACAAGTTTCTCA
+ACGGTCAGGTCGTGGTCTTCGTCGGTCCACGCCACGATACGGGTGGCCTGCGGTTTTTCCGCCAGCGCGC
+GATCCACCGTCGCGCTGAACTCTTCGTCATAGACGACAGTGTCGACGCCTTCGCGGGTAACCACCTCGGC
+CAGTGCCGGACCGGCGAAGGAGGTGTTGAGCAACAGGATGTGCGCGCCAATCCGGTTGACCGCCAACAGC
+GCATCGACGAAGCCGCGATGATTGCGGCACATGATGCCGACGACCCTGGGGGGTCCGGCTGGCAGGGCCT
+GAAGCGCCGCGGCCAGCGCGTTGCCGCGTTCGTCGAGCTGGCGCCAGGTCAGCGTGCCCAGTTCGTCGAT
+CAGGCCGGGGCGGTCCGGGCAGCGTCGGGCCGCACCGGCGAACCCCGCCGTAAACCCCATGCCTTCGCGG
+CGCATGGCGGCGACGATCCGCAGGTAGCGGTCTGGTCGCAGCGGAGCGATCAACCCTGCCCGGCGCATGG
+TGGCGATCAAGCCGAATGCTTGTCTGATACGCATGGCTTAGCCCAGAATCGGGAAGCGGCGCTTGGCGGC
+GAGGTCGTTGAGGGCTTGCTGCATCACCGACCGTACGTGCTCGTCGACCGCGTCGACATCAGGGTCCTCG
+CCGAACTGCTTGGTGAGGTTGATCGGGTCTAACACCTGCATGACGATCTTGGCGGGCAGCGGCAGATTGG
+GCGGGATCGCGGCGGAGAACCCGAACGGAAAGCCGAACGAGATCGGCAGGATGTCGCTGCGGAGCAGTCG
+CTTGAGCCCTAGCCGCCGGGCGAGCCAGGTGCCGCGGGACAGGTAGAGCTGGCTTTCCTGGCCACCGATG
+GACACCGCCGGCACGATGGGCACGCCAGCTTCGACGGCAGTGCTGACGTATCCCTTGCGGCCGTTGAAGT
+CGATCACGTTCTCCGCGAAAGTCGGCCGGTACGCGTCATAGTCGCCGCCGGGAAAAACGACCACCACACC
+CCCGGACCGCAACGCCTTAGCCGCGTTTTCTCGGGTGGCGCGAATGTAGCCGGTGCGTCGGAACAAGTCC
+CCGGTCAGGCCCATGAACAAGATGTCGTGGCTGAGCGTGTAGACCGGTCGGTCGTAGCCGAACTTGTCGT
+AGAAGTCGACGCTGAAGACCGGCACGTCCATCGGGAACATGCCACCGGAGTGGTTGGCCACGACCAGTGC
+GCCACCCGGCGGGAAGGAGTCCAGGCCATGCACCTGCGACCGGTGGTAGGTCTTCAAGACTGGACGCAGC
+ACACTTATCAGGCGCTGGGTTAGGCCAGGGTCGAATTTGCCGATGTCGCCGATACCTGCATCGTCCCCGT
+TACCAGGGCTATCGGTTTCGCTCAACTGTTCTCCCTCGAGGCCTCCGAGGCCTCATTGCCGCGTCGGGTC
+TTTAGATGGTAGCGATGCACGGTGGATAGGCACACGCGGCAGGTCTGCTAGCAAGGACGAGAGGTGGTCC
+AGAGTGGCTGAAGCTGGTGGCGGGCCCATTTCGGTGATCGCCCGGCATATGCAGTTGATTCGCGATGACT
+TCATCTCCGAGTTGTTTGACAAGATGAAGGCGGAGATTCGGGGGCTGGATTACGACGCGCGGATGGCGGA
+CCTGTGGCGGGCGAGCATCACCGAGAATTTCGTGACGGCCGTTCACTATTTGGATCGCGATACGCCGCAG
+TCCTTGGTGGAGGCTCCAGCGGCCGCGCTGGCATACGCCCGCGCCGCGGCGCAGCGTGATATTCCGTTGT
+CCGGGTTGGTTCGGGCGCACCGGCTCGGGCATGCGCGTTTCTTGGAGGTGGCGATGCAGTACGTGTCGCT
+GCTGGAGCCCGCTGACCGGGTGTCGACGATCATCGAGCTGGTGAATCGCTCCGCTCGCCTCGTTGACCTG
+GTGGCCGACCAGTTGATTGTCGCCTATGAGCACGAACACGATCGCTGGCTGAGTCGCCGCAGCGGTCTGC
+AACAGCAATGGGTCAGCGAGCTGCTCGCCGATACCCCGGTCGACGTTCCGCGGGCCGAGCGCGCGTTGGG
+CTATCGGTTGGACGGTGTGCATATCGCCGCGGTGGTATGGGTCGATTCGGCGGTGCCCATCGGTGATGTG
+GTGGCGCAATTCGACCAGGTGCGCTGCTTGCTGGCCGGGGAGCTGGGCCCCGAACTGGGCCCCGTGGCGA
+ACTCGCTGATGGTGCCGACCGATGAGCGCGAGGCACGGCTGTGGTTTTCGCCCGCGCCCACGCGGGCCTT
+CGCCCCGTCGCGGATTCGCGCGGCGTTCGAGTCGGCGGGAATCCGGGCGCGTTTGGCGTGCGGTCGGGTA
+GGGGACGGGCTGCGTGGGTTCCGGGCGTCGTTGAAACAGGCCGAACGAGTGAAGGCGTTGGCCCTGGCCG
+GTGGCGCCCGGCCCGGCGGCCGGGTCATGTTTTATGACGATGTCGCGCCAGTCGCGTTGCTGGCCGACGA
+TCTAGAGGAACTGCGGCGGTTCGTCACCGATGTGCTGGGTGACCTGAGTGTTGACGACGAGCGCAATAGC
+TGGCTACGCGAGACGTTACGGGAGTTCTTGCTGCGTAACCGCAGCTACGTCGCCACGGCCGACGCGATGA
+TCCTGCACCGCAACACCATTCAATACCGGGTGATCCAGGCGATGGAACTATGCGGACAGAATCTCGACGA
+TCCCGATGCCGCGTTTCGGGTGCAGATGGCGCTGGAGGTCTGCCGCTGGATGGCACCGGCGGTGCTCCGC
+GCCAAACAATAGTGTCTCGGTAACCGCCGGTCCGTTCATGCCGTGCGCACAATCGTGGTCGTGAGCTTCG
+GTGTCGGCGCATATGGTCTCCGACGGATTCGGCGCCTAACGTTTGCCCACGTCAAACAACCCGACCAGAA
+AGCCAGCCGGGTCCGCCAGAGGGGGGCGGACCCGGCGTATACCCAATTCGCGTCGCTCGGTTCTAGTTGG
+GCGCTATCATCCGTTGCCACGGGGTTGGTCGGAAGGTCGGTATGTCGTTCGTTTTCGCGGTGCCAGAGAT
+GGTGGCGGCAACCGCTTCCGATTTGGCCAGCCTCGGAGCGGCGCTGAGCGAGGCCACCGCGGCGGCGGCT
+ATCCCCACCACACAAGTACTGGCCGCGGCCGCCGATGAGGTGTCGGCGGCCATCGCGGAGTTGTTCGGTG
+CGCACGGCCAAGAATTTCAAGCGCTCAGCGCCCAGGCATCGGCGTTTCATGACCGGTTCGTGCGGGCCCT
+AAGCGCCGCAGCGGGCTGGTATGTCGACGCCGAGGCCGCCAACGCCGCGCTGGTGGACACCGCGGCCACC
+GGCGCGTCGGAGTTGGGGTCAGGTGGGCGCACGGCGCTGATTCTGGGCTCCACCGGAACCCCGCGACCGC
+CCTTCGACTACATGCAGCAGGTCTACGACCGCTACATCGCACCCCACTACTTGGGCTATGCGTTTTCCGG
+CCTGTACACGCCCGCGCAGTTTCAGCCGTGGACCGGCATCCCCAGCCTGACCTACGACCAATCGGTCGCC
+GAAGGCGCCGGCTATCTTCACACCGCGATCATGCAGCAAGTCGCGGCCGGCAATGACGTTGTGGTGTTGG
+GTTTCTCGCAGGGCGCGTCGGTCGCCACCCTGGAAATGCGCCATCTGGCAAGCCTGCCGGCCGGCGTCGC
+GCCGAGTCCGGATCAGCTCTCGTTCGTATTGCTGGGCAACCCCAACAACCCAAACGGGGGCATCCTCGCC
+CGGTTTCCGGGTCTGTACCTGCAGTCGCTCGGCCTGACGTTCAACGGTGCGACCCCGGACACCGACTACG
+CGACCACCATTTACACGACCCAATACGACGGCTTTGCCGACTTCCCGAAGTACCCGCTCAACATCCTGGC
+GGACGTCAACGCGCTGCTGGGTATTTACTATTCGCACAGCTTGTATTACGGGCTCACGCCCGAGCAGGTC
+GCTTCGGGTATCGTCCTGCCGGTGTCTTCGCCGGACACCAACACCACCTATATTCTGCTTCCCAACGAGG
+ATCTGCCGCTGCTGCAGCCGCTGCGCGGTATTGTGCCCGAGCCGCTGCTGGATCTCATCGAGCCAGACCT
+GCGCGCGATCATCGAATTGGGTTATGACCGAACCGGATACGCCGATGTTCCGACCCCGGCCGCACTGTTC
+CCGGTGCACATCGACCCGATCGCAGTCCCGCCCCAGATAGGCGCTGCGATCGGTGGTCCGCTCACCGCCC
+TGGATGGCTTGCTCGACACCGTGATCAACGATCAACTCAATCCCGTCGTAACGTCGGGCATCTATCAGGC
+CGGTGCTGAGCTGTCGGTGGCCGCGGCCGGCTACGGTGCTCCCGCAGGCGTCACCAATGCCATTTTTATT
+GGGCAGCAAGTGTTGCCGATTTTGGTGGAAGGCCCCGGTGCCTTGGTGACGGCCGACACCCATTACCTGG
+TCGATGCGATTCAGGATTTGGCCGCCGGTGACCTCAGCGGGTTCAACCAAAACCTGCAACTCATCCCGGC
+TACCAACATAGCCCTGCTGGTCTTCGCGGCCGGAATTCCCGCTGTGGCGGCCGTCGCCATCCTTACCGGT
+CAGGATTTTCCGGTATAGGCCCCCGGCCCCCGCTGTACCGAGCTCGGCCAGTGAAGAACAACCCCAGGCG
+TTGCCAGTCCGAATAGATTGTATTCGTCAGCCGGCGCAGGACAGGAAGCGAGGCCGCCATGGGATTTCTG
+AAGCCCGATCTTCCCGACGTCGATCACGACACCTGGTTGACCCAGCCACGCCGGACACGATTGCAGGTCG
+TGACACGGGACTGGGTAGAACACGGTTTCGGAACGCCGTATGCGGTGTACCTGCTCTATCTGACCAAGAT
+TGCGGTGTACGTCGCCGCCGGCGCCGCGATCATCTCGCTGACCCCCGGACTGGGCGGGCTGAGCCGCATA
+GGCGACTGGTGGACACAGCCGATCGTGTACCAGAAGGTCATCGTCTTCACGTTGCTGTTCGAGGTTTTGG
+GTTTTGGCTGCGGATCCGGCCCGCTGACCGGGCGGTTTTGGCCACCCATCGGGGGCTTCCTTTATTGGTT
+GCGGCCCAACACAATTCGGCTGCCTGCTTGGCCGGATAAGGTCCCGTTCACCCAAGGCGACACCCGCACC
+GTCGTCGACGTCGCCTTGTATGCCATCGTGTTGATCGGCGGGGTGTGGGCGCTGTTGTCACCCGGCTCGC
+CAGGTCCGGGGGGAACGCCGGTCACCGCCGCCGGCGACGTCGGCCTGATCAACCCGGTGCTGGTAGTGCC
+GACGATCGTCGCCCTGGGCGTCTTGGGGCTGCGTGACAAGACGATCTTTCTTGCCGCCCGCGGCGAACAC
+TACTGGCTGAAGCTATTCGTGTTCTTTTTTCCCTTCACCGACCAGATCGCGGCGTTCAAGATCATCATGC
+TGTGCTTGTGGTGGGGGGCGGCGACTTCCAAACTCAACCACCATTTCCCCTACGTCGTCGCGGTGATGAC
+CAGCAACAACGCCCTGTTGCGCAGCAGAGTGTTCAACCCGATCAAGCACCTGCTTTACCGCGACCACGCC
+AACGATCTGCGGCCCTCCTGGCTACCGAAACTCATGGCCCACGGGGGTGGCACCACGGCGGAATTCCTGG
+TGCCCGGGATTCTGGTGCTCGTCGCCGACGGTCACCCATGGCGGTGGTTCCTCATCGGGTTCATGGTGCT
+CTTTCACCTCAACATCCTGTCCAACCTCCCGATGGGGGTCCCGTTGGAGTGGAACGTGTTCTTCATCTTC
+TCGCTGTGCTATCTATTCGGCCACTACGGCGCGATCACTGCCACCGACCTTCGGTCGCCGTTGCTGCTGG
+CGATCGTGATCGCGGTGGTTGCCGTGGTGATCATGGGAAACCTGTTGCCCGAAAAGATTTCGTTTCTGCC
+CGCCATGCGCTACTACGCCGGCAACTGGGCCACCAGCATCTGGTGCTTCCGAGGTGATGCGGAAGCCACC
+ATGGAAACCAGCGTCGTGAAAAGCTCTGCGCTGGTGGTCAATCAGCTGGCCAAGCTCTACGACGGGGCCA
+CGGCCGAAATCATGACCGACCAGGTCGCCGCATTCCGGGCCATGCACACCCACGGCAGGGCGCTCAACGG
+CCTGCTGCCCCGCGCTCTCGATGACGAAGCTCACTACCGCATCCGCGAGGGCGAAATCGTGGCCGGGCCA
+CTGGTCGGGTGGAATTTCGGCGAGGGCCATCTGCACAACGAGCAGCTGGTGGCCGCCGTGCAGCGGCGGT
+GCAACTTCGCCGACGGCGATCTGCGGGTGATCATTCTCGAAGGTCAGCCCATCCACGTTCAGAAGCAGTG
+GTATCGCATTGTCGACGCCAAGACCGGTTTGTTCGAGGCCGGTTACGTCACGGTCGAGGACATGTTGAGC
+CGCCAGCCATGGCCCGAGCCCGGTGACGAGTTCCCGGTTCACGTCACGACGCAACGCGGCACGCCGTCAA
+AGCCATGACGACCGCGGTCGTCGTCGGAGCCGGGCCCAACGGCCTGGCCGCGGCGATCCACCTGGCCCGT
+CACGGTGTCGACGTGCAGGTGCTGGAGGCGCGCGACACCATCGGCGGGGGAGCACGCTCCGGTGAGCTGA
+CGGTGCCCGGGGTCATCCACGACCACTGTTCGGCGTTTCATCCGCTGGGCGTCGGGTCGCCATTCTGGGC
+GGCGATCGACCTGCAACGCTACGGGCTGACGTGGAAGTGGCCGGACGTCGACTGCGCACACCCACTCGAT
+GACGGCACCGCGGGCGTGCTATATCGGTCGATCGAAGCCACCGCCGCCGGCCTGGGTCCCGACGGCAAGC
+GGTGGCAGCGCGCCGTGGGTGACCTCGCCGCCGGATTCGATGAGCTGGCCGAGGATCTGCTGCGCCCGGT
+GCTCAACATGCCGCGTCACCCGATCCGCCTGGCCCGCTTTGGTCCGCGCGCGGCGCTGCCGGCCACCGCC
+ATGGCGCGTCGGTTTCACACCGAGCGGGCGCGCGCGTTGTTCGGCGGCGCCGCGGCGCACGTCTACACCA
+GGTTGGATCGGCCGCTGACCGCGTCGCTGGGGTTGATGATCCTGGCCAGCGGCCATCGCCACGGTTGGCC
+GGTCGCCCGGGGCGGATCCGGGTCGATCACGAAGGCGCTGGCCGCGGCCCTGGACGCGTACGGCGGCACC
+GTCGCCACCGGGGTGACCGTCACCAGCCGCCGCGACATCCCCGACGCCGACATCGTGATGCTCGACCTCA
+GCCCGGCCGCGGTGCTCGGGATCTACGGCGATGTGATGCCCACCCGCATCAACCGGTCCTATCGGCGCTA
+CCGCGCCGGATCGTCGGCCTTCAAGGTCGACTTCGCCATCGAGGGCGACGTTGGGTGGACCAACCCCGAT
+TGCCGGCGCGCGGGCACCGTCCACCTGGGCGGGACCTTCGCGGAAATCGCAGACACCGAACGTCAACGCG
+CCCAAGGCACGATGGTGCAGCGACCATTCGTGCTCGTCGGGCAGCAGTACCTCGCCGACCCGTCCCGCTC
+GGTCGGCAACATCAACCCCATCTGGGCCTACGCGCACGTGCCGTTCGGCTACACCGGCGACGCCACCGCC
+GCCGTCATCGACCAGATCGAGCGGTTCGCCCCCGGATTCCGCGACCGCATCGTGGCAACCGTCAGCACCT
+CCACCACCGAACTGCAAACGTACAACCGCAACTTCATCGGCGGAGACATTATCGGCGGCGCCAACGACCG
+GCTGCAGGTCATCTTCCGCCCGCGCGTGGCCGTCGATCCGTATGCGATCGGTGTGCCGGGTGTCTATCTG
+TGTTCACAGTCCGCGCCACCCGGTGCCGGGATCCACGGATTGTGTGGCTACCACGCCGCCGAATCGGCGC
+TGAGGTGGCTGCGCAAGCGACGTTGACGCAGGTCATCGCCGAGATCGACGTTAGCGCGACGTCCACTCGT
+GCCGTAGCCAAAACGTGACGGAGGTTTGATCGAATTGCTAAGGCGCGCCTGCACTTCCACTCTTCAATGC
+ACCTCTACCATCACTGGTGCAACTGTGTCGTTGACAGGGAATTGGAGCCATGCGGGCGGTTTTTGGGTGT
+GCTATTGCCGTCGTCGGGATCGCTGGGAGCGTGGTTGCGGGGCCGGCCGACATACACCTGGTGGCGGCGA
+AGCAGTCTTACGGGTTCGCCGTCGCGTCGGTGCTACCAACGCGCGGCCAGGTGGTGGGCGTGGCGCACCC
+CGTGGTGGTGACGTTCAGTGCGCCGATAACTAACCCAGCCAATCGGCACGCGGCCGAGCGCGCCGTTGAA
+GTCAAATCGACGCCCGCGATGACCGGCAAGTTCGAATGGCTCGACAACGACGTTGTGCAGTGGGTTCCCG
+ACCGCTTCTGGCCGGCGCACAGCACGGTGGAGCTTTCGGTGGGCAGCCTGTCGAGCGATTTCAAGACGGG
+TCCCGCCGTCGTCGGGGTTGCCAGCATCTCCCAGCACACGTTCACCGTGAGTATCGACGGAGTCGAGGAG
+GGACCGCCGCCTCCGCTGCCGGCGCCGCACCACCGAGTGCACTTCGGCGAAGATGGGGTGATGCCGGCAT
+CGATGGGTAGACCGGAATACCCGACGCCGGTCGGCTCCTACACTGTCTTGTCCAAGGAACGCTCGGTGAT
+TATGGATTCGAGCAGCGTCGGCATCCCCGTCGACGATCCCGATGGTTACCGGCTTTCGGTGGATTATGCC
+GTCCGCATCACCAGCCGCGGCCTCTACGTGCATTCAGCCCCGTGGGCCCTTCCAGCACTGGGACTTGAAA
+ATGTCAGCCACGGCTGCATAAGCCTGAGCCGCGAGGACGCAGAGTGGTATTACAACGCGGTCGACATTGG
+CGACCCGGTCATTGTGCAGGAATAGCAGCTGATGCGGGCGTCGCCCGCAGAGCGCGTCGACGGCGCGTAC
+GCGGGTGCGGGGCCTCACACCCAGTCCGTCCTGGAAGAGGACCAGCGTCAGCGCGCACCTGCGGGCGCAG
+AGGCCGAAGGACCGGGCAGAACCGGCTGACCAGGCACCGGTCCGCCAGCTGGCGCCGGATCGGTCAGCGC
+ATCCTTGACCCCGGACATGCCAATGATGGGAGCACTGACCACACCATCCCCGGGAGCACCAGCCAGGACC
+GGCCCAAGCGCAATCAGCGGAGTTCCGACCGGTATCACCGGAGCCGGAACGGCGGGTACCGGTACCGGTG
+CGCCCGGTATCGGTACCGGTCCGCCGGGGATTGGTACCGGTGCGCCCGGTATCGGTACCGGTGCGCCAGG
+GATCGGTACCGGTGCGCCAGGGATTGGTACCGGTGCGCCGATGGGCACCGGTGCAGCTGCCGGCACTGGC
+CCAGGCGCGACGAACGGAACACCAGCCATGTCAGTAAGTGCGGCACTGCACGCTCCCGTGGCTGCCGGTC
+CACCGGCAGCCACCGGGTCGCCGGCGGCTACCGGCGCGTCGCCCGCCATGCCCTGGATGCACGCGTAGCC
+ACCCGTCATCAGCGGGTCAGCCGCCGCGTCCGGGCTTAACGCTATAGCAGCTGCAAACAACCCAGCGCCG
+GCAATTACTTTGATGTTGAACCGATTGACGATCGCCATCAGCGTCAACTCTCCTCTATTCGCGCGCAGAT
+ATTTCCGCAATCAATTTGGTTCAGCAGAACCGCATAGCCGTATCGAGTTCCTTTTCGACCACCGGCTCAA
+TTGTCAGCATCCTATGGGGAACATGAGCCCCGCCGCACCGGGCCGTTTCCAAATGGTGACGTCACAACGG
+TGTCACAAGCCAGCGCAATGTCCGCGGTAGGGACGCGGCGGCTGGGATCGGTGGGGTGAGCGCCCGGCTT
+CTCAAAGCGAGGGGAGCCCCGGGACTCTTACCGGCCGAAGGCGGCGGGTGTCACTGATCTAGGCTGACGG
+CCAGTGGTTGTTTAGCCAACAAGGATGACAACAAATAAGCCGAGGAGAGACAAGTGACGGTCCGAGTAGG
+CATCAACGGGTTTGGTCGAATCGGACGCAACTTCTACCGGGCCTTACTGGCCCAACAGGAGCAGGGCACC
+GCCGACGTGGAGGTGGTCGCCGCCAACGACATCACCGACAACAGCACGCTGGCGCATCTGCTCAAATTCG
+ACTCGATTCTGGGCCGGCTGCCTTGCGATGTCGGCCTCGAAGGCGACGACACCATCGTCGTCGGCCGCGC
+GAAAATCAAGGCGCTCGCGGTCCGGGAGGGGCCGGCGGCATTGCCATGGGGAGACCTCGGCGTCGACGTC
+GTCGTCGAATCCACCGGCCTGTTCACCAATGCGGCCAAAGCCAAAGGCCACCTGGACGCCGGCGCCAAGA
+AGGTGATCATCTCTGCGCCCGCCACCGACGAGGACATCACCATCGTCCTGGGAGTTAACGACGACAAGTA
+TGACGGCAGCCAGAACATCATCTCCAATGCGTCGTGCACCACGAACTGCCTTGCGCCGCTGGCCAAAGTG
+CTCGACGATGAGTTCGGCATCGTCAAGGGCCTGATGACCACCATCCACGCCTACACTCAGGATCAGAACC
+TGCAGGACGGGCCGCACAAGGACCTGCGTCGCGCCCGCGCCGCCGCGCTGAACATCGTGCCGACCTCCAC
+CGGCGCGGCCAAGGCCATCGGCCTGGTGATGCCGCAGCTAAAGGGCAAGCTCGACGGTTATGCGCTGCGG
+GTGCCGATCCCCACCGGCTCGGTCACCGACCTTACGGTCGACTTATCCACACGGGCCAGTGTCGATGAGA
+TCAACGCGGCGTTCAAAGCCGCGGCCGAAGGCAGGCTCAAGGGCATTCTGAAGTACTACGACGCGCCGAT
+CGTCTCGAGCGACATCGTCACCGACCCGCACAGTTCGATTTTCGACTCTGGGTTGACCAAAGTCATCGAC
+GACCAGGCCAAGGTGGTGTCGTGGTACGACAACGAGTGGGGCTACTCCAACCGCCTGGTTGATCTGGTCA
+CGCTGGTCGGCAAGTCGCTCTAGCCATGAGCGTTGCAAACCTCAAGGATCTACTCGCCGAAGGTGTTTCG
+GGGCGTGGAGTGCTGGTGCGCTCCGATCTCAACGTTCCGCTCGACGAGGACGGCACCATTACCGATGCGG
+GCCGCATCATCGCGTCGGCGCCGACGTTGAAGGCGTTGCTCGACGCCGACGCCAAGGTGGTGGTTGCCGC
+GCACTTGGGACGTCCCAAGGACGGGCCGGACCCGACACTGTCGCTGGCGCCGGTCGCCGTGGCGCTGGGT
+GAGCAACTCGGCCGGCACGTCCAGCTGGCTGGAGACGTTGTCGGCGCCGATGCGCTGGCCCGCGCCGAGG
+GGCTCACCGGCGGCGACATCCTGCTGCTGGAGAACATCCGCTTCGACAAACGCGAAACCAGCAAGAACGA
+TGACGACCGGCGGGCACTGGCCAAGCAGCTGGTCGAACTGGTCGGAACGGGAGGCGTTTTCGTCTCCGAC
+GGCTTTGGGGTGGTGCACCGCAAGCAAGCCTCGGTCTATGACATCGCAACCCTGTTGCCGCACTACGCCG
+GCACGCTGGTCGCCGACGAGATGCGGGTACTGGAGCAGTTGACCAGCTCGACCCAGCGGCCCTATGCGGT
+AGTGCTCGGCGGATCAAAGGTGTCCGACAAGCTGGGTGTCATCGAGTCGCTGGCGACCAAGGCGGACAGC
+ATTGTGATTGGCGGCGGAATGTGCTTCACATTCCTTGCTGCACAGGGATTTTCGGTTGGCACATCGCTGC
+TGGAAGACGACATGATCGAAGTCTGTCGCGGGCTGCTGGAAACCTATCACGACGTGTTGCGGCTGCCCGT
+GGATCTAGTGGTCACGGAGAAGTTCGCCGCCGACTCGCCGCCCCAGACGGTCGACGTCGGCGCTGTGCCC
+AATGGCTTGATGGGCCTGGATATCGGGCCGGGATCGATCAAACGGTTCAGCACGCTGCTGTCCAACGCCG
+GGACCATCTTCTGGAACGGGCCGATGGGAGTATTCGAGTTCCCGGCTTATGCGGCCGGCACCAGAGGCGT
+CGCCGAGGCGATCGTCGCCGCCACCGGCAAAGGGGCGTTTAGTGTGGTCGGCGGCGGTGACTCCGCGGCC
+GCAGTGCGCGCGATGAACATCCCCGAGGGCGCCTTCTCACACATATCCACCGGCGGCGGTGCCTCGCTGG
+AATACCTTGAGGGCAAGACGCTTCCCGGCATCGAGGTACTGAGCCGTGAGCAGCCAACCGGAGGAGTTTT
+GTGAGCCGCAAGCCGCTGATAGCCGGCAACTGGAAGATGAACCTCAACCACTACGAGGCGATCGCGCTGG
+TGCAAAAGATCGCGTTCTCGTTGCCGGACAAGTATTACGACCGGGTTGACGTCGCGGTGATCCCGCCGTT
+TACCGACCTGCGCAGCGTGCAAACCCTGGTCGACGGCGACAAGCTGCGGTTGACCTATGGTGCACAAGAC
+TTGTCACCACATGACTCCGGTGCCTATACGGGTGACGTCAGCGGCGCCTTTCTGGCCAAGTTGGGGTGCA
+GTTACGTTGTCGTCGGGCACTCCGAGCGGCGCACCTATCACAACGAGGATGACGCGCTGGTGGCCGCCAA
+AGCCGCCACCGCACTCAAGCATGGCTTGACCCCAATCGTGTGTATTGGCGAGCACCTCGACGTCCGCGAG
+GCGGGAAATCATGTGGCCCACAACATCGAACAGTTGCGTGGATCGCTGGCCGGGCTATTGGCCGAGCAGA
+TCGGCAGCGTCGTCATCGCCTACGAACCGGTCTGGGCGATCGGCACCGGGCGGGTGGCCAGCGCCGCCGA
+CGCCCAGGAGGTGTGTGCGGCGATCCGAAAAGAGTTGGCCTCGTTGGCCTCGCCGAGGATTGCCGATACG
+GTGCGGGTGCTCTACGGCGGCTCGGTGAACGCCAAAAACGTCGGCGACATCGTGGCCCAGGATGACGTCG
+ATGGTGGCCTGGTCGGCGGGGCGTCGCTGGACGGGGAGCATTTCGCGACGCTGGCCGCGATTGCGGCCGG
+TGGTCCGTTGCCGTAGCGGATCGCGGGCGTGCTACACCCGTAGACCTTCGAGTAGGGCCATAAATGCGCG
+TTCGACCTCGACTCTGGTCCGGTCTTTGTCCGTCGCGTCCGCGATCTGCAGCGCGGATTCGGTTAGCGCG
+GCCAGCAGCAGATGCGAAAGTGGTGGCAACGGTACGCGCTGAATCACCCCGGCGGCCATCCCGCGTTCGA
+GAGCCCCGACCAGCAGACCAAGCCCTAGCGCATGTCGATCCGGCGCCATTCGCCCCACCCGAGCACTGAC
+GGGCCGTCAATCGCAATGACCTGCAGCGCATCCGGTTTGGTCGCCGCGTCAAGGAAGGCGTGGAAGCCGA
+CGACCAGCAGATCCAGGCGTCGGTGACCTTCGCTATGGCGGCTTCGACGTCGGCGACCAGGTCGGCTTCG
+ACAACCTCGAGTACCGTCTGGAACAGATCTTTCTTGCTGTCGAAGTGGTAGTCCAGGGCGCCACGGGTGA
+CTCGGGCACGGGTGACGATGTCTTCGATCGAGACGTCACCATAGTCGCGCCGCGCGAATAGGTAACGGCC
+AGCGTCGACGAGGGCTCGACGCGTCGCGTCCGTGTGGTCCGAGCGCCTGCTGGCCGTCATTTCGACGTCA
+AGCCCGGCTTCGCATGGTTGTCAACCAGCCACGCCAGGCCGACGGATGCTTGACTACCTTGATCAACAGT
+GGGAGCGAGTCGAAATAGCTCACGCGTTCTACGGCCTTGTCGCCACGCAGCAGGAACCGATCGACGACTG
+GCCACTCGACGACCTCGCTGCCGAGCCGTGCTATCAGCCGGAACTCGATGAACACCACGTCGCCTGCTTG
+GCTCCACCGGTCAACTTCCCCGTGCAGGTCAGGCAGCAAACCCAGAATCCGAGTGAACTCCCGCTGGGCC
+GCCCCCAGGCCGTGCCTCGGCGGTGACAGTGGCCGTACCAGGACTACGTCGGGATGAAGGTGATCGGTCA
+GTCTATCCGGCGACGGCGCCTTCCAGAAGTCGGCGAACCCTTCGACGAATGCGTTGGATGCGCTCATCTG
+CATGGCCCTTTCGGTGTTTGTTCGCTCGACAGTCTTACTGCGTAAGCCTGGGGGCGAATTCAGCGGACAT
+CGTTGCTTATCGGTAGGAAGCTACGGCCGTCACAGTGGTCTCAGCAGCGGGGGAATACACATTTTGCCCG
+CCCCGGCGCGACAACTCGGTTGAAGTCATGCCCGGATCGGCATGTTTGGCCACGAACGGAATCGCGACAG
+CGCCACGGCGTCGAGCCTCGCCATGCACCTAGCCGGCGCCTTTGAACTCGTGAGCGGACCGAAGTGGACC
+GCCTGTCGCTTCGAGGCGGGCACAGTGCGTATTCCCTCGCAAGGGAAGCGCCGGTGGCAGGCGTGACAGC
+CGCGGTCAGTGCACGCCTCAAAGCCGATGAGGCGCGACGGCCTGGGTTCTACGCGGCAGGCAGCGGTCCG
+CTGCCGCAGGTTCGGGGGAGTACGCTACCCGTCATGGAATTGGCCCTGCAGATCACGCTGATCGTCACGA
+GCGTGCTGGTGGTGTTGTTAGTACTGCTGCACCGGGCCAAGGGTGGCGGGCTATCGACACTGTTCGGCGG
+TGGTGTGCAGTCAAGCCTGTCCGGCTCGACGGTGGTGGAGAAGAACCTGGACCGGTTGACGCTGTTCGTT
+ACCGGCATCTGGCTGGTGTCCATCATCGGCGTGGCGTTGCTCATCAAATACCGCTAGCGCTGGTCGGCTA
+CCGCCGACCGGACCGGGGGAAGCGGTAGCTCATTGCCGATTACGACTTGGTGCAGCGCAGGATTCTGCTG
+ACCATGACCGGGCTGGCCAGCGCGCTCAGAAACAGTGGTTAGTCGGCCTGACCGGTCACCCGTGCTTTCC
+TTGCGCGCCATTGGCGCCGCCGATCCCGTCGGGCACACCGACGCCGCCAGGTCCGCCGGTGCCGCCGTCG
+CCGCCAAAGCCGGGATTGCCGCCACCTTGGCTGGGCCCGCCGTCACCGCCGTTGCCGCCGGCGCCGCCGT
+TACCGCCGGCGCCGGTGCCGCCTCCGCCTGCCCCACCCGCGGCGCCGTTGCCACCGTTGCCGCCGTTGCC
+GGCTTGGCCTTTGCCGTCGAGGCTTTCGATATAGCCGCCGGTGCCGCCGGTGCCGCCTGCGCCGCCAGCG
+CCGCCGGCGCCGGCGCTGCTGCCATTGCCGATGGTCAATGCGCTGGCGCCGCCGGTGCCACCGACGCCGC
+CGTTGCCGCCGGTACCGCCTTTGCCGCCGATCATTGAGCTGCCGCCGCCGTTGCCGCCGGCGCCGCCGTC
+GCCGCCGGCGCCGCCGGCGCCGGCGCTGCTGCCGCCGATGCCAGCTGTGCCGCCAGTACCACCGGCGCCG
+CCGGTGCCGCCGTCGCCGCCGATGCCGCCAGCGCCTAGCGCCGTGCCGCCGTCGCCACCTTGGCCAGCGG
+TGCCGCCGTTGCCGCCGGCGCCGCCATTGCCGAACAGCCGGCCACCAGCCCCACCCGCAGCGCCGTTGCC
+GCCGTCGCCGCCACGGGCGCCGTTGGCACCGCTGTTAGGACTGTCGCCGGCACCGCCGGCGCCGCCGTCC
+CCGCCGGTCCCACCGGCGCCGCCGGTGCCGAACATCCCAGCAGCACCACCGGCACCACCGCCACCGCCGT
+TACCGCCAGGGCTGGCGGGGACGGGGGGGAGGCCGCCGCCGCCGTCGGCGCCGCTGGCGCCAGTACCGCC
+GTTGCCGCCGGCGCCGCCGTTGCCGCTTAGCCAGCCACCGGCTCCACCGGCGCCGCCGGCTCCACCGGCC
+GCGCCGGTTCCGGCCGCCGGGCTGTAACCGGCACCGCCGGCCCCGCCGTTACCGAACATTCCGGCATCCC
+CGCCGTTGCCGCCGTTGGGGTGGGCGGCGTCGCCGGCTCCGCCGTTCCCGCCGTTGCCCCACAGCAACCC
+GCCGGCCCCACCGTTTTGACCGGGCAGCCCGTCGGCGCCGTTGCCGATCAGCGGACGCCCCAGCAGTGTC
+TGGGTGGGCGCGTTGATGGCCGCGAGCACCTGTTGTTCGAGGGCCTGCAAGGGGGAGGCGTTGGCGGCCT
+CGGCGGCGGCATACGAGCCCACGCTCGCGGTTAAGGCCTGCACGAACTGTTGATGAAATCTGGCCATTTG
+GGCACTGAGCGCCTGATAGTCGCGGGCGTAGCCAGAAAACAACGACGCGATGGCCGCCGACACCTCATCG
+GCCCCGGCGGCCAGGACACCAGCCGTCGTGGGTGCCGCGGCTCCGTTGGCCGCGCTAAGCGCCGCACCGA
+TGCTCGCCACATCCGCTGCCGCCGCTGACAACATTCCCGGGACTACCATCACGTTCGACATCGCTGCAGT
+CTAAAACCTGGTGCCATCGTTGCGACGCAAAACAATCGACATGCTTACCATTTCTGAGCTCAACTAGCTG
+CTAGGTTGCCGCACTAGACTGCTGCAAATGCAGGTCTATACGTCGGCAACGCACTGGGGCGTGTTCACCG
+CTCGGGTGCACGGCGGCGACATTGCGGCCGTGGCCGCGCTCGCCAGTGACACCAACCCGGCTCCGCAGCT
+GCAAAACCTGCCCGGCGCGGTACGTCACCGCAGCCGCATCGCCAACCCCGCCGTACGGCGCGGATGGCTG
+CAGCATGGCCCGGGGCCCAGCTCGGCTCGCGGCGCCGAAGAGTTCGTGGAGGTCAGCTGGGACGAGTTGA
+TCGAGCTGCTGGCTTCCGAGCTGCGCCGTACCGTCGACCGCTACGGCAACGAGGCGATCTATGGCAGCTC
+CTACGGCTGGGCCAGCGCCGGACGGTTCCACCACGCGCAAAGCCAGGTGCACCGGTTCCTCAACATGCTC
+GGCGGGTACACCGCATCCCGGCACAGCTACAGCGCCGGCGCGTCCGAAGTGATCTTCCCGCATATCGTCG
+GCGCGGCCCTGTTCGAAGCCCTGGCCGAGACCACGACCTGGGATGTCATCGTCGACCACACCGCGCTGTT
+GGTGGCGTTCGGCGGATTGCCGGTGAAGAACACCGCGGTGATGCCCGGCGGTACCACCGCTCATCCGGAC
+CGCGACTACGTCGGCCGGTACCGGGCTCGCGGCGGTCGGCTGGTGTCGGTCAGCCCGCTACGTGACGACA
+TCGCCGCGATCGCCGGTCCGCTCGACGATCGATGTCGCTGGCTTGCGCCGGTGCCTGGCACCGATGTGGC
+GATCATGCTCGGGCTGGCATACGTGCTGGCCACCGAGTCGCTGGCCGATCGCGCGTTCCTTGGCAGGTAT
+TGCACCGGCTACGAACGCTTCGAGCGCTACCTGCTGGGCCTGGATGATGGGATTCCCAAGACACCCGAAT
+GGGCCGCCGCGCTGTCCGGGCTCGCCGCCGGCGATCTGCGAGATCTGGCCCGCCGGATGGCCGAGCACCG
+GACTCTGATCACCACCAGTCTGTCGTTACAGCGGATAGAGCACGGCGAGCAGACCGTGTGGATGGCCGCG
+ACCCTAGCGGCGATGCTGGGCCAGATCGGGCTTCCCGGAGGGGGTTTCGGTCACGGCTACAGCAGCAACG
+GCGTCGGCAACCCGCCGTTGGCGTGCGGCCTGCCGGCATTGCCGCAAGGCAACAATCCGGTGTCGACGTT
+CATTCCGGTGGCGGCGATCAGTGAGCTGCTGCAGCGGCCCGGCCAGCGGCTGGCCTACAACGGCCGATTG
+CTGGAGCTGCCCGACATCAAGTGCGTCTACTGGGCCGGTGGAAATCCGTTCCACCACCACCAGAACCTGC
+CGCGGCTGCGTCGTGCACTGTCTCGGGTAGACACGATCGTGGTACACGAACAGTATTGGACCGCGATGGC
+CAAACACGCCGACATTGTGGTGCCAACCACCACCAGTTTCGAGCGCGACGACTTCGCCGCCAGCAAGACC
+AATCCCACCTTGATCGCAATGCCTGCGATGGTGCCGCCGTATGCCAACGCCCGCGACGACTACCACACGT
+TCTCCGCGTTGGCCCACCGGCTGGGGTTCGGCAAGCAATTCACCGAGGGCCGCAGCGCGCGCGAGTGGCT
+CGAGCACATGTACGACAAGTGGTCGGCCGAGCTGGATTTCCCGGTGCCGTCATTCGCCGAATTCTGGCGG
+ACCGGCCGGCTGGAACTACCGACCAGAACCGGTTTGACGTGGCTTGCCGATTTCCGGGCCGACCCGGCGG
+CCCATCCGTTGGGGACACCCAGCGGGCGGATCGAGATCTTCTCGGACACGGTCGACGCGTTTGCCTTGCC
+GGACTGTGCCGGGCACCCCACCTGGTATGAACCGTCCGAATGGCTAGGCGGGCCGCGGGCCGCGCGCTAC
+CCGCTGCATCTGATCGCCAACCAGCCGCGGACCCGACTGCACAGCCAGCTCGATCACGGCGGCGCCAGCA
+TGGCATCGAAAATCCGTGGACGAGAACCGATCCGGATTCACCCGGATGACGCCGCGGCCCGTGAGCTTAC
+TGACGGCGACATCGTGCGCGTGTTCAACGACCGCGGCGCCTGCCTGGCGGGTGTGGTGATCGACGACGGG
+CTACGGCCCAAGGTGGTGCAACTGTCCACCGGTGCGTGGTTCGATCCCGCCGATCCGCGCGACCCGGACT
+CGATGTGTGTGCACGGCAATCCCAATGCGCTGAGCAACGATTCCGGCACGTCGTCACTGGCCCACGGCAG
+CACCGGCCAGCATGTCTTGGTCCAGATCGAGAGGTTCACTGGCGAACTGCCGCCGGTGCGCGCCCACGAG
+CCACCGCGGCTGGCTTAGCGCCGGACGTCGACTTGTTGGGCGCGAAACGCCGCAATGGACCGAACGACTC
+GACGTAAGTGTGCCCTGCTGGTGTCGGCTCGAGTCGCAGCACGGGTGAGCACCACGTGCGCCACTAGCCC
+TGAGCGAAGTGTCGCTGCAACCGCCGGTGCCGATGACCGAAGAGCGCGCGCAACCCTGCCGCGATGAGCG
+GCGCGGCAAACCTGAGTCCGGCACGCGTCTGGAACGTGATGCGGTCGCGGACAATCGTTTTCGTGTCACC
+CTCGGGCGTCACGGTGCGTTCGTGCTGCCATTGCCGCATGCTCAGCATCGTCGAATCCTCGCGAAACCGC
+CGTCCCGGCTCGAGCTCGGCGATGCTGAGCCGGTCATAGTCGAATGGCAACACACCGAACAGTCGCAGCC
+AGGCACGTCCGATCGGCGCGCCGATCGGCACCGTGTCGACGGTCATCCCTTTCGCGCCGCGAGGCACCGA
+CATCGTCATCCAGGGGCGCAACTCATCGTTGATGCCCTCCGGGGTGACGACCCGTTGCCACACCTGCTCG
+GCAGGTGCGGCGACGACGCTTTGCCGTTCAATGAGCACCGGTTCAGCGTATCCGACCACGCGGCGCGGTG
+GGGCTACGTCTCCCTCGCCTCGGTGGCTGCCTAAAGGCCGTTCCGTCCCGGGTTGAGTTCTGCGATGCAG
+AGGTGGCAGATCGTCAATGCGGGCGAGAATTTGTTCCGGCCTCTGTTGATGCGGGTGACATCGGAAGGTG
+TGGGTAAAGGGATCAGCCCGAGATCATGCAATCACTGTCCTGACAACCAGATTCAGCACGGCCTGGTAAT
+CGACAGGATTCTGGGACTATCAGACTCCAGCATCACGGTTCTCACCCGGGCCCAGGTCGAGGCGATGGTC
+GCGGCGCTGCCGCGAAGCTACTGATTCCGCGCAGCTGCTCTGTCAGGGCCGCTGACTTTTCTCTCGGTCA
+TCGTGGTCGCAGGCGCCGCACTCGGTGTCTTCGGGGGGGGGGGGGGGGGGGGGGGGGGGAAGCGCGACCT
+CGAAGGCCACTGAAACGCCTTACGGAGACGCGACGAACCAAATGCCGACGAATACGGCGAGGCCGGTGGC
+TACCGGGAGCCTGCCACAGAGGATCGCCCAACCTGCCCAGATCGTTGCCTGGCCGAGGAACATCGGGTTC
+CGCGAGAACGCGTAGGGACCTCCAGCTCCTCGATGACCCGCCTCAGTTCGTCGGCTCGTGCACGGTCCGG
+TTTCGGAGCCGGTCCAACACGCCGCGAACCGCGTGCTCGGTGACCGACAGCGGTGACATCACCGTTTCGC
+CGAGGCTCACGATGTAGTCGATCCGATCGACGATGGCTTCCACCGGCTCGACCAACACGATGAGCCGTTT
+CGCGAGATCGTCCAGGCTGTGCAGGGTACCTTCGAGATGGTCCAGACCGTCCTCCAAGCGCTCCACGGTG
+CTGTTCAGCTGTGACAGCGAGCTGTTCAGCTCGGCCATGGTCTTACCCAGACCGTCCAGGACGTCTTCGA
+CCTGCTCCACCGTCTTGTCGGCGTTCAATGCGGCCTGGGTGAGGGTTTTCATTCGCCGTCGCACGGGCGC
+GGGGCGGCCGCTTCTGTCTGCCATGACGGTCATTATGACCCTGACGCGGTTAACTCGGAAGCTTGGCGGC
+GGCGTCGCGGTCCAGCAGCCAGAGCGTGTTCTGACGCCCGACGGCCCCGGCCGCCGGTACCGAAACCGGA
+TCGGCGCCGCCGATGGCCGCGGCCACGGCGTCGGCCTTACCCGGCCCGGAAACCAGCAGCCACACCTCGC
+GGGAACGCTGAATCGCCGGCAGGGTCAAGGTGATTCGGCGTGGCGGCGGTTTCGGCGAGTCGTCGACCGC
+CACCACCATGCGGGTGCTCTCGAGGACGGCGGGGCTGTGCGGGAACAGCGAGTTAATGTGGCCCTCGGGC
+CCCATGCCCAGCAGGTGGACGTCGAAATTCGGCGCCGGGTCACCTGGTGCGGCACTGGCGGCCAGCACCT
+GTTCGTAGGCCAGGGCCGCGGCGTCCAGATCGCCGCCGAAGTCACCATCACTGGCGGCCATCGGGTGCAC
+CTGGTTCGATGGAATGTCGACGTGATTGAGCAACGCCCGCCGGGCCTGCTTGAGATTGCGCTCGTCATCG
+TCTTCGGGAACGTAGCGTTCGTCGCCCCAGAACAGGTGCACCTTGGACCATTCAATCTGCTGTGCTTGGG
+CGCTGAGGTAGCGCAGAAGCGCAATCCCGTTGCCGCCCCCGGTCAGCACGATCAGCGCCTGCCCTCTGGC
+CGCCACCGCGGCCCCGATGGCGCCAACCAAGCGCTTACCCGCGGCCGCGACCAGAATGTCGCTATCGGGG
+AAGATCTCGATGCTACTGCTCACCGGTACTGCACCTTCTTGATTCCCTCGAGCGCGGCGCAGTAGATTTC
+GTCGGGGTCCAGCCGGCGCAGGTCTTCGGCTAGGCACTCACCGGTTACCCTGCGCGCCAAAGGAACCAGA
+GCGTCGGGCTTGCCCGTCCGGGTCAGGGTGGCCGTGATTCCCTCCTGGGGACGGCTTAGCACGATGGTCT
+CGCTGTTGCGCACCAGCTCGACTTTGAGTTCGCCGACCGCCCGTCGCACCGGACCTTCGATCCGGCTGGC
+TAGCCAGCCGGCTAGGACGTCGAGCGCCGGTTCGGTCTTCAAGCCGGACACCAGCGCCGACTCGATCGGC
+TCGTGTGGCGGCTGGTCGACGGCCGACGTGAGCAGCGCACGCCAATAGGTGATGCGGCTCCAGGCCAGAT
+CGGTGTCGCCGGCGCCGTAGCCGGCTAGCCGGCTCTTGATGGCCGACAGCGGGTCGATTGCGTTGGTGGC
+GTCGGTGATGCGCCGAATTGCTAACTTGCCCAACGCATCCTGTGCTGGCACCGCCGGTGCGATGTCGGGC
+CACCACGCCACCACCGGGATGTCGGGCAGCAGGAAGGGGATAACGACGCTGTCGGCGTGGCCGGCCAGTG
+GCCCGGACAGCCGCAGCACCACAAACTCGCCGGCGCCGGCGTCAGCGCCGACCCGCAGTTGTGCGTCCAG
+CCGCGGTCTGTCGGCGTACGGATCGCCCCGCATCGTTACGATGATGCGGCTGGGATGCTCATGGCTGGCG
+TCGTTGGCCGCCTCGATGGACTCTTCCAGCATGGCTTCGCTGTCCGGCGCAATGATGAGCGTGAGTACCC
+GGCCCATCGCGACGGCGCCGATCTTTTCGCGCAGCTCGTCGAGCTTCTTGTTGACCGCGGTGGTGGTGGT
+GTCGGGCAAGTCGACAATCATCTGCGCCGCTCCTCCTCATCGCTTCGCTCTGCATCGTCGCCGGCGCGGA
+TCACTATGGCCGCCGCCATTCCCGGCCGGTGCGGCGCAGCATCTCCAAGGATGATTCCGGACCCCAGGTA
+CCTGCCTCGTAGGCGTCGGGCGTCCCGTGTGCCGCCCAATGTTCCAACGCTGGATCGAGGATCTCCCACG
+CCAGTTCGACCTCCGCGTTGACCGGAAACAGCGAGGGCTCGCCGAGCAGGACGTCGAGGATGAGCCGCTC
+GTAGGCCTCCGGTGAATCTTCGGCGAATGCCGAGCCGTAGGAGAAGTCCATGTTGACGTCGCGGACTTCC
+ATGGCGGTGCCCGGCACCTTGGAGCCGAACCGCAATGTGACACCTTCGTCGGGCTGCACGCGGATGACCA
+TCGCGTTGGTGCCCAGCTCGTCGGTCATGGTGGCGTCGAACGGCAGATGCGGCGCCCGCCTGAAGACCAG
+AGCGATCTCGGTCACCCGGCGGCCCAATCGTTTTCCCGTTCGCAGATAGAACGGCACGCCGGCCCACCGG
+CGCGTATCGACTTCCAGGGTGATAGCGGCGAAGGTTTCGGTGGTGGAGTCCTCGGCGAACCCCTCCTCGT
+CGAGCAGCCCAACCACCTTCTCCCCGCCTTGCCAGCCGGCGGCGTACTGGCCGCGGCTGGTGGTCTGGTC
+GAGTGGCTCGGCAAGGCGGGTGGCCGAGAGCACCTTGATCTTCTCGGCCTGCAACGCTGCCGGGTGGAAG
+CTGACCGGCTCCTCCATCGCGGTCAGCGCCAGCAGCTGCATGAGATGGTTCTGGATGACATCGCGGGCCG
+CGCCGATGCCGTCGTAATAGCCCGCGCGCCCGCCCAGGCCGATGTCTTCGGCCATGGTGATCTGTACGTG
+GTCGACGTAGTGCGCATTCCAGATCGGGTCGAACAGCTGGTTGGCGAACCGCAGCGCCAGGATGTTCTGC
+ACCGTCTCTTTGCCCAGGTAGTGGTCGATGCGGAAGACCGCTTCCTCCGGGAAGACCGCGTTGACCGCCT
+TGTTCAGCTCGCGTGCGCTGGCCAGGTCGTGGCCGAACGGCTTCTCTATCACGACTCGGCTCCACCGGTC
+GCCTTGCGGGCGGGCCAGGCCGGACTTGTGCAGCTGCTCACACACCACCGGGAAGGATTTGGGCGGGATC
+GCCAGGTAGAAGGCGTGGTTGCCGCCGGTGCCGCGCTCGGCGTCGAGCTTCTCCAGCGTCTCGGCGAGTT
+GGGCGAACGCGTCGTCGTCGTCGAAAGTGCCTGGCACAAAACGGAATCCCTCGGCCAGCCGGTCCCAGTT
+CTGTTGCCGAAACGGTGTTCGGCAGTGCTCTTGGACGGCGTTGTACACCACTTGACCGAAATCCTGGGTG
+CTCCAGTCTCGGCGGGCAAACCCCACCAGCGAGAATGTGGGCGGCAGCAGGCCGCGGTTGGCCAAATCGT
+AGACGGCCGGCATCACCTTCTTGCGGGCCAGGTCGCCGGTGACGCCGAAAATCACCATGCCGCACGGGCC
+GGCGATTCTGGGTAATCGCTTGTCCCGCTTGTCTCGTAGCGGGTTGCGCCACGACGCCGCGGCGTGGGCC
+GGTTTCATTGGGCAGCGGTGTCGAGATGCGCCCGGGTTTCCTGGAGTAGCTCGTTCCAGGAGGCCTCGAA
+CTTCCGCACGCCTTCCTCCTCGAGGACGGCAAACACGTCGGTGAGGTCGATGCCGATCGCCCCCAGCTGG
+TCGAACACCGCCTGGGCATCGGATGCAGTTCCGGTGACCGTGTCGCCTTGGATCACGCCATGATCAGCGA
+CGGCGTCAATTGTCTTTTCCGGCATAGTGTTCACGGTGTGTGGGGCGACCAACTCGGTGACGTAGAGGGT
+GTCCGAGTAATCGGGGTTCTTCACGCCGGTGGAAGCCCACAACGGGCGCTGGACCCGGGCGCCGTCGACC
+TTGAGGGACCGATAACGATCGCTGTCTTCGAAGACCTCCCGGTAGGCGGCATAGGCCAGGCGGGCATTGG
+CGACACCGGCCTGGCCGCGCAGTTCGAGCGCTTGCCGCGAGCCGATTCTGTCCAGCCGCTTGTCGATTTC
+GGTGTCCACCCGGGAGACGAAAAACGATGCCACCGAATGGATCTTGGACAGGCTGTGTCCGGCTTGCCGG
+GCCTTTTCCATCCCGGTCAGGTAGGCGTCCATCACCTCGCGGTACCGCTGCACGGAGAAGATCAGCGTAA
+CGTTGACCGAAATCCCTTCCGCCAGAACGGCACTGATGGCGGGCAGACCGGCCTTAGTGGCCGGGATCTT
+GATGAAAAGGTTCGGCCGGTCGACGATCTTCCACAGCTCGATTGCCTGTTGGATCGTTTTTTCGGTTTCG
+TGTGCCAGCCGCGGGTCGACCTCGATCGACACCCGGCCGTCGACCCCGTCGGAGTCCTCCCACTGGGGGA
+CCAGCACGTCGCACGCGCTGCGCACGTCGTCAGTGGTGACGGTGCGGATGGTGGCATCCACGTCGGCGCC
+GCGCGCGGCCAGCTCGGCGATCTGGGCGTCGTAGGTGTGGCCCTCCGACAGCGCCTTCTGAAAGATCGAC
+GGGTTGGTGGTCACCCCGACGACGCTCTTGGTGTCGATCAGCTCCTGCAGATTGCCCGAGCGCAGCCGGT
+CCCGCGACAGGTCATCCAGCCACACCGATACCCCCGCGGCGCTCAATGCGGCCAGGTTGGGGTTCTGAGC
+GGTCATCGGTAATCACCCTTCCTCAGTTATCCAGCGCTCGTTCGGCGGCGGCGGCCACGGCCTCGGCAGT
+GAAGCCGTACTCGCGGAACAAGGTCTTGTGGTCCGCGGATTCGCCGTAGTGCTCGATCGAGACGATCTCG
+CCCGTGTCGCCAACCAGCTGGTGCCAGCATTGCGCGACGCCGGCTTCGACGGCCACCCGCGCCGACACCG
+TCGGGGGCAGCACCGCGTCGCGGTACTCGTAGGGTTGGGCCTCGAACCACTCCAGGCACGGCATCGACAC
+CACCCGAGCGAGGATGTCGTTGTCCGCCAGCAACGTCTGCGCCGCGACCGCCAGCTGCACCTCCGAGCCG
+GTGGCGATGAGAATGACGTCGGGTTCCTCGCCCGGTTGCAGACCACCGGCGTCACTCAGCACGTAACCGC
+CGCGGGCAACCCCCTCGGCGTCGGTGCCGTCCAGCACCGGCACACCCTGGCGGGTCAGGATCAACCCGAC
+CGGCCCGCTGCCGTTGCGGCGGGCCAGGATCGTGCGCCAGGCGTAGGCTGTCTCGTTGGCATCTGCCGGG
+CGCACCACCGACAGCCGGGGGATCGCGCGCAGCGCCGAGAGGTGCTCGATCGGTTGATGGGTGGGCCCGT
+CTTCGCCGAGGCCGATCGAGTCGTGCGTCCAGACGTAGATGGTGTCGATGTCCATCAACGCCGCCAGCCG
+CACCGCCGGGCGCATGTAGTCGGAGAACTGCAGGAAGGTGCCGCCGTAAGCCCGGGTGGGTCCGTGCAGC
+ACGATGCCGGACAGGATGGCACCCATCGCGTGCTCGCGAACACCGAAGTGCAAGGTGCGACCATACCAGT
+GCGCGGTGTACTCCTTGGTGGAAATCGAGGGCGGGCCAAAGGAGTCGGCGCCCTTTATCGTTGTGTTGTT
+GCTGCCCGCCAGGTCGGCCGAACCGCCCCACAACTCGGGCAGTTTCGGCCCGAGCGCGGACAGCACCGCA
+CCCGAGGCCGCACGGGTGGCCAGCGCCTTGGACCCCGGTTCCCAGTGGGGCAAGTCGGCGTCCCAGCCGT
+CGGGCAACTTCTGCGCGAGCAGCCGGTCCAGCAGCGCCTTGCGCTCGGGTTCACGCCGCGCCCAGGCATC
+GAATTCGAGCTGCCAGCGTTCGTGGGCCTGTTTGCCGCGGGCCACCAGCCCTCGGGTGTGGGTGAGGACG
+TCCTCGCGGACCTGGAACGTCTTGTCCGGATCGAAGCCGACGATCTTCTTGACTGCGGCCACCTCGTCGT
+CGCCCAGCGCCGCGCCGTGCGCCTTGCCGGTGTCCATCAGGTTCGGCGCCGGATAGCCGATGACGGTGCG
+CAGCGCGATGAACGAGGGCCGGTCGGTGACCGCCTGCGCATTGGCGATGGCCTCCTCGATGCCGACGACG
+TTCTCACCGCCCTCAACCTCTTGCACGTGCCAGCCGTACGCGCGGTAGCGGGCCGCGGTGTCCTCACACA
+GCGCGATGTTGGTGTCGTCCTCGATCGAGATCTGGTTGCGGTCGTAGAACACGATGAGGTTGCCCAGTTG
+CTGGACCGCGGCCAGCGACGACGCCTCCGAGGTCACCCCTTCTTCGATGTCACCGTCGGAGGCGATGACA
+TAGATGTAGTGGTCGAAGGGGCTGGCGCCCGGTTCGGCGTCCGGGTCGAACAGGCCGCGCTCGTAGCGCG
+AGGCCATCGCCATCCCGACCGCCGACGCCAGTCCCTGCCCCAGCGGGCCGGTGGTGATCTCAACGCCGGG
+GGTGTGGCGGAACTCCGGGTGTCCGGGGGTCTTGGATCCCCAGGTGCGCAACGACTCAATGTCGGACAGT
+TCCAGGCCGAAGCCGCCGAGGTAGAGCTGGATGTAGAGGGTCAGGCTGCTGTGCCCGGCCGACAAAACGA
+ACCGATCGCGGCCCAGCCAGTGTGTGTCGCTGGGATCGTGACGCATTGTCCGCTGAAACAGCGTGTAGGC
+CAACGGAGCCAGGCTCATCGCCGTTCCAGGATGACCGTTGCCGACCTTTTGGACGGCATCGGCGGCCAAT
+ACCCGGATGGTGTCGACGGCAGCCGAATCGATCTCGGTCCAGTCGTCGGGATGGCGCGGTCGGGTAAGCG
+CGGAGATCTCTTCGAGTGTGGTCACAAATTCAGTCCTCGAGTCAGCAAGATGATCAGTCCTCACCCTAGT
+GCGGGAATCCCGGCGCTTGCAGTGCCGCATATCCGGGTACCCATCCGGGCCCTGTGAAACGTAACCCGCG
+CGCTACCCACGCTTCGCATTCGGTGCCGATATGCCGAAAAATCACCGTCATCGACCCTGCGGCTCTGCTG
+CTGGGGCTACGTCGAACACCGTACGTCGCAGAAGTGTGGTGCGGGTCGGGCGGCCGGCTTAATCGCGGTG
+ATAATCGGTTGGTCGGCGATCACCGGCATCATCGGTTGGCCGGCGCTGGTGATGCTGTTCGCCGGGCCTC
+GCGTCGGCGAGCCGGGCAAGCCGGTGCGCCTGCCGATCCCATGGCGGGATGTTGGTGGGTACCGCCCGAC
+CGGAAGAAGCATCGCGGCATGCCGGCGTGGCGAGCCTCGGGGTCTACACGAATTCGCCGCCGCCGAGCCC
+GCCGAAGCCACCGCCGCCACCGGCGCCGCCGGCGGTACCTGTGGCGATGGACCCCGGGCTACCGAGGCCG
+CCGAGACCGCCGAGACCAAGGAGGATGCTGAAGCCGCCGCCACCGCCCTGCCCCCCGTGGCCACCGGTCC
+CACCGGTGCCTGTTCCAAAGGGCCCCGCGTCGCCGGTGCCGCCGGTGCCCCCGGAGCCACCCATCCCGCC
+CCGGCCACCGACGCCGGCAAAACCATTGCCGCCAAAGCCGCCCGCACCTCCGTTGCCACCCATCCCAGGC
+TGAGAGCCGTTGTGGCCGGTGCCGCCGGTGCCGCCAGCGCCGCCGTTGCCGCCAGTGCCGCCTCTGCCGC
+CGGTGAGGCCGCCGTTGGCACCCTGGCCGCCGGTGCCGCCGGTGCCGCCGGTGCCGCCGGTGCCCCAGTC
+GCCGGGGGTGCCACCTGGGCCGCTGGAACCGCCAAGTCCTGCATCGCCTCCGCGTCCTGCATCGCCTCCG
+CGGCCCCCGCCGCCGCCGTCACCAGGTGAGGTGACAAGGTCGCCACTGGCGCCGTTGCCACCGTTGCCGC
+CGTTGCCGGGTGTCCCGCCGGTCCCACCGTTGCCGCCGGCTCCGGTGAGGCCTTGGCCGCCGTTGCCGCC
+TCTGCCGCCGTTGCCGCCTCTGCCGCCGTCACCGCCATCGCCCTCGTTGGTGCCGAGGACGCCCTTGGCG
+CCGGTGCTGCCGGCGCCGCCAGTCCCGCCGATGCCACCGTTGCCGCCGTTGGCGCCGGTGCCGCCGTTAC
+CGCCGTTACCCCCGTGGCCGCCGGGGCCGCCGTTTCCGCCGCTGGCAGCGCCGTGGCCGCCGTGGCCGCC
+GTTGCCGCCGTCGTGCAGGATGCTGCCGGCCGGCCCCGCCTTGCCTGCGGTGGAGCCGGTGCCGCCGGGG
+CCGCCGGCACCGGCGTTGCCGGCGTTGCCGCCGTCGCCGCCTCGCCCGCCGCCGCCGCCGGCGAAGGCCC
+CTGCTCCCTGGCCGTTGCCGCCGTTGGCCCCGTCACCGGGAGCACCGCCGTCGCCGCCGGCCCCACCGGC
+ACCGCCCGCGCCGTCGCTGACTACGCCTTGACCGCCGTTGCCGCCGGCCCCGCCGTTGCCGCCGGCGCCG
+CCGTGCCCGCCGGCACCGCCGGGTTGTCCGGGCGCACCCACGGCCACGCCGTTGGCACCGGCGGCGCCGT
+TGCCGCCGAATCCGCCGAGGCCGCCGTTGCCGCCGGCGCCACCGTTACCGCCGTTCAGGCCGGCCCCGCC
+GGCCCCGCCGGCGCCACCGTTGCCGCCGGGGTTACCGTTTGGCCCGTTTTCACCAGGGTTGGTGGCGTTG
+GCACTCATGCCACCAAACGCGCCGTCGCCGCCGCGGCCGCCGTTGCCGCCCGTGCCGGCGCTGCCGCCGT
+TGCCGCCATTGCCGCCGTCGCCGCCGTTGCCGCCGACCACTTGGGAGTGGCCGCCGTTGCCGCCGTCGCC
+GCCGTCGCCGCCGCTGGTTGGAGTGAAGCCGTGGGCGCCCTTGGCGCCTGGGGTAGAGCCGGCGCCACCG
+CTACCGCCCTGCCCGCCGGCGCCGGGGTTACCGCCGTTACCGCCGTGACCGCCGTTACCATCGCCGAAGG
+CGAAGTTGCCGTTGGCGCCGTTGCCGCCGTCACCGGCGAGCCCGCCGGCCCCCCCTTTGCCGCCGGACCC
+GCCGACACCCTGGATTCCGTTCTGGCCAAAGAGGTTCCCCGCCAAACCGCCGGGCCCGCCTTGGCCGCCG
+TTACCGCCTTGCGCGCCGGGCCCGCCGTGGCCGCCGTCGCCGCCCTTGGCGCCCGGCGTGGTGGCGTTGG
+CGCCGTTGGCGCCGTTGCCGCCGGCCCCACCGTCGGCGCCGTTGCCGCCGGCCCCACCGGTCCCGCCGTC
+GCCCCCGAAGTCTCCGCCCCGGCCGCCGGCCCCGCCCGCCCCGCCAGCCCCGCCGTTCTGGCCGCTCGTG
+CCGGATTCGCCCGCGGTGGTGGGCGAGGAACCGGCGACACCGGCCATGCCGTCCCCGCCTTTGCCGCCGG
+CCCCGCCATTACCAACAAGCCCGCCGTTGCCGCCCTTGCCGCCGGCCCCGCCGGCCCCGCCGGCGACGGT
+GGCGTTCGCGCCGTTGCCGCCGGTGCCGCCGTTGCCGCCGCTGGTCGGGGTGGCGCCGCGGGCACCGTCT
+GCACCCGCGGTGGATCCGGCGCCGCCGATCCCACCAGCACCACCGATGCCGCGGCTACCGCCGTTGCCGC
+CGTTGCCACCAACTCCATCGCCGCCGTTATCGAACGTGCCCTTGGCACCGTTGCCGCCATCACCGCCCAT
+GCCGCCGGCGCCGCCGTTTCCGCCGGCCCCGCCGGCACCCATGCTGCCGTCCTGGTGGGTGGCTGCAAGC
+GCCTTACCGCCTTGCCCACCGGCTCCACCGCCACCGCCGGCTCCACCGTTGCCGCCCTTGCCGCCGTCGG
+TGCCATCCGCGCCTGCCCCCAGGCCGTTAAGGCCGGTGGCGCCGGTGGCGCCGTTGCCGCCGTTGCCGCC
+CTTACCGCCGGCGCCGCCAGCACCGCCGTCGCCTGCTTGGGCTCCGCCGTCGCCGCCCTTACCGCCAGCG
+CCGCCAGCTCCGCCGCCACCGCCGTTAGGGTCGCCGCCAGAAGGCGGGGCACCGGGGGCGCCGTTGCCGC
+CGGCACCTCCGGCGCCGCCGTTGCCGACCAGCCCGCCGGCCCCGCCGGCCCCGCCGTTACCGCCGGCTTT
+GCCGCCCGATGAGAAGTGGGCGCCGTTGCCGCCGGCCCCGCCGTTGCCGCCGCTGGTGGGGCTGGCCCCG
+GCCGCGCCGTGGGCACCGATCGTGGAGCCGGCTCCGCCGGTGCCTCCGGCCCCGCCGGCGCCGGGGTCAC
+CGCCATGGCCGCCGGCCCCGCCGGCACCTGCGTTGACGGCCTGGTTGCCGTTGGCGCCGGCTCCGCGGTC
+ACCGCCGACGCCACCAGCGCCGCCGTCCCCGCCGTCACCGCCGGCGCCTTGGCCGCCCAGCAGGCTGATC
+AGGCCGCCGGCCCCGCCGGGGCCGCCAGCCCCGCCAGCCCCGCCCATCCCGCCGTTACCACCATCACCGC
+CGTTATCCCCAGCGACAATCAAGGCACGAGAAAATCCGGCCCCGCCGGCCCCGCCGGTCCCGCCGATACC
+GCCGTCCCCGCCGGCCCCGCCGGCGCCGGCCAGCCAGCCGCCCCGCCCTCCGGTGCCGCCATCGCCGGCG
+TCGCCGCCGGCCCCGCCGTTGCTACCGTCTGGGAAGATACCGCCCTTACCGGCGGCGCCGGCGATACCCG
+CAGCGCCGTGTCCGCCGGCACCACCGTGCCCGCCCACGCCCAACAGCCCGGCCGCACCCCCGACACCGCC
+GTGTCCACCCACACCACCGATCGGGCCGGGCCCGCCGGCACCTCCGTGCCCGCCGGCCCCGTAGAGGGTC
+CCGCCCAGGCCACCGGCACCACCGGTACCGCCGACCCCGCCGGGCCCGCCGGGCCCGCCGGGCCCGCCGG
+GCCCGCCGGGCCCGCCGGGCCCGCCGGTTCCGCCGACCCCGAACAGTCCGGCGTTGCCGCCGGCCCCGCC
+GGTTGCCCCGCCCAGCAGGCTCTGCCCGCCGGCCCCGCCGACTCCACCATTGCCCAGCAGCCAGCCGCCG
+CTACCCCCGGCCCCACCGGCGGCGCCGGCCCCACCGGCCCCACCGGCCCCGCCGGTGCCGAACAACCCGG
+CGGCCCCGCCGGCCCCGCCGACTTGGCCGGGCGCGCCCGAGCCGCCGGCCCCACCGTTGCCCCACAAGAT
+CCCGCCGGCCCCGCCGGCCTGCCCGGTGCCGGGTGCTCCAGCCGCCCCATCACCGATCAACGGGCGACCC
+AGCAACGCCTGGGTGGGCGCATTGAGGGCATTGAGCACGTTGTGCTCCAGCGTCGCCAACGGTGCGGCGT
+TGGTCGCCTCCGCGCTGACATACGAGCCGACCGCGGCGCTTAACGTCTGCGCAAATCGGTCATGAAACGC
+TGCCACCTGCGTGCTGATCGCCTGATACTCCCGAGCATGGCTGCCAAACAGCGTCGCGATCGCCGCCGAC
+ACCTCATCGGCGCCCGCGGCCAGCACGCTGGTGGTTGACCCCGCCGCCGCGCTGTTGGCTACACCGATCG
+ATGACCCGATGCGCGCCACATCTAAGGCTGCGGCCGCCACCGTCTCCGGGGCCACGATCACCAACGACAT
+CACAGTCCACCCGCCACGCCCCTGCCCCTTCGGCAGGTCACACTCCTGCCAGATAAGGGTCGCGCCGCCA
+CCTTGTCCGATTCCAGGTCAAAATCCCCATAACCAGCACGAATCTGCTGTGCACAGTGCACATTCGCCCT
+ACTATCGGCTCGTGGCATTGCGGCTAGCAACGGTTGGTCTTCGGGCCCAATCCTTAGGGCGTCACACTGA
+TCAATCCCAGATAGCGATTTTCATCGGGCTGGTGTGAAAATTGTCCTGACCGCGGTTCGGGCTGGCGAGC
+GGTGCCGATATGCCGGCGAAGTCGTGTGAATCGACCCTGCGGCTCTGCTGCCACAGTTACCCGGTCTACC
+ATCGTGCGTAGTAGAAGCTGCGCGCGGCTGCGATTCCCGAGGAGTTAGTGCGTGAACGTTCGCGGGCGCG
+TCGCGCCGCGCCGAGTGACTGGTAGGGCAATGAGCACCCTGCTGGCCTACCTGGCGTTAACCAAGCCGCG
+AGTCATCGAGCTGCTGTTGGTCACCGCGATACCGGCGATGCTGCTGGCCGACCGCGGCGCCATTCATCCG
+CTGCTCATGCTCAACACGCTCGTCGGCGGGATGATGGCCGCCACCGGCGCCAACACGCTCAACTGCGTCG
+CCGACGCCGATATCGACAAGGTGATGAAGCGAACCGCGCGCCGGCCCTTGGCGCGGGAAGCGGTGCCGAC
+CCGAAACGCGTTGGCACTCGGGTTGACGTTGACGGTGATCTCGTTCTTCTGGCTATGGTGCGCCACGAAC
+CTGCTGGCGGGGGTGCTGGCCCTGGTCACCGTCGCGTTTTATGTGTTCGTCTACACGCTTTGGCTCAAGC
+GACGCACGTCACAGAACGTGGTGTGGGGTGGGGCGGCCGGCTGTATGCCGGTGATGATCGGCTGGTCGGC
+CATCACCGGCACCATAGCCTGGCCGGCGCTGGCGATGTTCGCGATCATCTTCTTCTGGACGCCGCCACAC
+ACCTGGGCATTGGCGATGCGCTACAAGCAGGACTACCAAGTGGCCGGGGTGCCGATGCTGCCGGCGGTGG
+CGACCGAGCGTCAGGTCACCAAGCAGATCTTGATCTACACCTGGCTGACCGTGGCCGCGACGCTGGTGCT
+GGCGTTGGCGACCAGTTGGCTTTACGGCGCGGTGGCCCTGGTGGCCGGTGGGTGGTTCCTGACGATGGCC
+CACCAGTTGTATGCCGGGGTGCGCGCCGGCGAGCCGGTCAGGCCGCTGCGGCTGTTTCTGCAGTCGAACA
+ACTATCTGGCGGTGGTGTTCTGCGCACTGGCCGTCGACTCGGTGATCGCGCTGCCCACGCTGCACTGATT
+GGGGGCCCAGTTCCGCTGCGGTGCCGGCCCTGCTCGGCCAACGTAGTCAGATGGTTGGATCGCCACCGGC
+GCCACCGGCGCCGCCCGCGCCACCAGCACCGCCGCTGCCATCTGGGTCCGTCGAGTCGCCGAGGACGCCG
+GCGCCGCCATTGTCGCCAAATACCGTGAGACCTAGCAGGGTGCCGGCGCCGCCCTTGCCGCCGGCCCCGC
+CGGCGCCGCCCAATCCACCGAAGCCCCTCCCTTCGGTGGGGTCGCTGCCGCCGTCGCCGCCGTCACCGCC
+CTTGCCGCCGGCCCCGCCGTCGCCGCCGGCTCCGGCGGTGCCGTCGCCGCCCTGGCCGCCGGCCCCGCCG
+TTTCCGCCGCCGCCGCCATCGCCGATGATGTTTTCCCCGCCCTTGCCGCCAGCCCCAGCGTTCCCGCCGG
+CTCCGCCACTGGCGCCGGTGCCGCCGGGTGCAACGGCGTTGGCGCCGTTACCGCCGTTGCCGCCTTTGCC
+CCCGGTGTCTGCAAAGTCGGGGGTCGCACCCTGCGCGGCGCGGGTCACGCCGTCACCGCTGAGCCCCCCG
+AGCCCGCCAGCGCCGCTGAAGCCAGGATTGCCGCCGTTGCCGCCATGGCCGCCGTTGGCACCGGGTGCGA
+CGGCGTTGCCGCCGGTCCCGCCGACCCCACCGTTGCCGCCTTTACCACCGTCCTGGCCACGCTCGCCCGC
+GGTGGTGGCATTGGCACCCTCGGCACCACTACCACCGAGCCCGCCGTCTGCGCCGCGGCCGCCAGTCCCA
+CCGGCCCCGCCATTGCCGGCGAGAGTTCCGCCGTCGCCGCCGGCGCCGCCCTGGCCGCCGTTGCCGCCGC
+TATTGCCTTTGCCACCGACTGCGCCCGAATCGCTCGCGTTCGTCCCTGCGGCGCCGTTGGCGCCGTTGCC
+GCCGGCCCCGCCGGCGCCGCCGTTGCCGACCAGCCCGCCATGGCCGCCGGCCCCGCCGGCCCCGCCGTTA
+CCGCCGGCTTTGCCGCCCGATGAGAAGTGGGCGCCGTTGCCGCCGGCCCCGCCGTTGCCGCCGCTGGTGG
+GGCTGGCCCCGGCCGCGCCGTGGGCACCGATCGTGGAGCCGGCTCCGCCGGTGCCTCCGGCCCCGCCGGC
+GCCGGGGTCACCGCCATGGCCGCCGGCCCCGCCGGCACCTGCGTTGACGGCCTGGTTGCCGTTGGCGCCG
+GCTCCGCGGTCACCGCCGACGCCACCAGCGCCGCCGTCCCCGCCGTCACCGCCGGCGCCTTGGCCGCCCA
+GCAGGCTGATCAGGCCGCCGGCCCCGCCGGGGCCGCCAGCCCCGCCAGCCCCGCCCATCCCGCCGTTACC
+ACCATCACCGCCGTTATCCCCAGCGACAATCAAGGCACGAGAAAATCCGGCCCCGCCGGCCCCGCCGGTC
+CCGCCGATACCGCCGTCCCCGCCGGCCCCGCCGGCGCCGGCCAGCCAGCCGCCCCGCCCTCCGGTGCCGC
+CATCGCCGGCGTCGCCGCCGGCCCCGCCGTTGCTACCGTCTGGGAAGATACCGCCCTTACCGGCGGCGCC
+GGCGATACCCGCAGCGCCGTGTCCGCCGGCACCACCGTGCCCGCCCACGCCCAACAGCCCGGCCGCACCC
+CCGACACCGCCGTGTCCACCCACACCACCGATCGGGCCGGGCCCGCCGGCACCTCCGTGCCCGCCGGCCC
+CGTAGAGGGTCCCGCCCAGGCCACCGGCACCACCGGTACCGCCGACCCCGCCGGGCCCGCCGGGCCCGCC
+GGGCCCGCCGGTTCCGCCGACCCCGAACAGTCCGGCGTTGCCGCCGGCCCCGCCGGTTGCCCCGCCCAGC
+AGGCTCTGCCCGCCGGCCCCGCCGACTCCACCATTGCCCAGCAGCCAGCCGCCGCTACCCCCGGCCCCAC
+CGGCGGCGCCGGCCCCACCGGCCCCACCGGCCCCGCCGGTGCCGAACAACCCGGCGGCCCCGCCGGCCCC
+GCCGACTTGGCCGGGCGCGCCCGAGCCGCCGGCCCCACCGTTGCCCCACAAGATCCCGCCGGCCCCGCCG
+GCCTGCCCGGTGCCGGGTGCTCCAGCCGCCCCATCACCGATCAACGGGCGACCCAGCAACGCCTGGGTGG
+GCGCATTGAGGGCATTGAGCACGTTGTGCTCCAGCGTCGCCAACGGTGCGGCGTTGGTCGCCTCCGCGCT
+GACATACGAGCCGACCGCGGCGCTTAACGTCTGCGCAAATCGGTCATGAAACGCTGCCACCTGCGTGCTG
+ATCGCCTGATACTCCCGAGCATGGCTGCCAAACAGCGTCGCGATCGCCGCCGACACCTCATCGGCGCCCG
+CGGCCAGCACGCTGGTGGTTGACCCCGCCGCCGCGCTGTTGGCTACACCGATCGATGACCCGATGCGCGC
+CACATCTAAGGCTGCGGCCGCCACCGTCTCCGGGGCCACGATCACCAACGACATCACAGTCCACCCGCCA
+CGCCCCTGCCCCTTCGGCAGGTCACACTCCTGCCAGATAAGGGTCGCGCCGCCACCTTGTCCGATTCCAG
+GTCAAAATCCCCATAACCAGCACGAATCTGCTGTGCACAGTGCACATTCGCCCTACTATCGGCTCGTGGC
+ATTGCGGGAAACCTCACCGCGAATACATGAGCTGATCCGCGAGGCAGCGCGAATCGCCCTCAACCCGACC
+CAGGAATGGCTCGACGAATTCGACCGTGCCATTCTGGCCGCCAACCCATCCATCGCTGCCGACCCCGCCC
+TGGCCACCGTTGTCAAGCGTTCCAATCGGGCGCATCTCATCCATTTCGCGGCCGCCAACCTGCGCAATCC
+CGGCGCCCCGGTGCCCGCGAACCTTGGTCCCGAGCCGCTGCGCATGGCCCGTGATCTCGTGCGCGTCGGT
+TTAGATGCCTTGGCCCTCGACATCTACCGCATCGGACAAAACGTGGCCTGGCGGCGCTGGACGGACATCG
+CGTTCGGACTGACCTCCGACCCCGACGAGTTGCACGAATTACTGGATGTGCCATTTCGGACAGCCAACGA
+GTTCGTCGACACCACCCTTGCGGGCATCACCACCGAGATGCAATTGGAACGCGACAAGCTCACCCGCGAC
+GTTCCTGCCGAACGCCGCAAAATCGTCCAGCTGCTCATCGACGGTGCCCCCATCAGCCGTGAGCACGCCG
+AAGCGCGATTGGGCTACCCTCTCGACCGATCCCACACCGCCGCCGTCATCTGGGGTGACCAGGCCCAGGG
+CGACCACAGCCACCTGGACCGAGTCGCCGACGCGTTCGGCCATGCCGGCGGATGCCCGCACCCGCTGGTC
+GTGGTAGCCGGCGCCGCGACTCGCTGGGTGTGGGTAAAAGACGCCCCCGGGTTTGACATCGACCTGATTC
+ACGAGGTGCTCCATGACATACCCGACGCGCGTATCGCCATCGGGGCCACCGCGCCGGGAATCGAGGGGTT
+CCGGCGCAGCCACCGAGACGCACTCACCACCGCTCGGATGATTATCCGGCTGGAATCACCGCACCGAGTC
+GCCTTTTTCACCGACGTCGAGATGGTCGCGTTGCTCACCGAAAACGCCGAGGGTGCCGACGACTTCATCC
+AACGCACCCTCGGAAACCTCGAGTCGGCCAGCCCGGCTCTGAAAACGACGCTGTTGACCTTCATCAACCA
+GCAGTGCAACGCTTCTCGGGCCGCGAGACTTCTCTTCACCCACCGCAACACCTTGATGAACCGACTCGAG
+ACCGCGCAACGACTTCTGCCCCGCCCTCTCGCCGACACCACCATTCACGTCGCCGTCGCACTCGAAGCCC
+AGCAGTGGCGGGAGAAGCAAACCAGCGATCCTCCGGCAAAGAAAGAGTCGAATGGCACCAAGATGCGCTA
+GCAAGACAGCGCAGCACAGACCGCTACGCTACGGCAGCAGCACGACCGAGCCGACCGTCTTGCGAGCCTC
+CAGGTCCTGATGGGCGCGCAAGGCGTCGGCCAGCGGGTAACGTCCGCCGACCGCCACGGTGATCGCTTCG
+CTGCCGATCGCGTCGAACAGCTCAGCGGCCCGCCAGCTGAACTCCTCGCCGGTGCGGGTGAAGTGGAACA
+GCGAGGGACGGGTGAGGTACACCGATCCGGCGGCATTGAGGCGCTGCGGATCGACCGGTGGAACCGGACC
+GCTGGCGGCGCCGAACAGTGCTAATGTCCCGCGGACAGCCAGGCTGGCTAGGCTGGCGTCGAAGGTGGTG
+GCGCCGACACCGTCGTAAACGGCTTGCACACCGGTGCCGCCGGTCAGTTCGCGAACCCGCCCGGCGAACT
+GCCAGGCATCCTCCGGGTAGTCGAGAACCACGTCCGCGCCGGCATCCTTGGACAGCTTGGCCTTCTCCGC
+CGTCGAAACGGTGGTGATCACCCGCACCCCCAGGTGAGTGGCCCATTGTGTCAGGATCAAGCCGACGCCG
+CCGGCGCCAGCATGCACCAAGACGGTGTCACCACGCTTCACCGGGTACACCGACTTCAGTAGGTAATGCG
+CCGTCAGGCCCTTCAGCAGCGCCGAAGCCGCTACCTCAGACGTGACGTCGTCGGGGACCTTGGCGGTCAG
+AGATGCTGGCGCTGTGCAGAATTCGGCGTAGGCGCCGTTGGCTGAGGCGCTGACCACGCGGTCGCCGACG
+CTGATGGCGGTGTCGGCTGCGGTAACTCCTGGGCCGACGGCCTCCACCGTGCCGCATACCTCGGAGCCGA
+TGACGAACGGGAGTTCGCGCGGATATTGCCCGGAGCGGAAGTAGGTGTCGATGAAGTTGACACCGATGGC
+CTCGGCCTTGATCAGGAGCTCGCCGTGGCCGGGTTGAGGTTGCGGCTGGTCGACGTGGCGTAAGACGCCT
+GGCCCGCCGGTTTCGGTGACTTCGATTGCGTGCATGTGGCTATCATGCCCGGGCATGAAGCTTGCCCGGC
+CGGACGTCTTCCATCCGCGCGTCGTTTTGGCGGGTTGGCCACAGCAGCCCGCCGGTGACGGCGACGATGC
+TGGGCTGGTTGCGGCCCTGCGCCACCGCGGCTTGCATGCTGGTTGGCTGTCTTGGGACGATCCCGAAATA
+GTCCACGCGGATCTGGTGATTTTGCGGGCTACCCGCGATTACCCCGCGCGGCTCGACGAGTTTTTGGCCT
+GGACTACCCGCGTGGCCAATCTGCTGAACTCGCGGCCGGTGGTGGCCTGGAATGTCGAGCGCCGTTACCT
+ACGTGACCTGATGGATCGGGGGGTGCCGACCGTGCCCGGCGAGGTGTATGTGCCGGGAGAGCCGGTCCGG
+TTGCCACGCAAAGGCCAGGTCTTCGTCGGTCCGACCATCGGTACCGGGACACGGCGCTGTAGTGCCCGGT
+TCGCTGCCGAGTTCGTCGCGCAACTGCACGCGGCCGGCCAGGCGGTGCTCGTTCAGCCCGGAGGTTCCGG
+TGACGAGACCGTGTTGGTCTTCCTTGGCGGTGAGCCGTCGCATGCGTTTACCAAGCAGGCCGACACTTGG
+CGCCAGACCGAGCCCGACTTCGAAATCTGGGACGTGGGTGCGGCCGCCGTGGCCGGCGCGGCCGCGCAGG
+TGGGTGTTGACCCAGGTGAGCTGCTCTACGCGCGGGCCCACATCACAGGTGGAAGCCGAGATCCCCGGTT
+GCTGGAATTGCAATTGGTGGACCCGTCGCTGGGCTGGCAGTGGCTGGACCCAGACATCCGCAATCTTGCC
+CAGCGTGACTTCGCGCTATGCGTCCAGTCAGCGTTGGAGCGGCTGGGGCTGGGCCCGTTCTCCCATCGAC
+GCCCATAGCGCGGCGGTGGCCGCCGTAACCGCCGCGGCACCGGCCACGTGAATGGCGACCAGGGCGGCGG
+GTACCCCGGTGAAGTATTGCGTGGTACCGACGGCGGCTTGCGTGGCAACCAGGGCGAGCAGCACGGCGAG
+TCGCACCAGAATCGCCCGGGTGGCACCCACGGCCAGCAGCCCGAAACCCAACCCGATCAGCAGCGCAAGG
+TAGGCAACCAACAGCGACGAATGCATATGCACCAAGGTGGTGATTTCGACTTTCAGCCGCGGCACGGTCC
+GGCTGGGGCTGCGATCTCCCGCGTGCGGGCCTGCCGCCGTGACTAGCGTGCCCGTCACCAGCACCGCGGC
+CAGGTTCAGCGCGCTGAGCGCCGTGAGCGCACGCAACGGGCTGACCACCAGTTCGTGGACGACTCCGTCA
+TCGGGCTGGCCGATCTTGACGTAGAGCAGCACCGCCAGCCACACCATCGTCATCGACGCCAGCAGGTGGA
+TGGCCACCGTCCACCACAGCAGCCCGGTGCGTACGGTGATGCCACCGATCATCGCCTGCACCACCGTCGA
+CACCGGCATCAGCCACGCGTAGGCCAGGACTTCCGTGCGCCGGCGCGCCCGGGTGACGACCAGCACGGCC
+AGTGCCGCGGCTATCACCACCGCAAACGTGACCATCCGGTTGCCGAACTCGACCGCCTGATGGACCCGCG
+GCACCTCGGCGACCACCACCGGGGTGAAGCTACCCGGAAAACACTGCGGCCAGGTCGGACACCCCAGGCC
+TGAGGCGGTAACCCGGACGATTGCCCCGGTGACGGCGATGCCGCCCTGGGTGAGGATGACGATTGCGGCG
+ATGACCCGCTGGACACGCAGGCTGGGAGACACCGCCCGATCGTAAGGCACCAAAAACTACACGCTGTAGT
+ACGGGCGGACCGGTGTCGAAACTGCAACCACGCACCGATGCGTCGGCGTGTCTTGTGCGTGGTTGCAGTG
+TCGCGAAGCCGGGCGGCCGGTTCAGGTGAACCGGAACCAGCGCAGTGCGGCCAGTGCGGCCAGCGCGCCC
+CACACCGCTAGGACGACGATCCCGAACCAGTCCACCGACACGGTCATGGCCTGCGACAGCGCCTCGGTGA
+GCGCGCCCGACGGGGTAACCCGAGCCACCCATTTGAACGCCGTCGGGATCACGTTCGACTCCAAGGTCAG
+CGCACCGAAACCGGCGAATACGAACCACATCAGGTTGGCGACGGCGAGAACGATCTCGGCTCGCAAGGTG
+CCGCCGAGTAGCAGGCCGAGCGCCGCAAAGCCCGCGGTACCCAGCGCGATGATCCCGGCGCCCAATGTCA
+GGGCCGTCAGCGCCGGCCGCCAGCCGAGCGCAAAGCCGATGGCGCCCAAGATGATGGCCTGCAAGAACAC
+CACGGCAACCACTGCCAGCGACTTGCCGGCGATGATCCCCCAAACCGGCAGCGGGGTAGCACCGAGTCGT
+TTGAGGGCGCCGTAGCGGCGATCGAACGCGACCGCGATGGCTTGCCCGGTGAATGCGGTGGAGATCACCG
+CAAGCGCCATGATGACCGGAACAAAGGTGGCGGCGCGGTTGTGGCCGAACGAGCCCATCGGCAGCAAAGT
+CAGCCCGACCAGCAGGGTGATCGGGATGAACATGGTCAACAGCAGTTGCTCGCCGTTGCGTAACAGCAGC
+TTCAATTCCAGGCTGAACTGTGCGGCAAGCATCAGGGGGACGGCGTTGGGGCGGGGGTCCGGGCTGAAGG
+TGCCCGCGGGAAAAGCGGGGCGATTGGTTTGGGTCACTGCCGCAACTTCCTGCCGGTGAGATCCAGGAAC
+ACGTCTTCGAGGCTGCGTTGCTCGACCCGCATGTCGGTGGCTAGCACGTCGATTTGTGCGCACCACGCGG
+TGACCGTCGCCAGCACCTGCGGGTCAACCGGACCTTCGACCAGGTACTCGCCCGGGGTCAGCTCGGTGGC
+CTGGTAGCCCTCGGGCAGTGCCGAGGCCAGCAGCGACAGGTCGAGCCGCGGCGGCGCGGTGAACCGCAAC
+TGGTCTTTGGCGCCGCTGCGCATCAGTTCTGCCGGTGTGCCTGCGGCCACCGTCACCCCGTGGTCGATGA
+TCACCAACCGATCGGCGAGTTCCTCGGCCTCCTTGAGATGATGCGTGGTCAGCACCACGGTCACGCCATC
+GCGGCGCAGCGCGTCGATCAACTCCCACACCAGTACCCGGGCATGGGCATCCATGCCCGCGGTGGGCTCG
+TCGAGGAACACCAGTTGGGGACGCCCGACCAGCGCGCAGGCCAGCGCGAGTCGTTGCTGCTGCCCGCCGG
+AGAGCCGTCGATAGGTGGTGCGGGCGGCCTCGGTGAGACCCAAGGTGTCCAGTAGCCAGTGCGGGTCCAG
+CGGGTTGGCGGCGTAGGACGCGACCAGATCCAGCATTTCGCCGGCGCGTGCCGCCGGGTAGCCGCCGCCA
+CCCTGCAACATCACGCCGATGCGTGCGCGCAGGCGTGCGTTGTCGGTGATCGGGTCCAGTCCAAGTACCT
+CAATGCTGCCGGCGTCCGGGCGGACGAAGCCCTCGCACATCTCGACGGTCGTGGTCTTGCCCGCGCCGTT
+GGGGCCCAGCAGCGCCATCACTTCGGCGTCATGCACGTCGAGATCGAGGTTGGAAACGGCGGTTATTGAC
+CCGTATCGCTTACATACCCCGCGAAGCCGCAGTACCACCTCGGGGGTGTCTGGGGCGCGGTTCACGAGCG
+CCGCTCCTCCTCATCGCTTCGCTCTGCATCGTCGTCGGCGCGGTTCACGAGCGCCGCTCCTCCTCATCGC
+TTCGCTCTGCATCGTCGTCGGCGCGGCTCACGTGGAATCAGCGTAGGCGTCGGGCGCTGCCGTCGGCCGG
+CGGGTCGCAGGGGTCTTGCTGGCCGACTCCGCGGCGGTGACCACTTGCTCGGCTGCAAGTGGCCGCCATG
+GTAACCGGGTGTAGGTCAGGGCAATCAGGAGGATCACGATGATGGCGCTGGCCGCGGTCGCATCCACGAT
+CTGAAACAGCGCGAAGCGGTCACCATTGGCGGTCGGACCGAAAATTCCGACGATGAGGGTGGCCAGGATT
+GCCGCTACCCGAAATCCCGGGCGGGTTGCCCAGGCGGCCAGCGGAATTATCGCCCACAGCAGGTACCAGG
+GCTGCACGACGGGAAACAGCAGCACGGTGACAGCTAGCGCAACGCCCAGGCCGCCGATCGGGTGCAGCCG
+GCCGCGGAGCACGGCCAATAACAGCCAGCACACCATCACCGTGATGATCAGCACGCCGATGGCGCGGGTG
+AGTGACAACACGGCGGTGGTGTGATCACCCAGGCCCAGCAGGATGCCGACGTGCCCGGTGCCCAGGGCCA
+GCAGTGTCGGCGGCGACATCCAGCTGCGCACCACATTGGCGGTGCCCAGCGTGTTGATCCAGCCGAATCC
+GAGACCGCTGGCCCAACCCAGGATGGCCATTATCGCCAGCGTTAGACTCGCCATCACAGCGGCGGCGAGC
+AGCAGTGCTCGCAAGTTGCCACCCCAGCGGTATGCCAGCACTGTCGTGACGAAGCCCATCGCCAGCAGCG
+AGGGTAGCTTCACTTGCGACGACAGCGTGATCAGGATGGAACCCGCCAGCAGCATGGCCAGGGGCCCCCA
+TTCCGGACGGGGTTTGACTGCCCGGCTCGCGCCCGCACGCGGGGATGCCCCCAGCTCGGGCCGCCGGCTG
+GCCCGTATTGTGGCGGGGCCCAACCGCCAGGTTTCGGGCGACGGGCGTGGGGTATTCGCCATATCAAGGC
+CGCGCAGCGCGAATTCGACGCCGGTCAGCATCAGCCCGAGCATCAGCGCTTCGTTGTGGATGCCGGCGAC
+CAAATGCATGATCAGCAGCGGATTGGCCGCGCCTAGCCACAGCGCGCTGACCTCGGCGACGCCACAGCGC
+TGAGCTAGCCGAGGGGTCGCCCACACGATCAGGGTCACACCGATCAACACCACAAGCCGGTGGCAGAGCA
+CGGCAGCGACGATGTTTTCCCCAGTCAGCGACGAGATTCCGCGGCCGATCCACAAGAACAGCGGACCATA
+TGGCGCCGGTGTCTCCCGCCACAGGCTGGGCACCGACAGGGTGAACACGTGGCCGAGGCCCAAGCCGGAC
+GCCGGACCCACCCGGTAAGGGTCGAGTCCGTCCCTGCCGATCTCACTTTGGGCTAGATATGAGTAGACAT
+CCTTGCTGTACATCGGTGGTGCGATCAATAGCGGCAGCATCCAGAGCAGCAGGGTGCGGTCCAGTTCGCC
+GCGCGACATCCGCCGCCTGCCCAGCGTGAACCGGCCGAGCATCAGCCAGGCCAGCGCCATCATGACCGCC
+CCGGTCGTGGTCATGGTCAACGACACCGTTTGGATTCGTGACGGCAGATTGAGCAGCCGGACCCCGAAGG
+TGGGGTCCTGGACGACGGGTCGGGCCCCGGCGCCCAGGGCGCCGATGGCCATCAGGACGGTGCCGGTGGC
+CCCAAACAGGCGGGTGCGCGCCAGCGCGGTGAGCTCGGTAGTGGTCAGCGGTGCACCCACCGCCTGCTCG
+TCGCCATGCAGGCTGGCGATCGACCAGCTCAGCGTATGGTGGCGGGCTGCCATTGGTGCAGCCTAACGGC
+ATGCCCGGGAATTGCTTAGGCGATCTCAATGTGACCAGCACAACCCTGCCGCATAGGGCATCCCTGGTAG
+ACCGATCAACGGAATTTTGTCACACTGATGTTGTGAAAATCCCGGCGGTCTCTACCACTGTCCCCGCGGC
+AGTCTCGGACGGTCACACTCGTCGGGCCATTGTGCGCTTGCTGCTGGAATCCGGATCGATCACCGCCGGC
+GAGATCGGTGACCGGCTGGGCCTGTCGGCCGCCGGTGTGCGGCGTCATCTGGACGCGCTGATCGAGGCGG
+GTGACGCGGAAGCGTCGGCGGCCGCGCCGTGGCAGCAGGTGGGACGCGGGCGGCCCGCCAAGCGCTACCG
+GCTGACCGCGGCCGGCCGGGCCAAGCTCGACCACTCCTATGACGACCTGGCGTCGGCGGCCATGCGGCAG
+CTGCGGGAGATCGGCGGCGAGGAGGCGGTGCGGACGTTTGCCCGGCGCCGTATCGACGCCATCCTGGCCG
+ACGTCGCGCCGGCCGACGGTCCCGACGACGCCGCGCTCGAGGCGGCCGCCGAGCGGATCGCAACGGCGCT
+CAGCAAAGCCGGCTACGTCGCCACCACCACGCGGGTGGGCGGGCCGATTCACGGTGTGCAAATCTGCCAG
+CACCATTGCCCGGTATCCCATGTCGCCGAGGAATTCCCCGAATTGTGCGAAACCGAGCAGCAGGCCATGG
+CCGAGGTGCTCGGCACCCACGTCCAGCGGTTGGCGACCATCGTCAACGGAGACTGCGCCTGCACCACCCA
+CGTACCCCTGTCGCCGGCGCCCAGCCCGCGCCCACCCGCCACCAGCACCGAAGGAGTGTCCCGATGACAC
+TCACCCCAGAGGCCAGCAAGAGCGTTGCCCAGCCCCCGACCCAGGCTCCCCTGACCCAGGAAGAGGCGAT
+CGCGTCGCTGGGCCGGTACGGCTACGGCTGGGCGGACTCCGACGTCGCGGGCGCCAACGCGCAGCGCGGG
+CTTTCCGAGGCGGTGGTCCGCGACATCTCCGCGAAGAAGAACGAGCCCGATTGGATGCTGCAGTCGCGGC
+TGAAGGCGCTGCGCATTTTCGACCGCAAGCCCATTCCGAAGTGGGGCTCCAACCTCGATGGCATCGATTT
+CGACAACATCAAGTACTTCGTGCGCTCCACCGAGAAGCAGGCCGCGAGCTGGGATGATTTGCCAGAGGAC
+ATCCGCAACACCTACGACCGGTTGGGAATCCCGGAGGCCGAGAAGCAGAGATTAGTAGCTGGAGTAGCCG
+CACAATACGAAAGTGAAGTTGTATATCACCAGATCAGAGAGGATCTGGAGGCTCAAGGAGTCATATTTTT
+AGACACTGATACTGGTTTGCGAGAACACCCGGATATTTTCAAGGAATATTTCGGTACAGTAATCCCTGCC
+GGCGATAATAAGTTTTCTGCATTGAATACTGCAGTTTGGAGTGGTGGGTCCTTTATTTACGTCCCGCCCG
+GTGTTCACGTCGACATTCCGCTGCAGGCCTACTTCCGAATCAACACCGAGAACATGGGCCAGTTCGAGCG
+GACGCTGATCATCGCCGATGAGGGCTCTTACGTGCACTACGTAGAGGGCTGCCTGCCCGCCGGCGAGCTC
+ATCACGACCGCCGACGGCGATTTGCGGCCCATCGAGTCGATTCGCGTCGGTGACTTCGTCACCGGCCACG
+ACGGGCGGCCACACCGCGTCACCGCTGTACAGGTGCGTGACCTCGATGGCGAGCTGTTCACCTTCACACC
+GATGTCGCCTGCCAACGCATTCTCTGTCACCGCCGAGCACCCCCTTCTCGCTATTCCCCGCGACGAGGTG
+CGTGTTATGCGGAAGGAACGCAATGGGTGGAAGGCTGAAGTCAACAGCACCAAGCTGCGTAGCGCCGAGC
+CGCGATGGATCGCGGCGAAGGATGTGGCCGAGGGTGACTTCCTGATCTACCCCAAGCCGAAGCCGATCCC
+CCACAGGACGGTTTTGCCGCTCGAGTTTGCGCGCCTGGCGGGCTACTACCTGGCGGAGGGTCACGCGTGT
+CTCACCAATGGCTGTGAGTCGCTGATCTTCTCGTTCCACAGCGATGAGTTCGAGTACGTCGAGGATGTGC
+GCCAAGCGTGCAAGTCGCTGTACGAGAAGTCGGGATCGGTATTGATCGAGGAGCACAAGCATTCGGCGCG
+CGTCACCGTGTACACGAAGGCGGGCTATGCGGCGATGCGCGACAACGTCGGCATTGGATCGTCGAATAAG
+AAGCTGTCGGATCTGTTGATGCGTCAAGACGAGACGTTCTTGCGTGAGCTGGTCGACGCCTATGTGAATG
+GAGACGGCAACGTCACGCGCCGTAACGGGGCGGTGTGGAAGCGGGTACATACGACATCGCGCCTCTGGGC
+GTTCCAGTTGCAGTCCATCCTGGCGCGTCTGGGTCACTACGCCACTGTTGAACTGCGCCGACCGGGCGGC
+CCTGGTGTGATCATGGGCCGCAACGTCGTTCGCAAGGACATCTACCAGGTGCAGTGGACCGAGGGCGGCC
+GCGGACCGAAGCAGGCCCGCGACTGCGGCGACTACTTTGCGGTGCCAATCAAGAAGCGAGCGGTCCGCGA
+AGCACATGAGCCCGTCTACAACCTCGATGTCGAGAATCCGGACAGCTACCTCGCCTACGGGTTCGCCGTG
+CACAACTGCACCGCACCGATCTACAAATCGGATTCATTGCACTCAGCGGTGGTCGAGATCATCGTGAAAC
+CCCATGCGCGCGTGCGTTACACCACCATCCAGAACTGGTCGAACAACGTCTACAACCTGGTCACCAAGCG
+GGCCCGCGCCGAAGCCGGGGCCACCATGGAGTGGATCGACGGCAACATCGGGTCCAAGGTGACCATGAAG
+TACCCGGCGGTCTGGATGACCGGCGAGCACGCCAAGGGCGAAGTGCTCTCGGTGGCGTTCGCCGGCGAAG
+ACCAGCACCAGGACACCGGCGCCAAGATGCTGCACCTGGCGCCGAACACGTCGAGCAACATCGTGTCCAA
+GTCGGTGGCCCGCGGCGGCGGCCGCACCTCCTACCGTGGCCTGGTGCAGGTCAACAAGGGGGCGCATGGG
+TCGCGGTCCAGCGTGAAATGCGATGCGCTGCTGGTGGATACGGTCAGCCGCAGCGACACCTACCCCTACG
+TCGACATCCGCGAGGACGACGTCACCATGGGCCACGAGGCCACCGTGTCCAAGGTCAGCGAGAACCAGCT
+GTTCTACCTGATGAGCCGCGGGCTGACCGAGGACGAGGCGATGGCGATGGTGGTGCGCGGCTTCGTCGAG
+CCGATCGCCAAGGAGCTGCCGATGGAGTACGCGCTGGAGCTCAACCGGCTGATCGAGCTGCAGATGGAGG
+GCGCGGTCGGATGACGGCTCCGGGACTGACAGCAGCCGTCGAGGGGATCGCACACAACAAGGGCGAGCTG
+TTCGCCTCCTTTGACGTGGACGCGTTCGAGGTTCCGCACGGCCGCGACGAGATCTGGCGGTTCACCCCGT
+TGCGGCGGCTGCGTGGCCTGCACGACGGCTCCGCGCGGGCCACCGGTAGCGCCACGATCACGGTCAGCGA
+GCGGCCGGGCGTATACACCCAGACCGTGCGCCGCGGCGATCCACGACTGGGCGAGGGCGGCGTACCCACC
+GACCGCGTTGCCGCCCAAGCGTTTTCGTCGTTCAACTCCGCGACTCTGGTCACCGTCGAGCGCGACACCC
+AGGTCGTCGAGCCGGTAGGCATCACCGTGACCGGGCCGGGGGAGGGCGCGGTGGCCTATGGGCACCTGCA
+GGTGCGTATCGAGGAGCTTGGCGAGGCGGTCGTGGTCATCGACCACCGGGGCGGCGGAACCTACGCCGAC
+AACGTCGAGTTCGTTGTCGACGACGCCGCTCGGCTGACCGCCGTGTGGATCGCCGACTGGGCCGACGACA
+CCGTTCACCTCAGCGCGCACCATGCTCGGATCGGCAAGGACGCGGTGCTGCGCCACGTCACCGTCATGTT
+GGGCGGCGACGTGGTGCGAATGTCGGCGGGCGTGCGGTTCTGCGGTGCGGGTGGGGACGCGGAACTGCTG
+GGGCTGTATTTCGCCGACGACGGCCAGCACCTGGAGTCGCGGCTGCTGGTGGACCACGCCCACCCCGACT
+GCAAGTCGAACGTGCTGTATAAGGGTGCACTGCAAGGTGATCCGGCGTCGTCGTTGCCCGACGCACACAC
+GGTCTGGGTGGGTGACGTGCTGATCCGTGCGCAGGCCACCGGCACCGACACCTTCGAGGTGAACCGGAAC
+CTGGTGCTCACCGACGGCGCGCGTGCCGACTCGGTGCCCAACCTGGAGATCGAGACCGGCGAGATCGTCG
+GCGCCGGACACGCCAGCGCCACCGGTCGCTTCGACGATGAGCAATTGTTCTACCTGCGTTCGCGCGGTAT
+TCCCGAAGCACAGGCCCGCCGGCTGGTGGTCCGCGGCTTCTTCGGTGAGATCATCGCCAAGATCGCGGTG
+CCCGAGGTACGCGAGCGCCTGACCGCAGCCATCGAACACGAGCTGGAAATCACGGAATCAACGGAAAAGA
+CAACAGTCTCATGACCATTTTGGAAATTAAGGACCTGCACGTCAGCGTGGAGAACCCCGCGGAGGCGGAC
+CACGAGATCCCGATCCTGCGCGGCGTCGACCTCACCGTGAAATCCGGTGAGACACATGCCTTGATGGGAC
+CCAACGGCTCGGGCAAGTCGACGCTGTCCTACGCCATCGCGGGCCATCCCAAATACCACGTGACGTCGGG
+CACCATTACCCTCGACGGCGCGGACGTGCTGGCGATGAGCATCGACGAACGTGCGCGGGCCGGCCTGTTT
+CTGGCCATGCAATATCCCGTCGAGGTGCCCGGTGTCTCGATGTCGAACTTCCTGCGCTCGGCGGCAACCG
+CCATTCGCGGCGAGCCGCCGAAACTGCGGCACTGGGTCAAAGAGGTCAAGGCCGCGATGGCCGCGCTCGA
+CATCGACCCGGCCTTCGCCGAGCGCAGCGTCAACGAGGGTTTCTCCGGTGGCGAGAAGAAGCGCCACGAG
+ATCCTGCAGCTAGAACTGCTCAAGCCCAAGATCGCCATCCTGGACGAGACCGACTCCGGCCTGGACGTCG
+ACGCGCTGCGCGTGGTCAGCGAGGGGGTGAACCGCTACGCCGAATCCCAGCACGGCGGCATCCTGCTGAT
+CACGCACTACACCCGCATCCTGCGCTACATCCACCCGGAATACGTGCACGTGTTCGTCGGCGGCCGCATC
+GTCGAGTCCGGTGGTTCGGAGCTCGCCGACGAACTCGACCAGAACGGCTACGTGCGTTTCTCCCCCGCAA
+GCGGGCGGTACCCCCACCAACCCGCGCCAACCGGAGCCTGACATGACGGCCTCGGTGAACTCGCTCGATC
+TGGCGGCGATTCGCGCCGATTTCCCCATCCTCAAGCGCATCATGCGGGGTGGAAACCCGTTGGCGTATTT
+GGACTCCGGCGCCACCTCACAACGCCCGCTGCAGGTCCTCGACGCCGAGCGCGAGTTCCTGACCGCGTCC
+AACGGCGCGGTCCATCGTGGCGCGCACCAGCTGATGGAGGAGGCGACCGACGCCTACGAGCAGGGCCGCG
+CGGACATCGCGTTATTCGTCGGCGCCGACACGGACGAGCTGGTGTTCACCAAAAATGCCACCGAGGCGCT
+CAACCTGGTGTCATATGTGCTGGGGGACAGCCGTTTCGAGCGTGCCGTCGGCCCCGGCGACGTGATCGTC
+ACCACCGAGCTGGAGCATCACGCCAACCTGATCCCGTGGCAGGAGCTGGCCCGGCGCACCGGGGCCACAT
+TGCGCTGGTACGGGGTGACTGACGACGGGCGCATCGACCTGGACTCGCTGTATCTGGACGACCGTGTCAA
+AGTCGTTGCGTTCACCCATCATTCCAATGTGACCGGGGTGCTGACACCGGTGAGCGAGCTGGTCTCCCGC
+GCCCACCAGTCGGGTGCGCTGACCGTGCTGGACGCCTGCCAGTCGGTGCCGCACCAGCCGGTTGACCTGC
+ACGAACTCGGCGTCGACTTCGCCGCGTTTTCCGGACATAAAATGCTGGGCCCCAACGGAATCGGTGTGCT
+GTACGGCCGCCGTGAGCTGCTAGCGCAGATGCCCCCATTTCTCACCGGCGGTTCGATGATCGAAACGGTG
+ACCATGGAAGGCGCCACCTACGCGCCGGCGCCGCAACGGTTCGAGGCCGGTACCCCGATGACCTCCCAGG
+TGGTCGGGTTGGCCGCCGCGGCCCGCTATCTCGGCGCGATCGGCATGGCCGCGGTGGAGGCCCACGAGCG
+GGAGCTGGTAGCCGCGGCCATCGAAGGCCTGTCCGGCATCGACGGTGTGCGGATCCTTGGCCCGACGTCG
+ATGCGGGACCGAGGGTCGCCGGTGGCGTTCGTCGTCGAGGGCGTGCACGCGCACGACGTGGGTCAGGTAC
+TCGACGACGGCGGCGTGGCGGTGCGGGTCGGGCACCACTGCGCGCTGCCGCTGCACCGCAGGTTCGGTCT
+GGCCGCCACCGCGCGGGCGTCGTTCGCGGTGTACAACACCGCAGACGAGGTGGACCGCTTGGTGGCCGGC
+GTGCGGCGATCCCGGCATTTCTTTGGAAGAGCGTGACGTTGCGTCTGGAGCAGATCTATCAGGACGTGAT
+CCTCGATCACTACAAGCATCCGCAGCATCGGGGGCTGCGGGAGCCGTTCGGCGCCCAGGTGTATCACGTG
+AACCCGATCTGCGGCGACGAGGTCACGCTGCGGGTCGCGTTGTCCGAGGACGGCACCAGGGTCACCGACG
+TTTCCTATGACGGACAAGGCTGTTCGATCAGCCAGGCCGCGACCTCGGTGCTCACCGAACAGGTAATCGG
+ACAACGCGTGCCGCGGGCGCTGAACATCGTCGACGCCTTCACCGAAATGGTGTCCTCCCGCGGGACCGTG
+CCAGGCGACGAGGACGTCTTAGGCGATGGGGTCGCGTTCGCCGGGGTGGCCAAATACCCGGCCCGGGTGA
+AATGCGCGCTGCTCGGATGGATGGCGTTCAAAGATGCGCTGGCCCAAGCCAGCGAAGCCTTCGAGGAGGT
+TACAGATGAGCGAAACCAGCGCACCGGCTGAGGAATTGCTCGCCGACGTCGAGGAGGCGATGCGCGACGT
+CGTCGACCCGGAGCTGGGGATCAACGTCGTTGACCTGGGCCTGGTCTACGGCTTGGACGTGCAAGACGGT
+GACGAAGGGACCGTCGCGCTGATCGACATGACCCTCACGTCGGCGGCGTGCCCGCTGACCGATGTCATCG
+AGGATCAGTCGCGCAGCGCGCTGGTCGGCAGTGGCCTGGTCGACGACATCCGCATCAACTGGGTGTGGAA
+CCCGCCGTGGGGCCCGGACAAGATCACCGAAGACGGCCGCGAACAATTGCGGGCGCTCGGCTTCACCGTC
+TGAACCGGCGCGTCGCCGAACGTGAACTGAGGGCGGAGAATCCGGCAAAATACCGCCGTGAGTTCACGTT
+CGGCGGGCGGTGCGAGCGAAACCCGCCTCAGAAGGCGTCTTCGGGCACGCGCATGATGTCGTCGTCGATG
+TTTTCGATGACACTGCGCACCCCGGTCAGTTTCGGCAGCATGTTCTTCGCAAAGAACGCCGCGACCGCGA
+TCTTGCCCCGATAGAACGCTTCATCGTTCTGCGATGGCCCGTCGGCCAGTGCGGCGTGTGCGACCCCGGC
+CAGCACGAGCAGCCGCCAGCCGATGAGCAAGTCGCCCACGGCGAGCAAATAGCGCACGGATCCGAGCCCC
+ACCTTGTAGATGTCGCTGGAGTGCTGCGCGGCGGACATCAGGTACCCGGTCAGCGCGCCCGTCATTGCCG
+TGATGTCGTCGAGCGCGGTGCGCAGCAGCTCGGCTTGCGGTTTTAGCGACGGGTCAATGTTCTCGACGGT
+GTGGGTGACCTGAGCCAGCACAAATTGCAAAGCCTTGCCGTGATCGCGCACGATCTTGCGGAAGAAGAAG
+TCCAGTGCCTGGATCGCCGTGGTGCCCTCGTAGAGGGAATCGATCTTGGCGTCACGGATGTACTGCTCGA
+GGGGATAGTCGACCAGAAAGCCCGAGCCGCCCAGCGTCTGCAGCGACTCGGTGAGGATTTCGTAGGCGCG
+TTCTGAACCCACGCCCTTGACGATGGGCAGCAGCAGATCGTCCACGCGGTGCGCCATGTCGTGATCGGCA
+CCCGAAACCCGTTGGGCCACAGCGTCGTCCTGGTGAGCAGCGGCATACAGGTACAGCGCCCGCAGGCCTT
+CGGCATAGGCCTTTTGGGTCATCAGGCTGCGCCGCACGTCGGGGTGGTGCATGATTGTGACCCGCGGCGC
+CGTCTTATCCGTCATCTGGGTCAGATCCGCGCCCTGCACCCGCTCCTTGGCGAAGGCGAGTGCGTTGAGA
+TAGCCCGTCGACAATGTGCCGGCGGACTTAACTCCGATGGTCATGCGAGCATGCTCAATCACCGTGAACA
+TCTGCGCAATCCCGTTGTGCACGCCGCCGACCAGATAGCCAACGGCGGGCACGTCGGCACCGCCGAACGT
+CAATTCGCATGTCGGAGAGGACTTTAAGCCCATCTTGTGTTCCAGGCCGGTCACGTAGACGCCGTTGCGG
+GCGCCGAGCTCGAACGTATCGGGGTCGAAGAGGTAGTTGGGAACGTAGAACAGGCTCAACCCCTTGGTGC
+CTGGGCCGGCGCCCTCAGGTCGGGCCAACACCAAATGGAAGATGTTCTCCGCGGTATTGCCGACATCCCC
+ACCGGAGATGAACCGCTTGACGCCCTCGATGTGCCAGGTGCCGTCGGGTTGTTCGAACGCTTTGGTTCGA
+CCCGCGCCGACATCGGAACCGGCGTCGGGCTCGGTGAGCACCATGGTGGCCTGCCAGCCGCGCTGCACGC
+CCTCGGCCGCCCACCTGCGTTGCTCATCATTGCCCTCGATGTAAAGGGACTGGGCCAGCACCGGGCCCAG
+GTTGAAAAAGCACGCCGACGGGTTGGCGCAGTAGATCATTTCGTTGACGGCCCATGCCAGCGGCGGCGGC
+GCTGGCATGCCACCGATCTCCTCGGCCAGGCCCAGCCGCCACCAGCCGGCCTCCTTGATTGCCTGCACTG
+TCTTGGCCAACTCGTCGGGCACGCTGATGGAGTGGGTGTTCGGGTCGAAGACCGGTGGGTTGCGGTCGGC
+GTAGCCGAAGGATTCGGCGATCGGACCCTCGGCCAGCCGCGCCGCTTCGGCCAAGATGGTGCGGACCGTG
+TCGACGTCCAGATCGCTGTAGCGTCCGGTGCCCAGGACCGCGCCGATATCAAGGACTTCGAGCAGGTTGA
+ACTCGAGATCGCGGACATTGGCGATGTAGTGTCCCAATGCGGTTCCCTTCAGGTGGCTGATCGGCCCTGA
+TCGGGCCCAGTCTCTCCGAGCGGGAAGAACGTACGCAACCGTAACCTGCGGTGGGAGGGCGGAACTGCGG
+CGACTATGTTCCGTTCGCGCCGGGCAGGCCGAGCAGCAGCCCGCCCCTGCCGCCGAGCCCGGGGGCGCCG
+GCCCCGCCGCCGTCGCCGCCGTCACCGCCGTTACCGATCAGCTGGGCGTTGCCACCGTTGCCGCCGTTGC
+CGCCCAACGCGCCGCCATCGCCGCCTTCCCCGCCGTTGCCGAACAACCCGGCCTGGCCGCCGGCCCCGCC
+GTGGGCGCTCGATGCCCCCCCGGCTCCGCTGCCGCCGGCGCCGCCGTTGCCATAGAAGAACCCGGCATCG
+CCGCCACGCCCAGCGCTACCCGCGGATAGGGCTGCCCCGCCGGCACCACCGTCGCCGAACAGGAAGGCCC
+TGCCGCCGGCGCCACCTCCGCCGAGGAAGCTGCTGGCGCCAGCACCGCCGTTGCCAAAAAACAGCCCGCC
+GTTGCCTCCAGAGCCACCGGCTCCCATGCCGTTGGGGCTGATGCCACCCGCGCCGCCGGCCCCGAAGAGC
+ACGGCGGAGCCGCCGATGCCGCCGGCACCGCCGCCACCGCCGCTATTGCCGCCGGCCCCGCCGTTGCCGA
+ACAGCCACCCGCCGGTGCCGCCGGCGCCGCCGTTGGCGCCCAGGGCGCCCACGCCGCCGTTGCCGCCGTG
+GCCCAGCAGTCCGGCGGCGCCGCCGTTGCCGCCGGGGCCGGCAGCGGGCGAGAAGCCGTTGCCGCCATTG
+CCGATCAGGAGTCCGCCGGCCTGGCCGTTGGGGTTCGCCGCGGTCCCATCGGCGCCGTTGCCGATCAGCG
+GACGGTTCAACAGCGCCAGGGTGGGCGCGTTGATGACGTCGAATAGCGGCTGCAAGGGGCCAAAGTTGGT
+GGCCTCCGCGGCGGCGTACGCCTGCGCGCCGCCGGACAGGGCTTGCACGAACTGGCTGTGAAACGCCGCG
+GCTTGGGCGCTGAGCACCTGATAGGTCTGGCCGTGCGCGCCGAACAACGCCGCGACCGCCGCCGACACCT
+CATCGGCGCCTGCGGCCGCGACAGCGGTCGTCTGGGCCGCCGCGGCCGAGTTGGCCGCGCTAATCATCGA
+ACCGAGGCGCGCGAGATTCCCCGCCGCTCCCGACACGAACTCCGTATTCGCGACCACGAACGACATCTGG
+CACCTCCGCAATGAAGAGCTAGCGACCGACGTATCTTATCGCGATCCAGCGGCCGCTTCACCCGTTTCGG
+GGTAACGCACCCCGCCAGAATGGTTAATCCGTTAGTGGCCCCGCTTGCCTTGTGCCAGTGACCAATTCAA
+TCGCATACCGCAATGCAATCGAGATTTTTGGTCGTTCCTGCGTCCCTACACTCGGTTCATCCTGACGAAT
+TCGCACCCCTGTCGTGAGGCCGCCGGAATGACCTTGACCGCTTGTGAAGTAACTGCCGCGGAGGCTCCTT
+TCGACCGCGTTTCAAAGACCATTCCCCACCCATTGAGCTGGGGAGCCGCGCTGTGGTCGGTAGTCTCCGT
+GCGCTGGGCCACCGTGGCGCTGCTGCTGTTTCTCGCCGGACTAGTGGCGCAACTGAACGGTGCTCCCGAG
+GCCATGTGGTGGACGCTTTACCTGGCCTGTTATCTGGCCGGCGGCTGGGGCTCGGCATGGGCGGGCGCAC
+AAGCGTTGCGGAACAAGGCACTTGATGTGGATCTGCTGATGATTGCCGCGGCGGTCGGAGCGGTCGCGAT
+TGGGCAGATCTTCGACGGCGCGCTGCTGATCGTGATCTTCGCCACGTCCGGTGCGCTGGATGACATTGCC
+ACCAGACACACCGCGGAATCGGTCAAAGGCCTGCTGGACCTCGCGCCGGATCAGGCGGTGGTGGTCCAGG
+GCGACGGCAGCGAACGGGTGGTGGCGGCCAGCGAGCTGGTGGTGGGGGACCGGGTGGTGGTGCGGCCGGG
+GGACCGGATACCCGCAGACGGTGCGGTGCTGTCGGGGGCTAGCGACGTCGACCAACGCTCGATCACCGGT
+GAATCGATGCCGGTGGCCAAGGCCCGCGGTGACGAGGTGTTCGCCGGCACCGTGAACGGATCGGGTGTAT
+TGCATCTGGTGGTCACCCGTGACCCGAGCCAGACCGTGGTAGCCCGCATCGTCGAACTGGTCGCCGACGC
+TTCGGCGACGAAGGCCAAAACCCAACTGTTCATTGAGAAAATCGAGCAACGCTACTCCCTGGGCATGGTC
+GCGGCCACCCTTGCCCTCATCGTTATTCCGCTGATGTTCGGCGCCGACCTGCGGCCGGTGCTGCTGCGCG
+CCATGACCTTCATGATCGTGGCATCGCCATGCGCGGTGGTGCTGGCCACCATGCCGCCGCTGCTTTCGGC
+GATCGCCAACGCAGGCCGTCATGGGGTGCTGGTCAAATCCGCGGTGGTCGTCGAACGCCTGGCCGATACC
+AGCATCGTCGCTTTGGACAAGACCGGTACGCTGACCCGTGGCATCCCGCGACTGGCTTCCGTCGCACCGC
+TGGACCCCAACGTGGTCGATGCCCGGCGATTGTTGCAATTGGCAGCTGCCGCAGAACAATCCAGCGAGCA
+CCCGCTTGGCCGGGCGATCGTCGCGGAAGCTCGTCGGCGTGGTATCGCCATACCGCCCGCCAAGGACTTC
+CGCGCGGTCCCGGGCTGCGGGGTCCACGCCCTGGTGGGCAACGATTTCGTCGAGATCGCCAGCCCGCAAA
+GCTACCGCGGTGCACCGCTAGCAGAGCTGGCGCCGCTCCTTTCTGCCGGCGCCACTGCCGCCATCGTCTT
+GTTGGATGGAGTTGCCATCGGTGTGCTCGGGCTCACCGATCAGCTTCGTCCGGATGCCGTGGAGTCCGTC
+GCGGCGATGGCTGCATTGACCGCCGCACCACCGGTGCTGCTCACGGGTGACAACGGGCGAGCGGCTTGGC
+GGGTCGCTCGGAACGCCGGGATCACCGATGTGCGAGCCGCATTGCTGCCCGAGCAGAAGGTTGAAGTCGT
+GCGCAACCTGCAGGCCGGTGGTCACCAGGTGCTGCTCGTCGGCGACGGCGTCAACGACGCTCCCGCCATG
+GCCGCCGCCCGCGCCGCTGTCGCCATGGGCGCCGGCGCCGATCTGACCCTACAGACCGCAGACGGGGTGA
+CCATACGGGACGAACTGCACACCATCCCGACGATCATCGGGTTGGCACGGCAGGCGCGCCGGGTGGTCAC
+CGTCAACCTGGCCATCGCGGCCACCTTCATCGCCGTCCTGGTGCTGTGGGACCTTTTTGGGCAGCTGCCG
+CTGCCACTGGGTGTGGTGGGTCACGAAGGGTCCACTGTGCTGGTGGCCCTCAACGGCATGCGGCTATTGA
+CCAACCGGTCGTGGCGGGCCGCGGCTTCGGCTGCGCGTTAGGCTCGATGTCGCAGAACTGACCAGGGCTG
+CGTTAGGGGTGCCCGTGACCACTCGAGACCTCACGGCGGCGTATTTCCAACAGACCATCTCCGCCAACAG
+CAACGTGCTTGTGTACTTTTGGGCACCGCTGTGCGCCCCGTGCGACCTGTTCACACCGACCTACGAGGCG
+TCGTCGCGGAAACACTTTGACGTCGTGCATGGCAAAGTCAACATCGAAACCGAGAAAGATCTGGCCTCGA
+TCGCCGGGGTCAAGTTGTTGCCCACGCTGATGGCCTTCAAGAAAGGCAAGCTGGTCTTCAAACAAGCCGG
+CATCGCCAATCCCGCGATCATGGACAATCTGGTGCAACAACTCCGGGCATACACCTTCAAGTCCCCGGCC
+GGCGAAGGTATCGGCCCTGGAACAAAGACTTCATCCTGAGGCGTTGAGGCAGGCGTGACTACCCGAGACC
+TCACTGCCGCACAGTTCAACGAAACCATCCAAAGCAGCGACATGGTGCTCGTCGATTATTGGGCCTCCTG
+GTGCGGCCCGTGCCGCGCGTTCGCGCCGACCTTTGCCGAGTCGTCGGAAAAACACCCCGACGTGGTGCAC
+GCCAAGGTCGACACCGAAGCCGAACGAGAGCTTGCAGCGGCCGCTCAGATCCGATCCATCCCCACGATCA
+TGGCCTTCAAGAACGGCAAGTTGTTGTTCAACCAGGCCGGCGCGCTGCCGCCGGCAGCATTGGAGAGCCT
+GGTGCAGCAGCTCAAGGCCTACGAGGTGGAGGCCGGCGAAGCCACCACCCAGAACGGGCGAGCCCAACAA
+GCCTGACCGGGCGCCAGGCGCCCGGCTGTGCCCCACCGCTGCGCGGCGCAAGTCGTCGCCGGGTACCGTT
+CAACGGTGAGTTTGGTCCTCGTCGAACACCCGCGGCCCGAGATCGCGCAGATTACCCTCAACCGGCCGGA
+GCGGATGAACTCCATGGCATTCGATGTCATGGTGCCGCTCAAAGAGGCCTTAGCGCAGGTCAGCTACGAC
+AACTCGGTGCGGGTGGTGGTGCTGACCGGCGCGGGTCGAGGGTTTTCTTCGGGTGCGGATCACAAGTCGG
+CGGGGGTGGTGCCGCACGTCGAGAACTTGACTCGGCCCACCTACGCGCTGCGTTCGATGGAGCTCCTCGA
+TGACGTCATCTTAATGCTGCGACGGCTGCACCAGCCGGTGATCGCCGCGGTCAACGGCCCCGCCATCGGT
+GGTGGGCTGTGCCTGGCACTGGCTGCAGACATTCGGGTGGCCTCGAGTAGCGCCTACTTCCGGGCCGCCG
+GTATCAACAACGGGCTGACCGCCAGCGAATTGGGGCTGAGCTACCTGTTGCCCAGGGCCATTGGATCCTC
+ACGTGCGTTCGAGATCATGTTGACCGGTCGCGACGTCAGCGCCGAGGAAGCCGAGAGGATCGGGCTGGTA
+TCCCGTCAGGTACCCGATGAACAGCTGCTAGATGCCTGCTACGCGATCGCCGCACGGATGGCGGGATTCT
+CGCGGCCGGGAATTGAGTTGACCAAACGTACGCTGTGGAGTGGACTGGACGCCGCCAGTCTGGAGGCGCA
+CATGCAGGCCGAGGGCTTGGGGCAGCTCTTCGTCCGGCTGCTCACCGCCAACTTCGAAGAAGCGGTTGCC
+GCACGGGCCGAGCAGCGGGCGCCGGTGTTCACCGATGACACGTAACAGCGCCCAAGACAACCGACGACCA
+GGGAGCTTATGTGATCACAGCTACGGACCTCGAGGTCCGCGCTGGCGCGCGCATCCTGCTCGCACCCGAC
+GGCCCCGACCTGCGTGTGCAGCCCGGCGATCGTATCGGGCTGGTCGGACGTAACGGTGCCGGCAAGACCA
+CCACGCTGCGCATTCTGGCGGGGGAGGTCGAACCCTATGCCGGGTCGGTTACCCGTGCCGGCGAAATCGG
+CTACCTGCCACAGGATCCCAAAGTTGGCGATCTCGACGTGCTGGCCCGTGACCGGGTGCTGTCCGCCCGC
+GGACTGGACGTCCTGCTCACTGATCTGGAGAAGCAGCAGGCGTTGATGGCCGAGGTCGCCGACGAGGACG
+AGCGTGACCGCGCCATCCGCCGTTACGGTCAGCTCGAGGAGCGATTCGTCGCGCTGGGCGGCTATGGCGC
+CGAAAGCGAAGCCGGCCGCATCTGCGCCAGCCTAGGCTTGCCCGAGCGGGTGCTGACCCAGCGGCTGCGT
+ACCCTTTCCGGAGGTCAGCGCCGCCGGGTGGAACTAGCCCGCATTTTGTTCGCCGCGTCCGAGAGTGGCG
+CTGGAAATTCCACCACCTTGTTGCTCGACGAGCCGACTAACCACCTCGACGCTGATTCGCTGGGCTGGCT
+GCGGGACTTCCTGCGCTTGCATACGGGCGGGCTGGTGGTCATCAGCCACAACGTGGACCTGGTGGCCGAT
+GTCGTCAATAAAGTGTGGTTCCTGGATGCCGTGCGCGGCCAGGTCGATGTTTACAACATGGGCTGGCAGC
+GCTACGTCGACGCTCGGGCCACCGACGAGCAACGTCGCATCCGGGAACGCGCTAACGCCGAACGCAAGGC
+GGCCGCGCTGCGTGCACAGGCCGCCAAGTTGGGCGCCAAGGCCACCAAAGCCGTTGCGGCCCAGAACATG
+TTGCGCCGCGCCGATCGGATGATGGCCGCACTCGACGAGGAGCGAGTCGCCGACAAGGTGGCCCGGATCA
+AGTTCCCCACCCCGGCGGCGTGTGGACGCACACCGCTGGTGGCCAACGGTCTGGGCAAGACGTATGGCTC
+GCTGGAAGTCTTCACCGGTGTCGACTTGGCCATCGACCGCGGCTCGCGGGTGGTCATACTCGGACTCAAC
+GGTGCCGGCAAGACCACGCTGCTGCGATTGCTGGCCGGTGTCGAGCAGCCCGACACCGGAGTGCTGGAAC
+CCGGATACGGTTTACGGATCGGCTATTTCGCGCAAGAGCACGACACGCTCGACAACGATGCCACCGTTTG
+GGAGAACGTCCGGCACGCGGCACCGGATGCCGGCGAACAGGACCTGCGCGGCCTGCTGGGTGCGTTCATG
+TTCACCGGTCCGCAGCTCGAGCAGCCGGCCGGCACGCTCTCCGGCGGTGAGAAGACCCGGCTCGCGCTGG
+CCGGCTTGGTGGCCTCCACCGCGAATGTGCTGCTGCTCGATGAACCGACCAACAATCTCGATCCGGCCTC
+GCGCGAGCAGGTGCTCGACGCGCTGCGCAGCTACCGAGGTGCGGTGGTGCTGGTGACGCATGATCCCGGG
+GCGGCCGCGGCGCTCGGTCCCCAACGGGTGGTGCTGTTGCCCGACGGCACCGAGGACTACTGGTCCGACG
+AGTATCGAGATCTCATCGAGCTGGCCTGACCTAGATGCGGCTGCCGCGTAACGATTTCGGCCAAAGCACC
+ACCGGGGCGGCGGCGGGTTCTTAGGCTAGGTGCCTGGGATCGACGGAGGGTACCGATGCGGAAGTCAAAG
+AAGACGCGCGATCAGCTGCTGCGCGAGTTGCGCAACGCCTACGAGGGCGGGGCCAGTATCCGCAACCTGG
+CGGCCACCACCGGCCGGTCGTACGGATCTATTCACAGCATGCTGCGCGAGTCAGGCACCACGATGCGCGG
+CCGCGGCGGCCCCAATCGCCGTCCCCGGCCGCGTTGATCCGCCGATTGTGAATCTGACGACGCGACAGCG
+GCGTGTCGCGTCGTCAGATTCACAGTCAGCGCATGTCAAGACCGACGCACCGAGTTCTCCACCAGGTCGA
+GGACGGCGGCTAGCCGCTGCGGGTCTTCGCCGGAGGCCAGCCGCGCCAGCAATCCGTCGAGCACCAGGTC
+CAGGTAGCACCGCAAAACGTCGCTAGGCACATCGTCACGCACTCGGTTAGCCTGCTTTTGCCGGCGCAGC
+CGATCGGTGGTCGCCGCCGCCAATTCCGCGGAGCGCTCCGCCCAGCCGCGGCTGAAGTCAGGGTCGTTGC
+GCAGCTTGCGTGCGATCTCCAACCTGGTGGCCAGCCAGTCGAACTGGTCGGGCGCGGCAAGCATGTCGCG
+CATCACACCGATGAGGCCTTCGCGGGATGCTACAGCCGCCATTCGCTCGGTATCCTCGCGCGCCAGCGCG
+AAAAACAGCGCGTCCTTGTCGCGGAAGTGGTGAAAGATCGCACCGCGCGACATCCCGATTGCCTGTTCCA
+GGCGCCGGACCGTGGCCTTGTCATAGCCGTATTCGGCAAAGCAACGGCGCGCACCGTCGAGGATCTGACG
+GCGGCGAGCCGCCAGATGGTCCTCGCTGACCTTGGGCACGGGCGCTCGGTCAGCCTGACTTCAGTATGTT
+GCGCAGCACGTACTGCAGGATGCCGCCGTTGCGGTAGTAGTCCGCCTCACCGGGGGTGTCGATGCGCACC
+ACGGCGTCGAACTCGATCGTGGCGCCGTCGCCCTTGGTGGCCTGGACGCACACCGTCTTGGGTGTCTTGC
+CGTCGTTAAGCACGTCGATACCGGTGATGTCGAAGACCTCGGTACCGTCGAGTCCCAACGACGACGCTGA
+CTTTCCTTCGGGGAACTGCAGCGGGATCACGCCCATGCCGATCAGGTTGGACCGGTGGATCCGCTCGAAT
+GACTCGGCGATCACCGCCCGCACGCCCAGTAGCAATGTGCCTTTGGCCGCCCAGTCCCGTGACGAACCCG
+ACCCGTACTCTTTGCCGCCGAACACAACCAGCGGAATGTGTTGCGCCGCATAGTTCTGCGCGGCGTCGTA
+GATGAACGCCTGCGGACCGCCCGGCTGGGTGAAGTCGCGGGTATAACCGCCGGACACGTCGTCTAGCAGT
+TGGTTACGCAGCCGGATGTTGGCGAAGGTGCCACGAATCATCACCTCGTGGTTGCCGCGGCGAGAACCGA
+AGGAGTTGTAGTCCTTGCGGTCGACACCGTGTTCGTCGAGGTAGCGCGCCGCGGGAGTTCCGGGCTTGAT
+GGCGCCGGCGGGGGAGATGTGGTCGGTGGTCACCGAATCACCGAGCAGCGCCAGCACCCGGGCACCGCTG
+ATGTTGCCGACCGGTTCGGGTTTGGCTGTCATCCCCTCGAAATACGGCGGCTTGCGCACGTAGGTCGAAT
+TCGGGTCCCACTCAAAGGTGTTGCCGCTCGGGGTTGGCAGGTTGCGCCAGCGGTCGTCGCCCTTGAACAC
+GTCGGCGTAGTTGCGGGTGAACATCTCCTGGTTGATCGCCGCGGCGATGGTGTCGGAGACATCCTGCTGC
+GATGGCCAGATATCGCGGAGAAAAACGTTCTTACCGTCTTTGTCTTGACCGAGCGGCTGGGTTTGGAAGT
+CGAAGTCCATGGTCCCGGCCAGCGCGTAGGCGATGACCAGCGGCGGCGATGCCAGGTAGTTCATCTTCAC
+GTCTGGGTTGATACGGCCCTCGAAGTTCCGGTTGCCGGACAGTACCGCGGTCACCGAAAGGTCGTTGTCG
+TTAACCGCTTTTGAGATTTCCTCGGGCAGCGGCCCGGAGTTGCCGATGCAGGTGGTGCAGCCGTAGCCGA
+CCAGATAGAAGCCGAGCTTCTCCAGATACGGCCACAGGCCGGATCTGTCGTAGTAGTCGTTGACCACTTG
+CGAGCCCGGGGCAATCGTGGTCTTCACCCACGGCTTCGAGGTCAGTCCCTTTTCGACGGCGTTGCGGGCC
+AGCAGCGCCGCGCCCAGCATTACTTCGGGGTTGGAGGTGTTGGTGCAGGACGTGATCGCGGCAATCACCA
+CCGCGCCGTGGTCGAGCACGAATTCGCCGAGTTCGTCCGACTTCACCCGCACTGGGTTGCTCACCCGGCC
+ATCGGCATGCGCGGCAGCCGAGTGCACGGTTTCGTCAGTGGCGACGTCGTCGTTGGCGAACGTCAGCTGC
+CCCGGGTCGCTGGCCGGGAATGTCTCCTCGACTACCTCGTCCAGCTTCGAGTGCGGGTCGTGGGGGGAAT
+CCGGGGAACCATTGCCGACATAGTGGTAAATCTGCTCGCGGAATGTTGATTTGGCTTGCGCCAACGCGAT
+TCGGTCCTGTGGACGCTTTGGTCCGGCGATCGACGGCACCACGTCGGATAGGTTGAGTTCGAGGTATTCC
+GAGAACTCCGGCTCGTGCTTGGGATCGTGCCACATGCCCTGCGCCTTGGCGTAGGCCTCGACCAGTGCGA
+CCTGCTCCGGCGTGCGACCGGTAAACCGCAGATACTTGATGGTTTCTTCGTCGATCGGGAAAATCGCTGC
+GGTGGAACCGAATTCGGGACTCATGTTGCCCAGGGTGGCGCGGTTGGCCAGCGGCACCTCGGCCACGCCC
+TCGCCGTAGAACTCGACGAATTTGCCGACGACGCCGTGCTGGCGCAGCATCTCGGTGACGGTCAACACCA
+CGTCGGTGGCGGTGACTCCCGGCTGGATCTCGCCGGTCAACCTGAAACCCACGACCCGCGGGATCAGCAT
+CGATACCGGCTGACCCAGCATCGCGGCCTCCGCCTCGATGCCGCCGACACCCCACCCGAGCACACCCAGG
+CCGTTGACCATGGTGGTGTGTGAGTCGGTGCCCACGCAGGTGTCGGGGTAGGCCACTCCGTCGCGAGTCA
+TCACCACGCTGGCCAGGTACTCGATATTGACCTGGTGCACGATGCCGGTGCCCGGCGGCACCACTTTGAA
+GTCGTCGAAAGCGCCTTGGCCCCAGCGCAGGAATTGGTAACGCTCACCGTTGCGCTGGTATTCGATTTCG
+ACGTTGCGCTCGAATGCGTCGGCGCGGCCGAACAAATCGGCGATCACCGAGTGGTCGATCACCAAGTCTG
+CGGGCGCCAGCGGGTTGACCTTGTCCGGGTTGCCGCCCAGATCGGCGATCGCCTCGCGCATGGTGGCCAA
+GTCGACGATGCACGGTACGCCGGTGAAGTCCTGCATCACCACCCGGGCGGGCGTGTACTGGATCTCGATG
+CTGGGCTCGGCCTTAGGGTCCCAGTTGGCGATGGCCTCGATGTGGTCCTTGGTGATGTTGCTGCCGTCCT
+CGTTGCGCAACAGGTTCTCGGCGAGCACTTTGAGGCTGTAGGGGAGTTTCGCGGTATTGGGGACGGCGTC
+GAGACGATAGATCTGGTAACTCTTTTCGCCGACCTTCAGGGTGTCGTGGGCTCCGAATGAGTTCACAGAT
+TTGCTAGTCACATCAACTCCCAGGGATTTGGTTCGCCCGCCGACGGGCCGTGTCGACGGCGTGGTGTCAG
+CCTAGCAGTACGCTTGTCCTGCTTTGTTGCCGTGTGGGTGCGCGCCGAAGTGCGAGCAGCGCGTAACGTG
+CCAGTAGCACGTCGGCAGGAAGGATGCGATGACCGGGCCATATTTTCCTCAGACGATCCCGTTCCTGCCC
+AGCTACATTCCGCAAGACGTCGACATGACCGCGGTCAAAGCGGAGGTCGCCGCACTCGGTGTCAGCGCTC
+CACCGGCGGCCACGCCGGGCCTGCTCGAGGTGGTCCAGCACGCTCGCGACGAGGGCATCGATCTCAAGAT
+CGTGCTGCTCGACCACAACCCGCCCAATGACACACCGCTGCGTGACATCGCGACCGTTGTCGGGGCCGAC
+TACTCGGATGCCACCGTCTTGGTGCTCAGCCCGAACTATGTCGGCAGTTACAGCACGCAATACCCCCGGG
+TCACGCTCGAGGCCGGGGAAGACCATTCCAAGACCGGCAATCCGGTGCAGTCCGCGCAGAACTTTGTCCA
+TGAGCTGAGCACACCCGAGTTTCCCTGGAGCGCGCTGACCATTGTTTTGCTGATCGGTGTGCTGGCAGCG
+GCTGTGGGTGCTCGGTTGATGCAACTGCGCGGGAGGAGGTCAGCAACGTCGACTGACGCCGCCCCAGGGG
+CGGGGGACGATCTCAATCAAGGCGTCTAGCCAGCCACATCTATCTCTTCTCGTGTTGCCGCGCTAACCGG
+GCGGTTGTTTGCGGCAAACGCGCGAGGTCACCGTTGGGTCACATTAGTCGCACGTACCGGGGGCAGTTTG
+TGACTTACGTTTCCATAGCGTCAGATGTGACGTACGGTGCAAATGATGCTTGTGGTGTCGTTGGCGTTGA
+CCTGCGCTGTCCCTCCGAGTTGAGCCCTAGGAGATCTGAGTCGAATGAGACGGAATCGCCGTGGCTCGCC
+AGCGCGACCGGCCGCACGGTTTGTCCGTCCGGCAATTCCGTCGGCTTTGAGTGTGGCCCTGCTGGTATGC
+ACACCGGGGCTGGCTACCGCCGATCCACAGACGGACACCATCGCCGCGCTGATTGCCGACGTCGCCAAGG
+CCAACCAGCGCCTGCAAGACCTGAGCGACGAGGTTCAGGCCGAACAGGAAAGCGTTAACAAGGCGATGGT
+CGACGTGGAAACCGCTCGGGACAACGCTGCCGCGGCCGAAGACGACCTGGAGGTCAGCCAGCGCGCGGTT
+AAGGACGCCAACGCGGCGATCGCCGCGGCTCAGCACCGGTTCGACACCTTCGCGGCGGCCACCTACATGA
+ACGGTCCCTCGGTCAGCTACCTCAGCGCGAGCAGCCCCGACGAGATCATTGCCACTGTGACCGCCGCCAA
+GACCCTTAGCGCCAGTTCCCAAGCGGTGATGGCCAACCTGCAGCGGGCCCGGACCGAGCGGGTGAACACG
+GAGTCGGCGGCGCGGCTAGCCAAGCAGAAGGCTGATAAGGCCGCCGCCGACGCAAAGGCCAGCCAGGATG
+CCGCGGTGGCGGCGCTCACCGAGACCCGGCGGAAGTTCGATGAACAGCGCGAGGAGGTCCAACGCCTGGC
+CGCCGAGCGCGATGCGGCTCAAGCCCGACTGCAGGCGGCCAGGTTGGTTGCCTGGTCCTCGGAGGGTGGT
+CAGGGTGCGCCGCCGTTCCGGATGTGGGATCCCGGATCGGGCCCTGCCGGTGGGCGTGCATGGGATGGCT
+TGTGGGACCCCACGCTGCCCATGATCCCCAGCGCCAACATCCCCGGCGACCCGATCGCGGTAGTGAACCA
+GGTGTTGGGGATCTCGGCAACGTCAGCGCAGGTCACCGCCAATATGGGGCGCAAGTTCCTGGAGCAGCTG
+GGCATCTTGCAGCCCACCGATACCGGCATCACCAACGCTCCGGCGGGCTCGGCCCAGGGCCGGATTCCGC
+GAGTTTATGGGCGCCAGGCTTCTGAATACGTGATCCGCCGCGGCATGTCACAGATCGGGGTGCCCTATTC
+CTGGGGCGGCGGCAATGCCGCGGGCCCGAGCAAGGGCATCGACTCCGGGGCCGGCACCGTCGGCTTCGAC
+TGCTCAGGCCTGGTGTTGTACTCGTTTGCTGGGGTGGGCATCAAGCTGCCGCACTACTCGGGTTCGCAGT
+ACAACCTGGGCCGCAAGATCCCGTCCTCGCAGATGCGCCGCGGCGACGTCATCTTCTACGGCCCGAACGG
+TAGCCAGCACGTGACGATCTACCTCGGCAACGGCCAGATGCTCGAGGCGCCCGACGTCGGTTTGAAGGTG
+CGGGTTGCGCCCGTGCGCACGGCTGGCATGACCCCGTATGTGGTCCGATACATCGAGTACTAGACGAGGA
+TTCATGCGCCACACGCGTTTTCACCCGATCAAACTGGCCTGGATCACCGCGGTGGTTGCCGGCCTGATGG
+TCGGTGTGGCAACGCCCGCCGATGCCGAACCCGGACAATGGGATCCCACGCTGCCGGCATTGGTCAGTGC
+GGGGGCGCCCGGAGATCCGCTGGCGGTAGCCAACGCGTCGTTGCAGGCCACCGCCCAGGCCACCCAGACC
+ACGCTGGATTTGGGCAGGCAGTTCCTCGGTGGGTTGGGAATCAACCTCGGCGGCCCTGCTGCCAGCGCTC
+CCAGCGCCGCCACAACCGGCGCGAGCCGGATTCCGCGGGCCAACGCCCGTCAGGCCGTCGAATATGTGAT
+TCGCCGGGCCGGGTCGCAGATGGGGGTGCCCTATTCGTGGGGTGGTGGCTCGCTTCAGGGCCCCAGCAAG
+GGCGTGGACTCGGGGGCCAACACTGTCGGCTTCGACTGCTCAGGTCTGGTGCGGTATGCCTTCGCCGGGG
+TCGGCGTGCTGATCCCGCGGTTCTCCGGTGATCAGTACAACGCCGGTCGCCACGTTCCGCCCGCTGAGGC
+CAAGCGCGGCGACCTGATCTTTTACGGCCCAGGCGGCGGCCAGCACGTCACCCTGTATCTGGGCAACGGC
+CAAATGCTGGAGGCATCCGGAAGCGCCGGCAAAGTCACGGTGAGCCCGGTGCGAAAGGCCGGAATGACGC
+CGTTCGTGACTAGGATCATCGAATACTGAGCCAGGTGTGATTTGCCGGGCACCACCGCGGCGTCGACGGA
+ATCCAGGAGGCCTGGAATAGTTGAACGCGGGCGCGTCGCTGCCCCGCGACGTTGGTCATGTCGGCAGTCG
+TGTCCGATTGAGCTGTGGAGGATTTTGATGACATCAGCAGGTGGGTTCCCCGCGGGCGCCGGCGGTTACC
+AGACCCCGGGTGGGCATTCAGCTTCGCCAGCCCACGAGGCGCCCCCCGGTGGTGCCGAGGGGCTGGCCGC
+CGAGGTGCACACGCTGGAGCGGGCCATCTTCGAGGTCAAGCGGATTATCGTCGGCCAGGACCAGCTGGTG
+GAGCGGATGCTCGTCGGCCTGCTGTCCAAGGGGCATGTGCTGCTTGAGGGCGTTCCCGGCGTGGCCAAGA
+CGTTGGCGGTGGAGACCTTCGCTCGGGTGGTCGGCGGGACATTTTCGCGCATCCAGTTCACCCCGGATCT
+GGTGCCCACCGACATCATCGGGACGCGCATCTACCGGCAAGGCAGGGAGGAATTCGACACCGAACTCGGA
+CCGGTGGTGGCCAACTTCCTGCTCGCCGACGAGATCAACCGGGCTCCGGCGAAGGTGCAGTCGGCGTTGC
+TGGAAGTCATGCAGGAGCGCCATGTGTCCATCGGCGGTAGGACCTTCCCGATGCCCAGCCCGTTCCTGGT
+GATGGCGACGCAGAACCCGATCGAGCACGAGGGCGTCTACCCGCTACCGGAGGCGCAACGGGACCGCTTC
+CTGTTCAAGATCAACGTGGGCTACCCGTCGCCCGAAGAAGAGCGCGAAATCATCTACCGTATGGGTGTTA
+CCCCGCCGCAGGCCAAGCAGATCCTGAGCACGGGCGACCTGCTGCGGCTGCAGGAGATAGCGGCCAACAA
+CTTCGTCCACCACGCGCTGGTCGACTATGTCGTTCGAGTCGTCTTCGCCACCCGCAAACCCGAGCAGTTG
+GGGATGAACGACGTGAAGAGCTGGGTCGCGTTCGGCGCATCCCCGCGTGCTTCGCTGGGCATCATCGCCG
+CCGCACGGTCCCTGGCGCTGGTCCGGGGCCGTGACTATGTCATCCCGCAAGACGTCATCGAGGTCATTCC
+TGATGTGCTGCGACACCGGCTCGTGCTCACCTATGACGCGCTCGCCGACGAAATCTCACCGGAGATCGTC
+ATCAACCGTGTGCTGCAGACTGTGGCGCTGCCACAGGTGAATGCCGTTCCACAGCAAGGCCATTCGGTGC
+CGCCGGTGATGCAGGCCGCGGCCGCGGCGAGCGGCCGGTGACCGAATCCAAAGCGCCGGCGGTGGTGCAT
+CCGCCGTCGATGCTGCGCGGGGACATCGACGACCCGAAGCTGGCGGCGGCGCTGCGCACCCTCGAGTTGA
+CCGTCAAGCAGAAGCTCGACGGTGTCTTGCACGGCGATCACCTCGGCCTGATACCTGGGCCGGGTTCGGA
+GCCAGGGGAGTCGCGCCTCTACCAGCCCGGTGACGATGTCCGCCGGATGGACTGGGCGGTCACCGCTCGC
+ACCACTCACCCGCATGTCCGGCAGATGATCGCCGACCGGGAACTGGAAACCTGGCTGGTGGTCGACATGT
+CGGCCAGCCTGGATTTTGGCACCGCCTGCTGCGAGAAACGTGACCTCGCGGTGGCGGCGGCGGCTGCCAT
+CACCTTCCTCAACAGCGGCGGCGGCAACCGGCTCGGTGCGCTGATCGCCAACGGCGCCGCGATGACTCGG
+GTGCCGGCTCGCACCGGGCGCCAACATCAGCACACGATGTTGCGCACCATTGCGACCATGCCGCAGGCCC
+CTGCGGGGGTCCGCGGCGACCTGGCGGTTGCCATCGATGCGCTGCGCCGGCCCGAACGTCGTCGCGGGAT
+GGCGGTGATCATCAGCGATTTTCTGGGCCCGATCAACTGGATGCGTCCGCTGCGGGCGATCGCAGCCCGC
+CATGAGGTGCTGGCCATCGAAGTGCTCGATCCGCGCGATGTCGAATTGCCGGACGTGGGTGATGTGGTGC
+TGCAGGACGCCGAATCCGGGGTTGTGCGCGAGTTCAGCATCGACCCTGCGCTGCGCGACGACTTCGCTAG
+GGCAGCTGCGGCGCACCGGGCCGACGTGGCGCGCACCATCCGCGGTTGCGGGGCACCCTTGCTATCGCTT
+CGCACCGACCGCGACTGGCTTGCCGATATCGTACGATTCGTCGCCTCTCGCCGGCGTGGGGCATTGGCGG
+GACACCAGTGATGGGTCAGTTATGACATTGCCGTTGCTGGGGCCGATGACGCTATCCGGCTTCGCGCATT
+CATGGTTCTTCCTATTCCTGTTTGTCGTGGCCGGACTGGTCGCGCTGTACATCCTGATGCAGCTGGCGCG
+CCAGCGGCGAATGCTGCGGTTCGCCAACATGGAGTTGCTGGAGAGCGTCGCACCCAAGCGGCCATCCCGC
+TGGCGGCATGTCCCGGCGATCCTGCTGGTGTTATCGCTGCTGCTGTTCACCATCGCGATGGCCGGTCCGA
+CGCATGACGTCCGGATTCCCCGTAACCGCGCGGTGGTGATGTTGGTGATCGACGTGTCGCAGTCGATGCG
+CGCCACCGACGTCGAGCCCAGCCGGATGGTGGCCGCGCAGGAGGCTGCCAAGCAGTTCGCCGACGAGTTG
+ACCCCGGGCATCAATCTGGGATTGATTGCCTACGCGGGCACGGCGACGGTCCTGGTGTCGCCGACGACCA
+ACCGGGAGGCGACCAAGAATGCGCTGGACAAGTTACAGTTCGCCGACCGTACCGCCACCGGGGAGGCGAT
+CTTCACCGCGCTGCAGGCCATCGCCACGGTTGGCGCGGTGATCGGTGGCGGCGACACGCCGCCGCCGGCG
+CGCATCGTGCTGTTCTCCGACGGCAAGGAGACGATGCCGACCAACCCGGACAACCCCAAGGGCGCCTACA
+CCGCCGCCCGCACCGCCAAGGACCAGGGCGTGCCGATTTCGACGATCTCGTTCGGCACCCCATACGGCTT
+CGTCGAGATCAACGACCAGCGCCAACCGGTGCCCGTCGACGACGAAACGATGAAGAAGGTCGCCCAGCTC
+TCCGGTGGAAATTCCTACAATGCGGCGACTTTGGCCGAGCTGAGGGCCGTTTACTCGTCGCTGCAGCAGC
+AGATCGGCTACGAGACCATCAAGGGTGACGCCAGCGTCGGCTGGTTGCGGTTGGGTGCGCTGGCGCTGGC
+GTTGGCGGCGCTAGCGGCGCTGCTCATCAACCGGCGGTTGCCGACTTAGCTTCCCCCGCGGCCCCGGCAG
+CCCGCGAGCGTAACCTGGCTGCGATTTCCGGCGCGGATTTTCGCAGTGCGGTTACGCTCGGAAAGCGCGG
+GCCTCGCCCACGCGGCGGATGATGTCAGCGGGGTGGTCCTCGGCGACGACCCGGACCACGATCCACCCGT
+AGCGGTGCTGGACTTTCTCGTGCCGGAGGATGTCTTTCCGGTAGTGGTAGCGACTGGTCAGATGGTGGTC
+GCCGTCATACTCGGCCGCGACCTTGATGTCTTGCCAGCCCATATCCAAATGGGCTTCCGCCCAGCCCCAT
+TCGTTGCGCACCGCGATCTGCGTCTGGGGGCGCGGAAAGCCGGCGCGGATCAACAACAAGCGCAGCCAGG
+TTTCCTTGGGGGACTGGGCACCGCCGTCGACGAGGTCCAGAGCGGCTCTTGCGGCCTTCATGCCACGGCG
+GCCCCGATAGCGCTCGATCAGCGGCTCGACGTCGGCCACCTTCAAATCGGTGGCCTGTATCAGGGCGTCG
+ACGGCCGCGACGGCGGGGTCCAATGGAAATCGACTGGTCAGGTCGAGCGCCGTTCGCTCCGGTGTGGTCA
+CGCGCATGCCCTCGATGACGCAGATCTCGTCGGGCTCGATGCGCTCTTCCCAGACTTGCAGCCCCGGGGC
+ACGGCGGCGGTTGGTGTCGATGATCGCGGCGGGAAGATCCGCGTCGATCCACTTGGCGCCATGGAAGGCA
+GAAGCCGAGTAGCCGGCCAGCACGCCGCGGCGGCGCGAGCGCAGCCACAGCGCTTTTGCACGCAATTGCG
+CGGTCAGTTCCACACCCTGCGGCACGTACACGTCTTTATGTAGCGCGACATACCTGCTGCGCAATTCGTA
+GGGCGTCAATACACCCGCAGCCAGGGCCTCGCTGCCCAGAAAGGGATCCGTCATGGTCGAAGTGTGCTGA
+GTCACACCGACAAACGTCACGAGCGTAACCCCAGTGCGAAAGTTCCCGCCGGAAATCGCAGCCACGTTAC
+GCTCGTGGACATACCGATTTCGGCCCGGCCGCGGCGAGACGATAGGTTGTCGGGGTGACTGCCACAGCCA
+CTGAAGGGGCCAAACCCCCATTCGTATCCCGTTCAGTCCTGGTTACCGGAGGAAACCGGGGGATCGGGCT
+GGCGATCGCACAGCGGCTGGCTGCCGACGGCCACAAGGTGGCCGTCACCCACCGTGGATCCGGAGCGCCA
+AAGGGGCTGTTTGGCGTCGAATGTGACGTCACCGACAGCGACGCCGTCGATCGCGCCTTCACGGCGGTAG
+AAGAGCACCAGGGTCCGGTCGAGGTGCTGGTGTCCAACGCCGGCCTATCCGCGGACGCATTCCTCATGCG
+GATGACCGAGGAAAAGTTCGAGAAGGTCATCAACGCCAACCTCACCGGGGCGTTCCGGGTGGCTCAACGG
+GCATCGCGCAGCATGCAGCGCAACAAATTCGGTCGAATGATATTCATAGGTTCGGTCTCCGGCAGCTGGG
+GCATCGGCAACCAGGCCAACTACGCAGCCTCCAAGGCCGGAGTGATTGGCATGGCCCGCTCGATCGCCCG
+CGAGCTGTCGAAGGCAAACGTGACCGCGAATGTGGTGGCCCCGGGCTACATCGACACCGATATGACCCGC
+GCGCTGGATGAGCGGATTCAGCAGGGGGCGCTGCAATTTATCCCAGCGAAGCGGGTCGGCACCCCCGCCG
+AGGTCGCCGGGGTGGTCAGCTTCCTGGCTTCCGAGGATGCGAGCTATATCTCCGGTGCGGTCATCCCGGT
+CGACGGCGGCATGGGTATGGGCCACTGACACAACACAAGGACGCACATGACAGGACTGCTGGACGGCAAA
+CGGATTCTGGTTAGCGGAATCATCACCGACTCGTCGATCGCGTTTCACATCGCACGGGTAGCCCAGGAGC
+AGGGCGCCCAGCTGGTGCTCACCGGGTTCGACCGGCTGCGGCTGATTCAGCGCATCACCGACCGGCTGCC
+GGCAAAGGCCCCGCTGCTCGAACTCGACGTGCAAAACGAGGAGCACCTGGCCAGCTTGGCCGGCCGGGTG
+ACCGAGGCGATCGGGGCGGGCAACAAGCTCGACGGGGTGGTGCATTCGATTGGGTTCATGCCGCAGACCG
+GGATGGGCATCAACCCGTTCTTCGACGCGCCCTACGCGGATGTGTCCAAGGGCATCCACATCTCGGCGTA
+TTCGTATGCTTCGATGGCCAAGGCGCTGCTGCCGATCATGAACCCCGGAGGTTCCATCGTCGGCATGGAC
+TTCGACCCGAGCCGGGCGATGCCGGCCTACAACTGGATGACGGTCGCCAAGAGCGCGTTGGAGTCGGTCA
+ACAGGTTCGTGGCGCGCGAGGCCGGCAAGTACGGTGTGCGTTCGAATCTCGTTGCCGCAGGCCCTATCCG
+GACGCTGGCGATGAGTGCGATCGTCGGCGGTGCGCTCGGCGAGGAGGCCGGCGCCCAGATCCAGCTGCTC
+GAGGAGGGCTGGGATCAGCGCGCTCCGATCGGCTGGAACATGAAGGATGCGACGCCGGTCGCCAAGACGG
+TGTGCGCGCTGCTGTCTGACTGGCTGCCGGCGACCACGGGTGACATCATCTACGCCGACGGCGGCGCGCA
+CACCCAATTGCTCTAGAACGCATGCAATTTGATGCCGTCCTGCTGCTGTCGTTCGGCGGACCGGAAGGGC
+CCGAGCAGGTGCGGCCGTTCCTGGAGAACGTTACCCGGGGCCGCGGTGTGCCTGCCGAACGGTTGGACGC
+GGTGGCCGAGCACTACCTGCATTTCGGTGGGGTATCACCGATCAATGGCATTAATCGCACACTGATCGCG
+GAGCTGGAGGCGCAGCAAGAACTGCCGGTGTACTTCGGTAACCGCAACTGGGAGCCGTATGTAGAAGATG
+CCGTTACGGCCATGCGCGACAACGGTGTCCGGCGTGCAGCGGTCTTTGCGACATCTGCGTGGAGCGGTTA
+CTCGAGCTGCACACAGTACGTGGAGGACATCGCGCGGGCCCGCCGCGCGGCCGGGCGCGACGCGCCTGAA
+CTGGTAAAACTGCGGCCCTACTTCGACCATCCGCTGTTCGTCGAGATGTTCGCCGACGCCATCACCGCGG
+CCGCCGCAACCGTGCGCGGTGATGCCCGGCTGGTGTTCACCGCGCATTCGATCCCGACGGCCGCCGACCG
+CCGCTGTGGCCCCAACCTCTACAGCCGCCAAGTCGCCTACGCCACAAGGCTGGTCGCGGCCGCTGCCGGA
+TACTGCGACTTTGACCTGGCCTGGCAGTCGAGATCGGGCCCGCCGCAGGTGCCCTGGCTGGAGCCAGACG
+TTACCGACCAGCTCACCGGTCTGGCTGGGGCCGGCATCAACGCGGTGATCGTGTGTCCCATTGGATTCGT
+CGCCGACCATATCGAGGTGGTGTGGGATCTCGACCACGAGTTGCGATTACAAGCCGAGGCAGCGGGCATC
+GCGTACGCCCGGGCCAGCACCCCCAATGCCGACCCGCGGTTCGCTCGACTAGCCAGAGGTTTGATCGACG
+AACTCCGTTACGGCCGTATACCTGCGCGGGTGAGTGGCCCCGATCCGGTGCCGGGCTGTCTGTCCAGCAT
+CAACGGCCAGCCATGCCGTCCGCCGCACTGCGTGGCTAGCGTCAGTCCGGCCAGGCCGAGTGCAGGATCG
+CCGTGACCGCGGACATCCGGGCCGAGCGCACCACGGCGGTCAACGGTCTCAACGCATCGGTGGCACGCTG
+AGCGTCCGACAACGACTGCGTTCCGATCGGCAATCGACTCAGCCCGGCACTGACCGCGATGATCGCATCG
+ACGTGCGCGGCATTCTCGAGCACCCGCAATGCGCGCGATGGCGCGTGGTCGGGAACCCGGTGTTGCCGTG
+ACGATTCGAGCAACTGCTCGACGAGGCCACGGGGATTGGCGACGTCGCTAGATCCCAGTCCGATGGTGCT
+CAAGGCTTCGGCGGCCGAGCGCACCGCTGACCGCAACGCGTATTCGGCATCGCCGAGCTCGTAGTGTTCC
+AACACTGGGGCCCCGGGAAGTGAATACACCATCCAAGAAAGTGCACACAATTCGGGCGTGAGTGGCTCGC
+TCTGCGCGGCTTCGTCGACATCGCCATAGGAGAACTCCGGGACCAGGCCAACGGCGCTGCCGGGATCCTC
+CGGGTTGGCGACGATCACCGCCTCGCCGGCGGCAAGGGCGTCGTGCTCGAACTGTGTTCCCGCAGCCAGC
+CCGCGCACATCGCCCGGCACCGGCAACACCACATTGATCGTCCCCCGCAGTCGGCGCCGGCCCACCGCGG
+CGCGCAGTGTCTGCAGGAGCGAGACCGTTCCAGCATCGTGGACGTCGGGCCACGGCAGCCCGGTGTGGCC
+CGCAGCCACGGCATCATAAGCTGCGACGGATTGCGTTGGCGCCCAAAGTGATAATGCATCCAACACGTCG
+TCGGGAGCAGCCTTGCCGGCGAGCCAAGCGTTAGCCCAGATCGACAGCGAAACACTGGGACACCACATGA
+TCTTGCAGTGTAGTTGTTCGACCCGGCTGACGCGGATCACGCGTATCCTAAGCGCATGCCCGTCGCTTTG
+ATCTGGCTTATCGCGGCGTTGGTGCTCGTCGGCGCAGAGGCACTGACCGGCGACATGTTCTTGCTGATGC
+TCGGCGGCGGTGCGCTGGCCGCCTCGGTAAGCAGCTGGCTGCTGGCTTGGCCGATGTGGGCCGACGGGGC
+GGTGTTTCTCCTCGTCTCGGTGCTGCTGCTGGTGTTGGTTCGGCCGGCGGTGCGGCGCCGGCTGACGCAG
+ACCAAAGGTGTGCAGCTGGGCATCGAGGCGCTGGAGGGTAAGAAGGCGGTGGTGCTTGGTCGGGTGGCCC
+GCGACGGGGGTCAGGTGAAGCTGGACGGCCAGGTGTGGACGGCGCGCCCGCTCAACGACGGTGATGTGTT
+CGAACCTGGTGACTCGGTGACCGTGGTGCAAATCGACGGCGCCACGGCGGTGGTCTTCAAGGACGTGTAG
+GGACTCGAGAAAGGAATTCCGGTGCAAGGAGCCGTTGCTGGTCTGGTGTTTCTGGCCGTCCTGGTGATTT
+TCGCCATCATCGTGGTGGCCAAGTCGGTGGCGCTGATCCCGCAGGCGGAGGCCGCGGTGATCGAGCGGCT
+GGGTCGCTATAGTCGTACGGTCAGTGGGCAGTTGACGCTGTTGGTGCCGTTCATCGACCGCGTCCGGGCT
+CGGGTGGACCTGCGCGAGCGGGTGGTGTCGTTTCCGCCGCAACCGGTGATCACCGAGGACAACTTGACGC
+TGAACATCGACACCGTCGTCTACTTCCAGGTGACCGTTCCGCAGGCGGCGGTGTACGAGATCAGCAATTA
+CATCGTCGGGGTCGAACAGCTCACCACCACCACCCTGCGCAACGTTGTCGGCGGGATGACGCTGGAGCAG
+ACGTTGACCTCGCGTGACCAGATCAACGCCCAGCTGCGCGGCGTTCTCGATGAGGCGACCGGCCGCTGGG
+GTCTGCGGGTGGCGCGGGTGGAGCTGCGCAGCATCGATCCGCCGCCGTCGATTCAGGCGTCGATGGAAAA
+GCAGATGAAGGCCGACCGGGAGAAGCGAGCGATGATTCTGACCGCCGAAGGTACCCGGGAGGCGGCGATA
+AAACAGGCCGAGGGGCAAAAGCAGGCGCAGATCCTGGCCGCCGAGGGCGCCAAGCAGGCCGCGATCTTGG
+CTGCTGAGGCCGATCGGCAGTCTCGGATGCTGCGCGCTCAGGGTGAGCGCGCCGCGGCCTACCTGCAGGC
+GCAAGGGCAGGCCAAGGCCATCGAGAAGACGTTCGCCGCGATCAAGGCTGGCCGGCCCACCCCGGAGATG
+CTGGCCTACCAATACCTGCAGACGCTGCCGGAGATGGCGCGTGGGGACGCCAACAAGGTATGGGTGGTGC
+CCAGCGACTTCAACGCCGCACTGCAGGGGTTCACCAGGCTGCTGGGCAAGCCGGGTGAGGACGGGGTGTT
+CCGGTTCGAGCCGTCCCCGGTCGAAGACCAGCCCAAGCACGCGGCCGACGGTGACGACGCCGAGGTCGCC
+GGCTGGTTCTCCACCGATACCGACCCGTCGATCGCTCGGGCGGTGGCTACAGCCGAGGCGATAGCCCGCA
+AGCCGGTCGAGGGTTCGCTGGGGACGCCCCCCAGGTTGACTCAATAGAGTGGTCCGATGAGTGGTTTGAC
+CTCACCGAAAACCTATGCGGTACTGGCAGCTCTGCAGGCGGGCGACGCGGTGGCGTGCGCCATCCCGCTG
+CCACCTATCGCCAGGTTACTCGACGACTTGGACGTTCCGGTCAGCGTTCGCCCGGTGCTGCCGGTGGTCA
+AGGCCGCCTCTGCGGTCGGTTTGTTGTCGGTCACCCGATTCCCGGCCTTGGCGCGGCTGACGACAGCGAT
+GTTGACGTTGTACTTCATCCTCGCCGTGGGGGCACATGTCCGGGTGCGAGATCGCGTTGTTAATGCGATT
+CCGGCGGCGTCATTCCTGACGTTGTTCGCGCTGATGACGGCAAAGGGGCCGGAGCGCACTTAAGCATGGA
+GGCGCAACTCGACCTATGGCAGTGGTGTGTCGGTCGGTGAGGTCGAGGTGCTCAAGGTCGAAAACAGCCG
+GGTGCGCGCCGAGCAGCTGGCCAAACTGTACGAATTGCGCTCAAGTCGGGATCGGGTCAGGGTCGACGCC
+GCACTAGCCGAGCTGAGCCGCGCCGCGGCCGCCCGCGGTTGTGCCGGTACTAGCGGGCTCGGCAACAACC
+TGATGGCGCCGGGGCCGCCCCATTCCCTCCTGGGACGGGATCGCTGACGCCACAATCGACCTGCTACGAA
+GGCTGGCCGAGCGGCTGGGGTACACACTGGATTGGCGAGCGATCCGTGGAGCCGAACCCGTTGCCACCGC
+CATTCTGCGTCGGTTAGTCTCTTTTTCGACCTTGGGGCGCGGAGGGTCGTTATGGTGTGTCACAGTGCTT
+TGCTGTCAAAGGCATTGGCGGTGCCGACCAAGCGACACTGGGCAGTGCAGAAATCCTCGTGAAATACGCT
+CAACTCGCTGACAAACGCGCTCGGGTATATGTCCTGGTGTCGACCTGGTTGGTCGTGTGGGGTATCTGGC
+ATGTGTATTTTGTCGAAGCTGTCTTTCCGAATGCCATCCTGTGGTTGCATTATTACGCGGCCAGCTATGA
+ATTCGGGTTTGTACGTCGCGGGCTGGGCGGTGAACTGATTCGCATGTTGACCGGCGATCATTTCTTTGCC
+GGCGCCTATACCGTTCTGTGGACGTCTATCACGGTGTGGCTGATCGCCCTTGCCGTCGTGGTGTGGCTTA
+TCCTTTCCACGGGCAACCGGTCCGAGCGCAGGATAATGCTTGCCCTCCTCGTTCCGGTGCTACCCTTTGC
+CTTTTCTTACGCCATCTATAATCCACATCCGGAACTCTTCGGGATGACCGCGTTGGTAGCCTTCAGCATT
+TTTCTGACCAGGGCCCACACCTCTCGAACCCGGGTGATCCTCAGTACGCTGTACGGACTTACGATGGCCG
+TGCTGGCGCTCATACACGAAGCGATTCCACTGGAATTCGCACTCGGCGCGGTGCTGGCGATAATCGTGTT
+GTCGAAGAATGCGACAGGTGCGACAAGGCGAATCTGTACTGCGTTGGCCATCGGTCCGGGGACCGTCTCA
+GTATTGTTGCTCGCTGTGGTCGGGCGTCGCGATATCGCGGACCAGTTGTGTGCCCATATCCCGCATGGGA
+TGGTCGAAAATCCGTGGGCGGTTGCAACGACACCGCAGCGAGTTCTCGATTACATATTCGGTCGTGTCGA
+GAGCCATGCAGATTACCACGATTGGGTGTGCGAGCATGTGACCCCGTGGTTTAACCTCGACTGGATTACC
+TCTGCAAAGCTGGTGGCCGTGGTTGGCTTCCGCGCACTATTCGGTGCATTCCTCCTCGGGTTGCTGTTCT
+TCGTTGCCACGACATCGATGATCCGCTATGTCTCCGCCGTGCCGGTCAGAACCTTCTTTGCCGAACTGCG
+CGGCAATCTGGCGTTGCCGGTGCTGGCATCGGCATTGCTGGTTCCGCTGTTCATCACCGCTGTCGACTGG
+ACTCGCTGGTGGGTGATGATCACACTCGACGTGGCCATTGTCTACATCTTGTACGCGATCGACAGACCGG
+AGATCGAGCAACCGCCGTCGAGGAGAAACGTGCAGGTCTTCGTCTGCGTTGTGTTGGTGCTGGCGGTGAT
+ACCGACCGGGTCCGCCAACAACATCGGCAGATGAGGCACCCCGCGGGACCACCCGAAGGCGGGCATGGTG
+ACGTAGGCCAACCGCCGCTGACATGCTTGGGACGGTGATGCTGTTGCAGGCCTATTAGGGGTTGTCGGAT
+CGGGAGCCTTGTGACCGGTTGGCCCTTGATCTGCGTTGGGAGGCCGCGGCGGGGTTGACGGTGCACGCGC
+CGTCGTTGCATCCCACGGTGTTGGTCGGGATGCGTAACCGGCTGCGGGCTTCGGATCCGACGTGTTGGTG
+GATGCACCATTTTCAAATGCCGTCGCGGGTCGAAACTTGGGTGCCGTCGAAGAATAACCCCACCAAAGGC
+CCTACATCAGCGCCGTCCTACGTTCGTGTGTCGGACAATCCTTAGTGCCGATGCCGGATATTCGGGCACT
+AACGGAAAAGACGTCCTCCGCGTAGAGGCTCCGTTGTTCGAGGCCCAGTTACAGGGGCAAGGTCAGTGGC
+CGTGACCTCTGCTTCCCGACACGAGAATGCTGGCCGACCGAACGTAGCGCGGTGCGTTGACGGCATCGAG
+CTGCCACGCCAAATTTGCACGCGCTGATGCGCTGACCCCGACCGAAGGTTTATCAAATGAGAGCCGGCTC
+GCGCACAGGGTCGTCGTAACCCGGCATGCGTCGGTGCTGCCGTCGATAATTGCGGATCTCATAGACGAGC
+CCAGTCAGACCTAGCGCGCCCGTGCATACCGACACCAGGATCAGCAGCGGGCTACCGCTACCGGCGAACG
+CGTCGCCCAGGATGACCACCGCCGCGGTGCCGGGGAGCAAGCCTGCCAAGGTCGCCCAGGCGAAGGACAG
+GATCCGCACGCCCGAGGCGCCGGCGGCATAGTTGATCGCCGCGAACGGGACGACGGGAATGAGCCGCAGC
+GACAAGATGGCCAGCCAGCCTCGCTCACGCAGACGCTCGTCCAGCCGGTTGATCGCTCGGCGGCGCACCA
+GACTGTTCAGCTGCCAGCCGGTGGCACGCACCAGCAGCATCGCGATTACCGCGCTAGCGGTGCTGCCGAC
+CACCGCGATGAATACGCCCACCACAGAGCCGAACAACAGCCCGGCGGCCAACGTGAACGCGGTGCGGGGG
+AATGGCGGCACCGTGACGACGGTATGCACCAGCAAAAATGCCAGCGGGAACCACGCGCCCAGTGACTTGG
+CCCAGTCGCGCAATTCCACCGCAGTGGGCACCGGAACCAGCAGCGCGACCACTACCAGTACTGTGATTCC
+CACCACTGTTCCCACGATGCGCGGCAGCGACGCCTGACGCGCGACCGCGCCGAGCGAGGTGGCGATACCG
+TGTACGGTTTCGGTGGTGTTGCAGATGGCGGGAGCCGTCACGTCTTCGGAGCGTACGGGGTCAACATGAA
+TAACTCGTTTCCCCAGGCTGGCGTTTCGTCACACTCCGGCCGCGATTGCCGCACCTGGGCGTCTATATGG
+GCGTCCCGATCAACTAGCCTTATTAGTTAAGTGACAATCCCGAAGCAAGCCCAAGCAACATCGCTAATTG
+CTGGGAAAACAGGAGCAGTCGGTGTCCATTGATGTACCCGAGCGTGCCGACCTAGAACAGGTTCGCGGGC
+GCTGGCGCAACGCGGTTGCCGGTGTGCTGTCCAAGAGCAACCGTACCGACTCAGCACAACTCGGCGATCA
+CCCCGAGCGGCTGCTGGATACCCAGACCGCTGACGGGTTCGCCATCCGGGCCCTCTACACCGCGTTCGAC
+GAGCTCCCGGAGCCGCCGTTGCCGGGCCAGTGGCCCTTTGTGCGCGGCGGAGACCCGCTGCGCGACGTGC
+ATTCCGGCTGGAAGGTCGCCGAGGCGTTTCCCGCCAACGGTGCGACGGCCGACACCAACGCGGCGGTGCT
+GGCCGCGCTCGGCGAGGGGGTCAGCGCGCTGCTGATCCGGGTGGGGGAGTCGGGTGTGGCGCCTGACCGG
+CTCACGGCGCTGCTGTCCGGGGTGTATCTGAACCTGGCGCCGGTCATCCTCGACGCCGGCGCCGACTACC
+GCCCGGCCTGCGACGTCATGCTGGCGCTGGTCGCCCAGCTCGATCCCGGCCAGCGCGACACCCTGTCGAT
+CGACCTGGGCGCCGACCCGCTGACGGCGTCGCTGCGCGATCGTCCCGCCCCGCCGATCGAGGAGGTCGTC
+GCGGTCGCATCCCGGGCGGCCGGCGAACGTGGGCTTCGTGCGATCACCGTCGACGGACCGGCCTTCCACA
+ACCTGGGCGCGACCGCGGCCACCGAACTCGCGGCCACCGTCGCGGCCGCGGTGGCCTACCTGCGGGTGCT
+CACCGAATCCGGGCTCGTGGTGAGTGACGCGCTGCGGCAGATCAGCTTCCGGCTCGCCGCCGACGACGAC
+CAGTTCATGACGCTGGCCAAGATGCGGGCTCTACGTCAACTGTGGGCGCGGGTCGCCGAGGTCGTGGGCG
+ACCCGGGTGGCGGCGCGGCCGTCGTGCACGCGGAGACGTCGCTACCGATGATGACCCAGCGTGATCCGTG
+GGTGAACATGCTGCGCTGCACGCTGGCGGCCTTCGGCGCCGGTGTCGGTGGCGCGGACACCGTGCTGGTG
+CACCCGTTCGACGTGGCGATTCCCGGCGGCTTTCCCGGCACGGCGGCCGGCTTTGCGCGCCGGATCGCTC
+GCAACACCCAACTGCTGCTTTTAGAAGAGTCGCATGTCGGCAGGGTGCTCGATCCCGCCGGCGGGTCGTG
+GTTCGTCGAAGAGCTCACCGACCGGCTGGCTCGGCGCGCCTGGCAGCGTTTCCAGGCCATCGAGGCCCGT
+GGCGGCTTCGTCGAGGCCCACGACTTCCTGGCCGGCCAGATCGCCGAGTGCGCCGCCCGCCGCGCCGACG
+ACATCGCCCATCGGCGCCTGGCGATCACCGGCGTCAACGAATACCCGAACCTGGGCGAACCCGCGCTGCC
+GCCCGGTGATCCGACATCGCCGGTGCGCCGCTACGCTGCCGGATTCGAAGCATTGCGCGATCGATCCGAT
+CACCACCTAGCCCGCACTGGCGCACGGCCGCGGGTGCTGTTGCTGCCGTTGGGTCCGCTGGCCGAGCACA
+ACATCCGGACGACCTTCGCCACCAACCTGCTGGCGTCCGGCGGCATCGAGGCGATCGACCCGGGAACGGT
+TGATGCGGGCACCGTCGGGAATGCCGTTGCCGATGCCGGTTCGCCCAGCGTTGCCGTGATCTGCGGCACC
+GATGCGCGCTACCGGGACGAGGTTGCCGACATTGTGCAAGCGGCCCGAGCCGCCGGTGTTTCGAGGGTGT
+ACCTCGCGGGTCCCGAGAAGGCGTTGGGAGATGCCGCACACCGGCCCGACGAGTTTTTGACCGCGAAAAT
+CAATGTGGTGCAAGCCTTGTCGAATCTGCTGACGCGGTTGGGGGCCTAGATGACAACCAAGACACCCGTG
+ATCGGCAGCTTCGCCGGCGTTCCGCTGCATAGCGAGCGTGCCGCGCAATCGCCCACAGAGGCCGCGGTGC
+ACACGCATGTCGCCGCCGCCGCGGCGGCGCACGGGTACACGCCCGAACAGTTGGTGTGGCACACGCCGGA
+AGGCATTGACGTCACACCGGTATACATCGCCGCCGACCGGGCCGCCGCCGAAGCCGAGGGCTACCCGCTG
+CACAGCTTCCCGGGCGAGCCCCCCTTTGTGCGCGGCCCCTATCCGACGATGTATGTGAACCAGCCGTGGA
+CCATCCGCCAGTACGCCGGGTTTTCCACCGCCGCGGATTCCAATGCGTTTTACCGACGCAACCTGGCCGC
+CGGCCAGAAGGGGCTGTCGGTGGCCTTCGATCTGGCCACCCACCGCGGCTACGACTCCGACCATCCCCGC
+GTGCAGGGCGATGTCGGAATGGCCGGTGTGGCAATCGATTCCATTCTCGACATGCGACAGCTGTTCGACG
+GCATCGACCTGTCGACCGTGAGCGTGTCGATGACGATGAACGGTGCGGTGCTGCCGATCCTGGCGCTGTA
+TGTGGTTGCCGCCGAGGAGCAGGGCGTGGCGCCGGAGCAGCTGGCCGGCACCATCCAGAACGACATCCTC
+AAAGAGTTCATGGTCCGCAACACCTACATCTATCCGCCGAAGCCGTCGATGCGGATCATCTCCGACATCT
+TCGCCTACACCAGCGCCAAGATGCCCAAGTTCAACTCCATCTCCATTTCCGGCTATCACATCCAAGAAGC
+CGGTGCCACGGCGGATTTGGAGCTGGCCTACACCCTGGCCGACGGCGTCGACTACATCAGGGCGGGCCTG
+AACGCCGGCCTGGACATCGACAGCTTCGCGCCCCGGCTATCGTTCTTCTGGGGCATCGGGATGAATTTCT
+TTATGGAGGTCGCCAAACTGCGGGCCGGCCGGTTGCTGTGGAGCGAGCTGGTCGCACAGTTCGCGCCCAA
+GAGCGCCAAATCCCTTTCGCTGCGTACACATTCGCAAACATCGGGGTGGTCACTGACCGCCCAGGATGTG
+TTCAACAACGTGGCGCGCACATGCATCGAGGCGATGGCCGCCACCCAGGGGCACACCCAGTCGCTGCACA
+CCAACGCCCTGGACGAGGCGCTGGCGCTGCCCACCGATTTTTCGGCCCGCATCGCGCGCAACACCCAGCT
+GGTGTTGCAGCAGGAGTCGGGCACCACGCGGCCGATCGACCCGTGGGGGGGCTCCTACTATGTGGAGTGG
+CTGACCCATCGGCTCGCGCGGCGAGCCCGGGCGCACATCGCCGAGGTCGCTGAACATGGCGGCATGGCGC
+AGGCCATCAGCGACGGCATCCCCAAGCTGCGCATCGAGGAGGCGGCCGCGCGCACCCAGGCCCGCATCGA
+CTCCGGTCAGCAACCGGTGGTCGGGGTGAACAAATACCAGGTGCCCGAGGACCACGAGATCGAGGTGCTC
+AAGGTCGAAAACAGCCGGGTGCGCGCCGAGCAGCTGGCCAAACTGCAGCGGCTGCGGGCAGGCCGGGACG
+AGCCGGCGGTACGGGCCGCGCTGGCCGAGCTGACCCGCGCCGCCGCCGAGCAAGGACGCGCCGGAGCAGA
+CGGGCTGGGCAATAATCTGCTGGCCCTGGCCATCGACGCCGCCCGGGCCCAGGCCACCGTGGGCGAGATC
+TCCGAAGCGCTGGAGAAGGTGTACGGACGGCACCGGGCCGAGATCCGTACCATTTCCGGGGTCTACCGCG
+ACGAAGTTGGAAAGGCCCCCAACATCGCAGCCGCAACCGAGCTAGTGGAGAAGTTCGCCGAGGCCGACGG
+CCGCCGGCCCAGGATTCTGATCGCCAAGATGGGCCAGGACGGCCACGACCGCGGGCAGAAGGTGATCGCG
+ACCGCGTTCGCCGACATCGGGTTCGACGTCGACGTGGGGTCGCTGTTTTCCACCCCCGAGGAGGTGGCGC
+GTCAGGCCGCCGACAACGACGTGCACGTGATCGGGGTGTCCTCGCTGGCCGCCGGCCATCTGACGCTGGT
+GCCGGCGCTGCGCGACGCGTTGGCGCAGGTGGGCAGGCCCGACATCATGATCGTGGTCGGTGGTGTCATC
+CCGCCGGGCGACTTCGACGAGCTGTACGCCGCCGGGGCCACCGCCATTTTCCCGCCGGGGACGGTGATTG
+CCGACGCGGCGATTGACCTGCTGCACAGGCTGGCCGAGCGGCTGGGGTACACGCTGGATTAGCGAGAGGC
+CCGTGGTGCCGTTTCTGGTTGCATTATCCGGTATCATCTCGGGCGTGCGTGATCATTCGATGACCGTGCG
+GCTCGACCAGCAAACTCGCCAGCGCCTGCAAGACATTGTGAAAGGCGGATACCGGAGCGCTAATGCGGCG
+ATCGTCGACGCCATCAACAAGCGCTGGGAGGCGCTACACGATGAGCAACTCGACGCCGCCTACGCGGCCG
+CGATCCATGACAATCCGGCGTACCCGTACGAGTCTGAGGCCGAACGGAGCGCCGCGCGGGCCCGGCGCAA
+CGCCAGGCAGCAGCGCTCGGCACAGTGAACGCGCCGTTGCGTGGTCAGGTCTATCGATGCGACCTCGGAT
+ACGGGGCCAAACCGTGGCTCATCGTCTCCAACAACGCCCGCAACCGTCACACCGCCGACGTGGTGGCTGT
+GCGCCTGACAACAACGCGGAGAACCATACCGACCTGGGTCGCCATGGGCCCCAGCGATCCATTGACCGGA
+TACGTCAACGCGGACAACATCGAGACCCTCGGCAAAGACGAGCTCGGTGACTACCTCGGTGAGGTCACGC
+CGGCGACGATGAACAAAATCAACACGGCGCTCGCGACCGCGCTGGGGCTACCGTGGCCATGATGGCCGCA
+TCCCACGACGACGACACCGTCGACGGGTTGGCGACGGCCGTGCGCGGCGGTGACCGTGCGGCGCTGCCAC
+GGGCCATCACACTGGTCGAGTCGACCCGCCCCGACCATCGTGAGCAGGCGCAACAGCTGCTGCTGCGATT
+GCTGCCGGACTCCGGGAACGCCCATCGCGTCGGCATCACCGGGGTCCCGGGGGTGGGCAAGTCGACTGCC
+ATCGAGGCGCTGGGCATGCATCTGATCGAGCGCGGGCATCGGGTGGCGGTGCTGGCGGTCGACCCGTCGT
+CGACCCGCACGGGTGGATCGATTCTTGGTGATAAAACCCGGATGGCGCGGCTGGCGGTGCACCCGAACGC
+CTACATCCGGCCGTCCCCGACGTCGGGAACGCTGGGTGGGGTGACGAGGGCCACCCGGGAAACGGTGGTG
+CTGTTGGAGGCGGCCGGTTTTGATGTGATCCTGATCGAAACCGTCGGGGTGGGCCAGTCCGAGGTCGCGG
+TGGCCAACATGGTCGACACGTTCGTGTTGCTGACCTTGGCCCGCACCGGTGATCAGTTGCAGGGCATCAA
+GAAGGGCGTGCTGGAGCTCGCCGACATCGTGGTGGTGAACAAGGCCGACGGGGAGCACCACAAAGAGGCC
+CGGCTGGCCGCCCGGGAGCTGTCGGCGGCGATCAGATTGATCTATCCTCGCGAAGCACTGTGGCGCCCAC
+CGGTGCTCACCATGAGCGCGGTGGAGGGCAGGGGACTGGCCGAGCTGTGGGACACCGTCGAGCGTCATCG
+CCAGGTGCTCACCGGGGCCGGCGAATTCGACGCCCGTCGGCGCGATCAGCAGGTCGACTGGACCTGGCAG
+CTGGTTCGCGACGCCGTCCTGGATCGGGTGTGGTCCAATCCGACGGTGCGCAAGGTCCGCTCCGAGCTCG
+AGCGTCGGGTCCGCGCCGGCGAACTGACCCCGGCCCTGGCGGCTCAGCAAATACTGGAGATAGCTAACCT
+AACGGATAGGTAAATAAATCCGTGTTTGCCGATGGTCGCTGCGAAATCCACGTAAGTTCGACCGTGTGAT
+GGTTGACACCGGAGTCGATCACCGCGCGGTTTCGTCCCACGACGGACCGGACGCGGGCCGGCGGGTGTTT
+GGTGCGGCGGACCCACGCTTTGCGTGCGTCGTTCGAGCCTTTGCCAGCATGTTTCCGGGGCGCCGGTTCG
+GTGGCGGAGCGCTGGCGGTGTATCTCGACGGGCAGCCGGTCGTCGACGTGTGGAAGGGGTGGGCTGATCG
+GGCCGGATGGGTGCCGTGGTCGGCGGATTCCGCGCCGATGGTGTTCTCGGCGACCAAGGGCATGACGGCC
+ACGGTCATCCACCGGCTGGCCGACCGGGGGCTGATCGACTACGAAGCTCCCGTTGCCGAGTATTGGCCGG
+CGTTCGGCGCCAACGGCAAGGCAACCCTGACGGTTCGTGACGTGATGCGACACCAGGCCGGCCTGTCCGG
+ATTGCGTGGCGCGACGCAGCAAGACTTGCTGGATCACGTCGTGATGGAAGAGCGGCTGGCGGCGGCGGTG
+CCCGGGCGGCTGCTGGGCAAATCCGCCTACCACGCGCTGACGTTCGGTTGGTTGATGTCGGGCCTGGCCA
+GGGCCGTCACCGGAAAGGACATGCGCCTGCTGTTCCGCGAGGAACTTGCCGAGCCGTTGGACACCGACGG
+CTTGCACCTGGGTCGGCCGCCGGCCGACGCGCCGACGCGGGTCGCCGAGATCATCATGCCGCAAGATATT
+GCCGCCAATGCGGTGCTGACCTGTGCGATGCGCCGGCTCGCCCATCGGTTCTCCGGCGGATTTCGCTCCA
+TGTATTTTCCCGGCGCCATCGCGGCCGTGCAGGGCGAGGCGCCGTTGCTGGACGCCGAGATACCCGCGGC
+CAACGGGGTGGCGACGGCGCGAGCGCTGGCGCGGATGTACGGCGCAATCGCCAACGGCGGCGAGATCGAC
+GGCATACGGTTCTTGTCGCGGGAGCTGGTCACGGGCCTGACCCGCAACCGACGGCAAGTTCTGCCGGATC
+GAAATCTATTGGTGCCCTTAAATTTTCATCTTGGCTATCACGGTATGCCGATCGGCAACGTGATGCCGGG
+GTTTGGTCATGTGGGCTTGGGCGGCTCGATCGGCTGGACAGACCCGGAGACCGGGGTGGCGTTCGCGCTG
+GTGCACAACCGGCTGCTGTCACCGTTGGTGATGACCGATCACGCAGGCTTTGTCGGCATCTACCACCTGA
+TCCGGCAGGCCGCCGCCCAGGCGCGCAAGCGTGGTTACCAGCCGGTGACGCCATTCGGGGCGCCGTACTC
+GGAGCCGGGAGCCGCGGCGGGCTAATCTGCCCGCCTAATCGGCCTGCCGGCAGCGGCGCTCGGCGCCACG
+GTGTCGCGATGCTTCCCGGATGCCGACCTAGCTCGCGGTTTTGGTCGCGATGACGATGTCCTGGAAGCTT
+AGGTGTGGTTCCCGGCCACTCCATGAGCCGTAGTGCAATGGTTCGTGCACGGCGAGGCCGAACTTGCCAT
+AGACATCCCTGACGAAGGTCTCCGGCAAGCCGATTGCTTCTTCGGGCCGCTTCTTGTGGATTGTCCGATA
+ACCCGGTCCCTCATGCTGGAAGTTGTGCGCACTCTTTCCTTCCGCGATGTGGGCTAACGACTCGTCATTG
+AGCAAGAAGTACGTGCACAGGCATCGTCCGCCGGGCTTCAGCACGCGGGAGATCTCGTCCAGATAGTGCT
+CCACGTCCGGCGGAAACATGTGGGTGAACACCGAGGTAAGAAACACCACATCGAACGACGCATCCGGATA
+TGGAAAGCGAAAGTCTAGTGACTGGTATTTCCCTTTCGGGTTGTACAGCGAGTTGTAGATGTCGGAGACC
+TCGAACTGGAAGTTGGGGTGCGCCGAGGTGATGTGCTCCTGGCACCACGCGATGGCTTTCTGCGAGATAT
+CGAAGCCGGCGTAGCGTCCCTCGCTGTTCAGATAGCCGGTGAGCGGCAACGCCATCCGCCCCGAGCCGCA
+GCCGACGTCGAGCACCGCTTCGTCCGGCTGCAGCCCACACAGGTCGACCAGATACCCGACGAATTCAGCA
+CCGACTTCCTTGTAGGCGCCGCCGACGAATTGTCGCAGGGATTTTGGAGGCAGCGCCTCGGCGGAGCCAC
+CGTCGGCTGAACCGCGTTTCGAGCGCGTCAGGATGTTCTGGAAAAGTCGCTTAATGATGCACCTCAGTTA
+TCGGCCGCGCTTGAAGGTTCAGGAATCCTCCAGGCGGAAGCCGACTTTCATAGTCACCTGGAAGTGCGCG
+ACCGCTCCGTCGACCAGGTGGCCTCGAATTGACTGTACTTCGAACCAGTCCAGCGCGCGCATGGTCTGCG
+CAGCTCGGGCCAGACCGCCCTGGATTGCCGCGTCGACGCCGTCGGGCGAGGTCCCGACGATCTCGATCAC
+TCGGTAGGTGTGATTGCTCGTCGTGTCCCCTCACATTCTTTTACCCGCTCTTACCGGCCAGCGGCACACC
+AGAATAGTCCGGTGCCATCGGGGGAGCCCTCTACGGCCGGTCACTTTGAGCACTTGCCGCGCGGCAGCTT
+CGGCCGGATTCTCTCCGTCCTCAATGCCGCTGCCGACCATCATCCACGTGAGTTGCTCGTCGTCGGGATT
+GCGACCTTCGACCAGAAGCGCCCGGCGGTGGGGGTCGATGAGCACGACCCGGGTGGTGCGGCGACGCCGG
+CGGTGGTCATCAACTACGAGAGCCGGTCGTCGGCTGGCGGCACCATCGGCCATTCAACAACGTCACAGGT
+AGCGTGCTGTTTGTATCAGCAGCCGAAACGCCCAGCGCTCCGGCCGACCAAGGCGGCAGCGACGACCGCA
+GCGACAACCTGGATCGAACGAGTCCAAAACCGCCGCGGACGCCACTCGGCCCTCGTATGATCCCGAGGAG
+ATACCCTACGGGGTGGATTGGGGATGGATCGGCGATGCGCCTCTCGATCGTAACGACTATGTACATGTCA
+GAGCCTTACGTGCTGGAGTTCTACAGGAGAGCGCGCGCGGCGGCGGACAAAATCACGCCTGACGTCGAGA
+TCATCTTCGTGGATGACGGCTCGCCGGACGCAGCGCTCCAGCAGGCCGTCTCGCTGCTCGACAGCGACCC
+CTGTGTTCGGGTAATTCAGCTTTCGCGAAATTTCGGCCACCACAAAGCGATGATGACCGGCCTGGCGCAC
+GCCACGGGGGATCTCGTCTTTCTGATCGACTCAGACTTGGAAGAGGACCCGGCTCTCCTAGAGCCGTTCT
+ATGAAAAGCTGATCTCGACGGGCGCCGACGTAGTATTTGGTTGCCACGCGCGGCGGCCCGGCGGTTGGTT
+GAGGAATTTCGGACCGAAAATCCATTATCGGGCGTCCGCCCTGCTGTGTGACCCCCCGCTTCATGAAAAT
+ACTCTCACCGTGCGGCTGATGACAGCCGACTATGTACGCAGCTTGGTCCAGCACCAGGAGCGTGAACTTT
+CGATTGCCGGTCTGTGGCAGATTACTGGTTTTTACCAGGTGCCCATGTCCGTAAACAAGGCATGGAAAGG
+AACGACCACATACACGTTTAGGCGTAAAGTAGCGACACTGGTCGACAATGTCACTTCATTTAGCAACAAA
+CCTCTAGTCTTCATTTTCTATCTTGGTGCGGCCATTTTTATTATTTCAAGCTCGGCCGCGGGCTATCTGA
+TCATCGATCGAATTTTCTTTCGCGCTCTGCAAGCGGGGTGGGCATCCGTGATCGTATCCATCTGGATGCT
+GGGGGGTGTGACGATTTTCTGCATAGGGCTGGTCGGAATTTATGTATCCAAAGTCTTCATCGAAACTAAG
+CAGCGGCCATACACAATTATCCGAAGAATCTACGGTTCGGATTTAACAACCCGGGAGCCATCCTCTCTGA
+AGACCGCCTTCCCGGCCGCGCACCTGTCGAACGGGAAACGCGTCACATCAGAGCCAGAGGGATTGGCAAC
+TGGCAACAGGTGAATAAGCGTAGCATGATTCCTGTAAAGGTTGAAAACAATACTTCGCTCGATCAGGTGC
+AAGACGCTCTTAATTGCGTCGGGTACGCGGTTGTAGAAGATGTGCTTGATGAGGCGTCACTGGCAGCGAC
+CCGTGATCGCATGTATCGTGTACAGGAGCGGATTCTTACCGAGATTGGCAAAGAGCGGCTGGCAAGGGCC
+GGTGAGCTCGGTGTTCTTCGACTCATGATGAAGTATGACCCTCATTTCTTTACCTTTCTTGAAATCCCCG
+AAGTCCTAAGCATCGTTGATCGTGTGCTATCTGAAACGGCCATCTTACATCTGCAGAATGGCTTTATCCT
+TCCGTCCTTCCCGCCCTTCTCCACGCCGGACGTTTTTCAGAATGCGTTCCACCAAGACTTTCCCAGGGTT
+CTGTCCGGTTACATTGCCTCCGTCAATATTATGTTCGCCATCGATCCCTTTACACGAGACACCGGCGCAA
+CGCTCGTAGTGCCGGGGAGCCACCAGCGCATAGAGAAACCGGACCATACCTACCTCGCGCGCAATGCCGT
+TCCCGTTCAATGCGCGGCGGGCTCGTTGTTCGTTTTTGACTCTACGCTTTGGCATGCGGCTGGCCGAAAC
+ACCTCCGGCAAAGACCGCTTGGCCATAAATCATCAGTTTACGCGCTCGTTTTTCAAGCAGCAGATCGACT
+ACGTCCGCGCGCTGGGCGACGCCGTGGTTCTGGAGCAGCCTGCGCGTACTCAGCAACTGCTCGGATGGTA
+CAGTCGAGTGGTTACCAATCTGGACGAGTATTACCAGCCGCCGGACAAGCGATTGTATCGGAAGGGGCAA
+GGCTAGTTTTGCGAGAATTCCGTTGCGCCTATTTGAAAGCCCGACATGAAACGATCGCTTTTAAGCGCAT
+ATGTCTGTTCTGCAAAAATGTCTAATTTTTCCGATAAAGGTTGGTGGGAAAGCTCGATGCGTGCCGTGTT
+TTGTAGGTGGCCGGATGATCCACTTAGACAGGCCGTGGAAGCAGAATTTGCGCGTCCCGATGGCGTTGCG
+GTGGCGTAATGGCCTGGCGAAAGCTCGGGAGAATTTTTGCTCCGTCGGGCGAACTCGACTGGTCGCGAAG
+TCATGCTGCGCTACCGGTTCCTGAATGGATCGAGGGTGATATTTTCCGCATCTATTTCAGCGGCCGCGAT
+GGTCAGAATCGTTCCAGTATCGGTAGCGTGATCGTCGATCTCGCCGTGGGCGGCAAGATTCTGGACATTC
+CGGCGGAGCCGATTTTGCGCCCCGGCGCTCGAGGAATGTTTGACGACTGTGGGGTGTCAATCGGATCGAT
+TGTGCGTGCCGGCGATACGCGACTTTTGTACTACACGGGCTGGAACTCGCTGTCACCGTGCCCTGGAAAA
+ACACCATAGGCGTGGCGATTAGCGAAGCAGGTGCACCATTCGAGCGATGGTCTACTTTTCCCGTCGTTGC
+GCTGGACGAGCGTGATCCATTCTCGCTTTCTTATCCCTGGGTCATCCAAGATGGAGGGACATACCGTATG
+TGGTATGGCTCAAATCTAGGCTGGGGAGAGGGCACCGACGAGATACCTCACGTGATCAGGTATGCGCAAT
+CAAGGGACGGTGTCCACTGGGAAAAGCAGGATCGCGTGCATATCGACACAAGCGGATCCGACAATAGCGC
+GGCCTGTAGGCCGTGCGTCGTCCGCGATGCGGGAGTATACAGAATGTGGTTTTGCGCTCGCGGTGCGAAA
+TATCGGATTTACTGCGCTACATCGGAGGATGGTTTGACTTGGCGGCAACTCGGCAAAGATGAGGGCATCG
+ACGTTTCGCCAGATAGCTGGGACTCGGATATGATCGAGTATCCTTGTGTGTTCGATCACAGGGGACAGCG
+CTTTATGCTTTATTCGGGCGATGGCTACGGTCGCACCGGGTTCGGTTTGGCGGTGCTGGAGAACTGATCA
+GGGCTGACAATAGATGTTTAGCGGCTGATGATGCGCTTCCCGCTCGAATAGGCTGAGACCATTATTGCCG
+CGGTAGCGATGATTTCCCGGATTATCGTCGTCGCCGCGATCACTCACTGCTCGTCGAGGCCCTTTAAGGG
+CTTCATTGTATCCTTCGCACTGCTTATCTTCATGCGCGCAACGTCAGGATGCGCGTGAGCGCCTCGACAA
+CGCGGCTCTGATCTACCTCCTGAAGTCCAACCCACATCGGCAGACGGATTAGGCGGGAAGCCACGTCGTT
+GGTGACGGTCAGGTTGCCATTGGTGCGGCCGTAGCGACGCCCGGCCGGCGAATCGTGAAGCGGCACGTAA
+TGAAAGACCGCGCCTATACCTTTGCTCGTCAGACGCGCCAGCACCTCCTCCCGATCGGCGCTGGGCGCTA
+GTAACACGTAGTACATGTGGGCGTTGTGAGAGCAGCCCTGTGGGATGATCGGACGGCGCAGGAGCCCCCG
+CTGTTCCAATGATTCGAAGCTTTCATGATACCGGTTCCATAGGTCCAATCGGATACGCGTGATCCGCTCG
+GCTTCCTCGAACTGAGCCCATAGAAAGGCAGCGACTAATTCGCTGGGCAAATAGGAAGACCCTTTGTCCT
+GCCACGTATATTTGTCGACCTCGTTGCGAAGGAAGCGGCTGCGATTGGTGCCCTTTTCCCTGAGAATCTC
+TGCCCGGAGCAGGAAGTCTTCTGAGTTGACAAGCAGGGCGCCGCCTTCGCCGGAAATCACATTCTTGGTC
+TCGTGAAATGAGAGCGCTCCCAGGTCGCCGATGCTGCCGAGCGCCCGCCCACGATACGACGCCATCGCGC
+CTTGGGCCGCGTCTTCGACCACCGCCAGGTTGTGGTGCGTGGCGATCTTCATGATCGCGTCCATCTCGCA
+GGCCACGCCGGCATAGTGAACGGGGACGATGGCCTTGGTTCGCGGGGTGATGGCGTCTACGATGCGAGTT
+TCATCAATGTTGAGCGTGTCGGGCCGAATATCGACAAAGACTGGCACACCACCGCGCAACACGAAGGCGT
+TGGCGGTAGAGACAAAGGTGTATGACGGCAGTATGACTTCGTCCCCCTCCTCTATGTCCAGAAGCAGCGC
+CATCATTTCCAGCGCGGCGGTGCATGAGGGGGTGAGTAGTGCCTTGCGACAACCGGTCTGCTGTTCGAGC
+CATGCATGGCTACGCCGGGTGAAGGGACCATCGCCGGCCAGGTGGCCGCAAGAATGCGCTTCGGCGATGT
+ACGCGAGCTCCCGGCCGGTCATGTACGGCCGATTGAATGGAACTTTGTGATCTGACACTCGACGCCAACT
+TCTCAAATCATCGAACAGGGCGCTGAAGTGTTCGGTGATCGGGGTCGAACATCCACCAGAATTCTCCTTG
+TGGCCGGCGGATCCCTAGCCTTTTCAGGTATCCCAACATGCCTTCACTATTTCTTCATATCTTCCGCAAC
+TCCGTGCTGGGCACCGGACGGCGCTCCGTCTTGGTTCCTATATAGACACCATCCGCGTCAGCGTCGCCAA
+GGAGTAGGGCGCCCGCTCCGACCACACACCGTGAACCGATGGTGATATGGTCGCGTAGCGTTGCATTGAC
+GCCAATGAAAGATTGCTCCTCTATTACCACGCCACCGGATACGACGATATGAGACGCTAGAAAACAGTGA
+TCGTGAATCGTCGAGTGATGGCCGATATGATTGCCGCTCCACAATGTGACGTTGTTGCCAATCGATACGA
+ATGGCTGGATAGTGTTGTCTTCAAGCAGGAAGACATTTTCACCGATCCGCCCATCGTTCAAGACGGTAGC
+GTGGGAGCTCACATAGCTGGCGAGTTCATAGCCGAGAGCCTTAGCGGCAAGATATTTTTCCTTCCGCACA
+CCGTTCAGTTTGGCGTAGGCCAGCGCCACGAACATCGCGTGGGACTCCGGCGGAAAGCGTTGTGCGACCT
+CGTCGAAGGCCACTAAAGGCAGGCCGCAAAACTCGGACACGCTTGCATAGTCTCGGTCGACTGTGAACGC
+GACGACCTCATATTCCGAATCCCTTGTGAAGTAGTAATGTGCGAGCTGAGCGATGTCGCCGCTCCCAAAA
+ATTACCAATGGTTTGGTCATGACGCCTTCCTAACCAGAATTGTGAATTCATACAAGCCGTAGTCGTGCAG
+AAGCGCAACACTCTTGGAGTGGCCTACAACGGCGCTCTCCGCGGCGCGGGCGTACCGGATATCTTAGCTG
+GTCAATAGCCATTTTTCAGCAATTTCTCAGTAACGCTACGGGGCGCGCCGTGCCGTAGTAGCGTCCCCAC
+TGATGTGGACGATGGTGCTCCTTTTGGGGTTGGGGATGGCGATTGACCCGGCGCGTCTGGGACTCGCGGT
+CGTCATGCTGTCGCGGCGTCGGCCCATGCTGAATCTGTTCGCCTTCTGGGTGGGCGGCATGGTGGCGGGT
+GTCGGCATCGCGCTAGCCGTGCTGGTGTTCATGCGCGATGTCGCCTTGGCGGCCATACAAGGCGTGGTGT
+CCGCGGCCAACGAGTTCAGGGAAGCGGTCGGGATCCTGGCGGGTGGGCGTCTGCACATCGTCATCGGTGT
+CATCATGCTGCTGTTGGCCGCGCGCATGGTGGCTCGCGCGCGGGCGCAGGTAGGGGTACCGGTAGGGCCA
+GTGGGGGTAGCCGACGGTGGAATGTCGGCCCTGGCGCTAGCGCAGCGCCCCCCGGGTCTTGTTGCGCGGC
+TGGAAGTGCGTACTCAACAGATGCTGCAGGGCGACGTTGTGTGGCCGGCGTTCGTGGTGGGCGTCGCCTC
+GTCCGCACCGCCCTTCGAGAGTGTGGTGGCGTTGACGGTCATCATGGCATCGGGAGCCGAGATCGGCACT
+CAGTTCGGCGCATTTGTCGTGTTCACCCTCCTGGTGCTTGCGGTCATCGAGATTCCGTTGGTCGCCTACC
+TGGCGATACCGCAGCAAACCCAGCAGGTTATGCTGCGGTTTCAGGATTGGGTACGGTCCAATCGTCGGCA
+GATCTCCCTCACCATCCTGATAGGGGTCGGGTTCCTCTTTTTGTACCAGGGCGTGACTAGTCTCTGAGTC
+GCCATGTGGTGCCTGGTGATGCATCAAGCGTGGTATCGGTGAACCCGGCGAAACCGCTTATCTCGGTGTG
+CATCCCGATGTACAACAACGGCGCCACCATCGAGCGCTGTCTGCGTAGCATCCTCGAACAGGAGGGCGTC
+GAGTTCGAGATCGTGGTCGTTGACGACGACTCGTCCGACGACTGCGCCGCGATCGCCGCAACGATGCTGC
+GACCCGGAGACCGCTTGCTGCGAAATGAGCCTCGCCTCGGCCTCAACCGAAACCACAACAAATGTCTGGA
+AGTCGCGCGCGGCGGACTTATTCAGTTCGTACATGGTGATGATCGGCTGCTCCCCGGAGCCCTGCAGACA
+CTCAGCCGACGTTTTGAGGATCCCAGTGTCGGAATGGCTTTCGCCCCCCGACGGGTGGAGAGCGACGACA
+TCAAGTGGCAACAACGGTACGGCAGGGTCCATACCCGTTTCCGCAAGCTGCGCGACCGCAACCACGGGCC
+GTCGCTGGTCTTGCAGATGGTATTGCACGGCGCGAAGGAAAATTGGATCGGCGAACCGACCGCCGTGATG
+TTTCGGCGGCAATTGGCGCTGGACGCCGGTGGTTTTCGCACCGATATCTACCAGCTCGTCGATGTGGACT
+TCTGGCTTCGGTTGATGCTGAGGTCGGCGGTCTGCTTCGTTCCGCACGAGCTCTCGGTGCGCCGTCACAC
+GGCGGCGACGGAGACCACACGGGTGATGGCGACTCGGCGCAACGTGCTGGACCGACAGCGCATTCTCACC
+TGGTTGATCGTGGACCCGTTGTCGCCCAACAGAGTTCGCAGCGCCGCGGCGCTGTGGTGGATACCCGCAT
+GGCTGGCCATGATCGTGGAGGTGGCCGTGCTCGGACCGCAGCGGCGGACGCACTTGAAGGCTTTGGCGCC
+GGCCCCATTCCGCGAGTTCGCCCACGCCCGGCGTCAACTGCCGCTGGCTGACTAGCAGTCGCACTCTGCC
+TGGCCGTCGTCGGAGCCACAGACAATTCCAACCCATTTGGCCTGGCGGCCAAGATGACATTTTTACAAGG
+TAAGGCTAGCCTTAAGCGTCCGCGTATCCAGGACCTCGGGTCTGTTGCGTTGTGGTTGCCTCGCATGCGA
+CGGAGTGCTCTGCGCCAACGGCCCAGGTCGTCCGAGAAGGCCAGCCTTGACCTGTACAGCTGTGGCGACC
+CGAACGTTGCACAGCTTGGCGACGAATGCCGAGTTGGTCGAGTCGGCCGATCTGACCGTCACCGAGGATA
+TTTGCTCGCGAATCGTGTCGCTGCCAGTTCACGACCACATGGCCATTGCCGACGTTGCGCGGGTCGTTGC
+GCCGTTCGGGGAAGGGTTAGCGCGCGGTGGTTGACCCGACAGCGACGGATTCGCCCAAGGTGAGTATCGT
+CTCGATCTCCTACAACCAAGAGGAGTACATTCGCGAGGCCCTGGACGGCTTCGCCGCCCAGAGGACCGAG
+TTCCCCGTCGAGGTGATCATCGCTGACGATGCCTCCACGGACGCCACCCCGAGGATCATAGGAGAGTACG
+CCGCCCGCTATCCGCAGCTGTTTCGGCCGATCCTGCGGCAGACCAACATCGGTGTCCACGCCAATTTCAA
+GGATGTGCTGTCCGCCGCTCGTGGCGAGTACCTCGCACTGTGCGAAGGCGACGATTACTGGACCGATCCG
+CTGAAGCTGTCCAAGCAGGTAAAGTACCTGGACCGGCATCCGGAGACGACGGTGTGTTTTCATCCTGTGC
+GAGTGATCTATGAGGATGGCGCAAAAGACTCCGAGTTCCCGCCGCTCAGCTGGCGCCGCGACCTGAGCGT
+CGATGCCCTGCTCGCGCGGAACTTCATCCAAACCAACTCGGTCGTGTACCGCCGTCAGCCGAGCTACGAC
+GACATCCCGGCCAACGTCATGCCGATAGATTGGTACTTGCATGTGCGGCATGCGGTGGGCGGCGAGATCG
+CCATGTTGCCCGAGACGATGGCGGTCTACCGTCGCCACGCTCACGGTATTTGGCATTCCGCGTACACTGA
+CCGCCGAAAGTTTTGGGAGACACGAGGCCATGGGATGGCCGCGACGCTCGAGGCGATGCTCGACCTAGTT
+CACGGCCACCGCGAGCGCGAGGCGATCGTCGGTGAGGTGTCCGCCTGGGTGCTTCGCGAGATCGGAAAGA
+CACCCGGCCGACAGGGTCGCGCCCTGCTTCTGAAGTCCATCGCGGACCATCCGCGGATGACGATGCTGTC
+GCTACAACACCGGTGGGCGCAAACGCCCTGGCGGCGGTTCAAGCGCCGGCTGTCCACCGAGTTATCGAGC
+TTGGCGGCGCTTGCGTACGCCACCCGACGGCGCGCACTCGAAGGTCGGGACGGCGGTTATCGCGAAACCA
+CTTCTCCGCCGACCGGTAGGGGACGTAACGTCCGCGGATCACATGCCTAGATCTTGATAGATCGCCCGTC
+TGGCCTCTATGGATGGAGCATGCGGGATCGGACCGGTTGCCGCCGACTCGACGACCGAAAGAGCCATCAA
+ATAGCCTTGCGGCCCATCTTTGAGATCTGTCAACCCGCCGGTCCTGATGTCCTCCAGGCTCTGGTCGGGA
+TGAGCTAGTGCGGTTCCCGAACTCGGCATCTTCGTCAGTCCTGGAGAGAAACAACACCAGCGAAGGTAGT
+GTGATGTCCGTGGTCGAATCCTCTCTTCCTGGTGTGCTGCGTGAACGCGCCAGTTTTCAGCCCAACGACA
+AAGCGCTCACCTTTATCGATTACGAGCGGTCCTGGGATGGTGTTGAAGAAACTCTGACGTGGTCGCAGTT
+ATATCGGCGAACGCTTAACCTCGCCGCACAGCTAAGAGAACATGGGTCGACCGGCGATCGGGCATTAATT
+CTGGCGCCACAAATCCTCGACTATGTCGTTAGCTTTATTGCCTCGCTGCAGGCCGGAATTGTCGCGGTTC
+CGCTTTCGATTCCCCAGGGTGGTGCCCACGACGAGCGCACCGTTTCCGTGTTCGCCGATACCGCACCGGC
+GATCGTTCTCACGGCGTCCTCGGTCGTCGACAATGTCGTCGAATACGTCCAGCCGCAGCCCGGCCAAAAC
+GCACCGGCGGTGATCGAAGTCGATCGGCTGGATCTTGATGCTCGGCCGAGCTCCGGTTCTCGTTCTGCCG
+CTCACGGCCATCCGGATATCTTGTACTTGCAGTACACCTCGGGTTCCACGCGCACGCCGGCCGGTGTCAT
+GGTCTCGAATAAGAATCTTTTCGCCAATTTCGAACAAATTATGACCAGTTACTACGGCGTCTATGGCAAG
+GTCGCCCCGCCAGGCTCCACCGTGGTGTCGTGGTTGCCGTTCTATCACGACATGGGTTTCGTCTTGGGAC
+TGATATTGCCGATTCTGGCTGGCATCCCCGCCGTGCTGACCAGCCCGATCGGTTTCCTGCAGCGCCCGGC
+TCGCTGGATACAGATGTTGGCAAGCAACACTCTTGCGTTTACCGCCGCGCCGAACTTCGCATTCGATCTG
+GCGTCTCGTAAGACCAAAGACGAGGACATGGAGGGCCTCGATCTCGGTGGCGTGCACGGCATCCTCAACG
+GCAGCGAACGGGTGCAGCCGGTGACGCTGAAGCGCTTCATCGACCGGTTCGCCCCGTTCAATCTTGACCC
+CAAGGCGATACGTCCGTCGTACGGAATGGCAGAGGCCACGGTATATGTGGCCACCCGCAAGGCGGGTCAA
+CCGCCAAAGATAGTGCAATTCGATCCCCAGAAGCTGCCGGACGGCCAAGCTGAGCGGACCGAAAGCGACG
+GCGGCACACCGCTGGTCAGCTACGGCATCGTCGACACCCAGCTGGTGCGCATCGTCGACCCGGACACCGG
+CATCGAGCGCCCCGCGGGAACGATCGGTGAGATTTGGGTGCACGGCGACAACGTCGCCATCGGCTATTGG
+CAGAAACCCGAGGCGACCGAACGCACCTTTAGCGCAACGATCGTCAATCCCTCCGAAGGCACACCCGCAG
+GACCATGGCTGCGGACGGGAGATTCGGGTTTCCTCTCCGAGGGTGAGCTGTTCATCATGGGGCGCATCAA
+GGACCTCTTGATCGTGTACGGGCGCAACCACTCTCCCGACGATATCGAGGCGACGATTCAGACGATCAGT
+CCGGGCCGCTGTGCGGCGATCGCTGTTTCCGAGCATGGTGCTGAGAAGCTGGTTGCCATTATTGAACTCA
+AGAAGAAGGACGAGTCCGACGACGAGGCGGCGGAACGACTGGGTTTCGTGAAACGCGAAGTGACCTCGGC
+AATCTCGAAGTCGCACGGGTTGAGCGTGGCGGATCTTGTGCTCGTCTCCCCGGGCTCAATCCCAATCACC
+ACCAGCGGCAAGATCCGGCGAGCACAGTGTGTGGAGCTGTACCGTCAGGACGAGTTCACTCGCCTGGACG
+CATAGCACCCACAGGCGAGGCTCCCGCAATGGGGCGCAATGGGGATCGTCACACCAGTAGCACCAGCCCC
+TGGAGGGGCAACAGGGGAAAACTGAGTTGAGCGCCAACCGTGCGCACTGAGGCTCAGGTGCTCAGCTTCG
+CGTCGGGCTTTGACCCCGCGTGACCGACTGCGGGTTCGCCGATAGACGTGTCATCCCAACGGTCGTAGCT
+CGGTAGGCCGGCAAGACCGAACAGCGGCAGCTAGTGGCCGAGTAGATGGTCGACGGGTTCTTTACCGATG
+TGGGCGCCGTCGCCGTTGGGTTTCGACACGCCATCCACGACATCGTAGGCCGGCATGGCGGCATAGCCGA
+ACAGCGGAAGCGAATGTCTGCGCAGGTGGTCGATCAGGTACTCCCCGTTGCCTTCGGCTAGGTCAGCGGG
+CTTGCCGTTGGGAACCGACTTGGTTGCCGCCTTGCTTGCGTGCCCGTTGGTGTTGCGGACGACCTTGGTG
+TGGGGCGGCTTGGGCGCCGGGATCGGGGCCTTGCGTCGGTGGCCTTTCACCCGCCGCAGCCACCGATCGG
+CTTTGGTCGGCGGCGTGGATGGGTCGCGTCCCAGCTCGGACGGCCACCAGTTTGCCCGGCCAATCATCGT
+GGTCAAGGCCGGCACCGTGACCGTGCGGACCAGGAAGGTGTCCAGCACGATCCCGATGCCGATGGTGAAA
+CCGGCCTGAGCCATCGTGTTGATGTTCGCGCCCACCAGACCGAACATCGACGCGGCGAAGATGAGACCCG
+CCGAGGTGATAACACCACCGGTGGAGCCCACGGTTCGGATGACGCCGATGCGTATACCGTGTGGTGATTC
+GTCGCGGATGCGTGAAATGAGCAGCATGTTGTAGTCAGCGCCGATGGCAACCAATAATATGAAGGACAGT
+CCCGGCAGGCTCCAATGCATTTCCTGGCCCAGTATCAATTGGAAAACGAGAGTTCCTATGCCTAGGGCCG
+ACAAGTAAGAAATCAGCACCGAGCCTATCAGATATATCGGAGCCACAAGTGCGCGCAGCAGAATGACGAG
+AATCAAGAATACGATAACGATCGTCGCAATGACGATGAATTTCATATCGCTGTTGTAGTAGTCGCGGATA
+TCCCGCAGCGCAGTCGGAACCCCCGCCAGACCTATCGTGGCATCCTCGAGTTCGGTATTCGGTCGCGCGG
+AATCCGCAACACGGAGGATATCGTTGACCTGATCCATCGCCTCGGTGGTGGCCGGATTCAGCGCGCTCTG
+CACGAAGTACCGCGCCGCATGACCATCGGCCGACAGGAAAATCTGGGCGCCCTTCTTGAACTCGTCCCTC
+GAAAAAATCTGCGGTGGAATGTTGAAGCCCGCCATTGACGGCTTGTCCGCATCCCGCTTGATCCCCAACA
+GGAAGTCGGCGGCCTCGTTGAGCCCTGAGCCCATCTTTTTGACCTGATCGACCAATTCCTGCACGCCTGC
+CGCCAGCGCTGCGCTGCCGTCGGCGAGAGCGTTGGCTCCTTGCTGCATTTGAGCCAATTTGGTGGGTAGG
+CCGTCGACCGCTTTGAGGGTGCTGACGACTTGCTTCAGTTGCCCGTCCAGTGTGCTCACCGTCCGGGCGA
+GTGTCTGGTATTCCTGCGTCTGTTGCAGGGTGACGGCTAGCGCTCTGATGGACCTGAGCAGGCCGTCGTC
+CTGCGCCTGGACAATCGCCGCCAACTGTGCGCGCGACGTCCGACAGGCGGGATCGCTGTTACACACCGGG
+CTGGAGTTGAGGGCGTTGACCATAGGGCTGGCCCAAGTGGCGATTTGTTCGGCATCGGTGACGGTCCCGC
+TCAGATTGTCCCCCAGAGCCCGCATGCGCCCGACATATTGGGACGCATTTTCCAGTTGTCGGATGGTCTT
+GTCGCCGCCCATCAGGTCCATCATGGCCTGCAGGGTGTTGACTATCCCGCTCGAGCTGGCCACGGCCCCA
+TTGATTTCGTTGCGTATTTGGGCGAGGGCGTCGGCCAACTGGTGCGCACCGCCGGTCAGCTGGTCCAGCT
+CGCCTCCGTGCTCTTCGAGCAGGGTGGTCGCTTCGTCGAGCTTGCCGCCCACTTCACCAGCCTGAAACGA
+GACCTTGGTCTCCTTCAGAGGTTCCCCGTTCGGTCGGGTCAAGCCCCGCACCATCACGATGTTGGGCAAT
+TCTGCTATCTCGCGGGACATCATCTCGATGTCGGCAAGCGCGCCGGGTGTCCGCAGGTCTCGGGGGGATT
+TGATGAACAGCACCATCGGAGTCATCGCGTTCATCGGGAAATGGCGGTTCATCGCCTCGTATCCTTTGAC
+GCTTTCGACGTGCTGCGGCACCGTCTTGAGATCGTCGTAGTTGAATCGGATCAGCAGCGTGCAGCCGGCC
+AGGGCGACCAGCACAATGAGACTGCCGACCAGGTGGATGGTGGGCCGACGCACGATGCGAACACCCGAAC
+GCCGCCACATTCGACTGGTCAGGTCGCGTCGCGGCTTGATCCAGCCCCGCCGTCCGGTGAGTGTCAGGAT
+GGCGGGCAGCAGGGTGACCGCACCCAGCAGCGACACCGTGATGGCAACCGCAATTGCCGGGCCCACCGCC
+GAAAACACTTCCAGTTTGGTGAACACCATCGCCAGAAATGTGACGGCGACGGTGGCCGCCGATGCGGTGA
+TCACCTTGCCGATGGACATCAACGCCTTCTTGACCGCCATGTCCGATTTTTCGCCGTGGCGCACATAGTC
+GTGATAGCGACTTATCAGAAAGACGGCGTAATCGGTTCCCGCCCCGATCATGACCGCGCTCATAAAGACG
+ATCGCCTGCATGTTCACGGCCAGGCCGAACTCGGCGAGCCCGGACAACGTGCCCTGCGCAGTGACCACCG
+ACGCTCCGATGGTGGCCAGCGGCACCAGCATGGTCACCAGGTTCCGATAGACGAGGATCAGGATGATCAG
+CACGCTGACCGCGGCGCCGATCTCGATGATCCGCACATCTTTCTCGCCGAGCTCCGTCAGGTCGGCGACC
+GTGGCGATCGGACCGCTGAGGTGGACGGTCAGGCTGGTTCCCGCGACTGTTTGCTTGACGATCGCGGCGA
+CGCGTTTGAACGCCGCTTGTGTCTCAGGCGACGCGGCATCGCCCGCGAACGTGATGGGCAGGTTCCAAGC
+CTTGTTGTCCTTGCTGGCCAACAGCTCCTTCATTTCGGGGACGGCGAGAAAATCCTGAACCGATATTTTG
+TCCTGCGTGTCCGCCCGCAGGTTTTCGATCAGTTTTCGGTAGACGGCCTCGTCGGCGGGTCCCAGCCCGT
+TCTCGTTGGTCAAGAGGACCAAAAGGAGGGCGGAGGTCTCAATTTTTTCCTGGAAAGCCGCGCTCATCTC
+CTTTTGCAGGACCATCGATGGGGCCCCGGGCGGCAGGGGAGCTTGCTCGCGCTTTGCGGCTTGCGCCTGC
+AGCGTTGGGAGCAACAGCGTCAGCGCGGCCGCCACCGCGATCCAGCACCCAATGACGATCAGCGGCCATC
+GCACCACGAAGTTGCCGATACGGTCGAACAGTCCCCCGGCTTTGGCCTCGTCATGCCTTGCCACCCGATA
+ACCGTACAAGCCTGGCAATCGGTGGCGTGGGGAAATGACGATAACCGCATTAACCGTGACGTTGCCGTTA
+CTTTGGCGGCGTTTGACCACTGCGGGCGTCAAATACGCAGATCAGGGGCATTTCGTGGGATCGGCTGGCG
+TGCCCGCAGCCGACGCTGGCGGGCGGGATGCGGCGTCCGAACAGATAGCTCGCTGGACTCAAACTTGCAC
+GGTCGTGCTGGTTTGCGGTCACGGTCCGGCAAAGTGGGCATTTCGGTCCTGGTGCACCTCGCGGTCGTGC
+GACACTCTCCCCGTGGCTCTTAGGTATCGCCTGCAGTCCAATCCGTTGGTCGGCAAGCTCACGACCAAGT
+ACTTCTTGCCGCTTGGCACTCGCCAGGTCGGCGATCACGTGGTGTTTTTCAACTTCGGCTACGAGGAGGA
+TCCGCCGATGGCGTTGCCGCTGTCGGAGTCCGACGAGCCCAATCGGTATTGCATCCAGCTCTACCACCAG
+ACGGCCAGTCAGGTGGACCTCACCGGCAAGGAGGTGCTAGAGGTCAGTTGTGGCGCCGGTGGCGGGGCCT
+CCTACATCGCCCGCAACCTAGGTCCGGCCTCCTACACGGGGCTGGACTTGAATCCGGCCAGCATCGACCT
+CTGCCGGGCAAAGCACCGGCTGCCCGGCCTGCAGTTCGTGCAGGGCGACGCGCAGAACCTGCCTTTCCCC
+GACGAATCCTTCGATGCGGTGGTCAATGTCGAAGCCTCGCACCAGTACCCCGACTTTCGCGGCTTCTTGG
+CCGAAGTGGCGCGCGTGCTTCGCCCGGGCGGACACTTCCTCTACACCGATTCCCGTCGAAATCCCGTCGT
+CGCCGAATGGGAGGCGGCGTTGGCCGATGCTCCGCTGCGCACGATTTCGCAGCGGGACATCGGCGCGCAG
+GCCAAGCGTGGGTTGGATGCGAACACGGCGCGTTCGCAAGAGGCCATCGGCCGCCGCGCACCCGTATTGC
+TGGCCGGCTTGACCCGCTGTGCGGTGCGTGTGCTGGACTGGGATCTACGTCGCGGCGGCGGGTTCAGCTA
+TCGGATCTACTTGTTCGCCAAGGATTGATTCGGCGAGACCACACCCATGAAAAACTCATGAAATTTGTCG
+TGGCCAGCTATGGGACTCGCGGCGACATCGAGCCCTGCGCAGCGGTCGGCCTGGAGCTGCAGCGGCGCGG
+CCATGATGTGTGCCTTGCCGTGCCGCCCAACCTGATTGGTTTCGTGGAAACGGCCGGGCTGTCTGCTGTC
+GCATACGGAAGCAGGGACTCTCAGGAGCAGCTCGACGAGCAGTTCCTGCACAACGCGTGGAAACTTCAGA
+ACCCCATCAAGCTGCTGCGTGAAGCGATGGCGCCCGTCACCGAGGGCTGGGCGGAGCTGAGCGCGATGTT
+GACGCCGGTGGCCGCCGGGGCCGACCTGCTGTTGACCGGTCAGATCTACCAGGAGGTGGTCGCCAACGTC
+GCCGAGCACCACGGCATTCCGTTGGCCGCGCTGCATTTTTATCCGGTGCGAGCCAATGGCGAGATCGCCT
+TTCCCGCGCGGCTGCCGGCGCCACTGGTCCGCTCCACCATCACGGCCATCGACTGGCTGTATTGGCGCAT
+GACGAAAGGTGTTGAGGACGCGCAGCGGCGTGAACTGGGCCTGCCGAAGGCGTCAACTCCCGCGCCGCGG
+CGAATGGCCGTACGCGGGTCGCTGGAGATCCAAGCCTACGACGCGCTTTGCTTCCCGGGGCTGGCAGCGG
+AATGGGGCGGCCGACGCCCGTTTGTCGGCGCGTTGACGATGGAATCGGCGACCGACGCGGACGACGAGGT
+CGCTTCATGGATCGCTGCCGATACACCGCCGATTTATTTCGGCTTTGGCAGCATGCCGATCGGATCCCTG
+GCCGACCGGGTCGCCATGATCAGTGCGGCCTGCGCGGAGTTGGGCGAGCGCGCGTTGATTTGCTCGGGAC
+CCAGCGATGCGACCGGAATCCCGCAGTTCGATCACGTGAAGGTGGTGCGTGTGGTCAGCCACGCGGCGGT
+CTTTCCCACCTGCCGTGCGGTCGTCCACCATGGCGGCGCGGGCACCACCGCCGCCGGTCTTCGAGCCGGT
+ATCCCCACCTTGATTCTGTGGGTCACCTCCGACCAGCCGATCTGGGCTGCTCAGATCAAACAGCTGAAAG
+TAGGCCGGGGGAGACGCTTTTCAAGCGCCACCAAAGAATCGCTGATTGCCGACCTTCGAACGATACTTGC
+GCCGGACTATGTCACCCGAGCGCGGGAGATCGCGTCTCGGATGACCAAACCCGCCGCCAGCGTCACGGCC
+ACCGCCGATCTGCTCGAAGATGCAGCCCGCCGTGCGCGCTAAGCGAGGGTGGCGCTTCGGCGAATGGCCT
+TCGGCGCGAGGATGATCGTTGTACGCTCCGCTTGTGTCCCTGATGATTACGGTGCCGGTGTTTGGGCAGC
+ACGAATACACCCACGCACTCGTGGCCGACCTGGAACGTGAGGGCGCCGACTATCTCATCGTCGACAACCG
+CGGTGATTATCCTAGGATCGGCACCGAGCGAGTGAGCACACCGGGAGAGAACCTAGGCTGGGCCGGGGGG
+AGCGAGCTCGGTTTCCGACTTGCGTTCGCGGAGGGTTACTCCCACGCAATGACGCTCAACAACGACACCC
+GGGTCTCGAAGGGATTTGTTGCCGCGTTGCTCGACTCGCGGCTACCGGCCGACGCCGGAATGGTCGGGCC
+GATGTTTGACGTGGGTTTTCCCTTCGCGGTAGCTGACGAGAAACCAGACGCCGAAAGCTATGTTCCGCGA
+GCGCGATACCGGAAGGTGCCCGCAGTCGAGGGAACGGCGCTGGTGATGTCGCGGGATTGCTGGGATGCGG
+TCGGCGGCATGGACCTGTCCACGTTCGGGCGCTACGGATGGGGGCTCGACCTGGATCTCGCGTTACGGGC
+TCGAAAGTCCGGGTATGGCCTGTACACAACCGAGATGGCCTACATCAACCATTTCGGGCGCAAGACCGCC
+AATACGCACTTCGGTGGGCACCGGTATCACTGGGGTGCAAGTGCGGCCATGATCCGGGGATTGCGTCGAA
+CGCATGGCTGGCCCGCCGCTATGGGTATCTTGCGGGAGATGGGGATGGCCCATCATCGTAAGTGGCACAA
+GTCATTTCCGCTCACCTGCCCGGCGAGCTGCTAGGCGTGCTCCCAGGCGTTTGGCGTGCCGTCGCCTCCA
+GCAGGTCCGCGGCCGCGGTGACGGCGGCTGTCGGCCGGGTCATCCGTGTCGAGATCTCACGTGCCCGCGC
+GGCGCATTCCGGCGCCAGGATCGATCGTAGCTCCTTGAGCAATGACCCGCGGGTGATGTTCGTAAAGCGT
+TTGGCAGAGCCGACTTTGAGTCGTTGGACGGCACCGGCCCAGATCGGTTGATCGGCCACGTCCCAGAGAA
+TCAGCGTGGGCATTCCCGCTCGCAGGCCGGCGGCGGTGGTACCGGCGCCACCGTGGTGGACGACCGCGCG
+GCACTTGGGAAGGATGGTCGAATAGTTGACCAGGCCGACACGTTTCACGTGGTCGGCATGACGAATGCGG
+GTGGAGTTGGCTGCCGGAGAATAGATCAGGGCTCGCTCGCCGAGCTGTGCGCAGACATCGGAGATCATGG
+CGAGCGTTTGGACGGGCGTTTGGACGGGCGTGCTGCCGAAGCCGAAGTAGATGGGTGGTGTTCCGGCGGC
+GATCCACGACTCGAGTTCTTCGTTGGGTTCGCTGTGTAACTCCATGGTCAGCGGGCCGACAAACGGGCGG
+CGGTCGCTCCATTCGGCCGCCAGTCCGGGGAAAAAAACCGGGTCGTAGGCTTGGATTTCGGGCGCTCCGC
+GTTCCGCCAGCCGACGCACCGCCGGCGCCGGTGCTGGCGGTAGGCCCAGTTCACGTCGTTGCGCGCGATC
+GGCATCCTTGCTGACGTACGCATACAGCCGCCATGAGACCTTCATCGTCGCGCGCACCAGAGTCGCCGGC
+GTCGGTATCGACGGGATCGCGATTTGGCCGTTGACCTGCATCGGAAAGTGATGCAGTGCCGCAGCCGGAA
+TGTCGTAGTACTCGGCGACGTTGGCTGCCACACCATGATATGTCTGGCCCGTCATCACCAGGTCGGCGCC
+GTCGGCCAACGTGGTCAACGTCGTGCCCATCTCCGCCCAGCCTTCGACGAATAGTTCCTTGACGGCGCGG
+GCGAGGTTGAGCGGATTCTGGGCTCTGGTGAGGTTGCGGACGAATGCCGCGACCGTGTTGATCTGTTCGT
+CCGAGTCCGGGCCGTAGGCGACGCCGGTCAGACCTGCCGACTCGACGAACTCGATCAGGTTGGGCGGCAC
+TGCCATATGAACTGCGTGGCCTCGCCGCCGCAGCTCCACGCCAACCGCGGCGCAAGGTTCGACATCACCG
+CGGGTTCCGTGGACCGCCAAGACAAACTTCATCAGCGCCTTCCCGCGTTCGACGTCAGGCGGGTGCCGGC
+GCGTCCCTGTCGGCCGCCAACTTGTCGCACATCAGATCCGCCAGGCCACGAACGGTGGTGTTGATTTCGG
+TGGCGGAAATGCGGATCCCGGTTTCGGCTTCCACCCGCGCACGCAGTTCCTGGCTGCTCAGTGAGTCCAG
+GCCGTACTCGCTGAGCAGCCGGTCGGTGTCGATGGTGCGGCGTAGGATTAGGCCGACCTGCTTGGAGAGT
+AGCCGCCGCAGCCGGTCTGGCCATTCCTCGCGGGGCAGGTCCACCAGCTCGGCAAGGAATTTGCTTGTGC
+CTGAACGGTTTTGCCCCAGGGATTGGAACTTCTCCGCGAATGGGCTGTGCTGGGCGAAGGCTGTCAGCCA
+GGGTGATCCGATCACCGGGGCGTAGCCGCTGTAGGCGCGGTTGTGGCGCAGCAGGGTCTCGAAGGCGTAG
+GCGCCTTCCTCGGGGGCGATGGCGTCGCCGGTTTGTTCGGCAAAGGCGATCGCGCGGCCGATCTGGCCCC
+AGGCGCCCCAGGCGATGGAGGTGGCTGGTAGGTCTTGGGCTCGCCGCCAGTGGGTGAAGGTGTCCAGCCA
+GCTGTTGGCCGCGGCGTAGGCGCCCTGACCCGGCGAGCCCACCAGGGCGGCCGCTGAGGAGAATGAGCAG
+AACCAGTCCAGCGGCTGGTCCGCGGTGGCCCGGTGCAGTTGCCAGGCGCCATATGCCTTGGGCGCCCAGT
+CGCGTTCGATGAGTTCGTCGGTGATGTTGGCCAAGGTGGCGTCCTCGACCACCGCGGCCGCGTGCAGCAC
+GCCGCGCAGCGGCAAACCCGTCGCGGTGGCCGCCGTGACCAACCGGTCGGCGGTGTCCGGCTGGGCGATA
+TCGCCGCACTCCACCACTACGTCAGACCCGATCGCGCGGACGAGTTCGATGGTCTCCAACGCCTTTTGGC
+TGGGCTGTGAGCGCGAGCTGAGCACGATGCGGCCGGCCCCGGCGTTGGCCATCTTCTCGGCCAGGAATAA
+GCCCAGCCCACCCAGGCCACCGGTGATGATGTAGGACCCGTCTGAACGGAAAACCCGAGCCTGTTCGGGG
+GGAAGCACCACGCTGCTGCGCCCGGCGTGGGGGACGTCGAGGATGAGCTTGCCGGTGTGCTCGGCCGCGC
+CCATCACCCGGATCGCGGTGGCCGCCTCGGCCAGCGGGTAATGGGTGCTCTGCGGCATCGGCAGCACACC
+CTCGACGGTCAACCGATACACCGTGCTCAACAGTTCGCGGACCGCAGCCGGATGGCTCACCGACATCAAC
+CCCAGGTCTAGACCGTAGAACGCCAGATTGCGCCGGAATGGCAAGAGTTCCAGTCGGGTATTGGAGTAGA
+TGTCGCGTTTGCCGATTTCGATGAAGCGGCCGCCCAGGGCCAGTAGTTTGAGGCCGGCCAACTGTGCGGC
+ACCGGTCACGGAGTTGAGCACGATGTCCACGCCGTAGCCGGCGGTGTCGCGGCGGATCTGCTCGGCGAAC
+TCGACGCTGCGCGAGTCATAGACGTGTTCGATGCCCATGTCGCGCAGCAGGTCTCGACGCTTTTCGTTGC
+CTGCGGTGGCGTAGATCTGGGCTCCGGCCGCACGCGCGATCGCGATTGCGGCCTGGCCCACTCCGCCGGT
+GGCGGAGTGGATGAGCACCTTGTCGCCGGCCTTGATCCGCGCCAGGTCCTGCAGCCCGTACCACGCGGTG
+GCGCTGGCGGTGGTCACTGCCGCGGCTTGGGCGTCGGTCAGCCCCTCGGGCAGTCTGGTGGCCAGGCGGG
+CGTCGCAGGTGACGAACGTGGCCCAGCAGCCGTTGGGTGACATGCCGCCGACCCGGTCACCGACCTTGAG
+TTCGCTGACCCCGGGCCCGACCGCGCTCACCACCCCGGCGAAATCGGTGCCCAGCTGCGGCTGTCGCCCG
+TCGAGGGTTTGGTAGCGGCCGAAGGTGACCAGCACGTCGGCGAAGTTGATGCTGGACGCGGTGACGGCGA
+CCTCGATCTCTCCCGGGCCCGGCGGGACCCGGTCGAGCGCGGCGAACTCCAAGGTTTGCAGGTCACCGGG
+AGTACGGATCTGTAGGCGCATGCCGGCCTCGGCGTGGTCGACGACGGTGGTTTGCCGCTCCTCGGGGCGC
+AGCGGGGCTGGGCACAACCGGGCGGTGTACCACTGGTCGTTGCGCCAGGCGGTCTCATCCTCGCCGCTGG
+CCGCCAGCAGCTGACGCGCCACCGACTCCGCGCCGGTCTGCTCATCCACATCGACATAGCTGGCCTTCAA
+ATGCGGATGCTCAGCACCAATCACCCGCAACAACCCCCGCATCCCACCCTGCTCAAGATTGGGTCGGTCA
+CCAGACAACACCGCCTGAGCATTGTGGGTCAGCACATACAACCGCGGCTCTTGGGCCGTGATCTCTGGAA
+TCTCGCGGGCGATACGCACCACATGTTTGACAAGCTCGCCGCCGCGCACGGGGGATTCCGCGTCGGGGTC
+GCCGGTCTGCGGCGCGGTCAACACGAATACGCCGGTGAACCCGCCGGTGCCGAGCTGGTCGCGCAGCCGC
+GCGGCCTGGGCTGCGTGGTCGGCGCGCTGCGGCCAGGACATCGTTGTGCACTGCGCGTCGTGCACCTTCA
+GCGCGTCGGTCAACTGTGCGGCCACCAAATCCGTAGCGTCACACGTGCTGATCAGCAGCCAGGCGCCGGG
+TTCGGCGTGGCTGTTTTCGGGCAGCTCACGTTCGTGCCATTCGATGCTCAGCAGCCGCTCACCCAAAACC
+CGGGCACGTTCGCTGGCCTGCGACGCGCCGGTACCCAACTGCAGCCCACGCACCGCCAACACCACCGCGC
+CGTGCTCGTCCAACACGTCCAGGTCGGCTTCCACGCCCACACCGCACGCGGTCACCGTCGTGCAGCAGTA
+CCGGGCATGACGGGCCGACCCATAGGACCGCAACCGCCGCACACCCAACGGCAGCAACAAACCACCGTCG
+GCCATACCCTGGACGGCGGGATGAGCCGCCACCGACTGGAAGCACGCATCCAGCAGCACGGGATGCACGC
+CGTAAGCTTTGACCTGCGAGCGAAGCGGGCCCGGTAGGTTGACCTCGGCCAGCACCGTGTCGCCGGCCCC
+TTCGGCGATGTACGCGTCAACCAGACCCGCAAAAGCCGGCCCTAAGCGATGACCACGCTTGTCCAGCCAT
+TGCCGAACCTCGGCGCCGTCCACCTTGTGGGGATGGCTGGCCAGCAGTTCGGCGATGTTTTTCTGGGGTG
+GCTGGTCCGGGGCGTCGTCGGCTTCCCGGACAACGTGCAGAACCGCGGCGAGTTGCCGTGTGTACCTACC
+ATCATGGCTGGTCTCTACTGTGAGTGGGACAACGCCGGGGGCTTCTACCGTGGCGGTGACGCCGATGGGG
+GTTTCGTCGTCGAGCAGCAACATCTGCTCGAATCGGATGTCGCGGACTTCGGAGGCTTCGCCGAGGACGG
+CGCGGGCTGCGGCCAACGCCATCTCGCAGTAGGCGGCTCCCGGAAGGGCGGCCGCGCCGTGGATTTGGTG
+ATCGGCCAGCCAGGGTTGTGTCACGGTGCCGACCTCGCCCTGCCAGACGTGGCGTTCCGGCTCCTCGGGC
+AGGCGCACGTGGGAGCCCAGCAATGGGTGTACGGCGACGGTATTGGCGTGGGCGATGCGACGGGTCGTGT
+CGTCGAGCAGCAGACGACGGTGGTTCCATGTGGGCAGTGGTGCGTTGATCAGTCGGCCGGTGGGGTAGAG
+CACGGCGAAGTCGACGGCGGCGCCGGCGGCGTAGAGGTCGCCGGCCAGTGCGCGCAGCCCGTGGGGCAGT
+GGTTGTTCGCGGCGCATGCCGGCCAGCGCAGCCGCGGACATGTCGAGGCTGCGGGCGGTCTGGTCGACCG
+CGTGGGTCAGCAGGGGGTGGGGGGTCAGCTCGGTGAAGACCCGGTAGCCGTCTTCGAGGGCGGCTTGCAC
+CGCCGCGGCGAAGCGTACGGTGTGGCGCAGGTTGTCCACCCAGTAGTAGGCGTCGCAGTAGGGCTCCTCG
+CGCGGGTCGAACGAGGTCGCCGAGTAGTAGGGGATTTCCGGTTGCAGCGGGCTGATTTCGGCGAGCGCTT
+CGGCCAGTTCGTCGAGGATCGGGTCGACCTGCGGGGAGTGCGATGCTACGTCGACGGCCACCTCACGGGC
+CAGCACGTCGCGTTGCTCCCAGGCGGCCACCAGGTCGCGTACCGTCTGGGTGGCCCCGCCGATCACGGTG
+GACTGCGGGGAGGCCACCACCGCGACCACGGCGTCGTTGACGCCGCGCGCCATCAACTCCGAAAGCACTT
+GTTGAGCAGGCAGTTCCACCGATGCCATGGCGCCGGCGCCGGCGATACGGGTCATCAGCGCCGACCGCCG
+GCAGATGACGCGCACTCCGTCTTCGAGGCAGAGCGCGCCGGCGACCACCGCGGCCGCGGACTCGCCCAGC
+GAGTGGCCGATGACCGCGCCGGGCGCTACGCCGTAGGACTTCATTGTGGCCGCCAGCGCGACCTGCATGG
+CAAACAGGGTCGGTTGCACCCGGTCGATGCCGGTCACGACCTCGGGGGCGGTCATGGCTTCGGTCACCGA
+GAAGCCGGATTCCGCGGCGATCAGTGGTTCGATCGCGGCGATGGTGGCGGCGAATACCGGTTCGGTGGCC
+AGCAGGTCGGCGCCCATGCCCGCCCATTGCGAGCCTTGCCCGGAGAACACCCAGACCGGTCCGCGGTCGT
+CTTGGCCGACCGCGGGTGGGTAGGGGGTTTCGCCGGTGGCGACTTCCCGCAGCGCCTCGGTCAGCTCCGC
+GGTGGTGGCGGCCAGTACGGCGGTGCGCACCGGCCGGTGTCCGCGCCGGCGGGCCAGGGTGTAGGCCAGA
+TCCGCCGGCGCCAGCTCGGGTCCTTGGGCGTCGACCCAATCGGCCAGCCGCGCGGCGGTCTGCCGCAGCG
+CGTCCTGCGAGCTGGCCGACAGCGCGAACAGCAGCGCGCCGTCGATACCGGGTGTGGCCGGGGTGTCGCC
+TGGTGCACCGGATTCGGGGGCTGGCACCGGTGCCTGCTCGACAATGGCGTGCACATTGGTGCCCGTCATG
+CCATACGACGACACCGCCGCGCGCCGGGGCGTTTCTTGATCGGCGCCGGGCCACGGCGTAATCTCTTGCG
+GCACAAACAGGTTGGTTTCGATTGCGGCAAGCTTGTCAGGCAGGGCCGTGAAGTGCAGATTCTGTGGGAC
+CACGCCGTGTTGGAGGGCCAGGACCGCCTTCATCAGTCCCAGCGCTCCAGCGGCCGACTGGGTGTGGCCG
+AAATTGGTCTTCACCGATGCCAGCGCGCAGGGGCCGTCGTTGCCGTATACCTCGGCCAGGCTGGCGTATT
+CGATGGGGTCACCCACCGGGGTGCCCGGGCCGTGCGCCTCGACCATGCCCACCGTAGCCGGGTCCACACC
+GGCCACATCCAACGCCTCCCGATACGCCGCGACCTGCGCGGACCGTGATGGTGTCGCGATATTGACGGTG
+TGGCCGTCTTGGTTGGCGGCCGTGCCACGAATTACGGCCAGGATCCGGTCCCCATCGGCCAGCGCATCCG
+GCAACCGCTTGAGCGCCAACATGACACAACCCTCACCGGAGACGAAACCGTCCGCGGAAACGTCGAACGC
+ATGACAGCGCCCGGTCGCAGACAACATGCCCAACGCCGAGCCCGAGGCGAACCGCCGCGGTTCGAGCATC
+ACGTAGACACCGCCGGCTAGCGCAATGTCGCTTTCGCCGTCGTGCAGGCTACGACAAGCCAGGTGGATAG
+CGGTGAGGCCAGACGAGCATGCGGTATCTACCGTGATCGCGGGACCCTGCAAGCCCATGGCGTACGCCAC
+CCGCCCGGATGCGAAGCAGGCATTGGTGCCCGTGTTGCCGTACGGCCCTTCGAAAGTCTGGTTGTCGGCG
+TGTACCAATATGTAGTCGGTATGAACCAACCCCACGAAAACCCCTGTCCGCGAGGCCATCTGGTTCGGTG
+TTAGGCCGCCGTGCTCCATGGCTTCCCAGGAGGTTTCCAGCAACAAGCGGTGCTGCGGATCGATCGCTAT
+CGCTTCTTTCTCCCCGATCCCGAAGAACTCGGGATCAAAGTCGCCGACGTTATCGAGGTACGCGCCCCAT
+TTGCAGTCGGTGCGTCCGGGCACGCCGGGTTCGGGGTCGTAGTACTCGTCGATGTCCCAGCGGTCGGCGG
+GGATCTCGGTGACCAGATCGTCGCCCCGCAGCAACGCCTCCCACAACCGATCGGGTGAGTCGATGCCCCC
+CGGCAGCCGGCACCCCATACCAATGACAGCTACCGGCGTAACACGTGTCCTATCCACGGTCTTTGTTCTC
+TCCTTACCCACGGTTCAAGCTTTTGCCAGCGGCGTATCGTCGAACTTCGGTCCGGGTTGATAGAACCGCA
+GCACCAAACGCACCCACCGACCCCCACGCTTCACGCCAACCCTTTAGTTCATTGGCGTGAACAGCAGCGT
+AGCCGGTTGCCCCGATATATGTGGAAAAATCGTTCGGACGTACAAAAAAAGTTCCTGACGCTGGCGTCAA
+CTCGAAACTGCCTCGGAAGTCATGATTGATTCATCAGTCAATATTAAAGTCGCAGTTCACAACTATAATA
+CGCCGGTGCAGCGGACAATTGCGGAAGCGCCGGACGCCTCGCGGTCCGATGTCGCCTTTCCCTGCCTCGT
+CGTCAATATCTGATGGTGGACGACCGCCCGTGCCGGACCGGCTTAGGTAGCCAGCCGGGCTTCGCGCCAC
+GCAATTTGCCTAGTCGTGGAAGACGGATTGCCGAAGTGTCGAAGGCAACCCGAACTCCGATGTTCAGGTT
+ATGCCAATTGGTGCCCGGAAATCCCCGAAATCGAAAATGTTACGTGCAGGTTTCACTGGACGGATCAAGG
+CCGTCGTCGCTGAAGCTGGGCGGCTGGGGCGACATCGCGCGATCCGCCCTCGGCGATGCGCACGTACGCC
+GATTGCATCGTCTCTGGATGCCGCGCGATCGAGCCCTGCGCGATCGGACTACTGGGGGACAACGCGGTGA
+CGGTGCTCTCCTCGTGAAACTTGTTGACCCACATGCACGCTTGCGCGCCGATCCAGCCATCGCCGAATAC
+TCTGGCATTCATCCGGTCCAGTTGTATTGCGATGACCGCAGACAGCAGAAGCGCGCCGGCCGGCATCGAG
+GCACGACGGGAACGGAAGCCGCCACCTAGAGGATCCAACGAGCATCTATGCTTTTCCCTTCCCACGGCCG
+CGCGTGAGGCATCCTCGCTGTGCAGCACCGCCAGGTCAGGGATCAACGCGCCGACTATTTCTCCGTCGAT
+GTGGCTGGACTGCACCTGCTCCGTCTCTCTTTGCTGCCACCAGCGCCAGGTTGGTTGTGGAAGCTGAGTC
+ACCGTCGGGCGAAACCGTCAGCGTTGACGAAGCGTTAGAGGTAGTGTGCTGCCGTGGTCGCGTCTTCGAT
+TCCCACCGCGCTGCGCGAGCGCGCCAGTGTGCACCCCAATGGTGCGGCCATCACCTACATCGATTACGAG
+CAGGACTGGGCCGGTGTTGCCGAAACCCTGACCTGGTCTCAGTTGTATCGGCGAATGCTCAATGTCGCCG
+AGCCGCTCCGGCATGTGGGGGCGACCGGTGATCGGGCAGTGATACTGGCACCGCAGGGAATCGAATACGT
+CGTTGGATTTCTCGGCGCGTTGCAGGCCGGACGTATCGCGGTTCCGCTGCCGGTTCCACATGCCGGCGCC
+CACGATGAGCGTACGATTTCGGTGCTAAGCGACACTTCGCCCGCTGTCATTCTGACGACGTCGGGGGCCG
+TTGACGATGTCAGAGAATGCGCTCAGCCACAGCCAGGCCAGTCCGCACCATCAATCGTTGAGCTTGATTT
+GCTGGACTTAGATTCTCGGCAGCGCTCCCGCAGCCCTGGCGCGCGCCCAACCGGCAGGGATACGCCGGAA
+ACCGCGTATTTGCAATATACTTCGGGATCCACCCGTACGCCGGCCGGTGTCATGGTCTCGAACAAAAATG
+TCTTCGCCAATTTCGAGCAGATCGTGGCCGACTTCTTTGCGCCCGAGGGGGGCGTCGTCCCGCCGGACCT
+CACTGTGGTGTCTTGGCTGCCGCTGTACCACGACATGGGTCTTCTATTAGGCGCGATCATGCCGATCCTG
+GCGGGTGTACCCACCGTGTTGACGAGTCCGGTGGGGTTCCTTCAGCGGCCGGCTCGATGGATACAACTGC
+TGGCACGTAACGGTCGCACGATTTCGGCAGGACCGAATTTCGCTTTCGAATTGGCGGTGCGTAAGACGTC
+AGACGACGACATGGACGGACTTGACCTCGCCGGCGTGCACACCATCCTCAACGGCAGCGAGCGAGTACAC
+CCGGCGACCCTCAAACGATTTGCTGAACGGTTCGGCCGCTTTAATTTTGCCGCCGCGGCGCTGCGGCCCG
+CGTATGGCATGGCGGAAGCAACGGTGTACATAGCGACCCGTAATGTGAACGAACCACCAGAAATCGTCGA
+CTTCGAATCCGAGAAACTGCCTGCGGGCCAAGCGATCCGGTGCCCGAGCGGAAGCGGCACACCGCTGGTC
+AGCTACGGCGTCCCACGGTCACAGCTAGTGCGCATCGTTGATCCAGACACGTGTATCGAGTGTCCGCAGG
+GATCGGTCGGTGAGATCTGGGTGCAAGGTGGCAACGTTGCGTCCGGCTATTGGCACAAACCCGAGGAGAG
+CAAGCGCACGTTTGGCGCCAGGATTGTCACCCCTTCGGCGGGCACACCCGAAGCGCCTTGGCTGCGAACC
+GGGGATTCGGGTTTCGTCTCCGGCGGCGAGCTGTTCATCATCGGCCGCATCAAGGACCTCTTGATTGTGT
+ATGGGCGCAACCACGCTCCCGACGACATCGAGGCGACCATCCAGGAGATAACCTCCGGCCGCTGTGCGGC
+GATCGCGGTCCCCGACCACGGCACCGAAAAGCTGGTCGCGATTATCGAACTCAAGAAACGGGGAGACTCC
+GACGAGGATGTGGCGGACCGGCTGCGCATCGTCAAGCGTGACGTCGCCGCGGCGATATTTGATTCGCACG
+GTCTGAGCGTGGCCGATCTCGTTCTGGTGTCGCCCGGGTCGATTCCCATCACCACCAGCGGCAAGATCAG
+GCGGGCACAGTGCGTCCAGCTTTACCGACGGCGTGAGTTCACCCGGTTAGACGCTTGACTGCATCGTTGG
+AGCTTGTTTTCCATTGTGCTACAACCGGTTTGCTGTCTCTGTGGCCCAGTGTTAGTGGGCCGCTCGGCAT
+TGACTGAGCACGACACGATTCCTAGTGTGCTGGTATGTCGGACGGCGCGGTGGTACGGGCATTGGTATTG
+GAGGCGCCGCGCAGGCTGGTCGTGCGCCAGTACCGGCTGCCGCGCATCGGCGATGATGACGCACTAGTGC
+GAGTAGAGGCCTGCGGGCTGTGCGGCACCGATCACGAGCAATACACGGGCGAGCTGGCCGGTGGGTTTGC
+CTTCGTACCTGGCCACGAGACGGTCGGGACGATTGCGGCCATCGGTCCGCGGGCGGAGCAGCGGTGGGGC
+GTGTCGGCCGGCGACCGAGTAGCCGTCGAGGTATTCCAGTCGTGTCGGCAGTGCGCTAACTGTCGTGGCG
+GCGAGTACCGGCGTTGTGTACGGCATGGCCTCGCTGACATGTACGGGTTCATCCCGGTTGACCGAGAGCC
+TGGCCTGTGGGGCGGTTACGCCGAATATCAGTACCTGGCACCGGATTCGATGGTGTTGCGGGTGGCCGGT
+GACCTCAGCCCGGAAGTGGCCACCTTGTTCAACCCGCTGGGGGCGGGAATACGTTGGGGAGTAACGATTC
+CCGAAACCAAACCGGGCGACGTCGTGGCGGTGCTGGGTCCAGGAATCCGGGGGCTGTGCGCCGCCGCGGC
+GGCAAAAGGGGCCGGTGCCGGGTTCGTGATGGTGACCGGGTTGGGACCCCGTGACGCCGACCGGTTGGCG
+CTGGCGGCACAGTTCGGAGCCGACCTCGCCGTCGATGTTGCGATCGATGACCCGGTCGCCGCCCTGACCG
+AACAGACCGGTGGGCTGGCAGACGTCGTTGTCGACGTGACCGCCAAGGCGCCAGCGGCATTCGCACAGGC
+GATAGCGCTAGCCCGGCCCGCCGGGACCGTTGTTGTCGCCGGCACCCGGGGCGTGGGCAGCGGGGCACCG
+GGATTTTCGCCCGACGTCGTTGTGTTCAAGGAGCTGCGTGTGCTTGGCGCCCTCGGCGTAGACGCCACCG
+CCTACCGGGCCGCGCTTGATCTGTTGGTGTCCGGTCGATACCCCTTCGCAAGCCTGCCTCGCCGCTGCGT
+GCGGCTCGAAGGCGCCGAGGATCTGCTGGCTACCATGGCCGGTGAACGCGACGGTGTCCCGCCTATCCAC
+GGAGTGCTCACACCATGACAACATCCCGCGTGCCCCTGTTGCCGGTCGACGAGGCCAAAGCTGCTGCCGA
+CGAAGCGGGCGTGCCCGACTACATGGCTGAGCTCAGCATCTTCCAAGTGTTGCTGAATCATCCGCGACTA
+GCGCGGACCTTCAACGACCTGCTCGCCACCATGCTGTGGCACGGGACCCTGGACTCACGGTTGCGTGAGT
+TGGTGATCATGCGGATTGGTTGGCTCACCGACTGTGACTACGAATGGACCCAACACTGGCGGGTTGCTTC
+AGGGCTTGGCGTGTCGGCCGACGATCTGCTCGGTGTACGGGATTGGCAAGGGTACAACGGGTTCGGGCCC
+GCTGAGCAGGCCGTCCTGGCGGCCACCGATGACGTGGTGCGCGAGGGCGCGGTGAGTGCGCAGAGCTGGT
+CGGCTTGCGAGCGGGAATTACATTGCGACAAAGTGGTTCTCATCGAACTCGTTACGGTGATAAGCGCATG
+GCGAATGGTCGCTTCGATCCTGCACAGCCTCGAGGTCCCACTGGAAGACGGCGTTTCCAGCTGGCCGCCC
+GACGGCCTTTCGCCAAGGTGACTGCGCCGAGCGTGTAACCATGGCGAGATTCCGCCGGCGATTTTTCCGC
+CCTGAGTGCACGTTCGGCGCAGAAGCACTAGACGATCCGGTAGGTCTGCACAGCGTGAGCGACGATGTTC
+CCGTCGGGATCGGTTGCGGTGATCTCGGTAAAGGTGAGTTCCTTGCGGCGTCGGGCAGTGCGCGCATGAC
+AGAGCAAGTCACACCGCTTGGCGGCGCCGGTGTACTGGATGCTCATCGCGACCGTGGCGGCGCGGGTGCC
+CCTGTCGAAGTCGTGGTTCGACCAAGCGGCGGCGGCACCGGCGGTGTCCATCACCGACGCGATCACCCCA
+CCGTGAAAGTAGGTGCCGTCATTGGTGAGGTCGGTGCGAAACGGGAGTCGGATCACGACGTCGTCGGGTT
+CGTAGCGTTCGAACACGATGCCGAGCCCGCCGATGAACGGCGTCCTCGGCATCAGCTCACGCACCGCCTG
+GCGACGTTTGTGCTGCTCTTGGGCGGTCAACGGGTCGGACATGGCAGGTAATCTACCCTATTAGATTGAC
+ATATCAATCAATAACTCTTAGCGTCGTCGCAATGCGGACCAGAGTCGCCGAGCTGCTCGGTGCTGAGTTT
+CCAATATGCGCGTTCAGCCACTGCCGGGATGTGGTGGCGGCGGTGTCCAATGCGGGCGGGTTCGGGATCC
+TCGGTGCCGTCGCACATAGCCCCAAACGGCTGGAGAGCGAGCTGACCTGGATCGAGGAGCACACGGGTGG
+CAAGCCGTACGGAGTCGACGTGCTGCTGCCGCCCAAATACATCGGCGCCGAGCAAGGCGGTATCGATGCC
+CAGCAGGCCCGGGAGCTCATACCCGAAGGGCATCGCACCTTCGTCGACGACTTGCTGGTTCGCTATGGCA
+TCCCCGCGGTCACCGACCGGCAGCGTTCGTCCTCGGCCGGTGGGCTGCACATCTCGCCCAAGGGTTATCA
+GCCGTTGCTGGATGTGGCCTTCGCCCATGACATCCGGTTGATCGCCAGCGCGCTCGGGCCGCCGCCACCG
+GATCTCGTGGAGCGCGCCCACAACCATGACGTGCTGGTTGCCGCCCTAGCCGGCACGGCGCAGCACGCGC
+GGCGACACGCGGCTGCGGGTGTTGACCTGATCGTCGCGCAGGGCACCGAGGCCGGAGGCCACACCGGCGA
+GGTGGCGACCATGGTTCTGGTTCCCGAAGTCGTCGATGCGGTGTCGCCAACGCCGGTGCTGGCCGCGGGC
+GGGATCGCCCGTGGCCGCCAGATCGCTGCGGCGTTGGCCCTGGGGGCGGAAGGCGTCTGGTGCGGGTCGG
+TCTGGTTGACCACCGAAGAAGCCGAAACGCCCCCGGTGGTCAAGGACAAGTTTCTGGCCGCAACATCCTC
+GGACACGGTGCGGTCCCGGTCGCTAACCGGCAAGCCGGCGCGCATGCTGCGCACGGCCTGGACCGACGAA
+TGGGATCGGCCTGACAGCCCCGACCCGCTTGGCATGCCGCTGCAGAGCGCGCTGGTCAGCGACCCGCAGT
+TGCGCATCAACCAGGCCGCCGGCCAGCCCGGGGCCAAGGCTCGTGAGCTGGCGACCTACTTCGTCGGACA
+GGTCGTCGGCTCACTCGACCGGGTGCGGTCGGCCCGCTCGGTGGTGCTTGACATGGTCGAGGAGTTCATC
+GACACCGTCGGGCAACTGCAGGGGTTGGTGCAAAGGTGAGCCGCGCTAGCGCGCGGCGGCGCCGAGCGGT
+CAGCGATGAGGACAAGTCGCAACGGCGCGACGAGATCTTGGCCGCGGCCAAAATAGTGTTTGCTCACAAG
+GGTTTTCATGCCACCACCGTCGCAGACATCGCCAAGCAGGCCGGCCTGGCGTACGGGCTGATCTACTGGT
+ACTTCGACTCCAAGGACGACTTGTTCCACGCCTTGATGGCCGGTGAAGAGGAGGCGCTGCGCGCGCATGT
+CGCGGCCGAACTGGCCCGCGTTGGCGGGTCTACCGAGGCGCCGCTTCGGGCCCTGTTACAGGCCGCGGTA
+CAGGCCACGTTCGAGTTCTTCGAAACCGACAAGGCTACCGTCAAACTACTGTTCCGTGACGCTTACGCGC
+TTGGGGGCCGATTCGAAGAGCATCTCGGCGGAATCTACGAGCGGTTCATCGACGACATCGAAGCCGTCGT
+TGTTGCCGCTCAACGGCGCGGTGAGGTTGTCGAGGCCCCGTCCCGGATGGCCGCGTACACGTTGGCGGCG
+CTGGTGGGGCAGTTGGCACACCGACGGCTGAATACCGACGATAACGTCACCGCCGCCCAGGTAGCCGACT
+TCGTGGTGTCGCTGGTGCTAGACGGGCTGCGTCCGCGTGCACTGGCGGTCGGGGCCCGCGGTGGTCGGGC
+CGCCCGAACCTGAGCAAAGGCTGCCAAATACATGGTGAACGCGTAAGGATTCGCGACACCCGCCCGGATC
+ACGTTGACCGAGACGGGTAGGTCGTGCATGATCGGTCCGGTAAGCACCTCGTTAGGTGAGGCGGCTACAC
+GAACATAGGCCACTGACCCCGAACGTCGAGAGACGCCCCGGGTCAGGACAGCTCTTCCCGGCTTAAGGGT
+TGAGCCCAGGTGGCTTCCGGCTTACCGGACACGTCGTGTGGTGCCGAAGCTCTGACGAGAGGGGTGCGGA
+TTTCCGGCAGTTGCCGGCATCTCTGTACTCCTGTGACGCGCTTTATCGTGCGGACAACCGTACGTGTCGT
+GGCCGTGAGGAGGTGAGGGACGCATGAGTTCCGGTGACAGTCCGGACCGATATCCGGGCTCTGTTTCGTC
+CCGATCCGGTTTCCGGCGCGACGTTTTGCGCTGAGTCGTCAAACCAAGATCAGCCTTCTTGGATCGGAAC
+CGCTACGGGACGGGACCAACTCGGTTCAGTCCATATGTGCTCGTTTTGATTTCCGTCCTCGCTTGCAACT
+CCGTCTAGGAGGCGATCATGACCGCTGCTCTGCACAATGACGTAGTAACCGTAGCTTCGGCCCCCAAGCT
+GCGGGTGGTGCGGGATGTGCCCCCGGCCCCCGCGTCCAAGAAGGTTGCTCGCCGGCTCGACGCGCAGCCT
+TTCGGCACCGGAGGGGACCCGCTGGTCGACGGGGCAGCTCGTTTGCTGAGCATTCCGCTGCGCCACCTCT
+ACGCCGCGTTGTGGCGCGTCGGGCTGCTCGAGGTCCAGGCCTAGTCCGATGGGCAGGCAGCCGACCTTGC
+GCCGCGATGTGGATTTGCGGCGCTGGGCGACAATCCCCGTAGAATCAGGGGAACGGCATCGATCCGGCGA
+TCACCGGGGAGCCTTCGGAAGAACGGCCGGTTAGGCCCAGTAGAACCGAACGGGTTGGCCCGTCACAGCC
+TCAAGTCGAGCGGCCGCGCATCGGCGTGGCAAGCGGGGTGGTACCGCGGCGTTCGCGCACCGGCGTGGCG
+TCGTCCCCGAGCCTGGATTGCAGGCACGCAGTGCCGAACGGTGCTGGGGCCTGGGGAGACGACGCGCAAA
+GTGACCGATAACGCATATCCAAAGCTGGCCGGCGGGGCACCCGACCTCCCGGCACTCGAACTCGAGGTCC
+TCGACTACTGGTCCCGTGACGACACCTTCCGGGCCAGCATTGCTCGCCGCGATGGCGCCCCCGAGTATGT
+GTTCTATGACGGGCCGCCGTTTGCCAACGGTCTGCCGCATTATGGGCACCTGCTCACCGGCTACGTCAAA
+GACATCGTGCCGCGATATCGCACTATGCGCGGTTACAAGGTGGAGCGTCGCTTCGGCTGGGACACTCACG
+GGCTGCCCGCCGAACTCGAAGTCGAGCGCCAGCTTGGCATCACTGACAAATCCCAGATCGAGGCCATGGG
+TATCGCCGCCTTCAACGATGCCTGCCGCGCATCCGTGTTGCGCTACACCGACGAGTGGCAGGCGTATGTA
+ACTCGGCAAGCTCGCTGGGTCGACTTCGACAACGATTACAAGACGCTCGATCTGGCTTACATGGAGTCGG
+TGATTTGGGCCTTCAAACAGTTGTGGGACAAGGGCCTGGCCTACGAGGGCTACCGGGTGCTGCCGTACTG
+CTGGCGCGACGAAACTCCGCTGTCGAATCACGAACTGCGGATGGACGACGACGTCTACCAAAGCCGCCAA
+GATCCCGCGGTAACGGTGGGCTTCAAGGTGGTGGGTGGCCAACCAGACAACGGGCTAGACGGTGCCTACT
+TGCTGGTGTGGACGACGACTCCGTGGACCCTGCCGTCGAACCTCGCAGTTGCGGTAAGCCCGGACATCAC
+CTACGTACAGGTCCAGGCGGGCGATCGCCGTTTCGTACTGGCCGAGGCACGGCTGGCCGCTTACGCCCGC
+GAACTCGGTGAAGAGCCCGTGGTGCTCGGCACCTATCGCGGCGCCGAACTGCTGGGCACCCGCTACCTGC
+CGCCGTTTGCCTATTTCATGGACTGGCCCAACGCTTTTCAGGTGCTAGCAGGCGACTTTGTAACGACCGA
+CGATGGCACCGGCATCGTGCATATGGCACCGGCCTATGGTGAGGACGACATGGTGGTCGCGGAGGCGGTC
+GGTATCGCGCCGGTGACTCCGGTCGACTCCAAGGGACGCTTCGACGTCACCGTTGCCGATTACCAAGGGC
+AGCATGTCTTTGACGCCAACGCGCAGATCGTCCGGGACCTGAAGACCCAAAGCGGCCCGGCTGCGGTGAA
+TGGCCCAGTGTTGATTCGTCACGAAACCTACGAGCACCCTTACCCACACTGCTGGCGATGCCGTAACCCG
+CTGATCTACCGGTCGGTGTCGTCGTGGTTCGTCAGGGTGACGGACTTCCGAGACCGCATGGTGGAGCTAA
+ACCAGCAGATCACGTGGTATCCCGAACACGTCAAGGACGGCCAGTTCGGCAAGTGGCTGCAGGGCGCCCG
+CGATTGGTCGATCTCCCGGAATCGCTACTGGGGTACCCCGATTCCGGTATGGAAGTCCGACGACCCGGCC
+TACCCGCGCATCGATGTCTACGGCAGCCTCGACGAGCTGGAGCGCGACTTCGGCGTACGCCCGGCCAATT
+TGCACCGGCCCTACATCGACGAGCTCACCCGTCCCAACCCAGACGATCCGACTGGCCGTAGCACGATGCG
+ACGCATTCCCGATGTGCTCGACGTGTGGTTCGACTCGGGATCCATGCCGTATGCCCAGGTGCACTACCCG
+TTCGAGAACCTGGATTGGTTCCAGGGACACTACCCCGGCGACTTCATCGTCGAGTACATCGGGCAGACCC
+GTGGCTGGTTTTACACACTGCATGTGTTGGCGACCGCGCTCTTTGACCGGCCGGCATTCAAAACCTGTGT
+GGCGCATGGGATTGTCCTTGGTTTCGATGGCCAGAAGATGAGCAAGTCGCTGCGCAACTATCCAGACGTA
+ACAGAGGTGTTCGATCGCGACGGCTCCGACGCCATGCGGTGGTTCCTGATGGCATCGCCGATTCTGCGCG
+GCGGCAACCTGATCGTCACTGAGCAAGGAATTCGCGACGGTGTGCGACAAGTCCTGCTGCCCCTGTGGAA
+CACCTACAGCTTCCTGGCGCTGTATGCACCGAAAGTCGGTACCTGGCGCGTCGATTCGGTGCACGTGCTG
+GATCGCTATATCCTGGCCAAGCTGGCGGTGCTGCGCGACGACCTCAGCGAGTCGATGGAAGTTTACGATA
+TTCCCGGTGCCTGTGAACATTTGCGTCAGTTCACTGAGGCGTTGACTAATTGGTATGTGCGACGGTCGCG
+TTCGCGGTTCTGGGCAGAAGACGCCGATGCCATCGACACGCTACACACCGTGTTGGAGGTGACCACGAGG
+CTGGCCGCCCCGCTGCTTCCGCTGATCACCGAGATAATCTGGCGTGGTCTGACACGCGAGCGATCGGTGC
+ACCTGACGGACTGGCCAGCGCCCGACCTGCTGCCGTCGGATGCCGACCTGGTCGCCGCGATGGACCAGGT
+CCGCGACGTGTGCTCGGCGGCATCCTCGCTGCGCAAGGCCAAGAAGCTACGGGTGCGCCTGCCGCTACCG
+AAACTCATTGTGGCAGTTGAGAATCCGCAACTTCTGAGGCCGTTCGTCGACCTCATTGGCGACGAGCTTA
+ACGTGAAGCAGGTCGAACTGACCGATGCCATCGACACCTATGGCCGATTCGAGCTCACGGTCAACGCCCG
+GGTAGCCGGACCACGGCTGGGCAAAGATGTGCAGGCCGCCATCAAGGCGGTCAAGGCCGGCGACGGCGTC
+ATAAACCCGGACGGCACCTTGTTGGCGGGCCCCGCGGTGCTGACGGCCGACGAGTACAACTCCCGGCTGG
+TGGCCGCCGACCCGGAGTCCACCGCGGCGTTGCCCGACGGCGCCGGGCTGGTCGTTCTGGATGGCACCGT
+CACTGCCGAACTCGAAGCCGAGGGCTGGGCCAAAGATCGCATCCGCGAACTGCAAGAGCTGCGTAAGTCG
+ACCGGGCTGGACGTTTCCGACCGCATCCGGGTGGTGATGTCGGTGCCTGCGGAACGCGAAGACTGGGCGC
+GCACCCATCGCGACCTCATTGCCGGAGAAATCTTGGCTACCGACTTCGAATTCGCCGACCTCGCCGATGG
+TGTGGCCATCGGCGACGGCGTGCGGGTAAGCATCGAAAAGACCTGAGGTCGACTGGGCGACGAGCGTAAC
+GTCACGGCTGAAAATCCGTGCCCGACTTCGCCGTGGCGTTACGCTCGCGGCGCGGGGACCCGATCTCTAG
+GGCGTTGTCGCCCAGATCCACGTCGGCCAAGGCCGATGGCAGCGGCTGAGGTTGATCGCCATAGCGAAAA
+CTAGCTCGGTAGCCCCAAATAGCATCACGGGTGTGGAGTCCCGCTGGGTGCTGCACCTGGACATGGATGC
+GTTTTTCGCCTCGGTCGAACAGCTCACCCGGCCGACCCTGCGGGGGCGGCCGGTGCTGGTTGGCGGGCTG
+GGTGGGCGAGGTGTGGTGGCCGGCGCGAGCTATGAAGCGCGGGCCTACGGTGCCCGATCGGCCATGCCGA
+TGCATCAGGCCCGCAGGCTGATCGGGGTGACGGCCGTGGTGTTGCCGCCACGCGGGGTGGTGTACGGGAT
+CGCCAGCCGCCGGGTATTCGACACCGTGCGCGGCCTGGTGCCCGTCGTCGAACAGCTTTCTTTCGATGAA
+GCGTTCGCCGAACCGCCCCAACTCGCCGGGGCAGTGGCCGAGGACGTCGAGACGTTCTGCGAACGGTTGC
+GGCGACGGGTGCGCGACGAGACCGGCCTGATTGCCTCGGTCGGAGCGGGCTCGGGCAAGCAGATCGCCAA
+GATTGCTTCTGGTCTGGCCAAACCCGACGGCATTCGGGTAGTCCGGCACGCTGAAGAGCAAGCGCTTCTC
+AGCGGATTGCCGGTACGACGGCTGTGGGGCATCGGCCCGGTCGCCGAGGAAAAGCTGCATCGGCTCGGCA
+TCGAGACGATCGGGCAGCTGGCCGCGCTGAGCGATGCCGAGGCGGCCAACATCCTAGGCGCGACGATTGG
+GCCCGCGCTGCACCGGCTGGCCCGTGGCATCGACGACCGCCCAGTGGTGGAGCGCGCCGAAGCCAAGCAA
+ATCAGCGCCGAGTCCACGTTCGCCGTCGATCTGACCACCATGGAGCAATTGCACGAGGCGATCGACTCCA
+TCGCTGAGCACGCGCACCAACGCCTGCTGCGCGACGGCCGCGGCGCCCGCACCATCACGGTGAAGCTAAA
+GAAATCCGACATGAGCACGCTAACCCGCTCGGCGACGATGCCCTACCCGACGACCGACGCCGGCGCGCTG
+TTTACGGTGGCCCGCCGGCTGCTGCCGGATCCACTGCAAATCGGGCCAATTCGTCTTCTGGGTGTTGGGT
+TTTCGGGTTTGAGCGACATTCGCCAGGAGTCGTTGTTTGCCGACTCGGACTTGACGCAGGAAACGGCGGC
+AGCGCATTACGTCGAAACACCGGGAGCGGTCGTGCCGGCCGCGCACGACGCCACGATGTGGCGGGTCGGC
+GATGACGTCGCCCACCCTGAGCTTGGGCACGGCTGGGTGCAGGGAGCGGGCCACGGCGTGGTCACCGTGC
+GGTTCGAAACGCGTGGTTCAGGCCCGGGCTCGGCGCGGACGTTCCCCGTCGACACCGGCGACATCAGCAA
+CGCCAGCCCGCTTGACAGCTTGGACTGGCCGGACTACATCGGCCAGCTATCGGTCGAGGGGTCCGCCGGC
+GCCTCAGCCCCAACGGTCGATGACGTCGGCGACCGGTGAGTTGGCCGCCAGCGCGGCCATTAGCAGCACC
+CGGGCCTGGGACGGCGGCAGTCGCGGTACCATCACCGCGCCAGCCTCCACCAGGTCGTGCCCGGGACCAT
+AGCCTGCGCCGACCCGCGCGCCGGCGACCCGGGTAGACACCGCGATCACCACCGGATCGCTCCCGTCTCG
+ACAGTGGCGACGGACTCCCTCGATCACGGCGGCCCCGGCATTGCCCGAGCCCAGCGCCTCCAGCACCACG
+GCGCGCGCGCCGGCTGCCACACAGGCGTCCATCGCCACCGCGTCACTTCCCGGATAGACGGCGACGATGT
+CGACTCGTGGCGCCACGGCAGCGCCCAGATCGCCGAGATAGGGCCGCGTCTTGGTGCGCGTCAGCCGCAC
+CCCGCCCGACGTGAAGCCAAGCGACTCGCCGGCGAATCCGCACAGGTCCGGGTTGGCCACCTTGTGCAGG
+CCCAAAGGCTGTAACACCCGGCCGCCGAAACTCACCAGCACCCCGAGGTCGCGGGCGGCTGGGTCGGCGG
+CGACCGCAAGCGCGTCGCGCAGATTGGCCGGGCCATCGGCGCCGGGGGCATCGGCGCTGAGCATGGCCCC
+GGTCAACACGACCGGGCGGCTACCCGCATAGGTGAGGTCCAGCCACAGAGCGGTCTCTTCGAGCGTATCG
+GTGCCGTGAGTGATGACCACCCCATCTGCGCCGCCGCGGAATGCCTCCTGCACTGCAGCGCCTATCCGGT
+CCCAATCGGCCGGCGTCAACTTTGAGCTGTCCAGCGCCATGAGGTCGACTACTTCGATGTCGGAGTCCAT
+GTCGAGACCGGCGATCAGCGTCGCCCCGCAATGGGTTGGCCGTAGCACCCCATCGGGGCCGGCGGTGGTC
+GAGATTGTCCCTCCAGTAGTGATGACGGTGAGGCGGGCCATGATGGGATCATTGCGCACGTGGTTTGCTC
+CCATCCGGCCGCGGGGTCTGGGCGGGCCATATCGGCCCTAGGGGATGATGATGGTGTGCCTGACGAACCA
+ACAGGATCGGCTGATCCGCTGACCTCGACCGAGGAAGCCGGGGGGGCGGGGGAACCTAACGCTCCCGCGC
+CGCCGCGACGGCTGCGCATGCTGCTGTCGGTCGCTGTGGTGGTGCTCACACTCGACATTGTCACCAAGGT
+GGTAGCTGTCCAACTGTTGCCGCCCGGCCAGCCGGTGTCGATTATCGGCGACACGGTGACCTGGACTCTG
+GTGCGTAATTCTGGGGCGGCCTTCTCGATGGCGACCGGATACACCTGGGTTTTGACGCTGATTGCGACGG
+GTGTCGTGGTCGGAATTTTCTGGATGGGGCGGCGGCTGGTATCGCCGTGGTGGGCGCTGGGTCTTGGGAT
+GATCCTGGGCGGTGCCATGGGCAACCTGGTTGATCGCTTCTTTCGGGCACCGGGGCCGCTGCGCGGGCAC
+GTCGTCGATTTCTTGTCGGTCGGCTGGTGGCCGGTGTTCAATGTCGCCGATCCGTCGGTAGTCGGTGGCG
+CCATCCTGCTGGTCATCCTGTCGATCTTTGGCTTTGACTTCGACACCGTAGGTCGGCGACACGCCGACGG
+GGACACCGTAGGTCGGCGCAAAGCCGATGGCTGACCGCTCAATGCCCGTTCCGGATGGATTGGCGGGAAT
+GCGTGTTGACACCGGACTGGCCCGCTTGCTGGGACTGTCTCGGACCGCTGCGGCTGCCCTCGCCGAAGAG
+GGCGCGGTCGAGCTGAATGGCGTGCCGGCCGGAAAGTCCGATCGGCTCGTCTCCGGCGCCTTGCTGCAGG
+TGCGGTTGCCCGAGGCGCCCGCGCCGCTGCAGAACACCCCCATCGATATCGAGGGCATGACGATTCTGTA
+TTCCGACGACGACATCGTTGCGGTCGACAAACCGGCTGCAGTTGCCGCGCATGCGTCGGTCGGCTGGACC
+GGACCGACGGTGCTCGGCGGACTCGCCGCCGCCGGGTACCGGATCACCACATCCGGGGTGCACGAGCGGC
+AGGGCATCGTGCATCGCCTCGACGTCGGGACCTCCGGGGTGATGGTAGTGGCGATCTCCGAGCGGGCGTA
+CACCGTGCTGAAGCGGGCGTTCAAATACCGCACGGTGGACAAGCGGTACCACGCGCTGGTTCAAGGACAT
+CCAGATCCGTCCAGCGGAACGATCGACGCGCCGATCGGTCGTCATCGCGGCCATGAATGGAAGTTCGCGA
+TCACCAAGAATGGCCGGCACAGCCTTACGCACTACGACACGCTGGAAGCGTTCGTGGCAGCCAGCCTGCT
+CGACGTGCATCTGGAAACTGGCCGCACCCACCAGATCCGGGTGCACTTCGCCGCGTTGCATCACCCATGT
+TGCGGCGACCTCGTTTACGGAGCTGATCCCAAGCTAGCGAAGAGGCTCGGGTTGGACCGTCAATGGCTGC
+ACGCGCGTTCACTGGCGTTCGCTCATCCGGCCGACGGCCGGCGGGTGGAGATCGTCAGCCCGTATCCGGC
+CGATCTGCAGCACGCGCTAAAGATATTGCGTGGCGAGGGTTGACCGGCATCACGAGGTGCGGCAGACGAA
+CGTGGCGCCATGGAAATCGAGGCGCACCTCGCCCTGGTGTTCCCAGTATTCAATGCCTTGGCGACCATAC
+CGGGCGCCACTGCCGGACAGTTCGACGAACACGATCACTTGGTCGCCTTTCCAGTTGAGCACGGCCGTCT
+TCGGGTCGAATTGGTTGTAGAACTGTGCGGTCAATGGGCCGTCCTGCGTGGGACACCGGTAGGTGAGGAC
+GGGTGGAGTCGCGGTGGCGGGATCGGCGATTGCCAATTGGACCAGCCGGGTCTGGTAGGCCTCCTGCACA
+CAGGTACGCGGGTCGGTGTCTTGCGCACAAGCATCACGCAGCATCGTCCAGCTGCTTTGTGCGGCTTCCA
+GCGCCGCCGAGCGTCGATGGGCCAGCGCCTGTTGATAGGCGGTCGAAAGCCGGTGGTCCAGACTGGTCAA
+CTGCCGGTCGTGGCAAACCAGTTGCTGCACTATGGTTGCCGGTTTGGTGCAGTCGAGCGACTGCCCGGCG
+GTCGGCGAGGTTGTGTTAGCCGGAGGGTTTGCGGCGCAGGCGCTCAGAACCAGGGCGGTCACCAGGACGC
+CGATCCATCTCATGGAAACGGACTACCCGGCTACCGACGCGGTGTCCAGCGCGACACGCCACAGGGCTCA
+GACTGGTGCCGTGGTGCTCTCGCCCGATGTGACGTCGACCGCCAGCGGCGCGATGACGCCGAGGATTTCC
+GTGATCGTTTCGGAGGGCACGCCGGCTGCGGTCAGCGCGTCGGCCAAGTGTCCGGCGACCAGGCTGAAGT
+GGTGCATGGTAATTCCGCGCCCCTGATGGACTTGCTTCATCGGCGCACCGGTATAGGGCTCGGGCCCGCC
+AAGCGCGGCCGCGAAAAACTCCACCTGCTTGCCCTTGAGGCGGCTCATGTTCGTACCGCTGAAGAAGGCC
+GATAGTTGGTCATCGGCAAGCACACGAACATAGAAGTCCTCGACGACGACTTCGATGGCCTCATGCCCGC
+CGATCTTGTCGTAGATGCTGATCGGCTCACGTTTGCGCAAGCGTGACAGTAGTCCCATCGTGCCAGGGGA
+CCATGCCGGCGTTGCCTGCCGGTTAGGTCGCGATCACGCTCGGATTATCAGCTGTAACAAGCTGATTGCC
+GCCAACGTCGCACAGATCCCGTCGCAAACAGATCCTTGGTCGCCGCACCGGCCGGTAGTGGACTCCATTC
+ATCAGCTCATGTGCTAGTAGGTTGGCTTCATGACCCGTGTCCATCACCCCACGCCGCCATCAGGAGCTAC
+CCACGATGAATCTTGGTGACTTAACGAACTTCGTCGAGAAGCCGCTCGCGGCGGTGTCCAACATCGTCAA
+CACCCCGAACTCGGCCGGGCGATATCGGCCCTTCTACTTGCGCAACTTGCTCGATGCGGTGCAGGGCCGC
+AACCTCAATGATGCTGTCAAGGGCAAGGTTGTCCTCATCACTGGTGGGTCATCAGGCATCGGTGCGGCGG
+CCGCGAAGAAAATTGCCGAGGCCGGCGGCACGGTGGTGTTGGTCGCACGCACCCTGGAAAACCTCGAGAA
+CGTCGCCAACGACATACGGGCGATCCGAGGCAACGGTGGGACCGCCCACGTCTACCCGTGCGATCTATCC
+GACATGGATGCGATTGCCGTGATGGCCGACCAGGTGCTCGGCGACCTCGGCGGCGTCGACATCTTGATCA
+ACAACGCGGGCCGGTCAATTCGGCGCTCGTTGGAGTTGTCCTATGACCGGATCCACGATTACCAGCGAAC
+GATGCAGCTCAACTACCTCGGCGCGGTCCAGCTGATCCTGAAGTTCATCCCCGGAATGCGAGAACGCCAC
+TTCGGGCATATCGTCAACGTTTCCTCAGTCGGCGTGCAGACCCGCGCGCCGCGCTTCGGCGCTTACATCG
+CCAGCAAGGCCGCGCTGGACAGCCTGTGTGATGCGTTGCAAGCCGAGACCGTGCACGACAACGTCCGATT
+CACCACCGTGCACATGGCATTGGTAAGGACTCCAATGATCAGCCCGACCACGATCTACGACAAGTTTCCC
+ACGCTGACGCCGGATCAGGCGGCCGGTGTGATCACCGATGCCATCGTGCATCGGCCCCGGCGAGCCAGCT
+CACCGTTCGGACAGTTCGCCGCCGTTGCCGACGCCGTCAACCCCGCGGTGATGGACCGGGTACGTAACCG
+TGCCTTCAACATGTTCGGCGACTCGTCCGCAGCCAAGGGAAGTGAATCCCAAACCGACACATCAGAACTC
+GACAAGCGAAGCGAGACGTTTGTGCGGGCCACCCGAGGGATCCATTGGTGACACCATGAGCCTTCCGAAA
+CCGAACAATCAGACCACCGTTGTGATCACCGGCGCCTCCTCCGGCATCGGTGTCGAATTGGCTCGTGGCT
+TGGCCGGCCGCGGCTTCCCACTGATGCTAGTGGCGCGGCGCCGCGAGCGCCTCGACGAACTGGCCGATCA
+GCTGCGCCAGGAACACTGCGTCGGGGTGGAGGTCTTGCCGCTCGACCTTGCCGATACGCAAGCGAGGGCA
+CAGCTGGCTGATCGCTTGCGTAGTGATGCGATTGCCGGGCTGTGCAACAGCGCAGGTTTCGGCACCAGTG
+GGCGTTTTTGGGAGTTGCCGTTCGCACGCGAAAGCGAGGAAGTCGTCCTCAATGCTCTGGCGTTAATGGA
+ACTCACCCATGCCGCACTGCCAGGCATGGTCAAGCGCGGCGCCGGTGCGGTGCTCAACATCGCCTCGATC
+GCGGGTTTCCAGCCGATTCCCTATATGGCCGTGTATTCGGCTACCAAAGCCTTTGTGCTGACGTTCTCTG
+AAGCCGTGCAGGAGGAGCTGCACGGAACGGGCGTGTCGGTGACTGCCCTGTGCCCAGGCCCGGTACCCAC
+CGAGTGGGCCGAGATCGCCAGCGCCGAGCGGTTCAGCATTCCCCTCGCCCAAGTTTCGCCGCACGACGTC
+GCCGAAGCCGCCATCGCCGGGATGCTCTCCGGTAAGCGCACCGTCGTGCCGGGCATAGTGCCAAAGTTCG
+TCAGCACCAGCGGCAGATTCGCTCCGCGCAGCCTGCTGCTGCCCGCGATCCGGATCGGCAACCGGCTGCG
+CGGCGGGCCCAGCCGCTGATGTGAGGGGCGTTCCGGCCTGGTGCCGAACGGAGTGCTGGGCCTGGGCAAT
+CCCAGCCGGCTAGCCGCGTTGTATGGGTTGCAGCTGGCGCACGAGTCGCAGTGCTGCCAGATGCACAATT
+TGCCCTCTGCAGCGCGACAAGTCACTGTTGCGTGTCGCGAGGAGGTGGGCATAACGACCATCCTTGCCGG
+CAGAGACGAATGCGGCGTGTGTGACAAGACAGCTGGGTTGGATGGCGCCGCTCCTTAGCGGGCCATAGCG
+CACGGCCCGCTTCGTCGCCGGCGCTAGTCTCATGCGATGGCCTCTGTTGAGCTGTCCGCTGACGTCCCCA
+TCAGCCCGCAGGACACGTGGGACCACGTTTCGGAGCTGTCAGAGTTGGGGGAGTGGCTCGTCATCCATGA
+GGGGTGGCGCAGCGAGTTGCCTGATCAACTGGGCGAAGGCGTCCAGATCGTGGGTGTCGCGCGGGCCATG
+GGCATGCGCAACCGGGTTACGTGGCGGGTGACCAAGTGGGACCCGCCACATGAGGTCGCGATGACAGGAT
+CCGGGAAGGGTGGAACAAAGTACGGAGTCACCCTCACCGTGCGACCCACAAAAGGCGGGTCGGCGCTGGG
+GCTGCGTCTCGAGCTGGGCGGGCGTGCGCTGTTCGGCCCGCTGGGTTCGGCGGCGGCTCGCGCCGTCAAG
+GGCGACGTCGAGAAGTCGCTTAAGCAGTTCGCCGAGCTATACGGCTAGCCGCTAGAAGACACACTTTGCG
+ACACGCCCGAACGGTGTCGGTCCTCGGTCATAGACTGGCGTCCCTATGAGCGGTTCATCTGCGGGGTCCT
+CCTTCGTGCACCTGCACAACCACACCGAGTATTCGATGCTGGACGGTGCCGCGAAGATCACGCCCATGCT
+CGCCGAGGTGGAGCGGCTGGGGATGCCCGCGGTGGGGATGACCGACCACGGAAACATGTTCGGTGCCAGC
+GAGTTCTACAACTCCGCGACCAAGGCCGGGATCAAGCCGATCATCGGCGTGGAGGCATACATCGCGCCGG
+GCTCGCGGTTCGACACCCGGCGCATCCTGTGGGGTGACCCCAGCCAAAAGGCCGACGACGTCTCCGGCAG
+CGGCTCCTACACGCACCTGACGATGATGGCCGAGAACGCCACCGGTCTGCGCAACCTGTTCAAGCTGTCC
+TCGCATGCTTCCTTCGAGGGCCAGCTGAGCAAGTGGTCGCGCATGGACGCCGAGCTCATCGCCGAACACG
+CCGAGGGCATCATCATCACCACCGGATGCCCGTCGGGGGAGGTGCAGACCCGCCTGCGGCTCGGCCAGGA
+TCGGGAGGCGCTCGAAGCCGCGGCGAAGTGGCGGGAGATCGTCGGACCGGACAACTACTTCCTTGAGCTG
+ATGGACCACGGGCTGACCATCGAACGCCGGGTCCGTGACGGTCTGCTCGAGATCGGACGCGCGCTCAACA
+TTCCGCCTCTTGCCACCAATGACTGCCACTACGTGACCCGCGACGCCGCCCACAACCATGAGGCTTTGTT
+GTGTGTGCAGACCGGCAAGACCCTCTCGGATCCGAATCGCTTCAAGTTCGACGGTGACGGCTACTACCTG
+AAGTCGGCCGCCGAGATGCGCCAGATCTGGGACGACGAAGTGCCGGGCGCGTGTGACTCCACCTTGTTGA
+TCGCCGAACGGGTGCAGTCCTACGCCGACGTGTGGACACCGCGCGACCGGATGCCCGTGTTTCCGGTGCC
+CGATGGGCATGACCAGGCGTCCTGGCTGCGTCACGAGGTGGACGCCGGGCTTCGCCGGCGATTTCCGGCC
+GGTCCGCCGGACGGGTACCGCGAGCGCGCCGCCTACGAGATCGACGTCATCTGCTCCAAAGGTTTCCCAT
+CGTACTTTCTGATCGTCGCCGACCTGATCAGCTACGCGCGGTCGGCGGGCATAAGGGTGGGTCCCGGCCG
+CGGCTCGGCCGCCGGCTCGCTGGTCGCCTACGCGCTGGGCATCACCGACATCGACCCGATTCCACACGGT
+CTGCTGTTCGAGCGGTTCCTCAACCCCGAGCGCACCTCGATGCCCGACATCGATATCGACTTCGACGACC
+GGCGCCGCGGTGAGATGGTGCGCTACGCAGCCGACAAGTGGGGCCACGACCGGGTCGCGCAGGTCATCAC
+CTTCGGCACCATCAAAACCAAAGCGGCGCTGAAGGATTCGGCGCGAATCCACTACGGGCAGCCCGGGTTC
+GCCATCGCCGACCGGATCACCAAGGCGTTGCCGCCGGCGATCATGGCCAAAGACATCCCGCTGTCTGGGA
+TCACCGATCCCAGCCACGAACGGTACAAGGAGGCCGCCGAGGTCCGCGGCCTGATCGAAACCGACCCGGA
+CGTACGCACCATCTACCAGACCGCACGCGGGTTGGAAGGCCTGATCCGCAACGCGGGTGTGCACGCCTGC
+GCGGTGATCATGAGCAGCGAGCCGCTGACTGAGGCCATCCCGTTGTGGAAGCGGCCGCAGGACGGGGCCA
+TCATCACCGGCTGGGATTACCCGGCGTGCGAGGCCATCGGTCTGCTGAAAATGGACTTCCTGGGCCTGCG
+GAACCTGACGATCATCGGCGACGCGATCGACAACGTCAGGGCCAACAGGGGTATCGACCTCGACCTGGAA
+TCCGTGCCGCTGGACGACAAGGCCACCTATGAGCTGCTGGGCCGCGGCGACACCCTGGGCGTGTTCCAGC
+TCGACGGCGGGCCCATGCGCGACCTGCTGCGCCGCATGCAGCCGACCGGGTTCGAAGACGTCGTCGCCGT
+TATCGCGCTGTACCGGCCCGGCCCGATGGGCATGAACGCACACAACGACTATGCCGACCGCAAGAACAAC
+CGGCAGGCCATCAAACCTATTCACCCGGAACTCGAAGAACCGCTGCGCGAGATCCTCGCCGAGACCTACG
+GCCTCATCGTCTATCAAGAGCAGATCATGCGCATCGCGCAGAAGGTGGCGAGCTACTCGTTGGCCCGCGC
+CGACATTCTACGCAAGGCCATGGGCAAGAAGAAACGCGAGGTGCTGGAGAAGGAGTTCGAGGGCTTCTCC
+GATGGCATGCAGGCCAACGGGTTCTCTCCGGCGGCCATCAAGGCGCTGTGGGACACCATCCTGCCGTTCG
+CTGACTACGCGTTCAACAAGTCACATGCCGCCGGCTACGGCATGGTGTCCTACTGGACGGCCTACCTCAA
+GGCCAACTATCCCGCCGAGTACATGGCCGGTCTGTTGACGTCGGTCGGCGACGATAAAGACAAGGCCGCG
+GTTTATCTGGCCGACTGCCGCAAGCTCGGCATCACCGTGCTCCCGCCCGACGTCAACGAATCTGGCTTGA
+ACTTCGCATCGGTCGGCCAAGACATCCGCTACGGGCTGGGCGCGGTGCGCAACGTTGGCGCTAATGTCGT
+GGGCTCGTTGCTCCAAACCCGCAACGACAAGGGCAAGTTCACCGACTTTTCGGACTACCTGAACAAGATC
+GACATCTCGGCGTGCAACAAGAAGGTGACCGAATCGCTGATCAAGGCGGGTGCGTTCGACTCGCTGGGGC
+ATGCCCGCAAGGGTCTTTTCCTGGTGCACAGCGATGCGGTGGACTCGGTGCTGGGCACCAAGAAGGCCGA
+GGCACTGGGGCAGTTCGATCTCTTCGGCAGCAATGATGATGGGACCGGCACCGCAGATCCCGTGTTCACC
+ATCAAGGTGCCCGATGATGAGTGGGAGGACAAACACAAACTCGCCCTAGAGCGCGAGATGCTGGGACTGT
+ACGTCTCGGGGCATCCCCTCAACGGTGTGGCACACTTGCTGGCTGCCCAGGTCGACACCGCGATCCCAGC
+GATCCTCGACGGCGATGTCCCCAACGATGCCCAAGTGCGGGTGGGCGGCATCCTGGCGTCGGTGAACCGG
+AGGGTCAACAAAAACGGAATGCCATGGGCTTCAGCGCAATTGGAGGATCTCACGGGCGGCATCGAGGTGA
+TGTTCTTCCCGCACACCTACTCCAGCTATGGTGCCGACATCGTCGACGATGCAGTCGTGCTGGTCAACGC
+CAAGGTGGCGGTCCGTGACGACCGCATCGCATTGATCGCCAATGACCTCACAGTGCCCGACTTTTCCAAC
+GCCGAGGTGGAGCGGCCGCTGGCGGTCAGCTTGCCCACCCGGCAGTGCACCTTTGACAAGGTGAGTGCGC
+TCAAACAGGTGTTGGCGCGCCACCCCGGCACCTCGCAGGTGCATCTGCGGCTCATCAGCGGAGACCGGAT
+CACCACGCTGGCACTTGATCAGTCGTTGCGGGTGACGCCGTCGCCGGCGTTGATGGGTGACCTCAAGGAG
+CTGCTCGGCCCTGGATGTCTGGGGAGTTAGCGAGGCGACCGCCCCCAGCGGTTTCCGCACGATCGCCCGT
+GAGCGCCGCTAATGGATCCAGCCCGACGCCCGACTGTCCCCGTTGAGATACCCCGAGACCTCGTCGTCGA
+AGTTGGCGAAGCCCGACATGAGGCTGCCGAAGTTGAAGAAGCCAGAGATCGAGGTTCCCGCATTGACGAA
+ACCCGAAATGTTGGCCGTACCGGTGATCGTGGGTACCGAGTTTCTGAAGCCCGACAGATGGTCACCCACG
+TTGATGATGCCGGCGTTGTAGTTGCCCACGTTGGCCAGGCCCGAGTTACCGGTGACAAATTCGGCGTGTT
+CGTCACGGGCGTTGTTATCGAAGCCCGAGTTGAAGGTGCCGGCGTTAGCGTAGCCCGAGTTGTTGGTGCC
+CGTGTGCAGCCAGCCGGAGTTCTGTACCGGCTGGTTGACCGAGTTGAACAATCCGGTGTTGAGATCGCCC
+GAGTTGAAGAAGCCGGTGTTGATGTTGCCGGAGTTGAAGTAGCCGGTGTTCACGTTGCCCGAGTTGAAAT
+CGCCCGTGTTCATGCTGCCGGCATTGAAGCTACCCGTGTTGGTATGGCCGGAGTTAAACAGACCCATGCT
+GCCGGTGACCAGGTTTCCGCCCGAGTTTCCGATTCCGGTGTTCGTGGTGCCCGAGTTGAACCAGCCGGTA
+TTGGTGGTGCCGGAGTTGAACCAGCCGGTGCTGGTGGTGGCCGAGTTGAACCAGCCCGTGCTGAGCTGGC
+CGGAGTTGCCGATACCGGTACTGAGCTCGCCGGAGTTGCCGAAGCCCGAGCTGCGCTCGGCCGAACTGCC
+GAACTCCACGCTCAGCGCCCCGACTCCATTGCCCGAGTTTCCCATGCCGATGTTGTTATTGCCCGAGTTG
+AAAAAGCCGATATTACCGTTGCCCGAGTTCCCGAAGCCGAGGTTCCCGCTACCTGAATTGAGGGCGCCGA
+AACCTATCTGGTTATCACCGGTGAGCCCGAAGCCGATGTTGTTGTTGCCGCTGTTCCCAAACCCGATGTT
+ATGAGAGCCCTTGTTGCCGAAACCGATATTTCCACTGCCAAGGTTGCCGCTGCCAAAGTTGGTGTCGCCG
+GTGTTTCCGTTACCAAAGTTGACGTTACCGGTGTTTCCGAACCCGAAATTCGAGTTCCCGGTGTTGCCGC
+CACCCACGTTGAGATTTCCGGTGTTACCGCCGCCAAAGTTGGTGTCGCCGGTATTTCCACTACCCAGGTT
+ATAGCTGCCGAGGTTGCCGCCGCCCAGGTTATAGCTGCCGATGTTTCCGCTACCCCAGTTGAGCGTGCCC
+GTGTTTCCACTGCCCGGGTTGAGATCCCCGGTGTTGCCGCCACCCAGGTTGTAGCTGCCGATATTGCCGC
+TGCCCAGGTTGAGATCACCGATATTGGCGTTGCCCAAGTTGACGCTGCCCGTGTTGGCGCTACCCGGGTT
+GAAGCTGCCCAGGTTGCCGAGGCCCAGATTGCCGCTGGCCAGATTGAAGCCACCGATGGTGACGTTGCCC
+AGATCGAGAAACGGAAACCCCGCGATGATCACCGCACCGCCGGGCGTGGCTGCCGCGCTCGGCGACGGTG
+TGAACGGCGTCAGCGACAAGGCGACCGCCGACGCCTCGCCGTGATAACCGAGCATCGCGGCGACATCGGC
+GGCCCACATCTGCTCATAGACGGCCTCGACGGCCGCGATGGCCGGGGCGTTTTGCCCCAACAGATTCGAG
+GCCACCAAGGAGCGCAACCGACCTCGATTGGCGCTCACCGCGCCCGGATGCACCGTCGCCGCCAGCGCCG
+CCTCGAACGCCGATACCGCCGCCTGGGCTTGACCCGCCGCCTGCTCAGCCTGCGCTGCGGCCGTGGTCAG
+CCAGCGAGCATAGGACGCGGCCGCGCCTGTCATGGCCGCTGACGCCGGACCTTGCCAGGACCCGGTGGCC
+AACTGCGAGGTCACCGCCGAAAATGAGGCCGCCGCCGAACCCAAATCGCCGGCCAGCCCGGTCCAGGCCG
+ACGCCGCCGCCAACATCGGTCCCGGCCCGGCACCAGCGAACATCAGCGCCGAATTGATCTCCGGCGGCAA
+CACCGAAAAATTCATCACAACCATCCCGTCAGCCGGCCACACCCACCGGGCTTCACGGCGCTGTCTGGCC
+CCAACCGCAGCGAAGCCTACGAAAAAGCCGGGCGCTTCGGACGGGCGCAGGTTAAATCCAGGTAACGCGT
+GACGAATCTCGCGACGAGCCTCCTTGCGGCCATGGGCCGCCACGGGTCTCGGTGGTCGCGGCCCCCGTGC
+TTCCGCGTCCTTCGATTGTGGACGTACGCTCACCGATGTGACCTGGGCCATACTGATCCGCTGTCAAGGA
+GAACGGAAATGACCACAACAGAGCGCCCGACAACCATGTGCGAGGCGTTCCAGCGCACCGCCGTCATGGA
+CCCGGACGCCGTTGCGCTACGGACCCCCGGCGGTAACCAGACAATGACATGGCGAGACTACGCGGCGCAG
+GTGCGGCGGGTCGCTGCCGGCCTGGCAGGTTTGGGAGTTCGGCGCGGCGACACGGTCTCGCTGATGATGG
+CGAACCGGATCGAGTTCTACCCGCTCGACGTCGGTGCTCAGCACGTCGGCGCCACCTCGTTTTCGGTGTA
+CAACACCCTGCCCGCCGAGCAGCTGACCTACGTGTTCGACAACGCGGGGACCAAGGTGGTCATCTGCGAG
+CAACAGTACGTCGATCGCGTTCGCGCCAGCGGTGTGCCCATCGAACACATCGTCTGCGTCGATGGCGCGC
+CCCCCGGCACGCTCTCGCTGACGGATTTGTACGCGGCCGCCTCCGGCGACTTCTTCGACTTCGAGTCGAC
+GTGGCGTGCCGTACAACCCGAGGACATTGTCACCCTCATCTACACGTCCGGCACAACGGGAAACCCCAAG
+GGTGTGGAGATGACCCACGCCAACCTGCTGTTCGAGGGATATGCCATCGACGAGGTGCTCGGAATCCGGT
+TTGGCGATCGGGTGACGTCCTTCCTGCCATCGGCGCACATCGCCGATCGGATGACCGGGCTGTACCTGCA
+GGAGATGTTCGGCACCCAGGTCACCGCGGTGGCCGACGCGCGCACGATCGCAGCCGCGCTCCCCGACGTG
+CGGCCAACCGTGTGGGGGGCCGTTCCCCGGGTTTGGGAAAAGCTTAAGGCCGGAATCGAATTCACCGTCG
+CTCGTGAGACCGACGAGATGAAGCGGCAGGCGTTGGCGTGGGCGATGTCGGTGGCTGGCAAACGCGCCAA
+CGCCCTGCTCGCAGGTGAATCTATGTCGGATCAGCTGGTCGCCGAATGGGCCAAAGCCGACGAGTCGGTG
+TTGTCCAAGTTGCGCGAGCGGCTGGGCTTCGGCGAGCTGCGGTGGGCCCTGTCCGGAGCGGCGCCGATCC
+CCAAGGAGACGCTCGCGTTCTTCGCAGGTATCGGCATCCCAATCGCCGAGATTTGGGGAATGTCGGAGCT
+GAGCTGCGTTGCCACCGCCAGCCATCCCCGCGACGGGCGGCTGGGCACCGTCGGAAAACTACTTCCCGGG
+CTGCAGGGCAAGATCGCCGAAGACGGTGAGTACCTGGTCCGCGGTCCGCTGGTGATGAAGGGTTATCGCA
+AAGAACCGGCCAAGACCGCGGAGGCGATCGACTCCGACGGCTGGCTACACACCGGAGATGTCTTCGATAT
+CGACTCCGACGGCTATCTGCGGGTGGTGGACCGCAAGAAGGAGCTGATCATCAATGCGGCCGGAAAAAAC
+ATGTCGCCGGCCAACATCGAGAACACCATCCTGGCCGCGTGCCCCATGGTCGGGGTGATGATGGCAATCG
+GTGACGGGCGAACGTATAACACCGCGCTGTTGGTCTTCGACGCCGACTCTCTCGGTCCGTATGCGGCCCA
+GCGTGGCCTCGATGCCTCGCCCGCGGCTCTGGCGGCTGACCCGGAGGTGATCGCGCGCATCGCCGCCGGC
+GTGGCCGAGGGCAACGCCAAATTATCGCGGGTCGAACAGATCAAGCGGTTCCGCATATTGCCCACCCTGT
+GGGAGCCCGGCGGGGACGAGATAACCCTGACGATGAAACTCAAGCGCCGTCGAATCGCCGCGAAATATTC
+CGCGGAGATCGAGGAGCTCTACGCCAGCGAGCTGAGACCGCAGGTTTACGAGCCCGCTGCCGTGCCATCG
+ACACAACCGGCATGACGGGGGCTAGCCAGTGACTGCACGGGAGGTGGGCCGCATCGGACTGCGAAAGTTG
+CTGCAGCGCATCGGTATTGTTGCTGAATCAATGACGCCGCTAGCGACCGACCCCGTTGAGGTTACCCAAC
+TGCTGGATGCCCGATGGTATGACGAGCGGCTGCGTGCGCTGGCCGACGAGCTCGGACGCGATCCGGACAG
+CGTGCGCGCCGAGGCGGCAGGCTATCTGCGGGAGATGGCCGCCTCGCTGGATGAGCGGGCCGTGCAGGCA
+TGGCGCGGCTTCAGTCGCTGGCTCATGCGCGCCTACGACGTACTGGTCGACGAGGACCAGATCACGCAGC
+TGCGCAAGCTTGATCGCAAAGCCACCCTGGCGTTCGCGTTCTCGCATCGTTCGTACTTGGATGGGATGCT
+GCTGCCCGAGGCGATCCTGGCCAACCGGCTCTCGCCGGCGCTGACCTTCGGCGGGGCGAACCTGAACTTC
+TTTCCGATGGGCGCTTGGGCCAAACGTACCGGGGCTATCTTCATTCGGCGTCAGACGAAAGATATTCCCG
+TCTACCGCTTCGTATTACGTGCTTACGCCGCGCAGCTGGTGCAAAACCATGTCAACCTCACCTGGTCGAT
+CGAAGGGGGTCGGACCAGAACGGGCAAGCTACGGCCACCGGTGTTCGGGATCCTGCGTTACATCACCGAT
+GCGGTCGACGAAATCGACGGTCCCGAAGTGTATTTGGTGCCGACCTCGATCGTGTACGACCAGCTGCACG
+AGGTGGAAGCCATGACCACCGAGGCCTATGGCGCGGTGAAACGACCCGAAGACCTGCGCTTTCTGGTCCG
+GTTGGCGCGACAGCAGGGCGAGCGACTGGGCCGCGCCTATCTCGACTTCGGCGAACCGCTGCCGCTTCGC
+AAGCGCCTGCAGGAGATGCGCGCCGACAAGTCGGGCACCGGCAGCGAGATCGAACGGATCGCGTTGGATG
+TCGAGCACCGGATCAACCGCGCCACACCGGTTACCCCCACCGCGGTGGTGAGTCTGGCCCTGCTGGGCGC
+GGACCGCTCGTTGTCCATCAGCGAGGTGTTGGCGACGGTTCGCCCGTTGGCCAGCTACATAGCTGCCCGC
+AACTGGGCGGTGGCCGGCGCCGCCGATCTGACGAATCGCTCGACGATCCGGTGGACCTTGCATCAGATGG
+TTGCTTCCGGCGTGGTGAGTGTCTACGACGCGGGCACCGAGGCGGTGTGGGGCATCGGCGAGGACCAGCA
+CCTGGTGGCGGCGTTTTACCGCAACACCGCGATCCATATCCTGGTCGATCGGGCCGTCGCCGAGTTGGCG
+TTGCTGGCGGCCGCAGAGACCACAACAAACGGCTCGGTTTCCCCGGCGACCGTGCGTGATGAGGCGTTGA
+GCCTTCGCGACTTGCTGAAGTTCGAGTTCTTGTTTTCTGGCCGTGCCCAGTTTGAGAAAGACCTCGCAAA
+CGAGGTACTGCTGATCGGGTCGGTGGTCGACACCTCCAAGCCCGCGGCCGCAGCCGATGTGTGGCGCCTG
+CTGGAATCGGCCGATGTGCTGCTGGCCCACCTGGTGCTGCGGCCGTTTCTCGATGCCTACCACATTGTCG
+CCGATCGGCTGGCCGCCCATGAAGACGACTCTTTCGACGAGGAAGGGTTTCTGGCCGAGTGTCTACAGGT
+CGGCAAGCAGTGGGAGCTGCAGCGCAATATCGCCAGCGCCGAGTCCAGGTCGATGGAGCTGTTCAAGACC
+GCACTGCGCCTGGCTCGCCATCGCGAGCTGGTCGACGGTGCCGATGCGACGGACATCGCCAAACGCCGAC
+AGCAGTTCGCCGACGAGATAGCCACGGCAACCAGGCGGGTAAACACAATCGCAGAACTGGCCCGCAGGCA
+ATGAGCGACAAATGCGGCCGCCAGGGCCGCTGCGCCGTCCAGCGAACGGGTCAAACGGTGGACGCGCCAT
+CCCCCCGGGCATAGTCTGAATGTGATCTAGGTCACGTGCCAGCACCGGAGGAGGCGGGACTATGGTCGCG
+ACCACTACGCACTTCCCGAAGCAAAAAGCGCCCTGCGGGCACATGGTTGACGGCGATCACCACATCGAGC
+GCGACGACGAAGGCCTTGCCTACGACGACCTCAAGTTTTCCTGCGGCTGCCGCGAAATCCGGCATTTCTA
+CCACGACGGATCCATGCGGGTACGCACGATTCGACACGACGGCAAGGTGTTGAAGGACGAGCACAGCGGC
+GATCACGAAGCGTGAACCAGCGCGATGACCGCCCAACACAACATCGTGGTTATCGGCGGCGGTGGTGCGG
+GTCTGCGCGCCGCGATTGCGATAGCCGAAACCAATCCGCACCTGGATGTGGCGATCGTTTCCAAGGTGTA
+CCCGATGCGCAGCCACACCGTCTCGGCTGAGGGCGGCGCCGCGGCGGTGACCGGTGACGACGACAGCCTC
+GATGAACACGCGCACGACACGGTATCCGGTGGCGACTGGCTGTGTGACCAAGATGCGGTCGAGGCTTTCG
+TGGCCGAGGCGCCCAAAGAGTTGGTGCAGCTCGAGCATTGGGGCTGTCCGTGGAGCCGTAAACCAGACGG
+GCGCGTTGCCGTTCGCCCGTTCGGCGGGATGAAGAAGCTGCGCACCTGGTTTGCCGCCGACAAGACGGGA
+TTTCACCTCCTGCACACGTTGTTTCAACGGCTGCTCACCTATTCCGACGTCATGCGCTATGACGAGTGGT
+TCGCTACGACGCTGCTGGTCGACGACGGCAGGGTATGTGGTCTGGTCGCTATCGAGTTGGCGACCGGGCG
+CATCGAGACGATCCTTGCCGACGCGGTGATTCTGTGCACCGGCGGATGCGGGCGGGTATTTCCATTCACC
+ACCAACGCGAACATCAAGACCGGCGACGGCATGGCGCTCGCATTCCGCGCGGGCGCGCCCCTAAAAGACA
+TGGAATTCGTCCAATACCACCCCACCGGACTGCCGTTCACCGGGATCTTGATCACCGAGGCCGCACGAGC
+TGAAGGCGGCTGGCTGCTCAACAAAGACGGCTACCGCTACCTCCAGGATTACGACCTCGGCAAGCCCACG
+CCCGAGCCCAGGCTGCGCAGTATGGAGCTCGGGCCCAGGGACCGACTGTCGCAGGCCTTCGTACACGAGC
+ACAACAAAGGAAGGACGGTCGACACCCCGTACGGCCCCGTCGTCTATCTAGACCTGCGGCACCTGGGGGC
+GGACCTGATCGATGCAAAGTTGCCGTTCGTACGTGAGCTGTGCCGCGACTACCAGCACATCGACCCCGTG
+GTCGAATTGGTCCCGGTACGACCGGTAGTGCACTACATGATGGGTGGCGTTCACACCGATATCAACGGCG
+CCACAACGCTTCCCGGGCTATATGCCGCAGGTGAAACAGCCTGCGTGAGCATTAATGGCGCCAACCGCCT
+GGGGTCGAACTCGCTGCCCGAGCTGCTGGTGTTCGGGGCTCGAGCGGGCCGTGCCGCCGCGGATTACGCA
+GCGCGCCACCAAAAGTCGGACCGTGGCCCGTCGTCGGCAGTGCGGGCTCAGGCCCGCACCGAGGCTCTAC
+GGCTAGAGCGTGAGCTCAGCCGCCATGGCCAGGGAGGCGAACGAATCGCGGATATTCGGGCGGACATGCA
+GGCCACCTTGGAAAGCGCCGCGGGTATTTATCGTGACGGACCCACCCTCACCAAAGCGGTCGAGGAGATT
+CGGGTGCTGCAGGAACGATTCGCCACGGCGGGCATCGACGATCACAGCCGCACATTCAACACCGAGCTGA
+CTGCGCTGCTCGAGTTGTCGGGGATGCTCGACGTTGCACTGGCGATCGTCGAATCTGGTTTGCGCCGAGA
+AGAATCCCGTGGCGCACACCAGCGAACCGACTTTCCGAACCGGGACGACGAGCATTTCTTGGCGCACACC
+TTGGTTCATAGAGAAAGCGACGGAACGCTGCGGGTCGGCTACCTTCCGGTCACTATCACTCGCTGGCCAC
+CGGGCGAACGCGTGTATGGGAGGTAAGGATGATGGATCGAATTGTCATGGAGGTCTCCCGGTATCGGCCC
+GAGATCGAATCGGCCCCGACATTTCAGGCCTACGAGGTTCCCCTCACCCGCGAATGGGCGGTGTTGGACG
+GCCTGACCTACATCAAGGATCACCTCGACGGAACACTCTCCTTCCGCTGGTCGTGCCGGATGGGTATCTG
+CGGCAGTAGTGGTATGACGATCAACGGCGACCCAAAGCTGGCGTGCGCGACATTCCTTGCCGATTACCTA
+CCCGGGCCGGTGCGGGTGGAGCCGATGCGAAACTTCCCGGTGATCCGCGATCTCGTTGTCGACATCAGTG
+ACTTCATGGCCAAGCTGCCCAGTGTGAAGCCGTGGCTCGTCCGGCATGATGAACCGCCCGTCGAAGACGG
+CGAATACCGGCAGACCCCGGCCGAACTCGATGCATTCAAGCAGTTCAGCATGTGTATCAACTGCATGTTG
+TGCTACTCGGCGTGCCCGGTGTACGCGCTGGACCCCGACTTCCTCGGTCCGGCGGCGATCGCGCTGGGGC
+AGCGGTACAACCTGGACTCGCGCGACCAAGGTGCGGCGGATCGCAGGGATGTCCTGGCCGCGGCCGACGG
+CGCTTGGGCGTGCACCCTGGTGGGCGAATGTTCGACGGCTTGTCCGAAAGGCGTCGATCCTGCCGGCGCG
+ATCCAGCGCTACAAGCTGACCGCGGCCACGCACGCGCTGAAGAAGTTGCTGTTCCCTTGGGGGGGGGGGC
+GGATGAGCGCCTATCGCCAGCCGGTCGAAAGATACTGGTGGGCGAGGCGGCGTTCTTACCTGCGATTCAT
+GCTTCGCGAAATCAGTTGCATCTTCGTGGCCTGGTTTGTTCTCTATCTGGTGCTGGTATTGCGCGCCGTT
+GGCGCGGGCGGGAATTCCTACCAGCGGTTTTTGGACTTCAGCGCCAATCCGGTTGTCGTAGTGCTGAACG
+TCGTCGCGTTGAGTTTCCTGCTGCTGCATGCTGTTACCTGGTTCGGATCGGCACCGCGCGCGATGGTGAT
+TCAGGTTCGCGGCCGCCGGGTACCCGCTCGCGCGGTCCTTGCTGGGCACTACGCGGCATGGCTGGTGGTT
+TCGGTGATCGTTGCCTGGATGGTGCTGTCATGACTCCCTCGACATCGGATGCCAGGTCGCGCCGACGCTC
+GGCGGAGCCCTTCCTGTGGCTGCTGTTCAGCGCCGGGGGCATGGTCACCGCCCTGGTTGCGCCCGTCCTG
+CTGTTGCTGTTCGGACTCGCGTTTCCGCTCGGGTGGCTCGACGCGCCCGACCACGGGCACCTACTGGCGA
+TGGTGCGCAACCCGATCACCAAGCTTGTTGTGCTGGTCCTGGTGGTACTGGCCCTGTTCCATGCGGCGCA
+CCGGTTCCGGTTCGTGCTCGACCATGGGCTGCAACTGGGCCGGTTCGACCGAGTGATCGCCCTGTGGTGT
+TACGGCATGGCCGTGTTGGGCTCGGCGACGGCGGGTTGGATGTTGCTCACCATGTAAAGTCGCTGGCCGG
+GCGCTTTGGCCGCCGGCACGGTACGGTACGGACCTGTACCACCACAACGGTTCTATGGTAGGCGCTGTGA
+CCCAGATAGCGGATCGGCCTACAGACCCCTCGCCCTGGTCGCCGCGAGAGACCGAGTTACTGGCGGTGAC
+ACTACGGCTGCTGCAGGAGCACGGTTATGACCGGCTAACAGTGGATGCCGTTGCGGCGAGCGCCCGCGCC
+AGCAAGGCAACGGTCTACCGGCGCTGGCCGTCGAAAGCCGAATTGGTGCTGGCCGCGTTCATCGAGGGCA
+TCCGCCAGGTCGCGGTCCCGCCCAATACCGGCAACCTGCGCGACGACTTGCTGCGACTGGGGGAGCTGAT
+CTGTCGGGAGGTGGGCCAACACGCCAGCACCATCCGCGCGGTGCTCGTCGAAGTGTCGCGCAATCCTGCC
+CTCAACGACGTTTTGCAGCATCAGTTCGTCGACCACCGTAAGGCCCTGATCCAGTACATCTTGCAGCAGG
+CCGTCGACCGCGGTGAGATCTCCAGCGCGGCCATCAGCGATGAACTCTGGGACCTGCTACCCGGCTACCT
+CATCTTCCGGTCCATCATCCCCAACCGGCCGCCCACCCAGGACACGGTGCAAGCCCTCGTCGACGACGTG
+ATACTCCCCAGCCTCACCCGATCCACCGGTTGAGTCAGCGGTGCGAATGGCTGGGCACCGTTGTGGTGTC
+CGGTCCCGTACCGTACTGTTGAATCCGCGGATCCCCGCCTGAGGTACGGGGCGTGGTCGCGCCCCGGGCA
+ATAGCGTCGCCGGTTATCGAAAGGCTAACGGGTGCAGGGGATTTCAGTGACTGGCCTGGTCAAACGCGGC
+TGGATGGTGCTGGTTGCCGTGGCGGTGGTGGCGGTCGCGGGATTCAGCGTCTATCGGTTGCACGGCATCT
+TCGGCTCGCACGACACCACCTCGACCGCCGGTGGTGTCGCGAACGACATCAAGCCGTTCAACCCCAAACA
+GGTAACCCTCGAGGTCTTTGGCGCTCCCGGAACCGTGGCAACGATCAATTATCTGGACGTGGATGCCACA
+CCTCGGCAAGTCCTGGACACGACCCTGCCGTGGTCATACACGATCACGACGACCCTGCCCGCGGTCTTCG
+CCAATGTTGTCGCGCAAGGCGACAGCAATTCCATCGGCTGCCGCATCACCGTCAACGGTGTAGTCAAGGA
+CGAAAGGATCGTCAACGAAGTGCGCGCCTATACCTTCTGCCTCGACAAGTCCTCATGAGCAACCACCACC
+GCCCGCGGCCTTGGTTGCCGCACACCATCCGACGGCTTTCGTTGCCGATCTTGCTGTTTTGGGTGGGTGT
+GGCCGCCATAACCAATGCCGCCGTGCCGCAATTGGAGGTGGTCGGGGAGGCGCATAACGTCGCACAGAGC
+TCCCCGGATGACCCGTCGCTGCAGGCGATGAAACGCATCGGCAAGGTGTTCCACGAGTTCGATTCCGACA
+GTGCGGCCATGATCGTCTTGGAAGGCGATAAGCCGCTCGGCAACGACGCCCACCGGTTCTACGACACCCT
+GCTCCGCAACCTTTCAAACGACACCAAACACGTCGAGCACGTTCAGGACTTCTGGGGCGATCCGCTGACC
+GCGGCCGGCTCGCAAAGCACCGACGGCAAAGCCGCCTACGTTCAGGTCTATCTCGCCGGCAACCAAGGCG
+AGGCGTTGTCAATCGAGTCCGTCGACGCGGTGCGCGACATCGTCGCCCATACGCCACCACCGGCCGGGGT
+CAAGGCCTACGTCACCGGCGCGGCCCCGCTCATGGCCGATCAGTTTCAGGTGGGCAGCAAAGGAACCGCG
+AAAGTTACCGGGATAACTCTGGTTGTGATCGCGGTGATGTTGCTCTTCGTATACCGTTCCGTCGTCACCA
+TGGTCCTGGTGCTTATCACGGTTCTTATTGAGTTGGCCGCGGCCCGCGGGATCGTCGCTTTTCTCGGAAA
+CGCCGGGGTAATCGGGCTGTCGACATACTCGACGAATCTGCTCACACTATTGGTAATCGCGGCGGGCACA
+GACTACGCGATTTTTGTCCTCGGCCGCTATCACGAGGCGCGCTACGCCGCACAGGATCGGGAAACGGCCT
+TCTACACGATGTATCGCGGGACCGCCCACGTCGTCTTGGGCTCGGGTCTGACCGTTGCCGGCGCGGTGTA
+TTGCCTGAGCTTTACCCGGCTACCCTATTTTCAAAGCCTGGGTATTCCCGCCTCGATAGGGGTGATGATT
+GCGTTGGCAGCCGCGCTCAGCCTGGCCCCATCCGTGCTCATCTTGGGCAGTCGTTTCGGTTGTTTCGAAC
+CCAAGCGCAGGATGAGGACCAGGGGATGGCGGCGCATCGGCACGGCCATCGTGCGTTGGCCGGGACCCAT
+CCTGGCAGTGGCGTGCGCAATTGCGGTGGTGGGTCTGCTCGCGCTGCCGGGATACAAAACGAGCTACGAC
+GCTCGCTATTACATGCCCGCCACCGCCCCGGCCAATATTGGCTACATGGCCGCGGAGCGACATTTTCCCC
+AAGCGCGGCTGAATCCCGAACTACTGATGATCGAGACGGATCACGATATGCGCAATCCGGCCGACATGCT
+CATCTTGGATAGGATCGCCAAGGCTGTCTTCCATCTGCCCGGCATAGGGCTGGTGCAGGCCATGACCCGG
+CCGCTAGGAACCCCGATTGACCACAGCTCGATACCGTTTCAGATCAGCATGCAAAGCGTCGGCCAGATTC
+AGAATCTCAAGTATCAGAGGGACCGAGCAGCCGACTTGCTGAAGCAGGCCGAAGAGCTGGGGAAGACGAT
+CGAAATCTTGCAGCGCCAATATGCCCTACAGCAGGAACTCGCGGCCGCTACTCACGAGCAAGCCGAAAGC
+TTTCACCAAACGATCGCCACGGTAAAGGAACTGCGAGATAGGATCGCCAATTTCGACGATTTCTTCAGGC
+CGATTCGTAGTTACTTTTACTGGGAAAAGCACTGCTACGATATCCCGAGCTGCTGGGCGCTGAGATCCGT
+CTTTGACACGATCGACGGTATCGACCAACTCGGCGAGCAGCTGGCCAGCGTGACCGTAACCTTGGACAAG
+TTGGCTGCGATCCAGCCTCAATTGGTGGCGCTGCTACCAGACGAGATCGCCAGCCAGCAGATCAATCGGG
+AACTGGCGCTGGCTAACTACGCCACCATGTCCGGGATCTATGCCCAGACGGCGGCCTTGATCGAAAACGC
+TGCCGCCATGGGACAAGCCTTTGACGCCGCCAAGAACGACGACTCCTTCTATCTGCCGCCGGAGGCTTTT
+GACAACCCAGATTTCCAGCGCGGCCTGAAATTGTTCCTGTCGGCAGACGGTAAGGCGGCTCGGATGATCA
+TCTCCCATGAAGGCGATCCCGCCACCCCCGAAGGCATTTCGCATATCGACGCGATCAAGCAGGCGGCCCA
+CGAGGCCGTGAAGGGCACTCCCATGGCGGGTGCTGGGATCTATCTGGCCGGCACGGCCGCCACCTTCAAG
+GACATTCAAGACGGCGCCACCTACGACCTCCTGATCGCCGGAATAGCCGCGCTGAGCTTGATTTTGCTCA
+TCATGATGATCATTACCCGAAGCCTGGTTGCGGCGCTGGTGATCGTGGGCACGGTGGCGCTGTCGTTGGG
+CGCTTCTTTTGGCCTGTCCGTGCTGGTGTGGCAGCATCTTCTCGGTATCCAGTTGTACTGGATCGTGCTC
+GCGCTGGCCGTCATCCTGCTCCTGGCCGTGGGATCGGACTATAACTTGCTGCTGATTTCCCGATTCAAGG
+AGGAGATCGGTGCAGGTTTGAACACCGGCATCATCCGTGCGATGGCCGGCACCGGCGGGGTGGTGACCGC
+TGCCGGCCTGGTGTTCGCCGCCACTATGTCTTCGTTCGTGTTCAGTGATTTGCGGGTCCTCGGTCAGATC
+GGGACCACCATTGGTCTTGGGCTGCTGTTCGACACGCTGGTGGTGCGCGCGTTCATGACCCCGTCCATCG
+CGGTGCTGCTCGGGCGCTGGTTCTGGTGGCCGCAACGAGTGCGCCCGCGCCCTGCCAGCAGGATGCTTCG
+GCCGTACGGCCCGCGGCCCGTGGTTCGTGAATTGCTGCTGCGCGAGGGCAACGATGACCCGAGAACTCAG
+GTGGCTACCCACCGTTAAGGTGGTGGGATGCCGCTTTCAGGGGAATATGCGCCGAGCCCGCTCGACTGGT
+CGCGCGAGCAAGCCGACACGTATATGAAGTCCGGCGGAACCGAGGGCACACAGCTGCAGGGAAAGCCGGT
+CATCCTGCTCACCACCGTCGGGGCGAAGACCGGCAAACTCCGTAAGACCCCGCTGATGCGCGTCGAGCAC
+GACGGCCAGTACGCGATCGTCGCCTCGCTGGGTGGGGCGCCGAAAAATCCGGTCTGGTACCACAACGTCG
+TGAAGAACCCACGGGTCGAGCTGCAGGACGGCACCGTGACCGGCGACTACGACGCCCGCGAGGTGTTCGG
+TGACGAGAAGGCCATCTGGTGGCAGCGCGCCGTGGCGGTCTGGCCGGACTATGCCAGCTACCAGACCAAG
+ACGGACCGCCAGATTCCGGTGTTCGTGCTGACCCCGGTGCGCGCGGGCGGCTAGCCATTGGGATAGGGCG
+GCGTGGCACCATTGACCGGTGTCCGCCGAACTGAGCCAGAGCCCGAGCAGCTCGCCGCTGTTTTCACTAT
+CTGGGGCAGACATCGACCGTGCCGCCAAGCGGATCGCACCGGTAGTCACGCCCACCCCGTTGCAACCTAG
+CGATCGGTTGTCGGCGATCACTGGCGCCACGGTCTACCTCAAGCGCGAAGACTTGCAGACGGTGCGCTCT
+TATAAGCTACGCGGAGCGTACAACCTGTTGGTGCAGTTGTCCGATGAGGAACTGGCCGCGGGCGTGGTGT
+GTTCTTCTGCGGGCAACCACGCGCAGGGCTTCGCGTATGCGTGTCGCTGTCTGGGTGTGCACGGCCGGGT
+CTACGTACCTGCCAAAACCCCCAAGCAGAAGCGTGACCGGATCCGCTACCACGGCGGGGAGTTCATCGAC
+CTGATCGTGGGTGGGTCGACCTATGATCTGGCTGCGGCGGCGGCCCTTGAGGACGTGGAACGCACCGGGG
+CCACGCTGGTACCGCCGTTTGACGACCTGCGCACCATCGCCGGCCAGGGCACGATAGCCGTCGAAGTGCT
+TGGCCAGCTCGAGGACGAGCCGGACCTGGTGGTGGTCCCGGTGGGTGGCGGCGGCTGCATCGCGGGGATC
+ACCACCTACCTGGCCGAGCGGACGACCAACACCGCGGTGCTGGGCGTCGAGCCGGCTGGTGCGGCCGCCA
+TGATGGCCGCGCTCGCGGCGGGCGAGCCGGTGACGCTGGACCATGTCGACCAGTTCGTCGACGGCGCCGC
+GGTGAACCGGGCGGGCACGCTGACCTATGCCGCGCTAGCCGCCGCCGGCGACATGGTTTCGCTCACCACC
+GTCGACGAGGGTGCGGTGTGCACGGCGATGCTCGATCTGTATCAGAACGAGGGCATCATCGCCGAACCGG
+CCGGTGCCCTGTCGGTCGCCGGTCTGTTGGAAGCCGACATCGAGCCCGGGTCCACCGTGGTGTGCCTGAT
+TTCGGGCGGCAACAACGACGTGTCCCGTTACGGGGAGGTGTTGGAGCGCTCGCTGGTCCACCTGGGCCTC
+AAGCACTATTTCCTGGTCGACTTCCCGCAGGAGCCCGGTGCGCTGCGCCGGTTTCTCGACGACGTGCTCG
+GACCCAACGACGACATCACCTTGTTCGAGTACGTCAAGCGCAACAACCGGGAGACCGGTGAGGCGCTGGT
+GGGTATCGAGCTGGGATCGGCCGCGGATCTAGACGGTCTGCTGGCCCGGATGCGGGCGACCGACATTCAC
+GTCGAGGCGTTGGAACCGGGGTCGCCGGCTTACCGCTATCTGCTGTAGCGAGGCGTCGGCGCGACCGTGC
+CGACAAACCTCGCATGTGTATCGTTGGTGTATGTCGCGCACCAACATCGACATCGATGACGAACTTGCCG
+CCGAGGTCATGCGCAGGTTCGGTCTGACCACCAAGAGGGCGGCGGTCGACCTTGCCCTACGACGGTTGGT
+CGGGTCGCCGTTGAGCCGTGAGTTTCTGCTCGGGCTGGAAGGCGTCGGCTGGGAAGGCGACCTGGATGAC
+TTGCGAAGCGATCGCCCAGACTGATCTCGATGATCCTCATCGACACATCGGCCTGGGTGGAGTACTTCCG
+TGCCACCGGATCAATCGCCGCTGTCGAAGTACGCCGGCTGCTGTCCGAAGAAGCAGCGCGAATCGCTATG
+TGTGAGCCCATTGCGATGGAAATCTTGAGTGGCGCGCTCGACGACAACACCCACACGACGCTAGAGCGGC
+TCGTGAATGGCTTGCCGTCGTTGAACGTTGATGACGCGATTGACTTTCGTGCTGCCGCGGGTATCTATCG
+CGCCGCCCGGCGCGCCGGCGAAACGGTTCGAAGCATCAACGACTGCCTCATAGCGGCGCTCGCGATCCGC
+CACGGTGCGCGTATCGTCCACCGTGACGCCGACTTTGATGTGATTGCCCGGATTACCAACCTGCAGGCCG
+CATCGTTTCGGTGAGCATGCCGCCCCAGCATCAGGCCGGCTCCGCAGCCCGCAGTATCGCAAGCGAATAC
+GCTGCTAGCTCGGTGGAATTATCGCCGATAATCGGCGACTCCCAGGCCAGCACCAGCTCACCGCTGACCG
+GCACGCAGGTTGGCTCGGCACCAAGGTTGCAGGCGATCATCAGCTGGCCGCGGCGCATCACAACCCAGCG
+TTGCTGCTCGTCGTAGTCGACCATAAGGTGGTCCAGCCAGGGGTCCGCAAGGTCGGCCTCGTTGTGCCGC
+AAAGCGATCAGATCGCGATAAAACCGGTGCAACCTGGCGTGTTCGCCGGAGCCGGCTTCGGCCCAGTTCA
+GCTTGCAGCGCTGGAATGTCTGCGGGTCCTGCGGGTCCGGAATGTCGTCCGCGGCCCAGCCATGTTCGGC
+GAACTCCTCCTTGCGTCCTGCCACGGTGCTATGGGCCAGTTCCGGTTCGGGATGTGAGCAAAAGAACTGA
+AACGGGCTGGAGGCCCCCCACTCTTCGCCCATGAAAAGCATTGCGGTATAGGGAGATCCAAGGGTCAACG
+CCGCCTTGATCGCGAGCTGGCCACCGGTCAGGTATTGCGATGGGCGGTCGCCGAGAGCGCGGTTGCCGAC
+TTGGTCGTGGGTGCAGGTGTAGGCGAGCAGCCTGGTGGCCGGGATCGCAGAAGTGTCCAATGCACGCCCG
+TGCCGACGACGCCGGAACGACGAATACGTGCCGGCGTGGAAGTAGCCGTTGCGCAGCGTGTACGCGAGAG
+TGGCCAGCGAGCCGAAATCCGCATAGTAGCCTTGCCGCTCACCGGATACCGCGGTATGGATGGCGTGATG
+GATGTCGTCATTCCATTGGGCGGTGATCCCGTAGCCGCCATGGCTGGGCCGGGTGATCAGCCGCGGGTCG
+TTTCGGTCGGTTTCGGCGATCAGCGACAACGGACGGCCCAACTGGCCTGACAGCCAGCGGGTCGCGTTGG
+CAAGCTCCTCGAGGACATGCACGGCGGTGGTGTCCACCAGTGCATGCACGGCGTCCAACCGCAAGCCGTC
+GGCGTGGAAGTCGCGCATCCATCGCAGCGCGCAGTCGATGATATAGTGGCGAACCTCGTCGGAGTCGGCG
+CCGGCGATATTGATGCCGTCCCCCCACGGGTTGCTGGCCGACGACAGGTACGGGCCGAATCGCGGCAGGT
+AGTTGCCCGATGGGCCGAGATGGTTGAACACCGCGTCGATCAACACGCCCAAACGACGGGTATGGCATGC
+GTCGATGAACCGGACCAGACCGTCGGGGCCGCCGTAGGGTTCGTGCACGCTGTACCACAGCACACCGTCA
+TATCCCCAACCGCGGGTTCCGGCAAAGGAATTGACCGGCATCAGCTCGACGAAGTCGATTCCGAGATCGA
+CCAGGTAATCCAGCTTTTCGATGGCGGCGTCGAACGTGCCAGCCGTGGTGAACGTGCCGATGTGCAACTC
+GTAGATCACCGCGCCCTCGACCGACCGCCCCGGCCAGCCAGTGTCGGTCCGGGCAGCACCAAACTGGCCG
+GGCGGCTCCCACCGCTGGGAGCGTGCGTGCACCCCGTCGGGTTGGCGGGCCGATCGCGGGTCGGGTAGCA
+CGGTGGGGTCGTCGTCGAGTAGGTATCCGTAGCGGGCGTCCGCCGGCGCCGCCACCGTCGTGTGCCACCA
+GCCGTCGGCTGAGCGGGTCATCGCATGTACCGCACCGTTCACGTCGAGCCGGACCAGCGCGGGTTTGGGT
+GCCCATACTCGGAATTCAGGCATTGTCGCGCACCAGCAGCACCACAGGCAGATCCGCGAACAGCTCGACG
+GCCGGCGTGTGCCCACTGGCCGTGAATCCGGTGAGGGCATCTGTCCACGACCCGTCGGGTAGGGGCAGTA
+CGGTGTGGTCCCAGCCGGTTTGCTGCAGGCGCACCGTCCAGCGGGTCACCGCGACCAGGATGTCGTCACC
+GCGGCGGAACGCAACGACGTGGTCGGCGGCCGGCCCGGCGGCGAACACCGGATGGTATGCGCCGCCCAGG
+AAGCTCTCCGGATGGGTGCGCCGCAGTCGAAGCGCCGCGGCCAACACCCGAATCTTAGGGTGCTGCAAGG
+CTTTCAGAGCGACACGCCGGGTGCCGTAGTCGACGGGACGGCGGTTGTCCGGGTCGACCAGGCTGTCGTC
+CCACAGTTCGCTGCCCTGGTAGACGTCGGGTACGCCAGGCACGGTCAACGCGAGCAGCTTAGCGGCCAGC
+GCGTCGCTTTCGGCATGCGAGTTGAGGTGGGCCACAAGTCCGGTCAGCTCGGACGCCAGCGGTCCGTCGA
+GCACCAGATCAAGCCAGCCGTGCACGTCGTCCTCGAACGCCCGGTTCGGGTTGTGCCACGAGGTGTGCCA
+TGCCGCCTCCCGGATCGCCTTCTCGGCGTAAGTGTGCAGCCGGCCGCGCAGCGCGGCGCTGACCTCTCCA
+CTCACTGGCCACACTCCGAAGACGTTCTGCCACAGAAACTGTCCAGTCACGGCATCAGGGGCGGGCGCAA
+TGGCTTGGGCGTGGCCGATGAACTTGGCCCACAGCCACGGCACTTGGGACAGCACGCCGATGCGGGCACG
+CACGTCCTCGCCGCGTTTGGTGTCGTGGGTGGACAGTGTCGTCATGGACCGTGGCCACAACCGAGCACGG
+GTGGCGGCCCGGTGATGAAACTCCGCGGCGCCCACACCAAACCGAGTGCTGGCGGTCGTGCACAGCGGGG
+CCGGTGCCGTCCCCGCTGCCGGGGGCGACGGGCAGCGCCAGGTCGCCCAGCCGCAGCAGGTCGCCGTCGA
+CTCTGAGGTTGGCAACGTCGCTGTCGGAGCCCAATAGCGGCAGGATGATCCGGCCATCACCTAGCTCCCA
+GTCGATGTCGAAGAACTCGGCATACGCCGAGGACCGGCCGAACTTCAAGACATCCCACCACCACGCGTTC
+TGCTCGGGCTTGCCGACGCCGACATGGCTGGGCACGATGTCGACGATCAGGCCCATGCCCCGCGACCGCG
+CCGCCGCGGATAACCGCGCTAGGCCGTCAGAGCCACCAAGCTCGGGTGACACCGTCGTCGGATCGGTGAC
+GTCATAGCCGTGGGTCGACCCGCCGACCGCCGTCAAAATGGGGGACAGGTACAGATGCGATACCCCGAGG
+TCGTCGAGGTAGTCCAGCAGGTTCTCGGCATCGGCGAAGGTGAACCCGAATCCGTTCGACCGACCGCGCA
+TCTGCACCCGGTAAGTGGAAATAACCGGAAATGCCATATTTCACAACGTCTTACGCAGGACCAGCAGCGA
+GCGCGCAGGTACCGAAAACGTGTCAGTGGCGGTTACCGTCAGGTCGATGTCACCGACGGGATCGTTGGTA
+TCCAGCTCTCCGGTCCACTGCTGCGCATAGCCGTCATGCGGCATCACGAACTCCACGTCGTGGTCATGGG
+CGTTGAAGCACAACAGGAATGAATCGTCGACTACTCGCTCACCACGGGCGTCCGGTGCGGTAATGGCTTC
+ACCGTTGAGAAACACCGCAACACACCTGTCGAAGCCTCTGCCCCAATCCTCGTGCGTCATCTCCCGACCG
+CTCGGTGTCAACCAGGCGATATCGCGGACTTCGTCGCCACTGCGGATCGGTTCACCCTCAAAGAACCGGC
+GTCGGCGAAACACCTTGTGGTTCTTGCGCAAGGTCGTCGCCTTGCGTGCGAAAGCTAGCAGATCGGCATT
+CTTGTCCACCAATGACCAATCCATCCAAGATAATTCGGAGTCCTGGCAGTAGACGTTGTTGTTGCCGTAT
+TGGGTGCGCCCAATCTCGTCGCCGTGGGCGATCATCGGCGTGCCCTGGCTGACCATAAGCGTGGCCCACA
+TGTTGCGCATCTGGCGGGCACGCAGCGCCAAGATGTCGGGGTCATCGGTGGGGCCCTCGACACCGCAGTT
+CCACGATCGGTTGTAGCTTTCCCCGTCGCGGTTGTTCTCGCCATTGGCCTCGTTGTGCTTGTCGTTGTAC
+GAGACCAGGTCGTTGAGTGTGAACCCGTCGTGGGCGGTGACGAAATTGATACTGGCACTGGGCCGGCGGC
+CGGTTGCTTCGTAGAGGTCCGACGACCCGGTCAGCCGGGAGGCGAATTCGCCTAGGGTGGCCGGCTCGCC
+TCGCCAGTAGTCGCGCACGGTGTCGCGGTACTTGCCGTTCCATTCCGTCCACAGTCCTGGGAAGTTGCCA
+ACCTGGTAGCCACCTTCGCCGACATCCCATGGCTCGGCGATCAGCTTGACCTGACTGACCACCGGATCTT
+GTTGCACCAGATCGAAGAATGCCGACAGCCGGTCGACGTCGTGCAGCTCGCGGGCCAGCGTGGACGCCAG
+GTCGAACCGGAACCCGTCGACGTGCATTTCGATCACCCAGTAGCGCAGCGAATCCATGATCAGCTGCAGG
+GTGTGTGGGTGGCGGGCATTGAGGCTGTTGCCGGTACCGGTGAAGTCCTTGTAGAACCTCAAGTCGTGGT
+CCATCAGTCGGTAGTAGGCGGTGTTGTCGATTCCGCGAAAGTTGATCGTCGGACCCAAGTGGTTGCCTTC
+AGCGGTGTGGTTGTAGACGACGTCGAGGATGACCTCGATGCCGGCTTCGTGCAGGCTGCGCACCATGGTT
+TTGAACTCGGCTACCGCGCTGCCGGCTTGCCGGGTCGACGCGTATTGATGGTGCGGGGCGAAGAATCCGA
+AGGTGTTGTAACCCCAGTAGTTTCGCAAGCCGAGGTCCAGCAGCCGGGAGTCGTGTAGGAACTGGTGCAC
+CGGCATCAACTCAACGGCGGTGACGTTGAGCTCGTTGAGGTGGTCGATGATCACCGGGTGGGCCAGGCCG
+GCGTAGGTGCCCCGGAGTTCGGGCGGGATACTGGGATGGGTCTGTGTCATGCCTTTGACATGCGCTTCGT
+AGATTACGGTCTCGTGGTACGGGGTGCGCGGCGACCGGTCGTATGCCCAGTCGAAGAACGGATTGATCAC
+GACGCTGGTCATAGTGTGGCCCAGCGAGTCGACCATCGGGGGAGTGCTGTCCGGGTCGACGGCGTTGACG
+TCATAGGAATACAGCGCCTGCCCGAAGGTGAAATCGCCGTGGAACGACTTCCCATACGGGTCGAGCAGCA
+GCTTGCTGGGGTCACACCGATGGCCGGCCGCCGGGTCGAACGGCCCGTGCACACGAAACCCGTAGCGCTG
+GCCGGGGGTGATGTTCGGCAGATAGGCATGCCAGACGTACCCGTCCACCTCGTCAAGCGGGATCCGCGAC
+TCGACGCCGTCCTCGTCGATCAGACATAGCTCGACCTTCTCGGCGATCTCGGAGAACAACGAAAAGTTGG
+TCCCGGCGCCGTCGTAGGTGGCTCCAAGCGGATAGGCGTTGCCCGGCCACACCGTGGGTAGAGCGGGCCC
+GGTCCCGTCGGACTCCCCGGCGTTGTTCGACGACATCACACGACCTTATCCAGGTTCTCCGGCGGGTGTA
+GGCGTCACCACCAGTCGGTGTTCGCCGCGATTTGCCGACCGAGCTCGCTGGTCATCGTCCGCATGTAGGT
+GGGGGTCAGGTGATGACTGTCGCGGTACACCAGAACATTTCCCTCGACCGCGCGGCAGGTGTCGGTCCGG
+CATATCGCGTCGGACATATCGAGTGGCTTAAGCAGCGGGAACCGCGCAACGAAGTCGAGGGTTGGATTCC
+GATCGACCAGCACCTTGGACCGCGCGATCCCACACGACTGCGGATTGCCGCCTTTGGCCAGGCAGTCCGC
+AGGGATGAACGGTTGGCCGTCCTTGACCAGCCAAGGGGTATCCCGCATCGCGAGAACGGGAATGTTGTTG
+TCGGCGAACGTTTGCCAGATCCCGACATAGGTTGCTGGCATCACATCGCCGGGTTTGATGTTCCACGGTC
+GAGTCGAGGTTGTGAAAACGTAGTCGGGGTGGTCAGCGACCAACTTGGCCATCGCCGCTTGCACCCACTG
+GTGACACTGCGGATAGGGAGCGTTATTGCCCATGATCAGCGGGACTTCCTCGGTGGACAACGGGCAACCC
+ATTTTGAGGTACGTCACCACCTTGAAGTGGTGCATGCGACCCAGCAGATCCAGTGCGGTCAGCCAGTGTT
+CGGCGTGTGAACCCCCGGCCAGTGCGATGGTCCGGGGTGCGTCCACATCGCCGTAGGTGCAGTTGATGAT
+CGCCGGGTTGACGAAGTCGCTGATGCAGCCGTCCTTGGTCGAGGTCGGCAGGTCGTGACGGACTTCCAGG
+ACGGTTGGGCGCATCCGCAGCTTGGGCACCCGGACGTGGTCGATCAGGGCCCGCGCCCCGGGATAGTCGC
+GGGAGCTCAACCCGCTCAACTCTTTGCCGGCGGCGCGCTGGACGATGACGTGCTCACGCCACGTGAACGA
+GGTCGCGGTAAGAGCGACGCCAAGCAGTGCCACCACAGATCCCAGCACGATCGTTGGCCGACGCAGCCGC
+AGCCGCCAGGGAATCGGCGGGACCGCCGCCGGCGATCTCACGCCGGCGGGTGCCCGATAGCGTAATGGGT
+CTTCGACAAGCCGGGTGGTCAGGTATGCCAGCAACCCGGATACCAGCAGGACTGCCGCGCCTTCGACAAA
+GTTGGCGTGCCGGTGCCCGGTGTAGGAGAGCCAGAAGATGAGCAGCGGCCAATGCCACAGATACCAGGAA
+TAGGCCATCGCGCCCAGCGCCACCAACGGAGCGGTGGCTAGCAGGCGATTGGGCAGTGGCAGCCGGTCGC
+GGGTACCGGGATGGCCCTGCCGGTTGGCTCCGGCAAGGATCATCAGCATCGTGGCTCCGACGGGTACCAG
+CGCCCACGGCCCTGGAAATTCCTTGACACCGTCGATCAGGGCGCCGCACGACAGTATCGCCGCCAGCGCG
+GCGGTGGCCACCGCGGTGCGCAGCCACATCGGCCAGCGCACATGGGGCACCACAGCGCCGACCAGTGCTC
+CCGCCAACAACTCCCAGGCCCGCGCGAAGGTGTTGTAGTAAGCGGTCGCCTGGTAGGCGTGATGCGCAAC
+GATGGCATAGATGAATGAGGCCAACGTCAACGTGCTCAATAACACCACAAACATCGTCCGCAGGTACGGG
+GCCCGCGGGCCCCGAAACAGTCTGCGCAGCAAGTAGGCGCACCCGGCAACAAGCAGCAGGAAAGCGAGAT
+AGAACTGACCCTGCACCGACATAGACCAGATGTGCTGCAAGGGGCTCACCGCTTCACCGGCTCGCAGATA
+GTTGGAGACCGTGCTAGCCAGCTCCCAATTCTGGTAATACCCCAAGCTGGCCAGGCTCTGGTTGGCAAAC
+GCTTCCCACCGCGTCTGCGGTTGTATTGCGATGGTGAGCAGCGCGCAGCCGGCGAGGACCACAACCAGTG
+CCGGGAGCAGCCGGCGGATGAGTCGGATCACTTCGGCTATAGGCGAGAGTGACAGATCCGGGTTGAGGGC
+GGCGCGAAGTATTTTCCCGCCAAAGAAGAAGCCGGACAGCGCCAGGAACACGTCTACTCCGCCGGAAACC
+CGGCCGAACCAAACGTGGAACACTGCCACCAGGGCGATCGCGACACCGCGCAATCCGTCCAGGTCGTGCC
+GGTAAAAGCCGGTCGTACGGGTCCCCATGGTAACCGGGGGCAAGGCCGGCTCCGGGGTCAAGGCCGGTGG
+GCGAGGCGGCGACAGGGTCAACATGGTTGACAGTTAATTTACCCAAACCAGCCTCCTGCTTCGCGCGCTG
+AGCAGCGGGAAGCAGGAGGCGGGTTTGGGAGGCGAGAAAGCAAGCGGGACCGTTAGCGTGAGCGCGCGGT
+GCCGAAGGGAGGCGGCTGGACGGGCGCTTGCTGGACGGGCGCTTGCTGGACCGGCGCCTGTTGGACCGGC
+GCCTGTTGGACGGGCGCCTGTTGGACGGGCGCTTGCTGGACGGGCGCTTGCTGGACCGGCGCTGGCTGGA
+CCGGCGCCTGTTGGACGGGCGTCGGCTGGGTCCCGAGAACCCGGACCAGGTAAGGCGTCATGCCGTTGGT
+GCGCACCGGCGAAACCTGGACGACGTCGCCCACCTCCAGCATCTGGCCCTTCCCGAGGTATAACGCGACG
+CTTTGCGTGCCTTCGGGGCCGTAGAAGATCAGGTCGCCCTTGCGCGCTTGCTGCGGCAGGACCTTTTGCC
+CAACCTTGTACATCTGGCCGGAAGAACGCGGCAGCTTTAGCCCGGCACCGGCATAGGCGTACTGGATCAA
+ACCGGAGGCGTCGAACCCGACGGTGTTGATGCCGGTACCGGTGCCGCGCGTGGGGCCGCTGATGCCGCCG
+CCGGCCCAGGAGAACGGCACGCCGCGCTGCGACAGCCCGCGCGCGATCACGACGTCGGTGATCTGTTGAT
+AATCCACCGGCCGCGTGGCCGGGTCTGCGGCCGCAAGACCGGGCGCGGCCACCATCGGGGCGAGCATCAT
+TGCCAGACCGATCGCGAAGGAGCCGCTTTTCATGCTGCGTTTCATGGGGTTGTAACCTCCTTGGCACTCT
+CGGGTGGTGTGTGCCTCAGCACGTGACTTCACCGTCTGCCATTCCAGCCGGAAGTCACTTTATTCACACC
+AATCACTACAGACACTTTGACAACAGATGCCGGCCGCGTCCATAGCTGGCCAGATCCACCAGAAGTCTTT
+TTGCCGTAACGTGACCGGACGGTGACTGCCGCGCTCAATCTTTGATCGGCAGTTGTGATTTCAGTCACGC
+GCGATTAATGCCAATAGCGTTCGCTGAATCCCGCTATCGCGTAGCCCGCGATGGAGGTGACGGTGATGAC
+GGCGATCGAGATGATCGGCCAGAAGGACATGTACCAGCCCTTCAACATGGAAACGAAGGGGCCGATGACG
+GCTGTGGCGATGGCCGCACCGATCCCTCCCCACATCACCGGGTAGATGTAATAGTTGACGCCGAACGGTA
+CCAGCGGGCAAGCATCCGGCGGGCACACGTTGTCGGTGAAGGCGAAGAGCCGTGATGGCCAGCTAGTCAT
+CGTGACCATGACCAGAAATACTGCCAATATCACTACGGTACATACCACGTCCCAGGGCGCTATCCGCAGC
+GTGAGTACCCGTGGGGGTGTCCGCTCGTCGGGCTCGTCTAGAGCCGACCGGGATTCGGTGCCAGCATCGG
+GCTGAGTGTCTTCAGGCTGATTCGGCGGTGCCATGCATGCATGCTCCCCGATGGCAGAGGTTTTGGCGAC
+CGTTACTGGGATGGGCCGTGGCGTGGCTGCATTACCCTCGATCTCCATGGCTGCGGCGACTGGCGGGTTG
+ACGCCCGAGCAGATCATCGCGGTCGATGGCGCCCATCTGTGGCACCCTTACAGCTCCATCGGCAGGGAAG
+CCGTGTCGCCGGTGGTGGCCGTCGCCGCCCACGGAGCGTGGTTGACGCTGATTCGCGACGGCCAGCCGAT
+CGAGGTGCTCGACGCGATGAGCTCCTGGTGGACCGCGATCCACGGGCACGGCCACCCCGCTCTGGACCAG
+GCGTTAACCACCCAGTTGCGGGTGATGAACCACGTCATGTTCGGGGGGCTGACTCACGAGCCGGCGGCCC
+GGCTGGCGAAGCTGCTGGTCGACATCACCCCGGCGGGTCTCGACACGGTGTTCTTCAGCGACTCCGGCTC
+GGTGTCGGTGGAAGTCGCGGCCAAGATGGCGCTGCAGTACTGGCGCGGCCGCGGCCTGCCCGGCAAGCGA
+CGGCTCATGACCTGGCGCGGCGGCTATCACGGCGACACCTTCCTGGCTATGAGCATCTGCGACCCGCACG
+GCGGCATGCACTCGCTGTGGACCGACGTCCTGGCCGCCCAAGTGTTCGCGCCACAAGTGCCACGGGACTA
+CGATCCCGCCTACAGCGCGGCGTTCGAGGCGCAGCTGGCGCAGCACGCCGGCGAGCTGGCCGCGGTGGTC
+GTGGAGCCGGTCGTGCAGGGTGCGGGCGGTATGCGTTTTCACGACCCGCGCTATCTGCACGACCTGCGGG
+ACATCTGCCGCCGTTACGAGGTGCTGCTGATCTTCGATGAGATCGCCACCGGCTTCGGCCGCACCGGCGC
+GTTGTTCGCCGCCGACCACGCCGGGGTGAGCCCGGACATCATGTGTGTCGGCAAGGCGCTCACCGGCGGC
+TACCTCAGCTTGGCCGCCACCTTGTGCACCGCCGACGTCGCGCACACCATCAGCGCCGGTGCGGCCGGGG
+CGCTGATGCACGGCCCCACCTTCATGGCCAATCCGCTGGCCTGTGCGGTCTCGGTGGCCAGTGTGGAGCT
+GCTGCTCGGCCAGGACTGGCGCACGCGCATCACCGAACTGGCCGCCGGGCTGACCGCCGGCCTGGATACC
+GCCCGGGCGCTGCCCGCCGTCACCGATGTGCGGGTGTGCGGCGCGATCGGCGTCATCGAATGCGACCGAC
+CGGTCGACCTGGCCGTCGCGACTCCCGCGGCGCTGGATCGAGGCGTGTGGCTGCGCCCGTTTCGCAACCT
+GGTCTACGCCATGCCGCCCTATATCTGCACACCGGCCGAGATCACGCAGATCACCTCGGCGATGGTCGAG
+GTCGCACGGCTCGTAGGCTCACTGCCATGAAAGCCGCCACGCAGGCACGGATCGACGATTCACCGTTGGC
+CTGGTTGGACGCGGTGCAGCGGCAGCGCCACGAGGCCGGACTGCGGCGCTGCCTGCGGCCGCGTCCCGCG
+GTCGCCACCGAGCTGGACTTGGCCTCCAACGACTATCTCGGTCTGTCCCGACATCCCGCCGTCATCGACG
+GCGGCGTCCAGGCGCTGCGGATCTGGGGCGCCGGCGCCACCGGGTCGCGCCTGGTTACCGGCGACACCAA
+GCTGCACCAGCAATTCGAGGCCGAGCTCGCCGAGTTCGTCGGCGCTGCCGCGGGATTGCTGTTCTCCTCT
+GGCTACACGGCCAACCTGGGCGCCGTGGTCGGCCTGTCCGGCCCGGGTTCCCTGCTGGTGTCCGACGCCC
+GTTCGCATGCGTCGTTGGTGGATGCCTGTCGGCTGTCGCGGGCGCGGGTTGTGGTGACGCCGCACCGCGA
+CGTCGACGCCGTGGACGCCGCGCTGCGATCGCGCGACGAGCAGCGCGCCGTCGTCGTCACCGACTCGGTG
+TTCAGCGCCGACGGCTCGCTGGCGCCGGTTCGGGAGTTGCTTGAGGTCTGCCGGCGTCATGGTGCGCTGC
+TTCTGGTGGACGAGGCGCACGGCCTGGGTGTGCGTGGCGGCGGACGCGGGCTGCTCTACGAGTTAGGTCT
+AGCGGGTGCGCCCGACGTGGTGATGACCACCACGCTGTCCAAGGCGCTGGGCAGCCAGGGTGGTGTGGTG
+CTCGGGCCGACGCCGGTGCGGGCCCATCTGATCGATGCTGCCCGGCCGTTCATCTTCGACACCGGTCTGG
+CGCCGGCGGCGGTGGGTGCCGCACGGGCCGCGCTGCGCGTCTTGCAGGCCGAGCCGTGGCGACCGCAGGC
+GGTGCTCAACCACGCTGGTGAACTTGCGCGGATGTGCGGTGTGGCTGCGGTGCCGGACTCGGCGATGGTG
+TCGGTGATCCTGGGCGAGCCGGAGTCGGCAGTGGCCGCCGCGGCGGCCTGCCTGGACGCCGGGGTCAAGG
+TGGGCTGCTTCCGGCCGCCGACGGTGCCCGCGGGTACGTCGCGGCTGCGGCTGACCGCGCGCGCATCGCT
+GAACGCCGGCGAGCTCGAGCTGGCCCGGCGGGTGCTGACGGATGTTCTCGCCGTGGCGCGCCGTTGACGA
+TCCTGGTCGTCACCGGGACCGGCACGGGGGTCGGCAAGACGGTCGTCTGCGCGGCGCTGGCGTCGGCCGC
+ACGTCAGGCCGGCATCGACGTGGCGGTGTGCAAGCCCGTTCAGACCGGCACCGCCCGCGGTGACGACGAC
+CTCGCCGAGGTCGGCCGGTTGGCCGGGGTGACCCAGCTGGCCGGCTTGGCGCGATATCCGCAGCCGATGG
+CCCCGGCCGCCGCCGCCGAACACGCCGGGATGGCGTTGCCCGCCCGCGATCAGATCGTGCGGCTGATCGC
+AGACCTGGACCGTCCCGGGCGGTTGACCCTCGTCGAGGGGGCGGGCGGGCTGCTGGTCGAACTCGCCGAG
+CCGGGCGTCACGCTGCGCGATGTCGCCGTCGACGTGGCCGCCGCGGCTTTGGTGGTGGTCACCGCGGACC
+TGGGCACCCTCAACCACACCAAGTTGACGTTGGAAGCGCTTGCTGCACAACAGGTTTCATGTGCAGGGCT
+GGTGATCGGCAGCTGGCCGGACCCGCCCGGGTTGGTGGCAGCCTCGAATCGGTCCGCGCTGGCGCGCATT
+GCTACGGTGCGGGCCGCTCTGCCCGCCGGGGCCGCGTCGCTGGATGCCGGGGACTTCGCGGCGATGAGCG
+CGGCGGCGTTCGACCGCAACTGGGTTGCCGGGCTGGTCGGCTGATGGTGCATTCGATCGAGCTGGTCTTC
+GACAGCGATACCGAGGCGGCGATCCGGCGCATCTGGGCGGGGTTGGCCGCCGCCGGCATACCCAGCCAGG
+CGCCGGCCAGCCGTCCGCACGTGTCGCTGGCGGTGGCCGAACGGATCGCCCCGGAGGTCGATGAGCCGCT
+GGGTGCGGTTGCCCGTCGGCTGCCGCTGGACTGCGTGATCGGCGCGCCGGTGCTGTTCGGGCGGGCCAAT
+GTCGTGTTCACCCGGCTGGTGGTGCCGACCAGCGAGCTTTTGGCCCTGCATGCCGAGGTGCACCGGCTCT
+GCGGCCCGCACCTGGCGCCCGCGCCGATGGCCAACAGCCTGCCCGGTCAGTGGACCGCCCATGTCACCCT
+GGCCCGACGGGTCGGTGGTCACCAATTGGGGCGGGCGCTGCGCATTGCGGGACGGCCGTCGCGGATTGAC
+GGTCGGTTCGCCGGCTTGCGCCGCTGGGACGGCAACACGCGTGCCGAGTACCTGCTGGGGTGAGGCGGGC
+CCAAAAAGCTTGATGGCGAAGGGGTTTGATCGCAACTTCGTCTTAATGGCCAGCTCGCGGGTTCGGGCGG
+GTGCTGGCCAGGTGGCGAGGACGCACGTCGATGTGGGGATGTCCAAAGATCTTCGCGGGCGGCGATTCTC
+ACGGATCGTCGTGGTTGTCCTCGTCGTTGTGGCGTAGCAGCTTCTCGTGGTGGTGGAAGGTGTTGGTGCG
+GGGTTGGCCGTGGACTGCTGAAGAACATTCCACGCCAGGAGATCAACCATGACCACCACACCAGCACGTT
+TCAACCACTTGGTGACGGTAACCGACCTGGAAACCGGTGACCGCGCCGTCTGCGACCGCGACCAGGTGGC
+CGAGACGATCCGGGCGTGGTTCCCGGACGCGCCCTTGGAGGTGAGGGAAGCGCTCGTTCGGCTGCAGGCC
+GCGTTGAATCGGCACGAGCACACCGGCGAGCTCGAAGCGTTCCTGCGGATCAGCGTCGAGCACGCCGACG
+CCGCCGGCGGCGACGAGTGCGGCCCGGCGATCCTGGCCGGCCGCTCCGGGCCGGAACAAGCCGCCATCAA
+CCGGCAACTCGGACTCGCCGGCGACGACGAGCCCGACGGCGACGACACCCCGCCGTGGAGCCGGATGATC
+GGGCTTGGCGGCGGAAGCCCAGCGGAAGACGAGCGCTGACGGTGAACACCGCGGCAACAGGACGCTGGGC
+GGTCCCACGGGCGGGGCATGGATAGCTTCCGGCCCATGGGCCGGAAGCTATCTCGGAGAAACAAATGGCG
+CCGCTGGCCGCCGGATCGCGGAGCTGGAGCGGCCGAAAGCCAAGCAGCGGCAGCGCGAGGGGCAGGATCA
+TGGCCGCCAGGCTCGATATTCTGGTTTGGGGCCCATGGGCTACAAACCAGAATCAGAGCGTCATTCGACG
+AAAACAGACACTGCTATCGGCGCAGCCCTCGGCATCTCCGCCGGCACCTACCGGCGGCTCAAACGAATCG
+ACAACGCAACCCACAGCGACGACAAAGAAATCCGCCGGTTCGCGGAGAAACAAATGGCGCCGCTGGTCGC
+CGGATCGCCGAGCTGGAACGCCCGAAAGCCAAGGAGCGCCAACGCGAGGGTGGTCGCCTCGGTGCATCGA
+TCACCAATGCCGGCTTTGGTCCCATGGAACCAAAGCCGTCTCAGCGCCACACTGACAAGGAGGTAGGCGC
+AGCCCTCGGCATCTCCGCCGGCACCTACAAGCGGCTCAAACGAATCGACAACGCAACCCGCAGCGACGAC
+AAAGAAATCCGCCTGTTCGCGGAGAAACAAATGGCGCCGCTGGCCGCCGGATCGCCGAGCTGGAACGGCC
+GAAAGCCAAGCAGCGGCAACAGGAAGGCGGCGACCATGGCCGCCAGGCTCGATATTCTGGCTTGGGGCCC
+ATGGGCCCAAGCCAGAATCGGAGCGTCGTTCGACGAAAACAGACACTGCTATCGGCGCAGCCCTCGGCAT
+CTCCGCCGGCACCTACCGGCGGCTCAAACGAATCGACAACGCAACCCGCAGCGAGTTGGCGGCGTGGGCG
+GCCCGGCACCCCTAAGCAGAGGCCGCCCACGCCTGGCCCTATCCTACCTACGCGGTAGTCTCCACCTTCA
+GAACTCGAAACGCGTTGCGCACCAGCACATCTGATCCGACCCTGAACCAGGCGAAGAATCCGCGCTGCCC
+GGTCGGCCGGCGATTCGGCCCGAACAGGTGAGGCACCAACTCCACCATGGACCCAACTCTGTCGACGATG
+AGGAATTGCTTCCAGTCGCCAAGCACCAGTGGATGATTCGTCGCTGTCACCGCCGAATCAACGGTGTCCA
+TGTGGGAGACTTCCAGGACAGACTTCCCGGCTAGCATCGGCGGACTGTCGTGCAGCGATGGGAATTTCAG
+CGCGCCATTCGAAGTTTCCGCCTGCCGCAACGTGTTGATGGTGGACAAGTTCGCCGCGAACGCGGCGCTG
+GCCTGGAACCTTGGCGGCAGCGCCGACTGCAACGCGTAAACATCCGCCGCCACAATCGCTTCTGACCCCG
+CGCCGACGACCACCTGATCGGAGGTGCCGGTTAGCGCGCTGACGAACCCGGTGGGCTCGCCGTTGCCGGA
+GCCGTTGACGAACGCCGCGGTCTGCAGTTGCTCAACGCTGTCCGCGAGAATCTTGCCGATCTCGCCAACG
+AAGCTCGCCGCGTCACCCTCCAGCTCGATGGAGAACGGAATCCAGCAGCTTCCACGGTAGTTCGGCACCG
+CCGGCTGGGCCAACGCTGGCGAATCGTCGGACACCTCCTGGGCTTCGGAGTACCAACGAGCTTCGGCGCC
+TTCGGAAGTCACGCCCCGCCAAATCTCGGAGGTCGTTTGCACCACCCTCGCCACCTGCCGAATCGGGTTC
+GTCGACCCATCACCCGACAGCAGGATCGCCGGGTCCAGCGCCGCCGGGATCAGAAACCCGCCTTGGGTGT
+CCACCAGGCCCATCGCTCGCTGCTCGGCGGCCACCGCGGCAGCCTCACGCCACGCGGCCGCTTCCCGGTC
+GGTCCAAACCGTGTGCCCCGCAACAGGATTGGAAACCCGCTTGACGAACGCGCCCAAATAGTCGCGGCTG
+CCGGTGGCCGCCAGCCAGCGCTGCGCCCACGAGGTGGACTGCGGCGGCCCGGTGCGGCACAAGGTTTCCG
+CGGTCTCCGCCGCCCGCGACGACATCAGGCCGTCTCGCACACAAGAATCCAGTGTGCGAAACGCGGTGTC
+CCGCAACGAGTTGCCCGGCGGCGCGTCGCCGTCGTCGCCGCCGGTGGGAGCGCCGGGCACCACCCTCAGC
+TCACCGGCCCGGTAGCGGCGCAGCTCCTCCTCGGCTTCGCGGCCGCGGCGGCGCTGCTCCGCCCGCAGTT
+CCTCGGCGTGGCGCGTCAGCGCCTGAAAACGCTGCGCCGCCTCACCGGTCAGGTCGCCGGCGACACTGTC
+GAGGAGCTGCTTCGCCGCGTCACGGGTTTCAGGTAAAGAGAGGTTTTTGATGTCGTCGAATTCGGTCATA
+GATTGTTCACCAATCGAGTAGGGACAGCCAGGCTTCGGCTGTCGAACGGGAAACGACTGTAAGCGATTCC
+GCGCGCACCCCGGCGATTTGTGCCCCCGAATAGGCCGGAACGCCGGTTAGGGAAACCTCTAACAGCGCCG
+CTTCGACGCGCACCAGCACATCCCCTTCGCGACGGTCCCGGATCGGTCGGAAACCCACCGAAAACGAGTC
+GACGACACCAGCTTTTACGTTCGCCAAAGCCTCGTCGCCGTCCGGGGTGTCCGCAATCTCGAACGCCCCG
+AACAAGCCGTGAGGCTCCTCCCGCAACTCAACGGCCCGGCCCACCGGGTAGCGGGTTCGAGCGTCGTGAG
+AGACCAGCAGCTTCAATTTGTGGCCGCGCTCGGCGATGGAGCGCCGAAAAGCGCCAGGAGCGAACATTTC
+CTGGAACTCGCCGTCGAAGTCGCGGACGGTGGTCGCCTCGTTGTAGGGCACGATGGTGCCGTGCACGGTT
+CGGCCTTCGCCAGACCGCAGCTCGGCCATGCGGAAAAGGATGCTACTCAAAATTCGGCCACCACCTAGCA
+GACGCAAGAAACGCGCGGAATCGCTTGTGGCGCATGGCGGCCGCTATCCGGGTTCCAGCCGCCCCGCGGC
+GACTGCCCGGCGTCAGCGGATGCCGAGATGCCAAACTCGATTGTATCACACACAAAAGGTCATCACCGGT
+CCGGGGCAAACGGGTTGAGCCCGTCGCCGTCGTCGCCCGGCGCCACCGCCAGTCGCTGCTCGGCGGCCGG
+GGTCAGGCCAAACTCGGAGGCCAAGCGCAGCAGATGCATGCGCGCCGTCTCCGCAACCGTCACCGCCGGG
+TTCCGGTGCACGACACCGGATTTCGGTGAGGTAATTGTGAGGCCTTCGGCGCGGACCCGCTGAACCGCCG
+CGACGTAGACGGACCAGGTCTCGCAGTACGCGGACAGGAGCGCCCGATCCTCAGGTTTGAGCAGGTCAAG
+CCGCTCCAAAGTCGGTGCGACGCGCCGCCATTCGGCCAGCGCCTCGGCGTCGAGCCAGTCCGGGGCATCC
+GGTGCCTGACGGATAAACTTCGGCGACTCGGGGACTTTCCGGCCGCCGGAATCGCGGCCGGGGGAGCGGC
+CCTCAACCAGTTTGAGCCGGGCCGGTTTCGGTGGTCTTGGCATCGGTCCTCCCATCAATTTTTAGTCTAG
+GTAATGAGCGTGCATGCGCGCCGGCACCGTGGCGGTGTCCGGGCTGGGCCTGGTCACGATGGCGACCCCG
+CCCCCTGGTCGTCGTCCTGCTCGATAGGTCGGGCGTCTCGCAGCGGGTCGTTGCCGGGATACGACGCGTG
+GAAGGCAAGCCAGTCACGATCGGCATGGACAAGAACATTGCCTCCGGCTTCGAGGTAGGCGTTCTCGGTG
+TCGCCGCGGAGGATAAGTGTTCCGTCTTTCGCGAAGGATTCGAGTGCTTCGACCGCCGCATCGGGTGAGC
+AACCCGTCTGCGAGCAGACAACCTGGACTGCCAGCTCGTGCATCAGTTGTCGTTCGTCGTTGGTCAGGGG
+CCGGTTGATCGGGGTCACTGGTCGACCTCTATGGTGTCGTCGGTACTGTCGGCGACACCCTCGGCGATTA
+GGAACGGGCACGGCTTACCGACGTCGACGGGACAGTTCGCGCGCTTCCATTTGTTGTCGGCGACACCCAT
+GACGGGTTCGCCGGTCTGCAGGTTCGGCAGGATGATGTACGGCACGGCGTCACCACAGCGTTTGCAGGTC
+GCCATACCGACATCGGCGTTGAAAGCCATGTCGGCGATTCGTCGCCGCAGTTCGGCGTGGTCGGGGGTTT
+CAGCCATGGCTTGTGTCCTTTCAAGCAGGGTTGGTAAGTGCGGTTCTGGCGGCATTGAGCTGCTGTTGCA
+GTATCGGGCATCCGGTTGGGGCGTCGGGGTGCAGCACTTTGGATAAAGCCCTGTACACGGCGGGTGTCCG
+CTGGGGTCCGACCGCCCGGAACAACGCTTTGGCCCAGTCGGTGCACTGCTGTTGCGCCGGGTCGGCGGGT
+CCGGTGACGGTGTGGCCGTGGTAGCGCAGCTCGGCGGCCAGCAGTGGGGTCCAGTCAGCGTCGATGAACC
+AGCAGCGGGTGTGCGCGGACCAGGAGCGGGCATAGGCGGGGATCGTGGACTTGATCAACGACACGATCGC
+AGAGTCGTAGGCGAATCGGACGCTGTGCCGACCGCCGGATGCCGGGGTGATCGCGACAGCGGTCATGCGG
+CACCGCCGGTGTTTGCTGGTTTGGCGGTACAGTCCGCCCGGTGGCGGCCGTGAACGGCCAGGTAGGTACC
+GCATCCTGGGCAGAACGGCACGGCAGGCCGTGACGCATGTGACGTTTGCGCGGTATAACCGCCATACGTG
+CGCGCGCGTAGGCGAACCTGGAAATGCGTCACATGCGTCACGTTAGGTGTGCTAATCATCGAAATCATCG
+GCCCCTCTCACCGCTATTCCGGCCCGCCAACGACCATCACGGGCCTTGTCAGTGACCGGGTATCCGTGGG
+TGTCGAGCGACTGGCCGAACGCTTTGCGCGAGATTTCGGGTACGCCTTCTTGCACCCGCCACCTTTGCCA
+CGCCTCGAACAGATGCGTAGTAGTGGCTTTCAGCACCGGCGAGCTGGTGACGCATTCGTCGTCGATGAAC
+CTCTTTATCGTGTCGGAGTCCTCGCGGTAATTCGACGTTGCCGCGAGCACCGCGTCCGGCTGGGATAGTC
+CGATTCGCTGATAGTCGCTCCATCCGGCCACCGCCCAGGACAGGATGCTGTCGGCCTCCAACTGCAACCG
+TGCGTCCAGTTCCCGGTCCTGCTCGTCGGCAGGAATCACTACTTCAAACGGCACCACTCGAATTCGCCGC
+CAGATGGCCGTATCATCGCCGGGCACTCTCGGTAGGTGGTTGGTGATGAGCAGTGGGGTATGTGACGGCG
+TGAATTCCACGAAGTCTTGCCGCATCTTTCGGGCGCGGATGGTGTCGCCGCCAGTCAGCCGTTTTATCGT
+TGATTCGGCCAGCCGGCGATCTTTTTCGCTCTCGGATACCGCTACCCATCGCACGCCGCGGAGGTCCATT
+TCGCCTGTTGGGTGAGCGTTTTCCCGGTGCATGAAAAGGTCAGGCTCAGCGGTGCAGGCATAATCGCCAA
+GGGCATAGCGAATCGCCTTGTCGAACACAGATTTTCCGTTGGCACCTACACCGATAAGAATCGCCAGGAC
+ATGTTCGCGGACGGTGCCTAGTAGGCCGACGCCGGCCAGGCGTTGCACGAACCCGCGCACACCTTCATCG
+GGCAGAACGCGGGTCAAGAACGCTTGCCAGAGAGGCGATTCGGTGTCGGACTGGTAGGCACCGCGGCATA
+TCTTTGTGATGCGGTCAGCGGGCGCGTGGGGCCGCAATTTGAGCGTGTGCAGGTCCAGCGTCCCATTCGC
+GACGTTGAGCAAGTGCGGGTCGCTGTCGAGGTCGGCTAGCGTCGCGGCGAATGGTACCAGTGCGGCGGCC
+AGGTCGAGCACGCCGGCCACGCCGGACGCCGATTCGCATTTTCGGACGTCGGCGCGTAATTCCTTGTCGT
+TGAGGCTGTCTGAGAGCGCTTGGCGCAGCTCTGCCAGCACTGCACGTTTGGCTTCGCCGCGGTCGTCGGC
+TGCCCAGCGTCTGCCGTCCCAGGAGTGCCAGCCGATCCCGGCCACGTGCAGCAGCTTGTCCTGGTAACGT
+TCGGCTAGCCGGTAGGCGATTCGGGCTTGGCCGCGATGAACTTGCGTCGGTTTGCCACCGTCGTCGATGA
+GCACGTGCCCGTCCCGGTCGATCCAGGGGGCGTCGGGATAGTCGGTGCCGTAGGGGATGTCGGCCATCAC
+GCCACCCCCGCCCGCGGGATGTACACGCCGCGCCGTCGGACGATCTCGCGGGCGATGCCGGGCCAGTCGG
+CGGCCGCAGATACGTCACGTGACGCCTGCGCCATCGCCTCCTGGCACGTCTCTACCCTCAGAGCCCAGTG
+CCGGGCTGCGTCGCAGATCGCGGCCCATTTGCGAGGATCGGCGTCGTCGAGCTGACGCCAGGCCGGTGTG
+CCGGCCATCGGCCACGACCCGGCAGCATCCAGGACCGGCGCGACATGCTCGTGCACCGACCACCACGACA
+CGGCGCGTGACGCGGTAGGATCGGCGCTAGACGGTGTGGCGACTGTCGCGGGTGCCCGGTCCTCCGTGGC
+CGAGCATCGTCGCGTCGGCGGCGACCCGCCGGCGCCGGCGGTCATCGGGCACCGCCTGACCGCCGCACGG
+GGCGCAGCAGCTCGGCCAGCCGGGTGCGCTGCTCGTCAGTCAGGGGCGGCGCTGCGGCGAGGGTGCGGAT
+GAGGTAGTCCGCGATGTTCGCGGCAACGAGATCGGTTTTCGCGGCGATGAACTCGGGATCGTCGGATGCG
+CGGGAACGAGACAGTGCGGCTACGCGGCCGCGATGATGGTAGATGGTCGACACGTGCGACTCCTTGGGGA
+CACCAAAACCCCGGAGTCGAAGCCGGCTACGTCGGAGTCTAGCAGCTACCACGCGTTGGGGTGGCGCGTA
+GTTTGTTCGGCGTGTCGCTTTCGCAGAGCGTGCGCCACAGCCACATGGCGACGACCACCGCGTCCGACTG
+CACCGCAAAACCCGGTGCGTAGTCGGGGTTGCCGGCCAGTCCGGTCAGTAGCCGCGGAACGTTCTCGCAC
+AGTGTTTGCAGGTCGCCGTTGCGAACCCGCACGGGCCGCTGCTCGCACGTGCGCACGCCGGCGGCGCCGT
+ACCTCAGGCAGGCGAATTCCCAGTGCAGCCGCACCCACCCGTCGCGGCGCATTTCAGGTCGTAGGCGAGA
+CTCGTTGGGCGGCAAGCCAATAACGGCTCGCGGCTGGTTGTCGTCGTCGAGTAATGTTGCCACCGCTGGC
+GCCTGCGGTAACCAGCCCTGGGTCTCGTCGACCCAAATGATCGGCGCGACAAGATCGCAGCGCTCGTGTT
+CGATGCGGCCATCGCCTTTGCGGCCGTGGTCACAGACGATCACGATGTTGTGGTGCCGGCTCATCGCCAA
+TTCACCTGCACCCGTTCGGGATTGAATATCCTGCCGCTCTTGCCGACCGGCTGGACAACGACTTCAGCGA
+GGACGTCGAGGACGGCGCGGAACCGGTCCGGCGACAGCTCGGCTATCATCCCGGCGACTTGCGGTGTTCC
+CAACGGTATCCCGTCGAACACTCGGAGCCGTTCCTGATCCTGTTGGCGGGCCTGAAGTTTCGTTATCTTG
+GCGTTGACGATGTCGGTGCTGATCTTCACCTGGCGCGCGGTCAGTAGCCCTTCGGCGCGTTCGACGGCGA
+GCCTGTCCAGCTCCCCGTAGAGGGTTTCCAGTTCCAGGCGGATGGTTTCGGCTTCGGCGGCGTCGTGAAT
+CTCCCGGCGCAACAAGTCAACGGCGTCGGGCATGGCCAGCCGCTCGGCCACGATGTGATACAGGATCGGT
+TCGATGTTGTCGGCCAGGATGGCCACCCCGTGGCACGCCTTGCACACGTAGACGACCTGGCCGTCGGTGC
+GGTAGCTGCCGGCCAGGTGGTTGCCGCATTTGCCGCAGCCTGCCAGCCCGGTCAGCAGGTGGCGGCGCAC
+GCTTTTGCGGCCGGGGGCGCGGCCGGGGGCGTCCAGCACGGCCTGGGCGGCCCAGAACGTCGCCTCGTCC
+ACCAGCGGCGACCACTGGGCCTTGCCGACAATCGCGTCGCGGTCCACCGGGCCGTAGCGGGCACCCTTAT
+ATGCGCGTAGTCCGGCGTTGCGGGGTTTGCGCAAGAATTTCGACAGCGTTGTAGTCGTCCACGGGCGGCC
+GGTGATGGTGAACGCCCCGGCGTCGTTCCACTGGCGGCACACGTCGCCCAGGGACGCCCCGGCGAGGATG
+TCGGCGTAGGCCTGTTTGACCAGCGGCGCTGTCCGGGGGTCGGGTTCGGGACCGTTGGGGCCGGGCAGGT
+AGCCGAAGGCTTTCGACCAGTTGGGGTGGCCGCGTTCAGCTTTCTGGCGGGCGGCGCGGCGCTGTCGTGC
+CTTCTTGTGCTCGGTTTCGTGAGCGGCCACCGACCCCTTCAGGCGGGCGACTAGCCGGCCCTGGGGTGTC
+GCCAGGTCAACGTCGCCGGCGACGGTGGCCAGGGCCAGCCGCTTCTCGTCGGCTAATGACATGAAGGCTT
+CCAGCTCGATGGGACGGCGATGGAGCCGGTCCAGGTCCCAGGCCACCACGGCGGCGATCTTGCCGGCGGT
+GATGTCGGCCAACATCTGCTCGTAGGCGGGGCGGCGCTTGCCGGTTGATGCGCTGACGTCGTTGTCGAGG
+TACTCGACGGGCACCCATTTTCGCTGCCCGCACAGCTTTAGGCAGTCCTCGCGTTGGCGGGCCACGCCGA
+GCTGTTCGCCGGAGCGGTCTTCTGAGATTCGGAGGTAGACAGCAGCACGCACAGGTGTAGTGTATCTCAC
+AGGTCCACGGTTGGCCGTGGTCGAGGTGGGGTGGTGGTAGCCATTCGGTGTGGCCGTGGGTGTTTTTGCG
+GGTGGTCCAGCCTTTTTCGGCGAGTCGGTTGTCGGGGTCGCAGGCCAGGGTGAGGTCGGTGATGTCGGTG
+CGTCCGGTGCTGGTCCAGCCGGTGACGTGGTGGGCTTGGCTGTGGTAGGCCGGTGCGTCACAGCCGGGTT
+TGGTGCAGCCGCGGTCGTTGGCGAACAGCATGATCCGCTGGGCCGGGGAGGCTAGGCGTTTGGTGTGATA
+CAGCGCCAGGGGTGTGCCGTGGTCGAAGATCGCCTGGGGGTACCTCCCGCTTGCGGGGGAGTAGTGGTGG
+GCGTGGCTGGTCATGCGGATCACATCGGCCATGGGTAGCAGGGTGCCGCCGCCGGTGAAGCCCTTGCCGG
+CGCCGGTTTGCAGGTCGGTCAGGGTGGTGGTGACCACGATCGAGACGGGAAGACCGTTGTGTTGGCCCAG
+TTCCCCGGAGGCGATCAGCGCGCGCAGCCCGGCCAGCAGCCCGTCGTGGTTGCGTTGGGCTTGGCTGCGG
+GTGTCGCGGTCGATGGCGGCCGCATCGGGGGTGGTGTCGATGACCGGGGTGTGGTCGTCGGGGTTGGTCG
+CGCCGGGGGCGGCCAGTTTGGCTAGCACGGCTTCAAAGGTGGCCCGCGCTTGGGGGGTCAGGTAGCCACT
+TAGCCGTGACATGCCGTCGTATTGCTGGTTGCTCAGGGTGATGCCGCGTTTGCGGGCGCGTTCGGTGTCG
+GTGAGGTCGCCGTCGGGGTGTAGCCAGTCCATGACCCGCTGGGCGTAGCGGGCCAGCTCGTCGGGACGAT
+ATTGAGCGGCTTTGCCGGCCAGGTCGGCTTCGGCGGCCTGGCGGGTGGACACATCCACCGCGGCGGGCAG
+GTGGGCGAAAAAGGGCGCGAATCACTTTGATGTGCGCCTCGCCGATCAGGCCCTGGCGTTGGGCGGTGGC
+GGTGGCGGTCAACTGTGGGGCTAGCGGTTCGCCGGTGAGTGCTCGACGAGGTCCGAGATCGGCGGCGTCG
+GCGATGCGTAGGGCGGCGTCGGGCTTGGTGATGCGTAACCGGTTGGCCAGCGCGCAGCACAGCGTGCCGC
+CCAGTTCTTCCTCGCTGGCTTGGGTGTCGAGTTGGTTGATCAACGTGTGCCCGACCGCCGGTAGCCGGCG
+CACCAAGCATTCCAGACGTTCCAGAGACCGCAGCCGTTCCGGGGTGGTCAACACCTCAAAAGACACCTCG
+TCCAAGCGGTCCAGCTCGGCATCCAGCGCATCAAAGACCTCGACAAGCTCCTCCCGGCTATTCGCTAACA
+TGTTCGAATCATAACGTCGGGCACTGACAAGAAGTCGCGCCGACAGCTGCTAGAACTGGTGTTAGCTAAG
+TGAATTCAGTGACTCGAGAGCCCTCGCGAGCTTGGCCGCCCACCAGGTCGGCGGGGATGCCTACCAGGAT
+TCGATCCCGCCAACCGGCAATCTGACCAACCGGGCATAACCCCCGCCGGTGAACCGCAGTTTAGTGAGCG
+GCTTGAGGTTGCGGGATCGACGATTCGGCGTCTGGGCCGCTGTGTGGGATGCCTGGCGGGTCGAGTGCGA
+GTGCTGATAGCTGGGCCGCTGCCAACGATCCGTGACCTCCGCCCACGTCGCGTTTGTCCCCGTGCGCACC
+GCTACCGTAGCCTGAACACCGTTTCATTCAGGCCGCCGAGCAGGCGGCGGATGGGTTCCGCGCGTGCGGA
+GATGACGAAGGATGCAGGGGAGTACCTGGTGACGCAAGCGGCAACGCGACCGACGAACGACGCCGGCCAG
+GATGGCGGGAACAACTCGGACATTCTGGTGGTTGCCCGCCAACAGGTGCTGCAGCGCGGTGAGGGCCTGA
+ACCAGGACCAGGTGCTGGCGGTGCTGCAGCTACCCGACGACCGGCTCGAGGAGCTGTTGGCGCTGGCCCA
+CGAGGTGCGGATGCGCTGGTGCGGACCCGAGGTCGAGGTCGAAGGCATCATCAGCCTGAAAACCGGTGGC
+TGCCCGGAGGATTGCCATTTCTGCTCGCAATCGGGGCTGTTCGCCTCCCCGGTGCGCAGCGCCTGGCTGG
+ACATACCCAGCCTGGTCGAGGCGGCCAAACAGACCGCCAAGTCCGGCGCCACCGAGTTCTGCATCGTGGC
+CGCGGTGCGCGGACCCGACGAGCGATTGATGGCCCAGGTCGCGGCCGGCATCGAGGCGATTCGCAACGAA
+GTCGAGATCAACATCGCCTGCTCCCTAGGGATGCTGACCGCCGAGCAAGTGGACCAACTGGCGGCGAGGG
+GGGTGCATCGCTACAACCACAACCTCGAAACGGCGCGCTCGTTCTTCGCCAACGTCGTCACCACCCACAC
+CTGGGAAGAGCGCTGGCAGACGCTATCGATGGTGCGTGACGCGGGCATGGAGGTTTGCTGCGGCGGCATC
+CTCGGCATGGGGGAGACGCTGCAGCAGCGCGCGGAATTCGCCGCCGAGCTTGCCGAGCTGGGCCCCGACG
+AGGTCCCGCTGAACTTCCTCAACCCGCGGCCCGGTACCCCGTTCGCCGACCTGGAGGTAATGCCGGTCGG
+TGACGCGCTCAAGGCGGTGGCCGCCTTCCGGTTGGCGTTACCGCGCACCATGCTGCGGTTCGCCGGTGGC
+CGCGAGATCACCCTGGGTGACCTCGGCGCCAAGCGAGGCATCCTGGGCGGCATCAACGCCGTGATCGTCG
+GCAACTACCTGACCACCCTCGGCCGGCCCGCGGAAGCCGACCTGGAACTGCTCGACGAGCTACAGATGCC
+GCTGAAGGCACTCAACGCCAGCCTGTAAATGGTGGAAATCGTGGCTGGAAAACAACGCGCTCCGGTCGCT
+GCCGGCGTGTACAACGTGTACACCGGGGAACTGGCGGATACGGCCACGCCGACAGCGGCTCGGATGGGTC
+TGGAGCCCCCCCGGTTCTGTGCGCAGTGCGGTCGCCGGATGGTCGTCCAGGTCCGGCCCGACGGCTGGTG
+GGCGCGCTGTTCTCGCCACGGGCAGGTGGACTCGGCCGACTTGGCGACACAGCGGTGACCGAGCCACCCG
+GTTTTGGCGGACCGTCCGAGCCTTCCGGTGCACCGCGGACGTCGCGGACACGGGCGGTCCTGTTTGTGAT
+GCTGGGTCTGTCGGCGACCGGTGTGTTGGTCGGTGGCCTGTGGGCGTGGATCGCCCCGCCAATCCATGCC
+GTCGTGGCCATCACACGCGCGGGTGAGCGGGTGCACGAGTATCTGGGCAGCGAATCCCAGAACTTCTTCA
+TCGCGCCATTTATGCTGCTGGGGCTCTTGAGTGTGCTGGCTGTCGTGGCATCGGCATTGATGTGGCAGTG
+GCGAGAGCACCGCGGACCGCAGATGGTTGCTGGGCTGTCGATTGGGCTGACGACCGCTGCGGCGATCGCG
+GCGGGAGTTGGCGCGCTGGTGGTTCGGTTGCGCTACGGTGCGTTGGACTTTGACACCGTGCCACTTTCCC
+GCGGCGACCACGCCCTGACGTACGTCACCCAGGCCCCGCCGGTGTTTTTCGCCCGCCGGCCGCTGCAGAT
+CGCCCTCACTCTCATGTGGCCGGCTGGCATCGCGTCGCTGGTATATGCCCTGCTTGCGGCCGGGACGGCG
+CGGGACGACCTGGGCGGCTATCCGGCTGTCGATCCGTCGTCGAACGCTCGTACTGAAGCCCTGGAAACCC
+CTCAGGCCCCGGTGTCCTAGGAGAGTCGCAGCCGCCCGCCGGCATCCGGAGCGGACCGTGTCTCCGGTCG
+GGTGTCAGCGCTTGGATTCAAGCGGCAGATCGTCGAACTGGTTTAAGTCTGGCGTGACGAGGTTGTGTGC
+CAGGTCCGAGTTCGCGCCGGTATGCGCAGAGCGCATTGGCCAGGTCAGAGCGGACGGCGGCTCAACTTCC
+TGCCGGTGATCACCTTGGCCGCGATCACGGCCAGTCTCGCCATGCCGGCGTAGGTCATCGGGTTGAAGAT
+GGTCGGCCACGTGGTCCGGACGCGGTGGTCGGTCAGTGGCTTGCCGGCGAACCGGTCGGTGAGCCAGCGA
+AGCGTCATTGGGGCCGACAGCGGGTGCAGGGACACATGTTCGCTGAACAGGTCGCGGTGGTAGGTGACGT
+TGGCGCCGCCGGCTGTATAGCTGTCAGCGAGCGCGTCGATGTCAGAGACGTCGATGAGGTAGTCATGCAC
+GGCCTGCACGATCAATACCGGCGGGGTGGGCACCGCGCTACCCAGCTTGGTGTCGCCGAAGACATGGGAA
+ACCTCCGGCGTCGACAGAATGTCCTCAAGGGGTTCGTCGAGGAAGTCACCCATGTCCCTGCCGGCCATCC
+GGATCACTGCGTCTACCGTTGTCATCTCCGTCAGTTGCTCCAGCAGCTGACGTCCTTCGTCGTTGGCGTG
+CTCCTTGATCACCCGGGCCAGGCCGGGGTAGCTGTGTTGCAGCGCGGCCACCACCAACGCGGGCAGACCG
+GCAAGAAGAGTGCCATTGAGCCGGCGGAACGTGTGACCAAGGTCACCGACGGGTGATCCCAGCACGGCGC
+CGACGATGTCTAGGTCCGGTGCGTACTCGCCGCATGCTTCGGCGGCCCACGCGCTGGCCAGCCCGCCGCC
+GGAGTAGCCCCACAGCCCGATCGGCGTTGCCGGGGACAACCCGACACGCTCGGAATTCAAGGCAGCCCGG
+ATTCCGTCGAGGACTCGGTAACCGGGTTCATACGGCGACCCCCACAGCCCTTTCGGCCCTTCATGGTCGG
+GTACTGATACCGCCCATCCTTCGGCAAGTGCGGCGCTGATCATCAACAGCTCCATTTGGGTCAGTGACCC
+CAGGGCCTTGGCCCGTCGTCGCAGGGCATATGACGGAAAACAGCGCGACGACATGGCATCGATCGCACAC
+TGGTACGACAGCAAGGGGCAGGTCTGACCCGGGGCAAGCTCCGCTGGGACGATCACCGTGGTCACCGTCG
+CCTCGGGGTTGCCGTACATGTTCGTGGTCCGGTACAGCAGCTGGGTAGCGGTGACGGGCTGCGGAATCAA
+GCCCATAAACGCCAGTTCGACATCGCGCGAGCGCAACACCGTTCCGGGCACGGCATGCTGGTAGCCGGCA
+GGTGGGAAGTAGAACGGATCGTCGGATGGCAGCAGCGGGCGCACTTTGCGCTGCAATTCCTCGTGCGGTG
+GCCGGCCGATCCATTCGGCGCCGGTCGCGCCTGCCAAATTGCCGGGCTCTACCATTAGGCTCCCTTCATG
+GCCATCCGGCATCCTCGCGCGTGATCGGTCCCTGACGGGGTAGCAGCGCGGTTTGCCTGTCGCAGTTCAG
+CGCCGGCACTCAAGGTCAGCGTCGGCACTCGAATGGCGCCAGCGGCTCTTATCCGGCTCTTAAAGTCTCA
+TACAAGTTACAGGATCCAAGGGCCGACTCCGAGGCCAGCGCGGCGTGGCGCCTATCACAGGTTGGGTACG
+CCGAGTTCCCCCATCGCTGGTGCGACCAGATTCAAAGCTGGCCGGGAGGCCGCAGTGCGGCGAACTCGTC
+AGTGACTCTTAGCTGCGAGTCGGTAAACCGGTACAACGCCGCCGGGCGGCCACCGCTGCGGCCGGACTGC
+GCGATGGTTCCGGTTTGGGTGATGACTCTGCGACGGGCCAGTACCCGCTGCAGGTTGGTTGCGTCGACCT
+GGTAGCCCAGTGCGGCGCCGTAGATGTCGCGCAGCGTTGAGAGCGCGAATTCTTTTGGAGCCAAAGCGAA
+TCCGATGTTTGTATAGGACATCTTGGCAATCAGCCGGGTGCGGGCATGGGTCACCATCGGACCGTGATCG
+AACGCCATTGGCGGCAAGGAACTCACCGGGTGCCAGCGGGTGTCTGCTGGCAGCTCGGGGGTGGCGGGGG
+AGGGCACCACCCCCAGGTAGGTCGACGCGATCATCCGGATGCCTGGCAGCCGGTGTGGGTCGGAAAACAC
+CGCGAGCTGTTCTAGATGGGCCAACTCTCGCAGGTCGACTTTCTCGGCCAGTTGGCGCCGAACCGAGCTG
+GTCATGTCTTCGTCGTTGCGTAGCCGTCCGCCCGGCAGCGACCACGCGCCGCGCTGCGGCTCCTTCGCAC
+GTTGCCACAGCAGCACATTGAGCTGGGGTTTTGCCGCACCGCGGCTCATGCCAACTCCGCGCACTTGAAA
+GACGACGGCCAGCACTTCGTGGGCGGTGCTACCATGGGCCATGTTTTCGATTATAAGTCGAAAACCTGTT
+GGAGCGCGGAAGGGGCGGCAATGACTGTGCTGAATCGCACGGACACGCTCGTGGATGAACTGACTGCCGA
+CATCACCAACACACCGCTCGGCTACGGCGGGGTTGACGGTGACGAACGGTGGGCCGCCGAGATTCGCCGT
+CTGGCGCATTTGCGCGGGGCCACCGTCCTGGCGCACAACTACCAGCTGCCCGCGATCCAGGACGTTGCCG
+ACCACGTCGGGGATTCGCTGGCGCTATCGCGGGTGGCCGCCGAGGCACCGGAGGACACCATCGTGTTCTG
+CGGAGTGCACTTCATGGCCGAGACCGCCAAAATTCTCAGCCCGCACAAAACCGTGCTGATCCCGGATCAG
+CGGGCCGGCTGTTCGCTGGCCGATTCGATCACCCCCGACGAGCTGCGCGCCTGGAAGGACGAGCATCCCG
+GCGCCGTCGTCGTTTCCTACGTCAACACCACGGCGGCCGTCAAGGCGCTCACCGACATCTGCTGCACCTC
+GTCAAACGCCGTCGACGTGGTCGCATCCATCGATCCCGACCGCGAGGTGTTGTTCTGTCCGGACCAATTC
+CTCGGTGCACACGTGCGCCGGGTGACCGGCCGCAAGAACCTGCATGTGTGGGCCGGCGAATGCCACGTAC
+ACGCCGGGATCAACGGCGACGAGCTCGCTGACCAGGCCCGCGCACATCCCGATGCCGAACTGTTCGTGCA
+TCCGGAGTGTGGTTGCGCAACCTCGGCGCTATACCTCGCCGGCGAAGGAGCATTCCCAGCCGAGCGGGTA
+AAGATCTTGTCCACCGGCGGCATGCTCGAAGCGGCGCACACGACGCGCGCCCGCCAGGTGCTGGTCGCCA
+CCGAGGTCGGCATGTTGCACCAGCTTCGCCGGGCGGCACCGGAAGTCGACTTTCGCGCGGTCAACGACCG
+CGCCTCATGCAAGTACATGAAGATGATCACCCCCGCGGCCCTGTTGCGCTGCCTGGTAGAGGGTGCCGAC
+GAAGTCCATGTCGATCCGGGAATCGCCGCCAGTGGGCGTCGCAGCGTGCAGCGGATGATCGAAATCGGCC
+ATCCCGGCGGTGGCGAATGATGGCCGGTCCCGCTTGGCGGGATGCGGCCGATGTTGTCGTGATCGGCACG
+GGCGTTGCCGGGCTGGCGGCGGCATTGGCCGCCGATCGCGCCGGGCGCAGCGTCGTGGTGCTCAGCAAGG
+CTGCCCAGACGCACGTGACCGCGACACACTACGCGCAAGGCGGTATCGCGGTGGTGCTGCCGGACAACGA
+CGACTCGGTCGACGCTCACGTCGCGGACACCTTGGCCGCAGGCGCGGGCCTATGCGATCCCGATGCGGTG
+TACTCGATCGTCGCCGACGGCTACCGAGCGGTTACCGATTTGGTCGGAGCTGGGGCACGGTTGGATGAAT
+CGGTCCCGGGCCGTTGGGCGTTGACGCGCGAAGGCGGGCACTCGCGGCGACGCATCGTGCACGCGGGTGG
+CGACGCGACCGGCGCCGAGGTTCAGCGGGCGCTCCAGGATGCCGCCGGGATGCTCGATATCCGCACCGGC
+CACGTGGCGTTGCGAGTGCTGCACGACGGTACCGCGGTGACCGGGCTATTAGTGGTCAGACCGGACGGAT
+GCGGCATTATCAGCGCTCCGTCGGTGATCCTGGCCACCGGCGGGCTCGGGCACCTGTACAGCGCGACCAC
+CAATCCGGCGGGCTCCACCGGCGACGGCATCGCCCTGGGATTGTGGGCGGGCGTCGCGGTCAGCGATCTC
+GAGTTCATCCAGTTCCACCCCACGATGCTTTTTGCCGGACGCGCCGGGGGTCGGCGGCCGCTGATCACCG
+AGGCCATCCGCGGCGAGGGTGCGATCTTGGTGGACAGGCAAGGCAATTCGATAACGGCAGGCGTGCATCC
+GATGGGTGATTTGGCGCCGCGCGACGTCGTCGCCGCCGCCATCGACGCGCGGCTGAAGGCCACCGGCGAT
+CCGTGCGTCTACCTCGACGCCCGCGGCATCGAGGGCTTCGCGTCCCGGTTCCCGACAGTCACGGCATCCT
+GCCGGGCTGCCGGCATTGACCCCGTCCGGCAACCGATCCCGGTTGTTCCCGGTGCGCACTACAGCTGCGG
+CGGCATAGTGACCGATGTGTACGGCCAGACCGAGCTGCTCGGGTTGTACGCCGCTGGCGAGGTGGCCCGC
+ACCGGGTTGCACGGCGCCAACCGCCTGGCCTCCAACAGCTTGCTAGAGGGTTTGGTGGTGGGCGGCCGCG
+CCGGAAAGGCCGCCGCCGCCCACGCCGCGGCGGCCGGGCGTTCGCGTGCGACCTCGTCAGCGACCTGGCC
+CGAACCGATCAGCTACACCGCACTGGACCGCGGCGACCTGCAACGGGCGATGAGCCGGGACGCGTCGATG
+TACCGCGCCGCCGCCGGGCTGCACCGGCTGTGCGACAGCCTATCCGGAGCACAGGTTCGCGACGTGGCTT
+GTCGCCGCGATTTCGAGGACGTGGCGCTCACGCTGGTCGCGCAGAGCGTGACCGCCGCCGCCTTGGCCCG
+CACCGAAAGCCGTGGCTGCCATCATCGCGCGGAGTACCCGTGCACCGTGCCGGAGCAGGCACGCAGCATC
+GTGGTCCGGGGAGCCGACGACGCAAATGCGGTGTGTGTCCAGGCGCTAGTGGCGGTGTGCTGATGGGGTT
+ATCCGACTGGGAGCTGGCTGCGGCTCGAGCAGCAATCGCGCGTGGGCTCGACGAGGACCTCCGGTACGGC
+CCGGATGTCACCACATTGGCGACGGTGCCTGCCAGTGCGACGACCACCGCATCGCTGGTGACCCGGGAGG
+CCGGTGTGGTTGCCGGATTGGATGTCGCGCTGCTGACGCTGGACGAAGTCCTGGGCACCAACGGTTATCG
+GGTGCTCGACCGCGTCGAGGACGGCGCCCGGGTGCCGCCGGGAGAGGCACTTATGACGCTGGAAGCCCAA
+ACGCGCGGATTGTTGACCGCCGAGCGCACCATGTTGAACCTGGTCGGTCACCTGTCGGGAATCGCCACCG
+CGACGGCCGCGTGGGTCGATGCTGTGCGCGGGACCAAAGCGAAAATCCGCGATACCCGTAAGACGCTGCC
+CGGCCTGCGCGCGCTGCAAAAATACGCGGTGCGTACCGGTGGCGGCGTCAACCATCGGCTGGGGTTGGGT
+GATGCCGCGCTAATCAAGGACAACCACGTTGCCGCCGCCGGATCCGTGGTAGACGCGCTACGTGCGGTGC
+GAAATGCTGCACCCGATCTGCCGTGCGAGGTGGAAGTGGACTCGCTTGAGCAGCTCGATGCCGTGCTGCC
+GGAAAAACCCGAGCTGATCCTGCTGGACAATTTTGCGGTGTGGCAGACGCAGACCGCGGTGCAGCGTCGG
+GACTCGCGCGCGCCCACCGTCATGCTGGAGTCATCCGGTGGGCTCAGCCTGCAGACGGCGGCGACCTACG
+CCGAAACCGGGGTGGACTACCTGGCGGTCGGGGCGCTCACACACTCAGTGCGCGTGCTCGACATCGGCTT
+GGATATGTAGCCGGGCGGCCCCGGCGCCCATTAGGCGGCGCCGGATAGGGTAGGCGCCGTGGCGCGAACG
+TTCGAAGATCTCGTGGCCGAAGCCGCATCAGCATCCGTCGGCGGCTGGGATTTTTCCTGGTTGGACGGCC
+GCGCGACCGAAGAACGCCCGTCATGGGGCTATCAACGACAACTCAGTCAGCGGCTGGCGAACGCGACGGC
+TGCCTTAGATCTTGAGACAGGCGGCGGAGAGGTGCTAGCCGGCGCGGGCAACTTCCCGCCCACCATGGTC
+GCTACCGAAGCGTGGCCACCCAACGCGGCTATGGCCACTAGGCGGCTGCATCCGCTGGGCGCGGTCGTCG
+TCATCACCGGCGATAAACCGCCACTGCCCTTTGCCGATGCGGCGTTTGACCTGGTGACCAGCCGCCACCC
+CAGCACCCGATGGTGGACCGAGATTGCCCGGGTTCTCCGGGCTGGCGGCAGTTACTTCGCCCAACACGTC
+GGACCGGCCACGCTGTGGGACCTGCGCGAGCATTTCCTCGGGCCGCGAGAACACAACGGGGCCGATCAGT
+ACGCGCAGGTTGTGCGCACCTGCATCACCGACGCCGGCCTCGAGATCGTCGACCTGCAGATGGAGCGGTT
+GCGGGTGGAATTCTTCGACGTCGGTGCCGTCATCTACTTTCTGCGCAAGGTGATCTGGTTTCTGCCGGAC
+TTCACCGTCGAGGGCTACCACGATCGGCTGCGTGCACTGCATGAGCGCATCCAGGCCGAAGGGCCCTTCG
+TCACCTACTCCACCCGCGCGCTCATCGAGGCCCGCAAACCGTCCTGACGTCGGCCGGGGCCTTAGGCTCA
+GGCGATATCGCCGACGAAGACCCCGATCCGGCGCAGCTGCAAGCGCGCCATCCGCGGCAGCCCCTGACCG
+TCGGAGCCGGCGGGCACAATCCGGGGGTTGATGACGTGAACAACGCCGCGGGCGAAGTGCACGTCGGCTT
+CGCCCGCGGCCAACACGTTCTTGACCCAATCCGTCTTACCGTGCGCGAGCGCGATCGCCAGCACACCGTC
+CTTGCGGTAGGCGGTCACAATCGTTTGGTATGGCTTTCCAGACTTGCGACCGCGGTGCTCGATCGTGGCC
+GTTCCGGGTAGGTAGCGCGCTATCGGTTTGAGCGCCCGGTTGATGTACTTGACCTGCAGACGCTCGAGCC
+AGAGCGGGAACACCATCGGAACGCCCGGGGCGTTATTCGGGTGATCCTTTGCGGACATGGCGGCTCCTCT
+TTGCCGGTCCTTTCTACTGCACTGTACCGGTCAGATATCGACTTGAGCTGCTCTGGGAGAATGGTCTACG
+TGACCGCGCCGCCGCCCGTGCTTACCCGTATCGACTTGCGGGGAGCCGAGTTGACAGCTGCCGAGCTGCG
+GGCCGCTCTGCCACGCGGCGGCGCCGATGTGGAAGCCGTGCTGCCGACGGTACGGCCCATTGTGGCGGCC
+GTCGCCGAGCGCGGGGCCGAGGCCGCGCTGGACTTCGGCGCATCGTTCGACGGTGTGCGGCCCCATGCCA
+TCCGGGTGCCAGACGCAGCGCTGGACGCGGCGCTGGCCGGACTGGACTGCGACGTCTGCGAAGCGTTGCA
+GGTGATGGTCGAGCGGACCCGCGCCGTGCACTCCGGGCAGCGTCGCACCGACGTCACAACCACACTGGGC
+CCGGGCGCGACGGTCACCGAGCGGTGGGTTCCGGTCGAGCGGGTAGGCCTGTACGTGCCGGGGGGCAATG
+CGGTGTACCCATCCAGCGTGGTGATGAACGTGGTGCCCGCCCAAGCCGCGGGCGTCGACTCGTTGGTGGT
+AGCCAGCCCGCCGCAGGCGCAGTGGGATGGAATGCCGCATCCGACCATTCTGGCCGCGGCCCGGCTGCTG
+GGCGTCGATGAGGTCTGGGCGGTCGGCGGCGCTCAGGCGGTGGCGTTGCTGGCTTACGGCGGCACCGACA
+CCGACGGCGCAGCACTGACACCGGTCGACATGATCACCGGGCCTGGCAACATCTATGTCACGGCCGCCAA
+GCGACTGTGCCGTTCGCGGGTGGGCATCGACGCCGAAGCGGGGCCAACCGAGATCGCTATCCTCGCCGAT
+CACACCGCCGACCCGGTGCATGTGGCCGCCGACCTGATTAGCCAGGCCGAACACGACGAGTTGGCTGCCA
+GCGTGCTGGTCACTCCGAGTGAGGACCTGGCCGATGCCACCGACGCCGAACTGGCTGGCCAGCTGCAGAC
+TACGGTGCACCGCGAACGGGTGACGGCCGCGCTGACCGGACGCCAGTCGGCGATCGTCCTGGTCGACGAC
+GTGGACGCCGCCGTCTTGGTGGTGAACGCTTACGCCGCTGAGCATTTGGAGATTCAGACCGCCGATGCCC
+CGCAGGTTGCCAGCCGGATCCGCTCGGCGGGAGCCATTTTCGTCGGCCCGTGGTCCCCGGTGAGCCTCGG
+CGACTACTGCGCGGGATCCAACCATGTACTGCCGACCGCGGGCTGCGCCCGGCATTCCAGCGGCCTGTCG
+GTGCAGACGTTCCTGCGCGGCATCCACGTCGTGGAATACACGGAGGCGGCCCTCAAAGACGTTTCCGGAC
+ACGTGATCACGCTCGCCACGGCCGAGGACTTGCCGGCGCACGGTGAGGCGGTACGGCGGAGGTTCGAGCG
+ATGACCAGGTCCGGACACCCGGTTACATTGGACGACTTGCCGCTGCGCGCCGACTTGCGTGGTAAAGCAC
+CATACGGTGCACCGCAATTAGCTGTTCCGGTACGGCTGAACACCAACGAGAACCCGCACCCGCCTACCCG
+GGCGCTGGTTGACGACGTGGTGCGATCGGTGCGGGAAGCGGCCATCGACTTGCACCGCTACCCCGACCGC
+GACGCCGTGGCTCTGCGTGCTGACTTGGCCGGCTATCTCACCGCGCAGACCGGAATCCAGCTTGGTGTCG
+AAAACATATGGGCTGCCAACGGTTCCAATGAGATTCTGCAGCAACTGTTACAGGCGTTTGGCGGTCCGGG
+GCGTAGCGCGATCGGTTTCGTACCGTCCTATTCGATGCACCCGATCATCTCCGACGGCACCCACACGGAA
+TGGATCGAGGCGTCCCGCGCCAATGACTTCGGTCTCGACGTGGACGTCGCCGTCGCGGCTGTGGTCGATC
+GCAAACCCGATGTGGTGTTCATTGCTAGCCCTAACAACCCGTCCGGACAAAGTGTTTCGTTACCTGACCT
+GTGTAAGCTGCTGGACGTTGCGCCCGGAATTGCGATCGTCGACGAGGCCTACGGCGAGTTCTCCTCGCAG
+CCCAGCGCGGTGTCGCTGGTCGAGGAGTATCCGAGCAAGCTCGTCGTCACGCGCACCATGAGCAAGGCAT
+TCGCTTTCGCCGGCGGCAGGCTCGGATACCTGATCGCTACGCCCGCGGTGATCGACGCAATGCTGCTGGT
+GCGGTTGCCGTATCACCTGTCGTCGGTCACTCAAGCCGCGGCCCGGGCCGCGCTGCGGCACTCCGACGAC
+ACCTTGAGCAGTGTCGCCGCACTGATCGCCGAACGCGAACGCGTAACAACCTCATTGAACGACATGGGTT
+TTCGAGTCATCCCAAGCGATGCCAACTTCGTGTTGTTCGGCGAGTTTGCCGATGCGCCGGCCGCCTGGCG
+GCGCTATCTGGAGGCCGGCATTTTGATCCGCGACGTTGGGATTCCCGGCTATCTGCGGGCCACCACCGGG
+CTGGCTGAGGAGAACGATGCGTTCCTGCGGGCAAGCGCCCGGATCGCCACCGACCTGGTCCCCGTCACCC
+GCAGTCCTGTAGGAGCGCCATGACAACCACCCAGACAGCCAAAGCTAGCCGGCGGGCGCGTATCGAACGG
+CGTACCCGCGAATCCGATATCGTCATCGAGCTCGACCTTGACGGTACCGGGCAGGTGGCCGTCGACACCG
+GTGTTCCGTTCTACGACCACATGTTGACCGCGCTGGGCAGTCACGCCAGCTTCGACCTCACCGTGCGCGC
+CACAGGTGATGTCGAAATCGAAGCCCATCACACCATCGAGGACACGGCAATCGCGCTGGGCACCGCGCTC
+GGGCAGGCCCTAGGTGACAAGAGGGGCATCCGCCGGTTTGGCGATGCCTTCATCCCGATGGACGAAACAC
+TGGCCCACGCCGCCGTCGACTTATCCGGCCGCCCCTATTGCGTGCATACCGGAGAGCCGGATCACCTGCA
+GCACACCACTATTGCCGGCAGTTCAGTGCCCTACCACACCGTCATCAACCGGCACGTGTTCGAATCGTTG
+GCGGCCAACGCCCGCATCGCGCTGCACGTCCGCGTGTTGTACGGGCGCGACCCGCACCATATCACCGAAG
+CTCAATACAAGGCCGTCGCGCGCGCGTTGCGTCAAGCGGTCGAGCCAGATCCTCGGGTGTCAGGCGTGCC
+GTCCACCAAAGGTGCTCTGTGACAGCAAAATCGGTTGTAGTCCTTGACTACGGCTCAGGAAACCTGCGGT
+CGGCCCAACGTGCGCTGCAACGAGTAGGCGCCGAGGTCGAAGTAACCGCCGATACCGACGCCGCAATGAC
+CGCTGACGGACTGGTGGTGCCGGGCGTCGGTGCTTTCGCGGCGTGCATGGCGGGCCTGCGCAAGATCAGC
+GGAGAGCGAATCATCGCCGAGCGGGTGGCCGCCGGCCGCCCGGTGCTGGGGGTCTGTGTCGGTATGCAGA
+TTCTGTTTGCTTGCGGGGTCGAATTCGGTGTGCAGACGCCAGGCTGCGGGCACTGGCCGGGGGCGGTCAT
+TCGACTTGAGGCCCCGGTGATTCCGCACATGGGCTGGAATGTCGTGGATTCCGCTGCGGGCAGCGCGCTG
+TTCAAAGGGTTGGACGTCGACGCCCGGTTTTATTTCGTGCATTCCTATGCCGCGCAGCGATGGGAAGGCT
+CACCCGACGCGCTGCTGACCTGGGCCACATATCGGGCGCCGTTCCTCGCTGCGGTGGAGGACGGCGCATT
+GGCCGCCACCCAGTTTCATCCGGAGAAGAGTGGCGATGCCGGTGCAGCCGTACTGAGCAACTGGGTTGAT
+GGACTTTAAAGGATACTGGTGATGCCGCTGATACTTTTGCCCGCCGTCGACGTGGTCGAGGGTCGTGCCG
+TGCGCCTCGTTCAAGGGAAGGCCGGCAGCCAAACCGAGTACGGCTCAGCGGTGGATGCCGCGTTGGGCTG
+GCAACGCGATGGCGCCGAGTGGATCCATTTGGTGGACCTGGATGCTGCGTTCGGCCGCGGTTCCAACCAC
+GAACTGCTTGCCGAGGTTGTCGGCAAGCTCGACGTACAGGTTGAGCTATCCGGCGGTATTCGAGACGACG
+AGTCGCTGGCCGCGGCGCTGGCCACCGGATGCGCTCGGGTCAATGTGGGCACTGCTGCCCTGGAAAACCC
+GCAGTGGTGTGCCCGGGTGATTGGCGAGCACGGCGACCAGGTCGCCGTCGGCTTGGACGTCCAGATCATC
+GACGGCGAGCATCGGTTGCGCGGACGCGGCTGGGAAACCGACGGCGGCGACCTGTGGGACGTGCTAGAAC
+GCCTAGACAGTGAAGGATGTTCGCGGTTCGTCGTGACCGATATCACCAAGGACGGCACCCTGGGCGGCCC
+CAATCTGGACCTGCTGGCCGGTGTTGCCGACCGCACCGACGCCCCGGTGATCGCGTCCGGAGGTGTGTCC
+AGCCTCGATGACCTGCGCGCCATTGCGACTCTCACGCACCGCGGCGTCGAGGGGGCCATCGTCGGCAAGG
+CCCTCTACGCCCGTCGGTTCACCTTGCCGCAAGCGTTGGCCGCGGTTCGGGACTAGATCGGCGATGCACT
+TGGATTCGTTGGTTGCCCCGCTGGTTGAACAGGCGTCGGCGATCCTGGATGCCGCAACGGCGCTCTTTCT
+CGTCGGTCATCGCGCCGATTCAGCGGTCCGCAAGAAGGGTAACGACTTCGCCACCGAAGTCGATCTAGCG
+ATCGAGCGGCAGGTTGTCGCAGCGCTGGTGGCGGCCACCGGCATCGAGGTGCACGGCGAGGAATTCGGCG
+GCCCGGCAGTCGACTCGCGGTGGGTGTGGGTACTGGACCCCATCGACGGCACAATCAACCACGCCGCCGG
+ATCGCCGTTGGCTGCGATCCTGTTGGGCCTGCTGCACGACGGAGTTCCGGTGGCCGGCTTGACCTGGATG
+CCATTCACCGACCAACGCTATACCGCCGTGGCGGGTGGTCCGCTGATCAAGAACGGTGTACCGCAGCCGC
+CGCTGGCTGACGCCGAACTGGCCAACGTGCTCGTCGGCGTCGGCACATTCAGCGCCGACTCACGGGGCCA
+GTTCCCGGGGCGATATCGACTGGCGGTGCTGGAAAAGCTCAGCCGAGTGTCATCGCGGCTGCGCATGCAC
+GGATCCACCGGCATCGATCTCGTCTTCGTCGCTGACGGGATACTCGGTGGTGCAATAAGTTTCGGAGGTC
+ACGTTTGGGACCATGCCGCTGGGGTGGCGTTGGTACGAGCCGCCGGTGGCGTGGTCACCGACCTGGCTGG
+GCAACCGTGGACCCCTGCATCGCGTTCTGCCTTGGCCGGGCCACTGCGCGTGCATGCCCAGATCCTCGAG
+ATTCTTGGCAGCATAGGGGAACCAGAGGACTACTGAGATGTATGCCGACCGTGACCTTCCGGGGGCTGGG
+GGCCTCGCGGTACGCGTGATCCCGTGTCTGGATGTCGACGATGGGCGGGTGGTCAAGGGAGTCAACTTCG
+AGAACCTCCGCGACGCCGGTGATCCCGTGGAACTCGCCGCCGTCTATGACGCGGAGGGCGCGGACGAGTT
+GACCTTTCTCGACGTGACCGCGTCGTCGTCCGGAAGAGCCACCATGCTGGAGGTGGTGCGCCGCACCGCC
+GAGCAGGTGTTCATCCCGCTGACGGTGGGCGGTGGGGTACGCACCGTCGCCGACGTCGATTCGCTGCTAC
+GGGCTGGGGCTGACAAAGTCGCCGTCAACACGGCCGCCATCGCTTGCCTGGACTTGCTGGCGGACATGGC
+GAGGCAGTTCGGCTCGCAGTGCATCGTGTTGTCCGTCGACGCGCGCACAGTTCCGGTGGGATCAGCCCCG
+ACACCGTCGGGTTGGGAGGTCACCACTCACGGCGGTCGTCGTGGCACCGGTATGGACGCCGTGCAGTGGG
+CGGCCCGTGGCGCCGACCTCGGTGTGGGGGAGATCCTGCTCAACTCGATGGACGCCGACGGCACCAAAGC
+CGGATTCGACCTGGCTTTGCTGCGTGCGGTCCGTGCCGCGGTCACGGTGCCGGTAATCGCCAGCGGGGGC
+GCCGGTGCTGTGGAGCACTTCGCGCCAGCGGTTGCCGCGGGGGCCGATGCAGTGTTGGCGGCCAGCGTCT
+TTCACTTCCGGGAGCTGACGATCGGTCAGGTGAAGGCGGCCCTGGCCGCGGAAGGAATCACCGTGCGATG
+ACACTCGACCCAAAGATCGCGGCGCGGTTGAAGCGTAATGCCGACGGACTGGTTACCGCCGTCGTCCAGG
+AGCGGGGCAGCGGTGACGTGCTGATGGTTGCCTGGATGAACGACGAGGCCTTGGCCCGTACCCTGCAAAC
+CCGTGAGGCCACTTACTATTCGCGATCCCGTGCCGAACAATGGGTCAAGGGCGCGACGTCCGGCCACACC
+CAGCACGTTCACTCGGTGCGCCTGGATTGTGACGGCGACGCCGTATTGTTGACGGTTGACCAGGTCGGCG
+GTGCCTGCCATACCGGCGATCACAGTTGCTTCGATGCCGCGGTGTTGTTAGAACCCGACGACTAACCCGC
+CGCGGAAAGACTGGGGCTAGCGGCTCGCGGCGCAACAGATTGCAGTGGTCGCCCGCGAGGCAAGAGTGCC
+CATCGACACGCCGCCGAGCGAGCGCGGACATACCACCTTGGGATCCATGCAGATGTCAAGGGGGGTTGCC
+CGTCCGGGCGATGGCGTCGATGAGAATGGCGGTCGATGCTGAAACGAGTGCCCTGGACCGTTGTGCTGCC
+TTCGCTGGCCTTTGTCGCGCTGGTATTGACCTGGGGAAAGCAGATCGGCCCGGTGGTGGGCTTGCTAGCG
+GCGGTGCTGTTAGCCGGTGCTGTCCTGGCCGCGGTCAACCATGCCGAGGTGGTGGCGGCCCGGGTGGGTG
+AGCCATTCGGTTCGCTGGTGCTCGCGGTCGCGGTGACGACCATCGAGGTGGCGCTGATCGTTGCGCTCAT
+GGTGTCCGGCGGGGACGATGCGGCGACGCTCGCCCGCGACACCGTGTTCGCCGCGGTGATGATCACCACC
+AACGGGATCGCCGGGTTGTCCCTGCTGCTGGGTTCGCTGCGCTATGGCGTGACGTTGTTCAACCCCCACG
+GCAGCGGCGCCGCGCTGGCCACGGTCACCACACTGGCGACGCTGAGCCTGGTGCTGCCCACGTTCACCAC
+CAGTCAGTCGGGCCCCGAGCTATCGCCCGGCCAGCTCATCTTCGCCGGCGCCGCGTCGCTGGGACTCTAC
+GTGTTGTTCCTGTTCACCCAGACTGTCCGGCATCGAGACTTCTTCCTACCGGTGGCGCAAAAGGGCGCGG
+TCGAGGATGACAGCCACGCCGATCCACCGAGCACCCGCGCGGCGCTGCTGAGCCTTGGATTGCTGCTCGT
+CGCTTTGGTTGCGGTGGTGGGTCTGGCCAAGGTGGAATCGCCGGTCATCGAGGAGGTCGTCTCGGCGGCC
+GGGTTTCCGCAATCCTTCGTCGGCGTGGTCATCGCCACACTGGTGCTGTTGCCGGAGACACTTGCGGCGG
+CCCGCGCGGCCCGGCAAGGCCGCCTGCAGACCAGCCTCAATCTGGCGTACGGTTCCGCGATGGCGAGTAT
+TGGACTCACCATCCCGACCATCGCCCTTGCTTCCCTGTGGCTCAGTGGCCCGCTGCAACTTGGCCTCGGT
+GCCATTCAGTTGGTGCTGCTGGTGCTCACGGTTGTGGTCAGCGTGCTGACCGTGGTTCCCGGTCGGGCCA
+CCCGTCTGCAGGGCGAGGTGCATCTGGTGTTGCTGGCTGCTTACCTGTTTCTTGCCGTCGTCCCGTGATG
+AATCCGTGCGCAAGCGATGGTTTTCGCCGCCGCTATCCAGATCTGATTGCCCGCAGCGTCGCTAACGCTT
+TGTCGGCGTGGGCGTCCATGCTGAATTCGCTGGAGATCACGTCGAGCACCTTACGGTCGGTGTCGATGAC
+AAAGGTCGTGCGTTTGACCGGCATCAACTTGCCCAACAGACCGCGCTTGACCCCGAATTGGGCGGCGACC
+GTGCCTTGGGCGTCCGAAAGCAGCGGGTAGTCGAAACGCCGCACCTCGGCGAATTTGGCCTGCTTTCGAA
+CGGGATCGGTGCTGATGCCGACCCGGCTGGCCCTGACCTCGGCGAATTCTTTGGCCAAGTCGCGGAAGTG
+GCAGGCTTCTTTGGTGCAGCCAGGCGTCATCGCCGCCGGATAGAAGAACAGGACCACGGGTCCGTCGGAT
+AGCAGGACGCTAAGCCTGCGAGGAGTCCCGGTCTGATCGGGCAGTTCGAAGTCGGCTACCGTGTCACCGG
+TTTTCATAGTCGTCAGGCTACAACCGATTGCCCGACTCCTTGCGCGCCGCTTCGCGGCTGGGGGTGCCCC
+CATGCGCGCCGTTTGCGCGGCGTGCATCGTCGTCGGGCTACGCCCGGGCCGATCGGCGTATCTGGGAAGA
+TGGTTCGGTGCACGCCGACCTCGCAGCCACCACCTCGCGTGAGGATTTCCGCCTCCTGGCGGCCGAGCAC
+CGGGTGGTTCCGGTGACTCGCAAGGTCTTGGCCGACAGCGAGACGCCGCTGTCGGCCTACCGCAAGCTCG
+CCGCCAATCGCCCGGGTACGTTCCTGCTGGAGTCGGCCGAGAACGGCCGGTCGTGGTCGCGATGGTCGTT
+TATCGGTGCGGGGGCGCCAACGGCGTTGACCGTGCGTGAGGGGCAAGCGGTATGGCTGGGTGCCGTGCCC
+AAGGACGCTCCCACTGGCGGAGACCCGCTGCGGGCGCTGCAGGTGACCTTGGAGCTGCTGGCTACGGCGG
+ATCGTCAGTCCGAGCCGGGTCTTCCGCCGCTGTCGGGTGGCATGGTCGGTTTCTTCGCCTATGACATGGT
+GCGACGGCTGGAACGATTGCCGGAACGGGCCGTCGATGACCTCTGCCTGCCGGACATGCTGCTGTTGCTG
+GCCACCGATGTGGCGGCGGTCGATCACCACGAGGGCACCATCACGTTGATCGCCAACGCCGTGAACTGGA
+ACGGCACCGACGAGCGGGTCGACTGGGCCTACGACGACGCGGTCGCTCGGCTGGACGTGATGACCGCAGC
+GCTCGGCCAACCACTACCGTCAACCGTGGCCACCTTCAGCCGACCCGAGCCGCGCCACCGTGCGCAACGC
+ACCGTCGAAGAATATGGTGCGATCGTCGAATACTTGGTGGATCAGATTGCAGCCGGTGAAGCGTTCCAGG
+TGGTGCCCTCGCAGCGCTTCGAGATGGACACCGATGTCGATCCCATCGACGTGTACCGAATTCTGCGGGT
+AACCAACCCAAGTCCCTACATGTATCTACTGCAGGTGCCGAATAGTGATGGTGCAGTGGACTTTTCGATT
+GTTGGATCCAGTCCGGAGGCGCTGGTAACGGTCCACGAAGGCTGGGCGACGACGCATCCGATCGCCGGAA
+CCCGGTGGCGCGGAAGGACAGACGACGAGGACGTGCTTCTGGAAAAAGAGCTGCTGGCGGACGACAAAGA
+ACGTGCCGAGCATCTGATGCTGGTCGACCTCGGCCGAAACGACCTGGGTCGGGTCTGCACGCCGGGCACT
+GTTCGGGTCGAGGATTACAGCCACATCGAGCGGTACAGCCACGTGATGCACCTGGTGTCCACGGTGACCG
+GGAAGCTCGGCGAAGGGCGCACCGCGCTGGACGCGGTGACCGCCTGCTTTCCGGCCGGCACGCTGTCGGG
+CGCGCCGAAGGTGCGGGCGATGGAGCTGATCGAAGAGGTGGAGAAGACACGCCGCGGCCTTTACGGCGGT
+GTCGTCGGTTACCTTGACTTCGCCGGCAACGCTGACTTCGCCATCGCCATCCGCACCGCGCTGATGCGTA
+ACGGCACGGCTTATGTCCAGGCAGGCGGTGGTGTGGTGGCCGACTCCAACGGATCCTACGAATACAACGA
+GGCGAGGAACAAGGCTCGGGCTGTGCTCAACGCGATCGCTGCCGCCGAGACGCTGGCCGCTCCGGGCGCG
+AACCGCAGTGGCTGCTAATGCCGGCAGTGTTCGGCCCAACCGCCGGGCCAGGCCGATGATCGGCATCGCC
+CAGTTGCTGTTGGTGGTTGCCGCCGGGGCGCTGTGGATGGCCGCACGGCTGCCCTGGGTGGTCATCGGGT
+CATTCGACGAGCTGGGGCCGCCGAAGGAGGTGACGCTGACCGGTGCGTCGTGGTCGACCGCTTTGCTGCC
+GTTAGCGCTGCTGATGCTGGCCGCGGCGGTGGCGGCGCTCGCGGTGCGCGGCTGGCCGCTGCGGGCGCTG
+GCAGTGTTGCTGGCCGCGGCCAGCTTCGCGGTCGGCTACCTCGGCATCAGTCTGTGGGTGGTCCCGGATG
+TCGCGGCCCGCGGAGCCGATCTTGCCCATGTCCCAGTGGTGACGCTGGTCGGAAGCGCCCGGCACTATTG
+GGGCGCGGTGGCGGCGGTGTTGGCGGCAGTGTGTGCTTTGCTCGCTGCCGTCTTCTTGATGAGTTCGGCG
+GCGATTCGCGGGTCGGCTGGCGAGGACATGGCGAGATATGCGGCGCCCCGCGCCCGCCGGTCGATTGCCC
+GGCGCCAGCACTCGAATGCGGCCGGCCGGGCGGCTCCGCAAGACGACGGGCCGGATATGGGGCCGCGGAT
+GTCGGAGCGAATGATTTGGGAAGCTCTTGACGAGGGCCGTGACCCGACCGATCGGGAGCAGGAGTCTGAC
+ACCGAGGGGCGGTGACGGACCGCGCGCTGACGGTCGCTACCCTTCATGGACGTCGTCGAAATTGACGAGC
+GCGTGTGGGTGACAGTGGGAAGGGAACGGCAGGCATGAGTCCGGCAACCGTGCTCGACTCCATCCTCGAG
+GGAGTCCGGGCCGACGTTGCCGCGCGTGAAGCCTCGGTGAGCCTGTCGGAGATCAAGGCTGCCGCCGCTG
+CGGCGCCGCCGCCGCTCGACGTGATGGCCGCCCTACGCGAGCCCGGCATCGGCGTCATCGCTGAGGTCAA
+GCGCGCTAGTCCTTCGGCAGGCGCATTGGCGACCATCGCCGACCCGGCAAAGCTGGCCCAGGCCTACCAG
+GATGGCGGTGCCCGGATCGTCAGCGTGGTGACTGAGCAGCGGCGTTTTCAGGGATCGCTCGACGACCTCG
+ACGCGGTGCGGGCCTCGGTTTCGATTCCGGTGCTGCGCAAGGACTTTGTGGTGCAGCCGTACCAGATTCA
+TGAGGCGCGTGCGCACGGCGCCGACATGTTGTTGCTCATCGTCGCCGCATTGGAGCAGTCGGTGTTGGTG
+TCGATGTTGGACCGCACCGAATCGTTGGGTATGACAGCACTCGTCGAGGTCCATACCGAGCAGGAAGCCG
+ACCGAGCGCTGAAGGCCGGGGCCAAGGTGATTGGCGTTAACGCCCGCGACCTCATGACGCTGGACGTGGA
+CCGGGATTGCTTCGCGCGAATAGCTCCTGGTTTGCCGAGCAGTGTGATCAGGATTGCTGAATCCGGCGTG
+CGTGGCACCGCTGACCTGCTGGCGTACGCCGGCGCGGGCGCTGACGCGGTGTTGGTAGGCGAAGGTCTGG
+TCACCAGCGGCGACCCACGTGCCGCGGTTGCCGATCTGGTTACCGCGGGCACCCATCCGTCCTGTCCGAA
+ACCGGCTCGCTAGCCGTCGATGAGCCGCTTGCATCTTGAGCCTCGGTGATGACAGATCTATCCACCCCGG
+ATCTTCCGCGCATGAGTGCTGCCATCGCCGAACCGACCAGTCACGATCCTGATTCCGGCGGCCATTTCGG
+CGGCCCCAGTGGTTGGGGTGGCCGCTACGTTCCCGAGGCGCTGATGGCGGTGATCGAAGAGGTCACCGCC
+GCCTACCAAAAGGAGCGCGTCAGCCAGGACTTTCTGGACGACCTAGACAGGCTGCAGGCGAACTATGCGG
+GCCGGCCTTCGCCGCTTTACGAGGCGACCCGGTTGAGCCAGCACGCTGGGTCGGCGCGAATCTTTCTGAA
+GCGAGAAGACCTGAACCATACTGGTTCTCACAAGATCAACAACGTGCTCGGGCAGGCACTGCTGGCGCGC
+AGGATGGGCAAGACCCGGGTGATCGCCGAGACCGGTGCCGGCCAGCACGGGGTCGCCACGGCCACCGCAT
+GCGCATTGCTCGGCCTGGACTGTGTCATCTACATGGGGGGCATCGACACCGCCCGTCAGGCGCTAAACGT
+GGCCCGGATGCGATTGCTGGGTGCCGAAGTCGTCGCGGTTCAGACGGGCTCGAAAACGCTCAAAGACGCC
+ATCAATGAGGCGTTCCGGGATTGGGTTGCCAACGCCGACAACACCTACTACTGCTTTGGTACTGCGGCCG
+GACCGCATCCGTTTCCAACCATGGTGCGCGATTTCCAGCGAATCATCGGCATGGAGGCACGTGTGCAGAT
+CCAGGGTCAGGCCGGTCGGCTGCCTGACGCCGTCGTCGCGTGCGTTGGTGGCGGGTCCAATGCCATTGGT
+ATTTTTCATGCGTTTCTCGATGACCCAGGCGTACGGCTGGTCGGATTCGAGGCAGCCGGCGACGGCGTTG
+AGACCGGCCGGCATGCCGCGACATTCACCGCTGGTTCGCCCGGGGCATTTCACGGATCGTTCTCGTACTT
+GCTGCAAGACGAGGACGGTCAGACCATTGAATCCCATTCAATTTCCGCGGGTCTGGATTATCCGGGGGTG
+GGCCCGGAACATGCGTGGCTCAAGGAGGCCGGGCGTGTCGATTATCGGCCGATCACCGACTCCGAGGCGA
+TGGACGCGTTTGGCCTGCTGTGTCGCATGGAAGGCATCATCCCGGCTATTGAATCCGCGCACGCGGTGGC
+CGGCGCCCTCAAGCTAGGTGTTGAGTTGGGAAGGGGCGCGGTGATTGTGGTGAACCTGTCGGGACGTGGC
+GACAAAGATGTCGAGACGGCCGCGAAATGGTTTGGCTTGCTGGGCAACGACTGATGGTGGCGGTGGAACA
+GAGCGAAGCAAGTAGGCTCGGGCCGGTTTTCGATTCCTGCCGTGCAAACAACCGCGCGGCATTGATTGGT
+TACTTGCCGACCGGGTACCCGGACGTGCCAGCGTCGGTGGCCGCGATGACAGCGCTAGTTGAATCCGGTT
+GCGACATTATCGAAGTCGGGGTTCCGTATTCGGACCCGGGCATGGACGGCCCCACCATCGCCAGGGCAAC
+CGAGGCGGCGCTCCGTGGCGGGGTGCGAGTCCGGGATACGTTAGCCGCGGTCGAGGCCATCAGTATCGCC
+GGCGGGCGTGCGGTAGTGATGACCTACTGGAATCCGGTGCTGCGCTATGGGGTTGATGCATTCGCGCGGG
+ATCTGGCGGCGGCCGGAGGACTCGGCCTGATCACTCCTGACCTCATTCCCGACGAGGCGCAACAGTGGCT
+GGCGGCATCCGAAGAGCATCGGTTGGATCGCATTTTCTTGGTCGCGCCGTCCTCGACACCGGAGCGGTTG
+GCGGCCACCGTCGAGGCTTCACGCGGGTTCGTCTACGCGGCGTCGACGATGGGGGTGACCGGGGCGCGGG
+ATGCGGTGTCGCAGGCGGCACCCGAACTGGTGGGCCGGGTGAAGGCGGTGTCTGACATACCGGTGGGCGT
+CGGTCTGGGTGTGCGGTCGCGCGCTCAAGCCGCGCAGATCGCCCAATACGCCGACGGTGTCATCGTTGGT
+TCCGCATTGGTGACGGCGCTAACCGAGGGGTTGCCTAGATTGCGGGCACTGACCGGAGAGCTCGCTGCCG
+GGGTACGACTAGGGATGTCCGCATGATGCGGATGTTGCCCAGCTATATCCCCAGCCCACCGCGCGGGGTT
+TGGTACCTGGGCCCGCTACCCGTCCGCGCCTACGCAGTTTGCGTCATCACCGGCATCATTGTCGCACTGC
+TGATCGGGGATCGCCGGTTGACAGCCCGCGGCGGCGAGCGCGGCATGACCTACGACATCGCCTTGTGGGC
+CGTGCCTTTCGGCCTGATTGGCGGCAGGCTCTATCACCTGGCTACCGACTGGCGGACATATTTCGGTGAC
+GGTGGTGCCGGGCTGGCCGCGGCACTGCGAATCTGGGATGGGGGCCTGGGCATCTGGGGTGCGGTAACCC
+TTGGTGTCATGGGCGCGTGGATTGGCTGCCGGCGTTGTGGAATCCCGCTGCCCGTCTTGCTTGATGCGGT
+GGCGCCTGGTGTCGTGTTGGCGCAGGCTATCGGTCGGCTCGGAAACTACTTCAATCAAGAGCTCTACGGC
+CGGGAAACCACTATGCCGTGGGGTTTGGAGATCTTCTACCGCCGGGACCCCTCCGGATTCGACGTCCCGA
+ATTCGCTGGACGGCGTCTCGACGGGTCAGGTGGCGTTCGTCGTGCAGCCAACGTTCCTCTACGAATTGAT
+CTGGAATGTTTTGGTATTCGTCGCATTGATCTACATTGACCGCCGGTTCATCATCGGCCACGGGCGACTG
+TTTGGGTTCTATGTCGCTTTCTACTGCGCCGGGCGATTCTGTGTTGAGCTGCTGCGTGACGATCCCGCCA
+CGCTTATTGCCGGCATCCGGATCAATTCGTTCACGTCCACCTTCGTGTTTATCGGGGCCGTGGTGTACAT
+CATCTTGGCGCCGAAGGGGCGCGAGGCTCCTGGGGCCCTGCGTGGCAGCGAGTATGTTGTTGATGAGGCG
+CTGGAACGTGAACCGGCTGAACTCGCCGCCGCTGCTGTGGCCTCCGCTGCGAGCGCTGTGGGGCCGGTTG
+GCCCGGGGGAACCGAACCAACCCGACGATGTGGCGGAAGCGGTGAAAGCCGAAGTCGCCGAGGTCACCGA
+TGAAGTGGCCGCGGAATCCGTTGTCCAAGTAGCAGACCGGGATGGTGAGTCAACCCCCGCTGTCGAGGAG
+ACCTCCGAAGCCGATATCGAGCGGGAACAACCGGGCGACCTCGCGGGCCAGGCGCCAGCCGCGCACCAGG
+TCGACGCCGAAGCTGCATCGGCCGCGCCCGAGGAGCCGGCAGCGTTGGCTTCGGAGGCACACGACGAAAC
+CGAGCCCGAGGTGCCCGAGAAGGCGGCGCCCATCCCCGATCCGGCCAAGCCGGATGAATTGGCGGTCGCC
+GGACCTGGGGACGACCCTGCTGAGCCGGACGGCATTCGACGGCAAGACGATTTCAGCTCGAGACGCCGCC
+GTTGGTGGCGGCTTCGACGGCGTCGACAATGACGACCCACGACGGCACTGCCTGGTCGCCGGTGCTGGAC
+TCAATAGACCGCCGATCGGGCGGCCGTTGCCGCAGCCGGAACGATGCGCCGACGAAGTTCCCGGTCACAA
+AATGGCCACCGGCTGGAACGGTAATCAGCCGAACCCCGACGCGCTTACGAGCCAGACCACTAAGCCCAGT
+AGGCTAGCAAGCCCGGCAGGTTCCATATTTTTTCGCAACCCGGACGCGCACGCGACGCCGGGGCGCTGCC
+TCCGATGCCCGACCGCCACATGAATATCTGTCCGTACCGCTCTTTCGTCACGTCCGCAACACTGGCCTTC
+GCCGTCGGCGATGGTCGCTGTGCCCAGCTAAGCGCGACAACTCGGTTTCTGCAGGTCAACGCCCGCCTCC
+AATCCCGCACAGCCGCGACCAACTCGGGAACAAAACCGCCGGTCAGGCAGCTGTCGCTGAGAGCCGGGCA
+CATCGGGTGTCGCCCGGTGCAGTGACACATGTGAGAGTTGTGGCCGTGCGATGTGCCCGACCCTCGGTGC
+GCACCAATTTGAGCCAACTCAGGAAATGAATCTCTGAGCGGAGGTGCACCGGTTGCCCGCCTCACAACGA
+CATGCTGAGGCGCACACGGTCGCTCGCAGCCGGGCACAACGAACACTCCTGCTCTGCCGCGCCGATGTTG
+GGAACGCATGGGCCTACGGCCGGCACGGGTCGTGCGCCCGGCTCGATCTGGCATGCTGAAAGGCGTGACC
+GATCCCCTGCAGCACGGTGCCTTCGAGCCGGGCTGGCAATCCGCACCACCCGGATATCCACCGCCTTATC
+CGCAATATCCGGGGCCTGGCTCTTACTTTGACCCGTTCGCGCCATATGGTCGCCATCCGGTCACCGGCCA
+ACCATTTTCCGACAAATCGAAGACTGTTGCCGGCCTGTTGCAGTTGCTTGGACTGTTCGGCATCGCCGGG
+ATCGGGCGAATCTACCTGGGCCATACCGGCCTGGGCATCGCGCAGCTGCTGGTGGGCTGGGTGACGTGCG
+GTTTGGGCGCCGTCATCTGGGGCGTCATTGACGCCCTGCTGATATTGACCGACAAAGTCGGCGACCCTTG
+GGGTCGTCCCTTGCGCGATGGAAGCTAGCGGGCGTCAACGTCGCTACGCCGCGGCCGGTTCGGTCGTGCT
+ATTGGCCGGCGCGCTTGGCTACATCGGACTTGTCGACCCGCACAACTCGAATTCGCTATATCCACCGTGC
+CTATTCAAGTTGCTTACGGGCTGGAACTGCCCCGCGTGCGGGGGTCTGCGGATGATCCACGATCTGCTAC
+ACGGTGAGCTGGCGGCCAGCATCAACGACAATGTCTTTCTGCTTGTCGGCGTCCCAGTGCTGGCCAGTTG
+GGTCCTGCTGCGCCGCCGCCACGGCGACTTGGCGCTCCCGATACCGGTGATGATTGCTGTGGCGGTCGCG
+GTGATCGCGTGGACGGTGCTGCGCAACCTGCCAGGCTTCCCGTTAGTGCCGACGATCAGCGGATAGCCGC
+GCCTACCCGCGGTCTGGTTGGCTGGGCTGCCCGCGGTGGTGTTGACCGGTGTGCCGACCCGGCGGTGCCG
+GCCCTACCGCCGTCGCGACTATGCTGAGTCGTCGTGACGAGACGCGGGAAAATCGTCTGCACTCTCGGGC
+CGGCCACCCAGCGGGACGACCTGGTCAGAGCGCTGGTCGAGGCCGGAATGGACGTCGCCCGAATGAACTT
+CAGCCACGGCGACTACGACGATCACAAGGTCGCCTATGAGCGGGTCCGGGTAGCCTCCGACGCCACCGGG
+CGCGCGGTCGGCGTGCTCGCCGACCTGCAGGGCCCGAAGATCAGGTTGGGACGCTTCGCCTCCGGGGCCA
+CCCACTGGGCCGAAGGCGAAACCGTCCGGATCACCGTGGGCGCCTGCGAGGGCAGCCACGATCGGGTGTC
+CACCACCTACAAGCGGCTAGCCCAGGACGCGGTGGCCGGTGACCGGGTGCTGGTCGACGACGGCAAAGTC
+GCATTGGTGGTCGACGCCGTCGAGGGCGACGACGTGGTCTGCACCGTCGTCGAAGGCGGCCCGGTCAGCG
+ACAACAAGGGCATCTCGTTGCCCGGAATGAACGTGACCGCGCCGGCCCTGTCGGAGAAGGACATCGAGGA
+TCTCACGTTCGCGCTGAACCTCGGCGTCGACATGGTGGCGCTTTCCTTCGTCCGCTCCCCGGCCGATGTC
+GAACTGGTCCACGAGGTGATGGATCGGATCGGGCGACGGGTGCCGGTGATCGCCAAGCTGGATAAGCCGG
+AAGCCATCGACAATCTCGAAGCGATCGTGCTGGCGTTCGACGCCGTCATGGTCGCTCGGGGCGACCTAGG
+TGTTGAGCTGCCGCTCGAAGAGGTCCCGCTGGTACAGAAGCGAGCCATCCAGATGGCCCGGGAGAACGCC
+AAGCCGGTCATTGTGGCGACCCAGATGCTCGACTCGATGATCGAGAACTCGCGGCCGACCCGAGCTGAGG
+CCTCCGACGTCGCCAACGCGGTGCTCGATGGCGCCGACGCGCTGATGCTGTCCGGGGAAACCTCGGTAGG
+GAAGTACCCCCTTGCTGCGGTCCGGACAATGTCGCGCATCATCTGCGCGGTCGAGGAGAACTCCACGGCC
+GCACCGCCGTTGACACACATTCCCCGGACCAAGCGTGGGGTCATCTCGTATGCGGCCCGTGACATCGGCG
+AACGACTCGACGCCAAGGCCTTGGTGGCCTTCACTCAGTCCGGTGATACCGTGCGGCGACTGGCCCGCCT
+GCATACCCCGCTGCCGCTGCTGGCCTTCACCGCGTGGCCCGAGGTGCGCAGCCAACTGGCGATGACCTGG
+GGCACCGAGACGTTCATCGTGCCGAAGATGCAGTCCACCGATGGCATGATCCGCCAGGTCGACAAATCGC
+TGCTCGAACTCGCCCGCTACAAGCGTGGTGACTTGGTGGTCATCGTCGCGGGTGCGCCGCCAGGCACAGT
+GGGTTCGACCAACCTGATCCACGTGCACCGGATCGGGGAAGATGACGTCTAGCCGGGTCGTGCCGGACGG
+TAAACCCATGTCCGACTTCGATGAACTACTGGCGGTATTGGACCTCAACGCCGTCGCAAGCGACCTGTTC
+ACCGGATCCCACCCCAGCAAAAACCCGCTCCGGACATTTGGTGGCCAGCTCATGGCGCAGTCATTCGTCG
+CGAGCAGCCGAACGCTAACCCGCCACCACCTACCGCCCAGCGCATTCTCGGTGCACTTCATCAACGGCGG
+TGACACGGCCAAGGACATCGAGTTCCAGGTGATACGACTGCGCGATGAGCGGCGCTTCGCCAACCGGCGC
+GTCGATGCGGTACAGGACGGCACGTTGCTGTCCTCGGCGATGGTGTCTTACATGGCCGGTGGTCGCGGGC
+TCGAGCATGCGCTGGATCCGCCGCAGGTGGCCGAGCCTCATACCCGGCCGCCGATCGGTGAGCTGTTGCG
+CGGTTACGAGGAGACCGTCCCGCATTTTGTCAACGCGCTGCAACCGATCGAATGGCGCTACGCCAACGAC
+CCGGCCTGGATAATGCGGGACAAGGGCGATCGGCTTGCCTACAACCGGGTCTGGGTCAAGGCACTAGGGG
+AGATGCCCGACGACCCGGTGCTGCACACGGCGACACTGTTGTACTCCTCGGACACCACCGTGCTGGACTC
+GGTCATTACCACCCATGGTCTGTCCTGGGGCTTCGATCGCATCTTTGCGGCCTCTGCCAACCACTCGGTG
+TGGTTTCACCGGCAGGTCAACTTCGATGATTGGGTGCTCTACTCGACGTCGTCACCGGTGGCCGCCGATT
+CACGTGGGTTGGGTTCGGGGCACTTTTTTGATCGCTCGGGGAAGCTCATCGCAACTGTGGTGCAGGAAGG
+TGTGTTGAAGTATTTTCCCGCCACCCCTGACAGTGCGGCAGGACGCTCGTAGGATTCCGGGTCAGCACGG
+CTGTGATCAGGCGTAACGTTCCTGGTAGCCAGATGACCGATGGTGGCAGCGGCCGGCGAGCCGCTGAATT
+GCCAGCGAGCGAACCCGGAGGTGACTGTGAAGCTGCCGTCGGCCGATGTGGTACCGAGGCTCCGTGGTCG
+CCAGCGTGTAGTCGTGCACGTCGATTCCCGCACGGCCCGCTGTGTCGGCGCGCTGGCGCTGGTGTGCGCG
+GCCTGCTGGCTGATCGCGCTGCTCGCCGGCGACTACCGGCACGCCCAGTGGGCGGTCGCCGGCCGGTTGG
+GCTGGTCGCTGACGGTCCTGGCTGCGGTGGCATTCATTGCTCGCGGCATCTTCCTGGGCCGCCCGGTCAC
+GGCCATGCATGCGACCGCGGCCGGCCTATTTTTGCTCGCCGGACTGGCTGCCCACGTGTTGGTCGCAGAT
+CTGCTCGGTGAGATTCTGATAGCCGGTTCGGGATGGGCACTGATGTGGCCGACGTCGGCGCATCCGCGAC
+CCGAAGATCTGCCCCGCGTGTGGGCGTTGATCAATGCCACCCGCGCGGACTCGCTTGCTCCGTTTGCCAT
+GCAGGCGGGCAAGAGCCATCACTTCAGCGCGGCCGGCACCGCGGCTCTGGCGTATCGGACCCGTATCGGC
+TATGCGGTGGTCAGCGGCGACCCGATCGGCGACGAGGCGCAATTCCCCCAGCTGGTCGCCGACTTCGCGG
+CCATGTGTCACATGCACGGCTGGCGAATCGTGGTCGTGGGCTGCAGCGAACGACGGCTCGGCCTGTGGAG
+CGACCCCATGGTGGTCGGACAATCGTTGCGGCCCATACCGATTGGCCGGGATGTCGTCATCGACGTGTCT
+AACTTTGAGATGACCGGGCGTAGGTTTCGCAACCTGCGTCAGGCGGTGAAACGCACCCACAATTTCGGCG
+TCACGACCGAGATCGTCGCTGAACAGCAACTCGACGACCAGCGGCAGGCGGAGCTGGCCGAGGTGCTGGC
+GGCGTCACCTAGCGGCGCCCGCACCGATCGCGGCTTTTGCATGAACCTGGACGGCGTGCTGGAGGGTCGA
+TACCCCGGAATACAACTGATCATCGCGCGAGACGCATCGGGTCGGGTGCAGGGTTTCCACCGGTACGCGA
+CCGCCGGCGGCGGCAGCGACATGTCTCTGGATGTACCGTGGCGGCGCCGCGGGGCCCCGAACGGGATCGA
+TGAGCGGCTCAGCGCTGACATGATTGCGGCCGCCAAAGATGCTGGGGTACAACGGTTGTCACTGGCATTC
+GCCGCGTTCCCCGACCTTTTCGGCGCCAACCAGCTCGGCCGCCTGCAGCGTGTCTGCCGTGCGTTGATCC
+ATATCCTCGATCCGTTGATCGCTCTCGAGTCGTTATACCGATACCTGCGCAAGTTCCACGCGCTGGATGA
+GCGGCGTTACGTGCTGATATCGATGACTCAGGTCTTTGCGCTGGCGTTGGTGTTGTTGTCGCTGGAGTTC
+GTCCCGCGGCGGCGACATCTCTGATCCGTCGCTATGGACAGCTCGGCGCATTGAATGTCGTTGGGCAGGT
+GGTGGGTGGCTACCACCACGGTCCGCATAGCGCTCATGATCCCGGAGTTCGGGGCCAGCAGATCGCGCAG
+AAGGTCGGCGTTGGCGGCGTCGAGGTGTTCGACAGGTTCGTCGAGCAACACGATCCGAGCCGGGGAAAGC
+ACCGCCCGGGCGAGCAGCAACCTTCTGCGCTGACCCGCCGAGACCGCTTGCGCGCCACCGATCAACACCG
+TCGACAACCCCTCGGGCAGGCCGGCGAGCCAGCCGCACAGGCCGACCCGATCCAGGGCCTCGATCAGTTC
+GTCATCGGGGCAGTCTCCTCGGGCGGTCAGCAAGTTGTCCCGAACGGTGGTAGCAAAGATATGCGCATCT
+TCAGCGAAAAAGCTGACAGCGCTGCGTAATTCATCCTCATCGAAGTCGCTCAGGTTAGTTCCGTCCAGCA
+ACACCCGGCCGTGCACCGGCGGCAGCAAGCCGGCCAGCGTCATCAACAGCGTCGTCTTGCCGGCGCCGCT
+CGCGCCGGTGACGGCCAGCCGGGCACCCGGCGGTAGGTCAATCGTCACCCGGATCGACTGCGCCTCTTGG
+TGACCGCAACACACGTCGGCCGCTAGCACCCCGGTACCTACCGGCAGTCGCGCCGACACCGTGGATTCGG
+TCTCGCGGACCCGGTTTGACCCAGTCAGGTCGAGCAGACGAGCCGCCGCGATGCGCGACCGTGTCAACTG
+GACGGCGGCGGCGGGTAGTGCAACGGTCGCCTCGAATGCGGACAGCGGCAACAACATCAGGATGGCCAGT
+GTTGTGGGCGCGACCGTGGGGGCCATGCCGATCCCGGCCACCACGGCGCCCAGCAGGCTGGCCCCGATCG
+CCGCGGTCGGCATGGCCTCGGCGATCGCCCCCGTTCGTGCGGCGGCGTCGAGCGCATCGGCCCAGGCATG
+TTGGCGCCGTTGTGAGTCGGCGATGACGTTGCGTAGGGCACCGGCGACACGAAGCTCGGGGGCATGCTCA
+AGGGCGATCATCGCCGACGTGTCGCGCATGCCCCGATGTTGGCGGGCGATCGCTTCCTGCGCTGCGGCGG
+TTCTGCCGGCAAGCCAGGGCGCAACAACGCCGGCAACCAAAAGGCAGACCGCCAGTACCACGGCGGCTGG
+CACCGAAACGGCCGCGACGACCGCGGTCGCGGCTACTGCCAGCACCGCTGCGACGGCTATCGGCACCAGA
+GCACGCACCAGCATGTTGGCCAGTTCGTCGACGTCCGCGCCGACGCGTGCTGCCAGGTCCCCGCTGTGCA
+GCCCGACGGCGGCCGCCGCCGGTCCGTGGGCCAGCCGGTGATAGATAAGGGTGCGGGCCCGGCCGGCGGC
+CCGCAACGCGGTGTCGTGGGTGGCCAGTCGCTCGCAGTAGTGCAGCACGCCGCGCGAAATCGCGAACGCC
+CGCACCGCCACGACCGCCACCGACAGGTCCAGGACGGGCGGCATCTGCCAGGCCCGAGTGATCAGCCAGG
+CCGACACCCCGGCCAGGGCCAGCGCGCTGCCCAGCGACAGCACGCCCAGCGCGACGGCCGCCAAGATCCG
+GGGCAACCGGGGACCCAACAGCCCAGACGCGGCCAGCAGGTCCCGCTGGCGGCGACTCACAGCACTCGGT
+CGGTTCATCGTCGGAAACCATCCGAGTTCACTTCGACGACCCGGTCACCGGCCGCGGCGACCTGCTGGCG
+ATGGGCGACGACCAGCACCGTCGCACCCGCGCGGGCACGCTCGACAATGGCGCCCAACACGTGTTGTTCG
+GTGCGGGCGTCCAGGTGCGCGGTGGGCTCGTCGAGCAGCAGCACCGCAGCCGGTGATCCGAGCGCGCGGG
+CCAGGCCCAGCCGTTGCCGCTGCCCCAGGGATAACCCGACACCACCGCGCCCCAGCACGGTATCCAGCCC
+GCGGGGCAACTCGTCTAGTACAGCGTCGAATCCGGCTGCTGCGCAGGCACGCTCGAGATCATCCACAGGG
+CCCAGCAGAACCAGGTTGTGGCGGACGGTTCCTGGGACCAGCACCGGCCGCTGCGGCAGCCACGACAGTT
+GCCGCCACCAGGCAGCCGGTGCCAGGTTGGTGACGTCGACTCCGGCGACCGTGATTCGTCCTGACGACGG
+TGCGGTGAGCCCGGCGATCGCTTGCAGCGTAGTGCTCTTGCCGGCGCCGTTTCGGCCGGTCAGCACCGTC
+ACCCGACCGGGTTCGATGTCTGCGGTGAGATCATACGGTGCGCGGCCGTCGCGGCCTCTGACACTGAGTC
+TCTCCAGGCGAATCACCCCGCCGCGCGCGGTGACCGTTCGTCGGCCGGGTGTTGGTGAGGGTGACTCGCC
+GAGGAGGGCGAATGCCTTGTCGGCCGCGGTTCTGCCGTCAGCTGCGGCATGAAACTGGACCCCAACGCGA
+CGCAGCGGCCAGTACACCTCCGGCGCCAATAGCAGCACCGTCAAACCGGCCGTCAGGCTCATCTCCCCGA
+AGACCAGCCGTAGCCCGATGCCCACCGCGACCAGGGCCACGCCCAGCGTGGCCAGCAATTCGAGCACCAG
+GGCCGACAAGAACGCGATCCGCAGCGTCGCCATCGCCGACCGCCGGTGGTCAGCAGACAGTTCCGCGATG
+CGTTGTTCCGGGCCGGAAGCACGGCCCAGCGCCCGCAGGGTGGGGATGCCGGCAATCAGGTCTAACAACC
+GGGCCTGGACGGCGGTCATGGCCGCCAGCGCGGCCGCCGAGGGGTTAGTGGTAGCCAGCCCGATCAGCAC
+CATGAAGATCGGTATCAGGGGCAGTGTGATCACCACAATGGCCATTGACTTCAAGTCATAGAGCCCGATC
+ACGGCGACGGTGGCCGGGGTCAGGATCGCGGCCAGCAGCAACGTGGGCAAATAGCCGGTGAAGTAGGGCC
+GCAAGCCGTCCAGGCCCCGGGTAATCAGCACCGCGGCGGCGTCTCGCTGCGCAGCCAGTTGGCTGGGTCG
+GCGGGCGGTTACCGCGGTCAGCACCTGACCGGACAGGTCGGCGATCACTGCGCTGGCGCCGCGCTGGGCC
+AGGCGCGCTTGTAGCCACTGAATCGACGCACGCAACCCCCACAGCACCAACAGGATTGACAGTGGCCCTA
+GCCAACGACGCAGGCCAGCCATCCCAGGGTTGGCGGGGTCGATGACGCCGGCGACGATGCTTGCCAACAC
+GATCGCCGAGCCGATGGCGCAGCCGGAGATCCCGACCCCGCAGGCCACCGTGCTGAGTAGATAGCGGCGC
+AGCGCCGCCGATGCCTGCCACAGCCGCGGATCCAGGGGCGCCCGGGTTCCCCGGGCCTTGGTGCTCAGGG
+CGCGCGCCTCGCCAGACCCGTGGGTGGAGGTATCCGTTCAGCTGAGATCCGTTGCCGGAAAACCCAATAC
+GTCCATGTCTGGTACGCCACCGTCAGTGGAGCGAAGAACGCGGTCACCCACGTCATGATCTTGAGGGTGT
+ACGGGGTCGACGACGCGTTATGGATCGTTAGGCTCCACTGCGGGTTCAGGGTTGAGGGCACCAGGTTCGG
+GTACAGCGCGCCGAACAGCAGCACCACCACAGCCGCCACGACTATCAACGTGCACATGAACGCCCAGCCG
+TCGGACACCCGCCGCCACACTAAGACCGTCGCCGCCGCCTGCGCGCACCCCGCAACTGCCAGCACCAGCC
+ACGTCCAGTCTTTGCCGTATGCCAGTTGCGTCCAAAGTCCAAAGCCCGCAACCAGTCCCGCCACAGGAAG
+CGAAAGCCATACGGCGAATCGGTAGGCATCGTCGCGGATCGGCCCGGAGGTTTTCAAAGCGATGAACACC
+GCGCCGTAGAGCGAGAACAGTCCGGCGGTCGCCAGACCGCCCAGCAGGGTGTAGGCGTTGAGCACGTCGG
+GAATCGACAGGGCAACATGACCGTTCGCGTCTACCGGGAGTCCGCGGACCAGAATGGCGAACGCCACACC
+CCACAACAGGGCAGGCAGCCAGGATCCCGCCGCGATCCCGAAGTCTGCCCCGGTCCGCCATTTCGGGTCG
+TCGATCTTGCCGCGCCATTCGATGGCGACGGCGCGCAGGATCATACCGAACAGGATCGCCAGCAGCGGCA
+GATACAGCGCGGAGAACACGGTCGCGTACCAGCCGGGAAACGCGGCGAATATGGCCGCGCCGGCGGTGAT
+CAGCCAGACTTCGTTGCCGTCCCAGACCGGTCCGATGGTGTTGAGTGCCGTGCGCCGGTGGGTCTCCGGA
+TCGCCCATACCGACATGAGCGAACGGCGCCATCAGCATGCCCACGCCGAAGTCGAACCCTTCTAGGATGA
+AGAAACCGAGGAACAGCGCTGCGATGACACCGAACCACAATTCTTGGAGTACCACCGGCTGCTCCTTTCC
+GGGGTCAGTTGGCCTCAGTAAGCAAACGACAATGGTGCTACCTCGTCGTCGCGGGGTGCCCCGTGCGCAG
+CCGGTTCCGCGTCGTGTTCCAGGGGGCCTTCGACGATGTAACGCTTGAGCAGCCAGCACCAGATGACCGC
+AAGTACCGCGTAGACCAAGGTGAACATCAGCAAAGACGTGGCGACCACGGTGGCGGAGTGATCCGAGACG
+CCTGCTTTGACGGTGAGTCGAACCAGCTGATCACCGGTCGGGTTAGGGACGACGACCCAGGGCTGGCGCC
+CCATCTCGGTGAACACCCATCCGGCGCTGTTGGCCAGGAACGGGGCGGGCATGGTTAGCAGCGCCAGCCA
+GGAGAACCAGCGTTGATTGGGGATCTGGCCGCCACGGGTGAGCCAGAGCGCAATCAGTGCGAACAGCACC
+GGGATCGCCATCAACCCGATCATCATGCGAAATGACCAGTAGGTGACGAAGAGGTTGGGCCGGTAGTCGT
+TTGGTCCGAAGCGCTGCTGGTATTCCTGCTGCAGATCGCGGATACCCTGCAACGTCACACCGCTGATCCG
+GCCCTCGGCGAGGAACGGCAACACATAGGGCACTTCGATGACACGGGTGAGGCTGTCGCAGTTGTTTTGC
+CGGCCGACCGTCAGGACAGAGAAGTTTGGATCTGTCTGGGTATCGCACAACGATTCGGCCGACGCCATCT
+TCATCGGCTGCTGCTGGAACATCAGCTTGCCTTGGTGGTCGCCGGTGAACAACAACCCGGCCGTGGCGGC
+CAACGCAACCCAACACCCCAGGATGGTCGCGGGACGATACATGGCTTGGGTATCTGAGTCGGCGTGCGTG
+GTGCTCGAACGGACCAGCCACCAGGCGCTCACCGCGGCGACGAAGGTCCCGGCGGTCAGCAGCGCACCGC
+TGACAGTGTGGGTAAACGCCGCCTGTGCGGTGTTGTTGGTCAGCAGCACGACGATGCTGCTCAACTCGGC
+ACGCCCGGTGGTCGGGTTGTAGTGCGCGCCGACCGGATGCTGCATGAAGGAGTTTGCCGCGATGATGAAG
+AACGCGGACACGTTGACCGCGATTGCGACGATCCAGATGCAGGCCAGATGCACCAGCCGGGGCAGCCTGT
+TCCAGCCGAAGATCCACAACCCGATGAAGGTGGATTCGAAGAAGAAGGCCGCCAGGCCCTCCATGGCCAG
+CGGGGCGCCGAAGACATCGCCGACGAATCGGGAGTACTCGCTCCAGTTCATGCCGAACTGAAATTCCTGC
+ACGATTCCGGTCGCCACGCCGATGGCAAAGTTGATCAGGAACAATTTGCCGAAGAATTTGGTGAGGCGAT
+ACCAGGCGGGGTTATCGGTGACGACCCACAGCGTTTGCATGACCGCGATCAGCGGGGCCAGGCCGATGGT
+CAGCGGTACGAAAATGAAGTGATAGACGGTGGTGATACCGAACTGCCACCGCGAAATGTCGACGACATTC
+ATCTGTCATCTCCGGAGATACTACGGGGCCGACTGATTTGGCTACGACGAAGTGTAGTAGGCACGAGTGG
+GCCCGCGCTACTGGCAATCGTGGGTGCACCGCGATTCTGCGGTCAGCCGAGCGTCTGCGAAGCCTTGCGG
+ATGGCGAACGACGACGCGATCTCGCATGCGCCGATCACCACGAGCCAGATGCCGACGACCAACGCCAGTA
+TCCAGATGGACTCGAACGGCGATGCCATCACCACAATGCCGGCGATGAGGCTGATCACGCCGACGAAGAT
+GGACCATCCCCGTCCCGGCAGCATCGGATCACTAATCGCCGAAACCGTGGTGGCGACGCCGCGGAAGATG
+AACCCGATGCCGATCCAGATGGCCAGCAACAGAACCGCGTCACCGAAATGGCGAAAGGCCAGCACAGCCA
+GGATGAGTGAGGCGGCACCGCTGATGAACAACAGGATCCGGCCGCCCGCCGAAACATGCAGGCTGAACGC
+GAACGCAACCTGAGCGACACCGGTAATCAGGAGGTAGACACCGAACGCCATGGCAGCAACGAGAATGGAT
+ATTCCTGGCCAGGCCAGCACCAGGACGCCCAGGATCAGCGACAGAATTCCCGATGCCAGAGTGGACTTCC
+AGAGATGCGGCAACAACCTTGGGAGAGGGCTCACGACAGGGCTTGGTTCCATGGGCGCAGTGTGACACAT
+GTAGCGGCCCCGGGATAGCGCTTGGCGGTCAGACCCCTGCCGTGCGGGGTTCGGCCCCGCGCACCTCGCC
+GGGATCTGCGGCTACCTTGCGGCCGATGAGGTACCACGTGCGCATTACGCCTTTCCCCTTGACGTTTATG
+TGGCCGCGCTCGCGCAACACGAAGTCGTCCTTGAGACGCTCGTAAACCTCGTCTGGCACCTGAATTTGCC
+CCACCGAATCGGTGGATTCCATCCGCGACGCGACATTGACCGCGTCGCCCCACACGTCGTAGAAGAACCG
+TCGAGAACCCACCACACCCGCCACCACCGGGCCGGTGGCCAGGCCCACCCGCAGCGGCACCGGGTTGCCG
+CGTGGATCCTTCAATTGCGCTGCGACATTGGTCATGTCGAGCGCAAAGTCCGCCAGTGCTTGCGTATGGT
+CAGGCCGGGGCCGCGGAACGCCGCTGACAACCATGTAGGAGTCCCCGCTGACCTTGATTTTCTCCAGCCC
+GTGCTGGTCGACCAGCTCGTCGAAAGCGCTGTAGAGGCGGTCCAGGAACCGGACCAGGTCCGCCGGCGCG
+GTGCTACTGGCGCGTTCGGTGAACCCGACGATGTCGGCGAACAGCACCGAGGCCTCGTCGTATTTATCGG
+CGATGATGTTTCGCTCGGGTTCTTTAAGCCGCTCGGCGATGCTGGCCGGCAACATGTTGGCCAGCAGTGC
+TTCGGAGCGGTCGTGCTCCGCCTCCATGACCGCCTCCGCGCGCGCAGTATCACGCAGCGCGAACCACACC
+GTTGCGACCGCTACCCCGCAGGCGGAGACGGTCGTGAGGACGAAACTTACCGACATGGCCCAGGGCGGCT
+GAAGCCCAGTATCGGGCGGGACCAGGAACTCCAGGGCAATCACCAGACCGGCGGCGACCGCCGCTAGGCC
+CACCGCTAACGCGGTGTGTTCGATGCCGACCAGCAACACCACCAACGCGGCGGCTACCAAGAAGAAGAAC
+TGGGCACCCGCGTCGGTGCCCACATCCCAGCCGATGGCGAAGATCGCCACATAGGCGGTGCCGATGAACG
+TAAGCGGTGCCACCAATCCCCCGAAGCGATGTAGCAGGGGCACGATCGCGAAAGTAACCGCGGTGAAGAC
+GTTGATCAGGGCGATGTACCAGCCCCCGGCCCCGGTCGCTAGTTGCATTAGCGCGAAGCTCCCGGTTACC
+ACGACAGCGAGCCAGGCGGTGATGGTAAGTACGCGCTGCCGCCGCGCGACGCTTTCGGCGTAGTGCTGCG
+TGGGAGCGCGGGCCTGAGTGCGCACGGCCGTGACACAGTCTGGGCGTCGTGTCGAGCCATCCGCTGCTAT
+CGGTGGGGCGCCGCATTTTCTTGCCGCCACGAACTAAAGCCTAATCGGTGAGTTAGCGTTTACCGACTCT
+GTCGGCGCTTTCCGAGTGCGTTCGCTTGGTGCCCTCGGTGGGATTCGAACCCACACTGGACGGGTTTTGA
+GTCCGTTTCCTCTGCCAGTTGGGATACGAGGGCTTGATCCGGTCTCCTACTCTAGAGGAGCCACGTCCCG
+ACTCACCGCCCCCCGAGGTTCCCGATCGCGCCCGCTCACGACACAATGTCCGTCATGACCGGCCCCACCA
+CCGACGCCGATGCCGCTGTCCCACGTCGGGTCTTGATCGCGGAAGATGAAGCGCTCATCCGCATGGACCT
+GGCCGAGATGTTGCGAGAGGAGGGATATGAAATTGTCGGCGAGGCCGGCGACGGCCAGGAAGCCGTCGAG
+CTGGCCGAGCTGCACAAGCCCGACCTGGTGATCATGGACGTGAAGATGCCGCGTCGGGACGGGATCGACG
+CCGCATCCGAAATCGCCAGCAAACGTATTGCCCCGATCGTGGTGCTGACCGCGTTCAGCCAGCGTGATCT
+GGTCGAACGTGCGCGTGATGCCGGGGCGATGGCATACCTGGTAAAGCCTTTCAGCATCAGCGACCTGATT
+CCAGCGATTGAATTGGCGGTCAGCCGGTTCAGGGAGATCACCGCGTTGGAAGGCGAGGTGGCGACGCTAT
+CTGAACGGTTGGAAACCCGCAAGCTGGTGGAACGAGCAAAAGGCCTGCTGCAGACCAAACATGGGATGAC
+CGAGCCGGACGCTTTCAAGTGGATTCAACGTGCCGCCATGGATCGGCGCACCACCATGAAGCGGGTGGCC
+GAAGTCGTGCTGGAAACCCTCGGAACACCCAAAGACACCTGAGGGCGAGCAGACGCAAAATCGCCCATTT
+CGTACCCGAAATGGGCGATTTTGCGTCTGCTCGCGGAACCTAGCGCGCGACGATCACCGACGAGCCGTGC
+CCGAACAGGCCCTGGTTGGCGGTGACGCCGACCTTGGCGTCCGCCACCTGCCGGCCGGTGGCCTGACCGC
+GCAGCTGCCAGGTCAGCTCGCAGACCTGCGCGATCGCCTGGGCGGGAATCGCCTCACCGAAACACGCCAG
+CCCGCCCGACGGGTTGACCGGGACCCTGCCGCCGAGGGTGGTCGCGCCGCTGCGCAGCAGCGCCTCGGCC
+TCACCCTTGGGGCAGAGCCCCAGGTGTTCGTACCAGTCGAGTTCCAACGCGGTGGACAGGTCGTAGACCT
+CGGCCAGGCTTAAGTCTTCTGGACCAATACCGGCCTCCGCGTAGGCAGCGTCGAGGATCTGATCCTTGAA
+CACCCGCTCCGGAGCCGGCACCGCGGCGGTGGAATCCGTTGCGATATCCGGCAATTCGGGCAAATGTTGC
+GGGTATTTCGGGGTAACGGTGCTGATCGCGCGCACCGACGGCACGCCCGCCACCGAGCCAAGGTGCTTCT
+CGGTGAAAGACTTGCTGGCCACGATGAGTGCGGCCGCACCGTCGGAGGTGGCGCAGATGTCAAGCAGCCG
+AAGCGGATCCGAGACCACCGGGCTAGCCAGCACGTCGTCGATCGAGTTCTCTTTGCGGTAGCGGGCGTTC
+GGGTTGTCTAGGCCGTGCCGGGAGTTCTTGACCTTCACTTGAGCGAAGTCCTCGACTGTGGCGCCGTACA
+GGTCCATGCGCCGGCGCGCCAGCAGCGCGAAGTACACCGTGTTCGTCGCCCCGATCAGATGGAAGCGCTG
+CCAGTCGGGGTCGCCCTTGCGCTCGCCGCCCACGGGCGCGAAAAAGCCCTTCGGTGTGGTGTCGGCGCCG
+ATCACCAGCGCCACGTCACAGAAACCGGCCAAGATCTGCGCGCGAGCACTCTGCAGCGCTTGGGAACCGC
+TGGCACACGCGGCGTAGCTGGAGCTGACCGGCACACCGGTCCAGCCGAGCTTCTGGGCGAACGTGGCACC
+GGCGACGAAGCCCGGATACCCGTTGCGGATGGTGTCCGCTCCGGCGACCAGCTGCACGTGCCGCCAGTCC
+ACGCCGGCGTCCCGCAACGCGGCGCGGGCGGCGACCACGCCATACTCGGTGAAGTCATTACCCCATTTCC
+CCCACGGGTGCATACCGGCACCCAGGATGTAAACGGGTTCCGGCGCGCTCATCCTCATCGGCGCCGCTCC
+TCAGCATCGCTGCGCTCTGCATCGTCGCCGGCGCGCGATGGGATCCGCCACGCGTAGACGATGCGCTGCA
+CACCGTCGTCGTCGGCGAACAGCGGCATGGTCGTCAGCTCCATCTCCATGCCGACCTTCAGATCGGCGGC
+CAGCGTGCCATCGACCACTTTGCCCAGCACGATCAGTCCCTCGTCGGCCAGTTCCACCGCGGCCACGGCA
+AACGGCTCAAAGGGGTCGGGTGCCGGGTACGGCGGTGGCGGGGCGTACCGGTTTTCGGTGTAGCTCCAAA
+GCTTTCCGCGGGTCGACAGTCCGACCGACTCTAGTGTGTCGCTGCCGCAAGCCGGATTCGGACAATTGTC
+CGCCCGGGGTGGGAAGACGTACGTGCCGCACTGGGGACACTTGCCGCCGAGCAGATGCGGGTTGCCGGCC
+TTATCGGTGGTGAACCATCCATCGATTGCCGGTTCTTCACGGGTGACCTCTGGCACCGGTCCAGCCTACC
+GAGCCCGGGCGTAAAACTGAAACGTGTTGCAGTTCTGCTGGCACCTGCGCCCGCATTCCACGTCAGCGTC
+GGTGCATAAAGTGTGAGCCGTGGTGACTACTGCCAGTGCCCCCAGCGAGGATCGAGCCAAGCCGACGCTG
+ATGTTGCTGGATGGCAATTCGCTGGCGTTTCGGGCGTTCTACGCACTGCCCGCGGAGAACTTCAAGACCC
+GCGGCGGGCTGACCACCAACGCCGTCTACGGCTTCACCGCCATGCTGATCAACCTGCTGCGCGATGAAGC
+CCCGACGCACATCGCGGCGGCTTTCGACGTGTCCCGGCAGACCTTCCGCTTGCAACGCTACCCGGAGTAC
+AAGGCCAACCGATCGTCGACCCCCGACGAGTTCGCTGGCCAGATCGACATCACCAAAGAAGTGCTGGGCG
+CACTCGGCATCACCGTGCTCTCCGAGCCGGGGTTCGAGGCCGACGACCTCATCGCCACGCTGGCCACCCA
+GGCCGAGAACGAGGGCTACCGGGTGCTGGTGGTCACCGGGGATCGTGACGCACTGCAACTGGTCAGTGAC
+GATGTGACGGTGCTCTACCCCCGCAAGGGCGTCAGCGAACTTACGCGCTTCACACCGGAGGCCGTCGTCG
+AAAAGTACGGGCTCACCCCTAGGCAGTACCCGGACTTCGCCGCGCTGCGCGGCGACCCCAGCGATAACCT
+GCCCGGCATACCCGGGGTGGGGGAGAAGACCGCCGCCAAATGGATCGCCGAGTACGGCTCGCTGCGGTCA
+CTGGTGGACAACGTTGACGCCGTGCGCGGCAAGGTGGGCGATGCGCTGCGGGCGAACCTGGCCAGCGTGG
+TGCGCAACCGTGAGCTCACCGACCTGGTTCGCGACGTGCCGCTGGCCCAGACCCCGGACACGCTGCGGCT
+GCAGCCCTGGGATCGCGACCACATTCACCGGCTCTTCGACGACCTGGAGTTTCGGGTGTTGCGCGACCGG
+TTGTTCGACACGTTGGCCGCGGCCGGGGGACCCGAGGTCGACGAGGGGTTCGACGTGCGCGGCGGCGCGT
+TGGCGCCCGGCACGGTTAGGCAATGGTTGGCCGAGCACGCCGGCGACGGGCGCCGAGCGGGCCTGACGGT
+GGTGGGTACCCATCTGCCGCACGGTGGGGACGCTACCGCTATGGCCGTCGCCGCCGCCGACGGCGAAGGC
+GCTTACCTCGATACCGCGACGCTGACGCCCGACGACGACGCCGCGTTGGCGGCCTGGCTAGCGGATCCAG
+CTAAACCCAAAGCCTTGCATGAGGCAAAGGCGGCCGTTCATGACCTGGCGGGTCGTGGTTGGACCTTGGA
+GGGCGTCACCTCCGACACCGCACTGGCGGCCTACCTGGTGCGGCCGGGGCAGCGCAGCTTCACCCTCGAC
+GACCTCTCGCTGCGCTATCTGCGTCGCGAGCTGCGTGCGGAAACACCGCAGCAGCAACAACTTTCACTGC
+TCGATGACGACGATACGGACGCCGAGACCATTCAAACGACGATCCTGCGGGCGCGGGCAGTCATCGACCT
+GGCCGACGCGCTGGACGCCGAGTTAGCGCGTATCGACTCCACCGCGCTGCTGGGGGAGATGGAGCTGCCG
+GTCCAGCGGGTGCTGGCGAAGATGGAAAGTGCCGGTATCGCCGTCGACCTGCCCATGTTGACCGAGCTGC
+AAAGCCAGTTTGGCGACCAGATCCGCGACGCCGCCGAGGCCGCCTACGGCGTGATCGGCAAGCAAATCAA
+CCTGGGCTCACCCAAGCAGCTGCAGGTCGTGCTGTTCGACGAACTGGGCATGCCGAAGACCAAACGCACC
+AAGACCGGCTACACCACGGATGCCGACGCGCTGCAGTCGTTGTTCGACAAGACCGGGCATCCGTTTCTGC
+AACATCTGCTCGCCCACCGCGACGTCACCCGGCTCAAGGTCACCGTCGACGGGTTGCTCCAAGCGGTGGC
+CGCCGACGGCCGCATCCACACCACGTTCAACCAGACGATCGCCGCGACCGGCCGGCTCTCCTCGACCGAA
+CCCAACCTGCAGAACATCCCGATCCGCACCGACGCGGGCCGGCGGATCCGGGACGCGTTCGTGGTCGGGG
+ACGGCTACGCCGAGTTGATGACGGCCGACTACAGCCAGATCGAGATGCGGATCATGGCGCACCTGTCCGG
+GGACGAGGGCCTCATCGAGGCGTTCAACACCGGGGAGGACCTGCATTCGTTCGTCGCGTCCCGGGCGTTC
+GGCGTGCCCATCGACGAGGTCACCGGCGAGCTGCGGCGCCGGGTCAAGGCGATGTCCTACGGGCTGGCTT
+ACGGGTTGAGCGCCTACGGCCTGTCGCAGCAGTTGAAAATCTCCACCGAGGAAGCCAACGAGCAGATGGA
+CGCGTATTTCGCCCGATTCGGCGGGGTGCGCGACTACCTGCGCGCCGTAGTCGAGCGGGCCCGCAAGGAC
+GGCTACACCTCGACGGTGCTGGGCCGTCGCCGCTACCTGCCCGAGCTGGACAGCAGCAACCGTCAAGTGC
+GGGAGGCCGCCGAGCGGGCGGCGCTGAACGCGCCGATCCAGGGCAGCGCGGCCGACATCATCAAGGTGGC
+CATGATCCAGGTCGACAAGGCGCTCAACGAGGCACAGCTGGCGTCGCGCATGCTGCTGCAGGTCCACGAC
+GAGCTGCTGTTCGAAATCGCCCCCGGTGAACGCGAGCGGGTCGAGGCCCTGGTGCGCGACAAGATGGGCG
+GCGCTTACCCGCTCGACGTCCCGCTGGAGGTGTCGGTGGGCTACGGCCGCAGCTGGGACGCGGCGGCGCA
+CTGAGTGCCGAGCGTGCATCTGGGGCGGGAATTCGGCGATTTTTCCGCCCTGAGTTCACGCTCGGCGCAA
+TCGGGACCGAGTTTGTCCAGCGTGTACCCGTCGAGTAGCCTCGTCAGGTACCAATCTGTCCCTACGACCC
+AACCCTGTCCGGAGCAACCCAACAATATGCCGAGTCCCACCGTCACCTCGCCGCAAGTAGCCGTCAACGA
+CATAGGCTCTAGCGAGGACTTTCTCGCCGCAATAGACAAAACGATCAAGTACTTCAACGATGGCGACATC
+GTCGAAGGCACCATCGTCAAAGTGGACCGGGACGAGGTGCTCCTCGACATCGGCTACAAGACCGAAGGCG
+TGATCCCCGCCCGCGAACTGTCCATCAAGCACGACGTCGACCCCAACGAGGTCGTTTCCGTCGGTGACGA
+GGTCGAAGCCCTGGTGCTCACCAAGGAGGACAAAGAGGGCCGGCTCATCCTCTCCAAGAAACGCGCGCAG
+TACGAGCGTGCCTGGGGCACCATCGAGGCGCTCAAGGAGAAGGACGAGGCCGTCAAGGGCACGGTCATCG
+AGGTCGTCAAGGGTGGCCTGATCCTCGACATCGGGCTGCGCGGTTTCCTGCCCGCCTCGCTGGTGGAGAT
+GCGCCGGGTGCGCGACCTGCAGCCCTACATCGGCAAGGAGATCGAGGCCAAGATCATCGAGCTGGACAAG
+AACCGCAACAACGTGGTGCTGTCCCGTCGCGCCTGGCTGGAGCAGACCCAGTCCGAGGTGCGCAGCGAGT
+TCCTGAATAACTTGCAAAAAGGCACCATCCGAAAGGGTGTCGTGTCCTCGATCGTCAACTTCGGCGCGTT
+CGTCGATCTCGGCGGTGTGGACGGTCTGGTGCATGTCTCCGAGCTATCGTGGAAGCACATCGACCACCCG
+TCCGAGGTGGTCCAGGTTGGTGACGAGGTCACCGTCGAGGTGCTCGACGTCGACATGGACCGTGAGCGGG
+TTTCGTTGTCACTCAAGGCGACTCAGGAAGACCCGTGGCGGCACTTCGCCCGCACTCACGCGATCGGGCA
+GATCGTGCCGGGCAAGGTCACCAAGTTGGTTCCGTTCGGTGCATTCGTCCGCGTCGAGGAGGGTATCGAG
+GGCCTGGTGCACATCTCCGAGCTGGCCGAGCGTCACGTCGAGGTGCCCGATCAGGTGGTTGCCGTCGGCG
+ACGACGCGATGGTCAAGGTCATCGACATCGACCTGGAGCGCCGTCGGATCTCGTTGTCGCTCAAGCAAGC
+CAATGAGGACTACACCGAGGAGTTCGACCCGGCGAAGTACGGCATGGCCGACAGTTACGACGAGCAGGGC
+AACTACATCTTCCCCGAGGGCTTCGATGCCGAAACCAACGAATGGCTTGAGGGATTCGAAAAGCAGCGCG
+CCGAATGGGAAGCTCGGTACGCCGAGGCCGAGCGCCGGCACAAGATGCACACCGCGCAGATGGAGAAGTT
+CGCCGCCGCCGAGACGGCTGGACGCGGCGCGGACGATCAGTCGTCGGCCAGTAGCGCACCGTCGGAAAAG
+ACCGCGGGTGGATCACTGGCCAGCGACGCCCAGCTGGCGGCCCTGCGGGAAAAACTCGCCGGCAGCGCTT
+GATCTTGCAGCTGATCGCGTTCACGTAATGCTGCGCATCGGGCTGACCGGCGGCATTGGCGCCGGGAAGT
+CGTTGCTGTCCACGACGTTCTCGCAATGCGGCGGAATCGTTGTCGACGGCGATGTGTTGGCGCGTGAAGT
+GGTCCAGCCGGGCACCGAGGGGCTGGCCTCGCTGGTCGACGCGTTCGGTCGCGACATCCTGCTTGCAGAC
+GGAGCGCTGGACCGGCAGGCGTTGGCGGCCAAGGCGTTTCGAGATGACGAGTCGCGCGGTGTGCTCAACG
+GAATCGTGCACCCGCTGGTCGCCCGGCGCCGATCCGAGATCATCGCGGCGGTTTCGGGGGACGCGGTTGT
+GGTCGAAGATATTCCACTGCTGGTGGAATCCGGGATGGCGCCATTGTTTCCGCTGGTGGTGGTGGTGCAC
+GCCGACGTCGAGCTACGGGTGCGACGGCTGGTCGAGCAACGCGGCATGGCCGAAGCCGACGCCCGGGCTA
+GGATCGCTGCGCAGGCCAGCGACCAGCAGCGTCGTGCCGTCGCCGACGTCTGGCTGGACAACTCGGGCAG
+CCCAGAGGATTTGGTGCGGCGGGCCCGCGACGTCTGGAACACGCGCGTCCAGCCCTTCGCGCACAACCTG
+GCCCAACGTCAGATTGCGCGCGCGCCGGCTAGGTTGGTGCCGGCGGATCCAAGCTGGCCGGATCAGGCGC
+GGCGCATCGTCAACCGGCTAAAGATCGCGTGCGGGCATAAGGCCTTGCGAGTTGACCACATTGGGTCAAC
+CGCCGTGTCGGGCTTCCCCGATTTTCTAGCCAAGGATGTCATCGACATCCAGGTCACCGTCGAATCACTT
+GACGTGGCCGACGAGCTGGCCGAGCCCTTGCTGGCCGCCGGCTACCCACGCCTCGAGCACATCACCCAGG
+ACACCGAAAAGACCGACGCTCGCAGCACCGTCGGCCGCTACGACCACACCGACAGTGCCGCTCTGTGGCA
+CAAGCGCGTGCACGCCTCGGCGGATCCCGGTCGGCCGACCAACGTGCACCTGCGGGTGCACGGCTGGCCC
+AACCAACAGTTCGCCCTGCTGTTCGTCGACTGGCTGGCGGCCAATCCCGGCGCGAGAGAAGACTATTTGA
+CGGTCAAGTGTGACGCCGACAGGCGCGCCGACGGTGAGCTCGCGCGCTACGTCACCGCCAAGGAGCCGTG
+GTTCCTGGATGCCTACCAGCGGGCATGGGAGTGGGCGGATGCGGTGCACTGGCGTCCCTGAACGAGGGCC
+TGCCGCACTGGGCGATGACGCCATCGATCGAGCAGGCCGCCCAGCTGTCATCCCCGGCCAGCCTCATCTG
+AGGCTTCCAGCTCGGGGGCGCCGGCGCCCGGGGCGGTGGGCGCTTCTGCTACCCGAGCCGGCACGCGCGC
+TTCATGAGCCGCTGCGCCAGGTCAGCTCCATCCCCTTGGTGGCCAGCCAGCGGGTGAGGTCATAGCCGTT
+GCGGGCCAGGCCCTCGACGGCGTCGACTGCGTGCCGCACCGCCTGCTCGGCGACCGTCGGGGTCAACAGG
+CCGTGGCGGACGGCGTCGAGTAGTTCGTCGACGTCGGCGAGCTCGGCCCCGCCGCCGGTGCGGACTTCGA
+TGTCGAGGTAGTGGTCTTCGGAACGCCATACGGAAGGGCCCGGTGTGTATTCGCCGACGTCCAGATAGTA
+GTCGTGATCGCGTTTGTGGCTGGGATTGAAGTGAAAGACAGTGGCGCGTAGGCCCAACGACGGCAACAGC
+CACGACTCGAGGTAGTGGAATTGGGCACGGCCCGGGGTGGGCCGGGCCAGGTAGAGCCCCCACGGATGCA
+CCGTGTACTCATCGACCGCCCGCACTATGCCCTTCGGATCGGTATTGGTGTTGGCGATCAGGTCGAACGT
+CTCGTGCTTGGGTGGGTGAATGGCTCACCCTATCTGGTCGCACGAGGCGTGCCGGTACATCGACACGCCG
+GTACTGGTGGCATTCTGCGCACGCTCGCCGCACGGTGTGTCCGCGGGTGGCTCTAGGCTGGTTGGCGTGG
+CTTTCGCTACCGAGCATCCGGTGGTCGCGCATTCGGAGTATCGCGCGGTCGAGGAGATTGTGCGCGCCGG
+CGGTCACTTCGAGGTGGTCAGTCCGCATGCTCCGGCCGGCGACCAGCCGGCCGCAATCGACGAGCTGGAG
+CGGCGGATCAACGCGGGGGAGCGTGACGTGGTGTTGCTCGGCGCCACCGGCACCGGGAAGTCGGCGACCA
+CCGCGTGGCTGATCGAACGCCTGCAGCGGCCCACCCTGGTGATGGCGCCCAACAAGACGTTGGCCGCCCA
+GCTGGCGAACGAACTGCGAGAGATGTTGCCGCACAACGCCGTCGAGTACTTCGTCTCGTACTACGACTAC
+TACCAGCCGGAGGCGTATATCGCGCAGACCGACACTTATATCGAAAAGGATAGCTCCATCAACGACGACG
+TGGAGCGGCTGCGGCACTCCGCGACCTCGGCGCTGCTGTCGCGTCGTGACGTGGTGGTGGTGGCTTCGGT
+GTCCTGCATCTACGGCCTGGGCACACCGCAGTCCTACCTGGACCGCTCCGTCGAGCTGAAGGTGGGCGAG
+GAAGTGCCGCGCGATGGGCTGCTGCGGCTGCTGGTCGACGTGCAATACACCCGAAACGACATGTCCTTTA
+CTCGCGGCTCGTTTCGGGTGCGCGGCGACACCGTCGAGATCATCCCCTCCTACGAAGAGCTGGCGGTTCG
+CATCGAGTTCTTCGGCGACGAGATCGAGGCGCTGTACTATCTGCACCCGCTGACCGGCGAGGTTATCCGC
+CAGGTCGACTCGCTGCGGATCTTTCCCGCTACCCATTACGTCGCCGGTCCGGAGCGGATGGCGCATGCCG
+TCTCGGCCATCGAGGAAGAACTCGCCGAGCGACTCGCCGAGCTTGAGAGCCAGGGCAAGCTGCTGGAGGC
+GCAGCGGCTGCGGATGCGCACCAACTACGACATCGAAATGATGCGGCAGGTCGGGTTCTGCTCGGGCATC
+GAGAACTACTCCCGCCACATCGACGGTAGGGGGCCCGGCACGCCGCCCGCGACCCTGCTCGACTATTTCC
+CCGAGGATTTCCTGCTCGTTATCGACGAGTCACATGTCACCGTGCCGCAGATCGGCGGCATGTACGAGGG
+CGACATCTCCCGCAAGCGCAACCTGGTGGAGTACGGTTTCCGGCTGCCGTCGGCGTGCGACAACCGTCCG
+CTGACCTGGGAGGAGTTCGCTGACCGGATCGGGCAGACGGTGTATCTGTCTGCCACCCCGGGGCCCTACG
+AGCTCAGCCAGACCGGCGGCGAGTTCGTCGAGCAGGTGATCCGGCCGACCGGTCTGGTGGACCCGAAAGT
+GGTAGTCAAGCCGACCAAAGGGCAGATCGACGACCTGATCGGCGAGATCCGCACACGGGCAGACGCCGAC
+CAGCGGGTGCTGGTGACGACGCTGACCAAGAAGATGGCCGAAGACCTCACCGACTACCTGCTGGAGATGG
+GCATTCGGGTGCGCTACCTGCATTCGGAGGTCGACACGTTGCGCCGGGTCGAGTTGTTGCGCCAGCTGCG
+TCTGGGTGACTACGACGTGCTGGTCGGCATCAACCTGCTCCGCGAGGGCCTAGACCTGCCCGAGGTGTCG
+CTGGTGGCGATCCTCGACGCCGACAAAGAAGGATTCCTGCGGTCAAGCCGCAGCCTGATCCAGACCATCG
+GACGCGCCGCTCGCAACGTGTCCGGCGAGGTGCACATGTACGCCGACAAAATCACCGACTCGATGAGGGA
+AGCCATCGACGAGACCGAACGCCGGCGGGCCAAGCAGATCGCCTACAACGAGGCCAACGGAATCGACCCA
+CAGCCGCTGCGCAAAAAGATCGCCGACATCCTCGATCAGGTCTATCGGGAGGCCGACGACACCGCCGTCG
+TCGAGGTCGGCGGATCCGGGCGCAACGCATCCCGCGGCCGGCGGGCTCAGGGTGAGCCCGGCCGGGCGGT
+CAGCGCCGGCGTGTTCGAGGGCCGCGACACCTCCGCCATGCCGCGCGCTGAGCTGGCCGACCTAATCAAA
+GACCTCACCGCACAGATGATGGCGGCCGCGCGCGACCTGCAGTTCGAGCTGGCGGCCCGGTTCCGCGACG
+AGATCGCCGACCTCAAGCGGGAGCTGCGGGGGATGGACGCGGCCGGCCTGAAGTGACCGAAACAGCGAGC
+GAGACCGGCAGCTGGCGTGAGCTACTGAGCAGGTATCTGGGCACCTCCATAGTGCTGGCCGGTGGCGTCG
+CGCTGTACGCCACCAACGAGTTTCTGACAATCAGCCTGCTGCCGAGCACAATCGCCGACATCGGGGGTAG
+CCGGCTGTACGCCTGGGTGACAACCCTGTATCTGGTCGGGTCGGTGGTGGCGGCGACCACCGTCAATACG
+ATGTTGCTGCGCGTCGGGGCGCGCTCGTCGTATCTGATGGGGTTGGCCGTCTTCGGTCTGGCCAGCCTGG
+TATGTGCGGCGGCGCCGAGCATGCAGATTCTGGTGGCCGGGCGTACCTTGCAAGGAATAGCCGGTGGGCT
+GCTGGCCGGCCTAGGCTACGCGCTGATCAACTCGACCTTGCCCAAGTCGCTGTGGACCCGTGGCTCAGCA
+CTGGTGTCGGCGATGTGGGGGGTCGCGACGCTGATCGGACCGGCGACCGGAGGCCTTTTCGCGCAGCTCG
+GGCTGTGGCGATGGGCGTTCGGCGTGATGACGTTGCTGACCGCGTTGATGGCCATGTTGGTGCCGGTCGC
+GCTCGGTGCCGGGCGGGTCGGCCCGGGCGGCGAGACGCCGGTGGGCAGCACACACAAGGTGCCGGTGTGG
+TCGCTATTGCTGATGGGGGCCGCCGCACTGGCGATCAGCGTCGCCGCGCTTCCGAACTACCTCGTCCAGA
+CGGCCGGGCTGCTAGCCGCCGCCGCGCTGCTGGTTGCGGTGTTTGTGGTAGTCGACTGGCGGATACACGC
+AGCGGTGTTGCCGCCCAGCGTATTTGGCTCCGGACCGTTGAAATGGATTTACCTGACCATGTCGGTGCAG
+ATGATTGCGGCAATGGTCGATACCTACGTGCCGCTGTTCGGTCAGCGACTGGGACACCTGACCCCGGTGG
+CAGCCGGGTTCTTGGGTGCCGCGCTGGCGGTGGGCTGGACGGTCGGTGAGGTCGCCAGCGCCTCGTTGAA
+CAGTGCACGAGTTATCGGGCATGTCGTGGCAGCCGCACCGCTGGTGATGGCGTCGGGGTTGGCGCTAGGC
+GCCGTCACCCAGCGCGCCGATGCGCCGGTGGGGATCATCGCGCTGTGGGCGCTGGCGCTGCTGATCATCG
+GGACCGGCATCGGGATCGCCTGGCCGCATCTAACGGTGCGCGCTATGGATTCTGTCGCCGACCCGGCCGA
+GAGCAGCGCGGCGGCCGCGGCGATCAATGTCGTACAGCTGATCTCCGGTGCTTTCGGCGCCGGGCTGGCC
+GGTGTGGTGGTCAACACTGCCAAGGGCGGCGAAGTGGCGGCGGCTCGTGGGCTATACATGGCATTTACGG
+TGCTGGCCGCCGCTGGTGTCATCGCCTCCTACCAGGCCACGCACCGCGACCGGCGCTTACCGCGTTGACT
+TGACCACCTGCGAGTAGTGGAACTGCCAGCGCTCGACGATGCGGAAGCCGAGGTAGCTCGGGAACCGGTA
+TACGGGCGTGCGCCCGAAGCCTGTTCCCGGTGACAACATTTCGCCGACCTGATGATCGGGCAACGACTTG
+TCACGATTGGCTATCGTCCACAGCGTGGGGCACTTGTCGATCTTGGCCGTCGTAAGCCACACAGCGACAT
+GGCCATCCCACAAAGTGCCGACCTTGGGGCCGTAGGTGCCGCGCTCGACGTCAATCAGCGACCGGAACGC
+CGCCGGCCGGGTGGCCAGCAGGGCGCGGATGGGCCCGGGTCGCCAACCCGCGGTGTTGTCCACCAGCAGG
+CAATCCCCGGGCTTGGCATGGGCGCTGATGACATCTGCCACCTGGCTGTAATCCCAGCCCTCTTTCGCGT
+ACGGCCCCCGCTGTGTGAAGAAGTAGTTCGGAAACGCTGCGGCGGCAAGGAGAAACACGACCCCGGCGAT
+GAGCCACGGCTTGCGGGCGATGGTGACGACGCAAACCGCCAGGATGACGGCCGCGGCGGGGGCGGTGAGG
+ATCAGGTAGCGCGGGTAGTAGATCGGTTCGACGGTCGCCGAGTAGATGAGGACGACGGCGGTGGGCACGA
+CGATCCAGGCTGCGCTGACGAGCACGAGCCGGTGGGTATCGCCACCGGGTCCACGAGCTCCGGCCAGATG
+CGCCGCGATGCCGGCAGCGACGATGAGGCCCGCGAGGATGGCGAACGGAACACTGTGATCGAAATACTGG
+CGGTGTATGACGTCGAGAATGATGTTTCTGTTCAACCCTGCGATCCACCCGACCTGCCAAACCTGGCCGT
+GGGCGAACAGTATGAACGGTGTCATGGCCCCGAGCGCGGCTGCCGTGACGACCGTCCACCAGATCACGGG
+AGATTTGCGTGATTTCCCGGACGCCAGCAGCGGCACCATCGTCGCATAGGCCGGTACCAACAGGGCCAGG
+TTGATACTGACCAAGATCGACAGCATCAAAACCAGCGCGTAGAGCAGCCACCGCCGCTGGGTGTTGCACC
+GCACCGCGGCCACGAGTAATACGGTCAGCCAGACGGCGGCTGCTACCGACAGCGCGGAGGAGCGTGCTTC
+GATTCCGGCCCACGTCACCCTGGGCAGAATCGCGAACACGGCTCCCGCACACACCGCCGTGGTGCGTCCC
+GAAAACTGTTTGGCAAAAACCACCACGCCGGCGGCGGCCGCTCCAATGGCCAGGCAGCTGGGAAGCCGCG
+ACCATAATTCGGTGGGCGGAAATATGGCGAACCAGCCATGCATCAACAGGTAGTACAGGCCGTGCACGGC
+GTCGATATGGCCCAGCAGACTCCATAGCTCTGGCAATGTCCGGCTGGCTGAAGCCGAGATCGTTGCCCCC
+TCGTCGAACCACAACGATGGCCTGCTTGCCCAGGCGCCGCTGATGACCGCGGCCAGCACTGCAATCGCCA
+GCGGGTCGAGCAGCCGGCCGCGCATCCGCGCCACCAACTCGTCGACGTGTGCTGCCGCGGGCTGCTCCAG
+AGTGGAGGCGGACATGATGCGGGTCACCTTAGGGTCCGCGCGATGATCCTGGTCACCGGCGGTTCGGCGA
+CTGGGCAGCCCGGCGTGCGGCGGTGCGCCGGGACGACTCGCATGCATTTCCCAAAAAGCCTTGCACAGCA
+ACATTTTCCGCGATCAGCGTGCGTATTGAATCGTCGTGTCATCGCCACCATTGTCGGCTGGTTCACCGCG
+ATCGGGCAAATGAGGGTTGCGCCACGCCGTTGCGGTGTGATTAATCTGACCTATCTATATCCGGCAACGC
+GATACTGTCTGGGGTTGGCGTAGCAACCGACACCTGGGAGGGTAAATGAGCGCCTATAAGACCGTGGTGG
+TAGGAACCGACGGTTCGGACTCGTCGATGCGAGCGGTAGATCGCGCTGCCCAGATCGCCGGCGCAGACGC
+CAAGTTGATCATCGCCTCGGCATACCTACCTCAGCACGAGGACGCTCGCGCCGCCGACATTCTGAAGGAC
+GAAAGCTACAAGGTGACGGGCACCGCCCCGATCTACGAGATCTTGCACGACGCCAAGGAACGAGCGCACA
+ACGCCGGTGCGAAAAACGTCGAGGAACGGCCGATCGTCGGCGCCCCGGTCGACGCGTTGGTGAACCTGGC
+CGATGAGGAGAAGGCGGACCTGCTGGTCGTCGGCAATGTCGGTCTGAGCACGATCGCGGGTCGGCTGCTC
+GGATCGGTACCGGCCAATGTGTCACGCCGGGCCAAGGTCGACGTGCTGATCGTGCACACCACCTAGCGGC
+CGTTACCAGCCGCGCGCACGCCATTCGCTGAGGCTGGGGCGTTCGGCACCCAGCTCCGTGTCGTCACCGT
+GGCCGGGGTAGATGACGGTGGAGTCGGCGTACACGTCGAAAACCCGGGTGGTGACGTCGTCGAGCAGTTG
+GGTGAAGTCGGCAGGTTGCCAGGTTTTGCCGACACCGCCGGGGAACAAGCAGTCGCCGGTGAAGAGCTGT
+GTGACGCCTCCGGTCACCGGCCCGCCGAGGGCCAGCGCGATCGATCCGGGTGTGTGTCCGCGCAAGTGGA
+TGACGTCGAATGTCAGCTCGCCGATGCGCACGCTGTCGCCGTGGGTGAGCAACCGGTCCGGTTTGACCGG
+CAGCGGGTCGGCGTCGATCGGATGGGCCGCGGTCGGCGCCCCGGTGGCCGCGGCCACCGCTTGCAGCGCC
+TGCCAGTGGTCGAAGTGCTGGTGACTGGTAACGATCAGGGCCAGCTTCGGCGCGTACCGCCGGACCAGGT
+CGATGAGGACCTCCGCGTCATTGGCGGCGTCGATCAGCAGGGTTTCTCCGGTCGCTGAACACGTCACCAG
+GTAGGCGTTGTTGTCCATCGGGCCCACCGATGCCTTGAGGATCGTGGCGCCGGGCAGGAAGCGACGCGCC
+GCCTTGCCGCGTTCGACGTGTCCGGTGTAATTGTCGTCGACTGTTGTCATATGCGCCACTGCTCCTATGC
+CGGCTGCGCCGGCATCATCGTCGTTGGCGCGGGTCATATGCGCCGACGTTACGACGTTACCGGTCCCCTG
+ATGGTTGTCGGTACGGGCACATAGCATGGGATACGGCCTTTGGCCGGCGAGATGAGTTTCAGTGAAAGGG
+ACAGCGTGGCTGACCGCCTGATCGTCAAGGGTGCGCGCGAACACAATCTGCGCAGCGTCGACCTCGACCT
+GCCCCGCGACGCGCTGATCGTCTTCACCGGGTTATCCGGATCGGGCAAGTCCTCGCTCGCGTTCGACACC
+ATCTTCGCCGAGGGGCAGCGGCGTTACGTGGAGTCGCTGTCGGCCTACGCCCGCCAATTTCTCGGGCAGA
+TGGACAAGCCGGACGTCGACTTCATCGAGGGGCTGTCTCCGGCGGTGTCCATCGACCAGAAGTCGACCAA
+CCGCAACCCACGATCGACGGTCGGGACCATCACCGAGGTGTACGACTACCTGCGGCTGTTGTATGCGCGC
+GCGGGCACGCCGCACTGCCCGACCTGCGGGGAGCGAGTCGCGCGCCAAACCCCGCAACAAATCGTCGATC
+AGGTGCTGGCCATGCCGGAGGGCACTCGGTTTCTGGTGCTGGCCCCGGTGGTGCGTACCCGCAAGGGCGA
+GTTCGCCGATCTGTTCGATAAGCTCAACGCCCAGGGCTACAGCCGGGTGCGGGTCGACGGTGTGGTGCAT
+CCGCTGACCGATCCGCCGAAGCTGAAAAAGCAGGAAAAGCACGACATCGAGGTGGTGGTGGACCGTCTCA
+CCGTCAAGGCCGCCGCCAAGCGGCGGCTCACCGATTCGGTGGAAACCGCGCTGAATTTGGCCGACGGGAT
+CGTGGTGCTCGAATTCGTCGATCATGAACTGGGTGCACCGCATCGCGAGCAGCGGTTCTCCGAGAAGCTG
+GCCTGCCCCAACGGGCACGCGCTGGCCGTCGACGACCTGGAGCCGCGGTCGTTCTCGTTCAACTCGCCCT
+ACGGCGCCTGCCCCGAATGCAGTGGTCTGGGCATCCGCAAGGAGGTCGACCCGGAGCTGGTGGTGCCCGA
+TCCGGATCGCACCCTGGCGCAGGGTGCGGTGGCGCCGTGGTCGAACGGCCACACCGCGGAGTACTTCACC
+CGGATGATGGCCGGCCTTGGCGAGGCGCTCGGGTTCGACGTCGACACGCCCTGGCGCAAGCTGCCGGCCA
+AGGCCCGCAAGGCGATTCTGGAAGGCGCCGACGAGCAGGTGCACGTGCGCTACCGCAACCGCTACGGACG
+CACCCGGTCGTATTACGCCGATTTCGAGGGTGTGCTGGCGTTCCTGCAACGCAAGATGTCCCAAACCGAG
+TCCGAGCAGATGAAGGAGCGCTACGAGGGTTTCATGCGGGACGTGCCCTGCCCGGTGTGTGCGGGCACCC
+GGCTCAAGCCCGAGATTCTGGCGGTGACGCTGGCTGGGGAGTCCAAGGGGGAGCACGGCGCCAAGTCCAT
+CGCCGAGGTGTGTGAGCTGTCGATCGCCGACTGCGCGGACTTCCTGAACGCGCTCACGCTGGGTCCGCGC
+GAGCAAGCGATCGCCGGGCAGGTGCTCAAGGAGATCCGGTCGCGGCTCGGGTTTCTGCTCGACGTCGGGC
+TGGAGTACCTGTCGCTGTCCCGGGCGGCGGCCACGCTGTCCGGCGGTGAGGCACAACGTATCCGGCTGGC
+CACCCAGATCGGCTCCGGCCTGGTGGGTGTGCTCTACGTGCTCGACGAGCCGTCCATCGGGCTGCACCAG
+CGCGACAACCGTCGTCTTATCGAAACCCTCACCCGGTTACGGGATTTGGGGAACACTTTGATCGTCGTCG
+AGCACGACGAGGACACCATCGAGCATGCGGACTGGATCGTCGACATCGGCCCGGGGGCCGGTGAGCACGG
+TGGCCGCATCGTGCACAGCGGGCCCTACGATGAACTGCTACGCAACAAGGATTCGATCACCGGCGCCTAC
+CTGTCCGGCCGGGAAAGCATTGAGATACCGGCGATTCGGCGTTCCGTCGACCCCCGTCGTCAACTCACCG
+TCGTCGGCGCCCGCGAGCACAACTTGCGCGGGATCGATGTGTCTTTCCCGCTGGGTGTGCTGACCTCGGT
+GACCGGTGTCTCGGGTTCGGGCAAGTCGACGTTGGTCAACGACATCCTGGCCGCGGTGCTGGCCAACCGC
+CTCAACGGCGCCCGGCAGGTCCCCGGCCGGCACACCCGGGTCACCGGGCTGGACTATCTGGACAAGCTGG
+TGCGGGTGGACCAATCGCCGATCGGGCGCACACCGCGATCCAACCCGGCCACCTACACCGGTGTGTTCGA
+CAAGATCCGCACCCTGTTCGCCGCCACCACCGAGGCCAAGGTCCGCGGCTATCAACCCGGACGATTCTCG
+TTCAACGTCAAGGGCGGTCGCTGCGAGGCCTGCACCGGCGACGGCACCATCAAGATCGAGATGAACTTCC
+TGCCCGACGTGTACGTGCCGTGCGAGGTCTGCCAGGGGGCCCGGTACAACCGCGAAACCCTCGAGGTGCA
+CTACAAGGGCAAGACCGTCTCGGAAGTGCTGGACATGTCCATCGAGGAAGCGGCGGAGTTCTTCGAGCCG
+ATCGCCGGCGTCCATCGCTATCTACGCACCCTGGTCGACGTGGGCCTGGGCTACGTGCGGCTCGGCCAGC
+CCGCGCCCACGCTGTCCGGCGGTGAGGCCCAGCGGGTCAAGCTGGCCTCGGAGCTGCAGAAGCGCTCCAC
+CGGGCGCACCGTCTACATCCTCGACGAGCCGACGACGGGACTGCACTTCGACGACATACGCAAGCTGCTC
+AACGTGATCAACGGCCTGGTCGACAAGGGCAATACGGTGATCGTCATCGAACATAACCTGGACGTGATCA
+AGACATCGGATTGGATCATCGACCTGGGCCCGGAGGGCGGTGCCGGCGGCGGAACCGTTGTCGCCCAAGG
+CACTCCGGAGGACGTTGCCGCGGTGCCGGCGAGCTACACCGGGAAGTTTCTCGCTGAGGTCGTCGGCGGC
+GGTGCCTCGGCCGCCACATCGCGGTCGAACAGACGGCGCAACGTCAGCGCCTGAGCTGGACTATCGCCGC
+GCGTCAAGTCTGTGCTCACGGCGGCGAACTGGGTGCGGTCTCACTCATCGGTGTGCATCGACTCACGGAT
+CTGAGCTAGCCGTTCGGCTGCCGCGCGCTGCCGCTGCGCGTACTGATCTTCGAGCCGGCGGCCTTGCGGG
+CTCTCGGCGTCGAGTTCGGTTGCCCCCAGGGCCGTTCCGTATCGGGTTTCGATCTTCTCGCGGACGGATT
+CGAAGGTCGGTACCCCAGCGCTGTCGTACCGCGGATCGGACTCGGAATTCGGCGTCGTGGCTTCCGGTGG
+TGTCGGTTCGTCGGGCATGCTCTGGCAATGCTCCTATCTGCCGGTACCGGCGATCTGCTGTGTCGTACCC
+GGCAACGGGATCTTAGGCACTCCCGGAGTGGCCAGTTGGCCGGCCAGCCATGGCAGCGCCGCAGCGAAAA
+CCCGGTCGGCGAAAGGCCAGTCGTGCTTGCCCGGTTGTGGAACCACGGCGCAGTAGATGCCGTTGGCGCG
+GCCGAGGGCGCACAGTGCATTGGCGGCAGCGGCCTGGTTGCCTGGGTTGGCGGCGGCATCGCGACCGGCC
+AGCCGCATCGTGGTGGTATCGGCGACAGCGTTGTCGGGCGAGGGTGGACCCGGCGAAGAGATCGCGAACC
+AACCCGACAGTCCGGTGTAGCTGCCATGCCGGGTGATCACCGTCGTCGGGTCAAACGCCGACCAGGCGTC
+TTCGTTGCCGCCGAACAACCTGACGATGGTTTGCGTCTTGTTGCCAGCGTTCGGGTAGAAATCACCGGCG
+ATGTCGACAAACGCGCTAAACAGTGTCGGGTGCATGACGGTCAGATCCACCGCGCAGGTCCCACCCATCG
+ACCAACCCACGATGCCCCAGCTGGTCTGTTCGGGACTGACGCCGAATTTCGAGACCATGTAGGGCACAAC
+ATCTTTAGTCAAGTGGTCGGCCGCGTTGCCACGCCGTCCATTGACGCATTCGGTGTCGTTGTTGAACGCG
+CCGCCGGAATCCACGAATACCACGACGGGAGCATTGCCGCTGTGGGCGGCCGCAAAGTCGTCGAGCGTCT
+TCACCGCGTTACCGGCTCGCGCCCAATCGGCGGGTGTGTTGAATTGACCGCCGATCATCATCACCGTCGG
+CAGCTGCGGCGGCGGAGGGTTCTCGGAACGATGCTCTCGGTCGAACCAGGCCGGCGGCAGGTACACCAGT
+TCGCCGCGATGCTTGAAGTGTGATGCGTCGGAAGGGATCACCACTGGCAACAAGGTGCCGTGCGACGGCC
+GCACCCCACTGTGCGCCAGTGCGGCAACAGCGGCCTGATCGGCCTGGTCGGGCAACGGGCCGGAGGTGAG
+CTGGTTCCACGCGGTCTGCACGGTCGGGAAGTAGCCAACCCACAGGTTGAGCGTCAAGGTCGCGCTGAGC
+AGACAGAGGGGCACGGCCAGCAGCGACGCGCCGCGGCGCCACCACCGCGCGCTGCGCCAGCCCAGGATCA
+ACACCGTCGCCGCCGCGCCGGTCAACGCGACCCAGATCCACAGCGTGCTCGGCGGCCGTTCGTTGGCCAG
+GCCGTTGCCGGTGACATACCAGCGCGTCCCCCATGCCAGGGTGGCCCCGATAGCGGCGGCCGTCGGCAGC
+CACCGCCGTTGCCAGTGACGTGATCGCCACCCTGCCGCCAGCACCAGCACGACCGCGGTCACGACCTGGA
+CAGCGAGCGGCACCCAACCGTGCATCAGCGATGTGTGGCCTACTGCTAACGGCTGCGTCGCGGCTGGCGG
+CGTCGACGCGGTCACCAGTTCATTCTGAGCCATTTCGGGCGGTGATTTGTTGGGGGTTTCCTGTGATCCG
+ACGGACGCCCACCGGCTCCGGCTAATGCGGTTTTGCCAACGGAAAGGGCAGTGTTTCGCGAATGCTGCGC
+CCAGTGATCAGCATGACCACCCGGTCAATGCCCATGCCCAAGCCGCCGGTGGGCGGCATGGCGTACTCCA
+TCGCTTGCAGGAAGTCTTCGTCGAGTTCCATCGCCTCGGGGTCTCCGCCGGCGGCCAGCAGGGACTGCTC
+CTGCAGGCGGCGCCGTTGCTCCACCGGGTCGGTCAGCTCGCTGTAGGCGGTGCCCAGCTCGATACCCCAC
+GCCACCAGGTCCCAACGCTCGGCGACACCGCGCTTGCTGCGATGCGGTCGGGTCAACGGTGACACCGATG
+TCGGAAAGTCGATGTAGAACGTCGGTTGCTCGGTGCGGCACTCCACCAGGTGCTCGTATAGCTCGAGCAC
+GACCGCGCCGGCATCCCATTGGGTCCGATAGGGGACACCGGCGGCGTCGCACAGCTTGCGGAGAGTGGTC
+AAGCCGGTATCGGCGTCGATGCGTTCACCGAGTGCTTCCGAGATCGCATCATGCACCGTCCGCACCGGCC
+ATATCCCGGAGATGTCGACCGGTTCGAGGTGGTGGCGGGTGCCGTCGGAACCCTTGTCCGTCCGGGGCCG
+CATGGCGATGGGCGCCCCGTTGGCGGCCTGGGCGGCGTTCTGGATGAGTTCGCGGCAGCCGTCAATCCAC
+TCAAGGTAGCCGGCGTGTGCTTGATAGGCCTCCAGTAGGGTGAACTCCGGGTTGTGGCTGAAGTCGACGC
+CCTCGTTGCGAAAGGCACGGCCGAGCTCGAATACCCGTTCCACGCCGCCGACGCACAGGCGCTTGAGGTA
+GAGCTCTGGTGCGATGCGCAGGAACAGATCCATGGAATACGTGTTGATGTGCGTGACGAACGGTCGGGCG
+GTGGCGCCGCCGTGCAGCTGCTGTAGGATCGGCGTTTCGACCTCGACGAATCCCTTTGCGAACAGCGTCT
+CGCGCACAGCGCGCAGCACGCTGCTGCGAGCGGTGATCAGCGCACGGGACTCAGCGTTGACCGCCAGGTC
+GAGGTAACGGGTCCGGACTCGGGCTTCGGGATCCAGTAGCCCCTTCCACTTATTCGGCAACGGCCGCAAA
+CACTTACCGATCAGGCGCCAGCCGCTGACGATCAACGATGGAGTTCCGGTCTTGCTGGCGCCCATGTGTC
+CGGTCATCTCCACCAGATCACCCAGATCGGTCGCCGCGTTGAAGTCGGCCGCGCAGCCCTGGTCCAGGCG
+TGAATTATCCAGCAGCACTTGCATTTCGCCCGACCAGTCGCGCAGCTGGGCGAACAACACACCACCGTAG
+TTACGTATTCGCATGATGCGTCCGGACACCGACACGCTAGCCTGGTGGTCTGCGGCCAGCGCCTGTGCCA
+CCGTGTGACTGGGCGGCCGGCCCACGGGAAAGGCGTCAATGCCGCTGCTCCGCAGCTTCTCTAGCTTGTC
+GAACCGAACTCGCACCTGCTCGGGTAGCCGCCGCTCGACCCCGTCGCCATTGGTGAGGCCTACTTGCCGC
+AGCCCGCTCACGTCCGGTGCCGAGCCGTCGTGATGCAATAGGCCGGTGGCCGCCAACCGCTCGGGCACTG
+CCGGATGATGCCCCGTGTGTACTCGGTTGCGCCGGCTGAACGGCAGCACGAGGAACCCCTCTGCGATCAC
+CGAGGCGACGCCCACTCGGGGAATCACTCGGGCGTCTTCGTAGCAGGCGTAGCGCGGTACCCATTCGGGT
+TGGTACTTCATGTTGGAGCGGTAGAGCGTCTCGAGCTGCCACCACCGTGAGAAGAAGACCAGCAGCCCCC
+GCCACAACCGGGCAACCGGGCCGGCGCCGAGTTGGGCGCCCTGCTCGAAGGCCGCGCGAAACACCGCGAA
+GTTCAACGAAATACGAGTGATACCAAGGCTTTCAGCGTGCAAGGCGAGTTCGCTGACCATAAGTTCGATA
+GTGCCGTTCGGGGATTGTGGAGAACGACGCATCAAATCCAGGGAGACACCGGTGGTTCCCCACGGCACCA
+GCGACAGCATTGCCAGCACCTGGTTGTGCGGATCAATCGCCTCCACCAGCAGGCAGTCGGAGTCCGCGGG
+GTCGCCGAGGCGGCCCAGCGCCATCGAGAAGCCGCGCTCGGTCTCGGTGTCGCGCCAGGAATCCGCCCGT
+GTGATGGTCTGCGCCATCTCGTCTTCGGCAATGTCGCGATGCCGCCGGATGCGCACCGTCAACCCCGCCC
+GCCGGGCCCGCGTCACGGCCTGGCGCACCCCGCGCATCTCCGGGCCGGACAACTTGAAATCGGCTGGCCG
+CAGGATGGCCTCATCGCCCAGCTCGAGCGCGGTTAGGCCCGCTTCGCGATATGTCTGAGCCCCTTGTGAA
+CTGGCGCCCATCACGCCGGGTGCCCAGCCGTAGGTCTGGCACAGCCGCAGCCACGCGTCGACGGCCTGCG
+GCCATGCTCTGTGGTCGCCTACCGGGTCGCCGCTGGCTAGGCAGACACCGACCTCGACACGGTAGGTGAT
+ACAGGCGCGGCCGCTGGATGCGAATACCACCGACTTGTCGCGACGGGTGGCGAAGTAGCCCAGTGAGTCG
+TCCTTCCCATACAAATCCAATAACCCGCGGATAGCGGATTCGTCCTCTCCGGTCAGCGCATTGTCAGCGC
+GCTGAGATAGGAACAAGACGATCGCAGCCCCGATCAACGCGAACGCGCCGAACAACCCGAAGATCGCGTT
+GAGGAAGACGTGCGGTCTGCCGGTGAACAGATCGGGATCGGCGAGGGCGAATCCGACCACCCGGTTGGCC
+GCGTAACCCAACCGCTCGTCCGGCGCTAGTGATCCCGGAAACAGTTCGACCAGACCCCAAGACGCCACGA
+TTCCGACCACCGCGCCGGCAAGCCACACCGCAGCCGCCCGAAACAGCGCGCCCCTGCGGACCTTGGCCCA
+GAACTCCCGATAGCCCAGCACCAGAACGACGATTGCCACAACATGCACGGCGAATCCGAGATTCTCCCCG
+AAGCTCTCGGCGGCGGTGTTGCCGCCCGCTGCGATCTCGGCGGCGTTGACCACGGCGGCCAGGACCATAT
+TTGCCAGCAAGACCAACCAGGCAATGCGTTTGCGTGCCGTTAACGCGGCGGCCAGCAATGCCAGCACGAA
+GGACCACGCGAAGTTGGTGTCGGGGAAGTTGAACAGATAATCGTTGATGAATTCGCGCGGAACCTTGATG
+ATCCACCGAATCAACGGCGACACACTGGCCAGTAGTGACAGGGTCGCGATCACGCCGACGGTCCAGCCGG
+CTGCCGCGGGAACCCAGTGATACCGGGAGTTTCCCCTGGTGGCCGAGCGAGGTTTGGTGAGTGTCACAGA
+CCGCGAGGATATTCCCAAAAGCCGGGAAATGCCCGGCGTTGCAGCCCTTTGTAGCCCCGCATCGGTGTGC
+TGAGGGCACCGGCTGATGTCGGCCGTTGTCTTAGATGACGTGTCATGGCTGTTAGACTGGACGCCGCGAC
+CATCCCGGCGAAGGCCAGGGACAGTTAAGTGGAGTCCCACTCCCACCGCTAGCCACGAGATCGTTTCACA
+CCTTCTCAAGGTTCAGCGGTCCGGTCACAGGCATCTCGGATGCCTGTTCTGCGTGCAGCGTGGGCGGCTT
+TGGCCGCGATCGGTCGGCATTGGGCCCTGCTTGTGCAGGGCTTTTTTGCTGATGGTTTGGGTGTGTTCCC
+CACCTGATTCCGGCCGGGTCCAACAAGCTGGTCGCGCCTGGAACAGCAGCCAACGAGGGAGGCCCCATCA
+GCACTGAAACCCGCGTCAACGAGCGCATCCGCGTACCTGAAGTCCGATTGATCGGCCCAGGGGGGGAGCA
+GGTAGGCATTGTGCGTATCGAAGACGCACTTCGCGTCGCCGCGGACGCAGATCTCGACCTTGTCGAAGTT
+GCTCCCAATGCCAGACCGCCGGTCTGCAAGATCATGGACTACGGCAAGTACAAGTACGAGGCCGCGCAGA
+AGGCGCGCGAATCCCGCAGAAACCAACAGCAGACCGTCGTCAAAGAACAAAAGCTGCGACCAAAGATTGA
+CGATCACGATTACGAGACCAAAAAGGGTCACGTCGTCCGCTTCTTGGAGGCGGGATCGAAGGTCAAGGTC
+ACCATTATGTTCCGTGGACGTGAGCAGTCGCGGCCGGAGTTGGGCTATCGATTGCTGCAGCGGCTGGGTG
+CGGACGTCGCCGATTACGGATTCATCGAGACGTCCGCCAAGCAGGACGGACGCAACATGACGATGGTGCT
+GGCACCGCACCGCGGTGCGAAGACCCGCGCTAGGGCCCGCCACCCGGGTGAACCGGCCGGCGGGCCGCCG
+CCCAAGCCCACGGCCGGTGACAGCAAAGCCGCACCGAACTAGCTCGCCAGCAAGACACGCAGAACCTAGA
+AATTCTAGAAATTGAGGAAACATGCCCAAGGCCAAGACCCACAGCGGGGCCTCGAAGCGGTTCCGGCGCA
+CCGGTACCGGCAAGATCGTCCGGCAGAAGGCCAACCGTCGGCACCTGCTCGAGCACAAGCCGAGCACCCG
+CACCAGGCGCCTGGACGGCCGCACCGTGGTGGCAGCCAACGACACCAAACGGGTCACGTCGTTGCTGAAC
+GGCTGACCGTACCGCCGGCCGGCTCCGGCACCTGACCAATCACGTCCGAACGAGAGTAGGAAGATCCATG
+GCACGCGTAAAGCGGGCGGTCAACGCCCACAAGAAGCGGCGCAGCATCCTGAAGGCATCGCGAGGCTATC
+GCGGCCAGCGATCGCGGCTTTACCGCAAAGCCAAAGAGCAGCAGCTGCATTCACTGAACTACGCCTACCG
+TGACCGCCGGGCGCGTAAGGGCGAGTTCCGCAAGTTGTGGATCGCACGGATCAACGCGGCTGCGCGCCTC
+AACGACATCACCTACAACCGGCTTATCCAGGGGCTGAAGGCCGCCGGCGTCGAGGTGGACCGGAAAAACC
+TCGCCGACATTGCGATCAGCGACCCGGCGGCGTTCACCGCGCTGGTCGACGTCGCCCGGGCGGCACTGCC
+CGAAGACGTCAACGCCCCCTCCGGGGAGGCCGCCTGATCCGGATTCCGGCCTGAGGCAGGGCTACGCCGG
+TGCTCACCGAACGCTCGGCCAGGGTGGCCACGGCGGTCAAACTGCATCGTCACGTAGGCCGGCGCCGGGC
+GGGACGTTTTCTCGCCGAAGGCCCCAACCTGGTAGCGGCGGCGTTGGCGCGCGGGCTGGTACGGGAGGTA
+TTCGTCACCGAAGTTGCGGCGCGGCGGCACGAGCTCTTGTTGGCCGCGCACGAGGCTTCGGTTCATCTGG
+TGACTGAGCGGGCCGCGAAGGCGCTCTCTGATACGGTCACGCCGGCCGGGTTGGTGGCGGTGTGCGATCT
+GCCGGCGACCCGACTTGAGGATGTATTGGCCGGCTCACCTCAGCTGATCGCGGTGACCGTCGAGATCCGC
+GAGCCGGGCAACGCGGGCACGGTAATCCGCATCGCCGACGCCATGGGTGCCGCGGCGGTGATCCTCGCCG
+GGCGCAGCGTCGACCCATACAACGGCAAGTGTCTGCGCGCGTCCACCGGTAGCATCTTCGCGATCCCGGT
+CGTCGTCGCGCCCGATGTCGGTGCCGCCATCGCCGACCTGCGAGCGGCCGGACTGCAGGTGCTGGCCACC
+GCAGTGGACGGCGAGATGGCTCTCGACGATGCCGATCGGCTGCTTGCCGAGCCGACGGCATGGCTGTTCG
+GGCCCGAAGCACACGGGTTGTCGGCCGAGATCGCGGCCTTGGCGGACCACCGCGTACACATCCCGATGTC
+GGGAGGGGCGGAGAGCCTCAACGTCGCGGCCGCGGCCGCGATCTGTCTGTATGAGAGCGCTCGGGCGTTG
+GGCCGCCGCTGATTGTCCGGCCCTACGCAGCGCGGCTGGGGCCCCGCGCCGGCCGCACGCCGGCCAGCGA
+AAGTGTGGAATGGACCAGCGCCCCGGCGCGTTCCATCAGGGCCTTGGCGGGATCGAGAGCCGACCGGGTA
+AAGCGATGGGAACGGGGTGGGAAGTAGTGCATCGGCAGCCCCTGCCGATCCCGTGGTGGCGCCATGAAGC
+CGGGCGCTTGCACCAGGGGCGCGTCATGGCGAGTACGGCCTGCCGCTCGCCGGTAGGCGGCCAGCGCGCG
+CGGGTGCAACCGGATTTCGTCGGGCACCGCCAAAAACGCCAGTTCTACCACCTTGCCGAACACTCGCAGC
+AACACCTCGTCACCCGGTGTCCAGTGCATTCCCGCCTTCTCCCGCACGGCCGGGTCGAACAGGCCGGCCG
+CGATCCAGCGCTGACCGGCTATTAGCGGCTTGAACAGCTGATCCCAGATCGGCGTTGGCATGAGTACAAA
+CCTCGGTTTGGGAATCCGCATCTGGAGGATGTCCACGGTCGCCTGATTGATCTCGAGCTTGTCGCGGCAC
+ACCCGGTCCCAATAGTCCTGAAAGTCTTCCCACGACTTGGGCACCGGTCGCATGCTCATCCCATACATCC
+GGTACCAGCGCACGTGCTCCTCGAAGAGCTGGTGTTTTTCGGCCTCGGTCAAGCCTCCGCAGAAGTATTC
+GGCGACCTTGATGACAAGCATGAAAAACGTCGCATGCGCCCAGTAGAACGTATCTGGATTCAGCGCGTGA
+TAGCGACGCCCCTCAGCGTCGACTCCCTTGATGGTTCGGTGGTAGCCCTTGATCTGCTGGCCGGTCTGGG
+CCGCTCGGTCACCGTCATAGACCACACCCATGATCGGGTACACCGAGCGGGCTACCCGCTGCAAGGGTTC
+GCGGAGCAGGATTGAATGCTCCTCGACACCGGCACCTAGCTCGGGATACATATTTTGGATCGCGCCGATC
+CACACACCCATCATCCCGGTGCGCAGGTCTCCGAAATATTTCCAGGTCAGCGAATCGGGCCCGAGCGGGT
+CGGCGGATGTCCTCGATGCGACAGTCATGACTGCCTCCGTGCCAGGTTAGTCTGCGCCCACGATAGGCAT
+TGACAACGCGCGTTGTCCACGATTTGGTCCGCCGATATCGCGCCGTGTCACCCAGTGCCTCCTCCGGGTG
+GCAACGAGCGTGGACGAGGACTGCAGCTGCATAGCTTGGCCCGCGGTGCGTGCGGGGGCAGGGAGTCCAA
+TGAAAAATGTTGCTTAGAACGCCAGAAAGTTTTTAACTAGATCAGGATTGCTTAGCTGTAGACTTTATTT
+CTCAATGACCACGTAAGGATTGCTGCGGCCAGTACAACGTGTACAAGGAGTCGGGCTATGTCGTTTCTCA
+CCGTGGCGCCGGACATGGTAACGGCGGCCGCCGGGAATTTGGAAAGCGTTGGCTCGGCACTGAATGAGGC
+CGCTGCGGCGGCGGCGCCAGCCACGGTTGGGCTGGCGGCCCCGGCCGCGGATCGGGTGTCGGCGGTCGTC
+GCGGCGATGTTGGGGGCATATGCCCGGGATTTTCAAGGCATCAGTGCTCAGATCGCGGGTTTTCATAACC
+AGTTCGTGGGCGCGTTGCGGGGCGGTGCGGCCGCCTACGCCAGCGCCGAAGCCGCCAACGTCCAGCAGAC
+CGTGGTGAACGCCGTGAATGCGCCCGCCCAGGCGCTGTTGGGGCACCCGTTGATCGGGCCCGAGACGGTC
+GGCTCCAGCGCCGCCGCGGTCTCCTTCGGCTTCGGCCCGTTGCTCCTCGCTGGTAGCGATCCGCTGCTGG
+CCGTGCCATTCAGCTATCCGGCCAGTCTGCCCACCCCATTCGGTCCAGTAACGATGACGCTCAACGGGTC
+GTTTGATCCGCTTACCCAACAGGTTGTTTTCGACTCGGGATCACTCACCGCGCCCGCTCCGTTCGTGTAC
+GGTCTTGGTGCGGTAGGTCCAGCTCTCACCACCATGACCGCGCTGCAAAACAGCGGCACAGCATTTTCCG
+GCGCGGTGCAAAGCGGGAACCTGCTAGGGGCCGCGGGCGCGCTTCTGCAAGCTCCCGGCAACGCGGTGAC
+CGGCTTCCTGTTTGGCCAAACAGCGATATCGCAGTCGATACCGGGGCCATCGAATCTGGGCTACGAGTCG
+GTGGGTATCAGCGTTCCGGTCGGGGGGCTCTTGGCTCCGCTGCAGCCCGTGACGGTCACGTTGACGCCCA
+CATCTGGTATGCCGACTGCCATTCAATTGAGTGGTACGCAGTTTGGCGGCCTTCTTCCCGCCCTACTCAA
+CGGTTTCTAACCGTCTGCGGACAGCCGCCGCAAACCGCGTGATCAGCGTGTTTGATGCGACTTGTGCCAC
+AAACACCGAGGTCGTCATTGCCGGGCTCAGCCCGCACCACCTACCCTTGCCACGTGGAGGTCGGGCCGCA
+GGATTCGGAGTCCGGCGCGCCCGACGAGACGGCAACCGCCATGGCGTCGCCAGTACCTCGACAACGGTCC
+GCACTACGCTGGCTGCGCACCGTGAACCGCAGCCCTGGCCTGGTGTCATTCATCCACCGGGCGCGCCGCC
+TGTTGCCTGGCGATCCGGAATTCGGCGACCCGTTGTCCACCGCGGGTGAGGGTGGTCCACGTGCCGCGGC
+TCGAGCTGCCGATCGGCTGCTGCGGGATCGCGATGCGGCCTCGCGCGAGGTCGGCCTGAGTGTGCTGCAG
+GTGTGGCAGGCGTTGACCGAGGCCGTTTCCCGCCGGCCGGCAAACCCGGAGGTGACGTTGGTGTTCACCG
+ACCTGGTCGGCTTTTCCACGTGGTCGTTGCACGCTGGTGACGATGCCACCCTCACGCTGCTGCGGCAGGT
+GGCCCGGGCTGTCGAATCCCCCCTCCTGGACGCCGGCGGGCACATCGTCAAACGGCTGGGCGACGGGATC
+ATGGCGGTGTTCCGCAATCCGACCGTCGCGCTGCGAGCCGTGCTCGTCGCCCAAGATGCTGTGAAGTCGC
+TTGAAGTGCAAGGCTATACACCGCGAATGCGGATCGGTATCCACACCGGCCGGCCGCAGCGGCTGGCCGC
+CGACTGGCTCGGCGTCGACGTCAACATCGCCGCCCGGGTTATGGAACGTGCCACCAAAGGGGGCATCATG
+ATCTCGCAACCGACCCTGGACCTGATCCCGCAAAGTGAGTTGGACGCGCTGGGCGTCGTGGCCCGGCGGG
+TGCGTAAACCCGTGTTTGCCAGCAAGCCCACCGGCATTCCGCCCGACTTGGCGATCTATCGCATCAAGAC
+TGTTAGCGAGTCGACAGCTGCCGATAACTTCGATGAGATGAGTCCCGATGCACAGTAGAACGCGATGATC
+TACCGCGTCGCCTGCCTGCTGGCCCGGATCCGGTTCACCGTGGGCTACGTGGCGGCTCTTGCATCGGTCA
+GCACCACCATCCTGATGCATGGTCCGCAGGTGCACGCCCAGGTGATTCGGCATGCCAGTACGAACCTGCA
+CAACCTGGCCCATGGACACCTGGGAACGCTGTGGAACAGCGCCTTCGTCATCGACGAGGGCCCGCTTTAT
+TTCTGGTTACCCTGCTTGGCGTGTCTGCTCGCGGTCGCGGAGCTGCAGCTGCGCAGCTTGCGGCTGACCG
+TGGCGTTCGTCGTCGGTCATATTGGGGCGACACTGTTGGTGGCGGCCGTGCTTGCCGGGGCGATCGAGAT
+CGGCTGGTTGCCATGGTCCATTAGCCGGGTCAGCGATGTCGGGATGAGCTACGGTGCCCTCGCGGCGCTC
+GGGGCGCTGACCGCGGCAATCCCTGGGCGGTGGCGGCCGGCATGGATTGGTTGGTGGGTATCGCTGGGCT
+TGGCGACTGCGACCATCGGCGGTGGTTTCACCGATGCCGGCCACACGGTTGCGTTGCTGTTGGGCATGTT
+AGTGACTGCCTGCTTCACCCGGCCCGCGCGCTGGACACTCGGGCGGTGTGCCTTGCTGGCGGTGGCGTCG
+GGGTTCTGCTTGGTGCTGCTAGCCCATAGCTGGTGGAGCTTGGTGAGTGGGTCGGCCTTGGGTCTACTCG
+GGGCCCTGGGTGCCGCCGGGTTTGCGCGTTGGACCAGAGCGCGCGCCACATCGCTGCCACCCGGCGCGCT
+GGCGATTCCGCAGCCGGCGCTAAGTCGCTGAGTCCCGCACAACGCGTGCCGAGCCGGGCCGACCGAATCA
+CCTATGATTTGCACTTGCGTCACGCCGTTAGCGGGCAAGTCGGGTACGTCCATCAGTCCAGTTTCCGCTC
+CGCGACGATGCGGGCGGTCCGAATAGCCTCGTCAGCAAGGAGAGTGGCGCCGCGTGGGTGATCCCCCCCT
+CGAGTCGATTGTGTCGATGTTGTCGCCGGAGGCATTGACCACGGCGGTCGACGCCGCCCAGCAGGCCATC
+GCCCTAGCGGACACCCTGGACGTCCTGGCGCGCGTCAAGACGGAGCATCTCGGCGACCGCTCGCCGTTGG
+CGCTGGCGCGGCAGGCGCTGGCCGTGCTGCCCAAAGAACAGCGAGCCGAGGCCGGTAAGCGCGTCAACGC
+CGCCCGCAATGCCGCTCAGCGCAGCTACGACGAACGGCTGGCGACGCTGCGTGCCGAGCGCGACGCGGCC
+GTGCTGGTGGCCGAAGGTATCGATGTCACATTGCCCTCGACTCGGGTGCCGGCCGGCGCCCGGCACCCGA
+TCATCATGTTGGCCGAACACGTCGCCGACACGTTCATCGCGATGGGATGGGAACTGGCCGAGGGGCCCGA
+GGTGGAGACCGAGCAGTTCAACTTCGACGCCCTCAACTTCCCTGCCGACCACCCTGCGCGCGGCGAACAA
+GATACCTTCTACATCGCGCCGGAGGATTCGCGGCAGCTGCTGCGCACCCATACCTCACCGGTGCAGATTC
+GCACCCTGCTAGCGCGTGAGCTGCCGGTCTACATCATCTCGATCGGTCGTACCTTTCGCACCGACGAACT
+CGACGCCACCCACACGCCCATCTTCCATCAGGTGGAAGGCCTAGCGGTGGACCGCGGTCTGTCGATGGCT
+CACCTACGTGGAACGCTGGACGCTTTTGCGCGCGCCGAGTTCGGGCCGTCTGCGCGGACCCGGATCCGGC
+CACACTTCTTCCCCTTCACCGAACCGTCCGCCGAGGTCGATGTGTGGTTTGCCAACAAGATTGGCGGCGC
+CGACTGGGTGGAGTGGGGCGGGTGCGGAATGGTGCATCCGAACGTGTTGCGGGCCACCGGCATTGATCCC
+GATCTCTACTCCGGTTTCGCGTTCGGGATGGGGTTGGAACGCACCCTGCAGTTTCGCAACGGCATTCCTG
+ACATGCGCGACATGGTCGAAGGCGACGTCCGATTCTCGTTGCCGTTCGGGGTGGGTGCCTGATGCGGCTA
+CCCTACAGCTGGCTGCGCGAGGTGGTTGCGGTCGGCGCTTCGGGCTGGGACGTTACCCCAGGCGAACTCG
+AGCAGACGCTGTTGCGCATCGGCCACGAGGTCGAAGAGGTCATCCCCCTTGGTCCGGTGGACGGCCCGGT
+GACCGTGGGGCGGGTGGCCGATATCGAGGAGCTCACCGGCTACAAGAAGCCGATCCGGGCCTGCGCGGTA
+GATATCGGCGATCGGCAGTATCGCGAGATTATTTGTGGTGCAACCAATTTCGCGGTTGGTGATCTGGTGG
+TGGTAGCGCTGCCCGGTGCCACGCTGCCCGGTGGATTCACCATTAGCGCCCGCAAGGCCTACGGTCGCAA
+CTCCGACGGAATGATCTGCTCGGCAGCCGAACTCAATTTGGGCGCAGACCATTCCGGGATCCTGGTGTTG
+CCCCCCGGAGCCGCCGAGCCCGGAGCTGACGGCGCGGGCGTGCTGGGGCTCGACGACGTGGTCTTCCATC
+TGGCCATCACCCCAGACCGCGGTTACTGCATGTCGGTGCGCGGCTTGGCCCGCGAGCTCGCGTGCGCCTA
+CGACCTGGACTTCGTCGACCCCGCCAGCAACTCGCGGGTGCCGCCGCTACCCATCGAGGGGCCAGTCTGG
+CCGCTGACGGTTCAGCCCGAGACGGGGGTGCGCCGGTTCGCGCTACGCCCGGTCATCGGGATCGACCCCG
+CCGCGGTATCGCCCTGGTGGTTGCAGCGCCGACTGCTGCTCTGCGGTATCCGCGCGACCTGTCCGGCGGT
+CGACGTGACCAATTACGTGATGCTCGAACTTGGCCACCCCATGCACGCCCACGACCGCAACCGGATCAGC
+GGAACCCTCGGAGTGCGGTTCGCCCGGTCCGGCGAGACCGCCGTGACCCTCGACGGTATCGAGCGCAAGC
+TCGATACCGCCGATGTCCTGATCGTCGACGATGCTGCGACAGCGGCGATCGGCGGCGTGATGGGGGCGGC
+CAGCACCGAAGTGCGGGCCGACTCCACCGATGTCCTGTTGGAGGCCGCGATATGGGACCCGGCTGCGGTA
+TCGCGTACCCAGCGGCGGCTGCACCTGCCTAGCGAGGCCGCCCGTCGTTACGAGCGGACGGTGGACCCGG
+CCATCTCCGTGGCCGCTTTGGACCGGTGCGCAAGGCTGCTCGCCGACATCGCCGGGGGGGAGGTTTCTCC
+CACCCTTACCGACTGGCGGGGTGACCCGCCGTGTGATGACTGGTCACCGCCGCCGATCCGGATGGGAGTC
+GATGTGCCGGACCGCATCGCCGGGGTGGCCTATCCGCAGGGCACTACTGCCAGGCGCTTGGCCCAGATCG
+GCGCGGTGGTGACCCACGACGGCGACACCTTGACCGTGACCCCGCCGAGTTGGCGACCTGATCTGCGGCA
+ACCCGCAGACCTTGTCGAGGAGGTGCTGCGGCTTGAGGGGCTGGAAGTTATCCCGTCGGTGCTGCCACCG
+GCGCCCGCGGGTCGTGGACTCACCGCTGGGCAGCAGCGCCGTCGCACGATCGGCAGGTCGCTGGCGCTGT
+CGGGCTATGTCGAGATTCTGCCGACTCCATTTCTGCCGGCCGGTGTGTTCGATTTGTGGGGGCTGGAAGC
+CGATGACTCACGGCGCATGACCACGCGGGTGCTCAACCCGCTGGAGGCCGATCGTCCGCAACTGGCGACC
+ACGCTGCTGCCGGCCCTGCTGGAAGCCTTGGTGCGCAACGTGTCCCGAGGGCTGGTCGACGTCGCGCTGT
+TCGCCATCGCCCAGGTGGTCCAGCCGACCGAGCAGACGCGCGGTGTCGGGTTGATCCCGGTTGACCGGCG
+GCCGACCGATGATGAGATCGCCATGCTGGATGCCTCGCTGCCCCGGCAACCCCAGCACGTCGCGGCGGTG
+CTGGCCGGACTGCGCGAGCCTCGAGGCCCCTGGGGCCCGGGCCGCCCGGTAGAGGCGGCTGATGCGTTCG
+AGGCGGTGCGAATCATCGCGCGCGCCAGCCGCGTGGACGTGACCCTGCGGCCGGCCCAATATCTGCCGTG
+GCATCCGGGCCGGTGCGCGCAGGTGTTCGTCGGGGAAAGCTCGGTTGGTCACGCCGGGCAGCTGCATCCC
+GCCGTGATCGAGCGCTCGGGTCTGCCGAAAGGCACCTGCGCGGTGGAACTGAACCTAGATGCGATTCCGT
+GCAGCGCGCCGCTGCCGGCACCCAGGGTGTCGCCGTATCCGGCCGTGTTCCAAGACGTCAGCCTGGTGGT
+GGCCGCGGACATCCCCGCTCAGGCGGTGGCCGACGCCGTGCGCGCGGGGGCAGGCGACCTGCTGGAGGAT
+ATTGCGTTGTTTGACGTGTTCACCGGCCCGCAGATTGGTGAGCACCGCAAGTCGCTGACCTTCGCGCTGC
+GGTTTCGTGCGCCGGATCGCACCTTAACCGAAGACGACGCCAGCGCCGCCCGCGATGCCGCTGTGCAAAG
+CGCAGCCGAACGGGTGGGTGCCGTGCTGCGTGGCTGAACCGACTCAGCACGCGTTCAACGAAAATTTGAC
+GACGGCATTTCAGCGCGCCGCGTTTATACCTCGCCGCCCTGTCCGGGTAGCGGCGCCGCCCTAAGGGGCA
+ATTGCCTGCGCTAGCTGTGTGGGAGCGTAGTTCACCAACGCGGGAACGATGCCGCCGGCGGGCGTACCTT
+CGAGCGTAACGGTAACCGGCCCGATGACCGGTATTACCGCCGTGGCCTGAAACGGCTGCAGAGGCGCAAG
+AATGCCGCCGACGGGAACCTCGACCGTCACCGGAATCCCCCCTGTCGCCGATGTTGGCAGGGCCAGCGGC
+AGCCTGGCCTCGCCATTGAGGAAGCCGTTGGCGACGTTGGCGGGAGCACCGACCAGGGCCGCCGCTGCCG
+CCTGCAGGTTTCCGGCCTGCACGGCGCTGACGAACGCTGTCGTGCTCTCGGCGAATGCGATTGCCGTCGT
+GATCGGCGAACCCACCGCATTAAGGGTCATCGCCAGCGGCAATCCAAACGTCATCACCCCGGTCAAGTTC
+GTGGTATCGATCGAAAAGGCGATGGTTGTGTCCGTGACCGTCATCACCACATTGGTGAAGTTTTGTGACA
+TGGCGCCGGGGATGCTCAGGATGGGGAACAGGTCTCCCACCGGCCCGAGCAGCAGGATGTTCGACAAGTC
+ACTCGCGTCAACACCGCTGACGAAGACCTTCACCACCGCCCCTAACACGTCGGTCACCGCGCCGCTGACG
+TCGCCTGCCGCGAGGGCTTGCAAGGCCGATTGCAGGCTCGGCGGTATGCCAGCCAGCCCAATAGCGAAGT
+CCCTGGTGGCATCTGTCAGCGCGGTTAGGGTCAGCTGGCCGTAGCCGAACTGGTTGGCGAGGTACTGCTG
+CAGGAACGGCGCCGGGTCGGCAAGCCAGGTATTGCCGATGCTCGCCAGGTTGGCGACCGTGTTGGCGATG
+AGGTCTTCGTATGGCCCGAGGATGGGAACACTGCTGCTCAGGCTAGGGAAGGCCAGCGCTGCCGCGCCCG
+GTGGACCGGAGCTGCCACTTTGGCCGAACAACACCCCGCCGGTGCCACCGGTGCCGCCATTACCCGGGGC
+ACCGGCCGGGCTGCCGGCGCCGCCGGCGCCACCGGCGCCACCGTCACCACCGTTGCCGATCAAGGTGGCG
+TTGCCGCCGTGACCGCCGTCGCTACCGGTGCCGCCGGCCTTGGTACCGGAACCGGCGCCGCCCGCGCCGC
+CGGTTCCGCCGGTCCCGCCGTCGCCGAACACTTGGCCGGCGTTGCCGCCGTTTCCGCTGGCACCGCCCTT
+ACCGCCGATACCGTTGCCGCCACTGTGATCCCCACCGGTACCACCGGCGCCGCCCTGCCCGCCATTACCG
+AACGCGATGGCGCTGCCTCCGGTGCCGCCGATACCGCCGGTGCCACCCTCAAGGGCGCCATCGGCGGTGG
+TGCCACCGTTGCCGCCGTTCCCACCGGCCCCACCGTTGCCCCATATCAGCCCGCCGGCACCGCCGTGACC
+GCCGGCACCGCCGGTACCGCCGGGACTTGCGAAGAGGGAGCCAGAGTTAGCCCCACCAGTGCCGCCGTTC
+CCACCGGCCCCACCGCTGCCGAGAAGCAACGCGGTGCCGCCGCTGCCGCCGGCACCGCCGACACCGGAGC
+TAAATAGCGCTGCAGCCCCACCGGCGCCACCGGCCCCACCGTTGCCGCCATTGCCGATGAAGCTACTGCC
+CGCGGCACCACCGGCGCCGCCGGCACCGGCGTTGGCGAGTATGTTGATAGCAGCCCCGCCGATGCCACCG
+GCCCCCCCGTTCCCGCCGTTGCCGTAGAGCAGCCCGCCGACGCCGCCGGCCCCGCCGGCCCCGCCGGCTC
+CGCTGGTAGCGCTGGCCAGATCGCTGCTCGTCCCCCCCTTGCCGCCGACGCCACCGGTCCCACCGTTACC
+GAACAAGCTGGCGTTGCCGCCAGCACCCCCGGCACCGCCGACGCCGGAGTCGAACAATGGCACCGTCGTA
+TCCCCACCATTGCCGCCGGCCCCACCGGCACCGCCGTTGCCGTACAGCAGGCCGGCGTTGCCGCCGGCCC
+CGCCAGCGCCGGCGTTCATGCCGACGCCCAACAATGACGTGGCGGCGCCGCCGTCGCCGCCGGCACCGCC
+GGAGCCCCACAGGCCGACGCTGCCGCCGGCCCCGCCGGCCACGCCGCTACCGGTGAGACCGCTGGTGCCG
+CCAGCGCCGCCGGCACCGCCATTGCCGACCAGGGTATTCCCGCCCGCACCCCCGGCGGCGACGGTGCTCG
+ATCCGCCGTCCCCGCCGTTGCCGAACAGTGCATTTCCACCTGCACCGCCAGCCTTCGAGGTGCTGGAACC
+ACCGTCCCCGCCATTGCCGAACAACCCGCCGTCCGCGCCGGCTAGCCCCGATCCGGCCCCAGCATTGCCG
+CCGTTACCAAATATCGTCCCGGCGTGGCCGGCGGCTCCGCCGGAAGCCCCACTTCCGCCGTTCCCGCCGT
+TGCCGAACAGCAGGGCGTTGCCGCCGGCCCCACCGGCCGCAGCGGCACTGCCCCCGTTGCCGCCGGCACC
+GCCGTTGCCATACAACAGTCCGCCGGTGCCGCCGGCCCCGCCAGCGCCGCCTGCACCTCCAACACCGCCG
+GCGCCGCCGGCGCCGCCGTTGCCGATCAATCCGGCGGCCCCGCCGTTACCGCCGGCCCCGCCGTCGGGTC
+CGCCGGCCCCGCCGTTGCCGCCGTTGCCGTACAAAATTCCACCGGGCCCGCCGTTGCCGCCGGCATTTGA
+CCCGGTCCCCGCCACTCCATCGGCGCCGTTGCCGATCAGTGGGCGCCCCAGCAGCGTCTGCGTGGGCGCA
+TTCACCGCGTCGAGCAGGGCCTGCATCGACGACACGCTGGCGGCCTCGGCGCCGGTATAGGCCGCCGCGC
+CGCCGTTCAACAAGCTCACGAACTCGGCGTGAAACGTCGCCGCCCGGGCGTTGAGCGCTTGAAATTGCTG
+ACCGTAGGCGCCGAATAGTCGCGAGACAGCCGCCGACACCTCATCGGCGCCGGCCGATGCCAGCGCGGTC
+GTGGGGGTCGATGCGGCGGCAGCGGCTTCGCTCAGTGCCGAGCGAATACCAGCTAAATTGGCGGCCGCTG
+CTGTGACCAAGTCCGGCTCCACGAGTAAGAACGACATGGCGGTCCCCCTTCGACTCGGCGCAGCTAGTGG
+ACATGTGTCACGGGAAATTCAGCCTAGTTGGGTCTTATGTCATGTGAGGGAAAACGCACGTTTTCGCGGA
+CGCAACTTCGAGTCCCATCGGCGCCGCCCGGCGGTGTGTCAAGTCCCGGCGCAGTCACCGCGGAATGAGT
+TTGCAAACTGTTGCATAACGATGCAAAATCGGCAGGTGGCCAATGCGACGAAGGTGGCGGTTGCCGGTGC
+CAGCGGATATGCCGGTGGTGAGATTCTCCGCCTGCTGCTCGGGCATCCGGCGTACGCCGACGGCCGGCTG
+AGGATCGGTGCGCTGACCGCGGCGACCAGCGCCGGCAGCACGCTCGGCGAACACCATCCGCACCTGACGC
+CGCTGGCCCATCGAGTAGTCGAACCCACCGAAGCTGCCGTGCTCGGTGGCCATGACGCCGTCTTCTTGGC
+CTTGCCGCACGGGCATTCGGCGGTGTTGGCGCAGCAACTGAGCCCCGAGACACTGATCATCGACTGCGGG
+GCGGACTTTCGGCTCACCGACGCCGCCGTCTGGGAGCGGTTCTACGGGTCGTCGCACGCCGGTAGCTGGC
+CGTATGGGTTGCCCGAGCTGCCGGGCGCGCGGGACCAATTGCGCGGCACCCGCCGCATCGCGGTGCCCGG
+CTGCTATCCGACCGCGGCACTGCTGGCGCTTTTTCCCGCGCTGGCCGCAGACCTTATCGAGCCCGCGGTG
+ACCGTGGTCGCCGTGAGCGGTACCTCGGGGGCGGGTCGTGCGGCCACCACCGACTTGCTGGGCGCGGAGG
+TCATCGGGTCGGCGCGCGCCTACAACATCGCCGGCGTCCACCGGCACACCCCCGAGATCGCTCAAGGGCT
+ACGCGCGGTCACCGACCGCGACGTCTCGGTCTCGTTTACCCCGGTGCTGATCCCGGCCTCCCGTGGCATC
+CTGGCCACCTGCACGGCACGCACCCGATCACCCCTGTCGCAGCTGCGGGCAGCCTACGAAAAGGCCTACC
+ATGCAGAGCCTTTCATTTATCTGATGCCGGAGGGGCAGCTGCCGCGCACCGGCGCGGTGATCGGCAGCAA
+CGCAGCGCACATCGCCGTCGCGGTGGACGAGGACGCGCAGACGTTCGTGGCGATCGCCGCGATCGACAAC
+CTGGTCAAGGGCACCGCCGGCGCCGCGGTGCAATCGATGAACCTGGCGCTGGGCTGGCCGGAGACCGACG
+GCCTTTCGGTTGTGGGGGTGGCGCCGTGACCGACCTGGCCGGCACCACCCGGCTGCTGCGCGCTCAGGGC
+GTCACCGCCCCGGCCGGCTTTCGGGCCGCCGGCGTCGCCGCCGGGATCAAGGCCTCCGGTGCGCTGGATC
+TGGCGCTGGTGTTCAACGAGGGACCCGACTACGCCGCCGCCGGGGTGTTCACCCGCAACCAGGTCAAGGC
+GGCGCCGGTGCTGTGGACCCAGCAAGTGCTGACCACCGGGCGGCTGCGCGCGGTGATCCTCAACTCCGGC
+GGCGCCAATGCCTGCACCGGGCCGGCCGGCTTCGCCGACACCCACGCCACCGCGGAGGCGGTGGCCGCGG
+CGTTGTCGGACTGGGGAACCGAGACCGGGGCCATCGAGGTCGCCGTCTGCTCCACCGGGCTGATCGGCGA
+CCGGCTGCCGATGGACAAGCTGCTCGCCGGCGTCGCCCACGTGGTGCACGAGATGCATGGCGGGCTGGTC
+GGCGGCGATGAAGCCGCCCACGCCATCATGACCACCGACAACGTGCCCAAACAGGTTGCGCTGCACCATC
+ACGACAACTGGACGGTCGGCGGCATGGCCAAAGGCGCGGGCATGCTGGCGCCGTCGTTGGCCACCATGCT
+GTGCGTGCTCACCACCGACGCGGCCGCCGAGCCGGCCGCACTCGAGCGGGCGCTGCGCCGCGCCGCCGCG
+GCCACGTTCGACCGGCTCGACATCGACGGCAGCTGCTCCACCAACGACACCGTGCTGCTGCTGTCGTCCG
+GGGCCAGTGAAATCCCCCCTGCCCAGGCCGATCTCGACGAGGCCGTGCTACGGGTCTGCGACGATTTGTG
+CGCCCAGCTGCAGGCCGACGCCGAAGGCGTCACCAAACGCGTCACCGTGACCGTGACCGGGGCCGCCACC
+GAAGACGACGCGCTGGTCGCCGCCCGCCAGATCGCCCGCGACAGCCTGGTCAAGACCGCGCTGTTCGGGT
+CCGACCCGAACTGGGGACGGGTGCTCGCCGCCGTCGGGATGGCACCGATCACCCTCGACCCGGATCGAAT
+CAGCGTGTCGTTCAACGGTGCCGCGGTGTGTGTGCACGGTGTCGGCGCTCCCGGTGCGCGCGAGGTGGAC
+CTGTCGGACGCGGACATCGATATCACCGTCGACCTCGGCGTCGGCGACGGGCAGGCGAGGATCCGAACCA
+CTGATCTGTCGCATGCCTACGTCGAAGAGAACTCGGCCTACAGCTCATGAGCCGCATCGAAGCACTGCCC
+ACCCACATCAAAGCGCAGGTGCTGGCCGAGGCCCTGCCCTGGCTCAAGCAGTTGCACGGCAAGGTCGTCG
+TCGTCAAATACGGCGGCAACGCGATGACCGACGACACGCTGCGGCGCGCGTTCGCCGCCGACATGGCGTT
+TCTGCGCAACTGCGGCATCCATCCCGTCGTGGTGCACGGCGGGGGGCCGCAGATCACCGCCATGCTGCGG
+CGGCTCGGCATCGAGGGCGACTTCAAGGGCGGATTCCGGGTCACCACACCCGAAGTGCTCGACGTGGCCC
+GGATGGTGCTGTTCGGTCAGGTGGGCCGGGAACTGGTCAACCTGATCAACGCGCACGGACCGTATGCCGT
+CGGGATCACCGGCGAGGACGCGCAGCTGTTCACCGCCGTGCGGCGCAGCGTCACCGTCGACGGCGTGGCC
+ACCGACATCGGCCTGGTCGGCGACGTCGACCAGGTGAACACCGCGGCAATGCTGGATCTGGTTGCGGCGG
+GCCGGATCCCGGTGGTGTCCACGCTGGCCCCGGATGCCGACGGCGTGGTGCACAACATCAACGCCGACAC
+CGCCGCCGCGGCGGTCGCCGAAGCCCTGGGCGCCGAAAAGCTGTTGATGCTCACCGATATCGACGGCCTG
+TACACCCGCTGGCCGGATCGCGACTCGCTGGTCAGCGAGATCGACACCGGCACACTGGCGCAACTGCTGC
+CGACGCTGGAATCGGGCATGGTCCCCAAGGTCGAAGCGTGCCTGCGGGCGGTCATCGGCGGGGTGCCCAG
+CGCGCACATCATCGATGGGCGGGTCACACACTGCGTGTTGGTGGAGTTGTTCACCGACGCGGGCACCGGC
+ACCAAGGTGGTGCGCGGATGACCGGCGCTTCGACCACGACGGCGACCATGCGGCAGCGGTGGCAAGCCGT
+GATGATGAACAACTACGGCACCCCCCCGATAGCGCTGGCCAGCGGTGACGGCGCCGTGGTCACCGACGTG
+GACGGCAGAACCTATATCGACCTGCTCGGCGGCATCGCGGTCAACGTGCTGGGCCATCGCCACCCCGCGG
+TCATCGAGGCCGTCACCCGGCAGATGTCGACGCTGGGGCACACCTCCAACCTGTATGCCACCGAACCGGG
+CATCGCGCTGGCCGAGGAGCTGGTCGCGCTGCTGGGGGCCGACCAGCGGACGCGAGTGTTCTTCTGCAAC
+TCCGGCGCCGAGGCCAACGAGGCGGCGTTCAAGCTGTCTCGGCTCACCGGACGCACGAAACTGGTCGCCG
+CCCACGACGCCTTCCACGGCCGCACCATGGGCTCGCTGGCGCTCACCGGACAACCGGCCAAGCAAACGCC
+GTTCGCGCCGCTGCCCGGCGACGTCACGCACGTCGGCTACGGCGACGTCGACGCGTTGGCCGCCGCCGTC
+GATGACCACACCGCCGCGGTGTTCCTGGAACCGATCATGGGGGAGAGCGGGGTCGTCGTCCCGCCCGCGG
+GCTACCTTGCCGCCGCCCGCGACATCACGGCGCGGCGCGGCGCGCTGCTGGTGCTCGACGAGGTGCAAAC
+CGGGATGGGCCGCACCGGAGCGTTCTTCGCCCACCAGCACGACGGCATCACCCCGGACGTGGTGACCCTG
+GCCAAGGGTCTGGGCGGCGGGCTGCCGATCGGTGCCTGCCTGGCCGTCGGGCCGGCCGCCGAACTACTGA
+CCCCAGGCCTGCACGGCAGCACCTTCGGCGGCAACCCGGTCTGCGCCGCGGCGGCGCTGGCGGTGCTACG
+GGTGCTGGCGAGCGACGGCCTGGTCCGCCGCGCCGAAGTCTTGGGCAAATCGTTGCGGCACGGCATCGAA
+GCGCTCGGCCACCCGCTCATCGACCACGTGCGCGGACGCGGACTGCTGTTGGGCATCGCGCTGACCGCCC
+CGCACGCCAAGGACGCCGAGGCCACCGCCCGCGACGCCGGTTACCTGGTCAACGCGGCCGCACCCGACGT
+CATCCGGTTGGCGCCGCCGCTGATCATCGCCGAAGCACAGCTCGACGGCTTTGTCGCCGCCTTGCCGGCA
+ATCCTGGACCGCGCCGTGGGGGCCCCGTGATCAGGCATTTCCTGCGCGACGACGATCTGTCCCCGGCCGA
+ACAGGCCGAGGTGCTCGAGCTCGCGGCCGAGCTGAAGAAAGACCCGGTTAGCCGTCGTCCCCTGCAAGGG
+CCGCGCGGGGTGGCGGTCATCTTCGACAAGAACTCCACCCGCACCCGGTTCTCCTTCGAGCTGGGCATCG
+CGCAGCTGGGCGGGCATGCCGTCGTCGTCGACAGCGGCAGCACCCAGCTGGGCCGCGACGAAACCCTGCA
+GGACACCGCAAAGGTGTTGTCCCGCTACGTCGATGCCATCGTCTGGCGAACCTTCGGCCAAGAGCGGCTG
+GACGCCATGGCGTCGGTCGCGACGGTGCCCGTGATCAACGCGCTCTCCGATGAGTTCCATCCGTGTCAGG
+TGTTGGCCGACCTGCAGACCATCGCCGAACGCAAGGGGGCGCTGCGCGGCCTGAGGTTGTCCTACTTCGG
+CGACGGCGCCAACAACATGGCCCACTCGCTGCTGCTCGGCGGGGTCACCGCGGGTATCCACGTCACCGTC
+GCGGCTCCCGAGGGCTTCCTGCCCGACCCGTCGGTGCGGGCCGCGGCCGAGCGCCGCGCCCAGGATACCG
+GCGCCTCGGTGACTGTGACCGCCGACGCCCACGCGGCCGCCGCCGGCGCCGACGTTCTGGTCACCGACAC
+CTGGACGTCGATGGGCCAGGAAAACGACGGGTTGGACCGAGTGAAGCCGTTTCGGCCGTTTCAGCTCAAC
+TCGCGACTTCTGGCGCTGGCCGACTCGGATGCCATCGTGTTGCATTGCCTGCCGGCCCATCGCGGCGACG
+AGATCACCGACGCGGTGATGGACGGGCCGGCCAGCGCGGTGTGGGACGAGGCCGAAAACCGGCTGCACGC
+GCAGAAGGCGCTGCTGGTGTGGCTGCTGGAGCGCTCATGAGCCGCGCCAAGGCCGCGCCCGTTGCGGGGC
+CCGAGGTCGCCGCAAACCGCGCCGGCCGCCAGGCGCGCATCGTGGCGATCCTGTCGTCGGCGCAGGTGCG
+CAGCCAAAACGAACTGGCGGCGCTGCTGGCCGCCGAGGGCATCGAGGTCACCCAAGCCACACTGTCACGC
+GATCTGGAAGAGCTCGGCGCGGTGAAACTGCGCGGCGCGGACGGCGGCACCGGCATCTACGTGGTGCCCG
+AGGACGGCAGCCCGGTGCGCGGCGTCTCGGGCGGTACCGACCGGATGGCGCGGCTGCTCGGTGAGCTGCT
+GGTGTCGACCGACGACAGCGGCAACCTCGCGGTGTTGCGCACCCCGCCGGGCGCGGCGCACTACCTGGCC
+AGCGCCATCGACCGCGCGGCCCTGCCCCAGGTCGTCGGCACCATCGCCGGTGATGACACCATCCTGGTGG
+TGGCCCGCGAGCCGACGACCGGCGCGCAACTGGCCGGCATGTTCGAGAACCTTCGGTAAGGAGAGTCATG
+TCAGAGCGCGTCATCCTGGCCTATTCCGGCGGTCTGGACACCTCGGTGGCGATCAGCTGGATAGGCAAGG
+AGACCGGCCGTGAGGTGGTGGCGGTGGCGATCGACCTCGGGCAGGGCGGCGAGCACATGGACGTCATACG
+GCAGCGGGCGCTGGACTGCGGCGCGGTGGAGGCTGTCGTCGTCGACGCCCGCGACGAGTTCGCCGAAGGC
+TACTGCCTGCCCACCGTGCTGAACAACGCGCTGTACATGGACCGCTACCCGCTGGTGTCGGCGATCAGCC
+GGCCGCTGATCGTCAAACACCTGGTCGCCGCGGCGCGCGAGCACGGCGGCGGCATCGTCGCGCACGGCTG
+CACCGGCAAGGGCAACGACCAGGTCCGGTTCGAAGTCGGGTTCGCCTCGCTGGCACCGGATTTAGAGGTG
+TTGGCGCCGGTGCGCGACTACGCGTGGACGCGGGAGAAGGCGATCGCGTTCGCCGAGGAGAACGCGATCC
+CGATCAACGTCACCAAACGTTCGCCGTTCTCCATCGACCAGAACGTCTGGGGCCGCGCGGTGGAGACCGG
+CTTCTTAGAGCACCTGTGGAATGCCCCAACCAAGGACATCTACGCCTACACCGAAGACCCCACGATCAAC
+TGGGGGGTCCCCGACGAGGTGATCGTCGGCTTCGAACGCGGCGTGCCGGTGTCCGTCGACGGCAAGCCGG
+TGTCGATGCTGGCGGCGATCGAGGAGCTCAACCGCCGCGCCGGAGCGCAAGGTGTCGGGCGCCTCGACGT
+CGTGGAGGATCGGCTGGTGGGCATCAAGAGCCGCGAGATCTACGAGGCGCCCGGCGCGATGGTGCTGATC
+ACCGCGCACACCGAACTCGAACACGTCACCCTGGAGCGTGAGCTGGGCCGGTTCAAACGCCAGACCGACC
+AGCGCTGGGCCGAACTGGTCTACGACGGGCTGTGGTACTCGCCGCTGAAGGCCGCGCTGGAGGCTTTCGT
+CGCCAAGACCCAGGAGCACGTGTCCGGCGAGGTGCGGCTGGTGCTACACGGCGGCCACATCGCGGTCAAC
+GGCCGGCGCAGCGCGGAATCGTTGTACGACTTCAACCTGGCCACCTACGACGAGGGCGACAGCTTCGACC
+AGTCCGCCGCCCGCGGCTTCGTCTACGTGCACGGGCTGTCCTCCAAGCTCGCCGCCCGCCGGGATCTGCG
+GTGACGGTTCTCCCGCGAGCAGACGCAGAATCGCACCGCCACGCCCGTCGGCGTGCGATTCTGCGTCTGC
+TCGCCACAGAAAAGTGAGCACCAACGAGGGGTCGCTGTGGGGCGGGCGGTTCGCCGGCGGCCCGTCCGAC
+GCGCTGGCCGCGCTGAGCAAGTCCACCCACTTCGACTGGGTGCTGGCCCCCTACGACCTCACCGCGTCGC
+GGGCGCACACCATGGTGCTGTTTCGGGCCGGGCTGCTCACCGAGGAGCAACGCGACGGGCTGCTCGCCGG
+CCTGGACAGCCTCGCCCAAGACGTCGCCGACGGCAGCTTCGGCCCGCTGGTCACCGACGAGGACGTGCAT
+GCCGCGCTGGAGCGGGGCCTGATCGACCGGGTCGGACCGGACCTGGGCGGCCGGCTGCGGGCCGGGCGCT
+CGCGCAACGACCAGGTGGCCGCGCTGTTTCGGATGTGGCTGCGCGACGCGGTGCGCCGGGTCGCCACCGG
+TGTGCTCGACGTGGTCGGTGCGCTGGCAGAGCAGGCCGCCGCACACCCGAGCGCCATCATGCCCGGCAAA
+ACCCACCTGCAGTCCGCCCAGCCGATCCTGCTGGCACACCATCTGCTCGCGCACGCCCACCCCCTGCTGC
+GCGACCTGGACCGCATCGTCGACTTCGACAAACGCGCGGCGGTGTCCCCGTACGGCTCGGGCGCCTTGGC
+CGGCTCGTCGCTGGGCCTGGATCCCGACGCGATCGCCGCGGACCTCGGTTTCTCGGCTGCCGCGGACAAC
+TCCGTCGACGCGACCGCCGCCCGCGACTTCGCCGCCGAGGCGGCGTTCGTGTTCGCCATGATCGCCGTCG
+ACCTGTCCCGGCTGGCTGAGGACATCATCGTCTGGAGCTCGACGGAATTCGGCTACGTCACGTTGCATGA
+CTCGTGGTCCACCGGTAGCTCGATCATGCCGCAGAAGAAGAATCCGGACATCGCCGAGCTGGCCCGCGGC
+AAGTCCGGGCGGCTGATCGGAAACCTGGCCGGGCTGCTGGCCACCCTGAAAGCCCAGCCCCTGGCCTACA
+ACCGCGACCTGCAGGAAGACAAGGAGCCGGTGTTCGATTCGGTGGCCCAGCTGGAGCTGCTGCTGCCGGC
+GATGGCCGGGCTGGTGGCCAGCCTGACCTTCAATGTCCAGCGGATGGCGGAGCTGGCCCCGGCCGGCTAT
+ACGTTGGCCACCGATCTCGCCGAATGGCTTGTGCGGCAAGGTGTTCCGTTTAGGTCCGCGCATGAGGCCG
+CGGGTGCGGCGGTGCGTGCGGCCGAACAGCGCGGCGTGGGGCTGCAGGAACTCACCGACGACGAGCTGGC
+CGCCATCAGCCCCGAGCTGACCCCGCAAGTCCGCGAGGTGCTGACCATCGAAGGCTCGGTGTCGGCCCGC
+GATTGCCGGGGTGGCACCGCGCCGGGCCGGGTTGCCGAGCAACTGAACGCCATTGGTGAAGCCGCCGAGC
+GGCTGCGCCGCCAGCTGGTGCGCTGAGGGGGCCTCGAAACTTTGCCGGCCAGTTCCAGGCGGGCTAAACT
+TCGGGCTCTAGGCGACCCGGTTGAACCATTCGGCCTCGATGTGCGTGTCAAAGGGGTGGGACCAGTGAGC
+GTCATCGCAGGTGTGTTCGGCGCGTTGCCGCCGTATCGCTATTCACAACGCGAGCTCACCGACTCGTTTG
+TCAGCATCCCGGATTTCGAGGGCTACGAAGACATCGTTCGCCAGCTGCACGCCAGCGCCAAAGTCAACAG
+CCGCCACCTGGTCTTGCCGCTGGAGAAATACCCGAAGCTGACCGACTTCGGCGAGGCGAACAAGATTTTC
+ATCGAAAAAGCCGTGGACTTGGGCGTGCAAGCCCTGGCGGGGGCACTCGACGAGTCCGGTCTGCGACCCG
+AGGATCTCGACGTGTTGATCACCGCCACGGTCACCGGACTGGCGGTGCCGTCGCTGGATGCCCGGATCGC
+CGGGCGGCTGGGGCTGCGCGCCGATGTCCGGAGGGTGCCGCTGTTCGGGCTGGGCTGCGTGGCCGGGGCG
+GCCGGGGTCGCCCGGCTGCACGACTACCTGCGCGGGGCCCCGGACGGCGTTGCCGCGTTGGTCTCGGTCG
+AGCTGTGTTCACTCACGTATCCGGGATACAAGCCGACGCTGCCGGGCCTTGTCGGCAGTGCGTTGTTTGC
+TGACGGCGCCGCGGCGGTGGTGGCCGCAGGTGTGAAGCGCGCCCAGGACATCGGCGCCGACGGGCCGGAC
+ATCCTGGATTCGCGCAGCCATCTGTACCCCGACTCGCTGCGCACCATGGGATACGACGTCGGCTCGGCCG
+GGTTCGAGCTCGTCCTATCACGGGACTTGGCGGCCGTGGTCGAGCAGTATCTGGGCAATGACGTCACCAC
+CTTCCTGGCTTCGCACGGCCTGAGCACCACCGACGTCGGCGCCTGGGTCACCCATCCCGGGGGACCCAAG
+ATCATCAACGCCATCACCGAGACCCTCGACCTGTCGCCGCAGGCTCTCGAGCTGACGTGGCGCTCGTTGG
+GCGAAATCGGGAATCTGTCGTCAGCGTCGGTGCTGCATGTGCTGCGTGACACCATCGCCAAACCGCCCCC
+CAGCGGAAGTCCCGGGTTGATGATCGCCATGGGCCCAGGCTTCTGTTCCGAACTCGTGTTGCTGCGCTGG
+CACTGATGCTGGATTCCGCGAGCGTAACGCCACTGCGCTATTCGGATCGCAATCTCGCAGTGACGTTACG
+CTCGGCGGACCTCGTGCCATGAACAGCACTCCCGAAGACCTCGTCAAGGCCCTGCGCAGATCGCTCAAGC
+AAAACGAGCGACTGAAGCGAGAGAACCGGGATCTTCTTGCCCGGACCACCGAGCCGGTGGCGGTGGTGGG
+GATGGGATGCCGCTATCCGGGTGGGGTGGATTCGCCGGAGACGCTGTGGGAGCTGGTGGCACACGGCCGT
+GACGCGGTTTCGGAGTTCCCGGCGGATCGCGGCTGGGATGTGGCGGGGTTGTTTGACCCCGATCCCGACG
+CGGTAGGCAAGTCGTATACCCGGTGCGGCGGGTTCTTGACGGATGTCGCCGGTTTTGACGCCGAGTTTTT
+CGGGATCGCACCCAGCGAGGCGCTTGCGATGGATCCCCAGCAGCGGTTGCTGTTGGAAGTGTCGTGGGAA
+GCGTTGGAGCGGGCGGGCATCGACCCAATCACGTTGCGGGGTTCGCAGACGGGCGTGTTCGCCGGGGTGT
+TCCACGGCTCGTATGGGGGCCAAGGCCGGGTGCCGGGTGACCTGGAGCGCTACGGGCTGCGTGGCTCGAC
+GCTGAGCGTGGCCTCCGGGCGGGTGGCGTATGTGTTGGGCCTGCAGGGCCCGGCGGTGTCGGTGGATACC
+GCGTGTTCGTCGTCGTTGGTGGCACTGCATTTGGCGGTGCAGTCACTGCGCCTCGGCGAATGCGACCTGG
+CGCTGGTCGGTGGGGTCACCGTGATGGCCACCCCGGCGATGTTCATCGAGTTCAGCAGGCAGCGGGCGCT
+GTCCGCCGATGGTCGTTGTAAGGCCTATGCGGGTGCCGCCGATGGGACCGCGTTTGCCGAGGGCGCCGGG
+GTGCTCGTGCTGGCGCGGTTGGCTGACGCGCGCCGGTTGGGGCATCCGGTGCTGGCGCTGGTGCGCGGAT
+CGGCGGTCAATCAGGACGGCGCCTCCAACGGGCTGGCCACGCCGAATGGGCCGGCGCAGCAACGGGTGAT
+CACTGCGGCGCTGGCCAGTGCGCGGTTAGGTGTCGCCGACGTGGATGTGGTCGAGGGGCACGGGACGGGC
+ACCACGTTGGGGGATCCCATTGAGGCGCAGGCGATTTTGGCGACGTATGGACAGCGGCCGGCCGATCGGC
+CGTTGTGGCTGGGGTCGATCAAATCGAACATCGGTCATACGTCGGCGGCTGCGGGGGTCGCCGGGGTGAT
+CAAGATGGTGCAGGCGATGCGCCACGGCGTGCTGCCCAAGACGTTGCACGTGGATGTGCCGACGCCGCAT
+GTGGATTGGTCGGCGGGGGCGGTGTCGTTGTTGACCGAGCCGCGGCCGTGGCACGTGCCGGGCCGGCCGC
+GGCGGGCCGGTGTGTCGTCGTTCGGGATCAGCGGCACCAACGCACATGTGATTCTGGAAGAGGCACCGGC
+AGTGGAACCGGTTGGCGCGGCCCATGGCAACGACCCGGTGGCGGTGCCGTGGGTGCTGTCGGCGAGGTCG
+GCGCAAGCGTTGACCAACCAGGCGCGACGGCTGTTGGCCTGGGTGGGCGCCGATGAGAACGTGCGCCCGC
+TCGATGTGGGGTGGTCGCTGGTCAACACCCGGTCGCTGTTTGATCATCGGGCCGTGGTCGTGGGCGCCGA
+CCGCACTCAGCTGATGGAAGGGCTGACGGGTCTGGCGGCCGGCGTGCCCGGCGCCGACGTGGTGGCGGGC
+CGCGCCCAGACGGTGGGCAAGACGGCATTCGTGTTCCCGGGCCAGGGCGCGCAGTGGCTGGGCATGGGAG
+CCCAGTTATGTGCTACCGCACCGGTGTTCGCCGAACATATCCATCGCTGCGAACGGGCGCTGCGTGAGCA
+CGTGGAGTGGTCGCTGCTCGACGTGCTGCGCGGGGCACCCGGCGCACCGGGGCTGGATCGGGTGGATGTG
+GTGCAGCCGGCGTTGTGGGCGGTGATGGTGTCGCTGGCCGAATTGTGGCGGTCGGTGGGTGTGGTTCCCG
+ACGCGGTCATCGGGCATTCGCAGGGGGAGATCGCGGCGGCATATGTGGCGGGCGCCCTGTCGCTTTGGGA
+CGCGGCTGCGGTGGTGGCACTGCGCAGCCGGTTGCTGGTGCGGTTGGGCGGTGCCGGCGGCATGGTCTCG
+TTGGCCTGTGGCCAGCCGCAGGCCGAGAAGTTGGCGTCCCAATGGGGAGACCGACTGAATATCGCTGCAG
+TCAATGGTGTCTCGTCGGTCGTGCTGGCCGGCGAGACGGATGCCGTGACGGAGCTGATGCAGCGATGTGA
+GGCCGAAGGCATTCGTGCCCGCAGGATCGACGTCGACTACGCGTCACACTCGGCGCAGGTGGACGCGATC
+CGGGAGGAGCTCATCGCGGCGCTGCGAGGTATCGAACCCCGTACTTCCACGGTGGCGTTCTTCTCCACTG
+TCACCGGCGAACTCATGGATACCGCCGGTGTGAACGCCGAGTACTGGTACCGAAGCATCCGCCAGCCGGT
+GCAGTTCGAACGCGCCGTCCGCAACGCCTTCGACGGCGGATACCGGGTGTTCGTCGAATCCAGCCCCCAT
+CCGGTCCTGATCGCCGGCATCGAAGAGACGTTGGTCGACTGTGATCGCGGCGCTACGGGTGAACCGATTG
+TCATTCCGACGCTGGGTCGCGATGACGGCGGGGTGGGCCGGTTTTGGCTGTCGGCGGGGCAGGCCCACGT
+TGCGGGCGTGGGTGTTGACTGGCGTGCCGCGTTTGCCGACCTGGGAGGCCGCCGGGTGGAGTTGCCGACG
+TACGCGTTTGCGCGCCAGCGGTTCTGGCTAGACGGCCTAGGTGCTGTTGGCGGCGATCTGGGTGGTGTCG
+GCTTGGTGGGCGCCGAGCATGGATTGTTGGCTGCAGTGGTGCAACGGCCCGACTCGGGTGGGGTGGTGTT
+GACGGGCCGGATATCGGTGGTCGCTGCGCCGTGGCTGGCCGATCATGCGGTGGGCCCGGTGGTGCTGTTC
+CCGGGCACAGGGTTTGTTGAGTTGGCCTTGCGGGCCGGTGACGAGGTGGGTTGTTCGGTGCTGCAGGAGT
+TGACGTTGCAGGCACCGTTGGTGCTGCCGGCAGATGGGGTGCGGGTCCAGGTGGTGGTGGGCGGCGTCGA
+GCAGTCGGGTACTCGGAATGTGTGGGTGTATTCGGCTGCCGGCCAGGCGGATTCGAGTCCGGGATGGACG
+TTGCACGCGCAGGGCGTGTTGGGGGTTGGCTCGGTGCAGCCGGCCGCGGAGCTGTCGGTGTGGCCGCCGG
+TTGGGGCACGGGCGATGGACGTCGCCGACGGGTATCAGGTGTTGGCGGCGCGGGGGTATGGGTATGGGCC
+GGCGTTTCGGGGTTTGCAGGCCTTGTGGCGGCGGGGGGCCGAGGTGTTCGCCGACGTCACTCTCCCTGAG
+GGTGTGCCGATACGGGGGTTTGGGATTCATCCGGCGGTGTTGGATGCGGCGTTGCATGCGTGGGGAATTG
+TCGAGGGTGAGCAGCAGACGATGTTGCCGTTCTCGTGGCAGGGGGTGTGTTTGCACGCAAGCGGGGCTGC
+GCGGGTCCGTGTGCGACTGGCGCCGGTGGGCCGGGGGGCGGTGCCGGTGGAGTTGGCCGATCCGCAGGGG
+TTGCCGGTGTTGTCGGTGCGGCAGTTGATGGTTCGTCCGGTCTCAGCGGCCGCGTTGTCGAGGTCGACCG
+CCGGCGACCGGGGATTGCTGGAGATGATCTGGACACCGGTGCCGTTGGAGGGCGGCGACATTGGCGACGA
+CGCCGTGGTGTGGGAGCTGCCGCCTCACGCCGGCGCGCAGGCCGGCGGGGATGTGCTGGCAGCGGTGTAC
+CGGGGTGTGCACGAGGTGTTGGAGGTGTTGCAGTCGTGGTTGGCTAGCGATGCGACCGGTCTGGGTGTGG
+TGGTGACGCGTGGGGCGGTGGGTCCGGTTGATGACGATGTCACCGATTTGGCGGGTGCTGCGGTGTGGGG
+GTTGGTGCGCTCTGCCCAGGCTGAACATCCGGGCCGGGTGGTGTTGGTGGATACCGATGGGTCGGTCGCT
+GTCGAGGATGCGGTTGGTTTCGGCGCACGCTCGGGTGAGCCGCAGCTGGTGGTTCGTCGAGGCCGGGTAT
+ATGCGGCACGGTTGGCCCCGGTAGCGGCCGGGTTGACTTTGCCTTCGGCGTCGGCTGGGGGCTGGCGGTT
+GGTTGCCGGTGGTGGGGGGACTTTGGCGGATGTGGTGGTGGCGCCCGTTGCTCCGGTGGAGCTGGCGACG
+GGGCAGGTGCGGGTGGCCGTGGGTGCGGTGGGGGTCAATTTCCGGGATGTGTTGGTGGCGTTGGGGATGT
+ATCCCGGCGGCGGGGAACTGGGTGTCGACGGGGCAGGGGTGGTCGTTGAAGTCGGCCCGGGGGTAACCGG
+TTTGGCCGTTGGTGACCGGGTGATGGGGTTATTGGGGCTGGTGGGTTCGGAGGCGGTGGTGGATGCGCGG
+TTGGTAACCATGGTGCCGGCGGGCTGGTCGTTGGTGGAGGCAGCGGCCGTGCCGGTGGCGTTTCTGACGG
+CGTTTTACGGGCTGTCGGTGTTGGCGGAGGTCGCGGCGGGGCAGAAGGTGTTGGTGCATGCCGGCACCGG
+CGGGGTTGGTATGGCAGCGGTGTCGTTGGCGCGGTATTGGGGTGCAGAGGTTTTCGTCACGGCGAGTCGC
+GCCAAGTGGGATACATTGCGGGCGATGGGTTTTGACGATATCCATATCTCCGACTCGCGATCGTTGGAGT
+TCGAGGAGGCGTTTCTGCGGGCCACCGAGGGCAGCGGTGTGGACGTAGTGCTGAACTCGCTCGCCGGTGA
+GTTCACCGATGCCTCGCTGCGGCTACTGCCCAGCGGTGGCCGCTTTATCGAGCTGGGTAAAACCGATATT
+CGCGACGGGCAGACGGTGGCCGAGCGGCATCGGGGGGTGCGGTATCGGGCGTTCGATTTGGTCGAAGCCG
+GCCCAGACCGCATTGCGGCGATGCTTTCCGAGGTAGTGGGGTTGCTAGCGGCCGGAGTGTTGGCGCGGTT
+GCCGGTCAAGACTTTTGATGCGCGATGCGCCCCGGCGGCCTACCGGTTTGTCAGTCAGGCCCGTCATATC
+GGCAAGGTCGTGTTGACCATCCCCGATGGTCCGGGTGGGCAGTCCGGGTTGGCGGGGGGCACCGTGGTGG
+TCACTGGGGGGACCGGCATGGCCGGTTCGGCGGTGGCTACCCATTTGGTCCGGCGACATGGGGTGGCCAA
+TCTGGTTCTGGTCAGCCGAAGCGGTGAGCAGGCCGACAGGGCGGCAGAAGTCGCGGCCCTGTTGCGCGAG
+GGCGGGGCCCAGGTGGCGGTGGTCTCCTGTGATGTGGCTGATCGTGATGCGCTGGCGGCATTGTTGGCGG
+GTCTGGATCCGCGCTATCCGCTTAAAGGGGTGTTTCATGCCGCTGGGGTGTTGGACGATGCCGTGATCAC
+GGGCTTGACACCGGATCGGGTGGATACGGTGTTGCGGGCCAAGGTCGATGGGGCCTGGAATCTGCACGAG
+CTAACCGAGGACATGGATTTGTCGGCGTTTGTGGTGTTTTCGTCGATGGCCGGGATTGTGGGCACACCGG
+CTCAGGGGAATTATGCTGCGGCGAATGCGTTTTTGGACGGGTTGGTGGCCTATCGGCGCTCGCGTGGGCT
+GGCCGGATTGTCGGTGGCGTGGGGACTGTGGGAGCAGGCCTCGGCGATGACCCGGCACCTCGGCGAGCGG
+GATCGCGCCAGGATGACGCAGGCCGGGCTCGCTCCGCTAACCACCGAGCAGGCGCTAGGGTTCCTGGACA
+CTGCGCTGCAGGCCGATCGCGCGGTGGTAGTGGCGGCCCGGCTGGATCGTGCCGCGCTGGCCGGCGCTGG
+TGCTGCGCTACCGGCATTATTCAGCCAGTTGGCTGCCGGTCCGACCCGGCGGAGGATCGACGCCGCCGAT
+ACGGCGGTGTCGATGTCGGGCTTAGTCAGCCGGCTGCATGCGCTCACGCCCGAGCGGCGGCAGCGCGAAC
+TCACCGATTTGGTGATCAGCAATGCCGCGGCGGTGTTGGGTCGTTCCAGCAGTGTCGATATCAACGCTCA
+CAAAGCATTCCAAGATCTCGGGTTCGATTCCTTGACCGCCGTGGAGCTGCGCAACCGACTCAAGACCGCC
+ACCGGGCTCACGTTGTCGCCCACGCTGATCTTCGACTACCCCACGCCGGCCACGCTGGCCGAACACCTCG
+ACAGCCGGCTAGTCACCGCCAGCGGTAGCGATCAACAAAGCCTGTCAGACCGTGTTGACGACATCACCCG
+CGAGCTAGTTGTGCTGCTTGACCAACCCGACTTGAGCGCCAACGTCAAAGCGCACCTGCGCACCCGCCTG
+CAAACCATGTTGACCAGCCTGACCACTGAAGACGACGACATCGCCGCCGCGACCGAAAGCCAGCTTTTCG
+CCATCCTCGACGAGGAACTCGGCTCCTAACCCCCCGCAAGGAACACCAATGTCGGGAACCACCACGCATG
+TTGACTACCTGAAGCGTCTCACGGCAGATCTGCGGCGCACCCGCAGACGCCTGTCCGACTTGGAAGCCAA
+GTTGTCCGAGCCGGTTGCGGTGGTCGGAATGGGATGCCGTTATCCAGGTGGGGTGGATTCGCCGGAGACG
+TTGTGGGAGCTGGTGGCCCAGGGCCGTGATGCGGTATCGGATTTTCCGGCGGATCGCGGGTGGGATGTGT
+ACGGGTTGTTTGATCCTGACCCGGATGCATGCGGGAAGATGTATACCCGCCGCGGGACGTTTCTGGAGCA
+TGCGGGTGACTTCGACGCCGGATTCTTTGGAATCGGTCCTAGCGAGGCGCTGGCGATGGACCCGCAACAG
+CGCCTGCTATTGGAAGTGTCGTGGGAAGCGTTGGAGCGTACGGGAATTGACCCGACCAAGTTGCGGGGTT
+CGGCAACGGGTGTGTTCGCCGGTGTTATCCATGCTGGCTATGGGGGCCAGCTATCCGGCGAGCTGGAAGG
+CTATGGGTTAACGGGTTCGACGCTGAGTGTGGCCTCCGGGCGGGTGGCGTATGTGCTGGGGTTGGAGGGT
+CCGGCGGTGTCGGTGGACACGGCGTGCTCGTCGTCGTTGGTGGCGCTGCATTTGGCGGTGCAGTCGCTGC
+GGTCGGGGGAATGCGATTTGGCGCTGGCCGGTGGGGTGACGGTGATGGCCACCCCCGCCGCATTCGTCGA
+GTTCAGCCGGCAGCGGGCGCTGGCGCGCGACGGTCGGTGCAAGGTATACGCCGGTGCCGCCGACGGGACC
+GCGTGGTCAGAAGGCGCCGGGGTGCTGGTGGTGGAGCGGCTGGTGGATGCACGGCGGTTGGGGCATCCGG
+TGCTGGCCCTGGTGCGCGGATCGGCGGTCAATCAGGACGGCGCCTCCAACGGTTTGACGGCACCCAATGG
+GCCATCCCAGCAGCGGGTGATTCGGGCGGCGTTGGCCAGTGCGCGACTGCGCGCGGTTGAGGTGGATGTG
+GTCGAGGGGCACGGGACCGGGACCATGCTGGGGGATCCGATTGAGGCGCAGGCGCTTTTGGCGACCTACG
+GTCAGGACCGCGTTGAGCCCCTGTGGTTGGGGTCGATCAAATCGAACATCGGTCATACATCGGCGGCGGC
+GGGGGTGGCCGGGGTGATCAAGATGGTGCAGGCGATGCGGCATGGGGTGATGCCCAAGACATTGCATGTG
+GATGTTCCTACGCCGCATGTGGATTGGTCGGTGGGGGCGGTGTCGTTGTTGACTCAACCGCGGGCGTGGT
+CGGTTCACGGCCGGCCGCGGCGGGCCGGGGTGTCGTCGTTCGGGATCAGCGGCACCAATGCGCATGTGAT
+TCTTGAGCAGGCACCGGTAGTTGAAAGTGTTGTGCCAGAAGTTGCATCCCCAACAGCGGCGTCCGCCGTG
+CCGTGGGTGCTGTCGGCCCGGTCGGAGCAGGCGTTGGCCGGTCAGGCGCAGCGGCTGCTGGCTTTCGTCG
+CGGCCAACCCGGATTTGGATCCGATCGATGTGGGGTGGTCGTTGGTCAAGACGCGGGCGATGTTCGAGCA
+TCGGGCGGTGGTCGTGGGTGCTGATCGCGGGGCCCTGCTGGCGGGGTTGGCGGCGTTGGCCGCTGGTGAG
+TCGGGTGCGGGCGTGGCAGTGGGTCGAGCGCGGTCGGTGGGGAAGACGGTGTTCGTGTTTCCCGGGCAAG
+GGGCCCAATGGGTAGGCATGGGAGCGCAGTTATATGCCGAATTACCCCTGTTCGCCCTGGCTTTTGACGC
+GGTGGCCGAAGAGCTGGATCGGCACCTGCGGCTGCCGCTGCGAAACGTGCTCTGGGAAGGTGACGAGGCG
+CTGTTGACTAGCACCGAGTTCGCCCAGCCGGCGTTATTCGCAATCGAAGTGGCGTTGGCAACGTTGTTGC
+AGCACTGGGGTATCAGCCCGGATTTCCTGATCGGACATTCGGTGGGCGAGATCGCGGCAGCACATTTGGC
+CGGGGTGTTGTCGTTGACCGATGCGGCGGGTTTGGTGGCTGCCCGCGGCAGGTTGATGGCGGAGTTGCCC
+GCCGGTGGGGTGATGGTGGTGGTGGCCGCCAGCGAAGAAGAAGTGCTGCCAGTGCTGGTCGACGGGGCGA
+ATCTCGCGGCGGTCAACGCGCCGCACTCGGTGGTGGTTTCAGGGTGCGAGGCAGCGGTCAGCGATATTGC
+CGATCACTTTGCCCGCAGGGGCCGCCGGGTGCATCGGCTAGCGGTATCACATGCGTTTCATTCGTTGCTG
+ATGGAACCGATGCTTGCCGAGTTCACGCGGATCGCTGCCGGTATTTCGGTGTCGAAACCGCGGATTCCGT
+TGGTGTCCAATGTGACCGGGCAGATGGCCGGCGCAGGCTACGGCGATGGACAGTACTGGGTGGAGCATGC
+GCGGCGCCCCGTGCGATTTGTCGAGGGCGTCCAGTTGCTGAATGCGGTTGGGGCCACAAGGTTTGTTGAG
+GTGGGTCCCGGCGGTGGCCTGACAGCATTGGTCGAGCAGTCGCTGCCTTTAGGCGAGGCGCTATCGGTGG
+CGATGATGCGTAGAGAGCACCCCGAAGTGTCGTCGGTGCTCGGCGCCGTGGCGACATTGTTCACTGCGGG
+TGCCCAAATGGATTGGCCGGCGGTGTTTGGCAGTCCGGGTCGACGGATCGAATTGCCGACCTATGCGTTT
+CAGCGGCAGCGGTATTGGTTGCCGCCTACGTCGGCGGGTTCGGCAGACATCAGCGGTGTTGGTCTGCTGG
+CAGCCCGGCATGGTTTGTTGGGTGCGGTTGTGGAGCAACCGGATTCGGACGTGGTAGTACTGACCGGCCG
+GCTATCGGTGGGGGAGCAGCGGTGGTTGGCCGATCACGTGATCGCTGGAGTGGTGTTGCTCGCCGGTGCG
+GCTTTCGTGGAACTGGCGCTGCGAGCCGCCGACCAGGTGGATTGTGGGGTGGTCGAGGAGCTGACGGTGG
+TGACTCCGTTGGTTTTGCCGACGGTGGGCGGGGTGCAGCTACAGGTGGTGGTGGGTGTCGGTGAGATGGG
+TCAGCGGCCAGTGTCGATATATTCACGCAACGCTGAGTCGGATTCCGGGTGGGTGTTGCATGCCCGGGGC
+GTATTGGGGGCAAAGGCGGTTGCCCCGGCAGCGGATTTGTCGGTGTGGCCGCCGCTGGGTGCTGCCCCGG
+TTGATGTCGATGGCGCCTATCAGCGATTCGCCGAACTGGGCTATGAATATGGCCGGGCGTTTCAGGGTCT
+GACGGCCATGTGGCGGCGGGAATCGGAGCTCTTCGCCGATGTTGCCGTCCCCGACGATGTCGATGTGACG
+TTGAGTGGGTTCGGAATTCACCCACTGGTGCTGGATGCGGCCTTGCATGCAATGGGCATGGTGGGCGAGC
+AGGCAGCTACCATGCTGCCCTTCTCCTGGCAAGGGGTCTCCCTGCATGCCGCGGGTGCGTCCCGGGTTCG
+GGCGCGGATCGCGCCGGCCGGTGATGGCACGGTGTCGGTGGAGTTGGCCGATCAGGCGGGGTTACCGGTG
+TTGTCGGTACAGGCATTGGTCATGCGTTCGGTGTCGTCTCAGCTGTTGTCGGCGGCCGTCGCCGCTGCCG
+ATGCCGCAGGTCGCGGGTTGTTGGAAGTGGCGTGGTTGCCAGTGGAATTGGCGCACAACGACATCAGCGC
+CGACCTCGTGGTCTGGGAGTTGGAGTCTTTCCAGGACGGTGTGGGTCCGGTGTATTCGGCTACGCATCGG
+GTGTTGGTGGCATTGCAGTCCTGGCTGGCCCAGGAGCGGGCCGGCGGACTGGTGGTGCTGACCCAAGGGT
+CGGTCGGCCAGGATGCCACGAACTTGGCCGGCGCCGCGGTGTGGGGGTTGGTGCGGTCGGCTCAAGCCGA
+ACATCCGGGTCGGGTGATGTTGGTCGATTCGGACGGCTCGATGGATGTTGGAGATGTCATTGGCTGTGGT
+GAAGAGCAATTGATGATCCGGAACGGCACAGCCTATGCCGCCCGGCTGGCACAGCTTCGACCACAGCCGA
+TCCTGCAGTTGCCCGATACCAACTCGGGCTGGCGGTTGGTCGCCGGCGGCGCGGGCACCCTTGAGGATTT
+GACGTTGGCATCATGCCCTGCAAAGGAATTGGCACCTGGACAGGTTCGAATAGAGGTGCGGGCTTTGGGT
+GTCAATTTCCGGGATGTGTTGGTGGCGTTGGGAATATATCCCGGTGCCGCGGAGTTGGGGGCCGAAGGGG
+CAGGGGTGGTCACCGAAGTCGGTCCAGGCGTGACCGGTTTAGCAGTTGGTGATCCGGTGATGGGTCTGTT
+GGGGGTGGCGGGGTCGGAAGCGGTGGTCGATGCGCGGCTGGTGGTCAAGCTGCCGAACCGGTGGCCGCTG
+ACCGATGCTGCGGGTGTGCCGGTGGTGTTTCTGACGGCCTACTGCGCGTTACGCGTGCTGGCGCAGGTGC
+AGCCGGGCGAGTCGGTGCTGGTACACGCCGCTGCGGGCGGGGTGGGTATGGCGGCAGTGCAACTGGCTCG
+GCTGTGGGGATTGGAGGTTTTCGCTACTGCCAGTCGCGGCAAGTGGGACACGTTGCACACAATGGGATGT
+GACAACACGCATGTTGCCGATTCACGCACACTGGCATTCGAGGAGACGTTTTGGCTGACCACCGAGGGTC
+GCGGCGTGGATGTGGTGCTCAACTCGCTGGCCGGTGAGTTCACCGACGCATCGTTGCGGTTACTGCCGCG
+AGGCGGTCGCTTCATCGAGATGGGCAAAACCGAGTTCGGGACGCCCAGGTCGTTGCCCAGGACCATCCTG
+GGGTGGCCTACCGGGCTTTCGACTTGATGGAGGCCGGACCGCAGCGGATTGCGCAGATGCTGGCCGAGTT
+AGTCGAGTTGTTCAAAACTGAAGCGCTGCATCGGCTTCCAGTCAAGTCATGGGATGTGCGGCACGCTCGG
+GAGGCGTATCGGTTCTTGAGCCAGGCGCGCCATGTCGGCAAAGTGGTGCTGACCATGCCGGACGCGTGGG
+CCGCGGGCACGGTGCTGATCACCGGTGGCACTGGGATGGCAGGTTCTGCGGTGGCGCGTCATCTGGTGAG
+TCGATACGGGGTGCGGCAGGTGGTGTTGGCCAGTCGTGCTGGTGAGCACACGGAGAGCGTCGCAGCATTG
+GTGGACGAGCTCGGCTCGGCCGGCGCCCGAGTGCAGGTGGTGTCTTGCGATGTGGCCGATCGTGATGCGG
+TGGCGGGTTTGGTGGCAAGCCAACCAGATCTGACTGCAGTGTTTCATGCGGCTGGGGTTCTTGACGATGC
+GGTAATCACCGGATTGACGCCGGAGCGGGTGGATAAGGTATTGCGGGCCAAGGTCGATGGGGCCTGGAAT
+TTGCATGAGCTCACCCGGCACCTGGATGTGTCAGCGTTTGTGTTGTTTTCGTCGATGGCCGGGATTGTGG
+GTGCGCCGGGCCAGGCCAATTATGCTGCAGCGAACGCGTTTTTGGACGGGTTGGCGGCCTATCGGCGATC
+ACGTGGACTGGCCGCGTTGTCGGTGGCGTGGGGATTGTGGGAGCAGGCTTCGGCGATGACCGAGCATTTA
+GGCGAGCGGGATCGGGTCCGGATGAGTCGGGTTGGACTGGCGCCGTTGCCTACCAACCAGGCGATGGGAT
+TCCTGGATGCCGCGTTGCTGGCGGATCGGCCCGTGGTGGTGGCTGCTCGGCTGGATCGTGCCGCGCTGGC
+CGGTGCCGAGCTGCCGGCACTATTTAGCCAGTTGGTTGCCGGTCCGATCCGACGGATCATCGACGGCGCC
+GATGAGGTGTCGGGGTCGGGATTGGCGTCGCGGCTGCACGGGCTGACTCCCGAGCAGCGGCACCGCGAAC
+TCACCGAGTTAGTATGTAGCAACGCCGCGATCGTGTTGGGGCATTCCGGCACTGAGATCGACGCGCACAA
+GGCATTCCAGGATCTCGGGTTTGATTCGCTGACAGCGGTGGAGCTGCGCAACCGGCTCAAGACTGCGACC
+GGGTTGACCTTGCCACCGACCTTGATCTTTGACTACCCCACGGCCGCCGAGTTGGCCGAACACCTCGACA
+TCCAGCTGGCGAACGCCCCTGCCGTCACGGTCGACCAACCCAACCCGTCGACTCGTTTCAACGAGGTCAC
+CCGCGAACTACAAGCATTGCTCGACCAACCCAACTGGAACCCCGACGACAAAACGCGCCTGATCAAGCGA
+TTGCAAGCGATTTTGACCGATTGCACCGCTCCACCGGCCAGCTCCGGCCCGTCTACCACCCATGACGACG
+AGGACATCACCACCGCCACTGAAAGCCAGCTTTTTGCCATCCTCGACGACGAACTTGGACCTTAGCGCAC
+GTGCAACCGACAGGCATCGCAATCATCGGGCTGGCATGCAGGTTTCCCACCGTCGTCAGCCCCGGCGACC
+TCTGGGACCTGTTGCGCGACGGGCGAGAGGCTACTGGATCCATTGACAACGTCGCCGATTTCGACGCCGA
+CTTTTTCAACCTATCCCCCCGCGAGGCGAGCGCGATGGACCCCAGGCAACGACTGGCGCTCGAACTCACC
+TGGGAACTGCTCGAAGACGCTTTCGTGGTGCCGGAAACGCTGCGCGGACAACCGATCGCGGTCTACCTCG
+GAGCGATGAACGACGACTACGCAGTACTGACGCTCGCGGCGGACCGTGTTGACCATCACGCGTTCGCTGG
+CACTAGTCGGGCAATCATCGCAAACCGCGTGTCGTTTGCTTTCGGGCTGCGTGGACCAAGCGTGACGATC
+GACTCCGGTCAGTCGTCATCCCTGGTAGCGGTGCATCTGGCATGCGAAAGCGTGCGAACAGGCGAAGCGC
+CGCTGGCGATTGCCGGTGGTGTTCACCTCAACTTGGCACGCGAAACAGCCATGCTGGAACAAGAATTCGG
+CGCGGTATCGCCGTCCGGCCATACCTACGCATTCGATGAACGTGCCGACGGCTACGTACCAGGCGACGGC
+GGTGGCCTCGTTCTGCTGAAGCCGGTGCAAGCTGCCCTGGACGACGGAGATCGAATCCACGCGATCATCC
+GCGGCAGCGCGGTCGGCAACGCCGGGCACAGCGCTACCGGGCTGACCGTGCCGTCGGTCGCCGGCCAGGT
+GGACGTCATCAGGCGGGCGATGTCCGGCGCGGGGGTGGATTGCCATCAGGTTCACTACGTCGAGGCACAC
+GGGACCGGCACCAAGATCGGCGACCCGATCGAGGCGCGGGCGCTGGGTGAGATCTTCGCGGCGCGGCAAC
+GTCGCCCGGTGAGTGTGGGGTCGGTCAAGACCAATATTGGTCATACCGGGGGAGCCGCTGGAATCGCCGG
+ATTACTCAAGGCGGTGTTAGCGATTGAAAATGCCGTGATTCCACCCAGCCTCAACTACGTCGGTGCCCCA
+ATTGATTTGGATAGCCTTGGGCTTCGGGTCGACACCGCGTTGACGCCGTGGCCGGTGGCGGATGAGCCGC
+GACGGGCTGGGGTGTCGTCGTTTGGCATGGGTGGGACGAACGCGCATGTGATCCTGGAACAGGGTCCGAC
+GCAGTCGCCAGAGATAGTGGAATCTGTTGCCGCAGCGGGTAGTAACGCTCCGGTGGCGGTGCCGTGGGTG
+TTGGCTGCGCGGTCGCCGCAGGCGCTAACCAACCAGGCGGGGCGGTTGTTGGCGCACCTGACTGCCGACG
+ACGGCCTGACCGCGCTCGATGTGGGGTGGTCGTTGGTGAGTACCCGGTCGGTGTTCGACCATCGCGCGGT
+GGTGGTGGGCGCTGATCGGGGGCGTCTGATGGCGGGGTTGGCGGGGTTGGCCGCCGGTGAGCCGGGCGCG
+GGTGTGGTGGTGGGTCGTGCGCGGTCGGTGGGCAAGACGGTGTTTGTGTTTCCCGGACAGGGGTCGCAGT
+GGCTGGGGATGGGCCGGCAGTTGTACGGCCGGTACTCGGTGTTTGCCCGGGCTTTTGACGAGGTCGTTGC
+GGTGTTGGATGGGCAGCTGCGGCTGTCTGTGCGGCAGGTGATGTGGGGCGCCGATGCCGGGCTATTGGAA
+AGCACAGAGTTTGCTCAGCCGGCGTTGTTTGTCGTCCAGGTGGCATTGGCCGCGTTGTTGCAAGACTGGG
+GTGTGCTGCCCGATCTTGTGATGGGTCATTCGGTGGGTGAGATTGCTGCGGCGTATGTGGCCGGGGCGTT
+GTCGCTGGTGGATGCCGCGCGGGTGGTGGCGGCGCGCGGCCGGTTGATGCAGGCGTTGCCCGCTGGTGGG
+GTCATGGTGGCCGTAGCGGCCAGCGAAGACGAAGTGGCACCGTTGCTCACCGAGGGCGTGTGCATCGCTG
+CGGTGAACGCGCCGGAATCGGTGGTGATTTCGGGTGAGCAGGCTGCCGTGGGTGTGGTAGTGGATCGATT
+GGTGGGGTTGGGTCGGCGGGTGCGGCGGTTGGCAGTGTCGCATGCGTTTCATTCGGTGTTGATGGACCCC
+ATGGTCGAGGAGTTCTCGAAGGTGCTGGCTGATGTCTGCGTGCGGGCGCCGCGGATTGGGTTGGTCTCGA
+ATGTGACAGGTCAGCTGGCCGGTGCTGGGTATGGGTCGCCGGCGTATTGGGTTGAACATGTGCGCAAGCC
+GGTGCGGTTCTTCGACGGTGTGGGATTGGCTGAATCCCTCGGGGCCAGGGTGTTTGTGGAAGTGGGTCCC
+GGTGCCGGGTTGGAGGCGTCGGTGGCGCTGCTAGCCAGGGATCGGCCTGAGGTGGAGTCGGTGCTGGCCG
+GGGTGGGGCGACTGTTCGCCGAAGGGGTGGCGGTTGATTGGTCTTCGGTCTTTGCGGGTTTGGGCGGCCG
+GCGGGTGGAGTTGCCGACGTATGGATTTGCCCGGCAGCGGTTTTGGTTAGGTGACAATGGCGAGTTGTCG
+GTGGACCAGACGGGCAAAGACGCCGGCGCAATTGCGCGATTGCAAAGCCTAGCCCCACCGGAACTGCAGC
+GCCAGCTGGTAGAGTTGGTGTGCTTCCATGCAGCAATCGTTTTGGGTCGCAAGAGCAGCCATGACATCGA
+CCCCGAATGTGCTTTCCAAGACTTGGGATTTGATTCAATGAGCGGGGTCGAACTACGCAATCGTCTCCAG
+ATGGCTATCGGTTTGCCCGGCTTGTCGCTGCCGCGCACTTTGATCTTCGACTATCCCACTGCGAGTGCCC
+TCGCCGAATGCCTTGGCCAGCTCTTAGGCGGCCAACACGAATCATCCGACGACGAGAGTATTTGGCAGCT
+GCTGAAAAACATTCCTATCCACCAGCTTCGACGCACCGGCTTGCTGGACAAATTGCTGCTGCTGGCCGGC
+CAGCCCGAGGAGTCCTTGGCTGGTCGGACCGTCAGCGACGAGGTTATCGACTCGTTAAGCCCCGAAGCTC
+TTATCGGGCTGGCGCTCGATGAGGACGAGAACGATATTCGATGACGAAATCCGTCCTGGCAGGCTCAAAT
+TATGCTATCGGCATAGGTGCAAATACGACAGGCGTTGAATAGCGATGTTTTTGCGAGATCGCGTAATGTG
+GCTTAAACTTTGGGCTTCGAGGGTGGCAAGTAACTTAAGTGGGCAGGGGCATGAGCGTCATCGCGGGTGT
+GTTCGGTGCGTTGCCGCCGCATCGCTATAGCCAAAGTGAGATCACTGATTCGTTTGTCGAGTTTCCCGGC
+CTTAAGGAACACGAGGAGATCATTCGGCGTTTGCATGCCGCCGCCAAGGTCAACGGTCGACACCTGGTGC
+TGCCGCTGCAGCAATACCCGTCGCTGACCGACTTCGGCGACGCCAACGAGATCTTTATCGAGAAGGCTGT
+CGACCTTGGCGTCGAGGCCTTGCTGGGCGCGCTCGATGATGCCAACCTGCGCCCCAGCGACATCGACATG
+ATCGCCACCGCAACCGTCACCGGCGTCGCGGTGCCGTCTTTGGATGCCCGGATCGCCGGGCGGCTTGGTC
+TGCGCCCCGACGTGCGGCGGATGCCGTTGTTCGGTCTGGGCTGCGTGGCAGGGGCGGCGGGCGTGGCCCG
+CCTGCGCGACTACCTGCGTGGCGCGCCCGACGACGTCGCGGTTCTGGTCTCGGTTGAGCTTTGCTCGCTG
+ACGTATCCCGCGGTCAAACCAACCGTGTCGAGTCTGGTCGGGACCGCACTGTTCGGCGACGGAGCAGCCG
+CGGTGGTCGCCGTCGGCGACCGGCGCGCCGAGCAGGTTCGCGCTGGCGGACCGGACATCTTGGACTCGCG
+CAGCAGCCTGTACCCCGACTCGCTGCACATCATGGGTTGGGATGTCGGTTCCCATGGCCTGCGGCTGCGG
+CTTTCCCCGGACCTGACGAACCTGATCGAACGGTACCTAGCCAATGACGTCACCACGTTTCTTGATGCCC
+ATCGGCTGACCAAAGACGACATCGGCGCCTGGGTGAGCCATCCCGGTGGTCCCAAGGTCATCGACGCCGT
+CGCCACGAGCCTCGCGCTGCCTCCCGAGGCGCTCGAGCTGACCTGGCGCTCGCTGGGCGAGATCGGCAAC
+CTTTCGTCGGCCTCGATACTGCATATTTTGCGCGACACCATCGAAAAGCGGCCACCCAGCGGAAGCGCCG
+GGCTGATGCTGGCGATGGGTCCTGGTTTCTGCACGGAACTCGTCTTACTGCGCTGGCGCTGACTTCCTGA
+TTTCAACGGTCAATCCCGGCCAGGGGCGCAGCGCGGCAAAGTTGGCCGCCCGAATGCGGTGAGTCCGCTG
+AGCGGGCAACTGCAGCATGGCCCTGGCGACCAGCCGAGCGAGAATCACGGTCATCTCGGTGGTGGCCATG
+ACGGCTCCGATGCATCGGTGCAGCCCGCCGCTGAACGGGATGAATTCATGTGGCGCGGGTTTGCGGTAGT
+CCGCTGCGTTGGGATCCCAGCGCAGCGGACGGAATTCGGTTGGCTCGGGCCAGATTTCTGGGAGCCGGTG
+GGTGACGTAGGCGCTGAAGATCAACAGGCGTCCCGCCCGGATGCGATGCCCGTCGAACCAGAGGTCACGC
+AGCACCCTGCGGGCCGAGATCACGCCGGGCGAGTACAGGCGCAGCGTCTCGTGAACAACTCCGTTGAGGT
+AGGTGAGCGCGCTCAGGTCATCGGCGGCGGGGACTCTGCCACCCAGCACGCGCGCGACCTCGCTGGCCGC
+ACTCTCCCAGGTGCCGGGCACGGTCAGCAGTGCGTAGATCGCCCAGGCCAGCGCGCCGCTGGTGGTCTCG
+TACCCCGCGGTGATCAGCGAAACGATCGAATCGCGAATCTCGTTGTCGCTTAACGTAGTACCCTCTTCAG
+AGCAGCCACTAATCAACGTCGTCAACATGTGGTCGTCGGGTCTGGGTGCCGTGCGCGCGTCGGCGATCTG
+AGCGTCGATGAGGTCGTCGATGCGTTTGCGGGCTGCCATGGCCCGTCGCCACCCGGGCGAGTTGACCCGC
+TGCTGCAGCCGCATCACCTGAGGCGGCCGTCGGGTTAGGTCCAGCAGGGGCTGCAGTTGCTCACCGAGAA
+AATCGGAATGTACGGCGAGGCGCTGGCCGAACAGACTCTCGGCGGTACTGCGCCGGACCGCCGAGCGCAA
+CTCTTGGTAGATGTCCAGCCGCTGTCCGGGCTGCCAACCGTCGATCACCGTGTCGATATTGGACACCATC
+GTTGCCACATAGCGCTGGACGTGATGGTGCCGCAGCCCCGGTGCCACCACACTGCGGCGGCGCCGGTGGT
+CCGCGCCGTCGCTGACGATCAGCGCGGTCGGCCCGTCGACGGGAACCAGGCTCTCAAACGTTTGGCTCCA
+GCTGAACGCGTCGGCATTGGCGAACACGAATCTGTTGGCCTCTGCTCCCAGGAGATAAGTGTAGCCATGC
+CCACCGACTCCGGCGTTGATCAGCGGACCGCGCCATCGATACAGCGCCAGCAGCGCTTCGCCAAGCGGGT
+AGCGCACCGTCCGATACGTCCTCATTCGAGCATCTCCGAAAGCTCCAGCCAGCGATTCTCCATCGCCGCG
+ACGTGGTCTTGCAGGACACGTAGTTGCTGGGTCAGCCGGGTGATGCCGACGTGGTCGGACTGGTCATGCT
+CGGCCAGTTCGGTATGTTTGGCGGCCACCCGGTCGGCCAGGCGGGCGAGTTGACGGTCGACTGCGGCCAA
+CTCTTTTTCGGTGGCACGTCGCTGTGCGCCCGACATCGCCGGCGGCGCTGGCCGCTCGGCCGGTGCTGGG
+GCGCTAACGCGGGCAGCCAGCTGCAGGTATTCGTCGATGCCGCCGGGCAGGTGCCGCAACCGGTCATCGA
+GAATCGCGTACTGCTGGTCAGTGACCCGCTCGAGCAGATACCGGTCGTGTGAGACGACGATCAACGTACC
+CGCCCACGAGTCAAGCAGGTCTTCGGTCGCCGTCAGCATCTCGGTGTCCACGTCGTTGGTGGGCTCGTCG
+AGGAGCAGCACGTTCGGCTCGGACAACAGCGTCAGCATGAGCTGCAACCGCCGACGCTGACCACCGGAGA
+GGTCGTCGACTCGCGCGGACAGCTGGTCCCGGCGGAACCCGAGACGCTCTAGCAGCTGGGTCGGGGTAAC
+CTCGCGGCCTTCGACCTGATAGCCGCCACGCAGCCTGCCTAGCACATCGGCGATCCGGTCGTCGGCAAAC
+GGTGCCAGATCGTCCCCGTGCTGATCGAGCACTGCCAGCCGGACGGTCTTGCCGCGCTTGACACGTCCGA
+CACCGGGCTGGACGGTGCCGGCGATCAAGCCCAGCAGGGTCGACTTGCCGGCGCCGTTAGCCCCGACGAT
+GCCGATACGTTCACCCGGGCCGATCCGCCATTCGATGTCGCGCAACACCGGGCGGCCCCCAGAAGGCTGG
+TACGAGACCGACACGCCGAGCAGGTCGACGACGTCCTTTCCGAGCCGAGCGGCCGCCAGCTTGGCCAGCT
+CCACGGTGTTGCGCGGTGGCGGCACGTCTGCGATCAGTTGGTTGGCGGCCTCGATCCGGAACTTGGGCTT
+GCAGGTCCGCGCCGGTGCGCCGCGGCGCAACCAAGCCAGCTCCTTGCGCAGCAGGTTCTGCCGCTTGGCT
+TCGGCCGCGGCGGTCAGCCGGTCCCGCTCGACGCGCTGCAGCACGTACGCCGCGTAGCCGCCTTCGAAAG
+GTTCGACGATTCCGTCGTGCACTTCCCATGTTGTGGTGGCGACCTCGTCGAGGAACCAGCGGTCGTGGGT
+GACCACGAGTAGGCCGCCGGTATTGCGGGCCCAGCGCCGCCGTAGGTGGTCGGCGAGCCAGGTGATGCCT
+TGGATGTCGAGGTGGTTGGTGGGCTCGTCGAGAGCGATCACGTCCCATTCGCCGACCAGCAGGCTGGCCA
+GTTGCACCCGTCGGCGCTGGCCACCGCTGAGGGTGCTGACCGGGGTGTCCCAGGCGATGTCGGATACCAG
+GCCGGCGACCACGTCCCGGATACGCGGGTTGCCCGCCCATTGGTGTTCGGGTTGGTCACCGATGAGCGTC
+CAGCCGACGGTGCGGTTGGGGTCGAGGGTGTCTGTTTGGCTGAGCGCGTTCACCCGCAATCCGCTACGCC
+GGGTGACCCGACCGGAGTCCGGCCGCAGTTGACCGGTGAGCAGGCCCAGCAGACTGGATTTGCCGTCGCC
+GTTTCGCCCGACGATGCCGATGCGCGCCCCGTCGTTGACCCCGAGCGTGACTGCCTCGAACACCACCTGA
+GTCGGATAGGCCAGGTGCACGGCCTCGGCTCCGAGTAGGTGCGCCATGGGGCCGACCCTAGCGTGGCGAC
+GATGCGGGCTGGGATGGGCCGCTGAGGAGCCGCGCGGTCGAGCTCTAGCGTGGCGACGATGCGGGCTGGG
+ATGGGCCGCTGAGGAGCCGCGCGGTCGAGCTCTAGCGTGGCGACGATGCGGGCTGGGATGGGCCGCTGAG
+GAGCCGCGCGGTCGAGCTCTAGCGTGGCGACGATGCGGGCTGGGATGGGCCGCTGAGGAGCCGCGCGGTC
+GAGCTCTAGCGTGGCGGCCCAGCCGCAGTGCAGTTGATTGGCGGCGGGGCTTGCCGGGTGGGGTGGAGGT
+CGTTGTAGGCGTCGATTGGGCTGGGTGTGATTGAGGTGTTTGAACATTTCGTGGGTTTGCACCCGGTTGA
+ACGGGGTCAATGTCACGGCGACCGGGATACTCGAATGGACGTGCCGGGGCCAGCCGGCAAGCTGCTCGTG
+GCGGCTCGGCAGGGGCGTCGTCGGTAGCTTTCTCCAGCCAGCCCAACTGCGGACTGACTGAATCAGTCTT
+GGGCCACCAAGTCACTGGAATATGCTTGGGCACAATACATCTTGATGCCATGCAGTGGCCATGGTCGTCG
+GCGTACCGATTGGAGCCGGCCGTTGCTACCACATTAATCGGCATCAGTGCCTGGTGGGCGAATGGCAGCG
+TGAAGCAATACGCCGGTGATCTGACTGATCGTGTCGCCACGATGACAGTTTGCCGGCGCACGCCGGCTCC
+GCGAGTGCATTATCGACAGTGACACGTTTGGCAGGACCCAAGGAGGCCGAGTCCATGATTCGTGCTGTGT
+GGAATGGAACAGTGCTCGCTGAGGCGCCGCGAACCGTACGGGTGGAAGGCAACCACTACTTTCCGCCCGA
+GTCGCTGCACCGCGAGCATCTAATCGAAAGCCCGACCACGTCGATATGCCCATGGAAGGGTCTGGCCCAT
+TACTACAACGTCGTCGTGGACGGCCCCTATGGTCCGGTTAACCCGGACGCTGCCTGGTACTACCGCCGGC
+CCAGTCCACTGGCTCGCCGGATCAAAAACCATGTTGCGTTCTGGCACGGTGTGACGGTCGAAGGTGAATC
+CGAGAGTCGGCATGGCTTGGCGCGCCGGGTTGTGGCGTGGCTCGGCAAATAGCGGCGTGATGCCAACGGT
+CGGACCCGCGGACCACGCGGCGGGCCTAGATCGGCGCGCGACGCCTGACCAGCTGCCGATATGGCGTATC
+GGCATCATCAGTGGGCTGGTCGGCATGCTGTGCTGTGTCGGGCCGACCATCCTGGCGTTGGTTGGGATTA
+TTAGTGCGGCAACGGCTTTCGCGTGGGCGAACGACCTCTATGACAACTACGCGTGGTGGTTCCGCGTGAG
+CGGGCTCGCGGTGCTTGCCATTCTGGTGTGGTGGGCGCTACGACATCGAAACCGATGTAGCGTCAACGCA
+ATCCGCCGGTTACGGTGGCGGCTGATGGCAGTGCTGGCAATAGCGGTTGGTACTTACGGTGTCTTGTCCG
+CTGTGACGACGTGGTTCGGTACGTTCGTATAGTTGCAGTATTAGACGAACGGGGTCGCCGGCGACGGGTG
+CAGCATGATTTCGGAGTCGTTGGCGCATACTGTCCGGCCAGCGTGCCGCAGTAGCAAGCTACAAGCCGCC
+GCGGCAGCAAGTACGGCGGCGACGGTCAGCAACGCGAGATGGTAAGTGCCGGTGGCGTCTTTGAGGTGGC
+CGGTGGCGTAGGGACCGGCGAAGCTCGCCAGACTGGCCACGGCATTGACCGTCGCGATGGCCACGGCGAC
+CCGGGGACCGGCCAGCGCGGCGGTGCAACGGCTCCAGAAAGCGGGCATCGCGGCAAGGATTCCGGCGACG
+GCGATGGTCAGCCAACTCAGCGTCACTATCGGTGACATCGGACTCAATGCCGCACCGAGCGCGGCGCTGC
+CCGCGGCCGTTGTTGGCAGTGTGATATGGCCCGCTTGGGCGCCCGAGCGGTCGATGCTGCGGTGGCTCCA
+GGCCAACATGGCCAGCGCGGCGACACCGTACGGCAGGGCCGCCAACGTGGCAGCGGTCAGCGTGGCGGTG
+CCGTGTGCCAGCGACGCAACTAGTTGGGGCAGAAAGAACTGCAACGCATACAGCGCGAAATACAGGCCCC
+CGTAGACGACAGCGAAAAGGACAAGATCCCAACCGGCTCCACTCGACCGACCGGTCGGGGCAGGGGTGTC
+CTCGGTCAGCCGGGCCGACAGCTCTGCACGTTCCTCGGGGGTGAGCCAGCTTGCCCGTTGCGGGTTATCC
+GGCAACAGGCGCCGAAGAAGCGGCGCCAGCAGCAGTGCAGGCAATGCCTCGATCACAAACATTGCCCGCC
+AGCCGGGTAGCCCGGCCATGTGAACGTGGCCGACGATCAGCCCAGACAGCGGCAGGCCGACCGTGTTGGC
+GACCGGAATGGCCAGCAGAAAGGTGGCTACGGCGCGGGCTCGCTGCGCGCACGGAAACCACACCGTCAGA
+TACGCGATGACGCCGGGGAAGAAGCCGCCCTCGGCGACGCCGAGGGCGAAGCGCGCCAGATACAAGGTGT
+GCGCGCTGGTGACCAAGGCCGTGGCCGCCGAGCACACACCCCAAGCCAGGACGACCGCCGTGAGCGTTCG
+ACCGGCACCGAAGCGCGCCAACGCCGCGTTGGCGGGAACCTGGAACAGGACGTAGCCGAGGAAGAAGACG
+CCGGCGGCGGTGCCGTATGCGGTGGCGCTCAGGCGCAGGTCGGCGTTCATCGCCAGGGCTGCGACCGAGA
+TGTTGGCCCGATCAACGAAGTTGATCACATACAACACGAACAGCAGGGGCAACAGCCGGCGCGCGGCCTT
+GCCCAGGGCATTGTGCGTGGGGCTTGCCGCGATTGTCGCCACCTGCGGCTCCTTCCGTGGGCCTGTCGAA
+CAATTGCATCATGAAATGACCCCAACCCGGTCTTTGTAGTCCGGCGTGTCACTAACACGATCGGTTATGT
+CATTGCAGTAAAACGGATTTGGCGTTGCGCCGGATGTGTTTCGCCGTCAATCTCGGCGTAGGGGCCGGCG
+AAGAACAGGCTCCGGCCCGCCCGCTGTGGTGGGGCGAGCAGGATGTCGCGGCCGATCGACCACGCGATGT
+GGTTGGCCTGCAGGTTCGCGAACAGGCCGTGGGTGCCGTACTTCGTCGCACAGGAGGCGTCCGCCGGTAG
+CCAACCCAGCCCAGCGACGAAGAATTCCGCCCAGCAGTGGTAGCCGCACACCTCGCAATCCTGCGCACCG
+GGCTGCGGTAGCTCCAAGGCCTGACCGAGCACAAATCGTGCGGGGATGTCGACCGATCGGCACAGCGAGA
+CGAACAATGCGTGGATGTCGTTGCAGTTGCCCACCGAGCAGGTCAGGGCATGCTCGGTGCTGCCCAGGAA
+AGACTGCTTCGTCGCGTCGTAGTCCATGGCGCCGGTGACGTAGTCGTAGATGCGACGGGCCTGTTCGAGC
+GGGTTGGTCTCGGGGCCGACGACGTCTTGGGCCAACGTACGGGTGCGCTCATCGACATCGACATGTGCTT
+CGGGGATCAAGGCGCGGCTGAACAATTGCGCCGTGGCCAACGGGCGGGCCCGTGCCGGATCCGGAGCATG
+CCCGATCGCCCGGCGTTCCACAACATAGCGGATAGACCAACTCGCCGCCGTCGCCAAGCGCAGCCGGCTG
+TACAACATCAGGTTCCCGAACTCCGGCTCACGCGTGAGGTCATAGGGATCCTCGCTGGTCACCTCGACGT
+CCAGAACGCGTTGAAACGCGCCGTCACCGATGACCGGGCACCACATCTCGACGGTGTGGGCACCTTGGGT
+GGAATCGATCGTGATGTGATCGGTGATTTCGAACAGCCCGATCGTCGCATCCGCGTGTGCGGATACCGCG
+GGGTCGGTGATCGTCATCGGTTAGCTCCTTCCGCTGAGACTGGTTTATGTTCGAACAACCGGCAGATCGG
+CTGCCAGCCATTCGGAGAACCCGCCGTCGAGTCGGCGGGCAGAAAATCCGTTGGGGCGCAACAGTTCTAG
+CGCGTCATAGGCATACACGCAGTAAGGTCCTCGGCAGCAGGCGACGATGTCGATGCCGGACGGGAGTTCA
+TCAAGCCGCTCGGCCAGTTCGTCGAGGGGAATGCTCACTGCCCCGGGCAGATGCCCGGCGGCGTATTCCA
+TGGCCGGCCGCACGTCGAGGACCAGCACCGACCCGGCGGCCACCCGAGCTTGCAACTCGTCTCGGCTGAT
+CGGTTCCAGGCTGTCTCTGTCGGTGTAGTACTGCCGCACCAGGGAGCCGACCGAGGCCAGATTGCGTTCG
+GCCACAGCGCGCACCGCGCGCACTACGTCCCACACCTGCGGATCCGACAGTGCGTAAATCACCCGTTTGC
+CGTCCCGGCGGCTGGTCACCAGGCCGGCGCGCCGAAGTTGCAACAAGTGCTGGGAGGCATTGGCAAACGT
+CAACCCCGACGCACGAGCCAGCGCGTCCACACTGCGTTCACCCTGCACCAGCAGATCCAACAGCTCCAAT
+CGATGGCCGCTGGACAGCGCTTGCCCGACCAGGGCGAACTGCTCGAAGATCAGCTTCTTTGCACCGGACA
+TGCCGCCGCTCCATTCCTCGATTCAGATGTTCGTATATTCAATTGATTGTTTGATCATGTCATTCCGACA
+CGCTGCTGCGGTTTCGCCGCCGGGGCGTCGCACCGTTACTCGGTGCCGGCTACGGCCTCACCCGCGGCCG
+CGGGTTCGCGACCGGGCCCTGCGCCGCGCCCTCGGGGTGGGCGGAATGTCCTCCGCGGTCAGCACCGGTG
+CATTCCTGACCACCGTGTGCCTCGCGCACCTGGTGCTCGGCGCGCTTATGGGTGTACTAGTGCACGAATT
+CGGCGCCGACATGCTGTCGTTGTGGCCCGTGGGACCGGCGCTGTGTCATTGAGCCCGGGCGCGTAATCCG
+TGTTGGTCGGTGATCTCGATGACCGCATACCCGACGGTGATCAATCGGTCGCGCTCGAACTCCTTGAGAA
+TCTTGTTGATCGATGGGCGCTGCGCTCCAAGCATTGCGGCGAGGGTGCGTTGGGCAAGTTCGATACGGGC
+ATCGATTGCCTCGTCGAGCAGGAGCTGCGCAACCTGCGCGGGCAGCGGGCGGCCAAGCATGCCCATTAAC
+CGAATCTGCGCAGTCGACACCCGTTGCGCCACACTCGACAGCCACCGCCGTGCGATGGCCGGGTGGGTAG
+CTAGCAGCCGCTCGAACGCCTGCCGGTCCAGGAACAGGCAGGTCGCTTGGGTCAAGGCGCGCCCCGTGTA
+GACCATCGGCATCTCCAGTAGCAGCGGGATGTCGCCATCGACATCGCCGGGATGAAGGATGTTCACCACG
+GCGCGGCGCCGCCTGGAGCCGACCGCGAGCTCAATTAATCCGTGTCGCACAATCCACACCCCGTCCGCGG
+TTTGATCGGCGTGGAATACCACTGCCCCGGGGGCAAACTCCTTGGCTTGTAACGTTTCGGCCAATGCCGA
+CACATCGTCACGGTGCAGTGGCGCCGAGCCTCCGCGACCGACGCACCGCGCAATCCAGGCTGCCTGTCGG
+ACCTGGGCCTCGGAAGGCGGTTGGCCCCCAGTCACCGCATGAACGAGATGCCGCAGCGGGCGCACCGACC
+GATCTGCCATGGCCCCTCCTTGAGAGCAGGCGATGCCGTCATCGTGCTGCCAATTGTCAGCGCGCGTGGA
+TTGCGTGCGGGTTGGCTTGCCCTGAATGGGAAATTAGTCGATCGAAGAGAACACGCAAGCCCGTTCTGCG
+CCCCAGGCACTCTGTCAGCACGCTGACAAACCGATTCTTGGCGGAGTTTTGCCATCGGTATGGTATTGGG
+GTGCCTACTCGATTGGCCCGCGGTGCGACCGTGCCGACTCGCCGTCTGCAGGACATCAACGATCAACCGG
+TGGACGTCCCGGCTGCGACCGGAAGGACACACCTGCAGTTTCGGCGGTTCGCGGCCTGTCCGATCTGCCA
+CCTGCACCTGCGCAGCTTCGCCAACCGGCACCAAGAGGTTGCGGACAGTGGAATCACCGAGGTGGTGTTT
+TTTCATTCGGCGGCCGACGCGCTGCGCGGATACCAGTCCTTGCTACCGTTCGCCGTGATCGCCGACCCCG
+ACCGAGTGCAGTACCGCGAGTTCGGCGTAGAGAAAAGCCTGGGCGCCATCACTCATCCGCGGGCATTGTG
+GGCTGCCGTTCGGGGGTCGGCGGCGATGTTGCATCGCAACGATCCGGAACGGGCGGGCGTCGGATTCGGT
+GACGGCACAACGCATCTGGGATTGCCCGCCGACTTTCTCCTGGATGCCGATGGAACTGTCGCCGCTGTGC
+ACTATGGGCGTCATGCCGACGACCAATGGTCGGTGGATCAGCTCATCGACATCAACCGCTCGCTTGGAGG
+TAAGGGCACTCAGTGACTCATTCCCGTCTGATTGGCGCACTTACCGTAGTCGCAATTATCGTCACTGCAT
+GTGGTTCGCAGCCGAAATCCCAGCCCGCAGTGGCACCTACCGGGGACGCGGCCGCTGCCACCCAGGTGCC
+GGCGGGCCAAACCGTTCCCGCCCAGCTGCAGTTCAGCGCCAAAACCCTTGATGGGCACGACTTTCACGGG
+GAAAGCCTGCTGGGTAAGCCCGCGGTGCTGTGGTTCTGGGCGCCCTGGTGTCCGACGTGCCAAGGCGAAG
+CGCCGGTAGTCGGCCAGGTCGCCGCGTCACACCCGGAAGTGACGTTCGTCGGGGTGGCCGGCCTGGATCA
+AGTACCCGCAATGCAGGAGTTCGTCAACAAATACCCGGTGAAAACGTTTACCCAGCTGGCTGATACCGAC
+GGGTCGGTCTGGGCGAATTTCGGTGTCACCCAGCAGCCTGCGTACGCGTTCGTTGACCCGCACGGCAACG
+TCGACGTCGTCAGGGGTCGGATGTCGCAGGACGAACTGACGCGGCGCGTCACGGCGTTAACCAGCCGTTG
+ATCGACGCCACGCCGGTCGGCTTGGCGTTGGCCCACGCAGAAATGCCTGGCCTTCGCGACGAGTTGGGGC
+TTGCGCCGCGTGTGATACTGCCCTCATGACGATGGCTCGGGTGCGTCGCGGCACGGAACTGTTGTTGTCA
+CCTCAGTCGCCGCCGGCCACCGGCGGGCTGATCGTGTTGACCGGTCTGCGGCTGTTGGCTGGGTTGATCT
+GGCTCTACAACGTGGTCTGGAAGGTGCCGCCGGACTTCGGTGAGCGCGGCCGGCGGGACCTGTATCACTT
+CACGCATCTGGCGGTTGAACACCCGGTGTTCACACCGTTCAGCTGGGTGATCGAGCATGCCGTGCTGCCG
+TACTTCACGGCATTCGGTTGGGGGGTGTTGTTCGCGGAGTCCGCGCTGGCGGTGCTGCTGCTGACCGGGA
+CGGCCGTGCGGCTGGCCGCGTTGATCGGGATCGGGCAGTCGGTCGCGATCGGGCTGTCGGTGGCCGAGTC
+ACCCGGGGAGTGGCCGTGGGCGTACGCGATGCTGCTGGGCATCCACGTCGTCTTGCTGTTCACCTGCTCG
+ACCCGGTACGCCGCCGTCGACGCGGTGCGCGCCGCCGCCACGGGGTCGGCCGCTCGGACGGCGGCGCAGC
+GGCTGCTGGCCGGTTGGGGAATCGTGCTTGGGCTGATCGGACTTGTCGCGGTATGGCGTGGCCTGGGCGA
+TGATCGACCCGCCTATGTCGGGATACGGGCGTTGGAGTTCTCCCTCGGGGAATACAACCTGCGCGGCGCA
+CTGGCGCTGATCGCGATCGCGCTGGCAATGTTGGCGGCCGCCAAACGCGGCTGGCGCACCGTCGCGTTGG
+TCGCGGCGGTGGTCGCGGTGGCCGCCGCGGCCGCCATTTACCTGCAAGTCGGCCGGACCGCGGTGTGGCT
+CGGCGGGACGAACACCACCGCAGCGGTTTTCGTGTGCGCGGCGGTGGTGAGTCTGGCAACCGAATTCCGG
+ATCGGACGGGTGGAAGGGGCGTGATGGCCACACCGGGCGTTGTGCAGGAAGTCGTTTCCGTCGCTGCAGA
+ACACGCCGAGCGGGTCGACACCGACTGTGCTTTCCCGGCCGAGGCGGTCGACGCCCTCCGCAAGACCGGC
+CTGCTGGGTCTGGTGCTGCCCCGCGAGATCGGCGGAATGGGTTCCGGACCAGTGGAATTCACCGAGGTGG
+TCGCCCAGCTGTCGGCTGCATGTGGATCAACGGCGATGATCTATTTGATGCACATGGCGGCCGCTGTCAC
+GGTAGCCGCGTCGCCTCCGCCGGGTCTGCCGGATCTGTTGGCGGACATGGCTTCCGGAAAACAACTTGGC
+ACCTTGGCATTCAGTGAACCGGGTTCTCGTTCGCACTTCTGGGCGCCCGTGTCCACGGCGAGCGCCGACG
+GTGACGGCATCGCGGTGCGGGCCGACAAGAGCTGGGTGACCTCGGCGGGGTTCGCCGACGTCTATGTGGT
+GTCCGTCGGTTCGGCCGACGGTGCCGCGGGCGACGTCGACCTCTACGCGGTTCCGGCGGACACACCGGGC
+CTGCGGGTAGCGGGCACCTTCACCGGGATGGGTCTGCGGGGGAATGCCTCCGCGCCAATGGCCGTCGACA
+TTCGCATCCCGGATTCGTATCGTCTCGGGGAGGCCGGCGGCGGATTCGGCATCATGATGCAAACGGTACT
+GCCCTGGTTCAATCTCGGAAATGCGGCTGTCTCACTGGGTTTGGCGACCGCAGCCACCGGTGCCGCGGTC
+AAGCACGTCGGGACCGCCCGGTTGGAACACCTCGGTGGCAGCCTGGCCGAGCTGCCCACGATCCGCGCCC
+AGATCGCTCGGATGGGCACCACGCTGGCCGCGCAAAAGGCGTACCTTGAGGTCGCCGCCAACAGTGTCAG
+CTCGCCCGACGACACCACCTTGACCCACGTGCTGGGTGTGAAGGCCTCGGTCAACGACGCCGCGCTGACC
+ATCACCGAATCGGCCATGCGGGTGTGCGGCGGGGCCGCGTTCTCCAAGCATCTGCCCATCGAACGCGCCT
+TCCGCGACGCCCGGGCGGGGTCGGTGATGGCGCCAACCGCCGACGCGCTCTACGACTTCTACGGCAGGGC
+CGTCACCGGGCTGCCGCTGTTCTAGGAGGCGATATGTCAACCGAACCGCTCGTCGTGGGAGCAGTCGCAT
+ACACACCCAACGTGGTCCCGATTTGGGAAGGCATCCGCGGCTACTTCCAAGACTCCGAAAGCCCGGACAC
+CCAAATGGATTTCGTGCTCTACTCCAACTACGCGCGGCTGGTCGATTCGCTGATCGCCGGCCACATCGAC
+ATCGCCTGGAACACCAACCTGGCCTACGTGCGGACCGTGCTGCAAACCGGCGGGCGGTGCACGCCATTGG
+CCCAGCGCGATACCGACGTCGACTACACCACCGTGTTCGTTGCACATGCCGGCAGCGATCTGCACGGCGC
+TAAAGACATTGCCGGAAAGCGCCTTGCGCTCGGGTCCGCCGACTCTGCGCACGCGGCCATCTTGCCGCTC
+TATTATCTGCGCCGGGCGGGCATCGCCGAGTCTGACCTGCAGGTGATCCGCTTCGACACCGACATCGGCA
+AGCACGGCGACACCGGTCGCAGCGAACTCGACGCGGTGGATGCGGTGCTCGCCGGTGAGGCCGACGTGGC
+GGCGATCGGCAGCTCCACGTGGGCCGCGATGGGCGCCGCGGAGCTGATGGGGGAGTCGTTGACCGAGGTG
+TGGCGCACCGACGGCTACTGCCACTGCATGTTCACCGCGCTGGATACGCTGCCCGCCGAAAGATACCAGC
+CGTGGCTCGACCGGTTGCTGGGGATGAGCTGGGATGACTCCGAGCATCGAAAGATCCTCGAACTCGAGGG
+TTTACGACGTTGGGTGCCTCCGCACCTGGACGGCTACAAGCCGCTGTTCGAGGCCGTGCAGGAGCAGGGC
+ATCGACCCGCGATGGTGATCATAGAGCTGATGCGCCGGGTGGTAGGTCTCGCACAGGGAGCTACCGCCGA
+GGTCGCCGTCTATGGCGACCGAGATCGTGATCTCGCGGAGCGATGGTGCGCGAACACCGGAAACACCCTG
+GTGCGCGCCGACGTGGACCAGACCGGCGTCGGCACCCTGGTGGTGCGCCGCGGCCATCCGCCTGACCCGG
+CAAGCGTGTTGGGCCCCGACCGGCTACCCGGGGTCCGGTTGTGGCTGTACACCAACTTCCACTGCAACCT
+GTGCTGCGACTACTGCTGCGTCTCGTCGTCACCAAGCACCCCGCATCGCGAACTGGGGGCGGAGCGGATC
+GGCCGAATCGTCGGTGAAGCGGCGCGCTGGGGAGTGCGCGAACTGTTCCTCACCGGCGGTGAGCCGTTCC
+TGCTGCCCGACATCGACACGATCATCGCGACCTGTGTGAAGCAGTTGCCCACCACCGTCCTCACCAACGG
+CATGGTGTTCAAAGGGCGGGGTCGGCGCGCGCTGGAATCCCTACCTAGAGGGCTCGCCTTGCAGATCAGC
+CTGGACTCGGCCACCCCGGAGCTGCACGATGCGCACCGCGGCGCGGGGACGTGGGTCAAGGCAGTAGCTG
+GTATCCGGTTGGCGCTCTCACTTGGCTTCCGGGTGCGGGTGGCCGCGACGGTTGCCAGCCCCGCACCTGG
+CGAGCTGACGGCGTTTCACGACTTCCTCGACGGGCTTGGCATCGCACCCGGGGATCAGCTGGTCCGGCCG
+ATCGCGCTGGAGGGCGCCGCGTCGCAAGGGGTGGCGCTCACCCGCGAATCGCTGGTTCCCGAGGTGACCG
+TCACCGCCGACGGCGTGTACTGGCACCCAGTGGCCGCCACCGACGAGCGCGCCCTGGTCACCCGTACCGT
+CGAACCCTTGACCCCGGCGCTGGACATGGTAAGCCGGCTATTCGCCGAACAGTGGACACGAGCCGCCGAA
+GAGGCCGCGTTGTTCCCGTGTGCGTAGTGCCCAGTCTGCCGGCCGCGAACCCAGGATTAATTGCTGATGA
+CAAGTATTGCCCTACTGCACTATAGTTCTGCTTGCACTTGAAAACAACGAGCCGTGATGCGGGTCGTAAG
+GGATTCCGGTAAGGAACACAGTCAAGTTCTTGCACGCGTCGGCGGCAGTGTTGCCTCAACGCCCAAACTG
+CACCAAACTGTTTCGCCCACGGCGGGGCGTGTCTGAGAGGTATCGCGTGACCACCGCCCATAACGGATCC
+GCTCCGCGTTTTCAACGTACCCGCTCTGGCTACGACCCGGTCGCAGTCAATCATTACATCGCCGAACTCG
+TGCTGCGTCAGCAGGCGCAGCACTGTGAGATTGAAACGCTCAAGGCAGAAATAGCCAGTCTGAAGGACGA
+AAACGCTGCCCTGAAGGACACCTCGCCGTCAGCACAGGCGGTGACCGATCGGATGGCGAAAATGCTTCGA
+CTCGCTGTCGACGAGGTCTTCCAGATGCAGTCGGAGGCACGGGCCGAGGCCGCAACATTAGTTTCTGCGG
+CTAGGGATGAGGCGGAAGCGGTCCGAACGCAGAAGCGAGAAATGCTGGCGGATATGAACGCCCGGCAAAG
+AGCGCTGGAGTCCGAGCATGCCGACGTGATGCGCCGCGCTCGTGAAGAGGCTGAACAGCTTGTGGCGCAG
+GCAACCGCCGAGGTGGAGCGGATGCGTGTCATCGATGCCAGACGCCGTGAGAAAGCCGAGCAGGAACTTG
+ATGCCGAAATCATCAGGCTTCGCACCGATGCCCAATTTCAGATCGACGATCAGCTGCAGGCCACACAGCA
+GGAGTGTGAGAAGCGGCTTGGCGAAGCCAAAATCGAGGCCGATCGACGGCTGCATGTTGCCGACGAGCAG
+ATTGAGCACGGCCTCAGCGAGGCTCGGCGAACGTTGGAAGAGATCAGCCAGCGGCGAGTCGGCATCCTCG
+AACAACTAGCGCGTATTCACGCACAGCTCGAGAATATTCCAGCGCTCCTGGAATCGGCTCGACATAGCGA
+GACGGAGCCACTGCAGTCCATAAACGGCGCCGTCGCTGAGCTACGGGCCATTTAGCGATCGCGTGCCTGA
+GCGCGACTCATCTGTGACAGTTCCGTCACGGCTGGGTCAGGTGCCGGTGTCCTGGCGACGCCGACTGCGC
+ACAGACCGAAACAGCACGGTGTGGATGTGCCATGATGTGCACGCTGTCAAGGCCAGTCGGGTGACGATGC
+GGGCCGGTGTGGTCCGAGGAGGAGCCCGACAATTTAAGCTAGTCAGGGAGCCCTCAGGAGCGGTGGTGGA
+TCTCAATTTTTCGATGGTCACGCGACCAATCGAGCGCCTGGTGGCCACGGCGCAGAACGGTCTGGAAGTC
+CTGCGACTCGGGGGCCTGGAAACCGGCAGTGTTCCGTCGCCGTCCCAAATCGTTGAGAGCGTACCGATGT
+ACAAGCTGCGGCGGTATTTTCCGCCGGACAACCGCCCGGGACAGCCACCGGTGGGTCCGCCGGTGCTGAT
+GGTGCACCCGATGATGATGTCGGCGGACATGTGGGACGTCACCCGTGAAGACGGCGCGGTGGGGATCCTG
+CACGCCAGCGGGCTAGATCCCTGGGTCATCGACTTCGGCTCACCCGACGAGGTCGAGGGCGGAATGCGCC
+GTAACCTGGCCGACCACATCGTCGCCCTCAGCGAGGCGGTCGATACCGTCAAGGACGCCACTGGCCACGA
+TGTGCACTTCGTCGGGTATTCGCAGGGTGGCATGTTCTGCTATCAGGCCGCGGCATACCGGCGTTCGAAG
+GACATCGCCAGCGTGGTCGCGTTCGGCTCGCCGGTGGACACCCTGGCCGCGTTGCCCATGGGCATCCCGG
+CGAACATGGGCGCTGCGGTCGCCGATTTCATGGCCGATCACGTCTTCAATCGCTTGGATATCCCAAGCTG
+GATGGCGCGCATGGGTTTTCAGATGATGGACCCACTCAAAACCGCGAAGGCCCGGGTGGACTTCGTGCGT
+CAGTTGCACGACCGCGAGGCACTGCTGCCGCGGGAACAACAGCGCCGGTTCCTGGAATCCGAAGGATGGA
+TCGCCTGGTCGGGCCCGGCGATCTCGGAACTGCTCAAGCAGTTCATCGCGCACAACCGAATGATGACGGG
+TGGTTTCGCCATCAGCGGCCAGATGGTGACGCTTACCGATATCACTTGCCCGATACTGGCGTTCGTCGGT
+GAGGTCGACGACATCGGCCAGCCGGCGTCGGTACGCGGCATCCGGCGGGCCGCGCCCAACTCCGAGGTCT
+ACGAATGTCTCATCCGGGCAGGGCATTTCGGTCTCGTCGTGGGATCCCGAGCGGCACAACAGAGCTGGCC
+GACCGTGGCCGACTGGGTGCGCTGGATCTCCGGCGACGGCACCAAACCGGAAAACATCCACCTGATGGCC
+GATCAGCCGGCCGAACACACCGATAGCGGTGTGGCTTTCAGCTCCCGGGTCGCGCACGGCATCGGGGAGG
+TCTCGGAGGCTGCGTTGGCGCTGGCTCGCGGCGCGGCCGACGCGGTCGTTGCGGCCAACAGATCGGTGCG
+CACGCTGGCGGTGGAGACGGTGCGGACGCTGCCGCGACTAGCCCGGTTGGGTCAGCTCAACGACCACACC
+CGGATCTCGCTGGGCCGCATCATCGACGAACAGGCACACGATGCCCCGAAGGGTGAATTCCTGTTGTTCG
+ACGGGCGCGTGCACACCTATGAGGCGGTAAACCGGCGGATCAACAATGTCGTTCGTGGCCTCATCGCGGT
+CGGGGTGCGGCAGGGTGACCGTGTCGGCGTGCTGATGGAGACTCGGCCCAGCGCGCTGGTCGCCATCGCC
+GCGCTGTCTCGGCTGGGAGCGGTTGCCGTGGTGATGCGGCCAGACACCGACCTGTCCGCGTCGGTCCGGC
+TCGGGAGAGTGACCGAGATCCTGACCGACCCTACCAATCTGGATGCTGCGCGCCAGTTGCCCGGACAGGT
+GCTGGTGTTGGGTGGTGGTGAATCGCGTGATCTGGATCTGCCGGCCGACGCACTTGAACAGGGCCAAGTC
+ATCGACATGGAAAAAATCGACCCGGACGCCGTCGAGTTGCCGGCGTGGTATCGACCGAATCCCGGATTGG
+CGCGGGATCTGGCGTTCATCGCGTTCAGTTCGGCCGACGGCGACCTGGTGGCCAAGCAGATCACCAACTA
+CCGCTGGGCGGTGTCGGCCTTCGGGACCGCCTCGACGGCGGCCCTCGGCCGCAGAGACACGGTGTACTGT
+TTGACGCCGCTGCACCATGAGTCCGCACTGTTGGTCAGCCTGGGCGGCGCGGTCGTGGGCGGAACCCGTA
+TCGCATTGTCCCGCGGCTTGCGCCCGGACCGGTTCGTGGCCGAGGTACGCCAGTACGGCGTCACCGTCGT
+CTCCTACACATGGGCCATGCTGCGTGACGTGGTCGACGATCCGGCGTTCGTGTTGCACGGCAACCATCCG
+GTGCGGTTGTTCATCGGCTCGGGCATGCCGACCGGATTGTGGGAGCGGGTCGTCGAAGCGTTCGCACCGG
+CGCACGTCGTCGAGTTTTTCGCCACCACCGACGGACAGGCGGTGCTGGCCAACGTGGCTGGCGCCAAGAT
+CGGCAGCAAGGGCCGTCCGTTGCCTGGCGCCGGACGTGTCGAACTTGGGGCCTACGACGCCGAACATGAC
+CTGATCCTGGAGAACGACCGCGGCTTCGTGCAGGTCGCCGGTGTCAACCAGGTCGGGGTGCTGCTCGCAC
+AATCCAGAGGGCCGATCGATCCGACCGCGTCGGTCAAACGCGGTGTCTTCGCTCCCGCCGACACCTGGAT
+ATCTACCGACTACCTATTCTGGCGTGACGACGATGGGGACTACTGGCTGGCGGGTGGACGCGGCTCGGTG
+GTGCGCACTGCGCGCGGGATGGTTTACACCGAGCCGGTCACCAACGCGTTGGGCCTCATCACCGGTGTCG
+ACCTCGCGGTGACCTACGGTGTATTGGTGCGCGGTCGCCACGTCGCGGTGTCGGCGGTGACGTTGCTGCC
+TGGAGCGACCATCACAGCCGCCGACTTGACCGAAGCCGTGGCGAGCATGCCGGTGGGGCTGGGACCTGAC
+ATCGTGCACGTGGTGCCGCAGCTAACGCTCAGCGGTACTTACCGGCCAACGGTCAGCGCGTTGCGGGCCA
+ACGGGATTCCCAAGGCGGGCCGTCAGGCATGGTATTTCAACTCCGGCGGCAACGAGTACCGGCGGTTGAC
+GCCGGCGGTCCGCACCGAGTTGACCGGCCAGCATCGGCGCGGCAATGCTTGACGAGGCGCTGCTCGCCAT
+CCTGGTGTGCCCGGCGGATCGAGGTCCGCTCGTCTTGGTCGAGGACGGCGACATCCAGGTGCTCTATAAC
+CCGCGGCTGCGGCGCGCCTACCGCATCGAGGACGGTATCCCGGTTCTGCTGGTCGACGAGGCCCGCGAGG
+TCGACGAGGACGAGCACGCCCGCCTCATGGCGCGAGGTCGTCCGGCAGCTCCCCAGTGAGGTAGCGCTGC
+AGGTTGGGCGCGATGGTTTGCACGATCTGTTCGGCCGGCAACGAAGCAAACGGTTCGATTCTGACGATGT
+AGCGCGCCATGACCACACCCATCAGTTGCGACGCGACGAACTGGGTACGGATCTTGCCGGTTCCCGGCGG
+GTTGTCGACGCGGGACCCAAGCTCCACGGTGACCACTTCCTCAAGGAAGGAGCGCGCCAGGCCCACGTCG
+GAGCCTGAGATCAAGGATCTCAGCGTCGCGATCAACCCGGCACCCAGTTCGGAATCCCAAATCGGCAGCA
+ACAAGGACGGCAGCTTGTAACCGAGTTCCTCGACAGGCGCCTCGCGAATCGGACCGATGATGACCATCGG
+GTCGATCGGAATGTGGATCGCGGCGGCGAAAAGCTGCTGTTTGGTGCCGAAGTAGTGATGCACTAGTGCG
+GCATCAACACCGGCCTTGGCGGCCACGGCTCGGATCGATGTTCTGTCAATGCCGTTGTGCGCAAAGAGTT
+CTCGGGCACTGGACAGGATTCGCTCCCTAGTGTCAGAGCTGCCGGCGGGTCGCCCGGGCCGTCTGCGGCT
+GTTGTCCGGCGCCGCCACGCTATGACGTCCGTCGCCGCAGTGTCACCGCCGCCAGACACAGCGACGCGAC
+CGCGAAACTCAGCACGACGACGACGTCGCGCACCGCGATACCGGTCAGCTCCGGATGCGCACCCACCTGT
+TGTAGCGCCTCGAGCGCGTAGCTGGCCGGCATCACGTTACTGATCCACTCCAGCCACGTCGGCATCAGTG
+CCCGCGGGACGATGATGCCGGCGAGCAGCAGCTGCGGCACCATCACCAGCGGGATGAACTGTACGGCCTG
+AAATTCGGTGCGGGCGAAGGCACTACACAATAGACCGAGCCCGACACCCAAGACGGCGTTGACGATCGCG
+ATCGCGAACACCCACACCGGGCTGCCCGCCGTGTCAAAGCCAAGGAACCAGAACGCCACAATGCAGGCCA
+GCGTGGCCTGCGCCGCCGCGGCGATCGAGAACGCGGTCCCGTAGCCGGCGAGCAGATCAAGCCGGCGTAG
+CGGGGTGGTCAGGATGCGCTCCAGCGTTCCCGAAGCCCTTTCGCGTTGCATGGTGATCGCCGTGATCACA
+AACATCACAAAGAGTGGGAACAGGCCCAGTAGCACCAGGCAAGCGGTGTTGAACCCGGATGGGGTACCGG
+GGCGATGCGGGAAGTTCTCGAACATGAAATACATCAGCGTGATGATCAGGATGGGTACCAGCAAGATCAT
+CGCGACACTGCGGTGATCAGCGGCAAGCTGCCGGAGAATCCGCGCCGTAGTGGCCGTGTAGTTCTGCAGC
+GTTAGCCGGCCGCGGGCACGGTGGTGGTGCGTCGGACGATGGACAGAAACGCTTCCTCCAGTGATGTGCA
+TCCGGTTTCCTTTCGTAGACGGTGCGGCGTTGTGTGGGCCAGCAGCTGCCCCTGGCGCAGAAGCAACAGA
+TCGCCGCAGCGGTCGGCCTCGTCCATTACGTGGCTGGACACCAACAGCGTGGTGCCACGCCGCGCCAGCG
+CCGTGAACCGATCCCATAATTCGACGCGCAATACCGGATCCAGGCCGATGGTCGGCTCGTCGAGCACTAG
+CAGATCAGGCCGGCCGACCAGCGCACACGCCAGCGAGACCCGGGCCCGCTGGCCGCCGGACAGGTTGGCA
+CAACGGGCGGTGCGGTGATCGCGCAGGTCCACCGCTTCGATCACCTCATCGGCGGCTTGCCTGTCGACGC
+CGCAGAGTTCAGCGAAGTAGCGGATGTTGTCGATCACCCGCAGGTCGTTGTAAATGGTCGGGTCCTGAGG
+CATGTATCCAACCCGATGGCGTAGTTCGGCTGACCCAGCCGGTTGGCCCAGCACGCTCACCGAACCCGAG
+GCAATGATTTGGGAGCCAACGATGCAGCGAATCAGTGTTGTCTTGCCCGACCCGGACGGACCGAGCAGGC
+CGGTGATCGTGCCGCAGGCGACCCGGACCGAAACATCCTGCAGGGCAAGGCGTTTACCACGGATGACGCG
+CAGCTGGTCGATGATGACCGCGGGGTCGGCACCGTCGCGAAGTAATTCATCACTTGATGAAATCATCATG
+TGATGAATATCCGCCAGTCGTGCGGGTTTGTCAAGGGCCGGTGCACAATCGTCTCTGATGAACGCTGAGG
+AACTGGCGATCGACCCGGTCGCGGCCGCGCATCGGCTGCTCGGCGCAACTATTGCCGGACGGGGTGTGCG
+TGCGATGGTGGTCGAGGTCGAGGCGTATGGCGGGGTGCCCGACGGTCCCTGGCCGGACGCCGCGGCGCAC
+TCTTACCGCGGCCGCAATGGCCGCAACGACGTCATGTTCGGGCCCCCGGGGCGGCTTTACACCTACCGCA
+GCCATGGGATCCATGTCTGTGCCAACGTCGCGTGCGGGCCCGATGGCACGGCTGCCGCTGTGCTACTTAG
+GGCCGCCGCCATCGAGGACGGCGCCGAGCTCGCCACGTCTCGGCGCGGGCAGACGGTGCGCGCTGTCGCA
+CTGGCGCGCGGCCCGGGAAACCTCTGCGCTGCCCTCGGAATCACCATGGCCGACAACGGGATTGACTTGT
+TTGATCCGTCCAGTCCGGTGCGGCTGAGGCTCAACGACACGCACCGTGCCAGGTCGGGGCCGCGCGTTGG
+GGTCAGTCAAGCCGCTGACCGGCCGTGGCGATTGTGGCTCACGGGTCGACCGGAGGTGTCGGCCTACCGG
+CGAAGCTCGCGGGCACCGGCCCGGGGAGCCAGCGACTAGAGTCTTGCGGGATGTCTGGCATGATCCTCGA
+TGAGCTCAGCTGGCGCGGGTTGATCGCGCAGTCGACCGACCTCGACACGTTGGCCGCCGAAGCACAGCGC
+GGGCCGATGACGGTGTACGCCGGCTTCGATCCCACCGCGCCTAGCCTGCATGCCGGACATTTGGTGCCGC
+TGCTGACGTTGCGGCGCTTTCAGCGCGCCGGTCATCGCCCCATCGTGCTGGCCGGCGGGGCCACCGGCAT
+GATCGGTGATCCACGTGACGTCGGCGAGCGCAGTCTCAACGAGGCCGACACCGTCGCCGAATGGACCGAA
+CGGATCCGTGGGCAGCTGGAGCGCTTCGTCGACTTCGACGACTCACCAATGGGCGCGATCGTCGAGAACA
+ACCTGGAATGGACCGGCTCACTATCGGCTATCGAGTTTCTACGTGATATCGGCAAGCACTTCTCGGTCAA
+CGTGATGCTGGCCCGCGACACCATCCGGCGGCGTCTGGCGGGGGAGGGGATCTCTTACACCGAATTCAGC
+TACCTGTTGCTGCAGGCCAACGACTACGTCGAATTGCACCGGCGCCACGGCTGCACGCTGCAGATCGGTG
+GTGCAGATCAGTGGGGCAACATCATTGCCGGCGTCCGGTTGGTGCGCCAGAAGCTCGGTGCCACCGTGCA
+TGCGCTTACCGTCCCCTTGGTGACCGCTGCCGACGGCACCAAGTTCGGCAAATCAACCGGCGGCGGGAGC
+CTGTGGTTGGATCCCCAAATGACCAGCCCCTATGCCTGGTACCAGTACTTCGTGAACACCGCGGACGCGG
+ATGTGATCCGCTACCTACGGTGGTTCACCTTCTTGTCGGCCGACGAGTTGGCCGAGCTGGAACAGGCGAC
+AGCGCAACGCCCGCAACAACGGGCCGCCCAGCGCCGGCTCGCCAGCGAGCTCACCGTCTTGGTGCATGGC
+GAGGCGGCGACCGCAGCCGTCGAGCATGCCAGCCGGGCCCTCTTCGGTCGGGGCGAGTTGGCCCGTCTGG
+ACGAGGCGACACTGGCTGCTGCGTTGCGGGAAACCACGGTCGCCGAACTCAAACCGGGCAGTCCCGACGG
+AATCGTCGACTTATTGGTGGCCAGCGGCCTGTCGGCCAGCAAGGGCGCGGCGCGGCGCACGATCCACGAG
+GGTGGGGTGTCGGTCAACAACATTCGGGTTGATAACGAGGAATGGGTGCCGCAAAGTTCGGACTTCTTGC
+ACGGCCGCTGGTTAGTGCTACGTCGTGGAAAGCGGAGTATCGCCGGGGTGGAACGGATTGGCTGAGCCGA
+GCCACCACGTCCTCGACGTCCTCGGGTCCCAAGGTGATATGCGACGTGAGCGGCCCATGGAATATCGCTG
+GGCGGTAGGGGAGGGCCAGCGGGGGATCTTATCTCGAGGGATGGGGTGGGGATGCATCGATAAGCCCCCC
+GCTGAAGCCTGGGGTTCGACGGGGATCTCAGACTTGGGGGGATTGGGAGGTGATGAGACCCCCGTCGAAG
+TCTAGTGCGTTGACCTCACTCGGCGGTGTCGCCGGCGTGGAACAACGGGATCGAGTACGTGGTCTCGCTC
+TCACTAAACAGCTGTGCGTGTGACAACGGGTCATCATCCTTTCATGTGACAGGCGAGCGGCGTTGCGTTG
+TAGTCGATTTCCACTTCCTGACTTATCTTTGGCGGGTTTGGACTCCGCTGGTATCCCACGACTAGTCGGT
+GGCCGGGGGAAATGCCGAATCCCGCATCCGGTGGATCGTGAAGTCCACCAATCGGGGGACGATCGGCCCG
+CGGTGCCCCCCTACCCGGTTAACGCGCACACATTCCACACGAAACGCGTTAGTGTGCAAACCTTTATCCC
+ACTGTGCTGTGAACGTGACTCTTGTTGGCCACTGTTGTCGAGGTGCCTTAAATGACGCAAGTGCGACAAC
+AACGAGAAGCGGGAGATGACGGCACACACACACACGACGGGACACGGACCTGGCGAACGGGCCGGCAGGC
+GACGACGTTGCTCGCGTTGCTGGCCGGGGTGTTTGGTGGTGCCGCGAGCTGCGCGGCGCCGATCCAGGCC
+GACATGATGGGTAACGCATTCCTGACAGCGTTGACCAACGCCGGCATTGCCTATGACCAACCGGCGACCA
+CGGTGGCGCTAGGCAGATCGGTTTGTCCGATGGTGGTTGCGCCGGGCGGGACGTTCGAATCGATCACGTC
+CAGAATGGCTGAGATCAATGGCATGTCGCGTGATATGGCGAGTACGTTCACCATTGTCGCGATTGGGACG
+TATTGCCCGGCGGTGATTGCGCCGCTGATGCCTAACCGGTTACAGGCCTGATAGTTACGGGGCGCAGCAA
+CCCCCGTAACCTCTACCGAGTGGTCGACGACAGGCAAGGGCGCAGGGGCGGGCGACGACCGCGCTCGGCT
+GCCGCCGACAACCGACCTGCGTTCCGGGATGGGCCCGCGATTCCGCCGGGTATCCACGCCAGGCAACTGG
+CGCCCGAGATCCGGCGCGAACTGAGCACCTTGGACCGTGCCACGGCCGACGCGGTGGCATGTCACCTGGT
+AGCTGCCGGCGAGTTGATCGACGACGACCCAGAAGCCGCTCTGCGCCACGCGCGGGCGGCGCGGGTTCGG
+GCCAGCAGGATCGCCGCTGTGCGCGAAGCTGTCGGAATCGCCGCCTACCGCTGCGGCGATTGGGCGCAGG
+CGTTGGCCGAATTGCGGGCAGCCCGAAGAATGGGGAGCAAGTCCCCCCTGCTTGCGCTGATCGCGGATTG
+CGAACGCGGTCTGGGCCGGCCGCAGCGGGCCATCGAATTGGCGCGCGGGTCCGAGGCGGTCGAGCTCAGC
+GGTGACGCCGCCGACGAGTTGCGCATCGTCGCCGCCGGCGCGCGCGCCGATCTCGGGCAACTGGAGCAGG
+CGTTGACGGTGTTGTCCACGCCGCAGCTCGACCCGGGCCGTACGGGTTCGACCGCGGCGCGCCTGTTCTA
+CGCCTACGCTGAAATACTGCTGGCGTTGGGCCGTGGCGACGAGGCCCTGCAATGGTTCCTACGGTCCGCG
+GCGGCGGACATCGACGGCGTCACCGACGCCGAAGATCGGGTAGACGAGCTAGGCGCACGAGAACAGAAAT
+GAAAAGCATTGCGCAGGAACATGACTGTCTGCTGATTGACCTGGACGGGACGGTGTTTTGTGGCCGTCAG
+CCCACCGGCGGCGCGGTGCAGTCGTTGAGTCAGGTGCGCAGCCGCAAGCTGTTTGTCACCAACAACGCGT
+CGCGTAGCGCCGACGAGGTGGCGGCGCACTTGTGCGAGCTCGGCTTCACCGCAACCGGTGAGGACGTCGT
+CACCAGCGCTCAGAGCGCTGCCCACCTGCTGGCCGGCCAGCTGGCGCCGGGTGCGCGGGTGCTCATCGTC
+GGCACCGAGGCGTTGGCCAACGAAGTCGCCGCGGTCGGATTGCGTCCGGTACGACGCTTTGAGGATCGAC
+CCGACGCCGTCGTACAGGGCCTTTCAATGACCACCGGATGGTCCGACCTTGCCGAAGCCGCGCTGGCCAT
+CCGGGCGGGCGCCCTGTGGGTGGCGGCCAACGTCGACCCCACCTTGCCCACCGAACGGGGCCTGCTGCCC
+GGCAACGGGTCCATGGTGGCTGCGCTGCGCACGGCCACCGGCATGGACCCCCGAGTGGCGGGCAAGCCCG
+CGCCCGCCTTGATGACCGAGGCGGTGGCCCGGGGCGACTTCCGGGCGGCACTGGTGGTCGGTGACCGGCT
+GGACACCGACATCGAGGGTGCCAACGCCGCGGGGTTGCCCAGCCTGATGGTGCTCACCGGGGTCAACAGC
+GCCTGGGATGCGGTGTACGCCGAACCCGTGCGCCGGCCCACCTACATTGGCCACGACCTGCGCTCGTTAC
+ACCAGGACAGCAAGCTGCTGGCGGTGGCACCGCAGCCGGGCTGGCAGATCGACGTCGGTGGTGGTGCGGT
+AACGGTCTGCGCGAACGGCGACGTCGACGATCTGGAATTTATCGACGACGGGCTATCCATCGTTCGGGCT
+GTGGCCAGCGCGGTATGGGAGGCGCGGGCCGCCGATCTTCACCAGCGGCCACTGCGCATCGAGGCCGGCG
+ACGAGCGGGCCCGTGCGGCCTTGCAACGCTGGTCGTTGATGCGCAGCGATCATCCGGTGACTAGCGTAGG
+AACGCAATGACCATCGATCCTGACCAGATCCGTGCCGAAATCGACGCCCTACTTGCTTCGCTGCCCGACC
+CCGCCGACGCCGAGAACGGACCGTCTCTGGCCGAACTCGAAGGCATCGCACGTCGTCTTTCCGAGGCGCA
+CGAGGTGTTGTTGGCCGCCCTGGAGTCGGCGGAGAAGGGTTGAGTGCGGCGTGGCACGACGTGCCCGCGT
+TGACGCCGAGCTGGTCCGGCGGGGCCTGGCGCGATCACGTCAACAGGCCGCGGAGTTGATCGGCGCCGGC
+AAGGTGCGCATCGACGGGCTGCCGGCGGTCAAGCCGGCCACCGCCGTGTCCGACACCACCGCGCTGACCG
+TGGTGACCGACAGTGAACGCGCCTGGGTATCGCGCGGAGCGCACAAACTAGTCGGTGCGCTGGAGGCGTT
+CGCGATCGCGGTGGCGGGCCGGCGCTGTCTGGACGCGGGCGCATCGACCGGTGGGTTCACCGAAGTACTG
+CTGGACCGTGGTGCCGCCCACGTGGTGGCCGCCGATGTCGGATACGGCCAGCTGGCGTGGTCGCTGCGCA
+ACGATCCTCGGGTGGTGGTCCTCGAGCGGACCAACGCACGTGGCCTCACACCGGAGGCGATCGGCGGTCG
+CGTCGACCTGGTAGTGGCCGACCTGTCGTTCATCTCGTTGGCTACCGTGTTGCCCGCGCTGGTTGGATGC
+GCTTCGCGCGACGCCGATATCGTTCCACTGGTGAAGCCGCAGTTTGAGGTGGGGAAAGGTCAGGTCGGCC
+CCGGTGGGGTGGTCCATGACCCGCAGTTGCGTGCGCGGTCGGTGCTCGCGGTCGCGCGGCGGGCACAGGA
+GCTGGGCTGGCACAGCGTCGGCGTCAAGGCCAGCCCGCTGCCGGGCCCATCGGGCAATGTCGAGTACTTC
+CTGTGGTTGCGCACGCAGACCGACCGGGCATTGTCGGCCAAGGGATTGGAGGATGCGGTGCACCGTGCGA
+TTAGCGAGGGCCCGTAGTGACCGCTCATCGCAGTGTTCTGCTGGTCGTCCACACCGGGCGCGACGAAGCC
+ACCGAGACCGCACGGCGCGTAGAAAAAGTATTGGGCGACAATAAAATTGCGCTTCGCGTGCTCTCGGCCG
+AAGCAGTCGACCGAGGGTCGTTGCATCTGGCTCCCGACGACATGCGGGCCATGGGCGTCGAGATCGAGGT
+GGTTGACGCGGACCAGCACGCAGCCGACGGCTGCGAACTGGTGCTGGTTTTGGGCGGCGATGGCACCTTT
+TTGCGGGCAGCCGAGCTGGCCCGCAACGCCAGCATTCCGGTGTTGGGCGTCAATCTGGGCCGCATCGGCT
+TTTTGGCCGAGGCCGAGGCGGAGGCAATCGACGCGGTGCTCGAGCATGTTGTCGCACAGGATTACCGGGT
+GGAAGACCGCTTGACTCTGGATGTCGTGGTGCGCCAGGGCGGGCGCATCGTCAACCGGGGTTGGGCGCTC
+AACGAAGTCAGTCTGGAAAAGGGCCCGAGGCTCGGCGTGCTTGGGGTGGTCGTGGAAATTGACGGTCGGC
+CGGTGTCGGCGTTTGGCTGCGACGGGGTGTTGGTGTCCACGCCGACCGGATCAACCGCCTATGCATTCTC
+GGCGGGAGGCCCGGTGCTGTGGCCCGACCTCGAAGCGATCCTGGTGGTCCCCAACAACGCTCACGCGCTG
+TTTGGCCGGCCGATGGTCACCAGCCCCGAAGCCACCATCGCCATCGAAATAGAGGCCGACGGGCATGACG
+CCTTGGTGTTCTGCGACGGTCGCCGCGAAATGCTGATACCGGCCGGCAGCAGACTCGAGGTCACCCGCTG
+TGTCACGTCCGTCAAATGGGCACGGCTGGACAGTGCGCCATTCACCGACCGGCTGGTGCGCAAGTTCCGG
+TTGCCGGTGACCGGTTGGCGCGGAAAGTAGCGGCGCGCCGAAGGTGTTGACTGAATTACGGATCGAGTCG
+CTGGGCGCCATCAGCGTTGCCACCGCTGAGTTCGATCGCGGCTTTACCGTGCTGACCGGGGAGACCGGCA
+CCGGCAAGACCATGGTGGTGACCGGGCTGCACCTACTTGGTGGTGCCCGGGCCGATGCAACTCGCGTTCG
+GTCCGGTGCTGACCGTGCCGTTGTCGAAGGGCGTTTTACTACAACCGATCTCGACGACGCGACCGTCGCG
+GGGCTGCAGGCGGTTCTCGACTCGTCGGGGGCCGAGCGCGACGAGGACGGCAGCGTGATCGCGTTGCGCT
+CGATCAGTCGCGATGGACCGTCGCGCGCCTACCTCGGCGGCCGCGGTGTACCCGCCAAATCGTTGAGCGG
+TTTCACGAACGAGCTGCTTACTCTGCACGGGCAGAACGACCAGCTGCGGTTGATGCGCCCTGACGAACAA
+CGTGGTGCACTGGACCGCTTTGCGGCCGCTGGCGAAGCCGTCCAGCGTTACCGCAAGCTGCGGGATGCCT
+GGCTAACGGCCCGACGCGACCTCGTCGACCGTCGCAACCGGGCCCGGGAACTAGCGCAAGAGGCCGATCG
+GCTGAAATTCGCGCTCAACGAGATCGACACCGTCGACCCGCAGCCGGGGGAGGACGTGGCGTTGGTCGCC
+GACATCGCCCGGCTTTCCGAACTGGACACCCTGCGGGAGGCCGCGACTACTGCACGCGCGACGTTGTGCG
+GGACACCAGACGCGGACGCATTCGACCGCGGCGCCGTCGACAGCCTCGGGCGGGCACGTGCGGCACTGCA
+ATCGAGCGATGATGCCGCGTTGCGGGGGTTGGCCGAACAGGTCGGTGAGGCGTTGACGGTGGTCGTCGAT
+GCGGTCGCCGAGCTCGGCGCCTACCTGGACGAGCTGCCCGCCGACGCCAGCGCGCTGGACGCCAAGCTGG
+CGCGCCAAGCCCAGCTGCGAACGTTAACCCGCAAGTACGCCGCCGACATCGATGGCGTGCTCCGGTGGGC
+GGATGAGGCGAGGGCAAGGCTGGCTCAACTCGACGTCTCCGAAGAAGGGCTGGCAGCGCTGGAACGCCGT
+ACCGGTGAGCTCGCCCACGAATTAGGCCAAGCCGCAGTTGATCTCAGCACGATCCGGCGGAAGGCGGCCA
+AGCGGCTGGCCAAGGAGGTCAGCGCGGAGCTGTCCGCCCTGGCGATGGCCGATGCCGAATTCACCATCGG
+TGTGACCACAGAGCTGGCCGACCACGGCGATCCCGTCGCCTTGGCCCTGGCGTCGGGCGAATTGGCCCGG
+GCCGGTGCCGATGGCGTCGATGCGGTCGAGTTCGGTTTCGTCGCACACCGGGGGATGACAGTGCTGCCGC
+TGGCCAAGAGCGCATCCGGCGGCGAACTGTCCCGGGTGATGTTGTCCCTGGAGGTGGTGCTGGCTACTTC
+GCGAAAACAAGCGGCTGGCACCACGATGGTGTTCGACGAGATCGACGCCGGCGTCGGCGGCTGGGCTGCG
+GTACAGATCGGGCGGCGGCTGGCGCGGTTGGCTCGCACCCACCAGGTCATCGTGGTCACCCATCTGCCGC
+AGGTCGCCGCCTATGCCGATGTGCACTTGATGGTGCAGCGCACCGGGCGCGACGGTGCCAGCGGTGTGCG
+GCGCCTGACCAGCGAGGATCGGGTGGCCGAGCTGGCACGGATGCTGGCCGGGCTTGGTGATTCCGACAGT
+GGTCGCGCGCACGCGCGGGAGTTACTCGAGACCGCGCAGAACGACGAGCTCACCTAGCAAGGCTGTGACT
+GAAGTGATGTCATATAACTTGTGAGGCTAATGTTACGGCGCGCCTCCACGCACCTGCCCAGCTTCACCGC
+CAGAATCCCCCCATGAGGATGTCAGCGCTTCTGTCCCGTAACACCTCCCGGCCGGGCCTGATCGGCATCG
+CCCGGGTCGACCGGAATATCGACCGATTGCTGCGTAGGGTCTGTCCCGGCGACATTGTGGTTCTCGACGT
+CCTGGATCTGGACCGCATCACCGCCGATGCACTGGTGGAAGCGGAGATCGCCGCCGTGGTAAACGCATCG
+TCGTCTGTCTCGGGCCGCTATCCGAACCTCGGTCCAGAGGTGTTGGTCACCAACGGTGTCACGCTGATCG
+ACGAGACCGGACCGGAGATTTTCAAAAAGGTCAAAGACGGTGCCAAGGTTCGCTTGTATGAAGGCGGGGT
+GTACGCCGGCGACCGCCGGCTGATCCGCGGTACCGAGCGTACGGATCATGACATCGCCGACCTGATGCGG
+GAGGCCAAGAGCGGGTTGGTCGCCCACTTGGAGGCGTTCGCCGGCAACACAATTGAGTTCATCCGCAGTG
+AAAGCCCGCTATTGATCGACGGCATCGGGATTCCCGATGTCGACGTCGATCTGCGGCGTCGGCACGTGGT
+GATCGTCGCCGACGAACCCAGCGGACCCGATGACCTGAAGTCCCTCAAGCCGTTCATCAAGGAGTACCAA
+CCGGTGCTGGTTGGTGTGGGCACCGGCGCGGACGTGTTGCGCAAGGCGGGGTATCGCCCGCAGCTCATCG
+TCGGCGACCCTGACCAAATCAGCACCGAGGTGCTCAAGTGCGGTGCCCAGGTGGTGTTGCCCGCCGACGC
+CGATGGACACGCGCCGGGCCTGGAGCGAATCCAGGATCTCGGTGTCGGCGCCATGACATTCCCGGCCGCG
+GGCTCGGCGACGGATCTGGCCTTGTTGCTGGCCGACCATCATGGCGCGGCGCTACTCGTCACCGCCGGCC
+ACGCTGCCAACATCGAGACGTTCTTCGACCGCACGCGTGTGCAAAGCAACCCTTCGACCTTCCTCACCAG
+ACTCCGGGTAGGGGAGAAGTTGGTGGACGCCAAGGCGGTGGCCACGCTCTACCGCAACCACATCTCGGGC
+GGCGCCATCGCATTGCTGGCACTGACCATGCTGATCGCCATCATCGTGGCACTGTGGGTATCCCGCACCG
+ACGGCGTGGTCCTGCATTGGATCATCGACTACTGGAACCGATTCTCACTTTGGGTGCAGCACTTGGTCTC
+CTAGGTTTTCTTGGACGGTGGGTTCATGATCTCGTTGCGTCAACATGCGGTCTCACTGGCTGCGGTCTTC
+CTGGCGCTGGCCATGGGCGTAGTGTTGGGTTCCGGCTTTTTCTCCGATACTTTGCTGTCCAGCTTGCGTA
+GCGAGAAGCGGGACCTCTACACGCAGATCGACCGACTCACCGATCAGCGGGATGCACTTCGCGAAAAGCT
+CAGCGCGGCAGACAATTTCGATATCCAAGTAGGCAGCCGAATAGTGCACGACGCGCTAGTCGGCAAGTCG
+GTGGTCATCTTCCGCACCCCGGATGCCCACGACGACGATATCGCTGCGGTGTCGAAGATCGTGGGACAGG
+CCGGCGGTGCGGTCACCGCAACGGTCTCATTGACCCAGGAGTTCGTCGAAGCCAACTCCGCCGAGAAACT
+GCGCTCAGTGGTGAACTCGTCCATTCTGCCGGCCGGTAGCCAGTTGAGCACCAAACTCGTTGACCAAGGT
+TCCCAAGCCGGCGACCTGCTCGGCATCGCCTTGCTGAGCAACGCCGACCCGGCGGCGCCGACTGTCGAGC
+AGGCGCAGCGGGACACTGTGCTGGCGGCACTGCGCGAAACCGGCTTCATCACCTATCAGCCCCGCGACCG
+CATTGGGACGGCAAACGCCACGGTGGTGGTCACCGGCGGAGCGCTCTCTACAGACGCCGGCAACCAGGGG
+GTCAGCGTGGCTCGGTTCGCCGCGGCGCTGGCGCCGCGCGGGTCTGGCACGCTGCTTGCCGGCCGGGACG
+GTTCGGCGAACCGACCCGCCGCCGTCGCCGTGACCCGCGCCGATGCCGACATGGCGGCCGAAATCAGCAC
+CGTTGACGACATCGACGCCGAGCCCGGACGAATCACCGTGATCCTTGCCCTGCATGACCTGATCAACGGA
+GGCCACGTGGGGCACTACGGCACCGGTCACGGGGCGATGTCAGTCACGGTTTCCCAGTAGGCCCGCGTTA
+GGGCGTGTTCCCCGCGGTGAGGCGCCGTGGATGTTAGGGTGGGTTTCCGTGGGTCGGCAGGCCCAGCAAG
+GCCAGAGAAATCTTGGCAGCGTCAAGAACAGCCCTGCCCGTCTTCACGGAGGTCGCTCAGTGCGAAAGCA
+CCCGCAAACCGCTACCAAGCACCTCTTCGTCAGCGGCGGCGTTGCTTCCTCGCTCGGCAAGGGACTGACC
+GCCAGCAGCCTAGGACAATTGTTGACGGCTCGTGGGTTACACGTCACGATGCAAAAGCTCGACCCGTACC
+TCAACGTCGACCCGGGTACCATGAACCCGTTCCAGCACGGCGAGGTCTTCGTGACCGAGGACGGTGCCGA
+AACCGATCTCGACGTCGGCCACTACGAACGGTTCCTCGATCGCAATTTGCCCGGCTCAGCGAATGTGACT
+ACCGGGCAGGTGTATTCAACGGTGATCGCGAAGGAGCGCCGCGGCGAATACCTGGGCGACACCGTGCAGG
+TGATCCCCCATATCACCGACGAGATAAAACGGCGCATCCTGGCGATGGCCCAACCGGACGCCGACGGTAA
+CCGCCCGGACGTGGTCATCACCGAAATCGGGGGCACTGTCGGCGATATCGAGTCACAGCCCTTCCTGGAG
+GCAGCGCGGCAAGTCCGGCACTATCTCGGCCGGGAGGACGTGTTTTTTCTGCACGTGTCGCTGGTGCCCT
+ACCTGGCGCCGTCGGGTGAGCTCAAAACCAAGCCAACACAGCACTCGGTGGCCGCACTGCGCAGCATTGG
+GATTACCCCGGACGCGTTGATCCTGCGCTGCGACCGCGACGTTCCCGAAGCGCTGAAAAACAAGATTGCG
+TTGATGTGTGACGTCGATATCGACGGCGTTATCTCCACCCCGGACGCGCCCTCCATCTACGACATACCCA
+AGGTATTGCACCGCGAGGAGCTCGATGCGTTCGTGGTGCGCCGACTCAATCTGCCGTTCCGCGACGTCGA
+TTGGACCGAATGGGACGACCTGCTGCGCCGGGTTCACGAACCACATGAGACAGTGCGAATTGCTTTGGTG
+GGCAAGTACGTCGAATTATCCGACGCTTACCTCTCGGTTGCCGAGGCATTGCGTGCCGGCGGATTCAAGC
+ACCGGGCCAAGGTCGAGATCTGTTGGGTGGCATCCGACGGTTGTGAAACGACCAGTGGTGCCGCGGCGGC
+GCTCGGCGATGTGCATGGGGTGCTCATTCCGGGCGGATTCGGCATCAGGGGCATCGAGGGCAAGATCGGC
+GCCATTGCATACGCGCGGGCGCGCGGGTTGCCGGTGTTGGGGCTGTGCCTCGGTTTGCAGTGCATTGTGA
+TCGAGGCCGCGCGATCGGTCGGTCTCACCAACGCCAATTCGGCCGAATTTGATCCCGACACACCAGATCC
+CGTTATCGCCACGATGCCCGATCAAGAAGAAATCGTGGCCGGCGAGGCGGATCTGGGCGGTACCATGCGT
+CTCGGGTCCTACCCCGCCGTGTTGGAGCCGGATTCGGTTGTTGCCCAGGCATACCAAACTACCCAGGTGT
+CCGAGCGGCATCGCCACCGGTACGAGGTCAACAACGCGTACCGAGACAAGATCGCCGAAAGCGGCCTGAG
+GTTTTCCGGGACGTCACCTGACGGACACTTGGTAGAGTTCGTCGAGTATCCGCCGGATCGGCATCCGTTC
+GTTGTCGGCACCCAGGCCCACCCCGAGTTGAAGAGCCGACCCACCCGGCCGCACCCACTGTTTGTCGCAT
+TCGTCGGGGCAGCCATCGATTACAAGGCGGGTGAGTTGCTGCCTGTCGAGATCCCCGAGATCCCCGAGCA
+CACACCCAACGGTAGCTCCCATCGGGACGGCGTGGGCCAGCCGCTACCGGAACCTGCGTCTCGTGGCTGA
+GCATGATTTCGAGACGATATCGTCGGAAACCTTGCATACGGGAGCCATTTTCGCATTACGTCGGGACCAG
+GTGCGGATGCCTGGTGGGGGTATTGTGACGCGTGAGGTCGTCGAGCACTTGGGTGCCGTAGCCATTGTGG
+CGATGGACGACAACGGCAACATCCCGATGGTTTATCAGTACCGCCACACCTATGGTCGGCGGCTTTGGGA
+ACTGCCCGCGGGGTTGCTCGACGTCGCTGGGGAGCCACCTCATCTCACGGCCGCCCGGGAGCTGCGGGAG
+GAGGTCGGGCTGCAAGCCAGCACCTGGCAGGTGCTGGTCGATCTGGACACCGCGCCGGGCTTCAGCGACG
+AATCGGTGCGGGTCTATCTGGCCACCGGACTGCGCGAGGTGGGCCGGCCCGAAGCCCATCACGAAGAAGC
+CGACATGACGATGGGGTGGTATCCCATTGCCGAAGCGGCTCGCCGGGTGCTGCGTGGCGAAATCGTCAAT
+TCCATTGCCATTGCCGGTGTTTTGGCCGTGCACGCGGTGACGACCGGGTTCGCCCAGCCACGCCCACTCG
+ATACCGAATGGATCGACAGGCCAACGGCGTTCGCCACGCGGAGAGCCGAGCGATGAAGACGCTGGCACTG
+CAATTGCAGGGCTACCTCGACCATCTGACGATCGAACGAGGTGTCGCGGCAAACACATTGAGCTCCTACC
+GACGTGATCTGCGCCGCTACTCCAAGCACCTGGAAGAACGAGGGATTACCGATCTGGCCAAGGTCGGCGA
+GCACGACGTCAGCGAGTTCCTGGTGGCATTGCGGCGCGGGGATCCTGATTCCGGCACGGCGGCGTTGTCC
+GCGGTGTCGGCGGCACGGGCGCTGATCGCGGTGCGCGGGCTGCATCGCTTCGCTGCCGCAGAAGGGCTGG
+CCGAACTGGACGTGGCGCGCGCCGTCCGGCCACCGACGCCGAGCCGGCGATTGCCTAAGAGCCTGACAAT
+CGACGAGGTGCTATCGCTGCTCGAAGGTGCGGGCGGCGATAAACCGTCCGACGGCCCGCTGACGCTGCGA
+AACCGTGCGGTGCTGGAACTGCTGTACTCGACCGGGGCGCGGATCTCCGAGGCCGTCGGCCTTGACCTCG
+ACGACATCGACACCCACGCCAGATCGGTGTTGTTGCGCGGCAAGGGTGGTAAGCAGCGGCTGGTTCCGGT
+GGGACGCCCGGCAGTGCACGCGCTGGACGCCTATCTGGTGCGGGGACGGCCCGACTTAGCGCGGCGGGGC
+CGCGGAACGGCGGCGATCTTTCTCAACGCGCGCGGCGGCCGGTTGTCACGGCAAAGCGCGTGGCAGGTTC
+TGCAGGACGCGGCCGAGCGTGCCGGCATCACCGCCGGTGTTTCGCCGCATATGTTGAGGCATTCGTTCGC
+CACGCATCTGCTGGAGGGTGGCGCCGATGTCCGGGTGGTGCAGGAATTGCTGGGGCACGCCTCGGTGACC
+ACGACGCAGATCTATACCCTGGTCACCGTCCATGCACTGCGCGAGGTGTGGGCGGGAGCTCACCCGCGGG
+CACGCTAAGCGATGACCGTCACTAGCGGTAGCGGTTGCTGGTCACTTGGCTCGCCCGCGACACAGAGGTT
+GCGCCTCTCGCTCATGGATCGTCTTCGTCGCTGTCGTGCAGGAGTTTTTCGGGGTGAAAGTAACTGTTGG
+TGCGGGGTTGTCCATGGTCGAGGTGGGCTGGGGGAAGCCATTCGGTGGTGCCGTCTTTGCGTTTGCGGGT
+GATCCAGCCCCCGGTGGTGGCCAGTTGGTGGTGGGGGCCGCAGCCCTGGGTGAGTTCGTTGATGTCGGTT
+TCTTGGCATTGGGCGAAGTCCGTCACATGATGCACCTCGGTGAGATAGCCCGGTACGTCGCAGTTGGGGA
+ACGAGCAGCCGCGGTCCTTGGCGTAGAGGACGATTCGCTGTCCGGGTGAGGCTAGCCGCTTGGTGTGATA
+GAGGGCCAGCTCGCGGCCGTGGTCGAAGATACGTAGGTAGTGGTTGGCGTGGCTGGCCAGCCGGATCACG
+TCGCTCATGGGCAGCAGGGTGCCGCCGCCGGTCAGCGCGTGGCCGGCGCGTGATTGCAGTTCGGTCAGGC
+TGGTGGACACGATGATGGCCGCGGGTAGCCCGTTGTGTTGGCCCAGCTCCCCCGAGCACAGCAGGGCCCG
+CAGCGCGGCCAGCAGGCCGTCGTGGTGGCGTTGGCCGGCGCTGCGGGTGTCGGCCTCGATCGCGGCCTGT
+GACGGGGTGCCGGCCAGGCAGGGGGTGTCATCGGCGGGGTTGGCCATGCCGGGGGCGGCCAGCTTGGCCA
+ACACGGCGTCGACGGTGGCGCGGGCTTCGGGGGTCAGGTAGCCGCTGATCGCCGACATGCCGTCGGGGCC
+TTGGTTGCCCAGGATGATGCTGCGGCGGCGGGCGCGGTCGGTGTCGTTGTAGTTGCCGTCGGGGTTCAAA
+CAGTCGGCGAGTTTGGTGGCTAGTTTGTGTAGTTGGTCGGGGCGAAACCGGCCGCCTAGGGTGGCCAGCT
+CGGCTTCGGCTTTCTCCCGGGTGGGTAGGTCCACATGGTGGGGTAGCTGGTGCAGGAAGCAGCGGATGAC
+CTGCACGTGGGCGGGGCCGAGGTGGCCGGCGCGTTGGGCGGCGGCGGTGGCGGTCAGCAACGGGGGCAGG
+GGTTGGCCGGTTAGCGTGCGGCGTGGGCCCAGGTCGGCGGCTTCATGGATGCGTCGGGATGCTTCGCCGC
+GGCTGATGTGTAGCCGTTCGGCCAGGGCGAAGGGTAGTTTGCCGCCCAGTTCGGTTTGGTCGGTTTGGTC
+GGCGAGTTTGTTGATGAAGGGGTGTTCGGCGGCGGGTAGGCGCCGACGGATCTTTTCGCAGCGCTGCAGC
+ATTGCCAGGCATTCCGGGATGGTCAGGTCGTCAGGGGAGACCTTCAGGACCCGGTTAAGGGCGGTGTCGA
+GGTTGTCGAACGCGGCGACGGCCTCCTCCCGGCTACTCGAATACATGTTCGAATACTATCACGGTTAGCC
+GGCCGATGCCATGCTGATTGTGGGTTAATCCAATGTGGTGCAGTTGAATTCAGGAGCATCGCCAGCCGCG
+AGGCCACGCCTATTCGGCGAGCATAATGGTCGGCTCGGAGACATCCAGCAACATGAGCGATGAAGACATC
+ACGTGCGATGGGTGGTCACGGTGGGCAGCTCTGACGCGCTGTTTCGCGTAGTCGACGGCGTGCAGGTAGC
+CCCGGCCTTGACACGTTCCGGCCCGCTCAAGCGAGTAGTCCGCGGATGTCGTCGACGGTGGGTACGGAGC
+CGAAGGCGTTGCCGTCGTCGACGACGCTGGCGAATAGGTTTGAGGTCCAGCCCGAAGCCGCGGGCTTGAG
+GCTGATGAGGAAAACCGGCGCGTTGCGCTCGTTGAACTGCTGGATCACATTGGGGCGTCATCGAGGTCGA
+TCGACGGATACATCAGGGAATGCATGGCCGCACCGTATCGACTCGGTCTGACAGCCATCCGCAGCCACAC
+CGCAACCGCACGCGATGACCAATCGACGACTAACCGTCGACTAACCCAGGTATTCGGACTCCAATACCAA
+GTCGGGCACCAGGGTCTGGTATTCGAGGTGCGTCTTGTGCTCAATGGTGTTCCATGACATGCCTTGTTGC
+CGGCGCATATATGCACGGTACTTCGGCGCGCCGGGCACCCTGACATTGTCGGCAACCACGATCGAGCCCG
+GGTGCAACCAGCCCCGGTCTAGGATGCTCTGCAGATCGGGCAGGTAAGCCTTCTTGTCATGGTCGAGGAA
+CACAAAATCGAGTGTGCCAGTTGCGAATCCGTGCTCGGTTAGCGCGTCCAGGGTGCGCCCACCGTCGCCG
+ATGGTGCCGACCACGCACACCACCCTGTCATCGACGCCGGCATGCGCCCATATTCGCCGGGCGTTGCTGG
+CGTTGGCTTCGGCGAGTTCGACGGAGTACACCCTGGCCTCCGGAGCGGCCCGGGCGATCCGCAGCGCGCC
+GTAGCCGAGGTAGGTGCCCAACTCCAGCGCCAATGCCGGGTCGGCGCGCCGAACCGCCGCGTCGAGCAGC
+GTCCCTTTCTCGTCACCGACGTTGATGAGCATCGACTTCTCATAGGCGAACTTGTCGATGGTGGCCAGCA
+CGTCGTCGATGTTGCCGGCCCCGGCGTGGGCGAGGACATAGTCGACGGCCGCCGCTTCGCGTCCATCACC
+GATCTGGCCCGTCGTGGTGATATTGCGGATCCCGGCCGCCATCCGCCAGACCGACCACCGCAACGGGGCA
+ATGCGCGCTTTGCGAATCATCGCTCGCTAGCTTACGCACAGATTTCGCGGACCTGCGGGCACCTGGTTCA
+CCTGCTGACACTGGCTCGACGACGACCGCACTTCGGAGTTTGGGCCGCGCGTGGATTTTCATTGCAAGCC
+TGGCCATACCGCGGCCGAGCTGCTGACGAACCCCGACGACCTGGCAGTGAAAACCAAAGCTGCGGCGGCT
+CTGCCGGCGCTGGGTGACGAGCCAACCCACGGCGAGCAGCACGAACCATAGCGGGAACCACGCCAACGCG
+GTTGCGGTTTCGGTTTCGGTGGTAAGTGTCCAGATCACGAACGCGAAAAACACCAGCACGGCCCAGCACA
+TCACCACGCCACCGGGCATCTTGTACACCGAGTCGGTGTGACGCTGTGGGTGTCGGCGACGGTAGACGAG
+GTAGCTGATGATGATCATTGCCCACACAAACATGAACAGCAGGGATGAGACCGTCGTGACGAGTGTGAAT
+GCCCCAATCACCGACCGACCGGCATAGAGCAGCGGGATGGAGGTCAGCAGTAGCGGAGCCGTCAGCAGCA
+GGGCGGGTGCGGGCACGCCGCCGCGATTGAGTTGGTGGAAAGCGGCCGGAGCGTGGCCTTCGTCGGCGAG
+GCCGAAAAGCATTCGCCCGGTGGAGAAGAAGCCGGAGTTCGCTGACGAGGCCGCTGCGGTGACCACGACG
+AAGTTGACGACCGACGCCGCAGCGGCAAGTCCGGCTAGGGAGAACATCGTCACAAACGGGGACTCGCCAC
+TGGCGAACTGCCGCCACGGCACGACGGCCAGGATCGCCAGCAGGGCACCGATGTAGAACACCGCGACCCG
+CAACGGCACGGCATTGATCGCGCGGGGAAGGGTGCGGCGCGGGTCCGCTGTCTCAGCCGCGGCGGTGCCA
+ACGAGCTCCACACCGATGTATGCGAAAAACGCGATCTGAAAGCCACTGACCACGCCCAGGAAACCCGTTG
+GGAAGAACCCGTTGTCGTTCCACAGGTTCTCGATGGTCGCGTGCACACCATGAGGGGAGACGAAGTTGGT
+TGCCACCAGGATCGCGCCGACGGCGATGAGGCACACGATGGCAGCGACCTTGATCAATGCGAACCAAAAC
+TCCAGCTCCCCGAAGTGGCGGACGCTGAACAAATTGACAGCGAGAATCAGGGCGACCGTGACCAGGGCCG
+GGACCCAGATTGGCAAGCCGGGCCACCAAAACCTGGCATAGCCGGTGATCGCGACGAGGTCTGCGATCCC
+GGTGACCACCCATGCGAACCAGTACGACCACCCCACGAAAAAGCCCGCCGCCGGGCCCAGGAGGTCGGCG
+GCGAAGTCAACGAACGACTTGTAGTTCAGGTTCGACAGCAGCAGCTCGCCCATCGCGCGCAACACAAAAA
+ACACAAAAAACCCAATGATCCCGTAGACCACCATGACCGCCGGACCGGCGAGCGAGATCGTTCGCCCAGA
+TCCCATGAATAGGCCGGTGCCGATCGCGCCTCCAATCGCGATCAACTGAATATGGCGGTTGGCAAGGTCC
+CGACGCAGGTGCGGCTGGGTGTCTGTCGGGTCGGCAGCCGCGATATCGTCCGGCATATATGGCGTCCTCA
+AGTTCTGGGGTAGGGAAGGCCTCGCGTTATCCGGCAAACGGCGGCCGGGACATCACCGTAACCCGGAACC
+CGTAGCGGGGACCCGCACCCCCCGTACCGGTGCCCGAACCGGCTAGCGGCATGCCGCCCAACAGGTTTCC
+CGCCGCACCGGCCTCCGGTTGCTCGACGATATCGCTGACCAGGGGTGCGGAGGCCGAACCCACGGTCGGG
+GCTAGGCTCGGACTGGCCCCTGCCCAGTTGGGCGGCACCGATAACTTGCCGATGGTGGCCGCGTTGCCTA
+GACCCGCGGATACGGGTCCGGTACCGCCAACCGCGGCGCCGACGGCCGCCGGCGCCGCGGCGGCAGCTTC
+GGCGGCCTCGGGACCGATCCATCCCAGCGCCCGCCACGATGTAATAAGGCTGTTGCCAATACCAATGGCG
+AAATATGGCAAACCCACGGTGTTGTAAAACAGCTGTGATATCGGCAGATACCAGTTGATGAACCATTCCA
+GCCACCCCGGGGTCGCGGCGGCGGTCAACGCGGACGACAGGGGCGAGGTGAGGCCCAGCAGCGTGTTGGG
+CAAGTGGGCGATCAGCTCCGCTATTGCGCTCTGCGCCGCGCCGGCTGAGGTGCCGGCGGCTTTGGCGACT
+GCGGACAACTGCGTCGCCGCGGCGGATGGGCTGGTGGTGTTCGGCGGCGGGGCAAACGGCGTCACTTTGG
+TCGCGGTCGCCGAGGAGCCCGCGTAACCGTACATGGCCATGGCGTCTTGGGCCCACATTTCAGCGTATTG
+AGCTTCGGTGGCCGCGATTGATGCGGTGTTTTGACCGAACACGTTATGCGTGACCAGCGACGTGAGCCGC
+GCGCGATTGGCCGCGATCAGCGGCGGGGGCACAATGGCGGCAAACGCGGTTTCGTAAGCGGCCGCCGCCG
+CACGCGCCTGACTGGCTGCCTGCTCAGCTTGGATGGCGGTGGCTCGCATCCACGCCACATACGGGGCGAC
+CGCTTCGACCATCAACGTCGACGCCGGACCCAGCCATTCTTCGGTTTGCAGCGTCGTGATCACCCGCTCG
+TAGCCGACGGCGGCCACACTGAGCTCGGCGGCCAGCCCGTTCCACGCGGACGCTGCGGCAACCATCGGTG
+CCGAGCCCGGGCCGCAATACATGCGCCCGGAGTTCACCTCCGGTGGCAACGCCCCAAAATCCATCGCTAT
+GAACTCCTTACCTCGTCACGGGTTTTCGGTGGGCTATCCGACGTTCGGCCGGTCAGCCATCACGGTGAGT
+CGTCTTCCATATCGGCGTCCCATATGGGCGGCGCGACTCCTGCCCGGAGTCGGTGCCCCCCGGAGTAGGA
+CCGATGTTTCAGCCGCCTCGGCGGCGCTGCGAATACCGGGAATCGATCGCGCGACGGTTTGCGCCTGGGG
+CGTGGCGGGCGGTGCGGACCAGCCCGGCGGCACCGACATCGGTCCGATCTTGGCGGCCAGAGTCGCGCTC
+GCCGCCACCGGTCCAGCTCCCAGCTGCGACCACGCCGACCATCCAGCGGCTCCACCCGCGCCGGCCGCTG
+CCTCGGCCGCACCGGCTTCTGCCAATGCGGTGCTCCACAACATCCCGCCGACGAACTGCAGAGCATTCAG
+CGTTAACCCACCGCTGTCGTAAATGAACCCTTCGGCAGTGGCGAGGGCGCCCAGGAACATCATCCAGTAT
+TTCTGTATGTCGCTCCATGGAATCGCCGCGGCCCAGCTGTGCTGCCCCCGCAGCGCGGCCACCGCTGTTG
+CGTGGCCGACGAGGCCGGTCGCGTTGGTGGTTTGCGGCGGTGGTGCGAACGGAGTCAAAACCGTGGCGGG
+TGCCGCGGCGCTGGCATAGCCGTACATCGCGGCGGCGTCTTGGGCCCACATCTCGGCGTATTGGGACTCG
+GTGGTGGCGATCGCCGGCGTGTTTTGCCCGAACCAGTTGGTATCGACGAGCGTCATCAACAAGGTCCGGT
+TGGCCGCGATCGCCGGCGGGGGCACCGTCATGGCGAAGGCGGCTTCAAAGGCCGCTGCGGCCGCCCTAGC
+CTGCATCGCGGCCTGTTCGGCTAGCGTCGCGGTGGTACTCAGCCAGCCGACAAAGGGCAGGACGGCGGCC
+ACCATCGAATCCGATGCCGGCCCCGACCACCACCGCATGTTTGTCAGCTCCGAGATCGCCGCACCGTAGC
+CAGTCGCTGCCGACGACAACTCTGCGGCCAGCCCGTCCCAGGCCGCCGCGGCAGCCATCAGTGGCCCGGA
+TCCCGGACCGCTATACATACGACCCGAATTGATCTCGGGAGGTAACGCCCCAAAGTTGGACAGGGAATGC
+CCGGCGATGCCGTCAGCAACGGCGGTGACCCCAACAAGGCAGCAGGCGACGCTGCCCGGGGGGACATGCC
+CCTGGTTGACCGGGACATCGAGGGTCATCGAAAACCGCCTCGTTATGGGTGGGCTGGCTCGACACCGTCG
+TCGATACGATAGCTATGACTAGGGCAACAGTGACCTAGCACGTTAATCTCCATAAGAGATCTTCTGCAAA
+AAAGGTTTCGGCCGTGTGACGCGCGTGTTAATACCCCATAGGGGTATAATCGTTACTGTTGGCAACGTCT
+GGCGTCCTGGCTCGGGCGACACACCGTCCCGATACATGTCAGCAACCGGGTCGATCGTGGTGAATGCACA
+GGCGGGCAAGGCGAATGCCGATGCGACCCCGACGAAGTAAGAGGGTACGTAATCGATACACCATGGGGAC
+ATTTGCCCTCCATGGCCTCACCCATCGCCTACCGTCGGCCTCGTTGCAGACGACGGCTGCCCGCCACCCG
+GATGTGACGCAATTCTCAATGCCTGGGCACTACCGATAACGCCGACCTGCCGCAGCTCGCGCATGTGGAC
+GCTGAAAGCCCGGAAGGAGCACACCGGCATATCCGGCAAGCCCACCGCACGGACCGATCGCCATGGCTCT
+ACTCGGTCCGGAGATTCTGAGCTACAAGCTAGTGCGCGGCGTTTTTCTCGATTGCCGGATCGCTGTGGCG
+CTCAGGGCGTTACGTGAAAGGTTCGGCAGCGGTGCTGCCCAGCCTGGCCGGTGGCGAACACGGTCAACAT
+GGTGAGGCCCTGCGGCACCCGAAATGCGGTGAGCAGAACGACGTTTGGTGCCATCGCGGATAGCAGCCAG
+CCAAGCTTGAACGCTGCGAGCGAGCCCATGTAGAGCGTTTGGTACCAAACCGATCGGTGGGCCAACTTGC
+CATGGGCTCACAGCGGCTATCGCGAGCGTGTAGCCGATCATCGTCCAGGCGACGGTGGCCTGAGCGGCAG
+GGGTTGCCTTATTCATCCTCTTGCGGCATGGTTGCCGCAGGGAGTGCCGGTAAGTCTGGTCGGCAACCTG
+GCCCGCTGCGGGTTGGGTTCGGATTCGCTCGGCTAGTAAGGTGCTCGCCTGGTGTTACAACGAATCGCTA
+GAGAGCTCTTATCGGGAGTGGCCGTCGCGATCGTTGCGCTGCCGCTGGCGATCGCGTTCGGCATTACCGC
+CACCGGAACGTCCCAAGGTGCGCTCATCGGGCTCTACGGCGCCATCTTCGCCGGATTCTTCGCGGCCGTG
+TTCGGTGGGACACCCGGACAGGTGACGGGCCCCACCGGCCCCATCACCGTCGTCGCTACCGCAACCATCG
+CCGAACACGGACTCGAGGGTGCCTTCTTCGCGTTTATCCTCGCCGGCGTCTTTCAGATCCTGTTCGGGGC
+GTGCCGGCTCGGTTCACTCATCCGCTACGTGCCCCACCCCGTGATCTCTGGATTCATGGGGGGAATCGCG
+ATCCTCATCATCATGACCCAGCTGGATCAGGTGCGCAGCAGCTCCCTGCTCGTGTTGGTAACGGTCGTCC
+TGCTGCTGGCTAGCGGCCGGTTTATCAAAGCGATTCCACCGAGCCTGCTCGTCCTGGTTCTGGTCAGCTC
+GGTGCTGCCGCTCGCGGCGCCATGGCTGCGCGACCTGCGCGCTGGGCCGGTCTCGATCAACAGGACGGTC
+GACTACATCGGCGAGATCCCACAGGCCATGCCGTCTTTCGACTTCCCGCAAGTCGCCAATTCGACGATGC
+TGCAGGTGCTGCTGTCGGCGGTGGCCATCGCGCTGTTGGGATCCCTCGATTCACTGCTGACGTCGCTGGT
+CATGGACAACATCAGGGGCACCCGGCACCGGAGCAACAAAGAACTGATCGGCCAGGGGATTGGAAATATC
+GCCGCCGGGCTCTTCGGCGGGCTGGCCGGTGCCGGCGCGACCGTCCGATCGGTGGTGAACGTCAGAAATG
+GTGGTCAGACCGCCCTGTCGGCGGCCACTCACAGTGTCGTTTTGTTCGTTTTCGTTGCCGGGCTTGGTGC
+CGTGGTGCAGTACATCCCGCTCGCCGTGCTGTCGGGGATACTGATATTGGTTGCCGTCGGCATGTTCGAC
+TGGCACGCCATGCGCAAAGCGCATGTGTCACCCAGGGGCGACGTCATCGTCATGTTCACGACGATGATCA
+TCACCGTCGTCGTCGACCTCACCATCGCGGTGATGGTCGGAATCGCCCTCTCGCTGCTGGTCCATAGGCT
+CCGATCCCGGCAACGCAAAGCCAAGGTCACCCAGGACGACACCGGCACCTATCGCATCGACGGTCCGTTG
+TCGTTCCTGTCCGTCGACGGTGTATTTGGCTCCCTGCGCGACGGTCGTGAGGACGTGTCGCTGGACCTCC
+AGCACGTCACCTACCTCGACACCTCTGGTGCCCAGGCCCTGCTGTATTTCATCGACCACTCCGAGAAGGA
+CGGCGTCGCGGTAAGCATCAAGCGGATCCCCCCACGCCTCGAAAGCCAACTCACCGCACTCGCCGACAAC
+GAGCAACGTGACAAGCTGAGAACCGTCCTCGAATCCGCCTGACGCATTGGCTGGTTGATTTGCCTGCGGG
+TCTCCCGGGCCAGGCGTCGGTAGCCGTTAGACTTTCCTGCGATGTCCCCCCTGACGCCCGTCACCACGAG
+CCACGACCGGGTATGACCGACCACCCCGACACCGGCAACGGGATCGGCCTCACCGGACGGCCACCACGGG
+CAATCCCTGACCCCACGCCGCGCAGCTCGCACGGCCCGGCCAAGGTCATCGCGATGTGCAACCAGAAGGG
+TGGCGTCGGGAAGACGACGTCGACGATTAACCTGGGTGCCGCGCTCGGTGAGTATGGCCGGCGGGTGCTG
+CTGGTGGATATGGATCCGCAAGGAGCGCTGTCCGCGGGCCTGGGCGTGCCGCACTACGAGCTGGACAAGA
+CCATCCACAACGTGCTGGTGGAGCCCCGGGTGTCGATCGACGACGTGCTGATCCACTCCCGGGTGAAAAA
+CATGGATCTGGTCCCCAGCAATATCGATCTGTCCGCGGCGGAGATCCAACTGGTCAACGAGGTGGGTCGC
+GAGCAGACGTTGGCCCGGGCGCTGTACCCGGTGCTGGACCGCTACGACTATGTGCTGATCGACTGCCAGC
+CGTCGCTGGGCCTGCTCACCGTCAACGGGCTGGCCTGCACGGACGGCGTGATAATTCCGACCGAGTGCGA
+GTTCTTCTCGCTGCGCGGCCTGGCATTGCTCACCGACACCGTCGATAAGGTGCGCGACCGGCTTAATCCG
+AAGCTGGATATCAGCGGAATCCTGATCACCCGCTACGATCCGCGGACCGTCAACTCGCGAGAGGTCATGG
+CCCGTGTCGTGGAACGGTTCGGTGACTTAGTGTTTGACACCGTGATCACCCGCACGGTTCGTTTCCCGGA
+GACCAGCGTCGCAGGCGAACCCATTACCACCTGGGCGCCGAAGTCGGCGGGTGCCCTGGCCTACCGTGCG
+CTGGCTCGCGAGTTGATCGACCGATTTGGCATGTGAACGGCCTTCAGAACAGCCTGGCGAACGGTGGGAC
+GGCACCCGAGAACGGCTACTCGGCTGGTTTTCGGGTCCGGCTGACCAACTTCGAGGGCCCGTTCGACCTG
+CTGCTGCAGCTGATCTTTGCGCACCAACTCGACGTCACCGAAGTGGCGTTGCACCAGGTCACCGACGACT
+TCATCGCCTACACCAAAGCGATCGGCGCTCGGCTGGAACTAGAGGAGACCACAGCGTTCCTGGTGATCGC
+CGCAACCTTGCTCGATCTCAAAGCAGCCCGGCTCCTGCCAGCCGGACAGGTCGACGACGAGGAAGACCTC
+GCGCTTCTGGAGGTACGCGACCTGCTGTTTGCCCGGCTGCTGCAATACCGGGCGTTTAAGCACGTCGCAG
+AGATGTTCGCCGAACTGGAGGCCACCGCGCTGCGCAGCTATCCACGGGCGGTGTCGTTGGAGGACGGGTT
+CGTCGGTCTGCTTCCCGAGGTAATGCTCGGCGTTGACGCTCACCGGTTCGCCGAAATCGCTGCGATCGCA
+TTAACCCCGCGGCCAGCCCCGACGGTGGCCACCGAGCACCTGCACGAGTTGATGGTCTCGGTTCCCGAGC
+AGGCCGAACACTTGCTGGCGATGCTGAAAGCGCGGGGCAGCGGCCAGTGGGCGTCATTTTCGGAGCTGGT
+CGCCGACTGCACGGCGCCCATCGAGATCGTGGGGCGCTTCCTGGCGCTGCTCGAACTGTATCGGACCCGG
+GCGGTAGCATTCGAGCAGTCAGAGCCGCTTGGCGCGCTCCAGGTTTCGTGGACCGGTGACGATGCAGAGC
+GCAGCGATGAGAAGGAGCGGCGCTTGTGACCGAACATATGCCCGAACACGATCCGAGCTATGGCATCCCG
+GATATCGCTGAGCCCGCGGAGCTGGATGCCGACGAGCTTAAGCGTGTGCTAGAGGCGCTGCTGTTGGTGA
+TCGACACCCCAGTGACAGCCGACGCGTTGGCCGCGGCCACCGAACAGCCGGTCTACCGGGTTGCGGCAAA
+GCTACAGTTGATGGCCGACGAGCTCACCGGGCGTGACAGCGGCATCGACCTGCGCCACACGAGCGAGGGT
+TGGCGGATGTACACCCGCGCCCGATTCGCGCCCTATGTCGAGAAGCTGTTGCTGGACGGCGCGCGAACCA
+AGCTCACCCGGGCCGCGCTGGAGACCCTGGCCGTGGTGGCCTACCGCCAGCCGGTCACACGAGCGCGGGT
+TAGTGCGGTGCGCGGGGTCAACGTGGACGCCGTGATGCGTACGCTGTTGGCCCGCGGCCTGATCACCGAG
+GTTGGTACCGACGCCGATACCGGCGCGGTGACGTTCGCCACCACCGAGCTCTTCCTGGAGCGCTTGGGAT
+TGACGTCGCTGTCGGAGCTGCCCGATATCGCACCGCTGCTTCCCGACGTCGACACAATTGACGACCTGAG
+CGAATCCCTGGACAGTGAGCCACGTTTCATCAAACTCACCGGTGAGCTGGCGTCCGAGCAGACGCTGTCG
+TTCGACGTGGACCGTGATTGATGGCCGAGCCGGAAGAGTCCCGGGAGCCCCGGGGCATCCGCCTGCAGAA
+AGTGTTGTCTCAGGCTGGAATCGCGTCGAGGCGAGCCGCCGAGAAGATGATCGTCGACGGCCGCGTCGAA
+GTGGACGGGCACGTGGTGACCGAGTTGGGTACTCGGGTCGACCCTCAGGTCGCGGTGGTCCGTGTCGACG
+GGGCCAGGGTGGTGCTCGACGACTCGCTGGTGTACTTGGCGCTGAATAAGCCGCGCGGCATGCACTCGAC
+CATGTCCGACGATCGCGGCCGCCCGTGCATCGGCGACTTGATCGAACGAAAGGTCCGGGGCACCAAGAAG
+CTTTTTCATGTCGGACGCCTAGACGCGGACACCGAGGGACTGATGCTGCTGACCAATGACGGCGAGTTGG
+CGCACCGGTTGATGCATCCCTCCCATGAGGTGCCCAAGACGTATCTGGCGACGGTGACGGGGTCGGTGCC
+GCGTGGGCTGGGCCGAACGCTGCGAGCGGGAATCGAATTGGACGACGGACCGGCGTTCGTCGACGATTTC
+GCGGTAGTGGATGCGATCCCCGGCAAGACGTTGGTGCGGGTAACGCTGCATGAGGGACGCAATCGCATTG
+TGCGCCGACTGCTGGCGGCCGCCGGCTTCCCGGTGGAGGCATTGGTGCGTACCGATATCGGCGCGGTGTC
+ACTGGGAAAGCAACGCCCGGGCAGCGTTCGGGCCTTGCGGTCGAACGAGATCGGGCAACTGTACCAAGCG
+GTGGGCCTGTGAGTCGCCTAAGCGCAGCGGTAGTCGCGATCGACGGGCCGGCCGGCACCGGAAAATCCTC
+GGTGTCAAGGCGATTAGCGCGCGAGCTGGGCGCACGCTTTCTGGACACCGGGGCAATGTATCGGATCGTG
+ACGTTGGCGGTGCTGCGTGCCGGTGCTGATCCGTCCGATATCGCTGCCGTCGAGACGATTGCGTCGACGG
+TGCAGATGTCGTTAGGCTACGATCCCGACGGAGACAGCTGTTACCTTGCCGGAGAAGACGTTTCGGTTGA
+GATACGCGGTGACGCGGTCACCCGTGCGGTCTCCGCGGTGTCGTCGGTGCCGGCCGTACGCACCCGGCTG
+GTCGAGCTGCAGCGAACAATGGCTGAGGGCCCGGGCAGCATCGTCGTGGAGGGCCGCGACATCGGAACCG
+TGGTGTTTCCGGATGCGCCGGTGAAAATCTTCTTGACCGCCTCGGCCGAAACGCGGGCCCGGCGGCGCAA
+CGCCCAAAACGTCGCGGCGGGTTTGGCCGACGACTATGACGGGGTATTGGCCGATGTGCGCCGGCGCGAC
+CACCTCGATTCCACCCGGGCGGTGTCACCGCTGCAAGCCGCCGGTGATGCCGTCATCGTGGACACCAGCG
+ATATGACCGAGGCCGAGGTGGTCGCCCATCTGTTGGAGCTGGTCACGCGGCGAAGTGAGGCAGTGCGGTG
+ACCCAGGACGGCACGTGGGTGGACGAAAGCGATTGGCAACTAGACGATTCGGAGATCGCGGAGTCCGGAG
+CGGCGCCTGTGGTGGCGGTAGTCGGCCGGCCCAATGTCGGCAAGTCCACCCTGGTCAACCGGATCCTGGG
+CCGCCGCGAGGCGGTGGTGCAGGATATTCCCGGCGTGACGCGTGACCGGGTCTGCTACGACGCGCTGTGG
+ACCGGACGCCGGTTCGTCGTACAGGACACCGGCGGATGGGAGCCCAATGCCAAGGGCCTGCAGCGGTTGG
+TGGCCGAGCAGGCCTCGGTGGCCATGCGCACCGCGGATGCGGTGATCCTGGTGGTCGACGCCGGTGTCGG
+TGCCACCGCCGCCGACGAGGCCGCGGCCCGTATCCTGTTGCGATCCGGCAAGCCGGTGTTCTTGGCCGCC
+AACAAGGTCGACAGCGAAAAAGGCGAATCCGACGCCGCGGCGTTGTGGTCGCTGGGCCTGGGTGAGCCGC
+ATGCGATCAGCGCGATGCACGGTCGGGGGGTGGCCGACCTGCTCGACGGGGTGCTCGCCGCGCTGCCCGA
+GGTGGGGGAGTCCGCGTCGGCGAGCGGCGGTCCTCGCCGGGTGGCGCTGGTCGGTAAGCCGAACGTCGGC
+AAGAGCTCCCTGCTGAACAAACTCGCGGGTGATCAGCGATCGGTGGTCCATGAGGCGGCGGGCACCACCG
+TCGACCCGGTGGATTCGCTGATCGAGTTGGGCGGTGACGTCTGGCGGTTCGTCGACACCGCGGGATTGCG
+GCGCAAGGTCGGCCAGGCCAGTGGGCATGAGTTCTACGCCTCGGTGCGCACGCACGCCGCCATCGACTCC
+GCCGAAGTGGCCATCGTCCTGATCGACGCGTCGCAGCCGCTCACCGAACAGGACTTGCGAGTGATATCGA
+TGGTCATCGAGGCCGGACGGGCGCTAGTCCTGGCCTACAACAAGTGGGACCTGGTCGACGAGGACCGGCG
+CGAGCTGCTTCAGCGCGAGATCGACCGAGAGCTGGTGCAGGTGCGCTGGGCGCAACGGGTCAACATCTCC
+GCCAAGACGGGCCGGGCGGTGCACAAGCTGGTGCCGGCCATGGAGGATGCGCTGGCGTCATGGGACACCA
+GGATCGCGACCGGCCCGCTGAACACCTGGCTCACAGAGGTGACGGCGGCCACACCGCCGCCGGTGCGCGG
+CGGCAAGCAGCCACGCATCTTGTTCGCGACCCAGGCCACCGCGCGGCCACCGACGTTCGTGTTGTTCACC
+ACGGGTTTTTTGGAGGCCGGCTATCGGCGGTTCTTGGAGCGGCGGCTGCGTGAGACGTTCGGGTTTGACG
+GCAGCCCGATCCGGGTCAACGTGCGGGTGCGAGAGAAGCGGGCCGGCAAGCGCCGCTGAGCGCACCTCGA
+ACGTGTGACCCGGGTAACCGGGGATGGACAGCGAGGCCGGTTCTGCTGTCCCATAATGCGGCTATGTTCA
+GCTGCATTACGGGATTTAGGTGTTGACACCCGAGCGCTCGGCGCTTACGCTTTCTCGTATAACGGGTGAT
+AAGTACCGTATTGCGGGAGTAGGTGGAGGAAATGGCGCTGGCTCAGCAGGTGCCGAACCTGGGTCTGGCG
+CGCTTCAGCGTGCAGGACAAGTCGATCCTGATCACCGGCGCGACCGGTTCGTTGGGCCGAGTTGCCGCCC
+GGGCGCTGGCCGACGCGGGAGCGCGGCTGACACTGGCCGGCGGCAACTCGGCCGGTCTGGCCGAGCTGGT
+CAACGGCGCCGGCATCGACGACGCCGCCGTCGTGACCTGCCGGCCGGACAGCCTGGCCGATGCCCAGCAG
+ATGGTCGAGGCGGCACTGGGCCGATATGGCCGTTTGGACGGAGTGTTGGTGGCCTCGGGCAGCAACCATG
+TGGCGCCCATTACCGAGATGGCCGTCGAGGACTTCGACGCTGTGATGGACGCGAACGTGCGGGGTGCCTG
+GCTGGTGTGTCGGGCGGCCGGACGGGTGCTGCTCGAGCAGGGTCAGGGCGGCAGCGTGGTGCTGGTGTCG
+TCCGTTCGCGGCGGGTTGGGCAATGCCGCCGGTTACAGCGCGTACTGCCCGTCGAAGGCGGGCACCGATC
+TGTTGGCCAAGACATTGGCGGCCGAATGGGGCGGTCACGGCATTCGGGTGAACGCGCTGGCGCCGACGGT
+GTTTCGGTCCGCGGTGACCGAGTGGATGTTCACCGACGATCCGAAGGGCCGGGCCACCCGGGAGGCGATG
+CTCGCCCGGATCCCGTTGCGCCGCTTCGCCGAACCGGAAGACTTCGTCGGCGCCCTGATCTATCTGCTCA
+GCGACGCCTCGAGCTTCTACACCGGCCAGGTGATGTATCTGGACGGCGGGTACACCGCATGCTGACCTCG
+CACGGGTTCTCCCGTGCCGCCGTCGTGGGTGCCGGGCTGATGGGCCGGCGCATCGCCGGCGTGCTGGCCT
+CGGCGGGCCTGGATGTCGCCATCACCGACACCAACGCTGAGATTCTCCACGCCGCAGCGGTGGAGGCCGC
+CCGGGTAGCCGGTGCTGGCCGTGGCTCGGTGGCCGCGGCAGCCGACCTAGCCGCGGCGATACCAGACGCC
+GACCTGGTGATTGAGGCCGTCGTCGAAAACCTGGCCGTCAAGCAGGAACTCTTCGAACGGCTGGCGACAC
+TCGCGCCCGACGCGGTGCTGGCCACCAACACCTCGGTGCTGCCGATCGGCGCTGTCACCGAACGGGTCGA
+GGACGGCAGCCGAGTGATCGGGACACACTTTTGGAACCCGCCGGATCTTATCCCGGTGGTCGAGGTGGTG
+CCCAGCGCGCGCACCGCCCCAGATACGGCGGATCGCGTCGTGGCGCTGCTGACCCAAGTCGGCAAGCTGC
+CGGTGCGGGTCGGGCGCGACGTGCCGGGTTTCATCGGCAACCGGCTGCAGCACGCGCTGTGACGCGAGGC
+GATCGCGCTGGTCGCCGAGGGTGTCTGCGACCCGAAGACGGTAGATCTCGTGGTACGCAACACCATTGGG
+CTGCGACTGGCCACCTTGGGGCCGCTGGAAAACGCCGACTACATCGGGTTGGACCTCACCCTGGCCATCC
+ACGACGCGGTGATCCCGAGCCTCAACCACGACCCGCACCCCAGCCCGCTGCTGCGGGAACTGGTCGCCGC
+CGGGCAACTCGGGGCGCGTACCGGTCACGGCTTTCTGGACTGGCCCGCAGGAGCCCGCGAGGCCACCACC
+GCCCGACTTGCCCAGCACATCGCCGCGCAACTCCAAGCCAACGAAAAAGGAAGGGGGACATAGCCATGAC
+GTTCGCCTGGCCCCTCGGTGCCGCCGAATCGACGTTGGAGTTCTACGACCTGTCCCACCCCTGGGGACAC
+GGCGCGCCGGCCTGGCCGTACTTCGAGGACGTGCAGATCGAACGACTCCACGGCATGGCCAAGAGTCGTG
+TGCTGACCCAAAAGATCACCACCGTCATGCATTCCGGCACCCACATCGACGCGCCGGCGCACGTGGTGGA
+AGGAACACCGTTTCTGGACGAGATCCCGCTGAGCGCCTTCTTCGGCACCGGCGTCGTCGTCTCGATCCCG
+AAGGGCAAATGGGGGATGGTCACCGCCGAGGATCTGCAAAACGCTACCCCCGACATCCGGCCCGGTGACA
+TCGTCGTCGTCAACACCGGCTGGCACCACAAATACGCCGACAGCGCCGAGTACTACGCCTATTCCCCGGG
+CTTCGACAAGAAAGCGGGCGAGTGGTTTGCGGCCAAAGGCGTCAAGGCGGTCGGCACCGACACCCAGGCC
+CTGGACCATCCGCTGGCCACGGCCATCGCCCCGCACGGTCCCGCGGAGGCACAGGGCGGCCTATTGCCGT
+GGGCGGTACGCGAATACGAGGCGCAGACCGGCCGCAAGGTGCTCGACGACTTCCCGGACTGGGAACCGTG
+CCATCGGGCGATCCTGTCGCAGGGCATCTACGGCTTTGAAAACGTCGGCGGTGACCTGGACAAGGTCACC
+GGCAAGCGCGTCACTTTCGCGGCGTTCCCGTGGCGCTGGGTGGGTGGCGACGGCTGCATCGTGCGGCTGG
+TGGCGATCGTCGACCCCACCGGGAGCTATCGCATCGAGACCGGAAAGGCGGCCTGATGAAACTGACACGA
+GCGTCGCAGGCCCCCAGGTATGTGGCGCCGGCGCATCACGAGGTGTCCACCATGCGGTTGCAGGGCCGCG
+AGGCGGGGCGCACCGAGCGATTCTGGGTGGGGCTGTCGGTCTATCGGCCCGGCGGGACGGCCGAGCCGGC
+GCCGACCCGGGAGGAGACCGTCTACGTCGTGCTCGACGGCGAGCTGGTGGTCACCGTCGACGGCGCCGAA
+ACCGTGTTGGGCTGGCTCGACAGCGTGCACCTCGCCAAAGGCGAACTGCGATCGATACACAACCGCACGG
+ATCGTCAGGCGCTGCTGCTGGTGACCGTCGCGCACCCGGTTGCCGAGGTGGCGTGATGAGCTGCACCGGC
+GACGATGCAGAGCGAAGCGATGCTGAGGAGCGGTGCGAATGAGCATCGTCATCACCGTCGCACCCACCGG
+CCCCATCGCCACCAAGGCCGACAACCCGGCGTTGCCGACGAGCCCCGAGGAAATCGCGACAGCCGTCGAG
+CAGGCCTACCATGCCGGTGCCGCGGTGGCCCACATCCACCTGCGCGACGAAAACGAAAGGCCCACAGCGG
+ATCCGAACATCGCGCGCCGGGCCATGGACCTCATCGGCGAGCGGTGTCCGATCCTGATCCAGCTGTCCAC
+CGGGGTCGGCTTGACGGTGCCCTTCGAGCAGCGCGAGCAACTGGTCGAGTTGCGCCCGCGGATGGCCACG
+CTGAATCCGTGCTCGATGAGCTTCGGCGCGGGCGAATTCCGCAACCCGCCGCAAGCGGTTCGTCGGTTGG
+CGGCACGCATGCGGGAACTGGACATCAAACCGGAACTGGAAATCTATGACACCGGGCATTTGGAGGCGTG
+CCTGCGACTGTGGGCGGAAGACCTGCTGGCCGAACCCTTGCAGTTCAGCATCGTGCTCGGGGTTCGGGGC
+GGAATGGCCGCCACCGCCGATAATCTGCTCACGATGGTGCGCCGGCTGCCCCCGGGGCGATCTGGCAAGT
+CATCGCGATCGGTAAGGCCAACATGGAACTGACCGCCATGGGCCTGGCGCTGGGCGGCAACGCCCGAGTC
+GGCTTGGAGGACACCTTGTACCTGCGCAAGGGCGAGCTGGCGCCGAGCAATCTGGCGCTGGTATCGCGCA
+CGATACGTCTCGCCGAAGCCTTGGACCTGCCGATCGCCTCGGTCGAAGAAGCCGAGGCGGCGCTGCAGCT
+GCCCGGCACGTCCTGAGAGGAGCTCGCTTGTGTCCGCCGAAGAGCAGGACACCCGCAGTGGTGGCATCCA
+GGTGATCGCGCGGGCGGCCGAACTGCTGCGGGTGCTGCAGGCGCACCCCGGCGGTCTCAGCCAGGCCGAG
+ATCGGCGAGCGGGTGGGCATGGCCCGCTCGACCGTGAGCCGGATCCTCAACGCGCTGGAGGACGAGGGGC
+TGGTGGCCTCGCGCGGGGCCCGGGGACCCTATCGGCTGGGCCCGGAGATCACGCGGATGGCCACCACGGT
+ACGGCTGGGTGTCGTCACGGAGATGCACCCGTTCTTGACGGAGTTGTCGCGCGAGCTGGACGAGACGGTG
+GACTTGTCGATCCTGGACGGGGATCGGGCGGACGTCGTGGACCAGGTCGTGCCGCCGCAGCGGCTGCGGG
+CCGTGAGCGCGGTGGGGGAGTCGTTTCCGCTGTACTGCTGCGCCAACGGCAAGGCGCTGCTGGCCGCGTT
+GCCGCCTGAGCGGCAAGCCCGCGCGCTGCCGAGTCGACTGGCGCCGCTGACGGCGAACACCATCACCGAC
+CGCGCGGCGTTGCGGGACGAGCTCAATCGCATCCGGGTGGACGGTGTCGCCTACGACCGTGAGGAGCAGA
+CCGAAGGCATCTGCGCGGTGGGCGCGGTGCTACGGGGGGTGTCGGTTGAGTTGGTGGCGGTGAGTGTGCC
+GGTGCCCGCGCAGCGGTTCTACGGCCGTGAAGCCGAGTTGGCCGGTGCTCTGCTGGCCTGGGTTTCGAAG
+GTAGACGCGTGGTTCAACGGCACTGAGGATCGCAAATGACAGAAGCGTTGTGCGACAAGCTCGTTGGGGC
+CTGGGACCTGGTGTCCTACGTGGAGCGGGCCGCGGCTTTGGCGTTGGGATACCTGGCCTACGGCGGACGG
+TAGTTCGTCGACAAGGCGTAGGGCGTGGCCGGGTTTGCAGGCCGGCTGCGGTAGGCTTTCGACCTGCCGC
+CGGTGGTGTCGCCGGTGGCACCGGGCTGTGGCGCAGTTTGGTAGCGCACTTGACTGGGGGTCAAGTGGTC
+GCAGGTTCAAATCCTGTCAGCCCGACTTACGTTTCCGCAGGTAGACCGCCCTGCTGGCGGTCCTCGGCTG
+CCGCTGAGGCAGTACCGCCAAGGGGTATGTACAGCAACCGGTACAGCAACCCGGTCAAATCCCCAGAGCA
+CCGCTGAGACCTTCCACTGCGGCTCGCGCCGCTTCGTCGCTGGTATGACCGCGCCACCGTGCTGGACACC
+GCCTACCGAGACCACCTCGAGCGGTTCGTTCGCAAACCACCCGAGCCACCCGCGCTACCGGCCTTCAGCG
+CGATCAACCCACCACCAAAGGAGGACCAGCCGACTCAATGAATCCCCGAAAATCGTGTCTCAGAAATGTT
+GACAGGTTCCGCGGTAGATCAGGCGACAAGCTCGATCTCCGCATTATGGCCATGGGATTGGGCAAGTCGC
+CCGTCGCAAGTGATAAGCGGTACGCCGAGGCCCTCGGCGAGGGCGACGTAGGCTCCATCGGCCACGGTAT
+GAGTGGACCGAAGTTGGTAGGCACGCTGGGTGAATGGCTTTAACGGCCAACGCCGAACGGGCAGGCTAAG
+GAAGTTGACAACCACGACGAGTCCTTCATGATCGCTGATCAGCTGACGCACGACCGCTTGACGTATCGCC
+CCGATCACCTCGACATCGAAATGTGCAGGGGCGTGCACGGTTTCGCCCCGCAAGCGCCGGGCGACCGCCG
+CACCCGCCGGCGTCGTGAGCATGAGCTCGACGGCCGCCGAGGCGTCCAACACGATCACTCAGATCGAGCC
+TCGTCAACAAGCTCGGCTGCGCTCGCGCCGAGATCCCGGCGCGGCAGTGCCGCTAGACGGTCGAGAACGT
+CGTCGAGGGCCGGTTCTTCCGCGATCTCGGCAAGCCGTGCTAGGAGGAAATCGCTCAGGCTCATCCGTTG
+CGCCGCTGCGCGGGCCTTCAGCTCGTGGAGAAGCTCGTCGGGAACGTTGCGGATCTGAACCATGGCGGAC
+ATGTTGTAAGCATATCGGACATGTGAAACACATGTCCGGTTGCCGGTGTGACCGGCTGGGGCGTGTAGGC
+GTCAACCCACGCCGTGCACGCGGCCATGGGCGGGTGCAGACTTTTGCCATGCAACCATGTGAGCTCACCG
+CCGTCGCGCTGACCGCAACGCCCCCGCCCGCGCCTCCGTCCCTGCGCCGGGCACCGGCGTCGACGTCACC
+GCGGCTGGCGTGATCGTGCCCGCCCGCGAGCCTGAGCCCCAGCCGCGCCGCGTGCTGAACGGCCTTTCGG
+ACGTACGCGCGTTCTTTCACAACAACACCATGCCGCTGTACTTCATCTCGCCGACGCCGTTCAACCTGCT
+GGGCATCTATCGCTGGATCCGAAACTTCTTCTACCTGACCTACTACGACTCTTTCGAGGGCGAACATTCG
+CGCGTGTTCGTGCCCCGGCGGCGCGACCGCAGGGATTTCGACGGCATGGGGGATGTGTGCAACCACCTGC
+TGCGTGATCCCGAGACACTCGAGTTCATCAAGAACAGGGGTCCCGGTGGCAAGGCCTGTTTTGTGATGCT
+GGACGAAGAGACCCAGGCGCTTGCGCGCCAGGCGGGGCTCGAGGTCATGCACCCCCCGGCGGAGCTGCGT
+CATCGCCTGGAATCCAAGATCGTCATGACGCGCCTGGCCGACGAGGCGGGCGTACCCAGCGTGCCGCACG
+TGATCGGGCGGGTGAGCTCCTACGACGAATTGTCGGCGCTCGCGCACGGCGCAGGGCTGGGAGACGACCT
+CGTCGTCGAGGCCGCCTATGGCAACGCCGGCAGCGCAACGTTCTTTGTGCGCGGATTGCGCGACTGGGAC
+CAGTGCGCCGGTGGCATAGTGGGGCAGCCGGAAATCAAGGTCATGAAGCGCATCCGCAATGTCGAGGTGT
+GCATCGAGGCCACCGTGACCCGCCACGGCACCGTGATCGGCCCGGCGATGACGAGCCTGGTCGGTTACCC
+GGAGCTGACTCCGTACCGGGGCGCCTGGTGCGGCAACGATGTTTGGCGTGGGGCGCTACCACCCGCACAG
+ACCCGCGCCGCGCGAGAGATGGTGGCAAAGCTGGGCGACGTCTTGAGCCGCGAGGGCTACCGCGGCTACT
+TCGAGGTGGACCTGTTGCACGACCTGGACGCCGACGAGCTCTACCTCGGCGAGGTGAACCCGCGCCTCTC
+CGGTGCAAGCCCGATGACGAACCTGACCACCGAGGCCTACGCCGACATGCCACTGTTCCTCTTCCACCTG
+CTCGAGTACATGGACGTGGACTACGAGCTGGACATCGAGGCGATCAACTCGCGCTGGGAGCGGGGCTACG
+GCGAGGACGAGGTCTGGGGTCAGCTGATCATGTCGGAGACCTCGCCGGACCTCGAGCTCTTCACCGCGAC
+CCCACGCACCGGGATGTGGCGCCTGAACCACGACGGGCGTGTCTCCTTTGCCCGCCAGGGCAACGACTGG
+GCCACGATGCTCGACGAGTCCGAGGCCTTCTACATGCGGGTCGCCGCACCGGGCGACCTACGCTGCGAGG
+GCGCCCAACTCGGTGTGTTGGTCACCCGCGGGCACCTGCAGACCGACGACTACCAGCTCACCGAGCGCGG
+CCGGCGCTGGATCGACGGCCTCAAGGCGCAGTTCGCCTCGACGCCGCTGACGCCCGCCGCCCCGATCGTC
+TCGCGGCTCGTCGCACGGGCGTGAGCGGCGGCGTCCCGGCCGGTCTCGCACTGGACAACTGGCTGTCGTC
+GCCGTATTCGCATTGGGCATTCCAGCACGTCGAAGACTTCATGCCGACCACGGTCATCGCGCGCGGCACC
+GAGCCGGTCGTGACGTTGCCCGCGGACAATGCGCCGATCGCCGACATCGGCTTGACCAGCACGGACGGGA
+TCGCCACCACCGTGGGCGCGGTGATGGCCGCCACCGCTACCGACGGGTGGGCGGTCGCGCATCGCGGTGC
+GCTGGTGGCCGAGCAGTACCTCGACGGCCTGGGACCCCGGACCCGCCACCTGCTGTTCTCGGTGAGCAAG
+TCGCTGGTGGCGGCTGTGGTCGGCGCGCTGCACGGGGCCGGGGCGATCGAGCTTGACGCGCCGGTCACGG
+CGTACGTGCCCGCCTTGGCGGACTGCGGCTACGCCGGTGCGACGGTGCGCCACCTGCTGGACATGCGATC
+GGGTGTCGCCTTCTCGGAGAACTACGACGACCCGGCCGCCGAGATTCACGTGCGCGAGCAGGTGATCGGG
+TGGGCGCCCAAGCGCGGTCCGGACCTGCCCGCCACGCTGCGCGACTACCTGCTGACCTTGCGGCGGAAGT
+CGGCGCACGGCGGCCCGTTCGAATATCGCTCGTGTGAAACCGACGTCCTCGGCTGGATCTGCGAGGCCGC
+GGCCGGACAGCCGATGCCCGAACTGATGTCGGAACTACTGTGGAGCCGCATCGGGGCCCAGTGCGATGCC
+ACCATCGCCCTAGACGTAGCCGGCGCGGCGGGCACCGGAATATTCGACGGCGGCATCAGCGCCTGTCTGA
+CCGACATGATCCGGTTCGGGTCGCTGTACCTGCGCGACGGTGTCTCGTTGGCCGGCCAGCAAGTGGTGCC
+CGCGGCCTGGATCGCCGACACCTTCGACGGCGGCCCCGACTCGCGTCAGGCGTTCGCCGCCAGCCCCGAC
+GACAACCCGATGCCCGGCGGGATGTACCGCAACCAAGTGTGGTTTCCCTACCCGGGCAGCAATGTCGCGT
+TGTGCGTGGGCATGTGCGGCCAGCTGATCTACGTCAACCGCGCCGCGGAGGTGGTCGCCGCCAAGCTGTC
+CACCCAGCCGCACTCCCATGAGCCGCACATGTTAGACACCCTGCGCGCATTCGATGCGGTGGCACACGAA
+TTGTCAGGAATCAGATCGAGTTCGACCAACGACCCGCAGCGGCCTTCCCCGCCAGCCCAGGAGGCCAGTC
+CGGGGTAACGGCTTGTGCCCACGTAACCGAGTTCCAGGGCGATGGGCTTATTAGCGGAAATATGACTCGT
+CCCAGGTATCCATACGACGCTTGCGTACCTCGGCGAGCTTGTGGTCAAGCGCCGCCTGCTCATTTTCGAT
+GGCACGACCGGCGTTTCTCACGGCGTTGTAGACGGCATCGTCCAGCTTGCATAGATCCTTTGCGGACACG
+TCGGTCGATACGAAAACCGAGAACCGAATACGGTCGTCGAGCAGCGAAATGTCGATCTTTGGTGATGGTT
+TGAGTTGGCGCTGGAAGTGTTTGGCTAGTGCTTGGATCCAATACTTTGGCCAATGCGGCACCGGTCTCAG
+ATCGTAGACGATGATGGCTTGCTCGCCGTTGTAGACGCCGATGGGCGCTTCCGCTCGGCTGAAGCATGGT
+CGCCGCAGGTTCCGCAGGTCCTGGAGTTCGTTCTCTTCATTACCCACCATGAGCCTCCGGCATCTGGTCT
+ACGGACACCACGGCTTGCCGCATGGCTGGGGCGAAGGGACTCCAAGCCATCCAGGATGGGAACGCGCGCC
+GCATCGCCGGCAGGCCGTCCAGTTCGATGCGCTCGGCGGAGATCTCGGCGGCCAGTGTGCTGCGGCCGCT
+GTAGACCCGATACAGATCTCGAGGATGGCCGCGCACCGTGAGGTCGACAGGTAGGCATGGATCGTGCAGG
+CACACCGAGATGTCCCCAGGTTCCAACACGAGCCAGGCCCACAGTGGCCGCTCGCCGTGGTAGCGGAACT
+CCACCACCACCCGCCGGCCGGGAAGGGCCTCGGTGTTGACGCGCCGGGAGATCCACAACGTGAGTAGTTC
+GGGGTCGCATTCGGCGGGAGTGGGGTCGGCCATCAACCAACGGGAGACCCAGTCCCCCAGGGTCTGCAGC
+ACGGGGCGTAGCTCCTCGCCGGCCACCGTGAACCGATAGCCCCCGCCCGTGTGTTCGGGGACCGCTTCGA
+TGATGCGGTCGTGCTGAAGTCGGCGTAGCCGCTGGGCCAGCACCGAGCGGGAGATGCCGGGCAGGCCCCG
+CTCGATTTCGGTGAACCGCAGCGGGCCGAAGAGCAGCTCCCGCACGATTAGCAGCGTCCAGCGGTCCCCC
+AGCAGCTCCGCCGCCCGCGCTACCGGGCAGTACTGGCCGTACGGCTGCACGACACCAGGCTAATCGCCAT
+CCCTGGCTGCGTGGTTCGGAATTCGAACTTCCCGCACCCCCTGTGGGAGGCGTAACGCTTGGTGCTGGAG
+GTGAGAGGCGATGACCGCGACGCTGACCAAGACGCTGGGTTCCCTCGACGATTTCAGGGGAACGCTTTGT
+GTCCCCGGTGATCCGGACTACCCCAGGGTGCGGGCCATCTGGAACGGGCAGGTGGCCCGCGAACCGGCCT
+TGATCGCCACGTGCCACGACGCGTGCGATGTCCGAACGGTGCTGCGGCGCCCGGTGGACGCCGGGATGGT
+GACCGCGGTACGTGGCGGCGGGCACAACGTGGCCGGCACCGCGCTGTGCGACGGCGGCGTGGTGATCGAC
+CTCTCGGCGATGCGGGCCGTCTCGCTGGATCCAGCGACTGGGCGGGTACGGGTGCAGGGTGGTGCCACGC
+TCGCCGATTTGGACCACGCCACGGTCCCGTTCGCCCGGGTGGCCCCCGCCGGGATCGTCACCACCACCGG
+TGTCGGCGGGCTGACGTTGGGCGGCGGGGTGGGTTGGACGACTCGACGTTTCGGACTGAGCTGCGACAAC
+CTGGTCGCGGTGCGGCTAGTCACCGCCGCCGGCGACTACCTAAGCGTCGACGACGAGCGCGACCCGGAGC
+TGATGTGGGGCCTGCGGGGCGGGGGCGGCAATTTCGGCATTGTCACTGAATTCGAATTCGCCACCCATCC
+GTTCGGTCCGGTCGCCGTGGCCGGCTTCGTCGTCTACCGGCTGGATGACGGGCCCGCGGTGCTTCGCGGC
+TACCGGCAGTTCGCCGCTGCGGCACCCGAGGAGGTGACCACGATCGTGGTCTTGCGCCACGCCCCGCCGG
+CACCGTGGATTCCCGTTGACCAGCGCGGCAAGCCGGTGGTCATGATCGGCGCCGTCCACACCGGGAGCAT
+CCAGACCGGGATCGAAGCGCTGCGACCGGTCAAGTCCCTCGCCAGACCCGTCGCCGACACCGTGTGGCCG
+ACCCCGTTCCTGGCCCACCAGGCGGTGCTGGACGCCTCCAACCCGGCCGGTCACCGCTACTACTGGAAAT
+CCGACTACTTGGCCGAGCTGAACGACGAGGCCATCGACTTGCTAGTTGAGCAGACGGCGCAGCTGTCCTC
+GCCGGACAGCCTCATCGGAATCTTCCAGCTCGGCGGCGCCGCCGCTCGCGGCGGTGAGCGTTCCTGCTTC
+CCGAGCCGGCACGCGCGATTCATGGTCAACTACGCCACCCATTGGACCGAGGCCCGCGAGGACGACCTTC
+ACCGCCAATGGACCCGCGACGCGATCGAGGCGCTGGCCCCGTACGGGCTGGGCACCGCGTATGTGAACTT
+CACCGCCGACGACGCACCGATGCACGTCGAAACACTTTACAGCACAACGGAGTTCAGTCGTTTGGTGACC
+CTCAAGAACCGACTCGACCCGGACAACGTGTTCCGCAATAACCACAACATCCGCCCCTCGGCATGAGGGG
+GCCCAAGTTGACCGTAGGAAGGACGATCATGGACCTCTATTCAAACCTCGTCGAAGCCGAACAACGCCTG
+GTCGCGCTGGTTTCGTCGATAGAAGCCGACAGCTACTCCTCGCCGACGCCGTGCGACCGCTGGGACGTGC
+GGGCGCTGCTCAGCCACGCGCTGGCCTCGATCGACGCCTTCGCGGCGGCCGTCGACGGAGCACCCGGACC
+GGACATGGCGCAGGTGTTCAGCGGTGCCGACATCGTCGGGGACGACCCCCTCGGTGCGACGCAGCGGATC
+ACCCGGCGGTCGCAGGCGGCCTGGTCGACCGTGCGCGATCTGAACGCGGAGCTGTCGACCTTCATCGGCG
+TGATGCCGGCGGGGCAGGCTCTTGCGATCATCACCTTCTCCACCGTCGTCCACGGTTGGGACCTAGCGGT
+GGCCACGGGCCAGGCCGGCGAACTCCCGGAGCACCTGGCCGAAGCGGCCCAACAGGTGGCGGCCGAACTG
+GTTCCCGTCCTGCGTCCGCGGGGCCTGTTCGCACACGACGTCGACCTAGCGGGGGAAGCCACGCCCACTC
+AGCGGCTCGTCGCCCTTACCGGACGGAAACCGCGGTGAGCTGCGTTTGGTTGTCGCGTTCGATCATTCTG
+GCGGCGTAGGGCTCATGGATCCGACGTAGTAGGTTTCCCGCCCGGTTGGGTATCCGCCGCCGTCGGTGGC
+GATATGGACGTGGTCGTAGTGGTTGAGGGTTTCTGAGCCGTAGTCCGCCGTCCAGCTCGGCGCGCCGATG
+CCTGGGTAGTAGCCCTGCCGCCAGATCACATGGAGCACTCCCCATCGTTTCGCATTCGCCAAGGCAAGTC
+CGGCGACTTGGTTGCCGAGCTGGATACCCTCGTCGCTGTGATGGTTCGGGATCATCACGTCGATCGCTAA
+CCCGTTGGGATGCCACTTCAAGGGATCCTGCCTATAGCCAAAGATGTTGGTGATCTGAGGAAATAGCACA
+GAGACGGCACGGGCTACCCAGATCGTCTTGACCTGCAACCCCTCTTCCGACGCAACGCCAGCAGGTAGCG
+CGAACTGGAATTGCTGGGCAGCGACAGGCGCGCTTGCCGCCAACAAGTCCGCTTCCGTGGGACTGGCGAT
+GCGCGGTGCGTTGGCCGGCGCAGAGTCGGGGCCTGTCGGGATTGCCGCCGGGGTCTCGCGGCAGCACGTA
+TGCTCTGCGCCTTGGGCATAGAGGATGGCGGCAGAGACGACGAGCGAGGCCGCGATTGCCAACCAGCGGC
+CCCGGCCGTTGGCCAACACGCCTTTGCTCACGAACAGCACTTTAGTGTGTCGTGTGCGACGCGTGTGGCA
+ACCTTTGCTATCGATTGGTTGCAGACCCGCGTTGTGCGCACCGGGCAAGCCGTTCACGCTCATCGCCAAC
+CCGCTGCCGTCGGCGGTGAAATGGAAGAGTGGTCGGTCAGGCAGCCGCTGATGAAGATGGTGTCGTCGTC
+TGCAGCGCGCACATCGAGACCGCTGCGCCGGAACAGTTCTGCCAGCGACACGCCTTCGGGTTGCCAGCCC
+TTGGCGGCGAGGTAGTCGAGGACGTGGTTGCGTGGGCCGGTGTAGACCAACGAAGCCAAGTCGACGTCCA
+CGCCATGACAGCGGAACGGGTTGGATATGGTCCGCGCTCGTTCGGCGCTGAAATCCGCTATACCGGTAAC
+AAATTCGGTGGCTACCATGCTCCCGGGCGCGCTGAGTGCGGTGATGTTGTCGAACAGCCTGTCTTGAGTT
+TGCGGCTTAAGATATATCAGTAACCCCTCGGCCAGCCACGCCGTCGGTGCTGCCGAGTCAAACCCGGCGG
+CTTGTAATGCCGTCGGCCAGTCTGCGCGCAAGTCGATGGGCACGGCGCGCCGGATGGCGGAGGGTTCGGC
+GCCCAGGTCGGCTAAGGTTGTCGTCTTGAACTCCATCACTTTTGGTTGGTCGATCTCGTATACCACCGTC
+CTGGTCGGCCACGGCAGCCGGTAGGCCCGGGAGTCCAACCCGGACGCGAGGATAGCGACTTGCCGAATCC
+CCCCAGCGGTGGCGTTAAGGAGATAGTCGTCAAAGTATTTGGTGCGGACCGCGTTTCCGTACACCATTGC
+CTGCGCCACGGCCGGTGAAACGTCCGCGATCGTCGACATGTCGAGTTCACCGTCCATCATCTTGGTGAAC
+AAATCCAGCCCCACCGCACGGACCAGGGGTTCGGCGAACGGATCGTTGATCAAACCGCGCGGATCCTTGG
+TGGCCAGCGCACGCCCGACCGCGACAATGGTCGCGGTGACGCCGACGCTAGACGTCAGATCCCAGTTGTC
+GTCGTCGGTGCGGGCCACCAGCCCACCCTAGTCTGATTGCCCGGTTCCTCCTCGCGCCGCAAACGGCGCG
+CATCGTCACCGGGCGTCGTCTGATTGCCCGGTTCCTCCTCGCGCCGCAAACGGCGCGCATCGTCACCGGG
+CGTCGTCTGATTGCCCGGTTCCTCCTCGCGCCGCAAACCAAGCCGGCTGGTGCTGTGCTATTGGCGTCGG
+AACAGACGGCCGTGCTGGCTACAGAACCAGGCGATGTTGCCGTCCGGCCCGCGCACGAAGTTGGAGCGAC
+TGCCGGTGGGCTTGTTGTCGGGTCCAAGGTCGAGCCCATAGTCGGGCCGATAGAAGGCGAGGCCCAGATT
+GGCGCTGTTTTGGCCATCCGGGTTGGCATCGTCGGTGCTCATGCTTCCAGCAAGCTGGCCGTCCCTGGCC
+CGGAAGTCGATGACCGTTGTCTCGAGGTCGCCATTTTGGGCGACTTGCTTGGCGATGTACCGGCCCTCGT
+AGGGCGCCAGGTCGACGGCACCAAGGCGTTGCGGCGTGGCCGGAAGATTGCTGAGCCCGGCGAATCTCTG
+CAATGCCCAGTCGGATGCGAAAAGGTCGTTGATCATATGAAATCCGCCATCAGAGTTAGTGAGCACGGTC
+ATGGCGAAGTTTCGATCGGGCACCATGACGAACCCAGAGCGCTGCCCCTTCCAGGTGCCGCCGTGCTCAA
+CGATGGTCACATTCTCCGCGGAGGGCCGCAGCATCCAGGTCACGCCCATCCCGGTCAGTTCCACCCAAAG
+TGTTCCGCCCGCCCCAGGGTTAGAGCGCATTGCCTTCAGCGATTGTCGGCTCAGAATCTGCTCACCGTTA
+GGCGCCCTGCCGTCGCCGAGGTGGAACTGTGCGTAACGCAGCTGATCTCGCGCTGTGGACATCAACCCAC
+CGGTGGGGTTGCAGCTGCGCGGGAATGTCCAAAAGTCAGTAACGGCAATCGGTTTGCCGTCGACCACGCT
+ATGCGATGCGGCCACATTCAGACCGATTATTTGGTCGGAAAAGTAGCGAGTGTGAGCAAGCTGCAGCGGG
+TCAAGCAACAGCCTCTGAACCGTAGATTCGTAGGTTGTTCCGGCGACAAGCTCGATGATGCGGCCCGCAA
+CCACAAGACCTGAATTGTTGTACGCGAACGCGGTTCCCGGAGGGGTGAGCTGCGGTAGGCGTGTCATCGC
+CTTGACATAGAGCGCCACCGCGTCATCGCCGCGCCCAAAGTCCTGCCCATTGCGACCATCCCAGCCTGCG
+GTATGGTTGAGCAGTTGGCGAACGGTAACCGTAGCGCTGGCTGATTCGTCGGCTACCGCGAAGTCGGGGA
+TGTAGCGGCGCACAGGTGAATCCAGGTCCACCTTGCCTCGCTCGACCAGCCGCATCATCACCGTACCTGT
+GAAAGTCTTTGTGGTGGAACCGATTCTGAAGACAGTGTCGCCGTCAACAGGCATCGGATGGTCGACATTG
+GTGACCCCGTAGCCTTTGACGTATTCTTGCCCGCCGGCCCAGACAGCAACCGCGACGCCCGGAATCGCAT
+AGGCCTTCATGCCCGCGTTGATTTTTGCATCGAGTTCGTCGAACGCTGCACCAGGGTCTGCGCAGTTGAC
+AGTTTCAACCACTGCAGTGGCGATTTCGTGCGGCAGTCGATCTAGCGCACGCACGTATTCGGTGACGACC
+GCGCGCCCATGGCGCGTCCCGCACCGCGTGCCGGTCGGCGTCGCGGAACTCAAGATGATCGGCGGACACA
+AGGACCGCGGCGACCCGGCCGGTGGCGGCCGATCTGAACAGCTTCGTGGGGGGATCCGCTTCGTCAACCA
+ACGCGGAAAGCATGGCTTTGGCCTTCCGCGGCCGCGTCCACATGAGTGTCAATATAGCTGGACTAACATG
+AACATCGCGAGGCCGGTTCTTCGTGGTAACGTGCCGGGATCCCAAGGGACTGCCGGAAGCGAATTTGGTT
+GCGCCGCTTGGGGCGTCGCGAGAGATTCGGCAATCCCCTGGCTGGAGGATCCCGTTCAGCCAGGGCGTAG
+GCGCTGCGGCGTGCACGGCTTGGCCCCACAACCCGTATTGATGCCACCTGAACAAGAAGAACCCGGCATT
+CGTCGAGAATGCCTTTGGTCACCAATCGCAGGCCGATACTCTGTGCCCTAGACACCCGCATTTCTTCGAA
+AGAGGTGACGATATGCCTGCACCCTCGGCCGAGGTTTTCGATCGCTTGCGTAACCTGGCCGCGATCAAGG
+ACGTCGCCGCACGTCCGACCAGGACGATCGACGAGGTCTTCACCGGCAAGCCGTTGACTACGATTCCGGT
+CGGCACGGCCGCGGACGTCGAAGCGGCATTCGCCGAAGCTCGCGCGGCGCAGACCGACTGGGCGAAGCGT
+CCCGTCATCGAGCGAGCTGCAGTCATCCGCCGCTATCGCGACCTGGTCATCGAGAACCGCGAGTTCCTCA
+TGGACCTCCTGCAAGCCGAGGCGGGCAAGGCCCGATGGGCGGCGCAAGAGGAAATTGTCGATCTGATCGC
+GAACGCGAATTATTACGCACGAGTCTGTGTGGACCTGCTGAAGCCCCGTAAGGCACAGCCGCTGCTGCCC
+GGGATAGGCAAGACCACGGTGTGCTATCAACCGAAGGGCGTGGTGGGGGTGATCTCGCCGTGGAACTACC
+CCATGACGCTTACGGTGTCGGACTCGGTGCCCGCGCTGGTGGCCGGTAACGCGGTGGTGCTCAAGCCGGA
+CAGCCAGACGCCGTATTGTGCGCTCGCGTGTGCCGAGCTGCTGTATCGGGCGGGTCTGCCGCGAGCGCTG
+TATGCGATCGTGCCCGGTCCGGGCTCGGTGGTGGGCACCGCCATCACCGACAACTGCGACTACCTGATGT
+TCACCGGTTCATCGGCGACCGGCAGCCGCCTCGCCGAGCACGCCGGCCGCCGGCTTATCGGTTTCTCGGC
+CGAACTTGGCGGCAAGAACCCCATGATCGTGGCGCGGGGTGCCAACCTCGACAAGGTCGCCAAGGCGGCC
+ACCCGTGCCTGCTTCTCGAACGCCGGCCAGCTGTGCATCTCCATTGAGCGGATCTACGTCGAAAAGGACA
+TCGCCGAGGAGTTCACCCGGAAGTTCGGCGATGCGGTGCGGAACATGAAGCTCGGCACCGCATACGACTT
+CTCGGTCGACATGGGTAGTTTGATCTCCGAAGCACAGCTGAAAACCGTGTCCGGTCACGTGGATGACGCG
+ACGGCCAAGGGCGCCAAGGTGATTGCGGGCGGCAAGGCTCGACCCGACATCGGGCCGCTGTTCTACGAGC
+CGACCGTGCTGACCAACGTCGCACCCGAAATGGAATGCGCGGCCAACGAGACGTTCGGGCCGGTGGTCTC
+GATCTACCCGGTCGCCGACGTGGACGAAGCCGTCGAAAAGGCCAACGACACCGACTACGGGCTCAACGCC
+AGCGTCTGGGCCGGCTCCACCGCGGAGGGCCAGAGGATCGCCGCCCGGCTGCGGTCGGGGACGGTGAACG
+TCGACGAGGGGTACGCGTTCGCCTGGGGCAGCCTCAGCGCGCCGATGGGCGGGATGGGCCTCTCGGGGGT
+CGGCCGCCGGCACGGTCCGGAGGGCTTGCTCAAGTACACCGAATCACAGACGATCGCGACCGCCCGCGTG
+TTCAATCTCGATCCGCCCTTCGGCATCCCGGCCACAGTCTGGCAGAAGTCACTGTTACCCATCGTGCGCA
+CCGTGATGAAGCTTCCCGGCCGCAGGTGACGGCGCGGCCTAGCGCCACTTGATGCCGCACCCGATCGACG
+GTCGTTGGTCGGGGTTGACTGGCCGCCCGGCGAGCAGGGCGTCGACCGCGGCCCGGACGTCGGCGGCCGT
+CACCGGTCGGCCATTGCCCGGGCGGGAGTCGTCGAGCTGACCACGGTAGACAAGTCGGCGCTGGCCGTCG
+AAGACGAACGTGTCGGGTGTGCAGGCCGCGGAGAAGGCGCGGGCGACGTCTTGGGTTTCGTCGTAGAGAT
+ACGGGAACGTCCAGCCGTGGCGGCGGGCCTCGGCGACCATCTGATCGGGCCCGTCCTGCGGGTAGGTGAC
+GACGTCGTTACTGGAGATACCGACCATCGGGACGCCTTGATCGGCGAGGTCCCGGCCGAGCGTGGCCAAT
+CCGGCGGCGACGTGTTGCACGTACGGGCAGTGGTTACAGATGAAGGTGACGACGAGGGCGGGACCCGTGA
+GCTCGTCGAGGCTGACCGTGGCGCCGGTCGCCGGCTGGGGCAGTGTGAACGACGGCGCGGGGGTGCCGAG
+GGCGAGCATGCTGGATTCAACGGCCATGCCGTCCAGAGTACGGTCGCGGTCCAGCTTGGCGGAGCCCTGG
+TTGCCGCTACCGGACGGTTGTCACCGCTGCGTGCAGAACAGGCTGTCGATGTCGTGTTGCCAACTGGCGT
+TGCGAACGCGGATCAGAATCGCCCGAGTGAGCGCCAGCAGGGCGCCCGCAACCGCGGCGACGCTCAACCA
+GAGTCCCAAGGCGGCCAGGGCCGCATCCGCAATGGCACGGGCCGGCGGAGCTGGTTCATCGACCAGCTGA
+CCGGCACTGTCGACCCAAATGCCGACGCGGTCACCGGATTTGGTTCCCGGCTTCGCGTTGACCTCACCGC
+TGCGTTCTATTCCGTTCACGACCCATCGGGCAGGCACGGTGATCTTCGTGCGCGGCGGCGCTGACGTGGC
+GGTCGTGTTGCTGTCGATCACCCCCTCGTGATCGATCACGGTCGCGGTTGCGGGATGGCGGGTCTGGGCC
+TGGTGGGCATAGACGTGGCTGCGGGAATCATGGACTGCGGTGCCGGCCGCGGCGGCGAACGGGATAGTCA
+GCAGCGAGACCGTGACGGCCAGCAGCATGACGACCGCCTCGAGTCGATCCGTCCCACGCACCAGCGGATT
+GCGGCTGAACACCCGCAGTATCGTCCGGCACGGCAAGCGCAGCCTAAACGTGATCATGGTGGCTCCTTCA
+CGATCGCGGGTTGTGGCGATCATCGCTGTGAATTGCTCGTGGCTCCTAGGGTCGTTCGGCCTTGGGGCTG
+GGGACGTCGGTCACGAATGGCTGGGCGCCGTGCATATCGGGTGAACCGGGCGTCGAACAAGCGAAGTTTT
+ATTGTCGGATAAGGGACTTTCGCCCCTTCCCGCCTGCTGTGTTTGGTGGCAGTATTGGTGATACCGGGGA
+AACCCGGTGATCTGCCCGAAGTGCTGGGCGATTGAGCGGGTATGTACACCCGGTTTGACCTACCGTCCCA
+AGACGGGGCTACCGCCTTCGGGCAGATCCTCATCCTGCTACTGCGGCGCACCGCGTCAGCTCGTTGATCG
+ACAGGAAGAACAGCGCGCCGCGATGGTCATCGCTGCAGCCGTGGTCAGCGGGCAGCGTAGCCAGCACGGT
+CGTCATGACGTGGATCGCGCCGTCGACGGCGCAAACTCGTTGTGCCGGCTTGCCGAAACTGACCAGCGCG
+ACCTGAGGTGGGTAGATCACCCCGAAGACCGCGTCAACCCCCTGGTCACCGACGTTGGTCATGGTGATCG
+TGAGGTCCGATAGCTCCGAGCCCGGGGACTTCGGTCCCCAGAGCCCCCGACTTGGATCAGTGGTCGGATA
+TCGCTCGATGACAGCGATGAGCTCTACACAACTGGCCGAGGCCAGAACACGAGGTTCGCCCGCGTGCTCG
+GACCATATCTGGTCGTTGTCACCGCCACGGCGCTAGCGCACGCGTCGTCGCGGACGTCCCGCTTGTTACG
+GGCGATTGGTGGCCAGGCGGTCATGGTGCTGATGGCATTGTCGGGCGGTATCTCAGCTACATCGGCTGGT
+TTCGACGAAACGCTCGAACTTGGTGGTCGAACGACCGCGGCGGGCGGCAGATGATGGCATGGGTGTCATC
+AGCGGCCCCGATGGCGTGCGATGACCGGCCGCTGCGGCCGATGGTGGCGGCTAGGTGGTGCAGCATGGCA
+ACGAAGGTGATCGTCCACACCGCCAACGCGACCCAACCTTCGAATTCGCCGATGCTTTCGACGATGGGCA
+GATGGGCGGCCAGGCCGAGACGGTATGCGCCCACGCCGTACATGCCGAGCGGGAACACGACGCTCCACAA
+CGTTGCCTCGTAGCGCAGCGGGACACGGTGGACGACATGTTTCCATATGCTGGCGGCGACCAGCGGTGGG
+ATCAGCCACGGTCCGAAGGCCCAGAACACCACCGACGCTCCCGCAACGAGTCCGCTGGTGACGATAGCCA
+TTGGTGCATCAGCCATTTCGACGATGTGGGCGCCGGCCAGCACGGTGATAGCCGTGGCGCCCATCGCCAC
+CCAATAGGGCGGGGTGAGATCCGCGGGCCGCAGCGGGTAGAGCAGCAGGCGGGCGACGACCAGGCTGCCG
+ACAGCGACGTACAGAAACACGCCTACTGACCAACTAATCGCGTGCCGAGCACGTCGGACGCAGCGACAAA
+GGTGAACATCCCAAATCCCCGGCGCGGATCAGCTAGGTCGTCGGCGAATTCTTTGCGGAAGATGACGATT
+CGTGTCGTGCTCACCGCGATCAAGACAGCATAGGCGGTGCAGGTCACCCACAGCAGGACGACGGAAAGGG
+CATACGTCCACCCGCACAGGCGGGTGACGACAGGGCCGAAAGTCGTGTCTCGCATCGAAATCGACGCCAG
+CGCGGACTTGTTCGACGAGTAGACGTGTCGCTAACGTCGATCTCGATGGGCAGTCCTGTCCGCTCGCCGA
+AGACGCACTCCCGTCACCACCCGCGCCGCCGCGGCCGCGTTAGCACCAGCTCCTCGCGGCTGCGGTAGAT
+GATGTACGGGCGGAACAGATAGCCGATCGGGGCGCTGAACGCGTGTACCAGCCGGGTGAACGGCCACAAC
+GCGAACAACGCCAACCCGATCAGCACATGGATCTGGTAATACAGCGGAGCCTCGGCCATCAGGTCCCCGC
+GCGGTTGCAGTACCCACACCGAGCGGAACCACACCGACACCGTCTCGCGGTAGTTGTACGCCTCGCCGAC
+AACGCCGGAGCCCAACGCCGTCGCACCCAGTCCCGCGACGATCGCCGCCACCAGCACGAGGTACATCACC
+TTGTCGTTGACGGTGGTAGCCATGAACACCGGCCCGCGGGTGCGCCGCCGGTAGATCAGCAGGGTAACGC
+CGGCCAAGGTGGTGATGCCGGCGATCGACCCCAGCACGACGGCCTGCACGTGATATGCGCCCTCGCTCAA
+ACCGGCGGCCTGAGTCCACGACTGCGGGATCACGAGCCCGATACCGTGGCCGACGATGACCACCAGGATG
+CCGAAATGAAACATCGGGCTGGCGATCCGCAGCAGCCGCGACTCGTACAGCTGGGACGAGCGGGTGGTCC
+AGCCGAATTTGTCATAGCGGTAGCGCCACCAGGAGCCGACCGCGACGATCGTCATCGTCACATACGGCAC
+GACGGTCCAGAAGAGTTCGCCCATCATGTCACCCGTCCGGCATACCGCGGCCACCGTGTGTGCGTATGGC
+AATGCGGCCTCGGTCAGGGCATTGCACAGCGCGGCGATGGGCACCCGGTACCCGCTCAGCAACCGCCGCC
+CCGCCTCGGGGTCGACGGTCGCGGCGAATTCGAGCACCACCGGCAGGAAGTCCGGGGTCTCGCCGCGCGG
+TGGTGCGACGTCGGTGCTGCGGTAGGTCTGGGCGAAGGCCAGCATCTCCCGGCCGCGGTTGCGGGTGTCG
+CCGGCGGTCCAGTAGGTCAGGTACAGGGTGGCGCGGCCTCGCAGGTCGAAGGTGTCGACGTAGCGGGTCG
+CCGCGGTCAGCGGATCGGCACGGCGCAGCTCAGAGACCGTGCGCCCCAACAGATCCGCGGCCGGACCGTC
+GATGTGGGCCAGCAATTCCTCTGCGGTGCCGAGTTGCCGTGAGTTCGGGTAGGTCAGCAGCACCGAGGCG
+CATTGCCACACCACGTCCCACCAATCTCCGGACTCCGGCACGTCGGTCTGGTCGCCGAACACCTGCGGGG
+AGGCCACCGGCAGGTCGGCGTACCAGTCGTAGAACGACGTCATCACCCCGCCGATTAGCTCCACGAACCG
+CGACCCCGCGGCGTGGCTCACCATGGACATCGCCGGGATGGGGGAGAAGCCGGCAACCCGGTCCGGGCCG
+TATGTGGAGATGGTGTGCACGTGGGCGGCGGCGATCATCTCGGTGGCCTCGGCCCAGCTGACCCGGACCA
+GCCCGCCCTTGCCGCGGGCGCGCTGGTAGCGGCGGCGCCGCCGCGGGTCGGCCTGGATGTCGGCCCAGGC
+CGCCACCGGATCACCCAAACGTGCCTTCGCCTCCCGATACATCTCGACAAGCACGCCGCGGGCGTACGGA
+TGGCGCACCCGCGTCGGCGAATACGTGTACCAGGAAAACGCCGCGCCGCGCGGGCAGCCGCGGGGCTCAT
+ACTCGGGCCGGTCCGGGCCCACCGACGGATAGTCGGTCTCCTGCGTCTCCCAGGTGATGATGCCGTCTTT
+GACGTAGATCTTCCAAGAACACGACCCGGTGCAATTCACCCCGTGTGTGGAGCGGACCACCTTGTGGTGG
+CTCCACCGGTCTCGATAGAACACGTCGCCGTCGCGGCCGCCGCGGCGGGTCACGGTACGCAGATCCGCCG
+AGATCTCACCCGGGATGAAGAACCGGCCGCTGCGTGCAAGCAGCTCCTCGATGCGGCTGCCGGTCCGTGG
+TGTCACCGTCACCTGGACGCCTCCTCACTCACCGGCTCCCGCGCGTGCAGCGCGGTGTAGGTACACGCGA
+CCAGCGCGGTCGCCACCAGCAGCAGCAACCCGACCGTGTAGTCGTTGTCGACCGGGTCGTAGGTCGCGCC
+CATCACCAGCGGCGGGAAGTAACCGCCCAATCCGCCTGCCGCGGCGACGATTCCGGTGACCGAGCCGACC
+GATGCGGCCGGGGCGCGGCGGGCCACCCACGCGAACACGCCGCCGGTGCCCACGCCGAGGCAGACCGCCA
+GGGTGATGAAGGTGGCCGCCGACCACACCTCCGGCGGCGGCTGCAACGCCGCGGCGAACGCCAGCAGCGC
+GGTCCCGGCGAGCGAGGCCAGCACCACGTGCCTCGGTGCGATCCGGTCGGAGAGCCACCCGCCCACCGGC
+CGGGCCAGCACCGCCGCCAGGGCGAACCCGGCGGTGCGAGCGCCCGCGTCGACCGTGGAGAACCCGTAGA
+TCGTGGTGATGTAGGTGGGCAGGTAGTTGCTGAACGCCACGAACCCGCCGAACACGATCGCGTACAGAAA
+CGACATCTCCCAGGTCACCGGCAACCGTGCCGCGGCCTTGAGCCTGGGCAGCACCGGGTCGGCGTTGGGC
+CGAAAGTAGGGTGCATCACGAAGCACGACCATGGCCACCACGGCGGTCGACGCGAGCGCGGCCGCGACGA
+TGGCGTGGGTGGTGAACAGGCCGAACCACCGTACAAACCGCGGGGTGAAGAACGCCGAGAGCGCGGTGCC
+GACCATGCCCATACCGAACACGCCGGTGGAGAAACCGCGCCGCGCCGGCTGGTACCAGTTGTTGGCGAAC
+GGGATGCCGACGGCGAAGATCGTGCCGGCAACGCCCAGGAAGAGCCCGAAAAACACCAGCAACGCGTAGG
+AGCCCATGGTTGCCGCGACCCCGACCGCGAGCACCGGGAGGATCGACGCCAGCGTCACCGCGATGAGCAT
+GGCGCGCCCGCCGAAGCGGTCGGTGAGCGGCCCGGTGACGATGCGGCCAAGGGCACCCACCAGGATCGGG
+GTGGCGACGAGCAGCGACGCCTCGGCGCTGGACAGTGACATGTCACGCGCGTAGCTGGTCGACAGCGGGC
+CGATCAGGTTCCACGCCCAGAAGTTGACCACCGAGATCCAGGTGGCCAGCACGAGATTGGCCGCTTGCCC
+TCTCATCGACACGATCCGGGGTCTCGGACTCCGGCGAACTCCGCGCCCCGCCCGGACAGCCATGCGCTAG
+CCCTGGCTTCGATGGCGCCGGCTCAGTTAGGGCCGGAAGTCCCCAATGTGGCAGACCTTTCGCCCCTGGC
+GGACGAATGACCCCAGTGGCCGGGACTTCAGGCCCTATCGGAGGGCTCCGGCGCGGTGGTCGGATTTGTC
+TGTGGAGGTTACACCCCAATCGCAAGGATGCATTATGACCAGCGAGCTGAGCCTGGTCGCCACTGGAAAG
+GGGAGCAACATCATGTGCGGCGACCAGTCGGATCACGTGCTGCAGCACTGGACCGTCGACATATCGATCG
+ACGAACACGAAGGATTGACTCGGGCGAAGGCACGGCTGCGTTGGCGGGAAAAGGAATTGGTGGGTGTTGG
+CCTGGCAAGGCTCAATCCGGCCGACCGCAACGTCCCCGAGATCGGCGATGAACTCTCGGTCGCCCGAGCC
+TTGTCCGACTTGGGGAAGCGAATGTTGAAGGTGTCGACCCACGACATCGAAGCTGTTACCCATCAGCCGG
+CGCGATTGTTGTATTGAGGGTGCCGGCGCGTTAGCGCCGACGGAACGCCTGCACTGCGGTAGGCAATGTC
+ATAAAGATATGGTCTTCGCCAATCTTATCGAGAAGACTGGCGGCCCTGAGTGATTCACGCAAGTCTTGTT
+TGACCCGGGCCATGGCGAACACTATTCCCCGACGCAGCAGCTCGGTGCGGAGTTGGTCGAGCGCATCCAG
+CGCAGTCAGGTCGACCTCCACATTGGATTCGGCGTTGAGTACGAACCACTCGACTTGCCCCGGATCCTGA
+TCGACCACGGTCAGTGCTCGCCTGCGGAAGTCTTCGGCATTGGCGAAGCACAACGGCGCGTCATAGCGAT
+ACACCACCAGCCCGGGCACGCGCTTGGCCTGCGGATAGTCATCGATGTCGTGCATGCCGGCAATGCCCGG
+CACGAACCCGAGAACGCTGTCATGCGGATGTGCGACCCGACGAAGCAGTTCGAGGATGGACAGGGCAACC
+GCGGCGAGGACTCCATAGAACACTCCTAGGCCTAACACGGCTGCTGTGGTGGCTAGTGCCAGCATGAGTT
+CGCTGCGCCGAAACCGCGCCAGTCGCCGGAATTCTGACAAGTCGATCAAGCGTAGCGCGGCATATACCAC
+CAAAGCGCCCAGAGCGGCGATCGGAAACATGGCCAGCAGCCCACTCGCGAAAACCATCACGATGACAACA
+AGCCCCAACGCGATCAGCGAGTACAGCTGGGTGCGGCCACCGACGACGTCGGCGAGGGCGGTACGGCTGC
+TGCTGGAACTCACCGGAAAACCGTGTGTCAGCCCGGCGGCGATGTTGCAGGCCCCGACCGCGCGCAGCTC
+GGCGTTGGCATTGACTTCCTGACCTCGACGAGCGGCGAAGGCGCGTGCGGTCAACACACCGTCGGTGAAG
+GTAACAATCGCGATCCCGGCAGCCGGAATGATCAGTGCCCGCAAGTCTTCCACCGAAACGGGCGGCACAC
+CCGGCGTCGGCAGACCGGAAGGTATCCGACCCACAATCGCAATACCTTTGGCATCCAAGGACATAACGGC
+CACTAGCATCGTGGCCGCAAGAACCGCGATGATCGGTCCGGGGGCGCGCGGCGCCCACCGCGTGAGCATA
+GTTAGCAGCGCTAGGACAGACATGGCTAACACAAAAGTCGGCCAGTGAACTCGCGTGACGCTAGTCGCGA
+AAGAGTGTACTTCGCTGAAGAATTCGTTGCCTTCGACCGAGGTGCCGGTGATAGTGCCGAGTTGGCTGGA
+GATCATGACAAGCGCGATGCCGGCCATGTATCCGACGAGCACCGGCCGCGATAGCAGGCTGGCGAGGAAA
+CCTAGTCGCGCCGTGCCAGCGAGTAGGCAGATAAGGCCGACTAGCAATCCGAGGGTTGCCGCCAGAACGG
+CATAGCGTCGAAGATCCCCGGCGGCCATCGGAGCGAGCACGGCCGCCGTCATCAAGGCGGTGGCGGATTC
+CGGGCCGATTGAAAGCTGCCGGGACGATCCGAGCAGTGCGTAAATGGCAAGCGGCGCGATCGACGCCCAC
+AGCCCGGCTGCCGGCGGTAGGCCCGCCACGGTCGCATACGCCATCGCTTGCGGGATCAGATAGGCGGCCA
+CGGTCAGGCCGGCGAGGACATCGCCGCGCAGCCAACGCCGTTGGTATTCGCGGAACTGCACCACCCCTGG
+TGCCCAGCCGGCCGATGTCATCGTGGGAATCATTGTCCGACGGCTGGCCGCTTAGCTAGAGTCGGTCTAG
+AACCCGCCCAATCTTTATAGAATCCTGACCATGGAATTGGCGGCTCGAATGGGCGAGACTTTGACACAAG
+CGGTCGTAGTTGCAGTGCGGGAGCAACTGGCCCGCCGGACCGGGCGCACCAGATCCATTTCGCTACGCGA
+GGAGTTGGCCGCCATTGGCCGGCGCTGCGCGGCCTTACCGGTGCTCGACACCCGAGCCGCGGACACGATT
+CTCGGCTACGACGAGCGCGGGTTGCCCGCCTGATGGTGATCGATACCTCTGCGCTGGTCGCGATGCTCAA
+CGATGAACCCGAGGCGCAACGGTTCGAGATAGCCGTGGCAGCAGACCACGTTTGGCTGATGTCGACGGCG
+TCATATCCGGAGATGGCGACCGTGATCGAAACACGCTTCGGGGAACCGGGGGGACGTGAACCCAAGGTCA
+GCGGCCAGCCTCTCCTCTATACGGGTGACGATTTCGCATGTATCGATATTCGCGCGGTTCTCGCCGGCTG
+AGCCGGCTATGAGCGCCCTGCTGGATGGGGTGTTGGACGCCCACGGCGGGCTGCAGCGATGGCGCGCCGC
+GGAAACGGTTCATGGGCCGGGTACGCACGGGAGGGCTGTTGCTTCGAACCCGGGTGCCGGGCAACCGCTT
+CGCGGACTACCGCATCACGGTGCATGTCCAACAGGCCCGGACGGTCTTGGATCCGTTCCCGCGTGACGGG
+TACCGCGGAGTCTTCGAGAGCGGGCAGGTGCGGATCGAAAGCCACGATGGCGCGGTCATCAGCTCGCGCG
+CGCACCCGCGAGCGGCGTTCTTCGGACGCTCGGGCCTGCGCCGGAACATCCGGTGGGACCCGCTGGACTC
+GGTCTATTTCGCCGGTTACGCGATGTGGAACTACCTCACCACGCCGTACCTGTTGACGCGCGAAGGCGTG
+GCGGTCGAGGAGGGAGCGCCCTGGCAGCAGGAGGGCGAGACCTGGCGGCGCCTGATTGTGAGCTTCCCGC
+CGGATATCGACACCCACTCGCCTCGCCAGACCTTTTACGTCGATGCCAGCGGTCTCTTGCGCCGCCACGA
+CTACGTCCCGGAGGTCGTTGGCCACTGGGCACGGGCAGCTCATTATTGCGCCGACCCCGTGGATGTCGAC
+GGGTTTGTATTCCCGACTTGCCGGTGGGTCCACCCGATCGGCCCGGGGAATCGCTCACTGCCCTTCCCAA
+CTCTGGTATCGATCCTGCTGACCGACATCCGGGTCGAGACCGATTAGGTTTCGCCGGAAGTCGCCGCACC
+TCGCGGTTGCTGAAACCATTAGCCTTATGCCTGTCACACCACCGCGGTTGGCGGGGTGAGGAGTCGGGCG
+ATGGATGGCACCGCGGAATCGCGGGAGGGTACGCAGTTCGGGCCGTATCGGTTGCGGCGGTTGGTGGGTC
+GCGGCGGCATGGGCGACGTCTATGAGGCCGAAGACACGGTGCGCGAGCGGATCGTGGCACTAAAGCTGAT
+GTCGGAGACGCTCTCCAGCGATCCGGACTTCCGCACGCGTATGCAGCGCGAGGCCCGCACCGCGGGGCGC
+CTGCAGGAACCGCACGTCGTGCCGATTCACGACTTCGGTGAGATCGACGGGCAGCTCTACGTGGACATGC
+GCCTGATCAACGGCGTGGATCTGGCCGCGATGCTGAGACGCCAGGGGCCGCTGGCCCCACCGCGAGCGGT
+CGCGATCGTGCGCCAGATCGGCTCGGCGCTCGACGCCGCGCACGCTGCCGGGGCAACGCATCGCGACGTC
+AAACCGGAGAACATTCTGGTTAGCGCGGATGACTTCGCCTATCTTGTCGATTTCGGGATCGCCAGCGCCA
+CCACCGACGAAAAGCTGACCCAGCTCGGCAACACGGTGGGCACCCTCTACTACATGGCGCCAGAGCGGTT
+CAGCGAGTCGCACGCAACTTACCGCGCCGACATTTATGCGTTGACCTGCGTGTTGTATGAGTGCTTGACC
+GGATCACCGCCGTATCAGGGAGACCAGCTCAGCGTGATGGGCGCGCACATCAACCAGGCGATCCCGCGGC
+CCAGCACGGTACGGCCGGGTATTCCGGTCGCCTTCGATGCGGTGATCGCCCGTGGCATGGCCAAAAATCC
+GGAGGACCGCTATGTCACCTGCGGTGATCTGTCAGCGGCGGCGCACGCAGCCCTGGCCACCGCGGATCAG
+GATCGTGCCACCGACATCTTGCGGCGCAGCCAGGTGGCCAAGCTGCCGGTGCCATCGACTCACCCGGTGT
+CACCGGGTACCCGGTGGCCGCAGCCGACGCCATGGGCTGGCGGGGCGCCGCCATGGGGGCCACCGTCGTC
+TCCGCTGCCCCGGTCAGCCCGCCAGCCCTGGTTGTGGGTTGGTGTTGCCGTCGCCGTCGTGGTGGCGCTG
+GCGGGCGGCCTGGGTATCGCGCTTGCCCATCCGTGGCGGTCATCTGGACCCCGCACGTCGGCACCGCCGC
+CACCGCCGCCCGCAGATGCGGTCGAGCTCCGCGTTCTCAACGACGGTGTCTTTGTGGGTAGCTCGGTGGC
+GCCGACAACGATCGACATTTTCAACGAACCCATCTGTCCACCCTGCGGCAGTTTCATCAGGTCGTATGCG
+AGCGATATCGATACCGCGGTGGCCGACAAGCAGCTGGCGGTGCGCTACCACCTGCTCAACTTCCTCGACG
+ACCAGTCGCACAGCAAGAACTATTCGACGCGAGCGGTGGCCGCCTCGTACTGTGTAGCGGGGCAAAACGA
+CCCGAAACTCTACGCCAGCTTCTACTCCGCCCTATTCGGCAGCGACTTTCAGCCGCAAGAGAACGCCGCA
+TCGGATCGCACCGATGCCGAACTGGCACATCTTGCTCAAACAGTCGGCGCCGAGCCCACGGCGATCAGCT
+GTATCAAGTCAGGAGCTGATCTGGGCACCGCCCAAACGAAGGCCACAAACGCCAGCGAGACGCTGGCCGG
+CTTCAATGCCAGCGGTACGCCGTTCGTGTGGGACGGCAGCATGGTCGTGAACTATCAGGATCCGAGCTGG
+CTCGCGAGGCTGATCGGGTAGCGCGGGTGGTGTGGCCTCGTCCCGGACAATTCCGCTTGCTCTCGCAGCA
+TGTCCGCAGCGGTGCGCGGTTGTGACGGTGAATTCACGATGCTCGCCGTTGATGTCGGCAGGTACCACCG
+CGGTGTGGCTTGCGTCGCGGACGGTGCGGTCAGATTCGGCGATGGTCCCGAGGGCGGCAGCTACTATGCC
+AACGACAGGCGCCCACAAATATCCTGCGGTTGAGTTGCAGACCGGGTGGGTCGTTCACCGATCCACTGTA
+GGGCCGGTGACTCAGAACGTGGCCGTTAATTCGAAACCCGGCCCAGGTTGCCAACCCGAAGATTTTGGGC
+GCCGACCACATTCCGCAGTCCCGAACAATTCACGCACCACAAACACCCCACACAGTCGGTGCAGCGCACG
+CAGCCGATACAGGCCACGCACCGGGTGCAGGTGATGCATGCTAGGCATGCCACACACTGCCGGACAGCCA
+CGCACAATACGGTCAGCAGACTGCCGATTATCCCGACGCTGCCCGCCGTGGCTGCCGCCCCGGCTATCGC
+GACGCTGCCCGCGGTCGCGACCGAGCCGGCGACTGCGACGCTGCCCGCGGTCGCCACCGAGCCGGCGACT
+GCGACGGCGCCCGTGGTCGCGGCCGATCCCGCGACGGCGATGCTGTCGATGCTGGCGATCGAGCGGTTAA
+TTACCATGTGCGGCTTTCGGTAGCCGGCAGTCGTCGGCCACGGGCCACTGTGCCGGACATGGTCCAAGTT
+TGGTCAGTTAGCCCAGTTGTGAGCGGCACCAAGGGGATACCGGGGCGATTACGCCGGCGGTAACATCGCG
+CACGAATTGTTCCCAGGACAACCAGCGGATCGCGTCGACCTCGTCCGAGTTCGGCCGGGGCTGTTGGTCA
+ACCTGGACTCGGTAGACGGGGCAGATCTCGTTTTCCACGGTGCCATCGGCCATAGCGGCCCGGTAGCGGA
+ACCCCGGCAGGATCAGATCGACCCGATCTGGGGTCAGTCCGAGTTCGGCAGCGAGCCGCCGCCGTATGGC
+GCCGGGTAGCGATTCGCCAGGCAGGGGGTGCCCGCAGCAACTGTTGGTCCATACCGCCGGCCACGTCCTC
+TTGGTGGCGGCCCGCCGCGTGATCAACAGCTGATCGTGCAGATCGGACACATAGCTGGAGAACGCGAGGT
+GCAAAGGGGTGTCGCCGGTGTGCACGGTGGCCTTGTCGGCCACACCTGTCGCGTCGCCGCGGTCGTTGAG
+CAAAACCACCCGCTCGATCGGTGGAGCTGGCCGGTAGCTGCGGGTCATGCCAGACCTCCTTACGCTTGCT
+TGCGAGGGTCGGTTCGCGGCCCCAACGCTGGCAAACTACCGGAGAGTCACTTGTCGCGTGCGGAGTTCCA
+CGATTCTCGTCGAGTGTCGCAAGCCCTGCCCTCCTGGCGGGCTACGATGCCGCCATGCCGCTCGCGGAAG
+GTTCGACGTTCGCCGGCTTCACCATCGTCCGGCAGTTGGGATCCGGCGGGATGGGCGAGGTGTACCTGGC
+CCGGCATCCCAGACTGCCCCGCCAGGACGCGCTCAAGGTACTGCGGGCCGATGTGTCAGCCGACGGCGAA
+TACCGGGCACGGTTCAACCGCGAAGCCGATGCCGCGGCGTCGCTGTGGCATCCACACATCGTCGCCGTCC
+ACGACCGCGGCGAGTTCGACGGCCAGCTCTGGATCGACATGGACTTCGTCGACGGCACCGACACCGTATC
+CCTTCTCAGGGATCGTTATCCGAACGGGATGCCCGGCCCCGAGGTCACCGAGATCATCACTGCGGTGGCC
+GAAGCGCTCGACTATGCCCACGAACGTCGGCTGTTGCACCGCGACGTCAAACCCGCCAACATCCTGATCG
+CCAATCCTGATTCACCTGATCGTCGAATCATGTTGGCCGACTTCGGGATCGCCGGCTGGGTCGATGATCC
+AAGCGGATTGACCGCCACAAACATGACTGTGGGCACCGTGTCATACGCGGCTCCGGAACAGCTTATGGGC
+AACGAGCTCGATGGACGGGCCGACCAATACGCACTAGCCGCGACGGCGTTTCACTTGCTGACCGGCTCCC
+CGCCCTTTCAGCACGCCAACCCCGCCGTGGTGATCAGCCAGCATCTCAGCGCGTCACCCCCGGCGATCGG
+CGATCGGGTTCCCGAGCTGACACCGCTGGACCCGGTCTTCGCCAAAGCGCTGGCCAAGCAACCCAAGGAC
+CGTTACCAGCGGTGTGTCGACTTCGCGCGCGCACTCGGCCATCGTCTGGGCGGCGCGGGTGATCCTGACG
+ACACGCGGGTGTCGCAACCGGTCGCCGTGGCCGCGCCCGCGAAACGCTCGCTGCTGCGGACCGCCGTCAT
+CGTCCCCGCGGTGCTGGCGATGCTGCTGGTGATGGCCGTCGCGGTCACCGTGCGGGAGTTCCAGCGTGCT
+GACGACGAGCGTGCAGCGCAGCCTGCGCGGACGCGGACCACCACATCGGCCGGCACGACCACTTCGGTAG
+CCCCCGCGAGCACAACGCGCCCGGCCCCCACGACCCCGACCACGACTGGCGCCGCCGACACCGCGACTGC
+ATCGCCGACCGCTGCGGTTGTCGCCATCGGCGCCCTCTGCTTCCCGCTCGGCAGCACCGGCACCACCAAG
+ACCGGGGCGACGGCCTACTGCTCGACGCTGCAAGGCACCAACACCACCATCTGGTCGCTGACCGAGGACA
+CCGTGGCCAGTCCGACTGTGACCGCCACTGCTGACCCGACGGAGGCGCCGCTGCCCATCGAGCAGGAATC
+GCCGATTCGAGTGTGCATGCAGCAGACCGGCCAGACCCGACGGGAATGTCGCGAGGAGATTCGCAGAAGC
+AACGGCTGGCCGTGATGGTCGGCTTGCCTGACCGGGTGCACCCGCCCCGGCGTCGGCTGCGGTCCCGATA
+CAGTTGGTGCCGATGAGCCAACCAGCCGCCCCGCCCGTGTTGACCGTGCGGTATGAGGGATCGGAGCGCA
+CGTTCGCCGCAGGACACGATGTCGTCGTCGGGCGTGACCTGCGCGCGGATGTCCGCGTCGCACACCCCCT
+GATCTCCCGGGCACACCTGCTGCTGCGATTCGACCAGGGTCGCTGGGTCGCCATTGACAATGGCAGCCTC
+AATGGGCTCTACCTCAATAACCGTCGGGTGCCAGTCGTGGACATCTACGATGCCCAGCGAGTCCATATCG
+GAAACCCCGACGGTCCGGCGCTGGACTTCGAAGTGGGCCGCCACCGGGGTTCGGCCGGGCGACCACCCCA
+GACGACGTCGATACGCCTGCCCAACCTGTCCGCGGGAGCGTGGCCCACCGACGGCCCGCCGCAGACCGGC
+ACGCTCGGCTCCGGCCAGCTACAACAGCTTCCACCGGCCACCACCCGGATACCCGCCGCTCCGCCATCGG
+GACCACAGCCGCGATACCCCACCGGTGGGCAACAGTTGTGGCCACCCAGCGGACCGCAACGGGCGCCGCA
+GATTTACCGGCCACCCACGGCCGCACCGCCGCCGGCGGGTGCCCGCGGCGGAACTGAGGCGGGAAACCTC
+GCGACATCGATGATGAAGATCCTGCGGCCAGGCAGGTTGACGGGGGAGTTGCCGCCCGGTGCCGTCAGGA
+TCGGCCGGGCGAACGACAACGACATCGTCATTCCCGAGGTGTTGGCCTCACGTCACCACGCCACCCTGGT
+CCCGACGCCTGGCGGCACGGAGATTCGGGACAACCGCAGCATCAATGGCACCTTCGTCAACGGCGCCCGG
+GTCGACGCGGCGCTGCTGCACGACGGCGACGTCGTGACCATCGGCAACATCGACCTCGTCTTCGCCGACG
+GCACCCTGGCGCGCCGTGAAGAGAACCTGCTGGAGACCCGCGTCGGCGGCCTCGACGTGCGCGGGGTGAC
+CTGGACCATCGATGGCGACAAGACACTGCTGGACGGCATCTCGTTGACGGCGCGCCCCGGTATGCTCACC
+GCCGTCATCGGTCCGTCGGGCGCTGGCAAGTCGACACTTGCCCGGTTGGTGGCTGGGTATACGCACCCGA
+CGGATGGCACGGTGACGTTCGAGGGCCACAACGTTCACGCCGAATATGCCTCGCTGCGCAGCAGGATCGG
+CATGGTGCCACAGGACGACGTGGTGCACGGTCAGCTGACCGTGAAACACGCGCTGATGTATGCCGCCGAA
+CTACGGCTGCCGCCGGACACCACCAAAGATGACCGCACCCAGGTAGTTGCCCGGGTGCTCGAAGAACTCG
+AGATGTCCAAGCACATCGACACCAGGGTCGACAAGCTGTCGGGTGGTCAACGCAAGCGGGCGTCGGTGGC
+GCTTGAGCTGTTGACCGGGCCGTCACTGCTGATCCTCGACGAGCCGACATCCGGCCTAGATCCTGCGCTG
+GACCGGCAGGTCATGACCATGCTGCGGCAGTTGGCCGACGCCGGTCGGGTGGTGCTCGTGGTTACCCACT
+CACTGACCTACCTGGACGTCTGTGACCAGGTTCTGCTGTTGGCCCCCGGCGGCAAGACCGCGTTCTGTGG
+GCCACCGACTCAGATTGGTCCGGTCATGGGGACCACGAACTGGGCCGACATCTTCAGCACCGTCGCCGAC
+GACCCAGACGCGGCCAAAGCCCGCTACCTGGCGCGGACGGGTCCGACCCCACCACCGCCACCGGTCGAGC
+AACCCGCCGAACTGGGCGATCCGGCCCATACCAGCTTGTTTCGGCAGTTCTCCACGATCGCGCGGCGACA
+GTTGCGATTGATCGTTTCCGACCGAGGTTACTTCGTCTTTCTGGCGCTGTTGCCGTTCATCATGGGTGCG
+CTGTCCATGTCGGTACCGGGCGACGTGGGCTTCGGGTTTCCCAACCCGATGGGTGACGCGCCCAACGAGC
+CCGGCCAGATCCTAGTGTTGCTGAATGTCGGTGCGGTCTTCATGGGGACCGCGCTGACCATTCGTGACCT
+CATCGGTGAGCGAGCCATCTTCCGGCGCGAACAGGCAGTCGGCCTGTCCACTACCGCCTACCTGATCGCG
+AAGGTCTGTGTCTACACCGTGCTCGCGGTGGTTCAGTCGGCGATTGTGACGGTGATCGTCCTGGTCGGCA
+AGGGCGGTCCGACTCAGGGTGCCGTAGCGTTGAGCAAGCCAGATCTGGAGCTGTTCGTTGATGTCGCGGT
+GACCTGTGTCGCCTCGGCGATGCTCGGATTGGCGCTGTCGGCGATCGCCAAGTCCAACGAACAGATCATG
+CCCCTGCTGGTCGTGGCGGTCATGTCTCAGCTGGTGTTCTCCGGAGGCATGATTCCGGTCACCGGACGTG
+TTCCCCTTGACCAGATGTCCTGGGTCACACCGGCGAGATGGGGTTTCGCGGCGTCGGCCGCTACGGTCGA
+CCTGATCAAATTGGTGCCCGGTCCGCTGACCCCGAAGGATTCGCATTGGCATCACACCGCCAGCGCGTGG
+TGGTTCGACATGGCCATGCTGGTAGCGCTCAGCGTTATCTACGTCGGCTTTGTGCGCTGGAAGATTCGCC
+TCAAGGCGTGCTAGGCGGCAGTTCACTGCCCAACCCAGGTGGAATTAACGGGAATGGCTGTCTCACTCAC
+CGGCTCAACAGGTGGCCTTGGGCGCGCGACGCGACCGCACCCGCCGACCGTGACGTGCGACTGATTCTGA
+GCTAACGCACGCAGGGGGAACTCGAGCCCGGTGACCAGCTCGAGCGCGGCGCCGGGCGGGTGAGATCGAC
+GTGTGGGTCGCCAACGCCGTGCTGCCAGCCTCCGGCAAGCTCGACAGCATCACCGCGGAGCCGGTTGGCC
+GCGCGCTGCGGGGACGGCGCGCTTGACGGCGAACGCGCCCGAGATCGCCCTCCTCGGCGTCGCCGACCAG
+GTCGCGGCCGGTCAGATTGACAAGCGGTGAAGCCGGTTGCCGGGTGGTGTCTGCTCCGGCCGACCCTGGG
+GCCGTCCATGGTGGCATCCTGGCCTGGTGGGGCTACTGATTCGGCTAGCCGAGTTGCTCGTTGTGATGCT
+GCCGCTCATCGGAGTGCTATATGTCGGCATCAAAGCGCTGTCGTCCTTCACGCGGCGGCTAGGGGAGGCG
+TCTGGCGATCTTGCGTCGGATAGCCCCGCGATGCCACGCCCAACCACTGTCGAAAACGACGCAGCGCGGT
+GGCGGGCGATCACTCGCGCGGTCGAGGCGCACGAGCGAACGGATGCACGCTGGTTGGAATACGAGCTCGA
+CGCCGCCAAGCTGCTCGACTTCCCGGTCATGACCGACATGCGGGACCCGCTCACGACGGCATTTCACAAG
+GCCAAGCTACAAGCCGACTTTCACAAGCCGTTGCGGGCGGAAGATCTTCTCGACGACCCGGACGCCGCGG
+GCCACTATCTCGATGCGGTTCGGGACTATGTGACCGCGTTCGACACCGCGGAGGCCGAGGCGATGCGCAG
+ACGCAGAACCGGCTTTTCCCGCGAGGAACAGCAGCGGCTGGCAAGAGCGCAAAGCCTGCTGCGGGTGGCA
+TCCGACGCCGGCGCGACGGCCCAGGAACGCGAGCGCGCATATCGTTTGGCGCGCACCGAACTCGACGGAC
+TCATCGTGTTGCCGGACCGTACGCGGGCCGGCATCGAGCGGGGGATCGCCGGCGAGCTCGATGACTAAGG
+CTGACCTTTCGGCACCGCGTCGCCGTTGCTGTGCCACGACCACGCATAGAGCGCCCACATGACGATGGGT
+AGCAGGATGTCGGTCCACAGCGGGACGCCGATGTTGTATGGGTTGGTGTTGTTCTCCACCACCCAGTAGT
+AGATGTGGCCGGCCGCGTCTCCGACGTACTGGATGGTGAGCACCACGATTGTCGCCAGCCAGAAGTGCCC
+GCGGAAGCGGTACGCCATCAGGCCGACCACCCCGATTGCCAGGTCGCCCATTGCGTTCTCCCATTGGAAC
+CCGCCGTCGCCGCGCGTATAGCCGATCAACTCGGCGGTCCGCTCGCCGTCGAAGACGTGGTATCCCGCGC
+CGATGATCGATACCACGCCCACGATCAGCACCATCCACCACAGCATATGGATGTCCGCGGCTGGGCGGTG
+CCGGTGACGCCGGCTCTGCACGAACGCACCGATTAGCGCGACGATTACCCCGACAATGGTGAACATTCCA
+ACACCCTTCCCTAGCTTTAGGGTCCCGTCATGCTGTCGAATCTCATTGACCGCACGCAACACTAGCGGAC
+GGGCTGGCGCTCACCGCTGTTGCGGGCGTCCCGAGAACGCCGGCCGAGTAATGGGGGAGCGGACCTTTCC
+GTACTTCATATCGCTTTTGCCGGTCCGGACGCGTGGTGGTAAGCGCTGCCTCGTGGTTCGCGCACCCACA
+GGGTGTCCGCTTTGCCGACCGCGGTTCCCTCGTCGATCAACTGGCGCTTGAGCACCTTGTGTGTGGCGGT
+GCTGGGAAGGTCGGCCGCGATGCGGATGTATCGTGGCCGGGCTTTAGTGGATAGGTCAGGCTGGGCGTCC
+AGAAATGCTTCGAACGCGTCAGGGTCGAAGGTGTCACCTGCTCGCAAGACCAACGCCGCCATCACCTGAT
+CGCCGACGTATTCGTCCGGGACGGCATACACCGCGACACGGTTAATAGCCTTGTATCGTAATAGAATTCG
+CTCGATTGGTGCCGCTGTCAGGTTCTCGCCGTCTACCCGCATCCAGTCGGCGGTGCGGCCAGCAAGGTAG
+ATCCAGCCTTCAGAGTCCCGGTATGCGAGGTCTCCAGACCAGTACATGCCGTGGCGCATGCGCTCGGCGT
+TGGCTTCGGGGTCATTGTAGTAGCCGGTGAAGAAGCCCGACCCCGTCGTGTTGACCAACTCACCTATGGC
+TTCATCGGCGTTGGTGAGTGCTCCGTGAGCGTCGAACCGCGCGACGGCGCACTCGGTGACGGTTTCGCCG
+TTGTACACCGCGACCCCGTGGGCTCCCCGGCCGATCGAGCCCGGTGGCGTGCCGGGTTCGCGGATCACGA
+TGACCGCGTTCTCGGTCGAGCCAAAGCCGTCCTCGACCTGGACTCCGAAGCGGCGTGAGAATTCCTCGAT
+GTCTTTGTCATTGGCCTCGTTGCCGAAAGCCACCCGCAGCGGATTGTCGGCATCGTCGTCGCGTTCGGGG
+GTGGCAAGGATATAGGCGAGCGGCTTGCCGACGTAGTTCATATAAGTGGCGTGGTATCGGCGGACGTCGT
+CGAGGAAGCCGGTCGCCGAAAACGTCGCCGGCGCGATCGCGGCACCGGAGACCACCGCTGGCGCCCATCC
+CGCGACCACCGCGTTGGAGTGAAACAGCGGCATGGATACATAGCAGGTGTCCTGTTCGGTGAGCCCGAAG
+CGCTCGGTGAGGCTACGCCCGGCGAACGTGGCCATTAGGTGTGACACCGGTACCGCTTTGGGATTTCCGC
+TGGTGCCGGACGTGAAGATCATCATGAACGGATCCATCGTGTCGACTTCTCGATAGGGGACAAAGGCGCC
+GTCACCAGCCACCAATTCAGCCCACCGCGGTGTCGAGGTATCAAGGATCCGCGCGCCCGCGAGGTCTAAA
+CCGTCCAACAGCGCTCGGTGGTCGGCATCGGTCACCACGATCTGGCAATCGGCTCGCCTGACGTCAGCGG
+CCAGTGCATCGCCACGTCGCGTTGTGTTCAGGCCACACAGCACATAGCCGCCCAACCCGGCCGCAGCCAG
+CTGGGCCAGCATCTCGGGCGTATTCCCCAGCAGAGAGCCGATATGCGTCGGACGTTGCGGATCGGCGATT
+GTGATGAGGGCCGCCGCGCGGGCCGCCGACTCCGCCAGGTACTGACTCCAAGTCCATTGCAGACCACCGT
+ATTTCACGGCAATCGTTGGATCGGATACGTGCTGGCGCAAGAGCGATTGAATCGTGTCGGTCATGAATTC
+GCTCCCATGTCGAGTCGCGGGCTTTGGCCGCGACGCTGTCATCCAGCATGATCGCCACGATGCCATCAAT
+GGCCAGGAGGTCGCGACATGACAACAAGATCACCACGCCGGCAGTGGATTGCCTCACGATCGAACGTCTA
+GATTCTCCCGCGTCCGGCGCCCCTCAGGTCACCCCTTATGCTAGGGCGCTAATGGGCGAGACAACCACGT
+GCGCGATCATCGGCGGCGGCCCGGCCGGGATGGTTCTGGGCCTGCTGTTGGCGCGGGCAGGTGTGCAGGT
+CACCCTGTTGGAGAAGCACGGAGACTTCCTGCGCGACTTTCGTGGCGACACGGTGCATCCGACGACGATG
+CGGCTACTCGACGAGCTTGGGCTGTGGGAACGCTTTGCGGCTTTGCCCTACAGCGAGGTCCGCACGGCCA
+CATTGCATTCGAATGGTCGCGCGGTGACCTACATCGACTTCGAGCGACTGCATCAGCCCTACCCCTATGT
+CGCAATGGTGCCGCAATGGGACCTGCTGAACCTGCTGGCGGAGGCCGCCCAAGCGGAACCGAGCTTTACG
+CTGCGGATGAAAACCGAGGTGACCGGGTTGCTGCGGGAGGGCGGCAAAGTTACGGGGGTGCGCTATCAAG
+GAGCCGAGGGCCCGGGTGAATTGCGGGCGGAATTGACCGTGGCGTGCGACGGCCGATGGTCGATCGCCCG
+GCACGAGGCTGGACTGAAGGCGCGTGAATTCCCGGTGAACTTTGACGTGTGGTGGTTCAAGCTGCCACGT
+GAAGGTGACGCCGAGTTCTCGTTCCTGCCGCGATTCTCCCCGGGCAAGGGGCTCGGCGTGATCCCACGCG
+AAGGTTATTTCCAGATCGCCTACCTCGGGCCCAAGGGAACCGACGCTCAGTTGCGCGAGCGAGGTATCGA
+GGAATTCCGTCGGGACGTCAGCGAACTGCTGCCCGAAGCGACGGCATCGGTGGCGGCGCTAGCGTCCACG
+GACGAGGTCAAGCACCTCAACGTCAAGGTGAATCGGTTGCGTCGTTGGCACATTGATGGGCTGCTGTGCA
+TCGGCGACGCGGCGCACGCGATGTCACCGGTGGCGGGAGTCGGCATCAACCTAGCGGTCCAAGATGCGGT
+CGCGGCAGCGACCATCTTGGCCGAACCGCTGCGTGAGCATCGAGTCAGCAGCCGCCACCTGGCAGCGGTA
+CGGCGTCGTCGCGCATTTCCCACCGCGGTGACCCAAGCGGTGCAGCGGGTGTTGCACCGAAGGCTGCTCG
+GCCCGCTGCTGCAGGGCCGGGACCCCACGCCGCCGGCGGCCCTGCTTGGCCTGGTCGAACGGCTGCCATG
+GCTCTCGGCGGTGCCCGCCTACTTTGTGGGAGTTGGAGTCCGGCCTGAGCATGCTCCGGCCTTCGCACGT
+CGCGGGCCCGGCAACCGCAAAGGCCCTTGAGCCGACATGCGCGCCGCCGCGAATCGGCGTCTTGGGTATA
+GCCCGGATAGCGCCGTTGGCGCTCATCAAGCCGGTCAGCGGGAGCGTCGTGGTGGCAGCACGTGATGTGT
+CGCGGGTGGCGCGACCATGGACGCTGGCTGCTATGCCGTCCACATGGCCCACACGTTCGGTGGGGCCACG
+CCGGAAGTGGTTTCGGCGCAAGCCAAATTACGCGATCCAGCGGTCGATCGGGCCATGACGGCCGAACTGA
+AATTTCCAGGCGGGCACACCGGCGGGATCCGCTGTTCAATGCGGTCGTCGGATCTGTTGAATGTGAGCGC
+TCGAGTGGTCGGCGACCGTGGCGAGTTGCGCGTGCTCAATCCGGTTGTGCCCCAACTCTTCCACCGATTG
+CCGCCCCTCGCATGCGTATCAGCTCGACGCTTTCGCTGCCGCAGTGCTGCGCGGGCAAGCGGTCAAGACG
+ACGCCCAAGGACGCGGTCGAGAACATGAGCGCGATCCACGCGATCTATCGGGCCGCCGGGCTCCCATCGC
+GCAACCCGAGCTGAATATGGTCGCCGCGAGCGGGTCCGCCGCCTGACAGGCCAATGGCGTCGGTCGCTTA
+CCCGCCAGGGTTAGGACGTGGTGCCTTGGAAGAAACCCGCCAGGTTGGTGCCGATATTGGCAAAGCCGGA
+AACGACGCTGGCTACCGAGAACGGCAGGATGCCCCTGTTGGCGAAGCCTGAGACGCCGCTGCCAAGGTTG
+GAAAAGCCCGAGGATAGCCCGCCGAAGTTCTGATAGCCCGAGCCGCCCAACAGCCCGGCCGGGTTGGTGT
+TGAACCAACCCGAGAGGCCCGAGCCGTTGTTGCCGAAGCCCGAGTTGCCGCCCGCACCGGAATTGAAGAA
+GCCCGACGAAGGCGCGGTGCTCGAGTTGAAGTAGCCCGGCCCCCCGGGGATCGCGAAGGCCCCGATCGTG
+GTGCTGGGCAGGTGGATGCCGGGAACGGTGAGCGGGGGCGTGGTGAAGCCCCCCACGCCGATCGGCTCGA
+TGGTGAGCGGTGGGGTGGTGATGGGTGGGGTGGTGATTTGGGGGAGGGTGAAGCCGGTGAGGTTGATGGG
+GTCGATGGTCAGCGGTGGGGTGGTGATGGGTGGGGTGGTGATTTGGGGGAGGGTGAAGCCGGTGAGGTTG
+ATGGGGTCGATGGTCAGCGGTGGGGTGGTGATGGGTGGGGTGGTGATTTGGGGGAGGGTGAAGCCGGTGA
+GGTTGATGGGGTCGATGGTCAGCGGTGGGGTGGTGATGGGTGGGGTGGTGATTTGGGGGAGGGTGAAGCC
+GGTGAGGTTGATGGGGTCGATGGTCAGCGGTGGGGTGGTGATGGGTGGGGTGGTGATTTGCGGCAGGGTG
+AACCCGCCGACGCCGATCGAGTTGATGGTTAGCTCCGGGGTGATGATTTCCTGGGTGGTGATCTGCGGCA
+GAGTGAAGCCGCCCACGCCGATCGGAGGGATCGCGAACTCCGGGGTGGTGATAGCTGGGGTGGTGATCTG
+CGGCAGGGTGAAGCCATCGACGTTGATAGCGGGGACATCGATCCCGGGTATGTTGAAGGCGGGCAGAAAG
+AATGAACCGATGACAATAGGGCCGGTCAATGTGTATGGGTGAACCACCAATTGTGGTAAGTCAAACTCAC
+CGAAGATGAGGGCGCCATTGGTGAAAGTACTAAGCCCGCCGCCGGGCGGCTGAAGCGCAGGCACATTGGT
+CTGGAATTGTAGGGTAAAGGGTATTCCAAAAGCCGGTACTGTTATCCTAGGTGTGCTTAGGAAAACATCC
+CAGCCTATGGAGGGCAGGCCAAATTGGCCCACGCCAATCTGGCCGACCGTTATCGGTTGAGTATGTATCG
+CAGGTAGACTAAAGCCACCGATTGTGATACCCGCGGGTATCGTCAGCTGCGGAATAGTTACTTCCGGAAT
+CTGCAATGGCGGCAAATTAAAAGCACCCACCGTAATGGGCGGGACCGTCACCGGCGGAATGGCTACGGAA
+GGAATACTCAGCGGAGGCAACTGAAAGCCGCTTACGGTGATGTTGGCTGGTGTGGTGGCGGCCGGGATGT
+TCAACGACGGCAACGTCAACCCGGGCAGGCTGAAGGCGCCGACGGTGATGTTGGCTGGTGTGGTGGCGGC
+CGGGATGTTCAACGACGGCAACGTCAACCCGGGCAGGCTGAAGGCGCCGACGGTGATGTTGGCTGGTGTG
+GTGGCGGCCGGGATGTTCAACGACGGCAACGTCAACCCGGGCAGGCTGAAGGCGCCGACGGTGATGTTGG
+CCGGTGTGGTGGCGGCCGGGATGGTCAGCGACGGCAGCGTTATTGCCGGCAGACTGAAGGCGGGAACCGA
+TATCCCCGGTATTTGCAGCGGCGGCAGAGTCAGATCAGGTGTCGTAATACTGAACTGCAGGCTGCCCTGC
+CCCACGCCCCGGTAGAAGACGCCATTGTTCATGTCACCCGTGTTGAACAGCCCATTATTCATGTGGCCAA
+TATTGAAGACACCAGTGTTGATATTTCCGGCGTTGAGGAAACCCGTGTTAGCATTTCCCGTGTTGAACGT
+GCCGGTGTTGGACGACCCCGGATTGAAGTCGCCCATGTTATAACTGCCGGTGTTCAGGCTGCCTGTGTTC
+GCGTTGCCGACGTCCAACATACCGGTGTTAAACGAGCCCGCATTGAAGAAGCCCGTGTTCCCGTGTCCAG
+AATTCCAGCCACCGGTGTTGAAATTACCCGAGTTTCCGATGCCAAAGTTTCCATTGCCGGAGTTGAAGAA
+GCCGACGTTTCCGCTGCCCGAGTTGAACAATCCGAAATTCCCGGTGCCCGAGTTGAGCCCGCCGATTCCG
+ATCTGGTTGTTGCCGGTAAGACCGATGCCGATGTTGTTGTTGCCAGTGTTGCCAAAGCCGAAGTTGCCCA
+AGCCGGTGTTGGCAAACCCGGTGTTGAGATTGCCAAGGTTTCCCACGCCGACATTGTTGCTGCCGAGGTT
+CCCGAAGCCGATGTTGTTATTACCCAGGCTTGCTGAGCCGATATTGGAGTTACCGAAATTTCCGGACCCG
+AAATTGTAGTTGCCAAGGTTGGCGTTGCCGATGTTGGCAAGGCCGTTGTTGGCGTTGCCGACGTTGCCAC
+CGCCGACGTTGGCTATGCCCAGGTTGATGGCGGTGGGTCCGCCCGCAAGCGCCGGTATGCCTGCGGCTGC
+GGTCATGGCGGCCGCAGGCGCGCCGCTGGCCAACCAAGCCGGCAAGCCAGCCAGGTTCTGCAGCGGTTTA
+CTGAACGGGGACAGCGCCGAGGCGATCGCCGATGCCCCGGCATGGTAGGCAGACATCGCCGACACATCGG
+CAGCCCACATTTGCTCGTACGTGGCTTCAATGGCAGCGATCGCCGGAGCGTTCTGTCCAAACAGGTTCGA
+CATCACCAGCGACACCAGGTCGGCACGGTTGGCCGCCACCAGCATCGGCTGCACCACCGCCGTCTTGACC
+GCTTCAAACTCGGCTATCATCGCCGCAGCCTGAGCGGCCGTCTGCTCGGCCTGGACCGCCGCCGCGGCAA
+GCCACGCCGCATAGGGGGCTGCCGCTGCCGCCATCGCCGACGACGACGCGCCCTGCCACGCCCCGCCCAC
+GAGTCCGGATGTCACTGAGCCGAAAGAGGCTGCGGCCGAGGCCAATTCCATGGCCAACCCGTCCCAGGCC
+GTCGCGGCCGCCGCCATCGGTTCCGGCCCTGCCCCGGCGAATATCAGCGCTGAATTGATCTCCGGCGGCA
+GTACAGAAAAATTCATCGTCCAGCCTTCCCTGCGTGCCCCGCGTGATCAGCGGTAAACCGTGGCCGGTGA
+GTGGCTCTTGGCCCACAAGCTAGACGCTGAACCGTCGTGGCCACATAAATATCGCGCACAAATGGCCACG
+ACTCATAGGTTTCGTAAATTTGATTTACAAAAGGCGCTCTCGGGTCATGCGGACCGCAAGCGGCGTCCGA
+ACGCAGGGGCTATGGCAGCACGGTGTGCATCAACATCACGTTGTATGCCGACCACAAAGACAGGTTAAAG
+TAGACGTCTTTGCCCGTCGACCAGGGATGCATCATCGGCGCGTAGATGCCGCCGGGCATCTGCCATGACG
+ACACCAGCATTTGCTCTGCGCTCCACGGTCCTTGCGGAGCCGGCGCGGTCCTTGCCACCACGTCGTTCAT
+ACCGTTGGTGTAGAGCGCCAGGTATTGCTTGAGGTAGGTGTTGTATTGGACGGACATTTCGCCCACCGGG
+CCCGGAATAACGGGTGTTGCCGCGTCCGGCTTGTTTGGAACCCAGGAGTTCGAGTCGCCGTTCCAGTACT
+GGTACTTGGTGAGGTCGGGCACAAAGCGCTGCGGAACTCGTGCCAGATATGCCGAACCGCCTCGCCCGGG
+CGGGGTCCCGAACGAGTAGAGGTAACCGTCGTTGGACTTGAGGTACGCCCCCATCTGGAAGTTCTCATTT
+CCCGGAACGAACCTGGCTTTTCCGCCGCTGTCCGGTCCGGACGCGCGGATGGTGCCCGGGAAGACCCCCC
+AGGTCTGACCATTGTCCTTGGACACCGCGATGCCCGAGTAGTTCGTCGTCCATTCCCCATCACGGCCCCA
+ATTCCTGATGGACATGAAGTTGACGTATTGGGTTTTGCCGACGGCGATGCCCGCGGTCGGAATGATCCCC
+GTCTCGTCGCGCGCCCATTTGATGCTGTTGATGAGCTGTTTGGAGAAGCCCGGTTGGCGTACCGGTGAGC
+CGGAATATCTGTTGGAAGCGTCACCGGATGTCACATGAACTCCGTTGCCCAGGTCGCGGTCTTGGCTGCG
+GAACAGCGTGTTGTATCGCCATTGATGGCCATCGACAGCGCAGTAGCCGAATGTGTCGCCGAAGATCATG
+AGCACCTGACGGTTGGCGGGATCGCCGTTATCCCAAGGAATTCCGAGGTCGGTCCCGGAGATGCCGAAGC
+GTTCCAGGGTCTTGTTGGGGCTGTCCGGTCCGGTCACCCACTCGGCGAGGGATGTGGTAGCCCCGGCGAG
+CGTGGCACCAGGATCCGGCGCCGCCGCCGGAGCAGGGTCGGGTGCTGGGGCTGGGTTCGGAGTTAGCTGA
+GTGGCATTCGGGGGTTGTGGGCCCGTGGCTGGCGGATTGGGTGCCGGATTGGGCCCAGGATTGGCCCTGG
+GGACTAGCGCTTGCTGTTGTAGCGGCGCGGCATTTCTAGCACCCGGGTTGAGCAATGCGGATATCAGTGG
+ACCCAGCTTGGGTAGCGGTGCACGGTCGTTGGCACCGCGAGGCTTGCGTCCGGTCGGTATCGGACCGTGT
+CCAGGTCGTACCGGGCCGAGCGCCGTGGCCCCGGGGTCGGTCACAATGGCGCTCGGTGGCGGCGGAGCGT
+TCGCGGCGTCTCCGCTGCACGGCGCCGCCATCGCTGGTGGCGCCAGGCCTATTGGAACCATGAGTCCAAT
+AGCGGCCGCCCACGCCAGCGATACCGACACGATTCGAGGAATCGGCGACATGTCACACCTTCCCGGGCTG
+GACGTTGCAATTGACGTCCGCAGTTCGCTGATGTGACGATAGTGATCTCTGGGACTCTTGTGATCAGTGA
+TCCACTGATAGGTATGCCTCCGTGACCGTGTCGCAACCCATCTGTTCATCTCCGACCTGCGCTGCTGCAC
+TCGGACTTGGTACCGGTACATTCAAGGCCCATCGGGGCCGCGGATACCACGACCACCGGTGCCGAACATC
+GACGATCCGATCAATTTGCGTCCACTGTCGCCCGGACAGGTCAACAAGGTGTGGCTCTGGCAATCGCTAC
+CCGGTCCCTGGATCGGGTCCGCACGGAATACCGTGTACCTGACCGGATTTGAGTTCCTCGAGCCTTAGCA
+CGGACCGCTCGGAATACCACGGGTAGGCGTGGTTTCCTGCGTGGGCATGATCTGTGGATCAGGAACCCGA
+TACGGGATTCCACGGTTTATCGTGCCCAGCGCCGCGTTGGGCACGCACTGCGGCACCGTTGATAGCGCGT
+GCAGCCCGGGATAATCCAGGTTGGGCCATGATGAGTTGGGCGGGACAGCGAAGTTGAACGTTGACGTCAT
+GTCGCCGGTCACACTGCGCCGCCAAGCCGTGAGGTTGGGAACTGGCACCCCGAACCGAGTTTCGAGCAAT
+CTCAGCTGTGAGGTGTGGTCAAACGTGTCGTGAACCATCTGCGGGCCACGGCTGTACGGCGAAATGACGA
+AGCAGGGAACGCGAAAGCCCAAACCGATCGGCCCGCGTATTCCGCCGGAGCCCGGCACCTGATCGATGTC
+AGGCACCGTGACATATTCGCCGGGAGTCCCGGCCGGCGCGGTAGCAGGAACAACGTGGTCGAAAAAGCCG
+CCGTTTTCGTCGTAGCTGACGATCAGCGCCGTCTTTTCCCACACCGCAGGATTGGCAAGCAATATTCTTA
+AGATGTTGACGATTGCGAAAGCCCCGGCCGCGGCTGGAACCGCAGGATGTTCGGATTCGAGAACATTGGG
+AATCACCCAGGAGACCCGCGGCAGTCTATTGGCTAAGACGTCGGCCGCGAAGCTCGCGGGATAGCTTGGT
+GCCACGCCAAAGCGGACAAGATCTGACCTGGGATCGGCTGACTGTTTGAAAGACGTCACAAGCGAGCCGT
+AAGTAAGAACCGAGGAGATGGGCCCGAGTGTCTTGTTGCGATACACCTTCCAGCTGACGCCGGCATCGCT
+AAGGTTCTGCGGCATGATGCGCCAACCGAATCTCCGCACCGGTTGGAAAGTGGGACTCTGCAGCTCCGGC
+CCACCATTTTGGCCGTCGGGGTCGATGGTGGCGCTCAGCCAATAAAGGCGGTTGGGCAGGGTGGGACCCA
+ATACCGAGCAAAAGTAGCGGTCGCAGACGGTGAACGCGTCGGCCAACAGATAGTGGATCGGAATGTCTTG
+GCGCGTGTAGTAGCCCATCACCGTGGGAGTGTGGGCCGCCGAGCGAGTCTTGGCCTGCGCTGGTAGCCAG
+TTGTCGTTGACGCCACCATTCCACGACTCATGCATCGCCACCCAGCTATGGTCAGGGTCGTTGACACACG
+CGCCGTCGAGGAACGGGCCTCGGGTGGTGTCGAAGCGGTAGGGCATCGTAACGCCGGTGGCGTCAAGAGC
+CTGCGTCATCGGGTTCCAACCCTTTTGTTGGAAGAGCGGCGATACCGTGTTGAATCCATCGGTGCCGGAG
+AGTGTTCCGAAGTAGTGATCGAATGAGCGGTTCTCCTGCATGAAGAACACAAAGTGTTCGATGTCGGTCA
+AATGGCCGGAGCAGGGCCCCGCGCCGTAGGCCTTTTCAATCACCGGACCGGCGAAAGACATCAACGCGCC
+GGCGCCGCCCGCAGCGACCTTAGCTAGGAATTCTCGCCGCGAAACTCCGCCGATGTGGCTTTGGCTCACC
+GCTGTGTTCTCCTGTCGAACCTCCAGCCGCATTTCAGCTCAAGGTAGAGGACTCCGACGAACGATCACGA
+CGCGCCAACCGGCGTGTCGCGCGCGAACTTGCGGATTTCGGCCGCAAACTTGAACCGCTATGCGGTGTCT
+TGGGTGTCGCCGCACCGGGTGCTTACGGCCATGGCGCCCAATGTTGCTAGCATGCTGGCTGCTGCCCGTT
+GCCAGGTGAATATTTCGGCGCGGCGGCGCGCGCAGCGGCGCCGGTGGCGTTCGGGCCGGCTGACGATTGT
+GCGGACTGCGTGTGCGATGGCCTCTGGGCGGTTGTCGGCGCAGGCGCCGCTGTCTGCGGTGATGATCTCG
+GTCAGCGCCGAGGTGCGGGACACCACGGCCGGTGTGCCACACGCCAGCGATTCGAGTGCGGCTAGCCCAA
+ATGTCTCGTGTGGCCCAGGTGCCAATGCGACATCGGCCGATGCCAGCAGGCCAGCGACGGCATGCCGATC
+CGAGATGAAACCGGTGAAGTCGATCGGCAACCCGGTTGCCTTGCGTTCCAGCCTGGCGCGCAGCGGACCC
+TCGCCAGCGATGACCAGTCGAGCGTCGACGCCGGCGTCACACAATGCGGCGAGTGCGTCGATGCTGCGGT
+CAGCGTGCTTTTCCACCGACAGCCGGCCGCAGTGGACCAGCAGGATCTGCGTCGGGGTGGCCCAGTGCTG
+CCGAACCCGGGCACAGCGCCGCCGCGGGTGGAAGGTCTTCAGGTCTACGCCCAGTGGGACGGTGACGGTA
+TTTGTCGCTCCGATGCGGTCGAATTCTTCGCGCGCGAACCCGGTAGTACACACGACAGTGTCGTAGTTGG
+CGGCGGTTCGCGCGTTGGCGAAGTCTGCGAACTTCTGCGCGGCTCGACGCGGAAGCAATTGGCCCGCAAA
+GCGATCAAGACGCTCGTGGGAGATCATCACCGTCGTAACGCCGTGTTCGCGGCCCCACCGGCCCAGTGAC
+CTCAGGGTGAGCCGGTCGGAGACCTCCAGGGTGTCTGGTCGCAGTGTTTCCAATACAGTCCGCACGGCTC
+CTGGCATAACCGCGCGATAACCACCGGTATATGGAATATGCTTGGCGGGCAAGGTAATTCGAACAACACC
+CGTGCGTAGGAGGTGTCGTTCGGTGCGCGCCCCCGGGACGATCAAAACACCTCGTGTCCGCTGGCGCAGT
+ATTCCGCGCCCAGCCGGTCCACCGCGGTGCGGAGTCCGCCCGAGCGAGGTCCATAGAAGTTGGCGACCTG
+AACAACACGCATACCGTGAGCAGAACCGGCCGTCGTGTGCGGTCAACGACATAGCATCGACGGTTCCCTG
+AACGGACCATGAACTCCTGCGGAGCGGGCACCTGCCTGCGCTTCGCGCCAGCCGACAGACACAACCAGAA
+CTTGTGAGCGCACAAGGTCAAACCCGCTACTGGAAGTTCGAGCAACGGCGGAGCATGGGAGTTGACCGAT
+CGAGGGGAGAACAGGACAACGATTGCCATGCTGGAGACCGCTGGATTATGGGGCAAGCGCGCCGACATGA
+TTGTGCGTGGATGCTTGCCTTATAACGCTGAGCCACCGCCGGCCGTGTTGGCTGGCAGCGACATCACCCC
+GATCAATGCGTTCTACGTCCGCAATCACGGCCCGGTCCCCGACATCGCGCCGCAGCATTGGCGGCTGACG
+GTCGGCGGGCTGGTGGACAACCCGCTTACCGTGACCTATGAACGGCTGACCACCGAGTTCGACCAACACT
+GTGTGGTGGCGACGCTGGCGTGCGCCGGCAATCGGCGTGCGGAGCTGTTACGGGTGCGACAGATCCCAGG
+TAAGGAACCCTGGGCGCACGGTGCGATCTCGACCGCTCAGTGGTGCGGTGTCCGTCTGGCAGACATCCTG
+CAGGCCGCCGATGTGCATATCGACGAGGGGCTACACGTGGCCTTCGATGCTCCGGATGTAGCTGAGGAGG
+CTCGCCCCATCCAGCCCTATGGCAGCTCGATCCCGCTGAGCAAAGCGCTGTCGCCGGAAGTTCTGCTGGC
+CTGGCAGATGAACTCCGAACCGCTGCCGCGTGCCCACGGTGGTCCGGTTCGCGTGGTGGTACCCGGATTC
+ATCGGGGCCCGCAGCGTCAAGTGGGTCACCGCCATCACCGTGCAGCCTGGTGCTTCGCAGAATTACTTTC
+AGGCTCTGGATTACCGCATCCTTCCGGCGGATGCGGACGCCGACATCGTCGGGCCGGGCGAAGGGATTTC
+GCTTTCGTCGCTGGCGCTCAACTGCGACATCCTCGACCCCACCGATGGCGACGACGTACCGGCAGGGGCG
+CTGACCATTCGTGGCTATGGGATGGCCGGCGATGGCCGCAGTGTCGAACGAGTTGATGTCTCTGTCGACG
+ACGGGCTCACCTGGCAGCAGGCCGACCTACACGCCGCGCCCAGCCAGTGGTCATGGCGGCCGTGGTCGCT
+GACGGTCGACGTGGAGCCGGGGCCGTTGGGTATCACCGCACGTGCCTGGGACGATACCGGGGCGCTGCAG
+CCCGAATCGGCTGTGTCCCTGTGGAATCCGCGCGGATACGGCAACAACGCTTGGGCCCGCGTCGCATTGC
+GCGTGAGTTAGCCGGGTACTCGGTCATCAACCGGTTGCGGGGCCCTCCGAAGACCACTGGAAAGCACTGC
+CGATCTGATGGTTAGGGTGGTTGAATTAGCCGACTCGGTCGGCGGTGACGCCCCGAGGTCAGGTGAGGCG
+AAGGTGATGCCAGTTGACGGAACTAGCCGGCGACACGATACCCGACCGGTGGCTCTGCTGAGGCCGACGC
+GGTGACCGCCATTGGACGACTTATCCATCGCTACGCGATATGGATCGTCGGCGTCTGGGCGCTCGCGGCC
+ATCATCGGGAATAACTTTGCCCCGCCACTCGAGCAGGTCATCACCGCCGAGGATCAGCCGTTCTCGCCGG
+CTGGCACCGCCACTTCGCGTGCCGTGGAACGGTCAGCGGCGGCCTTCTCCCAAGCGCCCGGCGACAACAT
+CGGATATCTCGTGCTGGAGCGAAACGGAGTCCTCAACGACCAGGACCGGGCTTACTACGATGCGCTGGTC
+GTGGCCCTACGCCGTGATTCCCGCCACGTCATCGAGGTGGTGGACTGGTGGGGAACCCCGGCCATCGCGG
+AGGTCGCCCGCAGCGACGACCATCACGCGGTGACAGCTGCCCTGCGCTTTGGGGGCATGGTCGGAACGTC
+GCAAGCCGGGGAGTCGATAACCGCCGCGCGCAGCATCGTTACCCAACTGCATCCCCCCGACGGTTTGCAC
+GTATTCGTCACCGGTCCTGGCGCCACCATCGTGGACGAGTTCGCGGCAATCGACAGACAGACCCAGCTCA
+TTACGGCAACGACAATCGTGGTGTTACTGATCCTCTTGTTGATCGTCTACCGATCCGCGATCACCGCGAC
+GGTGCCGTTGTTGTCGGTCGTCGTTTCCCTAGCCGTGGCCAAGCCGATCGTTTCCGTCCTTGTCGACCGC
+GATTTCATCGGGATATCCCTGTTTTCCCTCGGACTTAGCGTTGCGGTGGTTGTCGGCGCGGGAACCGGCT
+TCGCGATGTTCCTGATCGGGCGTTACCACGAACGACGAAGGCAACATATTGCCCCGGCGGCGGCGCTGGC
+AGACGCGTACCGCGGGGTGGCGCCGGCGATCGCGGGTGCGACGTTCATCGTGGTCACATCGCTGGGCGCT
+GTGGGATGGCTGAGCCTGGCACGGATCGGTATGTTCGCAACAACCGGAATCCTTTGCTCGATTGGCGTTC
+TCGCAGTGGGCCTGGCCGCACTGACGTTGACGCCAGCTCTCGTCGCGCTGGCCAGCCGTGCCAACCTCCT
+CAAACCGCCACAACACAAGCGCATACAGCGCCAATTTCGGCGACTCGGCACACATGTGGCGCGCTGGCCG
+GCGCCGATATTGGTAGCCAGCGGTGTGTTCGTACTCATCATGATGATCGCGCTCCCTAGGGTGCCGATCG
+GCTGGGACGAAGCCGCGGCAACCCCGTCCGCGGCGGAATCCAATCGCGGTTACCGGGCGGCCGATCGCCA
+CTTTGCCCCGAACCAACTGCTGCCCACCCAGGTGATGATCGAGACCGACCACGACATCCGCAATCCCGCC
+GGTCTGACCGCGATCGAACGAATCACTGCCGCGATCATGGCTATTGGCGGTGTGCGCATGGTGCAGTCGG
+CGAGTCATCCCAACGGAATGGTGTCCAAGCAGGCTGCCTTGACAGCATCGGCGGGGAATCTCGGTGATCA
+GCTCGACGAATTTTCCGATCAGCTCACATCCAGGCAGGCAACGTTCACCAATCTCGAAGCTGCGGTCCGC
+GACGTGGTGTCAGCCCTCGATCTGGTTCAGGCTGGCATACGACAGGATGGCTATGGACTTGGCCAGGTCA
+GTCTGGCCGTCCGGCTGATGCAACAGGCGATAACCAAACTTCAGGGCAGCGCCGGTGACGTCTTCGACAT
+ATTCGACCCGTTGCGTCGTTTCGTCGCGGCGATACCCGAGTGCCGGGCCAACCCCGTGTGTTCGGTCGCC
+CAAGAGGTGGTGCAGTGGGCAAACACCGTCACCGAGAGCTGTGCGAAGCTGGCCGATGCGGCAGGGCAGC
+TCGCGCGGGGGATCGCTGATGTCGCCTCGGCGACATCGGGTGTGTCCGGGCTACCGAATGCCCTGGACGG
+CATTGGAGGTCAGCTGGCGCAGGTACGAGAATCGGCCGCAGGCGTTCAAGAGTTACTTAACAATGTCGGC
+GCAGCACCATTGCGAGAGCTTCCCGACTATTTACGCGAACTTGCCGCCGTCTCCCAGAGTGCGCCGGGCG
+TGGATCTCTACGCCGCTCGGCGAATTCTGACCGACCCGAATATGCGCGCGGTCTTGGACTATTTTGTCTC
+ACCAAACGGCCATGCAACGCGTTTACTCGTCTACGGCGACGGGAGCGAGTGGGGTGACGATGGCGCCCAA
+CGCGCTCGCGCGATCGTGACTGCGGTGGCCGAGGAAACCGACGAGGGCACGCTGCGACCCACCGCTGTTG
+AGCTGACCGGCGTTGGACCGGCTACCCGTGACCTGCAGGATCTGGTGGGCAGTGACCTGACCTTGCTGGC
+GGTCATCACACTGGCCGTTATCTTCGCGATAGCCGCACTGCTGCTGCGCAGTCCGCTTGCCGGGCTTGTG
+GTCGTCGGCACAATCGCGACATCGTATATCTGTGCGCTTGGCGCCAGCGTAGTGATTTGGAAACACATAC
+TTGGCGATAACTTGCACTGGTCGGTATTGCCGATTGCGTTTGTTTTGCTGATATCGGTGGGTTCGGCCTA
+CAACCTGCTCTTCGCGCTGCGCATCCGCGAAGAAAGTCCTGCCGGGCCACGAACCAGTGTCATCCGAGCG
+TTCGCGGCGACCGGAATGGTAGTCACGGCCGCTGGAATCGTGTTTGGCACAACGATGTTCGCGCTGGCCG
+CGAGTACCTCGCTGAGCGTGGCACAGATCGGCGTTACCGTTGGCATGGGGTTATTGCTGGACGCCCTTGT
+GATACGAGGCTTTGTCCTGCCGGCCCTGATGGTTTTGCTGGGCCGCTGGCTGTGGTGGCCGCGCCGATCG
+GTTAGCAACCGGCAGGTACCCGAGCCGTCGCCGGCCTAAATTGAACCGATTCACGCGTGCATACGTATCC
+GAGAGTGTGACGAGCCGAAGCGCAGCAGCCGGCTAGGAGCTTCGCTGTCGGCCGAAGGCTGGGTTGATGC
+CTGGGCCACCGCAACCCGCTGCATTTGCGCACCGGACAGCACCTTAGCTGTGCACCAGGGCGACGACCCG
+TGCGCGACCGGTCGCCGAGATGGGATACCCGAGCCCGATCCCTGGCCGGTTCGGCCAGGCACGCCGGACC
+CTCCTGGTGTGGGAATGTGTCCAAAGGGCATTATTGGTCCGTGAGCGCATTCAACATCTGTCGATTCGTT
+GGTGCCCCAATGGTCACGACGTGGGCACTGCTGTTCGCGCCCGTACCCGCCGCGTCTGCCGACCCACCCG
+ACCCGACGGTATCGGATGGCGCGTGTCCCGATGTTGAGGTGGTTTTCGCCCGCGGGACCGGCGAGCCACC
+CGGCGTGGGTGGGATCGGAGAGGACTTCATCGATGCGCTGCGTTCCAAGATTGGCGAGAAGTCTATGGGC
+GTTTATGGGGTCGACTACCCGGCGACCACGGATTTCCCGACAGCGATGGCCGGTATTTACGACGCGGGCA
+CCCATGTCGAACAGACGGCGGCGAACTGTCCCCAAAGCAAGCTGGTGCTCGGCGGATTTTCCCAAGGTGC
+GGCCGTGATGGGCTTTGTTACCGCGGCGGCGATTCCGGATGGGGCGCCGTTGGACGCGCCCAGGCCGATG
+CCGCCCGAAGTCGCCGACCACGTGGCCGCCGTCACACTCTTCGGAATGCCCTCGGTTGCGTTCATGCACT
+CGATCGGCGCGCCGCCGATCGTCATCGGTCCGCTATATGCAGAAAAGACCATCCAGCTGTGCGCCCCGGG
+CGACCCCGTCTGTTCTAGCGGAGGCAATTGGGCGGCGCATAACGGGTACGCCGACGACGGCATGGTCGAG
+CAGGCCGCAGTGTTTGCCGCCGGTCGGCTCGGTTAAGGCAGTGTCAGCCACTCGCCACTCAGCCCGACAC
+CGATCGGACGTCGTGACCGGCGGGACCGAGAACTGCTCGATCCGCAACAACGCCGCGACGTGGATTGTGT
+CCCATGGTGAGCTGTGACTTGGAGTGCGGGTGGTGAGCTGAAGGCCCGTTGTCGACCGAAACGGGGCGAC
+GTCCGCGACTTCCTGTACAACCTGATGCTCTGGGATTTGGGCTGCGGATGCGCGGCGGGGGTTCGCTCTG
+GTGTCGTCGGTGTTCCGCCGCGCTACGTCAAGCCGTGCTGCCCATCCCGGCCGAGTACCAGCCCACCGGC
+GCCGCCGGCACCCGCCGTGCCCCCGGCTTTTCCGGCATTGCCGCCGTTGCCGCCGTTGCCGATCACCACG
+GCGTTGCCGCCGGCTCCACCCTTGCCGCTGGTGGCGCCATCCCCGCCGGCGCCACCGTCACCGCCGTTGC
+CGTACAGCCCGGCCTTGCCGCCGGCGCCGCCGTTCCCGCCGGCGCCGGTATCGCTGGCGCCGCCGGCGCC
+GCCGGCGCCGCCGAAGCCGCTGCGAAGGCCGGTGATTTGGCCGGCCCCACCGGTGCCGCCATCACCGCCA
+GTGCCATTGAGGCTGTAGCCCCCGTTGCCGCCGGCCCCGCCGGAGCCGTAGAACAATCCCGCGCTGCCGC
+CGGCGCCGCCAGCACCGGCCTTGCCTGACAGGCTGGAGCCGCCGCTGCCGCCGGCACCGCCCGACGCATT
+GAGGGTGAGCGAGCCAGCATTGCCGCCTACACCGCCACCCCCGCCGGCCATGCCCCCATGGCCGCCGGCC
+CCGCCAGAGCCGCCGGCACCGTACAGCCCACCGGGCCCGCCGGCACCGCCTGTCCCTCCGGCCCCCGTGG
+AGCCGCCGTTCCCACCTGGTCCGCCGGTTCCCCCGTGGGCGTACAGCCCGCCGGCCCCGCCGGCCCCGCC
+GGCGCCCCCGGCGGTGCTGCCGGTCCCGCCGGCGCCGCCGGCCCCCCCGTTGGCGAACAACCCGGCAGCG
+CCGCCAGTCCCGCCGGCGCCGCCAGTGGTAACGCCTGCGGTGAAAGCGCCGCCGCCACACCCGCCGAGCC
+CAGCCGCGCCGATGAGCAAGCCGGCGTTCCCGCCGGCCCCGCCGACGCCGCCGGTGGTGGTGGCGGCCCC
+GCCGACACCACCGGTACCGCCGGAACCGATCAAGAAGGCGGATCCGCCGGCGCCACCGGCCCCGCCGGCA
+CCCGCCGTTCCGACGCCGCCGGCCCCGCCGGCGCCACCGGTGCCAAACAGGATCCCGCCTGCCCCACCGG
+CGCCGCCCGCGCTGCCGTTGGTGCCGGCCGCACCGGCCCCGCCGTTGCCGCCGTTGCCGAACAACCAGCC
+GCCGGCACCGCCATCGTCCCCGGTTCCCGGCGTCCCACTGTCGCCGTTACCGATCAGCGGGCGTCCGGTC
+AATGCCTCGGTGGGTTCGTTGATGAAACTGAGAATGTCCTGCTGCAGGTTGTGCCATGGCGAGGTGCTCT
+CGGGAGCGTTATATCCGTCGGCGCCCAGCAGCAACCCGCCGAAGCCGCCGAAGCCGGACTTGCCGGCGAG
+CGCGCCGATGCCGCCCTCGCCGCCGTTGCCGATCAGCACGGCATTTCCACCGGCCCCGCCGACACCACCG
+GTGCCGCCACTCTCGCCGCCGTTGCCGCCGTTGCCGCCGTTGCCGATCAACCCGGGCGCCCCACCCGCCC
+CACCCGCCCCACCTGCGGCGGTGCCCGCGGGGCCCCCAGAGCCGCCAGCACCGCCGGAGCCGCCGGAGCC
+GCTGAGCATGCCGGCGCTGCCGCCGACCCCACCCTGCCCGCCGGCGGCGAAGCCGAACCCGCCGGTGCCG
+CCACCCCCGCCGGAGCCGAAGAGCATGCCGGCGTTACCGCCGGCTCCGCCGGCGCCGCCCTTACCACCAC
+CGAAGACAGTGCCGCCAGCCCCACCGGTGCCGCCGGCGCCACCGGCGGCACCCAGGGAAAGCGTCCCGGC
+GTTACCACCGTTACCGGCAGCGCCGCCGGTGGTCAGTCCTGACCCGCCTGCCCCGCCGTCCCCGCCGGCG
+CCGAACAAACCGCCGCCCCCACCGTCCCCGCCGGCCCCGCCGGTGCCGAGCGTTCCGTGATCCCCGAATC
+CGCCCGCCCCGCCCATGCCGCCGGCACCAAACAACCCGCCGGCCCCGCCGGCGCCGCCCGCCCCGCCCGT
+GTGACCCTGCCCGCCGGCGCCGCCGACACCGCCGGTGGTGAACAGCCCACCGGCCCCGCCGGCGCCGCCA
+GCCCCACCGGCAGTGCTGAAGCTGAACCCGCCGGCACCGCCGGCCCCGGCGGCGCCGGCGAGCATACCGG
+CGTTGCCGCCGGTTCCGCCGGTACCGCCGATGCCACCGACAAGAGACGTCGCAGCCCCGCCGGCGCCGCC
+GGCGCCGCCGGCCCCAAACAGCATGGCGGACCCGCCAGCGCCACCGGCCCCGCCGATCCCGTTGTTGGCG
+GTGGCGGTTCCGCCGGCACCGCCGGCCCCGCCGTTGCCGAACAGCCCGGCGGCCCCACCAGGGCCACCAG
+CCCCGCCGTTGGCGCCCTTTGCACCGGATCCGCCGGCGCCACCGTTGCCGATCAACCAGCCGGCATCCCC
+TCCGTTGGCCCCGGTGCCGGGAGCACCGTTAGCCCCGTTACCGATCAGCGGACGGCCGGTAGCGGCCAGG
+ACGGGCGCGTTGATCGAGTTGAGCAGCGGCGTCACGGCGGCGGCCTCGGCGGCCGCATAGGCGCCCCCCC
+GGTGGTCAGCGCCTGCACGAACCGACCATGAAACGCCGCCGCCTCGGCGCTCGCCGCCTGATAGGCCCGG
+CCGTGCGCGCCGAACAACGCAGCGATTGCCGCCGAGATCTCATCGGCACCGGCGGCCAGCAGGCTCGTCG
+TGTTGGCCGCCGCAGCCGCGTTGGCCCCAGCGATCGTCGAGCCGAGATCGGCTAGATCCGTCGCCGCCGC
+CGCGATAGTCTCCGGCACCGCGATCACAAACGACATCTGAAAACCTCCCACGACCGCTGACCACCAGGTA
+ATGCCGACGACCCAGGAAGCCTCGGCGCCGGGTGAATCGGTGCCAATCAGCGTATGGGCGGGCAGGCGAC
+CCAACCGGTGTTCCAGCCCGACTCATACCCGCTGTCAAATGACCTGACAATCACTCGGTGGTCACACGCT
+GCGTGCTTCACATTGGTAGCTTGGGCACGTCGGCAACCGTCACAGCTGTCACACGGGTCCCTGTGGGGTT
+GGTCGGCCACCGGCGACAACGTTTCCTGCGCGCCTTGATCTGTCGCCGCTGGGCAGGCATCGCCGCGACG
+GCCGTATCAGGCTTGGTCGGTGTGAGCCGCCAAATCGGTATTGACGAATTCGTCATCGAACTCCCGGCCA
+AGACCACTTAGGTCTGATGGCCTGGTTCTCGTCCTCAAGCCGCGTTAGCACCACTTCGGGACGCCACGCG
+GTTCAGCCCGTTCTCCTCGAATAGCAGCCTGCCGGTGCCACCGGCGTCTGGGCACCCCAGACTTTCGCGC
+CGCTGTCACCCGTTGCGAAGGCCCCCGCAATGGCACGGTCACCGACATGTGATGCCGAGGGGCTGCGCCG
+GGGCTAGATTCGCGTGCAATGCGTGCCTAAACTTTTTGGCGGGGTTGGGGATTTCTGAACCGATCAGTCC
+CGGGTGGGCGGCTATGGAGCGACTAAGCGGACTCGATGCTTTCTTCCTCTATATGGAGACACCGTCGCAG
+CCGCTGAACGTGTGCTGCGTCTTGGAGTTGGACACCTCGACGATGCCGGGCGGCTACACGTACGGCCGGT
+TTCATGCCGCGTTGGAGAAGTATGTCAAGGCGGCGCCCGAATTTCGGATGAAGCTCGCCGATACCGAGCT
+TAACCTGGATCACCCCGTGTGGGTGGACGACGACAATTTTCAGATCCGGCACCACCTGCGCCGGGTCGCT
+ATGCCCGCGCCCGGAGGGCGTCGCGAGCTGGCCGAGATCTGTGGGTACATCGCCGGGTTGCCGCTGGACC
+GTGACCGCCCGCTGTGGGAGATGTGGGTCATCGAAGGCGGTGCCCGTAGCGACACCGTGGCGGTGATGCT
+CAAGGTCCACCACGCCGTGGTCGACGGTGTCGCCGGTGCGAACCTGCTGTCCCACCTGTGCAGCCTGCAG
+CCCGATGCGCCGGCACCGCAACCTGTCCGGGGCACCGGTGGCGGCAATGTGCTGCAGATAGCTGCGAGTG
+GGCTGGTGGGGTTCGCGTCGCGGCCAGTGCGGCTGGCGACGGTGGTACCGGCGACAGTGCTCACATTGGT
+GCGCACATTGCTGCGTGCCCGTGAGGGCCGTACCATGGCCGCCCCGTTTTCGGCCCCACCGACTCCGTTC
+AACGGCCCCCTCGGTCGGCTGCGCAACATCGCGTATACACAGCTCGACATGCGCGACGTCAAGCGTGTCA
+AGGACCGGTTTGGGGTGACCATCAACGATGTGGTGGTGGCGTTGTGTGCCGGAGCGCTACGGCGCTTCCT
+ACTCGAGCACGGCGTGCTGCCCGAGGCCCCGTTGGTGGCCACCGTGCCGGTTTCGGTACACGACAAGTCG
+GACCGACCCGGGCGCAACCAGGCCACCTGGATGTTCTGTCGGGTACCGAGCCAGATCAGCGACCCCGCCC
+AGCGCATCCGCACCATCGCCGCCGGAAACACCGTCGCTAAAGACCACGCCGCGGCCATCGGCCCCACCCT
+GCTGCACGACTGGATTCAGTTCGGCGGCTCGACGATGTTCGGAGCGGCCATGCGGATCTTGCCGCACATT
+TCGATAACGCATAGCCCCGCCTACAATCTGATCCTGTCGAATGTGCCCGGACCCCAGGCCCAGTTGTACT
+TTCTGGGTTGCCGAATGGACTCGATGTTTCCCCTCGGCCCCTCCTTGGCAACGCGGGCCTCAACATCACC
+GTCATGTCCCTCAACGGGGAACTGGGTGTCGGCATTGTCTCCTGCCCCGACCTGCTGCCGGACTTGTGGG
+GCGTGGCAGACGGGTTTCCCGAGGCGCTCAAAGAGCTGCTGGAGTGCAGTGATGACCAGCCGGAAGGCAG
+CAACCACCAGGACTCCTGAGTCGTACGTTCAGAACCGGTAGTCGGTGCCGGTGCCCAGAACTTCGATGGC
+TGCGTTGATGTTCGGGATCACTGTGGCGCCGTATCGGCTGACGATCTGCCCAAGCGCGCGAGCAAGGTGC
+GGACCCACGGCCTCGGCGATGAGGGCGTCCTCGGCGATGACGATGCCGTTCACCATGTGGGCAGCGAGCA
+GCCGGCCGTCGTGGGCGACCTCGTAACGCCAGTCACCGATCTGGATTCGCTCGGGATTAGACCGAAAAAA
+GCCACGTCGTGCGGGGGTATGAATCACTCCCGGAAGTCCGGCGAACACTTTGACCACCAACGCGACACCG
+CCGGGACCGACGAGCGCGGCCGCGACGGCGCGGCTCACTCGCTCGGTATCGAAATCAGACATCAGCTGTC
+CATCGGCAGGACGAATGACGGTGTGATCGTTTCCCCGCTGCCGGTGCGGCGCACGGCGGTTCCCGCGGTG
+TAGAACTCCACCGTGTGCACTCCCCACGCGTAGTTCGAGATGGCGAAGTGCACGCCCACCACGCCGGTTG
+CGCCGTCTCGCTCGGCCTCGCTCTGCATGCGTGACATTGCCAGCTCACGCGCTTGGTAGTTGCCTTGCGT
+CCACTGTGGCATCTCCATGTTGCGGCCGATCTGGCGAAGCGTTTGCATGAATCCCTGCACGGCGATGTGG
+AATACGCAATTGCCCATCACGAACGCCACCGGCGCAAACCCGGATCGCAGCAGCGTCACCATGTCCTGGC
+CGGATAGATGACTGGAGAATGCTTGGCCGTTGGGACGCCGAAATGCTCCGGGCTTGGCGGTGTATCGCAC
+TGCGGTACCGACCGCCATGAACTCAAGGTGTTCCCCGCCCTCCCCATGGTGGCGCCAGTTGAGCCGGACA
+CCGACGATCCCGTCCGCTTTGAGGGCATCGGCTTCGGCCTGCATGCGCGCCATCGCATTCCAGCGCGCCC
+GGTATGTCGCCTCGGTGAGGACACCCAGTTCCTGTTGCTGCCTCATGCCGCTGAATTGGAAGCCGACGTG
+ATAGACCGAGACACCCATGACCAGCTCGATGGGCTCAAACCCGGCCCCATGCAGCAATGCGAACTCGTTG
+ATCGACAAGTCGGACGTGAATGACTTCTCAGCGTGCGACAGCCGTTCGCTGGCTACTGGATCGAGCGAGC
+TTGATTGCATCGTTGTGCGTCCTTCCTGTGGTGTGTGTCAGCGTACGACGCGCAAACCATGCAGCGTCTG
+CCATCAGCGTCCCCAGGGCATCGGCGGCGTCTTGGCGCCGGCAACGCTGTTGTCTGGCAGTCGCGCCGGG
+GAGTCGACGCTACCGGTCGGCACCGCGCCGGCCGCGCATGAGTGAGGTGGCAGCGCGTAACGCGCCGCGT
+AGTGCGTAGACGGCAGTCACCGCCGCCAACAGGATCAACAGGACAAAGGTCGGCAACCAGTTGGCCCGGC
+CGTGATTGACATTCCACCAGATGATCGTGAACAACAGCACGCAGACAAGTAGCACGATGTCTCGCCAATT
+GCCCCGGTAGGACATCGCCGCCTTGCGCAGTGCGTGACTCTTATCGGCTGCATCGATCAGGTCGTCAATG
+CGGGCATCGATTGTGCGCTGTAGGTTGGCGCGCCTTTTGGTGGCATCCGCCGGGAGCCGATCGAGCAGGT
+CCATATCCTGCCTGATCAGCGCTCGAAAGTCGGGGCCTTTGAATTGCCCGGCCGCAATGGCAAGCATGGC
+GCCACCAAAAATGGGCGCACTGTTCAGTGCGATTTGTCCCAGCCCCGGCACATCCACTCCTTCTTCGGCT
+GATCATCAATGTCGGCCCGTTGAGGATCGCCGAACTTCGGCTGGGGATCAACCGCCACACCGCGGACATC
+CCAACCACCGTCCATCAGTGCGGCCCGAGGGGACAGGCGGCGTTCTTAGCCGTCGGGGGCATCGGGTCTG
+TGAACAGCGTGTGATGGTGAGTTTCGTCGGTGGTGGCGTGGTCGATGATCCAGCCCAGTGCCGAACCCGA
+GCCGAGCAGGCAAATGCCCGGCCCCAATTCGTGCGTAGCGCCGCCGCGGATCTTGATGGTGGCGTGCGCA
+GGCCGTCGGGTAGCGGGTGGGCGCCACCAGCGGGTAGCACGAACGAAATCCTTGATGCCCCAAACCGTTT
+AAGCGTTACTGCAGGGTACAGGTACCGAGCGGGACCCGCTGCCGGGCCTAGTTGCTTATCGGTGGTGGTT
+GCGGCTGGAAGGGTTCATACCACCACCAGTCGGCGCGCTCGCCGGTGGGCCCAGGCCACGGCGCTACCGC
+CGGCGGCGGCTTCGTCGACGCCCGCGCCAACGATCCCGCGCTCAAAGGTCGGCCCGCGCTGTCGGCGACG
+GTGAGGTTGTCTGCCGGTCCGGTAATGGTGATCAGGCCCCGATGGTGTGCCCGGTGGTGATACGGGCACA
+CCAGCACCAGGTTGGCCAGCTCGGTGGCCCCACCGTCCTGCCAATGTCGGATGTGGTGGGCGTGCAAACC
+CCGGGTGGCCCCACAACCGGGAACCACACACGTGCGGTCGCGATGCTCAAGCGCCCGGCGCAACCGACGA
+TTGATCTGACGAGTCGTTCGACCGCAGCCAATGACCTGCCCGTCACGTTCGAACCAGGCCTCAAAGGTGG
+CATCACAGAGCAGATATCGGCGTTCGGACTCGCTGAGCAGCGGACCCAGGTGCAGGCCAGCGGCACGCTC
+CTGCACGTCTAGATGCATCACCACGGTGGTGTGCTGCCCATGTGGCCGACGAGCCACCTCGGCGTCCCAG
+CCGGCCTCAACCAGACGCAGAAACGCCTCAACATTGCCCGGCAACGGGGGCCGCTGATCCGACACACCGT
+CGCTGTTGTCGTGATCACGCTTGTACTCGGCGATCAACGCATCCAGATGAGACTGCAACGCCGCATCGAA
+CTTCGCCGCCTCCACGTGCGGAAGCTTGATTCGCCAACAACTGAACTGCTCATCGGCGCTCCTGGTGATC
+GAGGGCCGCGGTTCCGGCCGAAAATCCGGTTCGGGTTCGGGTCGCGGTTCCAACTTGAGCGCGGTCCGCA
+ACTGATTCACCGTGGCAACCCCGGCCAACTGCGCATAATGCGCATCCGAACCCTCACCCGCCCGCCCCGC
+GATCACCCCAACCTGATCCAACGACAACCGCCCCTCCCGCATACCCCGGGCGCAGCGCGGAAACTCCGGC
+AACCGCCGCGCCACCGTGGCGATCGTGTGGGCGTTGCCCGACGAGCAGCCCATCTTCCAGGCCACCAACC
+CCGCCACCGACCGCGCCCCCGTCACACCCCACAACCCGTCGCGATCCAGCTCAGCCACGATCTCCACAAT
+GCGCCCATCAATCGCATTGCGCTGACCGGCCAACTCCGCCAACTCCTCAAACAACACCTCCACACGCTCG
+GCAGGACTGACTACCGCTGCGCCAGACGTCGCGGTCGAGGACATGAGTTCATCATCGCAGCAGGGTCTGA
+CAACTCCGGCCAACCCGAATCCACGCCCGGGGCCGTGCCGTCATCACCCCGCAAAGAGATGCTCGGCTCC
+GCCGGTACGGGCACCCCACGATCCAACACCGCCTGCTCAGCCGCCGACCACTCAACAACCACAACCGTCA
+ATGCAGTTAACCCGGCCCCACCACGGCCCCAACTACGGCGCTCGATCCAGCGCGATCCAACAACACCAAA
+ACCACACGATCCGCACCGCACTCGCCCCCCGAAACGGTCCTCACGATGCCCACGATGGCCACCTGAACTA
+TCCCAGGCTTTGTTCCTAGTCGGTGCGAGGGCCGGGGTTGGCTGGCTCGCGGGGTGTGAGGTGCCGGTGA
+GGGCGGCCTCGTACTCGGCCTGGACTCCGGTAGCCTAGGGCTTCGTGCAGGCATTCCTGGTTGTACCAGC
+CAGCCATTCGGCGGTTGCCAGTTTGACGTCGTCGATGCACCGCCAGGGTCTGCCGCGGTTGATCAACTCG
+GACTTGGAGGCGACGTTGACCGCGAGGGCGTTGTCATAACAGTCGCCACGAGACCCGACCGAAGGGGCGA
+TCCCGAGCTCAGCCAGTCGGTCGGTATAGGTCAGCGATAGTTACTGCGATCCGGGGTCGGAATGATGCAC
+CAACTCAGAAAGATCTGAATTTGATTGCCAAACAGCATGATTGAATACTTGTACGGGCAGATCTTCGGTG
+CGCATCGTCGCCGAGACGGCCCGAACGACGATCTTTCGGGTGCACACGTCGGTGACGAACGCGGTGTAGC
+AGAACCCCTGCCAGGTCCGCACGAACGTGATGTCGGCGACCCACAACCGGTTGGGCTTACTGCCTTGAAT
+TGCCGGTTTACCAGATCAGCCGGCCGTGGTCGGCTACGTCGGTGACGGTGGTGAACACGGCCGTTGCACG
+CCGCACAGCCCGGCCTTGCGCATCAACGGGCGGGTTTGTTCTCTGCCGAGGTGCCAACCCTTGCGTTTCA
+TGGCCTGGTGCATCTTGTTAATCCCGTAGACCGAGTAGTTGTCGCGGTGCGCCGTGCGTAGGCGAACTTG
+AGACTATGACTGTGTTTTCCGGCCAGTCGGATGCGCCCTGGCATGGCCGGCGGTAGGAGATCCAATCGTG
+CATTGTTTTCGTGCAGCCATCCAATACCCCCCTGGGTACTATGGCGGTGCCACTTCAACGAGATAGAGGG
+TGCATGTGATTGGTGATCAAGACAGCATCGCCGCGGTTCTCAACAGGTTACGCCGTGCTCAGGGACAGCT
+TGCCGGGGTGATTTCGATGATCGAGCAGGGCCGCGACTGCCGGGACGTGGTCACCCAGCTCGCCGCGGTA
+TCGCGCGCACTCGACCGCGCCGGATTCAAGATCGTTGCGGCAGGGTTGAAGGAATGCGTGTCCGGGGCCA
+CGGCCAGCGGCGCGGCACCGCTGAGTGCAGCTGAGCTAGAAAAGCTGTTCCTGGCGCTCGCTTGAATGGG
+CCCGAAGCCATCAATAACCAAGGCCGCCGTCCGTGTATACCCATAGGGGTATATTGGACGCCATGTCGGA
+CCAGCCACGTCATCACCAGGTCCTCGACGACCTGCTGCCCCAACACCGCGCTCTACGTCACCAGATTCCC
+CAGGTGTACCAGCGATTTGTAGCCCTGGGCGACGCCGCGCTTACCGACGGCGCTCTCAGCCGCAAGGTCA
+AGGAGCTTGTGGCGCTGGCGATCGCGGTTGTGCAGGGGTGCGATGGCTGCGTCGCATCACACGCCCAAGC
+CGCGGTACGGGCCGGCGCTACAGCGCAAGAAGCCGCTGAGGCCATCGGGGTCACCATCTTGATGCACGGT
+GGACCGGCCACCATCCACGGTGCTCGTGCCTACGCGGCATTTTGCGAATTCGCTGACACAACGCCGTCCT
+AGTCGTCGCGGCCACCGAGCGGACCGCGCTGACCCGGGCTGAAACGTTCCGAGGCGGACTGGCGAAACGC
+ATGGTAGGTCACGCGGAAATGCGGGGCGTGTTGGCGCGATGGCGATAGCCTTTGCCGAGGGTTCAATGGT
+GACCGGGCGCCCGCCGGGTTTCCATGAGGCGGGAGGTCCCTGATGTCCTATCTCGTCGTGGTGCCGGAGT
+TGGTCGCAGCGGCGGCAACAGATTTGGCGAACATCGGTTCGTCGATTAGTGCAGCCAACGCGGCCGCGGC
+GGCACCGACCACGGCACTGGTCGCAGCCGGCGGCGACGAGGTATCGGCGGCCATAGCCGCGTTGTTCGGA
+GCGCATGCTCGGGCATATCAAGCGTTGAGTGCCCAGGCGGCGATGTTTCATGAACAGTTTGTCCGGGCCC
+TCGCCGCCGGCGGTAACTCCTACGCCGTCGCTGAGGCGGCAACCGCGCAATCGGTTCAGCAAGATCTGCT
+CAACCTGATCAATGCGCCCACCCAGGCGCTGTTGGGGCGTCCGCTGATCGGCAACGGCGCCAACGGGCTG
+CCGGGTACGGGCCAGAACGGCGGCGACGGCGGGATTCTGTACGGCAACGGCGGCAACGGTGGGTCCGGCG
+GGGTCAACCAGGCCGGTGGCAATGGCGGGAATGCTGGGCTGTGGGGCAATGGCGGATCCGGCGGAGCCGG
+CGGGAACGCCACCACTGCCGGCCGCAACGGCTTCAACGGGGGCGCCGGGGGAAGCGGCGGTTTGCTGTGG
+GGCAATGGCGGTGCCGGCGGGGCCGGTGGGCACGGCGGTCCGGCTCCGCTCGTGGGCGGGGTGGGCACCA
+CCGGTGGCGCCGGCGGGAACGGCGGCGGCGCCGGGTTGTTCTACGGTTTCGGCGGCGCCGGTGGGAACGG
+CGGGATGGGCGGGGTGGCACCGAGCACCGGCCCCTCGATGGGCATCCTCCCGGCCGGCGGTGTCGGCGGG
+CCTGGTGGCTCCGGCGGGGCGAGCGCGCTTGCCTTCGGCTCCGGCGGCGTCGGCGGTGCCGGTGGCTTGG
+GCGGGCCGACCGATGGCACCGTCCAGGGGGTGGGCGGCTTCGGCGGTCAGGGCGGCAACGGCGGGCAGAG
+CGGCTTGTTGTTTGGCAACGCGGGAGCCGGCGGGGCAGGCGCTGCCGGCGGAGCCGGCACCGGCGACACC
+GAGAGCTTCGGCGGCCACGGCGGGGCCGGCGGTGATGGCGGCGCTGTTGGCTTGATCGGTAACGGTGGGG
+GCGGCGGTAACGGCGGGGCCGGCGGCACCGGATCTCCCGGCGCTGTGGTGGGTGGTAACGGCGGCGTCGG
+TGGTCTGGGTGGCGCCGGCAGTCCCGGGGGTCTGTTGTACGGCACCGGGGGGGCCGGCGGCAATGGCGGA
+CCGGGTGGTGACGGTGGTACTGGCGCGACGGTGGGCTTTGCCGGCTCCGGCGGTTTCGGCGGTGCGGGGG
+GCATCGCCCAGCTGTTTGGCACGGGTGGCATGGGTGGTAGCGGCGGTGGTATAGGCGCTGGCACCACGAC
+CGTGGTGCCGCCCGACGTCGCCCCGGTGGGTGGCACAGGCGGCAATGGCGGTCGCGCCGGGCTGCTGTTG
+GGTGTGGGTGGCATGGGCGGTAATGGCGGTGCCACCAGCGTCGGCGGGACGCTCTACGCCGCCGGTGGAA
+ACGGCGGCGACGGCGGGTTGGTGTGGGGCAACGGTGGCACCGGCGGGAGCGGTGGCGCCGGCGGGGCGGG
+CAGCGTCGGCAACGGCGGTGCGGGTGGCAACGCGGCACTGCTGTTCGGCAACGGCGGGGCGGGCGGGGCC
+GGCGGCGCCGGCGGCATCGGTGCCGGCGGAGCCGGCGGCTTCGGCGCGGTTCTGTTTGGCAACGGCGGGG
+CTGGCGGGAGCGGTGCCCCCGGTGGCATCGGCGCCGGTGGCAATGGCGGAAACGCGCTGCTGGTCGGCAA
+CGGCGGCAACGGTGGGGCAGGTACCGGTGGGGCTGCTGGCGGTGCCGGTGGCTCGGGCGGGTTGCTATTC
+GGCCAAAATGGGATGCCCGGGCCGTGAGCGCCCCAACCCAGGCCAACCCCCTATGGGCAATCTGCACATC
+AATTGGCCAGGTCGACAGCAGACCGCACACATCTACGAGATTGGTTCCCGATCCGTGGGTGGGGCCGGGA
+AAAGCGGCTGTAAGAGTTGGCTAGGTTCAGTAGGGTGGCGGCGTGCATGAGGTGGCTGCTCGTGAGCAAC
+GTTCGGACGGGCCGATGAGGCTGGATGCGCAGGGCCGACTGCAGCGTTACGAGGAGGCGTTCGCTGACTA
+CGATGCACCGTTTGCGTTCGTAGATCTCGACGCGATGTGGGGCAATGCCGATCAACTGCTTGCGCGCGCC
+GGCGACAAGCCGATCCGGGTGGCGTCGAAGTCGCTGCGTTGCCGACCACTGCAACGCGAAATCCTTGATG
+CCAGTGAGCGATTCGACGGGCTATTGACGTTCACGCTTACCGAGACGCTGTGGCTTGCCGGCCAAGGTTT
+CTCGAACCTGTTGTTGGCCTACCCGCCGACCGACCGGGCGGCATTGCGTGCGCTTGGCGAGCTGACGGCC
+AAGGACCCGGACGGGGCGCCGATCGTGATGGTGGACAGCGTGGAGCACCTTGACCTGATCGAGCGCACGA
+CCGACAAGCCGGTACGGTTGTGTCTGGATTTCGATGCCGGCTATTGGCGCGCCGGCGGGCGGATAAAAAT
+TGGTTCCAAGCGCTCGCCGCTGCACACCCCGGAGCAGGCTCGCGCACTCGCGGTGGAGATCGCGCGGCGG
+CCGGCGCTAACGTTGGCGGCGTTGATGTGCTACGAGGCCCACATTGCGGGCCTCGGTGACAACGTCGCCG
+GCAAGCGGGTCCACAACGCGATCATCCGTCGGATGCAGCGCATGTCGTTCGAAGAGCTGCGCGAGCGTCG
+TGCCCGGGCCGTCGAGCTGGTGCGCGAGGTCGCCGACATCAAGATCGTCAACGCCGGTGGCACCGGCGAC
+TTGCAGCTGGTTGCGCAGGAGCCGTTGATTACCGAAGCGACCGCCGGCTCGGGTTTTTACGCGCCGACAC
+TGTTCGACTCGTATTCGACGTTCACGCTGCAGCCCGCGGCGATGTTCGCGCTGCCGGTATGCCGTCGTCC
+CGGTGCAAAGACCGTGACCGCGCTCGGGGGTGGCTATTTAGCCAGCGGGGTCGGGGCGAAGGACCGCATG
+CCGACTCCCTACCTGCCGGTCGGGCTGAAGCTCAATGCGCTGGAGGGAACGGGCGAAGTTCAGACACCGC
+TATCCGGTGATGCAGCCCGACGGCTGAAGCTTGGCGACAAGGTCTACTTCCGCCACACCAAGGCCGGTGA
+GCTGTGTGAGCGGTTCGACCATCTGCATCTGGTCCGTGGCGCTGAAGTAGTCGACACCGTCCCCACCTAC
+CGGGGTGAAGGGCGCACCTTCCTCTAATGCTGAAATGGACGAGGCCCACCCGGCTCACCCGGCAGATGCG
+GGGCGGCCCGGTGGCCCAATTCAAGGCGCGCGAAGAGGAGCTGCCATGACACCGATCACCGCCCTGCCGA
+CCGAGTTGGCGGCCATGCGCGAGGTAGTCGAGACGCTCGCACCCATTGAGCGTGCCGCGGGCGAGCCGGG
+TGAGCACAAGGCGGCCGAGTGGATCGTCGAGCGCCTGCGCACGGCGGGCGCGCAGGACGCGCGCATCGAG
+GAGGAGCAGTACCTCGACGGCTACCCGAGGCTGCACCTCAAGCTGTCGGTGATCGGGGTGGCGGCCGGCG
+TCGCGGGCCTGCTCAGCAGACGTTTGCGCATCCCCGCCGCGCTGGCCGGGGTGGGTGCGGGGCTGGCAAT
+CGCCGACGATTGCGCCAACGGGCCGCGCATTGTGCGCAAACGAACGGAGACGCCCCGGACGACATGGAAC
+GCGGTAGCCGAGGCCGGTGATCCTGCTGGTCAGCTAACAGTTGTTGTGTGCGCTCACCACGACGCCGCGC
+ACAGCGGCAAGTTTTTCGAGGCTCATATTGAGGAGGTAATGGTCGAGCTGTTTCCCGGGATTGTGGAGCG
+CATCGACACGCAGCTGCCGAACTGGTGGGGGCCGATCCTCGCGCCCGCACTCGCCGGTGTCGGCGCCCTG
+CGCGGCAGCCGGCCGATGATGATCGCCGGAACGGTGGGTAGCGCCCTGGCCGCCGCTTTGTTCGCCGACA
+TCGCGCGCAGTCCGGTCGTCCCCGGTGCCAACGACAATCTCTCCGCGGTTGCGCTGCTGGTCGCGCTGGC
+CGAGCGGCTGCGCGAGCGGCCGGTGAAGGGCGTGCGAGTGTTGCTCGTGTCCCTGGGGGCCGAGGAAACG
+TTGCAGGGCGGGATCTACGGGTTCCTGGCGCGACACAAACCCGAGCTGGACCGCGACCGCACATACTTCC
+TGAACTTCGACACCATCGGCTCACCCGAGCTCATCATGCTCGAGGGCGAGGGCCCGACGGTCATGGAGGA
+CTACTTCTATCGGCCATTCCGGGATCTGGTCATCCGGGCGGCCGAGCGCGCCGACGCGCCGCTGCGGCGC
+GGCATCCGGTCGCGCAACAGTACCGACGCGGTGTTGATGAGCCGCGCCGGCTACCCGACCGCGTGCTTTG
+TGTCGATCAACCGGCACAAGTCGGTGGCCAATTACCACCTGATGTCCGATACACCTGAGAATCTCTGCTA
+TGAGACGGTGTCCCACGCCGTCACCGTCGCCGAATCCGTGATCAGGGAGCTGGCCCGATGAGCCCGATAT
+GGAGTAATTGGCCTGGTGAGCAAGTCTGCGCGCCGTCGGCGATCGTACGGCCGACCTCGGAGGCTGAGCT
+GGCCGACGTGATCGCGCAGGCGGCGAAAAGAGGCGAGCGGGTACGCGCGGTTGGCAGCGGGCATTCGTTT
+ACCGACATCGCCTGCACGGACGGGGTCATGATCGACATGACCGGCCTGCAGCGGGTCCTCGACGTGGACC
+AGCCGACTGGCCTGGTGACGGTCGAGGGGGGCGCAAAGCTACGTGCGCTGGGACCCCAATTGGCGCAACG
+ACGGCTCGGCCTGGAGAACCAGGGTGACGTGGATCCCCAATCCATCACCGGCGCGACCGCGACCGCGACG
+CACGGAACCGGGGTGCGTTTCCAGAATCTGTCGGCGCGGATCGTTTCGCTGCGGCTGGTCACCGCGGGCG
+GGGAAGTGCTCAGTCTGTCCGAAGGTGACGATTACCTGGCGGCACGGGTTTCCCTCGGCGCGCTAGGAGT
+GATCTCACAGGTCACCCTGCAGACGGTTCCGCTATTCACGTTGCATCGCCATGATCAGCGACGCTCGCTG
+GCGCAGACGCTGGAGCGCCTCGACGAGTTCGTGGACGGTAATGACCATTTCGAGTTTTTCGTATTCCCTT
+ACGCAGATAAGGCGTTGACGCGCACCATGCATCGCAGTGACGAGCAGCCCAAACCCACGCCCGGGTGGCA
+GCGCATGGTCGGCGAGAACTTCGAGAACGGGGGATTGAGCCTGATCTGCCAGACCGGCCGTCGTTTTCCT
+AGTGTGGCGCCGCGACTGAACCGCCTGATGACGAACATGATGTCGTCCTCCACCGTGCAAGACCGCGCCT
+ACAAGGTCTTTGCGACCCAACGCAAGGTCAGGTTCACCGAGATGGAGTACGCGATCCCGCGTGAAAACGG
+GCGCGAGGCGCTCCAGCGTGTCATCGACCTTGTGCGCCGTCGCAGCTTGCCGATCATGTTTCCGATTGAG
+GTGCGATTCTCCGCCCCCGACGATTCCTTCCTGTCGACCGCATATGGGCGCGACACTTGCTACATCGCGG
+TTCATCAATACGCCGGTATGGAGTTCGAAAGCTACTTCCGCGCCGTCGAGGAGATCATGGACGACTACGC
+CGGTCGGCCACACTGGGGTAAACGTCACTATCAGACCGCCGCCACGCTTCGTGAGCGCTATCCGCAGTGG
+GATCGGTTCGCCGCGGTTCGCGATCGCCTCGATCCGGACCGGGTGTTTCTCAACGACTACACCCGGCGCG
+TTCTCGGTCCCTGACAACGAATCAACGAACCCTCGTGGTGTTCGGCCGATATCGACACGGTCACAACCGC
+GTACCGATATCAGCGGTGGTATGGCGTAACGGGCACGATGCACAAATCATGGCAGCATGCGCGTTGGGAG
+CCACCGTCGCGAACCAAGCGTGCGCGTTCACGGATTCGTCCGCCTGAGTTGGCGGATATCGGTTGGGTTC
+AACAGGAGGTAGCCAACCCATGACGGCGAATCGAGGGCCCGCTGCAATCTCGAGCGGCTCGAACTCTGGC
+CGCGTTCTCGACACCGCCCGGGGTATCCTCATCGCTCTTCGGCGGTGCCCCGCAGAGACCGCGTTCGACG
+AGTTGCACAACGCCGCTCAACGGCACAGATTGCCGGTCTTCGAAATAGCTTGGGCACTAGTGCATTTGGC
+GGTCGAGGGAAGCACGCCATGCCGGAGCTTCGTCGATGCCCAGTCGGCGGCTCGGCGGGAGTGGGGTCAG
+CTTTTTGCGCATGCGGCGGCGTAATGCCAGCTTGGCGGTGGTGTGGGGAAGCACCGCCGCCAGCTAAACG
+GATCGGCTTCGAATCCAGGAGCCCAATCAGCGAGTCCAGTCCGGCGAGTCCGCGGCGGCGCGCAACGCGG
+CGATTATGCGCTGCTCTTTTTCCAGAAATCGTGCGGTGGGCGCCGGCACCGAGATCGCGATCACGTTGTC
+GCCCAGGGCGCGTCGTGCGATCGCAGCCGCGGATATCCCTGGGGTGTGCTCGTTGCGGTCAAAAGCGATA
+CCGGTGCGCCGGATCTCGACGATCTCGCGCCGTAGACCTTCGGCCACCATGGGATCCAGACGGCAGAGCG
+CGGCCTCGGCGTCGGCGTCGTCGAGAGCAGCCAGCGCCGCTTTTCCATTCGCGGTTCCGTTCAACGGGAA
+GCGGAGCCCGACGGCTGAGACCGCACGCAGCCGGTAAGACGATTCGATCTGGTCGACAAACCACATTCGC
+TGGCCGCGCAGTACCGACAGGTCGACCGTTTCGCCGTCGGTCGCGCGGGCAACTCGCTCGACGGTCGGCC
+GGAACGCCGCGGCTATGTGGGCTCCGGTGACACTTCCGAATCCCAGCAAACGCTCGCCCAGTGCGAAGCG
+GCCGTGCGAATCGACACTAACCAGCCCCACCTCGACCAGGCCGACCAGCAAGCGTCGAGTCGTCGATTTG
+GCCAGCCCCAGCCGCTCGCAGAGATCGACTAGGCGCAGGTGTCCCGGTTCGGCAGCTATTTCGTCCAGCG
+CGGCGACGGCGCGACGGAGCACCTGGATGCCTTCGTCGCGATTCGTTGTCGACTTTCCTTCCGTAGGCGG
+CACAACTGCAATATAGTGAACCGAAATACGGATCACAATGATTCGAAATACGGACCAGGAGTTTTGCTAT
+GAGGGCGCTACCGGCCGGGCGGCACTTCTTCCGGGGCAGTGACGGGTACGAGGCGGCTCGCCGCGGCACC
+GTGTGGCATCGGCGCGTACCGGATCGCTACCCCGAGGTGATCGTTCAGGCTGTCAGTGCTGACGACATTG
+TCAGCGCCATCCGCTACGCCACGGTCAATGGCCATAAGGTGAGCGTCGTGTCCGGTGGGCACAGTTTTGC
+CGCCAGCCATCTGCGCGATGGCGCTGTGCTGCTCGACGTGAGCCGGATAGACCACGCCTCCATCGACGCC
+GATAAGGGCCGCGCGGTCGTCGGTCCAGGGAAGGGCGGCAGCGTGCTCATGGCCGAACTGGAGGCGCAGG
+GCCTGTTCTTCCCGGGTGGCCACTGCAGGGGAGTCTGTCTCGGAGGTTATCTGCTGCAGGGCGGATACGG
+CTGGAACAGCCGGATCTACGGCCCGGCGTGCGAGAGCGTGATTGGCCTGGACGTCATCACCGCCGACGGC
+GCGCAGATCCATTGCGACGCAGACAATCACGCCGATCTGTACTGGGCCGCCCGCGGCGCCGGTCCGGGCT
+TTTTTGGCGTCGTCACCTCGTTTTACCTGAAGCTGTATCCGAGGCCGGCCACCTGTGGCACCAGCGTCTA
+TGTCTACCCATTCGACCTTGCCGACGAGGTCTTTACCTGGGCCCGCGCGGTCAGCGCCGAAGTCGACCCT
+CGGGTCGAGCTGCAAGCCCTTGCCTCCCGCGGTGAACCGAGCATGGGCATCGACGTCCCCGTCATCTCCC
+TTGCCTCGCCCGCTTTCGCTGACTCGCCCGAAGAGGCCGAACAGGCCCTCGCCCTGTTCGGCACCTGCCC
+GGTTGTCGAGCAGGCACTGGTCAAAGTCCCTTATATGCCAACCGATTTGCCTGCCTGGTATGACGTCGCG
+ATGACCCACTACCTGTCAGACCATCACTACGCGGTGGACAATATGTGGACGTCGGCGTCCGCTGAGGACC
+TGCTGCCGGGTATCCGCTCAATCCTGGACACGCTGCCCCCGCATCCGGCGCACTTCCTCTGGCTGAACTG
+GGGTCCATGCCCTCCCCGTCAAGACATGGCCTATAGCATCGAAGCCGACATCTACTTGGCGCTCTACGGC
+TCCTGGAAGGATCCGGCCGACGAGGCGAAGTACGCCGACTGGGCGCGGTCCCACATGGCCGCGATGTCGC
+ATCTGGCGGTCGGCATCCAGCTCGCCGACGAGAACCTCGGTGCGCGTCCGGCGCGCTTCGCCAGCGACGC
+GGCCATGGCCAAGCTCGACCGGGTGCGCGCCGAATACGACCCCGACGGTTTGTTCAACAGTTGGATGGGA
+AGAATCTGATGGCCAGCGATCTGTACCTGGGCTACCGCAACGACGACGCGGACACGCCGTTCGGCAAGTT
+CTTCAAACCCGAGATGGCCCCGCTGCCACAGCATGTCGTGGTGGCGTTGCAGCATGGCCCCCAGGCCGGG
+ATGGCGTTGCTCGCCTTCGACGACGCCGCGAGCATCGTTGATGAGGGCTATCAGCAGACCGAGAACGGCT
+ACGGGATTCTCGGCGACGGCAGCATGCAGGTATCCGTGCGCACCGACATGCCCGGGGTCACTCCCGCGAT
+GTGGGCATGGTGGTTCGGCTGGCACGGCAGCGACACCCGCCGCTACAAGCTGTGGCACCCGCGGGCCCAT
+CTATCGGCGCGGTGGAAGGACGGCGACCAGGACAGCGGGGCCGGCCGTCGGGGCGCGCAGCGTTACGTCG
+GCCGCTGGTCGATGATCAGCGAGTACATCGGCTCGACGAAACTGGGTGCCGCAATACAATTCGTCGAGCC
+GGCGGCCATGGGTCTGCCCGACGACAGCGACGATACGGTGTCGATCTGTGCGCGGTTGGGCTCTGCTGAC
+GCCCCGGTGGATGCGGGCTGGTTCGTCCATCAGGTCCGATCGACGCCGGGCGGGTCCGAGATGCGGTCAC
+GGTTTTGGATGGGCGGACCGCACATCGCGGTGCGCAAGGCACCCGAGGTCGCGTCCAAGGCGGTGCGTCC
+CATCGCGTCGAAGCTAATCGGCGTCTCGGAATCGACCGCGCGTAATCTGCTGGTGTACTGCGCGCAGGAG
+ATGAACCACCTGGCGGGGTTCTTGGCGGACCTGTGGGAAAGCTTCGGTGACGAGTGAGGTTTCAGCTTTG
+CTCGGCAAACGCTGGCGCCACGTATTTTTCGACCAGCCGGCGTTCGGCTTCGTCGTTCTCAGCTGGCCAA
+TACATCAGTGAGAGCACCACGCGTACCACCCATTTCGCGCCTTGCGGATCACCGCCGGCTATGCCGGTGA
+GCTCGGTAGCAAAGTCCGCAAGCAACGGTGACTCGGTGAGCCAGGCCAATTCACCGGCGCCACCGTGGAT
+CGAGCCGAACATGAGCTTGCCCAGCGGGTCGGATCGGATTCGCTGAAGCGATAACAGGATCGCCGCGACG
+ACTCGCTCCCGCCCCCGCAGAGTTTCGACATCCGAGCGCACGCCGTCGGCGATCCGGGCCGCGGCCCGGG
+TCAGAACGACATCCCGGATCTGGGCCTTGCCGCCGGCACGGCGGTAGATGGTCGCTCGGGAGCAGTGGAC
+CTCGCGGGCTAATTTGTCGATGTCGAGTGCGTTGAGCCCGTAGCGCGTAATGAGGTCGGTTGCGGCGGCG
+TAGATCCGTTCGGCAGCGATCGTGCGGCGGTTGCCGCCCACGATCCAATCGTTACCCGGCACTGGTCAGG
+CGCATTTCCATCGAGAGGCGAAGAGCGATTCTTCTCATAGTGAGACACAAACCTTACTTATTCTCATCGT
+AGTTGCAGGTCCGCCTCCCGCGGTGAGACGTTCGCCGAAAGGCTCCCCGGGCGCAGTTCTCGACTTGCAG
+CGACGCGTTGACCAGGCGGTATCCGCCGATCACGCTGAACTAATGACAATTGCCAAGGATGCCAACACGT
+TCTTTGGTGCCGAATCCGTGCAGGACCCCTACCCGCTGTATGAGCGCATGCGCGCCGCAGGCTCGGTCCA
+CCGGATCGCTAACTCGGACTTCTATGCCGTGTGCGGTTGGGACGCTGTCAATGAGGCCATCGGTCGTCCG
+GAGGACTTCTCCTCGAATTTGACCGCCACGATGACCTATACGGCCGAGGGCACCGCTAAACCGTTCGAGA
+TGGACCCACTCGGCGGACCCACACACGTGTTGGCCACCGCCGACGATCCTGCCCACGCCGTGCACCGCAA
+GCTCGTGCTGCGTCACTTGGCGGCCAAGCGGATCCGCGTTATGGAGCAGTTCACCGTACAGGCTGCCGAC
+CGGCTGTGGGTCGACGGCATGCAGGATGGGTGCATCGAATGGATGGGCGCCATGGCCAATCGCCTACCGA
+TGATGGTCGTAGCTGAGCTCATCGGCCTGCCCGACCCCGACATCGCCCAGCTGGTGAAGTGGGGATACGC
+GGCCACTCAGCTACTCGAAGGGTTGGTCGAAAACGATCAGCTCGTCGCCGCGGGTGTGGCGTTGATGGAG
+CTCAGCGGTTACATCTTCGAGCAGTTTGACCGTGCCGCGGCCGATCCGCGGGACAATCTGCTCGGTGAGC
+TTGCCACCGCCTGCGCATCGGGGGAGCTGGACACTCTCACCGCCCAGGTCATGATGGTCACCTTGTTCGC
+CGCCGGCGGCGAGTCCACGGCGGCGCTGCTGGGCAGCGCGGTATGGATACTGGCGACACGTCCCGATATC
+CAGCAACAGGTGCGCGCGAACCCCGAGCTGCTGGGAGCGTTTATCGAAGAGACGCTGCGTTACGAGCCGC
+CATTTCGCGGCCAGTACCGCCACGTGCGAAACGCCACCACCTTGGACGGCACGGAACTGCCCGCGGATTC
+GCACCTGCTGCTGTTGTGGGGCGCGGCCAACCGCGATCCAGCCCAGTTCGAGGCACCCGGCGAGTTCCGT
+CTTGACCGTGCAGGAGGCAAAGGCCACATCAGTTTCGGAAAAGGGGCCCACTTCTGTGTCGGCGCTGCAC
+TGGCACGCTTGGAGGCTCGAATCGTCTTGCGTCTGCTGCTCGATCGCACCTCGGTAATTGAGGCAGCCGA
+TGTCGGCGGGTGGTTGCCCAGTATCCTGGTGCGCCGCATCGAGCGGCTAGAGCTAGCTGTACAATAGGCG
+CTCGACGACTCCTATTGCAGCACAACGGATATCAGCAACAGCAGGTGCCAACCGCGGCGATCGGATGCGT
+GAGAATAGTGAAAGTGGTTGTCGCGGTCAGGATTTCTGCGATCAACCCTACCCGCATGACGCCGGCGGGT
+GGCCCCCGCCGGCCACGATAAATGCTTCGACCGCCGTGGCCCGCTCGTAACCTTCGACCTCCACGCGCCA
+CTCGTAGATTCCTGGTTCCAAGGGAATTCCCGCAGGAATGTTGAGGGTGAGCGGCATGCGAACCGAGGTG
+CCGTGGATTGCGCCAGGAGCGCGGCCCGCCTCGGCGGCGGCTTCAAAGAGGATCCGCTGCGGCCCGTGTG
+GTCCCGGCACGACCACCGGATCGCCGTCGGCGGTGAGCAACTGGCATTTCAGCTGGTGCTGCTTATTGGT
+CTCATCCCAGTCGATGTCAAGGAACAGTACCAAAGCGAATGGGGGGGTCGGTCTTTGGCATTGCCGCCAG
+CCCAGCCCGAGCGCATGGACCTTCCCGGACTGGGCATCAGCCTGCGCCGCGTCCGACAGGAACAGACTGA
+CCCTCATGTCGCCGCCGCTGCGATCGAACTCCCGGGTTCCGATTCCACCCCTGTCCTTCCCCAATGTGCA
+ACTAGCCGAAGGTCGGTCAATACCGCACCCACTTAGACTGACTCCATCCCGACGGCAGGATAATACGTGG
+CGACCGGTAGATCTATGTTGTGCTATCTGGGCGGTGGCAGCTGGCGCGGACCGTCGGGGGAACGCAGTTC
+ATGCGGACCCTCCCGTTGGGTCAGCTCCCCGGTCGACCCAACTGATAGGCTCGCCAGGTCTCGCGGAGGC
+ACCTGCGCTAACGGCGGGTGATCATCGTTGGTAGCCAGCCGGCTACGGCGCGCAGAGTCCGACGATGCGA
+TCGGGTTGCTTTCGGCAGGGGCAGCCGGGGAGTGGGATTCCAGCGGGGGCTGGTCGTTGGGGTCGGAACC
+TTCGGCATTGACCGTCACCTTGTGGGTGCGCTTGAACGAAAACGCGATCTCCTCGACCTCTTCGAACACC
+TGACGCGCGGTGCGCAACGGCGCAGTGGTGTTGTCGAGCATTCGTGCGACAAACGGCGGCACCAGTGGGC
+GAATCCACCGAGCCGCAGCCTTGGTGGCGTCTGGGATCGACCGGATCACTGGGGTTGCACGCTTCTCGCG
+TGGTTCAACCGCACCCTCCGGTTGGACCTGTGCCGGCAGGTTTTTCGCGATACCGGGGCGGTGATGGGCT
+GCCCCAGCAGGCAATTGGGCGACCGTCCGGCTGGCAGCTTCGGTTTCGGCGGCGATGGGCAGATACACCT
+CGTCCTCCACTGGCTGCAAGGTTCGCTCCGACGAAGCGCGCACTGGACCTTCGAGCGCTTCGACGACTCG
+GCGGCGTTGCTGTTCGCGGTCGATTTCGGCCTGGGCCTCGATGGCGAGGCGGGTCTGGGTGAGTTGGTGC
+TCGGCCCACATGATTTCGGCGGCCCGGCGAACCTCCGCCCGCTTGATCGCGATCGCGGTGTCCGCCTCCA
+ACTCGGCGCGCTCCCGTTCCGCTCGCGCGGCCGCGTGGCGATCGTGCGTTGTGTCACCGCGCCATAGCCG
+GAGAATCAGCGGCAATAGGTACAGCAGCGCGAAGAAAGCGATCGCCAGCATTCGCGCCGTCAAGGCGCCG
+GCGCTGGCCAATGTCAGATCGTTCATGGCGACCCAGCGCGAGCCCAAACCACGACCCGCATCCGCGACCA
+CGGCCTGGCGCACCTCGGCAAGAGCCTGCTCGTCGTGTGCCATTTTGGCGTCCAAGGCAGGTGCTTGGTG
+ATCACGAGCCGCCAGCGCGTTGTCCAGCTCACGCTGCGCGTCGGCGAGAAGCTGGTTCGCCGTTCGTGTT
+TCGGGCCCTCGGCCGGGAACGCCGGTGATCCGGGTCTGCGGGCAGGCCGGAGTTGGGTGGTATTCGCAGC
+GTGCGACGACCAGCGCATCGTCCAGTCGTCCGCGCGCCCGCTCGACCGCGCTGTCCAGCGCAGTGCGCGC
+ATTGCGGGCCTGTTGCAGGGAGGCCGACGCTTGCACGGCCGCCGGCGTCGCGTCGGCGCTGTGCATAGCT
+TGTTCATCGAGACGGCGGTCGATGGCACCGGAAAACATGACCAGCGCAGCGAGTTCGCCGACGACGAAAC
+CGACGGCGACCGCGACGGACGCGCGTCCCGTAACGCCGGCCCGACCGCGAGCTGGGCCACTGGCCGTACC
+GCGGGTCACCGCGCCGACCAGCAGGCCGAGCACCAGGGCGAGCGAGGCAGCCCCGATGGGGGACGAGATC
+GGCCCCTGGGCCGCCTCGCTCACCGCGAGGCTCGCGAGGAGTCCGGCCAGCGCGGCGCCCACGGCCACAA
+TCACGCCGGCCACGGCGTGCGTGGACCGCTCGTGACGCTCGCCGAGTTCGCGCCAGTGTCCGCCGCCGAG
+CCAGGTAAGCAGCCCCTCGATTCCGGACACGGCCGAGCGCTGCTCAGCATATTCGTGGGCGCACATGAGA
+CTGAAAACACCTCCTGCTGGTCAAGCCTGGCAGGCCCCCGCCCGACACACCGAATCGAAGCGGCCCCTTG
+TGGTGTTGTTCACAACTGCGCGAGAGATGACGCAGATCACGTCGCGGCTGCCCAGCCGAATCCTCAGCGA
+GTTCAATGTCAAAATTACCGCGGCGCGAGCGGATCAGCGGCCATTATGGCAGGTGACGTGAGACGGTATA
+CACCTATGCAAAATCACGACTACGTTACCTACGAAGAGTTCGGCCGCAGATTCTTCGAGGTAGCAGTTAC
+CCCGGACCGCGTCGCCGCCGCGTTTGCCGACATCGCGGGCAGCGAGTTCGCAATGGAACCGATCTCCCAG
+GGCCCCGGCGGGATCGCCAAGGTTAGCGCGAACGTCAAGATCCGAGAGCCCCGGGTGACGCGAAAGCTGG
+GTGACCTGATCACGTTTGTCATCCATATCCCGCTGTCGATCGATCTCCTTCTTGACCTGCGCCTCGACAA
+GCAGCGGTTTATGGTCGCCGGCGACATCGCGCTGCGCGCCACCGCACGCGCCGCCGAGCCGCTGCTACTG
+ATTGTCGACGTCGCCAAACCGCGGCCCTCTGATATCACGGTCAACGTGTCGTCGAAGTCGATCCGCGGTG
+AGGTGTTGCGCATCCTCGCAGGCGTTGACGGTGAGATTCGGCGATTTATCGCCCAGTACGTCTCTGCCGA
+GATCGACTCGCCCAAATCCCAAGCCGCTCAAGTCATCAATGTGGCCGAACAATTGGACTCTACCTGGAGC
+GGCCCGTAGCCAGCTCTGGATGCAGTCTGGCTGCCGGCCACCGAAAGCTCACCAACAGCTCATCGGTGAG
+GTCGTCGCAGCGCGCACCGCCTCGGCCAAGGTGGCTGCCCTGCGATCGGTGAAGATGTCCTCGAGCAGCA
+TCGGCTGACCGTCGGGGCCGGTGAGCGGCACCCGCCAGTTCGGGTACTCGTCGGTGGTGCCAGGCTGGTT
+TTGCGTCCGGCGGTCGCCGACCGCATCGGTCAACGCCACTGCCAACAGCCGCGAGGGCGTTCGGCCCAGG
+TAGCGGTAGAGAGCCAGGACGGCCTCCTCCGAGTCGGGCTCGGCACCGTCCGCCAGCAGTCCGACCCGGC
+GCAGCTCGGCCATCCAGGCTGCCCGGTCGGCCCGGGCGGATTCGAGTTCCGCCTCCACGGGGTTGGTTAA
+CAACCCAAGGGACTCGCGCAGCCGTACCTGGTCGCCGGCCAGGTAGCCGGCGGTCGGCGGCAGATCATGG
+GTGGTCACCGACGACAAGCAGTACTCCCGCCAGCGTTCGGCCGGCAATGGTGTTCCAGCCGGCCCGCAAT
+CTCGATCCTGCTCAAACCAGAGAATTGAGGTGCCCAGCAGGCCCCGCAATAGTAGATAGTCGCGTACCCA
+CGGCTCGACGGTGCCGAGATCCTCACCGACGACAACCGCCCCGGCCCGGTGGGCTTCCAGGGCGACGATG
+CCGATCATCGCGTCGTGGTCGTAGCGCACATAGGTGCCTTGGGTGGGCGGTGCGCCGTCGGGGATCCACC
+ACAACCGGAACAGCCCGATGATGTGGTCGATGCGTACCGCACCGGCGTGCCGCAACGCGGCCTGGATCAG
+CGCGCGAAACGGTCGGTACTCCTGCTCAGCGAGCCGGTCCGGCCGCCACGGTGGCTGCGACCAGTCCTGG
+CCGAGTTGGTTGAACTCATCCGGCGGCGCACCTGCGGTCACACCTTGGGCCAGCACGTCCTGCAGAGCCC
+AGGCGTCGGCCCCGTTGGGGTGCACGCCAACGGCGAGGTCTGCCATGATGCCCAGCGACATGCCGGCCCG
+GAGCGCCTGCGACTGCGCACTGGCGAGCTGCTCGTCCAGCTGCCACTGCAGCCAGCGGTGGAAATCGACG
+GCATCGGCGTGTTTGTCGACGAAATCGGCGACACCTGAGGCATCGGGATGCCGCAGCGATTTCGGCCATC
+GATGCCAATCATCGCCGTACGTCTCGGCCAGCGCGCACCAGGTGGCGAAGTCGTCGAGGGCGCGGCCCTC
+GCGGGTACGGAAGGCGGCGTAGGCCAGCTCGCGACCCGCCGACCGCGGCACCCGGTGCACGAGCTTGAGT
+GCTGCGCGTTTGGCCGCCCAGGCGCTGTCGCGGTCAATGGTGTCGAGCTGGTCGGCGTGCTGTTGCACGT
+TGGTGCGCAACCGTTGCACCCGGCCACGCTTGGGCAGATCGACGAGTTCCGGAATGGCCTCCACCCGAAG
+GTAGAGAGGGTTGACGAAGCGTCGCGATGTCGGCAGGTAGGGCGATGGTTCGATTGGCTTCGAGCGCCCA
+GCGGGCCCGGGAAGCGTAGCCGCATGCAGGGGATTGACCAGCACATAGCCGGCACCGTGCGCAGACGCCG
+ACCACAGCGCGAGATTCGCCAAATCGGTGAGATCCCCGATGCCCCATGACTGCCGGGACCGCACGCTGTA
+GAGCTGGACGGCCAGGCCCCAGGCACGACGGCCTGCCAGCTTGTCCGGCAGCCCCAACCAATCCGGCGTC
+ACGACAACAGCGGCGCTGGCCTGCGAGTCGCCCGAACGCAGATTCACCCGGTGGTAGCCGAGGGGCAGGT
+CGGCGGGCAACACGAAGCTGGCCTCGCCGATCCAGCGTCCGTCAAGATCGAATGGCGGGGTGAAATTGTC
+GACCTGCACCACCTCGGCACGTGTCGTGCCGTCCTCGAGCTGCAACCACACGTCGGCCGGAGCGCCATCG
+GTCACATGCACCCTGAACTGCGTCTGCTCTCCGGCGCGCATGACGATGGTCGCCGGCAATGGACGCGCCC
+AGTAGGACCGCAGCTGCGCGGCCAGGGCGTCATTGCGTTGCTGTTCGGTCTGGGCGGGAACGCCGAGGGC
+GGCAAGAGCAGCCACCAATGTAGCCTCGGAGACCAGCACCTGCCGGCCAGTCCAGTCCGTGTACTCGGTG
+GCAATGCCGAATCGTCGGGCAAGTTCGACCAGCGAAGGCGCGAGCTCGGTCATGTCGCCCATCTTGCGTC
+CGGCACCCGTGTGCGGGCGAGCGCAGGAATCTGAGCCTTCCGTCAGCACAGCACGGTTGGCTACCGAACA
+CCACTACGTTGCAGGTCAACGAGGTAGACTGCGGAGCGGACAGTTCCACAGGCGGACTCGGTCATTCGCC
+GCTACCATGCCCAGTGAAGACACGACGAATCCTTGGGGGATCCGCGCAGTGGCAAATACCCAGGTCAATG
+TCCAGGTGTTCTGAGCAGACCGGAAGGTGATCTAGCGTGGCTGAAGAGAGCCGCGGGCAGCGGGGGTCGG
+GGTATGGCCTTGGGTTGTCCACGCGGACCCAGGTAACCGGTTATCAGTTCCTGGCGCGTCGAACCGCAAT
+GGCGTTGACACGCTGGCATGTGCGTATGGAGATTGAGCCGGGTCGGCGGCAGACGTTGGCGGTGGTGGCG
+TCGGTGTCGGCGGCGTTGGTGATCTGTCTGGGGGCGCTGTTGTGGTCGTTCATCAGCCCGTCCGGCCAGT
+TGAATGAGTCGCCGATCATCGCAGACCGCGATTCCGGTGCGCTCTATGTCCGTGTCGGTGACAGGTTGTA
+CCCGGCGCTGAATTTGGCATCGGCACGGCTGATCACCGGGCGGCCGGACAACCCGCACCTGGTTCGGTCA
+AGCCAGATTGCCACCATGCCGCGCGGTCCGCTGGTGGGTATCCCGGGTGCGCCGTCATCGTTCTCGCCAA
+AGAGTCCACCCGCGTCGTCTTGGCTGGTCTGCGACACGGTAGCGACCTCGTCAAGCATCGGGTCGCTGCA
+AGGCGTGACGGTGACGGTCATCGACGGGACCCCGGACCTTACCGGTCACCGGCAGATTTTGAGTGGATCG
+GACGCGGTAGTGCTGCGCTACGGCGGAGATGCGTGGGTCATCCGGGAGGGGCGCCGGTCACGAATCGAGC
+CGACGAATCGAGCGGTGTTGTTGCCGCTGGGGTTGACGCCGGAGCAGGTTAGCCAGGCGCGTCCGATGAG
+CCGGGCATTGTTCGACGCTTTGCCGGTCGGGCCCGAACTGTTGGTGCCGGAAGTGCCGAATGCGGGTGGT
+CCTGCGACGTTCCCGGGCGCTCCCGGACCGATCGGGACGGTAATCGTCACACCGCAAATCAGTGGACCAC
+AACAGTATTCGTTGGTCCTGGGCGATGGAGTGCAAACGCTCCCGCCGTTGGTGGCCCAGATCCTGCAGAA
+CGCTGGTAGTGCGGGCAACACCAAGCCGTTGACCGTGGAACCCTCAACGCTGGCCAAGATGCCGGTGGTG
+AATCGGTTGGATCTCTCTGCGTATCCGGACAATCCCCTGGAAGTGGTGGACATTCGCGAGCATCCGTCGA
+CCTGTTGGTGGTGGGAGCGGACGGCCGGTGAAAACCGGGCCCGTGTGCGGGTCGTGTCCGGGCCTACCAT
+TCCGGTCGCGGCGACCGAGATGAACAAGGTGGTGTCGTTGGTGAAGGCCGACACGAGTGGCCGCCAAGCC
+GATCAGGTCTACTTCGGCCCCGACCATGCGAACTTCGTGGCCGTCACCGGCAACAACCCGGGGGCCCAAA
+CGTCCGAATCGCTATGGTGGGTGACCGATGCGGGCGCGCGGTTCGGGGTGGAGGACAGCAAAGAAGCGCG
+TGACGCGTTGGGGTTGACCCTGACGCCGAGCCTGGCGCCGTGGGTGGCGCTGCGGCTGCTGCCACAGGGC
+CCCACGCTGTCACGAGCGGACGCGTTGGTGGAGCACGACACGCTCCCAATGGACATGACCCCGGCAGAGT
+TGGTGGTACCGAAATGAAGCGTGGTTTTGCCCGCCCGACACCGGAAAAGCCTCCGGTCATCAAGCCCGAG
+AATATTGTCCTATCGACACCGCTGAGCATTCCGCCGCCGGAGGGCAAGCCCTGGTGGCTGATTGTGGTTG
+GCGTCGTGGTGGTGGGCCTGCTGGGCGGCATGGTCGCCATGGTTTTCGCCAGCGGATCACACGTGTTCGG
+CGGCATCGGCTCGATCTTCCCGCTCTTCATGATGGTCGGGATCATGATGATGATGTTCCGCGGCATGGGC
+GGCGGCCAACAGCAAATGAGCCGGCCGAAATTGGACGCGATGCGCGCTCAGTTCATGTTGATGCTGGACA
+TGCTGCGCGAGACGGCCCAAGAGTCGGCCGACAGCATGGACGCCAACTATCGGTGGTTCCACCCGGCGCC
+CAATACGTTGGCGGCCGCCGTGGGGTCACCCCGGATGTGGGAGCGCAAGCCCGACGGTAAGGACCTGAAC
+TTCGGGGTTGTCCGCGTCGGCGTGGGAATGACGCGTCCCGAAGTGACCTGGGGTGAGCCGCAGAATATGC
+CGACCGACATCGAGCTGGAGCCGGTGACAGGTAAGGCGCTGCAGGAATTCGGGCGCTACCAAAGCGTCGT
+GTACAACCTGCCGAAAATGGTTTCGCTGCTGGTCGAACCCTGGTATGCGCTGGTCGGGGAACGCGAGCAG
+GTTCTGGGTTTGATGCGGGCGATCATCTGCCAGCTGGCGTTCTCCCACGGGCCTGACCATGTCCAGATGA
+TCGTTGTCAGTTCCGATCTAGACCAATGGGACTGGGTGAAGTGGCTACCGCATTTCGGTGACTCGCGGCG
+GCACGACGCGGCGGGTAACGCGCGGATGGTCTACACCTCGGTTCGTGAGTTTGCCGCAGAGCAAGCCGAA
+TTATTCGCGGGCCGTGGTTCTTTCACGCCTCGACACGCGAGTTCGTCGGCGCAGACCCCGACCCCGCACA
+CCGTGATCATCGCCGACGTCGACGATCCGCAATGGGAGTACGTGATCAGCGCCGAGGGTGTCGACGGGGT
+GACGTTCTTCGACCTGACCGGCTCTTCGATGTGGACTGACATCCCGGAGCGGAAGCTGCAGTTCGACAAG
+ACCGGCGTGATCGAGGCGCTGCCCCGCGACCGCGACACCTGGATGGTGATCGACGACAAGGCTTGGTTCT
+TCGCTCTCACCGACCAAGTCAGCATCGCCGAGGCAGAAGAGTTCGCGCAGAAGCTGGCGCAGTGGCGGCT
+GGCTGAGGCCTATGAAGAGATCGGCCAGCGGGTTGCCCACATTGGTGCCCGAGACATCTTGTCCTACTAC
+GGGATTGACGATCCTGGCAACATCGACTTCGACTCGCTGTGGGCTAGCCGGACCGACACCATGGGACGGT
+CGCGATTGCGGGCGCCGTTCGGTAATCGCTCCGACAACGGCGAGCTGCTGTTCTTGGATATGAAATCGCT
+CGACGAAGGCGGCGACGGCCCGCACGGGGTCATGTCCGGGACGACCGGTTCCGGTAAGTCGACGTTGGTG
+CGAACCGTGATCGAATCGCTGATGCTCAGCCATCCGCCGGAGGAGTTGCAGTTCGTTTTGGCAGACCTCA
+AAGGTGGCTCGGCGGTCAAGCCGTTCGCGGGAGTGCCACACGTGTCGCGGATCATCACCGACCTCGAAGA
+AGACCAGGCGCTCATGGAGCGCTTTCTGGATGCGCTGTGGGGCGAGATCGCCCGCCGCAAAGCAATATGC
+GACAGCGCCGGTGTCGACGACGCCAAAGAGTACAACTCGGTGCGAGCCAGGATGCGTGCGCGCGGTCAGG
+ACATGGCGCCGCTGCCGATGCTCGTGGTGGTCATCGACGAGTTCTACGAATGGTTCCGCATCATGCCGAC
+GGCGGTCGACGTCCTCGACTCGATCGGCCGGCAGGGCCGCGCCTACTGGATTCACCTGATGATGGCGTCT
+CAGACCATCGAGAGCCGAGCCGAAAAGCTCATGGAGAACATGGGTTACCGCTTGGTGCTGAAAGCGCGTA
+CCGCGGGAGCGGCGCAGGCGGCCGGGGTGCCCAACGCGGTGAATCTGCCCGCGCAGGCCGGTCTGGGCTA
+CTTCCGCAAGAGCCTCGAGGACATCATCCGATTCCAGGCGGAATTCCTGTGGCGGGACTACTTCCAACCC
+GGCGTCAGCATCGACGGCGAGGAAGCGCCTGCCTTAGTACACAGCATCGACTACATTCGCCCGCAATTGT
+TTACCAACTCGTTCACACCGCTGGAAGTTAGCGTGGGGGGTCCCGATATCGAGCCGGTAGTTGCCCAGCC
+CAACGGTGAGATGCTCGAGTCGGACGACATTGAAGGCGGCGAGGACGAGGACGAAGAGGGGGTGCGCACC
+CCGAAGGTTGGGACGGTGATCATTGATCAGCTGCGCAAGATCAAGTTCGAGCCGTACCGGCTCTGGCAAC
+CGCCACTAACCCAACCCGTCGCCATCGACGACTTGGTCAACCGGTTCCTCGGCCGCCCGTGGCACAAGGA
+GTACGGTTCGGCGTGCAATCTCGTGTTCCCGATCGGGATAATCGATCGCCCCTATAAGCATGACCAGCCA
+CCGTGGACGGTTGACACCTCCGGGCCCGGTGCCAACGTGCTAATCCTGGGCGCCGGCGGTTCGGGCAAGA
+CCACTGCGCTGCAGACACTCATCTGCTCAGCGGCACTGACTCACACCCCGCAGCAGGTTCAGTTCTACTG
+CCTGGCCTACAGCAGCACCGCGTTGACCACGGTCTCCCGCATCCCCCACGTGGGCGAGGTTGCCGGTCCC
+ACCGATCCCTACGGTGTGCGCCGGACGGTGGCCGAGTTGCTGGCGCTGGTGCGCGAGCGCAAACGCAGCT
+TCCTGGAATGCGGAATCGCGTCGATGGAGATGTTCCGGCGCCGCAAGTTCGGCGGAGAGGCCGGGCCGGT
+ACCCGACGACGGCTTCGGTGACGTCTACCTGGTGATCGATAACTACCGGGCCCTGGCCGAAGAAAACGAG
+GTGCTGATCGAGCAGGTGAACGTGATCATCAACCAGGGCCCCTCGTTCGGGGTGCACGTGGTGGTCACTG
+CCGACCGCGAATCGGAGCTGCGGCCGCCGGTGCGCAGCGGCTTCGGATCCCGTATCGAGCTGCGCTTGGC
+GGCGGTTGAGGACGCCAAGCTGGTGCGTTCTCGATTCGCCAAGGACGTTCCGGTCAAGCCGGGGCGCGGC
+ATGGTTGCGGTCAACTACGTCCGCCTGGACAGCGACCCGCAGGCCGGCCTGCACACCCTGGTGGCTCGAC
+CGGCGTTGGGCAGCACACCCGACAATGTCTTCGAGTGCGACAGCGTGGTCGCGGCGGTGAGCCGGCTCAC
+CAGCGCCCAGGCTCCACCGGTGCGCCGGTTGCCGGCGCGGTTCGGCGTGGAACAGGTGCGGGAGCTGGCC
+TCGCGGGACACCCGCCAAGGCGTTGGCGCTGGCGGAATCGCCTGGGCGATATCGGAATTGGATCTGGCGC
+CGGTTTATCTGAATTTCGCCGAGAATTCGCACCTGATGGTGACTGGTCGACGCGAATGTGGCCGCACCAC
+CACGCTGGCCACCATCATGTCCGAAATCGGGCGGCTCTACGCGCCGGGCGCCAGCAGCGCACCGCCTCCC
+GCCCCCGGGCGGCCCTCTGCGCAGGTATGGCTGGTCGACCCGCGCCGTCAGCTGCTGACCGCGCTCGGTT
+CGGACTATGTGGAGCGGTTCGCCTACAACCTCGACGGGGTGGTGGCGATGATGGGTGAACTTGCGGCGGC
+GTTGGCCGGTCGTGAGCCGCCACCGGGCCTGTCCGCCGAAGAGTTGTTGTCGCGGTCGTGGTGGAGCGGC
+CCAGAAATCTTCCTGATCGTCGACGACATCCAGCAGCTGCCGCCGGGCTTCGATTCACCGTTGCACAAGG
+CTGTTCCGTTTGTGAACAGGGCCGCCGATGTCGGCTTGCATGTGATCGTCACGCGCACCTTCGGTGGTTG
+GTCGTCAGCCGGCAGCGACCCGATGTTGCGGGCCCTGCATCAGGCCAATGCGCCACTGCTGGTGATGGAC
+GCCGATCCCGACGAGGGCTTCATTCGCGGCAAGATGAAGGGCGGCCCGCTGCCCCGCGGTCGAGGCCTGT
+TGATGGCAGAAGACACCGGTGTGTTCGTCCAAGTGGCAGCCACCGAGGTGCGTCGGTAGTTCGGCCAAAC
+CGATCAGCTCCAGCGTAGCGGCAAGTTCTTAAGCGCGAAGGACTTGGACGGGAACCGTATTTCGGGCGCG
+TAGTCCGGCGCGAGCTCGAAGTCGGGAATTTGATTCAGCCACTCGCCCACCAGCAGGGTGAGCTCTAAAC
+GGGCTAGATGCGAACCCAGGCAACGGTGTGGACCGCCGCCAAATCCCCAGTGCCGGTGCACCTTTCCATC
+CATCACCAACTCGTCGGTGGACATCGCGTCGCTGCCGTCGCGGTTGACTGCGGCCATGCATAACCGCACT
+GGTGACCCCGCAGGCAGTGTCATGCCGCCGACGGTGACGGGCTCGGTGGTAACTCGCGGCGCCACCGGCG
+CCGATGGCTCCAGCCGGACGATCTCTTCGATGAAAACCCTGATCTGCTTGGGATTGTCGCGCAGCATGGC
+GCGCAGCTGTGGTCTGCGGGCGAGCTCGAGCAGCGAAAAGCCTACCGCTGCCGTCACGGTGTCCAGTCCC
+GCCAGTATCAGGAGGTGGCTCAAACCCAAAACCTCGATCTCGCTCAACGGGTCCTCGCCGATCTGCACTT
+GCGACAAGACGTCCGGCCCTGGGTTTCGCCGGCGTTCGGCGACCATGGCCGTGAGATACTCGAGCAGCTC
+GCGCGCCGCAGCGACATCGGCTTCGGTCGGGTGAGGTCGATCCGACATGGCGATGACGGCGTCTTTCCAG
+CCGATCAGACGGTCACGGTCTTCGAGCGGCAGGCCGTACAGGACGAGAAACAACTGAAACGGAAACAGAT
+TCGCGAGATCGGCCATCGCCTCGCACTCGCCCCGGCCTGCGATGGCGTCGATCATAGCGACAGTGTGACG
+GCGCAGCGACGGTAGCGCCTTGCTCAAAGCGGCCGGGCTGAAGTATGGCTGCAGGATCCTGCGGTATCGG
+GTGTGCTCGGGCGGGTCGAACGCGAGCGGAACCACCGGCAGCGGATTTCCCGGAGGTTGCAGCGCTTTCC
+GCGACGAGAAAACCTTCGGATTCCGCAGCGCCGCGAGCACATCTTCGCGGCGCGTCAGGTAGTACCAGCC
+GTTCATGAACACCACGGGCCCCGCGTCGCGGAGGGTCTTCCAGCCGACACCCCGGTCAACGGCCATCGGT
+AACGTCGAATATTCGAGCCGCGGTAGATAAAACGAGCCGGCGTGGTCCTCGCCGGGGGTGGTCATGCGCT
+CAAGTCTTTCGTGTCTCCGTTCTTGTCGCAGGTCGCAGACGTAGCCAAGCGGTGCCGACCTAGCCAATAT
+CGCACGTGGGCGTGCACCCACCATTGTGGTGTCGAGCGCATCTGGGGGCTCAGCGGCTAATCTTCGAAGC
+GAACTGTCCGGTCCAAGCTGGCGTGTGCTTTGGGCGGTAAAGGGAGGAAATCCCGTGAAAGTCCGTCTCG
+ATCCATCGAGATGCGTGGGTCATGCGCAGTGCTATGCCGTCGATCCGGACCTGTTCCCGATCGACGACTC
+GGGCAACTCGATCCTGGCAGAGCACGAGGTGCGGCCCGAGGACATGCAGCTGACCAGAGACGGTGTGGCC
+GCTTGCCCCGAAATGGCGCTCATCCTCGAGGAGGACGACGCGGACTGACGATTCCGGGTCATACCACAAA
+ATTAACGCTGGCCAAACGATCGTTTACGAGGAATGAATATTTGGCGTCATCGGCGCTGGAGGCCGGTATT
+GCAATCTAATGTGTTTTCTATGCAACAGTTGCGCAGCGACGCCGTTATCGACTAGCGGTGCTATATTCGG
+CGCCTTTTCGATGCCGAGCGCGCGTCTCGTTGGCCACGTTTGGTGGCAATGCTCATCAGGGCTCATCCGG
+ATCGCCAACGCGATCGTGTGTGGAGAGGGAGGACTGGTTGGACTTCGGGGCGTTACCGCCGGAGATCAAT
+TCGGGCCGTATGTATTGCGGTCCGGGGTCGGGGCCGATGCTGGCTGCGGCCGCGGCCTGGGACGGGGTGG
+CCGTGGAGTTGGGGTTGGCTGCGACCGGTTATGCGTCGGTGATAGCCGAGCTGACCGGTGCGCCGTGGGT
+GGGTGCGGCGTCGTTGTCGATGGTGGCGGCGGCCACGCCGTATGTGGCCTGGCTGAGCCAAGCCGCGGCG
+CGGGCCGAGCAGGCGGGGATGCAGGCCGCGGCGGCCGCGGCGGCTTATGAGGCCGCTTTTGTGATGACGG
+TGCCGCCGCCGGTGATTACGGCGAATCGGGTTTTGGTGATGACGCTGATTGCGACCAATTTTTTCGGTCA
+GAACTCGGCGGCGATCGCGGTCGCTGAGGCGCAGTACGCCGAAATGTGGGCGCAAGACGCCGTTGCTATG
+TATGGCTATGCGGCTGCGTCGGCGAGCGCGTCGCGGTTGATTCCGTTCGCGGCGCCGCCGAAGACCACCA
+ACTCCGCTGGGGTGGTCGCACAGGTGGCTGCGGTCGCGGCGATGCCTGGACTGCTGCAACGACTTTCGTC
+GGCTGCATCGGTCAGCTGGTCGAATCCCAATGATTGGTGGCTCGTGCGGTTGCTGGGCTCGATTACCCCC
+ACGGAAAGGACGACGATCGTTCGTTTGCTCGGTCAGTCGTACTTCGCGACGGGCATGGCGCAGTTCTTCG
+CCTCGATCGCACAGCAGCTGACCTTCGGCCCAGGGGGCACAACGGCTGGCTCCGGCGGAGCCTGGTACCC
+AACGCCGCAATTCGCCGGCCTGGGTGCAAGCCGGGCGGTGTCGGCGAGTTTGGCGCGGGCCAACAAGATT
+GGGGCTCTGTCGGTTCCGCCGAGCTGGGTCAAAACGACTGCACTGACCGAACCGGGCGCCCACGCGGTGA
+GCGCCAACCCTACCGTCGGTTCGTCACACGGACCGCATGGCCTGCTCCGCGGACTGCCGCTAGGGTCGCG
+GATCACTCGGCGTAGCGGCGCCTTTGCCCACCGATATGGGTTCCGTCACAGTGTGGTTGCCCGCCCGCCA
+TCGGCCGGATAACGCCATGACCTCAGCTCGGCAGAAATGACAATGCTCCCAAAGGCGTGAGCACCCGAAG
+ACAACTAAGCAGGAGATCGCATGTCGTTTGTGACTACCCAACCAGAAGCACTGGCGGCGGCGGCCGGCAG
+TCTGCAGGGAATCGGCTCCGCATTGAACGCCCAGAATGCGGCTGCGGCGACTCCCACGACGGGGGTGGTC
+CCGGCGGCCGCCGATGAAGTGTCGGCGCTGACGGCGGCTCAGTTCGCGGCACACGCCCAGATCTATCAGG
+CCGTCAGCGCCCAGGCCGCGGCGATTCACGAGATGTTCGTCAACACTCTACAGATGAGCTCAGGGTCGTA
+TGCTGCTACCGAGGCCGCCAACGCGGCCGCGGCCGGCTAAAGGAGTCACTGCGATGGATTTTGGGGCGTT
+GCCGCCGGAGGTCAATTCGGTGCGGATGTATGCCGGTCCTGGCTCGGCACCAATGGTCGCTGCGGCGTCG
+GCCTGGAACGGGTTGGCCGCGGAGCTGAGTTCGGCGGCCACCGGTTATGAGACGGTGATCACTCAGCTCA
+GCAGTGAGGGGTGGCTAGGTCCGGCGTCAGCGGCGATGGCCGAGGCAGTTGCGCCGTATGTGGCGTGGAT
+GAGTGCCGCTGCGGCGCAAGCCGAGCAGGCGGCCACACAGGCCAGGGCCGCCGCGGCCGCTTTTGAGGCG
+GCGTTTGCCGCGACGGTGCCTCCGCCGTTGATCGCGGCCAACCGGGCTTCGTTGATGCAGCTGATCTCGA
+CGAATGTCTTTGGTCAGAACACCTCGGCGATCGCGGCCGCCGAAGCTCAGTACGGCGAGATGTGGGCCCA
+AGACTCCGCGGCGATGTATGCCTACGCGGGCAGTTCGGCGAGCGCCTCGGCGGTCACGCCGTTTAGCACG
+CCGCCGCAGATTGCCAACCCGACCGCTCAGGGTACGCAGGCCGCGGCCGTGGCCACCGCCGCCGGTACCG
+CCCAGTCGACGCTGACGGAGATGATCACCGGGCTACCCAACGCGCTGCAAAGCCTCACCTCACCTCTGTT
+GCAGTCGTCTAACGGTCCGCTGTCGTGGCTGTGGCAGATCTTGTTCGGCACGCCCAATTTCCCCACCTCA
+ATTTCGGCACTGCTGACCGACCTGCAGCCCTACGCGAGCTTCTTCTATAACACCGAGGGCCTGCCGTACT
+TCAGCATCGGCATGGGCAACAACTTCATTCAGGCGGCCAAGACCCTGGGATTGATCGGCTCGGCGGCACC
+GGCTGCGGTCGCGGCTGCTGGGGATGCCGCCAAGGGCTTGCCTGGACTGGGCGGGATGCTCGGTGGCGGG
+CCGGTGGCGGCGGGTCTGGGCAATGCGGCTTCGGTTGGCAAGCTGTCGGTGCCGCCGGTGTGGAGTGGAC
+CGTTGCCCGGGTCGGTGACTCCGGGGGCTGCTCCGCTACCGGTGAGTACGGTCAGTGCCGCCCCGGAGGC
+GGCGCCCGGAAGCCTGTTGGGCGGCCTGCCGCTAGCTGGTGCGGGCGGGGCCGGCGCGGGTCCACGCTAC
+GGATTCCGTCCCACCGTCATGGCTCGCCCACCCTTCGCCGGATAGTCGCTGCCGCAACGTATTAACGCGC
+CGGCCTCGGCTGGTGTGGTCCGCTGCGGGTGGCAATTGGTCGGCGCCGAGATCTCGGTGGGTTATTTGCG
+GTGGGATTTTTTCCCGAAGCCGGGTTCAGCACCGGATTTCCTAACGGTCCCGCGACTCAACGGCACCGCG
+CCGTCAGCAAGTTCCGGTGGTGTTGATCGCGGTATCCATGCAGGTGGTGATGGCGCGGCGAGACTGGTCG
+TGTGCGCTGAAGCACAGGGTACTTGGCGGTTGTGGCTCCCGGGATGTAGCTGGCCGCCCAACGTCCCGCA
+GCGTCGGGGTCAGCGGCGGAGCAGCACGGCGATTTAGCCTCACAACCGAGCAGCTAGCTCGCGTTTCCCA
+GCGGCTCAATCCCCGTCGAGCCATTGAAAGGCACCTCAGATGTCGTTTGCGACTCCGCAACCGGAGAAAG
+GGTTCGGAATGGACTTCGGGGCGTTACCGCCGGAGATCAATTCGGGCCGTATGTATTGCGGTCCGGGGTC
+GGGGCCGATGCTGGCTGCGGCCGCGGCCTGGGACGGGGTGGCCGTGGAGTTGGGGTTGGCTGCGACCGGT
+TATGCGTCGGTGATAGCCGAGCTGACCGGTGCGCCGTGGGTGGGTGCGGCGTCGTTGTCGATGGTGGCGG
+CGGCCACGCCGTATGTGGCCTGGCTGAGCCAAGCCGCGGCGCGGGCCGAGCAGGCGGGGATGCAGGCCGC
+GGCGGCCGCGGCGGCTTATGAGGCCGCTTTTGTGATGACGGTGCCGCCGCCGGTGATTACGGCGAATCGG
+GTTTTGGTGATGACGCTGATTGCGACCAATTTTTTCGGTCAGAACTCGGCGGCGATCGCGGTCGCTGAGG
+CGCAGTACGCCGAAATGTGGGCGCAAGACGCCGTTGCTATGTATGGCTATGCGGCTGCGTCGGCGAGCGC
+GTCGCGGTTGATTCCGTTCGCGGCGCCGCCGAAGACCACCAACTCCGCTGGGGTGGTCGCACAGGCGGTT
+GCGTCGGTCAGCTGGTCGAATCCCAATGATTGGTGGCTCGTGCGGTTGCTGGGCTCGATTACCCCCACGG
+AAAGGACGACGATCGTTCGTTTGCTCGGTCAGTCGTACTTGGCGACGGGCATGGCGCGGTTTCTTACCTC
+GATCGCACAGCAGCTGACCTTCGGCCCAGGGGGCACAACGGCTGGCTCCGGCGGAGCCTGGTACCCAACG
+CCGCAATTCGCCGGCCTGGGTGCAGGCCCGGCGGTGTCGGCGAGTTTGGCGCGGGCGGAGCCGGTCGGGA
+GGTTGTCGGTGCCGCCAAGTTGGGCCGTCGCGGCTCCGGCCTTCGCGGAGAAGCCTGAGGCGGGCACGCC
+GATGTCCGTCATCGGCGAAGCGTCCAGCTGCGGTCAGGGAGGCCTGCTTCGAGGCATACCGCTGGCGAGA
+GCGGGGCGGCGTACGGGCGCCTTCGCTCACCGATACGGGTTCCGCCACAGCGTGATTACCCGGTCTCCGT
+CGGCGGGATAGCTTTCGATCCGGTCTGCGCGGCCGCCGGAAATGCTGCAGATAGCGATCGACCGCGCCGG
+TCGGTAAACGCCGCACACGGCACTATCAATGCGCACGGCGGGCGTTGATGCCAAATTGACCGTCCCGACG
+GGGCTTTATCTGCGGCAAGATTTCATCCCCAGCCCGGTCGGTGGGCCGATAAATACGCTGGTCAGCGCGA
+CTCTTCCGGCTGAATTCGATGCTCTGGGCGCCCGCTCGACGCCGAGTATCTCGAGTGGGCCGCAAACCCG
+GTCAAACGCTGTTACTGTGGCGTTACCACAGGTGAATTTGCGGTGCCAACTGGTGAACACTTGCGAACGG
+GTGGCATCGAAATCAACTTGTTGCGTTGCAGTGATCTACTCTCTTGCAGAGAGCCGTTGCTGGGATTAAT
+TGGGAGAGGAAGACAGCATGTCGTTCGTGACCACACAGCCGGAAGCCCTGGCAGCTGCGGCGGCGAACCT
+ACAGGGTATTGGCACGACAATGAACGCCCAGAACGCGGCCGCGGCTGCTCCAACCACCGGAGTAGTGCCT
+GCAGCCGCCGATGAAGTATCAGCGCTGACCGCGGCTCAGTTTGCTGCGCACGCGCAGATGTACCAAACGG
+TCAGCGCCCAGGCCGCGGCCATTCACGAAATGTTCGTGAACACGCTGGTGGCCAGTTCTGGCTCATACGC
+GGCCACCGAGGCGGCCAACGCAGCCGCTGCCGGCTGAACGGGCTCGCACGAACCTGCTGAAGGAGAGGGG
+GAACATCCGGAGTTCTCGGGTCAGGGGTTGCGCCAGCGCCCAGCCGATTCAGCTATCGGCGTCCATAACA
+GCAGATGATCTAGGCATTCAGTACTAAGGAGACAGGCAACATGGCCTCACGTTTTATGACGGATCCGCAT
+GCGATGCGGGACATGGCGGGCCGTTTTGAGGTGCACGCCCAGACGGTGGAGGACGAGGCTCGCCGGATGT
+GGGCGTCCGCGCAAAACATTTCCGGTGCGGGCTGGAGTGGTCAGGCCGAGGCGACCTCGCTAGACACCAT
+GACCCAGATGAATCAGGCGTTTCGCAACATCGTGAACATGCTGCACGGGGTGCGTGACGGGCTGGTTCGC
+GACGCCAACAACTACGAACAGCAAGAGCAGGCCTCCCAGCAGATCCTGAGCAGCTAGCGCCGAAAGCCAC
+AGCTGCGTACGCTTTCTCACATTAGGAGAACACCAATATGACGATTAATTACCAGTTCGGGGACGTCGAC
+GCTCATGGCGCCATGATCCGCGCTCAGGCGGCGTCGCTTGAGGCGGAGCATCAGGCCATCGTTCGTGATG
+TGTTGGCCGCGGGTGACTTTTGGGGCGGCGCCGGTTCGGTGGCTTGCCAGGAGTTCATTACCCAGTTGGG
+CCGTAACTTCCAGGTGATCTACGAGCAGGCCAACGCCCACGGGCAGAAGGTGCAGGCTGCCGGCAACAAC
+ATGGCGCAAACCGACAGCGCCGTCGGCTCCAGCTGGGCCTAAAACTGAACTTCAGTCGCGGCAGCACACC
+AACCAGCCGGTGTGCTGCTGTGTCCTGCAGTTAACTAGCACTCGACCGCTGAGGTAGCGATGGATCAACA
+GAGTACCCGCACCGACATCACCGTCAACGTCGACGGCTTCTGGATGCTTCAGGCGCTACTGGATATCCGC
+CACGTTGCGCCTGAGTTACGTTGCCGGCCTTACGTCTCCACCGATTCCAATGACTGGCTAAACGAGCACC
+CGGGGATGGCGGTCATGCGCGAGCAGGGCATTGTCGTCAACGACGCGGTCAACGAACAGGTCGCTGCCCG
+GATGAAGGTGCTTGCCGCACCTGATCTTGAAGTCGTCGCCCTGCTGTCACGCGGCAAGTTGCTGTACGGG
+GTCATAGACGACGAGAACCAGCCGCCGGGTTCGCGTGACATCCCTGACAATGAGTTCCGGGTGGTGTTGG
+CCCGGCGAGGCCAGCACTGGGTGTCGGCGGTACGGGTTGGCAATGACATCACCGTCGATGACGTGACGGT
+CTCGGATAGCGCCTCGATCGCCGCACTGGTAATGGACGGTCTGGAGTCGATTCACCACGCCGACCCAGCC
+GCGATCAACGCGGTCAACGTGCCAATGGAGGAGATGCTAGAGGCAACGAAGTCGTGGCAGGAATCGGGGT
+TTAACGTCTTCTCCGGCGGAGATCTGCGCCGAATGGGCATCAGTGCCGCGACGGTGGCCGCGCTGGGGCA
+GGCGTTGTCGGATCCCGCGGCCGAGGTCGCAGTGTATGCGCGACAGTACCGAGACGACGCCAAGGGCCCC
+AGCGCCTCGGTGTTGTCGCTGAAAGACGGCTCCGGTGGACGCATCGCGCTGTATCAGCAGGCGCGAACGG
+CAGGTTCCGGCGAGGCGTGGCTGGCTATCTGCCCGGCTACCCCGCAGTTGGTGCAAGTAGGAGTGAAGAC
+CGTTTTGGATACACTGCCCTACGGCGAGTGGAAAACACACAGCAGAGTATGACGCCAGGGCGTGAAACCC
+GAAGTACAACAACAAATTTGAGCATCAGATACAACCCAGATACGTACAGGGCAAATTGCTCTAGAATCGA
+CTGCAATACTGCAAGGCAAGGTCAACCACAACGATTTGGTCGCGAGGCAAGGCAAATGGAATCGGAGTTA
+GTCGAGCCGCAGCTCCCGGTGGGCTACCGCGCCTCGGTGCCTACACCGACGGAGCTCCCCGCGCCACTGA
+AGCCACGGTGTAACACGTTTGCCATGGCAGGGGGTACAGGACGATGACCGCAGTAGCTGACGCACCTCAG
+GCTGACATTGAGGGTGTGGCATCGCCCCAGGCTGTCGTCGTGGGCGTCATGGCCGGCGAAGGCGTCCAGA
+TCGGCGTCCTGCTGGATGCCAACGCCCCAGTTTCGGTGATGACCGACCCGCTGCTGAAAGTGGTTAATAG
+TCGGCTCAGAGAGCTCGGTGAGGCTCCACTGGAAGCCACTGGACGCGGCCGATGGGCGCTGTGTCTGGTG
+GACGGCGCGCCGTTGCGTGCTACCCAGTCGCTGACCGAACAAGACGTCTATGACGGCGACCGGCTGTGGA
+TTCGGTTCATCGCAGACACCGAACGTCGCTCCCAAGTCATCGAACATATCTCCACCGCAGTCGCCTCGGA
+TCTCAGCAAGCGGTTCGCCAGGATCGACCCGATCGTTGCTGTGCAGGTCGGGGCGTCGATGGTGGCGACC
+GGGGTTGTTCTTGCCACCGGGGTGCTCGGCTGGTGGCGCTGGCATCACAACACCTGGTTGACCACCATCT
+ACACCGCGGTGATTGGTGTGCTGGTGCTGGCGGTCGCCATGTTGCTGTTGATGCGTGCCAAGACGGACGC
+GGATCGACGCGTCGCCGACATCATGCTGATGAGCGCGATCATGCCCGTGACGGTGGCGGCGGCAGCGGCC
+CCGCCCGGCCCGGTGGGCTCCCCGCAGGCCGTGTTGGGCTTCGGAGTGCTGACCGTCGCTGCGGCCCTGG
+CCCTGCGGTTCACCGGTCGCCGCCTGGGGATTTACACCGCAATCGTCATCATCGATGCGCTGACAATGCT
+TGCAGCCTTGGCGCGGATGGTCGCGGCCACAAGCGCGGTGACGCTGTTGTCGTCCTTGTTGTTGATTTGC
+GTAGTGGCCTACCACGCGGCGCCGGCACTGTCTCGGCGGCTGGCCGGCATCCGACTGCCGGTGTTCCCGT
+CCGCCACCAGCCGGTGGGTCTTCGAGGCTCGGCCCGACCTACCGACCACCGTGGTGGTGTCCGGTGGCAG
+CGCACCGGTCTTGGAAGGGCCGTCATCGGTGCGTGATGTGCTGCTGCAAGCTGAGCGCGCTCGGTCGTTC
+TTGAGCGGCCTGCTAACGGGACTTGGCGTGATGGTGGTGGTGTGCATGACATCGTTGTGCGACCCGCACA
+CCGGGCAACGTTGGCTGCCGCTGATACTGGCCGGATTTACCTCGGGCTTCCTGCTGTTGCGGGGCCGCTC
+CTACGTCGACCGTTGGCAGTCGATTACCCTGGCCGGAACTGCGGTGATCATCGCTGCTGCGGTGTGTGTG
+CGGTACGCGCTGGAATTGTCCTCGCCGTTGGCTGTGTCCATTGTCGCCGCGATCCTGGTGCTGCTGCCGG
+CGGCGGGCATGGCAGCTGCTGCACATGTGCCCCACACCATCTACAGTCCGCTATTCCGCAAGTTTGTGGA
+ATGGATTGAATACCTCTGCCTGATGCCGATCTTCCCGCTGGCGTTGTGGTTGATGAACGTCTATGCAGCG
+ATTCGGTACCGGTAGCAGCAGGTCGTGGTGTGGTCGCGCGGGTACCGCGACCATTGCCGCAGTCTTGCTA
+GCTTCGGGCGCGCTGACCGGCCTTCCGCCAGCGTATGCAATTTCGCCTCCGACGATCGATCCGGGCGCGC
+TGCCACCCGACGGGCCGCCCGGACCGCTGGCGCCCATGAAGCAGAACGCCTACTGCACCGAGGTCGGGGT
+CTTGCCCGGCACCGACTTTCAGCTGCAGCCAAAATATATGGAGATGCTGAACCTGAACGAGGCTTGGCAG
+TTCGGCCGCGGCGACGGTGTGAAGGTCGCTGTCATCGACACGGGTGTGACTCCACATCCCCGGTTGCCGC
+GTCTGATCCCTGGCGGCGACTACGTGATGGCCGGTGGCGACGGTCTGTCGGACTGCGACGCCCACGGCAC
+CCTGGTGGCGTCGATGATCGCGGCGGTTCCGGCGAACGGGGCGGTACCGCTGCCGTCGGTACCGCGCAGG
+CCGGTCACCATTCCCACGACCGAAACGCCGCCGCCGCCACAGACGGTGACCCTTTCACCGGTACCGCCGC
+AGACCGTGACCGTGATTCCGGCTCCACCTCCCGAGGAAGGAGTTCCGCCGGGCGCACCGGTGCCAGGACC
+GGAGCCGCCGCCGGCTCCTGGTCCACAGCCGCCGGCCGTGGACCGCGGTGGCGGCACGGTGACAGTACCC
+AGCTACTCCGGGGGCCGCAAGATAGCCCCGATCGACAACCCGCGTAATCCGCACCCGAGTGCGCCATCGC
+CAGCGCTGGGACCACCGCCGGACGCGTTCAGTGGGATCGCCCCCGGTGTCGAGATAATCTCCATCCGCCA
+GTCAAGCCAGGCCTTCGGCCTTAAGGACCCTTACACTGGGGACGAAGACCCGCAGACGGCGCAAAAGATC
+GACAACGTCGAGACAATGGCGCGCGCGATCGTGCATGCTGCCAACATGGGTGCTTCGGTGATCAATATCT
+CCGATGTGATGTGCATGAGTGCTCGTAATGTCATCGACCAGCGTGCACTGGGTGCCGCGGTGCACTACGC
+CGCGGTCGACAAGGACGCGGTCATCGTGGCTGCAGCGGGCGACGGCAGCAAGAAGGACTGTAAGCAGAAC
+CCGATTTTTGATCCCTTGCAGCCCGACGATCCACGCGCTTGGAACGCGGTCACCACGGTGGTGACACCCT
+CGTGGTTCCACGACTACGTCCTGACGGTCGGAGCGGTTGACGCCAACGGTCAACCGCTCAGCAAAATGAG
+TATCGCGGGACCCTGGGTCTCCATTTCGGCGCCGGGAACCGACGTCGTCGGACTCTCGCCCCGTGACGAC
+GGCCTGATCAATGCGATTGACGGCCCGGATAATTCGTTGCTGGTTCCGGCTGGCACCAGTTTTTCCGCCG
+CGATCGTGTCCGGGGTGGCTGCGCTGGTACGTGCTAAGTTCCCCGAATTGTCGGCGTACCAAATCATCAA
+TCGGCTGATTCATACCGCCCGGCCACCCGCTCGCGGCGTCGACAACCAGGTCGGCTACGGTGTGGTCGAC
+CCAGTGGCAGCACTGACTTGGGATGTGCCCAAAGGCCCGGCCGAGCCGCCCAAGCAGCTGTCAGCGCCGT
+TGGTGGTGCCGCAGCCGCCCGCCCCCCGCGATATGGTGCCGATATGGGTGGCCGCCGGGGGATTGGCCGG
+GGCACTATTGATAGGCGGTGCGGTGTTCGGTACCGCGACCTTGATGCGGCGATCACGGAAGCAGCAATGA
+AGGCTCAGCGCAGCTTCGGGTTGGCGTTGTCGTGGCCGCGGGTGACCGCGGTGTTTCTGGTGGATGTCCT
+GATCTTGGCGGTGGCCAGTCATTGCCCGGATTCCTGGCAGGCCGATCATCATGTGGCGTGGTGGGTCGGC
+GTCGGCGTGGCGGCCGTAGTGACGTTACTGTCGGTGGTCAGTTACCACGGCATCACGGTGATTTCGGGTT
+TGGCGACGTGGGTGCGGGATTGGTCGGCGGATCCGGGCACGACACTGGGTGCGGGGTGCACTCCGGCAAT
+CGACCACCAGCGCCGTTTTGGGCGTGACACGGTAGGGGTGCGTGAGTATAACGGCCGGCTGGTCTCGGTG
+ATCGAGGTCACCTGCGGTGAGAGCGGCCCGTCGGGTCGGCATTGGCACCGGAAATCGCCGGTACCCATGT
+TGCCGGTGGTCGCGGTCGCCGATGGTTTGCGCCAGTTCGACATTCACCTCGATGGCATCGACATCGTGTC
+GGTGCTGGTGCGGGGCGGGGTTGATGCTGCTAAAGCTTCGGCCTCGCTGCAGGAGTGGGAGCCGCAGGGC
+TGGAAATCCGAAGAACGAGCCGGTGATCGCACTGTCGCCGATCGGCGCCGCACCTGGTTGGTGTTACGGA
+TGAATCCGCAGCGAAATGTGGCTGCGGTGGCGTGTCGTGACTCGTTGGCGTCGACGCTGGTGGCAGCCAC
+CGAGCGGTTGGTCCAGGATCTGGATGGGCAAAGTTGTGCGGCCCGGCCGGTGACGGCCGATGAGCTGACC
+GAGGTCGACAGCGCCGTGTTGGCTGACTTGGAACCGACATGGAGTCGCCCCGGTTGGCGTCACCTCAAGC
+ATTTCAATGGTTATGCGACCAGTTTTTGGGTTACGCCGTCAGACATCACGTCGGAGACCTTGGATGAGCT
+GTGTCTGCCAGATAGCCCCGAAGTCGGGACGACCGTGGTCACGGTGCGTCTGACCACTCGGGTCGGGTCG
+CCCGCGCTATCGGCATGGGTGCGTTATCACAGCGACACGCGCCTGCCCAAGGAGGTAGCGGCCGGACTCA
+ACCGGCTCACCGGTCGCCAGTTGGCCGCGGTGCGTGCCAGCCTGCCGGCCCCGACGCACCGTCCACTCCT
+GGTCATCCCCAGTCGGAACCTGCGTGACCACGACGAGCTCGTGCTGCCGGTGGGCCAGGAACTCGAGCAC
+GCGACAAGCTCGTTTGTGGGGCAATGACACGCCCGCAGGCCGCCGCCGAAGATGCCCGCAACGCCATGGT
+CGCCGGTCTGCTGGCATCGGGGATCTCCGTCAATGGACTGCAGCCCAGCCATAACCCGCAGGTGGCCGCC
+CAAATGTTCACCACGGCGACCAGGCTGGATCCCAAGATGTGTGATGCCTGGCTGGCTCGGCTGCTGGCCG
+GCGACCAGAGCATCGAAGTGCTCGCCGGCGCATGGGCTGCGGTGCGGACTTTCGGCTGGGAAACCCGCCG
+CCTCGGCGTGACGGATCTGCAGTTCCGCCCCGAGGTGTCCGACGGGCTATTCCTGCGACTGGCGATTACC
+AGCGTAGATTCGCTGGCCTGCGCTTACGCGGCGGTCCTCGCCGAGGCCAAGCGTTACCAGGAGGCGGCAG
+AGCTGCTCGACGCCACCGATCCTCGCCATCCGTTCGACGCCGAGCTGGTGAGTTACGTGCGGGGCGTGCT
+GTACTTCCGCACCAAACGCTGGCCTGACGTTCTTGCGCAGTTCCCCGAGGCAACGCAGTGGCGTCACCCC
+GAGCTAAAGGCCGCGGGGGCGGCGATGGCCACCACGGCGCTGGCGTCGCTCGGGGTGTTCGAAGAGGCCT
+TTCGGCGCGCTCAGGAAGCAATCGAAGGTGACCGGGTGCCGGGCGCGGCTAACATCGCCTTGTACACCCA
+AGGCATGTGCCTGCGGCACGTCGGCCGTGAGGAGGAAGCTGTCGAACTCCTGCGCCGCGTGTATTCGCGC
+GATGCGAAGTTCACCCCGGCCCGCGAGGCGCTGGATAACCCCAACTTTCGGCTGATCCTCACCGACCCGG
+AAACGATTGAGGCGCGCACAGATCCGTGGGATCCGGACAGTGCGCCAACCCGCGCTCAGACCGAGGCCGC
+CCGCCATGCCGAGATGGCCGCGAAGTACTTGGCCGAAGGGGATGCCGAGCTCAACGCGATGCTTGGCATG
+GAGCAGGCCAAGAAGGAGATCAAGCTCATCAAGTCGACGACGAAGGTGAATTTAGCGCGTGCCAAGATGG
+GGCTTCCGGTCCCGGTTACGTCGCGCCACACCTTGTTGCTCGGGCCGCCCGGTACCGGGAAGACTTCGGT
+CGCAAGGGCTTTCACCAAGCAGCTGTGCGGGTTGACAGTGCTGCGCAAGCCGCTGGTGGTGGAGACCAGC
+CGCACCAAGCTGTTGGGCCGGTACATGGCCGACGCCGAGAAGAACACCGAGGAGATGCTCGAAGGGGCGT
+TGGGCGGTGCGGTCTTCTTTGACGAGATGCACACTCTGCATGAGAAGGGCTACTCCCAGGGCGACCCGTA
+CGGTAACGCGATCATCAACACGCTGCTGTTGTACATGGAAAATCACCGTGACGAGCTGGTGGTGTTTGGT
+GCGGGTTACGCCAAAGCGATGGAGAAAATGCTCGAGGTGAATCAGGGTCTGCGCCGGCGCTTTTCGACGG
+TGATCGAGTTCTTCAGCTACACCCCGCAGGAGCTGATCGCACTGACCCAGCTGATGGGTCGGGAGAACGA
+AGACGTGATCACTGAGGAAGAGTCTCAAGTGTTGTTGCCGTCGTATACCAAGTTCTACATGGAGCAGAGC
+TACTCCGAGGACGGCGACCTGATCCGCGGGATCGATCTGTTGGGCAATGCCGGCTTTGTGCGCAACGTGG
+TGGAGAAGGCCCGCGACCACCGTAGTTTCCGTTTGGACGATGAGGATCTCGACGCCGTACTGGCCAGCGA
+TCTCACCGAATTCAGCGAGGATCAGCTGCGCCGATTCAAGGAGTTGACTCGCGAGGACCTGGCCGAAGGG
+CTGCGCGCTGCGGTCGCGGAGAAGAAGACGAAGTAGGCACTCTTTTCGTCGGTGTCACTGGCTACTTTGA
+CCTGAACAGTCGGCGGTGGGTGAGTGGTCTGTGGTTGGCGAATGAGGCGGGGCGGGGCGGAGACTGGTCC
+AGATGGTGTCCGTGCACGCGGGGGAGGGTGTGGTGTTCAGCCGCTCAGGGCGGGGTACGTGCCGTCTCAA
+TCCGTGCTGTGTCCAAATTGTTTACAATTAACGGTGGTGCCACACCTTAAATTCCAAATGTAAATATATT
+TGACGTCGGTCAAAAATCCCACGTTTGGCACAAGTATCGGTGGCGCGTTGCCAAGTCATTAGGCAATCGA
+GCGGACTCCCGGGCATGGAAATGCGTGTCTTTCGTTTGTGGGTGTCCGGTATCCAGACAGCATCGCTTGC
+GCCTCGACTACAGGTTTGCTACTAAAATTCCTATGCGCCATAGTGATTGAGAAGGGCCACGCCCCCTTCG
+TGTGACGCACGGCGGGCGACGGCGGCGCCGTGCCCGGCATTGGTTGGGTGTCAATGAGGCTTCAAGGATA
+TCTACCAAATTTCCCAGAAATATTTCACGGAGGCCGCAATGGAGCTAGCATTTAATCGGCGTACGGTCAG
+GCCAATATATCGAAACATGAGAGGAATGATCGATGAGCGTCAAGAGTAAGAACGGTCGTCTCGCCGCTCG
+GGTACTGGTGGCACTGGCGGCCCTGTTTGCGATGATCGCGCTGACGGGCTCAGCATGTCTGGCAGAGGGT
+CCCCCGCTTGGCCGCAACCCTCAGGGGGCACCGGCTCCGGTGGGTGGCACTGTGATCGTCGCGCCGATGC
+ACAGCGGCGTCTGACCGCCCCGTTCGGGATCTGTACGCACTTTCATCCGACTGCGCGGTTGTTTGTTAGC
+GCATCGGATGAAAGTGTGCCGTCTCGGCTGAGGAAGGACCGTCGCGATGCTGCCGAATTTCGCGGTGCTG
+CCCCCCGAGGTCAATTCGGCGAGGGTGTTCGCCGGTGCGGGGTCGGCGCCGATGTTAGCGGCAGCGGCCG
+CCTGGGATGATCTAGCCTCCGAGCTGCATTGTGCTGCAATGTCATTCGGGTCGGTTACGTCGGGATTGGT
+GGTTGGGTGGTGGCAGGGATCGGCGTCGGCGGCGATGGTGGACGCAGCCGCGTCGTACATCGGGTGGCTG
+AGCACGTCGGCTGCCCACGCCGAGGGCGCGGCCGGTCTGGCTCGGGCCGCGGTATCGGTGTTCGAGGAGG
+CGCTGGCCGCGACGGTGCATCCGGCGATGGTTGCGGCAAATCGCGCCCAGGTGGCGTCGCTGGTAGCGTC
+GAACTTGTTTGGGCAGAACGCGCCTGCGATCGCCGCGCTCGAATCCTTGTATGAGTGGATGTGGGCCCAG
+GATGCAGCGGCCATGGCGGGTTATTACGTTGGGGCTTCGGCGGTGGCCACACAGTTGGCATCGTGGCTGC
+AACGGCTACAGAGCATCCCCGGCGCCGCCAGTCTTGATGCCCGTCTGCCGAGCTCGGCCGAGGCACCGAT
+GGGAGTCGTCCGCGCGGTCAACAGCGCGATCGCCGCCAATGCGGCTGCGGCACAAACCGTTGGCCTGGTC
+ATGGGAGGCAGCGGCACGCCAATACCGTCGGCCAGATATGTCGAGCTCGCGAACGCGCTGTACATGAGTG
+GCAGCGTCCCGGGTGTTATCGCGCAGGCGCTCGTCACGCCCCAAGGGCTCTACCCGGTGGTCGTGATCAA
+GAACCTCACTTTCGATTCCTCGGTGGCGCAGGGTGCCGTCATTCTCGAAAGTGCGATTCGGCAGCAAATT
+GCCGCCGGCAACAACGTCACCGTCTTCGGCTACTCGCAGAGCGCCACGATCTCGTCACTAGTGATGGCCA
+ATCTTGCGGCTTCGGCCGACCCGCCGTCTCCAGACGAGCTTTCCTTCACGCTGATCGGCAATCCCAACAA
+CCCCAATGGCGGGGTTGCCACCAGGTTCCCGGGGATCTCCTTTCCAAGCTTGGGCGTGACGGCCACCGGG
+GCCACTCCGCACAATCTGTACCCGACCAAGATCTACACCATCGAATACGACGGCGTCGCCGACTTTCCGC
+GGTACCCGCTCAACTTTGTGTCGACCCTCAACGCCATTGCCGGCACCTACTACGTGCACTCCAACTACTT
+CATCCTGACGCCGGAACAAATTGACGCAGCGGTTCCGCTGACCAATACGGTCGGTCCCACGATGACCCAG
+TACTACATCATTCGCACGGAGAACCTGCCGCTGCTAGAGCCACTGCGATCGGTGCCGATCGTGGGGAACC
+CACTGGCGAACCTGGTTCAACCAAACTTGAAGGTGATTGTTAACCTGGGCTACGGCGACCCGGCCTATGG
+TTATTCGACCTCGCCGCCCAATGTTGCGACTCCGTTCGGGTTGTTCCCAGAGGTCAGCCCGGTCGTCATC
+GCCGACGCTCTCGCCGCCGGGACCCAGCAGGGAATCGGCGATTTCGCCTACGACGTCAGCCACCTCGAAC
+TGCCGTTGCCGGCAGACGGGTCGACGATGCCAAGCACCGCACCGGGCTCGGGTACGCCGGTCCCCCCGCT
+CTCGATCGACAGCCTGATAGACGACCTGCAGGTGGCTAACCGCAACCTCGCCAACACGATTTCGAAGGTG
+GCCGCGACGAGCTACGCGACGGTGCTCCCAACCGCCGACATCGCCAATGCGGCGTTGACGATCGTGCCGT
+CGTACAACATCCACCTTTTTTTGGAGGGCATCCAGCAAGCGCTCAAGGGCGACCCGATGGGACTCGTCAA
+CGCGGTCGGATACCCACTCGCGGCCGACGTGGCACTGTTCACGGCCGCAGGCGGTCTTCAGCTCTTGATC
+ATCATCAGCGCGGGCCGAACGATTGCCAATGACATCTCGGCCATTGTCCCCTGATCGTGTTTTGCGTGAA
+CTTTAAAGCGTTGTGCTGAGGTATGTTCCGCTCGCGTGTGGGGCGGCCCGCGCGACCACCTATGCATGAG
+CGCCAATGGTCGAGACAACTACCTGCGCGGTCATCGGGCGGCCACCCAGAGGGCATGGTTCTCGGGCTGC
+TACTGGCTCGCGTGCTTCCATCGAGCGTGAATACATGCCGCCAAATCGGCAGTCGGCGCCGCTGGCGTGC
+CGCTAGCTGATCACAAAGCGCCGATACCGATGCGGCTGGCCATAGCAATGCCAATGTTGGCGAATAGATC
+TCACGCGCGGCCCAAGCCAACAGCGAGGTGATGGTGATCATTCTTTACGTTGCGATTACCTCGCCGGAAC
+GTGACACGAGCAATACTCGCCAACCATGATCGCCAGATATTTGGAACGGGTTTGGGTCCAGCGGCCGCCA
+AAAACCGACTCGCCGCCGTCCCTGACAACTCAGCGGCGAGAGGTGAACACGGGTGATTTGTCACTACGGG
+CCGCTGCGGTTCCTGCGCTGCCAGGGGGCCGCGAGTGCGATTCCGGCGAGCCACGCGATTAGGGATTAAG
+CGAAATGGATTTCGGGTTGTTACCGCCGGAGATCAACTCAGGCAGGATGTATACGGGGCCGGGGCCGGGG
+CCCATGCTGGCCGCCGCGACAGCCTGGGACGGGCTGGCTGTTGAGCTGCACGCAACAGCGGCTGGCTACG
+CCTCGGAGCTATCGGCTTTGACCGGGGCATGGAGCGGTCCTTCGTCGACGTCCATGGCATCTGCAGCCGC
+ACCCTATGTGGCATGGATGAGCGCCACCGCAGTGCATGCCGAGCTGGCGGGCGCGCAAGCCAGGTTGGCG
+ATAGCTGCCTATGAAGCTGCGTTCGCTGCCACCGTGCCTCCGCCGGTGATCGCCGCTAATCGTGCCCAAC
+TGATGGTGTTGATCGCGACGAACATCTTCGGGCAGAACACGCCGGCGATCATGATGACTGAGGCCCAATA
+CATGGAAATGTGGGCGCAGGATGCCGCCGCGATGTACGGGTACGCCGGCTCGTCAGCGACCGCCTCGCGA
+ATGACAGCGTTCACTGAGCCGCCGCAAACCACTAACCATGGTCAGTTGGGGGCCCAGTCCTCCGCCGTCG
+CACAAACCGCCGCCACCGCGGCCGGCGGCAACCTGCAATCGGCATTCCCGCAGCTGCTCTCCGCGGTTCC
+CCGCGCCCTGCAAGGCCTGGCATTGCCGACCGCATCACAGTCGGCATCGGCGACGCCGCAGTGGGTTACC
+GACCTGGGGAACCTGTCCACCTTCCTGGGCGGGGCGGTCACCGGCCCGTACACCTTTCCCGGGGTATTGC
+CTCCCTCCGGGGTGCCATACCTGTTAGGCATTCAGAGCGTCTTGGTAACCCAAAACGGGCAGGGGGTAAG
+CGCCTTGCTTGGCAAGATCGGGGGGAAACCAATCACCGGAGCGTTGGCTCCGCTGGCCGAATTTGCTTTG
+CATACACCAATTTTGGGTTCGGAGGGCTTGGGTGGTGGATCGGTTTCCGCGGGTATTGGCCGGGCAGGCT
+TGGTCGGAAAGCTATCGGTGCCTCAGGGCTGGACGGTGGCCGCCCCGGAGATCCCATCGCCGGCGGCGGC
+GTTGCAGGCGACGCGCCTGGCCGCCGCGCCGATTGCGGCCACCGACGGCGCGGGTGCGTTGCTCGGTGGC
+ATGGCGCTGTCGGGCTTGGCTGGCCGCGCTGCCGCCGGTTCTACCGGCCACCCCATCGGCAGCGCCGCAG
+CACCCGCCGTCGGTGCCGCTGCCGCTGCCGTCGAGGACCTGGCCACCGAAGCCAACATCTTCGTGATACC
+GGCCATGGACGACTAGCGCCATGTCACGGGAGAGAAGGTTGTCGACACTTTTGCGACCAGCGCCGGTTCG
+GTATGTGGCCACCGGGGCTGCCAATGGGGTTACGGCCCGTTAAGGAGGGATGCGGTAATGGATTTCGGGG
+TGTTACCACCGGAGATCAATTCCGGGCGCATGTATGCCGGTCCCGGGTCGGGTCCGATGCTGGCCGCGGC
+AGCGGCCTGGGACGGGCTGGCCACCGAATTACAGTCCACGGCGGCCGACTATGGCTCGGTGATCTCGGTT
+CTGACCGGCGTGTGGTCGGGACAGTCGTCGGGGACCATGGCGGCTGCGGCCGCACCGTATGTGGCGTGGA
+TGTCGGCCACGGCGGCGCTCGCTCGGGAAGCGGCCGCCCAGGCCAGCGCGGCAGCGGCGGCCTACGAGGC
+AGCGTTTGCAGCCACGGTGCCGCCGCCGGTCGTCGCGGCCAACCGCGCCGAGCTGGCGGTGTTGGCGGCG
+ACCAACATTTTCGGTCAGAACACCGGTGCGATCGCGGCCGCCGAAGCCCGCTATGCGGAAATGTGGGCGC
+AAGACGCAGCCGCGATGTATGGCTATGCCGGCTCGTCGTCGGTGGCGACCCAGGTGACGCCATTTGCTGC
+ACCGCCGCCGACCACCAACGCGGCCGGACTGGCCACCCAAGGCGTTGCGGTTGCCCAGGCTGTCGGCGCG
+TCGGCCGGCAACGCGCGCTCACTGGTGTCCGAGGTGCTGGAATTCCTGGCAACGGCCGGGACGAACTACA
+ACAAGACGGTGGCCAGCCTGATGAACGCGGTCACCGGGGTGCCGTACGCATCTTCGGTGTATAACAGCAT
+GCTCGGGCTTGGCTTCGCTGAGTCAAAAATGGTCCTGCCGGCTAACGACACCGTAATATCGACCATCTTC
+GGCATGGTGCAGTTCCAGAAGTTCTTCAATCCGGTGACGCCCTTCAATCCCGATTTGATCCCGAAATCTG
+CTCTAGGGGCCGGGCTTGGCCTGCGGTCTGCGATCTCGAGTGGTCTGGGCTCGACCGCGCCAGCGATATC
+GGCGGGTGCGAGCCAGGCCGGCTCGGTCGGGGGGATGTCGGTGCCGCCGAGCTGGGCAGCGGCCACCCCG
+GCGATCCGGACGGTTGCCGCTGTGTTCTCGAGCACCGGACTTCAGGCTGTCCCGGCGGCCGCAATTAGCG
+AGGGCAGTCTGCTCAGCCAGATGGCCCTGGCGAGTGTGGCCGGAGGGGCCCTTGGCGGCGCCGCTGCACG
+CGCCACTGGTGGTTTCCTCGGCGGAGGCCGAGTCACCGCGGTCAAGAAATCTCTCAAGGACAGCGACTCA
+CCGGACAAGCTGCGGCGGGTGGTCGCGCACATGATGGAGAAGCCCGAATCGGTGCAGCACTGGCACACCG
+ACGAGGACGGGCTCGATGATCTACTCGCGGAATTGAAGAAGAAACCGGGCATCCACGCCGTGCACATGGC
+CGGCGGCAACAAGGCTGAAATTGCACCGACGATATCAGAATCGGGCTAGGGCAGGGTTAGGGCGTGTCTT
+CCAATTGATAGGCCCCGAGGCAGACACGAGTCGCCAGACCGCACCATTGCTTGAGTTGGTTGATGCCCTT
+GAGATCGGAACCCGAATCCCACAGCAGGAGAATTAGTTTCGTCCCCAGACCGGCGGCTACGGCTGCCCGT
+TCTGCCCAGGCAAACCGATCAATCCGCCCTTGCCGCCTTGGCCCCCGGGTGCGGGTGGGACACCATCTCC
+GCCGTCGCCACCGGTACCGATCAGCAGGGCGGCGTTACCACCGTCACCGCCGGCACCGCCAGTGCCCGCA
+CTGCCGCCGGTTCCGCCGGCCCCACCGGTACCGCCACTTCCCCCGGGTCCGCCGTTGCCGATCCCCAGGC
+CGCTTGCCCCGCCTTGGCCACCATCGCCGCCGTTGCCGCCGTCGTTGCCCGACCCGCCGACGCCGCCGGC
+CCCGCCGATGCCGCCGGCCCCGCCGCTACCGAACAGTAGGCCTCCGCTGCCGCCCGCGCCACCGTCGCTG
+CCGTCACCTCCGGCTTCCTGAATGATGTTGCCTACTCCGGTCCCACCGGTCGCCCCATTCCCTCCGGCCC
+CGCCGTTGCCGATCAGAATGGCGGCGCCACCCTGGCCGGCGCTGCCTTCGAAGCCGGTACCTCCGCCGCT
+GCCGGCGTTACCACCGTTGCCGCCATTGCCGTATAGCACCCCACCTTGGCCGCCGTCACCCCCTGATGCA
+CCAAATTGAATGCTGAGGCTGCCGGCCCCAACGTCACCACCGTTGCCACCGTCACCGCCGTGACCAAACA
+ACCCAAAACCCTGGACACTAATCGGTCCGAAGTTAACGGCACCTACCCAGCCGCCACCGCCAGCAGAGCC
+GCCAAAGCCCGCAAATCCGTTGGTGCCTGCGTCACCGCCCTGACCCCCGTTGCCGCCGGACGCGCCGCTG
+CCGAACAACCACCCGCCGTTGCCGCCGTCGCCGCCTGAGCCACCGACCCCGCCGCTCCCGCCGAAGATGG
+TAGTACCCAGCGCAGACCCGGCCGCTCCATTCCCGCCGTTGCCACCGGCCCCGCCGTTGCCGACTAGGCC
+CGCGTCACCGCCGTTACCGGCTATCCCGGCCGAACCGCCGGAAGCGCCGTTCATGACGCCCGTTTGAGTG
+GAGTCGGTGCCGCCGCCGGCGCCGCTGTCCCCACCTTGCCCCCCGTTGCCGATCAGCCACCCGCCCTGGG
+CGCCGTTGCCCCCGTTGCCTCCTAATCCGCCGCTGCCGGCCGAATCTCCGGCTGTGTCATTAGTGCCTTG
+TCCTCCCATGCCACCGACCGAGCCGTTGCCGCCGTTGCCGAACAACAGTCCACCGCGACCACCCGAACCC
+CCGTTTCCGCCGGCGCCCCCATCGAAGCCTGCCGACGCACCCCCGGGCGCTGTGGCGTTGCCCCCGTTTC
+CGCCGGCCCCACCATGTCCACCGTGACCATAGATCCATCCACCGGCGCCGCCGTTGCCGCCGGACCCGCC
+CGCTTTCCCGGGTTGACCGGCTGCGCCGTTGGCACCCGCCCCGCCCTGGCCGCCATTGCCGCCGCTACCC
+CATAGCCCAGCCGACCCGCCGTTGCCGCCATTTTGGCCCGTCCCGCCGGACCCGCCGTTGCCACCGTTGC
+CGTATAGCCATCCGCCATCGCCACCGTTTTGCCCGGTTCCTGCGACCCCGTTGGCACCGTTGCCGATAAG
+CGGACGCCCGGTCAGCGTCTGCACGGGTGAATTGATGGCATCGAGGGCGGTTTGGCCCACGATTTGCAAT
+GGTGACGAGTTGGCTGCCTCGGCGCTGGCGTACTAGGCCGCCCCCGCGCTCATGAGCTGGACGAACTGCT
+CATGGAATGCGACCGCGTGGGCACTGAGCTCCTGGTATGCCTGCCCGTGCGTTGCGAACAGCGCCGCAAT
+CGCAGCCGACACGTCGTCAGCGCCCGCAGGCAGTAACGCCGTTATCGGGACCAACGCTTCGGCGTTGGCC
+CGGCTAATCGCCGAACCAATAGTTGCTAGGTCCTTTGCCGCTGCATCGACAAACGCCGGCGCCACGATCA
+TCTGCGACGTCCACACCTCCTGGCCGTTGTCGCCGCATGGGGAATCCATACGACCGCCAAAGGAATTTTG
+GAACCGACGCCAACGTTACAGTTTTGCGGACCCGCTATGGGGTGCATTCACCAGATTCACTGGCAACGAT
+GTGAACCCCGTGTCACCCCAAGCGGGGTCAATCCACTGATTACTCTCTAGCCCAAACTATTTCGCGCTGA
+CGCTGGTTTTAGTGATCTGGTGGGGGCAATAGACATGCGCGGAGATCGCAGCGAACTTGCAACAACCGTC
+CATCGAAAACCCGGGATTGCGGGTCCGCAGCTCGTTGACGACCTGAAGACCCGATTCGCCGCTTTCGACT
+AACGCGCATACGGCCTTGCCCGATGCTATGGCTTGATCCGGGTGGCTGTAGGTAATGCCTGCCCGCTCTA
+GCGAGGCAAGAAAGACCGCGTCGTCACCGCTGGGCCCCGCGTGGGCCGGAACCGCCAAGCCGATCATCAA
+CGGAATGCTGAGTAGCGTTGACACAACTCTCATAGACAACGATTCTCCCGGAATTGCGCTTCTCTTGCGG
+TGCAACCGGTTACCGCGTCATTCCAATACGTTACGGCTGCGCTAACTTCCCGTCTCAGGGTGTTCGGGTT
+GCGCTGGACCTGAAGGTCGTCTGCTGACCGGCGTTGTCTGCTCGCTGGCTAACAGCCGATCTTGATAGCC
+TCCGGGGCATCGGATGAGTCAAGCCGTTGGGTTGACGCGCGTCGCTACGAGTGTCACGATTACCCTTGCA
+AGCACCTCGCTAGGTGAGGCGTCTGCGCGGATATAGGCCACTGACCTCGAACGTCGAAAGACGCCCAGGG
+TCAGGACAGCTCTTCCCGGCTTAAGGGTTGAGCCCAAGTGGCTTCCGGCTGGACCGGCCGGATACGCCGT
+GTGGTGCCAAAGCTCTGACGAGAGGGGTGCCGAGTTCGGTGGTCTGCTGGGCTGTCATCCCTTTGTGCTG
+TGCATCGGCATCCCCGTGTGCCCCGGCCGTGAGGAGGTGAGAGCGAAATGAGTCCCGGCGATAGTCCGTA
+TCCGAGATCGACGACCGTTTCGTTCCGATCCGACCCCGGCGCCGTTTTCGCACTCTGAATCGGCCTTCCG
+GTTCGAAATCCGTTATTTCGCAAGCTCGTTGCTTCGCGGCCTTGTGTGAGTGACGTTCACGGGAAGTAGC
+CACGACAGAAGCGGTCATAGGCCTCCGGGTTCGGTCGTCTGTCAGGAGAAGACCCATGGCGTTTGTTCTT
+GTCTGTCCAGATGCGCTGGCCATCGCGGCCGGTCAGTTGCGCCATGTTGGATCGGTGATAGCCGCGCGGA
+ATGCGGTCGCGGCACCGGCAACTGCCGAATTGGCCCCGGCGGCCGCTGACGAAGTATCAGCTTTGACTGC
+AACACAATTCAACTTCCATGCCGCCATGTACCAAGCGGTCGGCGCCCAGGCGATCGCCATGAATGAGGCG
+TTCGTCGCGATGTTGGGCGCCAGCGCGGATTCTTACGCGGCTACCGAAGCCGCCAACATCATTGCTGTGA
+GCTAACGAGGAGATCAACGATGACTGCCGCACTTGACTTCGCCACGCTACCGCCCGAAATCAACTCGGCG
+CGTATGTATTCCGGCGCGGGCTCGGCCCCGATGCTGGCCGCAGCGTCAGCCTGGCACGGCTTGTCCGCAG
+AACTGCGCGCCAGCGCACTGTCATACAGCTCGGTGCTTTCGACGCTGACCGGTGAAGAATGGCACGGTCC
+GGCGTCGGCATCGATGACAGCCGCGGCCGCCCCCTACGTGGCCTGGATGAGCGTCACCGCCGTCCGGGCC
+GAGCAGGCCGGGGCACAGGCGGAGGCTGCCGCTGCAGCGTACGAAGCCGCGTTCGCAGCAACGGTGCCCC
+CGCCGGTCATCGAGGCCAACCGCGCCCAGCTCATGGCGCTGATCGCCACCAATGTGCTAGGCCAAAACGC
+CCCCGCGATCGCGGCCACCGAGGCCCAGTACGCCGAAATGTGGTCCCAGGACGCGATGGCCATGTACGGC
+TACGCCGGCGCCTCGGCAGCCGCTACCCAGCTGACCCCGTTCACCGAGCCGGTGCAGACTACCAACGCGT
+CCGGCCTGGCGGCCCAGTCGGCTGCGATTGCCCACGCCACCGGCGCCTCGGCTGGTGCTCAGCAAACGAC
+GCTGTCGCAGCTGATCGCCGCCATACCGTCTGTACTGCAAGGACTTTCGTCATCGACTGCAGCCACGTCC
+GCGTCGGGGCCGTCCGGATTGCTGGGCATTCTCGGGTCTGGATCTTCCTGGCTCGACAAACTCTGGGCGT
+TACTGGACCCCAACTCCAATTTCTGGAACACGATAGCTTCGTCCGGACTGTTCTTGCCGAGTAACACGAT
+TGCGCCCTTTTTGGGTCTACTCGGCGGCGTGGCAGCTGCGGATGCGGCCGGGGATGTGTTGGGAGAGGCC
+ACCAGTGGCGGGCTCGGTGGCGCGCTGGTGGCGCCGCTTGGCTCAGCGGGCGGGCTAGGCGGCACTGTCG
+CGGCCGGCCTGGGCAACGCGGCCACCGTCGGAACCTTGTCGGTGCCGCCGAGCTGGACGGCGGCCGCACC
+ACTAGCCAGCCCCTTGGGCTCCGCGTTGGGAGGCACACCGATGGTGGCACCGCCCCCAGCAGTGGCGGCC
+GGCATGCCTGGAATGCCTTTCGGCACCATGGGCGGTCAAGGCTTCGGGCGTGCCGTGCCCCAGTATGGCT
+TCCGCCCCAACTTCGTCGCACGACCGCCCGCCGCCGGGTGATCCCGTAGGGGGTGGGTTCCCTGGAAAGC
+GCCAGGGTCACGATGGCGCAGCCGAATAGCCGACAGTGCTTTTCTCTGCGAATACCGGAGTTGGTCGCGC
+GAAATCATTTCCGTTTAGCGCGTTCACCAGCGCAGGCGGGCCAGGCTCAATAAGCGGAAATTTCTCGGGC
+GAAGCACCCGTGCAGCAGCGCAAATAGATGGGATCGGCAGGACGTAGACATTGGGATATCTGGTGAAGTT
+CATAAGAGCTTGACCAGTTGGTGGGCAGAACTACGCGAGCGTGATTAGCATGGCGGCCATCGAGGGGACC
+GGAGGTCAGGGATGTTGGATTTCGGGGCGCTACCACCGGAGATTAATTCGGGGCGAATGTACGCGGGTCC
+GGGATCCGGACCGTTGCTGGCCGCCGCAGCGGCCTGGGATGCGCTAGCCGCCGAGTTGTACTCCGCGGCG
+GCGTCCTATGGCTCGACGATTGAGGGCCTCACCGTAGCACCGTGGATGGGTCCCTCCTCGATCACGATGG
+CCGCCGCGGTCGCTCCATATGTGGCGTGGATTAGCGTCACCGCCGGCCAGGCCGAACAGGCAGGGGCCCA
+GGCCAAGATCGCTGCGGGCGTTTATGAGACGGCATTTGCGGCAACGGTGCCGCCACCGGTAATCGAGGCC
+AACCGCGCTTTGTTAATGTCGCTGGTCGCCACGAACATCTTCGGGCAGAACACACCGGCGATCGCGGCCA
+CCGAGGCCCACTACGCGGAGATGTGGGCGCAAGATGCGGCCGCGATGTATGGCTATGCCGGCTCGTCGGC
+CACTGCGTCGCAGTTGGCGCCGTTCAGCGAGCCGCCGCAAACGACCAATCCGTCGGCAACGGCCGCTCAA
+TCAGCCGTCGTCGCCCAGGCCGCCGGCGCCGCGGCCAGCTCTGACATCACAGCGCAGCTGTCCCAGTTGA
+TCAGCCTGCTACCCAGCACCTTGCAAAGCCTGGCGACAACAGCGACCGCGACGTCGGCCAGCGCTGGTTG
+GGACACCGTCCTGCAAAGCATCACCACTATCTTGGCGAACCTCACTGGGCCGTACAGCATCATCGGGCTG
+GGCGCTATACCTGGCGGCTGGTGGCTGACGTTCGGCCAGATCCTCGGCCTAGCCCAAAACGCCCCAGGTG
+TGGCCGCCCTACTGGGCCCGAAAGCCGCCGCCGGCGCGTTGTCGCCATTGGCGCCGCTACGGGGCGGGTA
+TATCGCAGATATCACGCCTCTCGGTGGTGGGGCCACAGGGGGCATCGCCCGTGCGATCTACGTCGGGTCG
+CTCTCGGTCCCGCAGGGCTGGGCCGAGGCCGCACCGGTGATGAGGGCGGTCGCATCGGTATTGCCGGGCA
+CCGGCGCCGCCCCCGCCCTGGCCGCCGAGGCACCAGGTGCCTTGTTCGGCGAGATGGCCCTGTCGAGTCT
+GGCCGGACGCGCGCTGGCAGGAACCGCGGTGCGCTCTGGTGCCGGAGCTGCTCGCGTCGCAGGCGGTTCC
+GTCACCGAAGACGTCGCCAGCACGACCACCATCATCGTCATACCCGCGGACTGACAGGACTTTCGAGATG
+GCACTTGAACTGGGTGTTAGCCCCCACCGGAGAGGAGAGAAGGACGGTGTCATCGCCACTGTGGCCGGTG
+GCTGGCGGCCAGCCAGTTAGCGGCCGGTTGAGGAAAGGTGTGGCAATGGATTTCGGATTGCAGCCACCGG
+AGATCACCTCCGGGGAGATGTACCTAGGTCCGGGCGCCGGTCCGATGTTGGCTGCGGCAGTGGCCTGGGA
+TGGGTTGGCGGCCGAATTGCAGTCCATGGCGGCCTCCTACGCCTCGATCGTCGAGGGCATGGCGAGTGAG
+TCATGGTTGGGTCCGTCGTCGGCCGGTATGGCCGCTGCGGCCGCACCATATGTGACCTGGATGTCGGGTA
+CCTCGGCACAGGCCAAGGCGGCCGCTGACCAGGCCAGAGCCGCGGTGGTCGCCTACGAAACCGCGTTCGC
+GGCGGTGGTGCCACCGCCGCAGATTGCGGCCAACCGCAGCCAGCTCATATCGCTGGTGGCGACCAACATT
+TTCGGACAAAACACCGCCGCGATCGCAGCCACCGAAGCCGAATACGGCGAAATGTGGGCCCAGGACACCA
+TGGCGATGTTCGGCTATGCCAGCTCCTCGGCGACCGCCTCGCGGCTGACCCCGTTCACTGCACCGCCGCA
+GACCACCAACCCGTCCGGACTTGCCGGCCAGGCGGCCGCAACGGGGTAAGCGACCGCCCTAGCGAGCGGC
+ACCAATGCGGTGACAACCGCGCTTTCGAGTGCAGCGGCGCAGTTTCCGTTCGACATCATCCCGACCCTGC
+TGCAGGGCCTGGCCACACTCAGCACCCAATACACCCAACTCATGGGCCAACTCATTAACGCCATCTTCGG
+GCCGACGGGCGCAACGACCTATCAGAACTTGTTTGTCACCGCAGCCAACGTCACCAAGTTCAGCACGTGG
+GCCAACGACGCCATGAGCGCGCCCAACCTGGGAATGACGGAGTTCAAGGTGTTCTGGCAACCCCCGCCGG
+CGCCCGAGATCCCCAAATCGTCGTTGGGTGCCGGACTTGGCCTGCGGTCAGGGCTTAGCGCGGGCCTGGC
+CCACGCCGCATCGGCGGGTCTGGGTCAGGCGAACCTGGTGGGAGACCTGTCGGTACCGCCCAGTTGGGCC
+TCAGCTACCCCGGCGGTCAGGCTAGTTGCCAACACATTGCCGGCCACCAGCCTGGCTGCGGCCCCCGCGA
+CACAGATCCCAGCAAACCTGCTCGGTCAGATGGCTCTGGGGAGCATGACCGGAGGTGCCCTCGGTGCCGC
+CGCCCCCGCCATCTACACGGGCAGTGGCGCCCGGGCCCGCGCCAATGGGGGAACGCCCAGCGCTGAGCCG
+GTCAAGCTGGAGGCTGTCATCGCGCAGCTACAAAAGCAACCGGACGCAGTGCGACACTGGAATGTCGATA
+AGGCCGATCTTGATGGCCTGCTGGATCGATTGTCGAAACAGCCCGGCATCCACGCGGTACACGTGTCGAA
+CGGCGACAAACCCAAGGTTGCCTTGCCCGATACTCAGTTGGGTTCACACTCAACGTGATTCGAAATCCAC
+ACTGATACTGGAGGTGATTACCGGCTGAAGCAAAGCGCATTGGAAATCCAGGCTTAGACCATTGCCATGT
+GGCCGTGAGATTCGTCACGTCTTGACATCCGCGTCCGGCGGGTCACCTTCGACCGCGGTCAATGTCATTG
+GTAGGTAAGGGCTTTGCTGTACTGATGGCCGAATTTTGACTCGAAAAGTATGTCGGGCCCTCGCAGCAGA
+TCTGCCGCAGGACGCGATGCAATTACAACGCACGATGGGACAATGCAGACCTATGAGAATGCTAGTAGCG
+CTCCTGCTGAGCGCCGCCACCATGATCGGCCTAGCCGCACCCGGGAAAGCCGATCCAACAGGCGACGATG
+CCGCCTTCCTTGCCGCGTTGGACCAGGCCGGCATCACCTACGCTGACCCAGGCCACGCCATAACGGCCGC
+CAAGGCGATGTGTGGGCTGTGTGCTAACGGCGTAACAGGTCTACAGCTGGTCGCGGACCTGCGGGACTAC
+AATCCCGGGCTGACCATGGACAGCGCGGCCAAGTTCGCTGCCATCGCATCAGGCGCGTACTGCCCCGAAC
+ACCTGGAACATCACCCGAGTTAGCGGGGCGCATTTCCTGATCACCGCGGTGGTGCGCGGTGGTGTGGTGC
+GTCCGAGGGGGTTGCGATGCACCCGGTTCGCCTAGGCTCAAACTGCTGTTAACCTGCGCGTGGTTGGCTG
+CCGTGGCCGTCTTGCGATCGGGAAGGACTCGGCGTCATGCAAACGCTGACTGTCGCCGATTTCGCTCTCC
+GGCTGGCCGTCGGAGTGGGTTGCGGGGCCATTATCGGGCTCGAGCGCCAGTGGCGGGCGCGGATGGCTGG
+GTTGCGCACCAACGCTCTGGTGGCGACCGGTGCTACCTTGTTCGTGCTGTACGCGGTCGCCACCGAGGAC
+AGCAGCCCCACCCGAGTGGCGTCCTACGTGGTTTCTGGAATTGGATTCCTGGGCGGCGGGGTCATCCTGC
+GGGAGGGGTTCAACGTCCGCGGTCTGAACACGGCTGCCACGCTTTGGTGCTCGGCCGCGGTCGGAGTGCT
+GGCCGCCTCCGGGCATCTGGTGTTCACCCTGATTGGCACCGGAACCATCGTCGCTGTCCATCTCCTGGGG
+CGCCCACTTGGCCGGCTGGTCGACCGCGACAACGCCGTCGAAGACGAAGGGCTGCAGCCCTACCAGGTAC
+GGGTGATTTGTCGGCCCAAAGCAGAGACCTATGTACGTGCCCATATCGTGCAGCGCACCAGCAGCAACGA
+CATCACGCTGCGGGGTATACGCACGGGGCCGGCCGGAGACGACAACATCACGTTGACGGCCCACCTATTG
+ATGGTTGGCCATACCCCGGCCAAGCTAGAGCGGTTGGTGGCGGAACTGTCGCTGCAGCCGGGCGTTTACG
+CTGTGCACTGGTATGCCGGTGAGCACGCGCAGGCCGAATGACCCACGACACTAGGGGCGGGGCTGTACTC
+GCGGCGCGGCCGCAGCCAGCAAGTCTGCCCGACTGCCGTTCAGCGGCGGGTAGATCCGCCGGGTATTGAT
+TGACTGCTTGGTGGTCTTGGCCGGTGCGCCCTGCGATACCACTTTGCGTTCCCATCCCTCAGTGTACACC
+GCGCCCGCCGATCCTAGATCGAGAACCGTGACATACCAAGGGATCCGAAGAGCCAGCAACGGTTGGTCGA
+ACAGATCGTTGATGACGTTGCAGCCGGCATAGCGGCCCATCGGGCGCCCATGCTGACACGACATGACCGA
+CAGGTGCTCGTCATCCATCCGGGCCGCGGCCACATCGCCAGCAGCAAACATCGCAGGCACCCCGATCACC
+CGCAGGTAGTCGTCGACTTGCAGGCGTCCCAGCCGATCACGGGCTACCGGCAGCTGCTCGGTCAGGCGGC
+TGGCCCGCATGCCGGCGCACCACACCACGGTGGCCGCTGCCAGCCGTTCCCCCGATGACAGCGTTACACC
+GCCCGGGCTGACGGCGGCAACGCTCACGCCGGTTCTGGTCTCGACGCCGTTGTCCAACAGCGCCTGTTCG
+ATCACCGGCCGCGCCGATAAACCCATATCGGAGCCGACGAAGGGGTTGTGGTCGATGAGTACCACGCGGG
+GGGTGACACCATCACCACGGGCGAACAACGCGTGCAGTCGGCCCGGCAACTCGCAGGCCGTCTCGATACC
+GGTCAGCCCGGCACCGACGACCACGACGGTTGCCGCCGCCGATGTCAGCGGCCCGCCGGCCAGTCCTTGC
+AGATGCTGCTGTAGCCTGACCGCGCCGTCGTACGTGTCGACATCAAAACCGAACTCTGCCAGTCCTGGCA
+ACGCGGGTTTGACCACGTGACTGCCCGACGCGAGGACCAGTCGGTCATAGCTATATGAGGCACCGGTCGA
+CGTGGTGACGCGGCGGCCGTCGGCGTCGATCGCGGTCACCTCGGCGGTGACATGCGCAACGCCGGCAGGG
+CCGAGCACGTCGCCGAGCGGGATGCGGCAGGCGCTCAGATCAGCCTCATAGTTGCGAACCCGGATATCAT
+GAAACGGTTTGTTGCTCACCACCATGACGTCGACCGTGCCCGCTGGGACGGCGAGCTCGTCGAGTCGTCG
+GGCCGCACCGAGCGCCGCCCACAGGCCCGCGAACCCGGAGCCGATCACCACCACCCGGGTCAACGGCTAA
+ACACCTGACGACTCTGGGGTATCGCCGCCGCCGCGTGGCGACCGGGCAGGAACATCCACACGTGCCAACC
+TCCTTCGAGCCCGGGCCATCCGATAACCCCGTTAGCCGTCGCGAGCTTACAGAAGGTGCAGGCATCGGGA
+TTGAGTGCATCATGGGATACCGGTGAATACCGTCAGCCGGGGCAGCCAGGGTAGGGGACACCCCCCGCTC
+GGGCTGCCAGCGGAGTATCGAGCGGATCGCCATCGGCGTAGCAGATACCGGGTCAGAGCAGCGTACGCTG
+GCACATTCGGCTTCGGCTCGCTGGTTAGCGATTGTTAGTTGCACGCCCAGTTGACGATCCGCCCGCCTTC
+GAGTCGGTTCACGGCGTCGTCTTCTGCCGCGCGGCGCGTGAGTCCGGTTCCGCCTTGGTATTTCGAGCCG
+TTGTAGGCGACCGCGCCGCACCTGGTGAAGCGACTAACCACTTTGCAAGTCTTGTCACCGCACTTTTCTA
+GTGCGACTTGCTCTGCTCGCGCCGGTGTGCGCTGGTGCCACGCTTTGCCCGACGCGCCGCTGGGGGCATA
+GGCAATCGCCCCGTAATGGATAATCGGAGGGATAGGCAACCCGGCAATTTCCGACATCATGACTTCCGAC
+ATCGAACCGTTGGCGAGATGGGCGTCCACCGTCGGAACCAGCAGGATGCCCAGCCCGAGAGCAGCCCCTA
+GGCCGGCGGCTGCCATCGCGGTTCGGCGTCGGAGGTTTGTGATCATGTCCTGCCCCCTTTCTGCGGTCGG
+TAATCCAGCGGTTTGAAAGGGTTGAGCCGACTTACGCGCAGTGGATGCGTCGAAGGGTCAATGAGGCTGG
+GTACTGAGACGGCCACGGTTGGAAGCCCGGCGCCCTGGCCGATGATCGATCAGGTCATCGCTGTATGGAG
+GCTGCCCACCCACGGTGCTCGGTTCGGTCCGGGATTCTGGCGCTTGTGTGTCATGTGCCCAAGTGTGCGA
+TAAATATACCTGACCCGGGTAGGGCATAAAGTCTCTAACAGCACCGACCGGATAGGGAACAACGGCCTTC
+GGGCAAGCGGCTTCACTGTCAAGTCGTCACCTGTCACGCATGCGAGTCGTAGCCTGTCTGATGTGGATGC
+CGTCGCCGGATTCTTCTCAGCGCTGCCCGAGGAAATGCGGGACCCGGTACTGTTCGCCATTCCATGTTTT
+CTATTGCTGCTGATTCTCGAATGGACGGCGGCCCGCAAGCTGGAAAGCATCGAGACCGCTGCTACCGGGC
+AGCCACGGCCCGCCTCGGGCGCTTACCTCACCCGCGACTCGGTGGCCAGCATCTCGATGGGGCTGGTTTC
+GATAGCCACCACCGCCGGCTGGAAGTCCCTTGCCCTGCTCGGTTATGCCGCAATCTATGCCTACCTTGCC
+CCCTGGCAGCTGTCCGCCCACCGGTGGTACACCTGGGTGATCGCGATCGTTGGTGTCGATCTGCTGTACT
+ACTCCTATCACCGCATCGCCCACCGAGTTCGGCTGATCTGGGCTACCCACCAGGCGCATCACTCCAGCGA
+ATACTTCAACTTCGCCACCGCGCTGCGCCAGAAGTGGAACAACAGCGGCGAGATTCTCATGTGGGTTCCG
+CTGCCACTGATGGGGCTTCCCCCTTGGATGGTGTTCTGCAGTTGGTCGCTGAACTTGATCTACCAGTTCT
+GGGTGCACACCGAGCGGATCGACAGGCTGCCGCGGTGGTTCGAATTCGTCTTCAATACCCCGTCGCACCA
+CCGGGTCCACCACGGAATGGACCCGGTGTATCTGGACAAGAACTATGGCGGCATCCTCATCATCTGGGAC
+CGCCTGTTCGGTAGCTTTCAGCCGGAGCTATTCCGACCGCATTATGGCCTGACCAAGCGGGTCGACACGT
+TCAACATCTGGAAGCTGCAGACCCGCGAGTACGTGGCGATCGTGCGTGACTGGCGGTCGGCAACACGTCT
+GCGGGATCGGCTGGGCTACGTCTTCGGACCGCCGGGCTGGGAACCGCGCACCATCGATAAATCCAATGCC
+GCCGCCTCCCTGGTCACGTCTCGGTAACGTCGCGACCCGACATTGCGAAAGTATTACCGTCGGGTTTTGG
+TACGCCTTAGCCGTAACCGGCGGCGGGCGATGCGCTTGGCCCCGACGGATGGGAGTTCAAGGTGGTCCGC
+CTGGTACCACGCGCATTCGCAGCGACGGTCGCCCTATTGGCGGCCGGGTTTTCGCCGGCGACCGCCAGTG
+CCGATCCGGTCTTGGTGTTCCCCGGCATGGAAATCCGTCAGGACAACCACGTCTGCACCCTGGGCTACGT
+CGACCCAGCTCTGAAAATCGCGTTTACCGCGGGGCATTGTCGGGGCGGGGGAGCGGTCACCAGCCGGGAC
+TACAAGGTTATCGGCCATCTCAGGGCCTTCCGGGACAACACACCCAGCGGCTCCACCGTGGCCACGCACG
+AGTTGATCGCCGACTACGAGGCGATTGTGCTGGCTGACGACGTCACGGCAAGCAACATTTTGCCGAGCGG
+GCGTGCACTGGAATCCAGACCGGGTGTGGTTCTTCACCCGGGCCAAGCGGTCTGCCATTTCGGCGTCAGC
+ACAGGCGAAACCTGTGGGACCGTCGAAAGCGTCAACAACGGCTGGTTCACCATGTCCCACGGCGTGCTCA
+GTGAGAAGGGGGATTCGGGGGGCCCGGTCTACCTGGCCCCCGATGGCGGCCCCGCGCAGATCGTCGGGAT
+CTTCAACAGCGTCTGGGGCGGCTTTCCCGCGGCGGTGTCCTGGCGGTCGACGTCCGAGCAGGTTCACGCG
+GATCTCGGCGTGACGCCCCTTGCTTAGCAAGCACCCCGTTAGCGGCCACCAGGTTGATCGCCGTGTGTTT
+GCTAGAGCGGTGATCTCGGTTGTGTCAGACTTGCCGCGTGGGCAAGCGCCGGGATGCGAGGGAACAGATC
+GAGGCGAAAATTGTCGAACTCGGCCGTCGCCAGCTGCTGGATCACGGCGCGGCCGGGTTGTCGCTTCGGG
+CAATTGCCCGCAACCTGGGCATGGTGTCCTCGGCCGTATACCGCTATGTGTCCAGTCGTGATGAGCTGTT
+GACTTTGCTGCTCGTCGACGCCTACTCCGACCTGGCCGATACCGTGGACCGAGCCCGCGACGACACCGTC
+GCCGACTCGTGGAGTGACGACGTCATCGCAATCGCTCGAGCGGTGCGCGGTTGGGCAGTCACTAACCCCG
+CCCGCTGGGCCTTGCTATACGGTAGCCCGGTTCCTGGTTATCACGCGCCGCCTGACCGTACCGCGGGCGT
+CGCCACCCGCGTGGTCGGAGCGTTCTTCGACGCGATCGCCGCGGGAATCGCCACCGGAGACATCAGGTTA
+ACCGATGACGTTGCGCCGCAGCCGATGTCATCGGACTTCGAAAAGATCCGGCAGGAGTTCGGCTTTCCCG
+GCGACGATCGTGTCGTCACAAAGTGCTTTCTGCTCTGGGCGGGCGTGGTGGGCGCGATCAGCCTGGAGGT
+ATTCGGTCAGTACGGGGCCGACATGCTAACCGATCCAGGAGTGGTTTTCGATGCCCAGACACGGCTGCTG
+GTGGCCGTGCTGGCCGAGCATTGAAGCTGCTGCAATCGGCGTGTCCAGCCGGAATTAGAACGTGTTCACT
+CAAGGCTACCAGTGCTGACACTTGCGGTGGTGGCAAATGCAATCTGAGCCCTTTCTGGCCTCTGGCAAGC
+TGGGCTGTCCTGCGAGACGCTCATCCTTCTCGTTCTGTCGCTGATACAGATCGCAGGGGTTACCCCCGGA
+CCTAGAAGCCGCCGAAACGGCTCTCACCGGCTTGTTAGGCGTCCGGAAGCGGATTCGGATGCGCGATGTC
+CGCTTTGCGCACGACACCTGTAGCAGTCTGGGCAAGCCCGCGATGTCGTCGCGAGTATCTCGTTGAGCTA
+TCTCGGAGAGATGCCCTTCGAGTTAGTATCGTCGGTTCGTGTAGAGAATATCTATAGTGACTTTTGCGGG
+ACTGTGGGCCGGGTCTACACCAGGGGCTCGAAGCCGCATTGGCCGAAGCAAGCGGAGGTGCAAGTGCCGA
+CATGAGCGGCGCCAATGAGCCGCGCCGGCGACGATGCAGTGGGGGTACCGCCCGCTTGCGGGGGACGAAG
+CGATGACGAGGAGCGGCGCCAATGAGCCGCGCCGGCGACGATGCAGTGGGGGTACCGCCCGCTTGCGGGG
+GACGAAGCGATGACGAGGAGCGGCGCCAATGAGCACCGACATACCCGCCACCGTTAGTGCGGAGACCGTG
+ACGTCCTGGTCGGATGACGTCGATGTAACGGTGATTGGTTTCGGCATCGCCGGCGGTTGCGCGGCGGTCA
+GCGCGGCCGCCGCCGGCGCCCGGGTACTGGTGCTCGAACGTGCCGCCGCGGCGGGCGGCACCACCGCGCT
+TGCCGGGGGGCACTTCTACCTGGGGGGCGGAACCACGGTGCAGCTGGCGACCGGTCATCCCGATTCACCC
+GAGGAGATGTACAAGTACCTGGTCGCGGTCTCCCGAGAGCCCGATCACGACAAGATTCGCGCCTATTGCG
+ACGGCAGCGTCGAGCATTTCAACTGGTTGGAGGGCCTGGGTTTTCAGTTCGAGCGTAGTTACTTTCCCGG
+CAAGGCTGTGATTCAACCCAACACCGAGGGCTTGATGTTCACCGGAAATGAGAAGGTGTGGCCATTCCTG
+GAGTTGGCGGTGCCGGCACCGCGCGGGCACAAGGTACCCGTGCCGGGCGACACCGGCGGTGCCGCCATGG
+TGATCGACCTGCTGCTCAAGCGAGCCGCAAGCCTGGGGATACAGATCCGCTACGAGACGGGCGCCACCGA
+GCTCATCGTGGACGGGACCGGCAAGGTAACCGGGGTGATGTGGAAGCGGTTCTCCGAAACCGGTGCAATC
+AAAGCGAAGTCGGTAATCATCGCGGCCGGCGGATTCGTGATGAACCCGGACATGGTGGCCAAATACACTC
+CGAAACTGGCCGAGAAGCCGTTCGTGCTGGGCAACACCTACGACGACGGGTTGGGCATCCGGCTGGGTGT
+ATCAGCCGGCGGCGCCACCCAACACATGGACCAGATGTTCATCACGGCTCCGCCGTACCCGCCGTCGATC
+TTGCTCACCGGCATCATCGTCAACAAACTCGGACAGCGGTTCGTCGCCGAGGACTCCTACCATTCCAGGA
+CCGCTGGGTTCATCATGGAACAGCCAGACAGCGCGGCGTATTTGATCGTCGACGAAGCCCACCTGGAGCA
+CCCCAAGATGCCGCTAGTCCCGTTGATCGACGGCTGGGAAACGGTTGTGGAAATGGAAGCCGCGCTTGGC
+ATTCCACCGGGCAACCTGGCGGCGACGCTGGACCGCTACAACGCCTACGCCGCGCGCGGCGCAGATCCCG
+ATTTCCACAAGCAGCCGGAATTCCTTGCAGCACAAGACAACGGGCCGTGGGGGGCGTTCGACATGTCGCT
+GGGCAAGGCGATGTATGCCGGATTCACTCTGGGCGGGCTGGCCACGTCGGTGGACGGTCAAGTACTGCGC
+GACGACGGCGCGGTGGTGGCCGGCCTGTACGCGGTCGGGGCATGCGCGTCCAATATCGCCCAGGACGGCA
+AGGGATATGCCAGCGGGACCCAGCTGGGTGAGGGGTCGTTTTTCGGGCGTCGCGCCGGAGCGCATGCGGC
+AGCCCGAGCGCAGGGCATGTAAGCCTCCTCGCGCCGCGACTGGGAATCCTGCGACGCGACACGCCGACAA
+GGCGTCGTGAGATTCACAGTCGCAGCGCGGCTTCAGGTAAGACGCCGGGAGCGCGGTAGCCGGCCTCCCG
+GCTACGGTAACCCGTTCATCCCGTTCTTACCCAACAGCCCGCCGGCACCGCCGGTGCCCGCGCTGCCGTT
+AGGTGTGCCACTCCCGGCGTTGCCGCCGTTGCCGCCGTTGCCGACCAGGATGGCACCGCCGCCAGCGCCG
+CCGTCACCGCCCTTGGCACCGGTGCCGTTTCCTCCGGCGCCGCCGTCACCGCCGTCGCCGATCAGCCCGG
+CTTTGCCGCCGAGCCCACCGGCGCCCCCGGCACCGCCGAAGCCGAATCCGCCGGCGCCGCCGGCGCCGCC
+GGCACCAAACAGCAGGCCCGCAGTGCCGCCGTTTCCGCCGGCGCCGCCCACCCCGGTAGCGCCACCGCCG
+AGTGCGCCGGCGCCGCCGGCCCCGCCGGCGCCTACCAGCAGGCCGGCGTTGCCGCCCGCCCCGCCGGCAC
+CGCCGGTAGTGGACCCGACCCCACCCGCGCCGCCGGCACCGCCGTCGCCCCAGAGCAGGGCGGACCCGCC
+GGACCCCCCGGCACCGCCGTTCCCGACCAATCCGATTCCGCCGGCGCCGCCGGCCCCACCGACGCCGAAC
+AGCCCACCGGCCCCGCCGGCACCACCGGGCCCGCCGGGGGCGGTGCCCAGGAATGCCACACCGTCACCGC
+CAACACCGCCCACCCCGCCGGCGCCGAACAGGAGCCCGCCATTGCCGCCGGCCCCGCCGGCACCGCCGGT
+GACATTAGTGCCGGTGCCGCCGGCCCCGCCGGCACCGCCCACGCCGAAGAACAACCCGCCGTCTCCGCCG
+GCCCCGCCGTCACCGGCGTCGGCCGCGAGTCCGCCGACGCTGCCGGCCCCGCCGGCGCCGAACAGCAGCC
+CGCCATTGCCGCCGGCCCCGCCGGCCCCACCAATACCGCCCACCCCACCACCGGCGCGTCCGCCGGCGCC
+GCCGGCCCCGCCGGCGCCGTAGAGCAGCCCGCCGGCCCCGCCGGCCCCGCCGAACCCTGCGGTGCCGGAC
+GCTACGTTCCCCCCGGCGCCGCCGGCCCCGCCGTTGCCGAACAGGCCAGCGGCTCCGCCGTTGCCCCCGG
+GCATGCCGGCCGCGCCGGAGCCGCCGGCCCCGCCGTTGCCGATCAAGATTCCGCCGTCGCCGCCGTTTGC
+CCCGGTCCCCGGGGCCCCGTTGGCTCCGTTACCGATCAGTGGGCGCCCCAACAGCGCCAGGGCGGGGGCG
+TTGATCACGTCGAGCACACCCTCTAGCGGGGCCGCGCTGGCGGCCTCGGCGGCCGCATACGAGCCCGCCC
+CGGCGGTGAGCGCCCGCACGAACTGCTCGTGAAACAGCGCCGCCTGGGCGCTCAGCGCCTGATAGGCCTG
+GGCGTGTCCGGAGAACAATGCCGCCATCGCCGCCGACACCTCATCGGCGGCGGCGGCCAACACCGTCGTG
+GTCGGGACCGCGGCGGCCGCGTTGGCGGTGCCGATCGTCGACCCGATACCCGCCAAATCGGTCGCCACCG
+CCGCTAGCGCCTCCGGGATCGTGACCACAAATGACATCTGGCGCCTCGTCAACACCCTGTGGCCCCGGCG
+CGGGGCCGCTACCGATCGCCTGGTCACTCCCCAGAGATCGACGGATTCAGCGTATCGCGATCACGGAAGC
+GGCCACGCCGATTTGGGAAGCTCGTCCCGGCTTACACTTCGGCGGGCGCCGCCTCGACTGGGGCCAGCCG
+CCATTGGCCGCCACCGAGTAGTTCGAGCTGGTTTTCGTGCAGCCGCTCGAGGGCGGGGCGATGGCTGACG
+CTGACCACGATGCAGTCCGGCAGCTCGCTGCGCAGCAATTGGTAGAGCGCAAACTCCAGCCCGGTGTCCA
+GCGCCGAGGTACTTTCGTCGAGGAAGACCGCCTTGGGTTTGGTGAGCAGGATGCGAGCAAAGGCAACACG
+TTGCTGCTCACCGGGGGAGAGCACCTTGGCCCAGTCGCGTTCCTCGTCCAGCCGGTCACACAGTGGGGCC
+AGCGCCACCTTGGTCAGCGTGTCCCGCAGGGTGGCGTCGGGGATGGCGGCCGCAGAGTTGGGGTAGCACA
+CCACGTCACGCAGCGTCCCCAGCGGCACATACGGCAACTGCGACAAGAACATCGTCTCGTTCTCGCCGCC
+CGGCCGGTGCAGGGTCCCCGATGCGTAGGGCCACAGTTCCGCCAGACTGCGCAGCAGCGTGGTCTTGCCG
+GCCCCAGAACGCCCGGTGATCACCAGCGAGCCTCCGCGGTCCAGCCGCACATCGAGCGGGTCGATCAACC
+GATCGCCGGCAGGCGTACGCACCTCGATGTCGTTGAGCTCGACGGACTCGTCGTCGCTCGGTCGGGTCAG
+GACCGCGGGCAGGGCGCGGCCTTTCTCGTTGGCGTCGACCAGCCCATGCAATCGGATGATTGCTGCGCGG
+AAGGACGCAAACGCGTCGTAGTTGTTGCGGAAGAACGACAACGAGTCGTGAATGTTGCCGAAGGAAGTCG
+CCGTCTGCCCGACATCGCCGAAGTCGATCTGCCCGGCGAATAATCGAGGCGCCTGGATGACCCACGGCAA
+CGGAACAATTGTCTGGCTCACCGACAGATTCCATCCATTGAATGCGATGCTGCGCCGAACGTAGCGACGG
+TAATTGTCGATCACCGGCGTGAACCGCCGCTGTAGCTGGGTACCTTCCACCCGCTCGCCGCGGTAGAAAC
+CCACCGCCTCGGCGGCGTCGCGTAGCCGAACCAGCGCGTAACGGAAAGCGGCATTGAGCTTTTCATTGCG
+GAAGCTGAGCCAGATCAGGGGCCGCCCGATGATGAACGAGATGACCGTGGCCACGAACACATAGACCAGC
+ACGGTCCAGAACATTGCGCGCGGGATGGACACGCCGAAGATATTCAGGGTGCCCGAGAGATTCCACAGGA
+TCGCTGTGAAAGAAATCACCGAAATGATCGACTGCACGGCCCCGAAAAGCAGCGTGCTGGCCGTCCCGTT
+GGAGGGAGCATTCGGAGTGCCGCCTGCCCCGGCGGTGAAGATATCGACGTCTTGCTGAATGCGCTGGTCG
+GGGTTGTCGATCGTTTCGTCGATGAACAGGTCTCGGTAGTAGGCCCTGCCGTCGAGCCAGTCTTGTGTGA
+GGTGGTGGGTTAGCCAGACCCTCCAGGCGATGATGAAGCGCTGCGTCAAGTAGATGTCGGCCATGACCCG
+GGTCACGTGCAGCACGGCCATCACGCTGAAAACCCCGATCGACATCCAAAATCCTCGCGCGCCTGAGCGT
+TTGACCGTGCCATCGCCAGAGGCGATGCCCTCGAAGGCCTTCTGCAAGGCCGTGTACATGTCGTTGCCTT
+GGTAGCTGAATAGCACATTCAGGCGCACTGCCAGCACTACCGAAAGCAACAACACGCCGAGCATCAGCCA
+CACGCGAACGCTGTTGGGGCCAACGAAGTATGCGCGGGTGATCCGCCAGAACTGCCGGCCCCAGGGCGTC
+AAATACCTGAGCAGAACCAATATCGCGAGCACACAGATGGCACTGATCGTCCAGGCTTTGCCGACCCAAT
+ACACGGAATCCGGGAATGCTCTAGACCAATCGATGGACGGCTTAAACAATTTCGGGCCCAAGGTCGACGT
+CTCCTCACAAACAGAAATCCTTCGGGCGAAGGTACCCGAAGGTTGTCGATAGGCTGCCGATATGAGCACC
+GACACCGCCCCGGCCCAGACCATGCATGCTGGCCGGCTTATCGCGCGCCGACTTAAAGCCAGTGGTATCG
+ACACGGTCTTCACGTTGTCGGGCGGCCACCTGTTTTCCATCTACGACGGCTGCCGTGAGGAGGGCATCCG
+CCTGATCGACACCCGCCACGAACAAACCGCCGCCTTTGCCGCCGAAGGCTGGTCGAAGGTGACCAGGGTG
+CCGGGCGTGGCCGCGCTCACCGCGGGGCCAGGGATCACCAACGGGATGAGCGCGATGGCGGCGGCCCAGC
+AGAACCAGTCACCACTGGTGGTGCTCGGCGGCCGGGCGCCGGCGCTGCGCTGGGGTATGGGCTCCCTGCA
+GGAGATCGATCACGTGCCGTTTGTGGCGCCGGTGGCCCGCTTCGCCGCTACAGCGCAGTCAGCCGAGAAC
+GCGGGCCTGCTGGTCGATCAGGCGTTGCAGGCGGCGGTGAGTGCGCCGTCGGGTGTGGCATTCGTCGACT
+TCCCGATGGATCACGCGTTCTCCATGTCCTCAGACAATGGCCGCCCCGGCGCGCTCACCGAGCTACCGGC
+CGGTCCCACCCCAGCCGGCGACGCCCTGGACCGGGCGGCGGGCCTGCTTTCGACGGCCCAGCGTCCGGTC
+ATCATGGCAGGTACCAACGTCTGGTGGGGCCATGCGGAGGCGGCATTGCTGCGTCTTGTCGAGGAACGGC
+ACATTCCGGTGCTGATGAACGGGATGGCGCGCGGCGTGGTGCCCGCCGATCACCGGTTGGCCTTCTCACG
+GGCGCGGTCAAAAGCGCTGGGGGAGGCTGATGTCGCGCTGATCGTCGGTGTGCCGATGGATTTCCGTCTG
+GGCTTCGGTGGGGTATTCGGGTCGACAACGCAGCTCATCGTGGCAGACCGCGTCGAACCCGCACGCGAAC
+ATCCGCGACCAGTCGCGGCGGGGCTCTATGGGGATCTGACCGCCACCCTTTCGGCGCTGGCCGGATCTGG
+CGGCACCGACCACCAGGGCTGGATCGAGGAGCTCGCGACGGCCGAGACCATGGCGCGTGATCTCGAGAAG
+GCCGAGCTGGTCGATGACCGGATCCCATTGCATCCGATGCGGGTGTACGCCGAGCTGGCCGCGCTGCTGG
+AGCGGGATGCTCTAGTCGTTATCGATGCGGGCGATTTCGGGTCGTACGCCGGCCGGATGATCGACAGCTA
+TCTGCCAGGCTGTTGGCTGGACAGCGGTCCGTTTGGCTGCCTGGGGTCGGGTCCCGGCTACGCCCTGGCT
+GCCAAACTGGCGCGGCCGCAGCGCCAGGTCGTGCTCTTGCAGGGCGACGGCGCGTTCGGGTTCAGCGGCA
+TGGAATGGGACACGCTGGTTCGGCACAACGTGGCGGTCGTGTCAGTGATCGGCAACAACGGCATCTGGGG
+TTTGGAGAAGCACCCGATGGAAGCGTTGTACGGCTATTCGGTGGTGGCCGAACTGCGCCCGGGAACCCGC
+TACGACGAGGTGGTGCGCGCACTGGGCGGCCACGGCGAGCTGGTGTCGGTGCCCGCTGAACTTCGGCCGG
+CGCTGGAACGGGCCTTTGCCAGTGGCCTGCCCGCTGTGGTCAACGTGCTCACCGACCCAAGCGTGGCTTA
+TCCACGCCGATCCAACCTGGCTTGACGTCCAGCCGGGCCGTGAACGTGCACGGTTGTCCACGAATTGCGG
+CCTGTCGGTGTACAGACACGCACCCTCGCGGCCGGCCGGCATTCGCGTACCGTTGGTTTGTGCCCAAGAC
+CACCCGCGCTCAACCCGGCCGGCTGAGCAGCCGATTCTGGCGATTGCTCGGCGCCAGCACCGAAAAGAAC
+CGGAGCCGCTCCCTGGCGGATGTAACCGCTTCGGCAGAATACGACAAGGAAGCTGCCGATCTGTCCGACG
+AGAAGCTGCGTAAGGCGGCAGGCCTGCTCAACCTCGACGACCTCGCGGAGTCCGCCGATATCCCGCAGTT
+TCTCGCGATTGCCCGGGAAGCCGCCGAGCGGAGGACCGGGCTGCGACCATTTGATGTGCAGTTGCTTGGC
+GCGTTGCGCATGCTCGCCGGAGACGTGATCGAGATGGCCACCGGTGAGGGCAAAACCCTTGCCGGGGCGA
+TCGCGGCCGCCGGTTATGCGCTGGCCGGCCGGCACGTGCACGTCGTGACGATTAACGATTACCTGGCCCG
+CCGCGATGCGGAGTGGATGGGCCCGCTGCTGGACGCGATGGGCCTGACGGTCGGCTGGATCACCGCGGAC
+TCGACCCCTGACGAGCGCCGGACCGCATATGACCGTGATGTCACCTATGCCTCGGTCAACGAGATTGGCT
+TCGATGTACTGCGCGATCAGTTGGTGACTGATGTCAATGACCTGGTATCGCCCAATCCAGACGTGGCTCT
+CATCGACGAAGCCGACTCCGTGCTGGTCGACGAGGCGCTGGTGCCCCTGGTGCTGGCCGGAACCACACAT
+CGTGAGACGCCGCGGCTGGAGATCATCCGGCTGGTCGCTGAGCTTGTTGGCGACAAGGACGCCGACGAGT
+ACTTTGCCACCGATTCCGATAACCGCAATGTCCACTTGACCGAGCACGGGGCACGCAAAGTCGAGAAAGC
+GCTCGGTGGCATCGACCTGTACTCCGAGGAGCACGTCGGCACCACACTGACTGAGGTCAATGTCGCGCTG
+CACGCGCATGTGCTCCTGCAACGCGACGTGCACTACATCGTCCGCGACGACGCGGTGCACCTGATCAACG
+CGTCGCGTGGCCGTATCGCGCAACTGCAGCGCTGGCCGGACGGGTTGCAAGCTGCGGTCGAGGCCAAGGA
+AGGTATCGAGACCACGGAAACTGGGGAAGTGCTCGACACCATCACGGTGCAGGCCCTGATCAACCGGTAT
+GCGACTGTGTGCGGAATGACGGGAACCGCGCTGGCCGCCGGTGAGCAGCTACGGCAGTTCTACCAGCTCG
+GTGTCTCACCGATACCACCGAACAAGCCAAACATCCGCGAGGACGAGGCCGACCGGGTCTACATCACCAC
+TGCAGCCAAGAACGACGGGATCGTCGAGCACATCACCGAGGTGCACCAGAGGGGGCAGCCTGTGCTGGTC
+GGTACCCGCGACGTGGCCGAATCCGAGGAACTGCACGAACGCCTGGTGCGCCGCGGTGTGCCCGCCGTGG
+TGCTCAACGCGAAGAACGACGCCGAGGAGGCCCGGGTCATCGCCGAGGCCGGCAAATACGGCGCGGTCAC
+GGTGTCAACTCAAATGGCCGGGCGCGGCACCGACATCAGGCTCGGCGGGTCCGACGAAGCTGACCACGAC
+AGGGTCGCGGAATTGGGCGGCCTGCACGTGGTCGGCACTGGCCGTCACCACACCGAGCGGCTAGACAACC
+AGCTGCGCGGTCGGGCCGGGCGCCAGGGAGATCCCGGGTCGTCGGTGTTTTTCTCAAGCTGGGAAGACGA
+TGTCGTTGCGGCCAACCTCGACCACAACAAGCTGCCGATGGCAACCGACGAAAATGGCCGGATTGTCAGC
+CCGAGGACGGGTAGTCTGCTCGACCATGCCCAGCGCGTTGCCGAGGGCCGGTTATTGGATGTGCACGCCA
+ACACGTGGCGCTACAACCAGCTGATCGCCCAGCAGCGCGCCATCATCGTCGAACGGCGTAACACGTTGTT
+GCGCACCGTAACCGCGCGTGAGGAACTCGCCGAACTGGCGCCTAAGCGGTACGAGGAGCTGTCCGACAAA
+GTATCCGAGGAACGCCTCGAGACGATTTGTCGGCAGATCATGCTGTATCACCTCGACCGTGGCTGGGCCG
+ATCACCTGGCGTATCTGGCCGACATCCGGGAGAGCATCCATCTACGCGCGCTGGGCCGGCAGAACCCACT
+CGACGAGTTTCACCGGATGGCTGTGGACGCGTTCGCGTCGCTGGCCGCCGACGCCATCGAGGCGGCTCAA
+CAGACGTTCGAAACCGCGAACGTCCTTGACCACGAGCCGGGGCTGGACCTGTCCAAACTGGCCCGGCCGA
+CGTCGACATGGACCTACATGGTCAATGACAACCCACTGTCCGATGACACGCTTTCTGCCCTCAGTCTGCC
+CGGGGTGTTCCGCTGAGCTGCCCAGCGTAAGCGCCGAGCGTAACGCCACTGCGAAATTTCGGGCAGAAAA
+TCGCAGTGGCGTTACGCTCGCGGCTAGGGGTGCCCCCACAGCCCGCCGTTTCGGCGCGCATCGTCGCCAG
+GCTAGATCCGATTGCCCGGCTCCTCAGCCCGCCGTTTCGGCGCGCATCGTCGCCAGGCTAAGGTCACGGC
+TCATGGAGCCGGTGCTCACGCAGAATCGGGTGCTGACTGTCCCCAACATGTTGAGCGTTATTCGCCTCGC
+GCTCATCCCAGCATTCGTCTACGTCGTGCTCAGCGCGCACGCCAATGGCTGGGGGGTAGCGATCCTGGTG
+TTCAGTGGCGTTTCGGACTGGGCTGATGGCAAGATTGCACGGCTACTAAACCAGTCATCGCGGCTGGGCG
+CGCTGCTGGACCCGGCCGTTGATCGCCTCTACATGGTCACTGTTCCTATCGTGTTTGGCCTGAGCGGCAT
+CGTGCCGTGGTGGTTTGTCCTTACGTTGCTGACCCGCGATGCGCTGCTGGCTGGGACGCTGCCGCTGCTA
+TGGAGCCGTGGACTGTCAGCGCTACCGGTGACCTACGTCGGTAAGGCAGCGACTTTCGGCTTCATGGTTG
+GCTTTCCGACCATTCTGTTGGGGCAATGCGATCCATTGTGGAGCCATGTGCTGCTGGCCTGTGGTTGGGC
+ATTCTTGATCTGGGGTATGTATGCCTACTTGTGGGCCTTCGTGCTGTATGCAGTGCAGATGACGATGGTG
+GTGCGGCAGATGCCTAAGCTCAAGGGCAGGGCTCATCGGCCGGCGGCCCAGAACGCTGGTGAACGTGGCT
+GAGTCTGACCGGCTGCTCGGCGGCTACGACCCCAACGCCGGCTACAGCGCCCACGCAGGGGCGCAGCCAC
+AACGCATCCCGGTTCCGTCGTTGCTGCGCGCGCTGCTATCAGAGCATCTGGATGCTGGATACGCGGCGGT
+TGCCGCCGAGCGCGAGCGTGCTGCGGCACCACGGTGTTGGCAAGCCCGCGCCGTCAGCTGGATGTGGCAG
+GCATTGGCCGCGACCCTAGTCGCCGCCGTGTTCGCTGCCGCGGTAGCGCAGGCGCGCTCGGTGGCACCCG
+GCGTGCGCGCCGCCCAACAGTTGCTCGTTGCGAGTGTGCGATCAACCCAGGCCGCCGCGACCACGTTGGC
+TCAACGGCGCAGCACACTCTCGGCGAAAGTCGACGACGTGCGGCGGATCGTACTCGCAGACGACGCCGAG
+GGACAGCGGCTGCTGGCCCGTCTCGACGTGCTTAGCCTGGCCGCGGCCAGCGCACCGGTTGTCGGGCCTG
+GTCTGACGGTGACCGTGACCGATCCCGGTGCGAGCCCTAATCTTTCCGACGTGTCCAAGCAGCGGGTCAG
+CGGTAGCCAGCAAATCATCCTCGACCGCGATTTGCAGCTCGTCGTCAACTCACTGTGGGAAAGTGGCGCC
+GAGGCCATCTCGATCGATGGCGTCCGGATCGGGCCGAACGTCACGATCCGGCAAGCCGGCGGAGCAATCT
+TGGTCGACAATAATCCCACGAGTAGTCCCTACACCATCTTGGCGGTCGGGCCGCCACATGCCATGCAGGA
+CGTCTTCGATCGCAGCGCCGGGCTGTACCGCCTGCGGCTGCTGGAGACCTCCTACGGTGTCGGCGTCAGT
+GTGAACGTCGGCGACGGTCTGGCATTGCCTGCCGGTGCGACCCGGGATGTCAAGTTCGCCAAACAGATTG
+GGCCCTAGTGAGAGAAGTCCTGGTGAATAGGAAACCATGGGGAGCGATACGGCCTGGAGTCCGGCGCGCA
+TGATCGGGATCGCGGCGCTCGCCGTTGGAATCGTGCTGGGTTTGGTTTTCCATCCCGGCGTGCCAGAGGT
+CATCCAGCCGTATCTGCCGATCGCGGTGGTCGCCGCGCTCGACGCGGTGTTCGGTGGCTTGCGCGCCTAT
+CTCGAGCGGATCTTTGACCCGAAGGTCTTCGTGGTTTCGTTCGTGTTCAACGTTTTGGTGGCTGCCCTAA
+TCGTCTATGTCGGTGACCAACTGGGCGTCGGCACACAGTTGTCCACCGCGATCATCGTCGTGCTGGGCAT
+CCGCATCTTCGGCAACACCGCGGCCTTGCGGCGGCGGTTGTTCGGAGCGTGACGGAGATGAGATCACCGT
+GAGTGAGAATCGCCCAGAACCCGTGGCAGCCGAGACTTCCGCCGCCACAACTGCGCGTCACTCCCAAGCC
+GACGCGGGCGCTCACGACGCCGTGCGACGTGGTCGTCACGAACTACCAGCCGACCATCCGCGCTCCAAGG
+TCGGACCGCTGCGGCGGACAAGATTGACCGAAATACTGCGGGGTGGTCGCTCGCGTCTGGTGTTCGGGAC
+GCTTGCGATCTTGTTGTGCTTGGTTCTGGGGGTTGCCATAGTCACTCAGGTCCGTCAGACCGACTCCGGT
+GATTCATTGGAAACAGCCCGTCCTGCAGACCTATTGGTGTTGTTGGATTCGTTGCGGCAACGCGAGGCCA
+CGTTGAACGCCGAAGTGATCGACCTTCAGAACACGCTGAACGCGTTGCAGGCATCCGGCAACACCGATCA
+GGCAGCGTTAGAAAGCGCCCAGGCTAGATTGGCCGCGTTGTCCATCCTGGTCGGCGCCGTGGGTGCCACC
+GGGCCGGGCGTCATGATAACGATCGACGATCCGGGACCCGGAGTAGCGCCTGAGGTGATGATCGACGTGA
+TCAACGAACTGCGTGCCGCTGGAGCCGAGGCGATCCAGATCAACGATGCACACCGGTCGGTGCGGGTCGG
+GGTTGACACCTGGGTTGTCGGTGTGCCCGGCTCACTGACAGTCGACACCAAGGTCCTGTCCCCGCCGTAT
+TCGATTCTGGCGATTGGTGATCCTCCAACGCTGGCCGCGGCGATGAACATTCCTGGTGGTGCACAGGACG
+GTGTCAAACGCGTCGGCGGGCGGATGGTTGTGCAGCAGGCCGACCGTGTGGACGTGACCGCCTTGCGGCA
+ACCAAAACAGCACCAATACGCTCAGCCCGTCAAGTGAACTAGCCCAACTCCGAGCCGACCAGAATAGGAT
+TACCGTGAGCGATATCCCGTCCGATCTGCACTACACCGCCGAACACGAGTGGATTCGCCGCAGTGGCGAC
+GACACCGTCCGGGTGGGGATCACCGACTATGCACAGTCGGCGCTTGGCGACGTCGTTTTCGTTCAGCTAC
+CCGTTATCGGCACCGCGGTCACCGCCGGCGAGACCTTCGGCGAAGTGGAATCGACGAAATCTGTGTCGGA
+TCTCTATGCGCCCATTTCGGGTAAGGTGTCTGCGGTCAACAGCGATCTGGACGGCACTCCGCAATTGGTG
+AATTCCGACCCCTACGGAGCCGGCTGGCTGCTGGACATCCAGGTCGACAGCTCGGATGTCGCTGCCCTGG
+AGTCAGCTTTGACGACACTGCTCGACGCTGAGGCCTACCGCGGCACACTGACCGAGTGACGATTGCTAAG
+GTCCCTGCCAGCGTCACGTGGGAGGTCGCGGGTCTGCACGGATCCGGGCCGGGCAGGGCAATCGAGCCTG
+GGATCCGCTGGGGTGCGCACATCGCGGACCCGTGCGCGGTACGGTCGAGACAGCGGCACGAGAAAGTAGT
+AAGGGCGATAATAGGCGGTAAAGAGTAGCGGGAAGCCGGCCGAACGACTCGGTCAGACAACGCCACAGCG
+GCCAGTGAGGAGCAGCGGGTGACGGACATGAACCCGGATATTGAGAAGGACCAGACCTCCGATGAAGTCA
+CGGTAGAGACGACCTCCGTCTTCCGCGCAGACTTCCTCAGCGAGCTGGACGCTCCTGCGCAAGCGGGTAC
+GGAGAGCGCGGTCTCCGGGGTGGAAGGGCTCCCGCCGGGCTCGGCGTTGCTGGTAGTCAAACGAGGCCCC
+AACGCCGGGTCCCGGTTCCTACTCGACCAAGCCATCACGTCGGCTGGTCGGCATCCCGACAGCGACATAT
+TTCTCGACGACGTGACCGTGAGCCGTCGCCATGCTGAATTCCGGTTGGAAAACAACGAATTCAATGTCGT
+CGATGTCGGGAGTCTCAACGGCACCTACGTCAACCGCGAGCCCGTGGATTCGGCGGTGCTGGCGAACGGC
+GACGAGGTCCAGATCGGCAAGTTCCGGTTGGTGTTCTTGACCGGACCCAAGCAAGGCGAGGATGACGGGA
+GTACCGGGGGCCCGTGAGCGCACCCGATAGCCCCGCGCTGGCCGGGATGTCGATCGGGGCGGTCCTCGAC
+CTGCTACGACCGGATTTTCCTGATGTCACCATCTCCAAGATTCGATTCTTGGAGGCTGAGGGTCTGGTGA
+CGCCCCGGCGGGCCTCATCGGGGTATCGGCGGTTCACCGCATACGACTGCGCACGGCTGCGATTCATTCT
+CACTGCCCAGAGGGACCATTACCTGCCGCTGAAGGTGATCAGGGCCCAGCTGGACGCCCAGCCCGACGGT
+GAGTTGCCACCATTCGGATCTCCTTACGTTCTACCGCGATTGGTGCCCGTAGCCGGCGACAGTGCTGGCG
+GCGTCGGGTCGGACACCGCGTCCGTGTCGCTCACGGGTATCCGGCTCAGTCGGGAAGACCTCCTGGAACG
+ATCGGAAGTGGCCGACGAGCTACTGACGGCCCTGCTCAAAGCCGGTGTGATCACCACCGGGCCGGGCGGC
+TTCTTCGACGAACACGCCGTCGTGATCCTGCAATGCGCACGAGCGCTGGCCGAATACGGCGTCGAGCCGC
+GGCATCTACGCGCCTTCCGCTCCGCGGCCGACCGGCAGTCCGACCTGATTGCCCAGATTGCCGGCCCGCT
+CGTCAAGGCCGGCAAGGCCGGTGCCCGCGACCGGGCCGACGACTTGGCCCGTGAGGTGGCCGCGCTTGCT
+ATAACTTTGCACACGTCGCTGATCAAGTCTGCGGTTCGCGACGTTCTTCACCGCTGAGGACTAGACTTCG
+TTCGACAGCTTGGTGTTCGACGTCACGGTAGAGACGTGGCGCCCACCGCGTCGTCGCACCGAGCGTGAGT
+CGGACACCGGTTGCATGTGCGGAGGGCAGACGCAGATGGGTGAAGTTCGTGTTGTCGGCATTCGCGTCGA
+GCAGCCGCAGAACCAGCCGGTGCTGTTATTGCGCGAGGCCAACGGTGATCGATACCTGCCGATCTGGATC
+GGCCAGTCGGAGGCTGCCGCTATCGCGCTGGAGCAGCAAGGCGTCGAGCCGCCACGTCCGCTGACCCATG
+ATCTGATCAGGGATCTCATTGCTGCGCTGGGGCATTCGCTCAAAGAGGTGCGCATTGTAGACCTGCAGGA
+AGGAACTTTCTACGCTGATCTGATCTTCGACTGCAATATCAAGGTGTCCGCCCGTCCCTCGGACTCGGTG
+GCAATCGCATTGCGAGTGGGTGTTCCGATCTACGTCGAGGAGGCCGTACTAGCCCAGGCCGGTCTGCTGA
+TTCCCGACGAAAGTGACGAGGAGGCCACCACCGCTGTTCGCGAGGACGAGGTGGAGAAATTCAAAGAGTT
+TCTCGACAGTGTGTCACCTGACGATTTCAAGGCCACCTAGCGCGGCGACGATGCGCGCCGGGACGGCGGG
+CTGAGGAGGCGCGCGATAAGGCCGAGCGCGGCGACGATGCGCGCCGCGACGGCGAGCATCCATTATTTGC
+CGGCCAGCAACGTCACGGCTGCGTCTCATCTCTGGCTGCAATTGTCGACACGCCTAGCGGTTAGTGCCTA
+ATGCGCCCGGCGACCGCGATACTTTGATCACGACTTGATAGTTAACCGGGAGCATCGCGCCCATCGAACA
+GCGTATGCTCTCTAACACTCGGGCCCTCAGTAATGGCTGTCGGGGGAGCCAGTGACGCAGCTAGTGACAA
+GAGCGCGATCGGCGAGAGGAAGCACCTTGGGCGAGCAGCCACGTCAAGACCAGCTCGACTTTGCTGACCA
+CACGGGCACTGCTGGTGATGGTAACGACGGCGCCGCTGCGGCCAGCGGACCCGTGCAGCCCGGCCTGTTC
+CCCGACGATTCCGTTCCTGACGAGTTGGTAGGTTATCGCGGACCGAGCGCCTGCCAGATCGCTGGGATCA
+CCTACCGCCAGCTCGACTACTGGGCGCGCACATCGTTGGTTGTGCCGTCGATCCGTAGTGCGGCAGGATC
+CGGCAGCCAGCGGCTGTACTCGTTCAAGGACATCTTGGTTCTCAAGATCGTCAAACGGTTGCTCGACACC
+GGTATCTCGCTGCACAACATCCGGGTTGCAGTTGACCATCTGCGCCAGCGTGGCGTCCAGGATCTGGCCA
+ACATCACCTTGTTCTCCGATGGGACCACCGTGTACGAGTGCACGTCGGCCGAGGAGGTCGTCGACCTCCT
+GCAGGGCGGCCAGGGTGTGTTCGGCATCGCCGTCTCGGGCGCGATGCGGGAGCTGACGGGTGTTATCGCC
+GACTTCCACGGTGAGCGCGCCGACGGCGGGGAGTCGATTGCTGCCCCCGAAGATGAACTGGCCTCCCGAC
+GCAAGCATCGCGACCGCAAGATCGGCTAGCCGAGAGTTCCCCCGCGAACAGACACAGAATCGCACGCGGC
+AGGCTCCTCGGATGCGATTGTGTGTCTGCTCGGCAGTAGACTGGACAACGCATCGCTCTAGTGCGGGAGA
+GTTCTGTGGCTGCCAGCTACGGACGCCGAAGGAGCAATACCTCTCCGTCAACCTCTCAGGCACCCGGACC
+GCGCGAGACTACGATGCCTCTGGAAAGCGGTGGCGACCCCTGGCGGTCCTCACCCGCCGATGGGGAAAGG
+CGATTCACCTGACGGTGGACAGAGTCGCCGAATCTCTCAGGCGCCTGGCGTGCAGGTGAAGACAGAGGGA
+GAGGGCCGCTAGTCCTCTGCTTTGTCAGGAGTTCACCGTGTCCGACCATTCGACGTTCGCAGACCGGCAC
+ATCGGTCTGGACAGCCAGGCCGTCGCGACCATGCTCGCCGTGATCGGGGTGGATTCGCTCGATGACCTGG
+CAGTCAAGGCGGTCCCGGCGGGCATCCTAGACACACTCACCGACACCGGAGCCGCACCGGGTTTGGACAG
+TCTGCCACCGGCTGCCAGCGAAGCCGAGGCGCTGGCCGAGCTGCGAGCGCTGGCCGACGCTAACACCGTC
+GCCGTGTCGATGATCGGGCAAGGCTACTACGACACACACACCCCCCCGGTGCTGTTGCGCAACATCATCG
+AGAACCCGGCCTGGTATACCGCCTACACGCCGTACCAGCCCGAGATTAGTCAGGGTCGGCTGGAAGCCTT
+GCTGAACTTCCAGACCCTGGTCACCGATCTGACCGGCCTCGAGATCGCGAACGCGTCGATGCTCGACGAG
+GGCACCGCGGCGGCCGAGGCCATGACTTTGATGCACCGCGCGGCCCGCGGGCCGGTGAAGAGGGTGGTCG
+TGGACGCCGACGTGTTCACCCAGACCGCGGCGGTGCTGGCCACCCGCGCCAAGCCGCTGGGTATCGAGAT
+CGTCACGGCCGACCTGCGCGCCGGTCTGCCCGACGGCGAATTTTTCGGCGCCATCGCCCAGCTGCCCGGG
+GCCAGCGGCCGGATCACCGACTGGTCTGCCCTGGTGCAACAGGCCCACGACCGTGGCGCACTGGTGGCCG
+TCGGCGCCGACTTGTTGGCGCTGACGCTGATCGCGCCGCCCGGAGAGATCGGCGCTGACGTCGCCTTTGG
+CACCACACAACGGTTCGGAGTGCCGATGGGGTTTGGCGGCCCGCATGCCGGGTACCTTGCGGTGCACGCC
+AAGCATGCGCGTCAGCTGCCCGGCCGGCTGGTCGGTGTGTCCGTCGACAGTGACGGCACGCCGGCCTATC
+GGTTGGCGCTGCAGACTCGCGAGCAACACATCCGCCGCGACAAGGCCACCAGCAACATCTGCACCGCACA
+AGTGCTGTTGGCGGTGCTTGCCGCGATGTACGCGAGCTACCACGGCGCGGGCGGGCTGACCGCCATCGCA
+CGCCGGGTGCATGCCCACGCCGAGGCTATCGCCGGTGCACTGGGCGATGCGTTGGTGCACGACAAGTACT
+TCGACACGGTGTTGGCCCGGGTGCCCGGTCGTGCCGACGAGGTGCTGGCCAGGGCCAAGGCCAACGGCAT
+CAACCTGTGGCGTGTCGACGCCGACCATGTGTCGGTAGCCTGCGACGAAGCCACCACTGACACCCACGTG
+GCGGTCGTTCTGGACGCGTTCGGTGTAGCGGCCGCCGCACCCGCCCATGCGGACATCGCAACGCGCACAT
+CGGAGTTCCTGACGCATCCAGCGTTCACGCAATACCGCACCGAGACGTCGATGATGCGGTACTTGCGTGC
+GCTGGCGGATAAGGATATTGCCCTCGACCGCAGCATGATTCCGCTCGGCTCGTGCACGATGAAACTCAAC
+GCCGCCGCCGAGATGGAGTCGATTACCTGGCCTGAATTCGGGCGTCAGCATCCATTTGCCCCGGCATCTG
+ATACCGCTGGGCTGCGTCAACTTGTTGCCGACCTACAGAGTTGGCTGGTGCTGATCACCGGTTATGACGC
+GGTGTCGCTGCAACCTAACGCGGGCTCGCAAGGCGAGTATGCGGGCCTATTGGCGATCCACGAGTACCAC
+GCCAGCCGGGGTGAACCGCATCGCGACATCTGCCTGATCCCGTCCAGCGCGCACGGCACCAATGCCGCGT
+CAGCCGCCTTGGCCGGCATGCGCGTGGTGGTGGTGGACTGCCACGACAACGGCGACGTCGACCTCGATGA
+CCTGCGCGCTAAGGTCGGGGAGCATGCCGAGCGGTTGTCGGCGCTAATGATCACCTACCCGTCCACTCAC
+GGCGTGTACGAACACGACATCGCCGAGATCTGCGCTGCCGTGCACGACGCGGGCGGCCAGGTATACGTCG
+ACGGAGCCAACCTCAACGCCCTGGTCGGCCTGGCCCGGCCGGGCAAGTTCGGCGGTGACGTCAGTCACCT
+CAACCTACACAAGACATTCTGCATTCCGCACGGCGGCGGTGGCCCAGGCGTCGGCCCGGTGGCGGTGCGG
+GCGCACCTGGCACCGTTTCTGCCAGGTCACCCCTTCGCCCCCGAGCTGCCCAAGGGCTATCCGGTGTCGT
+CGGCACCATATGGGTCGGCTTCGATTCTTCCGATCACCTGGGCATACATCCGGATGATGGGGGCTGAGGG
+ACTGCGGGCGGCATCGCTGACAGCGATCACGTCGGCTAACTACATTGCGCGCCGCCTTGACGAGTATTAC
+CCGGTGCTGTACACCGGCGAGAACGGCATGGTCGCCCACGAGTGCATCCTGGACTTGCGCGGTATCACTA
+AGTTGACCGGTATCACCGTCGACGATGTTGCAAAACGGCTGGCAGACTATGGTTTTCACGCACCAACGAT
+GAGTTTTCCGGTGGCCGGTACGCTCATGGTGGAGCCCACCGAGAGCGAGAGCCTGGCCGAAGTGGACGCC
+TTCTGCGAGGCCATGATCGGCATCCGCGCCGAGATCGACAAAGTCGGGGCCGGGGAGTGGCCTGTCGACG
+ACAATCCGCTGCGCGGCGCACCGCACACCGCGCAGTGCCTGCTGGCGTCTGATTGGGACCACCCGTATAC
+GCGGGAACAGGCCGCCTACCCGCTCGGCACCGCATTCCGACCCAAGGTTTGGCCCGCGGTACGTCGCATC
+GACGGCGCCTACGGGGATCGCAACCTGGTCTGCTCATGCCCGCCGGTAGAGGCTTTTGCCTAAACGCTCG
+TCGACCGGCCCCCGGTCGAGCTCGAGGCCCGGGTGCTACTGGGTGGGTAGCTGACGTGTCGGCTGCTATG
+GGTCGTTGTCGGGGTTGCGGAGTTTTTCGGGGTGGCGGCAGGTGTTGGTGCGGGGTTGACCGTGGTCGGA
+GGTGGGGTGGGGAGCTATTCGGTGTCGCCACCCGCGCTCCAACAATGCCAGCTGTTGCGGGGTGCTCAGC
+GACAAAGGTTCAGCCGAAGCGCTCAATGATCGCGGCGGCGATCCGGTCGGGGGCGTCCTCCTGGATGAAG
+TGTTTGGCGTTGGGCAGCTCCACCAGGACGTGGTCGGGAAATGTCGCACTCAGTCTGGGGATAATCGTTT
+TCGGCCTGAATGCGACATCCTTCATCCCCCAAATCAACAGGGTGGGCTTGGTGCCCAGCGTGGCTGGCAC
+CTCCCGGGCGAGCCGTGCCAGCAGGGGACGGGCGGCCAGGATCTGTTTGGGCATCTCGGCTACGCCTCGG
+CGTGCCGCGGCGTTGGGCTGCACCGCCCGGTAGTGCGCCATCACCGCGCTACTCGGCCGGTGCTCGGTTC
+CCGCGGGTATCAAGCGCTCGACAAAGAAGTTGCGCCGTAAGATCGCGTACTGCACTGGCGGGCTGGACAT
+CACCCTGCTGAAGGCCTTCATCGCCAGCGTGTCCGCCGGCCAGAACCACGTGTTGCCCAACACGACGCCG
+CGGACCCGGTCGGCACGCTCGACAGCGACCGCCATGCTGATCGGGCCACCCCAGTCCTGACCCATGCTCA
+GGTAGCGGTCCAGGCCCAGGTGATCGACGAATTCGCCGATCACCCGCGCGTGCTCGTCGATCTGGTACCC
+GAATCCCGAGGGACGCTCCGATAACCCGAAACCCAGATAATCCGGAGCCACACAACGGAAACGGTCCCGC
+AGTGCGACGATGATGTCCCGATACAGGAAACTCCACGTCGGGTTGCCGTGACACAACAGGATCGGCGGAC
+CCGTGCCCTCGTCGACGTAGTGGATGCGTCCACGCGAGCTGTCGAACCAGCGCGACTCGAACGGGTACAG
+CTGCGGATCCGGCGTGAAATCGATGCTCATTACCCTCCTCCGATCGCGCTCATGATGGTATGCCCGAAGG
+GTGACATCACCGAGTGTCCGGGAGTGGCGTGACGGTGGCCGCTGGCTGCCGACGGCTGTCGGAAAGGTGT
+TCGTCCGGTCGGGGCCGGGCGACACGCCAACAATGCTCCTGCTGCATGGCTATCCGTCCAGTTCGTTCGA
+CTTCCGGGCGGTGATTCCACACCTGACCGGCCAGGCTTGGGTAACGATGGATTTTCTGGGCTTTGGCTTG
+TCCGACAAGCCGCGCCCGCACCGGTACAGCCTGCTGGAGCAGGCCCACCTGGTGGAAACGGTGGTCGCCC
+ACACCGTGACCGGCGCGGTCGTCGTGCTGGCCCACGACATGGGCACGTCGGTGACCACCGAGCTGCTAGC
+CCGTGATTTGGACGGCCGGTTGCCGTTCGATCTCCGACGTGCGGTGCTGAGCAACGGCAGTGTGATCTTG
+GAGCGGGCCAGCCTGCGTCCGATCCAGAAAGTACTGCGCAGCCCGCTTGGTCCGGTCGCTGCCCGGCTGG
+TCAGCCGCGGTGGCTTCACACGAGGGTTTGGCCGGATCTTCTCCCCAGCGCACCCGCTGTCGGCGCAGGA
+GGCCCAAGCCCAGTGGGAGTTGCTGTGCTACAACGACGGCAACCGGATCCCGCACCTGCTGATCAGCTAC
+CTCGACGAGCGGATACGGCACGCGCAGCGCTGGCATGGCGCGGTCCGCGATTGGCCCAAACCGCTTGGGT
+TCGTGTGGGGACTCGACGATCCGGTGGCAACAACCAACGTGCTCAATGGACTACGGGAATTGCGCCCCAG
+CGCCGCCGTCGTGGAACTGCCAGGGTTGGGCCACTACCCGCAGGCCGAGGCTCCCAAAGCATATGCCGAG
+GCCGCGCTATCGCTGCTCGTCGACTAGCCGGCTACGGCTGTATCACGGGCAGATCGATGCGAGAGGCATG
+CATCCGGCTACGGTAGACGCGCACGGTCGGTGCGCAACCGGGAAGGATGGCGAAGTGGCTTGCGTCCGCG
+CCGGCGATGGCGATGCGGATGCGGTGCCCCGGTTGGAACAGATACGACGTCGGCAGCAGGTCGAATGTCA
+GCCGGGCAATCTCGCCCGGGACTAGGGGCCACGCGTCCCCGCTCGCGAACGTTCGGTAGGGGACCACCTG
+GCGGTACGGCGGCGGCCCGTCGCTGAGCCGGCGGTGGATGGCGCGTAGCTGGCCCTCGGTGATGTAGGCG
+ACACGGCCGCGCGGATCGACGTCTTCCAGATAGACGAAGAAGGTGCCGTCGCTCGACGTCGACGTGATAA
+ACAGCGTGACCACCACATGACCGGTCACCTCCAGGGGATGGTCGAGCGGTGCGGAGGTATAGGTCAGCAG
+CTTGGCATCCTGGGCCTTGCGGTCCGGGTAGCAAACGTGTCCACCGATGCCCACTTGCGAGCGCCAGCGT
+GAGCGCTCGCCCGTTCCGGCCGTCTGATCCACCACGTATTCGTCTGCACCGCTGTCGCAATCGGGTGCGT
+CCGGGCGCAGCTGTCGGTCTGCGGACAGGTAGTAGCTCTGCGTGGTGGCGGGCGGCGGCCAGGTGTCGGC
+CGACTTCCAGCGGTTCTCGACCATGGTGAAGTAGTGCACCGGCGGCTCGGAGCCGATGCCCGTATCGGCC
+CCCTTGACGTGATGGTCGATGAACCTCAACAGCTCGCCGTCGTGATCGAAGTCGGGTCTGCTGAGCCCGC
+GCAGTGGGTCGACGCGCCAGCCGCCGGTGTGGTTCCATGGACCGAGGATCAAGTGGCTGCCCGGGGTGGA
+GACGGTCAGAAAACGTTTGATTGCGGCATGCGCATACCCGCCGTCGAACCAGCCGCTGTAGCTGTAGATG
+GCCGCTCCCGACGCCTGCACGTCACGCCAATAATTGTGCGGGCTGATCAGGTTGATGCTGCCCGACTCGA
+TCGGTGTACCGATCGGCTCGAGCCGGGCGTCAGGTTGGCCACGATAGGGATCCGAGGCGGATACGTCGTC
+CCGGAACGTCAATGACCCCGCGATCTGGTGAACGTCGTAGTTGCCGCGATGCGCGGCGATGGCCCCGTCC
+CGCAGCGAGCGATCACGGTCCTCCTGCACCGGCTGCATGCCGGTCACCGGGAGCTTCGCCCACCACCCGA
+CCACTTCGTGCAGGGCGTTGCGGTCGAGCGCCTCGTTGTAGCGTCCCCAGGTGTCGGTGAACCAGGCGGC
+GTGGATGCCGCCGGGGAACGCGATGTCGGTGTAGACGTCGAACAGCGAGAAGCACGGGGCGATCACCCGC
+ACCGCGGGATGCTGGTTGACCAGCAGTAACTCGGCCGACGTGCCGTCGTACGAATTTCCCAGCGCAGCGA
+CCGTTCCGTTGCACCAAGGCTGGCGCACGATCCAGTCGACGATCTCGGCGCCGTCCCGGATCTCGTCGGA
+GGACCATTCGCACACGCGGGCGCCGAACGACGCGCCCGATCCGCGCACATCCACATCGACCCAGGCGTAG
+CCGCTGGCGACGAAACGTCTCCGACGACGCTTATCTGCGGCGATGTGCTGGAGGGGCTTGCCCCCGAGCA
+ACATCCGCAACGGCCAGCGCAACTGCAGCGACCGGTAGTAGCGGGTCTGATGCAGGATCGCGGGCAGCCT
+TGCGGCACTCGTCAGGCCCGCGGGCAGGTAGAGGTCGATGGCGATGCGCACCCCGTCGCGCATCGTCACA
+TAGCACGAGGAGTAGCGCATCCCACGATATCTCGGGTAGGCGGATCGTTGGTCCGGCGCGGAGTACCAGG
+CCGCATCCGAGCCGCCGCGTCTGGTCATCGGGTAGCCAGGCGATCAGCTCAAGAAGATGTTGACCGCGGT
+TGCCAGGTCGGGGGATGCCGATGTCTCCAGGTTTTGGTAGCTGCCGCCGCTGAGCTGTGCGACGGCTTCC
+CAGGTTGCCCGATCGGGATCAGCACCGAAGTCGATGATGTTGACCGCGATCGGCTTGGCCGGGTCTGCGC
+TCTTGCGGATGAAATCCTGCAGGCCCGGCCCGTCGAGGGTTTGGTCCGTATGCGGCCCCGCGGTAATAAC
+CAGCACAGAATTAGCCTGGCCAACATGGTAATTGGCTAGCATCTCCTGATAGATCAAGCGCAGAGTGGTG
+AACGACACCGCGCCACCGCCCGAGGAGTATTGCTTGCCCAACGCGGCCGTCAAGGCCGCGGGGCGGGGCT
+GGCCGTTGACCGGGTCGGCCAATGGCCCGGCCGGCACCTCTGTTCGGCCCTCGCGGCCGTCGAATGTCCA
+CAGTCCGACGACCGAACTGGGCGGCATCGCCTTGATCCGGTTCTCAAGCGCCGCAACGACATTGCTAAGC
+CGGCTATTGCCGCCTTCATCATTGGGCATCGATTGGTCGAGCATGATGGTCGCGGCCACTCCGGCCGACG
+CGGTGACCATGGTGTCCGCCAGGGTCGCGCGCATGGAGTCGTCACCCACCGACAAAGTCGAAGGCAGCGC
+TGGGAAACTGGTGACGGGGCTGCTCGGCGGTTTGACGTCGCTGACTCGGAAACCAGCTCTGGCCAGTTTG
+GCCAGTTGCTCGGGCTTGTGCAAATACCTGGCAAACGCGCTGGCCGCCGACGTTTGCTCCTGCGATAGCC
+ATGCACCACTGAGCAGCACCGTCGGATAGTCAGCGACCGCAGCCGGCCCCGGCGGCAGCCAGGAACCCAA
+GGTGTTCTCGGCATCTGAAAGTGACTGGCCGCGCTGGAACAACTGTTGTTCGGTGGTGACCACCGCGTGC
+ACGGGTGCCGTGGCGACATCGCCGGGCTTGAGCAGCGTGTCCATCGCCGCGGTCAAGGAGTCGTCGGCGA
+GCTTAGGTCGTGCGCCCATCAGGGTGCGCACCGCGCCGATACCCGCTGTTGCTGGCGCGCCAGCAGGTGC
+TGACGCGGCAGCCACCGCCTCGCCGGCCAAATACGCGGCATCGCCGTTGCCACTGCTCGGCATTGCCAGC
+CGCAGTGATCCCCAGGCAGGCAAGTCCAAGCCGGACAACGAGTTCGGATTGGTTTGCAGGCCGGGCAACG
+CCGCCCAGTTCTGGTTGGCGAGGGCCTGCTGCAATTCGGGCCGCACGGCGAGCAACACCGGCGATATCAC
+CAGTGAGCGGCTATCGCTAATGGCTTGGCTGCCCGCGGCCCCGGTAAGCCGCGCCGCCGAGATGGAGCTA
+CTCGGAATCCACAATCCCGGCTGGCCGCCCAGTTCGGTCGGCCATTTGCCGATGAAACCATTGATGACGG
+CATCGGAGCCGGCCGAGGTGACAGCCACTGCCACACAACGGTCGCCGACCGGGCCCGCCGACGCGTTGTA
+GCTGTCGGCTGACTCCTTTACCTGATCGGCGATTGATGGGTCGGCTATAACAGCGACGGTGTCCTTGCCG
+CCCACGCAGCGGGCGGCAGCCGTATGCGAGCGGTTGGACAACGCGTCACCGAAGAAGCACCACAAGATCA
+CCCCGGCCACCATTACCACCACTGCGACAAGGGCCACGATCACGCCGATACTGACTCCCCGCCGCCCGTC
+CGCGCTACGGTGCCCGGCCTGCCAGTCGCCGGGCCCCCGATGTCCGAAGCGAAACAGCGGCGGCGGGGCG
+GCCGCTATGGGCTCGGCACCCGTTGGCTCCCAGTCGGGGCGGGGTGGAATGTCAGGGTAGTCTTCTGAGC
+CGCTAGCCGAGTAGCCGCCGACGGCGGAGTAGTGGCCCTCGCTGGATAACGGGCCGTCATCGGGCTGATC
+TACACCGGGATAGTCGTAGCTACCCGATATGTCCTCCCAGTGCTGTTGTTCCGCCGCATGCCCGTCGGAC
+AGGTCGTCAACGGAATCCTCGGGGTCGGGCTTGCTGTGCCTACCCATACCGGCGTCTGCGTCCTCTCCGT
+CGAAGGCCGGCGCCTGTCAAGCACGAGCTACGCACCGGCTCTGCCCGATGGGGCCGGCTCTCTCCCGCAA
+GCGGGCGGTGCCCCCACAGCGGCCCGCTAGCGGGCCGCATCGTCACCGGCCCTGTCCGATGGGGCCGGCT
+TCTCAGCGGCCCGGGCCTTAAACTCCCGACGACGTCGGTGCAGGATCGGCTCGGTGTAGCCGTTGGGCTG
+CTGGGCCCCGGACAAGATCAGCTCCTGCGCGGCCAGGAAGGCGATACTGTCGTCGAAGTTGGGTGCCATC
+GGTCGGTATGCCACGTCGCCCGCGTTTTGTCGATCGACCAACGGCGCCATCCGCTCCAAGCTGGCCCGCA
+CATCCGCGCTGGTGATCACACCGTGGCGCAGCCAGTTGGCCAACAATTGGCTGGAGATTCGCAGCGTGGC
+CCGGTCCTCCATGAGCGCGACGTCGTGGATGTCGGGCACCTTCGAGCAGCCGACACCTTGATCAACCCAG
+CGAACCACGTAGCCGAGGATGGATTGACAGTTGTTGTCGACCTCTTCGCGGATCTCGTCGGGAGCCCAGG
+CCAATTCCTTGGCCAGCGGAATGGTCAGCAATTGTTCGATGGTGGCGCGACGCTTCCCCGCCAGTCCTTG
+TTGCACCGCGGCGACGTCGACCTGGTGGTAGTGCAGCGCATGCAGGGTGGCCGCAGTGGGAGAGGGAACC
+CAGGCGGTGCTGGCCCCGGCGCGCGGCTGGGCGATTTTTGTCTCGACCATGTCGGCCATCAGCTCGGTCA
+TTGTCCACATGCCCTTGCCGACCTGGGCTCGGCCGCTGAACCCGGCGGCCAGGCCGGCATCGACGTTGTG
+GTCCTCGTAGGCCAAGATCCACGGCTGGCTCTTCATGGTGCCCTTGCGCACCATCGGGCCGGCCTCCATC
+GAGGTGTGGATTTCATCGCCGGTGCGGTCCAGGAACCCGGTGTTGATGAACACCACGCGGTCCGCGGCAG
+CTTTGATGCACGCCTTGAGGTTGACCGTGGTCCGGCGTTCCTCGTCCATGATGCCGATCTTCATGGTGTT
+TTGCGGCAACCCCAGCACATCTTCAACCCGGCTGAACAGTTCGCAGGTAAACGCCACCTCGGCCGGACCG
+TGCATCTTCGGCTTGACGATGTAGATGGAGCCGGTGCGGCTGTTGATCAGCGGCCCGTTGACGTCGCTGG
+CCTTTAGCCCGTGGATGGCGATCAGGCCGGTGAATAGGGCATCCATGATGCCTTCGAACACCTCGCTGCC
+GTCAGTGTCGACGATGGCGTCATTCGTCATCAAGTGACCGACGTTGCGGACGAACATGAGGCTGCGTCCA
+GGCAGCGTGAACTGGCCACCGCCGGGTGCGGTGTAGTTCCGGTCCCTATTGAGCACCCGCAGGAAAGCGG
+TGCCGTCCTTGTCTACCGCTGCTGCCAGGTCGCCCTTGTTCAGGCCGAGCCAGTTCCGATAACCCAGCAC
+CTTGTCGGCGGCGTCCACGGCGGCCACCGAGTCCTCGAAGTCCATGATCGTGGTGATCGCGGATTCCAGG
+ATCACGTCCTTGACGCCGGCCCGGTCGGTGGTGCCGACCTGCGACTCCGGATCGATCAGGATCTCGATGT
+GCAAACCGTGATTGATTAGCAGCACCGATGTCGGCGACTCGGCTGCGCCGGTGTAGCCGGCGAACTGGCC
+GGGGTTGGCCAGGCCGGTGGACTTATCCGGCAAGGCAACCACGAGCTGGCCATCCTGCACTGTGAAACCG
+GTGGCGTCGCCAAAGGAACCCGACGACAGCGGAACACTGTCGTCGAGGAACTTGCGGGCATACGCGATCA
+CCTTGTCGCCACGAACCTTGTTGTACGTGGGGCCTTTTTCGGCGCCGTCGGTCTCGGGGATGACATCGGT
+GCCATACAAGGCGTCGTAGAGGGAGCCCCAGCGAGCGTTGGCCGCGTTCAGAGCAAACCGCGCGTTGAGC
+ACCGGCACCACCAGCTGGGGGCCGGCGGTCGTGGTGATCTCAGCGTCGACACCGGACGTGGTGATGGTGA
+AGTCATCAGGTTCGGGAAGCAGGTAGCCGATCTCGGTGAGGAACTGGCGGTAGGCATCCATGTCGATGGG
+CTCGATCACCCGACGCCGGTGCCACTTGTCGATCTGCGCCTGCAGCTCGTCGCGGGCGTTCAACAGAGCT
+TGGTTCTGCGGGGTCAGGTCGGCGACGACCTTGTCGACGCCCGCCCAGAAGCTGTCCGGGTCGATATCGG
+TGCCAGGCAGGGCTTCATTGTTCACGAAGTCGTAGAGCACCCGAGCGATGCGCAAGTTGCCCACCGACAC
+GCGATCTGTCATTGCTTCCTCCCTTACTGGCAATTGCTCAGCCTACCGGCCGACAAGACGACTACTACAT
+CCGGCGACCCGCAACCGCAGGTCACGTCAAGCTCTGTCAGCACCTCGGCACCCGGCATGCTCGCTGGCTG
+GCAACGCGACGCAGTGGCCGCAGCGATCATACGGGTGGGGCGGTCTGCCTACTACAATCCCGTTGGATCC
+GTTCTGGCCGGACAGCATCCCGCCGGGAGCGGCTCCGGCCACGTCGGTGCCGCTCATTGCGGCGGTGTGA
+TTCCGAATCAGGCCAGACGCTTGATCCCCGGATAGGAGTCGAACCCACGGTCGAAGCTCATCAGCCGGGT
+AATGTCGTGGTGAGCCATGACGGCGATGTGTAGTGCATCCCTGGCCGACAACGTTTGATAGCGCAACAGG
+GCATCCCTCGCGTGTTCGACATCGGTGCGCTCGATCGGCAGCACTTCGTCGACCACGCCGATAATTGCAT
+CGAAAGCCGGCTGAATCGCCTCACGGCGTTTGATTGCCACATACCGGTGGCATATCTCCTGCAGCACCTC
+GGCGTCGGTGACTAGGCGTTCACCGCCCGACAGCGCCGACTCCAGCAGACGTTGCGCGTCCAGCTTATGC
+GGGTGCGAGGCACCCACCAGATACATGGGAATGTTGGAGTCAACGAGGATCACCGTGATCCTTCGCGCTC
+CGCACCGCGTCCGCGTTCGATTTCCTCGAGCATCTGCTCGACGTCGGCTGTCGGGAACTCATGGCGTGCG
+GCGGCACGGACAGATCGCAGCTTCATGTCTAGATCGCCGCGCGGTTCTCGCTCCCGCGCCTCCCGCAGCG
+TCCGGCGGACCCACTCGGACACTGTCGTGCGGTGCCGGCGTGCAATCTCTCGGAGTTCTTCCCACTCGTC
+GGGGTCCAGCAGAACCTGCAGGCGCTTACTCATAGCATGAGTGTATACAGCTCATACGGGTGTATGAATC
+CAGCTCGCCTGCGCGCGGGAGCTATCCCCCGGGGGACCCGTTCTGGCCGGCCAGCGTTCCGCCCGTACCG
+CCGCTGCCGCCCGGCCCGCCAGAGTCGCCGGGCCCACCGTCGCCGCCGTCGCCGATCAACTGGGCGTAGC
+CGCCGTTACCGCCGGTGCCGGGGGTGCCGTCCCCGCTGACGCCGGCGGCGCCGCCATTGCCACCGTTGCC
+GATCAACCCGGCCGTGCCGCCGTTACCCCCGGTGCCGCCGGCGCCGGTGACGGGTACCGCGACTGAGGGA
+ATCTGGGTTGGCCCACCGGAGCCGCCGGCGCCACCGTTGCCGACCAGCAGCGCGCCGTTGCCTCCGTTCC
+CGCCACTGCCACCGCCGGGGGCGAAGACGCCGGTACCGGCGGACCCGGCGCCTCCGGCGCCACCGTTGCC
+GATCAGCCCGACGGCGTTGCCGCCGTCGCCGCCGTGGCCTCGGAGAAAGCCGTCGGTTTGCACGCTGTTG
+CCGCCGTCGCCGCCGTTGCCGATCAGCGTCCCGCCGGTGCCGCCGTCGCCGCCGTTGCCATCGAAGAAGC
+TGAACCCGCCGTTACCGCCGTCGCCGAACATCCCGGCGTTACCGCCGGTACCACCGTCGCTGAAACCTTG
+CAGGGTGCTGCCTCCGGAACCGCCGTCGCCGTACAGCCACCCGCCGTTGCCGCCGTTGCCGCCGTTGCCG
+ATGCCGGTGGGGGCGGCACCGACGGAGCCGCCGTCGCCCCCGTTGCCGATCAGCCGGGCGTCACCGCCCG
+CTCCGCCGTCGGCGGCTCCCGATGGGACATTGCCGCCGTTGCCGCCGTTGCCGTACAGCAGTCCGCCGGT
+GCCGCCGGTGCCGCCGGCCCCGCCCGCGAAGCCGGCCTTGCCGAGCCCGCCGGCACCACCGGCAAGGCCG
+GTCGCCCCGGGCCCGCCGATGCCACCGTTGCCGCCGTTGCCGATCAACCCTGCATCCCCACCGGCGCCGC
+CGGGCTGGCCGATCCCGCCGTTGCCGCCGTTGCCGCCGTTGCCGTACAGCAACCCGCCGGGCCCGCCGGG
+CTGTCCCGGCGCGCCATTGGCGCCATCACCGATCAACGGGCGGCCGAACAACGCCTGAAACGGCCCGTTG
+AGCACGTCCAGCGCGGCGGCGTCCGCCGCCTCGGCACCGGCATAGGCCCCCGCGCCGGCGGTCATGGCAT
+GCACAAACTGCTCGTGAAACAGCGCCGCCTGCGCACTCAATGCCTGATAGGCCTGGGCGTGCGCGCCGAA
+CAAATCCGCAACAGCCGCCGACACCTCATCGGCGCCCGCGGCCAGCACCCCCATCGTGGGCACGGCCGCA
+GCCGCATTCGCCGCGCCGATCGCCGACCCGATGCCGGCCAAATCCGACGCCGCCGCCACCACCACTTCTG
+GGGCCGCCACCACAAACGACATGACGCGCTCCTCACGGGACCGGGTGCGCAGTCCCAGCGGTTACAGCGT
+ATTGACGTCCCGCCACCACGTCCGGCGTTCGGGCCAACTGATCCGAAACGATTGTCAGCGGCAGCAGCCC
+CCGATTACGCTCGGTGTCCCGTCAGACACCGATCCCTGCGTCAGTCAACGATGCGTCCCGTCGCGCATGG
+TGCCAACCAGGTCCTCCACCACGTCCTCCAGCGCCACCATCCCCACGACAGAACCGTTGTCGGCGGTTAC
+CAAGGCCAGATGGCTGTTGATGCGCCGCATCCGCGACAGGGCGTCGGCCAGCGGCAACGATTGGGGAACC
+CGCGGCAGCGGGCGCACAACGGCCAGATCGATCACGGTTTGCGGATTGTCACCGAGGGTCAGCACGTCCT
+TGATGTGCAGATATCCGATGAACCTTCCACCGCGATCCACCACCGGAAAGCGGGAGTAGCCGGTTTGCGC
+CAAGGCCTGTTCGACCCCGCCGATGGTGGGCCCGGACCCTACCGCCGACACCTGCACTGCCCGAATGTTG
+ACCAGCGGCACCGCGACATCGGCAACCAGGCGAGTTCGAATCCGAAGGGCTCGGGTTAGCCGCGTGTGCT
+CCTCGTGATCCAGCAGGCCTTCGGATAGCGATTCGGCGATCATCTCGGACAGTTCCGCAGTGGAGACGGC
+GATGTCGAGTTCATCCTTCGGCTGCACCCCAACCAGCCGCAGTATCGCGTTGGCGCAGTTGTTGTAGAAC
+GCGATGAACGGCCGGGCGAGGCGCACGTAGACCAGGTACGGCGGGACCAGCAACATCGCTGTTCGCTCCG
+GACCAGCCAAAGCGATGTTCTTCGGCACCATCTCACCGAGCAGGACATGCAGCGCCACCACGATCGCCAA
+CGCCACCGCCAACGACAAGGTGTGCAGCAGCGCCGGCGGTACACCGCTCAGCCCGAACGACAGCTGTAGC
+AGCTTGACGACTGCCGGTTCGCCGACCCGGCCAAGCAGGATCGAGGACACCGTAACCCCCAGCTGTGCGC
+CGGTCAGCATCGCCGGGAGCTGTTCGCCCGCCCGGATCACGGTGACGGCAGTGGCCTTGCCCTGCTCGGC
+CAGCGCTTCGAGGCGGTCACGACGCGCCGAGATCAACGCGAATTCCGCGCCCACGAAGAACGCGTTGGCG
+CCGATCAGCAAAAGCGCCAGCAACACCGCGGACAGCACATCCATCAGCGGCCCCGCCCCGACCCGGGGTC
+GGCATGGCCGCCCATTTTGATCAACTCCAACGAGTCGATCCGGCGCCCGTCCATCTGGATCACGGTGGCT
+AACCACCGCATCGAGTCGTCGGGAAGTCCGTCCTGGTCCAAGGCAGTCAGCTCGACCGTTTCGCCGGCCA
+CCGGGATGTGGCCGAGCTCTCGAAGCACCAACCCGCCGATCGTCTCGTACGGACCGTCGGGGGCTCGATA
+GCCGGTGGCGCTGGCCACCTCGTCGATGCGTAGCAGACCCGAGACCCGCCATCCGTTGCCGGCTGCCACC
+ACATCCGGTGTCGCATCGTCGTGTTCGTCGCGGACGTCGCCCACGATCTCTTCGATCAAGTCCTCCAGGG
+TTACCATGCCCGCGGTGCCGCCGTACTCGTCCACAACCATGGCGGTCTGTAGCGCACTGGCGCGGACCTG
+CGCCATCACCGCATCGCCGTCGAGCGTCGAGGGCACCACCGCGACCGGCTCGGCGACCGTCGTTAGCAGC
+GTGTGCGCGCGATCGCCGGGCGGAACCTCGAACACCTGCTTGACGTGCACGATGCCGACGGTCGCATCGA
+GATCTCCCTCGACCACCGGGAAGCGCGAGAATCCCGATGCGGCCGCGGCCGCAACCAGGTCGGCGATGGT
+GTCATCGGTCTGCAGCGCCACGATCTTCGACCGTGGCGTCATCAGCTCCTCGGCCGTCAGGGCGCCGAAC
+TGCAGCGAGCGGCGCATCAGCCACGCCGTGGCGTCATCGAGTGCGCCGCTGCGCGCGGAACTACGCACCA
+ACGACACCAGCTCCTGCGGTGTGCGAGCTGAGCGCAGCTCCTCGGCCGGCTCGATGCCAAGTCGACGCAC
+GATCCAGTTCGCCGCTCCGTTCGTGAGACGGATGGCCGGGGTGAGCAGCAGTGAGAACAGCACCTGGCCG
+GCCACGACTGAGCGCGCGGTGCGCAGCGGGCGCGCCACCGCGAGATACTTGGGGACCAGCTCGCCGAAGA
+CCATCGACAGCGATGTCACGATCACCAGGGCAAAAAACGTGATAAGACCGTCGGCCACCCGATCAGACAT
+TCCGACTGCGACCAGCCCAGGATGCGGTAGCTCGGCCACCAGCGGTTCGGTCAGGTAGCCGGTAGCCAAG
+GTGGTGATCGAGATACCCAACTGAGCACCCGAAAGCTGGAACGACAGCCGGTGGTGTGCGCGCTGGATGA
+AGCGGTCCCGACTGGTGCCGCCGCGGGCGTTGGCCTCCACGGTGCTGCGGTCCAGCGCGGTCAGCGAGAA
+TTCGGCCGCGACGAACACCCCCGTGCCTGCGGTGAGCGCCAAGATCGCCAGGATGGTGGCGACGGTATCG
+GTGAGGTTCACGGGCGGCTCGGTCGTCGCGCTATATCGGGCCGAGCCAGTACCGGCCGCTCGCCTGGAAA
+ACCGACGGTGTGGACGGGTGCCCGCGGCACGTCATCCCTTTCGCTCGCAACCGCGCAGCGCGATACTGCG
+GGTTTGAAGTACACATCGTAGCGAGATAGCTCGTGGCGCCAGCTTCACCAGCCGGCGGGCAGCGGATGGC
+CCTCGGCAAAGCCCGCTCCCGACTGCACGCCCACCACGGCCCGCTCATGCAGCTCCGCCAGGTTCGAGGC
+ACCCACATAGGTGCAGGTGCTGCGCACGCCAGAAGTGATGTGGTCAATTAGGTCCTCCACACCTCCGCGG
+TCGGGGTCAAGGCCCATCCGCGACGTCGAGATGCCTTCCTCGAACAACGCCTTACGAGCTCGGTCGAACG
+GGTTGTCCGCGCCGGTCCGGGCCACCACCGCCCGCTTGGATGCCATGCCGTAGCTCTCCTTGTACGGCTG
+ATCGTCGCGGTCACGCATCAGGTCTCCGGGGGATTCGTAGGTGCCGGCGAACCACGATCCGATCATCACG
+TTCGAGGCGCCGGCGGCCAGCGCCAGAGCCACGTCGCGTGGATGCCGGATCCCACCGTCGGCCCAGATAT
+GACCACCGAGCTGCCTTGCCGCAGAAGCGCATTCGAGCACAGCGGAGAACTGCGGGCGGCCGACACCGGT
+CATCATTCGGGTGGTGCACATGGCGCCGGGGCCGACACCGACCTTGACGACGTTCGCCCCGGCTTTCAGC
+AGATCCCGGGTGCCCTCCGCCGACACCACGTTTCCCGCCGCCAGCGGCAAACCCAAGTCCAGTGCCGAGA
+CCGCCTTGATCGCGTCCAAGGTCTTGACCTGGTGTCCGTGTGCGGTGTCGATGACCAGCACGTCGACGCC
+GGCTTCGGCGAGCGCTCGGGCCTTAGCGCCCACGTCGCCGTTGATGCCGACGGCCGCGCCGATCCGCAGC
+CGGCCCGCGCTATCGGTGGCCGGGGTGTAGATACCGGCGCGGATAGCCCCGGTGCGGCTTAGCACTCCCG
+CCAACGTGCCGTCGGCGTCGGTCAGCACCGCAACGTCGACCGGGGCGTGCTCCAGCAGGTCGAAGATCTT
+GCGTGGCTCGGTTCCCGCTGGAGCGGTCACATAGTCCGTCACGGCGATATCGCGCACCCGGGTGAAGCGA
+TCCACGCCCAGGCAGGACGATTCGCGCACCAATCCGATCGGGCGACCCTCGAGGATGACCACCGCGACGC
+CATGTGCGCGCTTGTGGATGAGCGCCATGGCGTCGGACACCGAATCGTCGGGTGCCAGCGTCACTGGGGT
+GTCGAGCACCAGGTCCCGGCTTTTGACGAACGCCACCGTCTGCTTTACCGCCGGGATCGGCAGATCCTGC
+GGCAGGATTACGATGCCACCGCGGCGGGCGACCGTCTCGGCCATCCGCCGCCCGGCTACCGCGGTCATAT
+TGGCGACCACTACCGGAATGGTGGTGCCCGAGCCGTCGGCGGTGGACAAATCGACGTCGAAGCGCGACGC
+GACCTCGGATCGGTTCGGAACGATGAACACGTCGTTGTATGTCAGGTCGTACCCGGGTGGGTGCCCGTCT
+AGAAATCTCATCACTTACCCCTTTACCCCCCTTTAGTTCTAGCCCGCTACACCGGTACTTCGGTGCGGTC
+TGAACTCCATAGTGTGTGGAACTTGCCTGGTTCGTCGATCCGGCCGTAGGTGTGTGCGCCGAAGAAGTCG
+CGCTGGGCCTGGGTGAGTGCAGCGGGCAGCCGCGCGGTGCGCAGCGCGTCGTAATACGACAGGGCCGACG
+AGAATCCCGGGGTCGGGATACCCAGTTGGGCCGCCGTCGACACCACACGCCGCCAACTGTCGATCGCCGA
+TTCGACGGCGCGCGGAAATACGGGGCCACAATCAGACTGGCCAGGTTCGGGCTGGCGTCAAAGGCTTCCT
+TGATGTGGTTGAGGAACTTCGCCCGGATGATGCAGCCGCCACGCCAGATGGTGGCCAGGTCGCCCGGCGT
+GATGTCCCAGCCGAATTCGGCGCTGCCGGCCTGGATCTGGTTGAAGCCCTGAGCGTAGGCCACGATCTTG
+GAGGCGTACAACGCCTGGCGGACGTCTTCGGTGAACGTGGCGGGGTCGGCGGGCTGCTCGCCGAGCTTGC
+CCGAAGCCAGACCGCTGGCGGCCGAGCGTTGCCCCACGGATCCCGAGAGAGCGCGGGCAAACACCGCTTC
+GGCGATGCCGGTCACCGGCACACCCAGGTCCAGCGCGGACTTGACGGTCCAACGGCCGGTGCCTTTCTGC
+TCGGCCCGGTCCACGATGACGTCGACGAGCGGTTTGCCGGTCTTGGCATCGGTCTGCCGCAGCACCTCGG
+CGGTGATCTCGACCAGGTAGCTGTCCAGATCGCCATTGTTCCACTCGGTGAACACATCGGCGATCGCCGG
+CGCGGTCAGACCTAGCCCGTCGCGCATCAGCTGGTAGGCCTCACCGATGAGCTGCATGTCGGAGTACTCG
+ATGCCGTTGTGGACCATCTTGACGAAGTGCCCGGAGCCGTCCGGGCCAATGTGGGTGCAGCACGGCACGC
+CGTCGACATGCGCGGAGATCTCCTCGAGCAGCGGACCCAGCGATTGGTATGACTCGGCGGGTCCGCCGGG
+CATGATCGACGGCCCGTTCAACGCGCCCTCTTCGCCGCCGGAGATCCCGGCCCCGACGAAGTGCAAGCCC
+CGCTCACGCATCGCTTTCTCGCGGCGCATGGTGTCGGTGTACAACGCATTGCCGCCGTCGATGATGATGT
+CGCCGGGTTCCATGGCGTCAGCAAGTTCGTTGATGACAGCGTCAGTGGCCTCTCCGGCCTTGACCATGAT
+CAGCACCCGACGCGGTTTTTCCAGTGCGGCAAGAAATTCGGGGATCGTTTCACTGCGCACGAACTTGCCG
+TCTGAGCTGTGCTCCTTAAGCAGCGCGTCGGTCTTGGCGACCGACCGATTGTGCACTGCCACGGTGTAGC
+CGTGCCGGGCGAAGTTTCGGGCGATGTTGGAACCCATCACGGCCAGGCCAGTGACGCCGATCTGCGCGAT
+GCCGGCTGGCGATTCCGACGAACTCATGTCCTGCCTTTCAGTTGGGCCCGGCTTCGCTAGGCGATGAACA
+GCCGCTGCAGCTGCGTGAGCCACGGTACGGCCAGCGCGACGGTGGGCACCACCAGGACGGCGGCCGCAGC
+TAGATATGCGGCCGCGGACAGAACCGCGCTATTTCCACGCCCCGACAGCCGGCGCACGCGGAGCACCGTG
+CTGGGACCTCCGACGGCCAACGCACCCGACGGCGCCCGCCCGGACGCACAGGCGACCAATGCCCGAGCCA
+GGGGAGTGCGCCCGGCGGCGCGCACCGCGGCGTCATCGGCCAGGAGCTCGACGAGTAGCTGCACCGCCCC
+CAGCGCATTGGCGCTGCGGACCAACCGCGGGAAAGCCGCGTGCACCGCGGTAAACGCCTCCAGGACAAGA
+TCGTGGCGGGCGCGTAGATGAGCCCGCTCATGGGTAAGGATCGCCGCGACCTCGGCGTCGGCGAGCGCGG
+TCAGTGTGCCTTCGCTGACCACAACCCGGCTACGCACACCGGGCAGACAGTAGGCAAGGGGCTGCGCGAC
+GTCCAAGACCCGAAGGTCGCGGGCCCGCGCGCACGGCTGGGCAAGCGCGCCATTGTGTCCGACCCCGACG
+AGATCGACCACCATGCGGTGGTGTGCCCGTCGTCGTCGCGTGGCGGTGGCGACGCGCACCACGGCGACCG
+CCAGCCGGGCACCGACCAGCACAGTCAACGCAAAGACGGTGATGTAGGCCGCCCACAGCGGCCAGCCGAG
+GCGGCCGGCCGCGCCGACGAAGCTGGTCGTAGGGCGTCCGTCGGGACCGGGCATGAGCAGCCTGCTAGCG
+ATCGCGATTCCGGCGCTGAACGACGACAGCACCGCGGCCAGGGCAATCGCCTGCCACAGCACCATGGCGG
+CGCGCGGTGCGCGCAGTGGCCACGTTGCCCGGGCTAGCAGGGCTGGGGTCGGGCCAGCCAGCAGCACCGC
+GAGGATGGTGAAGGCCAGCGCGGACACGCCGTTAGTCTCCCTCAGGTCTCCGTTGCCGCGCCAGCCGGTG
+GCCGATTGCCATGACCGGCTTCCAATTCGGCGAGCGCACGTCGTAGCGCATCCGCCTCGTCGGCACCGAC
+TCGCTCGACGAAGTGCACCAGCGCGGCTTGCCTGCTGCCGGAGTACTCGGCCTGAGCCAATGCATCGACC
+ATCAGCCCGGCGACCAATTCGTCGCGGCCGTGCACGGGAGCGTAGCGGTGGGCTCGATCGTCGCGGATCT
+GCAGCACGAGGTTCTTCTTTGCCAACCGTTGCAGCACGGTCATCACCGTCGTGTAGGCAAGGTCGCGGCG
+CGCCGACAACGCTTCGTGGACTTGGCGAACGGTTTGGGGTTCCGTCCTGGACCACAAATGGTCCATGACC
+GCGCGTTCCAAATCCCCCAACCGTGTCAGCTTGGCCATTGTTCGTTCATCTCCTGCGGGTTGAAACCAGC
+GTACTCCGGCTTACTACTCGCTGTCGTATCCAAACCGGCGGGCGGCCGTACCGGGCCTATGCACCCGGCT
+CGCAAACATTACACGCTAACGCTTGCTAAATTAGGGCAGCCTTGCCTATCATTACTTCGTCGAGCCACAA
+CGACCGCGGCCGAGTCCTGAGGGCTGCAGTGACCCCCGGTCGACTCGATCGGCGAGCCCCGTGCCTTGGT
+GCACGGGGCTCGCCCGTTGGTGTAGACACAAGGACGTGCAGCCATCGCCGGACTCACCCGCTCCGCTGAA
+TGTCACCGTGCCGTTCGACAGCGAGTTGGGTTTGCAATTCACCGAACTGGGTCCCGACGGGGCCCGAGCG
+CAGCTCGACGTCCGGCCCAAGTTGTTGCAGCTGACGGGCGTCGTGCACGGCGGTGTCTACTGCGCGATGA
+TCGAGAGCATCGCCAGCATGGCAGCCTTTGCCTGGCTCAATTCGCACGGCGAAGGCGGGAGTGTGGTCGG
+CGTTAATAATAATACGGATTTCCTGCGCTCCATCAGCTCAGGGATGGTGTATGGCACCGCCGAACCGCTG
+CATCGGGGTCGGCGGCAACAGCTGTGGCTGGTCACCATCACCGACGACACCGACCGGGTGGTCGCCCGCG
+GCCAAGTGCGGCTGCAGAACCTCGAGGCGCGGCCTTAACCCGCTCGAAACCGTTGAACCTGCCGCGGCGT
+GGCAGGATCGCAGAGCATGCGCCTGACGCCGCACGAACAGGAGCGTTTGCTGTTGTCCTACGCCGCCGAG
+TTGGCCCGCCGGCGTCGGGCCCGCGGCCTGCGCCTCAATCATCCGGAAGCCATCGCGGTGATCGCCGACC
+ACATCCTGGAAGGCGCGCGTGACGGCCGCACCGTCGCAGAGTTGATGGCATCCGGGCGTGAGGTGCTCGG
+CCGTGACGATGTGATGGAGGGAGTGCCGGAGATGCTCGCCGAGGTACAGGTGGAGGCGACGTTTCCGGAC
+GGCACCAAGTTGGTCACCGTGCATCAGCCGATCGCATGATTCCCGGAGAAATCTTTTACGGCAGTGGTGA
+TATCGAGATGAACGCCGCGGCACTCTCCCGCCTGCAGATGCGGATCATCAACGCCGGCGATCGTCCGGTG
+CAGGTCGGTAGCCACGTCCATCTCCCGCAGGCCAATCGGGCGCTGTCATTCGACCGTGCGACGGCCCACG
+GCTACCGTCTGGACATCCCGGCGGCGACAGCGGTGCGCTTCGAGCCGGGCATTCCCCAAATCGTCGGGTT
+GGTTCCGTTGGGCGGACGGCGCGAGGTACCCGGTCTGACGCTAAATCCGCCCGGACGGTTGGACCGCTGA
+TGGCGCGACTGTCAAGGGAGCGCTACGCACAGCTGTACGGACCTACCACCGGCGACCGGATACGGCTGGC
+CGACACCAACCTGCTGGTTGAGGTCACCGAAGACCGGTGTGGGGGACCGGGACTGGCCGGTGACGAGGCG
+GTGTTCGGCGGCGGCAAGGTGCTGCGCGAGTCCATGGGCCAGGGCCGTGCGAGCCGGGCCGACGGTGCCC
+CCGACACCGTGATCACCGGTGCGGTGATCATCGACTACTGGGGAATCATCAAGGCCGACATCGGGATTCG
+CGATGGCCGCATCGTCGGGATCGGAAAGGCCGGCAATCCCGACATCATGACAGGTGTGCATCGGGATCTC
+GTCGTCGGGCCGTCCACCGAAATCATCAGCGGCAACCGTCGAATCGTCACCGCAGGCACCGTCGACTGTC
+ACGTGCACTTGATCTGTCCGCAGATCATCGTCGAAGCCTTGGCCGCGGGCACCACCACGATCATCGGCGG
+TGGCACCGGACCCGCCGAGGGCACCAAGGCCACCACAGTCACTCCCGGCGAGTGGCACCTGGCCCGGATG
+CTGGAGTCACTGGACGGTTGGCCGGTGAACTTCGCGCTGCTCGGCAAGGGAAACACCGTGAATCCCGACG
+CACTGTGGGAACAGTTGCGCGGTGGCGCATCGGGTTTCAAACTCCACGAAGACTGGGGATCGACCCCGGC
+GGCCATCGACACCTGCTTGGCGGTCGCCGACGTGGCCGGGGTGCAGGTTGCGCTGCACTCCGACACTCTC
+AATGAGACCGGATTCGTCGAGGACACCATCGGCGCGATCGCCGGACGTTCGATTCACGCCTACCACACCG
+AGGGCGCCGGCGGCGGGCACGCACCGGACATCATTACCGTCGCGGCGCAACCGAATGTACTGCCCAGCTC
+GACCAATCCGACCCGCCCGCATACGGTGAACACCCTTGACGAGCATCTCGACATGCTGATGGTGTGCCAC
+CACCTCAACCCCCGGATCCCGGAGGACCTCGCGTTTGCCGAAAGCCGGATCCGACCGTCCACCATTGCGG
+CAGAAGATGTGTTGCACGATATGGGGGCAATCTCGATGATTGGCAGCGATTCCCAGGCGATGGGCCGTGT
+CGGCGAGGTGGTGCTGCGCACCTGGCAGACCGCGCACGTGATGAAAGCCCGCCGCGGGGCACTGGAAGGT
+GACCCGTCTGGTAGCCAAGCCGCCGACAACAACCGGGTCCGCCGCTACATCGCCAAATACACCATCTGCC
+CGGCCATCGCACACGGCATGGATCACCTGATCGGTTCGGTGGAGGTGGGAAAGTTGGCCGACCTGGTGTT
+GTGGGAGCCGGCGTTTTTCGGGGTTCGCCCGCACGTCGTGCTCAAAGGTGGGGCGATCGCCTGGGCAGCG
+ATGGGCGATGCGAACGCGTCAATCCCGACCCCGCAACCGGTGCTCCCGCGACCGATGTTCGGCGCGGCCG
+CGGCAACCGCGGCGGCGACCTCGGTGCACTTCGTCGCGCCGCAATCCATCGACGCGCGCCTGGCGGACCG
+GCTCGCGGTCAATCGGGGACTAGCGCCGGTGGCCGACGTGCGCGCAGTGGGCAAGACCGACCTGCCGCTC
+AATGATGCCCTACCGAGCATCGAGGTCGATCCCGACACCTTCACCGTGCGAATCGACGGCCAGGTGTGGC
+AACCGCAGCCGGCCGCCGAACTACCTATGACACAACGGTATTTCCTGTTCTAATGACCTCGCTGGCCGTG
+CTGCTCACCCTCGCCGACTCGCGGCTGCCCACGGGTGCGCACGTGCACTCGGGCGGCATCGAAGAAGCCA
+TCGCCGCCGGCTTGGTGACCGGCCTGGCCACCCTGGAAGCGTTCCTGAAACGGCGGGTCCGCACCCACGG
+CCTGCTGACGGCGTCCATCGCGGCCGCGGTGCACCGGGGCGAGCTGGCCGTCGACGACGCCGACCGGGAA
+ACCGACGCGCGCACACCGGCTCCCGCGGCCAGACACGCCTCACGCAGCCAGGGCCGCGGGCTGATCAGGC
+TGGCACGGCGGGTGTGGCCCGATTCCGGCTGGGAGGAACTGGGCCCGAGGCCGCATCTGGCGGTTGTGGC
+CGGACGGGTCGGCGCGCTGAGCGGGCTGGCGCCCGAGCACAACGCCTTGCACCTCGTCTACATCACAATG
+ACCGGCTCGGCCATCGCCGCCCAGCGACTGCTGGCGCTAGATCCCGCCGAAGTGACCGTGGTGACCTTCC
+AGCTGTCCGAACTGTGCGAGCAGATCGCGCAGGAGGCCACAGCCGGACTGGCAGACTTGTCTGATCCGCT
+GCTGGACACGCTCGCCCAGCGGCATGACGAGCGCGTGCGTCCCCTGTTCGTTTCCTGAAAGGTAAGGCAT
+GGCAACGCATTCCCATCCCCACTCGCACACCGTGCCCGCTCGGCCAAGGCGGGTCCGCAAACCGGGCGAG
+CCACTGCGCATCGGCGTCGGCGGCCCGGTCGGCTCCGGCAAGACCGCACTGGTGGCGGCGCTGTGCCGGC
+AATTGCGGGGAGAGCTGTCGCTGGCGGTGCTGACCAACGACATCTACACCACCGAAGACGCCGACTTCTT
+GCGCACACATGCGGTGCTGCCAGACGACCGGATCGCGGCCGTGCAGACCGGCGGCTGCCCGCACACCGCG
+ATCCGCGACGACATCACCGCCAACCTGGATGCGATCGACGAGTTGATGGCCGCCCACGACGCGTTGGACC
+TGATCCTGGTCGAATCCGGCGGCGATAACCTCACGGCCACCTTCTCTTCGGGGCTGGTGGATGCGCAGAT
+CTTCGTCATTGACGTTGCCGGCGGCGACAAGGTGCCGCGCAAGGGCGGGCCGGGGGTGACCTATTCGGAT
+TTGTTGGTAGTCAACAAGACTGACCTGGCTGCATTGGTGGGCGCCGACCTGGCGGTGATGGCCCGCGATG
+CGGACGCGGTGCGCGACGGCCGCCCGACGGTGCTGCAATCGTTGACCGAGGACCCAGCTGCCAGCGATGT
+CGTGGCCTGGGTTCGTAGTCAACTGGCCGCCGATGGAGTCTAGTGTTCTGGTGGTCGCGTCGCCGAATCG
+GTTGCCGCGCATCGACTGTCGGGGCGGTGTCCAGGCACGCCGAACCGCGCCCGACACGGTGCACCTGGTG
+TCGGCGGCCGCGACCCCGCTGGGCGGTGACACCATGAGAATCCGGGTGATCGTGGAACGGGGTGCCCAGC
+TACGGCTGCGTAGTGCCGCCGCGACGGTGGCCTTGCCCGGCGTGGATACCCTGACGTCGCATGCTCACTG
+GGAGATCGACGTGACCGGCACCCTGGATGTGGACCTGGAGCCGACGGTCGTCGCCGCCTCAGCCCGGCAT
+CTGTCGCATGCCACCTTGCGCCTGCACGACGACGGTCGGGTCCGCTTGCGCGAGCGCGTGCAGATTGGCA
+GATGCAATGAGCGCGAAGGATTTTGGTCGTCATCGCTGCAGGCCGATCGGCATGGTCGTCCCCTGCTGCG
+GCACCGGGTGGAACTGGGTGCCGGGTCTTTGGCCGACGACGTCATTGCGGCGCCGCGCGCCACTATCAGC
+GAGCTGCGCTATCCGGCGACGGCATTCACCGACGCCATCGACGCACGGTCGACCGTTTTGGCGTTGGCGG
+GTGGCGGAACACTGAGTACCTGGCAGGCTGACCGGTTGCCTGGCTAACGCTAGCTGGCCACCTTAGCGCT
+TGCCGCTGAGCCCTGCGCCTCGGCGGCCAGCTCGGCCAGCTGTTCGAGCCGCGTTCGCGCAAATGCCTGC
+TGGTCGGTGATGGTCAGCTGGCCGCGGCGAGTACTGAGGAAAGTCACCGTCCACGACAGCAGAGTGGTGA
+TCTTGGTCTTGAACCCGATCAGGTACGCCAGGTGCAGCACCAGCCAAATCAGCCAGGCGATAAAGCCGCT
+GAACTCAACGGGACCGATCTTGGCCACCGCCGAAAACCTCGAAACCGTGGCCATCGATCCCTTGTCGAAG
+TACTGGAATGGCTCACGCTCCGCCGGGTTGGCGCCGGCCAGTTCGGCCTTGATCGTGCTGGCGACGTATT
+TCGCCCCCTGGATGGCGCCCTGCGCCACACCCGGCACACCCTCCACAGCGGCCATATCGCCCACCACGAA
+CACGTTCGGGTACCCGGGAATGGACAGGTCGGGCAGCACTTGGACCCGGCCGGCCCGGTCGAGCTCAACC
+CGTGATTGCTCGGCAAGGTCCCTGCCCAACCAACTGGCCGAAACCCCGGCCGACCAGACCTTGCAGGCCG
+ACTCGATGCGCCGGACGGTGCCGTCGGAGTCCTTGACGGTGATGCCGTTGCGGTCGACGTCGGTGACCAT
+CGCACCCAGCTGGATTTCCACGCCCAGCTTCTGCAACCGGGCAGCCGCCCGCTGACCGAGCTTTGCGCCC
+ATCGGTGGCAGCACCGCCGGGGCGGCGTCAAGCAGAATCACCCGCGCCTTGGTCGAGTCGATGTGCCGGA
+ATGCGCCCTTCAACGTGTGCTCGGCCAGCTCGGCGATCTGTCCGGCCATTTCAACACCGGTGGGGCCAGC
+CCCGACAACGGTGAATGTCAGTAGCTTGGCCCGCCGTTCCGGATCGCTGGACCGTTCGGCTTGCTCGAAA
+GCGCTCAATATGCGGCCACGCAACTCCAACGCGTCGTCGATGGACTTCATGCCGGGTGCGAATTCGGCGA
+AATGGTCGTTGCCGAAATAAGACTGGCCAGCACCCGCGGCGACGATCAGGCTGTCGTAGGGGGTTTGGTA
+GGTGTGACCGAGCAATTCCGAGACGACGCACTGCCCGGCCAGGTCGATGTGGGTGACGTTGCCCAACAGT
+ACCTGGACATTGCGCTGCTTACGCAGCACGACCCGGGTCGGCGGAGCGATTTCTCCCTCGGAGATAATCC
+CGGTGGCCACTTGGTACAGCAGCGGCTGGAACAGGTGATGGGTGGTGCGCGCGATCAGCTTGATGTCAAC
+GTCGGCCCGCTTGAGCTTCTTTGCCGCGTTTAGCCCGCCGAACCCAGATCCGATGATCACAACTCGATGC
+CTACGAGGTGGTTGCGCTGTGGGTTCTTGCTGGGGACTCATGTTCCGCTGCTCCTGACGGGGTCACCTCG
+ATGAGCGAGTTCAGTTAGCTACTACGGTAGTCAACCCGACCGCTGCAGGCCCAGTTGAGGACATGTGTCA
+TCAGCCACACCACAGCGTGCCTGCGTCACCGGCCCCGGTGGCTACACACCCAGCAGCGGGCGCAGCGCTT
+CAGCGGCGGTGGTGATGACCCCGGGCAGATAGCCGTGCGGAGCCAAGTTGATGATTAATCCGTCGACACC
+GGCATCGAGCACCTTGGCCTGAATTTGGTCGGCGATCTGTGCCGGGCTGCCCACCACCACGCGACCGCTC
+ATCTCCGCGGGAATCGCATCTGGCGAGAGTGTCTCGTCGATCATCACCGTCAACAGCAGGCTGGTCTGAA
+GCGTCGACCGGTCCCGGCCGGCCTCGTCGCACCGCGCGGCCAGCGCCCGCATCTTGCGCGGCAGCTCGTC
+GACCGCCGCCACGATGTTGAGATGGTCGGCAAAGCGGGCGGCGATCGCGAATGTCTTTTTCTCACCACCG
+CCGCCGATCAAGATTGGGATGCGGTCGCGATACCGCGGCTCGGCCATCGCCGATTCGGTGGTGTACCAAT
+CGCCGAAAAACGTTGGGCGCTCACCCTTGACCATTGGCTCGAGGATCTGTAGCGCCTCTTCGAGCCGGTT
+GAACCGGTCACTGAAAGTGCCGAACTCGAAGCCGAGCTGGCGGTGTTCCAGCTCAAACCAACCGGCTCCA
+ATGCCGAGGATCGCTCGACCGGCGCTAACCACGTCGAGCGTGGTGATGATCTTTGCCAGCAGGGTCGGGC
+TGCGGTAGGTATTGCCGGTCACCAACGCGCCCAGTTGCAGCCGCTCGGTCGCCGTGGCCAGCGCACCAAG
+GGCCGTGTAGGCCTCCAGCATCGGCTGGTCGGGCGTCCCCAACATGGGCAGTTGGTAGAAGTGGTCCATC
+ACAAACAGGGAGTCGTAACCAGCCGCTTCGGCCTCACGCGCTTGAGCGATGACGGACGGGAAAAGCTTCT
+CCACCCCTGTGCCGTAGGAGAAGTTGGGGATCTGTAGACCCAGCCGAATAGTCACACTACCTACCGTAGC
+GATCGGCCGGTGAAGCGAAAGGTTCAGCCGAAGTGAGCCAGCGCGCCGTGGCTGACGTGCAGCGTCTGGC
+CGGTGATGTGGCGAGCCGCAGGGGTGGTAAGGAACAGCGCCAGCCGCGCAATCTCGGCCGCGACGGGCGC
+GGGTGTGTGCGAAAGCCCTTCGTAACCGGTCTGCACGCTGCGGCCGCAAGCGACTGTATTGATGGTGATC
+CCGCGCGTGCCGAAAACGGCGGCCTGGCCCGCGATCCAATTCGAGAGGGCCGCTTTGATCGCGGACTCGG
+CGCCACCGGCAGGCGGGTTCTCTGCCACCACGCTGACAATCGAGCCGCCGGAGCGCAGGTGATCGCCCAC
+GGATTGCACCGTCAGCACCACCGAGAGCACCGTCGCGTCGAGCGCATTGCGCCAGGCGTTGGCCGTGTCG
+GACACCGAGTAGGCGCGCGGGTCACCGGCATCCCAGGACGGCGCTGGCACGTTGACGATGGTGTCCAGGT
+GACGGGGGAACAGTCCCCGTGCCTCGGTGAGGCTGGTCGGGTCGGTGGTGTCGCACACAACGGCGTCCAC
+GTCGAGTTCCTTCGCGGCGACCTCGAGGTCGCCGCGGCGGGCACCCACCAGGGTGACCTTGTGGCCGTCG
+TTGCGAAAGCCTTCAGCCATTGTGCGCCCGAGATCGGTATCCCCGCCGGTGACCAGCACCTCCACTGCCA
+TGACCTCCTCGTGTTCAACGCTGAACCCAGACCCTGGACCGTTGCCTGGAATCGCATCGTGATGGCGTAA
+GCTCCGGTAGATGTTACTGGACAGTAGCTATTCGGGGAAACTCCGCACCGCCACGACGCGCAGACGATCT
+TGGTAACCATTAGGTTTGGCCAGTGCGTTGGATCGGACTGTCAACTGGCCTAGTGTCAGCGATGCTGGTC
+GCGGGCCTGGTGGCATGTGGATCGAATTCACCCGCATCGTCGCCAGCCGGGCCGACGCAGGGTGCCCGGT
+CGATCGTGGTGTTCGCGGCTGCCTCGCTGCAGTCTGCGTTCACTCAGATCGGTGAGCAGTTCAAAGCCGG
+CAACCCAGGGGTTAACGTCAACTTCGCTTTCGCTGGTTCTTCTGAGTTGGCCACCCAGCTGACCCAGGGC
+GCGACCGCCGACGTCTTTGCATCTGCGGACACCGCGCAAATGGACAGTGTGGCCAAGGCGGGGTTGCTGG
+CCGGTCATCCGACAAACTTCGCCACCAACACGATGGTCATCGTTGCCGCCGCAGGCAATCCCAAGAAGAT
+CCGATCTTTTGCCGACCTCACGCGGCCGGGGCTCAACGTGGTGGTCTGCCAGCCGTCGGTGCCATGCGGA
+TCGGCGACCCGGCGCATCGAAGATGCAACCGGGATTCATCTCAACCCGGTCAGTGAGGAACTTAGCGTGA
+CCGACGTTCTGAACAAGGTCATCACCGGGCAAGCCGATGCCGGGCTGGTCTATGTCAGTGACGCGCTCAG
+CGTTGCCACCAAAGTGACGTGTGTCAGATTTCCCGAAGCCGCGGGTGTGGTCAATGTCTACGCCATCGCG
+GTGCTAAAGCGGACCTCCCAGCCCGCTCTGGCCCGGCAGTTCGTGGCCATGGTGACCGCTGCGGCAGGTC
+GGCGGATCCTGGATCAGTCGGGTTTCGCCAAGCCCTGACGATGCACCCGCCTACGGATCTGCCTCGTTGG
+GTATATCTCCCGGCGATCGCGGGGATCGTGTTCGTGGCAATGCCGCTGGTCGCGATCGCCATCCGGGTCG
+ATTGGCCGCGTTTCTGGGCGCTGATCACTACTCCGTCTTCTCAAACGGCCCTGCTGTTGAGCGTGAAGAC
+CGCCGCGGCCAGCACGGTGCTGTGCGTACTGCTGGGCGTCCCGATGGCGCTGGTGCTGGCCCGCAGCCGC
+GGACGACTGGTGCGGTCGTTACGACCGCTGATCCTGTTACCGCTGGTGCTGCCGCCGGTAGTCGGGGGTA
+TCGCGTTGCTCTACGCGTTCGGCCGGCTCGGCCTGATCGGGCGCTACCTGGAGGCGGCCGGCATCAGCAT
+CGCATTCAGTACCGCGGCTGTGGTGCTGGCGCAGACCTTTGTCTCGCTGCCGTATCTGGTGATTTCCCTA
+GAGGGTGCAGCCCGCACCGCCGGAGCCGACTACGAGGTGGTGGCGGCGACACTTGGGGCGCGGCCCGGCA
+CTGTCTGGTGGCGCGTGACCCTGCCGTTGCTGCTCCCGGGCGTGGTGTCCGGATCAGTACTGGCGTTTGC
+CCGCTCGCTCGGAGAGTTTGGCGCGACCCTAACCTTTGCCGGTTCCCGGCAAGGGGTCACCCGTACCCTT
+CCGCTGGAGATTTACCTGCAGCGGGTGACCGATCCGGACGCGGCGGTGGCATTGTCACTGCTGCTCGTTG
+TGGTAGCGGCACTGGTGGTGCTGGGTGTGGGTGCTCGTACGCCGATCGGGACCGATACCAGGTAGCCGGT
+CATGAGCAAGCTGCAGCTGCGCGCGGTCGTCGCCGACCGGCGTTTGGACGTCGAATTCTCGGTGTCCGCG
+GGCGAGGTGCTTGCAGTGCTCGGGCCCAACGGTGCGGGCAAGTCCACCGCCCTGCATGTTATCGCGGGGC
+TGCTTCGCCCCGACGCGGGCTTGGTACGTTTGGGGGACCGGGTGTTGACCGACACCGAGGCCGGGGTGAA
+TGTGGCGACCCACGACCGTCGAGTCGGGCTGCTGTTGCAAGACCCGTTGTTGTTTCCACACCTGAGCGTG
+GCCAAAAACGTGGCCTTCGGACCACAATGCCGTCGCGGGATGTTTGGGTCCGGGCGCGCTAGGACAAGGG
+CGTCGGCACTGCGATGGCTGCGCGAGGTGAACGCCGAGCAGTTCGCCGACCGTAAGCCTCGTCAGCTATC
+CGGGGGCCAAGCCCAGCGCGTCGCCATCGCGCGAGCGTTGGCGGCCGAACCGGATGTGTTGCTGCTCGAC
+GAGCCGCTGACCGGACTCGATGTGGCCGCGGCCGCGGGTATCCGTTCGGTGTTGCGTAGTGTCGTCGCGA
+GGAGCGGTTGCGCGGTAGTCCTGACGACCCATGACCTGCTGGACGTGTTCACGCTGGCCGACCGGGTATT
+GGTGCTCGAGTCCGGCACGATCGCCGAGATCGGCCCGGTTGCCGATGTGCTTACCGCACCTCGCAGTCGT
+TTCGGAGCCCGTATCGCCGGAGTCAACCTGGTCAATGGGACCATTGGTCCGGACGGCTCGCTGCGCACCC
+AGTCCGGCGCCCACTGGTACGGCACCCCGGTCCAGGATTTGCCTACTGGGCATGAGGCAATCGCGGTGTT
+CCCGCCGACGGCGGTGGCGGTGTATCCGGAACCGCCGCACGGAAGCCCGCGCAATATCGTCGGGCTGACG
+GTGGCGGAGGTGGATACCCGCGGACCCATGGTCCTGGTGCGCGGGCATGATCAGCCTGGTGGCGCGCCTG
+GCCTTGCCGCATGCATCACCGTCGATGCCGCCACCGAACTGCGTGTGGCGCCCGGATCGCGCGTGTGGTT
+CAGCGTCAAGGCGCAGGAAGTGGCCCTGCACCCGGCACCCCACCAACACGCCAGTTCATGAGCCGACCCG
+CGCCGTCCTTGCGTCGCGCCGTTAACACGGTAGGTTCTTCGCCATGCATCAGGTGGACCCCAACTTGACA
+CGTCGCAAGGGACGATTGGCGGCACTGGCTATCGCGGCGATGGCCAGCGCCAGCCTGGTGACCGTTGCGG
+TGCCCGCGACCGCCAACGCCGATCCGGAGCCAGCGCCCCCGGTACCCACAACGGCCGCCTCGCCGCCGTC
+GACCGCTGCAGCGCCACCCGCACCGGCGACACCTGTTGCCCCCCCACCACCGGCCGCCGCCAACACGCCG
+AATGCCCAGCCGGGCGATCCCAACGCAGCACCTCCGCCGGCCGACCCGAACGCACCGCCGCCACCTGTCA
+TTGCCCCAAACGCACCCCAACCTGTCCGGATCGACAACCCGGTTGGAGGATTCAGCTTCGCGCTGCCTGC
+TGGCTGGGTGGAGTCTGACGCCGCCCACCTCGACTACGGTTCAGCACTCCTCAGCAAAACCACCGGGGAC
+CCGCCATTTCCCGGACAGCCGCCGCCGGTGGCCAATGACACCCGTATCGTGCTCGGCCGGCTAGACCAAA
+AGCTTTACGCCAGCGCCGAAGCCACCGACTCCAAGGCCGCGGCCCGGTTGGGCTCGGACATGGGTGAGTT
+CTATATGCCCTACCCGGGCACCCGGATCAACCAGGAAACCGTCTCGCTCGACGCCAACGGGGTGTCTGGA
+AGCGCGTCGTATTACGAAGTCAAGTTCAGCGATCCGAGTAAGCCGAACGGCCAGATCTGGACGGGCGTAA
+TCGGCTCGCCCGCGGCGAACGCACCGGACGCCGGGCCCCCTCAGCGCTGGTTTGTGGTATGGCTCGGGAC
+CGCCAACAACCCGGTGGACAAGGGCGCGGCCAAGGCGCTGGCCGAATCGATCCGGCCTTTGGTCGCCCCG
+CCGCCGGCGCCGGCACCGGCTCCTGCAGAGCCCGCTCCGGCGCCGGCGCCGGCCGGGGAAGTCGCTCCTA
+CCCCGACGACACCGACACCGCAGCGGACCTTACCGGCCTGACCGGATCCGGCCGCACCCCAAGTGATACC
+CCTGGGCGGGGTGTCAGCGCGGCCGGGCGCTCTTGAGCCGGCGCAGCGGCGTCCATGGAGCGCCGCCGGC
+CAACGCGGCGTTCTTGGCGCCGGCGCGAACGTTGTTCAGGTGCCAACCGGTGGTGGGTCGTGGTTGGCGA
+CTTGTACCGCTTCCGGTTCTCCATAGGTCGCGCCGGGGACGGGCAGCGGGTCGTGTGCGCGTCTTTCAGT
+GCACCGTGCGAAACGCCGACACCGTTGAACTCCACCTGAAAGCACCGCTGAACAGCAGAAAAGCGCCCAC
+GAAAACACCGTGGGGCGCCACACACGTTTGATCACGCCACAACCCACCGACACCGTCACTACCCTCAAAT
+CGTTACGCAGAAGCGGTATACCGATATCACGGCCCTGTGCTGGGCTAAGCCAGCGTCTGCAAGGAGAACC
+GCATGGACATCACGGCAACAACCGAATTTTCCGCCATGAACCTCGACGGCAAGACGGGTATAGGTTGGCT
+CGGCTACATCGTCATCGGCGGTATCGCCGGCTGGCTCGCCAGCAAGATCGTTAAGGGGGGCGGCTCGGGC
+ATCCTGATGAACGTTGTGATCGGCGTCGTCGGGGCATTCGGCGCCGGCTTGGTCCTTAACGCGCTGGGCG
+TCGACGTCAACCATGGCGGGTACTGGTTCACCTTCTTCGTCGCCCTGGGCGGGGCTGTCGTCCTGCTGTG
+GATCGTCGGCATGGTGCGCAAGACCTAGCGCTAAACTGTTGTCGGCCATGCAAATTGAGTGTGACTGCGG
+CGGCCGGCGACGGGTAGCGGCATGATGGAGTGATGGTCTCACCGGCGACCACGGCGACGATGAGTGCGTG
+GCAGGTGCGTCGGCCCGGCCCGATGGACACCGGCCCGCTCGAACGAGTGACCACCCGGGTGCCGCGCCCG
+GCGCCATCGGAGTTGCTGGTGGCCGTGCACGCATGCGGGGTGTGCCGCACCGATCTCCACGTGACCGAAG
+GTGACCTGCCCGTGCACCGCGAACGGGTGATTCCCGGCCACGAGGTAGTGGGAGAGGTCATTGAGGTGGG
+CTCAGCGGTGGGCGCGGCTGCCGGTGGCGAATTCGACCGAGGAGACCGGGTGGGTATCGCCTGGCTGCGT
+CACACTTGCGGGGTCTGCAAGTACTGCCGGCGCGGCAGCGAGAACCTCTGCCCGCAATCCCGCTACACCG
+GCTGGGACGCCGACGGGGGATACGCCGAATTCACGACGGTTCCTGCGGCTTTCGCGCACCATCTGCCGAG
+CGGCTATAGCGACAGCGAGCTGGCGCCGTTGTTGTGCGCCGGCATCATCGGATATCGATCGCTGCTGCGC
+ACCGAGCTACCACCCGGTGGCCGGCTGGGTCTCTACGGATTCGGCGGCAGTGCCCACATCACCGCCCAGG
+TCGCGTTGGCGCAAGGCGCCGAAATACATGTGATGACACGCGGGGCCCGCGCGCGCAAGCTGGCGCTGCA
+ACTTGGCGCTGCATCGGCTCAGGACGCCGCCGACCGGCCACCCGTGCCGCTGGACGCCGCGATCTTATTC
+GCCCCGGTCGGGGATCTGGTGCTGCCCGCGCTGGAAGCGCTGGACCGTGGCGGCATCTTGGCGATCGCCG
+GGATCCACCTGACCGATATTCCGGACCTGAACTACCAGCAGCACTTGTTCCAGGAGCGTCAGATCCGGTC
+GGTCACGTCGAACACCCGCGCCGATGCGCGCGCGTTCTTCGACTTCGCCGCCCAGCATCACATCGAGGTC
+ACCACGCCGGAGTACCCGCTTGGCCAAGCCGATCGTGCGCTGGGCGACCTGAGCGCCGGCCGCATCGCCG
+GTGCCGCCGTGCTGCTGATCTGACCGAGCTCAGGTCGACAGGTGCCAGACCAGGGCAGCGGCCAGGGCAC
+CCATCCCGTTCAGCGACCAATGCAGTGCGATCGGTGCGATCAGGCTGCCGCTGCGCCGTCGCAGCCAGCT
+GAACACGAATCCGGCCACTCCGGTGGCCAACACCGCCAGCATGACACCGGCCACCAGCCCGATGATCCCG
+CCACCGAACAGTCGAGTGAAGCCGACATTGCTGCTCGTGAGCCCCAGCGACGTCGCAATATGCCACAGAC
+CGAACAGCACCGAACCCGCCACCGCGACACCCCGGAATCCCCAAGCCCGATTCAGCGCCCCATGCAACAC
+ACCGCGGAAGGCCAGCTCTTCGGGGATGACGGTTTGCAGCGGGATCATGACCATCGAGGCGATCACCGCG
+CCGGAGATCGTCGCGTAGTGATGGTTCATGAACATCGGCCGGGTTATCGGCAGCAGGACACCTACCGAGA
+TCACCGCCACCACCAGGGCAACGGCCGCTAGCGCATAGACGAGCCCGGATTTCCAGTGTTGGCGGCTCAG
+TCCGAGTTCAGCCCAGCCCAGGCCTCTACTCCGCACCAAGATCACCAGTCCGACCGCGGCGGCCGGGACG
+GTGGCGATGCTCGCCCACGGTGTGGTGAAATGCGCGATCAGGTTCGTCAGTACCAGCACCAGGACGACGA
+CGGCGATGTCGACATATATCCGGAACCGGTGCATCACCGAGAGGTGCGACACCAGTGGACCTGGATGAAC
+GGCTGCGCAAGCAGTCAAGTGGTCAGACATCGTCAGCAGAGTCTACCGGCGGAGGGCTCGGTGTCCGCTC
+TCGCGCGTAGGCCTTGAGCTCGGCTGCGAGCGCGTCTGCCGCCAACAGCTGGGGAAGCAGCTCCGATTCA
+GAGGTTCGGGCGCGAAACACGAGCCCGACGGTCACGTTGTGCTCAGGGCGGTAATCGACGGTGATTGTGT
+CGCCGGCGCGCACTGTTCCGGGAGCGATCACCCGTAGGTAGGCGCCTGGTTTGGCGGCCCGGGTGAAGGT
+CTTGATCCAATAACGCAAATCCAGGAAGGCCGCGAAGGTCCGGCACGGGATCCGGGGCGCCGAGACTTCC
+AACACCAATCCGTCGGAGCCGATGCGCCAGCGTTCACCAATCCGCGCGTACGTCACGTCGACGCCCGAGG
+TGGTCAGATTCTCGCCGAACATTCCGTTGTGAAGGGTGCGGTGAAGCTGGGTTTCCCACGCGTCGAGGTC
+TTCTCGCGCATACGCATAGACGGCCTGATCATCACCGCCATGGAGCTTCGGGTTGCCGACGGTGTCGCCA
+ACCAGGCCGCTGCCGACACCCGCATGCATCGACCCGGGTGCCCGCACCATGACCGCCTCAGATGCCGCCA
+CTTTGTCGATTCCGGTCAACTTCGACTGCGCGCGCGGATCAGGGTTCGCCCGAACACGAGCCAGGTTGAC
+CGACAACACATGCGCCACCCGCACAGGGTAGCTCTGACGCGCGTTGGTCCACGCCAGCCGGCGCGGCGCA
+ACGGTCACTCCTCGCCGCGAGCCCGAGCCTCGTAGGTCCTGCGCTTCTCCATGTCGACATCGTCGGTGAA
+GACATGCTCGCCGCCGAGGAGTCGGTTCAAGCCCTCGGAAACCTGGCGCGGCATGAACCGCTGTGCCACG
+ATCATCGAGCCAGCCGCTTTCGTGACCCGCACCCGCGGTTTGGGATGAACAATCAGCCCGACGATCGCGT
+CGGCGATATCGGCCGGCTCGGCGTTCTTGAATCCTTTGATCCCACCGGTGCCCGCAATGAGCTCGGTGTT
+GACAAACGACGGCAACACCATCGAGAACTTCACGCCGGCCGAACGGTATTCAAGCCTGGCCGAATCGGTG
+AACGCGACCACCGCGTGCTTGCTGGCACAGTAAGTGGCCACGCCTACGGCGTAGATTTCCCCGGCAAGCG
+AGGCGACATTGATAACGTGTCCCCGCCCGCGCGGGACCATCCGCTGCGCCGCCAGCTTGCTACCCAAGAT
+CACCCCGTAGACGTTGATGTCCAGGATTCGGCGGGTTACCGGGTCTGGTTCGTCGACAATCCGCCCCACG
+GGCATGATGCCGGCGTTGTTGACCAGCACGTCGATCGGGCCGAGTTGGCGCTCGACGGCGTCGAGGAATC
+CCGAAAACGAATCCGGGTCGGTGACATCGAGTTTGCCGTACATGTCGAGGTCGAGATCGGCACCCGACTC
+TTTCGCCATCGCCTCATCGATGTCGCCGATAGCGACCTTGGCTCCCAAGTTGTGCAGCGCGGCCGCTGTG
+GCCAATCCGATCCCCCGGGCGCCGCCGGTGATGGCGATTACTTTGTCCTGGACCTTGTCCCGGATCTTGA
+CGCCGATGGATGTCCTGCCTGGCACTGTCGTCCCTTCGCTCGGCGGGCCTTAGCCGCCGTCCAATGCGGT
+CGCGCCCGTGTAGTCACGGTAGCCGCGAACGCCGATGAAACAGCTACGGTGTGCACGTGCCCGAACGATT
+GCTCGATGCCGTGCGTGTGCTCGACTTGTCCGACGGCTGTTCTGCTGGAGGCACCGATATGGTGACACGA
+CTGCTCGCCGACCTGGGCGCAGACGTTCTCAAGGTGCAACCCCCCGGCGGCAGCCCAGGACGCCACGTGC
+GGCCCACGCTGGCCGGCACCAGCATCGGGTTCGCCATGCACAACGCGAACAAACGCAGCGCAGTGCTCAA
+CCCGCTCGACGAGAGCGACCGTCGGCGGTTCTTGGACCTCGCCGCCAGCGCCGACATCGTCGTCGACTGT
+GGTCTTCCGGGACAGGCCGCCGCGTACGGGGCATCGTGTGCCGAGTTGGCCGATCGCTACCGACACCTGG
+TGGCGCTGTCGATCACCGACTTTGGCGCTGCCGGTCCGCGGTCGTCATGGCGCGCGACCGATCCGGTGCT
+GTACGCGATGAGTGGTGCTCTCTCGCGGTCGGGCCCTACCGCCGGCACGCCGGTACTGCCGCCGGACGGT
+ATCGCTTCGGCAACCGCAGCGGTGCAGGCAGCCTGGGCCGTACTGGTCGCCTATTTCAACCGATTACGTT
+GTGGTACTGGGGATTACATCGACTTCTCCCGGTTTGACGCCGTCGTTATGGCGTTGGATCCCCCCTTCGG
+GGCGCACGGGCAGGTCGCAGCCGGCATCCGCAGCACCGGGCGATGGCGGGGACGGCCCAAGAACCAGGAC
+GCTTACCCGATTTATCCGTGCCGGGACGGCTACGTACGGTTCTGCGTGATGGCGCCGCGGCAGTGGCGCG
+GGCTGCGCCGCTGGTTGGGGGAGCCCGAAGATTTTCAGGACCCCAAGTACGACGTGATCGGCGCACGTTT
+GGCCGCATGGCCGCAGATCAGCGTGTTGGTCGCGAAGTTGTGCGCCGAGAAGACCATGAAGGAGTTGGTG
+GCAGCCGGCCAAGCGCTCGGGGTTCCCATTACCGCGGTGCTGACACCGTCGAGAATCCTGGCCTCCGAAC
+ACTTCCAGGCGGTGGGTGCGATCACCGATGCCGAGCTCGTTCCGGGGGTGCGCACCGGGGTGCCTACCGG
+ATACTTCGTTGTCGACGGGAAGCGCGCCGGTTTCCGTACTCCGGCCCCCGCCGCGGGGCAGGACGAACCG
+CGCTGGCTCGCGGATCCAGCGCCGGTGCCCCCACCCTCAGGCCGGGTCGGCGGCTATCCATTCGAAGGTC
+TGCGGATTCTTGATCTGGGCATCATCGTGGCCGGCGGCGAGCTCAGCCGGCTGTTCGGCGACTTGGGCGC
+CGAGGTCATCAAGGTCGAAAGTGCCGACCACCCCGACGGGTTGCGGCAGACCCGAGTCGGGGATGCGATG
+AGTGAATCATTCGCGTGGACCCATCGCAATCACCTCGCGCTGGGCCTGGACCTGCGCAACAGCGAGGGCA
+AAGCGATCTTCGGTCGCCTGGTCGCTGAATCCGACGCGGTGTTCGCCAACTTCAAACCGGGAACCCTTAC
+CTCACTTGGGTTTTCCTACGATGTACTGCACGCCTTCAACCCCCGGATCGTGCTCGCCGGGAGTAGTGCA
+TTCGGGAACCGAGGGCCGTGGAGCACCCGGATGGGCTACGGGCCACTGGTGCGCGCCGCCACCGGGGTCA
+CCCGTGTTTGGACATCCGATGAGGCGCAGCCGGACAACTCTCGGCATCCCTTCTACGACGCGACGACGAT
+CTTCCCCGACCACGTTGTCGGGCGGGTCGGTGCCCTGCTCGCGCTGGCGGCCCTGATCCACCGCGATCGA
+ACTGGCGGCGGAGCCCACGTCCACATCTCCCAGGCCGAAGTCGTCGTCAATCAGCTAGACACCATGTTCG
+TTGCCGAGGCCGCCCGAGCGACCGACGTTGCCGAGATCCACCCGGACACCAGTGTGCATGCGGTCTACCC
+TTGTGCTGGCGACGACGAATGGTGCGTCATCTCAATCCGCTCCGACGATGAATGGCGTCGCGCGACATCT
+GTTTTCGGCCAGCCTGAATTGGCGAACGACCCACGCTTCGGGGCAAGCCGGTCACGCGTGGCCAACCGTT
+CGGAGTTGGTGGCCGCAGTGTCGGCCTGGACCAGCACCCGTACCCCGGTGCAAGCGGCCGGCGCGCTGCA
+GGCGGCCGGAGTTGCGGCCGGCCCGATGAATCGCCCGTCGGATATCCTCGAGGATCCCCAGCTGATCGAG
+CGAAACCTGTTCCGCGACATGGTGCATCCGCTGATCGCCCGTCCGCTGCCCGCCGAGACGGGTCCGGCTC
+CGTTTCGTCACATTCCGCAGGCACCCCAACGCCCGGCGCCGCTGCCCGGACAGGACAGCGTTCAGATCTG
+CCGCAAGCTGCTCGGCATGACCGCGGACGAGACCGAACGCCTAATCAACGAGCGCGTAATGTTCGGGCCG
+GCCGTCACTGCCTAAGTGGTCTCGCCGGTGTCGTTCGTCGACGGTCGGCTGATTGCCCTTCCGGCTCCGA
+GATCGACGTTTTGCCCGCCTGTTCGTGCTTTATCTGCGAAGCCCCGATCTGGGCGCATCGGGGTGACGCA
+TTCGGGCAGCTAAAGCTTTTCGACCCGCAAGCCGGCGGTGCCCCTCCTCGTTCCGCTGCCCGGTCTGCTC
+GATCGGTTCGGGGTCGCCGCGCTAGGCCCAATTGCCCGGCTCCTCCTCGGGCCGTTCCACGACCCGCATC
+GTCGCCGGGCTAGGTTCAAGCCATGCCGGTAGACCCCAGGACGCCAGTGCTGATCGGCTATGGACAGGTC
+AACCACCGAGGCGACATCGACGCCGAGAAGCAGTCCATCGAACCCGTCGACCTGATGGCCGCCGCGGCCC
+GGAAAGCCGCGGATTCGACGGTGCTCGAGGCGGTGGATTCGATCCGTGTGGTGCACATGCTGTCGGCGCA
+TTACCGGAATCCCGGGCAGCTCCTCGGCGAACGAATCAAGGCGAGGACCTTCACCACCGGTTACAGCGGG
+GTGGGCGGCAACATGCCGCAATCCCTGGTCAACCGGGCATGCCTGGACATCCAGCGCGGGCGGGCCGGCG
+TGGTGCTGCTGGCTGGCGCCGAAACCTGGCGCACCCGAACGGGCCTGCGCGCCAAGGGCAGCAAACTGGA
+GTGGACTGTGCAGGACGAATCCGTTCCGCTGCCGGACATGGCCGGCGACGACGTTCCGATGGCCGGTGCG
+GCTGAGCTGCGGATCAACCTGGACCGGCCGGCCTACGTGTACCCGATATTCGAGCAGGCGCTGCGCATCG
+CCTACGGCGAGTCGATCGAGAACCACCGAAAGCGGATCGGCGAGCTGTGGGCGCGGTTCAGTGCCGTAGC
+TGCTGACAACCCGCACGCGTGGATCCGCAACCCGGTTACGGCTGACGAGATCTGGCAGCCCGGCCCACAG
+AACCGGATGGTCAGCTGGCCCTACACCAAGCTTATGAACTCCAACAACATGGTTGACCAGGGTGCCGCGC
+TGCTGCTGACGTCGGTCGAACGTGCGACACGTCTGCGAATACCGGCCGAACGCTGGGTTTATCCACAGGC
+TGGCACCGACGCCCACGACACACCGGCCGTCGCCGACCGCCACCGACTGCATCGGTCGACGGCCATTCGG
+ATCGCCGGTGCCCGGGCGCTGGAACTGGCTGGGCTGGGGCTCGATGACATCGAATACGTCGACCTGTATT
+CGTGCTTTCCCTCCGCTGTCCAAGTCGCCGCAATCGAACTCGGCCTGGACACCGACGATCCTGCCCGCCC
+GCTGACCGTCACCGGGGGCCTGACCTTCGCCGGCGGGCCGTGGAGCAATTACGTCACGCACTCCATCGCC
+ACCATGGCTGAACTGCTGGCGGCCAATCCCGGGCGCCGAGGTCTGATCACCGCCAACGGCGGTTACCTGA
+CCAAACACAGTTTCGGGGTCTACGGCACCGAGCCGCCGTCGGAATTCCGCTGGGAGGACATGCAACCCGC
+GGTCGATAGGGAGCCCACCGGAGATGGGTTGGTCGAGTGGGAAGGCATCGGCACCGTCGAAGCGTGGACC
+ACACCAGTCAACCGGGACGGACAACCCGAGAAGGCGTTCCTGGCGGTGCGCACGCCCGACGGGTCGCGCA
+GCTTGGCCGTGATCACCGATCCCGCATCGGTGCAAGCAACGGTGCGCGAGGACATCGCCGGCGTCAAGGT
+TGCCGTCGCCCCCGACGGCACCGCGACCCTGCGATAGCCGGCGGGCAGCACGAGTCACGTTCCAGAAGCA
+ATGGTCGCGCAAGCGACACTGACGTGCCTATTGTCATGAGGAGACGTTGGGGGAGGTGAGGCCGGGTGCA
+GATCCTGGTTACCGACGCCACGGGTGCCGTCGGGCGGTCGGTCACTCGGCAGTTGATCGCTGCCGGACAC
+ACGGTGAGCGGTATAGCCCAGCACCCGCACGATGCTCTGGACCCCCGCGTCGACTATGTTTGCGCGTCGT
+TGCGCAACCCAGTGCTGCAAGAGTTAGCCGGCGAAGCCGACGCGGTGATCCATCTCGCCCCGGTCGACAC
+CAGCGCCCCGGGCGGTGTTGGCATCACCGGACTGGCACATGTGGCCAACGCGGCCGCCCGCGCCGGTGCC
+CGGCTGCTGTTCGTTTCTCAGGCCGCTGGGCGACCCGAACTATATCGGCAGGCTGAGACGCTGGTGTCCA
+CCGGTTGGGCACCCAGCTTGGTCATCCGTATTGCGCCACCGGTCGGCCGCCAACTCGATTGGATGGTGTG
+CCGGACAGTGGCCACGCTGCTGCGGAGCAAAGTCTCGGCACGGCCGATACGAGTGCTACATCTCGACGAC
+TTGGTCCGCTTCCTGGTTTTGGCGCTGAATACCGACCGCAACGGTGTCGTTGACCTGGCCACCCCTGACA
+CCACCAATGTGGTCACCGCGTGGCGGCTGCTCCGATCCGTGGACCCGCACTTGCGAACACGTCGGGTCCG
+CAGCTGGGAGCAATTGATTCCCGAGGTGGATATCGCTGCCGTGCAGGAGGATTGGAACTTCGAGTTCGGC
+TGGCAAGCGACCGAAGCAATTGTCGACACCGGGCGGGGCCTCGTCGGCCGCAGACTGCACCCGGCAGGCG
+CGACCAACGGATCGGGTCAACTAGCACTGCCGGTGGAGGCGCCCCCGCGGTCTGTGCCTTCCCACGGGGA
+ACCCTTGGGCAGCGCGGCTCCAGAAGGGTTGGAGGGAGAGTTCGACGACCGTATCGACGAGCGGTTCCCG
+GTCTTCAGCTCGGCCAGTCTCGCCGAAGCGCTGCCGGGTCCGCTGACCCCGATGACGCTGGATGTCCAGT
+TGAGTGGACTGCGCGCGGCCGGTCGGGCGATGGGTCGGGTACTGGCGCTTGGCGGTGTCGTTGCCGATGA
+GTGGGAGAGAAGAGCCATCGCGGTGTTCGGTCACCGCCCGTATATCGGAGTGTCGGCCAATATTGTGGCC
+GCCGCCCAACTGCCGGGGTGGGACGCGCAGGCCGTAGCCCGGCGGGCACTGGGCGAGCAACCGCAGGTCA
+CTGAGCTGCTTCCGTTTGGTCGACCGCAACTTGCGGGCGGACCGCTCGGCTCGGTCGCGAAGGTGGTCGT
+GACGGCGCGGTCGCTGGCCCTGCTGCGCCATCTCCGGAGCGACACACACCACTATGTTGCCGCCGCAGAT
+GCCGAGCACCTCGCTGCCGGGCAGCTTGCCTCGCTACCGGACGCCGGCTTGGAGGTCCGGATTCGGCTGT
+TGCGTGATCGCATCCACCAAGGCTGGATTCTTACGGTGCTGTGGGTGATCGACACGGGCGTCACAGCGGC
+GACGTTAGAGCACACCCGCGCAGGCTCCGCGGTGTCCGGAGGGGGCATGATCATGGAAAGTGGCAGAATC
+GGCGCCGAGATTGCTCCGCTGGCTGCGGTGCTGCGCGCCGACCCGCCGCTGTGCGCGCTGGCCAACGACG
+GCAACCTCGCCAGCATCCGCGCGCTGTCTGCTCCCGCCGCCGCCGCAGTTGACGCGGTCATTGCCCGGAT
+AGGGCACCGCGGGTTAGGCGAAGCCGAGCTGGCTAACCTGACGTTTGCCGACGATCCGGCGCTACTGCTG
+AAGACAGCCGCCGAAATCGCCGCGCGGCCCGCCGGGCCAGCTCACCCAGCGACGTTGATCCAGCGACTGG
+CTGCCGGCACGCGCAGTGCCCGGGAGCTGGCGCACGACACCACCATCCGATTCACCCATGAGCTCCGGAT
+GACATTGCGGGAGTTGGGATCTCGACGAGTCGCGGCGGATGTGATAGACGTCGTTGACGACGTGTTCTAC
+CTGACCTGCGACGAACTGATTACCACGCCGGCCGACGCTCGGCTGCGAATCAAACGTCGGCGCGCCGAAC
+GAGAACGCCTGCAGGCACAGCGCCCGCCAGACGTTATCGATCATGCCTGGGTACCCGTGGAGTAGCGGTC
+AACACACGTCAATTCGTCGTCAGGTCCGCCAACGGCCACTGCGGATCAACCAGCCTGTCAACGTCGACCG
+GGTTCCCGGACCGGATCAGGCCCTTGACGTCGTCCACCACGTCCCAGACGTTGACATTCATCCCGGCTAG
+CACCCGGCTGTCGCCGTCGAGCCAGAAGGAGAGGAACTCGCGGCCGGCAACGTTGCCACGGAACACCACC
+CGATCACAGCTGGGGGCGTGGCCGACGTACTCCATGCCGAGGTCGTATTGATCGGTGAACAAATAGGGCA
+GTTCAGCGTATTCGCCCGGCCGGCCCAGCATGCCGGCAGCCGCCACCGCGGGTTGTTTGAGCGCGTTGGC
+CCAGTGTTCGGTACGGACGCGGGTACCCAATAGCGGGTGTTCAGCGGCGGCAATGTCGCCGACTGCGTAG
+ATGTCGGGATCGCTGGTGCGCAGCGATGCATCAACCAACACACCGCCCTCGCCCATCGCCAGCCCGGCCT
+GTTGGGCGAGTTCTACGTTGGGCTTCGCGCCCACAGCGACTAGCACGGCGTCGGCGGCAACCGTCGACCC
+GTCACGCATCTTGAGCCCGGTCGCCTTGCCGTCGGCTGCAGTGATCTCTTCGAGCTGGGTCTGCAACCGT
+AAGTCCACCCCTTGATCTCGATGTAGGTCGGCAAACACTTTGCCAACCGCTTCCCCGAGCGCGGCCAGCA
+GCGGTTGTATGGCGGTCTCGACGACGGTGACGTCGACGCCACGTTGACGCGCACTGGCGGCCACTTCCAG
+GCCTATCCAGCCGGCACCCACCACTGCGAGGGAAGACCCCTGCACCAGAACGGAGTTCAATGCCACGGCG
+TCGTTGTAGCTGCGCAGGTAGTGGACGCCGGCGGCATCGGATCCAGGTATTGGTGGGCGCCGTGGGGCCG
+ATCCCGTGGCCAACAGCAGCTTGTCGTAGCGCACCGCAGCGCCGTCGGGAAGCTCTACCGTGTGTGCGGA
+CCGATCCAATGACGACACCCGCACGCCGAGCCGCACATCCACGTCATGGTCGCGGTACCAATCGGAGGTC
+TGGATGGTGAAGTCGCTCAGCGACTTTTTGCCGGCCAGAAACTCCTTGGAAAGCGGCGGCCGGTCGTAGG
+GCAGGTGCTCTTCGTCGCCGAACAAGATAATCCGACCGCCGAAGTCGCTGCGGCGCAACGCCTCTACGGC
+TTTAGCCCCGGCAAGTCCCCCGCCAACAATGACGAACGTGGTTGAGCTGGCCATAATTGCTGCTCCGTCC
+TGTTGTGTGCGGTGCCGCTTGACAGCCTACGAGCCGGTCGCGTACCTGGGTCAACCGGTCACCTGTAGGC
+GCAGCTCGTCGTCTAACGCCACTCGCACTAACGCAGCAGCGAGCAGCGCATTGGAGCTGGGTGCCACCGA
+CGCCAGCTTCTTCGGGTCAGTGGGCAAGCCGAGCTGCTTCGCCGCGGCGGTGGCTCGATCGTCGAAATAC
+GGTCGTACCCAGATCCAGACGTCTTGGACCTCGCGTAAGAAAATGTCGGCACCGGTGTCGCCGATTCCGT
+TGAAAGTCTTGAGCATACGTTTGGCGGCCGAAACGTCGGGTCGTGTGCGCTGGGCGAGTTCCCGCAAATC
+ACCGGAGTACTCGTCGCGAACCCGGTGAGCGATAGCGGTGAGCCGGGTGGCTGAGCTCTCGTCATACCGC
+ACGTAGTGGGCACGGCCAAACGCACTGATCATCGTTTGTCGCTCTGCTGACAGCACAGCTTTGGGTGTCC
+GCAGGCCCGAGCAGAACAATTCCCGGGCGGCACGTGCTGCCGTGGCGGCACCGATCGGCTTGCTGGCCAG
+CATGCACAGCACCAGCAGCTGAAACAGCGGCATCGGTTTGTCCCTGATCCGGATTCCCGCCTCCGCCGCG
+TAAGTGGTGCCGGCGAGTTTAAGCAGTCGTCGTGCCAGTGGCTCCGGCTTGATCACAAGCAACCGCATAC
+CCGCAATGCGTGGCGGCAAACCGCGACTATTGCTCGGGCAAGCGCGCTCCGGCGGCCTAAGCCCCGGTTC
+CGGCCAACCCCTGTCAGTCCAAATCCACCCGGATGGTCAGCAAGTCGGTGCCCATCGCGCGTACGCCGGC
+ACTGTTCAGCCGGGGTAGGCCGCGCAGCCGCTGCCTCGGATCGTCGTCGGGTAGCAGGTAGGCGGTCCCA
+CTGCGCCATCGGCCGCCGATGCGGACCCGCACGGCGGGGTTGGCCTTGATGTTGTAGACGTAATCGGAAT
+GCTCGCCGTGCTCGGACACCATCCAGAACTGGTTGTCTACGACGCGCCCGCCCACCGCGGTACGCCGCGG
+CTGTCCCGTTTTGCGGCCGATGGTTTCGAGCATGGTCATCGGCAGTTGCCGGCCGATTGGATTGACCACG
+AACCGTTGCACGCGATGGACGAATTCCCGCTTGAGATTCATAGCTGCATTCAACGCTACCGATCTGGCCG
+CGGCCTCACGTTGGTGCCCCGATAGGGCCGAGCCGCCGCAGTTGTGTCACGTGCCGAGGTGACAGCTCCT
+CAAGGCAGGTCACGCCCAGTAGCCGCATGGTCCGGATCACACCTGTCTGAAGGATCTCGATCGCGCGGTT
+GACGCCCGCCTCACCACCGGCCATCAGCCCGTAAAGGTAGGCCCGCCCGATCAGCGTGCACCGTGCCCCC
+AACGCGATCGCCGCGACGATATCGGCGCCCGACATGATGCCGGTGTCCACCAGGATTTCGGTGTGTTTGC
+CCAGTTCGCGTGCCACGTGGGGCAACAGGTGGAAGGGTACCGGGGCTCGGTCAAGCTGGCGGCCGCCGTG
+ATTGGACAACACGATGCCGTCGACGCCGCGGTCCACCACGGCGCGGGCGTCGTCGAGTGTTTGGATCCCT
+TTGACAACGAGCTTGCCCGGCCACTGCGACTTGATCCAGGCCAAATCGTCGAAGGTGAGGCTGGGGTCGA
+ACACGGTGTTCAAGTACTCGCCGACGGTGCCAGGCCAGCGATCCAGTGAAGCGAAGGCCAGCGGTTCGGT
+GGTCAACAAGTCGAACCACCACCGCGGGTGTCCCATCGCGTCGAGAACGGTTCGCAGCGTCAGCGCCGGC
+GGGATGGACATCCCGTTGCGGACATCGCGTAGCCGGGCACCGGCGACCGGGACGTCGACCGTGACCAGCA
+TGGTGTCAAATCCCGCGGCGGCGGCGCGCCGCACCAATGCCATCGAGCGGTCTCGATCACGCCACATATA
+CAGCTGGAACCATTTGCGGCCCTGCGGCACAGCGATGACGAGGTCTTCGATGGCACAGGTGGCCAGGGTG
+GATAGCGAAAACGGGATCCCAGCCGCGGCCGCCGCCCGCGCGCCGGCGATCTCGCCCTCGGTGTGCATCA
+AGCGGGTGAACCCGGTTGGCGCGATCCCGAATGGCAAGACGGTGGGCTGACCGAGGACGTTCCAGCCGGC
+GCACACGGTGGTGACGTCACGCAGGATTGTCGGGTGAAACTCGATGTCGCGGAACCCTTGTCGAGCACGC
+GCGATGGACAGTTCGTCCTCGGCAGCCCCGTCGGCGTAGTCGAACGCCGCCCTAGGGGTACGCCGTTTGG
+CAATGCGTCGCAGGTCCTGGATGGTCAGCGCGGCGCCCAGGCGGCGCTTGGAGGTGTCGAACTGCGGCCT
+GTTGAACTGGAGCAGGGGTGCCAGATCGCGCACTCTGGGCACTCGCCGGTTGACCGCCATCCGTTTATCT
+AACCAGTGTGATATGAAGTCAGCAAGCGACCCGTTCGACCTGAAGCGTTTCGTGTACGCGCAGGCTCCGG
+TCTACCGCAGCGTCGTCGAGGAGCTGCGCGCCGGACGAAAGCGCGGGCATTGGATGTGGTTCGTCTTCCC
+ACAACTCCGCGGGCTAGGTAGTAGCCCACTGGCAGTGCGCTACGGCATCTCCTCGCTCGAGGAAGCCCAG
+GCCTATCTGCAGCATGACCTGCTCGGGCCCCGCTTGCATGAGTGCACCGGGTTGGTCAACCAGGTGCAAG
+GCCGCTCAATCGAGGAAATCTTCGGCCCGCCCGACAACCTCAAGCTGTGCTCGTCGATGACCCTGTTCGC
+CCGTGCCACCGACGCCAACCAGGACTTTGTCGCGCTGCTCGCCAAGTATTACGGCGGCGGAGAGGACCGG
+CGGACGGTGGCATTACTGGCGGTCACATAGACCGCGCGATCCACCGGGGCGTCGACGCCTGACAGCGGAT
+GTAGGTTCGGGCTCATGGAGAAGGTGATCGCCGTGCTCATGCGGCCCGAGCCAGACGACGACTGGTGTGC
+CCGCCAACGAGCTCAAGTCGCCGACGCCCTGCTGGGACTGGGCGTTGCTGGGCTGTCGATCAATGTCCGG
+GACAGTACCGTGCGCGACTCACTGATGACCCTGACAACGCTGTACCCACCGGTCGCAGCGGTGGTCAGCC
+TGTGGACCCAGCAGTGCTATGGCGAGCAGGTAGCAGCCGCCCTCAGGCTACTGGCTCAGGAGTGTGATGA
+ACTCGGCGCATACCTGGTGACCGAGTCGGTTCCGCTGACCTTCCCATCGCTCGTCGAGTCCGGTTCTCGT
+ACACCGGGTCTGGCCAACATCGCGCTCCTGCGCCGGCCCGATGGCCTGGACCAGGCGACCTGGCTGACCC
+GCTGGCAGCGCGACCACACGCAAGTGGCTATCGAGGCACAGGCGACATTCGGCTACACCCAGAACTGGGT
+GGTACGAGCCCTCACCCCAGAGGCACCGGGAATCGCGGGCATTGTCGAAGAGTTGTTTCCCGTGGCGGCG
+ACAACCGATCTGAAAGCCTTCTTCGGAGCCGCCGACGACAACGATCTGCGGAATCGGATAAGCCGGATGG
+TCGCGAGCACATCTGCATTCGGTGCCAACCAGAACATCGACACCGTGCCAACCAGCCGCTACGTGTTCAG
+AACACCGTTCAAGGATTGAGGAACGTGAGATGACAACACTCAACGAAGCCGCGGCACTGGCGGCGGCAGA
+ACGTGGGCTTGCGGTGGTTTCCACCGTTCGTGCCGACGGCACCGTGCAGGCGTCGCTGGTCAACGTTGGA
+CTGTTGCCGCATCCTGTCAGCGGCGAACCATCTCTGGGATTCACCACCTATGGCAAGGTCAAACTCGGCA
+ACCTTAGGGCGCGCCCACAACTGGCCGTCACGTTCCGCAACGGTTGGCAGTGGGCGACCGTCGAAGGCCG
+AGCACAACTTGTCGGCCCCGACGATCCGCGGCCGTGGCTGGTCGACGGCGAGCGATTGCGGCTGCTACTC
+CGCGAGGTCTTCACTGCGGCGGGTGGCACGCACGACGACTGGGACGAGTACGACCGGGTGATGGCGCAGG
+AGCAGCGCGCCGTGGTGCTGATCACGCCCACCCGCATCTACAGCAACGGCTGAGGGACTCAGCAAACGGC
+GTCGCTCGTGCGACCTGCGGGGTCGAGTTGGGTTGGGTTGAGTCGGGCGGCTGCGATGATAGCTCGCAGT
+GTGCGCCGGCAGCGTCCGCAGTCGCCGCCAGCCCCGCACACAGCGGCCACTTCTTTGGAGGTCGACGCAC
+CTCGCGCCACGGCGTCACACACGGTTTGGTTGGTGACGCCGACGCACAAGCACACGTACATCAGCAAACC
+CCCAGCAGATGCTGCGTCGGCGAACGATCAAGCCGCATATTAGTGGAGTCTAGCCTAAGCTGATTAGTGG
+AGTCTAACCTAACAATGACCCGCGGCTTGGACTTTGCGCCGGCGAGACGCGCCGACGCCGCAACAAACCC
+TGCGCCGACCCGTACTCGCTGCACTAGATTGAGACGCGGCACGCAAACGTGCTGTTATCAGCCCAAGACG
+AGCCCGACACCGGTGCGCTCCAGCCCTGCCCACCTGGCGCGGTTCGCCACGACAGCCTTATATCCCATAG
+GAGTGGTCATGCAAGGTGATCCCGATGTTCTGCGCCTGCTCAACGAACAATTGACCAGCGAGCTCACCGC
+TATCAACCAATACTTTCTGCACTCCAAGATGCAGGACAACTGGGGTTTTACCGAGCTGGCGGCCCACACC
+CGCGCGGAGTCGTTCGACGAAATGCGGCACGCCGAGGAAATCACCGATCGCATCTTGTTGCTGGATGGTT
+TGCCGAACTACCAGCGCATCGGTTCGTTGCGTATCGGCCAGACGCTCCGCGAGCAATTTGAGGCCGATCT
+GGCGATCGAATACGACGTGTTGAATCGTCTCAAGCCAGGAATCGTCATGTGCCGGGAGAAACAGGACACC
+ACCAGCGCCGTACTGCTGGAGAAAATCGTTGCCGACGAGGAAGAACACATCGACTACTTGGAAACGCAGC
+TGGAGCTGATGGACAAGCTAGGAGAGGAGCTTTACTCGGCGCAGTGCGTCTCTCGCCCACCGACCTGATG
+CCCGCTTGAGGATTCTCCGATACCACTCCGGGCGCCGCTGATAAGCTCTAGCATCGACTCGAACAGCGAT
+GGGAGGGCGGATATGGCGGGCCCCACAGCACCGACCACTGCCCCCACCGCAATCCGAGCCGGTGGCCCGC
+TGCTCAGTCCGGTGCGACGCAACATTATTTTCACCGCACTTGTGTTCGGGGTGCTGGTCGCTGCGACCGG
+CCAAACCATCGTTGTGCCCGCATTGCCGACGATCGTCGCCGAGCTGGGCAGCACCGTTGACCAGTCGTGG
+GCGGTCACCAGCTATCTGCTGGGGGGAACTGTCGTGGTTGTGGTGGCTGGCAAGCTCGGTGATCTGCTCG
+GCCGCAACAGGGTGCTGCTAGGCTCCGTCGTGGTCTTCGTCGTTGGCTCTGTGCTGTGCGGGTTATCGCA
+GACGATGACCATGCTGGCGATCTCTCGCGCACTGCAGGGCGTCGGTGCCGGTGCGATTTCCGTCACCGCC
+TACGCGCTGGCCGCTGAGGTGGTCCCACTGCGGGACCGTGGCCGCTACCAGGGCGTCTTAGGTGCGGTGT
+TCGGTGTCAACACGGTCACCGGTCCGCTGCTGGGGGGCTGGCTCACCGACTATCTGAGCTGGCGGTGGGC
+GTTTTGGATCAACGTGCCGGTTTCGATCGCGGTGCTGACAGTGGCGGCAACCGCCGTCCCTGCGTTGGCC
+CGACCGCCCAAACCGGTCATCGACTACCTTGGGATCCTGGTCATCGCTGTGGCCACGACCGCTTTGATCA
+TGGCCACAAGTTGGGGCGGAACCACCTACGCCTGGGGCTCAGCGACCATTGTCGGGCTGTTGATCGGGGC
+CGCAGTGGCGCTGGGTTTCTTCGTGTGGCTGGAGGGCCGCGCCCGCTGCGGCCATCCTGCCGCCCAGGCT
+GTTTGGCAGCCCAGTATTTGCCGTGTGCTGCGTCCTGTCCTTCGTGGTCGGATTCGCGATGCTGGGTGCA
+CTGACCTTCGTACCGATCTATCTGGGGTACGTGGACGGCGCGTCGGCGACCGCGTCAGGTCTGCGCACGT
+TGCCGATGGTGATCGGCCTGCTGATCGCCTCGACCGGGACGGGTGTCCTGGTCGGCCGGACGGGCCGCTA
+CAAGATCTTCCCGGTCGCGGGGATGGCGCTGATGGCGGTTGCGTTCCTGCTGATGTCGCAGATGGACGAG
+TGGACGCCACCGCTGCTGCAATCGCTGTACCTGGTCGTCCTAGGTGCCGGCATCGGATTGTCCATGCAGG
+TGCTCGTTCTCATCGTGCAGAACACGTCGTCTTTCGAAGACCTCGGCGTCGCAACATCGGGTGTGACCTT
+CTTCCGGGTGGTCGGCGCCTCGTTTGGTACCGCAACATTCGGTGCGTTGTTCGTAAACTTCCTGGACCGA
+AGACTCGGTTCCGCGCTGACGTCGGGCGCCGTGCCTGTCCCGGCAGTGCCATCTCCGGCTGTCTTGCATC
+AGCTGCCCCAGAGCATGGCCGCCCCGATCGTGCGGGCATATGCCGAGTCGCTCACCCAGGTGTTCCTTTG
+CGCGGTCTCGGTCACGGTGGTCGGTTTCATCCTGGCGCTGTTGCTGCGAGAGGTACCGCTCACCGACATC
+CACGATGACGCCGACGACCTCGGCGACGGGTTCGGTGTGCCCAGAGCCGAATCGCCGGAGGATGTGTTGG
+AAATCGCGGTTCGGCGTATGCTGCCGAACGGGGTGCGACTGCGCGATATTGCGACACAACCCGGTTGCGG
+ACTCGGCGTCGCCGAGCTGTGGGCCCTTCTGCGGATCTATCAATACCAGCGGCTGTTCGAGGCAGTACGG
+CTGACCGATATCGGTAGACACCTGCACGTGCCCTATCAGGTCTTTGAACCCGTCTTCGACCGTCTGGTCC
+AGACCGGCTACGCGGCACGCGACGGCGACATCTTGACGCTAACCCCGTCCGGGCACCGTCAGGTCGACTC
+CCTCGCAGTTTTGATCCGTCAGTGGCTGCTCGACCACTTGGCCGTGGCGCCCGGCTTGAAGCGACAGCCA
+GACCACCAATTCGAAGCCGCTCTGCAGCACGTCACCGACGCGGTGCTCGTTCAACGAGACTGGTATGAAG
+ATCTGGGCGACCTGTCGGAATCACGCCAACTCGCGGCTACAACGTAGCGATGCTTGCCGCGCGTAGCCGC
+GCGAGCTGATCCGCGCTGCAGAATGACTGCCATGACAGCCACACCGCTTGCCGCGGCCGCGATCGCCCAA
+TTGGAGGCAGAGGGCGTCGACACCGTCATCGGCACCGTCGTGAACCCCGCCGGACTCACCCAGGCCAAGA
+CCGTGCCGATACGCCGGACCAACACATTCGCCAATCCTGGCCTCGGCGCCAGTCCGGTGTGGCATACCTT
+CTGTATCGACCAATGCAGTATTGCATTCACCGCAGACATCAGTGTGGTCGGCGATCAACGTCTCCGCATC
+GATCTGTCCGCCTTGCGCATCATCGGCGACGGGTTGGCGTGGGCGCCCGCCGGGTTCTTCGAGCAGGACG
+GCACACCGGTCCCCGCCTGCAGCCGAGGAACGCTGAGCCGGATCGAGGCCGCGCTTGCTGATGCCGGCAT
+CGACGCGGTAATCGGCCACGAAGTCGAATTCCTCTTGGTCGACGCGGACGGCCAGCGGCTGCCTTCGACG
+CTGTGGGCGCAGTACGGTGTCGCCGGGGTGCTCGAGCACGAGGCGTTCGTCCGCGATGTCAACGCCGCGG
+CAACGGCAGCAGGCATCGCTATCGAGCAGTTCCATCCCGAATACGGTGCCAACCAATTCGAGATCTCGTT
+AGCGCCGCAGCCGCCGGTCGCGGCCGCCGATCAGCTGGTGCTGACCCGCCTCATCATCGGCCGTACCGCC
+CGCCGGCACGGGTTACGCGTGAGCCTATCGCCAGCGCCCTTCGCCGGAAGTATCGGATCCGGTGCCCACC
+AACACTTCTCGCTGACTATGTCGGAAGGGATGCTGTTCTCCGGTGGGACTGGAGCAGCTGGCATGACCTC
+GGCCGGGGAGGCCACGGTGGCAGGAGTGCTTCGCGGACTGCCGGACGCCCAAGGCATCCTGTGCGGATCG
+ATCGTGTCCGGTCTGCGAATGCGACCCGGTAACTGGGCCGGAATCTATGCATGCTGGGGTACCGAAAACC
+GGGAAGCGGCGGTGCGATTCGTCAAGGGCGGGGCTGGCAGCGCGTACGGCGGGAACGTGGAGGTGAAGGT
+CGTCGACCCGTCGGCCAACCCGTATCTCGCGTCGGCGGCGATCCTCGGACTGGCACTCGACGGCATGAAG
+ACCAAGGCGGTGTTGCCGTCGGAAACGACCGTAGACCCGACACAGCTGTCTGACGTGGATCGTGACCGTG
+CCGGCATTCTGCGACTTGCTGCCGATCAGGCGGATGCAATTGCTGTACTGGATAGTTCGAAACTGCTTCG
+GTGCATCCTTGGCGATCCCGTGGTAGATGCAGTGGTCGCGGTACGCCAGTTAGAGCATGAGCGCTACGGT
+GACCTCGATCCTGCGCAGCTGGCCGACAAGTTCCGGATGGCTTGGAGTGTGTAACGATGGCCGACTCCGC
+CGGTTCGGACCTGACGCGGCACACGGCCGAAGTGCCGTTGATCGATCAGCACGTCCACGGATGCTGGCTG
+ACCGAGGGGAACCGGCGGCGGTTCGAGAACGCGCTCAATGAGGCCAACACCGAACCCCTGGCAGACTTCG
+ACTCGGGATTCGACTCACAACTCGGGTTCGCCGTGCGCAACCACTGCGCTCCCATCCTTGGATTGCCTAG
+GCACGTTGATCCGCAGACTTATTGGGATCGCCGCAGTCAATTCAGTGAAGCTGAATTGGCTCGCAGATTT
+CTGCAGGCCGCCGGGGTAACCGACTGGCTGGTGGAGACCGGAATCGGCTACGACGTGTCCGGAATGGCAA
+GCGTCGCCGGCCTCGGCGAACTGTCGGGCAGCCACGCTCACGAGGTGGTTCGTCTTGAACAGGTGGCCGA
+ACAGGCCGTGCAGGCATCCGGCGACTACGCCTCGGCGTTCAACGAGATACTGCGCCGGCGCGCAGCCACA
+GCGGTGGCAACCAAGTCCATCCTGGCCTATCGAGGTGGATTCGACGGTGATCTGACCGAGCCACCCGCGG
+CGCAGGTCGCCGAGGCCGCCAAGCGCTGGCGCGACCGTGGCGGTGTCCGATTACAGGATCGGGTTCTGCT
+GCGCTTCGGGTTGCATCAGGCGTTGCGCCTGGGCAAGCCGCTGCAGTTCCACGTCGGATTTGGCGACCGG
+GACGCTGATCTGCACAAGGCCAATCCGCTGTATCTGCTCGACTTCCTGCGGCAGTCCGGCAATACCCCAA
+TCGTGTTGCTGCACTGCTATCCCTACGAACGAGAAGCCGGTTATCTGGCACAAGCCTTCAACAACGTCTA
+TCTTGACGGCGGGTTGAGTGTGCACTACCTGGGGGCCCGGTCGCCGGCCTTCATCGGCCGACTACTGGAG
+CTTGCCCCCTTCCGCAAGATCGTGTACTCGTCGGACGGATTCGGCCCCGCGGAACTGCACTTTCTCGGTG
+CAACGTTGTGGCGCAGTGGAATTCAGCGTGTTCTGCGTGGCTTTGTCGAGCGCGACGACTGGTGCGAGAC
+CGATGCCCTGCGGGTGGTCGACCTAATTGCCCATGGCACTGCCGCACGCATCTATCGCCTTGGCGATCGG
+TAGCTTTCAGGTGGCGCAGGTGTGGCCCCGTCACGGGCTAACCATGGACCGTGCCGGACCCAGTGTCACC
+GGCAGCGTCGACCAACCGCGCAGCACCCGCGTGTCACGCCGACTTCCGGCACCCGCGGCCCGCACATCGG
+GGAAGCGGTCGAAGAACGTTCTCAGCCCGACCTCGCCTTCGGCGCGGGCCAGGGCGGCCCCCAGGCAGAA
+GTGGCGGCCGGTAGAGAACGCAAGATGTCGTCCGGCATTGGGGCGTTCGATGTCAAAGCGGTGCGGATCC
+GGGAACACAGCGGGATCGCGGTTGGCGGCTGCTAGGTAGATCACCACGACTTCGCCGCGTTTGATTCGCA
+CACCAGCCACCTCGACGTCACGGCAAGCCACCCGGGCGGTGAGCTGAACCGGCGAATCCAGCCGCAGGAT
+TTCTTCAACCGTATTCGGCCACAGCTCCGGATGTTGGCGCAGTGTGGCCAGATGTTCGGGGGTATCCAAC
+AACATGCGAATCCCGTTGCCTAACAGGTTCACTGTGGTTTCGAATCCGGCGACCAAAACCAGTCCGGCGA
+TCGCCCGAAGTTCGGTCTCGTCGAGCTGTGTCTCGTTGTCCCCGCTTTCGGCGATCTGGATCAACTGACT
+CATCAGGTCGTCACCCGGAGCGTGCCGCAACTGCTGCAGATGCCCTTCCAGCCAGCAGTCGAATCCTCGT
+ATCCCCTGCTGCACACGCAGGTACTGCCGCCACGGAATCCCGATGTCTAGACTCGGCGCTGCCAACTCAC
+CAAATTCCAGGACGCGCGGCCTGTCATGCTCGGGCACGCCCAAAATTTCGCTGATGACCACGATCGGCAG
+TTGCGAGCAATAGCGTCCTACGACGTCCACAATCCCGGGCTGCTCAGCGAACCGATCCAAGAGATTGATC
+GCGGTCTGTTCGACCAGATCGCGTAGCGCGCTGACCGCCCGTGAGGTGAACACCGCCGACACCGTTTTGC
+GGTAGCGAGTGTGATCGGGCGGCTCGACGGCCAGCAGCGAAGGTTCTCGCAGGGGGTGAAGTTGATCGCC
+GCGGGTCCGCCGCTCCAGCCAGCGCAGCGGTGGTGGCAGATTCTCGCCGAAGGAGACGACGCGGAAGTCG
+TCCGATCGCAGCAGGTCATGGGCGAGCCGATGGTCGACGGTCAGGTAGTTGGCGCGGTTGCGCACCAGGG
+CGCCGTGGGACCGGACTTCGTCGTAAAAGGGCACCGGATCGGTGGCGACGGCCGGATCCGCGATCAGCCG
+GGCCTGCAAGTCGCCACGCCGAATCCCGATTGCCGCAATGCCGCGGATCACCCCGTGCATCGCCAACCAG
+TGCAGCTTGTCCTTCACCGCGCCTCCGTCGATCGAGTGGCTTTTCTTCAAGACTAGAACCCGCAATTCAA
+CATTCGGCGAGGATGTTGAAGTCTGTTGACACCACCGTGTTGGGTTTTTTGCTGCTGATGCCGTAGGCAC
+TGCCGGCAACTGTGTATGTGTTGCGGGCGCGGTCGGCGCGGGCGTTGCCCACCCCGCCGTGCCAGAAGCT
+GCCGTTGAACCCGTCGACGTTACGGATCTTCACCCACTGCGGGATTACCCTGTCACCGCTGAGCAATACC
+ACGGCTTGGACGGTGCTGTCGTGGTTGCGGATGTCGATGGTCCGGTAGGAGTGCTCCTGGCTGCATGTTG
+CGGGACGTGTCGTGTGAGTGACGCCGTCAATAGTCAGGCGTGCGGCTTTTCGGGGTACCGTCTGAGCTTG
+CCCGCACGCGGAGAGACCAGCCGCGACGACCATTGCAACTCCGGTCACTGTGACCAACCGATTGCACACC
+AGCCACCTCCATTCGGGCCTGAGCATTGTGCTCGGGACATTACTTCCGTTTTGGCTCCAACGTGGCCAGG
+GACTTGGCAATGTGACGTCGGACGAACTCCGGACTGACGCCCTTGAGCCGATCAATCCAGCGAATGCTTC
+GGGGCACATACCAATGCAACCGTGTGGGGTGCTGGTAGGCCCGCCAGGCTGCCTCGGCGACGCTGGACGA
+GGGCATCAGCCGGAACATGCCCTTCTTGGGCGCGGCAGCGCGGATCTGCTCCGCGGAGATCGTGTAGGGG
+CCCTCGTCGGAATGCTGGCGCGTCGAGGTGAGGATAGCGGTGTCGATCAGACCGGGCAGCACGTCGGCGA
+CGCGAACCCCATGACGCTGCCACTCAACGCTCAACGCCTCGGTCAACCCCTTGACGGCGTGTTTGGTCGC
+CGAGTAGACCGCGATACGCGGCATGCCATAGGTGCCCGAGGACGACGACGTCGAGAACATCAGACTTCCC
+GGTGCTTTCTTGAGGTAAGGCAGTGCGGCGTAGGCGCCAGTGAGCACCGCCTTGAAGTTCACGTCGACGA
+CGCGCACGGCGGCCTCGTACGGCACGTCCTCGAACCAACCGCCTTCGCCGATGCCGGCGTTGTTCCACAT
+CATGTCGAGACCGCCGCCGACATTGCCGGCGCAGAAATCAGCGAGCGCACCCTCAAGGGCCGCCTTGTCC
+GTAACGTCGACGGCGCGGGCCCACAGCCGTTCGGCACCAAGCTGTACGCGCAGGGCAGCCAGCCCATCCT
+CATTGCGGTCTATCGCACCTACTCGCCAGCCGTTGGCGTGGAAAAGCGTTGCACCCTCGCGGCCCATTCC
+ACTGCCGGCGCCGGTGATGAATATCGCTTTCATGCGGAATCCGGAATAGCCGAACCGCCCTCAGCCTGCT
+TCAACCAGATCTTTGATGCGCTGCAACGTCTTGGTCATGTCTCGGATGTTGCGGCGCTGACGCAGCCAGC
+CCCCGAACACCCGGTAGTACACGGTGGTCAACACGGACGGGGGGAGCCGAAACGACTCAGTGACCTCGGT
+GCCGTCGGCGGTGGGCGTCAAACGATAATGCCAATTGTTCACCGGTCTGTCGCCGAGCAGCACAGCAAAC
+CCGAACTCACGGCCCGGTTCGCATGCCGTCACCTCGCATACCGTCCAGTAGACCGGCCCGATCCCGTTGC
+GCCGGACATGCCCGCGGAATCGAGCGCCAAGCGCGGGGCCGGTGGCACCGTCAAGCCACTCGGCCTCGAA
+GGTTTCCGGCGAGAACCGGCCGGTATTGCGGACATCCGCGATCAATGTCCAGATCTTGTCCGGCGGCGCT
+GCCATGTGAACTGTGGCCGAACCTTCCATGACCTGATCCAAACACATACGTCGACCTGGTCATAGACCGC
+ACACGCCGCCAACCGTCAGCGCGGAATACTTGCCTGAATGCCTGCCCAAATGATCTCGTTGATGATTTGC
+TTGATGCCCTGCGCGGGTTTCGACCACAGTGCGATCGGAAGGCCAGAGGCGGCGCCGCACGTCGGCCACG
+CGTCCAATCCCTGTTCGGCGAGAACCCGATTGGCAACTGCGATTTGTTGTTCCCGAGAGGCAGCTGCTGG
+GTTGCCGACACCGCCGAATGCGGCCCAGGTGGCCGGCTTGAACTGCAGTCCGCCGTATTTGCCGTTTCCG
+GTGTTGGCCGCCCAGTTGCCCCCGGATTCGCACTGCGCGACGGCGTCCCAGTTCGGGCTGGGACCGGCGT
+GGGCAACGGCGGTGGAGAGCGACATGGATGCCGTGACGAGTCCTGCGGCCATGGCGGACTTGATGAGCGG
+CTTGGCGATTCTTGTCATGCTCGACATATCGCCGGAAGTGGCCGAAGCGTTACCGATTAGAGAGAGTGGT
+GAGATCGGGTGTCTATTGCACCGCGACCGGCCGTGGTCGGCCGGCAAAGGATGCACAACCGGATTGATCA
+GGCCGGCGGTAGGGCCTGGCAATACGACTGTGTTGCTGTCGTCAGGGCCCGTTGATAGAGGCTATCGAGG
+TGGCGGGACCGCACTATGTCGCGTTTGGCGCGGTCGAGTTGGGCGGCGCAGGACGGCGCGGACAGCAAAC
+TCCAGTGACTCCAAATCTGCGACAGCATCCGATTATTCAGGGAGTCGATCGCCGATCGCGATGCCGATAG
+ATCCGGCGGCTCCGGGGGCGCGCTGGCCGGGTTGAGCTTCCAGTCCGAGAACCGGCTGTACTCGATTGCC
+TCGGTGGCGCGAATCTGGTCGTCGAAGACGCGGGTGACGTAGTCGGGGTCGATGTGCTGCGAGCGGGCAT
+CTTCGCCCAACTTTGCGAGTTGCTGTTCGACTCGGCCGGAATCCTCAATGGGCAGCTGAGCACGCCACTT
+GAAGGCTGCCACCGGGTCGGCGACCTCCAACCGCTCAGCGGCGGCGTCGACCAACTCGGCTAACTGGCTG
+GTGCCGTCGGCTCGCGCCAGCGGGGGGCCTAGTGGTGCAATCAGCGACAACAGGATGCCGATCGAGACGG
+CGGTCGCGAGGTATATCTCACGTGGACGGGTAAGCAACCCTTCGGTTGATCCCGTCAGCCGGCGCCTAAC
+GAACTCTGCAGGTCACCCTTCATGGCGTTGAGCTGAGCGCCCCAGTACTCCCAGCTGTGCGTGCCGTTGG
+GCGGGAAGTTGAACACGGCGTTGTGCCCGCCCGCGGCGTTGTACGCATCCTGGAACTTCAGGTTGCTGCT
+ACGAACGAAGTTCTCCAAGAACTCGGCGGGTATGTTGGCACCGCCCAACTCGTTCGGGGTGCCGTTCCCG
+CAATAAACCCATAGCCGGGTGTTGTTTGCGACCAGCTTGGGGATCTGCTGCGTAGGGTCGTTGCGCTCCC
+ATGCCGGGTCACTCGAGGGACCCCACATGTCTGCGGCCTTGTAACCGCCGGCGTCACCCATCGCGAGGCC
+GATCAGGCTAGGCCCCATCCCCTGAGAGGGGTCCAGCAGGGCCGACAGCGAGCCGGCGTAGATGAACTGC
+TGGGGGTGGTAGGCGGCCAAGATCATTGCCGACGAGCCGGCCATCGACAAGCCGATTGCAGCGCTGCCGG
+TGGGCTTCACGGCCCTGTTGGCGGACAACCATTGCGGCAGCTCGCTGGTCAGGAAGGTTTCCCACTTGTA
+AGTCTGGCAGCCAGCCTTACCGCAGGCCGGGCTGTACCAGTCGCTGTAGAAGCTGGACTGCCCGCCGACC
+GGCATGACTATCGACAGTCCCGACTGGTAGTACCACTCGAACGCCGGGGTGTTGATATCCCAGCCGTTGT
+AGTCGTCTTGGGCGCGCAGGCCGTCGAGCAGATAAACCGCAGGTGAGTTGTTCCCACCGCTCTGGAACTG
+AACCTTGATGTCGCGGCCCATCGACGGCGACGGCACCTGCAGGTACTCGACCGGCAGCCCCGGCCGGGAG
+AACGCGCCCGCGGTTGCCGCTCCGCCGGCAAGCCCCACCAGGCCCGGAAGGACTACAGCCGCTGCCGTGC
+CGATCATCAATCGGCGTCCCCAAGCTCGAATCTTTCGGCTCACGTCTGTCATACCTGTGCCCCTTTGTCC
+TGTATGTCGTCGTGTGCTCGGGCCAGAACATACCGTGTGTGGAGGCCAAATGTCGATTCGGGCGCAAAGT
+CGTCTCATTTCCGTATCGGTTACCGCCGCGGACAGAGCAAGTGTGCTTAGGGGGCTCACAAACGGTATGG
+CGGTATGGATCTATCGCGGATTTCTCAGAATCGCGGCCCGGGGCTACCGGCTGTGCTCCCCCAGGGAGGC
+CGAACTTGCGTTCACCGCGTAGGCTCGCTCGAAGCAAGCCGACGAAGACCACGCTATCCCGGTCTGTTCC
+GGCGTCCGCGTAACACCGCACTGGGGTTTGTGGCGTGCGATGGTGCGGGCTGAGGGCATCGGAGGTTCCG
+GGAACGATTGAGGTGCGAGAATTTGGACACGGTACTTGGGCTCTCGATAACGCCTACCACCCTGGGGTGG
+GTCCTCGCTGAAGGACACGGCGCAGACGGCGCCATCTTGGACCGCAACGAATTGGAGCTACATAGCGGTC
+GTAACGCGCAGGCCATACATACCGCAGAGCAGCTGGCGGCGGAAGTTCTGCTCGCCCATGAAGTGGCCGC
+TGCAGGCGATCATCGGTTGCGCGTCATCGGAGTGACCTGGAACGCCGAAGCTTCGGCTCAGGCGGCGCTG
+CTGGTAGAGTCGCTGACCGGTGCAGGTTTCGACAATGTGGTGCCGGTTCGGCGGCTACGTGCCATCGAGA
+CACTGGCGCAGGCTATCGCACCCGTTATCGGCTACGAGCAAATCGCGGTATGCGTTCTTGAGCATGAGTC
+GGCGACCGTCGTCATGGTCGACACCCACGACGGAAAGACGCAGATCGCCGTCAAGCATGTGTGCCGCGGA
+TTATCAGGACTGACCTCCTGGCTGACCGGCATGTTTGGTCGCGATGCCTGGCGCCCGGCCGGCGTGGTCG
+TGGTCGGCTCGGATAGCGAGGTCAGCGAATTCTCGTGGCAGCTCGAAAGGGTCCTGCCGGTGCCGGTCTT
+TGCGCAAACGATGGCGCAGGTTACGGTCGCGCGGGGTGCGGCCCTGGCGGCGGCCCAGAGCACCGAGTTC
+ACCGATGCGCAGCTAGTGGCCGACAGCGTCAGCCAACCAACGGTCGCGCCCAGGCGATCCCGGCACTACG
+CCGGGGCGGCGGCAGCGTTGGCCGCCGCGGCCGTGACCTTCGTGGCTTCGCTGTCCCTAGCGGTGGGCAT
+CCAGCTGGCTCCGCACAACGATACCGGGACGGCGAAGCACGGAGCGCACAAGCCGACGCCACGTATCGCA
+AAGGCCGTGGCGCCGGCGGTGCCGCCTCCGCCGACGGTCACGCCACCAGTCCCTGCTCGGGCACCCCGGC
+CGGCTGCGCAGCACGAACCACCCGCTCGCGTCACCTCCGGCGAAGCGCTCACGGAGCCGAACCCGCCTGA
+GGAGCAACCGAATGCTTCTGCGCCGCAACAGGATCGGAATGACAGCCAGCCGATCACTCGAGTGCTAGAG
+CACATACCCGGCGCTTACGGTGACTCGGCACCCCCAGCTGAGTAGTCGGAGGCCGCCGTAGCCGGTTGCG
+AAACCTGTTCGCGCGGACCCATGTCGAGGCGAAGCGGTGGGTACTCGTCGCGCATCAGCGTGGTGTATGC
+GCGGACCCGCAACGCCCACCGGTTTACTCCGATCACCAGGTTGTATAGCCCTATGGGGTACCGGCCGGTG
+AACAGGAGCGCCACCACGGCGACGAGCAGCAGGATCACCAGTAGCGAAGGCCACATTATGCCGACGCGGT
+CGTGGGGGTCGATCAGGAAGACTCGCCAACCGCTGGAGAGGAAGACCGCCAGGATCAGGTAGTGGGGGAT
+AGCAAGTAGCCACCACTTAATCAGCACCAGGCCGCGGCTCAACCGCTCCGGATAGTCAACCTCCAAGTCA
+GCCGGATACTCCGCCTTTGTCTGCAGGCTGAAGGGCGGGTACCGGTCGGTTCCCAGCGCCGACAGCGCAT
+AGAAGGCAACCCGCCAGCGCCACCGCATGACGCCGACATTGAAGTCGAACAGCGTCCGGGGATATCTACC
+CGTGAACAGGATGGCAAAGAACGCGATCACGGTGACCACCACGGCGGCAACGTGCAAGAAGAACAAGACA
+ATGTAGTGCGGGATGGCCAAAAACCACTTGACTAGCCACTGCCAACGTGACAACGCAGGATCGAGGTCAC
+CCCGGACCCGGACTGGATAGGCGTCAGGTTGCATGATCGACGGCTCCTTTACATGCGCGTCGGCTCGATC
+CACGAGCCAGGCCCATTGTCTCTCATCTGCCGCGCATGGGCGAAGCCATCGTCGTGCGCTACGGACACCG
+GATCGACGTGCAGTAATAGCCTTGGGCTGTAGGCAGCTTTCCGGGCGATGACGGCGGCACTGGTAATCCA
+TTGTCGGCCAACAATTTACTGAGAGGGGTCGGTACAGATTGCCAGCCGTGGCTATCCAGGTACGTGGCAA
+CGTCGTTGCGCTCGCCGTCGCTGTATAGCAGGTTGGGTGATTTCTATGTCGAACCCGTGGACGCTCCAGC
+GCTGCGAAGCGGTGTCAAGGAGGTCGGATGCCGGTCCGCCATCGTCATCTACCGACTCCCCGGCGCGCTG
+AGCGCGGTGATGTTGTCCAGCAAGCGATCCTGAGCGTCGGGCGGCAGGAATGCCAGCAGGCCCTCGGCGA
+GCCAGGCACTGGGTTGGTTGGGGTCAAAGCCCGCTTGGCGCAACGGGGTCGGCCAGTCACGTCTGAGGTC
+GACGGGAACCACGCGAGGTCAGCTGTTGCAGTGGCATCCAGATCAGCAAGTGTCGTCATCGGTATGCGCG
+CGCGTCAAGACCTGAGGCCAGGATGACAGCCTGCCGAATCCCCGCAGACGTCGCGTCACGGAAAAACGCA
+TCGAAGTACCGCGTCCGGGCGGCCAACAGGTCGGCCAATCGCTGCAGTCCCCACGTGCCGTCGGGGTCGT
+CGACGTCGGTCGCCTTGATGTTTCCGGCGGCCCAGCGAGTGAAGAAGTCAATCCCCACGGCTCTCACCAG
+TGGTTCGGCGAACGGATCATCGATCAGCGGGTTATCGGCCCTGGTGGCCACCGCGCGGGCGGCAGCCACC
+ATCGTCGCCGTTGCTCCGACGCTAGTTGCCAGGTCCCACGCGTCGTTGTTGGTGCGCGGCATCGGGATCC
+TTTCGGCTCGGCCAGCGATATACAGCCTTCGAAGTCCACCGCTTGTGGGATCAATCGTCCTTTGCCCGAA
+CCGCGGTGAATGCCACGCTCACTTCGTCGGCGACCCGTATTGAACCCATCAACAGCGAGTAGGGTTTGAC
+GCCGTAGTTGGACTGGCGAACCGTGGTGTCGGCAGAGATGCGCCACGCAGCACCAAGATCCTCTGTGTGC
+AAGTCGATGACGTGTTCTCGCGACTTTCCCCGGATGTGCAGTTTCCCGGTCAGGCGGTACCCATTCCCGG
+TCTGGGCAATGGCTTCCGTGGTAAAGCGAATATGGGGGAAGCGGCTGGCGTTGAGCGTTTTCAGCGCGTT
+CGCCCGCACCAGAGCTTTCTCAGGCTCGGACAGCCCCTTCACGCCACCCTCACCGCGCATCACCTCGAAG
+GAATCCACCTCAGCCACAAGCTCGCCGGCGACGGGATCGGTGCCGGACCAGTTCACCAGGGCCTGCCACC
+GTGTCATCGCGATGGTCAGGCGATGACCCAAGCGCGCGGCTCTGCCAACGACTCCGGTGCGAAGTACCAG
+CTCGCCGTCGGAAGCATCAAGAGTCCACACCGCGTCGCTCACGCCACGACTGTATTCAGACGACCTGCCT
+GCCCGCCCCTCCCGCCGCGTCTTGTGGGCCACGACACAATCGTTATGCTTGGTGAGGCTCGCCGGTGCCG
+TTGGAGGGGTGCAACATGATTCGCGAACTGGTCACCACCGCTGCGATCACGGGTGCCGCGATCGGTGGGG
+CGCCAGTCGCGGGCGCAGACCCGCAGCGTTATGACGGCGATGTGCCGGGGATGAACTATGACGCTTCGCT
+GGGCGCCCCATGCTCCAGCTGGGAGCGCTTCATTTTTGGACGAGGCCCCTCCGGTCAGGCCGAAGCCTGT
+CATTTTCCGCCTCCTAACCAGTTCCCGCCGGCCGAAACCGGCTACTGGGTGATCTCCTACCCGCTATACG
+GCGTCCAGCAGGTCGGTGCGCCGTGTCCGAAGCCGCAGGCGGCCGCGCAGTCTCCGGATGGGTTGCCGAT
+GCTGTGTCTGGGAGCCCGTGGATGGCAGCCGGGATGGTTTACCGGGGCCGGGTTCTTCCCTCCGGAGCCA
+TAACCGGTGGGCGTTTCTCATGATCATGTGCGAAGGCCGGCCCACCGAATCACCGATCCCACGGTGGCTG
+CGCTTCGTGCTTACGTCTGACCGTGCCGGCTCGGCATGGTATATCGGGGCAGGCTTCTTCTTCGCGCCAG
+TGCTGGCGGTGCTTTCGCCATGGCCGACCATCACCGCGGTGCTGTGGTGGATCATCGGACTGGCGGGACT
+ATGGCTCGGACTGCTCGGAATCGCGATGGCAGTCGGACTGGCCCGGGTGTTGCGTTCCGGCGCCGAAATA
+CCGGAAGCCTACTGGCGCACGCTGGTCGACTACCGATCCGCCAACGAATAGGAGACTCCGATGAGCTTCA
+ATCCCAAAGATGCGGTCGACGCTGTCCGGGACATTGCGGCCAATGCCGTCGAGAAGGCCTCGGACATCGT
+GGAAAACGCCGGCCACATCATCCGCGGCGACATCGCTGGCGGGGCCAGCGGCATCGTCAAGGACTCCATC
+GACATCGCCACCCACGCGGTCGACAGAACGAAAGAAGTGTTCACCGGCAAGACGGACGACGAAGGTTAGT
+CGAGACTAGTCGGCGCGCGCTTGTCGTCCGTTGTCAAACGGACGCGGCAGCATTGAGTGCGTCCAACCGG
+GCGGTCGCCTCGAGGTACTCCTGCACCCAGCGTTCGATAACGGTAGCCGTCTTTTCCACCTTGGTGAACT
+GCCCAACAACCTGCCCCACCGGGTTGAACGCGACGTCGACGGTCTCGTTCGGGTATTTATGTGTGGCTTT
+GACGGCCATGCCGGAGACCATGTATTGCAACGGCATACCGAGCGGCTTCGGGCTCTCCGGTTGCTCCCAG
+GCCTCAGTCCAGTCGTTGCGCAGCATCCGGGCCGGCTTACCCGTGAAGGAACGACTGCGCACGGTGTCGC
+GGCTGGTCGCCTTGACGTATGCGGCCTGTTGAACCGCGGTGTTTGCGGCTTCCTCGACCATCAGCCACTG
+CGAACCGGTCCATGCCCCTTGGGTCCCCAGCGCCAACGCTGCAGCGATCTGCTGACCGCTGCCGATGCCA
+CCCGCCGCCAACACCGGAACCGGCGCTACCTCCTTGACGACCTGAGGCCACAACACAATGGAGCCCACCT
+CGCCACAGTGCCCGCCGGCCTCGCCGCCCTGGGCGATGATGATGTCGACGCCCGCATCGGCGTGCTTGCG
+GGCCTGCGAGGGTGAGCCGCACAATGCGGCCACCTTGCGACCCGAGTCGTGGATGTGCTTGATCATGTCC
+GCTGGGGGGGTGCCAAGCGCGTTGGCGACCATCGTCATCTTGGGGTGCTTCAGCGCCGCGTCGACCTGTG
+GGGTGGCCGTCGCCTCGGTCCAACCGAGCAGCTGCAGACTGTCCTCGTCGGCGTCCTCGACCGGGACACC
+ATGATCGGCGAGGATCTTGCGGGCGAAGTCCAGATGCTCCTGCGGGACCATCGACCGCAGCGTCTTGGCG
+AGCTCATCCGCCGACAGCTGGGAGTCCATGCCCTCGTACTTGTTCGGGATCACGATGTCGACCCCGTAGG
+GGTGGTCGCCGATGTGTTCATCGATCCAGTTGAGCTCGATCTCCAGCTGCTCCGGCGTGAACCCAACTGC
+TCCGAGCACACCAAAACCACCAGCTTTGCTGACGGCGACCACCACATCGCGGCAGTGAGTGAAGGCAAAA
+ATAGGAAACTCGATACCGAGCTCGTCGCAAATGGCAGTGTGCATGCCTGCTCCTGGAATGCTAGCGGACG
+CAAATAGAACTGAAACGTGTTCTAGTTTAGTACCCGTCTTGGTAAGGTGGCCAACAGCCCAGGTTCCGGT
+CGGGTTTCGGCGCGCACCCCGGCGAAGCTGACGAGGCGGTCTAAGGTCACCTTCACCCGCGCATGGCCGG
+CCAGCAACAACGACGGCTGTCCCACCGAGCAGAAGTACTGGGCGATGGTGTGCACCGCGGTCGGCTACCA
+CCGCGACGACCCCGCCGCAGAACTGCTGTTACGCAACGAAGGCTTGGCAGCTGCAGTCCAAACTGGCCAC
+CTACGTCTACCCGCCACAGAAACTAGTCGCCAAGGTCCGTGCGGGCGCCAAAGTGTCCGACAACCACGAC
+CAGGCGACCACTCTGTTCCACCACGCGATCGATCACCCAACCGTGACCGTGCAGCAGACCTACTCCCTGA
+TCAACCCTCAATCGGCCCCGGGGCGATGGACCTTGATCCGCTGGGGCCCCGCCGGTAGCCTAGTGCTGCG
+AATTACGCTATGCCGAGTCTCGGAATTGCCGGCCCGCCGTTCACCACGTTCAAACGCCCGAGACCGGTGC
+CAGGCAGGTACGCGAACCTCATGGGTCTCAATTCGTTCTGCCACAAAGAAAGTGAGTAAGCCAGCATGCG
+TGCGGTAGTCATCGACGGGGCCGGCAGCGTCAGAGTCAACACCCAGCCCGACCCGGCACTGCCCGGGCCT
+GACGGAGTGGTTGTCGCCGTGACCGCCGCCGGCATCTGCGGATCCGATCTGCATTTCTACGAAGGCGAAT
+ATCCGTTCACCGAGCCGGTGGCCCTCGGTCACGAGGCGGTAGGCACCATCGTCGAGGCCGGGCCACAGGT
+GCGCACCGTCGGAGTTGGCGACCTGGTCATGGTGTCTTCAGTGGCCGGCTGCGGCGTCTGCCCGGGATGC
+GAACCCATGATCCAGTCATGTGCTTCTCCGGCCCGATGATCTTCGGCGCCGGCGTGCTTGGCGGCGCACA
+GGCCGATCTGCTGGCGGTGCCGGCCGCCGATTTCCAGGTGCTCAAGATCCCCGAAGGTATCACCACCGAG
+CAGGCACTGCTGCTCACGGACAACCTCGCCACCGGTTGGGCGGCAGCCCAACGAGCCGATATTTCATTCG
+GCTCCGCCGTGGCGGTCATCGGCCTGGGAGCCGTCGGCCTCTGCGCGCTGCGCAGCGCCTTCATACACGG
+TGCCGCAACGGTTTTCGCTGTCGACCGAGTAAAGGGACGCTTGCAACGCGCGGCCACCTGGGGTGCTACG
+CCGATACCGTCACCGGCGGCCGAGACGATTCTGGCCGCGACGCGGGGTCGCGGCGCAGACTCGGTGATTG
+ACGCCGTCGGCACCGACGCCTCGATGAGCGACGCGCTCAATGCGGTGCGCCCTGGCGGCACCGTCTCGGT
+TGTCGGCGTGCACGATCTTCAGCCGTTTCCCCTGCCCGCACTGACGTGCCTGTTGCGAAGCATCACGCTG
+CGAATGACCATGGCACCGGTACAACGAACCTGGCCGGAACTGATCCCGTTGCTGCAGTCGGGCCGACTCG
+ATGTCGATGGCATCTTCACTACCACCCTGCCGTTGGACGAAGCGGCCAAGGGCTATGCAACCGCGAGGGC
+GCGCTCGGGTGAGGAGCTTAAGGTTCTGCTTACGCCCTGACAGCCGTGATGTACTGGGAGCGCATGAAAC
+TGTCGATCTTTACGTCCACGTCCGGCGGTGTCAGTCCGTAGCCGACCTGCAGCTCGAGGGTGCTGCGGAC
+GGGGTCGACGGCCCATCCATGCTCAACTAGCCACTCCACGGGATCGGTCTTGTCGTCGTAGGTGAGCGCG
+GAGAAATTCACGTCACCAGACATATTGACCCCCGGGTGTGCGGTTTCCAGCGCGGCGAGCTGCTCGTGAT
+CCAACCGGGACCCTAAGGCGCCCAAGGCAACTCGGCTGCCAGGCGCACACAACTCATCGATCCGGGCGAA
+CAGAGCATATTGCGCATCGCCGGTCAGGTAGGGCAGTAGTCCCTCGACCGACCAGGCGCTGGGTCGTTGC
+GGATCGAACCCGGCCGCTGTCAGCGGCGTGGGCCAGTCCGTACGCAGATCTGCTGGCACCGCCACCCGGT
+GAGCTTTGGGTACAGCACCCCGCTCACTTAGCACCCGTGCTTTGAATTCCAGGACCTTCGGCACATCGAT
+CTCGAAAACCGTTGTCCCGGGCTGCCAGTCAAGGCGATAAGCGCGGCAGTCCAGACCGGCGGCGACGATC
+ACCGCCTGTCGTATGCCAGCCTCATCAGCGCAGTTGAAGAAGTCGTCGAAAAACCGGGTTTGCACGCCGT
+AGAGCCGAGGGAAAGCGGTGCCGTCCTCCGACGTTCTCGGGTTTGCTAACAGACCCTCCAGATACGGGTC
+GGCCGAAGCGGTGATGAAATGCTTCGCGTATTCGTCTTGGACCAGCGGTTTAGGGCCCGTGGTGTGCAGT
+GCACGCCAACCCGCAACCAGTAGCGCGGTGTAGCCCACGTTGCTGACAATGTCCCAGTGGTCGTCATCGG
+AACGAAGCGAGCCATACTCAGGTGTAGTCATCTCATCAGCCTTCCAGCATTACGGTCACCGGACCGTCGT
+TGACCAGTTCGACCTGCATGTGGGCACCGAACACGCCGGCTTCCACGTGCGCTCCCAACTGGCGCAGCGC
+TGCCGCGAACGCTGCTATCAGGGGCTGCGCCACCGCACCTGGCGCCGCGGCGTTCCAGGACGGTCGCCGA
+CCCTTCGCGGTATCTGCGTAGAGGGTGAACTGGCTGATTACCAGGATCGGTGCGTGCATGTCGGAGGCGG
+ATTTCTCGTCGGCGAGAACCCGCAAATTCCAGAGCTTTTCGGCGAGACGGCGCGCCTTGTCGAGATCGTC
+GCCGTGGGTGACACCGACGAACGCGACCAGGCCCTGCCCGTCCGGCCGGATAGCGCCGACCACCCGACCA
+TCGACCCTCACCGCAGCCGATGAGACCCGTTGCACCAGAACCCGCACGAGCCTCGATGCTGCCAGGCCGG
+CTATGCAGTCGCTGGGGCTGGGTAGGCTCATTGTGTGTCTGTGCTGGTCGCGTTTTCCGTCACCCCGCTG
+GGCGTGGGGGAGGGGGTCGGCGAGATCGTCACCGAAGCGATTCGCGTGGTCCGTGATTCCGGCCTGCCGA
+ACCAGACAGATGCCATGTTCACCGTGATCGAAGGCGATACCTGGGCGGAAGTGATGGCCGTCGTGCAGCG
+CGCGGTGGAGGCCGTGGCCGCTCGGGCACCGCGAGTCAGCGCGGTGATCAAGGTGGACTGGCGTCCCGGG
+GTCACCGACGCGATGACCCAGAAGGTCGCTACCGTCGAGCGGTATCTTCTCCGGCCTGAATAGCAGCGCT
+AAACGCCCGCTCGGCCGCATCCCCATGGACCGCAAATACCACCCTTTGCAGCGACCCCGGCCGGTGCCGA
+CGGACGGCGCCGACCATCAGCCGCGCAGCGTCGTCGAGCGGAAAGCCGCCCACGCCCGTGCCGAAAGCCA
+CCAGCGCCAGCGAGCGGCAACCGAGCTCGTCGGCTTTCCGCAGGGTAGCAGCGGTGGCTGCGGTGATGAT
+CTCGCCCGAGGTCGGACCTCCTAGCTCCATCGTCGCCGCGTGGATCACGTAGCGCGCCGGCATGTCACCG
+GCCGTGGTCTCGACCGCTTCCCCAAGCCCAATCGGCGCCTTCTCGGTGGACTCGCGCTGCAGCTCGGGGC
+CGCCGGCGCGGGCGATGGCCGCAGCGACACCACCGGCATGCCGCAGTCGGGTGTTCGCCGCATTGGTGAT
+GGCGTCGAGCTCGAGCTTGGTCACGTCGGCCTGATGTACCTCCAACTCGATCATCGACACATTGTCCCCC
+CTGCAAGTACTCGGCGGCCGCGGTGATGCACCCCTTGTTGTGTTGGACCGTCGCCACCATCGCCCACACA
+ATCGAACCCTCGCCCGGCGCCACTGCGGCCCATCGAGACTCCGGCCCATCGAGCCCAGATTCGGGGTAGC
+TTGAGGTGAACGAGGACAATCAAGCGGCTGGCAAGGACACAGACCGATGGCTCGTGATCCAGTTGTACCG
+AGGGTGCGAACAGCATGAGTGGCGACGACGCCGGGCCGGGCGAGGTCAGCCATGCCCGCGGCGTCGGTGG
+GCCGGGCGGAGCCGGAGGCGCCGGTGGCCGGGGTGGTGCCGGCGGTCGCGGCGGGGCGGGCGGTAGAGGC
+GGCGACGGCGGGCAAGGCGGTCGCGGCGGGGCGGGCGGTAGAGGCGGAGATGGCGGCATAGGCGGGGCAG
+CGGGCCCCGGCGGTCAACCCGGCCAGGGCGGGGTGGGCGGCGCACCCGGCCCCGGTGGAACCCCCGGCGA
+ACCAGGTCAGCCCGGCAAACCAGGACAACCGGGGCAACCCGGCAGCCCGGGACATTAGCGCGTGCGGGTG
+GCGTCGTCGCGCATGAGCACGCATAGCCGCCATCTGCCCGGTACGCCCTTGAGTTCCTGCTCACCACGCT
+CGGCGAACCGGTGCCGTGATCCGGCGACGATGTCTCGCACGGTCGAGGACACCAGCACCTCACTGGGTCC
+GGCCAGCGCGCAGACGCGCGCACCGATATGCACGGCCACGCCGGCGACGTCGGTACCGTGCGAGGCATCG
+CGCACCTCGACCTCGCCCGCATGAATACCGATCCGGACCTCAATACCCAGCGCGGCGACCGCGTCGACGA
+TGTCGTCCGCGCACGCGATCGCGGCACTCGGACTGGTGAACGTCGCGACGAAACCGTCACCGGCCGTGTT
+CACTTCGCGACCGCCGAACCGCTGGATTTCGTGGCACACGATGGTGTCGTGGTTGTCCAACAGGTCGCGC
+CATCGGTCGTCGCCGAGCGCGGCGGCGTGCTGGGTCGAGCCGACGATGTCGGTAAACATGATGGTGGCAA
+GCATGCGCTCGGCGTCAGCGCCGCCGCGCACGCCGGTGATGAATTCCTCGATTTCATCGAGCATCGGCCC
+GGTGTCGCCAACCCAGTACAGGGTATCGGTGCCGGGTAGTTCGACCAAGCGGGATCCAGCGATGTGCTCG
+GCGAGGTAGCGACCATGTCCCACCGGGATGTACGTCGATCCGACACGGTGCAAGATCAGTGTTGGAGCCT
+CGATGTGTCCCAAGACATCTCGTACGTCGGCCTCGGCTATGACCTTTGAAACGGCACGGGCCATGCTCGG
+CGGTCCGGCACGGTTGCCGGCGAGATCCCACCAGGCTCGAAACACGTCATCTCCGGCCACGGTAGGAGCC
+ACGATGCTCAGCACGTCGAAGCCCTGCTCGACGGCATCCGGTTCCAGCGCCACCGTCAGGAACGGGTCAG
+CTCGACGAACCTGGGCGCCTACCGGGTAGTCGGGCGCCCATAGTGGGCGCGCCGAGCCGTTGACGACGAT
+CAGGCTGCGCACCCGCTCGGGGTAGTCGGCGGCGAGAACAAGTCCGTTCATGGCGTGGAAACTGGGCGCG
+AAAATTGTCGCCTGCTCGCATCCGACCGCGTCCATCACCGCGATCGCGTCCTGGGCCCAGAACTTCGGCC
+CCAGCGTGGTTATCGCGGCGAGCCGTGACGACAGGCCGACCCCACGATGGTCGAGGCGGATCACCCTGCT
+GAATGACGCAAGACGGCGATGGAAACGGTACAGCGATGGCTCGTCGTCGATCGAGTCGATCGGCACGAAC
+GGCCCCGGCAACACCAGCAGATCCGTCGGACCGTCACCCAGCACCTGGTAGGCGATATCCATGTCGCCGC
+ATTTTGCGTAGCGGGTCCTGTGAATGTGGGGAGCCTGCGCCACGGTCCTACGTTAGTTCATGCGTAGGCT
+CATGGCGGTGAGCGCACGTGCGGGCATCGTGATCACCGGAACCGAGGTCCTGACCGGGCGGGTCCAAGAC
+CGCAACGGCCCCTGGATCGCCGATCGGCTCCTGGAGCTCGGGGTCGAGTTGGCACACATCACGATCTGCG
+GCGACCGTCCCGCCGACATCGAGGCACAGCTGCGATTCATGGCTGAGCAGGGTGTGGACCTGATCGTCAC
+CAGCGGCGGCCTGGGGCCGACCGCCGACGATATGACCGTCGAGGTGGTGGCGCGCTATTGCGGGCGCGAG
+CTGGTGCTGGACGACGAGCTGGAGAACAGGATCGCCAACATCCTCAAGAAGCTGATGGGGCGAAATCCCG
+CTATTGAACCCGCCAACTTCGACTCCATACGCGCCGCCAACCGCAAACAGGCCATGATTCCGGCCGGATC
+GCAAGTGATCGATCCGGTGGGCACCGCCCCCGGTCTGGTTGTGCCGGGACGGCCAGCGGTGATGGTGCTT
+CCCGGGCCACCGCGCGAGCTGCAGCCGATATGGAGCAAGGCCATCCAGACGGCTCCGGTACAGGATGCGA
+TTGCCGGCCGGACGACCTACCGACAGGAGACCATCCGGATCTTCGGCCTGCCGGAGTCTTCTCTGGCCGA
+CACACTGCGTGACGCCGAGGCAGCCATCCCGGGTTTTGACTTAGTCGAGATCACCACCTGCCTGCGGCGC
+GGCGAGATTGAAATGGTCACTCGCTTTGAACCGAACGCCGCGCAAGTGTACACGCAATTGGCACGGTTAT
+TGCGCGACCGGCACGGCCACCAGGTCTATTCGGAAGACGGTGCGTCCGTGGACGAGCTGGTCGCAAAATT
+GCTAACTGGCCGCCGGATAGCGACCGCCGAATCCTGCACCGCAGGGTTGCTGGCGGCACGGCTCACCGAC
+CGGCCCGGGTCGTCCAAGTACGTGGCGGGCGCAGTGGTGGCCTACTCTAACGAGGCGAAGGCACAGCTTC
+TCGGTGTGGATCCGGCGCTGATCGAGGCCCACGGGGCGGTTTCCGAGCCGGTCGCCCAGGCAATGGCAGC
+GGGGGCGCTGCAAGGCTTCGGCGCCGACACCGCCACCGCGATCACCGGAATTGCGGGTCCGAGTGGGGGA
+ACGCCGGAAAAGCCTGTGGGAACAGTGTGCTTCACCGTCCTGCTGGACGATGGCCGAACAACCACCCGAA
+CCGTGCGGCTGCCCGGGAACCGGTCAGACATTAGGGAGCGCTCGACGACTGTGGCGATGCACCTGCTGCG
+GCGCACCCTGAGCGGTATCCCGGGCTCACCCTAGCGACGGCGAAATCGACAGCAGCGCGACAAAGTTCGA
+CGAGAAGACACCGCGCTAATGTCGATTTCGATGACGAACAAGAAAAGCAGTTTCCGTAGTACCAAAGCGG
+ATTCCGGTGGCATCCTTGCCAATCGCCGTCAGCACCGCTACGACCAATAGCACGGGCACGATCGTCGCGG
+CCAAGGCGAAGGGGTAGCCATGGGATTCGGCCAGACGCTCTTGAATAGGAAGGTTGAACGCCGCCAGCAG
+ATTACCGAGCTGGTAGGTTACGCCGGGGTAGACGCCCCGGATAGCGTCTGGCGACATCTCGGTCAGATGC
+GCGGGGATCACACCCCAGGCACCCTGTACGAAGACTTGCATCAAAAACGAACCCAGGCACAACATCGCCG
+CAGTGCGCGAGTAAGCGAACAGCGGCACGATCGGCAGTCCCAGCGCCGCACAGAAAACGATGGTGTAACG
+GCGGCTGAACCGCTGGGACAACGTGCCGAACGCCAGACCGCCGATGATGGCGCCGATGTTGTAGATCACC
+ACTATCCACCTGGCGGTCAGGCTGGACAAACCGGCACCATGATCGGTAGTCGCGGTCAGGAAGGTCGGGT
+AGACATCCTGGGTGCCGTGGCTCATCCAGTTGAAGGCGGTCATCAACAGCACTAGGTAGACAAACCGGCG
+CACAATTGCGGGGTTACCCAGGACATCGCGGATTCGGGTCTTGGTGAGCCGCATGCGGTCCTGCGCGGCT
+TCCCAGACTTCGGATTCCTTTACCCGGTACCGGATGATCAAGCTGATCAGAGCCGGGATGATGCTTAGGC
+CGAACAACCACCGCCACGACAGCCCTAGCCAGTTCATCACCACCAGCGCTGCCACACTGGCCAGCAGATA
+GCCGAACGCGTAGCCCTCCTGCAGCAGCCCGGAGAAGACGCCACGCCGCTCGGCTGGAACCTTCTCCATG
+GACAGCGCGGCACCCAGCCCCCACTCTCCGCCCATGCCAATGCCGTAGAGCAGTCGCAGGATCACCAGCA
+CGGTGAAGTTGGGTGCGAATGCGCACAGAAATCCGATCACCGAATAGAACGACACGTCGACCATCAGCGG
+GACCCGCCGGCCCACCCGGTCGGCCCATAGCCCGAACAGCAACGCACCCACGGGGCGCATGGCCAGGGTG
+GCGGTGGTGAGAAACGCGACGTCGGTCTTGGTGTGGTGGAAGGTCGTTGCGATGTCGGCATAGACCAGCA
+CCACGAGAAAGTAATCGAACGCATCCATCGTCCAACCCAAGAAAGATGCCATAAAAGCGTTTCGCTGGTC
+GCCGGTCAACCGCGGTGCTGCCACGTCTGCATCGTGGCGTACCGGGCGCGGCACCGCGAGTCCGGGGACA
+TGGCGAACAGCGGCGGCTCGCATGTCCGTGGCAGGATCGGGCAATGGTGCCTTTTCTGATGCGCGCCGCA
+GTGACCGGATTCGCATTATGGGTGGTGACTCTTTTCGTCCCGGGCATGCGGTTTGCGGGCGGCGACACAA
+CGCTGCAGCGGGTCGCCATCATCTTCGTCGTCGCGGTGATCTTCGGTCTGGTCAACGCGTTCATCAAGCC
+CATCGTGCAGATCTTGTCGATCCCGTTGTACATCCTGACTCTCGGTCTTTTCCATGTAGTCGTTAACGCG
+TCGATGCTGTGGCTTACCGCGTGGATCACTGAGCACACCACCCACTGGGGACTGCAGATCGACCACTTCT
+GGTGGACCGCGATCTGGGCGGCGATCTTGTTGTCGATCGTCAGCTGGATCCTGTCGCTGTTGGCTCGTGA
+CTTTCGACGTGTCACTCGCGCACACTAGAGCCACAAATTTTGGTGGGGGGACATCCTAGGTTTTCGGGGC
+ATGTTCCACTTATGCTTACTCACACTGCTTGCCAACCTCGTCCAAGACAGGCACCCTGTCTTCGGCGTGA
+TGACGCTGACCTCCCGCCCTCCAATACGCCGGACGGCAGCACCTAACAGCACACGACGACGGGACTGCAA
+ATGATGCGCACTGTCGCGATTGGACCAGGTGCCGGTCCTTCGAGCACACGGCCGAGTTCGCAACCCAGTG
+ACCTGCATAGCGGCCTACGCGCGGTTACCGAGTGCACCGGCTCAGCGGTGGTCGTTCATGTGGGCGGCGA
+CATCGACGCCAGTAACGAGGTCGCTTGGCAGCGTCTGGTGAGCAAGAGCGCCGCTATCGCCATCGCGCCG
+GGTCCGTTCGTCATCGATATTCGGGACCTCGACTTCATGGGATCATGTGCATACGCTGTGTTGGCCCAGG
+AGTCGGTGCGGTGTCGCCGGCGCGGGGTGAATATGCGGTTGGTGAGTAACCAGCCGATCGTGGCCCGCAC
+CATTGCCGCGTGCGGACTGCGGCGACTAATTCCGCTGTATGCAATGGTCGAGACCGCACTGGCGCCGCCT
+CCCAGCGCGCATTGACCGACCCATTAACCGACCGGTGCCACCCAACCCGCCATGGTGTCGGGTTAACCGC
+CGCCGACAAGATTGACCACCTCCCGCGCACAACCCCATGACAGGGTCACGCCGTCACCTCCGTGGCCATA
+GTTGTGGATGCACAGCGCTCGCCCGATCGGTTCAGCTTCCACCCGCACGGACGGCCGATCAGGACGCAGC
+CCGGTAATCGTCTCAATCACTGCCGCCTCGGCAAGCCGTGGTTGTATGCGGCGACACCGTTGCAGGATCC
+GCTCGGTTATCTCCGGCTCTGGGGTGGTGTCCCACCTGCCAGGGATACTGATGCCGCCGCAGACTACACG
+CTGCGGGTGGGCAAAGTAGCAGATCCATTCCGAGCCGCCGGTGCGCTCGATAAACAGTTGCTCTAGACCT
+GGATTGGTGAGGACGACGTGCTGGCCGAACCGCGGCCAGACCGTGGCGTCGCCGGCCAGTTCCCGAGCGC
+CCAGACCAGCACAGTTGATCACTATGGGCGCCGCCTCAGCGGCCTCGGCCAGCGACCGTAGCGGGCGCGT
+TTCGATTTCACAGCCAGTCGCCGCCAATCGCTGGGTCAGACAGTCGAGGTACTGGGGCATATCGATCATC
+GGCAAGGTGGCATGAAACCCAGCACGGAAGCCCCCGGGCACGTCGGCCGGGTCAGCCGGCCGCACGTCGG
+GGATCAGCTCCAACCCGGGCGGCATCGCACCGGTCTCGATACGATCGCCGACACTCAGCGCCGGCGTCAT
+GCGCACGCCGGTGGCGGGATCCTTGGCCAAGTCGCGAAACACGTGCAATGACTGTTCGATCCACCCGCGT
+ACCTTGGCAACGGGTTCCTTCGGCCGCGGCCCCCAGACCGCACCCGCCACCGCCGATGTCGTTTGCTGCG
+GCAATGCGGCCGCCCATACCCGCACCGGCCACCCCGCCTCGGCCAGGCATATGGCCGACGTCAGTCCGCT
+GACGCCGGCCCCAATCACGATGACCTGTTGCTCACCTATTGCCACAGCAGGACCGTAGCCGAAGCCAGCG
+TCAGTTAGGGCTGAGGCACTCGCCCTCCAGTCGGTCCGAGTAAGCCGTTGAGGATGCCGAGCTGATTTTG
+TAGTTGGGCCCCCGCTTCAGGTCCAGGAACTCCGGCAGGGGCAGCGCCTTCGCTGCCCGTGTTCTGCCAG
+GGTTGGCAGCCGTGCGTCTTGAACGCCTTGTCGGTCGGCTCAATCGTCACTACCTGTGGTTTCTTGCTGA
+GTGCGTTATCGATGAGCGCGCCATCGGGGTTACCCATCCGCTTCCAATAGCAGGTGCCGTCGCCGACGGG
+TCCCGCGGAGCTGTACGTGCCGGGAGCGATGTCAATCCCCACCGCATAGGTGCCGTCGCTATCAATTGCC
+GTCTTCGGTGTCGGTGCCGGCTCCGGATCGGCGCCGGCGAGGCCCACGGATCCGGCCCAGCCTGCGAGGA
+TCAGGCCGGCGACGGCAAAGGCTGCAGCAGGAGATGGGGCTGGCTTCAAGCGCATCACACAATAGCCTAC
+TGGGGCCTACCGGTATCCGGAACTCACTCGGCCTGGAAGCAATCACTCGTTCTCCCGCCGCCGATGGGCT
+TGTTCGATCCCCATATGCGCCTGCGAGCGCACGGACGGCGCGCCACCGACGCAGTGTCCGGCAATGATGC
+GGTAAATCGCGGACGGCGCCAACGCTTCCACCGAGTCACAGCCTTGTCCGCCAGCACACCGCCCAGACCG
+CATGTATCGGAGGATGTCCGGAAGCCGTTGGCCACCTCCGTGTCGAGCAACCACCGCTGTCACTGCATTG
+CTGTCACTAAATCGTTGTCCGGCAACACGTTTAGAGCGCTCGCGTCAGGCTGACCTCCTGGTGGCTCGCA
+TCCCGAGCACCGGCTGGGTACCGCGACCTTCGTCGAAGTCCGCCGCCCACGGCCAGCGACCACGCCGGTC
+GGCCCACACCAACTGCAAGGCCGTCACCTTGTCGCCAAAGATGGCGATCGCACAATACAAATGCGCGTCC
+GGATGTGTAACCTGGACCGTTTCGACAAGAGGGCCGGCTGGGAGGGTGGTCTGCATACCGGGAGTCAGCA
+AGTCACCGACCAGAGCCCTGCGAGCGGCGATGTTCAACAACCGCTGCCCACGTCGTGGCGAGAGGCCAGT
+CACCACCAGTTCGGGCAAGCCGCGCCGGGTTAGACCAACCGTGTAGGCAAATGGCCGTCGCTCGCACTCC
+ACGTGCTGTACCGCCCAGCCATGCATGAGCATTATCCCGTACACCTCGTCGAGGTACTCCTCGGCGGTGG
+CTTCCGGGTGATCGCACATCCAGCACATTTCGGCGCCCTTTCTCCTCATCCCCGTCTCGTCATCCCCGTC
+TCGTCGTGCCTGCGACCACCATGCACGCGGGGTCTGACAAATCGCGCCGGGCAAACACCAGCACCCCGCG
+AGCCGGTCAGCTCGCGGGGTGCTGCGGCGGGTTGTGGTTGATCGGCGGGCAGGGCCGATCAACCCGAATC
+AGCGCACGTCGAACCTGTCGAGGTTCATCACCTTGTCCCAGGCAGCGACGAAGTCCTGCACGAACTTCGG
+CTGCGCGTCATCGGCGCCATAGACCTCGACAAGCGCCCGCAACTCCGAGTTGGACCCGAAGACCAGGTCC
+ACGCGGCTGCCGGTCCACTTCACCTTGCCACTGCCATCCTTGCCCTGGTAGGTCCCGTCATCTGCTGGCG
+AGGGCTCCCAGGTGATACCCATGTCGAGCAGGTTCACGAAGAAGTCGTTGGTCAGTGACTCGGAGGCCTC
+GGTGAACACGCCCAGCGGTAAGCGCTTGTAGTTTGCGCCGAGGACGCGCAGGCCACCTACCAGCACCGTC
+ATCTCAGGGGCACTGAGCGTAAGCAGGTTCGCCTTGTCGAGCAGCATGTACTCGGCCGGCAACGGGTTGC
+CCTTTCCGAGGTAGTTTCGGAAGCCATCTGCCTTGGGCTCCAGCACGGCAAAGGATTCCACGTCGGTTTG
+TTCCTGCGACGCATCCGTGCGGCCCGGGGTGAAGGGCACCGTGATGTTGTGGCCAGCCGCCTTTGCTGCT
+TTCTCTATGGCGGCACAGCCACCGAGCACGACGAGGTCGGCGAAGGACACTTTGATGTTCCCCGGCGCCG
+CGGAGTTGAATGACTCCTGGATCTCTTCCAGGGTGCGAATGACCTTGCGCAGATCCCCGTCGGGGTCGTT
+GACCTCCCACCCGACTTGTGGCTGCAGGCGGATGCGACCACCGTTGGCGCCGCCGCGCTTGTCGCTACCA
+CGGAACGACGACGCCGCCGCCCATGCGGTCGAAACTAGCTGTGAGACAGTCAATCCCGATGCCAGGATCT
+GGCTCTTAAGGCTGGCAATCTCGGCTTCGCCGACGAGGTCGTGGCTGACCGCAGGGACCGGATCCTGCCA
+CAGCAGGGTCTGCTTGGGGACCAGCGGCCCAAGGTATCTCGCAACGGGACCCATGTCTCGGTGGATCAGC
+TTGTACCAGGCCTTGGCGAACTCGTCGGCCAATTCCTCGGGGTGTTCCAGCCAGCGACGCGTGATCCGCT
+CATAGATCGGATCCACCCGCAGCGAGAGGTCAGTGGCCAGCATCGTCGGGGAGCGCCCTGGCCCGCCGAA
+CGGGTCCGGGATGGTGCCGGCACCGGCGCCGTCCTTGGCGGTGTATTGCCAAGCGCCAGCAGGGCTCTTC
+GTCAGCTCCCACTCGTAGCCGTACAGGATCTCGAGGAAACTGTTGTCCCATTTCGTCGGGGTGTTCGTCC
+ATACGACCTCGATGCCGCTGGTGATCGCGTCCTTACCGGTTCCGGTGCCATACGAGCTCTTCCAGCCCAA
+GCCCATCTGCTCCAGCGGAGCAGCCTCGGGTTCGGGGCCGACCAGATCGGCCGGGCCGGCGCCATGGGTC
+TTACCGAAAGTGTGACCGCCGACGATCAGCGCCGCTGTTTCGACGTCGTTCATGGCCATGCGCCGAAACG
+TCTCGCGAATGTCGACCGCCGCGGCCATGGGGTCCGGGTTGCCGTTCGGCCCCTCCGGGTTCACGTAGAT
+CAGCCCCATCTGCACCGCGGCCAGCGGGTTCTCCAGATCCCGCTTACCGCTGTAACGCTCATCGCCGAGC
+CAAGTGGCTTCCTTGCCCCAATAGACCTCATCGGGCTCCCACTGGTCGACCCGGCCGAAGCCGAACCCGA
+ACGTCTTGAAGCCCATCGATTCCAGCGCGCAGTTGCCGGCGAAAACAATCAGGTCCGCCCATGAGAGCTT
+CTTGCCGTACTTCTTCTTGACCGGCCACAGCAGCCGGCGCGCCTTGTCCAAGCTGGCGTTGTCGGGCCAG
+CTGTTAAGCGGCGCGAACCGCTGCATGCCGCCCCCGGCGCCGCCGCGGCCGTCGTGGATGCGGTAGGTGC
+CGGCAGCGTGCCACGCCATCCGGATAAACAGCGGCCCGTAGTGGCCGTAGTCGGCGGGCCACCACGGCTG
+CGAGGTGGTCATCACTTCCTCGATGTCCCGCGTCAGGGCGTCAACGTCGATGGTCGCGACCTCCGCGGCA
+TAGTCGAACGCCGCACCCATCGGGTCAGCGACGGCCGGGTTTTGGTGCAGTACCTTCAGATTGAGCCGGT
+TGGGCCACCAGTCCTGGTTTCCGCCGCCCTCGACTGGGTATTTCATATGACCCACGACGGGACAGCCGTT
+GCTAGCGGCTCCGGTGGTGGTTTCTGTAATGGGTGGGTGTTGCTCGGGCACAGCATTCCTTCCAGGAGTT
+GGTGTTATCGGGCTGTGATCACGGATGTGATCGCGAAGTGTCGGATATCGAACAATCAGGACATAGACCC
+CAGTAGATGACCTCCGCCTCGTCCAACAGGAAGCCGTTATGGTCCGAGGCCGTCAGACAGGGTGCCTCGC
+CAACAGCACAGTCGACATCGGCGATAACCCCGCAAGACCGGCAGACGATGTGATGGTGGTTGTCGCCGAC
+CCTGGACTCGTAGCGCGCGACGGAGCCCGAGGGTTGGATCTTTCGCACCAAGCCCGCGGCGGTCAGGGCA
+TGCAGCACGTCGTACACGGCTTGCCGGGATACGTCGGGCAGCGCAAAACGCACGGCACCGAAAATCGTTT
+CCGTGTCGGCGTGTGGATGCGCATTCACTGCTTCCAGGACGGCGACGCGCGGTCGGGTCACGCGCAGGTC
+GGCCGTCCGGAGCTGTTCGGCGTAGTCCGGTATAGAGGACACACTAGACAATATGACTCCCTTTTCTGGA
+ATCAGTCAAGACTTTGGCTAGCGTGACAGGCGTCTGCTAGGACCCGATCGCCCCGGGGCCGCTGGATCGT
+GGGATGGCGGGTGGATCAGCCTTCGTATGTTCCGATGAGCCGGGCCTGCATGGTGGCGGCCTGCGCGATC
+ACCCGCGCCGCTTGTGTCCCAGCCAGTCCCGCGAGTGGAGGCACGGCAGGAAGGTGGTAGAGGGTAAACC
+GGTAGTGGTGTGTCCCGGTGCCCGCCGGCGGGCAGGGTCCGGTGTATGCGGGCTGACCGCTGGAGTTCGG
+CAGGCTGATTCCGCCACCGGGTGTCTCACCATCGGCGGTGCTGCCAGCACCAGGGGCGATCCCGATCACG
+ATCCAATGGACGTAAGGTTCGCGAGGTGCGTCCGGATCATCGACAACGAGTGCGCCGCCAAACGGCGCCG
+ACCAGGTCAACGGAGGCGCGATATTGGCTCCTTTGCAGGTGTACTGTTCCGGGATCGGCGCACCGTCGGC
+GAATGCCGGACTGCTGATTGTCAGTACATCGCCGGTAGGCGTTTCGGGCATACTCCGACCGAGCGCTGCT
+GCTTTCGGCGCCAGCGGCGCCGCCTTTCGACTGTCACCGTTGCCACCGTAGGCAACTAGCGCCACGGGGA
+GCGCCAGCCCCAAGATGGCCAGTGCGAACCGGTGAAATGCGTGCGCCACTGTCGATTCCATATTGATCAT
+TGTCGCCAGGCGCAATTGGAGAAGCCAGGGTTTCGACCACCTCGCCAGGGATGCCGCGGCGTCAGCCTTC
+GAATGTGCCGACGAGCCGGGCCTGTCCGCTGGCGGCCTGTGCTATCGCCTGTGCCGCTTGGACTCCCGTG
+GCTCCCGGTGGCAGCTGGAGCGCGACAGGAAGGTGGTAGAGGGTAAACCGGTAGTGGTGTGTCCCGGTGC
+CCGCCGGCGGGCATGGACCGAAGTATCCTTGCCGACCACCAGAATTCGGCACGCTGTGCCCACCAGCAGG
+AGTCTGACCATCCGCCGTGCTGCCAGAGCCAGGGGCGATTCCGGTCACGATCCAGTGCACGTACAGTCCG
+CCGACCGCGTCGGGGTCATCGACGACGAGTGCCAGTTCGGCTGCGCCCGCGGGCGACGACCACGTCAACG
+GTGGCGCCACGTTGGCCCCCTTGCAGCTGAATTGCACCGGGATCGGGGCGCCGTCGGCGAACATGGGACT
+GGCGATCGTCAGTGGCTCGGCGGCCGGCGCCGGCGTTGTTGCGTCGACGGTCGTCGCTTTCGGCACGTAT
+GGCGGTGTCTCTCGACTGTCACCGCCCCCGCCCCCGCAGCCACCCAGCGCCACTACGAGCGCCAGCCCCG
+CGGTGGCTAATGGGGTTCGGTGAAGTGTGCTCGTCATTGGAGATTCCATAGCACATTGTTACTAACTGGG
+ATTCGAGAGTACAGCTGTTTTGCGGCCGCGCTTACCAGACAGCCGGGCCCCGGGCCACCCATCGCCTCAC
+GGTACCAGCACCACCTTGCCGACGTTCTCCCGTGCGGCCAGAATCCGATGTGCTTCAGGAGCTTCGGCGA
+ACGGCACGATTGCATGAACGATCGGCAGGATCGTTCCGTCGTTGAGCGCCTTGGTCAGCGGCGCGATCCA
+GGGTTCAAGGGTGCGGCGATCGTCCCACAACCGCAGCATGTTAAGACCGATCACGGTTTTCGACTCCTCG
+AGTTGTTTCATCAGGTTAAAGCCGCGCAGCATTGACAACGCGTGGGGCGCCACCCTGCGCATCGATCGTT
+TCTCGCCGTGCTGCATATTCGAAATCCCGTAGCCAACCAGCCTTCCACCCGGGCGCAGCAGAGTGTAGGA
+CCGCCGCAGCGAGGTGCCGCCGAGCGCGTCAAGCACGACGTCATACGGGCCCAATCCCTGCCACCAGCCG
+TCCCGGCGGTAGTCGATCGCGCGGTCCACACCGAACTCGGCCAGCTTCTGATGTTTTTGGGGTGATGCGG
+TGCCGTGCACTTCGGCCTTGGCTGCTTTCGCGAATTGGACCGCCGCGATGCCGACTCCACCGGCCGCGGC
+GTGAATCAGCACCCGCTCACCGGCGCGCAACGATCCGTAGCCGTGCAGCGCCGCCCAGGCGGTCGCGTAA
+TTCACCGGGACCGCGGCACCCTGTTCGAAGCTCAGCGCATCGGGGAGCACAACCGAGTCGGTGGCCGCAA
+CGTTGACGATCTCGCAGTAGCCACCAAATCGTGTACCGGCCAGGACTCGTTCGCCGACCCGGTTCGGGTC
+GACCCCATCACCGACAGCCTCGACCGTCCCAGCGACTTCGTATCCGACCACCGCCGGAAGTTTCGGCGCG
+TCTGGGTACAGGCCGACGCGGGCGAGATGGTCAGCGAAGTTCACCCCTGCTGCGCGGACGGCGACCCGCA
+GCTGGCCCGGGCCCGGTGGCGGCGGGTCCGGTCGCTGCCGCACCTGCAAGACCGATGGGTCGCCATGTTT
+GGTGATGACCACTGCTCGCATAATGTTCTCCTTGTCAGGCTTGACGGGTCGCACCCGCGAACACCCCTCT
+GTGATAGCACGAGTTATCAGGAGGTTCGGCGGGGCGTTACCTTTGCGGTTGTGCACTTCGACTGGGAGCG
+CCTGACCGACAGCGTGCATCGCTGCCGGCTGCCGTTCTGTGACGTCACCGTTGGGCTGGTCCGGGGCCGC
+ACCGGAATACTGCTCGTCGACACCGGGACCACCCTCGGCGAAGCAACAGCAATCGCGGCCGACGTCAAGC
+AGATCGCTGGTTGCCAGGTAACGCATGTTGTGTTGACACACAAGCATTTCGACCATGTGCTGGGTTCCTC
+GGTGTTCGACCAAGCGGAGGTGTTCTGCGCTCCCGAGGTCGTCGAATACCTACGGTCGGCTACCGACCGG
+CTCCGCGAAGATGCCCTGAGCTACGGCGCGGACACAGCTGAGGTTGACCGCGCGATCGCGGCCCTGAAAC
+CACCTCAGCACGGGATCTACGATGCAGCCGTCGATCTCGGGGACCGCACCGTCACCATCACTCACCCCGG
+CAGCGGCCACACCACAGCAGATCTCGTCGTGGTGGCGCCGGCCACCGGCCATGCAGACGGCCCAACGGTG
+GTCTTCACGGGTGATCTTGTCGAGGAGTCAGCCGATCCTGATATCGACGCCGATTCCGACCTGGCGGCCT
+GGCCGGCAACGCTTGATCGGGTACTTGCGATCGGCGGCCCTGACGCCAGCTACGTCCCGGGGCACGGGAA
+GGTCGTCGATGCGCAGTTTGTCCGTCGCCAGCGCGCCTGGTTGCGAACACGTGCGAGCCGCCAGCCTCGT
+GAAACGCCAGCTACTTTGCCGTGCAAGCGGTGACGAGCGCATCCGGGTCGGTAACGCTGACCCACAATTC
+GCGCACCGTCATCGACTTCTTCCACATCTTTGCCTGTTCGGGCGGATCGATCGTCAGTGCCACCAGGCCC
+TTACGTGACCCGTTGACCAGCCAGCGGCCGAATCCAAAGTGCACCCCGGCTGCGTAGACCCTTGCGTTGG
+TCGCCTCTGCCTTCGTGATCGACGTCAACGGGATGTCGGCGGCAAATGCCCATCCCATCTTGACGTGCAG
+GCTCCCCGCCCCAACCCATAGCTCGCTGTTCTTGGGGCCGAGCCCGAGCGGCACCGCAAGCGGGAGAAAC
+CAACGGTCAAAGCGCAACTGGGTCGGCACCAAGATGACCCTACCGGTGCTAGTGCGGCTCAGTACCATGT
+AGGAGTTAGTCTCGAACCGCCCCAGTGGCGTTGCGGAATTTGCGAGCCGTCATCGGTCAGTGATCTAGGT
+CGCCCGTCCGGGGATACACTCGGTCCGTCAGGTGAATCGGGGCTGCAGAGGAGCGCAAGGCCATGGCCAT
+CGCCGAAACGGACACCGAGGTCCACACACCGTTCGAGCAGGACTTTGAGAAAGACGTAGCCGCCACTCAG
+CGATACTTCGACAGCTCGCGCTTTGCTGGGATCATTCGGCTCTACACCGCCCGCCAAGTCGTGGAACAGC
+GCGGCACGATCCCCGTCGACCACATCGTGGCGCGAGAGGCGGCGGGCGCCTTCTACGAGCGTCTGCGCGA
+ACTCTTTGCAGCCCGCAAGAGCATCACGACGTTTGGCCCCTACTCGCCGGGGCAGGCGGTGAGCATGAAG
+CGGATGGGTATCGAGGCGATCTACCTCGGTGGTTGGGCTACCTCAGCTAAGGGCTCCAGCACCGAAGATC
+CGGGGCCCGACCTCGCCAGCTACCCGCTGAGCCAGGTGCCTGACGATGCCGCGGTGCTGGTGCGCGCCTT
+GCTCACCGCGGACCGCAACCAACACTATCTACGCCTGCAGATGAGCGAGCGACAGCGTGCGGCGACACCG
+GCTTACGACTTCCGCCCGTTTATCATCGCCGACGCCGACACCGGCCACGGCGGCGATCCGCACGTACGCA
+ACCTGATCCGCCGCTTCGTCGAGGTCGGTGTGCCGGGCTACCACATCGAGGACCAACGACCCGGCACCAA
+GAAGTGCGGCCACCAGGGCGGCAAGGTCCTGGTGCCGTCCGACGAACAGATCAAGCGGCTCAACGCCGCC
+CGCTTCCAGCTCGACATCATGCGGGTGCCCGGCATCATCGTCGCACGCACCGACGCGGAGGCGGCCAACC
+TGATCGACAGTCGCGCCGACGAGCGTGACCAGCCGTTCCTTCTCGGCGCGACCAAGCTCGACGTACCGTC
+CTACAAGTCCTGTTTCCTGGCAATGGTGCGGCGTTTTTACGAACTGGGCGTCAAGGAGCTCAATGGTCAT
+CTTCTCTATGCGCTTGGCGACAGCGAGTACGCGGCGGCCGGCGGTTGGCTTGAGCGCCAAGGCATTTTCG
+GCTTGGTCTCCGACGCGGTCAACGCGTGGCGGGAGGACGGCCAGCAGTCGATCGACGGCATTTTCGACCA
+GGTCGAGTCGCGGTTCGTGGCGGCCTGGGAGGACGACGCGGGCCTGATGACCTACGGAGAGGCCGTGGCG
+GACGTGCTCGAATTCGGTCAGAGCGAGGGCGAACCCATTGGCATGGCTCCCGAGGAGTGGCGGGCGTTCG
+CCGCGCGTGCATCGCTGCATGCCGCCCGGGCAAAGGCCAAGGAGCTGGGCGCCGATCCGCCATGGGACTG
+CGAGCTGGCCAAGACCCCGGAGGGCTACTACCAGATCCGCGGCGGCATACCGTATGCGATCGCCAAATCG
+CTGGCCGCGGCACCGTTTGCCGACATTCTTTGGATGGAGACCAAGACCGCCGATCTCGCCGACGCTCGAC
+AGTTCGCCGAGGCGATCCATGCCGAGTTCCCCGACCAGATGCTGGCGTACAACCTCTCACCATCGTTCAA
+CTGGGACACCACCGGCATGACCGACGAGGAGATGCGGCGCTTCCCCGAGGAGCTCGGCAAAATGGGCTTC
+GTCTTCAACTTCATCACCTATGGCGGGCACCAGATCGACGGTGTCGCGGCCGAGGAATTCGCCACCGCGC
+TGCGCCAGGACGGCATGCTGGCGCTGGCTCGGTTGCAGCGCAAGATGCGCTTGGTCGAATCTCCCTATCG
+CACACCGCAAACGCTAGTCGGCGGGCCGCGCAGTGACGCCGCATTGGCTGCCTCCTCCGGACGCACGGCG
+ACCACGAAGGCAATGGGCAAGGGCTCCACCCAGCACCAGCACTTGGTGCAAACTGAGGTGCCGCGCAAGC
+TGCTAGAGGAATGGCTGGCCATGTGGAGCGGTCACTACCAGCTCAAAGACAAACTGCGCGTACAGCTTCG
+GCCGCAGCGGGCCGGCTCGGAGGTGCTCGAGCTCGGCATCCACGGCGAAAGCGATGACAAGCTCGCCAAC
+GTGATATTCCAACCGATCCAAGATCGCCGCGGCCGCACCATCCTGTTGGTACGCGACCAGAACACGTTCG
+GTGCGGAACTACGCCAAAAGCGGCTGATGACCCTGATCCACCTCTGGCTCGTCCACCGCTTCAAGGCGCA
+GGCGGTGCACTACGTCACGCCCACCGACGACAACCTCTACCAGACCTCGAAGATGAAGTCGCATGGAATC
+TTCACCGAGGTCAACCAGGAGGTGGGCGAGATCATCGTCGCCGAGGTGAACCACCCGCGCATCGCCGAAC
+TGCTGACGCCCGATCGGGTGGCGCTGCGGAAGTTGATCACGAAGGAGGCGTAGCCAGCGCTGCCAACTGT
+CTTGGGGGCCAACCGGGTGTGCGTCGAGGTGGCGCACATCGCGAAACGCGAAGGATGCTGTCAGACGGCG
+TCTGCGGTGGCCTGTCGAAGATCCAGCGCACCGGCGTTCACCTGCGTCGGCCCGCGGTCGCGACTACCAT
+CGCCGCCCCCGTTTACGGCCCGGCACCCGGTGAGAAGAAGCCCAGGAGCATTTGGCCGATGTTGTTGACG
+CCCGAGTTAAACGCAGCGGTGAGGTGACCAACGGTGCTCGTGTTGTTGAAGCCCGAGACGGTGTTGCCTA
+AGTTCGCCACGCCCGACGCCAGCTGCCCGACGTTGTAGATTCCCGAGACTCCGCCTTGCAGCGCGTTCGG
+CACCTGGTTCCAGAGGCCCGAAATGCCGGGCCCGACGTTGCCGAAGCCGGATGCGCTTCCATCGCCACTG
+TTGAAGAAGCCCGAAGACGGGGTGGTGGTGGAGTTTCCGAAGCCCGGGGCGCTCGTGATGTTGATCGGTC
+CCAAGCCGCCGTTGGCGGTCAAGTTCAGGGGGGATCCGGGAATGGTGAAGCCGGGGATCGTAACCGGGCT
+CGTGCCCCCGCTCAACGGAACATTCAACCCAAACGGATTAATCGCGAAGCCGGGGATCGTAACCGGGCTC
+GTGCCCCCGCTCAACGGAACATTCAACCCAAACGGATTAATCGCGAAACCAGGGATCGTGACAGCGTTGG
+TGCCCCCGCTCAACGGAACATTCAAATCAAACGGATTAATCGCGAAACCAGGGATCGTAACCGGGCTCGT
+GCCCCCGCTCAACGGAACATCCAACCCAAACGGATTAATCGCGAAACCAGGGATCGTGACAGCGTTGGTG
+CCCCCGCTCAACGGAACATCCAACCCAAACGGATTAATCGCGAAACCAGGGATCGTGACAGCGTTGGTGC
+CCCCGCTCAACGGAACATCCAACCCAAACGGATTAATCGCGAAACCAGGGATCGTAACCGGGCTCGTGCC
+CCCGCTCAACGGAACATCCAACCCAAACGGATTAATCGCGAAACCAGGGATCGTGACAGCGTTGGTGCCC
+CCGCTCAACGGAACATCCAACCCAAACGGATTAATCGCGAAACCAGGGATCGTAACCGGGCTCGTGCCCC
+CGCTCAACGGAACATTCAACCCAAACGGATTAATCGCGAAACCAGGGATCGTGACAGCGTTGGTAGCACC
+GCTCAGCGGAATATTCAAACCGAACGGATTAACACTGAATCCCTGGATGCCAGACTCCAGGGTGCCGCCG
+GCCAGCGTGACGCCTAATACGAATGTGCTAAGCGGGATGGGGCCGATGTAGCCCGTGAAGATACCAGCGA
+CGTTAAACGGAAGTTCGTTGAGAGTGATGTTGACCGGTATCCTGATGTTAATCGTAAGGGGGATGCGGGA
+AATAGGGACGCCGGGAACGGTGATCGGACCGACACCACCCAGCGCGTTCAGGCTCAACGGAATACCAGGA
+ATAGTAATATCCGGCACCACAATCGGACCGACACCACCCAGCGCGTTCAGGCTCAACGGAATACCAGGAA
+TAGTAATATCCGGCACCACAATCGGACCGACACCACCCAGCGCGTTCAGGCTCAACGGAATACCAGGAAT
+AGTAATATCCGGCACCACAATCGGACCGACACCACCCAGCGCGTTCAGGCTCAACGGAATACCAGGAATA
+GTAATATCCGGCACCACAATCGGACCGATGCCACCATTCACTTCGACGCTCAGTGGGATGGCGGGAATGC
+TGAGTGTGTCTGAGTAGCCAATCAGACCCTGGTAATCGCCCCTCCACAGTATGCCGTTGCTGTAGCTGCC
+CGAGATCAGGGCGCCGGTGTTAAGGTCGCCAATGTTTCCCCAGCCGGTGTTGAGGTCGCCGAGGTTTAGG
+TACCCCGTGTTGGCGTTGCCCGGGTTGAGGTCGCCCGTGTTGGTGTCGCCGGCGTTGTAGCTGCCTGTGT
+TGTAGCTTCCTGCGTTGCCGATTCCAGTGTTGACGTTGCCGGTGTTGAACAGGCCCGTGTTGGCGTTGCC
+CACGTTACCCAGGCCGGTGTTGTAGTTGCCGGAGTTGCCGATGCCGACGTTTCCGTTGCCTGAGTTGAAG
+AAGCCGATGTTGCCGTTGCCGGAGTTGAAGAAGCCGATGTTGCCGCTGCCGGAGTTCAGCGCCCCGAATC
+CGACCTGATTGTCGCCGGTGAGCCCGATACCAATATTTCCAGTGCCCGTGTTGCCGAAGCCGATGTTGCC
+GTTACCGATGTTCGCGAAGCCGTAGTTGTTGCCGCCGATGTTCCCAAAGCCAATGTTGTGCAGGGCCTCC
+GTCAACCCCGGACCCGTGTTTGCAAACCCAAGGTTGTTGCTGCCGACGTTTCCAAAACCGAAGTTGTTGC
+TTCCGATGTTTCCGAAACCGAAACTTCCGTTGCCGATGTTTCCGCTACCGAAGTTGTAGCTACCGACGTT
+TCCGCTACCCACGTTGTAGTCGCCGAGGTTTGCGTTGCCCAAGTTGAGTGTGCCGTCGTTGGCGAAGCCG
+AAGTTGAATAACGTCCCACCTGCGGCGTTGCGCATGAAGCCGGCGAGTTGGCTGTCGGTGTTACCGACGC
+CGGAGTGAAAGGCCGATGTCGCTAGGCCCAGCGTGCTGGTGTTGTAGAGGCCTGAGACTGTGTTGCCGAA
+GTTCAAGATTCCCGATGTCAGTGGCCCGACGTTAAGGAATCCGGAGTTGCCGAGATTCCCAGCAATGTTC
+CAGAAGCCAGATCCGCCCGAACCGACGTTCCCGAAACCCGATGTGCCGCCCGTACCGCTGTTGAAGAAGC
+CCGATGACGGGGTGGTGGTCGAGTTTCCGAAGCCTGGGGTGCCCGCGATTTCGATCGGGATGTTGATCGG
+CCCGAGGCTGCCGGACACGTCGATGCCCAACGGGATTGCGGGGATCGTGATTGGCGGGGTAGTGAGGGGG
+CCGATGGCGCCGCCCACATCAATACCCAACGGGATTGCCGGAAGTGAGTAGCCATCCGGGAACACCGTAA
+ACGGGCCTAACCCTCCGCCCACATCAATACCCAACGGGATTGCCGGAAGTGAGTAGCCATCCGGGAACAC
+CGTAAACGGGCCTAACCCTCCGCCCACATCAATACCCAACGGGATTGCCGGAAGTGAGTAGCCATCCGGG
+AACACCGTAAACGGGCCTAACCCTCCGCCCACATCAATACCCAACGGGATTGCCGGAAGTGAGTAGCCAT
+CCGGGAACACCGTAAACGGGCCTAACCCTCCGCCCACATCAATACCCAACGGGATTGCCGGAAGTGAGTA
+GCCATCCGGGAACACCGTAAACGGGCCTAACCCTCCGCCCACATCAATACCCAACGGGATTGCCGGAAGT
+GAGTAGCCATCCGGGAACACCGTAAACGGGCCTAACCCTCCGCCCACATCAATACCCAACGGGATTGCCG
+GAAGTGAGTAGCCATCCGGGAACACCGTAAACGGGCCTAACCCTCCGCCCACATCAATACCCAACGGGAT
+TGCCGGAAGTGAGTAGCCATCCGGGAACACCGTAAACGGGCCTAACCCTCCACCCACATCAATACCCAAC
+GGAATAGCCGGCAAACTATAACCACCCGATAAGAAGGTGATGGGACCGATTTGACCACTCACTGTCACGT
+AATCTGGAGGGAATCCGGGGAAAAATGGCGGAATCGCGGGAATCTCAGGAGTGCCTAGCTGTATCGATAT
+GCTACCCGGGCCTATGCTGCCAACGGTGGGATTTACGCCGAATAAGCCGATCGCAAGCGGAGACGCGGGG
+ATCGAAATCGATCCCACGTTAATGACCTGGAACGCCGATAGCTCTAGGCCAATAGAATTTAGAGTGATAG
+GCGGAACATTGATTGGCCCCACCAACGCCCCCGAACTACTCACACCCAAACCGATGGCGGGAACAGTAAT
+AGGCGGAACATTGATTGGCCCCACCAACGCCCCCGAACTACTCACACCCAAACCGATGGCGGGAACAGTA
+ATAGGCGGAACATTGATCGGCCCCACCAACGCCCCCGAACTACTCACACCCAAACCGATGGCGGGAACAG
+TAATAGGCGGAACATTGATTGGCCCCACCAACGCCCCCGAACTACTCACACCCAAACCGATGGCGGGAAC
+AGTAATAGGCGGAACATTGATTGGCCCCACCAACGCCCCCGAACTACTCACACCCAAACCGATGGCGGGA
+ACAGTAATAGGCGGAACATTGATTGGCCCCACCAACGCCCCCGAACTACTCACACCCAAACCGATGGCGG
+GAACAGTAATAGGCGGAACATTGATCGGCCCCACCAACGCCCCCGAACTACTCACACCCAAACCGATGGC
+GGGAACAGTAATAGGCGGAACATTGATCGGCCCCACCAACGCCCCCGAACTACTCACACCCAAACCGATG
+GCGGGAACAGTAATAGGCGGAACATTGATCGGCCCCACCAACGCCCCCGAACTACTCACACCCAAACCGA
+TGGCGGGAACAGTAATAGGCGGAACATTGATCGGCCCCACCAACGCTCCGGAACTGTTAATGCCCAGGCC
+GATTTCGGGAATGGTGATGGACGGGATGGTGATGGGGCCGACGGAGCCGAGGCCGTTGAGGTCTAGGCCA
+GCAGCGGGAATGGTCAGTGTGCCGGAGAAGCCGATCAAGCCCTGGTAGTCGCCTCGCCAGAAGAAGCCGT
+TGCTGTAGTTGCCAGAGTTGAATCCACCGGTGTTGACGTTGCCGGTGTTTCCCACGCCGGTGTTGAGGTT
+GCCGGGGTTGAAGAAGCCTGTGTTGGAGCTGCCCGTGTTGAAGTCGCCCGTGTTGAAGCTGCCTAGATTG
+AAGCTGCCCGTGTTGTAGTTGCCCGTGTTGCCGATGCCAGTGTTGGCGATGCCGGCGTTGAAGAAGCCCG
+TGTTGGCTTGGCCCGTGTTGCCGATACCCGTGTTGTAGCTGGTACCTGAGTTCCCGATGCCGAAGTTTCC
+GGTGCCCGTATTGCCGATGCCGATGTTGCCGGTGCCTGAGTTGAACAAGCCGATATTGCCGGTCCCCGAG
+TTCCAGCCGCCGAACCCCTGCTGGTTGTCGCCGGTGAGGCCGAAGCCGATGTTTCCGTTGCCCGTGTTGC
+CGAAGCCGATGTTTCCGTTGCCGGTGTTGCCCAAGCCAACGTTGTTGCTGCCGACATTTCCAAGGCCGAA
+GTTGTTGCCGCCGGGATTTAGGCTGCCCAAGTTCAAAATGCCAAGGTTAGCGGCGCCCATCTGTCCGAAG
+CCCGAGTTTGCCAGGCCTAAGCTAAGATTTGCCAGCACACCCTTGGAACTGGTGATCGCCGCGGTGACGA
+CGGCCGCCGGAGCGGCCGCCAACTGGGCGGGCAGGTCTGTCAGATTCTGCGGCGGCGCAGTGAACGGCGT
+CAGGGCCGACGCCACCGCCGATGCCCCGGCATGGTAGGCCGACATCACCGACACATCGATGGCCCACATC
+TGTTCGTATGCGGCCTCAATCGCAGCGATCGCCGGAGCATTCTGCCCGAAGAAGTTTGAGAACACCAATG
+ACACCAGGTCGGAGCGGTTGGCCGCCACCAGCGCCGGTTGCACCATCGCCGCCCGGACAGCCTCGAACTC
+GGCCACGAGGGCCGCGGCTTGGGTTGCCGACCGCTGGGCCTGGGCCGCTGCCGCGGCAAGCCATCCTAGG
+TACGGCGCTACCGCAGCGGCCATCGCCGCCGATGACGGTCCGAGCCACGATTCGCCGACCAGGCCCGACG
+TCACGGAGTTGAAAGAGGCCGCTGCCGAGGCCAATTCCATCGCCAGTTGGTCCCAGGCGACCGCGGCCGC
+CGACATGGGTTCTGATCCCGCCCCGCCGAATATGAGGGCCGAGTTGATCTCTGGTGGCAATGTTGAAAAA
+TTCATGGCCCCGACTTTCCCTGGGTGCACCGAATTCATGGCGGCTCACCAACCCGCGGTCGGCGAGCGCC
+GTGTCGCTCGACGCTACTCGGCGATCTTCGCGGCCGTATGCATATCACCCGAATAGGGCCATGATTCATA
+GATCTCGTCAAACTGATTTACGGCGGGCGCTTTTTAGCCGCTCTAGGAATCGACGCCAAACCCAACGAAC
+GAGCCTCAGCCAAGGCCGAAATCGATTAATTCCCCGATGATTTCATCGTTGTGGAGGTCGTCGCAGGCGT
+CGTTGATCTGATCGTGGCGATTACGGCTGGTGATCCTCTCCGCGGGGCGGGGTCCGCACGGATTATGGCG
+TGGTGCTCTGGAAGAACAGGCCCGACAGGTTGTTGCCGATGTTGGCCAAACCGGAGACCAAGCTGGTCAC
+GGCAAACGGCAGGGTGCCGGTGTTGGCGAAGCCCGATATGCCGCTGCCAAGGTTGGAGAAGCCGGAGATA
+AGACCACCGTAGTTCTGGTAGCCCGAGCCGGCTAGCAGCCCAACAGGACTTGTGTTGAACCAACCCGACA
+GTCCCGAGCCGCTGTTGCCGAAGCCCGAGTTCCCACCGATTCCGGCGTTGAAAAAGCCCGACGAGGGCGT
+TGCGCTCGAGTTGAAGTATCCCGGCCCCGCTGGGATTGCGAATCCGCCCATGGTGGTGCTCGGCAGGTGG
+ATGCGGGCGATGGTGAGTGCGGGTGTGGTGAAGGCCGCCAAGCCCACCGGCTGGATGGTGAACTCTGGCG
+TGGTGATCTCCGGGATATTGACCTGGGGGAGGGTGAAACCGCTAAGTCCGATCGGGTCGATGGCGAACGG
+TGGAGTCGTTATCTCGGGCGTCATGATCTGAGGAAGCGTGAAACCACCCAGCGCTATCGGATCGATCGTG
+AACGCCGGGGTGGTAATCGCCGGGATGCTGAGCTGCGGCAGCGTAAACCCACCCAGCGTGATCGGGTCGA
+TGGTCAACTCCGGGGTCGTGAACTGTTGAGTAATGATATCCGGCAGGCTCAATGCACCGACACCAATCGG
+ACTGATCGTCAACGCCGGAGTGGTGAATTCTTGGGTGCTGATCTCTGGCAGGGTGAACCCGTCGACCGAG
+ATCCCCCCGAGGGACCACGGTTGGATGACGACGTTGGGGAGGGTGAAGGGGGTGACGTTGATTGCGCCGA
+TCGAGAAGCCGACGCCGTTGATTTGACCTCCACCCACGGTAATGGTCCCAGTATTAATAAAGGCAGGAGG
+TGTATTAGCGAAGCCGCCAATCTGCGGGAATACCCCGGGCATATTGGTTTGCAAGGCAGTGATGTTGTTC
+GGAATGAACACCACCAAATTAGTTATCGTAATGCCGTTAAGGCTAAAGGTGGGAAGATTGATGACACCAG
+AATTTGCTTGCGTGGCTATGCCGGGAGTGCTAAAGCCGCCTATACTTATTTGGGGTGTACTTATTAACGG
+GGTGTGTATCGTGGGTAGCGTAAATCCGCCGACAGTGGTTGCCAGCCGGAATCGTGATCGGCGGAACCGT
+CACCGACGGAATACTCAGCGTCGGCAGATTGAACGCACCTAGCGCTGTGCCAGCCGGAATCGTGATCGGC
+GGAACCGTCACCGACGGAATACTCAACTGAGGCAAGTTAAACGCACCTACCGTGATGTTGGCTGGTGTCG
+TTGTAGCTGGAATCGTCAACGACGGCACCGTCAACCCCGGCAAATCAAACGCACCCACCGTGATGTTAGC
+TGGCGTCATCGCCGCTGGAATCGTCAACGACGGCACCGTCAACCCCGGCAAATCAAACGCACCCACGGTA
+ACGTTGGCCGGCGTCGTCACCGCCGGAATCGTCAACGACGGCAAGGTTATCGCGGGCAGGCTGAACGCGG
+GAACCGAGATTCCGGGTATTTCCAGAGACGGAAGCGTCAAATCAGGGCTGGTGATGGCGAACTGCAGGCT
+GCCTTGGCCCACACCACGGTAAAAGACACCATTGTTCATGTCGCCCGTGTTGAACAAGCCGTTATTCATG
+TCGCCTATGTTGAAGGCGCCGGTGTTGATGCTTCCTGTGTTGAACCAGCCGGTGTTGGCGCCGCCCGTGT
+TGAAGGTACCCGTGTTCGACGGGCCCGGGTTGAAGGCACCGAAGTTGTAGTGGCCGACGTTGAAGCTGCC
+GGTGTTCGCGTTCCCAACGTCGAACATGCCCGTATTGAAAGAGCCCGCATTCAGGAATCCGGTGTTGCCG
+TGTCCGGGGTTGAACAGGCCAGTGCTGAAGTTACCGGAGTTCCCGATGCCAAAGTTGCCATTGCCGGAGT
+TGAAGAAACCGATATTGGCGCTACCCGCGTTGAATAATCCGACGTTACCGTTGCCGGAATTGAGTCCGCC
+AATGCCGATTTGGTTGTTTCCAGTCAGGCCGTTGCCGATATTGTTGTTGCCGGTGTTCGCAATTCCGAAG
+TTGCCGATGCCTGCATTGGCGAATCCCGTGTTCAAATTGCCCAGGTTTGCAAGTCCGAAGTTGTTGGCGC
+CCGCGTTTCCTATGCCGATGTTGTTGCCACCTAGGTTGGCCGAGCCGATATTGAAGCTACCGAAGTTGCC
+GGACCCCAGATTGTTGTTGCCAAGGTTGGCGTTGCCGATGTTGCCGAGCCCATTGTTGGCATTGCCGAGG
+TTGCCACCACCGACGTTGGCCAAGCCGAGGCTAGCGGCGATCGCCCGGCCGGCAAAAGTCGGCATGCCCA
+CGGCCGTGGTGAGCGCGGTCACCACGGCCGCGGGCCCGGCCGCCAGACCCGCCGGAAGCCGCAGCGGGAG
+GGCGAATGCCGGTAGCGCCACAGCGACCGCCGACGCCCCGGAATGGTAGGCCGCCATCGCCGATACATCC
+AGAGCCCACATCTCCTCGTATGCGGCTTCGGCGGCCGCGATCGCGGGAGCGTTTTGACCAAAAAGGTTCG
+ATATCACCAGCGATATGAGGCCGGAACGGTTGGCGGCCACCAGCGCCGGTTGTACCATCGCCAGCCGCAC
+AGCCTCGAACTCGGCCACCATCACCTGGGCCTGGGTGGCCGCCTGCTCGGCCTGGGTCGCCGCCGCGGCC
+AGCCACCCCGCATACGGGGCTGCCGCCGCTGCCATCGCCACCGATGACCGACCCTGCCACGACCCGCCGA
+CCAGCCCGGCTGTCACCGAGCCGAAAGAGACAGCAGCCGAGGCTAATTCGGTTGCCAGCCCGTCCCAGGC
+CGACGCCGCCGCCAGCATCGGTCCGGAGCCCGCCCCGGCGAAGATCAAGGCCGAGTTGATCTCCGGCGGC
+AACACTGAGTAATGCATCGCTCCCCACCTTCCGGGGTGAGCCTGGTGCTGATGAAAGGTCACACGCCCGT
+CGTCGCTGACTCGTTCGTAGCGCATGAGAGTACGCGGAGATCTTGAATTGTGTATCCGAGCAAATGAAAC
+CGTTATCTATTTGTTATAGACATATCGGGCACGGATGCAAAGTTCTTTTACACGCTATGCGTAATCACGA
+TCCGTGCCCGTCTGATGTAAACCACCGACGTAGGCGCACTGATATAAATGCATTTATTACCAAGGTGATT
+GGGTGAAATAATTACCCCGGAAAACTGTGCTCAATAGGAACGATTATTAGTTTGAATCACTGCCATAATC
+CACCCTATGTGCAACCCGGATGAATTCCGATCGCGTGCTTATTCCTGCCAAACATTCGGGCTTTAGCCCT
+GGCCCACCACGCGGGCACCAATCCGACGCTGCCCCTACAGCGAAATCACCGGCGCACCGCCTCCCGCTCG
+GCCGCCTTCACCAGTTGACCCGCGAAGAACCTGACCGCGCCACCCAGCGCCGCCCGCATCACCGGCCCCG
+TCCCACGAACCTTTTCGGTAAACGAGCCACTCCAGCGGAGATCGGTACCGCCCGACGCATTTGGTGTAAG
+GACCACCTCGCCGAAGTAGTCCTGGACGGGTGTCCTCGCGCCAACCAGCTTGTAGACGTGGCGACGGTCC
+TGCTCATACTCGACGGTCTCTTCCTGCACGAACACCGGCCACATGCCTAGTTTGCGGATGGCCCCGATGC
+CGCCGGGCGCGGGATCACCGCGTCGCGCCCAACTCGATTGAGCAACGATGGGCTTGGCCCAGGTCGCCCA
+GTTGCCACCGTCTGTCACGAGCCGAAACAAGGTTGCAGCCGGCGCGCTGCTGGTCTTGGTGACCTCGAAC
+GAAAATTTCCGACCCGACATGCGCGACTCCCGAAACGACAACTGAAGCGGCCCGATATGGTGCTGCCGCG
+TACCCTACCGCGCAGCCGTCCGTGCCGGCCGTAGTGGACCAGCCAAGGTGTTCCCGCGCTGGCCGCAGCA
+GGCGCATAATCACGAGGTGTCCCGCGCAGATACCGTCTCAGTGCCCCGTGCGCCCACCCAGGCTGAGGTC
+GCCGCAGTGCTGCGCATCATGACGCCGCTGCGCAAGGTGATTAAACCAAAGGTCTATGGGATCGAAAATG
+TGCCGACCGAACGCGCATTGCTGGTTGGCAACCACAACACGCTTGGCTTGGTCGACGCGCCATTGCTGGC
+CGCCGAGCTCTGGGAGCGGGGGAGAATCGTCCGGTCCCTTGGCGACCACGCCCATTTCAAGATTCCGGGG
+TGGCGCGACGCGCTGACACGAACAGGGGTCGTCGAAGGCACCAGAGAGATCACCTCGGAGTTGATGCGAC
+GCGGCGAGCTCGTCATCGTCTTTCCCGGCGGCGCCCGTGAGGTCAACAAGCGCAAGAACGAGCGCTACAA
+GCTGGTGTGGAAAAATCGGCTGGGGTTCGCGCGCTTGGCAATTCAGCACGGCTATCCGATTGTGCCGTTC
+GCTTCGGTGGGTGCTGAACACGGCATCGACATCGTGCTCGACAACGAATCCCCACTGCTGGCACCGGTCC
+AGTTCCTCGCCGAGAAGCTGCTCGGCACCAAAGACGGTCCGGCGCTGGTCCGTGGTGTCGGACTGACACC
+GGTACCGCGCCCCGAACGGCAGTATTACTGGTTCGGCGAGCCAATCGACACCACAGAGTTTATGGGGCAG
+CAAGCCGACGATAACGCCGCACGCAGGGTGCGCGAGCGTGCCGCCGCCGCTATCGAACACGGCATCGAGC
+TGATGCTGGCCGAGCGCGCAGCCGATCCAAATCGATCCCTGGTCGGACGGCTCTTGCGCTCGGACGCCTA
+AGGCGCCCCTGAGGCGTTCCCGGGGCCTGATTCAGAAGTCAGAAGACCGAGTCGACTTGATCGGGGATTG
+GGGTGCCGTCGTTGCGCAATACCGGTTGTTTCGATCCGTCGGGGTTGATGAATGCCTCCCCGCATACGTA
+AGGAGCGTGCTGGGGCAGCGGGTCGATAAACATCGGGTTGATCGCCCACTTACCGCCCCTGGTGAACAGG
+CCGTCGTAGGCCCGGCACATGAGGTCGTCCTGGTTGCGGTTGATCACGAGTGACACCACGGTGGCGTCGC
+CGACGAAGGTGGCGTCGCTGTTCGAGTCGCCGGCGGCGAGGACTTGACGACGATCCGCCGCGAGCTGATT
+GAAGGCTTGCGGGCCAGTCACCCCGAAGATGACCTGATTGGCCCAACACCGTTTGCCATCAAGGTAGGTC
+ATGACTGAATCGTCGCCGTCGCGGACGCCTCCGCAACCGACGAGGTGAGCGGTGAGTTTCCCGGACTGGT
+CGGCGACGCTGCGGACTCCGACGACATGCTGATCGTCTAGACCTACCTCGCCCGCCCACACCTTGACGAT
+CGGTTCGGGTGACGCTGACACCACCCAGGTGTCGATACCGTGTGCCTGCAGAGTACCGATGAGGTCTTTC
+ATTTGTGGATAGACGCGGATGTAACCATCGACCTGCTGTGTTCCGACCTGCTGGGTGGCGCCGACATCGG
+CGGCAAGGTTCTGTTTCTTGGCCTGGTCTGCGAATCCGGCGAGCTCCTCAGCGGTGTAGCCCGCCGACAG
+TGCGTTGCTCCACGCGTACGGACCCGCCAACCGGCGCACGTTGTTACCCACGAAAGCCGGCTGTCCCGTG
+GTGGTTTCGCCGTCGAGAAGGGAAAGGATCTCGTTCGCGCACAACGCATTGCTGCCGGTCGGCAGCGGCT
+TGCCGGCAGGTACAACCTTGCCGCATGCCACGCTCAGCGCGTTCGCCGCCGCGTCGGTCAGGTATCGGCT
+GGCGGCATGCCAATCCTGGTTGGCTGGCTGCAGCACCAGGCTGTGCTGCAGCATGTAGTAGTTCGTGGCG
+TAGCCGATGTCGTTCTTGACGACGGTGTTGTCCCAGTCAAAGATGGCGACCTTGCGCGCAGAACCGTCCG
+CGGTGCCGGTGCACCTGCTGTTGGCATCGATCGCCGACTGCAGGAATTCACGAACTCCGTGGTGCCACTT
+CAGAAACGCGTCGAGCTGACGACAGCCGGACGCTGGGGTCGGGGGTTGGTGGGCCGAGCAGCCGATGACG
+CCACCGAGCACGGTTGCCATTGCCAACAGCGACGGTATGAGTCGCACCATGTAAGCCCTTCGTCAGCCCT
+TGGTCGTGCCAGCATGCGCCGGATGGAAGGGGGATGGGAACTGAATGGTTGCCTGCTGAACTGAACGCTG
+AGCAAATTCGATGCCGACGAAACATTATGGGTTTGTTTCTCGACGGCAACCCGTGCGCGATTCGACAGTC
+ACCGCGATGCTGCCGACGCCGGCCCGCGCTCCCGGGCGATCCGCGTGAGCAGCGTAATCTCGTGCGCACG
+GATTTGCGGCCCGGACTAGCGCGAAAGATACTGTTGAACAGATGGATTCGACTGTAACGGCCTCGATCCG
+ACGCATGCTGGGACTGCTCGCCGCCACATTGCTGCTCGGCGGCTGCACCGGCCAGCACACGACACGCACA
+GCGGCGAGCACCACATACACGCCCCACATCAAGGCCAGCAGTCAGGACGTACTGGACGGCGCCATCAATG
+CCGACGAGCCAGGTTGTTCGGCCGCGGTAGGAGTCGAGGGGAAAGTTATCTGGTCAGGCGTTCGCGGCAT
+TGCGGATCTGGCATCCGGCGCCAAGATCACCACGGACACCGTGTTCGACATCGCGTCGGTGTCCAAGCAG
+TTCACCGCCACCGCGATCCTGCTGCTCGTCGAAGCCGGAAAGCTAACACTCGACGACCCGATATCCCAAT
+ACGTACCCGAGCTACCCGACTGGGCCCAAACCGTCACCGTCGAGCAGCTCATGCATCAAACCAGCGGCAT
+CCCTGATTACGTCGCATTGCTGGCAGCCAGGGGGTATCAGGTCAGCGACCGCACCATCGAGGCCGAAGCC
+AGGCAGGCGTTAGCGGCCGCCCCCGAGCTGCAATTCAAGCCTGGCACCAGGTTCGATTACTCCAACTCCA
+ACTACTTGCTGCTCGGCGAGATTGTCCACCGCGCATCGGGACAACCGCTGCCTGAGTTCCTCAGCGCCGA
+GATCTTTCAACCGCTTGGTCTGGCCATGGTGGTGGATCCGGTCGGGAAGGTTCCCAACAAAGCCGTGTCA
+TATGAGAAGGGCACTGGTGGAAACCGGTCCGAGTACCGGGTGGGCAATCCGGCCTGGGAGCAGATCGGCG
+ACGGTGGCATCCAGACCACGCCTAGCCAACTGGCCCGGTGGGCGGACAACTACCGGACAGGAAGCGTCGG
+CGGCCTGAAACTGCTCGAAGCACAACTTGCCGGTGCGGTGGAAACCGAACCCGGTGGCGGCGACCGCTAC
+GGCGCCGGAATCGTGTCGCGCGCCGACGGAACACTCGACCACGCGGGCGCCTGGGCCGGATTCGTCACGG
+CATTCCACATCAGCAGTGACCGACGGACTTCGGTGGCCATCAGCTGCAACACCGACAAGCCGGACCCGGT
+GGCCATGGCCGATGCGCTGGGGCGCCTTTGGATGTAGCGGGGCTACCGCGGTTGGCCGCCGGTACCCAGG
+CTGCAATCATTCACGGTATGGCGCAACCACCGTCACTCCTCACAACTGACAATGGCCTACCCTTCGGCGT
+GCAAGGTGCCTGCGACTCCCGTTTCACCGGAGTCATCCGTGCCTTTGCTGGGCTGTACCCCGGCCGCAAG
+TTCGGGGGTGGGGCACTGTCGGTTTATATCGACGATCGCCAGGTCGTCGATGTCTGGACGGGGTGGTCCG
+ATCGGCAGGGCAAAGTACCCTGGACGGCCGATACCGGGGCAATGGTGTTCTCCGCGACCAAAGGGTTGGC
+CGCAACGGTGATTCACCGTTTGGTCGATCGCGGCCTTTTGTCCTACGACGCGCCGGTCGCGGAGTACTGG
+CCCGAGTTCGGAGCTAACGGCAAGTCTGAGGTCACCGTCAGCGATGTGTTGCGACATCGGTCCGGACTGG
+CGCACCTCAAGGGGGTGGACAAGGACGAGGTCATGGACCACCTCCTGATGGAGCAGAAGTTGGCGGCTGC
+GCCGCTAAACCGCCAGCACGGGAAGTTGGCTTACCATGCGGTGACTTACGGATGGCTGCTGTCCGGCTTG
+GCTCGTGCAGTGACCGGCAAAGGCATGCGTGAACTGTTCCGCGAAGAACTCGCTCGCCCGCTGAACACCG
+ATGGTATTCATCTCGGCCGGCCACCGGCCGACTCGCCTACCAAGGCGGCACAGACACTTCTGCCCCAAGC
+CAAGGTCCCCACCCCACTGCTCGATTTCATCGCACCAAAGGTTGCGGGGCTGTCGTTCTCCGGGCTGCTC
+GGCGCCGTCTACTTCCCGGGCATCCTGTCGTTGCTGCAAGACGATATGCCGTTCCTCGACGGTGAGGTTC
+CGGCGGTCAACGGCGTTGTGACCGCGCGCGCCCTGGCCAAGACGTATGGGGCGTTGGCCAATGACGGTGT
+GATCGACGGCACCCGACTGCTGTCGTCGCAGGCGGTACGTGGATTGACGGGGAAGTCCGAGCTATGGCCG
+GACCTTAATCTCGGTCTTCCTTTTACCTACCACCAGGGTTACCAATCGTCTCCGGTGCCTGGGCTGCTGG
+AGGGGTACGGCCACATCGGGCTCGGTGGCACGATCGGATGGGCCGACCCGGAGACCGGCAGCGCATTCGG
+ATATGTGCATAACCGCTTGCTGACGCTACTGTTGTTCGATATTGGCTCGTTCGCAGGGCTGGCTGCGCTG
+CTGAACAGCGCCGTCGTGGCAGCACGTCGCGATGACCCCCTGGAAGTGCCGCATTTCGGTGCGCCCTATA
+GCGAACCGCGTCATGAGCAGGCGGCCTCGGGTGCATAACTGCTCCCGTTATGCCGCGAGCGCGAGCCCGA
+CGGGCTAGAACTCGTAAACGAGTAGCCAGACGAGAGCGACGGCCGCCAAGAACAGACCAACCAGGATAGC
+CGCGCGGGTAACCAGTACCTGGCGATGGAACCACTCTCGCAGCTGGGTGAATCGCCAGTCGGTCCAGGCG
+TAGGCGCGCACAGCCCACTGCGCCTCGACCGCGAGCAGTCGAAACGCGACCAGCAGGGCCGGGATGCCGA
+GTTCGGGGAGCAGCACGATCATCGGCAGGGATACGACGAATAGCCCGCCACCGACCACAGCGAGTGTCGC
+GCGAATCAGTAGCGGCCTGGCCCGTACCCGCTGTCGGTATGCGAGCACTCGGGCGAGCGCGGCGTCGCGG
+GTGGAAGTCGGGTTGATGACGTCGGCCGGGTCCATGACTGCTCCTAGTGTGCCTGCCTCGACGCCTAGCG
+GACGGCTGTGTCGGGGGTGGTTTGGTTCGGACTCTAGTGGAGCCCGGTTGCGCACTCGGGTCCGACCAAT
+GCGGGGCCGCGCCTCATACGCACGATAAGCGTGGGTGCATAGACTGCGGTTATGAATGACGGCTCCCGGC
+AGGAACTCAGGGTTCGTAGCGGCCTACTACAAATCGAGGACTGCCTGGATGCTGACGGCGGCATCGCATT
+GCCGGCAGGCACCACGCTGATCTCGCTCATCGAGCGCAACATCAAGTATGTCGGCGACCTCGTGGCGTAT
+CGCTACCTGGACCACGCCCGTTCGGCCGCCGGATGCGCCCTGGAAGTGACCTGGACGCAATTCGGTATGC
+GATTAGCGGCCATAGGTGCACACGTGCAACGGTTCGCAGGCCCCGGCGACCGCGTTGCGATCCTCGCACC
+ACAGGGCATCGACTATGTTTGCGGGTTCTACGCTGCAATCAAGGCAGGCACCGTCGCGGTGCCGTTGTTC
+GCACCCGAACTGCCGGGTCACGCCGAGCGTCTTGATACGGCACTTCGCGATTCGGAGCCAGCGGTCATAC
+TCACGACGGCGGCGGCGAAAAACGCCGTTGAAGGTTTTCTGAACAACGTTCCGCGCCTGCGAAAGCCGAC
+AGTCCTCGTCATCGATCAAATACCCGACCGCGAGGGGGAGCTGTTCGTCCCGGTCGAGCTGGACATCGAC
+GCCGTATCCCACCTGCAGTACACCTCGGGCTCGACGCGACCCCCGGTCGGTGTCGAGATCACCCACCGCG
+CGGTCGGCACCAACCTGGTGCAAATGATCCTGTCGATCGACCTGCTCAACCGAAACACCCACGGCGTCAG
+TTGGTTACCGCTGTACCACGACATGGGCCTATCCATGATCGGCTTTCCGGCGGTCTATGGCGGACACTCC
+ACCCTGATGTCGCCCACGGCGTTTGTCCGCAGGCCACTGCGATGGATCCAGGCGTTGTCCGAGGGGTCGC
+GGACCGGACGCGTGGTCACCGCGGCGCCAAACTTCGCCTACGAGTGGGCCGCACAGCGTGGACTACCCGC
+GCAAGGCGACGACGTCGACCTCAGCAATGTCGTGCTGATCATCGGTTCCGAACCAGTCAGCATCGATGCG
+GTGACCACGTTCAACAAAGCGTTCGCGCCCTATGGTTTACCGCGTACAGCGTTCAAACCCTCGTACGGCA
+TAGCCGAGGCGACCCTGCTCGTCGCGACCATCGACCATGCCGCTGAGCCGACGGTTGTTTATCTTGACCC
+AGAGCAGTTGGGCGCCGGACACGCGACGCGCGTCGCGCCGGATGCGCCCAACGCCGTCGTGCACGTGTCG
+TGTGGCCATGTGGCCCGCAGCCTGTGGGCCGTGATCGTCGACCCGGATACCGGCCCCGAGGCGGGCGCCG
+AACTGCCCGACGGTGAGATCGGTGAGGTTTGGTTACAAGGCGACAACGTTGCTCGGGGGTATTGGGGACG
+GCCGGAAGAAACGCGGATGACGTTCGGTGCCCGCTTGCAATCACCGCTCGCCGAAGGCAGCCACGCCGAC
+GGGTCCGCGATCGACGACACCTGGCTGCGCACCGGAGACCTCGGCGTGTACCTCGACGGTGAGCTCTACA
+TCACCGGTCGAATCGCGGATCTGCTGACCATCGACGGCCGCAACCACTATCCGCAGGACATCGAGGCCAC
+GGCCGCCGAGGCCTCGCCGATGGTGCGGCGCGGATACATAACCGCTTTCACGGTGCCGGCCAGCGACGGG
+GACGACCGCAATCAGCGACTGGTGATCATCGCCGAACGTGCGGCAGGCACCAGTCGCAGCGACCCGCGGC
+CGGCGCTCGACGCGATTCGCGCAGCGGTTTGCAACCGCCACGGGTTATCCGTTGCGGACCTGAGTTTCCT
+GCCGGCCGGCGCCATTCCACGCACCACCAGCGGGAAGCTGGCTCGCCAGGCCTGCCGCGCCCAATACCTC
+AGCGGTCGCCTGGGCGTGCATTAGCTACGATCTACGGCTCCCAAATCAGCAGATCCTCCATGCCGTTGTT
+CATCGCGACGATGGTTGGCGATGGGCCGGTGACATCGAAGTAGATTTTGCCGGTCGATTGTTCGCCTTGG
+GGGATAGTGGCTCCGCTAATGGTGTCGGGGCCCGCGGCTTGCCACAGCACCCGGTAGTTGATGCCGTCGG
+CGGTGCGGGCATTGAACTGCGAGACCGCGGGCGTGACGCTGCCGCGAATCGCATTGACCGTGGCAGTGGC
+CTCCCAGACCTGGCCGGCCACCGGATAGCCGGGGATGACTGCCGTGCTGGATTTGAGATCACTGACCTTC
+CAGCCGAGCACGACTTGGCCAACGGTGTCGGTCATCGTTAGCTCACTGCCAAGTTTTCCGGTGATGGGAT
+AGGCAGCCAACGCGACCGGTGCCGCAAAGGTCGCGATGGCCGCCATGGCCACGACCGCTACTGCCGTCTT
+GATCATTGTGGTGAGCTTCATTGGTCCCTACCTCCACTACTTGTTGGGGCGATTACCTGGTTCGAACCTC
+GCCGACGTCATTACCTTAAGCCGCAAATGACCCGCTGCTAACTCCAGATTCGATAGGAACCGTGGGGCAG
+ACGATGCCGTTCACATCCGTAGCCGGCGCACCGACGACGGGCGTGGCCATGAATGCTTGATGGCCGAGTC
+GTAGGCGACCAGCGCAAGGGAGCCAAACCGCATGTCAGGATGGTGTGGTGACCGCCATACCCGGCCCGTC
+GGGCGCCGAACCCGGTGAGAGCCGCGCGCTCGCGGGTTACCCGGTGACGCCGCCGGCGCTGCCCCGCCCG
+GTGATCTTCGACCAGCGCTGGACTGACCTGACCTTCATCCACTGGCCGGTGCTGCCGGAGAGCGTGGCAG
+GCAGCTACCCGCCCGGGACTCGCCCCGATGTCTTCGCCGATGGGATGACTTACGTGGGTCTGGTCCCGTT
+TCGCATGAGCAGCACCAAACTCGGCACCGCACTGCCGATCCCGTATGTCGGCACCTTCCCGGAGACCAAT
+GTCCGGTTGTACTCCATTGATAACGCCGGCCGGCACGGGGTGCTTTTCCGGTCGCTGGAAACAGCTCGAC
+TGACTGTCGTACCGCTCACGCGGATAGGACTCGGCATCCCGTACGCCTGGTCGAGGATGCGGATGATGCG
+CTCTGGTAAGCACATTACGTATCACAGTGTCCGCCGCTGGCCACGGCGCGGACTGCGCAGCCTATTGACG
+ATCACCATCGGTGACCTGGTTGAGCCGACGCCGCTGGAAGTCTGGCTTACCGCACGGTGGGGTGCGCATA
+CCCGCAAGGCTGGCCGGACTTGGTGGGTGCCGAACGAGCATAAGCCGTGGCCGTTGCGGGCCGCGGAGAT
+CGCCGAGTTGAACGACGAGTTGATCGACGCAAGTGGCGTGCAACCCACTGGCGATCGGTTGCGCGCCCTG
+TTTTCACCGGGTGTGCATGCCCGATTCGGCCGTCCGTGTGTCGTTCAGTGACGTTTAGGGGCAGGTGTAT
+CCACCATCAATCACGATGTCGGAACCGGTCATATAGCTGGAAGCCTCGCTAGCCAGATACAGGTAGAGGC
+CAGCGAGTTCTTCGGGCCGGCCCAACCGGCCCAACGGAATCTTGGGCTCCCATAGCGGCTGGTATTCCGT
+GTACGGTTCGACGAGCTCGGTCAGGATATAGCCCGGACTGACACTGTTCACCCGGATTTTATGCGGCGCC
+AACTCCACGGCCATGGCTTTGGTTAGATGAATGACCGCCGCCTTGGAGGCGCAGTAGTGGGAAACCTGCT
+GCGGGACGTTGATGATGTGGCCTGACATGGAAGCAGTGTTGATGATGACCCCGCCTTGGCCTTGTTTGAC
+CATCGCCTTGGCAGCGGCCTGCGCGGTAAGGAAGACGCCTGTCACATTGGTGTTTTGGAGGCGCTGGAAC
+TCTTCCAGCGGCATGTCCAGCATCGGAGTGACCGTGATGATGCCGGCGTTGCAGACCGCGATGTCGATCC
+CACCCAGCTCCGCGGTCACCTGATCCAACATGCTGGTCACCTGCTGGTGCTGGCTCACATCGCAGCAGAC
+GGGCACGACCTTGCCACCTGATGTGCCAATCTCATCCGCCAACTTCTCTAAGGCATCCAAATGCCGTGCG
+GCGATCGCCACTTGAGCCCCGGCTTCGACGTATGCCAGGGCAACTCTCTTGCCGATGCCGGTGGATGCCC
+CGGTTATCAGCGCCCTCTTGCCGTGCAAGTCGAACAGGTCCAACACGCTCATTCGTGATCCCCTTTCGCG
+CGACGCAGGGCCGATACCTGATGGAATCACATGCCGAAATGCGTTCGATGAACTGCCGCAATGGCTTCCA
+GTGGTCCGCTCACTTCGACCCGCGCTACGGCTCGGCGTCCAAAGACGTACAGCAGCAACTCGCCGGGCGG
+TCCGGTCAGGCGAGCCGTCGGCTCGCCTGACCGGACCCTCACCCGCTTACCGGTTCCAACCCACTCGATC
+TCAAGCCCGCAACCGTGCAGCCGCCGACTCAGGAAGTGGCTGCCGCGCCGAACATTTCGCCATAGGGCAG
+CATCCATTTCGGGCGTGAGGCTTCGGGGCCCTCGTCCGCTGGCGCGGCGAACGTCCTCGTGATGGACAAA
+GAATTCGTTGAGGTTCGCCAAGGTACGAACCCATCCGATGCGGAAGAACCCCATCGGTGGACCGGACCGA
+ATCCGAGCGACGAGCCACGTGAAGTCTTTACTCTGAGCCAATCTCGCTCTACGGCGTTCGGCAAACCGCT
+GGAAGGGACCCGGTAGAACGATGCAAAGGCCAGCAACGAGATCGCGTTCACGCAGCACGATGTGAGCGGC
+CAGGTCGTGAGCAGTCCAGCCCTCGATCAGTGTAGCAACCGCAGGACCGAGCTCCTCAAGGAGATCACAG
+AGCTCCAAGCGTTCTTGCGCGTCCAACGGGACATCAGCCACGCCGCGGGAGTCTACGGGCGACGTGCCTG
+CGCGCCAACGGGCTGCCGCTTGCGCCGTCGCGACTGCACAGCAGCCAGCGCCCGCTCCCAGGCGAGCAGC
+GTTGCGGCCGTCAGATTGGCCGGTTTGGCGCTGTCCTTGGACAGCAGCGCGGTCGCGGCGGCTTTGGTGG
+TCGGCGACGCCTTCGACATGTGACCGGAGTCGAACGGCGGCTGCGGGTCGTACTCGATCGCCAGCTGAAT
+CGCCTTGGCCCGGGCCTCCCCGCCCAGCTGTCCGGCCAGCCAGAGGGCGAGATCGAGCCCGGCGGACACG
+CCCGCGCTCGTGACAATGTTGTCCTGGTGCACAATCCGCTCGTCGGCGACCGGGATAGCGCCGAATGCCT
+TGAGCGCGGGAAGCGTCAGCCAATGCGAGGTCGCGCGCCGGCCCCGGAGCCACACGAACCGCACCTGGGC
+GTGCGGCAGGTTTCGCAGCACCTCGTACGGGCCGACCACGTCCAGCGCGGTAACGCCGGGGTAGGCCACG
+AATGCGATTTGCGTCATCGGTGTTCTCCCTAGTGTCAGGCGAAGGCTTTGCGGTATTGGTCGGGTGATAT
+CCCGACGCGGCGAATGAAGCTGCGGCGCATGGTTTCCGCGGTCCCGAAGCCGCATCGGGCGGCAATTGCC
+ACCACGGTGTCGTGGGTCTCCTCCAACTGGCGGCGCGCAGCCTCGGTGCGGATGCGTTCGACGTACCGGC
+CGGGCGCCTCGCCGACCTCGTCGCTGAACACCCGAGTGAAATGACGCGGGCTCATGGCCGCACGTTGAGC
+CAGTTCGCCGATGCGGTGCGCGCCCCCGGCTCGGCCTCGATGGCCTCCTGCACCCGGCGGATCGAGGTCC
+GTTTGGCGCGTGGCATCCACACCGGAGCCGCGAACTGGGTCTGCCCACCGGGTCGGCGCAGATACAGGAC
+GAGCCAGCGGGCAACCGTCTGGGCAATCTCGGTGCCGTGGTCGTCTTCGACCAGTGCCAGCGCGAGGTCG
+ATGCCGGCGGTGACTCCAGCCGCGGTCCACACCTTCTGCGAACTGCGCATGAAGATCGGGTCGGCATCGA
+CCCGAACGGCCGGAAATTCGCGGGCGAAATGTTCGGCAAAGGCCCAGTGCGTCGTCGCTCGGTGTCCGTC
+CCAACAACCCCGCTTCGGCCGCAAGAAACGCGCCCGTGCACACGGTGACGACGCGGCGGGCGGTGCCGGA
+GACGGCTTTGACCCAGTCGATGAGGGCCGGTTCGGACCGTGCGGCATCGACTCCGGCGCCACCGGGCAGG
+ATCACGGTGTCGACGGGGTCGCCGGGGAATCCCACGATAACCACTCTTCGCGCCATGAATGCCAGTGTTG
+GCCAGGCGCTGGCCTGGCGTCCACGCCACACACCGCACAGATTAGGACACGCCGGCGGCGCAGCCCTGCC
+CGAAAGACCGTGCACCGGTCTTGGCAGACTGTGCCCATGGCACAGATAACCCTGCGAGGAAACGCGATCA
+ATACCGTCGGTGAGCTACCTGCTGTCGGATCCCCGGCCCCGGCCTTCACCCTGACCGGGGGCGATCTGGG
+GGTGATCAGCAGCGACCAGTTCCGGGGTAAGTCCGTGTTGCTGAACATCTTTCCATCCGTGGACACACCG
+GTGTGCGCGACGAGTGTGCGAACCTTCGACGAGCGTGCGGCGGCAAGTGGCGCTACCGTGCTGTGTGTCT
+CGAAGGATCTGCCGTTCGCCCAGAAGCGCTTCTGCGGCGCCGAGGGCACCGAAAACGTCATGCCCGCGTC
+GGCATTCCGGGACAGCTTCGGCGAGGATTACGGCGTGACCATCGCCGACGGGCCGATGGCCGGGCTGCTC
+GCCCGCGCAATCGTGGTGATCGGCGCGGACGGCAACGTCGCCTACACGGAATTGGTGCCGGAAATCGCGC
+AAGAACCCAACTACGAAGCGGCGCTGGCCGCGCTGGGCGCCTAGGCTTTCACAAGCCCCGCGCGTTCGGC
+GAGCAGCGCACGATTTCGAGCGCTGCTCCCGAAAAGCGCCTCGGTGGTCTTGGCCCGGCGGTAATACAGG
+TGCAGGTCGTGCTCCCACGTGAAGGCGATGGCACCGTGGATCTGAAGAGCGGAGCCGGCGCATAACACAA
+AGGTTTCCGCGGTCTGCGCCTTCGCCAGCGGCGCGACCGTCTGGAGTTCGTCACCGTTGGCCGCGCTCAT
+CGCGGCGAACATCACCGTCGCCCGGGTGGCGTCGATCTCGATCATCATGTCGGCGCAGGCGTGCTTGACC
+GCCTGGAAGGAACCGATCGGTCGATCGAATTGCGTTCGCCGCCCGGCGTATTGCACCGCCAGGTCGAGGC
+AGGCCTCGGCGCCGCCCAGCATCTCGGCGGCCAACAGCACCCGGGCCACGTCGAGCACCCGCTCCATATC
+GTCGGGCGTCCCGGCGGTCAGCGGCTCGGCGGGGGACCCCGCCAGCCGGAGCGTGGCGACCGGACGGGTG
+ATGTCAAACGAGGGCAACGGTGTGACGGTCACCCCGGGGGCGTCGGCGGCCACGACGTGCAGAACGATCG
+ACCCGTCGGCCACCGCGGGCACCACGAACAGGTCTGCGACGTGACCGTGCAGCACCGGGGTGCACTCGCC
+GGTGAGTGCGGGCCGACCGTCGCGCCGAACGGCCCGAACGGTGGTAGCCGACGCGACGTCGTGGCCACTG
+ACGGCGATCGTTCCGATCCGCGCGCCGGTAAGCAGACCGGCGAGCAGGCGCTTGCGCTGCTCGTCGTCGC
+CCATGCGCAGAATCGCTTCGATCGCAAACACCGTGGCCGCAAAGGGAATTGGGGTGAGCGCCCGGCCGAG
+TTCGGCAAACGCGATCGCGGTCTCGACTAAGGTGGCACCCAATCCGCCGTGCTCCGGCGGGACGTGCAGC
+GCGGGTAATTCGAGCTCGGTGCAAAGCCGTTGCCACAGCCTGCGGTCGGATCCGTCCGCGGCAGCCATCT
+CCCGCACGGGCGCGCCCCGGCCAAGGAAGCCGCGCAGCGAGGCGCGGAAATCGTCTTGTTCGGTGCTGTA
+TCGGAAGTCCACGTCAGCAGAGCACTTCGGGCCGCGGCTCCTTGGGGAGGCCGAGCAGCCGCTCGCCGAT
+CACGTTGCGCTGGATCTGCGAGCTGCCGGCATAGATCGTCGCGGCCCGTGCGTAGAGCAGCTCATCCATC
+CAGCAGGCCGGGGAGTTTGGCGTACCCGCCTCCGGGACCAGCCGCGCACCGCCGTTGCCGGGCCCCCGCG
+GGCCCAGCGCCTCGAGCCCCAGGATTTCGACGGCGAGATCGGTGTACCGGCGGAAATATTCGCTCCAGAT
+GACCTTCGTGATCGCGGCTTCCGCGCCGGGCGGCCGTCCGGTCAGGGCCAGGGTGAGGTCACGGTAGCCC
+CGATACCGCATGATCTGAACCCGGGCATAGCACCACGCCAAGCCGTCTCGTACCCGTGGATCGGTGTGTA
+ATCCGCGGTCACGGGCCAGCTCGCACAGCCGCTGCAGGTCCCGCTCAAAATCGATGGCGGCGGTGGCGAT
+GTGCGATCCGCGTTCGAAGCCGAGCAGCGTCATGGCGGTCGACCAGCCGTCGCCGACCCGGCCGACGACA
+TTGCCGGCGCTGGTGCGGGCATCGGTCAGGAAGACCTCGCTGAACGAGGAGTGCCCGGCCGCGTTGACGA
+TCGGCCGGACCACGACGCCGGGCTGGTCCATGGGCACCAGCAGAAACGACAGGCCCCGGTGTTTCGCAGC
+GCTGGGATCGGTCCGCGCCAGCAGGAAGATCCAGTTTGCGGTGGTGCCGGCCGACGTCCAGATTTTGTGG
+CCGTTGATCACCCATTCGTCACCGTCGAGCACCCCCCTGGTGCGCACCGAGGCCAGGTCGGAGCCGGCCT
+CCGGCTCGGAGAAGCCCTGGCACCACCGATGCTCGCCGCTGAGGATGCGCGGCAGGAAATGCCGCTTCTG
+CGCCTCGGAACCCAGGGCGATCAGGGTGTTGCCCAGCAGGTCGATTCCGAGCAGGTCGTTTTCCGCGCGT
+TCGGGCGCGCCGGCGCGGGCGAATTCCTCGGCGAGCACCACTTGTTCCATCGGGGACAGGCCACCACCCC
+CGTATTCCGTCGGCCAGGACACCGCGACCAGGCCAGCGCCGGCCAGGGCCCGCCGCCAGTGCCGGGCGAA
+CTCTTCCCGCTCGTGGGGCGGCAGCGCCCCGGGTCCGGGCCACCCGGGCGGCAGGTGCTCGGCCACAAAC
+TCCCGGATCCGGTCGCGGAACGCTTCCGCTTCGGGTGGGTAGCTGACGTCCACTGCGCGCCCCGGCCTCA
+GGGCCGCTGCTTGATCGCGGGCCGGATCTGCGGTGCGGCGCGCCAGTCCTCCAGGCCGTACTCGACCGTT
+CCGTAGGACAGCTTGCCGCCGGTGACTTCGCCCCAGTGCGCGTGATTGAGCTGGTGGATCTTGAAGCAAC
+CGTCCAGCGCGGCGGAAAACCCCATGGCATCGACGGTTTGGTTCACCGATTCCTTGATCAGCAGTGCCGC
+CATCGTCGGCACCTTCGCGATCCGACGCGCGAATTCGATTGTGCTGGTCGCGAGTTCGTCAGCGGGAAAC
+ACCTTGCTGACCATCCCCAGCGCGTGGGCCTCGTCGGCGCCTATGCAGTCGCCGGTGAGCAGCAGTTCCT
+TGGTCTTGCGCGGCCCGAACTCCCACGGATGTCCGAAGTACTCGACCCCGCACATGCCCAGCCGGGTGCC
+GACCACATCGGCGAACACGGTGTCCTCGCTGGCGACGATCAGATCGCAGCACCAGGCCAGCATCAACCCC
+GCCGACAGCACGGCCCCGTGCACCTGGGCGATGGTGATCTTGCGCAGGTTGCGCCACCGCTTGGTGTTTT
+CGAAGTAGTAGTGCCACTCCTGGCGGTTGCGTGACTCGACCCCGCCGAAGGTCGCCCCGTTGCACCGGTA
+GCTGGGGTGCTGGTCCGGCCCGGGCGAGCGTTCCCGGATATCGTCAGCGGATCCGAGGTCGTGACCGGCG
+GAGAAGGCGGGGCCGGCGGCCCGCAGGATCACCACCCGGACGGTGTCGTCCGCCTCGGCAAGTTCGAAGG
+CGGCGCCCAGCTCGACCAGCATGCCGCGGGTCTGGGCGTTGCGTTGTTTCGGGCGGTCCAGGGTGATCGC
+GGCGATGCGCCCATCGTCGATGGTTTCGTAGCGGATGTATTCGAACTCCCGGGGCCGTCGGGAGCGTTCC
+CCGTCCGACCGGCGATCGACCGGACCGACCCTGCCGACGAACATGTCCGCTCCTTACTGGACGTGAACGG
+CTGACCTGTGCGAGGTTACCCGTCCCTTAGCCAACATGTCCATAGCCAATACGCACATGAGAGTGATCGA
+TATAGACAAATTCCCATGCAAAGAAGCACTTGTGTACAACGAAGTATCTTGGTAGTACTGTGATATACGC
+AAAGGGCGCCACCGCAGCGCGCCGGGCATCCGACCGGTACAACCAGGAAGGGTTGACGATGGAGATCGGA
+ATATTCCTCATGCCGGCCCATCCACCGGAGCGCACCCTCTACGACGCCACCCGGTGGGATCTGGACGTCA
+TCGAGCTGGCCGATCAACTCGGCTACGTGGAGGCCTGGGTCGGCGAACACTTCACCGTGCCGTGGGAGCC
+GATCTGCGCCCCCGATCTGCTGTTGGCGCAGGCGCTGCTGCGCACCCAACAGATCAAGCTCGCCCCGGGT
+GCGCACTTGTTGCCCTACCATCATCCGGTCGAGTTGGCCCACCGGGTGGCCTATTTCGACCACCTCGCCC
+AGGGTCGGTTCATGCTCGGCGTGGGCGCCAGCGGCATCCCGGGTGACTGGGCGCTGTATGACGTGGACGG
+CAAGAACGGCGAGCATCGCGAAATGACCCGGGAAGCGCTGGAGATCATGCTGCGCATCTGGACCGAGGAC
+GAGCCCTGGGAGCATCGCGGAAAGTACTGGAACGCCAACGGAATCGCGCCGATGTTCGAGGGTCTGATGA
+GGCGCCACATCAAGCCGTACCAGAAGCCCCACCCGCCCATCGGCGTCACCGGGTTCAGCGCCGGCTCGGA
+GACCCTCAAGCTCGCCGGCGAACGGGGTTACATCCCCATGAGTCTGGACCTCAACACCGAATACGTCGCC
+ACCCACTGGGACGCGGTGGAGGAAGGCGCGCTGCGCAGCGGGCGAACCCCGGATCGCCGCGATTGGCGGC
+TGGTGCGGGAGGTGCTGGTGGCCGAGACCGATGAGCAGGCGTTCCGGTATGCCGTGGACGGCACGATGGG
+ACGCGCCATGCGTGAGTATGTGCTGCCGACGTTTCGGATGTTCGGCATGACCAAGTTCTACAAACACAAT
+CCGTCGGTGCCCGACGACGAGGTGACACCGGAGTATCTCGCCGAGAACACCTTCGTGGTCGGCTCGGTGC
+AGACCGTGGTCGACAAGCTCGAGGCCACCTACGACCAGGTCGGCGGGTTCGGCCACCTGCTGATCCTCGG
+GTTCGACTACAGCGATAACCCGGGCCCGTGGAAGGAGTCGTTGCGGCTGCTGGCCCACGAGGTCATGCCC
+AGACTCAACGCCCGCCTCGCCACCAAGCCCGCCACCGCGGTGGTGTAGCCATGGCGGTTCGTCAGGTCAC
+CGTCGGCTATTCGGACGGCACGCACAAGACGATGCCGGTGCGGTGCGACCAGACGGTCCTGGATGCCGCC
+GAGGAACACGGCGTGGCCATCGTCAACGAATGCCAAAGCGGGATATGTGGCACCTGTGTGGCCACCTGCA
+CCGCCGGCCGCTACCAGATGGGACGCACCGAGGGACTGTCCGATGTCGAGCGGGCGGCGCGAAAGATCCT
+CACCTGCCAGACGTTTGTTACCTCCGATTGCCGGATCGAGCTGCAGTATCCGGTCGACGACAACGCCGCC
+CTGCTGGTCACCGGTGACGGTGTGGTGACCGCGGTCGAGTTGGTGTCGCCCAGCACCGCCATCCTGCGGG
+TGGACACCTCTGGCATGGCCGGCGCGCTGAGATACCGGGCCGGCCAGTTCGCCCAATTGCAGGTTCCCGG
+TACCAACGTATGGCGCAACTACTCCTACGCCCATCCGGCCGACGGCCGCGGTGAGTGCGAGTTCATCATC
+AGGTTGCTGCCGGACGGCGTGATGTCGAATTATCTTCGCGACCGCGCCCAGCCCGGTGACCATATCGCGC
+TGCGCTGCAGCAAGGGCAGCTTTTATCTGCGCCCGATCGTGCGACCGGTGATCCTGGTCGCCGGAGGAAC
+CGGCCTGTCAGCGATCCTGGCGATGGCCCAGAGCCTGGATGCCGATGTCGCTCACCCGGTCTACCTGCTC
+TACGGGGTCGAGCGCACCGAAGACCTGTGCAAGCTCGACGAACTCACCGAGCTGCGCCGCCGCGTTGGCC
+GCCTGGAGGTGCACGTCGTCGTCGCTCGCCCGGACCCCGACTGGGATGGGCGCACCGGGCTGGTCACCGA
+CCTGCTCGACGAGCGGATGCTGGCGAGCGGTGACGCCGACGTGTATCTGTGCGGTCCGGTCGCCATGGTC
+GACGCAGCCCGAACCTGGCTGGACCACAATGGCTTTCACCGTGTCGGGTTGTACTACGAGAAGTTCGTGG
+CCAGCGGGGCGGCGCGCCGCCGCACCCCGGCTCGGCTGGATTACGCGGGCGTGGACATTGCCGAGGTGTG
+CCGCCGCGGCCGCGGCACCGCGGTGGTCATCGGCGGCAGCATCGCGGGCATCGCGGCGGCGAAAATGCTC
+AGCGAGACCTTCGATCGCGTCATCGTGCTGGAGAAGGACGGCCCGCACCGTCGCCGCGAGGGCAGGCCGG
+GCGCGGCACAGGGTTGGCACCTGCACCACCTGCTGACCGCCGGGCAGATCGAGCTGGAGCGCATCTTCCC
+TGGCATCGTCGACGACATGGTGCGCGAGGGAGCGTTCAAGGTCGACATGGCCGCGCAGTACCGTATCCGG
+CTGGGCGGCACCTGGAAGAAGCCCGGCACTAGTGACATCGAGATCGTCTGCGCGGGAAGGCCGCTGCTCG
+AATGGTGTGTGCGCCGCCGGCTCGACGACGAACCGCGCATCGACTTCCGCTACGAATCGGAGGTGGCCGA
+TCTCGCCTTCGACCGCGCCAACAATGCCATCGTCGGCGTCGCCGTGGACAATGGCGACGCCGACGGAGGC
+GACGGTTTGCAGGTGGTGCCCGCCGAGTTCGTCGTGGACGCGTCGGGCAAGAACACCCGCGTGCCGGAGT
+TCTTGGAGCGTCTCGGTGTTGGCGCTCCCGAGGCCGAGCAGGACATCATCAACTGCTTCTACTCCACGAT
+GCAGCACCGGGTTCCGCCGGAGCGGCGGTGGCAGGACAAGGTGATGGTGATCTGCTATGCGTACCGCCCT
+TTCGAGGATACCTACGCCGCGCAGTACTACACCGACAGCTCCCGCACCATCCTGTCCACCTCACTGGTGG
+CCTACAACTGCTATTCGCCGCCGCGTACCGCCCGAGAATTCCGCGCGTTCGCCGACCTGATGCCGTCCCC
+GGTCATCGGGGAGAACATCGACGGGCTGGAGCCGGCATCGCCCATCTACAATTTCCGCTATCCCAACATG
+CTGCGGCTGCGCTACGAGAAGAAGCGCAACCTGCCGCGGGCTTTGCTGGCGGTGGGCGATGCCTACACCA
+GCGCCGACCCGGTGTCGGGTCTGGGTATGAGCCTGGCGCTCAAGGAAGTTCGGGAGATGCAGGCGCTGCT
+GGCTAAATACGGCGCCGGTCACCGGGATCTGCCGCGCCGGTACTACCGGGCGATCGCCAAGATGGCCGAC
+ACGGCCTGGTTCGTGATCCGCGAGCAGAACCTGCGCTTCGACTGGATGAAGGACGTCGACAAGAAGCGCC
+CGTTCTATTTCGGTGTGCTGACCTGGTACATGGACCGCGTGCTGGAGCTGGTGCATGACGATCTCGACGC
+GTACCGGGAATTCTTGGCCGTCGTCCATCTGGTCAAGCCGCCGTCGGCGCTGATGCGACCCAGGATCGCC
+AGCCGCGTCCTCGGCAAATGGGCACGAACCCGATTGTCGGGCCAGAAGACGTTGATTGCCCGCAACTACG
+AAAATCATCCGATACCAGCCGAACCCGCGGACCAACTTGTAAACGCTTAGGAGAGCCCAACGTGTCGCAG
+GTCCATCGAATCCTGAACTGCCGGGGCACCCGCATCCATGCCGTGGCGGACAGCCCACCCGACCAACAGG
+GACCGTTGGTGGTGTTGCTGCACGGGTTTCCGGAGTCCTGGTACTCGTGGCGGCATCAGATTCCCGCGCT
+TGCCGGCGCGGGCTACCGCGTGGTGGCCATCGACCAGCGCGGGTATGGCCGCTCGTCGAAATACCGGGTG
+CAAAAGGCCTACCGCATCAAGGAATTGGTTGGCGACGTCGTGGGCGTCCTCGACTCCTATGGTGCGGAGC
+AGGCTTTCGTGGTGGGCCACGACTGGGGTGCGCCGGTCGCCTGGACCTTCGCCTGGCTGCACCCCGACCG
+ATGCGCCGGCGTGGTGGGAATCAGCGTTCCGTTTGCCGGTCGCGGCGTGATCGGCCTGCCGGGCAGCCCG
+TTCGGCGAGCGCCGTCCCAGCGACTACCACCTGGAGCTGGCCGGGCCCGGAAGGGTCTGGTATCAGGACT
+ATTTCGCCGTGCAGGACGGCATCATCACCGAGATCGAGGAAGACTTGCGGGGCTGGCTGCTCGGGTTGAC
+CTACACCGTTTCCGGTGAGGGGATGATGGCGGCGACCAAGGCGGCCGTCGACGCGGGCGTCGACCTGGAG
+TCCATGGACCCGATCGACGTGATCCGTGCCGGACCGCTGTGTATGGCCGAAGGCGCGCGGCTCAAGGACG
+CGTTCGTCTACCCGGAGACCATGCCGGCCTGGTTCACCGAGGCCGATCTCGATTTCTACACTGGCGAATT
+CGAACGTTCCGGGTTCGGCGGGCCGCTGAGCTTCTACCACAACATCGACAACGACTGGCACGACCTGGCC
+GACCAGCAAGGCAAGCCGCTCACCCCGCCGGCTCTGTTCATCGGCGGCCAGTATGACGTCGGCACCATCT
+GGGGCGCGCAGGCCATCGAGCGTGCGCACGAAGTCATGCCGAACTACCGCGGCACCCACATGATCGCCGA
+CGTCGGACACTGGATCCAGCAGGAAGCGCCCGAAGAGACCAACCGGCTGTTGCTCGACTTCCTAGGCGGG
+CTGCGGCCGTGAGCTGCACCTTCGACATGGTCCCGGAGACCGTCGATCATCTCGACGAGGTCGGGCTGCG
+GCGGGTCTTCGGCTGCTTTCCGTGCGGCGTGATCGCCGTCTGCGCGATGGTCGACGACCAGCCGGTCGGC
+ATGGCGGCCAGCTCGTTCACGTCGGTTTCAGTTGACCCGCCGCTGGTATCGATCTGTGTGCAGAACTGTT
+CGACGACGTGGCCGAAGTTGCGCGACCGCCCACGGCTCGGTGTGAGCGTGCTCGCCGAGGGGCACGACGC
+GGCCTGTATGAGCCTGTCGCGCAAGGAAGGTAACCGGTTCGCCGGGGTGTTCTGGAGCGAATTGTCCAGC
+GGGGGTGTGGTGATCGCCGGGGCCGGCGCCTGGCTGGATTGCCGCCCGTACGCGGAGATCCCGGCGGGGG
+ATCACCTGATCGCCCTGCTGGAGATCTGCGCGGTGCGCGCCGATCCCGAGACACCGCCGCTGGTGTTTCA
+CGGTAGCCGGTTCCGCCGGTGGAGTCTCGATGAAGACGACCGATGTGCGGGTACGTCGTGCGATCACGGC
+GATGGCGGGCGGTCACGCCGTGGTCCTGACCGGCGACCCCAATGGCGATGGCTATCTCGTCTTCGCCGCC
+CAGGCCGCGACGCCGCGGCTGGTTGCCTTTGCGGTCCGGCACACCTCGGGTTATTTGCGCGTCGCGCTGC
+CGGGCGCCGAATGCGAGCGACTGCACCTGCCGCCCATGTGTGACCGAGACACCACGCATTGCGTGTCGGT
+CGACGTTCGCGGCACCGGCACCGGAATCTCGGCGAGCGATCGCGCCTGGACCATCGCGGCACTGGCTTCG
+GCCACCTCCGTCGCCGCCGATTTCCAACGTCCGGGCCATGTGGTGCCCGTGCAGGCGCAAGCCGACGGTG
+TGCTGGGTCGGCGGGGACCCGCCGAGGCGGCCGTCGACCTGGCCCGCCTGGCGGAACGGCGGCCGGCCGC
+CGCGCTCTGCGAGATCGTCTCGCCCGATAATCCCGTCCAGATGGCGCACCACGCCGAGTCGGTCGAATTC
+GCCGTCGAACACGGACTGGCCATGGTCTCGATCGGGGAGCTGGTGGCGTATCGCCGGCGGATCGAGCCCC
+AGGTGGTCCGGTTTACGGCAGCGACGCTGCCCACCTGGGCCGGCGCCTCGCGTGTCATCGGCTTTCGTGA
+CGTTTACGACCTCGGCGAGCATTTGGCGGTCATCGTGGGTGCGGTCGGTGCCGGGGTGCCCGTGCCGCTG
+CACGTCCACATCGAGTGCCTGACGGGCGACGTGTTCGGCTCGACGGCGTGCCGCTGCGGCGAGGAACTCA
+ACGGCGCGCTGGCGAGGATGTCGGCTCAGGGCAGCGGCGTGGTCTTGTATCTGCGTCCGCCCGGACCCGC
+GCAAGCGTGCGGCTTGTTCGCCCGGGGCGATGCGGCGACCGATGTCATGCCGGAGACCGTGACATGGATC
+CTGCGCGATCTTGGGGTGTATGCGATCCGACTTTCCGATGATGTGCCAGGATTTGGGCTTGTCATGTTCG
+GGGCGATCCGAGAAGCCAGCACGTTGGCGGCCGCAGGTTGAACCATCCAGACCTGGCCGGCAAGGTCGCG
+ATCGTTACTGGGGCGGGCGCCGGAATCGGTCTGGCGGTTGCCCGGCGACTCGCCGACGAGGGCTGCCATG
+TGCTGTGCGCGGACATCGATGGTGATGCCGCGGATGCCGCGGCCACCAAAATCGGTTGTGGCGCAGCGGC
+CTGCCGGGTTGACGTCAGCGACGAACAACAGATCATCGCCATGGTCGACGCCTGTGTTGCCGCGTTCGGC
+GGGGTGGACAAGTTGGTCGCCAACGCCGGTGTCGTTCATCTGGCTTCGCTCATCGACACCACCGTCGAGG
+ACTTCGATCGGGTCATCGCGATCAATCTCCGCGGCGCCTGGCTGTGCACCAAGCATGCGGCACCGCGGAT
+GATCGAGCGCGGCGGGGGAGCCATTGTCAACCTGTCGTCGTTAGCGGGCCAGGTAGCGGTGGGCGGCACC
+GGCGCATACGGCATGTCGAAGGCCGGCATCATCCAGCTCAGCCGCATCACCGCCGCCGAACTGCGCTCGT
+CGGGCATCCGCTCCAACACGCTGCTGCCCGCATTCGTCGACACCCCGATGCAGCAGACCGCCATGGCAAT
+GTTCGACGGGGCCCTGGGCGCGGGGGGTGCGCGCTCGATGATTGCCCGGCTGCAGGGCCGCATGGCCGCA
+CCGGAGGAGATGGCCGGCATCGTGGTGTTCCTGCTGTCCGACGATGCGTCGATGATCACCGGCACCACCC
+AGATCGCCGACGGCGGGACGATTGCCGCGCTGTGGTGATCCCCTCGGGTCAGGCGGTTTCGAAAGATCAC
+GCGAGACATTGCCTGCGACGGCATGCTACATATGTGATTCCGGTGTATTCGGGCCTCTGCGCATTGCTTT
+CGATCACAATGAGCTTGGCCGCGAGCCGTCTTGTTCGTTGAGCCACGGGGCCGTTCGAATGCGTTCGTCA
+GAACTCCGGCTCGGATTCTCGCTAGTTTGCTGACGTGTCATCGAGAGCAATCGACGGCGACCTCGAGGGC
+CGTGCAGATGGCGCGCATCCGGATGTCGGCGAGGCGGCCAAGCCGATTCACCAATACCGCGACCGAGACA
+CTTTCGACTGAGTCCAAATTCACCGCGGAACGGCGCGGGATCGGGTCGGAACCGGGTTCAAGAACAACCT
+CACTGGCTAGCCCTCGGATGGTCGTGGTGCAGGGCGCGACAAGTGCGCGTCGCAGCCGAGGGATCGCGGC
+ATCGCGCGACAGCACGACGACTGGTCGCCGACCGATCTCAGCCATCTCACACCACCACACCTCTCCGCGC
+GCCGGAAGTGCGGTCACGAGTCTCCAGCCGCCCGCCGCCACGACGCTAGATCGCCCCACTCGTCGGGCTC
+ATCGACCGGGTGCTTGTCGTAGGCCGCATAGCTGGCATCCACCTCGGCCGATCGATGACGAGCCAGTAAT
+GCCGCAAGGGCCTCATCGATGAGGGCTGCGTCAGTGATTCCTGCCCGCATGTCGCGCGCACTTGTCAAGA
+GTGCGGCGTCGACAGTAGTGCTCAGCCGTATGCGATTCATGCCACTACTATGCCACACTCCGGGGCGTGG
+ATCCGCCTGATCGGACGCAACGTGCTCGATACGGGCGAAACATTGGTCGCTGGACGAATTGATGAGGTCT
+ACCGCGCAGCGCAACGTCACCTGCAACCGGGCCGTCTTCACGGTGCGGGTTCCGTGTCGATGAACGACGC
+TGCGGCACAACACTTTTTGTACTTGTGCCCCGAGCCGCACCAGCACTGTTGGTTGCGGCCCGGTGGCCAG
+GCCATCACATCGTGGTCACCGTGTGCTGTCAGGTACGCGGCATACTCGGCGCGGGCCTCCGGCGAGTCCG
+GCTCCTGACCCTGTTCGGCGCACCAGGCAGCGAAGGGTGCCACGCGGATCGCGGCGACCGCCAGTCCTGG
+GAAACCAGCCTCGGCGAATTCGACCAGCTTTTGCTGCATCCTCCGGCAGTACAGCGGGTGCGCCACCGGC
+CCGTCCGGACCGGTCACCAGGTCGCTGCCGGCGAAGTCTGGCCACAGGTCGAGCGCCCGCTCGTAGTCAC
+CGGCAGGCAGCCACGCCAATGACACCGCGGTGATCGGTTCGGCGGATTCCGCCGCGGGTGTCTCATCGAC
+GGGAGGCACCCGGCTGGCTCCGTTGTCACTCATGGTCCAACATCCTGCCGCATCACCACCGCACGCGGCA
+TATGATGCTCGCAGTCGCGGTGGTGCGGCCTTATCGCCATGAGCGAAATCTTCTGTATCACTGATCATTC
+CGAGCCTATGACGGCCCGGTTCTTGTCAGTGGTGCTTCGTAGAATCCGAGGCATGAGGTCGGACACGCGC
+GAGGAGATCTCCGCGGCGTTGGATGCCTACCACGCCTCGTTGTCGCGGGTGCTCGATCTCAAGTGCGATG
+CGTTGACCACCCCGGAATTGCTGGCCTGTTTGCAGCGACTCGAGGTCGAACGGCGCCGCCAGGGCGCCGC
+CGAGCACGCCTTGATCAACCAACTCGCTGGGCAAGCCTGCGAGGAAGAGCTCGGCGGGACGCTGCGCACG
+GCGTTGGCCAACCGGCTACACATCACTCCCGGTGAGGCCAGCCGCCGCATCGCCGAAGCCGAAGACCTCG
+GTGAGCGCCGCGCCCTGACCGGTGAACCGCTGCCAGCGCAGTTGACCGCGACCGCGGCCGCTCAACGTGA
+GGGCAAGATCGGCCGAGAACACATTAAGGAGATCCAGGCCTTCTTCAAGGAGTTGTCCGCCGCGGTGGAT
+CTGGGTATCCGCGAGGCCGCCGAGGCCCAGCTGGCCGAACTGGCCACCAGTCGGCGTCCCGATCACCTGC
+ATGGCCTGGCCACGCAGCTGATGGACTGGCTGCACCCCGACGGCAACTTTTCCGACCAGGAGCGTGCCCG
+CAAGCGCGGCATCACGATGGGTAAGCAGGAATTTGACGGGATGTCACGTATCAGCGGTCTGCTGACCCCG
+GAGTTGCGGGCCACCATCGAGGCGGTGTTGGCCAAACTGGCCGCACCGGGGGCGTGCAACCCCGATGACC
+AGACCCCGCTCGTGGATGACACACCGGATGCGGACGCGGTGCGCCGCGACACCCGCAGCCAAGCCCAACG
+ACACCATGACGGTTTACTGGCCGGGCTGCGCGGGTTGTTGGCCTCCGGTGAGCTAGGGCAGCATCGGGGG
+TTGCCGGTGACCGTCGTGGTGAGCACCACGCTTAAAGAGCTGGAAGCCGCCACCGGCAAGGGGGTAACCG
+GTGGTGGTTCGCGGGTGCCGATGTCGGACCTTATCCGGATGGCGAGCAACGCGCACCACTATCTGGCATT
+GTTTGACGGCGCTAAGCCGTTGGCGTTGTATCACACCAAGCGGTTAGCTTCCCCGGCGCAGCGAATCATG
+TTGTACGCCAAGGATCGTGGCTGCTCCAGGCCGGGTTGCGACGCCCCGGCCTACCACAGTGAGGTCCACC
+ACGTAACGCCGTGGACAACCACCCACCGTACCGACATCAACGACCTCACACTGGCCTGCGGCCCCGACAA
+TCGCCTTGTCGAAAAAGGCTGGAAAACCCGCAAGAACGCCAAAGGCGACACTGAATGGCTACCGCCGGCC
+CACTTGGACCATGGCCAACCACGCATCAATCGATACCACCACCCCGAGAAAATCCTGTGCGAACCCGACG
+ACGACGAACCACATTGACACCCAATGACCGTGGCATTGCCGGTCACGTCGCAACCAAGTACTGCGACCGT
+AGCCGCGCTCAAGGCTCGGGGTAGACGAGCGCGGAGAGAGGCACGTTGCCGAGCTGCCTGCCGACGACGA
+GTATCCCAATATCGTGCTCACCCATAGCGTTTCAGCGGGCAACCAACGATTGCCGGCCAGCGAATCTCGG
+TGGCGGTAGCCAGCATGAAGGACGCAGATGACCTCGCCGACTACGGGCTGAGCATAGAGCAGGTGCGTGC
+AGCCGTCGACTCGCATGTGGACGTGGACCATTCTGTCTCAGCGCTGTGACCGTACGGTAGAGTTCGCCAT
+CGTGGCTGACGATGACGTCACCGGTCAGGATGGCTCCGGCGACGGCACCGATCCGCGCACCATGCTGGGC
+CGGTTTGCCAACCAGCACAACGAATGGGTGCGCCTGAGCGTGCGCCACGTGCTCGATGCGGGCGAAGCAT
+TGGATGCCGGACAGATTGATTAGGTCTACCGCCACTTTCGGCAGGAAAAGGCACTGGACACACGCCACCG
+AGCCGGCCGTACCACCGTTGACACTCGGCATCAGCAACCCGGAAACAGCCGAACCCCTGATCATCTGGCC
+GACCTCGCCCCTGGCCGCACCGCGACCATCGGGCTGCGGGATTCCAGCTGCCTGCGCGTGGACCGCTACA
+ACGACCAGGCGTCCGGGCGAGCGCTCATCGAGATCCGGTTGTGCAACGAACGTGCCACGCCGATGCCAAT
+CCCGATCGGGCTGTGGATGTTTCAGACCAAGCTCCACGTCAACGCCGGCGGCGCTGACGTGTTCCTGCCG
+GTCTGCGACGTGCTGGAGCAAGACCTCGCCGAGCGCGACGAGGAGGTACGCCAGCTGAACCTGCAGTACC
+GCAACCGGTTGGAGTATGCGATCGGGCGGACTTGCTCGGCGGCCTGGTCGGTGAACGGCTCGCGGCGCCC
+GTCGGCAGTGTGGACCACCTGGCTGCCGGTCGCCGAAACACCCCACACCCGGGCCCGGTCGGTGGAGAAC
+GCGCTGTTGTCCATGGACAGTCGCGGAGGGGTTACGTAGCGGACTGGCGTCGTTCGTCGCGGGATATGGA
+AGCTGGTTTCAGGGTCAGGCGGCTGTCGCGGCCGAGCTGCCCGAGCACCTGCACCCGACCGCCGACGAGA
+GGCTGGCTCATGTTGCGGCCGAAAAGGAAGCGCTGCGCTGCTTCCAGTTCATGAACCAGGTGATGCGCGA
+TCACCGTAAAAGCTTGTCAGAGGTGCAGTGAACACTGTTTCCATGACCAAGAGCAACGGGCACTGTTGAG
+ACACAGCGCGTCGCCAACGGGCGCTGCCTGTGGCCGAACATCGTAAATCAAGCATATTCGTCAACAGATA
+TCATCAATGTCGGCGCCGGACTATTCAAATCATCGATATACTGGTGGCCTGGTCCTTCGCCATCGATCAA
+TGGCGATAGCTTATCGAGGATTTCTACCAACTTCGTGTCATCGAAGCGCCATACAACGGTTTGCGATCCC
+AGTTCCATATCCGCAGTTCCGCTTTCTCGAACTATCCGTTGCTGTACACCATCTATGTCGAAAGTTGCCT
+GACCACTCTCATGGGCCGATCGCACGGCGTACTGGAAAATGCGAAGCCCATCCCGGTCTGCGGCCGCCAG
+AACCACGTCACCGAAGTAGTTATCCGGCTTGATACGGAAAACGGTCATTCTGGTCCAATCACTTGTGAGT
+CGGAAGGTCCCCGATGGGAATATTCTGCCACCTGGCGGTCGGCGAATCGTGGGGGTTGTAATCCCAATGC
+GGATAGCGGTAATTGTCTCCCGGAAAATATCGCCACTCGCCGCCGTTCTCGTCCCAGAGGCTTTCGCCGC
+CGCGAGCCTGTTGGATAGGACGACTGGGCGGTCCAACCGTTAGGTTGCTCTCGGCGGGCGGGCTGACACC
+GGGCGGAGGTAAGCCTTCGTTCGGTTGTGGTCCAGCGGGGTCGGGAGCAGGAGGGGGTTCGCCTTCGACC
+GGCACGCCCAATTCGCCTAACCGGGCTCTGATTGCGGCTTGTCTTTCAAGGAGAGAACCCTTGTCCGCGA
+TGCACGCGTCGTAGGCTGCCTGCTCGTTGGGCAGAACGAAGGTGCGTCCGCATCGGGCGTTGTACCGAGC
+GATGTCAGCGTTGACGGCGTCCCAGGCTGCGCGTGCCTGTACGGCTGTCATGTCTTTCGGGTCGCCCGGC
+ATCGGTGAGGGTGGATCTTGTTTCCAGCTGCGGTCGACCGCGTGGATTTGCGGTTTCTCGTTGTGGGGCA
+CCGGTGTCGGTAGCGACGGTGCGATTGGGGGTTCGTGGAAGCCGACGGTGTTAAGGGGTGCGGTAGCGGT
+GGCTATTTTGGCGGCCACTTCGTGTTCGACTCCGATGAGTTGTGTCGCGCGTTGGCGGATATCCCCGGCC
+AATGCTTGTGCTTGGGCCTGGCGAGCTGCTTGTTCGGCGAAGGTGCGGCTGGTTCGGGTGTCGGTGACCG
+AGAGGTCCTCTTCGACGTTGAAGCCCGCGTTGTGGGCATCTTGAACGGCATAGATGACCCTGCGCTGGGC
+TGCGCCGATGGTTCCGGCGCCTTCACGGGCAAGCCCACTCGCTTGGCGCAAATGCTCGGCTATGCCACTG
+ACTATCTGTAGGTCAGCGCCGGTTCGCTGTCGCAGCCATCACCGCCTGCGCCTTCCCACGCGATGAAGTG
+GGATCGGTTACGCATCTCTAGGAACACGTCTTCCCACTGATCGGCGACCTTCGTCCAGTAGTAGGCCGCC
+TCGATGAGATGTTCGGTGTCCCAGGCGTGGATATGCGACAGGGTCGGCAGCAATTACACCAGCCTCGTTT
+GCGGCACGGCCGCCATCTCGGCCGCTGCGGCCGCCTCGTTGTTGGCATACTCCGCCGCGGCCGCCTCGAC
+CGCACTGGCCGTGGCGTGTGTCCGGGCGGTAAACGCCGCCACGGCAAGACCAACCGCTGCGTGGGCACCG
+CCCACAGCCGCCGTGGTGGGTTGGAACGGCTGCCCCAGCGGAGGTGGTGCAAGGACGCTGAGTTCAGTGC
+TTCGCCCGCTCCATTGGCTGGCCGTAGCCGCTACCTGTTGGATATTGACCCGCAGCTCACCGGCTTTCAT
+CCTCGGAAAGTTTAATAGCGAGCTACAGGGTGGCAACTCATCGCAGGTCGAGCCAACTACTGCCGGGCCG
+GGTGACCGCAGCTCGTGCTGAGGCAGCACCGAGGCTGGCTGACTCAAGCAGTCTCGGCGTATGCCAGCCT
+GATCGCGAACACGGGAGTCAACCGGGGCAACCGCCGTCCGCCGGACAACCTCGATCCGATATCAATTAAG
+CGATATCGTCATCTCCGATGGAGCAGATCGTGATCCGCAACCTTCCCGAGGGGACCAAGGCGGCACTACG
+GGTCCGTGCTGCACGTCATCACCACTCCGTCGAAGCGGAAGCCCGCGCGATCCTCACCGCGGGATTGTTG
+GGCGAAGAAGTCCCCATGCCGGTACTGCTGGCCGCCGACAGTGGCCATGACATCGACTTCGAGCCCGAAC
+GTCTCGGCCTGATCGCCCGCACCCCGCAACTGTGACCTACGTCCTGGACACCAACGTGGTGTCCGCTTTG
+CGCGTGCCGGGACGCCACCCCGCCGTGGCGGCGTGGGCGGACTCGGTGCAAGTCGCCGAACAGTTCGTTG
+TGGCGATAACGCTGGCCGAGATTGAGCGAGGCGTGATCGCCAAGGAACGCACCGACCCGACCCAGAGTGA
+GCACCTACGGCGCTGGTTCGACGACAAGGTGCTGCGCATATTCGTGTTCGCCCGCCGGGGCACAAACCTC
+ATCATGCAGCCCCTAGCTGGGCATATAGGTTACAGCCTATATTCTGGTATAAGCTGGTTTTAGACGAAAA
+GGACCCCACCTCGGGGTCTGATGGCCAGGGGCAGGGTCGCGTGCATTGGGGATGCAGGTTGCGACTGTAC
+ACCCGGCGTGTTCCGCGCGACAGCGGGTGGGATGCCGGTGCTGGTGGTCATCGAGTCTGGGACAGGAGGT
+GATCAGATGGCTCGTAAAGCTACGTCCCCGGGTAAGCCGGCTCCGACGTCGGGACAGTATCGCCCGGTTG
+GCGGTGGCAACGAGGTGACCGTTCCGAAGGGACACCGTCTGCCTCCCTCGCCCAAGCCCGGTCAGAAGTG
+GGTGAACGTCGATCCGACGAAGAACAAGAGCGGCCGCGGCTGAGCTTGTGCCGTCGGGATGGGTGTCGCA
+CCGTCTCGGCGGGTCGCCCAAGTGCATAAGTGCTTTGTCGCTGCCCTCCGGTACCGTCGGAGCCCCGTCC
+AAGCCGGACAACGACGCCACTCGAGGCAGGACAAGACCAACTGTGCCGCCCCCTGATCCAGCCGCCATGG
+GTACCTGGAAGTTCTTCCGGGCATCTGTGGATGGCCGGCCGGTATTCAAGAAGGAGTTCGACAAGCTTCC
+TGATCAGGCCCGGGCCGCGCTGATCGTGCTAATGCAGCGGTATCTCGTCGGCGACCTCGCCGCAGGGAGC
+ATCAAACCGATTCGTGGCGACATTCTGGAGTTGCGATGGCATGAGGCGAACAACCACTTCCGGGTACTGT
+TCTTCCGCTGGGGCCAGCATCCCGTAGCGCTGACAGCGTTCTACAAGAACCAGCAGAAGACTCCCAAGAC
+GAAGATCGAGACGGCCCTGGACCGGCAGAAAATCTGGAAAAGAGCCTTCGGCGACACCCCACCGATCTGA
+ACAACGCCCAACCACTGTTACGAGGCTAGGAGAGCACAACCATGAGCATTGACTTCCCTTTGGGTGACGA
+CCTCGCCGGCTATATTGCCGAGGCGATTGCGGCTGATCCCAGCTTCAAAGGCACTCTCGAAGACGCCGAG
+GAGGCACGCAGGCTGGTCGATGCGCTGATTGCGCTGCGCAAGCACTGCCAGCTGAGCCAGGTTGAGGTTG
+CTAAGCGTATGGGGGTGCGCCAGCCCACCGTGAGCGGTTTCGAGAAGGAACCCAGCGACCCCAAACTGTC
+TACGCTGCAACGTTATGCCCGTGCATTGGACGCCCGGCTGCGGCTGGTGCTCGAAGTTCCCACGCTTCGC
+GAAGTGCCTACGTGGCATCGGCTCTCCTCTTATCGGGGCTCCGCACGGGACCACCAGGTCCGGGTGGGTG
+CAGACAAGGAAATCCTGATGCAGACGAACTGGGCCCGCCACATTTCGGTTCGGCAGGTTGAGGTGGCATG
+ACTGACCGAACCGACGCCGACGACCTTGACCTGCAACGCGTTGGCGCGCGGCTGGCAGCCCGCGCACAGA
+TCCGCGATATCCGGCTGCTGCGCACTCAGGCCGCTGTCCATCGTGCGCCCAAGCCTGCGCAGGGCCTGAC
+CTACGACCTCGAGTTCGAACCCGCTGTGGATGCCGATCCGGCCACTATCTCAGCATTTGTGGTGCGGATT
+TCTTGCCACCTGCGCATTCAAAACCAGGCGGCAGACGACGACGTCAAGGAAGGCGATACCAAAGACGAGA
+CACAGGACGTAGCCACCGCTGATTTCGAGTTCGCGGCACTGTTCGACTACCACTTGCAAGAAGGTGAAGA
+CGACCCCACCGAAGAAGAACTTACGGCATACGCCGCCACGACCGGGCGGTTCGCGCTTTATCCGTACATC
+CGCGAATACGTCTACGACCTCACCGGCCGTCTCGCACTGCCACCGTTGACCCTTGAGATATTGTCTCGGC
+CGATGCCGGTTTCTCCCGGCGCCCAATGGCCGGCAACGAGAGGAACGCCCTGACCAAACGAGGGTGAATC
+AAGCTGCCCGACGACCATGGTTTCCACACCTACCGCCAGATGCAGCGCTGGACTGTCAGCCCAGCGGCAC
+GGGTCGAGATCCTGGGCCGCTACTGGTGGAGAATCCGCCGCCGTGCCACCGAAGGGGCGAAGGCGAAATC
+CAAAGGCAAGGCCCGCCGCGGCTCTCAGTTCAAGGTTCTCGAACACGGGTGATGCGGTTCGAGCCCGGGA
+AGGTGGAGCGTTAGCCGCAGGGGAGGGAATCTTGGCGGGTCGGCCGACAAGAGGTTGAACTTGACTGCGG
+GACAGCAGTTTACGGCTCTTGTCGCCACGCCTACAGCGGATTCGCATACCGCCGGGGTTCATTGACAACC
+GGCGGGGGTTCGTTCCGCCGTGTTTCCGAGGTAGGTATCGGCGGGGGTGTATGTCGGTAGGCCTCGGGAA
+TGTCCGACAGGCGCGATGGGAGATCTTCGCGTTGATCACCGCGCCAATGGATGGTGTCGGGATCATCCCC
+CGGCTGACGGGAAATGCGGCCGGCCATTCTTCCTCAAGATCGAGTCAGAGGTTCCGGTCGACGTCCATCC
+GTTGGTGCAGGACTCGCACGACGTCGATGGTGCCTTCGCCAGTCACCCGATAGAACAACGTGTGTGACCC
+GGCCGAGAGCTTGCGATAGCCGGGGCGAATCTCGTCGCACGCTCGTCCGATCCGCGGGTTTGCCGCAGCA
+CGGTCGATAGCGTGTTGAAGTTCGCGCAGGTACTGCTCGGCCTGATCGACACCCCAACGGTCATAGGTGC
+AGTCCCAGATCTCTTCCAGATGTGCCTGCGCGGCAGGCGAGAGAAGGTATCGGCTACTCACCGGCCACGC
+GAGGCGTCAGCCCGCTTACGACCGAGGAATCCGTCGAAGTCGAACGGTGTCGAGCTGCCGCTGCGTTCGC
+CGGCCTCGAGAGCCTCACGAAGCGCGCGCAGCTGGGTTTCACGGTCCTCGAGCAGTCGCAACGCGGAGCG
+GATGACTTCACTGGCCGACCGGTAGCGGCCCGCGGCGATCTCGCCGTCGATGAAGGCGCTGTAGTGCTCG
+TCGAGGACGAAGGACGTGTTCTTACCCACGAACGCACAATACCAATTGTTGGTAGTAGGTGTTAGCCCCT
+GGGACACCCCAAGCCCCAGCGGCAGAATCTCCTGGGGATCGGCATGGCCGCACCAGGCGCGGCGCGCCCA
+GACATGTCAGAGGGTGAGGCGACACTGGATGATCGACACCACCGAAGCGGCATATCGGCTGACGTATCAG
+CCGGACGGCACGTCGATCACCGTCCGGGAGAACCTGGTCGACATCCTGGCGCGTGAGCTGCTCGGCCCGA
+TCCGCGGCCCGCAGGAGGTGTTGCCGTTCAGCCCGCGCTCGCAATACCTGGTCGGGCACCTCGCCCCGGT
+AAAGCTGACCGGCGCCGCGCTCATCGACGACAACGCGGTCCAGGCCCGTGCCAACGCCGAGGCGCTCGCC
+GAGGGCGGTGGCGTGCCGGCCTACGCGGCCGACGAAACGACGCCGACACCGACGACGACGCCCAAGACCG
+CGCACCCAAGCAGGGCCTGATGATCCCGGCATCAATGGGTTTACGGTTTCAGGTGCCACCCGATCTGGTG
+TCGTTCACCATCACCGCGTCATGGATAACCTACGAGACCGTCGAGAGCGGGAGGTGACCAAGGCCGGCCG
+TACGATAGCCAGCGCGATAGCAGTGATCTCGTCCCGGCTTCATCGCGCTTGTCCGGGTGCGACGACCGCC
+AACGACAGGGCCTCGGCGGCTTCCTTAAGGCGGTTGTCGTAGGTAACCAGCGCGGTCAATGGTGCAACGG
+ATCCGGCGGTTTGAGCAGTGGCTAGGTGTATCGCGTCGAGCGAGCGCAGTGCTGGGTTGGGGTAGGCCGC
+CGCGGTGGAGCGTATGACCGCGTCGATTTCGAAACGGTCCAGCCTGGCTAGCACGGAGGGCACCGCCGGT
+AGCCCTTCTGGGGAGACTGCGCGGATGGCTCTGGATAGCTCAACTTCGGTCAAAGCCGATGTGATCCACC
+GTAGTTCGGTGCGGTCATCGAGCCAATCAGCTAAAGCGTCAGATTCGACCTCGATCCGAATTAGCTTGAC
+CAGCGCCGAGGTTTCCAGGTAGATCACGCGCTAGTACCGCTCCTCGGCGCGCATGCGCTCCAACAGCGTT
+CCCGAGTCGAGACCGCCGCGCATCGGAATTGTGGGCCGAGGCGCCGGGCCATGCACTCTCGCCGGTTGCA
+CACTGCCGGTGCTGATCAGTGAGTCGAGAGGGCCGGCAGAAGCCGGGATTATTCGGGCGATAACCTTGCC
+GCGCTCAGTCAGGTTGATCTCTTCACCGCGCTTGACGCGGGCCAGGACCTTGGACGTCTCCTGGTTGAGC
+GTTCGTATGGACACCTCATTCACACCGATAATGTACTACCTATTTGTTCTACATGCTATGCGCGCAAGAG
+GTTACCTGCCCCGCTGGTCAGGATCGCCAGCGCCAGGCCACTGATCTCGTCGGCGACTCCGGCGTAGCGC
+GTGAGATGCCAGGTGCGAGCGACGTCTTCGATGAAGCTAATCGCCGCCGCGACCAGCAGTCGCCCCTGGG
+CGACACTGGTCGCGGGTACCAGCTTGCCGATGAGGTCGATCCACACGGCCTCGCGGTCGCCCTGATTTCG
+CAGGTAGCCGTCGCGTACTTCGACAGAGGCGTGCGACAGTTCGGTGACCGACACTGCCACCAGATCCGGA
+GCGTCCAAGCTGATCCGAACGTGCCCTTGGACAAGGCCGCGCAACCGTTGTGCCGCTTGCTGATTCGCTC
+GTAGCGCTCGGATGCACTCCAGGCAGCGCCACTCGTCGAGGCGGCGGATGAGCGCGTCCAGGATGGCCTG
+TTTGGAAGAAAACGAACGGTACAGCCCCGGGCCCGCGATGCCGGCTCCCTTGCCGATTTCGCTGGTGTTG
+ACGGCCGGATAGCCCTGCGCACGGAACAGCCGCGCGCCCGCGGCCAGCAGGGTCTCGTAGCGGGAGAACA
+GCACGTCGGCCTCGTCGCGTGCGGCATCACCGGCCGGCAGTGGCGGCAATTCGCAGACGGGAGGCGTCCT
+TGCCGCGGCCATACACGCCTGGTAGAGAAGCTTTTTCAGTTCCTCGCCCGGCAGGCTTAGGCTGTGCCGG
+CCCAGGCTGGTCAAAGTGCTGGACACCGCCCACGCCCGCAACTCCGAATGCTGTGGACTCAGATCGGGCA
+CCTCCAGCAGCACGCTGTCACGCATGCCGGCGACGATCGCGTTGATGCGGCGCCGGACCGCCGTGCGGTC
+GTCCTCGTTGAGGTAGCGGGCCTCGCGCTGCCACAGCACCGTCAACGCCCGAGAGGCGACCGCCGCGGCG
+ATCAGGTCTTCCAGATCGGCGTTCAACGGCCGCGGCGTCGGCTCCGTCTCGCCCTCGGTGAGACGACGCG
+CGCTCTGGTACTGATCCTGGCCGGTTCGGATCGCTTCGGCGAGCAACGCCTGCTTGTTGTCGTAGTGGCG
+ATACAACGCGCGCGCGGTCACCCCGGCCGCCTCGGCAATGTCCTCCAATTTGACCGAATGGAAGCCACGT
+TCGATGAACAGTCCAACGGCCTGATCCAAAATCTGCTTCTTCCGGTCCTTTGGGCGGCGCCTAACGGGTT
+GGGCGACGGATGCCATCGGCTCGAACCCCCTTCTTGCGCACCGGAATCACAAATCCTGCTAGCAGCATCG
+CCTCAGCTTCACCCCGCTCATTCTTCACCTCGAATGCGCCGGTCACCGGGTGCGACACTTACCGGCCGTC
+GTTCATGGTGACGTTTCGAGGCTGTGCTGCTGCCAAGACCCCAGGAAGTCTCGGACGAGAGACTCGCTAG
+CCTCCGTGGTATCGGGCATCCCTATCACCCCTGCTCGATCCTCAATATCGGACTAACAAAATACATCATC
+GCGCCTGTATACGCGATTACATTGCAATTTATCCTTATCACCCTTCTTAGAGTGCATATCAGTAATAGAC
+ATATCGCGCTCCTCGCGCCCCAGGAGGCGGTCGACGAATTCGCCGTGCGCAACGACATGAGCCGTCGCTG
+AGCCTGAAAACCTGCAGACAAAGCGCGAGTGGGGGCTGGCAAAACTACAGGCTCGTTAGCAGCAAGTTGC
+TTCGACGACCATGGTGGCAACCTCGCCGGTCGCGAAGGCTCTGGTCGGCGGGCCCGAATCGAGGCGGTCA
+GGATGCGGCATCCGATCACCGCCCGTCGGGCGCGCTGTTGATGCCTGATCGTGGTGCCTCGCCAGCGTGA
+CTCGAGCCAACGGCTTGACCGGTGATGCGCCTGTCGGCCGCCAAGGCAGCAGAGCACATCGCCCCGCGCT
+ATAGGATACTAGCAAGATACATCATAGCCAATATATGCCAGTTTGCATTGCTATTTACCGATCAGTTGTC
+CAAGCAATCGCGTATTGGCTATGGACATCAGCGGTCTCTGCCGCGTACGCTCACCAATGTCACCGATCGT
+CGACCTGTCCGGGGGGCCAGCGTGCGCCACCTCACCCAACGGCCCAGCATCGAATCCAGCTGGTGCGCCG
+CGCCATGGTAATCGTGGCCGACAAGGCGGCCGGTCGGGTCGCTGATCCGGTCTTGCGGCCGGTGGGCGCG
+CTGGGCGATTTCTTCGCGATGACGCTCGACACGTCCGTGTGCATGTTCAAGCCGCCTTTCGCGTGGCGTG
+AATACCTACTTCAGTGCTGGTTCGTGGCGCGGGTGTCGACGCTGCCTGGGGTGTTGATGACGATCCCATG
+GGCGGTGATCTCGGGGTTTCTCTTCAACGTCTTGCTGACCGACATCGGTGCCGCGGACTTTTCCGGCACC
+GGCTGTGCGATCTTCACCGTGAACCAAAGCCGTGGGACGGGCAGCCTCGAACGCGGCCGATTCATTGGGC
+CGCAAGATCACCGAGTGGCGGCAGCCCTCGAAGTGACGGCCCCTCTGCTACGTAGCTAAGCACGCGCGAC
+CGGCGGGCTGGGGAGCCCGGTCAGCGGTCTCATAGCATTGCGAACACGGGACGTCGAGAGGGGAAGAGCT
+GCCATGGGTGAGGCGAACATCCGCGAGCAGGCGATCGCCACGATGCCACGGGGTGGCCCCGACGCGTCTT
+GGCTGGATCGTCGATTCCAGACCGACGCACTGGAGTACCTCGACCGCGACGATGTGCCCGATGAGGTCAA
+ACAGAAGATCATCGGGGTGCTCGACCGGGTGGGCACCCTGACCAACCTGCACGAGAAGTACGCCCGGATA
+GCCCTGAAACTTGTTTCTGACATTCCCAACCCGCGAATCCTGGAACTTGGTGCGGGCCATGGCAAGCTCT
+CAGCGAAAATCCTCGAGCTACACCCGACAGCGACGGTGACGATCAGCGATCTAGATCCCACCTCGGTGGC
+CAACATCGCCGCGGGAGAGCTGGGAACACATCCGCGAGCACGCACCCAAGTGATCGACGCCACCGCAATC
+GACGGCCACGGCCACAGCTATGACCTGGCGGTCTTCGCGCTGGCATTTCACCACCTGCCGCCTACGGTCG
+CCTGCAAAGCGATCGCCGAGGCCACCCGGGTGGGGAAGCGCTTTCTGATCATCGACCTCAAACGGCAGAA
+ACCGCTGTCGTTCACGCTCTCTTCGGTGCTGCTACTGCCGCTCCACCTACTGCTGCTGCCATGGTCGTCG
+ATGCGCTCGAGCATGCACGACGGCTTTATCAGCGCACTACGTGCCTACAGTCCCTCGGCGTTGCAGACGC
+TTGCCCGCGCCGCCGATCCGGGAATGCAGGTTGAAATCTTGCCCGCACCGACCAGGCTATTCCCGCCATC
+GCTCGCCGTTGTGTTCTCCCGTTCGAGCTCAGCGCCAACGGAATCTAGCGAGTGCTCGGCCGATCGCCAA
+CCCGGCGAATGATTCGGTAGTAGTGCAGATAAGCCATCGCCGGTACCACGATGAACGTGATCACGATCAA
+AGCAATCGAGAAGTAGTTCGGACCACCCCGCACTAGAAAGATGCAGCGGTAGTCGTAGGACACTGCCAGC
+CCAACCGAGACCACGATCGCAACAAGCGGTAACACCTTGTCGGTGAACGCATTTCGCCGCACAGCAGCAT
+GTTCTACTGCCTGAGACCTCGCCAATGCGATGAGAGCGATCGGCACGATGATGAACTGGACGAATCGGGC
+GATCACCGCCAGGCCGGTCAGGTGCAGGTTGTCGAACCGCAGCGCCAACGGGAATGCGAGCGCCAACGAC
+GCCGTAATTGCGAAGGAGACCATCGGCACGTCGTATTGGTTCTTGCGTGACAAGCGTGTCGGCAGAACCC
+CGCTGTCCGCTAACGCGGTCCAAAGCCGCGGTGCACCGAACGAGGCCGCGACATTGATGCCGAACATCGA
+TATCAGGGCTCCGACGACGATGATCGTTCGGAAGGTAGCGTTTCCGATGGCCGCGGCCAGTTTCACGGTG
+TCGCCCGACGCGGCGATCTTGTTCGATCCGAGCAGCATCGCTACCGTTAGGGTGAGCAAGTAGATCGCGC
+CAACCGAGAAGATCGCGATCGGTATAGCTCTCGGCAGGTTCCGGTCCGGCGCGTCCATTTCTTCGGCGGC
+GTTCGCGATCGATTCGAAACCGGTGAATGCGTACAACGCGACAATCGTGGCCAGCGCCATACTCGAGAAC
+GTGCCCTTGCCAATTTCGGCGACGCCAAGCAACGAGTACGGGGTCGCGCTGTATGCCGACCACGCCGTTG
+CGTAGTTGTTCACGTGCTGGGTGGTGATGATCCACAGCCCGCCGACAATGAATGCCGAGAGCGCGAATGC
+CTTGCCTACCGTTGACGTTCCGTTGGCCCACTTGATCGCCCGGTTGCCGAAGAGGTTGATGGCCAACAGC
+ACGCCGATAAAGCCGAGAAACGTCAGCGTCTTCACACTGAACAGTTGCTCGGCGTCGGCCCAGGCCTTGT
+CGGGGAAGGCCACTCGCAACAGCGTCGAGACGAAAAAAGAAGCCAACACCCCCCAAGCGATGGACGCGGT
+AATGGCGTGGGTGACACCGACATAGATGCCGATCCGGCGCCCAAATGCGGCCGTTGTGTAGGCGTAGGAG
+GCACCGTTTGTTCTGACGTACCTTGCCGCCGTCGCGAAGACGATCGCCACGACACCCGCGAAAATGCCAG
+CTAAAACATAGGCCATCGGCGCGAAGGGTCCTGCGAGCCCGATCACCTCACCTGGAGTTAGGAAGATACC
+GGCGCCGATTATCGAGTTGATCCCGAGCATGACGACGCTGCAGAAACCCAGCTTGTGGATCGCATATCCT
+CTCGTCCGCGGGCCGACCACCGCACCAAGGCTGTCTAGCAGGGAATCCTCTAACGCACCATAGATTCTCT
+AGCGACGATTCTTGAGCTCCCGGCCTGTCGATGCCGGCGCTGCAGGTGAGTCACCGCAGTGGGCGCACCG
+AACACTCACTTCCGCCGCCCCAAATCCGCGCAGTGACCACCGCGCGGTCCTCGCGAGTCTAGGCCAGCAT
+CGAGTCGATCGCGGAACGTGGGACCAATACCTGGGTTGGGCCGGCTGCTTCGGGCAGCAACTCCCCCGGG
+TTGAAGAAGAAAATCACCCCGTCGTTCGTGACTGCGAAGTTCTGATAATTCACCGGGTCCAAGCCGGCAT
+TCGGCGCTATCGATACCTGTTGTCCGGTCTGCTTGCTCAGTTCACCTTGCACAATGGGGAAGACGACTGG
+CAGCGGATCGGTGTCAGCCTGCCACAGCGTGTCATAGGTGATTGGCTTGCGATAGGCCTGGTCCCAATCG
+AAGGCCTTGTACGTGGTCGTTGGGTGCGTGCCGCCGGCGTTCTGGTAGACCTTGAGCACCACGGCCTGCG
+TACCACGCGGCGGTATCGCGGACTGGTATGTGGCCGAGGTGATATTCAATTCGTAGGGGGCTTCGCGTGG
+AGTGGACGATGTGGCCGCGCTGAGGAACTTGTCGCGCGTCTGGGCGATGTAATTTTCCAGCGACTTCTGG
+TCGGGGTAGTAACTGGGCAGGCTGATGTTGATGTTGTAGGCCGGGTCGGACATTTGAATCTGGCACGCCT
+GGCCGGTATCGGTGCCTTTCAACTCCTCGCAGTAGGTCTTGGGCGCGGCCGTGGCCACACCCGAACAACA
+GAGCAAAACGACAGCCGTGACCAGCATGAAGATCTTGATGCGCACGTCGAAATTCCTCCGGGAGTAGTTT
+GCAGCACCGCCGGCCGCAGGCGGGAGATTGGATTGCCGCGATATCTGAGTCGACGACAAACATAGGGCAT
+CGCGCTGCTGACGACGATGCCTGACCAGACTCAAGCTAGCAGATCGATCGGGCCCGGTGTCGCGTGGTGC
+TCGACGCCCCCGACGCGCTGGGCGGTTAGAAGTCCCAGTCGGTGTCGGTGGTGGGTTGGTGGGTGCCCAT
+TACGTATGAGCTTCCGGAGCCGGAGAAAAAGTCGTGGTTCTCCCCTGCACCGGGGTCGAGAGCTGCGCGC
+ACGGCCGGGTTCACCTGGCAGGTGTCACGATCGAATGCAGGCTGGTATCCCAGGTTGGCTAGCGCCTTGT
+TGGCGTTGTAACGCATGTAGGGCAAAACGTCGTCGGTCCAGCCCAACTCGTCGTACAAGTCGTGCGCATA
+GTCGATCTCGTTCGCGTAGAGCGTGTGCAGCAGCTCGCAGGTGTATTCGCGGTGGTCGGCCCGCTCGGCG
+TCGGTCAGGTCGGCCAAACCTCGTTGACATTTGTAGCCGATGTAGTAGCCGTGGACGGCTTCATCTCGGA
+TGATCAGCCGGATCAGATCGGCGGTGTTGGTGAGCTTACCCCGCGACGACCAGTACATGGGCAGGTAGAA
+GCCGGAGTAGAACAGGAAGGACTCCAGCATTACCGACGATGCTTTGCGCTTGAGCGCGTCGTCACCGCGG
+TAGTAGTCGACGATGATCTGCGCTTTTCGCTGCAGGTAAGGGTTCTGTTCCGACCAGTCGAAGGCATCGT
+CGATCTGCTTGGTCGAGCACAGGGTCGAGAAGATCGAGCTGTAGCTCTTGGCGTGCACTGACTCCATGAA
+CGCCATGTTGGTCAGGACCGCCTCTTCGTGGGGGGTGACCGCGTCGTCGATCATGGCCACTGCTCCCACC
+GTCGCCTGCGCGGTGTCGAGCAGGGTCAAGCCGGTGAACACCCGGATCGTCGTCTGCTGCTCGGTGGAAC
+TCAACGTTTGCCAAGATGCCAGGTCGTTGGAGAGCGGAATCTTTTCCGGCAACCAAAAGTTACCGGTCAA
+ACGTTCCCAGACCTGCAAATCTTTAGCATCGAGCAACCGGTTCCAATTGATTGCGTGCACCCGCTCAACG
+CGCTTGCCGGTCATCGAGGGCCGTCCTGCCTTGCCATGGTCATGCCGCTGTTGGCCGGTGCGTACGCTCC
+TGTGGGCGTCAAGTCCGGCAGTCGGTCCTTGGGCATTTCGGCCGTCCTCCTTGTCATTGACGGTCTTTCA
+TGGCGTGCACCAGCACTGTAGCTTAGTGATTTCGGCTACCCATATTTTATTCTTCGTGTCGCTGAACTCA
+TTACAAACAGCGATCACCGCGCATACGGTTACGCGACGCCTGGCCAGTAGCCGACGACGCCGCGGAACTC
+AAGGTCGGTTTGCGGGAAGTCGTTGCCGACGGCCAGCAGTGGTTGGTGGCCCAGCTGGGCGGTCGCGTAC
+GTCATACAGTCTCCGAAGTTGAGAGCCGCGCGGTGGCGCCCCTTGCCGTATCGCAGAAAGGCTCGTTGCG
+TGGCAGCGGCATGCTCGGCGGTGAAAGATGACACGCTCAAGCCGATTTCGCTGCGAAGTCGTTCGAAGAT
+CGTGCGCGCAACGGGGCCGTGACGGGCGGTCAAGACAATCAGGCATTCGGCGACGGTGGGTGCAGACATG
+ACGGGGCTATGGGCGCCGGCCAGGGCGGCCGCGACCAGGGTGGCGTGCGGCCGCTCGCCTTGAACCAGGG
+CCACCACGGCGCTTGTGTCCACGATCATTGCGGTGCTCAGACTCCGGTTGCGGGGTCGTAGCCGAGGATT
+TGTTCGCGCTCGAGCTTGGTGATGGGGGAGCGGTCGGCAAGCAGGGGCCAGATTTCGGTACGCAAGATGT
+CGAGAAGTTGTGCCTCACGGTCGCCGGCGCGCGACTCCAAAAACGCCAGCTGGGCAGACAGGGCATGCCG
+GATGGCGGCAGTCTTGCTGGTGTGCAGCCGGTCAGCGAGTTCGGCGGCTAGTCGGTCTACCTCAGGGTCT
+TTGATATTCAGCGCCACAGGTAGATGGTACCAGCAAATAGCCACTATCTACCTAACGCGTGCTGTGCCGT
+GCGGTAGCTACTGAAAATCCGAGATGTCAAAGGCAGCGTCTGGATACGCTGTATGCGCGCAGGGATGGTG
+ATCGAGGCGGAGGGGCGGCGTGTCATTTCTGGTCGTGGTTCCCGAGTTCTTGACGTCCGCGGCAGCGGAT
+GTGGAGAACATAGGTTCCACACTGCGCGCGGCGAATGCCGCGGCTGCCGCCTCGACCACCGCGCTTGCGG
+CCGCTGGCGCTGATGAGGTATCGGCGGCGGTGGCAGCGCTGTTTGCCAGGTTCGGTCAGGAATATCAAGC
+GGTCAGCGCGCAGGCGAGCGCTTTCCATCAACAGTTCGTGCAGACGCTGAACTCGGCGTCAGGATCGTAT
+GCGGCCGCGGAGGCCACCATCGCGTCACAGTTGCAGACCGCGCAGCACGATCTGCTGGGCGCGGTCAATG
+CACCAACCGAAACGTTGTTGGGGCGTCCGCTAATCGGCGACGGAGCACCCGGGACGGCAACGAGTCCGAA
+TGGCGGGGCGGGTGGGCTGCTGTACGGCAACGGCGGCAACGGTTATTCCGCGACGGCGTCGGGGGTCGGC
+GGCGGGGCCGGCGGTTCCGCGGGGTTGATCGGCAATGGCGGCGCCGGGGGAGCCGGCGGACCCAACGCCC
+CCGGGGGAGCCGGCGGCAACGGTGGCTGGCTGCTCGGCAACGGCGGGATCGGCGGGCCCGGGGGCGCGTC
+GAGCATCCCCGGCATGAGTGGTGGAGCCGGCGGAACCGGCGGTGCCACAGGACTTTTGGGCTGGGGAGCG
+AACGGCGGAGCCGGCGGCCTCGGTGATGGAGTCGGTGTCGATCGTGGCACGGGCGGCGCCGGAGGCCGCG
+GCGGCCTGTTGTATGGCGGATACGGCGTCAGTGGGCCAGGCGGCGACGGCAGAACCGTCCCGCTGGAGAT
+AATTCATGTCACAGAGCCGACGGTACATGCCAACGTCAACGGCGGACCGACGTCAACCATTCTGGTCGAC
+ACCGGATCCGCTGGTCTTGTTGTCTCGCCTGAGGATGTCGGGGGAATCCTGGGAGTGCTTCACATGGGCC
+TCCCAACCGGATTGAGCATCAGCGGTTACAGCGGGGGGCTGTACTACATCTTCGCCACGTATACCACGAC
+GGTGGACTTCGGGAATGGCATCGTCACCGCGCCGACCGCCGTTAATGTCGTCCTCTTGTCCATCCCAACG
+TCCCCCTTCGCCATTTCGACCTACTTCAGCGCCTTGCTGGCCGATCCGACAACAACTCCGTTCGAAGCCT
+ATTTCGGTGCCGTCGGCGTGGACGGCGTTCTGGGAGTTGGGCCCAATGCGGTGGGACCAGGCCCCAGCAT
+TCCGACGATGGCGTTACCGGGTGACCTCAACCAGGGAGTGCTCATCGACGCACCCGCAGGTGAGCTCGTG
+TTCGGTCCCAACCCGCTACCTGCGCCCAACGTCGAGGTCGTCGGATCGCCGATCACCACCCTGTACGTAA
+AGATCGATGGTGGGACTCCCATACCCGTCCCCTCGATCATCGATTCCGGTGGGGTAACGGGAACCATCCC
+GTCATATGTCATCGGATCCGGAACCCTGCCGGCGAACACAAACATTGAGGTCTACACCAGCCCCGGCGGT
+GATCGGCTCTACGCGTTCAACACAAACGATTACCGCCCGACCGTCATTTCATCCGGCCTGATGAATACCG
+GGTTCTTGCCCTTCAGATTCCAGCCGGTGTACATCGACTACAGCCCCAGCGGTATAGGGACAACAGTCTT
+TGATCATCCGGCGTGATCGAGCCTGTTCGCCGCGAATGTCGCCGCCTGGCTTGTCATCCCCGACTGAACA
+TACGAAACATGCGCCATAATATTGCCGCCTCCGGTGCATATTGGATCGTCGGGAGCACACAAGTTTATGG
+TCTTAGAGCTATACAGCGGACCGATTGTCGGCAACGACCCGCCGCCCCACAACATGCTGGAGAAACCACT
+GGATGGCTCGCCGAAAAGGGCGACAGCGGCGACATGATCTGCCACCGCGGGCGGCATCGCCGAGGTGGAC
+AAATCGATGACCGTCGCACCCTGCGAATAGCCACCAAGCACAATCCTGGTGTTCGGGCAGCTGGCGACGG
+TGCGCTGGATGTGGGCGCTCGCATCATCGGAACCGTTTGACGCGCTCGCGCGGTAGTCGTCGCTTGCTGG
+GTAGTTCACCGCGTAGACCCCAATCGACCGCCCGCCAACTTGCGAGGTAAGCGAGTCGACGAACGCCTCA
+CCGACGTCGCCAAGACCAGAAGCCTGATGCGTGCCGCGAGCGAAAACGACCGCGATGTCCGAACACGGAT
+CCGCATGCGCGGCACGACCGCCGGCGGGTGCGCTCACCAGCGCCAAGGTCGTCGCAACCACGACACCAAC
+GATGCGAACAAGGCTGCGTGGAGTCATCTGCACATGCTGACATACTGCCGGCGACCGAGGTGGCGGTGGG
+CCGCTGAGACATGACGTGCCTCACGTCGTCGGCGCCCACGCAGCCCCAGGTCAGAACGGTAGCCTTAGGC
+GATGACCGACTCTGTGGTCGTCCGCGTCAAGCCCGGCAGTCACAAAGGACCCCTGGTCGAGGTCGGTCCC
+AACGGTGAGCTGATTATCTACGTCCGCGAGCCGGCGATTGATGGCAAGGCCAACGATGCGGTCACCCGGC
+TGCTCGCAGCTCACCTTCAATTGCCAAAGAGCCGAGTCAAATTGGTGTCCGGAGCGACGTCGCGGTTCAA
+GCGTTTCCGTCTGAGTCGTTAAGTTCAACCTGTTTGAGGAAGCGGGTCCAGCAAGGCCGGGACATCGAGA
+CCAAGCCGCGCTGACACAACAACATGCTGGCGTCGGTCAACCCGGTCGGCGGCGGCGTTGCTGGCCCCGG
+TACAGACCGCTTGCCGCCGCCCTCACCGTGTCGGTAATTCGCGCGATGATCGGACTGTCCAGTTTCCAGC
+ATTGCCAATAGAGAGGGACGTCGAGGTGTATGTCGCAGACCCGTACGAACGATCCATCGGCAAGCGGAGA
+TGCTGCCAGCTTCTCGGGGAACATGCCCCATCCCAGCCCGGCGCGCGCTGCGGCGGTGAAGCCCTCTGTG
+GTCGGGACAAAGTGCGTCGGTCTGGTGATGGCGCGACGAAAGGCCTTACGCACCAACATGTCCTGCAGCC
+CATCGTCACGATTCCACGCCAGTGACGGAGCTTTAGCCGCCGCGGCGGCAGTGAACCCGTCGGATAGATG
+GCGCTGGACGAATGGCCTGCTGGCCACTGGTAGGTAGCGCATTTCACCCAGCGGGTGCACCCGGCAGCCC
+GGCACCGGGTTCCGCTCGGTGGTCACCGCGCCCATCGCCACACCCTCCCGTAGCAGCCGCGCGGAATGGT
+CCTGGTCCTCGATCCGAACGTCGAGCAGGACGTCGCCGAGACCGTCGAACACGGCCGAAAACCATGTCGC
+CATGGAATCGGCGTTTACCGCAATGGTGATCCGCGTGCGTTTCAGCGACGCGTTGCCACCCATTTCAGCG
+AGCGCCTCGGACTCGAGCAACGCTGTTTGCGCGGCCAACCGCAACAGCGGGATACCTGCGGTCGTCGCCC
+GACATGGCTTTTCCCTGACCACCAGCACCTGGCCGACCTGCTGCTCCAACGACTTGATGCGCTGACTGAC
+AGCCGAGGGGGTGACATGTAGGCGCTCCGCGGCCGCATCGAAGCTGCCCAGTTCGACCACGGCAGCCAAT
+GCGGCCAGCTGTGGACCGTCAAGCTGCGGATCCACCATCTCAGGTGTAGACCATCTGCGGAGCGTCGCAC
+TGCACATTAATAATGCTAATGTAAATGAAGAATTATTAGCTATACTGACCCATACAAACTGCCTAGTGTC
+GATTGCGTGAACTCACCACTGGTCGTCGGCTTCCTGGCCTGCTTCACGCTGATCGCCGCGATTGGCGCGC
+AGAACGCATTCGTGCTGCGGCAGGGAATCCAGCGTGAGCACGTGCTGCCGGTGGTGGCGCTGTGCACGGT
+GTCCGACATCGTGCTGATCGCCGCCGGTATCGCGGGGTTCGGCGCATTGATCGGCGCACATCCGCGTGCG
+CTCAATGTCGTCAAGTTTGGCGGCGCCGCCTTCCTAATCGGCTACGGGCTACTTGCGGCCCGGCGGGCGT
+GGCGACCTGTTGCGCTGATCCCATCTGGCGCCACGCCGGTTCGCTTAGCCGAGGTCCTGGTGACCTGTGC
+GGCATTCACGTTCCTCAACCCACACGTCTACCTCGACACCGTCGTGTTGCTAGGCGCGCTGGCCAACGAG
+CACAGCGACCAGCGCTGGCTGTTCGGCCTCGGCGCGGTCACAGCCAGTGCGGTATGGTTCGCCACCCTCG
+GGTTCGGAGCCGGCCGGTTGCGCGGGCTGTTCACCAACCCCGGCTCGTGGAGAATCCTCGACGGCCTGAT
+CGCGGTCATGATGGTTGCGCTGGGAATCTCGCTGACCGTGACCTAGTACAGCACGTGTGCACACGCGGGT
+TGGACCACGTGATCGTCGATGGGCACATACCGTTCGGCAGGAGGGCGCGCGGTCAGTCTGCACAACTCAG
+TCACCAGCTGACACGCCGACGGCGGCCTCGCCCGGGCGTGTCGGCGCCACCAGTGCACATTCGGCGTGAC
+GCGGCCCTACGGATCGTGTTGGAGCTGTAGCCCGTTGATACCGGTCGCGAACGGTGAACGGCGCTAATCG
+GGGGAGTGGGGTCGAGGCTGTCTGGCCTTCCCCGTCCGCAAGTTCGCGTTCGGCCGGGCCGATATCTGGT
+TCAGGGTGGGTCGAGGCCAAATTTCATCACGGTTGCGGTTGAGCAAAGTTGCTGTAGCTTGCTCGCGAGG
+AGACGGCCGATATCGCCTCATTGGCATTAGTGTTGGCTGTCATGGCCGGACTGAACATTTACGTGAGGCG
+CTGGCGGACAGCGCTTCACGCAACCGTGTCGGCATTGATAGTTGCCATCCTCGGACTCGCCATCACCCCG
+GTCGCTAGTGCGGCGACGGCCAGGGCGACGTTGTCGGTGACATCGACGTGGCAGACCGGTTTCATCGCCC
+GCTTCACCATCACAAACTCGAGCACGGCGCCGCTAACCGATTGGAAGCTTGAATTCGACTTGCCGGCAGG
+AGAATCCGTCTTGCACACATGGAATAGCACCGTTGCACGATCTGGCACGCACTACGTTCTCAGCCCAGCG
+AATTGGAATCGCATCATTGCCCCCGGTGGTTCAGCCACGGGCGGCCTAAGAGGCGGGCTGACCGGTTCTT
+ACTCGCCGCCGTCGAGTTGTCTGCTCAACGGGCAATATCCTTGCACCTAGACGCGACTGCGCACTGAGGC
+TCGCCGACTGCGACAATGCGGCTACTGCCAGGTGGGTCTAGTGGGTCGTCACGGCCAACGTCATCTCGGA
+GTTGATGCGGACGGCGCCAGAGCCCTGGGGCTGGTGATGACCAGAAGGTTGCCTGAACCGAGAAATTGGA
+TTGATCGCAGTGCCGGTGGCGGGCTACGGTCGGGCGCGTGGGCATCTACGCAGTGACGGTACGTCGTGTC
+CGCCCTCGGACGGTCGCGACGGGCATGGGGCTGGCACCGGCTCCATGACGAATGGGCAGCGCGGGTAGTC
+AGCGCGGCCGCAGTGCGGCCCGGTGAGCTCGTGTTTGACATCGGCGCCGGCGAAGGGGCACTGACGGCGC
+ATCTAGTGCGAGCGGGGGCGCGGGTGGTCGCCGTGGAGTTGCACCCGCGACGAGTCGGTGTCCTCCGCGA
+GCGATTCCCTGGCATTACCGTGGTGCACGCGGACGCCGCCTCGATCCGGTTGCCCGGCCGGCCGTTCCGG
+GTTGTGGCGAACCCGCCGTACGGGATTTCGTCCCGCCTGCTGCGGACGCTGCTGGCACCCAACAGCGGGC
+TTGTCGCGGCCGATCTCGTGCTGCAGCGAGCCCTCGTATGTAAATTCGCTTCTCGCAACGCGCGAAGGTT
+CACCCTGACCGTCGGCCTCATGCTGCCACGGCGCGCGTTCCTGCCACCGCCGCATGTGGATTCCGCGGTG
+CTCGTCGTCCGCCGCCGGAAGTGCGGTGACTGGCAGGGGCGGTAAACCCGCGGCCGCCAGTAGGTGTACC
+ACCTTTGCTAGAAGTGGCACACTTCGTTCTATGTCGACCACTCGTCCGCGCTACCAAATAACCGAAACCC
+CGGAGGTAGCTCAGGCATTGGACCGGGCCGCCCAGCGATGGCCTGGCGAGCCCCGTTCCAAATTATTGCG
+GCGCCTGATCATCGATGCTCGACGATCCGCGTTCCGCGGGTAGCGTCGTTGCGCCGTACGACGATGGCGA
+GCTGCTGCGTCTCGCCGAACTACGCGCTAGCAGCGGGCTAAAACTACCTGATTGCTGCGTGCCGGATGTG
+GCAATTCATCACCAGGCAAGCCTCGCAACCTTTGACGACACGCTCGCTGCCGCAGCACGCACAAGGAGCG
+TGCCCGCTAGCACAAACGGCGCAGCTAACCCAATACGACCAGCTTCACTTGACATAATGTCGCTTATCGG
+CTTATAAGTGATGCGAGTTGCTCCTTACGATGACCATGGCACAGCGGCATCCTTCTCTGCGCCAAGCTGG
+CCAGCTACGTGGCTCGAAGTTCTTGGTAAAGAGCAGGCGTCAGATCGACGCTTTGTCGCAGTTGTAGTTG
+GCCCGGCCGAGTTCGCTGTTCATACGCGGTGACAACGAGGCCGACACCGCCCGCCGCCGGCACGAGGACA
+CCTTGCATGTGCAAGAACCAGGCCGCATGTCCGACCGCCTGGCACCCTGACCAGTCGTCGCCATAGATGT
+CGTCGTTCTCGAGCCCCACGGCTTCCCGAGCTTGCGGGGTTGTCAGATCGAGGACGGCCAGGTCCGTGAC
+GTCGATCGTGTGTAGTCGGTAGGCCGCCTCGAGCATCTTCTCTGCGGTCGTTGAAGCCGCTTGCGCCGCC
+CGTTCCACCTCAACCATGCAGGCTTGGGCGGAATCAGCAAGATAGATCGCCGGAAAGAGCAGCGGCGGAT
+TCCACCTGCCTCCGAATCTGCGCGCGCCCTCACCGGACAAGGCGTCACGGTGCGCGCCGGTATACCGGTA
+GCACGTTTCCGACCACTCAATTGTTCCGCGTGCGTCGATACGCTGGACGAGCCCTTCATCGAGGGCATCG
+CTCACACGAACACTCCCTCCGCCATCGCGTCGATGAGCGCCAACACGCGTTGGTACTCGCCGTCTCGCAC
+GAGGTCGGCAGGCTTGCGGTGTTCCAGTAACCGATTCGGCGAAAACATCCACACGTTCGCCTGGTCACGC
+GGCAGCACTTCCGCGAGGGCGTCGGCGACATAGGCCAGCTCGATAAGTCGTTGCTTGTTGAGGCGTTGGG
+GAACCACCTGACCTGCGGTCCATCGCGCCACGGAACGCGGCGAGGCATCGACGATGTCACCGACTTCCTC
+GTAGGTCAATCCCAAGCGCTCGATCGCACCCGACACGGTCGAGGCGAGCACATTTACTCCCATGGGCAGC
+CTGTCTTCCTTTTGTCTATTGATTTGTCATGTATTATGACACGAACCGAGGCGTCGATGCGAGAGGAACT
+TCACGACGATGGGCATTCAGTTTCGGCTCGGGCCGGGTGATCACAAACCGGTCGAGGACTTCCTGTCCCG
+CGACCACGCCGGCACCACTGCGATCACGCTGGACACCAACGCCACTCGTCACCAGCACGACGCTGCCGCA
+GCCGCAGTCGACGCAGGCCTAGATGTCTACTGGGAGCCAGCAGCCGAGCGCCTCGCCGCGCACCCGGCTT
+CGGGCTCGACAAGTTCCCTCTGTGAAACGGGCAGCCCTACGACACGGATGCCCTGACGCGCGACGCGGCG
+GCACGCGCCGAACTCGTCGGCAGGACTCTCGACAAACACCCGTCGATCGTCACGCACGTCACGGCCCCAC
+ACTTCTACCTCACCAACGAGCGCACCGCACGCCTCAACATCGACCTTGCCGAGCGCACGCGCTTGGCCGT
+CGGCTAGGCGGACCGCATGCGAACGGCCTTGACCCCGAGCCACGCCCGTAATGAATGCAACCTTGCCCTC
+AAGCCTGCCCACAACACCACCTCCGGCGAGTAGTTCCCCCGGCGGGGGGGCTTACACCAAGCAGGAACGT
+CACCGTGACGAATTGTCGCGTGGCGCAGTGTCAAAGGTCCAGTACGCGACGAAGTCCTCGGTCAACCTCG
+TGCATCAAGCTCGCTGGCACCTCCCCAACTCGGTCGGTGAGGTCAGTCTTGTTGAGCGTGACAATCGCCG
+TGACGTTGACGACCGAGTCACGTGGCAGTCGCGTTGTGGTCGCGGGCAAGAACACGTTGCCGGGCATTGC
+CGCCAGCGCCGTATTGGACGTGATCACCGCTGCGATCACAGTGGCAAGGCGACTTGCGTTGTACGGATCT
+GACTGGATTACGAGCACCGGGCGGCGCTTCGCCGGCTGACTGCCTGATGGCGGCCCGAGGTCAGCCCAGT
+AGATCTCGGCACGACTAATCACCACTCATCGTCCATGGTTTCTAGCACGCGGTATGCGTTGGCCACGGCG
+AGGGCCTCCGCTTCGTCGGTGCCATGGATGCTCTCTAGAGCCCTGTCGATCTGGCCCGTGAGCAATTGGG
+CGTCCAGCTCGTGCAGGTAGCGCTGCGCAGCCTTCGTGAAGAACTCGGACCGACTCATGCCGAGCTCACT
+CGCACGCCGCGATACCCGATCGAACGTCTCATCCGGCAGAGAAATAGCTGTCTTCATACAGATAGTATAA
+CCGGGTATAACTTCCAGAAGACGGCGGCTGTTTCGTCACAGTGACGCTATTGCTGGTCCAAACACACTCC
+ACGATTCCGCGCGTCGCTACCCCGGGATAGTCCGATCAGGTGTCTTGGGTGGCCCGGCAAGTGGTTTGAT
+GCGTCCGGCCCGCACGCCGTTGGCGATGACGATGACCTCGGTGAACTCGTGCACAAGCACGACCGCGGCC
+AGTCCGAGGATCCCGAACAACGCCAGCGGCATCAGCACGGTGATGATACTTAGGGACAATCCGACGTTTT
+GCACCATGATCTGCCGCGAGCGCCGGGCATGGTCTAGGGCTTGGGGCAGATGCCGCAGGTCTTGGCCCAT
+CAGGGCGACGTCGGCGGTTTCGATGGCGACGTCGGTTCCCATGGCGCCCATCGCGATTCCCAGGTCGGCG
+GCGGCCAGGGCCGGAGCGTCGTTGACTCCGTCGCCGACCATCGCGGTGGGTTGCCGAGCCCGCAGCTGTG
+CGACCAGATGAGCCTTGTCCTCGGGCCGCAATTCGGCATGTACCTGCTCGATGCCGGCTTGGGCTGCCAG
+GGCGGCAGCGGTGGCATGGTTGTCGCCGGTGAGCATCGTCACCTGGTAGCCGCCGGTGCGCAGCCCGGCC
+ACCACCTCGGCGGCTTCCGGGCGTAGTTCGTCGCGCACGGCGATGGCACCAAGCAGCTGCTGGTCGCGTT
+CGACGAGAACCGCTGTGGCGCCGGCTTGTTGCATGCACGCCACATGATCTGCGAGCTCGGCGGCATCGAG
+CCAGCCGGGTCGCCCCAGTCGCACCACCCGCCCGTCGAGGCGGCCTATCAGCCCGGCGCCCGGGACGGCT
+TGCACGTCGCTGGCGGCGGTCGTCGCTTGGGTCGCGGCAAGCACGGCCACAGCCAGGGGATGTTCGCTGC
+GGGCTTCCAGGGCGGCTGCCACCGCCAACACTTCCTCGCGGGTAGCGCCGTTTGTGGTGGCGACGTCGAT
+GACGACGGGCCGGTTGGCGGTTAACGTACCGGTTTTGTCCAGGGCTACCGCGCGGATGGTGCCCAGGGTT
+TCCAGCGCGGCGCCGCCCTTGATGAGCACGCCGAGTCTGGAGGCGGCGCCGATGGACGCGACCACGGTGA
+CCGGAACGGCGATGGCCAGCGCGCACGGGGCGGCGGCGACTAATACCACGAGCGCGCGTTCGATCCAGAC
+CAGCGGATTACCCAAGACGCTGCCGGTCCCGGCGATCAGCGCCGCGGCGATCATGATGCTGGGCACCAAC
+GGTCGCGCGATACAGTCGGCTAGCCGCTGACTAGCACCTTTTCGGACCTGTTCGGCCTCCACGATGTGCA
+CGATGCGCGCCAGCGAGTTGTTGGCCGCGGTAGCGGTGACCCCCACCTGCAGCACGCCCAAGCCGTTGAT
+CGACCCGGCGAACACTTCGTCACCGGGTCCAACCTCGACCGGCACCGATTCGCCGGTGATCGCGGAGACA
+TCCAGGGCGGTGCGCCCGGCACGAATGATGCCGTCGGTGGCCAGGCGTTCGCCCGGTTTAACGATCATCT
+GGTCACCGACGTGCAATTCGGTTGAGGCCACGATGGTTTCGGTGCCCTCCCGCAGAACTGTGGCCTGATC
+CGGCACCAGCGACAGCAGGGCGCGCAGGCCACGGCGAGTGCGCGCCGTCGCGTATTCCTCCAAGCCTTCG
+CTGATCGAGAACAGAAACGCCAGCGTAGCGGCCTCACCCAGCTCGCCAAGTGCGACAGCGCCCAGCGCGG
+CGATGGTCATCAGGGTGCCTACGCCGACGCGGCCTTCGGCCAGTCGTTTGAGGCTGGAGGGCACGAATGT
+CGAGGCCCCAACCGCCAGCGCAAGGGCCTTCAGTCCCAGTACGACCGGCCACAGCGGATAAGCCCATGCG
+GCAACTAGCGACGCGGTCAGCAACACTCCGGAGAATGCGGCTCGCCGCAGTTTGGCGACTTGCCAGAGCT
+GCTCCGGCTCGCGGTCCTCGTTGTCCTCGCCGTCGCAGCAGGCATCGCTCGTCTCCCCCGATGGCTGCGC
+GGCCACGTCACGCCGAACTCCTGATAGTGTTCGCGTGCTCCAGTCGATGATTTTCTGCACTACCCCGGCC
+TTGCGGTTACTGGCCGAGCGCGAAGCATACGCGGGCACCGCCGCCGCAGGGACGGTCTCGGCATCGATGA
+TTGCCGACAGGATGGCAGCGGTGTCGCAGATTGCGCGTGAATACCAGATCACAATGGATGCCGTCCGCGG
+ATAGGCATGCACGGCCTGCACACCGGCCACCTTGCCGACGGTGTCCTCGATCGCAACGGCCCGTCCCGCG
+TCGAACTGAAACCCGGTGGCCTGCACACGCATCCGCCCGGCTGCATCGGATACAACGGTCAGCTGGACCT
+CGGCGTCAACTACAGTCGTCACTCGTCGACCCTGGCGCCAGCGGGCAGGGGCGCCTCCTCACCGATGCGC
+CCGCGAGCCTCGGCAACGACGTCGGCGACTGTCAGCCGGGCCGACTCGGCCGCCGCCTCCGCGCGCCGGG
+TTCCGCGCAGGCCCCACTCCATCACGGTCACCGACGCCCGGCGAATGGGCGCCGTACCCAGCGCTTTGCG
+CAGCGTTTCGTAGGCGCTCACCCCGACCAGTCCGGTGAGCACCGCCCCGGCCGCCTTAACCAATAGCTCA
+TGCGTAACCACGGTCAGTTCTCCTTTGCTTTGTCCTGTAACCACAAGTCGTGTCGTCTGCTGCTCAGCTA
+CCTGTCATCTCGACCGCCTCCCCGGACGCGGCGCGCTCGGCGACACAGGGTTGGTCGGTATCCACCGCGA
+GAACGACCTGGACCAACTCGCCCAAGGCTCGCGCCAGGTGACTGTCGGCCAGCGCATACCGAACCTGCCG
+GCCCTCATAGGTTGCGACTACCAGCCCGCAGCCCCGCAAACACGACAGATGGTTGGACACATTCGATCGG
+GTCAACCCGAGGTGCGCAGCTAGCTGGCCGGGATAGCAAACGCCATCCAGCAACGCCACCAGAATCCGGC
+ACCGCGTCGGATCAGCCAGAGCCCGGCCGAGTCGAGCCAGGGCCGATTCCCGCATCTCACACGTCAGCAT
+AGATCAAATAGTACACCATATACTGGTATAACAGCAAGAGCTGAATTGTACATCCATAGCAGATATGATC
+GGCGCGCGTCACAAGCTTCCGGCCGCAGAGCCGCCAACTCACGATATCGTTAACCGATATCCCGAGCCGA
+TAGCTGGCGGGCTCGGGTGGTGGCCAGCGGCGCTGCGACGAAAGGTGTGACCGTCATGAAACAGACACCA
+CCGGCGGCCGTCGGCCGTCGTCACCTGCTCGAGATCTCAGCATCCGCAGCCGGTGTGATCGCGCTTTCGG
+CGTGTAGTGGGTCGCCGCCCGAGCCCGGCAAAGGCCGGCCCGACACAACCCCGGAACAGGAAGTCCCGGT
+CACCGCGCCCGAGGACTTGATGCGCGAACACGGAGTGCTCAAACGCATCCTGCTGATCTATCGCGAGGGG
+ATCCGCCGCCTCCAAGCCGATGATCAGAGTCCCGCTCCAGCACTGAACGAAAGCGCGCAGATCATTCGAC
+GCTTCATCGAGGACTACCACGGACAGCTGGAAGAGCAATACGTCTTCCCCAAGCTGGAACAAGCCGGCAA
+GCTCACGGACATCACCTCGGTCTTGCGCACCCAGCATCAGCGCGGCCGGGTGCTCACGGACCGGGTACTC
+GCCGCCACCACTGCAGCGGCTGCATTCGATCAGCCTGCGCGAGACACCCTGGCCCAAGACATGGCAGCGT
+ACATCCGAATGTTTGAGCCGCATGAGGCGCGCGAGGACACGGTCGTTTTCCCGGCGTTGCGCGACGTGAT
+GTCCGCTGTCGAGTTTCGCGACATGGCCGAGACCTTTGAAGACGAGGAGCACCGGCGCTTTGGCGAGGCC
+GGTTTTCAATCGGTGGTCGACAAGGTCGCCGATATCGAAAAAAGCCTTGGCATCTACGACCTGAGCCAGT
+TCACCCCCAGCTAAAGACACTAATGCCCTTGGGTTAGGGACCATCGCCTCCTGACGCGATCGCGACAGCT
+GGCTAACGTCGGTAGTACACCCATGCAGAGGGGACGCCAATGTCAGCCCAACAAACGAACCTCGGAATCG
+TGGTCGGTGTGGATGGTTCACCCTGCTCGCATACGGCAGTCGAATGGGCCGCGCGCGATGCGCAGATGCG
+CAACGTTGCGCTCCGCGTGGTGCAGGTCGTGCCCCCGGTAATAACCGCCCCGGAAGGGTGGGCATTTGAG
+TATTCGCGGTTTCAAGAAGCCCAAAAGCGCGAAATCGTCGAACACTCGTACCTGGTCGCCCAAGCGCACC
+AAATCGTCGAACAGGCCCACAAGGTCGCCCTCGAGGCATCCTCCTCAGGTCGCGCCGCGCAAATCACCGG
+CGAAGTGCTGCACGGCCAGATAGTGCCCACGCTGGCCAACATCTCCAGGCAGGTCGCGATGGTCGTGCTG
+GGCTACCGAGGTCAGGGCGCCGTAGCCGGCGCCTTGCTGGGATCGGTCAGCTCAAGCCTGGTTCGCCACG
+CTCATGGCCCTGTCGCCGTAATACCCGAGGAGCCGCGACCGGCGCGCCCGCCGCACGCGCCGGTTGTGGT
+GGGCATCGACGGCTCGCCCACCTCGGGATTGGCGGCCGAGATCGCCTTCGACGAGGCATCGCGCCGCGGC
+GTGGACTTGGTGGCGCTGCACGCGTGGAGCGACATGGGCCCCCTCGACTTTCCTAGGCTCAATTGGGCGC
+CGATCGAATGGAGAAACCTCGAAGACGAGCAGGAGAAAATGCTCGCCCGGCGTCTGAGCGGATGGCAAGA
+CCGGTATCCCGATGTCGTCGTGCACAAAGTCGTGGTGTGCGATCGACCGGCACCCCGCCTGCTCGAATTG
+GCACAAACCGCTCAGCTTGTGGTGGTTGGCAGCCACGGCCGCGGGGGGTTCCCCGGCATGCATCTCGGCT
+CAGTCAGCAGAGCGGTGGTCAATTCCGGTCAGGCTCCGGTTATCGTCGCCCGAATCCCCCAAGATCCGGC
+AGTGCCGGCCTGAGGGCCTGTGCGATCTGCTCGGGTGGTGCCCACCCGCGCGGAAAGCCCCGTCCGAACC
+GTGATTGGGCAACGTCGGGCCGGGCCAGCAGCGCTGGACCGTAGGTCCCTGCAGTGGATGACTTACGGCC
+CTGATCCACACCGGCGACCGTTAGGCAGGGTTGAGCCAACCGTCGGTTGAGCGTCTGGCTGCGAGGTGAG
+GTGATTGTCGGCGTCAGTGTCTGCCACGACGGCTCATCATGGCTTGCCAGCACATGAAGTGGTGCTGCTG
+CTGGAGAGCGATCCATATCACGGGCTGTCCGACGGCGAGGCCGCCCAACGACTAGAACGCTTCGGGCCCA
+ACACCTTGGCGGTGGTAACGCGCGCTAGCTTGCTGGCCCGCATCCTGCGGCAGTTTCATCACCCGCTGAT
+CTACGTTCTGCTCGTTGCCGGGACGATCACCGCCGGTCTTAAGGAATTCGTTGACGCCGCAGTGATCTTC
+GGTGTGGTGGTGATCAATGCGATCGTGGGTTTCATTCAAGAATCCAAGGCAGAGGCCGCACTGCAGGGCC
+TGCGCTCCATGGTGCACACCCACGCCAAGGTGGTGCGCGAGGGTCACGAGCACACAATGCCATCCGAAGA
+GCTGGTTCCCGGTGACCTTGTGCTGTTAGCGGCCGGTGACAAGGTTCCCGCCGATTTGCGGCTGGTGCGA
+CAGACCGGATTGAGCGTGAACGAGTCAGCACTTACCGGCGAGTCGACGCCGGTTCACAAGGACGAGGTGG
+CGTTGCCGGAGGGCACACCGGTCGCTGATCGTCGCAATATCGCGTATTCCGGCACATTGGTAACCGCGGG
+CCATGGCGCCGGGATCGTCGTCGCGACCGGCGCCGAAACCGAACTCGGTGAGATTCATCGGCTCGTTGGG
+GCCGCCGAGGTTGTCGCCACACCGCTGACCGCGAAGCTGGCGTGGTTCAGCAAGTTTCTGACCATCGCCA
+TCCTGGGTCTGGCAGCGCTCACGTTCGGCGTGGGTTTGCTGCGCCGGCAAGATGCCGTCGAAACGTTCAC
+CGCTGCGATCGCGCTGGCGGTCGGGGCAATTCCCGAAGGTCTGCCCACCGCCGTGACCATCACCTTGGCC
+ATCGGCATGGCCCGGATGGCCAAGCGCCGCGCGGTCATTCGACGTCTACCCGCGGTGGAAACGCTGGGCA
+GCACCACGGTCATCTGCGCCGACAAGACCGGAACGCTGACCGAGAATCAGATGACGGTCCAGTCGATCTG
+GACACCCCACGGTGAGATCCGGGCGACCGGAACGGGCTATGCACCCGACGTCCTCCTGTGCGACACCGAC
+GACGCGCCGGTTCCGGTGAATGCCAATGCGGCCCTTCGCTGGTCGCTGCTGGCCGGTGCCTGCAGCAACG
+ACGCCGCACTGGTTCGCGACGGCACACGCTGGCAGATCGTCGGCGATCCCACCGAGGGCGCGATGCTCGT
+CGTGGCCGCCAAGGCCGGCTTCAACCCGGAGCGGCTGGCGACAACTCTGCCGCAAGTGGCAGCCATACCG
+TTCAGTTCCGAGCGGCAATACATGGCCACCCTGCATCGCGACGGGACGGATCATGTGGTGCTGGCCAAGG
+GTGCTGTGGAGCGCATGCTCGACCTGTGCGGCACCGAGATGGGCGCCGACGGCGCATTGCGGCCGCTGGA
+CCGCGCCACCGTGTTGCGTGCCACCGAAATGTTGACTTCCCGGGGGTTGCGGGTGCTGGCAACCGGGATG
+GGTGCCGGCGCCGGCACTCCCGACGACTTCGACGAAAACGTGATACCGGGTTCGCTGGCGCTGACCGGCC
+TGCAAGCGATGAGCGATCCACCACGAGCGGCCGCGGCATCGGCGGTGGCGGCCTGCCACAGTGCCGGCAT
+TGCGGTAAAAATGATTACCGGTGACCACGCGGGCACCGCCACGGCGATCGCAACCGAGGTGGGGTTGCTC
+GACAACACTGAACCGGCGGCAGGCTCGGTCCTGACGGGTGCCGAGCTGGCCGCGCTGAGCGCAGACCAGT
+ACCCGGAGGCCGTGGATACAGCCAGCGTGTTTGCCAGGGTCTCTCCCGAGCAGAAGCTGCGGTTGGTGCA
+AGCATTGCAGGCCAGGGGGCACGTCGTCGCGATGACCGGCGACGGCGTCAACGACGCCCCGGCCTTGCGT
+CAGGCCAACATTGGCGTCGCGATGGGCCGCGGTGGCACCGAGGTCGCCAAGGATGCCGCCGACATGGTGT
+TGACCGACGACGACTTCGCCACCATCGAAGCCGCGGTCGAGGAAGGCCGCGGCGTATTCGACAATCTGAC
+CAAGTTCATCACCTGGACGCTGCCCACCAACCTCGGTGAGGGCCTAGTGATCTTGGCCGCCATCGCTGTT
+GGCGTCGCCTTGCCGATTCTGCCCACCCAAATTCTGTGGATCAACATGACCACAGCGATCGCGCTCGGAC
+TCATGCTCGCGTTCGAGCCCAAGGAGGCCGGAATCATGACCCGGCCACCGCGCGACCCCGACCAACCGCT
+GCTGACCGGCTGGCTTGTCAGGCGGACTCTTCTGGTTTCCACCTTGCTCGTCGCCAGCGCGTGGTGGCTG
+TTTGCATGGGAGCTCGACAATGGCGCGGGCCTGCATGAGGCGCGCACGGCGGCGCTGAACCTGTTCGTCG
+TCGTCGAGGCGTTCTATCTGTTCAGCTGCCGGTCGCTGACCCGATCGGCCTGGCGGCTCGGCATGTTCGC
+CAACCGCTGGATCATCCTCGGCGTCAGTGCGCAGGCCATCGCGCAATTCGCGATCACATATCTACCCGCG
+ATGAATATGGTGTTCGACACCGCGCCAATCGATATCGGGGTGTGGGTGCGCATATTCGCTGTCGCGACCG
+CAATCACGATTGTGGTGGCCACCGACACGCTGCTGCCGAGAATACGGGCGCAACCGCCATGATGCCCCGT
+CCGTGAGTACGGTGTGCGTGCGGTCGATCCGGCCAGAGTTACCAGGTCGGAACTAGCCAGTTACGTTGTA
+CTCGTGCGGTTCTCGTAGTCAACCAAGCGTGCCTGCAGTTCGGCGTACGGTACGGACCGTGGCAGCTGCT
+CTCCGTCGCGCACGGCCCGAGCCGCGTGGGCCGCTGCATACAACCCCGCGCTGTAGGGCACTGAACCGGT
+TGACACCCGGGCCACCCCGAGCTCACCAAGGTCGGCGATCGTCAAGCCGGGCACGGGCAACGTGTTAACC
+GGGCACGGAATGTTGCGAGTGAGCTCAGCAAGTTCGTCGGGATCGTTGGCCAGTGGGACAAAGACGCCGT
+CGGCGCCGGCATCGACGTAGCGAAGTGCGCGCTGGATCGTGCTGGTGGTATCGGCGTGCTGGCGCAACCA
+ATAGGTGTCGACGCGGGCGTTGACGAACACCTCGGGGTTACGTTGTTTGATCGCAACGATTTTAGCGGCT
+GCCAGGGCGGGGTCGATGAGCTTTTCGGCGCTACTGTCCTCGATATTGATTCCGGCTGTCGACAGTTGTG
+CGACGTAGTCAGCAATGGCGTCGGGTTCGTCGCTGTATCCGTCCTCGATGTCGACGCTGACGTAGCATTG
+CAGCGGTGCCAGGGCGGCCGCCAGTGCGATGTTGGCGCCGCGAGTGGCGCGGTGCCCGTCCGGGTGCCCG
+CCGCTGGACGAGACCCCGAAACTGGTTGTGCCGATAGCCGTGAAGCCCTCCGCGAGGTAGGCCAGGGCCG
+ACGGCACATCCCAGGCGTTGGGCAACACGAACGGAACACCTTGGTGATGAAGATCGTGGAAACTCATTCC
+CTACCTCCCTGCTGGCGGATGGGCCTGATTGTATGTGTGACCCGCGTCAGCAGGGTCAGTCGGTGAGACC
+CGTCGCCGCTGGCCGATTCAACTAGGTTGCGGACGGATGACCACTTCGTTGGGTATCACCAGAATCAGTC
+TGTCGTGCTCGACGAGTGATGATGCGGCGCACACCGTATGCCGCCACACCGACACCGAGCACCGCGGCCC
+CGGCGGCCACCGAGGAGAGTGGCAGCGCGAACGCCAGGACTACGCAGCCGATCAGTCCCACCAGCGGAAT
+CAGGCGGCGGGGCCGGCCCTCGTCGAGCCCCAGAGTCAAGGCGGAGGCGTTGGCGATCGCGTAGTAGACC
+AGCACACCGAAGGACGAAAAGCCGATCGCACCACGGATATCCGCTGTCGCCGCCAGCGCCGCCACCACCG
+CGCCAACCACCAGTTCGGCACGAAAGGGCACCTTGAACCTAGGGTGCACGGCGGCCAGCCAGCGCGGTAG
+GTGCCGGTCGCGTGCCATCGCCAAGGTGGTGCGGGAGACCCCGAGAATCAAGGCCAGTAGCGAGCCCAAT
+GCGGCCACCGCGGCCCCTATCTGCACGACGGGAATCAGCCAGTTCACCCCCGCGACCCTCATGGCCTCCG
+ACAACGGGGCGGCGGCCCGCGCGAGCCGCTGCGGACCCAACACAGCGATCACGGCCACGGCGACCAGGGC
+ATACACCGCCAGGGTGATGCCCAGCGCCAGCGGGATGGCGCGTGGGATCGTGCGGGCCGGGTCGCGGACC
+TCCTCCCCCAGCGTGGCGATGCGGGCATAGCCGGCGAACGCGAAAAACAGCAGGCCGGCCGCCTGCAGCA
+TCCCCCAGACGTGTGCATCTACACCGATATCGAGTCGCGCCGGGTCCGCAGCGCCGGAGCCATAGGCGGC
+GACCACGACTGCGGTCAAGACCACCAACACCACGGCGACGATCGACCGGGTGAGCCAGGCGGACTTCTGT
+ATCCCGGCGTAGTTCACCGCGGTCAGTGCCACCACCACGGCGACGGCCACCGCGTGCGCTTGCGCGGGCC
+ACACATAGAAGCCGACCGTCAACGCCATCGCCGCACACGATGCCGTCTTGCCGACCACAAAGCCCCAGCC
+CGCCAGGTATCCCCAGAAGTCGCCCAGCCGCATCCGGCCATACACATAGGTGCCCCCCGAGGCCGGGTAG
+CGCGCGGCCAGCCGCGCCGACGAGATCGCATTGCAGTAGGCCACCACCGCGGCCACTGCCAACCCGAGCA
+ACAACCCAGAACCGGCCGCGTACGCGGCCGGGGCCAGGGCGGCAAAGATTCCGGCACCGATCATGGACCC
+AAGCCCGATCACCACCGCATCCAAGAGCCCCAGCCGTCGCCGCAGCTCATCTGGAATATCGCGTGGGTCT
+AGCGGGCGTCTCATGCCTCGATAAGGCTACGGCATCCGATATCGGTATACGATATCTACCCGGAATTTGA
+CGCCCGAGACCCGCATGCGTCCAGGGTTTGTGGGTTTGGGGTTTGGTCAGTGGCCGGTCTACGTTGTTCG
+CTGGCCTAAACTCCACCTGACGCCGCGGCAGCGAAAGCGTGTCTTGCATCGGCGACGATTGCTCACCGAT
+CGCCCGATTTCGTTGTCACAAATTCCAATCCGCACAGGAGGGCCCATGAACGACCCGTGGCCCAGGCCAA
+CGCAAGGGCCGGCGAAAACCATCGAAACCGACTACCTGGTGATAGGTGCCGGAGCGATGGGAATGGCATT
+CACGGATACCCTCATCACCGAGTCCGGTGCGCGCGTCGTCATGATCGACCGCGCATGTCAACCTGGTGGA
+CATTGGACCACCGCCTACCCGTTCGTGCGGCTACACCAGCCATCGGCCTATTACGGCGTCAACTCAAGGG
+CACTAGGCAACAACACCATTGACCTCGTCGGTTGGAACCAGGGACTGAACGAACTGGCACCAGTCGGCGA
+GATATGCGCCTACTTCGATGCTGTATTGCAGCAGCAACTGCTCCCCACCGGGCGGGTTGACTACTTCCCG
+ATGAGCGAATACCTGGGCGACGGCCGGTTCCGGACACTGGCAGGCACCGAATACGTCGTCACCGTCAATC
+GGCGCATCGTCGATGCCACCTACCTGCGTGCCGTCGTACCGTCGATGCGGCCGGCGCCGTACTCGGTTGC
+ACCCGGCGTCGACTGCGTCGCTCCAAACGAACTGCCCAAACTCGGCACCCGGGATCGCTACGTGGTCGTC
+GGTGCCGGCAAGACCGGCATGGACGTCTGCCTATGGTTGCTCCGAAACGACGTCTGCCCTGACAAGCTGA
+CCTGGATCATGCCGCGTGATTCCTGGCTGATCGACCGAGCGACGCTGCAGCCCGGGCCCACATTCGTCAG
+GCAGTTCAGGGAAAGCTACGGTGCGACTCTCGAGGCCATCGGGGCCGCGACCTCGACCGACGATCTGTTC
+GACCGACTAGAGACCGCCGGAACCCTGCTGCGCATCGACCCCTCGGTGCGTCCGAGCATGTATCGCTGCG
+CCACTGTGTCGCACCTCGAACTCGAGCAGCTGCGCCGTATCCGCGACATCGTCAGGATGGGCCACGTCCA
+ACGCATCGAGCCCACCACGATAGTGCTCGACGGCGGATCGGTTCCCGCCACACCCACGGCCCTCTATATT
+GACTGCACCGCCGATGGAGCACCACAACGTCCAGCCAAGCCGGTTTTCGACGCAGACCACCTAACCCTGC
+AAGCCGTGCGCGGATGCCAACAGGTGTTCAGCGCCGCGTTTATCGCGCACGTCGAATTCGCCTACGAGGA
+CGACGCGGTGAAAAACGAACTCTGTACCCCGATTCCACACCCGGACTGCGATCTGGACTGGATGCGTCTG
+ATGCACTCCGATCTAGGCAACTTTCAGCGCTGGTTAAACGACCCCGATCTGACGGACTGGCTGAGCTCGG
+CGCGGTTGAACTTGCTCGCCGACCTGCTGCCGCCGTTGTCTCACAAGCCGCGGGTGCGCGAGCGGGTGGT
+GTCGATGTTCCAAAAGAGGTTGGGCACCGCCGGCGACCAGCTAGCGAAGCTGCTCGACGCCGCCACCGCA
+ACAACCGAACAACGCTAAGGATCGGCCGTGCACCATAACCGCGATGTCGACTTGGCGCTTGTCGAGCGAC
+CCAGCTCGGGATACGTCTACACAACGGGTTGGCGACTGGCCACAACGGACATCGACGAGCACCAACAACT
+GCGCCTCGACGGTGTCGCGCGCTATATCCAAGAGGTCGGTGCCGAGCATCTCGCCGATGCCCAATTGGCA
+GAGGTCCATCCCCATTGGATTGTCCTGCGCACGGTCATCGATGTCATCAACCCGATTGAGCTACCCAGCG
+ACATCACCTTTCACCGGTGGTGCGCAGCGCTTTCCACCAGGTGGTGCAGCATGCGTGTGCAGCTGCAAGG
+ATCCGCCGGCGGCCACATCGAAACCGAAGGGTTCTGGATCTGCGTGAACAAAGACACCCTGACGCCGTCC
+CGTCTCACCGATGACTGCATCGCACGTTTCGGCAGCACCACCGAAAACCACCGGCTCAAGTGGCGCCCAT
+GGCTCACCGGGCCGAACATCGATGGTACCGAGACACCATTTCCCTTGCGTCGCACGGATATTGACCCGTT
+CGAGCATGTCAACAACACCATCTACTGGCACGGTGTGCACGAAATACTCTGCCAGATACCCACCCTGACG
+GCACCCTACCGCGCCGTGCTCGAGTACCGCAGCCCCATCAAGTCCGGCGAACCGCTGACCATTCGTTACG
+AGCAGCACGACGACGTCGTGCGCATGCACTTCGTCGTCGGCGACGACGTGCGCGCGGCAGCGCTGCTGCG
+CAGGCTATAACCGTCTGGACGAATCGGCGGTATGCCGACCACCATGAACCAAGGTCCGCAACGCATCGAA
+GCACGAGGAGAATCCATGTCTGGACGGTTGATCGGAAAGGTCGCACTTGTCAGCGGCGGGGCGCGCGGTA
+TGGGTGCATCCCATGTGCGGGCGATGGTGGCCGAAGGCGCAAAGGTTGTGTTCGGCGACATCCTCGACGA
+GGAGGGCAAGGCGGTGGCCGCCGAACTGGCCGATGCGGCCCGCTACGTCCATCTCGACGTTACCCAACCC
+GCGCAATGGACGGCTGCGGTGGACACCGCGGTCACCGCATTCGGTGGCCTGCACGTGCTGGTCAACAACG
+CCGGCATTCTCAACATCGGGACGATCGAGGACTACGCCCTCACCGAATGGCAGCGCATCCTCGATGTCAA
+CCTGACCGGAGTCTTCCTGGGCATCCGCGCTGTCGTCAAGCCAATGAAAGAGGCTGGTCGCGGCTCCATC
+ATCAACATTTCGTCGATCGAGGGGCTGGCCGGCACGGTTGCTTGTCATGGCTATACCGCCACCAAGTTCG
+CCGTGCGGGGGCTGACCAAGTCCACCGCTCTCGAGTTGGGGCCCAGCGGAATTCGAGTCAACTCGATTCA
+CCCTGGGTTGGTCAAGACGCCGATGACTGACTGGGTCCCCGAAGACATCTTCCAGACCGCGCTGGGCCGC
+GCGGCCGAACCCGTGGAAGTGTCCAACCTCGTCGTCTACCTGGCCAGCGATGAGTCGAGCTATTCCACCG
+GCGCGGAATTTGTGGTCGACGGCGGGACCGTAGCTGGCCTGGCACACAACGACTTCGGTGCCGTCGAGGT
+GTCCTCGCAGCCGGAATGGGTGACGTAAACGCCGATTGGCAGGCAATGCCCGACCGGTCTGGCGATGACG
+ATCGCGTCCGCGCTCAACCGCAATCGGATACCCAGCCGGCCTGTCCCGCACCCGGCCCAAGGAACGGCGT
+CGTGGTGGCTATTCCGACTCGAGTGGGTGATCATCCTTAGGCTCGTGCGCTTGGTCGACCGCCGAGATAG
+CAACGAAGCCGGCGCCGGCTTGGATACCGTCATGGGCGGCTTCGATGTCGTACCGGGCGAGTCCCGGCGG
+TTGGTGCAGCGTGCAGCGGCGGGCGATGACCCGGAATCCCGAGTCTGCGAGCAGTTGTTCGAGTTCGGCC
+GCGGTGTAGAAGCGGGCGTCGCGGTAGCCTGGCTGTCCGCGGGCCGCGCGCAGAGCGTACAGGTCGGCCC
+ACGGTGTCCCGCGAGGCAAGAACCCGATAACAAGGCCGCCGCCGTCGGCGAGCAGACGCCGCGTTTCCCG
+GAATATGGCGGCCGGGTCGGTGACGAAACAGAGCGTGAATGCCATGAGGACCGCCCCGAAGTGCCGGCTG
+ACGAAAGGGACCGCCTCGCCGACGGCATTGGCGACCAGGACGCCGCGCCGGCGTGCGAACATCAGCGCAT
+CACGGGATGGATCGAGTCCGAACCGCACGCCGAGCAGGTCGGCGAAACGTCCTGTACCGACACCGATTTC
+CAAGCGTGGCTGGGCAAAGACCTCGATGAGCGGCCGCAACGCGGCGACCTCGGTCGCCAGGATCGGCCGC
+CCGGTGGGTGAGTCATACCAGGCGTCGTAGGCCGCCGCGTCGCGCCCGGCGGCCGACGATGCCGGCATCC
+GGGTGTCAGGCGTCACCGCGAGCTGATTCCAGCAACAATCGGCGTTCGGCGGCCGCGACCGACCCCGGGG
+TAGCAGCAATCGCGCCCGAATGGACCGACACTGAGGTGATTCCCATCCGGACCAGATGCTCGGCGAAAGT
+CGGGTTGCCCGAGAGCGCTTGACCACACAGCGACGATGTGCTGCTGACAGTGATGGTTGGCATCGGTTTT
+CCTTTCGGCGTTCTCAGATCGCGCTGCGCCAGATGTGGTAGGCCTGTCCCACGGAGCGCTCACGCGGCCC
+CGCCGTGTCGATCCGGTGCCCGGTGTCCCAGTCCGCTTGCCGGGCGGCCAAGGCCGCCGCGATCTCGGCG
+GTGGCGTCGGAGTTGCCCCCGGCTCTAGCAACGATTCTGTCGGCCATCACGTCAACCGTCGCCGAACACC
+TGAATTCGACAATCGCCGAGTGCGTGTCCGCCGCGAGACGCCGGGCGCAGGCGCGCATCTGCGGATCACC
+CCAGGTACCGTCGAGGATCACTGAGTGCCCACTACCCAAGAGCAGGCGGGCTTTGCGCAGCGCCTCCTGG
+TAGACCGCCACAACGTTGGCACGACTGTAGAGCCCGGAGTCCAAAACGCCGGGCTCCCCGGTGATTACTC
+CGCAATCGCGTAGCCGCCGGCGCACATCGTCGGTTGAGATCACCTGCGCCCCCACCAGTTCGGCGACCCC
+GCGGGCCAGGGTCGACTTGCCGGTGCCCGGATTGCCACCGACCAGCGCCAACCGGACCGTAGCGTGCTGT
+AGGTGTTGGGTGGCGATGATCAGGTGGCGCACGGCGTCCGCAGCGGCCTCCGGTTTGCCCTGGGAGAATC
+GCACGCACTCGACTTTCGCGCGCACCACCGCGCGATAAGCAATGTAGAAGTCGCGCAGCGACGCCGGGGC
+GGTATCACCCGAACGCACCGCATAGCCGGCCAGGAAGTAGTCCCCAAGATCTTTGCGGCCCAAGAACTCC
+AGATCCATGGCCAAAAAGGCGGCGTCGTCGATGCGGTCGAGGTAGCGAAGCTCGTCTTCGAACTCCAAGC
+AATCCAGCAGCGCCGGTTCGCCATCCACCAAGAAGATGTCATCGGCCAGTAGATCCGCGTGGCCGTCTAC
+AATACAACCTTCTTTGATCCGGCCGGCGAACAAAACCTCGCGCCCGGAAACGAATTCGTCGACCATGTGT
+TCAATCCGCCGAATCACATCCCCGGAGACCACTTTGTCCGCGTGGTGGCGAAGTTCGGCCAGGTTTTCGT
+GCCAACGCCGCGCCACCGCACCGACCTCGCCTTGAGTATCGATGCACCGGTTACGCTGTGCGCGCTGGTG
+AAACCGGGCCAACACCTCAGCGATCGCGTCCAGGGCACCCTCGACCGGCAGGCCGGCGGTCACCATCGAC
+GCCAGCCGCTGCTTGTCGCGGTAACGCCGCATGACGACGACCGGTTCGGCGTGCCCGCCGCTTGGATCGC
+TGAGATGGGCAATGCCCAAGTAGCTCTGCGCGGCCAGCCGACTATTCAACTCGAATTCCCGGATACAGGC
+GCGCTCACGCTGTTCCGCCGTGCGGAAGTCGCAGAAATCCGTCACCACAGGCTTTTTCGCCTTGAACGCC
+CGGTCGCCGGCCAACACAACCACTGCGGTGTGGGTTTCGCGCACATCGATGAAAGGCTCATCTGTCACAG
+GATGGGCGTCACACGTGCCGTCGTTGGTCGGTGAGTCCATGGCGGTAGCCAAGCCAAGTAGTCACGACTG
+CCGTGCCACGATCACTGGCACCCGCGCGGCGTGTAAGACCGCGTTACTGACCGACCCCAGAAGCATGCCG
+GTCAAGCCACCTCGGCCATGACTGCCAACGACGACAAGCTGGGCGGACGCCGACTTTTGCACCAGCTTCC
+GCGCCGGGCGATCGCAAACGACAACCCGGCTCACCGGCACATCGGGATAGCGTTCTTGCCAACCTGCCAA
+GCGTTCGGCGAGACTAAGCTCCGCTTCCTGCTGTACAGCCGAGAAGTCCAAACCCGGAAGTTCCACCACT
+TCGACGTCACTCCACGCGTGCACGGCGATCAGTTCGACGCCGCGGCGCGACGCCTCGTCAAATGCCACCG
+CCGTCGCAAGCTCCGAAACCGGCGAACCGTCGATTCCCACCAGCACGGGAGCGTGCTGCGGATCAGGGAT
+CACCGCATCATCGCTGTGGATGACCGCGACCGGGCACCCGGCGCGTCGCACCAGGCTCGAGCTGACCGAA
+CCGAGCAAGCCTCGGGCCAGCGCTCCCCGGCCCGAGCTGCCCAACACCACCATCTCTGCCTCGTTGGAGA
+TTTCAACCATGGTAGGTACCGGCGTGGAAAATACGAGCTCGCTCTTTACGCTGAGCTTTCGATCCGCTCC
+AACCGCCTCTTTGGCGAGCTTGACGGCGTTGGCGACGATCTGGCGACCCTCGTCCTCCTGCCAAACCCCC
+CAGGTCTCCGGATACGGCATCGGCGGCCACGTCGCTACATCGGCGTTCACCACGTGGACCACGGTCAGCG
+GAATGTTCCTCATCGCCGCATCGGTGGCACCCCAACAGGCGGCGGCATCCGATTCGAGCGAACCATCTAC
+CCCGACGACAACTCCGTGCTGCTTGCGGGGTTTAGACATCTCATTCTCCCTTCGCCTCGAGCAACGCTAT
+GAACCGGGACAGTCACCGGTCATGAGGCTTTAGTCCCCAATCGGACGGCCAACCGACCATGATTGGATTC
+GACGCCCGAATCCAGGCGTGCGCTGTGGCATCGTCGTCAATGTGACCGGACCGCCGCCCACCATCGACCG
+GCGCTACCACGACGCTGTCATCGTCGGCCTCGACAACGTGGTCGACAAGGCCACGCGAGTGCACGCCGCG
+GCATGGACGAAGTTCTTGGATGACTACCTCACCCGACGACCCCAGCGGACCGGCGAAGACCATTGCCCCC
+TCACCCACGACGACTACCGCCGCTTCTTGGCCGGCAAACCCGACAGTGTAGCCGACTTCTTGGCCGCCCG
+CGGAATCAGGCTGCCGCCGGGCTCCCCGACTGATCTCACCGACGACACCGTGTACGGGCTGCAAAACCTC
+GAGCGCCAGACATTCCTGCAACTGTTGAACACCGGTGTCCCCGAGGGCAAGTCGATTGCCTCGTTCGCAC
+GTCGGCTGCAGGTTGCCGGTGTCCGCGTGGCCGCCCACACCTCCCACCGTAACTACGGGCACACGCTGGA
+TGCCACCGGCCTGGCAGAAGTGTTTGCCGTCTTTGTCGACGGCGCCGTCACCGCCGAGCTCGGGCTACCG
+GCCGAGCCTAACCCGGCCGGCCTGATCGAGACGGCGAAGCGGCTGGGAGCAAACCCCGGTCGCTGTGTGG
+TCATCGACAGCTGCCAGACCGGTCTGCGCGCCGGCCGGAACGGCGGATTCGCGCTGGTGATTGCCGTCGA
+CGCGCACGGCGATGCCGAGAACCTGCTGTCCAGCGGAGCCGACGCCGTGGTCGCAGACCTGGCCGCTGTC
+ACGGTGGGAAGCGGCGACGCCGCCATCTCCACGATTCCCGACGCCCTGCAGGTCTACAGCCAATTGAAAA
+GACTACTGACCGGCCGACGACCAGCGGTGTTTCTCGATTTCGACGGCACGTTATCCGATATCGTCGAGCG
+CCCCGAAGCGGCAACGCTCGTCGACGGCGCAGCAGAAGCGTTGCGAGCGCTGGCGGCCCAGTGTCCGGTG
+GCGGTGATAAGCGGACGCGACCTGGCCGACGTTCGCAACCGGGTCAAAGTCGACGGGCTGTGGCTGGCCG
+GCAGCCACGGCTTCGAATTAGTGGCGCCAGACGGCAGCCATCACCAAAACGCCGCCGCCACTGCCGCTAT
+CGACGGATTGGCCGAGGCGGCAGCGCAATTGGCCGACGCACTCCGCGAAATCGCCGGAGCAGTAGTGGAA
+CACAAACGCTTCGCAGTCGCAGTGCACTATCGCAACGTTGCCGACGACAGCGTCGACAACCTGATTGCGG
+CGGTGCGCCGACTCGGACACGCAGCAGGGCTGCGTGTCACCACCGGCCGCAAAGTCGTCGAGCTTCGCCC
+GGATATAGCCTGGGACAAGGGCAAAGCACTCGATTGGATCGGTGAGCGGCTCGGCCCGGCCGAAGTCGGC
+CCCGACCTACGGTTGCCGATCTACATCGGCGACGACCTTACCGACGAAGATGCCTTTGATGCCGTGCGTT
+TCACCGGTGTCGGGATTGTGGTGCGCCACAACGAACACGGTGATCGACGGTCTGCCGCTACCTTTCGTCT
+CGAATGTCCTTACACCGTTTGCCAATTCCTCTCCCAGCTGGCTTGCGATCTGCAGGAGGCAGTGCAGCAC
+GACGATCCGTGGACTCTGGTCTTCCACGGCTACGACCCCGGCCAGGAGCGGCTGCGTGAAGCGCTGTGCG
+CGGTGGGCAACGGCTACCTGGGTTCGCGGGGCTGCGCACCCGAATCAGCGGAAAGCGAGGCACATTACCC
+GGGCACCTATGTGGCCGGGGTGTACAACCAGCTCACTGACCACATCGAAGGGTGCACCGTTGACAACGAA
+AGCCTGGTCAACCTCCCCAACTGGTTGTCGCTGACCTTCCGTATCGACGGCGGAGCATGGTTCAACGTCG
+ATACGGTCGAGTTGTTGTCCTACCGGCAGACGTTCGACCTACGCCGTGCCACGTTGACCCGCAGCTTGCG
+ATTCCGAGACGCCGGCGGACGAGTGACCACGATGACCCAGGAGCGGTTCGCGTCCATGAACCGGCCCAAC
+CTGGTCGCACTGCAAACTCGGATTGAATCCGAAAATTGGTCGGGCACAGTTGATTTCCGGTCACTAGTCG
+ACGGAGGTGTGCATAACACCCTGGTGGACCGCTATCGGCAACTATCCAGCCAACACCTTACCACCGCCGA
+GATAGAAGTCCTGGCGGACTCGGTGTTGTTGCGCACCCAGACGTCGCAATCGGGTATCGCGATCGCGGTC
+GCCGCTCGCAGTACCCTGTGGCGCGATGGCCAACGGGTCGACGCGCAATATCGGGTCGCCAGGGACACCA
+ACCGCGGCGGCCATGACATCCAGGTCACCCTGTCAGCGGGGCAATCGGTCACGCTGGAAAAGGTCGCGAC
+GATCTTCACGAGCCGGGACGCCGCGACATTGACAGCGGCAATAAGCGCACAGCGCTGTCTAGGTGAGGCC
+GGTCGCTATGCCGAGCTCTGTCAACAGCACGTCCGCGCGTGGGCACGGCTGTGGGAACGATGCGCCATCG
+ATTTGACCGGCAACACCGAGGAATTGCGGCTCGTGCGACTGCACCTACTGCACCTGCTACAGACCATTTC
+GCCGCATACCGCTGAGCTCGACGCCGGGGTCCCAGCGCGCGGGCTGAACGGAGAGGCCTACCGCGGGCAT
+GTCTTCTGGGATGCGCTGTTCGTCGCTCCGGTGCTCAGCCTGCGGATGCCGAAGGTGGCGCGATCGCTGC
+TGGACTATCGGTACCGACGACTACCCGCGGCCCGCCGAGCGGCGCACCGGGCGGGCCACCTTGGCGCGAT
+GTATCCCTGGCAGTCGGGCAGCGACGGAAGCGAAGTGAGTCAGCAGCTGCACCTCAATCCACGGTCCGGG
+CGGTGGACTCCCGATCCCAGTGATCGTGCCCATCACGTCGGTCTAGCGGTTGCCTACAACGCGTGGCACT
+ACTACCAAGTGACCGGTGACCGCCAGTATCTCGTCGACTGCGGGGCAGAGCTGCTGGTTGAGATCGCACG
+CTTCTGGGTAGGCCTGGCCAAGTTGGATGACAGTCGCGGCCGCTACCTGATCCGGGGAGTAATCGGTCCC
+GACGAATTCCATTCGGGGTATCCCGGCAACGAGTACGACGGAATAGACAACAATGCGTACACCAACGTGA
+TGGCGGTATGGGTGATCCTGCGGGCAATGGAGGCGCTGGACCTGCTACCGCTGACCGATCGCCGCCATCT
+GATCGAAAAGCTCGGGCTGACAACGCAGGAGCGCGACCAATGGGACGACGTGAGCCGACGCATGTTCGTT
+CCATTCCACGACGGCGTGATCAGCCAGTTCGAGGGCTATTCGGAACTGGCGGAACTGGATTGGGATCACT
+ATCGGCACCGATACGGAAACATCCAACGACTCGACCGGATCCTGGAAGCCGAGGGCGACAGCGTGAACAA
+CTACCAGGCGTCCAAGCAAGCCGACGCGCTGATGCTGCTCTACCTGCTGTCTTCCGACGAGCTGATCGGC
+CTGTTGGCCCGGCTTGGCTACCGCTTCGCGCCCACACAAATCCCAGGCACCGTGGATTACTATCTTGCCC
+GCACCTCGGATGGATCTACCCTGAGCGCTGTCGTGCATGCGTGGGTTCTCGCCCGCGCCAACCGGAGCAA
+TGCCATGGAGTACTTCCGTCAGGTCCTGCGCTCCGATATCGCCGACGTCCAGGGCGGCACAACCCAGGAA
+GGAATTCACCTGGCGGCCATGGCTGGCAGCATCGACCTGCCGCAGCGTTGCTATTCCGGATTGGAACTGC
+GCGACGACCGGCTGGTGTTGAGCCCGCAATGGCCGGAAGCACTTGGACCACTTGAGTTTCCGTTTGTGTA
+CCGCCGCCACCAGCTGAGCCTGCGAATCAGTGGCCGAAGCGCCACATTGACCGCAGAAAGTGGAGACGCC
+GAGCCAATTGAGGTCGAATGCCGTGGCCACGTGCAGCGGCTACGGTGCGGGCACACCATCGAAGTCGGTT
+GCAGCAGGTGACCAATGTCGCACATGGTGGGTCGACGATCTCTCCTGGAAAGGACGGCCGGCCGCGGTCT
+CCCTTATTGCGTTGGGTGTTGTGTGCTCGTCGCCTGCGACTAAGGGCACTCCACCGGGATAGCCGCGACC
+AGAGGCGTGTCGACTCCGATCGGGCCCACCGCTGCGGCACCACCCGGCGAACCCAGCGGAGCCACTCGGC
+CCGGCAGGACTTGGTGGAAAAAGGCGGCGTTGTCCCCCAGATGCTGGTGTTGATCGTCGGGTAGATCGCC
+TTCCCAGTAGATCGCCTCGACGCGGCAGGCCGGTTTGCACGCACCACAATCCACGCACTCGTCGGGGTTG
+ATGTAGAGCATTCGGGCGCCCTCATAGATACAGTCGACCGGACACTCCTGCACACAGGACTTGTCCATCA
+CATCCACGCACTCACTACCGATCACATAGGTCACAAACGGCAAGCTACCGGCCCGATGCCGAGGATCGCG
+CCTATCCAAAGACCCCTACCGGAAAGGACCAAAGGCCTTATTCGTCAAGTTCGTCACTGGCACGTCGACG
+CGGGGTGCAAGAAAACCGGGGCGGTTCACCCGACCGCCAGCGGGATTCACGCTCCCCCAGGCCATAAACT
+TACGATAGCCCGTCATTTCAAGAGCGCGAGAAGTTCATCGACACTCCCGGTGGTCAAGATCTGATCCGCG
+GGAACCGCAACGACCGTGTCGCTCAAGGGAAAGCGGTGTTCGCCAGGGTAGACGATTGCCAACCTCGCCA
+GTTGGAGGTCGACAAGAGCCGAGCGCATCGACCGGGAAATCGACGGTGTAGACGTCCGCTTGATCTCGAA
+TCCATAGGGACGGCCAGATAATTCGACATAGAGATCGAGTTCGGCGTCTTGCTGGGTGCGCCAGTAATAC
+AGCGGATTCGGGGCGAGCAGGGCCGCAAGCTGCTCGAGCACGAACCCCTCCCAGCTCGCGCCGAGCTTCG
+GATTGCGTTCGAGGGCAAGCCGATCGTCGATACCGAGCAACCTGTGCAACAAACCGGTGTCCCGGATGTA
+GATCTTGGGTGATCGGCGTTGTCGCTTTCCGATGTTGGCGAACCAGGGCGTCAGCTGACGGACGACGAGT
+GCATCGGTGAGCGCATCGAGGTATCGCCGCGCCGTCGTCTGAGCAACGTCGAGTGAGCGGGCAAGTTCTG
+CGCCGCTGAAGAGCTGGCCATGGTAGTGGGCGAGCATCGTCCACGCGCGCCGCATCGTCGCGGCCGGAAT
+GCGCACACCAAGCTGGGCGAGATCGCGCTCCAGAAACGTGGTGATGTAGCCGTCGCGCCACGCCGCGGAG
+TCCTCGTTGGAGCGTGCCGTGAACGAGGGCGGTAGACCCCCACGCAACCAGAGGCGATCGGCGGCCGAGG
+ATCCGACGTCGCGGACCGTCAGGCCGGACAACTCCACCAACTCGACGCGTCCGGCCAAACTTTCGGACGC
+CAGCCCGACAAGATCGGGTGAGGCGCTACCCAGGATAAGAAACCGGGCCGGCATGACAGGCCTGTCGACG
+AGCACGCGTAGGACCGGAAACAGATCCGGAATCCGTTGCGCCTCGTCGATCGTGATCAACCCGCTAAGGC
+CGGATAAAGCCAACATCGGGTCGGCAAGCCGTGTCGCGTCGACGGGATTTTCGGCGTCAAACGTACATTC
+GGGTGCGGACTTGCCCACCAGCCGGCTAAGGGTGGTCTTGCCGGCTTGACGAGGTCCGGTAAGCAACACC
+ACCGGCGCTCGGTGTAGCGCGCGTCGCAACCGCGCGGCGGCGTCGCGGCGTTCGATCAACATGCATGAAA
+TTCTAGCGGTAGGCGCTGATATTTCATGGTTAGCCGCCCCCGGGAGACTCGGTGGTGGGTCCCACACGCC
+TAGAAAGTCGCCGGCGATAACGACCGGCCAGGTCAGCGGGGTTGGCCGCAGCCCGATAAGGCTCTCGATC
+TCGTCCATCAGGCATGCTCCACATCGCCTGCACCAGGGCAAAGCTGCACCGGTCGTGCGAGCCGGTTAGC
+AAATAGCACGTTCATACACATAAATGTGTATAGTGGTGTTGTGTCACGGACCAACATCGAGATCGACGAC
+GAACTCGTGGCCGCCGCACAGCGGATGTACCGACTCGATTCCAAGCGAAGTGCCGTCGACCTCGCGCTGC
+GCCGGCTCGTGGGTGAACCGTTGGGCCGCGATGAGGCTTTGGCGCTGCAGGGCAGCGGTTTCGACTTCAG
+CGACGATGAGATCGAATCGTTCTCGGATACGGACCGCAAGCTCGCCGACGAGTCGTAGATGATCGTCGAC
+ACCTCGGTCTGGATCGCATATCTCTCCACGTCAGAGTCGTTGGCCAGTCGCTGGCTAGCCGATCGCATTG
+CCGCTGACTCGACGGTGATCGTGCCCGAGGTGGTGATGATGGAGCTGCTGATCGGTAAGACCGATGAGGA
+CACCGCCGCACTGCGCCGACGGCTCCTGCAGCGATTCGCTATCGAACCGCTGGCCCCGGTCCGCGACGCG
+GAAGATGCCGCCGCCATTCACCGGCGCTGTCGTCGCGGCGGCGACACCGTACGCAGCCTGATCGATTGCC
+AGGTGGCCGCGATGGCGTTGCGGATCGGGGTCGCCGTGGCGCATCGTGATCGCGACTACGAGGCGATCCG
+CACACATTGCGGACTACGCACCGAGCCGTTGTTCTGACTGCGGACACCCGGACGATTTCGTGTCTCACAT
+CTGACCCGTGGCCGTCGTCGTCCGCCGCCGGGTACATCGACATAGTGGACCAGGGAACATCGCCAGCGCA
+TGAGTGAGCGCGGATACCACCCGGTCCGGGGACGCGTTGGCGCTGGCCGAAGCCGACCGGCCCAGCGATG
+ACATCGACTTCAAGGACGTTCGGCTTTCAGCGCGACGATCATCCGCCTCAGGCTGTCGCGGGTCGCTTGC
+AGCGCGGCCGGGTCTACGGCGTCAGCAAGTCGGTTGTTGACGACGATGGCGCGTTCGGTGATTGCCTGGA
+GAACGCGGCGACCATTCTCGGTTAGCACCAGCAGTGGTGATGTGCGGTGGTCGGGGTTGTGTCTGAGCTC
+GGCCAAGCCGCAAACGACCAGATCGTTGGCCACTCGCTGCACCCCCTGACGGGTAACACCAAGGCGGCGA
+GCGGCTTGGGGCACGGTCAGCGCTCGATCGGAGACCACGCTCAGCAGCTGCCATCGCGCCTGCGTGTGCC
+CCTCTCTGGCAGCGACCACCTCACCTGAGCGCCGTAGCAGGCCAGCGAGCTCGAATACGTCTGCTACCAG
+CCGAGCGATCTCATCGGACATCCCGCCTCCAACTTTGACAATATATTGTCATCATGGTTCGATGCTGTCA
+AAATCGAAACGGTCCTGTCGTCGTCGTGAAACCCTTCGCATCGGAGAAAAGATGAGCGCTCCAATTACGA
+ATCTTCAAGCCGCACAGCGTGATGCCATCATGAACCGACCAGCGGTCAACGGCTTCCCCCATCTGGCCGA
+GACGCTGCGCCGCGCCGGTGTCCGAACCAATACCTGGTGGCTACCGGCGATGCAAAGCCTGTACGAGACT
+GATTACGGTCCAGTCCTTGACCAAGGCGTGCCCCTGATCGACGGCGTGGCCGAGGTCCCGGCATTCGACC
+GCACGGCCCTCGTCACTGCGCTGCGCGCCGATCAGGCGGGTCAGACGTCTTTCCGAGAGTTCGCCGCGGC
+AGCCTGGCGAGCCGGTGTGCTCCGCTACGTCGTGGACCTCGAGAACCGCACCTGCACCTACTTCGGCCTG
+CATGATCAGACGTATATGGAGCACTACGCGGCAGTGGAGCCTTCCGGTGGTGCCCCTACGAGTTGAGCTG
+CGCCCGTCGCAGCGACATTCCAGCAGACCGCGACGTCAGTCTTGGGCGGCCTGACTATCGCGATGATCCG
+TCGCCCGCTCATCAACCCGGTTCGTGGTCAAGACTTTTCACCGGGGCGACGTTTCCTGGGGCTAGTAAGG
+CGGTTGCCGATCTTCGTGAAGCGGCGGTGTCCGAGACCCACGACACCAAGGACGTGTTAGCCGCTTTGGC
+CGCGCGCAAGTCCCCGGTGCGACCTTTCTGATGCGATCGACGATGTAGGTGGGATCTCGTGCTCTTCGCA
+CCAGTCGTTGGGATCCTGGGCGATTCCGGACGCTTTGTCGGTGGTGACGCGGTCGATGATCCAGCCTAGC
+GCCGAACCCGAGCCGAGCAGGCAACGCCCGGCCCCAAGTGGTGCGCACCGCCGCCGTGGATCTTGATGGG
+AGCACGCGAAGCTCACTGGTGCACCATCCTTGTGTCGGTGACCTTGGATGGATTGCCGATGCACCCAAGG
+CGCCGCTGGGTTATCGCCCTGCTCGCTCGACAGCCGTGATGTCCACGATGAGTTCTGCGGAGTCCGGCGG
+TAGCCCCGGACGCGCCGACCGTCGACAGGACTGAGCGCCGACGAGCGCCGAACAGTGAGCGGCCCAAACC
+ACTACCCTGCCCGACGAGCCGCGGAACGGCGTCACGGGTGGAATCGATTGGGCGCGAGATGATCACGCGG
+TGTCGATCGTCGATGCGCGTGGGCGCGAGGTTCGCCGCGCCACGATCGAGCACAACGCCGCCGGACTGCG
+CGAGCTGCTCGAGCTGCTGAGCCGGGCCGGTGCCCGCGAGGTCGCCATCGAACGCCCGGACGGCCCGGTC
+GTGGATACCCTGCTCGAGGCCGGGATCACGGTGGTGGTGATCAGCCCCAACCAGCTGAAGAATCTGCGCG
+GTCGTTACGGCTCGGCTGGCAACAAGGACGACCGGTTCGACGCGTTCGTGCTCGCCGACACGTTGCGCAC
+CGACCGGTCCCGGCTGCGCCCCCTGCTGCCCGACACCCCGGCCACGGCCACCCTGCGCCGGACCTGCCGC
+CCCCGCAAAGACCTCGTCGCCCACCGGGTTGCGTTGGCCAATCAGCTGCGCGCGCACCTGCGCGTCGTCT
+TTCCGGGTGTGGTCGGGTTGTTCGCTGACCTTGACTCGCCGATCAGCCTCGCGTTTTTGACGTTTTTGCC
+CCGTTTCGACTGCCAGGACCGCGCGGACTGGCTGTCGGTCAAGCGCCTGGCCGGCTGGCTGGCCGCCGCT
+GGCTACTGCGGCCGTGCTCCACGACCGGCTCACCGGTGCCCCGCGCGGCGCCACCGGTGACGAGGGTGCC
+GCCAACGCCCACATCACCCGGGCCATGGTCGCCGCGCTCACCAGCGTCGCGACCCAGATCAAGACGCTCG
+ACGCGCAGATCGCCGAGCAGCTCTCCTTGCACGCCGACGCGCATATCTTCACCTCCCTGCCCCGCTCCGG
+CACCGTCCGCGCCGCCCGGCTGCTCGCCGAGATCGGGGACTGCCGAGCCCGTTTCCCCACGCCCGAATCG
+TTGGCCTGCCTGGCTGGCGTCGCCCCCTCCACCCGTCAGTCCGGCAAAGTCAAACACGTCGGATTCCGTT
+GGGCCGCAGACAAACAACTCCGCGACGCCGTCTGCGACTTCGCCGGTGACAGCCGCCGAGCCAACCTCTG
+GGCCGCCGACCGCTACAACCGCGCCATCGCCCGAGGACACGACCACCCCCACGCCGTGCGCATCCTGGCC
+CGCGCCTGGCTCTACGCCATCTGGCACTGCTGGCAAGACGGCGCCGCCTACCACCCTGCCAACCATCGCG
+CCCTCCAGGCACTGCTCAACCAAGATCAAGACCGGGCGGCTTGACACACGGCTACTCATCGGCCTAGCGG
+GTGGGCGCCACCAGCGGGTAGCACGAACGAAATCCTTGATGCCCCAAACCGTTTAAGCGTTACTGCAGGG
+TACAGGTACCGAGCGGGACCCGCTGCCGGGCCTAGTTGCTTATCGGTGGTGGTTGCGGCTGGAAGGGTTC
+ATACCACCACCAGTCGGCGCGCTCGCCGGTGGGCCCAGGCCACGGCGCTACCGCCGGCGGCGGCTTCGTC
+GACGCCCGCGCCAACGATCCCGCGCTCAAAGGTCGGCCCGCGCTGTCGGCGACGGTGAGGTTGTCTGCCG
+GTCCGGTAATGGTGATCAGGCCCCGATGGTGTGCCCGGTGGTGATACGGGCACACCAGCACCAGGTTGGC
+CAGCTCGGTGGCCCCACCGTCCTGCCAATGTCGGATGTGGTGGGCGTGCAAACCCCGGGTGGCCCCACAA
+CCGGGAACCACACACGTGCGGTCGCGATGCTCAAGCGCCCGGCGCAACCGACGATTGATCTGACGAGTCG
+TTCGACCGCAGCCAATGACCTGCCCGTCACGTTCGAACCAGGCCTCAAAGGTGGCATCACAGAGCAGATA
+TCGGCGTTCGGACTCGCTGAGCAGCGGACCCAGGTGCAGGCCAGCGGCACGCTCCTGCACGTCTAGATGC
+ATCACCACGGTGGTGTGCTGCCCATGTGGCCGACGAGCCACCTCGGCGTCCCAGCCGGCCTCAACCAGAC
+GCAGAAACGCCTCAACATTGCCCGGCAACGGGGGCCGCTGATCCGACACACCGTCGCTGTTGTCGTGATC
+ACGCTTGTACTCGGCGATCAACGCATCCAGATGAGACTGCAACGCCGCATCGAACTTCGCCGCCTCCACG
+TGCGGAAGCTTGATTCGCCAACAACTGAACTGCTCATCGGCGCTCCTGGTGATCGAGGGCCGCGGTTCCG
+GCCGAAAATCCGGTTCGGGTTCGGGTCGCGGTTCCAACTTGAGCGCGGTCCGCAACTGATTCACCGTGGC
+AACCCCGGCCAACTGCGCATAATGCGCATCCGAACCCTCACCCGCCCGCCCCGCGATCACCCCAACCTGA
+TCCAACGACAACCGCCCCTCCCGCATACCCCGGGCGCAGCGCGGAAACTCCGGCAACCGCCGCGCCACCG
+TGGCGATCGTGTGGGCGTTGCCCGACGAGCAGCCCATCTTCCAGGCCACCAACCCCGCCACCAACCGCGC
+CCCCGTCACACCCCACAACCCGTCGCGATCCAGCTCAGCCACGATCTCCACAATGCGCCCATCAATCGCA
+TTGCGCTGACCGGCCAACTCCGCCAACTCCTCAAACAACACCTCCACACGCTCGGCAGGACTGACTACCG
+CTGCGCCAGACGTCGCGGTCGAGGACATGAGTTCATCATCGCAGCAGGGTCTGACAACTCCGGCCAACCC
+GAATCCACGCCCGGGGCCGTGCCGTCATCACCCCGCAAAGAGATGCTCGGCTCCGGCTCCGCCCCCGCCG
+GGGCCAAGGGCACACGAGACAACGAAATCAGCGAACCCACCATGGAAACGCTCAACGGCGTGGGCCGCGA
+AGCCGGCGAAATGCTGGGAGCAGCTGGTGGACATCGCATAGATAGGCCCCAGACCCAGCCAGCACGGCTC
+CAACCGTCGACGCGCCTAGCTGCAAAATCGCATGCTTGTCAGCGGATACCGGTATATTTTCCGGTATGTT
+TTCAGAGCCTTATCCGACCGATGGCGAAGTCATGACGGAACTCGGCGACAAGTTCCTTGCTGCTCTTGTT
+GGCACCATCAGGGATACGCGCTTCGACATCGCCGACATGCGGAACTGGCGGCCGGGATGGTTTCCGACCA
+TGCATAGCCGGTGTCTGTCCAACCTCATCCACGACAGAATCTGGGCACACCTGGTCACCCTCATCGCGAG
+CAATCCAGGCACCAGCATCAAGGACAAGGGTGCCACCCGCGAGATTGTGGTTGGCGCACACCTGCGGTTG
+CGAATCAAACGCCACCACGCAGGTGACGAGATCAGCACCTACCCGACCCGAACCGCCATCGAATTCTGGC
+AACAGGGCAGCCAGCCCGCCTTCCCGGGGCTGGAAGAGGTTCGCATTGCGGTGGGCTATCGGTGGGACCC
+TGATACCCGCGAGATCGGAGCCCCCCTGCTGTCGCTTCGCGACGGGAAAGATCACGTCATCTGGGTAGTC
+GAACTCGACGAGCCTGCGGCCGGCGTGAAGATCACCTGGACCCCGATCGAGCCGACACTACCGTCCATCG
+ACTTCGGTGACTTGGGTGAAGACTCTGGAGCATCGGGGGAACGATGAACGGCCTGGGAGACGTGCTCGCG
+GTCGCCCGGAAGGCTCGTGGACTCACCCAGATCGAATTGGCCGAGCTGGTGGGACTCACCCAGCCGGCGA
+TCAACCGGTACGAATCAGGCGACCGTGACCCCGACCAACACATCGTGGCCAAGCTGGCCGAAATCCTCGG
+TGTGACCGACGATCTGCTCATACACGGGAACAGGTTTCGAGGTGCGCTCGCAGTCGATGCGCATATGCGC
+CGCCACAAGACCACGAAGGCGTCGGCCTGGCGTCAGCTGGAGGCCCGGTTGAACCTGTTGCGCGTGCACG
+CGTCATTCCTCTTCGAGGAAGTGGCTATCAATAGCGAGCAACATGTGCCCGCGTTCGACCCGGAGTTCAC
+CGCCGCCGAGGACGCCGCCCGGTTAGTCCGTGCCCAGTGGCGCATGCCGATGGGCCCGGTCGTCAACCTG
+ACCCGGTGGATGGAGGCCGCGGGCTGCCTGGTGTTCGAAGAGGACTTCGCCACCCAGCGCATCGACGGGT
+TGTCGCAGTGGGTCGACGACTACCCCGTCATGCTGATCAACGCCAACGCAGCACCCGACCGAAAACGCTT
+GACCCTTGCCCACGAACTCGGCCACCTCGTGCTGCATTCCACCAACCCCACGGAGAACATGGAGACCGAA
+GCCACCGCCTTCGCCGCCGAGTTTCTCATGCCCGAGAGCGAGATTCGGCCCGAGCTGCGTCGGCTCGATC
+TCGGCAAGTTGCTCGAACTGAAACGGGAATGGGGCGTCTCGATGCAAGCCCTCCTGGAGCGGGCATATCG
+CATGGGCCTGGTATCGGCCGAGGCTCGCACCAAGCTCTACAAGGCGATGAACGCGCGCGGCTGGAAAACC
+AAAGAGCCAGGCATCGAGTCCATCGTGCGAGAAAAACCGAGCCTACCCGCCCACATCGGCATGACACTCC
+GAAGCCGCGGATTCACCGACCAGCAAGCCGCCGCCATCGCCGGATACGCCAATCCTGCGGACAATCCATT
+CCGCCCCGAAGGTGGCCGCCTCCATGCGATTTGACTTCCGATTGACGCTGGGTTGTCATGCCGACGGCGC
+CAGGTGCGGTCACACAAGGCGGCCGGAACAGGCATCGATTCTTGGCGACGCCGTTGCTGTACCGATAGCG
+ACTGCCCCGTATCGATCCCAGGGAACGTGACCATGGTCGTAGGGATGACTTGACAGTTTCAACGGGGTGC
+GACCACCGTTGCGCTCAGAAGGCATACGTTGGTGGAACACGTCGGAAAGCTGGGAGGTGAATCTGATGGC
+TGGCGACCAAGAGCTGGAACTGCGGTTCGACGTTCCTCTTTACACGCTTGCCGAGGCATCGCGGTACCTG
+GTGGTTCCCCGCGCCACCCTGGCTACGTGGGCTGACGGCTACGAGCGTCGGCCGGCCAACGCACCGGCGG
+TCCAGGGGCAACCGATCATCACGGCTCTTCCCCACCCGACCGGCAGTCACGCTCGGCTCCCATTCGTCGG
+AATCGCCGAGGCGTATGTGTTGAACGCCTTCCGCCGAGCGGGCGTCCCTATGCAGCGGATCCGGCCATCC
+CTCGACTGGCTAATCAAGAATGTCGGGCCACACGCGCTTGCGTCCCAGGATTTGTGCACGGGCGGTGCCG
+AGGTGCTCTGGCGGTTCGCTGAACGGTCCGGGGAGGGCAGTCCTGATGATCTGGTGGTCAGGGGGCTGAT
+TGTCCCGCGATCCGGGCAGTACGTCTTCAAGGAGATCGTCGAGCACTACCTGCAACAAATCAGCTTTGCC
+GACGACAACCTGGCTTCGATGATTAGGTTGCCGCAGTACGGCGATGCCAACGTCGTCCTCGATCCACGCC
+GCGGCTATGGGCAACCGGTGTTCGACGGAAGCGGCGTCCGGGTAGCTGACGTGCTCGGCCCATTGCGCGC
+CGGCGCGACGTTCCAGGCTGTCGCCGACGACTACGGTGTGACCCCGGACCAGCTTCGAGACGCGCTCGAC
+GCCATTGCAGCCTGATCGGAATCTCCTCGCCGACCTCGATCACATCTTTGTCGACCGGAGTTTGGGCGCT
+GTGCAAGTCCCGCAACTCCTTCGGGATGCCGGATTCCGGCTGACAACGATGCGGGAGCACTACGGCGAGA
+CGCAGGCTCAGAGTGTCAGCGACCACAAGTGGATCGCAATGACCGCCGAGTGCGGCTGGATTGGATTTCA
+CAAGGATGCCAATATCCGGCGCAACGCCGTCGAGCGACGGACGGTGCTCGACACGGGAGCCCGGCTATTC
+TGTGTGCCGCGGGCCGACATCCTGGCAGAGCAAGTCGCGGCACGGTATATTGCGTCCCTTGCGGCGATTG
+CCCGTGCCGCACGATTTCCGGGACCATTCATCTACACGGTTCACCCGAGCAAGATCGTTCGCGTGCTCTA
+GTCGTTCATCGCTCCGTTAACCGCCGGCGAGGCCGTCGACGATCTTCATGGTCTCGACGCTGACGGTGGT
+CACCTTCTTGATGAGGTCGACGATGTAGGTGGGATCGTCGTGTTCGTCGCACCAGTCGTTGGGGTCGTTG
+ACGATGCCCGACGCTTTGTCGGTGGTGACGCGGTAGCGCTCGATGATCCAGCCGAGCGCCGAGCGGGAGC
+GAGCAGGTAGCGCTCGGCCTCGTCGGGAATGCCGGCGATGGTGACGCGGGAGTAGAACGATCGCCAAGTG
+GTCGGTCTTGGCTGCCCACTTCATCCCCGGCGCCACCGGCAGGTCTCGCGGTCATCTCGACCAACGGAGG
+GCCGTCGGTGGTTCGTATCCGGCCAAGAACGGCGAGAACGGTTTGTGCCTCTATGCCAGGGTGAATGTCT
+CATCTCCCAGGCGGACGGTGATATCCAGTTCTCCGCCAAGAGCGGACACGTATTTGCGCAGTGTGTTGAC
+CTGTGCGGAGCCGATGTCGCCGTTCTCGATGCTGGATACCCGGCTCTGCCGGATGTGCGCCAGCGCAGCC
+ACCTGGACCTGGGTGAGTGACTGAGCCGCGCGCAGCTCCCGGAGCCGGAATGCCCGCACTTCATCGCGCA
+TTCGTGCCTTGTGCCGGTCCACCGCCTCCCGGTTAACGGGACGTACGGCGTCCATGTCCCGTAGTGTCAT
+CGCCATCGTGCCACTTACCCTTTCTTGCGCTTGCGCCTCTTTGGCTTCGTGTCCTCGAACTGTGCGAGAT
+GTTCGGCAAACATCTCATCGGCCGCTTTGATCTTCTCGTCGTACCACTGGGTCCACCGCCCGGCCTTGTT
+ACCGGCGGCCAGCATGATCGCCTGCCGCGCCGGGTCGAAGGCGAACAGAATGCGGACCTCGGACCGCCCT
+TGTGATCCTGGACGCAGCTCCTTCATGTTCTTGTGGCGCGACCCACGCACCGTGTCCACCAGAGGACAGC
+CAAGTGCGGGGCCCTCTTCCTCGAGAACCTCGATAGCTGCGAACACCAATTCGTAGGTCTCTCGGTCCAA
+GCCGTTGAGCCAGGCGGAGATGCGCTCCACATCCGCCGTCCACCCCACAGAGTCGCAGAGTAGCGCGATA
+CGCGATATCACACAAGGGTGATATTCCTCCGGGTAAGAGCAGCGGGCGACGGGGCTACCGTCGAGGAAAT
+GCCGGCAGGCGAGGACGGACTCTGCGCACCCGGGCCGTTGAAACAGTAGCCTGTGCCAGGCCGAGAATTC
+ATCCCCACGTATGAGGCAGTACAGTGCGCCGCCGTGCGCGTTCTCCCATGGAACGTTCACGGGCTCCCGT
+GGATGACAGGCGTTTCATGAACGCCAGCGCCGCCGCAACCCGACCGAAAGCGGTTGACCCCAAGGAGAGC
+TGGAAGTCGAGGCCACCACCTTCGCCGCGGAGTTGCTCATGCCCGAGAGCGAGACTCGTCCCGAAATACG
+CCGGCTCGATTTCGGCAAGTTGCTCGAACTGAAGCGGGAATGGGCGTCGACCCGCTCGACCAGCCCCAGC
+CGGGTGACCAGCCCCAGCCGGGTGACCAGCCTATGCACCGCGGCGATCCCACCGAAGCCGGTGGCATCGA
+TGTTGGCGCCGACCTCGTAGCGCACCGCGCCCGAACCCAGCATCGGCCTGGGCTGCGCCGCCCAGCGTCC
+AGCCCGCGCGTGCCGCGCCGCCACCCTGCGCCCTCGGCGTGTGATGTTTCGCCGACTCTGTTCATGGGTT
+ATCTTCTTCACCACAAAGGCCTTTCCTGCTGGGCTGTGTTGAGGTCGCAAACCCAGCCAGGGTAAGGCCT
+TTGGCCTCTCCTACCCGGCCGACACGCTTACTGAAGGCCTAGTCTAGGCAGGCCATTCAATCTGCGGAAT
+CGAAAAATTCGGTTCCAGCCTGCTCGTTTCCTTTCCGACAGCGATCTGACGTTGCGTAACGTCATTTGTA
+CGGACTCTTTTAGCGGCATTGATTTCAGATGCTAACGCCGTCTGTGCTGTAGCGCCGATTGGCCGAAACT
+GTAAATTTGTATGATTATTTAAATCTTTGACGAACACGCGCCACAAACGTACTATCTCTTTGGCAAAGTC
+CACCGGCATCTCATTCAACGGTTTTGTTTGCGCGTGGTCGTCATATGTTGGTAACTGTGTAACCGGCCGC
+CTATCTTGCGCGTGCATCATATGACTATGAATCGGCCTTCTCCAGTGAAATTGATACAAGATCGATCCGA
+TAAGCGGTACCTTGTACACAGTGCAATTGTAGTAATTCGCGTTTTGTCCTACGCTTGTATTCTGCGTGAA
+GAATTCAAACAGCGTCCGGGCGTGCAGCACAGTCGAATCGAGTGCGTAGACCTGCATGCTATAGCCGTCA
+ATCCCAAGATTCATACAATGTTGCGCGTGCCATTCTGTTGCAGCACGCAATAACCATGCCAGCTCTTTGG
+TCAAGTGCTCCTCTAGATAGTGCTCTAGCTGAGCGACGCTTGTCATCGCTGGCGTTCGTTGAACCATCCT
+AAAAGGATAGCGTTGAACCATCCTAAAAGGATAGCGGTTTCATGGCGCTGCCTAACTAATTTGGAAGCTG
+CGCAGCGCCGTTGGGCCCCGGCCAGCATCTGCTGCGCGCCCTCGCGCACAATCTCATCGATCACCGACGA
+CACCGGGCCCGCCAACACGACCGGCACGGCAGAATCACGATTGCCGACCTCAGGGACTACATTGCGCATG
+GGCGTACCTTCCCGAACCAGCGCGCCAACGCCGGTCCTTGATCAGACAAATGGACTTCAGATCATCCTCG
+GGGAGGTGCGCCCAATCACGCCGCTTCGCCGAGGCTCATCCACAGGTTCTGATCATTGCTCAAGCAAGAA
+GGCGCGGCCGTATTGACAGTATCGCGGAAGACTTTCGTTTCCGGGCGTTTTGTCGCATCCGAATGTCAAC
+AACCGGTCGATTCAGCTTGCGGAGGAGGTTGGGGACACTTGAGAACACGTCCACCGACTTTCTGCATGTC
+CGGATTGCTAGGGTCCGCTTCGGCAACGAAGTCTGCCCACGCCCAACCACCACCGGCCATGTGCGGTCCA
+AGCTGCTTGTAATTGAACCCGGCGTCGTCGAAGTAACAGAAGTTGCTGTTCATAGTGTTGAGGGAAGGGG
+CGTCCAGGTTCGACAGGACCGCAGGCATAGTTCGCTCACGCGGAATCGCTACCGCCATGGCGTGCCTGCC
+AACCCCTGGGTTGTCCTCTGAAATTCGCCTCTGTAGTGCCACCATCAGCCTGGCCGCACGAGTTATCCCG
+TCTTGCTGCTTCAGCATTCGCGGAACACGCCGAAGCAAGATGTTCGCATACATTTTCTCAGTCAACGCAG
+CTCCCGTGATACGGAAGCTCGCCGAGTGCCCCGGCGCTCGGCGGATTCGGTAGCACTTGAACTCGTTTTG
+GTTGGCCGGGATCGGCGCTTCCGGATCGAAGTTCGAAATCTCGGCGACGAGAGGAATCCTGCGGCGGTCG
+AAGCCGGCGATGATAATCCCGAGCCGTTTGTCCTCCCAACCCTTCCCGGTCGGTAATTGGCCGATCTGCC
+CGGAGGCCCAGTACCGAAGCGCATCGACTCCGTCTTCGAACGAGGCGTAGTCGCATAGGGTCTCGGCGAG
+CCACTCCGATGTTGACTTCTTCTGGGCGGGATCGATGCGAGCAAGCCCTGTGAACCCGACCGTGAAGCTT
+GTATTCCAGCACACCAGTTTGGTGTAGTCGTCATCGAACACTGACCCGTCCGGTCTCGACAGTCGCCGAT
+CGGCAACCTGGATGACCAGGTCGTCGGTCGTAACCGTCTGAATCAACGTCATGATGCTGCTACCGATGCG
+CCAAGTTGGTCCGTATTGCACAAGGTGTGCAGACGGAGAGGATCAGATTTGTCAGAGTTCGAGAATGACC
+ACGGTGGTCCGCGCTGCTTCCGCCGCGGGGCCTCGGTGACGGGCGTCGCCCTCGGGCGGGGCGCCGCCGG
+GCAAGGTTAAGCGGTAGTTGGCCTGTCACGTTGAATCCGAACCCGCTGATGCAAGTGCCACAATGCTGTC
+CACGATCTTCATGGTCTCGACGCTGACGGTGGTCACCTTCTTGATCAGGTCGACGATGTAGGTAGGGTTC
+GCGTGCTCGTCGCACCAGTCGTTGGGGTCGTTGACGATTCCGGACGCTTTGTCGGTGGTGACGCGGTAGC
+GGTCGATGATCCAGCCCAGCGCGGAGCGGGAGCCGAGCAGGTATCGCTCGGCCTCGTCGGGAATGCCGGC
+GATGGTGACACGCGAGTTGTAGATGATCGTTGAGTGGTCTTGCTTGGACTTCCATTTCATCTTTTCGACG
+CGCCAGGTCTCGCGGTCCTCCGGATCTGCGCCCGGTTTGAGTTGCACATCAAGGGGATACGGCTTGACCG
+ACTCGTAGCCGACATGTAAGTCGGCTAGTTTCCGGCCGGCGCTGGCGAGCTGGTCGAAGCGTTCGCGGGT
+CTCCGGTGTTGGGATGTGCGGGAGCATCTTCTTGAGGTCAGCGGCGTATTTTGTGCGGTAGGCGGGGTCA
+TGCAGCAGGCCGTAGACGTAGTAGAAGATGTCGTCTTTGGTGACTTGGTCGCCGATCGTGTCGCGGTAGA
+GCTTGAGGATGACGCCGGTGATGTTGTCGACGCGGCGGTAGCCGTGGTCGTCTACTTCGGCGTTGGTGGT
+GGACTCGAAATCGAGTTCGCCGTCACGTGGTTCGGTCTTCTCGTAGGTCCAGCGCGGGAAGAATTGACCG
+TTGCTTGAGCCCCAGAATGCGAGATCGGGGATAGCGTTTAGCATCAGACACGAGAAGGGCTTGTCTGAGC
+CCATGCCAACCACGTAGTAACCGACATTCCCGTGCTCCGGCGTCGGAAACATCGACGGAAGCTGGTAGGT
+ACAGTTGTTGAGCTGCTGGTTGGGGTCGAGGTAGGCGTGCTCTTTCGTAAATGGTCGGTACGTGCCGAGC
+CGCATTCCCGCGGGAGCGAATTCGATGCGAATGCCTTGTGCCACTTGCCGCTTGTTGATGCGGTCCCAGC
+TGAACTTGGCCGAGTCCACGGTAATGAGGGCGTCAACCGGCGGGGTCTTGGCGTCCCTTCCGCGGATCTC
+GTTGATCCGGTCGACCTCCGAGTTGTAGAAGTCGATCGTGCGTCCGATGTTGGCCTCGAGCGCACCACGT
+GAAAAGTTGTAACACCACGCATCCCGGCTGGTCTTCAAGCCCGCGGAATAGTTCGCGAAGACACGTGTCA
+CGTCAAGAGCAGCCTTCTTGTCGCCGATAACCGGCCACGCGCTGAACGCGTCGTCGCGTTGGTTGACCCA
+GTCACCGTGCAAGTTGGGTGTGACTGTCTGCCATTCCACCGTGTCGAGGTAGCCGTCGCCGACGATCCGC
+AACTTCTCCTCGCGACTCAGGTAATCGCCGATGTCGCGGTAAAGGACATCGCATGGCCCGCTGTGCTTCG
+GATCCTTGATGCCAAGGAAGATCGCCACCGTGTTGCGACTCCCCCCGCCAAAGACCTTGCCGCCTTCCTG
+GCGTGAGAGTTCCCCAGCTGTGCGCTGGTTCCCCCGCAGGTTGTACACATATACCGCCGCGTAGTCGTCG
+GCGAGCGACAACCGCATGCCGTCTGCCGTGTTGCCGTCTATGTACCCACCATTGGAGACGAATCCGACAA
+CACCGTTGTCACCAATGCGGTCGGTCGCCCACCGGAACGCGCGAATATACGAGTCGTACAGGCTGTTCTT
+CAGCTGCGCCGTCGACCGCTTCGCGTACGTCTGCTCAATCCGCCCGTCCAACGTCGGATACTTCACGTTG
+GCGTTCAGGTCGTTCGCGCTGCTCTGCCCCACCGAGTACGGCGGATTCCCGATGATCACGCTGATCGGCG
+TCGCCAGCTGTCGCAAGATCCGAGCGTTGTTGTACGGGAACATGATCGCGTCCATCGAGTCCCCGGCTTC
+GGAAATCTGGAACGTGTCGGCCAGCGCCATCCCGGGGAACGGCTCATAGGCGTCGGCGTCGGCGGTCTTG
+CCCGCCAAAGCATGGTAGGTCGACTCGATGTTCACCGCGGCGATGTAGTACGCCAGCAGCATGATCTCGT
+TGGCGTGCAGCTCTTGCGAGTACTTTCGGGTGAGGTCGGCGGCCGTGATCAGGTCGGACTGCAGCAGCCG
+GGTAATGAATGTGCCCGTCCCGGCGAAGCCGTCCAGAATATGCACGCCCTCGTCGGTCAGCCCGCGCCCG
+AAATGCTTGCGCGACACGAAATCAGCCGCCCGCACAATGAAGTCCACGACCTCGACCGGCGTGTACACGA
+TCCCCAGCGCCTCGGCCTGCTTCTTGAAGCCGATGCGGAAGAACTTCTCGTACAGCTCGGCGATCACCTG
+CTGCTTGCCCTCGGCGCTGGTGACCTCGCCGGCGCGCCGTCGCACCGATTCGTAAAAGCCTTCCAACCGA
+GCGGTTTCGGCCTCCAGGCCGGCACCCCCGACGGTGTCGACCATCTTCTGCATGGCCCGCGACACCGGGT
+TGTGCGACGCGAAGTCATGCCCGGCGAACAGCGCGTCGAACACCGGCTTGGTGATCAGGTGCTGCGAGAG
+CATGCTGATCGCGTCATCGGGGGTGATCGAGTCATTGAGGTTATCGCGCAGCCCGGCCAGGAACTGCTCG
+AACGCCGCCGCCGCCGTAGCGTCGGCGCCGCCGAGCAGGGCGTGGATACGGGTGGTCAGCGTCGCGGCGA
+TGTCGGCGACATCGGCGGCCCACTGCTCCCAATAGGTCCGGGTGCCAACCTTGTCGACGATGCGCGCGTA
+GATCGCTTCCTGCCACTGCGACAACGAGAACATCGCCAACTGCTCCGCGACGGCGGGTCCCGCCTCGTCG
+GAGGTCGGCCCGATGTGACCGCCCAACAGCTTGTCGCTGCCTTCACCGGTCTTCGTCGGCTTCACGTTCA
+GCGCAATGCTGTTCACCATCGCGTCGAAGCGCTCGTCGTGCGACCGCAACGCGTTGAGGACCTGCCACAC
+CACCTTGAACCGTTTGTTGTCGGCCAACGCGGCAGACGGCTCGACACCCTCGGGCACCGCCACCGGCAAG
+ATGACGTACCCGTAGTCCTTGCCGGGCGACTTGCGCATCACCCGACCGACCGACTGCACCACGTCGACGA
+TGGAATTGCGCGGATTCAGGAACAGCACCGCGTCCAGCGCGGGCACGTCGACCCCTTCGGAGAGGCAGCG
+GGCGTTGGACAGGATGCGGCATTCATCCTCGGCGACCACGCCTTTGAGCCAGGCCAGCTGTTCGTTGCGG
+ACCAGCGCGTTGAACGTCCCGTCCACGTGGCGCACCGAACACGCCAGGCCCGGGCCGTCGTCAACCAATT
+CGCGGTATGCCTCAACCACTTTCGGGAACAGCTCGGCAACCTGCTTGGACGTCTTGATGTCCTTGGCGAA
+CGCCACCGCCCGACGCATCGGCGGCTCACCGGCGACAATGCCGGTACCGGACCGCTTGGCCAGGCCATTC
+CAGCAGCCGACGATCTTGGAGGCGTCGTCGAGCATCAGCTCGCCGGAAACCCCGGAGAGTTCCTGCTGCA
+ACCGGGGCGCGATCACGCCCTGATCGACGGTGAGCACCATCACCTTGTAGTCGGTGAGCAGCCCGCGCTC
+CACCGCCTCGCCGAACGACAGCCGGTGAAACTCCGGCCCGAACGTCAGCTCGTCGTCCATCGACACCAAC
+TCGGCGGAGTGCTGGTCGGCCCTGTCCTTGATGCTCTCGGTGAAAATCCTTGGCGTGGCGGTCATATACA
+GCCGCCGGGCCGCCTTCAGATACTGACCGTCGTGCACCCGCACGACGTTCGACTCATCGTCCCCCGCCAG
+CGTCACGCCGGTGGTGCGGTGGGCCTCGTCGCACATCACCAAGTCGAACTCGTCGACCCCCAGCCGTTGG
+GCCTTGGCCACCGTGGGCAGCGACTGGTAGGTGCAAAACACCACGGTCAGGCCCTGGGCGCACCTGCGGT
+GCGCCATTTCGTGCAGCAATACCCGCGCGTCGGTGGTGACCGGGATCGGCACATCGTGGACGTGGTAGTC
+CTCGGCCGAGCGCGACACCTTGGTGTCCGAGCACACCGCGAACGCCCGCACATCCAGCTCACTCTGTGCG
+GTCCACTCCCGCAGCGTCTGGCTCAACAGCGAAATCGAGGGCACCAGCAACAGAATCCGCGCGCTGCCGC
+CGTTGTCGGCGGCGATGCGCTCGGCGATCTTGAGCGCGGTGAACGTCTTGCCGGTGCCGCAGGCCATGAT
+CAGCTTGCCGCGATCGTTGCCCACCGCGAACCCGCGGAACACCGCGTCGATCGCCTGCTGCTGGTGCGGC
+CGCAGCTCGTGGCGTTTGGCCGGGGTCAGGTTCACCTGCAGGTCGCCGGCCGGCCAGGCGATGTCCCAGT
+CGATCGGCGATTCGGCGATCTCGGCCATGCCGATGCGCTGCACCGGGACCAACTGATCGGCCAGCGCGTC
+CTCGGCATTGCGGCCCCACCGATCCGTCGTGGAGATGATCACCCGGTTGGTGAAGCCCGTCTTGCCCGAC
+GCGGTGAAAAACGAGTCGATGTCCCCCTTGGCCAGTGTGTGCGTCGGCTCGTAGAACTTGCACTGGATCG
+CGGTGTAGTTGCCGGTGTCACGTTCGCGGGCGACCAGGTCGATTCCGGTGTCGGTCCTGCCCCGCCGCTC
+CGGCCAGTCGATCCACCGCCACACCGCGTCGTACTGCTGGGCCATCGTCGGGTCCAGCTCGAAATAGCGC
+ACCATCAACTGCTCGAACTTGGTCCCGCGCTCCGCGTTCGACGGAGCCTTCCGGAACGCCTCGATGACGT
+CGTGCACCGACCCCATAGTTCAATGACCATACTGGCGGCAACCGACACGTGGCGGGATCCCTCGCGTTCG
+ATCCAACCCAACCAGCTCGGCCAACCGCATCGCGGGCCGGCATCTTCGCCGTCCTAACTCGGGAAATAGC
+GGTTGTCACTATCTGAGCGCAGCTATCTCATTTGCGGAGAACTAGCCCTGATCAATTCCTGCCTCGGTTA
+CGTGTGTCATGATCAGCCGGCCAGTTCGAGGTTGAGGTGACCTTCACATAGTGAAGCCTCCCGGGTTTCG
+TGCGCACCTTCTTTCGAGGGAAGGACGCACGCTGAGCTGCGAGTTCGTCGCCGAGCATCGAGCCCGGTTC
+GAGGTCGCTGCGATCTGTCGCGTGCTGTGTGGGCAGGGCTGCAGATCACCCGGAGAACCTTCTACGCCTG
+GGCAGCGTCGGCCGCCGTCTAGGCGTGCCCTGCGGGAGATGACGGTCACCGAGCCCCTGGCCGGTTACGA
+CGGGCCCGATACCGATGGCCGCCGTAAGCCCGAGTCACTCTACGGTGCGGCCACGATCTGGGATCGACGA
+GCCATGTTCAGCCGGATAGGCGTGGATGAGGGCGGTGGTCAGCTTGGGAACGGTGTGGGTGAGTTCGTGT
+TCGGCGTCGTGGGCGATGCGGTGAGCTTGCGCGAGGTCCAGGGCGGGGTCGACGTCGAGTTCGGCATCGG
+CGTGCAAGCGGTGTCCGATCCAGCGCATCCGCACGCTGCGTACCGCCTGCACGCCGGGCCGGGCCGCCAG
+GGCTTGTTCGGCGGCATCGACCATCGCTGGGTCGACGCCGTCGAGCAGGCGGCGGAACACATCTCGCGCG
+GCAGTTCGTAGCACGGCCAGAATCGCCGCCGTGATGAGCAGGCCGACGATGGGGTCGGCCAGTGGGAACC
+CAAGTGCGACACCGCCGGCCGAGCACAGCACGGCCAGCGAGGTGAATCCGTCGGTTCGAGCGTGTAGTCC
+GTCGGCGATCAGGGCGGCCGAGCCGATGCGGTGCCCAACCCTGATGCGGTAGAGGGCAACCCACTCGTTG
+CCGATGAATCCGACCAGCCCGGCCAGGGCGACCCAGCCGACATGCTCGATCTGCTGCGGGTGGATCAGGC
+GGGCGATGGCTTCGTAACCGGCGATGATGGCCGACATCGTGATCATCGCGACCACGAACGACCCGGCCAG
+GTCCTCGACGCGACCGAATCCGTAGGTATATCGGCGAGTGGCGGGCTTGGCGCCCAACGCGAACGCGATC
+CACAACGGCACCGCGGTCAACGCATCAGCGAAGTTGTGGATGGTGTCGGCGGCCAGCGCAACCGACCCCG
+ACATCACCACGATCACAATCTGGATGAGCGCGGTCAACCCGAGAACCAACAAGCTGATCTTGACCGTACG
+GATCCCTGCCGCAGTGGATTCCAGGGTGTCGTCGACGCTGTCGGCGGCGTCGTGGGAGTGCGGCGCGAAG
+ATCTCCTTGATCATCGCCGGCACACCTCGTGAATGAGCGTGGTCGTGGGTCATCGGGCGCAGGCCCTTTG
+TGACAGCAGGCCAGATCGGCCGCGTTCGACCACCAAGCAAGCTCTTTTATCTGCGTTCATACGCAGATAA
+TAGCGGATGCTCTCGCCGGTTCCAGTACTAGCTGGGACGGACGACGATCACCGGGATTCTCACCGAATGG
+GCTACCGCGGAACTCACCGAACCCAACAGCATGCCGGAAAACCCCCCGCGCCCATGGCTGCCGACCACCA
+CCAGCTGAGCTTGCTCAGAATGCTCGAGCAGCCACCGAGCGGGCTTGTCGCACACCAGCGATCGGTGCAC
+GCGGACATCCGGATACTGCTCTTGCCAGCCGGCGAGGCGTTCAGCGAGGACCTCAGCCTCTCTCTTCTCG
+CGCTCTCGCCAATCCATCCCCAGAACCGGAAACATCCCCAGATCGGTCCAGGCGTGCAACGCCACCAGGT
+CCACCCTTCGGCGGGAGGCTTCGTCGAAGGCTAGGGCCGTTGCCGCCTCAGAGGCTGGCGATCCGTCGAT
+GCCCACCAACACCGGTGCATCGGAGTCGGGAGTCGCGCCATTACCGGAATGAATGATGGCCACTGGACAC
+CGCGCATGGTGGAGCAACGCGGTGCTGATCGAGCCGAGCAGCAGTCGACCCAATGCGCCCATCCCCTGGC
+TGCCGACGACCATCAACCAAGCCTGTTGGGATGCATCGATAAGCGTCGGCACAACATTGGAAAAGACCAA
+CTCGGTATGCACCTGCGGCGGTTTGGACTCACCCAAGCTGTTGGTGAGCGCCTCGCGGGCCTGCTCAATG
+ACCTGCTGTGCGTTGTCCTTTTGCCACTCAGTCATATTCGCGTACAGCTGGCCCACCGGCCAGCCGACAA
+CCACAGGGGCAACAATGTGCAGCAGGGTGATGGGCAGCTGGCGCATGACGGCCTCACGGGCGGCCCAGGC
+TACCGCCGCGTTGGATTGCGCTGATCCGTCGACGCCAACGAGTATTCCGTATTTCGCTGTCGCAGCAGAC
+ATTTCACGCTCCTTGCGGTCGGAACACAGTCCATCAATCCATCAGCGCAGCGGTGCAGACCACCGCAGCA
+AGGTGCCTCCGGTCGGCATGTTCTCGACTGTGAATTCGCCGCCCGCGTCGTCGGCACGCTGGCGGAGATT
+GCGCAGGCCGCTTTCGGTGATGTCGCCGGAGATGCCGACACCGTCGTCGACGACCTCGACCCGCACATCA
+TCCTCGACGCTGACGTTGATGGCCAGGCTGGTCGCGTTCGCGTGCCGGACAGCGTTGCTAACCGCCTCCC
+GCAGAACCGCTTCGGCGTGGTTGGCCAGGACGGTGTCGACAACGGACAGCGGGCCCGTGTACTGGACCGT
+GGTGTGCAGCGCGGGGATCGCGAGTTGGTCGATGACCTTGTCCAGTCGGTGGCGCAGACCCGTCGCCCGG
+GAGGGCCCGGCGTGTAGGTCGAAGATCGCAGATCGAATCTCCTGAATGATTTCCTGGAGATCGTCGATGC
+TGCTGTAGATGGATTCCCGGACGGCGGGGACACGTGCTCGCGGAGCGGCACCCTGCAGGGTGAGCCCGAC
+TGCGAAGAGCCGCTGGATGACGTGGTCATGCAGATCACGTGCGATCCGGTCGCGATCGGTCAGGATCTCC
+ACTTCTCGCATCTGTCGCTGCGCGGTCGCCAGCCGCCAGGCGAGCGCAGCCTGGTCAGCGAAGGCGGCCA
+TCATATCGAGCTGTTTGTCGCTGAACGGCTGTTCATCGGCACTGCGAAGTGCGACCAGCACACCGGCAAC
+AGTGTCGGCGGCACGCAGCGGCAGCACCAGGGCGGGCCCGGGCTCCACCGGGCCGTCGACCGCGAGGTCA
+AGCCGGTCGAACCGGCGGGGCGTACGGTCGTGAAAGACTCCCCCGATCGACGTTCCGCTGACGGCAACCG
+TCATTTGCTTGACCGCCGGGGAGATCTCTCCGGCCACCTCTACGATGACCAGGTCGTCGACCTCGCAAGC
+CGGCGCTTCGTCGTCGAGCGGCACCGCCACCAAGGTGGCTGCCCCAGCCATCAACGTCAACGCTTCCTCG
+GCGATGAGCCGAAACACCATGGCCGGGTCCGCACCGGCCAGCATCTGCGTTCCGATGTCGCGGGTTGCCT
+CGATCCACGCTTCCCGGGTCCGTGATTCCTCGAAGAGACGGGCATTGTCAACGGCAATCCCGGCCGCGGC
+GGCCAGCGCCTGCACCAGCACCTCGTCGTCATCGCTGAACGGCTGGCCATCTGCCTTCTCGGTCAAGTAA
+AGATTGCCGAACACCTCGTCGCGGATGCGCACTGGAACCCCGAGGAAGGTCCGCATCGGCGGATGGTGCA
+GCGGAAATCCAACCGATGCGGGATGCCGCGAGATATCGTCCAGCCGGATCGGCTTTGGCTCCTCGATCAG
+CGCGCCGAGAACACCTCGCCCCTCCGGCAATGAGCCGATGAGGTGCCGGGTCTCTTCGTCGATCCCCTCG
+TAGACGAATTCGACCAATCTATGGTCGTAACCGCGCACCCCGAGCGCCCCGTAGCGGGCATCCACCAACT
+CGGCGGCGGTATGCACAATGGCGCGCAGGGTGGCGTCGAGCTTGAGTCCCGATGTGATCGCCAAGATGGC
+GTCGATCAGACCATCCAGCCGGTCGCGGCCTTCGACGATCTGTTCAATCCGGTCTTGGACTTCCAGCAGC
+AGCTCTCGCAACCGAAGCTGCGACAGTGTCTCGCGCACTGGCGGGCTGCCAGGGTTAACGTTCGCCCTGT
+CAGGGTGTGTCACATAGCTATGTTGACACCGGAGCTGCGCTCAACCAACTGGTCTGGCTACCCAGCGGCA
+CAGTCACAGATACTGCTGACCGACGACCAGCAGGGTGCAGCCGGCCTCCTGCAACACGGCGTTGCCCGGC
+GCTCCCACAAGTTGCTCCACATGCTCCTGGTCGCTCGCGCTGAGCACCACCATGTGTACCGATCGACCCA
+GCCCAGCCAGATAATCCAGCAGCTCGCCGTGCACTGCCGCCGATTGCACCCGCACATCGGGATACCGTGG
+TTGCCAACGGGCAAGCCAGCGGTCCAGGCTGGCACGGACGTCGTCCCCGGTATCGCCCACTCCGGATTGC
+CGGCAGGTGACCACCCGAACCGGCGAGTCGCGCAGCCGTGCTTCGGCCATCACCGCCCCCAGCAAAACAC
+CGATATCGGACGACCCGTCCGCCTCGACGACGATCCATGCGGCGTCGCGTCCGATGGGGACCCGGTGGGG
+TCGCACGATCGCCACTGGGCACTGCGCCGATAACGCCAGGGCCGCTGCGGTAGATCCCACCCGCTCCGGT
+CGGAAGTGGTGCACGCCGATAGCGCCAACGCACACCAGGGCAGCAGCCGCCGAAGCGCGGATCAACGAGG
+TGACCGGCCGCTCCTGGGTGATCTCCACCTCGACCTTGACCGGCCGGTCCGCCGCCTCGACCGCTGTGAA
+CGCGTAGCGCACCGCGTTCTCGGCGGCGGCGAGTTTGCGAGCCGCCGCGCCGTGTGCGGCGTACCCGGGA
+TCGTCGGGTTCGATCGCGTACAGCAGACGCAGCGGGATGTCACGGCTGGCTGCCTCGTCGACCGCCCACA
+GTGCGGCTTGCACGGCCGGCTTCGAGCCATCAATACCGACGACGATCGATGGGGGTTTGTGTGATTGGTT
+CATGGCGAGGCTTCCGGGTTAACGATCGGGTGCCAAACGTATTGATCCTGCCCGACTTCGGTGGGTTCGG
+CCGCCAGCTCGAAGAACCTCTCCACATCGTCGCGATTGCAGGCCGCGGTGCCTGGCGTCAGCAGCATGGC
+TGCACCTGCCGCGTTTCCCAAGCGAACGGACTTGATGAGCGACCAGCCACGGCTGAGGCCCACGGTAATC
+GCGGCCACCATCGCGTCGCCGGCGCCGACACCGCTAACCGCGGTCATCGGAATCGACGAAAATCGATGGC
+TCGCATGTCGTGTGGCCAATAGCGCGCCCTGAGATCCAAGCGAGACCACCACGACCTCGGCGCGCCCACG
+GTCAATGAGTTCGTGTGCGGCGGCCAGTTGTTCGGGCTCGGTCAGCAGTTCGGATCCGACGCACTCGCGC
+AGTTCCCGCACGCTCGCCTTGAGAAGAAACACCCCGGACGAAATGTGCTGCAACCCGCCACCAGATGTAT
+CCAGGATCAGCGGAGTGCTCGATCGGCGGCAGATGTCGGCAACCCGCTGATAGTAGTCGGCAGCCACACC
+TGGCGGCAGGCTGCCACTGGCCACCACAAAGGCGGCCGAAGCCGCCGCACCGCGCAGTTCGTCGAGGCAT
+TGCTCCTGCTCCGCGACGGTCAGCGACGGCCCCGGAAGCACGAAACGATACTGCTTGGCGGTCCTGGACT
+CGTTGACCGTGAAGCTCTCCCGCGTCGAGGCCGCGATCGGAATGACGCGAAATGGCACTCCCGCATCACC
+GAGCAGCGCCATCAGCAGGCTCCCGGTCGACCCGCCGGCCGGGAACAGTGCTGTCGAGCAACCGCCGAGG
+ACATGCACAATGCGGGCGACATTGATACCGCCGCCGCCGGGATCGTAGCGAGGTGCGCCACAACGCATTT
+TCTCGGTCGGGCGCACCACGTCGACGCTCGTCGTGATGTCCAAGGCGGGGTTCATGGTCAAAGTGATGAT
+TCGCGGCTTGCCTTCGTCCCACGCCGCTGGCTCCGTCATCGTCGTGGACTCTGCGCTACAGACCGGTCGG
+GTAGGTTTCCGGGTTCTCGCCGGCGATCCACCGGCTCGTCACCTCGAGAGGTTCCAGGGCACGGGTCTGA
+TCGATGTGGATCATGGCGTCGAACTGGTCGGCGGGCCGCACGTGCAAGTAGTGACTTTGCCGTTCCGTTG
+CCGGTAGATAAACGACGCCGATGGCACGTCCCAACCGGACAACGTCCAGCGGGGCTTCGGCGTCGCGGCT
+TAGCCGCGCTGACACCAGGAAACTGTCTGCAGTCTGGTGGAAGAGCTCCTCGACACTGCGTGCAGTGCCG
+GCCGAACCGCTTTGCGTTGGGCGATACCACCCCATTCGCTGGCCGCGGTGACGGTGCCCGTGTACGTGCT
+GAATCCGATGCTGCGCGACTCGTCACCGTATCGCTCACGGACTATCTGGCCGAGGGTGAGCTGCCCGTCG
+GCCCACACCTCGGTAGCGCGTGCGTCACCCACGTGGGAGTTATGAGCCCACACCACTATTCGCGCCGGCG
+GCGCATCGAGGTGTCGGTCCAAATGCGTCAGCAAACTGCCAAGGGTCTGCGCCATGTGCTGGTCGCGCAG
+GTTCCACGAGGTAACGCGTCCACTGAACATGGCCCGGTAATACACCTCTGCGTCGCGCACCGTCTGCGCG
+TTTTGCTGGGCGTAGAACAGTTCGTCCTCGGCAAGCAGCCCGTCTTGGCGCGCATACGCCAGGGCATTGC
+GCTGAACGTCGACCAGTTGCTCGACGGCTTCACGTTCGCACGACGGACCGGCGCCGAATGCGGCCGCGAA
+TCCGTACGCCTGACCGTCATCGGCGCAGGCATGGTCGAAGCACGCATACCGGGCCCGCGCCCGTGCCGCC
+GCACGCGGGTCGACCTTGTCGAGATAGCTGATCACCTCTTGGATCGACCGATGCAGGCTGTAAAGATCCA
+GACCGTAGAAGCCGGCTTGCCGCAGCGCGCCCGACTCGTAGCGCTGGTTGCGTGTGCGCAGCCATTCCAC
+AAAATCTCGGACCACGGTGTTGCGCCACATCCAGGCGGGAAACCGCTCGAATCCGCTAAGCGCCTCGTCA
+GCGTTGGTGTCCTCGCCGAGGCCGCGAACGTACCGATTGACCCGGTAGGCGTCGGGCCAGTCCGCCTCGG
+CGGCTACCGCACCAAAGCCCTTCTCCTCGATCAGCCACTGTGTCATGGCGGCCCGGGCCTGGTAGAACTC
+GTGTGTGCCGTGCGAGCTTTCGCCGATCAACACGATTCGTGCATCGCCGACCAGCTCCGCCAACACCTCG
+TGCGTCGGAACACCCCCGGGGGCGTCGATCGCGACTCTGCGCAGAACATCGGCCGCCGTTGACGCCGCGG
+GCCGGCGCAGCGACGGCCCAGCGGTCGGGGTGGCCAGGAGCCGGCGGACCTCCTCGTCGGTGACCTGCCG
+GAAGTCCCAAAACGACTCACCGACGGCCAGGAACGGGGTCGGCATGGTCGCGCACACAACGTCGTCGACG
+AGGCCGGCGAACTCCCGGCACGTGGACTCCGGCGCCGCCGGCACGGCAATCACGATCTGCGCTGGTTGCG
+CATCGCGCAATGCCTGTACCGCCGCGAACATGCTTGCGCCGGTGGCCAAACCGTCATCGACGACAATGAC
+CGTCTTGCCGGTGATATCGGTGGGCGGGCGCTCGCCGCGGTAGGCGGACTCGCGCCGAAGCAGTTCCCGA
+CCCTCACGTTCGGCGATGTCGCGCAGTTGCTGCGGTGTGATCCGCAGGCCCCGCACGACGTCGTCATTGA
+CCACGACGCGGCCGCCGCTGGCCAGTGCACCAACGGCGAACTCGTCATGCCCCGGGGCACCAAGTTTGCG
+CACGACGAAGGCGTCTAGCGGGGCATGCAGTGCCGCGGCAACCTCCCATGCGACCGGGAGGCCACCCCGG
+GCCAAGCCGAGCACAATCACGTCCGGCTGGTCCCGATAGGCGGCGAGTAATTCCGCCAGCACCCGGCCGG
+CCTCGCGGCGGTCACGGAACACGCGCCGCGGCGAGCGCCGGGTGACATCAGCCGCTGCGGTCATCAGCAC
+GGACCCAGTGGTCAGTTGGTGGACCGGATCTGAATGTGCTTTTCGGTTGGCTTCCCTTCCGAAACCGCCA
+CCGACACAGTAAGAATGCCCTTGTCGTAGGTGGCCTTAATGTCGTCCTCGTCAGCACCTACCGGCAGCGA
+CACCGTGCGAACGAAGGAACCGTACGCGAATTCCGAGCGACCGTCGAAGTCCTTCTGCTCGGTGCGCTCG
+GCCTTGATGGTCAGCTGACCATCGCGGACCATAATGTCGACGTCCTTGTCGGGGTCGACCCCGGGAAGCT
+CCGCGCGTACCTCGTAGCGCCCCTCTTTCATCTCGTCTTCCAGCCGCATCAACCGGGTGTCGAAGGTGGG
+CCGGAGTCCGGCGAATGACGGGAAGGCCGCGAACAGCTCAGAAAACTCGGGGAAGAGGGACCGCGGGTGG
+CGCTGAACGGGAAGGGTGGTGGCCATTTGATGCCTCCTAATCGATGGAAACGGATGCCTTTGATCCGACC
+AGCCCATCGTGGCCAGGGCTAGGGACAGAAGTCCCCGAAGCGCGGGCCATTTGTCCGCGCCCGTCGGTGA
+TCCACTTGGGGACCATTGACCCTGTTGTCTGCCAACCGCCGTTCAGAAAGATCGGGGTGATATCGAACAG
+CGGAGGTTGATCATGCCGGACACCATGGTGACCACCGATGTCATCAAGAGCGCGGTGCAGTTGGCCTGCC
+GCGCACCGTCGCTCCACAACAGCCAGCCCTGGCGCTGGATAGCCGAGGACCACACGGTTGCGCTGTTCCT
+CGACAAGGATCGGGTGCTTTACGCGACCGACCACTCCGGCCGGGAAGCGCTGCTGGGGTGCGGCGCCGTA
+CTCGACCACTTTCGGGTGGCGATGGCGGCCGCGGGTACCACCGCCAATGTGGAACGGTTTCCCAACCCCA
+ACGATCCTTTGCATCTGGCGTCAATTGACTTCAGCCCGGCCGATTTCGTCACCGAGGGCCACCGTCTAAG
+GGCGGATGCGATCCTACTGCGCCGTACCGACCGGCTGCCTTTCGCCGAGCCGCCGGATTGGGACTTGGTG
+GAGTCGCAGTTGCGCACGACCGTCACCGCCGACACGGTGCGCATCGACGTCATCGCCGACGATATGCGTC
+CCGAACTGGCGGCGGCGTCCAAACTCACCGAATCGCTGCGGCTCTACGATTCGTCGTATCATGCCGAACT
+CTTTTGGTGGACAGGGGCTTTTGAGACTTCTGAGGGCATACCGCACAGTTCATTGGTATCGGCGGCCGAA
+AGTGACCGGGTCACCTTCGGACGCGACTTCCCGGTCGTCGCCAACACCGATAGGCGCCCGGAGTTTGGCC
+ACGACCGCTCTAAGGTCCTGGTGCTCTCCACCTACGACAACGAACGCGCCAGCCTACTGCGCTGCGGCGA
+GATGCTTTCCGCCGTATTGCTTGACGCCACCATGGCTGGGCTTGCCACCTGCACGCTGACCCACATCACC
+GAACTGCACGCCAGCCGAGACCTGGTCGCAGCGCTGATTGGGCAGCCCGCAACTCCGCAAGCCTTGGTTC
+GCGTCGGTCTGGCCCCGGAGATGGAAGAGCCGCCACCGGCAACGCCTCGGCGACTAATCGATGAAGTGTT
+TCACGTTCGGGCTAAGGATCACCGGTAGCGGGCGCCGCCGGGACCGCGTCTAAGCACCGCAGCTGAATCG
+GGCGGATGATGTGTCGATGAGCGGATCCGGCGATGGCGACGGTGTCGCGCGGTTGGGCAGACATCTTCCG
+CGGCTATTCGTCCCCGGCCGGCTGAGTGACGAAGTCGATCAGTTCTTCCACCCGGCCGATCAACGCCGGC
+TCTAGGTCGGTCCAGTCGCGTACTTGCGAACGGATGCGCCGCCACGCCGCGGCGATGTCGGCCTGGTCGG
+CGTGCGGCCAGCCGAGCGCATCGCACACGCCGTGCTTCCACTCGATGTGCCGCGGCACCCTCGGCCAGGC
+GGCCAGCCCAACTCGTTGTGGCTTGACCGCCTGCCAAATGTCGACGTAGGGGTGCCCGACGACCAAAGTG
+TCGGAGCCGCCCGGTCCGCGGCGCACCACCTCGGCGATGCGCGCCTCTTTCGACCCCGCGACCAAATGGT
+CAACGAGAACGCCGAGCCGACGCCGCGGGCCGGGCCGGAACTTGGCGACGATCTCCACCAGGTCGTCGAC
+GCCACCGAGATGTTCGACGACGACACCTTCGATTCGCAGGTCCGCTCCCCATACCGCCGCGATGAGTTCA
+GCGTCGTGTCGGCCCTCGACATAGATCCGGCTGGCCCGGGCCACCCGGGCACGCGCGCCCGGCACCGCGA
+CCGAGCCGGATGCCGTTCGCCTCGGGCCGGCAGCCGCTGCGCACCGCGGCGCGGTGAGGATCACCGGCAG
+GCCGTCGAGTAGATACCCGGGGCCCAGCGGAAACCCGCGGGTCTTCCCGTAGCGGTCTTCCAAGTCGATG
+CGGCCATATTCGACTCGGACCACCGCACCGACGTAGCCGGTCTCGGCGTCTTCGACGACCATGCCGAGCT
+CGACCGGGTGCTCAACCGAGCGGGGCCGGCGCCGCCCGCCTGCGGCAAGCACGTCGGTTCCATAGCGATC
+CAGCACGCCGCAATACTAGGGAGCCTCTCTGCCGGTCATCGCCGCGACGCGCCGCATGGGTTCTCGGAAA
+ATGCTTGTACCAGTCGACTTTCCGGCGGGCCAACGTCGCCAACCGATACTCGGCTCCAACGCCATGGGTG
+ACGGGATGCCCGGATCACGTGTCACACCACCCGCGCACCCTTGCGGAAGAATATCCGTAAGTCTAAACTT
+ACGGTTCGTGTCCACTTACAGATCACCGGATCGCGCTTGGCAGGCGCTGGCGGACGGCACTCGCCGGGCC
+ATCGTGGAGCGGCTGGCGCACGGCCCGCTGGCCGTCGGCGAGTTGGCCCGCGACCTGCCCGTCAGCCGAC
+CCGCGGTGTCACAGCACCTCAAAGTGCTCAAGACCGCCAGGCTGGTGTGCGACCGCCCCGCGGGAACACG
+CCGCGTCTACCAGCTCGACCCGACAGGCCTTGCGGCATTGCGCACCGACCTCGACCGGTTCTGGACACGC
+GCCCTGACTGGCTACGCGCAGCTCATCGACTCCGAAGGAGACGACACATGACACGCCCGCGAACCGATGC
+CATCCACCACCACGTTGTCGTCAACGCCCCGATCGAGCGTGCGTTCGCCGTGTTCACCACGCGGTTCGGC
+GACTTCAAGCCTCGCGAGCACAATCTGCTTGCTATCCCGATCACCGAGACGGTATTCGAATGCCATGCGG
+GAGGCCATATCTACGATCGCGGTGTTGACGGAAGCGTGTGCAAATGGGCGCGCGTGCTGGTCTATGAACC
+GCCCAGCCGGGTGCTATTCACGTGGGATATCGGCCCGACTTGGCGGCCGGAAACCGATCTGGCCAAGACC
+AGTGAGGTCGAAGTCCGCTTCACCGCGCAGTCCGCCGAGACGACACGCGTCGACCTCGAACATCGCCATC
+TCGACCGACACGGTCCGGGCTGGGAGTCGGTCGCCGACGGCGTTGACAGCGAGGCCGGATGGCCGTTATA
+CCTACGCCGCTATACCGACCTGCTCTGCATCCAGGTGCAGCCATGATCGCGGCAGACGACGATACCGAGA
+AGTCCATGATGGACATGGCCCGCGCCGAGCGGGCCGAACTAGCGGCGTTTCTGACTACCCTCACACTGCA
+GCAATGGGAAACACCCAGCCTGTGCGCCGGGTGGAGCGTCAAAGAAGTTGTCGCACATATGATCAGCTAC
+GAAGATCTCGGCGTTTTCGGGTTGCTCAAGCGCTTTGCCAAAGGCCGGATCGTCCGGGCCAATGAGGTGG
+GTGTCGACGAATTCGCTGGGCTCAGCCCACAGGAGTTGGTTGACTATGTCGGCCGGCATCTCCAACCGCG
+TGGGCTGACAGCGGGTTTCGGCGGAATGATCGCCCTCGTCGATGGCATGATCCACCACCAGGATATCCGC
+CGCCCGCTCGGTCAGCCCCGCACCATCCCCGCGCAGCGACTTGACCGCGTGTTGCGGCTGATGCCGAAGA
+ACCCCAGGCTGCGAGCTCGGCCACGCATCAAAGGGCTGCGACTGCGAGCCACCGACCTCGACTGGACAAT
+CGGCACCGGGCCCGAAGTAACCGGGCCCGGCGAAGCCTTGCTCATGGCAATGGCCGGCAGGCCAGCGGCG
+GTCAGCGACCTCTCCGGCCCCGGAAAGCCCACGCTAGCCGGACGACTCGGTTAACGACAGCTACAGCGAC
+GGCGTGAACGGGCCGCCGCAGTCAGCCAGATAATCGGCGTAATTCCAGTTCGCCAAGAACTTTTGACCCG
+CCTGAAATCCGCGTTGGTAAAGAGCCTCGCGTTGTTCGGCGGTGATGTCGAAGTCGATCGGACTCACGTC
+GTGGGCGGGCACGAAGATGGTGCGCCGAACGGTACACGGATCGTCGATGTAGGCGTTGTCCTGATTGCTC
+ACCAGTGTTTCGATCGCCGCGATGCCCAACGACACTGGCCCTTGGACCGGCCGGGTAGGTGGAATGCCCG
+GACGCGCTGACAACCTGATCCCGAACGTGGGCCATCGCGGTTCAGCGTCGGTTCGGTCGAACAGCGCCAC
+CGGAAAGTTCGACAGCAAGCCACCGTCGACCCAGGTAGCGCCGCGCACCCGAACAGGCTCGAACACAAAC
+GGGATCGCCGATGAGGCGTGCACCGCACGCGCCACCGAGAAGTCGTCCGGGTGGATGCCGTAGGAGTCCA
+GGTCCCACGGGATGCGAACGAGTCGGCGACGGGATAGGTCGCTGGCGGTGACCACCAGCGACCAGGCGAA
+CTGTTCGGGTGCCTCGCCGGTGCGCAAGTCGCCAAAGGTGTGCACGCCTAGGTCAGCGAGCAAACCGCCG
+AGCAGCTGTTCCAGATAGGCCCCGCGGTAAACGCCGTCCGACAACAGCAGAGAAAGTCCCCCGCCGATCA
+ACGGCACGTGTCCTATCAGATTGCGGTCGAGGAACTTCGGGTAGTCGATGCTGCGCATCATCTCGGCAAG
+CCGCGTCACCGGCTCACCGGCCGTTTGTAGGGCCGCGACCAGCGACGCGACGATCGCACCCGCGCTGCTG
+CCCGCCACCCTGGGAAATCGGTAACCGGCATCGGCCAGCGCGTCCACCGCTCCAACCAACCCTATCCCCC
+GGACCCCGCCGCCTTCACACACCAGGTCGACGCGTGCTGTGCTCACCAGCGCCACGTTAGCCCGGAATCC
+GACGCCCGTCGACGGCGAAGAAGTGCAGGTGTCCCGGTGTGGGACATAGCCGCACGCGACTACCCCGCTC
+GGGCGGGCCGCGGCCGTCCACTCGAGCGACGATTGACTGGTCCATTTCGCAGCCGCCCGACACGATTCGG
+CCATACAAGTAGGCGTCCGCTCCAAGTTCTTCGACCATGTCGACGTCCATCTCGATGCCGGCGCCGCCCA
+GCTCCAAATGTTCGGGGCGAACACCGATAATGACCTCGGCTGCCGTACCGACGACCGCACGCGGCAGCAG
+GATCTGCCAATCACCCAGTGACACCGTGGAATCGGCGATGGAAAGCCTGAACAGGTTCATCGCCGGGGAA
+CCGATGAACCCCGCGACGAACACGTTGCCCGGGTTGCGGTAGAGCTCTCGAGGCGAAGCACACTGTTGCA
+GCACACCGTCAGACAGCACCGCGACGCGGTCACCCATCGTCATGGCCTCGACCTGGTCGTGAGTGACATA
+CACGGTGGTCGTACCCAGTTGCCGTTGTAACGCGGCGATCTGATTGCGGGTTTGCCCGCGAAGTTTGGCG
+TCAAGATTGGACAGCGGTTCGTCCATCAGGAATACCTGTGGGCGCCGCACGATCGCACGACCCATCGCCA
+CCCGTTGCCGTTGGCCGCCGGAGAGATCTTTCGGCTTGCGATCCAGATAAGATTGCAGATCAAGCAATTT
+CGCTGCGGCAAGCACCCGCTCGCGGATCTCGGCCTTGCCGATCTTGGCGACCTTCAACGCGAAGCCCATG
+TTCTGCGCCACCGTCATGTGCGGGTAGAGGGCGTAGTTCTGGAACACCATGGCGACATCACGATCCTTGG
+GATCGACCTCGGTGACGTCGCGCTCGCCGATCCGGATACGCCCACAGTCCAGCGTCTCCAAGCCAGCCAC
+CATCCGTAACGACGTCGTCTTGCCACATCCGGACGGCCCCACCAGGACAACGAACTCGCCATCGCCGACG
+ATCAGGTCGAGCCGATCCAGGGCCGGTCGGTCCGTGCCGGGATAGCGCCGGGTTGCCTGCTCAAAACTCA
+CCGAAGCCATGGTTACCCGCCGAGCCCAGTCACCGCGATACCACGGACAAAGGAACGTTGTGCGACCGCA
+TAAAGGATGACCAACGGCACCAGCATCAGCATCGACGCCGCCATCAGCACCGGCCACCGGGCGACGTATT
+CGCCCCGCAATCGGACCAGGCCAAGGGTGAGCGTCGCCAGGCTGTTTCGCTGGATCATCAGCAGCGGCCA
+CAGAAAGTCGTTCCACACGTTGACCCAGGTGAGCACACCCAGCACCAGCACCGCGGGACGTGAATGCGGC
+AGCAGAATCCGCCAGTAGATCTGCCACGGCGAGCAACCGTCGAGAATCGCGGCTTCCTCGAGATCGGTCG
+GCAGCGTGCGGAAGAACTGCCGCATCAGGTAGGTACCGAACGCGCTACCGAACAATCCCGGCACGATCAT
+CGCCCACGGCGTATCCACCCACCCCACGATCCGCATGAGAATGAACTGTGGGATGACGGTCACCGTCAAC
+GGCACCATCAAAGTGCTCAAGTACAAGACGAACAACGTATCGCGGCCCCGGAACTGCAGTCGCGCGAAGG
+CATAACCGGCCAACGAGCAGAAGAAGACCTGCCCGGCGGTGACACATCCGGCATACAGCACGGTGTTGAA
+GAACATCCGCCAGAACGGCATCAACGCGAACACCTCGCGGTAGTTGGACCATTGCGGATGCGACGGGAAC
+AGCGTCGGCTCGGTCACCTCGCCGTCCGCCTTCAGGGAGCCCGACAGCGCCCAGATGATAGGGAACAGCG
+CGCACCAAGCGATCCCGATCAGTCCCGCGTACAGGGCAAGCCCACGAATGAAGTGGCGGTGGACTATTCG
+ATCAGCCCAGCCCACGGGACGCCTCCCAGGAGCGCCGGTGCGTAATTCGCAACTGCAGCACGGTCAACAC
+CAGCAAGATGGCGAACATCACCCACGCCAACGCGGACGCATAGCCGAATTCCAGGAACGAAAACGCGTGC
+TGGAACAGCATGATGCCCAAAACATAGGTAGCCGTCTCGGGACCACCGTTGGCACCGGTAAGGACGTAGA
+CAAGGTCAAACGCCTGGAACGCGTGGATGATCGATATGACAACCACGAATGACAATGCCCCCCGGATCAG
+CGGTACCGTGATGGACACGAACTGGCGAATCTCGCCGGCACCATCGATCCTGGCCGCCTCGTACACAGTC
+TCCGGAACCCCCTGCATCGCGGCCAGCAGGACGACCGTGGCGAAGGGCACACTGCGCCAGACGCTGACCA
+GGCAAAGCGAGACCATGGCCCATCGGGGTTCGATTAGCCATGGGATGGGGCCGATTCCCAGCCAGCCGAG
+CATGATGTTGAGTAGGCCATTGTCGGTGTTGAAGACGAACTGCCAGACGACCGCCATCACCACCGAGGAA
+ATCGCCAACGGCAAGAAGACGACCGTCCGAAAGAGGCTGATGCCTTTGATTTTCCGGTTTAGAAAGGCGG
+CGACGACGAGGCTGACGATAACGGTCGGTACCACGGTGCCGACGGTGTAAACCGCGGTGTTGACCACGGC
+GATGAGAAACAGCGGATCAGAAGTGAAGAGGTTTCTGAAATTGTCCAACCTCACGAACGTCGCATGCGTA
+AACAAGTCCCACTTCTGAAAGCTCATGTACAGCGAGAATCCCAGCGGAAACAGCATGAACACCACAACGG
+CAGCCAAGTTCGGCGCGACGAACATACGCCCCGCCCACGCGCGTCGCCCCCTGCGCCGTGTCATGGATTG
+CGCAGCACTTCATCGACGGCCTGTGATAGCCCGGTCAGCGAGGTCGCCGGCCGGGATCCACGCAGCACGG
+GTCCGAAGTAGCGGTCCATCAGGGCGGCGATCTTCTCCCAGGCCGGGGTCACCGGCAAGCCTTCCGAATA
+GGCCGGCCCCTCGCTGAGCACGGCAAGATTGCCTACCCTGCGGTGGGCGTTGGCGAATCCGTGCGAGTTG
+ATCGCCGATCTCAGCACCGGCACGAACAGGCGGGATTCGCCGATCAATGCCTGCCCCACCGGGCCGGTCG
+CGAACTTTACGAATTCCCACGCCTGGTCCTTGCGTCGACTGGTCGCCGCAATGGCCAGCCCGGTGACACC
+GATATCTGAACAGGCGGCTCGTCCGCGCGGACCGATGGGCAGTGGGGCGACGTCGAAGTCCAGACCGTCG
+GCACGGTCGAACGTCTGATATCGCCAGTGCCCGGCCAACGCGATCCCGGCCTTGCCCACAGAAAACAGGT
+CCGCCGTCGACATCGACTGCTGCTCAGCAGCGCTGGGGGCCACCTTGTGCTTGTTGGTCAGGTCGGCGTA
+GAACTGCACCGCTTCGAGGAACCCGTCGTGGTCGAAATTGAGGTGGGTGGGATTCATCCGCGGAACCGAC
+CACGGTACACCGTTATTCATGGCGAACAACCCGGCAGCGTAGAACGAGACCCACGCGTTGACGAAGCCCC
+ATTGCCTGTCCCGTCCCGACCGGCCCTGCTTGGTAAGCGCCTGGGCGGCATCCAGGAATTCGGCGAAGCT
+CCATGGCCGTTCCCAGCTACCGGGCGGCGGTGGCACGCCGGCGTCGTCGAATAGCTGTTTGTTGTAGAAC
+AAGAAGTTGCCGGACCATTGCTCCGGAAAGGCGTACTGGCCTCCGTTGAACGTGAAAGTCTCATACAGGG
+CCCCGATGCTGTCCGATTTCAGCTCCGCGGCGAAAACCTGGTCGCGCGCCAATAGCGTGTTCAGGTCAAG
+CAACACCCCCCGGTCGGCCAGTTCGGCATAGGTCAGTTCCCATGCCATCAGCACATCCGGACACTTGCCA
+CCCGCGCAAAACGTTGCGAGCTGCTGCATGACGCCGGGTCCGGACAACAGGGCCCGTACCTTGATATCGG
+GATAGCGCCGCTGGAATTCGTTGACGACGCGCATCCGGGGACGGAGCTCGTCCGGATTGGCTGCAAAAAA
+GAAAGTCAACGCGTCATCGTCATCGGCAGCACACCCAGCGGCCCAGGGAGCCAGCGAGGCCGCAGTAAGC
+GCGCCCGCACCCCGTAACAGACTGCGCCGCTCGAACGGCTTATTGACCATCGTGCTCCCGATTTTGGGTC
+CTGTGGTACAACGACCGTCAGGCTGGGAAGTACCGAATCCGATTGATCCGGTTGCCGCGCCACGGCACGT
+CGGCGAACATGATGCCGCGCCGGTGGTCCGACGCGAGCGACACCGCGACGGTGGATCCGGCACCGGTCAC
+CTTGGTCCAGCTAGCCCCGCGCAGCTGCTCGAACAGCTCGACAATGTCGAGTAGCTCATCCTCGCCTAAA
+GTCATTGTGGCAGTGCGTGATAACGCGTGATACGCAGCGGACTTGTCTGCCCGGGACGCGGCGTTGAGGA
+ACGTTTCCACCAGCTTCTTGTGCCGCCGGCCCGCCCGGCGAAAGCCGGTCAGGAATCCTGCGGTGCCGCC
+CAACCCTTGATTGCCTAGCAGCGCTCGCGACAGTTGCAGGGCGGGTCTTGTGGCCCCCGATCCCGTGCGC
+AGAAACTGCAGCATCATCGCCGGCAACTCCCAGTACGCCCGCAGTGCGGCAATCTGCCACTCGCCGGTAA
+CCGGTCGTAGGTCATAGCGTAGGAAGGCGGGAATGAACACCGTCACAGCCGAGTCCATCGCGACCTCGAG
+TTCGAGATCGCGCAGCACCACCGTGCCGGAGACGATATCCAGATCGCGATGGAACGTGATATCCCGCGGC
+CCGATGAAGGTGTCGTAGAAGCGGCCGATGGCCTCATGCCCCACCTGCGGCTGCGAACCCACCGGGTCTT
+CGACCCGCGCGTCACCGGTGAACAACCCGACCCAGCCGGCGCGGTCGTGCGCGGCGGCCGCTTGCGGCGA
+GCGCTCCACCGCCGCCAACAGTTCATCCCGGTTCGGCGGTGCCATCAGGAGCTGCAAACCAACTCGACGC
+TGGCGGTGCGCATCTCCTCCAGCGCGGCGACGGTGGTATCGGCCGACACACCCGCTGTCAGGTCCACCAG
+CACCCTGGTGGCCAAGCCATTGCGTACCGCGTCCTCGGCCGTCTGGCGCACACAATGATCGGTGGCAATA
+CCGACCACATCGACCTCATCGACGCCGCGTTGCCGCAGCCAATTCAGCAGTGGCGTGCCGTTCTCGTCGA
+CTCCTTCGAAGCCGCTGTACGCTCCGGTGTAGGCACCCTTGTAGAACACCGCCTCGATTGCCGACGTGTC
+CAGACTGGGATGGAAGTCCGCGCCGGGAGTACCGCTGACGCAATGCGGTGGCCACGACGAGGAATAGTCC
+GGTGTGCCGGAGAAGTCGTCACCCGGGTCGATGTGGAAGTCCTTGGTTGCCACGACGTGATGGTAGTCCG
+CCGCTTCGGCCAGGTAGTCGCTGATGGCGCGGGCCAGCGCGGCGCCACCGGTTACCGCCAGCGAGCCACC
+CTCGCAGAAGTCGTTCTGCACGTCGACGATGATCAACGCCCGCATACGTCCACCATACGTTCGGGCGACT
+GCCCGGGCAGTTTGCCTACCGACGCGGCAGCCACAGATATAGGGTCCATGACGCCGCGACGATCGCGAAC
+ATGACCAGCTGAGCGGCGGCCACCCAACCGGCGGGATAGATCACGCCGGTGATGTAGTGAGCGACAAATC
+CGTCCGGTGACAGAGGTGTCATCGCGGCCTTGGTGCGAGCCCAGCGCTCCACCCAGGTCAGCGGGCAGTC
+GACCCGCTTAGCGGCGATGCCGATCCCCCATATCACCGCCGGAACATGCAGCCACATCGTGCGTCGCCAC
+CGCAGGGCAAGGAAACCGCCGGCAAGGACGTAAGCGATGAAAGCGAAGTGCATTACCACCGTTGATACAA
+CGACGGTTTCGTACATCTCTCGGGTTGCCTTTCCAGGTCGCGGCGCTCCGGCCACTGACAGAAAAGGTTC
+AATTCGCCAGCGAAAACCCGTCCCATGCGATCCGGCGGTGCTGATGCGGATCGAACTCGATGCGGCACCT
+GCGGTCGAAAACCAGGACGGCACGGTCGTCTTGGGTGTAAGCCGGCCAGTCGTCGCCCGGAACACCAATT
+TGGCTGAAACAACGCCAGCGGCGTTGCACCTCGTTGCTGACCCGAAGGGCGGCACGGCGGTCGGCGGCGG
+CGGTCAGCAATGCGCCAAATCTGGTGCGATAGATGTCGAAGACGGCAAACAGTTCGGTGGCATGGGTGGC
+GCCGAAACCCGACCAGCGCAGCGTCCGTGGCGCGTAGTCATATCGGTATAGGTAGGTGGGCGCATTGGCG
+CCGTGAGCCTCGGCGATCTGCCAGGCCGCCGAGCTAAAGGCGAAGTCACCACCGAGCTGGATGCACGCCG
+AGGGCGCAGGGTAATTCGGGTAGGCGGCGGTAATGCGTTCACGATCGGCCGGTTTCATGCCCGACAGTAG
+CTCTTCAACCATCGGTTCGTTGGTCGGCAGCATCCCCAGAAAGCGGGTGAACAACCGACCCTCTTCGGCG
+TTGGTTCCCACGATCAGCGGAACCGCGTGCACCCGGCCGGACCGCATCGCCTCGACGGGGTCCATGGGCA
+GGTAGTCGTCGCCGAACACCGGACCAATCGGGAAGGCGCCCAGCCTTTTCCGCATTCCCTGGCGAATCAG
+GTGGTGTTGGGCTTCCACCAGCTGCGCGGGGGACGCCTGCATCAACGCATTGGCGGCATCCTGGGTACGC
+GCGCCGATCAGATTGGCAAAGCGTGCCGCGAACTCGGCGGCCACCTCGCGCGAACGCACCATGCCCGCCG
+CTGGGCTTTCCGAGATCGCCCTGGCGAATAGGCCTTTGGCGGCTGGCACCGCCAACAGTGTGGCGGTGAT
+ATGCGCGCCCGCGCTTTCGCCGAAAATGGTGACATTGCCTGGGTCACCGCCGAACTCCGCGATGTTGTCG
+TGGACCCAACGCAACGCCAACACCAGGTCGCGCAGGTACACGTTGCTGTCGAGGGTGATCTGCGGTGTCG
+ACAAGGACGACAGGTCAAGACACCCCAACGCGCCCAGCCGGTAGTTGACCGACACGTACACGCAGCCGCG
+GCGTGCCAACGCTGCGCCGTCGTATATCGGGGTTGCCGAGCTGCCCAGGATGTAGCCCCCACCGTGGATG
+AACACCATTACCGGCAGCGGCTGGGTGGCTGGCTCTTCGGGTGTGACGACGTTGAGGGTGAGACAGTCCT
+CGCTGCGGGTCTGGTACCTGCCGATGCCCATCACGGTGTAGCGGCGCTGCTGAGGAGCACAGTTGGCAAA
+CGTGTGGCAGTGCCGTACGCCCGGCCAGGGCTGCGCTGGCTGCGGCGCCCGGAATCGCAGCGAGCCCACC
+GGCGCCCTGGCGTAAGGGATTGATCGCCAACGGTGCACACCGTCGCGCGTGAAGCCTTCAACGATGCCGG
+TGGCCGTGCGGGCGCGCACGGTGCGCTCGTGCATAGACCCGACGGTAGCCGACTCCAGGGCCACGCGGCA
+TGCGCAGTGCAGGAATGGGGGCGGGGCGGCTAGCCTGTCGGGATGCGGATCGCCGCGCTGGTCGCAGTGT
+CGTTGCTGATTGCGGGGTGCCCGCGCGAGGTCGGCGGTGATGTAGGGCAGTCGCAGACCATCGCCCCGCC
+GGCGCCCGCCCCGTCGGCGGCGCCGTCAACACCACCGGCCGCAGGAGCGCCGATCACCACTATCGTGTCT
+TGGATTGAGGCGGGTCACCCGGTTGATCCCGCCGCCTATCACGTCGCCACCCGCGACGGCGTCACCACCC
+AGCTTGGCGACGACGTCGCGTTCAGCGCTTCGTCGGGCACGGTGGCCTGTATGACGGATGCCAGGCACAC
+TAGCGGCACCCTGGCCTGCCTGGTCCGACTCGCGAACCCACCACCCCGGCCCGAGACGGCCTACGGCGAA
+TGGAAGGGCGGCTGGGTCGACTTTGACGGCATCCACCTGCAGGTCGGGTCCGCCCGCGCCGACCCGGGCC
+CGTTCGTCTACGGCAATGGACCCGAGCTGGCCAACGGGGACACGCTGTCGATCGGGGACTACCGCTGCCG
+CTCCTATCAAGCGGGCCTGTTCTGCGTGAACTACGCCCATCAGTCCGCGGTCCGGTTCGCCAGCGCCGGG
+ATCGAGCCGTTCGGCTGCCTGAAGCCGGCGCCGCCACCCGACGGCGTGGGCGTTGCGTTCGGCTGCTGAG
+GTGCACCCGTCACAAGCTGACACGACGAACTAGGTTCAGCGACTGAGATCGCTTCCCGGAAGCGCCGGCC
+CATCTTCGGACGCCAGCTCAACCACATGAATTTCCCCGGTAGCCCCGTCGACCTCCACCAATGCTCCTGG
+TGGCAGAAACCGGGTAGCTCCCTGGGCGTCGACCACGCAAGGGAATCCGAACTCGCGGGCGACCACCGCG
+GCATGTGACATCGGGCCGCCGAGCTCGGTCACCACGGCGGCGGCGTAGCAGAAGGCCGCGGTGTATCCGA
+CGTCGGTGACCTCGGCGACCAGAATCTCGCCGGGCTGCAAATCGTCGATGGTCTCCGGACGCACGATCCG
+CACCCGGCCGCGCACCCGTCCGCCGCAGACGCCGACTCCGCGTAGAGTGTCCCCGGCTGCCAGCGCCGCC
+GCCGACGAAGGCGACGGTTCCCAGCTTCCGCTGAACACCGTGGGCGGAACGATGCCGGCAAGCCTGCGCT
+GTTCGGCACGGCGCCGAGCCACCAGCCCCGACACGTCTGCCGGCAGCGCATCGATTTCATCGACCAAGAG
+GTAGAACACATCGTCCGGGGTGTCGAAGACGCCGGCCTCGGTCAGCCGGCGCCCGTACTCCCGCAGCAGA
+GCACGCAGCACCCAGATGGCACGCACCATCCTGTCGCGGCGGACCTCGCGGTCGCGGAGCTGGCGGGCCG
+CCAGCAACGCAACGGGCTTGGCCCGCAACGGAATCACCGGCGTCGGCGGTTGCGGCGCTGGCACCGCACG
+TAGCGTCTTGGCTACCATCCGCACCAGCAACTCGGGGTTGTCGGCATAGCTGGTGGCGGCCATCTCGACT
+TCCGCCGGACCGCGGTGCCCGATCAGCGTCAGCTCGGCCAGCACCGCGGAATGGAACTCCGGCGCCTCGA
+CAGCTAGCTTGTCCAGACGCTCCCCCGGCTCGGCCAGCAACCGAATCACGACCGGATCCCGCCGTGCCGC
+GGCCACCAGCCGCTGCACCGCCTCCACCGATCGCGCGCTGACCAACTCCGGCCCGGCCGCCGGTGCGGTG
+TCCCGCCCGCACAATCCTCGCAACAACACGTTGAACGCCGCACACAGCATGAACGACCCCGAGGCCAGCA
+CCCAGCCGTGCACGACGTGGTCACGTGCCAACAAGATCAGGCTCAACAACCGGCGGTCGTCGTGGGTAGC
+GAGGTTATCGAAGGCGAGACGCTCCAGGCGATCGACGTCGGCGACATAGGCATCGGTGTCGCGGGGTGAG
+CCGGCGGACAGGCCCACCAGGTTGACGCCGAACACCCCGATATTGCGTAGCGTACGTAACCACCTGCGGG
+CACGGCTGGATTCCGATGGCGGTCGCTGCGCGCCAAAGATGGGCAGCGAAGCCATGCTGGGTCCGAAGAA
+CCCGCTGTTGCTGACGATCGTCGCCGGCTTGGCGAAGGGGACGGTTGCTGCCATGAAATGCGCCGACGTG
+ATGGCCCCGTACAGCCGGTGGGCGAACACCGCGACGGTCCGCATGGCGATTTCGCGCTGGATCACCCCGC
+TGGGCCGCAGCCGCTCGGCGATGCCCACCCCGCCGGCACGCAGGCCCCGCACAGTCACCGATGCCGACGA
+CGGCGAGAACGGGCCGGGCAGCGCCTCCGAGAGGTTGGTGGCCAGATAGGTCGGGAAGCGCGGGTCGATC
+GGCGTGTCGAACTCGCCGTTGGCCCCTTCTGGGCCGGCCAATCTGGGTGCGACACCGTCGTCTGCCGGGG
+AGTCGACCGCCGGAAGGTCCTGGATGTTAGCCAGCCGCCAAGGCAGGGAAAATGTTCGCTTTCCCAGACC
+GATCCGGCCACGCACCGCCAGGGTGAAGTCTTCGAGACACTCCTCGGCGTTCCAGGCCGGCTGGAATCCC
+CAGCGGTCACGCAGGAGCGTGACATCCATCAATGGCGCGCTGTGCAGGAGTTCGAGTTCGGCGAACGAGG
+TGACACGTCGTAGCACTGGGGAGCCAATAGGCACCATGGGCCGCCCGAGCGCGGCCGCAATGCGCCGAAA
+CGTCAACTCGCCAGGGGCGGCGAGATTAACAGGGCCGCTGTCGATTACCGTGTCCAGTAGCGCGCGAACC
+AACAGCCGCTGCGCGTCGTCGGAGTGGACGACTTGTACGACGCGATCAGCATACCCGGCGGGTAACACCG
+GCAGAGCAAACAGCCGCTGCACCCAGTTGTCGACATTTCGACCGAAAATGAGCGCGCAGCGCACGGCGAC
+CCATTCCAGGCCGCAGTCGGCCAGCATCTGCTCGACGCGGGGTTGGTGACCGCTGGACGTGAAAACGATG
+CGCCCGGTTCCGGTCTCGGCCATCGCCTTGAGGACATTGGCGGTGCCGTCGATATTGATGTGGTCGTTTC
+GGCCACGCACCCACGCACAATGCGCGACCACATCCGCACCTGTCATAGCACTTTCGACGGCGGTGGCATC
+CCGGATATCGGCCGCAATGAAATCCGCTGAGCTCGGCCAGCTGTCCGGTCGATGACGTGCGATTCCGACG
+ACCTCGTGACCCTGACTCAGCAATCTGGCGGTCAGGCCGCGGCCGAGAACTCCGCTGGCCCCGGTGACGG
+CGATTCTCACGGTCCTACTCGTCGTCGTTCCGAAACGCCGCGTTGACCAGGTCGTCGAGGTCCATGTCCG
+CGATCTCTTGTTCTGCGGTCGGCGCCAACGCCGGGTCCTGGCCGCTGGTTTCGGTTTCATTTGCCAGCGC
+GAGCAACAGATCCAGCACTCCCGCCTGCCGTAAGCGCTTGACCGGAATGGACGCCACAATGCGTTGTAGT
+TCGGCTTCCCCGGCCGCCACGGCTGAAGTGTCTTGCGGTGATGAGCCGAGCAGTTCTCGACGCATATAGC
+CGGCCAGCGCCGCGGAGTTGGGGTAGTCGAAGATGAGCGTGGGTGAAAGTGAAAGGCCGGTGGCGGATTT
+GAGCCGGTTACGCATTTCGACCGCGGTCAACGAGTCAAAACCCAGGTCCTGGAATGCCCTATCCGGGTCG
+ATGGCTTCGGGGCTGGCGCTACCCAGCACGGTGGCGATGTGCGAGCGCACCAGGTCCAGCAGGACGGCGT
+GTTGCTCGTCTTCGGGCAGCCCGTGCAGGCGATGCGCGAGCGCCGATTTCGATTTCGCCGCGGCCAACGA
+GTCATCGACCTGGCGCCTGGTCGGCGCGTTGATCAGATCGACGAACATCGGCGGCAACGTGCCGCCATCG
+AACTTGACCTTCAACGCCGCAAAGTCGATGTGGGCGGGCAGCATGAATGGCTCGTCGACGATCATTGCGG
+TGTCGAACAATTGCAGGGCGTCAGCAGACGACATCGCCACGATGCCGTCGCGGGCGAAGCGTTTGAAGTC
+CACCGTCGCCAGGCCGCTGGTCATGGCGCTGGCCTGATCCCACAGACCCCAGCCCAGGGAGATGGCCGGC
+AGCCCATGGGCCCGCCGGTGGGCGGCCAGCGCATCCAAAAACGAATTGGCGGCCGCATAGTTGGCCTGGC
+CCGACGATCCGACCAGCCCGGCCATCGACGAAAACATGACAAACGCCGACACATCCAGGTCGCGAGTCAA
+CTCGTGCAGGTGCCACGCCGCGTCCACCTTGGACCGCAACACCACATCCACCCGATCCGGTGTCAGTGAC
+ATCACCACCGCGTCGTCGAGTGCGCCGGCGGTGTGGATCACGCCCGACAATGGATGCTGAACCGGAATAT
+CGGCGATCACCTTGGCCAACGCCGCTCGATCCGCCGCGTCACAGGCCACCACCTGTACCTGCGCACCGGC
+GGCGGCCAACTCGGCCACCAGCTCCGCAGCCCCGGGAGCATCCGGGCCGCGCCGGCTCACCAACACCAGA
+TTGCGCACCCCATGACGAGCCACCACGTGACGGGCCACCGCCGAACCCGCCATCCCGGTGCCACCGGTGA
+TCAACACCGTGCCCGCCGCCCACGAGCCGGGCATCAGCATGACGACCTTGCCGGTGTGGCGCGCCTGGCT
+CAGATAACGCAACGCCGCAGGCGCGCGCCGCACGTCAAAAGTGGTGACCGGCAACGGCCGCAGCACCCCA
+TCGCCGAACAGCGTGGCGAGCTCGGCAAGGATCTGCGCAATGCGGTCCGGTCCCGCTTCGAATAGGTCGA
+AGGCGCGGTAGCGCACGCCCGGGTACTGCTGGGCGATCACGCCGGGGTCGCGGATGTCGGTCTTGCCCAT
+CTCCAAGAACACCCCACCCGGTGCCACCAGACGCAGCGACGCATCCACGAATTCACCGGCCAGCGAGTCC
+AACACCACGTCGAACCCTCGACCGCCAGTGGCCGCGCGGAACTTGTCCTCGAACTCTAGGCTACGTGAAT
+CGGATATGTGGTCGTCGTCAAAGCCCATGGCGCGCAAGGTGTCCCACTTACCCTTGCTCGCGGTCGCGAA
+CACCTCCAACCCCAGATGCCGAGCCAGCTGCACCGCCGCCATGCCCACCCCGCCGGTGCCGGCATGGATC
+AACACGCGCTGGCCCGGTTGTACGTCGGCCAAATCCACCAGCGCGTAGTGGGCGGTGGCGAACACCACCG
+AGGTGGTGGCGGCGGCCGTGTGCGACCACCCCGCCGGCACCTTGACCAGCAGCCGCTGGTCGGTGCTGGC
+GACGGTTCCGGTGCCCTCGGGGAACAGGCCCATTACCCGGTCTCCGACCGCGAAAGATCCCTTGTTCAAG
+CTGGTTTCGATAACGACGCCGCAGGCCTCAACGCCCATGACCGCGTCCGGATCGGGATACAGACCCAGCG
+CGATCATGACGTCGCGGAAGTTGGCGGCAATCGCGGACACCGCAACTCGAACCTGCCCGGGGCCCAGCGG
+CGCGTCGGCATCGGGAATCAGCTCCAGCCGCAGATTCTCGAAGGTGCCGGCGGTGCTCATCGCCAACCGC
+CACGGCCGGTCACTCGGAGGAACCAACAGCCCGCCCACCGCGCGGCTACCGTGCACCCGCGCCGTATAAA
+CCTCCCCGCGCCGCCACAACACCTGCGGCTCGCCTGTCGTCACTACCGCCGCCAGGGCCGAATCGTCGAG
+CGGCGCATCGGAATCGACCAGCACGATCCGGCCCGGATGCTCGGTCTGCGCCGACCGCACCAATCCCCAT
+ACGGCGGCACCCGCCAAATCGGTGACATCTTCGCCCGGCAATGCCACCGCACCGCGGGTCATCACCACCA
+AAACCCCTGCCCCATCACGGGTTAGCCACGACTGCAACACATCAAGCACCGAACTCGTGGCGGCATACAC
+GCCCGCCACTACGTCACCGGCCAGAGGCACCGACTCAAACACCACCGCCGCCGAGTCCTCCGTTGTCCCC
+CAGGCGCACACCGGTAGCGGCTCCACCGCGGCCGATGGCTGCGGCGACCAGGTGACCTCGAATAGCCGGT
+CCGGACCCGAGCTCGACACCGCCGCCCGCAATTGCTGATCGGTCACCGGTCGGGCCAGCATGGAAGCGAC
+TGACAACACCGGCAATCCCAACCCATCGGCCAGCTCGATCGACACCGCCGACGGACCCACTGGCGCGATG
+CGGGCCCGCACCGCCGACGCCCCCGCTGCATGCAACGAGACCCCCTGCCAGGAGAACGGGACCAACACCG
+AACCTTGGCCACGCTCGGCGCTTTCCGCGCTCAACACCACCGCGTGCAAGGCCGCATCCAGCAGCACCGG
+ATGCACCCCGAAGCCGGTGACCGAGACCCCGGCATCGGCGGGCAACGCCACCTCCGCGAACACCTCATCA
+CCCCGGCGCCACATCGCGGTCAGTCCCCGAAACGCCGGCCCGTAGCCGTATCCGCGCTCGGCCAGCTGCT
+GATAGCCGTCCGCCACCTCAACCGGGACGGCGCCCGCCGGCGGCCACATCGCTAGATCCGCGGTCGGTTC
+CGCCGACCCGGCGCGCAGCGCGCCCTCGGCGTGCAACACCCAGCCGGTACCGACGTCACCACGCGAATAC
+ACCGACACCCCGCGCACGCCGGACTCGTCGGGACCATTGACGACCACCTGAACCGCCACCGAACCGGATG
+CGGGCAACACCAACGGCGCGGCCAGCGTTAATTCGTCGACAACGCCACAACCCACTTCGTCGCCGGCGCG
+GATCGCCAACTCCACAAATCCCGCTCCCGGGAAGATCGTCACGCCGGCAACGGAGTGGTCGGCCAACCAG
+CCCTGCACGCTGGGCGACAGCCGACCCGTCAACACCACCCCGCCCGAGGCCGGCAGATCGATCACCGCGC
+CCAAGAGCGCGTGCTCACTGGCCGCCAACCCCAAGCTGGCCGCGTCCGCCGCGACACCATCACCGGACAG
+CCAAAACCGCCGCCGTTGGAAGGCATACGTCGGCAACTCGACAAACTGCGCCTCGCCTACCACAGCGCGC
+CAATCCAGGTCCATACCGGTGACAAACCCTTGCGCGACGGCGTTGGTCAACGTCGCCGGCTCGGGGCGAT
+CCTTGCGCAGCGCAGACATCGTTGTCACCGCAACGTCGGGCAACGACTCTTCGATCGACGCAACAAGGCC
+ACCGCTGGGCCCGACTTCGAGGAATCGGCTGCCTCCGGCCGCCTGCGCGAAGCGCACACTGTCGGCGAAC
+CGCACGGCTTGCCGGATGTGACGTCGCCAGTAGGCCGCTGATCCGAAATCGTCGCCCGCCAACTGCCCGG
+TCACGTTGGAGATGACTCCGATGGTGGGCCGGCCGATGGCGATTCCGGCAGCGACGGCTGCGAATTCGTC
+GATCATCGGATCCATCAACGGCGAGTGGAACGCGTGGGAAACCGCCAGCTGGTGGACTCGTCGTCCGTCG
+GCGCGCAGCTGGTCGGCCACCGCGGCCACGGCGTTTTGTGCACCCGAAATCACCAGTGACGCTGGACCGT
+TGACCGCAGCGATGTCAACCTCAGCGCTCAGCAGCGGCCGCACCTCTTCCTCGGCGGCTTGCACGGCGAC
+CATCGCCCCACCGGCCGGCAACGCCTGCATGAGCCGGCCGCGGGCAGCCACCAACACCGCAGCGTTCTCC
+AACGACAGGACACCGGCGACATGTGCCGCAGACAACTCACCGATCGAGTGGCCCATGACAAAATCCGGTC
+GTACACCCCAGGATCCCAGCAACCGGAACAGGGCAACTTCCACCGCGAACAGCGCGGGCTGCGCGAATTC
+CGTGCTGTTCAGTAGGTTTTCGTCGTGACCCCACATCACTTCGCGCAGTGGGCGCAGCAGATGCCGGTCA
+AGTTCGCCCACTACGGTGTTGAACGCCTCGGCGAACACCGGGTATCCGGCGTGCAATCCCATTCCCATGC
+CCAGCCATTGGGAGCCTTGGCCGGGGAAGACGAACACCGTCTTACCCGCCGCAGTCGCCGTGCCCCGAAC
+AACCGAGCCGCCCAACTGGTCACCCGCCAGCTCATCGAGCCCGGCCAACAACCGATCACGGTCCCCGCCA
+ACCACCACCGCCCGATGCTCAAAAACCGAACGACCCGCCAACGACCACCCCACATCGGCAACATCGAGGC
+CATCATCGCCACGCACGTACGCGGCCAACCGAGCCGCCTGCCCCCGCAACGCCGACTCCGACTTCGCCGA
+CACCACCCACGGCACCACCGGCCCCGCCCAACCAGCCTCCCGCCGCGGCACCACCGGCACCGCCTCGATA
+ATCACATGCGCATTAGTGCCACTAATCCCAAACGACGACACCCCCGCACGACGCGTCCGAGCACCAGCAG
+GCCACACCCGCGGCGCGGTCAACAACTCCACCGCCCCCGCCGACCAATCCACATGCGGGCTAGGCACATC
+CACGTGCAACGTCGCCGGCAACAGCTCATGGCGCATCGCCAACACCATCTTGATCACCCCGGCCACCCCC
+GCCGCGGCCTGCGTATGACCCATATTCGACTTCACCGACCCCAACCACAAAGGTTCTCCCGGCTCCCCCC
+GATCTTGCCCATAAGTGGCCAACAACGCCTGAGCCTCAATCGGATCCCCCAACGTGGTCCCGGTCCCATG
+CCCCTCCACCACATCCACCTCGGCCGCGCTCAACCCGGCATTGGCCAACGCCGCCCGCACCACCCGCTGC
+TGCGAAGGACCATTAGGCGCGGTCAACCCATTCGACGCCCCATCCTGATTAACCGCCGACCCGACCACCA
+CCGCCAACACCGGATGACCCAACCGCCGCGCATCCGAAAGCCGCTGCAGCACCAACATCCCACCGCCCTC
+GGAGAATCCGGTGCCGTCGGCCGCCGCGGCGAATGCCTTGCAGCGCCCGTCCGGGGATAATCCGCGCCAG
+CGGCTGAATTCCACGAAGATGTCGGGTGTGGCGTTGACGGTGACGCCGCCGGCCAGCGCCAGATCGCACT
+CCCCCGACCGCAGCGATCCCACCGCCATATGCAACGCCACCAACGACGACGAACACGCCGTATCCACCGA
+CACCGCCGGACCCTCCAACCCCAGCACATAGGCCACCCGACCCGAGGCGACGCTGGACAATTGGCCGGTC
+AGCCGGAAGCCTTCTACCGGCTCGGCGGCGAACATGCCGTAGCCTTGCGTCATTACCCCGGCGAATACCC
+CGGTGGCGCTGCCGCGCAATCCGGTCGGATCGATACCGGCCCGCTCCAACGCCTCCCAGGACAACTCCAG
+CAACATCCGTTGCTGGGGGTCCATCGCGAGGGCCTCGCTCGGCCCCACCCCGAAGAAGGCGGGGTCGAAG
+TCGCCGACCCCGTCCACAAAGCCGCCGGTGCGGGTGTAGCACGCACCCGCGGCGTCGGGGTCGGGGTTGT
+ATAGCCCGGCCAGGTCCCACCCGCGGTCCGCCGGGAATTCGGAGAGCACGTCGCGGCCCTGGATCAGCAT
+GTCCCACATGTCGTCCGGGGAATTCACCCCGCCGGGATAGCGGCACGCCATGCCCACGATCGCGATCGGA
+TCCTCGCTCGTGGTGCGTACCGCGGGTGTGTGCTTGATTTCCTGTGGGAGGCCGGCAAGTTCGGTGCGGA
+TATAGGAGGCCAGCCGATTGGGTGTCGGGTAGTCGAAGATGAGCGTGGGTGAAAGTGAAAGGCCGGTGGC
+GGATTTGAGCCGGTTACGCATTTCGACCGCGGTCAACGAGTCAAAACCCAGGTCCTGGAACGCCTTGTCG
+GGGTCGATGGCTTCTGGCGTGATGTTGCCCAGCACGGTGGCGATGTGCAAACGCACCAGGCCCAGCAAGA
+CGGCGTGCTGTTCGGCTTCGGGCAGCCCGTGCAGGCGATGCGCGAGCGCCGATTTCGACTTTGCGGCGGC
+CACGGAGTCGTCGACCTGACGGCGGGTCGGCGCGCTGGCTAGGTCGGAGAACATGGGCGGCACCGCCACC
+GCATGGGCTCGCAGTGCGGTGAGGTCAATGCGGGCGGGCGCCAGGAATGGCTCGTCGACGATCATTGCGG
+TGTCGAACAGTTCCAGCGCCTCAGCGGTGGACAGCGCCAGCACCCCTTCACGACCCAGCCGGGCCAGGTC
+TGCGGCGTCCAGGCCGCTGGTCATGGCGCTGGCCTGATCCCACAGACCCCAGCCCAGGGAGATGGCCGGC
+AGCCCATGGGCCCGCCGGTGGGCGGCCAGCGCATCCAAAAACGAATTGGCGGCCGCATAGTTGGCCTGGC
+CCGACGATCCGACCAGCCCGGCCATCGACGAAAACATGACAAACGCCGACACATCCAGGTCGCGAGTCAA
+CTCGTGCAGGTGCCACGCCGCGTCCACCTTGGACCGCAACACCACATCCACCCGATCCGGTGTCAGTGAC
+ATCACCACCGCGTCGTCGAGTGCGCCGGCGGTGTGGATCACGCCCGACAATGGATGCTGAACCGGAATAT
+CGGCGATCACCTTGGCCAACGCCGCTCGATCCGCCGCGTCACAGGCCACCACCTGTACCTGCGCACCGGC
+GGCGGCCAACTCGGCCACCAGCTCCGCAGCCCCGGGAGCATCCGGGCCGCGCCGGCTCACCAACACCAGA
+TTGCGCACCCCATGACGAGCCACCACGTGACGGGCCACCGCCGAACCCGCCATCCCGGTGCCACCGGTGA
+TCAACACCGTGCCCGCCGCCCACGAGCCGGGCATCAGCATGACGACCTTGCCGGTGTGGCGCGCCTGGCT
+CAGATAACGCAACGCCGCAGGCGCGCGCCGCACGTCAAAAGTGGTGACCGGCAACGGCCGCAGCACCCCA
+TCGCCGAACAGCGTGGCGAGCTCGGCAAGGATCTGCGCAATGCGGTCCGGTCCCGCTTCGAATAGGTCGA
+AGGCGCGGTAGCGCACGCCCGGGTACTGCTGGGCGATCACGCCGGGGTCGCGGATGTCGGTCTTGCCCAT
+CTCCAAGAACACCCCACCCGGTGCCACCAGACGCAGCGACGCATCCACGAATTCACCGGCCAGCGAGTCC
+AACACCACGTCGAACCCTCGACCGCCAGTGGCCGCGCGGAACTTGTCCTCGAACTCTAGGCTACGTGAAT
+CGGATATGTGGTCGTCGTCAAAGCCCATGGCGCGCAAGGTGTCCCACTTACCCTTGCTCGCGGTCGCGAA
+CACCTCCAACCCCAGATGCCGAGCCAGCTGCACCGCCGCCATGCCCACCCCGCCGGTGCCGGCATGGATC
+AACACGCGCTGGCCCGGTTGTACGTCGGCCAAATGTATGAATGCGTAGTACGCGGTGGTGAAGACAGCCG
+AGATGGCGGCGGCTTCGGCGTAGGACCAGTCGGCGGGCATCGGCAGCAGCAGCCGGACGTCGCCGGCCAC
+CAGGGTGCCGCTGCCGTCGGGGAAGAATCCGAACACCGAATCACCGACCGAGAATTCGGTGACACCGGGG
+CCGACCTCGACGACCACGCCCGCGCCTTCGCCGCCGAGCAGCGCGTCGTGGGTGAACATGCCTAGGGTGA
+TCATGATGTCGCGGAAGTTCGCGGCGATGGCGCGCATGGCCACCCGGACCTGGCCGGGCCCCAACGGTGC
+GTCGGCGTTGGGAACCGGCTCGAGCCGCAGATTTTCGAAGGTGCCCGCGCTGCCCAGACCCAACCGCCAT
+GGCCCATCGCCCGGCGGCACCAAGATGGCATCCGCCGCGCGGCTGCCGCGCACGCGCGCGGTGTACACCT
+GTCCGCCCCGCAGCACTACCTGCGGCTCGCCAGTCGCCAACGCCATCGCGATCGCCGCGTCGTCGGTGGC
+CGCATCGGAATCGACCAGCACGATCCGGCCCGGATGCTCGGTCTGCGCCGACCGCACCAGCCCCCACACG
+GCCGCGCCCGCCAGATCGGCGACGTCTTCGCGGGGCAGCGCCATCGCGCCCCGGGTCGCCACCACCAGCA
+CCCCGGATTCATGGTCGGTCAGCCACGACTGCACTGCGGCCAGAGCCTGGTGGCTGCGCACGTAGCTGCC
+GGCTACCGGATCTTGGTCAGCCGCAACCGATTCAAAGATCTGGTAGGCGGGGGTAGGCCCCGGGGACGTG
+GCCGCCGACGCGGGCGACCAGATCACTTCGAACAGCCGGTCGGGACCCGAGCCCGACACCGCCGCCAGCA
+GCTGCCGCTCGGTCACCGGGCGGGCCACCATCGAGGCCACCGACAATACCGGCAGACCCAGCCCGTCCGC
+CAACTCCACCGACACCGCCGACGGCCCCGCCGGCGCGATCCGGGCCCGCACCGCCGAGGCCCCCGTGGCA
+TGCAACGACACGCCCTGCCAAGCGAACGGCAATGCGAGTTCGTCCGGGTCGCCGGCGATCACGACCGCAT
+GCAAGACGGCGTCCAACAAAGCCGGATGCACACCGAACCCACCGACTCCCCCGGCCGCCTCCGGCAGCCT
+CACCTCGGCGAATATTTCCTCGCCGCGGGCCCACATCGCGGTCAGCCCGCGAAACGCCGGTCCGTACCGG
+TAGCCGCGTGTCGCCAACCGCTCATAGCCATCGGCCACGTCCACCGTCACGGCACCTGCCGGTGGCCACA
+CCGATAGGTCCGCGCCTGGTTCAACCGACCCGGGCCGCAGGATACCCTCGGCATGCAAAAGCCAGCCCGC
+TTGCGCGTCAGCTCGGGAAAATATCGACACACCACGGGAATTCGAATCCCGGCCAGCGTCGACTACCACC
+TGCACCGCAACGGAGCCGGTGGCGGGCAACAGCAGGGGTGCGGCCAGCGTCAGCTCGTCAAGCACCGAGC
+AGCCGACTTCGTCGCCGGCGCGGATCGCCAGCTCCACGAATCCGGTGCCCGGGAACAGCACCACGTCTGA
+AACGGCGTGGTCGGCCAACCACGGCTGCACGTTGGGCGACAACCGACCCGTCAACACCACCCCGCCGGAG
+GCGGGCAGGTCGACCACCGCGCCCAGCAACGGGTGTTCGCTCGCACCCAACCCCAAACCGGATACGTCGG
+CGCCTGAGCCCTCGGCCGAGAGCCAAAACCGGCGCTTGTCAAAGGCATACGTCGGCAGCTCCACATAGCC
+CGCTCCGTCCAGCGTGCCCCGCCAGTTCACAGCCACCCCCGCCACAAACGCGGACGCCGCCGAGAGCAGG
+AATCGGTGCAGCCCACCATCTCCACGCCCCAGCGTGGGGACGACAATGGCCTCGCTGTCACCGTCGGTGC
+ACGCGGCGAATGTTTCCTCGACACCGGTAATCAACGCCGGATGCGGGCTGGATTCGATGAACGTGCGGTA
+GCCCTGCTCGCAGGCGTTGCGCACCGCCTGGTCGAATAGCACGGTCTGGCGGACGTTGCGGTACCAGTAG
+TCGGCGTCCAAACCAGCTGTATCCAAACGATTTCCGGTCACCGTAGAGAAGAAGACGGTACGCGTGGATC
+GCGGTTCGATGCCGGACAGAGCTTCGGCGAGTGGGCCACGGATCGCCTCGACCTCCACCGAATGCGAGGC
+ATAGTCCACCTCGATCCGGCGGGTCCGCAGTTCCTTGGTGGAGCACACCGCGATCAGCTCCTCCAGCGCG
+CCCACTTCGCCCGACACCACCACCGCCGAGGGGCCGTTGACGACGGCGATGCTGACCCGATCGCCGAAGG
+GCGCCAACAAATCCCGCGCCTGGTCGGCACCGCACGCGATGGACACCATGCCGCCCGGGCCGGCCAGTCC
+GGCCAGCAACTTGCTGCGCAGCGTGACCACCCGTGCGGCGTCGCGCAGCGACAGCGCGCCGGCAACGTAG
+GCGGCAGCGATCTCGCCTTGCGAATGACCGATCACCGCATCCGGATGCACTGCGACCGACTTCCACAGCT
+CGGCCAGTGACACCATCACCGCGAACAGCACGGGCTGCACCACATCCACGCGATCCAGTCCCGGTGCACC
+GGGGGCGCCACGCAGCACGTCCACCAGCGACCAGTCGACAAATTCCGCGAACGCCTCGGCACACGCGTCG
+ATCTGCTGCGCGAATGCCGGTGCGGTATCGAGCAGTTCGATTCCCATGCCCAGCCATTGGGAGCCTTGGC
+CGGGGAAGACGAACACCGTCTTACCCGCCGCAGTCGCCGTGCCCCGAACAACCGAGCCGCCCAACTGGTC
+ACCCGCCAGCTCATCGAGCCCGGCCAACAACCGATCACGGTCCCCGCCAACCACCACCGCCCGATGCTCA
+AAAACCGAACGACCCGCCAACGACCACCCCACATCGGCAACATCGAGGCCATCATCGCCACGCACGTACG
+CGGCCAACCGAGCCGCCTGCCCCCGCAACGCCGACTCCGACTTCGCCGACACCACCCACGGCACCACCGG
+CCCCGCCCAACCAGCCTCCCGCCGCGGCACCACCGGCACCGCCTCGATAATCACATGCGCATTAGTGCCA
+CTAATCCCAAACGACGACACCCCCGCACGACGCGTCCGAGCACCAGCAGGCCACACCCGCGGCGCGGTCA
+ACAACTCCACCGCCCCCGCCGACCAATCCACATGCGGGCTAGGCACATCCACGTGCAACGTCGCCGGCAA
+CAGCTCATGGCGCATCGCCAACACCATCTTGATCACCCCGGCCACCCCCGCCGCGGCCTGCGTATGACCC
+ATATTCGACTTCACCGACCCCAACCACAAAGGTTCTCCCGGCTCCCCCCGATCTTGCCCATAAGTGGCCA
+ACAACGCCTGAGCCTCAATCGGATCCCCCAACGTGGTCCCGGTCCCATGCCCCTCCACCACATCCACCTC
+GGCCGCGCTCAACCCGGCATTGGCCAACGCCGCCCGCACCACCCGCTGCTGCGAAGGACCATTAGGCGCG
+GTCAACCCATTCGACGCCCCATCCTGATTAACCGCCGACCCGACCACCACCGCCAACACCGGATGACCCA
+ACCGCCGCGCATCCGAAAGCCGCTGCAGCACCAACATCCCACCGCCCTCGGACCAGCCGACCCCATCAGC
+CCGCCCGGCGTAAGGCTTGCACCGGCCGTCGGGTGCCAGCCCACGATGCCTGCTGAATTCCACGAAGACC
+GTCGGTGTGGCGTTGACGGTGACGCCGCCAGCCAGCGCCAGATCGCACTCCCCCGACCGCAGCGATCCCA
+CCGCCATATGCAACGCCACCAACGACGACGAACACGCCGTATCCACCGACACCGCCGGACCCTCCAACCC
+CAGCACATAGGCCACCCGACCCGAGGCGACGCTGGAGGTCATCCCGGTCAGCCGGTAGCCCTCGATCTCC
+TCGGCCAACATTCCGTAGCCGCCGACGATGAGCCCGGCGAATACCCCGGTGGCGCTGCCGCGCAATCCGG
+TCGGATCGATACCGGCCCGCTCCAACGCCTCCCAGGACAACTCCAGCAACATCCGATGCTGTGGATCCAT
+CGCTAACGCCTCGCTGGGCGAAATACCGAAGAACGCGGGATCGAAATCCGCGACGCCATCCACGAAGCCC
+CCAGTGCGCGCGTACGACTTATGGCGCACGTCGGGATCCGGGTCGAACAACCCGGCCAGATCCCACCCAC
+GGTCGGTGGGAAATTCTGACATCACGTCCCTGGCGTCGGCCACCATCTGCCACAGCCCTTCCGGGGAATC
+GACGCCCCCCGGGAAGCGACACGACATGCCCACGATCGCGATCGGCTCGCTCGAGCGCTCCAGCAACGCA
+CGGTTGGTGCGCTTCAGGCGTTCCACCTGGACCAGCGCTTTGCGCAGCGCTTCGGTCGCATGCTGGAGTT
+GATCAACCATTACTAACCTCGCCTAACTCTCGCTAATATTGGCCGTCGCCGACCGCCGGATGCGGCTCCC
+GCCGAGTCACCGAAGTTGCTGCACAAAACGACGCCGTCGTACGGCGCTCTGGCGCAAGTTCGCTGGTGAG
+TATTGCCAACTCCGGCAGGATTTCAAAGCGTCCAATACTCCCTGGGCACCAGTGCGCCCGTGCAAAGCCT
+GCCGTCCATGGCGCGACTGTACCCGCCCGCCCGTCAACGCCGGATGGGCGCATGTCAATGCGGTGCTAGC
+GGTGGTCTTCACAACACAGCCGCACGAATGCAGCGACTAGGCGCCGGCTCGGCGCCACCCATCGGCAGCC
+CTGGCGGCCCGGATCAGCTCGTCGCACAGATCGCGCAGTTCGGTCGCCGCGGCTCCTTCGTCGAGCGCGG
+TGACGACATCCTCGGCGGCGCATCGCACCTGGTAAACACGATCCGACAGATCGGCCGCGTCGTCGGCTGA
+CAACACGACCGCATCGGCGGGCAGCGCCCTCACCTCACCCCGGGTCAGCATGGCGCGCTGCTCGTAAGCC
+CGCTGCCGGCAAGACTGCCGGCAATACCGGCGGCGACGGCCCATGCCGACGTCGGTCACGTCACGGCCAC
+ACCACCCGCACGGCTGCGGACGGGCACGACGAGTCATGCCTGCAGACATTAGTCCGCCCGGGTGTCCGAT
+CCCGGTATCATTGATGGTCGCGCCGCGCGCGTCGCGTGCCGGGAACTACGCAGACGGCCGCAGCGTTTGC
+CAACCGGAGCCAGTCGCCAGTACGCAACCTACCAGCAGAGCCCAGGGCTCACAGGACCTAAAGGAGTAGC
+GCCCATGGCTGATCGTGTCCTGAGGGGCAGTCGCCTCGGAGCCGTGAGCTATGAGACCGACCGCAACCAC
+GACCTGGCGCCGCGCCAGATCGCGCGGTACCGCACCGACAACGGCGAGGAGTTCGAAGTCCCGTTCGCCG
+ATGACGCCGAGATCCCCGGCACCTGGTTGTGCCGCAACGGCATGGAAGGCACCCTGATCGAGGGCGACCT
+GCCCGAGCCGAAGAAGGTTAAGCCGCCCCGGACGCACTGGGACATGCTGCTGGAGCGCCGTTCCATCGAA
+GAACTCGAAGAGTTACTTAAGGAGCGCCTCGAGCTCATTCGGTCACGTCGGCGCGGCTGACCCGGGAACC
+CCCTGCTCCCGGCCGGGCAATGTCCGGTCGTGCGCGTGCGTGGTCCGAGCGCGAAAGGCGTCCCTCGATG
+CCCCAGCGGGCGACTTTGACCAGCGCCTCACGAATGTTGGACCCGCTCATCTTGGACACACCGAGCTCGC
+GCTCGGTAAAGGTAATCGGCACCTCGGTGACGACGAACCCGTTGCTCACCGTGCGCCAGGTGAGATCGAT
+CTGGAAGCAGTAGCCCTTGGAGTCCACGCCGTCCAGGTCAATCGCTTCGAGTGCTTCGCGGCGGTACGCG
+CGGTAGCCAGCGGTGATGTCGTGGATCCCGATTCCGAGCGCCAGGCGCGAATAGGTGTTAGCGGTTTTGG
+ACAGGACTAGCCGCCGCCAAGGCCAGTTTCGTACCGTCCCCCCCGCGACATAGCGCGAACCAATCGCAAG
+ATCGGCACCAGCGTCGACGGCGTCCAGCAGGCGCTGCAGCTGTTCGGGCGCGTGGCTGCCGTCGGCATCC
+ATCTCGACCAGCACCGAATACTCCCGGCTCAACCCCCAGGCGAAACCTGCCAGGTACGCCGCGCCCAAAC
+CGTTCTTGGCGGTGCGGTGCATCACGTGGGTGCGGCCGGGATCGGCCTGCGCCAGCTCGTCGGCGAGCTG
+GCCGGTGCCGTCGGGGCTGCTGTCGTCGACGACCAGCACGTGCACGGCGGGGCATGCTTGCGTCAGCCGC
+CGGTGGATCACCGGAAGGTTCTCCCGCTCGTTGAACGTAGGAATGATCACCAGGACGCGCTGGCTGGGAC
+GGTTACCCGGGGCTGGGGGCGCCGGCTGGCCGGTGGTCATGTAACTCCTCGATGTTGCTCTGTGTCGTCC
+GAAACCGGATGAGTGTCGGCCGCCCTGCTCGGGCTGAATGAGTTCGTCGTCGGATTCACTCAGGGCCGGC
+GGACCGGAGGCCTCAGATCTGCCCGGGGGCGCATCGGAATCGTCATTTTCGCCCTTTGGCTCCGAGCGCC
+TCGGACGCGGGAACCACCCATTCTGCCGCATGGCGACGAGAACGACCGCTGCGGCTGCCCCGACGAGAAT
+CCATTGCAGGATTGGACCCCATCGAGTTGCCGGTGTCAGCCTCGTCTTGAGGCGCACCTGGCTGTCCAGG
+TATGCGGGCTGGAAAAAGTCGGTCCGGATCAGCTCACCCCCGTCTGGTGCTATCACCGCACTGATCCCAG
+TGGTACCGGCAACCACCACGTATCTGTCGTGCTCGACGGCCCGTACCTTGGCGAATGCCAGCTGCTGTTC
+GCTCATTGTCTTGTTGAAGGTGGCGTTGTTGCTGGGCACGGTCAACAGCTGCGCGCCGCCCAGAATCGAC
+TTCCGCGGGGCGCGGTCGAAGATCACCTCCCAGCAGGTAGCCACCCCGACCGGGACCCCAGCGATGCGCA
+CCACACCGGTGCCGTTGCCGGGCACGAAGTGGCCGGCGCGGTCGGCGTAGCCGGAGAGGTGCCGAAACAG
+CCACGGCATGGGCAGGTACTCGCCGAAGGGCTGCACGATTGCCTTGTCGTGGCGGTCGGCCGGCCCGGTG
+CCGGGATTCCAGACAATGGCCGTATTGGTCCACTCCGGATTTTCACGAGGACGGCCCGGAACATCCATCA
+GGGTGCCGATCAGGATCGGCGCGCCGATCGCTTCGGCCGCTGCGGAGATCCGTTGACCGGCGTCGGGGTT
+GACGAACGGGTCGATGTCCGACGAGTTCTCCGGCCAGATGACGAACTGGGGTTGCTGCGCCAGCCCCGCA
+TGCACGTCGGCGGCCAGCCGCAACGTCTCCTCAACGTGGTTGTCTAGCACCGCCCGACGTTGCGCATTGA
+AGTCGAGACCGAGCCGGGGCACATTGCCCTGGACCACCGCGACGGTGACCGTGGGTTCGCCGCCCGATCC
+GCTACCCGCATGCCGCACCTGCGGCCAGACGACGATGGCGGCGAACAAGACCAGGCATATGCACGCGGCC
+GGCAGCACCACCGCCGGCGGCGCATCCCCCTGACCACCGGTTCGCCACCACTTCTCGATTTCCAGCGCGA
+TCGCGGTCAAGCCGCATCCGACCAGCGCTACCCCCGTTGACAGCAGCGCCACACCGCCGAGCTGGACCAA
+CGGCAACAGCGGGCCTTCGGCTTGACCGAAGGCGACCGACCCCCACGGAAATCCACCGAACGGAAGGATC
+GACTTCAACCACTCCTGCGCCGCCCACCCCACCGCGAACCAGATCGGCCAACCCGGCAACAGGCGTACCA
+CGACGGCGAACAGACCGAAGATGCCGGGGAACAGCGCGCACGTCGTCGCCAGTGCCAACCAGGGCCCGGG
+GCCCACCAGCTCGCCGATCCACGGCAACAACGAGACGTAGAACACCAGGCCGAATAGCAGGCCGTAGCCC
+AGCCCACCCACCGGTGTCGTCGCGCGGTGGGTCAGCACCCAGGCCAGCAATGCGAGCGCAACCACCGCCG
+CCCACCAGCAGTTGCGCGGCGGGAAGCTGGCATACAACAGCAGACCGGCCACGATGCTGACCACCAGGCG
+CGTCAGCCGCGTCCGCACCGCGGTCCGTGTGGTGGGCAGCTGCGCTGCCACCCAGGCGCCAAGCTTCACC
+AGGCGCCGGCGGGCCGCGGCGCCGAGCCAGGCAGCCGCGCTCGGCGCGTCGGGGCCTTCCGCCGGCTCGG
+CCGACAGTTCGATCTCTGGATCGGCGGGGCTCTCCGGGCCGGCCTCGGCGACCTCAGCGGGCCGCGCCTT
+CCGGCCGAACCATTCCCTAGCCATAGATGACCGCACCTCGATGCACGGTTTGGCGGCAACGCGGCAAGGC
+GTCGGTCGGGCCCAGCCGCGGCAATGCGGGTACCCGGGAGCGCGGGTCGGTAGACCAGCGCTGGACTGCG
+TCGCGCGGTGCGTCGACGTCAAAGTCCCCGGCGTCCCATATCGCGTAGGACGCGGGCGCGCCGGGCACCA
+GGGTGCCGATCCGGCCGTCTCGAACACCACCGGCCCGCCAGCCGCCGCGGGTCGCGGCAGCAAACGCCGC
+CCGCGCCGATACCCCGCTGCCCGGCGTGCGGTGATTGACCGCCGCGCGCACGCTGGCCCAGGGATCAAAG
+CCCGTGACGGGCGCGTCGGAGCCAAGCGCGAGGGGCACGCCTTGGGATGCTAACAGCGCCAGCGGGTTGA
+GTTCGCTGCCTCGCTGGGCGCCCAGGCGGCGAGCGTACATGCCGTCGCCACCGCCCCACAGCTCATCGAA
+GTTGGGCTGCACACTGGCGATGACCCCCCAAGCGCCCAGCTTCGCGGCCTGGTCCGCGGTGACCATCTCC
+ACATGCTCGAGGCGGTGGCCGCAGCGGGCGACGGCAACCACGCCGAGATCTGCCACCACCCGTTCGAAGG
+CGGCGACTGCGGCCGACACCGCAGCGTCGCCGATGACGTGGAAGCCGGCGGTCACTTCGGCCTTGGTGCA
+TGCTCGTACGTGCGCTTCGATGCCGTCTACGTCAAGGTGGCAGGTGCCGATGCAGTCGGGGGCGTCCGCG
+TAGGGCTCGTGCAGCCAGGCGGTGCGCGACCCGAGCGCCCCGTCGACGAACAAATCACCGGCCAGCCCTC
+GAGCCCCGGTCTCGGTCACCAGGTCACGGGCCTGGGCCGGCGTGGCCACGGCCTCACCCCAGTACCCGAT
+CACCTCGACTCCGTGCTCGAGTGCACGCAGCCGCAACCAGTCGTCGAGCCCGCCGATTTCCGGACCGGCG
+CATTCGTGCACGGCGACGACGCCGGCCGCGGCTATGGCCTGCAGCGCCACGGCCCGGGCGTCGGCAAGCT
+GGACGTCGGTCAAGAGGTAGCGTGCGGCGGCCCGGGCTAGGTGGTGGGCATCACCGGTCAGCGGCCGCTG
+GGCCGTGTAACCGGTTGCCGCCGCCAGCTCGGGGACCAGCCGCCGCAGTCCGGAGGAGACCAACGCGGAG
+TGCGAGTCGATCCTGGCCAGGTAGGCGGGACAGTCACCGAGAACCGCGTCTAGGTCGGCGGTGCTGGGCG
+CAGCATTCTCCGGCCAGGCCGACTCATCCCAACCGTGACCCCACAGCGGCTGACCCGGATGGTCGGCCGC
+ATAGTCGGCGACCATCCGTAGGCACTGCGCGCGTGAGGTCGCGGGCCGCAAGTCCAGCCCGCTGAGCATC
+AGACCGGTCGCGGTCAGGTGGATGTGGCTGTCCACGAACCCCGGCGCCACGAATCGGCCGTCGAGATCCT
+GCACGTCAGCGTCTGGGAACTGGTCGCGGCCGACGTCGTCGCTGCCCAACCAGGCGACGACATCGCCGCG
+CACCGCCATCGCGGTGGCTTCGGGGTGGGTGGGGCTGTACACCCGGCCGTTGACCAGGAGTTTGACGGGA
+ATCTGGCTCACACCGCTAATTCGACCCCGGCGATGGAGGTTCTGCGGCTACCCGAGGGGGCTGAAGGGTC
+AACGGCTCGACATCTATGACGTCGATGACCTCGCCATCAATAAAGTCCGGGTCGGTGCCGCTCTCGCCGA
+AGGCCCCGGCCATGTTGGCCGCCGCATCGGCCGTCAGTGGCACGTTCCGCAGGAAACCGCGCACGGCGAT
+CGCGGTCAGCCCGGGTCGAGCGAGCGCCCGGATCGGCGGCACCAGCAGCAACAGCCCCATCGTCGTGGTG
+ACCAGACCAGGAACAAGCACCAAGACCGAGGCAACGGTGACCAGCGCGCCGTCACTCAGTGCGCTTCGTG
+GTTCCGCCAAGCCGGATCGCAACCACAGGAGCCGTCGGCCGAGCTGCCAGCCACCGAGCGGCGCCAGCAG
+ACCGAACCCGAGGACGAACGTCGCCAGCAACACCAGCAAAGTCCAGCCAAACCCGATCGTCGCCGCCAGC
+GCGAAAACCACCGCGAGCTCGACGACGGCGTAGCTGAGCAGCAGCCGCGACACCACGTGACGCCAACGTC
+TGCGGGCTAGGCCCGAGTTCCTCGGGGGCGGACATCGAGGCTGCAGTTAGATGACGCTATGACAACGATA
+GAGATCGACGCTCCCGCCGGACCCATTGATGCGCTGCTGGGCCTTCCCCCCGGCCAGGGCCCGTGGCCGG
+GTGTGGTGGTGGTGCACGACGCGGTCGGGTATGTCCCCGACAATAAGTTGATTTCCGAGCGTATCGCCCG
+GGCAGGCTATGTGGTGCTCACCCCGAACATGTACGCCCGAGGCGGCCGCGCCCGATGTATCACCCGAGTC
+TTTCGCGAGCTGTTAACGAAGCGGGGCCGCGCGCTCGATGACATCCTGGCCGCCCGCGATCACCTGCTGG
+CCATGCCAGAATGCTCCGGTCGGGTTGGCATTGTGGGCTTTTGCATGGGCGGTCAGTTTGCGCTTGTCTT
+GTCGCCCAGAGGTTTTGGCGCCACCGCGCCCTTTTACGGCACTCCACTGCCGCGCCACCTCAGCGAGACG
+CTAAACGGGGCATGCCCGATCGTCGCCAGCTTCGGCACCCGCGACCCGCTGGGTATCGGCGCAGCCAATC
+GACTACGTAAAGTGACCGCGGCCAAAAACATCCCCGCCGATATCAAGTCCTACCCGGGCGCCGGGCACAG
+CTTCGCGAACAAACTGCCCGGTCAGCCGCTGGTGCGCATCGCGGGATTCGGCTACAACGAGGCCGCGACC
+GAAGACGCGTGGCGTCGGGTCTTTGAGTTCTTCGGCCAGCACTTGCGCGCCGGCTCGCCTGGTGAGCCTT
+AGGTACGACTTCGACTCCCCGCGGATGCCGATGACCTTGTCCCGTCGGAGGGCGGCGGGGCTGTCATGTC
+CGCGTGCACCCCGAAGGCGAGATGAACATGATTGTCATCATGAAGTAGTGGGCCACAGCTGCGGGTGTCA
+GCTGGCGAAAAATGCGCGCGGCGCCCTCTTCGTTGCCTGACGTGTGCGGCGCGCCGACATGGGTTTGGCG
+AGCATGGCCTCGGTAAGTTCCCCGGCTTGCCGGATGCGGGTCATGGGCACAGTGCAGCGCGTCGCTGCCT
+GTCCTGGCCCGGGTAGGGCAGCAGCGCCATCTCGCGGGCGTTCTTGATCGCCTGGGCGACTTGGCGTTGC
+TGCTGGACTGTCAGGCCGGTCACTCCCCGGGAGCGAATCTTGCCTCGGTCAGAGATGAACACCCGCAATG
+TTGCGGTGTCTTTGTAATCGACGCTCTCGACGCCGAGGCTATCGAGCAGGTTTTTCTTCGCCTTCGTCGG
+GCCCTTTCGCGCGGATTTGGCGGCCATCTACCAGCTGGCCTTCCGGACACCGGGCAGGTGTCCGTCGTGG
+GCCAGTTGGCGGACCCGCACACGGGAGAGCCCGAATTTGCGGAGATGTCCGCGCGGCCGGCCGTCGATGG
+CGTCGCGGTTGCGTAACCGCACGGGACTGGCGTCGCGGGGCTGGCGGGCAAGGGCTCGCTGGGCGGTACT
+GCGCTGTTCGGGGGCGCTCGATGGGGATCGGATGATGTCTTTGAGCGCGGTGCGACGCGATGCGTAACGG
+GCGACGGTGGCCGCCCGCCGCTGATTCTTGACGATCTTGGACTTCTTGGCCACGTCAGCGTTCCTCGCGA
+AAGTCCACGTGACGCCGCAGGATCGGGTCGTATTTGCGCAAGATGAGACGGTCGGGGTCATTACGGCGGT
+TCTTGCGGGTGGTGTAGGTGTAGCCGGTGCCCGCCGTGGAACGCAGCTTCACAATCGGCCGGATGTCGGT
+GCGCGCCATCAGATCCGCTGCCCCTGGCGACGCAGGCGGGCCACGACCGCTTCGATACCGTCGCGGTCGA
+TGACCTTTATACCCTTCGTGGACACCCGCAGCCGAATGCGACGGCCCTCGGAGGGCAGGTAATACGTTCG
+TTGCTGAATGTTGGGCGACCATCGCCGACGGCTTCGGCGATGGGAGTGCGAGACGGTGTTTCCAAATCCC
+GGCTTGCGGCCGGTGACTTGGCAGTGGGCGGACAAGGGGCACCCTTCCTTCGAAGCTCGGCTTATTGAAA
+ATCATTTTCGACAACAGCTAGGTGGCACTGTACCGTCGACGTCGCAATAATGAAAACTGTTATCGATAAG
+GAGGACGGTGGCCACCCCGGTGATCCTTGTCACCGGACACGAGGGCACCGCCGCCGTGACCGCTGACCTG
+CTGGGCCTGCTCACCGATCACGGCACTGCGACACTTCGGTCAGTGGCACCAGGATCCGTGCGGCGAGCCG
+ATCCCCGCCCACGGTGTCACCGCCGAGAACAACGACGACGACACCGGGCATCCATGAAATCCGCCATCCA
+TCCCGACCACCACCCCCGTCGTCTTCCACGGTGCCCGGTCCTCCGCCGCGACCAAGTTGTACTGGAAATG
+ATTGTCATTACGATGGTCGGGCGGCCGAGCGGGCCGGGCGAAAGGAAATGGGATGTGTGGGGCAGCGTGG
+CACGCGCGGTCACCGGCGGGCATGTACCCGTCAAATCCATCCTCACCGGCGCCCATGCCGACCCGCATTC
+GTACCAGGCCAGCCCCGCGGACGCCGCCGCGATCGTCGACGCGGAGCTGGTGATTTACAACGGCGGCGGG
+TACGACCCGTGGGTCGACCAGGTGTTGGCCGGCCATCCTGGTGTCCAGGCGGTCGATGCCTACTCGCTGC
+TCGGCGCCGTGGGCGACGACGACGCGCCCAACGAACACGTCTTCTACGACCCCAATGTCGCCAAGGCGGT
+CGCGGCAACGATCGCCGACCGGTTGGCGGACCTCGACCCGTCCAATTCCGGGAACTATCGAGCGAACGCC
+GCCGAGTTCAGCCGCGGCGCCGACGCAATCGCAATTTCCGAACACGCGATCGCCACCACCTATCCCGACG
+CCGCGGTCATCGCGACCGAACCCGTCGTGCACTACCTGCTGGCGGCAGCCGGCCTGAAAAATCGAACCCC
+GGCTACCTTCATCGCGGCCAACGAAAACGGCAACGACCCCACCCCGGCCGATATGGCGGCCGTGCTCGAC
+ATGATCGCCGGCCGTGAGGTCGCGGCGTTGCTGGTTAACCCGCAGACACCTACCGCGGCGACCGACGAAC
+TGCAGGTGGCCGCCCGGCGGGCAGGAGTGCCAATCACCGAGTTGACCGAGACCTTGCCCAGCGGAACCGA
+CCGGGACCAGTTTTGCGCTGCTGACCGGCCAGATCGTCGGGGTCGGTCACTCCGGGCTGACCATGCTGAC
+CGTGGTTTGTCTGCTCGTGGTCACCGTGTTGGCGATCTGCTACCGACCGCTCTTGTTTGCCACCGTCGAT
+CCGGAGGTCGCGGCCGCCCGCGGCGTGCCAGTGCGCGCCCTGGGAATTGTGTTCGCCGCACTGATGGGCG
+TGGTAGCCGCCCAGGCTGTCCAGATCGTCGGGGCACTCCTCGTGATGTCTTTGCTGATCACCCCCGCCGC
+GGCGGCCGCCCGGGTCGTGGTTGCCCCGGTCGCCGCGATCGCGACCTCGGTGGTCTTCGCCGAGGTTTCC
+GCCGTCGGCGGCATCCTGCTGTCGCTGGCGCCTGGAGTCCCGGTGTCGGTGTTCGTGGCCACCATCTCGT
+TTGTGATCTACCTGATTTGCTGGTTGCTCCGGCGGCGCCGCTAACTAGCCGGTCTCGCTTTCGGCCACTT
+TGAGCTCTAGGCCAATGTTGTTCCGCATGCCGCCGCGCAGCTTACTGACGAAGGTGAACAGCTTGCCCTG
+GATGCCGTAGCGCTTGACGATCGCGTCGTAGACGGCGCCCGTTTGGGATTCGTCGAGGATGGCCGCGGTG
+GCTTCGACGGCCTCGCTGGTCGGCCGGCCGCGCAAGGTGCAGGTCGCCAGCGTCACCCGCGGCGTGTTGC
+GGATCCGCTTGACCTTCCACGATTTCTTCTCGGTGATGACCAGCAGTCGATCCCCGCGGTCGGTGTCCAA
+GGCGGCCCAGATGGGAACCGGCTTGGGCCGGCCGTCCTTGGTGAAGGTGGTCAGCAGCAGGTACTGCGCC
+TCGGCAAGGTCAGAAAAGGTAGGGGTCACGGGTGCCAACCTACCGCGCGAGCAGACGCAGAATCGCACTG
+CGCGGGGTCCCGCGCATGCGATTCTGCGTCTGCTCGCCGTACTCAGGCTTCCAGGTCGCCCTCGGTTTCC
+AGCAGCACCTGGCGCAACCCGTCCAGGGTTTCCGGTGCCGGCTGTGCCCACAGGCCGCGACCGGCCGCTT
+CCAACAGCCGTTCGGCCATGCCGTGCAGCGCCCACGGGTTGGACTCGGTCATGAACGTGCGGTTCTGCGC
+GTCCAGGACGTAACGCTGCGTGAGCTGCTCGTACATCCAGTCCGCCATCACCCCGGCGGTGGCGTCATAA
+CCGAACAGATAGTCGACGGTGGCCGCCATCTCGAATGCGCCCTTGTAGCCGTGCCGGCGCATCGCGGCCA
+TCCACCTCGGATTGACCACGCGGGCGCGAAACACCCGCGTGGTCTCCTCCGACAGCGTGCGGGTGCGGAT
+CGCGTCGGGTCGGGTGTTGTCGCCGATATAGGCGGCCGGTGCTTGGCCCGTGAGCGCCCGCACGGTGGCC
+ACCATGCCGCCGTGATACTGGAAGTAGTCGTCGGAGTCGGCGATGTCGTGTTCACGGGTGTCGGTATTCT
+TGGCGGCCACCGCAATACGCCGGTACTGGCGGTTCATGTCGTCGATCGCCTCGCGGCCATCCAGGTCGCG
+CCCGTAGGCGAATCCGCCCCAGGCGGTGTACACCTGGGCGAGGTCGGCGTCGTCGCGCCAGCTGCGGCTG
+TCGATCAGCTGCAGCAGCCCGGCGCCGTAGGTTCCCGGTTTGGATCCGAAAATCCTTGTGGTGGCTCGCC
+GTTGATCTCCGTGGTGGGCCAGATCCGCTTGGGCGTGCGCGCGCACGTAGTTGTCCTCGGCGGCCTCGTC
+GAGGTCGGCGACCAACCGCACCGCGTCATCGAGCATGGTCACCACATGCGGGAAGGCATCACGGAAAAAG
+CCGGAGATCCGTACCGTCACGTCGATGCGCGGGCGGCCCAGCTCGGCCGGCTGCATGGGCGCCAGGTCGA
+TGACCCGCCGCGAGGCGTCGTCCCATACCGGCCGAACCCCCAGCAGCGCAAGCACTTCGGCGATGTCGTC
+GCCGGCCGTGCGCATCGCCGAGGTGCCCCACACCGACAGCCCCACCGACCGCGGCCACCGCCCATGCTCA
+TCGCGGTAGCGCGCCAGCAGCGAATCGGCCAGTGCCACACCGGCTTCCCACGCCAGCCGGGACGGCACCG
+CCTTGGGATCCACGGAGTAGAAGTTGCGCCCGGTGGGTAGCACGTTGACCAGGCCGCGCAGCGGCGACCC
+CGACGGCCCGGCCGGGATGAACCGGCCGTCCAAAGCTCTTAGCACCTGCTCGATTTCGGTTGCGGTGCCA
+GCCAACCGGGGTATCACTTCGGTGGCGGCGAACCGCAGCACCGCGGCGGCGTCGGCGTTGCCGGTGAGTC
+GGTCGGCGGCGGAGGGGTCCCAGCCGGTGGCCTGCAGGGCCGCGACCAGTTCGCGGGCTTTCGCCTCGGT
+CTGGTCGACTGTCGCGCGTTCGTCGGTGCCATCCTCGGCCAGGCCGAGTGCCTGCCGCAGGCCGGGGATC
+GCGTGCGCGCCGCCGAACAGCTGGCGGGCCCGCAAGATGGCCAGCACCAGGTCGAGTTCTTGCTCCCCCG
+TTGGGTTTTGCCCGAGGATGTGCAGCCCGTCGCGGATCTGGACGTCCTTGATCTCGCACAGCCAGCCGTC
+GACGTGTAGCAGCATGTCGTCGAACGAGTCCTCTTCCGGGCGTTCGGTCAGTCCCAGGTCGTGGTCCATC
+TTGGCGGCGCGGATCAGCGTCCAGATCTGCTGGCGGATGGCGGGCAGCTTGCCGGGATCCAGCGCGGCGA
+CGCTGGCATGCTCGTCGAGCAACTGTTCCAAACGCGCGATGTCGCCGTAGGTTTCGGCGCGGGCCATCGG
+AGGAATCAAATGGTCGACTAGCACCGCGTGCGCGCGCCGCTTGGCCTGGGTGCCCTCGCCGGGGTCGTTA
+ACCAGAAACGGGTAGATCAGCGGCAGATCGCCCAGCGCGGCGTCGGGTCCGCAGGACGCCGACATGCCCA
+GCGTCTTTCCCGGCAACCATTCCAGGTTGCCGTGCTTGCCCAAATGCACCACGGCGTGCGCCCCGAAACC
+GTTCGAGAATCCGGTATCGAGCCAGCGGTAGGCGGCCAGGTAGTGGTGGCTGGGCGGCAGGTCCGGGTCG
+TGGTAGATCGCCACCGGGTTCTCCCCGAAGCCGCGCGGCGGCTGAACCATGAGCACCAGGTTGCCCGCTC
+GCAGTGCGGCGATGACGATCTCGCCGTCCGGGTCGTGGCTACGGTCGACGAACAGCTCACCGGGTGGCGG
+GCCCCAGTACGCTGTTACCACGTCTGTCAGTTCGGCGGGCAGGGTGGCGAACCAGTCCCGATACTCCTTG
+GCCGACACCCGGATGGGGTTGCCGGCCAGCTGGCCTTCGGTGAGCCAGTCGGGGTCGTGTCCGCCGCATT
+CGATCAACGCGTGAATCAGCGCGTCGCCGTCGTTTGATTCGACACCCGGCAGATCACCCACCCGATATCC
+GCGCTGCCGCATCGCTTGCAGCAAGGCCACCGCGCTGGCCGGGGTGTCCAGGCCCACCGCGTTGCCGATG
+CGGGCGTGTTTGGTCGGGTAGGCCGAGAAGACCAGGGCCACCCGCTTGTCGGCGGGGGCGACCTGGCGCA
+GCCGTGCGTGCCGGACCGCCAGGCCCGCGACCCGGGCGCAGCGCTCCGGGTCGGCCACATAGGAGATCAG
+CCCGTCGTCGTCAATCTCCTTGAACGAGAACGGAACCGTGATGATGCGGCCGTCGAACTCGGGCACCGCC
+ACCTGGCTGGCCACGTCCAGCGGCGACAGGCCGTCGTCGTTGGCGCACCACTGATCCCGCGGGCTAGTCA
+AACACAGGCCTTGCAGGATCGGGATGTCCAGCGCCGCCAGGTGCTCAACGTTCCAGCTGTCATCGTCGCC
+GCCGGCCGAGGCGGCGGCCGGCTTGACTCCCCCGGCGGCCAGCACGGTGACCACCATGGCGTCGGCGCCG
+CCGAGCCTTTCCAGCAGCCGCGGCTCGGCGGTGCGCAGCGACGCGCAGTAGAGCGGCAGCGGGCGTCCGC
+CGGCGTCTTCGATCGCCCGGCACAGCGCCTCGACGTAGCCGGTGTTGCCGGCCAGGTGCTGGGCACGGTA
+GTAGAGCACCGCGATCGTCGGGCCGGTCTTGCCGGCGTCCGGACGCTCCAGCACCCCCCAGGTCGGGGTG
+GCGACCGGCGGCGTGAACCCGAAGCCGGTCATCAGCACGGTGTCGCACAGGAAGGCGTGCAACTCGCGCA
+GGTTGTCGACGCCGCCGTGGGCCAGGTAGATGTGGGCCTGCAGCGCGGTGCCGGCCGCGACCGTGGAGCG
+GTCGGTCAACTCGGCATCGGCGGCCTGCTCTCCGCTGACCAGTGCGGCCGGTACCCCGCCGGCGATCACC
+GTGTCGATTCCGCTCTGCCAGGCGCGGTAGCCGCCGAGAATCCGGATCACCACGATCGACGCTTCGGCCA
+GCAGGTCGGTCAGTTCCAGGTCAGACAGCCGCGAGGGATTCGCCCACCGGTAGTTCTTGCCGCTGGACCG
+GGCGCTAATCAGGTCGGTGTCGGACGTCGACAACAGCAGAACGGTCGGTTCCGGCACCAATTCTTCTTAC
+CGGAGCAGGACTCGAGCGGTGGCGTCGGGCCCGCGAGCTTTGTAGCCACGCCTAGACTACAAACATGTCT
+ACATCCACGACGATTAGGGTTTCAACCCAGACTCGGGATCGTCTGGCCGCCCAAGCCCGCGAACGGGGAA
+TCTCGATGTCGGCTCTGCTCACCGAACTGGCCGCCCAGGCCGAGCGCCAGGCAATCTTCCGCGCCGAACG
+CGAGGCCTCGCACGCCGAGACGACCACCCAGGCAGTCCGCGACGAGGACCGCGAGTGGGAGGGCACGGTA
+GGCGACGGCCTTGGCTGAGCCACGGCGAGGAGACCTTTGGCTGGTCAGCCTCGGCGCCGCTCGCGCGGGT
+GAGCCCGGCAAGCATCGGCCCGCGGTGGTCGTTTCCGTGGACGAGCTACTCACCGGAATCGACGACGAAC
+TCGTTGTCGTCGTGCCGGTGTCAAGCTCGCGCTCCCGCACCCCACTCCGGCCACCTGTCGCGCCCTCAGA
+AGGTGTAGCTGCCGATAGCGTCGCGGTGTGCCGCGGCGTCCGCGCGGTCGCTCGTGCCCGACTCGTGGAG
+CGACTCGGCGCCCTCAAACCCGCCACGATGCGCGCAATCGAAAACGCCCTGACCCTGATCCTCGGCCTCC
+CGACGGGACCTGAGCGCGGCGAGGCGGCGACCCATTCTCCCGTACGGTGGACGGGTGGCCGGGACCCGTG
+ACGCGGACGCCTGCCCCGGTGCGTTGCGGCCGCACCAGGCCGCCGACGGGGCGCTGGCGCGGATCCGGCT
+GCCCGGCGGGATGATCACCGCGGCACAACTGGCGACGCTGGCCAGCGTCGCCAGCGACTTCGGCTCCGCG
+ACACTGGAACTGACCGCGCGCGGCAATGTCCAGTTGCGCGGGATCCGCGACGTGGCAGCGGTCGCGGACG
+CGGTCGCCAAAGCCGGGCTGCTGCCGTCGGCAACACACGAGCGGGTGCGCAATATCGTCGCCTCGCCGCT
+GTCCGGCCGGGCCGGCGGGCTAGCCGACGTGCGGGCATGGGTCGGTGAGCTCGACGCGGCGATCCGCGCC
+GAGCCCCGGCTGGCGGAACTGGGCGGCCGGTTCTGGTTCGGTCTCGACGACGGCCGCGCCGACGTGTCCG
+GCCTGGGTGCCGACGTCGGCGTGCAGGTGTTCCCCGACGGTCCCCGACTGCTGTTGACCGGACGTGACAC
+CGGCGTGCGGGTGGCCGATGTCGCCGAGACCCTGATCGAGGTCGCGTTGCGTTTCGTCAAGATCCGCGAA
+ACCGCCTGGCGAGTAACGGAATTAGCCGATATCGGCGAGCTGCAGTCCGGTGTCGAGCTGGGCCCATCCG
+TTCGGCCCGTCACCAAAACGCCCGTCGGCTGGATACCCCAGGATGACAGCCGGGTAACGCTGGGCGCCGC
+GGTGCCGCTGGGGGTCTTGCCCGCCCGGGTCGCGGAATGCCTGGCCGCGATCGAGGCCCCGCTGGTGATC
+ACGCCGTGGCGATCGGTGCTGATCTGCGACCTCGACGACGCGACGGCCGACGCCGCGCTGCGGGTGCTGG
+CGCCGCTGGGCCTGGTGTTCGACGAGAACTCCCCCTGGCTGAACATCAGCGCCTGCACCGGCAGCCCCGG
+CTGCGCGCACTCGGCCGCCGACGTACGGGCCGACGCCGCGCGGTCACTGAACGTGGAGTCAGCCGGGCAT
+CGGCATTTCGTCGGCTGCGAGCGGGCCTGCGGCAGCCCACCGGCCGGCGAGGTGCTGGTCGCCACCGGCG
+GTGGATACCGGCGATTGCGGCCGTAGGGTGAGCGAGTGCTCGACTACCTACGCGACGCCGCGGAAATCTA
+CCGGCGGTCATTCGCGGTTATCCGCGCCGAGGCCGATCTGGCGCGCTTCCCCGCCGACGTCGCGCGGGTG
+GTGGTTCGGTTGATTCACACCTGCGGGCAGGTCGACGTCGCCGAGCATGTGGCCTACACCGACGACGTCG
+TCGCGCGGGCGGGTGCCGCGCTGGCCGCCGGTGCCCCGGTGCTGTGCGATTCGTCGATGGTGGCCGCCGG
+GATCACCACCTCGCGGCTGCCCGCCGACAACCAGATCGTCTCGCTGGTCGCCGATCCACGCGCCACCGAG
+CTGGCCGCCCGTCGCCAGACCACCCGATCGGCGGCCGGGGTCGAGCTGTGTGCCGAGCGGCTGCCCGGCG
+CGGTGCTGGCCATAGGCAACGCGCCCACCGCGCTGTTTCGGCTGCTCGAACTGGTCGACGAAGGGGCACC
+CCCACCGGCGGCCGTGCTGGGCGGACCGGTGGGTTTCGTCGGATCGGCACAGGCCAAAGAGGAGCTCATC
+GAGCGGCCCCGCGGGATGTCCTACCTGGTGGTGCGCGGTCGCCGCGGCGGCAGCGCGATGGCCGCCGCCG
+CCGTCAATGCGATAGCCAGCGACCGCGAATGAGCGCTCGGGGCACGCTGTGGGGAGTCGGGCTGGGGCCC
+GGCGATCCGGAGTTGGTGACCGTCAAGGCCGCCCGGGTGATTGGCGAGGCCGATGTGGTGGCCTATCACA
+GCGCCCCACACGGTCACAGCATCGCCCGCGGCATCGCCGAACCGTATCTGCGGCCCGGTCAGCTCGAGGA
+GCACCTGGTCTACCCGGTGACCACCGAGGCCACGAATCATCCCGGCGGCTACGCCGGTGCGCTCGAAGAC
+TTCTACGCCGACGCGACCGAGCGCATCGCCACGCACCTGGACGCCGGGCGCAACGTGGCGCTGCTCGCCG
+AAGGCGACCCGTTGTTCTACAGCTCCTACATGCATCTGCACACCCGGCTGACGCGGCGGTTCAACGCCGT
+CATCGTGCCCGGTGTGACGTCGGTGAGCGCCGCGTCGGCGGCCGTGGCCACACCGCTGGTGGCCGGCGAC
+CAGGTGTTGTCGGTGCTGCCGGGCACGCTGCCGGTCGGCGAGCTGACCCGCCGGCTGGCCGACGCCGACG
+CGGCCGTGGTGGTCAAGCTGGGCCGTTCGTATCACAATGTGCGGGAGGCGCTTTCGGCGTCCGGCCTACT
+CGGCGACGCGTTCTACGTGGAGCGGGCCAGCACCGCCGGCCAACGGGTATTGCCGGCCGCCGACGTCGAC
+GAGACCAGCGTGCCGTACTTCTCGCTGGCCATGTTGCCGGGCGGGCGGCGTCGTGCGTTGCTGACCGGCA
+CCGTCGCAGTGGTGGGCCTGGGGCCCGGCGACAGCGACTGGATGACACCGCAGAGCCGGCGTGAGCTGGC
+CGCCGCGACGGATCTGATCGGCTATCGCGGCTACCTGGACCGGGTCGAAGTCCGCGACGGCCAGCGGCGC
+CATCCCAGCGACAACACCGACGAACCCGCCCGGGCGCGGCTGGCCTGCTCGCTGGCCGATCAGGGCCGGG
+CGGTGGCGGTGGTGTCCTCCGGCGACCCAGGGGTATTCGCGATGGCCACCGCCGTTTTGGAGGAAGCCGA
+GCAGTGGCCGGGGGTGCGGGTCCGGGTGATTCCGGCGATGACCGCCGCCCAGGCCGTCGCCAGCCGGGTC
+GGCGCGCCGCTGGGACATGACTACGCGGTGATCTCGTTGTCCGACCGGCTCAAACCCTGGGACGTGATCG
+CCGCGCGCCTGACCGCCGCGGCCGCCGCCGACCTGGTGCTGGCCATCTACAACCCGGCTTCGGTGACCCG
+CACCTGGCAGGTCGGCGCGATGCGCGAGCTGCTGCTGGCCCATCGCGACCCTGGCATACCGGTGGTGATC
+GGCCGCAACGTCTCCGGACCGGTTTCCGGACCGAATGAGGACGTTCGGGTGGTGAAGTTGGCCGACCTGA
+ACCCCGCCGAAATCGACATGCGCTGCCTATTGATCGTGGGGTCCTCGCAGACCCGGTGGTATTCGGTGGA
+TTCGCAGGACCGGGTGTTCACCCCGCGCCGCTATCCCGAGGCGGGCAGAGCTACCGCGACAAAGTCGAGC
+CGCCACAGCGACTGAAAGAGCTTGCGGCCGAATTCCTCAAGGTCGGCCAGGCTGCCTCCGGAAGGCTCGC
+CAGTTCGCGCCACGCACCCGGCAATCTCCCGAATCGTGCGGCGACCGTCAACCTGCTGCAGAAAGGCCAA
+CTGGGCGGGGCTGGGCGCCATGCGCCAACCCGGCCAAAACATATCGGTGCCGGAGACACCGCAACGCGTG
+CGCATCAGCGGTACGTAATCGAGCGCGGCAACCGTCGAAAAATCGATCGTGTACTGCTCCTTGGGTCGGT
+CACGACGGCACGCCATAAAGAGATGGGTAGCGTTCAAGGTCTCCAGACGTTCCATCACGGACCAGGCCTT
+GACCTCGGGTAACGTGTTCACGGCCGCATAAAACTCGCTGTTCGGGACGAAAAAATCGTGCGGGTAATAC
+GGCGCCTTGTGGAACCATCCCTGAAATACCAGTCCGGCGGACGTGACCAGATCGACGCATTCCTCGACGG
+TGTAACTGCGTTGGCGACCATGCAAGAACGTATCGACGAGGGCGCTATCGGAAAGTAAATCCCGAGCTTT
+CGTGAGATAGTTTCGGAGCGGATGATACGTCGGTAGTAACGAGATTGCTTCCTTCGCCAATTTGATCGAT
+GCATCGTCCTGCCCTAATCCAAGATCACGAAAGACCGAACCGAGCAGTTCGACTCCGATCCGACCGTACT
+TCCCGTAGAGCATCGCCGCCACGACGCCATCCCGGCGCAGGCAGTGGGCGAGTTCTTTCATGCCCGCCCG
+CGGATCTGCCAGGTGATGTAAAACGCCGGTCGATACCACGAGGTCGAAGTCGCGTCCCAGCGTCGCCAGC
+TCTTCGATCGGAAGCAGATGCAACTCCAGATTCGCCAGCCCGTGCTTGTCTTTCAGATATTGCTGATGGT
+CCAGTGCCGGTCGACTGATATCGATCGCCACTACTTTCGCCGCACGATTGGTGAATGCGAAAATCGCCGC
+CTGGTTGGTTCCGCAACCGGCGATCAGAATATCCAGATCGGGCCGGTATTCGCGGTCCGGCCATAATATC
+CGGTGGGAGTGCACCGGGTCGAACCATTCCCAATTCGCTGTGGTCCACGCCTCAAGATCGGCGATCGGGT
+GCGGGTACAACCACCGGTGGTACTGCCGGGACACAATGTCGGCGCGCGGATGATCGTCGGTCACTTCGGT
+CCCACGAGCCTATGCAAGCACACCGGCAACGCACGTCGCCGCCTCGGCGAGCAGCGCCTCACGGGGCTCG
+GCGTCATACCCGCCGCCGGCACGATCGGACATGACGGCCACCACGTAGGGCACGCCGGTCGGTGACCACA
+CGACCGCGATGTCGTTTGCTCGTCCGTAGTCACCGGTCCCGGTCTTGTCGATCACCTTCCAATCGGCGGG
+AAAGCCCGCTCGGATCCGCTTGGCTCCGGTGGTGTTGCGCGCCATCCAATCGGTGAGCAGTGCCCGCTTG
+TCGGGCGGCAACGCGTTGCCGAGAACAAGCTGCTGCAACACCAGGGCGATGGCGTGCGGTGTTGTGGTAT
+CCCGTTCGTCCCCGGGCGGATCGCGGTTCAACTCCGGTTCCTCGGCGTCCAACCGGCTCACGGTGTCACC
+CAAGCTGCGGAGGTAGCCGGTAAATGCCGCGGTGCCGCCCCCGGGACCGCCAAGATCGGCCAGCAACAGG
+TTGGCGGCGGTGCCGTCGCTATAGCGTATCGCCGCATCGCAAAGCTGCCCGATCGTCATCCCGGTCTGAA
+CGTGTTGTTGGGCCACCGGGGAGATCGACCGAATGTCGTCACTGGTGTAGGTGATCAGTTTGTCCAGATG
+CGTGAGCGGGTTTTGGTGCAGCACCGCCGCCACGAGCGGCGCCTTGAACGTGGAGCAGAATGCGAACCGC
+TCATCGGCGCGGTATTCGATCGCGGCGGTGGTGCCGGTGGCGGGCACATACACCCCAAGCCGGGCATCGT
+ATCTGCGCTCCAGCTCGGCGAAGCGATCCGCCAGATCCGCTCCGGCCGGCAAGGTTGTCGATGCCGGACG
+GGCCCCGCTCGCATGCCGTGCACACCCCGTCACGGAAACCAGCATTGCCATCGCTACCAGCAGTTCGCGA
+CGACCGAATCCTCTGTTGCGCATGCCGTAGTATCACACGCGCGCAGATGGCAGGCGCCAAAGCGCATTCG
+ACGCCGCGCTCCCCCGGCTGCTCGGCGGCGGGATCTACGACGACCGGTCGTAGACTGACCGGACCTGCCG
+GGCTATGGTTTATGCCCATGACCGCGACGGCAAGCGACGACGAGGCCGTTACCGCACTCGCCTTGTCGGC
+GGCCAAGGGGAACGGGCGGGCCCTTGAGGCGTTTATCAAAGCCACCCAGCAAGACGTGTGGCGGTTCGTC
+GCCTATCTGTCCGACGTGGGCAGTGCGGACGATCTCACCCAAGAGACATTCCTACGAGCGATCGGCGCCA
+TCCCGCGGTTTTCCGCACGCTCCAGCGCCCGAACTTGGTTGCTGGCCATCGCGCGCCATGTCGTCGCCGA
+TCACATCCGCCACGTCCGATCCCGGCCCCGCACCACCCGCGGCGCGCGTCCCGAACATCTCATAGACGGC
+GACCGCCATGCCCGCGGATTCGAAGACCTCGTCGAGGTAACCACGATGATCGCCGACCTAACCACCGACC
+AACGGGAAGCGCTGCTGCTGACCCAGCTGCTCGGGCTGTCCTATGCGGACGCCGCGGCGGTGTGCGGCTG
+CCCGGTGGGCACCATCCGATCCCGTGTCGCTCGAGCGCGCGATGCGCTGCTTGCCGACGCGGAGCCCGAC
+GACCTCACCGGCTAGGCAGACCGGCCACCCACATGGCGGCCCGGTGGACAGAATCGACCGCCGCTACCCC
+AGCCGGCAGCAGCGGGCGCGCTATCATGACCACCGAAATACCCAGCGCAGCAGCGGCATCCAGCTTCGCT
+CGGGTCATCTTGCCACCGCTGTTCTTGGTGACCAATGCGTCGATGCGCTGCTCACGCAGCAGTGCGAACT
+CATCGTGGTAACCATATGGCCCGCGAGATAGCACCAGTTTGTGCCGCCGCGGCAGGGCGGTGCCATCGGG
+CGCGGTAACCACGCGGATCAAAAACCACGCGTCGCTGTTGGCGAAGGCCGCAATACCCGAGCGTCCGGTG
+GTCAGGAACACTCGCGAATAACCTTGTTCAGCAACAACGTCTGCAGCCTCGATGTCCGATACCGCGATGA
+TGGCGGTACCGGGATCCCACGGCGGGCGAGCCAGTACCAGGTACGGGAGCCCGAGCTCACCGCACACCTG
+CGCGGCGTGCGCGGTGATGGTTACCGCGAAGGGGTGGGTGGCGTCGACGACGGCATCGATGCGCTCCTCT
+CGCAGCCAACCGCGCAGCCCCTCGACACCGCCGAACCCGCCGATGCGCACCGGACCGATCGGCAGGGCAG
+GGTTGGGTACCCGGCCGGCCAGCGAGCTGACGATCTCAACGTGTGGGTTGCAACTCTTTCGCCAGCGCAC
+GGCCCTCGGCGGTGCCGCCGAGCAACAACACCCGGGTCACTGTGCATACCGACCGTGCCGTGCCACCGAA
+TATAGGTAGCTGTCGGTAAAGCCCTCAGCGGTCAGCACGTCGCCAACAACGATCACGGCGGTCCTGGTGA
+TCTTGGCATCGTGCATCCGCGCGGCGATATCGGCCAACGTGCCGCGTAGCGTCCGCTGTTGCGGCCAACT
+CGCGAAAGCCACCACCGCAACCGGCGTTTCGGGTCGGTAACCACCGTCTAGCAGTCGCGGAACGATGGCG
+TCGATCTGGGCTGCGGCCAGGTGCAAGACCAGAGTGGCGCGGGATCGGGCGAGCGCGGCCAGGTCCTCAC
+CGGGCGGCATGGGTGTGGACAGCGTCGCCACCCGGGTGAGCGTCACCGTCTGCGCCACACCCGGCACGGT
+GAGTTCGCGCTTTAGCGCCGCTGCGGCTGCGGCAAAAGCCGGTACGCCCGGCACGATTTCGTAGCCGATG
+CCCAGCGCGTCGAGTTCGCGGCACTGTTCGGCCAGCGCGCTGTACAGCGACGGGTCGCCGGAATGCAGCC
+GGGCAACGTCGCGGCCGTCGGCGTCGGCGTCGGCAAGTTTGCGCACGATTTGTTCGAGGGTCAGCGGACC
+GGTGTCGACAATCGTCGCGCCGGGCGGACACTGCGCCAACAGGTCGTCGGGCATGATCGAACCCGCATAC
+AGGCACACCGGGCATCGTTGCAGGAGCCGTTGGCCGCGGACGGTGATTAGGTCGGCGGCGCCGGGGCCCG
+CTCCGATGAAATAGACCGTCATCGCTTGGTCACCGACCACTGGGTGACCGGCAGCTGTGGGCGCCAACCG
+GTGAAGCCGCCCAGCGGTTCGCCGAGATAGTGCTGGAATCGTCGTAGCTCGCCACCGAGGCGCGAATATG
+CATGCGCCAGAGCGGCTTCCGATTCGACGGTGACAGCGTTGGCGACCAAGTTCCCGCCTGCGGGCAGGCT
+GTCCAGGCAGGCCTCAAGCAGGCCTGGCTGGGTTACACCACCGCCAAGAAAAATCACCGACGGCCGTGCG
+GCGTCGTCGAACGCATCGGGCGCGTCGCCGCGCACGTCGACGCTCACCCCGAAGGCCGCGGCATTGAACC
+CAATGTTGCGGCGGCGCCGTTCGTCGCGCTCGAACGCCACCGCGGTGCAGCCCGGCCAGCTCCGACACCA
+CTGGACCGCGATGGCGCCTGAGCCCGCGCCGACGTCCCATAACCGCTGCCCGGGCCTTGGCGCCAGCGCA
+GCCAGGGTCAGCACGCGGATTGGGTGTTTGGTGATCTGCCCGTCGTGCGCGAATGCCTCGTCGGGTGCCC
+ACGACGTGCGCTCGTCGGGCAGGTAGCGCACGGCGATCACGTTGAGCTCATCGACATCGAGGGGTGGGTC
+GCAGGCCCATGCCCGGGCCGTACCGTCGCGGCGGCGTTCGGCCGGGCCGCCAAGCTGTTCGAGCACGCTG
+AACTTGGAGTCACCGCGACCGTGCTCGGTCAGCAGCACCGCCAGCGCCTGCGGGGTGGACCGATCGCCGG
+ACAGCACGATGGCCCGGCCGCCGCGGCGCACCGCGGTGTGTGGTTGCGCGGTGACCAGGCTGATCACCTC
+GGTGTCATACACGTTCCAGCCCATCCGGGCGCACGCCAACGTCACCGCGGACACGTGCGGCAAACACGGT
+CACGTTGTCGTGGCCGAACAGCCGGATCAGGGTGGAGCCGATACCATGCAACAACGGGTCGCCGCTGGCA
+ACCACGTGTAGGTCAGCCCCATCCGGTGACAGGCCTTGCACCGCGGGCAGCATCGGCGTCGGCCACTCCC
+AGCGCTCGGCGGTGACGGTATCGTCGAGCAGGGCAAGTTGCCGTTTCGAGCCGTAAATTACTGTGGCCCA
+CGCCGGGCCGGGTTGGGACGGTAGATAAGGCTTGTTCCGTCCGCACGCCGCAACACTTGGTCGAGGGTAG
+CCACCACCGACTCATACGCCGACGCGTTCTTCAGCTGGTCCTCCAGGTAGAGCAGGATGACCTCCTCGGT
+ATGCCCGGGTGCGTTCAACCAGTTGGCGATCTGCGGCAGCACTGTGGCCAGCAGAGGTTCGACGGTGCAG
+CCTAGGTTCGCGTTCTTCGGTCCCAGCCCGTGACACACGGTGACGCCGGGGGCGCCGTGGCCCTCGAGGC
+GGGGCAAGTAGTGCAGGTCTAGCTCGAGCGCGCGGACGTCGATGTCGAGCTGTTGGGCCAACGACAGCTG
+CTGGTTTGAGTCTGCGTGCGAGACCGTGAACGAATCGCTGAGGCTGTTGAACGAGTTGTGCGTGCCGAGC
+CACTGAGTTTCCCGCAGCGGCACCGGGTCTTGCAACGCATCCTGGAACCGCGCGGTGCGATGCACCCAAG
+ACTGTAGGTAGGCATCACGCGCGGCCTGGGTCACCCGGTGCGCGAGCGGAAGCACGCACCGCGCATCGGG
+CACACCGACGCGGCGACACTCCGCAGCGACCGCGTCGGCGAACTTGCCGAGCGCCACGCAGGGGATCGCA
+ACCGGGCTTATTACGTCACAGGATGCGGTGGGCGAGGGCGGAGCGGGCACCTGGTAGGCATCGGCGGCCA
+CCGGTGCCGCGGTTATCAACACCACGGCCAAGGCGCCCATGAGGGCCGCGCTCTGCAGCCATCGGGCGCG
+GGGCATGCGCTACTTTGGCACGTCGATACACCGCTTACCAGGGGTGTTGTCGAAGTGTTGCGTGGTCTCG
+TCGAAGCCGTCACGTAACTCCAAGCCGCCCCGCGTCGATGACGAGACACTAGGGCTGCGACCGCCAGGGC
+CGTGTAGACGTTGCTCTACAAGGTCACCGGTCCTGGTCAGAACTTATCCGACGGCTCCTGCGCATTTTCC
+CGTACACAACCGCGGGGATGAGGACCAGCAACCCGAGACTCCAGATATCCCACCACAGTGACCCCTTCAC
+GGCATTGGCGATTGCACTGATGGCCAGCAGAACCCAGGCGACACCCATAAAGGCGAAATAGCACCCGCCC
+CTGAGCCGTCCCGCTGGCCGAGGCCACAGGGAGCCTGCGACACCGCCGATGAGGCAGACAACCACGACGG
+CAACGCTGAAGACGACAACGGGAGTCGCGCTACTTGGTGGCACAGTTGACCACCGCCGCTCCCGATCCGC
+CAACCCCCAGTAAGGCGGCGCCAAGTAGTGCCCAGTCGGCAGGGCCGGCCGGAATTGCTAGGGCGGTCCC
+AACTACGCCAGCCGATGATCCTGCGAAACCCGCAACAGCCGCCGTCCACTCCGCGCTGTTACATGGCCGG
+TGCAGAGCTTGAAACGCCAGCCGGCGCGCCTCCACCGCGATGGGGTCATCCGGCGGCCTAGCGGCCAGCT
+CGTTGACCATGTTGTCCACCCACCGTTTGGTCGCGTCTGATACGGGTGCCTCTGTCCCGGCCGGTGGCAG
+CATCATTGAAGTGATCGGATCGGAGTACGGTCCGTCGGCTCCACCGGACGGGTGTGGCGCTCCTGGCGGT
+GGAGGTGTTGGGCCGTCTTGTTTGAAGAAGTCGACTAGCTGAACCGCGCTGTGGGCAACAACCGGGGCGC
+CCGCGAAGCGGACATTTCCCACATCACCGGTGGTCGCGGCGAGCTGACCGGACACCTCGTTCTCCGCCGC
+AACCAGTTGCCCGACACGTAAGCGGATGTCACCGGCCAACGCCTGAGCCTGAGCTAGTCGAGCGGCCTGC
+ACTGCAGCCGGCTGCGTCGTTTTGGTGTCGGTGACCGATAGGTCTTCACCGACGTTGAAACCGGCGTCCT
+GGGCGTCCTCTACGGCATACATAACTCTTCGTTGTGCCGCGTCGATAGTGCCGGCGCCGTTGCGCGCGAT
+CGTGGCTGCTCTCCGCAGCTGGTCGGCTATGCCACTGACCGTTGAGAAGTCAGCTCGGGTTCGTTGTCGC
+AGCCCGTCGCCCCCGGCGCCATTCCAGGCGATGGCATGGGCCTGGTTTCGCATCTGCAGAAACACGTCTT
+CCCACCGATCCGCGGTTTCGGTCCAGTAGCCGGCCGCATCGATAAGGTGCTCGGTGCTCCATGCCCGGAT
+TTGGGACAGGGTGGCCAGCATCTAAACCACCGTCACCTGCGTCACCGCGGCCATCTCGCTCGCCGCAGTT
+GCCTCTTGATGGGCGTAAGCTGCGGCCGCGGCAGCCACCCCGGTAGCCGTAGCCTGCGTCCGGGTGGCGA
+ATTCCGCTGCCGCGCAGCAGATTGCTGCGTTGATACCACTTACCGCCACCGTCGTGGCTTGGAATGGTTG
+GCCGGATTCTGGCGGCGTTGCCGAGGCGGCGAACTGGGCGCCAAGGCCCTGCGATTGACTGGCCGCAACC
+TCAAGCTGACCAAGTACAACCTGTAGTTCATTCGACCCCACCCGCGGGAGTCTAAATCGAGACCACGCAG
+AGGGCTATTCACGCCGATTCAAAGCCGTCGAAGAAACGACACCACCCGCGGGCCGATGAGACAGGAACGA
+TCACACAGGTGCTTGCGAAGATCCGTCACCACGTATGCGGGCGAACGGTGTGTTCGGCCTGTTGGCGGCC
+GCCGCGTGCGGTGTTCCCATCCCCGTTATCGACAACCGCGCCGAGGAGATGACGGGCCGGCACGCCACAA
+CGGCAACGAGTTTCAGCATCACGGACCAGTCGTGCGCATCATGAGGACTGCCGCGCCGCTGCGCTCACCG
+CGGTCGTCAAAGCATTGGATCCAATGACGCCATCGCGGTGGCGCCCGGTGAGGTGCGTGACCGTGGTCTC
+CGGTTATACCTTCGAGCCGACCGCAGGGTGACTTGATCGTCAAATCCACGACAGTAGCCTTACACCAAGT
+CCGAAGGGAGTAGCGGTGTTTGTCGATGTTGGACTTTTGCATTCGGGGGCAAACGAGTCTCACTACGCCG
+GTGAGCACGCCCATGGTGGTGCTGATCAGCTGTCGCGGGGACCCCTGCTGTCGGGGATGTTCGGTACATT
+TCCTGTCGCCCAGACTTTTCACGACGCGGTCGGCGCGGCCCACGCACAGCAGATGCGAAACCTGCACGCT
+CACCGGCAGGCGTTGATCACGGTGGGCGAGAAAGCGCGCCATGCCGCGACGGGGTTCACCGACATGGACG
+ACGGCAACGCCGCTGAGTTGAAAGCTGTGGTATGCAGCTGCGCCACATAAACATCCGGGCGCTGATCGCC
+GAGGCCGGCGGCGATCCCTGGGCGATCGAGCACAGCCTGCACGCGGGTCGGCCGGCCCAGATTGCCGAGC
+TGGCGGAGGCGTTTCACGCGGCGGGTCGATGCACCGCCGAGGCCAACGCGGCCTTCGAGGAAGCCCGTCG
+CCGCTTCGAAGCGTCCTGGAATCGAGAAAACGGCGAGCACCCGATCAACGACTCCGCCGAAGTGCAGCGC
+GTGACCGCGGCGCTGGGTGTGCAGTCTTTGCAATTGCCCAAGATCGGTGTCGATTTGGAGAACATTGCGG
+CCGACCTCGCCGAGGCGCAACGGGCTGCGGCCGGGCGGATTGCGACGCTCGAAAGTCAACTGCAGCGGAT
+CGACGATCAGCTTGACCAAGCGCTGGAACTCGAGCACGACCCCCGACTGGCCGCGGCCGAAAGATCCGAA
+CTTGATGCGCTGATCACCTGCCTTGAGCAAGATGCCATCGACGACACGGCGTCAGCACTGGGCCAGCTGC
+AATCGATACGCGCCGGATACTCGGATCACCTGCAGCAATCGCTGGCCATGTTGCGTGCCGATGGCTACGA
+CGGGGCGGGGCTGCAGGGATTGGACGCACCGCAATCGCCGGTGAAACTCGAAGAGCCGATTCAGATTCCG
+CCACCAGGCACCGGGGCACCAGAGGTGCATCGGTGGTGGACGTCGCTGACGTCTGAGGAACGGCAGCGTC
+TGATCGCCGAGCACCCGGAACAGATCGGCAATCTCAACGGCGTTCCGGTCAGCGCGCGCAGCGATGCCAA
+CATCGCGGTGATGACGCGGGACCTGAATCGGGTACGTGACATCGCCACTCGGTACCGCACGTCGGTTGAC
+GACGTCCTGGGTGATCCGGCGAAATACGGTCTGTCCGCCGGCGATATCACCCGCTACCGCAACGCCGATG
+AGACCAAGAAAGGCCTCGACCATAACGCCCGTAATGATCCCCGGAACCCCTCCCCGGTATACCTGTTCGC
+CTACGATCCAATGGCATTCGGCGGTAAGGGACGAGCCGCGATCGCTATCGGCAACCCCGACACCGCAAAA
+CACACCGCCGTGATTGTGCCCGGCACCAGCAGCAGCGTGAAAGGCGGCTGGTTGCATGACAATCACGACG
+ACGCGCTGAACCTCTTTAACCAGGCCAAGGCCGCCGACCCGAATAATCCGACCGCGGTGATCGCCTGGAT
+GGGATATGACGCCCCGAACGACTTCACCGACCCGCGTATCGCCACTCCGATGCTGGCCCGAATCGGTGGT
+GCGGCACTGGCCGAGGACGTCAACGGTTTGTGGGTAACGCATCTCGGCGTCGGCCAGAATGTCACCGTGT
+TGGGCCACTCGTACGGCTCGACCACCGTGGCCGACGCGTTCGCCTTGGGCGGCATGCATGCCAACGATGC
+GGTGCTACTGGGCTGCCCGGGAACCGACCTGGCCCACAGCGCCGCGAGCTTTCACCTGGACGGAGGCCGG
+GTGTATGTGGGTGCGGCCTCTACGGATCCGATCAGCATGCTCGGGCAGCTCGACAGCCTCAGCCAGTATG
+TGAACCGTGGCAACCTTGCGGGTCAGCTGCAAGGTTTAGCCGTCGGCCTGGGCACCGACCCCGCCGGCGA
+CGGATTCGGTTCGGTGAGGTTTCGCGCTGAGGTGCCCAACTCTGATGGCATCAACCCCCACGACCACTCC
+TATTACTACCACCGGGGCAGCGAGGCGTTGCGCAGCATGGCCGACATCGCCTCCGGTCACGGCGACGCGC
+TAGCATCCGATGGCATGCTGGCCCAACCACGTCACCAACCCGGCGTCGAGATCGACATTCCAGGTCTTGG
+GTCGGTGGAAATTGACATACCGGGCACGCCGGCCAGCATTGACCCAGAGTGGAGCCGCCCTCCGGGATCT
+ATCACCGACGACCATGTTTTCGATGCCCCACTCCACCGCTGATCGACGGCTTCGGCTGACGCGGCAGGCT
+TTGCTCGCCGCGGCCGTGGCGCCGTTGCTAGCAGGATGTGCGCTGGTGATGCACAAACCCCATTCCGCGG
+GTTCGTCTAATCCCTGGGATGATTCCGCGCACCCGCTCACCGACGATCAGGCCATGGCCCAAGTCGTCGA
+GCCAGCCAAACAGATCGTCGCCGCCGCCGACCTGCAGGCTGTCAGAGCGGGATTCTCGTTCACCTCGTGT
+AACGACCAAGGCGATCCGCCTTATCAGGGCACCGTCAGGATGGCCTTTCTGTTGCAGGGCGATCACGACG
+CGTACTTTCAGCACGTCCGTGCCGCCATGCTGTCGCACGGCTGGATCGACGGCCCCCCACCGGGACAGTA
+CTTCCACGGCATAACCCTGCACAAGAACGGAGTGACCGCGAACATGAGCTTAGCGTTGGACCACAGTTAC
+GGAGAGATGATCCTTGATGGTGAGTGCCGCAATACGACCGACCACCACCATGACGACGAGACCACCAACA
+TCACCAACCAACTCGTTCAGCCATGAAGGCGTCGGGTGCCTTCACTGTTCCCACATCGATGTCAGTGATC
+ACCAACCCGTGTGGCACGTGGCGACCGGCGACCGGCGAGCCCGCATCGCACCAGGTATCGAGGAACTCGG
+ACCCACCCTGGTCGAAACGGTACGCCGCCGCGACGCACTGCCCCGCATCGCCCAAGCCGTAGTAGTGGCC
+GCCACCCGCAACTACGGCGTCCCCGACAACGAAACCGACCTACTGCGGTCGCCCAGGCCAAGGTGGCCAC
+CAAACGCTGCTGGCATGCAGGTGGAGTGCACAGACACGGCAGCTGCAATAGCCTTACGCGGGTGACCAAC
+ACCCCCCCCCCCACCCACCACAGGACAATGGACACCAACCCACCCCCCAGCGCCGCCGCGTTCACGCAAT
+TGGCCGTTGGCGGCGGTGGCCAGCGTCGCGATTGCCGCGGTTGTGCTGGGTGCCGCAGCTTTAATCGTGG
+CACTGACGCGCCCGACGAACAGCGGTCCAGCCACCGCCGCTGGAACGACCGCCGAGCCGACATACACCGC
+AGCAGAAACCGCCGCCGCGCACCAAAAGTTATGCGAGGTGTACAAACTGGCAGCGCGGGCGGTCCAAATC
+GCGACAAACGGCGACAACCCGGCGTTCGCAAACATTGCCACAGTCAATGGTGCGGTGATGCTTCAGCAGA
+CACTGAATACGACCCCGGCGCTCGTGCCCGGCGAGCGCACCGATGCACTTGCACTAGCAGAAGCATATGG
+CCAAGCTACAGCCTTTGCGATGGAGCAAGACCATCCAGCGTGGCAGTCAGCAGCCAATGATGTCAATGCC
+AAGGATGCGCGCATGAAGGCCATCTGCGGTGGCGGGTGATCTGCCACCCGGTCGGTGGTCGGCGCTCTTG
+GTGGGTGCGTGGTGGCCGGCGCGGCCCGATGCGCCGATGGCCGGGGTGACGTATTGGCGTAAGGCGGCCC
+AGCTCAAGCGCAACGAGGCCAACGACCTGCGCAACGAGCGATCCCTGTTAGCGGTAAACCAAGGGCGCAC
+CGCCGACGATTTGTTGGAGCGATATTGGCGCGGCGAACAGCGACTAGCCACCATCGCGCATCAGTGCGAG
+GTCAAAAGCGACCAAAGCGAGCAAGTCGCGGATGCGGTGAACTATTTGCGGGATCGGCTGACCGAGATCG
+CACAATCCGGCAATCAGCAAATCAACCAAATCCTGGCCGGCAAAGGGCCGATAGAGGCCAAAGTTGCCGC
+GGTGAACGCCGTCATCGAGCAGTCGAATGCCATGGCCGACCATGTGGGAGCAACCGCGATGTCCAACATT
+ATCGACGCGACGCAACGAGTGTTCGACGAGACCATCGGTGGTGACGCCCACACCTGGTTGCGTGACCACG
+GTGTAAGCCTCGACGCTCCCGCGCGGCCACGCCCAGTGACCGCTGAAGACATGACTTCTATGACGGCGAA
+CTCGCCTGCAGGATCCCCATTCGGTGCTGCTCCGTCTGCGCCCAGTCATTCGACGACAACCAGCGGCCCG
+CCGACAGCTCCAACACCAACATCACCATTCGGCACTGCTCCCATGGTGCTAAGTTCATCTTCAACAAGTA
+GCGGCCCGCCGACAGCTCCAACACCAACATCACCATTCGGCACTGCTCCCATGCCGCCCGGCCCACCCCC
+ACCGGGTACCGTCTCACCACCCCTACCCCCCAGCGCCCCCGCCGTTGGTGTTGGTGGCCCGTCAGTACCG
+GCCGCTGGCATGCCACCAGCAGCGGCGGCGGCAACAGCGCCGTTATCCCCACAGTCGTTGGGCCAGTCGT
+TCACCACCGGGATGACGACGGGCACGCCGGCCGCGGCCGGTGCACAGGCGCTGTCGGCAGGGGCGCTGCA
+CGCGGCAACCGAACCCCTGCCGCCACCGGCGCCACCCCCGACGACACCCACGGTCACCACACCGACAGTC
+GCGACCGCCACCACGGCCGGGATTCCCCACATCCCCGACAGCGCGCCGACCCCCAGCCCGGCACCGATCG
+CGCCACCAACCACCGACAACGCCAGCGCCATGACACCCATCGCGCCCATGGTCGCTAATGGCCCGCCAGC
+ATCCCCGGCCCCCCCGGCCGCCGCCCCCGCGGGGCCACTGCCCGCCTACGGCGCCGACCTGCGCCCACCG
+GTAACCACACCCCCTGCCACGCCACCCACCCCAACCGGACCCATCTCCGGTGCCGCGGTCACACCCTCCT
+CACCCGCAGCAGGCGGCTCACTAATGTCACCCGTCGTCAACAAATCCACCGCACCAGCCACCACCCAGGC
+CCAACCCAGCAACCCAACACCACCGCTAGCCAGCGCCACCGCGGCCGCCACCACCGGCGCCGCAGCCGGA
+GACACCTCCCGCCGAGCCGCCGAACAACAACGCCTACGCCGCATCCTCGACACCGTCGCCCGCCAAGAAC
+CCGGATTATCGTGGGCTGCCGGGCTACGCGACAACGGCCAAACCACCCTGCTGGTCACCGACCTCGCCAG
+CGGCTGGATCCCCCCACACATTCGCCTACCCGCCCACATCACCCTGCTCGAACCGGCCCCCCGACGCCGC
+CACGCCACCGTCACCGACCTACTGGGCACCACCACCGTAGCCGCGGCACACCACCCCCACGGCTACCTCA
+GCCAACCCGACCCCGACACACCCGCACTCACCGGCGACCGCACAGCACGCATCGCACCCACAATCGACGA
+ACTCGGACCCACCCTGGTCGAAACGGTACGCCGCCACGACACACTGCCCCGCATCGCCCAAGCCGTAGTA
+GTGGCCGCCACCCGCAACTACGGCGTCCCCGACAACGAAACCGACCTCTTACACCACAAAACCACCGAGA
+TCCACCAAGCCGTACTGACCACCTACCCCAACCACGACATCGCCACGGTGGTCGATTGGATGCTGTTGGC
+GGCGATCAACGCACTGATCGCAGGCGACCAGTCGGGGGCGAACTATCACCTTGCCTGGGCGATCGCCGCG
+ATATCAACGAGGAGATCCAGATGACGTCAATCGAATCGCATCCCGAACAATATTGGGCGGCGGCCGGCAG
+GCCAGGGCCGGTGCCGCTGGCGCTGGGACCCGTTCATCCCGGTGGACCGACGCTGATCGACCTGCTGATG
+GCGCTGTTTGGCTTGTCCACGAACGCCGATCTGGGAGGCACGAACGCCGACATCGAGGGAGATGACACCG
+ATCGGCGGGCACATGCGGCCGATGCCGCGCGCAAGTTCTCGGCGAACGAGGCCAATGCGGCGGAGCAGAT
+GCAGGGGGTGGGCGCGCAGGGAATGGCGCAGATGGCGTCAGGCATCGGCGGAGCGCTCAGCGGCGCGCTC
+GGCGGCGTCATGGGGCCGCTGACCCAGCTCCCGCAACAGGCGATGCAAGCCGGGCAGGGCGCCATGCAGC
+CGCTGATGAGTGCAATGCAACAGGCCCAAGGCGCTGACGGACTGGCGGCCGTGGACGGGGCGCGGCTGCT
+GGACAGCATCGGGGGCGAGCCCGGTCTTGGCAGCGGTGCAGGTGGCGGTGACGTCGGGGGCGGGGGCGCT
+GGCGGCACTACCCCCACCGGCTATCTGGGTCCACCACCCGTACCGACGTCGTCACCGCCGACGACTCCCG
+CGGGGGCACCGACCAAGTCGGCGACGATGCCCCCGCCCGGCGGCGCTTCACCTGCCTCAGCGCACATGGG
+TGCGGCCGGGATGCCGATGGTGCCGCCGGGCGCGATGGGCGCCCGGGGCGAAGGGAGCGGCCAAGAAAAG
+CCGGTCGAAAAGCGCGTGACCGCGCCTGCGGTCCCCAATGGCCAGCCGGTCAAGGGCCGCCTGACGGTGC
+CCCCGAGCGCACCGACCACGAAACCCACCGACGGCAAGCCCGTAGTTCGCAGGCGCATCCTGCTGCCCGA
+GCACAAGGACTTCGGACGCATAGCTCCCGACGAGAAGACCGATGCCGGTGAGTGACGATTCGTCGTCGGC
+GTTCGATCTGATTTGCGCCGAGATCGAACGCCAGTTGCGCGGCGGCGAGCTGCTCATGGATGCCGCAGCA
+GCATCCGAATTACTACTCACCGTGCGGTATCAGCTCGATACCCAGCCGCGGCCACTTGTCATCGTGCATG
+GACCGCTGTTTCAGGCCGTCAAAGCGGCCCGCGCACAGGTGTACGGACGCCTGATACAGCTGCGACACGC
+GCGCTGTGAGGTGCTCGATGAGCGATGGCAGCTACGGCCGACGGGTCAGCGCGATGTGCGCGCACTGCTG
+ATCGATGTGCTGAACGTGTTGTTGGCGGCCATTACCGCCGCAGGCGTGGAACGGGCATACGCGTGCGCGG
+AGCGGCGGGCGATGGCCGCCGCGGTTGTCGCCAAGAATTACCGGGACGCGTTGGGTGTCGAGCTGCAGTG
+CAATTCCGTATGCCGAGCCGCCGCCGAGGCGATCCACGCGCTGGCGCACCGCACAGGGGCTACCGAGGAT
+GCCGACTGCCTCCCGCCGGTTGATGTGATACACGCCGACGTTACTCGCCGCATGCATGGCGAGGTGGCGA
+CCGACGTTGTCGCGGCCGGCGAACTGGTGATAGCGGCGCGACACTTGCTGGACCCCATGCCCAGGGGCGA
+GCTCAGTTACGGCCCACTCCACGAGGGGGGAAATGCGGCCCGTAAATCGGTCTATCGACGCCTGGTTCAG
+CTATGGCAAGCGCGCCGGGCTGTTACCGACGGTGACGTCGACCTGCGCGACGCTCGCACGCTGCTGACCG
+ATCTGGACAGCATTTTGCGTGAGATGCGCACGGCCGCAACCATTCAACAGGCGTACACACGAGCGGAACG
+GCGGGCGATGGCGGCGGCGGTCGTCGCCAAGATTCGCGGCGACGCAATGGGCCTCGACGCCCAGCGCGAC
+GCGGTACATCGCGCGGCCGCCGATGCGCTCCACGCGTTGCAATCGGTTGGCATACACCAATAGGCGACCC
+TTTGGCAGTTGAGGGTGTAGAGGAGATCGGCGCGTCGTTGCCGGGGCGGGAGTCGACGCCTTCCGATGAT
+GGAGGTTCCCTACACCCATCAGGAAGACCTCGACGCGTCCATCGCCGCCGGTGGTGCGGGCTTGGCCTGT
+GCTGACACATGACCGCTTTCCGCCGCCTTGATTGTTGACCGGCACTGGGTTTGGGGGCGGCCGCGTCACT
+GTAGGTGAGTATGGGACGTGAGCGACATGTGCGACGTGGTGTCGTTCGTTGGCGCCGCCGAGCGTGTTCT
+GAGGGCGAGATTTCGGCCGAGCCCGGAATCTGGCCCCCCAGTTCACGCTCGGCGGTGCGGTTGGTCTCTG
+GGGATCAGCGCGGAGACGCTGCGCCGGTGGGCAGGTCAAGCCGAGGTCGATAGCGGTGTGGTGGCCGGCG
+TGTCCGCCAGCAGAAGTGGGAGCGTAAAGACCAGCGAGCTTGAGCAAACCATCGAAATACTCAAGGTCGC
+AACGAGTTTCTTCGCGCGGAAGTGCGACCCGCGACACCGCTGATCTGTGCGTTCGGCGACAAGCACAAGC
+ACACCTACGGGGTCACACCGATCTGTCGGGCACTGGCCGTGCACGGCGTGCAGATCGCCTCGCGCACCTA
+TTTCGCGGATCGCGCGGCAGCGCCTTCGAAACGCGCACTGTGGGACACCACAATCACCGAAATCCTGGCC
+GGCTACTACGAACCCGACGCCGAGGGCAAACGCCCACCGGAATGCCTGTACGGCAGCCTGAAGATGTGGG
+CGCACCTGCAGCGCCAGGGCTTCCGGTGGCCCTCTGCCACGGTGAAGACGATCATGCGGGCCAACGGTTG
+GCGCGGAGTGCCCCTCGCAGCGCACATCACACACCACCGAACCAGACCCGGCCGCGGCCCAGGCCCTAGA
+CCTGGCGGGTCGGCAATGGCGGGCTTTAGCAACGAACCTGCTGGAAGCGGCCGACTTCACCTACGCGCCG
+ATGACGTGGAGTTCCGGCTACACCGCGTTCGTGGTCGACGCCTACGCCGGTGTGATCGCGGGCTGGGAAT
+GCTCGCTGACCAAAGACGCAGCGTTCGTCGAACGCGCATTACGCCACGGCCTTCCAGACTCACCTAGGTC
+ACCCGTTTGGCGGAGCTATTCATCATCGCGACGCCGGAAGTCAGTATACTGCAATATATTTCGGCAAGAC
+ACCGATGCTAGCCGGGCTGCGGCCGTCGATAGGCATTGTTGGCGACGCCCTCGACAACGCCTTATGTGAA
+ACCACGACAGGGCCCCACAGGACCGAATGCAGCCACGGCAGCCCGTTTCGTAGCGGGCCGATCCGCACCC
+TGGCTGACCTGGAAGACATCGCCTCGGCGTGGGTGGAGCACACCTGTCACACACAACAAGGTGTGCGAAT
+ACCCGGGAGGCTTCAACCTGCGTAGTGGGCGGAAGCGTTTCACGACGCGATCGGCTTAGCGTATGCGCGG
+GCCGATACCACGGGTGCACGCGATCACCTGGAACTGGTGAGTTGGCTATCGTGGTTTGGTGATTACTTGC
+GCTTGGGGGCTTGCCGACGGTTGCGCCGGGCGCAAGTGGGGTGCGGTTTTGCGGTTGATGGATGGTAGCT
+GGTGGCCCACGAGTTGAGTGCGGGTTCGGTTTTTGCCGGGTACCGGATAGAGCGGATGCTAGGTGCCGGC
+GGAATGGGCACCGTATATCTGGCGCGTAATCCCGATCTGCCGCGTAGCGAAGCCTTGAAAGTCCTTGCTG
+CGGAGTTGTCGCGTGACCTCGATTTTCGGGCACGGTTTGTCCGCGAAGCCGATGTGGCCGCGGGGTTGGA
+TCATCCCAACATCGTGGCGGTTCATCAGCGCGGCCAGTTCGAGGGTCGGCTATGGATTGCGATGCAGTTC
+GTCGATGGCGGGAACGCTGAGGATGCGCTGCGGGCGGCGACCATGACCACAGCGCGGGCGGTGTACGTGA
+TCGGCGAGGTCGCCAAGGCGCTCGACTATGCGCACCAACAAGGCGTGATACATCGCGATATCAAGCCGGC
+GAACTTCTTGTTGTCGCGAGCCGCTGGCGGCGATGAACGAGTGCTGCTAAGCGATTTTGGGATCGCGCGT
+GCGCTCGGCGACACGGGACTGACGTCCACCGGTTCGGTGCTGGCCACGTTGGCCTATGCTGCGCCGGAAG
+TTCTTGCAGGGCAAGGTTTTGATGGCCGGGCCGATTTGTATTCGTTGGGGTGTGCCCTATTTCGGCTACT
+AACCGGTGAGGCGCCGTTTGCCGCCGGTGCTGGAGCGGCGGTGGCAGTGGTGGCGGGTCATCTGCACCAA
+CCGCCGCCGACGGTCAGCGATCGCGTGCCAGGGCTGTCGGCGGCGATGGATGCGGTGATCGCCACTGCGA
+TGGCCAAGGATCCCATGCGTCGGTTCACCTCAGCGGGTGAATTCGCACATGCCGCCGCCGCAGCCCTGTA
+CGGGGGAGCCACCGACGGATGGGTGCCGCCGAGCCCCGCGCCGCACGTCATATCGCAAGGCGCCGTGCCA
+GGTTCGCCGTGGTGGCAGCATCCGGTCGGGTCAGTGACCGCGTTGGCCACGCCGCCCGGTCACGGTTGGC
+CGCCAGGCCTGCCGCCGCTGCCGAGACGACCGCGCCGCTACCGTCGGGGCGTGGCGGCGGTGGCGGCCGT
+GATGGTGGTGGCCGCCGCGGCCGTCACCGCGGTGACCATGACATCGCACCAACCGCGGACCGCGACGCCG
+CCAAGCGCTGCAGCCCTTTCTCCCACCTCGTCCAGCACAACACCACCGCAACCACCGATCGTGACAAGGT
+CGCGCCTACCCGGGTTGTTGCCGCCCCTTGATGACGTCAAAAACTTCGTGGGCATCCAGAACCTGGTCGC
+CCATGAGCCAATGCTTCAACCCCAGACTCCCAACGGGTCAATCAACCCCGCGGAGTGCTGGCCGGCGGTT
+GGGGGTGGCGTTCCTAGCGCCTACGACCTGGGGACCGTCATCGGCTTTTACGGGTTGACAATCGACGAGC
+CGCCCACCGGGACTGCCCCAAATCAAGTGGGGCAACTGATCGTGGCCTTTCGCGACGCGGCCACAGCCCA
+AAGGCATTTGGCCGATTTGGCGTCGATCTGGCGCCGATGCGGGGGTCGAACCGTAACACTCTTCCGTAGT
+GAGTGGCGAAGGCCCGTTGAACTGTCGACGAGCGTTCCCGAAGTCGTTGATGGCATCACCACCATGGTGT
+TGACGGCGCAGGGACCGGTGCTACGAGTCCGCGAAGACCATGCGATCGCCGCGAAGAATAATGTGCTTGT
+CGATGTCGACATCATGACGCCCGACACCAGCCGCGGCCAGCAGGCGGTCATCGGCATCACCAACTACATC
+CTCGCCAAGATACCCGGCTGAGCGCGACACCATTGGCCTAGGACACCGGCACCACGATCAACTCGTGCGG
+GCAGTTGTTGACAGACACAGCACCGTCCTCGGTCACGATCACGATGTCCTCGATGCGGGCGCCCCACCGG
+CCCGGGAAATAGATTCCCGGCTCGATGGAAAACGCCATGCCGGGAACCAACACCAGGTCATTGCCGGCGA
+CGATATAGGGCTCCTCGTGCACGCACAGCCCGATGCCGTGCCCGGTGCGGTGCACAAAATACTCCGCGAG
+CCCGGCCTCGGCGAGCACGTCACGCGCGGCGGCGTCCACCTGCTCCGCTGTCACCCCTGGGCGGATGGCC
+TCGAACGCCGCCCGCTGGGCTCGCTGCAACATCGAATATGACTGCGCTACATCAGAATCAGGCTCGCCGA
+TGCTGTAGGTTCGGGTGGAGTCGGAGTGGTATCCAGGCCCATACGTGCCGCCGATGTCGACGACAACGAT
+GTCACCCTCCCGCAATTCGCGGTCCGAATATCCGTGATGCGGGTCGGCGCCGTGCGGCCCGGAACCCACG
+ATGACGAACGCTACCTCCGAATGCCCTTCGGCGACAATTGCTTCGGCGATGTCGGCGGCTACGTCGGCTT
+CCGTTCGGCCCGGGACCAGAAACTCCGGCACTCGGGCATGCACTCGATCGATCGCCGCGCCGGCCTTACG
+CAGCGCGTCGATCTCGGTTTCCTCCTTGACCATCCGCAGCCTGCGCAGCACGTCGGTGGCCAATACCGGC
+AGCACACCCAGTGCGTCGGCCAGCGGCAACATGTGCAACGCCGGCATGGAATCGGTGACCGCGGTCGCTA
+CCGGAGCTCCGCCCAACACGGCACTCACCAACCCGTAGGGGTCGTCACCGTCGACCCAATCGCACACGCG
+CAGACCCAATTCCGCTGCGGCGGATTGCTTGAGGGCGGCGAGCTCCAGCCGCGGCAGCACAACCGCCGGC
+GCACCGGCGGCCGGCAACACCAACGCGGTGAGCCGCTCGAACGTCTCCGCTCGCGACCCGATGAGGTAAC
+ACAGGTCGTAGCCGGGAGTTATCACCAGACCCGCCAGACCGGCGTCCGCCGTCGCGGCCGCCGCTAAAGC
+CAGCCGCCGTGCATAAACCTCGGCGTCGAATCGGCGAGAACCCATGTCAGCCAGGTTAACCGCGCGTTCG
+CGAGCGCTGGCAAGATAGCCCGCATGCCCGCACCCGATCCGATGCGTGGCGACCCGCCGCACCCGGCTCC
+GCCGCGCTTGCGATCGCCACTGGACCCAACAAGTGGCGACCCGCTGCACCCGGCTCCGCCGCGCTTGCGA
+TCGCCACTGGACCCAACAAGTGGCGACCCGCTGCACCCGGCTCCGCCGCGCTTGCGATCGCCACTGGTGC
+TACTGGACGGCGCCAGCATGTGGTTCCGCTCGTTCTTCGGTGTGCCATCATCGATCACCGCTCCGGATGG
+CCGGCCGGTCAACGCCGTACGCGGCTTCATCGACTCCATGGCGGTGGTGATCATACAGCAGCGGCCAAAC
+CGGCTGGCGGTCTGCCTCGACTTGGATTGGCGCCCGCAGTTCCGGGTGGACCTGATCCCGTCATACAAGG
+CACACCGGGTGGCTGAGCCTGAGCCCAACGGCCAGCCCGACGTCGAGGAGGTGCCCGACGAGCTGACCCC
+GCAGGTCGACATGATCATGGAGTTACTGGACGCGTTCGGGATCGCGATGGCAGGCGCCCCGGGATTCGAA
+GCCGACGACGTGCTGGGCACGCTGGCAACCCGGGAGCGCCGCGACCCGGTAATCGTGGTCAGCGGAGACC
+GCGACCTGCTGCAAGTGGTCGCCGACGATCCGGTCCCGGTCCGGGTGCTCTACCTGGGCCGCGGCCTTGC
+CAAGGCCACCTTGTTCGGACCGGCCGAGGTCGCCGAGCGCTACGGGTTGCCGGCACATCGCGCCGGCGCG
+GCCTACGCCGAACTCGCGCTGCTGCGTGGCGATCCGTCCGACGGCCTACCCGGCGTGCCAGGCGTCGGCG
+AGAAGACCGCCGCTACCCTACTGGCCCGACACGGCTCGCTAGATCAGATCATGGCGGCCGCCGACGACCG
+CAAGACCACGATGGCCAAGGGCCTACGTACCAAACTGCTTGCCGCGTCGGCCTACATCAAGGCCGCCGAC
+CGGGTGGTGCGGGTCGCCACCGACGCACCGGTCACGCTGTCGACACCCACCGACAGGTTGCCGCTGGTCG
+CAGCTGACCCGGAGCGCACCGCCGAGCTGGCGACCCGATTCGGGGTTGAATCCTCGATCGCGCGACTACA
+AAAAGCGCTCGACACGCTGCCCGGATGACGATTACTGTGGCCGGCCGACCTCGTAGGTGCCCTTGTTGTC
+CTGGAAGGTCACGGTCACGCGCTTTGAGGTGCCGTCGATGCTCACCGTGCATTCGAAGGTGGCGCCCTTT
+TTGACCGTGGGGTCTGAACCGTTGTTGCACTTGACGTCTTTGACGTTCTTGGCGCCGTACCCCGTGGTCT
+CATCGGTGAGAACCTGCTGCACACCGGCCTGCGCCTTAATGACGTCCAGCTTGGTGGTGACGAAGAATCC
+GGGTGCCCAGAAGCCGAGTATTAGAACCGCGCCGATGAACAGCACGGCCATCACGGCGATCACGCCGCCG
+ATCACCGCAACCGAACGCTTCGACCCCTGACCCGACTGGCCATACGGGCCGTATTGCCCGGGGTACTGAC
+CGGGCGGTGCGTACTGGCCGGGCTGGCCGTACTGTCCCGGCTGGCCATATTGGCCCGGCTGCTGGTATTG
+GCCGTACTGACCGGGCACGCCGAGCTGGGTGGGCTGTGCACCGAACTGTTCGGGCTGCGCATAGCCGGGT
+GTGGGCTGCGGGTACTGCTGCGGGTACGCCGGGTCAGCCGGCTGTTGGTACTGCGGTGTGTACGCCGGGG
+CCTGCCACGTCGCCTCCTGGGTCGGCTGCTGCTGCCAGGGATATCCCGCGGCCACGGTGGGGTCCGAGGA
+ATGGTCGGCGCCCTGGCCGGGCGGCTGCCACGGCTGCCTTGGGTCCGATCCCTGCGGTCCGCTCATCGCT
+TCTCCTCAGTCTGTGTTAACCGTAACTCTGGCCCAGCCTACCCGGCGTCAACCGCGACGACGCCGCGCCG
+AATGTCACCGATAGCGCGCTTTGCGGTAGCCCGCAGTTCGGGGTTGGGCGCAGCGTTACGAACTTGGTCC
+AGCAGATCGAGCACCTGACGGCACCAACGCACGAAATCCCCTGCCAATAACGGTGATCCGCTGCCGTTCA
+CGTCGGCAGCGGCCAATGCCGCCGCTAGATCACCGGTTCGCGACCAGCGGTAGATGACTCTGACAAAGCC
+ATCGTCGGGTTCGCGACTCGGGGTGATGCGGTGTGCCTGCTCGTCGGCGCGCAATGTCGTGGACAGCCTT
+GATGTCTGAGTCAGAGCCTGCCGTAACCGCGGTGTGGGCACATCGGCTCCGAACGGGGCGCCCTGGCCGT
+CACCACCGCGCGTCTCGTAGACCACCGCCGACACCACCCCCGCCAATTCGGCCGGCTTTAAACCCTCCCA
+CGCACCTGTACGTAGGCACTCGGCCACCAACAGGTCGCTCTCGCTGTAAATCCGCGCCAGCAGCCGGCCG
+TCGTCGGTGACCACGGGATCAGTGGCCGGGCCATCGATGAACTCCCGTTCGGTGAGCAGCCCGACGAATC
+GGTCGAACGTGCGGGCCAACGAGTTGGTGGCGGCGGCGACCTTCCTCTCTAATTGCGCGTTGTCGCGTTC
+GATGCGTAAGTAACGCTCGGCCTGGCGGATCTGGTCCTCGAGCCCGGGCGAGGTATGCACCGGATGACGG
+CGCAATTGTTCGCGCGACGACTCCAGCTCCGGATCGTGAAACCCGCCGGCCTCGCTGACGCGCCGGGCGG
+CTGGAATAACCAGACCCGCGGCTGCCGATCGCAGCGCCGAGGCCAGGTCGCGCCGGACCCGCGGCTGGCG
+GTGCTCCACCCGCTTGGGCAGCGTCATCGACCCCACCGGCGTCGTGCCCGAGTAGTCGGCCGAGGAGATC
+CGTCCCGCCCATCGGTGTTCGGTTAGCACCAGCGGACGCGGGTCGTCGCGGTCGCGGGCTGATTCCAGGA
+CGACGGCCAGACCACCGCGGCGGCCGTGGGTGATGGTGATGATGTCACCGCGGCGCAGCGCGGCCAGCGC
+ATCGGTGGCCGCCTGCCGTCGCTGTAACCGCGACGCGCGGGCCTGCGCACGTTCCAGCTCGGACACCCGC
+GCGCGCAATCGAGCGTATTCGAGGATGGGCGCATCAGATCCGCCCAGTTCGGCTGCGATCTCGCCGAGTA
+TCCTGTTGCCCCGCTCAATTCCGCGGACCAGTCCGACCACGGATCGGTCGGCCTGATATTGGGCGAACGA
+CTGCTCGAGCAGTCGGTGCGCCTGTTGCGGACCCATCCGGTGCACCAGGTTGATCGTCATGTTGTACGAC
+GGGGCAAACGAGCTGCGCAGCGGAAAGGTGCGGGTGGAGGCCAGGCCCGCCACCTCGGACGGTTCAATTT
+CCGGGTGCCAGATCACCACCGCGTGACCCTCGACGTCGATACCGCGCCGGCCGGCGCGACCGGTCAGTTG
+GGTGTACTCCCCCGGCGTCAGCGGCATGTGCTGCTCACCGTTGAACTTCACCAGCCGCTCCAGCACCACC
+GTGCGGGCCGGCATGTTGATACCGAGCGCCAGAGTCTCGGTGGCGAATACAGCCTTGACCAAACCGGCGG
+TGAACAGCTCCTCCACCGTGTGCCGGAAGGCCGGCAACATGCCCGCGTGGTGGGCGGCCAGACCGCGCAG
+TAACCCTTCCCGCCATTCGTAGTAGCCGAGTACCGCCAGGTCGGAGTCGGCCAGGTCACCGCAGCGGTGG
+TCGATCACCTCGGCGATCCGTGCGCGCTCCTCTTCGCTGGTCAACCGCAGCGGTGACCGCAGGCATTGGG
+TGACCGCGGCGTCACAACCGGCCCGGGAGAACACGAAGGTGATCGCCGGCAACAGCCCTTCAGCGTCGAG
+TTTGGCGATCACCTCGGGTCGGCCGGGTGGCCGGTAGAAGCCGGGCCGGCCCGAGCCTCGGCGCCGAGGC
+TGCCAATCGGCCATCCGGTCGGCCTCACGGCGATGCGCGATGTGGCGCAGCAACTCGCGGTTGACTTGGG
+GCTGCCCTTCGGCTTCGCCGATCCGGTAATCGAACAGGTCGAACATGCGCTTGCCCACCAAGACGTGTTG
+CCACAACGGCACCGGCCGATGCTCGTCGACCACCACCGTGGTGTCGCCCCGCACCATCTGGATCCAACCG
+CCGAACTCCTCGGCGTTGCTCACCGTCGCCGACAGGCTGACCACCCGCACGTCGTCGGGCAGTTGCAGGA
+TCACCTCCTCCCACACCGGACCCCGCATCCGGTCGGCGAGGAAATGCACCTCATCCATCACCACATAGGA
+AAGCCCCTGCAGCGCAGGCGAATCCGCGTAGAGCATGTTGCGCAGCACTTCGGTGGTCATCACCACCACC
+GGCGCGTTGCCGTTGACCGACAGGTCACCGGTCAGCAGCCCGATCTGGTCACGGCCGTAGCGTGCTGTGA
+GATCGGTGTGCTTTTGGTTGCTCAGGGCTTTCAGCGGCGTGGTGTAGAAACATTTACTGCCGGCCGCCAG
+CGCCAGGTGCACGGCGAACTCGCCGACCACCGTCTTGCCAGCGCCGGTCGGCGCGCACACCAGCACACCG
+TGGCCGCGTTCCAGCGCGCTGCAAGCCCGCTGCTGAAAGTCGTCGAGCGAGAACGGTAGTTCCGCGGTGA
+ACCGGTCCAGCTCGGCCAGCTCAGTCACGTCGCCGCCGCCTCGCCAGTTGACCGCGCCCGCTCGCGGCTA
+GCGGGCCTACGTGACGTCGTCATGAGATCCGATGACCGATGGCGCCGGCACCGGCGAGGGCGGGTCGATG
+ACCGAAGCTTCGTCGTCGGGAATCGCGGCTTCGCGCTTGGCTTTTCGCTTGTCATGCACGCGGGCGATCT
+GAATGGCGAGCTCTAGCAGCACGGTCAACGCCGCACCGAGCGCGGTCATCGAGAACGGATCGGATCCGGG
+CGTGAAGATCGCCGCGAAGACGAACATCGCAAAGATCAACCCGCGCCGCCAAGACTTGAGCCGCTCATAG
+GTCAGCAGGCCCGCCAGGTTCAGCATCACGATCAGCAGGGGGAATTCGAAGCTGACCCCGAACACCACCA
+GCAGGTTGAGCAGAAAGCCAAAGTAGCGGTCGCCAGACAGCGCGGTCACCTGCACGTCGCTGCCGACGGT
+CAACAAAAAGCCCAACGCCTTGGACAACACCAGGTAGGCCAGTACGGCACCGGCGACGAACAGCACCGCT
+GCTGGGATCACGAAGGCCACCGCGAAGCGGCGCTCCCTCTGGTAGAGACCAGGCGTGATGAACGCCCACA
+GCTGGTAGAACCACACCGGGCAAGCCAGCACAATGCCGGCGGCCATCCCGACCTTGAGCCGCAACATGAA
+CTGGTCGAACGGCGCGGTGGCCAACAAACGGCACTCTCCGTCGGCGCTGATATCCGCCCGGGCCGACTGC
+GGCAGGGCACAGTAGGGATGCCGCAGCCACTCTCCGAGGCTGTCCAACCCGAAAATCGAATGCGAATACC
+AGACGAACCCGAAGATTGTGGTGACCAAGATCGCGGCCAGGGAGATCAGCAACCTGGTGCGTAACTCGGT
+CAGGTGGTCGACCAGCGACATCGTCGCGTCAGGATTGACGCGGCTGCGCCTGTTACGTGGGTTGAGCCGT
+TTGAGAAGACCGGCGGCGCGCACTGAAGCGACGCCCGAGCTAAGCCGGCCGAGCCTCGGTGCTGTCTTGA
+CCAGACGCCGCTGAGGGGTCGACACGCTGCGATTGCACCGGCGTGGGGGTCTCGATAGACGCTTCCGCTT
+TGTTCTCGTTCTGCAGTTCACGGACCTCGGACTTAAAGATTCGCAATGACTTGCCCAACGAGCGCGCCGC
+ATCGGGGAGCTTCTTGGCACCGAACAACACGATCACCACGACAGCGAGGATCGCCCAATGCCACGGACTC
+AGACTGCCCACTTTGATTACCTCCAGACGTTGACCCGATGCTACCGCAGCGGCCGCGGCACCCGGAGATT
+TCGCGCCGTCACGGCGGCGCAGCTGCCTGGTATGCATCCAGCGCGGCCGTCGCGGCGTCGCGAACCCGCT
+GAGCGAGCGACTCCGGCGCCAGAACGCGCACGTCCGAACCGAAGCCCAGCAATAGGCGCGTCATCCAATC
+CTCAGAGGCGTAGGTCATGACCACCTCACAGGAGCCGTCCGGCAGCTGTCGTAGCTCCCGAATCGGGTAG
+TACTCCAGCATCCACGAGGCCGACGGTGCCACCCGCAACGTCGCCGACGGCAGCGATAGGTCACCGTCGA
+ACAGCGACGTGTCCGGTGGCGCCTGCCGTGCCGATTCCGGCGGAACCGCGGGCTCGCCCAACTCGGCGGC
+ATCGACAATCCGGTCGAAACGGAACAGGCGAACCCCTTCGGCCTCACGCGACCAGGCCTCCAAATAGCTG
+TGCCCGCCGATCAACAGCACCCGGATGGGATCCACGATCCGAGTGGTGAGGGTGTCATGCGACGCGGCGT
+AATAGTCGATGGTCAGCGCCCGACTGTTCCGCACCGCGGCCCGTACGGCCGCGGCGGCCGGGCTTTCTGT
+GGGTGCCTGTTCGGCAACGGCGGCCACCGCGCCGGCCGCGGCGGCGATCTTGGCGATGGCGCTGCGCGCC
+GCCTGCGGGTCAACCACGCCGGGAATGTCCGCTAGCGCCCGCAACGCCACCAGCAGCCCGGTGGCCTCCG
+GCGATGTGAGCTTTAACGGCCGGTCGATGCCCGCCGAGAACGTCACCTCGATGGTGTCACCGCAGAATTC
+GAAGTCGATGAGGTCACCCGGGGAATAGCCCGGAAGGCCGCACATCCACAGCTGGTTGAGGTCCTCCTCC
+AGCTGCTTGGCGGTGACACCCAGCTCGGCGGCGGCCTCGGCGCGGGTGATCCGGGGGTTGGCCTGGAAGT
+ACGGCACCATGTTGAGCAGCCGCACCAGCCGGGTGGACAGGGCGCTCATGCCAGTGCTCCGGCTTGCGCG
+CGTAGTCGGGCCAGCACATCGTCGCGCAGAGACCCGGGCTGCAGCACGATTGCGTCGGCCCCATAGCCGG
+TGATCTCACGCGCCAGCCGGTCGCTGGATCGAATCTCAAGCTCGATCACCTCGCCATCGCGACCACCAAG
+TTGTCGCGGCCCGGCGGACCGCCCGGCACGTCGCAACGCGGTGGCCCGACCCTCGGCTACCCATACCGTG
+GCTTGCTCACCGGTCGGCACCTCCGTCACCTTCTGCGCCACGATGCTGCGTAGGTCCACACCGGCAGGCA
+CGGTGGTTGCGCCGGCCGGCCCGATTGGCGTCACCTGCGCTCCGATCCGGGACAGCCGGAAGACGCGGGT
+TGCATCCCGGTCGCGGTCGTGGCCGACCAGATACCAGCGGCCCTTCTCGGTAACCACACCCCACGGCTCG
+ACGGTCCGAACGGTGTACGGCTCTGCGCGCGACGATCGATGAGAGAACTGCACCACCTGCCCGGAATCGA
+TGGCCGACAACAAGATTCCGAGAACGTCCTCAGAGCCGCGCAGTCCCGAAACGGCCGCCGCCGACGCGAT
+GGCCACCGGTGCCCCGGTATCCAAGGGATCGACGTCCACCCCGGCGGCCCGCAGCTTCAGCAACGCGCCC
+TGGGTCGCGGTGATCAACTCCGGTGACTCCCACAGCTGGGTGGCGACGGCTACCGCGGCCGCCTCATCCG
+GGGTCAGCTCGACAGGCGACAGGGCGTAGGCGTCGCGGTTGATGCGATAGCCCTCGGTGGGCTCCAACGC
+CGAGACCCTGCCGACCTCGAGCGGAATGCCGAGGTCACGCAGCTCGTTCTTGTCGCGCTCGAACATCCGG
+GAGAACGCCTCAACGCTGGGGCTGTCCGAATAGCCTGCCACGCTGGACCTGATCTTCTCCGCAGTGATGT
+AGCCACGAGTGGACAGCAAGGCTATGACGAGATTGACCAGCCGTTCGACTTTCGAGGTCGCCATTGGTGG
+TGCTACATGCTCGCGATCAGCCGCTTAACCCGCTCATCGACCGCCCGGAACGGGTCTTTGCACAGCACGG
+TGCGCTGCGCCTGGTCGTTGAGTTTGAGATGTACCCAGTCGACGGTGAAATCACGTCCCGCCTCCTGCGC
+GGCGCTGATGAACTCACCGCGCAGCCGGGCCCGGGTGGTCTGTGGGGGCTGATCGACGGCCTCCGCGATT
+TCTTCGTCGGTGGTGACGCGCGCGGCCAACCCTTTGCGCTGCAGGAGATCAAAGATCCCGCGTCCGCGCT
+TGATGTCGTGGTAGGCCAGATCCAGCTGAGCGATCTTCGGGTGGGACAACTCCATGTCATAGCGGTCCTG
+ATAACGCTGAAACAGCTTGCGTTTGATCACCCAGTCGATTTCGGTGTCGACCTTGGCGAAATCCTGGCTT
+TCGACGGCATCGAGTTGGCGGCCCCACAGGTCGACGACCTGCTCGATCTGCGCGTTGGGCTCCCGAGTCT
+GCAAGTGCTCGACTGCGCGGGTGTAGTACTCCCGCTGGATGTCCAGCGCGCTGGCCTGACGGCCTCCGGC
+CAACCGCACCGGCCGGCGACCGGTGACATCATGGCTAACCTCACGGATGGCGCGGATCGGGTTATCCAGG
+GAAAAATCACGGAAGGCGACTCCACTTTCGATCATTTCCAGCACGAGCGCCGCGGTGCCCACCTTGAGCA
+TGGTGGTGGTCTCGGACATGTTGGAGTCGCCGACGATGACGTGCAGCCGCCGGTACTTCTCGGCGTCGGC
+ATGTGGCTCGTCGCGGGTGTTGATAATGGGGCGGGATCGGGTCGTGGCGCTAGAGACGCCCTCCCAAATG
+TGTTCGGCGCGTTGGCTTAAGCAGTAGGTGGCGGCCTTGGGGGTCTGCAGCACCTTGCCGGCCCCGCAGA
+TCAGCTGGCGGGTGACCAGGAAGGGCAGCAGCACGTCGGAGATCCGGGAGAACTCACCGGCCCGCACGAT
+CAGGTAGTTTTCGTGGCAGCCGTAGGAGTTGCCCGCCGAATCGGTGTTGTTCTTGAACAGGTAGATGTCG
+CCGCCGATGCCCTCGTCGGCCAGCCGCTGCTCGGCGTCAACGAGCAGGTCTTCCAGCACCCATTCACCGG
+CCCGGTCATGGGTGACCAGCTGCACCAGGCTGTCGCATTCGGCGGTGGCGTACTCGGGATGACTGCCCAC
+GTCGAGATACAGGCGCGCACCGTTACGCAGGAAGACGTTGGAGCTGCGGCCCCAGGACACCACACGGCGA
+AACAGGTAGCGGGCCACCTCGTCCGGGGACAGCCGACGGTGACCGTGAAATGTGCAGGTGACACCGAACT
+CGGTTTCGATGCCCATGATTCGACGCTGCACGTATTTGAGGGTACTGGTTGTTGGTTGGCGGCGGCGCGA
+TAGCCACGCCCGTTACCCGTCCGGGCCGGACGGGCCGGGGACTCCGAACAGCAGCCCGCCGGTGCCGCCG
+CTGCCGCCGGGCCCCGCGGCCCCGTCCGGAGTACCGGGTCCGCCGGCGGCGCCAGCCCCACCGGCGCCAC
+CGTCGCCGAACAAGATGGCGGTGCCGCCGTGCCCGCCGACACCGCCCGGCCCGCCGGGCGAGGTGGTGTT
+CATGCCGGGCCCCCCTTGGCCGGCGGCCCCGCCGGCGCCACCGTTGCCGTACCACACGCCGCCGTTGCCA
+CCGCTGCCGCCGGGGTTGCCCGCGCCCCCGACGCCACCGCTGCTGACCGAGCCAGGCGCGCCGCTCCCGC
+CGCTACCGCCGGCACCACCGTTGCCGATGAGCCGCGCGCTGCCGCCGTTGCCGGCGTTGGTGGAGCCAAT
+AAATGGCAGCCCCCCATTACCGCCGTCGCCGCCGCCGCCGCCATCGCCGTACAGCCACCCGCCGACCCCA
+CCGTCGCCGCCGCGACTACCTACCTGGAACAGGCGCGCACCGAGCCCTGGGTCGCCGCCGTTGCCGCCGC
+CGCCGCCGACACCAATCAGCCCCGCGTCGCCGCCCCGGCCACCGCTGCCGCCCAACCCGGCGAAACCGTC
+GCTGGAGACGCCGGTACCTGCATCGCCACCGTTGCCGCCGGAACCGGCCGCCCCTCCATTGCCGTACAGC
+AGCCCGCCGGCGCCACCGAACTGGCCGAAGCCGCCACTGCCGCCACTGCCGCCGGCCTTGCCGCTCCCGC
+CGTGCCCACCGTCCCCACCGTTTCCGCCGGCACCGCCGTGACCGATCAGCCCCGCCCGTCCACCCAAACC
+GCCATCGCCTCCCCCGCCGCCAGCACCGAGGTCTCCCACACCGTTGTCACCGGTACCGCCGACTCCCCCG
+GCACCCCCGTTGCCCAGCAGCAATCCGCCCAGGCCGCCATTGCCTCCTGCACCGCCGGGCGCACCGTTGC
+CGCCCCTGCCGCCGTTGCCGATCAGCCCCGCTGACCCGCCGGCTCCCCCGGCAACCCCGGGGCTCGTGCT
+GTCGCCACCGTTGCCGCCGTTGCCCCACAAGATGCCGCCGTCCCCGCCGGGCTGTCCCACCGGACCACTG
+GCCCCGTCGGCGCCGTCGCCGACCAGCGGACGCCCCAGCAGCGTCTGGGTGGGCGCGTTCACCGCGTTCA
+GCAGGTTCTGCTGCGCGTTGGCAATCTCGGCGCTCGCATATGAACCTCCACCGGCGTTAAGCAGTTGGAC
+GAACCGGTCATGAAACGCCGCCGCCTGGGCGCTGACCGCTTGATAGCTCTGGGCCTGGGCGCCAAATAGC
+GCCGCTATGCCCGCCGACACCTCATCGGCGGCGGGCGCCAACGCCCCCGTCGTCGGGACCGCCGCCGCCG
+CGTTCGCTGCCCTGATGGTCGAACGGATGGCCGCTAAATCCGTGGCCGCAGCCAGCAATGCCTCCGGGCT
+CGCAATCACAAACGACATTGCGCACCTCCCACCAACCCGCGATAACCCGGCTGCGCCGGAACCGTCGATG
+CGTATGGCAGGAATATCGTATTGCGATCCCCCACCCTCAGTCGGGGTGTTCGCCAGATTCGTCGCAGCTC
+AGCGCTGCGCCGGCGCCAGCATTGGCGATGGCTGGTGGTTAACGCGAGTGGTCGAAGGTGATGGCCGGGG
+CACTGTTCGAACCGTCGTTCGCCGCAGCGCACCCAGCGGGGCTTCTCAGACGACCCGTGACGCGAACCGT
+CGTGCTGTCGGTGGCCGCTACTAGTATCGCACACATGTTCGAGATATCGCTGCCGGACCCGACGGAGCTG
+TGCCGATCCGATGATGGCGCGCTGGTGGCCGCGATCGAGGACTGCGCTCGTGTGGAGGCGGCTGCGAGCG
+CCCGGCGGTTGTCGGCGATCGCCGAGCTGACCGGCCGGCGCACCGGCGCGGACCAGCGGGCCGACTGGGC
+GTGTGACTTCTGGGACTGCGCGGCCGCGGAGGTGGCTGCGGCGTTGACTATCAGCCACGGCAAAGCCTCC
+GGACAAATGCATCTGAGCCTTGCCCTGAACCGGCTGCCCCAGGTGGCGGCGTTGTTTTTGGCCGGGCATC
+TTGGTGCGCGGCTTTTCTCGATCATCGCCTGGCGGACCTACCTCGTTCGCGACCCGCACGCACTGAGTCT
+GCTCGATGCCGCCCTGGCCGAACACGCCGGCGCGTGGGGGCCGCTGTCGGCCCCCAAACTGGAAAAGGCC
+ATCGACTCCTGGATCGATCGCTACGATCCCGGGGCGCTGCGGCGCAGCCGTATCTCGGCCCGCACCCGCG
+ACCTATGCATCGGTGATCCCGATGAGGACGCCGGCACCGCCGCGCTGTGGGGCCGGCTGTATGCCACCGA
+CGCCGCGATGCTGGATCGCCGGCTCACCGAGATGGCCCACGGCGTGTGCGAGGATGACCCGCGCACCCTG
+GCCCAGCGCCGCGCCGACGCGCTGGGCGCGCTGGCCGCCGGCGCCGACCACCTGGCGTGCGGCTGCGGCA
+AGCCCGACTGCCCCTCCGGTGCCGGCAACGACGAGCGGGCCGCCGGTGTGGTCATCCACGTCGTCGCCGA
+CGCCTCAGCACTTGACGCACAACCCGACCCACACCTATCCGGCGACGAACCCCCTTCGCGGCCCCTCACC
+CCGGAGACGACCCTGTTCGAGGCGTTGACACCCGACCCCGAACCCGATCCCCCCGCCACCCACGCGCCGG
+CCGAGCTGATCACCACCGGCGGCGGTGTGGTGCCCGCGCCGCTGCTGGCCGAACTCATCCGGGGTGGGGC
+CACCATCAGCCAAGTGCGCCATCCCGGCGATCTCGCAGCAGAGCCGCACTACCGGCCGTCGGCCAAGCTG
+GCTGAATTCGTCCGGATGCGGGATTTGACGTGCCGGTTTCCCGGGTGTGACGTGCCCGCCGAGTTTTGTG
+ATATCGACCATTCGGCGCCCTGGCCGTTGGGGCCGACGCATCCATCAAATCTGAAGTGCGCGTGTAGAAA
+ACACCACCTTTTGAAAACTTTCTGGACGGGCTGGCGGGATGTGCAGTTACCCGATGGCACGGTCATCTGG
+ACCGCGCCCAACGGCCACACCTACACTACCCATCCCGGCAGCCGCATCTTCTTTCCCACCTGGCACACCA
+CCACCGCCGAACTACCCCAAACATCAACGGCAGCAGTCAACGTCGACGCACGCGGCCTGATGATGCCGCG
+ACGGCGCCGGACCCGAGCCGCCGAGCTGGCCCACCGCATCAACGCCGAACGCGCCCTCAACGACGCGTAC
+ATGGCCGAACGCAACAAGCCACCATCGTTCTGATGGGCGGCTATTCCCACCTCATGTCAAACACCCCTTC
+TGGATGTCACGCCCCTTCTGGACACCACCGACGAGTTCTCGTGTCGCCGCACCTATCCAAGAAGACCAAC
+CGCTACGATCGGTCGATGTCGCGGCGCCGCAGTCGACGCAGGAGAACCGCGAAACGTGCCGGCCGCTCCG
+TCGACAAGAGAGAAGGACTGCATGCTGGTTTTGCACGGCTTCTGGTCCAACTCCGGCGGGATGCGGCTGT
+GGGCGGAGGACTCCGATCTGCTGGTGAAGAGCCCGAGTCAGGCGCTGCGCTCCGCGCGGCCACACCCGTT
+CGCGGCGCCCGCTGACCTGATCGCCGGCATACATCCGGGCAAACCCGCAACCGCCGTTTTGCTGTTGCCG
+TCGTTGCGATCGGCGCCGCTGGACTCGCCGGAGCTGATCCGGCTCGCCCCGCGCCCGGCCGCGCGAACCG
+ATCCGATGCTGTTGGCGTGGACGGTACCGGTGGTGGACCTGGACCCCACCGCGGCGTTGGCCGCCTTCGA
+CCAGCCCGCCCCCGACGTCCGCTACGGCGCGTCCGTCGACTACCTGGCCGAGCTGGCCGTTTTCGCGCGC
+GAGTTGGTCGAGCGTGGTCGCGTGCTGCCCCAGCTGCGCCGCGACACCCACGGCGCGGCCGCCTGCTGGC
+GTCCGGTGTTGCAGGGACGCGACGTGGTCGCGATGACCTCGCTGGTCTCGGCGATGCCGCCGGTCTGCCG
+CGCCGAAGTTGGTGGGCACGACCCGCACGAACTGGCAACCTCGGCTCTGGACGCGATGGTCGACGCCGCC
+GTGCGCGCGGCGCTGTCACCGATGGACCTGCTGCCCCCGCGACGGGGTCGCTCCAAACGGCATCGGGCCG
+TGGAGGCTTGGCTGACCGCGTTGACCTGCCCGGACGGCCGGTTCGACGCGGAGCCCGACGAACTCGACGC
+GCTGGCCGAGGCGTTGCGGCCATGGGACGACGTCGGTATCGGCACCGTCGGCCCGGCGCGGGCGACGTTT
+CGGCTGTCCGAAGTCGAGACCGAAAACGAGGAGACGCCCGCGGGCTCGTTGTGGAGGCTGGAGTTCTTAT
+TGCAGTCGACGCAGGACCCCAGCCTGCTGGTCCCCGCCGAGCAGGCATGGAACGACGACGGCAGCCTGCG
+CCGCTGGCTGGACCGGCCGCAGGAGCTGCTGCTGACCGAACTGGGCCGGGCCTCTCGGATTTTCCCCGAG
+CTCGTCCCGGCGCTGCGCACCGCGTGCCCGTCCGGGCTTGAGCTCGACGCCGACGGCGCCTACCGATTCC
+TGTCGGGTACGGCCGCGGTGCTCGACGAGGCTGGGTTTGGCGTGCTGCTGCCGTCCTGGTGGGACCGCCG
+CCGCAAGCTGGGCTTGGTCCTGTCCGCATATACCCCGGTCGACGGCGTGGTGGGCAAGGCCAGCAAGTTC
+GGCCGCGAGCAGCTCGTCGAGTTCCGCTGGGAGCTGGCCGTGGGCGACGATCCGCTCAGCGAGGAGGAGA
+TCGCGGCGCTGACCGAAACCAAGTCCCCGCTGATCCGGCTGCGTGGCCAGTGGGTGGCGCTCGATACCGA
+ACAGCTGCGCCGCGGGCTGGAGTTTTTGGAGCGTAAGCCAACCGGCCGCAAGACCACCGCCGAGATCCTC
+GCGCTGGCCGCCAGCCACCCCGACGACGTGGACACCCCGCTCGAGGTCACCGCCGTACGCGCCGACGGCT
+GGCTCGGGGACCTGCTCGCCGGGGCCGCCGCGGCGTCGCTGCAGCCGTTGGACCCGCCCGACGGATTCAC
+CGCGACGCTGCGTCCCTACCAGCAGCGCGGTCTGGCGTGGCTGGCGTTTTTGTCCTCGCTCGGTTTGGGC
+AGCTGCCTGGCCGACGACATGGGCCTGGGCAAGACGGTGCAGCTATTGGCCCTGGAAACCTTGGAATCCG
+TTCAGCGCCACCAGGATCGCGGCGTCGGACCCACACTGCTACTGTGCCCGATGTCGTTGGTGGGCAACTG
+GCAGCAGGAAGCGGCCAGGTTTGCACCCAACCTGCGGGTGTACGCCCACCACGGGGGCGCCCGGCTGCAC
+GGCGAGGCGTTGCGCGACCACCTCGAGCGCACCGACCTGGTCGTGAGCACCTATACCACCGCCACCCGCG
+ACATCGACGAGCTGTCGGAATACGAATGGAACCGGGTGGTGCTGGACGAGGCCCAGGCGGTGAAGAACAG
+CCTGTCCCGGGCGGCCAAGGCGGTGCGACGGCTACGCGCGGCGCACCGGGTCGCGCTGACCGGGACACCG
+ATGGAGAACCGGCTCGCCGAGCTGTGGTCGATCATGGACTTCCTCAACCCGGGCCTGCTCGGATCCTCCG
+AACGCTTCCGCACCCGCTACGCGATCCCGATCGAGCGGCACGGGCACACCGAACCGGCCGAACGGCTGCG
+CGCATCGACGCGGCCCTACATCCTGCGCCGGCTCAAGACCGACCCGGCGATCATCGACGATCTGCCGGAG
+AAGATCGAGATCAAGCAGTACTGCCAACTCACCACCGAGCAGGCGTCGCTGTATCAGGCCGTCGTCGCCG
+ACATGATGGAAAAGATCGAAAACACCGAAGGGATCGAGCGGCGCGGCAACGTGCTGGCCGCGATGGCCAA
+GCTCAAACAGGTGTGCAACCACCCCGCCCAGCTGCTGCACGATCGCTCCCCGGTCGGTCGGCGGTCCGGG
+AAGGTGATCCGGCTCGAGGAGATCCTGGAAGAGATCCTGGCCGAGGGCGACCGGGTGCTGTGTTTTACCC
+AGTTCACCGAGTTCGCCGAGCTGCTGGTGCCGCACCTGGCCGCACGCTTCGGCCGTGCCGCCCGAGACAT
+TGCCTACCTGCACGGTGGCACCCCGAGGAAGCGGCGTGACGAGATGGTGGCCCGGTTCCAGTCCGGTGAC
+GGCCCGCCCATTTTTCTGCTGTCGTTGAAGGCGGGCGGTACCGGGCTGAACCTCACCGCCGCCAATCATG
+TTGTGCACCTGGACCGCTGGTGGAACCCGGCGGTCGAGAACCAGGCGACGGACCGGGCGTTTCGGATCGG
+GCAGCGGCGCACGGTGCAGGTCCGCAAGTTCATCTGCACCGGCACCCTCGAGGAGAAGATCGACGAAATG
+ATCGAGGAGAAAAAGGCGCTGGCCGACTTGGTGGTCACCGACGGCGAAGGCTGGCTGACCGAACTGTCCA
+CCCGCGATCTGCGCGAGGTGTTCGCGCTGTCCGAAGGCGCCGTCGGTGAGTAGCACCTGGTATCCACCAC
+CGTCCCGGCCCCGTCCGGTCGAGGGTGGGATCAAGGCGCGCAGCACCCGCGGCGCGATCGCGCAGACCTG
+GTGGTCGGAGCGGTTCATTGCGGTGCTGGAGGACATCGGCCTGGGTAACCGGCTGCAGCGTGGCCGCAGC
+TATGCGCGCAAGGGGCAGGTGATCTCGCTGCAGGTGGATGCCGGCTTGGTCACCGCGCTGGTGCAGGGCA
+GCCGGGCCCGGCCGTACCGGATCCGCATCGGGATTCCGGCGTTCGGCAAGTCGCAATGGGCGCACGTCGA
+GCGAACCCTGGCCGAAAACGCTTGGTACGCAGCAAAATTGCTGTCCGGCGAAATGCCCGAAGACATCGAG
+GACGTCTTCGCCGGCCTGGGCCTGTCGCTATTCCCCGGCACCGCCCGAGAGCTATCACTGGACTGCTCCT
+GCCCCGACTACGCGGTCCCATGCAAGCACCTGGCCGCCACCTTCTACTTGCTGGCCGAGTCCTTCGACGA
+GGATCCGTTCGCCATCCTGGCGTGGCGTGGCCGCGAGCGGGAGGATCTGCTGGCCAACCTGGCCGCTGCC
+CGCGCCGACGGAGCGGCACCGGCCGCCGACCACGCCGAACAAGTGGCCCAGCCGCTCACCGACTGCCTAG
+ACCGCTATTACGCCCGGCAGGCCGACATCAATGTCCCCAGCCCGCCGGCAACCCCATCGACGGCATTGCT
+CGACCAGCTGCCCGACACCGGACTCAGCGCCCGCGGACGGCCGCTGACCGAGCTCCTGCGACCCGCCTAT
+CACGCCCTGACGCACCATCACAACAGCGCGGGCGGCTGATCCCAGCGCACCCCTTCGAATCGGCCGAAGT
+CACTGTCGTAGGACACGATGCTGGCGCGATGCTCGACGGCAAGCGCGGCCAGATGCGCGTCGTTGACCAG
+GTTGGCACCGGTTCCCACGTACGTCAGCATTCTCGCCAGGATATCGGCGTGCCGGACGGTCGGATTCACC
+AAGACGGCGCTGGGTGCGGCTAGCCAATCCGCGACCTGGGTGATGGCCGCCTCCCGCGGAAGCGGACGGG
+GGAACAACCCCACCTTGGTCGCCAATCGCACGAACGCCAACAACGGCACCCAGGCGAACCCGACGCGGTC
+GGCGCCCGACAGCGCACCGTCAAGCCAGCGCAGCGACGGCTTGTGGTGCTCACTTGTGGTGTTCACGGCG
+TAGAGCAAGACGTTCGCGTCGACGATCTTCATCAACCGCTATGACCCGCGGCGTTGACGGCGCACAAGCT
+CTTCGTCCTCGAGGTCGGCCGCAAGCTGCAAGGCCCGGTCGAGGTTGACCGCAGGGACGCCCAAGTCTGC
+CGTGCGGGTGCTGAAGTGACTCGGCGCAGGTCGCCCGGAGGCGCCGTCGCGAATCGCGTCGTTGAGGGCC
+TTCTTGAAGGACACTTGCCGCTCGGCCATCCGGCGCCTTACCAACTGCTCGACGTCGTCATCCAATGTGA
+CAGTCGTCCGCATTTTGATAGCATAGCATCAAGATTGTCGACAGCATCTCGTCAATCGGCGCGCGGGCCC
+GTCACTAATCCGGCGATTCGCCGTCGGACTGGGAGTCTTTGGCGCCCGTGGAACCCCTTTGTGTCCCTTG
+GCATCTTTGCGATCCAGTTCCCGCAGCCGTTTTCCCAACGCGGCACCCGCGATGCGCCGAAACGCGCGCC
+GTAGCCGGTCGGCGTCGAGCACGGCCACCTCCAGGGTGGCCAGGGGTGGGTTGAGCACCACGGTCGTGAA
+CGTCATTCGCGGTAGCCCGACTCGGCGACCTCGAGCAGTCGACACGCCTTCTGCACGGGAAGTCCTTCTG
+CGGCCATCGTTGCTATGGCCGCTTACTGCCTTCTAGTCCGTGCGGCTCTCGCAACAGCTCACGGGACCTT
+TTTGAGGATCGCCACTTCAGGTCTTCAACTCGCGGATGCCCTCATTGGCAACGTTTGCGCCTGCCTTGGG
+GCGGCCGGCAGCCACCAAGTCGAGCACTTTGCGGCGGAACTACTCGGGGTAACACTTCGGCACGGACACG
+GCTCGTTCGACGGACGTCGTGACCAGAAGTCGAGCAAACCGACTCCACTCTAGCTAGTGATACAAGCTTT
+TTTGTAGCCGCGCGATTGGGCCGCCCGTAAGGAATGCGTCATGAGCGACTTCGCATCACGGGCGACCAAT
+CATTAATTTGTCAAACCCTTTGACATGCACTACTTGTCCACATTTTGTACACGAAATACCTAACACACTA
+TGGTGCACATCACGCACTTCCACGTTCCGTATTCGGTGTACGATTTTGTCACGCAACTAAGCGTTCAAGA
+GGGAGTACTATGACTCATCCAAAAGTAAAAGATGACATAGAAATAGAAGAGTCGTGGTTCCGGTGCGGGT
+AGCTCCCGATGGCTTGACTGTGGTAAGCACCAGTGGCGTGTTCCCCGTGGTTGAGACCAGGAAGTTTTAA
+AGTCCTACAGCCCGCGGTATTCCGCAGAGGACATTGTGTGCATTTCGCACCTTCGGGTGGGAGAAATCGG
+GATGATCTCACCACCGGCCACCGGTGGGCGCACTTTGTACCCTTCGATTCCGTTATTCGGCGGATTTAAG
+CAGTTCGCACCATTACCAAGCAGCCAATGAGGAAGAGCGCAGGTGACTAGGTCGCTTGATCTTTCCCTGT
+GCAGTAGCTCGGGTTCTTTGAGTTTCGAGGAGGAGAAACCACATGTCCTTTGTGAATGTAGACCCATTTG
+GGATGTTGGCGGCAGCTGCGACACTGGAGTCCCTTGGTTCCCACATGGCGGTAAGCAATGCCGCGGTGGC
+CTCGGTGACCACCAAGGTTCCTCCCCCGGCCGCCGACTACGTATCAAAAAAGTTATCGCTGTTCTTTAGT
+AGCCACGGGCAGCAGTACCAGGTGCAAGCCGCTCGGGGCACGGCCTTTCATCGAAAATTGGTCCGGACCC
+TGGCGAATGGCGCGCTTGCGTATGAGGAAGTCGAGATCGCCAACAACGAAGGTTTCTAACGTGTCGCCAG
+TTACGCACGAGTGGCTACCAGCGAGTACAAGGGAGTAACGAATTATGCCCAATTTCTGGGCGTTGCCGCC
+CGAGATCAACTCCACCCGGATATATCTCGGCCCGGGTTCTGGCCCGATACTGGCCGCCGCCCAGGGATGG
+AACGCTCTGGCCAGTGAGCTGGAAAAGACGAAGGTGGGGTTGCAGTCAGCGCTCGACACGTTGCTGGAGT
+CGTATAGGGGTCAGTCGTCGCAGGCTTTGATACAGCAGACCTTGCCGTATGTGCAGTGGCTGACCACGAC
+CGCCGAGCACGCCCATAAGACCGCGATCCAGCTCACGGCAGCGGCGAACGCCTACGAGCAGGCTAGAGCG
+GCGATGGTGCCGCCGGCGATGGTGCGCGCGAACCGCGTGCAGACCACAGTGTTGAAGGCAATCAACTGGT
+TCGGGCAATTCTCCACCAGGATCGCCGACAAGGAGGCCGACTACGAACAGATGTGGTTCCAAGACGCGCT
+AGTGATGGAGAACTATTGGGAAGCCGTGCAAGAGGCGATACAGTCGACGTCGCATTTTGAGGATCCACCG
+GAGATGGCCGACGACTACGACGAGGCCTGGATGCTCAACACCGTGTTCGACTATCACAACGAGAACGCAA
+AAGAGGAGGTCATCCATCTCGTGCCCGACGTGAACAAGGAGAGGGGGCCCATCGAACTCGTAACCAAGGT
+AGACAAAGAGGGGACCATCAGACTCGTCTACGATGGGGAGCCCACGTTTTCATACAAGGAACATCCTAAG
+TTTTGATTCGGGAACATCCTAAGAAACGGGGGGCGTCGCCGTTGGAGACGTCGCAACGTGTCCGCAGTCC
+CAAGGGCAACAGTGAAGGGCCCACGGTGCGATCCCCAACACCCGGCTAGAGTGCGCATATATTTTCCCGC
+CTCGGCTCAAGGCGTGCACCCCCATCACCGCTAACCATGCTGTGTATCAACAGATTTCATTGTCCCGGCC
+GTCGCGCGACCGACCAATAGGGTGAGTTCCATGTGCGATATCGCCTAACAGCCGGCTCCCGTACTCCCGT
+GGCCGATGTGATTATTGATTACGTGGATCACCATGTGGGTGATCGCGGTCGACAGCTTTGGTACCGAGCA
+CATCGCCACAACGCGCGGTACGAATCTAGTACACAAATCCGCACCAGCCGCCATGCGACTTCGCAGGTCA
+TAGCCCCGCAGAGTCGCCGAACCTGCCGCAGTGACAAAAGTCAGGACGGCCGGCGACGCGTCGAGCCGGG
+GTTAGGCGCAGTTAACGTCGCAGCGGGGTCCCAGACACGCGTCGGACTTTCGGACTCAGCCCGACGATTC
+GCCGTCAGACTGCGGGCTTTCCTGGTCTACCAGCAACGCTTGCAGGGCGGAGCCGGTGATGCGCCGGAAC
+GCGCGCCGTGGCCGGTTGGCATCGAGAACGGCCACCTCTAAGCTGGCCACGCCAAGGGTGGGTTGATCAC
+CACCCGAGGTGTCGGCACTGCCGGCCCGCAATGCAGCGACCGCGATACCCAGGGCGTCGGTCAGGCTGGC
+GTTCTCGGCATACGACTCTTTGAGCGCGTTGGCGATCGGCTCCGTGGTGCCGCCCATCACCACGAAATGC
+GGCTCGTCGGCGATCGACCCGTCGTAGGTAATACGATACAACTCAGGGGGTTTCGTCTCGCCGTAATGCG
+CCACCTCGGCCACACACAACTCAACCTCGTAGGGCTTGGCCTGTTCGGTGAAGATGGTGCCTAGAGTCTG
+CGCGTAGACATTGGCCAACTGCCGACCCGTGACGTCACGACGGTCATAGGCGTAACCGCGGGTGTCGGCG
+AACTGGATCCCGCCGCGGCGCAAATTGTCGAACTCGTTGAACTTGCCCGCAGCCGCAAAACCCACCCGAT
+CGTAGAGCTCACTGATCTTCTGCAGCGACCGCGACGGATTCTCCGCGACGAACAGCACACCACCGGCATA
+GGCCAGCGCCACCACGCTTTTGGCCCGCGCAATGCCCTTACGCGCCAACTCGCTGCGCTCGCGCATCGCC
+TGCTCAGGCGAGATGAAATACGGAAAACTCACTTCTCACCGCCATCGGAGCCGAAAGTATCCGCACCCGA
+ACGGCTTTCGATGATCGCGCGGGCCAATTCGGCAATCCGGCTCTCCGGCACGTCAACCGCCCCGTCGGCG
+TCGATGATCACCGCCGTCGGAAAGATGCCCCGCACCAGGTCCGGACCGCCGGTGGCGGAGTCGTCGTCGG
+CGGCGTCGTAGAGCGCCTCGACCGCCACCCGCAGCCCCGAATCACCGTCGGTAACCTGCGAATACAACTT
+CTTCATCGACGACTTCGCGAACAGCGAACCCGAGCCCACCGCCTGATAGCCCTCTTCCTCGATGTTCCAA
+CCGCCGGCGGCGTCGAACGAAACGATACGACCCGCGCTCTGCGGGTCAGACGCATGAATGTCGTAGCCCG
+CCAGCAACGGCAACGCCAGCAGACCCTGCATCGCGGCCGCCAGATTGCCACGCACCATAATCGCCAGCCG
+GTTGATTTTGCCGGCAAACGTCAGCGGCACACCCTCGAGCTTCTCGTAGTGCTCAAGTTCCACGGCATAC
+AGCCGGGCAAACTCAACCGCGACCGCAGCCGTGCCAGCGATGCCGGTAGCGGTGTAGTCATCGGTGATAT
+ACACCTTGCGCACATCACGCCCAGAAATCATGTTGCCCTGCGTCGAACGCCGGTCACCCGCCATGACAAC
+ACCGCCGGGGTATTTCAGCGCGACAATGGTGGTGCCGTGCGGCAGTTGCGCATCGCCGCCTGCGAGTGGC
+GCACCGCCGCTGATGCTTGCCGGCAGCAACTCCGGCGCCTGGCGGCGCAGGAAGTCAGTGAAAGAAGATA
+GGTCTACAGCGGGTGTTCCAGAGAGTGAATTAATGGACAGGCGATCGGGCAACGGCCAGGTCACTGTCCG
+CCCTTTTGGACGTATGCGCGGACGAAGTCCTCGGCGTTCTCCTCGAGGACGTCGTCGATTTCGTCGAGCA
+GATCGTCGGTCTCCTCGGTCAGCTTTTCGCGACGCTCCTGGCCCGCGGCGGTGCTGCCGGCGATGTCGTC
+ATCATCGCCGCCGCCACCGCCACGCTTGGTCTGCTCTTGCGCCATCGCCGCCTCCTGCTTCCTCATGGCC
+TTTCAAAAGGCCGCGGGTGCGCGTCACACGCCCGCTGTCTTTCTCTACCCTACCGGTCAACACCAACGTT
+TCCCGGCCTAACCAGGCTTAGCGAGGCTCAGCGGTCAGTTGCTCTACCAGCTCCACGGCACTGTCCACCG
+AATCCAGCAACGCACCAACATGCGCCTTACTACCCCGCAACGGCTCCAGCGTCGGGATGCGAACCAGCGA
+GTCGCCGCCCAGGTCGAAGATCACCGAGTCCCAGCTAGCCGCGGCGATATCAGCCCCGAACCGGCGCAGG
+CATTCGCCGCGGAAATACGCGCGGGTGTCGGTCGGCGGGTTCTCCACCGCACTCAGCACCTGGTGTTCGG
+TGACTAAACGCTTCATCGAGCCGCGCGCGACCAGCCGGTTGTACAGGCCCTTGTCCAGCCGGACATCGGA
+GTACTGCAGGTCGACGAGGTGCAGCCGGGGCGCCGACCAGCTCAGGTTCTCCCGCTGCCGGAAACCGTCG
+AGCAGCCGCAGTTTGGCCGGCCAGTCCAGCAGCTCCGCGCAATCCATCGGGTCACGCTCGAGCTGATCCA
+GCACGTGTGCCCAGGTTTCCACGATGTCGGCCGCCCGCGGGTCCGGGTCGCGGCTATCCACCAACTTAGC
+CACTCGGTCCAGGTAGATCCGTTGCAGCGCAAGACCGGTCAGTTCCCGGCCGTCGGCCAGCGCAACGGTC
+GCTCGCAGCGACGGATCGCGGGAGATTGCGTGCACCGCATGTACCGGGCGGGCCAGCGCCAGGTCGGTCA
+GATCTATTGCGTGGGCTGGTCCTTCTTCGATCAGGTCGAGCACCAGCGCCGTGGTACCCAACTTCAGATA
+GGTCGACGTCTCGGCAAGGTTGGCGTCGCCGATGATGACGTGCAGCCGGCGGTACCTGTCGGCGTCGGCG
+TGCGGTTCGTCGCGGGTGTTGATGATGCCGCGCTTGAGCGTTGTTTCCAGCCCTACCTCGACCTCGATGT
+AGTCCGAACGCTGGGATAGCTGGAAGCCGGGCTCATCACCCGAGGGCCCGATGCCGACCCGGCCCGAGCC
+GGTCACCACCTGCCGGGATACCAGAAAGGGGGTCAGCCCGGTGATGATCGCCGAGAACGGTGTCTGCCGC
+GACATCAGGTAGTTCTCGTGCGACCCGTAGGAGGCTCCCTTGCCGTCGACGTTGTTCTTGTACAGCTGCA
+GTTTCGCGGCCCCGGGCACGCTGGCGACATGGCGGGCAGCGGCCTCCATCACGCGTTCGCCCGCCTTGTC
+CCAGATCACTGCGTCCAGCGGGTCGGTGCATTCGGGCGCGGAGTATTCCGGGTGCGCGTGGTCGACATAC
+AGCCGCGCCCCGTTGGTCAGGATCATGTTGGCCGCGCCGACCTCGTCGGCGTCGACCACCGGCGGCGGCC
+CGGCCGAGCGACTCAAATCGAAGCCCCGGGCGTCGCGCAGCGGCGATTCCACCTCGTAGTCCCAACGGGT
+GCGTTTGGCACGCTGAATGCCGGCGGCGGCGGCGTATGCCAGCACCGCCTGCGTCGAGGTGAGGATCGGG
+TTGGCGGTCGGGTCCGACGGCGAGGAAATGCCGTACTCGACCTCCGTTCCGATAATCCGCTGCATGCCGT
+AGAGCCTAGGCCCGCCGACGATGCGGGCCGCGCAGCGGGCCGCTGAGGAGGCGGGCATCAAGCAACGCCC
+GCCGACCCAGAACATCGGAGCGGGCCGCGCAGGAGGTGGACAATCAAGCAGGGCCCGGCGCTAGGGTAGG
+CCGGCATGAGCCTTTCCGTCCGTCGCCCCCCGGCGGCCCGAGCAGCGGCCATTGTGGAGGCTGAAAGCTG
+GTTCTTGAAGCGTGGTCTGCCCTCGGTGCTGACCATGCGGGGCCGGTGCCGTCGGCTGTGGCCGCGGTCG
+GCTCCGATGTTGGCCGCCTGGGCGGTGGTCGAGGGCTGCCTCATGGCCGTCTTCTTCGTCACCGACGGCG
+GCGAAGTCTTCATCAGCGCGACGCCGACGACAGCGCAATGGGTGATCCTGGCGCTGCTCGCGGTTGCTCT
+TCCGCTGGCCTCCCTCGTCGGCTGGTTGGTGTCGCAGATATCAAGCGGGCGTGGCCAAGCGGCGGTGGCG
+ACCATGGCGGTGGCCTTCGCGGCCGCATCCGACGTCATCGAATCCGGCCCGATCCAGCTGTTGCGGACCG
+CCGTCGTGGTGGGCCTGGTGCTGCTGCAGACCGGCTGCGGCGTCGGGTCGGTGCTTGGCTGGGCGGTGCG
+GATGACGCTGGAGCACCTTGCGACGGTCGGCACGCTGGCGGTCCGGGCCCTGCCGATCGTGCTACTGACG
+GCATTGGTGTTCTTCAACACCTATGTCTGGCTGATGGCCGCCAACATCAACGGCGAGCGGCTGCCGCTGG
+CGATGGTTTTTCTGCTCGCCATCGCCGGGGCGTTCGTCGTGTCCAAGACGGTGGAACGGGTGCGTCCGCT
+GCTTCGCTCAACGACGGTGATGCCCCAAGGCAGCCAAAGCCTGGCCGGCACACCCTTCGCGACCATGGGC
+GACCCCTCTCCCGGCTTCCCCCTCACCCGGGCCGAACGCCTCAACGTGGTCTTCCTGCTGGCGGCCTTGC
+AACTCGTCGAGATCCTGGTAGTGGCGTCGGTCGGCGCCGCGATATACCTCGTTCTGGGCATGATCATTCT
+CACTCCGCCGCTGCTTCGGGAATGGACGCACTACGATTCGATGACCACGACGGTGCTCGGCATGACGTTC
+CCGGCGCCGGATTCGCTCATCCGTATGTGTCTTTTCCTGGGCGCGCTGACGTTCATGTACATCAGCGCCC
+GCGCGGTCGACGACGCCGAGTACCGCGCGATGTTCCTCGACCCTCTGATCGACGACCTGCACACCGCGCT
+GCTCGCGCGCAACCGCTATCGCAACAACGTGGTGACCGCGCCGTGCGCCGGTGTTGACGCCGGTCACGTC
+GATGACTAGGTTCACCCTGATGTCGGCTCCCGAACGGGTAACCGGCTTGTCCGGGCAACGTTACGGGGAA
+GTCCTTCTCGTAACACCCGGGGAGGCCGGTCCACAGGCCACCGTTTACAACAGCTTCCCGCTTAACGATT
+GTCCGGCCGAGCTGTGGTCCGCGCTCGATCCGCAAGCCCTAGCCACCGAACACAAAGCGGCCACCGCCCT
+GCTCAACGGTCCGCGCTATTGGTTGATGAACGCCATCGAGAAGGCGCCCCAGGGCCCGCCGGTGACGAAG
+ACCTTCGGCGGGATCGAGATGCTCCAGCAGGCCACGGTGCTGCTGTCATCGATGAACCCTGCCCCATACA
+CCGTCAGCCAGGTCAGCCGCAACACGGTCTTTGTGTTCAACGCCGGCGAAGAGGTCTACGAACTGCAGGA
+CCCCAAGGGACAGCGCTGGGTGATGCAGACGTGGAGTCAAGTGGTGGACCCCAACCTGTCCCGAGCCGAC
+CTGCCCAAGCTGGGTGAACGGCTCAACCTGCCAGCCGGGTGGTCCTATCATACCCGCGTGCTTACCAGCG
+AGTTGCGGGTCGACACTACCAACCGGGAGGCCCGCGTCCTGCAAGACGACCTCACCAACAGCTACTCGCT
+GGTGACCGCCTGAGCCCTACAGGTACTGGCCGAGGTTGGACTCGGTATCAATAGCCCTGCTGGCCGACGA
+ACTCTTTCCGGTGACCAGGGTGCGGATGTAGACGATCCGCTCCCCCTTCTTGCCCGAGATCCGCGCCCAG
+TCATCGGGGTTGGTGGTGTTGGGCAAATCCTCGTTCTCGGCGAACTCGTCGACGATCGAATCGAGCAGAT
+GCTGTATACGCAGTCCCGGTTGGCCGGTCTCCAGCACCGATTTGATGGCGTTCTTCTTGGCTCGGTCGAC
+GACGTTCTGGATCATCGCCCCGGAGTTGAAGTCCTTGAAGTACATGACTTCCTTGTCGCCGTTGGCATAG
+GTGACCTCCAGGAACCGGTTGTCGTCGATCTCGGCATACATCCGGTCGACAACCTTCTCGATCATCGCCT
+TGATGCAGGCCGAACGGTCACCGTCGAACTCGGCGAGATCGTCGGCGTGCACCGGCAAGAACTCGGTCAG
+GTACTTCGAGTAGATGTCCTGCGCCGCTTCGGCATCAGGCCGCTCGATCTTGATCTTCACGTCGAGGCGC
+CCGGGCCGCAGGATGGCAGGGTCGATCATGTCCTCTCGGTTGGAGGCGCCGATCACGATGACATTCTCGA
+GTCCCTCCACCCCGTCGATCTCGCTGAGCAGCTGCGGGACCACCGTGGTCTCGACGTCCGAGGAAACGCC
+GGTGCCACGGGTGCGAAAGATCGAGTCCATCTCGTCGAAAAACACGATCACCGGAGTGCCTTCCGACGCC
+TTCTCGCGGGCCCGTTGGAAGATCAGCCGGATGTGGCGTTCCGTTTCCCCGACGAATTTGTTCAGCAGCT
+CGGGGCCCTTGATGTTGAGGAAGTACGACTTCGCCTCGTGGGCATCGTCGCCGCGGACCTCGGCCATTTT
+CTTGGCCAACGAGTTGGCCACAGCCTTGGCGATCAACGTCTTACCACAGCCGGGTGGGCCATAGAGCAAC
+ACACCCTTGGGCGGGCGCAGCGAGTACTCCCGGTACAACTCCTTGTGCAGGAACGGCAGCTCCACGGCGT
+CGCGGATCTGCTCGATCTGGCGGCTCAGACCGCCGATGTCGGCGTAGCTGACGTCCGGCACCTCTTCCAG
+CACCAGGTCTTCTACCTCGGCTTTGGGGATGCGTTCGAAGGCATAGCCGGCTTTGGTGTCGACCAGCAGC
+GAGTCGCCGGGGCGCAGCTTGCGCGGCCGGGTGTCATCGTTGAGGGCCTCAGGGAGGCCGTCTGGCAGGT
+CCTCGGCGATCAGGGGATCAGCCAGCCAAACAACGCGTTCCTCGTCGGCGTGGCCGACGACCAGAGCCCG
+ATGACCGTCGGCCAGGATCTCGCGCAAGGTGGATATCTCGCCGACCGCCTCGAATGTGCCGGCCTCCACG
+ACGGTCAGGGCCTCGTTGAGCCGGACCGTCTGCCCCTTCTTCAGCGATGCAGCGTCAATATTCGGTGAGC
+ACGTCAGGCGCATCTTGCGACCCGATGTGAACACATCGACCGTGTCGTCGTCGTGCGTGGCCAGCAGGAC
+GCCGTAGCCACTGGGCGGCTGCCCCAGCCGGTCAACTTCCTCGCGCAGCGCCAGCAGTTGTTGACGGGCT
+TCTTTAAGAGTTTCCATTAATTTGGAATTGCGGGCAGCAAGTGAGTCGATACGGGCTTCGAGTTGATGTA
+TATCGCGGGCAGAGCGCGTCGGGGCATGTGATCCGACGGCGTTCTCAAGTTGCTCGCGCAGGACCGCAGC
+CTCGCGCCGCAGCTGTTCTAATTCGGCGGCATCACCACTGGACAGCGGGCTATCCCGGGGGATGCCGAAT
+GCCTCAGAACGCTCTGACTCACCCATGTTGCGCTCCTTTCCCACGCCAGGAATCGCGCGGCGGATACTCC
+AACGCTACCGGCGATCGGCGCTTCATGTTGGCAGTCGAATGCCGATGGAAAGTAACAACTTGTATCGCTG
+GTAATCTCGGCCCCGAATCCGGCCGATCAAACGGACCTTGAGAGGAGCACTGTGACCGCGAAATCCCTAG
+CCACAGGCGTAGTGGGCGACGCGGCGATCAGTGCGGCGGCCGCCGCCGAGACTTCTGCTGCATTCGCAAG
+CGGCCGGTAGCCGAGCGTGTCGCTGGATGCGCCGAAACATCCGTGTAACCCTGGGCGCCGCCACCATCGT
+GGCGGCGTTAGGGCTCTCCGGGTGTTCACACCCTGAGTTCAAGCGTTCGTCGCCGCCTGCCCCGTCACTG
+CCGCCCGTCACGTCGAGCCCGCTCGAGGCCGCGCCGATCACGCCCCTGCCCGCACCCGAAGCCCTGATCG
+ATGTGCTGTCCCGGCTCGCCGACCCGGCCGTGCCGGGCACCAACAAGGTGCAGCTCATCGAGGGCGCGAC
+CCCCGAAAACGCCGCTGCCCTGGACAGGTTCACCACCGCACTGCGTGACGGGAGCTACTTGCCCATGACC
+TTCGCGGCCAACGACATCGCATGGTCGGACAACAAGCCGTCCGACGTGATGGCCACCGTCGTCGTCACCA
+CTGCCCATCCGGACAACCGCGAGTTCACGTTTCCCATGGAATTCGTGTCCTTCAAGGGCGGCTGGCAATT
+GTCTAGGCAGACCGCGGAAATGCTGCTGGCCATGGGTAACTCACCGGATTCGACTCCGTCGGCTACCAGC
+CCGGCGCCGGCCCCATCACCGACTCCCCCTGGCTGAGCTCCCGATGTGGATTGGCTGGCTGGAATTCGAC
+GTGCTGCTGGGCGACGTGCGCTCACTCAAGCAGAAGCGGTCGGTGACCCGCCCCCTGGTCGCCGAGTTGC
+AGCGCAAATTCAGCGTGTCGGCCGCCGAGACCGGTTCGCATGATCTGTACCGGCGGGCGGGCATCGGTGT
+GGCCGTGGTGTCCGGTGACCGCAGCCACGCCGTCGATGTCCTCGACAACGCCGAACGTCTGGTAGCCGCA
+CATCCGGAGTTCGAGTTGCTGTCCGTGCGCCGGGGCCTGCACCGCACTGACGACTAAGTGGACTGGCTCC
+CAGCTGTGTCTCCCGCTACCCGTCGCGTCCCTCGCGCTTACGACCTAGCGGCGCCGGAGCCACAGCCCCC
+GGCGCCAACCGGCGCGTTGCTACCAGGAACGCGGTATGCCCGCGCATCGAATGCTGCGGCCGAACCGCCA
+ACCCTACGACGTTCCAGCCCCGCTGCAGCGTCTCCCAGGCTCTCGGTTCGGTCCAGCACTGCTTGGCCCG
+CAGTGCCTCCACGATCCTCGACAGCTGAGTGACGGTGGCCACGTAGACCATCAGCACTCCGCCGGCGACC
+AGCAGCCGCGATACCGCGTCGAGCACCTCCCACGGCGCCAGCATGTCGAGCACGGCCCGATCAACGGATC
+CGTCGGGCAGTTCGGAGTCGGCGAGGTCGCTGACGACCAGTCGCCAGTTGTCCGGCGGCTGGCCGTAGCA
+GCCGCTCACATTGCGCCGGGCGTGTTCGGCATGATCGGCGCGCTGTTCGTAGGAGATCACCTGTCCGGCC
+GGCCCAACCGCCCGCAGCAAAGACAAGGTCAGAGCACCGGATCCGGCTCCTGCCTCCAGCACCCGCGCGC
+CGGGAAATATGTCGCCCTCATGCACGATCTGGGCCGCATCTTTGGGATAGATCACCTGCGGGCCGCGCGG
+CATCGACATGACGTAGTCGACCAGCAGCGGGCGCAGCACCAGGAACAGGGCGCCGTTGCTGGATTTGACC
+ACGCTGCCTTGCTCCAACCCGATCACCGCGTCGTGGGCGATCGAGCCACGATGAGTGTGGAATTCGGCAC
+CGGGAGTCAGCGACATGGTGTAGCGGCGCCCCTTAGCGTCGGTGAGCTGAACACGTTCGCCGATGCTGAA
+TGGGCCGGTTGCTGACACGCCGTCTAGCGTGCCAGCCGACTCGCCGCGATCGGTGCTCGGGGTTGTCGGC
+GCCCAACCCTAAGCTGCGGACATGGCCGACCAGCCGGACCCGCCCACACCACGGCCGGCGTTATCACCGT
+CACGGGCGACGGACTTCAAGCAATGCCCGCTGCTATACCGGTTTCGCGCGATCGACCGGCTACCCGAGGC
+GACGTCGGCGGCGCAGTTACGGGGTTCGGTGGTGCACGCCGCGCTTGAGCAGCTCTATGGGCTACCCGCG
+GGGCTGCGCAGCCCGGATACTGCGAGGTCACTGGTGCAGCGCGCTTGGGACCAGATGGTCGCCGCGGAGC
+CCGAACTGGCCGGCGAACTGGACCCCGGACAACCAACCCAGCTGCTGGAGGACGCCCGCGCGTTGGTGTC
+CGGCTACTACCGGCTGGAAGACCCGACTCGGTTCGACCCGCAATGCTGCGAACAGCGGGTGGAGGTCGAA
+CTGGCCGACGGAACTCTGTTGCGCGGCTACATCGACCGCATTGACGTCGCCGCCACCGGCGAGCTGCGGG
+TGGTCGACTACAAGACTGGCAAGGCGCCGCCGGCGGCGCGGGCGTTGGCGGAGTTTAAGGCGATGTTTCA
+GATGAAGTTCTACGCGGTGGCGCTATTTCGGTCGCGCGGCGTGCCGCCCACCCGGCTGCGGCTCATCTAT
+CTGGCCGACGGCCAGCTGCTCGACTATTCACCGGACCGCGACGAGCTATTGCGTTTCGAAAAGACGTTGA
+TGGCGATTTGGCGTGCTATCCAATCCGCAGGCGAGACAGGCGATTTCCGCCCCAACCCATCGCGGCTCTG
+CGATTGGTGCCCGCATCAACAGCGCTGCCCGGCCTTCGGCGGAACACCACCGCCCTATCCAGGGTGGCCC
+ACCGAGCCGGCGGCATAAACGATCGCGTCGAAGTGCGGTGTCATAGGGCCGCCGCGGCGGCGACGATGGC
+AAACCCGCCCAACACCGCGACCGAATCCTCGAGCAGCGCGATCGGCAGGTCGTGGCCGCCACGGGCAGCC
+ACCAGCCTCGTACGTGCCTGATAGCCGCCCATGGTGCCGAGCACGGCGCCGATAACCCCAGCGCCAAGCC
+CGCCCCACCGGTAGCCCCACGCGGTGCCGATGACCGCGCCGGCGAACGCGCCCAAAATGATCCGGACAGC
+GAACACCGGCGTCACGGTACGCGGCGGTGTTTTGGGACGTTTGTCGTTAACGAGTTCGGCGACCGCAAGA
+ACGCTGACGATCACCACGGTCACGAAATTGCCCATCCAGGATGCCCAGGTTCCATGCAGGTTGATCCAGC
+CGAGAAAGGCGGCCCAGGAGACCACGGCCGGGGCCGTCAGGGAACGCAACCCGGCGACGACACCGATAAG
+CAGCGCCAGCAGCAGAACAAGGACATGCGTCACAGCGATCCCTCCTGAGACAGACGTTATGGGCAATCAG
+GCCCCAGCGGACGCTAACACAGCGTGGGCCCCGCCACAGGATCAGAATCGGCAGAACCTGATGTCCGACG
+CCAGAATCGCTTTGGCCCCGATCGCAGCGAGCTCATCCATGATGCCGTTGACGTCCCGGCGCGGCACCAG
+GGCGCGGATTGCCACCCAGTCCGGGTCGGCCAGCGGGGCGATGGTCGGTGACTCCAGCCCCGGCGTGATC
+GCCGTGGCCTTCTTCAACGCCGAGCGCGGGCAATCGTAGTCGAGCATCAGATACTGCTGGCCGAAGACCA
+CCCCCTGCACCCGAGCGACCAGTTGATCGCGCGCCTCGGTCTGGTCTTGGCCGTCCGTACCGGCCCGCTC
+GATGAGCACCGCCTCCGAATCGCACAGCGGCTCACCAAAGGCCACCAGGTCGTGCTGGCTCAGCGTGCGA
+CCCGACCCCACCACATCGGCGATGGCATCGGCCACCCCGAGCTGCACCGAGATCTCCACGGCACCATCAA
+GTCTGATGACCGTTGCTTCGATTCCCTTGGTGGCCAGATCTTTCCGGACCAGATTCGGGTAGGCGGTGGC
+GATCCGCATCCCGGCTAGGTCGGCAGTCGTCCAGTTCCGCCCGGCGGGAGCGGCATAGCGGAAGCTGGAC
+GACCCGAAGCCCAGCGCCAGGCGTTCCCGAACCTGTGCACCGGAATCGCACACCAGGTCGCGTCCGGTGA
+TCCCGAAGTCGAGCTCTCCCGAACCGACATATATGGCAATGTCTTTGGGCCGCAAGAAGAAGAACTCGAC
+GTTGTTGACCGGATCGATGACGGTCAAGTCTTTGGAATCGGTGCGGCGGCGGTAGCCGGCCTCCGCGAGG
+ATCTCGGTGGCCGGCTCGCTCAGCGCACCCTTGTTGGGAACCGCGACCCGCAGCATGCTCACAGCTTTCG
+ATAGACGTCGTCGAGGGACAGTCCACGGGAGATCATCAGCACCTGCGTCCAGTACAGCAACTGGCTGATC
+TCCTCCGCCAGTGCGTCGTTGGATTCGTGCTCGGCAGCCAGCCACACCTCGCCGGCCTCCTCGAGAAGCT
+TCTTACCCAGAGCATGAACCCCGCCGTCCAATGCCGCCACCGTGGTGCTGTCGGCCGGCCGGGTGCGGGC
+ACGATCGCCGAGTTCGGCGAACAGATCCTCGAAGGTCTTCACGGCCAGCGATTGTTGCACGTGTCAGCCA
+GCCAAGTCACGGTGGTTTGACGCCACACGTTCGCCACCGCCGCGCCGCGCATTAGGGCATCCTAATATAG
+GTTAGGCTACCCTAGTTATTCCTGTGGTCGAAGGAGGCAGCCGAACGTGACCTTCCCGATGTGGTTCGCA
+GTTCCGCCGGAAGTGCCGTCAGCATGGCTGTCCACCGGCATGGGCCCCGGTCCGCTGCTGGCCGCGCAAT
+ACACCGAAATTGCAACGGAACTCGCAAGCGTGCTCGCTGCGGTGCAGGCAAGCTCGTGGCAGGGGCCCAG
+CGCCGACCGGTTCGTCGTCGCCCATCAACCGTTCCGGTATTGGCTAACCCACGCTGCCACGGTGGCCACC
+GCAGCAGCCGCCGCGCACGAAACGGCCGCCGCCGGGTATACGTCCGCATTGGGGGGCATGCCTACGCTAG
+CCGAGTTGGCGGCCAACCATGCCATGCACGGCGCTCTGGTGACCACCAACTTCTTCGGTGTCAACACCAT
+CCCGATCGCCCTCAACGAGGCCGACTACCTGCGCATGTGGATCCAGGCCGCCACCGTCATGAGCCACTAT
+CAAGCCGTCGCGCACGAAAGCGTGGCGGCGACCCCCAGCACGCCGCCGGCGCCGCAGATAGTGACCAGCG
+CGGCCAGCTCGGCGGCTAGCATCAGCTTCCCCGACCCGACCAAATTGATCCTGCAGCTACTCAAGGATTT
+CCTGGAGCTGCTGCGCTATCTGGCTGTTGAGCTGCTGCCGGGGCCGCTCGGCGACCTCATCGCCCAGGTG
+TTGGACTGGTTCATCTCGTTCGTGTCCGGTCCAGTCTTCACGTTTCTCGCCTACCTGGTGCTGGACCCAC
+TGATCTATTTCGGACCGTTCGCCCCGCTGACGAGTCCGGTCCTGTTGCCTGCCGGGCTGACCGGGCTTGC
+CGGGCTCGGTGCGGTATCGGGGCCGGCCGGACCAATGGTCGAACGTGTGCACTCCGATGGTCCCAGCCGG
+CAAAGCTGGCCTGCGGCCACCGGAGTCACCCTGGTGGGTACCAACCCGGCTGCCCTGGTTACCACGCCCG
+CACCCGCTCCGACCACGTCCGCGGCACCGACGGCACCGTCGACTCCCGGATCCAGTGCCGCCCAAGGCCT
+TTACGCGGTCGGTGGTCCCGACGGGGAAGGGTTCAACCCGATCGCCAAGACGACAGCACTCGCCGGTGTT
+ACCACCGATGCCGCCGCACCTGCCGCCAAACTGCCCGGCGACCAAGCTCAGAGCAGCGCCAGCAAAGCAA
+CAAGACTGCGGCGACGTCTCCGGCAACACCGCTTCGAGTTTCTGGCCGACGACGGCCGCCTGACCATGCC
+AAACACACCGGAGATGGCAGACGTCGCCGCCGGCAACCGTGGATTGGATGCGCTGGGGTTCGCCGGCACG
+ATCCCAAAATCGGCGCCCGGATCAGCGACCGGGCTTACTCACCTAGGCGGCGGATTCGCCGACGTCCTGT
+CGCAGCCGATGCTTCCGCACACGTGGGACGGGTCAGATTAAACGTTGAAGTACTTGGCTTCCGGATGGTG
+CAGGACGAACGCGTCGGTCGACTGTTCGGGATGCAGCTGTAATTCCTCGGATAACGTCACACCGATGCGT
+TCGGGCTCCAGCAGCGCCATCATCTTGGCGCGGTCCTCCAGATCCGGGCATGCGCCGTAGCCGAAGGCAA
+AGCGAGCACCGCGGTAGCCGAGCTTGAAATAGTCTTCTTTCGCCTCCGGATCCTCGGCCGCCATCGCCCG
+ATCCCCGGAGAACTTGAGCTCCTCACGGATCCGCCGGTGCCAGTACTCGGCCAGCGCCTCGGTGAGCTGC
+ACGCCGATACCGTGCACCTCCAGGTAGTCGCGGTAGGCGTTGGACGCGAACAGCTCGTTGGCGAAATCCG
+CGATCGGCTGACCCATGGTCACCAGCTGGAACGGCAGCACGTCAACCTCGCCACGCTCGGCGGCCAGCTC
+CCGCGAGCGGATGAAATCGGCAATGCACAAAAACCGACCGCGCTGCTGGCGCGGGAAGTGAAACCGGTAG
+CGCACCGGGGCGTCGGGCTTGGGCTCGGTGAGCACCACGATGTCGTTGCCCTCGGACACCGCCGGGAAAT
+AGCCGTACACCACGGCGGCGTGCGCCAAGATGCCGTCGGTGGACAGCCGGTCCAACCAGTACCGCAGCCG
+CGGCCGGCCCTCGGTCTCGACGAGATCTTCGTAGGACGGACCCTCACCGCCGCGCTGGCCGCGTAAACCC
+CACTGGCCCAAAAACAATGCGCGCTCATCGAGCAGACCGGTGTAGTCGGCCACCGCCAGGCCCTTGACGA
+TCCGCGAACCCCAGAACGGCGGCGCCGGGACCTCGATGTCGGCCGCGACATCGGAGCGTTCGGGCACCTC
+GACTGGTTCTTCGGCGGCTTTGCGCTGTGCGGCAATGCGTTTGGATCGCTGGTGGCGGGCCTTACGTTCG
+GCTTCTTTCTCACGCGCCTTAATGGCTTCCGGGCTGTTTTCGTCGGGCGCCTCGCCGCGCTTGGCGCTCA
+TGATGGTGTCCATCAACTTCAGGCCCTCGAAAGCGTCTCGCGCGTAATGCACTTCGCCCTGGTAGATCTC
+GGCCAGGTCGTTTTCGACATAGCTGCGCGTCAACGCCGCGCCGCCGAGCAGCACCGGGAACTTTTCGGCG
+ACTCCCCGGGTGTTCATCTCCTCGAGGTTTTCCTTCATCACCACGGTCGACTTCACCAGCAGGCCCGACA
+TGCCGACCACGTCGGCGCTCTTGTCCTCGGCGACTTCGAGGATGGTGGCGATTGGCTGCTTGATGCCGAT
+GTTGACCACTTCGTAGCCGTTGTTGCTCAAGACGATGTCGACCAGGTTCTTGCCGATGTCGTGCACGTCG
+CCCTTGACGGTGGCCAGCACGATGCGTCCCTTGCCCGAATCGTCGTCCGAGCGCTCCATGTGCGGTTCCA
+GATACGCGACGGCGGCTTTCATTACCTCCGCCGACTGCAGCACGAACGGCAGCTGCATCTGGCCGGAGCC
+GAAGAGCTCGCCGACCGTCTTCATGCCGGCCAGCAGATGTTCGTTGATGATCTGAAGCGGCGGCTTTTGC
+GTCATCGCCTCGTCGAGATCGGCGTCCAGGCCGTTGCGCTCGCCGTCGACGATGCGTTGGGCCAGCCGTT
+CGAACAGCGGCAGCCCAGCTAGTTCAGCCAGTCGGTCCTCTTTCGAGGAGGCCGCCGACACGCCTTCGAA
+CAGCCGCATCAGCTCCTGCAGCGGATCGTAGTCCTCGCGGCGGCGGTCGTAGACCAGATCCAGGGCGACG
+TTGCGTTGCTCCTCGGGAATCCGGTTCATCGGCAGGATCTTCGACGCGTGCACGATCGCCGAATCCAGCC
+CCGCTTCTTGGCATTCGTGCAGGAACACCGAGTTGAGCACCTGGCGCGCTGCGGGATTGAGACCAAACGA
+GATGTTGGACAGACCAAGTGTGGTCTGCACATCCGGGTGGCGCTTTTTCAGTTCGCGGATCGCCTCGATG
+GTCTCGATGCCGTCGCGGCGGGACTCCTCCTGACCGGTGGCGATGGTGAACGTCAAGGTGTCGATGAGGA
+TGGATGATTCGTCGACGCCCCAGTTGCCGGTGATGTCGTTGATCAGCCGCTCGGCGATCTCGACCTTCTT
+CTGCGCGGTGCGGGCCTGGCCCTCTTCGTCGATGGTCAGCGCGACCACCGCCGCGCCGTGCTCGGCGACC
+AGCGCCATGGTCTTGGCAAAGCGCGATTCCGGGCCGTCGCCGTCCTCGTAGTTCACCGAGTTGATCGCGC
+ACCGGCCACCCAGATGCTCCAAACCCGCCTGCAGCACCGCGGTTTCGGTGGAGTCCAGCATGATCGGCAG
+CGTCGAGGACGTGGCCAGCCGGCTGGCCAGCGCCTTCATGTCGGCCACACCGTCGCGGCCCACGTAGTCC
+ACACACAGGTCCAGCAGGTGGGCGCCGTCGCGGGTCTGGTCCTTGGCGATGTCCAGGCACTTCTGGTAGT
+CCTCGGCGATCATCGCCTCACGAAAACCCTTGGAGCCGTTGGCGTTCGTTCGCTCCCCGATCACCAGAAC
+CGAGGCGTCCTGGGCGAACGGGATTGCGGTGTACAGCGACGACACCGACGGCTCGTAGCTGACCTGTCGC
+TCGGGACGCTTGATGTTCGCAACCGCGGCAGCCACTTCGCGGATATGGGCCGGGGTGGTGCCGCAGCAGC
+CACCGACCAGCGAGAGCCCGAACTCGGCGATGAAGCCGGCCAGCGCCTCGGCCAATTCGTCGGGCAGCAA
+CGGATATTCGGCGCCCTTGGCGCCCAGCACCGGCAACCCGGCGTTGGGCATCACCGACACCGGGATGCGG
+GCGTGCCGGGACAGGTGGCGCAGGTGCTCGCTCATCTCGGCCGGACCCGTCGCGCAGTTCAAGCCGATCA
+TGTCCACACCGAGCGGCTCGACAGCGGTCAACGCCGCCCCGATCTCGCTGCCCAGCAGCATGGTGCCGGT
+GGTCTCGACGGTGACGTGGGCAAACACCGGAATGTGCCGCCCGGCCCGCGTCATCGCCCGCCGCGACCCC
+AACACCGCCGCCTTCAGCTGCAGTAGGTCCTGGCAGGTTTCCACCAGGATGGCGTCGGCTCCGCCGTCCA
+GCATGCCCAGCGCGGCCTCGGTGTAGGCGTCGCGGATCACCGCGTATTCGGTGTGGCCCAGAGTCGGCAG
+CTTGGTGCCCGGCCCCATCGACCCCAGCACGTAGCGCTTGCGGTCGGGACTGCCCAGCTCGTCGGCCACC
+CGGCGTGCGATCGCGGTGCCCTTCTGTGATAGATCGCGGATCCTGTCGGCGATGTCGTAGTCGCCGAGGT
+TGGACAGGTTGCAGCCAAACGTGTTCGTCTCGACGGCGTCGGCGCCCGCTTCGAAATAGTTGCGGTGAAT
+GGTTTCCAGCACGTCAGGGCGGGTTTCGTTGAGGATCTCGTTGCAGCCCTCCAGGCCGCGGAAGTCGTCG
+AGCGTGAGGTCCGCGGCCTGTAGTTGGGTTCCCATTGCACCGTCGCCGACCATCACTCGCTGCGACAAGA
+CGTCGAGCAGATCGGTGTCGTAGAGGTGCTTGTCGGCCGCAGTCACATGGCAAGGATAGTCGGCCTATGA
+AATTTCCTCAGTCGTTGACAGCGCTCTGCCAGGTACCGCGACGTCGCATCGGTCACAGCTGCCACAAGAG
+TCTCAGCTGAGGCAGGCACACAACGTGCCCACCTCAGCGCGACAAAGCGTGGCCATCGCTACTAGCCGGG
+CCGCCTCAGACGACGTGCACGGTTCGCATCGTCGCCCGGGTGGACGCCGTAGGCTGACCAGGTGACCCCA
+TCGGAGGGCAACGCACCGCTGCCCGAACTGCACAACACCGTCGTCGTGGCTGCGTTCGAGGGCTGGAACG
+ACGCCGGCGACGCGGCCAGCGATGCCGTGGCACACCTGGCGGCCAGCTGGCAAGCACTGCCGATTGTCGA
+GATCGATGACGAGGCCTACTACGACTACCAGGTCAATCGGCCGGTCATCCGCCAAGTCGATGGGGTTACC
+CGGGAACTGCAGTGGCCGGCCATGCGGATCTCGCACTGCCGCCCACCCGGCAGCGACCGCGACGTGGTGT
+TGATGTGCGGGGTGGAGCCGAATATGCGCTGGCGCACGTTTTGCGACGAGTTGCTGGCGGTCATCGACAA
+ACTCAACGTGGACACCGTGGTGATCCTGGGGGCGCTGCTGGCCGACACCCCACACACCCGGCCGGTGCCG
+GTCTCGGGCGCGGCCTACTCCGCGGCGTCGGCGCGGCAGTTCGGCCTTCAAGAAACACGCTACGAGGGCC
+CCACCGGCATCGCCGGCGTCTTCCAATCTGCCTGTGTGGGGGCCGGCATCCCGGCGGTGACGTTTTGGGC
+GGCGGTGCCGCACTATGTGTCGCACCCACCGAACCCGAAGGCGACGATTGCGTTGCTGCGCCGGGTCGAG
+GACGTGCTCGACGTCGAGGTGCCGTTGGCGGACCTGCCCGCACAGGCCGAAGCGTGGGAGCGCGAGATCA
+CCGAGACGATCGCCGAAGATCACGAGCTGGCCGAGTACGTGCAGACGCTGGAACAGCACGGCGACGCCGC
+GGTGGACATGAACGAGGCTCTCGGCAACATCGACGGCGACGCGCTGGCCGCCGAGTTCGAGCGCTATCTG
+CGCCGGCGCCGCCCGGGGTTCGGGCGCTAGAGGGAGGTTGCGCTGCGGCGGACGACGGTGTCAGCCGGGC
+GGCCCAGGATCGCCGGAATCACCCTGAGTGCCCGGAGCGCCGGCTTTGCCGGGATTCGTGCCTGTCGACG
+TACCACCGCCGGCACCAGCCTCGCCGCGCGCACCGCCGCCGCCGCCGGCCCCGCCCTCGCCGCCGCTGCC
+CATGGCGCCGTGGGCGCCCGAGTGGCCACTGAGCCAGCCGCCCGCCCCGCCCGCGCCACCGGCACCGCGG
+GCACCTCCGGCGCCGCCGGTGCCACCATCGCCACCATCGCCGCCGTCACCGCCGCGGCCACCGAAGGCGT
+TACCACCCCCAAAGGCGCTGGCAACGCCGCCGCCACCGGTCCCGCCGGCCCCTCCCCCACCGCCCACACC
+GCCGGCACCGCCAATGCCGCCGGCACCGCCAGCCCCGCCGTCACCGATCAGCAGCCCGCCGGCCCCGCCA
+GCCCCGCCCGCGCCGCCGGCACCACCCATGCCGCCAGAGGCTCCGGTATTCCCGTTGCCGCCGAAGCCAC
+CGCGGCCACCTTGGGCAAAGCCCCCAGTGAACTCGTCGGCGAACCCACCTTTCCCGCCGTCGCCACCGAG
+GCCGCCGGGAGCGCCGGCGCCTCCGATGCCGCCATTGCCACCGGCGCCGCCGGCCCCGCCGTTACCGATC
+AATCCCGCACTGTTGCCGGCCCCACGGTCCTGACCGGCGGCACCCGCCCCACCGTGCCCGCCATTGCCAT
+ACAGCAATCCACCCGGCCCACCGGGCTGGCCCGGCCCGCCGTTAGCGCCGTCGCCGATCAACGGCCGGCC
+AACAATGCCTGGGTGGGCGCATTGACGGCATTGAGCACTTCGTGTGCCAACGTGGCGTTGGCGGTCTCGG
+CGGCCGCGTACCACCCGCCACCCGAGGTTAGGGCCGCGACAAACTGCGCGAGATACGCGGCCGCCTGCGC
+GCTGATCTGTTGGTATTCCTGCGCATTCGCGCCGAACAGCGCCGCGATAGCCATCGACACCTCGTCGGCG
+GCGGTCGGCCGCCAACGCCGTCGTCGGGCCTGCCACGAGCGCATTGGCCGCGCTGATCGCCGAACCGATC
+CCCGCCACATCTGCGGCGGCCGCGGTCAGAAAGAAGGTTGCGCGATTACGAACGACATGTAGTCTCCAAC
+CGTTTACGGCCGCCCGGCAAGGACCTAACGAACCGTTAAGTAGGCGGCGACAGCGCGAACGCTACCGTGA
+CCGCACTCGCGCGACCCCACACTAGGAAGCAGCACTAATGATTTTCTTATCTTCTCCGCAGCATCGACGG
+CGCCAGCCGACGTTGCGGTGTGTGCGGGTACGATTCCGGTGGAGTTGCCGCCACCCCTAGAGTGGGCGAG
+GATCGCAAGAGCAAATTCCGCGCCGGTAGGACAACGATAGGACCGCCATTACGAAGCCGCCCGAGACTCC
+TGAATTGAGCGCGGCCTCACAGCGTGTCGACGCCTTCGGCGAAGAGGCCGGCTATCACAAAGGCCTCAAG
+CCCCGACAACTGCAGATGATCGGGATCGGCGGCGCGATTGGGACCGGCCTGTTCCTCGGCGCCAGCGGCC
+GGCTTGCCAAGGCCGGACCTGGGTTGTTCTTGGTGTACGGCGTGTGCGGGGTTTTTGTCTTCCTGATCCT
+GCGGGCGCTGGGTGAGCTGGTGCTGCACCGTCCGTCGTCAGGCTCGTTTGTGTCGTATGCACGTGAATTT
+TTCGGCGAGAAGGCCGCTTACGCGGTGGGCTGGATGTACTTCCTGCACTGGGCGATGACGTCGATCGTGG
+ACACCACCGCGATCGCCACCTACTTGCAGCGTTGGACGATCTTCACGGTGGTCCCGCAATGGATTCTTGC
+CCTGATCGCCTTGACGGTGGTGTTGTCGATGAACCTGATTTCGGTCGAATGGTTCGGCGAGCTGGAGTTT
+TGGGCCGCGCTGATCAAGGTTCTCGCGCTGATGGCGTTCCTAGTGGTGGGAACCGTTTTTTTGGCCGGGC
+GATACCCCGTCGACGGCCACAGCACCGGATTGAGCTTGTGGAACAACCATGGCGGGCTGTTCCCGACAAG
+CTGGCTGCCGCTGCTGATCGTTACCTCGGGAGTGGTGTTCGCGTACTCAGCAGTCGAATTGGTAGGGACG
+GCGGCCGGGGAGACCGCCGAGCCGGAGAAGATCATGCCGCGGGCGATCAATTCGGTGGTCGCTCGCATCG
+CGATCTTTTATGTCGGGTCGGTGGCCCTGCTAGCGCTGTTGCTGCCGTATACCGCCTACAAGGCCGGCGA
+GAGCCCGTTCGTCACGTTCTTTTCCAAAATCGGTTTCCACGGTGCCGGTGACTTGATGAACATCGTTGTG
+CTTACCGCCGCGCTGTCGAGCCTGAACGCGGGGCTGTATTCGACCGGCCGCGTCATGCATTCGATCGCGA
+TGAGCGGCAGCGCCCCAAGGTTCACCGCGCGAATGTCGAAAAGCGGTGTGCCCTACGGCGGGATCGTGTT
+GACCGCGGTCATCACCCTGTTCGGTGTCGCGCTGAACGCCTTCAAGCCCGGTGAAGCCTTCGAGATTGTG
+CTCAACATGTCCGCGCTGGGCATCATCGCGGGTTGGGCCACCATCGTGCTGTGTCAGCTTCGACTTCACA
+AGCTGGCCAACGCCGGGATCATGCAGCGGCCGCGGTTCCGCATGCCCTTCTCCCCCTACAGCGGCTACCT
+CACCTTGCTCTTCTTGCTTGTCGTGCTGGTTACGATGGCGTCCGACAAACCGATCGGCACCTGGACGGTG
+GCGACACTGATTATTGTCATTCCGGCCCTGACCGCAGGCTGGTACCTGGTACGCAAGCGTGTCATGGCCG
+TCGCCCGCGAAAGGCTGGGTCATACCGGGCCATTTCCGGCGGTCGCCAACCCGCCCGTGAGGTCAAGAGA
+CTGATGCTTCGAAGAGGTGAATCGATCATCCGCAACCGTTACGCCAGTAAGCCACCACTGTACGGAATGG
+CAATGGTCTTCTTGGCCATGGCCGTCGTCGCCGTGACCGCGTACTTTCGCATGGGCTGGTGGTCGATCAT
+CGGTTACGCCGCCGCTGCCATTATCGGAGTGATCGGGTTCGCACTCGCCTTCCGCGACCTGTCCTGAATC
+GAGCGCGGCAGAACCTCTAGGAATTCTCGAGTGATTCGGTGTAGGCGCTGGCAAAGCGGCCGAGCGCGGC
+GACCTCGGCATCCATCTGGGGCATCAGCTTGGCAACGGTGTTGCGGATGGGACGTTGGCCTACCCGGGTG
+GACAACAACGGCTTGAGCCAACGGAACAGGGCCACCCAGCCCGGGCAGTACACGCGATCTTTTCGGCCCT
+CAATGCCGTTGACGAATGCGGCCGCACACTTGTTGACCGACGTGGTCTTGTTCAACGGCCAAGGGAGGCG
+CGCCAGCAATTCGGCGAACGCAGGCAGGTCGGCCTTGGTATCGCGAACCAACGCGGTGTCGATCCACGAC
+ATGTGCGCCGAGCCGACGCTGACGCCCAGGTGTGCGACCTCGAGTCGCAACGCGTTGGCGAAGTGCTCGT
+TACCCGCCTTCGACATGTTGTAGGGCGCCATCCCGGGCGGCGCCGCGAACGCGGCAAGCGACGAGACGAT
+CAATACGTAACCGCGGCGGTCGATCAGCGCGGGCAACGTCGCCCGCACCGTGTGGAAGTTACCCAGCAAA
+TTGACGTCCAACACCCGCCGGAACGCCTGCGGGTCGACCTTCAGCACGGAGCCGTAGCTGGCGATGCCGG
+CGTTGGCCACGACGACGTCGATGCCGCCGAATCGTTCGACGGCCGTCTCGGCTGCGGCCTGCATGGCGGG
+CAGGTCGCGCACGTCGGCTACCACGGTGAGTAGGCGGTCGTCGCCGCCGAGTTCGGCGCCCATCACCGCC
+AGCTCTGATTTGCTCAGGTCGGTCAGCACCAGTTTGGCGCCCTTGTTGTGCAGCCGACGGGCGACCTCAG
+CCCCGATTCCCCGGGCAGCACCGGTAATGAAGACGACCTTGCCTTGCAGCGATGTCATGGCCGAAAACGT
+ACCGCCGCGCCGGCTACAGGTCCACCCCGAGCAGGGCATCGATCGCCGTCGCCACCAACTTCGGCGCCCC
+GGCATCGTGGCCGCCGTACTCCACCGCATCGGTGACCCAACCATCCAGTGCGGCAATCGCTTTGGGCGTA
+TCGAGATCGTCGGCCAGGTAGCGGCGCACCCGAGCGACAACGTCAACTGCGGCCGGACCGGCGGGAAGTG
+CGGTTGCGGTGCGCCAACGGTGCAGCCGGGCGGTCGCCTCGTCAAGCACCTGCTGGCTCCAGAACCGATC
+GGCTCGGTAGTGTCCGGCGAGCAAACCCAGCCGAACCGCCGATGGCTCAACGTCCTGCGCACGCAGCGCC
+GACACCAGCACGAGGTTGCCGCGGCTCTTTGACATCTTGTGCCCGTCCCAGCCGATCATCCCGGCATGCA
+CGTAGTGCCGCGCGAATCGCCGTTCGCCGCTGACACATTCGGCGTGCGCAGCGGTGAACTCGTGGTGCGG
+AAAGATCAGATCGCTACCACCGCCCTGGATGTCGAGGCCGCTTCCGATACGACTGAGCGCGATGGCTGCG
+CACTCGACATGCCAGCCTGGCCGGCCAGGCCCGAACGGGGACGGCCAGCTGGGCTCACCGGGCCGCGCGG
+CCCGCCACAACAACGCGTCGAGTTCGTCGCTCTTGCCGGGGCGCCGCGGATCGCCGCCACGTTCCTCGCA
+CAGCCGCAGCATGGTGTCACGGTCATACCCTGACTCGTAGCCGAACTGCAGGGTGGCGTCAGCGCGGAAG
+TAGATGTCCTGGTACTCTCCCATTTCCCGGTCTATGACATAGGCCGCCCCGCACGCCAGCATTTTTTCGA
+TGAGCTCGACCATTTCAGCAATCGCTTCGGTGGCCCCCACGTAGTCTTGCGGTGGTAGCACCCGCAGCGC
+CGCCATGTCCTCACAGAACAGGGCGACCTCGGCTTGGGCAAGGTCACGCCAGTCGACACCGTCGCGATCC
+GCGCGCTCAAATAGTGGATCGTCGATGTCGGTGATGTTCTGGACATAGTGCAATTCATGACCGAGATCCA
+GCCACAGCCGATGGATCAGGTCGAACGTCACATAGGTGGCAGCATGGCCCAGATGCGTGGCGTCGTAGGG
+CGTGATCCCGCAGACGTACATGGTGGCCTTAGATCCGGGCGCCACCGGACGGACCTGCCGGTCGGCGCTG
+TCGTACAGCCGTAGCTGCGGGCCTCGTCCCGGCAACACCGGAACCGGTGGGCAATACCACGACTGCATGT
+CCTCGACTCTAAACGGCCCGGTGACTCCAGCCTTTCTGAGCAGCCCGCGCGCCGATCAGCGCCACGCGTC
+GGCGATGGCACCGAGCAGGATCGGCGCCACCTCGGCTCGACACATCAGCAGATCCGGCAGGTAGGGGTCC
+AGTTGGTTGTATCGCAGCGGCGAGCCATCGAGTCGTGACGCGTGCATGCCGGCGGCCAACATCACCCCAG
+CCGGCGCCGCGGAATCCCACTCCCATTGGCCTCCGGCGTGCAGGTAGGCGTCGACGTAGCCGTCAATGAC
+GGCCATCGCTTTGGCGCCCGCCGAACCGATCGACACCGGTTGGATCGCCAGCGTCTGGCGGATGCGGTGC
+AGGACTGCCGGTGGCCGGGTGGCGCTGACGGCAATCCGCAAGGTGCCAGGAACGCCGGCCGGCGCGGCGC
+CGGAAGTCACCGTATCGGTGCGGTACACCACGTTGCCACGGGCCGGCAACGCCACCGCGGCGTCGGTGAT
+CTCGGGCTGGCCATTGGAGGAACGCCGCCACAGCGCAATGTGTACCGCCCAGTCGTCGCGACCCGGTGTG
+GAGAACTCGCGGGTGCCATCCAACGGGTCAATAATCCACACCCGATCGGATTTCAGCCGGGCCAGATCGT
+CGTGGGCCTCCTCACTGAGCACTGCGTCACCCGGCCGTTCGGCCTGCAGCCGTCGCAACAGCAGCGAGTT
+AGCCTGGCGGTCACCGGCTTCCCCGAGCGTCCATGGCTGATCGAAACCGATCTCCGCACGCACCTGGAGC
+AACAGCTTTCCCGCGTCCGCCGCCAGGTCGGCGGCCAGCTCGGCGTCAGTCAGGTCGTCCGTCAGATCAG
+GTGCGGCAGGGCTCACCACTTCAGTATCGCCGAGCTGAACGCAGGCATTTGACAATGGGGCTTCACATCA
+TGATGCTCTATAATTCGCATCTTGATGCACAATAGTGGGATGCGAACCACGGTCAGTCTCGCCGACGACG
+TTGCCGCTGCCGTGCAGCGCTTGCGGAAGGAACGCTCGATCGGGCTGAGCGAAGCCGTCAACGAGTTGAT
+CCGCGCCGGGCTCACGAAACGACAGGTCGCAAATCGGTTCCAGCAGCAGACGTACGACATGGGCGAGGGA
+ATCGACTACTCCAACATCGGCGACGCGATCGAAACACTGGACGGCCCGGCAAGCGGCTAATGCTCATTGA
+CGCAAACCTCCTGCTCTATGCCGTCGACGAGCGTGCCGCGCGGCACCGCGCCGCGGTTGGCTGGCTTTCG
+GAACAACTCAACGGCTCCCGTCGGGTCGGCTTGCCGTGGCAGAGCCTGGCCGCCTTCCTGCGGATCGGGA
+CTCATCCACGTGCGTTCCCGCGACCACTCACACCTGCCGCGGCATTCGACATCGTCGACCTAAAACGCCG
+GCCAGGGAATGGGACGATGCCCATTCGGCCCGGGCATCACCGGTTGGTCCAGCAGCGATTGCGCGCGTCG
+GCGCAGCGCGCCGATTTCGGCTGCGGCGATTCGCCCGGCCAACGCCTCGGCAAGCGGGCCGCCAAGAGCA
+TCGGCGAGCCCGGCAACCGCCTGCAGAATTTGGTCGTCAATCGGCTTGCCGGCCCAACCCCACAGCACGG
+TGCGCAGCTTGTTCTCGACGTGCAGACACAATCCATGGTCGACCCCGTAGACCTGGCCGTCGATGCCGCA
+CAGGATGTGACCGCCCTTGCGGTCGGCGTTGTTGATAAGCACGTCGAACACCGCCATCCGGCGCAACCGG
+ATGTCGTCCGCGTGCATCAAAACGACCTCGTCACCGGCGTAGTCGTAGGCCCGCAGCACCGGCAGATAGC
+CCGGCCGCGGCCGGTGGGCGGGAAACAGGTCGACCAGGTCGGGCCCGGGCAGAGGGTCGGAGTCGACCGC
+GTCGCCGGGTTGCTGCACCCAGAGCTGTAGCATGCCTATGCCCGCCGGACCGTCTCGGATGATGGTGTGC
+GGCACCAGGTTCCAGCCCAACTGTGTCGACACCAGATAGGCGCTGAGTTCGCGGCCGGCCAGCGTTCCGT
+CGGGGAAATCCCACAACGGCCGCTCGCCCGAGACCGGCTTGTAGACGCAATGCAGGCTGCGCAGACCCAG
+CGTGGACTCACACAAAAAGGTGGCGTTGCTCGCCGAGCGGATCCGCCCGAGGACTGTCAGCTCGCCGTCG
+GCCAACACCGCATGCTCGTCATCCCGCAGGGTCATCGCCAGACCCGAGCAGCACATCGCGCCGGTAACCG
+TTGGTGCGCGCACAGATGTGTCCCTCGGGATCCAGCGGTTCATCGCAGAGCGGGCACGGCGGGCGTCCCG
+CAGAGATGACGCGGTAGGACCGAGTAGCGAACTGTCGGGCGGACTCCGGCGTCAGAAATACCCGCACCGC
+GTCGGGCCCTTCCTCGGTGTCGTCGAGCACCACGGAAGCGTCGAACTCCGCGTCGGTGACGGCCAGCAGT
+TCGACCACCACGCTCTGCGCCTCCGAATCCCAGCCCAGCCCCATCGTCCCGACCCGAAACTCGGCATCCA
+CCGGCATGATCAGGGGGCTGAGGTCGTCGATCTCAGTGGGTTCCGGGGGCACCGGGGTGCCGAACCGGCG
+GTTAACCTCGAACAGCAGCGCTCCGATGCGCTCGGCGAGCACCGCAACCTGCTGCTTCTCCAGGACCACC
+GACACCACCCGGGAGTCGTGCACCGCCTGTAGGTAGAACGTGCGGTTTCCGGGCTGGCCAACAGTCCCGG
+CGACGAAACGGTCGGGTGTGCGGAATACGTGAATTGCGCGGGCCATGGCACCTCCAAAATACCGCGCAGA
+CGCCGTTGCCGCGTTCTTCGTCGACGGTCACCCCACACGCTAGTCGGTGGAACCGCCGATCACCGCGTCG
+CCGGGTGGCACCGCCGCGTTCGGCTCCGGTGACGCACCCTGGGCGGAAGCCGCGGCCTGCAAAGCCGGGG
+CCAGCCGGGCGCCGGTGTGGTTGACGTGCAGCACGAACGGGCGCAGCTGGGTGTAGCGGACGACACTCAC
+CGAACCCGGGTCGGCGGTGATTCGCTGAAAGCTGTCCAGATGCATACCGAACGCGTCTGCGATCACCGCC
+TTGATGACATCGCCATGGGTGCAGGCCAGCCACAGCACGTCGTGGCCGTGCTGATCGGCCAGCCGCCGGT
+CGTGTTCGCGGACGGCTGCCACAGCGCGAGTCTGCACCTGCGCCAAACCCTCACCGCCGGGAAACACCGC
+CGCGCTGGGGTGGGCCTGGACTACCCGCCACAACGGCTCGTCGACCAGGTCACCGATTTTTCTGCCAGTC
+CATTCGCCGTAGTCGACTTCGGAGAACCGGTCATCGATGAGCGGCTCCAGGCACAGCGCCTCGGCCAGCG
+GTTCGACGGTGCGTTGACACCGCAGCATTGGAGAAGACGCGACCGCCCGGATCGGCAGGTCACCAATTCG
+ATCGATCAACCCGGTGGCCTGCTCGCGCCCCTTCTCGTCGAGGTCGACGCCGGACCGGCCGGCCAGCACG
+CCCGCGGTGTTCGAGGTGGAACGGGCATGGCGTAGCAAGATGACGGTCATGTCGCGGCTACCGTCCCGGT
+AGCCAGCAGCACGAGCATGCCCGTCCCGACGAGCACCCGGTAGCCGACGAACCAGTACATGTTGTGTCGC
+ACCAGAAACCGCAGCAGCCAGGCCACCGCGGTCAGACCGAGGACGAACGCGATCAGGGTGGCCACCAGCA
+ACTGCGGGCCAGTAGCGCTCATGCCCTCGGTTACCGGGTGGAATGCGTCGGGCAACGAGAACAACCCGGA
+GGCGAACACCGCTGGAATGGCCAGCAGGAATCCGAATCGGGCGGCCAGTTCACGGTCGAGTCCGAGAAAC
+AGTCCAGCGCTGATGGTCGACCCGGACCTGGATACCCCGGGGACCAGCGCCAGGGTTTGGGCAATACCAA
+CCACCACGGCATCCCGCCAGGTCAACCGCTCAATGTGACGACTCTGGCGCCCCACGTATTCGGCGAGTGC
+GATCACCCCGGAAAACACCACCAGCGCGGTCACCACGACCCACAGGTTGCGGACGCCCGACCGGATGTCG
+TCTTTGAAGAACAGGCCCAGAATGCAGATCGGGATTGTGCCGATGATGACATACCAGCCCAGCCGATAAT
+CGGTGTTTCGATGTGCCTTCACGACCAGGCCGTGCACCCAAGCGCTCAGGATGCGCACAATATCGCGCGC
+AAAGTAGATCACTACGGCGGCCTCGGTGCCCAACTGGCTCACGGCGGTGAACGAGGCACCGGCGTCGCCG
+CTGAAGAAGATCCGCGACACGATCGCCAGATGTCCCGAGGACGACACCGGCAGGAACTCGGTCAAACCCT
+GGGCCGCGGCCAACACGATGACTTGCCACCAAGACATCGCCGGAGCCGCGGTCACGACGACGACGGTACC
+CGGTTACCGGCGGCCGGTAGACGGATGCGCCTAACGCGACACCGGCGCCGCGGATGCCACCGAGTCGCGC
+ACGGCCGCAGCAAGGCTGCGTTCGTCGGTCAGGTCAATGTCGACCAGGCCACGGACCGCCATCGCGACCA
+CATCCTCAGCCTGCGGCACCGGACCGGCCACGCGCGGTCGATAGATTTCGACGACGAGCGAGCGATGCTC
+GATGTGGAAGGAGAAACTGCGTCCATCGCCGACTTGCCCATACCCGCTGGCGAAAATTCCCGTCGATATA
+TCTTCAACAGCAAACTCTTCGCGCTTGTCTGCGAGATGCCGGTCAGCGGTGACGGTCATGCCCAGAGAAT
+ACCTCTGGAGTACCATTTCCCGTGGGCGACATGACGAGATTGAAAGCAACTTGCCAGATTCGGATTCGTG
+AGAGGTTGACTTCATGTTTCGCATCCGAAGGCTGACCGTTGCTAACAGGGAATAAACCAGCAGTTCAACG
+CCGCTTCATCGGCCTGTTGATGTTGTCAGTCCTGGTCGCAGGCTGTTCTTCGAACCCGCTGGCTAACTTC
+GCACCCGGGTATCCGCCCACCATCGAACCCGCCCAACCGGCGGTGTCACCGCCTACTTCGCAAGACCCGG
+CCGGTGCAGTGCGACCACTGAGCGGCCACCCCCGGGCGGCACTATTCGACAACGGCACCCGCCAATTGGT
+GGCTCTGCGCCCGGGCGCCGATTCGGCGGCACCCGCCAGCATCATGGTCTTCGATGACGTGCACGTTGCA
+CCGCGCGTCATTTTTCTGCCGGGCCCGGCAGCCGCGTTGACCAGCGACGACCACGGCACGGCCTTCCTTG
+CCGCCCGCGGCGGCTACTTCGTGGCCGACCTGTCCTCCGGTCACACCGCACGAGTGAATGTCGCTGACGC
+AGCGCACACCGATTTCACCGCGATCGCCCGCCGCTCCGACGGCAAGCTGGTGCTGGGCAGCGCAGATGGC
+GCCGTCTACACGCTTGCCAAGAACCCCGCAGTTGACCCGGCGTCCGGCGCCGCCACCGTAGCCAGCCGGA
+CCAAGATCTTCGCGCGCGTGGATGCCCTTGTAACACAAGGGAATACAACCGTTGTTCTGGATCGTGGCCA
+GACCTCGGTGACCACGATCGGCGCCGACGGTCATGCCCAGCAGGCACTGCGCGCCGGCCAAGGTGCGACG
+ACCATGGCCGCCGATCCGCTGGGCCGGGTGCTGATCGCCGACACCCGTGGTGGCCAACTACTGGTGTACG
+GCGTCGACCCGCTGATCTTGCGCCAGGCCTACCCGGTGCGGCAGGCTCCGTACGGGCTGGCCGGATCCCG
+CGAATTGGCGTGGGTGTCCCAAACCGCGTCCAACACCGTCATTGGTTACGATCTGACCACCGGAATACCC
+GTAGAGAAGGTGCGTTACCCAACCGTGCAACAACCCAACTCGTTGGCCTTCGACGAAACGTCGGACACCT
+TGTACGTGGTGTCGGGATCCGGTGCCGGGGTCCAGGTCATCGAACACGCGGCGGGCACCCGATGAGCAGC
+CGACCCGCGGCGCGGCGGACCTGGTTGCCTACCGGCTGGGATTCCGAGATGTCCGACGAGTACGAGTGGG
+CGCCATTGCGCCTACCGCCAGAAGTGACCAGGGTCAGCGCGTCCACCCGGCTGTCCATCGAGGCCGAATA
+CCGCGGCTGGGAGCTAGCACGGGTACGCCTCTATACCGACGGCAGCAGGCGGGTATTGTTGCGCCGCAAG
+AAATCTCGCTGGGCAGACGCAGAGGCGAACCGCCGGCCAGACCAGCCGCAGCTGTGGCTCTGAAGGCCGG
+GGCCAGCCCGCGCGCAGACCGCTATCGGATGTATCCCCTGGTGCGTCGGCTGTTGTTCCTGATCCCACCC
+GAGCACGCGCACAAGTTGGTTTTCGCCGTGCTGCGCGGCGTGGCCGCCGTGGCGCCAGTGCGCCGGCTCT
+TGCGCCGACTGCTGGGCCCGACGGATCCGGTGCTGGCCAGCACGGTGTTCGGGGTGCGCTTCCCGGCACC
+GCTCGGGCTGGCCGCGGGGTTCGACAAGGACGGCACCGCACTATCCAGTTGGGGTGCGATGGGGTTCGGC
+TACGCCGAGATCGGCACCGTCACCGCTCATCCGCAGCCCGGCAACCCGGCCCCCCGCCTGTTCCGGCTGG
+CCGACGACCGCGCCCTGCTGAACCGGATGGGGTTCAACAATCACGGTGCCCGGGCACTGGCGATCCGACT
+CGCGCGGCACCGACCCGAGATCCCGATCGGGGTGAATATCGGCAAGACCAAGAAAACGCCGGCCGGCGAC
+GCGGTCAACGACTACCGGGCCAGCGCCCGGATGGTCGGCCCGCTGGCGTCGTATCTGGTGGTCAACGTCA
+GCTCTCCGAACACACCGGGGTTACGCGATCTGCAGGCGGTCGAATCGCTGCGGCCCATCCTGTCTGCCGT
+CCGCGCCGAGACTTCGACGCCGGTGCTGGTGAAGATCGCGCCGGACTTGTCCGATTCCGACCTCGACGAC
+ATCGCGGACCTGGCCGTCGAGCTAGACCTGGCCGGCATCGTGGCAACCAACACCACGGTGTCACGCGACG
+GCCTGACCACACCGGGGGTCGACCGGTTGGGTCCCGGCGGCATCTCGGGGCCACCGCTGGCTCAGCGCGC
+GGTCCAGGTGCTGCGTCGGCTCTATGACCGGGTCGGTGATCGATTGGCGCTGATCAGCGTGGGCGGGATC
+GAGACGGCCGACGACGCGTGGGAGCGCATCACAGCGGGCGCATCGCTGCTACAGGGCTATACCGGCTTCA
+TCTACGGCGGGGAACGGTGGGCCAAGGACATCCATGAAGGCATTGCCCGCAGGCTGCATGACGGCGGGTT
+CGGCTCGCTGCACGAAGCGGTCGGCTCGGCAAGACGTCGGCAACCCAGCTAAAGCGCTAACGCTGCTCGT
+AGGTGCCGAAGATGACCGCTCGTGCAATCGCGTGCTGGAACAGGTTGAATCCCAGATATGCAGGACTCGC
+GTCCTCGGGGAGGTCGAGCTTTTCGACCTTCACCGCGTGTACCGCGACGTAGTAGCGATGCACCCCATGA
+CCGGGAGGCGGCGCCGCACCCACATACCGGCGCATACCGGCGTCGTTGACCAATGTCAGTGCCCCGCCCG
+GCAGTTCGCGGCCATCGCCGACACCCTCGGGCAACTCGGTGACGTTGGCAGGCAGGTTGGCCACCGCCCA
+GTGCCAGAACCCGGACAGGGTGGGGGCATCAGGGTCGTAGACGGTTACCGCGAAGCTGCGGGTCTCGCTG
+GGAAATCCCGACCACCTCAGCTGCGGACTGGCATCCGCCCCGCCCGCACCCATGATCCCGCTGACCTGGG
+GTGTAGCCAGCGGCTGCCCATCGGTGATCGAGGTTGACGTCAGGCTGAAGGACGGCAGCTTGGGCAGCGC
+GGCATACGGGTCGGGTGAAGTTGTCATGGTCAGTCCTCTCGTGTGATCGACGTTGCGACTAGCCTCGTTT
+TCGACTAGCAGTGTGTCAGCAAGTGCGTTAGCACCTCGGTGCCGAACCGCAACCCATCGATGGGTACCCG
+CTCGTCGACGCCGTGGAACAACGAGGTGAAATCCAAGTCCGGCGGCAAGCGCAGCGGGCTGAAGCCAAAG
+CACCGAATACCCAAGCGCGCGAACGCCTTCGCGTCCGTTCCACCGGACAGCATGTACGGCACCGTGCGAC
+CGTCTGGGTCGACCGCCAACACCGCGGCGTTCATGGCGGCGACCAGATCACCGTCGAAGGTGGTCTCATA
+TGATGGCAGATCGCTGACCCACTCCCGGGTCACGTCGGGTCCGATCAGCGCGTCGACTTCGGCCTCGAAC
+GCCGCCCGGCGACCCGGAAGCACGCGGCAGTCCACAACTGCCTCCGCGGTCGCCGGGACGACGTTGGCCT
+TGTATCCGGCCTTGAGCATCGTAGGGTTCGCGGTGTCATGTAGCACTGCCTTCAACATGCGGGCCATCGG
+GCCAAGCTTGTCGATCGTCCCGGCCAGGTCCGGCGAGTCAAGGTCGAAGGCCAGTCCGGTCTCCTCTCCG
+ACTACGGCCAAGAACTGGGCGACGGTGTCAGTGCAGACCAGCGGAAACTGGTGGCGCCCTAGGCGAGCGA
+CCGCCTCACAAACGGCGGTGACCGCGTTCTGGTCGTGCACCATCGAGCCGTGCCCAGCCCGGCCGCGTGC
+CGTCAGCCGCATCCACTGGATGCCCTTCTCGGCGGTTTCAATCAGGTACAGGCGACGTTCGCCACCATCG
+TGCCGGGGCACGGTTAGCGAGAAACCGCCGACTTCACCGATTGCCTCGGTGATGCCGTCGAACAGATCGG
+GCCTATTGTCGACCAGCCAGTGCGACCCGTACTTGCCGCCGTGCTCCTCGTCGGCAACGAACGCGAACAC
+CAGATCCCGTGGCGGCACGATAGCGGCCTGACGAAGGTGGCGGGCAACCACAATCATCATGCCCACCATG
+TCCTTCATGTCGACCGCGCCACGACCCCAGACGTAGCCGTCTTCGATGGCGCCGGAAAACGGGTGCACAC
+TCCATTCGGCCGGTTCAGCCGGCACCACATCGAGATGCCCGTGGATCAGCAGCGCGCCGCGAGAACTATC
+GGCGCCCGCCAGCCGGGCGAACACGTTGCCGCGGCCGGGCGCACCGGATTCAACGTATTCAGGTTGGTAG
+CCGACTTCGGCGAGCTGCTCGGCGACCCAGCGTGCGCACTCGGCCTCACCCTTGGTGGTCCCGGGTTCGC
+CACTGTTGGTGGTATCGAACCGGATTAGCCTGCTGACGACCTGGGCGACATCATCGCTGTGGTCGCTTGA
+AGCCCCGGTCTCATCTGTCACAGTCACCTTTCCTACCACTCGTAACCCTGGCGAGCCGATCGCCCCTGGC
+GCGCCGGGCCCGCGTCGTCGCCGAGCTGGATTTGCTTACGTGGGCTGATTGCCTGGCTCCTCCTCACCCC
+GTTACCCGGGGCGCATCGTCGCCGAGCTCGATTTGATTGCCCGGCTCCTCCTCACCCCGTTACCCGGGGC
+GCATCGTCGCCGAGCTCGATTTGATTGCCCGGCTCCTCCTCACCCCGTTACCCGGGGCGCATCGTCGCCG
+AGCTCGATTTGATTGCCCGGCTCCTCCTCACCCCGTTACCCGGGGCGCATCGTCGCCGAGCTAGGTTGGG
+CCGGTGCGGGGCAATCCGATAGCCTTAGCTGCCAGCCCCGGTGGTTGGTTGGTCCGAGTGGCGGAATGGC
+AGACGCGCTAGCTTGAGGTGCTAGTGCCCTACTAATGGGCGTGGGGGTTCAAGTCCCCCCTCGGACACAA
+CTTCTTAGCTCTATAGATCAAAACCAAGCCTTGACCTCGTCAAGGACTAACGTTATGAGTTTGCTCATAC
+CAACGATGGTCATCTCGTTGATGTCCTAATACCTAAGAACTCACCGATCACTCGAAGGTGCGGCCAGAGA
+TCTCAGCCTCGACCGCGTTCGGGTTCTCCATTCCGTGCCGAACAGCCAGTATGTCGATAGCCTCGTCGGT
+CGTCCGATAGGCAACGTAGTACCTGAAGGGCCGGAGGTAGATGTGTCGATAGTGCTTGAATAACGGCGCA
+AACGCGTTCGGAGCCTGCGGAATCCGCTTCGTCACGGCATCGACAAACAAGTTGTAAAGCCGATCGATCT
+GATCTGGCGCCGCGTCCGCGTAGTAGGAAAACGCCTCGAATAGGTCGTCTTCAACCCCGTTATGGACGCG
+CAGCCTGCGCGTCATCCGAGCCGGGCGCGGATCCGCTTGTCGAAGTCATCAATGGTGGACCAATGAGCAT
+CGTCGGTGTCATTGGCCCGCGCTTCGATGAGCGCCTGGTTGGCCTCGCTGATATGCATGCCCTCGGCTAG
+GTTTCCGTTGATGTGCTCGACGAGCTCAATCTGCTCATCACGCGACAGTGCGTCGACGCTCGCCAGCAAT
+GCCCGGTTGACCACCACTCAACGATACCCAAGGCAGCCAACGCCGGCAGCGCAGCATTCGGAGGCCAGGC
+TGAACTTCAAGCTGGCAGGTGTCATCCGCTCAGTTGAAAGACCTCAACCCGGGTCGCAGGTGGCCAAGTC
+CCCCCTCGGACACCACATGTGACGGGTCGAAGACGAGGCACGCCGCGGACGACTTCGAGGGTAAGCAGCC
+GTATCCCGGGGAGGCCTGCCATGACCACTTCTGGGCCTATGGCAGCTAGCAAACGTCATGAATGGAAGCG
+CCACCATATGCCGGCGATCCGACGTTCGAGCGTTTGCGGCGCTCGTTTCAGCCAGCCGATCTACTGCCGG
+AACTGCAAGCGGCAGGAGTGCATTACACAATCGCTGTCGAGGCGGCGGACGATCCGGCCGAGAATGAGTC
+TCTGTTGGCCACTGCGCGCCACCATGATTGGATAGCGCGCGTGATCGGTTGGGTCCCACTCGCCGATCCG
+GATGAGGTTACCGAGAGCTCGACGCACGGGCGGCACCGCCCGGACGCCTCCTGGCGACGAGATCTGCGGT
+GCCCCGGCCTGCTGCCGCCCGGGTGCCACCAGCCAGTCTTGGTCGTAGGCTTGGTAGGTCAGCAGCCGGA
+AATGCGACCGATGAATCCACCAAGTGGTTTTCTCCGGCGGACGCCGACCCGCAGGTTTCGCGACCGCCGC
+GATGCTGGTCGCGTATTGGCCGACGAACTTGCGTCCTATCGCGGCAGGGACCGGTTGCTCGTCCTCGGCC
+TTGCCCGCGGTGGCGTCCCCGTCGGCTGGGAAGTCGCGTCGGCGCTAGGCGCCGAATTGGATGTATTTCT
+GGTTCGCAAGCTCGGCGTGCCGCAGTGGCGCGAGCTGGCGATGGGCGCGTTGGCCAGTGGGGGCGGGGTC
+GTGATGAACGACGACGTGGTTTCCAGCTTGCGCATCACCGACCAGCAGGTGCGTGCGGCGATCGACAGCG
+AGACGGCAGAGCTCCAGCGGCGCGAGCTGGCGTATCGCGGCGGACGCCCTGTCGTCGATCCGCGCGCCAG
+GATCGTGATCCTGGTTGACGACGGCATCGCCACCGGCGCGAGCATGCTGGCGGCGGTGCGCACCATCCGT
+GCCACCGGACCGGAGTCGATCGTCGTCGCGGTCCCGGTCGGTCCGGCCACAGCCTGCCGCGAGCTCGCGG
+CGGAAGCCGACGACGTGGTGTGCGCAACCATGCCGGCAGCGTTTGAGGCCGTCGGCCAGGTCTATAACGA
+CTTTCATCAGGTCACCGACGACGAGGTCCGCGAGCTGCTCGCGACGCCAACCACAGGCGCAGCGACCTAA
+CGAGAGGATTCTCGTGAGGTGACTGGGATGGTCAGGATGCGTGGTCGAGGGTCTAGATCCGGAGCTGGGC
+GACAAACCACCCGATAACCTCCCACGACGCCCCTACCGAGGTCGGTGTCGCTGACGACCCTACTTGGCGC
+TGTCGTCGCTTCGGTCCGCCGATACCGCCGACTCCTCGGTCGCTTCGCTGGCCTCCTCCGATGGCTCCTC
+ACTGCCGATGACACCGGCGTCGACGGCTTGGCTCTCCTCGGGGGCTTCCTCCGGGTAGTCGACGTCGGCT
+TCCTCCGCGACACCCGTTTCCCCAGCCCCATCAGCTTCGTCCGCGCCACCTTGCTGGCGTTCTCGCAACG
+CATCGACGATCAGCAACGCCACACCCAGCACGCTGGCCCCGATGCATACCCAGGCCACTAGCTGGTTGCT
+GGTGACCACCGCGAACACCAAGGCCAGGAGCCCAATCAGGGCCAAGACCAGCGCAATGATCAGCATCGGT
+CATCCTCCAACCGGCTAGCAGCGACTGCCCAACCTACCAGGATCTGGCTGCCGACCTCGAAAACTGGCGC
+GTGTCCGGCACGCCTGGTGGCTAGTTTTTGCCCCGGTTGAATTGATCGAAGCCACCGGCATCCGCATTGG
+AATCGACCGGCGCCGCCGATCCACGCTGGCCGAGTTCCTCCAGCTGCGATTCCAGGTAGGTCTTGAGCCT
+GGTGCGGTACTCACGTTCGAAGGTACGCAGCTGCTCGAGGCGGCCTTCAAGCACCGCGCGCTGCTGGTTG
+ATGGTTCCCATGATCTCGGAGTGCTTGCGTTCCGCATCGGCCTGTAAGGCATCGGCCTTCTCCTGCGCCT
+GGCGCAACTGGGCCTCGGATCGGGATTGGGCATCGGCCAGCATGGCATCGGCACGCTGGCGGGCCTCGGC
+GACCGTGGCGTCGGCGGTGTGTCGGGCCTCACCGAGGATCTGCTCCGCATTGGCACGGGCATCGGCCAGC
+ATCTTGTCCGACTCGGCTTTGGCGGTGTTTGTAAGCCGGTCGGCGGTGTCTTGGGCCAGACTCAGCACTC
+GCGCCGCCTTCAGGGCCTGTTCCTCGTTCATCCCCGCCGAGACCGCCGCCGGCGCCGGCTTGCCCGGTTC
+GGGCTCATACGCCGGGATTGCCTGGGTGGCCTGCGGCGTAACGCCGGCACCGCCGCCCGCGGCGAGCTCT
+TGATCCAGCTCGTTGATCCTCTGACGCAGATCGGAGTTCTCTTCGATCAGGCGGGTCAGCTCGTTTTCCA
+CCAGGTCGAGGAAGGCGTCGACCTCATCTTCGTTGTACCCACGTTTGCCGATAGGCGGCTTACTGAACGC
+CACATTGTGGACGTCGGCAGGTGTAAGCGGCATTGTTTGTCCCCTCGAGTTCCTGGACGGTCAAACGATC
+TGGAAGTGTAGAACGGAGTGGTAGCCGTGGTGCAACTACCGTCCATCCTGTCACACCAGACTCGGCGGTT
+GCCGATTGGACTAAGTAAATAAGGACCAATTTCAAACTCTAAGACCAAATAAATCACAATCCTTAGATTT
+GAAATCGTGCGCGCCAAACTTGTCCCCAAATCGTGGCCGAACCGTCTCTCAATCCTCGTCATGCACCCGG
+CCGTGTGACCGCGCCGCGGCTCAGGCCGCAGCACCAAACGCCAGTTGCATACCGATGAACGCAACCAGCA
+GCAGCACCATGATCGACAGGTCGAACCGGACCGCGCCGATCGTGAGTTGCGGGATCAGCCGGCGCAGCAC
+CTTCACCGGCGGATCAGTGATCGACATGATGATCTCCAAGATCACCACGGTGACACCGGTGGGACGCCAG
+TCACGGCTGAACGAGCGGATGAACTCAACGACGACCCGAGCGATCAGCAGCAGCCAGAAGATGAACAGCG
+CGAACCCAAGGATCTGAAAAAACACCACCAACGAGAGCCCCGACCTTACTGAGGAGGATGAAGAAATGTT
+GCGTCGCCACCGATGCGGGCGGCAACGCCAGCCTACCGACTCGGGTGGCGTGCCCACATCTCATGGCGGG
+CCACGCCCCGCCCAGCGTGGATGCCCAATGGGTCTACAGGCGACCGTCGCGTCTATTGGTAGGCGTAGAA
+CCCGGTTTCGGCGATCCTGCGGCGCTCCTCGGGGGACACATCGACGTCTGCAGGCGAGAGCAGGAACACC
+TTGGTCGCGACCTTGTCGAACGAGCCGCGCAGCGCGAAGGCCAGGCCGGCCGCGAAATCGACCAGCCGCT
+TGGCATCGGCGTTGTCCATCGACACCAGATCCATGATGACCGGGCTGCCGTCGCGGAACCGCTCACCGAT
+GGTGCGAGCCTCGCTGTAGTCCTTGGGCCGCAGCGTGGTGATCTTCGAGAGCGGATGGCCATCCTCGAAC
+ATCATCGCCATCCGGCGGGGGTCCATCGCTAGCGCGCCGCGGGTGGAGTTGCGCAGCCACGATCCGAAGC
+GCGGCCGTGTCATCTCCGCGCGGTCGAACTCCCGGGGCCGGAAACGTGGTTCGTCCGCGTACCCGCCGCG
+ATATCCCGGTGGTGGATAGTCGGCCGGCTCACCGCGCAGGTCACCGCGTGAATCGCTGCGCGCGTCGTCG
+TAGTCGCGCCCATCGTAGCGGCCGTAGTCGTCGTCGAATCGGGGCCGCGCATACCCGCGCGAGGGAGCGC
+GGTCGTCGTAGTACTCGTCGTCGTAATCCTCCATGGGAGCCATACCGAAGTAGGCCTTGACCTTGTGCAG
+TGTGCTCATTGCGTGACCCCTTCTAGCCCTGGGAGATCTGTTGTCTGTGATGAAGGTGTGACTACAGTGA
+CTATTCACGGTGACCGTAACCGCCGCGGACCCAATAGCGCGGTACCGACACGCACACAGGTCGAACCATG
+TTTGACGGCGACTTCAAGGTCGTTGGACATGCCCGCCGACAGACCGATCGCGTGCGGGAACATCGCACGC
+ACCCGGTTGTGCTCCGATTGCAGCCGGTCAAAGGCCTCGTCCGGGTCCCAATCCAGCGGCGGAATGCCCA
+TCAACCCGACCAGTTCGAGGCCCTCTGACTCCTGCACCTGCGCGCAAATCCGGTCTACGGCGCCGGGCGT
+CGTGCTGTCGACGCCGCCCCGGGATCCGTCACCGTCGAGGCTGACCTGGACGTAAACCCGCAGCCGCTCG
+CCACGACGGTGTTCGGCCAGCGCCGCAACAACCGCCCGATCCAGCGCGGTCACCAACCGCGAGCTGTCCA
+CCGAGTGAGCGGTGTGCGCCCAGCGAGCCAGCGACCCGGCTTTGTTGCGTTGAATCCGGCCCACCATGTG
+CCAGTGCACACCCCCCGAGTGACCCAACTCGGCAGCCGCCAACAACCGATTAAGTTCGGCCATCTTGGCT
+GAAGCTTCCTGTTCGCGCGATTCGCCAACGGACCGACAACCCAATCGAAACAAAATCGCAACATCGGTTG
+CTGGAAAGAATTTGGTAATCGGTAGAAGTTCAATTTCGCCGACATTGCGACCCGCCGCCTCCGCGGCCGC
+CGCAAGTCGCGATCGCATTGCCGCCAACGCATGCGTCAATTCCGATTCGCGGTCTGGATACGCCGAAAGA
+TCCGCCGCCATCGCGGTCATTCCATCCACACCAACGACGCGAACCGTCCGGTGGGCGCATCGCGGCGGTG
+GCTGAACAACGTCGGATCGGCCACCGTGCAGCGGGGATCGACGTCGATAGACTCAACACCCAAATCGCGG
+AGCTGGCAAGCGATTCCGGCGCGCAGGTCGACTCCGGGAGTGCCGGCAGCGGTGGTGGTGCGGCTGCCCG
+GCAACGCCGCCTCGACCTCATCGGCCATCGCTGCGGGCACTTCGTAGTTGCGACCACTGACCGCGGGACC
+CAACAGTGCCGAGATGTCGCGGACCTGGGCACCCAGGCTCAACATCACCTCCAGCGCGCGAACCACCACA
+CCGCGCTGCGCGCCTGCCCGACCGGCATGAACCGCGGCGGCGATACCGGCCCGTGCGTCGGCCATCAGCA
+CCGGCACGCAGTCGGCGGTCACAACCGCCAGCGCCAATCGGGGTGTAGCGGTCACCAATCCGTCGGTGTC
+ATCGAGTGCCGTATTGCGCGGCTGGTCGACCAGCTCGACCCGATCCCCGTGCACCTGGTTCATCCACACC
+ACTCGGTTGCCGGGCAGTCCGATGGCTGCGGCCAGCCGAGCGCGGTTTGCCGCCACCGCGGCCGGGTCGT
+CACCAACGTGGTCGCCGAGGTTGAAGGTGTCGAACGGTGGGGCCGACACACCACCTGCCCGGGTGGTGGT
+GACCCGACGGATGCGAACACTCACGTTCCCAGTATCGCCGCGGGCGATGTGCCGCGTACTGGCGAGCAAG
+CCGATGCTCTCAGCGGCGCATGAAGGGCGGCACGTCGACATCGTCGTCATCACCGCCGATGCTCAGGGTT
+GCGCCGTTGGTGTGCAACGGCACGCTGACGGCGTCGACCGGCTCGAACAAGGTCGAGGTGAGCTTGCCTG
+CCTTGGCTGACTCGATCCGGTGGGCGCCGCCGGTCTCGCCCATCACCGGCTTGCGGCCGGGACCGCTGAC
+GTCGAAGCCGGCCGCGATCACGGTCACCCGCACCTCGTCACCGAGCGAATCGTCGATGACGGTGCCGAAG
+ATGATGTTGGCATCGGGGTGAGCGGCGTCTTGTACCAACGAGGCCGCCTCGTTGATCTCGAACAAGCCCA
+AGTCGCTGCCGCCGGCGATCGACATCAGCACGCCTTGCGCGCCCTCCATCGAGGCTTCCAGCAACGGCGA
+GTTGATGGCGATCTCGGCCGCTTTGAGCGACCGGCCTTCGCCCCGGGCCGAGCCGATGCCCATCAGTGCG
+GTGCCGGCACCGGACATGATGCCCTTGACGTCGGCGAAGTCGACGTTGATTAGACCCGGGGTGGTAATCA
+GGTCGGTGATGCCCTGCACGCCGTTGAGCAGCACCTCGTCGGCGCTACGGAAAGCATCCATCAGCGATAC
+CGCGGCATCTCCCATCTGCAGCAACCGGTCGTTGGGAATCACGATGAGGGTGTCGCAACTCTCCCGCAGC
+GCCGCGATGCCATTTTCGGCCTGATTGCTGCGTCGCTTGCCCTCGAACGAGAACGGCCGGGTGACCACAC
+CGACGGTCAACGCGCCCAGCTTGCGGGCGATGCTGGCGACGACGGGTGCCCCCCCGGTGCCGGTTCCGCC
+CCCCTCGCCGGCGGTGACAAACACCATGTCGGCACCGCGCAGCAGCTCTTCGATCTCGTCCTTGGCGTCC
+TCGGCGGCCTTACGGCCGACCTCCGGATCGGCGCCGGCGCCCAGCCCGCGGGTGGAGTCGCGGCCGACGT
+CGAGTTTGACGTCGGCATCGCTCATCAACAACGCCTGGGCGTCGGTGTTGATCGCGATGAATTCCACGCC
+TTTGAGGCCCTGCTCGATCATTCGGTTGACGGCGTTGACACCGCCACCACCGATACCCACGACCTTGATG
+ACGGCCAGGTAGTTGTGCGGGGGGGTCATCGTTCGGCTTCCTCCCTGGTGGGGCTCGGTTCTTCGGTGTG
+TCTGCTGGCAAACTCTCAACCTCAACCATAGGCTTAGAGTTATGTCAAGTAGTTGCTCGTAGTCAGAACC
+GTATGGCTACGACGGTTGCTAACCGTGCAGGCGCGCCGATACGCGGCGGGCATTTTTTCGGCTATTTCAC
+GGTCGGCAGGTCGGGGCTGGACACGTCGTACGTTCTGCCTGGCTGGGTCAACAGCGCCGCCAGCTTTTCG
+GCCTTCTCTTCGCAGCGGTCGGTGGTTCCCCAGATCACCACGCGGCCATCGGCCAACGTCAGGGTGATCG
+AGGCCACCGACGGGGCCGCGATCCGCCCCACCTGGCTTGCAACTTCAGGATGCAGCGCGGTCAACACCTG
+CAGCGCCGCCTTGGTCGTCGGATCGCTAGGACCGGGATTGTCCACATCGAAATAAGGCAACGCCGGCGGT
+GGCGGATCGGTCGCGAAGTCGACGCCGTCGCGGTCAAAAAGGTGCGGGCCGTCCGAAAAATCCTTGACCA
+CCACCGGGACCCGCTCGACGATGGTGATCCGCAAGGCCGACGGGTACTGCCGCTGCACCCGCGCACTGGC
+CACCCGCCGGATCGTGGCCACTCGGTCAGCAACCTGTTGGGTGTCGATCTGCAGCAACGGCGTTGCCGGC
+CGCACTCTGGCGGCGTCGAGAACCTCCTCGCGGCTCACCGCCCCGATCCCGATGATCACGATCTCGCGGG
+CCGACATCGCCGGCGTGAAGTACAGCGCGAGCCCAAGCCCGATCCCGACGACGGCCAGCACGACCGTCGC
+GAGCAGCGCCTTCAGCCCTCGAACAACACCTCGGGCGGCCGGTTTGGCGGGGTTCTGCTCACTGACGATC
+TGCCCGCGGGCTCGCCGTTTGGCCGCGCGGCGAGCCTGCTCGATCGCGGTAGCTCGAGCCTGCGCGGCGC
+GACGTTCGGCACGTTCGCGGCGGGCGCGCCGACGCGGCCCTTCGAATTCTGGGTGCTCGGCCGGTTCGTC
+CTTCGATTCGGTGGCCAACGGCTCCGTAACCGCCTCCTCGTCGGCGGCGTCGTCGGCCACGCGCTCGATC
+TGTGGGTCCTCGTTGTGTTCCGTCATCCCAGCACCCCCGGACGGCCGGGGGCGCTTCGGTTGGCCCGGAC
+CCGAAGGGCGGTCAGGATTTCCGGGCCCAGCAAGGTCACGTCTCCGGCACCCATCGTGACGATGACGTCG
+CCCGGACTAGCGGCGGCGGCCACTTGCTGTGCGACCGCCGAAAAATCCGGGACGTAGCGCATCGGCACAG
+TGACGTGCTCAGCGACGCTGGCTCCGCTGACACCGGCCAGCGGTTGTTCACGAGCTCCGTAGACGTCGAG
+TACGAACACCTCGTCAGCGGCATTCAGCGCACGCCCAAACTCAGCAGCGAATGCCTTTGTCCGCGAATAC
+AAATGGGGTTGAAACACAACCATGCAGCGGCCACCGTCGCCCTGTTCGAGCACCATGCGCGCCGCCGCCA
+GTGTCGCGCTGATCTCCGTCGGGTGGTGGGCGTAGTCATCGAACACGCGCACCGACGCCTTTCCGACGCC
+GCAGGTCCCAACCAGTTCGAATCGTCGCCGCACTCCTTCGAAGCCGGCCAGCCCGTCGAGCACCTCGTCG
+GCCGGGGCGCCGATCTGCACCGCGGCCAGCAGCGCTCCCAGCGCGTTGAGCGCCATGTGTCGCCCGGGCA
+CCGACAGCCGCATCACGCGGGGACCCTGTGCTGTGGCTAGTTCTGAGGCCAACCGGATATGTGCGACCGC
+GCCGACCCCCTGTTGCTGCCACGAGACCAACGTGGCTGCCATGGTCTCACCCGGCACCGACCCGTATCGC
+AGCACTCGAATTCCCAGCTCAGTCGCGCGCTGAGCCAGCGCGGCCCCTCCGGGGTCGTCAGTGCACACCA
+CCAGCGCACCCCCGGGGACAATGCGCTCCACGAAGGAGTCGAACACCGCAACATACGCCTCGACGCTGCC
+GTAGAAGTCCAGGTGATCGGACTCGATGTTGGTGATCACCGCGACGTGGGGTGTGTACTGCAACAGCGAG
+CCATCGCTTTCGTCGGCTTCGGCGACGAAACAGTCGCCACTGCCGTGATGGGCGTTGGTACCGGCCTCCC
+CCAGCTCACCGCCGACCGCAAAGGACGGGTCAAGCCCGCAGTGCTGCAGGGCGACGATCAGCATGGACGT
+CGTCGTTGTCTTGCCGTGCGTGCCGGTGACCATCAATGTGGTGCGCCCGGCCATCAACTTGGCCAGCACG
+GCCGGCCGCAGCACCACGGGAATGCCGCGGCGCCTCGCTTCGACGAGCTCGGGGTTGGTTTTGGGGATGG
+CGGCATGGGTAGTGACGACCGCCGTGGCGCCACCGGGCAACAGGTCCAGCGACGACGCGTCGTGTCCGAT
+CCGGATCAACGCGCCCCGCGCCCGCAGCGCATGCACACCGCGCGACTCCTTGGCGTCTGACCCGGAGACC
+AGCCCGCCGCGGTCCAGCAGGATTCGGGCGATGCCCGACATGCCAGCTCCGCCGATGCCGACCATGTGCA
+CCCGCCGCAGATCGGGCGGCAACTGCTCGGTGCTCACGTCGTTGTCCTGGCACCGGCCCCGGTGGCGACG
+GCCAGCGCGGCCCGGGCCACCTGGCCCGCGGCATCGCGATGTCCCACCCTGGCTGCGGCCGCGGTCATCG
+CGGCCAGCCGCGCGGGGTCGGTGAGCAGCCCGGCAACCTGGCGGGCCACCAACTCGGGGGTCAGGGCGGC
+GTCGGCGACCACCATGCCGCCGCCGGCATTGACTACCGGCAACGCATTCAGCCGCTGTTCACCGTTGCCG
+ATCGGCAGCGGCACGTAGATGGCCGGCAGACCGACGGCGGATACTTCGGCGACCGTCATCGCCCCGGCCC
+GGCAGATCACCAGATCGGCGGCGGCGTAGGCCAGCTCCATCCGGTCCAAATAGGGCACCGCCACGTACGG
+TGGGTCACCTTGAGCCCGACGGCGCAACTCCAGCACGTTCTGGGGTCCATGGGCATGCAGCACGCAAACA
+CCGGCGGCGGCCAGGTCGGCGGCGGCGCCGGACACCGCCCGGTTGAGCGAGACCGCGCCCTGCGAACCCC
+CGAACACCAGCAGCACCCGCGCGTCGTCGGGGAAGCCGAAGTGTGCCCGCGCCTCGGCTCGCAGCACCGC
+GCGGTCCAGCGCGGCGATCGACGCACGGACCGGGACCCCAACCACCTCGGCGCGCCGCAGCCCGGAATCC
+GGCACCGCGGAGAGCACCCGGTCCGCGGTATGGGCGCCGACCCGGTTGGCCAGTCCCGCCCTGGCGTTGG
+CTTCGTGGATCACCACCGGGATCCGGCGCCGGCGCCGGGGCGGCAAAGGCAGGCCGCGAGCGGCTAGGTA
+AGCCGGTAGCGCGACGTACCCACCGAAACCGACGACGACGTCGGCGTCGACATCGTCGAGCACGTCCCGG
+GCCTCCCGGACGGCGCGCCACACCCGCGACGGCAGCCGGGCCAGGTCGCCGCCGGGCTTGCGCGGCATCG
+GCACCGCCGTGATCAGCTCCAGGTGGTAGCCGCGCTGGGGCACCAGCCTGGTCTCTAGTCCACGGGGGGT
+GCCCAACGCGGTAATCCGGACGCGCGGATCCAACGCGACCAAGGCGTCGGCGACGGCCATGGCGGGCTCG
+ACGTGCCCGGCGGTCCCGCCGCCGGCGAGAACGACCGACAAGGAATCAGCAGACGGCGAGGAACCACAAG
+ACGGCGAGGCGGCATCGGCGGGCCGGGGCGCCGTTGCCCCGCGCCCGCCGGCCGGCTGGCTGACCGTGTC
+CTTCACCCGTAACGCTGACCTTCCAATGCCCGAACGCGCCGTGTGCGACGCTGGCCCGCGTACCGCTGGC
+CAGCTCCATGATGCACTGATCGACGAACCGGCGGATCGGCCGTGCGGGGCGAGCCGGGTCGCGGGGGCAG
+GCCCATCTGCCGGGCAGGCTGTCCGGGCGCCGTGCGGGGGGTCTTCCGCGCGGGCTGCGTTTGGGCCGGT
+TGCGGGTTGGCGCGCTTGCGGTCACGAAACGCCTCGAGACGAGGGGGCAGATACGGCTCGGGCAGCGGCA
+GCCGCAGCAACCGGTTCACCTTGTCGTCGCGCCCAGCCCGCAGCGCGGCCACCGCCTCCGGTTCGTGGCG
+AGCCGCGTTGGCGATGATGCCTATCAGCGAAAGTGTTGCGGCCGTGGAGGTTCCACCGGCGGAGATGAGC
+GGCAGCTGCAGGCCGGTGACGGGCAGCAGCCCGATCACATAGCCGATGTTGATGAACGCCTGTCCCAGCA
+CCCACAGTGTCGTGGTGGCGGTCAGCAGCCGCAGGAACGGGTCGGCGGACCGGCTAGCGATGCGCATGCC
+GGTGTAGGCGAACAATCCGAATAGCCCCAGCAGTCCGAGCGCGCCGACGAGACCCAGCTCTTCGCCGATG
+ATGGCGAAAATGAAGTCGTTGTGGGCGTTGGGCAAGTAGTTCCACTTGGCCACGCCTTGGCCCAGACCGT
+CGCCGAAAATGCCACCTTGAGCCAGCGCGAACTTTGCCTGTCGGGCCTGGTAGCCGGAGTCTTGCGGATC
+GTTTTCGGGGTTGAGCCACGACCGCACCCGGTCGGATCGGTAGCCCGCGGACACCGCCAGGATGGCGGCC
+GAGACGACGACCGCCGCCAGTGAGCTGAGGAAGACGCGCAGCGGCAGCCCCGCATACCACAGCAGGCCCA
+ACAAGATGATGCCCATCGACACGGTCTGTCCGAGGTCGGGCTGGGCCACGATCAGCGCCAGCGCAACGAC
+GGCGGCCGGCACCAGTGGAATCAGCATCTCGCGCAGTGAAGCCCGTTCCATGCGCCGGGCGGCCAGCAGA
+TGCGCTCCCCAGATGGCGAACGCCATCTTAGCCAGCTCAGAGGGCTGCATCGAGAAGCCCGCGACCACGA
+ACCAGCCGCGCGAGCCGTTGGCCTCCTTGCCGATCCCCGGCACCAGCACCAGCACCAGCATCACGATGGT
+GATCGCGAAACCGGAGAAGGCGATGCGCCGCATGAACCGCACCGACATCCGCAGACAGACATAGCCGCCG
+ATAAGACCCACAAGCGTCCACAAGACCTGCTTGCCGAAGATCACCCAAGCCGATCCGTCGTCGTCGTAGG
+ACCGCACCGCCGATGCCGACAGCACCATGATCAGTCCAAGGGTGGTCAGCAATGCGGCAACGGCGATGAT
+GAGGTGAAACGAGGTCATCGGACGGCCCAGCCAGGCACCGAAACGGGTGCGGGGCCTCGCCGAACCCGGG
+TTAGAGGCTTCTTCCGGGCCCGTCCGCTGCCCCTCGACCGGCTCGGCCCCTCGAGTCTGGGAGCCGTCGG
+TGTCGCTGGTGCCCCGACGCAGCAACCGGGTTAGCACGCTGCCCCCGCCTACCGGATCACCGCGCGGACC
+GCGGTCGCGAATGCCTCGCCCCGGTCGGCATAACCGGTGAACTGGTCGAATGAGGCGCCGGCCGGTGCCA
+GCAGCACGGTGTCACCGGGTTGGGCCATCCGCCGGGCCGCGGCCACCGCAGCGGTCATCACGGCAGCGCC
+AACGGTCTCACCGGCTTTGTCATCTTTTGCCACATCTAGAACACAAGCAACAGGAACCTCAACAGTCGCA
+GGCATACCAGTATCCTCGCCTGCCACAACCTGAACGACTGGGACATCGGGCGCGTGTCGTGATAACGCCT
+CGGCAACCGCTGCGCGATCCCGGCCGATCAGCACCGCACCGACCAGCCGCGACGCCATCGCCGCAACCTC
+GGCGTGAAGCGACGCGCCCTTGAGCAGGCCACCGGCGATCCATACAACCCTCGGGTATGCAAGCACCGAA
+GCCCGCGCGGCGTGCGGGTTGGTGGCCTTGGAGTCGTCCACGTAGGTGATGCCGTCGGCAACGGCCACCA
+CCTCGGCGCGGTGTCGGCCCACTCGAAACGACGTGACCGCGTCGGCGATCGCACCGGCGGGCACCCCGAC
+CGAGCGGGCCAGCGCCGCCGCGGCCAGGGCGTCAAGCACGCCGACCGGACCTGGCACCGGTATCGACGCG
+ACCGGCAGCAGCGTCAAGTCGTCGGAGAAGGCGCGATCGACCAGGTGGGCGTCGCGCACGCCCAGTTCCC
+CCGCGGCCGGCTCGCCGAGCCGGAAGCCGACCCGCACCTGCGCCGGTGAGCCGTCCAGCAGTGCGGCCGC
+TCGGCTGTCATCCAGCCCGGCCACCGCTACCCCGCCGGTCAGCACCCGGGCCTTGGCCGCGGTGTATTCG
+GCCATCGTGGCATGCCAGTCCAGGTGGTCTTCGGCAATGTTGAGCACCGCGCCGGCCTCGGGCCGCAGCG
+ACGGCGCCCAGTGCAGCTGGAAACTGGACAACTCCACGGCCAGCAGCTCGGCCGGCTCGTCCAGCACATC
+CAGCACCGCACTGCCGATATTGCCGCACAGCACGGCGCGGCGGCCACCGGCGATCAGCATGGCGTGCAGC
+ATCGACGTCGTGGTGGTCTTGCCGTTGGTGCCGGTCACCACCAGCCAGCTGCGCGGCGGTCCGTAGCAGC
+CCGCTGCGTCTAGCCGCCAGGCTAACTCCACGTCACCCCAGATCGGCACCCCCGCCGCCGCGGCCGCGGC
+CAGTAGCGGGGTTGCGGGCGAGAAGCCGGGACTGGCGACCACCAGCGCATACCCGGTTATCTGCTGCACC
+GCGTCCGAGGAACTAACGGTCGGCAGCCCACGTTCGGCGTGCGGTCGCAGCATGACCGGATCGTCGTCGC
+ACACCGTCGGCGTCGCACCAAACCGAGTCAGCACCGCGGCCACCGCCTGACCGGTCACCCGGCCACCGGC
+TACCAACACGGGCGCACCCGGCCCCAGAGGGTCAAGCACGTCAGGCACCGACCGCGGCAAGCCACTCACC
+GTAGAACAAGGCCACGCCCAGACCGCAGGTGATCGCGGTGAGCAGCCAGAACCGGATGATGACCGTGGTT
+TCAGCCCAACCGACCAACTCGAAATGGTGGTGGAAGGGCGCCATCCGAAACATCCGGCGCCCGGTGGTCC
+GGAAGGTCAGGATTTGCAACACCACCGAGGTGATCTCGGCGACGAACAGCGCACCCAGCACCACCGCAAG
+GATCTCGGTGCGGCTGGTCACCGACAACCCCGCGATGACGCCGCCCAACGCCAGCGACCCAGTGTCACCC
+ATGAAGATCTTGGCGGGCGCGGCGTTCCACCACAAAAAACCGATGCAGGCGCCAGCGGTTGCGGCCGCGA
+TGAGCGCCAGGTCCAGCGGGTCGCGCACGTTGTAGCAGCCCAGGCCCGGCGCCGTCACGCACGCGTTGCG
+GTACTGCCAGAAGGTGATCAGCACGTAGGCGGCGGTGACCATCGCCATGGTGCCGGCGGCCAGCCCGTCC
+AGGCCATCGGTGAAGTTGACCGCGTTCGACCAGGCGCTGACGATGACCACGCAGAACAACACGAACAGCA
+CCGGCGCCAATGTGACGGTGGCGATCTCACGCACGTAGGACAGATCCGCGCTGCCCGGTGTCAGGCCGGC
+AGCATTCCGGAACTGCAGCACCAGCACGCCAAACAGCACGGCGGAGGTGATCTGCCCGACGGTCTTGGCC
+GTCTTGTTCAACCCGAGATTGCGCGACCTGCGGATCTTGATCAGATCGTCGATGAACCCGACGCCGCCCA
+AAGCGGTGGCTAGGCCCAGCACCAACAGACCCGATGCGCCGATGCCTTCACCGTCAAACGCCAGGCCCGC
+TAGGTGGGCGCCCAGGTAGCCCGCCCAGATGCCGGCCAGAATCGCCACCCCGCCCATCGACGGCGTACCG
+CGCTTGGTGTGGTGGCTGGGCGGGCCATCCTCACGGATCTGGTGGCCGAAGCCCTGCTTAGTGAACAACC
+GGATCAGCACCGGGGTCAGCAAGATGGACACCGTCACCGCTACGGCAACGGCGATAAGGATCTGCCTCAT
+GGGCGCACACTCCCGCATGTGTCGTCTGCGACCAATGCATCGGCCACCGCACCCAGCCCGGCCGCGTTCG
+AGGCCTTGACCAAGACCACATCCCCGGGTCGCAGCTCGGCGCGCAGTAGTGCCAGGGCGGCGTCACCGTC
+GGCCACATTGACGGCCGTGCGATCCGCACCGTGATCAGCAGTGGCTTCCCCCGAGCCCCACGCCCCCTCC
+AGGACCGCTCCGTGGTGCATGGCGCTGATCGACCTCCCGGTTCCCACGACAACGAGTCGAGACACATCTA
+AGCGCACCGCGAGCCGGCCGATGCGATCGTGCTCGGCTATCGCGTCCTCACCCAGCTCGGCCATCTCACC
+CAGCACCGCCCAGCTGCGGCGGGTGGCCTCGGGTTGGTGCGCGATCCAGGCCAGCGCCTGCAGCCCGGCC
+CGCATGGAGTCGGGGTTGGCGTTGTAGGCGTCGTCGATCACCGTCACCCCGTCGCCGCGGGTGGTCACCT
+GCATCCGATGCCGCGACACCGGCGGCGCCGCGGTCAGCGCGGCCGCGACCTGTTCAACGCTGGCCCCACA
+CTCCAGCGCGACCGCCGCGGCGCACAGCGCGTTAGTGACCTGGTGGTCGCCGCAGACCCCGAGTCGGACC
+TCGGCTTGGGCATCGTGGGCATGCAGCGTAAAGCGCGGCCTGGCCAATTCGTCCAGCGACACCGGCCCCG
+CCCAAACGTCACCGGTGTTGTCCCGGCTGACCCGCACCACCCGGGCCGCGGTCAGCTTGGCCATCGCCGC
+CACCGCGGGGTCATCAGCGTTGAGGACGACCGCTCCGGAATGCGGAACAGCCTGCGGCAGTTCGGCTTTG
+GTCTGTGCGATGACCTCGCGGGAGCCGAACTCACCCAAATGTGCGGTGCCGACGTTGAGCACGACTCCGA
+TCGACGGGGGCGCGATCTCGGCGAGCGCGGCGATGTTGCCGTGATGGCGTGCCGCCATCTCCAAAATCAG
+GTAGTCGGTGCGCCGCGTCGCGCGCAGCACCGTCCACGGGTGACCCAGCTCGTTGTTGAACGATCCGGGC
+GGGGCCACCACCTCCCCCAGCGGGGCCAGCACGGCGGCCATCAGGTCCTTGGTCGACGTCTTGCCCGACG
+AGCCGGTGATCCCGATGATGGTGAGCCCGCCGGCCACCAACTGCGCGGCCACCGCGGTGGCCAGCTTGGC
+CAGCGCGGCCAGCACCGCCGCCCCCGACCCGTCGTTGTCGTGCTCGAGGACGCCGGCCAATACGTTCGGC
+GCGGCCACTGGCGGAACCACGATGGCCGGCACCCCCACCGGGCGGGCGGCCAGCACGACGGCGGCGCCCG
+CGGCTACCGCCGACGCGGCATGGTCGTGGCCGTCGGCGCGCGCCCCCGGCAGGGCGAGGAACAGCCCGCC
+CGGGCCGATGGCGCGCGAGTCGAACTCGACGGTCCCGGTGACGCGGCGGTGCGCGGCGTCTTGCGGGGAG
+ATATCGGCCACTGCGCCCCCGACGATCTCGGCGATCTGCGCGACGGTCAGCTCGATCATGCGCGCCGCTC
+GAGGGCCTCTAGCGCGGCAGCCAGCTCCACCCGGTCGTCGAACGGGCGGACCCGCCCGCCGCCGCGTTGC
+CCGGTCTCGTGGCCTTTGCCGGCGATGAGCACCACGTCGCCGGGGCGCGCCCAGGCGACCGCGTGCCGGA
+TCGCGTCCCGCCGGTCTGCGATCTCGACGACCTGGGCATCACCGCCGACTTCGGCCGCCCCAGCCAGGAT
+TTCGCGGCGGATCGCCGTGGGATCTTCGTCACGCGGGTTGTCGTCGGTGACGACCACCAAGTCGGCCAGC
+TGCGCGGCTATCCGGCCCATCGGGGCCCGCTTGCCCGGGTCACGATCGCCGCCGGCGCCGAACACCACCG
+CCAGCCGGCGGTCCGGGTGCGCCAAGGTGGTCAGCACCGACCGCAGCGCTTCCGGTTTGTGCGCGTAGTC
+GACCAGCGCGAGAAAGCCCTGGCCGCGGTCGATCTGCTCGAGCCGCCCCGGGACCCGGATCTCACGCAGG
+CCCGGCACCGCCTGTTCCGGGGAGACCCCGACGGTGTCCAGAATCGCCAGGGCGACCAGGCAATTGGCGA
+CGTTGTAGCGGCCCGGTAGCCGGATTCCGATGTGATGCCCTACGCCGGCGGGGTCGATGGCGGTGAATTG
+TTGCCCGCCCGCGTCCGTGGGCGCCACATCCGTGGCGCGCCAGTGTGCGGGCCGGTCGGCGGCGCTGACG
+GTGATCGCGTCGGCGGCCCGCGCCGCCATCGCGCGCCCGGCGTCGTCGTCGATGCACACCACGGCGGTGC
+GGGCGCGCAGTGCCGAGTCCGGATCGAACAATGACGCCTTGGCCTCGAAGTAGTCGGCCATGCTGGGGTG
+GAAATCCAGGTGGTCACGGGAGAGATTGGTGAAGGCGCCGACGGCGAACCGGGTGCCGTCCACCCGGCCC
+AGCGCCAGCGCGTGGCTGGACACCTCCATGACCACGGTGTCCACCCCGCGTTCGACCATCGCCGCCAGCA
+TCGCCTGCAGCGTGGGGGCCTCCGGGGTGGTCAGCGCGCTGGGAAGGTCGGCGCCGCCGACGCGGATGCC
+GATGGTGCCGATCAGCCCGGCGACGCGTCCGGCAGCCCGTAACCCGGCCTCGACCAGATAGGTGGTGGTG
+GTCTTGCCGGACGTTCCGGTGATCCCGATAACCGTCAACCGCTCGGACGGATGCCCGTACACGGTGGCGG
+CCAAGCCGCCGAGCACGCCGCGGGGTGCGGGGTGCACCAACACGGGCACGGCCGCTCGTCCGGCGATCTC
+GGCGACCCCGGCGGGGTCGGTGAGCACCGCGACGGCGCCGCGTGCGATCGCGTCGCCGACGTGGCGGGCC
+CCGTGGGTGGTCGAGCCGGTCAGGGCGGCGAACAGGTCACCGGGTGACACGTCCTGGGCGCGCAGCGTGA
+CCCCGGTGACCGTCCGGTCCTCGGTGACGGCACGCTGAGCTGGACCCTCGGCCAGGGCCGCGCCGACCTG
+ATCGGCCAGTGCGGCCAACCGAACGCCCACGACGGCGTTGGGGCGCAAGCCAGTGGGCGCAGCCTCCACC
+TGTGTCGCCACCTCCGTTCGCCGCCGCGAGATCCCTCGGGCCAGCGATGACACCCTACCGACAGGGCGCG
+CACACTCACCCAGTCGGGTTTTGCCGCGACACCTGGCCCTCGGCGGCGGCGCCGATCCAGGTGCCGATGC
+GCCGCGCGGCGGTGAAGGCGGCCCAGGCCAGGGCGCCAACCAGCGCCGCATCGGTGTCGAGCAGGGATCG
+GGCCGCGGCGACGTCGTCGTCGGTCACCTGATGCGGGGCCAGGCCGGTCAGCAGGGCAAGACGGGTGGGC
+GCGTGCAGGTCGGCGGGCAGCTCGGCGGTGTGCTCGTTCGTCCAGCGACTGCTCATCGGCATTGGCTCGC
+CGTGCCACGACCCCACGACCCGCCTGACCACCTGACGAGTCGGTGGCGGCAGGTGCGGCGCGGTGTCCAG
+GTGGTGGCTGAGCGCGGCGAACGCGGTTGCTATGGGCTCGGACGGTGTTGCCCATGCCAGATCGTCGGGC
+AGCGTTCGCGGCTCGAGCCGGCGGGTGGAGCGGCCCGGCCGATGCTCCGCGCGCACCTTGCGGGCGAACA
+CCAGTCCACCGGCGCGGCGCATGAGCTGTTGGGCGCGCGGGCCCCCCGGCAGGAAGGTTTCGTCCAGCAG
+CACCAGGACCAGGCGTGCGATGAAGTGGAATTGCACCGCGGTGCCCAGGTATTCGGCGGCGACATCCGGG
+CCGAACGGTGCCGGCGGTCCCGCCGGTGTCCCGGTTCCTGCCGCCCACGCCACATACGGCGCGTTCGGGT
+CACCGGCGGCAGGTGCTGTGCCGGCCAAGATCGCCGCGGCGGTGTCGGTTTGGCCTGCCGCGTACAGCAT
+GGTGGTGTGTGCGTCGACGCACCAGGGGCAGCGCAGGCTGGCCGCGACGGCGGCGGCGACGGCTTCCTTG
+CGGCCACGCGGCACCTGGCCCACCAGCAGTGTCTCGCGCAACGTCGCCCAGCCGGCGGTGAGCAGTCCCT
+CGTCCGGGGACAGCATGGCGAGCGGCTCGGGCAGCCGGCCGAACTCGCGGCGGGCCTCGGCATAGACCTC
+GGCGACCGCGCCGCCGGCTCGGCGGGGCGCGACGGGCTCAATATGGTTGACAAATTTCATGATTCGACTC
+CCTCCTGGGTGGTGCCGACTCTGGCCAGGGCCGCGTCGATCGCCGTTCGCGCCCGCTCTCCGGCGCCGTC
+GTCGTCGAGCAGCAGCAGCGCCCAGTTGGCCTCCATCGCGTAGGCGTGCAGCTCGAACGCGAGTTGGCGC
+GCTTCGATATCCGCCCGGATCTCGCCCCGGCGTTGCGCCGTTTCGACGTCGGCCGTGATGGCGGCGATTC
+CGGCCCGCCCGGTCGCGGCGATGCGGTCGCGCACCGGGCCAGGCTGTGAGTCCACGTCGGCGGCCGCGGC
+CGCGAAAAAGCAGCCGCCGGGGAACACGTCGCGTTCCAGGTATCCGACCCACGCATGCATGAGGGCGCGC
+ACCCGGTCCACCCCGGGCGGCGCTGCCATCGCGGGAGCCACGACCTCGGCTTCGAACACGCTCACGGCGG
+CCTCGACGGTCGCCAGCTGCAGCTGCTCCTTGGCGCCGAAATGCCGGAACAGGCCCGACTTGCTCATGCC
+CAGCCGCCCGGCAAGCTCGCCGATGGACAGCCCCGAGAGCCCCTTCACCGAGGCGATATCCATCGCGGCG
+CGCAGGATCTGCGCCCGGGTTTGGCGGCCGACGTCGGCGCTAGGCATGGCTTTTGACCTCCCGGTCGTCT
+CCGGCGAACGCATCCACCAGCGGGGCCGACCGGTCCAGGGCGGCCAGCACCTGGTCGCGGCCCGCCGAGG
+GCAGCGCGAGCGCCACCTCCGCGACACCGGCCCGGCGGTACTCGTGCAGGGTCGCCGGGTCGCCGGCCGA
+CGAGTACACACAGACCTGGGCGGTCGCCGGATCTCGCCCGGCACGCTCGAACGCGGCGTGCAGCATCGGC
+AACGCGCCCAGGAGCTCGCCGTACCCCTCGATCGGCTGCCAACCGTCGCCGTGGCGGGCGATCACCTCGA
+ACGCCCGCGCACTGGGCCGGCACCCGAACAGCACCGGCGGCGCCACGGCCGGTTTCGGCCACGCCCACGA
+CGGCGGCACCGACGCGTGCGTGCCCTCGTAGTGGACCGGCTCTGCGGCCCATAGCGCCCGCATGGCGGCG
+AGCTTGTCCACCGTCACCGCGATCCGGTCGGCGAACGGCACGCCGTGGTCGGCGAGCTCCTCCACGTTCC
+ACCCGAAACCCACCCCCAGCACGAACCGCTCGCCGGACATGGCGCACAGCGAGGCGATCTGTTTGGCCAG
+CAGGATCGGATCATGCACCGCCACCAGGCAGGCCCCGGTGCCCACGCGCAGCCGCGTCGTGACCGCCGCG
+GCGGCGGCCAGCGCCACCACCGGGTCATAGCAGCGGCGATACCAGTCCGGCAGCTCTCCACCGGGCCACG
+GCGTGCTCCTGCTGATCGGCACGTGCGTCTTCTCCGGCACATACAGGCCCGCGAAGCCGCGCTCCTCGGC
+CCACACCGCGACCAACTGCGGGGGTGGGGTCAGGTCGGTGACGAACTGCATGAGCGAGACGAGCATCGGC
+GGCGGCTTTCATTAAGCACGAACGTTCGTGTTTAACGATGGTCCGCCTGGGGCGTGCTGTCAATGCCGGA
+TTGCGTGACCGCTCGCTCGGGGCCCGGGTCAGCCGTCGGCGCCGTTTGCTCCAGGGGTGCCGAACAGCAC
+ACCACGGCTGCCGCCGGCACCACCACTTCCGACGGGTATGCCGAAGCCGCCGGCCCCGCCGTTGCCGCCG
+TTGCCGATCACCACGGCGTTGCCGCCGTTGCCCCCGTTACCACCGTCGCCTTTAACGCCTGGGGGGCCGT
+CGCCGCCTTCCCCGCCGTTGCCGCCGCGCCCGCCGTCACCGATCAGCCTGGCGTTGCCGCCGGCGCCGCC
+GTCACCGGCATTACCCGGCGTGGGAGCCTGTCCGCCGTTGCCGCCGCGCCCGCCGACGCCGCCGTTGCCG
+TAGAACAGCCCGCCGTTGCCGCCGGCCGCGCCGGCGCCGCCGGACCCCGCATCGGCAAGGGTGGAGCTGT
+TGTCGTTGCCCCCGTTGCCGCCGGCACCGCCGTTGCCGCCGTTGCCGATCAGCCCGACGTGCCCACCGGC
+CCCACCGGCGCCGCCGGCCCCACCGCTGTTGCCGTGGCCACCGTTGCCGCCGTGCCCCCCGTCGCCGCCA
+TTACCGATCAGGGCGGCCCCGCCGGCACCACCCGCCCCACCGCTGGCGCCGGTGTTGCTGAGCCCGCCGT
+TACCGCCGTCACCGCCGGCGCCACCGTTGCCGATCAGCCCGGCGGCGCCGCCGGCACCGCCGTTTCCGCC
+GTGCACCCCGGTCACCCCGTTGCTTCCGTTCCCACCAGCCCCGCCGGCCCCGCCGTCGCCGTACAGCAGC
+CCGCCGCGCCCTCCGTCACCACCGGCGCCGCCGGCCCCCGGTGCCCCGGATGCGCTGCCGCCGGCCCCGC
+CGGCCCCGCCATGGCCCCACAGCCCGGCGGCCCCGCCGGCCCCGCCGGCGGGGCTGACGCCCCCGGCGGT
+GCCGAGCCCGGCCGCACCCCCGGGCCCCCCGTTGCCGTACAGCCATCCGCCATTGCCGCCCGCACCTCCC
+GCTCCGGTGGCCGCACCCGCGCCTCCGGCCCCGCCGTTGCCGATCAGCCCCGCCGATCCGCCGTTGCCGC
+CGTTGGGATTGGCGGTGTCACCGGCCCCGCCGTTACCACCGTTGCCGTACAACAAGCCGCCGGGCCCACC
+GTTTTGCCCGGGACCCCCGTCGGCGCCGTTGCCGATCAACGGGCGCCCCAGCAACGTTTGGGTGGGCGCG
+TTGATCGCGTTGAGCAGGGTCTGCTGCACGTTGGCGGCCTCGGCGCTGGCATACGAGCCCGCGCCGGCGT
+TCAGGGCCCGCACGAACTGGTTGTGATACGCCGCCAGCTGAGCGCTCAACGTCTGATAGCCCTGGGCGTG
+CGACCCGAACAACGCCGAGATCGCCACCGACACCTCGTCGGCGCCGGCCGCCAGGATTCCCATCGTGGGG
+CCTGCCGCCGCCGCACTGGCGGCGCTGATCGACGACCCGATGTTCGCCAAATCCGTGGCGGCCGCTGCCA
+TCACCTCCGGCGCCGCAATCACAAACGACATCCCGCACCTCCGACCAGCTCAGCACGACTTCACGAATCC
+CAGACCTGCGACACCGTCGGCAGGGCTTTCGATCCTATAACAATCTGGAAACAGGATGTCGCACTTTCCT
+TAAAAGCGCTTCCGCCAACCCGATCGTCAGCGCGCACATGTTGCGCAAAAGTTGTTGGAGCCGAAACGAA
+CCGGCGCGCGCCGTTACCGGCGCCGCCGCCCTAGGTGGCCTGCAAGACCAAAGGAGGCCCGGGATCGGGT
+GACAGCGGGACGTTTTCGCGCTGCATCAGCCAGCCCGCGATGTTGTGGAACAGCGGGGCGGCCGAGTGCC
+CAGGCGCGCCGTCGGAGTTGCGCGCCGGGTTGTCCAACATGATGCCGATCACGTAGCGGGGATTGTCGGC
+AGTGGCGATTCCGGCGAAGGTGATCCAATACACGTCGTCGAAGTAGCAGCCGCAGCCAGGGTTGATCTGC
+TGCGCGGTACCGGTCTTGCCGGCCATCTGATAGCCGGGCACCCCGGCCGTCGGCCCGGTACCCTGCTGGT
+AGCCCATCGGATCGCGTTGCACCACGGCACGCAGCATCTGGCGCACGGTCTGGGCGGTCTGCGCCGACAC
+CACGCGAATGTCGTCGGGGCGCGGTTCTTCGGTCCGGCTGCCGTCGGGTGCGACGGTGGCCTTGATAATG
+CGTGGGGGTACCCGCACTCCATCGTTGGCGATGGCCTGGTACATGCCGGTCATCTGCAGCAAAGTCATCG
+AAAGACCTTGGCCAATAGGAAGATTAGCGAACGTACTGCCCGACCACTGGTCGATTGGCGGCACCAGTCC
+GGCGCTCTCACCGGGCAGGCCCACGCCGGTGCGCTGTCCCAACCCGAACTTGCGGAGCATATCGTAATAG
+CGTTCCGGTCCGACACGTTGGGAAAGCATCAGCGTGCCGACGTTGGAGGACTTTCCGAACACCCCCGTGG
+TGGTATAGGGCATCACGCCGTGCTCCCAAGCGTCATGCACGGTAACACCGCCCATCTGGATCGAGCCAGG
+CACCTGTAGCACCTCGTCGGGGCTGCTCAACCCGTGCTCGATGACCGCGGACGCGGCGACGATCTTGTTC
+ACCGAGCCCGGCTCGAAGGGCGACGACACCGCCGGGTTGCCCAACTGCTTGTCGCCCTGGCGCCCGATGT
+CTTGCGACGGGTCGAAGGTGTTGTCGTTGGCCATCGCGAGCACCTCGCCGGTCTTGGCGTCCAGGACGAC
+GGCCGAGACGTTGTGAGCCCCCGATAGGTTCTTGGCCTGCTGCACCTGCTGCTGCACGTAGAACTGGATG
+TCGTTGTCGAGGGTGAGCACGACGGTGGAACCGTGGACCGCCTTGTGCCGATTCCGGTAGCTGCCGGGGA
+TGACGACGCCGTCTGACCCACGGTCGTAGGTGACCGATCCGTCGGTTCCGGCCAGCACCGCATCCAGGGA
+GTCCTCCAGACCCAGCAGCCCATGACCATCCCAGTCGATGCCACCGACGACGTTTGCCGCCAGCGACCCA
+CCCGGGTACTGACGCAGATCCTGTCTTTCCGCACCGACCTCGGGATACTTCGCGCAGATCGCGCTGGCGA
+CAGCCGGGTCGACCGCACGCGCCAAGTAGACGAAGGTCTCGTCGCTTTGCAGCTTCTTCAGCACGGCCGC
+GGCATCTGGCTTGTTGTTCAGCTTGCCGGCGACCTCCTGGGCGATATCGCGCAGGCGCTGCTGCGGGTCG
+GGTGCAGCCGACGTCTTCTTCCTGGCCTCTTCCAATTGCCGCCGAATCCGCTTCGGCTGGAACGTCAGGG
+CACGCGCCTCGATGGTGAACGCGAGCCGGTCATTGTTGCGGTCGACGATGCTGCCGCGAGCCGCTGGCTG
+GACGTCGGTGACCTTGAGTTGGCCGGCCGCCTGCGCACGCAGGCCCGCGGCATGTGATACCTGCAGAAAG
+AACAATTGTGTTGCCGCGACCAACATCAACACCAAGATGACCGCGTTTCCGGTCCGATGCCGAAAGACGA
+ACGACGCACCGCGCGTCCCGACGTCCACCACCTGCCGGGTGCGCCTCGCACGAGTCGAGCGACCCGCGGG
+TGCGACGTCTGACCGTGTCGCAGGGCGGGATTTCGTGGCTTCCTGGGCTTGCCGGGCTTTCTGCGTTTTG
+CCGGGCCGTTTGCGTTGCCCAACCTCCTGGGCTCCCGGTGGCCGGCGCAAACCGCGCGCCGGTCGCGTCG
+ACTGCGACTGACTGGCCCGCCTGGGGGCGGCGCGGCTCACCTGGGAGCCCCCGGCGCCGTTGGCACCGGC
+GCCGTGACGGGACCGAACTGTTCGCCGTTGGCCGGCACTGGAGCGGGTGGTGCCACCATGGGTTGCGACC
+CACCCGACAGCCCGGGCGTCGCAGCCACCGGTGCTGGTCCAGGGAGCCCGGCCGGGGGCGCCGCACCCAC
+CTGGAGCGGCACCGGATTTTCCGCTGGTGCCGGGGATGGCACTGCGCCGAGCGGAGGAGCCGGCATCGGA
+CCCGGCGCCCCAGGTATCGGCACCGGACCGGGCAGCTGCGGGCCGGCCTGGGTGGGCAGGTGGGTTGCGC
+CGCCCAGCGTCGCTGTGCCGTCTGGGGTACGCACCAGCACCTCCGGGCCAGACCGGGCGGGCGGAGCGGG
+ATCATCGGGGCCTGGTGTCACCCGGACCGGCACCTCGAGGGGCACCGCCGCGGGTTTCGGGGGCGGCGGC
+GGATCTTCGGGCAACTTCGTGTTCAGCGGCGGCGGTGGAACTCCGTCAGCCGGCTTGGGTGTACCGACCA
+CCACCCAATTGCCGTCCGGATCCTGAGCCAGGTGGGCGGTATCCCTCGTCGGGATCATGCCCTGGCGACG
+AGCCGCCTCGGCCAGCGCCGGCGCCGACGCAGCCTCGCGTACGTCGCGTTCCAGCGCTTCCTTGTGCTGC
+TGCAGCATCCGGGTCCGCTCCCGGGCGTTGCTCAGCTGGTAGGACCTCTCGGCGGCATCGGTGGACAACC
+ACAGTGTGAGGCCTAGTCCGACGCCGAGCGAACCGATAACCAGCACCACAAACGGAACCTTGTTTGCCAA
+CGTGCGCGGCCGCAGGTCGATCGACGTGAGCCGGGCGGCGAGACGCTCCATCGGCGTAGGACGGACCAGC
+TTGGGCGCCTTGGCTTTTCGGGCCTTGGCCCGCGCCTTGGCCTGGCTGGTGTTCTTTGCGGGGGCCGGCC
+GGTCGAACGGGCTGAGCATCGGGCTGGTTTGCGGTCCAGGGCGCGACACCCGGGCCTGCCGGCCGGGTGC
+CGAGGTCTTGCCGGCACGGCTCCGGATGCGGCGCGACGGCGCCGAGTTCGTAGTCGTTCGCCTCGTCGCC
+GCGGCAGGACTGTCGGCTCTCCTGCGACGATCGCTGCTGCGGCTTTTCGGTGCCTCACGCTTGGCCCTCA
+TGAATCACCCTTCTCGGTTGCCCATTGCTGCGATTGCGCCCGGTGCTCGACTCGTTGCAGGGCCCGCAAC
+CGCACTGGAGTACTGCGGGGATTGCGTTCGATCTCAGCCACACTCGCTCGTTCGGCGCCGTGCGTTAACG
+AACGGAATCGCGGCTCATGGCCGGGAAGTTCGACCGGAAGTCCCGCAGGGGTGGCCGACGCGACTGCCTC
+GGCGAACACCCGTTTGACGATCCTGTCCTCTAGCGACTGGTAGGCCAGCACCGCGATGCGCCCACCGATA
+GCGAGGGCATCCAGCGCGGCAGGAACGGCCGTGCGCAGCGATTCCAGCTCATCGTTGACCGCGATGCGCA
+GCGCCTGGAATGTTCGCTTGGCTGGATGCCCGCCGACACGCCGGGCCGGAGCTGGAATCGCCTGGTACAG
+CAGGGCAACCAGTTCGGCGGTCGAGGTGAACGGGGTTTTTGCGCGTCGGCGGACGATACCGGCAGCGATG
+CGCCGAGCAAACCGCTCCTCTCCGTAGCGACGCAGGATGTCGGCTAGTGCCGCCTCGTCGTAAGTGTTGA
+CAATGTCAGCTGCGGTCAACGGCGTCGTCGGGTCCATCCGCATGTCCAATGGCGCGTCCGTGGCGTAGGC
+GAAGCCCCGCTCGGCGCGGTCGAGCTGCATGGATGAGACGCCGAGATCGAACAGGATTCCGTCGACTGAT
+CCCACTGCGGCATAACCGGATTCAGCCAGCGCTGCGCCCAGACAGTCATAGCGGGTGTGCACCAGGGTAA
+GTCGGTCAGCGAATCGCACCAGCCGAGACCGCGCGACGTCCAGAGCGGTTGGGTCACGGTCGAGCCCGAT
+CAGGCGCAGACCCGGCAATCCCTCCAAAAACCGCTCCGCATGCCCGCCCGCGCCGATGGTCGCGTCGAGA
+AGGACCGCCTGCGAGCCGTCTGGATAGTAGCGGGTTAGTGCGGGGGTAAGCAGTTCGAAGCAACGTTGCG
+CCAATACCGGCACATGACCGAAACCGGTTGGCCCCGAACCTGGATCAGCCACCGTGATACCTCCCCAGGT
+CTGGCAAGCCGTACTTCGGGACGCGGCTATTCCAGGCGCCGCCCCTGCACCGAGGTCCCTGTCCGAAGAC
+ACGAACCTGGCGTTGGGGAAGTACGCCAGGGTCGCTTCGGGCAGAGACCACGGTGCACGGGTTTGCACCT
+CAGAAGATGTCACCGAGTGCTTCATCGCTGGCCGCGGAGAAGTTCTCTTCATGGATTTGTTGGTAGTTCT
+GCCAGGCTTGCGCATCCCAGATCTCGAGATAGTCGACCGCGCCGATCACCACACAGTCCTTGGAAAGGCT
+TGCGTAGCGGCGGTGGTCGGCCGACAAGGTGATCCGGCCTTGACTGTCGGGATGCTGTTCGTCGGTACCG
+GCGGCGAGATTACGTAGGAACGCTCTCGCCTCGGGGTTGCTTCGTGGCGCCTTGCTGGCCCGGCGCGCCA
+GCTGCTCGAACGCCGCCCGCGGGTAAACGGCCAGGCTGTGATCTTGGCTCTTGGTGACCATCAACCCCCC
+TGCCAACGCGTCGCGAAACTTGGCCGGCAGCGTCAGCCGCCCCTTGTCGTCGAGTTTGGGCGTGTAGGTG
+CCGAGAAACATGGGGCACCTCCCTGCCAAATCCATCTCACCCAAACACCTCAGCCACCATACCCCACAAT
+CCCCCACTTTGCCCCATAACTGGGGTATCAAAGCGGCGTTTTGCCGTCTCTGTACCACTGAAGCGCGCGG
+CTAGCCCGGCTACGACCTCAGAAAACCGCATGTCGCCGGGCAAATGGGTGGCAAGTGGGGCCAAGTGGGG
+CACAACTGGGGCTCAAACCGGACTCAATATCGCCGACAGCCGGTGACGACCCGGCTGGGGCTTCCCGAGA
+CTGCGATTCCCAAACGATGACGCCCAAACAAAAAGCGGGACCGCCGATGGCTGCCCCGCTGCCGCTGGTT
+GCGTTCGGCTTACTCGTCGAAGCGGCGCCGGAACCGATCTTCCATACGGCTGGTGAATGAGCCCCCGGCC
+CCCTTGGTACGACGCTGGCGCGAAGCCCCAGCAGCCGATCCGCCACGATCCATCCTGCCGGACAACCGAG
+GACCGGTGATGGCATACACCACACCACCGAACATCACGACAAAACCGAAAACGCTGAGTATCGGGAAACT
+TCCGATCATGGTCTCTTTGAACGCCACGCCGGAAACCAACATCCCCAGACCGATGATGAACAACGCCGCG
+CCCTGCAGGCGCCGCCGCGCGGTCGGTGCGCGGAAGCCCCCGCCACGGACACTCGATGCGAACTTGGGAT
+CTTCGGCGTAGAGAGCGCTCTCGATCTGGTCAAGCATCCGCTGCTCATGATCGGAGAGTGGCATGCGTCC
+CTCCTTGCCGACAGACTGTCACGTAATACCGATAACACGCGGATGCCCATTGCGCGGGCAACTAACTCAG
+ATGATACGAGGTCAATCTGCGCCGTACCACTGGTTCGCGGGCGATTCTATCCCGGCGGCGCCGCAGCGAC
+GAGCTGAGCGGAAACGGCCATACGCTACAAGCCCCGTCCAGCGCGGGCGGCCTCATCGGCTTGTCCGATA
+CTGGTGCGCAAGCACGCATCGGTTCATCACATGAGGAGGACACCGCGCGTTGGCGATATTCCTCATCGAT
+CTGCCGCCCAGCGATATGGAGCGCCGCCTCGGTGATGCCCTGACGGTGTATGTCGACGCGATGCGCTACC
+CCAGGGGCACCGAGACTTTGCGCGCCCCAATGTGGCTGGAGCACATCCGGCGGCGCGGCTGGCAGGCGGT
+CGCGGCCGTCGAGGTAACGGCAGCCGAACAGGCCGAGGCCGCCGACACCACGGCGCTGCCGTCGGCCGCC
+GAACTGAGCAACGCGCCAATGCTCGGAGTGGCGTACGGCTATCCCGGGGCGCCCGGCCAGTGGTGGCAAC
+AGCAGGTGGTACTGGGCTTGCAACGCAGCGGCTTTCCGCGCCTAGCGATCGCCCGACTGATGACCAGCTA
+CTTCGAGTTGACTGAATTGCACATCCTTCCCCGCGCTCAAGGCCGTGGCCTCGGGGAGGCGTTGGCCCGC
+CGACTGCTAGCCGGTCGCGACGAGGACAACGTCCTGCTCTCCACACCGGAGACCAACGGTGAGGACAATC
+GGGCGTGGCGGTTGTACCGCCGGTTGGGCTTCACCGACATCATCCGCGGCTACCACTTCGCCGGTGACCC
+CCGAGCATTCGCCATCCTGGGTCGCACGCTACCGCTCTAACCCGCGCCCGACAGCTTGCCGACGCGGCAT
+GCCCGGTCTGGCACGATGACCTGGTGCGCGCTAGCTATGCCCCACCGTCATCCCAAGGATCGCGAGTGGC
+AAGGACCCGACGGCGCGGCATGCTGGCCATCGCGATGTTGCTGATGCTGGTGCCTCTGGCTACCGGATGC
+CTGCGGGTCCGAGCCTCGATCACCATCTCGCCGGATGACCTGGTGTCCGGGGAGATCATCGCCGCGGCCA
+AGCCGAAAAACAGCAAAGACACCGGCCCTGCGCTCGATGGCGATGTGCCGTTCAGCCAGAAGGTTGCGGT
+CTCGAACTACGACAGCGACGGCTACGTGGGGTCGCAAGCAGTGTTTTCCGATTTGACCTTTGCCGAGCTG
+CCCCAGTTGGCCAATATGAACTCCGACGCCGCCGGAGTGAACCTGTCACTGCGCCGAAACGGCAACATCG
+TGATCCTGGAAGGCCGAGCGGATCTGACATCGGTATCCGATCCCGACGCCGACGTCGAGTTGACCGTCGC
+CTTCCCCGCAGCAGTGACTTCCACCAACGGCGACCGCATCGAGCCCGAGGTAGTGCAGTGGAAGCTCAAG
+CCGGGCGTGGTGAGCACGATGAGCGCACAGGCTCGTTATACCGATCCCAACACCCGGTCGTTCACCGGAG
+CCGGCATCTGGCTGGGCATCGCCGCGTTCGCGGCCGCCGGTGTGGTGGCCGTGCTGGCGTGGATCGACCG
+GGACCGCTCCCCACGGTTGACCGCTTCGGGCGACCCGCCAACCAGCTAGTCCGGCTTGCCCGGCTCGGCA
+GGTGACCAGTAGGCAAGCATTTCCGCGAAGGTCTCGAAAGCCGCGGCCGAAACGCCATACGTCGCCTCGA
+GATGGATGCTTAGCGGAAAACCCAGATCGGCGACGCCGTCTAGCACACGCTTGTACAAGTCGACCATGAG
+CCGGCGCCGCCGTGCGGGTTCACTGCCGGCCAACTTCTGCACGAACGCCTGCTCGTCGGCCACCGCGGCG
+TTTCCCGGGTCCTGGATCAGCCAGTTGATCAGGCCGATGCGGGTCTCGACCTTCGGGACAAAGCCGAACG
+ACAGCAGAATCTCGGGTCGGTGTTCGGTGGTCCTGGCGAACTCGCGCAGGAAGCCCACGATCGCGTCGGA
+ATACAACAGCTGGGTCATGCCGTAGGTTGCGCCCCGACTGCACTTGAAATTGAGCCGGCCCTGCTCGCCG
+TCTCGGGTGGGGATCACGATCACACCACGGTTGGCCACCAGCTGGCGATACAGCGACAGGGCATCCGTCG
+GCGCGACTCCGGAGCCCTCGCCGTCCTGCATCGTGCGCGGTACACCGACGAATACGATGCCCTCCATGCC
+GGCATCGGACAGATCGACCAGCCGCCGGTGCAACGATGGCTCGTCCATGAACGCGGTTACCTGCGTACAC
+AGGCCATGGACTCCCGCCAACTCCGGTTTGATGATCGACCAGAAATCGAGTACATCCAGCTTCGGCTGCA
+TCGGGATGGGCCTATCGTCATCCTCGGCGATCATCCCCGGCATCATTACGTGCCGTATCCGGCCGTCAAG
+CCCGGATGCAGCCGAGTACTGCACCACCTTGCGAGCATCTTCGATTGCCCGCTCCTTGCCACCCTCGAGG
+TTCGGTGGCACCAGCTCCAGCGCGATCGTGTTGAGGGTCACACGGCTCCTCTTCGTCAAACGAGTACTTC
+CATGGCCGCCAATGGGGCCACCGGTGGGCCGCGCCGCGTCGCGCAAATCGCCATCCTGGGCCGGGCCGGA
+CCAGCCAACCCAAGGGCGCTGAAGACAGCATAAACACGAAATAGTCAGTTAGTCGAAGCAACTTGTGTGG
+TTTCCGCGAGCCCACCCGCCGAATCATCGATAGCGGCCACTCGCGCCGGCGCGGAATACACTGTCGGGCC
+ATAGGCACGCCAAATGAGAAAGGGGCGCCGCGCTGAGCCTGAATGCGCCGGCAGCACCGGCAGCGGTCCA
+GTTGGCCGGCGCCATCACCGACCAGCTGCGGAGGTATTTGCACGGCCGCCGCCGTGCGGCCGCCCACATG
+GGCAGTGACTACGACGGCCTGATCGCCGACCTGGAGGATTTCGTTCTCGGCGGGGGCAAGCGCCTACGAC
+CGCTCTTCGCCTATTGGGGCTGGCACGCCGTTGCCAGTCGGGAACCCGATCCTGATGTGCTGCTGCTGTT
+TTCCGCGCTGGAACTGCTGCACGCCTGGGCGCTGGTCCACGACGACCTGATCGACCGTTCCGCCACCCGC
+CGGGGCCGCCCGACCGCCCAGCTGCGCTACGCGGCGCTGCACCGCGATCGGGACTGGCGGGGGTCACCGG
+ACCAGTTCGGCATGTCGGCGGCCATCCTGCTCGGCGACCTCGCACAGGTCTGGGCTGACGACATCGTCTC
+GAAGGTCTGCCAGTCCGCCCTGGCACCCGATGCCCAGCGGCGAGTGCATCGGGTGTGGGCCGATATCCGC
+AACGAGGTGCTGGGCGGGCAATACCTCGACATCGTCGCAGAGGCCAGTGCCGCCGAGTCGATCGAGTCGG
+CGATGAACGTCGCGACGCTCAAGACCGCCTGCTACACGGTATCGCGACCGCTACAGCTTGGGACGGCCGC
+CGCGGCCGACAGATCCGACGTAGCGGCCATCTTCGAGCATTTCGGAGCGGACCTCGGCGTAGCGTTTCAG
+TTGCGCGACGACGTGCTTGGCGTGTTTGGCGACCCAGCCGTGACGGGCAAGCCGTCCGGTGACGACCTAA
+AGTCGGGCAAGCGTACCGTGCTGGTAGCCGAAGCGGTGGAATTGGCGGACAGGTCAGACCCCTTGGCGGC
+CAAACTATTACGGACCTCGATTGGCACCCGATTGACTGATGCGCAGGTACGTGAACTGCGCACGGTCATC
+GAGGCAGTGGGCGCGCGCGCCGCCGCGGAGAGCCGCATCGCCGCGCTCACCCAGCGAGCACTGGCCACCC
+TGGCGTCCGCACCCATCAACGCAACAGCCAAGGCCGGGCTGTCCGAACTGGCCATGATGGCTGCGAACCG
+GTCCGCCTAACCGATGACTACTCCGAGCCATGCTCCAGCGGTTGATTTGGCTACAGCGAAAGATGCTGTT
+GTCCAACACCTTTCGCGACTTTTCGAGTTCACTACCGGTCCGCAGGGCGGACCGGCGCGGCTGGGCTTCG
+CCGGCGCGGTGCTGATCACCGCAGGCGGGCTGGGAGCCGGCAGCGTCCGCCAACATGACCCGCTGCTGGA
+GTCGATTCACATGTCCTGGCTGCGCTTCGGCCACGGACTCGTGCTGTCGTCGATTCTGTTGTGGACAGGT
+GTGGGTGTGATGCTGCTTGCGTGGCTGGGTCTAGGCCGACGGGTCCTCGCCGGCGAAGCCACCGAGTTCA
+CCATGCGGGCAACCACCGTTATCTGGCTGGCGCCGCTACTGCTGTCGGTGCCCGTCTTCAGCCGGGACAC
+TTACTCGTATCTGGCCCAAGGGGCGCTTCTGCGCGACGGTCTGGATCCTTACGCTGTTGGCCCGGTCGGT
+AATCCCAATGCGCTGCTGGACGACGTAAGCCCGATCTGGACGATCACCACCGCGCCCTACGGTCCTGCGT
+TCATTCTGGTTGCGAAGTTCGTCACGGTAATCGTCGGCAACAATGTCGTCGCCGGAACCATGCTGTTGCG
+TTTGTGCATGCTGCCCGGGCTGGCGTTGCTGGTCTGGGCCACTCCACGCTTGGCCAGCCATCTCGGCACC
+CACGGCCCGACCGCGCTGTGGATCTGCGTGCTGAACCCACTGGTCCTCATCCATCTGATGGGCGGGGTGC
+ACAACGAGATGCTGATGGTGGGTCTGATGACCGCCGGTATCGCGTTGACCGTCCAGGGCCGTAATGTCGC
+GGGGATCATCCTGATCACCGTTGCGATCGCGGTGAAGGCCACCGCCGGAATCGCGTTGCCCTTCTTGGTC
+TGGGTTTGGCTGCGTCATCTGCGTGAGCGACGGGGGTACCGGCCGGTCCAGGCGTTCCTGGCAGCCGCCG
+CGATATCGCTGCTGATCTTCGTCGCGGTGTTCGCGGTGCTGTCTGCGGTAGCCGGCGTTGGCCTAGGGTG
+GCTGACCGCGCTGGCCGGCTCGGTGAAAATCATCAACTGGCTGACGGTGCCCACCGGGGCGGCCAACGTG
+ATCCACGCGCTGGGCAGAGGGCTCTTCACGGTCGACTTCTACACCTTGCTGCGGATCACCCGGCTGATCG
+GAATCGTGATCATCGCGGTGTCGCTGCCGCTGTTGTGGTGGCGGTTCCGGCGCGACGACCGGGCCGCGCT
+GACCGGGGTCGCATGGTCGATGCTGATCGTGGTGCTGTTCGTACCCGCCGCCCTGCCGTGGTACTACTCC
+TGGCCGCTGGCGGTCGCTGCCCCGTTGGCCCAGTCACGACGGGCGATCGCGGCCATCGCCGGGCTCTCGA
+CTTGGGTGATGGTGATCTTCAAACCCGACGGATCGCACGGGATGTATTCGTGGCTGCACTTCTGGATCGC
+CACCGCCTGCGCACTGACTGCGTGGTATGTCCTGTATCGGTCACCGGACCGGCGCGGAGTGCAGGCTGCA
+ACCCCGGTGGTCAATACGCCATAGCCTGGGCCCGGCGCACCACCTCGCGAGCCTGGTGGGCATGCAATGC
+ATCGACGGGACGGGCGTTGCTGACGGCGTCACGCGAGCCGTCGCGGGTGATGGTCAGCGACGGATCGGGG
+GTAAACAGCCAGCGCATAATCTCGGTGTCGCGATAGCCCCCGTCGTGCAGGATGGTCAACAGCCCCGGCA
+GGCTCTTGACCACCTGACCGGAGTTGGTGAAGAAGACCTGAGGGATCACCACGCCACCAGCGCGCCGCAC
+GGCCACCAGATGACCTTCCCGCAGCTGCTGGGCCACCTTGCTGACCGGAACGCCGAGCAGCTCGGCGACC
+CGGGGCAGGTCGTACGTCGGTTCGTCAGGGTCCAAAACGTCATCGCCAGCGAGAATGCTGCCCACCCGCG
+CAAGTGTAGAGCCTGGTGCGCGGCCAGGCATGCGCGTTAGGCTTCCGTTCTGCATCCAATCGCGGCGGCC
+ACCTACGATGACCCCGTGGTCGAAGCTGGCACGAGGGACCCGTTGGAGAGCGCGCTGCTGGACAGCCGCT
+ATCTGGTCCAGGCCAAGATCGCCAGCGGCGGCACCTCGACGGTCTACCGGGGCCTGGATGTCCGACTCGA
+CCGGCCCGTCGCGCTGAAAGTGATGGATGCTCGCTACGCGGGCGATGAACAGTTTCTGACCCGCTTTCGA
+CTGGAGGCCCGTGCGGTTGCCCGGCTAAATAACCGCGCGCTGGTCGCGGTCTACGACCAGGGCAAAGACG
+GCAGGCACCCGTTTCTGGTGATGGAGCTCATCGAGGGCGGTACCCTGCGCGAGCTGCTGATAGAACGTGG
+TCCCATGCCGCCACATGCCGTTGTGGCGGTGCTGCGCCCAGTGCTTGGCGGGCTGGCTGCCGCCCATCGA
+GCCGGTCTGGTGCATCGCGATGTCAAGCCCGAGAACATCTTGATCTCCGACGACGGCGACGTCAAACTCG
+CCGATTTCGGGTTGGTCCGCGCGGTCGCCGCCGCTTCAATCACGTCTACCGGCGTCATCCTGGGTACCGC
+GGCCTACCTGTCCCCTGAGCAGGTCCGTGATGGAAACGCCGATCCTCGAAGCGACGTCTACTCTGTCGGC
+GTTCTGGTCTACGAGCTGCTAACGGGGCACACACCGTTCACCGGCGACTCGGCCTTGTCGATTGCCTACC
+AACGGCTTGATGCTGACGTGCCGCGTGCCAGTGCTGTAATCGACGGTGTACCGCCACAATTCGATGAGTT
+GGTGGCATGTGCAACTGCCCGCAACCCTGCCGACCGATACGCCGATGCGATCGCGATGGGCGCCGATCTG
+GAGGCGATCGCCGAGGAGCTGGCCCTGCCTGAATTCCGGGTACCGGCGCCGCGCAACTCCGCTCAACACC
+GGTCGGCCGCGTTGTACCGCAGCCGGATTACCCAGCAAGGGCAGCTGGGTGCCAAACCGGTTCACCACCC
+TACTCGCCAGCTGACTCGCCAACCCGGCGACTGCTCCGAGCCGGCTTCAGGGTCGGAGCCCGAACACGAG
+CCGATCACCGGCCAATTCGCCGGCATCGCAATCGAGGAATTCATCTGGGCGCGACAGCACGCCCGTCGAA
+TGGTGCTTGTCTGGGTGTCGGTGGTGCTGGCGATCACCGGGCTAGTGGCGTCCGCGGCATGGACGATCGG
+GAGCAACCTGAGCGGCCTGCTCTAAGGCAGGCGAGCAGTCGCAAAAGCCCCCATTTCGGCACGAAAATGG
+GGGCTGGTACGTGAATTAAGGTGACCACGGCAAGCGTGACCCGCCGGCGACTGCAGCGAAGCCGGGTCTG
+TTGGTGACAGTGTGTATGTCGGGGTTTCAGGCGGCAGGTTCGAGGGTGACCCCCAATCCTTGGGCTTCGA
+GTTTGGCGACGAGGCGACGTCGTTCTTTGTCGGGATCCATGCGGGTGGTGAAGTAGTCGGCGCCGAGATC
+CTGGTAAGGCCGGCCGGTGGCCAGCACGTGCCAAATGATGACGATCAGCTTGTGGGCGACGGCGATGATC
+GCCTTCTTGTTGGCAGCGGGACTGCGGAAGCCACCGAACTTGCGGACCTGGCGGCGGTAGTACTCGCGCA
+GGTAGCCATCGGTGCGCACGGCGGCCCACGCGCACTCGACCAGGACCGGCTGCAGGTGCTGGTTGCCTTT
+GCGGCGGGCACCGTGATGGCGTTTGCCGGCCGATTCGTGGTTGCCCGGGCACAGCCGCACCCACGAGGCC
+AGATGCTCAGCCGAGGGGAACCAGGCCGCCGGGTCGGCGCCGATTTCAGAGATGACCGTCGCCGAGGCAC
+CCACCCCGATCCCCGGGATCGATGCAATCAGCTCGCGTCGGGCACAAAAGGGATGCATCAGCTGCTCGAT
+CTGCTCGTCGAGAGCACCGATCATCGCATCGAGCTGATCCAGATGAGCCAGGTGCAACCTACACATCAGG
+GCATGGTGATCATCGAAGCGCCCTTCCAGCGCCCGCTGCAGATCGGGGATCTTCGAGCGCATAAGGTGCG
+CTTGATCGTCTTGCGCCCGTCAGGACCCTCGCCCGGCACCCACACCGCCACCGCGATGATGTCCTGGCCC
+ACATCAACAAAGGCGCACCGCTCGTACAGAATATGCATCCCACCAGCCCCTTTCCGGCTCAGCGTCGCAA
+CCAACAACGCGCGCTGCGAAGGGAGCCCCCAAACATGAACTAAAGAGACTGGTACTCGCGCTCGTAGCAG
+CAACCGGGACACACCCGAAAGTGGGGGGGCTCCAACGTCAGTCTCTTGCACGGCCACACACAGCCAAGCC
+CCTACGACGTCGACACCGCAACGCACGCACCGATTCTCATTCACCATGAGCGGGCGCACCAGCGCCCATC
+ATGTTCTTTTACGACTGCTCGCCGAGCTAGTCCCGCAGCATCTCCGCGACCAGGAACGCCAACTCCAGCG
+ACTGCTGGGTGTTCAGCCGCGGATCACATGCCGTCTCATAGCGGCCGGCCAAGTCCGTCTCCGAAATGTC
+TTGCGCGCCACCAAGACATTCGGTGACGTTCTCGCCGGTAATCTCGACATGGATGCCGCCCGGATGGGTT
+CCGAGGGCACGATGCACCTCGAAAAAACCCTGCACTTCATCGACAATGCGATCGAAGTGACGGGTCTTGA
+ACCCCGTGGACGACTCGTGGGTGTTGCCGTGCATCGGGTCGCATTGCCAGATCACCTGATGCCCGGTGGC
+CTGGACCTTCTCCACGATCGGTGGCAACAGATCGCGGACCTTGTGGTTGCCCATCCTGCTCACCAACGTC
+AGCCGGCCCGGCTTATTGTGCGGGTCGAGCCGCTCGACGTACTCCACGGCCAGTTCCGGGGTCATGTTGG
+GGCCCAACTTGACCCCGACCGGATTAGCAATCACCTGGGCAAACGCGATGTGCGCGCCATCGATTTGTCG
+GGTCCGCTCGCCGATCCACACGGTGTGTGCGGACAGGTCAAACAGTTGTGGTTCACCGTCTTCACCGTCG
+GACAACCTCAACATGGCGCGCTCGTAGTCGAGCACCAAAGCTTCATGGCTGGCATAGATTTCGGCGGTCT
+GTAGATTGCGGTCGGCCACCCCACAGGCACTCATGAACCGCAGCCCACGATCGATCTCGGTGGCCAGCGC
+CTCATAGCGCGCGCCGGCCGGCGAGGTCCGGACGAATTCCCGGTTCCAGTCGTGAACCAGATGCAGCGAC
+GCCAGGCCCGACGAAGTCAGCGCACGCACCAAGTTCATCGCCGCACTGGCGTTAGCGTAAGCCCGGACCA
+GCCGCGACGGGTCGTGCTCGCGCGCCGCGGCGTCCGGGGCGAAGCCGTTGATCATGTCGCCGCGGTAAGA
+CCGCAGACCCAGCGCGTCAATGTCGGCTGACCGAGGCTTCGCGTACTGACCGGCGATGCGGGCCACCTTC
+ACCACTGGCATGCTGGCGCCGTAGGTCAGCACCACGGCCATCTGCAACAAGGCACGGACATTGCCCCGAA
+TATGGGGTTCGGTGTTGTCCATGAATGTCTCAGCGCAGTCGCCGCCCTGCAGCAGGAAAGCCTCACCCTT
+TGCCACCTGGGCCAGCTGCTCTTGCAGCCGGACGATCTCGGACGGCACCGTCACGGGTGGCACGCTCTCC
+AACACCGTGCGCATCGCCAACGCCTGGTCGGCCGGCCAGGTGGGTTGCTGGGCCGCCGGCTTGGCCAGCG
+CGGCGTCCAGTCGTGTTCGCAGGTCAGTCGGCAGCGGCGGAAGCGACGGGAGCTGGTCGATCGGTATGTC
+GACGGTCCAGTTCATCGGTCCATGGTAACCGGGGATTTCCTGACGGCTGCTCAGGGCGAGGTTCGCTCGG
+AGGTCCTCGCCGGCGGGATCTGACTGTCCGTCTCCTCAGCGGGCCGCGCCGCGGCCCGCATCGTCTGTGG
+ACGTGATGAGACGAAACCGGCGCAGCTGATCTCGGGCATCGACCAGCGCGTCGTGGACGTCGCGTGGCCG
+CGGCGGCATCCGGGGGCATCCCCGGTCCTCCCACAACTGCCGCAGTTCCCGGGTGAAACGGGGCACTGTG
+GGTGGCAAGGCAGTCATCGGGCCCCACAATTGACACAGCGCTACATGGTCGTAGGCCCCCACCCAGGCCC
+ACAACTCGATCGAATCCGTGCCGTCGATGCGGAGGAATTCTTCCAGGTCAAGACGAATCTGCTGGCGCGA
+GCGCCACAGTTGCGAGGCGGGCGGCGGCAGCTTGGGCAGCACATGGGTGCGCACCCAGCTGCCGGCCCGC
+TCGGGATCGAATTCCGTGGATACTGCGTAGTATTCGCGGCCGTCTTCTGCGACCACCCCGATCGAGATCA
+ACTCGATGGTGTGCCCATCCTCGATGAATTCGGTGTCGTAGAAGTACCGCACCGCCGCAGCCTAATCCGA
+CCAGACCGAGCCGCTGATCAGAATGGGCGCGGTTCTCTCCGGCGGTGGTGCGGGGCGCACGTCCTGGTCG
+AGCTGGGCGTCGACCGCGCGCTCGTCGGGCATCCGTGGCGTCCCGGCGATCACGTATTGCAGCCACAGCT
+TGATCCGCACCACCGGGCGGCGCCATGTCCGTTCCCGCTGTAGCGCACGGCGCATCTTTTCCGGGTGGCG
+GGTGTAGCGCCACCGGGCCCACGGAGCGTGCGGACGCGACAGCCGGACTGCGCCGACGACCAACAGCACG
+ACAACGAACATGCCAAGCAACCCGGTCCAAACCTTGCCCTTGAGCAGCACCACCACCGCCAACGGCAACG
+TCAAGACCAATCCTGCGATCAGGGTGGTTTGCAGCACCACCCAGTTGGCGCCTTGCCGAACCGTCAGGAA
+GAAGATCAGCGGGTGTAGGCCCATGATCAACAGCCCCGCGACGGCCACTGCGGCAAAGACGGCGTCTACC
+GACGTGCGTCCGTCTTCCTCCCAGTAGACATCGGACAGATGCAGGATCAGTGCGTACTCGTCGAGCACCA
+AGGCGGCCCCGACTCCGAAAATGCTCGCCGCTATGGTGAATTCGGGTTCTCGACCGTCGACTGACAAGGT
+GACCAGCGTCAGCCCGGAGATCATCACCAGCACCACCCCAAACGCGACGTGGTGGATGTGCACCGACCCG
+ATGTGGACATTTCGCGGCTGCCACCACCTGGCCGGCCGACCGTCCGCGGCGCGACGGTGGATAAACCGTA
+CAAAACTACGCGTGACGAGGAAGGTCAGGACAAAGGCGACCAAGCAGCACAACAACGGCAGCCGGCCACG
+GTCGACGATGTCGTGCTGCAGCCAGTGGAACACCTCCAAAAAGCTACGCCCACCTTGACTGCATATGCAG
+GCGCCGTACAGCGCCACCATGCGCGCCTACGCGAAACTACTAGGCTGTTCTGCGACATGAGTGCATGGCG
+GGCGCCCGAGGTGGGCAGTCGACTCGGGCGGAGGGTGTTGTGGTGCCTGCTGTGGCTGCTGGCCGGCGTG
+GCGTTGGGCTACGTGGCCTGGCGGTTGTTCGGCCACACGCCGTATCGCATCGATATCGACATCTATCAGA
+TGGGCGCTCGAGCTTGGCTGGACGGGCGTCCGCTGTATGGCGGTGGTGTGTTGTTCCACACACCCATCGG
+GCTGAACCTCCCGTTCACCTATCCTCCACTGGCGGCCGTCCTGTTCAGCCCATTCGCCTGGTTGCAGATG
+CCGGCTGCCAGCGTCGCGATCACGGTGCTAACCCTGGTGCTGCTGATCGCGTCGACGGCGATCGTGCTGA
+CCGGCCTCGACGCATGGCCAACCTCCCGACTGGTACCCGCGCCGGCTCGGTTACGCCGGTTGTGGTTGGC
+CGTGCTCATCGTGGCTCCGGCAACGATTTGGCTGGAGCCGATCAGCTCGAACTTCGCTTTCGGTCAGATC
+AATGTGGTGCTGATGACCCTGGTGATCGTCGACTGCTTCCCACGCCGAACGCCATGGCCACGCGGGCTGA
+TGTTGGGGCTGGGGATAGCCCTCAAACTCACCCCCGCGGTGTTTCTCCTCTACTTCCTGCTACGTCGGGA
+CGGTCGGGCCGCGCTGACGGCGCTGGCGTCGTTCGCGGTCGCCACGCTGCTCGGTTTCGTCCTGGCGTGG
+CGCGACTCCTGGGAGTACTGGACGCATACCCTTCACCACACGGACCGGATCGGCGCTGCCGCCTTGAACA
+CAGACCAGAACATCGCGGGCGCACTCGCGCGGTTGACGATTGGCGATGACGAACGCTTCGCACTGTGGGT
+GGCCGGATCCCTGCTCGTGTTGGCAGCGACCATATGGGCGATGCGGCGAGTGTTGCGGGCCGGCGAGCCG
+ACCCTGGCTGTGATCTGCGTCGCCCTGTTCGGGTTGGTAGTTTCGCCGGTCTCGTGGTCACACCATTGGG
+TGTGGATGCTGCCGGCCGTGCTGGTGATTGGGCTACTGGGTTGGCGTCGCCGCAACGTCGCGTTGGCCAT
+GCTCAGCCTGGCCGGGGTGGTGCTGATGAGGTGGACACCGATCGACCTGCTTCCCCAACACCGGGAGACG
+ACTGCGGTCTGGTGGCGTCAACTCGCGGGGATGTCCTACGTGTGGTGGGCGCTGGCGGTCATCGTCGTTG
+CCGGACTCACCGTTACCGCCAGGATGACGCCGCAGCGCTCGCTTACGCGCGGACTGACCCCGGCGCCGAC
+GGCCAGCTGACTAGCCAGCGGCTGTCTCGGGGATTCGTGCGGCGTCCGTTGAATTGGGATTTGCACCGGC
+ACCGCCCGCGTTGCGGCCGTCTTTGACACTGGCGGCATAGATGTCGACGTACTCCTGACCCGAGAGCCCC
+ATCAGCTCATAGATCACTTCGTCGGTAACGGCCCGCTCGATGAAATGGTTACCGGCCAACCCCTCGAACC
+GGGAGAAGTCCATCGGCTTGCCAAACCGAACGGTGACCCTGCCGAACCTCAGCATCTTCCTGCCCGGCGG
+GTTGACGACGTTGGTACCGATCATCGCCACCGGAATCACCGGAACCCCGGTGTGCAATGCCAACCGGGCT
+AGGCCGGTCTTGCCTTTGTAGAGCCGCCCGTCCGGCGAGCGAGTGCCTTCTGGATACATGCCCAGCAGCT
+TGCCCTGACCCAGCAACACCACTGCCGTCTGCAGTGCGCCCTGCGCGGAGTCGGCATTGGTGCGGTCGAT
+GGGAACCTGGCCGGAGACGCTGTAGAACCAGCGGTTGATCCAGCCTTTCAGTCCGGTGCCGGTGAAGTAT
+TCCGATTTCGCCAGGAACCAGATACGACGGCGAACTACCAACGGAAGGTAGAAGCTATCCGCCACCGCAA
+GATGGTTACTGGCGAGGATGGCCGGACCCGAACTCGGGATGTATTCCAGTCCTTCAACTTTCGGGCGACC
+AAGCAACGTAAAGAGCGGACCCATGAAAATGTACTTGAACAGGTAGTACCACATGGCCCTCCCTCTCGCC
+CACACCGGATGGTGTCTGCGCCAACTGTACCCATCCGCGATGGCTGCGACTACCTGCGCGGGCAGCGGCT
+CACTCCTCGATGGTAACCGGGATGGCCTGGTAGTGGGATTTCATGCTGCCCTCGCCGTTGGTATTCTCGC
+CGCCTGACGCACCGGTCTGGCCGCCGCCCGGCGGGCCTTCGGGTGGCGGTTTCGCCGACCGGTCAATGTC
+GTCGACTATGGCGCGGATCACCTCCAGCAGAGCCAGACTGTGATCCGCGATGACCGTCAGCAGCGGATGC
+TGCTCGCCGGTTACCAACGCTGCCAACGCGCACAACGGACACCACACTTGCTGGCACTTGCCGGTCCCGG
+GACCTCCACCCGAAGCCATCGCCGCCGCCACCCGCACCGCGGGGTCGATCCCATCGAGGATTGCCTGCGC
+CAGCTTGCGCAGCTCGGGACGAACGTCGGTATGGGCCCCGCTCACGTCGGCCACACCTCCGGATTTGGTC
+GGAAACGAACTGTTAACTCACCACCCCGCAGATGCGCGTCCAGCACCGTGCACCTCCGCAATACGGACGC
+CAACCGAACTCGGCGCCGCATCCCCCCAGCACTGACGATCAAGTCGTCGTCGGCCCGGCCCAACGTCAGC
+GTCCCGGGATCGAGCTGGGGCAACGCTAGCCGCAGTCGGTATATCGACGCCAATCCCGACCCGGATTCCA
+GGTCCACAATAGGCTGTAGCGGGCCTGGCGGCGCGCTTCCTTGGCGACGACGGGCACTATCGAGCAACCC
+GCCCAGGGCCTTGGGGCCGATCGGTTCGCCGGCCAAGTGCGGCACCAGCACCAGTGCCACGTCACCGATG
+GTGGCATCGAGGTCGTCGAGGACGGCACGCTGCTCACCGATGCGTTCGGCATACCAGTGGAAAGCCGGAT
+GGTCGGGCAGACTGCGATACTCATAGTTCTCGTCTTGCACCAGAAGCTGATTGACGAGCAGCTCTTCGAC
+CCGGACCCCCATGAGCGCCAACGACCCCAGCGTCCGGACCGCCTCAGCGGCGACCACCCGCTCCGGAGTC
+AGCACCAGGTGGGCACTGACCAGGGCACCGTCGGTCAGCAATGTGCTTAGCCGCTCGACGCTGGCGCGGA
+TGCGCTCCAGCAGTTCCGCCAGCACGGCTGACCTGCCGTCGTCGGCGCCGATGGACAACCTGCGATGCCG
+CGGCCAGGCACGTTCGACGTACAGCCCGAAGGTGGCGGGTAGCGTCAACATCCGCAAGGCGTCCGCCGTC
+GAGGCGCAGTCGACCACAATCCGATCCCATCGTCGGGCTGCCGCAAGCTCGCCGACGGCGTGCAGCCCCA
+GCACCTCCTGGATCCCGGGCAGCGCGCAGAGTTCTTCGGGCGCAATGCTGCTCAACTCGGAGCCCGGAAA
+TCTGCGGTCCAGGGTCTCGACCACGTGCAACCACCGGCCCTCGAGCAGGGCCAGGGTATCCAGCGCCAGC
+GCGTCGAGAAATCCGCCCCCGGCTTCGGGGTCGTAGGCGAGCACGCGAACAGGATCGCCCTGACCGGTAG
+GCGGGACCGCGATGCCCAGCACGTCGCCCAGCGAGTGCGCCTGGTCGGTGGATACCACCAACACTCGCTG
+GCCGGCCCCGGCATCACATACCGCGGTGGCGGACGCCAGAGTGGACTTTCCTACCCCGCCCTTGCCGACA
+AAGAGACTGATCCGGGCCTGAGCCGGCGTACCGGAATCACTCAGCCCTCGACTCGTTTCTTCAGATCCTT
+CAACGCGCCGTCTATCAACCTGCGTTCCGCCTTACGCTTGAGCATCCCGATCATGGGGACAGCAAGGTCG
+ACGGCAAGCTCGTAGGTGACCTCAGTGCCAGAACCCTTGGGCGCCAAGCGATACGTGCCTTCGAGGGACT
+TTAGCAGCGAGCTGGATTCGAGAGTCCAGCTAAGCGATTGGCGGTCTTCCGGCCACTCGTAGGACATGAT
+CAAGGTGTCTTTGAAGATGGCTGCGTCCATCAACATTCGCGCTCGTTTCGGGTAGCCCTCGTCGTCGGCC
+TCTAGGATCTCGACTTCCTTATACTCCGAAATCCATTGCGGGTAGGCTTCTATGTCGGCGATCGCCTTCA
+TCACCTCGCCTGGATCCGCGTCGATGTAAATCGTCTGTGTCGTCTTGTCCGCCACCTGGCTACTTCCCTT
+TCCCCGCAAGCGGGTCGGCCCCGGTCATCTGCGGGAGCTCCCGATCTCCCGGGGAGAAACGGTACTCCCT
+CGTGCCAACCTTGACCCGGTTAAGTTACCGGAGAAACCCCGATGGGGCGTGACCGTTCTAGCACTGTCTT
+GACCTCGAAGGCCATTTTTTTGCCCGCGACCCGTCGGTGGTGCGTCATTCTGGCCAGGTTCATCCGGGCC
+AGCTGCCAGGCTGCTACCCCGGTCGGTTCGGCGTGCAGGAAATAGTGCAGTAGCACCCCATCCATCGACG
+GTTCCAGCCAGATCTCCATGGTGCCGGTCAGGGCGCCGGTAACCGTCCACCTGATTCCCTTGTCGGCACG
+ATCCTCGGTGACCTGTAGCCGTAGGTCAGGCCACCACCGACGCCAGCTGCATCGATCCGCGACCGCGGCT
+GAAACCCGCGCGGCGTCGGCTGCGACATAGGTCTCGTCAGCGATCTGGATGCTGTTCATCGCCTCAGCTT
+CACATACCCGAGGCCGTGGGCAAGCCGGACCCCGAAGGGCACCAACCAACGGACACGCGATATCGGTCTA
+TTCCGCACCGGCATCAACCCCTCTAGGCTTGACGACAGCAAACCGGACCCGGAAGACGGCAACAGGTCAA
+GTGAGGTGTTGATCGTGCGTGAGATTAGCGTCCCCGCCCCATTCACTGTCGGCGAGCACGACAACGTCGC
+GGCCATGGTGTTCGAGCATGAACGTGACGATCCCGACTACGTCATCTATCAACGCCTGATCGACGGCGTC
+TGGACCGATGTCACGTGTGCGGAGGCAGCCAACCAGATTCGTGCCGCGGCTCTCGGTTTGATTTCACTGG
+GGGTGCAGGCCGGCGATCGGGTAGTCATCTTCTCTGCCACCCGCTACGAGTGGGCGATCCTCGATTTCGC
+GATTCGGCTGTGGGTGCGGTCACCGTACCGATCTACGAGACCTCGTCAGCGGAGCAGGTGCGCTGGGTTT
+TACAAGACTCCGAAGCGGTGGTGTTGTTCGCCGAAACCGACTCACACGCGACAATGGTCGCCGAACTCTC
+CGGCAGCGTGCCCGCCCTGCGGGAGGTACTGCAGATCGCCGGTTCGGGTCCCAACGCGCTCGATCGGCTC
+ACGGAGGCGGGCGCCTCGGTCGACCCGGCCGAGCTAACCGCCCGCCTCGCCGCACTACGGTCGACGGACC
+CGGCGACGCTTATCTACACCTCGGGCACCACCGGACGACCCAAGGGCTGCCAGTTGACCCAATCCAACCT
+GGTTCACGAGATTAAGGGCGCCAGGGCATATCACCCGACGCTGCTGCGCAAGGGTGAGCGGCTGCTGGTT
+TTCCTGCCGCTAGCTCATGTGCTGGCGCGCGCGATCAGTATGGCCGCCTTCCACTCCAAAGTCACCGTGG
+GATTCACCAGCGACATCAAGAATCTGCTGCCGATGTTGGCGGTGTTCAAGCCGACGGTGGTGGTGTCGGT
+GCCGAGGGTGTTCGAGAAGGTGTACAACACCGCCGAGCAGAACGCCGCCAACGCCGGCAAAGGGCGAATC
+TTCGCGATCGCCGCGCAGACCGCGGTCGACTGGAGCGAAGCTTGCGACCGCGGCGGACCGGGGCTGCTAC
+TGCGCGCCAAGCACGCGGTGTTCGACCGGCTGGTCTACCGCAAGCTGCGTGCGGCACTGGGTGGCAACTG
+CCGCGCCGCCGTCTCCGGCGGCGCGCCGCTGGGTGCGCGGCTTGGTCACTTCTATCGCGGCGCCGGTCTC
+ACCATCTACGAGGGATACGGCCTGAGCGAGACCAGTGGGGGCGTCGCCATCAGCCAGTTCAATGATCTAA
+AGATCGGAACTGTCGGAAAGCCGGTGCCCGGCAACAGTCTACGCATCGCCGACGATGGCGAGCTGCTGGT
+GCGCGGTGGCGTGGTATTCAGCGGCTACTGGCGCAACGAGCAGGCTACCACCGAGGCATTCACCGACGGC
+TGGTTCAAGACCGGTGATCTCGGTGCGGTGGACGAAGACGGGTTCTTGACGATCACCGGCCGCAAGAAAG
+AAATTATCGTCACCGCGGGCGGTAAAAATGTCGCCCCCGCTGTGCTGGAAGACCAGCTGCGGGCCCACCC
+ACTGATCAGCCAGGCGGTGGTGGTTGGGGACGCCAAGCCCTTCATCGGCGCGTTAATCACCATCGACCCT
+GAGGCATTCGAGGGCTGGAAGCAACGCAACAGCAAGACAGCTGGCGCGTCGGTGGGCGATTTGGCCACCG
+ACCCCGATCTGATTGCCGAGATCGACGCGGCCGTCAAACAGGCCAATCTTGCGGTGTCACATGCCGAGTC
+GATCCGCAAGTTCCGAATACTGCCCGTCGACTTCACCGAGGACACCGGCGAGCTGACCCCGACAATGAAG
+GTCAAACGCAAGGTGGTGGCCGAGAAGTTCGCTTCCGATATCGAGGCGATCTACAACAAGGAATAGCCGA
+CTGTGCCCGGCTCCTCCCCGGCCCGCTCAACGGGCCGCATCGTCGCCGCGCAGAAAATCTGCTAGCTTGG
+CGGCCAGCGTGTCCCAACGCCACTGCGCCGTGACCCATTCTCGGCCGGCGGCGCCCATCGCGACGGCCCG
+ATCCCGATCGATCAGCAACTCGGCCACGGCGTCGGCCACCCGGTCCACCGACCTACCGTCGACCACTAGC
+CCAGTCTTGTTGTGCTGCACCGTTTCCGGCGCTCCGCCAGAATTGCCGGCGATTACCGGCACGCCGGCGG
+CGGAGGCTTCGAGGAACACGATGCCCAAGCCCTCGACGTCCATCCCGGCGCCGCGGGTGCGGCATGGCAT
+GGCGAACACGTCGGCCAGTGCGTGGTGGGCGGGAAGTTCGTCGGTTGCCACGCCGCCGGTGAACGTCACG
+TGGTCGGCCACCCCACAGTCGTGAGCCAGCTTGCGCAACGTCTCTAGATATGGACCGCCGCCGACAATCA
+CCAACGCGGCTCCATCAACGCGACGCCGGATCGACGGGAGCGCCGTGACCAGGGTGTCCTGGCCTTTGCG
+CGGCACCAACCGCGACAGACACACTACCGTGGGCCGCTCGCCTAGCCGATAGCGCTTCCGCAACTCGGCG
+CGTGCGGCCGGATCGGGGCGGAACCGGTCGGTGTCCACTCCCGGCGGTAGGTATTCCAACGAAGCCGCGG
+GCCCGAACGCAGAAGCAAACCGGGACCGCGTGTAGCTGCTGACGAAAGTCACCACGTCGGTGCCGTCGCC
+GATGCGGCGTAGCACCGATCGAGCGACCGGAAGCATCGACCAGCCCACTTCGTGGCCGTGCGTGCTGGCC
+AACACCCGGCTAGCTCCAGCCAGCCGGGCACGCGGGGCCAGCAGGGCCAGCGGTGCGGCCGCACCGAACC
+AGACGGTTTCGATGTCGTGCTCGGCGATCAGCCGGCGCATCCGGACATCGACCGTTGGACCCGGCAGCAT
+CACCGTGCTGGGATGGCGCACCACCCGGTAACCGGCAGCACGGGCTGCGTCGTCGAAGGCGTCGGCGCCT
+TTCCACTGCGGTGCATACACTGTCATCGCATGCGCTCGGGAGCCGACCAGCCGACCGACGAACTCCCCCA
+GATAGGACTGGATGCCCCCGCGTCGGGGTGGAAAGTCGTTAGTTACCAACAGGACCCGGCTCACCTGGGT
+CAGGCTAGCGGGTCCACCTTGCGTGAGCAGACGCAAAGTCGCCCAAAATCGCCGGTTTCCGGGTGATTTT
+GCGTCTGCTCGCGGCGGAAGCTAGCCCATTAGCCACCGCTGCCAGCGCGCGAGCAGGCCAGCGGCGTCAA
+TGCCGAGGACGTCGTGGGCGGCGGTAGCCAGGTCGAAGTGTCCGACACCACAAGTGGCCAGATAAAGCTC
+ACGCAGCTTGGCGGTACCGTAGGCGGCCGCGACGAACCGAGCGAACCACCACGCGCGGTCATATGCCAGC
+GAGCGCTGTGGCCCCGGAGTGTCCAGGTCGGTGTCCGACGGTAACGACAGCGCCACAGACACCGCATCCG
+CGGGCGGCGGGGTCTTGGGCCTGGCAACGAAATCGGCCACCCCCTCGGCCAGCCATCGAGGTGCATCCAG
+GGCCGTGTCGGCCCGGGCCGCATAGTGAAAAAGCTCGTGGCCCAACACTATTCGTAGCGCCGCTGGGCTC
+ATGTGTGCCGCGCCCGGCGCGAACACAATCCGTTGGCCGACCACCGTGCGACGAGCAGGATCGACACGGT
+CGACCACCGTGATCGCGGCGATGTCCGCCCATTGCGACGCCAAACCCCCGCCTGCGGCGGCATGAAACTG
+CTCGTCGCTACCGGCGGCAACCACAAAGATGTCGTGCGACCAATCGGTGCCCCAGAATGCCACCACCTCG
+TCGACCGCGGCGTCGATGCCCGCCGCGATGCGCGACAGCAAGCGGTCGGTGGCCGCGCCACCAAGGCTGA
+GCAGCCGCACCGTGCGGTCGTCGGCGACCCGCAGCGCGACAAACCCATCGGCTGGCGCGACCACCTGTGC
+CGGTGCTGCAGGTCCATCGCGCACCGGATTACCAGACAGGGCCGCCGCGCCAATCAGCTCCGCAACAAAC
+AGACAGGCCAGCAAGATCCGAGGGCAAAGCCGCCGCGCGACGAGCCGGTCAGTAACGGCGGGCGTCGTAG
+ATCGGCCCCGACGAGTCCATCGGCACCACCCGCACCGGAACACCGTAGGTGGAGGAATGAACCATAAGAC
+CATCACCGATGTAGATGCCTGCGTGTGACGCGTCGGAATAGAAGGTCAACACGTCGCCGGGCTGCAGATC
+CGACAACGCGACCGGCTGACCACCGTGAGCCAGCGCCTGGCTGGAGTGCGGTAACGCGATACCAGCCTGC
+TGGAACGCCCACATCACCAAGCCTGAGCAGTCGAACCCGCCGGGCGCGGCACCACCCCACGCGTAGGGCG
+CGCCGACCTGCGTCAACGCCGCTTGGACAACGGCCGTACGGTCGCCGCCAGCGCCGTCGGGCTGCACGAA
+AGGCAATCCGGGCATCCCACCAGGCGGCGGCGCCACGCCAGGCGCCGGGCCGTCGCCAGGCGGCGCACCG
+GGCGGCAACGCCGCAGGTGGGGCCCCGGGGGCGATCGCAGCAACCGCCGGGACCGGTCCTGGATCAGCGA
+GGGCCGTGCGCTCCTCCGGCGTCAACGCGACGTATTGCGACTTGACGACGGCAATCTGCACCTGCAGCTG
+GCTCTGTTTGTGCTGCAGATTCGCTCGTACCGCGGCAGCTTGCTCGGCCGCGGACCTGGCATCGGCCGCC
+GATTTGGCTGCAGCCTGCTCGGCCTTGACGGCCTGTTCTCCAGCGGCCTTGAAACGGGCCATCTGCGTGG
+ACATTTGATGCGCCATCACCCGCTGTACCGATAGCCGATCGATCAACAGTTGCGGGGACTCCGCCGTCAG
+GATCGCATCCATGCCGTGGGTACGACCACCCATGTAGGTAGCGGCCGCGACCTTGTTCACCGCCGTCTGA
+AAAGTCGCCAAGCGTGCTCTCGCAGCATCCAAGGCCGTTCTGTTGTCCGCAAGCTTCTGGTCGGCGGCCC
+GCTGGGCAGCGAGCTTTTCGTTGAGATCCAGCTGCGCACTGTGCAGCGCCTCGGTGGTCTGCTCGGCCTG
+CCGGGATAACTCGTTGAGCTTGGCCAGCGCGTCGTCGGCCGGATCAGCCAGCACATTCGCGGCCAGGACG
+CCGGAGGAGACGGTGAAGCTCGCAAAGAAACCTATGGCGGACCGCATGATTACACGCGCGATCAACCACC
+TCTGGTCGAGCCTCAAAATTTGCTTCCTTAAACGGGCCATCGACGGATGACGTCGAGCTGGTTTAGGTCT
+CAAACAGGTTACGAAACGATCTCGGAATTGTCCAAAAGGGGAAGTTAAGAAAATGGATAGATTTCTACCA
+TTTCGCTGTGGACGATCGTACTTCTGCTATAGGGCTCCAGGGGCATCGACACGCAACGACCTTACGCGAC
+ACCGGATCCGCGCTGGCGGCGGACCGGCACCAGGCGCAACCGAGGGGCCAATCCGACATCGGCGAGCACT
+TCCAACGCAGCACGCTCGTCATGCGACAGGCTTTCCGGTACCCCGATGAGCACGCTGACCACACAGTCGC
+GGCATCCAGATCCGCGCGCCGCGCAATCGTCACAGTCGATTACCACCGGCGCCCCCGGCCCGGGGGCTGT
+GCCGCCGCTAGTGTCTGGTCCGCTGCGTGCCATGGGGTCGTTCCTCTCGGCTTGGCTCATGAGGTCGTCC
+GAACGCTAATCGCGAGCACCGACATCCGTTGCCGCCGCGTGCGCGCTCGGCGTAGGGAGCGTTTGCGTGT
+CAGTGCAGGGGCCTAACGTCGCGGCCATGGGTGCAACCGGTGGGACTCAGCTGAGTTTCGCCGACCTGGC
+ACACGCCCAGGGGGCAGCCTGGACCCCAGCCGACGAGATGTCCCTGCGCGAGACCACCTTCGTCGTGGTC
+GACCTGGAAACCACAGGTGGGCGCACGACGGGTAACGACGCAACACCGCCGGACGCGATCACCGAAATCG
+GGGCGGTCAAGGTATGCGGCGGCGCGGTGCTCGGTGAATTCGCCACCCTGGTAAACCCGCAACACAGCAT
+TCCGCCCCAGATCGTGCGGCTCACCGGTATCACTACGGCGATGGTGGGTAATGCCCCGACGATCGACGCC
+GTCCTGCCGATGTTCTTCGAGTTCGCCGGCGACTCGGTGCTCGTGGCCCACAACGCTGGGTTCGATATCG
+GATTCCTGCGCGCCGCCGCGAGGCGGTGCGATATCACCTGGCCCCAACCACAGGTGTTGTGCACGATGCG
+GCTGGCCCGGCGGGTGCTGAGCCGAGACGAAGCCCCTAGCGTGCGTCTGGCCGCGCTAGCGCGGCTGTTC
+GCCGTCGCCAGCAACCCCACCCACCGCGCCCTCGACGACGCTCGCGCCACCGTCGACGTGCTGCACGCAC
+TCATCGAGCGAGTGGGCAACCAGGGCGTGCACACCTATGCCGAGCTGCGCTCGTATCTGCCCAACGTGAC
+CCAGGCGCAGCGCTGCAAACGGGTACTGGCGGAAACACTGCCGCACCGGCCGGGGGTGTACCTGTTCCGC
+GGACCGTCGGGCGAGGTGCTCTATGTCGGCACCGCGGCGGACTTGCGCCGCCGGGTAAGCCAGTACTTCA
+ACGGCACCGACCGCCGCAAGCGGATGACGGAGATGGTCATGCTGGCCAGCTCGATCGATCATGTCGAATG
+CGCGCACCCCCTGGAGGCCGGTGTCCGTGAGCTGCGGATGCTGTCGACGCATGCCCCGCCGTATAACCGC
+AGGTCGAAGTTCCCATACCGGTGGTGGTGGGTGGCGCTCACCGATGAAGCATTTCCACGCCTGTCGGTCA
+TCCGGGCCCCGCGACACGACCGCGTCGTCGGCCCGTTCCGATCCCGCTCCAAGGCCGCCGAGACGACGGC
+GCTGCTGGCACGCTGCACGGGACTGCGAACCTGCACCACTCGGCTGACACGTTCCGCCCGGCACGGACCC
+GCCTGCCCCGAGCTGGAAGTGTCGGCCTGCCCGGCCGCCCGCGACGTCACGGCCGCGCAATACGCCGAGG
+CGGTACTGCGCGCGGCGGCCTTGATCGGCGGATTGGACAACGCCGCGCTGGCCGCGGCCGTTCAACAGGT
+CACTGAGCTCGCCGAGCGCCGTCGCTATGAGAGCGCTGCCCGACTGCGTGACCACCTCGCCACCGCCATC
+GAGGCGTTGTGGCATGGCCAACGATTGCGAGCACTGGCCGCGCTGCCCGAGTTGATCGCCGCCAAGCCGG
+ACGGCCCCAGGGAGGGCGGCTACCAACTGGCCGTCATTCGCCACGGCCAACTCGCCGCTGCCGGCAGGGC
+ACCGCGCGGGGTTCCTCCGATGCCTGTGGTCGACGCCATCCGCCGCGGCGCTCAGGCGATCCTGCCTACG
+CCGGCACCGCTCGGCGGGGCACTGGTGGAGGAGATCGCGCTCATCGCCCGCTGGCTGGCCGAGCCGGGAG
+TGCGCATCGTCGGGGTCTCGAACGACGCCGCAGGGTTGGCCTCCCCAGTGCGCTCGGCCGGCCCGTGGGC
+AGCGTGGGCGGCAACGGCGCGCTCGGCCCAGTTGGCCGGCGAGCAGCTCAGCAGAGGTTGGCAGTCAGAT
+CTGCCGACCGAACCGCACCCATCGCGCGAGCAACTGTTCGGCCGCACCGGTGTCGATTGCCGCACTGGCC
+CGCCGCAACCCCTCCTCCCAGGCCGGCAGCCATTCAGCACGGCTGGATAATCCGGCGTGGGCGACGATCG
+CACCGGCGGCGTTGAGCACCACAGCGTCCCGGACCGGGCCCCTGGCACCGCCCAACACCGCGCGCACCGC
+GGCCGCGTTGGCTTGCGCATCGCCTCCAGCCAGCTGGTCAAGCTGGGCGCGCGCAAACCCGAATCCGGCG
+GGATCAAACGTCAACTTATCCACGCTGCCCGCCGCAACGCGCCAGATCGTGCTCGTGGTGGTGGTGGTCA
+ACTCGTCCAGCCCATCGTCGCCGTGTACCACCAGCACACTGGACCGGCGCGCAGCAAACACCCCGGCCAT
+CACTTCGGCGAGGTCGGCGAACGCGCATCCGATCAGTCCAGCCCGGGGCCGGGCCGGATTGGTCAGCGGC
+CCGAGAAGATTGAACACGGTGGGCACACCGATCTCGCGGCGTACCGCGGCCGCGTGCCGGTAGGAGGGAT
+GGAACCGCGGCGCGAAGCAGAACCCGATCCCAACCTCCGCGAGGCTGCGCGCGACCAGGTCGGGTCCCAG
+GTCGATGCGCACCCCCAGCGCCTCCAGCGTGTCGGCGCCACCGGACAACGAGGACGCCGCTCGGTTGCCG
+TGCTTGACCACCGGCACACCCGCAGCCGCCACCACAATCGCCGCCATGGTGGATAGGTTCACCGTGTTGA
+CTCCGTCGCCACCGGTGCCGACGACGTCGACGGCGTCGTCGGGGACCGTATCGGCGGGCAACGGATGCGC
+GTGGCTGAGCATGACGCCAGCGAGCTCACCGACTTCGTCGGCGGTCGGAGCCTTCATCGTCATCGCCACC
+GCGAAGGCGGCGATCTGCGCCGGCCGCGCATTGCCGGTCATGATCTGGTCCATGGCCCAGGCAGCCTGGC
+CCCGCGCCAGATCGCGGTTGTCGGTCAACCGCCCCAAAATCTGCGGCCAGGACGGCACCGATGCGGCTTC
+TGCTTTCGGCGAGCCCCCGCGAGATCCCCCCGAAGAACCCTCAGCTGACAGCGCCACGCGCTGATGGTCC
+CATGAGGATCAACCAACCCCAACCGCGCCCTGAACACGTCGACGACTTGCGCTAACCAAACGGCCGGGCG
+ACACGCGGAACTGACTTACCGAAATTTCCGACCCGGGTAGAGTTCGACAACTACAAAGCGTCATACTTGC
+GGATGTGACGAGTGCTGTTGGGACCTCGGGTACTGCCATCACATCGCGCGTGCATTCGCTGAATCGGCCC
+AACATGGTCAGTGTCGGCACCATAGTGTGGCTATCCAGTGAATTAATGTTCTTTGCTGGGCTGTTCGCGT
+TCTATTTCTCGGCACGAGCTCAGGCCGGCGGGAATTGGCCGCCGCCACCGACAGAACTGAATCTGTACCA
+GGCCGTCCCGGTCACGCTGGTCCTGATTGCCTCGTCGTTCACCTGCCAGATGGGCGTGTTCGCGGCCGAA
+CGCGGCGACATCTTCGGGCTGCGCCGCTGGTATGTGATCACATTCCTGATGGGCCTGTTCTTCGTTCTGG
+GCCAGGCCTACGAGTATCGCAACCTGATGTCGCACGGGACGAGCATCCCCAGCAGCGCATACGGCAGCGT
+GTTCTATCTGGCCACCGGATTCCATGGACTGCACGTCACCGGCGGCCTCATCGCCTTCATCTTCCTGCTG
+GTACGCACTGGGATGAGCAAATTTACTCCGGCGCAGGCCACAGCCAGCATCGTCGTCTCTTACTACTGGC
+ATTTCGTCGACATCGTGTGGATCGCGCTATTCACCGTGATCTATTTCATCCGATGAGCCGGCGTCCGACG
+AACATCCCACGAACAGGAGTGCTCGGTTGACGAAACTGGGGTTCACCCGATCCGGTGGCAGTAAGAGTGG
+TCGCACGCGACGGCGCCTGCGCCGCCGATTGTCCGGCGGAGTGTTGCTGCTGATAGCGCTGACCATCGCC
+GGTGGATTGGCAGCTGTGCTGACCCCTACCCCACAGGTGGCCGTCGCCGACGAATCCTCCTCGGCGTTGC
+TGCGCACCGGCAAACAACTTTTCGACACCTCGTGTGTGTCCTGCCATGGCGCCAACCTGCAGGGCGTGCC
+CGACCACGGGCCGAGTCTGATCGGGGTCGGCGAGGCCGCCGTCTACTTCCAGGTGTCGACCGGCCGGATG
+CCGGCCATGCGCGGCGAGGCACAGGCGCCGCGCAAAGATCCGATCTTCGACGAAGCACAGATCGACGCGA
+TCGGCGCCTACGTGCAAGCCAATGGCGGTGGGCCGACGGTGGTACGTAACCCCGATGGCAGCATTGCAAC
+GCAGTCGCTACGTGGCAACGACCTGGGCCGCGGCGGCGACTTGTTCCGGCTCAACTGCGCCTCGTGTCAC
+AACTTCACCGGCAAGGGCGGAGCATTGTCGTCCGGCAAATACGCACCCGACCTTGCGCCCGCCAATGAAC
+AGCAAATCCTCACCGCGATGCTGACGGGTCCACAGAACATGCCGAAGTTCTCCAACCGCCAGCTCTCCTT
+CGAAGCGAAAAAGGACATCATTGCCTACGTGAAGGTCGCCACCGAGGCGCGGCAGCCCGGTGGTTACCTA
+CTCGGCGGATTCGGACCCGCACCCGAAGGCATGGCCATGTGGATCATCGGAATGGTCGCCGCGATCGGGC
+TGGCACTGTGGATTGGGGCGCGATCATGAGCCGCGCCGACGACGATGCAGTGGGGGTACCACCCACTTGC
+GGGGGACGAAGCGATGAGGAGGAGCGGCGCATAGTGCCCGGACCTAACCCGCAAGACGGGGCCAAAGACG
+GGGCTAAGGCAACCGCCGTCCCCCGTGAACCGGACGAAGCCGCGCTGGCCGCGATGTCCAACCAGGAGCT
+GCTCGCATTGGGCGGCAAGCTGGATGGTGTCCGGATCGCCTACAAAGAGCCCCGCTGGCCGGTCGAGGGC
+ACCAAAGCCGAGAAGCGCGCCGAGCGTTCAGTGGCGGTGTGGCTTTTGCTAGGTGGCGTGTTCGGACTGG
+CGCTGTTGCTGATCTTCCTGTTCTGGCCGTGGGAGTTCAAGGCGGCGGATGGCGAAAGCGACTTCATCTA
+CTCGCTGACTACCCCGCTCTACGGCCTGACTTTCGGATTGTCCATCCTGTCGATCGCCATCGGCGCCGTG
+TTGTATCAGAAAAGGTTTATTCCCGAAGAGATTTCAATCCAGGAACGTCACGATGGCGCTTCGCGGGAGA
+TCGACCGCAAGACGGTGGTGGCGAACCTGACCGACGCGTTCGAGGGCTCGACGATCCGACGGCGCAAGCT
+GATCGGGCTGTCCTTCGGCGTGGGCATGGGTGCGTTCGGGCTAGGCACCTTGGTCGCGTTTGCTGGTGGC
+CTCATCAAGAACCCCTGGAAGCCGGTTGTCCCCACCGCCGAGGGCAAAAAGGCGGTGCTCTGGACGTCGG
+GTTGGACCCCCCGCTACCAGGGCGAGACGATCTATCTGGCGCGCGCCACCGGCACGGAGGACGGACCACC
+GTTCATCAAAATGCGCCCGGAGGATATCGACGCCGGTGGAATGGAGACCGTTTTTCCCTGGCGGGAGTCC
+GACGGCGACGGCACCACCGTCGAATCACACCATAAGCTGCAGGAAATCGCGATGGGTATCCGTAACCCGG
+TGATGCTCATCCGGATCAAACCCAGTGACCTGGGCCGCGTGGTCAAGCGCAAGGGCCAGGAGAGTTTCAA
+CTTCGGCGAATTCTTCGCGTTCACCAAGGTCTGCTCTCATTTGGGTTGCCCGTCATCGCTGTACGAGCAG
+CAGAGCTACCGAATCCTGTGCCCTTGTCACCAGTCGCAGTTCGACGCATTGCATTTCGCTAAGCCGATCT
+TCGGTCCAGCGGCCCGCGCCTTGGCGCAACTGCCGATCACGATCGACACGGACGGGTATCTGGTCGCCAA
+CGGTGACTTTGTCGAGCCCGTCGGACCAGCATTCTGGGAGCGAACAACAACATGAGTCCGAAACTGAGTC
+CGCCGAACATTGGTGAGGTCCTGGCCCGCCAAGCCGAAGACATCGACACCCGGTATCACCCCTCGGCGGC
+GCTGCGTCGTCAGCTCAACAAGGTCTTCCCGACCCACTGGTCGTTCTTGCTCGGCGAGATCGCTCTGTAC
+AGCTTCGTGGTCCTGCTGATCACCGGCGTGTATTTGACGCTGTTTTTCGATCCGTCCATGGTCGACGTCA
+CCTACAACGGTGTCTATCAACCGCTGCGGGGCGTCGAGATGTCGCGTGCCTACCAGTCCGCGCTGGACAT
+TTCCTTCGAGGTGCGCGGTGGCCTGTTCGTGCGCCAGATCCATCACTGGGCCGCTTTGATGTTCGCGGCG
+GCAATCATGGTGCACCTGGCACGCATCTTTTTCACCGGAGCGTTCCGGCGGCCCCGCGAGACCAACTGGG
+TGATCGGTTCGCTGTTGTTGATCCTGGCGATGTTCGAGGGCTATTTCGGCTACTCACTGCCTGACGACCT
+GCTGTCGGGACTCGGTCTGCGCGCGGCACTCTCGTCGATCACGCTGGGTATGCCGGTAATCGGGACCTGG
+CTGCACTGGGCGCTGTTTGGCGGTGACTTCCCCGGCACCATCTTGATCCCCAGGCTCTACGCCCTGCACA
+TTTTACTGTTGCCGGGGATCATCTTGGCGCTGATCGGGCTGCATCTGGCGTTGGTGTGGTTCCAGAAGCA
+CACCCAGTTCCCCGGCCCGGGCCGCACCGAGCACAACGTCGTCGGCGTGCGGGTGATGCCGGTGTTCGCG
+TTCAAGTCCGGCGCATTTTTCGCGGCTATCGTCGGTGTTCTGGGCCTGATGGGCGGCCTGCTGCAGATCA
+ACCCGATCTGGAATCTGGGGCCCTACAAGCCATCACAGGTGTCGGCGGGCTCGCAGCCAGACTTCTACAT
+GATGTGGACCGAGGGTCTGGCCCGGATCTGGCCGCCGTGGGAGTTCTACTTCTGGCATCACACCATTCCC
+GCCCCGGTCTGGGTCGCCGTGATCATGGGCCTGGTTTTCGTCCTGCTACCCGCCTACCCATTCCTGGAGA
+AGCGGTTTACCGGCGACTACGCGCATCACAACCTGTTGCAGCGGCCACGGGACGTTCCGGTGCGCACCGC
+GATCGGCGCCATGGCGATCGCCTTCTATATGGTGCTCACTCTCGCGGCGATGAACGACATCATCGCGTTG
+AAGTTCCATATTTCGCTGAATGCAACCACGTGGATTGGCCGCATCGGCATGGTGATTCTGCCGCCGTTCG
+TCTACTTCATCACATATCGGTGGTGTATCGGATTGCAGCGCAGCGATCGGTCGGTGCTCGAGCACGGCGT
+CGAGACCGGCATCATCAAGCGGCTGCCCCATGGCGCCTACATCGAGCTGCATCAGCCCCTCGGCCCGGTC
+GACGAGCATGGCCACCCGATACCGCTTCAGTATCAGGGAGCGCCGCTGCCCAAGCGAATGAACAAGCTGG
+GCTCGGCCGGATCGCCGGGTAGTGGCAGTTTTCTGTTCGCCGACTCCGCGGCAGAGGATGCGGCGCTGCG
+CGAGGCAGGGCACGCCGCCGAACAACGTGCCCTTGCCGCACTGCGCGAACACCAGGACAGCATCATGGGT
+TCGCCAGACGGCGAGCACTAGCCCGGCGACGACCCGGGTCGGCACGACCCGGGAAGGAACCGGGCAAATC
+AAGCACAGCCCGGCGACGACCCGGGTCGGCACGACCCGGGAAGGAACCGGGCAAATCAAGCACAGCCCGG
+CGACGACCCGGGTCGGCACGACCCGGGAAGGAACCGGGCAAATCAAGCACAGCCCGGCGACGACCCGGGT
+CGGCACGACCCGGGAAGGAACCGGGCAAATCAAGCACAGCCCGGCGACGACCCGGGTCGGCACGACCCGG
+GAAGGAACCGGGCAAATCAAGCACAGCCCGGCTAACTGGACTGGGGCGCCACCACCCGGCGCAGCTGCCG
+AGAGTATAGCCACTCGATCACCGGCATGCCCGCGGTGACCACCCCGGCCAACCCGTAGCTGATCCAAGAT
+GGCCCGTCGTGACCGACCGCCATGAGGTAGGTCGCCGCCGCCACGGCAATCAACGCAATGCCAATCGCAC
+TGGTCAACACGACTGTCCCGCGCAACCAGATCCGGTCCACCGCCTCACTGGACCACTCGGCGGCCACCTC
+GAATGCATCCGCGTGCTGTACGGGTGCCGACTCGGCCACAGCGCGTTTCGCCGGATGCCCGGATCCGATC
+GATCGCCCGCCCCGCACGGATGCACCCGTCGGCCTCGTCGCGGGCTCGGCCTCAGCCATGCGGCGAGCTC
+GCAACAGCACCGGTATCGCGCCCACGATGACCAGTGCGGAGACCACAATTACGGCGTACAGCACCCACGT
+GGTGTGCGGGTTTCCGGCCATCTCGTGGAAGCCCCTACCCAGGTCCATCAGGGCGACAGCGGCGGCCACC
+GACACGCCGGTGAACACCAGCCACACCGCGGCACATGCCCCAACCAGGATGCGATCGATGACGTCCGGCG
+AGATTACATCCGGCCCACGCCGGTATGCGGAATATCTGCTCACCATCAGCAGCTCGTTTGCGGTCCATCG
+TTGGAGTTCGATGAGAGCACCGTTCCGTCGCTCGTGGTGATCGAGCAGTTGAGTTTGCTGACCCGGAAAA
+GGCTGGAGGCCTCCACCGAGCCAACGTCGGATTGCGAGATCGGGGTGACCGTCATGGACCACGGGATGTA
+CACATTGTGCTGTGTCCGTCGGCGCCCGGCGGCATCGACGTAAGTCACCGAGATAATGTCACCCGGCGCC
+TTGGTACCGGTCACCGAATAGGTGACTTGCCGCGGACCGGTCGGCGTGGTGGTCGTGGGCGGCGGTGCCG
+CCGCCGTTGTGGTGGTCGCCGGCGGCGGCGCCGTGGTTGTCGCCGGTGGGGGCGGTGGTGGCGGCGTCAC
+AGTGACCGTCTGTGTCTCCGTCGCTGTCGGGATCTCGGTGGTGGGCGGTGGGGCTGGTGGCGGCGGTGGC
+GGCGCCGGCTTGGTGGTCGTGATTTCGTCCTGCACGGGCGGTGCAGAGGACGTAGTGTCGCCGGTGGCGA
+GTTTGCTGGTATGTGGTCGCGTGACGAGCAACGACACCGAAACCACGAGCGCAACGGCGGCAATTATGGC
+GGCGACACCGACCACCCACGGCCAGCGCGGAGCGGCCAGTTCGTCGTCCAGGTCGGACGACTCCTCATAG
+TCGTCGTAGTCATAGAGCCTGAGATCGGCTGGCACATACGGGCCGCCGGTGACGTGCTCGGATTCCGGAG
+CAGAGTATGCCCGAGAATATGCGTCGGTCTCGCCCGTCTGGTCACTGGGCAGTTTGTCGCCGCCCCCGGC
+GACGGGCGGCAAGTGGTTGCCGGAAGCCCGTTCGTCGCCCGTGTCGCTGACGGGTTCCGATTCGGGTTCG
+TCAGGTTCCCGTCCCGGGGGATTCGGCCCGCTCATGTTTGCCTACCCTGTCCAACTGCCTCACCAACACG
+CGTGGCTTTCCGCCTGCATCCTTGCCCGCGCGCTCGGCGCATTCTTCATTGGTGCCACGGAAACCCTACC
+CAACCGGGCAGGACCGAGAAGTCTGGGCAACCGTGCTACTGGTCAACTGATGCCCTGATTGTGACCTTCC
+CGGCGCCGGATCAGTGCTTCTCAGGACCGACGTAATATTCGAAGACCAATCCGGCCGCCGAGGCGAGGAT
+GAATGCCACACCGGCGGCGATCAGCCACGGGAGCCACAACGCGATGCCGACCGCTGCCACCGAGCCGGAC
+AACGCGACCATGATCGGCCACCAGCTATGCGGACTGAAGAATCCAAGTTCTCCTGCGCCGTCGCTGATTT
+CAGCGCCTTCGTAGTCCTCGGGCCGGGAATCTAACCGGCGGGCCACAAACCGGAAGAAGGTGGCGACGAT
+CAACGCCATGCCGCCGGTAAGCGCCAGCGCAGTGGTGCCAGCCCACTCGACACCACCGGTGGCGAACATC
+GAGGTCAACACGCCGTACAGCACCGCCGTCACCACGAAGAACGCGGCGACAAACTCAAACAGTCGGGCTT
+CGATATGCATGAGCGTCCTAACCTACGGGCTGCGGGGCCAATTCACCGCGGCGAGTATCAAACGGGTGGG
+TGGTCACCGCAAGGGGCGGCTGGTTGATCGCCCGCAGGGCCTCGGCGTTTGTCTTCCCGTCGATGCGTTG
+CTGCAGGTAGGCCTTGAAATCGTTGGGGGTCACGACGCGGACCTCGAAGTTCATCATCGAGTGATACGTG
+CCACACATCTCGGCGCAGTGGCCCACGAATGCTCCGGTCTTGGTGATTTCTTCGATCTGGAAGACGTTGA
+CCGAGTTGTTTGCCACCGGGTTAGGCATCACGTCACGCTTGAACAAGAACTCCGGCACCCAGAATGCGTG
+TATCACATCGGCTGAGGCCATTTGGAATTCGATACGCTTGCCGGACGGCAGCACCAGCACCGGAATTTCG
+GTGCTGGTGCCCAACGTCTCGACCTTGTCGAAATTCAGGTAGGTCCGGTCCTCGGTGTTGAGCCCGCGCA
+CCGGCCCGACCAGCTCTTCGCCGTACTTGTCCTTGCCCTCTGGCTTGGAAACCATGGCGCGCTTGCGCTC
+CGGATCGGCACCATCATAGGTCAGTGTGCCGTCTTTGAAGTTCACCCTTTGATAGCCAAACTTCCAATTC
+CACTGGAAAGACGTGATATCAATCACGACCTCGGGATCCTTGGCTATCTGCAGCATCTTCTCCTGCACCA
+CGACGGTGAAATAAAACAGCACCGAGATGATGAGGAACGGTATGACGGTGAGAACCAGCTCTAGCGGCAT
+GTTGTAGCCGAACTGGCGGGGCAACTCAGTGTCGGTGTTCTTCTTCCGGTGAAATACCGCGGACCAGAAG
+ATGAGACCCCACACGATTACCCCAACCGCCAGGGAGGCGATCACCGCCCCGATCCACAGTTCTCGATTGA
+GGTGTGCCTCCGGGGTAATGCCCTCCGGCCAACCGATGCCCAGGGCTTCCGACCAGCTGCATCCACTGAC
+GGTGACGGCCAATGCCCCCAGCATTGCTGCGAGCGCCAGCTGTCGAAGACCACGGGCAGGCCCTCCGGAG
+CCGCGCTGAGGCCTGCACTGCGACAAGCGTTGCAAACGACCTGGCCCGCGAGGTGTCACTGTTGGCGCCT
+CCTGTATCACAAGCTGGGCCGACTGGGATAGCACCGGCTGCGGCGAGAACCATCGGCTAACTCAGACATC
+GAATACTACGCAGCGTAGACCACGCCGCCCGCGCGGGCGACGATGCGGGCCGAAACGGCCCGCTGAGGAG
+CCGCGCCATCAGCCCCGCGGGCGACTGCCTGGTCGTCGCGACCCGCCGGACGAGGCATCCACAAGAGTCG
+CCAAGTGGGGCATACTGGGGCGCCGTGTGTGGACTGCTGGCCTTCGTCGCGGCCCCGGCCGGTGCTGCGG
+GGCCCGAAGGTGCCGACGCTGCCAGCGCCATCGCCCGCGCATCGCATTTGATGCGCCACCGCGGGCCCGA
+TGAATCGGGCACCTGGCACGCCGTCGATGGCGCCTCCGGAGGCGTCGTGTTCGGGTTCAACCGACTGTCC
+ATCATCGACATCGCGCACTCGCATCAGCCGCTGCGGTGGGGGCCGCCGGAGGCTCCGGACCGCTACGTGC
+TGGTGTTCAACGGCGAGATCTACAACTACTTGGAGCTGCGTGACGAGCTGCGCACCCAGCACGGCGCTGT
+GTTCGCCACCGACGGCGACGGTGAGGCGATCCTCGCCGGCTATCACCACTGGGGCACCGAGGTGCTGCAG
+CGGTTGCGCGGCATGTTCGCATTCGCGCTGTGGGACACCGTCACCCGCGAATTGTTCTGCGCGCGAGATC
+CGTTCGGCATCAAGCCGTTGTTTATCGCCACCGGAGCCGGCGGCACGGCGGTGGCCAGTGAGAAGAAATG
+CCTGCTGGACCTCGTCGAGTTGGTGGGGTTCGACACCGAGATCGACCATCGGGCGTTGCAGCACTACACC
+GTCCTGCAGTACGTGCCGGAACCCGAGACACTGCACCGTGGGGTACGTCGGCTGGAATCAGGCTGCTTCG
+CCCGGATCCGTGCCGACCAGCTCGCGCCGGTGATCACCCGTTATTTCGTGCCGCGATTTGCGGCCAGTCC
+GATCACCAACGACAACGACCAGGCCCGCTATGACGAGATCACGGCAGTGCTTGAGGACTCGGTGGCCAAG
+CATATGCGCGCCGATGTCACCGTCGGCGCGTTTCTGTCCGGGGGTATCGACTCCACGGCCATCGCGGCGC
+TGGCCATCCGGCACAATCCGCGGCTGATCACCTTCACCACCGGTTTCGAGCGCGAGGGCTTCTCCGAGAT
+CGACGTCGCGGTGGCTTCGGCAGAGGCCATCGGTGCCCGTCACATCGCCAAGGTGGTCAGCGCCGACGAG
+TTCGTCGCCGCCCTGCCCGAGATCGTCTGGTACCTCGACGAGCCGGTCGCTGACCCAGCGCTGGTACCGT
+TGTTCTTCGTCGCCCGCGAGGCCCGAAAGCACGTCAAAGTGGTGTTGTCGGGCGAAGGCGCCGACGAACT
+GTTCGGCGGCTACACAATCTATCGAGAACCGCTGTCGTTGAGGCCGTTTGACTACCTGCCCAAGCCACTG
+CGCCGGTCGATGGGAAAAGTTTCCAAGCCACTGCCGGAGGGCATGCGCGGCAAGAGTCTGCTGCACCGCG
+GATCGCTGACACTCGAAGAGCGCTACTACGGCAATGCCCGCAGTTTCTCCGGCGCGCAGCTGCGCGAAGT
+ACTGCCCGGGTTCCGGCCGGACTGGACCCACACAGATGTCACGGCGCCGGTCTACGCCGAATCGGCCGGC
+TGGGATCCGGTGGCGCGAATGCAGCACATCGACCTGTTCACCTGGCTGCGCGGCGACATTCTGGTCAAGG
+CCGACAAGATAACGATGGCCAACTCCCTGGAGCTGCGGGTGCCGTTCCTGGACCCGGAGGTTTTCGCGGT
+GGCCTCCCGGTTGCCGGCGGGCGCCAAGATCACCCGTACCACCACCAAGTACGCGCTGCGGCGCGCGCTG
+GAGCCTATTGTGCCCGCACACGTGCTGCACCGGCCCAAGCTCGGGTTCCCGGTCCCGATCCGGCATTGGC
+TGCGTGCCGGCGAGCTGCTGGAGTGGGCGTATGCGACGGTGGGCTCGTCGCAGGCCGGTCACTTGGTTGA
+CATCGCCGCCGTGTATCGCATGCTCGACGAGCACCGGTGCGGCAGCAGCGACCACAGCCGCCGGCTGTGG
+ACCATGCTGATCTTTATGCTGTGGCACGCGATCTTCGTCGAGCACAGCGTGGTGCCCCAGATCAGCGAGC
+CGCAGTACCCCGTCCAGTTGTAACCGCCCCTTCGCGAGCAGACGCGGAATCGCATCGGCGGGGCCCACAC
+GGTGCGATTCCGCGTCTGCTCGGCGGTGCCGCGGCTAGGCCAAGCCGCGGCTAGGCCAGCACGGCGACGA
+TCTCGGCGGCCGCGTGCTCGCCGTAAGCACCAGCCAGCCTGCTGGCCGCGGCCTCGTAGTCCCACTGCCA
+CTCCTGAGTTCCGGTCGACTCCAGCACCAGCACGGCAACCAGCGAGCCCAGCTGCGCCGAACGCTCCAGG
+CCTAGTCCGGCACTGCGGCCAGTCAGGAAACCGGCGCGGAACGCGTCGCCGACGCCGGTGGGGTCGGTCT
+GGCTGGTTTCGGGGACCACGCCGACGTGGATGGTGGTGCCGTCAGGTTCTACCAAATCGACACCCTTAGG
+ACCCAATGTGGTCACCCGCAGGTCGATCTGCGCCATCACATCGGCCTCTGACCAGCCGGTCTTGGACAGC
+AGCAGATCCCATTCGTAGTCGTTGGTGAACAAGTAAGCAGCACCGTTGACGAGCCTGCGAATTTCCTCAC
+CCGACAGCCTCGCCAGCTGCTGAGACGGATCGGCGGCGAAGGCCAGCCCCAGCTTGCGACACTCCTCGGT
+GTGCAAGAACATCGCCTCGGGGTCGTTGGCGCCGATGATCACCAACTCCGGCTTGCCGATGGCCGACACC
+ACGTCGGCAAGCTTGATGTTACGTGCCTCCGACATAGCCCCGGGGTAGAACGATGCGATCTGGGCCATGT
+CGACATCGGTGGTACAGGTAAACCGCGCCGTGTGCGCGGTCTCGGAGATCAGAACGTGGTCGCAGTTGAC
+ACCGCGGGCTTTCAGCCAGTCGCGATAATCGGCGAAGTCGGCGCCTGCCGCCCCAACTAGCGCGACCTCG
+CCACCTAGCACACCGATGGCGAAGGCCATGTTTCCGGCCACGCCGCCGCGGTGCATCACCAAGTCATCGA
+CTAGGAAGCTAAGCGACACCTTGTGCAGGTGTTCGGGCAGTAGCTGCTCGGAAAATCGGCCTGGAAACCG
+CATCAAATGGTCGGTCGCAATCGAACCGGTTACCGCGATCGTCACAAAATCTCCGTCCTTCGTTCCTAAG
+GTTGCCTAGTCTTTCAACATTATCGGCGCCGCGGCCCGCCCCGTCGCGTTGAGAGCTGACGGCAGCTGTT
+GCGCTAGCCTGCCTAGGGAGCTCACCTGATTGCCGATGCTGCCGGCTGACGCGACGGGCGGTTGTCGCCC
+TAGCAGCTGGTCCCGTCCACCACCCTAGGAGAACCACAATGCCCGGTCCCCACTCGCCGAACCCCGGTGT
+CGGCACCAACGGACCGGCGCCGTACCCCGAGCCCTCATCCCACGAACCCCAAGCCCTGGACTACCCCCAC
+GACCTCGGCGCCGCCGAACCGGCCTTCGCCCCGGGACCGGCAGACGACGCGGCGCTGCCGCCCGCCGCAT
+ATCCCGGCGTGCCGCCGCAGGTGTCCTACCCGAAGCGACGGCACAAGCGGCTGCTGATCGGCATTGTGGT
+AGCCCTCGCGCTGGTGTCGGCTATGACGGCGGCGATCATATACGGGGTTCGCACCAACGGAGCCAACACG
+GCAGGCACATTCTCGGAGGGACCGGCCAAAACCGCGATTCAGGGATACCTCAACGCGCTGGAGAACCGCG
+ATGTGGACACCATCGTTCGCAATGCGCTGTGCGGTATCCACGACGGCGTGCGCGACAAGCGCTCCGATCA
+GGCCTTGGCCAAGCTGAGCAGCGACGCGTTCCGCAAGCAGTTCTCCCAGGTCGAAGTGACCTCGATCGAC
+AAAATCGTGTACTGGTCGCAATATCAGGCCCAGGTGCTGTTCACCATGCAGGTGACACCTGCCGCCGGCG
+GCCCGCCACGCGGTCAGGTGCAAGGCATCGCTCAGTTGCTTTTCCAGCGCGGTCAGGTCTTGGTGTGCTC
+GTACGTGTTGCGCACCGCGGGGTCGTACTAGCGTTTTATCAGTTGAACGAATCCCCGCACGCGCAGGAGC
+CGGTGGCGTTGGGATTGTCGATGGTGAAGCCTTGCTTCTCAATAGTGTCGACGAAATCGATCGACGCGCC
+TTCCACATACGGCGCGCTCATCCGGTCCACGATCAACCTGACACCACCGAACTCCGCGGTTTGGTCACCA
+TCCAGCGTCCGGTCGTCGAAGAAAAGGTTATAGCGCAATCCAGCGCACCCCCCCGGCTGAACCGCGATCC
+GCAGCGCCAGATCGTCCCGTCCCTCCTGGTCCAACAGCGACTTCGCCTTGGCGGCGGCCGCTTCGGTCAG
+GATCACGCCGTGGGTCTTGGCGCTCGGCTCGTTCTGCACCGTCATGACTTCTCCTAGATGTCTCATCGTT
+GGGTGGGCCCCGCCCACTAGCGTTTCAGCCTGCGGAATCCAGTCTGGGGTCTGCTTGGGGAAAATCCCAC
+TTCCTCAACGGTACCCTGAAGGACCGCTATTCCCGAGTCGCGCCGCTACCTGAGACGCCAAGCCCATGAG
+CTGATTGGCCGCATCGGCCAGCGCCAACCGCACCGAACCGGCGTACTCAGCGATGGACAATGCGGCCATA
+ATGCCCGCCGACCGCAACGCGGACTTGTCCAGCGACACCTGGCCGGCCAACACTATCACCGGAATTGCGA
+GCGGGCGGGCCGCAGCCGCGATCGCACCAACCACCTTCCCGTGCAGGGATTGCTCGTCGAATCGGCCCTC
+ACCGGTGACGATCAGCTCCGCATCGGCAAGGTCGTCGGCAAAATGCGTGTGCTCTGCGATGATTGCCGCA
+CCCGACTGGTACCGGCCGCCAACCGCGAGCAGCCCAGCCCCGATACCACCGGCGGCGCCCGCGCCCGGCT
+CGGCGCTCACCCCGCGCCCGGCGGCCGCGTCCAGTTCAATCGCCCATGCCGCCAGACGGCCTTCCAACAC
+TGCGACGGTGGCCATGTCCGCGCCCTTCTGCGGCGCGAACACCCTGGCCGTGCCCCATGGTCCCAGCAAT
+GGGTATTCGACATCCGAGGCGGCGATCACCTCGACGTCGGCCAACTGTCGGCGGGCCGCGTCCAGGCCGC
+CAAGCTCGGCAATCATCCCCTTCCCCCCGTCGGTACATGCGCTGCCCCCCAACCCCACCACGATCCGAGC
+CGCCCCGGCCCGCAGTGCCGCGGCGATGAGCTGGCCGACGCCCTTGCTGTGGGCCGCCAGCGCGGTCTCG
+GGCGTGGGCGGGCCGCCAAGCAACCCCAGACCACAAGCCTGCGCGCACTCCAAATACGCGGTTGCCGAGC
+CCGGATCGAACACCCACGCCGCGTTCACGACGGTGTTCAGTGGCCCGCAAACACGCAGCCGGCGGGTCTC
+TCCTAGCCGGCTGCCCAGCACCTCAACAAAACCCGGACCGCCATCGGATTGGGGGGCGACGATGAACGAA
+TCGCCTGGTCGCGACCGCGTCCAGCCGGTCGCAATGGCCGCGGCGGCCTCCACCGCAGACAGGCTGTCGC
+CGTAGCAGTCCGGTGCCACCAACACCCGCATGGCGGGCAGCTGGAGTCGGCCGGGCCCCAAGCTACCGGT
+CGCGTCATCCGAGGCCTGCGAGCCTTTCATCACTGGCCAGAGTAGGTCTGCGCACCCACACGCGTACCTA
+AACGCACGCAAATTCCAACCGGGCCCCGCCGCGAAGTAGCCTGGCGACTGTGAAGCTGCTGGGCCACCGG
+AAGAGCCATGGACACCAAAGGGCCGACGCATCACCCGATGCCGGGTCGAAAGATGGTTGCCGGCCTGATT
+CCGGACGCACGTCCGGGTCGGACACATCGCGCGGGTCGCAAACCACCGGCCCCAAGGGCCGGCCCACGCC
+CAAGCGCAACCAATCCCGTCGCCACACCAAGAAGGGCCCGGTCGCACCGGCACCAATGACTGCGGCCCAG
+GCACGGGCCCGGCGCAAGTCGCTTGCCGGCCCCAAACTTAGCCGCGAGGAACGGAGAGCCGAAAAGGCCG
+CAAACCGGGCCCGGATGACGGAACGCCGGGAACGCATGATGGCCGGCGAAGAGGCCTACCTGCTCCCGCG
+CGACCGGGGCCCGGTACGCCGCTACGTGCGCGATGTGGTGGACTCCCGGCGCAACCTGCTCGGGCTGTTC
+ATGCCCTCGGCGTTGACCCTGCTGTTCGTCATGTTTGCCGTGCCGCAGGTGCAGTTTTACTTGTCTCCGG
+CGATGTTGATACTGCTGGCCTTGATGACGATCGACGCGATCATCTTGGGTCGCAAAGTTGGCCGGCTGGT
+TGACACGAAGTTCCCGTCTAACACCGAAAGCCGGTGGAGGCTGGGTCTTTACGCCGCCGGCCGAGCTTCC
+CAGATACGCCGGTTGCGGGCGCCCCGACCCCAAGTCGAGCGCGGCGGCGATGTTGGCTAACGGACGCCGG
+AAGTCATCTCACCCGGTGTACACCCTAGTGCTCAGCGGGCGGACCGAACCGATCAAGCCGGCGAAAGGAT
+GATCGGCTTCGCGCCGGTGTCGACGCCCGATGCGGCTGCCGAAGCAGCCGCCCGCGCCCGACAAGACAGC
+TTGACCAAGCCGCGGGGAGCGCTGGGCAGTCTCGAGGACCTGTCTGTCTGGGTCGCGTCGTGCCAGCAGC
+GCTGTCCGCCGCGGCAATTCGAGCGCGCCCGGGTGGTGGTGTTCGCCGGTGACCATGGTGTGGCCCGGTC
+CGGGGTGTCGGCGTACCCGCCGGAAGTCACCGCCCAGATGGTCGCCAACATCGACGCTGGCGGGGCGGCG
+ATCAACGCGCTGGCCGATGTCGCGGGCGCGACCGTGCGGGTCGCGGACCTGGCCGTGGACGCGGACCCGC
+TGTCTGAGCGCATCGGCGCGCACAAGGTGCGCCGCGGCAGCGGCAATATCGCCACCGAGGACGCGTTGAC
+CAACGACGAGACCGCCGCCGCGATCACAGCCGGCCAGCAGATCGCCGACGAAGAGGTTGATGCCGGCGCC
+GACTTGCTCATAGCCGGCGATATGGGAATCGGAAACACTACCGCGGCCGCGGTTCTTGTGGCGGCGCTGA
+CCGATGCCGAGCCGGTCGCGGTGGTCGGGTTCGGGACCGGTATCGACGACGCCGGTTGGGCGCGTAAGAC
+GGCCGCGGTGCGCGACGCCCTGTTTCGGGTGCGCCCAGTGTTGCCCGACCCGGTCGGGTTGCTGCGCTGC
+GCCGGCGGCGCTGACTTGGCCGCGATAGCTGGCTTCTGCGCGCAGGCCGCGGTCCGACGCACCCCGCTGC
+TGCTTGACGGGGTGGCGGTGACAGCCGCCGCCCTGGTCGCTGAGCGTCTTGCGCCCGGCGCTCACCGGTG
+GTGGCAGGCGGGTCATCGATCCAGCGAACCGGGCCACGGGCTGGCGCTGGCAGCCCTCGGGCTGGACCCG
+ATCGTGGACCTTCACATGCGGCTGGGCGAGGGAACCGGCGCCGCGGTGGCGTTGATGGTGTTGCGCGCCG
+CGGTCGCGGCGCTGTCGTCGATGGCGACCTTCACCGAGGCCGGCGTGTCCACCCGGTCCGTCGACGGTGT
+CGACCGGACCGCACCCCCGGCAGTCTCACCGTGATGCGTTCGCTGGCAACAGCTTTCGCATTCGCAACGG
+TGATACCCACACCGGGCTCAGCGACCACCCCGATGGGCCGTGGCCCGATGACCGCGCTGCCGGTGGTGGG
+CGCGGCGCTGGGTGCACTGGCGGCGGCGATCGCATGGGCTGGCGCGCAAGTGTTCGGCCCGTCCAGCCCG
+CTGTCCGGCATGCTCACGGTGGCGGTACTGCTGGTCGTCACTCGAGGCCTGCACATCGATGGCGTTGCCG
+ATACCGCTGACGGACTGGGCTGCTATGGGCCGCCGCAGCGTGCGCTTGCGGTGATGCGCGACGGGTCGAC
+CGGACCGTTCGGGGTGGCGGCCGTGGTCTTGGTCATCGCCTTGCAGGGCCTGGCCTTCGCGACCCTCACC
+ACGGTCGGGATCGCTGGGATCACGCTGGCGGTCTTATCCGGCCGGGTCACCGCCGTACTGGTCTGTCGCC
+GGTCGGTGCCGGCAGCCCACGGCAGCACCCTGGGCTCGCGGGTCGCCGGTACGCAACCCGCGCCGGTGGT
+GGCGGCCTGGCTCGCCGTCCTGCTCGCCGTTTCGGTGCCGGCCGGTCCCCGGCCTTGGCAAGGACCGATA
+GCGGTTCTGGTAGCGGTGACGGCCGGCGCGGCCCTGGCGGCGCATTGCGTGCACCGGTTCGGCGGTGTCA
+CCGGTGACGTGCTGGGCAGCGCGATCGAGCTGAGCACGACGGTCAGCGCCGTGACGCTTGCGGGCTTGGC
+CCGGCTTTAGCAGGCGGCGAGCGGGACGCTGCAGTAGACTCATGTCCGCCGTCCCTTCCAACACAGGGCT
+CCCCTCCGTGTCCCCAGATTAGGGGACATGAAATTCAACCGACGGTGTCCGATTGGCGGATCGTTTTGGC
+CGCGCGGCATATATAGCGTCGTTAATCATGCCCGCATCACGACTGGTCAGACAAGTGTCTGCGCCACGGA
+ACCTGTTCGGGCGGCTGGTTGCCCAGGGGGGCTTCTACACGGCCGGGCTGCAGTTGGGCAGCGGTGCGGT
+GGTACTGCCGGTCATCTGCGCACATCAGGGCCTCACCTGGGCGGCTGGGCTGTTGTATCCGGCGTTCTGC
+ATTGGCGCCATTCTGGGAAATTCGCTGTCGCCGCTGATTCTGCAGCGCGCCGGCCAGCTCCGGCACCTGC
+TGATGGCGGCGATATCGGCGACGGCGGCGGCGCTGGTTGTGTGCAACGCTGCGGTCCCCTGGACTGGCGT
+TGGCGTCGCCGCGGTTTTTTTGGCGACCACGGGGGCCGGTGGTGTCGTCACCGGAGTCTCCAGCGTCGCC
+TACACCGACATGATCTCCAGCATGTTGCCCGCGGTACGGCGGGGCGAGCTACTGCTCACCCAAGGTGCCG
+CGGGGTCGGTGCTGGCCACCGGCGTCACATTGGTGATTGTGCCGATGCTGGCCCATGGCAACGAGATGGC
+GCGCTATCACGATCTGCTGTGGCTGGGCGCCGCAGGTCTGGTTTGCTCCGGCATCGCGGCGCTGTTCGTC
+GGCCCGATGCGGTCTGTGTCCGTCACAACCGCCACCCGAATGCCACTGCGGGAAATCTATTGGATGGGCT
+TCGCGATCGCCCGCTCCCAGCCGTGGTTTCGCCGGTATATGACGACTTACCTGCTGTTCGTTCCGATCAG
+CCTGGGCACCACGTTCTTCAGCCTGCGCGCCGCCCAGTCCAACGGCAGTCTGCACGTGCTGGTGATCCTT
+TCCAGCATTGGATTGGTCGTCGGTTCGATGCTGTGGCGACAGATAAACCGCCTGTTCGGGGTGCGTGGCC
+TGCTGCTGGGCAGCGCACTGCTCAACGCCGCTGCTGCGCTGCTGTGCATGGTGGCCGAGTCGTGTGGGCA
+GTGGGTTCACGCCTGGGCGTACGGCACGGCGTTCCTGCTGGCTACGGTGGCCGCTCAAACGGTGGTCGCC
+GCATCGATATCGTGGATCAGCGTCCTCGCGCCCGAGCGGTACCGCGCCACCCTGATCTGCGTTGGGTCGA
+CCTTGGCCGCCGTCGAAGCCACCGTGCTGGGAGTTGCGCTCGGCGGAATTGCCCAAAAGCATGCCACCAT
+CTGGCCGGTTGTCGTCGTGCTGACACTGGCCGTAATCGCCGCGGTGGCGAGTCTGCGCGCACCGACACGA
+ATCGGGGTGACGGCGGACACGAGCCCGCAAGCAGCGACCTTGCAAGCCTACCGCCCGGCCACTCCTAACC
+CCATCCATAGCGATGAACGTTCGACGCCGCCCGACCATCTCTCAGTCCGCCGCGGGCAGTTACGACACGT
+ATGGGACAGTCGCCGGCCCGCGCCACCCCTGAACCGGCCAAGCTGTCGCCGCGCGGCCCGCCGTCCAGCG
+CCCGGCAAACCCGCTGCCGCACTACCCCAGCCGCGCCATCCAGCCGTGGGTGTCCGCGAAGGTGCCCCGC
+TGGATGCCGGTCAGCGTATCGCGTAGTGCCATGGTCACCTCACCCGGCTGACCGTCGGCGATTCTGAACT
+CGCTGGCACCGTGCCGCACCCGCGCGACCGGGGTGATGACAGCGGCGGTGCCGCACGCAAACACCTCGGT
+GATCTCGCCGGCGGCGGCTTTCTTCTGCCACTCGTCGATATCAATCCTGCGTTCCTCGACCGCAAATCCG
+GCATCAATAGCCAACTGCAACAACGAATCCCGTGTGATCCCGGGCAGCAGGGAACCGGACAGCTCCGGGG
+TGACCAGCCGCGCCGATCCGCCGCTGCCGAGCACGAAGAAGATGTTCATGCCACCCATCTCTTCGATATA
+GCGGCGTTCCACAGCGTCCAGCCACACCACCTGGTCGCATCCGTTCTCGGCGGCTTCGGCCTGCGCCAGC
+AACGAGGCGGCGTAGTTGCCGCCGAACTTGGCCGCACCGGTGCCGCCCGGACAGGCCCGTACATACTCCG
+TCGAAACCCAGACGCTGACAGGGGCGATGCCGCCCTTGAAGTACGCACCGGCCGGCGAGGCGATCAACAG
+GTAACGGTATTGGGTGGCAGGCCGCACGCCCAGTCCCGGCTCGGTGGCGAAGATGAACGGCCGCAGATAC
+AGCGCCTCCTCACCGCCGGCACCGGGCACCCAAGCTTTGTCGACAGCGATTAGCTGGCGCAGGGATTCGA
+TGAACACCGCGTCGGGCAGTTCGGGAATCGCCAACCGCCGCGCCGACGAACGCAACCTGGCGGCGTTGGC
+GTCGGCGCGAAACGACACGATGGACCCGTCGGCCCAGCGGTAGGCTTTGAGCCCTTCGAACACCTCCTGC
+GCATAGTGCAGCACGATCGCCGAGGGATCCAGCTCGATCGGGCCATAAGGGATTACCCGCGCGTTGTGCC
+AACCACGGCCCTCGGCATAGTCGATCGACACCATATGGTCGGTGTGGTATTTGCCGAAACCCGGCGCCCG
+CAGCATCGATTCACGCTGCGCGTCGGTGGCCGGATTGACCGCACGTAACACCGTGAATTGAAGGGAGCCG
+CTGGTCATGGGCCGATTCTATCCGTGGGCGAACGGTTATTGACGGCCCGGAGGCCACTCCGCTGCCACCA
+AGTGGTGACTCAGCGCGTTTTCACGGCAACGAACGGCGGACACACCACTTGACATTCGACAGCACGGCCG
+CGGACGTCGACATTGATTTGCTGGCCGTCTTCGATGCCGGCATCACTGTCGATCAGCGCCAGCCCGATGC
+CGACCTGCAACGTGGGAGAAAACGTTCCCGACGTGGTGACCCCAACCGTCTCATCCCCGACAAGCACAGC
+CAGCCCGGGGCGCAGCACACCGCGACCGACCATGCGCAGCCCCCGCAGCAGCCGCCGCGGCCCGGCCGCT
+TTCTCGGCCAACAACGCCGCACGACCAAAGAAGGCGTCCTTCCGCCAGCCGACCGCCCAGCCGCATCGGG
+CCTGCAGCGGCGAGATGTCCAGCGAAAGCTCGTGCCCGTGCAGCGGATAGCCCATTTCAGTGCGCAGTGT
+GTCGCGAGCACCGAGGCCGGCGGGCTCGCCGCCCGCGGCTGATACCGCCGCCAACAGTGCGTCGAACACC
+ACACCCGCCGACTCCCATGGCGGCAGCAGTTCGTAACCGTGCTCACCGGTGTAGCCGGTGCGACAGACAC
+GCACCGGCACCCCCGAGTACGAAGCGTCGGCGTAGCCCATGTAGTCCATCTCGGTTGGCAGCCCCAACGC
+GGTGAGCACGTCGGTCGAACACGGCCCCTGTACGGCCAGCACCGCGTAGGACCGATGCAGATTGGTGATG
+CTCAGACCGCCCGGTGCGGCAGCTTGTAGCGCGCCGACCACCGCGGCGGTATTGGCGGCGTTGGGCACCA
+GAAAGATCTCGTCGTCGCTGACGTAGTAGGCGATCAGGTCGTCGATCACACCGCCGGATTCGGTGCAGCA
+CAAGGTGTATTGCGCCTTGCCGGGCCCGATACGACCCAGGTCGTTGGTGAGCGCGGAGTTGACGAACTGC
+GCCGCACCCGGTCCACGGACCAGTGCCTTGCCCAGGTGGCTGACGTCGAAAAGGCCGACGGCGGTGCGGG
+TGGCGTTGTGCTCGCTGACGGTTCCGGCATACGAGACCGGCATCAGCCAGCCGCCGAACTCGGCGAAACT
+CGCACCCAGCTCGCGATGGCGGTCTTCCAGCGGTCCGTGTATCAGCTCTGGCACATCGCTCACGGCGTCC
+CACCCTAATGGGCGTCCCTGCTGGCACACTTAGGCAGGTGTACGATTCCTTGGACTTCGACGCCCTCGAG
+GCCGCCGGAATTGCCAACCCACGCGAGCGGGCCGGCTTGCTCACCTACCTGGATGAGCTTGGCTTCACGG
+TCGAAGAGATGGTGCAAGCCGAACGCCGCGGCCGGTTGTTCGGGCTGGCCGGTGACGTCCTGCTATGGTC
+CGGGCCCCCGATCTACACCCTGGCGACCGCGGCTGACGAACTGGGGTTGTCAGCCGACGACGTCGCACGC
+GCGTGGAGTTTGCTCGGCCTCACCGTCGCGGGTCCCGACGTTCCCACGCTGAGCCAGGCCGACGTCGACG
+CCCTGGCGACCTGGGTCGCACTGAAGGCGCTGGTGGGTGAGGACGGCGCATTCGGCCTGCTGCGAGTGCT
+CGGCACTGCCATGGCCCGACTCGCCGAGGCCGAGTCGACCATGATCCGCGCCGGGTCACCGAACATCCAA
+ATGACGCACACCCACGACGAACTTGCCACGGCACGGGCCTATCGCGCGGCTGCGGAGTTCGTCCCCCGGA
+TCGGTGCGCTGATCGACACCGTCCACCGTCACCACCTGGCCAGCGCACGAACCTACTTTGAAGGCGTCAT
+TGGCGACACGTCGGCAAGCGTGACGTGCGGTATCGGCTTTGCGGATCTGTCCAGCTTCACCGCGTTGACC
+CAGGCGCTCACCCCCGCGCAGTTGCAGGACCTGCTCACCGAATTCGACGCCGCCGTCACCGACGTGGTGC
+ATGCCGACGGTGGCCGGTTGGTGAAGTTCATCGGCGACGCCGTGATGTGGGTGAGCTCGTCGCCCGAACG
+ACTGGTGCGGGCGGCGGTGGATCTCGTCGATCATCCGGGTGCGCGCGCGGCCGAACTGCAGGTCCGTGCC
+GGTCTTGCCTATGGCACGGTGCTGGCCCTTAACGGTGACTACTTCGGCAACCCGGTCAACCTGGCTGCGC
+GCCTGGTGGCGGCCGCAGCGCCAGGGCAGATCCTGGCCGCAGCGCAACTCCGCGACATGTTGCCAGACTG
+GCCTGCCCTCGCCCATGGCCCATTGACGCTCAAGGGGTTTGACGCCCCGGTGATGGCCTTCGAACTGCAC
+GACAACCCTCGTGCGAGGGATGCTGACACGCCAAGCCCCGCCGCCAGTGATTAGGGTGGTTGCCCGTGAC
+CACCGAACCGGGTTACCTATCCCCCTCCGTCGCCGTCGCGACCTCGATGCCGAAACGTGGTGTCGGCGCT
+GCGGTGTTGATCGTGCCGGTCGTCTCGACCGGCGAAGAGGATCGGCCCGGCGCGGTCGTTGCCTCGGCCG
+AGCCCTTCCTGCGCGCCGACACGGTTGCCGAAATCGAGGCGGGCCTGCGAGCGCTGGACGCCACCGGCGC
+CAGTGACCAGGTGCACCGGCTGGCGGTGCCGTCGTTGCCGGTGGGCAGCGTCCTGACGGTCGGCCTGGGC
+AAACCGCGGCGCGAATGGCCGGCCGATACCATCCGCTGCGCCGCCGGCGTGGCCGCGCGTGCGCTCAACA
+GTTCGGAGGCAGTGATCACCACGCTAGCCGAATTACCTGGCGACGGCATCTGCTCGGCCACCGTCGAGGG
+GCTGATCCTGGGCAGCTACCGATTCAGCGCCTTCCGCAGCGACAAGACCGCGCCCAAAGACGCCGGACTC
+CGCAAAATCACCGTGCTCTGCTGTGCAAAGGACGCCAAGAAGCGCGCGTTGCACGGTGCGGCCGTCGCGA
+CCGCGGTGGCCACCGCCCGGGACTTGGTCAACACTCCCCCAAGCCACCTGTTTCCCGCCGAGTTGGCTAA
+GCGCGCAAAGACTTTGAGCGAATCTGTCGGCCTCGACGTGGAAGTTATCGACGAAAAGGCGCTGAAGAAG
+GCCGGCTATGGCGGGGTGATTGGTGTCGGCCAGGGCTCGTCGCGGCCGCCGCGACTGGTGCGGTTGATTC
+ATCGGGGATCGCGGCTGGCCAAGAACCCCCAAAAGGCCAAGAAGGTGGCCTTGGTTGGCAAGGGGATCAC
+CTTCGATACCGGCGGCATCTCGATCAAGCCGGCAGCGTCGATGCACCACATGACCTCGGACATGGGCGGA
+GCGGCCGCGGTGATCGCCACTGTCACGCTGGCTGCCCGGCTGCGACTGCCGATTGACGTGATCGCCACGG
+TGCCGATGGCCGAGAACATGCCGTCGGCGACGGCGCAGCGCCCGGGCGACGTGCTGACCCAATACGGTGG
+GACCACCGTCGAGGTGCTCAACACCGACGCGGAGGGCCGGTTGATCCTGGCCGACGCCATCGTCCGGGCA
+TGTGAGGACAAGCCGGACTATCTGATCGAGACATCCACGTTGACCGGTGCGCAAACGGTGGCGCTGGGGA
+CGCGCATACCGGGTGTGATGGGCAGCGACGAGTTCCGCGACCGGGTCGCCGCGATCTCGCAGCGGGTGGG
+CGAGAACGGCTGGCCGATGCCGCTGCCCGATGACCTCAAGGATGACTTGAAATCCACGGTGGCCGACCTG
+GCCAATGTGAGTGGCCAGCGTTTCGCAGGCATGCTGGTGGCCGGGGTTTTCCTGCGTGAGTTCGTCGCCG
+AATCGGTGGATTGGGCGCACATCGACGTGGCCGGCCCGGCCTACAACACCGGCAGCGCCTGGGGTTACAC
+GCCCAAGGGCGCCACCGGTGTGCCCACCCGCACCATGTTCGCGGTGCTCGAGGACATCGCGAAGAACGGG
+TAGGCGGCCGCCCGGACCCAAAGCACTTCACGAGTAGCGGTTAGATCACCCGCAGCCGCGCGGTACTGCG
+CAGCGCCTGCGGCAGCACCCGGGAGATGCCGTATAGCGCATAGGCTTCCGGCGCGACCGGTCTGATCGGC
+TTCTTCTTCTTGACCGCGGACACGATCGCGTCGGCTACCTTGTCCGGCCCGTAGCTGCGCAGCGCAAACA
+TCTTGTCGATCTGCCCCCGCCGGCCGTCGATCTTCTCCTCGTCGGTTCCGGGCGCGTGGAAACCGGTGGT
+AGCGACGATGTTGGTGTCAATGACACCGGGGCAGATGGTGGTCAGTCCGACACCGGCGGCATCGAGTTCG
+GCCCGCAAACAGTCGGAGAACATGTAGGTCGCCGCTTTGGAGGTGCAGTACGCGCTGAGCGACTGCAGCG
+GCGCATAGGCGGCCATCGACGACACGTTGACGATGTGCCCGCCAGTCCCCCGCTCGACCAGACGCTGCCC
+AAAAGCGCGGCAACCGTTCACCACGCCGCCCAGGTTGACGGCCAGCACCCGGTCGAACTGCTCAGCCGGG
+GTGTCCAGGAACCGACCCGCCTGGCCGATGCCGGCGTTGTTGACGACAATGTCGGGGACCCCGTGTTCGG
+CGCTGACCCGCTCGGCGAATGCCTCGACCGCCTCGGCGTCGGACACGTCGAGCACATAGGGGTACGCGAT
+GCCACCACGTGCGGCGATCTCGGCGGCGGTGTCCTTGACGGTGGCCTCGTCGATGTCGCTGATAACGATC
+TCTGCACCCTCACGAGCAAAGGCGAGCGCGGTCTCGCGGCCGATTCCGCTGCCCGCCCCGGTAACCGACA
+CCAGCGTGTCACCGAAGTACCCGCGGGGCCGTCCGACCTGGGCGCGTAACAGCGCGCGGCTCGGCTGCTT
+GCCGTCGGCCAGGTCGGCGAAGTCGTGCACGGCGGCCGCCATCACCTGCGGGTGCGACATCGGCGAAAAG
+TGACCAGCTTTGATGTCACGCCGCCAGAGCCGCGGCACCCAGCGCGCCGTCTGGTCGTATCCGTAGGGCC
+GCACGTAGGGGTCCTGGGAATTGACGATCAGCTGCACCGGCACATCAACTATCGGAATGGCCCGGCCGCG
+GCGGCTGCTGGAAAACGACCGAAAGTAGTTTGCGGGGTAAGTCTTGACCGAGTGGGCGGCATCACGGGCC
+AGCGTCTCCGAGTGATGAATCTGGTCGACGGGAATGTCGCCGACCATGTTGCGGCGGACGGCCGCACTCG
+ACAGCGCAACCCGAAGCAGCAGCGGTGCGACCACCGGTACCGAGAACAAGGCCATGTAGCTCAACCGCAG
+TGTCTGGCTGATCGCCCGTAGAAAGGTTCGCGGACGCCAAGGCCGCCGCAGACCGCCATAAACGTAGTTG
+ACCAGGTGGTCTTGACTGGGGCCGGACACCGACGTGAACGAGGCGACCCGATCACTGGCTCCGGGCCGGC
+GCAGGTACTCCCACACCCCCACCGAACCCCAGTCATGGGCCAGCACGTGCACCGGCTCACCGGGGCTCAG
+CTCGCCGATGACGGCGTCGAAATCGTCGGCGAAATGGGCCATGGTGTAGGCCGAAATGGGTTTGGGCACC
+GATGAGCGACCGACACCACGGTTGTCGTAGCGAACGATCCGGAACCGTTCGGCCAGCAGCGGAACGACAC
+CGTCCCACAGCACGTGCGAGTCCGGAAAGCCATGCACCAGCACGACGGTCGGGCCGTCGGGATTGCCTTC
+GTGGTAGACCGCGATGCGAACGCCATCCGGGCTGTCGACCAGACGGGACATCTGTTGTGTTGCCGGCATC
+GCACCTCCGCCCACCGGGACTTGCTGTTGCAACCAGTCGCCCAAACCGTAGCAAGGACGGCCGACTGCAC
+CGATGTCCCCGCCGAGGTGTCGGCAACGGCCGCCGGGGCCACCAACTCGCCGCGCCCTGGATGTGTGTCG
+CTCCGGGCGCAGTGACAGGATAGGTTTCGACATCCACCTGGGTTCCGCACCCGGTGCGCGACCGTGTGAT
+AGGCCAGAGGTGGACCTGCGCCGACCGACGATCGATCGAGGAGTCAACAGAAATGGCCTTCTCCGTCCAG
+ATGCCGGCACTCGGTGAGAGCGTCACCGAGGGGACGGTTACCCGCTGGCTCAAACAGGAAGGCGACACGG
+TCGAACTCGACGAGCCCCTCGTGGAGGTGTCGACCGACAAGGTCGACACCGAAATCCCCTCGCCGGCCGC
+GGGTGTGCTGACCAAGATCATCGCCCAGGAGGATGACACGGTCGAGGTCGGCGGCGAGCTCGCTGTCATT
+GGCGACGCCAAGGATGCCGGCGAGGCCGCGGCCCCGGCACCCGAGAAAGTCCCTGCGGCCCAACCCGAGT
+CCAAGCCGGCACCCGAACCACCACCGGTCCAACCGACGTCCGGAGCGCCTGCTGGTGGCGATGCCAAGCC
+GGTGCTGATGCCCGAGCTCGGCGAATCGGTGACCGAGGGGACCGTCATTCGTTGGCTGAAGAAGATCGGG
+GATTCGGTTCAGGTTGACGAGCCACTCGTGGAGGTGTCCACCGACAAGGTGGACACCGAGATCCCGTCCC
+CGGTGGCTGGGGTCTTGGTCAGTATCAGCGCCGACGAGGACGCCACGGTGCCCGTCGGCGGCGAGTTGGC
+CCGGATCGGTGTCGCTGCCGACATCGGCGCCGCGCCCGCCCCCAAGCCCGCACCCAAGCCCGTCCCCGAG
+CCAGCGCCGACGCCGAAGGCCGAACCCGCACCATCGCCGCCGGCGGCCCAGCCAGCCGGTGCGGCCGAGG
+GCGCACCGTACGTGACGCCGCTGGTGCGAAAGCTGGCGTCGGAAAACAACATCGACCTCGCCGGGGTGAC
+CGGCACCGGAGTGGGTGGTCGCATCCGCAAACAGGATGTGCTGGCCGCGGCTGAGCAAAAGAAGCGGGCG
+AAAGCACCGGCGCCGGCCGCCCAGGCCGCCGCCGCGCCGGCCCCGAAAGCGCCGCCTGCCCCTGCGCCGG
+CGTTGGCACATCTACGGGGCACCACCCAGAAGGCCAGCCGGATTCGTCAGATCACCGCCAACAAGACCCG
+CGAATCTTTGCAGGCAACGGCACAGCTGACACAAACCCATGAGGTCGACATGACCAAGATCGTGGGGCTA
+CGGGCCCGGGCCAAGGCGGCGTTCGCCGAGCGTGAGGGCGTGAACCTGACCTTCCTGCCGTTCTTCGCCA
+AGGCCGTGATCGATGCCCTCAAGATTCACCCGAACATCAACGCTAGCTACAACGAGGACACCAAGGAGAT
+CACCTACTACGACGCCGAGCACCTAGGATTCGCTGTCGACACCGAGCAGGGCCTGCTCTCCCCGGTCATC
+CACGACGCCGGCGATCTGTCACTGGCCGGTCTGGCGCGGGCGATCGCCGATATCGCGGCCCGTGCCCGGT
+CGGGCAACCTGAAACCCGACGAGTTGTCCGGCGGCACCTTCACCATCACCAACATCGGTAGCCAGGGCGC
+GTTGTTCGACACCCCGATCCTGGTTCCGCCGCAGGCCGCCATGCTGGGCACCGGGGCGATCGTCAAGCGG
+CCGCGGGTGGTCGTCGATGCCAGCGGCAACGAGTCGATCGGGGTGCGCTCGGTCTGCTACCTCCCGTTGA
+CCTATGACCATCGGCTCATCGACGGCGCCGACGCCGGACGTTTCCTCACCACGATCAAGCACCGCCTCGA
+AGAGGGAGCGTTCGAGGCCGATTTAGGACTGTGATGGCCAACGCCGTTGTCGCGATCGCGGGTTCGTCTG
+GCTTGATCGGCTCTGCCCTGACCGCGGCGCTGCGCGCGGCCGACCACACGGTGCTGCGGATCGTGCGCCG
+GGCACCTGCGAATTCCGAAGAACTGCACTGGAATCCCGAAAGCGGCGAATTCGATCCGCACGCGCTCACC
+GATGTCGACGCCGTGGTCAACCTCTGCGGCGTCAACATCGCCCAGCGTCGGTGGTCGGGGGCTTTCAAAC
+AGAGCCTGCGCGACAGCCGGATCACACCCACCGAGGTGCTATCCGCCGCAGTCGCCGACGCCGGCGTCGC
+TACCTTGATCAACGCCAGCGCGGTGGGCTACTACGGAAACACCAAGGACCGGGTGGTCGACGAAAACGAC
+TCGGCGGGAACAGGTTTTCTGGCCCAGCTGTGCGTTGACTGGGAAACCGCCACGCGGCCGGCGCAGCAGA
+GCGGTGCCCGCGTGGTGCTGGCCCGGACCGGAGTGGTGCTGTCTCCGGCGGGGGGCATGCTGCGACGCAT
+GCGGCCACTGTTTTCGGTGGGCCTGGGCGCGCGGCTGGGCAGCGGCCGGCAATATATGTCATGGATCAGC
+CTGGAGGACGAGGTGCGGGCGCTGCAGTTCGCTATCGCGCAGCCCAACCTGTCCGGCCCGGTGAACTTGA
+CCGGGCCGGCCCCCGTTACCAACGCCGAATTCACCACCGCGTTTGGCCGCGCCGTCAACCGCCCTACCCC
+GCTGATGTTGCCTAGCGTCGCGGTACGCGCGGCGTTTGGTGAGTTCGCCGACGAGGGGTTGCTCATTGGT
+CAGCGCGCCATCCCCTCCGCGCTGGAGCGAGCCGGATTTCAGTTCCACCACAACACCATTGGCGAGGCGC
+TCGGCTACGCCACCACCCGGCCCGGCTAGGCTTGACCCCGTCTGCCCAGCCGTGCGCTGGCGGCCGAGTA
+GCCTAGCTATCGTGACGGGTTCTATCCGGTCGAAGCTGTCCGCGATCGACGTCCGCCAGCTGGGGACCGT
+CGACTACCGGACCGCGTGGCAGCTACAGCGAGAGCTAGCCGACGCCCGGGTCGCCGGCGGCGCCGACACG
+CTGCTGCTGTTGGAACACCCCGCGGTCTACACCGCCGGACGGCGTACCGAGACACACGAGCGACCCATTG
+ACGGCACTCCGGTCGTCGGCACCGACCGCGGCGGCAAGATCACCTGGCACGGTCCGGGGCAATTGGTCGG
+CTACCCGATCATCGGGCTGGCCGAACCCCTCGACGTGGTCAATTACGTTCGGCGCCTTGAAGAATCGCTG
+ATCCAAGTCTGCGCCGATCTGGGCCTGCACGCCGGCCGCGTCGACGGCCGGTCCGGGGTCTGGCTGCCCG
+GCAGGCCGGCGCGCAAGGTCGCGGCCATCGGTGTCCGGGTGTCGCGGGCGACGACACTGCACGGGTTTGC
+GCTCAACTGCGATTGTGATTTGGCTGCCTTCACCGCCATCGTGCCATGCGGAATCAGTGACGCCGCAGTG
+ACATCGCTGTCCGCCGAACTCGGCCGTACGGTCACCGTCGACGAGGTCCGCGCGACGGTCGCCGCCGCTG
+TCTGCGCCGCTCTGGACGGCGTCCTACCGGTCGGTGACCGCGTGCCCTCACACGCCGTACCATCGCCGTT
+ATGAGTGTCGCTGCCGAGGGCCGGCGCCTGTTACGCCTGGAGGTGCGCAACGCGCAGACCCCAATCGAGC
+GCAAACCGCCGTGGATCAAGACACGAGCCCGCATCGGGCCGGAGTACACCGAGCTGAAGAACCTGGTCCG
+CCGCGAGGGGCTGCACACGGTCTGCGAGGAGGCCGGCTGCCCCAACATCTTCGAATGCTGGGAGGACCGA
+GAAGCCACCTTCCTGATCGGCGGTGACCAGTGCACCCGCCGATGCGATTTCTGCCAGATCGACACCGGAA
+AGCCCGCCGAGCTGGACCGCGACGAGCCACGCCGAGTCGCCGACAGCGTGCGCACGATGGGCCTGCGCTA
+TGCCACCGTCACCGGCGTGGCTCGCGACGACCTGCCTGACGGCGGGGCCTGGCTGTACGCCGCGACCGTG
+CGCGCCATCAAGGAACTCAATCCGTCGACCGGCGTCGAACTGCTGATTCCCGACTTCAACGGCGAACCAA
+CCCGGCTGGCCGAGGTCTTCGAGTCCGGCCCGGAAGTCCTGGCACACAATGTCGAAACCGTGCCCCGTAT
+CTTCAAGCGGATCCGGCCGGCGTTCACGTACCGGCGCAGCCTGGGTGTGCTTACCGCTGCGCGCGACGCC
+GGCCTGGTCACCAAGAGCAACCTCATCCTCGGCCTGGGCGAAACCTCCGACGAGGTGCGCACCGCCCTGG
+GCGATCTGCGCGACGCCGGCTGCGACATCGTTACCATCACCCAATACCTGCGGCCGTCGGCGCGCCACCA
+TCCGGTCGAGCGCTGGGTGAAGCCCGAGGAGTTCGTCCAGTTCGCGCGATTCGCCGAAGGGCTGGGCTTC
+GCCGGGGTATTGGCGGGACCCCTGGTTAGGTCGTCATATCGGGCGGGCCGGCTCTACGAACAGGCACGTA
+ACTCACGGGCCTTGGCATCCCGCTAGCCAGCGTTTACGTATTCTGGACGATTATGGCGAAACCCCGAAAT
+GCCGCTGAAAGCAAGGCCGCCAAAGCTCAGGCAAACGCTGCTCGTAAGGCTGCCGCCCGCCAGCGCCGCG
+CTCAGCTGTGGCAAGCGTTCACCCTGCAGCGCAAGGAGGATAAGCGCCTGCTGCCGTACATGATTGGTGC
+TTTCTTGCTGATCGTGGGCGCATCGGTGGGGGTCGGGGTGTGGGCTGGCGGGTTCACCATGCTCACGATG
+ATCCCGCTGGGGGTGCTGCTGGGTGCACTGGTGGCGTTCGTCATCTTCGGCCGGCGAGCCCAGCGAACGG
+TTTACCGCAAAGCCGAAGGCCAAACCGGCGCAGCCGCCTGGGCGCTGGACAACCTGCGGGGCAAGTGGCG
+GGTGACGCCCGGGGTGGCCGCCACCGGCAACCTCGACGCCGTGCACCGGGTGATCGGCCGGCCCGGTGTC
+ATCTTCGTCGGCGAGGGATCAGCGGCCCGCGTCAAACCACTGCTGGCTCAGGAGAAAAAGCGCACCGCGC
+GACTGGTCGGGGACGTGCCGATCTACGACATTATCGTCGGCAACGGCGATGGCGAGGTTCCGCTGGCCAA
+GTTGGAGCGCCACCTCACCCGCCTTCCGGCCAACATCACGGTCAAGCAGATGGACACGGTGGAGTCGCGA
+CTGGCGGCGCTGGGTTCGCGTGCCGGTGCGGGCGTCATGCCCAAGGGACCGCTACCCACCACGGCCAAGA
+TGCGCAGCGTCCAGCGCACGGTCCGCCGTAAGTAACGCGGCTCAGCGTCGCACCACCGCCGTAGCAGTGA
+GCCGATCGTGCAGCCCACGCCCGTCCGAGTCGGTGAACAGCGGCGGAACCACCAGCCCGATCAGCAGGCC
+ACGCACCACCAGACGGCCGATCCCCACCGGCCGCCGGCCACCCACTGCCACCACGACCAGACCCAGCATC
+AACTGCCCGGGTGTGAATCCGAACAAGCGGACCGCCGCCACCCCGAGCAGCAGCCAAATCACCAGGACAA
+CCGTCGACAGCATCGGGGTCGACCAAACACCGAATTCCACGCCCAGCAACGCCAGACCGTAGGCGATCAG
+CCAGTCGATCAGCAGAGCCGCCAGCCGGCGCCCCATCGGAGCCAGCGAACCCGGTCCGGTGTCCGGCAAG
+CCCAGCGTCTTGCCGGGATAGTCGGGCGGCGATTTCGCCGTCATCGGGCAGACCCGATAACCAGGTTCCC
+GTTCGGCATGCCACCGGTTACGATCTTGCCGACCATGGCCCCACAATAGGGCCGGGGAGACCCGGCGTCA
+GTGGTGGGCGGCACGGTCAGTAACGTCTGCGCAACACGGGGTTGACTGACGGGCAATATCGGCTCCATAG
+CGTCGGCCGCGGATACAGTAAAGGAGCATTCTGTGACGGAAAAGACGCCCGACGACGTCTTCAAACTTGC
+CAAGGACGAGAAGGTCGAATATGTCGACGTCCGGTTCTGTGACCTGCCTGGCATCATGCAGCACTTCACG
+ATTCCGGCTTCGGCCTTTGACAAGAGCGTGTTTGACGACGGCTTGGCCTTTGACGGCTCGTCGATTCGCG
+GGTTCCAGTCGATCCACGAATCCGACATGTTGCTTCTTCCCGATCCCGAGACGGCGCGCATCGACCCGTT
+CCGCGCGGCCAAGACGCTGAATATCAACTTCTTTGTGCACGACCCGTTCACCCTGGAGCCGTACTCCCGC
+GACCCGCGCAACATCGCCCGCAAGGCCGAGAACTACCTGATCAGCACTGGCATCGCCGACACCGCATACT
+TCGGCGCCGAGGCCGAGTTCTACATTTTCGATTCGGTGAGCTTCGACTCGCGCGCCAACGGCTCCTTCTA
+CGAGGTGGACGCCATCTCGGGGTGGTGGAACACCGGCGCGGCGACCGAGGCCGACGGCAGTCCCAACCGG
+GGCTACAAGGTCCGCCACAAGGGCGGGTATTTCCCAGTGGCCCCCAACGACCAATACGTCGACCTGCGCG
+ACAAGATGCTGACCAACCTGATCAACTCCGGCTTCATCCTGGAGAAGGGCCACCACGAGGTGGGCAGCGG
+CGGACAGGCCGAGATCAACTACCAGTTCAATTCGCTGCTGCACGCCGCCGACGACATGCAGTTGTACAAG
+TACATCATCAAGAACACCGCCTGGCAGAACGGCAAAACGGTCACGTTCATGCCCAAGCCGCTGTTCGGCG
+ACAACGGGTCCGGCATGCACTGTCATCAGTCGCTGTGGAAGGACGGGGCCCCGCTGATGTACGACGAGAC
+GGGTTATGCCGGTCTGTCGGACACGGCCCGTCATTACATCGGCGGCCTGTTACACCACGCGCCGTCGCTG
+CTGGCCTTCACCAACCCGACGGTGAACTCCTACAAGCGGCTGGTTCCCGGTTACGAGGCCCCGATCAACC
+TGGTCTATAGCCAGCGCAACCGGTCGGCATGCGTGCGCATCCCGATCACCGGCAGCAACCCGAAGGCCAA
+GCGGCTGGAGTTCCGAAGCCCCGACTCGTCGGGCAACCCGTATCTGGCGTTCTCGGCCATGCTGATGGCA
+GGCCTGGACGGTATCAAGAACAAGATCGAGCCGCAGGCGCCCGTCGACAAGGATCTCTACGAGCTGCCGC
+CGGAAGAGGCCGCGAGTATCCCGCAGACTCCGACCCAGCTGTCAGATGTGATCGACCGTCTCGAGGCCGA
+CCACGAATACCTCACCGAAGGAGGGGTGTTCACAAACGACCTGATCGAGACGTGGATCAGTTTCAAGCGC
+GAAAACGAGATCGAGCCGGTCAACATCCGGCCGCATCCCTACGAATTCGCGCTGTACTACGACGTTTAAG
+GACTCTTCGCAGTCCGGGTGTAGAGGGAGCGGCGTGTCGTTGCCAGGGCGGGCGTCGAGGTTTTTCGATG
+GGTGACGGTGGCCGGCAACGGCGCGCCGACCACCGCTGCGAAGAGCCCGTTTAAGAACGTTCAAGGACGT
+TTCAGCCGGGTGCCACAACCCGCTTGGCAATCATCTCCCGACCGCCGAGCGGGTTGTCTTTCACATGCGC
+CGAAACTCAAGCCACGTCGTCGCCCAGGCGTGTCGTCGCGGCCGGTTCAGGTTGAGTGTCGGGGATTCGT
+CGTGCGGGCGGGCGTCCACGCTGACCAACGGGGCAGTCAACTCCCGAACACTTTGCGCACTACCGCCTTT
+GCCCGCCGCGTCACCCGTAGGTAGTTGTCCAGGAATTCCCCACCGTCGTCGTTTCGCCAGCCGGCCGCGA
+CCGCGACCGCATTGAGCTGGCGCCCGGGTCCCGGCAGCTGGTCGGTGGGCTTGCCGCGCACCAACACCAG
+CGCGTTGCGGGCCCGGGTGGCGGTCAGCCAGGCCTGACGGAGCAGCTCCACGTCGGCTGCGGGAACCAGA
+TCGGCGGCCGCGATGACATCCAGGGATTGCAGCGTCGAGGTGTTGTGCAGGGCGGGAACCTGGTGCGCAT
+GCTGTAGCTGCAGCAACTGCACGGTCCATTCGATGTCGGCCAGTCCGCCGCGGCCCAGTTTGGTGTGTGT
+GTTGGGGTCGGCACCGCGCGGCAACCGCTCGGACTCGATACGGGCCTTGATGCGGCGAATCTCGCGCACC
+GAGTCAGCGGACACACCGTCGGGCGGATACCGCGTTTTGTCGACCATCCGTAGGAATCGCTGACCCAACT
+CGGCATCGCCGGCAACCGCGTGTGCGCGTAGCAGGGCCTGGATCTCCCATGGCTGTGCCCACTGCTCGTA
+GTATGCGGCGTAGGACCCCAGGGTGCGGACCAGCGGACCGTTGCGGCCCTCGGGTCGCAAATTGGCGTCG
+AGCTCCAGCGGCGGATCGACGCTGGGTGTCCCCAGCAGCGCCCGAACCCGCTCGGCGATCGATGTCGACC
+ATTTCACCGCCCGTGCATCGTCGACGCCGGTGGCCGGCTCACAGACGAACATCACGTCGGCATCCGACCC
+GTAGCCCAACTCGGCACCACCCAGCCGACCCATGCCGATGACCGCGATGGCCGCCGGGGCGCGATCGTCG
+TCGGGAAGGCTGGCCCGGATCATGACGTCCAGCGCGGCCTGCAGCACCGCCACCCACACCGACGTCAACG
+CCCGGCACACCTCGGTGACCTCGAGCAGGCCGAGCAGGTCCGCCGAACCGATGCGGGCCAGCTCTCGACG
+ACGCAGCGTGCGCGCGCCGGCGATGGCCCGCTCCGGGTCGGGGTAGCGGCTCGCCGAGGCGATCAGCGCC
+CGAGCCACGGCGGCGGGCTCGGTCTCGAGCAGCTTCGGGCCCGCAGGCCCGTCCTCGTACTGCTGGATGA
+CCCGCGGCGCGCGCATCAACAGATCCGGCACATACGCCGAGGTACCCAAGACATGCATGAGCCGCTTGGC
+CACCGCGGGCTTGTCCCGCAGCGTGGCCAGGTACCAGCTTTCGGTGGCCAGCGCCTCACTGAGCCGCCGG
+TAGGCCAGCAGTCCGCCGTCGGGATCGGGGGCATACGACATCCAGTCCAGCAGCCTGGGCAGCAGCACCG
+ACTGCACCCGTCCGCGCCGGCCGCTTTGATTGACCAACGCCGACATGTGTTTCAACGCGGTCTGCGGTCC
+CTCGTAGCCCAGCGCGGCCAGCCGGCGCCCCGCGGCCTCCAACGTCATGCCGTGGGCGATCTCCAACCCG
+GTCGGGCCGATCGATTCCAGCAGCGGTTGATAGAAGAGTTTGGTGTGTAACTTCGACACCCGCACGTTCT
+GCTTCTTGAGTTCCTCCCGCAGCACCCCGGCCGCATCGTTTCGGCCATCGGGCCGGATGTGGGCCGCGCG
+CGCCAGCCAGCGCACTGCCTCCTCGTCTTCGGGATCGGGAAGCAGGTGGGTGCGCTTGAGCCGCTGCAAC
+TGCAGTCGGTGCTCGAGCAGCCTGAGGAACTCATACGACGCGGTCATGTTCGCCGCGTCCTCACGCCCGA
+TGTAGCCGCCTTCGCCCAACGCCGCCAATGCGTCCACCGTGGACGCCACCCGTAACGACTCGTCGCTACG
+GGCATGAACCAGCTGCAGTAGCTGTACGGCGAACTCCACGTCGCGCAATCCGCCGCTGCCGAGTTTGAGC
+TCGCGGCCGCGGACATCGGCGGGCACCAGCTGCTCCACCCGCCGCCGCATGGCCTGCACCTCGACCACAA
+AGTCTTCGCGCTCGCAGGCTCGCCACACCATCGGCATCAAGGCGGTCAGGTAACGCTCGCCAAGTTCCGC
+GTCGCCAACGACTGGCCGTGCTTTCAGCAACGCCTGAAACTCCCAGGTCTTGGCCCAGCGCTGGTAGTAG
+GCGATGTGCGACTCGAGCGTACGGACCAGCTCCCCGTTGCGCCCCTCCGGACGCAGGGCGGCGTCCACCT
+CGAAAAAGGCCGCCGAGGCCACCCGCATCATCTCGCTGGCCACGCGCGCGTTGCGCGGGTCGGAGCGCTC
+GGCAACGAATATGACATCGACGTCGCTGACGTAGTTCAGTTCGCGCGCACCGCACTTGCCCATCGCGATG
+ACCGCCAGGCGCGGTGGCGGGTGCTCGCCGCACACGCTCGCCTCGGCCACGCGCAGCGCCGCCGCCAGAG
+CGGCGTCCGCGGCGTCCGCCAGGCGTGCGGCCACCACGGTGAATGGCAGCACCGGTTCGTCCTCGACCGT
+CGCGGCCAGGTCGAGAGCGGCCAGCATTAGCACGTAGTCGCGGTACTGGGTTCGCAATCGGTGCACGAGC
+GAGCCCGGCATACCCTCCGATTCCTCGACGCACTCGACGAACGACCGCTGCAGCTGGTCATGGGACGGCA
+GTGTGACCTTGCCCCGCAGCAATTTCCAGGACTGCGGATGGGCGACCAGGTGATCGCCCAACGCCAGCGA
+CGAGCCCAGCACCGAGAACAGCCGCCCGCGCAGACTGCGTTCGCGCAGCAGAGCCGCGTTGAGCTCGTCC
+CATCCGGTGTCTGGATTCTCCGACAGCCGGATCAAGGCGCGCAGCGCGGCATCGGCGTCCGGAGCGCGTG
+ACAGCGACCACAGCAGGTCGACGTGCGCCTGATCCTCGTGCCGATCCCACCCCAGCTGAGCCAGACGCTC
+ACCAGCAGGGGGGTCAACTAATCCGAGCCGGCCAACGCTGGGCAACTTCGGCCGCTGCGTGGCGAGTTTG
+GTCACGACCACGACGGTAGCGCAAAGCGCGTCGGCGTCGGATCAACCGGTAGATCTGGGCTACAGCGACA
+GGTAGGTGCGCAGCTCGTATGGCGTGACGTGGCTGCGGTAGTTCGCCCACTCCGTGCGCTTGTTGCGCAA
+GAAAAAGTCAAAAACGTGCTCCCCCAAGGCCTCCGCGACGAGTTCGGAGGCCTCCATGGCGCGCAGCGCA
+CTATCCAAACTGGACGGCAATTCTCGGTACCCCATCGCTCGGCGTTCCTCGGGTGTGAGGTCCCATACGT
+TGTCCTCGGCCTGCGGGCCCAGCACGTAACCCTTCTCTACACCCCGCAATCCCGCGGCCAGCAGCACGGC
+GAATGTCAGATAGGGATTGCACGCCGAATCAGGGCTGCGTACTTCGACCCGCCGCGACGAGGTCTTGTGC
+GGCGTGTACATCGGCACCCGCACTAGGGCGGATCGGTTGGCGGCCCCCCACGACGCGGCCGTGGGCGCTT
+CGCCGCCCTGCACCAGCCGCTTGTAAGAGTTGACCCACTGATTTGTGACCGCGCTGATCTCGCAAGCGTG
+CTCCAGGATCCCGGCGATGAACGATTTACCCACTTCCGACAGCTGCAGCGGATCATCAGCGCTGTGGAAC
+GCGTTGACATCACCCTCGAACAGGCTCATGTGGGTGTGCATCGCCGAGCCCGGGTGCTGGCCGAATGGCT
+TGGGCATGAACGACGCCCGGGCGCCCTCTTCCAGCGCGACTTCTTTGATGACGTAGCGGAAGGTCATCAC
+GTTGTCAGCCATCGACAGAGCGTCGGCAAACCGCAGGTCGATCTCCTGCTGGCCGGGTGCGCCTTCGTGA
+TGGCTGAACTCCACCGAGATGCCCATGAATTCCAGGGCATCGATCGCGTGGCGGCGAAAGTTCAAGGCGG
+AGTCGTGCACCGCTTGGTCGAAATAGCCGGCGTTGTCGACCGGGACGGGCACCGACCCGTCCTCGGGTCC
+GGGCTTGAGCAGGAAGAACTCGATTTCGGGATGCACGTAGCAGGAGAAGCCGAGTTCGCCGGCCTTCGTC
+AGCTGCCGCCGCAACACGTGCCGCGGGTCCGCCCACGACGGCGAGCCGTCCGGCATGGTGATGTCGCAAA
+ACATCCGCGCTGAGTGGTGGTGGCCGGAACTGGTGGCCCAGGGCAGCACCTGGAAGGTCGACGGGTCCGG
+GTGCGCCACCGTATCGGATTCCGAGACCCGCGCAAAGCCCTCGATCGAGGATCCGTCGAAGCCGATGCCT
+TCCTCGAAGGCGCCCTCGAGTTCGGCTGGGGCGATGGCGACCGACTTGAGGAAACCGAGCACGTCTGTGA
+ACCACAGCCGGACGAAGCGGATGTCGCGTTCTTCCAGGGTACGAAGAACGAATTCCTTCTGTCGGTCCAT
+ACCTCGAACAGTATGCACTGTCTGTTAAAACCGTGTTACCGATGCCCGGCCAGAAGCGTTGCGGGGCGGC
+CCGCAAGGGGAGTGCGCGGTGAGTTCAGGGCGCGCACCGCAGACTCGTCGGCGGCAAGGTCCCGTCGAGA
+AAATAGTGCATCACCGCAGAGTCCACACACTGGTTGCCATCGAACACCGCAGTGTGTTGGGTGCCGTCGA
+AGGTGATCAGCGGTGCGCCCAGCTGGCGGGCCAGGTCTACCCCGGACTGATACGGAGTGGCCGGGTCGTG
+GGTGGTGGACACCACGACGACCTTGCCAGCCCCGGCCGGCGCCGCGGGGTGCGGCGTCGACGTTGCCGGC
+ACCGGCCACAGCGCGCACAGATCGCGGGGGGCGGATCCGGTGAACTGCCCGTAGCTAAGGAACGGGGCGA
+CCTGACGGATCCGTTGGTCGGCGGCCACCCAGGCCGCTGGATCGGCCGGTGTGGGCGCATCGACGCACCG
+GACCGCGTTGAACGCGTCCTGGTCGTTGCTGTAGTGCCCGTCTGCATCCCGGCCGTCATAGTCGTCGGCA
+AGCACCAGCAAGTCGCCGGCGTCGCTGCCGCGCTGCAGCCCCAGCAGACCACTGGTCAGGTACTTCCAGC
+GCTGAGGGCTGTACAGCGCGTTGATGGTGCCCGTCGTCGCGTCGGCGTAGCTCAGGCCACGTGGATCCGA
+CGTCTTACCCGGCTTCTGCACCAGCGGGTCAACCAGGGCGTGGTAGCGGTTGACCCACTGGGCCGAGTCG
+GTGCCCAGAGGGCAGGCCGGCGAGCGGGCGCAGTCGGCGGCGTAGTCATTGAAAGCGGTCTGAAATCCCG
+CCATTTGGCTGATGCTTTCCTCGATTGGGCTAACGGCTGGATCGATAGCGCCGTCGAGGACCATCGCCCG
+CACATGAGTACCGAACCGTTCCAGGTAAGCGGTGCCCAACTCGGTGCCGTAGCTGTATCCGAGGTAGTTG
+ATCTGATCGTCACCTAACGCTTGGCGAACCATGTCCATGTCCCGTGCGACGGACGCGGTACCGATATTGG
+CCAAGAAGCTGAAGCCCATCCGGTCAACACAGTCCTGGGCCAACTGCCGGTAGACCTGTTCGACGTGGGT
+GACACCGGCCGGACTGTAGTCGGCCATCGGATCGCGCCGGTACGCGTCGAACTCGGCGTCGGTGCGACAC
+CGCAACGCAGGGGTCGAGTGGCCGACCCCTCTCGGGTCGAAGCCCACCAGGTCGAAGTGGCGGAGAATGT
+CGGTGTCGGCGATCGCGGGTGCCATAGCGGCGACCATGTCGACCGCCGACGCCCCGGGTCCCCCAGGATT
+GACCAGCAGTGCTCCGAATCGCTGTCCCGTCGCGGGGACGCGGATCACCGCCAACTTCGCTTGTGTCCCA
+CCGGGTTGGTCGTAGTCGACGGGGACGGACACCGTCGCGCAGCGTGCAGTGCGAATTTCGCTGGTGTCGG
+CGATGAACTCGCGGCAGCTGTTCCAACTCTGTTGCGGCGCCACGACCGGCGCACCCGGGGTTTGGCCGGC
+GCCGGGTTCTTCAGTCGCGCCGGCCAACGGGGGCGCTGCTAGGGGCAGTCCGCCGAGCAGCAACCCGAAG
+GACAGCAGCGCCGAGCTCAACGGTCTGCGGCGCCACATGGCCGCCATCGTCTCACCGGCGAATACCTGTG
+ACGGCGCGAAATGATCACACCTTCGTCTCTTCGCCCCGCTAGCACTTGGCGCCGCTGGGCGGCGTGGTGC
+CGCCGATCAAATACGCCGTCACGTACTCGTCAATGCAGCTGTCGCCCTGGAATACCACCGTGTGCTGGGT
+TCCGTCGAAGGTCAGCAACGAACCGCGAAGCTGGTTCGCCAGGTCGACCCCGGCCTTGTACGGCGTCGCC
+GGGTCATGGGTGGTGGATACCACCACCGTCGGCACTAGGCCGGGCGCCGAGACGGCATGGGGCTGACTTG
+TGGGTGGCACCGGCCAGAACGCGCAGGTGCCCAGCGGCGCATCACCGGTGAACTTCCCGTAGCTCATGAA
+CGGTGCGATCTCCCGGGCGCGGCGGTCTTCGTCGATGACCTTGTCGCGATCGGTAACCGGGGGCTGATCG
+ACGCAATTGATCGCCACCCGCGCGTCACCGGAATTGTTGTAGCGGCCGTGCGAGTCCCGACGCATGTACA
+TGTCGGCCAGAGCCAGCAGGGTGTCTCCGCGATTGTCGACCAGCTCCGACAGCCCGTCGGTCAAGTGTTG
+CCACAGATTCGGTGAGTACAGCGCCATAATGGTGCCCACGATGGCGTCGCTATAACTCAGCCCGCGCGGA
+TCCTTCGTGCGCGCCGGCCTGCTGATCCTCGGGTTGTCCGGGTCGACCAACGGATCGACCAGGCTGTGGT
+AGACCTCGACGGCTTTGGCCGGGTCGGCGCCCAGCGGGCAGCCCGCGTTCTTGGCGCAGTCGGCGGCATA
+GTTGTTGAACGCGTCCTGGAAGCCCTTGGCCTGGCGCAGCTCCGCCTCGATGGGATCGGCATTGGGGTCG
+ACGGCACCGTCGAGAATCATTGCCCGCACCCGCTGCGGAAATTCCTCGGCATACGCGGAGCCGATCCGGG
+TGCCGTACGAGTAGCCCAGGTAGGTCAGCTTGTCGTCGCCCAACGCCGCGCGAATGGCATCCAGGTCCTT
+GGCGACGTTGACCGTCCCGACATGGGCCAGAAAGTTCTTGCCCATCTTGTCCACACAGCGACCGACGAAT
+TGCTTGGTCTCGTTCTCGATGTGCGCCACACCCTCCCGGCTGTAGTCAACCTGCGGCTCGGCCCGCAGCC
+GGTCGTTGTCGGCATCGGAGTTGCACCAGATCGCCGGCCGGGACGACGCCACCCCGCGGGGGTCGAACCC
+AACCAGGTCGAACCTTTCGTGCACCCGCTTCGGCAATGTCTGGAAGACGCCCAAGGCGGCCTCGATACCG
+GATTCGCCGGGTCCACCGGGATTTATGACCAGCGAACCGATCTTGTCTCCCGTCGCCGGAAAGCGAATCA
+GCGCCAGCGCCGCCACGTCACCATCGGGGCGGTCGTAGTCGACCGGTACAGCGAGCTTGCCGCATAACGC
+GCCGCCGGGGATCTTTACTTGCGGGTTTGACGACCGGCACGGTGTCCACTCCACCGGCTGGCCCAGCTTC
+GGCTCCGCCATACGAGCGCGTCCCCCGACCACGCGGATGCAGCCCACAAGAACCAACGCCACGGCGGCGA
+GCGCGGCCCAGATCAACAGCATGCGCGCGATCTTGTCGCGGCGAGACAGCCTCATGCCCACAATGCTGCC
+AGAGCAGACCCGAGATCCTGGCCAGCGGCCACCGTCGGCCGACTAACCGGCCGCTGCCAGCAGTCCTGCC
+ATCGCCGATGGCGAACTCGTCGGCCATCCCCCATACGTCCGGTAACAGATCCGGGCAAGACACCGACCCG
+TCGACCGGATCCGGCACGGGCGCGTCGGCCTCGGCGGTGCACAACTGCGACATCAGGTTGGCGCTGGCAC
+CCCGTCCACGCCGGCATGGTGCACCTTGGCCATCGCCCGAGGGCGATCCCCGATGCCGTCCACCCCTTCG
+ACGAACCCATCTCCCACGGCGGTCGCCGGCAGCGACGCGATGTGGCCGCAGATCTCCGAGAGTTCGGCCC
+GCCCGCCCGGCGACGGCAACCCGATGCCGTGCAAGTGACGATCGATGTGAGGTTCAAGGTTCAGCGCACT
+GCTGGCAAGCTTTTTCCGAAACCGCGGCCTCGCCTTGATCTGGAGTCAGAACGCGTCACGCAGCCGGTCA
+AAGGCGTAACCCATGCTCGAGCAAACATGCATGGGCTGAGTGGACGTTTCCAGACACAGCAACTGGCGTC
+CAGGCCACTGAGCCGCTGCATGCGCGATGGTATGCCGATGGGGGCCCCGGGCGCGTCTGAGGGGAAGAAG
+TGGCAGACTGTCAGGGTCCGACGAACCCGGGGACCCTAACGGGCCACGAGGATCGACCCGACCACCATTA
+GGGACAGTGATGTCTGAGCAGACTATCTATGGGGCCAATACCCCCGGAGGCTCCGGGCCGCGGACCAAGA
+TCCGCACCCACCACCTACAGAGATGGAAGGCCGACGGCCACAAGTGGGCCATGCTGACGGCCTACGACTA
+TTCGACGGCCCGGATCTTCGACGAGGCCGGCATCCCGGTGCTGCTGGTCGGTGATTCGGCGGCCAACGTC
+GTGTACGGCTACGACACCACCGTGCCGATCTCCATCGACGAGCTGATCCCGCTGGTCCGTGGCGTGGTGC
+GGGGTGCCCCGCACGCACTGGTCGTCGCCGACCTGCCGTTCGGCAGCTACGAGGCGGGGCCCACCGCCGC
+GTTGGCCGCCGCCACCCGGTTCCTCAAGGACGGCGGCGCACATGCGGTCAAGCTCGAGGGCGGTGAGCGG
+GTGGCCGAGCAAATCGCCTGTCTGACCGCGGCGGGCATCCCGGTGATGGCACACATCGGCTTCACCCCGC
+AAAGCGTCAACACCTTGGGCGGCTTCCGGGTGCAGGGCCGCGGCGACGCCGCCGAACAAACCATCGCCGA
+CGCGATCGCCGTCGCCGAAGCCGGAGCGTTTGCCGTCGTGATGGAGATGGTGCCCGCCGAGTTGGCCACC
+CAGATCACCGGCAAGCTTACCATTCCGACGGTCGGGATCGGCGCTGGGCCCAACTGCGACGGCCAGGTCC
+TGGTATGGCAGGACATGGCCGGGTTCAGCGGCGCCAAGACCGCCCGCTTCGTCAAACGGTATGCCGATGT
+CGGTGGTGAACTACGCCGTGCTGCAATGCAATACGCCCAAGAGGTGGCCGGCGGGGTATTCCCCGCTGAC
+GAACACAGTTTCTGACCAAGCCGAATCAGCCCGATGCGCGGGCATTGCGGTGGCGCCCTGGATGCCGTCG
+ACGCCGGATTGCCGGCGCGGACGCGCCAGCGGGACCCATCGGCGTCGCGTTCGCCGGTTGAGCCCGGGGT
+GAGCCCAGACATTCGATGTGCCCAACACCATCCGCCACAGCCCAATTGATGTGGCACTCTATGCATGCCT
+ATCCCCGACCAACCACCACCGCGGCGACGCATCATGACCGGAGGCGAAGATGCCAGTAGAGGCGCCCAGA
+CCAGCGCGCCATCTGGAGGTCGAGCGCAAGTTCGACGTGATCGAGTCGACGGTGTCGCCGTCGTTCGAGG
+ACATCGCCGCGGTGGTTCGCGTCGAGCAGTCGCCGACCCAGCAGCTCGACGCGGTGTACTTCGACACACC
+GTCGCACGACCTGGCGCGCAACCAGATCACCTTGCGGCGCCGCACCGGCGGCGCCGACGCCGGCTGGCAT
+CTGAAGCTGCCGGCCGGACCCGACAAGCGCACCGAGATGCGAGCACCGCTGTCCGCATCAGGCGACGCTG
+TGCCGGCCGAGTTGTTGGATGTGGTGCTGGCGATCGTCCGCGACCAGCCGGTTCAGCCGGTCGCGCGGAT
+CAGCACTCACCGCGAAAGCCAGATCCTGTACGGCGCCGGGGGCGACGCGCTGGCGGAATTCTGCAACGAC
+GACGTCACCGCATGGTCGGCCGGGGCATTCCACGCCGCTGGTGCAGCGGACAACGGCCCTGCCGAACAGC
+AGTGGCGCGAATGGGAACTGGAACTGGTCACCACGGATGGGACCGCCGATACCAAGCTACTGGACCGGCT
+AGCCAACCGGCTGCTCGATGCCGGTGCCGCACCTGCCGGCCACGGCTCCAAACTGGCGCGGGTGCTCGGT
+GCGACCTCTCCCGGTGAGCTGCCCAACGGCCCGCAGCCGCCGGCGGATCCAGTACACCGCGCGGTGTCCG
+AGCAAGTCGAGCAGCTGCTGCTGTGGGATCGGGCCGTGCGGGCCGACGCCTATGACGCCGTGCACCAGAT
+GCGAGTGACGACCCGCAAGATCCGCAGCTTGCTGACGGATTCCCAGGAGTCGTTTGGCCTGAAGGAAAGT
+GCGTGGGTCATCGATGAACTGCGTGAGCTGGCCAATGTCCTGGGCGTAGCCCGGGACGCCGAGGTACTCG
+GTGACCGCTACCAGCGCGAACTGGACGCGCTGGCGCCGGAGCTGGTACGCGGCCGGGTGCGCGAGCGCCT
+GGTAGACGGGGCGCGGCGGCGATACCAGACCGGGCTGCGGCGATCACTGATCGCATTGCGGTCGCAGCGG
+TACTTCCGTCTGCTCGACGCTCTAGACGCGCTTGTGTCCGAACGCGCCCATGCCACTTCTGGGGAGGAAT
+CGGCACCGGTAACCATCGATGCGGCCTACCGGCGAGTCCGCAAAGCCGCAAAAGCCGCAAAGACCGCCGG
+CGACCAGGCGGGCGACCACCACCGCGACGAGGCATTGCACCTGATCCGCAAGCGCGCGAAGCGATTACGC
+TACACCGCGGCGGCTACTGGGGCGGACAATGTGTCACAAGAAGCCAAGGTCATCCAGACGTTGCTAGGCG
+ATCATCAAGACAGCGTGGTCAGCCGGGAACATCTGATCCAGCAGGCCATAGCCGCGAACACCGCCGGCGA
+GGACACCTTCACCTACGGTCTGCTCTACCAACAGGAAGCCGACTTGGCCGAGCGCTGCCGGGAGCAGCTT
+GAAGCCGCGCTGCGCAAACTCGACAAGGCGGTCCGCAAAGCACGGGATTGAGCCCGCCAGGGGCGGACGA
+GTTGGCCTGTAAGCCGGATTCTGTTCCGCGCCGCCACAGCCAAGCTAACGGCGGCACGGCGGCGACCATC
+CATCTGGACACACCGTTACCGGGTGCCTCGAGCGGCCTACCCGCAGGCTCGGGCGAGCAACCCTCAAGCG
+CCTGCGCGGCCGCACTTTCGGTGCGGCCTTCTTGGCCTTGCTTCGGGTGGGGTTTGCCTAGCCACCCCGG
+TCACCCGGAATGCTGGTGCGCTCTTACCGCACCGTTTCACCCTTGCCACCACGAGGATGGCGGTCTGTTT
+TCTGTGGCACTTTCCCGCGAGTCACCTCGGATTGCCGTTAGCAATCACCCTGCTCTGTGAAGTCCGGACT
+TTCCTCGACTCGACGCTGAACCTCGTGAATCCACACAAGCCCTACGCGAGCCGCGGCCGCCCAGCCAACT
+CATCCGCGACGACCACGCTACCCCGCTGGGCGGTGTCGCGGCCAGTGTGACCGCTGGACGACACGGCTAG
+TCGGACAGCCGATCCGGCGGGCAGTCCTTATCGTGGACTGGTGACACGGTGGGACAAACGCGTCGACTCC
+GGCGACTGGGACGCCATCGCTGCCGAGGTCAGCGAGTACGGTGGCGCACTGCTACCTCGGCTGATCACCC
+CCGGCGAGGCCGCCCGGCTGCGCAAGCTGTACGCCGACGACGGCCTGTTTCGCTCGACGGTCGATATGGC
+ATCCAAGCGGTACGGCGCCGGGCAGTATCGATATTTCCATGCCCCCTATCCCGAGCCGATCGAGCGTCTC
+AAGCAGGCGCTGTATCCCAAACTGCTGCCGATAGCGCGCAACTGGTGGGCCAAACTGGGCCGGGAGGCGC
+CCTGGCCAGACAGCCTTGATGACTGGTTGGCGAGCTGTCATGCCGCCGGCCAAACCCGATCCACAGCGCT
+GATGTTGAAGTACGGCACCAACGACTGGAACGCCCTACACCAGGATCTCTACGGCGAGTTGGTGTTTCCG
+CTGCAGGTGGTGATCAACCTGAGCGATCCGGAAACCGACTACACCGGCGGCGAGTTCCTGCTTGTCGAAC
+AGCGGCCTCGCGCCCAATCCCGGGGTACCGCAATGCAACTTCCGCAGGGACATGGTTATGTGCTCACGAC
+CCGTGATCGGCCGGTGCGGACTAGCCGTGGCTGGTCGGCATCTCCAGTGCGCCATGGGCTTTCGACTATT
+CGTTCCGGCGAACGCTATGCCATGGGGCTGATCTTTCACGACGCAGCCTGATTGCACGCCATCTATAGAT
+AGCCTGTCTGATTCACCAATCGCACCGACGATGCCCCATCGGCGTAGAACTCGGCGATGCTCAGCGATGC
+CAGATCAAGATGCAACCGATATAGGACGCCCGACCCGGCATCCAACGCCAGCCGCAACAACATTTTGATC
+GGCGTGACATGTGACACCACCAGCACCGTCGCGCCTTCGTAGCCAACGATGATCCGATCACGTCCCCGCC
+GAACCCGCCGCAGCACGTCGTCGAAGCTTTCCCCACCCGGGGGCGTGATGCTGGTGTCCTGCAGCCAGCG
+ACGGTGCAGCTCGGGATCGCGTTCTGCGGCCTCCGCGAACGTCAGCCCCTCCCAGGCGCCGAAGTCGGTC
+TCGACCAGGTCGTCATCGACGACCACGTCCAGGGCCAGGGCTCTGGCGGCGGTCACCGCGGTGTCGTAAG
+CCCGCTGTAGCGGCGAGGAGACCACCGCAGCGATCCCGCCGCGCCGCGCCAGATACCCGGCCGCCGCACC
+AACCTGGCGCCACCCCACCTCGTTCAACCCCGGGTTGCCGCGCCCCGAATAGCGGCGTTGCTCCGACAGC
+TCCGTCTGCCCGTGGCGCAACAAAAGTAGTCGGGTGGGTGTACCGCGGGCGCCGGTCCAGCCGGGAGATG
+TCGGTGACTCGGTCGCAACGATTTTGGCAGGATCCGCATCCGCCGCAGCCGATTGCGCGGCGGCGTCCAT
+CGCGTCATTGGCCAACCGGTCTGCATACGTGTTCCGGGCACGCGGAACCCACTCGTAGTTGATCCTGCGA
+AACTGGGACGCCAACGCCTGAGCCTGGACATAGAGCTTCAGCAGATCCGGGTGCTTGACCTTCCACCGCC
+CGGACATCTGCTCCACCACCAGCTTGGAGTCCATCAGCACCGCGGCCTCGGTGGCACCTAGTTTCACGGC
+GTCGTCCAAACCGGCTATCAGGCCGCGGTATTCGGCGACGTTGTTCGTCGCCCGGCCGATCGCCTGCTTG
+GACTCGGCCAGCACGGTGGAGTGATCGGCGGTCCACACCACCGCGCCGTATCCGGCCGGTCCGGGATTGC
+CCCGCGATCCGCCGTCGGCTTCGATGACAACTTTCACTCCTCAAATCCTTCGAGCTGCAACAAGATCGCT
+CCGCATTCCGGGCAGCGCACCACTTCATCCTCGGCGGCCGCCGAGATCTGGGCCAGCTCGCCGCGGCCGA
+TCTCGATCCGGCAGGCACCACATCGATGACCTTGCAACCGCCCGGCCCCTGGCCCGCCTCCGGCCCGCTG
+TCTTTCGTAGAGCCCCGCAAGCTCGGGATCAAGTGTCGCCGTCAGCATGTCGCGTTGCGATGAATGTTGG
+TGCCGGGCTTGGTCGATTTCGGCAAGTGCCTCGTCCAAAGCCTGCTGGGCGGCGGCCAGGTCGGCCCGCA
+ACGCTTGGAGCGCCCGCGACTCGGCGGTCTGTTGAGCCTGCAGCTCCTCGCGGCGTTCCAGCACCTCCAG
+CAGGGCATCTTCCAAACTGGCTTGACGGCGTTGCAAGCTGTCGAGCTCGTGCTGCAGATCAGCCAATTGC
+TTGGCGTCCGTTGCACCCGAAGTGAGCAACGACCGGTCCCGGTCGCCACGCTTACGCACCGCATCGATCT
+CCGACTCAAAACGCGACACCTGGCCGTCCAAGTCCTCCGCCGCGATTCGCAGGGCCGCCATCCTGTCGTT
+GGCGGCGTTGTGCTCGGCCTGCACCTGCTGGTAAGCCGCCCGCTGCGGCAGATGGGTAGCCCGATGCGCG
+ATCCGGGTCAGCTCAGCATCCAGCTTCGCCAATTCCAGTAGCGACCGTTGCTGTGCCACTCCGGCTTTCA
+TGCCTGATCTCTCCCAGTTTCGTGATCGAGGTTCCACGGGTCGGTGCAGATGGTGCACACACGCACCGGC
+AGCGACGCGCCGAAATGAGACCGCAACACTTCGGCGGCCTGGCCGCACCACGGGAATTCGCTTGCCCAAT
+GCGCGACGTCGATCAGGGCCACTTGCGAAGCTCGGCAATGCTCGTCGGCTGGATGATGTCGCAGATCGGC
+CGTAACGTACGCTTGCACGTCCGCGGCGGCCACGGTGGCAAGCAACGAGTCCCCGGCGCCGCCGCAGACC
+GCGACCCGCGACACCAGCAGGTCGGGATCCCCGGCGGCGCGCACACCGGTCGCAGTCGGCGGCAACGCGG
+CCTCCAGACGGGCAACAAAGGTGCGCAGCGGTTCGGGTTTTGGCAGTCTGCCAATCCGGCCTAACCCGCT
+GCCGACCGGCGGTGGTACCAGCGCGAAGATGTCGAATGCCGGCTCCTCGTAAGGGTGCGCGGCGCGCATC
+GCCGCCAACACCTCGGCGCGCGCTCGTGCGGGTGCGACGACCTCGACCCGGTCCTCGGCCACCCGTTCGA
+CGGTACCGACGCTGCCTATGGCGGGCGACGCCCCGTCGTGCGCCAGGAACTGCCCGGTACCCGCGACACT
+CCAGCTGCAGTGCGAGTAGTCGCCGATATGGCCGGCACCGGCCTCAAAGACCGCTGCCCGCACCGCCTCT
+GAGTTCTCGCGCGGCACATAGATGACCCACTTGTCGAGATCGGCCGCTCCGGGCACCGGGTCGAGAACGG
+CGTCGACGGTCAGACCAACAGCGTGTGCCAGCGCGTCGGACACACCCGGCGACGCCGAGTCGGCGTTGGT
+GTGCGCGGTAAACAACGAGCGACCGGTCCGGATCAGGCGGTGCACCAGCACACCCTTTGGCGTGTTGGCC
+GCGACCGTATCGACCCCACGCAGTAACAACGGGTGGTGCACCAATAGCAGTCCGGCCTGGGGAACCTGGT
+CCACCACCGCCGGCGTCGCGTCCACCGCAACGGTCACCGAATCCACCACGTCGTCGGGGTCGCCGCACAC
+CAGACCCACCGAATCCCACGACTGGGCAAGCCGCGGCGGGTAGGCCTGGTCCAGCACGTCGATGACATCG
+GCCAGCCGCACACTCATCGGCGTCCTCCACGCTTTGCCCACTCGGCGATCGCCGCCACCAGCACGGGCCA
+CTCCGGGCGCACCGCCGCCCGCAGGTACCGCGCGTCCAGGCCGACGAAGGTGTCACCGCGGCGCACCGCA
+ATTCCTTTGCTCTGCAAATAGTTTCGTAATCCGTCAGCATCGGCGATGTTGAACAGTACGAAAGGGGCCG
+CACCATCGACCACCTCGGCACCCACCGATCTCAGTCCGGCCACCATCTCCGCGCGCAGCGCCGTCAACCG
+CACCGCATCGGCTGCGGCAGCGGCGACCGCCCGGGGGGCGCAGCAAGCAGCGATGGCCGTCAGTTGCAAT
+GTTCCCAACGGCCAGTGCGCTCGCTGCACGGTCAACCGAGCCAGCACGTCTGGCGAGCCGAGCGCGTAGC
+CCACCCGCAATCCGGCCAGCGACCACGTTTTCGTCAAGCTACGGAGCACCAGCACATCGGGCAGCGAGTC
+ATCGGCCAACGATTGCGGCTCGCCGGGAACCCAATCAGCGAACGCCTCGTCGACCACCAGGATGCGTCCC
+GGCCGGCGTAACTCGAGCAGCTGCTCGCGGAGGTGCAGCACCGAGGTGGGGTTGGTCGGATTACCCACGA
+CGACAAGGTCGGCGTCGTCAGGCACGTGCGCGGTGTCCAGCACGAACGGCGGCTTTAGGACAACATGGTG
+CGCCGTGATTCCGGCAGCGCTCAAGGCTATGGCCGGCTCGGTGAACGCGGGCACGACGATTGCTGCCCGC
+ACCGGACTTAGGTTGTGCAGCAATGCGAATCCCTCCGCCGCCCCGACGAGCGGGAGCACTTCGTCACGGG
+TTCTGCCATGACGTTCAGCGACCGCGTCTTGCGCCCGGTGCACATCGTCGGTGCTCGGATAGCGGGCCAG
+CTCCGGCAGCAGCGCGGCGAGCTGCCGGACCAACCATTCCGGGGGCCGGTCATGGCGGACGTTGACGGCG
+AAGTCCAGCACGCCGGGCGCGACATCCTGATCACCGTGGTAGCGCGCCGCGGCAAGCGGGCTAGTGTCTA
+GACTCGCCACAGCGTCAAACAGTAGTGGGCCGGTGTGCGGGCCAAGAATCCAGAGCACCGCCGACGCGTT
+GTCTACGCGGCGACAACCGCGACATCACAGGCAGCTAACAGGGCGTCGGCGGTGATGATCGTCAGGCCAA
+GCAGCTGTGCCTGGGCGATGAGCACACGGTCGAATGGATGTCGATGGTGATCCGGAAGCTCTGCGGTGCG
+CAGTGTGTGCGTGGTCAACTGACAGCGGCGACGTGCCGCAGCGGCGCATTCGATCGGGCACGTAAGAGGC
+CGATGGCTCGGGCGGCGGGAGCTTGCCGAGGCGGTAGTTGATCGCGATCTCCCAGGCACTGGCGGCCGAC
+AAGAGAATGCTGTTGCGGACGTCCTGAACAATCGCCCGTGTTTCGTTGACGGCATCCGCAGCCAAACGTG
+GGTGTCGATGAGGTAGCGCTTCACCGGTGAAAGCGTTCGAGCACGTCGTCTGACAACGGAGCGTCCAAAT
+CGTCGGGCACGCGGTACACGCCATGGTCAATGCCTAACCGCCGAGTCTCATGAGGATGCAGCGGCACAAG
+CTTTGCTACCGGCTCGCCGCGGCGGGCAATCTCAACCTCTGCCCGCCGTAGACGAGCCGCAGCAGCTCGG
+ACAGGCGTGTCTTCGCCTCGTGAACGCCGACCCGCTTCGCAGGCGCCCAGACTTTCGCGTCGACCACCTG
+CTCACCAAACTTCGCGATCATCGCCTGATACCACAGCGCCAACGGGTAGCGGTTTGTCCAACCGCTTCGT
+CAACGACAATGGGATCGTGACCGACACGACCGCGAGCGGGACCAATTGCCCGCCTCCTCCACGCGCCGCC
+GCACGGCGCGCATCGTCGCCGGGTGAATCGCCGCAGCTGGTGATCTTCGATCTGGACGGCACGCTGACCG
+ACTCGGCGCGCGGAATCGTATCCAGCTTCCGACACGCGCTCAACCACATCGGTGCCCCAGTACCCGAAGG
+CGACCTGGCCACTCACATCGTCGGCCCGCCCATGCATGAGACGCTGCGCGCCATGGGGCTCGGCGAATCC
+GCCGAGGAGGCGATCGTAGCCTACCGGGCCGACTACAGCGCCCGCGGTTGGGCGATGAACAGCTTGTTCG
+ACGGGATCGGGCCGCTGCTGGCCGACCTGCGCACCGCCGGTGTCCGGCTGGCCGTCGCCACCTCCAAGGC
+AGAGCCGACCGCACGGCGAATCCTGCGCCACTTCGGAATTGAGCAGCACTTCGAGGTCATCGCGGGCGCG
+AGCACCGATGGCTCGCGAGGCAGCAAGGTCGACGTGCTGGCCCACGCGCTCGCGCAGCTGCGGCCGCTAC
+CCGAGCGGTTGGTGATGGTCGGCGACCGCAGCCACGACGTCGACGGGGCGGCCGCGCACGGCATCGACAC
+GGTGGTGGTCGGCTGGGGCTACGGGCGCGCCGACTTTATCGACAAGACCTCCACCACCGTCGTGACGCAT
+GCCGCCACGATTGACGAGCTGAGGGAGGCGCTAGGTGTCTGATCCGCTGCACGTCACATTCGTTTGTACG
+GGCAACATCTGCCGGTCGCCAATGGCCGAGAAGATGTTCGCCCAACAGCTTCGCCACCGTGGCCTGGGTG
+ACGCGGTGCGAGTGACCAGTGCGGGCACCGGGAACTGGCATGTAGGCAGTTGCGCCGACGAGCGGGCGGC
+CGGGGTGTTGCGAGCCCACGGCTACCCTACCGACCACCGGGCCGCACAAGTCGGCACCGAACACCTGGCG
+GCAGACCTGTTGGTGGCCTTGGACCGCAACCACGCTCGGCTGTTGCGGCAGCTCGGCGTCGAAGCCGCCC
+GGGTACGGATGCTGCGGTCATTCGACCCACGCTCGGGAACCCATGCGCTCGATGTCGAGGATCCCTACTA
+TGGCGATCACTCCGACTTCGAGGAGGTCTTCGCCGTCATCGAATCCGCCCTGCCCGGCCTGCACGACTGG
+GTCGACGAACGTCTCGCGCGGAACGGACCGAGTTGATGCCCCGCCTAGCGTTCCTGCTGCGGCCCGGCTG
+GCTGGCGTTGGCCCTGGTCGTGGTCGCGTTCACCTACCTGTGCTTTACGGTGCTCGCGCCGTGGCAGCTG
+GGCAAGAATGCCAAAACGTCACGAGAGAACCAGCAGATCAGGTATTCCCTCGACACCCCGCCGGTTCCGC
+TGAAAACCCTTCTACCACAGCAGGATTCGTCGGCGCCGGACGCGCAGTGGCGCCGGGTGACGGCAACCGG
+ACAGTACCTTCCGGACGTGCAGGTGCTGGCCCGACTGCGCGTGGTGGAGGGGGACCAGGCGTTTGAGGTG
+TTGGCCCCATTCGTGGTCGACGGCGGACCAACCGTCCTGGTCGACCGTGGATACGTGCGGCCCCAGGTGG
+GCTCGCACGTACCACCGATCCCCCGCCTGCCGGTGCAGACGGTGACCATCACCGCGCGGCTGCGTGACTC
+CGAACCGAGCGTGGCGGGCAAAGACCCATTCGTCAGAGACGGCTTCCAGCAGGTGTATTCGATCAATACC
+GGACAGGTCGCCGCGCTGACCGGAGTCCAGCTGGCTGGGTCCTATCTGCAGTTGATCGAAGACCAACCCG
+GCGGGCTCGGCGTGCTCGGCGTTCCGCATCTAGATCCCGGGCCGTTCCTGTCCTATGGCATCCAATGGAT
+CTCGTTCGGCATTCTGGCACCGATCGGCTTGGGCTATTTCGCCTACGCCGAGATCCGGGCGCGCCGCCGG
+GAAAAAGCGGGGTCGCCACCACCGGACAAGCCAATGACGGTCGAGCAGAAACTCGCTGACCGCTACGGCC
+GCCGGCGGTAAACCAACATCACGGCCAATACCGCAGCCCCCGCCTGGACCACCCGCGACAGCACCACGGC
+GCGGCGCAGATCGGCCACCTTGGGCGACCGGCCGTCGCCCAAGGTGGGCCGGATCTGCAACTCATGGTGG
+TACCGGGTGGGCCCACCCAGCCGCACGTCAAGCGCCCCAGCAAACGCCGCCTCGACGACACCGGCGTTGG
+GGCTGGGATGGCGGGCGGCGTCGCGCCGCCAGGCCCGTACCGCACCGCGGGGCGACCCACCGACCACCGG
+CGCGCAGATCACCACCAGCACCGCCGTCGCCCGTGCGCCAACATAGTTGGCCCAGTCATCCAATCGTGCT
+GCAGCCCAACCGAATCGGAGATAACGCGGCGAGCGGTAGCCGATCATCGAGTCCAGGGTGTTGATGGCAC
+GATATCCCAGCACCGCAGGCACGCCGCTCGAAGCCGCCCACAGCAGCGGCACCACCTGGGCGTCGGCGGT
+GTTTTCGGCCACCGACTCCAGCGCGGCACGCGTCAGGCCCGGGCCGCCCAGCTGGGCCGGGTCACGCCCG
+CACAGCGACGGCAGCAGCCGTCGCGCCGCCTCGACATCGTCGCGCTCCAACAGGTCCGATATCTGGCGGC
+CGGTGCGCGCCAGCGAAGTTCCGCCCAGCGCTGCCCAGGTGGCCGTCGCGGTGGCCGCCACGGGCCAGCA
+CCTGCCGGGTAGCCGCTGCAGTGCCGCGCCGAGCAAGCCCACCGCGCCGACCAGCAGGCCGACGTGTACC
+GCACCGGCGACCCGGCCGTCACGGTAGGTGATCTGCTCCAGCTTGGCGGCCGCCCGACCGAACAGGGCCA
+CCGGATGACCTCGTTTGGGGTCGCCGAACACGACGTCGAGCAGGCAGCCGATCAGCACGCCGACGGCCCT
+GGTCTGCCAGATCGATGCAAACACTCCGGCAGCGTCGCACACGTGGTCTACGCTCAGCTATTTATGACCT
+CATACGGCAGCTATCCACGATGAAGCGGCCAGCTACCCGGGTTGCCGACCTGTTGAACCCGGCGGCAATG
+TTGTTGCCGGCAGCGAATGTCATCATGCAGCTGGCAGTGCCGGGTGTCGGGTATGGCGTGCTGGAAAGCC
+CGGTGGACAGCGGCAACGTCTACAAGCATCCGTTCAAGCGGGCCCGGACCACCGGCACCTACCTGGCGGT
+GGCGACCATCGGAACGGAATCCGACCGAGCGCTGATCCGGGGTGCCGTGGACGTCGCGCACCGGCAGGTT
+CGGTCGACGGCCTCGAGCCCGGTGTCCTATAACGCCTTCGACCCGAAGTTGCAGCTGTGGGTGGCGGCGT
+GTCTGTACCGCTACTTCGTGGACCAGCACGAGTTTCTGTACGGCCCACTCGAAGATGCCACCGCCGACGC
+CGTCTACCAAGACGCCAAACGGTTAGGGACCACGCTGCAGGTGCCGGAGGGGATGTGGCCGCCGGACCGG
+GTCGCGTTCGACGAGTACTGGAAGCGCTCGCTTGATGGGCTGCAGATCGACGCGCCGGTGCGCGAGCATC
+TTCGCGGGGTGGCCTCGGTAGCGTTTCTCCCGTGGCCGTTGCGCGCGGTGGCCGGGCCGTTCAACCTGTT
+TGCGACGACGGGATTCTTGGCACCGGAGTTCCGCGCGATGATGCAGCTGGAGTGGTCACAGGCCCAGCAG
+CGTCGCTTCGAGTGGTTACTTTCCGTGCTACGGTTAGCCGACCGGCTGATTCCGCATCGGGCCTGGATCT
+TCGTTTACCAGCTTTACTTGTGGGACATGCGGTTTCGCGCCCGACACGGCCGCCGAATCGTCTGATAGAG
+CCCGGCCGAGTGTGAGCCTGACAGCCCGACACCGGCGGCGTGTGTCGCGTCGCCAGGTTCACGCTCGGCG
+ATCTAGAGCCGCCGAAAACCTACTTCTGGGTTGCCTCCCGAATCAACGTGCTGATCTGCTCGAGCAGCTC
+ACGCATATCGGCGCGCATCGCATCCACCGCGGCATACAGGTCGGCCTTGGTCGCCGGCAGCTGGTCCGAC
+GTCATTGGCCGCACCGGCGGTGCTGTCTGTCGCGCCGCGCTGTCGCTTTGAAACCCAGGTCGCTCACCCA
+CGACCACGACACTGCCATATCCGGCGCCCCGCCGACAACGAAGCACAGCTAGCCGGTGGGCGCGGACGGG
+ATCGAACCGCCGACCGCTGGTGTGTAAAACCAGAGCTCTACCGCTGAGCTACGCGCCCATGACCGCCGCA
+GGCTACACGCCTTGCGGCCAAGCACCCAAAACCTTAGGCCGTAAGCGCCGCCAGAGCGTCGGTCCACAGC
+CGCTGATCGCGAACTTCACCCGGCTGCTTCATCTCGGCGAACCGAATGATCCCTGACCGATCGACCACAA
+AGGTGCCCCGGTTAGCGATGCCGGCCTGCTCGTTGAAGACGCCGTAGGCCTGACTGACCGCGCCGTGTGG
+CCAGAAGTCCGACAACAGCGGAAACGTGAATCCGCTCTGCGTCGCCCAGATCTTGTGAGTGGGTGGCGGG
+CCCACCGAAATCGCTAGCGCGGCGCTGTCGTCGTTCTCAAACTCGGGCAGGTGATCACGCAACTGGTCCA
+GCTCGCCCTGGCAGATGCCCGTGAACGCCAACGGAAAGAACACCAACAGCACGTTCTTTGCACCCCGGTA
+GCCGCGCAGGGTGACAAGCTGCTGATTCTGGTCGCGCAACGTGAAGTCAGGGGCGGTGGCTCCGACGTTC
+AGCATCAGCGCTTGCCAGCCCGCGATTTCGGCTGTACCAATCTGCTGGCGCTCCAGTTGCCCAGATTGAC
+CGACGAGGTCGGCATCAGCCCAGCTGTGGGCGCCGCCTCGGCAATCTCGGCGGGCAATACATGGCCGGGC
+TGGCCGGTCTTGGGCGTCACCACCCAAATCACACCGTCCTCGGCGAGCGGGCCGATCGCATCCATCAGGG
+TGTCCACCAAATCGCCGTCGCCATCACGCCACCACAACAGGACGACATCGATGACCTCGTCGGTGTCTTC
+ATCGAGCAACTCTCCCCCGCACGCTTCTTCGATGGCCGCGCGGATGTCGTCGTCGGTGTCTTCGTCCCAG
+CCCCATTCCTGGATAAGTTGGTCTCGTTGGATGCCCAATTTGCGGGCGTAGTTCGAGGCGTGATCCGCCG
+CGACCACCGTGGAACCTCCTTCAGTCTCCGCGGGCCATGTGCACACCGTCGCGATGGGCATTATCGTCGC
+ACAGCCAGAACCGGTCCACCCGCCCGCCTCAGAAGGCGGCCACGCACATTTTCAATGCCTTTGTCTTGGT
+GTCGTTGAGCCGATCAACCCGCCGGTTGAATTCCGCTGTCGACGCGTGCGCACCGATGGCATTTGCCACC
+GCGCGGGCCGCGTCGACATATGCGTTGAGCGCATCCCCCAGTTGCGCGGACAGCGCGGCGCTCAGACTGC
+CTGAGACCGTCGAGGCACTGTTGTTGAGCGCGTCGATGGCCGGACCTTCGGTCGGCCCGGTGTTGCGGCC
+CTGATTGAACGCGGCCACGTAGGCGTTCACCTTGTCGATGGCGTCCTTGCTGGTGGCCGCCAGCGCGTCA
+CACGAGGTGCGAATCGCCTTGGTCGTCAGCGATTGTTGGCGCTGCGACTCCCGGATGCTCGACGTCGCCG
+CCGAAGCCGACACCGACGCGGACACCGACGAGCGGTAGGCCGGTGCGACGTTGGTGTCGGGCATGGCCGT
+ACCGTCGGTGACAGTGGTACATCCGACGATCCCCATCAGCAGCAGCGCGATGCAGCCGAGCGCCAGGGCG
+CCTCGCCTGGGGAGCTCCCCCCCGTGCCTGCGAGGCACGGCGCGCCATCCGATGAGCACGGCATGTGAGG
+TTACCTGGTCGCAGCGCGACCGCGCTGGCCGTGGTGTGTCGCGCATCCGCAGAACCGAGCGGAGTGCGGC
+TATCCGCCGCCGACGCCGGTGCGGCACGATAGGGGGACGACCATCTAAACAGCACGCAAGCGGAAGCCCG
+CCACCTACAGGAGTAGTGCGTTGACCACCGATTTCGCCCGCCACGATCTGGCCCAAAACTCAAACAGCGC
+AAGCGAACCCGACCGAGTTCGGGTGATCCGCGAGGGTGTGGCGTCGTATTTGCCCGACATTGATCCCGAG
+GAGACCTCGGAGTGGCTGGAGTCCTTTGACACGCTGCTGCAACGCTGCGGCCCGTCGCGGGCCCGCTACC
+TGATGTTGCGGCTGCTAGAGCGGGCCGGCGAGCAGCGGGTGGCCATCCCGGCATTGACGTCTACCGACTA
+TGTCAACACCATCCCGACCGAGCTGGAGCCGTGGTTCCCCGGCGACGAAGACGTCGAACGTCGTTATCGA
+GCGTGGATCAGATGGAATGCGGCCATCATGGTGCACCGTGCGCAACGACCGGGTGTGGGCGTGGGTGGCC
+ATATCTCGACCTACGCGTCGTCCGCGGCGCTCTATGAGGTCGGTTTCAACCACTTCTTCCGCGGCAAGTC
+GCACCCGGGCGGCGGCGATCAGGTGTTCATCCAGGGCCACGCTTCCCCGGGAATCTACGCGCGCGCCTTC
+CTCGAAGGGCGGTTGACCGCCGAGCAACTCGACGGATTCCGCCAGGAACACAGCCATGTCGGCGGCGGGT
+TGCCGTCCTATCCGCACCCGCGGCTCATGCCCGACTTCTGGGAATTCCCCACCGTGTCGATGGGTTTGGG
+CCCGCTCAACGCCATCTACCAGGCACGGTTCAACCACTATCTGCATGACCGCGGTATCAAAGACACCTCC
+GATCAACACGTGTGGTGTTTTTTGGGCGACGGCGAGATGGACGAACCCGAGAGCCGTGGGCTGGCCCACG
+TCGGCGCGCTGGAAGGCTTGGACAACTTGACCTTCGTGATCAACTGCAATCTGCAGCGACTCGACGGCCC
+GGTGCGCGGCAACGGCAAGATCATCCAGGAGCTGGAGTCGTTCTTCCGCGGTGCCGGCTGGAACGTCATC
+AAGGTGGTGTGGGGCCGCGAATGGGATGCCCTGCTGCACGCCGACCGCGACCGTGCGCTGGTGAATTTAA
+TGAATACAACACCCGATGGCGATTACCAGACCTATAAGGCCAACGACGGCGGCTACGTGCGTGACCACTT
+CTTCGGCCGCGACCCACGCACCAAGGCGCTGGTGGAGAACATGAGCGACCAGGATATCTGGAACCTCAAA
+CGGGGCGGCCACGATTACCGCAAGGTTTACGCCGCCTACCGCGCCGCCGTCGACCACAAGGGACAGCCGA
+CGGTGATCCTGGCCAAGACCATCAAAGGCTACGCGCTGGGCAAGCATTTCGAAGGACGCAATGCCACCCA
+CCAGATGAAAAAACTGACCCTGGAAGACCTTAAGGAGTTTCGTGACACGCAGCGGATTCCGGTCAGCGAC
+GCCCAGCTTGAAGAGAATCCGTACCTGCCGCCCTACTACCACCCCGGCCTCAACGCCCCGGAGATTCGTT
+ACATGCTCGACCGGCGCCGGGCCCTCGGGGGCTTTGTTCCCGAGCGCAGGACCAAGTCCAAAGCGCTGAC
+CCTGCCGGGTCGCGACATCTACGCGCCGCTGAAAAAGGGCTCTGGGCACCAGGAGGTGGCCACCACCATG
+GCGACGGTGCGCACGTTCAAAGAAGTGTTGCGCGACAAGCAGATCGGGCCGCGGATAGTCCCGATCATTC
+CCGACGAGGCCCGCACCTTCGGGATGGACTCCTGGTTCCCGTCGCTAAAGATCTATAACCGCAATGGCCA
+GCTGTATACCGCGGTTGACGCCGACCTGATGCTGGCCTACAAGGAGAGCGAAGTCGGGCAGATCCTGCAC
+GAGGGCATCAACGAAGCCGGGTCGGTGGGCTCGTTCATCGCGGCCGGCACCTCGTATGCGACGCACAACG
+AACCGATGATCCCCATTTACATCTTCTACTCGATGTTCGGCTTCCAGCGCACCGGCGATAGCTTCTGGGC
+CGCGGCCGACCAGATGGCTCGAGGGTTCGTGCTCGGGGCCACCGCCGGGCGCACCACCCTGACCGGTGAG
+GGCCTGCAACACGCCGACGGTCACTCGTTGCTGCTGGCCGCCACCAACCCGGCGGTGGTTGCCTACGACC
+CGGCCTTCGCCTACGAAATCGCCTACATCGTGGAAAGCGGACTGGCCAGGATGTGCGGGGAGAACCCGGA
+GAACATCTTCTTCTACATCACCGTCTACAACGAGCCGTACGTGCAGCCGCCGGAGCCGGAGAACTTCGAT
+CCCGAGGGCGTGCTGCGGGGTATCTACCGCTATCACGCGGCCACCGAGCAACGCACCAACAAGGCGCAGA
+TCCTGGCCTCCGGGGTAGCGATGCCCGCGGCGCTGCGGGCAGCACAGATGCTGGCCGCCGAGTGGGATGT
+CGCCGCCGACGTGTGGTCGGTGACCAGTTGGGGCGAGCTAAACCGCGACGGGGTGGCCATCGAGACCGAG
+AAGCTCCGCCACCCCGATCGGCCGGCGGGCGTGCCCTACGTGACGAGAGCGCTGGAGAATGCTCGGGGCC
+CGGTGATCGCGGTGTCGGACTGGATGCGCGCGGTCCCCGAGCAGATCCGACCGTGGGTGCCGGGCACATA
+CCTCACGTTGGGCACCGACGGGTTCGGCTTTTCCGACACTCGGCCCGCCGCTCGCCGCTACTTCAACACC
+GACGCCGAATCCCAGGTGGTCGCGGTTTTGGAGGCGTTGGCGGGCGACGGCGAGATCGACCCATCGGTGC
+CGGTCGCGGCCGCCCGCCAGTACCGGATCGACGACGTGGCGGCTGCGCCCGAGCAGACCACGGATCCCGG
+TCCCGGGGCCTAACGCCGGCGAGCCGACCGCCTTTGGCCGAATCTTCCAGAAATCTGGCGTAGCTTTTAG
+GAGTGAACGACAATCAGTTGGCTCCAGTTGCCCGCCCGAGGTCGCCGCTCGAACTGCTGGACACTGTGCC
+CGATTCGCTGCTGCGGCGGTTGAAGCAGTACTCGGGCCGGCTGGCCACCGAGGCAGTTTCGGCCATGCAA
+GAACGGTTGCCGTTCTTCGCCGACCTAGAAGCGTCCCAGCGCGCCAGCGTGGCGCTGGTGGTGCAGACGG
+CCGTGGTCAACTTCGTCGAATGGATGCACGACCCGCACAGTGACGTCGGCTATACCGCGCAGGCATTCGA
+GCTGGTGCCCCAGGATCTGACGCGACGGATCGCGCTGCGCCAGACCGTGGACATGGTTCGGGTCACCATG
+GAGTTCTTCGAAGAAGTCGTGCCCCTGCTCGCCCGTTCCGAAGAGCAGTTGACCGCCCTCACGGTGGGCA
+TTTTGAAATACAGCCGCGACCTGGCATTCACCGCCGCCACGGCCTACGCCGATGCGGCCGAGGCACGAGG
+CACCTGGGACAGCCGGATGGAGGCCAGCGTGGTGGACGCGGTGGTACGCGGCGACACCGGTCCCGAGCTG
+CTGTCCCGGGCGGCCGCGCTGAATTGGGACACCACCGCGCCGGCGACCGTACTGGTGGGAACTCCGGCGC
+CCGGTCCAAATGGCTCCAACAGCGACGGCGACAGCGAGCGGGCCAGCCAGGATGTCCGCGACACCGCGGC
+TCGCCACGGCCGCGCTGCGCTGACCGACGTGCACGGCACCTGGCTGGTGGCGATCGTCTCCGGCCAGCTG
+TCGCCAACCGAGAAGTTCCTCAAAGACCTGCTGGCAGCATTCGCCGACGCCCCGGTGGTCATCGGCCCCA
+CGGCGCCCATGCTGACCGCGGCGCACCGCAGCGCTAGCGAGGCGATCTCCGGGATGAACGCCGTCGCCGG
+CTGGCGCGGAGCGCCGCGGCCCGTGCTGGCTAGGGAACTTTTGCCCGAACGCGCCCTGATGGGCGACGCC
+TCGGCGATCGTGGCCCTGCATACCGACGTGATGCGGCCCCTAGCCGATGCCGGACCGACGCTCATCGAGA
+CGCTAGACGCATATCTGGATTGTGGCGGCGCGATTGAAGCTTGTGCCAGAAAGTTGTTCGTTCATCCAAA
+CACAGTGCGGTACCGGCTCAAGCGGATCACCGACTTCACCGGGCGCGATCCCACCCAGCCACGCGATGCC
+TATGTCCTTCGGGTGGCGGCCACCGTGGGTCAACTCAACTATCCGACGCCGCACTGAAGCATCGACAGCA
+ATGCCCTGTCATAGATTCCCTCGCCGGTCAGAGGGGGTCCAGCAGGGGCCCCGGAAAGATACCAGGGGCG
+CCGTCGGACGGAAAGTGATCCAGACAACAGGTCGCGGGACGATCTCAAAAACATAGCTTACAGGCCCGTT
+TTGTTGGTTATATACAAAAACCTAAGACGAGGTTCATAATCTGTTACACCGCGCAAAACCGTCTTCACAG
+TGTTCTCTTAGACACGTGATTGCGTTGCTCGCACCCGGACAGGGTTCGCAAACCGAGGGAATGTTGTCGC
+CGTGGCTTCAGCTGCCCGGCGCAGCGGACCAGATCGCGGCGTGGTCGAAAGCCGCTGATCTAGATCTTGC
+CCGGCTGGGCACCACCGCCTCGACCGAGGAGATCACCGACACCGCGGTCGCCCAGCCATTGATCGTCGCC
+GCGACTCTGCTGGCCCACCAGGAACTGGCGCGCCGATGCGTGCTCGCCGGCAAGGACGTCATCGTGGCCG
+GCCACTCCGTCGGCGAAATCGCGGCCTACGCAATCGCCGGTGTGATAGCCGCCGACGACGCCGTCGCGCT
+GGCCGCCACCCGCGGCGCCGAGATGGCCAAGGCCTGCGCCACCGAGCCGACCGGCATGTCTGCGGTGCTC
+GGCGGCGACGAGACCGAGGTGCTGAGTCGCCTCGAGCAGCTCGACTTGGTCCCGGCAAACCGCAACGCCG
+CCGGCCAGATCGTCGCTGCCGGCCGGCTGACCGCGTTGGAGAAGCTCGCCGAAGACCCGCCGGCCAAGGC
+GCGGGTGCGTGCACTGGGTGTCGCCGGAGCGTTCCACACCGAGTTCATGGCGCCCGCACTTGACGGCTTT
+GCGGCGGCCGCGGCCAACATCGCAACCGCCGACCCCACCGCCACGCTGCTGTCCAACCGCGACGGGAAGC
+CGGTGACATCCGCGGCCGCGGCGATGGACACCCTGGTCTCCCAGCTCACCCAACCGGTGCGATGGGACCT
+GTGCACCGCGACGCTGCGCGAACACACAGTCACGGCGATCGTGGAGTTCCCCCCCGCGGGCACGCTTAGC
+GGTATCGCCAAACGCGAACTTCGGGGGGTTCCGGCACGCGCCGTCAAGTCACCCGCAGACCTGGACGAGC
+TGGCAAACCTATAACCGCGGACTCGGCCAGAACAACCACATACCCGTCAGTTCGATTTGTACACAACATA
+TTACGAAGGGAAGCATGCTGTGCCTGTCACTCAGGAAGAAATCATTGCCGGTATCGCCGAGATCATCGAA
+GAGGTAACCGGTATCGAGCCGTCCGAGATCACCCCGGAGAAGTCGTTCGTCGACGACCTGGACATCGACT
+CGCTGTCGATGGTCGAGATCGCCGTGCAGACCGAGGACAAGTACGGCGTCAAGATCCCCGACGAGGACCT
+CGCCGGTCTGCGTACCGTCGGTGACGTTGTCGCCTACATCCAGAAGCTCGAGGAAGAAAACCCGGAGGCG
+GCTCAGGCGTTGCGCGCGAAGATTGAGTCGGAGAACCCCGATGCCGTTGCCAACGTTCAGGCGAGGCTTG
+AGGCCGAGTCCAAGTGAGTCAGCCTTCCACTGCTAATGGCGGTTTCCCCAGCGTTGTGGTGACCGCCGTC
+ACAGCGACGACGTCGATCTCGCCGGACATCGAGAGCACGTGGAAGGGTCTGTTGGCCGGCGAGAGCGGCA
+TCCACGCACTCGAAGACGAGTTCGTCACCAAGTGGGATCTAGCGGTCAAGATCGGCGGTCACCTCAAGGA
+TCCGGTCGACAGCCACATGGGCCGACTCGACATGCGACGCATGTCGTACGTCCAGCGGATGGGCAAGTTG
+CTGGGCGGACAGCTATGGGAGTCCGCCGGCAGCCCGGAGGTCGATCCAGACCGGTTCGCCGTTGTTGTCG
+GCACCGGTCTAGGTGGAGCCGAGAGGATTGTCGAGAGCTACGACCTGATGAATGCGGGCGGCCCCCGGAA
+GGTGTCCCCGCTGGCCGTTCAGATGATCATGCCCAACGGTGCCGCGGCGGTGATCGGTCTGCAGCTTGGG
+GCCCGCGCCGGGGTGATGACCCCGGTGTCGGCCTGTTCGTCGGGCTCGGAAGCGATCGCCCACGCGTGGC
+GTCAGATCGTGATGGGCGACGCCGACGTCGCCGTCTGCGGCGGTGTCGAAGGACCCATCGAGGCGCTGCC
+CATCGCGGCGTTCTCCATGATGCGGGCCATGTCGACCCGCAACGACGAGCCTGAGCGGGCCTCCCGGCCG
+TTCGACAAGGACCGCGACGGCTTTGTGTTCGGCGAGGCCGGTGCGCTGATGCTCATCGAGACGGAGGAGC
+ACGCCAAAGCCCGTGGCGCCAAGCCGTTGGCCCGATTGCTGGGTGCCGGTATCACCTCGGACGCCTTTCA
+TATGGTGGCGCCCGCGGCCGATGGTGTTCGTGCCGGTAGGGCGATGACTCGCTCGCTGGAGCTGGCCGGG
+TTGTCGCCGGCGGACATCGACCACGTCAACGCGCACGGCACGGCGACGCCTATCGGCGACGCCGCGGAGG
+CCAACGCCATCCGCGTCGCCGGTTGTGATCAGGCCGCGGTGTACGCGCCGAAGTCTGCGCTGGGCCACTC
+GATCGGCGCGGTCGGTGCGCTCGAGTCGGTGCTCACGGTGCTGACGCTGCGCGACGGCGTCATCCCGCCG
+ACCCTGAACTACGAGACACCCGATCCCGAGATCGACCTTGACGTCGTCGCCGGCGAACCGCGCTATGGCG
+ATTACCGCTACGCAGTCAACAACTCGTTCGGGTTCGGCGGCCACAATGTGGCGCTTGCCTTCGGGCGTTA
+CTGAAGCACGACATCGCGGGTCGCGAGGCCCGAGGTGGGGGTCCCCCCGCTTGCGGGGGCGAGTCGGACC
+GATATGGAAGGAACGTTCGCAAGACCAATGACGGAGCTGGTTACCGGGAAAGCCTTTCCCTACGTAGTCG
+TCACCGGCATCGCCATGACGACCGCGCTCGCGACCGACGCGGAGACTACGTGGAAGTTGTTGCTGGACCG
+CCAAAGCGGGATCCGTACGCTCGATGACCCATTCGTCGAGGAGTTCGACCTGCCAGTTCGCATCGGCGGA
+CATCTGCTTGAGGAATTCGACCACCAGCTGACGCGGATCGAACTGCGCCGGATGGGATACCTGCAGCGGA
+TGTCCACCGTGCTGAGCCGGCGCCTGTGGGAAAATGCCGGCTCACCCGAGGTGGACACCAATCGATTGAT
+GGTGTCCATCGGCACCGGCCTGGGTTCGGCCGAGGAACTGGTCTTCAGTTACGACGATATGCGCGCTCGC
+GGAATGAAGGCGGTCTCGCCGCTGACCGTGCAGAAGTACATGCCCAACGGGGCCGCCGCGGCGGTCGGGT
+TGGAACGGCACGCCAAGGCCGGGGTGATGACGCCGGTATCGGCGTGCGCATCCGGCGCCGAGGCCATCGC
+CCGTGCGTGGCAGCAGATTGTGCTGGGAGAGGCCGATGCCGCCATCTGCGGCGGCGTGGAGACCAGGATC
+GAAGCGGTGCCCATCGCCGGGTTCGCTCAGATGCGCATCGTGATGTCCACCAACAACGACGACCCCGCCG
+GTGCATGCCGCCCATTCGACAGGGACCGCGACGGCTTTGTGTTCGGCGAGGGCGGCGCCCTTCTGTTGAT
+CGAGACCGAGGAGCACGCCAAGGCACGTGGCGCCAACATCCTGGCCCGGATCATGGGCGCCAGCATCACC
+TCCGATGGCTTCCACATGGTGGCCCCGGACCCCAACGGGGAACGCGCCGGGCATGCGATTACGCGGGCGA
+TTCAGCTGGCGGGCCTCGCCCCCGGCGACATCGACCACGTCAATGCGCACGCCACCGGCACCCAGGTCGG
+CGACCTGGCCGAAGGCAGGGCCATCAACAACGCCTTGGGCGGCAACCGACCGGCGGTGTACGCCCCCAAG
+TCTGCCCTCGGCCACTCGGTGGGCGCGGTCGGCGCGGTCGAATCGATCTTGACGGTGCTCGCGTTGCGCG
+ATCAGGTGATCCCGCCGACACTGAATCTGGTAAACCTCGATCCCGAGATCGATTTGGACGTGGTGGCGGG
+TGAACCGCGACCGGGCAATTACCGGTATGCGATCAATAACTCGTTCGGATTCGGCGGCCACAACGTGGCA
+ATCGCCTTCGGACGGTACTAAACCCCAGCGTTACGCGACAGGAGACCTGCGATGACAATCATGGCCCCCG
+AGGCGGTTGGCGAGTCGCTCGACCCCCGCGATCCGCTGTTGCGGCTGAGCAACTTCTTCGACGACGGCAG
+CGTGGAATTGCTGCACGAGCGTGACCGCTCCGGAGTGCTGGCCGCGGCGGGCACCGTCAACGGTGTGCGC
+ACCATCGCGTTCTGCACCGACGGCACCGTGATGGGCGGCGCCATGGGCGTCGAGGGGTGCACGCACATCG
+TCAACGCCTACGACACTGCCATCGAAGACCAGAGTCCCATCGTGGGCATCTGGCATTCGGGTGGTGCCCG
+GCTGGCTGAAGGTGTGCGGGCGCTGCACGCGGTAGGCCAGGTGTTCGAAGCCATGATCCGCGCGTCCGGC
+TACATCCCGCAGATCTCGGTGGTCGTCGGTTTCGCCGCCGGCGGCGCCGCCTACGGACCGGCGTTGACCG
+ACGTCGTCGTCATGGCGCCGGAAAGCCGGGTGTTCGTCACCGGGCCCGACGTGGTGCGCAGCGTCACCGG
+CGAGGACGTCGACATGGCCTCGCTCGGTGGGCCGGAGACCCACCACAAGAAGTCCGGGGTGTGCCACATC
+GTCGCCGACGACGAACTCGACGCCTACGACCGTGGGCGCCGGTTGGTCGGATTGTTCTGCCAGCAGGGGC
+ATTTCGATCGCAGCAAGGCCGAGGCCGGTGACACCGACATCCACGCGCTGCTGCCGGAATCCTCGCGACG
+TGCCTACGACGTGCGTCCGATCGTGACGGCGATCCTCGATGCGGACACACCGTTCGACGAGTTCCAGGCC
+AATTGGGCGCCGTCGATGGTGGTCGGGCTGGGTCGGCTGTCGGGTCGCACGGTGGGTGTACTGGCCAACA
+ACCCGCTACGCCTGGGCGGCTGCCTGAACTCCGAAAGCGCAGAGAAGGCAGCGCGTTTCGTGCGGCTGTG
+CGACGCGTTCGGGATTCCGCTGGTGGTGGTGGTCGATGTGCCGGGCTATCTGCCCGGTGTCGACCAGGAG
+TGGGGTGGCGTGGTGCGCCGTGGCGCCAAGTTGCTGCACGCGTTCGGCGAGTGCACCGTTCCGCGGGTCA
+CGCTGGTCACCCGAAAGACCTACGGCGGGGCATACATTGCGATGAACTCCCGGTCGTTGAACGCGACCAA
+GGTGTTCGCCTGGCCGGACGCCGAGGTCGCGGTGATGGGCGCTAAGGCGGCCGTCGGCATCCTGCACAAG
+AAGAAGTTGGCCGCCGCTCCGGAGCACGAACGCGAAGCGCTGCACGACCAGTTGGCCGCCGAGCATGAGC
+GCATCGCCGGCGGGGTCGACAGTGCGCTGGACATCGGTGTGGTCGACGAGAAGATCGACCCGGCGCATAC
+TCGCAGCAAGCTCACCGAGGCGCTGGCGCAGGCTCCGGCACGGCGCGGCCGCCACAAGAACATCCCGCTG
+TAGTTCTGACCGCGAGCCGCTCCTCGCATGCTCGAACGGTGCCTACCGACGCGCTAACAATTCTCGAGAA
+GGCCGGCGGGTTCGCCACCACCGCGCAATTGCTCACGGTCATGACCCGCCAACAGCTCGACGTCCAAGTG
+AAAAACGGCGGCCTCGTTCGCGTTTGGTACGGGGTCTACGCGGCACAAGAGCCGGACCTGTTGGGCCGCT
+TGGCGGCTCTCGATGTGTTCATGGGGGGGCACGCCGTCGCGTGTCTGGGCACCGCCGCCGCGTTGTATGG
+ATTCGACACGGAAAACACCGTCGCTATCCATATGCTCGATCCCGGAGTAAGGATGCGGCCCACGGTCGGT
+CTGATGGTCCACCAACGCGTCGGTGCCCGGCTCCAACGGGTGTCAGGTCGTCTCGCGACCGCGCCCGCAT
+GGACTGCCGTGGAGGTCGCACGACAGTTGCGCCGCCCGCGGGCGCTGGCCACCCTCGAAGCCGCACTACG
+GTCAATGCGCTGCGCTCGCAGTGAAATTGAAAACGCCGTTGCTGAGCAGCGAGGCCGCCGAGGCATCGTC
+GCGGCGCGCGAACTCTTACCCTTCGCCGACGGACGCGCGGAATCGGCCATGGAGAGCGAGGCTCGGCTCG
+TCATGATCGACCACGGGCTGCCGTTGCCCGAACTTCAATACCCGATACACGGCCACGGTGGTGAAATGTG
+GCGAGTCGACTTCGCCTGGCCCGACATGCGTCTCGCGGCCGAATACGAAAGCATCGAGTGGCACGCGGGA
+CCGGCGGAGATGCTGCGCGACAAGACACGCTGGGCCAAGCTCCAAGAGCTCGGGTGGACGATTGTCCCGA
+TTGTCGTCGACGATGTCAGACGCGAACCCGGCCGCCTGGCGGCCCGCATCGCCCGCCACCTCGACCGCGC
+GCGTATGGCCGGCTGACCGCTGGTGAGCAGACGCAGAGTCGCACTGCGCCGGCCGGCGCAGTGCGACTCT
+GCGTCTGCTCGCGCTCAACGGCTGAGGAACTCCTTAGCCACGGCGACTACGCGCTCGCGATCCCGTGGCA
+CCAGACCGATCCGGGTCCGGCGGTCGAGGATATCGTCCACATCCAGCGCCCCCTCATGGGTCACCGCGTA
+TTCGAACTCCGCCCGGGTCACGTCGATGCCGTCGGCGACCGGCTCGGTGGGCCGCTCACATGTGGCGGCG
+GCAGCGACGTTGGCCGCCTCGGCCCCGTACCGCGCCACCAGCGACTCGGGCAATCCGGCGCCCGATCCGG
+GGGCCGGCCCAGGGTTCGCCGGTGCGCCGATCAGCGGCAGGTTGCGAGTGCGGCACTTCGCGGCTCGCAG
+GTGTCGCAGCGTGATGGCGCGATTCAGCACATCCTCTGCCATGTAGCGGTATTCCGTCAGCTTGCCGCCG
+ACCACACTGATCACGCCCGACGGCGATTCAAAAACAGCGTGGTCACGCGAAACGTCGGCGGTGCGGCCCT
+GGACACCAGCACCGCCGGTGTCGATTAGCGGCCGCAATCCCGCATAGGCACCGATGACATCCTTGGTGCC
+GACCGCCGTCCCCAATGCGGTGTTCACCGTATCCAGCAGGAACGTGATCTCTTCCGAAGACGGTTGTGGC
+ACATCGGGAATCGGGCCGGGTGCGTCTTCGTCGGTCAGCCCGAGATAGATCCGGCCCAGCTGCTCGGGCA
+TGGCGAACACGAAGCGGTTCAGCTCACCGGGGATCGGAATGGTCAGCGCGGCAGTCGGATTGGCAAACGA
+CTTCGCGTCGAAGACCAGATGTGTGCCGCGGCTGGGGCGTAGCCTCAGGGACGGGTCGATCTCACCCGCC
+CACACGCCCGCCGCGTTGATGACGGCACGCGCCGACAGCGCGAACGACTGCCGGGTGCGCCGGTCGGTCA
+ACTCCACCGAAGTGCCGGTGACATTCGACGCGCCCACGTAAGTGAGGATGCGGGCGCCGTGCTGGGCCGC
+GGTGCGCGCGACGGCCATGACCAGCCGGGCGTCGTCGATCAATTGCCCGTCGTACGCGAGCAGACCACCG
+TCGAGGCCGTCCCGCCGAACGGTGGGAGCAATCTCCACCACCCGTGACGCCGGGATTCGGCGCGATCGGG
+GCAACGTCGCCGCCGGCGTACCCGCTAGCACCCGCAAAGCGTCGCCGGCCAGGAAACCGGCACGCACCAA
+CGCCCGCTTGGTGTGACCCATCGACGGCAACAACGGGACCAGTTGCGGCATGGCATGCACGAGATGAGGA
+GCGTTGCGTGTCATCAGGATTCCGCGTTCGACGGCGCTGCGCCGGGCGATGCCCACGTTGCCGCTGGCCA
+GATAGCGCAGACCGCCGTGCACCAACTTCGAGCTCCAGCGGCTGGTGCCGAACGCCAGATCATGCTTTTC
+CACCAAGGCCACCGTCAGACCGCGGGTGGCAGCATCTAAGGCAATGCCAACACCGGTAATGCCGCCGCCT
+ATCACGATGACGTCGAGTGCGCCACCGTCGGCCAGTGCGGTCAGGTCGGCGGAGCGACGCGCCGCGTTGA
+GTGCAGCCGAGTGGGGCATCAGCACAAATATCCGTTCAGTGCGTGGGTAAGTTCGGTGGCCAGCGCGGCG
+GAATCGAGGATCGAATCGACGATGTCCGCGGACTGGATGGTCGACTGGGCGATCAGCAACACCATGGTCG
+CCAGTCGACGAGCGTCGCCGGAGCGCACACTGCCCGACCGCTGCGCCACTGTCAGCCGGGCGGCCAACCC
+CTCGATCAGGACCTGCTGGCTGGTGCCGAGGCGCTCGGTGATGTACACCCTGGCCAGCTCCGAGTGCATG
+ACCGACATGATCAGATCGTCACCCCGCAACCGGTCGGCCACCGCGACAATCTGCTTTACCAACGCTTCCC
+GGTCGTCCCCGTCGAGGGGCACCTCCCGCAGCACGGCGGCGATATGGCTGGTCAGCATGGACGCCATGAT
+CGACCGGGTGTCCGGCCAGCGACGGTATACGGTCGGGCGGCTCACGCCCGCGCGCCGGGCGATCTCGGCA
+AGTGTCACCCGGTCCACGCCGTAATCGACGACGCAGCTCGCCGCTGCCCGCAGGATACGACCACCGGTAT
+CCGCGCGGTCATTACTCATTGACAGCATGTGTAATACTGTAACGCGTGACTCACCGCGAGGAACTCCTTC
+CACCGATGAAATGGGACGCGTGGGGAGATCCCGCCGCGGCCAAGCCACTTTCTGATGGCGTCCGGTCGTT
+GCTGAAGCAGGTTGTGGGCCTAGCGGACTCGGAGCAGCCCGAACTCGACCCCGCGCAGGTGCAGCTGCGC
+CCGTCCGCCCTGTCGGGGGCAGACCACGATGCGCTGGCGCGCATCGTCGGCACCGAGTATTTCCGCACCG
+CCGATCGCGACCGGCTGCTGCACGCCGGCGGCAAGTCCACCCCAGACCTGCTGCGGCGCAAAGACACCGG
+TGTCCAGGATGCGCCCGACGCGGTGTTGCTGCCCGGCGGCCCCAACGGGGAGGACGCCGTCGCCGACATC
+TTGCACTACTGCTCCGACCACGGCATTGCCGTGGTCCCGTTTGGTGGCGGCACCAGCGTCGTTGGTGGGC
+TTGACCCCGTTCGCAACGACTTTCGCGCGGTGATCTCCCTGGATATGCGGCGCTTCGACCGGCTGCACCG
+GATCGATGAGGTGTCCGGCGAGGCCGAACTGGAGGCCGGTGTCACCGGGCCGGAAGCCGAACGTCTGCTC
+GGCGAACATGGCTTCTCGCTCGGGCACTTCCCGCAGAGCTTCGAGTTCGCCACCATCGGGGGGTTCGCGG
+CCACCCGCTCGTCAGGCCAGGACTCGGCTGGCTATGGCCGGTTCAACGACATGATTCTTGGGCTGCGCAT
+GATCACTCCGGTGGGGGTGCTGGATCTGGGTCGAGTGCCGGCGTCGGCGGCCGGCCCGGACCTGCGCCAG
+CTGGCGATCGGCTCCGAAGGCGTCTTCGGCGTCATCACCCGGGTGCGGCTGCGGGTGCACCGGATTCCGG
+AATCGACGCGTTACGAGGCGTGGTCGTTTCCCGATTTCGCGACCGGGGTTGCGGCGCTGCGCACCATCAC
+CCAAACCGGCACCGGCCCCACCGTCGTTCGGCTCTCTGACGAGGCCGAAACCGGCGTCAACCTCGCCACC
+ACCGAGGCGATCGGGGAAACCCAAATCACCGGCGGCTGTTTGGGGATCACCGTGTTCGAGGGCACCCAGG
+AACACACCGAGAGCAGGCACGCCGAGACGCGCGCGTTGCTGGCGGCCCGAGGCGGCACCTCGTTGGGCGA
+AGGACCGGCGCGGGCCTGGGAACGCGGCAGGTTCGCCGCGCCGTATCTGCGTGACTCCCTGTTGGCCGCG
+GGAGCGCTCTGCGAGACCCTCGAGACCGCCACGGTGTGGTCCAACACCCCCGTGCTGAAGGCCGCCGTGA
+CCGAAGCGCTCACCACCTCGCTGGCCGCATCGGGTACACCGGCGCTGGTGATGTGCCACGTGTCGCACGT
+GTATCCCACCGGCGCGTCGTTGTACTTCACCGTTGTCGCCGGGCAGCGAGGCGATCCGATCGAGCAGTGG
+CTGGCCGCCAAGAAGGCGGCGTCGGATGCGATCATGGCCACCGGAGGAACGATCACGCACCACCATGCGG
+TTGGTTCCGACCACCGCCCCTGGATGCGCGCGGAGGTGGGTGATCTGGGCGTGACATTGTTGCGCACGAT
+CAAGGCGACGCTGGATCCGGCCGGAATTCTCAACCCCGGCAAGCTGATTCCATGAGCGCCGGGCAGCTGC
+GCCGGCATGAGATCGGCAAGGTCACCGCGCTGACCAATCCCCTGTCAGGCCATGGCGCCGCCGTAAAGGC
+TGCACACGGCGCGATCGCCCGGCTGAAGCATCGGGGGGTGGACGTCGTCGAGATCGTCGGCGGGGACGCC
+CACGACGCACGCCATCTGCTCGCCGCGGCAGTCGCAAAAGGCACTGACGCGGTGATGGTGACCGGCGGTG
+ACGGAGTCGTCTCCAACGCGCTACAGGTCTTGGCGGGCACCGACATTCCGTTAGGAATCATTCCGGCCGG
+CACTGGTAACGACCACGCACGCGAATTCGGGCTTCCCACAAAGAATCCCAAGGCAGCCGCAGATATCGTT
+GTTGACGGCTGGACGGAAACCATTGACCTGGGCCGGATTCAAGACGACAACGGTATCGAAAAGTGGTTCG
+GTACCGTGGCGGCTACCGGATTCGACTCCCTGGTCAACGATCGCGCCAACCGAATGCGCTGGCCACACGG
+GCGGATGCGCTATTACATCGCGATGCTCGCCGAACTGTCGCGGCTGCGGCCGTTGCCGTTCCGGCTGGTG
+CTCGACGGCACCGAAGAGATCGTCGCCGACCTCACACTTGCCGACTTCGGCAATACCCGCAGCTACGGCG
+GCGGATTATTGATCTGCCCCAACGCCGACCACTCGGACGGCCTGCTCGACATCACCATGGCCCAGTCGGA
+TTCCCGTACCAAGTTGCTCCGCCTGTTCCCCACCATTTTCAAAGGCGCCCATGTCGAGCTTGACGAGGTG
+AGCACCACACGAGCCAAGACAGTCCACGTCGAGTGCCCCGGTATCAACGTCTATGCCGACGGCGACTTCG
+CCTGCCCGTTACCAGCCGAGATCTCCGCGGTGCCGGCCGCCCTTCAGGTTCTTCGCCCCCGCCACGGATA
+AGCGGGTGGTAACGACTCGGTCGTAAAGCGCGACATCCTTCCAAACCCGCTGTACGGGAGGAACAGATGT
+CCGGACACCGCAAGAAGGCAATGCTCGCCTTGGCGGCTGCGTCGCTGGCAGCGACGCTGGCCCCGAACGC
+AGTCGCGGCCGCAGAACCGTCGTGGAACGGGCAGTACCTCGTGACGTTGTCTGCCAACGCGAAAACCGGC
+ACCAGCATGGCGGCCAACCGGCCAGAGTATCCACACAAAGCGAACTACACGTTCAGCTCGCGCTGCGCGT
+CCGATGTCTGCATTGCCACCGTGGTCGACGCTCCGCCACCAAAAAACGAGTTCATCCCGCGGCCAATCGA
+ATACACCTGGAATGGGACTCAATGGGTACGGGAGATCAGCTGGCAATGGGACTGCCTGCTACCCGACGGC
+ACAATCGAATATGCCCCAGCCAAATCGATCACGGCCTACACGCCCGGTCAGTACGGAATCCTCACCGGCG
+TCTTTCATACCGATATCGCCAGCGGCACGTGTAAAGGCAATGTCGACATGCCAGTGTCGGCCAAACCGAT
+CGTTGGCTGACGTTGCCAGCCCTGCCGAGCATGGGCGGCACATCACGCAAACGCATGGACGACCAGCACA
+GCCCCGAATGCGGCGATAACGGCGTTGCCGGCAAGGACTGTCATCCGACGGACGCGGGCGGTCGCCCGGG
+ACCTGAGAAACGCTCCCGCCGAGACAAGCAGCAACTGCCAGAGCAACGACGCGAGCGCTACCCCGACCAC
+AACAGCGATCGCGGTCGTTGCGCGCAACGCGCGCGCCAGCGTCACGGCTACTGCGGTGAAGTACACGAAC
+GTGGCCGGGTTGATCACCGTTAGGCCGAAGATCAACGCAAACCGAACACAGCCCAGCTGTTTTTGTGGGG
+CCGGAACCGGCTCCGGCGATGGACGCAACCCGTGCCCGATTCCCATCGCAGCGATGACCAGCAGCACGAT
+CGCACCGACGATTTCGGGCCAAACCCTCAACACGTTGATCGTCGGTGCCGCAACTGTCTCCAAATCGCGG
+TAGCGCAATACGCTACGTCGACAAGGGCGACCGCCGCGGCGGCCGGTATTCCACGACGCCAGCCGCGCTC
+AACACCTGCTTGCCGAGGAAAGCGTTCCCGGTGGCGGCATCGAGGCGTTTGTCGATGTGCGACTTCGACC
+GGCGGAGGACAGCGACGACTTTCTGGCATGGTCGAGCACGGACACCACGATCGACGATGCCGTCCACGTC
+ACCGGACCCTACGACTACCTGCTACACATTCGGGTCTGCGACACAGCGGACCTGGACCGCCTGTTACGCA
+GGCTCAAGACCTCCGCGGAAGCTGCGCAAACCCAAACGCGCATTGCGCTCAAGTCCCGGCGTTGACACCG
+CGCCAGCAGGCGCCACCAAACCCTTAGCCAACTCCCCGACTCAGCCAAGTCACCTCGCCGGCGTCGCCGC
+CGTCACGATACACCTCGAGCGCCTGGTCCCAGGCCGTTCCCAGCACCGAATCCAGTTCGGCGGCCAGTGT
+GTCCGCACCTTGGGCCATCATCGCCCGCAGCCGCATCTCCCCCACCATGATGTCGCCGTTGGCGCTCATC
+GCCCCGCTCCACAGACCCAGTTGCGGGGTGTGACTGAATCGCTGGCCGTCGACTCCAGGGCTAGGGTCTT
+CGGTGACCTCGAACCGCAGCACCGACCAGGAACGCAAGGCGTTGGCTAGTCGCGCCCCGGTGCCCACCGG
+CCCGACCCAATTGGTGACCGCACGCAACTGCGGCGGCAGGGCCGGTTGCGGCGTCCAGACCAGGTTCGCC
+TTGGCCTGTAGGGTCGACGACAACGCCCACTCGACATGCGGGCACACCGCCGCGGGCGAGCCGTGGATGT
+ACACCACACCGGACGTCACGTCGGCGAATTGGTTCGACGCTCGCATCTGCTGCTCCTTCGGTTCCACGAG
+GGACGTCTTCCCCAACGACCTGGTGAACCCGACAAGCAGGATGCCTGCTGTGAAATTTCGAATTTTTGTG
+TCGTGCGTTTCTATTGTGCCTTGTGATACCCGTGTTGCGCTAGTGTGCGGTTCTGCCTAGGTGTACTCGG
+CTAGAACCGCGTCGGAAATCGCGGGCCACAAGTCCAACGCCCAGTCGCCGAAATCGCGGGCCGTGAGGAC
+CACCAGAGCCAGGTCCGCCTTGGGATCCACCCAGATGAAACCGCCTGATTGGCCGAAATGGCCGAATGTC
+CGCGTCGAGTTGCACTCGCCGGTCCAGTGGGGCGATTTCGAATTCCTGATCTCAAAGCCCAGCCCCCAGT
+CATTGGGCCGCTGCACACCGTACCCGGGCAGTACACCGTCCAGGCCGGGAAACTGCACCGTGGTCGCGTC
+GGCATGCATCTGCGCCGAGACCGTCGATGGCCGCAGCAGATCACCCGCGAACACCGCCAAGTCCGCGACC
+GTCGAGGTCGCCCCGAACCCGGCGGCAGCGGGGCCCCCGTCCAGCCGGGTGGTCACCATGCCCAGGGGTT
+CGCACACCGCCTCGGTCAGGTAGCGCCCGAACTCGATCCCCGACTCCCGCTGCACGCTCTCGGCCAGCAC
+GGTGAAACCGTAGTTCGAATACATCCGGCGGGTGCCGGGGCGGGCCAGCGCCTGATCGGAATGCATCGCC
+AACCCCGATGTGTGCGCCAGCAGGTGACGGACCGTGGAGCCGGGCGGGCCTGCCGGGGTGTCGAGATTCA
+CCACCCCCTCCTCAACGGCGACCTGTGCGGCTCGGGCCACCAGCGGCTTGGTGACCGACGCCAGCGCGAA
+CACCCGCGCGGTATCGCCGTGGGTGGCTAGCACCCCTGCGGGTCCGATCACCGCGGCGGCCGCAGCCGGG
+ACCGGCCAGCCACCAAGCACTTCGAGAGCGGTCATCGACTCCGGCGCGTCACTTCCGGGCGATGTAGTAG
+TTGTTCAACACGTCCGACTCGATCTCGGCCACCGTCACGTCGGTAAAACCGGCGTCGGCGAGCATCGAGG
+TGGCCAACTGCCTGCCCCACACCGTCCCCAACCCGGCCCCGTCAAGCGCCAGCGACACCGTCATGCAGTG
+CATTAGCGAGGTCGTGTACAGGTAGGTGCTCAGCGGAACGCCGACATTGTCTTCCAGTTGACTCGATGCC
+TTGATGTCGACCATCAGCAGCACACCACCGGGTCGCAGCGCACGATAGATGTTCTGCAGGACGCGCGCCG
+GCTGCGCCTGGTCGTGAATCGCGTCGAACACGGTGATCACGTCGTAGGCCCCCACCTTGTCCAGCTCTGC
+CAGGTCATGGCGCTCGAAGGTCGCGTTTGCCAGGCCCAACCGAGCCGCCTCCTCGGTCCCCGCCGCAACG
+GCCTCGTCGGAAAAGTCGATGCCGGTGAATCGGCTCGCGCCGAACGCCTGCGCCATCAGCTTGACCGCGC
+GACCACTGCCGCAACCGAAATCGGCCACGTCGGCTCCGGACCGCAAGCGGTCCGGAAGGCCGTCGACCAG
+CGGGAGCACCACGTCGATCAAGGCGGCATCGAACACCATGCCGCTCATCTCGGCCATCAGCTTGTGGAAG
+CGCGGGTATTCGCTGTAGGGCACACCGCCGCCTTCCCGGAAGCAGCGAATGACCTTTTGTTCGACCTCGC
+CGAGCAGCGAAACGAACTGTGCTATCACGGCGAGGTTGTCCGGCCCGGCCGCACGGGTCAGCATGCCGGC
+GCGGTGGGCAGGCAGCGAGTAGGTCGAGCTCCCCGCGTCGTATTCGACGATCTGCCCGGTGGTCATGCCG
+CCTAGCCACTCCCGAACGTAGCGCTCTTCCAACCCCGCAGCCTCGGCGATCTCCATGCTGGTGGCTGGCG
+GAAGTCCGGCCATGGTGTCCAGCAGCCCGGTCTGGTGTCCAACGCTCACCAGGATCGCCAAACCGGCGCT
+GTCGATGGCCGCAACAAAACGGTTGCCGAATTCTTCGGTGGTCTCGAGTGCTCCGCTCATCTGCGCCGCT
+CCTCCTCATCGCTTCGCTCTGCATCGTCACCGGCGCGACTCATCTGCGCCGCTCCTGCTCATCGCTTCGC
+TCTGCATCGTCACCGGCGCGACTCATCTGCGCCGCTCCTGCTCATCGCTTCGCTCTGCATCGTCACCGGC
+GCGACTCATCTGCGCCGCTCCTCCTCATCGCTTCGCTCTGCATCGTCACCGGCGCGCATGGTCAGCGACG
+CTACACCGTAGGTTGGACACCATGAGTCAGACGGTGCGCGGTGTGATCGCACGACAAAAGGGCGAACCCG
+TTGAGCTGGTGAACATTGTCGTCCCGGATCCCGGACCCGGCGAGGCCGTGGTCGACGTCACCGCCTGCGG
+GGTATGCCATACCGACCTGACCTACCGCGAGGGCGGCATCAACGACGAATACCCTTTTCTGCTCGGACAC
+GAGGCCGCGGGCATCATCGAGGCCGTCGGGCCGGGTGTAACCGCAGTCGAGCCCGGCGACTTCGTGATCC
+TGAACTGGCGTGCCGTGTGCGGCCAGTGCCGGGCCTGCAAACGCGGACGGCCCCGCTACTGCTTCGACAC
+CTTTAACGCCGAACAGAAGATGACGCTGACCGACGGCACCGAGCTCACTGCGGCGTTGGGCATCGGGGCC
+TTTGCCGATAAGACGCTGGTGCACTCTGGCCAGTGCACGAAGGTCGATCCGGCTGCCGATCCCGCGGTGG
+CCGGCCTGCTGGGTTGCGGGGTCATGGCCGGCCTGGGCGCCGCGATCAACACCGGCGGGGTAACCCGCGA
+CGACACCGTCGCGGTGATCGGCTGCGGCGGCGTTGGCGATGCCGCGATCGCCGGTGCCGCGCTGGTCGGC
+GCCAAACGGATCATCGCGGTCGACACCGATGACACGAAGCTTGACTGGGCCCGCACCTTCGGCGCCACCC
+ACACCGTCAACGCCCGCGAAGTCGACGTCGTCCAGGCCATCGGCGGCCTCACGGATGGATTCGGCGCGGA
+CGTGGTGATCGACGCCGTCGGCCGACCGGAAACCTACCAGCAGGCCTTCTACGCCCGCGATCTCGCCGGA
+ACCGTTGTGCTGGTGGGTGTTCCGACGCCCGACATGCGCCTGGACATGCCGCTGGTCGACTTCTTCTCTC
+ACGGCGGTGCGCTGAAGTCGTCGTGGTACGGCGATTGCCTGCCCGAAAGCGACTTCCCCACGCTGATCGA
+CCTTTACCTGCAGGGCCGGCTGCCGCTGCAGCGGTTCGTTTCCGAACGCATCGGGCTCGAAGACGTCGAG
+GAGGCGTTCCACAAGATGCATGGCGGCAAGGTATTGCGTTCGGTGGTGATGTTGTGATGGCCGCCATCGA
+GCGCGTCATCACCCACGGCACCTTCGAACTCGATGGCGGCAGTTGGGAAGTCGACAACAACATCTGGCTG
+GTCGGCGACGACTCCGAGGTGGTGGTTTTCGACGCCGCCCACCACGCGGCTCCTATCATCGACGCCGTCG
+GCGGCCGCAAGGTGGTTGCGGTGATCTGCACGCACGGCCACAACGACCACGTGACGGTGGCCCCCGAACT
+GGGCACGGCGCTTGACGCACCGGTGCTGATGCATCCCGGCGACGCCGTGCTGTGGCGAATGACTCACCCG
+GACAAAAGCTTTCGCGCCGTTTCAGACGGTGATGCGGTGCGGGTTGGCGGGACGGAGTTGCGTGCGCTGC
+ACACCCCGGGGCACTCCCCTGGATCGGTGTGCTGGTATGCGCCAGAGCTGGGTCCCGGAACAGGCACCGT
+GTTCAGCGGAGACACGCTGTTCGCTGGCGGGCCGGGTGCAACCGGCCGCTCGTATTCCGACTTCCCCACG
+ATCCTGCGGTCGATATCCGGACGGCTCGGCGCATTACCGGGCGACACCGTCGTGCACACCGGCCACGGCG
+ACAGCACCACCATCGGCGACGAGATCGTCCACTACGAGGAATGGGTGGCCCGTGGGCATTGATCCCGCGG
+GCGCGCGCAGAATGCCGGTCGTAGCGGCGTGTCGGTGTACAAGCACCGCGCGGTCCATGAGCCGAGCGCT
+ACTTATCCGCGCAATCTGACACTCGAGCCAAGCTGCGGCGCAGAAACACCGCAAAGCCGGCACCCATGAC
+CACAAATGCCGTCACTGGCACCCAGTCACCCAACCGAAGGTAGAGCGTGACATTCGATGCCAACGGAACG
+TTCACCACGATGGCACCGTTGAATTCCGCCGAGCACCAGGCCAGCCGACGGCCCCGGGTATCAAAGGCCG
+AGCTGTCGCCCGACAAGCTGGCGTGCACCGCTGGGATGCCGGCTTCGACGGCGCGCACCGCGGGCTGGGC
+GGCCAACTGCGGCTGCGCCCAACTCCCTTGGAACGTCGAGGTGGAACTCTGATACACCAGCAGCGCCGCC
+CCGAGCCGCGCGGCGTGCCGGGTCAGATCGGAGAAGGTCATCTCGTAGCTGATCAACGGGGCGATATGCA
+AGGAGTTCACCGCCAACACCACCGGCCCGGCGCCGCGCTGCCGATCCTTTGCGGCGGCCTTGCTGTAGCG
+GGTGATCCAGCCGAAAAGCGGGCGCAGCGGCACATATTCGCCAAACGGAACCAACCGGGTCTTCCGGTAG
+CTGCCCACAGCTTCGTGCGCGCCGACAAGCACCGCCGACTTGTAGATTCCCCCGTCCGGTGCCGGGGCGT
+CGACGTTGACCAACAAATCCGCGCCCACCCGCTGTGACAGCTCGGCCAGGCGAGCCAGGACGTCAGGATG
+GCGGGTGAGGTCTTGTCCGACGCTGCTTTCCCCCCAGACCACCAAGTCCGGCCGCTGGTCCGCAACGGCC
+GCGGTGAACTCTTCACCGGCCGCCAGTCGAGCCGCCGCATCGGCTATGTCGCCGGCCTGTACCAGCGCCA
+CGCGCACCGTCGGACCGCCGACCGGCACCGAGCCCAGCAGGTAGGAAGCCGGGCCGAGTCCCGCACACCC
+AATCACGCATCCCAGCGCGACCAGCCGGCCGCCCGTTGCCCGGCACACGAGCACGCTCGCGATGGCGGTA
+TTGGTCGCAACCAGAAGAAAACTTGTCAGCCACACCCCACCCAGCGACGCCGACGCTAGCGTCACGGGCT
+GGCTCCATTGCGATGCACCCAGCAACGCCCACGGACCGCCCAGCGATTGCCAGGACCGCACCGCTTCGGC
+TGCCACCCACGCGCTGGGCACCACGACCAGGGCGGCACCGACGCGGCATGTGGTCACCGGTACCGACAAC
+AGCCGGTGCGCCAACCACCCGGCCGGCAGCCACAGCACACCCAGGCCGGCGGCCAACAGCACCAGCATCG
+GACCAGCACTGGTCACCAGCCAGTACTGGGTTGCCAGCACAAATCCGCCCATACCCGTCCACGCCCGCAG
+CGCGCCCTCCCACGACGTCGGCGCGGCCCGCACCACTAACAGCAGTGGGACCAAGCCGAACCAGGCCAGC
+CACCACCAAGACGGCGCGGGAAAGGCCAGCGCGGGTAACCCGCCGAACACCAACGCTGCCGCACAACCAA
+TGACCGGTTGTCGCCGGGCTCCCGCGCGCAACGCCATGCCGATCAGCATGCCGGCCACATTCGCCTGCGT
+CGAGGAAAAGAGCAGACTAAGACCGGCAGTCCCCGCCAGAAAGGGAGTGATTTGCATGGCCAAGGATCTG
+GTCGCCACGGTGCCCGATCTTTCCGGGAAGCTGGCAATCATCACCGGCGCCAACAGCGGTCTAGGCTTCG
+GGCTGGCCCGGCGGCTGTCGGCGGCTGGCGCCGACGTAATCATGGCGATCCGCAATCGCGCCAAGGGCGA
+GGCGGCGGTCGAGGAAATCCGGACCGCGGTTCCGGATGCGAAGCTGACCATCAAGGCCCTCGACCTGTCA
+TCGTTGGCGTCCGTCGCCGCGTTGGGGGAACAGCTCATGGCTGACGGGCGGCCGATCGACCTGCTGATCA
+ACAACGCCGGCGTCATGACCCCACCGGAACGCGTTACCACTGCCGACGGCTTCGAATTGCAGTTCGGCAG
+CAACCATCTCGGACACTTCGCGCTAACCGCACACCTGCTGCCGCTGTTGCGCGCGGCACAGCGCGCGAGG
+GTCGTCTCGTTGAGCAGCTTGGCGGCCCGCCGCGGCCGCATCCACTTCGACGACCTACAGTTCGAGAGGT
+CGTACGCCCCGATGACGGCCTATGGCCAGTCGAAGCTGGCGGTCTTGATGTTCGCCCGCGAGCTGGACCG
+CCGCAGCCGCGCGGCCGGCTGGGGCATCATCTCCAATGCCGCGCATCCTGGCTTGACCAAGACCAACCTG
+CAGATCGCGGGACCGTCCCATGGCCGCGACAAGCCGGCGCTGATGGAACGCTTGTACAAGACGTCCTGGC
+GTTTCGCACCGTTCCTCTGGCAGGAGATCGAAGAGGGGATCTTGCCCGCGCTGTATGCAGCCGCCACCCC
+GCAAGCCGACGGTGGCGCGTTCTATGGCCCCCGCGGCCGCTACGAGGTCGCCGGCGGTGGTGTGCGAGAG
+GCCAAGGTTCCCGCAGCCGCCCGCAACGACGCCGATAGCAAGCGACTTTGGGAGGTCTCCGAGCAGCTCA
+CCGGTGTCAGCTACCCGAAATCGCGCTGAACTGCCCGATCCCGGGAACCTGAGGTATTCCGGGGGGGAGC
+TGCGGAATCTCCGGAATCGGTGGGATCGGCGGGATCGGTGGAGGGCTGGGGGACGTGGTCGCCGGCGGCT
+GCGTGGTCGCCGGCGGCTGCGTGGTCGCCGGCGGCGCGGAAGCGGGGGTCGTCGGTGCCGGAGTGATGAC
+ATCGGTGGTCACCGCCGGTTGCGTATTCGTCGTTGTCGGCGGAGGCGGCAACGGCTGCTGCAGCGGCGGC
+GCGGGCCCACCGGTGGCTGGCGCCTGTACGGGAGGTGCGGGCTCGGTAGTGGGGCCATCGGATGCCGGCG
+CTGGGGACGGGGGCGGTGCGGCGGTCGTGGTCACACCCGGCCTCTGCGGGGTCCCCGGCGCCGTCGGCTG
+GTCGCCGGTGGACAACCCGATCGCCACGGCGGCACCCACCAGCAACACCGCCACCGTCGTGCCGGTGATG
+ATCACGGCCGGCAGGCGATACCACGGGATTGGCGGGGACTTGGGCTCGGGCTCCGCATGGGCATCGTGGT
+CGAAGCTCAGCGACGGGCGGGCCGCTGTGTAGCCAGGGGCCGGCCCGATGTGGGAGTCCTCGTCGGCCTC
+CGACCAGGCCAAAGCCGGCTGCAGGACCGACGCCGGCGCATCGGCCGGCGCCGTCGCCGTCGCCGAGGTG
+ACCGCGGTCAGCACCGTTGCGCTGGTGTCGCCGGGTCTGCGTGCCGCCCACAACGCGCCGCCGAAAGCGG
+CCGTCAATTGCGGACGAGGCGTCCTGACCACCGGCACGCAGAAACGTCCGGACAGCGTCGTGGTGACTGC
+CGGGATATTTGCACCACCACCCACCGAAACGATCGCTACCAGCTCGGCCGTGCGAATTCCGCTGCGGGCC
+AGGGTTTGTTCCAAGGCCCTGCCCACGCTGTCCAGCGAGTCACGGATTGTGTCCTCGAGCTCGTTGCGGG
+TCAACCGGATATCCCCGCCCAACGCGTCGGTCAGCGTGGTCACCGTGCTTGACGAAAGCCGTTCCTTGGC
+TTTGCGACATTCGATCCGCAGCTTAGTCAGTGAGCCGATCGCCGAGGTGCCGGCTGGATCGAACGCGCCC
+GTGCCCGGTAGTTCGGACATGACGTAGCTCAACAGCGACTGATCGATCAGATCGCCGGAGAAAGCCTGAT
+GGCGCACCGTCGCGGCCACCGGCCGATACTCGTCTGCGGCGTCGACGAGCGTGATGCCGGTCCCGCTGCC
+ACCGAAGTCGCATACCGCGACGATCCCACGGGCCGGTATGCCCGGGTCGGCCCGTATCGCGTACAGCGCT
+GCCGCGGCGTCAGGGAGCAGTGACAGTGGCTGGGCCGTACTCGAAGTCCCGTGCGACCATTCCGAGGCCC
+GACGCAGCGCGCTATCCAACGCTGCTACCGCAGCCGGCCCCCAGTGGGCGGGATAGGTCACCGTGACACT
+TCCGGGAAGAGCACGACCGCCGGTAGCGGTGTAGGCCAGCGCCAGCAGTGCGTCAGCCACTAGCGCCTCG
+CTGCGGTACACCGAGCCGTCGGCAGCCACGATGCCGACCGAATCTCCCACCCGGTCTACGAAGTCGGTGA
+TCACCAGGCCTGGCTCGTCCAGCCTCGGGTTCTCCGATGGCACACCGACCTCGGGCGGGCGCTGTCGATA
+CAGCGTCAGCACGGGTTTACGTGTGATGGAGTGATCGGCAGCCACAGCCGCTAGGTTGGTGACACCGATC
+GACAAGCCTAATGCCGGTCTCGCCCCTGTTGCCATATGGCCCAATCCCCGTGTCCGGCGGCTCGTCGCAA
+CCGCCTACCTCGAATTTTCCGTCATACCTATAGCCAATGTGGGCGCCGGTGATCTGGATAGCGACATTGC
+CGCAACGCCCGGTTGGTCAGCAAATGGTGCCCATGCTGGCGACCAACGGGACCTCCGGCGCGGTAAGGCA
+GCCGGGCTCCAGTAATCCCAGCGGCTAGGCCAAGGCCTCGATGTCGTCGGTGGCGACGATGCCTACCGGC
+TTGGAGCCGTGTTGAGAAATGAGTTCGGCCGTCGGCAGCAACCTCCCCACTCAGCAATCCCAGCTTCACC
+CTAAACCTGGCGTTCGTACGCCACCTAGCATCTGGTGGGTGCGAACGGTGATGTCGCGTTGAGCCGCATC
+GGCGCCACCCGTCCGGCATTGAGCGCGTGGCGATTCGTCACAGTGTTCGGGGTGGTCGGCCTGCTCGCCG
+ACGTCGTGTATGAAGGGGCCCGTTCGATCACCGGCCCGCTGCTGGCTTCGTTGGGAGCGACCGGACTGGT
+GGTCGGAGTCGTCACCGGCGTCGGTGAGGCCGCCGCCTTGGGCTTGCGGCTGGTGTCGGGGCCATTGGCC
+GATCGAAGCCGACGGTTTTGGGCCTGGACCATCGCCGGCTACACCCTGACGGTGGTAACGGTTCCGCTGC
+TCGGCATCGCGGGCGCCCTGTGGGTGGCGTGCGCGTTGGTCATCGCCGAGCGAGTCGGGAAAGCTGTGCG
+CGGCCCCGCCAAAGACACCCTGCTGTCGCACGCGGCCAGTGTGACCGGCCGAGGCCGCGGTTTCGCCGTG
+CACGAGGCGCTGGACCAGGTCGGTGCGATGATCGGCCCTCTCACCGTTGCCGGGATGCTCGCGATCACCG
+GGAATGCCTATGCGCCCGCGCTCGGCGTGCTGACCCTGCCCGGCGGTGCCGCCCTTGCTCTGTTGCTGTG
+GCTGCAGCGTCGGGTGCCCCGCCCGGAGTCCTACGAGGACTGTCCGGTTGTCCTCGGTAATCCTTCGGCG
+CCGCGACCCTGGGCGCTGCCGGCGCAGTTCTGGCTGTACTGCGGGTTCACCGCGATCACCATGCTGGGGT
+TTGGCACGTTCGGGTTGCTGTCGTTTCACATGGTCAGCCACGGCGTGCTGGCCGCCGCCATGGTCCCGGT
+GGTCTATGCGGCCGCAATGGCCGCAGATGCGCTGACGGCCTTGGCCTCAGGCTTCAGCTATGACAGATAT
+GGCGCGAAAACCCTTGCCGTTCTGCCGATTCTGTCGATTCTGGTAGTGCTATTCGCCTTCACGGACAACG
+TCACAATGGTGGTCATTGGCACGTTGGTGTGGGGCGCAGCGGTCGGAATACAAGAGTCCACGCTGCGCGG
+CGTGGTGGCCGACCTGGTCGCCAGCCCACGGCGGGCCAGCGCCTACGGCGTGTTCGCCGCAGGGCTGGGC
+GCTGCGACCGCCGGGGGCGGCGCCCTCATCGGCTGGCTGTACGACATCTCCATCGGCACGCTCGTTGTGG
+TGGTGATCGCACTTGAACTGATGGCCCTGGTGATGATGTTCGCGATCCGACTACCCCGCGTAGCACCGAG
+CTAAAGAAGCGATCAGGCGGCCCAACGGAACAGCAGGTTGGTATGCGACAACATGCTTGACCGGCACGCC
+AACAAGCACGACTGCCACCGATCCAGGTAAGTGGCGGCCAAGGACGGTCAACCGGTCTAGGCTCGCCAGT
+ATTACCCCTTCAAGGGCGAAGGGGGCAGGAGGATCTCGATGGGCCTCAACACGGCGATCGCGACTCGGGT
+GAATGGCACGCCGCCGCCGGAGGTGCCGATCGCCGATATTGAACTGGGTTCCCTGGATTTCTGGGCACTC
+GATGACGACGTTCGCGATGGCGCCTTCGCCACCTTGCGCCGCGAGGCGCCGATCTCGTTCTGGCCCACGA
+TCGAGCTGCCCGGGTTTGTCGCGGGCAATGGGCATTGGGCGCTCACCAAGTACGACGATGTCTTCTACGC
+CAGCCGTCATCCGGACATTTTCAGTTCGTACCCCAACATCACGATCAACGACCAGACACCAGAGTTAGCC
+GAATACTTCGGCTCGATGATCGTGCTCGACGATCCGCGCCATCAGCGGCTGCGCTCGATTGTCAGCCGAG
+CCTTCACCCCGAAGGTGGTAGCCCGCATCGAAGCAGCCGTGCGTGACCGGGCCCATCGGTTGGTCTCATC
+GATGATCGCCAATAATCCCGACCGGCAGGCCGATCTGGTCAGCGAACTCGCAGGTCCACTGCCGCTGCAG
+ATTATCTGTGACATGATGGGGATTCCCAAGGCGGACCATCAGCGCATTTTTCACTGGACCAACGTCATTC
+TCGGCTTCGGCGATCCCGATCTGGCCACCGATTTCGACGAGTTCATGCAGGTTTCGGCGGACATCGGCGC
+CTACGCCACCGCGCTGGCCGAAGACCGCCGGGTCAACCACCACGACGATCTGACCAGCAGCCTGGTCGAA
+GCCGAGGTCGACGGCGAGCGGCTGTCGTCGAGGGAGATCGCGTCGTTCTTCATCCTGCTGGTGGTGGCCG
+GCAACGAGACGACGCGCAACGCGATCACTCACGGCGTGCTGGCACTGTCCCGCTATCCCGAGCAACGGGA
+CAGGTGGTGGTCTGACTTCGACGGCCTGGCGCCCACCGCGGTCGAGGAGATCGTGCGGTGGGCCTCCCCG
+GTGGTCTACATGCGCCGCACCCTGACCCAAGACATTGAGTTGCGCGGCACCAAGATGGCCGCCGGTGACA
+AGGTCTCCCTGTGGTATTGCTCGGCCAACCGGGACGAGTCAAAGTTCGCCGATCCCTGGACATTCGACCT
+AGCACGCAACCCCAATCCGCATCTCGGTTTCGGTGGCGGTGGCGCCCATTTCTGCCTGGGCGCCAACCTA
+GCGCGTCGGGAGATCAGGGTCGCGTTCGACGAACTACGCAGGCAGATGCCCGACGTCGTCGCGACCGAGG
+AGCCCGCACGGCTGTTGTCGCAGTTCATTCACGGAATCAAGACGCTGCCAGTTACGTGGTCCTGAAAGGC
+CGAACGTGGCTCGGCGGGTATATGGTGCGCCATTCCCGGTGGCTGTGGGATTTGCACTACACAGGAAGCG
+TTGTCGCCCACCCACTGGCGGACCGGTAGGCACCGATCGGTGCCGGCCTGTTTTGGGTAGCGGATCAAGC
+GCACAAACGACTCGCGGTGGCCGAACAGGATGATGTTGGCGGGACGCCCCGTCTGGCATGACCGCTGCCG
+ACGCGTTCGAGTGCGGTCGAGAGCCAAAGGCGGCTTGATCAGCCGCCAACCGCAGGCCGAAGACGTGCCG
+GCTCAGGTGTGTGACGATCGTAGCCGTAGCGGTCGATGATCTCGCCCCAGTGCTCATCGACAATCGCACG
+CTGCTCGACGGTCAGTTGATAGCTGTTGGTTTTGTAGTCCGCATGGTCAGCTAGGTATTGCCGCAGACGC
+GGCAGGTAACACTCGAAGTCGCCCAGTCCCAGGTGCTGGTATAGCCGGCGCAGCTGTCCCTCGGGATCAC
+CGATCAAATCCTCATAACGCAATTCGTAAAAGCGTGTGGGGTCAACGAGTTCTCGGCCTTCGTCCAACTT
+TCGGTATAGGTCGACGTAGGTCGACACGACCTTGTCGTCCAACCCGTCGAACGTCGGTTGTTGCAAGCCA
+TGTATGCGGTACAGCGCCTTATGAAGATGGATGGTTGATGGATAGACCACATAGGGATCTCGGACGATGT
+GGATGAACTTCGCTTGCGGGAATACCTCCAGCAGCACCTTGATTCGAAAACTATGCGTTGGATTCTTGAG
+GATCACCGTCTTGCGACGGCGGAAGTACACCTGCTGAACGAACCGGAACAGGGTCCGTTTCCAGATTTCT
+AGTTCTCGCGGTGCCACCTGCTCTAGATCCAGGTACTCCTCATACTGGGGCGGCCGGTTCGGGAATGCGA
+TGGTCAGATACGGCGACGGCAGGCCCTGCATACACCACACGAACTCGTCTTCCTGCGGGTGATGCAAGCT
+CAAATCCATGTTGTCCATTGCCCGATGCTTCGATACCAGGAATTCCACATATGGCGCAAACCACTCGGTC
+AGTAGAAAATGGTGTGGCGCAAGGCATTCGTAGCCGGTGGGACCGGTGTGGCGATCATCGACGACCAACA
+GTTCATGCAGCAAGGTGGTGCCGGTACGCCAATGCCCAACAATGAAGATTGGCGGATCGGCGATCACCGT
+TTCGGCCACTCGCCTACCGAAAACGATCTTCTGCCACAACCCCAGACAGGAATTGACCATGCTGAGAAAC
+GTATAGAGGACCGCGAAGTGCCAGCGGCTGTGATGCACGGCGAAGCGGTTACGGATCAAAAGCCGCATCC
+AGGCCGAGAAGTTGCAGCCGACCCACAGCGGTGCGGCCCACTCGCGCCACCGGGAAAGTCGAGACGACGA
+ACGGAGAGCCTTCATGGTGCGACGCGGGGGGTAACGGCGACCCGTAACCGGGTCAAGCCGCGAAGGTTGG
+CGTTTGTCGTCCACGTCGGCGGCTCGACCACCTCTATTCGGTCGATATTGGCGACGATCTCGCGCAAGAT
+CGCCTGACCCTCCATGCGCGCCAGCTGGGTCCCCGGACACAGGTGGATGCCGGAGCCGAACGCGAGATGC
+CCGACCGGGTTGCGGTCGGCGCGAAAGACATCCGGGTCTTCGTACTGGCGCGGGTCACGGTTGGCTGCAC
+CCCATGCCAGCAGCACCAGTGAGCCTGCCGGGATGACCGCTTGACCGACCGAATAGTCGACGCGCGTTGT
+GCGGCAGATGTTTTGGATTGGCGATATAAAGCGGAGGTGCTCCTCGATCGCCGACGGGATCAGGTCTGGT
+TGCTGCGCAAGGAGTGTCAGCTGATCTGGATAGTCGGCCAGCGTCAGAAACAATGTGCTAATCATATGAG
+CAGTGCTCTCATAGCCCGCAACCAGCAGCAACACCGCGAAGAAGAACAATTCGTCATCGCTGAGTCGACC
+TTGCTCGGCATGGGTGGCAAGCTTCCCGAGAACAGTGCATTCCCTAAGCAGCCCGTTGTCACGCCGATGA
+GTGAAGAGTGCACGCAATCGCCGGAATCCGGCAAAGCCCTGCACAAGCGAAATCAACCCGGAGGCTGACA
+AGGCAACGTCGGTGATCCGTACCGCCTGGTTGGACAAACGGCAGAAGGCGGCCTCGTCCGGTCCATCTAC
+GCCGAGCACACTGGTGATAGCGCGCATCGGCATCGGTGCGGCCACGGTGGAGACGACGTCCGCGGGCGTC
+TGGGTCAGTAACCCGCCGACCAGTTCTCGGGCAAGCTGGTCGACCATCGGGCGCCACGTCTCCAACGCGC
+CACGCGCCATACCTGGTGCCAGTTGCTTGCGCATCCGGGTGTGCGCCGGCGGATCGGACGTCGGCAGAAA
+CGGCAGCCACCCCCGTGAGAAGGTGACCCCACGGGCGCTGGACAACGTGTCGTGGTTACGCGCAGCCTCG
+CGGACGTCGGCGTATCGGCTCAAAATGTAGACGTCGCGCTTGGGGTTGTACTGCACCCGCTCGCCGGCCA
+ACAGCTCTCGATAATGCGGGTAAGGATCAGCGGCAATCGCGGGATCGAACGGGTCAAAGTCGGTGAGCTG
+CATAAATTTCCGGCAATGCCGGCCGGTCAACCTGGACCGAGCCTTCCCGGCGACCCTCAGCGCAAGTGCT
+TTCGCGACCGCGGGCCCGTAGGTTCGCACAGTTTGCGCGTCGCGCCACATGCTGGTGGCTACCGGGATGC
+CACCAGATGACGCGCGCCGGCGCGTGGGAACGCCCAGAGCCGTGGTCGCGTCCTGCGCGGTCAGACCAAC
+GTCGGGCGTGCCCGCTAACGGGCACCCGGCCAGCCGCACTCGGTCCGGCGCGGGCTCGGGAGGGGACTGT
+GTCGCGGTCATGACCCTCCGAACTCAGAGAGGCGTAGAACAGTCACAGGGTAACGGCGGGCATCGCAATA
+ATTGCGCAGTTTCGCAAAGCGTTTCGCAACGCAATAAGATGGTTACCCGGAGTTCGGACAGGCGAATCTG
+CCCAGCGCAAGGCTGGTGATAGCGCCGACCAACGGCGCCGTGATCGGTAACCGTTTCCGACCGGCCGATA
+CCGGCCCGGCCACCATAGCGGAGGTCAACCCCACCTGTTGGCGGAACGCCCAAAACTGGGCCGACTGTGT
+AGGCATGCGTCGCACTTGATTGGTCGCCGACCCGGCAATTCGCTAGCCGCGCTAAGGGTCGCGCATCGTT
+GGCCACAACAGGCGCGACTTGCGCGAATGTGCTTTCTCGCCGGCATCGCGATGCCTAACTTTATGTTTTC
+GAGGAGACTGCGATGCGGCTTCCAGGCCGTCATGTGTTATACGCCCTGTCGGCGGTCACCATGCTGGCGG
+CCTGCTCCAGCAACGGTGCTCGTGGCGGCATTGCGTCGACGAACATGAATCCGACAAACCCACCCGCAAC
+TGCGGAGACCGCTACCGTCTCACCGACACCGGCTCCGCAGAGCGCGCGAACCGAGACCTGGATTAACCTT
+CAAGTCGGCGACTGCCTGGCCGACCTGCCGCCGGCGGATCTGAGCCGGATAACCGTCACGATTGTCGATT
+GCGCGACAGCGCATTCGGCCGAGGTATACCTGCGTGCTCCGGTGGCCGTCGATGCCGCCGTCGTTTCCAT
+GGCCAATCGTGATTGTGCTGCCGGATTTGCGCCCTACACAGGCCAATCCGTCGACACCAGCCCATACTCG
+GTGGCGTATCTCATCGACTCGCATCAGGATAGAACCGGGGCCGATCTCACCCCGAGCACCGTCATCTGTT
+TGCTGCAGCCCGCCAACGGTCAGTTGCTCACCGGGTCGGCCCGTCGCTGACCGGACGACCCGTTGTTCGG
+GTGCGTGGCACACGACACCAACCGGTATCGTCTGTTGCCGTGACTTCTCCGATTGCTCCGAATACCAAAA
+GCGACGGTTCTCGCTGATGACTACCCCACCCGACAAGGCGCGGCGCCGGTTTCTTCGCGACGCCTACAAG
+AACGCTGAGCGCGTCGCACGAACCGCTTTGCTCACAATCGACCAGGACCAGCTTGAGCAGCTGCTCGACT
+ACGTCGACGAGAGACTCGGCGAACAGCCTTGTGACCACACCGCCCGGCATGCGCAACGATGGGCCCAATC
+ACACCGCATCGAATGGGAGACGCTGGCCGAGGGCCTACAAGAGTTTGGTGGCTACTGCGATTGTGAGATC
+GTAATGAATGTCGAACCTGAGGCGATCTTCGGCTAGTCCTCTGCCGGCGATGTTCTCATAACGACATGGC
+AAGCCACGCGCTTGACTAAACTCAGCCGACGTCAAACCGCCTGTCCCCGATATGCCCTGCGAGGTTGCCT
+CGTGGCTGATGACTCAAACGACACCGCGACCGATGTCGAACCCGACTACCGGTTCACCCTTGCCAACGAG
+CGGACCTTCCTGGCCTGGCAGCGCACCGCTCTAGGCCTGCTGGCCGCGGCGGTCGCCCTGGTGCAGCTCG
+TCCCGGAACTGACGATCCCCGGCGCACGCCAGGTGCTCGGTGTGGTGCTCGCGATTTTGGCAATCCTCAC
+CAGCGGAATGGGTCTGCTGCGCTGGCAGCAGGCGGATCGCGCCATGCGCCGGCACCTGCCATTGCCCCGT
+CACCCCACACCGGGCTACCTCGCGGTGGGGCTGTGCGTGGTCGGGGTCGTCGCGCTCGCATTGGTGGTAG
+CCAAGGCGATCACCGGGTGAACCGTCACTCGACGGCAGCGAGCGATCGCGGGCTGCAGGCCGAACGGACG
+ACGCTGGCCTGGACCCGGACGGCCTTTGCGTTGCTGGTCAACGGCGTGTTGCTGACGCTCAAGGACACGC
+AAGGCGCCGACGGGCCGGCTGGGCTGATCCCGGCCGGCCTAGCTGGTGCTGCGGCCTCGTGCTGCTATGT
+GATCGCTCTACAACGCCAACGAGCACTTTCGCACCGCCCGCTACCGGCACGAATCACTCCCCGCGGCCAG
+GTCCACATCCTCGCGACAGCGGTGCTGGTGCTTATGGTCGTCACCGCCTTTGCTCAACTGCTCTAGCGCG
+GCGAACAGACGCAAAAGCCCCCGCACGCACGGAGTGTCGGGGGCTTTTGCGTCTACTCGCCAAATGCGAT
+CGTGGCCGATGGCGGCGCGGACCTTCCTGTAAATTGCCGGAATTCACGATTTTGTGCGGCTAGACCAACG
+CCGGGAGCCAGCGTGCCTGCGAGGATAGGAGCGCCTCGGCCGATCCGCCGGCGCAGCCGTTCGGTCACAA
+CGGATCTGACCTGCTCAGCCTGCAAGTCAACCACAAGACCGGTCCAGGCTGATACGCAAAACATGTGAGT
+GTACCCGCCGCCACAGCGGCAGCAGCTGGATCCCCCTTTTGGTGGACACGAGATCCACCCAATAGGCTGG
+GCCGATCGGGCGATAGACATTGTCAGTTCGTGCCGGCACCCTGATCACTGACCTCAACACCGAGCGTCGA
+CCCCGTCCCTATGGTCCAAGGAAAACAATGTCATACGTGGCTGCCGAACCAGGCGTGCTGATCTCGCCGA
+CGGACGACTTGCAGAGCCCCCGGTCAGCCCCGGCAGCGCATGACGAAAATGCGGACGGCATAACAGGCGG
+GACCAGAGACGACTCTGCTCCCAACTCACGGTTTCAGCTAGGCAGGCGCATTCCGGAAGCCACCGCCCAG
+GAAGGGTTTCTGGTTCGGCCATTCACCCAACAATGTCAGATCATCCACACCGAAGGAGATCATGCTGTTA
+TCGGGGTATCCCCGGGGAACAGTTACTTCTCCCGCCAGCGCCTACGGGATCTCGGGCTTTGGGGTCTCAC
+GAATTTTGATCGTGTGGACTTCGTCTACACCGATGTCCATGTCGCCGAGAGTTACGAAGCGCTAGGCGAT
+TCCGCAATCGAAGCCCGGCGCAAGGCGGTCAAAAACATCCGCGGCGTCCGCGCCAAGATCACCACCACGG
+TGAACGAACTCGATCCGGCCGGGGCCCGGCTGTGCGTTCGTCCGATGTCGGAGTTCCAGTCCAACGAGGC
+ATACCGGGAGCTGCATGCGGACCTGCTCACGCGCCTGAAAGACGACGAGGACTTGCGCGCCGTCTGCCAG
+GACCTAGTGCGGCGCTTCCTGTCCACGAAAGTGGGTCCGCGGCAGGGGGCGACGGCTACTCAAGAGCAGG
+TGTGCATGGACTACATTTGCGCCGAGGCCCCGCTATTCCTCGACACACCTGCGATTCTCGGAGTGCCGTC
+GTCGTTGAATTGCTACCACCAATCACTGCCCCTCGCCGAAATGCTCTACGCCCGAGGATCGGGACTACGG
+GCATCGCGCAATCAAGGCCACGCCATTGTTACCCCTGATGGGAGCCCCGCCGAATGACCGCGACCGTTCT
+GCTCGAGGTCCCGTTCTCTGCACGTGGGGATCGGATTCCTGACGCCGTCGCAGAATTACGAACCCGCGAG
+CCTATCCGCAAGGTACGGACCATTACCGGCGCCGAAGCCTGGCTCGTCTCCTCGTATGCACTGTGCACAC
+AGGTGCTCGAGGATCGGCGTTTTTCCATGAAGGAAACCGCCGCTGCCGGCGCCCCCCGCCTGAACGCGCT
+GACTGTTCCACCCGAAGTGGTCAACAACATGGGAAACATCGCCGACGCGGGACTGCGCAAGGCGGTGATG
+AAAGCGATCACACCCAAGGCACCCGGGTTGGAGCAATTCCTACGAGACACCGCGAACTCGCTGCTGGACA
+ACCTGATTACCGAGGGCGCACCAGCCGATCTGCGCAATGACTTCGCCGACCCGCTGGCCACTGCCCTGCA
+CTGCAAGGTTCTGGGCATCCCGCAAGAAGACGGCCCGAAGCTGTTCCGTAGCTTGAGTATCGCTTTCATG
+AGTTCGGCCGACCCGATCCCCGCCGCGAAGATCAACTGGGATCGCGACATCGAATACATGGCCGGAATTC
+TGGAAAACCCAAACATCACGACCGGCCTCATGGGTGAGCTCAGCCGCCTCCGGAAAGATCCCGCCTACTC
+GCACGTCTCCGACGAACTATTCGCGACCATCGGCGTCACTTTCTTCGGTGCCGGCGTCATCTCAACCGGC
+AGCTTCCTCACCACCGCGCTGATATCGCTGATACAACGCCCGCAACTTCGGAACTTGTTGCACGAGAAGC
+CGGAACTGATCCCGGCCGGTGTAGAGGAACTGCTGCGGATCAATCTCTCCTTCGCCGACGGGTTACCGCG
+CCTGGCCACCGCCGACATCCAGGTCGGCGACGTGCTGGTCCGCAAGGGGGAGCTGGTGCTGGTGCTGCTC
+GAGGGCGCCAACTTCGATCCCGAGCACTTCCCTAACCCGGGCAGCATCGAACTCGACCGGCCCAACCCCA
+CCTCGCACCTCGCGTTCGGCCGCGGCCAACACTTCTGTCCTGGATCAGCTCTCGGTCGCCGCCACGCACA
+GATCGGCATCGAAGCGCTGTTGAAAAAGATGCCCGGCGTCGACCTGGCTGTGCCCATCGACCAATTGGTC
+TGGCGCACCCGATTCCAAAGACGCATCCCCGAACGCCTTCCGGTGCTCTGGTAGGCTTCCGGAAACTCAC
+CCGAGCCATCACCGCAAGATTTGGCAAGCGTTGGGACAGAACAATTTCGACCTTGCACCGGCCGAAGGCG
+CTGCCTTCTACCGAATAAAAGTACGGGCCTCCCCCAAACTCCGAAATCGTCAGTACCGCACGCAATTCAA
+ATGAACCGCACCCTGACAGCGAGCGACGTTAATGACGCCATTGTTGGGCCGCCAGCGGCGAGTCCACAAG
+TACCGCATCGAGTCCGATTTTGTGAGCCAGGCGGTAGTCGTCGACAGTTTTCACCGCGAAACCCATGACC
+TTCATGCCGGACTGCGATCTGAAACAGTCGACCGAGGCCTCGTCCCACAACTCGGCATTCACCGCGGAGA
+TACCGGACCCCAACGTGAATTCTTCGGTGACGGTGACATCGCGATGCAACTCGAATCCGGCCCACTTCCC
+AGGATCCGGCTGCGGATCACAGTGATGGTTCAATGCCATGTTGAAAAGGCGCTGGCGGGTCACGTCACGA
+CTTTCGGCGACCTGCAGTCCCTCCTGCCGCGAGGCTGCAGCCGTGATGTCAGCGTTGGTGGAATATACGA
+TCGACCGCCCGGCAGCACCAGTCCTGGTCAACACCTGCGCGACCGCTGAGACCAGCGGCTGTGGCGGAGT
+CTGCTTGGGGTCTAGAAACAGAGTCATATCGGGCGGAGTCGCGCCAATGGCTTGCTCCAGTGTCGGTATC
+GGGGTCGCCCGTTGCCGGTAGGGATGGCCCTCGACGCCCGGCGTGGTGAAATTCCATCCCGCGTTGAGCT
+GCTGGAGTTGCTGAACCGTCTTCGAATTCACCGGGCCGGCGCCGTCGGTCAACGTTGCCAGATCGGACGG
+ACGATACAGCACCGGCACGCCATCGCTGCTGACCTGGACGGTCAGCCACATGCCATCCACACCAGCTGCG
+ACTGCGTTGGTAATCGCCAGAACGGTGTTCTCGGGAAAATCGCGCGTACCCGCGCGATGCGCGACAATCA
+TCGGGTCGTCAGTCTGGCCCAGCGGCAAAGCATCCGCCACACCGCAAGTCCCTCCCAAGGCGATCACCAG
+CGCCACCGCGCCCAACATAGCCGTCTTCACCATCGGTCCCCTTCAGGCTTTCCCCACCGTAGAAACGTGC
+GCAATGCGCGGCGCACAGTATCGAACCGTACCGCTGAGAGCCAACCACGATGATTTGCCCGCACCGGCAG
+CGATAAAGTAAGTCGCGGTCGGGCACGCAGCGCAGCGTTGGAAAGTGAGGCCTCCGATGAGTGAAATGAC
+AGCTCGGTTTTCCGAAATCGTCGGGAACGCCAATTTGCTGACCGGCGACGCAATCCCCGAGGACTACGCA
+CACGACGAAGAGTTGACGGGGCCGCCGCAGAAGCCAGCCTATGCCGCCAAGCCGGCCACCCCCGAAGAGG
+TTGCCCAACTGCTGAAGGCCGCCTCTGAAAACGGTGTGCCGGTGACGGCCCGCGGGTCCGGGTGCGGCTT
+GTCGGGGGCCGCACGACCAGTCGAGGGTGGGCTGCTGATCTCGTTCGACCGGATGAACAAGGTCCTCGAG
+GTCGACACCGCCAACCAAGTCGCCGTCGTGCAGCCCGGGGTGGCGTTGACCGACCTGGACGCCGCTACCG
+CCGATACCGGGCTGCGGTACACGGTTTACCCGGGCGAGCTGTCCTCCAGCGTCGGCGGGAATGTCGGAAC
+CAACGCCGGCGGGATGCGCGCGGTCAAGTACGGAGTGGCCCGCCATAACGTGCTCGGGTTGCAAGCGGTA
+TTGCCCACCGGCGAGATCATCCGAACCGGCGGCAGGATGGCCAAGGTGTCCACCGGCTACGACCTCACCC
+AGCTGATCATCGGCTCGGAGGGCACCCTGGCCTTGGTCACCGAGGTGATCGTCAAGCTGCATCCGCGGCT
+CGACCACAACGCCAGCGTGCTCGCCCCGTTCGCCGACTTCGACCAAGTCATGGCGGCGGTGCCCAAGATC
+CTCGCCAGCGGCCTGGCACCTGACATCCTGGAGTACATTGACAACACTTCGATGGCCGCACTCATCTCCA
+CTCAGAACCTGGAGCTAGGTATTCCGGACCAGATCCGCGACAGCTGCGAAGCTTATCTCCTTGTGGCGCT
+TGAGAACCGCATCGCCGACCGACTGTTCGAGGACATTCAGACGGTGGGTGAAATGCTCATGGAATTGGGA
+GCGGTGGACGCCTACGTGCTCGAAGGAGGCTCGGCGCGCAAGCTGATCGAGGCCCGCGAGAAGGCATTCT
+GGGCGGCAAAAGCACTCGGCGCCGACGACATCATCGACACCGTCGTCCCACGCGCGTCGATGCCAAAATT
+CCTGAGCACCGCGCGCGGTCTGGCGGCGGCAGCGGACGGTGCCGCGGTCGGTTGCGGGCACGCCGGCGAC
+GGCAACGTACACATGGCCATCGCGTGCAAGGATCCGGAGAAAAAGAAGAAGCTCATGACCGACATCTTTG
+CTCTCGCAATGGAATTGGGTGGCGCGATCTCTGGCGAACACGGCGTCGGCCGGGCCAAAACCGGCTATTT
+CCTCGAGCTGGAAGACCCGGTCAAGATCAGCCTCATGCGCCGTATCAAGCAGAGCTTCGATCCGGCGGGC
+ATCCTCAACCCAGGCGTTGTCTTCGGAGACACCTGAGCACGGACAAGAGCCGGCCGGACCAAGGCCGGTC
+ATCGGCCGGCCAACAGGCCTGCAAGTCTCGAGCGCAACATCTTCGTGGACAGCTCGGTCCGCCGGTCGTC
+AAAGCCGATTTCCCCGCATCTGTCCGGTCAGTCCGATGCAGCGTCGGTCACCGTTATTCATCCGGCGTTT
+ACCCGTTGCTAGCCGCCATGACGTAGCCTGCTGACGCTCGATCGCCAACACAAGCCGACATGAGCGACAA
+TGCCAAACACCACAGGGATGGGCATTTGGTGGCTAGCGGACTTCAGGATCGCGCAGCGCGCACACCGCAA
+CACGAGGGCTTCCTCGGGCCGGACCGACCATGGCACCTGTCGTTCAGTCTGCTGCTGGCGGGTTCTTTCG
+TGCTGTTCTCGTGGTGGGCATTCGACTACGCAGGGTCCGGCGCGAACAAAGTCATCCTGGTGCTCGCCAC
+CGTCGTCGGCATGTTCATGGCCTTCAACGTCGGCGGCAATGATGTCGCCAACTCGTTTGGCACCAGCGTC
+GGCGCGGGCACGTTGACCATGAAACAGGCGCTTCTGGTCGCGGCGATCTTCGAGGTCAGCGGCGCGGTGA
+TCGCCGGCGGCGACGTCACCGAGACCATCCGCAGCGGCATCGTTGATCTGTCCGGGGTGTCCGTCGACCC
+ACGCGACTTCATGAACATCATGCTGTCGGCGCTATCGGCAGCCGCGCTCTGGCTGCTGTTTGCTAACCGT
+ATGGGGTACCCGGTGTCGACCACACACTCGATCATCGGCGGCATCGTCGGCGCGGCGATCGCGCTGGGGA
+TGGTGAGCGGCCAGGGCGGTGCCGCACTCAGGATGGTCCAGTGGGATCAAATCGGCCAGATCGTGGTGTC
+CTGGGTGCTGTCGCCGGTGTTGGGCGGCTTGGTGTCGTACCTGCTCTACGGCGTCATCAAACGGCACATC
+CTGCTGTACAACGAACAGGCCGAACGACGGCTAACAGAAATTAAGAAAGAGCGCATCGCACACCGCGAGC
+GCCACAAGGCGGCGTTCGACCGGCTCACCGAGATCCAGCAGATCGCCTATACCGGCGCCCTGGCGCGCGA
+CGCCGTCGCGGCAAACCGCAAGGACTTTGATCCCGACGAACTGGAATCCGATTACTACCGCGAGCTACAC
+GAAATCGACGCCAAGACATCGTCGGTCGACGCGTTCCGGGCCCTGCAGAACTGGGTTCCGCTGGTCGCCG
+CCGCCGGATCCATGATCATTGTCGCGATGCTGCTGTTCAAGGGGTTCAAGCACATGCACTTGGGCCTTAC
+CACGATGAATAACTACTTCATCATCGCGATGGTCGGTGCAGCGGTGTGGATGGCCACCTTTATTTTCGCC
+AAGACACTTCGGGGCGAATCACTTTCACGGTCAACGTTTTTGATGTTCAGCTGGATGCAGGTCTTTACGG
+CCTCGGGCTTCGCCTTCAGCCACGGCAGCAATGACATTGCCAACGCCATCGGGCCGTTCGCGGCAATCCT
+GGATGTGCTGCGCACGGGCGCCATTGAAGGCAACGCAGCGGTGCCTGCCGCGGCCATGGTAACGTTCGGC
+GTCGCGTTGTGCGCGGGGTTGTGGTTCATTGGACGACGGGTGATCGCCACCGTTGGACACAACCTCACCA
+CGATGCACCCGGCATCGGGGTTTGCTGCCGAATTGTCGGCCGCCGGGGTGGTCATGGGAGCCACGGTCCT
+GGGTCTTCCGGTTTCCAGCACGCACATTCTTATCGGCGCCGTCCTCGGCGTCGGCATCGTAAACCGGTCC
+ACCAACTGGGGACTGATGAAACCGATCGTGCTAGCGTGGGTCATCACGCTGCCTTCGGCGGCGATCCTCG
+CCTCGGTCGGTCTTGTCGCGCTACGCGCGATTTTCTGACGACGCCGGGTCCATCAACCCCAGCGCAACCT
+CCGCGAGCAGTCGCTAAAGCCCCCGACACGCCGTGCGTGCGGGGGCTTATGCGACTGCTCGCCGGACGGA
+GGTCCTACGTGCTGCGGGAAGTGATGTGGCTGAGCAGGTCTCGTATCGCACCCGCCGGCGGGGTGCGCCC
+ACCGACCCAGATGGCTCGAAGCTGGCGCCGCAGGTTCAACGCGGGGATGTCGACCGCGAGTAATCGACCG
+AACGCCAGGTCATCGGCTATCGCTAGCCGGCTCATCGCAGCCGGTCCAGCGCCGGCCAAGACCGCGGCCC
+GCACGGCCGCAGCCGATGATAATTCCAGCACCGGTGGCGCTTGCTGCATGTCCTCCCCGAGCGTGTCACG
+TAACGCCGCGGTGAGTGAATCGCGGATGCCAGAGTTCGGTTCGCGAGTCACCAAAGGCGTCTGAGCGAGC
+TCCCGGGCGCTCACTACTCGTGACCGTCGGGCCCACTTGTGACCCGGCGGCACGACGACGACCAGTTCGT
+CGCGTGCAACCACAACGCTGCCTAATCCCGTGGGAGGACAGGGGTTTTCGATGAATCCAAGATCTGCGAT
+GCCGTCACGAACGGCTGCGATCGCATGCTCGCTATTGGTGGCGGTCAGGATTACCTCAGGGACAGTACCA
+CCGCGGCGCATGTCGGCGGCCCGCAAGGACAGCATCCAATGCGGCATCAGCTGTTCGGCTATCGTCTGGC
+TGGCCACCACTCTGATGCGCTGGCGGCCTTCGGTGCGCAGCGAGCCGAGGCCGGCATCGATCTCGTCGGC
+GACTTCGAGCAAGCGGGCCGCCCATTCGGCGACGACGATGCCGGCAGGCGTGAGTTGGGAGCCACGTGTC
+GTCCGGATGGCCAATCGCACCCCGATCTGGGCCTCCATCGATGCGAGCCGCCTTGACACAGCTTGTTGAG
+TCAACCCGAGTTCGCGTGCGGCGCCGCCAAGACTGCCGGCCTCAGCGATGGCCAGAAAGATTTCGAAGCA
+GGTGAGTCCGGGCATACGAGAGCTGAGCGGCATGCCTGATCAAATCACAACCAATGTTTGTTCCCAACAA
+CATTCAGACCCCTAGTGACGACGGCCCATGCTCGAAAAATGCCCCCACGCGAGCGTCGACTGCGGTGCCT
+CGAAAATCGGCATCACCGACAACGACCCCGCGACCGCCACCAACCGCAGGCTGGCGAGCACAATTCGCAA
+GCCGCCGATCGAGCACGCGGCCGGGCCCTTAGGGTCCACATCACGCGCTGGCCACCGTTCGTACGGCGGG
+GTGGCCTCGTAAGGTAACCACATGGGCGCTCCTCGACTCATCCACGTCATCCGGCAAATCGGGGCCTTGG
+TGGTAGCGGCAGTGACCGCCGCCGCCACGATCAACGCATATAGGCCGCTGGCGCGCAACGGATTCGCATC
+GCTGTGGTCGTGGTTTATTGGCCTGGTGGTTACCGAGTTTCCGTTACCGACGCTGGCGAGCCAGCTCGGC
+GGGCTGGTGTTGACAGCCCAACGCCTGACCCGGCCAGTGCGGGCGGTCTCCTGGCTGGTAGCGGCCTTCT
+CGGCGCTGGGGCTGCTGAACCTCAGTCGCGCAGGCCGTCAGGCCGATGCCCAGCTCACCGCCGCATTAGA
+CAGCGGCCTGGGGCCCGATCGCCGCACCGCCTCGGCCGGTCTGTGGCGCCGCCCAGCCGGCGGTGGTACC
+GCCAAGACCCCCGGGCCGCTGCGCATGCTGCGGATCTACCGCGATTACGCACACGATGGCGACATCAGCT
+ACGGCGAATACGGCAGGGCCAACCACCTCGATATCTGGCGACGTCCCGATCTAGATCTGACCGGAACAGC
+GCCCGTGCTGTTTCAGATCCCCGGCGGTGCATGGACCACCGGAAACAAACGCGGACAGGCGCATCCACTG
+ATGAGCCACCTCGCCGAGCTAGGCTGGATCTGCGTGGCGATCAACTACCGACACAGCCCGCGCAACACCT
+GGCCGGATCACATCATCGACGTCAAGCGCGCCCTGGCGTGGGTCAAGGCGCACATCAGCGAATACGGCGG
+CGATCCGGACTTCATCGCCATCACCGGTGGTTCGGCCGGCGGCCACCTGTCGTCACTGGCCGCGCTAACG
+CCGAATGACCCACGATTCCAACCGGGATTCGAAGAGGCGGACACCCGGGTGCAGGCAGCCGTGCCGTTCT
+ACGGCGTCTATGACTTCACTCGTCTGCAGGACGCGATGCACCCGATGATGCTGCCGCTGCTGGAGCGAAT
+GGTGGTCAAACAACCGCGCACGGCGAACATGCAGTCCTACCTCGACGCCTCACCGGTCACCCACATTTCC
+GCCGACGCTCCCCCATTCTTTGTGCTACACGGCCGCAACGACTCGCTGGTTCCCGTACAGCAGGCGCGTG
+GCTTCGTCGATCAGCTGCGGCAAGTCAGCAAGCAGCCGGTGGTATACGCCGAATTGCCCTTTACCCAGCA
+CGCTTTCGACCTGCTCGGCTCGGCACGTGCGGCACACACGGCGATCGCCGTGGAGCAATTCCTGGCCGAG
+GTCTACGCAACGCAACACGCGGGCAGTGAGCCGGGCCCCGCGGTTGCGATCCCATAGCTTTTGGGGTTGA
+GGTCGCTAGGGTTGGCCTTGTGAAGCTGCTCAGCCCGCTGGATCAGATGTTCGCGCGCATGGAGGCGCCG
+CGCACGCCAATGCACATCGGCGCGTTTGCGGTCTTCGACCTGCCTAAGGGAGCACCGCGCAGGTTCATCC
+GCGACCTGTACGAGGCGATCTCACAACTGGCGTTCCTGCCCTTCCCGTTCGACAGCGTGATCGCCGGCGG
+CGCGTCGATGGCGTACTGGAGGCAGGTGCAGCCCGATCCGAGCTACCACGTCCGCTTGTCCGCCCTACCT
+TATCCGGGGACCGGCCGCGATCTCGGCGCGTTGGTCGAGCGGCTGCATTCGACCCCACTTGACATGGCCA
+AGCCGCTATGGGAGTTGCACCTCATCGAGGGGCTAACCGGCCGTCAGTTCGCCATGTACTTCAAGGCCCA
+CCACTGCGCGGTCGACGGATTGGGTGGGGTGAACCTGATCAAGAGCTGGCTCACCACCGATCCCGAGGCA
+CCCCCAGGCTCGGGCAAGCCCGAGCCGTTCGGCGATGACTACGACTTGGCCAGCGTGTTGGCCGCCGCCA
+CGACGAAGCGGGCGGTCGAGGGCGTTTCCGCGGTCAGCGAACTGGCCGGAAGGCTATCCAGCATGGTGCT
+GGGCGCCAACAGCTCGGTGCGGGCGGCCCTCACCACCCCGCGTACCCCGTTTAACACCCGCGTCAACCGG
+CATCGACGGCTAGCGGTGCAAGTGCTGAAACTGCCGCGCCTCAAGGCAGTGGCCCACGCCACCGACTGCA
+CCGTCAACGACGTGATCCTGGCGTCTGTCGGCGGGGCTTGCCGACGCTACCTGCAGGAGCTGGGCGACCT
+GCCGACGAACACCCTGACCGCCTCGGTGCCGGTCGGCTTCGAGCGCGACGCAGACACGGTCAACGCCGCC
+TCGGGTTTCGTCGCGCCGCTGGGCACCTCGATCGAAGACCCGGTTGCGCGGCTGACCACAATCTCGGCGT
+CGACCACCCGCGGCAAGGCCGAACTGCTGGCGATGTCACCAAATGCCTTGCAGCACTACTCCGTATTCGG
+CTTGCTGCCGATCGCGGTGGGGCAGAAGACCGGCGCACTCGGGGTGATTCCACCGCTGTTCAACTTCACC
+GTCTCCAATGTGGTGCTCTCGAAGGACCCGTTGTATCTTTCGGGCGCCAAGCTGGATGTGATTGTTCCGA
+TGTCGTTCCTGTGTGACGGCTATGGCCTCAACGTGACGCTGGTCGGCTACACGGACAAGGTCGTCCTCGG
+CTTTCTGGGCTGCCGTGACACCTTGCCGCATCTGCAGCGGCTAGCGCAGTACACCGGCGCGGCATTCGAG
+GAACTCGAGACCGCCGCCTTGCCATAGCGACCAAACGACGACAACGCTCCGCCCATCGCCGGCAGTACCC
+GCCAATCACCACGGTGTAGCCGCTCAGGAGCGGCCCGCCAGCCGGTCGATATCAACGATCTCCCCGCGAT
+TGATGCTCACCCAATCGCGCCCATCGAGGTAGGGGCGTAGCTGCTGGGCAATGAGTTCAACATCGGCTGG
+TGACTTCGGTCGCTGAAGTTCGTAGACGTGCGGCAGCCCCGCCATGCCCGTGACGACGCTCCACAGGTTC
+AGGGCGGCCGGTCCAGCAGGCGGGTCCACCAGCACCGGCCCAAAAAGGCATTGTCCGTCCAAAAAGAGCG
+TCGGCACGCCGTATCCGCCCGCGGCGACAACCCGTTAGTGGTCGGCGCGGACGTCGTCGTGGGTCGTCGG
+ATCATCCAGCGCCGCGTCCAAAATCGCCGCATTGACGCCGACGTCGCACAGTAGGCGTCGCGCCACCGCG
+GGATCATGCGGTTTGCCGCCCAGGGTGTGCAGCTCATGACCGATCGCTGCATACCACCGATCAAGCAACG
+ACATGTTCGTTCGACGCAGCAGCGCACCGATCCGCATCAACGACCAGCCATAGGACCAGTCTCGCTCCCA
+CGGGTGCTTCTTGCCCGCTACCAGGTTGATCTCCTCGAGGCTGAAAAACCGCCAGTTGATCGTGATTCCC
+AATTGCGCGCGCACATCACGGATCCACACCGAGGTCTGATAGGCGAACGGGCACAAAGGGTCAAAGTGGA
+AATCCACGGTGGTCATCAGACCTGAGTCCTCCAGCTGATCGAGTCGACACCTCGATGACATTGTGCCGTG
+CGCCACGTTGTCAGCGGACTGAGTCGACCCAACATCTCGGGGTGTTCGCCAGGGTGCCGAAACAGGTCAA
+CGCGGCGGTATGAATGGTCGACGCACCATAGGCGAGGATGGGCTGGTGTTCGGGCTCGTCGTTATCGTTG
+CGCTGGTCGCCGCCGTGGTCGTGGGGACCGTCCTGGGCCACCGCTATCGCGTGGGCCCTCCAGTGTTGCT
+CATCCTGTCCGGTTCCCTGCTGGGTCTGATTCCCCGTTTCGGTGACGTTCAGATCGATGGCGAGGTGGTG
+CTGCTGCTGTTCCTGCCGGCGATCCTTTATTGGGAGAGCATGAACACCAGCTTTCGCGAGATCCGCTGGA
+ACCTGCGCGTCATCGTCATGTTCAGTATCGGGCTGGTGATTGCCACCGCGGTCGCGGTGTCGTGGACGGC
+ACGAGCGCTGGGCATGGAGTCCCACGCCGCGGCTGTCCTCGGTGCCGTGCTCTCCCCCACCGATGCCGCG
+GCGGTGGCCGGCCTGGCGAAACGGTTGCCGCGCCGGGCGCTGACAGTGCTACGCGGCGAGAGCCTCATCA
+ACGACGGGACCGCGCTCGTGCTGTTCGCCGTCACCGTGGCGGTCGCGGAAGGTGCCGCTGGGATCGGCCC
+GGCCGCGCTGGTCGGCCGGTTCGTCGTCTCCTATCTCGGCGGAATCATGGCCGGGCTGCTGGTCGGCGGC
+CTGGTGACATTGCTACGCCGCAGAATCGACGCACCATTGGAGGAGGGAGCCCTGAGCTTGCTGACGCCGT
+TCGCAGCGTTCTTGCTCGCTCAATCTCTGAAGTGCAGCGGTGTGGTTGCGGTGCTGGTTTCGGCCCTGGT
+CCTCACCTACGTTGGTCCGACGGTGATACGCGCTCGTTCCCGCCTGCAGGCGCATGCGTTTTGGGACATC
+GCCACGTTCCTGATCAACGGCTCGTTGTGGGTGTTTGTCGGCGTCCAGATCCCGGGCGCGATAGACCACA
+TCGCCGGCGAGGACGGGGGACTACCACGGGCCACAGTCCTGGCCCTGGCGGTGACGGGTGTCGTTATCGC
+CACCCGGATCGCCTGGGTACAGGCAACCACGGTCCTGGGTCACACCGTGGACCGGGTCCTGAAGAAGCCC
+ACCCGCCACGTCGGCTTCCGTCAGCGTTGCGTCACAAGCTGGGCCGGTTTCCGCGGCGCGGTATCGCTTG
+CCGCAGCGCTGGCGGTGCCGATGACCACCAATAGCGGCGCTCCATTCCCAGACCGCAACCTGATCATCTT
+CGTCGTCTCGGTCGTCATTCTGGTCACCGTGCTGGTCCAAGGGACTTCCTTGCCCACCGTCGTTCGGTGG
+GCGAGGATGCCCGAAGACGTCGCGCACGCCAACGAATTGCAGCTGGCCCGCACCCGTAGCGCCCAAGCCG
+CCCTCGACGCTTTGCCGACGGTCGCCGACGAACTCGGGGTCGCCCCCGATCTCGTCAAACACCTGGAAAA
+GGAATACGAAGAACGCGCGGTGCTCGTCATGGCCGATGGCGCCGACTCCGCGACCAGCGATCTGGCCGAG
+CGCAACGATCTGGTCCGGCGCGTGCGTCTAGGCGTGCTGCAACACCAGCGGCAGGCCGTCACCACGTTGC
+GCAACCAAAACCTCATCGACGACATCGTGCTGCGCGAGCTGCAGGCGGCGATGGATCTAGAGGAAGTGCA
+ACTCTTGGACCCCGCCGACGCCGAGTGAGCCGGCGCCGCCCGCTGATCGAACCAGCAACGGTTCAGGTTT
+TGGCCATTGCTTTCACAGACTCATTCAGCGTTTCATTGCACTGGCCGCAGCGCGAGCAGGGCTGCCGCAC
+AGCGATCTTGGCGCCTATGCGAAGGTGGTGCGATGGTGATGTGGACGGGCGAAAGTTACTGCCACCGGCA
+CGCCGCACTGGCACCCAACAGAGGAGGATCAGGCCCGCCGCACCCAGGGTCTACACGACCGGCGACATCC
+TGCGTGATCGGAAGGGCATAGCGCCATGGCAGGAACAACGCGAACCGGGCTGGGCGCCGTTCGGTTGGCT
+GCACGAGCCCTCGGGCGCAAGGTGCCCAAAAGCCGACGGGCAGTCAGTCTAAGTGTCTTGATAGGTGCGG
+TGATAGCAGCTCTTGCCGGGGCGCTGATTGCGGTAACCGTACCGGCGCGGCCGAATCGCCCTGAGGCCGA
+CCGTGAAGCACTGTGGAAAATCGTGCACGACCGTTGCGAATTCGGCTATCGGCGTACCGGTGCGTACGCT
+CCCTGCACATTCGTGGATGAACAGTCTGGAACGGCGTTGTACAAAGCGGATTTTGATCCGTACCAGTTCC
+TTTTGATCCCGCTTGCTCGTATCACCGGAATCGAGGATCCCGCCCTACGGGAGTCAGCGGGTCGCAATTA
+CCTCTACGACGCTTGGGCCGCACGGTTCCTCGTTACCGCGCGCCTGAACAACTCACTTCCAGAGTCAGAC
+GTAGTCCTCACCATCAACCCGAAGAACGCGCGCACTCAGGATCAGCTGCACATCCACATATCGTGTTCGT
+CACCAACAACATCGGCAGCCCTGAGGAACGTGGATACCTCAGAGTACGTTGGCTGGAAGCAGCTCCCCAT
+CGACCTCGGTGGTCGCAGGTTTCAAGGATTGGCGGTTGACACGAAGGCGTTCGAATCCAGGAACCTGTTC
+CGGGACATCTACCTGAAGGTAACCGCTGACGGCAAGAAAATGGAAAATGCATCGATTGCGGTTGCCAACG
+TAGCGCAGGACCAATTCCTGCTGCTCTTGGCAGAGGGAACTGAGGACCAGCCCGTTGCAGCCGAGACTCT
+CCAAGACCACGACTGCTCCATCACCAAGTCCTGATAGCACGATGCCAGCGGGCCACACGACAGGGCGCAG
+TGTGCGAACCTGACCCCGCCACGGCGGGCCGTTGATGGCATTTTGCTAGTGTCGGAGCGGCAATCCGCCT
+ATATTTCTCCTCGCCTACCAGTGAGGGAGCCGGGCTTGACTGATCCGCGCCACACCGTTCGAATCGCTGT
+CGGAGCTACCGCGCTCGGCGTGTCGGCACTCGGGGCAACTCTGCCGGCCTGCTCCGCACACAGCGGGCCG
+GGTTCTCCCCCAGTGCGCCGTCAGCTCCCGCGGCCGCGACCGTCATGGTAGAGGGACATACGCACACAAT
+TTCCGGAGCGGTCGAGTGCCGCACCTCGCCAGCGGTAAGGACGGCGACGCCGTCGGAGTCGGGGACTCAA
+ACTACACGGGTTAACGCACACGACGATTCGGCCTCGGTGACACTGTCCCTGTCCGACTCCACGCCCCCAG
+ACGTCAATGGTTTTGGTATCTCCCTTAAAATCGGAAGCGTCGACTACCAGATGCCCTACCAGCCGGTTCA
+GTCCCCAACTCAGGTCGAAGCGACCAGGCAGGGCAAGAGTTACACACTGACCGGGACGGGTCACGCGGTG
+ATCCCGGGCCAAACCGGCATGCGTGAGCTGCCGTTCGGGGTACATGTAACCTGTCCGTAACTACACTGAT
+TGCGCGACAAGGGAATTAGCCGCGTTGGCAGGCAACACGGAGGTGACCGGTGCAAGCCCGTGGTCAGGTC
+CTGATCACCGCCGCGGAACTGGCTGGCATGATCCAGGCCGGCGATCCGGTGTCGATCCTGGATGCGCTGG
+CGGCTTGATGAACCTGACGGGCATGCGGCCTACCTACAGGGTCACCTGCCGGGAGCGGTATTTGTGTCAC
+TCGAGGACGAACTGAGCGATCATACGATCGCCGGCCGGGGCCGGCACCCGCTGCCGTCGGGGGCTAGTCT
+GCAAGCCACCGTCCGCCGATGCGGAATCCGACACGATGTGCCGGTCGTGGTCTACGACGACTGGAATCGA
+GCCGGTTCCGCGCGAGCGTGGTGGGTGTTAACTGCGGCTGGGATCGCGAATGTACGCATTCTAGACGGCG
+GCTTGCCCGCGTGGCGGTCCGCAGGCGGCAGCATCGAGACCGGCCAGGTCAGCCCGCAGCTCGGGAATGT
+GACTGTGCTGCACGATGATTTGTATGCCGGACAGCGGCTAACCCTAACGGCGCAGCAAGCCGGTGCGGGT
+GGTGTGACGCTGCTCGATGCGCGCGTACCGGAACGTTTCCGCGGCGATGTCGAGCCCGTGGATGCGGTTG
+CCGGTCACATCCCCGGCGCCATCAACGTTCCCAGCGGTAGTGTCCTGGCCGACGACGGCACGTTCCTTGG
+CAATGGCGCCCTTAACGCACTGCTGTCCGACCACGGCATCGATCACGGTGGCCGCGTGGGTGTCTACTGC
+GGCTCGGGTGTCAGCGCAGCTGTCATCGTCGCGGCACTGGCAGTGATCGGCCAGGATGCGGCGCTGTTTC
+CAGGGTCATGGTCGGAGTGGAGTTCGGATCCGACCCGTCCCGTCGGCCGTGGCACTGCATAGTCAGACGC
+CGGCCCAGTTCTGCAGGAAGGCTTCGGTGACCCGGGCGGCGTTGTTGGCCGCAATCTGCTTGTAAACGAA
+GAACTGGACGGGGAAGCCCGGCAGATGCAGCGGGTCGCCGGGCCCGTCGGACATACCGCGAATTCCCAGG
+AACGGGACGCCGTGTGCATCGGCGACCGCCTGCGCGGCTGCCGTCTCCTGGTCAACCGCGTCGAAGCCGG
+GGTTCACCGTCGATACGATGTTCAGGTTGCTGATCAGAGCGTTCTTCAGCCAGGGTCCCGCCGCCTGGAA
+AAAGTTACCGGTATAGCCAAGTGAGCGATCGGGTGCACTACAGGGTTGGCAGCCAAAAACGCTGCCGCCG
+TTCGGGATGCAAGGAAAAGCCTGGCCGTTGTTCTTGTCGGAGCTAGACCCGTCACCGCCGACGAACAGTT
+GCGGCTGGCGCCCCAGGTGGTTCAACCGGACGACCGGAACGTTCCTGCACAGACAGACAGGATTGCCGAG
+CGTGTTGATGTTGTCCAGTACAACAGAAAGCGTCTGGGCAGTAGCCAGCATGCCGGGATCGACCCCACGG
+AATGTTGCCCCGTTGTCCAGGGTCCACCGTGCTGGTATTGCCACGTCCCCAATGCTGGTGCGGCCGGCAC
+CACCGGCGACGCCCGAGAACATCACGGCGGCAATGGCAATGGAAGAAGCACAGGTAAAGCGTGCGAAGGC
+GGTCTCGGTGGTGTTGGTAGCGTTCACTAGGCCGATGCCGGTCATCGCCACAATCACCTTCTTGCCGCTG
+ATCGAGCCCAGGTAGTAGCGACGACGGTCGGCGACCACCACCGGGTTGGCGTCCAGCGCGGTGTGCGCCA
+GCACCGCGTCGGCCTCAGCCGGAAACGCCGACAAGACCAGCGTGCGCTGTTCGCACGGGATCACATTTGC
+CACGTATCCGGGATCGGCCGCCGCCACGCCACAGCCCAGCGACAACGCGGCCGCCACCAAAAGACAGTGC
+CGCAAAGGCGCGCCCACAATCCCTTATCCCCAAAAATCGTGATTTGACATGGATGCCGGAACTCTCTGTC
+ATTTAGCCGTGGCCGATTTGGGGCTTGGCCCTGATTTTCGCGCACCATCGGCGACGGACGAATATTTGTT
+ATCGTTTTTTTCGTCTAGCGATTCCTCGGCGTTATTTCATCGCGGCGGAACGAGCCGCCCTATGACCAAC
+TGTGCAAGCGTGATTGGTCGATAGCCCCGGTCGGGCTATGTTCCCCGGTGTGGCTAGACCAGTTGACCGG
+TGCGGGACGCGGATACGGCTAGTCTGCCGGAGTGATACCTAACCCACTCGAGGAGCTAACGCTCGAGCAA
+CTGCGAAGCCAACGCACGAGCATGAAGTGGCGTGCGCACCCAGCCGACGTCTTGCCGTTGTGGGTCGCGG
+AGATGGACGTGAAGCTTCCGCCGACGGTGGCCGATGCCCTCCGTAGAGCTATCGACGACGGCGACACCGG
+ATATCCCTATGGAACGGAGTATGCCGAAGCCGTCCGCGAATTCGCTTGCCAACGTTGGCAATGGCACGAC
+CTGGAAGTGAGCCGCACGGCCATCGTTCCCGACGTCATGCTCGGCATCGTCGAAGTGCTGCGTCTGATCA
+CCGACCGCGGTGACCCTGTGATCGTCAACTCCCCGGTATATGCGCCGTTCTACGCTTTCGTGTCGCATGA
+CGGCCGCCGAGTGATCCCAGCGCCGCTGCGGGGAGACGGCCGGATCGATTTGGACGCGCTGCAGGAAGCG
+TTCTCGAGCGCGCGTGCTTCAAGCGGCTCGAGCGGCAACGTCGCCTACCTCCTGTGCAATCCGCACAACC
+CGACGGGGTCGGTGCACACCGCCGACGAACTGCGCGGCATCGCGGAACGCGCCCAACGGTTCGGTGTCCG
+GGTGGTGTCCGACGAGATTCATGCCCCTCTTATCCCGTCCGGGGCACGGTTTACGCCCTATCTGAGCGTC
+CCCGGTGCGGAAAACGCATTCGCACTAATGTCGGCTTCCAAGGCGTGGAATCTCGGCGGACTCAAGGCAG
+CCCTGGCCATTGCCGGTCGCGAGGCGGCGGCCGACCTCGCTCGGATGCCCGAGGAGGTCGGTCACGGCCC
+CAGCCACCTGGGTGTCATCGCGCACACCGCGGCGTTCAGGACTGGTGGCAACTGGCTCGACGCGCTGCTG
+CGCGGTCTGGACCACAATCGAACGTTGCTAGGCGCTCTGGTCGACGAGCATCTTCCCGGGGTGCAATACC
+GATGGCCGCAGGGTACTTACCTGGCGTGGCTGGATTGCCGAGAACTCGGCTTCGATGACGCGGCTAGCGA
+CGAGATGACCGAAGGCCTGGCGGTGGTGTCAGATCTGTCCGGGCCAGCCCGCTGGTTCCTCGACCACGCG
+CGGGTTGCGCTCAGTTCTGGTCACGTCTTCGGGATTGGCGGTGCCGGGCATGTGCGCATCAACTTCGCGA
+CCTCCCGAGCCATTCTCATCGAGGCGGTATCGCGGATGAGCCGGTCACTACTCGAGCGCCGGTAGCGCGT
+CCAGAGAACCGCTAGCGCCAACACGATCACCTCGGGTGACGGTCTTGTCCGCTCGGCGGCCCTTCAGTGC
+CCAGCCAATGCGGCCGACCCCGCGGCGGCCGCATTCGGTAGACAAAGGAAGTCTGACACCGTAGGCGCCT
+CGTTGATCGCGTTTTCGCCGAGAAACGTGAAGGCCGTTTGCCCGCCCGTGCGGATCAGCTACGATCAAGG
+CGGCCACATGGACCAGTCGGCCAACCATGCGTGTCTGCCCACCCCGCTGGCGAGCACAACAGGGCGCGGG
+CAAGATCATGAGATGCCTGTCGAAGAGACCTCCACCCCCCAGAAGCTGCCCCAATTTCGTTATCACCCCG
+ATCCCGTCGGCACCGGCTCGATAGTCGCCGACGAGGTGAGCTGCGTGAGCTGCGAGCAACGTCGGCCCTA
+CACCTACACCGGCCCGGTGTATGCGGAGGAGGAGCTTAACGAGGCCATCTGTCCTTGGTGTATCGCAGAT
+GGCAGTGCGGCGAGTCGCTTCGATGCCACGTTCACCGACGCCATGTGGGCGGTGCCCGACGACGTTCCAG
+AGGACGTGACCGAGGAAGTGCTGTGCCGAACACCCGGGTTCACGGGCTGGCTGCAGGAGGAATGGTTGCA
+TCACTGCGGGGACGCCGCCGCCTTCCTTGGCCCGGTGGGCGCCAGCGAGGTGGCCGACCTCCCTGACGCC
+CTGGATGCGCTGCGCAATGAGTACCGCGGCTACGACTGGCCCGCCGACAAAATCGAGGAATTCATCCTGA
+CGCTCGATCGAAACGGGCTGGCGACCGCCTACCTCTTCAGGTGCCTGAGCTGCGGCGTCCACTTGGCCTA
+CGCCGATTTCGCTTAACCTCGGCGGCGACTGAGTCGACGCGAGCGCGGATATCGGACGCTTTTGCACAAC
+AATGGTTCCGACGTGGCACAGCTCAGAGAGGAGCAGATCATGGATGTCCTACGCACCCCAGACTCCCGGT
+TCGAACACCTGGTGGGCTACCCGTTTGCACCGCACTATGTCGATGTGACGGCCGGCGACACCCAGCCGTT
+GCGAATGCACTACGTCGACGAGGGCCCGGGCGACGGTCCGCCGATCGTCTTGCTGCACGGCGAGCCCACC
+TGGAGTTATCTGTACCGAACCATGATTCCGCCGCTCTCCGCCGCCGGGCACCGTGTGCTCGCGCCCGACC
+TGATCGGCTTCGGCCGCTCCGACAAGCCGACTCGCATCGAGGACTACACCTACCTGCGGCACGTCGAGTG
+GGTGACGTCCTGGTTCGAGAATCTCGACCTGCACGACGTTACGCTCTTCGTGCAGGACTGGGGGTCATTG
+ATCGGTCTGCGCATCGCTGCCGAGCACGGTGACCGGATCGCGCGGCTGGTGGTCGCCAACGGGTTTCTCC
+CCGCCGCGCAGGGGCGCACCCCACTCCCCTTCTACGTGTGGCGGGCGTTTGCGCGCTATTCTCCGGTGCT
+TCCCGCTGGCCGTCTGGTGAACTTCGGCACCGTCCACAGGGTTCCCGCCGGGGTCCGAGCCGGCTACGAT
+GCACCTTTCCCCGACAAAACGTATCAAGCCGGCGCCCGGGCGTTCCCACGGTTGGTGCCGACCTCACCCG
+ACGATCCGGCGGTACCGGCCAACCGCGCGGCATGGGAAGCCCTGGGCCGGTGGGACAAACCGTTCCTTGC
+CATCTTCGGTTATCGCGACCCGATACTCGGGCAAGCGGACGGTCCGCTGATCAAGCACATTCCCGGCGCG
+GCGGGTCAGCCGCACGCCCGCATCAAGGCCAGCCACTTCATCCAGGAGGACAGCGGAACCGAACTCGCCG
+AACGCATGCTCTCCTGGCAGCAGGCAACGTAACCGCGACGGCTGCGGACGAAGGATCGGCAGAATGGCGA
+TGGAGATGGCGATGATGGGCCTGCTCGGCACCGTGGTGGGTGCCTCGGCCATGGGCATCGGGGGGATTGC
+GAAGTCGATCGCGGAAGCGTATGTCCCGGGGGTCGCGGCTGCCAAGGACCGTAGGCAGCAGATGAACGTC
+GATCTGCAAGCACGGCGCTACGAGGCGGTGCGAGTGTGGCGGTCTGGGTTGTGCAGTGCCAGCAACGCCT
+ACCGGCAATGGGAGGCCGGGTCTCGGGACACCCATGCGCCCAACGTCGTCGGCGACGAGTGGTTCGAAGG
+TTTGCGGCCGCACCTGCCCACCACTGGGGAGGCAGCGAAGTTCCGTACCGCTTACGAAGTCCGTTGCGAT
+AACCCAACTCTCATGGTGCTTTCGCTTGAGATTGGCCGTATCGAGAAGGAATGGATGGTGGAGGCGAGCG
+GCCGGACACCAAAGCACCGGGGATGACTGCGAAGACTCGCGGTTGGTAGCGCACCCGGCTGGTGCGGCGC
+CGACAAGCTGCCCACATTCGGTGACACTGAATTTCTGCAGCAAAAGCGCGAGTGACCAACGGTCTGCGAA
+ATTACCGGCTCGGGGTCGGCTACACCGTCGAGCGACGCGGTCGCCGCCGCGCCGAGCCCCTCGGTACGGT
+GGCAGACATGAAATATCTGGACGTCGACGGAATCGGACAGGTCAGCCGGATCGGGTTGGGCACTTGGCAG
+TTCGGCTCGCGTGAATGGGGATATGGGGACCGGTACGCCACCGGCGCCGCCCGCGACATTGTCAAACGCG
+CACGCGCCTTGGGGGTCACGCTGTTCGATACCGCCGAGATCTACGGCCTGGGCAAAAGCGAGCGTATTCT
+CGGGGAGGCCCTCGGCGACGACCGCACCGAGGTGGTGGTGGCTAGCAAGGTCTTCCCGGTCGCGCCGTTT
+CCGGCGGTGATCAAGAACCGCGAGCGCGCCAGTGCGCGGCGGCTGCAGCTGAACCGTATCCCGCTGTATC
+AGATCCACCAGCCCAACCCGGTGGTCCCCGATTCGGTGATCATGCCGGGGATGCGTGACCTGCTGGACAG
+CGGCGACATTGGCGCGGCCGGTGTCTCCAACTACTCACTGGCGCGATGGCGGAAGGCCGACGCCGCGCTT
+GGGCGCCCAGTCGTCAGCAACCAGGTACATTTCTCGCTCGCCCACCCTGATGCGCTCGAAGATCTGGTGC
+CGTTCGCCGAGCTCGAGAACCGCATCGTGATCGCCTACAGCCCGCTGGCGCAAGGACTATTGGGTGGCAA
+GTACGGACTCGAGAATCGTCCCGGTGGCGTGCGCGCGTTGAACCCGCTGTTCGGCACCGAGAACCTGCGC
+CGGATAGAGCCGCTGCTGGCTACGTTGCGCGCCATCGCCGTCGACGTCGACGCCAAGCCCGCCCAGGTGG
+CACTGGCCTGGCTGATTAGCCTGCCGGGGGTGGTCGCCATTCCCGGAGCGTCCAGTGTCGAGCAACTCGA
+GTTCAACGTCGCGGCCGCTGACATCGAGCTCAGCGCGCAATCCCGCGACGCGCTCACCGACGCCGCCCGG
+GCGTTTCGCCCGGTTTCCACCGGCCGCTTCCTCACCGACATGGTGCGTGAGAAGGTCAGCCGTCGTTGAG
+CTCGCTACAAGGTACGCGCGAGACGTTCGGCCAGCAGCTCGGCGAACCTCGCCGGATCCTCGAGTGCGCC
+GCCTTCGGCGAGAAGCGCTGTGCCGTAAAGTAATTCCGCGGTTTCGGCCAATGATTTCTCGGCATCGTCT
+GCGCGGTCCTGGTGGGCTTGGCGCAGGCCGGTCACCAACGGATGGCTCGGGTTGAGCTCAAGTATCCGCT
+TGCCGACCGGAACCTCCTGGCCGGAAGCCCGGTAGATGCGCGCGAGCGCGGGTGTCATCCCGAAGGCATC
+GGTGATCAGACAGGCCGGTGACTCGGTCAGGCGGGTGGACAGCCGCACCTCCTTGACGTGATCGCTCAAC
+GTCTCCTGCAACCAGGTCAGCAGGTCGGCAAATTCCTTCTGCCGCTCCTCGCGCTCGGCCTCGCTGGTGT
+CCTCTTCGGAACTCAAGTCCACCTCGCCCTTGGCAACCGACTGCAGCGGTTTGCCGTCGAACTCCGGCAC
+CATTCCCACCCAGACCTCGTCGACCGGGTCGGTGAGCAGCAGCACTTCGTACCCCTTGGCCTTAAACGCC
+TCCAGGTGCGGTGACTTCAGCAGTTGTTGGCGCGTCTCGCCGGTGGCGTAGAAGATCTGTTGCTGACCGT
+CCTTCATGCGCTCGACGTATTCGGCCAGCGTGGTGGGTTCCTCCTCGCTGTACGTGGAGACAAACGAAGA
+AATACCGAGCAGGGTCTCCCGGTTATCGATGTCTGACAGCAGTCCCTCTTTGAGGACCCTGCCGAACTGT
+GTCCAGAACGTGCGGTAGTCCTCCGGCCGGCTGGACTGCACGTCCTTGATCGTGGACAGCACCTTCTTGG
+TCAGCCGCCGGCGGATGGCCTTGATCTGCCGGTCCTGCTGCAGGATTTCGCGAGAAACGTTGAGCGACAT
+GTCCTGCGCGTCGACCACACCCTTGACAAAACGCAAGTACTCGGGCATGAGCTGGTCGCAGTCGCCCATG
+ATGAACACCCGCTTGACGTAGAGCTGGATACCGACGTGGGCGTCCCGGTCGAACAGATCGAACGGGGCAT
+GAGACGGGATGAACAGCAGGGCCTGGTACTCGAAGGTGCCCTCGGCCTTCATCGCGATGATCTCGAGCGG
+GTCGTCCCAGGCGTGCGCGACGTGTTTGTAGAACTCCTTGTACTCCTGCTCAGACACCTCTTCTTTGGGC
+CTCGCCCACAGCGCCTTCATCGAGTTGAGGGTTTCGGTTTCGATGGTGACGGTCTCCTCGCCGCCTTCCC
+CCCCTTCTTCCTGGGAGGCTGGGGTGCGGCGCTCGACGTCCATCCGGATGGGCCAGGCGATGAAGTCGGA
+GTATTTCTTGACCAGGTTACGGATCTTCCATTCCGAGGTGTAGTCGTGCAGGTCGTCCTCGGCGTCTTCC
+GGCTTGAGGTGCAGGGTGACCGACGTGCCCTGGGGGGCATCCTCGACGGACTCGATGGTGTAGGTGCCCT
+CACCGCTGGACTCCCATCTGGTGGCCGCGCTCTCGCCAGCCTTGCGGGTAAGCAGTTGGACCTTGTCGGC
+CACCATGAACGACGAGTAGAAGCCGATGCCGAACTGACCGATCAGTTCCTCGGAGGCGGCCGCGTTCTTG
+GCCTCACGCAGCTGTGCGCGCAGCTCGGCGGTGCCCGACTTGGCCAGCGTGCCAATCAGATCCACCACCT
+CCTCGCGCGCCATCCCGATGCCGTTGTCACGAACGGTAAGAGTCCTTGCAGCTTTGTCTGCGTCGATCTC
+GATGTGCAGATCGGAGGTGTCGACCTCCAGGTCCTTGTTCCGCAGCGCCTCAATCCGCAGCTTGTCTAGC
+GCATCGGAGGCATTCGAGATCAACTCCCGCAGAAACGCGTCCTTATTGGAGTAGACCGAGTGGACCATCA
+AATCCAGCAGTTGCCGGGCCTCCGCCTGAAACTCCAACTGCTCGACATGGGCGTTCATGAGATTCCTTCC
+GACGACATAGCGACTCGAATTTAGCGAGCTGCGATCCGGCGCCGAGCTGGGGGTGGCCTGGCTAGGCCGT
+ATCGCGAGCAAGCTGATAGAGGTCGGGATCGTGTGCGCAGACGATGAGTAGATCCGGGTCGTGGCGTCGA
+TGGAGTTCGACGATTCGGGCCTGGTTGTCGCGCAGTTGGTTGCGGTTATACGACAACAGCTTTTCCTCGG
+CCCGCATCACGAAGGGCACCCGGAACCGGCCATCGAGGGTGCCGCGATGATAGAAGGCGTCGCCGCAGTG
+CAAAACCCAGCGGTGACCGGCATCGACAGCTACCGCGGCGTGCCCGCGGGTGTGACCGGGCATCGGCACC
+AGAACGACACCGGTGCCGATGGAATCGAGGGGTTTGGCCGATGCGAATCCGCGCCAGGGTTCCCCGTCGG
+GACCGTGCTCCACCAGCTTCGGGCCATGGGCCCACTGTCCGCGTCGATATCGCAGTCGCTCGCGGAGCGA
+AGGGGCGTGGATGGCACCGCGGGCTTCGGCGGCGGTGACGTGGAGGTGAGCCTCGGGGAAGTCGGCGATC
+CCGCCGATGTGGTCGAAGTCGAAGTGGGTGAGCACAATGTGTCGAACGTCGGACGTGCGGTAGCCGAGCT
+GTTCGATCTGGCGGGCCGCGGTTTCGGCCTGCAAGAATGCCGGCCGCAGGACATGACGGAATAGACCTAC
+CCGGCCGGGGTCAAGGCAGTCCTGGATACCGAAGCCGGTGTCCACCAGCACCAATCCATCGTCGGTCTCG
+ACGAGCAGAACGTGGCATAACAGAGCGATGCCAAATGCATTCATGGTGCCGCAGTTGAGGTGGTGGACCT
+TCACCGGCGGTCCCTTCGCTTCGGGGGCGACACCTAACATACTGGTCGTCAACCTACCGCGACACCGCTG
+GGACTTTGTGCCATTGCCGGCCACTCGGGGCCGCTGCGGCCTGGAAAAATTGGTCGGGCACGGGCGGCCG
+CGGGTCGCTACCATCCCACTGTGAATGATTTACTGACCCGCCGACTGCTCACCATGGGCGCGGCCGCCGC
+AATGCTGGCCGCGGTGCTTCTGCTTACTCCCATCACCGTTCCCGCCGGCTACCCCGGTGCCGTTGCACCG
+GCCACTGCAGCCTGCCCCGACGCCGAAGTGGTGTTCGCCCGCGGCCGCTTCGAACCGCCCGGGATTGGCA
+CGGTCGGCAACGCATTCGTCAGCGCGCTGCGCTCGAAGGTCAACAAGAATGTCGGGGTCTACGCGGTGAA
+ATACCCCGCCGACAATCAGATCGATGTGGGCGCCAACGACATGAGCGCCCACATTCAGAGCATGGCCAAC
+AGCTGTCCGAATACCCGCCTGGTGCCCGGCGGTTACTCGCTGGGCGCGGCCGTCACCGACGTGGTACTCG
+CGGTGCCCACCCAGATGTGGGGCTTCACCAATCCCCTGCCTCCCGGCAGTGATGAGCACATCGCCGCGGT
+CGCGCTGTTCGGCAATGGCAGTCAGTGGGTCGGCCCCATCACCAACTTCAGCCCCGCCTACAACGATCGG
+ACCATCGAGTTGTGTCACGGCGACGACCCCGTCTGCCACCCTGCCGACCCCAACACCTGGGAGGCCAACT
+GGCCCCAGCACCTCGCCGGGGCCTATGTCTCGTCGGGCATGGTCAACCAGGCGGCTGACTTCGTTGCCGG
+AAAGCTGCAATAGCCACCTAGCCCGTGCGCGAGTCTTTGCTTCACGCTTTCGCTAACCGACAAACGCGCG
+CACGATGGAGGGGTCCGTGGTCATATCAAGACAAGAAGGGAGTAGGCGATGCACGCAAAAGTCGGCGACT
+ACCTCGTGGTGAAGGGCACAACCACGGAACGGCATGATCAACATGCTGAGATCATCGAGGTGCGCTCCGC
+AGACGGCTCGCCGCCATACGTGGTGCGTTGGCTGGTAAACGGGCACGAGACAACGGTGTACCCCGGGTCG
+GACGCGGTCGTCGTCACCGCCACCGAGCACGCGGAGGCCGAAAAGCGCGCTGCCGCGCGGGCCGGGCACG
+CGGCGACATAGCCGGTGAAAAGCTCTGCTGGCGATGTGGGGCCTACAGGTCTCACGTGTCGAGCCGCAGC
+ACACGTGTGGCGTTACGCCATAGCCAGTCCTCCAGGACTTCCCGGGGGACCGGCAGCGCACGCATCTCGT
+CGCACAATTGCAGGTAAGGGCGGTTGATGAGAAATCCGCCGGTACCGTAAACGATCTTGTTGCGGATTGT
+TGTCTGCCCAAACCGCATCAGCGGCTCCCATCCAGCGCCCGGTGAAGCGAAGTACTTGGGACGGTGCGCG
+GCCAATTCCAGGTAGACGTTCGGGTGTTTCCAGGCGATCAGGCATGCCTGCAGCACCCACGGGTAGCCGC
+CGTGGCTCATCAGGATCGTTAACTCAGGGAAGCGGCAGGCAACGTCGTCGATGTGGCGGGGATGGCCGAG
+ATCGCTGAGCCGTGTCCGAGTCCAATCGGCGGAGGTGTGGATGGAAACGGGCACACCAAGCTCGACGCAT
+TTGGCGTAGCAAGGGAAGTAGGCGGGGTCGGATGCGGGCCGTCCAATCATGAACGGACGCAAGCTCAACC
+CGCGGAAACCGTGCTCGACCACCCAGCGCTCGAACTCGTCGACTGCCGAGTCGCCGGCCAGGATGTCGGC
+ACCGGCGAAGGGTAGGAACCGATCTGGATAGCGGGCCGCGACGGCGGCCACCGAGGCATTGTGGACAAAG
+GTGACACCACACGTGGACCGTTCATCGAATCCCGTGATCAGACTGCGGGTAATCCCGGCGTCGTCCAGGG
+AGTCCAGTATTTGGTCGTCTGTCCTGCGTAGCGACTCCGCGTAGGCACCGAACTGCTCGGCGCTGATCGT
+CGTCTTGGTGAAGACCTCGAAATACGACAGCAGCTCGACGGGAAATCCTTCCCGAAGATCGTCAATGACC
+TCGGCGGACGGAACGAACGGTGCCCACATATCGATGACCGGCACCCGCGGTTCGGGCGCGGTCATGGGGT
+GCTCCGCGGGCCAACCGGACCGTGCAGGAAGTCATCGAATCCGGCATCGCGCTCCACGGCGAATGCCTGC
+TCGAACGTCGTGGCGGGGCGGCCGGTGCACGTCGCCTCCTTGACATCGACTCGCTTCCCGGTGAGGTCGC
+ACAGGACACAACGGTCCAGCGCGCCGTCGTCGGCTTCCTCGGTAGCAATGTCGTGGCTCATCGCTCCTCC
+GTTGACTGTGTCGACCAGCTGAGCATGCGCTCTTATGCGATTACGCCAAGTCAACTGACCCCGCCGACGC
+TTCGCATACCTAGTGTCGGCCAGGGCCACCTGGCCCGCCCGGACCTCCCGGCCCGCCTGGTCCGCCCGGA
+CCCCCGGGTCCGCCTGGTCGGTTTACGGCGGGGAGCCAGAACACGCATTGATTCAAGTCGGGGCTCCACA
+CCCAGCCGGGCGCGCAATCATCGTCGGCCCGGCTGTTCGCCGGCTCGACAAGTCCGGTCACCGCCAACAC
+CGTCAACACCGCAGTGAACGCGCAAAGCGCGCAGCGTCGTAGAAAATGCCTCATCGCAGACCTCACGGTT
+TGTCGTCCGGCGCTGGACCTAGGTTATCGCCACGACCGCCGCGGCGGCAGCACACGTGGCGACTCACCGC
+GGCCGTAGAACCGGTTGAGCAGCAAGCCACTGCGCGTTGGTAAGAGCGGATCCAAGCGCCGGCAACGGAT
+GGTCGGCGAGGGCGCTGATCGGGCAACGATGCCCAGGCCAGGCGGCCCCAGCGAACGCCGCACCGGCTGG
+AGGAAGATAGCCCCATGACCCAAACGCTGCGCCTTACCGCGCTGGACGAGATGTTCATCACCGATGACAT
+TGACATCGTTCCTTCGGTGCAGATCGAGGCGCGGGTGTCCGGTCGTTTCGACCTCGACCGGCTTGCCGCT
+GCCCTGCGCGCCGCCGTCGCCAAGCACGCCCTGGCTCGGGCGCGGCTTGGCCGCGCCAGCCTAACCGCAC
+GGACGCTGTATTGGGAGGTACCCGACCGCGCGGATCACCTCGCCGTGGAGATCACCGATGAACCCGTCGG
+TGAAGTTCGCAGTCGCTTTTATGCGCGGGCTCCCGAACTGCACCGAAGCCCGGTCTTTGCCGTCGCGGTG
+GTACGCGAGACCGTGGGCGACCGCCTCCTGCTCAACTTCCACCACGCGGCCTTCGACGGCATGGGCGGGC
+TGCGTCTGTTGCTCTCACTGGCCCGGGCCTATGCGGACGAGCCTGACGAGGTCGGTGGCCCTCCGATCGA
+GGAAGCCCGCAACCTTAAAGGCGTCGCCGGCTCCCGCGACCTGTTCGACGTCCTGATCCGCGCCCGCGGC
+CTGGCAAAACCGGCCATCGACCGGAAGCGGACCACCCGGGTCGCCCCGGATGGCGGCTCGCCCGACGGGC
+CGCGCTTCGTGTTCGCCCCACTCACCATCGAGAGCGACGAGATGGCAACCGCGGTTGCTCGTCGACCCGA
+GGGGGCGACGGTGAACGACCTGGCGATGGCCGCGCTGGCGTTGACGATCCTGCAGTGGAACCGCACACAC
+GATGTCCCAGCCGCCGATTCCGTGTCGGTGAACATGCCGGTGAACTTCCGGCCGACCGCGTGGTCGACCG
+AGGTCATCTCGAACTTTGCCAGCTACCTGGCGATCGTGCTGCGGGTCGACGAGGTGACCGATCTCGAGAA
+GGCGACCGCCATCGTCGCCGGGATCACCGGACCATTGAAGCAATCCGGCGCCGCCGGGTGGGTCGTGGAT
+CTGCTCGAAGGGGGAAAGGTGTTGCCGGCGATGCTCAAGCGCCAACTTCAGCTGCTTCTCCCCTTGGTCG
+AAGATCGGTTCGTCGAAAGCGTCTGTCTGTCCAACCTGGGCCGCGTCGACGTCCCCGCTTTCGGGGGCGA
+GGCCGGGGACACCACTGAGGTGTGGTTCAGTCCGACGGCGGCCATGAGCGTCATGCCGATCGGGGTTGGC
+CTCGTCGGCTTCGGAGGAACGCTGCGCGCCATGTTCCGCGGCGACGGGCGAACCATCGGCGGCGAGGCGC
+TGGGCCGCTTCGCCGCACTGTATCGCGACACACTGCTGACCTGAGGGCCCGGCATGACCGACAACGAGTG
+CCCGGCCGACAGCCGACGGCGCCATGTCCTGCGGCTCGCCCTGTTCGCCGGGATTTTGCTGGGGCTGTTC
+TACCTGGTTGCGGTGGCACGAGTCATCCACGTCGACGGGGTCCGTAGCGCGGTCGTGGTGGCGACGGGTC
+CGATCGCACCCCTGGCGTACGTTGTGGTGTCGGCCGCACTCGGCGCGTTGTTCGTCCCGGGCCCGATCCT
+CGCCGCCGGCAGCGGGGTGCTGTTCGGGCCGCTACTAGACACCTTTGTGACCCTGCCAGCTTTCTCGGCC
+GGCGCGCAGGCCGGAATGACGCCCAGGCGCTGCTGGGTGTCGATCGCGCCCATCGCCTCGATGCACAGAT
+CGAACGGCGCGGATTGTGGGCGGTGGTCGGTCAGCGCTTCGTCCCCGGCATCTCGGATGCGCTGGCCTCG
+TACACCTTCGGGGCGTTCGGAGTTCCGTTGTGGCAGATGGTCGTTGGGTCGTTCATCGGGTCGGCGCCAC
+GGGTGTTCGTCTACACCGCGCTGGGCGCGTCGATCACCAACCTGTCGTCGCCGCTGGTTTACTCGGCGAT
+CGCGGTGTGGTGCGTGACCGCCATCATCGGGGCGTTCGCCGCGCGGCGTTGGTACCGGAAGTGGCGTGCG
+CGCCCGCGCCGGCGGTGCGGCCTGGCTCAGCTCACGACCGGTAGTCAGCAACGCCACACGAGTCACCGGA
+CACCGGCGGGCGTCGTCATGCCCGGTTCACTGTCCGAGCACCGCCGTCTCCGTCAAGAAGCGCCGGATCG
+CATCGAGCATCACCCGCCCATCGAGTAGTTCCGGGTCGTTGTGACCCACACCGGGAACCACCACGTATCG
+CTTAGGCTCGGCGGCCGCTGCGACCAGCCACTCACTAAGCGTAGCGGGGACGATGTCGTCGCTGCCGCCC
+GCGATGACCAGCACCGGCGCGTGTACAGAGGCGATGCGCTCGATCGACGGGTAGTGGTCCAGCAGCAACC
+GGCGCAGCGGCAGCCACGGGTAGTGCACCGCGCCGACCTCGGCCAGCGACGTGAACGGAGATCTCAGCAC
+GAGTGCCGCCGGCGGCCGTTGCACGGCCAGCCCGACCGCCACCGCCGCGCCGAGGGATTCGCCGAAATAG
+GCAATGCGCGCGGGGTCGACGTCGGACTGGCCGGACAGCCACTCCTGCGCGGCCCGAGCGTCGGCGGCCA
+GGCCCTGCTCAGACGGCCGACCCGGGTTACCGCCGTAGCCGCGATAGTCAAACAGCAACACCGACAGGCC
+CAGGCCATGCAGCGCGACAGCCAGCTCCGCACGCATCGACCGGTCGCCGGCGTTGCCATTGCACACCAGC
+ACCGCGGGCCCACTACCGCCCGAAGTATGCGGGAAGTACCAGCCACCCAAGCGCATTCCATCTTGTGTTT
+CGACCACGACATCGCGGCCGGCGGGCAAAACGGAGGAAGCCGATGGCACCGGACCCGCAGACGGGAAGTA
+GATTAGCCGACGCTGCTGCGACCAGATGAACGTAATCACGCCCGATGCCACCAGCGCGACGATAGCGACC
+ACCGGCAACGCGCGACACCTCTTTAGCGACATCTAGCCCCGCACCGGTGCGACGCATCGAAAGCGGGGTC
+CCCGCGACCAGTGGATTACCGAAACCACCGTTCCAAACAGAAAATCGACACGAAATTCAACGACGCGGCG
+GGCCGGCGATGGCCACGAGACACCCACAACCAGCAACCGCCCCAATCATCACGCCAACCAGCTCAGTACA
+CCGCCGTGGCGCGAACACGTGCCTGACCGGTGTGTGCTGAACGAGTACGACCCGTCCCTACAAATTGCGG
+TGGCGCCGGGTGGCGCCCCCGAACCTGGCGGCACTTGCCGGGGAGCAGGTATGCACTGACCGTCCACGTT
+CTCGTAGTAGCCGCTAGGACAGGCAAACACCGAAGTCGGCGTCGACGGAGAAATGGCCGGGACGAAGCCG
+AAACCAACTGCCGCCGCAACAACGCCGACGGCAAACCGCCTCCGAGCAGACACTGCTAGCCTTCGATCAT
+CACGCTTACGACTCCGCGTCCCAGCAAAGCGTACCGAGTACATCGCCAGCCGGGAAGGGATATGGTCCCG
+CGACTAGCGGATCAGCAGAGTGCGCAGTTCCAGTGCTCTGGCAAACCAACACGTATTGCTCGCCGATCCA
+ACATATTCGTTGAACCTTGAGAAAGGCTTGCGGCGCATCGCCCAGCCCAGCGCCACTGCCACCACGGGAG
+GAGAAATCCAACCGTCACCACGACACCACGGATAGCGAAGATCAACAAATGCCACCCACGTTCGGGCGCA
+CCAAGGAAGCCACCGTCGCGATACTTACCTATCGTTGCATCCGTTCTGGCGATATTTTTCAACTCGCATT
+CATGCGCCCCCTCCGCAAGAGCCGGGAGCGGCTAATGGTGGCACCGGGCTACCATCGTCAATAACACACG
+ACAAGGTAAGCGTCGTACCAACAAACGGCGCTGGTACCCGCACTTGATGCCAATAGCTGCCGTCTGGATA
+TCTGATTCCGTCACAATATCCCCACCCGGTAATCCCACCAAAGCCACCGCCAGGGCAATATCCCATCGCA
+CTATTCGGCATGTGCGGATCTTGTCCCGGCGGTGGCGCGGGTTCGGCGTTGGCAGAAACCATAGAAAATT
+CAACTGCCATAGTCAATGTACCGATTGCGATAGCAATACTATTTTTATACATTTTCTCAACACCTGAATT
+CATTCGTGTGGGGAATGCAGCCTTTTGGCCCCCACATGCCCGGTGTCCCATCGCTGGCGGGCCAGTAGGG
+ACTTCTTCCACGGCCGGAAGATCATTGCGCGTTGGTTGTGCGAGCGGGCGGCTGACGGCTTCGCATAATG
+GCGTGGACGGGCTGTCATCGTTGTCCCTCAGCGCTACAACAAGTCAGGGAAACTCTTCACAGGCGGTGCC
+GTCGTCGCCGTGGTCGAGGCCAAGACGGTAACCCGGCTCACCCCATAGAGCGGGGCCACCCCCGCGTCCC
+GCCTTGCAGTTCTGGTAGTACCGGAACCACGCGGGTATCGGCGTTGGGGCTGCATGAGCCACAGGTGGCG
+CCACATCGCCGACCGCGATCACAGCTGCGAGGACCGGTGGACGCTGCATGATGAGCCCTACGTGTAGTAC
+CAGACGGCTTTGGTTGTGACTGGCTGGTCAGTCGCGTAAACCGTGGACCTGGCTACTGCTGAAAGTACCA
+TGACGCGGGGCAACGAAACAGCAGCAACGTCGACAGACAGCGGAACTGTCGGCTACCGCCGATAACGTTG
+TGTCATGCGTGCGGACATGTCCGTCACCTCGATGCTCGACCGAGAGGTCTACGTATACGCCGAGGTCGAT
+AAGCTGATCGGCCTCCCCGCCGGCACCGCGAAGCGGTGGATCAACGGCTACGAGCGTGGCGTCAAAGATC
+ACCCGCCGATCCTCCGCGTCACGCCGGGAGCTACGCCGTGGGTTACGTGGGGCGAGTTCGTCGAGACTCG
+CATGCTTGCTGAATACCGCGACCGCCGGAAAGTGCCAATAGTGCGGCAGCGCGCAGCGATTGAAGAACTG
+CGTGCGCGGTTCAATCTCCGATACCCGCTGGCACATCTGCGGCCGTTCTTGTCAACGCACGAGCGGGATC
+TGACGATGGGCGGCGAGGAGATTGGTCTGCCGGATGCGGAAGTGACGATCCGTACTGGGCAAGCGTTGCT
+TGGTGATGCCCGGTGGCTCGCCAGCATCGCGACACCCGGTCGGGATGAGGTTGGCGAAGCCGTGATCGTC
+GAACTGCCCGTCGACAAGGCCTTTCCCGAAATCGTCATCAACCCAAGCCGATATAGCGGGCAGCCCACGT
+TCGTTGGGCGTCGTGTGTCGCCGGTGACGATCGCCCAAATGGTAGACGGCGGTGAGGAACGCGAGGACCT
+GGCCGCCGACTACGGTCTCAGCCTGAAGCAGATTCAAGACGCAATCGACTACACCAAGAAGTACAGGCTG
+GCCCGACTGGTGGCGGCATAAGGCCCGGCGATGCTCGAAGTCGACAAAGTCACCCATGTTGTCGATGAAA
+ACCTGCTTCGGCTTGGTGTGGCCTTGTCGCCGTCAGAAAAGACACGGCCCGGTTTGGCCGCCCGCCCGTC
+GACGACCTGCTACCGCAAGGCATCCTCGACACCGACTGGATCCCCATCGTCGGGGGTCGGGTGGGTGGTC
+ATCAGCAACGACAGGCATCTCCGGACGCGGCCAGTGGAGGCCGAGCTGGCGGTCGCCCACAAGCTCAAAG
+TCGTGCACTTGCATGGCCGTGTGGGCGGACTAGTCCGCGTGGGCACAGCTGACGCGGCTGGCTGCGCGGT
+GGCCGGCCATTGAGCACCAATATGAGAAGGCACCGGAAGGGCCTTGGTGGTTGTCGGTGCGGAGGAGCAG
+GACCGCCGTAATGGAGTTCGCGCCCGGCGCCGTCGACACCATAGCGTCGGACAACATGGCTGCCCAAAAT
+GTCCACGATACGGCTGTGAAGACCTCGAGGTGATGGCCGAAAGGTGACCACCTCGCAGTGGTAGGACGAC
+AGCGACCCGATCGAAGGCAATGCCGCCGCATCGAGCGCGACTTTGGGCATGACAGGATTTCGAGTAAGCG
+CATCAACGTGTCCGAAATGTGGGGCGGGCGGGGCTCGAACCCGCGACCAACGGATTATGAGTCCGCGGCT
+CTAACCAACTGAGCTACCGCCCCTTGTGCTAACTAGCTGCAGATATGTTCTCCACCGCGACTGAATCAGG
+GTCGGAATACCGCAGTGATGCCGCAGCACTCTTGATGGCCTGCACAAGCAAACCTGCCACGCCCGCCAGG
+TCGTCGCTGAGCAGGTGGCCATGGCGGTCCAAGGTCATGGCCGCTGTGGCGTGTCCGAGAAGCCTCTGCA
+CGACTTTGACATTAGCGCCCGCACTGATCGCCAGCGACGCCGTGGTGTGCCTCAGCCCGTGCGGGACCAG
+GTCGGCAATGCCAACCGCCTTGCATCCCTTGTCGAAGGCTCTGCGGTACTCCTCGATAGGTAGGTGCCCG
+CCGCGGTAGCTTGGGAACACGAGGGCATTGGGCTCGGTTGGCAGTTCATCACGCAGGCGCTCCGATACCG
+GCTCGGGGACAGGCACGTGACGCACCCGGTTGGTCGTCGTCTCGACAATCCCGGCGCCGGTCACACAGAT
+GAGCGAATCGTCAACTCCCGGTCCCCACGTTCTTGCGACGCAGGGCCGCTGCCTCGCCGAAGCGCAGTCC
+GCAGTAGCCGAGAACCAGGGTCAGCGTCAGTACCGCAACAATCCGTGGTACGAATCCGTTACTCACCCAC
+TCCCCCGCGCTCGGTCTTGGCAGCTTCCGCCTCTACCCACGCATCCAGGTCGGCGATATCGCAAAACGTG
+TGTCGGCCAAGGCGATAGCTGCGCGGACTGGTGCCCAGTAACGCCAGTACCTCAGCGTCGACTCAGGTAG
+GCCGCCGAGGTATTCGGCTGCGGCCTTGGTGCCCAGCCGAACCACAGATGTCGCCGTCATCGCTCTACTT
+CCTGTCGTCGCTCAACGCGCTTATGTCCCAATCCCTTTGGCAGTCCCAGGGCCGACCGCAAAATCCTTTC
+CATTGACCGCACAGTAACCATTAGCCCGATGGCATCTAACAACCGAAGAACGCCGAGAAGTCGACACCAA
+GATCCCGATGTTTGCCGTAGCAGGAACGGCGGTCACACTCGGGCTGATTCGAGCCAGTCGTACATGTCGC
+GCCGCGTCCAGCGCCGATCCCGCCCGCCGAGGCGCACATAATGGGGTCCCGGTGCGTCAATTCCGCGCTC
+TCGCTTTGCAGCCCAGCCGTGCAGGGTCGACACTGGCACACCGGTGATCTCCCGCACCTAGATGGTGGTA
+AGCATCTCCGCGTGGCTTTCGTTGTCTTCCATCATGTGCTTTGGCCACCAGTAGCGACGACATCACCATA
+AATCGACACCCTCCGTTGAATTGCGCCGTAAATCGCCACGACGAAAGCCGACGGTCTCCGCTGCGCCGGG
+GCCTACTCGCCAACGGCCTAAGAGAGAGGCAAGCTGGGGCATTATTCGAACGTTACAAAAGCCAGTTCGA
+TTCATTCGGATATATCGAGAAGGTGCGGTATCGGGGCTCAGGGTATCGAGTCGAAGACGTTTATGCCCGA
+GCGGACAGTGGACCTAGCGCCGGTGCTGAGCTTCCTGTCGGCCCATGAGCGGCGGCGCGGCCGCACGCTG
+GCCCCCAGCTACGCGCTGGTGGGCGCCACGAGCACGACCGCGTCGAGCTGCCGCGCGAGGTTCATCAGGC
+GCTAAGGCAGGTGGTGGCTGCGCTGCACGCCGGCAAGGCGGTGACCATCGCGCCGCAGAGCATGACGCTG
+ACCACCCAGCAGGCCGCCGACCTTCTCGGGGTGAGTCGTCCGACCGTGGTGCGTCTGATCAAGAGCGGCG
+AGCTGGCCGCCGAGCGCATCGGGAATCGCCACCGGCTCGTGCTCGACGACGTGTTGGCCTACCGGGAGGC
+CCGCCGGCAGCGCCAGTACGACGCGCTTGCCGAGAGCGCAATGGACATCGACGCCGACGAGGATCCCGAG
+GTGATTTGCGAGCAGTTGCGTGAGGCGCGGCGTGTTGTCGCCGCGCGCCGTAGAACTGAGCGGCGGCGCG
+CCTGAGACCATCGCTGCATGCTCGACACGTCGCTGCTGTGGTCAAGCCGGCAGCGCGACTTTCTGTTGTC
+GTTGGCGACGTCGCCGCGAACTACGACGGGCGGGTGGTGGTGGCGCCGACAGGCCAGGCCGTCGACGTCG
+CGGTACGTGAAGGCGCCGGCGATGTCGGCTACAGCGTCGAGCGAGAGAATCTTCCGGCCGACGATCCGGT
+GCGCAACGGCAACCGCTGGCGGGTCATCGCGGTCGACACCGAACACCACCGGATCGCCGCCCGCCGCCTG
+GGCGACGGCGCACGCGCCGCCTTCAGCGGCGACTACCTGCACGAGCACATCACCCACGGATATGCCATCA
+CCGTCCACGCCAGCCAGGGCACCACGGCTCACTCCACCCACGCTGTGCTGGGCGACAACACCAGCCGAGC
+AACGCTGTACGTGGCAATGACGCCGGCACGCGAGTCGAACACCGCTTACCTATGCGAGCGAACGGCGGGC
+GAAGGCGCGCGAGTGGATCTCGCCGGATGGGACCTTTGGGTGAGTGGGAAAGCTGAGGCAATGAGTGACG
+AGAAATCCGCATCGCCAGTTTGGTGCCGTGTCGGAGCTCGGTGCGATCATCGGGGAAAGCGTTCCTGCTG
+GTGAGGGCAGAATTGTTGTGCACGTCGTGCGCTATACCGTGGTGACGACTCGCCGAAGCATGGACTAAGG
+AGGTAGCTGCGATGATGAAGGAGATCGAGCTCCATCTGGTTGACGCTGCCGCCCCCAGCGGCGAGATTGC
+GATCAAGGACCTAGCCGCCCTCGCGACTGCTCTGCAGGAATTGACGACTCGAATCAGCCGCGACCCAATC
+AACACGCCCGGGCCTGGTCGCACAAAACAGTTTATGGAAGAGCTCTCGCAACTGGCCAGCGCCCCCGGGC
+CAGACATCGACGGCGGGATCGACCTAACTGACGATGAATTCCAGGCGTTTCTTCAGGCGGCGCGTTCGTG
+AATCAAGTAGCGGCGACGGTGGTCGACACCGACGTCTTCAGCCTGATCTAAGACACCGACTCGCGTGACC
+TCGGCTGCCGCGCCCAGACGCCGTGGCACTTCTGCCGTTCGGTCGCCGCCTGGCTGGCCGGAGTCATCAC
+AGCACGCTCCAATAGCGCCTCATGGAATCAGCCGGCGCCCTCGAATCGAGCCTTACCCGCCCGAAACGAC
+ACGCCTCGACGGTACCTGGCGCGCTGACCTGGCCCTACATCAGTCAACGTATACGAACCACAGCGTCGCG
+GAGCTGCCAGACCGCCGTCAACCGAACACCGTCTGACCGTCAAGCCCAATGCGATACCGTTCGGTGCCCT
+GCTGCACCCTGGGCGCATCAGCACCCAACGACACTGCAACCTTGTTGCTGGCGTTGCGCATGATGTCAAA
+GGTCAGCTCGACGGCCTCGTCGTCCGAGAACCGGGAGCGCACCTCGACGGCAACGTCGACGGCGAGGTGC
+GCAGGGGTCCAAATTAACGCATCTGCATACCTCAGGGCGGCTTTTGCGCGAACGTCGAGCAAGACCGAGG
+TATCGAAACGCTCGATCTCGCCATACAACGTCTCCGAACCGCCCGCATCAAGCGCGGAGACCTCCCGCAA
+CGACTTGCACACCCGGCAATTGTGCTGCGCAGCTCCACGCAGCCGCACCAGCTCAGAGGTGACCGGGTCC
+AGTGCCCGCATCCGGGCCACCGCCGGCAGAAATCCGTTGAACACCGCAGCGGACAGATCGGTGTTGTGAT
+CCCAGGAGATCGGCCCGGTTACCCAGCCCAGATACTCCTTGCCGACGCCCAATGCTTCCAACCCGGCGCG
+CACCCGCGGCACAAAGTCGGCGATGTACATCGCCACAACCGCACCGAAAGCGTCTTCCCCCAAATGCGTC
+CACAGCAGGGATCGCTGCTCGCCGGTGATCGCTGAGACATCGACGCTGAACTGCTCGGCGAACTCGGCAA
+CGACGGCCTCGGCCGGCGACTCCGGCTCGTTCACCGCAACCTCACACGGCAACGACGGTAGCGACAGCGC
+CCGCGCGCACACCTGCCTCACCAGCCCCGCAATCCGGCCGTCGCCCGGCGATAGCGCCACCAACCGACAC
+AGATCGTCACGAACCGAAACCGGGGCCGGCACCCTTCACACGCTACTGCGCCTGGCTCACCGAGGACATG
+TGGAAGTCGGGAATCCGCAGCGGCGGCATCGCGGTACGGGTAACCCAATCTGACCATTCGCGCGGCAGTG
+TCGGCTCGCTGACACCTGCTTCGGTGGCCCGTCGCAGCAGGTCCAGTGGGCTTTCGTTAAACCGGAAGTT
+GTTGACCGCCGCGCTGACCTCGCCGTCTTCGACCAGGTAGACGCCGTCGCGGGTCAGCCCGGTGAGCAGC
+AGCGTGGTCGGGTCGACCTCGCGGATGTACCACAGCGTGGTCAGCAACAGTCCGCGCTCGGTGCCCGCGA
+TCATGTCGGCGAGATCGGCCGACCCGCCGGTCATGATCAAGTTGTCGGCGGCGACCGCAACTGGGGCGTC
+GAATTTGGCGGCAGTGGCCCGTGGATACGCCAGCGCATTGATCACACCGCTGCGGATCCAGTCCACCTGG
+CTGATTTCCATGCCGTTGTCGAACACCGATTGCGTCTCCGAGGAGTTGCTCACCGCCACAAACGGCGTAC
+ACGCCAGACCCGGCGCAGCCGGATCGGTGAACAACGTCAGCGGCAGCTCGGTCAACCGCTCTCCCACCCG
+GGTTCCACCGCCAGGAGCCGAGAAAGCGGTTCGGCCCTCCTGCGCGCCGCGCCCGGCCATCGACCAACCC
+AGGTAGATCATCATGTCGGCCACCGTCGACGGAGGCATGATGGTCTGGTAGCGCCCGGCCGGCAGCTCGA
+CGGTGCGTTGCGCCCACCGCAGCCGCGTCGACAGCCGCTCGAGCATCAGATCGATGGGCACCTCGACGAA
+ATCGGGTGTGCCGATCCCCACCCAAGCGCTGGCGTCGCCGCGTTTGGCGTTGATCTCGATCGCCCCGGTG
+GGCTGGGTGTAGCGGCGGCGCAGACCCGTCGACGATGCCAGAAACGTCGTGGACACACTGCGGTGCGCGT
+AGCCGTACAAGCGGTCGGCCCCGCGGAAGCCCCTGCTCAGTGAGCCGGCGATACCGGTGAAAACCCCTGC
+CCCGGTGCCCGGAACCGGGGCATCCCAGTCGTCGGGCTCTCCGGTATCGGCAAGCAGCGGCGCGGCATCA
+CCGGCCTCCGGCGCGGAGCGGGCCGCGTCCTGGGAGGACACCACCAGACCGGGCAGCACCGACGGGTCCA
+CTTCGGCGGAGACCACGGAGCCGACGAAGGCGCTATCTCCCCGTCGGACGATCGAAATCACGGTGACGTT
+TCGGCTGTGGGAAACGCCGTTGGTGGTCATCGAATTGCCCGCCCAACGCAGTGTCGCCTCGACCTTTTCG
+GTGACCAGCACCATGGTCTCGTCCGCCCGGCCAGACCTGGCCGCTTCCTTTAAAACGATGTTGACGGCGT
+GCTGCGGCTCGATCATCGACCACCTTCAGTACGAGTATTGAGCACATTGACGCCCCGGAACAACGCCGAC
+GGACAGCCATGGCTGACCGCGGCAACCTGGCCGGGCTGGGCCTTGCCGCAGTTGATGGCTCCGCCCATTC
+GCCAGGTCGACGGCCCGCCCACGGCTTCCATGGCATTCCAGAAATCGGTGGTGCTCGATTGATAGGCGAC
+ATCACGCAGCTGCCCGTACAGCTGGCCACCTCGGATGCGGAAGAAACGCTGGCCGGTGAACTGAAAGTTG
+TAGCGCTGCATGTCGATCGACCATGACTTGTCGCCGACAATATAGATCCCGTCGTCGACCCGGCCGATCA
+GGTCCGCGGTGCTGAGGTCTTCGATGCCCGGCTGCAGCGATATGTTGGCCATCCGCTGGATCGGCACGTG
+ATGTGGCGAGTCGGCATACGAGCAGCCGTTGGAACGTGGCTCCCCCAACCGTGGGGCGAACGCCCGGTCG
+AGCTGGTAACCAACGAACACCCCGTCACGCACTAGATCCCAGCTCTGCGCGGCCACTCCCTCGTCGTCGT
+AACCGACGGTGGCCAAGCCGAATTCGGCGGTACGGTCGGCGGTCACGTTCATCACCGGCGAGCCGTAGCG
+CAGGGTGCCGAGTTTGTCTGGGGTGGCAAACGATGTCCCGGCATAGGCAGCCTCGTAGCCGATGGCACGG
+TCGTATTCGGTTGCGTGGCCGATGGATTCGTGAATAGTCAGCCATAGGTTAGTGGGGTCGATCACCAGGT
+CGGTGGGCCCCGGCATCACGCTAGGCGCTCGGACCTTCTCGGCCAACAGCGATGGCAGCTGCGCGAGCTC
+GTCGGTCCAGTTCCAGATCTCGTCGCCGGCCACCACTTCCCAGCCCCGGGCGGTCGGCGGAGCCAACGTC
+CGCATCGATTCGAAGTTGCCCGCCGCGGAATCAACAGCAACCGCATCCAGGCACGGCAGCAGCCGCACCC
+GCTGTTGGGTAATCGATGACCCGAAGGTGTCGGCGTAGAAGGTCTGCTCCTTGACGGCGTTCAAGCTGGC
+CGATACGTGGTCGATGCCGTCGGCGTCCAGTAACCGCCCGGAGTAGTCGCGCAGCACGGCGATCTTCTCG
+GAGGCGGGAACGCCGAACGGATCGATCCGGTAGTTCGAGACCCACTCCGCGTCGGTGTATACGGGCTCGG
+GCGCCAATCTGACCCGCTCGGTGTTCAGCGCCGCCAGCACGGTAGCCACGTGTACCGCATGGCGAGCGGT
+CGCGGCCGCGACGTCGGGTGCCAACTCAGCATGGGAGGCGAATCCCCACGTGCCCGCGACGATTACCCGG
+ACGGCCAGGCCGAGCTCACGGCTGATCACCGCGGTCTCCAGCTCACCGTCACGCAGTTGGATGATCTCGG
+TGCTAATGCGGTGAACCCGCAGGTCGGCGTGGCTGGCCCCGGCCGTGGCGGCCGCCGACAATGCGGCGTC
+GGCCAACTGCTGGCGCGGCAGGTCCAGGAAGTCTTCATCGATCCCCCGGTTCGGTGTCACGACTCCACCG
+TAACGACCAGCTTTAATACACCCATGCGCGACGCGCCACGTCGGAGGACGGCACTGGCATATGCCCTGCT
+GGCGCCCAGCCTGGTGGGCGTGGTCGCCTTCTTGTTGCTGCCCATCCTGGTGGTGGTATGGCTGAGCCTG
+CACCGGTGGGACTTGCTGGGCCCACTGCGCTACGTCGGCCTGACCAACTGGCGGTCGGTGCTGACCGATT
+CCGGCTTCGCAGACTCATTGGTGGTCACCGCCGTCTTCGTGGCGATCGTGGTCCCGGCGCAGACAGTACT
+GGGACTGCTGGCCGCGTCCCTGCTGGCCCGGCGACTGCCGGGCACCGGCCTGTTCCGCACGCTGTACGTG
+CTGCCCTGGATCTGTGCACCGCTGGCGATCGCGGTGATGTGGCGCTGGATTCTGGCGCCCACCGACGGCG
+CGATCAGCACTGTGCTCGGACACCGCATCGAATGGCTCACCGATCCAGGCCTCGCGCTTCCTGTGGTTTC
+GGCCGTCGTGGTGTGGACCAACGTCGGATATGTCTCGTTGTTCTTCCTAGCCGGATTAATGGCGATTCCG
+CAGGACATTCACAACGCCGCACGCACCGACGGCGCCAGTGCCTGGCAGCGCTTCTGGCGCATCACCCTGC
+CCATGTTGCGGCCCACCATGTTCTTCGTCCTGGTTACCGGAATCATCAGCGCCGCACAGGTTTTCGACAC
+CGTCTACGCGCTGACTGGCGGTGGGCCGCAGGGCAGCACCGACCTGGTGGCCCACCGCATCTACGCCGAG
+GCGTTTGGGGCCGCGGCAATCGGGCGGGCATCGGTGATGGCGGTGGTGCTGTTCGTCATCCTGGTCGGTG
+CCACCGTGGTGCAGCATCTGTATTTCCGGCGGCGGATCAGCTATGAGCTCACCTAGTCGCGTCTCCAACA
+CTGCGGTCTACGCGGTGCTGACGATCGGCGCGGTAATCACGCTGTCCCCCTTCTTGCTTGGCCTGTTGAC
+CTCGTTCACTTCCGCACACCAGTTCGCGACGGGTACTCCGCTGCAGTTGCCGCGACCGCCCACGCTGGCC
+AACTACGCCGATATCGCCGATGCCGGATTTCGCCGCGCGGCGGTGGTGACCGCGTTGATGACGGCGGTGA
+TCCTGCTGGGCCAGCTGACATTTTCGGTGCTGGCCGCCTACGCGTTCGCGCGGTTGCAATTTCGGGGACG
+TGATGCGTTGTTCTGGGTCTACGTCGCAACCTTGATGGTGCCGGGGACGGTGACCGTGGTGCCGCTGTAT
+CTGATGATGGCCCAGCTAGGCCTGCGCAACACGTTCTGGGCGTTGGTGCTCCCGTTTATGTTCGGTTCGC
+CGTACGCGATTTTCCTGCTACGCGAGCACTTTCGCCTCATCCCAGATGACTTGATCAATGCCGCGCGCCT
+CGACGGTGCCAACACTTTGGACGTGATCGTGCATGTGGTGATCCCAAGCAGCCGGCCGGTCCTGGCCGCC
+TTGGCGATGATCACCGTGGTCTCGCAGTGGAACAACTTCATGTGGCCGTTGGTGATCACCAGCGGCCACA
+AATGGCGTGTCCTAACGGTGGCGACGGCTGACCTGCAGTCGCGGTTCAACGACCAGTGGACGCTGGTGAT
+GGCGGCGACCACGGTGGCAATCGTGCCGCTGATTGCGCTCTTCGTGACCTTCCAGCGGCACATCGTCGCA
+TCGATTGTGGTCTCGGGGCTCAAGTGACCCGGCCCCGCCAGTCCACGCTGGTCGCCACCGCCCTTGTGCT
+GGTGGCGATCCTGCTGGGTGTGACGGCGGTGCTATTGGGGCTCTCCGCCGAACCGCGTGGCGGAAAGATC
+GTCGTAACGGTGCGACTCTGGGACGAGCCGATTGCTGCGGCGTATCGACAGTCGTTTGCGGCATTCACCC
+GCAGCCATCCCGATATCGAGGTGCGCACCAATCTGGTGGCCTATTCGACCTACTTCGAAACCCTGCGCAC
+CGACGTGGCTGGCGGCAGCGCGGACGACATCTTCTGGCTATCCAACGCCTACTTCGCCGCCTACGCTGAC
+AGTGGCCGGCTAATGAAGATTCAGACCGATGCCGCCGACTGGGAGCCGGCGGTGGTTGACCAGTTCACTC
+GGTCCGGCGTCTTGTGGGGTGTGCCGCAACTGACGGACGCCGGAATTGCCGTGTTCTACAACGCCGATCT
+GCTGGCTGCCGCCGGTGTCGACCCCACGCAGGTGGACAACTTGCGATGGAGTCGCGGCGATGACGACACC
+TTGCGCCCGATGCTGGCTAGGCTCACCGTCGACGCCGATGGACGCACCGCCAACACGCCAGGATTCGATG
+CTCGGCGGGTCCGCCAGTGGGGATACAACGCCGCCAACGATCCTCAGGCCATCTACCTTAACTACATCGG
+CTCGGCCGGCGGTGTGTTCCAGCGCGACGGCAAGTTCGCGTTCGATAACCCCGGCGCCATCGAAGCCTTC
+CGCTATCTGGTCGGCCTGATCAACGACGACCACGTCGCACCGCCGGCCTCGGACACCAACGACAACGGCG
+ATTTCTCCCGTAACCAGTTTCTGGCTGGCAAGATGGCGCTATTCCAGTCCGGCACCTACAGTTTGGCGCC
+GGTAGCCCGTGACGCCCTCTTCCACTGGGGTGTGGCGATGCTTCCCGCCGGCCCCGCAGGCCGGGTAAGC
+GTCACCAATGGTATTGCTGCAGCTGGTAATTCGGCGTCCAAACATCCGGATGCGGTGCGTCAGGTGCTGG
+CCTGGATGGGCAGCACGGAGGGCAACTCCTACGTGGGCCGCCACGGTGCGGCCATCCCCGCGGTGTTGTC
+TGCGCAACCGGTCTACTTCGACTACTGGTCTGCTAGGGGCGTCGATGTCACGCCGTTCTTCGCGGTGTTG
+AACGGTCCGCGCATTGCGGCCCCCGGCGGCGCCGGCTTCGCCGCCGGACAGCAGGCCCTCGAACCCTACT
+TCGACGAAATGTTCCTCGGCCGTGGCGATGTCACGACAACCCTGAGGCAGGCACAGGCGGCGGCCAATGC
+TGCCACACAGCGCTAGTTGCGATCTAGCCCGGTAGTACTAGCACGGGGACCGGGCTGTAGCGAATGATCT
+TGCCACTCCAGGAGCCGAGGAATACTCTCGCGACATCACCGAACGGCGAGGTGCCCAAGGCCAGGATCTC
+CCCGTCCTGCCAGTCCGCAGCGTCCAGCGCCTGCGCCCAGCCGTTCCCGGTGACCACTTGCAGCACAACG
+TCTTCACTCACGACGCCGTTAATTCTTAGTTTTTCCAACAGTTCTCGCGCTTGCGCCGCCCATGCCTCCA
+GAACCGAAGCCTCGGCATGCAGCCCCACTTCGGGCGGATACATGGTCCGGCCGCGGACCGCGAATGTGAT
+CACCCGCATCGGCACGCCATACCGGCTGGCCAGGTGGCCGCATCGCCTCACCACGTCGACCGAACCCGAC
+GTCGCGGAGTAGCCGCAGCTGAGCCGTGTCAACCGGTCGGTGTAGCAACGGTAGCGGCGGGGGGTGATCG
+CCACCGGTACCGGCGACGAATGCAGCAGCCGGTCGGCGGTCGAGCCGATCAACACCCGCGCGCGCCGCCC
+GCTGGGAAACGACCCCAGCACCAGCACCTCGGCTTCGAGTTCCTCGACGACGTCGAGCAGACCAGCCGAC
+ACCGATCGGTGTGCGCGGTGGTGGTAGCTGACCTCGATCCCGTCGGCCAGTCTGCGCAGGTAGCGCTGGG
+CCTCTCGCGCGGAGGCGGCAGCCAGCTGCTCAGACCAGAGCTCGTACTCGGCGTCGACGCGGGCGAGCGA
+CGGTGTCGGCCAGTGCCTGCGCACGATGGTGGCCACTGTGAGCGACGTCTTGTGCATCCGCGCGACGCGG
+ACGGCTAGATGTAATGCGGACGGACCGACCTTGCCAGCCAAATACCCGACGACGATGGTCACGGCACTTC
+CTCGTTGAGCGCACTGTGGTGCCGACCCCACATCAGGTAAAAGATCACTGCCACCGCCACCCATCCGCTG
+AACGCCAGCCAGGTGTACCAGTGCAAGCTGGCCAGGATATACCCGCAGGCCAGCACCGAAAGAACAGGCG
+TCACAGGGTAACCGGGTACCTTGAACCCTCGGGGTAAGTCGGGCTCGCGCACCCGTAGAACGATCACACC
+CACAGCCACCACGCTGAACGCGGTGAGCGTGCCGATGGACACCATGTCCGCCAAGCTATCCAGCGGTATG
+AAGGCGGCCAGCGTCGATGCGAAGATCGCGACGATCACCGTGTTGTGCACCGGCGTCATGGTGCGCGGAT
+TCACCTTCGCGAACCGCGCCGGCAGCAGCCCGTCGCGCCCCATCGCGAACAGGATCCGGGTCTGGCCGTA
+CATGGTGACCAGCGTGACGGTGAAAATCGAGACCACCGCACCGGCGGCCAGAATCGTGCTGGCCCATTCG
+CCATGCGTGACGTTGTCCAAGATGATGGCCAGCCCGGCGGTTTCCTGCTCTGCGAAGTCCTGCCACGGTT
+GGGTGCCCAGCGCGGCCAGTGCGACCAGCACGTAGACACCGGTGACGACCACCAGCGCTGCGATCAGCGC
+ACGCGGCATGGTCTTCTGCGGGTCCTTCACCTCGTCGCCGGCGGTCGACACCGCGTCAAGGCCGATGTAT
+GAGAAGAAGATCGTGCCCGCCGCGGAGCCGATGCCGGCGACGCCGAATGGGACGAAATCCTTGAGGTGGT
+CGGCGCTGTACGCGCTGAACGCGATGATCATGAACATGCCCAGCACGCCGAGCTTGATCAGCACCATGAT
+CGCGTTGACCCTCGCCGACTCGCTGGCCCCTCGAATCAACAGCAGCGCGCATAGCCCGATCAGGATGACG
+GCGGGCAGGTTCACCCAACCGGGATGGGTGTCCCACGGCGCCGCCGACAATACGTGCGGCATCTGAAATC
+CGAACAGATTACTCAGCAGCTTGTTCACGTAGCCACTCCAGCCGACCGCGACCGCTGCGGTGGCTACCCC
+GTATTCCAGCAGTAGGCAGGCCGCCACCACCATCGCGACCGCCTCGCCCAGCGTCGTGTACGCGTAGGAG
+TACGCCGACCCGGAAATCGGCACGGCGGAAGCCAGTTCCGCGTAGCAGATAGCCGCGAGCCCAGCGGCGA
+TGCCGGCGATGATGAACGAAACAATCACGCCCGGGCCGGCCTCTGGAACTGCCTGGGCAAGCACGAAAAA
+GATGCCGGTACCTATCGTCGCGCCAACCCCGAACATGGTCAGCTGGAAGGTGCCGAAACTCCGCTTGAGG
+TTCCCCGATGCCCCGGATGCGACCGGGGCGCCGCTCACCGGGCGGCGCCGCAGCATCAGTTCTCGAAGGC
+TCATCGACGTTGTCGGCAATTATGAACCCGCCTCCCATAGCGCGTCGGCGAACCGGCGAACCGCGCAGTC
+GATCTCCTGCGCGGTGATCACTAACGGCGGCGCGAACCGCAGGGCGGCGCCGTAGGTGTCTTTTAACAGC
+ACACCGCGATCGGCCAACCGCATGCTCATGTCTGTGCCAATGGCAAGCGCCCGTTCGATGTCGACGTCAG
+CCCACCATCCGAGGCCGCGCAGGGCCACCGCACCATCGCCGATCAGGTCCGCCAGGCGCTGATGCAGATG
+CGCACCCAATTTAGCGGAGCGAGCTTGACATTCTCCCCAGACGACCATGGAAACCACGGGGGTACCGATC
+GCGGCGGCCAACGGATTGCCGCCGAACGTCGACCCGTGTTCGCCGGGATGCACCACGCCGAAGATTTCGC
+GGTCCGCGACCATCGCCGACAACGGAACCGCACCGCCACCAAGTGTCTTGCCGAGCAGGTAAATGTCTGG
+CAGCACACCCCCGTGGTCGCAGGCGAACGGGTAACCCGTACAGGCCAGCCCCGATTGGATTTCGTCGGCG
+ATCATCAGCACGTTGTGCTCGACGCAGCCGGCAGGTAGTCGTCGGCCGGGACGATGATGCCCGCCTGGCC
+GGGAATCGGCTCGAGCAGGTCAGCGACGGTGTTGTCGTCGATTGTCTGCGCCGGTGCCGCAGCATCGCCA
+AACGGTACCGAGCGGAGTCCCGGGGTAGAAGGTTCGACGCCGCTGCCCGCAGCCGGGTCCGACGAGAAGC
+TGACGACACTGCTGGTGTGGCCATGAAAGTTGTTGTTTGCCAAAATGATATCGTGCCGGCCCGCGGGGAG
+GCCGTTGACGTCGGCTCCCCACTTGCGGGCGACCCTAAGACCGCTCTCCACCGCTTCAGCATCAGAGTTC
+ATTGGCAACACCACGTCTTTGCCGCACAGCTGGGCAAGCGCGGCGCCCAACGGCCCGAGTCGGTCGGCAT
+GCAAGGCCCGATTCAGCAGGGTGACGGTGTCGACTTGGGCATGAGCCGTGGCGGTGCTCGCGGGGTTGCG
+ATGGCCAAGGTTGACCGCCGAGTACGCAGCCAGCCAGTCCAGGTAGCGCAGGCCGTCGATATCGGCGATC
+CACGCACCCTCAGCGCTGGCCGCCACCACAGGCAGCGGCGAATAATTGTGCGCTGCATGCCTTTCGACCA
+GTGCCATAGTGGCCTGAGTGGCATCCGCGAGATTTGTCATGGGTGTATCTCCAGCGTGCAGCACTTGACG
+GAACCGCCGCCCTTGAGCAGCTCGGACAGATCGACACCGACCGGCTCGAAGCCGGCTGCGCGTAACTGCG
+CCGCAAAACCCATGGCCGCGACCGGAAGCACTACGTTCAGACCGTCAGAGACGGCGTTGAGTCCGAACAC
+GAACGCGTCGGCACTGCCGACCACAATCGCGTCGGGGAACAGCGCCGACAACTGTTCCTGCGCTGCCGTA
+CTGAACGCCGGCGGGTAGTAGGCGATCGTGTGGTCGTCGAGCACGGCCAGCGCGGTGTCCAGGTGATAGA
+ACCGTGGGTCGACCAACTCGAGGGAGACCACCGGCAGACCAAGCACCGCGGCGATTTCGGCGTGTGCGCG
+CTGGTCTGTGCGAAAGCCGTAGCCCGCCAACACCCTTTCGCCAACCATCAGCAGGTCGCCCTGTCCCTCG
+TTGACGTGGCGGGTGGTCACCGGGCGATATCCGACCGAGGACATCCAGCTGGCATAGGCTCTAGACTCAC
+CAGCTCGTTCGGGGAACCGGAACCGGGCGACCACGGCGATGTCGTGCGTGATGAACCCACCGTTGGCGGT
+GTACACCATGTCCGGTAACCCGGAAATGGGCTCGATCAGATCCACGCTGTGGCCTAGCCGAAGATAGGTC
+TGGTGGAGGTGCTCCCACTGTGCTTGCGCGACTTGGACGTCGACTGGCGCGGTGACGTCCATCCAGGGGT
+TGATCGCGTATGCGACGGCAAAGAAGGCCGGCGGGGTCATTGCATACCGCCGCGTCCGGGGGGTGCGGCG
+TGCAGGTGACCCTAGACGGGCAGCAGCGACGTAGGAATCCGTCATAAACCAACGATATTTGGCTCTGATT
+TCACAATCAAACGATGGTCGTTGCGTATTTTCCATTGATACATTGCGTTAACCTCGAATCTGTGGTGATT
+CGTTGCGTGCTTAGAACGGAGGAGGGCCGATGGACCGCCTGGATGACACCGACGAACGCATCCTCGCCGA
+GCTGGCCGAGCATGCACGGGCCACCTTCGCCGAGATCGGTCACAAGGTGAGTTTGTCCGCTCCGGCGGTG
+AAGCGCCGCGTCGACCGGATGCTCGAGAGCGGCGTCATCAAGGGCTTCACCACGGTGGTCGACCGCAACG
+CGCTCGGCTGGAACACCGAGGCTTACGTGCAGATCTTCTGCCACGGCAGGATTGCGCCTGATCAGCTGCG
+TGCCGCCTGGGTGAATATCCCCGAGGTGGTCAGCGCGGCAACGGTGACTGGCACGTCCGACGCGATCCTG
+CACGTGCTCGCTCATGACATGCGGCATCTGGAGGCCGCCCTCGAGCGCATCCGGTCCAGCGCTGACGTCG
+AACGCAGCGAAAGCACCGTCGTGCTGTCAAACCTCATCGACCGCATGCCGCCCTAGTGTTCCGCGCCAAT
+GCTAGAAAAGGCCTGCTGAGCTACGTAGACGCAGCATGAGCAGGTCCTCGCGCCGCCAACCCGCGAAACG
+GCGCGTCTGTACACCGACACGCCGTTAGGGCGCGCGCCCACGCCCAGCTATCGCCCAAGCTCACCATCGC
+GTTGGGCGGCGGCGGTGGCGGCCAACATCGGGGCTATAGCGGCTGGCCGGTCCGCGCGCCGCCCGCGCCG
+CCACCTAGGAGTGCAATATCAGGCTCTCTATCGCCACCGCTGTCCCGCTGGCCATGGCAGTGATCGCAAG
+CGTCACCCAGTCGGCAAGTTTGGGTCGCCCAGGATGCGCTGACAGCTGGCCGGTGCCGCCACGGGCGGTG
+ATCGCGTCGCCCATCTCGTCGGCACGGCGCAGGGTCACCGTGATGGCAGCGGCAAGCAGGTCGATCAGCT
+CGCGCGCATGCCGCTGGCGCCGAGCCTTGCGGCTTGGCGGCATCCGCTTGGGCCGCAGCCGGCGCGCGGC
+GTAGAGCACCTGGAATTCGTCGATCAACATCGGGAAGGCGCGCAGCGCGAGCGCCAACGCCACCGCCCAT
+TCGTCGACCGGGATCCGCAACACCCGAAACGGCCGACCCAAAGTGGCTACCGCAGGGCTGATTTCGGCAA
+CATTGGTGGTCCAGGACACCATCGCCCCCAGCGCCAGGAGCACAACCGACAGCGCGGTGATCCGCAGGAA
+GTGCAGTGCGCCGCCCAATCCGAGCTGCACTCCGCCCACGGCGACCACTGGAGTGCCACCGGCTAGCGCA
+GCGGTCAGAAAGCCGATCGCGAGGACGATCCACAGCCAGCGAGGTACCGACGGCAGCGCGCCGCGCGGAA
+TGTGCGCGATTCGGGCCGCGGCCAGCACCAAAGCCGCCATCATCCCGATCGTCACCCATCCCGGGTAGAA
+CGTCAGCAACACCGAAATGCCGAAAACCACCAATAATTTGGTGCCGGCCCACAGGTCGTGGATGACCGAG
+CTACCCGGCACCGGAATCAACAGCACAATCGGACGTGACGGGCGACGAGTCCCGTTGCGTGCCGGGGCCG
+AAGTTGTGGTCATGACATTCCCCCCGCCTCCGACGCCGCCGCCGATTCCAGCACACCGTCGCGCAGATGC
+AGGGTACGCGGGCAAAGCTCCTCCATCCCCGCGAAGTCGTGCGAAACTACGACCACCGTCAGGCCGCGCG
+CCCGACGCAAGTCTTCCAGCAGCCGCAGCAGGCCGCGCTGGCTGGCCGCGTCCAACCCCGCCAACGGCTC
+ATCGAGGATCAACGCCCGGGGTGCACGCGCAAGCAGCCCGGCCAGCACCACCCGACGCATCTGGCCCCCG
+CTGAGCTGGTCGATTCGTCGCGCGCCCAGCGCGGGGTCCAACCCAACGACAGTCAGCGCCGCAGCCACCC
+GGTCCTGCTCGCTAGCCGAAAAACCTGCTGCGGAAGCAACTTCCAGGTCTACACGGCTGCGCATCAGCTG
+CAGCCGGGCCGCCTGAAAAGACAACGCCACCGCGCCGACCTGCTCGTGGGTGGGCCGACCGTCAAGTAGG
+CAGGCTCCGGTCGTGGGGATCGTCAGCCCGGCCATGATCCACGCCAGCGTCGACTTCCCCGAGCCGTTGC
+CGCCGTGGATCAGCACCCCGTCTCCCTGCTCAACAACGAAGTTGATATCGCGCAACGCGGTCTTTGCCCA
+CGGGGTGCCGCTAGCGTATTCGTGGCCGACGCCCACCAGTTCGAGCGCCGGCGCGTGCTGGGGCTGATCC
+ACCCCGATGACCGGGGCCGGCATCGCGGCGGTGTGGACCATATCGGTGTTATCCGGCGAATCGCTCAGGC
+TGAGCGTGCGGTCGGCGGAATCGGCTTCGTTGTCGTAGTGCGTGATGTGCACCAAGGCGGTCCGGTGCCG
+CTGCGTCAGACCCGACAGCACGGCCAGCAAAGCGTCCCTGCCCTGCTGGTCAACCATGGTGGTGACCTCG
+TCGGCGATGAGCATCGCCGGCTCCCGGGCCAGCGCTGCCGCCAGCGCCAGGCGCTGCAGCTCACCACCGG
+ACAGGCTTCCGGTGTCGCGTTCGGCAAGCGCTTCCAAGCCGACCTCGCTCAGCAACCGGCCAACGTCAGC
+GGTGGTACCCAGCGGCAGCCCCCACACCACGTCGTCGGCAACCCGGGTGCCCAGGACCTGGCTTTCCGGA
+TGCTGCAAGACGACAGCGGTGCCGCCCAGCTTTCCCAAACCCACCGTGCCCGGACGATCCACGGTGCCCG
+ACGTCGGTGCCCGGCCGGCCAGTATCAGCATCAAGGTGGTCTTCCCTGATCCGTTGGCCCCGATGATCGC
+TAGGTGCTCGCCGGCCCGGACGTCGAGGCTGACCTCCCGCAGCGCATCTTGGCCGGCGCGGGGGTAACGG
+AAGCGGACCTTGTCCAACCGCACCGGCACCGGCCCGATCAGAGCGTCCACGTCATCTCCTGGCGGTGGGT
+CAAGTTTGTGTACATCGGGGATTCCGCGCATCCGCTCCAGCAGGCGCGACAACGCCCACCACCCAATCAG
+CGACACGATCATGATCCCAATGTTGAAATAGCCCAGCAGCACCCACGGCCAGTACTGCAGTCCCTCGGCG
+AAATACCGCTTGACGTCGGCGGCTGCCCCCTGCATGTGCATCCGGGCCAAGGTGGCGGCGATACCGTCCA
+CGTTTGCGGTCATGACCTTGAAAATCAGATGCCGCAGTCGGACCATGGCGGCCAACATCCCGACCATCGC
+CGCGCCGAACACGAATCCGCCGATCAGCGACGAGACGACCACCGTCGGGGTGCCCCGGCCCCTGCGTTTG
+ACGATTCCGGTCAGCCCACCGATGTAGGCACTGTGGACCACCCCCATGAAACCGCCCAGCCCCGCGATCA
+GGAAGGCGATCATCCCGGCCGCAACCGTCGCGGCCGCCAGCACGCGGAGACGGTAGCGGTAGGCCAGCAG
+GCCGGTGGGCACGGTGCCCAACAGCGCCAGACCGGCCGCGAACGGAACGACGACGGAGATGATCGCGGTC
+ACCGCGCACAGCGCCGCCATCACCGACGCCTGCGCCAATTCACTCGGCCGCAGCGGCCCGCCCCGATGTT
+GCGCGGGGCAAGGGCCGAGCGGGGTCACTTCACCGATTCTGCCAGGCTCAGGCCCGCACACGGCGCAGCA
+CATCGATTAGCCTCGCATAGCAAAGCTATGCAACGATGGGGGGATGAGTCCCTCCCCCGCCGCCGCCAAC
+CGCAGCGAGGTCGGCGGGCCACTACCGGGCCTGGGAGCGGATCTGTTGGCAGTGGTCGCGCGGCTCAACC
+GCCTAGCCACGCAGCGCATCCAGATGCCACTGCCCGCGGCTCAAGCCAGACTGCTGGCCACCATCGAAGC
+CCAGGGGGAAGCCCGGATCGGCGACTTGGCCGCCGTCGATCACTGCTCGCAACCAACGATGACCACGCAG
+GTACGACGACTCGAGGACGCTGGACTGGTTACCCGAACCGCCGACCCGGGAGACGCCCGGGCGGTCCGCA
+TCCGCATCACGCCGGAAGGCATCCGCACGTTGACCGCGGTGCGGGCAGACCGCGCGGCTGCGATCGAGCC
+TCAGCTGGCCCTGCTCCCACCGGCGGACCGCCGGGTGTTGGCGGATGCGGTAGACGTGTTGCGCCGGCTG
+CTCGACCATGCCGCCACCACGCCGGGCCGGGCGACGCGGCAATAGGCATCGAGATGTCGAACGCCGCGCC
+GTTGGCGGTGTGGGTCGGATCGATGCGCCCGAAAACGCAAAGGGAATCGCTTGGCGGCTCCTGCTGCTGG
+AGTTGTCCGGACCATCCCGACTACTCCGAAAGGCCAATGCGAGCCGGCTGATTGACGGCGAACGCCAACT
+TGGCCCGAAAAGACCGGCATTTCACTACTATCAATGTGCCTCGATCGTCGTTGGATAACAACCGTAGTGA
+GTCGAGAGGAACCAGTATGCAGTTCCTGAGCGTGATTCCAGAGCAGGTCGAGTCCGCGGCTCAAGATTTG
+GCGGGCATTCGCTCAGCGCTGAGCGCGTCTTACGCGGCCGCAGCGGGACCCACAACAGCGGTGGTTTCCG
+CTGCCGAGGACGAGGTGTCGACCGCGATTGCGTCGATATTCGGCGCCTACGGTCGACAGTGCCAGGTTCT
+CAGCGCCCAGGCCTCCGCGTTTCATGACGAGTTCGTCAACCTGTTGAAAACTGGCGCGACTGCATACCGC
+AACACCGAATTCGCCAACGCCCAAAGCAACGTGCTGAATGCAGTGAACGCACCGGCCCGATCGCTGTTGG
+GGCACCCGAGCGCGGCTGAGAGCGTGCAGAACTCGGCCCCAACGCTAGGCGGTGGCCACAGCACCGTGAC
+CGCTGGGCTTGCCGCACAGGCCGGTCGTGCCGTCGCGACGGTCGAACAACAGGCTGCGGCTGCGGTTGCC
+CCGTTGCCAAGCGCCGGCGCCGGACTGGCTCAGGTTGTCAACGGCGTCGTGACCGCCGGACAGGGTTCCG
+CCGCCAAACTTGCCACCGCGCTGCAGAGCGCCGCGCCCTGGCTGGCCAAGAGCGGCGGCGAGTTCATCGT
+GGCTGGGCAGAGCGCGCTGACCGGTGTTGCTTTGCTGCAACCTGCCGTGGTCGGCGTTGTTCAGGCGGGC
+GGTACGTTCTTGACCGCCGGAACGAGCGCTGCTACCGGACTGGGTCTGCTCACACTTGCTGGTGTTGAGT
+TCAGTCAAGGCGTTGGCAACCTTGCGCTGGCTTCAGGGACCGCCGCGACCGGACTTGGTCTGCTGGGCAG
+TGCCGGTGTGCAACTGTTCAGTCCTGCCTTTTTACTGGCTGTGCCCACCGCGTTGGGTGGAGTTGGCTCG
+CTCGCGATCGCAGTAGTTCAGCTTGTGCAAGGCGTCCAACACCTGTCGTTGGTTGTGCCGAACGTTGTTG
+CCGGGATCGCTGCACTGCAGACCGCCGGTGCCCAGTTTGCCCAGGGTGTTAACCACACGATGCTGGCCGC
+TCAGCTCGGTGCCCCTGGGATAGCTGTCTTACAGACCGCCGGTGGCCATTTTGCTCAAGGCATTGGCCAC
+CTGACGACGGCTGGCAATGCCGCTGTCACGGTGCTGATCTCCTAGCCGGGCGGTCGAGCTTCATCCCGGA
+GCCGCTACGTTACGCCGAGATGCTGCACCCGGAGAATCGGTCCGATTGAGTTCTGGGACCGATAAGTTCG
+GCTGGCGTCGATGCCGGCTGCCGCACCAAGGCCGCCTGCAACATCCCCATGTCGGTGACCGTTCGGCGGT
+CGTACACTTTCCAAGTCAGAACGGCGGCAGCGGCGTAGCACATCATGAAGATCCAGAACGCATCGGTCCC
+ACTGCCGGTGCTGAGGTAGGACTCACGCAGCGCCATATTGATTCCGACCCCGCCGAGCGCGCCGAAGGCC
+GCCACAAACCCGATGACTACTCCTGAGATGATGCGTGACCAGTCGCGGCGTTCGGCTTCACTGAGATCCA
+GGGAGCGGCTGCACGCCTCAAAAATCGTCGGAATCATCTTGTACACAGACCCGTTGCCCAACCCGGATAG
+GACGAACAACGCGACGAAGCAGACGAAGTAGCCGACCATGGTAGCGCCCCGATGCTGGCCGACATGTCGG
+CCTTCGAGGGTGCTGGCACTGATCAGCAGCCCAGCGGCGAGCGTCATCGCCACAAAGACTATAAGGGTCA
+AGCGGCTTCCACCGACTCGATCGGCCAGCCGGCCACCGTAAATCCGGGCCACCGCCGCCAGCAACGGCCC
+GACAAACGCCAACTCGACGGCATGCAGCGTCGCGCGCGCCGGGCTTTGTCCGCACGCCAGGAAGTTGGTC
+TGCAACACCTGGCCAAACACGAAGGAGAAGCCGATGAATGAGCCGAAAGTGCCGAGGTAGAGCAGCGAGA
+GCAACCACGTGTCGCGGGTCGACAGAACCGCGGAAACGATCGGCCGAAGCCGGTTCACCTGCACCCGGTG
+CTGTTCGACATTGTTCATGAACAGCGACACTCCGATTACCGCGATTGCCACCAGAACCACATACAGTGCG
+CAGACCAGGTAAGGCTTCCGCTCACCGACAGTGGCGATTGCCAACAACCCAACTAGCTGGATCGCCGGCA
+CCCCGAGATTGCCTACCCCACCGGCAATTCCGAGCGCCGAACCCTTGAGCCGATGTGGATAGAAAGCATT
+GGCGTTGCTCATTGACGACGCGAAGTTGCCGCCGCCTAAGCCGGTCAGGGCCGCACACACCAGATACGGC
+CACAGCGGTAGCCCCGGATGGGTCAACAACACCGTTGTGCCAATGGCCGGAATTAGCAACACGATTGCCG
+AAAAAGTCGCCCAGTTGCGACCGCCAAAGATCGCGCTGGCCAACGCGTAGGGCATCCGCAGGAACGCGCC
+AAACAGCGTCGCGATGGTGCCGAGCAGAAACTTGTCACTGGTTGAAAAGCCGTAGACGTCCTGGGGCATC
+AGCAACTCCAGCACCGGCCAGAGCGTCCACACCGAGTAACCCAGGTGAACCGTCACGACCGACCAAAGCA
+GATTGCGTCGGGCAATGCCCTTGTTGCCTGCCTCCCACGCTCCTAGATCCTCGGGATCCCAATGCGTGAT
+GTGACGTGAGCCACCCAGGCGCCTGAGCGAAGGGGCCGCGGGACTGCGCGGCGACTCCTCGCGTTGCAGC
+AGCGTGTGCTGTTCCATCACCCTCCTTGTTCCCACCCTGGTGCGAATGCGGGCCGGCCTACCAGGGTGCC
+AGCCTTGCGTGTACGAAGTTGTTTCCTGGCAGCCTGAAACTCCTGTAGAACTCCTGTAAAAGTGCTGAAG
+GCAATACACAATTGGGCTCGCCCTTGAGCCGAGAAGACCTAAACCCTACATGTAAAGCTGCGCTGTTGTC
+CTCGCAGCAAGAAAACAGCGAAAGCTATTGTGCTCGAGTACTACTGATGGGGGATCGAGCCGAGCGCCTC
+GAGCTTGCCATCTGATCCGATGTGGAATCGCACCGTGCCGATGCCGGTGGGACAGCACTCCTGGTCGCTG
+CCGATCTGCCATTGGTACTGAACCGTCACGGTGTCATCGCCTGCAGGCAATACGGTGATGTAGGGCTTCG
+GATTCCGAGTCGGCGAGCCCAGCGGGATGTTGCGGTCGAAGAACAACAGCTGTTGGGGAGTCGACTGGGA
+GGCAATTGTCGGGATGATTTGCACCCAATGCAAGCGGCAGTTGCGGGTATGTCCTCGGGTGATTTCGACC
+CATTTGGAGCCCGGTACCACGATCGGGACCGCAGCGATGGCCTGCCGTACCGTGTCAGCGGTCGGCCCGT
+CGGAATCCTTGCAGGTGTTCGGTGGTGACGGTCGTGTTGTCGGCGGCTTCCAGGCGCAACCGGAGGCGCC
+CAGCCCCACAATCAGTGCCAACAGTGCCAACAGTGCCAACAGTGCCAGAATCGGGACGGCGCTACGCTGA
+CGACGCACGTCACGAGCTTAGCGAAAACTGGGAATTTCCCCTACGTTTCATCAACGCCTCAGGTGTCGAT
+CCTAAAGCGCGGGTGCCGCCGGTATTCTTGCCCCAAATCGGTCGGTTGACACCCGATGCGGTCGGCGAAG
+CCATCGGCATCGCGGCCGACGACATCCCGATGGCGGCACGCTGGATCGGCAGCCGACCATGCTCGCTCAT
+CGGCCAGCCCAACACGATGGGCGACGAAATGGGTTACCTGGGACCAGGTCTAGCGGGTCAGCGGTGCGTT
+GATCGATTGGTCATGGGCGCCAGTCGATCCACCTGCTCCCGATTGCCGGTCATCGCGTCCGTCGACGAAC
+GGCTGTCGGTGCTCAAACCAGTTCGGCCGCGCCTGCATTCAATCTCATTCATCTTTAAGGGCCGCCCCGG
+GGAGGTGTACCTGACGGTCACCGGTTACAACTTTCGCGGTGTGCCGTAGTTCGGGGTGTGCTCGACCTGC
+CTCGCCGAGCGCCCCCGACAATCGGGTCGCCATCTATGAAAGGACATCTAGCAACATTCGGCCACCCAGC
+GCTTCCGACATACCGAGGATCATGGTTGAGTCGGGAACCGGGATCCCCCTACCGGCTTCCTGCTGGAGCC
+GGACGAGATCGAGGCGATGCATGCCGAAGGCTTCCTCGCCGCACTGGATCTGGCACTCTTCTGCGGCCAG
+GGCAGCGCTGTACGTTCGCGGCAAACGCCGACCCGATGGCCAAGGGCGTCGATCGTGCGCTCTGCGAAAT
+CGTGGCCGAACGCCGGCAACTGGACCTGGACCTGGCCAAAGCCCAAGTCCGGTCGGCGCTCGCCAACCAG
+CGTTACCATCGCGACGTCCATTAAACCCAGCACGGTCACGAACGGAGGTTGTGATGAGCGACGCCCGCGT
+GCCACGGATCCCGGCCGCGTTGTCCGCACCAAGTCTCAACCGTGGAGTCGGCTTCACCCACGCGCAGCGG
+CGGCGGCTGGGGCTGACCGGCCGGCTTCCGTCGGCCGTGCTCACGCTCGACCAACAGGCCGAACGCGTAT
+GGCATCAGTTGCAGAGCTTGGCCACCGATCTGGGCCGCAACCTGCTTCTCGAACAGCTGCACTACCGCCA
+CGAGGTGCTGTACTTCAAGGTGCTGGCCGACCATTTGCCCGAACTGATGCCGGTGGTGTACACGCCCACC
+GTTGGCGAGGCAATCCAACGCTTCTCCGACGAATACCGCGGGCAACGCGGACTGTTTCTGAGCATCGACG
+AACCCGACGAAATCGAGGAAGCCTTCAACACGTTGGGGCTGGGGCCCGAGGACGTCGACCTGATCGTGTG
+CACCGATGCCGAGGCGATCCTGGGTATCGGTGACTGGGGTGTGGGTGGCATCCAGATCGCTGTGGGCAAA
+TTGGCCCTCTACACCGCCGGCGGCGGCGTCGATCCGCGCCGCTGCCTCGCGGTGTCTCTGGATGTCGGCA
+CCGACAATGAGCAGCTGCTGGCCGATCCGTTCTATCTGGGCAATCGCCACGCCCGGCGGCGCGGTCGGGA
+ATACGACGAGTTCGTCAGTCGCTATATCGAAACGGCTCAACGGTTATTTCCGCGTGCCATTCTGCATTTC
+GAGGACTTCGGGCCGGCGAACGCGCGGAAGATCCTAGACACATACGGCACGGATTACTGCGTGTTCAACG
+ATGACATGCAAGGAACCGGCGCGGTGGTCTTGGCCGCCGTATACAGCGGTCTGAAGGTTACCGGTATCCC
+GCTGCGCGATCAGACAATAGTCGTCTTCGGCGCAGGCACCGCAGGGATGGGGATCGCCGATCAGATCCGG
+GACGCGATGGTGGCAGACGGTGCCACGCTCGAGCAGGCGGTGTCCCAGATCTGGCCGCTCGACAGGCCGG
+GCCTGTTGTTCGACGACATGGATGACCTGCGCGACTTCCAAGTGCCGTACGCGAAAAACCGCCACCAGCT
+CGGTGTGGCCGTCGGGGATCGGGTCGGGCTGAGCGACGCGATCAAGATCGCATCGCCCACTATCCTGCTC
+GGCTGCTCAACGGTCTACGGAGCGTTCACCAAAGAGGTGGTCGAGGCGATGACGGCGTCCTGCAAACACC
+CGATGATCTTTCCGCTGTCCAACCCGACGTCGCGCATGGAAGCCATCCCCGCCGACGTGCTGGCGTGGTC
+GAATGGCAGGGCGCTGCTTGCCACCGGCAGCCCAGTCGCCCCAGTGGAATTCGACGAAACCACCTACGTC
+ATCGGTCAGGCCAACAACGTGTTGGCGTTTCCCGGCATCGGACTGGGCGTCATTGTCGCTGGTGCCCGGT
+TGATAACCAGGCGCATGCTGCATGCAGCAGCGAAGGCCATTGCGCACCAGGCCAATCCGACAAATCCCGG
+AGACTCGCTGTTGCCGGATGTCCAAAATCTGCGGGCCATCTCGACAACGGTCGCCGAAGCTGTCTATCGG
+GCCGCCGTCCAAGACGGGGTGGCTTCCAGGACGCACGACGACGTCAGGCAGGCCATAGTCGACACCATGT
+GGCTCCCGGCATATGACTAACCGCGCACTCGACGGTCATCGCTGTAGGCAGCCTCTCGCTTAGCGTCGCT
+GCCCGCGGTTTGCACGTCACGCGGAAACCATCGCCAGCCGGCGAGAAACACGACAGCCAGTGTTGCAGTG
+GCGACGAGCAACGCCACCCGAATGCCTTCGATGAAATCCTCCTCCGCAATCGCGACGGGGTCGCGATGCT
+CAATGTGCCGCCGGGGGACGATTCCGCCCACATGCGCTCGCGGATTGGCACTGTCGATAATGATCTCGGC
+AAGGACGTGGCGCTGGACCGGGTCGGGCACCGCGCGCTCCAGATGGGGCTCGAGTGTGGCCGAAAGCCAG
+GCGGCAAGGACGGAGCCCAAAACCGCGAACCCGATCGTCGAGCCGATCGCCCGCTGAGCACTCATGATGC
+CGGACGCCATGCCCGCACGCTCGGCGGGGACCGCGGTCATGGCGACGGTCGTGATCGGCGTCAGGCACAA
+CGCGACGCCGCTCCCGCACAAGCCCAGCCCGACCAGGACCAGGGCCGAGCTCCGGTGCTCGCTGAAGATG
+AGCATGAGCAGACCCAGCATCAACATGCACAGCCCCGCCAGGATGGGAACGCGTGCTCCGATCCGGCCAA
+CCAGGTGCCCAACAAGTGGCGACACGATGGCCACGGCCGCACTGAACGGAAGGATCATCAGGCCGGTCAC
+GCTCGGGGTATAGCCGCGCACGTTCTGCAGGAACTGGGTGGTGAGCAGCAGCATCCCATAGACGGCGAAG
+AACACCGTGCAGATGGTCGCGATGGCCAGGGCGTATGAGGTGTCGCGGAACAGGGTCAGATCCATCATCG
+GATTCGATGATCTGCGCTCAAGCCAGACGAACAGGGCGCAGCCGACGGCGGCTGTCCAGAGCATCACGAT
+GGTCTGGACAGACGTCCAGCCGATCTGGGGGCCTTCGATGACCGCATACACCAGGGCACCCACGGCAACG
+ATGAACAGCAGCTGCCCGGACAGATCGAAGCGGCGTGCCCGCTCGTTACACGACTCCTCGACGTAGCACA
+AAGTCAGGAAGAGGACGAGTGCGCCCATGGGCAGGTTGACATAGAAGATGCTGCGCCACCCCCACTGGTC
+CACCAGCAGACCGCCCAGTGTCGGGCCCGTCGTCGTACCGATGCTCGCGATGGCGGTCCAGATCCCGATG
+GCGCGCGCCTTCTCCTTCGCCTCCGGAAAGGCCGCGCTGACCAGGGCGAGCGAGGTTACGCTGACGGCCG
+CCGCACCTAGGCCCTGCGCGCCCCGCGCGGTGGTGAGCACCGCGATTGAGGGCGCCAACCCGCAGGCGAT
+AGATCCCAGCGTGAACAACGAAACACCTATCAAGTACCAGCGGCGCCGACCGTAGAGGTCGGCAAGCGTC
+GCCGCCGACATGATGAAGACCGCCATTCCGAGGCTGTAGGACGCCACCACCCACTGCAGGCCGTCCTCCC
+CCACCGCGAAACTGCGCTGGATGTCGGGCAGCGCCACGTTCACGATCAGTGCGTCGAGAAAGATCATGAA
+CAGGCCCAGGCCAGTGGCGATGAGCGTGAGGAGCTGCGTGCGGTTCATGCGGGCCCCGATCTACATGGAT
+TTCGGTGGCGATCTGTGACCAGACACTAGGCTGCGCCAGCGACGGCGTCAGCCGCTTCGGTCGATTCGAG
+CCGAATGGTCGACGGCTGCGGAACCGACCGCAAAACTGGGGCAAAAGGTTCACCGCGGGTGTAAGCCAGC
+TAGGCGAACCGATCCCGCTGGCCCATGGCCTATAGTGGGCCCATGCAACAGGCCATACAGCTGCGCTTTA
+TCCTCCCGCGCCGCCTCGCCGTGGGCTGTTGTTGTTGTTGATTCCTGGCGTCCACAGCAATCCTCGCGCT
+CTTGCCCGCAAACGGGTGGAAATCGGTGTTCGCCCGCGGCGTACAGCCGCCGCGCACTCACGAGTCGTTC
+AGAAAGATCAACAGCCATGACCGTGCCCACGGATGCAGCCATCGACTTCGACGTCAGCTGGGAGGCCAAC
+TGGGCCTGGACCGACACTGTTGGGCGTAGCAGATGAGCATCGCCGAGGACATCACCCAACTCATCGGGCG
+CACACCGCTGGTCCGACTGCGCCGAGTCACCGACGGCGCCGTTGCCGACATCGTCGCCAAGCTGGAATTC
+TTCAACCCGGCCAACAGCGTAAAAGACCGTATCGGGGTTGCCATGCTCCAAGCGGCCGAGCAGGCAGGTT
+TGATCAAGCCGGACACGATCATTCTCGAACCCACGAGCGGTAACACCGGCATCGCCCTGGCCATGGTTTG
+CGCGGCACGCGGCTACCGGTGCGTGCTGACCATGCCCGAGACGATGAGTCTGGAGCGCCGGATGTTGCTG
+CGCGCATACGGTGCTGAACTCATCCTCACTCCGGGTGCGGACGGCATGTCAGGTGCCATCGCCAAGGCTG
+AGGAGCTGGCCAAGACCGATCAACGCTACTTCGTGCCCCAGCAATTCGAGAACCCGGCGAACCCGGCCAT
+CCATCGCGTCACGACCGCCGAGGAGGTCTGGCGTGACACCGACGGCAAGGTCGACATCGTCGTCGCGGGA
+GTCGGCACCGGTGGCACCATCACCGGCGTCGCGCAGGTCATCAAGGAACGCAAGCCGTCGGCCCGGTTCG
+TGGCCGTAGAGCCGGCCGCGTCGCCGGTCCTTTCTGGTGGCCAGAAGGGACCGCACCCGATCCAGGGCAT
+CGGCGCCGGGTTCGTCCCGCCGGTACTCGACCAGGACCTAGTCGACGAGATCATTACCGTCGGTAACGAA
+GACGCGCTCAACGTGGCGCGCCGGCTGGCCCGGGAAGAGGGCTTGCTGGTCGGCATCTCCTCGGGCGCCG
+CCACAGTGGCCGCTCTTCAGGTGGCCCGCCGGCCAGAGAACGCCGGGAAGCTAATCGTCGTAGTGCTCCC
+CGACTTCGGCGAACGATATCTGAGCACACCGTTGTTCGCCGACGTGGCTGACTAAGCCATGCTGACGGCC
+ATGCGGGGCGACATCCGAGCAGCCCGGGAGCGGGATCCGGCGGCCCCTACCGCGCTGGAAGTCATCTTCT
+GCTACCCGGGCGTGCACGCCGTGTGGGGCCACCGCCTCGCCCACTGGCTGTGGCAGCGTGGCGCCAGGCT
+GCTCGCGCGGGCAGCTGCCGAATTCACTCGCATCCTGACCGGTGTAGATATCCACCCCGGTGCCGTCATC
+GGTGCTCGCGTGTTCATCGACCACGCGACCGGCGTGGTGATCGGAGAAACCGCGGAGGTCGGCGACGACG
+TCACGATCTATCACGGCGTCACTCTCGGCGGCAGTGGCATGGTTGGCGGGAAACGCCATCCCACCGTCGG
+TGACCGCGTGATCATCGGCGCCGGGGCCAAGGTCCTCGGTCCGATCAAGATCGGCGAGGACAGCCGGATC
+GGCGCCAATGCCGTCGTGGTCAAGCCCGTCCCGCCGAGCGCGGTGGTGGTCGGGGTGCCCGGGCAGGTCA
+TCGGCCAAAGCCAGCCCAGTCCCGGCGGCCCGTTTGATTGGAGGCTGCCCGATCTCGTGGGAGCCAGCCT
+CGATTCGCTGCTCACCAGGGTGGCCAGGCTGGAGGCCCTCGGCGGCGGCCCGCAAGCAGCAGGAGTCATC
+CGGCCACCCGAAGCCGGGATATGGCACGGCGAGGACTTCTCGATCTGAGGCAATACCCGGCCGCCGACAA
+TGCCTTCTTCGGCGCCGCCCACCGACGCGCATCATCGGCTGCTAGCCCCCGCACCGGGTTCCGTCCTCGC
+CGAATTCACCTCGGGCCGGAGGTTGAGCTGCTTGGGCTTCGGCAGCCGAAACCGGGGCGATACAAACGTG
+GGTTGCGGATACGACCGCTTTGCGACGCGGTTTGTCCAACGCAGGCTTGGAAAACTTCTCCAAGCACGAG
+CGAGATTACTGATTCGAATTGGCTCTTGACAGCACCGGCGAAGAGGTGTAGAGATGCGAATCACTATGTG
+GACAGCAATCTTTGGAAAGCTCTTGCTGTCAAATCCGTCACGAACCTATGCTTAGCGATACCTTGCGCCA
+AACATGCAGTCGCTTGACCGTTGAGATCGCTGAGGTATCGGCCATGGATGTCCCTCACGAGCAGCCAGCC
+CTCTCTTCGAGCAAATCGAATCGCTTTACTTCGCAAAGGCAAACAACTGGTGTGGGAACCACCACTGTTG
+AACGGCTCGAACCGCGGTTATCTCCCGCGTCCCGCCACATCACTGAGGCTAAAGCTTTCGGCACCGAGTG
+CCACGTAAGTTCCTTTACCCGTGAGCAGGATCCCGACAGGGCGGTCCGTGTGGAGCAGATCCACGGTGAA
+GCGTATGTCGCCGCCGGCCATGTGTACGAATCTGCGCTCGATGAATTGGGCCGGCTGGACAATTCCAACG
+CCGAGTTCATCCTCGACAAGGCACGCGGTAGCACCCGAGAAACCGAGGTCATATACCTGCATGCGGTTCC
+CGCGGAGCCCCTCTCCGGCAGCCAAGGCGAAGGAGGCCTGCGAATAGTCGGCATTTCCGCTGTGGGGTCA
+ATTGACGACCTCAGTGCATTTAAGGCCGCCAAACCGTCGATGGGCCTGGCGCATCAACGCAAGCTTTATG
+ACGCGATCGAAGACCTGGGTCACGGCGGGGTCAAGGAGATTGCGGCATTATCGGTTACGGCCGATGCCCC
+TCCCACGGTGTCGTATTCGCTCATCCGGGAGGTTTTGCGCTTGTACCACCGAACCGGCGAAAAATTGATA
+ATCACATTTGCCATGCCAGCATACGCCAAGATGGTGATGAATTTTGGTCGATTTGCGATGCCTCAAGTGG
+GCGAACCGTTCTATGCGCATAGAAATAATGACCCTAGGACATCGAATGATCTCTTGCTGGTTCCCTCAAT
+AGTCGAGCCATCGAATTTTCTCGAGAATATTTCCCGCGGGGTCGTGACAGCGGATGACGGCCCGACCGCG
+AGAAGGCGATTCGCCACCCTATGCTATATGACCGACGGCCTTGATGACTATTTCATGCCGTTGACTCGGC
+AGGTCCTTAGCGAAGGAATCCAAGACATCTGAGTTCTGGAAGCGGTAATGGGCGGTCGGGCGTGCGCAAC
+TCCGGCAACAAACAGCTTGGAGCTTTTACGCGAAGCGGGATTCACTATCCGAACCAGACCGCTCGGCAGG
+GGCATAGCAATAAGCTTCAACCGATTGACGCATTGTGCGAACTGACGGCGCCCGCGCATGGCCAATCCGG
+AAGACCATCATTGGCCAGTGGCCGGGCGCTAACAGGTTCCAGCCCCCCACCAGTGCCGCTCGAACATGCG
+GTGCAACCCATTCGCAGGCCGGCAGGGAAAGCACCGCGGAAGCCGCAAAGGGCTGCAGTTCCGCGCCCAA
+TAGTGTCGTCCGCAACCAGATGCGCTCGAAAACCGCGCCGGCAGTCAGCGCACCCGACGCGAGGTCGAGA
+GACGTCGTCAGCGCGCCCACATGGGGTGCCAATCGGCACGGCAGGTAGGCCGCGCGCAACCCGAGCGCGT
+GGTGCATGCCCACGGTCCGCAGGAGGCGCAGCACCCTCCAATGCCGAAGCCCACGAAACATCGGGCGCAT
+CCACGCTTCAACCTCAAGAGACCCGGGCGGCAACCCATCGTCGCTGCTCGCGGTCCAGCCAATGTCGAAG
+CGGACGGCCGAAAAGAGTTCTTCGTGTAGTTCACGAGATCGAAAGCGCTCAGTTTCGGCCAATCTGACCA
+ACCGAAGGATCTGTTTCCTGGTCTCTGGCGAGTCAAACCAATGCAGTTGGATCCCGTCAATGCCGGTGGC
+CTCCGCCGAGAGTGCACCCAATTCGCCCTGCGAAAGTGGCGGTCCACGAAAGCGAACACGCCGGTTGGTG
+CGCCTTCGCTCGATCGCGACCTCGATTGGATCCACCCTGGTTTGTGGCAGGCGATCCACGTCGATCTCCG
+CCACCAGCCCCGGATTCCCGCTATCCGGAAACCAGCACACCTTCGTTTCAAAACCAAGGCGTCCAGCGCG
+CAGCTTCACGTTTTCGACAGCCGCACCGATCGCGACCAAACTCATGATGCGGCGGTGCTCGGGGGCGGAC
+CTCCAAGTCTGATCGCCCCACAACCGCACCCGCCTACCGGCATGTTCGAGCTGGACTTCGCGCCGGTTGT
+CCGCGGATGGCGCCAGCGCCGCCGCCTCGACGAGCGACAGGAATTCAGCAGGATCCAGACCCGTCATACC
+CGGGCCCCAGCGGCCGGCACGCATTGCCGTGGCAGAGTGGTCGCGCCGACGAACAGTGCGGAAGCGATAT
+GTCTATCCCATGTTCGCTCAAACAGCGGTGCGCTGGCAGTATCTGAGTACACCATTCTAGGTGCAGCTCC
+CAACTAGTAGCTCGGTTCCGTCCTGTGATACCGCAGTCCCGGTATTACCCCCGCCGATCGTCGATTTATG
+TAGCGGGCCAGCAATCGCCGCTTGACTCTCTGTAGAGGGTGGCGATTTCCGCACCGTAAACGCTTCCGAA
+CATAGATGCTGCGGTAAGCATCGAACTGATGAAAGTAGGGAGCAGCGTAAACGCGCCCATGTCCGAGCAG
+AATCTTCAACACCTCGGCCGCCACCACACCGGAAGCCAGATGACAGGCGAGGCCAACCGATGGACCCGTG
+CGATTTTCGATGTCGACGTAGGACAGATCTATGGAGCGCCGATGCGTCGCGGATGGTGCTATTCCAGCTA
+TAAATGCGACGAACTTATCCACCGTGTTCATCGCATCAGACAGATCGAAATACCGATCGAACGTCATACC
+CTTAGGATCGAAAACGACCCAGGCCGTACTGAACCCGAGCGGGCCAGCGCCTAGCGCGTAGATTCCCCGC
+TGCTGTGCTTCACGATAGAGCAGGCGACGCAAATCGATTTCGAACGCGTCGATGCCGTCCACCAAAACAT
+CTGCTCCCTCTAGAAAGGTAGCTGCATTCTCTTTCCCAATAGGTTCGCAGAAAGCACGGATTTCTGCTTC
+AGGGTTAATATCATGAACGATATTGCGCATGACCTCTGCCTTGGCCTGGCCGTTGGTCGAGCGCATAGCG
+CCGTACTGCCGATTCGAGTTGCGTATTTCGAAGACGTCCGGGTCTGCAATGGTGAACTTTCCTATTCCCA
+TCCTTGCGAGGGCGACCATGTCAATTCCCCCAACCCCACCCATCCCAGCGATTGCAACGCGACTATTCCG
+AAGCCGTTGTTGTTCGGTTGGGCTAATCAATCCAAGGTTGCGACAGAAAGCTTCGTCATAAGACCATGGT
+GCGCTTTCTTTCACCCGTCCAGAGTCGGGGGCATCCGCACCGGCTCGCATCGCATCATCCTCCCACGACG
+GGCCGCTCATCAGCTTGGGCCATTTCAATGTACTTGATACCCCGCGCTGCGGGTAGGCCACTGCGACGAT
+TCAAACACGGTGTCACACGGTGAATAGTGTCGAGATGGGCTCTGATCAACCGTCGCAAACCCGGTTTCGC
+ATCGATAGCGGAATCGCACCGGGTTGCATGGAGGCTGCTGACCTTGGAAAACAAGATGTATTCATTACGA
+CAAAACAAGCGCCGCGGAAACTTTGCACGCTCGAGCATTCCGCCGCGGCTCACGCACATCCTGGCCGCCT
+TCCCGCAACCGTCCCCCGGAATTACTGATCAAACCCTGGGTTTACCAACTTCCGGGCATGGGGCGAAGGT
+CGACAGCCAGAACATGGCCGTGCGTGATATGGGCATTCACGGGACGGAGCCGCTAAGGAGACCGGTACGA
+TTCAATCTCCATATGAGCGGTGCGGCGGCTGTTGTCAGGTACGTTGAACACCGGTGGGCGATCGGGTGCC
+GGCAGGTTGGTCTTCTCCTGTGATGCGAGCGCGCCTCCGCGCCAACCACCGCGTGCGAAGCAGGTGCTGA
+TGCCACAGTGCTGATGTCACAAGGAACCGCGAGGGGGTCCCGGACCCTACATGGTGCCGGGCGAAGTCCA
+CATGAGTGATACGCCGTCAGGCCCGCACCCAATCATCCCGCGGACGATTCGCCTGGCCGCGATTCCCATC
+TTGCTGTGTTGGCTGGGATTTACCGTTTTCGTCAGCGTCGTCGTTCCTCCGTTGGAGGCGATCGGTGAAA
+CCCGGGCCGTGGCAGTTGCCCCCGACGATGCGCAATCGATGCGTGCGATGCGACGTGCCGGAAAGGTGTT
+CAACGAATTCGATTCCAATAGCATCGCGATGGTCGTCCTGGAAAGCGATCAACCACTAGGCGAGAAGGCC
+CATAGGTATTACGACCACCTGGTCGATACGCTCGTACTGGACCAGAGCCATATCCAGCACATTCAAGACT
+TTTGGCGTGATCCCCTGACGGCGGCGGGTGCGGTCAGCGCAGATGGTAAGGCGGCGTACGTTCAACTTTA
+CCTCGCCGGCAACATGGGTGAAGCACTCGCAAACGAATCCGTTGAAGCCGTCCGGAAAATTGTGGCGAAT
+AGTACACCGCCGGAAGGCATCAGAACCTATGTCACCGGACCGGCGGCCTTGTTTGCCGACCAAATCGCCG
+CCGGTGACCGAAGCATGAAGCTGATCACCGGATTAACGTTCGCGGTAATCACCGTGTTGCTGCTGCTCGT
+CTATCGCTCGATCGCCACCACGCTGCTGATTCTTCCCATGGTGTTTATTGGACTCGGCGCGACGCGTGGC
+ACCATTGCCTTTCTTGGATACCACGGAATGGTCGGCCTTTCGACTTTTGTGGTCAATATCCTCACGGCAC
+TTGCCATTGCTGCCGGTACAGACTACGCGATCTTCCTGGTCGGCCGCTATCAAGAAGCCCGCCATATCGG
+CCAGAATCGCGAAGCCTCTTTCTACACGATGTACAGGGGCACCGCTAACGTCATTCTCGGATCGGGACTG
+ACCATCGCCGGCGCAACATATTGTCTGAGTTTCGCCCGGCTGACGCTGTTTCACACCATGGGGCCTCCGT
+TGGCAATAGGCATGCTGGTTTCGGTCGCGGCCGCGCTGACCCTGGCGCCCGCCATCATTGCCATCGCCGG
+CCGCTTCGGCTTGCTCGACCCCAAGCGAAGACTGAAGACCAGGGGCTGGCGTCGTGTGGGTACCGCAGTC
+GTGCGCTGGCCCGGGCCAATTCTGGCCACGTCGGTCGCGCTTGCCCTGGTGGGATTGCTCGCACTACCGG
+GCTACCGGCCCGGCTATAACGATCGCTACTACCTGCGCGCTGGCACGCCTGTCAACCGCGGGTATGCGGC
+CGCCGACCGGCACTTTGGCCCAGCCCGGATGAACCCCGAGATGCTGCTGGTCGAGAGCGATCAAGACATG
+CGAAATCCGGCCGGGATGCTCGTCATCGACAAGATCGCCAAGGAGGTCCTGCACGTGTCCGGGGTCGAGC
+GGGTGCAAGCGATCACCCGGCCGCAGGGGGTGCCCCTTGAGCATGCGTCGATTCCCTTTCAGATCAGCAT
+GATGGGTGCCACCCAGACGATGAGCCTGCCCTACATGCGCGAACGCATGGCCGATATGTTGACCATGAGC
+GACGAAATGCTGGTTGCGATCAATTCCATGGAACAGATGCTCGACTTGGTGCAGCAGCTCAACGACGTTA
+CCCATGAGATGGCAGCCACGACGCGCGAGATCAAAGCTACTACCAGCGAACTGCGAGATCACCTTGCGGA
+CATCGACGATTTCGTCAGGCCGTTGCGTAGCTATTTCTACTGGGAGCACCATTGCTTCGACATTCCGTTG
+TGCTCGGCGACGCGATCACTGTTTGACACCCTAGACGGCGTCGACACGCTGACTGACCAATTGCGGGCCC
+TTACCGACGACATGAATAAGATGGAGGCGCTCACACCGCAATTTCTCGCACTGCTGCCGCCAATGATCAC
+GACCATGAAGACCATGCGGACCATGATGTTGACCATGCGATCAACAATAAGTGGCGTACAAGATCAAATG
+GCCGATATGCAAGACCATGCGACTGCGATGGGGCAGGCCTTCGACACCGCAAAAAGCGGCGATTCATTCT
+ATCTTCCTCCGGAAGCCTTCGATAATGCAGAATTCCAGCAAGGCATGAAGTTGTTTTTGTCGCCGAATGG
+TAAGGCGGTGCGCTTCGTAATTTCCCACGAGAGCGATCCAGCAAGTACTGAAGGTATCGATCGCATCGAA
+GCGATAAGGGCCGCGACCAAAGATGCCATCAAGGCGACACCATTGCAAGGCGCTAAAATCTATATCGGTG
+GCACGGCTGCGACCTACCAAGACATTCGAGACGGTACCAAGTACGATATCCTCATCGTTGGTATAGCCGC
+GGTATGCCTGGTATTTATTGTCATGCTCATGATTACCCAGAGCCTGATTGCGTCACTCGTCATTGTTGGC
+ACGGTACTTCTGTCATTGGGTACTGCGTTCGGACTGTCCGTGCTCATCTGGCAGCACTTTGTCGGTCTCC
+AGGTGCATTGAACGATCGTCGCGATGTCTGTCATCGTCTTGCTGGCCGTCGGTTCTGACTACAACCTCCT
+TTTGGTGTCCCGGTTCAAGGAGGAGGTCGGCGCTGGATTAAAGACCGGGATCATCCGGGCGATGGCCGGC
+ACCGGCGCAGTTGTCACGTCGGCCGGTCTGGTATTCGCGTTCACCATGGCGTCCATGGCCGTCAGCGAAC
+TCCGCGTTATCGGACAGGTCGGCACCACCATCGGGCTCGGTCTACTTTTCGATACCCTGGTGGTCCGATC
+GTTCATGACGCCATCCATCGCAGCGCTGCTAGGTCGCTGGTTCTGGTGGCCGAACATGATCCACTCGAGA
+CCCACCGTCCCGGAGGCGCACACACGCCAGGGCGCTCGCCGAATTCAGCCGCATCTGCACCGGGGTTGAT
+ATGCACTTCGGTGCCGTGATCGGCGCCCGGGGTGTTCGTCGACCATGCGACCGGCAACGCGGCCTTGCGC
+ACAGGCGCGATCGCTCATTCGTGCCCGGGCGGTCGAAGACCAAGAGCGCGCAGCAGTTGGTCGCGGTCCC
+ACGGCCGGCCGCTGCCACTAGCATTGTCGCCGGATGCTGTCAGCAGCCCATTTCGAGCTCGAAGCCCGGA
+CAACTTCTTTAGCGTGTGGCGCAACCCCCGAAGACTCGTCAACGGAAGAAGCAGTAGCTGCTCATCGCGC
+CCGCCATCAGCCCGGCGCGCCGAGTTGCCCGGGTCGGCCGGGTTGCCCTGGTGTGCCGCGTTGCCGGGGT
+TGGTCGTCGCGTGCATCGCCTGCGCCTTGGTCGCCGGCGTCGAGCCGGATTCGGCTGCCACCGCAGACGT
+GGTAGCCGGCGACACCGCAGGTGCCGTGGCTACCGCAGGTGCCACCTGTTCACCCACTCCGCCGATAGCA
+CCGGAATGGCCTTCACCGCCGAGCCCCCAGTGCCCGCCAACCCACGGAGCCCCACCGAAGCCGGGCATCA
+ACCCGCCCTCAGCAGAAGCGCCCGCAGCGCCGGTGCTCAGACCGCCGTCACCGCTGGCCATGCCGACTCC
+GCCGTCCCCGCGAACAGACCCGACGATGTCCCTGCCAGTCCCGGCACCACCGACTGCGTCTGCGCTGCCG
+GCCCCAGTCCCATTGCCGGCTGCGCTACCGACCCCAGCACCACTGCCACCCGGGTCCGCGACACCGGCGG
+CACCTGTTGCGCCGCTGCCGTGCGAAGCAGAAACGCCGCTGCCGTGCGCGGCGCCAGCCACTCCGGGGTT
+ACCGTCGGTGCTGCCGAGCTGGCCGGCCCCATGCTGCTCGCCGACCTGACCGTTGCCGATCGGTCCGCCG
+TCCCAGCCCTTTCCGCCAGCCTGGCCGACACCGCCAAACCCGCCGGCACCGCGAGATTGCCCGGTGCCCG
+TCCCCCCAGTGCGATCTTGGGCGAGTTCGCTGACCACGCCCTGCGCTTTCTGCAGCGGCAAGGCGTTGGC
+GGCCTCAGCCATGGCATACGCCGCCGCGCCCTCTTGCAGGATCTGTACAAACCGGTCGTGAAACAGCGCC
+GCTTGAGCGCTAATGGCCTGATAGGCCTGCGCCCGCGCGCCAAACAACGCCGCGATGCCAGCCGACACGT
+CATCGCCGCCGGCAGCCAGCACTCCTGCCGTCGGGGCGGCCGCAGCGGCGTTGGCCGCGCGCATAGTGGA
+GCCGATCGCGGCTAGCTCCCCGGCCGACGCCGCCAGAACGTTCGGGGCCGCGGTAACGTGCGACATAAGC
+GAGCACCTGCCCGTGTTGCCAACTCGCTGTGACCGGATCGCTGGTCGACCCGCGTTGTCACCGCGAATCC
+TATCGCGATCGACCAGGAACATCCCAGCATTCAGGCATGCCTACTGCGCCTCACACTGAAGTGTCGAGGT
+CGGCGGAGTCCCGGCATCATCAGGCGAGTGGCATGCACTCACCAACCGCGGCCAGCTCGGCACCAGCTTG
+GTGTCGGCGCACAGAGCTGTTCGGGCCCATACGTCGACGTAGCCGAACCCGCCCCGACTCTCGTCGGACA
+CGTTCTGCTGTTTGGCGTGGCCGAACGATCAGATCTCGTCGCGCCGAACGTGTATTGCCGGGCCGGTGGA
+AGAGTCTGCCGGGAGAAAAAGGAAAAGCCCTGCAGAGACTGGTGTGACACGCCTTGCGCAGCCACGCGGT
+CGGAAAACCGAACCTTAGCTCATCAGAACCCAACACAAGAGGCGGGACAAGCCGAGTTCAAGCCGAACGC
+CCTGCTCCCCCGGGAGGACTCGAACCTCCAACCCTTCGGTTAACAGCCGAACGCTCTGCCAATTGAGCTA
+CAGGGGACCGCCTGGTCCGTGCGAACGCTGGCGCAGTCGCGGGACGACTCTAGCGTACTGGTGTGACGGC
+GCCCAACTAGGGAGATTCCTTACCGATGGGAGCAGGCTGATGGCAGCAGGCACGATGCCAGTAGGTGGTC
+GGCAGCACGTTTTCGAGAAGCTGGCCAGCATCCTGGGCTTGGTCGCCGCGCCGCTCATGCTCCTTGGATT
+GAGTGCCTGCGGCCGCAGCGCCGGCAAGACCAGCGAACCGACCTGCCCCACGGAGCCGATCGATGCGGCC
+GACAGCTCGACAACACCGGACCCCTCGTGTGTGGTGCGGGCCACTGAGATCAACGGCAACGGGTCGCGCA
+TCCAGACCTGGACCGGCAGCTATGATGCGGCCGCAACCCAGTCCGGTGGTGTGTGTGGTGGCACCTGCAA
+CTTCCACGCCACAGTGCGGTTCACGGTCGACGAAGGCCAGATCTCGGGCAGCGTCGATCAGGTCTATCAA
+GCGGCGATGGTTGCTATCGCAACACGCCCCACTTCGCCATCTCTGGCACCATGACGATGACGCGGTGACC
+ATCGCGTGATCCAAGACGTACCTGACGGGCAATAAGCCGATACCAAAGCCGAGCCCGCATCACGCCGAAA
+CAACCGCGGAGTATCTGCTCGGCGTCGTGAATTGGGTGACCAAGTGGAACCTCGATTGCGTCGAAGGCTG
+CAAATAGGACATCGGGTACCGCATAACCGGATCGGGCGCGCGTAGCCAGGCGTGTAAGGCAGGATGGATG
+CAACCGCACCGTTAGTCGGAGGGACCGCATTGATCGGGTATGTCGCCGTGTTGGGACTGGGTTACGTGCT
+GGGCGCAAAAGCCGGGCGCCGCCGCTACGAGCAGATCGCGAGCACCTATCGCGCACTCACCGGCAGCCCC
+GTGGCCAGGTCGATGATCGAAGGCGGGCGTCGCAAGATCGCCAATCGGATCTCACCCGATGCTGGGTTTG
+TGACCCTGGCCGAGATCGACAACCAGACCGCCGTTGTCCAGCGCGGGGTCGAGCGGCAGCCGAAAACCGC
+GCGCTGACCCTCACGCGGTGAGATCGTCGCCGCTGGCCTGCTCTAACAGGCTGCGCCGATAGGCCTCCAT
+GGCGACCAGGTCGCCGAACAGCGCGTGGTATTCGTCGCCTTGCTCGATCGGCGACATGCGCTGCAGTTTG
+GACTTCACCTCGGCGATCTGCCGCCCCAACCAAACCTCCTGCAGACGGGCCAGCACGCCGGCGATATAGC
+GCGGCAGCTTGTCGTCGTCGACCTGAATCGCCTCCACCCCCAGCTCGCTGATCAAAGCCGAGGTCACGGT
+TGATGTCGTCTGCTGGCGCACCATATCCAGCCACTGCGCACCGCTAAGGCCAGCCGAGGTACCGCCCGCC
+GTGTCGATGGCCGCGCGCACAGCCGCGTACTCGGGGTGCGTGAAGCCTTCGACGGTCAGCGCGTCGAACA
+CCGGGCCGGCCAACGCCGGGTACTGCAACGCCGATTTGAGTGCCTCACGCTGTGGCCACAGGGTCGGGTC
+ACGCGGATCAGGTCGGACTGCGAGTTCGGTCGGGGGGCCGGCGGTGGGCCGCTGCGCTGCCCGGGCGATG
+GTCGTCGATCCCAGTCTGCCCAGCCTGGGGTGCTTGGTTCGTTTGGCCTCACCCCGCACCCGACCGATGA
+CCTGTGCGACGTCGGCCCACCCGACCCAGCCGGCGAGCTGACGGGCGTATTCGTCACGCAGCGTGGGGTC
+TTTGATCTGGCCCACCATCGGTACGCAACGGCGCAGCGCGGCCACCCTGCCCTCGGCGCTATCCAGGTCC
+ATCTCGGCAATCGCGGCGCGAATCGCGAACTCGAACAATGGGGTTCGTCGTGCCACGAGGTCGCGCAGGG
+CAGCGTCGCCGCACTTCAGTCGTAGGTCGCAGGGGTCCATGCCGTCGGGAGCCACCGCGACGAAAGACTG
+ACCAGCCAGCTTCTGCTCACCGTCGAAGGCCTTGAGCGCGGCGGCGCGGCCGGCCTCGTCGCCGTCGAAA
+ACGTAGATCAGCTCGCCGCGGAAGAAGCTGTCGTCCATCATCAGTCTGCGCAGCATCGCCAGGTGCTCGC
+CGCCGAATGCGGTCCCGCACGACGCCACCGCGGTGGTGACCCCGGCCAGATGCATGGCCATGACATCGGT
+GTAGCCCTCGACGACGACGGCCTGATGTCCCTTGGCGATGTCGCGTTTGGCCAAGTCGATGCCGAACATC
+ACCGATGACTTCTTGTACAGCAATGTCTCGGGCGTGTTGACGTACTTGGCCTCCATCGCGTCGTCGTCGA
+ACAGTCGCCGGGCACCGAACCCGACCACCTCGCCGGCCGAGGTGCGGATGGGCCACAGCAGCCGACGGTG
+AAACCGGTCCATCGGGCCGTGCCGGCCCTGCCGGGACAGTCCCGCGGCCTCCAGTTCCTCGAACTCAAAA
+CCCTTGCGCTGCAGATGTTTTGTCAATGAGTCCCAGCCCGACGGGGCGAACCCACAGCCGAATTTACGAG
+CGGCCGCCGCGTCGAAGCTGCGTTCGGTCAGGTACTGGCGAGCCGGTGCCGCCTCGTCGGACTGCAGCGC
+CTGCGCATAGAACGCTGCCGCGGCCGCGTTGGCGGCCAGCAGCCTGCTGCGACTGCCGCGGTCGCGCTGC
+ACGCTGGTGGCCGCACCGGTGTAGCTGATCGTGTGGCCGATCCGGTCGGCAAGCAACTCAACCGCCTCGA
+CGAAGCTGACGTGCTCGATCTTCTGGATGAACGCATACACGTCGCCGCCCTCGCCGCAGCCGAAGCAGTG
+GAAGTGGCCGTGGTTGGGCCGCACGTGAAAGGACGGGGACTTCTCGTTGTGAAACGGGCACAGCCCCTTC
+AGCGAATCGGCACCGGCACGCCTGAGCTGGACATAGTCGCCGACGACATCCTCGATACGGGCCCCCTCGC
+GGATTGCCGCGATATCGCGATCGGAGATCCGGCCGGACATCGGCTCAGTCTAAAGCGTTCCTGCTGACGC
+CAAGCTGATCGGCATCGATGCGTTCCAACCGACCCTCGGTATAGGAGGCGATCTGATCAACGACGACCCG
+CAACCGGGCAGCGTCGTCGGCGGCGGTATTGAACGCAGCGGCATAAACCGGGTCGAGCGTCTGCGGCGCC
+CCCGAGTACAGCCTGTGCGCCACCCGGTGAATACGTTCGCGCTGCCGTGCCTGGGTTTCCAGATGCCGAG
+GGTCGGACATGATGAACTGCAGCGCGAGGATTTTCAGTACCGCGACCTCGGCACGTACCAGATCGGGCAC
+CTGCAGGTCGGCCCGGAAGCGCACCAACGGTCCCGGACCGGCCGCGGCCCGGGTGGTCGCGATCGCGGCC
+GATGCAAAGCGGCCCACCAGCTCGCTGGTCAACCGCTTGAGCGCGACCGATGCCGACAAGGTGGCGTCAT
+ACTTGCCGACGGCGGCCACCACGGGCAGCCGCGACAGCCGCCGCGCGGCCGCCATCAACTCGTCGGCGCT
+CACCCGGGAGAACTCGCGCTCCCCTAACCTGGCCAGCGCGGCAGCGTCCTCTTCGGCGGCCAGCACACGC
+AGGTCGATGCGTTCGGAGACAACGCCGTCCTCGACGTCGTGAACCGAGTAGGCGACGTCGTCGGCCCAGT
+CCATCACCTGCGCTTCCAGGCACGCCCGCTCCGGGGGCGCGCCTTGCCGAACCCATACCGCCGATTCGCG
+GTCGTCGTCGTAGAAGCCGAACTTCCTCCGCTGGCTGCCAAGCCCGTCACCACGCATCCACGGATACTTG
+GTGACCGCGTCCAGGGACGCGCGAGTTAGGTTCAGCCCCGCACTAAGTCCTTGTGCGTCAACTACTTTGG
+GCTCAAGGCTGGTCAAGATACGGAAGTTCTGCGCGTTGCCCTCGAAACCGCCGTGGCTGGCTGCGACTTC
+ATCAAGCGCCCGCTCACCGTTGTGTCCATACGGCGGGTGCCCGATGTCATGGGCTAGACCGGCCAATTCG
+ACCAGATCAAGGTCGCAGCCCAGCCCGATCGCCATTCCCCGTCCGATCTGAGCCACTTCCAGCGAGTGGG
+TCAGCCGGGTACGCGGCGTATCCCCTTCCCGGGGTCCGACCACCTGGGTCTTGTCGGCTAGCCGGCGCAG
+TGCGGCGCTGTGCAGCACCCGGGCCCGGTCCCGGGCGAAGTCGGAGCGGTACTGACCCTCAGTGCCCGGC
+AGACCGGCAGTCTTTGGCGCTTCGGCTACCCGCCGCTGGCGGTCGAAGTCGTCGTAGGGGTCGTGCTCAC
+TCGCGCTCACCGACCCACAGTCTGCCAGGGTGGTCGCCGCACGCCCGTATCCGCCGGCACAGCGTCTAAA
+TTGACGGTATGCGTCTCGTTCGCCTGCTCGGCATGGTCCTGACTATCCTCGCCGCCGGGCTGCTGCTGGG
+GCCGCCCGCTGGCGCGCAACCACCTTTCCGGCTGTCGAACTACGTGACCGACAACGCGGGCGTGCTGACT
+AGCTCCGGTCGCACCGCGGTGACGGCGGCCGTCGACCGGCTCTATGCCGATCGCCGCATCCGACTGTGGG
+TGGTCTACGTCGAGAACTTCTCCGGTCAGAGTGCGCTCAACTGGGCGCAGCGCACGACGCGGACTAGCGA
+GCTGGGTAACTATGACGCGCTTCTGGCCGTGGCCACCACCGGTCGCGAATATGCCTTTCTAGTGCCATCC
+GCGATGCCGGGTGTCAGCGAGGGGCAGGTCGACAACGTGCGGCGCTATCAGATCGAACCGGCGCTGCACG
+ACGGCGACTACAGCGGCGCGGCCGTTGCGGCGGCGAACGGACTCAACCGGTCACCCAGTTCGTCGAGTCG
+AGTGGTGTTGTTGGTCACGGTCGGCATCATCGTCATCGTCGTCGCGGTCCTGCTGGTGGTGATGCGCCAC
+CGCAACCGGCGGCGCCGCGCCGACGAGCTGGCCGCGGCACGCCGCGTCGACCCTACCAACGTAATGGCAC
+TGGCCGCCGTGCCGCTTCAGGCCCTCGATGACCTCTCCCGGTCGATGGTGGTAGACGTCGACAACGCCGT
+GCGCACCAGCACCAACGAGCTCGCGCTGGCCATCGAGGAGTTCGGCGAACGGCGAACCGCACCGTTTACC
+CAAGCGGTGAACAACGCCAAAGCGGCTCTGTCCCAGGCGTTCACCGTACGCCAACAACTTGATGACAACA
+CGCCCGAGACGCCGGCGCAGCGACGTGAGCTACTCACCCGAGTGATCGTGTCGGCGGCGCACGCCGACCG
+TGAACTCGCGTCGCAAACCGAGGCCTTCGAGAAGCTACGCGATTTGGTGATCAACGCCCCGGCCCGGCTT
+GATCTGCTCACCCAGCAGTACGTCGAACTGACCACCCGGATCGGCCCGACTCAGCAACGCCTGGCCGAGC
+TGCATACCGAATTCGACGCTGCGGCGATGACGTCGATCGCCGGCAATGTCACCACCGCCACCGAGCGGCT
+GGCGTTCGCCGACCGTAACATCAGCGCGGCTCGGGATCTGGCCGACCAGGCAGTGAGCGGACGGCAAGCC
+GGACTGGTGGATGCGGTGCGTGCCGCCGAGTCGGCACTCGGGCAAGCCCGGGCGCTGCTCGACGCGGTGG
+ACAGCGCCGCCACCGACATCCGGCACGCCGTCGCGTCGCTGCCGGCGGTCGTGGCCGACATCCAGACGGG
+CATCAAGCGAGCCAACCAACACCTACAGCAGGCGCAACAACCCCAAACCGGGCGCACCGGTGACCTGATC
+GCAGCCCGCGATGCGGCGGCCAGGGCCCTCGATCGCGCGCGCGGAGCCGCCGATCCGTTGACCGCATTTG
+ACCAGTTGACCAAGGTCGACGCTGACCTCGACCGGCTGCTCGCCACCCTGGCCGAAGAACAGGCAACCGC
+CGATCGGCTCAACCGCTCACTTGAGCAGGCGCTGTTTACCGCGGAGTCGCGGGTGCGCGCCGTCTCGGAG
+TACATCGACACCCGCCGCGGCAGCATCGGGCCGGAGGCCCGGACCCGGCTGGCCGAGGCGAAACGGCAGC
+TGGAAGCCGCACATGACCGGAAATCGAGCAACCCGACCGAAGCGATCGCCTACGCTAACGCGGCATCGAC
+GCTGGCCGCACATGCGCAGTCGCTGGCCAATGCCGACGTGCAATCCGCCCAGCGCGCATACACCCGTCGT
+GGGGGCAACAACGCCGGCGCGATCCTCGGTGGCATCATCATCGGCGACCTGCTTAGCGGAGGCACCAGAG
+GCGGGTTGGGTGGATGGATCCCCACGTCGTTCGGCGGTTCGTCGAACGCGCCGGGAAGTTCACCCGACGG
+CGGGTTCTTGGGCGGCGGCGGGCGGTTCTAAGCCACGCGCCAGCGCACGGGGATACCCGTACGCTGGCGC
+GTGTGGCCGTCGACCTAGGCTTCTTCCTAGGGTTCGTCGACCCTGTCAGGCCCAGCTGGAGCCGACGGCG
+CTGTCGGTTTGCGCCATGTTGTTGCCGGCAGCCTGCACCTTCTGCCCGTGGGCGTTGGCCTGCTCGTAGA
+TCACCTGGAAGTTACGGCCCAGCTGGGTGATGAACTCCTGGCAAGCCACCGAACCGGCGCCGCCCCAAAA
+GTCACCCGCGGCCAACAAAACTCGAGTTTATGTTTCCGGCGTTAAGACTGCCGAAGTTGTAGTTGCCAGC
+GTCGAAAAAGCCTGTGTTGCCGGCGCCGGCGTTAGCGAGGCCAGTGTTTGTGCTGCCGCCGTTCCAAAAT
+CCGGTGTTGACGTTGCCCGCGTTCCCGAATCCAGTGTTCGCAGTACCGGAGTTCCCGAAGCCTACGTTGC
+CGGTGCCGGAGTTGAACAAACCGACGTTTCCGGTGCCGGAGTTCCCGAAACCGATGTTTCCGCTGCCCGA
+GTTCAGTCCGCCGATGCCGATCTGACCATCGCCGGTGAGCCCGATACCGATGTTGTTGTTGCCCGTGTTT
+CCGAAACCGAAATTCCCGCTGCCGGTGTTTCCGAAGCCGATGTTGTTACTGCCGGTATTGCCGCTACCAA
+AGTTGAAGTTGCCGTTGTTTCCGTTACCGAAGTTCGTGTCGCCGATGTTGCCGCTGCCCACGTTGGTGCT
+GCCGATGTTGCCGCTGCCCACGTTGGTGCTGCCGATGTTGCCGCTACCCAGGTTTTGGCTACCGAAGTTT
+CCGCTGCCCAGGTTGAGGTTGCCAACGTTACCGATGCCCAGGTTGATGTCACCTTGGTTACCGCTGCCCA
+GGTTGAAGCTGCCGATATTGCCGCCGCCTAGGTTGGTGTTGCCGATATTGCCGCTGCCGACGTTCGTGTC
+ACCGGTATTTCCGCTGCCCAAATTGAGGGACCCGATGTTGCCAAAGCCGAAGTTGATGCCCTGCAGAGGC
+CCAGGCACGGTGGAGCCGACTGCTTGGGCGGTCACCGCTTGCGCGCTGGACTGTGCACTATCTAGCAAGC
+CCAACAAGCCCGGCACCGCCTGCTGCCATGGCGCCAACGCCGCCGCCGCCGATGCCCCACCGTGATAACC
+CACCATCGCCGCCACATCGGCAGCCCACATCTGCTCATAGGTGGCCTCAGCAGCGGCAATCGCCGGCGCA
+TTCTGCCCAAACACATTCGACAGCACCAACTGCACAAACGCACTGCGATTAGCCGCCACCACCACCGGAT
+CCACCATGGCCGCCCGCGCCGCCTCAAACGCGCCGGCCACCGCCTTAGCCTGAACCGCAGCCCCCCCAGC
+CCGCGCCGCCGCAGCAGCCAACCACCCCGCATACGGCGCCGCCGCCACCACCATCGCCGCCGCCGCACCC
+TGCCACGCCTGACCCGACCCACCCGCCAGACCCGAGGTCACCAACCCAAACGACTCCGCCGCCAACCCCA
+ACTCAGCCGCCAACCCATCCCAGGCCGCCGCCGCCGCCAACATCGGCCCCGACCCCGCACCAAAAAACAT
+CCGCCCCGAATTAATCTCCGGCGGCAACACCGAAAAATTCACCACTACCGCCCCTCCTCTAACAAATCAT
+TCTCAACCGCACCCCCGCGCGTTACCCCAAACGACACGCGGACACCCGTCACCGAGACGTCCTACGTTGT
+CTGGGCGCCAAACCGGCTCGATCCCCGACTTGGCTCACGATTCGCGGCTCAGCATTAATAGAGCCCGTTG
+ACCTGTGAGTTTGCTTGGTGACGGGTCGAAAATTGTGCACTTGATGCACTCAGGAGTACCTGGACGCCCG
+GACGGCCAACCGGGGCGCCGCCGAACCACGGTGGCGCGCCAGATGACTCAATTGACCCGAGTGCTGCTCC
+CGCTGTCCGTACCGCTCTTTCGTCACGTCCGCAACACTGGCCCTCGCCGTCGGCGATGGTCGCTGTGCCC
+ACCTTAGCGCGACAACTCGGTTTCTGCAGGTCAACGCCCGCCTCCAATCCCGCACAGCCACGACCAACTC
+GGGAACAAAACCGCCGGTCAGGCAGCTGTCGCTGAGAGCCGGGCACATCGGGTGTCGCCCGGTACAGTGA
+CACATGTGACCGTTGCGACCGTGCGATGTGCCCGACGCTCGATGCGCACCAATTCGAACCAACTCAGGTC
+TTACGTTGCCTGGACGCCGAACTAGCTCGATCCAGCGCCGACCCGCACCCCACTACCGGCATCTGAAGGT
+GAGCCAGAGACGCGTCGACCAGGAAGAACCGTGGCCGCACGGGTCACCCGGGCACACCCAACCGGGCCGT
+GGCAAGTGCCGACTACCTGAAGAATCCCGAAAGTCCTACACCCGCATTGAAAGCACCGGAGTTCTGGCTA
+CCCGAATTTACCGCACCCGAACTGTCGTCACCCGAGTTGGAGATACCGGCGAGGTTGTTACCCGAGTTTG
+CAATTCCTGCATTGAAAGAGCCAATGTTTGCAAACCCGGAGTTGAAGCCAGGAAGCATGGCTGGGCCGGC
+GTTGGAGAAGCCCGAATTACCGTTGCCTGTGTTGAAGAACCCGGAGTTGCCGGTGCCCGAGGGGTCACTG
+TTCCCCCAACCCGAGTTGCCGGTACCGAGGTTCCCGAAGCCCGAGTTGGCACCTGCTTGGGTGAGCGCGC
+TGCCAAAACCGGTGTTGACGTTGCCGCCATTGAAACCACCGGTGTTGATATCTCCACCGTTAAAGAAACC
+GGTGTTGACGTTACCTGCGTTCGCGAAACCGGTGTTCGAGTCACCCGCATTGAAGAAGCCGGTGTTTCCA
+GCACCCGAATTTCCGAAGCCGGTGTTCTGAAAGCCCACGTTGAAGCTGCCCGAGTTTGAGTTCCCGCCGT
+CGAAGATACCGACGTTTCCGTTGCCGGCACTCCCGAAGCCCGTGTTTAAATTGCCTGCGTTCCAGAAACC
+GGTGTTGATATTTCCGGCGTTCCCGAAACCCGTGTTGCCGTCACCCGAGTTGAAGAAGCCGATGTTTCCA
+TCACCCGAGTTGAAGAAGCCGATGTTGTTGTTGCCGGAGTTTCCGAAGCCGATGTTTCCAGTGCCTGAGT
+TCAGTCCGCCGATGCCGATCTGACCATCACCGGTGAGCCCGATACCGATATTGTTGTTGCCCGTGTTTCC
+GAAACCGAAATTCCCGCTGCCGGTGTTTCCGAACCCAAAGTTGAGGGTGCCATTATTCCCGCCGCCAAAG
+TTGAAGTCGCCGGTGTTCCCGCCGCCGAAATTGACATCACCGTTATTTCCGTTGGCGAGGTTGAGCGTGC
+CGAAGTTTCCGCTGCCCACATTGAGGCTGCCGATATTTCCGCTGCCGAAGTTTCCGCTGCCGAAGTTTCC
+GCTGCCAGGGTTGTAGTCACCCGTGTTTCCGCTGCCGGCATTGCCGGTACCGGTGTTTCCGCTGCCCCAG
+TTCAGGCTGCCGTAGTTCCCGCTGCCCAGGTTGGTGCCGCCGACATTGCCACTGCCCACGTTGGTACCGC
+CGATGTTGCCGCTGCCCAGGTTGAGGCTGCCGATGTTGCCGACACCCAAATTCAAGGTCAGCTCGGCGAG
+GCCTTGTGCAGCGCCTTGTGCAGCGGCCGCCGGTGCGTTAGCCGCACCGCCTAGCAAGCCCGACAAGCCC
+GGCACCGCCTGCTGCCATGGCGCCAACGCCGCCGCCGCCGATGCCCCACCGTGATAACCCACCATCGCCG
+CCACATCGGCAGCCCACATCTGCTCATAGGTGGCCTCAGCAGCGGCAATCGCCGGCGCATTCTGCCCAAA
+CACATTCGACAGCACCAACTGCACAAACGCACTGCGATTAGCCGCCACCACCACCGGATCCACCATGGCC
+GCCCGCGCCGCCTCAAACGCGCCGGCCACCGCCTTAGCCTGAACCGCAGCCCCCCCAGCCCGCGCCGCCG
+CAGCAGCCAACCACCCCGCATACGGCGCCGCCGCCACCACCATCGCCGCCGCCGCCGCACCCTGCCACGC
+CTGACCCGACCCACCCGCCAGACCCGAGGTCACCAACCCAAACGACTCCGCCGCCAACCCCAACTCAGCC
+GCCAACCCATCCCAGGCCGCCGCCGCCGCCAACATCGGCCCCGACCCCGCACCAAAAAACATCCGCCCCG
+AATTAATCTCCGGCGGCAACACCGAAAAATTCACCACTACCGCCCCTCCTCTAACAAATCATTCTCAACC
+GCACCCCCGCGCGTTACCCCAAACGACACGCGGACACCCGTCACCACGGCGCCGCCCACCCAGCGGCCAC
+CACAGCTCACCGGGTCGTGCCCGGACCGGGGCTGCTAGCTGCCCTTGAGCCGCACCGCGAGATAGTCGGC
+CACGCTGCTCATCGCAACCCGGTCCTGCGTCATGGCGTCACGCTCCCGCACGGTGACGGCATTGTCCTGC
+AGCGAGTCGAAGTCAACCGTCACACAGAACGGGGTACCGACCTCGTCCTGGCGCCGGTAACGCCGCCCGA
+TAGCGCCGGCATCATCGAAATCGATGTTCCAGCATTTCCGTAATTCGGCGCCCAGGTCCCGGGCCTTCGG
+GCTCAGGTCCGCGTGCCGGGACAGCGGCAACACCGCCGCCTTGACCGGCGCCAGCCGCGGGTCCAATCGC
+AGCACCGTGCGCTTATCCATCCCACCCTTGGTATTCGGGGCCTCGTCCTCGGTGTACGCGTCGATCAAAA
+ACGCCATGAATGACCGGGTCAAGCCAGCTGCCGGCTCGATGACGTACGGCGTGTACCGAACATCGTTGAT
+CTGGTCGTAGAAAGACAGGTCGACGCCGGAATGCCGCGCATGCGTCGATAGGTCAAAATCGGTTCGGTTG
+GCCACACCTTCCAGTTCACCCCATGGATTGCCCATGAAGCCGAACTTGTACTCGATGTCGACGGTGCGGT
+CGGAGTAATGTGACAACTTGTCTTTGGGGTGCTCCCACAACCGCAGGTTCTCCCGACGAATACCCAGGTC
+GATATACCACTGCAGCCGGTTGTCGATCCAGTACTGATGCCATTCCTTGGCAGTCGCCGGCTCGACGAAG
+AACTCCATCTCCATCTGCTCGAACTCGCGGGTCCGGAAGATGAAGTTGCCCGGAGTGATCTCGTTGCGAA
+AGCTCTTGCCGATCTGTCCGATACCGAATGGCGGCTTCTTACGAGCAGTTGTCACCACGTTGGCAAAGTT
+CACGAAGATGCCCTGCGCGGTTTCCGGGCGCAGATAGTGCAGCCCCTCCTCGGTCTCGATGGGTCCGAGG
+TAGGTCTTGAGCATCATGTTGAACTCGCGTGGCTGCGTCCACTGGCCGGGTTCGCCGGTTTCCGGGTCGC
+GAATGTCGGCCAACCCGTTAGGCGGCGGATGCCCGTGTTTGGCTTCGTAGGCCTCGATGAGATGGTCGGC
+CCGGTAGCGCTTATGTGTGATCAGCGACTCGACCAGCGGGTCATGAAAGACATCGACGTGACCGGAAGCC
+ACCCACACCTCACGCGGCAGGATGATCGACGAATCGATTCCGACAACGTCGTCGCGGCCAGTCACCACCG
+ATCGCCACCACTGGCGCTTGATGTTCTCTTTGAGCTCAACCCCTAGCGGACCATAGTCCCACGCCGACTT
+TGTGCCGCCGTAGATCTCGCCCGACGGATAGACGAAGCCTCGCCGTTTGGCTAGGTTGACCACGGTGTCG
+ATGACGGGCGCCACGGGGTGGTGCACTCCCTTCGAGGGATCGGGCAGACGCGCGCAGCCCGACACGACTA
+CGCGCAAAACATCAGTCATGGTAGCGATCGGGACCTGGGTCTCCTATTGCCTTTGACATGCATCATCATG
+CATGTGACAGTGGAGGTCAGTGGCAGGTCCTTCCTAATACGGCACTTCTCGAGGTGAAGACTCCAATATG
+GTGACGTCCCCCTCAACGCCGACCGCCGCCCACGAAGATGTGGGTGCCGACGAAGTAGGCGGTCACCAGC
+ATCCCGCGGATAGGTTCGCCGAATGCCCCACGTTCCCCGCACCACCGCCGCGGGAGATCCTAGACGCTGC
+CGGCGAGCTGCTGCGTGCGCTGGCCGCACCGGTGCGGATCGCCATCGTGCTGCAATTGCGTGAATCTCAA
+CGCTGCGTGCACGAACTGGTCGACGCACTGCACGTGCCCCAGCCGTTGGTCAGCCAACATCTGAAGATCC
+TCAAGGCGGCGGGCGTGGTCACCGGGGAGCGATCGGGCCGAGAAGTGCTGTACCGACTTGCTGACCACCA
+CCTCGCGCACATTGTGCTCGACGCCGTCGCGCACGCCGGTGAGGACGCAATATGAGTGCAGCCGGTGTCC
+GCTCTACCCGCCAGCGGGCAGCCATCTCGACACTGTTAGAGACGCTCGACGACTTTCGTTCGGCCCAGGA
+ACTGCACGACGAACTGCGCCGGCGCGGCGAGAACATCGGTCTGACCACCGTCTACCGCACACTGCAGTCG
+ATGGCATCCTCCGGACTGGTGGACACACTGCGCACCGACACCGGTGAATCGGTCTACCGCAGATGCTCGG
+AGCACCATCACCACCATCTGGTGTGCCGCAGCTGCGGTTCCACCATCGAAGTAGGTGACCACGAGGTGGA
+GGCGTGGGCGGCGGAGGTGGCCACCAAACATGGATTCTCTGACGTCAGCCACACCATCGAGATCTTCGGC
+ACCTGCTCAGACTGCCGGAGCTAGGACACCACCGAGGTCGAGCGACCCCACACGCCGAACGTGCAACCAT
+GGCGGCTCCGCCCGGCGTGTCGCCGCCACCAGGGCACGTTCGGCGCACAGCGAGCACACTCCTAGCCAAC
+GAGCGCGCTGCGGATCGTGGCGCCCGTCTCCAGCACCAAAAGGATCAACGTGCGCAACGCGTCGTCGGTC
+AAACCGGTGCCGGGAAAGTTGTATCGCAGCATCACGTCCGCGGTGTTGGACGCGGGCCGACCAGAGCTTC
+GCCGCGCAGCCTTCTCGCTGACCTTTTCCCGCAGGCTCACCGAGCCGAAGTTGATGTCGCGTGCCTGCTT
+GGCCACTTGCTCGGTGAGCCTCTTGGTCAACGGCAGATCCCACGCCAGGATCTGGGTAAGGGACACCAGC
+TCGAGGTCCTCAGCGATGCTCACTACCCGCAACGAGGCAAACGTACCGTCATGGCGAACCGTCAGCGCGC
+CGTCGGGTTCCTCCTCGGCAGGAAGGACATCGCGCAGTATCGATGCCAGCCGGTCCGGTAGGGATGGCAC
+TAGGCGCTCCCGAACCGCCGAGTGCGCGACGCGTATTCCTCGCAGGCCGCCCACAAGTCGCGGCGGTCAT
+AGTCGGGCCAGAGCTTGTCCTGGAATATGTATTCAGCGTAGGCCGCCTGCCACAGCATGAAGTTGCTGGA
+GCGCTGCTCACCCGAGGTCCGCAGGAAGAGGTCAACGTCGGGAATGTCGGGTCGCTGCAGGTGGCGGGCG
+ATCGTGGATTCGGTGATCCGCTCCGGGTTGAGCCTGCCCGCGGCGACCTCACGAGCGATTTCGCGGGTGG
+CTTCGGTGATTTCGGTGCGTCCGCCGTAGTTGACGCAATAGTTGATGGTGATGACGTCGTTGCTTTTGGT
+CATCTCCTCCGCGACCGCCAACTCATTGATGACGCTACGCCACAGCCGTGGTCGTGAACCCACCCACCGG
+ATCCGGACCCCTAGCTTCTTTAGGGTGTCTCGGCGCCGTCGCACCACGTCGCGGTTGAAGCCCATCAGGA
+AGCGGACTTCCTCGGGCGAACGCTTCCAGTTCTCCGTGGAAAAGGCGTAGAGGCTGAGCCACTTGATCCC
+AAGTTCGATAGCACCGCAAGCGATGTCGATCACCACCGCCTCGCCCATCTTGTGACCTTCGGTGCGGGCC
+AGCCCACGTTGGGTGGCCCAGCGGCCATTGCCGTCCATGACAATGGCGACATGGTTGGGCAGCCGGTCGG
+CCGGTATTCGTGGCGCGGCCGCTTTCGAAGTGTGCTGCGGTGGCCGGCAGGGGCCTCCGTAGGGCGCTGC
+CGGCAACTCCGGGAAGACGACGGGCCACGTCGACGTATCAGGAAAGGTCGGGTAGTCGTCGGGGGCCGGA
+GGCAGCTGCGGGAAGTTGCTGGACGTCCGCTTCCGTGCATCCCTAGCCACCGGCTATATCCTGCCCGATC
+AGCGCGGCGCGACGTTCGGCAACCGATCGATCGGCCTGGTAGAACCGCTCCACCAGCGGCAACGTTTTCA
+GCTGCCGTTCCAGATGCCATTGCAGGTGTGCGGCCACCAACCCGCTGACATGGCTGCGGGCCGATTGCGG
+CGCCGCCTCGGCGGCCTCCCAATCGCCGTCGTACAGCGCGGACATCAGGTCTACGACGCCCAGCGGCGGT
+GTGGTCGAGCCGGCCGGACGGCAGTGTGCGCAGACACTGCCCCCGGTCGCGATGTGAAACGCCCGATGCG
+GACCAGGCGTGGCGCAGCGGGCGCACTCGGTCAACGCTGGTGCCCAGCCGGCGATGCCCATGGCGCGCAG
+CAGATAGGCGTCCAACAACAGGTCCCGAGGCCGCTGTCCATCGGCCACCGCCCGCAGCGCGCCCACCGTG
+AGCCGGTGCAGAGCCGGAGCGGGCGCCCGCTCCTCACCGGCCAGGCGTTCGGCGGTTTCCAGTATCGCGC
+ATCCGCAGGTGTAGCGGCCGTAATCGGCGACGATGTCGGTGGCGAACGCGTCGACAGAGACAACCTGGGT
+GACGATGTCGAGGTTGCGGCCAGGGTGCAGTTGCACCTCGATATGCGCGAACGGCTCCAGGCGCGCGCCG
+AATTTGCTGCGGGTGCGTCGAACACCTTTGGCCACCGCGCGGACCAACCCGTGATCGCGGGTCAGCAGGG
+TGACGATCCGGTCGGCTTCGCCGAGCTTGTGCTGGCGCAGCACAACAGCCCGGTCCCGATACAGCCGCAT
+CACAATAGTTTTGCACCCCGCCACGACATCGCGGGTATCCGCGCCGATAGTCTCGTACCCCGTGGTTGGC
+GCTTCTGGGTCGGATGCTGGAGCCATTTCCGGCTCTGGCAACCAGCGCCTGCCCACCCTGACCGACCTGC
+TCTACCAGCTGGCCACCCGCGCAGTGACGTCCGAAGAGTTGGTGCGACGTTCCCTGCGCGCGATCGATGT
+GAGCCAGCCCACATTGAACGCCTTCCGGGTAGTGCTCACCGAATCCGCGCTGGCCGACGCGGCGGCCGCC
+GATAAGCGGCGGGCGGCCGGCGACACGGCGCCGCTGCTGGGCATTCCGATCGCGGTCAAGGACGACGTCG
+ACGTTGCTGGAGTGCCAACCGCCTTCGGCACCCAGGGCTATGTCGCGCCTGCTACCGACGACTGTGAGGT
+CGTCCGGCGCCTCAAGGCGGCCGGAGCGGTGATCGTCGGCAAGACGAATACTTGTGAATTGGGCCAGTGG
+CCGTTCACCAGCGGACCCGGGTTCGGACACACCCGCAACCCCTGGTCGCGCCGGCACACGCCGGGTGGAT
+CCTCGGGCGGTAGCGCGGCGGCGGTGGCCGCCGGCCTGGTTACCGCCGCTATCGGCTCCGACGGCGCCGG
+CAGCATCCGCATCCCCGCAGCATGGACACACCTAGTGGGCATCAAGCCACAACGCGGTCGGATCTCCACC
+TGGCCGCTGCCGGAGGCGTTCAACGGCGTCACGGTCAACGGCGTACTGGCCCGCACTGTGGAGGATGCGG
+CGCTGGTGCTGGACGCCGCGTCCGGCAACGTCGAGGGCGACCGCCACCAGCCACCCCCGGTGACGGTGTC
+CGATTTCGTCGGCATCGCCCCTGGACCGCTGAAGATTGCCTTGTCAACCCACTTCCCGTACACCGGCTTT
+CGGGCCAAGTTGCATCCTGAGATCTTGGCCGCGACCCAGAGGGTGGGCGACCAGCTCGAGCTGCTCGGCC
+ATACGGTGGTGAAAGGCAATCCGGACTACGGCCTACGGTTGTCGTGGAACTTTCTTGCCCGGTCCACCGC
+GGGCCTCTGGGAATGGGCGGAGCGGCTAGGCGACGAGGTGACCCTGGATCGTCGCACCGTATCCAACCTG
+CGCATGGGGCACGTGCTGTCGCAGGCGATTCTGCGCAGCGCGCGCCGCCACGAAGCCGCCGACCAGCGTC
+GGGTCGGCTCGATCTTCGACATCGTCGACGTGGTGCTGGCACCGACCACAGCACAACCACCGCCAATGGC
+GCGCGCGTTTGACCGGTTGGGCAGCTTCGGCACCGATCGCGCCATCATCGCCGCGTGCCCGTCGACCTGG
+CCGTGGAACCTGCTGGGCTGGCCGTCGATCAATGTGCCGGCGGGGTTCACCTCCGACGGTTTGCCGATCG
+GTGTGCAACTGATGGGACCGGCCAACAGCGAGGGCATGCTGATCTCGCTGGCCGCCGAGTTGGAAGCCGT
+CAGTGGCTGGGCGACCAAGCAGCCGCAGGTGTGGTGGACGAGCTAAAACCCCAGTCGGCCAAGCTGTTTG
+GGGTCGCGCTGCCAGTTCTTGGCGACCTTGACCCGCAAGTCGAGATAGACCTTGGTGCCCAGCAGGTTTT
+CGATCTGGCTACGGGCCGCGGTACCCACCTCCCGCAGCCGGGCACCACCCTTGCCGATGACGATGCCCTT
+CTGACTATCTCGCTCGACGTACAGCGCGGCGTGTACGTCGATCAGGTCGTCACGCCCCTCACGTGGACTG
+ACCTCGTCAATCACCACCGCCAGCGAATGGGGCAGCTCATCGCGCACGCCCTGAAGGGCCGCCTCGCGGA
+TGAGCTCGGCCATCAGAACCTCCTCGGGTTCGTCAGTCAACTCACCGTCGGGGTAATACGCGGGGCCGGC
+CGGCAATGCCGCGGCCAGTACGTCGATCAACAGGTCTACCCGGTCGCCGGTCATCGCCGAAACCGGGACA
+ATCTCGGCCGCATTCGTGACGAGTTCGCTGACCGCTACCAGCTGGGCGACCACTTTTTCTTTCGGCACCT
+TGTCAATCTTGGTGACGATGACCACCAGTGTCGTATTGGCAGGGCCGGTCGAACGAAGCTGCTCGACAAT
+CCACCGGTCTCCCGGACCGATCGCCTCGTCGGCGGGGATGCATAGCCCGATGACGTCGACCGCCGCGTAG
+GTTTCGCGGACCAAGTCGTTGAGCCGCTTGCCCAGCAGAGTGCGCGGCCGGTGCAGACCGGGAGTGTCGA
+CGAGGATGATCTGGAAGTCGTCGCTATGCACGATCCCACGAATAGCGTGCCTGGTGGTCTGCGGGCGCGT
+CGACGTGATTGCCACTTTCGCCCCGACCAGCGCATTGGTCAGCGTGGACTTGCCGGTGTTCGGCCGGCCG
+ACCAAACACACAAAGCCAGAATGGAATTCGGTCATGCCGGTTTCCTCGCCGAACGTGAACACAGGGAGAC
+TTTTCCCGCTTTTTTCCGCCGTGAATGCACGTTCGGCGTCATAGCGGGTTACCTGCCCGATCGGTGACGA
+TGATCGCAGCGGTCGGGGCGAGTTCGCGGACGGCGGCAATGCCCGGATCGTCAACGGACCCGGCCACCAA
+GACGGCGGCCTGAAGACCGGTCGCCCCACTGGACACGGCCGCGGCCACCGCCGCCTGCAGACCGGTCAGC
+TCGAGCGCCGACAGGGCCACCGGCGCCGCCGCGTACGTGCGGCCGTCGACATCGCGGACCGCCGCGCCGG
+CACCGGCCTCGGCACGTGCCATCGCCGCCCGTGCCAACACAACCAGCTTTGCGTCCTCGGCATCTAGCTG
+CTCAGCCAGGGTGATCGGCCTCCTCATCATCGGCGCCGTCGGGTTCGGCCGGACTCAGCAACACGGTGCC
+GATTCGTACCCGTCCCCGATGATCGGTGCCACCCTCGGCATGCAGCCGCAGGCCATGCGATATCACCTCA
+GCGCCGGGCAGCGGCACCCGGCCCAGTTCTAGGGCCAGCAGCCCGCCCACCGTGTCGACGTCAAGGTCGT
+CGTCGAACTCCACGCCGTACAGCTCGCCGACGTCTTCGATGGGCAGGCGCGCCGATACCCGGAAACGCTT
+GTCGCCCAAGTCTTCCACCGGCGCCGTCTCGGCCTGGTCGTACTCGTCGGCAATCTCGCCGACGATCTCC
+TCCAGCACGTCTTCGATGCTGACGAGGCCGGCTATCGCGCCGTACTCGTCGACCAGCAGGGCCATGTGGT
+TACGGTCGCGCTGCATTTCCCGCAGCAATGCGTCCAGCGGCTTGGAGTCCGGCACGAACACAGCTGGCCG
+CATCACCCGCGCGACGGTCGTTTCGCGGCCGCCGTTCGTCGAGCAGAACGTCTGCTCGACAAGGTCTTTC
+AGGTACACCACGCCGACGATGTCGTCGACGTTCTCGCCGATCACCGGGATTCGGGAATGTCCGCTGCGTA
+CCGCCAGGGTCATTGCTTGACCGGCTGTCTTGTCGCTTTCGATCCAGATCATCTCGGTGCGCGGCACCAT
+CACCTCGCGGGCTGGGGTGTCACCCAGCTCGAAGACCGACTCGATCATCCGGCGCTCGTCGGCAGCAACC
+ACGCCCCGCTGCTGGGCTAGGTCGACAACTTCGCGCAGCTCGATCTCGGATGCAAACGGCCCGTTGCGAA
+AGCCGCGCCCGGGGGTCAGTGCGTTGCCCAGCAACACCAGCAAGCGGCTGATCGGCATCAACAACCACGA
+GATCAGCCGCAGCGGAAGGGCCGTGGCCAACGAGATGGAATATGCGTTCTGGCGCCCAAGGGTGCGTGGC
+CCCACTCCCACGACGACAAAGCTGGCCAAAACCATGATGCCCGCGGCAAGATACAACCCCCACACCATGC
+TGAAGTGGTATCGGATGAAAACCACCAGCAGCGCGGTCGCGGTGATCTCACAGCTGGTCCGCAGCAACAC
+GACCAGGTTGACGTACCGCGGCCGGTCGGCCATCACCTTACGCAGCGACCCCGCGCCCGGCCGCTGGTCG
+CGTACTAGCTCATCCACCCGGGCCGGAGACACGGTGCTGATGGCGGCGTCAATCGCGGCGAACAACCCAC
+CCAAACCGATCAATACGATCGAGCCGAGCAGCTGGTAGTACCCGGTCAAAGGTCAAAATACCTTGACTTG
+TCGAGCAACCGGCGGTCCTTCTCGTCCTGCCGGTCGTGCTGGTAGGCCTCAACCTGGTCGGCTACCCACT
+CTTCAAGCAACCGGTCCTGCAGGGCGAACATCTCTTTTTCCTCGTCTGGCTCGGCGTGGTCATAGCCGAG
+CAGGTGAAGCACACCGTGGATGGTCAGCAGGGCCAATTCGTGGCCCAGGCTGTGGCCGGCCGCAGCCGCC
+TGCTCAGCGGCGAATTCCGGGCACAGCACGATATCGCCCAGCATGGACGGTCCCGGTTCGGGGGCGTCGG
+GGCGACCACCCGGCTCGAGCTCGTCCATCGGGAAGCTCATCACGTCGGTCGGCCCGGGAAGATCCATCCA
+GCGCATGTGTAGGTCGGCCATCGCCGCGGTGTCCAGCAGCAGCATCGACAATTCGGCGCACGGATTGACG
+TCCATCTTGGCGATGACAAACCGTGCGACACTGACTAGTTCCGCTTCCGAGACGTCGATGCCTGACTCGT
+TGGCTACCTCGATGCTCATAAGATGCTCACGCACCCATCATCGGCGACCGCGGGCGCCGGACGCCCGCCG
+AGCCGCCCGATTCAGCCCCGACCCGGGCTCCTCGTACCGCGCATAAGCGTCCACGATCTCCGAGACCAGA
+CGGTGGCGTACCACATCCACGCTGGTCAGCTCCGCGATATGGATGTCGTCGATGTCTTCGAGGATGTCGA
+CCGCCGCCCGCAGACCCGACCGGGCGCCGCCCGGCAGGTCGATCTGGGTGACATCTCCGGTGACCACGAC
+CTTGGATCCGAAGCCCAGGCGGGTGAGGAACATCTTCATCTGCTCGGCCGTGGTGTTCTGCGCCTCGTCC
+AGGACGATGAACGCGTCATTCAGGGTTCTACCCCGCATGTACGCCAGCGGTGCCACCTCGATGACTCCAG
+CGGACATCAGCTTCGGGATCAGCTCGGGGTCCATCATGTCGTACAGCGCGTCATAGAGCGGTCGTAGGTA
+CGGATCGATCTTTTCGCTCAGCGTGCCCGGCAGAAATCCAAGGCGTTCACCGGCTTCCACCGCGGGTCGG
+GTCAAGATTATGCGGGTCACCTGCTTGGTCTGCAGCGCGTGGACCGCTTTGGCCATCGCAAGATAGGTCT
+TTCCGGTGCCGGCCGGGCCGATTCCGAAGACGATGGTGTTGGCGTCGATCGCGTCCACGTAGCGTTTCTG
+GTTGAGCGTCTTGGGCCGGATCGTCTTCCCCCGACGCGACAAAATGTCTAGAGTGAGCACTTCGGCCGGT
+GACTCGTTGCCTGTGCCGACCAGCATGGCAACGCTGTGGCGCACTACCTCTGGGGTCAGCGACTGGCCGC
+TGGCCACGATCGCAATCAGTTCGGAGATCACCCGTTCGGCTAGCGCGACATCCGCCGGCTCACCGCAGAG
+GGTCACCGCGTTGCCGCGCACGTGCAGGTCGGCACTCAGCGTGCGTTCGAGGGCACGCAGATTTTCGTCG
+GCCGAACCGAGTAAGCCCACGACGAGGTCAGGCGGAACGTCGATGCTGCTGCGAACTTGAGCGTCGGCTT
+GCCGGGCTCCAGCCGCGTCAGCAGCGCGGGTCTCGCGGGACGTCACCTGGCTTCTGATGCCTGCTTTCTG
+GCCTATCGACTGGAACCTGTCGAACTGACGAGTGTTGAAGTTTCATTCTAACGCCGGTCAGGGACGGCGT
+CGGAGCACAACGCACAACGCCGAGCCCGTGCGCGCTCACCTTTATCCGCGATGAGGCCTGTCTGTGTCCG
+CCCGTTCGATGCCGACGAACGGCAGCCACTCTCGGGCCTGCCAGCTGTGCCTGCCGGTGCGCGGCAACAT
+CCCGACCGTGCCCATGCCGGTCCGCCAAGCCGACGATCACCGCTCAAGCTGGGCCAGCCGTGAGCGTCGG
+CGCCCCAATGATTCGGGTGGCGGGCTAGTAATCCCTTCGACGGGGGTTTCCACGGGGTCGCTGGTCTGAC
+TGCCGCGCCATTGGAGGGCGCTGATGGCCACGGCGACCTGGATGATCGTGTGGTCGAGGGGTCGGGGTAG
+GAGTCGTTGGGCGGTTTCGAGTCGGCGTAGCAGGGTGTTGCGGTGGGTGTGTAGTACGTGCGCGGCGCGG
+GAGGCGTTGCATTGTTCGTTGATGTAGGTCAATACGGTGGTGAGCAGTTGAGGGCTGGCCGATTCGAGGT
+CCCCGAGGGTGCTGGTGATGAAATCGGCTGCGCTGTCCGGGTTTTCGGTGAGTACCGCGATCATGTGGAT
+GTCGGCGAAGAAAGCCAGGCGCTGTTGGGATCGAAGCCGGGCCAGCATGCGTTGGGTGGCCAGGGCGTCG
+CGGTGGCTGCGCCGAAACCCGTCGATTCCTCGTGCGGTGGTCCCGACCGCGATGCGGGCATGTGGTGCGT
+GGTCGAGCACCTGGTGGATTCGGTCGGTGTCGAGGGTTGCCGCGTCGCTGACCCATACCCAGCGGGTGGC
+CGCGCTGGCGACCGCGATCAGGGGCTGTGGGCATCCCAGTGCGCGGCCGAACGCGCGTGCGGTGTGGTCG
+AGGTGGTTTTGGTTGTCGTCGGGATCGTCATACCAGATGATGGCGGCGGTGTGGGATCGGTCTAGGGGGT
+AGCCCAGTTTGGCTTCGGCGCTTTGGCGGCTGATGGGGGCGCCGTCGAGGATCAGTTCGACGATGCGGCG
+GTGTTCGGCGTGGACGTCGCGGGTCAGTTCGTCGTATTCGAGCTGCATTTGTGCGGCCAGGCCGGCCAGG
+GTGGCGTCGATGAATTCGGAGGCCGAGCGAAACGGCAGGGTGAGCAGTTCGTGCAGTTCTTGGGGGTCGG
+TGGTGAGTCCGAACGCGATTTCGGTCCATCGTTGCCAGGCGACGTTTTGTCCGACGCGGTAGACGTCCAG
+CGCTGAGGCGTCTAGTCCGCGGCGCACCAGGTCGCGGGCCATGCGTAGCGGGTCGGGGCCGAGGTTTGCC
+GGTACGGGTTGGCCGGGTTTGCGCAGGTTGGCGGTGGCGAAGTGGATCAGGTGGGAGCGGTTGGCGCGGC
+TGACCACTGTTGCTAGGGCGGGGTCGGCGGCGATGGATGGGTGGGCGGCGAGGGTGGCGCGGTCGAGTTC
+GTCGAGCCATTCCGGGGTGGGGTGCAGGGCGACTTTTGCTGCTTGGCGGATGAGTTCACGTCCGCGCGGT
+GTGGGTTTGGGCAATACCACGAGATGAGACTAGTTGCCTAGGTGCGTTGTGCACCACGTTCTGGGGAATG
+TTGGTGAGGTTTACTCCTTCAGCCGTGGTGGACGTTTAGCCGGTGTGGCGCGTTCGGGATTATTGGGATG
+AACGGTTACCCACCGCGGCGGCAGCGGGCCGTGCGCCTGCCGAGTCGTCGACATTTAGCGTTCAGGAGGT
+CTCGATGTCGTTGGTCAGCGTGGCCCCGGAGTTGGTGGTGACGGCGGTACCGGATGTGGCGCGCATCGGG
+TCGTCGATCGGTGCGCCCGACACCGCGGCGGCGGCGAGACCGACCACCAGCGTGCTGGCCGCCGGCGCCG
+ATGAGGTGTCGGCGGACGTCGTGGCGCTCTTTGGCTGGGTCGCCCGTTGATGGTGATGGGGCCGCTGGGG
+CGCCCGAGACCGGGCAACGGCGGGGCCGGCGGCTCGGGTGCGCCCGGCCAAGCCGGCGAGTGGGATTCTG
+ACGACCGGCTACCGGCGTGTCACGTCGCAGTATTCACAGTCGCTCGCTGATGCATCCCAACGAGATGTGA
+GCACACCGACAGCACCCAATGCCACCGCGGCCGCGGTCGATGTCCGCAGCACCGTCGGGCCCAGCCGGAC
+CGCGACGGCGCCGGCATCGGTCAGCGCGGCAAGCTCGTCCGGTGCGATCCCACCCTCGGGTCCAACCACG
+AGCATCAACGAACCAGCTTGCGCCGCAGCGATATCCACAATCCGCTCGGTCGCCTCCTCGTGCAGGACCA
+GCACCGCCGCGCCGGCGGCCACCTCTTCTCGGACACGCTGTACAAGCATTGGCGTCGACAACACGCCGTC
+GACCGGCGGGATGCGCGCCCGACGAGATTGCCGGGCCGCCGAGCGGACCACCGCTCGCCACCGACGCAAA
+CCCTTGTCGACACGCGCCCCGTCCCAGTTCGCCACGCAGCGCGCCGCCTGCCATGCCAGGAACGCGTCGG
+CTCCGGCTTCGGTGGCCAGCTCGATTGCCAATTCGGAGCGTTCGGATTTGGGCAGCGCCTGCACCACGGT
+CACCGGTGGCCGCACGGGCGGGACGCTCCAGCGCCTAAGCACCCGGGCCCGCAGCCCGCCACGTCCGGCC
+TGCTCCACCACACAGCGGGCCAGGCGACCGACACCGTCACCAAGCACCAACTGCTCGCCGGGACGGATCC
+GCCGCACGGTGGCGGCGTGAAATCCTTCGTCGCCGTCTACGACCGCCACCGCACCGGTGTCGGGCAGTGT
+GTCGACGTAAAACAGCATCGCCACCATGTGCGGGCCGTGATTAGCGCCCGGTGAAGGTCTCGCGCAACCG
+GCTGAACAGTCCGCCGGCGGCGGCGTGGGTCGAACGGACCTCGGCCACCTCGCGGTCGCGGCGACCCTTC
+AGCTCGCGCAGCAGTTCGATGTCCTGGTGATCCAGCCGGGTCGGGACCACCACCTCCACGTGAACGTGCA
+GGTCGCCACGCGTGTTGGAACGCAGGTGCGGCATTCCTCGACCGCGCAGCGTGATCACCGAACCTGGCTG
+CGTGCCGGGTGGAATGGTGATCTCGCTCAGGCCGTCCAGGATGGCGTCCACCGTGACCGTAACACCCAGC
+GCCGCGTCGACCATGGGCACCGAAACCGTGCAATGCAGATGGTCACCTTCGCGGACAAAGACGTCGTGCG
+CCTGCTCATGGACCTCGACGTAGAGGTCACCCGCCGGCCCTCCCCCGGGCCCGACCTCGCCCTGAGCGGC
+GAGCCGAACTCGCATCCCGTCGCCGACACCGGCCGGGATCTTGACGCTGATCTCCCGACGGGCCCGGATC
+CGGCCATCGCCCATGCATTGCTGGCACGGGTCGGGGATAACCACCCCGACGCCGCGGCAGGTGGGACACG
+GCCGCGACGTCAACATCTGACCCAACAGCGATCGCTGCACGGTCTGCACCTCCCCGCGGCCACCGCAGGT
+GTCGCAGGGTATCGGAACCGAATCGCCGTTGGTGCCCTTGCCCTGGCACCGGTCGCACAACACCGCGGTA
+TCGACGGTGACCTGCTTGGTGACACCTGTTGCGCACTCTTCGAGATCCAGCCGCATTCGTAGCAGCGAGT
+CCGAACCCGGCCGGACCCGGCCGATCGGCCCTCGGGACGCCGCGCCCCCACCGAAACCCCCGCCAAAGAA
+CGCCTCGAACACGTCGCCGAGGCCGCCGAAGCCACCGAACCCATTGCCGCCCGCAGCGGCGCTCTCCAGC
+GGATCCCCGCCCAGGTCGACGATGCGACGTTTGTCCGGGTCACTGAGCACCTCGTAGGCGACGCTGATTT
+CTTTGAATTTCGCCTGCGCAGCCTCGTCCGGGTTGACGTCGGGATGCAGCTCGCGCGCCAGCTTGCGGTA
+GGCGCGTTTGATGTCCGCGTCGCTGGCGTTCTTGCTCACGCCGAGCAGCCCGTAATAATCGCGTGCCACG
+CTTGATTCTCCTATGCCGCGTCTTTATGCCGCTTCTCAAGCGGCTATCCACAAACCCTGCAGCAGGTGCG
+CGTTCATCGAGCACCCAGGACGTCGCCGATATAAAGAGCAACCGCAGCCACGCTGGCGATAGTTCCCGGA
+TAGTCCATCCGGGTGGGGCCCACCACACCCATACCGCCGTAGACGGTATGGGCGGTACCGTAGGCCGTCG
+ACACCATCGAGGTGCCCACCATCTGCTCAGACGCCGTCTCATGACCTATGCGAACCGTCACCTTGCCGGC
+TTCCTGCTGAGCCGCCAGCAGCCGCAACACCACCACCTGCTCCTCAAGTGCTTCCAATATTGACCGCAGT
+GAACCACCGAAGTCCGCAGCGTTGCGGGTTAGGTTGGCGGTACCGCCCAGCAAAAGGCGTTCCTCGGTGT
+GCTCCACTAGCGACTCCAGCAATACGGTCGCCGCGCGGCCCACGGCGTCGCCCAATCCGCCGGCGCCGCC
+CAGCTGGCTGGCGAGGTCGGCGACCGCCACCGAAGCCGCTGAAAGCTTCTTGCCTTCCAGCGCCTGGCCG
+AGTATTTCACGCAGCTGGGCTAGCTGGTGATCGTCGATGACATCGCCGAGTTCGACGATGCGCTGATCAA
+CCCGGCCGGAGTCGGTGATGACCACCATCAGCAGCCGGGCCGGTGTCAGCGCGATCACCTCCAAGTGGCG
+AACGGTCGACGTTGACAACGTCGGGTACTGCACGACGGCCACCTGGCGGGTCAGCTGCGCCAGCAATCGC
+ACGGCACGGCGCAGCACGTCGTCGAGATCGACACCGGATTCAAGGAAGCTCTGGATCGCCCGGCGCTCGG
+CCGACGATAGGGGTTTGACGTCCTCGAGCCGGTCGACGAACTCGCGGTAGCCCTTCTCCGTGGGCACGCG
+TCCGGAACTGGTGTGTGGCTGAGTGATATAGCCTTCGGCTTCCAGCACCGCCATGTCATTGCGGACTGTG
+GCCGACGAGACTCCCAGGTTATGGCGTTCCACCAGGGATTTGGAGCCGATCGGTTCCTGGGTTGCAACGA
+AGTCGGCGACGATGGCACGCAGCACCTCAAAGCGACGCTCGTCGGCGCTTCCCATCGACTGCTCACCTCA
+CTTCTTACGCTGCCTGACCGGCTTCATTTTACGTTCTCGGCGGCCACTGACCGTCATCTAGCAGGCGTCT
+GCCGATGGTCAGGGGGCGTGTGCCCCGACTAACGTGTCCAGCATGATCTCGTCGGGCTTCAGCCACTCGG
+TAGGGAAGATCCGCCAATGATCTTCAAAGGGGTGCGGGAAGGCAAGCCGTATCCCGAGCATGGACTGTCC
+TATAGGGACTGGTCTCAGATACCGCCGCAACAGATCCGGCTCGACGAGTTGGTCACCACGACTACGGTGC
+TCGCGCTGGACCGCCTGCTGTCAGAGGACTCCACGTTTTACGGTGACCTTTTCCCCCACGCGGTGAAGTG
+GCGAGGCACCACCTATCTCGAGGACGGCTTGCACCGGGCGGTGCGTGCGGCCCTGCGCAACCGCACCGTG
+CTACACGCGCGAGTGTTCGACATGGACGCGTCACCAGGCGGGCGGCGTAGCTGAACAGCGGGCTGAAGCC
+GGCCCGCCAATCAGTTCCCTGCGGCCTGCAGCAACTCCATCGCCGATGCGCGTGACAGCATCCAGCCGCC
+TTGATTCACGAACGTGACGTTCTGCGTGACCGGCGACGAGAGCTTCGGACCCGAGACGGAAACGTCGGCG
+GTGGCCGAACCGGCGGCCGCCGGCTGGATGTTCGTCACGCTGAACGACAGCGGCAGATCCCCGTGCTCGG
+CGGCCTTCTTCAGCTTGTGGTCGGCGATGCGCGCCTCGGTGCCCCCGATGCCGCCCTCGACCAGACTGCC
+CTTGTTCGCAAACGACACGTTGGGATCGGCGAGGCTGTTGAGCAGGCTGGTCAACTGGGCGGCGGTCGGG
+ACGTCAGGGGCGGATGCCGGGTCCAACGGCAGTGGCGCGCCGAAGACGACCGGCTGCATCTGGTATACGA
+CCGGGCCGCCAGCCATGATCGAAGTCACACCGGCCGCAGCGGCGCCGATTGCAGCCGCGGCGGTCAGACC
+TGCGGCGATCGATTTCACCATCTTCATGGTTGTGTTCTTCCGTTCGTTTGCCCGTCGATTGTGCGTTTGG
+TTCAAACTACCGGTGCACGCGCCGGGCAAGTCTGTGTCGTAGCTGTGAGCGAGCGGTCAGTCCTCGGCCA
+TGGCGTCACGCAGGCTCTTCGGCCGCAGATCGGTCCAGTTCTTTTCCACGTAGTCCAGGCAGGCGGCACG
+GCTGGCTTCGCCGTGCACCACGCGCCAGCCGGCCGGGATATCGGCGAACACCGGCCACAGGCTGTGCTGG
+TCTTCGTCGTTGACCAGCACGAAGAATGCGCCGTTGTCGTCATCGAAAGGATTGGTGCTCACCGCTTCTC
+CTTGTGTCGTTGTGTTTGGTCGGCGTAAAGATGCCGGCGCCGAGCACCCGGTCCGACAACAAGCCGAGGC
+AGCTCAGGTTGGGGAACCCGGGCCCCTGGGTGAGTCCGGACAGGGTGGGCAGGAACAGCTTGGGCGTGAC
+GTCGGTGACTGCCAAGTCGTAGCCGATCGCTTCCTGCAGGCGGTCGGCGGTCAGCGGTCCACCCAGTCCC
+AGCTCGAGCAGGTCGAGGGTGTGCTGACTGAACAGTGAGGTGAACCACAGCGGATCGGCGCCCGAGCCGT
+CGATGACGAGATCGAATCCGTGCACGGTCTCGAAGTTCTCGCTGCCCCGGTTGGTGCTCAGCGTCAACCG
+GATCTGCCCCTGACGGCCCACCGCGTGGGCGACCCGGCCACGCAGATGATGGATGCGGTCATCGGCCAGC
+AGCGCTTCCTGCACGGTCGCCGAGAACACTCCTCGGTCGGTGCGGGCCAGCGCGTCGCGCCGTTCGTCGA
+ACGTCAAGGCCGCCCAGTCGGTCGGATCGGAAAACAGTGAGTTCTCGAAGAATCCCTCGCCGCGGGTGAA
+CAGGGTTACCTGCGGGGAGATGACGGTGATGGTTGAGACCCGATGCCGGAACAGCTCGTTGAGCATCGAT
+GCGGCCGTCTCTCCGCCACCGATCACCGCGACCCGCTCGGCGTTGATCCGGTCGTGGCCGGCGGCACGGT
+CCCAGAACTGTGCGATTGAGAGCACGCGCGGGTTTCCGGGCAGTAGCGACTTTTCAGCCTGGCCGGGCCC
+GGTGATCATCAACGCGTCGGCCTGCACGGTGGTCTCGTGGGTGCACAACGCCCAGCGGTCACCGGTGACG
+GCGAGCCGTTCGACCTCGCCGTGGATCACCTTGAGGCCAATGTGATCGGCCACCCAGGCTAGGTACTGAC
+TCCACCTGCGATGGGTGGGCGCCGGGCGGCCCCGGTCGATCCATTCCGCGAACGACGCGGTGGCGATCAG
+ATACGACTGCCAGCTGTAGCGGGTCATCCGCTCGTCCAATTCTGCGTTGCGCCGTGGCACCAGCGCCGAC
+CGGTAGGGAAAACCGACATCCTTTTCTGGGCTGGTGCCCAGCCGGTGGGCTCCGTCGGTCCAGCCACCGC
+TGGCCTGCCAGTTGGCCCCGACCCCGATGCGTTCGACGGCGATCACGTCGGGCACGTCGACCCCCATGTC
+ACGCAGCACGGATGCCTTGGCCGCGACCGCCACCGCCTTGGCTCCAGCGCCCAGGACCGCGAGCGTCGGA
+TTCATGCTGTTATCTCCGCCAGCGCGCCCTGCCACAGTGATTGCAGCGTGGCGACGTCGTCGGCGGACAG
+GATGTCGGGCAGCGTGCGCCACCGCGTGGCTAGCACGGGAGCGTCGGCGGGCCCGAGGAGCGCCGCCAGC
+ACCGTCAGTTCGTGGCGCACCGGCTGTTCGGGTTCAGGCAGTTGCCCCACATCAGCCAGTAGTGCGCGGT
+CGACCGCCAGATCTCCCACCCCGACGTGCAGGCTACCCAGATAGTTCAGCAGCAGCTGGGGTTCGCGGTG
+GGCGCGTAGTCGCTCCGCGGTATCGGCGCGCAGGTACCGCAGCAGGCCGTAATCGATGCCGCTGCCGGGT
+ATCCGCGCGAAGTCGGTCGCGCCGTCGCAGTGGATGCGCAGCGGATAGATCGCGCTGAGCAGCCCGACCG
+TGTCGCTGGTGTCGGCAGTCTTATCGACGTGGACGTCCGCGCGGCCATGCGTCTCCAACGCCAACAGCGG
+TGCTGGTGTTTGTTGACCGCGTTGCCGGCGCCAGGCGGTCACCATCCGCGCAGCGGCGGTAGCCAGCAGA
+TCGGTCATCGACCGTCCCGTCGAAAGCAGCCGCGCGGTCAGATCGGCGTCGGAGATCGACATGGTGATCG
+CTAGCTCACCAACCCGGTCGGTCTGCGGCGCCACCCTGCGGGCACCCAACGGCGGATCGGCGCCCTCGAG
+TTCGGCGACCCAGAAATCAACGCTATCCAGCGCCTTAGCCCGCTGCGCCAGCAGCCGCGACCACTGCCGG
+TAGCTGGTGTTCTCGCGCGCTGGGCTGGGCGCGCGCCCGGCCGCCAGCGCGTGCAGGCCGGCGTCGAGTT
+CACCCAGCACAATCCGCCAGGAGGCTGGGTCCATCGCCAGCACATGGGCGGTCAGCACCAGAACACCGGG
+CCCGTCGGGTTCGCGCAGCCACACCGCCGAGAGCAGTCGGCCGGCCTGGGGGTCGAGACTCGCCAGCACG
+CCAAGAGTCTGCTCGGCCACCGCGGTGACCAGTTCACCGCTGACCCAAACCTCGCTGAGAATGTCCGTTT
+TCGGTTGTGCGACAAGGGCCATCGCATCCCGGTCGAACCGGCACCGCAACACCTCGTGTCCGTCGACGAC
+CGCGGCCAACACGGCATCCAGGCGTTCGCGGGTGATCCGGTCGGGCAACCTGATGACCTCGGTTTGTGCC
+AGCCGGCGCGGGTCGCCGTACTCGTAGAGCCAATGAGTGTTGGGTAGCACCGGGATCGGCTCGCCGGCAT
+CGTTGGCCGGTGCCTGCCATGCGGCATCGGAGTCAATGGCCGCCGCGAGTTCACGGATGGTGTCGCACTC
+CACCATCAGCCTGGCCCGCAACGCAATCCCACGACGGCGCGCGGCCTGCACCACCGACAGCGCCACGATG
+CTGTCTAGACCCATCTGCAAAAAGCCCGCGGTGACATCGACGTTCGAGGTTTCCATGACATCGGCGAACG
+CCTCGGCCAGCACCAGCTCGGTCGGTGTCTGCGGCGGAGTTGCCGGTCCTTCGGTGACATTGATTGCCGC
+CAAAGCGTTTTCGTCGATCTTGCCGTGTGGAGTCAGCGGTAACTCGTCGAGGACGACGATATGGTGCGGG
+ACTAGATAACGCGGCAACCGCTCTAGCAGCATCGCCCGCAATTCGGCCACCGGTGGCGGTTGTGGTCCGC
+CTGCCACATACGCCGTCAGCCGGGGGCCACTGGCATGGCCGCGGGCCGTCACATGGCAACCGTGCACCGC
+ATGGTGGCCGTTGAGCACCGCGGCAATCTCACCCGGCTCGACGCGGAAACCGCGGATCTTCACCTGGTCA
+TCGCTGCGCCCGAGGAACTCCAGCCCACCGTCGGGCAGGCGGCGCACCACATCTCCGGTGCGGTACATTC
+GGCTACCGCGCCCGTTTGGCTCAGCGACAAAGCGCGCCGCAGTCTCGGCCGGGCGGCCGAGGTAACCGCG
+GGTCAACTGGGCGCCCGCCAGATACAGCTCGCCGGCGACGCCATCGGGCACCGGCCGCAGCCAGGAGTCC
+ATGACGTAGGCGCGGGTGGTGCAGGTCGGACGTCCGATGACCGGTCGCGCATGCTCAGCAACGGCGGCGA
+CCACGGCTTCGACCGTGGTCTCGGTAGGCCCGTAGCAGTTGAAGGCCGTCATGGCCGTGCGCGCGCAGTT
+CTGCTGGATCATCCGCCACGTCGCGGCGCCCAAGGCTTCGCCGCCGAGCGCAAGCACCGCCAACGGCGCC
+CGGTCGAGCAGTCCAGCGTTGTGCAGCTGGGCGAACATCGACGGCGTGGTGTCAATCATGTCCAGACCGA
+ATCGGTCGATCGCTTCGACCAGCGCCCCTGCGTCCCGCTGACGATGGTCGTCGACAATGTGCACCGCGTG
+GCCGTCAAGCAGTGCGACCAACGGCTGCCACGCCGCGTCGAAGGTGAACGACCAGGCATGCGCGATTCGC
+AGCGGGCGCCCGAGCCGCTGGGCCGCCGGCCGCAACACGCGCTCGATGTGGTCGTCGGCGTAGGCCGACA
+GCGCCCGATGGGTGCCGATGACACCTTTCGGGGTACCGGTGGTGCCGGAGGTGAAAATCACGTAGGCCGC
+CTGGTCCACCGGCACCGTGATGGCACGGTCGTCCTCGAGTATGTCAGCGCCAACCGAAGCGGCGAACACG
+CCCTCATCGATGACCACCGGAGCCGATGTCTGGCGCAAGATCTCGGCGACACGCTCACCGGGCATCGCCG
+GGTCCAGCGGCACGATCATGCCACCCGCCTTGAGGACCGCCAGCATGGCGGCCACGTAGCGCGGACCACG
+GGACAGCGCGACGGCCACCGGGGTCTCGCGACTCACGTCCGCGCGGCGCAGCCCAGTGGCCAGCCGGTCG
+GCCAATGCATCCAGCTCCCGGTACGTCAGCTGACCATCCGCCCAACTGACCGCCACCGAGTCAGGCTGTG
+CCGCAGCGATTTCGGCGAACCGGGTATGCACCGCGGGTGCCGACGTCGTCACATCCGGCAGGCCGGGTGC
+GGTCGGATCGTGCTCGCCGTCCAGCAGAATGTCGACGTCGCGCAGCGGCCGATCCCACCGGCTGACCAAG
+CGCTGTAACACAGCCAGCACCCGCCTGCCGAGGCTTTCGGGCGCCATCGTGCCCAGCGCACCGTCGAGCA
+CCTCCACTAGCAGCGTGAGCTCACCGGTGCTGCGGTGCGCGGCGACGGTCACCGGAAAGTGCGACAAACT
+CTCTAGCGCCACCGGACGGAACGTCACCCCGTTTGCGACGAACTCCGCGGTGCCCACCACCTCGCCGGGC
+GGGAAGTTCTCATACACCAGTAGGGTGTCGAACATCTCACCGATACCGGCGATGGCACGAAACTCGTTGA
+AACCGAGATAGCTGTGGTCGCGCAACATGGCGAATTGACGTTGTAGGACAGCGCATTGCCCGCCGACGGT
+AGCGCGGGCGTCCAGGCGGACCCGCAGTGGCACCGTATTGATGAACAGGCCGATCATCGTTTCCACGCCG
+GACAGTTCGCTGGGCCTGCCGGACACCGTCACACCGAACGTCACATCGCCACGACCGGTGAATGCTGAAA
+GCGTGGTAGCCCAAGCCATTTGAACAAGTGTGCTGATCGTGACGCCACGGGTGCGGGCGGCATCGGCCAG
+CTCCGCGGTGGCTTCACGGTCAAGGCGCACTTCGGTGCGTCCCGGAATACCCGGCTGCACAGGAGTGTCG
+GCGAGTGCCGGCGATAACAGAGTCGGGCCGTCCAGGCCATTGAGGTGGTCCGCCCACATTGCGCGGCTAG
+CCGTCTGATCGCGGCCGGCCAGCCAGCCGATGTAGTCGCGATACGGCCGCGGCGCTGCCGGCAACGCGGC
+GACGTGACCACCAGCCCGATACAAGGCGAGCAGCTCGGAGACGAACAGCGGCAACGACCATCCGTCGATG
+ACGATGTGGTGCGCGACGATGACCAGATGCCAACATTCGTCCGGTAGTTCGATGAGCAGGAACCGGATGA
+GTGGTCCGCGGCCGACGTCGAAGCGGCGCCGGCGCTCTTCGGCTGCCAGCGCCCCGACCTCACTGGGGTG
+GGCGCGCACGTGACGCCAAAGCACCTCGGCACTGGATGGTATTACCTGCACGGGCCGGCTCAGGTTCCCG
+TGTAGGAAGCTCGCCCGCAGGTTGGGGTGCCGGGTCAGCATCGCGGCAGCGCAGTCGCGAAGCAAGGCGA
+TGTCGAGCGGGCCGGCCGCGTCGGCCGCCATCGCGATCACATACGGGTCGGCCTCTGCGGCCTCAGAGCC
+GGACTCCGCGGCGACCAGTGTCGCCCTAGAAAACAGTCCCTGTTGCAATGGGCTGAGCGCCATCACATCG
+TCGATGGCGCCCCGCGCGTCGGCTCGCGTCACGGCCACTGGTCCCATGACGCGGTCAGGGCCGACAGTTC
+GTCTGGGGAAAGCCCTGATGTGCTCATCGGCGCGTGATGCTTGTCGTCCGGCTCGGCCTCGACGTGAGGC
+TTGGCGTCGACCGCGGCGGCGAGCTCACACAAAACGGGATGCTCGAAAACCATCCGCGCGGTCAGCGGTA
+TCCCGCCATCTCGAGCCCGGGCAGCCACCTGAGTCGCGAGGATGCTGTCGCCGCCGAGGTTGAAGAAGTC
+GTCGTAGCGTCCGACCTCCCCCACCTCGAGCACGTCGGCGAGGATGGCAGCCAGCGCGCGCTCGGTTTCG
+GTGTCGGCGGGCTCGGCCGGCACCGGTGCCGCCTGCGCCGTTGGCAGCCGTTCGATTTCGGCCAGCAGCT
+CCAGTTGGCCGTCGGCCTTCCACACTCCGCGCTCGCCGTTGCGGTAGAGCCGAGAACCCGGTTGCGCGGC
+GAACGGATCGGCAACGAATCGGGTCGCGGTCTCCGATGGCCGGGCCAACCGGGCACCGACGGCGGGACCG
+CCACCGTAATAAACGTCACCCACCACGCCTACCGGAACGGGCTTAAGTGCGTCGTCAAGCAGGTACACCC
+GGGCCGTTCCGGCGCCCGCATTGGACCGGTCCAAAATGCGCCGTCTGGCTTGCGCGCTGACCATCTCGAC
+CTCGCGCAGCGGTTGGTCCGGACGGTCGGCGAACGCCTCGACGACACGGACTAGCCAGTCGGCGAAGCGT
+TGTGCGGTGGCGCGCTCATACAACTCGGTGCGGTAGATGACGTGGCCGCGGTACTCGTCGCCGCAGGCGA
+AGAAGTTGACCGATAGATCGGCTTGCGCGGCATCGAATGTCGGCTCCAGCACGCGCAACGTGGTGTCACC
+GTCGGGCCCGGTGTCGATGACGTGGTCTTGCGGCATTTGTTCGCGAACGTGCACAACAATGTCGAACAAC
+GGATTGCGGGACAGCGACCGCTGGGGGTTGACCGCCTCCACCACCTGGTCGAACGGCAGGTCCTGATGTG
+CATACGCTGCCAGCGCCATCTGCCTGGTGCGCTGCAGCACCTCGCGCAGCGTGGGGTTCCCGCGCAGGTC
+GTTGCGCAACACCACGATGTTGATGAAGAACCCGATGAGCTGGTCCAGGTTGGCCTCGCTGCGACCGGCC
+ACCGGGGCGCCGATGGGGACGTCTACCCCGCCGCCGGCCTTGTGTAACACCACCGCGACGGCGGCCTGTA
+GCAGCATGAACTCGGTGACACCGAGGTCTCGGCTCACGGCAGCCAATTTGTCGCGGATCGCGGCGCCGAG
+ACGAAATTCGACCGCGTCACCGGCACCGCTGAGCAGGGCCGGGCGCGGGAAGTCCGGGCGCAGACCGGTT
+TCGCCTGCCAGGCCCCCCAGCTGGCGGATCCAGTAGTCGCGTTGCGGACCGACGATGCCCGCACCGTCGT
+CGAGTAGCGCCGACTGCCACACGCTGTAGTCGGCGTACTGCACCGGCAGCGGTGCCCACGACGGCCGTTG
+TCCGGTGCTGCGGGCCCGGTATGCGGTCAGCAGATCGGTGAACAACACCCCAGCCGACCAGTGGTCGCCG
+GCGATGTGATGCACCACCAGCGACAACACGGTCTGCTCCGGCGTGCTCAGCAGCGCCGCCCGGATCGGCC
+AGTCGGTTTCCAGGTCGAAAACGTAACCTCGCTCGTTGTTCAGTTCGGCTCGCAGCCACGCGGCGTCGGA
+CCCGGCGGCGCACCGCACCGGCACCTCGGCGGGCGGCTGGATGATCTGGTGTGGCACGCCGCCGATCTCG
+CGGTAGACGGTGCGCAGGATCTCGTGGCGTGCCACCACATCGGTGATGGCCGCCGCGAACGCGTTGGTGT
+CGCAGGGCCCATGCAATGCCGCGGCGAAGGGAATGTTGTTGACGGCGTTGGGCCCGTCGAAGCGATAGTT
+GAACCAGCTACGCATTTGAGACGACGACAATCGCACTGGCCCGTCATGATCCACCCGGGTCAGCCGCGGC
+CTCGCCGAATCCGAATCCAACGTATCGATGTGTCCGGCCAACGCGGTCACCGTGGCGAATTCGAAGATCT
+CCCGCACACCGACATCGACGCCGAACGCGTTGCGCACGGCCGCAACGAGTTTGGTTGCCAGCAGCGAGTG
+ACCGCCGAGGTCGAAGAACGAGTCGTCAGCACCCACTCGGTCGCGGCCGAGCAGCTCACCGAACAGTTGG
+GCAAGGCGCCGCTCGGTGGCGGTCTGCGGCGCGCGGAACTCGGTGTCCGACGCGATCTGCGGTTCCGGCA
+GCGCGGCGCGGTCGATTTTGCCATGCGCGGTGATCGGAATCTCATCCAGCACAACATAGGCCGCGGGCAG
+CATATATTCAGGCAGTGCCGCGGCCACCCGGGCGCGGATGCGGTCGAGATCGACGCCGACATCGGCGGGT
+CCGTCGCCGCCCGCGGCGGGTGTCACGTAGCCCACCAGACTCTTGCCCAGCCGCGGCAGGTCGCTAACCA
+CCACAACGGCCTGCCCGACCGTAGGGTCGACCGCGATGGCCGCTGCTACGTCACCGAGTTCGATTCGGAA
+TCCGCGAATCTTGACCTGCTCGTCGGCACGGCCCACGAACTCGATGTCACCGTCAGCATTGCGGCGCGCC
+AGATCCCCGGACCGGTACATGCGGGAACCGGGATTAAACGGGTCGGCAACGAATCGCTCCGCGGTCAGCC
+CGGCGCGGCGATGGTATCCGTATGCGACATGCGTCCCTCCAATATAGATCTCGCCGATCACACCGGTCGG
+CACCGGCTGCAACGAATCGTCGAGCAGGTGCATGGTGGTGTTGATCTTGGGCCGGCCGATGGGCACGATG
+CGGGTGCCCTGTGGGCCCACCACTTTAAACCGGCTGGCGTTGATCACGGTTTCGGTTGGACCGTAGAAGT
+TGTGCAGCAGCGCATCGAATGTCGCGTGGAACTTGTCGGCCACCTCACCGGGTAGCGGCTCCCCGCCGAT
+GGGTACCCGCTGCAACGTCCGCCACTGGCTCACACCCGGCAGCGACAGGAACAGCCCGAGTAGGGACGGC
+ACGAAATGCATTGCCGTGATGCCCTCGTCGCGCAACAGGGCGGTGAGATATCCAATGTCGGTGAGTCCCC
+CGGGGCGTGGTATCACCATCCGCGCGCCACAGGCCAGCGTGCCGAAGATCTCGGCGATCGAGACGTCGAA
+GCTGGGTGAGGCGACCTGCAGTAGCCGGTCGGTGTCGTCGACGTCGTATTCGCCCTTGAACCAGACGAAG
+TACTCGGCGACGGGGCGGTGTGGCACCGCGACACCTTTGGGCAATCCGGTGGTACCGGACGTGTAGATGA
+GATAGGCCGTGTTGTCTGGCCGTAGCGGCCGGATTCGATCGGCGTCGGTGGGGTCGTCGCTGCGGTATCC
+GGCCAGCTCACGTACTGGCGTGCGCAGCACCAGTTTCGCGTCGCAGTCGGCGAGGATGAAATCCAGCCGG
+TCTTGCGGGTAGCTGGGATCCACGGGCACATACACCGCCCCGGACTTGACCACCCCCAAGGCCGTGACGA
+TCAGGTCCGGCGATTTGTCAAGAAGTACCGCGACCCGGTCTTCGCTGCCTATCCCCTGCTCGATCAGCCA
+GTGCCCCAACCGGTTCGACGCCTCATTGAGGTCGTGGTAGGTGAAGTGTTGGCCCTCATACACCACGGCG
+GTGGCGTCGGGAGTCCGCGTGGTCTGCTCGTTCACCAGGTCCACGAGGGTTTTGACAGGGGTATCGAACC
+GCTCGCCGCGCGACACCTCGCGCAGCCTGGCGGCGTCGCGCTCATCCATCAGCGCCAGCCCCGACAACGT
+GTTGTCGGGGGCGGCCAGCGCATTGTCGAGCAGCACACCGAAGTGTCGAAGCATCTGCTTGGCCAGGGCG
+GGTTCCAGGATCTCCACCAGGTGTTCGGCCTCGACCAGCACACCCGCGCGGTCGAATTCGACCATGAAGC
+CCAACGGCAGCTGCGTGATGTTGCTGCGCAGGTCGTAGCGCTCGCACTCGATGCCTGGCGGGTTGAATCC
+GCCGCCGTCGGGCTCCCGGAAACCGAAGCTGACCCGGGTCATGCGCTCGGCACCGTGCCGGCGATCGGGG
+TTCAGTTCCCTTACCACGCGGTCGAGGTTGATCCGTTGGTGTGCGAACGCCCCGCTGGCGATGTCGCGGG
+TGGCGGTCAGCAACTCCCGGAAACTCATCGCCGATTGCGGTCGCAGCCGCATCGCTACCGTGTTGCCGAA
+ATAGCCGATGGCATCTTCGGTTCCGGCGCCACGGTTGAGCACCGGAGCCGCCACGAGGAAGTCGTCACTG
+TGGGTGTAGCGATGCACCAGGGCACCGAACGCGGCCAGCAGCACCATGTAGGGAGTGCAACCGGTGTTCT
+TCGCCATCGTGGCCACCCGCGCAGCGGTGTCGGCGGGCAGCCGCAACGTGGCGCGCGCGGCACGCCAACT
+GGTCGGCACACACGTTCCGGCTGGGCCGGGAAGTTCCAGCGGCTCTGGCGGATCGGCCATGATCGCGCGC
+CAATAGTTGAGGTCGGCCTCGGTAGTGTCGGGTCCGGATGCGGCCGACGGACGGTGTTCTGGCCCCAGAT
+CGGCCCCTAGGTCAGCTCGCGAGTACGCCTGGGTGAGATCGGTGAAGAACACCCGCCACGAACCATCATC
+CCAGGCGATGTGGTGGGCCACCAACAGCAGCACGTGTTCGTCGGCAGCCGTGCGCACCACCGTGATTCGC
+AATGGCGCGTCGCGGGAAAGCTCGAAGGGAGCGCAGAATTCGCGCTGAGCCAACACCTCCAGGCGCAGCC
+GCTGGGCGCGTTGGGACAGGTCCGTCAGGTCGTATTGTGTCCAGCCGGGGCGAAGATCCGCGTGCACGGT
+CGGCTGGGCGACTCCGTCGTCGCCGACAGGGTAGGTGGTACGCAGTATCCGATGGCGACGGGCGACGGCG
+TTGACTGCGTCGCGCAACCTGGCCAGATCGATGTCACCGGTGATGCGGTAGGACACACAGATGTTGAGTA
+ACGCACCGCTGGGGTCGGCCATCTGCACGAACCACATCCGGGCCTGGCCGTCGGAGAGCCGATCGTCAGT
+GTGCGGGCCAATGTCCTGCGCAGCCGAGGACAGGCCGCGGTCGGCGAGCCTGCGACGCAGCAGCTCCAAT
+CGGGCCTCGTCGAGGCGGGCGCCGATGTCGGCGGTATTAGTCACGCGAAATGTCCACTTTCTGTGCGGTG
+TGTGAGCGCTCGTCGGCATCTTCGAGTTTCGCGACAAGTCCATCACCGGTGATGTCGCCCATGAGCGTGG
+CCAGCGACACCGTCGCGCCGATTGATCGTTTGAGTCGGTTACGCAAGTCCAGTGCCAGCATGGAATCGAC
+ACCGAGATCGAACAGCGATTCCTGCAGGTTCACCTCGCCGGCCTGCGGGATCCCGAGCACGGCCGCCAAT
+TGGGTGCGCACCGCGTCCACGATCGTCAGGTTGGGGTCGGTTGGACCCTCGTACCGTTCGAATTGCCTGC
+TGTCCAACAACATCTGCAACCGGGCCGCGTCGGCGGCGAACACTAGCGGGTCGACAGTGAATTCGTGCAG
+GCTCGCCTCGATCGCCTGCTGGGGCGCCATCTGGCGGAGTCCAGACCGCTCGACGCGGGCGATCGTAACC
+GCATCCGCGATTCCCCGAGCTGGTTCGCCGGCCTTGGGGGCCTGCCATAGGCCCCATTTCACCGCCACGC
+AGTGCCTGCCCTGGGCGCGCAGCTGGGCGGCCATCACGTCGAGCAGCCGGTTGGCCGCCGAGTACGCGAC
+CACCCCGTGTCCACCCCACACCCCCATCACCGAGGAACACAGCAGGGTTCGCACATCCGGGCGCAGCGGC
+CACAGCTCGATCATCTGGGCCAGGCCGAGCACCTTGGCCGCGAAGTTGTCAACGACGGCGGCCGACGTCA
+CCCCCGGTGCGGTACCAGAGATCACGCTGCCTGCCGCGTGCACGATCAACGAGGCGCCGACGCCACCGTA
+TTCGGCTGCAATCGCTGACAACTGGGTGGGATCGGTGATATCGCACGGCGGCGACACGATCACGGTGCCA
+TGTTGCTTTCTGAGCATGGCCACCGTCGCCTGATCCGCGGCGCGCCGGCTGAGCAGCACGATGCGCCGTG
+CGCCATGCTCGGCGAGATACCGCGCGTAGTGCATCCCGATGGCACCCGCGCCACCGGTGACGACGACATC
+GTCGAGCACGCCGGAGTCCAACGACCAGTTCGGGACGGCCGGGGCATCGGCGAGGGTTCGCTCGAACAGC
+GTGTACCCGTTTACCGAGCCGCGTAGCGCGGTCTCACCGAAGCCCCGCAGTACCGCCGTTATGACCGAGA
+CGCCGAGGACCGGGTCCAAGTCCCACGACGGCAAGTCCAGGTGGCTGAAAGTCTGTTCGGGATGCTCGAA
+TCCGATGCTTCGATGCATCGCGGCCAGCGCGGCCTGGCCGGCCGACGGCACCGCGTCCGCTGCGTCGACC
+TGCTCGGCGCCGACGGTGACCAGACATACCGATTGGCAACGGGCACCGATATGCATCGGATAGTCCAGCA
+AACCGGCCCCGACGAGGTCGGCGAGTGCACCGGCGGCCCGGACGGCGTCGGTGTGTTCGAAGTCGGGCGC
+GATCACCAGGATCAACTCGGCGTCCCGCGCAGCACTCAGCTCGGTATCGGGGTGCGAATCAATTGCTGCG
+CACAGTGTTTGAGCCAGCGCGCGGTGAGCACCGAGATCGAGCACTGCGAGGTGACGGTGCCGCCCAGCGA
+CCGGTGTCGACGGCACCATCCGTTCCCACCGCTCAACCGCAATGGTCAGTCCGGACACCGGCGGCAGCGG
+TTCGGGGTGCGCCCACATCGGCACCGCACGCATCGGCGCGTTCGGGAACCCGGACAGATCGACGTCGCCG
+TCGAGTGGGTCACCGCCCAGGTCACCCCACGGGTAGCCAGGGTCAGCGACCGCCGCGCTAACAATATTCG
+CCGACAACGCATCAACAAACCGCTCGCCACGACGTGCCGACCCGACCAGCACAGCGGGACCGTCCGGCAG
+GTTGGCGGCGCCCTCACAGTTCTGACCGATCGCAAACAACAGCGCGGGATGGGCCGATATCTCGATGAAC
+GCCCGTGCTCCACAGCGGATTGCCGATTCGACAGCGCGGTCGAAACGCACCGTATGGCGCAGGTTTGCGT
+ACCAGTAGTCGCCGAAAGTGGTGCCTGGCGCCACCACGTCGCCGGTGGTTCCGCCGATGAATTGCACTGG
+CGCTTCCATAAATTCGGAGTCAGGCAGCTGCTCGCATAATTCATCGCGGAGCGATTCGAGCACGCTGGTA
+TGCACCGGGAAGCCCACGGTGATCCCGCGGGCGAAGTGACCGCTGGACCGGACTGTGTCAACGATGGCCG
+CTACCGCTTGGCGCTCACCGGACACGGCGACGGTCGAGGAGGCATTGACCACAGACAGTTCCAGCCAGCC
+GCCGGTGGTCGCGATCAGCGCGCTCGCGTCCTGTTCACCGATGCCCAGCGCCGCCACCGCATAGCGACCA
+GGCAAGCGGCCCACCACGTTGGCGCGGGCCGCCACCACGGCCACAGCATCCGACAAGGTGATACTTCCTG
+CGAGATAGGCCGCCGCTACTTCGCCGAGGCTATGACCGACTGTTAGATCGGGCAGCACACCGCAGGAACG
+CCATACCTCCGCCAGCGCAACGGCATGGACGAACTGCGCGCCTTCGATCTCGATCTCGCAGAACGCTTGC
+CGCTCATCGGTTCCGGGCGGGGCGATCAGGTATGGCAGCGGCGAGTCGACACCAGCGGCCGCAAATGCGG
+CGGCGCACGTGTCGGTCGCGGTCCGATAGGTCGGCAGCTCGCGGTAGGCGACGGCGCCCATGCCCGGCCA
+ATGACCACCCTGGCCGGGAAAGACGAACGCCTGGCGCGGGGCCGAGCCCAACGACGACCGCGCGATGAGC
+GGATGCTCGCGTCCGGCGGCCAGCGCGCGCAAGCCCTCGGCGAGTTCCAGCCGGTCGGCGGCCCGAAGCA
+CCGCCCGATGCCGACGGACCCGTCGGGTCTTGCGCAGCTGCCGAGCCACTTCGGTCACGGTCGTAGCCGG
+AAAGCGCTCGAGGTAGTCGGCGATGGCCCGAGCGTCCGGCCCGATCAGTTCCTCGGCATGGGCGCTGAGC
+AAAACCGCAACCCGCCCATCGGGCAGCTGTTTGGGGGCCATCACACCTCCCCACACTCGGGGCCACGCTC
+GGGCGCGGAAACGGTGTCCGGCATCGAAACGATCACGTGGCTATTGGTACCGCTCATCCCGAACGCGGAC
+ACCGCCGCGGTGCGCCATCCGTCAACGGCCCGCCACGGCGTGAGTTTGTCGGCCAGCCGCAGACCCTGTT
+TCTCCCAATCGATTTCGCGGCTGGGCTCGTCGACGTGCAGTGTCGGCGGGATCGCGGCGTGCTGGGCGGC
+CAGAATGACCTTCACAAGGCCCAGCCCGCCCGCCGCCGCCTGAGCATGCCCGATGTTTGACTTGACCGAT
+CCCAACAGCGGCCCGCGTCCGGCCGGGGCGGTGCCGTAGCTGGCTGCCAGTGACCGCAATTCGGTGCGAT
+CGCCGAGCCGGGTCGCGGTGCCGTGCCCTTCGACCATCCCGACATCGGCGGGCACAACTGCTGCCTGCGC
+GATGGCGCGCCGGAGCAGTCGCGTTTGCGCGTCGCCGCTGGGCGCGGTCAGCCCGTCGCTAAGTCCATCG
+GAGTTCAGGCAACTGGCACGCACCTCGGCGAGGACACGACGCCGGTCAGCGGTTGCCCGCGACCGGCGCT
+GCAGGAGGAACATGGCGGCGCCCTCTGCCCAGGCGGTTCCGCTGGCGTGCGCGCTGTAGGGCCGGCAGTG
+GCCGTCGTCGGATAGCGCGTGCTGCTTGGAGAACTCGACGAAATAGCCGGGCGTACCCATCACGCACACG
+CCGCCGGCGAGTGCCAGGTCGCAGTCGCCGGCCCGGATAGCTTGAACCGCGGTGTGAAAGGCCGCCAGCG
+CCGACGAACACGAGGTATCGACGGTCAGCGCCGGCCCGGCCAGGTCAAGGGTGTAGGCGATGCGCCCGGA
+GATGACACCCAGCGACGTCCCGGTGATCAGATGGCCACTGTGGTGGGAGAATTCGGTCAAAGCGGGACCG
+TATTCGAGCGCCGAGGCACCGACATAACAGCCCACATCGTGACCGGCCAGGTCATCGGGATTGATCCCGC
+TGTTCTCCAGGGTGCGCCATGCTACTCGCAGCCCCACCCGCTGCTGCGGGTCCATCGCCGTCGCCTCGCG
+CGGTGAGATGCGGAAGAACTCAGGATCGAATGTAGTTGCGCTGGAAAGGAATCCGCCAAGGTTGTGGATC
+GGTTTGAATCCGTTTCGACGCGACCCGTCGAACAGCTCGCGAAGTGCCCAACCTCGATCGGTGGGGAACG
+GTCCGAGTCCCTCGCGCTGTTCGGAGAGCAGTGTCCAGTAGTCGTCGGCGGTTTCGACACCACCGGGTGC
+CTCGATGGCCAGCCCGACGATGACGACCGGGTCGTTATCGGACATCGGCACTCACCATCCGGGCCACGGC
+GTCGAGGTGATCGTTGAGATAGAAGTGACCACCATCAAAGTGCGACAGCGTGAAGCGACCGGAGGTGTGA
+GTCTCCCAACTGGTCAACATCTCCCGGCTGATGCGGTGGTCGCGGTTGCCGCCGACCGCGTGGATGTTGG
+CGCGGATGCGCACGTCGGGTGGACATGAATAGCCGCTGAGGGCCCGATAGTCGGCCTTGACCGCCGGCAC
+CAGCAGTTCAACGAATTCCTCGTCCTCGAGCAGCACGGGATCGGTGCCGCCAAGATCCACCATGTCGGCC
+AGGACGTCACGGTCGGCGGTCGGCAACGGTCCGGACGCGGCCACCGTCGACGGAGCCTGACCGGAGGAAG
+CCCACAGTGCACGTACCGGCACGCCATTGCGCTCGGCGAGGCGAGCGAACTCGAAGGCCACTATCGCACC
+CATGCAATGGCCGAACAGCGTCAGCGGAGCCGTCAGGTGCCAGTCGCCCGCCTCGAACAGCTCGAGCGCC
+AGCGCCTCGATGCTGTCTGCCGCCGGGTGGCTGCGCCGGTCAGCCCGCTGCGGGTACTGCACCACGAACG
+TGTCAACGTCGTTGGCCACTAACGATTTTGCCAACCACCGGTAAGCCGCGGCAGCGCCGCCGGCGTGTGG
+AAACACCAGCACCGCGCCGGGCTTGTCAGTACCGGTGAACCGCTTCACCCACGGTTTGAAGGCTGGCTGT
+GCGGGCTGCTCGATCGGATCGAGCGCCGCCATCACGTCGGCACTTGTCATATTCGCGATTTCTAAGTACA
+CCTCGGCGACCAGTTCGAGTCGGTCGGCGTTGGCTTCCCGACCGGTGAGCAACTGGGCCAACGCGGCAAT
+GGTCCTGGCGGCAAACATGTCGGCGACCATCAGGCTCGGCGAATCCAGCCACCGCCGGATACCGGCGACG
+ACCTGGGTCGCAAGCACGGAATCGCCGCCCAGGGCAAAGAAGTCGTCGTGCACGCCCACGGCATCGTTGG
+CACGGCCCAGGATGTCCGCGACGATGCGGCGCAGTGCCCGCTGAAGCACCGTTCGCGGCGCCGCATAGGG
+TGCCGATCTGTCGCCAGACCGCTCGACCTCGGCGGCAAGCAGGGCGCCAACCTCCGCGCGGTCGATCTTG
+CCGCTGTCGGTAAAGGGGATGCGGTCTAGCAGCGTGACGTGGCGCGGAATCATGTGCGCGGGCACCAGAT
+CGGCGAGCTGCTGTCGAATCGACTCCGCGGTCACGCCGGCATCGTCGACGCAGACCGCCGCGGCCAGCAC
+ATCGGACCCGCCAGGAAGCACGGTGGCCGCCGCCGCGTGCACACCGGGCAAGCGCTGCAGCGCGGCTTCG
+ATCTCGCCGAGTTCGACGCGGTACCCGCTGATCTTGACGCGGTGATCGGCACGGCCGACGAACTCCAGGG
+TGCCGTCGTGCCAGTAGCGGGCCAGATCACCGGTGCGATACCAGGTGCGGCCGTCATGCTCGACGAAGCG
+CTCCGCGGTCAGCTCGGGACGGCCACGGTAACCCCGGGCGATTCCGCGACCGGACACCCACAACTCACCG
+GCCACCCAATCGGGGCAGTCGTCGCCGCTGTCGGCCACTACCCGGCAGGCGTTGTTGGGAAACGGGACGC
+CGTATGGCACCGAGGCCCAGTCCGGTGGCAGATTGGCCGCGTCCTGGACCTCGAAAATGGTTGCGTGGAC
+CGCGGTTTCGGTGGCTCCACCCAACCCCGCGAACCGTGCGCTCGGCGCTTGCACCTGCAGGCGGCGGGCC
+AGGTCGGGACGCACCCAGTCGCCGCCGACGGCCACCGCTCGCAGCGACGACAGCCGGCCCCCGCCGACTT
+CGAGCAGCATGTCCAACCAGCCCGGCATGAAATTCAACGCCGTGACCTCGTAAGTGTCGATAAGCCGGGC
+CCAGGCGTCGGGATCGCGGCGCTGCGCTTCGTCGACCACCACGATCGCTCCGCCGGAGCGCAGGGCGGCG
+AAGATGTCCAGCACCGACATGTCGCACTCCAGCGTCGCCAGGGCAAGCCAGCGATCTGCGGCGCCTAGCT
+CGAAGTGCCGGATGAAGGTCTCCACGGTGTTCATCGCGGCGTCGTGCGCCACCTCGACACCCTTGGGTTC
+CCCGGTTGAGCCCGAGGTGAACAACACATAGGCGAGCGCGGTGGGATCGCTAGGCCCGGGCACGAATTCT
+GCCGGCGCGGCGGCAAGCACGTCAGCCAGCAACAGCGTCGGGACCGGCACCCGCACTTGGCATGGCGGGC
+CGCAAACGAGCGCTAAGTTGACCGAACCGGTCGCCAGGATGCGCTCCGCGCGGTCGCGGGGCTGGTCGAC
+GCCGATCGGCAGATAGACCCCGCCGGCGGCCAAAATCCCCAGCACAGCCGCCACTTGTTCGCCCGTTTTC
+GGACCCAGCACCGCGACGGTGTCGCCGACTCGTAGGCCCGCAGCACGCAGCGCCGCGGCCACCGCCGATG
+CCTGGTCGCGCAGTTGGGCGTAGCTCAAGTCGCCGGAACTGGCGAACACCGCCGGCGCGTCGGGCTGCTG
+TTGGGCCTGGCGGAAAAACCCGTCGTGCAGCGCCTCGGTGCTGGGGGCGGCGGTGCGACCGTTCAGCGCC
+GCGCGCACCGCGCGTTGCGCGGCGGGTAGCGCGGACGGGCTCGGCGCATCCCAGGCGTCGTCCCCGGCGG
+CCAACCGGAGCAATTCGTCGACCTGGTGGGTGAACATGGCGTCGATGACGCCGGGTGCAAAGACCCCCTC
+GCGGACATCCCAGTTCACCAGCACACCGCCGTCGAACTCGGTGACCTGGGCGTCGAGCAGCACCTGGGGC
+CCCTGCGAAATGATCCATCCGGGTGTGCCGAATTGCTCGGTGACGTCCGGGCAGAAAAGGTCGCCGAGCC
+CCAGCGCGCTGGTGAATACCACCGGTGCCAGCACCTGGGTGCCACGGTGGCGGCTGAGGTCACGCAGCAC
+AGACAGCCCGGGGTATGCACTGTGGCCTGCGGCGCTGCGCAGGGCTTCCTGCACCGCCTGCGCCCGCGCC
+GCCGCCGTGCGCGCACCGGTCAGATCGACGTCGAGCAACAGCGAGGAGGTGAAGTCACCGACCAGCAGGT
+CGACGTCTGGATGCAGGGCCTGGCGACTGAACAACGGCAGGTTCAGCAGGAACCGCGACGACGCTGACCA
+ACGCGCCAGCACGTTGGCAAAGGCCGCGGCCAGCGTCATCGCCGGGGTGATGCCGCGGGCCCGGGCTCGG
+GCGAACAACGCGTCGCGGGTCTGCGGGTCTAGCCAGTGCCAGCGCCGGGTGCTGCGGCGCCGGTCGCGTT
+CGCCGCCGGCCCGGGTAGGCAGCGCGGGCGGATCCGGCAGCTGCGGGATGCGCTGCGCCCACCAGTCCCG
+GTCGGCGTCGCGAACCGGTTGGGGCAGCGTCTCCTCCGCCTCGATAGCCTGCCGGTATTCCTGGTAGGTG
+TAGCCCAGTGCCGGCGGTTCACGGCCGTCATAGAGGGCCGCCAGGTCGGCCAGCAAGATGCGGTAGCTCA
+TCGCGTCAGCGGCCTGCATGTCCAGGTCGACATGTAGGCGGGTGCGCTCCCCCGGTAATAACGTCAACGC
+AAGTTCGAATACCGCACCGTCGAGCTGCTGGTGCGATTTGGCGTCGCGGATCCCCGCCAACCGCTGATCG
+ACGACATCCGGGGCCACGTGACGCAGGTCGGCAACACTGATGGGAAAGTCGCGAGATCCCGCCGCCGGCG
+GGATGCGCTGGGTGCCGTCGGGCAAGAACTGCACCCGCAGCATCGGGTGCCGCAGCGCCAACCGGGTGGC
+CGCCGCGCGGAGCCTGTCCGGATCGACCCGGGCACCATCGAACTCGACGTAGAGGTGCCCAGCTACCCCG
+CCGAGCTGTTGGTGGTCGTGGCGGCCGACCCACATCGCGTGCTGCATCGGCGCCAGCGGGAAAGGCTCGC
+CTTCCTGGGATAACCCGGCATCCCCTGGTGCGGCAACTGCCGTGGGCGCGACGCCGGTGCCGGCGGACAC
+CAGTTGGGACCAGGCCTCGATTGTGGGTGTGGCGGCCAGTGTGGCGAAGTCGACGGCGATGCCCTTCCGG
+CGCCAGCGCCCCACCAGCGACATCATCCGGATCGAGTCCAGGCCCTGACCAACGAGGTTGGCGCCGGGGT
+GCAGAGCATCGGCGCGGACACCGAGCAACTCTGCGACCTCGGCGCGAATGATCTCCGAGCACGCCGTAGC
+ATGCACCACAAACCCTCCCCTGTTAGCACAGGCTGCCCTAATTTTAGTGGTTACCCTATCTTCGAACCAC
+GCACCTGCGCTACCAGCCCCCCTGTTAAGGAGCCCACATGCCACCGAAGGCGGCAGATGGCCGCCGACCC
+AGTCCCGACGGCGGACTGGGTGGCTTTGTACCGTTCCCCGCGGATCGGGCCGCGTCGTACCGGGCGGCCG
+GCTATTGGTCGGGGCGAACCCTGGACACCGTGCTCTCCGATGCCGCGCGGCGCTGGCCTGACCGCCTCGC
+GGTGGCCGACGCCGGTGATCGTCCCGGCCACGGCGGCCTCAGTTACGCCGAACTCGACCAGCGGGCCGAC
+CGGGCCGCCGCGGCGCTGCACGGCCTGGGCATCACGCCAGGCGACCGGGTACTGCTCCAGCTGCCAAACG
+GCTGCCAGTTCGCGGTTGCCCTGTTCGCGTTATTGCGGGCGGGAGCGATCCCAGTGATGTGCCTGCCCGG
+TCACCGCGCCGCCGAATTGGGCCACTTCGCCGCCGTCAGCGCGGCCACCGGGCTGGTGGTCGCCGATGTG
+GCCAGCGGGTTCGACTATCGGCCGATGGCGCGCGAACTTGTTGCCGATCACCCCACCCTGCGCCATGTCA
+TCGTCGATGGCGATCCGGGACCGTTCGTGTCGTGGGCGCAGCTGTGCGCCCAGGCCGGCACCGGTTCGCC
+GGCACCGCCGGCCGATCCCGGATCGCCAGCGCTGCTGCTGGTCTCCGGCGGCACCACTGGCATGCCCAAA
+CTCATTCCACGCACCCACGACGACTACGTGTTCAACGCGACGGCCAGCGCCGCACTCTGTCGGCTTAGCG
+CCGACGACGTCTATCTGGTGGTGCTGGCCGCCGGCCACAATTTCCCGCTGGCCTGCCCGGGCCTGCTCGG
+CGCGATGACCGTCGGGGCCACCGCCGTGTTCGCCCCCGATCCCAGCCCGGAGGCCGCCTTCGCCGCCATC
+GAGCGCCACGGTGTCACCGTCACCGCGTTGGTTCCGGCACTGGCCAAACTGTGGGCCCAATCCTGTGAGT
+GGGAGCCGGTGACACCGAAGTCACTGCGGTTGTTGCAGGTTGGCGGGTCCAAGCTAGAACCCGAGGACGC
+TCGCCGGGTACGCACCGCGCTCACCCCGGGCCTGCAGCAGGTGTTCGGCATGGCGGAGGGGCTGCTGAAC
+TTCACCCGCATCGGCGACCCACCCGAAGTGGTGGAGCACACCCAGGGGCGGCCACTATGCCCGGCCGACG
+AACTGCGCATCGTCAACGCCGATGGTGAGCCGGTGGGGCCCGGGGAGGAAGGCGAACTCTTGGTGCGCGG
+GCCCTACACGCTGAACGGCTATTTTGCTGCCGAACGCGACAACGAGCGCTGCTTCGATCCGGACGGCTTC
+TACCGCAGCGGCGACCTGGTCCGCCGCCGCGACGACGGCAATCTGGTGGTCACCGGGCGCGTCAAGGATG
+TCATCTGCCGTGCGGGAGAAACCATCGCCGCCAGCGACCTCGAAGAACAGCTGCTGAGCCATCCGGCGAT
+CTTCTCGGCCGCGGCGGTGGGACTACCTGACCAGTATCTGGGGGAAAAAATCTGCGCTGCAGTCGTTTTC
+GCTGGAGCTCCGATTACGCTTGCGGAGTTGAACGGCTACCTTGACCGGCGTGGTGTGGCCGCGCATACGC
+GACCCGACCAGCTGGTCGCGATGCCGGCGCTGCCCACAACGCCGATCGGGAAGATCGACAAACGAGCGAT
+CGTCCGCCAGCTCGGCATCGCGACGGGTCCCGTGACGACCCAGCGCTGCCATTGACTGACGTCAACAAGT
+TGAATTGACTGCGTTGCATGACCGACGGTGTTCCGGCCCGCGGGTCACTTCGATCACGCGGCGCGGTAGC
+GGTGAGCTCGATGGTGTTGCGGCCCATCACCGGGGCGATTCCGCCAGACGGGCCGTGGGGGATATGGGCC
+TCGCGCCGGATCATCGCCGGACTCATGGGCACGTTCGGGCCCTCGCTCGCGGGCACCCGAGTGGAACAAG
+TCAACTCCGTTCTGCCGGACGGACGCCGGGTCGTCGGCGAATGGGTGTATGGACCGCACAACAACGCGAT
+CAATGCCGGACCCGGTGGCGGCGCCATCTATTACGTACACGGCAGCGGTTACACGATGTGTTCGCCCCGA
+ACCCACCGGCGGCTGACATCCTGGCTGTCGTCATTGACCGGGCTACCGGTATTCAGTGTCGATTACCGAC
+TGGCGCCGCGCTACCGTTTCCCGACCGCGGCCACCGACGTGCGGGCAGCCTGGGATTGGTTAGCGCACGT
+ATGCGGCTTAGCCGCGGAGCACATGGTGATCGCCGCGGATTCCGCGGGTGGCCATCTGACCGTCGACATG
+CTGCTGCAACCCGAGGTCGCCGCCCGACCTCCGGCGGCGGTGGTGTTGTTTTCGCCGCTGATCGACCTCA
+CCTTCCGGCTGGGCGCCAGTCGTGAGCTGCAGCGCCCCGATCCTGTCGTGCGCGCTGACCGTGCGGCCCG
+GTCGGTTGCGCTGTACTACACCGGAGTCGATCCCGCCCACCACCGGCTGGCGCTCGATGTTGCCGGCGGG
+CCACCGCTGCCACCGACGCTGATCCAGGTGGGTGGAGCCGAGATACTCGAGGCCGATGCGAGACAACTCG
+ATGCCGACATCCGCGCTGCCGGCGGCATATGCGAGTTGCAAGTGTGGCCTGATCAGATGCATGTGTTCCA
+GGCCCTGCCGCGGATGACGCCCGAAGCGGCCAAAGCCATGACCTATGTTGCCCAGTTCATCCGCAGTACA
+ACAGCACGTGGAGACCTCTGAACGTTACTGGCGTGCAACCAGATAAGGCGTCAATGTGGATAGCTTTTCG
+CAAGTCTCCTCGAATTCGCGCTCTGGCTCCGATTCTTCGATGATGCCGGCGCCGGCCCGCAGCCAAGTCC
+GCCCGCCGACCTGGTATGCCGCCCGCAGCGTCAGCGCGGCGTCTAGCCCGCCATCCGCCGAAAGCATCAC
+CACCGCACCGGAATACAGCCCACGTGGGCACTCATCGAGGCGAAAGATGGCCTCAACGCCAGCTGCTTTC
+GGGATTCCGGATGCAGTGACAGCAGGAAAAAGGGCTTCCAGGGCGGCCATCCGGTCGCTCGATGGATCCA
+ACCGTGCTCTGATGGTGGAGCCGAGGTGCTGCACACTGCCGCGCTCGCGCACCGTCATGAAATCGATGAC
+CGCAGCACTCCCTGGTTCGGCGATGTCGGTAATCTCCTCAAGCGAAGAGCGCACTGAAATGGCGTGCTCG
+ACAATTTCTTTGGAGTTTGATTCCAGGTCATCACGAGCCAGTCGGTCAATGGCGGGACCACGGCCCAAGG
+CGCGGGTACCGGCCAACGGCTCGGTGATCACCACTCCGTCGGCGCGCACCGCCGTGACGAGTTCGGGGCT
+GTAACCCAGAGCACGGATTCCGCCCAACTGCAACAAAAACGACCTCACCGGGGTGTTGTGCCGACGCCCC
+AGCCGGTAGGTCAACGGAAAGTCGATCGCGAAAGGCACTTCGACACAACGGGACAGAATCACCTTGTGGT
+AGCGGCCGGCAGCGATTTCATCGACGGCTACCGCCACCCGACGGCGGAAGCCGGATGGATCGTCGGAGAC
+GTCGACGGAGCGGGACTGCGGCACCTCTCGCACCCCGGTGGCGAGTAATCGGTCGATGGCCTCGCGGTGG
+CGAATCCCAGCATCGAACAGGCGAATCTCCTTTTCGCTCACCATGATCCGGGTTCGGGGCGAAAACACCC
+GGGCCAGTGGGGTGTGCGGCGCCAGCCGCTGCTGCAACCCATAGCGGTGCACGCCGAATTCGAAGGCGAC
+CCAGCCAAAAGCTTGATCGGTTTCCAGCAACAGCCGATCGACGGCTTCGCCCAGGGCCGCTCCCGGGCGA
+CCCGACCATTGCTGTCGCCGCGTAACGCCATCACGGATGACGCGCAGTTCGTCGCTGTCTAGCTCCACCA
+TCGCCTGCACACCGGCGGCCAGGACCCATTGGCCGTCGCACTCGTAGAGCAGGTAATCCTCGTCGACGGA
+CTCGGTAACCACCGCCGCCAGCTCCGCTGCCAGGTCGGCGGGGTTGACACCGGCGGGCATCGGGATGGAC
+GACGACGCGGTGCTGACGGCGCCTGTCGCGACGCTGAGCTCGGACACAGCTAGTAAATGTAGCCTAACCT
+ACTTAATGGGTCGCAGCCCCCCGGGGTCGTCGCATGTCCAACGTGCTCGACTGGAAGAAAATGCTCGTCG
+GGAGCAAATGGCACCAGCCGGGGCGGCGACAGGACCCACCCACGGCCGGACGGTCCGCGGACTGCGTTTC
+GCAGCGTAATCATTTCCGCAGGCAGAGGCGGTCGCGGCCGGTGCTCGCCGGTTACCATGCCCGCCAACTC
+ACGCACACGAAATCGTGAAACCTTTGCCAACCGTTTACTGGCTAGCTACAAAGCAAGGTTTTGCCTTCGC
+CGGAATTCTCCTAACATCACTCACTAACCACGTAGACCATCCGGTCGACGACGTAGTCGCGGTACGCGTG
+GCTCGCCAAGCTCGGTATGTCCGCTGGGTCTGCCCAGGCATCGCCCGATCGTTAGCCAGTCAACAGAGAG
+GACCCGACGATGTTCGTAATCCGGCTCGCCGACGGCGAAGAAGTCCACGGCGAGTGCGACGAGCTGACGA
+TTAACCCAGCAACCGGCGTCCTCACGGTCTGCCGGGTCGACGGGTTCGAGGAAACCACCACGCACTACTC
+GCCGTCGGCGTGGCGGTCGGTGACACACCGCAAGCGGGGGGTCGGCGTTAGACCATCCCTGGTCTCAACG
+GCTCAATAAGCCCGAGCCACACTTTCTAGATTCGACTTGATATTCCTGGTCGCTCCCCTGACGCTGGGTG
+CTTCCTGGATCGCCGCACCAGGTATGGGAGGCGCCAATGCTGCATGAGTTCTGGGTGAACTTCACTCACA
+ACCTGTTCAAGCCGCTGCTGCTGTTCTTCTATTTCGGGTTCTTGATCCCGATCTTCAAGGTGCGATTCGA
+GTTCCCCTATGTGCTCTACCAGGGCCTAACCCTGTATCTGCTGCTGGCCATCGGTTGGCACGGCGGCGAA
+GAACTCGCCAAGATCAAGCCGTCCAACGTCGGCGCCATCGTTGGGTTCATGGTGGTTGGCTTCGCCTTGA
+ACTTCGTGATCGGCACCTTGGCATACTTCCTGCTGAGCAAGCTGACCGCCATGCGCCGGGTCGACAGGGC
+GACGGTCGCCGGCTATTACGGGTCGGACTCGGCAGGGACATTTGCCACCTGTGTAGCAGTCCTGACCAGC
+GTCGGCATGGCCTTCGACGCCTACATGCCGGTCATGTTGGCCGTCATGGAGATCCCCGGCTGCCTGGTGG
+CGCTGTATCTGGTGGCGCGGCTGCGGCACCGAGGGATGAACGAGGCGGGGTACATGGCCGACGAGCCCGG
+CTACACCACAGCGGCGATGATCGGAGCGGGGCCCGGCACGCCCGCCCGGCCCGCTCACAGCGACAGCCTC
+ACGGCCCAAGCCGAGCGCGGCATCGAAGAAGAGTTGGAGCTCTCGCTGGAAAAGCGCGAGCATCCAAATT
+GGGATGAAGACGGCGTCAAAGACAGCGGCACGAATGCGTCGATCTTCTCACGCGAGTTGCTGCAGGAAGT
+TTTCCTCAACCCGGGGCTCGTTCTCCTCTTCGGCGGCATCGTCATCGGCCTGATCAGTGGACTGCAGGGA
+CAGAAGGTCCTACACGACGACGACAACTTCTTTGTGGCGGCATTCCAGGGCGTACTTTGCCTGTTCCTGT
+TGGAGATGGGCATGACGGCGTCGCGTAAGTTGAAGGATCTGGCGTCGGCGGGCAGTGGGTTCGTTTTCTT
+CGGCCTGCTGGCACCGAATCTGTTTGCGACGCTTGGGATCATCGTGGCCCACGGCTACGCATACGTCACT
+AACAACGACTTCGCGCCGGGCACATATGTGCTGTTCGCGGTGCTCTGCGGCGCGGCGTCCTATATCGCCG
+TCCCGGCCGTGCAACGGCTTGCGATCCCCGAGGCCAGTCCGACCTTGCCGCTGGCCGCGTCGCTGGGTTT
+GACGTTCTCCTACAACGTCACGATCGGGATCCCGCTGTACATCGAGATCGCCCGCATCGTCGGGCAATGG
+TTCCCTGCCACCGGGGCTTCGATCGGTTAGCCCAGCAGAGTGCGCACCACCGCGTCGGCCAGCAATCGCC
+CCCGGCCGGTGAGGACCAGTCGGTCGCCGTGGTAGTCCAGCAATCCGTCGGCCAACACCGCCTCGGCACG
+TTCCCGTTCGGCAGCCCCTAGCCGGGCGAGCGGTAGCCCCTGGCGCAGCCGGACCTTCAGCAACACGTCT
+TCGGTGTGCAAAGCGTCGGCGCCCAGCTGCTCGAAGCCCGCTACCGGCAACGTCGCCCCGGCCAGTATCT
+CGGCGTAAGTGTTGGGGTGCTTGACATTCCACCAGCGTGTCACGCCAATGTAGCCGTGCGCGCCCGGACC
+TGCGCCCCACCACTGGCCACCGTCCCAATAACCCAGGTTGTGCCGGCACTCGCCGCCCGGTCGACACCAA
+TTGGACACCTCGTACCAGGCAAACCCGGCCGCCGACAGCCGAGCATCGACCAACTCGTAGCGATGCGCCA
+GCACGTCGTCATCGGGCGCGGCCAGCTCACCACGCCGAACCCGGCGAGCCAGTGCCGTGCCGTGCTCGAC
+GACCAAGGCATACGCGGACACATGATCCACACCGGCCTGCACCGTGGCGTCCACTGAGCGCACCAGGTCG
+TCGTCGGACTCCCCCGGGGTTCCATAGATCAGGTCGAGGTTGACGTGTGTGAAGCCCTCCGCTATCGCCT
+CGGTGGCCGCGGCCGCCGCCCGGCCCGGCGAGTGCACCCGGTCCAAGGTTGCCAGCACCCTCGGGGCCAC
+CGACTGCATGCCGAGCGACACCCGCGTGTAACCGGCCGCGCGGATCGTGGCGAAGAACTCCGGCCACGTC
+GACTCGGGGTTGGCCTCGGTGCTGACTTCGGCGTCGGGCGCCAGCACAAAGTGGTCCCGCACCATGTCCA
+GCAACGTGGCCAGGCGCTCCCCCCCGAGCAGCGATGGCGTCCCGCCACCCACATACACGGTATGCACCGT
+CGGTGCGTCCAGCTTGGCGGCCGCCAGTTCGAGCTCCGCCCGCAGCGCCAGCAGCCAACGGTCCGGGCTG
+ACGCCACCCAGCTGGGCCGGGGTGTAGGTATTGAAGTCGCAGTACCCGCAACGGGTCAGGCAGAACGGGA
+CGTGCAGGTAGACCCCGAACGGTTGTCCGGGCATGGGCGCCAGGCCGGGCAGCTCAACTGGTGCCTGCCG
+AAATACCATGCCAAATCATCGCATAGCGCGTACCAGCTAGGGTGGCCAGCAATGTAACGCAGGCACACCT
+CAATCGTCCCTGCTCCCCGAACAACCTCCAGTCTCGGCCGCGAGGAACGTCAGGATGTGGGTGAGCGAGC
+CCAGCGGTGCGTCTCCCTGACTACAAGAACTACATTTCGGCCACGCACCCGGGCCTTGGGTTTTCATAAT
+GTTGTCTGCGACCTCGATCTGTTGCTGGGGACTCGCGGCCGCCGGCGACCCGACACCACCGTTGGAATCC
+CACGTCGCCTGGCTGATCTGCAGACCACCGTATAACCCGTTACCGGTGTTGGCCGCCCAATTGCCGCCGG
+ATTCGCATTGCGCGATGGCGTCCCAATCGATGTCGTCGGCTTTCGAGCTGATGGTGGACAGACCCAACAA
+CGCGACAAACATGGTCGCGACAACGGCGGTTTCGATGAACACCGTGCATACGATCCTGGCGCACCTGTCA
+CGTGGTCGGCCAGCACCCGCAGTAGTAAGCAAACCCGGTGTCATAGCAGCTCCACCTTGCTGGCCAGCCA
+GCGGCCGTTCACCTTGTCCATGATCACCTTGATCCGACTGCGGTCGATCTGCGGCGTTGGGCTGTTCCGG
+TTGCTGACCGACTGGTCGATGAACATCAGGACCACTACCTTGTTCGTGGTGGCTGATTTGACCGACGCCG
+CCACGACGGTCCCGTGGGTGGCCACCCGATTGTCGGCCAGCAGTTGGCGAAGGTGCGCACTGGATTTGCC
+GTACTTATCTTTGAACTCGCCGGTCGAACCCTCGAGAATGTCCCTCATGTTGTGGTCGATCCGCTCACAG
+TCCATGGTGGCCAGCTTGACGACATAGCTGCGTGCGGCCTGCAGTGCCTGGCCGGCGGCGACGTCTGTCT
+GATGCTTCTCAAAGAGCACCCATCCGCACCATCCAGACCCGGCCAACGACACAACCACCGCGACGGCGCC
+AACCCAGCCAGTCACCGATCTGGTTAACCGACCGCGGCCGGGAGTTTCGGCCGGTTCGCCGGTGCCGCCT
+GGCTCACTTGCACCGTGGCCCCGGCCGAAGATGGCCATTCTGCGCACGATTGACCTCGATCACTATCCGC
+TAAGACAACTATCTCAGTAGTCATATTTGGTCACATCTGTCACTCCTGTCAACGTCAGGTGCGCGTCTCC
+CAGCGGATTCCCGGGTCGGCCTATCCATCCATCCAGGCTTGTTGCGTAGTTTTGATCATCGTGAAAAGAA
+ATTTGACCAGGTCGCGCAGCTGCACGCCATCCATGGCAGAATGTCACCGTGACCGCCGCCAAGAACCCGC
+GCCCCGATCTGCGAATCGCGCTGGTGGCTCGGCGGCACATCGACCTCAAGCGGGTCTGCAGCTGTGGCTG
+TCGGCCTTGACGCCGTAAACCCAGCCCACCTGTATCTGCAGCCGGCGACCGGATCTGCCCCTCCCGGAAC
+AAGCGGCGTTTAGCGCGTCCTAGGTCGGCGATGTCCGCGAAGGAGAACCCCCAAATGACCACTGCACGTC
+CCGCCAAGGCTCGAAATGAGGGCCAGTGGGCGCTGGGACATCGCGAGCCACTCAACGCCAACGAAGAGCT
+GAAGAAGGCCGGCAACCCGCTCGACGTGCGGGAGCGCATCGAAAACATCTACGCCAAACAGGGTTTCGAC
+AGCATCGACAAGACCGACCTGCGAGGGCGCTTTCGCTGGTGGGGCCTGTACACCCAGCGTGAGCAGGGCT
+ACGACGGCACCTGGACCGGTGACGACAACATCGACAAGCTCGAGGCCAAATACTTCATGATGCGGGTGCG
+TTGCGACGGCGGCGCGCTCTCGGCTGCCGCGCTGCGCACGCTGGGCCAGATCTCGACGGAGTTCGCGCGC
+GATACCGCCGATATCTCCGACCGGCAGAACGTGCAATACCACTGGATCGAAGTGGAAAACGTCCCTGAAA
+TCTGGCGACGGTTAGACGATGTCGGACTGCAGACCACCGAGGCGTGCGGTGACTGCCCGCGGGTAGTGCT
+GGGCTCGCCGTTGGCCGGCGAGTCGCTCGACGAAGTGCTCGACCCGACCTGGGCGATCGAGGAGATCGTG
+CGTCGCTACATCGGCAAGCCCGACTTCGCCGACTTGCCGCGCAAGTACAAGACCGCCATCTCTGGCCTGC
+AGGACGTCGCGCACGAGATCAACGACGTCGCCTTCATCGGCGTCAACCATCCCGAGCACGGACCAGGCCT
+GGATCTGTGGGTGGGCGGTGGACTGTCGACCAACCCGATGCTGGCCCAGCGGGTCGGCGCCTGGGTTCCA
+CTGGGCGAAGTGCCCGAGGTGTGGGCGGCGGTCACCTCGGTGTTTCGCGACTACGGCTACCGGCGACTGC
+GCGCCAAGGCCCGGCTGAAATTTCTGATCAAAGACTGGGGCATAGCGAAGTTCCGCGAAGTGCTCGAAAC
+CGAGTACCTCAAGCGTCCGCTGATCGACGGTCCGGCCCCCGAACCGGTCAAGCATCCGATCGACCACGTC
+GGGGTGCAACGACTCAAGAACGGGCTCAACGCCGTCGGAGTCGCCCCCATCGCCGGGCGGGTATCGGGCA
+CCATCCTCACGGCGGTCGCCGACCTGATGGCGCGGGCCGGTTCCGACCGGATCCGGTTCACCCCCTACCA
+GAAGCTGGTCATCCTCGACATTCCGGACGCCTTGCTCGACGACTTGATCGCCGGTCTGGACGCGCTGGGG
+CTGCAGTCGCGCCCGTCGCATTGGCGCCGGAACTTGATGGCGTGCAGCGGGATTGAGTTCTGCAAGTTGT
+CATTCGCCGAAACCCGGGTTCGAGCACAGCATTTGGTGCCCGAGCTGGAACGCCGGCTTGAGGACATCAA
+CTCGCAGCTCGACGTACCGATCACCGTCAACATCAACGGCTGCCCGAACTCATGTGCGCGAATTCAAATC
+GCCGACATCGGATTCAAGGGACAGATGATCGACGACGGACACGGCGGCTCCGTCGAAGGCTTCCAGGTGC
+ATCTGGGCGGACACCTCGGCCTGGATGCCGGATTCGGCCGCAAACTGCGCCAGCACAAGGTCACCAGTGA
+CGAACTCGGCGACTACATCGACCGGGTGGTGCGCAACTTCGTCAAACACCGCAGCGAAGGTGAACGCTTC
+GCGCAGTGGGTCATCCGGGCCGAGGAGGACGACCTGCGATGAGCGGCGAGACAACCAGGCTGACCGAACC
+GCAACTACGTGAGCTGGCCGCGCGCGGAGCTGCCGAACTCGACGGCGCCACCGCCACCGACATGTTGCGC
+TGGACCGACGAAACCTTCGGCGACATCGGCGGCGCCGGCGGCGGCGTGAGCGGACATCGCGGGTGGACAA
+CGTGCAACTACGTAGTTGCTTCCAACATGGCTGATGCGGTGCTGGTGGATCTGGCCGCCAAGGTGCGACC
+GGGCGTACCGGTCATCTTTCTTGATACCGGCTACCACTTCGTCGAAACAATCGGCACCAGAGATGCGATC
+GAGTCCGTCTATGACGTCCGGGTGCTCAATGTCACTCCGGAGCACACAGTGGCCGAGCAGGACGAACTGC
+TGGGCAAGGACTTGTTCGCCCGCAACCCCCATGAATGCTGCCGGTTGCGCAAGGTCGTTCCCCTGGGCAA
+GACGCTGCGTGGCTACTCCGCGTGGGTGACCGGGCTACGGCGGGTCGATGCACCGACCCGGGCCAATGCC
+CCGCTGGTCAGCTTCGATGAGACGTTCAAACTAGTGAAGGTCAACCCGCTGGCGGCGTGGACCGACCAAG
+ATGTGCAGGAATACATTGCCGACAACGACGTGCTGGTTAATCCGCTTGTGCGGGAAGGCTATCCGTCGAT
+CGGTTGCGCTCCGTGCACAGCCAAACCCGCCGAAGGCGCCGACCCGCGCAGCGGACGCTGGCAGGGGCTG
+GCCAAGACCGAATGCGGGTTGCACGCCTCGTGACCGCGCCGGCGACGATGCAGAGCGCAGCGATGCTGAG
+GAGCGGCGCCATCGAAGCACCGCCGGCGACGATGCAGAGCGCAGCGATGCGGTGGGGGCACCTCCCGCTT
+GCGGAGGAGAGCGGCACCATCGCGCCTCAGCTCGTCCTCACCGCACACGGCAGCAAAGATCCGCGATCGG
+CCGCCAACGCACGGGCTATCGCGGGCCGGCTGGCGCGCATGCGGCCCGGGCTCGACGTGCGGGTCGCGTT
+CTGTGAGCTCAACTCGCCCAACCTGGTCGACGTGCTCAACCGCTGTCGAGGAGCAGCTGTGGTCACCCCG
+CTGCTGCTGGCCGATGCCTACCATGCTCGCGTCGACATCCCTGCCCAGATCGCCAGCTGCCGCGTTGGTC
+ACCGGGTACGCCAGGCCAGTGTGCTGGGTGAGGACATTCGGCTGGTGTCAGCGCTGCATGAGCGCCTCAC
+CGAGCTGGGGGTTTCGCCGTTCGACCACACACTGGGGGTGGTCGTGCTCGCGATCGGCTCATCGCATCCC
+GCGGCCAATGCGCGCACCTCGACGGTGGCGTCAAGGCTGGCGGAGGGGACCCAGTGGGCCGCGGTGACGA
+CCGCTTTCATCACCCGACCGGAGGCTTCGCTGGCCGATGCCACCGATCGGTTGCGACGCCACGGTGCCCG
+TCGGATGGTCATCGCGCCATGGCTGCTCGCCCCTGGGATACTGTCTGACCGGGTACGCGGATACGCACGG
+GAAGCCGGCATCGCGATGGCACAACCGCTGGGTGCACACCCGATGGTGGCCGCGACCATGTGGGATCGCT
+ACCGACAAGCCGTGGCCGGTCGGATCGCGGCCTAGGTCTTCTCGAAGGTCTGCTGGAACGGATGTCCTCT
+GGTGAGTGTTTGGTTGCGAGCGGGCGCCTTGGTGGCTGCAGTGATGCTGTCGCTGAGCGGATGTGGCGGC
+TTCCACGCGGGTGCGCCAAGCACGGCCGGTCCGTGCGAGATCGTCCCCAATGGCACGCCGGCGCCCAAGA
+CACCCCCGGCTACCGTGCCTTCGTCGCGCAACCTCGCGACCAACCCCGAGATCGCCACCGGCTACCGCCG
+GGACATGACCGTGGTGCGGACCGCCCACTATGCGGCAGCCACCGCCAATCCGCTGGCCACTCAGGTGGCC
+TGCCGAGTATTGCGCGACGGTGGTACCGCCGCCGATGCCGTCGTGGCCGCCCAGGCGGTGCTGGGGTTGG
+TCGAACCGCAATCCTCCGGGATCGGCGGCGGCGGATATCTGGTGTACTTCGACGCCCGCACGGGCTCAGT
+GCAGGCCTACGACGGCCGTGAGGTGGCCCCAGCGGCCGCCACCGAGAACTACCTTCGCTGGGTCAGCGAC
+GTCGACCGCAGCGCGCCCAGGCCCAACGCCCGAGCCTCGGGACGGTCGATCGGAGTACCGGGCATCCTGC
+GAATGCTGGAGATGGTGCACAACGAGCACGGGCGCACACCCTGGCGCGACCTCTTCGGCCCCGCGGTAAC
+GCTGGCCGATGGCGGTTTTGACATCAGCGCCAGGATGGGCGCGGCCATCTCCGACGCTGCGCCGCAACTG
+CGAGACGACCCGGAGGCCCGCAAGTATTTCCTCAATCCCGACGGCAGCCCGAAACCCGCGGGAACCCGGC
+TGACGAACCCCGCGTACTCAAAAACCCTGTCCGCCATCGCCTCCGCCGGCGCCAACGCCTTCTATTCCGG
+CGACATTGCCCACGACATCGTGGCGGCGGCGAGCGACACATCGAATGGCCGCACGCCGGGCCTGTTGACC
+ATTGAGGACCTGGCGGGTTACCTCGCCAAGAGACGCCAACCGTTGTGCACGACCTATCGCGGCCGGGAGA
+TCTGCGGCATGCCATCGTCGGGTGGCGTCGCCGTGGCCGCAACCTTGGGCATCCTCGAGCACTTCCCGAT
+GAGCGACTACGCGCCCAGCAAGGTCGACCTCAACGGCGGTCGCCCGACCGTGATGGGGGTTCACCTGATA
+GCGGAGGCCGAACGGCTGGCCTATGCCGACCGCGACCAATATATCGCTGACGTCGATTTTGTCCAGCTGC
+CCGGCGGCTCGCTCACCACGCTGGTTGACCCGGGCTACTTGGCAGCACGCGCCGCGCTAATCTCGCCGCA
+ACACAGCATGGGCAGCGCCAGACCGGGGGACTTCGGCGCACCGACGGCCGTCGCCCCGCCAGTGCCTGAG
+CATGGCACCAGCCACCTCAGCGTCGTCGATTCGTACGGCAATGCGGCCACGTTGACGACGACGGTGGAAT
+CTTCGTTCGGCTCCTACCACCTGGTGGACGGATTCATCCTCAACAACCAGCTGAGCGATTTCAGCGCCGA
+GCCACACGCTACTGACGGATCACCGGTGGCTAACCGGGTCGAGCCTGGGAAGCGACCGCGCAGTTCGATG
+GCACCGACGTTGGTGTTCGATCACTCGTCGGCGGGGCGCGGTGCGCTGTACGCGGTGCTCGGTTCTCCGG
+GCGGCTCCATGATCATCCAGTTCGTCGTGAAAACACTTGTGGCGATGCTGGATTGGGGTCTGAATCCGCA
+GCAGGCGGTTTCCCTGGTCGATTTCGGCGCCGCGAACTCGCCGCACACTAACCTCGGCGGTGAGAATCCC
+GAGATCAACACTTCCGACGATGGTGATCATGACCCGCTGGTGCAAGGCCTGCGCGCGCTGGGGCATCGAG
+TTAATCTTGCCGAGCAATCCAGTGGGCTCTCGGCGATCACCCGCAGCGAGGCGGGTTGGGCCGGCGGCGC
+CGACCCACGCCGCGAAGGCGCGGTCATGGGCGACGATGCCTGAGCCGTTCGCCGGCGGGCGGCCAAACGA
+ACGCGGACCACTTCGAGCCGATAATTTTGCCGGCCCTCTCGGGCTTTGTCTGCGGTTTTACCGGCTCGGT
+GCATTCGCGCGCTAGCCGATAGGGTCTATCGCCATGTCCGGTGCCACGGTGGGTGCGCGCGAAATCACCA
+TCCGCGGAGTCGTCCTGGGCGCATTGATTACCTTGGTGTTCACCGCGGCCAACGTGTACCTGGGGCTAAG
+GGTTGGATTGACATTCGCCACTTCTCATACCGGCCGCGGTGATCTCGATGGGCGTGCTGCGGTTGTTCGC
+CAACCACTCAGTGGTGGAGAACAATATTGTTCAGACGATCGCGTCGGCGGCCGGCACGCTGTCGTCGATC
+ATCTTCGTGTTACCGGCACTGCTCATGATCGGCTGGTGGAGCGGGTTTCCGTACTGGACAACGGCGGCGG
+TGTGTGCACTGGGCGGGATCCTTGGCGTCATGTACTCAATTCCGTTGCGCCGCGCACTCGTCACCGGATC
+AGACCTGCCGTACCCAGAAGGCGTTGCCGGAGCCGAGGTTCTCAAGATCGGTGACTCCGCACGGGAGATG
+GAGCACAACCGTAGGGGAATTGGGGTAATCGCCCTGGGCGCGGCAGCGGCGGCGGGATATGCACTGCTGG
+CATCCCTGCGGGTGATCAACAACTCACTGTCGGCCACCTTCCGAGTAGGTTCCGGTGCGACGATGATCGG
+TGCCAGCTTGTCGCTGGCGTTGATCGGCGTCGGTCATCTTGTTGGCGTCACCGTCGGTGTCGCAATGATC
+GTCGGATTGGCTATCGCCTTTGGGGTAATGCTGCCAATACGGACAGCCGGCCAACTGCCGCCGGACGGGG
+ACTACGCCGTCGCCGTCGCCAGAATTTTCTCGACGGACGTGCGGTTCATCGGGGCGGGCGCCATTGCGGT
+GGCGGCCGCCTGGACGTTCTTGAAGATCCTGGGGCCGATTCTGCGTGGCATCGCCGACGCCGCGGTCTCA
+GCTCGAACCCGACGCCGAGGGCAAGCGGTTGGCCAGACCGAGCGCGACATCCCGATCCACATCGTGGCCA
+TGGTGGTTCTTCTCTCGCTGATCCCAATCGGATGGCTGCTCGCGGACTTTACCGACGGGACACCGCTCGA
+TGACCGCAGGCCCGGCGCCATCGCCGCCGGGGTACTGCTCGTCTTGGTCATCGGGTTGATGGTCGCTGCG
+GTCTGCGGTTACATGGCCGGGTTGATCGGCTCGTCGAACAGCCCGATCTCGGGCGTGGGCATTCTGGTGG
+TGGTGCTGGCCGGTCTGCTGATCAAGACTGCGTATGGTCCGGCCACCGGCTCGCAGATTCCGGCCCTGGT
+GGCCTACACCGTGTTTACCGCTGCATTGGTCTTCGGCGTGGCGACTATTTCCAACGACAATCTGCAGGAC
+CTCAAAACCGGCCAACTCGTCGGCGCTACCCCATGGAAGCAGCAGGTTGCACTGATCATCGGCGTGCTCG
+TCGGGTCGGTGGTGATGGCGCCGATCCTGCAGCTGATGCAGGCTGGATTCGGGTTCCAGGGGGCGCCGGG
+CGCAACGGCCAACGCATTGGCCGCCCCGCAAGCCGCGCTCATGTCCGCGCTGGCCAAGGGAGTATTTGGT
+GGCTCGCTGAACTGGTCGCTGGTCGGTGTAGGGGCCTTGACCGGCGTGATAGCGGTCGCGCTCGACGAGA
+CACTGGCCAAGACGACAACCAACCTTCGGCTGCCGCCACTAGCGGTGGGTATGGGTATGTACCTGCCGGC
+CGCACTGACGCTGATGATCCCGATCGGCGCATTCCTCGGGCGGATCTATGACTCCTGGGCGCGGTGGTCT
+GGGGATGACGACGAGCGCAAGAAACGGTTGGGCGTCATGCTCGCGACGGGCCTGATTGTGGGCGAAAGCC
+TATACGGGGTGCTCTTTGCCGTCATCGTCGCGACAACTGGCAAAGAGGAGCCGCTGGCCATGGTCGGCGA
+CGGATTCAGGTTTGCCTCCCAGCCGCTGGGAGCCATCGTCTTTGCCGGCCTCCTCGCTTGGCTCTACCAG
+CGCACCCGGGTCACAGCGTCGTACCGGCTGGCAGCGCCGGCCGGCAGCTCCAAGCCACTGCCCGATTTGC
+CTGGGTAACCGCATTGCGCCCGAGGGGTCCGGCTTTTCACAGCAACTTCACGGTTGACATCCACCTTGGC
+TCGCAGCTCTGCGAGGCAGCCTGAGGTGACAAAGCCGGCGGCCCGACACATGCAGCCGAGTTGGCTGGCT
+CGGAAGGGGGACAGAGTTGACCATGACAGCGAGTGTGGCCAAGGTGACAGCTGCACGCCCGGAGCCAAGC
+GCGGCGTGGGCTGAAGCCCGGCGGCGGGTACGCCAACGCCGCGAGGACATGCTGCGCCATCCTGCATTTC
+TGTCCAAGCAGCTCCCTGCCGAACCAGCAGACGACGACGGCGTCGCGGCCGTCTACGACATCGCGATTGC
+GCGTCGGCGCCGACCTGCTTGAGCGGGTCCCGGCGGGTCAACGTCGGCGGCTGCCGGGTAAACCGGCAAT
+CGACGACCGGGCCTTGGCGGGCGCGTCGCGTTCTGCCAGCTGAACTCGCCGAGCCTGGTCGATGTGCCTG
+GGCTGGTGCCCGCGATGCCCTTGGACGCGCTCCGGCCGGCGAGACAGCCGACGAGTGGCTTGGGCGAATG
+CGCCACGATGCGTCGGCCAGAGGCGGGTAACGAGAAGGTGGCGGTGATCTGGGAAAGCCTGGATGTCGTT
+CCCCCCGAGTCGCTATAGTCAACTGCGCCGATGGGTCAATGCTGGCCAGGCGATGCTCTGGTCGACATGG
+CTTAGCAATCCTGACATTTTGGAGGTGCCGGATGTCGTTCCTGATTGCTTCGCCGGAGGCGCTAGCGGCG
+ACAGCCACATATTTGACAGGTATCGGTTCGGCAATCAACGCGGCGAACGCGGTCGCGGCCGCCCCGACAA
+CAGAGATCCTGGCGGCGGGGACCGACGAGGTGTCCACCGCCATCTCAGCGCTGTTCGGCGCTCATGCCCA
+GGCATATCAGGCGCTCAGCGCCCACGTGGCGGCATTTCACGACCAGTTCGTGCATACCTTGACCGCCGGT
+GCCGGCTCATACATGGCCGCCGAGGCCGCCGCCTCGCCCCTGCAGGCTTTGCAGCTGGAGCTGCTCAACG
+CCATCAATGCACCCACCCTGGCGCTGTTGGGACGCCCGTTGATCGGCGACGGCACCGATGCGGCGCCGGG
+GAGCGGGGGGGCCGGCGGGGCCGGCGGCATCTTGATCGGCAACGGCGGGACCGGCGGCGCCAGCGACTTA
+GCCGGGACCGGCCGCGGCGGGGTCGGCGGGGCGGGCGGCGCCGGCGGGCTCTTCGGCATCGGCGGCGCCG
+GCGGGGGCTGCGGGTCCGCGGTGGCGATCGGGGGTGACGGCGGGGCCGGTGGCGCCGGCGGCGTGTTCAG
+CGGCGGCGGCGCCGGCGGGGCCGGCGACGCCATCGGGGGTAGCGGCGGCGCGGGCGGCACCGGTGGGCTG
+TTGGGTGGTGGCGGCGGCGCGGGCGGCGCCGGCGGCGCCGGCGGCAATGGCGGGGGCGCCAGCAACAGCG
+CAAGTATCGGGGGTGACGGTGGGTCCGGCGGCGCGGGCGGCATGCTCTACGGTGCCGGCGGCGTCGGCGG
+CAACGGCGGGGCCGCGGTCGCTATCGGGGGTGACGGCGGGGCCGGCGGCAGGGCCGGAGCGATCGGCAAC
+GGCGGTGACGGCGGCAACGGCGGGACTTCCAACACCCCCGGCGGTAGCGGCGGCGACGGCGGCAATGGCG
+GGAACGCCGGACTGATCGGCAGCGGCGGTAACGGCGGCAACGCCGAGATTGTCATCTCCGGCGGTAGCGT
+CGCCGGCACCGGTGGCAACGGCGGGTTGCTGTTGGGCTTCAACGGCACGAACGGGCTGCCGTAGCGGGCG
+AGCCCGCCGGCCTCTGGATCACGTCGATGTGACTTTGACCCGTTCCACGCCGGCATCGTCGACGCCCGAT
+ACGCCACCGGCAATCGGCGGCACCCGGGTGGCACGCACGTAGACGGTGTCACCCTCGCGTAGGGCCAGCG
+CCTCGGCATCGCCGCGGGTGATCTGGGCGGTGAAGGCCCCGCCGGTGGCCGCGCTGGTCAACTCCACGCG
+GACCTCGAAGCCCAGCACCACCACCCGATCCACAACAGCCCGTAGCACACCGGTGGACCCGGCGGTGCCG
+TCAGCGGCGGCCACGGCCATATTGGGAGTCCGGCCGACCCGGATGTCGTGCGGGCGCACCAGGGAGCCGT
+TCAACGTGGAAACCGCTCCCAAGAAGGACATCACGAAGGCGTTCGCCGGGGCGTCGTAAACGTCGGTCGG
+GGATCCGACCTGCTCGATACGGCCCTTGTGGAGTACGGCGATGCGGTCGGCCACATCCAGCGCTTCGGCC
+TGATCGTGGGTGACCAGCACCGTGGTGACATGCACCTCGTCGTGCAGGCGGCGCAGCCAGGCACGCAGCT
+CTTCGCGCACCTTGGCATCGAGTGCGCCGAACGGCTCGTCGAGCAGCAGCACCTCCGGATCGACCGCCAG
+CGCCCTGGCCAGCGCCATCCGCTGTCGTTGCCCACCGGAGAGCTGATTGGGGTAGCGGCTCTGAAATCCG
+CTCAGGCCCACCACCTGCAGCAGATTGTCGACCTTGGCCTTGATCTCGGCCTTGGGGCGCTTACGGATCT
+TCAACCCGAACGCCACGTTGTCACGGACAGTCAGGTGTTTGAACGCCGCGTAGTGCTGGAAGACGAATCC
+GATGCCACGCCGCTGTGGCGGCACCCGGGTGACGTCGCGGCCGTTGATCGTGATGGTTCCGGTGTCCGGT
+TGGTCGAGGCCGGCTATGGTGCGCAACAGCGTCGACTTGCCCGAACCGCTGGGGCCCAACAATGCGGTCA
+GCGAACCGGTCGGTACGACGAAATCCACGTGGTCAAGTGCGACGAAGTCGCCGTAGCGTTTGGTGGCGTC
+GGCCACGACGATGGCGTAGGTCATTTTCACCGTCTCCTTCTCAGCCCTCGCTGACCGCTCGTGCCCGGTG
+GGCGTCTAGCACCATCTGGACGATCAGCACCACCACGGAAACCGCCATCAGCAGCGTCGACAGCGCGTAG
+GCACCGTACTCGGCCCCACGGTGGTAGCGGTCGGAGACCAAGAGGGTCAGTGTTTGCGATGTCCCTGGAA
+GGTTCGACGAGACGATGATGACCGCCCCATATTCGCCGAGGGTTCGAGCGACGGTCAATACGATGCCGTA
+CGTCAGGCCCCACCGGATGGAGGGCAGCGTGATTCGCCAGAATGTCTGCCACCAACCGGAACCCAGCGTC
+GCCGCCGCCTGCTCCTGGTCGGTGCCCAATTCGTGCAATACGGGTTCCACTTCGCGCACCACGAATGGAC
+AGGTGACGAACATGCTGGCAAGCACGATTCCCGGCAGCCCGAAGATGATCTTGAAGCCAAGGTCCTGCTC
+GACGAAGCCCAGGGCGCCGGCCGATCCCCACAGCAAGATCAACGAGACGCCCACGATGACGGGTGAAACC
+GCAAAAGGCAGATCGATAATCGCCTGCAAGACGCCCTTGCCGCGGAACCGGTTGCGGGCCAGCACCAATG
+CCGTCGTGACTCCAAAGATCACGTTCAGCGGTACCACGATAGCCACCACCAGTAGCGACAGGTTCAGCGC
+TGATATCGCCGCCGGGGTACTGATCCAGGCGTAGAACTGGCCAAAGCCCGGTTCGAAGGTCCGCCACAGG
+ATCAGCGCTACCGGAACGATCAACAGCACAAAGACGTACCCCAGCGCGACCGATCGGACGAGGTAGCGAG
+CCGCCGGCAAGGAGGTCATGCGGCCATCTCCTCACGTTTGGCCGCACGCGCGCCGACGACACGTAGGATG
+AGCAGCACAATGAACGAAATCGAGAGCAATACAACCGATATCGCGGCCGCTCCGGTGCGGTCGTCGTTCT
+CGATCAGGGTGCGAATCCATTGCGAGGACACCTCGGTCTTGCCCGGCACGGCCCCGCCGATCAGAACCAC
+CGAACCGAACTCGCCGATAGCGCGCGAAAACGCCAGGCCCGCACCGGATAACAATGCCGGCGTCAGCGAC
+GGCAACACCACCGAAGTGAAGATTTTGGCACCATTAGCGCCCAGCGACGCCGCCGCCTCCTCGGTCTCGC
+GATCGATTTCCAGCAGCACCGGCTGCACGGCGCGCACCACGAACGGCAATGTGACGAACGCCAACGCCAC
+CCCAACACCGGTCGCGGTGTGTTGAAAATGAAGCCCCACCGGGCTGTTGTTCCCGTACAGTGCCAACATC
+ACCAGGCTGGCGACGATGGTGGGCAACGCAAACGGCAGATCGATAATCGCATCGACGATCCGCTTGCCAG
+CGAAGTCGTCACGCACCAGCACCCAGGCGATCAGCAAGCCGAACACCAGGTTGATGACCGTGACTGCGGT
+CGAAATCGTCAGCGTTACCCGGAACGACTCCATCGCGGCATGCGACGAGACCGCCAGCCAGAAGGCCCGC
+CAACCACCGCCCGCGGCCTGCCAGACGATGGCGGCCAGCGGCAACAGCACGATCACCGAAAGCCACACCA
+CTGCCATACCGACCCGAACGGAAGGGGGGCCCGCGGGGCCGGAAAGGCGCGCGCGGAACTGCGGCGCGCG
+GCGTTCGCCGACCAACGATTCCGTCATCCGGTGGCCCGCAGATAAATCTTGGTGATGCTGCCGGTCGCCT
+TGTCGAACAGCTGAGGATCCACGCTGCCCCAGCCACCGAGGTCGGCGATCGTCCACAGTTTCGCCGGCAC
+CGGAAACAGGTCGGCAAAATCGGCGGCGACCGCCGGATCGACCGGCCGGAAACCGGCCTGCGCCCATAAC
+TTCTGCGCCTGCACGGTGTACTGGAAGTTTCTGAATGCGGTCGCCGCTCCAAGGTGTGTGCTGGTCGCCA
+CTACGGCCAACGGATTTTCGATCTTGAACGTCTGCGGCGGGGTGACGTGCTGCACCGGTTTGCCCGCCCG
+CTCGGTGGCGATGGCTTCGTTCTCGTAGCTGATCAACACGTCACCGCTGCCCTGGACAAAAACATCGGTG
+GCTTCCCGCCCCGACCCGGGGCGCAATTTGACGTGTTCATTCACCAATGTATTGACAAAGTCGATCCCCG
+CTTGGTTATTCCGGCCACCGTCACTTTTCGCGGCGTAGGGGGCTAGCAGATTCCACTTGGCAGAACCCGA
+ACTCAGCGGACTGGGCGTGATGACCTCAATACCCGGGCGCAACAGGTCATCCCAATCTCTGATGTTCTTC
+GGGTTACCCGCGCGGACCACAAACGTCACCACCGACCCGAACGGGATGCCCTTGGTGGCATCGGCGTCCC
+AGTCCTTGTCAACCTTGCCGGCCTTGACCAGGCGAGCGATGTCCGGTTCGACCGAGAAGTTCACCAGGTC
+GGCCGGTTTACCGTCGGCAACACCGCGCGACTGGTCGGCCGACGCGCCATATGAGGTAATCACCTGGACT
+CCCCGGCCCTGTTCGGAAGCGTTGAACGCGGGAATCACCGCACTCCAGCCGGGTTCCGGGACGGCGTAGG
+CGACCAGGGTGATGCTCGTATGCGCACGGTCCGGTCCCGCACGGCCGACCACGTCGCTGGGACCGCCATG
+ACACCCCACGCCGATACCGGCGATCAATGCGCACACCACCCCGGCAGGGATAATGTGCCGCCAGCGGGAT
+GCGCTAGCGATGCAGCTCGCTTCAGAAAGCGTCAAGGAGAGCATTGGCGACCTTCCGGTGCGGGACTTTG
+GACAACGTTCCCGTAGCGGCGGAAAGGCGATCGCTGAACATTGCAGGACTCACGAACTCCACATCAGACC
+GCGCACGGGTGGGGAGTCAGCGACAACAGTGCAGGTTGGCCGCAGCGCCGCAAACGAGCGCGCCGACATA
+GCGCCCCGAAAAACCCGATGCTGCGTGCACGTGGCGAAGCCTAACAGAATTCGGCTGGCCGACCAGTTGG
+CGCGCAGCTCAATGGGTGAGAAGCCAGGTCACGATCACCAGCGCAACCAGCGTGACCAGAACCAACGTGA
+CGTGCGACCTCGGCATCCGGGCTACCTGGGCGCCTGATCGGGGCGGCGGGCGCGGCGAATCAACTGAATG
+ACCCGGCCGAGCAGGGCATCCAGCAATGCCGCGGTGAAATAGGCCAAAGCCAGCACGACCGGCATGACTG
+CCAACGCCTGCAGCGCGAACGGGAGTCCGGACAGCCACAGCTCGACGCCGTCCCACCAACTCAGGAACCC
+GTTCATCGGGCCCACACTATAGCGCCGGCAGGCAAAACCCCAGGTGTGTCGCGATTACGGTGACCGCCGA
+CGCCAAACCGCGACACGGCACACGGCTGCTAGGCCCACCTGAGCACGCACCCAACTACGCCGGGCGCCGG
+GCGTGAAGTGGACGCCGAGCAAGTCGACAGATGATGATGTCGGCATGGTCCTGCACGCTCAACCCCCCGA
+CCAATCGACCGAAACAGCCCGCGAGGCTAAAGCGTTGGCCGGGGCAACGGACGGGGCAACGGCCACATCC
+GCGGATCTGCACGCACCCATGGCTCTATCGTCCAGTTCGCCACTGCGCAACCCGTTTCCGCCGATCGCCG
+ACTACGCGTTCTTGTCCGATTGGGAAACGACGTGCCTGATTTCGCCGGCGGGTTCGGTGGAGTGGCTGTG
+TGTGCCACGGCCGGACTCCCCCAGTGTGTTCGGCGCGATCCTGGACCGCAGCGCCGGCCATTTTCGTCTG
+GGCCCCTACGGTGTTTCGGTGCCTTCGGCGCGACGCTACCTTCCGGGCAGCCTGATCATGGAGACCACCT
+GGCAGACCCATACCGGCTGGCTGATCGTGCGAGACGCGCTGGTGATGGGTAAATGGCACGATATCGAACG
+GCGATCGCGGACCCACCGCCGCACCCCGATGGACTGGGACGCCGAGCACATCCTGTTGCGCACGGTGCGC
+TGCGTCAGCGGCACCGTTGAACTGATGATGAGCTGCGAGCCGGCGTTCGACTATCACCGCTTGGGCGCCA
+CCTGGGAATACTCGGCCGAGGCTTACGGCGAGGCCATAGCCCGCGCCAACACGGAGCCCGACGCGCACCC
+GACGCTGCGGCTGACCACCAACCTGCGGATCGGGCTGGAGGGCCGGGAAGCACGCGCACGCACCCGGATG
+AAGGAGGGTGACGACGTGTTCGTCGCGCTGAGCTGGACCAAACACCCGCCGCCGCAGACCTACGACGAGG
+CCGCCGACAAGATGTGGCAAACCACCGAGTGCTGGCGGCAGTGGATCAACATCGGCAACTTCCCCGACCA
+CCCATGGCGGGCGTACCTGCAGCGCAGCGCGCTAACCCTGAAGGGGTTGACCTACTCCCCCACCGGGGCG
+CTGCTCGCGGCGAGCACCACGTCGCTGCCGGAAACCCCGCGAGGCGAACGCAACTGGGACTACCGCTATG
+CCTGGATTCGCGACTCGACCTTCGCGCTGTGGGGGCTCTACACCCTGGGATTGGACCGGGAAGCCGACGA
+CTTCTTTGCGTTCATCGCCGACGTGTCCGGCGCCAACAACAACGAACGCCATCCGCTGCAGGTGATGTAC
+GGGGTGGGCGGTGAACGCAGCCTGGTCGAAGCGGAGCTGCACCATTTGTCCGGCTACGATCATGCCCGCC
+CGGTGCGCATCGGCAACGGCGCCTACAACCAGCGCCAACACGACATCTGGGGTTCGATCCTGGACTCGTT
+TTACCTGCACGCAAAGTCCCGCGAGCAAGTCCCGGAGAACCTATGGCCGGTGCTGAAGCGGCAGGTGGAA
+GAGGCCATCAAGCATTGGCGTGAGCCCGACCGGGGAATCTGGGAGGTGCGCGGCGAGCCGCAACACTTCA
+CGTCGTCGAAGGTGATGTGCTGGGTCGCCTTGGACCGGGGGGCCAAACTGGCCGAGCGTCAGGGCGAGAA
+AAGCTACGCCCAGCAGTGGCGGGCCATCGCCGACGAGATCAAGGCCGACATTCTGGAACACGGGGTGGAC
+TCGCGCGGCGTGTTCACCCAGCGCTACGGCGATGAGGCGTTGGACGCCTCACTGCTGCTGGTGGTGCTGA
+CCCGATTCCTGCCGCCGGACGACCCGCGGGTGCGCAACACCGTGCTGGCCATCGCCGACGAGCTGACCGA
+GGACGGCCTGGTGTTGAGGTACCGGGTGCATGAGACCGACGACGGGCTTTCCGGCGAGGAAGGCACGTTC
+ACCATCTGCTCGTTTTGGCTGGTATCGGCGCTGGTCGAGATCGGTGAGGTGGGCCGCGCCAAGCGGCTGT
+GCGAGCGGCTGTTGTCCTTCGCCAGCCCGCTGCTGCTCTACGCGGAGGAGATTGAGCCGCGGAGCGGGCG
+TCACCTGGGCAACTTCCCGCAGGCGTTCACCCACCTGGCACTGATCAACGCCGTGGTCCACGTGATTCGC
+GCCGAGGAGGAAGCCGACAGCTCGGGGATGTTTCAGCCCGCCAACGCCCCCATGTAGGACTTCCGATGCC
+GAGCAGACGCAAAATCGCCCAAATTCGGGCCGAAATGGGCGATTTTGCGTCTGCTCGGCAAGCGTCAACT
+CAATTCGCTGATCCTGTCCATCATCGCGTGTGCGATATCGACGGCGCTGGTGCTGATGTCGGCCGACCCC
+TGATCCGACGGGTGGGTGATGCCAAAGAAGGTGACCGCGACCTCGACCACGCAATTGCCCCGTACGCCGA
+CGGCACGGGCCTGAGGGACGGACGCCAGTATGGAGTGCGTGCCGCGTCGCAGCGAGACCGTTGCCGCGAC
+AACTGAATCCGCAACCCGGACGTCGGTGATGGAGCGTTGACCGAACGCGCTGGCGGGCACCGTCAGCGTT
+GTGCCATCACATTCCTTCCACTGCGCAGAAAACCTCGCGAACAGATCATCGGCGGCTGCCGCGGAAGGCA
+GGGCGACGACACCCTCATCGAGGTCATCCACCTTCACCGAGGAACCGTCGTGTCGCCACGACACCCGGGC
+GACGCTTTTGACCTCGACGGACCGGTAAACGTTCCGCTGCGTCAGGTAACCGACGCCCACGCAGTCAGCG
+GGCCGAGCCGATACATCACTGTCTCCCAAACTGTCGCTGCCCCCGAACACCGGCGGGAAAGGTGGAAGGG
+CCTGAAACGGCTGGTTGAGGAGCGTTGACAGCGCAGCGCCGTCGAGCGGTACCCGCTGGATCAGTGAACC
+CATCAGCGGACGCGGCACTGCGTTCGGCGCCAGACCTGCTTTCCCGGTCGTCGTTGTGGTGCACCCGGCA
+GCGAGGAACACGGCAAACAGCGGAACCACCCAGCGCCAGCGGTTTGTCACTTCTTGCCTTTGTCCCCGGC
+GGCATCGGTGGACAATGCCGCGACGAAAGCCTCCTGTGGCACCTCGACGCGCCCGATGGTCTTCATCCGC
+TTCTTGCCTTCCTTCTGCTTCTCCAGCAGCTTGCGTTTGCGCGTGATGTCGCCGCCGTAGCACTTGGACA
+ACACGTCCTTGCGGATCGCGCGGATGTTTTCGCGGGCAATGATTTTCGATCCGATGGCGGCCTGCACCGG
+CACCTCGAACTGCTGGCGCGGGATCAGCTCCTTGAGTTTGGTGGTCATCTTGTTGCCGTAGGCATACGCC
+GTGTCCTTGTGCACGATCGCGCTGAACGCATCCACCGCCTCGCCCTGCAGCAGGATGTCGACCTTGACCA
+GCGCGGCCTCCTGTTCGCCGGCCTCCTCGTAGTCGAGGCTGGCATAGCCGCGGGTGCGCGATTTCAGTGC
+GTCGAAGAAGTCGAAGATGATCTCGCCGAGCGGCATGGTGTAGCGCAGTTCCACCCGCTCGGGGGAGAGA
+TAGTCCATGCCGCCCAACTCGCCGCGGCGCGACTGGCACAGCTCCATGATGGTGCCGATGAACTCGCTGG
+GCGCGATGATGGTGGTCTTGACGACGGGCTCGTAGACCGTGCGGATCTTGCCCTCCGGCCAGTCCGACGG
+ATTGGTCACCCGGATTTCGGTGCCGTCGTCTTTGTGCACCCGATACACCACATTGGGTGAGGTCGAGATC
+AGGTCCAGGCCGAACTCGCGCTCAAGGCGCTCACGGGTGATCTCCATGTGCAGCAGGCCCAAGAAACCGC
+ACCGGAACCCAAAACCCAGCGCCACCGAGGTTTCCGGCTCATAGGTCAAGGCCGCGTCGTTGAGCTGCAG
+CTTGTCCAGGGCGTCGCGCAGGTTCGGGTAGTCCGAACCGTCGACCGGATACAACCCCGAGTAGACCATC
+GGTTTGGGCTCACGGTAGCCGGTCAACGCTTCGGCGGCAGCCCCGCGGGCCCGGGAGAGGCTGGTCACGG
+TGTCGCCCACCTTGGACTGGCGGACGTCCTTGACGCCGGTGATCAGGTAACCCACCTCGCCGACACCGAG
+GCCCTCACACGGTTTCGGCTCGGGTGAGACGATGCCGACCTCAAGCAGCTCGTGGGTGGCGCCGGTGGAC
+ATCATCATGATGCGCTCACGGGGGCTGATCTTGCCGTCGACGACGCGGACGTAGGTCACCACTCCGCGGT
+AGATGTCGTAAACGGAGTCGAAAATCATTGCGCGGGTAGGTGCCTCGGCGTCGCCCTGAGGGGGCGGCAC
+CTGTCGGACCACCTCGTCGAGCAGGTCGGACACGCCTTCGCCGGTTTTGCCGGACACCCGCAACACCTCG
+GCCGGCTCGCAGCCGATGATGTGTGCCATCTCGGCGGCGTAACGGTCCGGGTCGGCCGCGGGCAGGTCGA
+TCTTGTTGAGCACCGGGATGATGTGCAGGTCGCGGTCCAACGCCAGGTAGAGGTTCGCCAGCGTCTGCGC
+CTCGATGCCTTGCGCGGCATCGACCAACAGCACCGCACCCTCGCAAGCCTCCAGCGCACGCGAGACTTCG
+TAGGTGAAGTCGACATGGCCCGGGGTGTCGATCAGATGCAGCACGTAGTCGGTCTTGTCGACCCGCCAGG
+GTAGCCGCACATTCTGGGCCTTGATGGTGATGCCGCGTTCCCGCTCGATGTCCATCCGATCCAAGTACTG
+GGCCCGCATAGAGCGTTCGTCGACCACTCCGGTGAGCTGCAGCATCCGGTCGGCCAACGTTGACTTGCCG
+TGGTCGATGTGGGCGATGATGCAAAAGTTCCTAATCTGCGCCGGCGCAGTGAAGGTTTTGTCGGCGAAAC
+TGCTGATGGGAATCTCCTGGAGCGGGGGTTGACGGGTATCCAGGGTATCCGCGTCGGGCAGCTGCGACCC
+AATCGCGCTCGGTCGATCGCGTCTATGCTGCGAGCATGGCGTCCGCACGGAAGTCACAGTGGAAAACGTT
+GCAGCGCTTCGCGGAGAACCTGGTGTTCACTGAGGCTCCTAAGCTGGTGCGTCACCTGCAAAACACGCAG
+GAAACGCTTCGCACAATCCGGCAAGCCGTCAAGATCACCGCGAACATCATGACCACCGCCGTGCCGTCGC
+CACCGGCCGAAATTGCCGCGGGCCGGCCGGTGACCAGCACCAGCTGTCCCACCGCAGCGCGAGCCCGCAG
+ACTTGTCTACGCCCCGGACCTCGATGGCCGGGCCGATCCCGGCGAGATCGTGTGGACTTGGGTGGCCTAC
+GAGCAGGACCCCACCCGCGGCAAAGACCGACCCGTGCTCGTCGTGGGCCGAGACCGCAGCGTTCTGTTGG
+GGTTGCTGGTGTCCAGCCAGGAGCGCCATGCTGCCGACCGGGACTGGGTGGGAATCGGTTCTGGCGCTTG
+GGACTACGAGGGCCGAGAAAGCTGGGTACGGCTGGACCGGGTGCTCGACGTACCCGAGGAGAGTATCCGC
+CGCGAAGGCGCGATTCTGGAACGCGAGGTCTTCGACGTGGTAGCCGCCCGGCTGCGTGCCGACTACGCTT
+GGCGCTAAACCGGGCCGGGCGGCCAGCGCAATCGGCTGGGCAACGAGCCCCGATCAGGCCCCAATCAGCC
+CCGCCTGGCGACGACGCGGGCCGCCCAGCGGCCCGCTGAGGAGCCGGGCAGTCAGCCCCGCCCGGCGACG
+ATGCGGGCCGCCCAGCGGCCCGCTGAGGAGCCGGGCAATCAGCCCTGAGTGATGTAGGACTGAAGCTGCT
+GCTGCTCGGCCTCGAGTTCTCCCATGCGCGATTTCACCACGTCACCGATGCTAACGATGCCGATCAGTTT
+CTTCCCGTCGAGCACCGGCACGTGGCGGACCCGGTTTTCGGTCATCAGCACACTGATCTTGTCGACCGTG
+TCGGATTTTGTACAGGTGGCGACGGTGGTCGACATAATCTTGGCGACCGGGCGAGACAGCACGCTGGCAC
+CATACGTGTGTAGCTGGCGCACCACGTCGCGTTCCGACACGATACCGACCACGCCTTCGGCGCCGACCAC
+TACCATGGCGCCGATGTTCTGCTCAGCGAGGCCAGCGAGCAGCTCCCCGACCGTGGCGTCGGGGTTGATC
+GTCACCACCGCCGCCCCCTTGTTCCGCAAGACGTCCGCGATGCGCATCAAGGCCTCCCGCCGGTGGTGAG
+CTGGTTCACACCAGGCTACGGCGAACTCGGGCGGCGGGAAAGCCGATACCGGAATATGCGGCATCTAGCA
+CCCGAACCCGCAGGTGCCCGGCGGTCGGTAGCTGCGTAGCCCGGGCAGGAATTCGGCCGCCGACAACGCC
+CATGTCGGCCGCATCCTCGAGGCTAAAACTCGTTGGCCATCAGCCGAATCGGTCGATCGGGGCCGCTGGA
+TCCATCGAGCTTGTCAGGATAGGGCCATGCTTGAGATCACGTTGCTCGGAACTGGGAGCCCCATTCCCGA
+CCCGGACCGTGCCGGACCATCCACTCTGGTGCGGGCCGGCGCGCAGGCGTTCCTGGTGGACTGCGGTCGC
+GGCGTGCTGCAACGCGCGGCGGCCGTCGGTGTGGGCGCCGCAGGATTGTCGGCGGTGCTGCTCACCCATT
+TACACAGCGACCATATCGCCGAGCTCGGCGACGTGCTTATCACCAGTTGGGTCACCAACTTCGCTGCTGA
+TCCCGCGCCCTTGCCGATCATCGGACCGCCGGGCACCGCCGAAGTGGTGGAGGCGACGTTGAAGGCATTC
+GGTCACGACATCGGCTATCGGATCGCCCACCACGCCGATCTGACGACACCACCACCGATCGAGGTGCACG
+AATACACCGCAGGCCCAGCTTGGGATCGCGACGGCGTGACAATCCGGGTGGCCCCTACCGATCATCGGCC
+GGTCACGCCGACGATCGGATTCCGGATCGAATCCGACGGTGCTTCGGTGGTGCTCGCCGGTGACACCGTT
+CCTTGTGACAGCCTCGACCAGCTGGCCGCCGGAGCGGATGCGTTGGTACACACGGTGATCCGCAAAGACA
+TCGTCACGCAGATCCCGCAGCAACGGGTCAAGGACATCTGCGATTACCACTCGTCGGTGCAGGAAGCCGC
+CGCAACCGCGAACCGCGCAGGGGTGGGAACCCTGGTCATGACGCACTATGTGCCGGCTATCGGGCCCGGA
+CAAGAAGAACAGTGGCGGGCGCTGGCCGCGACCGAGTTCAGCGGGCGGATCGAGGTCGGCAACGACCTAC
+ACCGAGTCGAGGTGCACCCGCGGCGCTAGCACGCCAGCTATGACCAACCAGCCCCGACACCAGGGCGATC
+GATAAGGCAAGAAGTAGATCGCCCGAACCAGCGCCGGGTCCGTGCGGCGCTAGCACGCCAGCTATGACCA
+ACCAGCCCCGACACCAGGGCGATCGATAAGGCAAGAAGTAGATCGCCCGAACCAGCGCCGGGTCCGTGCT
+GACCCTCGGGCGCCACACGGTCTTGCCCAGCAAACCGGTCAGCCCGGACGCTCCCGCCCGCCACGGTGCC
+GCCGGCCAACGCCGATCGTCGAACCCCACCCGGTCACTGAAAGCTGCCGCAGGCGGTTGGCTGATGCAAC
+ACCGCGGTGGCAATACGTGCAGCGCGACCGGCTCATCGCGGATCTACGGCGCAACCGCGGTGATCGGCGT
+CACGCCGCGGGTGCGACCCCCACGGGACCCCGGTTCCCACTGCTGTTTGGCGGTGAATCGCTGACACCGT
+GGACGGCGCCCAGCCGCGGCTGTTCGCGGTGGTGCAGCCGACCCGATTTCACGGAAACACAGGCTGTCAT
+CAGCGAGGGAAACTATTCGCCGTGCAAAGCATTTCCATGGCGCCACACCGATAGCCGGCTTGTGCTGATC
+GCACGTCCCGATATCTTATGCAGTCGCGGTCCGGAGGCAATGCGGGCCAAAGCCGCCGATTTGGACTTGG
+CTGCGGCGGCAAAGACGGTCGGAGTGCAGCCCGCCGCCGATCAGGTGGCGGCGGCAATTGCCGCAATATT
+GCTGTCACACGCCCAGATCTACCAGGACATCAGCACACAGATGGCGGCATTCCACGACCAGCTCGTAGAG
+AACCGCACGGCAGATAGCACGTCGTACGCCAGCGCCGAGGCCAACGCCCAGCAGAGCCTGCTCAATGCGA
+TGGATGCACCGAGCTGGCAACAGCGCCGAGAAACCGTCGGCGAGGTGGGGCTCCCAGCGGACCCAGCGGG
+ATCCGGCACGGCGACGGCGGCAGTGGCGGCGGCGACGACGGCGCGGGCAGGAAGCCGTTCGGCCGCCCAG
+GCAACCGTGGCGCCTATCGGCGGGCTGAAACTCCGCCGCGAATCTGCGCTAAGCCAGCCGGGTGATCTCC
+ACCACCACGTCGAGGTCGGTGACGCCCTCCCCAGAGTAGATCCCTTTCAGCGGGGAAACGTCGGTGTAGT
+CGCGGCCTACACCCACACTGATGTATTGCTCGGTGATCTCATTGTCATTGGTGGGGTCGTAGTGCCACCA
+TCCACCGGTCCAGGCCTGAACCCAGGCATGGCTGCGCCCGTCTACCGTCTTTCCCACCACGGCATCACGC
+TTAGGGTGTAGATACCCAGACACGTACCGACAGGGAATTCCCATGCTGCGCAACACCATCAGCGACAAGT
+GCACGAAGTCCTGGCAGACGCCCTTGCCTTGTTCCAGCGCATCGAGCCCGGACGAGTGCACACTGGTGGT
+GCCCGGAATGTAGTCCAGCTCGCTGCGCGCCCACCGGGCGGCGGCGACTACGGCCTCGCTGGGCTCATGG
+CATTTCCTGATCCGCCTGCCGACGGCATCAACGCGGGCGCTTGCCGGGGTGTGCGGGGTTGGGCGGAGCA
+CTTCGTCGAACCTGTCGATCACGGCCGTCGATTGCAGGTCGGCCCAGGTTGCCTTGGCGGCCAACGGCTC
+CGGGCGCTCGGTCTCCACCACCGACGAGGACGTCACCGTCAGTTCGGTGTGCGGCGCATGCAAGTCAAAC
+GCCGTCACGGCAGTACCCCAATAATCGATATAGCGGTAGGAGCGGGTGGCCGGGATGGTTTCGACTCGGT
+TGAGGACGAGGTTCTGCCGCGAACTCGACCGAGGGGTCAGCCGGGCTTCGTTGTATGAGGCCGTCACCGG
+CGACTGGTAGACATATCCGGTGGTGTGCACCACCCGGGTTCGCCACATCAGGATTCCTCTTGGCTTCCGA
+CGAGTTGGCCACGCTGGCCTGCATCCGACCACGCAACCCAGGGAGCTGCGTGAAAGTACTGCAGCGCCAA
+TGCATCTCCGACATCACGACAGGTCGTCTGCAAGCCCGCCAGGCGGCTCTCCAAGGTCTCGAGCAGGACG
+CCGGGTTGCACGAATTCCAGCTCGCTGCGTGCTTGCCCTAACAACCGCTGTGCTTCGGTGGTCGCCCCGA
+TCCGGCTGTGCGGATTGTGCATCAACTCGGCGAGATTGTGTTCGGCCAGCTTCAACGAGTGAAAGACCGA
+GCGCGGGAAAAGCCGGTCGAGCATCATGAACTCCACCACCCGGCCCGCGTCCAGCACACCGCGGTAGGTG
+CGCAGGTACGTGTCGTGCGCACCCGCCGAGCGCAGCAGCGTCACCCAGGCCGGCGACGATGCGCTATCCC
+CCACCCGTGACAGCAACAGCCGCACCGTCATGTCGACCCGCTCAATCGCGCGCCCAAGCAACATGAAGCG
+ATATCCGTCGTCACGCAAAAGCGTCGAATCGGCCAGGCCGGCAAACATCGCCGCACGGCCCTCGATGAAC
+GACAGAAACTCGTGCGGCCCAAGGCGTTTGGCAGCGCGTTCGCGTTCAGGCAGGGCGTTATAGGTGGTGT
+TGAGACACTCCCACGTCTCGCTGGAGGTGACTTCCCGCGCCGATTTTGCGTTTTCCCGTGCCGCCGAGAT
+CGCGTCGACAATGGAAGAACCACCCTGGCTATTGGTGCTGAAAGCCACCAGGTCCGTCAAGGACCAGACA
+TCCAGCTCGTGGTCGGGCGGCTCGATGCCCAGCACCCGCAGCAGCAGCCGGGAGGCCTGGTCGGGATCGA
+CACTGGAATCCTCGAGCAATTGATGCACCGCGACGTCGAGAATGCGCGCGGTGTCGTCGGCGCGCTCGAC
+GTAGCGACCGATCCAATACAGTGCTTCGGCGTTGCGGGCGAGCATCAGTGGAACGCCTGCTGTTGTTGTT
+GCTGCTGCTGTTGCGGTTGTTGGTCGTGCGGTTCATACCCGGACGCGTCCACCGTTGGGTCGCACAGCGG
+CTGCGGCAGCGAACGCACAATCTGTGCAGCGCCCAACTCGCGGGCGGCCGCCGAAGCGCGCGGGGCCAGC
+ACCCAGGTGTCCTTGGAGCCGCCGCCTTGGCTGGAGTTGACCACCCGGGAACCCTCAACCAACGCCACTC
+GGGTCAGCCCGCCCGGCAGCACCCATACCTCGTTACCGTCGTTGACCGCGAACGGCCGCAAGTCCACGTA
+GCGGGGCGCCAGCGTGCCTTCGATCCGGGTCGGCACGGTCGACAGTTCCATCATCGGCTGCGCGATCCAG
+CTGCGGGGATCGTCGCGGATCTTTTGGCTAACGGCCGCCAATTCGGCCTGAGAGGCTTCCGGGCCGAACA
+CGATGCCGTAACCACCGGATCCCTCGACCGGCTTGAGGACCAATTCGCGGATCCGGTCCAACACCTCTTC
+GCGTTCGTCATCCAGCCAGCATCGGAGGGTTTCCACGTTCGCCAGCAGCGGCTTTTCGTGGAGGTAGTAC
+TCGATCATGGTCGGCACGTACGTGTAGACGAGTTTGTCGTCACCGACTCCGTTGCCGATCGCACTGGACA
+GCACGACGTTGCCGGCCCGGGCAGCGTTGACCAATCCGGCCACCCCGAGCACCGAATCGGCACGGAACTG
+CAGCGGATCCAGGAAGGCGTCATCAATGCGCCGATAGATGACGTCGACCTGGCGCTCCCCCTCGGTGGTG
+CGCATGTATACCTGGTTGTCTCGACAGAACAGGTCGCGGCCCTCGACCAATTCGACACCCATCTGCCGGG
+CCAGCAATGAATGCTCGAAATACGCCGAGTTGTAGACCCCAGGGGTCAGAACCACGACCGTGGGGTCGGC
+CTCGTTGGTGGCCGCCGAGTTGCGCAGCGCGCGCAGCAGGTGCGAAGCGTAGTCATCGACCGCCCGCACC
+CGATGGGTGGCGAACAGGTTCGGAAAGACCCGCGCCATGGTGCGCCGGTTCTCCATCACATACGACACCC
+CCGACGGCGAGCGCAGGTTGTCCTCGAGAACCCGAAAGTCGCCGCGGTGGTCGCGGATCAGGTCGATGCC
+GGCGACGTGGATTCGCACACCGTTGGGTGGCACGATCCCGACTGCCTGACGGTGAAAGTGCTCACAGGAG
+GTCACCAACCGGCGCGGGATGACACCGTCGCGCAGAATCTCCTGATCACCATAGATGTCGTCGAGGTAGC
+ACTCGAGGGCCTTGACCCGCTGGGTGATGCCACGTTCCAGTCGGGTCCACTCGGGGGCCGAAATGACCCG
+TGGCACCAGGTCGAGCGGGAACGGCCGCTCCTGGCCCGACAGCGAAAACGTGATGCCCTGGTCGATGAAC
+GCACGCCCCAGCGCATCAGCGCGGGCCTTGAGTTCGGACGCGTCCGACGGCGCCAGCTCGGCGTAGATAC
+CTTTGTAGGGGCCGCGGACAATGCCCTGGGCATCGAACATTTCGTCGAAGGCCATCGCATAGACGTCCGA
+CGTGTTGTAGCCGCCGAAGATGCGTTCGCCGCGTGTGGGCGACCGCCGCCGGGTCTCGTTGAGTTGGTTT
+GGCAGACTCACGCGTCTCATGCTGCCTCAAATTCGACATTCCGGCAGACCACAGATTCCGCTTTTGGGCG
+AAAACGTAACCGACTGATAACCTGGGCAGCCGAATCACACCGACAAAGGGAACTTGCACGTGGCCAACAT
+CAAGTCGCAGCAGAAGCGCAACCGCACCAACGAGCGCGCCCGGCTGCGCAACAAGGCGGTGAAGTCCTCG
+CTTCGTACCGCTGTCCGTGCCTTCCGCGAAGCTGCCCATGCAGGCGACAAGGCAAAGGCCGCGGAACTGC
+TGGCGTCGACCAACCGCAAGCTGGACAAGGCGGCCAGCAAGGGCGTGATCCACAAAAACCAGGCCGCCAA
+CAAGAAGTCGGCACTGGCCCAGGCGCTCAACAAGCTCTGACAGCCACCTGCCGACTCATCGGCCGCGGTC
+GGCCACCAACTCGGCGACCTGCCGGACCGCGGATTCCAGCGCGTAGTCCGCATCCGCGACGGCGCCCTTG
+ACGTTAGCATTGAGTTCGGCCACCAACCTCATCGCGGTCGCCACCGTGTCACGCGACCACCGCCGAGCCT
+GCTTCTGGGCTTTCTGCACCCGCCAGGGCGGCATCCCCAGTTGTGCGGCCAGGCGGTACGGGTCGCCGGA
+CTGCGGCCCGACCCGGCCGATGGTGTGCACGGCTTCGGCGAGCGCATCGGCCAACACCACTAGCGGCTCA
+CCGCGCATCATCGCCCACCGCAACGCTTCGGCAGCTCCCGCCACGTCGCCGGCTACCGCCTTGTCGGCGA
+TGTCGAAGCCCCTCACCTCGGCTTTGCCGCTGTGATAGCGCCGTACAGCGGCGGCGTCGACGGCTCCTCC
+GGTATCGGCGACCAGCTGTGAACAGGCCGAGGCGAGTTCGCGCACGTCGGAGCCGACGGCGTCCAGCAGG
+GCGGTCACGGTCTCGTCGTCGACCTTGACCCGCAGCGACGCGAACTCGCTACGGATGAAGTCGGCGCGCT
+CACTGACCTTGGTGATCCGCGCGCACGGATGAACCTGCGCACCCATCGACCGCAGCTGGTTGGCCAGCGA
+TTTGGCGCGCCCGCCACCCGAGTGGACCACTACCAGCACGGTGCCGGCCGGAAGATCGGCGGCGGCCGAC
+TCGATTACCGCGGCAGCGTCCTTGCCCGCCTCCGCAGCGGCCCCCAGCACAACGATCCGCTCCTCGGCGA
+ACAGTGACGGGCTCAGCAGTTCGGCGAGCTCATAGGCACCGACGTCACCCGCGCGCATTCGGCTCACCGG
+GACGTCGGCTGTACCTGCCCGCTGCCGAGCCGAGCGCAACACGTCGGCCACCGCCCTTTCGACCAGCAGT
+TCTTCGTCTCCCAGGACCAGGTGCAACGGCTTAGCCTCGCTCACCCCACGATGGTGTCACGAAGGGCCGA
+CCAGCCCGGACAGCGACCAGGCAAGCAGACATATGACGGCCACCGCCATCGTTTTGCACATGGCCGCGCG
+AAACCAGCGCCAAGCGCCACTGCGCAACCGTGAACACGGTGGCGCCACCGACCAGCAGTACGCCGGGCAG
+ACCTGCGGCCACCGGAACGGTCGCCGCGGGCACACCCGACGCCCAATGCGCCACGCGCAACACCCACCAC
+ACTTCGGGCCCGGTGAACCGGATCAGCACCTGCGCGCCGGCCGGCCACGGCACGACCAGCACGGCCGCAA
+CGCTGCCCAGCACGGTGATCGGCGCGATCACGGCCGCCACCGCCAGATTGGCCACCACGGCCACCAGACT
+GACCCGGCCGGAGATGGCGGCCACCAGTGGCGCCGTCACCAGCTGCGCGGCCGCCGCGACTGCGAGGGCA
+TCGGCCAGCACCTTCGGACATCCGCGGTCGACCAAGCGGCGTGACCAAACCGGCGCGATGACGACCAGTG
+CACCCGTGGCCGCCACGGACAGCGCGAAGCCGATGTCCACAGCAAGATGGGGAGCGGCAGCCAGCAAAAC
+CAGCACGCTACCCGACAAAGCTGGAATCGCCTGCCGCCGGCGCGCAGACAGCATCCCCACGAGGGCAATG
+GCGCCCATCACAGCTGCCCGCAACACGCTGGCCGTCGGCTGCACCAGGATGACGAATGCCACCAACGCGA
+CGGCCGCGCACACCACGGCCGCACGCGGTCCGATCAACCGTGCCGAAACCAGCGCCGCCGCACACACGAT
+CGTGACATTGGCCCCCGAGACCGCCGTCAAGTGCGTCAGGCCCGCCGCACGGAACTCGCGGCTGGTTAAG
+GCGGTGACCGTCGAGGTATCGCCGAGAACCAGGGCCGGCAACATCGTGGCCTGGTCAGCGGGCAGCACCT
+CACGAACCGCGGCCGCGAATCGATGGCGGACGATGTGAGCGGCGCGGTGTACCGGGCCGGCACGGCCCAC
+GGTCGGCCGACCGGTCGCATTGAACACCGCGACCGTCAGGTCGTGACGCGCCGGGCGACTGATACGCGCG
+CGGAACTGGACGGGCTGTCCGACCATCAGCTCGCCGAAGTCCAGCGCTCGCGCGAAAACCACTACCCGGC
+CGGATGTCTCGTCATCCCGCAGCCGTTGAACCGTCGCCCGGAACATCAACCGGCCCCGCCCCAGCGACAC
+TGGGCTCTCGCTGGGGGTGACCGTGACCAGCGCGGAGGTGCCAAATGCCACGGTGATTGGGTGGCGATCG
+ACCGCCTCGGAGCGCAACGCGACCGCAAGCCCGTACCCCGCGCCCACCATACCGACCGCGACCAGGCCGG
+CGCTGATCGAACCCAGTCGCGGAGCGTGCCACGACCGGCGCGCCACACACCACCACAGTGCGCCGCCGCC
+GAGGGCCACCACGACGCAGCACAAGGCACACACGTTGCCGATCGGCCACACGATCCCGGCCGCCGTCACA
+ATCCAGCTGACCAGCGCCGCCGGGACCAGGCGTACGTCCAAACGGGACGCGCCGAAGCCCATATGGCGCA
+CCGGTATCAGACACGGACCAGATTGCGCAGCTTGTCCAGCCGCGCCGGACCGATGCCGTCGACGTCGGCA
+AGCTGGTCGACGCTGGTGAACCTACCATTGCGCTGCCGCCACGCCACAATCGCTGCGGCGGTGACCGGCC
+CGATGCCGGGCAGGGCGTCCAGCTGCTCCACGGTCGCAGTGTTGAGGTCGAGCACCTCAGCTGTCTTAGG
+AGCTGTCTTAGGGCCTGTCGTGGCTGTGCCCGAGGTACCCGCCGGTCCCGGCGTCCCCGCACCGACCGAG
+CTGCCCAGCACCCTCGGCTGTCCCGAGGGCGGAGCTAGCCCGACCACGATCTGCTCACCGTCACCAAGCT
+GCCGAGCCATGTTCAGTCCGACGGTGTCCGCGCCGTCTACCGCTCCGCCGGCGGCCTGTAGCGCATCGGC
+GATCCGCGCGCCCGGCGCCAGGGTGACGAGTCCTGGGGTGTGCACCAGGCCAACCACGCTGACCACCACC
+GGCAGGCCGGAACGGTCCGGCGAGCCCGGGCTTGCCGACGACCTAGGGTTCGTCGGCGAAACCGGCTCTA
+CCGGAGGAAGTTTGGCTGACATTACCGGCTCAGTCCGGTCGCGGATCAAGGTGAATACCGTCACCAGCAC
+CGCGAGGGCGGCGATCACCGCCAATGCGACGGCGCCGGCACGGCCCGGATCTGCGCGTATCCTGTCCGCC
+CAACCTTGCCCACGGGAAGTGTCGGGAAGCCAGCGCGGCAGCAGCGAGTTCGGATCGTCGCGTGGCTCGT
+CGTGGTCTGGACCGTCGTCCGTTGGATCGTGTGGCTCCGGGTCTAAGTGTGCAGATGCGGCGTGCGAGTC
+GATATCCGGGACGGCACCGAGCCGCCTTTGCAGTCGCTCGGCGGGCAGTTCTGTTCGCATGGGCCGACCG
+TAGCTGCGGGGACCGCCAGAACCGGCGCGCACGACGGCGTCGCGCTGCCCTGCTGTGGATCAATCCGAGG
+CTGTGGACAAGCCGCTTTGGCGATGGATCAAGATGGGACAAACCGCGCCAACATCCCCGAACAACCAGCA
+CCGGGCTGCGACGTCCATCCGGACTCGGCTCACCGCGATCGAGAGTGTACTCGGCAACGCGATCCGCGAG
+TGCTGAGCCGCGCGGCCGATCCCCATCCATGGCGTGTGGCGACCGAAGCCGGCGCGCAGCACGCGGGTCG
+CTGACCACGCCGAAAAGCCCGTCAGCCTAGCGCCGGCCTAGCACGGCCTTCAGAACTCGAACGCGGTCTG
+GACGGGAACATCACTGGCAAACGCCGCGTCGAGTCGACGAAGCAGCTGGGAATCTTTGGTGCGCAACCGG
+TTAGCGGCGGCTAACGTCGAAGCGCGGTGCGCTCCAAGGTAAAGGCTGCCCAGTACGTCCCGATCCATTT
+CGATCTCGGCTGCCGCATCGGTCGGGGTACACCGCGCACGGCCGTCACCGATCTTGAGCGCGAACCGGCC
+GCCATCGGATACCTCGAGGACCGTGGAAAACTCGCCAACTTCGTGAGCGTAACCACGCGCCTCGAGTGCG
+GCCGGTACGTTCATGATGCGCAACCACAGGCCGTCCTGGCGCCAGGTAGTGCGGGCCAGTCGGGTATCGG
+TGAGCAGGTGGGGTAACGGGTCCTGTGGATGGGTGATGATGCTGATTCGCTCCATGGAGTCGAGGCCAAT
+CAGGGCCCGCCACAACGCACAATGCGCATCTGCGGTTACCGCCCTGAGTTCGCTGACGCGCGCTAGCTTG
+AGATCGGTGCGATCCACCCGGTACAGCGCGTACCCGTCGGGATGCAGTAACGCGAACGATTCACGGTCTC
+CACCGGGCGCGGCTTTGCATTCTGCCAGCAGCTCGTCCCAGAGCACCTGCGGGCGTAGCAGCCCGCCCGG
+CACCTGCTGGCGCCATCGCTCGTAGATCGCCTCAAACTCGCCGCGATGCTCGGTGGGTCTGACCAACCGG
+ACGCTGCTGCCACCTAGGCCGCCGCCCGGTGCGTCGGCGTGAAAGCGCGCGAAGCGTCGGTCGACCGTCA
+GCTCATGCAAGGTGGTAGCGGGCCCGTAGCCGAACCGGCCGTAGATGCCGCCCTCGCTAGCATGCAGTGC
+CGCGACCGGATAGCCGGAATCGGCTATGCGGCGGTGCAGTTCGGCGCACATCGCGCGCAGCAAGCCGCGC
+CGGCGATGCGTCGGCGCCACCGCGACGAAACTGAGACCGGCGGTCGGGAGCACCACTTCACCAGGCACCG
+CCAACCGCAGATCCATGTACAGCGCCATCCCGACCACCTCAGAACCCGGGCCGGCACCATCGCGGACCAC
+CACCGCTCCGTCGGTGGGCACCAGGGTCCGCCAGGCGGTCGCTGATTCAGGGCCGATGAAATCGGTGAAA
+CTGGCCGCGGCCAGTAGGAACATCCCCGGCCAGTCGTCCTCGGTCGGGCTACACAGGGTCACAGTCACAG
+AATCCGACTGTGGCATATGCCGCGGCCACGTGCACGTGAATATTACGACGACAGTGTCTGGCAAAGGATC
+ACGCGATGCGGGTAGCCCCGCCAGCGTGACGCCACTGCGAGAATCAGCGACGAATTTCGCCGTGACGTTA
+CGCTGGCGGCGACGCTCCCACGTCGACGCATACCCCGACGGCTCCGGCACCGACGTGCAGAGCAAGTACC
+GGTCCCATGGCGGTCACCATGGCCGGCTCACACGCCGGCAGCCGCTCCGCCAGCGCCGCCGCCACGTCGT
+TCGCAGCTGCCGGGTCGGCGACGTGATGCACCGCGAGAGCGGCGGGGCGGTCGCCGACAAGCTGGCAAAC
+CCGGTCGATCATCACCGCCGTCGCGTTGCTCACAGTGCGAACCCGTTGGACCAGAACAAGTTTTCCGTCG
+TCGACTGACAGCAGCGGCTTGAGCGCCAGCGCGGTGCCCAACCATGCCTTGGCCCCACTGATGCGCCCGC
+TGCGGCGCAGATTGTCCAACCGCGCTACAGCGACGAACGCGTGAATCCGGCTTACCGCCGCAGCCGCTGC
+GCGCGCGACCGTATCCAGCTCATCGCCTGCGGCGGCTGCCCGCCCGGCCGCCAGTGCCGCGAAACCGACG
+CCCATCGCGGCCGACCTCGAGTCGATCACCCTAACGGCGGGACCTAGTTCCGCCGCGGTCAGCTCGGCGG
+CTCGAAAGGTACCCGACAGCGCCGACGAAATGTGCACCGCCACTACCCCGTCGCCGCCACTGTCCGCCAA
+CGCCCGTTGGTAGGCGGCGGACAGCTCAACCGGGGTCGCCCCAGCGGTGGTGGCGTGGCGCTTGTGGATG
+TCATCGGGGATTTCGTCCACACCGTCGCGCAGGTCGAGGCCGTCAAGCAAGATATGCAGCGGGACCTGGC
+GGATCGACCACTGTTCGCGCAGGTCGGCCGGCAGTCGACACGACGTATCGGTCACCACCACAACGGTCAC
+CGGCGCCGCTCTCCCCCGCAAGCGGGAGGTGCCCCCACCTCATCGCTTCGCTCTGCATCGTCGCCGGCGC
+GGGGCATGTCTCAGCCGCGCGATTTCTCGTTCGGCACCCCGGCTTCGGCCAGTGCCTTGAGCATCAGTTC
+GGCGACCGCCTGGTGGGCTTCAAAATTCCAGTGAATGCCATCACGATTACCATATCCACTCAATATCTGT
+TCTGCGACAGCGGCTTTGAGATCAACTAGAGGAATGTCATGGTGCTGTGCCCATTCCGTGATCGCCGCCA
+CCGTGCCTGCGCGGCCGTGATGGGCCTTGCCGTAGGTCTCGGCGATATGCACCGAGGGCAGCGATGCGAT
+GATCGGTATGCCCGGACGATTGAAATCAATTGCACCACGGGTCTTTTCAAGGTACTCAGCGGTCAGGTGC
+GGCGGCAACGCCGCACGGGCCACTGGCGACAGTCGCGGTTGAACCCAGGCGTAGCCGTCGCGGACCCACC
+GCCGCAGCCAAGACGGACGTACATAGCGGATGAGCTCACGCAGCGCCGTCGGTAATACCGACGGCAGCGA
+ATCCATTCCGCCGGTCGCGAAGATCACCGCTCCGGCCCTGGGTAACGCCGCCCAAGCGCGCGGATCCTGG
+GTTGCCGCCCACCAGACATCCCGACAGGTCCAGCCGATGCGGCCAATCAGCTCTAAATCCCAATCTAGTT
+GGGAAGCAACAATATTGGGCCAGATACGGGGGTCATCGGCAGGCAGGCCGCCGGTGGGCCCGTAGTAGGC
+CAGCGAGTCAGCGAAGACCAACAATGCGGGCCTGCGCCCGCGCCTAGAGGACATCGCTGGAGACCTGCGC
+CGAAGCATTCCACACATCAAGGCGCCACCGGATGCTCTCGAAGTCGGAGCCCGGGGCCCAATGGCCACTC
+AGCTGAGTCCAACTGGCATTGCCCATGCCGCCCAAAGCCGGCCAGTTGGCCACCGGCAACTTCAGCAGCG
+CCGCCGACAACACGGCGATCAGACCCCCATGGGCTACCAGCACCACCGGGCGATCCGGCTCGTCAGCGCC
+ACCCCATTCCGGTTCGCTGGCAACCAACTCGGCAACCAACGGCCGACTTCGGGCAGCCACGTCAACCCTG
+CTTTCCCCGCCGTGCGGCGCCCAGGTCGCATCCTCGCGCCAGGCCAACCGGGCGCCCGGGGCATCAGCGT
+CGATCTGAGCGTGGGTTAAGCCCTGCCAATCGCCAAGGTGAGTTTCCCGCAATCGGGTGTCGACCCGGAC
+CACAAGGCCGGTGCGCTCGCCCAGCTTGACCGCCGTGTCATATGCGCGGCGCAGGTCCGACGATACGATC
+AGTAGCGGCTGCCGCTTGCCCAGCACCTCGGCGGCCGCGACCGCTTGGGTGCGGCCAAGTTCGCTCAACT
+CAGTGTCCAGCTGGCCCTGCATCCGGCTACCGACGTTGTAGTCCGTTTGTCCATGCCGCAGCATCACCAG
+TCGCCGCGCTCTCATTGCGCACCCGCTGAGTTCGCCGATAAATCAACCGGCACCACCGGGCAGTCACCCC
+ACAACCGGTCCAGGGCGTAGAAATTGCGGTCGTCCTGATGCTGGATGTGCACCACGATGTCCCGGTAATC
+CAACAGCGTCCAGCGACCCTCGCGGGCACCCTCACGGCGGGCCGGCCGGTAACCCGCCTGTCGCATTTTC
+TCCTCGACCTCATCGACGATGGCGTTGACCTGCCGCTCGTTGGAGCCCGAAGCAATGACGAAGCAGTCGG
+TGATGACCAGCTGCCCGGAGACATCGATGACCACGACGTCATCGGCGAGCTTGGCGGCGGCCGCGCCGGC
+GGCCACCCTCGCCATGTCGATGGCTTCCCGGTTGGCGGTCATAGGCCATTCCCAGCGGCCAGGCTGGTCG
+TTGAACGCGCGCCCGCGTCGCAGGCGCCACAGTAGAGCCGGCACTTGGAGACATACTGCACGACGCTGTC
+GGGCATCAGGTACCACAGCGGCCGGGACTGCTCGGCGCGCTGACGGCAGTCGGTCGACGAAATGGCCAGC
+GCCGGGATCTCGACCAGAGTCAACGCATCCTTGGCCAGCTGACCCAGCAGGCTAGTGATGTGTTCGTTGC
+GCAACTCGTAGCCGGGCCGGCTGACCCCCACGAACCGCGCCAATTCGAACAGCTCCTCCCAGCCCTGCCA
+GGACATTATGGAAGCTAGCGCATCGGCGCCGGTGGTGAAGTACAGCTCAGAGTCCGGGTGCAAAGCATGC
+AGATCGGCCAGCGTGTCCTTGGTGTAGGTGGGTCCGCCGCGGTCGATGTCGACCCGGCTCACAGAGAATC
+GGGGATTGGAGGCGGTGGCGATCACCGTCATTAGGTAGCGGTGCTCGGCGGCGGAGACCTGTCGACCCTT
+TTGCCAGGGTTGCCCGCTGGGCACGAATACCACTTCGTCGAGATCGAACAGGTCGGCCACCTCGCTGGCG
+GCAACCAGGTGGCCGTAGTGGATGGGGTCGAACGTCCCACCCATGACTCCCAATCGACGCCCATGCACGA
+TTGGCCAGCTTACTGGAGTATCTTGCCGCAGTTCCGTTCGCGGCAACTGCCAGCCAGCCTAAGCGAGCAG
+CCATTGATAAGGCAGCACGATTGGTTATTCCTAAGCCTTTGCGTGATCATCTTGGTCTCGTTCCGGGTGA
+GGTCGAGGTCGTCGCCGACGGGGCGGGACTGGGTGTCGCGACCCTCGCCGGTGACTCCCTCGGCGAGCGG
+CATGGCCTACCGATGATACCCGCGGGCAGTGCGGCGCGATGCCGGCCAGCGTTAGCACCGTGCTCGTGGA
+CACGAGCGTCGCGGTCGCACCGGTGGTCGCCGATCACGACCACCACGAAGATACCTTTCAAGCGCTACGT
+GGCCGCACCCTCGGTCTGGCCGGGCACGCGGCTTTTGAACGCAGGACGCTGGCGACCGTGGCGAAGCTGC
+TTGCACACACATTCCCGGCGACCAGGTTCCTCGGCGCTGGGGCGGCGATGTCGCTGCTACCCGAACTCGC
+ACCGGCCGAAATCGCCGGCGGAGCCGTCTAGGATGCGCTGATCGGTACGGCTGCCAACGAGCATCGGCTC
+CCCCTGGCAACCCGCGACCGGCAGGCGCTGAAGGTCTACCGCGCGCTCGCAATGGAAGCCGAGCTGCTGG
+CCTGAGCGTCGCGGTTGCGCGGCCAATCACACCCGCGCCGCTGCCAGGCCAACGGCTGCCCAGCTGCCCG
+GTCCCTCACGTTTTTCACCCGATGTACCCGCAACGATCTACTCGGTCGTGTAGAAGGGGTCTGTGGATAA
+TTTGCCGATCGAATCAGCCGAGTCGACGCGGTTGGCGAAGGCGGCGATGACCCGACGGTTTTACACCCGC
+TCGGTGGTGAAAGGCGAGATCACGCTGCCGGCCGTGCCGAGCATGATCGACGAGTACGTGACAATGTGCG
+CCGGCCTTTTTGCGGGTGTGGGCAGAAAGTTTTCCGACGAAGAACTTGCTCATCTTCGCGCGGTGCTCCA
+GGGTCAGCTGGCAGAGGCGTACGCGGCCTCCCAGCGTTCGACCATCGTCATCTCATACAACGCCCCCATG
+GGCCCGACCTTGCACTACCAAGTCCGAGCCCAATGGCGGACGGTGGCGCAGGAATACGAGAACTGGATCG
+CCACCCGTGAGCCGCCGCTCTTCGGTACCGAACCAGACGCACGTGTGTGGGCGCTGGCCAACGAAGCAGC
+CGATCCTACGACGCATCGGGTGCTCGAAATTGGCGCCGGAACCGGGCGTAACGCCCTGGCGTTGGCACGG
+CGCGGACACCCGGTCGACGTGGTGGAGATGACCCCGAAGTTCGCCGACATCATTCGCTCCGACGCCGAAC
+GAGATTCCCTCGACGTGCGCGTCATCATGCGTGACGTCTTCTCGACCATGGACGACTTGAGGCAGGACTA
+TCAGCTGATGGTGCTCTCCGAGGTGGTGCCGGACTTCCGGACGACGCAGCAGCTGCGCAATCTGTTCGAA
+CTCGCTGCCCAGTGCCTTGCTCCCGGTGCCCGCTTGGTGTTCAACGCCTTCCTGGCGAACGGAGATTACG
+CACCCGACCAAGCCGCGCGTGAGTTCGGGCAGCAGATGTATACCGGGATGTGCACGCGGGCCGAGATGTC
+TGCTGCAGCGGCCGGCCTTCCTCTCGAACTCGTCGCCGACGACTCGGTATACGACTACGAGAAAACGCAC
+CTGCCACCGGGCGCCTGGCCGCCCACCAGTTGGTACGCCGACTGGATCCGTGGCCTCGACGTGTTCACCA
+CCAACGTTGAGAGCTGCCCGATCGAGATGCGCTGGTTGGTGTTCCAGAGGAGGCGGTGAGCAGTCGCAAA
+AGCCCCCGAAACCGGTCGGATTTGGGGGCTGGTACGTGAATTAGGGTGACCACGGCAAGCGTGACCCGCC
+GGCGACTGCAGCGAAGCCGGGTCTGTTGGTGACAGTGTGTATGTCGGGGTTTCAGGCGGCAGGTTCGAGG
+GTGACCCCCAATCCTTGGGCTTCGAGTTTGGCGACGAGGCGACGTCGTTCTTTGTCGGGATCCATGCGGG
+TGGTGAAGTAGTCGGCGCCGAGATCCTGGTAAGGCCGGCCGGTGGCCAGCACGTGCCAAATGATGACGAT
+CAGCTTGTGGGCGACGGCGATGATCGCCTTCTTGTTGGCAGCGGGACTGCGGAAGCCACCGAACTTGCGG
+ACCTGGCGACGGTAGTACTCGCGCAGGTAGCCATCGGTGCGCACGGCGGCCCACGCGCACTCGACCAGGA
+CCGGCTGCAGGTGCTGGTTGCCTGTGCGGCGGGCACCGTGATGGCGTTTGCCGGCCGATTCGTGGTTGCC
+CGGGCACAGCCGCACCCACGAGGCCAGATGCTCAGCCGAGGGGAACCAGGCCGCCGGGTCGGCGCCGATT
+TCAGAGATGACCGTCGCCGAGGCACCCACCCCGATCCCCGGGATCGATGCAATCAGCTCGCGTCGGGCAC
+AAAAGGGATGCATCAGCTGCTCGATCTGCTCGTCGAGAGCACCGATCATCGCATCGAGCTGATCCAGATG
+AGCCAGGTGCAACCTACACATCAGGGCATGGTGATCATCGAAGCGCCCTTCCAGCGCCCGCTGCAGATCG
+GGGATCTTCGAGCGCATACTGCCGCGCGCCAGATCAGCCAGCACCGCCGGGCGGCGTTCACCGTCGATGA
+GCGCCTCCACCATCGCCCGCACCGACTTGGGGGTGACCGAGGACGCCACGCTGTCGGCCTTGATCCCGGC
+GTCTTGAAGCATTGCCCAGGCGCTGCAGCTTCGAGGTGCGATGCTCGACCAGCTTGCGGCGGTAGCGGAT
+CACGTCGCGGGCGGCCTTGATGTCGGCGGGCGGAATCAACCAACCCCGCAGCAGACCGCATTCCAGCAGG
+TGCACCAACCACTCGGCATCCAAGAGGTCGGTTTTGCGGCCCGGCCGTTCTTCACGTGCCCGGCATTGCA
+CACCAGCAGCTCACTCGCCGTGGGCCAACAACGCGTGATAAGCGGGCGCACCAGCGCCCATCATGTTCTT
+TTACGACTGCCCGCCCGGCCTACACCGGCAGTAGCTGGTCGATCACCGTGGCCAGCTGCTTGGCGGATCG
+GCATTCGTGCATCGTGATCACCTCTTGGTAGCGCGGCACCGCCGAGTCACCGCTGCCCCACAGATGCTTG
+GGCTCCGGGTTGAGCCAGTGCGCGTGCCGGCTGGCGGTCACCATGTCGGCCAGCACGTCGGTGGCCGGGT
+TGCGGTAGTTGGTGCGCCCGTCACCAAGCACCAGCAGCGAGCTGCGCGGCGACAGCACATTTGGGAAGCC
+CTGCATGAACGAGACGAACGCGTTGCCGTAGTCGGAATGGCCGTCGCGGGCATACACACCAGCCTCCCGG
+GTGATCCGCTGGATCGCTATGGCCAGGTCCGATTCCGGCCCGAACATATGGGTCACCTCGTCGGTGGAGT
+CGATGAAGGCGAAGACGCGAACCCGGGAGAACTGTTGGCGCAGCGCGTGTACCAGCAGCAGCGTGAAGTG
+GCTGAAGCCCGCGACCGAGCCCGACACGTCGCACAACACGACGAGTTCCGGGCGCGCCGGGCGGGGTTTG
+TGCAACACCAGGTCGATCGGCACGCCGCCGGTGGACATCGACTTGCGCAGCGTCTTGCGCAGATCGATCG
+ATCCCGCGCGGGCGCGGCGCCGCCGGGCGGCCAACCGGGTCGCCAGGGTGCGGGCCAACGGGGCCACCAC
+CCGGCGCATCTGGCGCAGCTGCTCACCCGAGGCACGCAGAAACTCGACGTTCTCGGAAAGCTGTGGAATT
+CCGTACATCTGGACGTGCTCGCGGCCGAGTTGCTCGGCTGTGCGCCGCTTGGTCTCGGCGTCGACCATTC
+TGCGCAGCTGCGCGATCTTTTGTGCGGCAAGCGCTTTGGCAATCTGTTCCTGGGTGGCTGTGGGCTCATC
+GCCGTAGGGAGCAAGCAGGCCCGCCAGTAGCTTGCCCTCCAGTTCGTCCAGCGCCATGGCCTTGAGTGCC
+TGATACGACGAGAACGACGGACCGCGGCTGGAACTGTACTTGCCATAGGCCTCAACGATCCGCGCGATCA
+TCTCCACCAACCGCTCGTCCTTGCCGGCCAGGTCTTGGTTGTTGGCCAGCAGATCCAGCAGCAGCTGCCG
+CATAGCCTCGACATCATCGGGCGGCAAACCCCCGGAGCCTGCCGACTCGTCTTCCGTGGTGATGACCGCC
+CGAGCCCCCAGTGCCGCGGGAAACCACAGGTCGAACATGGCGTCATAGGTATCGCGGTGGTCAGGCCGGC
+GCAGCACCGCACAAGCAATGCCCTCCCGCAACACCTCACGATCACCCAGCCCGAGGGTGGCCATCACCCG
+GCCGGCATCCACCGTCTCTGACGGGCCCACCGAAATCCCGCTGCCACGCAGCGCTTCCACAAAGCCCACC
+AAGTGTCCGGGCAGCCCATGCGGGGCGAGTGGCCGGGCAGCACGAATACGACGGGCGGCCACTAGTTCAA
+CCTGAGCTCTCCGGTGGCCCGTTGCTGGTCGGATTGGTGCTTGAGAACCACGCCGAGCGTGGCGGCAACG
+ACCGCATCGTCGATGGTGTCCAGTCCCAGTGCCAAGACGGTGCGACCCCAGTCGATGGTCTCGGCGATCG
+ATGGCACCTTCTTAAGCTGCATGCCGCGCAGCACGCCGATGATGCGCACCAACTCCTCGGCGAAGTGCTC
+GGGCAGCTCGGGAACTCGGGATAACAGGATGCGACGCTCCAGCTCGGGGGTCGGGAAGTCGATGTGCAAG
+TACAGGCAGCGACGCTTGAGCGCCTCGGACAGCTCACGGGTGGCGTTGGAGGTCAGCAGCACGAACGGCG
+CCCGGGTGGCGGTCAGGGTGCCCAGTTCGGGGACGGTCACCGCGAAGTCGGACAGCACCTCCAGCAGCAG
+GCCCTCGATCTCGATGTCGGCCTTGTCGGTTTCATCGATCAGCAGCACGGTGGGCTCGGTGCGCCGGATA
+GCGGTCAGCAGCGGACGCTGCAGCAGGAACTCTTCGCTGAGCACATCGGTTTTGGTGGCCTCCCAATCTC
+CCGAGCCGGCCTGGATACGCAGGATCTGCTTAGCGTGGTTCCACTCATACAGGGCGCGAGCCTCGTCGAC
+GCCCTCGTAGCACTGCAGCCGGACCAGACCGGATCCAGTGGCCTGCGCCACGGCGCGCGCCAGCTCGGTC
+TTGCCGACCCCGGCGGGGCCTTCCACCAGCAGCGGCTTGCCGAGCCGGTCGGCGAGAAAGACCGCCGTCG
+CGGTGGCAGTGTCGGGCAGGTAGCCGGTCTCGGCCAGCCGCCGCGAGACGTCGGCGATGTCGGCGAACAG
+CGGCGTGGGCCGGGCGGGCACGGTCACGATCGGGTCTCCTCTAGCCAACGGCGTCAGGCCGGACGGGTGT
+GGCCGGCTCCCCATGCGATCCACTTGGTCGACGTCAATTCCGGTAGTCCCATCGGTCCGCGGGCATGCAG
+TTTCTGGGTGGAGATGCCGATCTCGGCGCCGAAGCCGAATTGCTCGCCGTCGGTGAACGCCGTTGATGCG
+TTCACCATCACCGCGGCCGCATCGATCTGTTCGGTAAAGCGTTGGGCCGCATCAAGATTGGTGGTCACAA
+TCGCTTCTGTGTGCCCGGTGCCGTATTCGTTGATATGGGCGATGGCAGCGTCGACACCGTCGACCACCGC
+CACCGCGATGTCCAGCGACAGGTATTCGCGGCGCAGGTCGGCCTCGTCCGGGTCGAGATGTACGGTGACA
+CCGGCGTGCTGCAGGGCGGCCAGCAATCGAGGCAACGCCGTTTCGGCGATCGCTGCGTCGACCAGCAGCG
+TCTCGGCGGCGTTGCAGACGCTGGGCCGCCGCGTCTTGGAGTTCAGCAAGATACGCTCGGCCACGTCCAG
+GTCGGCCGCTTGGTGCACGTAGACATGGCAGTTCCCGACGCCGGTCTCGATGGTGGGCACCTGGGCATCG
+CGTACGACCGCCTCGATCAGGCCCGCTCCCCCGCGTGGAATCACCACATCGACCAGGCCGCGGGCCTGAA
+TCAGGTGAGTGACGGTGGCGCGGTCGGCAGCCGACAGCAGCTGGACCGCGTCGGCCGGCAGCTCCAGGCC
+GACCAGCGCGGTGCGTAACACCGCCACCAGGGCCTCGTTGGACTTTGCGGCCGACGAGCTGCCGCGCAGC
+AATGCAGCGTTACCCGACTTGAGTGTCAGCCCGAAGGCATCCACGGTGACATTGGGGCGGCCCTCGTAGA
+TCATGCCGACCACGCCCAGGGGGACGCGCTGCTGGCGCAGCTGCAGCCCGTTGGGCAGGGTATAGCCACG
+CAGCACTTCACCGACCGGATCGCGCAGTCCCGCGACTTGCCGCAACCCGGCGGCGATACCGTCGACTCGT
+TGCGGGTTCAAGGACAACCGGTCCAGCATGGCGGCCGGGGTGTCCGCCTCGCGCGCCGCGTTCAGGTCTT
+CGGCGTTGGCCGCCAGGATCTGGTCGCGGTGAGCCAGTAGCTCGTCGGCAGCCGCGTGCAGCGCGCGGTC
+TTTGACAGTCGTCGGCAGCGATGCCAGCCGGCGGGCGGCCACCCGGGCGCGGCGTGCGGCGTCGTGCACC
+TCTTGACGCAAGTCGAGCTGCGACGGTGCTGGCACGGTCATTGCCCCAGGGTAACGGGCTTGCGCTGGCC
+AGGTAAGACGACCCGCTCCGGACGGGCCGCGCAGCGATCCGGCTGGGTGGTTGCTATGCGATCAGGCGTA
+CTTGACGGTCGCCCCTGATCAGCTTGCCGATAATCCCGGCAAGACGCTGGTAGGACTTCTCGCGGCCGCC
+GAAAGAGCTAAACACCAAACCGATTCGTCGCGCCGGGCAGGGGCGACGAATCGGGCGAGTTCCAGCCGGC
+TTCGCGTGGTCTCGACGGCGGCCGCGGTCTGCGGAATCAGTGTCACCCCCAGCCCGCCGGTCACGCACTG
+CACGACGGTGGCCAGCTACACCGCCCGGGTGTTGGGCAGCATCGAGCGTCTGGTCGCGTAGGCAGTGCCC
+CTCATGCAGTCACAACAAAGTCAGCTCTGACAGCGCGGTCAGCGGCACCCGCTGCTTGCCGGAAAGACAT
+GCCCTGGGGGTGCACCGAGACCGGCTTCCGACCACCGCTCGCCGCAACGTCGACTGGCTCATATCGAGAA
+TGCTTGCGGCACTGCTGAACCACTGCTTTGCCGCCACCGCGGCGAACGCGCGAAGCCCGGCCACGGCCGG
+CTAGCACCTCTTGGCGGCGATGCCGATAAATATGGTGTGATATATCACCTTTGCCTGACAGCGACTTCAC
+GGCACGATGGAATGTCGCAACCAAATGCATTGTCCGCTTTGATGATGAGGAGAGTCATGCCACTGCTAAC
+CATTGGCGATCAATTCCCCGCCTACCAGCTCACCGCTCTCATCGGCGGTGACCTGTCCAAGGTCGACGCC
+AAGCAGCCCGGCGACTACTTCACCACTATCACCAGTGACGAACACCCAGGCAAGTGGCGGGTGGTGTTCT
+TTTGGCCGAAAGACTTCACGTTCGTGTGCCCTACCGAGATCGCGGCGTTCAGCAAGCTCAATGACGAGTT
+CGAGGACCGCGACGCCCAGATCCTGGGGGTTTCGATTGACAGCGAATTCGCGCATTTCCAGTGGCGTGCA
+CAGCACAACGACCTCAAAACGTTACCCTTCCCGATGCTCTCCGACATCAAGCGCGAACTCAGCCAAGCCG
+CAGGTGTCCTCAACGCCGACGGTGTGGCCGACCGCGTGACCTTTATCGTCGACCCCAACAACGAGATCCA
+GTTCGTCTCGGCCACCGCCGGTTCGGTGGGACGCAACGTCGATGAGGTACTGCGAGTGCTCGACGCCCTC
+CAGTCCGACGAGCTGTGCGCATGCAACTGGCGCAAGGGCGACCCGACGCTAGACGCTGGCGAACTCCTCA
+AGGCTTCGGCCTAACCGGGATCTGGTTGGCCGGGAATCAATGAGTATAGAAAAGCTCAAGGCCGCGCTCC
+CCGAGTACGCCAAAGACATCAAGCTGAACCTGAGCTCAATCACCCGCAGCAGCGTGCTCGACCAGGAACA
+ACTATGGGGAACCCTGCTGGCCAGCGCCGCAGCGACACGAAATCCGCAGGTATTAGCTGACATTGGCGCT
+GAAGCGACCGACCATCTGTCGGCTGCAGCCCGCCACGCAGCCCTCGGAGCCGCGGCCATCATGGGCATGA
+ATAACGTGTTCTACCGTGGCCGCGGCTTCCTTGAAGGCCGGTACGACGACCTGCGCCCCGGACTGCGGAT
+GAACATCATCGCCAATCCGGGCATACCGAAAGCCAACTTCGAGCTCTGGTCCTTCGCAGTGTCCGCGATC
+AACGGGTGCTCGCATTGCCTCGTCGCCCACGAGCACACGCTGCGTACGGTAGGTGTGGACCGAGAGGCGA
+TCTTTGAAGCGCTGAAAGCCGCAGCAATCGTTTCAGGCGTTGCACAAGCGCTGGCCACAATCGAGGCACT
+AAGCCCAAGCTAAGTGTCTGTACGCGATGACGCCGTGCTGGGTGACACCGGTGCGACCAACACGGTACTG
+TGGGCGATCGGCGGCGGCGCCTTCCACGGAGTCAACTTCGACAACGCATCCGACACCCGAAGCCTGTAGT
+CCCTCATCACCTCTCCGTCCTCGTCCCAGAAGTCGTCATATTCTTGGTCGAGGTCGGCGATCTGCGCAGT
+GAATTGCCCAAGCGCGTTGTTGTCGATCAGAATCTGCCTCTCAGCACGGTTGTTGTAGATCTGCGCCAGG
+GGCACCATATCGTGATGTGCCCATTCATAGGCCCGCACGATCTCGTGGATCTGCCTCTCGACCTCAGACA
+GCTGCACACAGAGGTCGGTCAGCCACCTGACAAACGGCTTGGCTGCCTCCATCAACTGCATCACCACTGG
+ACCCGCCCAGGCGTCCATCAGAGACAGCAGCGTTCGGTTGAACGACCTCTGCACGGCCGTCATTTCCACA
+TCCAACGACCTCCACGCCCTGGCGGCAGCCAACATCGAGTCAGGACCGGGGCCGGCATATATGTTGGCGG
+AGTTGACCTCCGGTGGGTACGCTTCGAAATGCATCTGTTTGTTCGTTGTTCCGTCGGCTCGTGACGACTG
+TAGTGACTCGTTAACTAAAGGTCTTGATGTTGTCGGCCTCGGCGGTCGCATACTTATCGGCGCCAGTGGT
+CAAGGCGTGCGCAAACTCCTCAAGAACCACCGCCGCCGCAGCGATGGTCTGCCGATACTTCCTTGCGTAC
+TCGACCAGGAACGTCGCCGCCTTCTCCGACACCAGATCCGCAGCCGGAGGCCGCACAGCGGTTGTCATCG
+GGGCCACCTGAGCATCGCTTTGGATCGCACGATCGCGAATCCGTCGTACCTCCGTGGCCGCCACGGTCAA
+CGCCTCGGGATTTGTGATCACAAAAGACATGCCGACTCCACTCCGCGATTAACGAACCCCCGGCACTGCA
+CCGGGCTGATCAACCACCGGTTGTTTGCGCTGCGACTGCCCACGTTGAGAAAACGCAACGACTTCACTGG
+CATAATTATCCAACAGACGAAGGGATCAATTCCGGGTAAGCCGCTGCAAATCAAGCCGACTCAAGGCACA
+CAACGCCACCCGACGATACCCCCCATGCTGACGTTCAAAGCAGTAGGGATGTAGCTTACCATGCCCCAAT
+GGCCGTCGGAGGCCAGCCACCAGCGCACATGCCTGCACGGTGCACCTAATCGGTGCCGGCTTCCAGCGGC
+CGGCAGTTGACCCGCGATGACAGACACGCCCAGGCTCGTTGAGGCCGATCGCGTTCTCACACAGCGCATT
+ACGGCTCGTGACAGATGAGGGAGTAGAGCGGGTCGGCAAGGGAAACCCATCATGGCGCCGGGCTCCGCCC
+CGGGTTGGGCCAGTGCGATGGCTGCGACGTCGTGGAAAAGCGCGGTGGGGTGCTCGGGCATGACGGATGG
+GCACTCATCACATCCTCCTGCTCCACGGCAGTGTTCGGCTCGCACCGTCATTGTGCTGATGGATCAGAAC
+GTCCGCTCGCACGCCGGACACCGCGCCGCGCACCGAGGTAGCCGACGCTAGCCACCAGGAACGGGACCAA
+ATAATTGATCACCATCCGTACCCACGTGCCGATCGTCGCGGCGCCCTCGGCAAGGGTGGCACCCTGATTC
+ACCGCACATAGCACGGTACCCACGATCAGCGCCGTCGGAGCTGCGGTGCGCAGGGTGTGGCCGCGCAGAA
+ACAGACCGATCGCTTGGCCAACCGTGTCCCACCGCTCGTCAGCGTCGCGCAGGCCCACGATGCTCGCCGG
+CCGCCGCTGGGGATTGGTGCAAGTCGCGGCGAATTGCCTGTTGCGCCTTCCTTTGCCGCTCGTCGATAAC
+CCGACCCAGCTCCTGCAGCAGCATCGGCTTGTTCATCACGACCTGCTCAAGGTGCTCCCGGCCGATCTGC
+AGCGCGGTCACCTCTTCCAGCGCTACCGCACCGGCGGGGTCGGGTTGCCGAGTCAGCGCAGTCAAGCCCA
+GAAACGTGCCCTTTTTGAGGGTGGCAATCGCAACCACGGATCCGTCATCGGTCGTAACCGTCAGCCGCAC
+GCTGCCGGCGATCACGAAGGTGATACCCATGGGAACCACACCCGCGTGCTGCACGATCTCATCAGTGCCG
+TAGCGCACCAGCCTCGCGTACCGAGCCAGCGACTGCTGATCGCTAGAGCTCAGTCGCAGCTCGGGCCCCA
+CCACCGTGCGCAGGGCGGACTCCACACGTTCGGCCGTCGAGAACTCGTCGTCGGCCTCGTCGAGGTGTAG
+CCCTTCCCGACGCGCGGCGTACCAGACCCAGCGCAGAAACGTTGCCTGCGTTGGGCCTTCGTCGGCCGGT
+GATGTCAGCCTGACCGTCGTTCGATACTCGGCGGCTCCTCGGGCAATTGTGGCGGGCACGACCCCGGGCT
+TAACATGCGGTAGCGCGCTGGCAGCCCTGTTCAGCATGGCGCATACCTTGTCCGGGGGATCGGACGTGGA
+AAATGTGGTCGTGATCGAGCATTCGTGCGCCCCGGCCGGCCGGCTGAGATTGGTAAACGCGGTGGTGGCC
+AACATCGAGTTGGGCATGATCTGCAGTCCGCTGCCGGTGTCGATATGGACAGCCCGCCAGTTCACCTCGA
+CGACTCGTCCGCGGGCTGTGGGTGTTTCCAACCAATCATCGATCCGAAAGGGCTGTTCGAACAGCATGAA
+CAAGCCCGACACGATCTGGCCGACGGAGTTCTGCAGCATCAGGCCGATGACGACTGACGTCACACCTAAC
+GCGGCGAACAGTCCACCGACCCGCACCCCCCAGATGTAGGACAGGATCACCGCCAAACCTATGCCGATCA
+GCGCGAAGCGCGCGACATCGACGAAGATGGCGGGTAGCCGCTTGCGCCAGCTCTGTTGGGGCGCACCCTG
+AAACAGGGTGGCATTCAGTAACGACAGCAGCAGCACCAGCACCAGAAATCCGAACGCTGTCGTGAGCACC
+CGCACGGTGGGGTCCTCGGCCGGGACTTCAGATGCCTTGACAAGCAGCAGCAAAACCGCGCCCAGGGGTA
+GCAGGTAGTTTCGCAGCAGACTTGCCTGCCTGGCCAGATGGCTGTTCCGTCGGACGAGTATGTTGTGCAG
+TTCGGTGAGAACGATTAGCCCGGCCGGCAATCCGATCGCAATGCCAACGGCCCAGTAGAACCATGTCGAG
+TCGAGCAGGTTCATGATCGCTCCGACAATCGGTAGATCGGCTCTTCTAACCCTCCGACAGAAATCGTGCC
+CGCAGCCGTGAACTGCCACACGTCTCGCATCGCCTCATACACCTGCGAGGTGACATAGATGCCGGGCTGT
+GGTGAACCGCTGTGCATTTGGTAGGCCAGACTCACTGCCGCGCCCCACATGTCGTAGACGACACTTGATC
+TGCCGACCAGCCCGCTAATGACGTCCCCGGTGTTGATACCGACTCGCAGGTGCAGATCGTTACCGGTTTG
+GCAATTGAACCGATCGACGATGCGCCGCATCTCTAGGGCGAAGTCGACGGTTCGGGGAATATTGTCCAGC
+CGTGGCGTGGTTACCCCGCAACCGGCGAGATAGCCATTGTGCAGCGTGCGAATGCGTTCGACACCAAGGT
+GTTCGGCGGCCGAATCGAACTGGCGGACCAGCTCGTCGACAATTTTGACCAGTTCGTTACCCGACAGGCC
+GCTGGAAATCTCGTCGACACCCAGGATGTCGGCAAACAGGACGGTGACATCTTGGTGCTCCTGCGCAATG
+GTCTGCTCCCCAAGGCGGTACCGCTCGACAACTGGCTCGGGCATCATCGATAGCAATAACCGGTCGTTTT
+CCTTGCGTTGCTCGTTGAGCAGCTCCTCTTTGGTTTGCAGATTCCGACTCATCTCGTTGAAAGCGGCTGT
+AAGATCACCGATTTCGTCGCGTGACTTTACCGGAATGTTGACTTCGTAGTCGCCTGCGCTGATCTTCTGG
+GTGCCAACCTCGAGCCGCCGGATTGGCCGCACCATCGCATGGGCGATCAGCATCGACGCCACACAGATGA
+CGACAATGATGCCAACTGTAACCAGCACAAGCGCCCTGCTGAACGACGCGACGGCCGCGAACGCCTCAGA
+ATCGTTCCGCGTTGCCAGGATCGACCAGTGCAGATCGGAGTCCGGCACATTCAGCGGCGCGTAGGCCTCC
+AGTTCCCTGCTACCCGTGTAGTCGGTGGAGGTGACGGTTCCGGTCTGTCCGCGTTGGGCGGCGCGCAGTC
+CTTCGGTCGCAACAGGCTGCAGCAGCGTCGTCCCACCGAACTGGATCGCTCTGTTGACCACATCAAGTGA
+CGTGCCTGCTGCCACAACCTGTTTCCGGTATTCCTCCGGGTCTTGCAGGAAGAGCCGAGAATCGGACCGC
+ATCAGACTGTCCGGACCGGCGAGATAGGTTTCCGTCCCACTACCCATGCCAGCCGCTTGCCATTGCCTGT
+CGGCGGTCATGATCTTATTGATCTTGTCGATCGGCAACGGCAGCGCCAAAACGCCCTGAGTTTTGCCGCC
+CGCTTCGACCGGTGCCACCAACCACGCGGTCGGCACGCCGAGTTGAGGCTGATACGGCTTGAAGTCGGTA
+ATCCAGGTAAAGTCGACGGCGTTGGCGCCCAACGCTTTAAGGTAGGCGTCACGCAGATTGGATTCGCGAT
+ACGGCCCGGTCAGAATGTTGGTACCGAGGTCGGGGTCCTTGCTCAGGGTATAGACGATATTGCCCCGGGT
+GTCCAGCAATACCGCGTCGTCGTAATCGAACCGGGTGACGATTTCCCGGAAATAGCTGTTGAATTGCGCG
+TTGGCGGCCGACCATGCACTGCCGTCGCCGGCATCGTCCAGCCGCATCGCATCTTGGTCCGACGTGAATG
+GTGCAGTGTAGTACGCCTGAAGATACCTTTGGGCCGGAGAAGTCGGCAGCAGCGCGGTGATGTCGAGTTT
+ATCGCCGGTCGTGCGTTCGACGGGTGTGATGAATTCGTTGTTGTAGTAGTTGACGATCGCCTGTTGTTGG
+GCGGGGCTGATCGTGGCGTCAGCCAGCTGGTCAAAGCCGGCCGTGAACCGCACGACGGCATCGACAACCG
+TGAGTCCACGTTCGTAAATGACCAGCGAATTCGTCAGGTCAGAAAATAGTGTCTCAACTGCCCGCTTCTG
+CGACTCGCGCAACTGGGTCAACCGCTCGTAGGCGGCTGCTCTTAGCGAAGTGCGACCAGATTGATAGACA
+ATGGCCGCAATCGCCGCGACGGACACGATACTCGTCAACAGCAGCAGCACCATGAGCTTGGACTGGATGC
+TGGCCCGGAAACGCGGCCGACGCCGGAGCACATTCTTATGGCGCTTCTTAGCCGGGGTGGATTCACTCTC
+GGCTACCGAGTCCAGTGCCTCACCCGACGTCAACCGGCTTCCCCTCTGCTGTCGGTCGCAGGCTGCTCTA
+CGACGCGCCGATTACGCAGCAGACTAACGTGCCCAGCCCACGATCATCGCGTTTGCCGAAAAGCCACCAG
+CGACCAATCGAGGAATGCGCCGCGTACGGGTCCTCGTCATCGTCCTCGTCGCGCACGCGCTTCTTGAGGG
+GTGGTAGCGATTGGTTCTGGGTGGTCCGTAATCGAGGTGAGCCAGGATAGCTCGGCCGTATCGCAATGTT
+CAGCGAGTCGATGGATCAACACATGCCCCGGCACCGGCAACCGCTGCGGAGTGGTCAACGCATCAAACGA
+CGACGCACTCAGACCATCGACCGACAGCATCGAGCCGGTCCAGCATCCCGACCACCCGTCCCGATCCGCA
+AGCATGTTCGAATACTGGGACGCGCCACCGACAGGACACCCACTGATACCCTTGGGACAAAAGTGACACA
+AGTGATTTCAGCCAACAGCAAGCATGGCAAACGCCAGTGAGACTAACGTCGGCCCCATGGCGCCCCGGGT
+GTGCGTGGTAGGCAGCGTGAACATGGACCTGACGTTCGTGGTGGACGCGCTTCCGCGCCCCGGCGAGACG
+GTGCTTGCGGCGTCGTTGACCCGAACGCCAGGCGGGAAGGGCGCCAACCAGGCGGTGGCCGCAGCGCGCG
+CAGGCGCGCAGGTACAGTTCTCCGGTGCATTCGGCGACGATCCAGCCGCCGCCCAGCTGCGGGCCCACCT
+GCGCGCCAACGCCGTTGGACTGGACAGGACCGTCACGGTGCCCGGACCGAGCGGGACGGCGATTATCGTG
+GTCGATGCCAGCGCCGAGAACACCGTGCTGGTGGCGCCGGGTGCCAATGCACATCTGACTCCGGTACCCT
+CGGCCGTCGCCAACTGCGATGTACTGTTGACCCAGTTGGAGATTCCTGTTGCAACCGCGCTGGCAGCCGC
+GCGGGCAGCCCAGTCGGCCGATGCGGTTGTCATGGTCAACGCCTCCCCAGCCGGCCAGGATCGAAGCTCC
+TTGCAGGACTTGGCCGCTATCGCCGACGTGGTGATCGCCAACGAGCATGAGGCAAACGACTGGCCGTCGC
+CACCAACACATTTCGTGATCACCCTGGGTGTGCGCGGTGCCCGGTACGTCGGCGCGGACGGGGTGTTCGA
+GGTACCCGCCCCAACGGTAACGCCAGTGGATACCGCCGGCGCCGGCGACGTATTTGCCGGGGTCCTTGCT
+GCGAATTGGCCGCGCAACCCAGGTTCGCCGGCCGAGCGACTGCGCGCATTGCGGCGGGCCTGCGCTGCGG
+GTGTGCTGGCAACTTTGGTGTCCGGTGCCGGCGACTGCGCACCGGCCGCCGCCGCGATCGATGCGGCCCT
+GCGAGCCAACCGCCACAACGGTTCATGACCACTGCTACGCACCGAAGGAGACCCGCTGATGCGAACGACC
+ACCGCGGCCGACTTAGCGCTGGCACTCTTCGCGGTTTTCAGTGTGGTCGGATTCGGCTGACGCAGTTGGC
+TGCAGCACCGACGCACCGGATCCACCGGCTTTCGCGGCGTCAGCGGCCGGGTCGGTTCGCTGGAGTGGAT
+TACCGGGACGTGCTTTGTCATCGCCCTGATCGTGACGGTGGTCGCTGCGGTGCTGCAGCGGACCAACGTT
+GTCCAACCGCTGAATACTCTGCGCATGGTCTGGATTCAGGTTGCCGGCATAATCCCGGCGACGGCCGGGA
+TCGCGGCCACGGTTTACGCCCAGCTTGCGATGGGCGATTCGTGGCGGATCGGGGTGGACGAGCAGGAGAA
+CACCACTCTGGTGCGCACCGGCCCGTTTAAATGGGTGCGTCACCCCATCTACACGGCCATGATGGCGTTT
+GGCCTCGGGCTGTTGCTGGTGACTCCGAATCTCGTTGCCCTCGCCGGGTTTATCCTGCTCGTTGCCACGC
+TCGAGGTGCATGTCCGCCGCGTCGAAGAACCCTACCTGTTGCGGACGCACAGTGCCGTCTACCGCGGCTA
+CACCGCCAGCGTCGGCCGGTTCGTCCCGGGTGTGGGGTTGATCCGCTAGCCCTTGGGCACCTCACGGTCG
+ATCTGATCGAGCCAGATTCGCGCTGACATATCCGACGGGGCCCGCCAATCCCCACGCGGCGACAACGCGC
+CCCCGTGGGACACCTTGGGGCCGTTGGGCAATGCCGAACGCTTGAACTGGCTAAACGAATAAAACCGCTG
+GACGAAAATCTGCAGCCAATGCCGGATTTCGGCCAATGAATAGGACGGGCGTTCGCTCTTTGGGAAGCCG
+GGCGGCCAGTTGCCCCGCTCCGCATCGTTCCACGCATGCCAGGCCAAAAACGCAATCTTCGACGGGCGAA
+ATCCGTAGCGCAGTACCTGAAAAAGCGAAAAGTCCTGTAGGGCGAAAGGTCCGACCTTGGCCTCGCTGCT
+CTGCAGCTCCTCCTCGCCGGTCGGAATGAGTTCGGGGGTGATCTCGGTGTCGAGCACCGACTGCAATACC
+TCACCCACCTTCTCACCGAACTCACCCGCCGAAATGACCCACCGGATCAGGTGCTGGATCAGCGTCTTGG
+GCACACCGGCGTTGACGTTGTAGTGCGACATCTGGTCGCCGACACCGTATGTCGACCAACCCAGTGCCAG
+CTCCGACAGGTCCCCGGTGCCCAGTACGATTCCCCCGCGCTGGTTGGCGATACGGAAAAGATAGTCGGTG
+CGCAACCCGGCCTGGACGTTCTCGAAGGTGACGTCGTACACTTTTTCGCCAACCGAATACGGATGGCCGA
+TTGTGTGCAGCATCAACCGAGCGGTGTCGCCGATATCGATTTCGGAGAAGGTAACCCCCAGCGCACGTGC
+CAGCTTGATCGCGTTGTTCTTAGTGTGCTCCCCGGTGGCGAATCCGGGCAACGCAAACGCCAGAATGTCG
+CTGCGCGGCCGGCCCTCGCGGTCCATGGCATGGGTCGCGACGATCAGCGCGTGCGTCGAGTCCAATCCCC
+CGGACACACCGATAACGACCTTCGGATAGTCCAGCGCCCGCAACCGTTGCTCGAGTCCAGACACCTGGAT
+GTTGTAGGCCTCGTAGCAATCCTGTTGCAATCGTTGCGGATCGGCCGGAACGAACGGGAACCGCTCGACC
+TCGCGCAGCAGTCCGATGTCGCCTGCCGGTGGGTCGAGTGCGAAGTCGATGCGCCGGAACGATTCCGTTA
+ACTCCCGGTGGTGACGCCGGTTGTCGTCGAACGTGCCCATCCGCAGCCGCTCCGACCGAAGCAACTCGGT
+GTCAACGTCGGCGACACTGCGGCGCACTCCTTTGGGGAAACGTTCGGACTCCGCGAGCAGTGCGCCATTC
+TCCCAGATCATCGTCTGACCGTCCCAGGCCAGGTCCGTCGTTGACTCCCCCTCCCCCGCGGCGGCATAGA
+CATAGGCAGCCAGACACCGCGCCGACGCCGAGCGCGCAAGCAGCCGGCGGTCCTCGGCACGGCCGATGGT
+GATCGGGCTGCCGGACAGATTCGCCAGCACCGTCGCGCCCGCCAGGGCCGCCTCGGCGCTGGGCGGCATC
+GGCACAAACATGTCCTCGCAGATCTCCACATGCAACACAAAGCCGGGTAGATCTGACGCGGCGAACAACA
+GGTCCGTGCCGAAGGCCACGTCGGCGCCACCGATGCGGATCGTGCCCCGCTCCCCGTCTCCGGGCGCCAT
+CTGGCGCCGCTCGTAGAACTCGCGATAGGTGGGTAGATACGACTTGGGCACCACGCCGAGCACGGCGCCG
+CGGTGAATGACGACCGCGGTGTTGTAGATGCGGTGTCGATGCCGCAGCGGAGCCCCGACCACCAGTACAG
+GTAACAGGTCGGCGGATTCGGTCACCAGGTCGAGCAGCGCGTCCTCGACGGCATCGAGCAGAGAGTCCTG
+CAGTAGTACGTCCTCGATGGAGTAGCCCGACAGCGTCAGCTCAGGAAAGACCGCCAACGCTGCGCCATCG
+TCGTGGCACGCACGGGCCATGTCCAATACCGACGCGGCGTTGGCCGCCGGGTCACCGATGGTGGTGTGGT
+GAGTGCAGGCGGCAACGCGCACGAACCCGTGCTGGTAGGCGGAGTAAAAGTTCATCGTCCTTTCATTGTC
+GCCCAGCGACGTCAGAACGCCCGAATCACCCGCCGAGTATCCACGCTCGACACCGTGGAATCCCCCGCGC
+TGCTGGCAGATGGCGGCATTGACCGGCGTGGGGATGCTACCGACTGGGCCGCTGCCGACCCTGGGCCCTG
+ATTGGCCGCCGAGCAGTCCCATGACGATCCACTAGTTCACCTCGGATACCCGCTCGGCCGCAATGCGCAG
+CTAGCGGCCATGTTGATCGAAATCATTTGGGGTACACCGCATCTCGGAGCAATATGGTAGCTAAACTTGC
+TTAGCTTGCTTCGCCGACACCGCGACCAGATCGTCGGCGTGCACCACCGGGCGGCGCAGCTCGCCGGGTA
+GCTCAGAGGTGGACCGGCCCACCATGGTGGCCAGCTCGGACGCGTCGTAGGCAACCACCCCGCGGGCTAC
+CATGGCCGCGTCGGGTGCACGCAGTTCGACCACATCGCCGCCGCAAAACCGGCCGGACACCGCGGTGATA
+CCCGCCGCCAGCAGTGACCGGCGTTGTCGCACCACAGCGCGCACCGCACCGGCGTCGAGAGTCAGTGCGC
+CGGTTGCTTCGGCGGCATAACGCACCCAGAACCGCCGGGCCGACAGACGCGCGGGCCGGGCCGCAAACAC
+CGTGCCCACCGACGCGTCGGCGAGCGCGGTCGCGGCGTCGGCCGCGGGGGCCAGCAGTACCGGCACCCCG
+GCGTCGGCGGCCAACAGCGCCGCCGACACCTTGGACGCCATGCCGCCAGTACCCAGGTGGCTACTGCGGC
+CGGCGACCACACCGTCCAGATCCGCCGGCCCGGACACCTCCGGAATGAACGTCGCGTCCGCGGTTTTGCG
+CGGGTCGCAGTCGTAGAGGCCGTCGATGTCCGACAGCAGCACCAAAGCGTCGGCGCCGACCAGGTGCGCC
+ACCAGTGCAGACAGCCGATCGTTGTCACCGAACCGGATCTCGTTGGTGGCCACGGTGTCGTTCTCGTTGA
+CAATCGCCACCGCGTGCAACGCGCGCAGCCGATCCAGCGTGCGTTGGGCGTTGGTGTGCTGCACCCGCAT
+CGAAATGTCGTGCGCGGTCAGCAGCACCTGGCCCACCGTGCGGCCGTAGCGGGCGAACGCCGCGCTCCAC
+GAGTTCACCAGCGCGACCTGCCCGACGCTGGCCGCCGCCTGCTTGGTCGCCAGATCTTTGGGACGACGGG
+ACAGCCCGAGCGGCTCGATGCCGGCGGCGATGGCGCCCGAAGACACGATGACGACGTCGGAACCCGCCTT
+CATCCGCCGCTCGACCGCCTCGGCCAGTCCGGCCAGCCGGCCGGCATCGAACATCCCGGACGGTGTGGTA
+AGCGCCGTGGTCCCGACCTTCACGACAAGGCCGCGCGCGGTCCGGATTGCGTCCCGATGCGGACTTCTCA
+TCAGCCATCCCCGTGTTCGCGACGCCGACTCCGAGCGGCCTTTCGCTCGGCCGCGCCCACCCGCTTGTTG
+CTGTCCAGCCGCGGATCGGTGCCCCGGCCGGACATCGCGACCGGCTCACCCGCAGGCGTTTGCGGCTCCC
+AATCGAACGTCATCTCGCCGATGGTCACCGCGCATCCTGACCGCGCACCCAGCCTCAGCAATTCCTCCTC
+GACACCCAGGCGCGCCAGCCGGTCGGCGAGATAGCCGACGGCCTCGTCGTTGTCGAAGTTGGTCTGGTCA
+ATCCAACGCTCGGGCCGGGCACCGCTGACGACAAAGCCACCATGCCCGTCGGGTTCGACGGTAAAACCGC
+TGTCGTCCACCGGAATCGGACGAATCACCGGCCGCCGTGGCACCGCCACCGGCCGCGCAGCGTTGTAGTC
+CGAGATCATCTGCGACAGCCCAAAGATCAACGGCTGCAGGTTTTCCCGGGTTGCGGTCGACACGCAGAAC
+ACCGGCCAGCCGCGCTGGGCGATGTCGTCACGGACGAACTCCGCGAGCTCGCGGGCCTCCGGCACATCGA
+TTTTGTTGAGGACCACCGCACGCGGCCGTGCGGCGAGATCGCCCAGAGCCGCGTCCCCTTGCAGCGTGGG
+CGTGTAGCACGCGAGTTCCGTTTCCAGCGCGTCGATGTCCGAGATGGGGTCGCGGCCCGGCTCGGCGGTA
+GCGCAATCCACCACATGCACCAGTACAGCGCAGCGCTCGATGTGCCGCAGAAAGTCCAGCCCCAGACCAC
+GGCCCCGGGATGCGCCCGGGATCAACCCCGGCACGTCGGCGACGGTGAACGCGTGCTCGCCAGCCGAGAC
+CACACCGAGGTTGGGCACCAGGGTGGTGAACGGGTAGTCGGCGATCTTCGGCTTGGCCGCCGAAATCGCC
+GACACCAGCGAGGATTTTCCGGCCGACGGAAACCCGACCAGGCCGACGTCGGCGACGGTCTTGAGTTCCA
+AGGTGAGGTCTCGGGACTGTCCCTTTTCGCCGAGGAGTGCGAAACCGGGGGCCTTACGCACGCGGGAAGC
+CAGCGCGGCGTTGCCCAAACCGCCACGGCCTCCGGCGGCGGCTTCAAAGCGGGTGCCCGCGCCGACCAGG
+TCGGCCAGTAGCCGGCCGTTCTCGTCCAATACCACGGTGCCTTCGGGAACTTTCACTTCCAAATCCGCGC
+CGGCGGCCCCGTCGCGGTTATTGCCCATCCCGTGCTTGCCCGAAGCCGCGGTGAGATGCGGGCGGAAATG
+GAAGTCGAGCAGGGTGTGCACTTGCGGATCGACGACGAAGACGATGCTGCCGCCCCGGCCGCCATTTCCG
+CCATCGGGGCCGCCCAGCGGCTTGAATTTCTCGCGATGGACCGAAGCGCAGCCGTTACCGCCCGAACCCG
+CTCTGGTGTGGATGACGACCCGATCGACAAACCGAGGCACCGAGCTCCCCTTCATCTGCGGAGTGTGCAG
+CTACTGCGGGTTTTGCCCCTCGTGAATCTTCGCAGTGGGCGCACACGCGCGACGCTCAGGCAGTGGTCGA
+ACCGACGATGCTCACCGTCTTACGTCCGCGTTTGATGCCGAACTCGACCGCCCCGGCCGTCTTGGCGAAC
+AAGGTGTCATCGCCGCCACGCCCGACGTTGACGCCGGGATGGAATTTGGTACCGCGCTGGCGGACCAGGA
+TCTCGCCGGCCTTGACGACCTGGCCGCCGTACCGCTTAACCCCCAGCCGCTGGGCGGCGGAATCGCGACC
+GTTGCGCGAGCTGGAAGCCCCCTTCTTGTGTGCCATGTCTGTCGCCTCCGTTATGCGATGCCGGTGACCT
+TCAGGACCGTCAGCTGCTGACGGTGTCCCTGCCGTTTGTGGTAGCCAGTCTTGTTCTTGAACTTGTGGAT
+ACGGATCTTGGGGCCCTTGGTGTGCCCGAGCACCTCACCGGTCACCGCGACCTTGGCCAGTGCCTTCGCA
+TCGGTGGTGACGGTGGCGCCGTCGACAACCAGAGCCACCGGCAGGGACACCTTCTCCCCCTGCTCGGATT
+CCAGCTTTTCGACCTTGACCACATCTCCGACAGCGACTTTGTACTGCTTGCCGCCGGTCTTGACGATTGC
+GTAGGTCGCCATCATTGCTCCTGCCTCTTCATACTTCCGCTGCATGCGTTGCGCTTCGCGCGCGGGCCAG
+CGGCGGGACGCGTGCTGGGTCTTGGGCGGGCACCTACAACGGACCCCGCATCGTCTCCAGCCGTCAGCCT
+GGCGACAACTGGTCAAGGGTACGTGACCTGCAACTACGGGGTCAAACCAGCGGGGCCTCAGCGAGATCGA
+CGCCAGCACACGAAAGTGCGCCGGTAGCGTCGATCTCGACGCTACCGGCGCACTCCGGGGCCCGGGTGGT
+GACGTCATCCGGGTTGGACCGCTGATGGCTGCGGCTAACATCGTGCCGAATCGCGTCCGATGTCGACCTG
+GAGGAACCGCCGATGACCGCCCCCTTGGATCGTGCGCCGGTCACGGATTTGCCGGCTAACAACAAAGGCC
+GAGACCGCACCCACTGGCTGTATCTCGCGGTCATTTTCGCAGTGATAGCCGGTGTGATCGTGGGGCTGAC
+GGCGCCGTCGACCGGAAAAAGCCTCACGGTGCTCGGGACGGTGTTCGTCAACCTGATCAAGATGATGATC
+GCACCGGTCATCTTCTGCACGATCGTGCTCGGGATCGGCTCGGTGCGCAAAGCCGCGGCCGTGGGCAAGG
+TCGGCGGGCTGGCTTTGGCCTACTTTCTAACGATGTCATCGGTGGCGCTCGGGATCGGGTTGATCGTCGG
+CAACCTACTCAGTCCGGGTAGGGATCTGCACCTTAGGCCTGGTGCGGTCGGAAGCGGCGCAGCATTGGCC
+GGCCAGGCTGCGGAGTCACACGGAATCGCTGGGTTCATCCAGCAGATCATTCCGAGGTCGCTCCCCTCAG
+CCCTTACTGAAGGCAACGTGCTGCAGGTGTTACTCGTCGCGCTGCTGGTCGGTTTCGCGGTCCAAGGCCT
+GGGCCCCGCAGGCGAGTCCATCCTGCGTGCCGTCGAGAACCTGCAAAAGCTGGTGTTCAAGGTGCTCGTG
+ATGGTACTGTGGCTGGCTCCGATCGGCGCGTTCGGTGCGATCGCCAATATCGTCGCCACGACTGGCTTCA
+ACGCCGTCACCAACCTGCTGCTGCTGATGGCCGGCTTCTACCTGACGTGCGTGGTGTTCGTTTTCGGCGT
+CCTGGGAGTGCTACTGCGCATCGTGTCGGGTTTGTCGATCTTTCGGCTGCTGCGCTATCTAGCCCGCGAG
+TACTTGCTGATCTTCGCAACATCGTCGTCGGAGGTGGTGCTGCCCAGACTGATCACCAAGATGAAACACT
+TGGGCGTGCAATCCAGCACGGTCGGCGTGGTGGTGCCGACCGGCTACTCGTTCAATCTTGACGGCACCGC
+TATCTATCTGACCATGGCGTCGCTGTTCATCGCCGACGCGATGGGACATCGCTTGACATGGGGCGAGCAG
+ATCGCGCTGCTTGCGTTCATGATCATCGCGTCCAAGGGCGCTGCCGGGGTCAGCGGTGCGGGCCTTGCGA
+CGCTGGCCGGCGGCCTGCAGGCTCATCGCCCCGAGCTGCTGGACGGTGTCGGGCTGATTGTGGGGATCGA
+CCGGTTCATGTCGGAAGCCCGTTCGCTCACGAACTTCTCCGGCAACGCCGTCGCAACCATCCTGGTTGCC
+TCGTGGACAAAGACCATTGACCTGTCCAAAGCCGACGAGGTGTTGCGCGGTCGTGATCCCTTCGACGAAT
+CGACCATGGTCGATCCCCACGATGAGGAGCCACCCGCCGCCACACCCCACGGGGGCGGCGTCCCGACGAA
+CCCTGCGCTGTGCGATTTCGAGCAGGTCAGTCTAGGCGGATTGGTGGGCCGGCCGGCCGGCCCGCAACGC
+GCCGACGTGGACGGGTAGGGGCCAGCTCCGTGACACCGGGGACGTCGACTTCGCCCGGGGAACCGTCCAA
+GCCGGCTGCATCCTCCTCGTCGACGTCGGCATCGGCGGCGTCTTCGTCGGAGTCTTCGTCGTCGGAATCG
+GAGTCTTCAACGTCGAGATCCTCGTCGAGGTCCTCGTCGTCGAGGTCCTCGAGGTCCTCGTCGGCGTCGA
+GCTCGTCCTCGTCTTCGTCGGTGTCCTCGGTGTCCTCGAAGTCCGCTTGGGCGGTGTCGTCGAGGTCAGT
+GGGCGGTTGATCGCCGGCCTGCTCGGCGAGTTCGGCAGCGGGCTCCCCGGATTCCTCGTCACCGCGACCA
+GCCAGCGAGGACAAGCCCGCTGCCATCGCCTTGAACATGGGATGCTCACCGGGAGCGTGCACGGGGACCT
+TGGCGACCATGCTCCTATCACTGGACTCTTCGGACCGGCTCTTTTTCGATCGCTTGCCCCGCCGAGCACC
+GGGCTCAGACTTTCGCCCAGTCGCCGCGGCCGAATCGACCGGGTCGGCGTGCAGCAGGATCCCGCGGCCA
+CTGCAGTTCGGACACGATGTGGAGAACGCTTCGATCAGTCCGGTTCCCAACCGCTTGCGAGTCAACTGCA
+CCAGCCCCAGCGACGTCACCTCGGACACCTGGTGGCGGGTGCGATCGCGGGCCAGCGACTCGGTCAACCG
+GCGCAACACCAAGTCGCGGTTGGACTCCAGCACCATGTCGATGAAGTCGATGACCACGATGCCGCCGATA
+TCGCGCAGCCGCAGCTGGCGCACGATCTCCTCGGCCGCTTCCAGATTGTTCTTGGTGACCGTCTGCTCGA
+GGTTGCCCCCGGCTCCGGTGAATTTACCGGTGTTGACGTCAATGACCGTCATGGCTTCGGTCCGGTCGAT
+CACCAGCGTCCCGCCCGACGGCAACCACACCTTGCGGTCCATCGCTTTGGCCAGCTGCTCGTCAATGCGG
+TGCACCGTGAAGACGTCCGGCGCGGACTGGCCATCCGGCCCGTCAGCGGACTCGTACTTGGTCAACTTCG
+AAACCAATTCGGGAGCAACAGAATTCACGTATTCATTGATCGTGTTCCAAGCCTCGTCGCCGGAAACGAT
+GAGGCCGACGAAGTCCTCGTTGAACAGGTCACGGATAACCTTGACCAGCACGTCCGGTTCTTCGTACAGC
+GCCACCGCAGCGCCCGCGGCCTTCTCCTTGGTCTCTTGTGCCTTGGCCTCGATCTGCTCCCAGCGTTCCC
+GTAGCCGAGCGACGTCTGCGCGAATGTCGTCCTCTTTGACGCCCTCAGACGCGGTACGGATGATGACCCC
+AGCGTCAGACGGCACCACCTCGCGCAGGATCTCCTTGAGCCGCTGACGTTCAGTGTCGGGCAGCTTGCGG
+CTGATCCCGGTCGACGACGCGCCCGGCACATAAACCAGAAATCGACCGGCCAGCGACACCTGCGTGGTCA
+GCCGCGCGCCCTTATGCCCTACCGGGTCCTTGCTGACCTGCACCACGACATAGTCGCCGGGTTTGAGGGC
+CTGCTCGATCTTGCGATCGGCCCCGCCCAACCCCGCTGCATCCCAATTGACTTCACCGGCGTAGAGCACT
+CCATTGCGACCGCGCCCGATGTCGACGAACGCCGCCTCCATCGACGGCAGCACGTTCTGCACAATTCCCA
+GGTAGATGTTGCCCACCAGGGAAGCCGAGGCCGCAGACGTCACGAAATGCTCCACGACGATACCGTCTTC
+GAGCACCGCAATCTGGGTGTACCGCGTGCCCGGCAGCGGTGGCTCGGTGCGGACCCGGTCGCGCACCACC
+ATCACCCGCTCGACCGCCTCACGGCGAGCCAGAAACTCGGCCTCACTCAACACCGGTGGGCGGCGCCGGC
+CGGCGTCGCGCCCGTCGCGGCGGCGTTGCCGCTTGGCTTCCAGGCGGGTCGAGCCGTCGATGCCCTTGAT
+CTCAGTGGAGCCAGAGCCGCCATCCTGCGAGTTGCCGGCCTTGTCACCCGCGCGGGGCACGCGTTCGTGT
+ACGACAGTGTTGGGCGGATCGTCAGGCAACGGGCCCTCTAACGCAGCGTCGTTGTCGTCACCAGAAGCCG
+ACTTACGCCGTCGCCGGCGGCGCCGGCGACGATTGCCGGCCTCCAGCGAACCGTTTTCGTCCTCGCCGTT
+GTCACCGGCTTCGGTATCTTCGGAATCTCGATCGTCGCCGTCGTCGGTTTCGGCGGCGTCCGCGCTGGTA
+AATTGTTGGGCCCGGGGCTCGGATTGCTGGTCAACCGGATCACCGTCGGATCCACCCTGCTCCCCGCGTC
+CGCGACCGCGACCCCGACGGCCGCGACGTCGCCGCCGGTTCGCCGGCCGGTCTAGCTGCCCTTCGTCGTC
+AGCGTCGGAATCGTCGGCGACGTAGTCGGGGCCATCGTCGACGTCCTCGTCGTCCGCTAACGGCTCGGGA
+ATCGGCTGGGGCGCGACGAACAGCGGCATATAGTGCGGCCGCTCCACGTCGGCATTCCGAGTCTCCTGGG
+TCTCTAGCATCAGCCGGGACTCGGGTTCCTCGGACGCTTCGGGCGCATGGACCGAGGCCGCCAGCACGCC
+GGCAGTCTCGAGATGAGTGGCCAGCAGATCGCGCACCCGGACCGCATCGACGCGATCCACCGTGGAATGT
+GCGCTGCGGACCCGTCCGTCGAGCGCGGTGAGCGCATCCAGCACCCGCCTGCTGGTGGTTCCCAGCGTTC
+GTGCCAGCGAATGGACTCTTAGGCGGTCCGGCAGTTCCTCATGCTGGCTCGGTTCTGGTGGATCTGAAGG
+TGGGGCACCGTCTATCACGTATTCTCCTCAAGCCCCCGGGCGCGTCTTGATCGACGCGGCCACGCGAGGG
+CTTCGCTATCTGCCCGGGTCACTTGTCTCCCGAGCTTGTGATGGTCTTGTCCCGAGCAGCTCATGACGAA
+CCCACTCGGCACCGTGCTGAATGACGGCCCGACATGCCGCGCCGCATCGAAGGATGGCGATGGTCGCGGT
+TGCCTAAGTCTTCATTCGGGCGTCCGACACCGCTTCGGCGACGTTCACCCGTCATCAGTATCCCACATCA
+CTGGGCCGAGTCACCTTCCCTTGAGCTGGGGTGCTGCCCAAGCCGCCCGGGATCGGCGCACCCGGAGCTA
+GGCGCCGGGAAACCAGAGCGCGATTTCGCGCTGCGCGGATTCGGCCGAATCAGACCCGTGCACCAGGTTG
+AACTGCGTCTCTAGAGCGAAGTCGCCCCGGATTGTGCCGGGCGCCGCCGCCTGCACCGGGTCGGTGCCGC
+CGGCGAGTTGGCGAACCGCCGCGATGGCTCGGGTTCCCTCCACGATCGCCGCTACCACCGGACCCGACGT
+GATGAACTCCAGCAACGATCCAAAGAATGGTTTGCCTTCATGTTCGGCGTAGTGCTGGCTGGCCAACTCC
+GCGCTGACGGTCCTGAGCTGCAGCGCAGCGATGGTGAGGCCTTTGCGCTCGATGCGGCTGATGATCTCGC
+CGATCAGCTGCCTTTCGATGCCATCCGGCTTGATCAGTACCAGAGTCCGTTCGGTCACGGTGCCCAACAC
+TAGATGCCGCAAGATGTATGCCCAAACCGGTCATTGCGACACCCGGTAATCCCGACGCCGCCGCACCTCG
+GCACGCAAATACGCGATCAGGACCCACAACGCGGCGAACAGCACGCCAATGAAACCCACACCCGGGTACA
+CGGCGAAGCCGGCAACCAGCACCGGTTGTGCGCCCAGGTTCACCCAGATTGCCCAGGGTCTGCGCTGCAG
+CCCGGTCAGCAGTATCAACAGCACGGCCAGACCGACCAAATAGCCCAGCGAGGCCGGACGCAGCCCACCG
+CCGACCGCGTCCACTACCGGTATTGCCAGCAGCACCACGATCGCCTCGAGGATCAGCGTCGCCGCCATCA
+CCGCGCTGAATCCCTTCCACGGGTCAGCCGGCTCACGCGACCGGTCGGTCATTGCGGATCACGACCGAAC
+AAGGTCCGAGCCGCCCCTGCGGTGACAACCGAGCCGGTGATGACGATCCCGGTTCTCGAGAATGCGTCCC
+CGGCCACATCCGGGTCGGCGGCGGCGTCGTCGACCAGTGAGGTGGCAACGTCGATAGCATCGCGCAGGTT
+CTCGGCGGTGCGCACCCGGTCGGGTCCGAACCGCTCGCCGGCCGCCAGCGCCAGGGCCTCGACATCCAGC
+GCCCGCGGCGACCCGTTGTGGGTCACGACGACGGAATCGAACACCGGCTCCAGTGCGGCCAGGATGCCGT
+CCACGTCCTTGTCGCCCAGCACGCTGAGCACCCCGACCAGAAATCGGAAGTCGAACTCATGCGCCAGCGT
+TTGTGCCAGAGCACTCGCCCCGGCCGGATTGTGCGCGGCGTCGATGAACACCGTGGGTGCGCTGCGCATG
+CGCTCCAACCGGCCGGGACTGGTGACGGCGGCAAAGCCGGCCCGGACGGCGTCGCCGTCGAGCTGACGCT
+GCGCACCGGCACCGAAAAAGGCCTCGACGGAAGCGAGGGCGAGCACCGCGTTGTGCGCCTGGTGTTCACC
+GTGCAGCGGCAAGTAGATGTCGGAGTAAACCCCGCCGAGGCCCTGCAGTTGCAGTACCTGACCGCCGACC
+GCGATCTGTCGCCGTAGCACCGCGAATTCGGAATCCTCCCGGGCCACCGACGCGTCGGCGCGCACCGATT
+CGGCCAGCAGCACCTCCATGACCTTCGGGACCTGACGCCCGATGACCGCGACGGTGTCCGGCGAACCGTC
+GGGGGCCCGAGTGATGATGCCCGCCTTCTCCCCGGCGATCCCGGCGATATCGGCACCGAGATAGTCGACG
+TGATCAATGCTGATCGGGGTGATGACGGCGACCGGTGCGTTGATCACGTTGGTGGCGTCCCAACGTCCGC
+CCATGCCCACCTCGACCACTGCCACGTCGACGGGCGCGTCCGCAAAGGCCGCGAACGCCATCGCGGTGAG
+CACCTCGAACTTGCTCATCGCCGGGCCACCCTTACCCGCAGAAGCCTGCGACTGCTGGTCGATCAGCGCC
+ACCAACGGCTCGATCTCCCGGTAGGTCGCCACATACTGCGCCGGGCTGATCGGCTTGCCGTCGATCGAAA
+TGCGTTCCACCGGTGACTGCAGGTGTGGGCTGGTGGTTCGGCCGGTGCGCCGGTGCAGCGCGGTGACCAG
+CGCGTCGACCATGCGCGCCACCGAGGTCTTGCCGTTGGTGCCCGCGATATGGATCGACGGATAGCTGCGT
+TGGGGCGAGCCCAGCAGGTCCATCAACGCGCTGATCCGGGTCAGGCTCGGATCGATGCGGGTCTCCGGCC
+AGCGTTGGTCGAGTAGATGCTCAACCTGCAGCAGGGACGCGATCTCGTCCGGAGTGGGCACGACGCCGGT
+GGCCGATCCCGAGTCAGGCGGGCCGGAATTCGTCGAATTCATTGCAGCGCAGCCAACCGGGTGGTGATGC
+GCTCGGTTTCCTGCTGCGCCACGCGCTGGCGGTCCCGGATCTTGGCAATGACGGCGTCGGGCGCTTTGGC
+CAGAAAGTCCGCGTTGGCCAACTTGGCGGCGGTCGACGCCAGCTCCTTTTGGGCGCCGGCCAACTCCTTT
+TCCAGGCGGCGACGCTCGGCGGCCACGTCGATGGTGCCCGAGGTGTCGAGCTCGACGACGACGGTGCGGT
+TCATCTCGGGGCCGAGCCGAACCTCCAACGAGACCGACGGCTCAAAATCCGGGCCCGGCTCGGTGAGCCA
+CGCCAGCGAGGTCACGGCGGCCACCTGGTTGCTCAGATCCGAGTCCCGCACACCGTGCATTCGGGCCGGA
+ACCTTCTGCCGGTCGGCCAGACCTTGATCGCTGCGGAACCGCCGCACTTCGGTCACCAACTTCTGCATAT
+CGTTAATCCGTTGCGCGGCAACAAGGTCCACGCTAATCCCGGAAGGCTCCGGCCAGTCGGCGCTGACCAG
+CGATTCCCTGCCGGTCAGCGCCAGCCATAGCGCCTCGGTGAGGAAGGGAATCACCGGGTGCAGCAGGCGC
+AGCAGCGTGTCCAGCCCGGCGGCCAGCACGGCGGTGGTGTGTGTGAGTCCCTGGGCAAGCTGCGTTTTGG
+CCAGTTCGAGGTACCAGTCGCAGAATTCGTCCCAGGCGAAGTGATACAGGGACTCACAAGCGCGGCTGAA
+CTCGTATCCGTCGAAGGCCGAATCAACTTCGGCCCGAACCTCTTCCAACCTTCCGAGAATCCAGCGGTCG
+GCGTCGGTCAGCTCGTTCGGCGATGGCAGGGGTGCTGGCGCGGCGCCATTGAGCAGTGCGTACCGAGTGG
+CGTTGAACAGCTTGGTCCCGAAATTGCGCGACGCCCGCACGGCATCCTCGCTCACCGCCAAGTCACCACC
+GGGACTGGCCCCGCGGGCCAGCGTGAACCGCAGCGCATCGGCCCCGAACATTTCCACCCAATCCAGCGGG
+TCGATGACGTTGCCCTTGGACTTGCTCATCTTGCGGCCAGACTCGTCGCGGATCAGCCCATGCAGAAACA
+CGTCGGTGAACGGCACCTGCGGGCCCCGGCGGCCGTCGAGGGTGATGGCGGCGTCGTCGCCGACGAAGGT
+GCCGAACATCATCATTCTGGCCACCCAAAAGAACAAGATGTCATAGCCGGTAACCAGAACGCTTGTCGGA
+TAGAACTTTTCCAGCTCCGCCGTCTTGTCCGGCCAACCCAGCGTGGAAAACGGCCACAGCGCCGACGAAA
+ACCAGGTATCCAGCACGTCAGGATCCTGTTCCCAGCCCTGCGGGGGTGTTTCGTCCGGGCCGACGCACAC
+CTGTTCGCCGTCGGGTCCGTACCAGATCGGGATCCGATGCCCCCACCAGAGCTGTCGCGAGATGCACCAG
+TCGTGCATGTCGTCGACCCAGGAGAACCAGCGGGGTTCCATGCTGGCCGGGTGAATCACGGTGTCCCCGT
+TGCGCACCGCATCCCCGGCCGCTTTGGCCAGCGATTCCACCCGGACCCACCACTGCAGGGATAGCCGCGG
+CTCGATCGGCTCGCCGCTGCGTTCGGAGTGTCCGACGCTGTGCAGGTAGGGTCGCTTTTCTTCGACCACG
+CGGCCCTGGGCCGCGAGCGCTTGGCGCACCGCGACCCGTGCCTCGAAGCGGTCCATGCCGTCGAATCGCG
+TTCCGGTGTCGACGATCCGGCCCTTGGTGTCCAGGATCGAGGGCATCGGCAGCTGGTGGCGCACCCCGAT
+TTCGAAGTCGTTGGGGTCGTGGGCGGGTGTGACTTTGACCGCGCCGGTGCCGAATTCAGGGTCCACGTGC
+TCGTCGGCGACAATGGCCAGCTCCCGGTCGACGAATGGGTGCGCCAGGCTGGTGCCGACCAGGTGACGGT
+AGCGCTCGTCATCGGGATGGACGGCGATCGCGGTATCGCCCAGCATCGTCTCGACCCGGGTGGTGGCGAC
+CACGATGTGGGGTTGCGAGTCGTCAAGCGAGCCGTACCTAAACGACACCAGCTCGCCTTCGACGTCGCGG
+TAGTTGACCTCGAGGTCGGAGATCGCGGTCTGCAGCACCGGCGACCAGTTGACCAGCCGCTCGGCCCGAT
+AGATCAGCCCGGCGTCATAAAGCCGCTTGAAGATCGTGCGCACCGCCCGCGACAGACCTTCGTCCATGGT
+GAACCGGTCGCGGCTCCAGTCCACCCCGTCACCGAGTCGGCGCATCTGGCCGCCGATGGCACCGCCAGAC
+TCTCGCTTCCAATCCCACACCTTGTCCACGAACAGCTCGCGGCCGAGGTCTTCTTTAGTCTTGCCGTCGA
+CCGCCAGCTGCTGCTCGACCACGCTCTGGGTGGCGATCCCGGCATGGTCGGTGCCCGGCTGCCAGAGCAC
+CTCATAGCCCTGCATCCGCTTGCGCCGCGTCAAGGCGTCCATCATGGTGTGTTCCAGCGCGTGGCCCATG
+TGCAGGCTGCCGGTCACGTTCGGCGGCGGCAGCACGATCGAATAGGCCGGCTTGGTGCTGGTCGGGTCCG
+CGGTGAAGTAGCCAGCGTCCAGCCACTTCTGATAGATGGCGCTCTCCATCGCGGCCGGATCCCACGACTT
+GGGCAGCATATCGGCGGCAGGGTGAGGGCTGGCGGTCACCGATCAATTCTAGGAACCGCTTCACACCGGC
+ATGAAAGCGCCCGAAACCGCCCGGATTCAGCTAGCCAGTCGCGTGGTCTGCAGCGACACACCGGCGGCCG
+GCAAACGCTCCAGCAGGGCGTCACCCATTGCGGCCGCGGGGGTTAACACACCACGCATGTCGGACAGCTT
+GTCGCGATCCAGTGCCAGCGCCAGACCACACTCCCCCAACAACACCGACGTCGCCTTGTAGCCGGGGTCA
+CCATCTTGGGCCATGCGCGCCAGGTACCGGGCTCCGGTGGTTGTGGTGGTGTAGGTCTCGATGCGGTAGT
+AGCCGCGCTCGCGAGCCGCCGCACTGGGGCCGGTGCCGGGTTTGGGGACGACACGCTTTACCAGTCCCCG
+CGGCAGCAGGCGGATGTAGCGGCTGGCCAAGCCGAACATCGCGTTGCCGACACCGCCGCCGACAACCGAT
+ACCACCGGCGCCAGCACCGTGGACCCTACGCTCATGGTTTCGCTGTAGCGGAACCGCCGGCCGTAGGCCC
+AGTCCAGGAGCGCGTTGCTGCGGCGCACGATCCGGGTGTTGGTGGGCGCCATGATGAATCCCGCGGTCCA
+CACACCGGCCAGTTCCGGCGCGAGCCGACGGCCACGACGCGACGGCAGGTCAGGCTGTGGGCCCAGTTCG
+GGTTCGGCGCCGCGGTCTGGGCTCAGCATGTAGGGGTCGGATAGCTGGCGGCGCGCATCGGGATCGTTAG
+AAGCGGTGCTCAACACCTCCAGCATCGATGCGATGGTGCCGCCGGAGAACCCGCCTTTGAAGGAACGCAC
+CACGCAGTTGGTGTCGGTCAGCTCGCCGGCGCCGTCTTCTCGTGCCGCGTGGTATAGGGCGTACACGCTC
+AGATCAGATGGGACGGAGTCGAATCCGCAGGCGTGCACGATGCGTGCACCGGTGTCGGCGGCCTGCTTGT
+GGTACAAGTCGATGCTGTTGCGCATGAACATCGGCTCGCCGGTCAGGTCGGCGTAGTCGGTGCCGGCGGC
+AGCGCATGCGGCCACCAGCGGCAGCCCGTAGCGAGTGTAGGGCCCAACGGTGGTGACCACGACCTGGGCG
+CGGGCGGCCATGGCTTGCAGCGTCGACGGCAACGACGCGTCGGCGGTCAGGATCGGCCAGGTCTGCGCGG
+ATTCGCCCAGGGCTTCGCGAACGGCGAGCACCCGTTGCGTCGACCTGCCGGCCAGCGCGATCCGGGCATC
+TCCCCCGGCCCGGGCCAGGTATTCGGCGGTCAGCTTGCCGACGAAGCCGGTCGCCCCGTACAACACGATG
+TCGAATTCACGCGGCGTAGCGGTCACGGGTTTGACGCTACTCCGGGGTGCGCGAGCAGACGCAAAAGCTC
+CCAAATCCGACCGGATTTGGGAGCTTTTGCGTCTTTTCGCGGTGGTCAGCCGCGGCGGCCGCAGACCGGC
+CAGGCGCGGATACCCTGCGAACGCAGCACGTTCTCAGCCACCCGGATCTGCTCCTCCCGGCTCGCGTTGG
+CCGCGGACCCCGAGCCACCGTTGGCACGCCAGGTGCCGGCGGTGAACTGCAGGCCGCCGTAGTAACCGTT
+ACCGGTGTTGATCGACCAGTTTCCACCGGACTCGCACTGCGCGATCGCGTCCCAGTTCACGCTGTAGGCC
+ACGGGCACGGGAGGCGCTTCCTCCGCAGGCGGGGACAGGAAGTCCGGGGCCAGCGGCGGGGGGAGGTTGG
+GATCAAAGCCCGCGTCCTCCGGAGCCGGCGGAGTATCGACGGGTGCAGCGTCCGGGGCCGGCGGCAGGTT
+CGGGTCAAAGCCCACGGCATCCGGGCCGGCTGCGGCGTTTGGGTCCAAGCCCGCGTCGTCGGCATTGGCG
+ATACCGGCTGGTGACGTGGTCACCAACGTCCCGGCAATCGCGGCGGCGATGAGCGTCGTACGGGCGTTCT
+TCAACGTTGTTCCTTTCGCGGTGCGCGCGCGCCAAAGCCAACCCACGGGCATGGGTTAGCTGCCAGGTGC
+ATTCGAGGGTGCTGCGTGGGACGTGCCGTCTCGGTCCGGCACGGCAGCGGAGCGCTTGATCTGCCCGGCG
+CGGCTGCTAGCCGCCGCCTGCGGGTCGGCCAACCGATTCAGCCGTCCCCGGCTCCGCTCGCACGCGGGTC
+CGTAGATTCAATTGTTGAGATTTCTTGCTGCCCGTCTGCCGGGCCAAGGGGACCGTACGATGACGATTTG
+GATTCGTCATCTCCGGCAAACCGAGATATCAGTTCAATCACAAGCCGATCACGGCGCGGTGGCACAATTG
+TTGTTGCAGGTCAGAAGTGCGGTTTTGGCTCAGCTGTATCTTTGCGACCGCGGCGCTATCGTGAGCCGAA
+TCACGCAAATATTGTGACCCCGGACACGGATTTGTCACCATCGTGGCCCTGGTCCGGGATCTGATCCACA
+CGCCGTGGTGACCTGCGCCACAACGACTTGCACACCCCGACGTCCACCACACCTCGAATCAGCTAGACTG
+CTCCCAATAATCCGCCCTAATACTAAGTGCCGCACTGTGATTCATAGGTAACCTGGGGCACCACCAAATA
+GCAGTCTGCCGTAACAGCCGGATCCTCTACCGTCAGCAGACTCAAATGTCCTCCACCCCAACGCAATACG
+TGATCAACCGCGCACCAGAGACGCCAACTGTAGTCAAGGCAGTACTAGAAGCGGCGGCCATGGCCAATGT
+TAATAACGTCTTCATTGAAAACAAGACGAGAATATCTCGAAAGGCCACCAGAAAATTAATATGGAATAGT
+ATTAGCGTCCGGGCTGCATCGGTGCGTGCAAGCCTGCGGCCGAATTGACGTTGGTCAGCGGTCGGGAATC
+CGCCATCACGATCCGCAGTGCATCCGAAGCGTCGACCAGGGCGCTCATCTTTCGCTCGCCGGCACCGACC
+AACGTGTCGACGCGGTCGGCCAGATCCGTCCGATACACCGCGGCCAGGTAGTGGTTACGGCCATCCCAGG
+GCAACACCACTTCGGCATCGGTCTGCACCGCGCGGCGCGCGAGATCCTCGATCAATTCCACTGTCAGATA
+AGGCATGTCGACCGCACAGACAAACGCGAGCCGGACACCGGCCTCCGCAGCCGCACGCAACCCGCGACCG
+GTCGCCGGCAGCGGCCCCAGCCCCGGCAGCTCATCACGCAGAACGGGGACCGGCAGCGTGGGCAACGGTT
+GTCCCGGAGCGGCCATCACGAAAACCGGCGCGCAGCGCTGGCCGAGAATGCCGACCATATGCTCCACCAG
+CGTGGTGGTTCCCCCGGGGAGGGGCAGGGTGGCTTTGTCGCGACCCATTCGGCGGGATTCACCTCCCGCG
+AGAACAACCCCGGCCAGCGGCACTGTGTCGGGCGCGAGCTCAGCCACGTCAGTCGACGGTCCAAGTGTCG
+CGCCCGTGCAACAGTGACTGCAGTGCAGCGGTGCCGGACGGGGCGGCGTTTCGGGCCGCGACTACCTGCG
+AGCGGGCCGCATCATCGTAGGTTGGCCGGCTGATGTGCCGAAAGATTCCCAGCACGGTGTGGTCCAGGTT
+CTGATCGGACAGCCGGGACAGCGCGAAGGCGTAGGCCGGGTCGTCGACCTGCGCATCGTGCACAATGATC
+TCGTCGATGGCCACATCGGCCGTCTTGGCCACTTCGAGGCCGAATCCGGACTTGACCACGCAGTATTCGC
+CGTTGGCCCCGAAGACGATCGGCTCGCCGTGGCGGACCTTGATGACCCGCTCCTCGGCGCCCTCCTTGCG
+CAGCGCATCGAACGAGCCGTCGTTGAAGATCGGGCAGTCCTGCAGGATTTCGACCAGGGCAGCACCGCGA
+TGCTGGGCCGCGGCACGCAGCACTTCGGTCAGCCCGTTACGGTCTGAGTCCAGCGCGCGGCCAACGAACG
+TCGCCTCTGCCCCCAGCGCCAACGACACCGGATTGAACGGGTGATCCAGCGAGCCCATCGGTGTCGACTT
+GGTGACCTTGCCGACCTCCGATGTCGGCGAATACTGTCCTTTGGTCAGCCCATAGATCCGGTTGTTGAAC
+AGCAGAATCGTCACGTTGATGTTGCGGCGCAGCGCGTGGATCAGGTGGTTACCGCCGATCGACAAGGCGT
+CACCGTCGCCGGTGACCACCCATACCGACAGATCCTCGCGAGCCAGCGCCAGACCGGTCGCTATCGCGGG
+CGCGCGGCCGTGAATCGAATGAAAGCCGTAGGTTTCCAGGTAATAGGGGAACCGGCTGGAGCATCCGATA
+CCGCTGATGAACACGATGTTCTCACGCCGCAGCCCCAGTTCGGGCAGGAAGTTTCGGATGGTGTTGAGGA
+TGACGTAGTCGCCGCAGCCCGGGCACCAGCGCACCTCCTGGTCACTGGTGAAATCCTTGCCCTTCTGCGG
+CTGATCCGTGGTGGGCACCCCAGCGTTCTTGGTCAAGCTCGGAGTCAGGCCGAGCTCGGTGCCCGCCAAA
+TCACCGGTCACGCCGGTCATGAGCTGTGCTTCATCGCCGGAGCGGGTCATCCGTTTGCTCCCGCTCCCGC
+CGTGGCCGCCGACAATCTGGCGACCAACGTCTTGTCTTGCTCAAGCTCGGCCAATCTCCCGGCAAGTGCG
+GCCCGGATAAAGCGCCCAATCTCGTCGGCCAGGAACGAGACACCCTTAACCTTGGTGACCGATTGCACGT
+CGACCAGGTACTTACCGCGCAGCACCTGGGCCAGCTGGCCCAAGTTCAACTCCGGAGCCACCACCTTGGG
+GTAACGCCGCAGCACCTCACCCAAATTGGCCGGGAACGGGTTGAGATAGCGCAGATGGGCGTGCGCTACC
+TTGGTGCCTCGGCGACGCGCGCGCCGGCACGCTTCACCGATTGGGCCGTAGGAGCTGCCCCACCCGATCA
+ACAACAGCTCGGCGTCCCCGGTCGGATCATCGACTTCCAGATCGGGAACATGGATACCGTCGATCTTGGC
+TTGGCGCAACCGGACCATGAGGTCATGATTAGTCGGCTCGTAGGAGATGTCGCCCGAGCCATTGGCAGCT
+TCCAGCCCGCCGATGCGGTGTTCCAGACCGGGGGTGCCCGGAATGGCGAACTGGCGGGCAAGGGTTTCCC
+GGTCACGGGCATAAGGCTGGAAGGGCTCGCCGGGTTTGGCGAAGGTGTGCTTAATGGGCGGTAGCGCATT
+GACATCCGGGATTCGCCATGGCTCCGAGCCGTTGGCGATGGCGCCGTCGGACAACAAGATCACCGGGGTG
+TGGTAGGACACCGCGATGCGCACCGCCTCAAGGGCGGTTTCAAAGCAGTCGGCAGGAGAGCGCGGCGCCA
+GCACCGCCACCGGTGACTCGCCATTGCGGCCGTAGAGCGCCTGCAGCAAGTCGGCCTGCTCGGTCTTGGT
+GGGTAGACCGGTCGACGGCCCGCCCCGCTGCACGTCTATGACCAGCAACGGCAGTTCGGTCATCACACCC
+AGTCCCAGCGCTTCGGACTTCAGCGAAATTCCCGGTCCCGATGTGCTGGTGACTCCCAACGCACCACCGT
+AGGCGGCACCCAGCGCAGCGCAGATGCCGCCGATCTCGTCTTCGGCCTGGAAGGTGACGACATTGAAGTT
+CTTGTGCTTGGACAGTTCGTGCAGGATGTCCGACGCCGGAGTAATCGGATAACTGCCGAGCACGACCGGA
+AGGCCGGCGAGCTGACCGGCCACCACGATCCCGTAGGCCAGCGCGGTATTGCCCGAGATCTGCCGGTACT
+CGCCGGGCGGCAAAGTCGCGGGCGGTATCTCATAGGTCGTGCCGAAGGCCTCGGTGGTTTCGCCGTAGTT
+CCAGCCGGCCTTGAGGGCCAACACGTTGGCCTCGGCGATTTCGGGCTTGCGGGCGAACTTCTCCCTGATG
+AAGGCCTCGCTGTGCTCGAGCTCGCGCCCGTACATCCACGACAGCAGACCCAGCGCAAACATATTTTTGG
+CGCGCTGGCCATCCTTCTTGGACGCGCCGATCGCCTCGACGGCACCCAGGGTCAGTGTGGTCATGGCGAC
+GGTGTGCACCACATAGTCGGACAGCTCGCCGGACTCCAGCGGGTTTGTCACGTAGCCCACTTTCGTCAGG
+TTGCGCTTGGTGAACTCGTCAGAGTTCACGATCACCATTCCGCCAAGCGGTAGGTCGCCGATATTGGCCT
+TCAACGCTGCCGGGTTCATGGCGACGAGCACGTCGGGACGGTCACCGGCGGTCAGGATGTCGTAATCGGC
+TATCTGAATCTGAAAAGACGACACTCCGGGCAACGTGCCCGCCGGTGCCCGGATCTCTGCGGGGTAGTTC
+GGCTGGGTCGCCAGATCGTTGCCGAAAAGCGCTGCCTCCGAGGTGAATCGGTCGCCGGTTAGCTGCATGC
+CGTCGCCGGAGTCTCCAGCGAACCGGATCACCACATTTTCCAAGCGTTGCCGATCAGGCGCGGCATGAAA
+TGCCGCGTCATGAGACTCTGGCCCGGCCCCGCTGCCGTTCGGATCCACGTCTCCGCCTTCCATGTGTTAT
+CGGACAGGCACTCCGCGCTGCAGCTTCAGGTTACGCGTCGTCGGAGCGACACCCCCGCGCCGCACGGCTT
+GTGTCACTGGCGGTAGCGATTATGACATTTCATTTCGGGTGTAAGGCGGTCTCCGATGCCATATATGCGG
+CCGGTAACCGACCAAAAGGCGAAGTCAGCGAGGGCTGGCGGTAGCGACGACACAGAACTGTGGTATTGGT
+CACTTCCCCCCGAGGGTTGGCCGCGACCGCACCCGGACATCCGAATCCACGGTTTCCGGCATCGCGACCA
+GGTACAGGAGGAAGCCGGCCCCGGCGAGCGCACCCAGCGACATGAATGCCGCGTCATAGCCCGCGACGAC
+CACGATCCAGCCGGCAACAAGATTAGACAGCGCGGCACCAATGCCCGTTGCCGTGGTTACCGCCCCGAGG
+CTGATATTGAAATGTCCCGTTCCGTGTGTGACGTCCTGTACGACAAGGGGAAACAACGCCCCGAAAATGC
+CGGCTCCGATACCGTCGAGCAACTGCACGCCCACCAGCCAGTAGGAGTTATCCGACAACGTGTAGAGGAA
+CCCGCGAGCGGTCAAGACAGCGAACCCCACCAAAAAGATCGGCTTTCGCCCCCACGCGTCGGCCCTGGTC
+CCGACCACATACGCCACCGGCACCATCACGACCTGCGCCGCGACGATGCACGACGACATCAGCGCCGTTC
+CTTCGTCTCGATTGTGCAACGCCAACAGCTCGCCGACCAGCGGCAGCATCGCCGCGTTGGCGAAGTGGAA
+CGCGACAACCGCCGCCCCGAAGATCACCAGTTCGCGGTTGTGCGCCAACACGGTGAACCGCGACGGCTGC
+GGATGCGGCTCGCCGGGCGCATGGTCCATACCACGCGCTAAATCGTGGTCGACCGCGTCCGGCGGGATCC
+GCAGTGTCGCCAGCACGCTGATCAACGCCATGCCGGCCAGCACCCAGAACACCACCACCGGCCCGAAGAA
+GTACGCCAGCGCGCCGGTCGCCCCAGCCGCCGACGCGTTACCGGCGTGGTTGAACGCTTCGTTACGCCCA
+ATCCGTCTGGCGAAAAACTGAGGACCGACAGCACCCAACGTGATCGCCGCCAACGCCGGAGCGAAAACCG
+AGCTGGCGATCCCGGTGACGGCCTGCAGCACCGAGATGGAATACAAGCCCGCAAACAGCGGCATCGCCAC
+TGCGGCGGCGGTGACCAGCACCGCGCCGGCGACGACCAGCGCCCGCTTGGCCGTGGTCCGGTCCACCAGG
+GCGCCAATCGGCGTCTGGGCCACGATGGCCGCAATGCCGCCGACCGCCATGACGAACCCGATCGAGGCTT
+GATCCCAATCGTGGATCAACAGGAGGTATATCGACAGATAGGGGCCCAGACCGTCGCGAACATCAGCCAA
+CGAGAAATTCAGCAGGTCCAGCGCACGCGCCACCCGTGGCGGCACTGCCACAACGGTGCCCGACATGCAG
+TCGTCGCGGGGCTACGCGCTCTTGTCGCGGCGCTCCGAACGGGACGGCTTGCGTGGCACGATTGTCGGCA
+ACACGTTGTCCTGCACGGTCTCCTTGGTGACCACCACTTTGGCGACATCGTCGCGGCTCGGGATGTCGTA
+CATCACCGGCAGCAGGACTTCTTCCATGATCGCCCGCAGGCCGCGGGCACCGGTGCCGCGATGGATCGCC
+TGGTCGGCGATCGCTTCCAGCGCATCGTCGGTGAACTCCAACTCCACGCCATCCATCTCGAACAGCCGGA
+TGTACTGCTTGACCAAAGCGTTCTTCGGCTCGGACAGGATCTTGACCAACGACTCTTTGTCCAGGTTGGT
+GACCGAGGCGACCACCGGCAGGCGGCCGATGAATTCCGGGATCAGGCCGAACTTGATCAGATCCTCCGGC
+ATCACGTCGGCAAAGTGGTCGGTGGTGTCGATCTCGGCCTTGGAACGAACCTCGGCGCCAAAGCCGAGGC
+CCCGCTTGCCGACGCGCTCGTAAATGATCTTCTCCAGCCCGGCGAACGCTCCCGCGACGATGAACAGCAC
+GTTGGTGGTGTCGATCTGGATGAACTCTTGATGCGGGTGCTTACGGCCCCCCTGCGGCGGAACCGACGCC
+TGAGTGCCCTCCAGGATTTTCAGCAAGGCCTGCTGAACGCCCTCACCGGAGACGTCGCGAGTAATCGACG
+GGTTCTCACTCTTGCGGGCGATCTTGTCGACCTCGTCGATGTAGATGATGCCGGTCTCGGCGCGTTTGAC
+GTCGTAGTCGGCGGCCTGAATAAGTTTGAGCAAGATGTTCTCGACGTCCTCGCCGACGTAACCGGCCTCG
+GTCAGCGCGGTGGCGTCGGCGATGGCAAACGGCACGTTAAGCATCTTGGCCAGCGTCTGGGCCAGGTAGG
+TCTTGCCACAACCGGTGGGTCCGAGCATCAAGATGTTCGACTTGGTCAACTCAACGGGCTCACATCGGGA
+GTCACGGCCCTTCTCCCCGGCCTGGATCCGCTTGTAGTGGTTGTACACCGCCACGGCCAGCGTGCGTTTG
+GCGGTATCTTGCCCGATGACGTAGCCCTCGAGGAACTCCCGGATCTCGGCCGGCTTGGGCAGCTCGTCGA
+GTTTCACATCGTCGGCGTCGGCGAGTTCCTCTTCGATGATCTCGTTACACAGGTCGATGCACTCATCGCA
+GATGTACACGCCGGGGCCGGCAATGAGCTTCTTGACCTGTTTTTGGCTCTTCCCGCAGAACGAGCACTTC
+AGCAGGTCACCACCGTCTCCTATGCGCGCCATAATGCTGATGGCCTACTTCCTGATCGCCGTTCGTGTTG
+CCGTGCCCCGTGTATGCCCCGACGCTACCCGCTTGCTCCGGCCCCCCGCGACCGTTAGCACCGAATAGCG
+TCCTAGAGATTTCAGGGTGTTCACGCCTCTCGTCTGAATGAAACATATAGCCCGACTGCGCCCCACTCGC
+CGAGACGCGCGATCCGTGTCTCTGGCGTGTCGCGGTCGTAACCCCACCGAGGCCCGCGCGTCGCGGACCC
+GGCAGCGGCCCGACCGCCAGCTGACCACCCTACAGTGGCGTTGTGGAATTGGTCAGCGATTCCGTGCTGA
+TCAGCGATGGCGGCCTGGCCACCGAGCTTGAGGCGCGCGGTCACGACCTGTCCGACCCGTTGTGGTCGGC
+GCGGCTGCTGGTGGACGCTCCGCACGCGATCACCGCGGTGCATACCGCGTACTTTCGCGCTGGGGCCCAG
+ATTGCCACGACTGCCAGCTACCAGGCCTCGTTCGAGGGCTTCGCGGCGCGCGGCATAGGTCATGACGACG
+CCACCGTGCTGCTGCGCCGCAGCGTCGAACTCGCCCAGGCTGCGCGCGACGAGGTCGGCGTTGGCGGTCT
+ATCGGTCGCAGCCTCGGTCGGGCCATACGGCGCCGCGCTGGCTGACGGATCCGAATACCGTGGATGCTAC
+GGCCTGTCCGTCGCAGCCTTGATGAAGTGGCATCTGCCACGGCTCGAGGTGCTAGTCGATGCCGGCGCTG
+ACATGCTCGCCCTGGAAACCATCCCCGATATCGACGAAGCCGAAGCGCTGGTCAACCTGGTGCGGCGGTT
+GGCTACGCCGGCCTGGCTCAGCTACACGATCAACGGGACGCGGACTCGCGCCGGGCAACCGCTCACCGAC
+GCGTTTGCGGTGGCCGCAGGAGTTCCCGAGATCGTCGCCGTCGGCGTCAACTGCTGCGCACCCGACGACG
+TGTTGCCGGCCATCGCTTTCGCCGTCGCCCACACAGGCAAACCGGTGATCGTGTACCCGAACAGCGGTGA
+GGGTTGGGATGGTCGGCGCCGCGCCTGGGTAGGTCCGCGGCGGTTTTCCGGATCTTCCGGGCAGCTTGCG
+CGGGAATGGGTTGCGGCGGGCGCGCGCATCGTGGGCGGATGCTGCCGAGTACGGCCGATCGATATTGCCG
+AAATCGGGCGAGCGCTGACCACCGCGCCGCCCCGAGGCTGAAAGCGAAAATTGCCTCTACTGCCTCATCG
+AGGCGTTACCTAGGGTTAGTTCTTGTGACCGCGAAGCCCGGCTACGCATGAGTAAGAACCGCATTATGGG
+CAACCAACCGGAGAAGTCAGATGTGACTGCGGCACCCGACACCGTGGAGGGCGATTCCCACACTGCAATG
+ACACCGCGCCAGCGGCTGACCGTGTTGGCAACGGGGCTGGGCATCTTCATGGTGTTCGTGGACGTCAACA
+TCGTCAATGTCGCATTGCCCAGCATCCAAAAGGTGTTTCACACGGGCGAACAAGGTCTGCAGTGGGCGGT
+CGCCGGGTACAGCCTGGGCATAGCGGCCGTGCTGATGAGTTGCGCCCTGCTGGGCGATCGCTACGGTCGC
+AGGCGCAGTTTTGTGTTCGGGGTCACGCTCTTCGTCGTGAGCTCTATTGTCTGTGTGCTACCGGTCAGCC
+TGGCAGTTTTCACGGTCGCACGAGTGATCCAAGGTTTAGGAGCGGCGTTCATCTCAGTGCTCTCGCTGGC
+CTTGCTAAGCCACTCCTTTCCCAATCCCCGAATGAAAGCACGGGCGATATCCAACTGGATGGCCATAGGC
+ATGGTCGGTGCGGCATCTGCCCCCGCGCTGGGCGGGCTCATGGTCGACGGCCTCGGTTGGCGCAGCGTGT
+TCCTGGTGAACGTTCCGCTCGGTGCCATCGTGTGGCTGCTGACGCTAGTCGGTGTCGACGAGTCACAGGA
+TCCCGAGCCCACTCAACTCGACTGGGTGGGACAGCTGACGCTTATCCCGGCCGTCGCCCTGATCGCATAC
+ACCATCATCGAGGCTCCCCGGTTCGACCGGCAGTCCGCCGGGTTCGTGGCGGCGTTGCTGTTAGCGGCTG
+GGGTACTGCTGTGGCTGTTTGTTCGACACGAACACCGCGCCGCTTTCCCGTTGGTCGATCTCAAACTGTT
+CGCCGAGCCGTTGTACCGATCGGTGCTGATCGTCTACTTCGTGGTGATGTCCTGCTTTTTCGGGACTCTG
+ATGGTGATCACCCAGCACTTCCAAAATGTGCGCGACCTATCGCCGCTGCACGCGGGTTTGATGATGTTGC
+CGGTCCCCGCGGGATTCGGGGTGGCGAGTCTGCTGGCGGGTAGGGCGGTCAACAAATGGGGTCCTCAGCT
+CCCGGTGCTGACGTGCCTGGCGGCCATGTTCATCGGGTTGGCGATTTTCGCGATCTCGATGGACCACGCG
+CATCCAGTGGCCCTTGTTGGCCTGACGATCTTTGGCGCGGGAGCCGGCGGCTGCGCCACACCGCTGTTGC
+ATCTTGGAATGACCAAGGTCGATGATGGCCGTGCCGGCATGGCCGCCGGGATGCTCAATCTGCAGCGGTC
+GCTGGGCGGCATTTTCGGCGTCGCCTTCCTGGGCACCATTGTCGCGGCCTGGTTGGGTGCCGCGCTGCCG
+AACACCATGGCCGACGAAATTCCCGATCCCATCGCTCGCGCGATCGTTGTCGACGTCATCGTGGACAGCG
+CGAATCCGCATGCCCACGCGGCATTTATCGGGCCAGGACACCGGATAACTGCGGCGCAGGAGGATGAGAT
+CGTACTGGCCGCCGACGCGGTCTTCGTGAGCGGAATCAAGCTCGCGTTGGGCGGCGCCGCCGTATTGCTG
+ACCGGCGCGTTCGTCCTTGGTTGGACGCGCTTCCCCCGGACCCCCGCCAGCTAAGTGGTCTCGCTCGGTG
+CGCCCCCACAGTCCCTGCGCCGAGATCGACGTTAGCGTCACGCCTTATGGTGATTTTCCGCTCTGGCGTG
+GATCTCGGCGCATGTCGGGTGGCGACCACCAAGCCACGCCACGGCCGCACCACCCGCCCATGGCTCAGGC
+GGTTTGCGCGGAGAGCTTCCGGTACTCGAGCACCGTGTCGATGATGCCGTAGTCCTTAGCCTCTTCCGCG
+GTCAAGATCTTGTCCCGGTCAGTGTCTTTGCGGATCACTCCGGCGTCCTTGCCGGTGTGGCGGGCCAGCG
+TGGTTTCCATCAGGGTGCGCATCCGCTCGATCTCGGCGGCCTGGATCTCCAGATCGGAGAACTGTCCCTG
+GATCACGCCCGACAACGACGGCTGATGGATCAACACCCGCGCATTCGGCAGCGCCATGCGCTTGCCCGGT
+GTTCCGGCGGCCAGCAGCACCGCAGCCGCCGAGGCGGCCTGGCCCAGACACACCGTCTGGATATCGGCCC
+GCACGTATTGCATGGTGTCGTAGATCGCCATCAGCGAGGTGAACCCACCGCCCGGCGAGTTGATGTACAT
+GGTGATATCGCGGTCGGGATCCAACGACTCCAACACCAGCAACTGTGCCATGATGTCGTTCGCCGACGCG
+TCGTCGACCTGGACGCCGAGGAAGATGATGCGTTCCTCGAACAGCTTGTTGTATGGATTGGACTCCTTGA
+CCCCGAAGCTGGAGTGCTCGATGAACGACGGCAGGATGTAGCGCGCCTGGGGCTGGATCTGAGAATTTTG
+GGAATTCACTGTGCTTCTCCATTGACGTGGGCGCGGGTGATGATGTGATCGACGAAACCGTATTCCAGGG
+CTTCGGCGGCGGTGAACCAGCGGTCGCGATCGGAATCCGCCTCAATGCGCTCGATCGGCTGGCCGGTGAA
+TTCGGCGTTGAGCCGGAACATTTCTTTCTTGATCACGGCGAACTGCTCGGCCTGGATGGCGATATCGGCC
+GCGCTGCCGGTCACCCCGCCCAACGGCTGGTGCATCAGGATGCGAGCATGCGGCAGCGCGTAGCGCTTGC
+CCTTGGTACCTGCCGCCAGCAGGAACTCGCCCATCGAGGCGGCCATGCCCATCGCGTAGGTGGCGATGTC
+ACAGGGCGCCAGCACCATGGTGTCGTAGATCGCCATGCCGGCGCTGATCGATCCACCCGGCGAATTGATG
+TAGAGGCTGATGTCCTTGCTGGCGTCTTCGGCGGCCAGCAGCAGAATCTGAGCGCATAACCGGTTGGCGA
+TCTCGTCGTTCACCTCCGAGCCCAGGAAGATGATGCGCTCGGAGAGCAAGCGCTCGTAGACCGAATCCGT
+GAGGCTAAGACCCTGCGAGTTCGAACGCATGTCAGTCACTTGGCTCACAGTGGGGCACCTGCTTTCCTCG
+AGTTCTTCTATGCTCCGACACTAACCAACCAGGCTGGCTGTTTCGCGGTCACGCACCCCCTGAAACCGGC
+GCGTTCGCTTACAGCGTCATACGGTCACGTTGTCGCTTCGTCGGACGCCGCCCGCGCGGCACCCTCGTCT
+GCCGGTTCGGCCTCCTCAGCCTCACCGGCCGACACACGCTTGCCGAAGAACTCACTGGTATCGATCGTGT
+TTCCGTCACTGTCGGTGACCGTCGCCGCCTCCACTGCGGCCCTGATCGCCAGCTCGCGCCGCACGTCAGC
+GAACATGGTCGGCAGCTGGTTGCGCTCTTGGAGGTAGCCGAACAGCTGCTGCGGCTCGATGCCGTATTGC
+CGAGACGTCGTCACCAGTCGTTCGGTCAGATCATCCTGGCCAACTTGGACCTGCAGCTCATCGGCCAGGG
+CGTCTAGCAACAGCTGCCTCTTGACGTCCTTTTCTGAGGCGGTGCGCGCCTCGGCATCGAACGCCGCGCG
+TGACGAGCCTTGCTCGACGAGCAACTCATTGAACCGGGCTTCGTCGTGATTAAGACCGCTGAGCGCGCTG
+TGCAGCACGCTGTCGAATTGGGCCTGCACATACGACTCCGGCAACGGCACGTCGACCTGTTCGAGTAGCG
+CATCGATGGTGGCGTTTCGAATCTGCTCGGCCTGCTGGGCGCGCTTGGCCTGGCGCACCTGGTCGCTGAG
+GCTGGCCCGCAATTCGTCGATGCTGTCGAACTCGCTGGCTAACTGCGCGAATTCGTCGTCGGGCTCTGGT
+AGTTCGCGCTCCTTAACCGACCTGACCGTGACGGTAACCTGAGCTTCCTGCCCGGCGTGCTCGCCGGCTG
+CCAGCTTGGCGGTGAAGACCCGGGACTCGTCGGCGGACAGACCAACAACCGCGTCGTCGAGACCTGCGAT
+GAGCCGGCCGGAGCCGACCTCGTGGGAGAGTCCCTCAGCGGCTGCGTTCGGTATGTCCTCTCCGTCGACC
+GTGGCAGACAAGTCGATCGAGACGACGTCGCCGACGGCCACCGGCCGGTCCACCGCGGTCAGGGTGCCGA
+ACCGGGTACGTAACGACTGCAGTTCGGCGTCGACGTCGTCCTCACCGATTTCGATCGGATCCACCGAGAC
+CGTCAGCGCGCTCAGGTCCGGGAGACTGATCTTCGGGCGGATGTCGACCTCGGCGGTGAATTGCAGGTCC
+TGGCCGTACTCCTTCTTGGTCACCTCGATGTTGGGCCGGCCGAGCGGTTGGACATCCGACTCGGCCACCG
+CCTGTCCGTACCGGCTGGGCAGCGCATCGTTGACGATTTGATCCAGCATGGCCTCCCGGCCGATGCGGGC
+TTCGAGTAGTTTGGCCGGCGCCTTCCCGGGCCGGAAGCCGGGCAGCCGCACCTGTTTGGCCAGCTCTTTG
+TAGGCCCGCTGGAAATCCGGCTCAAGCTCGGCGAATGGCACCTCCACGTTGATACGAACCCGGGTGGGGC
+TCAACTGCTCGACGGTGCTCTTCACGGGTGTGCTCCTTGGTAGTCGATAACGGCGGTCGGCTGGTCGGGG
+TGACAGGATTTGAACCTGCGGCCTTCCGCTCCCAAAGCGGATGCGCTACCAAGCTGCGCTACACCCCGCG
+CTGACCTCGCGATCCTACGGCCCGGCGACACCGGCACCGCAATGACCTCTTGAGACCTCACGGGAAGGTC
+TCAAAACGACTCCGATTAGATTTGATGTCTGTCACCACGTACAGTCGCGCTCGACTAAATACATGCGGGC
+GTAGCTCAATGGTAGAGCCCTAGTCTTCCAAACTAGCGACGCGGGTTCGATTCCCGTCGCCCGCTCGGGC
+CATGCGTTTGTTCGGCAGAAAGGCGCCATGCGCGACCCATGAATCAGCCTGACATCAAGGGCTCGTGCGC
+GTCGGAGTTCACCAAGGTACGCGACGCGTTCGAGCGCAACTTTGTGCTGCGCAACGAGGTCGGCGCGGCC
+GTCGCGGTGTGGGTCGACGGGGATCTTGTCGTCAACCTGTGGGGCGGCTCCGCCGACGCCGGCGGTACCC
+GGCCCTGGCAGCACGACACGCTGGCCACCGTGCTGTCCGGTACCAAGGCACTAACGGCCACGTGTGTGCA
+TCAGCTCGTCGATCGCGGTGAGCTTGACCTGCATGCGCCGGTGGCACGCTACTGGCCCGAGTTCGGACAG
+GCGGGTAAGCAGGCCATCACGCTGGCGATGGTGATGAGCCACCGCTCCGGGGCGATCGGGCCGCGCGGAC
+GGCTGGGCTGGGAGCAGGTCGCCGATTGGGATTTTGTCTGCGAGCAACTGGCCGCCGCCGAACCGTGGTG
+GCAGCCGGGTGCCGCGCAGGGCTACCACATGACCACCTTCGGTTTCATCCTCGGCGAAGTGTTCCGCCGC
+GTCACAGGCCGTACGGTCGGTCAATACCTGCGTACCGAGATCGCTGAGCCGCTGGGTGCGGACGTCCACA
+TTGGCTTGCATCCCGGCGAACAGCTCCGCTGCGCCGATCTAGTTGATAAGCCGCACATCCGCCAATTGCT
+GGCCGACGTCCAAGCCCCCGGCTACCCCACCAGCCTAAACGAACATCCCAAGGCTGCATTGTCGGTGTCG
+ATGGGCTTCGCCCCCGACGACGAACTCGGCTCCAACGACCTGCAGCTGTGGCGTCAGATCGAATTCCCCG
+GCACCAACGGCCAGGTGTCTGCGCTGGGGCTGGCGACGTTCTACAACGGGCTTGCCCAGGAGAAGCTGCT
+CAGCCGCGAGCACATGGAGCTGGTCCGGGTCTCACAGGGCGGCTTCGACACCGATCTGGTGCTCGGCCCG
+AGGGTCGCCGACCATGGCTGGGGTCTGGGCTACATGCTCAACCAGCGCGGCGTCAATGGACCCAACCCAC
+GGATTTTCGGGCATGGTGGCCTCGGCGGCTCGTTTGGGTTCGTCGACCTCGAGCACCGGATCGGCTACGC
+CTACGTGATGAACCGCTTCGACGCCACCAAGGCCAACGCGGATCCGCGCAGCGTCGTCCTGTCCAACGAG
+GTCTACGCCGCGCTCGGGGTAAACCGTTCCTAGACGGCTAGCCACCAGGCGGTCAGGTCTGACAGACCGG
+GCACCAGAAAACATTGCGGCCCTCGAGCAGTGCCGTGCGGATCACTCCCCCACACACCCGACACGGCTCG
+CCGGCTCGGCGGTACACATAGGTGCGGGGCCGGTCGGGCAGATATGACGGCAGACCATGGTCATGTTCGG
+GGCGCACCACGATGATCTTGCCGCGGCGCAAGCCCACCTTCATCAACGACACCAGATCGTTCCAGGCCGC
+GTCGAATTCCGGCTCACCGATCCCGCGGCCGGGCCGCTGTGGGTCGATCCGGTGCCGAAAAAGCAACTCA
+TTACGGTAGACGTTGCCAACACCGGCGATCACCGTTTGGTCCATCAAGAGCGCGCCTATGGGCCTGCGAG
+ACTTGGTGATCCGAGACCATGCCGACGACGGGTTGGCGTCGCTACGCAACGGGTCGGGTCCCAGCCTGGC
+AACCACGTCCGCAACCTCGCCGTCGTCGATCGACTCACACACCGTCGGGCCGCGCAAGTCGGTGCCGAAT
+TCTGCCCCGACCATCCGCATCCGCACCTGCCCCGCGGGTTCGGGTAGCCACCCATCTGTGGGGCGTGCCC
+ATTCGGTGAAGGTGCCATAGAGCCCGAGATGCACGTGCACCACGGGGCCGCCGACGTAGTGATGGAACAG
+GTGTTTGCCCCAGGCACTGGCCCGCCGCAACACCCGACCGTTGAGCGCGGAAGCCGAATCGGCGAACCGG
+CCCTGGGGGCTGGACACCGAGACCGGCGCACCGGCGAACCGGCGCTGGTGCAGCCGGGCCAGCCGATGCA
+GCGTATGCCCCTCAGGCACGGGAGTCAGGCCGGAGCGCCGGGCACCGGCGGCGCTTCGTGGGTCCGTTCG
+TACTCGGCGAGAATGTCGATACGCCGTTGGTGGCGTTGCGCTTTCGACCACGGCGTGGTGACGAAGGCGT
+CGACTATCGCCAGTGCCTCGGCCACCGTGTGCATGCGGCCGCCGATGCCGATCAACTGGGCGTTGTTGTG
+CTCGCGAGCCAGCGCCGCGGTCTGCACACTCCAGGCCAGCGCGCAGCGAGCGCCGGGCACCTTGTTGGCG
+GCGATCTGCTCCCCGTTGCCCGATCCGCCCAGCACGATGCCCAGGCTGCCCGGATCGGCGACAGTGCGCG
+TCGCTGCGGCAATGCAGAATGCCGGGTAGTCGTCGTCGGCGTCGTAGCGCAACGCGCCGCAGTCGATCGG
+CTCGTGGCCGGTTTGCTTCAGGTGCTCGATGATCCGCTGCTTGAGCTCATATCCGGCGTGGTCGGCCCCC
+AGGTAGACGCGCATGCCCGACATTGTGCCCGACACACTGCCGGGCGCCGGCGCGGGCGCCCGCCGATAGT
+GAATTCGGCGACAAGAACCCGGGCGTGTTCCGGCGCCGAATTCACTATCGGCGGCTAGTCGAACTGAGGC
+GGCTCGGTGCGGGTCCGCTTGAGCTCAAAAAAGTGCGGGTAGGAAGCGAAGGTAACCGAGGCATCCCAGA
+GCTTGCCGGCTTCCTCGCCGCGCGGAATCTTCGAGAGCACCGGCCCGAAGAACGCCACACCATTGACATG
+GATCGTCGGCGTACCGACGTCCTCGCCCACCGCGTCCATCCCGGCGTGGTGGCTTTTGCGCAGGGCGTTG
+TCGTAAGCGTCGCTGGTAGCGGCCTTGGCCAACTCCGCGGGCAGACCGGCGTCCGCCAGCGACTGGGTGA
+TGACCTCGTCGAGTTCGTGGTTGCCCTGGTTGTGAATCCGGTTGCCCATCGCGGTGTACAGCGGGTCCAG
+GACTTTCGCCCCATGGGCCTGCTCGGCGGCGATCGCCACCCGTACCGGTCCCCATGCCCTCGCCATGCCT
+TCGCGGTATTGCTCGGGCAGGTCGTCACGGTTTTCGTTGAGTATTGCCAGGCTCATGACGTGGAAGTTCA
+CCTCGATGTCGCGGACCTTTGCCACCTCGAGGATCCAGCGCGACGTGATCCAGCACCACGGGCACAGCGG
+ATCGAACCAGAAATCGGCGACAGACTTCTGGGGGGCCTTCTCGAGCATGGCGCGGTCCTCTCGTTGGAGT
+CAGCAGCGGTGAGTACACCGCCCAGCACAACCACGGCCGCCCCGCACCTGTTCCCGCCGACCCGGTTAAG
+TTGGACGCCGTGGCCCTTCCAAACCTCACGCGGGACCAAGCCGTCGAACGCGCCGCCCTGATAACCGTGG
+ACAGCTACCAGATCATTCTCGATGTGACCGACGGTAACGGCGCTCCCGGCGAACGCACCTTCCGGTCGAC
+CACCACCGTGGTGTTCGACGCACTCCCCGGCGCCGACACGGTCATCGACATCTCCGCCCACACCGTGCGC
+CGCGCCAGCCTCAACGACCAAGACCTGGACGTCTCGGGATATGACGAGGCGGCCGGGATCCCGTTGCGCG
+GACTGGCCCAGCGCAACGTCGTCGTCGTCGACGCCGACTGCCACTACTCCAATACCGGCGAGGGCCTGCA
+TCGGTTTGTCGATCCGGTGGACGGCGAGACCTACCTGTACTCGCAATTCGAAACCGCCGACGCCAAGCGC
+ATGTTCGCCTGCTTCGACCAACCCGACCTCAAGGCCACGTTTGACGTGCGGGTGACCGCGCCCGCGCACT
+GGAAGGTGATCTCCAACGGCGCGCCGCTGGCCGCGGCAAACGGCGTACACACCTTCGCCACTACCCCGCG
+GATGAGCACCTATCTGGTGGCCTTGATCGCCGGACCATACGCGGCCTGGACGGACACTTACATCGACGAC
+CACGGGGAAATCCCACTCGGCATCTATTGCCGGGCCTCGCTTGCCGAATACATGGACGCCGAGCGGCTGT
+TCACCCAAACCAAGCAGGGATTCGGCTTCTACCACAAGCACTTTGGCCTGCCATACGCGTTCGGCAAGTA
+CGACCAGCTCTTCGTCCCCGAATTCAACGCCGGCGCAATGGAAAACGCCGGCGCGGTGACCTTCTTGGAG
+GACTACGTCTTCCGCAGCAAGGTCACCCGGGCATCCTATGAGCGGCGCGCGGAGACCGTGCTGCACGAGA
+TGGCCCACATGTGGTTCGGCGACCTGGTCACCATGACCTGGTGGGACGATCTGTGGCTGAACGAGTCCTT
+CGCCACCTTCGCCTCGGTGCTGTGCCAAAGCGAGGCCACCGAATTCACCGAGGCTTGGACGACGTTTGCG
+ACCGTGGAGAAGTCTTGGGCGTATCGCCAAGACCAGCTGCCGTCGACGCACCCGATCGCCGCCGACATCC
+CCGACCTGGCCGCTGTCGAGGTGAACTTCGACGGGATCACCTACGCCAAGGGCGCCTCGGTGCTCAAACA
+GCTCGTTGCCTACGTCGGGCTGGAGCGCTTTCTGGCCGGCCTGCGTGACTACTTCCGCACGCACGCTTTT
+GGCAATGCCAGCTTTGACGATCTGCTGGCCGCGTTGGAAAAGGCCTCGGGCCGCGACCTGTCGAATTGGG
+GCGAGCAGTGGCTGAAGACGACCGGGCTCAACACCCTGCGACCAGATTTCGAGGTTGATGCCGAGGGCAG
+GTTCACCCGGTTCGCGGTGACACAGAGCGGTGCGGCACCCGGCGCAGGTGAGACCAGGGTGCATCGGTTG
+GCGGTGGGCATCTACGACGATGATGGTTCCAAGAGTTCCGGCAAGCTGGTCCGGGTGCACCGCGAGGAAC
+TCGATGTCTCCGGTCCGATCACGAACGTCCCTGCGCTGGTTGGCGTTTCGCGCGGGAAACTGATTCTGGT
+CAACGACGACGACCTGACCTACTGTTCGCTGCGGCTGGACGAGCGGTCGCTACAGACCGCGCTAGACCGC
+ATCGCCGACATCGCCGAGCCGCTGCCGCGCACGCTGGTGTGGTCGGCCGCCTGGGAAATGACCCGTGAAG
+CCGAACTGCGTGCCCGCGACTTCGTGTCACTGGTGTCCGGCGGCGTGCACGCAGAAACGGAGGTCGGGGT
+CGCGCAGCGGCTGCTGCTACAGGCGCAGACAGCGTTGGGTTGCTATGCCGAGCCCGGCTGGGCCCGGGAG
+CGGGGATGGCCGCAGTTCGCCGACCGGCTGCTGGAGTTGGCGCGCGAAGCCGAGCCTGGGTCGGATCATC
+AGCTGGCCTATATCAACTCGCTGTGTTCGTCGGTGTTGTCCCCCCGGCATGTGCAGACCCTAGGGGCGTT
+GCTCGAGGGTGAGCCCGCCGCATGTGGATTGGCAGGCTTAGCCGTCGACACCGACCTGCGCTGGCGGATC
+GTAACCGCGCTGGCCACCGCGGGCGCCATCGACGCCGACGGGCCGGAGACACCGAGAATCGACGCCGAGG
+TGCAGCGCGACCCGACTGCCGCCGGAAAGCGGCATGCCGCCCAGGCCCGCGCGGCGCGGCCACAGTTCGT
+CGTCAAGGACGAGGCATTCACCACGGTGGTCGAGGACGACACCCTGGCCAACGCCACTGGCCGCGCGATG
+ATCGCCGGCATTGCCGCACCCGGACAAGGCGAGCTGCTCAAGCCGTTCGCGCGACGCTACTTTCAGGCGA
+TCCCCGGAGTATGGGCACGGCGATCCAGCGAAGTCGCGCAATCGGTGGTGATTGGCCTGTATCCGCACTG
+GGACATCAGCGAGCAGGGCATCACCGCCGCCGAGGAGTTCCTCAGCGACCCCGAGGTTCCGCCCGCATTG
+CGCCGGCTGGTGCTCGAGGGCCAGGCCGCGGTGCAGCGATCGTTGCGGGCCCGCAACTTCGACGCTGACG
+GCTAGCCCTCACCGCGAGGGCGCGTGTCTGTACAACGACACGCCGCATCGGGCGTACATTCGGGCGTGCT
+CGCCGGGTCAGCCCGGCGCGATCCCCGCGCTGAGCACGCGGATCGCGCTGATCAGCCCATCTACCAGCTC
+ACCCTGCTCGAACGCTGAGGAAGCGGCGGCAACCCCGAGCGGAGCCGCCGACTCGGCACCGCGGCCGCGG
+ACTTGCGAGCCGTAGACCACTTCGATGGCGCACTGGTTGGGCGAGACCGCGAGCAGCACAGCATTGTCCG
+GCGTGGGCACCTTGCCCAAGATCTCGCGGGCCCGCGCGGCGGTGTCACGACCCAAGTCGCCGAGGTAGAT
+GGCGAACCTCACCTGACACGCCCGCGAGCTGTAGGTCAGCGCGTCGTCCAGGGCGACGAGATCTGCGATG
+GGGAACGGGTAGTGCACGGACAGTTCCCCGGGCTCGGTGACCCCCGAGATCCGTCCGCTGGTGGTCAGCA
+CCCAACCCGGCGGCAGCTCGGCGTGCTCAATCGTCGCAACGTCACCACGTGCCACTGGCCCCACCTCCAA
+CCGTGAACTCCGATGCGTCATGCCCGTGTCCGCCGTGCGCGCTGCCAACGACCTCGTCGGTGGCGGCCCA
+CAGGATGGGCGGGTGTGTCCAAGGCTCCGACAGTTTGTAGGTTGCCGGGTGAGGTCCCTTGCGCGACCAG
+ATCAGCACAGACAGCACAACCACCAGCAACAACGGGATACCGACAAAGAAGAGGTGGATCTCCATAGCAC
+TCACGACGCAAACCGTATCCCACCGGGTTTTCAGGCCGCACCCTCACCGAGGTATCGCGCCCAGGACGGG
+TCCAGCTCCTTGACCGCCGACAGCAGTCGCCAGTGCGGTCCCGTGGGCGGCAGCGGCGCCCGGCGGAGTG
+CCCAGCCAAGCTCGGTCAACAGCCTGTCACCCTTGCGGTGGTTACACGGCGAGCAGCACGCAACGCAGTT
+CTCCCAGGAGTGGGCACCGCCCCGGCTGCGGGGTACCACGTGGTCGACGGTGTCGGCCTTGCCGCCGCAG
+TAGGCACAACAGAACCGGTCCCGATGCATGAGCGCGGCCCGGGTCATCGGAACCCGGGCACGGTAGGGAA
+CCCGGACATAGGAGCGCAACTGGATCACCGACGGGACCAGGATCGATCTGGTCGACGAGTGGATGACCGG
+CCCGGACGGGTCTTCGTGCACCACGTCGGCCTTGCCACAGATCACCATGACAATCGCCCGCCGCATCGAC
+AACGCGGTAAGCGGCTCGTAGGTGGAGTTCAGGAGCAGCACCCGCCGGCGGTTCCAGATCGATGCGCTCT
+CGTGACGGTTCGGTGGATGGGTCTCGACGCCTGACGCGAGTCGGTGGGAGTGGACACCGTGCAGGCATGA
+AGCGGGCCCGGTTACGCCTGCCGCGACACCGGAACTGCGGTGGCCGCGGCGCTTCTTGCCGTGCGCCATA
+GGTCCTCCGCCGAACAGTCCACCATGATTCGCGGCTAATCGCACGCCAAATGCCACGTCCACACCGTGTC
+GCTCCGGTGAACAAACCGGGGGCTGGCTGGTCGGCCACGACAAATAGACCACAATGGAGGGGATGGATCA
+GATGCCGAAGTCTTTCTACGACGCGGTCGGCGGCGCCAAAACCTTCGACGCGATCGTGTCGCGTTTCTAT
+GCGCAGGTCGCCGAGGACGAAGTACTGCGGCGGGTGTACCCCGAAGATGACTTAGCCGGCGCCGAGGAAC
+GATTGCGGATGTTCCTCGAGCAGTACTGGGGCGGCCCACGAACCTACTCGGAGCAGCGCGGCCACCCCCG
+ATTGCGGATGCGGCATGCCCCGTTTCGGATCTCGCTCATCGAACGCGACGCCTGGCTGCGGTGCATGCAT
+ACGGCTGTGGCCTCCATCGACTCAGAAACGCTCGATGACGAGCACCGTCGAGAGTTGCTGGATTATCTGG
+AGATGGCCGCTCACTCGCTGGTCAACTCCCCGTTTTGATGGACCAACACCAGCGACCGGATCCAATGGGC
+CCCGGCTCTCCTCGCGCCAGCGCTCGTCGACCGGAGCCAGATCCGATGGGCGAGCCGTGGTGGTCGCGAG
+CCGTGTTCTACCAGGTCTATCCCCGATCGTTCGCCGACAGCAACGGCGACGGGGTGGGCGACCTGGACGG
+GTTGGCGAGCCGGCTTGACCACCTGCAACAGCTCGGTGTCGACGCGATCTGGATCAACCCGGTCACCGTC
+TCGCCGATGGCAGACCACGGATACGACGTCGCCGATCCCCGCGACATCGACCCACTCTTCGGCGGGATGC
+CGGCGTTCGAACGGTTGGTCGCTGCGGCACACCGGCAGGGCATCAAAGTCACCATGGACGTGGTGCCCAA
+CCACACCAGTTCGGCGCACCCATGGTTTCAGGCCGCGCTGGCTGACCTCCCGGGTAGCCCGGCGCGGGAT
+CGCTATTTCTTTCGCGACGGGCGGGGCCCCGACGGGTCGCTGCCGCCGAACAACTGGGAGTCGGTGTTCG
+GCGGGCCGGCCTGGACCCGAGTGCGCGAACCGGACGGCAACCCGGGCCAGTGGTACCTGCACCTTTTCGA
+CACCGAACAGCCGGACCTGAACTCGGACAACCCGGAAATCCTTGACGACTTCGAGAAAACACTGCGCTTC
+TGGCTGGACCGCGGCGTGGATGGCTTCCGCATCGACGTGGCGCACGGCATGGCCAAGCCCCCGGGCCTGC
+CGGACTCACCGGACCTGGGCATCGAGGTGCTGCACCACCGCGATGACGACCCGCGCTTCAACCACCCGAA
+TGTGCACGCGATTCACCGCGACATCCGCACGGTGATCGACGAGTACCCCGGAGCGGTAACCGTCGGCGAG
+GTGTGGGTACACGACAACGCCCGCTGGGCGGAGTATCTGCGGCCCGACGAACTGCATCTCGGCTTCAATT
+TCCGGCTGGCGCGAACCGAGTTCGACGCCGCCGAGATCCGCGACGCGGTGGCGAACTCCCTGGCCGCCGC
+GGCGCTGCAGAACGCGACCCCAACCTGGACGCTGGCCAATCACGATGTGGGACGGGAGGTTAGCCGCTAC
+GGCGGCGGCGAGATCGGGCTGCGCCGGGCCAAGGCGATGGCGGTGGTGATGCTCGCCCTGCCGGGCGTGG
+TCTTCCTCTACAACGGCCAGGAACTGGGTTTGCCCGACGTGGACCTGCCCGACGAGGTGCTGCAGGATCC
+GACGTGGGAACGCTCGGGACGCACCGAACGCGGTCGCGATGGCTGCCGGGTGCCGATTCCCTGGTCGGGC
+AACATTCCCCCGTTCGGGTTCTCGACGTGTCCAGACACCTGGTTGCCGATGCCGCCGGAATGGGCGGCGC
+TGACCGCCGAAAAACAACGCGCTGATGCCGGCTCGACCTTGTCGTTTTTTCGACTTGCACTCAGATTACG
+TAGGGAACGAAATGAATTCGACGGCGACGTCGACTGGCTGGCCGCGCCCGACGATGCGCTGATATTCCGG
+CGTCACGGCGGGGGTTTGGTGTGCGCGCTCAACGCCGCTGAGCGTCCGCTGGCGCTGCCGGCAGGTGAAC
+CCATCCTGGCCAGCGCACCGTTGACCGACGCCACGTTGCCACCCAATGCCGCGGCCTGGCTGGTGTAGCG
+GCATTCCGAGCTATGCTTGCCCGACATATAAGCGCATACGCATCCTAGGCGGGCACCGTCTAGGTATGAT
+GATGCGGATCGCCGTGCGGCTACCCGGGGAAGTCATCACCTTCGTCGATAGCGAGGTCAGCCAAATCCGC
+ATACCCAGCCGGCGCGCCGCAGTGGTGTTGCGTGCCTCGAACGCGAGCGACGCCGCGATTCTTACCGCCA
+CCGAACCCAATCACCACCTCGACGCACTCGCCGGACAGGCCGCAAAGCTAGCACCAACATCGATTGATGC
+GGCTCATCCAGCTCGCCCAGCTAGACGAGACCCGTGCCTTTACCCGCGAACTGGCCAGGCCTTACCTCGC
+ACCGGGTAACCGTGGCACCCACCTCGAGCAGCGTAGCCAGCGAACTGCTCATGCCCTGGCCGAGCGCTGC
+CGCTAGCGGTGTGGTCGGCTGGCGCACCACCGCGACCGCCAGTCAGCGATACCATCGGCCGATGTCGGAT
+ACTCCGTTCGCCGAGCCCTATCCCGAGCAGCGGCCCCCCTGGGGTGTCCCGCCACCAGGTTGGGACGGAT
+CGTCGCGGCCAGCGCCCTCGACGACTCCTCGATCGCCCGGGCGGTGGTCTCTAGTGGCGGCCCTAGCCCT
+TGCGGTCGTCTCATTAGGCGTGGGCATCGTCGGATGGTTTCATCGGCAACCGCACGACAAGCCATCACCG
+GCCCCATCCGCGCCGACGTTCACCAGCCAACAGATTTCCGACGCGAAAGAAAACGTCTGCGCCGCACACC
+GGATCGTGCGCCAGGCGGCCGTGCTGAATACCAATCAGGCCAACCCGGTACCCGGAGACCCGACCGGCGA
+TTTGGCGGTGGCAGCCAACGCCCGCCTGGCGCTGTATAGCGGCGGCGACTACCTGCTGAGGCGTCTCACC
+GCCGAGCCAGCGACTCCTGCCGAGTTGCGCGATGCCGTCCGCTCGCTCGCCAACGCTCTACAAGAGCTTG
+CAGTGAACTATCTCGCTGGAGCTCCCGATTCCGTGGTAACTCCCCTGCGGCTGGCGCTGGAAAGGGACAC
+CAGAGCCGTGGATCCGCTATGCGTGTGACGGCGATCCGGAAATGAACCATCCTCGCCCATCAGCGCAGCA
+CCAGCGCCGCGTGGCCGCGATGCCGATAAACCGAGCCGAAGCGGGCGTCCAGACGCAACCACGCCGGCGA
+TATCCGGACCCGGATCAGCTCGTCGGCGCTGATCGTTTCTGCGGACTGGGGAAGGAAACCCATTGCGGTC
+AAAGCGAACACACAGCGCATGGGTAGCCCAACGACGACATCGGCCGAGCTGACCTGGATGACCTCCTGAT
+CGAGCAGCGATACCGGCGGACCAGCCGAACTCCCGTGCTCCTTGGCCAGCCGCGCGCCACGGTGCGCCAG
+GTCCAACATCACCCGGGCCGGTACGTCGTCGAGATAGGTGAAGCCGGACTCCGGCGGCAACCCACCCCGC
+CACGCGGAGTCCATCGAGTAACCGGGATCGACATAGCCCGAGGCATCCGTTGTGGCCAGACCGTGCGCGA
+GTGACCGTGCGGCCACCGACAGATCGTCGGGTCGCACCTTGCCGGCCACCACCCGACTGGCCAGCACGTC
+GAAGCCCGTTGCTACCCAAGCCGATAGCAATCCGGTAGACCGCGCGCGAATACGGATAACGGCGACATCG
+TCGAGCCGAAGCGCGTGATCCACGAACGTGGCCAGATCCGCGCGGTGAGCCGGGTCAGGGAGCCACAACC
+CACGCTCAACCACCCCGCCTATCCCCGAAACCACCGTTGCAGGTACTCGCGATGGTGTGGCGATAGTCGA
+ACCAACCGCTGTTCCTCGATATGGAACGCGGCCAGCTGCGACTCGGCGATGACCGCAGGCCTCGAGTCTG
+GCTCCGCGTTGACCGACCGCACCTCGTACCCGAGCGTGAAGTCGACCGCCCGCAGCCGCTTGGTCCAGAT
+CGTCACCTGTAGCGGCGAGTCGGACAACCGCAGTTGACCCTTGTAGGTCACCCGGACATCGGCGATCAGC
+AGCCCGGTGGACGTGATGTCGGCTCCGAAAGCATCCTTAAGAAACGGGACCCGTGCCTCTTCGAGAATCG
+TGACCATGGTGGCGTGGTTGACGTGCTGATACATGTCGATGTCAGACCAGCGCACCCCCACCGGCGTGAC
+GAACCCGACGCTCACCCCGAGATTCCTCGCCCGCTTGTCCGTGTCATGCGGCGGATCTGCCGCGCGGCGA
+CCGACAACGTCGCCAGATCCTTCTGGCCGCTGGCACGGATGTCGTCGAGTGTCCGACGTGCCCGCGCCAC
+CCGGGAGGCGCTGAGGTGTTCCCACTCGGCGATCTTTTGCTCGCTACTCTCGCCGGGTTCCCCCACGGCC
+AGCACGTCGAAACACAACGACCGTAGCGCACCGTAAATATCGTCGCGAATCGCCAAGCGCGCCAACGAAT
+GCCAGCGGTCGTGTCGGGGCAGCTGGGATACCGCGGTCAGCAGGCCATCGGTGCCCAGCCGGTCCATCAG
+GGCGAAATAGGTGTCAGCGACCTCGGCGGCGTCGATGTCGGCGATGTCGGCGATGTCGATGATGTCGAGC
+AGGCTGTACCGGTACAGGCCGGTCGAGACACGGTAGGCCAAGTCTTCAGGCACACCCTGCGATGCGAATT
+CCGCAGCTGTCTTTTCGACGATGGCCTTGTCATCACCACGCAACCACTCCGACATGCGCGGTGTCAGTGC
+CTTGACCATGGCCGCGAATCGGTTGATCTCGGCGCCGACGGCCAAGGGCTGCGGACGGTAGTTGAGCAGC
+CAGCGTCCGGCACGGTCGATCAGCCGACGGGTGTCCAGCGTCAACCTGTCTGACAGCGCGATTGGCAGGT
+TCGCCGCACGGATCCGGCGCCAAATGTGACCGACACCGAAGATGGCATCGGTGGCGACATAGGTGCGCAC
+GGCATCGATCGGCGTGACACCAACGTCTTCGGCGATCCGGAACGCATAGGTGATGCCGGCGGTATCCACC
+AGATCGTTGATCAGCATGGTGGTGACGATCTCGCGGCGCAGCTGGTGGGAACGGATCTCCGGGGTGAACC
+GTTCGCGCAGCGCCGTCGGGAAATAACGAGGCAACCTGGAAGCGAAGACATCCTGATCCGGTAGTTCGGT
+GGCTAGCACCTCCTCTTTGAGCCCCAGCTTGACGTGCGCCATCAGCGTGGCGAGTTCGGGCGAGGTGAGC
+CCGATGCCGGCCTCGGAGCGCCGGGCAATCTCCTTCTCCGACGGCAGCGCTTCCAATTCGCGGTTGACCC
+CGCGCTCAGCCACCAAATACTTGATCTGCATTGCGTGCACCGGCAGCAGGCTGGCCGCGTTGGCGCGACT
+GGTGCCCATCAAGTCGTTCTGATCTTCGTTGTCGGCGAGCACCAGTTGCGCTACCTCGTCGGTCATTGAC
+TCGAGCAGCTGTGTGCGTTCGTCGGCTTTGACCGTGCCGGCGCTCACCAGCGAGTCGATCAGGATCTTGA
+TGTTGACCTCGTGGTCCGAGCAGTCCACGCCGGCGGAGTTGTCCAGCGCGTCGGTGTTGATCCGGCCGCC
+GGACAGATCGAATTCGACACGGCCCAACGCCGTCACTCCGAGATTGCCACCTTCGCCAATGACCTTGGCG
+CGCACTTGATTCGCGTTGACTCGCACCGGATCGTTGGCGCGATCGCCGACATCAGCATCCGACTCTGACT
+CGGCCTTGATGTAAGTGCCGATGCCGCCGTTGAACAGCAGGTCCACCGGCGCCCGCAGAATCGCCCGAAT
+AAGGTTGGGCGGGGCCATCTCGGCGGCCCCCCCGTCAACTGAGCCGTCGATGCCGAGGACGGCGCGGACC
+TGCGCGCTGAGCGGGATGGCTTTCTGTTCGCGGCTGTACACCCCGCCGCCCTCGCTGATCAGAGACCTGT
+CATAGTCGCCCCAGCTGGACCGGGGCAACTCGAACATCCGCCGGCGTTCGGCCCACGACACCGCGGCATC
+GGGGTTGGGGTCGAGGAAGATGTGGCGGTGGTCGAAGGCGGCGATCAGCCGGATGTGCTTGCTCAGCAAC
+ATGCCGTTGCCGAATACGTCGCCGCTCATGTCGCCGATTCCCACGACGGTGAAATCCTGGGTCTGGGTGT
+CGATCCCGATCTCTCGGAAATGCCGTTTTACGGCCTCCCAGGCCCCCCGGGCGGTGATGCCCATGGCCTT
+GTGGTCGTAGCCCACCGATCCGCCCGAGGCGAACGCGTCGCCCAGCCAGAACCCATAGGACTTGGCGACA
+TCGTTGGCGATATCGGAAAAGGTGGCAGTACCTTTGTCGGCGGCCACTACCAAGTAGGCGTCGTCGCCGT
+CACGTCGCACCACCTCGGGCGGGGGGTTGACGCTTGCGGTCGCATGATCGACGTTGTCGGTGACATCGAG
+CAACCCGGAGATGAACAGCTGATAGCAGGCGACCCCTTCGGCGCGGGTGGCGTCGCGGTCGGCGGCGGGG
+TCGCCGGTGGGCAGCGGGGGACGCTTGACCACGAACCCGCCCTTGGCCCCGACCGGCACGATGACGGCGT
+TCTTCACCGCTTGCGCCTTGACCAATCCGAGAATCTCGGTTCGGAAATCGTCACGGCGGTCCGACCAGCG
+CAACCCGCCACGCGCAACTGGGCCGAACCTCAGATGCACGCCTTCGACGCGGGGCGAATACACAAAAATC
+TCGTACCGGGGACGCGGCAGCGGAAGTTCGTCGATCAACTGGGCATTGAGTTTCAGCGCCAATACATCAC
+GGCAGCGGGCCGAACCCTGGCGTGTCACAAAGTAATTGGTGCGCAACGTGGCCTGAACCAACGACGCGAA
+GGCGCGCAGGATCCGGTCGGTGTCCAGGCTCACCAGCGCGTCGATGTCCGCGGCGACAGCGGCAGCGGCC
+GCTTGGGCATCGCGATTGCTCGCCGACCCCGACGGCACCGGAACGAAAAGCGCTTCGAACAGATCGACCA
+AAGACCGAACGGTAGCAGGGTGCTCGTTGAGCACCGATTCAATGTAGGACTGGCTGTACGGGAAGCCCGC
+CTGGCGCAGGTACTTCGCGTAGGCACGGAGCAGCACGACCTGCTGCCAAGTCAGCCCGGCACGCATCACC
+AGCTCGTTGAATCGGTCGATTTCGACCCGGCCGTGCCAGATCGCGGTCACCGCCTCGGCGAATCGGTGCG
+CGGTCGCGGCCCGCTCGGCAACCGTCGGGGCCAACGGGATCGTGGGATGCGGCGAGATCTTGAACTGATA
+GATCCAGACCGGCAGACCGTCCGGCCGGGTGACGGAGAACGGTCGCTCTTCGAGCACCACGACTCCCATG
+CTTTGCAGCATCGGCAGCAGCTGGCTCAGCGAAGCGGTGCGCCCACCGAGGAACCAGGTCAACTGGGCGA
+CACCCTGCTCGTCGCGTTCGGAAAACACCAGCTTGACCGAATCGTCGGTCAGCTCCGTGATGACCGCAAT
+GTCGCCAATGGCATCGGCCGGGGTGACGGCCTGTTTGTAGGCCTCGGAGAAGGCGGCAGCGTAATGCATA
+GCGTCGGCCTGTCCGACGGAGCCAGCCGCCGCCGCGCCGATCAAACGGTCGGCCCAGGTTCGCGCGGCTT
+CGGTCAGCAGACCCTGGATCCGGATCCGGTTGGCTTCGGAAACGTCCACCGGCGGGGCGGCCGCCCCTTC
+TCCTGCCACACCCACTTCGGGTAGCCGCACCATGAAATGCATGAGTGCCCAAGGTGATTCACTGACCCGA
+GCGGTGAACTCCAGTCGTGTTCCCCCGAACTCGCGGACAAGGATGTCCTCGAATTGCATGCGCACGGCGG
+TGGTGTAGCGATCTCGGGGCATGTAGACCAGGCACGACACGAAGTACTGCAACCGATCCGCGCGCAGGAA
+CAACAACGCCTGCCGTTGCGATCCCAAGTCCACCACGGCCCTGGCCATGGTCAGCAGGCGCTGCGCGCTC
+AGGGTGAACAGCTCCGGTCGCGGGACGGTCTGGATGACGTCGAGCAGCAATTGGCCTGGGTGGCTGGGAT
+CGCTTTCGGCCATCGCCAGCGCCTCGCGGACCCGGCGCGAGATCGTCGGGATCTCCAGCACGTCCGCATT
+CATGGCCGCGACGCTGAAGAGCCCGACGAAGCGGTGCTCGACCACGCTGCCGTCGACGTATTCGCGGACC
+GCGATGGCATAGGGATAGGCGCCGTAACGCAGGTAGCTGCCGACCCGCGCTTGGGCCAACACCAGCAGTT
+TGTCGTCGTCGGTCAGCCGGGGACGCGAACCGGTGCGGCCCCGCAGGACGCCCATACCGCTTGACCCCTC
+GCCGTAGACCATCCCGTCAGCCACCCGGCACCGTTGGTAGCCCAGCAGCAGGAAGTTCCCGTCACCCAGC
+CAACGCAACAGTTCCCCGACGTCTTGTCGGTCGGGCGCGGAAAATCGGCCGCCGGCATTGGATTCGACTT
+CTCCCGCCAGCTCGCTCAGGGTGGCGATCAGCGCTGTGGCGTCGGTGGCCACCCGCTGGACGTCGGCCAG
+CACCTTGGGCAGCAACCGCTCCACCTCGGCGAGGCCTTTGTGATCAACGGCGGGCGAGAGCGCTACGTGC
+ATCCAGGCCTCACCCAGGTGCGGCGACGTGCCCTCGGCCTTCGGTTCGATGCGCAGCAGCTCTCCCGTGG
+GGCTGCGGTGCACGTCGAACACCGGGGTCAGAATCGCCGCGTAGGCGATTCCAAGCCGGTGCAGCAGCAC
+CGTAACGGAATCCATCAGCATGCCGCCGTGCTCGGCGACCACCTGCAGCGCCGGACCGAACCCCGCGGGA
+TCGTCCGCCCGATAGACGGCGACACAGCTTTCACCGGCCGCGCGGTGCCGGCCAAGCCGATAATGTGCGC
+CCAGCATGGCGGGCGTCAGCAGGGAGGCTGGAAGCCAACTGGCCTCGGCGGCCTTGGTGGCTTCCGACGA
+GTCGTCGCGCGGTCCTCGATAGCTGTCGATGTAGGCCTTCGAGATCCAGTCAGGAATGTCCGCACTCGCG
+GTGAACGTGGTCCACGCCTCAACATCCTGCTTAGCCCCGGGATCGATCGTCATGCCGATTGCTCCCAACT
+CACGACGGGTACCGCTCGATTCAATTTTCCCGCTCCTGGGTGCGGCGTTCCGGACGCATCGTCACGGGGC
+GTGGGCGAAGCTAACATTAGCCGCGCGTCAGCTTGCGGTGGGTGACCCTATGCGGTCGAGCGGCGTCGAC
+ACCGAGCCGTTCCACCTTGTTCTCCTCGTAGGCGCCGAAGTTGCCCTCGAACCAGAACCACTTCGCCTCG
+TTGTCGTCGTCACCCTCCCACGCCAGGATGTGCGTGCACGTGCGGTCAAGAAACCAGCGATCGTGCGAAA
+TCACCACGGCGCAGCCGGGGAAGTTCAGCAGAGCATTCTCCAGCGAACCCAGAGTCTCGACATCCAGGTC
+GTTCGTCGGTTCGTCGAGCAGAATCAGGTTGCCGCCCTGTTTGAGCGTCAACGCAAGGTTGAGCCTGTTG
+CGCTCCCCGCCGGATAGCACACCGGCCGGTTTTTGCTGGTCCGGTCCCTTAAACCCGAATGCCGACACGT
+AGGCCCGTGACGGCACTTCGGTTTGACCGACCTGGATATAGTCCAGACCGTCCGAGACAACCTCCCAGAC
+GGTCTTCCGCGGATCGATGCCAGCACGGGCCTGGTCCACGTAACTCAGCTTGACGGTCTCGCCGACCTTG
+ACGCTGCCGCTGTCCGGCGTCTCGAGCCCGACGATGGTTTTGAACAGTGTGGTCTTGCCTACCCCGTTGG
+GCCCAATGACGCCGACGATGCCATTGCGGGGCAAGCTGAACGACAGGTCCTTGATCAGGGCGCGCCCGTC
+GTAGCCCTTATCGAGGTGGTCGACCTCAACCACCACGTTGCCTAGGCGGGGCCCGACCGGGATCTGAATC
+TCCTCGAAGTCGAGCTTGCGGGTCTTCTCCGCCTCGGCTGCCATCTCCTCGTAGCGCTGCAGGCGCGCCT
+TGCTTTTGGCCTGGCGCGCCTTGGCCCCGGACCGGACCCAAGCCAACTCCTCGGTCAACCGCTTTTGCAG
+CTTCGCGTCCTTGCGGCCTTGCACCGCGAGCCGCTCGGCTTTTTTCTCCAGATAGGTCGAGTAGTTGCCC
+TCATAGGGGTAGGCGCGGCCACGATCGAGCTCCAGGATCCATTCCGCGACGTTGTCCAGGAAGTAACGGT
+CGTGGGTGACCGCCAGGATCGCACCGGGGTAGCTGGCCAGATGCTGTTCGAGCCACTGCACACTTTCCGC
+GTCTAGGTGGTTGGTCGGCTCGTCGAGCAACAACAGGTCGGGTTTGGACAACAGCAGTTTGCACAGCGCC
+ACCCGGCGACGCTCGCCACCGGATAGGTTGGTTACCGGCTCGTCGGCCGGCGGACAGCGCAGCGCATCCA
+TGGCCTGCTCGAGCTGCGCGTCGAGGTCCCACGCGTCGGCGTGGTCCAGTTCCTCTTGCAGCCGACCCAT
+CTCTTCCATCAGCTCGTCGGTGTAGTCGGTGGCCATCAATTCGGCGACCTCGTTGAAGCGGTCGAGCTTG
+ATCTTGATGTCCCCCATGCCCTCTTCCACATTGCCGCGAACGGTCTTGTCCTCGTTCAGCGGCGGTTCCT
+GTTGCAGGATGCCCACGGTGGCGCCGGTGGCCAGGAAGGCATCGCCGTTGTTCGGCTTGTCCAAACCGGC
+CATGATCCGCAAGACGCTCGACTTACCGGCCCCGTTGGGGCCGACGACACCGATCTTGGCGCCCGGATAG
+AAACTCAACGTCACGTCGTCGAGGATCACCTTATCGCCGTGCGCCTTGCGGACCTTCTTCATCGTGTAGA
+TGAACTCAGCCATGCCGCGGTGTTGCCTTTCTGGTCCTTCGGGTTACCTCGCGAACCATCCTAGGCACCG
+CCGGGGCAGCATCGAGGCGACCCCTAAGCCGATATGGGCAGGGGGTTGTGGCCAGTGATGGCGTCGTCGA
+CCACGACATCGGAAACCGAGTCGGCTGCCGACGCTGGGGCGTCGGCGGCACCGGCCGCCCCGGTCCCCGT
+GGCGGCCGGGAGATCACCGGCGCTTGGACCGGTGTAGGCCGGCTTTTCGATGCGCACGATCACGCGCGAC
+AAATCCGGCCCTACCGACGTCGCCCGCATCTCCAGCGACGAGCGACGAATGCCGTCCCGGTCCTCATATT
+CACTGGTGTACACGTGTCCCACCACAATCACCGGTGCGCCCTTGCCCAATGCTGCGCCCACCCCGGTGAC
+CAGCCTTCCCCAGCAATTGACGGTGATAAACAGCGAGTTGCCGGGCTCCCAACCGCCGTCGCTGGTGCGC
+CGGCGCGAATTGCTGGCCACCCGGAACTTGACGACCTCTTGATCACCGACTTTGCGGCGCTGCAAATCGT
+TGACGATGTGACCGACCACGGTCAGTGGCGTTTCGAACATTTGCTCATTCCTTTCCTAGTTGCGTTGGCA
+CAGTTGCGTTGGCACCGGGTGATTCCGCGAACTGCCCACGCATATGCCGAGTGCTATTCACCTCGGCCAC
+ACCGACATTTGCCGGGATGAGACCGTCGCCGCGCGCAATCCTGTGAATGAAGCGGTAACTGTGGATTAAC
+CAATTAATTGGCCGCTTGGCCTGCAAACCTGGGAACCAGACCGAAACCTCGCTCAGTATTCACAAAACGG
+TCCAATGGGGCAGGGTGACGGCGATAACATCCCAATGACCGTGATTCTTCGAACCATGGCGACGTACGGG
+CCACGACAACCTGCCATCGAAGGGGCGACGACAATGAAGACAAGGAACCCACGGACGCTGCTAACCTGGC
+TGCTCGGCGCGATAGTTACTGGGTTGTACGTGGTTTTCGCTACGGGCTGCCAATTGCAAGCGCCCGCGCC
+TCCCACTCCGGAAATAGGTTGGTCGGGCCCGCAGGCTCCACTGCCGGCGCCGGATGCGGCGCCAACGCAC
+CTCGGCGTCTAGCCGATCGCGGCGGACAAGTCGCCCGGCACCCAGGGCGAGCAGGGCTTCACGACAGCTA
+GTGAGCTATAGACGACTTCGTGTTAGCGCCGCTGGCGGGGACGTTGGCGCTGATGGGGATCGAGTTCCTC
+AGCTGCCCGTGGACAAGAACCGCACCCCGCAGCGAGTCGGCATGGACACTCGCGACGCCGCCACGAGTCT
+GGCGGTGTACGCCCATTGCGCGCGTCACGCGCCCACTGACCCAGTTCACTGGGGTGCCGTTCGCCGTGCT
+CGCGGCGGCGCTCACGGCGCTGCATCTGACGGCATGGCGCACCGCATTCGGTTTTTCTGAGCGCTGGGAA
+AATGGCCAGCCGTCTGGCTCATGGCGTCTACGCAACGCCACGCCCCCAACACGTTCTTAGATTCGGTCGC
+GTCCTTGACGCGCTTTGAACTCGCGGGCGACGAACTGGTTGCGCGCGATCTGCTCGACATAGTCGAAATC
+CCGCAGAATGTTTCGTAACTCCCGCCGGAAGGCGACCCTACGTTCGGCGAGGTCGGCCGCCGGCGCTATC
+AGCTCCTGATCGACGGCGACCTGGCGTGCAGTGGCGAACAGCAGCGTCGATACCGGTTCGCTGCTGCGGA
+CCCGGCCCTGTGCCACAAACTGACGGCCGAGGCCGAGCGCCAGCTCCGTCAACTCCTCAGGACCGATGTC
+AGGCGGAGCATCGCGCAACACGTCGGCAACGATCTCATAGGCTTCGAAGAAGACCCGCAACATCGCGTCC
+GACATCAGCGGCCGTTTGGCATACAGCATCGCGTCGATCTCATTGCCCCCGACGCCAAGATGATCCTCCC
+AGTCTTGGTGCCAGGCCATCTCTTGGGCGATGTTGGCCCGAAACGCCGTGGAATCCGCGAAATAGAAGTC
+GAACTTCAGCAGATCCCGCAACCGCATCGCCTGGGCCCAGAACGCGGCGACGCGGTCACCTTCGGCGTGC
+TTGGCATGGGCCAGCGCGAGCTCGACGATCGAGGTCTCCAAAAACGCATGGATCACCGAGCTCCGGTAGA
+ACGCCGCGGCGTGCTCGTCGTCAGGCGCTATGTACCATACCGGCTCCCGGCCACTGTCGACCCGAGTGAC
+CGGGTGGCCGTTGGACAACGCGTCCGCCGCCGCACGGACGCCTTCGCGCGAGCGCAGTCGCAATGCGCTT
+GTCGAAACCGGCGATTGTTTGCGTTCCAGATAGTCCAGTGAGTCCTGCAACGTGTGGTGCAGCTGGTCGA
+GCGTCAACGCGGTGCCGCGGGTGGTGAGCAGCAGTGCGGACACCAAACCCGTCGCGGTCACCGGCGTCGC
+CTGCAAAATCCTCCAGGCCACCTCGAACGACATCTTCTGCAACGCAAGCCGTTTCGCGGCCGGATCCTGG
+GTCAGCTCGCCGTGCGGTGCGCCGAGGTACTGGCGCATCGAGACCGCTTCGGGGAAGCGAACGTAGATCT
+TGCCGAAGTTGCGTTCCCCCTGCGCCTTGATGAAGTTGTAGAGCCAGCGCAAACCTTCGGGCGTCTTCTC
+CGCGCCACGCGCGTAGGCGGCGTATTCGGTGATCTCGTGCAGCTGATCGAAGCAAATCGAAACCCCCTGC
+AGCAGGATGTCGTCACTGCGGCCGTCCAGGTAAGCATCGGCCACGTAGCTCATCAAACCGAGCTTGGGCG
+GCAACATCTTTCCGGTGCGCGACCGGGTGCCTTCGATGGACCAGCTCAGGTTGAACCGCTTCTCGACCAC
+GTAGCCCACGTACTCCTTGAGCACGTACTTATACAGTGGGTCGTTGCCGATATTGCGCCGGATGAAGATC
+ATCCCCGAGCGCCGCATGAGGGGTCCCATGAGACCGAACGACAGGTTGATGCCGCCGAACATGTGCACCG
+GCGGTAACCGGTTGTCCTGCATGGCCACCGGTACCACCACGCCGTCGATGTAGGACCGGTGCGAGAACAG
+CAGGACCGCCGGATGAGCCTCCAGTGCGGCGCGCATCGCCGCGACCTGATACTCGTCGTAGTCGAATTCC
+GGATCGAAGCCGCGGCTAGCCAGCCTGCCGAGGACGGAAACCAGGTCTACCGACACCTGGCTCCATCCGG
+TGGAGAGTTCGTCGAGCATCTTCCCGGCATCTTCGACCGTGGCGCCCGGAATCCGGTCCAGGCCGGCACG
+AAATCGTGCGGACGCCAACATCTCCGGCTTCACCAGCCGGGGAGATTTGTATTGCGGTCCAAGGATCCGA
+TATTCGGCGCGCGCCAGCGCCAACAGCGCTCGGCGGCTGACGAACTGGGCGAAATCGCGCTTGTGCTCTG
+CCACCGTGGTATCGCGCCACTGCTGGCGCAGTTCGGACACCTTGGCCGACTCGCCGGCCACCACCCGCGC
+GCGCCTGGGATCGGTACGCAGGATGCGACGCTGCTGACGCTGGCTGGGATGGTAGGGATCCCGACCCGGG
+AGCAGTGCGGCCACCTTGCCCGCCCGGCTGCGATCGGCGGGAGGCAGCCAGATCACCCGAACCGGCACGA
+TAGAACGGTCCTCGCCAGATTGCGGGCTGGATGCGAAGCCGGGCTCGAGCTGCTCGACCAGTGCCGTCAG
+CGCCGCCGGCGGAGCGTTGCGCGGTGGCAGCTTCAATATGTCGAACTTCGAGTCCGGATGGCGTGCACGC
+TGCTGGCCCAGCCAGCCCATGATCAGCTCCATCTCGACCGGCGTCGCCGTGGAAGCCAGCACCAGTGTGT
+CCTCGGCAGTAAGCACCGCGCTGGCATCGGCCGCCGGTTTGGTCACGACCGTCCTTTGGCGCTAGAGCTT
+GGCGATGCGGAGGCCTCACCATCCTTGCCAGCGATCTTAGATTCGCTGGGTTTGGCCTTCGGCGATGCCT
+TCTTTGTAGCCGCCTTCGTCGCGGCCGCGCCTTTATTGGCGGCGCTTTTGGCGGGAGCCTTCTTAGCCGG
+CACCCTTTTCGCGGTGGCCTTGGCGACCTGAGCCCTGGCTTTTCTGGCGGCCTTCTGCTCGGCGTACAGA
+TCGACCGCGGGCAACCCATCGACCGGCCAGTCCGCCAGCGTGTCCAGATACAGCTGGCGCACCTCGGCGA
+TACGATCCGGCAGGGCGTCCAGGGTCCAGTCATCGACCGGAATCGGCGGAAACACCGCGACGTCGACCGT
+GCCCGGATTGATCGTGGTGGAGTTGCGCGAGGCGACGATCTCCGCATTGCGGATCACGATCGGCACGATC
+GGGATCTTCGCGGCCATGGCGATACGGAAGGGCCCCTTCTTGAATGACCCGACTTCGGTGGTATCCAACC
+GGGTACCTTCGGGAGCGATCACGATCGATAGTCCATTGCGGGCGCGCTCCTCAACCGTGTGCAGTGTCTC
+CACCGCGGCGACCGGATCATCACGGTCGATGAACACACCGTCCAGCAACTTCCCCAGCGTGCCCATGATC
+GGGTCGCTCGCCAGTTCCTTCTTGCCCACCCCAACCCAGTTGTCGCGCACCAGCGCACCGGCAATGACCG
+GGTCAACCTGGTTGCGGTGGTTGAAGATAAAGACGGCGGGCCGCTGGGCGGTCAGATTCTCTTTTCCGAT
+CACATTCAGGTGCACGCCGCTGGTCGCCAGCAGCAGCTGAGAGAAGGTGGAGGTAAAGAAATTCACGCCG
+CGGCGCCGGCTACCGGTCAGCACACCGATCCCTACCGCGCCGGCCGCGACCGGGACGATGGTGCTCAGAC
+CGGCAAGTGTCCGCAACTGCCGCCGGATGCCCACACCGCCGCGACTGTTGAACTTCAAGATCGGCCAGCC
+CCGTCGCTTGGCGACCGCGGCCATCTTTCCTTCCGGATTGGTCGGTCGCGGATTGCCCACCAGATACATC
+AGGGCGACGTCCTCGTCACCGTCGGCATAGAAGTAACTGTCTTTGAGATCGATGTCGTGCTCGGCCGCAA
+AGCGTTGCACCGCAGTGGCTTTGCCCGGACCCCACAAAATTGGCTTCAGCACACCCCCGGTGAGTATCCC
+GTCCTCGTTGGTCTCGAACTTGTTGGTGAGCATGTTGTTGATCCCCAGAAAACGTGCGACTGGGCCAACT
+TGGATGGTCAGCGCCGACGAGCTGAGGACCACGGTGTGGCCGCGGGCCACGTGAGCCCGGACCAGTTCCC
+GCATTTCCGGGTAGATCCGGGACTCGATCCGCTGGGCGAATAGCCGCTCGCCGATTTCTTCCAGGTCGGT
+CAAGAGCCGCCCGGCCAGCGCCGCGGCGGCCTTTCCGATAAGGTCTTCGAACTCGATTCGCCCGAGCGTG
+TGATTCAGGCCGGCCTGAACCATACCGAGCAGCTCGCCCACGCCCATATCGCGGCGCCGCAGCCTCTCCT
+GGGTGAGGATGACGGCCGTGAAGCCGGCGACCAGCGTGCCGTCCAGGTCGAAAAACGCACCGACCTTCGG
+GCCGGCAGGACTGGCCAGAATCTCGGCTACCGAACCGGGTAGGCGCAAATCCGGCGCCGACTTCCGCGTC
+GCCCGCTCTTCCCCCTGCTCGTCAGCGGCGCTCATGAGCCCGACACCGATCGAGGCACTGAACCGGCTCC
+TTGAGTATCGAACGACGCCGGCAGCACACGCGGTGCCGGATCACCGGCCAGCGCAAGGATTTCGTCGAAA
+CCCGCCTGCAGGCATTGAGCGAACAACTCGTCGTTTCGCACCGACGCCCTGTCGTAGCGCACCGTGACGG
+TGCACCACCCGCCCCGGGAAATTAGCACTACCATCATCGCCACACCGGGCAACGGTCCAATACCGTACTG
+CCGCAGTATCTTCGCGCCGGCAAGGTAGGTATCCCCTGGGTAGACCGGAACATTGCTGGCTTGCACATCG
+GAACCGATCACCGAACCGGTGATCCCCTCCAGCACGGCCGTCGGCAAGACACTCAGCACCGGTGCAATGG
+AACCGATGATGTTCATCGCGGGCTCGTCGCGACGCTGGGTCATCTGCGCCCGGATCTTCTTCATCCGGGC
+CACCGGATCGATAGTGCCCACCGGCGCCGCCAGGTTGACACCGGTGAACTGGTTGCCGCCGGCCGCATCG
+CCCTCGGCCCGCAGGTTGACCGGCACCGCCATCGGCAGCGTGCTGATCGGCACGCCCAGGGCCTCGTGGT
+AGCGGCGCAGCGCGCCACACAGACCCGCAAGGTAGGCGTCGTTGATCGACCCGCCGCCGGCCTTTGCGGC
+CTTGTGCAGGTCGGCGAGCCGGATGTCGATGGCCTCGGTACGGGTGGTCAGGCTGCGCCGGCGCAGTAGG
+GGTGAGGGTTCAGCAGCTCGGTTCAGCACCCGGATGCCCGACCTGGCGTAGCCCAAGATCCCCGACACGG
+TGGACACCGGTTCCAGAACAGCCCGCCCGGCCATCGATACCGCCCCGGACAGCGCGTCCAGGACACCGCC
+GACGACAGCAATTGGCAGGTGGTTGATGCCCCGGCGCATCAGGTCATTGGGGGACAGATCCTCCGGAATG
+GGTTGCGGCGGCGTCGACCTAGGTGGTGGATCGCGCTCGAGGTCATAGATCTGCGCGAACATCTCCACGC
+CGCCGACACCGTCGGTGACCGCATGGCTGACGTGCAGCAGCATCGCCGCTCTGCCGTCAGCCATACCCTC
+CACCAGGGTGGCCGTCCACAGCGGGCGCGATATGTCCAGCGGCGACTGCAGAATCACCTCGGCGAGATCG
+AGCACTTCGCGCAACGTGGCGGGTCCGGACACACGCACCCGACGCACATGGAAGTCCAGATTGAAGTCCG
+GATCCACCACCCAGCGCGGGGCCGCGGTCGGCAAGGTCGGCACCACCACCTTCTGCCGCAGCCGCAACAC
+CCGTCGCGAGGCGTTTTCGAATCGGGTCCGGAAGCGATCCCAGTCCGGCGTGCCGTCCAGCAGTTCCAGC
+GCCATGATCCCCGAACGAGTCCGCGGATTTGCCTCGCCCCGATGCATCAAATAGTCGACCGGCCCAAGCT
+CGTCGGACAACCTGGGGGACTCGCCGGACTCAGCCATGGCCACGACCCCGCGCGGGTTGGGCAACTCGAC
+GCACAAACTCTGTCACCGCCGATCAGACCTCCTGCTTCAAACCCGCCACCGCCACGCACCACAGTGCCAA
+CACAACGCTAGTCGCGATGACGCGGTGGTGAAAGCCGATGCGGGCCATGATCCACCCGCAGCACCGATGC
+CGCGGCCACGACCGACGAAACCTCGTGTTGGGCAGCCGAGTTGGAACGGCCAAGCTCAGCTGGCCGGAGG
+TGACGACAGCGCCAGCGAACCCTTGCGAGCACCCATCCGTCGCCCGTAGATCACACCCAAGAAGTCCGAG
+ACCGCTTCGGCGACCATCCGCGATCGGACCGTGGCGGCGAGGTCGAACGCGTGGTGGGCGTTGGGGAGCT
+CAGCGTAGGACACCGTCGCGGCACCCGCGTCGCGCAGCGCCGCGCTGAAGGCGCGAGATTGCGCGCTCGG
+CACCATCGGATCCTTCTCACCGTGCAACACGAAGAACGGCGGAGCCTCGCTGTGGACGTACGAAATCGGC
+GACGCCGCCTTGAACAGCCCCGGGTTGTCGACGTAGCGGCTACGCATCACGAAGTGCTCCAGGAACGGCA
+TCATCATTTCGTGCATATTCTCGGCGTTGGTGAGGTCGTAGACGCCGTAGTAGGGCGCCGCGGCTTGTAC
+CGCCGTGTCGGCGCTTTCGAAGCCCGGCTGCAGCGCCGGATCATTCGCCGAAAGCGCGGCCAACGCGGCC
+AGGTGCGCACCGGCGGACCCGCCGGTGATCGTGATGAAATCCGGATCGCCGCCATAGTCGGCGATGTTCT
+CGCGAACCCACGCAATCGCCCTCTTCACGTCCACAATGTGCGCCGGCCACGTGCACCGTGGGCTCTTGCT
+GTAGTTGATCGACACACAGATCCAGCCGAGTTCCACCATCCGGCTCATCAACGGGTAAGCCTGAGGGCGT
+TTGCCGTTGATGGTCCACGCCCCGCCCGGGACCTGGATGAGGACCGGAGCCCGGCGGCCGGGCGCTAAAT
+CGGGACGCCGCCAGATGTCGAGTAGATTCTCGCGGCCGCCGGGCCCGTACGGGATGTCGGAGGTCTGGGC
+CGCATAGCGGCGATGGGGTCCGGGAATGTGCGGTAGGTTCAGCAGCCCGCTGCGCCGGGCAGCCTCTGAC
+TGTTCGCCGGTCGGATGCCACACTAGGTCACGGAAATCCGGGCCGAAAGCGTCCACGAGCGCCGCGTGCA
+GGATTTGATCCGCCCGCTGCGCCGCCCAGCTGGTGCCAAACCGGCCGATCGAGCGTGGTGATATGCGGGA
+CAGCGCGTGGCCGGTGACGACGCGGGCCGGAAACTCCGCGGACAACCATCCTGCGACCCAACCGATGGCG
+CACGGTGATCCACGCAGCAGCAGGGCGCCGGCCCGGCAGGTGTCTCTGGCGTCGGCCGCCAGCTGCGCTC
+CCTGGCGCAATGCCTCGGCGCCGGCCCGCGAGCACCGCGAAGTCACGCTGGCGATGTGCATAACAAAGCC
+CACCCCTCGACGTCAGGCACACGCATCGTTGCGGTAAACGGCTGGTTGCCAGCCGGTTTTGTACGTGTGT
+CGAGGATCACACAATAACCAATAATTGACGTGGCGGTAGACCTTTCGCGCGTGTGGCGTCTGGAAAAATT
+CCTCGACGGCCACCGTTAGATAAACTGACCTGCGCATCGCCTCCGTAGCTCAGGTGGATAGAGCAAGGGC
+CTTCTAATCCCTAGGTCGCACGTTCGAGTCGTGCCGGGGGCACTGTGGAAATAGCAGGTCAGCATGGTGG
+CGTGGCTTGACACCGCCTCGTTATGGGTCGACGCCCAGAGTCGCCTTCAAACTCAAACCACGGAGGTGCC
+CGATGGCCCAATACGACCCGGTCTTGCTCAGCGTCGACAAGCACGTTGCGCTCATCACGGTCAACGACCC
+GGACCGACGGAACGCCGTCACCGACGAGATGTCGGCGCAGTTGCGTGCGGCGATCCAACGCGCCGAAGGC
+GACCCCGACGTACACGCCGTAGTCGTGACCGGGGCGGGCAAGGCCTTCTGCGCCGGGGCCGACCTGAGTG
+CGCTGGGCGCCGGGGTCGGCGATCCAGCCGAGCCGAGATTGTTACGGCTCTACGACGGTTTCATGGCCGT
+CAGTAGTTGTAATCTGCCCACCATCGCCGCGGTCAACGGCGCGGCTGTGGGCGCCGGACTCAATCTGGCG
+TTGGCCGCCGATGTGCGCATCGCCGGACCGGCCGCATTGTTCGACGCCCGCTTCCAAAAGCTGGGACTGC
+ATCCAGGTGGCGGCGCAACCTGGATGCTGCAGCGAGCGGTGGGTCCGCAGGTCGCCCGTGCGGCCTTATT
+GTTCGGCATGTGCTTCGACGCCGAATCCGCTGTGCGGCACGGCTTGGCGCTAATGGTTGCCGACGATCCC
+GTCACCGCGGCGCTGGAGCTGGCCGCCGGGCCCGCAGCCGCCCCGCGCGAGGTCGTGCTGGCGAGCAAAG
+CCACCATGCGCGCCACAGCCAGCCCCGGATCGCTGGACCTTGAGCAACACGAACTCGCCAAACGCTTAGA
+ACTTGGGCCGCAGGCGAAATCGGTCCAGTCGCCCGAGTTCGCCGCTCGCTTGGCTGCCGCTCAACACAGG
+TAGCGCCTACCAGCCTCGAGGGTTTCCATGGCGTGCCCCAGTCCGAAGCTGCTGCTGCTTGACTCCGCGC
+GCTGGGCCCGAGCGCGCGCTGTTGTACGGCCCAAACGGCGTGTCGGTGTACAGTCGCGCGCTCGCGGCTT
+CAGTCCGGCCCCCGACTCCGGCAGGCCCGACGGCGCCCAGCGCTAGCCGGGCGCGCCGGCCATGCCTTCG
+GTGCCGGAAACGCCAGGGGACCCGGGGCCGTTGGTGAGGCCCCCCGCGCCTGCCTCACCGCCGCTACCGC
+CCGCGCCACCGGCACCGCCTGCGCCGCCCGCGCCACCGATACCGTCAGCGCCGCTGACTCCTGCGGCACC
+GCTGAGGAACCCTCCGGACCCACCCGCACCGCCGGCAATACCGCCAGCGCCACCGTTACCGCCGTTTGCG
+CCGTTGCCCCCGTTGCCGCCTGTCCCGCCGGCCCCGCCGATGGAGTTCTCATCGCCAAAAGTACTGGCGT
+TGCCACCGGAGCCGCCGTTGCCGCCGTCACCGCCAGCCCCGCCGACTCCACCGGCCCCACCGACTCCGCC
+GCTGCCACCGTTGCCGCCGTTGCCGATCAACATGCCGCTGGCGCCACCCTTGCCACCCACGCCACCGGCT
+CCGCCCACCCCGCCGACACCAAGCGAGCTGCCGCCGGAGCCACCATCACCACCTACGCCACCGACCGCCC
+AGACACCAGCGACCGGGTCTTCGTGAAACGTCGCGGTGCCACCACCGCCGCCGTTACCGCCAACCCCACC
+GGCAACGCCGGCGCCGCCATCCCCGCCGGCCCCGGCGTTGCCGCCGTTGCCGCCGTTGCCGAACAACAAC
+CCGCCGGCGCCGCCGTTGCCGCCCGCGCCGCCGGTCCCGCCGGCGCCGCCGACGCCAAGGCCGCTGCCGC
+CCTTGCCGCCATCACCACCCTTGCCGCCGACCACATCGGGTTCTGCCTCGGGGTCTGGGCTGTCAAACCT
+CGCGATGCCAGCGTTGCCGCCGCTTCCCCCGGGCCCCCCGTGGCGCCGTCACCACCGATACCACCCGCGC
+CACCGGCGCCACCGTTGCCGCCATCACCGAATAGCAACCCGCCGGCGCCACCATTGCCGCCAGCTCCCCC
+TGCGCCACCGTCGGCGCCGGAGGCGGCACTGGCAGCCCCGTTACCACCGAAACCGCCGCTACCACCGGTA
+GAGGTGGCAGTGACGATGTGTACGAAAGCGCCGCCTCCGGCGCCGCCGCTACCACCCCCACTGCCGGCGG
+CTACACCGTCGGACCCGTTGCCACCATCACCGCCAAAGGCGCTCGCAATGTCGCCCTGCGCGACTCCGCC
+GTCGCCGCCGTTGCCGCCGCCGCCACCGGCAGCGGCGGTACCGCCGTCACCACCGGCACCGCCGGTGGCC
+TTGCCCGAGCCTGCCGTCGCGGTGGCACCGTCGCCGCCGGTGCCACCGGTCGGCGTGCCGGCAGTGCCAT
+GGCCGCCCGTGCCGCCGTCGCCGCCGGTTTGATCACCGATGCCGGACACATCTGCCGGGCTGTCCCCGGT
+GCTGGCCGCGGGGCCGGGCGTGGGATTGACCCCGTTTGCCCCGGCGAGGCCGGCGCCGCCGGTACCACCG
+GCGCCGCCATGGCCGAACAGCCCGGCGTTGCCGCCGTTACCGCCCGCACCCCCGATGCCTGCGGCCACGC
+TGGTGCCGCCGACACCGCCGTTGCCGCCGTTGCCCCACAACCACCCCCCGTTCCCACCGGCACCGCCGGC
+CGCGCCGGTACCACCGGCCCCGCCGTTGCCGCCGTTGCCGATCAACCCGGCCGCGCCTCCGCTGCCGCCG
+GTTTGACCGAACCCGCCAGCCGCGCCGTTGCCACCGTTGGCCAAACAGCAACCCGCCGGCCGCGCCAGGC
+TGCCCGGGTGCCGTCCCGTCGGCGCCGTTTCCGATCAACGGGCGCCCCAAAAGCGCCTCGGTGGGCGCAT
+TCACCGCACCCAGCAGACTCCGCTCAACAGCGGCCTCAGTGCTGGCATACCGACCCGCGGCCGCAGTCAA
+CGCCTGCACAAACTGCTCGTGAAACGCTGCCACCTGTACGCTGAGCGCCTGATACTGCCGAGCATGGGCC
+CCGAACAACCCCGCAATCGCCGCCGACACTTCATCGGCAGCCGCAGCCACCACTTCCGTCGTCGGCATCG
+CCGCGGCCGCATTAGCCGCGCTCACCTGCGAACCAATACTCGCTAAATCCAAAGCCGCAGTTGCCAGCAG
+CTGCGGCGTCGCGATCACCAACGACACCTCGCACCTCCCGATACCCCATATCGCCGCACCGTGTCCCCAG
+CGGCCACGTGACCTTTGGTCGCTGGCTGGCGGCCCTGACTATGGCCGCGACGGCCCTCGTTCTGATTCGC
+CCCGGCGCGCAGCTTGCTGCGCGAGTTGAAGACGGGAGGACAGGCCGAGCTTGGTGTAGACGTGGGTCAA
+GTGGGAATGCACGGTCCGCGGCGAGATGAATAGGCGGACGCCGATCTCCTTGTTGCTGAGTCCCTCACCG
+ACCAGTAGAGCCACCTCAAGCTCTGTCGGTGTCAACGCGCCCCAGCCACTTGTCGGGCGTTTCCGTGCAC
+CGCGGCCTCGTTGCGCGTACGCGATCGCCTCATCGATCGATAACGCAGTTCCTTCGGCCCAGGCATCGTC
+GAACTCGCTGTCACCCATGGATTTTCGAAGGGTGGCTAGCGACGAGTTACAGCCCGCCTGGTAGATCCCG
+AAGCGGACCGCTCCCATGCGCCCCCGGGCCGCGTCGGCCGCGCCGAACAGCCGCACCGCTTCCCGGTTGC
+TGCCGGCATCCGCCATCACCGAGGCGAGGCACTCGAGAATGTCGGGGACCCATAGGTATGCCCCAATGGA
+CGCGGCCACGCCGAGGGCGTCGTGGGCATCGCGCTCGGCCCGGTGGCGATCCCCTTGGGCGATCTCGATG
+CGGCAACGGGTAGTCAGGGCGCGGGCGCGGTGCACGCCACGAGTGATCGACGCTGCGCCGTCGGCCAATC
+GGTGCGCCGCGTTCAGATCACCTCGCGCACACGATATTTGAGCCGAACTGGTGGGGTCGTTGATGATCGC
+CGCCGCGCTGGCACCAAAGAATCGCGTTGCCGATTCGCGGGCGTGTTCGGCGGCCGCGACGTCACCGGCG
+GCCAGGGTCGCGAAGACCAGCGCGGAGCAGGCCGAGCCCGACAGCACCGGGCTGAGTCCAACGGCGGTGT
+CGATGCTGGCTTGGGCGGCGGCGGCCGCCTCGGTGTCGCCGCGGTGCGCTAACGCGTGCGCCAAGCAAGC
+CTGGCCCGCGCAGCTGCTAACCATGTCGTGCGCGGCGTCGGACTCGCCGATCACCTCGCGCGACAGGCCG
+ACCGCTGCCTCGAGGTTGCCCTGCCAGAGATTCGCCGCGGCCAGCGCCCAGCGACATGAACGTGAAAGGA
+ATGCATCACCAATCTCGTCGGCGAGGCTTCGTGCCTCCTCGCCCGCCGCGCGGGTCGCGCCCGGGTCACC
+CTCGCCGGCGAACCCGACATAGGCCTGCCAGGCCAGAACCTCGGCCAACCGCCACTTGTCGCCCACCGCC
+CGGGCCAGGCCGACGGCCTCGGCCAGCCACGGTCGCGCCAGATCCGCGTTGTAGGCGGCGACACCCCCGC
+ACGCGGTCAGCGCCCGCGCCAGCAGGGCCGGATCCTCGATGTCGCGCGCTATAGCCAGCGCCTTCTGGGC
+ATCATCTAGGCGGTCGGTGATGCCGGCCACGGCATCTATCAGGGCCCGGTCGGCCAGTGCCCGCGCATAC
+AACCCAGGGTCGGCCCCCGCCGGATGTGCATCGTGGTCGGCCAGGGCGGCGGCGAACCAGGCCAGCCCCT
+CTTGCAGGCGGCCCCGGGCACGCCACAACGGCTGCAGACATGATGCCAACAGCAACGCGTGGCCGGTATC
+GCCATTCTCGCGGCTGAACGCGAAAGCGGCCCGTAGGTTGTCGATCTCGAGCTCGGCCTGGTTGAGCCGG
+CGTTCATGGCCGGCCACCGAGGGGGCGTCAAGCCCGGCGGCAACGGCCGCGTAGTGGTCGCGGTGTCGCG
+CACGCACGGCATCGGCATCGCCGGATTCACGCAGCTTCTCCAACGCATACTGGCGCACCGTCTCTAGCAG
+GCGGTAGCGCGTTCGGCCGTCGCTGTCGTCGGTCACCACCAGAGACTTGTCTGCCAGCAGGCTGAGCAGA
+TCGACCACCTCGTAGCGCTGAACGTCACCGCCGGCGGCTGCCGCTTGGGCACCGTCGAGATCAAACCCGC
+TCGGGAAAACCGCCAGTCGCCGAAACAGCACCTGCTCCGGTCCGGTCAGCAGCGCATGTGACCAGTCGAC
+GGAAGCCCGCATCGTCTGCTGGCGGCGCACCGCAATACGCGATCCACCGGTCAGCAGGCGGAACCGGTCA
+TGCAAGCTGTCGACGATTTCGGTCAGCGCCAGGGCACGCACCCGCGACGCTGCAAGTTCGATCGCCAGCG
+GAATGCCGTCGAGTCGGTGGCAGATCTCGGTCACCAGGGCGAGGTTGTCGGCAGTGATCTCGAGTTCGGG
+CCGCGCCTCACGAGCGCGGTCGGTGAACAACTCGATCGCCTCGCCGTGCCCCAGCGGGGGAACCCGCCAA
+ATCTGCTCACCGGCCACCGCGATCGGTTCCCGGCTGGTCGCCAATACCCTCAGCGCTGGGCACGCCCCGA
+GCAACGCGACGATCAGAGCCGCGCACCCGTCGAGCAAGTGCTCGCAGTTGTCCAGCACTACCAGCATGCG
+CCGGTCGCCGATACGCCGCACAATGGTGTCCACCGTCGAGCGGCCCGGCTGATCCGGCAACCCCAAAACC
+CGCGCCGCCGCGATCGGCACCAGCGCCGGGTCGGTGATCGGCGCCAGGTTGACATACCAAACCCCGTCCG
+GATAACCGTCGGCAACGGCGCTCGCGACCTGTGTCGCCAGGCGTGTCTTTCCGACCCCGCCGACACCGGT
+AAGGGTGACCCACCGTTTGACGTCCAGCAGCCCACGGACTTGCGCCACTTCGTCGACGCGCCCCACCAGC
+CGAGTGAGCTGGGCCGGAAGACAGTGCGCACCAACGACTTTCCGGGTCCGCAGCGGCGGGAACGCGTTGT
+GCAGATCAGGGTGACACAGCTGCACCACCCGTTCCGGTCGGGGCAGGTCGTCCAGCCGGTAGGTACCGAG
+GTCGTTCAGCCACGCGTCCTTGGGCAGCAGGTCAGCAACCAGATCGCTGGTAGTTCCCGACAACACGGTC
+TGGCCCCCGTGGGCCAGCTCGCGCAGCCGGGCGGTGCGGTCGATGGTCGGCCCTACGCAGTTGCCCTCGT
+CGGGTGACGACACCTCCCCGGTGTGCATGCCGATGCGCAGCCGGATCGGTGCCAGCGGCGCCCGCTGCAA
+GCCCAGGGCGCACGCCACGGCGTCGGATGCGCGGGCGAACGCCACCAAGAAGCTGTCGCCTTCGCCCTGT
+TCGACCGGGCAAACCCCGCGGTGCTCGCGAACCAATTCGGTCAGCGTTCGGTCCAGTTTGGCGATCGCCG
+TCGTGTCAAGCTGAGACCCCGGCAGGTGGGTCGCGCCCTCGATATCGGCCAGCAGCAACGTCACCGTGCC
+CGTCGGTACAAGCTCGCTCACACCATCTGCGCTCCAGTCCACAGGTACCACGTCGACGCCGGGGTGAATC
+TTGCTCATGCTAGCCAGCATCGAGCCAGCGCGTAGCGCATTACATCGGCACCTGCGCCTAGATTGCTCGA
+AATCTCTTGGCCGCCGGTCCATGTGTTCTACGCGCTTTAGTCGATGCATTCGGCGACCGGCGTGCCATCG
+CGGCGGACCTACAGTGCCCGTGCTGTCCGCTGGCAATTGTGAGTCCCCCAGTGCTGGCAGCATCGCCCGC
+AAGAACCGACACGACCGCATCGTGGGCGGTGCCGTCGAAGTCGCCGGCTGACCGATCGGCGGAGTCACCG
+GCCCGATGGGGTTTCCGAAGGCTAGGGAATGATGACGATGGGGCGGCCGCCTCGGCCGCCTTCGCCGTAA
+CCCCCAACCATGCGGAAAACGAGCCTAGCGTCGCCCGGCCGCGCAGAGCGAGCCATCGCGGTGGCGCCAA
+CGACAGGAAGCGATCCGGATTCTCTGACCATGGTGGGTGTTCTGGCTACGTGACGTTAACGGAGATGGAG
+GGGCCGCCTTCGCCGCCTTCACCGCCGGAACCGCCGGAGCCAGGGTCGCCCCTCCCGTTGCCGGAGCCAC
+CCGACTCGCCCGACGAGCCGACGCCGCCGGAGGTCAAGCCACCGGCACCGCGTCCGCCGTCACCTCCGCG
+CCCGCCGTCCCCGCCGTCACCGCCGCCGATGCTGCGAGGCGGAGGGGCGCCGAAGCCGCCGGAGCCGCCG
+GTCCCGCCGTCGCCTCCGTCACCACCGGGGGCGCCACCGTCTCGCCCGGCCCCACCCAAGCCGCCGTTGC
+CGCCGTTGCCACCCGGCCCGCCGTCGCCTGCATCAGCAAAGCTGCCGTTGCCGTCCCCACCGTGACCGCC
+GTTCCCGCCGTCGCCTCCGTCACCGCCGGGGGCGCCGAAGCCGGCCTTGCCGTGCGCGCCACTTGTGGAA
+CCGAAACCGCCTTGTCCGCCGGGGCGGCCCCACCCGCCGTCGCCGCCGTCACCTCCGTCGCCGCCAGGCT
+CTCCGTCAAAATCCGCGAGATAGGTAAAGCCGTCACCGCCCAAGCCACCATTACCAGCGTCCCCGCCCGA
+CCCGCCGTCACCGCCGTCCCCGCCAACGCCTCGATTGCCGACCTCGCCGGCGGGTGCCGACCCGCCGGCC
+CCGCCGTTTCCGCCGGCGCCGCCCCACCCGCCGTAGCCACCGTCGCCGCCGTCGCCGTCGCGGCCCGTCG
+TTTCGTTAATGTCAAAGCCGTCAACGCCGTTACCGCCGACCCCACCAGCCCCGCCTAGGCCTCCGGCCCC
+GCCGTCACCACCGTCGCCGGTCTGAGTTCCGCCGGCGCCACCGGCCCCGCCGTCGCCTCCCGCCCCACCG
+CTGCCGCCGTCGAAGCCGTCGAAGCCCTTTAGGTCGGAGTCGGGCGACCAACCCGCGCCACCGGCCGCGC
+CGTTGCCTCCCTGGCCGCCGGTTCCGCCGCCGCCGTTCATCCCGGCGTCGCCGCCCGCCCCGCCGTGTCC
+ACCAACCCCGCCGCCGCCGCCGGGGCTGCCGCCCCGGCCAGCCCCACCTTGGCCGCCGGCTCCGCCGTTC
+CCGCCGTCGCCCAGAAATGCTCCGCCGGCGCCACCAGCCCCACCGGCGCCACCAGCCCCACCGTTGCCGC
+CAGCAACGGTGAGCCCTCCGAGGGCACCGTGCGCGCCGTCGCCACCCTTGCCGCCGTCACCGCCGTCACC
+GATGTCGCCGGCGTCACCGCCCTTGCCTCCAGCCCCACCGGCCCCGCCATCACCGCCGAGAGCTTCGGCA
+GCGGTGCCGTCGGCCCCATCACCACCGGCTCCGCCGTCCCCGAATAGCCCGGCGTTGCCGCCGTCACCGC
+CCTGGCCGCCGTCGCCGCCGGCCGCGGCGGCCTTGGCACCGTTGCCGCCGACGCCGCCGTCGCCGCCGGT
+CAGTGGCCCGTGTTTGCTGGCGTCCACGCCGTTGGCCGCGGAGGTGCCGTTGCCGCTGTCACCCCCCAGA
+CCGCCGCGACCGCCTGCGCCGGGGTCACCGCCGTTACCGCCCGCTCCGCCGGCGCCGCCGACGGTGATAC
+CAATGCCGCCGTTGCCGCCGGCCCCGCCAACGCCGCCGGCGCCGCCGAGTCCGCCGTCGCCACCGACCCC
+ACCGGTGCCGTGACTGCCGACCGTCCCCGAAGGTGCGGCCCCGCCGACCCCACCGTCCCCGCCATGTCCA
+CCGACCCCGCCGGCACCGCCATCGCCGCCACCACCGCCGGCCCCACCGGTGCCGCCGATACTGTCGATAC
+CGTTGGCGCCCCTGGCCCCGGCCCCACCGCTAGCGCCCACACCGCCGTTGCCGCCGGCCCCGCCGTTGCC
+GCCGGCACCGCCGTCACCCGACACCGACCCACCGGCGCCACCGGCACCACCGGCACCGCCGGCCTGCCCC
+GCGTCGCCCTGACCCCCGTTGCCTCCCGGTTGGCCGAGGGCGAGGGCATCTGAACCAGGCGCGCCCGAAT
+TGGCCCCGTTGGCGCCGGCCGCGCCATCGCCACCATTGCCGCCGGCGCCACCATCGCCGACCCGGCCGGC
+ATTGCCGCCGTCGCCTCCGTTGCCCCCGGCGCCGCCCGCGACGCTGGCTTGCGCACCGTTGCCACCGTTA
+CCACCGTTGCCGCCGCTGCCGGGCCCGTGGTCGCTGGCGTCCACACCGCTGGCCGCGCGGGTGCCGTTGC
+CGCTGTCGCCGCCCAAGCCGCCGAGGCCTCCCGCGCCGGGGTCACCGCCGTCACCGCCGTCCCCGCCATC
+ACTGCCATGACCGCCGTCACCGCCGTTGCCGCCGGCTCCGCCGAGCCCGCCGTCACCGCCAACGCCGCCG
+ACACCGTGGCTGCCGACCTGACCCGCGGGTGCGGCCCCGCCGGCGCCGCCATCACCGCCGGGCCCGCCGT
+CACCGCCAACGCCGCCGACACCGCCGTCGCCGCCTTTCCCGCCGGCGCCTCCAACGGCCTCAGCGCTGTC
+GGCGCCGGAGGCGCCCTTGCCGCCGCCGCCACCACTAGCTCCGGCACCACCCGCACCGCCGGCCCCGCCC
+TTGCCACCGGGTCCACCGTCGCCCGACACCGACCCACCGGCGCCACCGGCTCCGCCGGCACCGCCCGCGC
+CGCCGGCCTGCCCCGCATCGCCTCGACCGCCGTTGCCGCCACTACCTAACGCCGAACTCCCGGCACCACC
+GTCACCGCCGGCACCGCCCGCGCCGCCACCGCCAACGCCGCCTTGACCGCCGTTGGCCTCGCTTCCTTCG
+CCCGGTTGCCCCGAGAGGGTGCCGTCGGCGCCGTCCTCACCTACGTTCGCGCCATTCGCACCGGCCGCGC
+CGCTACCACCGTCGCCGCCGGCCCCGCCGTCACCGACCAACCCGCCGTTACCACCGGCACCGCCCTTGCC
+GCCGTTCGCGCCAGCCACGGTGGCGTCGGCGCCGTTACCGCCCTTGCCGCCGTTGCCACCACTGTGCACG
+GTAGCGCCGGTCGCGCCGGTCACACCCTCGGTGGCGCCGGCGCCGCCGGCGCCACCCTTCCCACCGGCGC
+CTGGGTCACCACCATCGCCGCCGGCCCCACCGTCACCATCCTTGAAAGCCATGTCGCCGCGGCCACCGCT
+GCCCCCGTTACCGGGCGCCCCACCAGCCCCGCCGGCACCACCGTCCCCGCCAACACCCTGGCTGCCCGCC
+CGACCCGCAGGTGCGTCACCGCCAGCCCCACCGGCCCCACCGTCACCGCCGCGACCGCCGGCTCCGCCAT
+CACCACCGTTGCCGCCGTCAGATACGAGCACAGCATTGAAACCGTGAGCTCCGTTACCACCGGCCCCGCC
+GGCCCCACCGTTGCCGCCGGCACCGCCGGCCCCGCCATCGCCGGCGTGGGCCCCACCCGCGCCGCCGGCC
+CCACCGGCCCCGCCGTTACCTCCATCCTCACCGGGGGTACCGGATGAACCCAGGAAGATCGCCGTCATAT
+CGGCATAGCCGGCACCCGCGGCTCCGTCACCGCCATGACCGCCGGCCCCACCGTCACCGACCAACCCGCC
+GTTGCCACCGGCACCGCCGTTACCGCCATGACCGCCGGCGACCGATGCGTGGGCGCCATTGCCACCTTTG
+CCGCCGTTGCCGCCGCTGACCGGCCCGTCGTTGCCGGCCGCCAGACCATTGGCCCCCGCGCGAGCACCGG
+CGCCGCCCGACGCCCCCCCCCCCCCCCGGCTCCGCCAGCCCCACCCAGGCCCGGGTCGCCACCGTGACCG
+CCGGCCCCGCCGTCACCGGCGGCCAGCCAACTGCCACCGTTGCCGCCGGCACCGCCGTCACCAGGCGCTC
+CACCCAGCCCCCCACCCCCGCCAGCCCCGCCGTCTCCGGCCCGGCCGACATACCCCAATAGTCCAGCCGA
+CCCGCCAGCACCCCCGGCGCCGCCCACGCCGCCGTTTCCGCCGGCACCGCCATTGCCGCCGGCGCCGCCG
+TCACCGCCGGCCGCCGAGATACCGGCCGGCCCATTTATTCCGGTAGCCCCGGCACCGCCGGCACCGCCGG
+CCGCACCGGCACCACCGGCCCCGCCGACACCGCCAACGCCACCGGCGCCGCCGTTACCGAGAAGCCACCC
+TCCCCGACCACCGTTGCCGCCCACCCCACCGGCACCGCCATCGCCCCCGTCCGACCCTGCCAAACCGTCA
+CCGCCGGCACCGTCGTCCGACCCGGCAACACCAGCCGCCCCATCCTGACCGGGCGTAGCACCGTTGGCCC
+CGGCCGCACCTACACCACCCACGCCGCCAGCGCCCCCATGACCAAACCACCCCGCGTTACCGCCCGCGCC
+GCCGGCGCCACCACCAGCCCCACCGGCACCACCGGCGCCGCCGTTGCCGAACAGGCCCGCGTTGCCACCC
+GCCCCGCCGGCGCCACCACCAGCCCCACCCATACCGCCGACGCCGCCCCCACCCGCCAGCCATCCACCCG
+TCCCGCCGGTACCTCCGGGTGCGCCCGCCCCGCCCGCGCCACCGGCGCCGCCGATCCCAAATAACCCGGC
+CGCCCCGCCGGCGCCGCCCACCTGCCCGACGGCACCGGCAGCGCCGTTGCCGCCATTGCCGAACAACAAT
+CCACCGGCCCCACCGGGCTGCCCAGGCGCTGTCCCGTGCGCACCATCGCCGATCAGCGGGCGTCCCAGTA
+GCGTCTGGGTGGGCGCATTCACGGCTCCGAGCACGACTCGCATCGCCGCGGCGTTGGCGATCTCGGTGGC
+CGTGTACCACCTCGCGGCCGCGGTCAGCGTGTGCACGAACTGGTCGTGAAACGCCGCGGCCTGCGCACTT
+AGCGCCTGATACTCCTGAGCGTGCGCGCTGAACAACGCCGCGATGCCCGCCGACACCTCGTCGGCGCCGG
+CGGCCACCACTTCCGTCGTCGGCATCGCCGCGACCGCACTAGCCGCGCTCACCTGCGAACCAATACGCGC
+CAGATCAAAAGCCGCAGTTGCCATCATCTCCGGCGTCGCGATCACATATGACATCTCGCACCTACCCAAT
+AGCCCGACCGTCGCCGCGCCGCTCCCGCTGCGACTAGTGACCCCTTGGTCTCTTGAGCCAGCGACCCCAA
+CTACCGCCGCGACAGGCCTTGTTCTGATTTGCCGCGACGACCTCCCAGGTGGGTCGAACCCACTCTGTCG
+GCCAGCAGCAATGCCACCGAACCCGCCGCCACCGGATTGCCCACGTCGTCTTTGCTGACTTTGCTGCAGT
+CCAGAGGTGCCACGTCGGCACCCGGGTCAATCTCGCGCATGCCAGCCAGCATCGAGCCAGCGGGCACCGC
+AATACATCAGCACGTGTGACTAGATTGCTCCGAATTCTGTCGAACGCGGGTCCGCGTGATCTGCGCGTTT
+CGGTCGATGCTTTCGGCAGCCCGGCCTCCGATCATTAACGAACCCGAGACGAGGAGAGCGCCATGGTCGA
+CACGAGCGCGCCCGCCAGCCGGCTGGACACCGATCCGCGCCGCGCTCATGTGAGTCTTAGTAAGCACCCC
+TACCAGATTGGAGTTTTCGGGTCCGGAACAATTGGTCCGAGAGTCTACGAACTGGCCTATCAAGTCGGTG
+CCGAGATCGCAAAGCAAGGCCACATTCTCATCAGTGGCGGGATGACTGGCACAATGGAAGCCTCCTCACG
+GGGTGCGTCGGACGCCGACGGCCTTGTCGTCGGCGTCCTGCCGGGCGACAAGTTTACCGATGGCAATGCC
+TATTCCACGATAAAGATTCTGAGCGGTATGCAGTTTGCTCGTAACTACATAACAGGTTTGAGCTGCCACG
+GAGCAATTGTCGTCGGCGGCTCGAGCGGCGCCTATGAAGAAGCCCGTCGTGTCTGGGAAGGCCGTGGCCC
+CGTGGTGGTTCTAGCGAACAGCGGATCGCCAACGGGTGCGTCTGCGCAAATGCTGTCCATGCAGGAAATC
+TTTGGGGTCGCCTTTCCGGAGGACAAACCCAAGCCCTGGCGAGTCTTTTCGGCGGCAACCCCCGCCGAAT
+CGGTGTCGCTTGTCATTGGCCTGATCCGGAAAGGATATGCCCAACATGAGCCGTAGGATAATTAACGAGT
+TCGGAGTACAGATCTACGGGGCCACGATAGGTGACACCTGGGCCGGGCTGGTCAGGGCGGTGCTTGACCT
+TGGGTCTCAGTGTTTTGACGAAGACCGAGAGCGTATAGCGCTGTCCAACGTCCGCATCAAGTCTTCGGTG
+CAGAATTATCCCGATCTCACTATTGAAGAACATTGCAACAGCGACCAACTAAAGGCCATGCTAGATTTCA
+TGTTCAACACCGATACCATGGAGGATATCGATGTGGTCAAGAGCTTCAGTCGTGGCGCAAAAAGCTACCA
+TCGCCGGATAAAAGAAGGACGAATGATTGAGTTCGTAATTGAGCGACTGAGTCTAATTCCGGAAAGCAAG
+AAAGCAGTGGTCGTGTTCCCGACTTACGAGGATTACGCGGCGGTCATGCGTAATCATCGAGACGATTACT
+TGCCTTGCCTTGTTTCGATACAGTTCCGCTTGTTGCCAGACGGCAAAGATTACGTCTTCCACACGACGTT
+CTATTCGCGGTCCATGGACGCCTGGCAAAAAGGTCACGGCAATCTTTTGTCTATCGCCAAGCTATCGGAT
+TGGGTGCGAGAGAACGTCAGTGCGCGCATTGGGCGCAAGATCATGCTTGGCCCGCTTGATGGCATGATTT
+GTGATGTTCATATCTACAAGGAGACGTATGCAGAGGCTTGCAAGCGTTTGGCCAACCTCGACCTTAGGCG
+AACACAATTTGACGCGGTGCGGAATTAGTGAGGACGCTAAGCCTCCCCAGCTGATGCGTTGATGCGCTAG
+CATCAGGGCTGTGCGAACGACACTTGACCTTGACGACGATGTGATCGCCGCGGCACGTGAACTTGCCTCC
+AGCCAGCGCCGCTCGCTCGGCTCGGTGATTTCCGAACTCGCACGCCGTGGTCTCATGCCCGGACGCGTCG
+AGGCTGACGACGGGCTGCCGGTGATCCGCGTTCCAGCCGGGACCCCGCCGATCACACCGGAGATGGTCCG
+TCGCGCGCTCGATGAGGACTGACGCGGGTGGCGCTGCTCGACGTCAACGCATTGGTCGCGCTGGCGTGGG
+ACTCACACATCCACCACGCCCGGATCCGCGAGTGGTTTACCGCCAACGCCACGCTCGGCTGGGCGACTTG
+CCCGCTCACCGAAGCCGGCTTCGTGCGGGTGTCGACGAACCCAAAAGTACTTCCCAGCGCGATCGGGATC
+GCAGACGCTCGACGGGTCCTCGTGGCACTACGCGCCGTGGGAGGCCACCGCTTCCTGGCTGACGACGTAT
+CGCTCGTCGATGACGATGTTCCGTTGATCGTCGGTTATCGCCAGGTGACCGACGCCCATCTGCTGACACT
+CGCCCGCCGGCGCGGCGTCCGCCTGGTCACCTTCGACGCCGGTGTCTTCACCCTCGCCCAACAACGCCCC
+AAGACGCCAGTGGAGCTGCTGACCATCCTCTAACCAAAGCTGCCAGCCCGCCCGGCTACAGATCCAACAG
+CGCGGTCTCCGGCGACTCGATCAGATCCCGCAGCTCACACATGAACTGGGCCACCTGAGCACCATCGACA
+ACGCGGTGGTCGAACACACAAGTCAACGTCATCGTCGGCCGTGCGACAACCTCGCCGCCGACGACCACCG
+GGCGCGGCTTGATCGCCCCCAGACCCAGGATCGCCGCTTCGGGATGGTTGATCACCGGCACGCCGTCGTC
+GACTCCCAGCGCCCCGAAGTTCGACACCGTGAACGTCGAACCGCGCAGCTCCGCGGGTGTGAGAGTGCCT
+TCACGTGCGCCGGTGATTAATTCCGCTACGCGGGAGGCAAGTTCGCGGGTGTTCTTGTCCTGGGCGTCGG
+TCACCACCGGCACCAGCAATCCACGCTCAGTGGCCGCGCCGAACCCCAGATGCACACCGCGATGCACGTG
+TACTTGCGGGCCTTCGCCCGAGTCGACCCACGTCGAGTTGAGAATTACGTTGTGTTTCAATGCAATAACC
+AGCAGCCGCAGCGTCAGCGCGAACGGTGTAATCTCGGGCGCCGCCGAAACGAACCAGTCGCGCAGCCGCA
+GCAGTTCGGCGCAAATTACCTCAACGCTGGCCTTTGCGGTCGGAATCTCCTTGTGGGACAACGTCATTTT
+TTCGGCCATCCGCGCGTGCACGCCGTGGACCGGCCGCACGTCCGGCCCGGCTCCGACGCCGCCTCGAGCA
+GCGGCCAGCACATCGGCCCGGGTGATCACACCGCCGGCGCCCGACCCACGCTGCAATGCGGCCAGGTCGA
+CCGCCAACTCTTTGGCCAGCTTGCGCACTACCGGTGCCGCCAGCGGCCGGCTTGTCCGTCTACTGGTTTC
+GATCGCGGCGTCGGCACCGTAGCCGACCAACGTGGGGACCGCTCCTTCACCGTTAGGCTGCGCAACTGCC
+GTGGGCCCGGTGTCGATCCGAACTAGCTCCGCGCCCACTTTGAGCACATCGCCTTCGGCGCCGCCTAACT
+CGACGATCCGGCCGGCATACGGGCTGGGGATTTCGACCTCGGCCTTGGCGGTCTCCACCGAACACAGCGT
+CTGGTTGATCTCCACATCGTCGCCGACGGCGACGCTCCAACACGTCACCGTCACTTCCTGCAGTCCCTCG
+CCGAGGTCGGGCACCGGGAAAGACCTGATGCTGTCCTCACCGCTCATGGCTGACGCAGCACACGTTCGAC
+GCAGTCCAACAGCCGGTCGGGGCCGGGTAACCACAATTTTTCCAACCGCGCAGGCGGGTAGGGTGTGTCA
+AAACCGCAGGCACGCAACACCGGAGCCTCCAATTGGTAGAACATCTCTTCCTGGATGCGCGCGGCCAGAC
+CGGCACCATAGCCGAGGCTGCGCGGCCCTTCGTGCATCACCACGCAACGCCCGGTGCGCTGGATCGACGC
+AGCAATGGTGTCGAAGTCCAGCGGCGCCAACGACCGCAGATCGATAACCTCCAGACTCCAATCATGTTGC
+TGCTCTGCAGTATCCGCGCTAGACAGGGCGGTGCTCACCAGGTTTCCGTACGTTACCACGGTCACATCGG
+TGCCGGACCGGCGCACCATCGCGTGCCCGATCGGCGGTTCCGGCCGGCTAGTGTCGACCATCCCGCGGCT
+GTGGTAGCGGCGTTTGGGCTCCAGATACATCACGGGGTCCGGGCAGGCGATAGCGTGCCGCAGCAGCCAG
+TAAGCGTCACCGGGTGTCGACGGCACCACCACCTTGAGGCCCGCGGTGTGCACCCAGTAGGACTCCGTGG
+AGTCCGAATGATGTTCGGCCGCACCGATACCGCCAAACGAGGGGATCCGGACGGTCACCGGCATGTCCAC
+CTCACCGCGGGTGCGAGTCCGGTACTTGGCCAGATGGCTCACCACTTGGTCGAAAGCCGGATAGGAAAAG
+CCGTCGAACTGGATTTCTGGCACCGGCACAAAGCCACGTAGTGCCAACCCGACGGCTATTCCGATGATCG
+CGGACTCCGCCAGTGGCGTGTCGAAGCACCGGTCTGCACCGAACGTATCGGCCAGTCCCTCGGTCACCCG
+AAACACCCCACCCTCGACCGCGACATCCTCGCCAAACACCAATACCCGCTCGTCGGCGGCCATCGCGTCG
+TACAGGGCGCGGTTGATCGCCTGGACCATGGTCAACGACTGCGTGATGTCGCTCACCGCTACCGCAAGCG
+TCTCATCCGGCCTGGCCGGACGGTCTGCGATTTGAGTCATGCCCGCCTCCTCAGTCAGTCCGCGCCAGTT
+CGGCACGCAGCTGTTCGCGCTGCGCCTGCAACCCGGGTGTGATTTCGGCGTACACCGTGGTGAACACCTC
+ATCGACGTCGAAGTCAGGCGCATCAAAGACCGCGTCGCGTAGCTCGGACCGCACGTGTTTTGCCCGAGCC
+GTCACCTGTTCCTCGAGGCGTTGCGACCACAGGCCCTGATCTTGTAAGTAAGTGCGATAGCGCGGAATCG
+GGTCCAGCGTCGCCCAGCGGTCCACCTCCTCCTGGCTGCGGTACCGGGTTGGATCATCGGCGGTGGTGTG
+CGGACCAAGACGGTAAGTGACCGCCTCGATCAGCGTTGGACCGTCGCCGGCCCGAGCCCGAGCGGCAGCT
+TCGGCCATCACCGCATAGCATGCCAGCACGTCGTTGCCGTCCACCCGGATGCCTGGCATCCCGTAGCCAA
+TCGCCTTGTGCGCGATAGATGGTGCGGCGGTCTGCCTGGATACCGGCATCGAGATTGCCCACTGGTTGTT
+CTGCACGTAGAACACGCACGGTGTGGTGAACACCGCCGCGAAATTGAGCGCCTCATGTACGTCGCCCTCG
+CTGGTGGCGCCGTCGCCCAGAAAGGCCACCGTCACGGAGTCCTCGTCCAGGCGTTGCGCGGCCATCGCCG
+CGCCCACCGCGTGCAAGGTCTGGGTGCCGATGGGAACCGACATCGGTGCACAGCACTTCGTGGTGAATTG
+CAGCCCGCCGTGCCAGGTTCCACGCCACGCGACCCCAACATGTCCAGGCGGGATGCCACGCACTAGGTAG
+ACGCCCAATTCTCGGTATTGGGGGAACAACCAGTCGGTTTTGCGTAGGCAAGCCGCCGCACCCACCTGCG
+CGGCTTCCTGCCCGCGACAGGGCGTGTACAACGCCAGCTCCCCCTGGCGCTGCAGATTGACGAATTCGGT
+ATCCAGCTCGCGGGTGACCACCATCATCTCGTAGAGCCAACGCAGCGTTTCCTCAGGAAGGTCACGGTGG
+TAGCGGCGTTCGGCCGTCGGCGTACCGTCCGGGCCGACGAGTTGCACCGGCTCAAGATCGACAGACATCA
+ACATCCCAGATGGCCTCCGAGAACCCTCCCCCATACCGTCTCCTCAGCTCGCGATCACAACGCGGTTACG
+CGTCAGAAGATGCCGTGCGTTCCATCCTTAGCGTCGGCGCTGGTGGTGCGGCGCTCACAGCACATCCCGC
+CTGGGAAACCGCTGCGAGCCGAAGTTGATCGCCGGCCGCACCAAAGCTTCCGCTCGCCGCAACACTGGCG
+CTTCCTCCATTATGCCCCCAAATGTGAAGAGTCCGGACCGATCGCGAACGCATCGCAACCGTGTCGCGGG
+GGATCTGCGCCCTCATTCGGAGGTGGCTTCCCCGGCTCGCCGCAACATCGTTTCCGCGTGCGTGAGCACT
+GGAGAGTCGACCATCTGGCCTTCGAACGCGAACGCCCCACGCTCGCTTCGCGACGCGGCCAAAACCCGCC
+GAGCCCAGGCCAGCTTCTCGTGGCTGGGTCGATAGGCCTTGCGCACCACCGGGATCTGACTCGGGTGAAT
+GCACACGGTCACGTCAAAGCCCACCGCCGCGGCGTCTCTGGCCTCTTCCTGCAAGCCCTCGACATCGAGG
+ATATCCAGATGTACGGCATCGAGCGCGAGACGGCCGAACGCGGACGCGGCGAGCAGGATGGTCGAGCGGA
+CATGTCGGGCCACGTCACGATAGGCACCGTCGGCCCGCCGGCTCGAGCTGCCGCCAAGGGTGGCGATCAA
+GTCTTCGGCACCCCACATCATTCCCACGGTGGGATCGGCCGCGGCGATTTCGGCGGCGCACACGGCACCG
+CGCGCGGTCTCCACCAGCGCGATGACATCACGCGGCGCAAGCTCGATGACTTGGGCCGCCGATTCGGCCT
+TGGGCAGCATCACCGTGGTATAGGCGGTGCCTGCGAGGGCCTCCAGATCGCGGGCCTGATCAGCAGTACC
+GCCCGCATTGATACGCACCACCGTGCGTTCCGGGTCCAGCGGGGTGTCCCGCAACGCATTGCGCGCGGCA
+GGCTTCTGCGCCTCGGCCACGCCGTCCTCGAGGTCGAGAATCACCACGTCGGCCGCGGCGGCAGCCTTCG
+CAAAGCGTTCCGGACGATCGGCAGGGCAGAACAGCCACCCCGGACCGGCGGCACGCAGGTTCATTGCGCC
+TCCTTAATGGACTGCTTTTGGACCAGCGTCGTGCGCACCGCGCGGGCCACCACCTCACCGTGCTGGTTGC
+GGGCGATGTGCTCGAGTGTGACGATGCCCTCGCCGGGCCGGCTTTTCGACTCACGTTTACCGGTACAGAC
+GGTCTCTGCATAAAGCGTGTCGCCGTGGAAGACCGGTTTGGGAAACGACACCTCGGAGAAGCCGAGGTTG
+GCCACGATGGTGCCCAACGTCAACTGCGCAACCGACAGACCGACCATCGTCGAGAGAGTGAACATCGAGT
+TCACCAGCCGCTCGCCCCGAAAACCCGGCTGCTGCCCAGCCCACGCCGCGTCGAGGTGCAGTGACTGGGT
+GTTCATCGTCAGCGTGGTGAACAACACGTTGTCGGCCTCGGTGACCGTGCGGCCGGGCCGGTGCAGGTAT
+GTGGTGCCGATCTGGAACTCTTCAAACCACAAGCCTCGTTGAAGAATCCTTCTGCCGACTGTGGATCCTG
+CGACGCGACACGCCGATACGGCGTCGTCAGATTCACGGTCGCCGGCGTGCTTTGTCACTGCAGTCCCAAC
+GATCGCGCGATAAGCATCAGCTGCACTTCCGTGGTGCCCTCACCAATCTCGAGCACCTTGCTGTCGCGGT
+AATGACGCGCCACCGGATATTCGTTCATAAAGCCGTATCCGCCGTGTATCTGGGTGGCATCGCGGGAGTT
+GTCCATCGCCGCCTCCGAGGAGATCATCTTCGCGATCGCCGCCTCCTTCTTGAAGGGCTTGCCCGCCAAC
+ATCTTTGCGGCGGCATCATAGTACGCTGTGCGGGCAACATGGGCGCGTGCCTCCATCCGCGCGATCTTGA
+AGCCGATCGCCTGATAAGCGCCGATCGGCTGGCCAAACGACTGACGCTGGTTGGCGTACTTGACGCTCTC
+GTCAACACAGCCCTGCGCCGCGCCGGTGGCCAGCGCTGCAATCGCAATCCGGCCCTCGTCCAGGATGGAC
+AAGAAGTTGGCATAGCCGCTCCCCCGGGCTCCCAGCAGGTTCTCCCTCGGGACCCGCGCATCGGCAAATG
+TCAGTGGGTGGGTGTCCGAGGCGTTCCAGCCGACCTTGTTATAGACCGGTTCCACGGTGAATCCCGGTGT
+GCCGCTGGGCACGATGATCGTCGAAATCTCTTTCTTGGCATCCGCAGCGGTTCCGGTGGTCCCGGTAACC
+GCAGTGACGGTGACCAGCGATGTGATGTCGGTGCCCGAGTTGGTGATAAATTGCTTGGAGCCGTTGATGA
+TCCACTCGTCACCTTCGAGACGCGCCGTGGTGCGGGTGCTGCCCGCGTCCGATCCCGCTCCCGGCTCGGT
+GAGACCAAAACCGGCGAGCGCACGGCCAGACGTCAAGTCGGGCAACCACTTCTGTTTCTGCTCCTCGGTA
+CCGAACCGGTAGATCGGCATCGCACCCAGGCCCACCGCGGCCTCCAGCGTGATCGCTACCGATTGGTCAA
+CCTTGCCCAGCTCCTCAAGTACCAGCGACAGCGCGAAGTAGTCGCCGCCCATGCCGCCGTACTCCTCCGG
+AAACGGCAGCCCGAACAGGCCCATCTCTCCCATCTTGGCGACAATTTCGTATGGGAAGCTGTGTTCCGCA
+TCGTGTTTGGCCGATACCGGCGCGACCACGGTGCGCGCAAAATCGGCCACCGTATCCCGAAGATCTTGGT
+ATTCCTTGGGTAATATCCCCCCAGAAATCGTTGTAGTCGTTGTGGTCATGATCCTAGTCCTTGATCCTCG
+CCAGTACCTGTTCGACTTTCACCTGATCGCCAACGGACACCAACACCTGTACCCGTCCCGAAACCGGCGC
+CTCCAGCGAGTGCTCCATCTTCATCGCTTCCACCACCACCACCACATCACCCGCAGAGATCTGGGAGCCG
+GACTCGACCTGCACGGCGATCACGCTGCCAGGCATAGGGCTGACGACCTCCGCCGGCCGCGCACCCACGG
+CGCGGTGAATCTTGTGCTCCTCGGCCTCGCGCAGGTGCCAAGTCCCGCGCTCGTCGGCGATCCACAGGTG
+CCGGTCAGCCTCTGCCCACCGATAATCCCGGCGCAGCCCGCTTATCGTCACGCTCATCTGTTCTCGGGTG
+ACCTGCACGCTCGCACAATCGATCTCACCATCGCCAACCTGAACCTGCGCCGACTCGGGTGGCCCCCACA
+CCGAAACGGTCTCGCTGCGCAGCGGGGTGCGCATGGCGGTGCGGACCGGTGCCATATGGCCCCCGCCGCG
+CCATCCGGACGGCGCGGCCCACAGGTCGCCCTGTGCGCGCCGGGCCAGGGCCCACTGGCGGTAGAGGCCG
+CCGGCAGCTAGCACGTCGTCAGGCGCCGGCCGCGCAGTGAAATCGGCCGATCGCTCGTCCAGTACAGCGG
+TGTCCAAATCCCCGACCCGCACCCGCTCGTCGGCGAGCAGAAAGCGAAGGAACTCGACATTGGTCTGCAC
+TCCCAGCACCGCAGTCCGCGCCAGCGCCTGGTCCAGCCGATCCAGCGCTTCCTCGCGATCGGCCCCGTGC
+GCAATCACCTTGGTGAGCAACGGGTCGTAATCACTGCCGACCACCGTGCCGCCTAGCAGTGACGAATCCA
+CCCGCACCCCGGGGCCGGCGGGTTCGAACACCGCCAGCACCCGGCCGCCGGTGGGCAGGAATTCCCGCGC
+GGGATCCTCCGCATACACCCGAGCCTCGATCGCGTGCCCACGCAGCTCGATGTCGTTTTGGGCGAAGCCC
+AACTTTTCGCCCGCACCCACCCGCAACTGCCACTCGACCAGGTCCAATCCAGTAATCGCCTCGGTGACCG
+GGTGTTCCACCTGCAGCCGGGTATTCATCTCCATGAAAAAGAACTCGTCGGGGCGCTGCGCGGAGACGAT
+GAACTCCACCGTGCCGGCGCCGACGTAGTCCACGCAGCGGGCGGTGTTGCAGGCCGCGACCCCGATGCGC
+TCGCGGGTCTGCGGGTCAAGCAGTGGCGACGGCGCCTCCTCGATAACCTTCTGGTGGCGCCGCTGGAGGC
+TGCACTCACGCTCACCCAGATGCACCACGTTGCCGTGAGCGTCGGCAAGCACCTGCACTTCGATGTGCCT
+GGGCCGCAACACAAACCGCTCCAGGAATAGCGTATCGTCCCCGAACGAAGACATGGCTTCGCGCCGGGCA
+CTCACCAGCGCCTCAGGCAGCCGCGCCGGATCTTGCACTAACCGCATCCCTTTGCCGCCGCCGCCGGCCG
+ACGGTTTGATCAGCACCGGATAGCCCACCTCAGCGGCAGCGGTGACCAGCGCGTCGTCCGTCAGCCCGGC
+GCGCGCCACACCGGGCACCACCGGAACATCGAAAGCGGCGACCGCGTTCTTGGCGGCGATCTTGTCGCCC
+ATCACCTCGATCGCGCGCGCCGGCGGACCCAGGAACACCACCCGGGCGCGTTCACACGCCGCAGCGAAAT
+CGGCATTCTCGGCAAGAAACCCGTAGCCCGGATGGATCGCCTGGGCTCCGGTGCGCGCCGCAGCATCGAG
+CACCTTGCCGATATCGAGGTAGCTTTCGCGTGCTGGGGCGGGCCCCAGCCGCACCGCAGCGTCCGCCTCC
+AAGACGTGGCGGGCATCGACGTCGGGGTCGCTGTAGACCGCGACCGACCGGATGCCTAGCCGGCGCAGCG
+TCCGAATCACCCGAACCGCGATCTCACCGCGGTTGGCCACTAGTACGGTGTCAAACATCGCCTCACATCC
+GGAAGACGCCGTAGCCAACCTGATCCAGCGGAGCGTGGGCACACAACGAAAGGGCAAGCCCAACAACCGT
+TCTGGTGTCCGCAGGGTCTATGATACCGTCATCCCACAGCCGGGCAGTTGAATAGTAGGGGTTACCCTGG
+TCTTCGTACTGCGCTCGGATGGGCGCCTTGAACGCTTCCTCCTCGTCGGGTGACCAGGGTGTGCCGGCCG
+CGGACAGCTGCTCGCCGCGCACGGTCGCCAACACGGACGCGGCCTGCTCACCGCCCATCACCGAGATCCG
+CGCGTTCGGCCACATCCACAGGAACCGGGGCGAGTACGCGCGTCCGCACATCGAATAGTTACCCGCACCA
+TAGGATCCGCCGATCACCACGGTCAACTTGGGCACCCGCGCGCAGGCCACCGCGGTGACCATCTTGGCGC
+CATGCTTGGCGATTCCGCCGGCCTCGTAGTCGCGGCCGACCATGAAGCCGGCGATGTTCTGCAGGAACAG
+CAGCGGAATCTTGCGTTTGTCGCACAGCTCGATGAAATGCGCTCCCTTGAGCGCGGATTCGCTTAACAAC
+ACGCCGTTGTTGGCGACGATCCCGACCGGGTGGCCGTGGACGCGTGCAAACGCAGTCACCAGAGTCTTGC
+CGTATTTAGCCTTGAACTCGCTGAATTCGCTGCCGTCAACAATCCGCACGACGACCTCATGAACGTCGTA
+AGGGACCCGGGGATCCGGGGGCACCACATCGTAGAGCTCGGCCTGCGGGTACTTGGGCTCGACCGAACGG
+CGCACATCCCATTGGGCGGGTTCGCACGGGCCGAAGGTGTCCGCGATCGCGCGCACGATCCGCAGCGCGT
+CCTCGTCGTCGTCAGCCAGATGGTCGGTGACACCGGACGTGCGCGAGTGCAAGTCGCCACCGCCAAGTTC
+CTCGGCCGAGACGATCTCGCCGGTGGCCGCCTTCACCAGTGGCGGACCGCCGAGGAAGATCGTGCCCTGC
+TCACGGACGATGACGGCCTCGTCACTCATCGCCGGCACATAAGCGCCACCCGCCGTGCAGGAGCCGAGAA
+CCGCCGCCACCTGCGGAATGCCCTTGGCGCTCATCGTCGCCTGGTTGTAGAAGATCCGCCCGAAATGCTC
+GCGGTCGGGAAACACCTCGTCTTGGCGGGGCAGGAAGGCGCCGCCGGAGTCGACCAGATAGATGCACGGC
+AGCATATTCTGCAGCGCGACCTCCTGGGCGCGCAGGTGCTTCTTGACCGTCATCGGGTAGTAGGTACCGC
+CCTTGACCGTCGCGTCGTTGGCGACGATCACGCACTGGCGTCCGGATACCCGGCCGATCCCGGTGATGAT
+TCCCGCGCCCGGGGATTCGTCGCTGTACATGCCGCCAGCGGCCAGCGGAGCCAGCTCGAGGAAAGGGCTG
+CCCGGGTCGAGCAGGCGGTCCACCCGTTCGCGGGGCAACAGCTTGCCGCGGCTGACGTGGCGTTTCCGGG
+CGCGTTCGTTGCCGCCCAGGGCGGCGGCGGCGAGCTTATTGTTCAATTCCGCCACCAGCCGGCGGTGCTC
+GTCGGCGAACGAGGGGGCTATTGCTATCGACGGGGTGGTCACTGGGTCGCCAGGTCCCGAAGCACAAGGG
+GCGGTTGAGTCTTCGCGACTACCTCGTCGACCGACACGCCAGGAGCGGTCTGGACCAGGTGCAGGCCGTC
+AGCGCAGACATCGATGACCGCGAGTTCAGTGACAATGCGGTCGACGCAGCCCACACCGGTCAACGGCAAT
+GTGCACCGCTCTAGGATCTTGGGGCTACCGTCCTTGGCGGTGTGCTCCATCATCACGATCACCTTGCGAG
+CGCCGTGTACCAGATCCATCGCGCCGCCCATGCCCTTGACCATCTTGCCGGGGATCATCCAGTTGGCTAG
+GTCACCGGTGACCGAAACCTGCATCGCGCCAAGCACTGCGACATCAAGGTGGCCGCCGCGGATGATTCCG
+AACGAAGTCGACGAGCTGAAGAATGCGGCACCCGGCAGCGTGGTGACCGTCTCCTTGCCCGCGTTGATCA
+AATCGGCATCCACGTCCTCCCGCCGCGGGTAGGGGCCGACGCCGAGGATGCCGTTCTCCGAGTGCAGGAC
+GACATGGACGCCGTCGGGAATGTGGTTGGGAATCAGGGTGGGCATGCCGATGCCAAGGTTGACATACTGA
+CCGTCTTCGAACTCCGCGGCCACCCGTGCGGCCATCTCGTCTCGGCTCCAGCCCGGGGCGCTCATTGCCG
+CACCGTCTCCCTCTCGATCTTCTTGGCGGGGTTGGGCACATGAACCACCCGGTGCACAAACACGCCCGGG
+GTGTGTACGGTGGCAGGGTCGATCTCACCCGGCTCGACCAAGTGCTCGACCTCGGCGATCGTGATCCTGC
+CTGCGGATGCGCACTCCGGGTTGAAGTTGGCCGCGGCGTGGCGGTACATCAGGTTGCCGTGCCGGTCCCC
+CTGCCAGGCATGCACCAGTGCGAAGTCGGTCCGGATCCCCCGCTCGAGGACATAGGTGACACCATCGAAC
+TCCCGAGTCTCCTTGGCCGGCGACACCACCGCCACCCCGCCCGAGGCGTCGTAGCGCCACGGCAACCCGC
+CGTCGGCGACCTGGGTACCGACCCCTGCCGGTGTATAGAAGGCCGGTATGCCCATCCCTCCGGCCCGCAA
+CCGCTCGGCCAGCGTGCCCTGCGGGGTCAGTTCCACCTCGAGCTCGCCCGCGAGGAACTGGCGGGCGAAC
+TCCTTGTTCTCCCCCACGTAGGAGGAGACTGTCCGGCGAATTCGCTTGTGTTGCAACAATAGTCCCAGAC
+CAACACCGTCGATTCCGCAGTTGTTCGAGACTGTTTCCAGGTCGGTGACACCGCTATCCACCAACGCTGC
+GATCAGTGCTTCGGGGATGCCGCAAAGCCCGAATCCACCAACCGCAAGCGACGACCCGTTGGCTATGTCT
+GCGACCGCCTCCGCGGCGGTGGCCACCACCTTGTCCATACCGCAGAGCCTCCTAGCATTTCAGTTAATTA
+TCATTAACTGAGGTGAGAATACCATTGCCCCCGCGGTGCGTCTAGGGACCTCACTGTTGGCCGCGGAGGT
+ATTCGAGCGCCTGTTGTCGCATCTCCACTTTGCGTACTTTGCCGGTGACGGTCATCGGGAACTCGTCGAC
+GATCCACAGGTACCGCGGGATCTTGAATCGCGCGATGCGGCCCATGCAGTACTCGCGCAGCCGCTCGATG
+GTCAGTTCCGGCGCGTCGTTTCTCAGCTTGACCACCGCCATGAGCTCTTCGCCGTATTTGGCGTCGGGCA
+CCCCGATGACGTGACCGTCGACAATATCGGGATGCGTGTGGAGGAGTTCCTCGATCTCCCGCGGCGAGAT
+GTTCTCGCCGCCCCGGACGACGAGGTCTTTGATCCGGCCGGCGATCCGCACGTACCCGGACGGGTCCATC
+TCAGCCAGATCTCCGGTGTGCATCCAGCCGTCGGCGTCGATCACCTCCGCAGTCTTCTGCGGGTCATTCC
+AGTACCCGGCCATCACCGAATAGCCTCGCGTGCAGAACTCGCCGACCACCCCGCGCGGGACCGTCTCGCC
+CGTGGCCGGATCCACCACCTTGATCTCAAGGTGTGGACCCACCCGACCGACCGTGCCGACCCGTCGATCC
+ACCGAGTCGTCGGCGCGCGTCTGCGTGGAAACCGGTGACGTTTCGGTCATTCCATAGCAGATCGAGACCC
+CGGGCATATGCATGCGTGAGATCACCTTGCGCATCACCTCGACCGGGCACGCGGCGCCGGCCATAATCCC
+GGTGCGCAGACTGCCCAGTTCGTAGTCGGTGAAGTCCGGCAGGCCCAGCTCGGCGATGAACATCGTCGGC
+ACGCCGTACAAGCTGGTGCATCGCTCGTCCTGCACCGCGCGCAGCGTGGCCGCAGGGTCAAAGCCCGGCG
+CCGGGATCACCATGGCCGCCCCGTGACTGGTGGCCGCCAGATTTCCCATTACCATGCCGAAGCAGTGGTA
+GAAGGGCACCGGGATGCAAATCCGATCTTGTGCGGTGTACCCGAGCAGCTCGCCCACCAGGTAGCCGTTG
+TTGAGGATATTGCGGTGGCTTAGCGTGACACCCTTCGGGTATGCCGTTGTGCCGGAGGTGTATTGGATGT
+TTACCGGATCACTGCCGTCTAGCCTCGCCGCGGTCTGCTGCAGCGCAGGCAGATCGGGCTCGGCACCCGC
+CAGCGCGTCCCAGCGATCGCTTTCCAGCAAAATCACGTCGGCCAGATCGGGGCATCGCGGCCCAACCTCG
+GCCAGCATCGCGGCATAGTCCGCATCCTTGAAACTCGCTACGGCAATCACCATCGCGACACCGGACTGCC
+TAAGCGCATACTCCACTTCGCGGACCCGATAGGCGGGGTTTATGGTCACTAGGATCGCGCCGATCTCAGC
+GGTCGCGTACTGGACGAGCACCCACTCCCACCGGTTCGGTGCCCAGATGCCGACCCGATCGCCCGGGCCG
+ATCCCCGCCCGCACCAGCCCCGTCGCCAGCCGGTGCACGTCAGTCAGCAGTTCGCTGTAATTGAACCGTC
+GCCGGGCCACCATGTCCACGAGTGCTTCCCGATGTCCGTACCTGGCAGCGGTCGCTGCGAGGTTGGCGCC
+GATGGTCGACTCGAGCAATGATGGCGCACTCGGACCGCGATCATAGGAAAGCCGATTGGGGTCTACGACT
+TCCGCGGCTGCCACGGTTCCTCCGCCTGGTGCCTACCGCATGTCTGACTCGCGTTAACATCGAATAGCTC
+GTGCTACGTTAGTGACGATTAACCGAAGTGTCCAGCATGAGTCGTGTACGGAGACCGTCGTGACAGCGTC
+CGCCCCGGACGGTCGGCCCGGCCAGCCCGAGGCCACAAATCGTCGCAGTCAGCTGAAGTCCGACCGACGA
+TTCCAACTCTTGGCAGCCGCCGAACGATTGTTTGCCGAACGAGGATTCCTGGCGGTGCGACTGGAGGACA
+TCGGCGCCGCCGCGGGCGTCAGCGGTCCGGCCATCTACCGACACTTCCCCAACAAAGAGTCGCTGCTGGT
+GGAATTGCTGGTCGGCGTCAGTGCGCGACTTCTTGCCGGCGCACGCGATGTGACGACCCGCAGCGCTAAC
+TTGGCCGCGGCACTGGATGGCCTCATCGAGTTTCACCTTGACTTCGCACTCGGCGAAGCAGACCTCATCC
+GGATCCAGGACCGGGACCTAGCGCACCTGCCGGCCGTCGCTGAGCGGCAGGTGCGTAAGGCCCAGCGACA
+GTACGTGGAGGTCTGGGTCGGGGTGCTGCGCGAGCTGAACCCAGGCCTGGCCGAAGCCGACGCCCGGCTG
+ATGGCCCACGCCGTGTTCGGACTGCTGAACTCCACCCCGCATAGCATGAAAGCGGCCGACAGCAAGCCGG
+CACGGACGGTGCGTGCACGCGCCGTCCTACGGGCGATGACGGTCGCCGCGCTATCGGCCGCGGATCGTTG
+TCTATAGCTCGCCAGGCTGCGATGTCGCCGGGTACATCAGCGCACCCGCACCCAGCGCGGGTACCCTGCA
+TGCCATGAGGTGGACATGAACGATCCACGTCGCCCCCAGCGGTTTGGTCCCCCTCTATCCGGGTACGGGC
+CGACCGGACCGCAGGTTCCCCCCAATCCGCCGACCGCCGACCCGGCTTACGCCGACCAGTCGCCGTATGC
+ATCCACGTACGGCGGTTACGTTTCCCCGCCGTGGTCTCCAGGAGGGCCCCCGCCAAGGCCTCCCCAGTGG
+CCCCCAGGCCCCCACGAGGCCAGTCCGACCCAACAGCTGCCGCAGTACTGGCAATACGACCAGCCCCCAC
+CGGGCGGATTTCCCCCCGACGGGCTGACTCCCCCGCCACCGCAAGGGCCGAGAACGCCGCGCTGGTTGTG
+GTTCGCCGCCGGCTCAGCCGTGCTGCTCGTCGTCGCGTTGGTCATCGCACTGGTTATCGCCAACGGCTCG
+GTCAAAAAGCAAACCGCGATCGAGCCGTTACCCCCCATGCCCGGGCCTAGCCCGACACGTCCGACCACGA
+CCACACCGACCCCACCCTCACCCAGCGCCGCACCGGCACCGACAACTACGACCGGTACGCCTAGTGAGAC
+GGTCGCCGGCGCGATGCAAACCGTTGTCTACGACGTCACGGGGGAAGGCCGGGCAATCAGCATCACGTAC
+ATGGATAGCGGCAACGTCATACAGACCGAGTTCAACGTCGCCCTGCCGTGGCGGAAAGAGGTCAGCCTGT
+CAAAGTCGTCCTTGCATCCCGCTAGCGTCACGATCGTCAACATCGGCCACAACGTCACCTGCTCGGTCAC
+CGTGGCCGGGGTTCAGGTACGCCAGCGCACCGGGGCGGGGTTGACCATCTGCGACGCTCCCAGCTAGGAG
+GATTGCGCCGTCGTCAGCGCACCGCCGTGCCGCGACACCTGTACCCGCAGCATGAGCAGCAGGCCGGTTG
+TCAACACGAGGCACACGCCGCCGAGCCCGGCACGGACCGTGTGGAACACGTCGACGAAGACCGAAAACAA
+CCACGGCCCCAGAAACGACACCGCCCGGCCGGTCATCGTGTAGAGCCCAAAGGCCACACCCTCCTTGCCG
+TGCTGCGCCATATGCAGCAGCAGAGCGCGTGCCGACGACTGCGCCGGCCCGATGAACACACACAACAGCA
+GCCCGCACGCCCAGAACGCCGTTGGGCCCGACAACGTCAGCAACGTGAGCGCCGCGGCGATGATGGCGGC
+CAGTGATCCGACGATGACCGGTTTGGACCCGATCCGGTGGTCGACGAACCCACCCAGCACGGCCCCCACC
+GCAGCCACCACGCTTGCGGCCGCACCAAAGATCAGGACATCGGCCTGGGTGAGCCCGTATGCGTTGACGC
+CAAGTACCGCGCCGAAGGCGAAAATGGCCGCCAGCCCGTCGCGGAATATCGCGCTGGCCACCAGGAAGTA
+GACCAAGTTGCGGTCGCGCCGCCACTCCGCGCTGATCTCCGTCCACAGCTTGCGGTAGCCGCCCAGCAGG
+CCGGTCGAAGGATGAGACGCCGCACCGGAATCGGGTAGTCGGTGCGCGACCAACAACAATGGCAGGCCCA
+GCAACGCCAACCAGGCCGCCGCAACCAGCATCGCCATTCGCACGTTGAGTCCGTTCGCGACGGGTAGCTG
+CAGCAGGCCGCGCTGCGAACCGCTACCTGACATGAAACCCAGATAGATCACCAGCAAGAGCGCGACGCTG
+CCGACATAGCCCGACGCCCAACCGAAGCCGGAGATCCGGCCCGCCGTGCTGGGTGTGGACAGTTGGCGCA
+GCATCGCGTTGTACGGAACGCTGGACAAATCGCTGGACGCCGCGGTGGCCGCGAGCAAAACCAGCCCGGC
+CCACAGGTAGCGGGGGTCGTCGCGGATCAGGAACATTGCGCAGGTCAGCGCGACCGCGGTGCCGGTCAGC
+ACAGACAGTGCCACCCGACGGCGGTGCGGAGACTCCACCCACACGCCGACGACGGGCGCCAGCACCCCGA
+TGGTCAACCCGGCGACCGCCCCCGCACGACCCAACCAACTCGCCGGTGAGGTGCCGCCCGGCAGACCCTG
+ACCCACGGCGCTGGTCAGGTAGACGGAGAACACAAAGGTTGTCACGATCGCGTTCAGACCGGTGGAACCG
+CAATCCCACATGGCCCACGCCACCACCCGGAAGTGCAGGAGGGTGCCCGCGCGCGACCCCGGGTTATTCA
+TGTCCGGCACTTTATTGCTTTTGGCAGCGACCCGCTGCGCCCGGCTCCGCCGCGCTCGCGATCGCTACGT
+GTCTACGATTGGCGCATGCCGATACCCGCGCCCAGCCCCGACGCACGTGCCGTTGTCACCGGGGCTTCGC
+AGAACATCGGCGCGGCGCTGGCCACCGAACTGGCCGCACGCGGGCACCACCTGATCGTCACCGCACGACG
+CGAGGACGTGTTGACCGAGTTGGCTGCCCGGCTGGCCGACAAGTACCGCGTCACGGTCGACGTGCGACCG
+GCCGATCTGGCCGATCCGCAAGAACGATCGAAACTGGCCGACGAGCTGGCTGCCCGGCCCATCTCGATCC
+TGTGCGCCAACGCGGGTACCGCGACATTCGGCCCGATCGCATCGCTCGATCTTGCCGGCGAAAAGACGCA
+GGTGCAGTTGAATGCCGTGGCGGTGCACGACCTTACGTTGGCGGTGTTGCCGGGCATGATCGAGCGCAAG
+GCCGGCGGCATCTTGATTTCTGGTTCGGCGGCCGGCAATTCACCGATTCCCTACAACGCCACCTATGCCG
+CGACCAAGGCCTTCGTGAACACCTTCAGCGAATCTCTGCGCGGTGAGCTACGCGGCTCCGGCGTGCACGT
+CACGGTGCTGGCCCCGGGCCCGGTTCGCACCGAGCTACCGGATGCCTCCGAAGCGTCACTGGTCGAGAAG
+CTGGTGCCGGACTTCCTGTGGATCTCGACGGAGCACACCGCCCGGGTATCGCTGAATGCCTTGGAGCGCA
+ACAAGATGCGCGTCGTTCCGGGTCTGACGTCAAAGGCGATGTCGGTGGCCAGCCAATACGCTCCGCGCGC
+CATCGTGGCGCCAATCGTGGGTGCCTTTTACAAAAGGCTTGGGGGCAGCTAGGCATCACTTCCGGCGGCG
+GCGCCCGGTGCCGAAGATGCTGCGGGTGATCTCGCGTGCGGTGGTGTTGAGGACGCTCTTGACGGTCGGA
+TTCTTGAGTATCTCCTCCCACACCGCGGGGCCCTGCGGCTCCACCGGAGCGGGCATCGGCGGAACTTCAA
+AATCGTCCGGCCAGGGCAGCGGATCGTACTGCCCCCTTGGGGCTGGGGCCTCCTGGGCCGGGGCCTCTTG
+CGCCGGCGCGAGTTTGGCGCTCAGTATCTCGTGGGCTGACGGGCGGTCGATGGTCTGGCCATATACGGCC
+TGCAACGAGCTTGCCTGGGCCGCGGCGCCAATCGCTTCGGCTCCGATCGCGGCCATCAGCGACCGTGGCG
+CTCGCATCCTGGTCCAGGCGACCGGCGTCGGTGCGCCCTTCTCCGATAGCACGGTGACGACGGCCTCGCC
+GGTGCCCAGCGACGTCAGCGCGGACTCCAAGTCGTAGACATCGGTTTTCGGGTAGGTGCGCACGGTCTTG
+CGCAGCGCCTTGTGGTCGTCGGGGGTAAACGCGCGCAGCGCGTGCTGAATTCGGGCTCCCAGCTGGGAGA
+GGACATCGTTGGGTAGATCCGTGGGCAGCTGGGTGCAGAAGAACACCCCAACACCCTTGGAACGGATCAG
+CTTCACGGTCTGCTCGACCTGCTCGAGAAAGGCCTTCGAGGCATCGGTGAACAACAGGTGCGCCTCGTCG
+AAAAAGAACACCAGTTTGGGCTTGTCCAGGTCACCCACCTCGGGCAGGAAGGTAAACAGGTCCGCCAGCA
+CCCACATCAGAAAAGTGGAGAACATCGCCGGGCGCAACGCCTGGCTCCCGAACTCCAGCAACGAGATGAT
+GCCCCGACCCTGGCTGTCGACGCGCAGCAGGTCCTCGGGCCTCAGTTCGGGCTCACCGAAGAATGTGTCG
+GCACCTTCGGCTTCCAGGTTGACCAAAGCCCGCAGGATGACCCCGGCCGTCGTGGGCGACACCGCCCCAA
+GGGATTTCAGCTCTACCTTGCCCTCATCACTGGTCAGATGGGTAATGACCGCCCGCAGATCCTTCAGGTC
+CAGCAGCGGAAGTCCTCGTTGGTCGGCCCAGTGAAAGATCAGGCCCAGTGTAGATTCCTGGGTAGCGTTG
+AGCCCCAACACCTTTGCCAGCAGAATCGGGCCGAAGCTGGAGATGGTCGCACGCACCGGAACCCCGACGC
+CACTGGCACCCAGCGACAGGAACTCCACCGGGAAGGCCGTCGGCACCCAGTCGTCACCGGTGTCTTTCGC
+ACGGGCGGCCGTCTTGTCGGCGGCCTCCCCCGGGCGGGCCAGACCGGACAAATCGCCCTTCACGTCGGCC
+ATCAGCACTGCCACCCCCGCCGCACTGAGCTGTTCGGCGATCAGCTGCAGCGTCTTGGTCTTGCCGGTTC
+CGGTGGCCCCGGCGACCAGACCGTGCCGGTTGACGGTGGCCAGCGGAATGCGAATCTGCGCGCTCGGGTC
+GGGTTCGCCGTCGACGACGACGGTGCCCAACTGCAGGGCCTGGCCTTCGACGGTGTAACCCGCCGCGATC
+CGCTGCGCGGGCCCGCCAGGTCCACCGGCCGCCGATTCGGTGCCCATAGCTGGATCACACTACTTGCCCG
+GGGGAGACAGCCGCGACGGCTCGCATGCGCCTACGCTGAGCGCTGTGCAAGACGAACTGGTGTGGATCGA
+CTGCGAGATGACCGGGCTCGATCTGGGTTCGGACAAGCTGATCGAGATAGCCGCCCTGGTCACCGATGCC
+GATCTGAACATTCTCGGCGACGGGGTGGACGTGGTGATGCACGCCGACGACGCCGCGCTGTCGGGCATGA
+TCGACGTGGTCGCCGAGATGCACTCGCGGTCGGGGCTGATCGACGAGGTGAAGGCATCCACGGTCGACCT
+AGCGACCGCCGAGGCCATGGTGCTCGACTACATCAACGAGCACGTCAAGCAGCCCAAGACCGCCCCACTG
+GCCGGCAACTCGATCGCCACCGACCGCGCGTTCATCGCCCGCGACATGCCCACGCTGGACTCGTTTCTGC
+ACTACCGAATGATCGACGTCAGCTCGATCAAGGAACTGTGCCGGCGCTGGTATCCGCGGATCTACTTCGG
+CCAGCCGCCCAAGGGGCTGACGCACCGGGCGCTGGCCGACATCCACGAATCCATCCGCGAACTGCGGTTC
+TACCGCCGCACCGCGTTCGTGCCCCAGCCCGGCCCTTCTACCAGCGAAATCGCGGCCGTCGTCGCCGAGC
+TTTCCGACGGGGCGGGCGCGCAGGAAGAAACAGATTCGGCCGAGGCGCCCCAGAGCGGTTAATATCGACG
+TCGCCGCTCATTAGCCCCCGCGGGGGCGGCCGGCGGCCATGGTGAGTGTAGTTCAGTTGGTAGAGCACCA
+GGTTGTGATCCTGGGTGTCGCGGGTTCGAGTCCCGTCACTCACCCCAACAGGGCGGCAGGGTGTTTATGG
+CCCTGGGCCCTTTGCTGTCCCCGCCGAGGGCTTGCACCTGCAACCTTCGTGTCTATGATCTGGTCCCGTG
+GCGAATTCGACCACTCGCCGCGACTGCACCTGGCCGCCCGCTCCAACACCCGCCGGTCAAACTGCCATCG
+GACAGCATGTTCCCCGTCGCCAGGGCCTTGGCAGGTGTCGGTTTGCCCGGTCTATTTGCCTGCCGCGCAA
+CTATCGCACCTCCGGCGTGGCTTGTTCGGACTCACTCGGTGTTTCGTGCCATGGTTGATGTGCAGGACGT
+TTGAGACCCCAACCAGCTAGACCAGGATGAGCGCTTCTGCGTCAGCCGACAAGGTCGTATGCGAGTGCTG
+CGAGCTCTGTGTTCCTAAACAGCTCGCGTCAGCGATTCGCAACCCATACGGACTCGTCCGTGGGTGGCGC
+TGTCGCATCTGTAACGAGCACCAAGGCCAGCCGGTCAAGATGGCGCAAGACCACGAAGAGGAGGTCCGCA
+TCCGTTGGGGCGAGACGGTGGACGAACTCCACGCTGCGCTGGACCGCGCCGGGCCAAGGCCAGGGACGTG
+GTGTACGAGTGAAGGTTCCTCGCGTGATCCTTCGGGTGGCAGTCTAGGTGGTCAGTGCTGGGGTGTTGGT
+GGTTTGCTGCTTGGCGGGTTCTTCGGTGCTGGTCAGTGCTGCTCGGGCTCGGGTGAGGACCTCGAGGCCC
+AGGTAGCGCCGTCCTTCGATCCATTCGTCGTGTTGTTCGGCGAGGACGGCTCCGACGAGGCGGATGATCG
+AGGCGCGGTCGGGGAAGATGCCCACGACGTCGGTTCGGCGTCGTACCTCTCGGTTGAGGCGTTCCTGGGG
+GTTGTTGGACCAGATTTGGCGCCAGATCTGCTTGGGGAAGGCGGTGAACGCCAGCAGGTCGGTGCGGGCG
+GTGTCGAGGTGCTCGGCCACCGCGGGGAGTTTGTCGGTCAGAGCGTCGAGTACCCGATCATATTGGGCAA
+CAACTGATTCGGCGTCGGGCTGGTCGTAGATGGAGTGCAGCAGGGTGCGCACCCACGGCCAGGAGGGCTT
+CGGGGTGGCTGCCATCAGATTGGCTGCGTAGTGGGTTCTGCAGCGCTGCCAGGCCGCTGCGGGCAGGGTG
+GCGCCGATCGCGGCCACCAGGCCGGCGTGGGCGTCGCTGGTGACCAGCGCGACCCCGGACAGGCCGCGGG
+CGACCAGGTCGCGGAAGAACGCCAGCCAGCCGGCCCCGTCCTCGGCGGAGGTGACCTGGATGCCCAGGAT
+CTCTCGGTAGCCCTCGGCGTTGACGCCGGTGGCGATCAAGGTGTGCACTCCGACGACGCGGCCTGCCTCG
+CGCACCTTGAGCACCAGGGCGTCGGCGGCGAGGAAGGTATACGGGCCGGCATCGAGCGGGCGGGTCCGAA
+ACGCCTCTACGGCTTCGTCGAGCTCTTTGGCCATGATCGACACTTGCGACTTGGAAAGCTTTGTCACACC
+AAGTGTTTCGACCAGGCGCTCCATCCGGCGAGTGGATACTCCCAGCAGGTAGCAGGTCGCCACCACGCTG
+GTCAGTGCGCGTTCAGCTCGCTTGCGGCGCTGCAGCAGCCAGTCCGGGAAATAGCTGCCCTGGCGCAGCT
+TGGGGATCGCGACGTCGATGGTTGCGGCACGGGTGTCGAAATCACGGTGGCGGTAGCCGTTGCGCTGATT
+GGACCGCTCATCGCTGCGTTCGCGGTAGCCCGCCCCGCACAGGGCGTCGGCTTCAGCCCCCATCAAGGCG
+GCGATGAACGTCGAGAGCAGCCCGCGCAGCAGATCCGGGCTCGCCTGTGCGAGTTGGTCAGCCAGAAGCT
+GCTCGGTGTCGATAAGATGAGAAGAGGTCATTGCGTCATTTCCTTCGATTGACTTTTGCTGGTCGTTTCG
+AAGGATCACGCGATGACCGCCCACTACTGGGCTACGACACGCCCACCGGCCTTACCTGCCCGTACACCAC
+ACCCCTGGACGTAACTCCGCGCCGATGACTACAAGGCAAAGATGCTGGCTGCGTTTAGGTCTCACGATGC
+CGTGTTAAGAGAGTTCGAAAAGCTCGGCCGCTATCATCAGTCAACCGGGCACGGCTGCCTCTGCGGCAAA
+CGAAACTGTGCAACGCTGTCCATCATCGATAGCAACCAGATATATGGCCACATTGACCGAATGAATCGCC
+GCGACGAGCTTGGCTAAGCCACAACAGAGAGAAACAAGGTGGACGACATCGCAGCATTCAAGCTCGACAG
+CCTGCCGGACATAACCTTCACGGTCACGCGGGCCATAAGTTCGGGTGGGGAAAATCCGGCGGGGTTTCTC
+AATTTCGCGGCGCGCCGAGAGCAACCGGAGATCCTGGGTGGTGGAGGCCGTCCTGGACCGGTGGGCCCGG
+AAGCGGTCGATACTCCACGTATTCGCGGCGGGAAGGTGCCGTTCGTCTTCCGGACGCTACCGGGTTACAC
+CTTCTACGCCAGCCAAATCGAGCCGAGAGTGGGCGACCCGGAAGGGCCCACACTCCTGGCTGGATTCGGC
+AATATCCCTGAGACTTCGCAGCGGTCGCCGGGATGGATCCGCATCACCTGCAAGGGGCCAGACGACGATG
+AGGAGCTGGAATTCTTTGGATTCGCCGGGCCAGAGTCCTAACCAGGCGATGAACGAAGGATCGGCGACGG
+CTACGAACCTGGATAGGCAAGAATGGCGCACCGAAGCGTCACTCGACGTCGGCCGGCCGGAGAACGCACC
+ACGAAACGAAACACTTGTGAGGACCAAGATTCTCCGATCTTCGGGTAGCACCCGAGAGCATGTCGTTAGG
+CCTGTCGGCATGGGCGCCGGCAAGGTCCTCCAGCCGGGTGATGGGCGTCGCAGAGTACAGACGTGGCTGC
+TGTCCGCAGGCTGAAGCGGATGAAGTGACAGCCCAGCGGCGCGGCCAGAAGCTCTCAGAAAGTCCATCCC
+TGCGCCTCGATATAGCCCATCAGAGTTAGCCACGGCACGCCAAGAGCGTCGCAGACATCGGGGATGCGCG
+GCTTTTCGATATTGCCGCTCGCAGTCTCCTGGGTAACCACCGTGGCGTTGTTCACCATCGCGAGCGCGAT
+GACGAACGGGTCGGCGGCGCTTCGCCTGCCACCCTGCCGGACCATGTTCGGGTGCAACCGCAAGATGTGC
+CGCGCCGCCTGCTGGATCTGTTCATCCAGAGGACAGAACAAGCCAGTTTGCCCGTCCGCCCACCGCTTCG
+CGTCATCATCACGCCTGGCGAGTTCGCGCTGAACCTCATCGACCGACCTGATCTGACCGGCGCTGATCGC
+ATCCTCAACCCGGCCCCACAGACTGCGAAACACCGCTGGCCGAAACAGATCACGCCGTCCGTTCAGGATG
+GCGCTGGTATCGAAGGAATAGAGCACAGCGGTTAGACCACGCTCCGCAGTTCGGCTGACTCAGCCAACTT
+CGGAATCTGGCTGACCTTGGCGTCGAGGTAGATCGCAGCGGTGTTGCTGTCGATGACGCGGCGGCGGTGG
+GCGTCGGTCACCGCCCGCACGTAGCCCTTGCCGAGGTCTCGGACGGTATTGCGGTACCAGTTGCCGCCCC
+CAGCCGATCGAGCCCGTTCGGCCTCGTCCTCGTGAGCCGCGATGAACTCGGCGCGGCGCTGTCGGTAGAC
+CTCGACCGGCACGATTCCAAGCGTGCTTAGCCGCCGCAGGAACGCCTCGGCACTCACGCCAAAATGCGCC
+GCGACCGGCCGCAGCGATTCGTAATCCCACGAAGACGGAGTCTCGCTGCGAACGATGACCTCCGGCCGCG
+CTCGCACCACGTCGGCAGGCATCAGCACAGCGGCGGCGATCGCGTTGCATCGAGCCTCCAGCGATCGGTC
+CTGGGTGCTCGGATGAGCATCGGCGATCACGTCACACAAGCCCTCGGTGTGCAGCACCACGTGCACGAAC
+TCATGCAGCAGCGAGAACAGGCGAGGGCGGGGGTGGTCGCTGCCATTGAGCACGATCACCGGCAATTCGT
+CGAAATACAGACACATACCGCGCATCTCGTCGATAGCGACCTTGCCGCCGCGGGTCGCGAGCACCAGAAC
+GCCGGACGTTTCGATGGCCGACACCCAGGCGTTCAGATGCTCGTAAGGGTCAACCGAGGCCACGGGGATA
+GGCAACGGGCTGACCTCGATCAAGGCCTTGCGGATTCGTGCCGCGATATCCGCGTCGGCCTCGTCGCCGG
+ATAGGGGCAAACGCCAGGCGCCCGGTATCTCCCGGTCCTCGGCGTCGGCCAGCTCTAGCGCGAAGTCGCG
+TTGCGTGTGTGCGCGACGGAACTCCTCGTGAAGCCCCGGCGTCCATTGACCCGACGCGGCACCGTCCAAT
+CGTCGGAAGTCGCGTAAGGTGTCAAACCCCTCGGGCGGCTCGGACAGGAAGAACACCGCCAGCGAGCGCT
+TGTAGACCTCGGCGGCCTTGCGCAGCTGCGCGATGGTTGGCACAACCTCGCCCACCTCCCAAGCCGCGAC
+GCGATCATCAGGCAGGCCGAGTTTGCGGGCCGCGGCTACCTCGGTCAGGCCACACGACTCGCGAGCCCAA
+CGGAGCACCGAGCTCTCCACCGAAGCGGGAATCGACCGCATGGCAATGATGATGCACCACCCCACCCACA
+TTGGATGGCCGATACCCACGCTTGGTTCCCGACCAGCCGATTAACCGCTCCCCCGCAACCTGGCGAGACG
+GTACTCGCCGCGTTCGGCGTCTGGGACGGTGTGCCGTGAGACCGGCTGCGGTGTAACGCCTTACGAACTA
+GTGAGCAGGGTGCAACGGGACGGCCGCCCACTCGTCCTGTCCAGCCCAACGGACGTATAGCTGATTTGGA
+AGGGGATGGCCCCAAGCCGCTATCAAGACCATGTTGAGCCCCTCTCCGGGGCGAATCACCGTCTTCTTCG
+GGACATTTCGAGTGATCGCATCGATTCGCGAGAGGTCAATCTCGACATCTTCTGCGATATCGTCGCCGAT
+GTTGCGCAACACAAAGCGGATTTTGTCTGGGTTCTCGACACGCCACCGGACGTTAGGTGCCTTACCGGAC
+CTGCCGACCGCCGGTCCCACCGCCCACGAGTACGCGAACTTGGCAGTCCCGGTATGCGGCCGACCGGGCT
+TTCGCTCCCAGGTCTCCGCAAACCTGCGCACCGCTGCCGCATCCCACACCGCGCCTCCACGCAAATCTGC
+CAACGGAGCGGGAAACCCTGCTGTCGACCTCAATTGGTGCACCCTCTGACGCGAAACCCCCAACTCATCC
+GCGATCTCAGCCGCAGACATCAACTCGGGCGTTGTGAACGCCTCAGCGCGCAGACGATGCTCTGGCTCGC
+TAATGATCTGCACAGCAATGGGACTCTTGGCTTGAACTACCGGCATAACCTCGCCAGCCATCTTGGCGAG
+CGCGTCGAACACACTCCAATCGCCGGGCGCATAGACCGTGACGTCAATGCCGTGTCCTGGGACCCGAGAT
+ACCAGTGCGTCGAAGCCCTCGAGCTGCGTCTCCCAGGCGTCCATGGTCTCCATCGAAGGGTCAGCATCAA
+ACGTGAAGGTGACGACCCAGTCGGCTGTCACTGTGCGCCTTCCTTCCTGTGCTGTGCCCGCCGTTCCTTC
+TTGCTCGGCGGTGGCCACGTCAGGCCCGCTTTCTTCAACGCGCCCAATAGGTCTCGCATCCGGCGGTACT
+CGTTGCTAGGTGTTGCCGGAAACCGAGCAATATAGACGCCCTGGGGGTTGTAGAAGCGGGTGTAGCCGCT
+GGCGTCATCCTCAACCGTCCATTGTTGCGATTGCGCCCACTTCGCGATCTTGATGATTGCGCTGTTCACA
+TCGTCTCCCCAACACTTGCGATGTGTCAAGAGTAATGGCAAGACGCGACATCGTAAAGGTTTTAGCCGGA
+CTCATTCGAATATTTGAGCGATGTAGCCAGTGAGTGGGTGCTCCGATGATCACGGCTTCGCGCGAGCTCG
+CCCCGGCTGGCCTCATGATCGCCGACCGGCTGGGCTTCACCCGGTCTCAGTGGTTCTCCCAGTCGCGAAG
+GAACACCCGAGTGTCGTCATGGTCCGCGCGGTTGGGCACTGCGGCCATCGGATGTCATCGTCGTACAACG
+AACCATGCGGTCGTTGCAGGGCGTGTATCAGGCGCTGTTGGTTGTCTGGCGTTCCTCGCGGCGCGCTTAC
+GCCTTGGCGTTACCGGCGCGCCACTGGTCCCACGGAATGTTCCAATCGCCGAGCCCGTCGATCCCCGGCA
+GGGTGCCACCCACGGTATTGACCACCTCGACGATGTCGCCGCGCTTGACATGGTCGTAGAACCACTGCGC
+GTTGCTCGGGCTGACGTTCAGGCAGCCATGGCTGGTGTTGGTGTGGCCCTGAGCCCCCACCGACCACGGC
+GCTGAGTGCACGAAGACACCGCTGTAGGAGATCTGGGTGGCCCAGTCGACATCGGTGCGATATCCGTTGG
+GCGAGTTGACGGGTACGCCGTAGGTGGACGAGTCCATGATGATGTGCTTGTACCGCGAGCCGACGATGTA
+TATGCCGTTGGCCGTCGGGGTGCTGTCCTTGCCCATCGACGTCGGCATGGACTTTACGACCTCGCCATTC
+ACCCGCACGGTCAGTATCTTGGTGTTGTCGTCGGCGGTCGCGATCACCTCGTCGCCGATGGTGAAGTGCG
+TCTGCACGTTGTCCTCGCCGAACATTCCCTCGCCCAAGTCGACGCCGTAGGTGTTGACCGCCACATCAAC
+GGCCGTACCTGGCTTCCAGAAATGCTCTGGGCGCCAACGCACTTCACGGTTATTCAGCCAGTAGAACGCG
+CCCTCCACGGGCGGGTTGGTGGTGATCTTGATGGCCTTCTCGGCCGCGCCCCGGTCAGCGATGTTCTCGT
+CGAATCGGATCGCCACCGGCTCGCCGACACCCACGACCTCCCCATCACCGGGCATGACGTAGGGCATGGT
+CAGGTGCGCGGGGGAACTGGTCTGGAAGGTCAGCTGGCGGGTCGCCGCGCCACCCAGTCCAAGCGCCGTC
+GCGTTCAGCGTGTAGCGCCTGTTGTAGCCGAGCTGCTCAGTGGTCGACCAGCGCAGTCCGTCGGGGCTGA
+GTCGACCGGCCACCGGCCTGCCGTTGTCGTTGACCATGGTGACGGCCGCCAGCACACCGTCGGCGGCGGT
+CACCGACACCGGTGCATCCACGGTGACGCCGACGGCGCCGTCGGTGACCGACGCGGTGAGCTTGGGCACC
+AGCAGATCGGCGAACGGCGTGCCCTTGTCCGCGATGACCTTGATCGGTGCGGGTCCGCGGCCGCTGCCGC
+ATGCGACGGCACCGATCATCACGGCGGTCATCATCAGCGCGGTTAACCAGGCTCTCCGAACCCTGGTCCT
+ACCCGCCTGAGCTGCAATCCCCACCTTTGGCATGCCTTCCCTCACCTCCCCCACTGCGTCGTGACCGAGC
+TAGACTCGGCTGTAGTCTAGGTTCTGACTGGCCGCCACGCTGCGATGCTGATACCAAGTTCAGTGTGAGA
+TTTCACGCGAGAGCGCAAGGCCTGTTAATGTGCCTTGGCTAGGTAATCGAGGCGCCGTTAGCTCAGTTGG
+TAGAGCAGCTGACTCTTAATCAGCGGGTCCGGGGTTCGAAACCCTGACGGCGCACAGGTCAACGCGTTAT
+TTCGGATGCACCAGCCGCAGCTGTCCCGTTGGGCGACGATTTCCGTATTCGGAAGGTGCACGCCGGTTAC
+CGGATTTGGGCAGCGGATCGGATCGGAGCCACGGGGATAGCTCGACGAGACAGCCGGGGAAGCCGCAGAA
+AATTGGGTTGTAGGCGCGTGCAATAGCTACGCTGCATGTGGACAGCGGGGAAGAGGTTAGTTGTGTCGCG
+TCTGATCGTGGCTCCGGACTGGCTGGCGTCAGCAGCGGCGGAGGTGCAAAGCATCGGCTCGGCGCTGAGC
+GCGGCGAACGCCGCGGCCGCGGCCCCCACCACCCTATTGGTGGCCGCCGCCGAAGACGAGGTATCCGCAG
+CGGCCGCAGCGCTATTCGCCAACTACGGCCGGGAGTATCAGACGCTGAGTGTGCGGTTCGCCTCGCTTGA
+TCAGCAGTTCGCGCAAGCACTGAACTCGGCGGCAGCGTCGTATCAGACGGCCGAAGCCACGGGTGCGTCG
+CTCGTGCAGACCGCGACACAAGGTGTACTGGGTGTGATCAATGCGCCCACCGAGTTCATGTTCGGACGCT
+CGCTGATCGGCGACGGAGCTGACGGCACGGCTGCCAGCCCCATCGGCGAGCCCGGCGGAATCCTGTACGG
+CGACGGCGGAAACGGCTACTCCCAGACCACGCCCGGAGCTGTCGGCGGAGCCGGCGGGTCGGCCGGATTT
+ATCGGTAACGGTGGCGCCGCCGGCGCCGGCGGGCCCGGCGCCGGCGGCGGGACTGGAGGCCTCGGCGGCT
+GGTTATGGGGCAACAACGGCGCCGCTGGCACCGGCGACCCAGTTAACGTTGCCGTCCCCCTGCGCGTGGA
+AAACAACTTTCCGCTGGTGAACCTCTTGGTCAACCGCGGGCCAACTGTCCCCATACTGCTGGACACGGGA
+TCCTCGAGTCTCGTCATCCCATTCTGGAAAATCGGGTGGCAGAACCTGGGCTTGCCCACCGGGTTCGATG
+TCGTTCACTACGGCAATGGCGTGAGCATCGTCTACGCCGACGTGCCCACGACGGTCGATTTCGGTGGCGG
+CGCCGCTACCACACCGACCTCCGTCCATGTCGGTATCCTGCCGTACCCGCGAAACCTTGACAGCCTGGTC
+CTCATCGCTTCCGGCGGCGCTTTCGGACCCAACGGAAACGGCATACTGGGCATCGGGCCGAATGTGGGGT
+CGTATGCCGTCAGCGGGCCCGGCAACGTTGTCACGACCGATTTGCCGGGCCAACTCAACGAAGGCACCCT
+CATCGACATTCCCGGCGGCTACATGCAGTTCGGCCCCAACACGGGCACTCCAATCACCTCCGTGACCGGG
+GCACCGATCACCGTGCTGAACGTTCAGATCGGCGGCTACGACCCCAACGGGGGCTACTGGTCACTCCCCT
+CGATTTTCGATTCGGGCGGCAACCACGGAACGCTTCCGGCGGTGATTCTCGGCACGGGCCAGACAACCGG
+TTACGCCCCGCCGGGCACGGTTATCTCAATCTCAATACATGACAACCAGACGCTGCTGTATCAGTACACG
+ACAACCGCGAGCAACAGCCCAGTGGTCACGGCAGACCCCCGACTCAACACCGGTCTAACCCCGTTCCTGC
+TGGGACCGGTATATATCTCGAACAACCCTAGCGGTGTCGGGACGGTGGTGTTCAATTACCCGCCACCGTA
+GCTTTCCGCCGGGTCCAGAACCGCCGCGCCATAAGGGCGTCACGTTCGTCCAGAACCTCGGCTAAGTGCG
+GAGTGCGCAATCATGGTGCACTGCAATGGGTTTCCCATCGGTAACTCCGGGTTGGTCAGCGATTCCTGAT
+CTTGTGGATGACCACGACGACGACCACAGACCCGATCCCGACCAGTGACACGGTCACGATGGGCTTCCTG
+AGGAAGGCGATCACCCGAGTTTTTGCGTCGTCGGCGAGGCGGCGGGGGTTGGCGCGCTCGGCGAGGGAAT
+CGATGGTCGCCGCCAGTTGGTCGCGGGTTTGGTCGATCTCCTGCTTGATGGTATTGGGATCGCGGTCCAC
+CACGTGCTGTCCTCCAAGTTCTCCAGTCGCCCACTGCCGGCCTGCGTCGCCCGCCGAACTACCCTAGATC
+AGTGACCAAAACCACGCGTCTGACCCCCGGAGACAAAGCCCCTGCCTTCACCCTGCCCGATGCCGACGGC
+AACAACGTGTCGCTGGCCGACTACCGAGGACGCCGCGTCATCGTGTACTTCTACCCGGCGGCCTCGACAC
+CGGGATGCACCAAGCAGGCTTGTGATTTTCGCGACAATCTGGGCGATTTCACCACTGCCGGCCTCAACGT
+CGTCGGTATCTCCCCCGACAAGCCGGAGAAGCTCGCTACGTTCCGCGATGCCCAGGGCCTGACGTTTCCG
+CTGCTGTCTGATCCCGACCGCGAGGTGTTGACGGCCTGGGGTGCCTACGGGGAGAAGCAGATGTATGGCA
+AGACGGTGCAGGGGATGATCCGGTCCACCTTCGTCGTCGATGAAGACGGAAAGATCGTCGTCGCGCAGTA
+CAACGTCAAGGCCACCGGCCACGTCGCTAAGCTTCGGCGCGACCTGTCGGTATAGCCGCGAGCTTGGCCA
+GCAGCAGCGCTTCGGCGGTCGCCGCGCGTTCCAGCACACCCAGATGCAGGCTTTCATTGACACTGTGCGC
+CTGCGTTCCGGGGTCTTCTACCCCGGTGACAAGGATGGTCGCCTGCGGGAACGCGGCGGCGAACTCGGCG
+ATGAACGGGATCGACCCGCCCATTCCCATATCGATCGGATCGGCACCCCACGCCTGCCGAAACGCCGACC
+GCGCCGCATCATAGACAGGGCCGCTCGCCTCGATGGCGTAGGGCTGTCCGACCTCGCCGCGCGTGACAGT
+GACCTGGGCGCCCCAGGGGGCGTGCCGCCGCAGATGGGCCTCCACCGCGTCCAGGTGCGCCGTGGCATCG
+CCTCCAGGCGCCACCCGAATACTGATCTTGGCCCGGGCCCGCGGGATCAGCGTATTGGACGCTGCCGCAA
+CGGATGTGGTGTCGATGCCGATTACGGTGATCGCCGGCTTCGCCCAGAGCCGCTGCGGCACCGAGCCCGT
+GCCGATTTCCGATACTCCGTCCAGTAGACCCGACTCAGCGCGTACCCGTCCAGCCGGGTAATCCACACGC
+GCCGCGGTGCTTTCGTGCATGCCCGCCACGGCCACGTTGCCGTCGTCGTCGTGCAGGCTGGCCAACAGCC
+GCACTAGCACGGTCAGCGCGTCGGGAACGACGCCGCCCCACAACCCGGAGTGCAGCCCGTGGTCGAGGGT
+GGCGACCTCGACGACGCAGTCGGCCATTCCGCGTAGCGACACCGTCAAAGCCGGGATGTCGGTGCTCCAA
+TTGTCCGAGTCGGCGATGACGATCACGTCGGCTGCCAGCGCGTCACGGTGGGCGGCGAGCAACCGGCCCA
+GTGACGGCGACCCGGATTCTTCTTCACCCTCGACAAAGACCGTGACGCCCACCGGCGGTCTGCCGCCGTG
+TGCCCAGAATGCGGCCACATGCGTGGCGATACCTGCCTTGTCATCGGCGGTGCCCCGCCCGTAGAGCCGC
+CCACCACGCTCGGTCGGCTCGAACGGCGGCGACACCCATTGCCCGCGGTCACCCTCGGGCTGGACGTCGT
+GGTGGGCATAGAGCAGCACCGTCGGCGCCCCCGGCGGCGCCGGGTACCGCGCGATCACCGCCGGCGCACC
+GCGCTCGCTGACAATCCGCACGTCGTCAAAACCGGCCTGCGACAACAGGTCTGCCACCGCACGCGCGCTG
+CGGTGAACCTCGTCGCGCCGATCTGGGTCGGCCCACACCGATTCGATGCGGACCAGCTCCTCGAGATCAC
+ACCGCACCGACGGCAACACCTCACGGACGCGCTCAACCAGCTCGCGAGCAGACGCAGAGTCGCATGAAAA
+TCCGGATTTCGATGCGATTCTGCGTCTGCTCGCGCTCACGGGGCCTCCAGGATGGCGACCGCGGCCGCGG
+TATCCCCTTCGTGGGTCAGCGACACATGGATCGTCACGTCGGCCAAATACTCAGCGATGGCCCCGGTCAG
+CCTGACCCGCGGCCTGCCCCACATATCGGTGACCACCTCGATATCGCGGTGGATGTCCTCCGGCAACACC
+GGCCGCTGCGCGAACCGCGATCCGGACCAGGCCTTGATCACCGCCTCCTTCGCGGCCCAGCGGGCCGCCA
+GGTGCCGGGCCGCCGACGAACTCTTGTCCGAGGCGTCCCGGCGCTCACCCGGGGTGAAGGTCTCGGCGAA
+CACCGTTCCGGGCTGGTCGACCTGCTCGGCGAAATCGGGAATGGAGACCAGGTCGATCCCCACACCGACG
+ATGCCCATGGGCGGCCACGTTAATCGATGGCCCAGTCCGGCGACGATGCGGTCCGCGTTGGGGGCACCTC
+CCGCTTGCGGGGGACGGACCGAAGAGATGCCGGGCAGTCAGGCCAAGGAGCACGCGGCGAGCGTGTATCC
+ATGGCGGCGACACGCCGAACACCGTCGCCCTGAGCGCACGTTCGGCGCCCAACGGCAGGGTCAGCCGATA
+TACGCCTCGCCGTCACCCAGCCGGGCCGCCGGATTCAGCAGCATCGACGCCTCCTGCGGCCGCTCGGGCG
+CGTGGTGGTCGAAGCGACGGTCACCGGGCCGCTGGTACATCGGCGCACCACCGGCAATCGCCGAGGCCAG
+CCGGCGCTGACCGGCCAGCAGGCGGGCGTCGGCACGCCGCTGGTAGTCCGCGCGCTGTGCGGGATCCAGC
+GAGGCGATGAACGCCTGCGGATGCACCAACGCGACCAGGCCCGACACATGGCCGAACCCGAGGCTGGTCA
+GCATGCCGGCCTTGAGTGGGAACTTGCCGCCGAGCCGCAACGTGTCACGCACCCACACGAAATGCGCGGA
+GCCGGCCAGCTCGTCGTCGACGCAGTCGAGGCTGCGGTTGGGTGGGATCACCCCATCCCGCAATATCTGG
+CAGAGCCCCATCATCTGGAAGACCGCCGCGCCGCCCTTGGCGTGGCCGGTCAGGCTCTTCTGCGACACCA
+CGAACAGCGGGGCGCCCTCGGAACGGCCCAGGGCGTCGGCGAGCCGTTCATGCAACTCGGTCTCGTTGGG
+ATCGTTGGCCAGCGTCGAGGTGTCGTGCTTGGAGATGACCGCCACGTCGTCGGCGGCCACGCCCAGCTTG
+GCCAGCGCCCGCGCCAGCGGTGAATCCTTGCCGCCGCGGCCCGCCCCCAGCGCGCCCAGGCCCGGGGCCG
+GGATCGAGGTGTGCACGCCGTCGCCGAACGACTGCGCGAACGCCACCACCGCCAGCACCGGCAGCCCCAT
+CCGCAGCGCCAGGTCCCCGCGGGCCAACAGGATCGTCCCGCCGCCTTGGGCTTCGACGAAGCCCAGACGG
+CGGCGGTCGTTGGGCCGGGAAAACTTCGAGTCGTGGATGCCGCGGCCGCGCATCATGGACGTGTCGGCGG
+TGGCGGCCATGTCACCGAATCCGATGATGCCCTCCAGCGTCAGGTCATCCAGGCCGCCGGCCACCACCAG
+TTGAGCCTTGCCCAACCGGATCTTGTCGACACCTTCCTCGACCGACACCGCGGCGGTGGCGCACGCGGCT
+ACCGGGTGGATCATCGCACCGTAGCTACCGACGTAGGACTGAACCACGTGCGCGGCAATGATATTCGGCA
+AGACTTCCTGGAAGATGTCGTTCGGCTTGTTGCGGCCCAACAGATTGCCGTGGTACATCGTCTGCATCGA
+CGTGCCGCCGCCCATGCCGGTGCCCTGGGTGTTGGCCACCAAACTCGGGTGCACGTAACGCATCACCTCG
+GCCGGGCTGAAACCGGACGACAGGAACGCGTCGACGGTCGCCACCATGTTCCATACCGCCAACCGGTCGA
+TGGAACCGGCCATGTCTGCGCTGATGCCCCACACCGTCGGGTCGAACCCGGTCGGGATCTGGCCGCCGAC
+GACGCGGGACAGCTTGGTCTTTCGCGGCACCCGGATCTCGGTGCCGGCCTTGCGGATGACCTGCCAGTCG
+GTGGAGTCGGGCACCGGCCGGATGACCGTGTGCTCGGGATCGAACTCGACGAAGGCGCGCGCATCGGCCT
+CCGAGGACACCACGAACGCGAAGTCCTTCTCCAGGAACACCGACACCAGCAGCGGCGAGGCGTGGTCGGG
+GTCGATCGCGCCGTCATCAACGAATTCGCGAATGCCGACGCGCTGCACCACGGCGTCGTGGTAGCGCTGC
+ACCAACTCGGATTCGTCGACCATTTCGCCGGATTCGGTGTCGTACCAACCGGGTTGCGGGTCGTCCTCCC
+AGCGGATCAACCCAGTGGTCCAGGCCAGCTCCAGCACGCCGGCCGCCGACAGCTCGTTTTCGACCTCCAT
+CTCGAACCGGGTGCGTGACGAGCCGTACGGGCCGATTTCGGCGCCGCCGACGATCACCACCAGGTCGGCC
+GGGTCGACATCGAGGTCGTCCCATTGCGGCGGCGGTGCGGGGGTGAAACCCCGGGGCGGCGACGGCAGCG
+CGGCGATGGCGCCAGGGGCCTCGGCGTCCTCGTCGACGGCCGCCGCTGCCGACATCTGCTCGCGCGCCTT
+GGCCGCCAGCTCGGCCATGTCGAGGTTGGCCTCGGCCAGGCCCCCGGTCAGGTCGGCCTTGATCGGCGAA
+CGCGCCGCAGCCACCTTGGATTCCGCATCACACAGGTCGAGCAGCAGCGCCGCCATCTCGTCGGTCGAGT
+AGGTGGTGACCCCGGCCTCTTCGACGGCGGCCACGATGGCATCGTTGTGGCCCATCAGCCCGGTGCCGCG
+GGTCCAGCCGATGAGCGCGTGCGCCAGGCTGACCCGTGCCGCCCAGGACGACTCGGCGTGCCAGCGGCTC
+ACCACGGCATCCAGCGCGGACTTGGCTTCGCCGTAGGCGCCGTCGCCGCCGAACATGCCACGGTTGGGCG
+AGCCGGGCAGCACCACGTGCAGCCGCGACGCGATGTCGCGTTCGGCGCCGATCGTCGACAGGCCGCCGAT
+CAGCCGTTGCACGGCCCACAGCAGCACTTTCATCTCCATCTCGGCGCGCGAACCGGCCTCCGACAGGTCC
+CCGACCACGCGTGGCGCCGCGAACGGGAACAGCAGCGTCGGGGTCTGCGCGTCTTTGATGTGAATCGACT
+GCGGCCCAAGGCTTTCGGTCTGTTCGGTGCCGATCCATTCGACCAGGGCGTCGACGTCGGAGTAGGACGC
+CATGTTCGCCGCGACCAGCCACAGCGCCGCGCCGTAACGGGCGTGGTCGCGATACAGCGTGCGGTAGAAC
+GCCAGCCGCTCCTCGTCGAGCTTGGAGGTGGTCGCGATGACGGTGGCTCCGCCGTCGAGCAGCCGAGCCA
+CCACCGACGCGGCGATCGAACCCTTCGAAGCGCCGGTCACCACGGCAACTTCGCCGCCGTAGCGGCCGGG
+TTCGGGGTTCTCGGCGCCGGCGGCGATGCGGCCGTACAGCGATGCATGGATCTGCCGGCCCGCGGCCAGC
+GACTTACCTTGCCACCAGGTAGCCTGGGTCGCCACGACGTGGCCGGCACCCTCGAAGCGCTCCGCCAGGC
+GCGGCCAGTCGGCGTCGATGTCGCCCTCGTCGGTCAGCCACAGCTTCACCAGGTCCTCGCGGGCGCTGGC
+CCAGCGGTCGTCGAATACGACGGCCTTCTTGGGGTCGAACACCGGTGCCACCAACCGCGGCCAGTCCGCT
+CCCAGTTCGGCGGTGACCAAGTCGATCAGCTCGGAATCGGGGGCGGCCGGCAAGGCGTTGACGGGGTCGT
+CCAGTCCCAGCTGCCCCAGCACCAGGCGGGCCGCGGAGGCCAGCACGCCCTCACGGCCGGTGATTTGGTC
+GGTGAACTCGCTGAGCGCGGCCGCGTCGATGGTGGCGCCGCCACCACTACCGGCCGACGGCAGCGCTACC
+GAAACGCCCTGGCGCGCGGCCACCGATGCGACCGCCGCGTCGATGACCTTGTCGACGGAGGCGGCATCGG
+CCAGCGCGCCCTCGTGCAGGTGGCCCATGGCGCCGCCGCGAACGCTGCTGCCCTCGCGGGTGCCCAGCGC
+GACCTCGACGGTGACATGCTTGGCCCAGCCCTCACCGAGCTCCCAGGTCTTCTTCACCCGCTCGGCGATG
+GCGCCGGGCCGCTTGCCCGACGGTCCGAGGACGGTGCGAAGCTGGTCGTTGATGGCGTCGGAAAGCACTG
+GGCCGTAAGGCTTGTAGGTGCGCGCCAGTTTGGTCACCTGTGAGCGCAGACCGGCCAGGTCCGATTCGGC
+GGCGCCGTCAATGGCACCGAGGTTCAGCTCGGAGCCCAGGTCCACCAGCAGCTGGTTGCGCCGCGACGAC
+GCACCGTCGGTGATGGACTCGATGGAGTCGAGTTCTTCGATCTGGTCGATGCGCATCTTGGCCGAGAGCG
+CGATCAGCGCCAGCGTGGCATCGGCGGCGTCGAAAACCAGATCGTCGGGACGCGGGCCCGCCGACGAAGC
+GGCCGGCGCGACGGGGGCGGCTTCCGAGACGACGTCCGGCGCGGGCGATTCCGCGACCGGCTCGTCTTCC
+TCCGGCTCCGGCTCCGGGTCGGTGTCGGTGGCGAACAGCACCGCGGCATCACGCTCGGCGTTGAGCACTT
+CCACTGTGCTGTGGGCGTATTCGGGCAGTTTGAGGGTGTTGGTGGCAAGACCCGCCACCGTCGGTGAGCT
+CTTCACACCGATCTCGACGAATCGCTCCACACCCAGCCCGCCGGCGGCCTCCTCGATGAACAGCAGATCC
+TGCGTCTCGATCCAGCGCACCGGGCTGGCGAATTGCCATGCCAGCAGCTCGATGAACACCGTGCGCGCCA
+TCTCGCGCGGACGCTCGCGAAGCCAGGTGTCGTAGTCGGCGAGGATCTCGTCGAGCGGCTCGGCGGGCAC
+CAAATCCCGGATTTCCTGGATGAAGTCGCGGTCCAGGGTGAACAACCGCGGCACCAGGTTGGGAATGTAG
+CGCCCGATGATCAGGTCGGGGTCCGCGTCGCGCGGCATGACCCGGTCCAGCGAGCGCCGGAATTCGGCCA
+CCCCGACCCGCAGCACTCGCGAGTGGAACGGAACATCGATGCCGGGCACCAAAATGAACGACCGTCGGCC
+GCCGGTGAGCTCGCGGCGCCGCTCCACCTCGGCCTCGAGCGCCTCGAGGCCGCGTACCGTGCCCGCGATC
+GCGTATTGCGAGCCACGCAGGTTGAAATTCACGATCTCCAGGAATTCACCGGTGCTCTCCGCGATCCCGG
+CGACGAACGCGGGCACGTCGGCGTCGTCGAGGTCGATCTGGGACGGCCGGATGGCCGCCAGCCGATAGTT
+GGAGCGGCCGAGCTCGTCGCGCGGAACGATGTCGTGCATCTTCGACCCGCGGTGAAACACCATCTCCAGC
+AAGGCTTCCAGTTGGTAGATGCCGGTCACGCAGGCCAGCGCGGTGTACTCGCCGACCGAGTGGCCGCACG
+CGATGGCGCCTTCGACGAAGGCTCCCTGTTCACGCATCTCGGCGACCTGCGCGGCCGCCACCGTCGCCAT
+CGCGACCTGGGTGAACTGCGTCAGGTAGAGCACCCCGTCGGGGTGGTGGTAGTGCACACCGCTGGCGATG
+ATGCTGGTCGGGTTGTCGCGGACCACGTGCAGTACCGAGAAGCCCAGGGTGTCGCGGGTGAACTTGTCCG
+CGGTGTCCCACACCTTGCGGGCCGCCTTGGAGCGGGCGCGCACCTCCATGCCCATGCCCTTGTGTTGGAT
+GCCCTGGCCGGGGAATGCGTAGACCGTCTTGGGTGCGGCCAGTCGCGCGGAGGCCGACATCACTAGATCC
+GACCCGACGCGCGCGGCCACGTCCACAATCTCTGCGCCCTGGTCGATTCCGACGCGCTCGACGCGGAAGT
+CCACCTCGTCGCCGGGGCGCACCATGCCCAAAAACCGCGCGGTCCAGCCGACCAGCCGGGCCGGTGGCCG
+GGCCTGCCCGTCGGTGGCGGTCACCGCGTGTTGCGCCGCGGCCGACAGCCACATGCCGTGCACGATCGGC
+GACTCCAGGCCGGCAAGCAGCGCGGCGGCCCGGTCGGTGTGAATGGGGTTGTGGTCGCCGGACACCACCG
+CGAACGGGCGCATGTCGACCGGCGCGGTGATCGTGACGTCGCGGCGGCGACGGCGCGGGGTGTCGGTGGC
+GTTCGCCGACACCGCGCCACCGGCTCGCGCCGGGTCGGCGAGCTCGGCGGAACCGGTGCGACCCAGGATC
+GCGAATCGCTCCTCGAGAGTGGCGATCACGGCGCCATCGGCGCCGGTAACGACGACCGAGACCGGCACGA
+CGCGGCCCATGTCCGTATCGGTTGCGTTGGCAGCCGTTGCGGTGACGGTCAATTGGGCCGGGACCGTGGG
+CAGCTGACCGACCACGCGGGCGGCGTGGTCCAGATGCACCAGGCTCAGCAGGCCTTCCACCACCGGCTCA
+CCGGTGTCGGTGACCGCCGATCCGATGGCCGCGAAAACCGCTGGCCAACAAGGGCCGACGAGCGCGTCGG
+GCACGTTGGTGAGGCTGGGTGCCAGCGGCTCACCGAACGTGGCGGTGACGCCGGTGTGGTCGGCAACACG
+CTCGGGGTGCCAGTCCACCGTCAAAGTGGCCGTCCCGTTGGCCACCGCAGGCAAGAACTCCGGGCTGTCG
+ACACCGGCGGCGATCGCCAGCACCGTGCGCATGGCGCTGGTGGCGTCCTCGGTGGCGATCACCGGGGTGC
+CGCCATCGACGGTGTTGGCCGGCAACGTGAATCGGATGTCGACCCAGGTGCCCGAGACGGGCACGCTCAA
+GGCGACGTCGTCGCCGTGCGTCTGCAGCCGGGCGCCGGTGGATGAGTGTGTGGCGCGCGGGTTTTCGGGT
+CCATCGTGCACCTGCCATTCGGCCGGGTCGGCGATCCGATGCACCGGGTTGGTCACGGTGCGACCGGCCC
+AGCGCACATCGGGTGCGTCGAGGACGACAGCCAACGGTCCGGCCACGTCGGCGCGGCCCAGCCGGCGCGA
+CGCGACATCCTTCGGCTCGACACCGGCGCCGAGCACTTCATCGATTGCGGCTTGCTCGAAACGGTCCAGC
+AACTCACCGACGGGTTCATCCATCCGGGTGATGCCGGCTACCGACGCGGTGCCCGGAATGATGCACACCG
+CATCGGCGTCGTAGCGGGCGTCGTGGGCCTGCCACAGCGAGTCGCTGCGCCACCAGCGCCGCACGTCCTG
+GTCGATCACCGGCACGAAGTTGACCGGCTTGCCCAGCGTCTTGCACAACGTCACGAAAAAGGGCACATCC
+GCGGGATGCAACTGCACGGTCTCGGCGTCGGGGTAGCGCGCCAGCAGGGCGGCGATCGCCTGCTGCGGAT
+TGTCCAGCAGGCCAGCATCGGTGAATAGCGTCTGGATCGGGCCGAAATCCTGTGGGTGCAACCGGGCTTC
+GGCACGCTGCAGCATCTGCTCGAAGCGGTCCCGCCAGGTGTCGGCCAGCCACGGGCTGCCCACCGAGGCG
+GTGTCGGCGGTCGAGTTGCCTTCCCCGATGGCCAGTTCGACGTAGCGCCGCAGCCACTGCAGGTAGGTCA
+TGTCGGCGACGTCGCCGAAGTAGGGCTTGGCGGTCTTGGCCATCGCCGCGATGATCTCGTCGCGACGCTC
+CGCGACCGCCTCCGCGTCACCGGCCACCTCGTCGAGCAGCCGCCCGCACCGGGATGCGCTGTTGTCGATC
+TCGTGGATGTCGGCACCGAGCTGACTGCGGCTGGAGGCCATGCCGCCCTGCGCTTTTCCGGCGCTGATCC
+ATTGGTCGGTGCCCTGAGTGTCGACGAGCATCCGCTTGACCGATGGCGACGTGGTGGATTCCTTGGTGGC
+CATCGCCGCGGTGCCGACCAGGATGCCGTCGATCGGCATCAATGGGAAGCCGTAGGCCTGCGCCCAGCGC
+CCGGACAAATATTCCGCAGCCCTTCTCGGGGTGCCAATGCCGCCGCCGACGCACACCGTGATGTTGGCGC
+GTGAGCGCAACTCCGAGTAGGTAGCCAGCAGCAGGTCGTCGAGATCCTCCCAGGAATGGTGCCCGCCGGC
+GCGCCCGCCCTCGACGTGCATGATCACCGGCTTGGTGGGCACCTCGGTGGCGATGCGAATCACCGAGCGG
+ATCTGCTCGATGGTCCCGGGTTTGAACACGACGTGGCTGATGCCGATGTCGCCCAGTTCGTCGATCAGCT
+CGACGGCCTCGTCGAGGTCTGGGATGCCGGCGCTGATCACCACGCCGTCGATCGCGGCGCCGGACTGGCG
+GGCCTTCTGCACCAACCGCTTGCCGCCCACCTGAAGCTTCCACAGGTAGGGATCGAGGAACAGCGCGTTG
+AACTGATAGGTGCGGCCCGGCTCGAGCAGGCCGGCCATTTGTTCGATGCGGTTACCGAAGATCTCTTCGG
+TGACCTGCCCGCCGCCGGCCAGCTCGGCCCAGTGCCCGGCGTTGGCCGCCGCGGCGACGATCTTGGCGTC
+CACGGTGGTCGGGGTCATGCCCGCGAGCAGGATCGGCGAGCGGCCGGTCAGCCGGGTGAACTTCGTCGAG
+AGCTTGACCCTGCCGTCGGGGAGGCGAACCACGGTCGGTGCGTAGCTCGACCAGGCCCGGGCAACCTCGG
+GGGTGGCGCCGACGGTGAACAGGTTGCGCTGGCCACCGCGGGTAGCCGCCGGCACGATGCCGATGCCCAG
+GCCGCGGATCACCGGTGCGGTCAGTCGGGTCAGGATGTCGCCCGGCCCCAGGTCGAGGATCCAGCGGGCG
+CCGGCCGCGTGGACACGGGTGATCTCGTCGACCCAGTCGACCTTTCTGATCAAGATGGCATCGGCCAGCT
+CCCGAGCCAAGGCGACATCGAGGCCCGCCTTCTCGGCCCAGCCCGCGACGATGTCGATCCCGTCGGATAG
+CCGCGGGGTGTGAAAGCCCACCTCCACCTGCACCGGCTCGAAGACCGGCGAGAAGACGTCGCCGCCGCGG
+ACCTTGTTCTTGCGGTCGGCTTCTTCCTTCTCGGAGATCTGGCGGCAATAAAGCTCGAAACGCGACAGCT
+GCTCGGGGGTGCCGGTGATGACGACGGCACGCCGGCCGTTGCGGATGGACAACACCGGTGGCAGCACCGT
+GCGCACGTCCTGGGCGAACTCGTCGAGCAACCGGCCGATGCGCTCGGGGTCGGCGTTGGTGACCGATACC
+ATCGGCGGGCGATCGCCCAGGACGGAAATTCCGCGCCGGCGGGCCACCAGCGTTCCGGCGGCACCGATCA
+ACTGGGCCAAGGCAAACAGCTCGACGTCGCGTGCCCCACCAGCCTTGAGGGCTTCCACCGCCAGCACACC
+TTGCGAATGCCCCGCCATGGCGACCGGCGGGGTGGCCACGAGGTCCATGCCTTGACGGGCCAGCGCCCGG
+GTCGCCGCGATCTGGGTAAGCAACACGCCGGGCACCGACACGGCGGCCGACGTCAGGTGCTTGTCGGACG
+GAACCGGGTCCTCGGCCGCCAGTGCGCGTACCCATTGCAGCGGCTCGAAACCGATCGGGCGCACCACAAT
+CAGCTCGTCGGTGACCGGATCGAGCAACAGCTCTGCCTCACCGACCAACGTCGCCAACTCGGTTTCTATC
+CCGGTGGCCGACACCAGCTCTTCGAGGGTTTCCAGCCAGGCGCTGCCCTGGCCACCGAATGCGACAGCGT
+AGGGCTCACCAGCCATGAGGCGATCGACCAGAGCGTGGGTGGTATGCGGGCTGTCCCCGCCGCGATCAGC
+GGACACCCGGTCGTGCTCGTGGATCGTCACGGTCTATGTCTCCCTATGTGCATCGGTACGTGTCAGTTCG
+TACAGCGGCCCAGGCTGCCGTGCGGGGCATCCCCGACTCCGCACCGACTCCCAGCCGAAATCCTCTGACC
+GGTGTGTTGTCGGTGGGCCGGCCCGTGGGTCGAGCAGCGCGACGGGCTGCATCGGCCTTATAAGAGTCTC
+ATAAGGATCGGTCCACCTTGTTTACACAGATCGGTTACTGGCGAGTTCTACGTACGGGTAACCGTGTCGT
+GGGTAACGCCGGGTTCGACGGCCGGCGCGTATGTGTTGACCAAACGTCCTGCGTGCAGGTGGTTACGGTG
+GAGTAGCTATAACTGCGCTGATCAAGGCAGTTTTGTTATCAAATCGTTATGCTGGGAATTCGCTCTACGC
+CGGGCGCGTGCCGACGCGCCGACCCAAAGGCCGCGCCATTGGCGGCGTTGGCCCGGGGTTGGCAATGCCG
+TGCAGCGGGCGAACGAGTGTTTGCTGTAGTGCAGCGGGGGCCAGGCTCGGGGCGGCAGGCTAAGCCCACT
+GCCCGAATTGGGGCTTCAGGATTTGGTTGACGTCCACCCCGACCCCACCAACCTTGCGCTTATCGATCTC
+CACCTGGTGCAGATGCGCGGCCGGGTGGGTGTATCCCTTGGGCGAGCCCCAGTTGTGCTGCCAGAAGTAC
+GAGCCCAAGCCATCGTTGACGGCCCAGTCGATGGTTTTGGAGTTGGCGTACACGCCGGTCCGCTGGTGTC
+CGATCACCGACTCCCAGGACCGCAGATATGGCACGATCTGGTTCTTGTACTGCTCATATGATGGGTTGTC
+GTCGATCGAGGCGTAGATCGGGGCGCTCGTCGGGCCGCCGGCAGCGGCATGCAGCTCCGACCCCCGTCTG
+GCGTGCTGCACGCCGGCGCTGGCACCGCCCAGCCAGTCGGCAGTGCTCCCCTTGCCGTATTGATAACAGG
+ACACGATCTTGAGCCCATTGCCGCTCAGGTCACGGGCCTCGCTGAGCTGGATCGGCTTGCCAAGCATCCA
+GGCGCCGCCAGGCCGCCGATCGGACACGTACCGGATTGCCCCCACCGCGCCGGCAGCCCTGATCTGGCTG
+GCGGGGATGACACCGGCGGCGTAGTCCAACAGGGTGCCCAGCGAACCGGCCGATGCCGGCGCGGCGCGCA
+ACGACGACGCAACGACGCCAAGACCCAGCACGCCCGGAGTCGCCGCCGCGAATTTGAGCACATCACGCCG
+AGAGACCGACATATGCCACAGGGTACGACAAAAACAACAACTGTCACACTGGTTTCAGTGGTCACGGATG
+CATCACACTGGCAGAACACATGCATGCGGCCATACCGACACCGGTGCGGTCTCGGGCAGGCCGCCTCTCC
+CTGCGACCACTACTACGGTGTGATCGCCTACGCTCCCAACGGCGCAATGGGCAAAATCGTCGCGCCACCG
+CACTCGAGGCCAGGCGGATATCGACGCATAAGAACTTTGCGGCGTCTTAGCTGCAAAGTGCTCAGCAACT
+TCACCAACTACCACGGGGGAGTCCGACGATCGCGCCCGCTGGCAGAACCTGGACGTGCAACCAGTTGAGT
+AGTTCCCACACTGCGCGCCGAGCGTGGGCTGGCTGCGCCGAATGTGCACTGGTGGCGGCGACACGCCCGG
+GCGACGCCGCCGTGGTTGCACGTTCGGCGTAGGCAGCCCCGTGCGCTTGCCGGGCAGGTGTCCTCAAAGG
+TCCAACTAGACACACATATCAGACACTAGTATGTACATATGACCGTAAAGAGGACCACGATTGAGCTGGA
+CGAAGATCTTGTGCGGGCAGCCCAGGCCGTCACCGGGGAAACATTGCGAGCGACGGTCGAGCGCGCGCTG
+CAGCAGCTGGTGGCCGCGGCTGCCGAGCAGGCCGCCGCGCGCCGGCGGCGGATCGTCGACCATCTCGCGC
+ACGCCGGCACTCACGTGGACGCAGACGTACTGCTCTCCGAGCAGGCGTGGCGATGACCACCTGGATTCTG
+GACAAGAGTGCCCACGTGCGACTCGTGGCCGGCGCCACGCCGCCAGCCGGCATCGACCTCACCGACCTCG
+CCATCTGCGATATCGGCGAACTTGAATGGCTGTATTCAGCACGGTCAGCTACCGACTACGACAGCCAACA
+AACGTCACTGCGCGCCTATCAAATCCTTCGCGCACCCAGCGACATCTTTGACCGGGTTCGCCACCTTCAG
+CGCGACCTAGCCCACCACCGTGGGATGTGGCATCGAACGCCGCTTCCGGACCTATTCATCGCCGAAACCG
+CGCTTCATCACCGGGCCGGCGTGTTGCACCACGACCGTGACTACAAACGAATTGCCGTCGTACGGCCTGG
+GTTTCAAGCATGCGAACTCTCTCGCGGGCGCTAGCTTCGCCCGAATCCGTGAGCGGAGGCGATAATCCTT
+ACAGGCCATCAAAAAAGTCCTCGTCGAGCCGTAAGAGTTCGACGGTCTGCACCGCCTGGACACCGACTCG
+ATACCGCACGAGCAGCTCGGCCAGCCGAGCGCCGTCGATGAGTTCGATCCGGGCGTTGATCCGCTCAGCT
+TCCTGGCGGGCACCGCGGGAAAACGATGACGTGGTGATGTAGACGCCCCGGTCGCCCTGCTTGCCCAGGA
+GGGCGCCGGCGAACTCGTGGATCTTCGGCCGGCCAATCGTTTGGTCGACGGCGTATCGCTTGGCCTGCAC
+GTAGATGCGGTCCAGCCCGAGCGGGTCCTGGCTGATGATTCCGTCGATGCCAGCGTCACCGGAGGCACTC
+GTCCGTTCCACCGCGCCGGCTCGCCCGTAACCCATCGCCTCCAAAAGTCTGATAACCAGATCTTCAAACC
+CGGTGGGCGACAACGTGAGTGCCTTCTTCAGGATCTCCCCCTCGACGGCTGCCCGGTTCTCCGCAAGCGC
+AGCGTCGATGAGATCCTCGGGTGAGACCTGCACATCGTCCCCGGACGGTCGCTTGGCGGTCGCGTCGACT
+GGCTGCTTGGCTTTGGTTCGCTCACGAAAAGCGATGTACGACGGGAACTCCCGCAGCACAGCCATGTCGA
+CGCGCTCGGGATGCGCCTTCAGGACTTGACGGCCCGTGTCCGTGACCTGGACGTGGCCCCGCGTGGGACG
+GTCGAGCAATCCGGCCTGCGACATGTGAGTGAGAGACCAGTGCACCCTGTCGTACATGGTCCTTTGCCGA
+CCGCTGGGCAACATCTGCGCCCGCTCGTCGTCGGACAGACCGAACTCGTCGGACATCGCCGCGATGACGT
+CCTTGGCCGACTTCGCTTGTCCATCGGCAAGATACGCGAGAATCGGCCGCATCAACGTCTGGGCATCAGG
+GATCGTCATGGGGAGCCATTATCCAGCTGGCTTGTCAGCCCTCCGAACCGGCCAAGTTGGGTAAGTCCAT
+CCGGGGCTCCGTGTTCTGACAGGCCCGCTGCAGGCGTCGCATCTTCCTCATCTGCCCCACGTGTACCCGG
+TCCCGCCGACCTAAAAGGTCGGCATATCCCTGCCATGCCGGGACGCGTGAGGCGGGTGAGACACAAGGGA
+ACGTGCACCTCGCGCACCGGGTCGCCAGCAGCCGCGACACGCCGTCGTCCAGTGCCACACCGAATGCGGT
+GTCGGGCTCGGCGTCAAACGCTGCCGATCGGCCTTGCCTCGTCAGGCCGCCGACAGCACCGCCCTGGGCT
+CACGGTCCGCGGCTCCGCCGGGATCCGACCGGCGGCGGCTCAACCCCCTCGATCGTCTTGAGCCGGTCGA
+CAGACCGATCGAAAGACGGCCACCGGATCGTCCCGGCAGGGGCGAGGAAGTCCGGCGTCCGAGCAAGCAC
+CGAGCGATTGCCCTCAACGCGGAAGACAACCCGATCACCCGATTGCAGGCCGAGCGCGTCGCGCACCGCT
+TTCGGAACCGTCACCTGCCCCTTCGACGTGACGATGGGTTCGTCGGAGTGCCTGCTTCACCGTTGCCGTA
+CGCCGCCCGTACCCTCACACTCTGTGGAGCTGCTCGTCGCCGCCAACCCCGCTGAAGACTCGCGCCTGCC
+CTACCTGATCCGGCTGCCGGTGGGCGCGGGACTGGTCTTCGCCACCTCAGACGTGTGGCCGCGCACCAAG
+GCGCTGTATTGCCATCGCCTCGACATCGCCGACTGGCCCGCCGACCCCGTCGTCGTCGACCGGGTCGAGC
+TACGCAGCTGCAGCCGCCGGGGCGCGGCCATCGACGTCGTCGCCGCCCGCGCGCGGGAGAACCGATCGCA
+ACTGGTGCACACCATGGCGCGCGGCCGCCAGGTGGTGTTCTGGCAGAGCCCCAAAACGCGCAAACAGTCG
+CGGCCGGGCGTGCGCACCCCCACCGCCCGCGCCGCCGGCATCCCCGAGCTGCACATCGTCGTCGACGCCC
+ACGAACGCTACCCCTACACCTTTGCCGACAAACCCGCGAAGACGACGCGGGAAGCCCTGCCCTGCGGCGA
+CTACGGCCTGAAAGTGGCCGGCCAACTCGTGGCGGCCGTCGAGCGTAAAGCGTTGGCGGACCTTACTTCT
+GGCGTGCTGAACGGCAACCTGAAATACCAACTGACCGAACTGGCCGCGCTGCCACGGGCCGCCGTGGTGG
+TCGAGGACCGCTACTCGGAGATCTTCGCGCACTCCTTCGCCCGCCCGACGGCGATCGCCGATGGGCTGGC
+CGAATTGCAGATCGGCTTTCCCAACGTGCCGATCGTGTTCTGCCAAACCCGCAAGCTCGCCCAGGAATAC
+ACCTACCGCTATCTAGCCGCCGCCCTCACCTGGTTCGTCGACGATGCCGACGCCACCACGGTTTTCGAGC
+CGGCTGCCGCCGAGCCCGAGCCCAGCAGCGCCGAGCTGCGCGCGTGGGCCAAAAGCGTCGGCCTGCCGGT
+GTCCGACCGGGGGCGCCTGCGCCCGCAGATCCTGCAGGCCTGGCGAGCCGCCCATCCCCGGTGACTACAA
+CACCTCGACGAGGCCTGCGGATGCTGAATCGGCCAGTGCGGCATCGAATGTGACCAACCGGCCCCCGTAG
+CGCGCGGCCAAGGCGATGAGATGGCAGTCGGTGACCCGACGGTGGTTGGACACCGCATCGCGATCGCCGG
+CGCTCCCAACGATCAGTGGCACATCGTCAGGCCAAAACGTGTGCCCGGCAAGAGAAGTCATCGCCGCCAA
+CTGAGCGATCGCGATAGCCGGCGTGGTCGACACCTGCATCACACTGCGATTGCTTGAAATTCGGACATAC
+CCTGCCTCGGTGATCGGCGTGGTGGCCCACCCATTCGAGGAGAACTGCGTGAACCATCGCTGCGCGGCCG
+CATGGTGAACGTGATTCGGCCAGCCCAGCGCGATCAGCACATTGACATCGAGCAGTGCCGTCACACGTCG
+TCCTCGAGCGCGCGGACGACATCCTCGGAAGTCACCGTCGGCGCATCCGGCGGAACATCAAAAACCGGAA
+ATCCGTCAACCTCGACAATCCCAACCGGACGGAGCGACCTACGCGCCAACTCAGAAATTACCGCGCCGAC
+TGACTTGCCCTCCGACCGCGCGATGCTACGAGCATCTTCTAGAACATCATCATCAATCTGCAACGTGGTG
+CGCATAGCATCATGTTACGGGGCTTGGGCCAGCTTTCACGCGTCTTCGGCGACCCCCTGCAGCACACTGT
+CGCCGTTGACGGTGCCATTCAAAGCCGAAGCGTCCCGCGGTACCTCGAAGGCCGGCAGCGCGGCACCTAC
+CGTGGCGACGGCGTTGCGCGCGGCCTCCATCCGGGCCAATGCCGCCTGGGTGAACACCGACAACCCCAGG
+TCGGGGTTGTATCCGTGGATCTCTTTGACGTCGAGCTGGGCAAGAAAGTAGATGATCTCCTTGGAAACCA
+GTTGACCCGGCACCAGTACCGGGAAGCCGGGCGGGTAGGGCACCACGAACGTGGTGGATACCAGAGTCTT
+GCCCTCGGCCAGCCGGCGCCCGGCCAAGCCGATCTGCACGTACTCACGGTCGGCCTCTTCGTAGCCGGCG
+TAGAAAGCCGACCGCATGTCACCGAAAGAGCTGGCGTCGTCGGGGCGGAAGGCAAGGTCGAACTCGCTGA
+AATCTGGTAGATGCGGCAGATCCTGCGTGATCTCCTCGACGTGGCGTCGGTGTAGAGCAAGGTCGGCCCC
+GCTGGCCGCCTTCTGGCTGCGGTCCAGATCGATCGCCACCCGACGCAACACATCGAGCAGATAGTGCACG
+CTCGACCAGGTGACGCCGATCGTGAAGATCAGCAACACGCTGTTGATAGACGTTTTGTTGATCTGGATGC
+CGAATCGCTCCATCAGGATCTTCTCGCGGAAGTCGTACCCGTTCATCCCGGTCGCCCCGATAAACAGGGT
+GAGCCGCGTCGGATCGAGCACGAATTGATCGGACCGCCAGGCTTCGTTCCAATCGGCCAGAGCCCCCTGC
+CTGACCTGACGGTACGAGCTGACCGTCGAGGACCGAAAGGCATCGGGAACCAGGTCGGACTCGTCAAGGA
+TGCGGAACCACTTGCTGATCAGCCGGTCTTTGCGGACGCGATGGCGGAACACCAGCGCCATGTTGTAAAC
+ATGGCGGACCAGCTCGAACCCTTCGATGTCAACCTGTCGGCGCGCCAAGTCCAACGAGGCGAGAAGTTGC
+TGGTTGGGCGAGGTCGAGGTGTGGGTCAAGAATGCCTCACCGAACGCGTCCCGGGTGAGCGCTTTGAAAT
+CCTGGTCGCGCACGTGGATCATCGATGCCTGCCGTAGCGCGGACAGCGACTTGTGAGTCGAATGCGTCGC
+ATACACTCGGACCCGAGCGCGGTTGGGGTCTGGCAACAGCCGGTGATCAACCCACTCGGAGCGGTCCACT
+CCGTCCATCGACGCACACCAATTCCGGTATTCCTCAGCGTATTCCGCAGTGGACAACATCTGCTCGAGTC
+GCTCGGCAGCAATCATCGCGGTCCGCTGCCGGGCCCAGGGCACCGCCGTCGCAAACGCATACCACGCCTC
+GTCCCACAAAAAGCAGATGTCCGGTTTGATCGCTAGCACCTCCTCCATCACCCGGCGCGGGTTGTACACC
+ACGCCGTCAAACGTGCAGTTGGTGAGCAACAGCATGCGCACCCGGTGCAGCTGTCCGGCGGCCTCGAGGT
+CCAGCAGCGCCTGCTTGATGGTGCGCAACGGCACGGCACCATAAATCGCGTACTGCGGCAGCGGATATGC
+GTCGAGGTACATCGGGTACGCGCCGGCAAGTACCAGGCCGTAGTGGTGCGACTTGTGGCAATTGCGGTCG
+ATGAGCACGATGTCGCCGGGGCGGGTCAGGGCCTGCACGACGATCTTGTTGGCGGTCGATGTTCCGTTGG
+TGACGAAGTAGGTCTGGTTGGCGTTCCAGGTCACCGCGGCTTTGTCCATCGCCGTCTTGATGTTGCCATG
+CGGGTCCAGCAGCGAGTCCAGTCCACCAGAGGTTGTCGAGGTCTCGGCCATGAAGATGTTGCGGCCGTAG
+AACTCGCCCATGTCGTGCAGTGACTTGGAGTTGAAGATGCTGGCGCCGCGCGCGACGGGAAGGGCATGAA
+ATTGGCCGACCGGCGCCGCCGCATAGGCCCGCAGCGCATCGAAAAACGGTGTGGCATAACGGTTTCGTAA
+ACCCGCGAGCACCGTGCTGTGCAGGTCGGTGACGTCGTTGAGCCGGTAGAAGGTGCGGTCGTAGACGTCG
+GGCTCGTCCTGGGTCTCGGCGGCGATCGACTCGTCGGTGAGCAGATAGAGGTCGATGTGGGGCCGCAACT
+CACGGATCCACTCGGCGCATTCCACCCAGTCGTGGGTCTCGTTTGCCACCGCTTCGTCGCCATCGGTGCC
+CAGCAGCGTGGTCATCAGCGGCACCCGGTCGCGGGACCGCAGCGGCAGGTCGTGACGGATGATCGCCGCC
+TGAATCTCGCCATTCAGCGCCACCGCGGTGATGGCATCTTCGATGCTGGCCACCACGAGCAACTCGAACT
+GCACCTCGTCGGCCGGATTGCGCAACTGCCGCAGGCACTCGGCCAAGCTGTCCGGAGCCGTCGCCGGGGA
+GTCGTCGGCGAGCAGCACGGTGTAGAACTGCTGCTGTTTGGCCTGCGCTACCAGCTCCTGCTCCGCCAGT
+GACGCGGAGGTGTCGAACAGCGCTGTGCGGTCGCCGTATTCGGACAGCAGTCGTACGGCCAACGACACTT
+CCTCGGTAAGCCGCACCGTGGAATGACTATCCAGATGAGCGCGGAAAGTCGCCAGATTCTGTGCCCCCGG
+ATACAGCCAGTACCGCTCATAGGCGCCGATGCGGTCCATCAGCCGCTTCGCCCGAGCCACGTCGTGTGTG
+GTATCGAGCCCGGCGAGGTCGACCTCCGCCAGGTGACGACACGCGTCATCGAGCAGGTTCCAGGTGTCCA
+GGCGGGTGTAGGACGGGTTGGCCACCGCGGCCAGCGCGGAGACATGCAGCCGTCGCGGGCGGACGCTGTT
+TGGGTTCATGTCGTCACCTGTTCTCTGGTGCGGGTAGCGCCGTAGAGTGCAACCAGGCAATTATCGCGCG
+CAGGACCGGGTCAGTCAGCTAAGTCGTCGCTGTCCGCGATCCGCCGATTAGCCCGATTCCCGGAGTTGTC
+CACCCAGCGCAGCACCGGCAGCTGCGAAAGCTCCCGGCGGCGTGCCGGCAGATCGGTGACGTCACCCAGC
+GAGCGCACCACGGCCTGCGTCAGGCCCATGATGGCGGCCATCACCGGTAGCAGCGGCTGCAACGGCTTTG
+CCGCCGTGCGAACAGTGCTGATGCGGCGTGCCAAGATCAGGCGTTCGATCGCGTGATACAGCCAGGCGCC
+GACACCCAGCGCGTAGATCGACATTGCCGAGGCGACAATGGTCAGCCCGTAGGCGGCGCACACCACGGCA
+CCGAGCACCACCGTCGCAGCCAGGACGGCCGCGACCACGACGCGCAGCTCGAGCCGGGTCATCACGCCCC
+CCCACGCACCGCTTGAGCGGCCGCACGCAGCTGCGGGGTCACCAGCATGACCTGGCCCAGCACCCCGTTG
+ACAAAGCCCGGCGAGTCGTCGGTCGACAGCTCCTTGGCCAGCTGGACGGCCTCGTCGACGACCACCGGCT
+CCGGCACATCCGCCGCGTGGAGCAGCTCCCATACCGAGACGCGCAGAATGGCGCGATCCACGGCGGGCAA
+CCGGTCCAGCGTCCAGCCCCGCAGATGCGCGGTGATCAGGTCGTCGATGTGGGCGGCGTGTTCACTGACC
+CCTCGAGCCACCGCGGCCGTGTACGGATGTAGCCGGGCAATGTCGGGCTTCGCTTCGGCCAGCGCGGCAC
+GGGTGTCGACCACCTCGGCCGCGCTGATGCCGCGGACCTCGGCCTCGAACAGCAGGTCCACCGCGCGCTT
+ACGGGCCTGATGTCGTCCGCGAACCGGCTTTCTGTCCGACATCGTCAGGCGTTGACCCGGCCCAGGTAGC
+TACCGTCGCGCGAATCCACCTTTAGTTTGTCTCCGGTATTGATGAACAGCGGCACGTTGATCTGGGCTCC
+GGTCTGAAGGGTGGCCGGCTTGGTGCCCGCGCTGGACCGGTCGCCCTGCAAGCCGGGCTCGGTGTGAGTG
+ACCTCGAGCTCGACGGTCACCGGCAGCTCGATGTATAGCGGCACGCCGTTGTGGAACGCCACCTGCACCG
+GCATGCCCTCCAGCAGGAACCGTGCCGCGTCCCCGACCAGGGCCTCCGGCAGCGGGTGCTGCTCGTAGTC
+TTGGCTGTCCATGAACACGAAGTCCGAGCCGTCGCGGTAAAGGTAGGTGGTATCGCGCCGGTCGACGGTG
+GCGGTGTCCACCTTCACCCCGGCGTTGAACGTCTTGTCGACGACCTTGCCCGAGAGCACGTTCTTCAACT
+TGGTGCGCACGAACGCCGGACCCTTGCCCGGTTTGACGTGCTGGAACTCGGTGATTGTCCACAGCTGGCC
+GTCGATTACCAGGACCAGCCCGTTCTTGAAGTCAGCAGTGGTCGCCACGTGGGTCTCCTACAGAATGGCC
+AGTTCTTTGGGGAACCGGGTCAACAATTCCGGGGTCTGCCCGGCGGTTTCAGGCATTTTCGGCGTCCCGC
+CAGCCACTACCAATGTGTCCTCGATGCGGACACCGCCGCGGCCGGGTAAATAGACACCGGGCTCCACGGT
+CACCACGGAGCCCGCCAGTAGTGTACCGGCGGATGTGACCCCGATGCCCGGCGCTTCATGTATCTGCAGG
+CCAACACCGTGTCCCAGTCCGTGACCGAAGTGCTCGCCGTAGCCGGCGTCGGCGATCAGCTGGCGCGCTG
+CAGCGTCCACCCCCCGCAGCTCGGCACCCGGCAGCAACGCCTGCCGACCGGCCTGTTGCGCCTCGGCCAC
+CAGCTGATAGATCTCTAGCTGCCAGTCGGCGGCCTTGCCCAACACGAAGGTGCGGGTCATATCGGAGTGG
+TACCCGGCGACCAGGGCGCCGAAGTCGATCTTCACGAAATCGCCGACCTGCAGCACCGCGTCGGTCGGCC
+GGTGGTGCGGGATCGCCGAATTGGCCCCGGCAGCCACGATCGTCTCGAATGACACCGCGTCAGCGCCATG
+ATCGAGCATCAGGGCCTCCAGCTCGCGGCTCACCTGCCGTTCGGTTCGGCCCGGCCGCAGGCCGCCGCGG
+GCCACCAAGTCGGTCAGCGCGGCATCGGCTGCTTCGCAGGCTAGTCGCAGCAGCGCCAGCTCGCCGGCGT
+CTTTAACCTCGCGCAGTGACTCCACAGTTCCGGATGCCCGCACCAACTCGGTGTTCTTGCCCTCCAGCGC
+GCCCGCCAAGGCGTCCAGGCCGTCCACCGTGACCACGTGGCTCTCGAAGCCCAGCTTTCCCACGCCGGCC
+TCGCCGGCCCGGCCGGCCAGGTAGCGCCCGACCGCGCGCTCGATAGCCACTTCGAGGTCGGGCGCTTGCG
+AGGCGGCCTGAGTGCGGTACCGGCCGTCGGTGGCCAACACGGCATCGCGCTCATCGGCGAACACCAGCAA
+TGCGCCGTTGGACCCGCTGAAGCCTGATAGATATCGCACGTTTATCAGGTCGCTGATCAGCATCGCATCC
+AACCCGGAGGCAGCGATTTGTGCTTTCAGCTTGTCTCGACGCTGGGAATGTGTCACGACCCTTGACGGTA
+CTCGCTACGCTGAATGCCCATGACTAACTGGATGCTGCGCGGGTTGGCGTTCGCCGCCGCGATGGTGGTT
+CTCCGCCTGTTCCAGGGGGCATTGATCAACGCGTGGCAGATGCTGTCCGGGCTGATCAGCCTGGTGCTAC
+TGCTGCTCTTCGCGATCGGAGGGGTGGTGTGGGGTGTGATGGACGGGCGCGCCGACGCCAAGGCGAGCCC
+TGACCCCGACCGCCGCCAAGACCTGGCCATGACCTGGCTGTTGGCCGGCCTGGTAGCCGGCGCGCTCAGC
+GGCGCGGTGGCCTGGCTCATTTCGCTGTTCTACAAAGCGATCTACACCGGGGGCCCAATCAACGAGCTGA
+CCACGTTCGCGGCCTTCACCGCGCTCATCGTCTTTCTGGTCGGGATCGTCGGGGTAGCCGTGGGCCGGTG
+GCTGGTGGACCGGCAGCTGGCGAAGGCACCGGTGCGACACCACGGGCTTGCCGCTGAACACGAGCGGGCC
+GCCGACACCGATGTATTCTCCGCCGTTCGCGCCGACGACAGTCCGACCGGGGAGATGCAGGTCGCGCAGC
+CTGAGGCACAAACCGCGGCCGTCGCCACGGTCGAACGTGAGGCACCCACCGAGGTGATCCGCACCACCGA
+AAGCGATACACCCACCGAGGTTATCCGCACCGACACCGAGGCGGACCAGACCAAGCCCGGCGACGAGCCC
+AAGAAGGATTAACCCTCACGTCCCGACATGCTCAGCTAGGTACCGCAGGGCCAGCAGGTAGCCCTGGATG
+CCGAGCCCGACGATCACCCCGGTCGCGATGGGGCTGAGGTAGGAGTGGCGGCGGAACTCCTCACGCGCAT
+GCACGTTGGAGATATGCACCTCGATCAGCGGAGCGCTCAGCTCCGCGCAGGCATCGCGCAGTGCCACCGA
+CGTGTGCGTCAGACCGCCGGCGTTGAGGATCACGGGTTCGGCCGCATCGGCGGCCTGATGAATCCAGTCC
+AGCAGCTGGGCTTCGCTATCACTTTGCCGCACAACGGCTTTGAGTCCGAGCTCGGCGGCCTCACGCTCGA
+TCAGAGCGACCAGCTCGTCGTGGGTGGTGCCGCCATAGACGGCGGGCTCGCGCCGGCCCAACCGGCCCAG
+GTTGGGGCCGTTGATCACGTTCACGATCAGTTCGCTCATGGGGCGCAAACTCCGGCGTAGGCGGTTACCA
+GCAGACCGGGGTCCGGTCCCACCATTCGGCCCGGCTTGGCCAATCCGTCGAGCACCACGAACCGCAACAC
+ACCCGCCCGAGTCTTCTTGTCGCCGGCCATGATTTCCAGCAGCTGGGGCAGCGCGTCCGGGTCGTAGCTG
+ACCGGCAATCCCAACGAGGACAGGATGGTGCGGTGGCGCTGCGCGGTCGCGTCGTCGAGCCGCCCGGCAA
+GCCTGGCCAGCTCGGCCGCGAACACCAGCCCCACCGACACGGCGGCGCCGTGGCGCCACCGGTAGCGTTC
+CCGGCGCTCGATCGCGTGGCCTAATGTGTGGCCGTAGTTGAGGATTTCGCGCAGCTCGGATTCCTTTTCG
+TCGGCGGCGACCACCTCGGCCTTGACGGTGATCGCGCGCCGGATCAGCTCGGGCAGCACGTCGCCGGCCG
+GGTCGAGTGCGGCCTGCGGGTCAGCTTCGATGAGATCCAGGATCACCGGGTCGGCGATGAAGCCGGCCTT
+GACCACTTCGGCCATGCCGCAGATCATTTCGTCGCGTGGCAAGGTTTGCAGCGTCGCCAGGTCCACCAGG
+ACCGCCAACGGCTGATGAAACGCCCCGACCAGGTTCTTGCCGGCGTCGGTGTTGATGCCGGTCTTGCCGC
+CGACGGCCGCATCGACCATGCCCAGCAGTGTGGTGGGCAGGTGCACAATCGAGACGCCGCGCAGCCAGGT
+GGCCGCCGCGAACCCGGCGACGTCGGTGGCGGCCCCGCCGCCGAGGCTGACCAGGGCGTCTTTGCGGCCG
+ATTCCGATGCGGCCCAACACCTCCCAGATGAATCCCACGACGGGCAGGTCCTTGCCGGCCTCGGCGTCGG
+GGATCTCGATGCGGTGCGCGTCGACGCCCTTGCCGGCCAAGCGCTTTCGGATCTCTTCCGCGGTCTCGGC
+TAGTCCGGGCTGATGCACGACGGCGACCTTGTGCCGGTCGGCCAGCAGGTCTTCCAGCTCGTCGAGCAGG
+CCGGTACCGATGACCACCGGGTATGGCGGATCGACGGCCACCTGCACGGTCACGGGTGCGCCGATATCGG
+TCATGTGGCCGCCTCGCTGGGGCTGGGAACCTGCAGCCGCGACAGGATATGGCGGACCACCGCCCCGGGG
+TTGCGGCGATTGGTGTCCACTCGCATGGTCGCGACGCGCCGGTACAGCGGTGCCCGCTTGGCCATCAGCG
+CGCGGTATTTTTCGGCGCGGTCGGGGCCGGCCAGCAGTGGGCGCACGGTGTTGCCGCCGGTGCGGCGCAC
+GCCCTCGGCGGCGCTGATCTCCAGGTAGACGACGGTGTGGCCGGCCAGCGCCGCGCGCACACCGGGGCTG
+GTCACCGCGCCGCCGCCGAGCGACAGCACACCGTCGTGGTCGGCCAGTGCCGCGCGCACCACGTCCTCCT
+CGATACGTCGGAACTCCTGCTCCCCGTCGGTGGCGAAGATGTCGGCGATGCTGCGTCCGGTCCGCTGCTC
+GATCGCGACGTCGGTGTCGAGCAGGCCGACCCCGAGCGCCTTGGCCAGCCGGCGCCCGATGGTGGACTTG
+CCGGAGCCCGGCAGGCCGACGAGAACCGCTTTGGGTGCCATCTGTTAACCGGAGACCCGCGCGGCCGGTG
+CTTCGCGGTCGGCGACGCTGCGCTGGTAGGCGGCGATGTTGCGCTGGGTTTCGGCCAGCGAATCCCCGCC
+GAATTTTTCCAGCGCCGCCCGGGCCAGCACCAACGCCACCATGGTCTCCACCACGACCCCGGCCGCCGGC
+ACCGCGCACACATCCGAGCGCTGATGGATGGCGACGGCCTCATCGCCGGTCGCCAGGTCGACGGTGGCCA
+GCGCGCGCGGCACCGTGGAGATCGGCTTCATCGCCGCACGCACCCGCAGCGGCTGCCCGTTGGTCATCCC
+GCCTTCCAGCCCCCCGGCCCGGTTGGTGGAGCGGACGACGCCGTCGGGCCCGGGGTACATCTCGTCGTGG
+GCGCGGCTGCCGCGGCGGCGCGCGGTCTGGAATCCGTCGCCGATCTCCACGCCCTTGATCGCCTGGATGC
+CCATGACGGCGGCGGCCAGCTGGCTGTCGAGCCGATGGTCGCCGCTGGTGAACGACCCCAGCCCCACCGG
+CAGGCCCAGCGCGACCGCCTCCACCACGCCGCCGAGGGTGTCGCCGTCTTTCTTGGCCGCCTCGATTTGG
+GCGATCATGTCCGCCTCGGCGGCCTTGTCGTAGGCGCGTACCGGGCTGGCGTCGATGGCGGGTAGGTCCT
+CGGCCCGCGGCGGCGGACCCTCGTAGGGTGCCGACGCGCCGATCGAGATGACGTGGGAGAGCACCTCGAC
+ACCCAGCGCCTGCCTCAGGAATGCCCGTGCGACCGTGCCCGCCGCGACCCGGGCGGCGGTCTCGCGGGCG
+CTGGCCCGCTCCAGCACCGGCCGCGCGTCGTCGAAGCCGTATTTGAGCATGCCCGCGTAGTCGGCGTGGC
+CCGGCCGCGGCCGGGTGAGCGGGGCGTTGCGTGCGACGTCGGCCAGCTCGGCGGGGTCGACCGGGTCGGC
+GGCCATCACGGTCTCCCATTTGGGCCATTCGGTGTTGCCGATCTCGATGGCGATGGGCCCGCCCAGGGTG
+CTGCCGTGGCGTATCCCGGACAGCACGGTCACCGCGTCGCGCTCGAACGTCATCCGTGCGCCGCGGCCGT
+AGCCCAGCCGGCGTCGGGCCAGCTGGTCGGCGATGTCGGCCGAGGTGACGTGCACGCCGGCGACCATGCC
+TTCGACCACGGCCACCAAGGCGCGGCCGTGTGACTCCCCCGCGGTGATCCAGCGCAACACCTGACCATCT
+TCCCATGCGCCGCCGGCGGCCACCGCACGTCAACGCACCCACTCCGTGCGATCGCGGTGATGTGCGGCCC
+CCCGGATGCCCCGCTAGCATCCCTGGCGTGGAAGTGGCTGGCGGCACCCGGGCCCGGCTGCGGGTCACAG
+CCGATGGTTTGCAGGCGCTGGCCGGGCGGTGCGCGACCCTGGCCGGCGAATTGTCGGCCGCGGTCGCGCC
+GTCGGGGGCGGTGTTGTCGTGGCAGGCCAACGCGGTCGCGGTGAACGCCGCGCATGCCCGCGCGGGTGCG
+GCCGCCGCGGCTGTGAGCGCCCGAATGCGGGCCACCGCCGCCGCGCTGGGGCAGGCCGCCCGCCGGTACG
+CGGGCCAGGACACCGCAGCGGCGGCCGCCCTGGGGGCGGTACGCCCGTGGGGGACCCACTGATGGCTACG
+TCGGGGCTGCCGCCGCTGTCGGCGGTGCAGTCGACGAGCTTTGCGCATCTGAGCGAGGCCGCCGCCCACT
+GGCGGCGGCTGGCCACGCGGTGGGAGCGCGCCTTAGCCGAGGTGCGCGATTCGATGCGCCGACCCGGCGG
+CACCGACTGGGAGGGCCAGGCCGCGGCCCGCGCCCACTACCGGTCGACCGTCGACGTGGTGACGATCGGT
+CGCGCGGTGGACCGGCTGCATGACGCCGCCGCCGTCGCCGGCCGGGGGAAGACCAGCTGGAGGCCAACCG
+GCGGGCGGTGCTGGACGCTGTCAGCGACGCCCGCCGGGACGGGTTTGCCGTCGGTGAGGATTACACGGTC
+ACCGACCGCTCCACGGGTGGCTCACGCCAGCAGCGGGCGGCGCGTCTGGGCCAAGCCCAGGGGCACGCCG
+ACTTTATCCGGCATCGGGTGGGCGCGCTGCTGGCCACCGACCGCGATATCGCGACCCGGGTCAGCGCCGC
+CACCCAAGGCCTCGATGAGCTGGCGTTCGAAGACGTGCCCGGGGTCGACACCCCGGCCGAGGATGGGGTG
+CAGGCGGTGGATTTCCGCCAGGCCCCGCCACCGGGAGCCCCCGGGGGCATGTCCTCCGGCGACATCGACG
+CGATCGACGCGGCCAATCGCGCCCTGCTGCAAGACATGCTGGCGGAGTACAGCCGGCTGCCCGACGGGCA
+GGTGAAAACCGACCGGCTGGCCGACATCGCGGCCATCCAAGAGGCGCTGAGGGTGCCCGACTCGCATTTG
+ATCTATGTGGCCAGGCCGGACGACCCCGCCGACATGATCCCGGCGGTCACCGCGGTCGGCGATCCGTTCA
+CCGCCGATCACGTGTCGGTGACGGTCCCCGGGGTGTCGGGAACCACCCGTCAGACCATCGCCACCATGAC
+CCAAGAAGCCCGTGGGCTACGAGAAGAAGCGAGAGTGATCGCCCACAGCGTGGGTGAAAGTGAGAATGTG
+GCGACCATAGCGTGGGTGGGGTATCAGCCGCCGCCGGTGCTCGCGTCGTGGAACACCGTCGATGACGATC
+TCGCGCAGGCCGGCGCTCCGAAGTTGGAGGCGTTTTTGCGGGATCTGCAGGCGGGATCGCACAATCCGGG
+TCACACGACGGCGTTGTTCGGGCATTCCTACGGGTCGTTGCTGTCGGGGATCGCGTTGAAGGATGGCGCC
+AGTTCACTGGTCGACAATGCGGTGCTGTATGGCTCGCCGGGGTTTGACGCGACCTCACCGGCCAAGCTGG
+GCATGAACGACCACAACTTCTTCGTGATGACCACACCCGATGACCCCATCCGGTATCCGGCGCGCCTGGC
+ACCCCTGCACGGGTGGGGATCAGACGGCGCCGACACCATCGGCACTGTAGGCCGCCAAGGCACCCCTGCA
+CGGGTGGGGATCAGACCCCAACGAGATCATCGCCGGATCCCCGGACCGCTACCGCTTCACCCATCTGCAG
+ACCGACGCGGGATCCACTCCGCTGGGTGATCACAAGACCGCCGCCAGCGGGCACTCGCAATACGGCCAAG
+ACCCGCTGCAACGGATGACCGGCTACAACCTGGCGACCATCCTGCTCAACCGGCCCGATCTGGCGGTGCG
+CGAAAGCCCACAGCAGTGATCGCACCACAACCGATTTCCCGAACGCTCCCGCGGTGGCAGCGCATCGTCG
+CGCTGACCATGATCGGCATATCAACCGCCCTGATAGGTGGCTGCACCATGGATCACAACCCTGACACATC
+ACGGCGCCTGACCGGCGAGCAGAAGATCCAGCTCATCGACAGCATGCGCAACAAGGGCTCCTACGAGGCC
+GCCCGGGAGCGCCTAACCGCCACCGCCCGGATCATCGCCGACCGCGTCAGTGCGGCCATCCCGGGCCAAA
+CCTGGAAATTCGACGACGATCCCAACATACAACAGTCTGACCGAAACGGAGCACTGTGCGACAAGCTCAC
+CGCGGATATCGCGCGGCGGCCGATCGCCAACAGCGTAATGTTCGGCGCCACGTTCTCGGCCGAGGACTTC
+AAGATTGCCGCCAATATCGTGCGGGAGGAAGCCGCCAAGTACGGTGCGACCACCGAGTCGTCGCTATTTA
+ACGAATCGGCCAAGCGCGACTACGACGTGCAGGGCAACGGCTACGAATTCCGACTCCTGCAAATCAAATT
+CGCCACACTTAACATCACCGGCGATTGTTTTCTGTTGCAGAAGGTGCTCGACCTGCCGGCCGGACAACTC
+CCCCCGGAACCACCCATCTGGCCAACGACCTCGACGCCACATTGATCGCACCACAACCGATTCCCCGAAC
+GCTCCCACGGTGGCAGCGCATCGTCGCGCTGACCATGATCGGCATATCAACCGCGCTGATAGGTGGCTGC
+ACAATGGATCAAAGCCCTGACACATCACGGCGCCTGACCGACGAGCAGAAGATCCAGCTCATCGACAGCA
+TGCGCAACAAAGGCTCCTACGAGGCCGCCCGGGAACGCCTCACCGCCACCGCCCGGATCATCGCCGACCG
+CGTCAGTGCGGCCATCCCGGGCCAAACCTGGAAATTCACCGAAGATCCCGCCGGGCGAAAGGCCGATCGG
+GAAGGTTTGTCGTGCAAGGAACTCACCGGCGATATCGCCCGGCGGCCGATCGCCGACGCAGTTATCTTTG
+GTACTGCGTTCTCGGCGGAGGACTTCAAGGTTGTCACCAATATCGTGCGGGAGGAAGCCGCCAAGTACGG
+TGCGACCACCGAGTCGTCGCTATTTAACGAATCGGCCAAGCGCGACTACGACGTGCAGGGCAACGGCTAC
+GAATTCCGACTCCTGCAAATCAAATTCGCCACACTTAACATCACCGGCGATTGTTTTCTGTTGCAGAAGG
+TGCTCGACCTGCCGGCCGGACAACTCCCCCCGGAACCACCCATCTGGCCAACGACCTCGACGCCACATTG
+ATCGCACCACAACCGATTCCCCGAACGCTCCCACGGTGGCAGCGCATCGTCGCGCTGACCATGATCGGCA
+TATCAACCGCCCTGATAGGTGGCTGCACAATGGGCCAAAACCCCGACAAATCACCGCACCTGACCGGCGA
+GCAGAAGATCCAGCTCATCGACAGCATGCGCCACAAAGGCTCCTACGAGGCCGCCCGGGAACGCCTCACC
+GCCACCGCCCAGATCATCGCCGACCGCGTCAGTGCGGCCATCCCGGGCCAAACCTGGAAATTCAACGACG
+ACTCCTACGGCCAAGACTTCTATAGAAATGGATCGTTGTGTAAGGAACTCAGTGCCGATATCGCCCGGCG
+GCCGATGGCCAAACCGGTTGACTTCGGTAGCACATTCTCGGCGGAAGACTTCAAGATTGCCGCCAATATC
+GTGCGAGAGGAAGCCGCCAAGTACGGTGTGACCACCGAGTCGTCGCTGTTTAACGAATCGGCCAAACGCG
+ACTACGACGTGCAGGGCAACGGCTACGAATTCAACCTGGGCCAAATCAAATTCGCCACACTTAACATCAC
+CGGCGACTGTTTTCTGTTGCAGAAGGTGCTCGACCTGCCGGCCGGACAACTCCCCCCCGAACCACCCATT
+TGGCCGACGACCTCGACGCCAACCCCGTGAGCACCACCATCGTTGCTGGCGTGATCCAGGGTCACCTGCC
+GGTGATCCTGCCCACGCGCAGGCGGGCTCGCGATCTCGGGCACACGACGGCGTTATTTCGGGCGCAAACG
+CTCCAATGCATATATCTCAGTATCGAATACCTATATGTTTGCTCCATGTCTCGGCGTACAACGATCGACA
+TCGATGACATACTGCTGGCCCGCGCGCAAGCGGCGCTCGGTACCACCGGGCTGAAGGACAGGGTCGATGC
+CGCTTTGCGAGCCGCGGTGCGCTAGTCGGCGCGCACTCGGCTCGCCGCGCGAATCGCCTCGGGTGCCGGC
+ATCGATCGGTCCGAGGCGCTGCTTGCCCAGACGCGTCCCGCGCGGTGATGGTGTTCTGCGTCGACACCAG
+CGCGTGGCATCACGCGGCGCGGCCGGAAGTTGCGCGCCGATGGTTGGCGGCCTTGTCCGCGGACCAGATC
+GGCATCTGCGACCACGTGCGGTTGGAGATCCTGTACTCGGCGAACTCCGCTACCGACTACGACGCGCTCG
+CCGACGAACTCGACGGCTTGGCCCGTATACCAGTCGGTGCCGAAACCTTTACGCGCGCATGCCAAGTCCA
+GCGTGAGCTTGCCCACGTCGCCGGTCTGCATCACCGCAGCGTGAAGATCGCCGATCTTGTCATCGCCGCG
+GCGGCCGAACTTTCAGGCACCATCGTGTGGCATTACGACGAGAACTATGACCGGGTCGCCGCCATCACCG
+GCCAACCTACGGAGTGGATCGTGCCGCGCGGGACCCTTTAACCGCTGATAGGCGCCATCACTGGATGTAT
+GGTGATGTCATGCGGACTCAGGTGACCCTGGGCAAAGAGGAGCTTGAGCTGCTCGATCGTGCCGCCAAGG
+CGAGTGGCGCATCGCGGTCCGAACTCATCCGACGCGCAATTCACCGTGCCTACGGGACTGGATCCAAGCA
+GGAACGGCTCGCCGCGCTCGACCACAGCCGTGGCTCGTGGCGAGGACGGGACTTCACCGGCACCGAGTAT
+GTCGACGCCATTCGGGGCGACCTCAACGAACGACTTGCTCGGCTCGGTCTGGCGTGAAGCTGATCGACAC
+CACCATCGCGGTCGACCACCTTCGCGGCGAACCCGCGGCAGCCGTGCTGCTCGCCGAACTGATAAACAAC
+GGTGAGGAGATCGCGGCCAGCGAGCTGGTCCGATTCGAACTCCTCGCCGGTGTGCGGGAAAGCGAACTCG
+CGGCGCTCGAGGCCTTCTTCTCGGCAGTGGTGTGGACCCTGGTGACCGAGGACATTGCCCGGATCGGCGG
+ACGACTCGCCCGTCGATACCGGTCCAGCCACCGCGGTATCGACGACGTGGACTACCTGATCGCTGCGACC
+GCCATTGTGGTCGACGCCGACCTGCTCACCACCAATGTGCGCCACTTCCCGATGTTCCCGGATCTGCAGC
+CGCCGTACTGAGCACTCCCTGGGGCATCAGCCTTGGTCGGCGATGAGTTGTTCGATGAGCTCGACGATGC
+GCTGTTGGCCGGCGGCGGCCCCGTCCAGCTTGCCTCGCATCTCGGTGAATCCGTCGTCGACTCGACTAAA
+ACGTTCTTCTACGTGACTGAAACGTTCGGTCATCTCTTCCCGCAGGGCGGTGAAATCTTCTCGCAGGGCG
+TTGAAGCTACCGATTGTAGCTCGCCGGAAGTCGCGGAACTCGCCAACGAACTCCGTGACATCGCGATCGG
+CCGCGCCGGCTAGCACGCGAGCGGCGGCGGCATCCTGTTCGCTGGCCCGCACGCGGTCAGCCAGCTCACG
+CACTTGGGATTCCAGCGCGGTGACCCGTTGTTCGAGGTTCTCGGGCAGCACGAGCGAATCCTACCGCGAT
+TCAACGCAACGCAGCCCTGTCCCGGGCGGACACCGGCATTGGGTGCACGTCGGATAAGCAGGGCTGAGCG
+GGGCTCGGCTCTACTCGGGTCTTACCTCGACAAATCCGGCCGCGCTGAAGTCACCATCGAAGGCATACGC
+ATTTTGGATGCCTTTCTTTCGCATCACCGCGAAGCTCGTGGCATCGACGAACGAGTACTCTCGCTCGTCG
+TGGCGTACAAGCCATTCCCATGCCTGCTCTTCCAGGTCGGCTGTTACGTGCTCGACGCGAACGACGGTGC
+TCAAGCGGATTGCAGCGGCGGCAACCGCCGCGCGGTGACCGCAGCGCCGGTTGAGCAGCGTCCAGGTCTC
+GCCCAGGACATGGTTGGAGGTCATCACCACGGGCGGTTTGCTGGCCCACAACCTCTTCGCGGTGCCGTGC
+CGAGCGTCGCCGGCGTTGCCAAGTGCAGCCCAGAAGGACGTGTCGACGAAGATCATTCGTGCTTTCCGTA
+AACCACGTCGTCGACGGACGCGGACAAGTCGGCTTCCCCCACGAACGATCCGACGAAGGCATCGACCGGA
+TCTGGGCCCGGCTGCCGGAGGTGCTCAGCGACGTACTCCCGGATCAGCGCCGCCTTCGACGTCCGCCGCC
+GTCGCGCTTCAACAGCAAGCGCTCGGTCAACGTCTTCGTCGATGTAGATCTGCAGCCTTTTCACATGGCA
+AATATACGCCACTAGCATAATGCTGTATACATCGGTAGCTGAGAATCGGATGCTTGCCGCTGGCTGCCGA
+GTTTGTTGAACTCGCCGCCGTGGTGACCTGGATGAAGTGTGCCCGCCGAAACTGCCGCCGCCCGACTAGG
+CGACTGGCCAAAGCGATGACAGTGCTGACTTCTGTACAGGGGCGAAGCGAGTGTCCGCCCCTTTACGCGC
+GTCGTAATCAGCCGCTGAGTTCGCCATGGTTCCCATGCAAGATCGCTCACGTTCGAGCCCGGCGCGCGGT
+GACCGACATGAAACTCCCGTTACGAGCAAGCATGCGGCAACGCCGCCTCGACGGCGACGGTCCAAGCTGT
+CCTCTGAACGAATCAGGTTGCGCTAAGCCAAGATTCGTTGTCAAACGACCTCTGGTCTACACTGATATCG
+CGCCAATCTCAGCCCAGCAGCGCCAACCCCACCGCCCCCAGGCTGGCCACACACATCGACGGCCCGTGCG
+GCAGGGTGCGGACACCCCATGGCGTCACCATCACGCCGCACACCGCGGTCAGCAGCGGCGCGGCCAGCGC
+CGCCAGAAACCACACCTCGACCCCGAAGCAGCCGGTCAGCCCGCCCAGACCGATCGCCAGCTTGACGTCA
+CCGGCGCCCATCGCGGCGGGCAAAGCCAGGTGCACCAGCAGGTACACCCCGGCCAAGGCGGCCGCCCCGG
+CCAGCGCCGGCACACCGCGGCCGGCAAGGCCCGCGAAGAGCAGGATCACCCCCGCCCCGGGCAGGGTGAG
+CCAGTTGGGTAGCCGGCGCTGCCGGACGTCGCAAACGCACAACACTCCCATCCAGGCCAACACCGCCGCC
+GCCAGCATGCTGGGGCACGCTAGTCCAACGCGGCCAGCGCGCAAGTCATCGCTTCGCGGGGGGCGGGTAG
+CCCGGTGAACTGCTCCACCTGCGCGAACGCCTGATGCAGCAACATCTGCAGCCCGCTGATCACCCGCCCG
+CCCGCCGATCCGACCGCGGCGGCCAGCGGTGTGGGCCACGGATCGTAGATGGCGTCCAACAGCACCGGGA
+TCGCGGCCAAGGTGCCGGCATACCCCGCGGCCACCTCCGCTGGAATGGTGCTGACCAGCACTTCCGCGGC
+GGCCACCGCATCGGCCAACCCACCGCTGTCGAACGCGCAGAACCGGGTCGCCACGCCGACCCGTGTGCCC
+AGGTCCACCAGCCGGGCCGCCTTGTCCGAGTTGCGCGCCACCACGGTGATGTCGGTGACCCCGAGTTCGG
+CCAGCCCCACCACGGCCGCCGGTGCGGTCCCCCCGGACCCCAGCACCAGCGCGTGTCCAGCAGCCGCCCC
+CAACGCCCCGGCCACCCCGTCGATGTCGGTGTTGTCGGCCCGCCAGCCATGCGGCGTCCGAACCAGGGTG
+TTGGCCGAACCGACAAGGTCCGCGCGTGCGGTGCGCTCGTCGGCGAACCGCAGGGCGGCGAACTTGCCCG
+GCATGGTCACCGAAACACCGACCCACTCCGGTCCGAAACCACCGACCACGACGGGCAACTCGGCCGCACC
+GCATTCGATGCGCTCATAGGTCCAGTCGTGCAGCCCCAACGCCCGGTAGGCGGCCAGGTGCAGCTGCGGG
+GAGCGGGAATGCGCGATCGGCGAACCAAGCACGCCGGCTTTTTGGGACCTTCGCTCATCGCGCGCTGTCG
+AGGACACCGTTGTGTTTGGCCAGCTCGATGTTCGCCAGATGCTGCTGATAGTCCCTGGTGAACAGCGTCG
+TGCCCTGGGAATCGATGGTGACGAAGTACAGCCAGTCGCCAGGTACTGGATGCTCGGCGGCGCGCAGCGC
+GTCGACGCCGGGCGAACAGATCGCGGTGGCCGGCAGCCCCTGGGCCATGTAGGTGTTCCACGGTGTGCGC
+TGGGCACGGTCGGTGTCGCTGGTGGCCACCTCACGGCGATCCAGCGGATAGTTCACGGTCGAGTCGAACT
+CCAACGTGCGGTGTTCGTGCAGCCGGTTGTAGATGACCCGGGCCACCTTCGGGAAATCCTGGGTGTTGGC
+TTCCTGCTGCACCAGCGAGGCCACCACGAGAATGTCATAGGGCGACAGGCCCAGCGACTTTGCGGTGTCT
+ACCAACCCGGATTTCATGTACTCCACGGCGCCGGCGCTGATCAAGGTCGCCAAGATGGTTTCAGCCGATG
+CCGACGGGTCGATGTTGAAGGTCCCCGGTGCGATCAGCCCCTCGATCCGGCGATGGTCAGTGCCCAGCTC
+CATCACCGGCCCAACCGCCCAGCGCGGCACTGACAGCATCGTCGGCGTGCTCCTGCTCGCCGCCGCGCGG
+AGGTCGGCCACCGAGACGCAGCGTTGGGTACCGTCGAGATCCACACAGGTGGCACGGGAGATCAGCGCGA
+ATATGCCAGGATTCACCACGTTGGTCTTCATGTCGGTGGTGTCGTCGAGCTGACGCCCTTCCGGTATGAC
+CAACTTCCCCACCCGGTTGTGCGGATCGGTAAGCCGCGCGACAGCGGAAGCCGCCGAAATCTCGGTTCGC
+ATCCGATAGAACCCGGGTTGGATCGAGGAAATCGCGGTGTTGCCGTGCGCGGCATCGACGAATGCTCGGA
+CGGTGGCCACTACACCGTGTTTGAGCAGCGTCTCCCCGACCGCCGTGGTCGAGTCACCGGCCCTGATCTG
+AATCACGATGTCTCGCTTGCCGGGACCGGTGTAGTCGTTACCGAAGCCCAACATGGTCTGCCACAACTTG
+GCGCCGACGACGACGGCCACCACCACCACCACGACGAGCAGGCTCAGGGCAAATCCGCCGGCGACGCGCC
+GTCGCCGGCGGATTTGTTGGGCGTGTCGGCGCTGAGCGCGGCTGACTCGGGTCCTGCGGTGCCGGTTCGG
+TCTTACCGACACCGGCTGGGCGCGGTGGCGGTGGCCACCGTCAGGCATCGGAGCCTTCTTGAGTCCCGGC
+CATCGCCGCGAGACGTTCATCCAGCCAGCTCTGCAGTATTGCCACTGCGGCCGCTTGGTCGATCACCGCA
+CGCTGCTCGGAGGCCCGCACCCCCGCCTGCCGCAAAGATCGTTGAGCACTGACCGTGGTGAGCCGCTCGT
+CGGCCAGCCGCACCGGCGTAGGAGAAACACGGCGTGCCAGCGCCTCGGCCAGTTCGATTGCGTCTTGGGC
+CGAGCGGCCGATGCGGTCGGCCAGCGTGCGCGGGAGCCCGACGATCACCTCGACCGCCTCCAACTCGGCG
+GCCAGCGCAGCCAGCCTGCGCAGGTGCTTGCCGGAACGATCGCGGCGCACCGTTTCCACCGGGGTGGCCA
+AGATCGCGTCCGGGTCGCTGCAAGCCACGCCGATACGCGCGGCGCCCACGTCGATACCGAGGCGTCGTCC
+CCGTCCAGGGTCGTGCGCTGGATCGCCGGGCCGGTCGGGCGGGCGGTGCTGTGCTGGGACCACTCAACCG
+ACCCGCGCTATCACGGCGATCTCGGAGCGGACCGCGTCGAGCGCGGCGTCGATACCGGTCGGATTCTTTC
+CCGAGCCCTGCGCCAGGTCCGCCTTACCGCCACCGCGGCCTTCGACCGCCACCGCAAGTTGTTTGACCAG
+GTCGTTGGCACGGATTCCGAGGTCCTGGGCAGCGGGATTGGCCGCGACCGCATACGGCACAGTTTGGCTT
+TCGCCCTCGGCAATCAGCGCCACCACCGCCGGCTCGCTACCCAGCTTGCCGCGGATGTCGCCGATCAACG
+ACCGCAGGTCTGCCGCGGTCATCCCGCCGGACATTCGCTGCGCCACCAAACGGACGTTACCGATCCGCTG
+AGCCCCGGCGGCGGCATTGGTGGCGGCTGCCCGGGCGCTGGCCATCCGGACACGTTCGAGTTCCTTCTCG
+GCGGCCCGCAGGCGCTCCACTAGATTGGCCACCCGGGCCGGTACCTCTTCGGACGGCACCTTCAGTGACG
+AGGCCAACCCGGCCATCAACGCACGCTCCTTGGCCAGGTGACGAAACGAATCCAACCCCACGTAGGCCTC
+CACCCGGCGCACCCCGGAGCCGATCGACGACTCGCCCAGGATCGTCACGGGACCGATCTGCGCCGTGTTG
+CTCACATGGGTGCCGCCACATAGCTCCAGCGAGAACGGTCCACCCATCTCCACCACCCGCACTTCGTCGG
+GGTAGCTCTCGCCGAACAGCGCGATGGCACCCATCGCCTTGGCCTTGTCGAGCTGTTCGGTGAACGTGCG
+CACCTCGAAGTCCGCTTGCACGGCCTCGTTGGTGACCTCTTCGACCTGGGTGCGCTGGTCGTCGGTCAAC
+GGACCCTGCCAGTTAAAGTCGAAGCGCAAATATCCCGGCCGGTTCAGCGATCCCGCCTGAACCGCGTTGG
+GCCCCAGCACTTGTCGCAGCGCGGCATGCACCATGTGGGTGCCCGAGTGGCCCTGCGTGGCACCCCGGCG
+CCACCCGGGATCCACCGCCGCGATTACGGTGTCACCCTCGACGAATTCCCCGGATTCCACGTTGACTCGG
+TGCACCCAAAGCGTTTTGGCGATCTTCTGCACGTCGGTAACCGCGGCCCGGGCAGCTTCGCTGGAACCGG
+TTCCGCTGATGGTGCCCTCATCGGCGATCTGCCCACCCGATTCGGCGTAGAGCGGGGTGCGATCTAAGAC
+AAGTTCGACACGCTGCCCTTCCCCGGCTCCGCCGGCTACACCGTGCGCCACCACCGGAACCCGCTTACCG
+TCGACGAAGATGCCCAGAATCCGCGCCTGGGAACGCAACTCGTCGAATCCGGTGAACTCGGTGGCGCCGG
+CGTCAACCAGCTCGCGGTAGGCGCTCAGGTCAGCATGCGCGTGTTTGCGCGCGGCGGCGTCGGCCTTGGC
+ACGGCGGCGCTGCTCGGCCATCAGCTCACGGAACCCGATTTCGTCTACCTGCAGACCGGTTTCGGCCGCC
+ATCTCCAGCGTGAGCTCGATCGGGAACCCGTAGGTGTCATGCAACGTGAAAGCGTCCGATCCGGACAGCA
+CGGTGGCTCCGGATTTCTTGGTGGAGCTAGCCACCTCCTCGAACAGCCTGGAACCCGACGCCAGCGTGCG
+GTTGAACGCCGTCTCCTCGGCGACCGCGATCCGGCTGATCCGCTCGAAGTCGGCGACGAGTTCGGGATAT
+GACGGGCCCATCGCGTTGCGCACCGTGGCCATCAGGTCGCCAACGATCGCAGCGTCGATGCCCAGCAGCT
+TGGCGGAGCGGATCACCCGACGCAGCAGCCGGCGCAGCACATAACCGCGACCGTCGTTGCCGGGGCTGAC
+GCCGTCACCGATCAGGATCGCGGCGGTGCGGCTGTGGTCTGCGATGATGCGGTACCGCACGTCGTCTTCG
+TGGTTGCCGACGTCGTAGGCACGCGCGGCGACCCTGGCCACGGTATCGATGACCGGCCTGAGCAGGTCGG
+TCTCGTAGACGTTGTGCACGTCTTGCAGCACCAGCGCGATCCGCTCGACGCCCATGCCGGTGTCGATGTT
+GTTGCGGGGCAGCGGCCCGAGGATCTGGTAGTCCTCCTTGGTGGTTCCCTCTCCGCGCTCGTTCTGCATG
+AACACCAGGTTCCAGACCTCGAGGTAGCGGTCTTCGCTGACGATGGGACCGCCTGCGGGACCGAATTCGG
+GTCCGCGGTCGTAATAGATCTCCGATGACGGCCCGCACGGTCCGGGAATGCCCATCGACCAGTAGTTGTC
+GGCCATGCCGCGGCGCTGGATTCGCTCCGCCGGCAGCCCGGCAACCTCCTGCCATAGCCGGACAGCTTCG
+TCGTCGTCGAAATAGACTGTCGTCCAGATTCTTTCCGGGTCCAGGCCGTAGCCGCCGGCGGCGAGGCTGT
+TGGTCAGCAGTGCCCAGGCCAGTTCAATGGCCCCGCGTTTGAAATAGTCGCCGAAGCTGAAATTGCCGGC
+CATCTGAAAAAACGTGTTGTGCCGGGTGGTTATGCCCACCTCGTCGATATCGGGGGTACGGATGCACTTC
+TGGATGCTGGTGGCCGTCGGGTACGGCGGCGTGCGCTGTCCCAAGAAGAAAGGCACGAACTGGACCATCC
+CGGCGTTGACGAACAACAGGTTGGGGTCGTCGAGGATCACCGAGGCGCTGGGCACCTCGGTGTGGCCCGC
+CTTCACGAAATGATCGAGGAACCGCTTCCTGATCTCGTGTGTCTGCACTCTACGTTCTTCCTTGATCCGT
+GGTTAAGTCCATTACCAGCCTATTCGCCGGATTATGAGAAGGCTGTCCGACGGCCCAATTCGGCCCGCTC
+AGCCTTCCACAAAGCTCAATCGCACCGACCGCCGCGGATTGTCCTGGTTGAGGTCGACCAGAACGATGCT
+TTGCCAGGTGCCCAGCAGGGGCTGGCCCCCCGAGACCGGCACCGTCACCGACGGCGCAACAAAAGCCGGT
+AACAAGTGGTCGGCGCCGTGACCGTAGGACCCGTGCGCGTGCCGGTAGCGGTCGTCGCGCGGCAACAACC
+GCACCAGCGTGTCCACCAGATCCTCGTCGGAACCGGCGCCGGTCTCGATAATCGCAACGCCGGCCGTAGC
+GTGCGGGACGAACACGTTGCACAGGCCATCATCATGGGCGGTGCAGAAGGCGCGCACGGCGTCGGTGAGA
+TCGACAATGCGGCGACGCGCGGTGTCCACATCCAGCACATCGGTATCCACCCGTCCCAGCCTACGGTGGG
+GGCGCGCCAACCTGCCAATCCATTGACGTCGGATTGCCCATTGCCCCGGCCGGCCCGTCGGAGGAAGGTA
+ATGATTGACCGGTGGCGCCACCGGGGCGCTGCCCCGAACAATGAAAGAGGGGTGGATCGTGTACGCGCGC
+TCTACCACTATTCAGGCGCAATCCGAGTGCATCGACACCGGAATTGCGCACGTTCGCGATGTGGTTATGC
+CCGCACTGCAGGGGATGGATGGGTGCATCGGCGTATCCCTTTTGGTCGACCGGCAATCCGGCAGGTGCAT
+CGCCACCAGTGCCTGGGAGACCGCGGAAGCCATGCATGCAAGCCGGGAACAGGTAACGCCGATCCGCGAT
+CGGTGCGCGGAGATGTTCGGCGGCACGCCGGCCGTCGAGGAGTGGGAGATCGCGGCGATGCATCGCGACC
+ACCGCTCGGCCGAGGGGGCGTGTGTGCGGGCGACCTGGGTCAAGGTGCCGGCGGACCAAGTAGATCAAGG
+CATCGAGTACTACAAGTCGTCCGTCCTGCCCCAAATCGAAGGCCTCGACGGATTCTGCAGCGCCAGCCTG
+TTGGTCGACCGCACCTCCGGGCGCGCGGTGTCTTCCGCGACCTTCGACAGCTTTGACGCCATGGAGCGCA
+ACCGGGACCAGTCGAATGCGCTCAAGGCCACATCGCTGCGTGAGGCGGGCGGCGAGGAACTCGATGAATG
+CGAGTTCGAGCTGGCGCTAGCGCACCTACGGGTACCCGAGCTGGTCTGATCAACCCGCCGGCGGCAGTAC
+CGGCCCGAGCCCGACGCTGGGCCGGCACTGCTGTCGTGCGTCGAGCGGCGCTCGCGGTAGGCATTGCCAG
+GCTCAGCCGGTTGGAGGAAGGTATTTGGTGGGACCGGTGGCGCCACCGGGGCGCTGCCCCGACACGGGAG
+GGGGTCGATCGTGTACGCACGCTCAACCACCATTGAGGCGCAACCTCTGTCGGTCGACATTGGAATCGCG
+CATGTTCGTGACGTCGTCATGCCCGCTTTGCAGGAGATCGACGGGTGTGTCGGGGTGTCGCTGTTGGTCG
+ACCGGCAATCCGGCCGGTGCATCGCCACCAGCGCCTGGGAGACCTTGGAGGCGATGCGCGCCAGCGTCGA
+GCGGGTGGCACCCATCCGCGACCGCGCCGCGCTGATGTTCGCCGGTAGTGCCCGGGTCGAGGAATGGGAC
+ATCGCCCTGTTGCACCGCGACCACCCGTCGCATGAGGGGGCATGCGTGCGCGCCACCTGGCTCAAAGTGG
+TGCCAGACCAGCTCGGTCGGTCCCTGGAGTTCTACCGCACGTCCGTACTTCCCGAGCTGGAGAGTCTGGA
+CGGGTTCTGCAGCGCCAGCCTGATGGTCGACCACCCCGCTTGCCGGCGTGCGGTGTCGTGCTCGACGTTC
+GACAGCATGGACGCGATGGCCCGCAACCGCGACCGGGCGAGCGAGCTGCGCAGCAGGCGCGTCCGGGAAT
+TGGGAGCCGAGGTCCTCGACGTCGCCGAATTCGAACTGGCGATCGCACATCTACGGGTACCCGAGCTGGT
+CTGAGCGGACCTGCTTCCCGCAGAGCGCAGCGGTCACCCCCGTTTCTTGCGGATGATTGCCCGCAGGCGG
+TCCAGGCGGCCGGCGATCTCGCGTTCGCCGCCGCGACCAGTGGGCCGGTAGTAGTCCACGTCCACCAACT
+CGTCGGGCGGGTATTGCTGGGCCACAACGCCATCCGGGTCGTCATGGGAATATTTGTAGCCCTGTGCATT
+GCCCAGCGCCGCCGCCCCGGAGTAATGCCCGTCACGCAGATGAGCCGGCACCAGACCGGCCTTGCCGGCC
+TTGATGTCGTTCATCGCCGCGGCCAACGCCGTGGTGACGGCGTTTGACTTCGGTGCGGTGGCCAGGTGGA
+TGGTGGCGTGCGCCAGCGTCAGCTGGGCTTCGGGCATGCCGATCAGCGCCACCGTCTGTGCGGCGGCGAC
+CGCCACCTGCAGCGCGCTCGGGTCGGCCATGCCGATGTCCTCGCTGGCCAGAATCATCAGCCGGCGGGCG
+ATGAACCGCGGGTCCTCCCCGGCGACCAGCATGCGGGCCAAATAGTGCAGCGCGGCATCGACGTCGGAAC
+CGCGCACCGATTTGATGAAGGCGCTGACGACGTCGTAGTGCTGGTCGCCGTCACGGTCGTAGCGCACCGC
+GGCTTTGTCCACCGACCGCTCGATGGTTTGCACGCTGACCAGCTCGCCGGCCGCCTGGGCTGCCTCGGCC
+GCTACTTCCAGCGCGGTCAGGGCGCGCCGGGCGTCGCCGGCCGCGAGTTGCACCAGCAGGTCGACGGCCT
+CAGGCGCTACCGCGACTGCCCTGCCCAGGCCGCGGGGGTCATCGATCGCGCGTTGTACTACCGCGCGGGT
+GTCCTCGGCCGTCAGCGGCCGCAGCTGCAGGATCAGCGACCGCGACAGCAGCGGTGCCACCACCGAAAAC
+GACGGGTTCTCGGTGGTCGCCGCCACCAACAGCACCACCCGGTGTTCCACCGCCGACAGCAGGGCGTCTT
+GTTGGGTCTTGGAAAATCGGTGCACCTCGTCGATGAACAGCACGGTCTGCTCGCCGTGAAGCAGCGCTTT
+TCGCGAATTCTCGATGACCGCCCGCACTTCCTTGACGCCGGCCGACAATGCCGACAGGGCCTCGAACCGG
+CGGCCGGTGGCCTGCGAGATCAACGCCGCCAGCGTTGTCTTGCCGCTGCCCGGGGGACCGTAGAGGATCA
+CCGACGCCACCCCCGAGCCCTCGACCAGCCGGCGCAACGGCGAACCGGGCGCCAGCAAGTGGTCCTGGCC
+GACCACTTCGTCCAGCGACGCCGGACGCATCCGCACCGCCAGCGGTGCCCCGGCCGAAGCGCCCAGGTCA
+TGGCCGGACGTCATCGGTACGCCGGGCACGTCAAACAGACCGTCGGACACGGCTTCAGGCATACCACGCC
+CACCTGACGACGCGAACGTTCGCCGAAGACGCCACACGAATAATCCGCGCGCCTTCGGCAAATATTTGCT
+AAGTTCCGGTTTGCTTAGCGTCGCGCGGGTACCGATAAAAGCGAACTACGAAGCGATTGGGACAGCGATG
+AGCCAGCCGCCAGAACATCCAGGCAATCCGGCCGACCCCCAGGGCGGCAATCAGGGCGCTGGAAGCTACC
+CGCCGCCCGGCTACGGAGCGCCTCCCCCGCCACCAGGCTACGGCCCACCCCCGGGGACCTACCTGCCTCC
+CGGCTACAACGCACCCCCGCCGCCCCCCGGCTATGGCCCACCGCCGGGCCCGCCGCCTCCCGGTTACCCG
+ACGCATCTGCAATCGTCGGGTTTTAGCGTGGGCGACGCGATCAGTTGGTCATGGAATAGGTTCACGCAGA
+ACGCCGTAACGCTCGTCGTCCCGGTGCTCGCCTACGCTGTGGCGTTGGCCGCGGTCATCGGCGCGACGGC
+CGGGCTCGTTGTCGCCCTATCGGACCGTGCTACTACCGCATACACCAACACCTCCGGCGTCTCTAGCGAA
+TCCGTGGACATCACGATGACCCCGGCCGCGGGCATAGTCATGTTCCTCGGCTACATCGCTCTATTCGCCC
+TGGTGCTCTACATGCACGCCGGAATTCTGACCGGCTGCCTTGACATTGCCGACGGAAAGCCGGTGACCAT
+CGCGACGTTCTTTAGGCCGCGCAATCTGGGCCTGGTGCTGGTCACCGGACTGCTGATCGTCGCCCTCACC
+TTCATTGGTGGCCTGCTCTGTGTCATTCCCGGCCTGATCTTTGGCTTCGTCGCCCAGTTCGCCGTCGCTT
+TTGCCGTCGACCGTTCCACTTCGCCGATCGACTCGGTAAAGGCCAGCATCGAGACGGTCGGGTCCAACAT
+CGGTGGCAGTGTGCTGTCGTGGCTCGCTCAGCTCACGGCGGTGCTCGTCGGCGAACTGCTGTGCTTTGTC
+GGCATGCTGATCGGCATTCCGGTCGCCGCGCTCATCCACGTCTACACCTACCGGAAGCTGTCGGGTGGCC
+AAGTCGTTGAGGCAGTCCGGCCAGCGCCCCCGGTCGGCTGGCCGCCCGGCCCCCAGCTCGCATAGTCGGC
+ACCCGCCGACGCCGGCTGGCCGTCTTGGCCCGCTGGATTTGTCACGCGCTCACCCGAATTGGCATCCGGG
+GCCTGGAACGCGTTAGGGCAGTGGCTTTCCCACAGGTTGACGTAAATGACCTCCAAGATAGGTATCGAAC
+CAAGGTTGCGGCCGATGTGTACGTAGTTCGAGAGTTCGCTGATCTGATCACTCGCGTGGTCGATGCAGTC
+GACGGAACCGGCAGCCGCCACCCAAGGGTGCGCAGGTGGTTAGCAAATCGCCGACGAACACGACGCCACC
+GCGTCATGCGCCATCGCCGACCCCGCCTTGGTGGCTGAGAGCCGCTCGCCGGCGTTAAGCTGCCCAACAT
+CATGGGCATTCAACGCGCCGTTCTCCTCATTGCCGACATCGGCGGATACACAAATTACATGCACTGGAAC
+CGCAAGCACCTGGCCCACGCGCAGTGGACGGTGGCACAGTTGCTGGAGTCCGTCATCGACGCTGCCAAGG
+GCATGAAGTTGGCGAAGCTGGAGGGCGACGCCGCGTTTTTTTGGGCACCAGGGGGCAACACCAGTGTCCT
+GGTATGCGACCGGCCCCCGCAGATGCGCCAGAGGTTCCGCACGCGGCGCGAGCAGATCAAAAAAGACCAT
+CCCTGCGACTGTAAGAGTTGCGAGCAGCGGGACAACCTGTCGATCAAATTCGTCGCCCATGAGGGCGAAG
+TGGCCGAACAAAAGGTGAAGCGCAACGTCGAACTCGCTGGCGTTGATGTCATCCTGGTGCACCGCATGCT
+GAAAAATGAGGTGCCAGTGTCGGAATATCTATTCATGACCGACGTCGTAGCGCAGTGCCTCGACGAGTCG
+GTGCGAAAACTAGCGACGCCGCTGACACATGACTTCGAGGGCATCGGAGAAACGTCGACACACTACACCG
+ACCTCGCCACGTCCGACATGCCGCCGGCGGTGCCAGACCACAGCTTCTTCGGCCTGCTGTGGGCGGATGT
+GAAGTTCGAATGGCACGCGTTACCGTACCTGTTAGGTTTCAAGAAGGCCTGTGCAGGTTTCCGCAGCCTG
+GGCCGCGGCGCCACCGAAGAGCCCGCCGAAATGGGCTAATCGGGTTCGCTTGGCTCGATCGCCGATGATC
+TCGACCGCCACGACCGACCCCCTCACCTCGGTCGAACCTCGGCGAACCAACGCGGCAACGCCAGCCCATG
+ATCATTTGATTGGGTCCACGGAAGCAGGTAGCTTCCGTCGCATGCTTTTTGCGGCTTTGCGTGATGTCCA
+ATGGCGAAAACGACGCCTTGTCATCGCAATCGTCAGCACCGGCCTAGTTTTCGCGATGACGCTCGTTCTG
+ACCGGACTTGTGAACGGGTTTCGGGTCGAGGCCGAGCGAACCGTCGATTCCATGGGTGTCGACGCATTCG
+TGGTCAAGGCCGGCGCGGCAGGACCGTTCCTGGGTTCGACACCATTCGCCCAAATCGACCTGCCCCAGGT
+TGCTCGTGCGCCTGGCGTCTTGGCTGCCGCCCCACTAGCGACTGCGCCGTCGACGATCCGGCAGGGCACG
+TCAGCGCGAAACGTCACCGCGTTCGGGGCACCAGAGCACGGACCCGGCATGCCGCGGGTCTCGGACGGTC
+GGGCGCCATCGACGCCGGACGAGGTCGCGGTGTCGAGCACGCTGGGCCGAAACCTCGGCGACGATCTGCA
+AGTGGGTGCGCGCACTTTGCGGATCGTCGGCATCGTGCCCGAGTCAACCGCGCTGGCAAAGATTCCCAAC
+ATCTTCCTGACCACCGAAGGCCTACAGCAGTTGGCATACAACGGACAGCCGACAATCAGTTCGATCGGGA
+TCGACGGGATGCCCCGACAGCTCCCGGACGGCTATCAGACCGTCAATCGAGCGGATGCTGTCAGCGATCT
+GATGCGCCCGTTGAAGGTCGCGGTGGATGCGATCACGGTTGTGGCGGTCTTGCTGTGGATCGTTGCGGCG
+TTGATCGTCGGCTCGGTGGTCTACCTCTCTGCGTTGGAGCGGCTGCGTGACTTTGCGGTGTTCAAGGCGA
+TCGGCGTGCCGACGCGCTCGATTCTGGCCGGGCTGGCGCTGCAGGCGGTCGTCGTCGCGCTGCTCGCGGC
+GGTGGTTGGCGGCATCCTTTCGCTGCTGTTGGCGCCGTTGTTCCCGATGACTGTCGTGGTACCCCTGAGT
+GCCTTCGTGGCGCTACCGGCGATCGCGACTGTGATCGGTCTGCTGGCCAGCGTCGCAGGACTGCGGCGCG
+TGGTGGCGATCGATCCGGCACTAGCGTTCGGAGGTCCCTAGCCATGGGCGGCCTAACCATTTCCGACCTG
+GTCGTCGAGTATTCCAGCGGCGGGTACGCCGTGCGGCCGATCGACGGGTTAAGCCTCGACGTGGCGCCGG
+GGTCGCTGGTGATCTTGCTTGGGCCCAGCGGCTGCGGGAAGACGACCCTCTTGTCCTGCCTCGGCGGCAT
+CCTGCGCCCGAAGTCCGGCTCAATCAAGTTTGACGATGTCGACATCACGACGCTGGAGGGCGCCGCGCTG
+GCGAAGTATCGGCGTGACAAGGTAGGGATCGTCTTCCAGGCGTTCAACCTGGTCTCGAGCCTTACCGCCC
+TGGAGAACGTGATGGTCCCGCTGCGCGCGGCCGGCGTGTCACGAGCGGCCGCGCGTAAGCGTGCCGAGGA
+CCTGCTGATCCGAGTCAATCTCGGCGAACGAATGAAACACCGCCCGGGTGACATGAGCGGCGGCCAGCAG
+CAACGCGTCGCGGTCGCCCGCGCGATCGCGCTGGACCCGCAATTGATCCTTGCCGACGAACCGACCGCGC
+ACCTGGACTTCATCCAGGTGGAGGAGGTGCTGCGGCTGATCCGCTCGCTAGCGCAGGGCGACCGTGTGGT
+GGTGGTCGCGACCCACGACAGCCGGATGCTGCCGCTGGCCGATCGCGTCCTTGAGCTGATGCCGGCGCAG
+GTGTCGCCGAATCAGCCACCCGAAACGGTGCACGTGAAAGCCGGCGAGGTGCTGTTCGAGCAGTCCACAA
+TGGGCGATCTGATCTACGTGGTGTCCGAGGGCGAGTTCGAGATTGTGCGCGAATTGGCCGACGGCGGTGA
+GGAATTGGTCAAAACCGCCGCGCCTGGGGACTACTTCGGTGAAATCGGCGTGCTGTTTCACCTGCCACGC
+TCGGCAACGGTACGGGCTCGCAGCGACGCGACAGCCGTCGGTTATACGGCGCAGGCGTTTCGGGAGCGGC
+TGGGTGTGACGCGGGTGGCCGACCTGATTGAGCACCGCGAGCTTGCCAGCGAATAGTTCGGCACCAAGTC
+GCGATCCCTGAGGGTTGCGATGGGCGCGGCGCCGCCGCTGAATCGACCGCCCCCCACTGAGCCGCCGTGG
+AATACTCGATGAATCCTGCGGGCGTGTCCGCACTGCGTGTGGCTATGGAGTTGGGGAACATGTTGCTTGG
+GATAAGAACGTGAATGAGGGACCGCTCTTCACAATGTCAGGCACTGCCGTGAGAAGTCCGCTACTCGATC
+GGGTGTATGTGAGCAGTCCTGGCATGGGCCGAGATGCCAAGAGCCGCATCTCATGACCACCGCGCGACGA
+CGGCCCAAGCGGCGTGGTACCGATGCGCGAACCGCGCTGCGCAACGTTCCGATACTCGCCGATATCGACG
+ACGAACAGCTCGAACGACTCGCAACCACCGTAGAACGCCGCCACGTGCCCGCTAACCAGTGGCTCTTTCA
+TGCCGGAGAACCAGCGGACTCCATCTATATCGTCGACTCGGGGCGGTTCGTCGCTGTTGCCCCAGAGGGA
+CACGTATTTGCTGAGATGGCATCCGGCGACTCGATCGGAGACCTGGGGGTGATCGCCGGGGCTGCCCGCT
+CAGCGGGAGTGCGAGCTCTGCGAGACGGCGTGGTGTGGAGGATCGCCGCGGAGACGTTTACCGACATGCT
+CGAGGCAACCCCGCTACTGCAATCGGCGATGCTGCGAGCGATGGCGAGAATGCTACGCCAGTCACGACCC
+GCCAAGACGGCTCGGCGTCCGCGGGTCATCGGCGTGGTATCGAACGGGGACACCGCCGCGGCCCCGATGG
+TCGACGCGATCGCTACTTCACTGGACTCGCACGGTCGAACTGCCGTGATTGCGCCGCCCGTCGAAACCAC
+CTCCGCCGTTCAGGAGTACGACGAGCTCGTCGAGGCGTTCAGCGAAACCCTCGATCGCGCGGAGCGAAGC
+AACGATTGGGTCTTGGTGGTCGCCGACCGAGGCGCCGGCGACCTGTGGCGGCACTACGTTAGCGCGCAAA
+GCGACCGACTCGTGGTCCTGGTGGATCAACGGTATCCGCCGGATGCGGTCGATTCGCTTGCTACCCAACG
+GCCAGTGCACCTGATCACATGTCTGGCAGAACCGGATCCAAGTTGGTGGGATCGGTTGGCGCCGGTTTCG
+CATCATCCGGCCAACTCCGACGGCTTCGGTGCCCTTGCTCGCAGAATCGCCGGCCGATCGCTCGGCCTGG
+TGATGGCCGGTGGCGGAGCCCGGGGACTGGCGCATTTCGGTGTTTACCAAGAGCTCACCGAAGCCGGCGT
+CGTCATCGATCGGTTTGGCGGAACAAGTTCGGGTGCAATCGCTTCCGCAGCGTTCGCGCTGGGGATGGAC
+GCCGGGGATGCGATCGCCGCGGCGCGAGAGTTCATCGCAGGAAGCGACCCACTCGGCGACTACACGATCC
+CAATATCCGCCCTCACGCGAGGTGGACGCGTCGATCGTCTGGTGCAGGGATTCTTCGGCAACACGTTGAT
+CGAACATCTGCCCAGAGGGTTCTTCTCCGTCTCCGCCGACATGATCACCGGCGATCAGATCATCCATCGG
+CGGGGATCCGTCTCGGGCGCCGTGCGCGCATCGATCTCGATCCCCGGTCTCATCCCGCCAGTGCACAATG
+GCGAGCAGCTGCTCGTCGACGGTGGGCTGTTGAACAATCTGCCGGCCAACGTGATGTGCGCCGATACCGA
+TGGCGAAGTCATCTGCGTCGACCTCCGCCGAACGTTCGTGCCGTCGAAGGGCTTTGGCCTGCTGCCGCCA
+ATCGTTACGCCGCCCGGGCTCCTCCGGCGGCTTTTGACCGGCACGGATAACGCGCTACCACCGCTGCAAG
+AGACGTTGCTGCGCGCCTTCGACCTTGCCGCCTCCACCGCAAACCTGCGCGAGCTTCCTCGCGTTGCGGC
+CATCATCGAGCCCGACGTGTCGAAGATCGGAGTGTTGAACTTCAAGCAGATTGATGCCGCCCTAGAGGCT
+GGGCGGATGGCAGCCCGTGCGGCTTTGCAAGCACAGCCGGACCTGGTGCGCTGAACCCGACCAAGTGCCG
+CTACGGCCCACTCAGGTGTCCAGCACCGGGCGTACGCGCTGCGCCGGGCGGTCCGGTGTGATCTCATCAG
+CAGCTATGAGCATCAAAGTTGCGCTGGAGCACCGCACCAGCTACACCTTTGACCGGCTGGTGCGGGTGTA
+TCCGCACATCGTGCGGCTACGCCCGGCGCCGCACTCCCGCACCTCCATCGAGGCCTACTCGCTGCGCATC
+GAGCCCGCCGACCACTTCATCAACTGGCAGCAGGACGCGCTGGGCAACTTTCTGGCGCGGCTGGTCTTTC
+CGAATCCCATGCGCCAACTGCGTATTACCGTCGGGCTTATCGCCGACCTCAAGGTGATCAACCCCTTCGA
+CTTCTTTATCGAGGACTGGGCCGAGATATGGCCCTGCGCAGGGATGGCCTACCCCAAGGCGCTCGCCGAT
+GACCTGAGGCCGTACTTGCGGCCGGTCGACGAAGACGGCGACGGTTCGGGCCCCGGCGAGCTCACGCAGG
+CCTGGGTGCGCAACTTCACGGTGCCCGATGGCACCCGCACCATCGACTTCTTGGTCGCACTCAACCGCGC
+GATCAACGCCGACGTCGGCTACTGCGTGCGCATGGAGCCCGGAGTTCAGACACCGGATTTCACGCTGCGC
+ACCGGCGTCGGCTCGTGCCGGGACTCGGCGTGGCTGCTGGTCTCGATCCTGCGTCAGTTCGGGCTGGCCG
+CCCGGTTCGTGTCCGGCTACCTGGTTCAGCTGGCATCCGACATCGAAGCGCTCGACGGGCCGTCGGGGCC
+CGCCGCCGACTTCACCGACCTGCACGCGTGGTCCGAGGCATACATCCCGGGTGCCGGCTGGATCGGGCTG
+GACCCGACGTCGGGGCTGTTGGCCGGCGAGGGCCACATTCCGCTGGCGGCTACGCCCCACCCCGCCAGCG
+CGGCACCCATCAGCGGCGGCACCGACGTGTGCGACACCGTGCTGGAGTTCTCCAACACCGTCACCCGCGT
+ACACGAAGACCCACGTGTCACGTTGCCCTACACCGACGAGTCCTGGAAGACCATCTGTGAGGTGGGCCAG
+CGCGTCGATGAGCGGCTGGCCGCCGCCGACGTCCGGCTGACCGTCGGCGGCGAACCGACGTTCGTGTCGG
+TGGATAACCAGGTCGCCGAAGAGTGGCGGACGGCGGCCGACGGCCCACACAAACGCGAACGGGCATCCGA
+CCTGGCCGCCCGCTTGAAGGCGGTGTGGGCCCCGCAGGGACTCATCCACCGCGGTCAGGGCAGGTGGTAT
+CCCGGAGAGCCGTTGCCGCGCTGGCAGATTGCGCTGTATTGGCGCACCGACGGGCGGCCGCTGTGGACCA
+ACGACGCGCTGTTGGCCGACCCCTGGGGCGCCCCGCCCGCCGACCCCGTCGACGACGACGCGGCCTACCG
+GGTGCTCGCCGGGATCGCCGACGGCTTGGGGCTGCCGATCTCGCAGGTGCGGCCCGCCTACGAAGACCCG
+TTGAGCCGGCTGGCTGCGGCCGTGCGAATGCCAGCCGGCGACCCGGTGGAATCCGGTGACGACCTCGGCT
+GCGACACCAACCCCGACACCCCCACCGGCCGCGCCGCGCTGCTGGCGCCTCGATGAGGCCATCACCTCTC
+CGGCTGCGTACGTGCTGCCGCTGCACCGCCGCGACGACGGGCAAGGCTGGGCCAGCGCGAACTGGCGGCT
+GCGCCGCGGTCGCATCGTGTTGCTCGAAGGGGATTCGCCGGCGGGCCTGCGGCTGCCGCTGGATTCGATC
+AGCTGGCGCCCACCCCGGGCATCGTTTGACGCCGACCCGGTAGCTGTGCGATCCACATTGCCGGCGGAGC
+CCCACACCGACCGGGCCGTAGTGGAGGATCCCGAGACGGCTCCGACCACCGCGTTGGTCGCCGAGGTCCG
+GGGTGGGCTGGTGCACATCTTCTTGCCGCCCACCGACGCGCTCGAGCACTTCATCGACCTTGTCGCCCGA
+GTCGAGGCCGCGGCGACGACGGCCAACTGCCCGGTGGTGATCGAGGGCTACGGCCCACCCCCGGACCCGC
+GGCTGACGTCCACCACAATCACCCCCGACCCCGGCGTCATCGAGGTCAACATCGCGCCCACCGCCTCTTT
+TGCAGAACAACGGCAACAGCTGGAAACCCTGTATCAACAAGCGCGCCTGGCCCGACTCACCACCGAAGCG
+TTCGACGTCGACGGCACGCACGGCGGCACCGGCGGCGGCAACCACATCACGCTTGGCGGCGTCACACCCG
+CGGACTCACCGCTGCTGCGCCGGCCCGACCTGCTGGTTTCACTGCTGACCTACTGGCAGCGACACCCGTC
+GTTGTCCTACTTGTTCGCCGGGCGTTTCGTCGGCACCACGTCACAGGCGCCCCGGGTTGACGAGGGCCGC
+GCCGAGGCGCTCTACGAACTCGAGATCGCGTTCGCCGAGATCCTCCGGCTGTCGCCGTCGTCCGGGGGCG
+GCCGGCCCCAACCGTGGGTGACCGACCGCGCGCTGCGGCACCTGCTCACCGACATCACCGGCAACACCCA
+TCGCGCCGAATTCTGCATCGACAAGCTCTACAGCCCCGACAGCGCCCGGGGCAGGCTCGGCCTGCTGGAG
+CTCCGCGGGTTCGAGATGCCGCCGCACCTGCACATGGCGATGGTGCAGTCGCTGCTGGTGCGCTCGCTGG
+TGGCGTGGTTCTGGGACCAACCGCTGCGCGCCCCGCTGATCCGCCACGGCGCCAACTTGCACGGTCGATA
+TCTATTGCCGCACTTCTTGATTCATGACATCGCCGACGTCGCAGCCGACCTGCGCGCGCACGGCATCGCG
+TTCGAGACTAGCTGGCTGGACCCGTTCACCGAGTTCCGCTTCCCGCGCATCGGCACCGCCGTATTCGACG
+GCATTGAGATCGAGCTGCGCGGGGCCATCGAGCCATGGCACACCCTTGGCGAGGAGGCCACCGCGGCAGG
+CACCGCGCGCTATGTCGACTCGTCGGTCGAGCGCATCCAGGTCCGCATCATCGGCGCCGACCGGCACCGC
+TACGTGGTGACCTGTAACGGCTACCCGATGCCGTTGCTGGCTACCGACAACCCCGACATCCACGTGGGTG
+GTGTGCGGTTCAAAGCGTGGCAGCCGCCCAGCGCGCTACACCCGACCATCACGGTCGACGGCCCGTTGCG
+GTTCGAGCTCATCGACATCGCCACCGCTACCTCGTGCGGCGGCTGTACCTACCATGTCGCCCATCCGGGC
+GGCCGCGCCTACGACGAGCCCCCGGTCAACGCCGTGGAGGCGGAGGCCCGCCGCGCCCGGCGCTTCGAGG
+CGACCGGCTTCACCCCGGGCAAGCTCGACCTGTCCGACATCCGGGAGAAACAGGCCAGGATATCCACCGA
+TATCGGCGCGCCGGGCATCCTCGACCTACGACGCGTGCGTACCGTGCAACAGTAATGGCACCCTCAGCTT
+CTGCCGCTACCAACGGCTACGACGTCGACCGCCTGCTGGCCGGATACCGCACCGCGCGTGCCCAGGAAAC
+ACTGTTCGACCTGCGGGACGGCCCGGGAGCCGGCTATGACGAATTCGTCGACGACGACGGCAACGTGCGA
+CCGACCTGGACCGAGCTCGCCGACGCGGTCGCCGAACGTGGCAAGGCGGGGCTGGACCGGCTGCGCTCGG
+TGGTGCACAGCCTGATCGACCACGACGGCATCACCTACACCGCAATCGATGCACACCGGGACGCGCTGAC
+CGGCGACCATGATCTGGAACCGGGGCCGTGGCGCCTGGACCCGCTGCCGCTGGTGATTTCCGCGGCCGAT
+TGGGAAGTGCTGGAGGCCGGCTTGGTGCAGCGATCGCGCTTGCTTGATGCCATCCTCGCGGACTTGTACG
+GGCCCCGCAGCATGCTCACCGAGGGTGTCCTGCCGCCAGAGATGCTGTTCGCTCATCCCGGCTACGTGCG
+TGCCGCTAACGGGATCCAGATGCCTGGGCGCCACCAACTTTTCATGCACGCCTGTGATCTCAGCCGGTTG
+CCCGACGGGACTTTTCAGGTCAACGCCGACTGGACGCAGGCGCCCTCGGGCTCCGGCTATGCGATGGCCG
+ATCGACGTGTCGTCGCGCACGCCGTTCCCGATCTGTACGAGGAACTGGCGCCGCGACCCACCACACCGTT
+CGCCCAGGCGCTCCGGCTGGCACTGATTGACGCGGCACCCGATGTCGCCCAAGACCCCGTCGTGGTGGTG
+CTCAGCCCGGGCATCTATTCAGAAACCGCTTTCGACCAGGCGTATCTCGCAACGCTGCTGGGTTTCCCGC
+TAGTGGAAAGCGCGGACTTGGTGGTGCGCGACGGCAAGCTGTGGATGCGTTCGCTGGGCACGCTGAAACG
+CGTTGACGTCGTTCTTCGCCGCGTCGATGCCCACTACGCGGATCCACTGGATCTACGCGCCGATTCCAGG
+CTCGGTGTCGTCGGTTTGGTGGAAGCGCAGCACCGCGGAACAGTGACCGTCGTCAACACGCTGGGCAGCG
+GCATCCTGGAGAACCCAGGCCTGTTGCGCTTCCTGCCGCAGCTATCCGAGCGCCTGCTCGACGAAAGCCC
+GCTGCTGCACACCGCTCCGGTCTACTGGGGCGGCATCGCCAGCGAACGCTCACACCTACTGGCCAATGTC
+TCGTCGCTGCTGATCAAAAGCACTGTCAGCGGGGAAACTCTTGTCGGACCGACACTTTCGTCTGCACAAC
+TGGCCGATCTGGCAGTGCGTATCGAGGCGATGCCGTGGCAGTGGGTGGGCCAGGAGCTGCCGCAGTTCTC
+GTCGGCGCCCACCAACCATGCCGGGGTGTTGTCGTCCGCCGGGGTAGGCATGCGACTGTTCACCGTTGCC
+CAGCGCAGTGGTTACGCGCCGATGATCGGCGGCCTCGGCTATGTACTGGCGCCCGGTCCTGCCGCATATA
+CGCTGAAAACCGTTGCAGCAAAAGATATCTGGGTGCGCCCAACGGAGCGTGCGCATGCCGAGGTGATAAC
+GGTGCCGGTGTTGGCGCCGCCGGCCAAAACCGGAGCGGGCACCTGGGCGGTCAGCTCTCCGCGCGTGCTG
+TCCGATCTGTTCTGGATGGGCCGCTACGGCGAGCGCGCGGAGAACATGGCCCGGCTGCTGATCGTCACCC
+GCGAGCGCTACCACGTTTTCCGGCACCAGCAGGACACCGATGAAAGCGAGTGCGTGCCGGTGCTGATGGC
+CGCGCTGGGCAAGATCACCGGATATGACACCGCAACTGGCGCCGGCAGCGCTTACGACCGGGCCGACATG
+ATCGCGGTCGCCCCGTCGACACTGTGGTCTTTGACCGTGGATCCGGACCGGCCGGGTTCCCTTGTTCAGT
+CGGTGGAGGGGCTGGCACTTGCCGCCCGGGCGGTGCGCGACCAGCTGTCCAACGACACCTGGATGGTGCT
+GGCCAATGTGGAACGCGCGGTGGAGCACAAGTCCGACCCGCCGCAGTCGCTGGCAGAGGCGGACGCCGTG
+CTTGCGTCGGCTCAGGCGGAGACGCTAGCCGGCATGCTGACGTTGTCCGGGGTGGCCGGCGAGTCGATGG
+TGCACGACGTGGGCTGGACGATGATGGACATCGGCAAGCGTATCGAACGCGGCCTGTGGCTGACCGCGTT
+GCTACAAGCCACGTTGAGCACCGTGCGCCACCCCGCCGCCGAGCAAGCCATCATCGAGGCAACCCTGGTG
+GCGTGTGAATCGTCGGTTATCTATCGGCGCCGCACCGTAGGCAAGTTCAGTGTCGCCGCTGTGACCGAGC
+TGATGTTGTTCGACGCCCAGAACCCGCGCTCGCTGGTGTATCAGCTGGAACGGCTGCGCGCCGACCTGAA
+AGACCTGCCTGGCTCGTCGGGATCGTCTCGTCCGGAACGGATGGTGGACGAGATGAACACCCGCCTGCGC
+CGCTCACACCCAGAAGAGTTGGAAGAGGTCTCCGCCGACGGGCTGCGCGCCGAGTTGGCGGAACTGCTGG
+CCGGGATACATGCCTCGCTGCGTGACGTGGCCGACGTCCTCACCGCCACTCAGTTGGCGTTGCCCGGCGG
+CATGCAACCGCTGTGGGGTCCAGACCAACGGCGGGTGATGCCGGCCTAAACGGTGCGACGGCTGTGAGCC
+GGCTCGAAATCCGGGGCCACCTCGTCGACGACGGTGTGGATGAACCGCATCTTCTCCAGCACAGCGGCCG
+GCAGCACAAAGGGGTATAGGTCGTCGTGGCCCATCGAGCGATTGACCATGTTCAGCGACCACGACAGCGG
+CAGCCACTTGTCGATGATGGTATTAAAAGCGCTGGGGCCCAACGCCGGCCGGTCGAAGGTTGCCGACGCC
+GGTGCCAGGCCGCACCAGGCCGCGGTGTCCAGGGCGTCGCGGATATGCAGGTAATGAGCGAACGTCTCGG
+CCCAATCCTCACTCGCGTGCATGGTCGCATACGACGAGACAAAGCTGTCCTGCCAACCTTCCGGCGGGCC
+GCCACGGTAATGCCGATCCAACGCCTGGGAGTAGTCAGCGTCCGGGTCTCCGAACAACTCGTTGAACCGG
+GACAGATAGTCGCTTGACGAGGCGATGAGTCGATAGAAGTAGTAGTGCCCGATCTCGTGGCGGAAGTGCC
+CAAGCAGGGTCCGATACGGCTCGTCCATCTCGACCCGCAGCTGCTCCCGATGCACATCGTCGCCTTCGGC
+GAGATCCAGTGTGATGACTCCGTTCTGGTGTCCGGTGGTCACGTTCTCGTGCGCGCTGGACAATAGCCGG
+AAGGCCAACCCATGGTCAGGATCCTGGTCGCGGCCGACGATCGGCAGCTTCAGCTCGTGTAGCTCGGCGA
+TCAGCCGCCGCTTGGCACCTTCGGCTCGGGCGAACTCCGCCAGCCCGGCGGTGTTGGTATCGCTGGGCCG
+CTCGATGGTCAGCACACAAGAACTGCAAAGTCCGCCGAGCTGATCACTGGGCACCAGCCAATTGCATTGC
+GCGAGGTGGAGATTGGCGCAGAGTTGGACATCGGCGTCGTCGGCGATGACCAGCAGCGCCATCCGCCCAA
+GAGAAAACCCCAGCGCGCTGCCGCACGACAGGCAGGCGGAGTTCTCGAATGCCAGGCGCTGCCCGCAATT
+TGGACAGTGGAAGTCACGCATGCAGCGCATCACCTTCGAAGGGCACGACATCGACAGAAACGTCGATCAC
+ACTGTTCTCGGAGTTGGTGTAGATGATGCCGCGTAGCGGCGGCACGTCTGCGTAGTCGCGGCCGCGGCCC
+ACGACGATGTAGCGCTGGTCGACCAACTGGTCATTGGTGGGATCCAGCCCCAGCCACTCGAACCGCCCGG
+GCTGCTGCGGAGTCCACACCGAGGCCCAGGCATGCGTCGCGTCGATGCCGATCATCCGATCCTTTCCGGG
+CGGCGGGTCGGTGGCCAGGTAGCCCGACACATAACAGGCCGCCAAACCGTTGGCCCGTAGGCAGGCGATC
+GCCAGCCTGGCGAAATCTTGGCATACCCCTTCGCGGGCCAGCAGCACCTCGTTGACTCCTGTGGAAATCG
+TCGTGGAACCCGAGCGGTAGGTGAAGTCGGTGTAGATCCGCGACGCGAGATCGCGCAATACCTCGACCAG
+GGGGCGTTTGGGCAGGAAGCTAGGAGCCGCGTACTCACGCACCGCATCGGTGATCTCCGGCGGGTTCAAG
+TCCAGGGTGAACTCGGTGGCTAGCGATCCGGGCAGCCCGGCGGGCCGGGCCGCCTCCCACGGTTGCAGCG
+CCGGCCCGCTGGTGTAAAGCCCGGGCGGCGGCGGGGACACGTCGACGATGGAATCGCTGGTGATCGTCAA
+GGTGCGGTGCGGTTCGGTGACGTGGAAATAGGAGCTGATGTTGCCGTACCCGTCGCGACTGGTGGACCGG
+TCGGCGGGGGCCGGGTCGATGGTCAGCCGGTGTGCGACACAACGCTGCCGCAGCGAATTCCGCGGCGTGA
+GAAACCCGCGGCCATAGGAGCTGGTCACCACGTCGGAGTAGCGGTATTCGGTGCGGTGTGTTACTCGATA
+GCGGTGAGTGCCCGACAACGGCAACGACAACGAGCTATCTGCTGACAAAAAGCTACCTCCTGGCTGATCA
+CATCACACGCCGGCGGCTCGTCCGGCGCGATCGTCGCGCAATGTGGCGCCAAGCGCACCATAGCCGGAGC
+ACAATTAAAGCGTGGCTACCTGGGACGACGTCGCCCGTATCGTGGGTGGGCTGCCGCTGACCGCGGAGCA
+GGCACCGCACGACTGGCGTGTTGGCCGCAAGCTGCTGGCCTGGGAACGGCCGCTGCGCAAGTCCGACCGC
+GAAGCCCTGACCAGGGCCGGATCGGAGCCACCGTCCGGCGACATCGTCGGTGTCCGAGTGTCGGACGAGG
+GGGTGAAGTTCGCCTTGATTGCCGACGAGCCGGGCGTGTACTTCACCACCCCGCATTTCGACGGCTATCC
+AGCGGTGCTGGTCAGGCTGGCCGAGATCGAGGTTCGCGACCTCGAGGAGTTGATCACCGAGGCCTGGCTG
+ATGCAGGCGCCGAAGCAGCTGGTGCAGGCGTTTCTCGCCAATTCAGGCTGACATGCCCGACGGGCCCGGG
+CGTTCGATTACCCGTTGTAGATCGGTGACACACGCTTGGACGATATCGGCGCGCACCACTTCGTTGCTGC
+CACAAGCAGCCGATTGCAGTGTCGACGCGGTTGCGCGGGCGGCGGCCGCGTGCTCGTTCGCTGCCGTCGG
+ATCCGCGTCGGCCAGGCCGGTTCCCGCGGCGAGGTCGGTGAGCACGGCGTGCACGGGCGTTGGCAGCTTA
+TCGCCACCAGGCCCGGCAATGGTGCGAGCCAGATGCAACACCGAACTGACCAGCAGGGCCAGGTAGACGG
+CCTGTTGATCGAGATCGCGGACAGTGCTGCGCACCCCCCATCGGCGGGGCGCTCGCCGCGCCACCATGGC
+AGCGTTGGCGCGCACCTCGATGAGCCCGTTCAGCTGCTGATGCAGTCGATCAGCGGCTGCCATCGGCCAG
+TCGGGCGGGGCGCTGGTGGGATCGCTCACCGTGTTCACCAGCTCGGCGAGGATGTCGCGCACAGCGGCCA
+ACACGTCGGCGCGCGCACTGCACAGCATGACCACCGGGTCGGGCGGGAAGAGCAGAATGCTGAACACGAT
+AGCCAGCCCACCACCGACCAGCGCGTCGAAGAGGCGTTCGAAAACCACACTGCCGTTGGACGCGAAGACC
+AAGACCAGCACCGCGGAGACGGCGGCCTGGTTGATGAACATTAAGCCTTGCGCGACCAACCCGCGTGCGC
+ACAGCACCGCGACCGACAACGCGATGAACACCACCACACCCATGGCGATCGGTCCGGAACCAAGCAGAGC
+ATGCACGCCAGCACCCAGCACGATCCCCAGCGCCACCCCGACGATCATCTGTTGGGCACGTCGTGCGCGC
+AGCACGTTGGTCGCCGACATGCACACCACAGCCGAAATCGGCGCGAAGAACGCCTGCGGATGGTTGAACA
+CGTCATGGGTGAGATACCACGCGAGGCCGGCGACGACCGATGTCTGGGTGATCGGCCACAGCACGGTGCG
+CAACCGTTGGGCGACCGCACGGCCGCCGCAGGCCGTCCTGACTAGCAGCGAAGCGCTCATGAACGCCTAT
+TTATTCACACTCGGGTGCGACGTCGTAACCGCAAAGATCTGGTCATGCCGCTGGACCCGCTTGGGCTGGG
+CATCTATTCCGGACTCCTTACGTTGCTGAGCGGTAATGGGCGCCGGCGCGTCGGTGAGCGGATCGACGCC
+GCCGCCGGTCTTCGGGAACGCGATCACCTCACGGATCGAGTCCATCCCGGCCAGCAGCGCGGTGGTCCGG
+TCCCACCCGAACGCGATTCCGCCGTGCGGCGGTGCGCCAAACATGAACGCCTCCAACAGGAATCCGAACT
+TTTCCTCCACCTCGGCCTTGTCCAGGCCCATCACCGCGAACACCCGTTCCTGGATATCACGGCGGTGGAT
+ACGCACCGAGCCGCCACCGATCTCGTGGCCGTTGCAGACGATGTCGTACGCGTCGGCCAGCACGCTGCCG
+GTATCGGATTCGATGCGGTCCTCCCATTCCGGTTTCGGCGCGGTGAAGGCATGGTGCACCGCGGTCCAGG
+CCCCCGAGCCGACCGCGACCTCACCGGCGGCGGTCGCTTCGTCGGCCGGCTCGAACAGCGGCGGGTCAAC
+GACCCAGACGAATGCCCACGCATCGGGGTCAATCAGGCCCAGCCGGTTGGCGATCTCGACGCGGGCCGCG
+CCCAGCAGTGCCCGCGACGATTTGACCGGACCGGCCGAGAAGAAGATGCAATCGCCGGGTTTGGCCCCGA
+CATGGTCGGCCAGTCCGGTGCGCTCGGCCTCGGTCAGGTTTTTGGCCACCGGACCGCCCAGCGTGCCGTC
+TTCGGCGACCAGCACGTAGGCCAGTCCGCGGTGGCCGCGCTGCTTGGCCCAGTCCTGCCAGCCGTCCAGC
+GTGCGCCGCGGCTGCGACGCCCCGCCAGGCATCACCACCGCGCCCACATACGGTGCCTGGAAGACACGAA
+ATGTGGTGTCGGAGAAGAAATCCGTGCATTCGACGAGCTCCAGCCCGAACCGCAGGTCGGGTTTGTCCGT
+ACCGAATCGGCGCATCGCTTCGGCATAGCCGATCCGCGGGATGGGCGTCGGAATCCGGTAGCCTATCAGC
+GCCCACAGCTCGGTCAGAACTTCCTCGGAGATCGCGATGATGTCCTCGGCGTCGACGAAGCTCATCTCCA
+TATCGAGCTGGGTGAATTCGGGCTGGCGGTCGGCGCGGAAGTCCTCGTCGCGGTAGCAGCGGGCGATCTG
+GTAGTAGCGTTCCATCCCCGCCACCATCAGCAGCTGCTTGAACAGCTGCGGGCTCTGCGGTAGGGCGTAA
+AACGAACCGGGGTGCAGTCGGGCCGGCACCAGGAAGTCGCGCGCTCCCTCCGGGGTCGAGCGGGTGATCG
+TCGGCGTCTCGATCTCGACGAAGTCGTGACGCGCCAGCACCGCGCGCGCAGCGGCATTCACCCGGGAACG
+CAGTCGAATCGCCGCAGCGGGGTCGTCGCGGCGCAGATCGAGGTAGCGGTACTTCAGTCGCAACTCCTCA
+CCCGCCGGTTCGTCCAGCTGAAACGGCAGCGGCGCACATTCGCCCAGCACGGTCAACGACGTGGCGTTGA
+CCTCGATCTCGCCGGTGGCGATCTCCGGGTTGGCGTTGCCTTCCGGGCGGATCTCGACGACGCCGGCCAC
+CGATACGCAGAATTCCGCACGCAGCCGGTGAGCCTGCGCCAGCACCTCAGTGTCCTGGGGGTCGCGGAAC
+ACCACCTGTGCGATGCCCGAAGCGTCCCGCAGATCGATGAAGATCACGCCGCCGTGGTCGCGGCGGCGAG
+CCACCCAGCCGGCCAATGTCACCTGCTGCCCGGCGTCGCCTTCCCGTAGCAAACCCGCGGCGTGGCTGCG
+CAGCACAAACACTCCCCTTCAACCGGATTAACCGACTGCTCAGTCTAGAGCTGCCCGCGGCGCACATCGG
+TCACGCAGGGTAATTTCGGCTCATCTCAACAAACATTGCAACAGGCATTGCCCTAGTCGGACCCGGTGCC
+GTCGGAACGACGGTCGCCGCGCTGTTGCACAAGGCCGGGTATTCGCCGCTGTTGTGCGGCCACACTCCGC
+GCGCCGGGATCGAGCTCCGGCGAGACGGCGCAGACCCCATCGTGGTGCCCGGTCCGGTGCACACCAGTCC
+TCGGGAGGTTGCCGGCCCGGTCGATGTGCTGATCCTGGCGGTCAAGGCCACTCAGAACGACGCCGCACGT
+CCCTGGCTGACCCGCCTGTGCGACGAGCGCACCGTGGTGGCCGTGCTGCAAAACGGTGTCGAACAGGTCG
+AGCAGGTCCAGCCGCATTGTCCGTCCTCGGCCGTGGTTCCCGCGATCGTGTGGTGTTCGGCCGAGACCCA
+GCCGCAAGGGTGGGTGCGCTTGCGCGGTGAAGCCGCACTGGTCGTTCCCACCGGGCCCGCGGCCGAGCAG
+TTCGCCGGGCTGCTGCGCGGTGCCGGCGCCACGGTGGACTGCGACCCCGACTTCACCACGGCGGCCTGGC
+GCAAACTACTGGTCAACGCGCTGGCGGGATTTATGGTGCTGTCCGGACGGCGGTCGGCAATGTTCCGCCG
+CGACGACGTCGCGGCATTGTCGCGCCGCTATGTCGCCGAATGCCTGGCGGTGGCGCGCGCTGAGGGTGCC
+CGACTCGATGACGACGTCGTCGACGAAGTGGTCCGCCTCGTCCGGTCGGCCCCGCAGGACATGGGCACCT
+CGATGCTGGCCGACCGGGCAGCCCACCGGCCACTGGAATGGGATTTGCGCAATGGGGTGATCGTCCGCAA
+GGCCCGCGCCCACGGCCTGGCCACCCCGATCAGCGACGTGCTGGTGCCGCTGCTGGCGGCTGCTAGCGAC
+GGTCCCGGATAGCAATGTAGCTAATGTCTAGATCATGTACCCCTGCGAGCGGGTAGGCCTGAGCTTCACC
+GAGACCGCGCCTTACCTCTTCCGCAACACCGTCGACCTGGCCATCACGCCCGAGCAACTCTTCGAAGTGC
+TCGCCGACCCGCAGGCCTGGCCACGCTGGGCAACGGTGATCACAAAGGTGACCTGGACCAGTCCCGAACC
+GTTCGGCGCCGGCACCACCCGCATCGTCGAGATGCGCGGGGGTATCGTCGGCGACGAAGAGTTCATTTCG
+TGGGAGCCTTTCACCCGCATGGCATTTCGGTTCAACGAATGCTCCACCAGAGCCGTCGGCGCGTTCGCCG
+AAGACTATCGGGTGCAGGCCATCCCCGGTGGTTGCCGGCTGACCTGGACCATGGCGCAGAAACTCGCCGG
+CCCGGCGCGGCCGGCGCTGTTCGTCTTCCGGCCCCTGCTGAACCTGGCGCTGCGCCGGTTTCTAAGGAAT
+CTGCGCAGGTATACCGACGCTCGGTTCGCCGCTGCGCAGCAGAGTTAGGCTGGATCGGCCGATTTCGGGA
+GCGTGCGATGACCTTCAACGAGGGTGTGCAAATCGATACCAGCACCACGTCGACCTCGGGTAGCGGTGGC
+GGGCGGCGCTTGGCCATCGGGGGCGGCCTCGGTGGGCTACTGGTGGTGGTGGTCGCAATGCTGCTCGGCG
+TCGATCCCGGTGGCGTGCTGAGCCAACAACCTCTCGACACCCGCGACCACGTAGCACCCGGTTTCGACCT
+GAGCCAGTGCAGAACCGGGGCCGATGCCAACAGGTTCGTGCAGTGCCGGGTGGTGGCCACCGGTAACTCC
+GTGGACGCGGTATGGAAACCGCTGTTGCCCGGCTACACCCGCCCACACATGCGGCTGTTCAGCGGCCAGG
+TAGGCACCGGATGCGGACCGGCCAGCAGCGAGGTCGGGCCGTTCTACTGCCCAGTGGACAAAACGGCCTA
+CTTCGACACCGACTTCTTCCAGGTGCTGGTCACCCAATTCGGTTCCAGTGGCGGCCCATTCGCGGAAGAG
+TATGTGGTGGCCCATGAATACGGCCATCACGTGCAGAACCTGCTGGGGGTGCTCGGCCGCGCTCAGCAGG
+GTGCGCAAGGTGCTGCGGGCAGTGGCGTGCGCACGGAGTTGCAGGCGGACTGCTACGCCGGGGTGTGGGC
+ATACTACGCGTCCACCGTCAAGCAGGAGAGCACCGGTGTGCCTTACCTGGAGCCGTTGAGCGACAAGGAC
+ATCCAAGACGCCCTCGCGGCCGCGGCAGCGGTGGGCGACGACCGTATCCAACAGCAGACGACCGGACGCA
+CCAACCCCGAGACCTGGACGCATGGCTCGGCCGCGCAACGGCAGAAGTGGTTCACTGTCGGATACCAGAC
+TGGCGACCCCAACATCTGCGACACCTTTTCCGCCGCGGACCTGGGGTAGGCGAATTACCAGGGACGAGTC
+GAGCACTGCACGCCGCTGCCGCCGTCCTGCGACACCACCACCTGGCCGTCTACAACAATCTCGCAGTGGA
+ACTCCGGATTGACCCGCAGGCCGCCGCTGGCGGTGACGATCGCCCACTGGCTCGGGTTTGCCAGCGTGGC
+GGTATAGACCAGCGGCTGACCGCCAGCGATCGGAGTGTGCAAGGTAATCATGTACTTCGATGAATCGGCA
+TTGAAAGCCGCCATGCTGGGCGGATCGGCGCTCATGTACCGAATGTTGGCCATCAGGTCGCTGGTGGTCG
+TGACGGTGTAGGTCACCTGATGCCCGACCGGATCCGCGCGGGCAATCGCCGGGATGACCCCGCTGAGCGC
+GGCTCCGGCAAACGTCACCAGCGCGACGGCGCTTGGCACTGTGCGCACGGACGTCATATCTAAAACGCTA
+CCGGATGCGTTACCGACGCCGGCCGGCACTGCATGCGATGACCGTCGCCCGCCATCCGGGCAAGCCGAAT
+TGCGTGAGCCGCACCGCCATTAGCAGCCGAAAGCTGTCGTTGGCCTCGGGCTTCGCGCTCTGGAGGCGAT
+CGCTGGTGTGAGCGTCTACGCAGTTCAGAAAGCCTTTCCGAGCAACGCGCCGAGGTAACTTCAGATTTCG
+GCAGCCGGTTTACCCGCAGGTAAACCAGGGCGGGTATGAAACGTGAGTGGGCGCCGATCTGAAGCAGCCG
+CAGGATGCCGATTCACCCCCGAAAGGGGTTAGCCGCCGTAGGTTCCTGACGACGGGCGCGGCAGCGGTTG
+TTGGGACAGGTGTCGGCGCGGGCGGGACCGCGCTGCTGTCGTCACACCCCCGGGGTCCTGCCGTCTGGTA
+TCAACGTGGTCGGAGCGGCGCGCCTCCGGTGGGTGGTCTGCACCTGCAGTTCGGCCGGAATGCCAGCACC
+GAAATGGTGGTGTCCTAGCATACCACGGACACCGTCGGCAATCCGCGAGTCATGCTGGGCACGCCAACCT
+CTGGCTTCGGCAGCGTCGTGGTGGCCGAGACCCGGTCGTACCGGGATGCGAAGTCCAATACCGAGGTGCG
+CGTCAACCACGCTCACCTGACCAACCTGACACCCGATACCGACTACGTCTACGCCGCGGTGCACGACGGT
+ACAACTCCGGAGCTCGGGACCGCACGGACCGCACCGTCGGGTCGAAAACCGCTACGCTTCACCAGCTTCG
+GTGATCAGTCCACTCCCGCGTTGGGCAGACTGGCCGACGGGAGGTACGTCAGCGACAACATCGGATCCCC
+CTTCGCCGGTGACATCACGATTGCGATCGAGCGTATTGCCCCGTTGTTCAACCTGATCAACGGTGACCTG
+TGTTACGCCAACCTGGCACAAGACCGAATTCGCACCTGGTCGGACTGGTTTGACAACAACACCCGCTCGG
+CGCGCTACCGGCCGTGGATGCCGGCAGCGGGCAATCACGAGAACGAAGTCGGTAACGGGCCAATCGGTTA
+TGACGCCTATCAGACCTACTTTGCGGTACCCGACTCGGGATCCAGCCCGCAACTGCGCGGGCTATGGTAC
+TCGTTCACCGCCGGCTCGGTGCGGGTGATCAGCCTGCACAACGATGATGTGTGCTACCAGGACGGTGGCA
+ACTCCTACGTACGCGGCTATTCGGGCGGCGAACAACGGCGCTGGCTGCAAGCCGAACTCGCCAACGCTCG
+GCGCGACTCGGAAATCGACTGGGTGGTCGTCTGCATGCATCAGACCGCGATCTCCACCGCCGACGACAAC
+AACGGTGCCGACCTCGGAATCCGGCAGGAATGGCTACCGCTGTTCGACCAGTACCAGGTCGACCTGGTGG
+TGTGCGGCCACGAACACCACTACGAGCGGTCACATCCGCTGCGCGGGGCCCTGGGCACCGATACCCGAAC
+ACCGATACCCGTCGACACCCGCAGCGACCTCATCGACTCAACCCGGGGAACCGTGCACCTGGTAATCGGT
+GGGGGCGGCACGTCGAAGCCGACCAACGCGCTGCTCTTCCCGCAGCCTCGGTGCCAGGTGATAACCGGCG
+TCGGGGATTTTGATCCCGCGATCCGGCGTAAGCCGTCCATATTCGTGCTCGAGGATGCGCCGTGGTCGGC
+GTTCCGCGACCGCGATAATCCTTACGGCTTCGTGGCCTTCGACGTCGACCCGGGTCAACCCGGCGGCACT
+ACCTCGATCAAGGCGACGTATTACGCGGTGACTGGGCCGTTCGGGGGACTCACCGTCATCGACCAATTCA
+CCTTGACCAAGCCGCGCGGCGGATAGCTCAGAACAGGGTCGCCTGAACGGGTACCAGTGCCGCTTCGGTC
+TCCGGCGGCGCCGGGCGATGATCACCCGCCAACCGATACTTTGCGATCAGCGGTGCCACCCGTTCCCGCA
+GCATCTCGCGGTAGCTCGGCGGTAGATATGGCCCGCGCCGGTACAGTTCGCGGTACCGGCTGACCAGTTC
+GGGATGCGCGCGGGCCAGCCAGCACATGAACCAGCCGCGCGTCGAACCCCGCAGATGCAGGCCAAAGACC
+GTTACACCGGTGGCGCCTGCGGCCGCGATCTGGCCCAACAGTTGGTCAAGGTGCTCGCCGGAGTCGGTGA
+GTTGTGGCAGCACCGGCGCGACCATCACGTGACAGTCCAAGCCGGCGGCGCGAATTGCGGTAATGAGCGC
+CAGCCGCGCCTGCGGTGTTGGCGTACCCGACTCGACATCCCGGTGCAGCTCCGGGTCGCCAACGGCCAGC
+GACACCGCCACCGACACCGGCACTTGTTGGGCGGCCTCGGCGATCAACGGCAAGTCCCGTCGCAGCAGGG
+TGCCCTTGGTCAGGATCGACAGCGGCGTACCGGATGCCGCCAGCGCGCCGATGATGCCCGGCATCAGGGC
+GTAGCGGCCCTCCGCGCGCTGGTAGGGGTCGGTGTTGGTGCCCAACGCGACGGTCTCGCGCCGCCAGGAC
+GGCCGGCGCAACTCGTGACGCAGCACAGCGGCGACGTTGGTCTTGACCACCACCTGGGTGTCGAAGTCGG
+TGCCCGGATTGAAGTCCAGGTACTCGTGGGTGGGGCGGGCGAAACAATAGCGACAAGCATGCGAGCAGCC
+GCGGTAGCCGTTGACGGTGTAGCGAAACGGCAACGCGGCCGCGTTGGGCACCTTGTTCAGCGCTGATTTG
+CACAACACCTCGTGGAAGGTGATGCCGTCGAATTGTGGCGCGCGAACGCTGCGGACCAGGCCGATCCGCT
+GCAACCCCGGCAGCGCCCCGTCGTCAACGGGCATCCCGTTCACCGCGACGGCTTGCCGGGCCCAACGCAT
+ACCATTATTCGAACAACCGTTCTATACTTTGTCAACGCTGGCCGCTACCGAGCGCCGCACAGGATGTGAT
+ATGCCATCTCTGCCCGCACAGACAGGAGCCAGGCCTTATGACAGCATTCGGCGTCGAGCCCTACGGGCAG
+CCGAAGTACCTAGAAATCGCCGGGAAGCGCATGGCGTATATCGACGAAGGCAAGGGTGACGCCATCGTCT
+TTCAGCACGGCAACCCCACGTCGTCTTACTTGTGGCGCAACATCATGCCGCACTTGGAAGGGCTGGGCCG
+GCTGGTGGCCTGCGATCTGATCGGGATGGGCGCGTCGGACAAGCTCAGCCCATCGGGACCCGACCGCTAT
+AGCTATGGCGAGCAACGAGACTTTTTGTTCGCGCTCTGGGATACGCTCGACCTCGGCGACCACGTGGTAC
+TGGTGCTGCACGACTGGGGCTCGGCGCTCGGCTTCGACTGGGCTAACCAGCATCGCGACCGAGTGCAGGG
+GATCGCGTTCATGGAAGCGATCGTCACCCCGATGACGTGGGCGGACTGGCCGCCGGCCGTGCGGGGTGTG
+TTCCAGGGTTTCCGATCGCCTCAAGGCGAGCCAATGGCGTTGGAGCACAACATCTTTGTCGAACGGGTGC
+TGCCCGGGGCGATCCTGCGACAGCTCAGCGACGAGGAAATGAACCACTATCGGCGGCCATTCGTGAACGG
+CGGCGAGGACCGTCGCCCCACGTTGTCGTGGCCACGAAACCTTCCAATCGACGGTGAGCCCGCCGAGGTC
+GTCGCGTTGGTCAACGAGTACCGGAGCTGGCTCGAGGAAACCGACATGCCGAAACTGTTCATCAACGCCG
+AGCCCGGCGCGATCATCACCGGCCGCATCCGTGACTATGTCAGGAGCTGGCCCAACCAGACCGAAATCAC
+AGTGCCCGGCGTGCATTTCGTTCAGGAGGACAGCCCAGAGGAAATCGGTGCGGCCATAGCACAGTTCGTC
+CGGCAGCTCCGGTCGGCGGCCGGCGTCTGACCGCAACCGGGCCTCATGCTAGGCCACCGGCGACCGACGG
+ACTTCCCGCGCGAGCCGCTCCAAAAGCCTCAGCCGCTCGGGGTGGTCGGCTCGTCAAACGACAGCCCTAT
+CAGCCGAGACACCACGTTGTGCAGCGCGTCAAACACCTCCAGGATCTCTTCTCGGCTACTCGAAACCCAT
+GTTTGAAACGTATGACGCCCACCGACAAGAATGGCCGCCTTGAGGCCCTGCGGCCACGGTGGCGCAAGTG
+ATTTCGGTGACTCCGGCTGGAAGCGGCGACTACCCAGCCAGCCGCGAAATTACTTCGGCCACAACCGAAT
+CCATCGAGACCGAAACTTGCTCACCCGTCGTCAAGTCCTTCACTGCGACCGTCCCGGCCTCGATGTCGCG
+GTCGCCCGCTACCAACGCAACACGGGCGCCGGAACGAGCGGCCGCGCGCATCGCGCCTTTGAGCCCGCGA
+TCACCATAGGCAAGGTCAACCCGCACCCCGGCCGCGCGCAGTCGTCCAGCCAGCACCGCCAGCCTGAGCT
+TGGCCGCCTCGCCAAGCGGCACGCCGAACACGTCGCACCGGGCGCTGTCCCCCGCCGTCTTGCCCTCGGC
+CCGCAGCGCCAGCACGGTCCGGTCCACGCCCAGCCCGAACCCGATGCCCGACAAGTCCTGCCCGCCAAGC
+TGGTGCATCAGGCCGTCGTAGCGCCCCCCGCCGCCGATCCCCGATTGCGCACCAAGCCCGTCATGGACGA
+ACTCGAAGGCGGTCTTGGTGTAGTAGTCCAGGCCGCGCACCATGCGCGGGTTGATGACATAGGGCACTCC
+AAGCGCGTCCAGATGGGCGAGCACGGTGTCGAAATGCTGCTTGGCGACATCAGACAGATGATCCAGCAAC
+ACCGGCGCCGACGCCGTCATCGCACGCAATTCGGGTCGCTTGTCGTCGAGCACCCGCAGCGGATTGATCC
+CTGCGCGCCTGCGGGTGTCCTCGTCGAGATCGAGTCCAAACAAGAACTCCTGCAACAGTTCCCGGTACTG
+CGGACGGCAACTCTCGTCTCCCAGGGAGGTGATTTCCAGCCGGAACCCGTCGAGACCCAACGAGCGGAAC
+CCGGCGTCGGCAATGGCGATCACCTCGGCGTCCAACGCCGGGTCGTCGACGCCGATCGCCTCCACCCCGA
+CTTGCTGTAACTGGCGATACCGGCCGGCCTGCGGACGCTCGTAGCGGAAAAACGGGCCCGCATAACACAA
+CTTCACCGGCAGCGCGCCGCGATCCAGCCCGTGTTCGATCACCGCACGCACCACCCCGGCGGTGCCCTCG
+GGCCGCAGCGTCACCGAGCGGTCGCCACGGTCGGCGAACGTATACATCTCCTTGGACACCACGTCGGTGG
+ATTCACCCACGCCCCGGGCGAACAGGGCGGTGTCCTCGAAGATGGGCAGCTCGATGTGGCTATAGCCGGC
+TTGACGGGCCGCCGCGAGCAGCCCGTCGCGCACCGCGACGAACTGCGCCGAGTCGGGCGGGACGTAGTCC
+GGTACCCCCTTGGGGGCCGAAAATGACGAGAATTCCGTCACCGGCTCAAGCCCTCAAGGAACGGATTGAA
+GCGCCGCTCGGCCCCAATGGTGGTGGAGTTGCCGTGCCCGGGCAGCACCACCGTGCTGTCGTCGAGCACC
+AGGAGTTTGTCGACGATGGAGCGCAACAGGTCGCGGCCGCTGCCGCCGGCCAAGTCGGTGCGGCCTATCG
+CACGCTCGAACAGGGTGTCACCGGTGAACACGATGTCCTTGTCGTTGTTGGTCGCCTGCAGGACCCGGAA
+GACCACCGACCCGCGGGTGTGACCCGGTGTGTGATCGATGTTGACCGAGATGCCGCCGAGGTCGATCTTG
+TCGCCGTCTCGGTCCAGCTCCACAACCTGTTTAGGCTCACGAAAGAACGCACCCGCAACCAGCTGCGCTA
+TCCGCGGGCCCAGGCCGTAGATGGGGTCGGTCAGCATGAACCGGTCGGCGGGATGCACATAGGTGGGGCA
+GCCGAAGGTGTCTGAGACCTTCTGCGCGGACCAGATGTGATCGATGTGTCCGTGGGTGAGCAGCACCGCG
+GCAGGGGTCAGCCGGTTCTTGTCGAGGATGCGACGCAGCGTGCCCATCGCACCCTGGCCCGGATCGACGA
+TGACGGCGTCGGTTCCGGGCCGCTCGGCCAGCACATAACAGTTACACGCCAGCAACCCCGCAGGAAATCC
+GGTGATCAACACGGTTCCCAGTTTCCCATCCCCGGCGTCCGGGGACGAGGCGGGCCGCGAACATGGGCCA
+CTTGACACCGGTCGCGGCGCCCCGATTAGCCTGTGCTTTCGTGCCGACCAATGCTCAGCGACGTGCCACA
+GCCAAACGCAAACTCGAACGACAACTAGAGCGCCGCGCCAAGCAAGCCAAACGCCGTCGCATCTTGACTA
+TCGTCGGTGGCTCACTCGCAGCGGTGGCCGTGATCGTCGCGGTAGTCTTCACGGTGGTGGTCAACAAGGA
+CGACCACCAGAGCACCACGTCAGCAACCCCCACCGACTCGGCCTCGACCAGCCCCCCGCAGGCCGCGACC
+GCTCCCCCGCTGCCGCCGTTCAAGCCGTCGGCCAACCTCGGCGCCAACTGCCAGTACCCGCCGTCGCCGG
+ACAAGGCCGTCAAACCGGTCAAGTTGCCCCGGACCGGCAAGGTACCCACCGACCCGGCCCAGGTCAGCGT
+GAGCATGGTGACCAACCAGGGCAACATCGGTCTAATGCTGGCCAACAACGAATCGCCGTGTACGGTCAAT
+AGTTTCGTCAGCCTCGCGCAGCAGGGTTTCTTCAAGGGCACCACTTGTCACCGGCTGACCACCTCACCAA
+TGTTGGCGGTTCTGCAATGCGGCGACCCTAAGGGCGACGGCACGGGCGGTCCGGGCTACCAGTTCGCCAA
+CGAATACCCCACCGACCAATACTCGGCGAACGACCCCAAGTTGAACGAGCCCGTCATCTATCCGCGCGGG
+ACACTGGCCATGGCCAACGCCGGCCCTAATACCAACAGCAGCCAGTTCTTCATGGTCTACCGGGACTCAA
+AGCTGCCACCCCAATACACCGTGTTCGGCACGATCCAGGCCGACGGACTGACCACCCTGGACAAGATCGC
+CAAGGCCGGCGTCGCCGGTGGCGGCGAAGACGGCAAGCCCGCCACCGAAGTCACCATCACGTCGGTGCTG
+CTGGATTAGCCCGACGCTCGCCGAGCAGACACAGAATCGCACGAAATCAGCCCGCCCAATGCGATTCTGC
+GTCTGCTCGGCGGAGAAAAGCGCGCTACGCGGCCGAGGTCACCCGGTAGACGTCGTAGACACCTTCGACG
+TTGCGGACGGCGTTGAGCAGGTGCCCGAGGTGCTTGGGGTCACCCATCTCGAAGGTGAATCGACTGATCG
+CCACCCGGTCCCCCGAAGTGGTGACCGACGCGGACAGGATATTGACCTTCTCGTCGGCCAGTGCGCGCGT
+CACATCCGACAGCAGCCGGTGCCGGTCGAGTGCCTCGACCTGGATTGCCACCAGAAACACCGACGACGGC
+GACGGCGCCCATAGCACCTCGATGATGCGCTCGGCCTGCTGCTGCAGCGATGCGGCGTTGGTGCAGTCGG
+TGCGGTGCACACTGACCCCGCCGCCACGGGTGACGAACCCCATAATCACATCGCCCGGAACCGGCGTGCA
+GCACTTGGCCAGCTTGGTCAGCACGCCCGGGGCGCCGGGGACGGAGACCCCGACATCGTCGGTGCTGCGT
+GGGCGCCGCGGCATGGTCGCCGGCGTGGACCGCTCGGCGAGTTCCTCTTCCGCCTGGTCGATACCGCCGA
+GCTCGGCCAACAACCGCTGCACGACGTGTTTCGCCGACACGTGCCCCTCACCGATGGCGGTATAGAGTGC
+TGACACGTCCGCGTAGTGCAGCTCGCGGGCCACCGCCGCCATGGACTCACCATTGACCAAGCGCTGCAAC
+GGAAGTCCACCGCGGCGCACCTCGCGGGCCATCGCATCCTTACCGGTCTCCAACGCCTCCTCACGCCGCT
+CCTTGGCGAACCACTGGCGGATCTTCGTCTTTGCGCGCGGCGACACCACGAACTGCTGCCAGTCCCGCGA
+CGGCCCGGCGTTCGGCGCCTTGGACGTGAAAACCTCGACAACTTCTCCGTTTTCCAGCTTGCGTTCCAGC
+GCTACCAACCGGCCGTTCACTCGGGCGCCGATGCAGCGGTGGCCCACCTCTGTGTGCACCGCGTAAGCGA
+AGTCCACCGGCGTCGAACCGGTTGGCAGCGTGATCACGTCGCCCTTGGGGGTAAACACGAAAATCTCTTG
+CACCGCAAGGTCGTAGCGCAATGATTCCAAGAACTCACCGGGGTCGGCCGCCTCACGTTGCCAGTCGAGC
+AGCTGACGCATCCAGGCCATGTCGTCGATCTCCGCGGCGGCATGCGGATGAAGAACACCGTTGCGGCCCT
+TGGCTTCTTTGTAGCGCCAATGCGCGGCGATGCCGTATTCGGCGGTGCGGTGCATGTCGCGGGTACGGAT
+CTGCACTTCCAGCGGCTTGCCCTCAGGCCCGACCACAGTGGTGTGCAGTGACTGGTACACACCGTATCTG
+GGCTGGGCGATGTAGTCCTTGAACCGACCCGCCATCGGCTGCCATAGCGAATGCACTACGCCGACAGCCG
+CGTAGCAGTCCCGGATTTCGTCGCACAGGATGCGCACACCGACCAGGTCGTGGATGTCGTCGAAGTCGCG
+GCCCTTAACGATCATCTTCTGGTAGATCGACCAATAGTGCTTGGGGCGGCCCTCCACCGTCGCCTTGATC
+TTCGACGCGGTCAGCGTGTTGACGATTTCGGCACGCACCTTGGCCAGGTAGGTGTCCCGGGACGGCGCGC
+GACCGGCGACCAGCCGGACGATCTCCTCGTACTTCTTGGGATGCAGGATCGCGAAGGACAGGTCCTCCAA
+CTCCCACTTGACGCTGGCCATGCCCAGCCGATGCGCCAGGGGTGCAATGACTTCCAACGTCTCACGGGCC
+TTGCGGGCCTGCTTCTCCGGCGGCAAGAAGCGCATGGTGCGCATGTTGTGTAACCGGTCAGCCACCTTTA
+TCACCAGCACCCGCGGATCGCGGGCCATCGCGGTGATCATCTTGCGAATAGTCTCGCCTTCGGCGGCGCT
+GCCCAACACCACCCGATCCAGCTTGGTCACCCCGTCGACGAGATGGCCCACCTCTTCGCCGAATTCCTCG
+GTCAACGCCTCCAGGGTGTAACCGGTGTCCTCGACGGTGTCGTGCAGCAGCGCGGCCACCAAAGTGGTGG
+TGTCCATGCCCAACTCGGCCAGAATGTTGGCAACGGCCAACGGGTGGGTGATGTAGGGATCACCGGACTG
+CCGCAACTGGCTGGCATGCCTTTGGTCAGCGACCTCGTAGGCTCGCTGCAAGATCGACAGGTCGGCCTTG
+GGATAGATCTCCCGGTGCACCGCCACCAACGGCTCGAGCACCGGATTGGTGGTGCTGCGCTGGGCGGTCA
+TCCGCCGGGCCAATCGGGCCCGCACCCGACGCGACGCGCTGATGCTGGTCTTAAGAGTCTCGACCGGCGA
+CTCGGGCGTCTCGAGAGCGGGCTCGAGAGCCGCAGAAGCCTCCGTGGGCGGTGCAACCGCTTGCGCCGTG
+AGCTGGTCCTCGGCCACGTTCGTCACCTCCGACCTAGAGGATATCCCTCACAGGCGGCTCAGGCTGTGCA
+CCGGCAGCGGTGCGAGCGCCGCGCGACCGCTCAACCCCGCAAGTTCCACCACTACGGCCGCCCCGGCCAC
+GTTGGCGCCACCGCGCTCAAGCAGGCGTCGCGTCGCGCCGATGGTGCCGCCGGTTGCTAACACGTCGTCA
+ATGATCACGACACGGCGGCCCGCAACCTCGATGCCCTCAGCGAGAATCTCCAGAGTGGCGGCGCCGTACT
+CCCTGTAGTACTCCTCGCTGAGCACCGGCCGGGGCAGCTTGCCGCCCTTGCGAACGGCCAGCACACCCAC
+TTCGAGCCGGGTGGCGACCGCGGCTGCCACCAGAAACCCGCGGGCGTCGACGCCGGCCACCAGGTCAGCT
+CCGGACGCCCGATCGGCCAGCGCTTCGGTTACCGCGGCCAATCCTCTTCGGTCGGCGAATAGCGGGGTGA
+GGTCCTTGAACTCGACGCCGGGAACCGGAAAGTCGGCCACATCCCGGGTCAGCGACGCAACCACGTCGGC
+CACAGATATGGCTGAGCTCCGGCGGGACTCACCGAGCGCCAATACCCGCCCGTCGTCGACCCAACGCTGC
+CGGCGGCGCTTCCCCCGTGCCTTTAAGGAGAGCCCCGTCGCGATCACGTTCAACACGTAGTCACCAGCCC
+ATGTACCGCCATGGCACACATCCTCTCCCAGACAGCCCGGAGCACCTGCGACACTACGCTCCGATAGGTC
+CGCTTCTCGTCGTGGAATTCTGTCAATTACCTGCAGATGGCACTGGCCATCGTCACCGCGCCAGCGCCCA
+GCGATCCATGTTCCACCCTGCCCCCCATCGCGTCGGATTCCTGCTCACCGCATACATTTTCGTCGACATC
+AACAACGTGCGCTGCTGCCGGTACAACGGCAAGGTTGGCATCTCATCCCAGAGCACCGGCGCGGCCTCGG
+CAAGCAACCTGGCCCGCTCGGCGGGGTCGGCCGACACCGCGAGCGCGCTGATGATGCCGTCGATCTGAGC
+GTTTGCGTACCCCGATAGATTGTTTCCGTTGCCGCTGTGCAAGTCATAGGCATCCATCGCAGACGATCCG
+CTCGATCCGCTGCCGGTGGCCCCACCGGTGCTCGCCAACAATACGTCAATCTTTCCGTCCCGCAGCGCTT
+GCGGTCCGGGTGTGTCCACCGTCACATCCGAAACGGTGATCCCGGCCGGGGCGCAGGCGTCGGCAATGGT
+TCCGATGGTGGCCGCCAACCGAGCGTTGGGCCTGCCGTAGCCGATCCGCACGGTCAGCGGCGTACCACCC
+AGCGCGTCGCGAGCGGCGGCGGGGTCCACCCGGCCGAACTGACGTGCTTCGGCGGCGCCGTCGGCATCGG
+TGAGGGCATCGTCGGTCGCCGGGGACAGCCGCGAGTTGGCAATCGGAACCCCGGCATCCCGAGCGATCGC
+GTCCCGGGGTACACACAACGCGAGCGCGCGGCGGGTGCGGCTTTGCGCGAGTGAACCTTGTGGTGCGAAG
+ATCAGCTGCTCGATCCCGGCCGACGGGTAGTCGGTGCGCTGGTAGCTGTCGGGGGTTACCAGGGATCCCG
+ATGAACCGGCCGCGACGTCGACCACGTCGACGCTGCGGTTGTTGACCCGGTCTTGGATATCGGCTCCCTG
+CGGCCAGACGGTGATCCGCTTCGTGATCGCCTTGGTGCCCCACCAACGATCATTGGCGACGAGCACCACG
+GCGCCATCGTCCAGGACGGATTCGATCTTGTACGGTCCCGACGAGGGGAAGCGGCTGCGGACTTCGTCGT
+GGCTGCGGCCCGGCTTGAGGTCCCACGTGGAATTCCACAGTCGCGCAATCTGTTCCACCGCTGACACGTT
+GTTGCTTAGCAACGCCGCGGTAACATCGATGTGCAGCTGGTCGGCGATCACGTGCGACGGCATCAGCGAC
+GTCGCGGTGAACAGCTGGGAGTGGTCAACGACACTGCGATCCGGGATGAACGACACCCGGGCCTTTTTCT
+GCCCCGCCGTGCACTCGATGTTGGCGATGTCGACATAGCCGGCCTGCGTAGCAGCGTCGAAGCCGGGAAA
+GCGGCCGGATTGGGCCGCCCAGGCCAATACCAGGTCGTCACAGGTCACCGGCCTGCCGTCGGAATAGACG
+GCGTCGTCGGAGATCTGGTAGTCGAGGATCAACGGCGACCCCTCCACCACCGAGACCGTTCCGAAGTCGC
+GGTCAGCCACCACTTGGCCGTCGGGGCCGTGATAGCCAAACCCGGTGAGAGTCCGGGCGAATGCCTGCGC
+CCCGGCCGACGCGGCACCGATGACAGTATTGGTGTTGTAGGTGACCAGCGCGCCGTCGACCACGTAGTCG
+ATCTGAGCCGCGGCGCTGCCCGAACACGCGGTCAGCGTGGTTGCGGCGACCAACGTCGCGGTACCAACGA
+CTCGCAGGCCGGCGATGCGCGTATGACGCCGGCGGCGGGGGGCCACCGCGCCTACCGCCGACCGGCGTTC
+CGCTTGCCGGGCGGACGCCTGGTACCGACGGGACGCACTGGGCGCGCCCCCGGCGCCGGCTTGCTGGAGC
+CCTGGGCCGCCCGCGGGGCGGATTGGCTGCTGGCCTGCGTGATCCCCACCAGCGACTGTTCATCAGCGGC
+TGCCGGCTGCTCGCCGCCATCCGTGCTGGCGTCCTCTGATCCCGCCGGCGAGCCGGAGTTACGCCGTTTG
+AGCACCCGACGGGTGTGGTTGCGCACCAACTCCGTGCGCTCACGGAGGGTAACCAACAGCGGCGTGGCGA
+AGAAGATTGACGAGTAGGTGCCGATGATGATGCCGATCAGCTGCACCAGCGCCAGGTCTTTGAGAGTGCC
+GACGCCCAGCAGCCAGACCGCCACCACCATCAGCGTCAACACCGGCAACACGCCGATCAGGCTGGTGTTG
+ATCGACCGCATGAACGTCTGGTTGATCGCCAGGTTGGCCTGCTCGGCGAAGGTGCGCCGGGTGGTGTGCT
+GGAAGCCATGGGTGTTCTCCTCGACCTTGTCGAACACGATGACGGTGTCATAGAGCGAGAACCCGAGAAT
+GGTCAGCAGGCCGATGACCGTGGCCGGGGTGACTTCGAAACCCACCAGGGAATACACGCCGGCGGTGACG
+GTCAGGTCGAAGAGCATGGCCGTTATCGCCGAGATGGTCATGTAGCGCTCGTAGCGCACGGTAATGTAGA
+GGGCGACCAGCACCAGAAACACCACCAGCGCGATCACCGCCTTCTTGGTGATCTGACCGCCCCAGGTCTC
+CGACACCGCCGAGTCGCTGATGGCCTGCTTGCTGGGCTGACCGTCGGTTCCCTTGGGCCCGAAGGCCTCG
+AATAGGGCGTCCCGCAGCTTGGCCGTCTGGTCGCTGGTCAGCGTCTCCGAACGAATCTGCACCGTCGCCG
+AAGCACCGGCCCCGACGATCACCACCGACTGGGGCTCACTGCCGAGGGCCCGGTAGTAGACGTCTTCGAC
+CTGCGCGACTTGGGTGCTGCCACGCGGGAACGACACCGTGGTACCGCCTTTGAAATCGATGCCGAAGGTG
+AACCCACGAAAGACGATGCTGGCGATGGCCACCGCGACGATCGCACCGCTCACGCCAAACCACAACCGGC
+GGCGTCCCACTACCTCAAACGCCCCGGTGCCGGTGTACAGGCGCGAAAGGAAGCTATGGTGCCCCAGCTT
+CGAGGCGGTGTCTGTGGTGCTGTCGCCGTCGGTCCGCGCCACAGCACTCTCGGTGGCCTCGGTGAGTTCG
+ACCGCCGACGTGGCTTCGTCGTCGCGGCCGGTCTTTGCTTTCGACGCCATCGGCTATCCCCGTCCCGTCC
+GAGCCATGGCCCGGCGTTCGCGTGCGACCTGCTGCACCGCTCCCAGGCCGTTGTATGCCGGCTTGGCCAG
+CAGCGACGATTTGGACGCCAGATACACCAACGGCCACGTCACCAAGAACACCACGACGAGGTCCAGGATC
+GTGGTGAGGCCCAGGGTGAACGCGAACCCCTTCACCTGACCGATCGCCAGAAAGTACAGCACGGCAGCGG
+CCAGGAAAGTGACGGCGCTGCCCGACACGATCGTCTTGCGGGCACGCGCCCAACCGCGCGGCACTGCCGA
+CCGGAACGAACGGCCTTCGCGGATCTCGTCTTTGATGCGTTCGAAGAACACCACGAACGAGTCGGCGGTG
+GTCCCGATACCGATGATCAGGCCCGCAATACCAGCCAGATCTAGGGTGTAGTTGATATATCGGCCCAAGA
+GCACCAGGATCGCAAAAACCATTGAGCCAGAAGCCACTAGCGACAAGGCCGTGAGCAGTCCCAGCACTCG
+GTAGTAGAGCAGCGAATACACCAGCACCAACAGCAGGCCGATCGCACCCGCGATCATGCCCGCGCGCAGC
+GATGACAACCCCAAGGTCGCCGAAACCGTTTGGGCTTCCGACGGTTCGAAGGACAGCGGCAGCGACCCGT
+ACTTGAGGACGTTGGCGAGCTGGCGTGCGGTCGCCGCGGTGAATGGCGGATCCCCACCGCTGATCTGGGT
+TCGGCCGCCGGGGATCGCTTCCTGGATCTGCGGTGCACTGACAACCTGCGAGTCCAGGGTGAACGCCGTC
+TGGGTGCCGATATGGGCGGCGGTGTAGTCGGCCCAGATGTTGGCCGCCGGACCCTTGAACTGCAGGTCGA
+CGACGTAGCCGATGCCGCGCTGGTCCATACCCGAGGTGGCGTTTTGGATCTGGTCGCCGCTGATGATCGA
+CGGCGCCAGCAGGTACGCGGTCTTGTGGTCGGTCGAGCAGGTCACCAACGGCAGTTTCGGGTCGTCGTTG
+CCGGCCAAAATGTCGTCGCTCTCGCAGCGGGTCGCCTGGAATTGCAGTGCAACCATCTGCATGTATTGGT
+TGGTGCTCTGCCGCAGCTTCTTCTCCTGGGCGATGCGCTCGGCGAGATCCTTGCGCGGATCCGTGGCCGG
+CGCCTCAGCGGGCGGCGCCGGCGGCGGGCTGGCCGGTGAGGTCGGGTTGGGCGATGGCGCCGGGTCCTGC
+GGATAGGGCCGCGGTTGGGCCCCAGGTTGCGGTGAAGCCGGCGCCCCCGATTGGGCTGGCGGCGGTGCGG
+CGGGTTGACCGGGCGGCTGCGGTTCGGCGCTGGGTGCCGGCTGCGGTTCTTCGGCTGCGGGCTGCGCCGG
+CATCGAGTTGAGCACCGGCCGGATGTACAGCCGAGCGGTCTGTCCGAGGTTGCGTGCCTCGCTGCCGTCG
+TTGCCGGGCACCGTGATGACCAGGTTGTCACCGTCGACGACCACCTCCGACCCGGACACTCCCAGCCCGT
+TGACCCGCGCGCTGATGATTTGCTGCGCCTGTGCCAGCGCTTCCCGGCTCGGGGCCGAGCCGTCCGGTGT
+GCGCGCGGTCAGCGTGACCCTGGTGCCGCCCTGCAGGTCAATGCCGAGTTTGGGGGCGGTGTGCTTGTCC
+CCGGTGAAAAACACCAGCAAATAGATGCCGATCAGCATCACCAGGAACACCGACAGGTAACGGGCAGGGT
+GCACCGGCGCCGAAGACGATGCCACGTTCCTTGTATCTCCTCGAGAATCAGTTTTCTACCCCCGACAGAG
+CCTACGTGTCGCGCCGGGGCGCGTCGCGCAAGCGGCTCGTCGGTTCCGGTCGGCCGGTTGCCGGTCAGGA
+ATCGTTGGTCACCCGGCGCTCGCCGGCCACGTCGTCAACATCCTTGTCAAGGTCCTCGTTGAGCTCCTCG
+TCGATGTCGTCGTCCGGCAGAATTCGGTCACGAATCGCCAACTTCATCCACGTGGTGACCACCCCGGGCG
+CGATCTCGAGGTCGATGGTGTCGTCGGCAATGGCGACGATGGTGGCTTCCAGCCCAGAAGTCGTGTGTAC
+CCGCTCCCCGGGCTGCAACGAGTCGTGCAGATCGATGGTGGCTTGCATGGCCCGTCGCTGGCGGCGCGAC
+GCGAAGTACATGAACCCACCCATGATGAGCAGGAACGGCAAGAACAAAACGAAACTCTCCATCAACCCGT
+CTTTCGTATTGGTATTGCGATCACGGTGCCAGGCCTACCCGCGGGCCGCGCACCTGGTAACAGTCCAGTG
+TGCCCGTCCAGTCTGGCAGGCCGGAAACATCGGTCAGCAGATAGGCTTTACCAGCGATGTGAACCGGCGA
+GCCGGGTGAGGAGGATCTGTGGCCAGCCTGCAGCAGAGTCGGCGCCTGGTCACCGAAATCCCCGGTCCCG
+CATCGCAGGCACTGACTCACCGCCGGGCGGCGGCGGTGTCCAGCGGTGTTGGGGTCACCCTGCCGGTGTT
+CGTAGCCCGCGCCGGCGGCGGCATCGTGGAAGACGTGGACGGTAACCGGCTCATCGACCTGGGTTCGGGC
+ATCGCAGTGACGACGATCGGCAACTCGTCGCCACGCGTGGTGGATGCGGTGCGCACGCAGGTGGCCGAAT
+TTACCCACACCTGCTTCATGGTGACGCCATACGAGGGGTACGTGGCCGTCGCCGAGCAACTCAACCGGAT
+TACCCCAGGTTCGGGCCCCAAGCGCTCGGTGTTGTTCAATTCCGGCGCCGAGGCAGTCGAGAACGCCGTC
+AAGATCGCACGCTCCTACACCGGCAAGCCCGCGGTGGTGGCGTTCGACCACGCCTACCACGGTCGCACCA
+ACCTAACGATGGCGCTGACCGCCAAGTCGATGCCCTACAAGAGCGGCTTCGGTCCGTTCGCGCCGGAGAT
+CTACCGAGCGCCATTGTCTTACCCCTATCGGGACGGCCTCCTCGATAAGCAACTGGCTACCAATGGTGAG
+CTAGCCGCGGCCCGAGCCATCGGCGTCATCGACAAGCAGGTAGGCGCGAACAACCTGGCCGCCCTCGTCA
+TCGAACCGATCCAGGGCGAAGGCGGTTTCATCGTTCCGGCCGAAGGGTTCCTACCTGCCCTCCTCGATTG
+GTGCCGCAAGAACCATGTGGTGTTCATCGCCGACGAGGTGCAAACCGGCTTTGCCCGTACCGGGGCGATG
+TTCGCCTGCGAGCACGAGGGCCCCGACGGTCTAGAGCCCGACCTGATCTGCACGGCCAAAGGCATCGCCG
+ATGGATTGCCGCTGTCGGCGGTCACCGGCCGCGCCGAGATCATGAACGCCCCGCACGTGGGCGGCCTGGG
+CGGCACGTTCGGCGGCAACCCGGTGGCCTGTGCGGCCGCGCTGGCCACCATCGCAACCATCGAAAGCGAC
+GGGCTGATCGAGCGGGCCCGCCAGATCGAACGCCTGGTGACCGACCGGTTGACGACGCTGCAGGCCGTCG
+ACGACCGGATCGGCGACGTGCGTGGTCGCGGCGCCATGATCGCCGTAGAGCTGGTCAAATCCGGAACCAC
+CGAGCCCGACGCCGGGCTGACCGAGCGGCTGGCGACCGCGGCCCACGCCGCCGGCGTCATCATTTTGACC
+TGCGGCATGTTCGGCAACATCATCCGGCTACTGCCGCCGCTGACCATCGGCGACGAGCTGCTGAGTGAGG
+GGCTGGACATCGTGTGCGCGATCTTGGCCGACCTCTGACGGCCTGCCGGCCCCGACTGCGTCATCCCGTG
+CCGCATCTCACAGCCGATCAGCAGCAGGCTTGCATTGTGTAATATATTTACTTTAGCTAACGTTCTATTG
+GTCGGGCGCAGCGCCGCGCCGTCGATTTCCCACCCTTTCCGGCACGCCGAGGTGACCGCATGTCGATCAA
+CGATCAGCGACTGACACGCCGCGTCGAGGACCTATACGCCAGCGACGCCCAGTTCGCCGCCGCCAGTCCC
+AACGAGGCGATCACCCAGGCGATCGACCAGCCCGGGGTCGCGCTTCCACAGCTCATCCGTATGGTCATGG
+AGGGCTACGCCGATCGGCCGGCACTCGGCCAGCGTGCGCTCCGCTTCGTCACCGACCCCGACAGCGGCCG
+CACCATGGTCGAGCTACTGCCGCGGTTCGAGACCATCACCTACCGCGAACTGTGGGCCCGCGCCGGCACA
+TTGGCCACCGCGTTGAGCGCTGAGCCCGCGATCCGGCCGGGCGACCGGGTTTGCGTGCTGGGCTTCAACA
+GCGTCGACTACACAACCATCGACATCGCGCTGATCCGGTTGGGCGCCGTGTCGGTTCCACTGCAGACCAG
+TGCGCCGGTCACCGGGTTGCGCCCGATCGTCACCGAGACCGAGCCGACGATGATCGCCACCAGCATCGAC
+AATCTTGGCGACGCCGTCGAAGTGCTGGCCGGTCACGCCCCGGCCCGGCTGGTCGTATTCGATTACCACG
+GCAAGGTTGACACCCACCGCGAGGCCGTCGAAGCCGCCCGAGCTCGGTTGGCCGGCTCGGTGACCATCGA
+CACACTTGCCGAACTGATCGAACGCGGCAGGGCGCTGCCGGCCACACCCATTGCCGACAGCGCCGACGAC
+GCGCTGGCGCTGCTGATTTACACCTCGGGTAGTACCGGCGCACCCAAAGGCGCCATGTATCGCGAGAGCC
+AGGTGATGAGCTTCTGGCGCAAGTCGAGTGGCTGGTTCGAGCCGAGCGGTTACCCCTCGATCACGCTGAA
+CTTCATGCCGATGAGCCACGTCGGGGGCCGTCAGGTGCTCTACGGGACGCTTTCCAACGGCGGTACCGCC
+TACTACGTCGCCAAGAGCGACCTGTCGACGCTGTTCGAGGACCTCGCCCTGGTGCGGCCCACAGAATTGT
+GCTTCGTGCCGCGCATCTGGGACATGGTGTTCGCAGAGTTCCACAGCGAGGTCGACCGCCGCTTGGTGGA
+CGGCGCCGATCGAGCGGCGCTGGAAGCGCAGGTGAAGGCCGAGCTGCGGGAGAACGTGCTCGGCGGACGG
+TTTGTCATGGCGCTGACCGGTTCCGCGCCGATCTCCGCTGAGATGACGGCGTGGGTCGAGTCCCTGCTGG
+CCGACGTGCATTTGGTGGAGGGTTACGGCTCCACCGAGGCCGGGATGGTCCTGAACGACGGCATGGTGCG
+GCGCCCCGCGGTGATCGACTACAAGCTGGTCGACGTGCCCGAGCTGGGCTACTTCGGCACCGATCAGCCC
+TACCCCCGGGGCGAGCTGCTGGTCAAGACGCAAACCATGTTCCCCGGCTACTACCAGCGCCCGGATGTCA
+CCGCCGAGGTGTTCGACCCCGACGGCTTCTACCGGACCGGGGACATCATGGCCAAAGTAGGCCCCGACCA
+GTTCGTCTACCTCGACCGCCGCAACAACGTGCTAAAGCTCTCCCAGGGCGAGTTCATCGCCGTGTCGAAG
+CTCGAGGCGGTGTTCGGCGACAGCCCGCTGGTCCGACAGATCTTCATCTACGGCAACAGTGCCCGGGCCT
+ACCCGCTGGCGGTGGTTGTCCCGTCCGGGGACGCGCTTTCTCGCCATGGCATCGAGAATCTCAAGCCCGT
+GATCAGCGAGTCCCTGCAGGAGGTAGCGAGGGCGGCCGGCCTGCAATCCTACGAGATTCCACGCGACTTC
+ATCATCGAAACCACGCCGTTCACCCTGGAGAACGGCCTACTCACCGGCATCCGCAAGCTGGCACGCCCGC
+AGTTGAAGAAGTTCTATGGCGAACGTCTCGAGCGGCTCTATACCGAGCTGGCCGATAGCCAATCCAACGA
+GCTGCGCGAGCTGCGGCAAAGCGGTCCCGATGCGCCGGTGCTTCCGACGCTGTGCCGTGCCGCGGCTGCG
+TTGCTGGGCTCTACCGCTGCGGATGTGCGGCCGGACGCGCACTTCGCCGACCTGGGTGGTGACTCGCTCT
+CGGCGCTGTCGTTGGCCAACCTGCTGCACGAGATCTTCGGCGTCGACGTGCCGGTGGGTGTCATTGTCAG
+CCCGGCAAGCGACCTGCGGGCCCTGGCCGACCACATCGAAGCAGCGCGCACCGGCGTCAGGCGACCCAGC
+TTCGCCTCGATACACGGTCGCTCCGCGACGGAAGTGCACGCCAGCGACCTCACGCTGGACAAGTTCATCG
+ACGCTGCCACCCTGGCCGCAGCCCCGAACCTGCCGGCACCGAGCGCCCAAGTGCGCACCGTACTGCTGAC
+CGGCGCCACCGGCTTTTTGGGTCGCTACCTGGCGCTGGAATGGCTCGACCGCATGGACCTGGTCAACGGC
+AAGCTGATCTGCCTGGTCCGCGCCAGATCCGACGAGGAAGCACAAGCCCGGCTGGACGCGACGTTCGATA
+GCGGCGACCCGTATTTGGTGCGGCACTACCGCGAATTGGGCGCCGGCCGCCTCGAGGTGCTCGCCGGCGA
+CAAGGGCGAGGCCGACCTGGGCCTGGACCGGGTCACCTGGCAGCGGCTAGCCGACACGGTGGACCTGATC
+GTGGACCCCGCGGCCCTGGTCAACCACGTGCTGCCGTATAGCCAGCTGTTCGGCCCAAACGCGGCGGGCA
+CCGCCGAGTTGCTTCGGCTGGCGCTGACCGGCAAGCGCAAGCCATACATCTACACCTCGACGATCGCCGT
+GGGCGAGCAGATCCCGCCGGAGGCGTTCACCGAGGACGCCGACATCCGGGCCATCAGCCCGACCCGCAGG
+ATCGACGACAGCTACGCCAACGGCTACGCGAACAGCAAGTGGGCCGGCGAGGTGCTGCTGCGCGAAGCTC
+ACGAGCAGTGCGGCCTGCCGGTGACGGTCTTCCGCTGCGACATGATCCTGGCCGACACCAGCTATACCGG
+TCAGCTCAACCTGCCGGACATGTTCACCCGGCTGATGCTGAGCCTGGCCGCTACCGGCATCGCACCCGGT
+TCGTTCTATGAGCTGGATGCGCACGGCAATCGGCAACGCGCCCACTATGACGGCTTGCCGGTCGAATTCG
+TCGCAGAAGCCATTTGCACCCTTGGGACACATAGCCCGGACCGTTTTGTCACCTACCACGTGATGAACCC
+CTACGACGACGGCATCGGGCTGGACGAGTTCGTCGACTGGCTCAACTCCCCAACTAGCGGGTCCGGTTGC
+ACGATCCAGCGGATCGCCGACTACGGCGAGTGGCTGCAGCGGTTCGAGACTTCGCTGCGTGCCTTGCCGG
+ATCGCCAGCGCCACACCTCGCTGCTGCCCTTGCTGCACAACTACCGAGAGCCTGCAAAGCCGATATGCGG
+GTCAATCGCGCCCACCGACCAGTTCCGCGCTGCCGTCCAAGAAGCGAAAATCGGTCCGGACAAAGACATT
+CCGCACCTCACGGCGGCGATCATCGCGAAGTACATCAGCAACCTGCGACTGCTCGGGCTGCTGTGATCGG
+GCCTGGCCGCCGCGGCGCCGGGTAACCAAGCAGCCCGTTACGCCCAGTTCGCCTATGAGAAGGCAGTAAG
+AAGCGCGAAAAATGGCAGACCCCGACGGAGGCCCTCTGAAAGAGTCTTGATCATCAGGGCGCGTGACATG
+TGTCACATGACGGGTTGGGAGGGTGGCTGATGTCGTTTGTCACGGCAGCTCCAGAGATGCTGGCGACGGC
+GGCGCAGAATGTCGCGAATATCGGCACATCGCTGAGTGCGGCAAACGCGACGGCAGCGGCGTCCACGACC
+TCGGTGCTGGCGGCCGGAGCCGACGAGGTATCGCAGGCTATCGCAAGGCTGTTCAGTGATTACGCCACGC
+ACTATCAGTCGCTGAACGCTCAAGCCGCGGCATTTCATCACAGCTTCGTGCAAACGTTGAACGCCGCCGG
+TGGCGCCTATTCGAGCGCCGAGGCGGCCAACGCTTCGGCGCAGGCGTTGGAACAGAATCTGTTGGCCGTG
+ATCAATGCGCCCGCCCAGGCGTTGTTCGGGCGTCCCCTGATCGGCAATGGCGCGAATGGAACAGCGGCCA
+GCCCCAACGGCGGTGATGGTGGGATTTTGTACGGCAACGGCGGCAACGGCTTCTCCCAAACGACCGCCGG
+GGTGGCCGGCGGCGCCGGTGGTTCCGCGGGCCTGATCGGCAACGGCGGCAATGGTGGCGCCGGTGGGGCC
+GGTGCTGCCGGCGGGGCCGGCGGCGCCGGCGGATGGCTGCTCGGCAACGGTGGCGCCGGCGGTCCCGGCG
+GCCCAACGGACGTTCCTGCCGGCACAGGTGGAGCCGGCGGGGCCGGCGGCGACGCCCCATTGATCGGCTG
+GGGCGGCAACGGCGGGCCCGGCGGTTTCGCTGCTTTTGGAAACGGTGGGGCCGGCGGCAACGGCGGCGCC
+AGCGGTTCGCTCTTTGGCGTCGGCGGCGCCGGCGGCGTCGGCGGATCGAGCGAAGACGTCGGCGGCACCG
+GCGGGGCCGGCGGCGCTGGCCGCGGTCTATTCCTTGGCCTGGGCGGTGATGGCGGCGCCGGCGGCACCAG
+CAACAACAACGGCGGTGACGGTGGCGCCGGCGGCACCGCGGGAGGTCGATTGTTCAGCCTGGGCGGTGAC
+GGTGGCAACGGTGGTGCCGGTACCGCAATCGGATCCAACGCCGGTGACGGTGGCGCCGGCGGTGACAGCA
+GCGCCCTGATCGGCTACGCCCAGGGCGGCTCCGGCGGCCTCGGCGGCTTCGGCGAAAGTACCGGCGGCGA
+CGGCGGCCTGGGCGGCGCCGGCGCTGTGCTCATCGGCACGGGCGTCGGCGGTTTCGGCGGCCTCGGTGGC
+GGCTCCAACGGCACCGGGGGCGCGGGCGGCGCGGGCGGCACGGGCGCCACGCTGATCGGCCTGGGCGCCG
+GCGGCGGCGGCAGCATCGGCGGGTTCGCCGTCAACGTGGGCAACGGCGTCGGCGGTCTGGGCGGCCAGGG
+CGGCCAGGGCGCCGCGCTGATCGGCCTGGGCGCCGGCGGTGCCGGCGGTGCCGGCGGCGCCACAGTCGTT
+GGACTTGGTGGCAATGACGGTGACGGCGGTGACGGTGGCGGCCTGTTTAGTATCGGCGTCGGCGGGGACG
+GCGGCAACGCCGGCAACGGCGCCATGCCTGCCAATGGCGGCAACGGCGGCAACGCCGGGGTCATTGCCAA
+CGGCTCCTTTGCCCCGTCGTTCGTCGGCTTCGGCGGCAACGGCGGCAACGGCGTCAATGGCGGCACCGGC
+GGCACCGGCGGCAGCGGCGGGATCCTTTTTGGCGCCAACGGCGCGAACGGACCGTCGTAGCGGGTCCTCC
+AGCGCACTACTCGAACAACCCCGGTTGACTCGCTCCGACCGGTGGCGTCATGCCCAGGTGCGTCCAGGCC
+AGGGCGGTGGCCACCCGGCCGCGCGGGGTGCGCGCGACCATACCCGCGCGCACCAGAAATGGTTCGCACA
+CCTCCTCGACCGTGGCGGCCTCCTCCCCGACCGCCACCGCCAGCGTCGACACACCCACCGGACCACCGCC
+GAAGCTGCGGGTCAGCGCCGAGAGCACCGCTCGGTCCAGCCGGTCCAGACCCAGCTCGTCGACGTCGTAG
+ACCTCCAGTGCGGCCTTGGCGACGTCGCGGGTGATGACGCCGTCGGCGCGCACCTCGGCGAAGTCACGCA
+CCCGGCGCAACAACCGGTTGGCGATCCGCGGCGTTCCCCGAGAACGGCGGGCGATTTCGGCGCCGGCGTC
+GGCGCCCAGCTCGATACCCAGAATTCCGGCGGAGCGGGCCAGCACCCGCTCCAGCTCGGCGGGCTCGTAG
+AAATCCATGTGCGCGGTGAAGCCGAACCGGTCGCGCAGCGGGCCGGTCAACGCGCCCGACCGGGTAGTCG
+CCCCGACCAGGGTGAACGGCGCGACCTCCAGCGGAATCGACGTGGCCCCAGGACCTTTGCCGACCACCAC
+ATCGACGCGGAAGTCTTCCATCGCCAGATACAGCATCTCCTCGGCGGGCCGGGCGATGCGGTGGATCTCG
+TCGATAAACAACACGTCGTGCTCGACCAGGTTGGACAGCATCGCCGCCAGGTCACCGGCGCGTTCCAACG
+CCGGCCCCGACGTCACCCGCAGCGAGGACCCCAGCTCGGCGGCGATGATCATCGCCAACGACGTCTTGCC
+CAAGCCCGGCGGACCGGACAGCAGAATGTGATCCGGTGTGCCGCCGCGGTTTTTGGCTCCCTCGATGACC
+AGCTGCAGCTGTTCGCGGACCCGGGGCTGGCCGATGAATTCGCGTAACGAGCGCGGCCGCAGGCTGACGT
+CGATGTCGCCCTCTCCGACGGTGAGTGCGGGCGAAACGTCGCGGTCGGACCGCTCGGTCATCGGGCCTTC
+CCCAGCAACGACAAGGCAGACCGCAGCGCGCTGGATGTCGTCGCGTCATGGTTGGCGGCCAGCACCGTAT
+CGGTGGCCTCCTCGGCCTGTTTGGCCGCAAAGCCCAGGCCGACCAGAGCCTCGACCACGGGACTGCGCAC
+CGCGTGGCCGTTGGTCGAGAGTGCGCCGCCGGTGGCTGCCACCCCAACCTTGTCGCGTAGTTCCAACACC
+ATGCGTTCGGCGCCCCGCTTGCCGATCCCAGGCACCCGGGTCAGGGCGGCGACGTTGCCGTCGGCCAGCA
+CCTGCCGTAGCGCCGGAGCGTCGTGCACGGCCAGTGCCGCCATCGCCAGCCGGGGCCCAACGCCGGAGAC
+CGACAGCAGCGTCAGGAATAGGTCGCGGGTTTCCCCGTCGGGAAACCCGTACAGCGTCATCGAGTCCTCG
+CGCACAATCATCGCGGTGATCAGCCGGGCCTCGGTGCCTTGCCGCAACGTCGCCAGCGTCGCCGGTGTCG
+CGTTCACTCGGTAGCCCACACCGGCGGCCTCGATCACCACATGGTCAAGCGCCACCTCGAGCACCTCACC
+GCGGACCGAGGCGATCATCGGGCGGCCTTCAGCTTGGCTAGGTACGCATGACGCTGCTGCGCTGCTCGTG
+CTTCCGCCCTCGACGTGGCCTCAGCCATCCGGGCGATCGTCGGCGCCCGCCAACAGTGACAGATCGCCAG
+CGCCAAAGCGTCGGCCGCGTCGGCCGGTGTCGGTTTAGCTTGCAGCGCAAGGATTTTGGTGACCATCGCG
+GTGACCTGAGCCTTGTCTGCGGAACCGTTGCCAGTGACCGCCGCCTTGACCTCGCTGGGGGTATGGAAAT
+GCACGTCGACACCACGTTTGGCCGCCGCCAGGGCGATCACGCCGCCGGCCTGCGCGGTGCCCATCACCGT
+GGTCACGTTGAGCTGAGAGAACACCCGTTCGATAGCCACCACCTCCGGATGATGGGTGTCCAGCCAGTGC
+TCGACGGCATCGCTGATGGCCAACAGGCGCTGCGCCAAGGCCGCATCCGACGGTGTGCGCACCACGTCGA
+CATCCAGCGCGGTGAGCTGCCGACCACGCCCACTCTCGATAAGCGACAGCCCGCATCGGGTCAACCCGGG
+ATCGACACCCATCACCCGCACCGCACGCTCCCTCAGCCATTTCCGAACAATCGTTCGATACGCTAGCGGA
+TCGTCCCGACATCCCGCGCAGGACACGCCTATGGAACGTGCGATGGTAAATTTCCTACCATGCGAACAAC
+CATCGATGTCGCAGGACGTCTGGTGATTCCCAAGCGGATTCGCGAGCGCCTTGGCTTGCGCGGGAACGAC
+CAGGTGGAGATCACCGAGCGCGATGGGCGCATCGAGATTGAGCCGGCCCCGACCGGTGTCGAACTCGTTC
+GGGAAGGCTCGGTTCTCGTCGCACGGCCAGAACGTCCCCTGCCCCCGTTGACCGACGAAATCGTTCGGGA
+AACGCTCGATCGCACACGGCGGTGATCGCACCAGACACCAGCGTGCTGGTTGCCGGATTCGCGACCTGGC
+ACGAAGGGCACGAGGCCGCCGTGCGCGCGCTCAACCGTGGCGTCCATCTGATCGCGCACGCGGCTGTGGA
+AACCTATTCGGTCTTGACCCGGCTACCACCGCCGCATCGTATTGCCCCTGTTGCCGTCCACGCCTACTTG
+GCGGACATCACCTCCAGCAACTACCTGGCACTGGATGCCCGCTCATATCGCGGCTTGACCGACCACCTCG
+CCGAGCACGATGTCACCGGTGGCGCAACCTACGATGCCCTGGTCGGCTTCACGGCGAAAGCTGCCGGCGC
+AAAGCTGCTGACTCGCGACCTGCGCGCGGTCGAAACGTACGAGCGATTGCGGGTCGAGGTTGAGCTGGTG
+ACCTGAGAAACCGTTGCCGTTGAGTGTGTTTGAGTTGCACGCTCACCGACACCCGGATGGTGCACCAGTG
+AGCTGGGGTGACCGCGGCCGAGACCTGCCGGGTTCCCGGCCGGACAACTCGCCCGTTGTGACCCCCGGTC
+CCGCGAAAGCTGTTACGTTAAACGGCGCCATCGATATGCGACCGATCGACCAACCGCGGCGCAGCGGTAC
+GAGAGGGTATGCGTGGGAAATCTGCTGGTCGTGATTGCCGTGGCGCTGTTCATCGCCGCCATCGTCGTTC
+TCGTCGTGGCCATCCGGCGGCCCAAAACACCAGCCACGCCGGGCGGGCGCCGGGATCCGCTGGCCTTCGA
+CGCAATGCCGCAATTCGGCCCCCGCCAACTCGGACCCGGCGCAATTGTCAGCCACGGTGGCATCGACTAT
+GTGGTCCGCGGATCAGTCACCTTTCGCGAGGGTCCCTTCGTGTGGTGGGAACACTTGCTGGAAGGCGGCG
+ACACGCCAACCTGGCTGAGCGTGCAAGAGGACGACGGGCGTCTCGAGCTTGCGATGTGGGTGAAACGCAC
+CGATCTGGGCTTGCAGCCCGGTGGCCAGCACGTGATCGACGGCGTGACGTTTCAGGAGACCGAGCGCGGT
+CACGCCGGATATACCACCGAGGGCACGACGGGCCTGCCGGCCGGCGGTGAGATGGACTACGTCGACTGCG
+CCAGTGCCGGTCAGGGGGCCGACGAGTCCATGCTGCTGTCATTCGAGCGCTGGGCACCGGACATGGGATG
+GGAGATAGCGACCGGCAAGTCCGTACTGGCCGGCGAGCTCACCGTCTACCCCGCGCCCCCAGTCTCGGCA
+TAGGGCCGAATCGGTGCCACTTCATCAGCTCGCCATAGCGCCGGTGGACGTATCAGGGGCATTGCTTGGA
+CTCGTGCTGAACGCACCCGCGCCGCGGCCACTGGCCACCCACCGACTGGCCCACACCGACGGCAGCGCAC
+TGCAGCTCGGCGTCCTCGGCGCGTCGCATGTCGTCACCGTCGAGGGACGCTTCTGCGAGGAAGTCTCCTG
+CGTGGCCCGCAGCCGGGGCGGCGATCTGCCCGAGTCCACCCACGCACCCGGCTACCACCTCCAATCCCAT
+ACCGAGACGCACGACGAGGCGGCGTTTCGGCGACTCGCACGCCACCTGCGTGAACGCTGCACGCGGGCAA
+CCGGGTGGCTGGGCGGTGTGTTTCCCGGTGATGACGCCGCGCTGACCGCACTCGCCGCCGAACCCGATGG
+AACCGGGTGGCGTTGGCGGACTTGGCATCTGTACCCGAGCGCGTCCGGCGGGACGGTGGTCCACACGACG
+AGCCGATGGCGTCCATGAGCCGCAACCGCCTGTTCCTGGTTGCCGGCATCTTGGCGGTTGCCGCCGCCGT
+GTCCTTGATCTCTGGAATCACGCTGCTGAACAGGGACGTTGGCTCGTATATCGCCTCGCACTATCGCCAA
+GAATCCCGTGACGTGAACGGAACGCGATACCTGTGCACCGGATCGCCCAAACAGGTGGCCACCACGCTCG
+TCAAGTACCAGACCCCGGCGGCGCGCGCGTCGCATACCGACACCGAGTACCTGCGTTACCGCAACAACAT
+CGTGACGGTCGGACCCGACGGCACCTATCCGTGCATCATCCGCGTCGAAAACCTCAGCGCCGGATATAAC
+CACGGCGCATATGTCTTCCTGGGCCCTGGATTCACCCCTGGGTCCCCGTCGGGCGGTTCGGGGGGCAGCC
+CGGGCGGTCCTGGCGGCAGCAAGTAAGGCGATGACGCAAAGGAGAGAGTCATGTATCAGGCCGGAGTCGA
+TTTCGGGACCATCAGCCTTACCCCGATCCTGCATGGGGTGGTGGCCACCGTCTTGTACTTCCTAGTGGGC
+GCCGCCGTGCTAGTCGCAGGCTTTCTGATGGTCAACCTGTTGACCCCGGGCGATCTGCGTCGCCTAGTGT
+TCATCGACCGCCGCCCCAACGCCGTGGTTCTGGCCGCCACAATGTATGTGGCGCTGGCCATCGTCACCAT
+CGCCGCCATCTACGCCAGCTCCAATCAGCTGGCCCAGGGCCTGATCGGCGTGGCGGTGTACGGAATCGTC
+GGTGTCGCGCTGCAGGGGGTGGCACTGGTGATCCTCGAGATCGCGGTGCCGGGGCGATTCCGTGAGCACA
+TCGACGCACCTGCGCTGCATCCGGCGGTGTTCGCTACCGCCGTCATGCTGCTGGCGGTAGCGGGGGTAAT
+CGCCGCCGCGTTGTCATGACGTCCACCCGGCAGGCGGGCGAAGCCACCGAAGCTTCGGTACGGTGGCGGG
+CCGTGCTGCTGGCCGCGGTCGCGGCGTGCGCGGCCTGCGGTCTCGTTTACGAGCTCGCGCTGCTGACACT
+GGCGGCGAGCCTGAACGGCGGCGGGATCGTGGCCACCTCCCTGATCGTCGCGGGCTACATAGCCGCGCTG
+GGAGCAGGCGCCTTGCTGATCAAGCCGCTACTTGCACACGCGGCCATCGCGTTCATCGCCGTGGAGGCGG
+TGCTAGGCATCATCGGCGGATTGTCCGCGGCGGCGCTGTATGCGGCGTTCGCGTTCCTGGACGAGCTCGA
+CGGGTCGACGCTGGTTCTTGCGGTGGGCACCGCCCTGATCGGCGGGCTGGTCGGCGCCGAGGTGCCGCTG
+CTGATGACGCTGTTGCAGCGCGGCCGCGTGGCAGGGGCCGCCGATGCCGGACGCACCCTGGCCAACCTCA
+ACGCGGCCGACTATCTGGGCGCGTTGGTCGGCGGGCTGGCCTGGCCATTCCTGCTGCTGCCGCAGTTAGG
+GATGATCCGCGGTGCGGCGGTCACCGGCATCGTCAATCTGGCGGCCGCCGGGGTTGTGTCGATCTTCCTG
+CTGCGCCACGTCGTGTCCGGCCGGCAACTGGTGACCGCCTTATGCGCGCTCGCCGCGGCGCTCGGGCTGA
+TCGCCACACTGCTGGTGCATTCCCACGACATTGAGACCACCGGCCGCCAACAGCTCTACGCCGACCCGAT
+CATCGCCTACCGACACAGCGCCTACCAGGAAATCGTGGTCACCCGCCGCGGCGATGACCTGCGCCTCTAC
+CTGGACGGAGGTTTGCAGTTCTGCACCCGCGACGAATACCGCTACACCGAAAGCCTGGTCTACCCGGCAG
+TCTCCGATGGCGCGCGTTCGGTGCTGGTGCTCGGTGGCGGCGACGGACTGGCAGCCCGCGAACTGCTGCG
+CCAACCCGGCATCGAGCAGATCGTGCAGGTGGAACTCGACCCCGCGGTCATCGAACTGGCGCGCACCACC
+CTGCGCGACGTCAACGCCGGTTCGCTGGACAACCCGCGCGTACACGTCGTGATCGACGACGCCATGAGCT
+GGCTACGCGGCGCCGCGGTCCCCCCGGCTGGCTTCGACGCAGTGATCGTCGACCTTCGCGACCCCGATAC
+TCCCGTGCTGGGTCGGCTGTATTCCACCGAGTTCTACGCACTCGCCGCCCGCGCGCTCGCGCCCGGCGGG
+CTCATGGTCGTGCAGGCAGGCAGCCCGTATTCGACCCCGACTGCGTTCTGGCGCATCATCTCCACGATCC
+GGTCCGCCGGGTATGCCGTCACGCCCTACCACGTGCACGTGCCCACCTTCGGCGACTGGGGATTCGCCCT
+GGCACGCCTTACAGACATCGCGCCCACCCCCGCTGTGCCGAGCACTGCCCCTGCACTGCGCTTCCTGGAC
+CAACAGGTGCTCGAGGCCGCGACCGTGTTTTCCGGCGACATCCGGCCCCGCACGTTGGACCCGTCGACCC
+TGGACAATCCGCACATTGTTGAGGACATGCGGCACGGCTGGGACTAGCGCACCCATCTAGGGCGGCCAGG
+GTTTGCACAACGCAGCACGGGTTCCGAACGGAACCGGGGCCCGCTCGTAGCCCGGCCATAAAAGCATAAA
+AACAGTATGCTGGGTAAATGAAGACCACGCTCGACCTGCCTGATGAACTGATGCGCGCTATCAAGGTCCG
+CGCGGCGCAGCAGGGCCGCAAGATGAAAGATGTCGTGACCGAACTGCTCAGATCCGGTCTGTCCCAGACG
+CACAGCGGGGCTCCAATCCCAACGCCGCGGCGCGTGCAGCTTCCCCTGGTGCATTGCGGTGGCGCGGCTA
+CCCGCGAACAAGAAATGACGCCGGAGCGTGTTGCCGCGGCCTTGCTCGACCAGGAGGCCCAGTGGTGGTC
+CGGACACGACGATGCTGCTCTGTGACACCAACATCTGGCTGGCGTTGGCGCTTTCCGGACACGTGCACCA
+CAGGGCCTCGCGCGCATGGCTAGACACCATCAACGCGCCCGGAGTCATCCACTTTTGCCGCGCAACCCAA
+CAGTCGCTCCTTCGGCTGTTGACGAATCGGACGGTGCTGGGCGCGTATGGCAGCCCACCACTGACCAACC
+GCGAAGCGTGGGCGGCCTATGCCGCGTTCCTGGATGACGACCGCATCGTGCTGGCCGGCGCCGAACCTGA
+TGGTTTGGAGGCCCAGTGGAGAGCCTTCGCCGTTCGCCAGTCGCCGGCGCCCAAGGTTTGGATGGATGCC
+TACCTAGCTGCTTTCGCACTTACCGGTGGATTCGAGTTGGTGACGACTGACACCGCCTTCACCCAGTACG
+GCGGAATCGAGCTGCGGCTCCTGGCCAAGTGACAGCGCAAGCCCCGCAGTGCTCACTCGTCGTCGAGGGC
+GGCCAGCACCTCGTCGGACACGTCGACGTTGGTCCACACGTTCTGCACGTCGTCACTGTCTTCTAGCGCG
+TCGACGAGCTTGAACACTTTCCGTGCGCCGTCCAGGTCCACGGGCACGCTGACCGAGGGTTGAAAGCTGG
+CCTCGGCCGATTCGTAATCGATGCCGGCATCTTGCAAAGCGCTACGAACCGCGACCAGTTCCGCGGGCTC
+GGAGATGACCTCGAAACTGTCGCCCAGGTCGTTGACGTCCTCGGCACCGGCTTCCAGAACAGCCGCCAGC
+ACATCGTCTTCGGTCAAGCCGTTCTTTTCCAGGGTCACCACGCCTTTGCGGGAGAACAGGTAGGACACCG
+ACCCCGGATCGGCCATGGTGCCACCATTGCGCGTCATCGCCACCCGCACCTCGCTGGCGGCGCGATTGCG
+GTTGTCGGTCAGACACTCGATCAGCACCGCCACCCCGTTGGGCGCGTAGCCCTCGTACATGATGGTCTGC
+CAGTCGGCGCCGCCGGCCTCCTCGCCGGCGCCGCGCTTGCGGGCCCGTTCGATGTTCTCGTTGGGAACCG
+AGCTCTTCTTCGCCTTCTGAATCGCGTCGTAGAGCGTGGGGTTGCCGGCCGGATCACCGCCACCGACACG
+CGCCGCCACCTCGATGTTCTTGATCAGCCGGGCGAACATCTTGCCGCGGCGGGCGTCGACGACGGCCTTC
+TTGTGCTTGGTGGTGGCCCACTTGGAATGGCCGCTCATCGCAGTGATTTACCTCTTCTGTTGCTCGTTCG
+CCAGACGAGTCTACGTGGGGGTTGTGGGCGGCGAGCCAACCGGCACGAGCAGACACAAAAGCTCCAAATT
+TCGGCCTGAAACGGGTGCTTTTGCGACTGCTCACGCCGCGGAGGTGACGATGTCGACGAACAACTGATGA
+ATGCGGCGATCGCCGGTCATCTCCGGATGAAACGCGGTGGCAAGCACCGCACCCTGGCGCACCGCGACGA
+TGTGCCCCGCCGCGCGGGCCAGCACCTGCACACCGTCACCGACTCGCTCAACCCATGGCGCCCGGATGAA
+CACCGCGCGCACCGGATCGTCTAGACCAGCGAACTCGATATCGCCTTCAAACGAGTCAACCTGACTTCCA
+AAAGCATTGCGCCGCACCGTCATATTCATCGCACGCAGGGGCAGCGCCTGGCGGCCTGCCGCACCGGCGT
+CCAGGATCTCGCTGGCCAACAGAATCATGCCCGCGCACGAACCATAGGCCGGAAGCCCATCGGCGAGCCG
+GGCCCGCAGCGGTCCCAGCAGGTCGAGGTCGAGCAGCAGGTGGCTCATCGTGGTGGATTCCCCGCCCGGG
+ATGACCAGCGCGTCCACCGCGTCAAGTTCGTCGCGGCGCCGCACCGTCATCGGCTCGGCCCCGCATTCGC
+GCAGCGCAGCCAGGTGCTCCCGGGTGTCGCCCTGCAGCGCCAGCACCCCGACCCGTGGAACGCTCACAGC
+CCGCTCACTGCCCCACCGACCGGTGACCGCGCCGGTGGCGGGTCAGCCCCTCCTGCATGACCGCCGCGAC
+CATCTCCCCGGACCGTGTGAAAATCTCGCCCCGAGTCAGCGCACGACCGCCGCTGGCCGACGGCGACGAC
+TGGTCGTACAGCAACCACTCGTCGGCGCGGAAGGGTCGCATGAACCACATCGCATGGTCCAGCGATGCCA
+CCTGCAGCTGGTCGCGCACATCGAGGTGGTTGACTTGTGCCGATCCCAGCAGCGTGAGGTCGCTCATGTA
+GGCGAGTGCACAGATGTGCAACACCGGGTCGTCGGGCAACGGGTCACGGTGGCGAAGCCACACCTGCTGC
+TGGGAAGCCTTGCCCGGCAAAAGCCGCAGGCGCTCCCGGGGCACGATGCACACGTCCCACTCGTCGAACT
+GCCGGAACCCGGCATCATCGAAAACCTTGATCGAGTTCAACCCCGGCAGGCCGTCGGGCGGCGGCGCCGC
+TGGCATAACGTCTTGGTGGGTAATGCCCTCCTGTTCGGTCTGGAACGACGCCGCCATGCTGAATATGGTT
+TCCCCGTGCTGGACTGCGTTGACCCGCCTGGTGCAGAGCGATCCACCGTCGCGGATGCGTTCGACCAGAA
+AAACCGTGCGCTCCTTGGCATCTCCAGGCCGAAGAAAATAGCCGTGCAGCGAGTGCACCATGTACCGCGG
+GTCGACGGTGCGCACCGCCGACACCAGCGACTGGCCGGCTACATGACCACCGAAAGTGCGTTGCAGGAAG
+CCCGATTCGGGGCTGAACACGCTTCCTCGGTAGATGTTGACCTCAAGTTGCTCAAGATCAAGGATCTCTT
+CGATCGACACGCGATGACCGTCTGCTCGTCGCGGGTTCTCACCAGCCGCGCTGGGCGAGCCGATGACCGA
+CAGCGATCTCGTCCACGTTGATGCCCACCATCGCCTCGCCCAGCCCGCGCGACACCTTGGCCAGCACATC
+GGGATCGTCGAAGAACGTGGTGGCCTTGACGATCGCGGCGGCGCGGTGCTCAGGGGCGCCGGACTTGAAA
+ATACCGGAACCCACGAAGACGCCCTCGGCGCCAAGCTGCATCATCATCGCCGCGTCGGCGGGCGTGGCGA
+TACCCCCGGCGGTGAACAGTGTGACCGGCAACTTGCCCGCCCGAGCTACCTCGGCAACGAGTTCATAGGG
+CGCTTGCAATTCTTTTGCCGCGACAAACAATTCGTCCTCCGACATCGACGTCAACCGGCGGATCTCACCA
+CCGATGGCCCGCATGTGTGTGGTCGCGTTGGAGACGTCTCCGGTCCCGGCCTCGCCCTTGGACCGGATCA
+TGGCCGCTCCCTCGCTGATGCGCCTCAACGCCTCACCGAGATTGGTCGCCCCACACACGAAAGGCACCGT
+GAAGTTCCACTTGTCGATATGGTGGGCGTAGTCAGCGGGCGTCAGCACCTCGGACTCGTCGATGTAGTCG
+ACGCCCAACGTCTGCAGGATCTGCGCCTCGACAAAGTGGCCGATGCGCACTTTAGCCATCACCGGGATGG
+TGACCGCGGCGATGATGCCCTCGATCATGTCGGGGTCACTCATCCGCGACACCCCGCCCTGGGCGCGGAT
+ATCGGCGGGCACCCTTTCCAACGCCATTACCGCAACCGCACCGGCGCCCTCGGCGATGCGGGCCTGCTCC
+GGGGTGACAACGTCCATGATGACGCCGCCCTTGAGCATCTCGGCCATGCCGCGCTTGACCCGCGCCGTAC
+CGGTCGCTGGGTTACCTGCAGGATCCATGGTGCCTCCTCTTGTCCCCACTACGATACGACCGCTACCGCG
+CCGGTCTGCTAGCCACTCAGGGGCGTGGCCAGGACGCCGATTGGTAAATTACGAATCCCTCAGCCGTGCA
+GCACCGGAGGCCGGAATGGACGATGACGCCCAAATGGTCGCGATCGATAAAGACCAATTGGCAAGGATGC
+GTGGCGAATACGGCCCGGAGAAGGATGGCTGCGGAGATCTGGACTTCGACTGGCTCGACGACGGCTGGCT
+CACGCTGCTGCGGCGCTGGTTGAACGATGCACAACGCGCCGGAGTGAGTGAACCGAACGCGATGGTGCTC
+GCCACCGTTGCCGACGGAAAACCGGTGACCCGTTCGGTACTTTGCAAAATCCTGGACGAGTCCGGTGTCG
+CGTTCTTTACCAGCTACACCTCCGCCAAAGGCGAGCAGCTCGCCGTGACACCATACGCATCGGCAACCTT
+TCCCTGGTACCAGCTAGGTCGCCAGGCACACGTACAGGGCCCAGTCAGCAAGGTCAGCACCGAGGAGATA
+TTCACGTATTGGTCCATGCGCCCCCGGGGCGCGCAGCTGGGTGCGTGGGCCTCGCAGCAGTCGCGCCCGG
+TCGGTTCTCGCGCCCAGCTCGATAACCAGCTCGCCGAGGTGACGCGTCGCTTCGCCGACCAGGACCAGAT
+CCCGGTGCCCCCAGGATGGGGCGGCTACCGCATCGCTCCGGAAATCGTGGAATTCTGGCAGGGCCGGGAG
+AACCGCATGCACAACCGAATCCGCGTCGCCAATGGCCGGCTGGAACGGTTGCAACCCTGATCGTCGAGTC
+TGGCCACCTCGCGGGCGAAGTTTGACGGAACCTCGCAGATCTTGCCGGACATGCCATAGAGTCTTTGACC
+GGAATGCCCGCTGACCCGTGACGACGCGGTCACCGGGGATACCCGCCGCGGTGGTGGCCAACCGATAACG
+GCCAACCGAGAAAGTACACAGCGATGAATTTCGCCGTTTTGCCGCCGGAGGTGAATTCGGCGCGCATATT
+CGCCGGTGCGGGCCTGGGCCCAATGCTGGCGGCGGCGTCGGCCTGGGACGGGTTGGCCGAGGAGTTGCAT
+GCCGCGGCGGGCTCGTTCGCGTCGGTGACCACCGGGTTGGCGGGCGACGCGTGGCATGGTCCGGCGTCGC
+TGGCGATGACCCGCGCGGCCAGCCCGTATGTGGGGTGGTTGAACACGGCGGCGGGTCAGGCCGCGCAGGC
+GGCCGGCCAGGCGCGGCTAGCGGCGAGCGCGTTCGAGGCGACGCTGGCGGCCACCGTGTCTCCAGCGATG
+GTCGCGGCCAACCGGACACGGCTGGCGTCGCTGGTGGCAGCCAACTTGCTGGGCCAGAACGCCCCGGCGA
+TCGCGGCCGCGGAGGCTGAATACGAGCAGATATGGGCCCAGGACGTGGCCGCGATGTTCGGCTATCACTC
+CGCCGCGTCGGCGGTGGCCACGCAGCTGGCGCCTATTCAAGAGGGTTTGCAGCAGCAGCTGCAAAACGTG
+CTGGCCCAGTTGGCTAGCGGGAACCTGGGCAGCGGAAATGTGGGCGTCGGCAACATCGGCAACGACAACA
+TTGGCAACGCAAACATCGGCTTCGGAAATCGAGGCGACGCCAACATCGGCATCGGGAATATCGGCGACAG
+AAACCTCGGCATTGGGAACACCGGCAATTGGAATATCGGCATCGGCATCACCGGCAACGGACAAATCGGC
+TTCGGCAAGCCTGCCAACCCCGACGTCTTGGTGGTGGGCAACGGCGGCCCGGGAGTAACCGCGTTGGTCA
+TGGGCGGCACCGACAGCCTACTGTCGCTGCCCAACATCCCCTTACTCGAGTACGCTGCGCGGTTCATCAC
+CCCCGTGCATCCCGGATACACCGCTACGTTCCTGGAAACGCCATCGCAGTTTTTCCCATTCACCGGGCTG
+AATAGCCTGACCTATGACGTCTCCGTGGCCCAGGGCGTAACGAATCTGCACACCGCGATCATGGCGCAAC
+TCGCGGCGGGAAACGAAGTCGTCGTCTTCGGCACCTCCCAAAGCGCCACGATAGCCACCTTCGAAATGCG
+CTATCTGCAATCCCTGCCAGCACACCTGCGTCCGGGTCTCGACGAATTGTCCTTTACGTTGACCGGCAAT
+CCCAACCGGCCCGACGGTGGCATTCTTACGCGTTTTGGCTTCTCCATACCGCAGTTGGGTTTCACATTGT
+CCGGCGCGACGCCCGCCGACGCCTACCCCACCGTCGATTACGCGTTCCAGTACGACGGCGTCAACGACTT
+CCCCAAATACCCGCTGAATGTCTTCGCGACCGCCAACGCGATCGCGGGCATCCTTTTCCTGCACTCCGGG
+TTGATTGCGTTGCCGCCCGATCTTGCCTCGGGCGTGGTTCAACCGGTGTCCTCACCGGACGTCCTGACCA
+CCTACATCCTGCTGCCCAGCCAAGATCTGCCGCTGCTGGTCCCGCTGCGTGCTATCCCCCTGCTGGGAAA
+CCCGCTTGCCGACCTCATCCAGCCGGACTTGCGGGTGCTCGTCGAGTTGGGTTATGACCGCACCGCCCAC
+CAGGACGTGCCCAGCCCGTTCGGACTGTTTCCGGACGTCGATTGGGCCGAGGTGGCCGCGGACCTGCAGC
+AAGGCGCCGTGCAAGGCGTCAACGACGCCCTGTCCGGACTGGGGCTGCCGCCGCCGTGGCAGCCGGCGCT
+ACCCCGACTTTTCTAAGCGGTCCACAAACCGTGCACGTCAGCGGATGGGCTGAGGAACGCCGGCATCGCG
+CGCGGCTCCGTTGTCCAGCGCGACGTCCACCAGCCGGTTGGCTGCCGGCAACAGCTCGCCTAGTTGCAAC
+GGGTACACCCGCTCGCCCGCCGCCACCAGCTGCGCGATGTCGTTCGCGTCACACCAGCGGGCATCGCGAA
+TATAGCGGCGTTCCAACTCGGTTCGCCCCTGCACAGCAGGCTCGAACCGACGCGTCCGGTGCACCAGGTA
+GAACTCCTCGCTGTCGATCAGCGACCCGTTGAACTCGAAGACCTCGTCGCGTCGCCAGATAGGTCCGATC
+ATGTCGGCCGGGGCCACCCGCAGACCGGTTTCTTCGGCCAGCTCCCGGGCGGCGGCCTGGGCCAGCCGCT
+CACCCGGTCGCACTTGGCCCCCGACGGTGAACCACCACTTCGGCGCCGCGCCGTCCCGAAACGCCGGGTT
+CGCCGGATCCGATCCGCACAGCAACAACACGGCACCGCTGTCATCCAATAGCACCACCCGCGCCGAGGTG
+CGGCGACCGGACGCACCCTGATCGCCGTGCACCAATGCGTGGGGTCGCTCGACGATCTCGAAATAGGTTG
+GCAGCACAGCGGTTCCACCAAGCCGCAGCAATCGCACCAGCCGTCGTTCCCCCAGAGCGAGGGTGTCGCG
+AACGGCGTCGTTGTGGAAGCGGCGGGCCAGCAGGACGCGGGCTTCCGCGTCGGCTAACTCGGCGATCAGG
+GCCGCGGGCAGCGACGCGGGGTTGACCATCGCCAACGCGGCCGAAAGCTCGTTCTCCGCATTCTCGCGCG
+CATGCCGGGGCGCGCCCTCCGCGGCGTCGGCTAAGGCGGCCAGCCGACTGCCCTGGGGGGCACCGCCGTA
+CGCGTCGATCGCCACCGCACGTGCCACCACCGCTCGTCGCGCGAGCGCGCTGTCCAGCGACTGCCACGAC
+AAGTCATAGCGCACGTTCAACCGGTTCAACCGGTTGGCCGTCTGATATCCCCAGGCGCCGAACGCAACCA
+GCACAACGAGCAGCACTGCGCCGGCCAGGACCAGCCACGTCATCAGCTGGCCACCTGAACCTTGGCGCCC
+GACCCGGCGACCGTCTCGTACACTCGCATGATCTGGCTGGCCACCACCGACCAGTCATACCGGCGGACGG
+CCGCGTTGCCGGCCGCCACATAGCGCTCCCGCAGGACATCGTTCTCCAGCACCGCAATCAGTCCATCGGC
+CAACGCGGCGGCCTGCAAGTCTGGCGGGTCCACCGGCACCAGGTGCCCGACCTCACCGTCGCGCAGCACA
+CGCCGGAAGGCGTCGAGGTCGCTGGCCACCACCGCAGTGCCGGCGGCCATCGCTTCGACCAGCACAATGC
+CGAAACTCTCACCGCCGGTGTTGGGCGCACAGTAGACGTCGGCGCTGCGCATCGCCGAAGCTTTTCCGGC
+GTCGTCCACCTGACCCAGAAAGCGCAGGTGCGCCGCCAAACGGCCCGCCTGGCCGCGCAACTGGTCGGCG
+TCGCCGTGGCCGACGATCAGTAGCTGGACATCCGGAAACCGCTGCACCACCTTCGGCAGCGCGTCGAGCA
+AAACGGCCATGCCCTTGCGGGGCTCGTCGTAGCGACCCAGGAACAACACCGTTTTACCCTGGCGCGGGTA
+CCCGTCCAGCCGCGCTGCCGAGGCGAAGGAATCAACGTCCACCCCATTGGGGATCTCCACCGCATCGGAT
+CCCAACGCCTCCATCTGCCAGCGCCGGGCTAGGTCGGACACCGCGATCCGGCCGACGATCTTCTCGTGCA
+TGGGCCGCAGAATGCCCTGGAACACCGTCAGCGTCAGCGACTTGGTGGTCGAGGTGTGAAATGTCGCCAC
+AATCGGGCCCTCGGCAATGTTCAGGGCCAGCATCGACAGGCTCGGCGCATTCGGCTCGTGTAGATGCAGT
+ACGTCGAAATCACCATGCGCAAGCCACTTTTTGACCTTGCGGTGGGTCGCCGGACCGAACCGCAGCCGGG
+CCACCGAGCCGTTGTAGGGAATCGGAACCGCCCTACCACCGGAGACAAAGTAATCAGGCAGTGCGGCATG
+CGGGGAGGCCGGCGCGAGCACACTGACCAAGTGGCCGCGGGTGCGCATCACCTCGGCAAGCTGTAGCACA
+TGCGACTGCACCCCGCCCGGGACGTCGAACGAGTACGGACAAATCATGCCGATCCGCATCAGGCTTTCCT
+CATCTGGACCTCAGTTGCGCCCGCCGCGATTCGGATAAGTCGGCCAGCCACTGGGGCTGCAGCATGTGCC
+AATCCGCGGGATGGGCGGCAATGTTCTGCGCGAAGCGGTCGGCCAGCGCCTGTGTGATGGCAGCGACGTC
+ACCGCTGGTGCAATCCAGCGCCGGATACACCTGGAAACCCCAGCCGCGGCCCTCGAACCAGCAATGTGTG
+GGCAGCAATGCCGCACCGGTCTCGACCGCCAGCTTCGCCGGCCCCACCGGCATCCGGGTGGGCTCGCCGA
+AGAAGTCGACCTCAACACCGGTGCGGGTGAGATCGCGCTCGGCCATCAGGCAGACCACTCGGTTGTTCCT
+CAGCCGCTCACAGAGCACCTCGAACGGCGGCCGTTCGCCGCCGGACAGCGGCAGCACCTCAAATCCCAGG
+CTTTCGCGGTAGTCGATAAAGCGCTGGTACAGCGATTCGGGTTTTAGGCGCTCGGCGACGGTGGTGAAGG
+TGCCGTGCCGCTGCACCAGCCACATCCCGGCCATATCCCAGTTGCCGCTGTGCGGCAACGCCAGCACGGC
+ACCGAGGCCCGCGGCCAGCGCCGCGTCCAGGTGATCCAGTCCACCGATCACGCGGTCGAGCTGGCGGGCC
+AGCTTGCGGTGGTTCATCGTCGGCAGCCGGAACACCTCACGCCAGTAGCGCCCGTAGGACTCCAGCGAGG
+CGCACATCAGCGGGTCCGGCACCGCGGCTGGCGGCACACCCAGGACGCGGGCCAGGTTCTTGCGCAGCTG
+CTCGGGCCCGCCGTGGCGGGCAAAGTAGCGCGCTCCGGTGTCGAATGCGTTGCGTACGGCGAACTCTGGC
+AGCGCCCGTACGGCCATCCAGCCGGCCGCATACGCCCAGTCGGTCGCGGTGCGCGTCACGGAACTGCGCG
+GATCTTTGGGCAGCTTCAAGCCCTTAAGGCCGGCAATCACCGGTCGCCCTTTCCAGGAATCGCCATCCGA
+TCGATGGCTCCGGGTGAAGTCCAGACCGTGTGCAACCGCTGCACGCAGGTGATCACGCTGGCGACGGCCA
+GCAGCCACATCCCCACCGACAACGCCGGCGGCCAGGGCACAAACGGGAAGTCCGACACCCCGGCGCCGGT
+CAGCACGATGATCAACCGTTCCGGCCGTTCGATGAAGCCGCCGTCGCCGCGCAGCCCGCTGGCCTCCGCC
+CGGGCCTTGATGTAAGAGATCACCTGCGAGGTGACCAGACAGATCAAGGTCGCGATCACCAGCGGTCGGT
+CGCGCATGTGAAACGCTATCCACCACAGCAGACCGCAGAACACCGCGCCGTCACTGATGCGGTCACAGGT
+GGCGTCCAGCACCGCGCCGAAGCGAGTGCCGCCCCCGCGCTCCCGGGCCATCGCCCCGTCCAGCATGTCG
+AACAACACGAAGAACCACACCACACACGCACCCGCGAACAGCTTGCCCATCGGGAACAGCGTCAGCGCTC
+CCGCCACCGACGCGGTGGTGCCCAGGATGGTGACGACGTCCGGCGTGAGGCCGACCCGCAGCAGTCCCCT
+GGCGATCGGGGTGGTAATCCGGGCGAACGCCGCCCGGGACAGGAAGGGCAGCTTGCTCATGGTTGCCGAG
+CCCACTCGGTGGCAAGCAGCCGACGGGTGTCGCGCAGCAGCTGCGGAATCACCTTGGAGCCCCCGATGAT
+GGTGATGAAATTCGCATCGCCACCCCACCGTGGCACCACATGCACGTGCAGGTGCTCGGCCAGCGACCCG
+CCCGCCGATGTCCCTAGGTTCAGGCCGACATTGAAGCCGTGCGGACGCGACACGTTCTTGATCACGCGAA
+TCGCCTTCTGGGTGAACGCCATCAACTCGGCGCTCTCCAAATCGGTGAGATCCTCGAGTTCGGATACCCG
+ACGATAGGGCACCACCATCAAGTGCCCGGGGTTGTACGGGTACAGGTTGAGCACGGCGTAGACCAGCTTG
+CCACGAGCGACCACCAGACCCTCTTCGTCGGACAGCTGCGGGATCTCGGTGAACGGCTGCGCAGGGCTGG
+CCGAGGAATTGGGGTCACGCTTCACTGGCGCTTCGGCCAGGTAGTTCATCCGGTAGGGGGTCCATAACCG
+CTGCAGCTGGTCGCGCTGGCCGACACCCCGATCGAAGATGGTGTGGTCCTCGGTGGCCCGATCCGTGCGG
+TCCTCGTCACTCACGACCGGCCACTTTCACCAGTTCCGCTGTAGGAACCGCATTTTCGCGGTCAGCGATC
+CAGGCGACAATGGCCGCCACCGCATCGTCACGGGCCACACCGTTGATTTGGGTGCGGTCACCGAACCGGA
+AACTCACCGCGCCGGCGGCGACGTCACGATCACCCGCCAACACCATGAACGGCACCTTGTGGTTGGTGTG
+GTGCACGATCTTCTTGGCCATCCGATCGTCGCTGGCGTCCACCTCGGCCCGCACCCCGTGCGACTTCAGT
+TGCGTGGCAACCTCTTCCAGATAGGCGACGTGCTCATCGGCGACCGGGATGCCGACCACCTGCACGGGCG
+CCAACCAGGCCGGGAACGCCCCCGCGTAGTGCTCGGTGAGAATGCCGAAGAACCGCTCGATCGACCCAAA
+TAGCGCGCGGTGGATCATCACCGGGCGGTGGCGGGTTCCGTCGGCGGCGGTGTACTCCAGGCCGAAACGT
+TCCGGAAAGTTGAAGTCCAGCTGGATGGTCGACATCTGCCAGGTGCGGCCCAGCGCGTCTTTGACCTGCA
+CTGAAATCTTGGGCCCGTAGAACGCCGCGCCGCCTGGATCGGGCACCAGCTCCAGCCCGGATTCGGCGCC
+CACCTCGGCCAGCACGGTGGTGGCTTCCTCCCAGACCTCCTCGGCGCCGACGAACTTCTCCGGGTCCTTG
+GTGGACAGTTCGAGGTAGAAGTCGGTGAGGCCGTAGTCGGCGAGCAGGTCGAGCACAAACCGCAGCAGCG
+ACCGCAGCTCGTCGCGCATCTGGTCGCGGGTGCAGAAGATGTGCGCGTCGTCCATGGTCAGCCCACGCAC
+CCGGGTCAACCCGTGCACCACACCGGACTTCTCGTAGCGATACACCGTGCCGAACTCGAAGAGCCGCAAC
+GGCAGTTCCCGATAGGATCGCCCGCGCGCGCGGAAGATCAGGCAGTGCATCGGGCAGTTCATCGGCTTGA
+GGTAGTAGTCCTGGCCGGGTTTGCGCAGCGAGCCGTCGGCGTTGTACTCCGCGTCGATGTGCATCGGGGG
+GAACATGCCGTCGGCGTACCAGTCCAGATGTCCCGAGGTGTGGAACAACTGGGCCTTGGTGATGTGCGGG
+CTGTTGACGAACTGGTAGCCCGCCTCGGTGTGCTTGCGCCGCGAGTAGTCCTCCAGTTCGCGACGCACGA
+TGCCGCCCTTGGGGTGGAAAACCGCTAGGCCGGAACCGATTTCGTCGGGGAAGCTGAACAGGTCCAGCTC
+GACACCCAGCTTGCGGTGGTCGCGGCGCTGCGCCTCTTCGATGAACTCCAGGTGCCTGTCGAGCGCCTCC
+TGGGATTCCCACGCGGTGCCGTAGATCCGTTGCAGGCTGGCGTTTTTCTGATCGCCCCGCCAGTAGGCGG
+CCGAGCTGCGGGTGAGCTTGAACGCCGGGATGTGTTTGGTGGTCGGGATGTGCGGTCCGCGGCACAGGTC
+GCCCCAGACGCGCTCGCGGGTGCGGGGGTTGAGGTTGTCGTAGGCGGTGAGCTCGTCACCGCCGACCTCC
+ATGATCTCGGCGTCACCCGATTTGTCGTCGACGAGTTCCAGCTTGTAGGGCTCGTTGGCCAGCTCGGCGC
+GGGCCTGTTCGGTGGATTCGTAGACCCGCCGGTCGAACAGCTGGCCTTCCTTGACGATCTGGCGCATCCG
+CTTTTCCAGCGCCGCCAAGTCCTCGGGCGTGAACGGCTCGGGCACGTCGAAGTCGTAGTAGAAGCCGTCG
+GTGATGGGTGGTCCGATGCCGAGCTTGGCCTGCGGAAACAGCTCTTGGACGGCTTGGGCCAACACGTGCG
+CGGTCGAATGGCGGATCACGCTGCGACCGTCGTCGGTGTTGGCGGCCACCGGCGTGATATCGGTGTCGAC
+GTCGGGCACCCAGCTCAGGTCGCGCAGGTTGCCGTCGGCGTCGCGCACGACGACGATCGCATCGGGCGTA
+CCGCGCCGCGGTAAACCCGCTTCGCCGACGGCGGTGGCCGCGGTGGTCCCGGCAGGAACCCGAATTCGGG
+CTTGCGACGGGTCGCCGCCATCGACTCCCGGGGCGGGTTGTGCGGGGGCGCTCATCGGGTCGGTCTCCAA
+GGCTTGGACGTGTCGAAACGATCGCGACCATGCTATCGGGGCGCACGTCGACGACCGTAAGCCGAGTGAC
+CGGATGGGTTTTCGATCACCGGTGTGGGCGATCGGTACCGGGCAGGTGACCGGGTGCTCTACGGCGGCTC
+GATGAGCCCAAAGGATGTTGACGACCTGGCTACCCAGCAGGACGTCGACGACGGACAGTCGATAGAGCGT
+CGCTGGACGGGGAGCGGTCAGCGACGCTGGCGGCGGTCGCCGCCGACGGGCCACTACCGTAGCAACTCGC
+AAATCCAGGTCTGGATTTCCGGCGCCGGCCGGCTCCGTTAGCCGTCGGCTCCGTTGGTGCCGGCCAGGCC
+GGGTGGCCCCAACAGTGATGCACCGCCGCTGCCGCCGGGCCCGCCGAAGCCTGGAGCGCCATTGAAGAGG
+CTCCCGGCGCCGCCGTTTCCGCCGTTTCCGCCGTTTCCACCGTTGCCGATCAGTCCGACGCTGCCGCCGT
+TCCCGCCTTTCCCGCCGTCACCGCCGGACCCGCCAGCAGTGCCGGCGCTCGCTCCGTTCCCGCCGGCCCC
+GGCGCTCCCACCGGCCCCCGCGTTGCCGATGAGGGCATTGCCGCCGTTTCCACCGCTGCCGCCGCTACCG
+CCATTCCCTCCGAAGGCCGTAACAGACCCGGGCGACCCGGCGGCACCGCCGTTTCCGCCGGCCCCGCCGT
+TACCGTAGAGTAGCCCGCCGGCGCCGCCGTTACCGCCTTGCCCGCCAAACCCAACGCCCCCGAAATCGGC
+GGACACATCACCACCGGCTCCGCCGGCTCCGCCATTGCCGCCGTTGCCGATCAGTCCGGTGGTTCCGGCG
+TGACCACCGTTACCCCCGAATCCGGACGCTGGACCGTTCTGAGAAATGCCTGCCCCGTTTCCGGCGGCCC
+CGCCGTCCCCGCTGTTGCCGATCAGTAGGCCGCCGTTCCCGCCGTTCCCGCCGTTGCCGCCGCTAGCCCC
+CGCGGAGGGCTCGCCGCCGCCGGTGCCCCCGGCCCCGCCGGTCCCGCCGGCGCCGATCAGCCCGGCGTTG
+CCGCCGTTCCCACCATGCCCGCCGATAGCGAGGTTGGTGCCGGCCCCACCGATCCCGCCGTTCCCGCCGG
+CCCCGCCGTTGCCGAACAGCCATCCACCGGCGCCGCCGGCTCCGCCGTTCGCGCCGGCCTCAAAGGGTAG
+GCCCTGGCCGCCAGCTCCGCCGGCCCCACCGTTGCCGATCAACCCGGCCGCACCGCCGGCCCCGCCGGCC
+TGCCCGGGTGCCCCCGACCCGCTGTTGCCGCCGTTGCCCCACAGCCACCCGCCGTTACCGCCGGCTTGCC
+CGGTCCCGTCGATCCCGTTCGCGCCGTCGCCGATCAATGGGCGCCCGGTCAGCGACTGAACGGGTGCGTT
+GATCGCATCGAGCACGTTCTGCAGCGGTGTTGCGCTGGCCGCTTCGGCGACCGCGTAGGTGCTGCCAGCT
+TGGCTTAAGGCCAGCACGAACCGTTCCTGATAGGCCGCGACCTGCGCGCTGATCGCTTGATAGTGCTGGC
+CGTGGCTGCCGAACAGCGCCGCGATCGCCGTTGACACCTCGTCTTGGGCGGCGACCAACACCTGGGTGGT
+CGCCGCCGCCGCGGTGTTGGCGGTGTTGATCGCCGAGCCGATCCGCGCCGCATCGGCCGCGGCTGTGGAC
+ACTAACTGTGGGGCCACGTTGACAAACGACATCGAAATCCTCCTGACCGCCACGATGTTGAGATGCGGGC
+GGCCCACCGCCTGTTACCCCTGCGGTGGGTAACCGTTTATTCGGACGATCCCTGCCGTTCCACGCCTGGG
+CGCAGGCACAAACCGCACCAACATTGGTGGAACGTGGTGCACACTGCACCTGGGGTTCTGCCCTCATCGT
+GTGTCAGCAGGCGAAACCCGCGCGGACGAGAACTCCTGCGTTAAGCAGCACAAATCGCCCTACACCCCAG
+TGAATCTCCGGACGCCACTACGACAGCGCGCAACGGTCGCCTCATCGACTGTGTGCACGCGCGCTTCGCG
+ATGCGCTGCCGTGGCAAGCTGGCCAGGTGGACCTCAATGCGCTGGCCGATCTGCCGCTGACCTATCCGGA
+GGTGGGCGCGACAGCGACCGGACGACTGCCCGCGGGCTACAACCACCTTGACGTGTCGACGCAGATCGGC
+ACCGGCCGCCAGCGTTTTGAGCAGGCCGCCGACGCCGTCATGCATTGGGGCATGCAGCGCAACGCCGGCC
+TGCGGGTGCGGGCCAGCTCCGAAACCGCCATCGTGTCCGCGGTGGTGTTGGTGGGAATCGCTTTCCTGCG
+TGCGCCGTGCCGAGTGGTGTATGTCATCGACGAACCCGACGTGCGCGGATTCGGTTACGGCACTTTGCCG
+GGCCATCCGGTGTCCGGCGAGGAACGGTTCGCGGTTCGCTGCGACCCGATGACCTCCGTGGTGTTTGCCG
+AGGTGTTGTCGTTCTCCCGTCCGGCGACCTGGGCGAGCAAAGCCGCCGGGCCGCTGGGCGCGGTGACCCA
+GCGCTTCATCGCCCAGCGCTACCTGCGCGCGGTGTGAGGCGCCGGCGCCCTGGTTAAGGCCGCCCGATGC
+CTCCGCTGTGCACGCCCTGCGCCAGCCGGGCGAGCGCGATGGCGCCAACCAGCAAACCGAAGTCGCGCAG
+CGCGATGTCGTAGAAACCGGGTCCGGTGACCAGGTTGAGAATGATCCCGGCCAGCCAGGCCGCGACTACC
+CAGGCGCCGATGCGCGGTGCGACCGCAACCAATACGCCGGCCACAATCTCGATTGCCCCGACCAAGTACA
+TGCATTGGTCGGCGGTGCCGGGCACGAGATCGTTGATCCAGCCGGCCAGATACATGTTCCAGTGCTGCGG
+ATGGGTCAGCAGATTGAAGAACTTGTCCAGCCCGAACAGGATGGGCGCGACCGTGAACAGCGTGCGAAGC
+AATACGTATGCAGAGTATGCCGGATCCTTCAGCTGGTCTGCGAGAGCAGGGCTGGTCGTTGGTCTGATGC
+TCATAGCTGCCTCCCGACTTCTAACAGACAACAATTTGAACGCTAGATCCTATAGACTGTATCGTCAAGT
+GTTTTGTCTGTTAGAGATGGCTTGCTGAAGTGGACGGCCGAGCTTCCTTCGAACGCGACGTCGCCGGGAT
+CGGGGCACTCGTGGATCCGGTGCGTCGCCAGCTCTACCAATTCGTGTGCTCACAATCGATGCCGGTGAGC
+CGAGACCAGGCGGCCGACGCCGTCGGCATCCCGCGCCACCAGGCGAAATTCCATTTGGACCGGCTCACTG
+CCGAAGGCCTGCTGGATACCGAGTACGCGCGCCTGACCGGCCGGTCCGGCCCCGGCGCCGGGCGGACCGC
+CAAGCTGTATCGCCGGGCCGGCCGCGACATCGCCCTCAGCCTTCCACAGCGGGAGTACGAGCTTGCTGGG
+CGGCTGATGGCCGCAGCCATCGTGCTGTCGGCCACCACCGGGGAGCCGACCGTGGAAGTGCTCAACCGGA
+TCGCCCATGACTACGGCCAAGCCATGGGCGCCGCCGCCACCACCCGGCCGCCCGCAGACCCCGCGGCGGC
+GCTGGAGCTGACGCTGGATGTGCTGCGCAAGTACGGTTATGAACCCCGCCGCCCGGCTGGCCCTGGCGAC
+GATGAGGTCGAGCTGGTGAACTGCCCGTTCCACGCACTGGCCCGGGAGCAGACCGAGCTGGCCTGCAATA
+TGAACCACGCCTTGATCACAGGCGTGGCCGACGCGCTGGCACCGCACAGCCCGGCCGTTCGGTTGGCACC
+CGGACCGGCCCGGTGTTGTGTAGTACTCAAGCGATGTTCGGCTCACGACCCCGAGTGAGCATCGGGCAGG
+GATTTCAGCACGGTCAGCATGATCACCGAATCCTCGACGGCGTGCAGCGCATGCCGTGTCGGCGGAATCG
+CGACGTAGTCGCCGGCCCTGCCGTTCCACGCGTCCTCACCGGCGGTAAGGCACACATGGCCCTGCAGCAC
+TTGCAGCGTCGCCTCGCCCGGGCTGTCATGCTCGGACAGGTCGTGGCCGGCAAGCAATGCCAGCACCGTC
+TGCCGAAGCTCGTGGGTGTGACCACCGTGGATGGTGTGGGCAGCCCGTCCGCTGTGTGTCTGTTGCGCCT
+CGGCCAGCTTTTCGGCGGCCAGGCTGGTCAGCGAAATGGATTCCATCGGCGCGTCCTTTCAGCCGTTCAG
+TAGCAGTATCCCCGCGACGAGCAACGCAACCACCTTGACTATCTCCAAACCGACATAGATGTGGTGACCG
+CGGGAGCGGGGAGCCTGCAGCCCGGCCAATACCTGATTGGACCGTCGAGTCAATCGAGGACGCACCGCAA
+TCAACTGGACGGCCAACGCAGCCAACGCGACCGAAAACGCCGCGGCGATCCGCGCCGGCGTCGAGCCGAC
+CACCACGATCGCGAGGATGACAAGGGCGAAACCGACCTCAACGGTATTGAGCGCACGGAAGACCAACCGG
+CCGATGCCGAGCCCGATCTGCAGCGTCACTCCTGCCGCCCGGAACTTCAGCGGAGCTTCCAGAAACGAGA
+TCGCCACCACCATTCCCAGCCAGACGAACGCGACGGCGACCTCGATCGCCGGTCCGGCGCTCACCGAATG
+GCTCCTTCCAGCGGCGTGAAGTGGGCCAGGCACAGGTCGGGTTCGACGAACGCGTCGAGCCGGTCGACGG
+TGACTGGCGCCCATGTTTGCAAGGCTCCCCGCATGATCCCTAAGTGGACGGGGCAGACGACACCGGCTTG
+AGTTTCGGCGAGTTCCAGAAACGGACAGTGCCGCAGACCGACCTGTTGCCTGCCGTTGGATGCCCGGCGC
+TCGGGAGCGAAGCCAAGGTCGTCAAGCACCGCGACCAAGTGGTCGATCGTCTCCTCGGTGTCGGCACCGG
+CCGGCGGCGCTTCGAGCTGGCGCCCCCACGCCCGGCCCGCGGACAACGCCATGGCCCGCGAATCCCGTTC
+GGCGGCAAGGCCACTGGCGAGGATCTCGGCAAGCAGCCGGTAACGCCGCGTCCCAGTGCTATCCGTCCGC
+CGGACCGCCCGAAACATCAGCGGCGGGCGCCCCGGTCGGCCGCGGCCGGGCTCGACCCGCTCCACCTGGC
+CATCAGCGACCAGGTTATCGAGGTGGAAGCGGACGGTGTTGGGATGCACGCCCAACTTGCCGGCGATCGC
+GGCGATGCTCATCGGAACCCGCGACGCACACAATGCCCGCAGCACCGCACGACGGCGCCCCACCGGCTCT
+TGCAGTGACCTGATGATGACACTCACCCCCATAAGGCTCGTCGGCTGCGCCTGAGCAATGCAGTAAGTTT
+ACACAAACGGACTTGTAAAAACCTGCGGAGGTGGGGTCTATGGCCAACAAACGTGGCAATGCCGGGCAGC
+CTCTGCCCTTGTCGGATCGAGACGACGACCACATGCAGGGGCACTGGCTGCTGGCCCGGCTGGGCAAGCG
+GGTGCTGCGTCCCGGCGGCGTCGAACTCACCCGGACACTGCTGGCCCGCGCCGAGGTGACCGACGCCGAC
+GTGCTCGAGCTGGCACCGGGCCTGGGCCGCACCGCAGCCGAAATCTTGGCCCGCAACCCGCGGTCGTACG
+TGGGGGCGGAGAGCGATCCCAACGCGGCCAACCTGGTCCGACACGTTCTCGCCGGCCGCGGCGACGTCCG
+GGTCACCGACGCGGCCGATACCGGATTATCCGACGCCAGCGCCGATGTCGTCATCGGCGAGGCGATGCTG
+ACCATGCAAGGCAACGCGGCTAAACACACGATCGTCGCCGAGGCGGCGCGGGTGCTGAGGCCGGGTGGCC
+GCTACGCGATTCACGAACTAGCGCTGGTGCCGGACGACGTCGCAGAGCAGGTCCGCACCGACCTGCGGCA
+GTCGCTGGCCCGCGCGCTCAAGGTCAATGCGCGTCCGCTGACCGTTGCGGAATGGTCGCACCTCTTAGCG
+GGCCATGGACTGGTCGTCGAACACGTTGTCACCGCTTCCATGGCGTTGTTACAACCGCGACGGGTGATCG
+CTGACGAAGGCCTCCTGGGTGCGCTGCGGTTCGCCGGAAACCTGCTCATCCATCGTGCCGCGCGTCGGCG
+AGTCCTGTTGATGCGCCACACATTCCGCAGGCATCGTGAACGCTTGACAGCCGTCGCCATTGTCGCGCAC
+AAACCGCACGTCGATTCGTGATCCATTGAGGACCTAAGCCCGTTGGGCTAGTGACAAACGCCTCCTGAGC
+AAAACCCTCCTCCCCCGTTACCGTCGTGCGGTAGGGACAAGCCACATCGGCCGAGCGGGCGATCAGCCAA
+CGACAGGAGGACCGCGATGTCATCGGGCAATTCATCTCTGGGAATTATCGTCGGGATCGACGATTCACCG
+GCCGCACAGGTTGCGGTGCGGTGGGCAGCTCGGGATGCGGAGTTGCGAAAAATCCCTCTGACGCTCGTGC
+ACGCGGTGTCGCCGGAAGTAGCCACCTGGCTGGAGGTGCCACTGCCGCCGGGCGTGCTGCGATGGCAGCA
+GGATCACGGGCGCCACCTGATCGACGACGCACTCAAGGTGGTTGAACAGGCTTCGCTGCGCGCTGGTCCC
+CCCACGGTCCACAGTGAAATCGTTCCGGCGGCAGCCGTTCCCACATTGGTCGACATGTCCAAAGACGCAG
+TGCTGATGGTCGTGGGTTGTCTCGGAAGTGGGCGGTGGCCGGGCCGGCTGCTCGGTTCGGTCAGTTCCGG
+CCTGCTCCGCCACGCGCACTGTCCGGTCGTGATCATCCACGACGAAGATTCGGTGATGCCGCATCCCCAG
+CAAGCGCCGGTGCTAGTTGGCGTTGACGGCTCGTCGGCCTCCGAGCTGGCGACCGCAATCGCATTCGACG
+AAGCGTCGCGGCGAAACGTGGACCTGGTGGCGCTGCACGCATGGAGCGACGTCGATGTGTCGGAGTGGCC
+CGGAATCGATTGGCCGGCAACTCAGTCGATGGCCGAGCAGGTGCTGGCCGAGCGGTTGGCGGGTTGGCAG
+GAGCGGTATCCCAACGTAGCCATAACCCGCGTGGTGGTGCGCGATCAGCCGGCCCGCCAGCTCGTCCAAC
+GCTCCGAGGAAGCCCAGCTGGTCGTGGTCGGCAGCCGGGGCCGCGGCGGCTACGCCGGAATGCTGGTGGG
+GTCGGTAGGCGAAACCGTTGCTCAGCTGGCGCGGACGCCGGTCATCGTGGCACGCGAGTCGCTGACTTAG
+GTTCAGCGGCGAACGACAAGCACCGAACACTCGGCGTGACGGAACACCGGATGTCCGGATGGCCCGACCA
+GCCGCGCTAGCTGACCGGCCTCACCACCGCCGATCACTGCCAGCTGTACGCGCTCGTCGTGGTCGGCCAG
+GAACCGGGCAATACCCGTGTGAGTGGTGATCGGGTAGACGCGCACATCGGGATGACGGTGGTGCCAATCC
+TGCACGCGACGTTCGAATTCGCCGTCCGGAATCTCCCGGAGCTCCTCCGGTCGCCCGCCGAGTGCCAGTA
+TGGGCGCTTGCCGCAACTTCGCTTCCCGGGCAGCGTATTCCAGCACGGCCTCGTTATCCGGTGCGTCGGT
+CATGCGCACCACGATCCAGTTGATGTCAGACGCTGGCTGGTCCACTTTTGAGCGCATGACGGCGACCGGG
+CAATGCGCCTTTTCGGCCAGCTCGGTTGCCGTCGAACCCAAGATCGAGCTGGCGTAGCGCCCGATTCCCA
+CGGAGCCGACGCAGATCATCTCGGCGTCGCGCGATGCCTCCACAAGCACCGGGCCGGCTGGCCCGCGGGG
+GATGTCGGTTTCGATCTTGACGAGCTTGCCCGCGGCCTCAACAGCGGACTGCGCTTCCCGAAGCGATCTT
+TCAGCATGCGCAAGGTCGCGGTCGTAGTCGTCCGGGGACGGATGTGTCGGCTTGATCACTGAGACCAGTC
+GCAGCGGCACCGCTCGGCTGATGGCCTCGTCAACCCCCCACAATGCGGCCGTAATCGCCGCGTGCGAACC
+ATCGATACCAACAATGATTGTTTTCATCGTCGGCTCTCCTCTCCCAGACATTTCCCGATGCTCGATCACC
+CCGCATCGGAAAACCTGTCCGCATCTTGGGGACTCGTGGTAAAGGTCGGTTCCGGCTGGGCCAACCGGTA
+GACGTCAATCAGCCGCGCGACATCGCTGGGAGTGACGATGCCGACCACCGCGCTCCCTTCGGTGACCAGC
+GCACGGCTGCGCGGGCCGAGCGGTGCCATCCGCTCTAGGAGCGCGGTCAGCGGCTCTTGTGGTCGGGCGG
+TCGGCACGCTGTGCAGCGGCAGCGCAATGTCACCTACGCTGGTAGTGCTGCGCCGGCTAGGCGCAACATC
+GCGCAGCTGCCGCAATGCCACCAGGCCCGTGATCGATCCGTCCCGATCGGCAACCGGATATGCCGAGTGC
+CGTTCACCAAGCACGTAACGCTGGATGAAATCCTCGACATTGATCCATCCGGGAGCCGTATGCGGTTGGG
+CGGTCATCGCATCGGCCACACGCACCCCGGCAAACAGCTGCTGGGTCGAAATCCGGGTCTCCTCCTCGCG
+AGCGGCAGCGAAGATAAACCAGCCAATGAAGGCTAACCAGACCCCACCGACGAGGCCACCAGCCACAAAC
+TCGGCCAATCCCAACGCGATCAAGACCAGCGCAACCACCCGTCCGGCCCGCGCCGCACCGATCCCGGCGC
+GCACACTATCGCCGTGGCGGCGCCACAGATAGGCCCGGACCAACCGCCCACCGTCCAACGGCGCGCCAGG
+CAGCAGATTGAACAGCCCCAGCAGCAGGTTGACAGTAGCCAACCACCAAGCAACGCTGATCACGATGGCC
+GGGGTCCGCACGCCGGCGAGCGTGATGGCCAACGCACCGAATGTCGCCGACAGCGCCAGGCTGGTAGCCG
+GACCCGCGAACGCGATCCGGAAAGCGGCTTTGGGCGTCTTTGCCTCGCCGCCAAGCGCGGTCACCCCGCC
+GAACAGCCACAACGTCACGCTCTCAACGGATACCCCGGCGCGACGAGCGACGACGGCGTGCGCGAGCTCA
+TGAGCCAACAGCGACGCCAGCAACATGACCGCGCCACCTGCGCCGAGAAGCCAATAGACCACGGCCGGGT
+AGCCTCCGACGGTACCCGGCAACATGGTCGCCAGACTCCAGGTGAACAACCACAGGATCACCAACACGCT
+CCAGTGGACGTTCACCACAAACCCGGCGATCCGCCCAAGCGGGATCGCATCACGCATTGGGTACCTCCGA
+TGCTGGCGGATAAAGCCTTTCGTGCCGGCGGATGATCCGAGGTCGCTAGCTGGCGAGGGCCATGGGCGAG
+CAGATTGCCTTGACGAACTGCACAATGGCGTGCTCGGGCAGGTGTCGGGCGATGTCGGCTTCGGTGACGA
+TTCCGACCAAGCGGTGCTCTGAGATGACCGGAACACGGCGGACCTGATGTTCTTCCATGACGTTGAGCAT
+CTCCTGGATGCTTGCGTTCGCATCGACGTAGTAGATGCTGTCCCGGGCCAACTCGCCAGCCGTGGCGGTA
+TTCGGGTCTAGGCCCGCAGCCAGGCCTTTGATCACAATGTCGCGGTCGGTGAGCATGCCGTGCAGCCGGT
+CGTCGTCCCCGCAGATCGGCAACGCGCCGATGTCATGCTCACGCATGTATTGAGCGGCAGCGGTTAGCGT
+CTCGTGTTCGCCAACACAGGTCACACCTGCGTTCATGATGTCGCGTGCGGTGGTCATCGGGATCCTCCTC
+GAGTCGGGGTGCTATTGCTGATCTGCTGCCGAAGGTACGACCACGTCGTAGCGAACACTAGGGTCGTTTG
+ACCCGTGGGCCGCGGGTCGATGGACCCGTACTGGCGCGCGTTGAGGCAGCTGGCTTGCCTGGCTTGTCCT
+CGCCGTAGGCCACCTCAAAGTCGAAGGTTGTCAATTGATTTCACCAGCCGGATATAGCGCTATGGGCGGC
+CGCAGGACCGATAGTGATGCCGATCGGCCCCGATCGGGGTAACCGGCAATGGAACAACTGACAACCATGA
+AGGCTCGTTTCGACGGAAGCTGAAGACGCCGACAGGCACATGAGCCTCGCGACGGGGCCAATCCGTTGGC
+TTTGCGACCGTGGTCGTAGGTCCTGGCGGAGCCGGGTTGCCACATCCGTCACAAGCTGACACGCCGAACG
+TGCAACCAGGGCGGCATCGCCTGGGTGTGTCTCCGCCACCAGTGCACATTCGGCGCAGCCAGCCCACGCT
+CGGCGCGGAGTTAGGCGGAACGGTCGCGCTGTGTCCGTGGCGCGTCCAACAGGCCCGACTGCTCCAGCGC
+AGCCTGGACAAACCGTCGTACCGGCCGCGACTGGAAGAAGCCAGTGTGACCGCCTGGATACCACACGATT
+TCGGGTTTGCCCCAGTGCTCCCAGAGGCGAGTCACCTGTTCGCGTGGATGCACGAGTCGGTCGGCAATGC
+CCGCGTAGATAAAGCGGCCCGGCATGGGCACCAGTGGCGTAAGTGAGAGCGGCGAGATCATTCGGCCGAT
+CGGTTCGGCCATCTTGACGGTGTGGCGGCGGGGGTCTTTGTGCCGAAGACCGCAGTGGCGGCCCAACAAC
+TCGATCAGATCAGCCACTGGGACACCGAGAATCGCGCAGGCGAGACCTTCTTCGAGGCTGGCGACCAATG
+ACGCGATGTAGCCGCCCAGCGAGAGACCGTTCAACCCGATCAGCGACTCCTCCTCCTGCGATCGTATCCA
+GGACAACAGCCGCCGGATATCCCACACCGCTTGAGCCGTCCCATGCACATCGTCGAGAACATCTTCTCCG
+GGAAAAACGGCGCCCTTCGGCAGACCTTGCCCGCGGGGACCATGCATCGGAAGAACCGGCATGACAATGT
+TCAGGCCGAGTTCGTCATGCAGCTTCCAGGCGCGGAACACCGCGAGATCCAACGGGGCCCTGCCCATCTC
+GGTGCCGTGTACACAAACCAGCCAGGGACGCGGCTCTGGGTGCCGCAGTAACAGGGCGTACTCGCGATTG
+TTCGCAGTGTATGAGAGCCACCGTTGGCTGCCCGGTTCACCCGGATGCGGCGTAAACCCACTGTCGAAGA
+AGATGCGATAAAAGGAGCGTCTGCGGTCCTTGACCTTTCGGACCGCGACCTCGGTGAGCGGTGGGGGCTG
+GGCAAAAAATCCGCTAGGCTTCTCCAGCCATCCGCGATTCCCATAGAACTCCAGTCCAGCGGCCACTTCT
+TGGCTGATGCGCTCGAACACTCGATGATTGCTGACCGGACGTCGTGCCTTGAGGCCCAGCAGGACGATTT
+CGTCTCGAAAGGCTTGCGCCGCTAAGGCAATAGTGGGCCGTGCGATCGGCAGTTTATCGGGCTGTTGACC
+CAGATAGTCGCGCCACGATTGAGCGACGTACAGACCGGTGTGCATGAACGGTCCCATGGCGCCGCTCAAG
+ACCGGTGGACTCAGGCGAAAAGCCGAGCGTTCGTGGGTGCCGTCGCTCGCAGAACTTGCCATGGCAGCAA
+AGCTAACCGCGTGCGGAACGACGCGTTAGGGACTTACGTCCCGCCGGAAGTCACCTGTGTGGTGGTGGCC
+ACTGTCGAGACCGGCGGCCCGTTGTGGTGGCCCAAGTGCCCTAAGGTGATCAGGTGCCGCAGCCCGGCCA
+GCACGCCGTCAGAGTTTCACGGGGCTTGGTCGCGGCCGATGGCGTCCTCATCGTGGGGTCGATGACCGAG
+GTGGACGCGGCGCGACCGGGCACATCGACGGTCCCCGGGGCTTTGTGGGCCAGTGAAGTGACGAAAGACC
+CCAGTGGACACGGACTTCGGCATGTCCACGCAACGACCGAGGCACTCCGGTATTCGGGCTGTTGGCCCCT
+ACGCATGGGCCGGCCGATGTGGTCGGATAGGCAGGTGGGGGGTGCACCAGGAGGCGATGATGAATCTAGC
+GATATGGCACCCGCGCAAGGTGCAATCCGCCACCATCTATCAGGTGACCGATCGCTTGCACGACGGGCGC
+ACAGCACGGGTGCGTGGTGACGAGATCACTAGCACCGTGTCCGGTTGGTTGTCGGAGTTGGGCACCCAAA
+GCCCGTTGGCCGATGAGCTTGCGCGTGCGGTGCGGATCGGCGACTGGCCCGCTGCGTACGCAATCGGTGA
+GCACCTGTCCGTTGAGATTGCCGTTGCGGTCTAAGCACCACCTAACGGTGTCGTCCCGAAGGGACGATTG
+CCGATCCGGTGGATGACTTTGGTCCCTATGCCTTCCCGCTGGACCGCACAACGATCGAAGGTGCCACGAC
+GCATAGAAGACATGGCCATGCCACACCCTGATAGCATTGCAGCAAGCTACATGTACTGCTCTACCAGGAT
+CCTTATGGGCAACAGTGGGTTTGAGTTATGAAACCCGTGGGCACATACCCTTCCGCGTCGTACTGGTCAG
+TCTCGACAGCGAAGAGATCACCGGTTGATCCACCAAGCATGCATTGGCGGGCATCTGCATAAACGGTGAC
+GTATCAGCACAAAACAGCGGAGAGAACAACATGCGATCAGAACGTCTCCGGTGGCTGGTAGCCGCAGAAG
+GTCCGTTCGCCTCGGTGTATTTCGACGACTCGCACGACACTCTTGATGCCGTCGAGCGCCGGGAAGCGAC
+GTGGCGCGATGTCCGGAAGCATCTCGAAAGCCGCGACGCGAAGCAGGAGCTCATCGACAGCCTCGAAGAG
+GCGGTGCGGGATTCTCGACCGGCCGTCGGCCAGCGTGGCCGCGCGCTGATCGCGACCGGCGAGCAAGTAC
+TGGTCAACGAGCATCTGATCGGCCCACCACCGGCTACGGTGATTCGGCTGTCGGATTATCCGTACGTCGT
+GCCATTGATAGACCTTGAGATGCGGCGACCGACGTATGTATTTGCCGCGGTTGATCACACCGGCGCCGAC
+GTCAAGCTGTATCAGGGGGCCACCATCAGTTCCACGAAAATCGATGGGGTCGGCTACCCGGTGCACAAGC
+CGGTCACCGCCGGCTGGAACGGCTACGGCGACTTCCAGCACACCACCGAAGAAGCCATCCGAATGAACTG
+CCGCGCGGTCGCCGACCATCTCACCCGACTGGTAGACGCTGCCGACCCCGAGGTGGTGTTCGTGTCCGGC
+GAGGTGCGGTCACGCACAGACCTGCTTTCCACATTGCCGCAGCGGGTGGCGGTCCGGGTGTCGCAGCTGC
+ATGCCGGACCGCGCAAAAGCGCCTTAGACGAGGAAGAGATCTGGGACCTGACATCCGCGGAGTTCACCCG
+GCGGCGGTACGCCGAAATCACCAATGTCGCACAACAATTTGAGGCGGAGATCGGACGCGGATCGGGGCTG
+GCGGCCCAAGGGTTGGCGGAGGTGTGTGCGGCTCTGCGTGACGGCGACGTCGACACGCTGATCGTCGGAG
+AGCTAGGCGAGGCCACCGTGGTCACCGGTAAAGCGCGTACTACGGTCGCGCGGGATGCCGACATGTTGTC
+CGAACTCGGCGAACCGGTAGATCGCGTGGCAAGGGCCGATGAGGCGTTGCCATTCGCCGCGATCGCGGTA
+GGTGCCGCATTGGTCCGTGACGACAACCGGATCGCGCCACTAGATGGGGTGGGCGCATTGCTGCGTTATG
+CCGCCACCAACCGACTCGGCAGCCATAGATCCTAGGATGCTGCACCGCGACGATCACATCAATCCGCCGC
+GGCCCCGCGGGTTGGATGTTCCTTGCGCCCGCCTACGAGCGACAAATCCCCTGCGCGCCTTGGCGCGTTG
+CGTTCAGGCGGGCAAGCCGGGCACCAGTTCAGGGCATCGGTCCGTGCCGCATACGGCGGACTTGCGAATC
+GAAGCCTGGGCACCGACCCGTGACGGCTGTATCCGGCAGGCGGTGCTGGGTACCGTCGAGAGCTTCCTCG
+ACCTGGAATCCGCGCACGCGGTCCATACCCGGCTGCGCCGGCTGACCGCGGATCGCGACGACGATCTACT
+GGTCGCGGTGCTCGAGGAGGTCATTTATTTGCTGGACACCGTCGGTGAAACGCCTGTCGATCTCAGGCTG
+CGCGACGTTGACGGGGGTGTCGACGTCACATTCGCAACGACCGATGCGAGTACGCTAGTTCAGGTGGGTG
+CCGTGCCGAAGGCGGTGTCACTCAACGAACTTCGGTTCTCGCAGGGTCGCCACGGCTGGCGATGTGCGGT
+AACGCTCGATGTGTGAATTGAGACCTGATTCATGAAAATCGTCGAGGAGACCCCATACCGGTTCCGGATC
+GAACAAGAGGGCGCGATGCGGGTGCCCGGGATCGTGTTCGCGTCCAGGTCGTTGCTGCCTCGTGACGAAG
+GCGACATGGCCCTGATGCAAGTGGTCAACGTGGCTACGCTGCCGGGGATTGTCCGGGCCTCGTATGCGAT
+GCCCGATGTGCACTGGGGATATGGTTTCCCAATCGGCGGCGTGGCCGCAACCGACGTCGACAATGATGGA
+GTCGTTTCCCCAGGCGGTGTCGGCTTCGATATTTCGTGCGGCGTAAGACTCTTGGTCGGCGAAGGGCTGG
+ACCGCGAGGAGCTGCAACCACGGTTGCCGGCGGTCATGGACCGGCTTGATCGCGCGATACCGCGCGGAGT
+GGGCACGGCGGGTGTGTGGCGACTACCCGACCGGAACACGCTGCAGGAGGTGCTCACCGGTGGTGCCCGG
+TTTGCGGTGGAACAGGGGCATGGCGTCGCGCTAGACCTCGAGCGGTGCGAAGACGGCGGTGTGATGACAG
+GAGCGGACGCGGCCAAAATCAGTGACCGGGCCCTCCAACGCGGGCTTGGGCAGATCGGCAGCCTTGGCTC
+GGGCAACCACTTCCTGGAAGTCCAGGCCGTGGACCGCGTCTACGATCCGGTTGCGGCCGCGCCGATGGGT
+CTGGCGGAAGGGACCGTCTGCGTGATGATCCACACCGGCTCACGGGGCCTGGGCCATCAGATCTGCACGG
+ATCACGTCCGCCAGATGGAACAAGCCATGGGCCGATACGGAATCGCGGTGCCCGATCGCCAATTGGCTTG
+TGTGCCGGTGCACTCCCCCGATGGGCAGGCCTATCTCGCCGCGATGGCGGCGGCGGCCAACTACGGACGC
+GCCAACCGCCAACTGCTGACCGAGGCGACGCGTCGTGTGTTCGCTGATGCAACCGGAACACCTCTGGACC
+TGCTCTACGACGTGTCGCACAACCTGGCCAAGATCGAGACGCATCCGATCGACGGTCAGCTGCGCTCGGT
+GTGCGTGCACCGCAAGGGCGCCACCCGCTCGCTGCCGCCGCACCATCACGAGCTGCCGGCCGAACTGGCA
+GCGGTCGGCCAACCCGTGCTGATACCCGGGACGATGGGTACGGCGTCATATGTGCTTGCCGGGGTCACCG
+GCAACCCGGCGTTCTTTTCCACCGCGCATGGTGCTGGGCGGGTACTGAGCCGTCACCAGGCCGCCCGCCA
+CACCAGCGGTGAAGCGATACGCGCCAGCCTCGCAAAACGTGGCATCATCGTCCGCGGTACCTCTCGTAGG
+GGTATCGCCGAGGAAAAGCCGGAGGCCTACAAAGACGTCGACGAGGTCATCGAAGCCAGCCATCAGAGTG
+GCCTCGCGCGCAAAGTGGCTCGCCTTGTTCCCTTGGGCTGTGTCAAAGGATGAATCAACGGCGAACATTC
+CAGCCGTCGCGACCGCCTTCTTCAGTGGTGCAGACCCGTGACCGGCTGATGGGTACTGGCTTCGATATCC
+GACGACGTCAAAGCGAATAGCTGATTCGCCAAATCCGACAAGGCCCGGGCGATCGCAAGTTCGTCGCCGA
+TCTGGGCCACCGGCTCATCGGCCGGATCGAGTCGCGCCAAACCAACACCCACCATCTGCCTGCCTGCCCA
+GGACAGCCGCGCCTTCGCCCGGGTGCGCTCGTCGTGTTCCTCAATCAGCACATCAATTTGGCAGGTTTTT
+CCAACGTGCTCGCTGTCTGTCATCGCGGCCTCCCTGTCGGATTTGCGCTTACGCCCGCCGATCTGCCCCG
+CTAGCTGAACGCGGTATCTATCCAATCACCACAATCGGTCGTGGAGTAGGCCAGAATTCTTTTCGCCCGA
+CCCGGGCCCGCCTAGCGCTGACAACCGCTAGATGGCCTTCAGGAGGTCTGCTTTGCCCTTGGTACGGAGT
+GTGTACAGAGGTGAGCCGCGCAACTGCTCAATGCGAGCCGCCATCTTGTCACCGAGCTCCTCGAGCTCGG
+CATCGGTGATGTGCACCGGTGTAGGAGCGGGGATCATGTCGCGTTCCTCTACGTCGGCGTGCGCCTCCAA
+CACGGTCCGGAACACGTTCCACTCTTCTTCATACCCGGGCGCGCGCTGCGGAGTGCGCAGCAGCGTCGCG
+AGCTGATCAACCACCTGACGGTGCTCGGCGTGGGTACCCGTGATTGGTTTGCCGGCCGCGGAAAGGGCAG
+GGTAGTACAGGTCATCCTCGATGCGGAAGTGAATGTCCAGCTCGATGAGCATCTCGTCGAAAAGGACATG
+GCGCTCTTCGCTATTCACCGGCGCCTCGCCGACTTTGCGGCCCAGTCCTTTAAGCACGGTGTGGTGGCGC
+TTTAATACGTCGTAGGCATTCACTTCGTTGCTCTATTCCGTATTCGGGATCAACGAGACAACCGTAACCT
+CGCGCCGCGGCCCATTAATGTGAGGTAGCTGTGAATCAGCACAAAGAAGCCTGTGCAGTAGCGCGACGCT
+CGGCGTACCGGCACGAGTCCGACGGCCCGCATGTCCATGCGGCCGCCGGCACCAGCGCCGAGGCCCCCGC
+AGGATACCGGGATCTGCAGCTCCTCGTGCGGAAACAGTTGCCGCAGTTCGGGTTCGGGCAGTTCGGCGAG
+CGTGATGTTCGCGCCTAACGGCAACAACTATCCGTCGGCGCCCTGGGTGCCGGGCGGGCCCATATTGCCC
+TGGATGCCGGAGCTGCCACCCGGTGACCCACCCGCGCCGCCGGCGCCCCCGTTGCCGCCCAGCGCGAAAT
+CGCCGCCCTGACCGCCGGTCGCGCCGGTCCCGCCGTTGCCGCCGTTGCCGCCCTGGCCGCCGAGGCCACC
+TTGCCCACCCGTGCCGCCTGCGCCGGTGCCGCCGGCAGCTCCTGCCCACCCGATCAGCCCGCCGGCTCCG
+CCGCTGCCGCCGGTGGTCCCGCCGGCGCCGCCGGTACCGCCAGTGCCACCAGCGCCCCCCACGCCGCCTG
+TACCGCCGCCACCGCCAATTGTCGCTCCCCCGCCGGTGGTGGTACCCGCGCCGCCGGCGCCACCGTTGCC
+GCCGGCACCACCGATGCCGCCGATGCCACCGGTGCCGCCGACACCGCCGGCACCCCCGCCACCACCAAGC
+CCGATGAGCGACCCAGCCGCCCCGCCGTTGCCGCCGACACCGCCGCTGCCACCCATACCGCCGGTACCGC
+CGACACCGCCGAGGCCCCCCAGACCGCCGGTGCCGCCTTCCGCGGTACCCGCACCGTCGGTGAGACCCTC
+TCCGCCCGCGCCGCCGACACCGCCCGCGAAGCCGGCGGCGCCACCACCACCGGTGCCGCCCGTCCCGCCG
+GCCCCACCGGCGCCGCCGTTGCCGATTAACATCCCGCCACGTCCACCGTTTCCACCGGCACCACCGGTGC
+CGCCGTTACCGCCCGCCGCGCCTAGTGCCCCGTTACCGTCACCGCCGATTCCGCCGTCACCGCCGAAAGC
+GTCACCTACACCCGTGTTGTGCCCCTGCCCCCCCTTGCCGCCAGCACCACCCACGCCACCGTCGACCCCT
+CCGGTGGCACCGTCACCCCCCTCACCCCCGGTAGCCACGCCGCCGGCGCTGCCGTCGGTCTCACCTATGC
+CGCCAGCGCCGCCAGCGCCGCCGGCACCGCCATCGGTACCGGCAGTACCCCCGGCTCCACCCTTACCGCC
+GGTGCCGTCGTTGCCGTCGAGCGACTCCCCCAGCCCGCCCTGCCCGCCGACGCCGCCAGCCTCGCCGACG
+CCACCGGCGGGGCCGGGACCCCCGTTCCCGCCAGTTTGATTCCCGTTGCCGCTGTTGTCGGTACCGTTCG
+CACCGGTGTTGGGGTTCGCAATCGAGCCGGGGTTGACCCCGTTTGTCCCGGCCAGACCGGTGCCACCCTG
+CCCGCCGGCACCACCGGACCCGAACCAGTTGGCATTACCGCCGTTGCCGCCCGCGCCGGGCATCCCGCCC
+AGGACACCCGCCACGGCCGGCCCACCCTGTCCGCCGGCACCGCCATCGCCCAACAACATCCCGCCGGCAC
+CGCCATTACCACCGGCCGCCCCGGCCCCACCCAGACCCCCAACACCGCCATTGCCGATCAATAGCGGACC
+CGCACCGCCGTCACCACCGGGCGCACCGTCCCCACCAACGCCGCCACCGCCCCCGGTGCCGAAGTAGCTG
+GCCGCCCCTCCGACGCCGCCGGCGGCGCCAAGGCCACCGGCCCCGCCGAATCCACCATTGCCGAACACGC
+CGCCAACGCCACCGCTCCCGCCCACGCCGCCGGTGGTGCCCACCCCCGCCGCGGCCCCGCCAGCACCGCC
+GAAGCCCCCGCTGCCGATCAACCCCGTCGCCCCACCGACACCGCCAGTACCGCCGACCAAAGTGGCCCCT
+GCAGCCCCACCAGCCCCACCGGTCCCGCCATTACCCAGCAACCATCCACCGCGACCACCGACACCCCCGG
+CAGCACCGGACCCGACCAGCCCGTCCCCACCTTTACCGCCAGTCCCGCCGTTACCGATCAACCCCGCATC
+CCCGCCAGCACCACCTGGCTGACCCGGCGCACCCGATCCGCCATTCCCGCCGTTGCCAAGCAACAGCCCG
+CCCGGCCCACCGGGAGCCCCCGTCCCGTCGGCCCCGTTAGCGCCATTGCCGATCAACGGGCGCCCCAACA
+ACGCCTGGGCGGGGGCATTTACCACGCCCAACAAATCCTGCAACGGCGCAGCACTGGTGGCCTCGGCAAC
+TACGTATGAGCGCGCGCCGTTCGTAAGGGACTGCACGAACTGGGCGTGAAACGCCGACAGCTGCGCACCA
+AAAGCCTGATAGCTCTGCGCGTACGACCCGAACAAGGCCGCAACTGCCGCCGAAACCTCATCCGCGGCAG
+CCGCCACCACCCCCGTGGTCGGCAATGCCGCCGCCGCATTCGCCGCGTTGATCGTCGACCCAATGTTGGC
+CAGATCCGAAGCCGCCATCGTCAATGCTTCCGGCACCGCAATCACAAATGACATCTGCGACCTCCTGGAC
+CGGACAACCCGCATGGTCGCCGCGGATCATCGAGCACTCGGCAGCAACAAATCCTATCCCGCCTCGCAGA
+CGGCGGAGGCCATTTGGCCGCCGGCGCGTACTCTTCGCTACGACCGCCAGAGCCCTTGGTTAGCGACCGG
+ATTCGACCGCCGCATGAGCCAAACTGTTACCGGTGTGGGTGTGCAGAACTGCGCAGTTAGCAAACGCCGA
+TGCAGCGCGGTGGACCACAGCAGCCGCACACCGTACCGGCGCTGAGTGATAAACCCGACCCGGGCCCGGC
+GGATGCGATATCGTCTTGCGGCTATGGCGGGTATGCCAGAGGGCAAACTCATCCTCCTCAACGGCGGATC
+CAGCGCGGGAAAGACGTCGCTCGCCTTGGCGTTTCAGGATCTTGCCGCCGAGTGTTGGATGCACATTGGG
+ATAGATCTGTTCTGGTTTGCGCTGCCGCCAGAGCAGCTTGACCTTGCGCGGGTGCGGCCCGAGTACTACA
+CATGGGACAGCGCGGTCGAGGCCGACGGGCTGGAGTGGTTCACCGTGCACCCGGGCCCCATCTTGGACCT
+GGCCATGCATTCCCGCTACCGCGCCATCAGGGCATACCTGGACAACGGAATGAACGTCATCGCCGACGAC
+GTGATCTGGACACGTGAGTGGCTGGTAGACGCTCTGCGGGTTTTTGAGGGCTGCCGAGTCTGGATGGTCG
+GGGTCCACGTATCCGACGAGGAGGGTGCCCGCCGGGAATTAGAACGCGGCGATCGCCACCCCGGGTGGAA
+CCGAGGCAGTGCGCGCGCTGCCCACGCCGACGCCGAGTACGACTTCGAGCTGGATACCACCGCGACCCCG
+GTCCACGAGCTGGCCAGGGAGCTGCATGAGAGCTATCAAGCCTGCCCGTACCCCATGGCTTTCAACCGGT
+TACGCAAACGCTTCCTATCTTGAAATGGAGCCAAAAGTCGTGCGCAACTGGAACTTTCACTCCTGGCAAA
+CGCTGGGGCGACCCGTCACCGCGCGCTTGGGTTCGGGTCGAATCGTCGGCCGCGCGGGTCGTGCGGAACA
+TTGCACCCGACGCGGCGGAATCGGAGTTGAGAAGTACATGGCGGGACGCACCCGGCACCGGTCAGGCATT
+CTTTACCCATGGATGTGGAGGCCCTGCTGCAGTCGATCCCGCCGCTCATGGTCTACCTGGTGGTCGGCGC
+GGTGGTAGGGATCGAGAGCCTGGGCATCCCCCTTCCCGGCGAGATCGTGCTGGTCAGTGCCGCGGTGTTG
+TCGTCGCACCCCGAGCTGGCCGTCAACCCGATCGGCGTCGGCGGCGCTGCGGTGATCGGCGCCGTGGTCG
+GCGATTCGATCGGCTACTCGATCGGCCGCCGCTTCGGCTTACCGCTATTCGACCGGCTGGGCCGGAGGTT
+CCCAAAACACTTCGGCCCCGGTCATGTCGCGCTTGCTGAACGGTTGTTCAACCGATGGGGAGTCCGAGCC
+GTGTTCCTCGGTCGCTTCATCGCGCTGCTGCGGATATTCGCCGGACCGCTCGCTGGCGCCCTGAAGATGC
+CCTACCCGCGCTTCCTGGCCGCCAACGTCACAGGCGGCATCTGCTGGGCCGGCGGCACCACTGCACTGGT
+CTACTTCGCCGGGATGGCCGCCCAGCACTGGTTGGAACGGTTCTCCTGGATCGCGCTGGTCATCGCGGTC
+ATCGCCGGCATTACGGCCGCGATCTTGCTGCGCGAACGCACTTCGCGCGCGATCGCCGAACTCGAGGCCG
+AGCACTGCCGCAAAGCCGGTACCACCGCGGCGTGACCGACCGGCTTGAATCCGGTACCCACGCTCACAGG
+AGCTGCAATCTAGACAGATCTCCAGTCATGTCATAAAAATGAGATCTGAAATTACTTGACAAGCTTGTCT
+TCGGACAGTGCGGGGCATCCGCCGCGGTGGCTGTACGCCGTCGATTAGGAGCGCACCATGGGCCTGATCA
+CTACAGAACCACGCTCTAGTCCCCACCCGCTCAGCCCACGGCTCGTCCACGAGCTAGGCGACCCACACAG
+CACGCTGCGGGCAACCACTGACGGCAGCGGGGCAGCGTTGTTGATCCACGCGGGCGGCGAGATCGATGGC
+CGCAACGAGCATCTCTGGCGTCAATTGGTCACCGAGGCCGCCGCCGGCGTCACGGCGCCCGGACCGCTCA
+TCGTCGACGTCACCGGGCTCGATTTCATGGGCTGCTGCGCTTTCGCCGCACTGGCCGACGAGGCACAACG
+ATGTCGGTGCCGCGGCATCGACCTGCGTCTGGTGAGCCACCAGCCGATCGTCGCCCGGATCGCCGAAGCG
+GGTGGGCTGAGCCGAGTGCTGCCCATCTACCCGACCGTCGATACTGCGCTCGGCAAGGGCACGGCCGGTC
+CAGCCCGTTGCTGATCCCGGCCGTAAGAGCACCGAGCCGACCGCCGGTGGCCCCACCGCTAGGGCCGATC
+GCACCGCCGCGCGACGATGTTCGCGTCAGGCGCGCATGCGGTATCGCTTGCCTTGCAAGGTAATCCACTT
+CGGACATCCACGATGCAGGTCGCGATCAAGTCGGGCGCGCCGCAGCAGTCAGTGGCCGCGAGGGGCGTAC
+ATGATCACGGCTACCCCGGCCATGCAGCCAAGGGCACCGATGACATCCCACCGGTCGGGCCGGAACCCGT
+CCAGGGCCATGCCCCAGGCGAGCGAACCGGCGACAAACACACCACCGTAGGCGGCCAAGACCCGACCGAA
+ATGGGCGTCCGGCTGCAATGTGGCGAAGAACCCATAGACCCCAAGCGCAATAACTCCGAGTCCCGCCCAA
+AGCCAACCCCGTTGCTCGCGGACGCCCTGCCATACCAGCCACGCGCCACCGATCTCCGCAACCGCCGCCA
+GGACGAATAGCAGGATTGACCGCACCACCATGGTTGCGAGCCTACGAGATCCGCTGCCCTGCCGCCCCCC
+AACCAATCGCGCACCCCAAATGCTTCCCGTCACCCGCGCTCAGCCAGACACCGGTGTTGGCTACAACTAT
+GGTTCCCGGATCAGGCGCAGCAGTTCGGGTTGAGCACGGTACACAGCGCTTGCAGGGCTTCAGGATGTAC
+CCGATGGAAGACGTGCATGCCCCGGCGATCGGAAATGACCAGGCCGGCCTTGCGCAGCTGGGCCAAGTGG
+TGGCTGACGGTGCCATCGCTGAGGCTGAGCGCCGCCGCTAGTTGGCCGCTGACCTGCTCGCCGGCCGGCG
+AGCTGAACAGGTAGGACATGATCTTGACTCGTGCCGGGTCGGCCAGGGCCTTCAGCCGCAGCGCCACCGC
+CAAGGCGTCGCCGTCGCTCATCGGCCCCGCCGCCACCGGGGCGCAGCACACGGGAGCGGAGATGTCAATC
+ACCGGCAGCGACTTGGGCATAGGCCCACCCTGCCAGATACCTTGACATATATCAAAGAGATGTTGCACAC
+TGGGTTCGGCGCCATTTTGATATAAGTCAAACAACTGGGAGGTGTCTACCAATGTCCCGCGTTCAGCTAG
+CCCTCAACGTCGACGACCTGGAGGCCGCAATCACGTTCTACTCCAGGCTGTTCAACGCCGAGCCCGCCAA
+ACGCAAGCCCGGATACGCCAACTTCGCGATCGCCGATCCGCCGCTTAAGTTGGTGCTGCTGGAGAACCCC
+GGCACCGGCGGTACCCTCAACCATCTCGGTGTGGAAGTCGGCTCGAGCAACACCGTGCATGCCGAAATCG
+CCCGGTTGACCGAAGCCGGACTGGTCACCGAGAAGGAGATCGGCACCACGTGTTGCTTTGCCACCCAGGA
+CAAGGTGTGGGTGACCGGCCCGGGTGGGGAACGCTGGGAGGTTTATACCGTGCTGGCCGACTCCGAGACC
+TTCGGCAGCGGTCCTCGGCACAACGACACCAGCGACGGCGAAGCAAGCATGTGCTGCGACGGCCAAGTCG
+CCGTTGGCGCAAGCGGCTAACTGTAGGCCTGACCCCGGGGTGCGTCTCCAAGCCGCGGAGCCCACCCCGG
+GCCACTCAATGCCCCCTAACCCGCGTAGCGCCGTTCACCGCGTGGCCGCTTGCGGACCTGATTCGATATT
+TGTCAATATTGATGTATGTCGAATCTGCATCCGTTACCAGAGGTGGCGAGCTGCGTAGTCGCGCCGCTGG
+TGCGCGAACCGCTGAATCCTCCGGCCGCGGCCGAAATGGCGGCCCGGTTCAAAGCCCTGGCCGATCCGGT
+GCGATTGCAGCTGCTGAGCTCGGTTGCCAGTCGCGCCGGCGGCGAGGCCTGCGTCTGCGACATTTCCGCG
+GGAGTCGAGGTGAGCCAGCCCACGATTTCGCATCATCTCAAGGTGCTGCGCGACGCGGGTTTGCTGACCT
+CGCGGCGTCGGGCCTCGTGGGTGTACTACGCCGTGGTCCCCGAGGCGCTGACCGTGTTGTCGAACCTGCT
+CAGCGTGCATGCCGATGCCGCACCCGCCCTGGGGGCACCGGCATGACGGAGACGGTCACCCGCACCGCCG
+CCCCGGCGGTGGTGGGCAAACTCTCGACGCTGGACCGCTTCTTGCCGGTGTGGATCGGGTCGGCAATGGC
+CGCCGGGCTACTACTGGGCCGGTGGATTCCCGGCCTGCACACCGCCCTAGAAGGGGTTCAGCTCGACGGG
+ATTTCGCTGCCGATCGCGCTAGGCCTGCTGATCATGATGTATCCGGTGCTGGCCAAGGTGCGCTACGACC
+GCCTCGACACCGTCACCGGTGACCGCAAGCTGCTACTCAGCTCGCTGCTGCTGAACTGGGTACTGGGCCC
+GGCGTTGATGTTCGCGCTGGCTTGGCTGCTACTGGCGGATCTGCCCGAGTACCGCACCGGGCTGATCATC
+GTGGGCCTGGCTCGCTGCATCGCCATGGTGATCATCTGGAACGACCTGGCCTGCGGGGATCGCGAAGCCG
+CCGCCGTGCTCGTCGCGTTGAACTCGATCTTTCAGGTGGCCATGTTCGCCGCGCTCGGCTGGTTCTACCT
+GTCGGTGCTACCGGGTTGGCTGGGCCTCGAGCAGACCACCATCGCCACATCCCCGTGGCAGATCGCCAAG
+TCGGTGCTGATCTTCCTCGGCATCCCGCTGCTGGCCGGCTACCTGTCGCGGCGGATCGGCGAAAAGACCA
+AGGGCCGCAACTGGTATGAATCCCGCTTCCTGCCCAAGGTGGGACCGTGGGCGCTCTACGGTTTGCTGTT
+CACCATCGTGATTCTCTTTGCGCTGCAAGGAGATCAGATCACCGGCCGACCGCTGGACGTCGCACGCATT
+GCGCTGCCGCTGCTGGCCTACTTCGCCATCATGTGGGTAGGCGGCTACCTACTGGGGGCGGCGCTGCGGC
+TAGGGTATCGGCGCACCACCACGCTGGCGTTCACCGCCGCGAGCAACAACTTCGAGCTGGCCATCGCGGT
+GGCCATCGCCACCTACGGCGCCACCTCCGGGCAAGCCCTGGCCGGAGTCGTCGGGCCCCTGATCGAGGTA
+CCCGTCCTGGTGGGGTTGGTCTATGTGTCCCTGGCGCTGCGCAACCGCCTCGCCGGTCCCAACGCGACCC
+ACGATGCCGACAAACCCAGCGTCCTATTCGTCTGTGTGCACAACGCCGGACGTTCCCAGATGGCCGCCGG
+GCTATTGACCCACTTGGCCGGTGACCGCATCGAAGTCCGTTCGGCCGGAACCGAGCCCGCCGGTCAGGTC
+AATCCGACGGCTGTGGCCGCGATGGCCGAAATGGGCATCGATATCACCGCCAATGCCCCCACATTGCTCA
+CCGGCGGGCAGGTCCAGTCCAGCGACGTCGTCATCACGATGGGCTGCGGCGATGCCTGCCCTTACTTCCC
+GGGTGCCTCCTACCGCAACTGGAAACTACCCGATCCCGCCGGCCAGCCCCTCGACGTTGTGCGCATGATC
+CGCGACGACATCGCAGACCGCGTCCAAGCCCTGATCGCCGAGCTGCTGGCCACCGCCAAGACCAGATAGC
+GTGTGCCACGCTCGGTGCTGCGCCGATACGTGAGGTCCCGGCTGGGATCGGATTTTCCGCCTGTACGGCG
+GCTAGGCACCAGCGGATCGCATTTGTACTGGTTAGAGACTTGCCGAGTGGCCGCATTAGCCTGCGTGGAG
+CGCTTGGTCAAAAAGCTCGGCCCTGTTCGGCCCTATGGGTTCCTGTTGATCTGCCCTGTTCGTAGTCTCG
+ACAAAGCGGCTGCCCGAGATCGCGTGCGACGATATCGGGAGCGGCTGCGGCAACGAGGTCTGCGGCCGAT
+ACAGATCTGGGTTCCCGATGTGAACGCACCCGAATTTGTCGGCGAAGCACACCGTCCGTCGGCGCTCGTC
+GCGGCCCGCGAATACGAGGACGACGATCAAGCCTTCGTCGATGCGGTATCGGTCGACTGGGACGACGCCA
+CCTGACGTGCGGCGCGGCGACATCCACACCGCGGCGGCGCGTGGTGCCTACACCGGCAAGCCACGCCGGT
+CGCGGTCATCCAGAATGACCGGTTCGATTCGACGGCCTCGGTTACCGTCGTGCCGTTTACCACGCGTGAT
+GTCCAGGCATCCCTGATGCGAATCCCGGCCCCAGCGTCCAACACCACCGGGCTGACCGAGACCAGTCGCC
+TGACGGTCGACAAGGTGACAACATCCCCCGCACCAGCCTGACGCGGCAGGTTGGTCGGTTATCGGCCAAA
+AACATGGTCAGGCTCGACCGTGCATTGCTGGTTTTCCTGGCCGGCTGACAATTGCGCCACCTGGTCATCA
+GAACTGATCGGGCGGGGAAACGAAACGGGGCTCCCAGCGGAGGTCATGAGTTGGCGCGCCGGTTTCGCCG
+CGATCTCTCCGAACTTGACCGCTAAACCTCGGGGCAGAAGTCATGAACAAGCCCGTTAGGAGGCGTTTGA
+GGCCGTAAATGTTGATGAGGGCGGGGAAAGTGTCGTCATGGCCGTCGCGCTGAATTCACCACGCCCCCAC
+GACGGAGCTCGTGGGCACCCAGCATTCACTGCTTACCACTACGATCTCGCTCACGAGGTTCGAGCAGCCA
+CTGTCGCCTGCCGCCAACGAATAATGCTCCCTGACCTAGTGGTCCCGGCTGGGATCGAACCAGCGACCTT
+CCGCGTGTGAAGCGGACGCTCTCCCACTGAGCCACGGGACCGGCGCCGAGGAGATGAACGAGGTCGAAGA
+TTAGCACGTGCAAGACATCGTCAGCAGCAGTCTACGTGCGCTTCACATAGGGGCTGCGATAGCCTAGAGC
+CGCAACGTACCAAGAGATTTGTGTGGGCCCGCTCACCTCGACTATCGTCGTGCTTCGCACCGGGCGACGA
+TCTCGTTCGTTGCGCGCGGATGTAGCGCAGTTGGTAGCGCATCACCTTGCCAAGGTGAGGGTCGCGGGTT
+CGAATCCCGTCATCCGCTCGAAGGTGCTAGTGGCATCAAATCCCAGCGGTGGAGTGGCCGAGTGGTGAGG
+CAACGGCCTGCAAAGCCGTGCACACGGGTTCGATTCCCGTCTCCACCTCCAGGTTCAACCCCCAGCGCGA
+TTAGCTCAGCGGGAGAGCGCTTCCCTGACACGGAAGAGGTCACTGGTTCAATCCCAGTATCGCGCACCAC
+GATTGACCTGCGGTTTCATCCACAAAATCTGGGCTGCGTGAACTAAATGTGAACTGACTCGGTGCAACCA
+CCGAAAGGTTCCTCTGTTCCGTGCCCACGCCGACACCGACGGTGACCCCACCAGATGCGCCTGCCGCCCG
+CTGGCTAGCCTGGCCTGTTGCTGCAAGCGCCTGGTCGACGCCCGCTATCACGCTGTTGTCGCGTCCACCG
+AACTCACCGAGGCACGCCGCACCCGCGCAACCGAGCTGACGGAGCTGATCACCACCGCGCTCGCCTTCTG
+CGAACGGCTGCAAACGGTCGTTGAGGGTGACCGGCGGGCTGAGGTGACCCGATGAGCGGCGGCTGGCTCG
+CCGAGCACCTCGGCCTGTCCACAAACCGGCTCCGGCACGAACTCGCAGACCGGCTCGACGCGCACTACGG
+GCCACCCGCACAGAACAGGGAGCTCGCGCGGCCGAGCCTGCGGATTATCAACGAGGGCACTGATGGATGA
+CCTGACGCGGCTCCGGCGCGAGCTTCTGGACCGATTCGACGTGCGGGACTTCACAGACTGGCCTCCAGCA
+TCGCTGCGAGCCCTCATCGCGACCTACGACCCCTGGATCGACATGACGGCCAGCCCGCCACAGCCTGTAT
+CGCCCGGAGGGCCTCGACTCCGACTCGTGCGATTAACCACCAACCCATCCGCGAGAGCAGCCCCTATCGG
+AAACGGTGGGGACTCTTCTGTTTGCGCTGGTGAGAAACAGTGCCGCCCACCGTAGCGGCCTGCGCGTGGC
+AATTGACCGACCTGACCCGAGTAGCCGCCAGTGGGCTGTAAGCCATTCTTTACGGCAGCCTGTTGTAAAG
+GTAACGTTTACACGTGGAGGTGAGGGCTAGCGCCCGCAAGCACGGCATCAACGACGACGCCATGCTCCAC
+GCATACCGCAACGCGCTGCGCTACGTCGAACTGGAATACCACGGCGAAGTTCAACTGCTGGTGATCGGCC
+CCGACCAAACCGGGCGCCTTTTAGAGCTGGTCATCCCAGCAGACGAACCACCCCGAATTATCCACGCCAA
+CGTACTACGCCCGAAGTTCTACGACTACCTGAGGTGATGAGATAAGAGTGAAGCACAAGACCGACATTGA
+CGAGTGGCTCGACACGATCGAGCCCAACCCGGCCGACGCCCACGATGCCAGCCACCTGCGGCGCATCATC
+GCCGCGAAAGAAGCGGTCCAAACAGCCGAATCTGAGTTGCGGGCCGCAGTGAATGCTGCCCGCGCCGCCG
+GCGACACCTGGGCAGCCATCGGCGTCGCCCTCGGCATCACCCGCCAGGCCGCGTTCCAACGGTTCGGGCC
+ACACAGCACAGCGAGCCCCTAAACCGGCGCGCCTCCGCGGTGGAGTTGACGACGACCAGACAGGGCCGAA
+GCGGAGTCACAGCGTCTGGCCGACACACGTGGCGTCGTGTTTGCTAGGCATGGGTTTTGTGTTTGCTGTC
+CCCCACAACCCCAGACCCGTACAAATCCCCAGACCCCTACACACAGCGACACGGCGACCCGCCGTCTCCT
+GAGTGTGTTTGCTAAAATTTCGTTTGTTCTGGTCGATCACTTATTGTGTTTGCCGGTTTTGGCGATGGGC
+TTGATTCCTCTGACAGCAACACCAGTTGGCCCCTTCCTGGCCAGGACGTGATAGACCACGCTGGTGGGTC
+ATGCGCACCGGAGCACCCGATGATCGTCGTCCGTACGGCCGAGGCGGCCGAGCAGGCCCTGACTGAGGGC
+CAGCTGGTCTGCCCCCGCCGCGGATGTGGCGACACCTTGCGGCGGTGGCGATATGGACGGCGCCGGCATG
+TGCGCAGCCTCGGCTCGCAGGTGATCGATGTGCGGCCCCAGCGGGTGCGTTGCCGCAGATGCGAAAGCAC
+CCATGTGCTCCTGCCAGCGGCGCTACAGCCACGCCTAGGGCGCGGCGGCGGCGGCCAGTTACGTCCAGGG
+GTGTGGTGTACGGGCAGGTAAGGCCGGTGGGCGTGTCGTAGCCCAGTAGTGGGCGGTCATCGCGTGATCC
+TTCGAAACGACCAGCAAAAGTCAATCGAAGGAAATGACGCAATGACCTCTTCTCATCTTATCGACACCGA
+GCAGCTTCTGGCTGACCAACTCGCACAGGCGAGCCCGGATCTGCTGCGCGGGCTGCTCTCGACGTTCATC
+GCCGCCTTGATGGGGGCTGAAGCCGACGCCCTGTGCGGGGCGGGCTACCGCGAACGCAGCGATGAGCGGT
+CCAATCAGCGCAACGGCTACCGCCACCGTGATTTCGACACCCGTGCCGCAACCATCGACGTCGCGATCCC
+CAAGCTGCGCCAGGGCAGCTATTTCCCGGACTGGCTGCTGCAGCGCCGCAAGCGAGCTGAACGCGCACTG
+ACCAGCGTGGTGGCGACCTGCTACCTGCTGGGAGTATCCACTCGCCGGATGGAGCGCCTGGTCGAAACAC
+TTGGTGTGACAAAGCTTTCCAAGTCGCAAGTGTCGATCATGGCCAAAGAGCTCGACGAAGCCGTAGAGGC
+GTTTCGGACCCGCCCGCTCGATGCCGGCCCGTATACCTTCCTCGCCGCCGACGCCCTGGTGCTCAAGGTG
+CGCGAGGCAGGCCGCGTCGTCGGAGTGCACACCTTGATCGCCACCGGCGTCAACGCCGAGGGCTACCGAG
+AGATCCTGGGCATCCAGGTCACCTCCGCCGAGGACGGGGCCGGCTGGCTGGCGTTCTTCCGCGACCTGGT
+CGCCCGCGGCCTGTCCGGGGTCGCGCTGGTCACCAGCGACGCCCACGCCGGCCTGGTGGCCGCGATCGGC
+GCCACCCTGCCCGCAGCGGCCTGGCAGCGCTGCAGAACCCACTACGCAGCCAATCACGGTCGACACAATG
+CATAACGTCAACCTACTGTTGACGTCATGCCGGAGCCCACACCCACCGCCTACCCCGTCCGCCTCGACGA
+GCTCATCAACGCCATCAAACGGGTGCACAGCGACGTGTTGGACCAACTCAGCGACGCCGTCCTGGCCGCC
+GAGCATCTCGGCGAAATCGCCGATCACTTAATCGGCCACTTCGTCGATCAGGCCCGCCGCTCGGGCGCCT
+CCTGGTCCGATATCGGCAAGAGCATGGGCGTCACCAAACAGGCCGCGCAAAAGCGGTTCGTCCCCCGAGC
+CGAAGCCACCACACTGGATTCAAACCAGGGCTTCAGGCGTTTCACGCCGCGGGCCCGCAACGCCGTGGTC
+GCGGCCCAAAACGCCGCGCACGGAGCCGCCAGCAGCGAGATCACCCCCGATCACCTGTTGTTGGGAGTGC
+TCACTGACCCGGCCGCACTGGCCACGGCGTTGCTTCAGCAGCAGGAGATCGACATCGCAACCCTGCGTAC
+GGCGGTCACGCTCCCCCCGGCAGTCACCGAGCCGCCTCAGCCGATCCCGTTCAGCGGCCCGGCGCGCAAG
+GTCCTCGAGCTCACCTTCCGCGAGGCGCTTCGGCTGGGCCACAACTACATCGGGACCGAACACCTGCTGC
+TGGCACTGCTAGAACTCGAGGACGGGGATGGGCCGTTGCATCGATCCGGCGTCGACAAGAGCCGCGCCGA
+GGCCGACCTGATCACCACGCTCGCATCGCTCACCGGCGCCAACGCTGCCGGCGCAACCGATGCCGGCGCA
+ACCGATGCCGGCTGAGGCGAGCGACCCCTCCCCTTCGCGGCGCCGCGTGTGCAATCATGCGAAGGTCCCC
+CACCGGGAGCCGAGGAGGCACAGATGCGCCGCTGGCTGATCGTCCTCGCTACGCTGCTCGTCGCCGCCGC
+GGGCGTTGCGGCCGCCAACGACGTGCCCCGTGCGTGGGCCGGCGACGCGCCGATCGGCCACATCGGCGAC
+ACGCTGCGTGTGGACACCGGCACCTACGTCGCCGACGTCACCGTCAGCAGCGTCGTACCGGTCGATCCGC
+CGCCGGGATTTGCCTATACCCGCAGCGGCGTCCCGGTCAAAAGCTTCCCCGACAGCTCAGTGACCCGCGC
+CGACGTGACGGTCCGCGCGGTCCGGGTGCCCAACTCCTTCATCTTGGCCACCAATTTCAGCTTCACCGGA
+GTAACGCCGTTTGCCGACGCGTACAAGCCGCGGCCGTGCGACGCATCCGATTGGCTCGACGCCGCGTTGG
+GCAACGCGCCACAGGGCTCGATCGTTCGCGGCGGGGTGTACTGGGACGCCTACCGCGACCCGGTGTCGGT
+TGTCGTGCTGCTGGACAAGAAAACCGGCCAGCACCTCGCACAGTGGAACCTTTGACCTGCGCCTCGAGAT
+CGCCACGGCCGACGTGACCGACGCCGACGAGTTGGCCGCCGTCGCCGCACGCACCTTCCCGCTGGCGTGC
+CCACCAGCGGTCGCCCCGGAGCACATCGCGTCGTTCGTCGACGCCAACCTGTCGTCGGCCCGGTTCGCCG
+AGTATCTGACCGATCCGCGGCGCGCCATCCTCACCGCCCGCCATGACGGCCGAATTGTCGGTTACGCCAT
+GCTCATTCGCGGTGACGACCGGGACGTGGAGCTGTCCAAGCTGTACCTGCTGCCGGGTTATCATGGCACC
+GGAGCCGCTGCGGCATTGATGCACAAGGTGCTGGCTACCGCCGCCGACTGGGGCGCGCTCCGGGTGTGGC
+TGGGTGTCAACCAGAAAAACCAACGCGCACAACGCTTCTACGCGAAGACTGGTTTCAAGATCAACGGCAC
+CAGGACGTTTCGACTGGGAGCCCACCACGAGAATGACTACGTCATGGTTCGCGAGCTTGTATGACCCCCG
+CCGTCAGGGCCAGCAGGCGAGATGTGGCCCGCAGGTACTTCTTTCGGTATCCACCGGCCAGCATTTCCTC
+GCTGAAGATGGTGTCCAGCTTAGCGCCGGACGCCACCACCGGAATGCCGGCGTCATAGAGCCGATCAACG
+AGCGCCACCAACCGCAGCGCAACGTTCTGGTCGTCGATGCCGTGCACGCCGGTCAGAAACACCGCGGTCA
+CACCTTCGATCAGGGTCAGATATCGCGACGGATGCATGGTGGCCAGGTGCGCGCACAGCGCGTCGAAGTC
+GTCAAGGGTCGCCCCCTCAACACGTGCGGCACGCGCGGCCACCTCCTCGTCGGACAGCGGCGCCGGTGCC
+GGCGGCAGATCACGGTGTCGGTAGTCCGGACCCTCGATCCTCACCGTGGTGAAAATGCTTGCCAGGGTGT
+TGATCTCGCGTAGAAAGTCCTGGGCGGCGAAGCGGCCCTCGCCGAGCTGTTCGGGCAGTGTGTTGGAGGT
+GGCGGCCACCGAAACCCCCCGCTCGACCAGAGCCGAAAGCAGCCGGGAGATCAGCGTGGTGTTGCCCGGA
+TCGTCCAGCTCGAACTCGTCGATACATAAAGCGGTGTAATTGGCCAACAGATCGATACAGTCGGCGAAGC
+CGAACACACCGGCCAGCTGGGTCAGCTCACCGAACGTCGCGAATGCCTTTGGACATGTCGGCGCGTCCGG
+GCCGGTTCCAGGCAGCTGGTAGTAGGCAGAGGCCAGCAGGTGCGTCTTGCCTACCCCGAACCCACCGTCC
+AGGTACAGCCCCACACCGGGCAACACGTCGCGCTTGCCGAACCATTTCTTGCGGCCTGCACGCCGCTCGA
+CGGCCTGCCGGCAAAAGTCCTGGCACGCCACGACGGCGGCCGCCTGGGTGGGTTCAACCGGGTCAGGTCG
+ATACGTCGCGAAGCTCACCTCGGCGAACGTCGGAGGCGGCCGCAGTTGGGCGATCAGCCGCACCGGAGAC
+ACGGTCGGATGCCTGTCCACCAGGTGGTCCACCGAACCGCAAGCTTCGGAGGCAGACCCGTGCATGGTGG
+CACTGTAGCGACGTGCTGCAATCAAGGTCATGCCCGACTCTGGTCAGCTCGGAGCCGCTGACACCCCGCT
+AAGGCTGCTCAGCTCGGTGCATTACCTCACCGACGGCGAACTCCCCCAGCTTTACGACTATCCGGATGAC
+GGCACCTGGTTGCGGGCGAACTTCATCAGCAGCTTGGACGGCGGCGCTACCGTCGATGGCACCAGCGGGG
+CGATGGCCGGGCCCGGCGACCGATTCGTCTTCAACCTGTTGCGTGAACTTGCCGACGTCATCGTGGTCGG
+CGTGGGCACCGTGCGCATTGAGGGCTACTCCGGCGTCCGGATGGGTGTCGTCCAGCGCCAGCACCGGCAG
+GCCCGAGGCCAAAGCGAAGTTCCGCAACTGGCAATCGTCACCAGGTCCGGTCGCCTTGACCGTGACATGG
+CGGTATTCACCCGGACCGAGATGGCACCGTTGGTGCTCACCACCACGGCGGTCGCCGATGACACGCGCCA
+GCGGCTCGCGGGCCTCGCCGAGGTGATCGCGTGCTCCGGCGACGATCCGGGCACGGTCGATGAGGCAGTG
+CTCGTGTCCCAGCTCGCGGCTCGCGGTCTGCGCCGGATCCTTACCGAAGGCGGGCCGACGTTGCTCGGGA
+CATTCGTCGAGCGTGACGTGCTCGACGAGCTGTGTCTGACGATCGCCCCCTACGTCGTCGGCGGCCTGGC
+GCGCCGCATAGTGACGGGACCCGGGCAGGTGCTGACCCGGATGCGCTGTGCCCATGTCCTCACCGACGAC
+TCCGGCTACCTGTACACCCGCTACGTCAAGACCTGAAACAGCTGGACGTGAATGCCCGCCTCCTCACCGA
+CCCACTACGCGGCCCGCATCGTCGCCGGGTGAATGGCTACTGTGGTCGGCATGAGTCGGCCCATGACGTC
+AACCGCGATGTTGGTCGCGCTGACCTGCTCGGCGACAGTGCTGGCCGCATGCGTCCCGGCGTTCGGCGCC
+GACCCGCGGTTCGCGACCTACTCGGGCGCAGGACCGCAAGGCGCAGCCACCACGACACCACCGCCGGCTG
+GCCCACCACCGCTCGCCGCACCCAAGAACGACTTGTCGTGGCACGACTGCACGTCACGGGTGTACTCGAA
+TGCTGGGATCCCAGCAGCGCCCGGCGTCAAGCTGGAATGCGCAAGCTATGACACCGACCTCGACCCGCTC
+GTCGGCGGGTCCACAGCGGTAAGCATCGGCGTAGTGCGCGCGCGCTCCAACCAGACCCCGAGCGACGCAG
+GACCCCTGGTGTTCACCACCGGCTCCGACCTACCCTCGTCGACGCAGTTGCCGGTCTGGCTGGCACACGC
+GGGCATCGATGTGCTCCGCAGCCACCCCATTGTCGCCGTCGACCGCCGCGGCATGGGCATGTCGAGCCCA
+ATCGACTGCCGCGATCACTTTGACCGCGACGAGATGCGTGATCAGGCGCAATTCCAGGCTGGCGACGATC
+CGGTGGCCAACCTTTCCGACATCTCCAACACCGCCACCACCGACTGCACCGACGCCATCGCGCCAGGCGA
+GTCCGCCTACGACAACACCCACGCCGCCTCGGATATCGAGCGCTTACGCAAACTCTGGGACGTCCCTGCC
+CTCGCCTTCGTCGGCATTGGCAACGGCACCCAAGTGGCGCTGGCCTACGCAGCATCGCGTCCCGACAACG
+TCGCCAGACTGATCCTCGACTCCCCAATCGCGTTGGGGGTCTCTGCCGAAGCCGCCGCCGAGCAACAGGT
+CCAGGGCCAACAGGCGGCGCTGGACGCATTCGCTGCGCAATGTGTCGCGGTGAACTGCGCGCTGGGCTCC
+GATCCGAAAGGCGCGGTCAGCGCGCTGCTGTCGGCCGCCCGGTCCGGTGATGGGCCCGGCGGCGCGTCGG
+TGGCGGCTGTCGCCAACGCCGTCGCCACCGCGTTGGGCTTCCCCGACAGTGGCCGGGTCGATAGCACCAC
+GAAATTGGCCGACGCGCTGGCCGCGGCCCGCTCCGGGGACATGAACTTGCTGTCCGCCCTGATCAACCGC
+GCCGATACCACCCGGGATACGGACGGTCAGTTCATCAGCTCGTGCAGCGATGCGGTCAACCGCCCGACAC
+CGGACCGGGTGCGCGAGCTGGTGGTGGCTTGGGGGAAGCTCTACCCGCAGTTCGGCGCCGTCGCGGCGCT
+CAACCTGGTGAAATGCGTGCACTGGCCCAGCAGTTCGCCGCCGCAGCCACCGAAAGACCTCAAGGTCGAC
+GTGCTGTTGCTCGGTGTGCAAAACGACCCGATCGTGGGCAACGAAGGGGTCGCCGCGACCGCCGCCACGG
+CCATCAACGCCAACGCCGCCAGCAAGCGGGTGATGTGGCAAGGTATTGGCCACGGCGCCAGCATCTACTC
+GTCCTGCGCGGTGCCGCCACTCGTCGCCTACCTGGACACTGGCAAGCTGCCTGACACCGACACCTATTGC
+CCCGCCTGATATTCGGGGCGGGCGGGACGCGGTGTACGGTGCGCTGGTGACGGCAGCTGACTCCATCCGA
+ACCGGCCTAGGCGCATCCTTGTTGGCCGGATTCCGTCCGCGCACCGGCGCCCCGAGCACCGCGACGATCC
+TGCGGTCGGCGCTCTGGCCGGCCGCCGTCCTGTCGGTGCTGCACCGCAGCATCGTATTGACGACCAACGG
+CAACATCACCGACGATTTCAAGCCGGTCTACCGCGCGGTGCTGAACTTCCGGCGCGGATGGGACATCTAT
+AACGAGCACTTCGACTACGTCGACCCGCACTACCTGTATCCCCCCGGTGGCACCCTGCTGATGGCGCCGT
+TCGGCTACCTGCCCTTCGCCCCGTCGCGCTATCTGTTTATCTCGATCAACACCGCGGCCATCCTGGTCGC
+CGCCTACCTGCTGCTGCGGATGTTCAACTTCACGCTGACCTCGGTGGCCGCACCCGCCCTGATTCTGGCC
+ATGTTTGCTACCGAGACCGTGACCAACACGCTGGTGTTCACCAACATCAACGGCTGCATCCTGCTGTTGG
+AGGTGCTCTTTCTGAGATGGCTGTTGGACGGCCGAGCCAGTCGTCAGTGGTGCGGCGGCCTGGCGATCGG
+GCTGACCCTGGTTCTCAAACCCCTGCTCGGTCCGCTGTTGTTGCTGCCGCTGCTGAACCGCCAGTGGCGG
+GCTCTGGTGGCCGCCGTCGTCGTTCCCGTCGTCGTCAACGTGGCCGCGCTGCCGCTGGTCAGTGACCCGA
+TGAGCTTCTTCACCCGCACGCTGCCCTACATCTTGGGCACCCGGGACTACTTCAACAGCTCGATCTTGGG
+CAACGGCGTCTACTTCGGGCTGCCCACCTGGCTGATCCTGTTCCTGCGGATCCTGTTCACCGCGATCACC
+TTCGGCGCATTGTGGCTGTTGTACCGCTACTACCGCACCGGTGACCCGCTGTTTTGGTTCACCACCTCGT
+CGGGTGTGCTGCTGCTGTGGTCGTGGCTGGTGATGTCGCTGGCCCAGGGCTACTACTCGATGATGCTGTT
+CCCGTTCCTGATGACCGTTGTGCTGCCCAACTCGGTGATCCGCAACTGGCCGGCGTGGCTGGGAGTCTAC
+GGCTTCATGACGTTGGATCGCTGGCTGCTGTTCAACTGGATGAGATGGGGCCGCGCGCTGGAATACCTCA
+AGATCACCTACGGTTGGTCGTTGCTGTTGATCGTGACGTTTACCGTGCTCTATTTCCGCTATCTGGACGC
+CAAGGCGGACAACCGGCTGGACGGCGGTATCGATCCAGCCTGGCTGACGCCCGAGCGGGAGGGCCAGCGG
+TGATCGCAAGCGCGGCGAGCCGGGCGCAGCGGGTCACCGCCATCGGGACTAGCGGTGATCGCAAGCGCGG
+CGAGCCGGGCGCAGCGGGTCACCGCCATCGGGACTAGCGGTGATCGCAAGCGCGGCGAGCCGGGCGCAGC
+GGGTCACCGCCATCGGGACTAGCGTGGACCCATGACGCGCCCAAAGCTAGAACTGTCCGACGACGAGTGG
+CGTCAGAAGCTCACCCCGCAGGAATTCCATGTGCTACGTCGCGCCGGGACCGAGCGGCCCTTCACCGGTG
+AATACACCGACACCACAACAGCGGGCATCTACCAGTGCCGGGCCTGTGGCGCCGAATTGTTCCGCAGCAC
+CGAGAAATTCGAGTCGCATTGCGGCTGGCCGTCGTTCTTCGACCCGAAAAGCTCCGATGCGGTGACCCTG
+CGCCCTGACCACTCGTTGGGGATGACGCGTACCGAGGTGCTGTGCGCGAACTGCGACAGCCACCTGGGCC
+ACGTGTTCGCCGGCGAGGGGTATCCCACGCCAACCGACAAGCGCTATTGCATCAACTCCATTTCGCTGCG
+CCTGGTCCCCGGTAGCGTGTAGCGCCGAGATTGACGTTTTGCAGACGCCCTCTCGCACTTTCACTGCAAA
+ACGTCAGTCTCGGTGAAAGTCAGTCCACCCGGGTGGCGTGCACTTCCCAGAACGGGGCATGTACGCGGCC
+GCCCACCAGCCACGGCTTAATCGCCCGGAACCGCTCCAGCACGCACCGCACTTGATCGGCCATATCGGGA
+TTGCGCGCGGCCATCAGCTCTAGGGCCTCGACGCTCAAGTTGACCTGGTAGGTGGTCGTCCCCAGGTAGG
+TGATCTCCCAACCGCCGACCGGAAGCACCTGGCGAAAATCGTCCTCGGACAACGACCGCGGCATGCTGAA
+CCCGTTGACGTTGTGCTCGCCGAATTCGAACATGTACAGCCGTGCACCCGGCTTGCTGGCCCGGCGCAGC
+GCCCGCACATAGCACCTTTGCAGCTCGGGCGCGGTGCTGAAGGTGTGGTAGAAGGCGCAATCGACGACGG
+TGTCGAACCGGCCGTCCAGCCCGTCGAGCGTGGTGGCGTCGCCGACCTGGAAGTTCACCGACACCCCCGC
+CTTACGCGCGTTGTCCCGAGCCCGCTCGATGGCCGCGACGGACCCGTCGATCCCGGTGGCCGCATATCCC
+TTGGCGGCGTAGTAGATCGCGTGGTGCCCGGGCCCGGTGCCCGGGTCGAGCACCTCACCTCGGATCGCGC
+CCAACGCAACCAGCTGTTGAACCACCGGCTGGGGACCCCCGATGTCCCATGGCGTGGCGGCCGGCAACCC
+GTGGGCGACCCGATCATCGCGATACATCTCCTCGAACCGGGTGGGATCGGCAGGATCGAACTGGGCCGTC
+ATGGCAGCGAGTGCACCAACTGCTCCACCGGCACTCGCGGACCGGTGAAAAACGGTGTCTCCGCGCGGGT
+ATGGCGGCGCGCGTCGGTGGCGCGCAGCTCACGCATTAGGTCGACGATGCGGTCCAGCTCGGGCGCCTCG
+AACGCCAGGATCCATTCGTAGTCGCCCAGCGCGAACGCCGGCACCGTGTTGGCCCGGACGTCCTTGTATC
+CGCGGGCGGCCATGCCGTGTTCGGCGAGCATGCGGCGACGTTCCTCGTCGGGCAGCAAGTACCACTCGTA
+AGACCGCACAAACGGATAGACGCAGATGTAGGCGCCGGGCTCCTCGCCGGCCAGAAACGCCGGGATATGA
+CTTTTGTTGAACTCCGCCGGCCGGTGCAGGCCCACACCGCTCCACACCGGCGTGCATGCCCGCCCCAGCG
+TGGTGGTGCGCCGGAAGTCGGCGTAGGTGGCCTGCAGGGCCTCGACACGTTCGGCGTGGGTCCAGACCAT
+GAAATCGGCGTCGGCCCGCAGGCCCGCGACGTCGTAGAGGCCGCGCACCACAACCCCGCGCTCTTCCTGC
+TGTTTGAAAAACGTGGACGCGTCGTCGATGATCGCGTCACGCTGGTCACCGAGCGCACCGGGACTCACCG
+AGAACACTGAGAACATCAGGTAGCGCAGCGTCGCATTCAACGCGTCATAGTCAAGACGGGCCATGGCATC
+TATCGTGCCACCTGCGCATCTAAGGCCTCGATGACGCTGGTGACGGCCCGGCCCGCCGCGCCGACGCAGG
+CCGGCACGCCGATCCCGTCGAGGTAGCTGCCCGCAACGGCCAGCGTCGGTGGCAGGCCGGCGCGCAGCTC
+GGCGACCACATCGGCATGGCCGGGACCGTACTGCGGCATCGCCTCGATCCAGCGCCGGACCCGAACGTCG
+ACCGGGTCGACGGCCACACCGAACACCGTGACCAAGTCGTCCGCTGCCCAGGCCAGGAGTTGGTCGTCGG
+AGGCCGTCAGGGCCGGTTCGTCGCCGAACCGACCGAACGACAGCCGCAACAGCGCGACGTCGCCGCGCTG
+ACCCCATTTGCGCGACGACAATGTGATCGCCTTGGCATGCGGTGACTCGTCGCCGGCCACCAGCACGCCG
+GAACAGTGCGGAAACGCGGTGCCGCCGGGCACCGCCAGCGCCACCACCGCCGACGACGCGCTCACGATCT
+GCCGGGCGGCGGCATGTGTGCGCGGCGCGATGCCATCGACGAGGCGCGCCAACCGCGGCGCCGGAACCGC
+CAGGATGACGGCGTCGGCCTGCCAGCGGCCGCCGGTTTCGTCGCGCAGCACCCAGCCGCGTTCGAGCTGG
+ACCACCCTGGCCCGCACCCAGTGCACCCGGCTGCGCCGGACGAGCCCGTCGAGCAGCACCTGATACCCGC
+CGTCCAGCGCGCCGAACACCGGCCCGCCGCTTCCCGGCGGCAGCGCCTGCCGGACCGCGTCGGTCACACT
+GGTCGCCCCGCGATCCAGGGCCGCGGCCACGCTCGGGGCGGCCGCGCGCAGCCCGATCGTCGCCGCCGAG
+CCCGCGTATACCCCGCTTAACAGCGGGTCCACCGACCGGGCCACGACTTGGTCGCCGAACCGGTCAGCCA
+CCAAGTCGGCCACCGCGGGATCGCTGCCCACCTGCCAGGTGAACGGACGAGCGGCTTCGGCGTCGATCCG
+CGCCAGGGTTGCGTCGTCGACCAGCCCCGCCATGGAGCCCGCCGACGACGGGATCCCGACGACCGTCTGC
+GGCGGCAGCGGGTGCAAGCGCTGCTGGCTGTAGATGAGCGGCCGCGCGCCGGTGCTGGCGAGTTGGCGGT
+CCGACAGGCCCAGCTCGGCCAAAAGCGCCGGCATCTCGGGCCTACGCAGCACGAACGCCTCCGCGCCGAG
+GTCCATTGGCTGTCCGCCGATATGCTCGGTGCGCAATACCCCGCCGAGCCTATCGGCCGGTTCGAACAAG
+GTGATGGTCGCGTCATCGCCGACAGCCTGCCGCAGCCGGTACGCCGAGGTCAATCCCGAAATCCCGCCTC
+CTACAACACAATACGAGCGGGGAGTCATAGCGAGTGTACGAGCGAGACCAGGTCGGCCAGCACCGCGGGA
+TCGCTTTCTGGCAGCACCCCGTGGCCGAGGTTGAAGATATGGCCGGCCGCACCGGCGTCGACGGCGCGGC
+GTCCGTCGTCGACAACGGCACGTGCGGCACGTTCCACCGCCGGCCAGCCCGCCAGGACCACCGCCGGATC
+GAGGTTGCCCTGCAACGCCGTGCCGGGCACCACCCGGGCGGCGGCGTCGGTCAGCGGGGTCCGCCAGTCC
+ACGCCGACGACGGCCCCTCGGCCTGGCCGCTCCCCGGCTGTCACGGCCTCCGACATCGCGCCCAGCAATT
+CGGCGGTCCCAACCCCGAAGTGCGTCATCGGCACGCCATGCTCGCCCAGCGCAGCGAACACCCGGGCGCT
+GTGCGGCAACACGTACTGGCGGTAGTCGATCGGCGAGAGCGCCCCGGCCCAGGAGTCGAATACCTGGATG
+GCGTCCACCCCCGCGTCGATTTGGCCGACCAGAAACGCGATGGTGAGGTCGGTCAGCTTGGCCATCAGCG
+CGTGCCAGCTCGCCGGCTCGGCCAACATCATCGCCTTGACGTGGGCGTGATGGCGGCTCGGTCCGCCCTC
+CACGAGGTAGGAGGCCAGCGTGAACGGCGCGCCGGCGAAACCGATCAGCGGCACGTCGCCAAGCTCAGCG
+ACCAACAACGAAGCCGCCACCAATACCGGTTGAATCGCTTGTGGATCAAGTGGTTTCATGGCGGCGACAT
+CGGCGGCGGTGCGCACCGGGTCCGCGATCACCGGCCCAACGTCGGCGACGATGTCCAAATCCACGCCGGC
+CGCCCGTAGCGGCACCACGATGTCGGAGAACAGGATGGCCGCGTCGACGTCGTAGCGGCGTATCGGCTGC
+AGGGTAATCTCACAGGCCACGTCCGGTTCGAAACAGGCCGCCAGCATGCTGTACCGCTCGCGCAGCGCCC
+GGTATTCGGGCAACGAGCGCCCGGCCTGCCGCATGAACCACACCGGCACCCGGCTGGGCTTGCGGCCGGT
+GACGGCGGCCAGATACGGCGACTGCGGAAGGTCGCGACGGGTACTCATCGAACTCAATGCTGCCACGACC
+GCCACCCCGCACCTGCGTAACATCGACCCAATGCCAGTTACCTACGACGACTTCCCCAGCCTGCGCTGCG
+AAATCCACGACCAACCTGGTCACGAAGGCGTGCTGGAGCTGGTGCTGGACTCCCCCGGGCTGAACTCGGT
+CGGGCCGCACATGCACCGCGACCTTGCCGACATCTGGCCGGTGATCGATCGCGACCCGGCCGTGCGCGTG
+GTCTTGGTCCGCGGTGAAGGCAAGGCCTTTTCCTCCGGCGGCAGTTTCGACCTGATCGCCGAAACCATCG
+GCGACTACCAGGGCCGGCTGCGCATCATGCGCGAGGCCCGCGACCTGGTGCTCAACCTGGTCAACTTCGA
+CAAGCCGGTGGTGTCGGCGATTCGGGGCCCGGCCGTCGGTGCGGGTCTGGTTGTCGCGCTGCTCGCCGAC
+ATTTCGGTGGCGGGCCGCGCCGCGAAGATCATCGATGGGCACACCAAACTCGGGGTCGCCGCGGGGGATC
+ACGCGGCGATCTGCTGGCCCCTGCTGGTCGGCATGGCCAAGGCCAAGTACTACCTGCTGACCTGCGAGCC
+GCTGTCCGGGGAGGAGGCCGAACGCATCGGTCTGGTCTCCATCTGCGTCGACGACGACGATGTGCTCCCC
+ACCGCAACACGCCTGGCGGAGCGGCTCGCCGCTGGCGCGCAAAACGCCATCCGCTGGACCAAACGCAGCC
+TCAATCACTGGTATCGCATGTTCGGTCCCGCCTTCGAAACGTCGCTCGGGCTGGAGTTCATCGGGTTCGG
+TGGTCCCGACGTCCGGGAAGGCCTGGCCGCGCACCGCGAAAAGCGCCCCGCGCGGTTCGGCGCCGACCCC
+GATCCCGGCGCCGGCAGCTGAGCACAGTTCGGCGCGCCTGTGCACACGTGTCGGCGGATAGGTCTACCGT
+CGAAATCTGTGACCTCCGCCGGCGACGATGCAGAGCGCAGCGATGAGGAGGAGCGGCGCTTGACCTCCGC
+CGGCGACGATGCAGAGCGCAGCGATGAGGAGGAGCGGCGCTTGACCTCCGCCGGCGACGATGCAGAGCGC
+AGCGATGAGGAGGAGCGGCGCTTGACCTCCGCCGGCGACGATGCAGAGCGCAGCGATGAGGAGGAGCGGC
+GCTTGACCTCCGCCGGCGACGATGCAGAGCGCAGCGATGAGGAGGAGCGGCGCTTGACCTCCGCCGAGCC
+GGCCCTATTCCGCGAGGCAGTAGCGGCGATGAACGCTGTCACCGTGCGGCCGGAAATCGAACTCGGCCCT
+ATCCGACCGCCGCAGCGGCTAGCTCCGTACAGCTATGCGCTGGGAGCCGAGATCAAGCATCCCGAACTCG
+ACGTCATTCCGGAGCGTTCCGAGGGCGACGCCTTCGGCCGGCTGATCATGCTGTATGACCCGGACGGCTC
+CGATGCATGGGACGGCACTATTCGCCTGGTCGCCTATGTCCAGGCCGACCTGGACTCGAGTGAAGCCGTC
+GACCCCCTGCTGCCCGAGGTGGCATGGAGTTGGCTGGTGGACGCGCTGACAGCGCGCACCGACCAGGTGA
+GGGCCCTGGGCGGCACTGTCACCGCCACCACATCGGTGCGATACGGCGACATCTCCGGGCCGCCGCGCGC
+TCACCAGCTGGAGCTACGGGCGTCATGGACGGCGACCACCCCCGATCTGGGCGCCCATGTCCAGGCGTTC
+TGCGACGTCCTGGAGCACGCGGCCGGCCTGCCGCCAGCCGGGGTCACCGACCTGGGCTCGCGGTCACGCG
+CCTGACATGTGCCCCGAGCCGTCTCACGCGGGAGCTGCTGAGTCCGAAGGCACGGAATCGGAACCCACCC
+CCTTGCTCCGGCCCGCCGGTGGGATACCGGATCTGTGTGTGACCGTCGGTGAAATCGCCGCTGCCGCAGA
+ACTACTGGACCGCGGGCGCGGACCGTTCGCGGTAGACGCCGAGCGGGCGTCGGGTTTCCGCTACTCCGGC
+CGCGCCTACCTGATTCAGATCCGGCGGGCCGAGGCCGGCACCGTACTGATCGACCCGGTCAGCCACGGCG
+GTGACCCGTTGACCGTGCTGGCGCCGGTCGCCGAGGTGCTCAGCACCAACGAGTGGATCCTGCACTCCGC
+CGATCAGGATCTGCCCTGTCTCGCCGAGGTCGGTATGCGACCGCCAGCGCTATACGACACCGAGCTTGCC
+GGGCGCCTGGCCGGGTTCGATCGAGTGAACCTGGCGGCCATGGTCGAGCGGTTACTTGGACTGGGATTGA
+CCAAGGGCCACGGCGCGGCCGACTGGTCCAAGCGCCCGCTACCCTCGGCCTGGCTGAACTACGCGGCGTT
+GGACGTGGAACTGCTCATCGAACTACGCGCGGTGATCTCGCGGGTGCTGGCCGAGCAAGGCAAAACCGAT
+TGGGCTGCGCAGGAATTCGAGCACCTGCGGTCGTTCGAATCAAGGCCACCCCCAGCGGCCGCCCGGCAGG
+ACCGCTGGCGACGAACCTCGGGTATCCACAAAGTGCATGACCGGCGGGGGCTGGCCGCGGTCCGCGAATT
+GTGGACAGCGCGTGACCGAATCGCCCAGCGCCGCGACATCGCGCCCCGCCGGATCTTGCCGGACTCGGCC
+ATTATCGATGCCGCCATCGCCGACCCAAAGTCAGTCGACGACCTTGTCGCGTTACCGGTGTTCGGCGGAC
+GCAACCAACGTCGCAGCGCGGCTGTGTGGTGGGCGGCACTGGCAGCCGCACGCGAAAGCCCAGATCCGCC
+GGAGATCGCCGAACCGGCAAACGGGCCGCCGCCGCCGGGGCGGTGGGTCAGACGGAAACCGGCAGCCGCC
+GCACGGCTGGATGCGGCGCGCGCGGCGCTGACGGAGGTGTCGCAACGGGTGCGGGTACCGACCGAGAACC
+TGGTCTCACCTGATCTGGTGCGACGGCTGTGTTGGGAATGGGAGGACATCTCGCAGAGTTCTCCAGACCC
+GATTGCCGCTGTCGAGGCGTACCTGCGCACCGGCCAGGCACGGGCCTGGCAGCTCGAACTAGTGGTCCCC
+ATCCTGACCGCGGCGTTGACAGGGGCTCCGGACGCCGGCGCCCAGGGCGATGATGGCTCTTAGTCGAGAT
+GTTCTGGAATCGCGTCGGACGCACACACCCCGGTACCCAGCGCGGCGACCCAGCCGGTGATCCGCCGGGC
+CACGTCCTGGTCGGTAAGCCCCAGATCGGCCAGCACCTCGCTTCGAGACGCGTGCTCGTAGAACTCCTGC
+GGCAACCCGACATCGCGGCAGGGCACGTCGATCTCCGCGCGCCGCAGCGCGGCCGACACCGCTGACCCCG
+CCCCACCGTTGACCCCGTTGTCCTCTAGCGTGACGAGCAGCTTGTGCTGCACCGCCAGTTCGCGCACACC
+GTCAGACACCGGCAACACCCAGCGCGGGTCGATCACCGTCACACCGATCCCCTGGTTGTGCAGCCGCTTG
+GCCACCGCCAACGCCATCGGTGCGAACGCGCCGATGGCCACCAACAGGACGTCGTGGTTCAAACCATCGG
+CGGGCGCCGCCAGCACATCCACGCCTCCACGCCGCTCCAAAGCCGAAATATCTTCTCCCACATCACCTTT
+GGGGAACCGTAACGCCGTCGGGCCGTCGTCGACGTCGAGCGCCTCGCCGAGTTCTTCACGCAACCGGGTG
+GCGTCTCTGGGCGCTGCCACCCGGATGCCGGGCACGATACCCAGCATCGACAAGTCCCACATTCCGTTGT
+GGCTGGCGCCGTCGCTACCGGTGATCCCGGCACGGTCCAGCACCATGGTGACCGGCAGCTTGTGCAGCGC
+CACATCCATCATGATCTGGTCGAACGCCCGGTTCAGGAACGTCGAGTAGATCGCCACCACGGGGTGCAGC
+CCACCCATCGCCAACCCGGCCGCCGACGTCATCGCGTGTTGCTCGGCGATCCCGACGTCGAACAATCGAT
+CCGGGAAGCGCTGCCCGAACGCGGTCAGCCCGGTGGGGCCCGGCATGGCCGCGGTAATGGCCACGATGTC
+ACGGCGTTTCTGGGCGTAGCCGATAAGTGCATCAGAGAAGGTCGCCGTCCAGCCTGGGCCGGCCACCTTG
+GTGGCTTGTCCGGTGGCCGGATCGATCGGGACCGTGGAATGCATCTGCTCGGCCTGGTCGGCCTCGGCCG
+GCGGGTAGCCCATGCCCTTGCGGGTGACGACGTGCACGATCACCGGTGCACCGAAGCGCCGCGCGCTGCG
+CAGCGCGACCTCCACCGCCCGCTCGTCATGGCCGTCGACCGGGCCGACGTACTTCAACCCGAGGTCGGTG
+AACAGCAACTGCGGCGACAGCGAGTCCTTGATGCCGGCCTTGACGCTGTGCAGGAATCGAAACCACAGAC
+CGCCGACAAGCGGCACCGCGCGCACCAGGTCGCGGCCCGTCTCCAGCGCCTGCTCGTAGGCCGGCTGCAG
+CCGCAGCGTGGCCAGATGGTCGGCGACGCCCCCGATTGTGGGCGCGTAGCTGCGCCCATTGTCGTTGACC
+ACGATAATCACCGGCCGGCGGGATGCGGCGATATTGTTCAGCGCCTCCCAGCACATACCGCCGGTGAGCG
+CACCGTCACCGACCACCGCGACCACATGCCGGTTGCGGTGTCCGGTCAACTCGAACGCCTTGGCCAACCC
+GTCCGCGTACGACAGCGCCGCGCTGGCGTGGCTCGACTCCACCCAGTCGTGCTCGCTCTCGGCACGAGAC
+GGATACCCCGACAACCCGCCCTTCTTACGCAGGGTTGCGAAGTCCTGGCTGCGTCCGGTCAACATCTTGT
+GGACGTAGGCCTGGTGACCGGTGTCGAAGATGATCGGATCGTGCGGCGAGTCGAATACCCGGTGCAGCGC
+CAAGGTGAGTTCCACCACTCCCAGGTTCGGCCCCAGATGCCCCCCCGTGGCGGCAACCTTGTGGATCAGG
+AACTCACGGATCTCGGCGGCCAGCTCCCGAAGCTGCGCCTGGGAAAGGTGCTGCAGATCAGCGGGCCCGC
+GGATCTGTTGCAGCATTTCGCTAGTGTACGCAGCAACCCCCCCATTGGCCCAGCATGCGGCCGCCGATCA
+AAAGGGCCGAACCACTTTGATAGCGTCGGTGGCCGGCGCGCCGGGAAGCCTGGTCGGCGACTCATTGTCA
+TCCAACTCCGGAGTTCGATATGAAGGTAAACATCGACCCAACCGCGCCCACCTTTGCGACGTATCGTCGG
+GATATGCGTGCCGAGCAAATGGCGGAGGACTATCCCGTCGTAAGCATCGATTCCGACGCGCTGGATGCTG
+CCCGCATGCTCGCAGAGCATCGTCTGCCTGGACTATTGGTCACCGCCGGAGCGGGCAAACAGTATGCGGT
+ACTCCCTGCCTCACAGGTCGTGCGCTTCATCGTGCCCCGCTATGTGCAAGACGATCCCTCACTGGCCGGT
+GTGCTCAACGAATCGACGGCCGACCGGTGCGCCGAGAGATTGAGCGGCAAAAAGGTCCGCGACGTGTTGC
+CTGACCACCTGGTCGAGGTTCCCCCGGCTAACGCCGACGACACCATCATCGAGGTGGCCGCGGTGATGGC
+ACGGCTGCGCAGCCCATTGCTCGCGGTGGTCAAAGACGGCTCGCTGCTCGGGGTGGTCACCGCATCGCGC
+CTGCTTGCTGCGGCACTGAAGACTTGACCTCGTGAGCGTCGTCGCGGTCACCATCTTCGTGGCGGCCTAC
+GTTCTGATTGCCAGCGATCGCGTCAACAAGACGATGGTGGCGCTGACCGGCGCGGCGGCCGTGGTCGTCC
+TACCAGTGATCACATCCCACGACATCTTCTATTCCCACGACACCGGAATCGACTGGGACGTCATTTTCTT
+GTTGGTGGGCATGATGATCATCGTCGGAGTGCTGCGGCAGACGGGGGTGTTCGAATACACCGCGATCTGG
+GCCGCCAAGCGCGCCCGCGGCTCGCCGCTACGCATCATGATCCTGCTGGTATTGGTGAGCGCGTTGGCGT
+CAGCCTTGCTGGATAACGTCACCACGGTGTTGTTGATCGCGCCGGTCACGCTATTGGTGTGCGACCGGTT
+AAACATCAACACGACGTCGTTCCTGATGGCCGAAGTCTTCGCCTCCAACATTGGTGGCGCCGCGACGTTG
+GTGGGTGACCCGCCGAACATCATCGTGGCCAGCCGGGCGGGATTGACGTTCAACGACTTCATGCTGCACT
+TGACACCGCTGGTAGTCATTGTGCTGATCGCCCTCATCGCTGTGCTGCCCCGCCTGTTCGGCTCGATCAC
+GGTCGAAGCCGATCGAATTGCCGATGTCATGGCGCTCGACGAGGGTGAAGCCATCCGCGACCGCGGACTG
+CTGGTCAAATGTGGCGCCGTGCTGGTGCTGGTGTTCGCGGCCTTCGTCGCCCATCCGGTGCTGCACATCC
+AGCCTTCTCTAGTGGCGCTGCTGGGCGCTGGGATGCTGATCGTGGTCTCGGGTCTGACGCGATCCGAGTA
+TCTATCCAGCGTCGAGTGGGACACGCTGCTGTTTTTCGCCGGGCTGTTCATTATGGTCGGAGCGCTGGTC
+AAGACCGGTGTCGTCAACGATCTCGCGCGGGCAGCGACCCAGCTGACCGGCGGCAATATTGTGGCCACCG
+CGTTCCTAATCCTCGGCGTCTCCGCCCCGATCTCGGGAATTATCGACAACATTCCCTACGTCGCCACGAT
+GACGCCCCTCGTCGCGGAGCTGGTCGCGGTCATGGGGGGTCAACCCAGCACCGACACCCCCTGGTGGGCG
+CTGGCCCTGGGTGCCGACTTCGGCGGCAACCTGACCGCAATCGGCGCCAGCGCGAACGTCGTCATGCTCG
+GAATCGCCCGGCGCGCAGGAGCTCCCATCTCGTTCTGGGAGTTCACCCGCAAAGGGGCGGTGGTCACGGC
+CGTCTCGATCGCGCTCGCGGCGATCTACCTGTGGTTGCGGTACTTCGTGTTGTTGCACTGACCATCTGTA
+TTGCCGACAGACCTGTAGCACCAGACGACGCCGCGATGAGCGGCCTACGAGAAGATTCGGAGGATGGCCG
+ATGAGCATCATCGCCATCACGGTGTTCGTAGCCGGCTATGCACTTATCGCAAGCGACCGAGTCAGCAAGA
+CCCGGGTGGCACTGACGTGCGCGGCGATCATGGTCGGCGCCGGGATCGTCGGATCGGACGACGTGTTCTA
+CTCGCACGAAGCCGGAATCGATTGGGACGTCATCTTTCTGCTCTTGGGCATGATGATCATCGTCAGCGTG
+CTTCGGCACACCGGCGTCTTCGAATACGTCGCGATTTGGGCCGTCAAACGCGCAAACGCCGCGCCGTTGC
+GCATCATGATCCTGCTGGTGCTGGTGACCGCGCTGGGGTCGGCCCTGCTGGACAACGTCACCACGGTGTT
+GTTGATCGCGCCGGTGACGCTACTGGTATGTGATCGACTGGGGGTCAATTCCACGCCGTTTTTGGTGGCC
+GAAGTCTTCGCGTCCAATGTCGGCGGCGCGGCCACGCTGGTCGGCGACCCGCCGAACATCATCATCGCCA
+GCCGGGCGGGACTGACGTTCAACGACTTCCTGATCCACATGGCCCCGGCCGTGCTCGTCGTCATGATCGC
+CCTGATCGGTCTGCTGCCCTGGCTGCTGGGCTCCGTCACTGCCGAGCCCGACCGAGTTGCCGACGTGCTG
+TCGCTCAACGAGCGCGAAGCCATCCACGATCGCGGGCTGCTCATCAAGTGCGGTGTCGTCTTGGTGCTGG
+TGTTTGCGGCCTTCATCGCTCATCCGGTGCTGCACATCCAGCCGTCTCTGGTGGCGCTGCTGGGCGCCGG
+TGTGCTCGTACGGTTCTCGGGGCTGGAGCGATCCGACTACCTGTCCAGCGTCGAGTGGGACACCCTGCTG
+TTCTTCGCCGGGCTGTTCGTCATGGTGGGGGCCCTGGTGAAGACCGGTGTCGTCGAGCAACTGGCGCGGG
+CAGCAACCGAGCTGACCGGCGGCAACGAGTTACTCACAGTCGGTTTGATTCTCGGCATCTCGGCACCGGT
+GTCCGGCATCATCGACAACATCCCCTACGTCGCCACGATGACGCCCATCGTGACCGAACTGGTCGCCGCG
+ATGCCGGGCCACGTCCACCCCGACACGTTCTGGTGGGCACTGGCGCTAAGCGCCGACTTCGGCGGCAACC
+TGACCGCCGTGGGAGCCAGCGCCAATGTCGTCATGCTCGGAATCGCCCGGCGCTCGTGCACTCCCATCTC
+GTTCTGGAAGTTCACCCGCAAGGGCGCGGTGGTGACCGCGGTCTCGCTCGTGTTGTCGGCGGTCTACCTG
+TGGCTGCGGTACTTCGTGTTCGGCTAAGCGCCAACGCTCACGCGTGCTTAGCGCGAAAGCGCCGAAACAG
+CACCCAGACGATGGCCAGGTTGTAGACGGCACCCCCGACGAGATACGGCCACCAGGTGCCGTGATCGCTG
+GCGACCCAAAATGCCTTGGCAGCCCAGTACGGTGGTAAGACGCCGAACGCGAGGTTCCAGTTGGAACTGA
+TGAACCACGGCAGGCAGGGCAGCCCGGCGATGAGCATGCCCAGCGCACGGACCATCGCCAGGCCCTGAAT
+CTTGTTGTTCGCCACCGCAAGAATCAGCAGCAGCGTGACCACCGCCGACAGGCCGGCCACCAGTCCGATG
+GGAATCAGTGAAGACACCAGGCCCGGTTCGAGGATCCCGCTGCACGACATCGTCGCGACGACGTAGATGG
+TGGTCACCACCATCACGGTGGCCGCACGATAGCCGAAAAAGACCGACAGCGGCACCGGGGTTACTCGCAG
+CGCCGTCATCGTGCCCGCGTCTACGTCGTCCAGCACCAAGAACGCGGCCAGCGCACCGGCGACGATGATG
+CTGGTCAACAACAGGAACGCGGTGAGGATCAGTGGGTAGTATCCGACCAGGTCGAATCCATAACGCCGCG
+CCAGCATCTCGGTGAACAGCGGCGTGAGCAGCGCGACTCCGGTGGTCCAGATGACCGGTGCGATGACGAG
+CATGACCAGCAGCGGATCGCGGTAGGTGCCTCGAATGTCGTTGCGGCCGAACGCGGCCAACGCCCGTGGG
+CCCGCAAGGCTCGATATCGCTCTCACAGCACACCCGATCTTTGCACGACATAACGGCCGAATAGCGCCTT
+GGCCGCCCGGCACAATCCCGCCGCACACACGATTGGGTAGACCACCGCATACCCGACCTGCCAGGGCGCC
+AAGCTCACCTGATCGAACGCCGCGCCGAGCAAGAGCAGCGGCCCCTGGGTGGGGATGAGGTAAAGCACCG
+GGTTGGGCCACAGGCCGGAGTAGTGCACCACCGGCGGCGCCAGCATGATCGCGAGCGGGATGACCGCCGC
+CAGGAACCAATCGGTCACCGAGGCGAACGGCAACGAGGAACTGAAGCCGACCAGCAGCATCAGCAGTGTG
+CCCAGCACGATGCCGGCCACCAGCGGCAGCAGGTGGTAACCAAGCCCGTGAACGATGGTGGCCACGACAA
+CCGCAACGAACAGCGAGATCGCCAGCAGCACAGTTAGTTTGGCAGCCAGGTACTCCCAGAACCGCAGCGG
+CGTCGAGACGATCGCGCCGATCGTGCGCTCCTGCTTCTCGAAGAACACGGTCCCGCCGACGAAGAAGAAC
+CCGATGATCGCGATATCACCCACCAGGACATAGGGTTCGGCGACCGGGCGCAGGCTGACCGGCATCGGCA
+GCAGCACTGCCAGCCAAATCAGTCCGGAGAAAACGGCGGCATGCAAGAACTTCTGCCGCACCTGTAGCGT
+CAGCTCGAGCCGCAGCGCAGGCACCAACCGGGTCATGTCAGCTGCCTGCCGGTGACCTCGACGAAGACAT
+CGTCGAGGCTGGCCTCGCGGCTATGAATGGTCTCGACGTGGTGGTTTCGCAGCACGGAGTGGAACGCCGG
+GTCGTCGGCAAGGCCGTCCATGCCGAACTCGGCGGTCTCGAGTCCCCCGCCGTCGCCCCGGTATTCCACC
+CGCACCCGCCGCCGGCTGCGAGCGATCTTCAGTTCGGTGGGACTGTCCAGTGCGACGATCCTGCCGTCGA
+CGACGAACGCCACCCGGTCGCACAGCTCGTCGGCGGTGGCCATGTCGTGCGTGGTGAGAAAGATCGTGCG
+GCCGCGCGCCTTCAGGTCCACGATGATGTCCTTGATCTTGCGGGCGTTCACCGGGTCCAGCCCGGAGGTG
+GGCTCGTCGAGGAACAGCAGCTCCGGGTCGTTGATCAGCGACCTGGCGAAGGTCAGCCGCATCTGCATGC
+CCTTGGAGTACTTGCCCACTAGGGTGTGGGCGTCATCGGCCAGGCCGACGGCGGCCAGCAGCTGCATCGG
+GTCGGCCGTCGCGCCGGCGTACAGCGAGGCGAAGAAGCGCAGGTTCTCATACCCGGTGAGCTTTTGGTAG
+TGGTTGGGCAGCTCGAAGGAGACCCCGATGCGCTCGTAGTAATCGGGTCCCCACTCGGCCGGCTCTTTGT
+CCCACACCGTGGCCTGGCCGCCGTGGTCGCGCAGCAGCCCGATGAGAAGCTTCTGGGTGGTGGACTTGCC
+CGCGCCGCTGGGACCTAGAAGCCCGAAGATTTCGCCGCGGCCGACGGTGAACTCCATGCCACGCACCGCC
+GGCTCGGCCGCCTTTGGGTAGCGGAAGGTGAGCCCGCGCACGCGGATCACCTCGGTTCCCACACGCGCCG
+ATGCCACAGCACGGTTGAGCGCCGTCATGATTGGCTCCGTTCCCTTTCGGGCGAGCGCGGTGCGCCGGCT
+CATCCAAGTAACCAGAAAGTCACCGCGCCAATGCTGATACCTGGTTCCGACCAGTCTTCCCGGAGCGCCA
+ACCCAAGACTACTAGCTGCGCTGCTGTATACGGAGCAACCCACGACGACCACGGGCGAGCTGGTCGAGCA
+GCTGCATGACCTCTACACCTTTCGGGTCAACAGCGCAACGCACTCGACGTAGTGAGTCAGCGGGAACGCG
+TCGAACACCTTGATCTTCTCCACGGCGTAACCGTGACCACGGTAGAGGCCGATATCGCGCGCGAAAGACG
+CCGCTTCGCAACCGATATGTATCAACCGTGGCACCCCCGCACCGGCCAGCAAGTCGACAACCTCGCGCCC
+AGCGCCTGATCGCGGTGGATCCAGCACCGCCAGATCCGCGCCGGCGGGTTGCACTGCCAACACCCGCCGC
+ACCGAACCGGTGACGACCTCCACCTGGGGCAAATCGACCAGCGCGGCACGTGCGGCCCCGGATGCCAGGC
+GCGAAGTGTCGACGGTCAACACCCGTCCGGACTCCCCGACCGCCTCACCCAGCACCGCAGCGAAAACCCC
+CGCACCACCGTAGAGATCCCAGGCGGTCATGCCGGGGGCGGGCTGAGCCCAGTCAGCGATCAGATCGCTG
+TAGACCGCCGCCGCGTCGCGATGCGCCTGCCAAAAGGCCGTTACCGGCACCCGCCAGCTGCGCCGGTGCA
+CACGCTGGTGGGCGTGGTAGGCGCCCTCCACCACGTTGGTCACGGTTCGGGTCCTATTCCGAGGGCCCTG
+CCGCACGGAACAGACCACATGGCGCTCGCCGTCGTCGTCCAGAGCCACGTAAAGCTGGGCTTCCGGCGGC
+CAGTCAGCCGCTACCAGGCCGTCTAGCATGCCGACAGGCAACTGCCCGCAGTCCAGGTCGGTTACCAGCT
+CGCCACTGTGGTAGCGGTGAAAACCTGGACGACGGTCTGCGCCCACGTCGAGCCGGACTCGAATACGCCA
+ACCCGTGGGGCCGGCATCCGACAGCGGTTGCGCCTCGCCCTGCCAGCTGTGCCGCCCGAGCCGTTCCAGC
+TGGTTAGCCACAACTTGCGCCTTAAGTGTGCGGGCCGCCTCCGGAGCAGCAAACGCCAGATCGCAACACC
+CGGCGCCGTCGGCCCCGGCGATCGAACACAGCGACCCGATCCGGTCGGGCGACGGGTCGATCACCTCGAA
+AGCCTCTGCGTGCCAATAAGAGCCACGTTGCGCGGTCACCCGCGCCCGCACTCGTTCACCGGGCAACGCA
+TAGCGGACGAAAACCACCCGGCCCTCGTGGTGCGCCACGCAGCTACCGCCGTTCGCGGGCGCTCCGGTGA
+CCAACGTCAGATTCACTGCATCGTCGCCGGCGCGGGTCACTGGCGCCGCTCCTCCCCATCGCTTTGCTCT
+GCATCGTCGCCGGCGCGGGTCACTGGCGCCGCTCCTCCCCATCGCTTTGCTCTGCATCGTCGCCGGCGCG
+GGTCACTGGCGCCGCTCCTCCCCATCGCTTTGCTCTGCATCGTCGCCGGCGCGGGTCAATCGAAGATGCC
+CCGTCGCGTGTCACCGGGAGCCGCGTGCGGCTGTAACGTCTTGATCCGCTCCGACGACGTCAGTTGCCAA
+GGCACCGAAGTCACCATCACGCCGGGCATGAACAGCAACCGGCCCTTGAGCCGCAGCGCACTCTGGTTGT
+GCAGCAGCTGTTCCCACCAGCGCCCCACGACATACTCCGGAATGAATACCGTCACCACGGTCCGTGGCGA
+TTCCTTGCTGACCCGCTTGACGTAATCGAGCACCGGCCGGGTGATCTCACGGTACGGCGAGGCGATGACC
+TTGAGTGGCACGCTCACATCGCTGTCCTGCCACTGGCGCACCAGCTCGCGGGTTTCCGCATCGTCGACGT
+TGACCGTCACGGCTTCCAACACGTCGGGCCGGGTCGCTCGTGCGTAGGTCAACGCGCGCAACGTCGGCAG
+GTGCAGCTTCGACACCAGCACGACGGCGTGATTGCGGCTGGGCAACGTTATCTCGGCTTCCTCGGCCTGT
+TCCGCCAACTCCCGGTTGACGGCGTCATAGTGCCTGTGGATGAGCTTCATCATCATGAAGAACCCTCCCA
+TGGCGACGATCGCGATCCATGCTCCGGCAAGGAATTTCGTTACCAGCACGATGAGCAGGACGGTACCGGT
+GGACACGAAGCCGACCGTGTTAACCGCGCGGGAGCGCAGCATCGCGCGACGGGCGCGCGGATCGGTCTCG
+GCGCTCAGCAACCGGGTCCAGTGCCGGACCATGCCGACCTGACTCATGGTGAACGAGATGAACACACCGA
+CGATGTACAGCTGGATCAGCGCGGTCAACTCGGCACGAAACGCGACCACCGCCCCGATCGCCGCCGCCGC
+CAGGAACAGGATTCCGTTGGAGAACGCCAGCCGGTCCCCACGGGTGTGCAACTGGCGCGGCAGATAGCTG
+TGCTGCGCCAGCACCGAGCCCAGCACCGGGAAGCCGTTGAAGGCGGTGTTAGCGGCCAACACCAGGATCA
+GCGCTGTCACCGCGGCGATCAGCAAGAACCCCAGGTAAAAGCCCCCGAACACGGCCTGCGCCAGTTGTGC
+GACCAGCGTCTTTTGCTGATAACCCGGCGGGGCGCCCGTCAGCTGGGTGTCCGGATCGTCGACGACCTGG
+ACCCCGGTCTCTACGGCCAGCACGATCATGCCCATAAACATGCTCACCGCAATGATGCCCAGCATCAGCA
+GCGTGGTTGCCGCGTTACGCGACTTGGGCTTTTGAAACGCCGGCACCCCGTTGCTGATCGCCTCGACACC
+CGTCAGCGCCGCACACCCCGACGAAAACGAGCGCGCCACCAAGAACACCAGCGCGAAACCGACGATCTGG
+CCGTGCTCTGCGTGCATTTCAAAAGCCGCGGACTCGGCCCGAACCGGATTGCCCAGCACGAAAATCCGGA
+ACAACCCCCACACGAGCATGGTGCCGATTCCGGCGATGAACGCATAGGTCGGGATCGCGAACGCCAACCC
+GGATTCCCGAACCCCACGCAAGTTCATCGCCATGATCAGCACGATCGCGCCGACGGCAAACAACACCTTG
+TGCTCGTACACGAACGGGCTCACAGAGCCGATGTTGGACGCCGCCGACGATATCGAAACAGCAACGGTGA
+GAACGTAATCCACCATCAGGGCGCTGGCAACCACGAGACCGCCGGTAGCACCCAGGTTGGTGGTGACAAC
+CTCGTAGTCGCCCCCACCGGAGGGGTAAGCGTGCACGTTCTGCCGGTAACTAGACACCACCACGAGCAGA
+ACCGCGGCGACCGCCAGGCCGATCAACGGCGCCATCGAATAGGCCGCCAGGCCGGCCACCGAGAGCACCA
+GAAATATCTCCTCGGGGGCGTAGGCTATCGACGACATCGCATCCGAGGCGAACACCGGCAAGGCGATCCG
+CTTGGGCAACAAGGTGTGACTGAGCCGGTCACTGCGAAACGGCCGGCCGATCAGCAACCGACGCGCCGCG
+GTTGAAAGTTTGGACACGAGAGCCAAGGGTAGGCCTATCCGAGCGTGGCGGTAGCGTTCCCTAGACGAGA
+ATGTTCGCCGACGTAAATCGGCTGGCCACCGCGGGTTGCCGATCGCGTACGGCGCACCGGACACAGCCGA
+GAGGACCTCTAATGCGGGTGGTTGTGATGGGGTGCGGCCGGGTCGGGGCTTCGGTGGCCGACGGACTGTC
+CCGGATAGGCCATGAAGTCGCGATCATCGACCGTGACAGCGCCGCCTTCAATCGGCTCAGCCCGCAGTTT
+GCCGGCGAGCGGGTGTTGGGTCAGGGCTTCGACCGAGATGTGCTGCTGCGTGCGGGCATCCAGGGGGCCG
+ACGCATTCGCCGCGGTGTCCTCCGGCGACAACTCCAACATCATCTCGGCGCGGTTGGCCCGGGAAACCTT
+CGGTGTGCCGCGCGTCGTCGCGCGGATCTATGATGCCAAGCGCGCCGAGGTCTATGAGCGACTCGGCATC
+CCCACCATTGCCACCGTTCCCTGGACCACCGATCGGCTGCTCAACGCGCTAATGCAGGACACCGAAACCG
+CCAAGTGGCGCGATCCTACCGGTACCGTCGCGGTCGCCGAGGTCGTCTTACACGAAGACTGGGTGGGCCA
+CCGGGCGACCGATCTTGAGCAGGCCACCGGCGCTCGGATTGCGTTTCTGATCCGATTCGGAACCGGTGTA
+TTGCCGGAACCGAAGACGGTCCTACAGGCCGGCGATAAGGTCTATATCGCTGCGATATCCGGCCGGGCCG
+CAGAGGCAGCGGCCATCGCAGCCTTGCCACCCAGTGAGGACTTCGAGTCGGGGGCTCGACGATGAAAGTA
+GCTGTCGCCGGAGCGGGTGCGGTGGGCCGCTCGGTCACCCGCGAACTCGTGGAAAACGGACACGACATCA
+CCCTGATCGAGCGCAACCCCGACCACCTCGACGCCGCCGCCATCCCGGAGGCGCATTGGCGGCTTGGCGA
+TGCCTGCGAACTGAGCCTGCTGGAGTCGATTCACCTCGAAGAGTTCGACGTGGTCGTCGCCGCCACCGGG
+GACGACAAGGTCAACGTGGTGCTCAGCCTGCTAGCCAAGACCGAATTCGCGGTGCCGCGGGTGGTGGCCC
+GGGTCAACGATCCCCGCAACGAGTGGCTGTTCAACGACGCCTGGGGGGTCGACGTCGCGGTGTCCACACC
+CCGCATGCTGGCGTCGCTGATCGAAGAGGCCGTCACGGTCGGCGACTTGGTGCGGCTGATGGAGTTCCGC
+ACGGGTCAGGCCAATCTGGTAGAGATCACCCTGCCCGACAACACGCCGTGGGGCGGCAAACCGGTGCGCA
+AACTTCAGCTGCCGCGGGATGCCGCGCTGGTGACAATCCTGCGCGGGCCACGAGTCATCGTGCCGGAGGC
+CGACGAGCCGCTGGAAGGCGGCGACGAGTTGCTCTTCGTCGCAGTCACCGAAGCCGAGGAGGAGCTGAGC
+AGGCTGCTGCTGCCGTCCATGTAACCGGCGGGCTCTACTCGCGGCCGGCGTCGGCGTCGAATTCAGCTGC
+ACCTCCGACGGCCGCGGCGTCGTGAGAGGCCAAGATGGCGCGCTGGGCTGCCTTGATTGCCGCGTAGGTG
+GCCAGCGCGGCGAGGGCGGTCAGCGGCCAACCCATCCCGATCCTGGCCACTCCCAGCCAACCCGTCTTAT
+CGGCGTCGTAGAGGTGCCTTTGGACGATGAACCGGGCAGCAAAAACCAGCGTCCAACCCAGGGTGGCGAC
+GTCAAACGCAAAGACAGCGCGGGACACGTCGCGCCAGGCGCGATCGCGCCCGCTGAGCCAGCTCCACAAG
+TAGCCGACTATCGGCCGCCGGATCAGGATCGACAGTGTGAAGACCACCGCCCACAGCAACGACATCCAGA
+TGCCCAGCAGGAAGTACCCCTTGGACTGTCCCACCAGGTACGCGATCAGCGCGCACACGGCTACCCCGCA
+GAATCCGGCAACCACCGGCCGCGCAGATTCCCGGCGCAAAAGCCGCCACAGCAGGATCAACCCCGCCATG
+CTCAGGGCGAACCCAATCGCGGGCAGCAAGCCGGCGGCGCTGGAAGCAACCACAAAAGTCACCACCGGTA
+ATGACGAATAGACCAGGCCGCTCACTCCGCCGGCCTGCGCCAACAGGCGCTGGGCGCTAGTGCGGTTAGC
+GTTCACGAGACACCGGCAATTCCGACTGCCGGATAGTCACCGCTGAATTTCGTAATGCGGGTTGTAGATA
+GCCTTCGTCCCATTTTCCAGCTTGCCCAGCCGGCCGCGCACCCGCAGGGTACGGCCCGTGTCGATGCCGG
+GTATCCGGCGTTGACCCAACCACACCAGCGTGACGGTGTCGCTGCCGTCGAACAATTCGGCGCTAACACC
+ACCCGAGCAACCCTTGCCATTGGTTTCCACGCTACGCAGGGTGCCAACCACCGTGACCTCCTGGCCGCGC
+TGGCAGTCGATCGCACGCTGTGCGCCGGCATTGAGCACCTCGTCGGATAACTCTTCGACGTCGCGTTGCT
+CCAGGTCCTCCGTCAACCGACGGGTGAGCCTGCGCAGATAACCCTGGGCCCCCATGGCCTCTCCTGACAC
+GTCACCTACGTTATGGAAGTTTCGTGCAACTGCCGGCGTATTCCACCTATGCCAACGGCCACCGTAGACC
+TGTTGGTTCCCGGGCGCCACCGTTGGCCTTGGAGCACCCCAAAGTGGCGGGCACTATCAAGGGATGGCTG
+TCGATTTGGATGGGGTCACAACCGTGTTGTTGCCGGGAACCGGATCGGACAACGACTACGTCCGGCGAGC
+ATTTTCCGCCCCCCTGCGACGCGCCGGGGCGGTGCTGGTGACGCCCGTTCCGCATCCTGGTCGCTTGATC
+GACGGCTATCGCGCCGCCCTGGACGACGCCGCGCGCGACGGGCCGGTTGTCGTCGGCGGCGTCTCGCTCG
+GAGCCGCAGTGGCGGCGGCGTGGGCGCTGGAACATCCCGATCGCGCGGTCGCCGTCCTGGCCGCCTTGCC
+GGCCTGGACCGGGGAACCTGAATTAGCACCTGCCGCGCAGGCAGCGCGGTATACGGCAGCGCGGCTGCGC
+TGCGACGGTCTGGCGGCGACGACCACACGCATGCGTGCATCTAGCCCCGTCTGGTTGGCCGAGGAGCTGA
+CCCGATCGTGGCGAGTTCAGTGGCCCGAGCTGCCCGATGCTATGGAGGAGGCGGCGGCCTATGTCGCCCC
+AAGCCGCGCCGAGCTGGCCCGGCTGGTCGCGCCGCTGGCCGTGGCCGCGGCGGTCGATGATCCGATCCAC
+CCGCTGCAGGTCGCTGCCGACTGGGTGTCCGTAGCTCCGCATGCGGCGCTACGGACGGTGACGCTGGACG
+AGATCGGCGCGGACGCCGCCGCGCTGGGCTCTGCCTGCCTGGCCGCTCTCGCCGAGGTCTCGGGCGCTTG
+ATCGCCTGTTTGTCCGACGGCGGAGTGCGCGTACCGTTTGGGTCGCCGAGCCTGTAATTTTGCAGGCCCC
+CACTCGCACTTTGCCTGCAGAGTTACAGCCTCAGCGAACAGCGCGCTCGTACTGTTGAGGTCGTCGAGCT
+AGTCCCGATCGCCCGACTCCTCCTCACGCCGCTACGCGGCGCGCTCGTACTGTTGGGGTCGTCGGGCTAG
+CCGCCCGTCGTGCTGCGCAACTGCTGCATCGCCGATCCTTGAGCGCCGCGGCGTGCAACCCCCGCGGCGG
+CTTGGCGTTGCGTGTCGGCCTGTGCCGCCGCAGCCTCCCTTAGTTGCGCCGCCATCGGCTCGGGCAGGTG
+CACCGGTAACGGCGTCCGTACCGGCAGCGGGGTATCGCCCCGGCGGACCACGGTGTCCGCCAACGCCTCA
+CGGGCCTCCTCGGTCAGCGCATCGACTGTCTCTTGTGGGCCGTTGACGACGCATCGGATCATCCAGCGGT
+AGCCGTTGACCCCGATGAAGCGCACCACACCGGCGGCGATGCCGATCACTTCGCGACCCCACGGGCCATC
+CTTGATCGAAACTTTGGCCGAGTCCTTGCGCAGCGAGTCGGCGAGTTCGCCGGCCACCTCACGCCAGAGC
+CCGCCGGTCTTAGGTGCCGCGTAGGCCGCAATGCTGTAGCGACCGTTGGGTGTGATGACCCACACCGCGC
+TGGGAACACCGCTCTCGGTCAGCTCGACCTGTACCTGACCCGCGGCCGGCATCGGAATCAGCACCGAGCC
+CAAGTCCAGCCGGGCCAGCACCGCCACCGAAGGGTCATCGAAGTCGTCGATGTCGAATGGGCCCTGAAGC
+TCCTCCTGGTCTTCGACGCCTGACGCGGCGGCAGCGCTGGCCACCACGGTGTCCTCCGGTCGGACGTGCT
+CGTCGGCCGGCTGGACGGGGGCGTGTCCGGCCTTGCGTTTGCCACCGTCTTTGCCTGTGCGTCTACCGAA
+TGCCATGGCGAGCGCCGCTCTCCCCCGTAAGCGGGTGGTACCCCCACCTCATCGCGCCCTCCTTTGCATC
+GTCGCCGGGGTCACAAACTCGCATGTCCGCCGGAGGAACCGTGGCCACCGTCGCCGCGGGATGTCGAGGC
+CAGCCCGGCCTCGTCGAACGACGAGACCTCGACCAGCTCGACCAACTCAACCCGTTGCACTAGCAACTGG
+GCGATTCGGTCACCGCGATGTACCACGATGGGCGCGGCTGGGTCCAAGTTGATCAGGGCCACCTTGATCT
+CCCCACGATAACCCGCGTCGATGGTGCCCGGACTGTTGACGATCGAAAGCCCCACCCGCGTGGCCAACCC
+GGAGCGCGGATGGACCAGCCCGACCATGCCGAACGGGACGGCGACCGCAACACCCGTCCGTACCAGGGCG
+CGGCGCCCAGGTGCCAGCTCGACGTCTTCGGCGCTGTAGAGATCAACGCCGGCGTCGCCGTCGTGAGCGC
+GGCTGGGCAGCGGGAGCCCGGGGTCGAGGCGGACGATCGCCAGAGTGGTCGACACGGGGCCACAGACTAC
+CCTTGACCGCGTGTCTGGGACGCGCCTCGCGCCGCACAGCGTGCGATACCGCGAGCGATTGTGGGTGCCC
+TGGTGGTGGTGGCCATTGGCTTTCGCGCTAGCGGCGCTTATCGCGTTTGAAGTAAACCTGGGCGTTGCGG
+CCCTACCCGACTGGGTACCGTTCGCAACGCTTTTCACAGTCGCAGCCGGGACGCTGCTATGGCTCGGACG
+TGTCGAAATTCGGGTCACCGCCGGCTCAGCGGATGGAGCCGGAGTGAAGCTATGGGCCGGACCAGCGCAT
+CTGCCGGTAGCCGTGATCGCCCGATCAGCCGAAATCCCGGCCACGGCTAAATCTGCGGCGCTGGGCCGAC
+AACTCGATCCGGCAGCTTACGTCCTGCATCGGGCCTGGGTGGGGCCCATGGTTCTGGTTGTCCTCGACGA
+CCCCAACGATCCCACGCCGTACTGGTTGGTGAGCTGCCGCCACCCGGAGCGGGTGTTGTCGGCGCTGCGC
+AGCTGACCTATCAGGCGGCGCAGTCGGTGCAGATCATCACGCCGTTCTTCTCGCTGGCCAACCTGCTGCG
+GTGTTGCACCAAAAAGCAACTCGAGCAGGTGAATTCGTCAGCTTGCTTGGGTACGACGCGCACCGACAGT
+TCTTCGCCGGACAGGTCGGCGCCAGGCAGTTCGAAGGACTCGGCGGATTCGGATTCGTCCACGTCGACCA
+CGGCCGACGCCGCCTCGTTCCGTCGTGCTTTGAGCTCTTCAAGCGAGTCCTCCGAGACATCATCGGTCTC
+GGTACGCCGCGGAGCGTCATAGTCGGTAGGCATTCCTATCCCCTCACATGCCTCATAACTTCAAGCAACG
+CTTTGTACCAGCGTCGAACGCGTCCACCAAACGATTCGTGCCCGTATCGTGGCCTATTCAAGTGTGATTT
+ACATCACATATTCATATTGCACCTTGTACGCGGCCCTAAACGGTGCCTTTTTGGGTGCGAACTACACCCA
+ATGGTCCGCCTCCTCACCGCGCCGTGCCGGCACGCGTCGTCAGCGGATTAAAGTGCACGTGTGGTCGCAC
+AAATCACCGAGGGTACCGCTTTCGACAAGCACGGACGGCCCTTTCGGCGACGCAACCCCCGACCCGCTAT
+CGTCGTGGTGGCCTTCCTCGTGGTGGTGACTTGCGTGATGTGGACTCTTGCACTGACGCGGCCCCCAGAT
+GTCCGCGAGGCCGCAGTCTGCAACCCGCCTCCGCAGCCGGCGGGGTCAGCACCGACCAACCTTGGTGAAC
+AGGTGTCGCGGACGGACATGACCGATGTCGCACCCGCCAAACTGAGCGACACCAAAGTCCACGTCCTCAA
+CGCCAGCGGCCGGGGCGGCCAAGCCGCCGATATCGCTGGCGCACTGCAAGATCTGGGCTTCGCCCAGCCG
+ACCGCCGCCAACGACCCGATCTATGCCGGCACCCGGCTGGACTGCCAAGGCCAGATCCGCTTCGGTACGG
+CGGGGCAAGCCACCGCTGCCGCACTATGGCTGGTAGCGCCGTGCACCGAGCTGTATCACGACAGCCGCGC
+CGACGATTCCGTCGACCTTGCGCTCGGCACCGACTTCACCACGCTGGCACACAACGACGACATCGACGCC
+GTGCTTGCCAACCTGCGCCCCGGCGCCACCGAGCCCTCAGATCCCGCGCTGCTGGCCAAGATCCACGCCA
+ACAGCTGCTGATCGGCCGGCTCAGTCCGGGATCGGCTCTAGGCCGTTGAATCGCTGTAGCGCCGCCAACA
+GCTCGTCGGCGATTCCGGGCGCGGCAGCCACCACCACCAACCCCGCGCCGCCCGCTCTCGGCGTTGACAA
+CAACACGCGGGCCCCCGCCTCAGCGGCGATCAACGCACCTGCCGCACAGTCCCACACCTGCACCCCGTGC
+TCGTAGTAGGCGTCCAGCCGACCCGCCGCTACCATGCACAAGTCCAGCGCCGCAGAACCGATCCGACGCA
+CGTCGCGGACCAACGGCACAACATGAGCCAGCAATTCTGCCTGCTTCTCGCGGCACCGAACCGAGTACCC
+GAAGCCGGTACCCAGCAACGCCATCGACAACTCGTCGACACCGGTGCACCGCAACACATGTCTCCCCCGC
+TCATCGGTGAGATGTGCGCCGAGGCCCGTCGCCGCCGAATACACCGTGCGAGCGGCGACGTCGGCGACCG
+CGCCCGCCACCGTGATGCCGCCAACCTGTGCCCCAATCGACACCGCGTACGCCGGGATGCCGTAGACGAA
+ATTCACCGTGCCGTCGATGGGGTCGAGCACCCAAGTGACCCGGTCGGAGGGTGTAGCCGTCACGTCGGCG
+GGACCACCACCTTCCTCCCCGAGAATCGGGTCACCGGGCCGAAGTTGAGCCAACCGATCACGCAAGAGCC
+GCTCCGTGTCGGTGTCGACCACGGTCACCGGATCGGTCGGGCTGCTCTTCGCGCGCACCGCGCCGTCGCC
+GTCGCCCGCCCTGGAGATGCCGAAAACCTCGGCCCGACGACCGCGAACGAAGGCCGCCGCCTCGGCAGCA
+AGGTTTTCGGCCACAGAGCGCAGCCGCGCGGGTTCGTTGTCAGGTCGTGTCACCGGCCTATCGCATCACA
+GTCGCCACCCGCATGGTGGCGTGGACTCCAGCGGCCATAACGCCCTCGCAACTGCCGGGCCGCAGTTTAA
+GGTGAGGGTCATCCACGTCTCGCCGAGGAGATTCGATGACCAGCACCGGCCCCGAGACGTCCGAAACACC
+GGGTGCCACGACACAGCGTCATGGCTTCGGCATCGACGTCGGCGGCAGCGGCATCAAGGGCGGAATCGTC
+GACTTGGACACCGGCCAGCTGATCGGCGACCGGATCAAGCTGCTGACCCCGCAACCGGCCACTCCGTTGG
+CGGTCGCCAAAACCATCGCCGAGGTCGTCAACGGTTTCGGCTGGCGGGGTCCGCTGGGGGTGACCTATCC
+CGGCGTCGTCACTCACGGCGTCGTCCGGACCGCGGCTAACGTGGACAAGTCCTGGATAGGGACCAACGCA
+CGCGACACTATCGGCGCCGAGCTGGGCGGTCAGCAGGTCACCATCCTCAACGACGCTGATGCCGCCGGGC
+TGGCCGAGACACGCTACGGGGCCGGCAAGAACAACCCTGGCTTAGTGGTACTGCTCACATTCGGAACCGG
+GATCGGGTCCGCGGTCATCCACAACGGGACGTTGATACCCAACACCGAGTTCGGACATCTTGAGGTCGGC
+GGCAAGGAAGCGGAGGAAAGGGCCGCCTCCTCGGTAAAGGAAAAGAACGACTGGACCTATCCAAAGTGGG
+CCAAGCAGGTGACACGCGTGCTCATCGCCATCGAGAACGCGATCTGGCCTGACCTGTTCATCGCCGGCGG
+CGGCATCAGCCGCAAGGCCGACAAATGGGTGCCGCTACTGGAAAACCGCACACCAGTAGTGCCCGCGGCC
+CTGCAGAACACCGCCGGAATTGTCGGTGCGGCCATGGCCTCTGTCGCAGATACGACGCACTGAAACTTGC
+CCGCTCGGGCTGTACTCGTGCGCAGTAAAGTTACAATGGTCAGCGGCGGCCGCCCGACCGATAGCGCGCG
+AGTATTCACGCTGATATCAACGCCGACATTCGACATAGCAGACACTTTCGGTTACGCACGCCCAGACCCA
+ACCGGAAGTGAGTAACGACCGAAGGGGTGTATGTGGCAGCGACCAAAGCAAGCACGGCGACCGATGAGCC
+GGTAAAACGCACCGCCACCAAGTCGCCCGCGGCTTCCGCGTCCGGGGCCAAGACCGGCGCCAAGCGAACA
+GCGGCGAAGTCCGCTAGTGGCTCCCCACCCGCGAAGCGGGCTACCAAGCCCGCGGCCCGGTCCGTCAAGC
+CCGCCTCGGCACCCCAGGACACTACGACCAGCACCATCCCGAAAAGGAAGACCCGCGCCGCGGCCAAATC
+CGCCGCCGCGAAGGCACCGTCGGCCCGCGGCCACGCGACCAAGCCACGGGCGCCCAAGGATGCCCAGCAC
+GAAGCCGCAACGGATCCCGAGGACGCCCTGGACTCCGTCGAGGAGCTCGACGCTGAACCAGACCTCGACG
+TCGAGCCCGGCGAGGACCTCGACCTTGACGCCGCCGACCTCAACCTCGATGACCTCGAGGACGACGTGGC
+GCCGGACGCCGACGACGACCTCGACTCGGGCGACGACGAAGACCACGAAGACCTCGAAGCTGAGGCGGCC
+GTCGCGCCCGGCCAGACCGCCGATGACGACGAGGAGATCGCTGAACCCACCGAAAAGGACAAGGCCTCCG
+GTGATTTCGTCTGGGATGAAGACGAGTCGGAGGCCCTGCGTCAAGCACGCAAGGACGCCGAACTCACCGC
+ATCCGCCGACTCGGTTCGCGCCTACCTCAAACAGATCGGCAAGGTAGCGCTGCTCAACGCCGAGGAAGAG
+GTCGAGCTAGCCAAGCGGATCGAGGCTGGCCTGTACGCCACGCAGCTGATGACCGAGCTTAGCGAGCGCG
+GCGAAAAGCTGCCTGCCGCCCAGCGCCGCGACATGATGTGGATCTGCCGCGACGGCGATCGCGCGAAAAA
+CCATCTGCTGGAAGCCAACCTGCGCCTGGTGGTTTCGCTAGCCAAGCGCTACACCGGCCGGGGCATGGCG
+TTTCTCGACCTGATCCAGGAAGGCAACCTGGGGCTGATCCGCGCGGTGGAGAAGTTCGACTACACCAAGG
+GGTACAAGTTCTCCACCTACGCTACGTGGTGGATTCGCCAGGCCATCACCCGCGCCATGGCCGACCAGGC
+CCGCACCATCCGCATCCCGGTGCACATGGTCGAGGTGATCAACAAGCTGGGCCGCATTCAACGCGAGCTG
+CTGCAGGACCTGGGCCGCGAGCCCACGCCCGAGGAGCTGGCCAAAGAGATGGACATCACCCCGGAGAAGG
+TGCTGGAAATCCAGCAATACGCCCGCGAGCCGATCTCGTTGGACCAGACCATCGGCGACGAGGGCGACAG
+CCAGCTTGGCGATTTCATCGAAGACAGCGAGGCGGTGGTGGCCGTCGACGCGGTGTCCTTCACTTTGCTG
+CAGGATCAACTGCAGTCGGTGCTGGACACGCTCTCCGAGCGTGAGGCGGGCGTGGTGCGGCTACGCTTCG
+GCCTTACCGACGGCCAGCCGCGCACCCTTGACGAGATCGGCCAGGTCTACGGCGTGACCCGGGAACGCAT
+CCGCCAGATCGAATCCAAGACTATGTCGAAGTTGCGCCATCCGAGCCGCTCACAGGTCCTGCGCGACTAC
+CTGGACTGAGAGCGCCCGCCGAGGCGACCAACGTAGCGGGCCCCCATGTCAGCTAGCCGCACCATGGTCT
+CGTCCGGATCGGAGTTCGAATCAGCCGTCGGCTACTCGCGCGCGGTACGCATCGGGCCACTCGTGGTGGT
+GGCCGGAACGACCGGCAGCGGCGATGATATCGCCGCTCAGACGCGAGACGCTCTGCGCCGCATCGAGATT
+GCGCTCGGACAGGCCGGCGCAACTCTGGCCGACGTGGTCCGTACCCGCATCTATGTGACCGATATTTCCC
+GCTGGCGCGAGGTCGGCGAAGTGCATGCACAGGCTTTCGGCAAGATCCGTCCGGTGACGAGCATGGTCGA
+GGTTACCGCGCTGATTGCGCCCGGCCTGCTGGTAGAGATCGAGGCCGACGCCTACGTAGGGTCGGCGGTT
+GCAGACCGAAATTCGGGAGCCGGCCCGAAGGACCCGTCACCAGCCGGTGGGTAGGCGGCGGCCCCAATCA
+CAGCGCGCACCGGCAGTGGGCCGTAGAGATGCGGGAAAAGCATCGACCGCGGATCAGTAGGCACGCCCGG
+CTCCCAACGCACGGGTGAGTCGAGCGCCGCCGGGTCGATGTACAGCAGCACCAGGTCAGCACGGCCACGG
+TAAAGGCGGTTGGCGGGCAGGTGAACCTGCTCGAGTGTCGACAGGTGGATATACCCCGTCTTGTCGGACT
+CGGGATAGATCCCACCGCGTTCTCGGGCATGCGACCACTCCTGCACCCCGCATAGGTGCACCAGCATGGC
+AGGATCGGGCGTCATTCTCACCACCCTGCCCGATTGGCGGGGGCGAAAGTCGTGAGAAATGACACACCCG
+ACAGCGGCCGGGGAACACGGCGAGAACCCCGAACGTCTGAGAAGGTGAAGATACCCGAGAACGGAGAGCC
+ATGAACGCAACTCTGACCAGTCCTGAGCTGACTAGAGCAGACCGCTGCGACCGCTGTGGCGCTGCAGCTC
+GGGTGCGCGCCAAGCTGCCCTCCGGAGCCGAGCTTCTTTTCTGCCAGCATCACGCCAACGAGCACGAGGC
+GAAACTGACCGAGATGTCCGCCGTGCTGGAGGTCAGCGGGAGCGAATAGACCGAACTCACCCGTCCACAA
+TGCCGGTAGCGCGCGCAGTTTTCGGTAATGCTGGACTGGTATGAGCGACCAGGTCCCCAAGCCACACCGC
+CACCACATCTGGCGAATCACCCGTAGGACTTTGTCCAAAAGCTGGGACGACTCGATCTTCTCGGAGTCAG
+CGCAAGCGGCTTTTTGGTCGGCCTTGTCTTTGCCGCCGCTACTGCTGGGAATGCTGGGCAGTCTGGCCTA
+CGTTGCTCCGCTATTCGGCCCGGACACCTTGCCCGCGATTGAAAAGAGCGCGCTTTCGACGGCCCACAGC
+TTTTTCTCCCCCAGTGTGGTCAACGAGATCATCGAGCCCACCATCGGCGATATCACCAACAACGCCCGCG
+GTGAGGTGGCGTCGCTGGGCTTCTTGATCTCGCTGTGGGCAGGATCGTCGGCAATCTCGGCGTTCGTCGA
+TGCAGTGGTGGAAGCGCACGACCAGACACCGCTACGCCACCCGGTCCGGCAACGCTTCTTTGCGCTCTTC
+CTCTACGTGGTGATGTTGGTGTTCCTAGTAGCGACCGCACCGGTAATGGTGGTGGGTCCACGCAAGGTAA
+GCGAGCACATCCCGGAGAGCTTGGCCAACCTGCTGCGCTACGGCTACTACCCCGCGCTTATTCTCGGTCT
+AACCGTCGGGGTCATCCTGCTATACCGGGTGGCACTACCGGTACCCCTGCCGACGCATCGGCTGGTCCTA
+GGCGCGGTGCTTGCGATAGCGGTCTTCCTGATCGCCACCTTGGGCTTGCGGGTCTACCTCGCGTGGATCA
+CCCGCACTGGCTACACCTACGGAGCGCTGGCCACGCCGATCGCGTTTCTGTTATTCGCCTTCTTTGGCGG
+CTTTGCGATCATGCTCGGCGCTGAACTCAACGCCGCCGTCCAGGAGGAATGGCCGGCGCCGGCGACGCAT
+GCCCACCGACTGGGCAATTGGCTAAAGGCCCGCATCGGCGTCGGCACGACGACGTATTCTTCGACAGCCC
+AGCACAGCGCCGTCGCTGCCGAGCCGCCGAGCTAGTCAGCCCTTCTTGAGGGTGTCGTAAATCCGCTTGC
+AATCGGGACAGACCGGCGAGCCCGGCTTGGGCGCGCGGGTAACGGGAAACACCTCGCCACACAACGCCAC
+CACGTGGCTACCCATGACCGCGCTCTCAGCGATCTTGTCTTTCTTGACGTAGTGGAAGTATTTCGGTGTG
+TCGCTGCCGGTCCCGTCGTCGACGCGTTCGTCGGCGTCGGTACGTTCAATCGTCTGGGTCTGCATACCTG
+ACATTGTGCCCTTGGCAGGAAAGCTCTCGAAGCCGGAGTGCACTGCATGTGGGACAGTAGAGTAATGAAG
+CACGGCTTGAGGCTGGGTTTCAATGGCCAGTTCGACGACTTCGACGACTTCGACGATAAGGGCCGGCCGG
+TACTGATTAGTGCCGCCGCTCCCTCGTATGAGGTGGAGCATCGCACACGGGTGCGTAAGTACCTGACCCT
+GATGGCATTCCGGGTCCCCGCGCTCATTCTGGCCGCCATCGCCTACGGCGCCTGGCACAACGGACTGATC
+TCGCTACTGATCGTGGCAGCCTCGGTGCCGTTGCCATGGATGGCCGTTCTGATCGCTAACGACCGACCGC
+CGCGCCGCGCCGACGAACCCCGCCGCTTCGACGTCGCCCGCCGGCGCATCCCGCTGTTCCCGACCGCCGA
+ACGGCCCGCACTCGAGCCGCGGCGACAGCCGGCAGAGCGGTCAGCCCCGCGGGGATTCGCCGACCACGGT
+TAGCCGTCTGTTGGCCGGCGTTCCGGGTTGTCGGCCACTGGCCACACTTCTCAGGACTTTCTCAGGTCTT
+CGGCAGATTCCTGCACGTCACAGGGCGTCAGATCACTGCTGGGTGGGAACTCAAAGTCCGGCTTTGTCGT
+TAAACCCCATGACAGTGCAAGCCGATCGGGAGGTCGCTATGGCCGATGCACCCACAAGGGCCACCACAAG
+CCGGGTTGACAGCGATCTGGATGCTCAAAGCCCCGCGGCAGACCTCGTGCGCGTCTATCTGAACGGCATC
+GGCAAGACGGCGTTGCTCAACGCCGCCGGTGAAGTCGAACTGGCCAAGCGCATAGAAGCCGGGTTGTATG
+CCGAGCATCTGCTGGAAACCCGGAAGCGCCTCGGCGAGAACCGAAAACGCGACCTGGCGGCCGTGGTGCG
+TGATGGCGAGGCGGCGCGCCGCCACCTGCTGGAAGCAAACCTGCGGCTGGTGGTATCGCTGGCCAAGCGC
+TACACGGGTCGGGGCATGCCGTTGCTGGACCTCATCCAGGAGGGCAACCTGGGTCTGATCCGAGCGATGG
+AGAAGTTCGACTACACAAAGGGATTCAAGTTCTCAACGTATGCCACGTGGTGGATCCGCCAGGCCATCAC
+CCGCGGAATGGCCGACCAGAGCCGCACCATCCGCCTGCCCGTACACCTGGTTGAGCAGGTCAACAAGCTG
+GCGCGGATCAAGCGGGAGATGCACCAGCATCTGGGTCGCGAAGCCACCGATGAGGAGCTCGCCGCCGAAT
+CCGGCATTCCAATCGACAAGATCAACGACCTGCTGGAACACAGTCGCGACCCGGTTAGTCTGGATATGCC
+GGTCGGCTCCGAGGAGGAGGCCCCTTTGGGCGATTTCATCGAGGACGCCGAAGCCATGTCCGCGGAGAAC
+GCGGTCATCGCCGAACTGTTACACACCGACATCCGCAGCGTGCTGGCCACTCTCGACGAGCGTGAGCACC
+AGGTGATCCGGCTGCGCTTCGGCCTGGATGACGGCCAACCACGCACCCTGGATCAAATCGGCAAACTATT
+CGGGCTGTCCCGTGAGCGGGTTCGTCAGATCGAGCGCGACGTGATGAGTAAGCTGCGGCACGGTGAGCGG
+GCGGATCGGCTGCGGTCGTACGCCAGCTGAAGCTGGACATCCTGAGCCAGGTAGCAGACGGTATGCCCGC
+CGCGCCAGCGGCGGGCATACCGCTGCGGTGGGGCGGCGGGCAACCATTTTCGCAGCTGGCCAAGTAGACT
+CAGCTGCAATGGAGGGTGCTGAATGAACGAGTTGGTTGATACCACCGAGATGTACCTGCGGACCATCTAC
+GACCTCGAGGAAGAGGGCGTGACGCCACTGCGTGCCCGGATCGCCGAGCGGCTCGACCAGAGCGGGCCGA
+CGGTCAGCCAGACCGTGTCCCGGATGGAGCGCGATGGGCTACTTCGGGTGGCTGGCGATCGCCACCTGGA
+GCTCACCGAAAAGGGCCGCGCGCTGGCCATCGCCGTGATGCGCAAGCACCGCCTCGCCGAACGGCTCCTC
+GTCGATGTCATCGGGTTGCCGTGGGAAGAAGTTCACGCCGAGGCATGCCGGTGGGAGCACGTGATGAGCG
+AGGACGTCGAGCGACGGCTGGTCAAGGTGCTCAACAACCCGACCACGTCCCCGTTCGGCAACCCGATCCC
+GGGCCTGGTGGAACTTGGCGTGGGCCCGGAACCGGGCGCCGACGACGCCAACCTGGTCCGGTTGACCGAG
+TTGCCGGCCGGCTCGCCGGTCGCAGTCGTCGTCCGCCAGCTTACCGAGCACGTTCAGGGCGACATCGACC
+TGATCACGCGGCTAAAAGACGCCGGCGTGGTGCCCAACGCACGAGTAACCGTCGAAACCACCCCAGGCGG
+CGGCGTGACCATCGTCATCCCGGGCCATGAGAACGTCACCCTGCCACACGAGATGGCCCACGCGGTCAAG
+GTCGAGAAAGTCTGAGCTAACCCGCACCTACCCTGCGCGTTGACCGAACGCACGTCGAGGCGGCAGTCGT
+ATTCCGAGTTGTTCAGCCCGTTGGTAGCCGGTGACCGCGATGTCACGGATGTGCTCAGGTCGCAGACCAG
+ACTGCAGTGCCGTGTCCAGCATGCCCGCCATCCGATGGCCCGGCTCACAGCACAGCGCAGCCTGCAGCGA
+AACACCGGCCAGCGGCCCGTCACCGCGGGCATAGGCGCTGAACGCGAGCAACACCAGGGCCTCCACCCGC
+CACGGTTCGGGCAGCACCCGCGCCAGTAACGCCCACAATGACTCGGCCGCACCAGCATTCTCGCCGACGG
+CAAGGGCATACAGCATGTCGCGGACCCGCGCGTCGCCCAGTGCGCAACCCAGCCGCGCCAGCTCCGTGTC
+GGACAAGGACTGACCGTCTGCGACCCGGGCCGCGGCGGCCAGCGCATTTTCCACATCCTGGCGGCTGCAG
+CCGACCGAATCAGCACGGTGTGCGATCTCTCGGTCAGCCGCTTGGTGTCCTAGCGCAACGGCAAGCTCGG
+CGGAGCGCACAGGGTCGTCCACGGCGATGACGGCCTGCAGGTCGGAGCGCCGCGGGTAGAGCTGCCTGCC
+GTCCAGCACCGCCGCCATCGCCAACGGCGACGCCGACGGATCGTCGATAACGCCGCTGCAGCCGCAGCCG
+TCCACACAATGCCAGCGCCCGCCAGCGGCTACCCGGTCTACCACGTGCGCTGCCCATAGCACGATGTCGC
+GCTGCGACAACGCCGCCGCGAGCGCCGCGCACAGCTGCCGGTACTCCTCATTGCATCGCGGACACTGGGC
+TCCGTTCGCGTCAACGATCACCGCGATCGCGGCCGCCGGGTTCGCCGCGGCGACAAGTTCTGCGAGATGG
+CCAACCCGATCGGCGAGTTCATCACAGAGGTCGGCGCGCATCACCGACCCTAGTTCCCCCGCTGCCAACG
+ACACCAGAACCAGCGATTTTTCCGGCACGAAGCCGAGGATGGCCGGTAGCGCGGCGATCAGTGTTGCAGG
+GCGGTTGAGTTCAAATTGTCCTCGATACTTCGTCATGAATGCCACGCTGACTACCGGCACCGTCAGCCGG
+TGCCCACGTCACGCGATCGAGCTGCCTTCCTGTGGACGAAGGCGTAACTGTGCGTTCTACTGTCATTTCA
+TGGGGTCGATGCGTGAATACGACATCGTGGTGATCGGGTCAGGCCCGGGCGGACAGAAAGCCGCCATCGC
+CTCGGCGAAGCTGGGCAAGTCCGTGGCCATCGTCGAACGCGGCCGAATGCTCGGCGGCGTCTGCGTCAAC
+ACAGGCACGATCCCATCCAAAACGTTGCGTGAGGCTGTGCTCTACCTCACCGGCATGAACCAACGCGAGC
+TGTACGGCGCAAGCTACCGCGTGAAGGACCGGATCACCCCGGCCGACCTGTTGGCGCGGACCCAGCACGT
+GATCGGCAAGGAAGTCGACGTGGTGCGCAACCAGCTGATGCGTAACCGCGTCGATCTGATCGTGGGCCAT
+GGCCGGTTCATCGACCCGCACACCATCCTCGTGGAGGACCAGGCCCGCAGGGAAAAGACCACCGTCACCG
+GCGACTACATCATCATCGCCACTGGCACCAGGCCGGCACGGCCATCCGGAGTCGAATTTGACGAAGAACG
+GGTGCTCGACTCCGACGGGATCCTCGATCTCAAATCGCTGCCATCCTCGATGGTCGTGGTCGGTGCCGGC
+GTGATCGGCATCGAATACGCCTCCATGTTCGCTGCGTTGGGCACCAAAGTCACCGTCGTGGAGAAGCGGG
+ACAACATGCTGGACTTCTGCGACCCCGAGGTCGTCGAGGCGCTGAAATTCCACCTGCGCGACCTGGCGGT
+GACATTCCGGTTCGGCGAGGAAGTGACCGCGGTCGATGTCGGCTCTGCGGGCACCGTGACCACCCTGGCC
+AGCGGCAAACAGATTCCAGCCGAGACCGTAATGTACTCGGCGGGACGTCAGGGACAAACCGACCACCTCG
+ACCTGCACAACGCCGGACTCGAGGTGCAGGGCCGCGGGCGGATCTTCGTAGACGACCGTTTCCAGACCAA
+GGTAGACCACATCTACGCCGTCGGCGACGTCATTGGCTTCCCCGCCTTGGCCGCGACGTCGATGGAGCAG
+GGGCGGCTGGCCGCCTACCACGCCTTCGGCGAACCAACCGACGGAATCACCGAACTTCAGCCGATCGGTA
+TTTATTCGATTCCCGAGGTGTCCTACGTCGGCGCCACCGAGGTGGAACTGACCAAGAGCTCCATCCCATA
+CGAGGTGGGAGTGGCCCGCTACCGGGAGCTGGCCCGCGGCCAAATCGCCGGCGACTCCTACGGCATGCTC
+AAGCTGCTGGTTTCCACCGAGGATCTCAAGCTGCTCGGCGTGCATATCTTCGGCACCAGCGCCACCGAGA
+TGGTGCACATCGGGCAGGCCGTGATGGGATGCGGGGGCAGCGTCGAGTACCTGGTCGACGCGGTGTTCAA
+CTACCCGACCTTCTCGGAGGCCTACAAGAACGCCGCACTGGACGTGATGAACAAGATGCGCGCACTCAAC
+CAGTTCCGCCGCTGAGGGTGCCGAGCGGATGTGAATCCGTCTCGGCGCCCAAGTAGGCTTGCCAGCAAAT
+TCGCCGCCGCCCACGAACGGTCGGCGTCGAACGTGGCCCCGCGCTTTTGGCGTTGTGCAGCACAGCGGCA
+GCCAGGGTTGGCTGTTCAATCATTGCTGTCCGCTGATTTGAGGGACACTGGTTACGGCACCTCGGCGACA
+ACCCCGAGAGGAGGCAACACCCATGGCTCGCGATCAAGGCGCAGACGAAGCGCGAGAATATGAGCCGGGG
+CAACCCGGCATGTACGAGCTTGAGTTCCCGGCGCCTCAGCTGTCGTCGTCCGACGGCCGTGGTCCGGTGT
+TGGTGCACGCTTTGGAAGGTTTCTCCGACGCCGGCCATGCGATCCGGCTGGCCGCCGCCCACCTCAAGGC
+GGCCCTGGACACAGAGCTGGTCGCGTCCTTCGCGATCGATGAACTACTGGACTACCGCTCGCGGCGGCCA
+TTAATGACTTTCAAGACCGATCATTTCACCCACTCCGATGATCCTGAGCTAAGCCTGTATGCGCTGCGCG
+ACAGCATCGGCACCCCATTTCTGCTGCTGGCGGGTTTGGAGCCGGACCTGAAGTGGGAGCGGTTCATCAC
+CGCCGTCCGATTGCTGGCCGAGCGCCTGGGTGTACGGCAGACCATCGGCCTGGGCACCGTCCCGATGGCC
+GTTCCGCACACACGACCGATCACGATGACCGCTCATTCCAACAACCGGGAGCTGATCTCCGATTTTCAAC
+CGTGGATCTCCGAAATCCAGGTCCCGGGTAGCGCTTCCAACCTACTGGAATACCGGATGGCCCAGCACGG
+TCATGAGGTCGTCGGGTTCACCGTGCACGTCCCGCACTATCTCACGCAGACCGACTATCCCGCGGCCGCC
+CAAGCGCTGCTCGAACAAGTGGCCAAGACCGGTTCTCTGCAGCTGCCGCTGGCCGCGCTAGCCGAAGCAG
+CCGCAGAGGTCCAGGCCAAGATCGACGAGCAGGTCCAGGCAAGCGCCGAAGTGGCTCAAGTGGTGGCGGC
+CCTTGAGCGCCAGTACGATGCCTTCATCGACGCTCAGGAGAACAGGTCGTTGCTAACGCGCGACGAAGAT
+CTACCGAGCGGCGACGAGCTCGGTGCCGAGTTTGAGCGGTTCCTGGCTCAGCAGGCCGAGAAGAAGTCCG
+ACGACGACCCGACCTAACGCCGCGAAAGCGGCCCACAAAACGGCCCCAGTCGGCCCGACAACAAGATTGG
+CGAGGATGACCGAGCGGAAGCGAAATCTTCGGCCAGTGCGCGACGTGGCACCGCCTACGCTGCAGTTCCG
+CACCGTCCACGGTTATCGGCGGGCATTCCGGATCGCCGGTTCCGGGCCGGCGATTCTGCTTATCCACGGG
+ATAGGTGACAATTCCACCACCTGGAATGGGGTGCACGCCAAGCTCGCCCAACGATTCACCGTCATCGCTC
+CGGATCTACTGGGCCACGGGCAATCCGACAAGCCGCGTGCCGACTATTCGGTTGCGGCTTACGCCAACGG
+CATGCGGGACCTCCTCAGCGTGCTCGACATCGAGCGGGTGACCATCGTGGGCCATTCGCTCGGCGGCGGG
+GTAGCAATGCAATTCGCCTACCAGTTCCCTCAGCTAGTCGACCGACTGATCCTGGTCAGCGCGGGCGGTG
+TCACCAAGGACGTCAACATCGTCTTCCGGTTGGCCTCGTTGCCCATGGGCAGCGAGGCTATGGCCTTGCT
+ACGGTTGCCGCTGGTGCTGCCGGCAGTGCAAATCGCCGGGCGGATCGTGGGTAAGGCCATCGGTACCACC
+AGCTTGGGGCACGACCTGCCCAATGTGCTGCGCATTTTGGACGACCTGCCAGAGCCGACGGCTTCTGCGG
+CGTTCGGCCGCACCCTGCGGGCAGTGGTGGACTGGCGGGGGCAGATGGTCACCATGCTGGACCGATGCTA
+TTTGACCGAAGCCATCCCGGTACAGATCATCTGGGGCACAAAGGATGTCGTGCTGCCAGTCCGTCACGCT
+CACATGGCGCATGCCGCCATGCCGGGCTCGCAATTGGAGATTTTCGAGGGCTCGGGACATTTCCCGTTTC
+ACGACGACCCTGCGCGCTTCATCGACATCGTCGAACGCTTCATGGACACCACTGAGCCCGCCGAATACGA
+CCAGGCCGCGCTGCGCGCGTTGCTTCGCCGGGGTGGCGGCGAAGCAACCGTCACCGGCTCGGCAGACACC
+CGTGTTGCAGTACTGAACGCCATCGGGTCCAACGAACGCAGCGCTACCTGATCACCACCGGGTCTGTTAG
+GGCTCTTCCCCAGGTCGTACAGTCGGGCCATGGCCATTGAGGTTTCGGTGTTGCGGGTTTTCACCGATTC
+AGACGGGAATTTCGGTAATCCGCTGGGGGTGATCAACGCCAGCAAGGTCGAACACCGCGACAGGCAGCAG
+CTGGCAGCCCAATCGGGCTACAGCGAAACCATATTCGTCGATCTTCCCAGCCCCGGCTCAACCACCGCAC
+ACGCCACCATCCATACTCCCCGCACCGAAATTCCGTTCGCCGGACACCCGACCGTGGGAGCGTCCTGGTG
+GCTGCGCGAGAGGGGGACGCCAATTAACACGCTGCAGGTGCCGGCCGGCATCGTCCAGGTGAGCTACCAC
+GGTGATCTCACCGCCATCAGCGCCCGCTCGGAATGGGCACCCGAGTTCGCCATCCACGACCTGGATTCAC
+TTGATGCGCTTGCCGCCGCCGACCCCGCCGACTTTCCGGACGACATCGCGCACTACCTCTGGACCTGGAC
+CGACCGCTCCGCTGGCTCGCTGCGCGCCCGCATGTTTGCCGCCAACTTGGGCGTCACCGAAGACGAAGCG
+ACCGGTGCCGCGGCCATCCGGATTACCGATTACCTCAGCCGTGACCTCACCATCACCCAGGGCAAAGGAT
+CGTTGATCCACACCACCTGGAGTCCCGAGGGCTGGGTTCGGGTAGCCGGCCGAGTTGTCAGCGACGGTGT
+GGCACAACTCGACTGACGTAGAGCTCAGCGCTGCCGATGCAACACGGCGGCAAGGTGATCCTGCAGGGGT
+TGCCCGACCGCGCGCATCTGCAACGAGTACGAAAGCTCGTCGCCGTCGATGCGGTAGGAACGGTCAAGGG
+CGGTCACCTCTTTTGCGGTCGGGGCCAATCCGATCGACCCATCCGCGCGTGTGGACAATTCGAGTTCGAT
+GACGTCACCGGTCACCGAATAGGTTCCAACCTCAATTTCGGTGATGCCGCTTGGATGGGCGAGAACGAGT
+TCAACGCAGCCCGGTCGGCAAACGCGGAGATACCCCGTCTCGGAATGCAGCGGCTTCCCGTCAGCTACCG
+CCCTGGTCTGCTGTGTGTACGTCAGAAACGGTTTACCCACATGGGCGAATACGACTTCCTCGAGGTATTC
+GAACGGCCGGATGGTGGGGTACTTGCCCGCACCGCGACCCGCCCAACTCCCCAGGAGGGGTGACAGCGCC
+TGCAGGGCAGGGGCCAGATCTCGGGTCATCGCCCGCTTGCGGGGGACAGGCATGCGGGAAGCCTAGCGCC
+GCGAGATCGGTCAGCTGTGGGCTGATAGGTTGCGGTGCGCGCGAAGCGCCTCAATCTCGCGCGCGAAATC
+GTCCGCGGAAGAAAACGACCGGTAGACCGACGCGAACCGTAGGTAGGCCACCTCGTCAAGCTCGCGCAAC
+GGGCCCAGGATAGCCAGGCCGACATCGTGACTCGGAATCTCCGGCGACCCCGCGGCACGCACCGAATCCT
+CGACTTGCTGAGCCAGCAGGTTCAACGCATCGTCGTCGACCTGGCGTCCCTGGCACGCCCGGCGCACACC
+GCTGATCACCTTTTCCCTGCTGAAGGGTTCGGTAACGCCACTGCGCTTGACTACGGCCAGCACCGCGGTC
+TCTACGGTGGTGAATCGTCGTCCACATTCGGGGCACGACCTCCGGCGCCGGATCGCCTGGCCTTCATCGG
+TTTCCCGGGAATCGATCACCCGCGAATCGGGATGCCGGCAGAACGGGCAATGCATGGCCGCTCCTTTGCC
+GTCTTGACATCCGGGTATCACAGACGACTCCGAGCGTACCTGTGTGCTCCCGCGGGTAGCCACTGCAGTC
+ACGACTGATGCGCATATTGCGTCGCGGTCACCCAGTAACGTTGACACAGAACGGTTTTCGCGGACACCGG
+GATGGCCTCAGCCAACCGGAGCGATCAGCGTCTGACCCACGGCCAATGCCGGTGTCTGCAGGCCGTTGAG
+TTCACGGATGCGGTCGGCAACCTGGCGGGTCGGAGCGTTCGGCGCCACCCGGACCGCCACGTCATGCAGG
+GACTCCCCCGTTTCCACCCGTACCACGGCAAGCCTGTCGGGCACCCGACCGGTCGAATCGGCCGACCCGT
+CGGCCGAACCGCCGGTGATCATCTGCCCGAACTGCGCCACCAAACCAAGCCAGAGAGTAATCGCCGCGGC
+AAGCAGAGCCAGCCCCACCGTCGTGGCCGGCGGGACGGGCCTGCTGCCATGCCCAGTCCTCGACATCCCG
+ACCCCGGTGCGGTGGTAGCGCAGCGGCGCACCCCCCGGCCTCGATCGGCCGGGCCTGCGCGATTGCGCCG
+GCTCAGCGCGGCGCCAGCGAGGTCCATCGAGCGGGCCCCGCAGATTGAGCGGATCGGGGGTATGCGGTGG
+CCGGACCGGTGTCATGTTCGCTCCTCCAACTCAGACGGTAATCGCTCGCGTGTTCGACACTGTAGTCACT
+CATGTGTTCGATATCCGAACATTTGATCGAAGCGTGTCGCACGCGCAAAACGGTAGACCACACCACCGAC
+ACGTTTCGGTTGGAGCCGGACTTCCGGCGCGAAGGCCCAGCCACTCCTCGTGCCCTCCCGCGACCGGAAC
+ACGCCTGTCGAACACATGTTTGATTCTTGGTGCGAATGCGACTACATTCATTGCCATGAACGACAGCAAC
+GACACCTCGGTTGCCGGCGGAGCCGCTGGTGCGGACAGCCGGGTGCTGTCCGCAGATTCGGCGCTGACCG
+AGCGGCAACGCACTATTCTCGACGTCATCCGCGCGTCGGTCACTAGCCGCGGATATCCGCCGAGCATCCG
+GGAAATCGGCGACGCCGTTGGTCTGACGTCGACGTCTTCGGTGGCGCACCAGCTGCGCACCCTGGAGCGC
+AAGGGCTACCTACGCCGTGACCCGAACCGCCCCCGCGCCGTCAATGTGCGCGGTGCCGACGACGCCGCCC
+TACCGCCGGTGACCGAAGTGGCCGGCTCGGACGCCTTACCGGAACCCACCTTTGCCCCTGTCCTGGGACG
+TATCGCGGCCGGCGGCCCGATCCTTGCCGAGGAAGCCGTTGAAGACGTCTTCCCGCTGCCGCGTGAGCTG
+GTTGGCGAGGGCACCCTGTTCCTGCTCAAGGTGATCGGTGACTCGATGGTCGAAGCCGCGATCTGCGACG
+GTGACTGGGTGGTGGTGCGACAGCAGAACGTCGCCGACAACGGCGACATCGTTGCGGCCATGATCGACGG
+TGAGGCCACCGTCAAGACGTTCAAACGCGCCGGCGGTCAGGTGTGGTTGATGCCGCACAACCCGGCCTTC
+GATCCCATCCCGGGCAACGACGCGACGGTGCTGGGCAAGGTCGTCACGGTGATCCGCAAGGTCTGATGCT
+GATCCGCGTGCAGGCTGTCAATCCGCCCTAATGAAGCCGTTGACTTGTGCCACTTCTTCACTGGCGAACC
+AGAGTTCGGCCAGCGTGTCGTGGTATAGCGCACTGCCGGGTGGGTAATACAGGCCGAAGCTCACACTGGC
+TTTGACGGGATAGCCGTTCGGCATCTGGTATGGGTCCTCGAGCGGCAGATGAATTGCCGGGCGCACGCCC
+GCACTCGGCGGTTCCGGCGGTTCTGCGGCCGCGTGCCGCCCGCCTCTGTCTTCAGCTGCGGATACAGCCG
+CCGCCGGCAACCCAGTGTCAGCAAGATCGGCAGCGTGGACATCGGGCGGCACCGCTTCAGGCGCCACTGC
+TTCCGGAACAAAGGCTTGCGGAACGAAAGTCTCCGGAACCACTCGCTCAGGAACAATGAGATCGGGACCG
+ACTTCGGAAAGGTCGGCCTGCGACACAACGGGTGTCGGCGTGGTGTCCACCGCATCGGTGTCTTCCTCCT
+CGACCCCGACGTTGCTGGGGCCGGACAGCAAGTCGCTGCCGTAGCCCTCCTCACCCGGAAGATGCTCGGC
+ATCACCGACAGCCGCCCCGGCGCCGCGCGGCCAGCTGACCCGCGGTGTGGACCCGGCGTCCGGCGCCACA
+GGTTCCGGCGGGAACTGGTCGCCGAAACCGAAATGCTCTGAACCGAAGTCCTCGTCGGGCGGCCAGTCTC
+CATCAGCGGCGGTACCGTACTCGACATCCCCAGCGCGGTCATCGTCGTAAGCAGCGGCGTCGTACCCACG
+TCGACGCCGACGCAATCCGAACACCACCAACGCCACCATCACGACCAGGAGCACCCCCAGGGCGGCGGCC
+CCTAACCACCACCAATGCCAGGTGAACTTCTTGCCGGGTGGGGGCATCGCCGAAGTACTTGGCTGGTTCT
+GCCCTGACACCTGCAGACCGGACAGCAAGGGCGCTAGGTTAGCGGGATCCGTAGTGAATGTGTTTTTTGC
+ACGGTTCCACGAAATCATGCCGCCGGTGAATTTCTGTGAGACAACATCGCCGTCGACGGTCTGGTCGCCG
+ACCGGGGCGCCGAGCTTGCCGTTGGGGCCGCGCAGCTTGTCCCACGCGGCCACCATGGCTCCGCGCACGA
+CGAACGCGCCGTGGTCCGGAGTCCAGAAAATCACCGGCTTGTCGGCCGCGGAGAACCTGACGATCCGGCT
+GGAGGGCCCAAAACCACCATCAGTTTCGTTGGCGATGGGGAAACCCAAGTCGCTGCTGACCGGTCCGCCC
+AGCGACTCGTACTTCGCCAGGATTTCACCCTCGACGGCGTTTGCACCGGTTGCCGGGCTGAAGAAGACCT
+TGCCACCGACGAAGTCCTGGGCGATACCGTCTCCGCCGATCGGGTACTGCCCACCCTTCTTGGCGCCCAG
+CGGACCTGCGGCACCACCTGCTGCGCGCCAGGCCATGTTGATCGCCGCGGAAGGATCGATCGCTACCTGC
+AAACCCTTCAGCTGCTCGGCCAGCACCGCCGGAACGGTGGTGAACTCCTTGGTTGCCCGGTTCCAGGAGA
+CTTCACCACCGCTGAACTTCTGGGCGGTGACCTCGCCGTCGTAGGTTTCATCCCCGACCGGGGCACCCAG
+CACGCCACCCGAGCTGCCGAGCTTGTCCCACGCGGCATTCAGCGCGCCGCGCACGACGAACGCACCGTGT
+TCAGGCGTCCAGAAAATCACCGGGTTGTCGGCCGCGGAGAACGTGCTCACGCGACTGTCGGGTCCGGCAA
+GGCCGGGCACCTCGTTGATGGTCGGGAATCCCAGATCGCTGTCGGCTGCACCGCCCAGCGACTCGTATTT
+GTCCAGGAGCGGGCCGTAGAGGTATTTGGCACCGGTGGCCGGGGTGAAAAACATCTTGCCGCCGGCGAAG
+TCCAGGGCGAACCCGTCGCCTATCGGGTAAACGTCACCTTTCCGGACACCAAGTGTTGAAGTGTCACCAC
+CCGCCTTCTCCCACGCGGCCATCATGGCGTCCTCGGCATCGCCCATCGGCGAAGCCGCCACCGTGGGCGC
+CAGCAACACGGCGGTCACCGCCGTGGCCGCCAAGCCGAGCAGCGTACGCCCGATCAGCGTGCTCAATTGA
+CCTCTCTGCCCGTTCACCAAGCCTCCCAGCCGATGCCCTGCCTAGCCCGCCAGCCGGTGGATCTCCCACC
+GTGGGCCGGTCCCCGCTGCGGTCCGTATTGTCCCCGGGCTCGCATAACATTGCTCCAGCGAACGACGATT
+GCGAAGTCCAATCGCAAATATTACGAAAACGGATACCCAGCCGATGTCAAATTGATGCCGGGGCACGCTG
+CTGTGGTGAGCAACCGGGCTGCAGCCCGGGCCGGGTTTGCGTTACCGTGCCGGAAACGACAACCGGACTG
+ATGCGGTGAGAGGAATCCCGGCTGACATGGGTGCTTCCGGCCTGGTCTGGACCCTCACCATCGTCCTGAT
+CGCCGGCTTGATGTTGGTCGACTACGTCCTCCACGTACGCAAGACCCATGTACCGACGTTACGTCAGGCC
+GTCATCCAGTCGGCGACCTTCGTGGGGATAGCGATCCTGTTCGGCATCGCAGTGGTGGTGTTCGGCGGCT
+CAGAGCTGGCGGTCGAATATTTCGCCTGCTACCTGACCGACGAAGCCCTGTCGGTCGACAACCTGTTCGT
+ATTTCTGGTCATCATCAGCAGCTTCGGGGTGCCTCGTCTCGCGCAACAAAAGGTGCTGTTGTTCGGTATC
+GCGTTTGCGCTCGTCACGCGCACCGGATTCATCTTCGTCGGCGCCGCGCTCATCGAGAACTTCAACTCGG
+CCTTTTACCTGTTCGGCCTGGTCCTACTGGTCATGGCGGGCAACCTCGCCAGACCCACCGGGCTAGAAAG
+CCGCGACGCCGAAACGCTCAAGAGGTCCGTCATTATCCGGCTAGCCGACCGCTTCTTGCGGACCTCACAG
+GACTACAACGGAGACCGGTTGTTCACGGTCTCGAACAACAAGCGAATGATGACCCCGTTGTTGCTGGTCA
+TGATCGCCGTGGGTGGCACTGACATACTATTTGCGTTCGATTCGATTCCAGCACTTTTCGGCCTGACCCA
+AAACGTCTATCTGGTGTTCGCCGCCACCGCGTTCTCGCTGTTGGGCCTGCGCCAGCTGTACTTCTTGATC
+GACGGCCTGCTGGATCGGCTAGTCTATCTGTCTTACGGGTTGGCCGTGATTCTTGGCTTCATCGGCGTCA
+AACTGATGCTGGAAGCATTGCACGACAACAAGATTCCGTTCATCAACGGCGGCAAGCCGGTCCCGACCGT
+GGAGGTGAGCACCACCCAGTCGTTGACGGTGATCATCATCGTCCTGCTGATCACGACCGCGGCGTCGTTC
+TGGTCGGCGCGCGGACGGGCGCAGAACGCCATGGCGAGGGCCCGGCGGTATGCAACCGCATACCTCGACC
+TGCACTATGAGACCGAGTCGGCCGAACGCGACAAGATCTTTACCGCACTGCTGGCCGCTGAACGCCAGAT
+CAACACTCTCCCAACGAAATACCGCATGCAGCCCGGACAGGACGACGACCTGATGACGCTGCTGTGCAGG
+GCCCATGCCGCGCGCGACGCGCACATGTGAGCCCGCGCTAGCTGAGGGCTAGCTGCGCCTAAACACCCAA
+GCCACGACCGATGATCTCTTTCATGATCTCGGTCGTGCCACCGTAAATCGTCTGTACCCGCGAATCGAGA
+TAGGCCCGGGCGACTGGGTATTCGCGCATGTAGCCGTACCCACCGTGCAGCTGCAGACAGCGGTCGTTCA
+GATACACCTGCTTCTCGGTGGCATACCACTTGGCCATGGCGGCCTGCTCTGCCGTCAACTTCCCCGCCAG
+GTGCAGCTTAATGAATTCGTCGACCATGATGCGCACCACAGTGGCCTCGGTTGCCAGCTCGGCCAGCAAG
+AATCGGCTGTTCTGGAAGCTACCGATCGACCTGCCGAACGCCTTGCGCTCCTTGGCGTACTGCAGTGTCT
+GCTCCAGCACGGATTCCATCCCCGCGGCCGCCATGATGGCGATCGAGATCCGTTCTTGCGGCAGGTTCTG
+CATCAAGTAGATGAACCCCATCCCCTCCTGGCCGAGCAGGTTTTCGGCTGGAACCGCCACGTCGGTGAAG
+GACAGCTCGGCGGTGTCCTGGGCGTCCAACCCGATCTTGTCCAGCTGGCGGCCGCGTTCGAATCCAGCCA
+TGCCGCGTTCGACGACCAACAAACTGAACCCTTGCGCACCCTTTTCGGGATCCGTCTGCGCCACCACGAT
+CACTAGGTCTGAATTGATCCCGTTGGTGATGAACGTCTTTGACCCGTTTAGCACGTAATGATCACCGTGT
+TTGACGGCACGGGTGGTGATACCTTGCAGGTCACTACCGGTTCCGGGCTCGGTCATCGCGATCGCGGTGG
+TCAATTCCCCGGTGCAGAAGTTGGGAAACCAGCGCCGCTTCTGCTCTTCGGTGGCCAGCGCCAGCAAGTA
+CGGCGCCACGATGTCGTTGTGCAGGCCAAAACCGATCCCGCTGTACCGTCCGGCGCAGGTTTCCTCGGTG
+ATGACCGTGTTGTACCGGAAGTCCGCGTTACCCCCACCGCCATACTCCTCGGGCACCGCCATGCCCAGAA
+ATCCCTGCTTGCCGGCCTCCAGCCACACGCCGCGGTCGACGATCTTGGTCTTTTCCCATTCATCGTGATA
+GGCCGCGACGTGGCGATCGAGGAACGCCCGGTAAGACTCGCGAAACAACTCATGTTCGGGTTCGAAAAGT
+GTGCGCTGGTACTTGGTGGCACTGCCCATGGATGCCCTCCGGGGAAGAAAATTCTGGTGCCCAACAATAC
+CAACCGGGCGGTTGGTCGGCAGGTAGCCGGGGCGCGCCAGCCGCCGCGAGCGTAACGCCACGGCGAGCTT
+GCGTGCACCGAATTCGCCGTGGCGTTACGCTCGCGGCGCAAACTCGCGCAAGGTGGCAGCCAGCGCCTCC
+GGGACACGGGCCTTGATCCGGGTGCCCTCGGGCTTGTGCTCCGCCTGCTGTATCCGCCCATCGGCGTGCA
+CACGGGCCACCAGGTCGCCGCGGTCGTACGGGATCACCACGTCGACGGCGGTGTCGGCGGGCACAACCAG
+CTCGGCCATCCGCCGTCGGAGCGCATCGATACCGTCGCCGGTGCGGGCGGAAACGAACACCGCGCCGGGC
+AGCCCGTGCCGCAGCTTGGCCAGCATCAGGTCGCTAGCGACGTCAACCTTGTTCACTACCAGCAGCTCGG
+GCGGCGGATCGCCGTCATGGTCGGCGATCACCTCGGAGATCACCTGACGGACCGCGTCGATCTGGGCTAG
+CGGGTGGCCGTCGGATCCGTCCACGACGTGGACCAATAGATCGGCGTGCACGACCTCCTCCAGCGTGGAG
+CGAAACGCCTCGACCAACTGGGTGGGCAGGTGCCGCACAAAGCCGACGGTGTCGGTGAGCACGACTGGCC
+TACCGTCACCGAACTCCGCGCGCCTGGTGGTGGGTTCCAGGGTGGCAAACAGCGCGTCCTGTACCAGCAC
+CCCGGCCCCGGTCAGCGCGTTGAGCAGGCTGGACTTACCCGCGTTGGTGTAGCCGACAATCGCGATCGAC
+GGCACGTCACTGTGCCGGCGACGGCTGCGCTGGGTGTCGCGGACCTGTTTCATGGCCCTGATGTCGCGCC
+GTAACTTGGCCATCCGCTCGCGGATGCGGCGTCGGTCAGTCTCGATCTTGGTCTCACCGGGACCGCGCAG
+ACCCACCCCGCCACCACTGCCACCGGCGCGACCGCCCGCCTGCCGTGACATCGACTCACCCCAGCCGCGC
+AGCCGCGGCAGCATGTACTCCATCTGAGCCAGCGACACCTGGGCTTTGCCCTCCCTGCTGGTGGCATGCT
+GGGCAAAGATGTCGAGGATCAGCGCGGTGCGGTCAATAACCTTAACCTGCACAGCCTTTTCCAAGGCGGT
+CAACTGCGCCGGCGACAGTTCGCCGTCGCAGATGACGGTGTCGGCGCCGGTCGCCACGATCACTTCGCGG
+AGTTCGGCCGCTTTGCCCGAGCCGATGTAGGTCGACGGGTCGGGCTTGTCGCGACGCTGGATGAGTCCTT
+CGAGCACCTGGGAGCCGGCGGTTTCGGCCAATGCCGCCAGCTCGGCCAGGCTTGCCCGGTTGTCAGCCGC
+GCTGCCCTCGGTCCACACTCCCACCAACACCACCCGCTCCAGGCGCAGCTGGCGGTACTCCACCTCGGAG
+ACGTCGGCAAGCTCGGTCGACAACCCGGCAACCCGGCGCAGCGCCGATCTGTCCTCGAGTGCGAGCTCAC
+CGAGGCTCGGTGTGAAGTCCGAAAGGCCCGTCTGGGGCGGATCTGGATATGTCATAGCCAGTACCCGATG
+GTGGCACGTGGCAGCTGGCCGCGCATCTGAATTTGCCGGCATAAGCCGCTGCCTGGGATCACCCCATCGC
+GTTCCACCAATCGTCAGCGAGATCTCCGCGGGCCACCAACACTGACGGCCCACGCAGGAAGCTGGTGGCA
+TCGGTGACGGTAACCACGACCTCTCCGCCCGGCACGTGCACGGTGAGCGTTCCGGTCGGCGAGCCCACCG
+CCGCCAACGCGGCGACCGCGGCCGCAACCGTCCCGGTGCCACACGAGCGGGTTTCCCCCACGCCGCGTTC
+GTGAACCCGCATCCAGACCGCCCCGTCGACCGGCGCGGTGAGTACCTCGACATTGACCCCGTCGGGGAAC
+TGCGCACCATCGAAACTCACCGGCGCACCCACGTCCAATGCCGCCAGGCCGTCGACGGTCAGCTGGGAAT
+CCACGCACGCCAGATGCGGGTTACCCACATCGACGGCCAGGCCGTGAAACCGCCTGCCACCAACAACAGC
+CTCCCCTGCGCCCAATCTGTTGGCCTTGCCCATGTCGACGGAGACGTCGGCGTAGGCCGCCTCGACGTGG
+TGGCAGGTGACTGGTCGCGGTCCGGCCAGTGACCCTACGACGAACTCGTCGCGAACCTCCAGGCCACTGG
+CACGCAAGTAGTGCGCGAACACTCGCACACCGTTGCCGCACATCTGGGCTGCCGACCCGTCGGCGTTGCG
+GTAATCCATGTACCAGTCGGTCACGCGGACACCCTCGGGCAGGCTGTCCAGCACTCCTACCGCCTGGGCG
+GCTCCGGCGGTCGTAACCCGCAACACCCCGTCGGCGCCCAGCCCCTTCCGCCGGTCGCACAATGCCGCCA
+CCCGGGCAGCGGTGAGCACCAACTCGGCGTCGACGTCAGGCAGCAACACGAAGTCGTTCTGGGTACCGTG
+GCCCTTCGCGAAGATCATCTGCGCCACTCCTCAATCACCAGATCAGGTTACGTGCCGCCATAACCGCACG
+GCGTCGTCGACCAGTCGTGCGCGGTCCGGTGAGCTGGCCACACCGGCGTCGAGCCAGTGCACCCGGTGGT
+CTCGGCGAAACCAGGACCGCTGCCGTCGCACGTAGCGGCGGGTGCCCAGGTACGTCTGCTCCCGCGCGGC
+GCGCATCATGTCAGCTCCAGCACCGGCGTCCAGAGCGGCTATTACCTGCGCGTAGCCCAGCGCGCGTGAC
+GCGGTGACCCCCTCGCGCAGACCATTGCGGAGCAGAGTGCGTACCTCTTCAACCAGGCCCTGATCAAACA
+TCAGGTCGGTGCGACGGGCCAACCGCTCGTCGAGAATCGTTGTCTGACAGTCCAACCCGACGATAACCGT
+GTCCCACCGCGGCGCACCGATGCGTGGCGCGGACGCGGCAAATGGCTGCCCGGTGAGTTCGACCACCTCG
+AGCGCCCGCACCGTGCGCCGGGCATCTGTGGGCAGGATTGCCGCGGCTGCAGCCGGGTCTCGGCGGGCTA
+ACTCGGCGTGCAGCCGATCCACCCCGACCTCGGCCAGACGCCGCTCCCATCTCGCGCGTACTGAAGGATC
+GGTTGCGGGAAACGACCAGTCGTCGAGCAGGGATTGGACATACAGCATCGAGCCGCCCACCACGACCGGC
+ACCGCTCCCCGGGCTGCGATCGCCTCGATGTCCGCCGCGGCGGCCCGCTGGTAGCGCGCCACGGTCGCGG
+TTTCGGTGACATCCAGGACATCGAGTTGATGATGCGGGATGCCACGGCGCTCGCTGACGGGCAGCTTCGC
+CGTCCCGATGTCCATGCCGCGATACAGCTGCATCGCGTCGGCGTTCACGATCTCCACGCTCACCCTGGCG
+CCGAGCCGCGCGGCGACGTCGAGCGCCAACTGGGACTTGCCGGCGCCCGTCGGTCCGATAATCGCCAACG
+GTCTCACGGCTGCCAGACACCGGCGAAATACCCCACGCCGTGTGGCGCTCCTCGGTAGAACTCCTTGGCC
+GATCGCGGTCCTGGCTCGGCCAGGCCGGCCAGCACCTGAAATGCCACCCGCCCAAGCACCTGTGCGGGCA
+GCCGGGTCAAGACGGCGAGGTCGCCGCTGGCCAACGCGTCGTCGAGAGCCCGCTGCATACCGGCGCCGTC
+GGGGTCATAGCCGCCGGGAGCGCGGGGCGTCAGGGTGTTCAGGCCGTCGGCGACGACTAGTACCCCGATC
+GGATCGGGCTCCCGGTCGATGTCGGCTCGCAGTTGCCTGCCACGTGCCACCGCGGCATCGGAACCGTGGT
+CGCTGGCATAGACGTGGACCTGTGCCCTGGCCTCAGGCCGGGCCTGGCCCCGTACCCAGGCGGTAAGTAG
+CGCACACAGGGGTAATTCCACCGGAACGGCAACTCCGTCACCGTCCTGCGGCGCGAGCCCGACTCGCACG
+TCGGCGCCGAAGCCCGCAAAGGTGCCGACGTCGGTGGGGCGCACGACGTCGTCGGCGCGCCCGGTTCCGA
+CAGCAATCCAGCTTTTCGGCAACAAGGAGGCCGCCGCGATCACCGCGGCCCCCAAATCGGCCAGCTCGGC
+AGCGGCGGCTCCGGCCAGTTCGGGAACCAACACCGGCGCGGACGGAACGATCCCGATGGCGCTCAACACA
+ACACAAAGCTAACGCCTTGGCGGGCGGATTCGGCCTCGTGGAGCAACGGCTGCAAAGAGACCGTGCTGAG
+AGGCCGACACTGTCCCGCGCTCATCGGCCAGAGACGGTCAACGAACCGCAAGCTGGCCCGCGGCCCCCAA
+TTCGCCGGCGGAAACCGTCATCATCGCGACCTCGTCACGGGCCAAGGCTACGGTCGCGACAACCACCACC
+ACTACCACTGCCACCAGCGCGACCAGGGCCACCCGGCCGGTGTGCAGCACCTCATCGAGCACGGTGATCC
+CCAGCACCGAAGCGATCACCGGCCTCGCCACGGTGATCGTCGGCAACGAGGCGGTTAGCGCGCCCACCCG
+CAACGACGACTGCTGAAGCATCAGCCCGATCGGTAGAACCAGGATCCAGGCATACAACTCGGGGGTCCGG
+ATCAGTGTCGCGAACCCCTCGCCGAGCTCCGTCACGACCCCTTTGGTCAGCACGGTGAATACCGCCAACG
+TTGCCGACGACGCCACCGCCAGCAGCACCGCGGACAGCGAACCCGAGGCAATCCGTGCACCAACCACACA
+AAGCACCACCGCCGGAACAACCACGACAGCAACCACCGCCCAGGTCGAGAAGGGGGCCCGAGTAGTGCCG
+GCCGCCGGGTTGCCCGACATGACGATGACGGCCACCGCGCCGGCCAGCAATACCGCCCACATCCACTCCC
+TGGGAGTACAGCGGTGATGAGTCAACCGAGCATCGATCAGCAGCGCGAACAACAGTGCGGTGGCCTGCAG
+CGACTGCACCAACACCACCGAACCCATCGTCAGCGCAATGGCCTGCAGGGTGAAACTGGCGACTGCGGCC
+AGGCTGCCCAGCCACCACAGAGCGTGACGCAAAGAGAGGTGGAACAACGTCAAATGGCCGACATATTCTT
+CAGCGGTGACCTGTCGCGCGGACCGCTGAAGTGTCACATACCCGATCCCGGCCAGCAACGCGGCGCCCAG
+CGCCAGAATGGTCGCGAATTCGACGCTGGCCATAGGTGACCTCCCACCGACATTCGGCCCGGAAGCTGAC
+TGATACATCTCGATTTAAGCAGTTGTTCAATGATGATGAACTGGCGCCAGACAAATATCACAACAAAACG
+TTGCGCGCAGACGCGTGCTTCGTCATCGGCTTCGGAATTCTGCGGCATATTCGCTGCGCCGGGATTGATG
+AGGAATTGCCATCATGGTGGCTCGGCCCCAAGTGCGGTCGGCGGGTCGGCCGTGCAATTGACCGTTGCTT
+ACGGCCCTCAGCGCTTCCACGGGAGGTGCGCGAGTAACAGCTCGGTTCGGCCCCTTACTACCGGCGGCAG
+CTGGACCCCGACCTCGATCAGCTCTACGGATGGCGGAAAAGCACAGGGCCATGACACCCACGATCGGCAA
+ATATCGCGACGAACAGTCTGTCAAGCGGCCTCAATACTTGCTTCAATACTGTTGGAAACGGTGGCAGGAC
+CGGGTGAGGGCATCGGGCCGACCACATCGGTGCCGCTTCGCGCGGCAGATGCGCGGCATACGCGCGAAGG
+GTTGCAAGGTAGGTGACAAGCGCATGACGGCCGACGAGCCCCGCAGCGACGATTCGTCCGGGTCGGCCCC
+CCAACCGGCTGCCACGCCGGTGCCCCGCCCGGGACCGCGTCCCGGCCCCCGGCCGGTGCCGCGACCCACC
+TCCTACCCGGTGGGTGCGCACCCTCCCAGCGACCCGCACCGTTTCGGCCGTATCGACGACGACGGCACGG
+TGTGGCTGGTCAGTGCGAGCGGCGAGCGTATCGTCGGCTCCTGGCAGGCCGGCGATCCCGAAGCCGCGTT
+TGCCCATTTCGGCAGGCGATTCGATGACCTGAGCACCGAAATCATGCTGATGGACGAGCGGTTGGCGTCC
+GGCACCGGCGACGCACGCAAGATCAAAGCCCATGCGATCGCGCTGGCCGAAACGTTGCCGACGGCATGCG
+TGCTGGGCGATGTCGACGCGCTGGCAGACCGGTTGACAAGCATTCGTGATCGCGCGGAGGTCATCGCTGC
+CGCCGACCGCTCCAGACGCGAGGAACATCGAGCCGCCCAGACCGCCCGTAAAGAGGCGCTGGCCGCCGAA
+GCCGAGGAGCTGGCCGCCAACGCGACACAATGGAAGGTCGCCGGTGACCGGCTGCGGGCAATCCTCGATG
+AATGGAAGACGATTAGCGGTGTGGACCGCAAGGTCGATGACGCGCTGTGGAAGCGCTACTCGACGGCCCG
+CGATACGTTCAACCGGCGGCGAGGGTCCCACTTCGCCGAATTGGACCGTGAGCGATCCGGCGTCCGGCAA
+AGCAAGGAACGGCTTTGTGAACGGGCCGAGGAGTTGTCCGAGTCGACGGACTGGACCGCCACCAGCGCGG
+AGTTCCGCAAGCTGCTCGCCGACTGGAAAGCGGCGGGACGCGCGAGCAAGGATGTGGACGACGCCCTGTG
+GCGTCGCTTCAAGGCCGCGCAGGACTCCTTCTTCACGGCTCGCAATGCCGCCACCGCCGAGAAGGAGGCC
+GAGTTGCGAGCCAATGCCGACGCCAAGGAGGCGCTGCTGGCCGAAGCGGAGCGGCTCGACACGACAAACC
+ACGAGGCCGCTCGAGCAGCGCTGCGGTCGATCGCCGAGAAGTGGGACGCGATCGGCAAGGTGTCGCGGGA
+GCGGGCCGCGGAGCTGGAGCGGCGACTACGCGCGGTCGAGAAAAAGGTGCGAGAAGCCGGCGAAGCGGAT
+TGGTCCGACCCGCAGGCGCGGGCCCGCGCCGAGCAGTTCCGCGCCCGGGCCGAGCAGTTTGAACACCAGG
+CCGAGAAGGCAGCAGCGGCCGGTCGCACCAAGGAAGCCGACGAGGCGAAGGCGAACGCCGAACAATGGCG
+GCAGTGGGCCGAGGCAGCCGCCGACGCGTTGACCCGACGCCCCTAACGGTCGGTGCCGCGGTCGGGCGTT
+GTCCCGGCCTCGGAGTCCGTTTGCACGTGGTCCAGCAGCGTCTTGCACTGTTGTTGCGCGACGACGCGGC
+GACGCCGCTCCTCGGCTGCGAGCTGCACGATGGTGCGCGACCACACCACCTGGGCCCAGTGGAATGTCAA
+CACGATCGCGGTGATCCAGGCGACGATGAGCCCGATACCGGGGCCGGGATGACCGGCGGCGACCGTCTGA
+CGCGACCATACGGCCAGCAGCCCGGTACCGCTGGCCATCGCCGAACCCGCCAGCGCCACCCAAGCCAGCG
+CCCACCGCCGGGTGAGCAACGCCAGCATCGAGAAGCCAACGCCGAACACCAGCGCCAACCAGGCGAATAC
+CCGCGAGGGCAGCGCGACGGCGGCCCTGCCGGCGCCGTGGCTGCTGAACAACACATCCCAGCCGCGCACG
+CTTCCGGTATGCGGCAGGATAAACGACCCCAACAGCACGAATACCAGGATTGCGACAACCAAAGCCCTCG
+CGCCTGGCTCGATTTCGCGCGCAACGCGGCGTTCTGCCGCCTCGATCTCAGCGCGGAGGGCGTCGAGATC
+CCCGGCGTCGTGTTCGTGGCTCATCATCTGCATCCTCCGGGCTTGGCCGCGCTGACCGGCAGCCCGACCC
+CAGGCATGCCCAGGCCGACGGCGCGCCCCGGCTGCCCGGCGGTGTGCGCGTCGCCGGCGCGGGTGCGGCG
+GTGGGTCAGGACGCCGGCGTCGGCGATGAGGTGGTGCGGCGCCGCTTCGGTGACCTTCGTGGTGATGACG
+TCGCCGGGACGCACGCGCGGCTGGCCGGCGGTGAAGTGCACCAGGCGCCCGTCGCGCGCCCGCCCGCTCA
+TGCGCGCCGTGACGGTGTCCTTGCGCCCTTCCCCGGTGGCCACCAGCACCTCGACGGCCTGCCCGACCAG
+GGCGCGGTTGGCTTCCAGCGAGATTTGCTCCTGCAGCGCGATCAGGCGTTCATAGCGTTCCTGCACAACG
+GCTTTCGGCAGCTGTCCGTCGAGTTGCGCGGCCGGTGTCCCGGGCCGCTTGGAGTATTGGAAGGTAAATG
+CGGCCGCGAAGCGGGCCCGGCGCACCACGTCGAGCGTGGCCGCGAAGTCCTCTTCGGTCTCCCCGGGGAA
+ACCGACGATCAGATCGGTGGTAATCGCGGCATGCGGGATGGCCGCCCGCACGCGCTCGATGATGCCGAGG
+TAGCGCTCGGCACGATAGGACCGCCGCATCGCGCGCAGGATCCGGTCGGATCCGGACTGTAGCGGCATGT
+GCAGCGCGGGGCAGACGTTGCGCGTCTGCGCCATCGCCTCGATGACGTCGTCGGTGAATTCGGCCGGGTG
+TGGGGAGGTGAACCGGACCCGCTCCAGCCCGTCGATGTCTCCGCAGGCCCGCAGCAACTCGGCGAAAGCT
+CCCCGATTACGGGGCAATGCGGGGTCGGCGAACGAGACGCCGTAGGCGTTGACGTTTTGGCCGAGCAGGG
+TGACTTCGAGCACACCGTCGTTCACCAAGGACCGCACCTCGGCCAGGATGTCTGCCGGGCTGCGGTCGAC
+CTCCCTACCCCGCAGCGACGGGACGATGCAGAACGTGCAGCTGTTGTTGCAGCCCACCGAGATGGAAACC
+CACGCGGCATAGGCAGATTCGCGGGAGCTGGGCAGCGACGACGGGAACTGTTGCAGCGCCTCGGCGATTT
+CGACCTGGGCGACCTTGTTGTGCCGGGCGCGCTCCAGCAGCGTGGGCAAAGACCCGATGTTGTGGGTGCC
+GAAGACAACGTCTACCCACGGCGCCCTGCGCAGCACGGCGTCGCGGTCTTTTTGCGCCAGGCAGCCACCG
+ACCGCGATTTGCATGTCGGGATTGGCGCGCTTGCGCGGGGCCAGATGGCTGAGGTTGCCGTACAGCCTGT
+TGTCGGCGTTCTCGCGGACGGCGCAGGTGTTGAACACCACGACGTCGGCCTCGGAACCGTCGGTCGCCCT
+CCGGTAGCCGGCCGCTTCCAGCAGACCCGCCAGCCGCTCGGAGTCGTGGACGTTCATCTGACAGCCGTAG
+GTGCGGACCTGATAGGTGCGCGCTGGCGCTCGCCGCACGGGCGGCCCGGCGCCCTCGCCGGTCACCCCCG
+CGGCGGCATCGTGCGCCACCATCGAAGTCACGGGGCCATGGTACGGCGGCTGGGCGGCTCGCGGCCCAGC
+GGATGGTGTCGCCTCGTCGCAGCATCGGGCTAGCGGGGACGCGCTCGACACGGTGGCCGATCACGGCTTC
+GCTGCACACCGGCTCGAAGAAGTCGGCCACGCGCATGAGGTAGTCGCGTCGTCACCGACACTATGGCTCG
+CTTGCCTCTAAAGCATCGCTTATGCCACAGACCAGACTTGTCGGAGCCGCTGTCTAGCATCGGGGACCGG
+GTGCTCGGCGCGGACAAACGTCATGAAGGGAATCGATAATGTCGGATCGCTCAGCGATCGAATGGACGGG
+GGCAACCTGGAACCCGGTCACCGGATGCGACCGTGTATCGCCGGGATGTGACCACTGCTACGCAATGACG
+TTAGCGAAGCGGCTAAAGGCGATGGGCTCCGACAAGTATCAAACCGATGGTGACCCCAGAACCTCCGGTC
+CGGGATTTGGCGTCACCATCCATCCCCGCAGTCTTGACGAGCCGTTCCGGTGGCGAAGCCCCCGCACAGT
+GTTCGTGAACTCGATGGCGGACCTATTTCACGCCAGGGTGGCGCTCTGGTTCATTAGGGAAGTGTTCGAG
+GTGATGCGAGCCACACCACAGCACACTTACCAGATCTTGACCAAGCGCAGCCTGCGACTGCGTCGCCTCG
+CTCACAAGCTGGAGTGGCCCTCGAACGTTTGGATGGGGGTGTCGGTGGAAAATGTCGACGCCTTCCGCCG
+TATCGAGGACCTACGACAGGTGCCCGCAGCAGTAAGGTTCCTCTCCTGCGAGCCATTACTCGGGCCCCTG
+GACGGAATAAATCTAGGTTCGATTGATTGGGTTATCGCCGGAGGCGAATCTGGTCCAAATTTCCGCCCGA
+TCGATCCACAATGGGTTCGCCATATTCGCGATACCTGTACTGCCGCTGATGTCCCATTCTTCTTCAAGCA
+ATGGGGCGGTAGAACACCAAAGGCATTTGGACGTGAACTCGACGGACGTTGTTGGGATGAAATGCCGCTT
+ATTGAGATTAGAAACCCGGATCCTCGGACCACCAGCCGCGTGCACGCGGATCCCATGTTGGCGACGGCGC
+CCACAGAATCTGCCCAGCGTTCGAATCCTGGACAGCTAGTTCGCCAACGCTGAATAATCCCATCTCGCCA
+CGGTCCTCGGACTCCTTCTGCTGTTTCGCGCTCTTGGCTTGCCGCATCATCTCTGGCTCCTTTTGAGCCG
+CCCGGTTGTACAGGTGGCACATGATCGCATCTCCGGCCCAGTGATCGGTCGCGAACACCATGTCAAAGAT
+TGTGACCTTATTGTGCATCTGCATGGGAATACGATGCGAATACTTGTATCCCAGCTCATACTCCAGCTTG
+ACGCGCATGAGATTAACCATCTCGGCACGGTAGGCAGGCGCAGTTAGATGGTGGCGCCATCGCGCTGCCT
+GTATCCGCTTCCAATCCGCGTCTCCGTACATGCGGGTGACCTGCTCGATAAACAGTTCCGCGTTCGTGCC
+CTTCACGCCCCGCGCGATCATGGTGGGTGACATCAACATCCATAGTTCGGTCTTGAGGTTACGAGGGTTC
+TGGCGAAAGGCGGCGACCTTATTGATCGTTTCCCAATGGACTTCAGCGGCCTGTTGGTCGATGAAAGCGA
+AGGTGGGCGCCCACCGCCAAGGGCCTAGTTCGGCAAGTGTTTCATCGATTGTTACGTTGGAATCGCCGGC
+CACAACGCGGTACCTACCGTCACCGGGAAAGCGGGTCCGAAGGGCGACGTCCAATTCAGAGGCAAGCGGG
+TTAAGCTCGCAAAACCGGAGCCGCGTGAAAGGTGGATCGGCTTTCATAGCGATAAGAGAAGAGCCATCAA
+ATTTCTCTCCCATGTCGCGGTCTATGTTCTCGGGCTGGCCCGCCATCAAGTCGAGGTAAATTCGTTCACG
+AGAAGTCTGACTAGCCCTGTTGAAGGCCGGGAGGTACCCGGCAAGTATCTCCAGTTTGTTTCGCGTCCAA
+TATGACCATTCTCTAGCCATCGAATCCCTTTAGACGCGTCGGCGCTCCCGCTCGGCGGCCAGCTCGGCGA
+TAACCACCTCGCACGCCAAGGTCTGGCCGTACCCACGGCGCGCCAACATCGCCACCAGCCTGCGGCTCAC
+CCGCGCTTCGTCGGTGCCGTCGTCGATCAGCACCTCCCGCCGCAGCCTGGCCCGTACCAGCTTTTCCGCC
+CGCCCCCGTTCGGCACCGGCGTCGATGCCCCCGAGCACCGTGGTGATCACGTCGTCGTCGACGCCCTTGG
+CGTGCAGCTCGGCAGCCAACGCGCGCTTGCTCTTTGCTGCGTTCGCCCGCCTGGACTGAACCCATTGTTC
+GGCGAAGTCGGTGTCATCCACCAGGCCAACGGCGGCCAGCCGATCCAATACCCGGTTGCCGATGTCTTCG
+GGGTAGCCGCGCTTGGCCAGCTGGCCGGCTAACTCGGCGCGGGTGCGGGATCGCGCGGTGAGCAGGCGCA
+GGCACAGTGCCCGCGCCTGCTCTTCGCGCTCAGAAGTCGACGGGGGCGGGCAGGACACCGTCATTTGAGG
+GATCATCGGTCACCACGGCACCAATGCCAAGCTTTTCCTTGATCTTCTTCTCGATCTCGTCAGCCACGTC
+GGCGTTCTCCACCAAGAAGTTGCGGGCATTCTCCTTGCCCTGGCCGAGCTGCTCGCCCTCGTAGGTGAAC
+CAGGCACCCGACTTGCGGATGAGGCCCTGATCCACACCCATGTCGATCAGCGAGCCCTCCCTGCTGATTC
+CCTTGCCGTAGAGGATGTCGAACTCGGCCTGCTTGAAGGGGGGCGAACAGTTGTGCACGACAACCCCTTC
+GGCGACGAGGGTGTGCAGTTCCTCGACCTCGAGGTCGAACGTTCGTGCCCGCCGCGTTGGCAGCACTTCT
+CGGATCACGGAATAGCGGAGTTCTTCCGCCAGCATGTCGTGCAGGAATTTGTCATCCAGGGCATCCGCGA
+GCGCCTGCACGCGATCCCGACGAAGGCGGCTGGCACCTAAGACCTGCTTCATTCCACCGCGGGGGTCCCC
+GGAAGCTACACCGATCATGGCCGCGGCCTCCTGCGCGGTCACGCCGCGCTCGTCCAGATAATTCAGCACG
+GCATCGGTCATCTCTGCAGCCAGATATGTCGCTTGCGATCCACGACGCCGCCCCTGCGTGGCTTCTGGAA
+TCGCCTGGATAAGCGCGGCACCGCGCGGCCCCCACATGGGAACTGACTCCGCGAATGCCGTGACGTTATC
+CATACCCGAGATCCGGACCTCGAACACTTGACGTTTGCTCTGGATCCGTCGACCGTTGACGATGCTCGGC
+CGCTTCTGGGTCGGATCGTAATCTCGAACGGTGCTCCCGACACCGAACCGCAGCAGCAGCCAATGAATCT
+GATGCGCGAGTTGTTCAGAGGTCGTCGTGTAACCGACCCGAAGTGCCCCGGTCTGTTCCCGGCTCACCCA
+CCCGTCGCTTTCGAACAGGCCGAAGAGCAGATTGCCGACAATGTCGGCCGCGATGTCCGGCTCGAAGAAC
+CAATTCGGAATCGTCTTCTCCCACGCGAGCTTGCCGTAGATACCGGCCTGCTGACAAAGGTCTGCCACAC
+CGTTGCGCTCACCGGGTCGATGAGCGATCGCGAGTGAGATACGCCCCTGCGGATGGGCCGCGCAACCGAG
+CGTCGCAGCGATTCGCGTCACGTCGTCAATGAGCGCCCGCTGAACATTGATGAAGTTGATCGGAGTCTTG
+CCCCCCACCCAACCATCCCTGCCATCTCCGATCAGGTAGCCAAGCAGCCGGGCATGATCCGCCGGAATCG
+GCGCACTGTCACCGAATCCATCGAAGCGTCGCGGTTGCGCCACCCTGTCTCCCTTGCGGAGTTCCCCGGC
+GGCACGCCAGCCGTACTCTGTCAGCACCTTGTGATCGGGTGTCGCCCACACGATGGCGCCACCGGCGATC
+CGCAACCCGATCACATCCCGCGTTCCCTGGTCGAACCAGGACACCACGGGCCGCGCATGCAGCGTTCCGT
+CCTTGGCAGCAGCCACGACATGAATAGGCTTGCGCCCATCGACAACATCCTCGATGCGATGCGTTGTACC
+GGTGACCGGATCGAAGATCCGAGTGCCCTCTGCGAGGCACTTGTTCTTGACGACCTTGACCCGGGTGCGG
+TTGCCGACCGCGTTGGTACCGTCCTTGAGCGTCTCGACTCGCCGCACGTCCATGCGCACCGACGCGTAGA
+ACTTCAACGCCTTTCCGCCCGTTGTCGTCTCGGGCGACCCGAACATCACTCCGATCTTGTCGCGGAGCTG
+GTTGATGAAGATCGCCGTGGTGCCCGAATTATTCAGCGCGCCGGTCATTTTCCGCAGCGCCTGGCTCATC
+AGCCGGGCCTGCAGCCCGACGTGGCTGTCGCCCATCTCGCCTTCGAGCTCCGCGCGCGGCACCAGCGCCG
+CCACCGAGTCGATCACCACGATGTCAAGCGCACCCGAGCGGATCAGCATGTCGGCGATCTCGAGTGCCTG
+TTCCCCGGTGTCCGGCTGGCTGACCAGCAGCGAATCGGTGTCGACACCGAGCTTCTTGGCATAGTCCGGA
+TCCAGCGCGTGCTCGGCGTCGATGAACGCCGCAACACCACCGGCGGCCTGAGCGTTGGCCACCGCGTGCA
+GCGCCACGGTGGTCTTACCCGACGACTCCGGGCCGTATATCTCTATCACCCGGCCACGCGGCAGGCCGCC
+AATGCCCAGGGCCACGTCTAGTGCGATGGATCCGGTCGGAATGACCGAAATCGGCTGACGCGCCTCGTCG
+CCGAGGCGCATCACCGAACCTTTGCCGTAACTCTTCTCGATCTGGGCCACTGCCAGCTCGAGCGCCTTTT
+CCCGATCGGGGGTCTGCGTCATGGTGCCTCTCCTGTGGTCGGTGTTCGATTGACCGGTATCGGTCGGTTG
+GCCGTGACACTAGAGACAGCCACTGACAAGTCGGCTGCTCCGAATGATCACCACAGTAGCCGAACACCTG
+TTCGATTCAAGTGTGACACGCCGCGTGTGGCAACATCGCGTCCGCGCTCGTCGGCGCGTCGAACGCCCTG
+GCGGCGGTGCGGCCCGACTTGCGTGCGCGGCTGGTCCGGATCACCGACGATCTGCTCAACACCGCTAGCC
+TGGCCGGATCCGGCGTGCTCACCGGCCCGGATCTGACCTTTCGGCGTCGCAGCTGCTGCCTGTTCTACCG
+GGTACCCGCCGGAGGCAAGTGCGGCGATTGCCCGCTTTGACGAATGTGCAACCTCACCACCGATCGTGGG
+GAACGTCGAAGTCGGCGCACAATGCCCGCCAGACGTCGCGGGGCTCGACACCGTCCTCGATGGCCTGGGC
+GGCGCTACGGCCGTCGAAGCCGGTCAGCACGTGATCGAGCAGCACCGACGAGCCATAAGCCGCCCCGAAA
+TGCAGGGCTACCCGCTCGTGGAACTCCGTCAGCCGCACGCCAGCCAACATACCCAGCGCGCTACCCCGCC
+AACGCAAGCGCGTCGTGGCAGACCCGCACCGGATCGGCCGCACCGGCGACGCTGGCGGCCGCCCGCCGCG
+CGGCCTCCCGGAACCTCGGCGACGACAACACCTCGTTGACCGCCGCCACCAGCGCGTCGGCGGTCAACGG
+CCGGATCAGCACCGCGCTACCCTGCCGGACTACCCGGTTGGCGATCTCCCACTGATCCCCGCCACCGGGA
+ACCACCACCATGGGCACCCCGGCCAGCAGCGTCTTGGCCACCATCCCATGACCACCGCCGCAGATCACCA
+GATCGGCCCGCGTGAGCAGCTCGGCCTGGCTGCCCAGCCCGGCCACCGCCCAGGGCGGCACCGTCAGGTC
+GGCTCCGCTCAAACGCGACACCACCAGGCGCGATCCCGACGGCACCGTCTCACCCGGCGTCAGAGACTGC
+AACGCGACCTCCGTCAATCCGGCGGTCCCGGTCAACGCGGTGGACGGCGCCACGACCACCACCGGCCCGG
+TGCCGGCGGGGATGGCCAGCACCCGATCGGTCGGCTCGAAATGCAGCGGGCCCACCACGACGGCCTCGGC
+CGGCCAGTCCGGGCGGGGAACCTCGAGCGCGGGCAGCGTGGCGATCAGCCGGCGCAGCGGCCCGGGATCG
+CGGGCCGGCAATCCGATCTCGACCCGAACGGCGGCACGCTGGCGCAGCCCGGCACGCCAGGACCGCCCCG
+TCAGCGCTCGCATGGTGGCATCGCGCAGCCGGCCGCGGATACCGGTGCCTGCAGCCAGTCCGCTGCCGAT
+CGGCGGCAGTCCCTTCGACGGCAGGTACAGCGGATGCGGGTTGAGTTCCACCCACGGGATCCCTAGCAGT
+TCGGCTGCCATGCCGCCGCACGCCGTGATGACGTCGGACACCACCAGCTCCGGTTCCAGAGCCCGCAGCC
+GCGGCACGTTGAGCACGGCCATCTGCGCCGCTCGCCGATGGATCCTGGCCCCGGCGTCGAGATCGCGGTC
+GGTGGCCGCCAGCCCGTCCAGCTCGACGGCGTCAATGCCAGCGGCGCGGGCGGCTTCCAGCCATTCCACC
+CCGGTGAACAGGGTGGGCGTGTCAGCGGCTGCGCGGAAACGCTGGCACAGCGCGATCGCCGGAAACGAGT
+GCCCGGGATCCGGCCCGGCGACCACGGCGACGCGCATCGGCCCTACCCTGCCACAGCGCCACAGCCGTAG
+GCTGACAGCCATGGCCGAGCTGACCGAAACATCGCCGGAAACCCCCGAAACCACCGAGGCCATTCGTGCC
+GTCGAGGCGTTCCTCAACGCCCTGCAGAACGAAGACTTCGACACCGTCGACGCCGCACTGGGCGACGACC
+TGGTCTATGAGAACGTCGGGTTTTCCAGGATCCGCGGTGGCCGCCGCACGGCAACGCTGCTTCGCCGCAT
+GCAGGGCCGCGTCGGCTTCGAGGTGAAGATCCACCGCATCGGCGCCGACGGCGCCGCGGTGCTCACCGAA
+CGCACCGACGCGCTAATCATCGGACCGCTGCGGGTGCAGTTCTGGGTCTGCGGCGTATTCGAGGTGGACG
+ATGGGCGGATCACCCTGTGGCGGGACTACTTCGATGTCTACGACATGTTCAAGGGCCTCTTGCGAGGCCT
+GGTGGCGCTGGTGGTGCCATCGCTGAAGGCAACGCTGTAGGCCGACCTTCCGGATCAAGCCCAACGCGCT
+GTAGAACATCGGGTAGCGCTACAGCCAGCCGGCTGCCCGGGCTTATCGCTACTCTGCGCGGCGGGCCAGC
+AAAGATGCGAAGTGTGGGCGAAACCGCAAATGCATCGCCTCGGCCGCTATACGATCCCCATGCACAGTCT
+TGAGGGTGAGCTGGCGATTTTGGGCCGACACGACGGGCTGTGGCGTGTTTGGAGGTCTCAGATGTCATTT
+GTGATCGCGGCACCGGAGTTTTAACGGCGGCAGCAATGGACTTGGCGAGCATCGGCTCGACAGTGAGCGC
+GGCCAGTGCCGCCGCATCAGCCCCCACGGTCGCGATCCTGGCCGCGGGCGCCGATGAGGTGTCGATAGCC
+GTCGCGGCGCTGTTCGGGATGCATGGCCAGGCATATCAGGCCCTCAGCGTGCAGGCATCGGCGTTTCATC
+AGCAATTTGTGCAGGCCTTGACCGCGGGCGCGTACTCGTATGCCTCCGCTGAAGCCGCCGCCGTGACACC
+GCTTCAGCAACTAGTCGATGTGATAAATGCGCCCTTCAGAAGCGCGCTCGGCCGCCCCCTGATCGGCAAC
+GGCGCCAACGGTAAACCGGGGACCGGACAAGACGGCGGGGCCGGCGGGCTCTTGTACGGCAGCGGCGGTA
+ACGGGGGATCAGGGCTGGCCGGCTCCGGCCAGAAGGGCGGTAACGGAGGAGCTGCCGGATTGTTTGGCAA
+CGGCGGGGCCGGCGGTGCCGGCGCGTCCAACCAAGCCGGCAACGGCGGCGCCGGCGGAAACGGCGGCGCC
+GGTGGGCTGATCTGGGGCACCGCGGGGACCGGTGGCAACGGCGGGTTCACCACCTTTCTTGATGCCGCTG
+GGGGTGCCGGCGGGGCCGGCGGCGCCGGTGGGCTGTTCGGCGCGGGCGGGGCCGGCGGCGTAGGCGGCGC
+CGCCCTCGGCGGCGGCGCCCAGGCCGCCGGTGGCAACGGCGGTGCGGGCGGGGTCGGTGGGCTGTTCGGC
+GCCGGCGGTGCCGGCGGCGCCGGCGGCTTCGGCGACACCGGTGGGACCGGCGGCGACGGCGGCAGCGGCG
+GGCTGTTTGGCGTCGGCGGGGCCGGCGGGCACGGTGGCTTCGGCAGTGCTGCCGGCGGCGACGGCGGCGC
+GGGCGGCGCCGGCGGCACGGTCTTCGGCTCGGGCGGGGCCGGCGGTGCAGGCGGAGTCGCCACTGTCGCT
+GGCCACGGTGGTCACGGCGGTAATGCCGGCCTGCTATACGGCACCGGTGGGGCCGGCGGAGCCGGCGGGT
+TCGGAGGGTTCGGCGGCGACGGCGGCGACGACGGTATCGGCGGGTTGGTCGGTTCTGGCGGCGCCGGCGG
+CAGCGGCGGCACCGGTACCCTAAGTGGTGGTCGCGGCGGGGCCGGCGGTAACGCCGGCACGTTCTACGGT
+TCCGGCGGCGCCGGCGGCGCCGGCGGGGAGAGCGACAACGGCGACGGCGGAAACGGCGGCGTGGGCGGCA
+AGGCCGGGTTGGTCGGCGAGGGCGGCAACGGCGGCGACGGCGGTGCCACGATAGCAGGAAAGGGTGGTAG
+CGGCGGTAACGGCGGCAACGCCTGGCTGACGGGCCAGGGCGGCAACGGCGGCAACGCCGCATTTGGCAAA
+GCCGGGACTGGCAGCGTCGGCGTCGGTGGCGCCGGCGGGCTGCTGGAGGGCCAGAACGGCGAGAACGGAT
+TGCTGCCTAGCTGAGCCAGCTTAGCCGCAGCTTGGCCTCAGCCACCGGGCGTGCGGCGGCCCATCGACCG
+AGGCACGTCGAAATCGGTGCACAACGCCCACCACGCGACGCGGGGCTCAACCCCGTCCTCGATCGCGCAG
+ATGGCATTGCGCCCACCGAAACCGGTCAGCACATGGTCCAACCAGCACCAAAAGCCCGGTACGCCGCGCC
+GAATCGCGGGCTGACCAACTCGTGGAACTCCGTCCGCCGTATGCCGCCAACCGCGTGCGTCAGCGCCTTG
+TGGCACACCCGCACCGGATCGGCTACCTAACCCGCACCGGATCGGCTACCTAACCCGCGCCGGCCGCTGC
+CTTGGCGCGGCACCCGGTCGGCCATCCACCGCAGATCCCCGCCACCGAACGCACCGAAACGCCGACCTTC
+GGCCCGCTTCGTATCCGGTTCTGGGCCTGCGGCATTTTCGAGGTACAGCGGGCACGCTATGGCATTACCA
+CTTCGGCGTCCAAGGCGCTGGTGCGCGGTCTGACCGCGTCGGCGTTCTCGTCGCCGCGGGCTACCCTGTA
+GCGAATGAGCGACAACGCAATCCGCCCGCGGCCCAACCCGTGGCAGTACATCCGCTATTGCTACGGGGCG
+CGGCTGCCGGACTCGATGCGAGACTGGGTGCGCAACGATCTGGCCGGCAAGGGTGCGGCCATCCGGATGA
+TGATCCGCGTCGCGGTTCCGGCGGTGCTGGTGCTGGCCCCGTTCTGGCTGATCCCGACGTCGCTGGACGT
+CCACTTGAGCATGACGTTGCCGATTCTCATCCCGTTCGTGTATTTCTCGCATGCGCTGAACAAGGTATGG
+CGCCGGCACATGCTGCGCGTGCACAATCTTGACCCCGAGCTCGTCGACGAGCACGCCCGCCAACGCGACG
+CCCACATTCACCGGGCGTATATCGAACGCTACGGGCCACGGCCGGACCCGAACGACTAACGCCGGGGCAA
+TCCGCCGAGCTCGTCAAACGCCTGCGCCCAAGCGACCAGGCGATCGGTGGCGCCGGCCAACTCCTCGCGG
+TAGCGCTGTTGTCCGGGCCCAGCCCCACCCGCGCCGTTCGCCGAGGAAACCAATTGCGCTGCGGCGGTGA
+CCATTTCGTTGTACTGACGGACGCCGGTGCTCAGCTGCGCGGTAAACGCGTTGATGGTCGGCACCAGATA
+CGACCGCGACGCCGCCGAGCATTGCACGGCCCGCTCCATCGAGACCACCTCGGCCGCGGTCGCCACCATC
+GCCGCCGAAGTCTGGTTGGCCGCGGCCGTTAGGTCGCGGATCTCGTCCGCCGGCAACATGGCGCCCCGCT
+CCATGACACCCAACAGCGAGAAGAACCCGCGTTCGGAGGCGCCCAGCGCCGACATCGCGGGTCGCGCGGC
+CGAGCCCGGTGGTGGCAGCCGGCGCACACTTGCGGGCCGCCGCACCGGCAGTGGCTCCGAGCGCAGCCAG
+CGGTAGCGAAGCAGCAATAGCGTCGCCGGAATGGCCTGCGTGACCGCAATCGTGCCGGTAATCACCAGCA
+GCGACGTAAACCAGCCCCAGGCCGCCAACAGCGCCGTCACCAACCCCCAGAGCAGACAGCCTGCGGTGAA
+TACCAGACCCCAGCGCAATGCACGGCGGCGGCGGCGCAGCAGCCGGGCACGCGGATCGATGGCGACGCTG
+ATCTTTTGTGCTACCAGGTCGGCCAAATCACCGGCGGTATCCACGCCGCGCTGCAGCAACGAACGCCACG
+GCCGGCGCTGACCCGCTTTCACTGCCATGCCGAACCGTCTGCCCAACTACTGACCGTAGGGCTGCTCGGC
+AATAGCCCCGCCAGAAGTCTCGGTGGCCGGTCTGGGGGTAGCCGTGGTCCCGCCGGCCGGCAACGCTTCA
+CCGCGCATCGATGCGCGGATCTGTTCCAACCGTGAATGACCGGCCATCTGGATCCCGGCCTGCTCCACCT
+CGAGCATCCGGCCCTGCACCGAACTCTCGGCAAGTTCAGCCGAACCGATCGCGTTGGCGTAGCGACGCTC
+GATCTTGTCGCGCACCTCGTCGAGGCTCGGCGTGTTGCCTGGCGCGGCGAGCTCACTCATCGACCGCAAC
+GATGCGCTGACCTGCTCCTGCATCTTCGCCTGCTCGAGCTGGCTGAGCAGCTGGGTTCGCTCGGCGATCT
+TCTGCTGCAGCACCATCGCATTTCGTTCGACGGCCTTCTTGGCCTGAGCTGCGGCGCTAAGCGCCTGGTC
+ATGCAGCGTCTTGAGGTCTTCGACGCTCTGCTCGGCGGTCACCAGCTGGGCTGCGAACGCCTCGGCGGCG
+TTGTTGTATTCGGTGGCCTTGGCAGCGTCTCCGGCGGCGGTGGCCTGGTCGGCCAGCGTCAGGGCTTGGC
+GCACATTGACCTGAAGCTTTTCGATGTCCGCCAGCTGTCGGTTGAGTCGCATCTCCAATTGACGCTGGTT
+ACCGATCACTTGCGCCGCCTGTTGAGTCAGCGCTTGGTGGGTGCGCTGTGCTTCCTCAATGGCCTGTTGA
+ATCTGCACCTTGGGGTCGGCATGCTCGTCGATCTTCGAGCTGAACAGCGCCATGAGGTACTTCCAGGCTT
+TAACGAACGGATTGGCCATCAGTTAGCTCCGCCTTCGCTTCTTGTGTGCGCCAGATGGTCTCAGCGCCCT
+GTCGCTCAATTTATCGGGTCAGCGCGCATTGCCCCACCCATGGCGCGCATCTTGTCGACCCGGACCGACC
+GGCGACCCTTAGGCCACCGCCAGCGACACCACCGGCGCAATGACGACCTTGGTGCTGGCGTCAATGGTGG
+CGCCGGTTGCTCTGCCAGCCGGGGTGGCGCGGGCAAGGCGCTCTTGACGCGCCATCCGCTCGCCCGCATC
+GATGAGCACCACCGACAACGGGAGCTGCAGAGCCGTACAAATCGCACTGAGCAGCTCGCTGGAAGGCTCC
+TTGCGACCGCGCTCGATCTCCGACAGATACCCGAGGCTCACCCGCGCCGAATCGGACACCTCGCGCAGCG
+TCCGACCCTGCGACATCCGCGCTCCGCGCAGCACGTCACCAACGACCTCACGCACCAAAGCCGCCATCAA
+AAACTCCTTGTCCACCTCGCAATCGTCATCAGGTGAACGCCGCCGGCGGTGGGGTTGGTTCCCGCAATCA
+GCTGGCGGTCTGGCGGATCCCCCCGATGTCCCGCAGAGCCCTGGCCACGTAATCGACACCAGTGATCACG
+GTGAGCAGGATCGCGGCGGCCATCACTACCACCGCCGCAACGTGCAGCGGACCCGAAAGTGGCAACACGA
+ATAAGCCAATTGCCACCGCCTGGACAAAGGTCTTCAGCTTGCCGCCCCAGCTCGCGGGAATGACACCGCG
+CCTAATAACCGCCAACCTCAAAACGGTCACTCCGAGTTCGCGGGTCAGGATTAGCACCGTGACCCACCAC
+GGCAAGTCGCCGAGCATCGACAATCCGATCAGCGCCGAGCCGATCAGAGTCTTGTCCGCGATCGGATCGA
+CAAACGCACCGAATTCGGTTGCCATCCCGTAATTGCGAGCCAGCAGGCCGTCGAATCGATCGGTAATGCA
+GGCGGTTGCAAATATCGCCCACGCCACTACGCGGGCCGCGGAGTGGTGGCCGCCGCCATAGAACAAGGCC
+AGCAGGAAGACCGGGACCATCACCAGCCGCAACAGCGTCAGGATATTGGCGAGGTTGGCAATGCGGGCGC
+GGCCTGCTATCTGACCCGTTTCAGGCTGCGCCGACACGGCAACAGAATAACGGGTTGACCTGCTCATGCG
+ACCCTTGATGTCGATACTGTTTCACACGTGACCGAGCGTCCACGGGATTGCCGGCCGGTGGTCCGGCGCG
+CGCGAACCTCCGATGTGCCCGCGATCAAACAACTCGTCGACACCTATGCCGGAAAGATCTTGCTGGAAAA
+GAATCTCGTGACACTCTATGAAGCGGTTCAGGAATTCTGGGTGGCCGAGCACCCGGACCTCTATGGCAAA
+GTCGTCGGTTGCGGTGCGTTGCACGTGTTGTGGTCGGATCTCGGCGAAATCCGCACCGTCGCTGTCGACC
+CGGCCATGACCGGCCACGGTATCGGCCACGCAATCGTCGATCGGCTACTGCAGGTCGCCCGCGATCTGCA
+GCTGCAGCGCGTGTTCGTGTTGACCTTTGAGACCGAGTTCTTCGCCCGGCACGGATTCACCGAGATCGAG
+GGCACCCCGGTCACCGCCGAGGTGTTCGACGAGATGTGCCGCTCCTATGACATCGGGGTCGCCGAATTCC
+TGGACCTGAGCTACGTCAAGCCCAACATCCTCGGCAACTCCCGGATGCTGCTGGTGCTGTAGCCCGGCGA
+GCAGACGCAAAATCGCCTCATTTCGGCACGAAATGGGCGATTTTGCGTCTGCTCGGCGGGCTACTCGCCG
+CCGTCACCCCGGATCGCGGCCAGTGTGCCCGCCAACTCGTCGGGCTTGACCAGCACCTCACGGGCCTTCG
+AGCCTTCGCTGGGCCCGACGATGCCGCGGGTCTCCATCAGGTCCATCAAACGGCCCGCTTTGGCGAAGCC
+GACCCGCAGCTTGCGCTGCAGCATCGACGTCGACCCGAACTGGCTGGACACCACCAGTTCCACGGCCTGC
+AGGAAGACGTCCATGTCGTCGCCGATGTCGGGGTCGACGTCGGTGCGCTCCGCGGTGGGTTTAGCCGTGG
+TGACGCCCTCGGTGTATTCGGGTTCGGCCTGTTCCTTGCAGGCGGTGACGACGGCGTGGATCTCTTCGTC
+GGAGACGTAAGCGCCCTGCAGCCGGAGGGGTTTGCTCGCACCCATCGGCAAGAACAGGCCGTCGCCCATG
+CCGATCAGCTTTTCCGCGCCCGCCTGGTCCAGGATCACCCGGCTGTCGGTCAGCGACGAGGTGGCAAACG
+CCAGCCGCGACGGCACGTTGGTCTTGATCAGCCCGGTGACCACGTCCACCGACGGGCGCTGGGTGGCCAG
+CACCAGGTGGATGCCGGCGGCGCGGGCTTTCTGGGTGATCCGCACGATGGCGTCCTCGACGTCACGCGGC
+GCGGTCATCATGAGGTCGGCCAACTCGTCGACGATGGCCACCACGTAGGGGTAGGGCCGATACTCGCGCT
+GGCTGCCCAGCGGCGCGGTGATGGCCCCGGATCGCACCTTGTCGTTGAAGTCGTCGATGTGGCGCACCCG
+GGAGGCCTGCATGTCCTGGTAGCGCTGCTCCATCTCGTCGACCAGCCAGGCCAGCGCGGCCGCGGCCTTC
+TTCGGCTGGGTGATGATCGGCGTGATCAGATGCGGAATGCCTTCATACGGCGTCAGTTCCACCATCTTCG
+GGTCGATCAGGATCATCCTGACCTCTTCCGGGGTGGCCCGGGTCAACAGCGACACCAGCATGGAGTTGAC
+GAAGCTGGACTTTCCCGAGCCCGTCGAGCCGGCCACCAGCAGGTGCGGCATCTTGGCCAGGTTGGCCGAG
+ATGAAGTCGCCTTCGATGTCCTTGCCCAGCCCGATCACCAACGGATGATGGTCGCGACGGGTCTCTCGTG
+CGGTGAGCACGTCGGCCAACCGCACCATTTCCCGGTCGGTGTTGGGTACCTCGATGCCGACGGCGGACTT
+GCCGGGGATCGGTGCCAGCATGCGCACGCTCTCGGTAGCCACCGCGTAGGCGATGTTGCGCTGCAGCGCG
+GTGATCTTCTCGACCTTGACGCCGGGCCCCAGTTCGACCTCGTAGCGGGTGACGGTGGGCCCGCGGGTGC
+AGCCCGTGACGGCCGCGTCGACCTTGAACTGGGTCAGCACCTCACCGATGGCGCCGGCCATGTGGGTGTT
+GGCCGCACTGCGTTTCTTGGGCGGATCACCGGATATCAGCAGGTCCAGCGACGGCAGCGTGTAGGGACCC
+TCGACGATCCGGTCCAGCACTTGGGTATCTTTGCGGCGGCCGCGTCTTCCGGAGCCCCGACCGGCGGAGG
+CTTCCGGTATCGTCGCAGTGTCATCCTGCGGAACCTCGGCCGACGGCCAGGCCGGTGGCCCGTCGTCGGA
+GCACAGGGGCACCTCGTCGTAGTAACCGTCGGAGAAGTCCTGGCGGGCGACTTCGACGGTGTCCGCGTCG
+TCACCATCGAAGTCCGCGAAGTCCTCGAAGTCGTCGGCGTATTCCCGTGGCAACAGCCGGGTGCCGAACA
+TGGCGCGCATGGCATCTGGCACCTCTCGGATCGTGATCCCGGCCAGCAGGAGCAATCCGAACAGCGCGCC
+GATGAATAACAGCGGCGCGGCGATCCAGGCGGTCAACCCGTCCGAGAGCGGCCCGCCGATCGCGAAACCG
+ATGAACCCCGCGGCGCGCAAACGCGACTCCGGGGCCTCGGGTGAGCCCGCCCACAGGTGGCACAAGCCGA
+GAAACGACAAGCCGATCAGGCTGGCGCCGAGGATCAGCCGCGGCCGCGAATCGGGGTTGGGCGACGTACG
+CATCAGCACCACGGCCACGGCGGCGGCAACCAGCGGGAGCATGACCACTGCCGACCCGATGAACGTCCGC
+AACAAGGCGTCGACCCACGCGCCGAGCGGCCGGGCGGCGTCGAACCACGAGCTCGCGGCGACTACCACGG
+CAAGGCCGAGCAGCACCAGCGCGATTCCGTCGCGGCGATGCCCGGGCTCGATGTCGCGGGCTCGCCCGAT
+CGACCGCGCCGCGCCGCCGGTGCCCTTGGCCGCCATCATCCAGACGGCACGCATGGCCCGGCCGCAGGCG
+AGTCCGGTAGACACCAGCAGCGACCGATGGTGCCGTCGGGAGGGTCTGCCGACCCCTTTGACGGGCCTCG
+ACCTCTTTCTGGGCACGGCCGATCGCGCACTTCGGGACGCGCCCCGCGAAGTGGCCTTTGACCTGCTCGT
+TCGAGTGCCGGAGCGGGCAACGGTCTTGCTAGACATAACGGCAAGCCTAGTCGCTATCACACCATCTACA
+CCATCCGCCACACTGGTAACGGCGATCTGCTCGCCTCGTTGCCAGGGTCTCCTGAGTAGGGTGACAAGTG
+ATCGTGCCGCGTCACGCCGCCCGACGCGCGGAGTTCCAGGAGGCCCCAGCATGCCCGTCGTCGTCGTCGC
+CACGCTGACCGCCAAGCCTGAATCGGTCGACACCGTCCGCGACATCCTCACCCGCGCGGTCGATGACGTG
+CACCGCGAACCCGGCTGCCAGTTGTACGCGCTCCACGAAACCGGCGAGACCTTCATCTTCGTTGAGCAAT
+GGGCCGATGCCGAGGCGCTCAAGGCCCATAGCGGCGCCCCCGCGGTTGCCACCATGTTTACCGCGGCCGG
+CGAGCACCTGGTCGGGGCGCCGGACATCAAACTGCTGCAGCCGGTTCCCGCCGGCGACCCGAGCAAAGGG
+CAGCTGCGCCGGTGATCGACCGGCCACTCGAAGGCAAGGTCGCCTTCATCACCGGCGCCGCGCGCGGCTT
+GGGCCGCGCACACGCGGTTCGACTGGCAGCCGACGGCGCGAACATCATCGCGGTTGACATCTGCGAGCAG
+ATCGCCAGCGTGCCTTATCCGTTGAGCACCGCCGACGACCTGGCGGCCACCGTCGAGCTCGTCGAGGACG
+CCGGCGGCGGGATCGTGGCCAGACAGGGCGACGTTCGCGATCGCGCATCACTGTCGGTCGCATTGCAGGC
+GGGCCTTGACGAGTTCGGCCGGCTCGACATCGTGGTGGCCAATGCCGGTATCGCGATGATGCAGGCCGGC
+GACGACGGCTGGCGCGACGTTATCGACGTCAACCTCACCGGCGTCTTCCACACCGTACAGGTGGCGATCC
+CGACCCTGATCGAGCAGGGCACCGGTGGGTCGATCGTGTTGATCAGCTCGGCCGCGGGACTGGTCGGCAT
+CGGCAGCAGTGATCCCGGATCGCTTGGCTACGCGGCCGCCAAGCACGGCGTCGTCGGCCTGATGAGGGCG
+TACGCGAACCATCTGGCACCGCAAAACATTCGGGTTAACTCGGTACATCCTTGCGGGGTCGATACGCCGA
+TGATCAACAATGAGTTCTTCCAGCAGTGGCTAACCACTGCTGACATGGACGCGCCGCACAACCTGGGTAA
+CGCGCTGCCCGTCGAGCTGGTGCAGCCAACCGACATCGCCAACGCGGTGGCATGGCTGGCGTCCGAGGAG
+GCGCGCTATGTCACCGGCGTCACCTTGCCGGTCGACGCGGGCTTTGTGAACAAGAGGTAGCTGATGGCTC
+GAAATCCCGCTGCGCAGACCGCCTTCGGCCCGATGGTGTTGGCGGCCGTGGAGCAAAACGAACCACCTGG
+CCGCCGCCTGGTGGACGACGACCTCGCGGACTTGTTCTTGCCCAGACCATTGCGATGGCTGGCCGGTGCA
+ACCCGGTCGGCGGTGTTGCGTCGTTTACTCATTAGCGCCTCGGAGTGGTCCGGCCGCGGGTTATGGGCCA
+ATCTGGCCTGCCGTAAACGCTTCATCGGAGACAAACTCGACGAAGCGCTCGGCGACATCGACGCGGTTGT
+CATCCTCGGAGCCGGATTGGACACCCGTGCCTACCGGTTGACGCGACGAGTGCGGATGCCGGTATTCGAG
+GTCGACCTGCCGGTCAACATCGCCCGCAAGGCCAAGACGGTCCGACGGGTGCTCGGTGAACTGCCGCTGT
+CGGTTCGCTTGGTTGCATTGGATTTCGAGCATGACGACCTGCTCACCGCTCTGGCCGAGCACGGCTACCG
+TACCGAGTACCGGGTGTTCTTCGTCTGCGAAGGTGTGACCCAATACCTCACCGAGCGGGCCGTCCGGCGG
+ACCTTGGAGGGCCTACGCGCGGCCGCACCGGGCAGTCGAATGGTATTCACCTACGTCCGCCGGGACTTCA
+TTGACGGCACCAACCGTTACGGTACCCGGACGCTATACCACACGGTTCGCCAGCGACGTCAACTGTGGCA
+CTTCGGCTTAGATCCCGAGGAAGTAGCCGGGTTTCTCGCCGACTACGGTTGGCGGCTGACCGAGCAGGCC
+GGGCCGGAGGAGCTTGTCCAGCGCTACGTCGAGCCCACCGGCCGCAACCTCAACGCATCACAAATCGAGT
+GGTCTGCCTACGCCGAGAAGAGTGAGCCGGTTACACCTCGATGACCGTCGGCACAATCATCGGCTGGCGG
+CGATAGGTTTCCCCCACCCACTTGCCGACCGTGCGGCGCACCCCTTGAGCGATCCGGATCGGATCGGTGA
+CGTTGGCGGCCACCAACGATTCCAGCTCTGCCTCCACCTTGCGCACGGCGGGTTCGAGCGCCTTGGGATC
+TTCGGAGAAACCCCGCGAGTGTAGATGTGGCGCAGCCAACGGCTGGCCGGTGCCACGTCTGACCACGACG
+GTCACCGCGACAAAGCCCGACGACAAAATGAGCCGCTCGCCCAGGGTGATATCGCCGACGTCGCCGGCGA
+TCAAGCCGTCGACGAACATCTTGCCCACCGGCACCGCACCGGAGATACTGGCTTTGCCGGCAACCAGGTC
+GACGCTGACACCGTTCTCGGCCAACAGAATTGACTCTTGCGGTACGCCGGTACTGGCGGCCAGCTTGGCA
+TTGGCGCGCAGCATCCGCCAGGTTCCGTGCACCGGCATCACGTTGCGCGGCCGCACCCCGTTGTAGAGGA
+ACAGCAGCTCACCGGCGTACGCGTGGCCGGAAACATGCACCCTTGCTTGGGCGTTGGTGACGACTCTGGC
+GCCGATCTTGGACAGTGCATCGATGACTCCGAAGACCGCCTCCTCGTTGCCGGGGATCAGCGACGACGAC
+AACACGATGAGATCACCAGCAGTCAACGTGATGCTGCGATGCTCCCCACGCGACATTCGCGACAACGCCG
+ACATCGGCTCGCCTTGGGTGCCGGTGGTGATCAACACAACTTGGTCGGGCGCCATCGTTTCGGCGGCGGC
+GATGTCGATGAGATCGGAATCAGCCACTCGTAGGAAGCCCAGTTGCCTTGCGACGCGCATGTTGCGCACC
+ATCGATCGGCCGACGAACGACACTCGCCGGCCCAATGCCACTGCGGCATCGATGATCTGCTGTACCCGAT
+CCACGTTGGAGGCGAAACACGCAACTATCACCCGTCCGTCGGCACCCCGGATGAGCCGGTGCAGCGTTGG
+GCCCACTTCGCTTTCCGATGGCCCGACACCGGGGATCTCGGCGTTCGTCGAGTCGCACAGCAACAGGTCC
+ACGCCGGTGTCGCCGAGCCGCGACATGCCCGGTAGATCGGTGGGACGGCCGTCCGGTGGCAATTGGTCGA
+ACTTGATGTCGCCGGTGTGCAGGATGGTTCCCGCGCCGGTATACACCGCGATGGCCAACGCGTCCGGAGT
+GGAATGGTTGACGGCGAAGTACTCGCACTCAAACACGCCGTGCCGGGTGCTCTGGCCCTCGCGGACCTCG
+ACGAACACCGGTGTTATGCGGTACTCACGACATTTCTCTGCAACCAGAGCCAAGGTGAACTTCGAGCCGA
+CGACCGGGATGTCGGGTCGCAGCTTGAGCAGAAACGGAATCGCCCCGATGTGGTCCTCGTGCCCGTGGGT
+CAACACCAGCGCCTCGATGTCGTCAAGCCGGTCTTCGACATGGCGCATGTCCGGCAGGATCAGATCGACA
+CCGGGCTCGTCGTGGCCAGGAAACAACACACCGCAGTCGATAATCAACAGTCGGCCCAGGTGTTCGAAAA
+CCGTCATGTTGCGGCCGATTTCGTTGATGCCGCCCAGCGCGGTGACCCGCAACCCGCCGGAGGTCAGGGG
+ACCTGGCGGGGGAAGGTCTACATCCACTTCTGGGCCACCCTTTGGCTCACCTTTAGATCACCGAAGCACC
+GAGGCCGCGCGCATGTCGGCGGCCAACGCGTCGATCTGCTCCGGTGTCGCGGCCACCTGGGGCAGCCGGG
+GATCACCGACGTCGATGCCCTGCAGCCGCAAGCCCGCCTTGGACAACGTCACCCCACCCAGGCGGCTCAT
+CGCGTTGCACAGCGGGGCGACCGCAATGTTGATCTTGCGGGCGGTGGCGATATCCCCAGAACCGAAGGCG
+GACAACAACTCTCGAAGCTGCCCGGCTGCCAGGTGGGCAATCACGCTGATGAAGCCCGTGGCGCCCATGG
+CCAGCCAGGGCAGGTTGAGCGCGTCGTCGCCGGAATAGTAGGCCAGTCCGGTGTCGGCCATGATTTGGGC
+GCCGCTGTGCAGGTCGGCTTTGGCGTCCTTGACTCCGACGATGTTCGGATGCGACGCCAACGCGCGGATC
+GTGTCGGGCTCGATCGGCACCGCCGACCGCCCCGGGATGTCATAGAGCAGCATCGGCAGCTCGGTCGCGT
+CGGCGACGGCGGTGAAATGGGCTTGCAGCCCCCGCTGCGGCGGCTTGGAATAGTAGGGCGTGACCACCAG
+CAGCCCGTGCGCACCCTCGGCCGCACAAGCCTTGGCCAGCCGGATGCTGTGCGCGGTGTCATAGGTGCCG
+GCACCGGCGATAACACGGGCCCGGTCCCCCACCGCTTCCAAGACGGCCCGCAGCAGCTCGATTTTCTCCC
+CGTCGGTGGTGGTCGGCGACTCGCCGGTGGTGCCCGAGACCACCAGACCGTCGCACCCCTGATCGACCAG
+GTGGTTGGCCAGCCGCGCCGCGGTGGCGGTGTCCAGGGAGCCATCGCCGCTAAACGGTGTCACCATCGCG
+GTCAGCAGGGTTCCTAGGCGCGCTGCGACGTCGAATCCGACGGTGGTCACGGCTCCCAAGGTTACCTGGC
+GCTTTATCCCGGCCGCGAGCGCGCGTGTTTGTCCAGCGACACGCCGCCTCAGGCTTCGGTCGCCAACGGG
+CTGGTCGCCACCTCGGTGCCGTCGGCCAGGGTGGTCACCTCGAAGTCGGCGAACACCGCGGGGGCCACGG
+CGGCGAGCTGGCGCAGGCATTCGATGGCCAGTCGCCGGATTTCCACGTCGGCGTGCTCGCTGGCCCGCAT
+TGCGATGAAGTGCCGCCAGGCCCGGTAGTTGCCGGTCACCACGATGCGGGTTTCGGTGGCGTTGGGCAGC
+ACCGCGCGGGCGGCTTGGCGGGCCTGCTTGCGGCGCAGGATCGCGTTGGGTTGGTCGGCGAACTTGGCTT
+CCAGCTTGGCCAGCAGCTCGCTGTAGGTGGCGCGGGCGGCGTCGGCGGCCTCGGTCAGGATGTGGCGCAG
+GTCGGCGTCGTCCTCCATGCCGGGCGGCACGACGACCCGCGAGTCCTTCTCGGGTACGTAGCGCTGGGAG
+AGCTGCGAGTAGGAGAAATGCCGGTGGCGGATCAGCTCGTGGGTGCACGATCGCGAGATCCCGGTGATGT
+AGAACGACACGCTGGCATGCTCTAGCACCGAGAAATGTCCGACGTCGATGATGTGCCGGAGGTAGCCGGC
+GTTGGTGGCGGTCTTGGGATTGGGCTTGGACCAGCTCTGATAGCAGGCCCGGCCGGCGAACTCGACCAGC
+GCGGGTCCGCCGTCGGCGTCGGTGGTCCAGGGCACGTCGGGTGGGGCCAAGAAGTCGGTCTTGGCGATCA
+GTTGCACGCGCAGCGGCGCGGTCTCGGCCACGGCGCTCACCTTAGCGCCGGCCGCAACTAGACGAACTCG
+GTGTGGCAGGTCAGCCCGGGCTCCCGGCGCAGACGCGGGTCCGCGGTCAGCAGGGGGATGTCGAGGTGAC
+TGGCCAGTGCCACGTAGAGGGCGTCGTAAAACGTGAAGTTGTGCCGCAGGGTCCACGCCCGTCGAGCGTC
+CGCGTTGGCGCTGGCTCCCAGAGTTGAACCCCACCAAATCTGTTGCCTGAAGAAGCCGATCTACCTAACG
+GGGATCGTTGCCCTTGAAGTCGCGAACAAATAGGCAAGTGTCCAGCGGCCAGATCGGACCCGCAACGAAA
+GTTGCGGTACCAATCGCCGCACCGCTCCTGCCGATGGCTACACCGGGACCATCGTACGCAGCTGTGTCAT
+GCATACCGGTCACCCCGAATGACCCGATAACAGGTACCGTTCCAGATCCCCGCGACGCCGCAGGAAGATC
+ATGTCCTCGCTGCAGCTCAAGGACTTCCCCGAACCGCAAGGTTTTCCATCCATCACTCATCTAAGCCGCC
+CCAGTTGCTCCCGCACGACCCTTTCCAGCCGCGCCGACTCATCGAACGCCTCCAGCAACGCCTTCGACAA
+CCGGGCCATCTTCTCGTCGATCGGCTCTCCGTCGTCCTCGACCGCGGGCGTACCCACATACCGCCCCGGC
+GTGAGCGCATAGTCGGTCGCCTTGATCTCCGCCAACGTCGCCGACTTACAGAACCCCGGAACATCCTCGT
+ACATAATCCCTTTGACGGCAGCCGACTTCGACCCGCGCCACGCGTGGAAGGTATCCCCGATGCGGACGAT
+CTCCTCGTTGGTCAGCGCCCGCTCGGCCCGGTCCACTAGGTCGCCCAGTTCACGAGCGTCGATGAACAGC
+ACCTGCCCGCACCGGTCGATAGACCCTTGCTTACCTGCCGCCTTGTCTTTGGCGAAAAACCACAGGCACA
+CCGGGATTCCGGTGCTGCGGAACAGCTGGGTGGGTAACGCGACCATGCAGGAAACCAAATCCGCCTCCAC
+GATCTGCGCGCGAATATCCCCCTCGCCGTTGGAGTTCGACGACATCGACCCGTTGGCCATCACCACGCCC
+GCCCGACCTCCCGGCGCCAACTTGTACAGGATGTGCTGAATCCATGCGTAGTTGGCGTTATTGGCGGGCG
+GAACACCGAAGCGCCAGCGTGGGTCTTCCTCGTTGCGGGCCCAGTCTTTGATGTTGAACGGCGGATTGGC
+CATCACGTAGTCCATCTGCACGTCCGGGTGCTGGTCGCGGGCGAAGGTATCACTCCATCGGGCGCCGAGC
+CCCTTGTTGTCGATGCCGTGGATGGCGAGGTTCATCTTCGCCATCCGCCAGGTCTCCTCAATGCTTTCCT
+GGCCATAGATCGAGACATCCTTCGGATCGCCGTCGTGTTCGTAGATGAACTTCTCGGTCTGCACAAACAT
+GCCTCCGGAACCGCAGCACGGGTCATACACCCGCCCACTCGACGGCTCCAGCACCTCCACGATCACCTTG
+ACCACGCTGGGCGGGGTAAAGAACTCGCCACCCCGCTTCCCTTCCGCGCGAGCGAAATTGCCGAGGAAGT
+ATTCGTAGACCTCACCCATCAGATCCCGGGCGCGGTGCTCGCCCTGCCGGCTGAAGCGCGCACTGTTAAA
+TAGGTCGATCAGCTCACCGAGCCGGCGCTGGTCGATGTTGTCCTTGTTATACAGCCTCGGCAGCGTCCCA
+CCGAGTGTTGGATTGGCCTTCATTACCGCGTCCATCGCCTCGTCGATCAGCTGACCGATGTTCTTCGCCG
+GCTCACCACCAACGGCTGGCTTGCCTTTTGTGTTCTCTGCCAAGAACTTCCAGCGCGCACTCACCGGCAC
+CACGAATACGCCGTAACCCTGGTACTGCTCGGGATCGTCGATCAGGTCTTCTATCTGAGACTCCTCCATT
+CCTTCGGCCGCCAACTCGGCACGGATTGCCTCGCGCCGTTCGTCATACGCGTCGGACACGTACTTAAGGA
+ACACCAGGCCGAGGATCACGTCCTTGTATTGGCTGGCCGACAGCGACCCGCGCAGCTTGTCGGCGGCCTT
+CCAGAGCGTGTCTTTGAGCTCCTTCATCGTCGACGGCGCCTGCGGCGCCTGCTTCTTCCTGGGCGGCATT
+CCCGTTTCCTTCCTATCGATGCGCCGCGGCGATGCCGGGCGTGGTGGGCCAGCTCCTCGACAACACGAAG
+GTCGCATCGGGCGAATCACGCTGTCCCTGGGGCCACCACCCATTCCACGGGTTGCCGTGTGATGGCGGCG
+ATGCGTTCGAAGTCTTGGTCGTAGTGCATGACGGGTATGCCGTGATGCTCGGCGACCGCCGCAATGATCA
+AGTCCGGGATCTTGACCGAGCGGTGAAATCCCTTGTCGGTCAATGCTTCTTGGATCTCCCATGCACGAAC
+CCACACGGTGTCGGGGGTGTTGACGTATTCGAGCGCGTCACGCCGGTAGGTGCCCAGTGTTCGATGGTCC
+TCGCGGGAACGCGCCGAGACTCCGAACTCGAGATCGGTAATGCCGCACCGGGCCAGTAGACCGCGTTCCA
+TCAACGGTTCCAAGCGATGTCGGACCGCGGGCAAGTGCGCGCGGTAAGCCGCTGATTTGTCGAGCAAATA
+GCGCGTGGTCATGCCGTGTTCTCTGGGTGGCCGTCTCGCCACATTGCGTTGACCAGAGCTTCGTCCTGGG
+TTCCGGTGGCGTTCTCGGCCATCCGGTTCATGAGCGAGCGCGCGGCACTGGCTCGCAACGCGGCCCGCAG
+CGCGGCATGCACGGTGTCTTTCTTTGTCGTGGTACCCAGTTCCTTGGCGGCCCGAGCGAGCAGGTCGTCA
+TCGATGTCGATCATGGTGCGCGTCACACCCGGAGAGCATACTACTAATGCATATCCGCGATGCATATAAC
+GGATGTATCTCAGGCGGGGCTCAGGTGCACGCGGGCCGGATATCGGTATGCGTGAAGTCATCGCCACGAA
+ACAGCAGCGGCTCCCCGGTGACCTGGGCCAGGGCGTAGCTGTAGGTGTCGCCGAGGTTGAGACGGGCCGG
+ATGGCCGCTGCCGCGGCCGTAGTCGCGATACGCCTGCGCGGCCACGCGGGCTTGGTCGGCGTCGACGGCT
+TCGACCTGGATTCCGTAGTCGTCCAGCAAACGGTCCACCAATCGAGAGATCTCCGGCCGGTCCCGCCGCT
+GCATGATCGCGCACAGTTCGACGTAGTTGGGCGCGGACATTCGGGAGTTCGGTGACCGCTCCAGCGCCTC
+CTTGAGCACCTGCGCGCCCGATTCCCCGCTCACGATGGCGACGATGGCCGACGTATCGACGATCACCGGG
+GCAGACCGCTGTCATCGTAGAGGTCGACCTCGTGTCGCCGAATCAGGCGCTTGTCGTCGTCGCTGAGCAG
+CTTGTCGAGGTCGCGCAGGGTCTGTTCGGCGGCGGCGCGCCGGGCCTCCGCGCGTGCCCTGTCCTCGCGG
+TCCAACTCCGAGAGGCGGCGCGCGACGGCGTCCTCGACAGCAGCCGTCTGGTTGGTGCCGGTGCGTGCGG
+CCAGTTCCCGCACCAGCGCCACGGTGCGCTGGCTCTTGATATTGAGGCTCATGGTAGAAGGCTACCGGCC
+AGCGGGTAGACCATCTATCCCGGACATCAACAGCGGAAGCAGCGCATCGCGGCAGGATGCCAGGCGTGCG
+GATTCAATCCGCCGCTCGTTGCACAGCGCACCCAGGTTCGCGATTGCGGCCGCGTGTCCGGGAGTCAACC
+GGCGCACATCGCGCACCCAAACCCGCAACAGCTGGGTCGGTTGGATTCGTTGCCGGCTTCCCGTCATGCC
+CCCGACTAACTGCCGCAGTTCTGCCAGGACATCGGGTTGTCGCAGCGCCGCCCACAGGGCCGAAGTGTCG
+ACGCCGACTGGCCGCAGCACGACGAACTCCGTACTCGCCAGCGCCATTTCCGACGGGAGGCTGGTGATGT
+TCCAGATTCGCGGGATTCTTGGATTCAGTTTCGGGAACAACACACACGGCTGCGACACGACGAGCTTTGC
+GCTCCTGATCGTTCGCCCACCGACGCGACTGGGCTGGGCGCCGCCGTCGAATGCCGCGAAACTGTAATGG
+GCGACGGTGCTATCGAAGTGCTGCGCATCAAGACATGCGGTTGACCTGCTCGCCAGGCTCGACAACGGCA
+CGTATGCAGAGAGCCGCCCGACGATCGCAAGCATCAACGCCTCGGCGGCTTCGATGACACGGTCGTTGGC
+GGCGATCTTGTCGTCGAAGGCGCCTAGGATCTCGCCGATTCGAGGGCGGTCGGGCGCGGCGACGGCCGAT
+ACCGAAACGTTCCGCAGAACACCCTGACTCAGCAGGGGCTGTCCCGATCCGGCCCGATATCGGTTGAGCC
+CGAAACCCAGTAGCGCGTAATACCAATATCGGGTTTCCTCGGGCTTCTTGGCCCGACACGCCAGCGCGTT
+GTCGGTCACCCACACGTCGGAATCGCAATAGCGCAGGCTACCGCAGTACGAGCCGACGCGGCCGACGACG
+ATCAGCGGGCCACGCGCGTTGTGTTGGGCGGAATATCCGATAACCCCGTTTGCACCATAGACGGGATAGC
+GGCCGCCGGGCTCGCTCGCTGGCGACGTATGGCCAGACGTATGGCCATTCGAGAAGTCGAGATGGTCCCC
+TAGCCTTACCTTTTCGACTTTCTCGACGCGGCTCATCCGTTAGTCCGCTTGGTGGCCGCGCACAGTTCCC
+CAGCCAGATCACCCCGGGTGGACACGGCGATCCCCCCCAATCCCAGCCACGACGCCATCGACGCCAGCTC
+GCCGGCCAACCCCTCGGCAACCGTGACCGGCGGTATGTCGAGTTCGCCAAGCACGCCCGCCACGGGCAAG
+CTGTCCGCGGCGCGGTCGGTTTTGCGGTCCACCCGCGCAACCGGGTGTCCGTCAAGGGGCCGCACGTAAT
+ACAAGTGCCGGCGTTTGGCCGCCACTGCCGCCGAATCCAGCTACCGCACTTGGATTCGCGAGATCAGCCG
+CTTGCGGTCGGCACCGGCGATCGGGCCGGCCGACCCGGGTTCGGCGACGCCTCCTACGACGACGGCCGCC
+CGGCGGTCCCACGCAGCAGTCGCGGCGCTCATGAGCGCGCGCCGCGACGATGCAGTGGGGGTACCACCCG
+CTTGCGGGGGACGAAGCGATGAGGAGAAGCGGCGCTCATGAGCGGTGGTAGCTGTACAACCGGTACCGCA
+ACCCGGACCGGCTGAAGCGCCACTCCCCCGTCTCGCCCCGCCATGTCTCGTCCAGCACGGGGGCCAGCGC
+GTCACCGGCTTCGCGCGGCAGGCCGATGTCGACCTCGGTAACCTCACATCTGGTCGCGTACGGCAGCGCC
+AGCGCATAGACTTGTCCGCCTCCGATCACCCACGTCTCCGGGCTGGTCAGCGCCTCCTCGAGTGAACCGA
+CAACCTCAGCCCCGCTGGCCATAAAGTCAGCTTGGCGGCTCAGTACGACATTTCGCCGGCCGGGCAGCGG
+CCGGACTTTAGCCGGCAGCGAATCCCATGTGCGCCGGCCCATCACGATCGTGTGCCCCATGGTGATCTCC
+CGGAAATGCGCCTGGTCCTCGGGCAAGCGCCAGGGGATGTCGCCGCCGCGGCCGATGACACCCGATGTCG
+CTTGAGCCCAGATCAGCCCCACCATCGTCACACGCGTCACTCCTTGATTCCGGCTTGAAGGCTGTCCGAG
+CCGACTTCATTGTCGTCGGCGCGCCTCATACCGCGACTGGAGCTTTGATCGCCGGATGCGGATCGTAGTT
+CTTCACAACGATGTCTTCATAGGTGTACTCGAAGATTGAATCCCGGTCGGCTAGAAGTAGTTTCGGATAT
+GGCCGCGGCTCGCGGCTGAGCTGCAGCCGTACTTGCTCGACGTGATTGTCGTAGATGTGGCAGTCGCCAC
+CGGTCCAGATGAACTCGCCGACCGACAAGCCGGCCTGGGCGGCCATCATGTGGGTGAGCAACGCATAGCT
+GGCGATGTTGAACGGCACACCCAGAAACAGGTCGGCGCTGCGTTGGTAGAGCTGACAGCTCAGCCGGCCA
+TCGGCGACGTAGAACTGGAAGAACGCATGACAGGGCGGCAGCGCCATCCGCTCGATTTCGCCGACGTTCC
+AGGCCGACACGATGATGCGCCGGGAATCGGGATCGGTGCGCAGCAAATCCAGCGCCGCGCTGATCTGGTC
+GATGTGCTCACCGGATGGAGCCGGCCACGATCGCCATTGTACACCGTAGATCGGCCCGAGTTCGCCTGTA
+TCACTTGCCCATTCGTCCCAGATGGTGACTCCGTGCTCGTGCAGCCAACCGATATTGGAATCGCCGCGCA
+AAAACCACAGCAGCTCGTAGGCTACCGATTTGAAATGGACTTTCTTGGTAGTGAGCAGCGGGAAACCGGC
+CGACAAATCATAGCGCATCTGCTGGCCGAACAGGCTGCGGGTTCCGGTGCCGGTGCGGTCGGATTTGGGC
+GTACCCGTTTCGAGCACGAAGCGCAGCAGGTCCTCGTATGGCGTCACGATTGACACGCGGTCAGCCTAGC
+GGCGATCGCAAGCGCGGCGAAGCCGCCGCAGCGACTCGCCGCCAAACAAACCCAGCGGGCGATCGCAAGC
+GCGGCGAAGCCGGGCACAGCGAGTCGACGGGAATACACCCAGATCCGCGCCACAGGAGTACAACGGAGGC
+CATGCCGAAAACCACCGACACCGCCGCTACTCCTGACGGCACCTGCGCCGTGCGTCTGTTCACTCCCGAT
+GGTCCGGGCCGCTGGCCCGGTGTGGTGATGTTTCCTGACGCCGGCGGCGTTCGGGACACCTTCGACCGGA
+TGGCCGCCAAGCTAGCCGGATTCGGTTACGTGGTTCTGCTTCCCGACGTGTACTACCGCGAAGGCGACTG
+GGCTCCATTCGATATGAAGACCGCGTTCGGCGATCCGCAAGAACGCGCACGGATCATGTTTATGATTGGC
+ACCCTAACGCCCGACCGGGTAACCCGTGATGCCGATGCGCTTCTCAACTACCTGGCCAGCCGCCCGGAGG
+TGATCGGGGACCGCTTCGGTGTCTGCGGCTACTGCATGGGCGGGCGAATGTCGGTGGTGGTGGCCGGCCG
+CCTGCCGGATCGTGTCGCCGCCGCGGCAGCTTTCCACCCCGGCGGTTTGGTGGCCAACAGCCCGGACAGC
+CCGCACTTGCTGGCCGACCGGATCAGCGCCACCGTCTACATCGGCGGCGCGGAGAACGACCCGTCGTTCA
+CCGCCGACCACGCCGAGAAACTCGACAAAGCGTTCAGCGCGGCCGGCGTGCCGCACCGCATCGAGTGCTA
+CCCGGCCGCCCACGGGTTCGCGGTCCCGGACAATCCGTCTTATGACGCCGCAGCCGACGAACGCCATTGG
+GCAGCAATGACAGAGACCTTCGGCGCAGCGCTCAACTAGCCCCGCCAAGCAGACGCAGAATCGCATTAAT
+CGCGCCCGGTTTGTGCGATTCTGCGTCTGCTTGGCAGCACCTCAGGCGCCGCGACGTCGATCCCGATGAT
+GATTCAGCCGACGCCGGTCCGCGGTGCGCCCCGCGAGCTACGCGTCGAGTTGCGTCCGCGGCAGTGCGTG
+GACGCACTTTCCACGGGGCAAAGGCGCCCCTACACCGGCGCGGTCAATGCTCAGTGCTGGGTGCGGCCCG
+GAATCCCAGCGCGTTGCCGAGCAGTAGACCGCCGTCGATGATCATGGTTTCGCCGGTGATCCAGCTTGCG
+GCATCCGAAACCAGGAACGCGACCGCGCTCGCTATGTCGGCCGGCTCCCCGATTCGTCCGAGCGCAATGG
+TCGCCGCCAACGGATCCTCGTGGTCCTTCCACAGCGCCTCGGCAAGCCTGGTGCGAACCACCCCGGGACA
+GATCGCATTCACCCGGATGCGCGGTGAAAGCTCCAGCGCCAGCTGCTTGGTGACGTGGATCAGCGCGGCT
+TTGGTCGCGTTGTACATGCCCATGGCCGGGGACTGGTGCATCCCGCCGATGGAGGCGGTGTTGACCACCG
+CGCCGCCGTGCTCGCCCATCCACGCCGTCACGACGAGCGAGGTCCACATCAGCGGTGCCCACAGGTTGAC
+GTCGAAGATCTTGGCGAAGCGGGCGTGGTCCTGCTCGAGCAGCGGACCGTAAGCCGGGTTGGTTCCGGCG
+TTGTTGATCAGGATGTCAACGCTGCCGAAGCGCTCGAGGGTGAGGTCCACACAACGCCGGGCGGCATCCT
+CGTCGACCGCGTGTGCACCAACGCCCAGGGCGCGGTCGCCGACCTGTGCAGCAGCCTCGTCGGCAGCTTC
+CTGCCTGCGTGCGGTGAGCACCACATGGGCGCCGGCAGCTGCCAGCTGTTGGGCGATGGCAAGCCCGATG
+CCTCGCGATGCGCCAGTAATTATGGCGGTGCGGCCGGTCAGATCCAGTGAGGTCATTTGGCTTGCCTTCG
+GTTGCTGTGGTGGCCGGACTCCGCCGGCGGGGAGCGTCGGTAGCGCCCCCGCACCGTATGCGACAAGAAT
+GCTAGCGAAATCAAACCCCACGAAACCACCGGTAGTGGTGGTGCTATCGCGATTGCCGTAGCCTGCACAA
+CCTCACGCCAGACTTGAGCCACTGCGACCATCTGCGGCGTGTCGCGTGCGTGGTTTAAGTGTCGCGAACG
+GCGAGGCCTTACAGCCTCATGATTCCGAATGATTCCGAACGGTATCCGGCTTGAACGTGCCCCAGCTGTG
+GCGGATTCTGACATTTCTCGGCCAGCCCGGCCACGGGCACCCTCGTAACCAACCATTTCGCCGCTAGCGA
+GCCCGGCGGGGGCGGCTGCGACGCCATGGCTCCGGCGGCTTGATTGACGGTCCGGGCGGCGTCGGTTGCG
+GCCCCACCGTCGGTTGCCGCACCGGCCACGCCTGGCGGGTCGCTGTGCGGGACATAGCCGGCCGGCCCGG
+TCGATGGGCCACAGGCCAATCAGACGACGACCTGTTTGGGCATGACGATGGGCTTGAACCCGTACCGAGG
+CCCGGCATAGGCACCGGCTCCTTTGGCCGCCCCAGAAATCCCCGCCATACCCGGCATTGCGGCGACTGGC
+CCGGCTTCCTCGGGGACCGCCCAGCCCGAGCCCTCCAGTGCCGTGGTACCAGACGTCATGGCCGGAGCAG
+CGGTCGACCAACCGGCCGGGACCGACAGGCCACCGACCGAGGACGCCTCGCCCAGACTCGCCGTCAGCGA
+GGCCCCACCAACGCCCACTGGCGTCACCGTGTGCGCCAAACCAGCTGCTGCCGCGGCAGCTGGAACGGCA
+TCGGCGGCTGCGGTCACGGTTGCCGGGTTTAGGGCAGCAAAGGCGTGTCCGAGGAATACCGCGTTGCGGA
+TGGTGGCCATGACGAACCAGGCGGTGGTGTTGACCGCGCCGTTGATCGCGTTCTGAACAAACGTGATACC
+GAGCAGCTCCTCAATGTCCTGAATGATTCCGCCTAATCCCGCCGCGTCGGCCGCCGATGTCAGGGGCGAA
+GCGAACCCCATTACCGCGTTCGGCAGGTTGCTGATCAGCGATCCCAGCCCCACCTGTTGGACCGTGCTGG
+CGGCAGCGGCATGGCTGACCGCGGCGGCCTGACCGGCCAGCCCGGCCATGTTGGCGGTCTGGGAGGGCGT
+GATCAACGGGTTCAACCTCCCCGCCGCCGCCGAGGAGGCCGCGTAACCGTACATCGCCAGTGCGTCTTGA
+GCCCACATTTCGCCGTAGTGAGCCTCGGTCGCCATGATCGCCGGTGTGTTTTGACCCAGGACGTTGGTCG
+CCACCAGTGCCGCGAGCAGAGCCCTGTTGGCAGCGACCTCCGCCGGCGGAACCGTCATGGCGAACGCCGC
+CTCAAAGGCGGCCGCCGACGCCATGGCCTGTGCAGCCGCATGGGCCGCCGATTCAGCGGTGTAGGTCAAC
+CAGGCCAAATAAGGCTGGGCAGCAACGACCATCGACATCGACGCCGGACCCAGCCACTGTTCGGTAGTCA
+ACTGCATGATCACCGACTCGACGGACGATGCTGTAGTGCTCAACTCGACGGCCAGGCCGTTCCACGTCGC
+CCCGGCGGCCATCAGGGGTGCTGCGCCGGCACCGGCGTACATTCGTGTGGAGTTGATTTCCGGGGGTAAA
+GCTCCAAAATCCATTTTCCCTATCCCTCTATTGATCTCTATTGATCGAAATTCGCTACTTCTCAAGTGCG
+GGCAACCGCGTCGAGGCCGCCCCCTATACCGCCGGCTTGGGCATGACGATGGGTTTGGCGCCGTAGCGTG
+GCGCACCGAAGCCCGCGCTGCTGCGCGTCGCCGAGGCCAACCCCGGCATCCCGGGAATGACCGTCCCCGC
+GGCACCATGCGGTGCCGCGGTGGTCCAGCCAGCGCCCTGCAGTGTGCTGGTGCTCGATACCAGGTTGGCC
+TGTCCCGCCCAGCTGGGCGGCACCGACAATGCGCCGATTGACGACGCCCGACTAAGGCCGGCGGCTAGCG
+GAGCCGCACCCAGACCGGCCGCGATCGGCGCCTCGCCGACGGCCGCCTCCGCCGCCCCCAGCTCCGATAG
+GCCCGCGCCCTCCAAGCCCTCCTCGAGGGCGGCTTCCTCGGCAGCCGGAAGAAGACCACCGCTGGCCAGC
+CCTAGCAAGTCCGACGCGGCGGAGGCCCAGTTCCCAGCCCCAATGTTGAAGATATTGGCAATATCTGAAA
+TCCAGGAGGGCACCTTCCCGGGCGTGGAACCCAAGATGCTCGCGATACCCGACAACGGCGAAGCGGCCGC
+GGATGAGTTGGCGGCCTCGGTGGCCGCATAGGTGCCAGCGCTGACCCCCAGGGTCTTCACAAACAGGTCG
+TATACCGCAGCTGCTTCAGCACTGACCTGCTGGTAGAGAGTGCCGTACGCGGTGAACAACGACGCCTGTA
+GCACTGATATCTCATCAGCGGCGGCGGGAATCACGCCCGTGGTGGTCGGGGCGGCCGCGGCCGCGTTCTG
+GGCGACCATCGCCGAGCCGATGGTCTCGAGCTTGCCGGCCGCAGCCGCCAACTCTTCAGGCTGTGTCGTC
+AGGAATGACATCGATTGCTCCTCATATGACTAAGCCAGCAGGGCTAGAAACCTGTGAATTATCTGATCAG
+TCCCTGCCGAATAGCTGATCAGGTCCTGTGTTTAGATAAGGCTAACGATCCACACCTCCGCAAGCCCGAT
+CAAAAGGCGCAAGCGCAGAATTCATTTACGGCTTATTTACGCCGGCACCGGCAGTCTTAACACGATCCTT
+TTGAGCGTGGCACCTGACCGCTCGCCGCAGCAGCGAAATGAAACACGCGCCGCGGGAGGGTTAGCGCAAT
+GTGGCCGCGGCGGCGCGCTGGTCGGCCGCGTGCGCTTGTCTCGGTGTCTCCAGATCAGAAGAGGCCGTGC
+TTGGGCATAACAATCGGCTTGACTCCGTACCGTGGTCCGGAGTCGGCACCAACACTGTTGGCGGCTACGA
+CCATTCCAGGGGCAGGCGGCATCACTGCGATCGGGCCGTCCTCCTCGGGAACTGCCCAGCCTGTGCCATC
+CAAGGCCGCGCCGGCTGCCGTCGCCGGCGCTGCAGTAGACCAGCTTGCCGGCACCGACAGGCGACCAACC
+ACGGACGCATTGCCCAAATCGGCGGTCAGCGCTGTTCCGCCGACGCCCGCTGGGGCAACCGCGTGTGCCA
+CCGCGGCTGCCGCGCCGCCACCTGGAGCGGCTCCGCCAACGGTTCCCATAGCATCGGCAAGAAGCGTCAT
+ATTGCCAATGGCGGCCGTGGCAAAGTCTGCCACGCCACCCAGGCCGTGAAACGCGGATTCTACGAACAGC
+GGAACATCGAGATTGAGGAACTGCCTGACCGCCTCCAACCCGGTATCGGCCGCGGACATCACCGGGGAGG
+CGAAGCTCAGGACAGCGTCAGCGACGTCGCTGATCAGGTGGCTCAGACCCACCTGGCGCGCGGAAGCGGA
+TGCGCCGGCTTGGCCAACAGCGGCGGCTTGGTGTGCGAGCCCGGCCGGATTGGTGATGTGCGACGGCCTG
+GTCAGCGGGTTCAGTCTTGCGGCGACCGCGGATGCGGCCGCATAGCCGTACATGGCCGAAGCGTCTTGGG
+CCCACATTTCGCCATAGCGTGCCTCGGTAGCCGCGATGGCCGACACGTTTTGCCCAAGGATGTTGGTCGC
+TGTCAGTTCAGCCAACAGGGCTCTGTTGGCAACCACCTCGGCCGGGGGCACTGTCAGCGCAAACGCCGTT
+TCAAAGGCGGCCGCAGACGCCATGGCCTGTGCCGCCGCGAGCGCCGAGGATTCAGCGGTGCAGGTCAACC
+AGACCAAATAGGGCTGCACCGCGGCGGCCATCGACAACGATGCGGGACCCATCCAGTGCTCGGTGCTCAG
+CCGCGTGATGACCGACCCGACGGAGGACGCAGCTGTGCTCACCTCGACAGCTATGCCGTTCCACGCAGCC
+GCAGCCGCCAGCAGGTCTGCCGCGCCCGCGCCGCCATACATGCGCGCAGAATTGACCTCCGGAGGTAGAG
+CTCCAAAATCCACTGAGGCGTTCCGTTTCTGGTCGAGTGCAGTGGTGGCCGGTGCTCCGTCTGAGGCAGC
+CATTATTCCATCAAGGTCAGCGCCAGCGTAGGCACCACGCTCGCCACGGCGTCGATGGCGCCCAAATCAT
+CCCATTAACTGCGCAGCGACGGTTGCTCCGAGGTTCCAGCACGCCTCGATATCGGCCTTGCTCGGCTTGC
+CCATCACCACTACAGTCTCAGCGGCTTGCACCCAACCCAGGCCGGTTGTGATGGCGTCGACGGCTCGCTC
+GGCTCCCTCGGTGCCCTCGTTGCCGTGAATGTACGCGCCGAACGAACGCCCACGGGTGGTGTCCAGGCAG
+GGGTAATAGCAGACATCGAAGGCATGCTTGAGAGCACCACTGATGTACCCCAGATTGGCTGGGGTACCCA
+GCAGATAGCCGTCAGCCTCCAGCATCTCGATCGGCGAAACCGTCAGGGCGGGTCGTCTCACCACCTCGAC
+GCCCTCAATCTCGGGATCGGTCGCGCCGGACACCACCGCCTCAAACATCTCCTGCATGTGCGGAGACGGC
+GTGTGGTGCACGATCAGCAAGCGCCGCACCGCAGGACCCTGTCACTAAAAGTGGGGTAATCGACCAAAGC
+GTGCAGAAGCGCTCCGGACAGGTAGCCCAAGGCCGGCAACGTGGTCATCTGGCCCCCGGCCTAGCGCGCC
+CCTCTAGCTGTAGGGCCGTCTTCATCGCTTCCCGCGCGCGGCGCCGATCCCCCGCGTAGTCGTAGGCGCG
+CGCCAGTCGGTACCAGCGGCGCCAGTCGTCGGCGTCGTCTTCGAGCTCGGTGCGCACGGCAGCGAACAAC
+GCATCGGCCGCGTCTCGCTGAATGCGGCCAGAAGCCCGGCGGGGCAGCGCGCTGGCGTCGATGTCCAGTC
+CGTCTTCGGCGATCAGACGGGCCAGCCGCTGATACGCGAATCCGGCCCGCAGCGTGGCAATCATGGCCCA
+CAGCCCAATGACCGGCAGGATCAGCAGCGCCAGCCCCAGCCCGGCAGCCGCGGCGCGGCCCGAACCGATC
+ATTGCGACGGCGACACGCCCGAGCATAACCAGGTACGCCACCATCGCCACGCACATGAACGCGATTATCA
+ACTGGACATACAGGGTGCGCCTGGTCATCACAGTGTCGGTCAGTGCAGATCGAGTAGGGGCTCAAGACCT
+ACGGTGAGACCAGGGCGTTCGGCGATGCGGCGCACCGCCAACAGCACACCGGGCACAAACGATGTGCGAT
+CGAGGCTATCGTGGCGGATGGTCAGAATCTCCCCCTCGGTCCCGAACAGCACCTCCTGGTGGGCGACCAG
+TCCGGCCAGCCGCACCGCGTGCACCGGTATGCCGTCGACGTCGGCACCACGCGCGCCCGGCAGGCTGGTA
+CTGGTGGCATCGGGATTGGGCGGCAAGCCTTTTCGGGCCTCGGCGATCAGCTTCGCGGTACGCGCGGCCG
+TGCCTGACGGCGCTTCAGCCTTGTGCGGATGATGCAGCTCAATGACCTCGGCCGAGTCGAAAAACCGTGC
+GGCCTGCTTGGCGAAATGCATGGACAGCACCGCTCCGATCGCGAAGTTTGGCGCTATCAACACCGATGTG
+TTGGGTTTTGCGACGAGCCACGATTCGACTTGTTGAAACCGCTCGGCGGTGAACCCCGTGGTACCGACCA
+CGGCGTGAATTCCGTTGTCGATGAGGAACTCCAGATTGCCCATCACCACGTCCGGGTGGGTGAAGTCGAT
+GACGACCTCGGTGTTACCGTCCGTTAGCAGGCTCAGCGGATCGCCGGCATCCAGCTCGGCGGATAGGGTC
+AGGTCGTCGGCGGCCGCCACCGCCCGCACCATCGTCGCTCCGACCTTGCCTTTGGCTCCAAGGACGCCTA
+CCCGCATGGCCTTCACCCTAGACCGGGCCGTCCTCGAGGCCAACGACCGCGGCTGCACCAAACCCGGCGT
+GCGCCGTGAGGCGCTTGTTGATCGAGTGGAGGTGAAAGACCTGCACGGTAGTTCTGTCGCAGCTGTCTGA
+ACCACCCCATCGGCAGATTCCGTGAAGAGCCAGATACGGTGAAAGTCGCACGTCCGGTTCGAAGGGCGGC
+CACGGGAAACGGACCCGCAGCAACGCGGGCACCGCACCCATGGTCGACCCAACTGCCACGCACCCGGTGA
+CCGGTGCGAAGTCCACCATATCGACCAGTGGGCAACCGGCACATCCCACCACAGGTTGGTCGGAAACGGC
+TGGTGCACAACGAAGCTCCCCAACGGCCAAACCGCAGGGATCCCGCCACCCCACCTCGACCGCGGTGCCC
+ACACCAAACAACTACGCGCTGACCGCCGCGACTGCGCCCACGACCTATCTAGGCTTTAATGATCCGAGGC
+GTCAGCAGCGAAGGTGCTCATGTGAAACCCAGCAATATCAGGATTCGTGCAGCCAAACCGATCGATTTCC
+CGAAGGTGGCGGCGATGCACTATCCGGTTTGGCGACAATCCTGGACCGGAATCCTCGACCCGTACCTACT
+CGACATGATCGGTTCGCCGAAGCTGTGGGTCGAGGAGTCTTACCCGCAAAGCCTGAAACGCGGCGGCTGG
+AGTATGTGGATCGCCGAGTCTGGCGGTCAGCCAATAGGTATGACGATGTTCGGGCCCGACATTGCTCATC
+CTGATCGCATTCAAATCGACGCTTTGTATGTAGCCGAGAACAGTCAACGTCACGGCATTGGCGGGCGCCT
+CCTCAACAGGGCCCTGCACTCACATCCGTCAGCCGACATGATTTTGTGGTGCGCCGAGAAGAACAGCAAG
+GCACGCGGCTTCTACGAGAAGAAGGACTTTCACATTGACGGCCGCACTTTCACGTGGAAACCACTGTCAG
+GTGTGAACGTGCCCCATGTGGGCTACCGGCTTTATCGATCCGCCCCGCCCGGGTAAGCATCAGGCGTCGA
+TAACCACCCGACCGCTCACGGCCCGCGACACACAGACCAGCATCTCGTTATCGCCTTCGATGATGCGGCC
+GCGGCGGTCGACCTGCCCGGCAAGGACTCTCACCTTGCAGGTCCCGCAGAAGCCCTGCTGGCAGGAGTAT
+GCCGTCGTCGGGTCCCAGTCGAGCATGACGTCCAGCGCCGACCGGTTCGCCGGAACTCGGAGCACTCGCC
+TCGACCGTGCGAGCTCCAGCTCGAACGGAACTCCGTCGACAACCGGCGGCGGGCTGAATCGCTCGTAATG
+CAGCGGCGCGTCGGCGTGTTGATTGCGGGCCACGCGCACCGCTTCTAACATCCCGGGCGGCCCGCACACG
+TAAACGGCCGTCGTCGGCCCTGCGCCGGCCAACAGTTCATCGACAGACGCAAAACGACCGTGCTCGTCGT
+CGGCCCACACCGTGACCCGGCCGGGTGCCACCGCCACTACCTCGTCCAGGAACGGCATGTACTCCCGACC
+GCGACCGGCATAGATTGCGCGCCAGTCGATTCCGCGCTGTTCGGCGGCCCGGATCATCGGCAGGATGGGC
+GTCACCCCGATACCGCCGATCACGAAAAGCACGTCACGCTCGGCCAGACCGAGATGGAAGGCGTTGCGGG
+GACCTTCGAACTCGCACGTGTCACCTACGTCGAAGGCCTCGTGCATCTCGATCGAACCGCCGCCGCCGTC
+CGCGATTCTGCGAATGGCGATCCGGTAGTCCGTACGCCGTCCGGGCACACCGCACAACGAGTACTGTCGG
+CGCCGCCCCGAGGGCAGCTGCACGTCGATGTGCCCACCGGGCGACCAGGCCGGGAGCAATCCGCCACCGG
+GGTCAGCCAACGTCAACGCCACCACGTCGGGAGCGACCAGCTCGCGCTTGGTAACCACCGCGGGATTCGT
+GCGCCGCACCGGCTGCACCCGCGACGGTTCCCACCGCGAGGCCGCGCCCAATCCTCCCAATAACGCTCGT
+ACACCCCACAGCGCTGTGAAGAAGCGGTCCCGGCTGCGGCGACCGTAAAGGTCGGCGGGCCTACTGGCCC
+AGCTGGTCTCTGGCACGGTGCGCTCCGCCATTCCTACGGATCGTCACCGATCAGTGCGACGCTCGCGCGG
+CGGGCGAGACGGCCAGGTAGTCCACGGCCGCCCCCAGCCCGCCCAGCTGGGACGGGTGAAAACCCGGCTT
+GTAGTAGTGCCCCACGACCCGAAGCAGCCGCGGCAGCCCGGGCACCAAACCACGGCGTGCGGCCTTGAAA
+TAGTCCCGCCAGCGCGGCTTTGTCCCCGGTGGCAGGTACGGATCCACCGAATACATGAACCGCACTCCGC
+GAATCCACAGCAGCAACATCACCGGGGTAACGGTCAGCTGGGCACGCACCTGCCGCCAGTAACCGGCGCG
+CAAGTGCTTCATGGTGTCGAAGGCCACGGCTTTGTGCTCGACTTCTTCTGCACCGTGCCACCGCAGCATG
+TCCAGCATCACGGGGTCTGCACCGACGGCATCGAGCTGCGGGGAATTCAGGATCCACTCGCCCATGACGG
+CGGTGTAGTGCTCAATTGCCGCGATGAACGAAACCTGCTCTAGCAACCAGCTGTACTGTCGTCGCGGGCT
+CCGCCGAGGACTCTCCCCCAGCAGCTTTTCGAACAGCCACCTGATCTGGTTGGTAAACGCTGTCACGTCG
+ACACCCTGGGCATCGAAGTGGTCAACCACGCCGGAGTGCGCCTGGGAATGCATCGCCTCCTGACCGATGA
+ATCCTTGCACGTCCAGCCTCAGTTGATCGTCCTTGATCAGCGGCAGCGTCTTCTTGAAGACCCTGACGAA
+GAACTCCTCGCCGGCCGGCAGCAGCATATGCAGAACGTTGAGAACGTGGGTGGCCATCGGCTCGTTGGGC
+ACATAGTGAAATGGCAGGTTTGTCCAGTCGAATTCGACATCTCGCGGCTCGAGGACGAGACGTTCGTGGT
+CGGCGGCGCGCGACTCTGACGAGTGCGGACCCGTCGCCCGGTCATCGACGCTGACCATTGCTGCCCCCTC
+AGAAAACGTAGCCACGGCGTTTACATAAATGCCCGACATGTCGCCCCAGTAGACATCACGTGTTGGCAAG
+TATAGTTGCGCGTACCCGAGGGGTGAAGAACCTGCTCGCCAGCCTGGCGCCGAATGCACCTCGACGTTCA
+CCGCGCCTCGGCAGCCGACGATGTCGGCTTCACCGTGTCGAATTCGTCGCCTCGCCCTCGTCGGCCTACT
+CGCAACTGGTGGCATCAGTAATGCCATTGCGCAGCAACGCACTTGCTACGGCACGCGACTCGCCATCAGT
+GTCCCGCCAGCACTTTCGCTACCCGGCCTCAGCTCGGTCCTTGAGACGCTGCAGGGTGCGTCGAATGTGC
+TCGGTGTTTACGCTCGCCCGATCCTTGACGCCGGTGGCCATCCGGGCAACTGCGCGGAACCAGCTGGGCC
+GCCGGTCCCAGGTGCTCTCCGTAACCCGACAGCCGTGTTCGGTAGCGACGATGCCATATTGCCAGCGTGA
+AATCGGAATAATGCCGGACCGTACATCGAAAGCGAAAACCCGACCGGGATCGGCGTCGGTAACGGTGCAC
+GTCGTGGTCCAGCGCCGTCCACCGTTTTCGTTGCGACCGACAAACACCGCTCCCTTGCGAACATCGTCGC
+CTTTGCGCAACTGCATCGCCACCACTTCCTCGGCCAGCGAGGCCAGTGTCGGCAGATCAGTGATCAGCCC
+GTATACCAGGTCGGGATTGGCGTCGATCTCAACGGTGACCGTCACAGAAGGCCCATCAGGGTCTGGCATC
+CCGCGATCATAGCCCGCTGGGCGGGCCGCTCTAGATGGGCGCCGCCCCGCGCAGATGCTCGAAGATCAGG
+GACGTCTGGGTACCTGCGACGTCGGCGTCGGCATTGAGGTTTTCGACCACGAACGAACGCAGGTCCTCGG
+TGTCGCGAGCGGCGACGTGCAAGATGAAATCGTCGGCGCCCTGCCGTTTGCGGCGGATCTGCTGGATGAA
+GCTGCGGATTTTCCCGCGAGCGGACGACTGCAAGTTGACCGAGATCATCGCCTGCAACGGCAAACCCACC
+GCGACCGGGTCGATGTCGGTGTAGAACCCCCGGATCACGCCGAGGTCCACCAACCGCCGAACCCGGCCGT
+GACACGTCGACGGCGCTATCCCGACAGTGTCCGCTAACGCGTTGTTGGGCATTCTGGCATCGCCATGCAG
+CAAGCTCAGGATTCTGCGGTCCACCTCATCAAGTTCAGCGGGTCGAACATCCTTCGACGAGGCAGCCCGG
+CGAGTCTTGTGTTCCGTTGAATTATCACGTATATGGCCTCGAAAAAGAATTATCATCAGCAATCTTGCAG
+ATTAATCGAACTTTCTTCACACTGAAGCGTACAGTATCGAGAGGGGTAATCATGCGCGTCGGTATTCCGA
+CCGAGACCAAAAACAACGAATTCCGGGTGGCCATCACCCCGGCCGGCGTCGCGGAACTAACCCGTCGTGG
+CCATGAGGTGCTCATCCAGGCAGGTGCCGGAGAGGGCTCGGCTATCACCGACGCGGATTTCAAGGCGGCA
+GGCGCGCAACTGGTCGGCACCGCCGACCAGGTGTGGGCCGACGCTGATTTATTGCTCAAGGTCAAAGAAC
+CGATAGCGGCGGAATACGGCCGCCTGCGACACGGGCGATCTTGTTCACGTTCTTGCATTTGGCCGCGTCA
+CGTGCTTGCACCGATGCGTTGTTGGATTCCGGCACCACGTCAATTGCCTACGAGACCGTCCAGACCGCCG
+ACGGCGCACTACCCCTGCTTGCCCCGATGAGCGAAGTCGCCGGTCGACTCGCCGCCCAGGTTGGCGCTTA
+CCACCTGATGCGAACCCAAGGGGGCCGCGGTGTGCTGATGGGCGGGGTGCCCGGCGTCGAACCGGCCGAC
+GTCGTGGTGATCGGCGCCGGCACCGCCGGCTACAACGCAGCCCGCATCGCCAACGGCATGGGCGCGACCG
+TTACGGTTCTAGACATCAACATCGACAAACTTCGGCAACTCGACGCCGAGTTCTGCGGCCGGATCCACAC
+TCGCTACTCATCGGCCTACGAGCTCGAGGGTGCCGTCAAACGTGCCGACCTGGTGATTGGGGCCGTCCTG
+GTGCCAGGCGCCAAGGCACCCAAATTAGTCTCGAATTCACTTGTCGCGCATATGAAACCAGGTGCGGTAC
+TGGTGGATATAGCCATCGACCAGGGCGGCTGTTTCGAAGGCTCACGACCGACCACCTACGACCACCCGAC
+GTTCGCCGTGCACGACACGCTGTTTTACTGCGTGGCGAACATGCCCGCCTCGGTGCCGAAGACGTCGACC
+TACGCGCTGACCAACGCGACGATGCCGTATGTGCTCGAGCTTGCCGACCATGGCTGGCGGGCGGCGTGCC
+GGTCGAATCCGGCACTAGCCAAAGGTCTTTCGACGCACGAAGGGGCGTTACTGTCCGAACGGGTGGCCAC
+CGACCTGGGGGTGCCGTTCACCGAGCCCGCCAGCGTGCTGGCCTGACTCTCGGCCGCTCGTTACGCCGAG
+CACACGTCGGGAGTAAGGGAAGCGATGATGTCGGCCGCGGGTCCCGGCCGGGTCTTCCGGTGCGCCGATC
+CCGCCCAAAGGTTTGTTCCGTGCGGGTCGTCCGCCTGCACCGCCGCCGCCCGTATCGGCTTCGTCATCTG
+GTGGACCTCCGGATAACCCAGCGGCGCCACGTGGTCGAGCAGGCGAGTGAAGTTGTTGGCCAGACCGCGC
+GCATACCTACCCGAGAACGCCCGAGTGACCAGGGTGGCATCGAACTCTGGATTCTTCAGCGCGGCACGGT
+GTGCGGCATTGGTACCGGCTTCGTCGGCCAGCAGCAATGCGGTACCAACCTGCGCGGCGATCGCTCCGCG
+GCGCAGCACGGCGGCCACGTCCTCAGCCGTGCCCAGGCCACCGGCTGCAACCAGCGGCACATCATGGGCG
+CTGCCAATCCGATCGAGGAGTTGGTGCAGCGACTCCGTACCGGGTTCCATGTCCGGCGCGAACGTTCCGC
+GGTGCCCGCCGGCAGCCGGGCCCTGGACCACCAGGCTGTCCGCGCCCGCGGCAATGGCCACACCGGCCTC
+GTAGACCGACGTCACGGTGATCGAGACCAACAGTCCCAGCGCGCTCAACCGCTGCACGACATCCGGCGGC
+GGCGCGCCGAAGGTGAACGACACCACCTCCGGACGGACATCGGCTACCACCTCGAGTTTGCGCACCCAGT
+CGTCGTCGTCACCATAGACGGGCTGGCCCACCTCGGTGTGGTAGTACTCGGCGACCTCTTCGAGCTCGTC
+CGCGTAATACTCCAGCTGCGCCCAGTCGGCGACGCTGGGTTGGGGCACAAACAGATTGGCTCCGATAGGA
+CCGGTAGTGGCGGCGCGCGCAGCGGCGATATCGTCGGCGAGCCGGTCCGCGCTCAGATAGCCGCCGGCGA
+CGAAACCAAGCCCGCCAGCGTTGGACACCGCCGCGGCCAACGCCGGGGTGCTCGGGCCGCCGGCCATCGG
+GGCGCCGACGATCGGCACCGCGATGTCCCAGAAGCCCAACACCATCGGGCTAATTCGCCGACGGCGAGCG
+CCGGCACGGCGCGAGTGAGGAAGCGGACATTTGAGCTACCCTACCATCGCTCGAAGTTGTTGCGGCAGTG
+ATCGTTTCGATCCGTGTGGGCCAAGAACGGCAGCACCGTAGCGCCTGCTCAGCAGGTGGCGGGCCACCGC
+GTTGACCTCCTCCACGGTGACCTGCTCGATTTGCCGCAAGGTGTGTTCGATGCTGCGGTGCTTGCCGTAG
+TTCAACTCGCTGCGGCCGAGCCGGCTCATCCGGGAGCTGGAATCCTCCAGCCCTAGCACCAGCCCACCCC
+GCAGCGATCCCTTGGCGATGCCGCATTCCGCCTCGGTGATGCCGTCGCGTGCCACGCTTTCCAGCACATC
+GGCGGTCACCCGCATCACGTCGGCGAAGCGTTCGGGCAGGCAGGCCGCGTACACCGAAAGCGCGCCGCTG
+TCGGCGAAGAGATCCAGCGCGGAGTAGACCGAGTAGGCCAGCCCGCGGGTCTCGCGGACCTCCTGGAACA
+GCCGGGAACTCAAGCCACCGCCCAGCGCGGTGTGCAGCACCGACAGTGCCCAACGATGCTCCCAGCCGCG
+CCCGGGTGTGCGGATGCCCAGCGACACATGCGTCTGTTCGGCGTCGCGGCTAACCAGTGTCAACCGGGGG
+CTGCCGTTGACCCGGCCGGTACCCTTGCGCGGCGCAACTGGCCGTCTCCCCCGGACCAACCGGGACCCGA
+AGTGCTCGCGGACCAACGCAACCAGCCCGTCGTGATCCACATTGCCGGCGGCCGCGACGACCATCCGCTC
+CGGGGTATAGCGCCGCAGGTGAAACGATTGCAGTTGAGCCCGCGTCATCACCGACACGGATTGCGCGCTG
+CCGATCACCGGGCGACCGACCGGGTGGTCGCCGAACAACGCCGCCAGGAACATGTCCGCCAAGGCGTCCT
+CGGGGTCGTCGTCGCGCATCGCGATCTCCTCGAGGACGACGTCACGTTCCACCTCGACATCGTCGGCGGC
+ACAGCGGCCGTTGAGCACCACATCGGCGACCAGGTCGACGGCCAACGGCAAGTCGCTGCCGAGCACGTGG
+GCGTAGTAGCAGGTGTGCTCCTTGGCGGTGAATGCGTTCAGTTCCCCGCCCACCGCGTCCATCGCCTGCG
+CAATGTCCACGGCAGAGCGGGTGGGCGTCGACTTGAACAGCAAATGCTCAAGGAAGTGCGCCGCCCCGGC
+CACCGTGGCGCCTTCGTCGCGCGATCCGACGCCGACCCACACCCCGACCGACGCGGAGTGCACCGCGGGC
+AGGAATTCGGTGACCACTCGCAGCCCGCCCGGCAGGGTGGTGCGCCGCGGCGCCAGCGCCGCCGCGGGGT
+CAGCTGGTGACCGTCGCGGCATCGGTAGCGGCGGCGGTGCTGTCCTCGTCGGCGACCAGGATCAGGGAGA
+TCTTGCCCCGTTTGTCGATGTCGGCGATCTCCACCCGCAGCTTGTCACCGACATTGACAACGTCCTCGAC
+CTTCGCGATGCGCTTGCCCTTGCCGAGTTTGGAAATGTGCACCAGACCGTCGCGGCCAGGCAGCAACGAT
+ACAAAGGCACCGAAATCGGTGGTCTTGACCACGGTTCCGAGGAACCGTTCGCCCACCGTCGGCAGCTGCG
+GGTTGGCGATGGCGTTGATCTTGTCGATCGCGGCCTGTGCCGATGGCCCGTCGGTGGCGCCGACGAACAC
+GGTGCCGTCGTCTTCGATGGAGATCTGCGCGCCGGTCTCCTCGGTGATGGCGTTGATGACCTTGCCCTTG
+GGTCCGATGACCTCCCCGATCTTGTCCACCGGAACCTTGATGGTGGTCACCCGCGGGGCGTAGGGACTCA
+TTTCGTCGGGTCTATCGATGGCCTCAGCCATCACCTCCAAGATCGTGAGGCGGGCGTCCTTGGCCTGCTC
+GAGTGCTCCGGCAAGCACCTGCGAAGGGATCCCGTCGAGCTTGGTGTCCAGCTGCAGCGCGGTGACGAAG
+TCCTTGGTCCCGGCGACCTTGAAGTCCATGTCACCGAACGCGTCTTCGGCGCCGAGGATGTCGGTGAGGG
+TGACGAAGCGACGCTCCACAACGCCGTCGACCGCCCCTTCTACTTGAATGTCGTCGGAGACCAGGCCCAT
+CGCGATGCCGGCCACCGGCGCCTTGAGCGGCACCCCGGCGTTGAGCAGCGCCAGCGTCGACGCGCACACC
+GACCCCATCGAGGTCGACCCGTTGGAGCCCAGAGCCTCCGACACCTGGCGAATGGCATACGGGAATTCCT
+CGACGCTCGGCAACACCGGCACCAGGGCCCGCTCGGCCAGTGCGCCGTGCCCGATCTCACGCCGCTTGGG
+CGAACCGACCCGACCGGTCTCGCCGGTGGAGAACGGCGGGAAGTTGTAGTGGTGCATGTACCGCTTCGAT
+GTCTCCGGCCCCAACGAGTCGATCTGCTGGGCCATCTTGATCATGTCGAGTGTGGTCACACCCAGGATCT
+GGGTTTCGCCGCGTTCGAACAGCGCGCTGCCGTGCGCGCGCGGAACCACGGCCACCTCGGCCGACAATGC
+GCGAATGTCGGTGATGCCGCGGCCGTCGATACGGAAATGGTCGGTGAGGATGCGCTGCCGAACCAGCTTT
+TTGGTCAGGGCACGCAACGCGGCGCCGACCTCCTTTTCGCGACCCTCGTAGGTGTCGGCGAGCCGCTGCA
+CAACCTGGGTCTTGATTTCGTCGATGCGCTGGTCGCGCTCGGCTTTACCGCCGATGGTCAACGCGGCGGC
+CAACTCGTCGGTGGCCACCGAGGACACCGAGTAGTACACGTCTTCGCCGTAGTCAGGGAACACCGGGAAG
+TCGACGGTCGGTTTGCCCGACTTTCCAGCGGCATCGGCAAGCTCCTGCTGCGCGGTGCACAGCGCGGCGA
+TAAACGGCTTGGCCGCCTCCAGGCCCGCGGCCACCACGCTTTCCGTCGGCGCTTGGGCACCACCTTCGAC
+GAGCTCGACGACGTTTTCGGTGGCCTCGGCTTCGACCATCATGATGGCAACATCACCCTCGACGATCCGG
+CCGGCCACGACCATGTCGAACACGGCGCGCTCGATCTGGTCGACGGTGGGGAAGCCGACCCAGGTGCCGT
+CGATGAGCGCCACCCGCACACCGCCGATGGGCCCGGAGAACGGCAGACCGCCCAGCTGGGTGGACGCCGA
+CGCCGCGTTGATCGCCAATACGTCGTAGAGATCGCCCGGATCCAGGCTGAGAATCGTCACCACGATTTGG
+ATCTCGTTGCGCAGCCCGTCGACAAACGACGGGCGCAGCGGGCGGTCGATGAGCCGGCAGGTCAGGATCG
+CGTCGGTGGAGGGTCGGCCCTCGCGACGGAAGAACGAACCGGGGATGCGGCCGGCCGCATACATGCGCTC
+CTCGACGTCGACCGTGAGGGGGAAGAAGTCGAAGTGTTCTTTGGGGTTCTTGCTGGCGGTGGTCGCCGAC
+AGCAGCATGTTGTCGTCGTCGAGGTAGGCGACCACCGCGCCGGCGGCCTGCAAGGCCAATCGGCCGGTCT
+CGAAGCGGATGGTCCGGGTGCCAAAGCTCCCGTTGTCGATGGTGGCGGTCGTCTCGAACACGCCTTCGTC
+AATTTCAGCGGCAGACATGACGTCCGTGCGGCCTCTCTGGATTATTGAGCTGTTTCGCGTCGTCACGCGC
+AATCCAGCGGGTTCGCCGAACCCCGAGAGCTTCCCAGGGGAAAAGGTCTGAATGCGGCTACGGCCATCGA
+TCGAAGCGGCCGACCTGCCCCAGATCCGGAGAGCCCGGCAGCCACTACCGAGGACCGCCCGATACAGGCC
+GGGGGTGCTCCCTTGGATATGCATAGTGACTCGCTGGAACGGCACACGCGGTTCTGCGCGTACCGCACCA
+TTTGCTGGGCCGAACCGGCCCAGAACGTTCTCACTCTACACGGGCGACCGGCGGCATTTGCGTAGAACTC
+GCTTTGCCGAGCTACCCCGCCTCAGCTCCGCGGGCCGCCGGTGACATCCTCGACGCACACCGCGAACCGT
+CGCTGAGTGTAGACGTAGCCCACGCCGCTGGCGCACTGGTCGACGCTGACGGGAGAGTCGAGGTCTTTCA
+GGATCTGGGTGGCCCGCTGCCGGTGCGGCACCGAGGCGTCGTCGCAGTCCACCCGGAACGGGTCGGTGTT
+GTGGGTAGGGTCGACGCTCATACAACCGCCAATCACCCAATCGATGTCCAGGCAAATGGTGTTGGTTGAG
+CCGTTGAACGCATTGCGCATCGAATAGGTGGAGTCGACGTCCGCCGGGCATTCCGCGTGGTCCTCCTGCA
+CGACGGCAACGACCTTGAAGTTGGACGCCGGGCTCCCGCACTCCGCCTTAGTGGCCTGCGGCCGGTCGGG
+CGTGCCGGCGAGTTTGACGCAGTCCCCCACCTTGAGTTCGGCGACGTTGGTCGCTGACGAACACCCCGTC
+GCCACGACGAACAAGGCCGTGGTCGCGGCCGCGAGCCAGGCGCGCATCGACGCCGCGGGTCAGCGACGCA
+GGCCCAGCCGCTCGATGAGTGAACGATAACGCTCCACATCGATCTGGGAAATGTACTTGATCAGCCGGCG
+CCGCCGGCCCACCAGCAACAGCAGTCCTCGCCGCGAATGATGGTCGTGCTTGTGCACCTTGAGATGCTCG
+GTGAGGTCGGCGATGCGTTTGGTCAGCAACGCGATCTGTGCTTCCGGGGATCCGGTATCGGTCTCATGCA
+GGCCGTAGGAGCGCAGAATCTCCTTTTTTTGCTCGGCTGTCAGCGCCACGAAATGTCTCCATCAATGGGT
+TCGCGATCATGGATATCAGGGCACGGCCACCGCGAACCGCAGCACGCACCGATGTCGTTGGACAGTCTAG
+CAGCGGGTTGACCGCCAAACACAAACGCCGCAGGTGCCAGCCGGGGGTCACGACCGCAAGAACCGTCAAC
+CCGTAGACAACAGGTCACGTGCCCGCTCGGTATCGGCACCCATCGCAGCGACCAGCTGGCGCACCGATTC
+GAACTTCTTCTGGCCGCGGATACGCCCGACGAAGTCCAAGGCCACATGTTGACCGTAGAGGTCAGCGGTG
+GTGTCCAGCACGAACGCTTCGACGGTGCGGGTGCGTCCGGAGAAGGTGGGATTGGTCCCGACCGACACCG
+CGGCCTGGTAGCGCTCACCCGGGACGACCGTGCCGGTCACCGGCCCATGCCCGAGCACCGTGAACCAAGC
+GGCGTACACGCCGTCGGCCGGAATCGCCGAATACATCGGCGGCGCCACGTTCGCGGTGGGAAAGCCCAGC
+TCCGCGCCCCGCCCCTCACCGCGTACCACAACCCCCTCCACGCGGTGCGGTCGGCCCAGAGCTTCCATGG
+CCGCCACCATGTCGCCGGCGTCCACGCAGGACCGGATGTAGGTGGAGGAGAACGTCACGGTCTCGTTGCT
+GTGGTGCTCGGACACCAACGACATCGATTCCACCGCGAACCCGAACCGCTCGCCAGCCCGACGCAGCGTG
+TCGACATTGCCGGCGGCCTTTTTGCCGAAGGTGAAGTTCTCGCCGACGACGACCTCCACCACATGTAGGT
+GCTCGACGAGCAGCTCATGGATGAAGCGATCCGGCGTGAGCTTCATGAAATCGGTGGTGAACGGCATCAC
+CAGGAACACTTCGATGCCCAAGTCTTGAACGAGCTCCGCGCGTCGGGTCAGGGTGGTCAGCTGCGCCGGG
+TGACTGCCTGGATAGACCACCTCCATCGGGTGCGGGTCGAACGTCATCAGCACGGCCGGTACACCGCGAG
+CGCGGCCGGCCTTGACCGCGTGCGCGATCAGTTCGGCGTGCCCGCGGTGCACGCCGTCAAATACCCCGAT
+GGTGAGCACGCATCTGCCCCAATCCGTCGGGATCTCGTCCTGGCCACGCCAGCGCTGCACGATCGCAAGC
+CTACGGCGCACGGTGGTCGGCCAGGCGCCAGATTCACCGGTGGGCTCTGGCCAGCGGCCGATCCGGGAAC
+ACCATGCACGCGGCCGCCGGACACCTGGCGCAGCACGTCCGGGAACGCCGGCGGCACCGTGGCCGGTCCC
+AGAGAATTGGCGCGCGCATACCGAACGATTGGTCTCAAGCTTTACGCCGACCATTGATCAGGTGATCAGG
+GAGTGGGTCTGATGAGTACGTTTAGAGAATGCCGCAGCATGTTCGATGCCGCGGTGAAGAGCTACCAGTC
+CGGAGACCTGGCCAATGCCCGAGCGGCCTTTGGCCGCCTCACAGTCGAAAACCCGGACATGTCCGATGGC
+TGGTTGGGGCTTCTGGCCTGCGGCGACCATCATCTTGATACCTTGGCCGGTGCCCATCAACACTCCGAAG
+CACTGTACAGCGAAACCCGCCGCGTCGGCCTCACGGACGGCGAATTGTCCGCCGTGGTCATGGCCCCGAT
+GTATCTGGGGTTGCGGGTGTGGTCGCGCGCCACGATCGGGCTCGCGTACGCCAGCGCTCTAATCATCGCC
+GACCGCCACGATGAAGCGGCAGCAACGCTGGACGACCCGGTCATCACGGAGGACACCGGCGCCGCCCAAT
+ACCGCCAGTTCGTCATGGCGACGCTGTTCCACAAAACTCGCTCCTGGTCCAACCTTTTGAAGGTCACCGA
+AATTTCTCCGCCGAGCGGGGCCACCGATGTCCGTGACGAGGTGGCTGACGCGGTGGCCGCGCTGGCCTCG
+ACCGCTGCGGCGAGTCTGGGCCAATTCCAGTTCGCGTTGGAGCTCGCTGAGCAAGTCTCGACAACCAATC
+CGCGGGTGACTGCCGATGTGACCCTCACTAGGGCGTGGTGCCTGCGCGAACTGGGTGACGACGACGCCGC
+CAGAGTGGCACTTAGCGCCACGACCACCGGTGATGCCCCCAGGACAAACACCACCGCGGAACAGGCTGGT
+AGCCCCCAACCGAAGTTTCGACATCCTTACGACGACGGCCGGGATCTCCTGGTGGCTCGCCGCCGCCCGC
+CGGCCGGGGACGGTTGGCGCAAAGCGGTAACCAAAATGACTTTCGGGCGGGTGAATCCCGAACCGAGCGC
+CAAGCGCGAGCAAACCGACGAGCTGATTCAGCGTATCTGCGCTCCACTGGCCGATGTCCATAAGTTGGCG
+TTCGTCTCTGCCAAGGGCGGCGTAGGTAAGACCACGATGACGGTGCTGGTGGGCAACGCCGTCGCCCGGC
+TGCGCGGCGATCGGGTGATGGCTGTGGACGTCGATGCCGACCTGGGCGACCTGTCAGCAAGGTTCAGTGA
+GCGCGGTGGCCCGCAGACCAACATCGAGCATTTCGTGTCATCGCAGCACACCAAGCGCTACGCGGACGTG
+CGTGTGCACACGGTGATGAACAAAGACCGGCTGGAAATGCTTGGTGCCCAGAATGATCCGCGATCGACAT
+ACAAGTTTGGCCCGGAGGACTATGGGGCCGCCATGCAGATCCTGGAAACCCACTGCAACGTCATACTGCT
+TGATTGCGGCACACCGGTCAACGGGCCATTGTTCAGCAATATCCTCAACGACGTCACTGGTCTGGTTGTG
+GTGGCATCCGAAGACGTGCGCGGTGTCGAGGGAGCGTTGGTCACTCTGGACTGGCTGGGGGCGCATGGCT
+TTGGCCGGTTGCTTCAGCACACTGTGGTTGTTCTCAACGCAATCCAGAAAACCCGGTCACTTGTGGATTG
+CGGGGCCGCCGAAAACCAGTTCAGGAAGCGCGTTCCGGATTTCTTTCGGATTCCCTACGACCCGCATCTG
+GCCACGGGTTTGGCGGTCGATTTCAGCTCTCTCAAGCGAAGGACACGCAACGCCGTGCTGGATTTGGCCG
+GCGGCCTGGCACAGCACTATCCGGCTAGCCGAGTACGGCCCCGTGGCGAGGACAGTTGGAAAACCTGGAT
+CGAAACGATGCGTCAGGTCGGATGACGGTTTGGTCGAGACCGAGTTGGCGGCCATTTCCCCGACTGCGCA
+CCGAGCGCGCCGTCACGCCGGTATCTAGACTCTCTGGTTGTGAGGGCTGACGAGGAGCCTGGCGATCTTA
+GCGCGGTTGCGCAGGACTATCTGAAGGTCATCTGGACCGCCCAGGAGTGGTCGCAGGACAAGGTCAGCAC
+CAAGATGCTGGCCGAGAGGATCGGGGTGTCGGCCAGCACGGCCTCGGAGTCCATTCGCAAGCTCGCCGAG
+CAGGGCTTGGTCGACCACGAGAAGTACGGCGCGGTGACGTTGACCGATTCGGGGCGACGAGCCGCGCTGG
+CAATGGTGCGCCGGCACCGGCTACTGGAGACATTCCTGGTCAACGAGCTCGGCTACCGCTGGGACGAGGT
+GCACGACGAGGCCGAGGTGCTCGAGCACGCGGTCTCGGATCGCTTGATGGCCCGCATCGACGCCAAGCTG
+GGGTTCCCGCAGCGCGATCCGCACGGTGCCCCGATCCCGGGCGCCGACGGGCAAGTGCCCACGCCACCGG
+CTCGTCAGCTGTGGGCGTGCCGCGACGGCGACACAGGGACGGTGGCCCGTATCTCCGATGCCGACCCGCA
+GATGCTGCGATACTTTGCCAGCATCGGGATCAGCCTGGACTCGCGGCTGCGGGTGCTGGCTCGGCGCGAG
+TTCGCCGGCATGATCTCGGTGGCAATCGACTCGGCCGACGGCGCCACCGTCGACTTGGGGAGCCCGGCCG
+CCCAGGCAATCTGGGTGGTGAGCTGACGGCTTTGGCCCGCGAGCGTAACGTGGCTGCGATTTTCGGCACG
+GATTTTCGCAGTCCGGTTACGCTCGCGAAGCCGGTTCGCCCAGCAGGCCCTTGGCGATGTGGGTTACCTG
+GACCTCGTTGCTGCCGGCGTAGATCATCAGCGACTTGGCATCGCGAGCCAGCTGCTCCACCCGATATTCG
+GCCATGTAGCCGTTGCCGCCGAACAGCTGGACGGCCTCCATCGCGACATCGGTGGCGGCCTCCGAGGAAT
+ACAGCTTGATCGCCGAGGCCTCGGCCAGCGTCAGCTGTTTGCCGGCTTTGAGCCGCTCGATGGCCTGAAA
+TACCATGTTCTGCACGTTGATCCGCGCAACTTCCATTTTCGCCAACTTCAACTGGATCAGTTGGAACTGC
+CCGATGTTACGGCCCCACAGCGTGCGGGTCTTTGCGTAATCCACACACAGCCGGTGGCATTCGTTGATGA
+TACCCAACGACATGAGCGCCACGCCGAGGCGTTCGACGGCGAAATTGGCGCGGGCGCTGTCGCGGCCGTC
+CCCCTCGGCGCAAAGCAGGCGATCCGGGGTCAGCCGCACGTTGTCGAAGAACAACTCGCCGGTCGGCGAA
+GACATCATGCCCATCTTCTTGAACGGCTTGCCCTGCGTCAGGCCCGGCATGCCGGCATCGAGCACAAAGA
+CCAGCACCGGGCGGTTACGCCAATCTGAGGCGGGCTCACCGTCGGCGAGCTTGGCGTAGACCACCAGGAC
+ATCAGCGTACGGCCCGTTGGTGATGAAGGTCTTGTGCCCGTTGAGGATGTAGTCTTCACCGTCGCGGGTC
+ACGTGAGTCTTCATGCCGCCGAACGCATCCGAGCCGGAGTCTGGCTCGGTAATGGCCCAGGCCGCGATCT
+TTTCCAGCGTCACCAGCGTGGGCACCCAGCGCTCCTGTTGGGCCAGGGTGCCGCGGCTCATGATCGTCGC
+CGCGCCCAACCCGAGGCTGACGGCCACCGTGCTCAGCAATCCGATGCTGACCCCGGCCAGTTCGGACACC
+AGCACCGCGACCATCGAAGCCTGGTCAGCCAGCCCGAAACTGCCTGAGCTGTCCCGCTTTTCCCGCTTAG
+CCCGCTCCCCATCCAGCATCTGGTTGACCGACTCGGCAAGCAGCACGTCCAGACCGAACTGGCTGAACAG
+CTTGCGCGCGATCGGATACGGCGACAGTTCACCGGTTTCCAATGCGTCTTGGTGCGGGCGGATCTCCTTG
+TCGATGAACTGGCGAACGGCGTCGCGCACCATTAGATCGGTGTCGGACCACTCGAACATCGCGTGCTCCC
+TCCGATCGCGTGGCTCAACGTTCGGCCCGTTGGTATGCGGTGACCACGGCGGCGCCGCCCAGCCCGATGT
+TGTGTTGCAGCGCGGCGGTCACGTTGTCGACCTGGCGCGCCTCGGCGGTGCCGCGCAGCTGCCAGGTCAG
+CTCCGCGCACTGCGCCAACCCCGTCGCACCCAGCGGATGGCCCTTGGAGATCAGCCCACCGGATGGGTTG
+ACGACCCAGCGTCCGCCGTAGGTGGTCTGGTTGTCGTCGATCAGCTCGGGCGCCTCGCCCGGCCCGCACA
+GGCCGAGCGCCTCGTAGAGCAGTAGCTCGTTGGCTGAGAAGCAGTCGTGCAGCTCGATCACTCCGAAGTC
+CTTCGGGCCGAGTCCGGATTGCTGGTAAACCCGTTGTGCCGCTTGCACAGTCATGTCGTAGCCGATGATA
+TTGCGGGCACTGCCATCAAAGGTGGAAGCGAAGTCGGTGGTCATCGCCTGCCCGACGATTTCCACAGCCC
+GCCCGGCAAGGTTGTGGTTGGCCAGGTAATCCTCACTGGCCAGCACCACCGCCGCCGACCCGTCGGAGGT
+GGGAGAGCACTGCAATTTGGTCAGCGGGTCGGAAATCATCTTTGAGGCCAAGATGTCGTCCAGGGTGTAT
+TCGTCCTGAAACTGTGCATACGGGTTGTTGACCGAGTGCTTGTGGTTCTTGTAGCCGATCTTCGCGAAAT
+GCTCCGCGGTGGTGCCGTATTTCTTCATGTGTTCGCGGCCGGCCGCCCCGAACATCCACGGCGCCACCGG
+AAAGCCGAACTCGTCGATCTCGGCTAACGCCTTGACGTGCCTGCCCAGCGGCGACTCCCGGTCGTCGGCG
+CCACCGCCCAGCGCTCCGGGCTGCATCTTCTCGAAGCCCAGCGCCAACACGCAATCGGCCAGTCCGCCGC
+GGATGGCCTGCGCGCCGAGGTAGAGCGCCGTGGATCCGGTCGAGCAGTTGTTGTTGACGTTGACGATGGG
+GATACCCGTCATGCCGAGTTCGTAGAGCGCCCGCTGACCCGACGTCGATTCTCCGTAGACGTAGCCGACG
+TAGCCCTGTTCAACTTCGCGGTAGTCGATGCCGGCGTCGCGCAGCGCTTTGGTGCCCGACTCCCTGGCCA
+TGTCCGGGTAGTCCCAGCCTTCGCGTCGCCCGGGCTTTTCGAACTTCGTCATGCCCACGCCAATGACGTA
+AACCTTGTTCGACGACCCTTGGTTAGGCATCGTTGCCGTTGCAAGTGAGTGATCTTTAGTGGTCACGCGA
+CTTGCACCCCGTCTCGGGGTTGTTCGGCAGCCTTGCGGCTGCTTCCCTTCCGCGCTTCACGGCCACCAGC
+CCGGCCAGGCCGGGTCTTACGGTCGGCTCCACGCTTGACGGCGGCCCCAACTGGGCCGACGACGCTACTG
+GTGTCCTCGTAGCGTGCGAGGTTGATCGCTGCGCAGTCATCACGCTGATGCGATGCCGAGCACGAATCGC
+ATTGCCAGTGCTCGGCCCATCCGATCTCTTGGACATGCCCGCAGACGTGGCAGGTTTTCGACGATGGGAA
+CCAGCGGTCAGCGACCACTAGTTGTGACCCGTACCAGCCTGTCTTGTAGGACAGGTGGCGGCGCGGGGTG
+CCCAGGGCCGCGTCGGAGAGTCCGCGCCGGCGAGCGCGGGCACCCGAGAGGCCCTGTTGCCGCAGCATCC
+CTGCCGCGTCCAGGCCTTCGACAACGATGCGGCCGTGGGTCTTAGCCAAATGCGTTGTCAGACAGTGCAG
+GTGGTGGGTGCGAACATCGTTGACCCGGCGGTGCAGCCGGGATATTTCGGTGGTGCGCTCACGGTAGCGA
+CGTGAGCCTTTCGTGCAGCGCGACCGTGCCCGGCAGACATGCCGTAGCTCGTTGAGTGCCGCGTCGAGTG
+GCCGTGGATTCGGCACTCGTTCGAGCACCGCGCCGTCGGCGGTGGCGACCGTGGCCAGGCGGCGCACCCC
+GACATCAACGCCGACCCGTGAACCGGGGTCGGTCACCTTCGGTTGCTGCGGGCGCTGCACGAGGACCCGC
+ACACTCGCATCGATCCGGGTCCCGTTACGGCGCACCGTGATCGCGAGCACCCGCGACCGGCCTTTGGCGA
+TGAGCCGCTCAACCCGGCGCGTGTTCTCGTGGGTGCGGACGGTCCCGATGACCGGCAGCGTGAGGTGGCG
+CCGGTCGGGCTCGACGCGCATCGCTCCGGTCGTGAACGTCACCCGGTCTGGGTCGCGTCCCTTCTTCTTA
+AACCGGGGAAAGCCCATCCTTTTGCCATCACGTTTGCCTGATCGCGAGTTCTGCCAGTTCCAGTACGCGT
+CGACCGCGCCGTCAATACCGTCGGCGTAGGCCTCCTTCGAGCACTCCGGCCACCACACAACACCGGTCTC
+GATGTTGACGCACACGTCGTTCTTGACGGTGTTCCAGCGCTTCCGCAACACCCGCAGCGACGGCTTTGCC
+GTCTGGATCCCGGTCGCCTGCCAGGCGTCGATATCGGCTTTCAGGGTGGCGACGGTCCAGTTGTAGGCCT
+TGCGGCGGGCACCGAAATGCCGTGCCAACGCGCGGGCCTGCTCGGCGGTCGGATCGAGCGTGAACCGGAA
+AGCCTGAACCATCCAGCCCTCAGGAATCTCGAATTTCGCCATCAGGCAGCCTCCGACTCTTCGGCGGCGG
+CCGCCAATGCGCGCTTGGCCCGGTTCTGCGCAGCGCGCTTGCCGTACAGCCGGGCGCACATCGAGGTCAA
+GATCTCGGTCATGTCCCGTACCAGGTCGTCATCAACCTCGGCCGAGTCGACCACGACCAGCTCGCGGCCT
+TGGGCGGCCAGCGCCGCTTCGACGTACTCAGAGCCGAACCGGCAGAACCGGTCTCGGTGTTCCACCACGA
+TCCGCTTCACCGATGGGTCACGCAGCAGCGCAAGAAACTTTCGGCGGTGCCCGTTCAGCGCCGAACCGAC
+CTCGGTCACGACCTTGTCGACCGCGATCTGCTCGGCCGTGGCCCAGGCGGTCACCCGCGCCACCTGCCGA
+TCCAGGTCCGGCTTCTGATCCGCTGACGACACTCGCGCATACACGGCCGTCCGCGCCCGGCGGGATCTAT
+CGGCCGGCTGGTCGTCCACGAGAATCAGCCGCCCGGCCTTCCGCGCCGGCACCGGCAACAACCCCGCATG
+AAACCAGCGATACACAGTCACCCGCGCAACACCGTTGCGCTCAGCCCACACCGCCAGATTCATACTGTTG
+TTCCTACAGCACGCCACTGACAACTACCGACCACTCAGACCGCAACAGCTGACAGCCCCTTCCGAATTGA
+ACAGCGGCCCATCGCCGTGCGACGTAGGCCGTGTAGCCCAGTGTGCCACCGTTGCCGTCCCGGACCGCAT
+CCCCCTACATTGAGGCCAGGCTCCAACCGAATCGCCCGGCTCCTCCTCACCCCGCTACCCGGGGTGCATC
+GTCGCCGGGCGGAGCACCGCCACCGACCTGGTCCGCGAACCCTCGTCACGCAGCAGCGCGATAACCCGGC
+CGTCGGCGTCACAGGCCGCGTACACGCCGTCGATACCGACCGCCGGCAGGGACCGGCCGTTGGCGGCCGC
+GCTGGCCTCCGCGGCGGTCAGGTCGCGGCGCGCAAACATCAGCAGGCAGGCCTCATCGAGGCTCAGGCTC
+AGCGCGGGGCGCTCCGCGAGATCGTCGAGCGATCTCGCCTGGTCCAGCTCGAAGCGGCCGACGCGGGTGC
+GCCGCAACGCCGTCACATGGCCTCCCACCCCAAGCGCGTCGCCGAGGTCGCGTGCCAACGCGCGGATGTA
+GGTTCCCGAGGAGCAGTCGATCTCCACATCGATATCGATGAGCTGGTCGCGCCGGCGTGCGGCCAGCAGC
+TCGAACCGGTCGATGCGGATCGGCCGGGCTTCCAATTGCACGGAGCGCCCCTGGCGGGCCAACCGATAGG
+CGCGTCGGCCACCGACCTTGATCGCGCTGACCGACGACGGCACCTGCCGGATCTCACCGCGCAGCCGCTC
+CATCGCGGCGTCGATCGCCTCGATGGTCAGGTGCTTAGCCGGAACCGACTGCAGCACTTGACCTTCGGCG
+TCCTCGGTGGAAGTGGTCTGACCCAAGCGGATGGTGGCGGCATACGACTTGGGGGCCGCCGTCAGCAGAC
+CGAGGATCTTGGTGGCGCGTTCGATGCCGATCACCAACACCCCGGTGGCCATCGGGTCCAGGGTGCCCGC
+GTGGCCGACCCGCCGGGTGGCGAAGATGCGGCGGCACCGCCCCACCACGTCATGGCTGGTCATTCCCGCG
+GGCTTGTCGATAACCACGATTCCGGGGCCGGTTGCGCTCATAGCACGATCGCGGTCAGCACCAGTCCGCG
+CTCAACCGACCAGCGTCCCCGCAGCGTTGTCAGCGGCGGACCCGACAGGGTGGACCCGTCGATGAGGATA
+CGGGAGACGAAGCGACCCGTCCAGCCGGTGCTATCGGTTTCGAACGTGATGTGCGCGTCCTCGAAACCCA
+GCCACCTCTTGGTCAGCGGAAACCACGCCTTGTACGTTGCTTCCTTGGCGCAGAACAGGATTCGATCCCA
+ATGCAACGCCGCTGGCATGGTGCGGGGCATGTCGGCGCGCTCGGCCGGCAGGCTGATCGCATCCAGCACA
+CCATTGGGCAACACGTCGTGCGGTTCGGCGTCGATGCCCACGGAACGCACCGCATCCCTGCGTCCGACAA
+CCGCGCCGCGGTAACCGGCGCAGTGGGTGAGGCTACCGACCACGCCGTCGGGCCAGCACGGTTCGCCCTT
+GTCGCCCTTGAGGATCGGCGCCGGCGGCACACCGAGCTGGTCCAGCGCGATGCGGGCGCAGTGACGCACG
+GTGATGAATTCGTTGCGCCGCTTGGCAACCGATCGTGCGATCAACGGCGCCTCCTCGGGCAGCGGGGTGA
+GACCGGGTGGGTCGGAGTACAACTCGGCATACGCCAAATCCTCGAACACGGTCGCCGGCAACACCGACGC
+CACCAGCGTGCCTACCGTCATCGAGACTGCCGTTGCCGCAATCGTTCCCGGAACTGGGCGGCCTGGGTTC
+GCATCTCGGGCGTGATCACGAAGTGACCGCCGAAGTCGTTGAGGTAGCCGGGCGCGTATTGGGGATCCGG
+CAGCACCTGCCGCAGCCAGGAGTAGGGCTTGCGCCGGCGCCACTCCCGCGGGTAACCCACCGACACCTCC
+TCGAACCGCACACCGTCATACCAGGTGGTGCGGGGAATGTGTAAGTGTCCGTAGACCGAGCACACGGCGT
+TGTAGCGGGTGTGCCAGTCGGCGGTCTTGGTGGTTCCGCACCACAGCGAGAATTCCGGGTAGAACAGCGC
+GTCGCAGGGCTGTCGCAGCAGCGGAAAGTGGTTGACCAGCACGGTCGGTTGCATCCAGTCGAGCTGTTCG
+AGACGGGCCCGGGTGGCCGCGACCCGCTCGTGGCACCAGGCGTCGCGGGTGGGGTACGGCTCGGGTGAGA
+GCAGGAACTCGTCGGTGGCCACGACGTTGCGTTCCTTCGCGATGGCCACACCTTCGGCCTTGCTGTTTGC
+CCCCTCCGGCAAAAAGCTGTAGTCGTAGAGCAGAAACATCGGCACGATGGTGGCCGGGCCGCCTCGTTCG
+GTCCATACCGGGAACGGATGCTCGGGTGTGACGACGCCCATCTCGTCGCACATGTTGACCAGATAGTCAT
+AGCGTGCGCGGCCGAAGATCTGCATCGGGTCGCGGTTGGTGGTCCACAGCTCGTGGTTGCCCGGCACCCA
+GATCACCTTCGCGAACCGCCGCCGCAGCAGGTCCAGCGACCAGCGGATCTCGTCGGTGCGTTCGGCGACG
+TCGCCGGCGACGATCAGCCAGTCGTCCGGCGAGGACGGGTACAGCGATTCGGCGACGGGTTTGTTGCCGA
+GGTGACCGGTGTGCAGGTCGGAGATCGCCCACAGCGTCGGCTCGGCGCCGACGGTCTCCTGCCCCGATCC
+TTTCCAGGTCACGACTTACCACCCTAACGACCCGGCGAAGTGGGAACGAAATCCAGCCAGTTCGACCAAC
+CGCTACGGCGTGAGCAGACGCAAAAGCCCCCATTTCGGGCCCGAAATGGGGGCTTTTGCGTCTGCTCGGC
+CAACCTAGCCCAACTGCTACGGGGTCGGCGAGGGTTTTGGGGTGTCGGTCCGGCTGATCCGGCAGTCCGA
+CTGTGCGGTGAGGACCGCCGCCTTCTGGGTCGAGAATTTGAACTCGACGCCGCCATGACCGGCGAAGTAC
+ACGTCGTGGTCGGCCGGCTTGTTCTTCATCACCCCAAAGCCGGTGGCACCGAACTGTTCGACACCGTCCT
+TGACGATCTGCACGGCCTGCAGCCACTTGTCGTCGGGGATCGGTCCACTGAAAACGATCATGAAATACGC
+CGCTTTGGCCCTGGTCCATTCATACTCACCACCGCAGCCGGTCCAGGTGTCCATATCCGTTCGCCACGTC
+AGGCCGGGCACCAGGGCCGTGATGGCGTTGGCCAGCTGGGTCACCGCCGCCCGGTACTGGTCCTTGGCGT
+CCTCCAGCGGGGGCTTGGCGCGCAACGGGTTCTCCAGCTCGGCGACCTTCTCCGGGCTCAACGGCCCCTC
+CTCGCCGGCCCGCGTCCCGTGGCCACTGGGTCCGCACCCAGTCGCCATCACACACACCAGAGCCAGCAGC
+CACGCCGTCGGCCACCGCATCAACGTCCCCCTCTCAGTGCTGGGCCGGGCGCTGCCGGCATGCCGCCACC
+CAGAATTGGCGGAAGCAGCGGCGGGCCCACCGTGTTGTCGGGCAGCCCGGCGGCGATCGCCGCCAGGTTA
+TAGCCGGACATCCGCAGCTGCGGCTGGCCGGCGGCATCGAGGAAGGACCGCGGGTAGTCCCCGTGGGCAT
+ACACTCCGTCACGCCAGATCCCGCCCGGATCAAAACCCGCCTGTGACGACAGCTCCGTGAACCCGGGGGT
+CAGATAGGGGTCCAGGCCCCATCCGTGCAGCGGCGCCAACGGCGCCACCAGATTGGTGATGAGGTCGTGG
+GGGGCCTGCATGACATAAGCGTGCCCGTGATCGAGCCCGAGCTGCGCCGGGCTGTACAGCTCCAAGCCGG
+GTGAGCCGTAAAACACGACGTCGTTGACCGGATGGGCGCTCTGGGCATCGAGGTCCTGCAACGCCAGCGA
+CGCCGTCAGCGACCCATACGAGTGCCCCAACACGGTCAGGTGGCCACTGGGGTTATTGGCGCGCACCTGC
+TGCAAATACCGCGACAGATCGGCCGCGCCCGCGTGTGCCTGCCCATCGGTCATGGTCTGCCACAGATCGC
+CCGCACTGCCGGTGTCGAGTGGGTTCGGGGGCGGGTGGTAGCCCATCCAGGCGATGGTGGCAACCGATGC
+GGGCTTGCCGGCAGCATTGAGTTGCCGGATTACCTCCGACCGCAGGTCGCGGGCTTCGGTCACCATGCCG
+GGCAGGGCGCCCCGGGTGGTGGACCCGACGCCGGGAACCGTCACCGACACATTGGCGGCGGTGTCGGGAT
+TACCGACGGCCACGGCCGCCAGCACCTGCTGATTTGGGTCCTCGGGAATCTGCAGCTGGGTCAGGTAGGT
+CTCGGGTGCTCGGCTCAACGCCTCGTCGACGGCATCGAGCTCACCCAGCCGGCCCCTGGCGGCGCTCAGC
+TCGTCGGTAAGCGCTGCCAGTCGGCCCACCGCGTCACCGTCGAGGATGCCGTTGTGGTAGTCACGGGCGG
+CCCGCACACTCAGTTGGTCATACTCCGCCTGTAACCGCTCGAGGTGGGCCTGCAGGCGGGCGCGCTCCTC
+GCGCAGCCGCTCCTCGTTGGCATCGCTGGCGAGCTGGGTCGGGGTCAGCCCCTCGGGACCGACCGGCGGG
+CCGGAATCGGCCGGGATGGGCGCGTCACCGTCGGCCATATTGACCGCTGAGGCCAGCTCCTCGTCGACGG
+CATTGGCCTCGGCCATAATCGCATCCAGCTCCGCCTGCAGCTCCGTTTGCTTGGCCAGCGTCCGCGCCCA
+CTGCGCCTCGGTGGATCGCAGCCCGGGGATCGGCACCACCCGGTTGATCAGCGCATCGATCGTCAGCTCG
+GCGGCCGCGGCGGCATGGCGTAGTGCGGCCAGCTCGGACTGAACCTTCACAATCCCGTCGGCGGCCCTGT
+CGGCCGCCCGAGCAACCGCCAACGCCTCGTTGCCGTGGGCGTCGAGGTCTCGGCGAATGCCCGCGTTGTG
+GTGTGCCGCCGCCTCAGCGGTCTTGCCACCCGAGTTCGCAAAAATCGACAGCGCGGCCAACTGACGCGAC
+GCCTCGAACGTCACCTCCGCTCGGGCACTGGCCGCGTGAAACACCTCCCGGACCGCTTGCGCGTTCCACC
+GATCGATATCGGCCACGGTCAGTGGCACGAATCACACCCCACGCGGACCAGCTACGACGTCGGCGGAAAC
+ACCCACCTGGGCGAGCGCCTGCGCCCGCTCCGCCTCCGCCGCCGCATGCTGGATAGCGGCCTCCTGCAGC
+CCGAATGCGTGATCACCGATCCTGGTCAGCAGCGCCCTCGACGCGTCCAACCAGTCGTCCATCTTGGCGT
+TGAGCGCCATCGCCGAGGCGCCCTGCCAGCCGAACTGGGCGGCCTGCATCCGATAGTCCGACGACAAATG
+TCCGACGGCCAGACCCTCACCCTGCGTGGTCACCTGCGCCGCCGAGTGCATCCACTGCTCCGGACTGATC
+TGAAACACCCGTTGCTTCCTTGCGTCCATCGAAGTGCATCACATTATGCGTCAGCGGGAACTACCGCAGA
+ATTCACCGCATCAAAGGTGGCCCGGGTTAGAACAAGTTCTCGTTTGACTGTGACGACGCGGAGCCGACTT
+GTACACTCCCGGCAAGGGACCGCCGAGGGCAGGGGGTGTCGTGTTCACCAGGGTGCGGCTGATCGGAGGG
+CTCGGTGCGCTGACGGCAGCGGTGGTGGTGGTGGTGGGCACGGTGGGCTGGCAGGGCATCCCCCCAGCGC
+CGACCGGCGGCGACGCGGTCCAGCTGCGATCGACCGCGGCGCCCATGTCCACCACGATGAAGAGCCCGAT
+CGTGGCGACCACCGACCCCAGCCCGTTTGACCCGTGCCGAGACATCCCGTTCGACGTCATCCAGCGGCTC
+GGATTGGCCTACACGCCACCGGAAGCCGAGGAGGGGCTGCGCTGCCACTTCGACGCGGGTAACTATCAGA
+TGGCCGTCGAGCCGATCATCTGGCGCACCTACGCCCAGACCCTGCCCCCCGACGCGATCGAGACCACGAT
+CGCCGGCCACCGCGCCGCGCAGTACTGGGTGCGGAAGCCGACGTATCACAACAGCTTCTGGTACTCCTCT
+TGCATGGTGACCTTCAAGACCAGCTACGGGGTGATCCAGCAGTCGCTGTTCTACTCGACCGTCTACTCCG
+AGCCCGACGTGGACTGCCCGTCGACCAACCTGCAGCGGGCAAACGACCTCGTCCCCTACTACAGGTTTTA
+GGTCCCTACCCTGGGCGTCGTGAGTACCACCTCCGCTCGGCCCGAGCGGCCCAAGCTGCGCGCCCTGACC
+GGACGAGTCGGTGGGCAGGCCCTGGGCGGACTGTTGGGTCTGCCCCGCGCAACCACCCGCTACACCGTCG
+GTCACGTCCGAGTCCCGATGCGCGACGGCGTCCAGCTGGTGGCCGACCACTACGCACCCGCCACGTCGCA
+GCCCGTCGGCACCCTGCTGGTGCGTGGGCCATACGGGCGCCGGTTTCCGTTTTCGCTGGTGTTTGCCAGG
+ATTTACGCCGCCCGCGGTTATCACGTCGTGCTGCAGAGCGTGCGCGGGACGTTCGGGTCCGGTGGCGTGT
+TCGAGCCCATGGTCAACGAGGCCGCCGACGGCGCCGATACGGTGGCGTGGCTGCGTGAACAGCCCTGGTT
+CACCGGCCGGTTCGGCACCATCGGCCTGCCCTATCTGGGTTTCACCCAGTGGGCGTTGCTGCACGATCCG
+CCCCCGGAGCTGGCCGCGGCCGTGATCACGGTGGGGCCGCACGACTTCCGGGCCTCGGTGTGGGGCACCG
+GATCGTTTACGGTCAACGACTTCCTGGGCTGGAGCGATCTGGTTTCCCACCAGGAAGACCCCGGTCGCAT
+CCGGGCCGGAATCCGCCAGCTCACCGCGCCGCGACGGGTGGCGCGGACGGCCGCCACGTTGCCGCTGGGT
+GAGTCGGCCCGGACGCTGCTCGGCACGGGTGCGCCGTGGTTCGAATCCTGGGTGGAACACACCGACCGCG
+ACGATCCGTTCTGGGACCGACTGCGGTTTCCCGCCGCGTTGGACCGCGTCCAGGTCCCGGTGCTGCTCGT
+CGGCGGCTGGCAGGACATCTTCCTGCGGCAGACGCTGCAGCAGTACCGGCACCTGCGCGACCGGGGTGTG
+CACGTCGCGCTGACGGTCGGTCCCTGGACACACACCCAGATGCTCACCAAGGGGCTGGCCACCGGCGCTC
+GGGAATCGTTGGACTGGTTGGACGCCCACCTCGGCCGGGCGCCGGCGCTGCGCCCCAGCCCGGTGCGGGT
+CTTCGTCACCGGCCAGGGCTGGCGGCACCTGCCGGACTGGCCTCCGGCGACCACCGAGCGGGCGTGGTAC
+CTGCAGCCCGGTGGCCGCCTGGGTGAGAGCGCTCCGGCTTCCGGCACGCCACCGGCGACGTTTCGCTACC
+ACCCCGCCGACCCGACACCGACCACCGGTGGTCCGCTACTGTCATCCAACGGCGGTTACCGCGACGACAG
+CCGGCTGGCCACGCGCGCCGACGTGCTGTGCTTCACCGGGGCGCCCCTCACCCACGACCTCTGCGTGCAC
+GGAAACCCCGTCGTCGAGCTGGTGCACAGCTCGGACAACCCCTACGTCGACGTGTTCGTTCGGGTCAGCG
+AGGTGGACGCGAAGGGCCGGTCCCGCAATGTCAGCGACGGCTACCGGCGCCTTGGTGACGCGCCGGAGCT
+GGTCCGCGTCGAGCTGGACGCCATCGCCCACCGATTCCGCGCCGACTCCCGCATCCGGGTGCTGATCGCC
+GGTAGTTGGTTTCCCCGCTATGCGCGAAACCTCGGCACCCCGGAACCGATACTCACCGGACGGCAGCTCA
+AGCCGGCTACCCACGCGGTGCATTTCGGGCGCTCCCGGCTGCTGCTGCCCGTCGGCTAACGGCTGGTGGT
+GCGGCGGACCCGGGCGGCGACCCGGCCGATAACCCGAGCCCGTCCAGCGGCGCGTGCCCAGTGGTCTCCC
+CGACGCGGAACCTGCGAGAGCTACGACCATAAGTCGAGATGCAGTTTCAAAGCCTCATCGAGCTGGGCAA
+GTTCGGCGGCTGAAACTCGGCCGATTGGCCGGAGCAACCGCTCGGTAGCAATCGATCTGATTTGCTCGGC
+CTGCGCCTTGCAGTCGACCTGGAGACCAGTAGTGGTGGCCGACAACAACACCTGAAACGGATAGACCTTG
+GCGATGTTGCTCGTCACCGGCACGACGGTGATGACGCCGCGCCCAAGACGCGTGGCGGTCGCGTTGGCCC
+GGTCGTTGCTGACGACGACGGCGGGGCGCTGGTTGTTCGCTTCGCTACCTCGAGCGGGGTCGAGATCGAC
+CTGCCAAATCTCACCGCGGCGCATCACCGACTCCGTCGCCGACGGTCTGCTCCCACGCGTCCGTGTCGCC
+GGCTGCCGACCATTCTTGCCATGCGTTGGCATAGTCATCTTCGAGCGTGGGGTAGCGAAGCACGCGGATC
+GCATGCTGCAGGCCGGCGGAGCGGGATGGTAATCCCGCTCGTTTCACATATGCGTCCAGGATCGCGACGT
+CGTCATCGGACAGGCTCACGCTCAACTTCACAACCTAAGATGCTACCAGGGTCGTACCTAGGTAGTAATA
+GGTTCAGCGGCTGGTCGCGCGCCAGTCGCGCAGCACTTCCTCGACGTGCTCACCCACCCGGTGCCGCGCC
+GTTTCCCGGTCGACACCCGACATCAGCAGTTCGTCGAACGAAGTGTCGATATGCCGCACCGACGCCGCGA
+CGGCCAGCCTCACCGCTTCGGGATCGAGCGCCCGTCCGGCCGCGCTACGTCCGATCCTGCCGCTGCCGCG
+GGTGGCCGCGTGGCGGGCGATCGCCTCGGCCCGGCCGGCCGGGCAGTTCGGGAACAGCGTGCGAATCGCG
+GCGCCGAATTCGGCTTGCAGACGCAGGTCCTCGTTGGCCCGTCGCGCCTCGTCGCGCTCCCGGCGGCGGG
+CGCGCACCTCCGCATCGGCGAGGCACTCGTTTTCGGCGCGCTCCAGCGCCTCCGCCTCGACCAGGATGCC
+CTGACGCTCGTATCGCTTACGCGCCCGGCTCCACCGCACCACCACCGCCGAAAGCCGGCTCGCCCGCTTG
+GCCCGGCGGGTAAGCGCGGCGTCCCCGGACGGCAAGAAGACCAGATGGCCAAGGTCCGCGCAGTCCAGGC
+ACAACGGCCCCGCGTCCTCAAGGAACATCAGGTCACCGCTGCCGCCACACGACGCGCATGACCAGTCGTT
+GACCGGCATGATCACGACCAAATCGGGGCGCCGGCTCTGCCGCGCGACCGCACGCTCCGAGAGCTCCGGC
+GACACCCAATGCGTGCGATACGCGCGCTCGATGGCGTCCTCGCCGGTGACGCTGAACCGCAGCCGACGGC
+GGTCCCGAGTGCGAGCGACGTAATCGGTCTCCGACGGGTTGAGCCCCCGGTCGCGGGCCCAGCGCCGCAA
+CGCGGCCATCACGGCGGTGATCTTGCTGAGGTTGGCCTGTACGACTTGCTCCAGCGAGTCGACGCGGCCC
+TGCCGCCACTGGTCGACATGCGAGGGCGCCAGCCAGCCCAGGCCGAGCAGCACATCGATCGCGCTGACGA
+ACCGCTGTCGGGCCAGCGCCGCCTGCGCCGCCCGGGCCACCCGCTGCTCCAGAGGTTGACGTGCCATGAC
+CTGCCCGAGCCTAGTCGGACTGCGCACCGAGGCCGCGGAACTGAGTTACTCCGACCAGCCGGACGCGCTC
+GGAGTGGCGATGCGCGAACGTCGGGAACAACAGAACCTCGTTCGGCCGCCACGGAGAAACGCTTCTCGCC
+GCATCAACACCGATCAGACGTCGACGAAGTACGTCTACATTACGTACATGCCCGAGACTCTGACTGGTCG
+CCTCAACTTCCGCCTGTCTCCTGAACAGGAGCAGGCCCTTCGCCACGCCGCCGCGCTCACCGGCCAGAGC
+CTGTCGGGGTTCGTATTGTCCGCCGCGGTCGACCACGCCCACGATCTCTTGGCCCGGGCCAACCGGATCG
+AGCTGTCCGAGGCCGCTTTCCGCCGCTTCGTCGCCGCGCTCGACGAGCCCGACGAGGCGGCTCCCGAATT
+GGTGCGCCTCGCCAGACGGAAGAGCCGCATTCCCCCCCATTGAGCACCCCCGCGCTCGGCCCCGTCGAGC
+TGTTGGACCCGGACCGGCACGACACGGCGCGCTTCTCCAGCGATGTTGAGGTTCTCGACCACTGGCTGCG
+CCGAGTCGCGCCCGTCGCGGCTGCCGCCGGCACGGCCGCTACGTGGGTGCTCTGTCGAGGCCGGCGGGTA
+GTTGGGTTCTACGCGCTCGCCATGGGGAGCATCGAGCGGATCCGGGTGCCATCGCGGCCGGGCCGGGGCC
+AACCCGACCCGACCCGATCCCAGTGCTCGTCCTCGCTCGCCTGGCGCTCGACCGGCAGGAGCAAGGCACC
+GGTCTCGGTGGCGATCTTCTCCTCGATGCCCTCATCCGATCCGTGGCCGGTGCCCGGCACTACGGCGCCC
+GCGCCCTGGTCGTCGACGCCATCGACGACCGCGCCGCCGAGTTCTACGGTCACCACGGCTTCTTGCCCCT
+CGAGGGTCGACGCCTCTACCGGCGGATCAGCGACATCGCGCGGGCGCTGGGAGTATGAAGCGCTATCGTC
+GCTTGGCGACGTGCTGCCGATCGATCGCCTCGAATGGCCTCGTTGTTGTTGTCGTCGGTGATGGGGAGGG
+ACAACGGCAAGATTTTGGATCCGGTGGTGGCCACCACGGGGATGGGTCGCTCGACGGCGCGGCAGATGTT
+GACCGGCCCGAGGTTGCCGGGCCCGGCCGAGCAGGTCGACGGGCGTAGCCTTCGGCCTCGGGGCTTCAGC
+GACGAAGCCAGGGCGCTGCTGGAGCACGTGTGGGCCTTGATGGGCATGCCGTGCGGCAAGTACCTGGTGG
+TCATGCATGACCTGTGGTTGCCGCTGTTGACCGCTGCCGGTGATCTTGACAAGCCGCTCGTCACCGAGGC
+GTCGGTGGCCGAGTTGAAGGCGACAGCCCTACCAGGGGCGAATCGCATGCCGCACTGGGCCGCAGGGACA
+CTCCCTGATGGCTTTCCAGCCCGGGCGGTGAGGACGCGCACGTGAAAACCAACCCCCGGTACGGCCCGGC
+GTTCTACTCAGTGATGACGGTGTTGTTCCTGGCGCTGTTCGTGCTAAATGTGTGCACCCACGGCTCGACG
+CTGGGCCTGATCAGTACCGGAGGCCTCGCCGTGTTGATGGGCTACATCGGCTACCGGGGCTGGTCCGGCA
+AGCGCCATATCAACCGGCAATAGCGATCATCGACCGGTTCCGGCACACCTGACCAGCGCCGTCGTCGGCC
+GCCAACCCCACGGCTCGTGTGCCAGCCGACGGTCACCGTGTCGCGGCGGCGGGACACGAGGAAACTGCCC
+ACCAGCCACACCTACTTCGCGCTCACTTTTAAGTGAGGCACTTCGGCATCGAAGGCGGATAAGACCAAGA
+TCCTGGATCGGGTGGTGTCCACCACCGGGATGGGTCGTTCGACGGCCCGGCGGATGCTGACCGGCCCGGG
+GCTGCCGGAGCCGGCCGAGCAGGTCGACGGGCGCAGGCTGCGGGCGCGGGGCTTCAGTGACGACGCCAGG
+GCGCTTTTAGAGCACGTGTGGGCCTTGATGGGCATGCCGTGCGGCAAGTACCTGGTGGTGATGCTCGAGC
+TGTGGCTGCCGCTTGTGGCCGCCGCCGGTGATCTTGACAAGCCGTTCGCCACCGAAGCGGCGGTGGCGGA
+GTTGAAGGCGATGAGCGCGGCCACCGTGGACCGCTACCTCAAACCCGCCCGCGAGCGGATGCGCATCAAA
+GGCATCTCGACAACCAAACCCTCACCATTGCTGCGTAATTCGATCACCATCCACACCTGTTCGGATGAGG
+CGCCCAAGGTCCCGGGGGTGATCGAGGCCGACACTGTGGCGCACTGCGGCCCGAGTCTAATCGGCGAGTT
+CGCCCGCACCCTGACGATGACTGATCTGGTGACCGGCTGGACCGAGAACGCCTCGATCCGCAACAACGCG
+GCCAAGTGGATCCTCGAGGGCATCAAGGAGTGCCAGCAGCGGTTCCCATTCCCGATGACGGTTTTCGATT
+CGGACTGCGGGGGCGAGTTCATCAATCACGACGTCGCCGGCTGGCTGCAGGCCCGCGACATCGCCCAGAC
+TCGCTCGCGGCCGTACCAGAAGAACGACCAGGCCCATGTCGAGTCCAAGAACAATCATGTGGTGCGCAAA
+CACGCGTTCTACTGGCGCTATGACACCGGCGAAGAGCTGGAGCTGCTCAACCGGCTATGGCCGTTGGTGT
+CGCTGCGGTGCAACTTCTTCACCCCGACCAAAAAGCCCGTCGGCTACACCAGCACCGTCAACGGTCGCCG
+CAAGCGCATCTATGACAAGCCGGCCACCCCATGGCAGCGCCTGCAGGCATCGGGCGTCCTTGATGCACAG
+CAACTCTCGACCGTGGCCGCCCGAATCGAAGGCTTCAACCCGGCCGATCTGACCCGCCAGATCAACGCGA
+TCCAAATGCAGCTGCTCGACCTGGCCAAGACCAAGACCGAGGCCCTGGCCACCGCCCGCCACATCGACCT
+GCAATCATTGCAACCGTCAATCAACCGATTGGCCAAGGCGAAGTAATGCAAGCCCCCCACGCGCTCACTA
+TGCGTGAGGCACCAGCCACGCTTCGCGCTCACTTCTACGTGAGGCACCTCGGATGCTGTTGCGAATCCTG
+TTGGGCCGCCCCAGTTTAAAGTGGATGAGCTTGGTAGAGGCGCTTACGTGTACGTTGGGAAAGACGCAAC
+AGTGGTCCTAAACAAAGATGGCCAAGTGGTAACCGCCTGGGCGAACAGCCGGGCTGGATGGAGAAATCCG
+TGAGCAACGTTCTCGATGCTATTTCAACGGAGCACCGTCCCGTGATCGAGCAAGAATTAGAGAATCGTAA
+TCCCGCTCTCTTCGACGAGCTTCGGCGCACAGAGAAGCCAACCAACGAACAGAGCGACGCTGTTATCGAC
+GTGCTTTCCGACGCCTTGATGAAGACCTTTGGACCTGATTGGGTTCCGAATGATTATGGGTTGAAAATCG
+AACGAGCAATTGACGCATACTTAGAGACGTGGCCGATATACCGATAATCGCTTGACACCAACTATTGCCA
+GCACCAGGCGCCTACCGTGCATCGGGAGCGCGGCCGGGCTGGTATTCGCGTGGGACTGAAGGAGCTTAGG
+CAGGAACGCACATGACGTACGCAGCCAGGGACGATACGACGCTCCCCAAACTGCTCGCACAGATGCGGTG
+GGTGGTGCTGGTGGACAAGCGTCAGCTCGCGGTGCTGCTGCTAGAGAACGAGGGACCGGTCGCTTCCGCG
+ACGGACCCGTTGGATACGCGCGGTGATAGCGACTATGAAAACCAGCCGGTCGACGCAGTGGAGCGGCTAT
+GTCGGCGTTTGGCTGACCAGGCGGTGCGTCAGTGGGGTTTTATGCAGGGCCTCAAGCAGAAGCTCGGACC
+AGGTGTCGACGTGCGGATGAAGCTGGTGGAGTGGAACCGATGAGCTTTAATGGCTCTTCCGGAATCAGAG
+TGCATGGATCAGCTGAGCCAGGTTGCCGCAGTGCAGTAGTGAACGGATTCGGTAGTGGGTGAGGTTTCTG
+AATCCGAGGGCGTTACGGCATAGGGCTTCCAGTCGTCCGTTGATGGCTTCGGTGGGCCCGTTGGACGCGT
+GGTGGTCGAAGTAGGCCAGCACATCGTGGCGGCAGCGCCACAGGGTGCGGCCTAGTTTGGCCAGTTCCTC
+TAGTACGACAGGGACACCGGTTCCGGCGCTGACGGTGAGCAGCGCGGGGGCTTGCCGTACCCGGGTTTGT
+TGTTTGTAGTGCCGGGGCGGCTCGGTGATCAGGTCATTGGTAGGCGACGGCCCTCCCGTCGTCTCTTGCC
+GGAGTGCTACGGGAGGGCCGCCTGTGTGCGCTTGGAGGCGCAGTGGTCACCGTAGAAGCAGATGTCGATC
+AAGTCGAGCGTCGGCTGGCGGCCGGTGAGCTGAGCTGCCCGTCTTGCGGGGGTGTGCTGGCGGGCTGGGG
+CCGGGCTCGGTCGCGGCAGTTACGCGGCCCGGCTGGTCCGGTGGAGTTGTGCCCGCGTCGGTCGCGGTGC
+ACCGGGTGCGGGGTGACGCATGTGTTGTTGCCGGTGAGCGCGTTGCTGCGCCGCGCCGACACGGCGGCGG
+TGATCGTGTCGGCGCTGGCGGCGAAGGCCACCAGCCGGGTCGGGTTCCGCCGGATCGCCACGGATGTGGC
+TCGCCCGGCGGAGACGGTGCGGGGCTGGCTGCGCCGGTTTGCCGAGCGTGTCGAGGCGGTGCGGTCGGTG
+TTCACGGTGTGGCTGTGCGCGGTCGATGCCGATCCGGTGATGCCGGATGCAGGTGGCGGCGGGTTCGTCG
+ATGCGGTGGTGGCGATCGGCGCGCTCGCAGCTGCCATCGGGCGCCGGTTTTCGCTGCCCACGGTGTCGCT
+GGCTGAGACCGCGGTAGCGGTGTCAGGTGGGCGGTTGTTGGCGCCGGGCTGGCCCGGCGAGTGGGTGCAA
+CACGAGTCGACCCTGCCGTAGCCGTCGATCGGGCCGTAAACCTGTGCGCTGTCGTGTGTTTTGACAGACA
+GCAAATGGAAAGGAGCGGCCGGTGGCGGTCGGCGATGACGAGGAGAAGGTGCGCGCGGAGCGCGCGAGGG
+CGATCGGGTTGTTTCGCTACCAGTTGATTTGGGAGGCCGCCGATGCGGCGCATTCCACCAAGCAGCGGGG
+AAAGATGGTGCGCGAGTTGGCCTCACGCGAGCACACCGATCCGTTCGGGCGGCGGGTGCGCATCAGCCGC
+CAAACCATCGACCGCTGGATCCGGGGCTGGCGGGCCGGCGGGTTCGACGCGCTGGTGCCCAACCCACGCC
+AGTGCACACCGCGTACCCCGGCCGAGGTGCTGGAGCTGGCGGTGGCGCTGCGGCGGGAAAACCCGCAGCG
+CACGGCGGCGGCAATCCGGCGGATCCTGCGTACCCAGTTGGGCTGGGCGCCCGATGAACGCACCCTGCAA
+CGCAACTTCCACCGGCTCGGGCTCACCGGCGCCACCACCGGGTCGGCGCCGGCGGTGTTCGGCCGGTTCG
+AAGCCGAGCACCCGAACGCCCTGTGGACCGGGGATGTGTTGCACGGCATACGGATTGATCTCCGCAAGAC
+CTATCTGTTCGCGTTCTTAGACGACCATTCCCGGTTGGTGCCCGGCTACCGGGGGCCATGCCGAGGACAC
+GGTGCGGCTGGCCGCCGCACTGCGCCCGGCGCTGGCCTCCCGCGGCGTGCCCAACGCGGTGTATGTCGAT
+AACGGCTCGCCCTATGTGGATGCGTGGTTGTTGCGGGCATGCGCGAAACTCGGTGTGCGCCTTGTTCATT
+CCACGCCAGGTCGGCCGCAAGGCAGGGGCAAGATAGAGAGGTTCTTCCGCACCGTGCGCGAGCAGTTCCT
+GGTCGAGATCACCGGCGAACCCGACGTCGTCGGCCGACATTACGTCGCTGATCTGGCCGAGTTGAATCGG
+CTGTTTACGGCCTGGGTCGAAACGGTTTATCACCGCAGCGTGCATTCCGAAACCGGGCAGACCCCGCTGG
+CCCGCTGGTCAGCCGGCGGCCCCATCCCGCTGCCCGCCCCCGAGACGCTCACCGAGGCCTTCCTGTGGGA
+GGAGCACCGCCGCGTGACCAAGACCGCCACCGTCTCGCTGCACGGCAACCGCTACGAGATCGACCCGGCG
+CTGGTCGGCCGGAAAGTGGAGTTGGTGTTCGACCCGTTCGATTTGACCCGCATCGAGGTGCGGCTGGCCG
+GCGCGCCGATGGGGCGGGCCATTCCGTATCACATCGGGCGCCATTCACACCCGAAAGCCAAACCCGAAAC
+CCCCACCGCACCGCCCAAACCCAGCGGCATCGACTACGCGCAGTTAATCGAGACCGCGCACGCAGCCGAA
+CTCGCCCGCGGCGTCAACTACACCGCCCTCACCGGGGCTGCCGATCAGATCCCCGGCCAGCTCGACCTGC
+TCACCGGCCAGGAGGCCCAACCGAAATGATGCACAAACTGATCTCGTATTACGGTTTTTCGCGCATGCCA
+TTCGGCCGCGATCTGGCACCGGGCATGCTGCATCGCCACAGCGCGCACAACGAAGCGGTCGCCCGCATCG
+GCTGGTGCATCGCCGACCGCCGCATCGGCGTCATCACCGGCGAAGTCGGCGCCGGCAAGACCGTCGCCGT
+GCGCGCCGCACTAGCGAGCCTGGATCGCAGCCGCCACACCGTCATCTACCTGCCCGACCCCACCGTCGGC
+GTCCAGGGCATCCACCACCGCATCGTCGCCTCGCTCGGCGGACAACCCCTCACCCACCACGCCACCCTGG
+CCCCACAGGCCGCCGACGCGCTAGCCGCCGAACAAGCCGAGCGCGGACGCACCCCCGTCGTGGTCGTCGA
+GGAAGCGCACCTGCTCGGCTATGACCAACTGGAGGCGTTGCGGCTCTTGACAAATCACGACCTCGACTCG
+TCAAGCCCGTTCGCCTGCCTGCTCATCGGCCAACCCACCCTGCGGCGGCGGATGAAACTCGGCGTGCTCG
+CCGCGCTTGACCAGCGCATCGGACTCCGATATGCCATGCCGCCCATGACCGACACCAACACCGGCAGCTA
+CCTACGCCACCACCTCAAGCTAGCCGGACGCGACGATGCCCTGTTCTCCGACGACGCCATCGGGTTGATC
+CACCAGACCAGCCGGGGCTACCCCCGCGCGGTCAACAACCTCGCCCTGCAAGCCCTCGTCGCCGCCTTCG
+CCGCCGACAAGGCCATCGTCGACGAATCCACCACCCGCACCGCCATCGCCGAAGTCACGGCAGACTGAAC
+ACCACACCGACACCCCGAACACCACCGACCCCGCCGGACATCTCCCGGCGGGGTCATTTCATGACCAAAC
+GTCCTCACCGTCAACGCCGCCATCATGCTCATCCTGAATGCCGGTCAACAGACGCGGTGGCGACCCAGTC
+GTCGTAGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACACTTGCGCGCACAACGCATCCGCCATCC
+ACGGGGCGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACCTGAAAGGGGGACTGTGGACGAGTTCG
+CGCTCAAAATGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACGCGAGAATAAGATTGTCAGGCTGG
+TGCTGCGTTTCCGTGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACTTCGGGAGCATGCCGCAGCT
+GCGGATGTGGTGCTGGATTTCGAGTTTACGTCCCCTCTCGGGGTTTTGGGTCTGACGACACGTTGGAAGC
+GTTTCGAGCGTACGGACTTTCCGGATGCAGGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACTTGA
+CTCAGACCCCAGCGCCAACTTGCCCACCATCCGCGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGAC
+AGGCGCTTCGACGGTGTGGGCGAGGTGACTTCGCAAAGGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGA
+CGACTGCGTCAAGTGCGGCACCGCCGTCATGTCGGTGTCGAGTTTCCGTCCCCTCTCGGGGTTTTGGGTC
+TGACGACTTGAACACGCCGATACCTATTTGGTCGGGAGTGATAAAGTTTCCGTCCCCTCTCGGGGTTTTG
+GGTCTGACGACTGACAGGGTGCGGTGGTCGCTGATCGGCTCCCCGAGTTTCCGTCCCCTCTCGGGGTTTT
+GGGTCTGACGACCGGACTTGATCGACGCGAACCTGTCTGACGCGAACCTGTTTCCGTCCCCTCTCGGGGT
+TTTGGGTCTGACGACGGCTGGAAAAGGGCGCGGGGCAACCGCATCGTCAAGAGTTTCCGTCCCCTCTCGG
+GGTTTTGGGTCTGACGACGCGTTGTGGTCGTGTCGTGGAGCCTGTATTTCGCTGGTTTCCGTCCCCTCTC
+GGGGTTTTGGGTCTGACGACCATTAGTTGGTGTTGTGATCGCTAAACGCCGGGGCAGTTTCCGTCCCCTC
+TCGGGGTTTTGGGTCTGACGACCTATCCGCGGGAAGAGATCACGAATCCGGCGTCGAAGGGTTTCCGTCC
+CCTCTCGGGGTTTTGGGTCTGACGACATGCTGAGCTGAGGCGCCGGATGATGGTGGTGCTGAAGGTTTCC
+GTCCCCTCTCGGGGTTTTGGGTCTGACGACTGACAGGGTGCGGTGGTCGCTGATCGGCTCCCCGAGTTTC
+CGTCCCCTCTCGGGGTGAACCGCCCCGGTGAGTCCGGAGACTCTCTGATCTGAGACCTCAGCCGGCGGCT
+GGTCTCTGGCGTTGAGCGTAGTAGGCAGCCTCGAGTTCGACCGGCGGGACGTCGCCGCAGTACTGGTAGA
+GGCGGCGATGGTTGAACCAGTCGACCCAGCGCGCGGTGGCCAACTCGACATCCTCGATGGACCGCCAGGG
+CTTGCCGGGTTTGATCAGCTCGGTCTTGTATAGGCCGTTGATCGTCTCGGCTAGTGCATTGTCATAGGAG
+CTTCCGACCGCTCCGACCGACGGTTGGATGCCTGCCTCGGCGAGCCGCTCGCTGAACCGGATCGATGTGT
+ACTGAGATCCCCTATCCGTATGGTGGATAACGTCTTTCAGGTCGAGTACGCCTTCTTGTTGGCGGGTCCA
+GATGGCTTGCTCGATCGCGTCGAGGACCATGGAGGTGGCCATCGTGGAAGCGACCCGCCAGCCCAGGATC
+CTGCGAGCGTAGGCGTCGGTGACAAAGGCCACGTAGGCGAACCCTGCCCAGGTCGACACATAGGTGAGGT
+CTGCTACCCACAGCCGGTTAGGTGCTGGTGGTCCGAAGCGGCGCTGGACGAGATCGGCGGGACGGGCTGT
+GGCCGGATCAGCGATCGTGGTCCTGCGGGCTTTGCCGCGGGTGGTCCCGGACAGGCCGAGTTTGGTCATC
+AGCCGTTCGACGGTGCATCTGGCCACCTCGATGCCCTCACGGTTCAGGGTTAGCCACACTTTGCGGGCAC
+CGTAAACACCGTAGTTGGCGGCGTGGACGCGGCTGATGTGCTCCTTGAGTTCGCCATCGCGCAGCTCGCG
+GCGGCTGGGCTCCCGGTTGATGTGGTCGTAGTAGGTCGATGGGGCGATCGGCACACCCAGCTCGGTCAGC
+TGTGTGCAGATCGACTCGACACCCCACCGCAAACCATCGGGGCCCTCGCGGTGGCCCTGATGATCGGCGA
+TGAACCGGGTAATTAGCGTGCTGGCCGGTCGAGCTCGGCCGCGAAGAAAGCCGACGCGGTCTTTAAAATC
+GCGTTCGCCCTTCGCAATTCGGCGTTGTCCCGCCGCAAGCGCTTCAGCTCAGCGGATTCTTCGGTCGTGG
+TCCCGGGCCGTGCGCCGGCATCGACCTGCGCCTGGCGCACCCACTTACGCACCGTCTCCGCGCAGCCAAC
+ACCAAGTAGACGGGCGACCTCACTGATCGCTGCCCACTCCGAATCGTGCTGACCGCGGATCTCTGCGACC
+ATCCGCACCGCCCGCTCACGCAGCTCCGGCGGGTACCTCCTCGATGAACCACCTGACATGACCCCATCCT
+TTCCAAGAACTGGAGTCTCCGGACATGCCGGGGCGGTTCAGGGTTTTGGGTCTGACGACTCGCGGCGAGC
+ACGTCTCACCCAGCAGGCGGTGAGGTTGGGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACACGGA
+CGAGCTGGACCGCATCAGCGATGCTGAGCTGAGGGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGAC
+TTGTCTCAATCGTGCCGTCTGCGGTGACACGCTCCAAGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGAC
+GACTCGACGATTGGGACATCGACATCGACGCGATCGTCGACGAGTTTCCGTCCTCTCTCGGGGTTTTGGG
+TCTGACGACGTGATCTTCTCTCCTGGCGAGGTCAAGGAAATCGATGTGGAGTTTCCGTCCCCTCTCGGGG
+TTTTGGGTCTGACGACCACCAGGATCAGCGCCAAGCCAGTTAGCGCAATCCAGTTTCCGTCCCCTCTCGG
+GGTTTTGGGTCTGACGACCTCCCGGACCATCTGCAGCTCGCCCGGGTCCATGCGGTTTCCGTCCCCTCTC
+GGGGTTTTGGGTCTGACGACCGGAGTCATCCGCGCGGGCCGGCGCGATTGTTGCCGGGTTTCCGTCCCCT
+CTCGGGGTTTTGGGTCTGATCCGCGAAATTCACTGCGCGTTATTCAAGGTTTCCGTCCCCTCTCGGGGTT
+TTGGGTCTGACGACCCGAGCCGACCATCCGCATCACACCGAAAGGGTTGGCGCAAGTTTCCGTCCCCTCT
+CGGGGTTTTGGGTCTGACGACACGTGGGGAGAGGGAATGGCAATGATGGTCGACGAAGTTTCCGTCCCCT
+CTCGGGGTTTTGGGTCTGACGACTCAAAAACGGGGACGGCATGCTGCATGCCCTAACGTCGTGTTTCCGT
+CCCCTCTCGGGGTTTTGGGTCTGACGACCAGCGCAGACGGCAGCCCCGAGTACTCGCTCTCCTCAGGTTT
+CCGTCCCCTCTCGGGGTTTTGGGTCTGACGACCAGCGCAGACGGCAGCCCCGAGTACTCGCTCTCCTCAG
+GTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACCTAAGCCCGCTAATCCCGCACAAGTGGTCAGAAA
+AGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACCTGATGATTGGTCGGCGTATGACGTGCTACTGA
+GGTGTTGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACACCCCTGAGCCACGGCATGTGCACGGCT
+CCGTGTTCAAGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACTCGATGAATGATGCGCGCCAGCGG
+TAACGCGTGGGATGTGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACTCTGAAAATTCGTGGTCAA
+CGAATTGTCGTCGAAATGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACACGGGCCGTGGGGCACT
+TACGGCGACGGCGCACATGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACCCCCTAGCCACGCCTG
+CCGTGCCATGCCGCGCCGCGAGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACTTGGTCAAAAGCT
+GTCGCCCAAGCATGAGGCAAAAAGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACACGACTAGGGG
+AGCGTGATCCAGAGCCGGCGACCCTCTATGGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGACGTGC
+AAGAATTCCGGGTTGCAGTGCAACACGGTTTTAAGTTTCCGTCCCCTCTCGGGGTTTTGGGTCTGACGAC
+TCTATGGACAATTCGTCCAGCGTGTGGTAACAATGCCTGCTGATGATGTCAAAAGAACACAAACTCCTCT
+GCGCTGACAAGCCGTCCCCTTCCGTAGAACGTAACTGCCGCAACACCTCTTATCTTATAGATCCGGATGT
+TGTCGCAGTCGATGGCGAAGCGGTCGATACGTGCAACTAGTTTCGCGAGCTGGCCCTTCGTCAGCATCGC
+TTCGAATGCGGACTCTTGGACGCGATAGCCAAACCCGGCCAGGATCTTCGCAAGTGAAGCCCGCCGCCGG
+TTGTCGCTGATGTCGTATATTACGAGGACGAACATCTTGCCTATAGTGCCGCTGGACTCGTCCACTTTGA
+GCGGGAGATTGAAGTACTCCTCACGGCTGCGAGTGGGCATTTAGGCTCCGGATGGCTCGGAGGTGATATC
+GATATCGACGAGCCGCGACGGGTGCCCGGCTTCGATAACACGCACGAGGCTTTGCAGTTGCAAGTCGAGG
+GCGTACTGAAAGGTGTATCGGTGAGGATCGCCTTTGATGTAGGTGGCGGTTCGTGCGATTCGATTACCAA
+AGGCGCGCGCGATGGATCGTGTGGCTTCCCGTGTCGCGAAGACGGCCCCCGTGTCGGAGTTCTTGCTGAA
+AGCCCGGGTGTCGACCACACCGTCCGCGATCAATCGAAGTACGGTGTCATCGATGATCGGCGCCCGCCAT
+ACCTCCATGAGGTCGCTCGCCAACGTTGCGTGCCCTCGTGAATCCTGGTGTAGGAAACCGATATACGCGT
+TCAGGCTGTGACGCTCGATCGCCCCTATGATGTTCTTGTACAGCAGCGAATAGCCGAGGCTGACCATCGA
+GTTGAAGGCGTCCAACGGCGGCCGAGTCGAGCGGCCCTGGAATGCGAACTCCTGCGGGACGAGATGCCCC
+AGCGCGGTGAAGTATGCCTTTGCGGCATTTCCCTCGAACCCGTTCAACTCCGCCAGGGAGCCCGATCGAT
+CGACCCAGGCCAGCGAGTGCTTCATCGTGCGGATGCTCTCAGCAACGTCTTGCCCCGACGTGTGTGCCCG
+AATCAAGGCCTGCTGATTCAGGATCTTCCTCGACACGATCCGCTTGCTTAACGACAGGCAGAACGCAGGA
+TCGTCGGTGCGGTGAACTTGCTGACGGAGCCGCGGCGCGTATGACACGTCGGGTGTTGAGATCCGGCCCT
+GGTAGTGGCCGTCGGTCGTGAAGAGCTGGATGTCGCGCTCACGCTTGAGCATCTCAACGATGAAGGGCGT
+TGTCATCGTCGGCCGCCCAAACAGCGTGATGCCGTCCAGCGTCTCGATCGGATACTGGCTCTCGCCGAGC
+TCCTCGCTCCACACGATCACCCGGCCGTCGGCAAAGCTGATCCGCGACACGGAGTCCGAGACATACAGCT
+GCACCATCTTGCGCACCTGTTAGCCCAGCGGTGCCATATCAATCTGCCGGATGATCTCGTCGTTCAACCG
+GTCATAGAGCGTCAAATCAGCGCCTGTTTCGCGGGCGAGGATCTTCAGCAGTTGTTCTGGGAGAAGGCCG
+CCATCCTTCGTGATGCGATCCTCACTGATTGAGACGATCTCGTGTGCTGCGGTGTTGCGGACCCGGCTCT
+CGAACCTTCCGAGTACTTCAAGAGCACCAACTCGATCGGGTGCGAATTAGCGGAGCAGTGCGAGCCAGTC
+CTTGGTGTAGAGGTACCACTCCGCGTTTGGCGATTTCGGAGGGTGCTTGAGCGCGCACCGTATCTCCGGC
+TCTCTTTCCAGCTTTCGGCGGTCGACGCGGCCCATGTCGTCGAGATAGCGGTCCTCCGGAAGGTGTTTTG
+CCACAGCCGCCCTGAGCACGATAGTGATTGCCGGGGTAGCTGATCGTGCGAATTCAGCCCATTGCTCGCG
+CTTTGCCAGCAGCGCAAGAGCACTTATGTACTCAGCGACCTTGTTCGCGGGGTCATACGTGAACGCGGTG
+TCCTTAAAGAACTTTGGCGCTACGAGGTGTTCCAGCCTCGAGCGGTGCATCGCGCCGCGGATCAGATTGC
+TCACTTGATCGGGCAGGCGCGAGTCTGCCGCGATCGTCACTGCTGCCGAGTAGTCGTACGACACGATCAG
+CTGCTTCAGGTTGGCCCGCTCAAGCAGCGCGCCGAGCGCAGCGGAAGTCGCCTCAAAGCAACGGTTGGGG
+GCTCCAGGCTGATTGTCGTCGTTTGCGTCCCACATTAGTTCGAGGTCGTAAGCGTCTGGGGATTCACGAT
+CGCCAGGCTTGCTCAATGCCCGGGCAGGCGTGCTTACTTGCACAGCGGTGGTCCTGGGAATGCCAAACAC
+ATTTATGGCCACCAGCGCCGCCTGCATCGCAGGGGTGCCGGAACTGGTATTCAGCAGAATGGTTCGATCA
+GGGAACTCAGCCGACAGTTCAACCAGGTGGTTGCGGAAAACCGGCACGAAAAGGTCGAACCTGTGCACCG
+ACGGGTTGGTATAGGTGACTATGCGAACGTCGGTCTCAGGCGCGAGCCGCGTGATTGCCGCGGAGTACCG
+CCGGTCCGCGTTCTCAAAGGCAGCTATCTCGGCGCTGAGGAATAGCACGACAACTATTGGTCGATAGTGG
+CGGACGATGTGTAGCATCGGGCCGTCGCCGAGCGCGGTGATCGGGTCCGCAGTTCCGATAGGCGAGAACA
+GGATCATTCGGCTCTCCTGATCGACAGCTCGCACTGACCCATCTCGTAGCATATGTTGTCGATCTTGGTT
+CGCTTCAAGACAAGTGGTGAGACGCGTAGTTCGCGCGTCTTGTCGACGTGCTTGACTACCTTCCCGAACT
+GGGCGTCGAGCACCTTCGCCATGTCGTCTTGGTCGGTGACAAAGGTCTTGCTCCGATAGCCGGCTCCGCC
+GCCCAGATAGACAATTGGGCCAACTATCGCGTTCACGCCAGGGTACATGGCTCTGTACTCCGCGTAACGC
+GCCTGATTCACGGACGCGGCTGTCTCGGCCAGCGTTTCAAGGAACCGCTCGCCCTCACGCCAGCCGCCGC
+GAGCGGTGGGACTGGTGTCGACCACCACGCGGTGCGAGATTGAGGTTCCCGGCGCCAAACATTCCCGGAA
+GAGCGGCAGGCCATCAGGCTTGCCGTGGACATTCATGTCCATCTTCTGGCAGATCAGCAGATCGCTTGTT
+CTCAGTGCAGGTGAGTCGGTGACCCTGATCGCCTGAAACAGGTCGTTGACCGCGTCTTGCGGACGGGTGT
+TGGGGCGCCCCGATTTGCGCAACTCCTTCCGCTCAAACCTTTCGCCGTACTGCCGGTGCTCCCGCGTCTG
+GTGTCCCGGAACACGAACAGGTTGGGCCGTCCGCTTATGCACAAGCGACTGCAGGTAGATGCTGCGAAGC
+ATTCCCTTGACAGTCGAACCCGGCACGTAGGGCCTTCCAAGAGGGTCTTTGATGAAAGCGTGAATCTCGT
+TGAGCGTAAGCTTCTTTCGAGTCATGCGCCCGCCTCGACCACGAGATGCACGTCGCGGTTCGATCGACCC
+GATCTTCACCTCGTAACCTCGATGCTTAGCAGGATCCAGCTTGACCGCGTTTGGCTCTACCCACTCTTTG
+AGTGGCGCCGTCGCCTGTGCCCCATCGGTGTTCATGACGAACGCTTCGAAAGACTTCCTCTTGTGAGCCG
+GAATGTCTGCGTAAAGAAGTTCCATGTCCGGGAAGTAGACCCGGTCGCCCTCCACGTGGTACTCCTTCGA
+GGTCCGCTTCTCGCCGGATCCGATAAACACCGGCCCCAGGCACCGCAGCGTGAGTTCGAACGGCTTCAGG
+TAGGTGTTCATGCGGCGGACTCCGGGAGTGCGAGAAATAGCGGTCGCGCGTAGCTGTAGACCGGATGGTT
+TCCGCCCAGGCTGACGTCGAGGATGCCTCCTTGGAAGGGGCGCGAGAAGACCGAGCCGGCGGCGAATTTG
+TAGATGTCGCGTTTGCGCAGGGGCATGTCAGCGTATGTGCTCGACGCGACGAATCCACTGCGCTTGACGA
+GGCGGTACGTCGCGCCGGCGAGTGCGGCTTCGAGCTCGTCGTCCGTGGGTAGGGATGTCGTGAGCGTCAT
+CAGACTGGCCGCGTCGACTGTCGGCGTGAGTGCGGCGGGTGCTTCTGACTCGGTAAGGTTAAACGCTCCG
+AACCCGCTTGTCCGTTCGCCGCCCAGCGCGGAGATCCCTTTCAACAGCCTGGTGAGTAGGCCGAGCTCGG
+ACTCGGATCCGGTCGCCAGCAACCACAGACCCGCGTCCAGCTCGAACCGGAAGTAGCCGACACGGTACGG
+GTCGGCGTCTTTCTTTCCGTTGTGGATCGCTGCCTTCGCTGACACGGCGTGGACACCGATCTTGGTCTGC
+CGCGCCGCGAGTTCTTTCAGGTCGGCCGTGCCATCGAGGAAGCTGCCAAGCTGGGCAGCGGGAAGAAAGC
+CGATCTTCTTCGCCAGCTTCTTCTGCATACTTGAGCCGTCGGACCGAACGCTGTGCAGGGGCTTGGGAAC
+CAGGTAATCGGGCCCCACATAGGGCAGCAGATCGGTCAACCGCAGCGTCGAGCACGCAACGAGTTCGCCA
+AGCAGCTGCTGGCCACCCATCCGTAGCGCTTCAACGCAAAGCGCAGAGTAGAGGGTGTCCGCGGGGCAGC
+TAATCGTGGACGACTCGAGGCCGTGGTCGCCGAAGTGTGTGCGGTCGAAGTCGAACCTAAACAGCCGCGA
+GTTCATGGTTTAGCTTCTCCAGCAGAGAACCGTCGAGGGCGCCGACTGCGGCGCGGGCTTTCAGGTTGCT
+GAACTTGACCTGCCCGTAGCCACGGGTTCCGCTGCCGCCGAGGTAGTCGAGTTCGAGCAACTTCAGGCCG
+CGCGCGATGGCGTTGAAGTCCTCGATGATCTCATCGGAGGAAGGCAGAGACGCCTTCTGTTCCTCGCCGG
+GGGTGCCGAAGGAGACCTCGTAGACAAGTGAGAACGCGAACTCGCTGCCGGGGATCACGCGTTCCATCTG
+GCGAAGGTTTGCCTTTGCGGTCACCCGGTTGATGGCGTTCTCGAATTTCACCTCGGTGAGAGTCTTAGCG
+CCGCGGGCTTCGAGGTCGTCTTTGTTGGTGAGCTTCGTGTCGCGGAAGACGAGTCGGCCCGTCATGTACT
+CCTCGGTGTCGCCGAAAAGCCGACGGATATGGGCGTGGTCCTCATTCGGCTTCCTGTAAAACGTTTCTGT
+GTCGGCGCCGTATTGGCGGGACAGCAAGGTGCGGACCTTGCCCTTCAGGCTGGTACCCGGAATCATCGGC
+AGCCTGCTCAGCGGATCACGAACGACAGGCTTGTCGACCGCGCCGATGGCGGAGAAGCCATCGCCGGCCC
+CGATCTGCAGGCCCGTCAGGACGGTCAGTGTCCCGGTTATCTCGATCTTGGCGTAGCTCGTAGTCATTGG
+GTTGTCTCACTTGTCCTTCGGATCGAGGTACTTCTTGTATGCGGCTAGGGCTTCCATGTACCGGCAGAAT
+CGCAGCAGCCCGTCGCGGCTATCGCCTATCCCTTCCAGCGCTTCTAGGAGTTTCGCGTTTCGGACGAATG
+TCTTAACCGCGTCTTCACGCCCGGACTGGTAGACGAACCGGACCCGCAGGTACTGGACCTTCTCCTTCAG
+CTGACGCGGGAGCGTGGGGTTGGCGCTCTGCTGCGCCTCGTCGAAGAGCTGTGCGGTCAGGCTGAGTAGC
+ACCCGCAGCTGGGTTGTGGTCAGCTCGAAGCCGTTCTTTTTCTTTGGCAGGCCGCGAATTACTTCGGCCT
+GTTTCACATAGTCGTCTTGGATGACGCTCATTCGGACTCCTCCTTGCGAGTGCGATAGATGTAGAGGTGC
+AGCGCGGTCTTGAGTTGCTTGGCGTCTGTCGGATCTTGGAACCATTGGTGTAGCCGGTTAGCAAACTGCT
+GAAAAGGCGCTGTGTCACCGGTGGGGTTACGCATGCGCGTGAGGAAGTACACCCATCTGGCCTTTGTGAT
+TCGATCGTCGCGTTCGGCGAGTAGTTCGAGCAGCTTGTAGATGAAGGCCATGCCGCGTTCTTCGTTGCCA
+CTGAAATAGTCGGCGATGTGCCGGTACTTCTCCTCGATCACCTTGCTGAGCAGCTCATCCCAGCCGAAGG
+TGAACTCGCGATCGAAGAGTGCAACCCCGTTCTTGCCGGGCAGCGACTTCGCCGCGTCTTCGAGATCTCC
+GACTTCGCGGGCCATCACGGAGATGGGGTACTTGTCGGGGAACATGCCGATGCCAGCCGACACGGTGAGT
+TTGCCCTGGGTGAATTCGTGGAACCGCTCCCGAAGCTCGATCCCGAACTCGATGACGTCGTCCCACGCGC
+CCACGACGAAGACGTCATCGCCACCGGAGTAGATGATCGTGGCCTCGCGGGGCCGCGCCGGGTCATCGCC
+GGTGATCGGGCGCAGTTTCGGGCGTGCCAACACGTAGTTGATGTGCTGCCGGAAGAACAACGACAGCATC
+CGGGAGAACGCGGCCGTGCGGCTAATCGTGTTGAACTTGCCGTTGCCTTGCTCCATGAAGCCGTGCGTGA
+ATGCCTGGCCCAGGTTATCGACGTCAAGGCGCAGAACCCCGAGGCGCGCGATTCCGCTCGCACGCTTCAC
+GTAGTCACCGAACTCCATCTGTGCGACGTAGTCGCCCACCCAGAGCCCGGTGCCCAAACACTCGCCGGCG
+AAGAACTTGTTCTTCGCGTACCGCCTTCGGGTTTGGGGTTGCTGGAGTGCCTTATCGGCGTCGGCTCGGC
+TACAGAACGTGAGTGTGGCGCCGAACGGCAGGGGCAGACCTTTGGTGGCGCCGTCAGAGATGAGTAGGAA
+GCGGCGAGACTCGGATTGAATCTGCGAAGACGCAGCGGTCAGCGCTTGGCACAGGCTGCACTTTGGCTCG
+TCGTCGGCGCTGACCGTGCGGTTGACCGTGTGGCACACGCTGCATTCCCGGTCACCTTTCTGACCGTCGT
+GATCGCGCGAGTTGAGTTCCCGCAGTTGGTCAGCGCTGTATCGGGCGAGCTTCTTCGCGGAAAGTTGCTC
+GCTCAACTCACGGTAGAGCCCGCTGTAGCGGAGGGCGCGGTTACTTGCCTGGCTCGCACTCTCGTTCGGC
+CGACGCATCAGGTCGTTCGCGGCAAGCGGTACGCTGCCCGTGGCGATGAAGAGCCGGGTTGCGAAGTTTT
+CCAGCAGCCAGTCGTTGGCCTCACGCTCGAACTGTTCGACGGATTTCCGCGCGGACTCCGTGTTGGGCAG
+CAGCAGGTACGCGTGCCCGCCGCCGGAGTAGTTGAGATTCGCGCGGCTGAGACCCACCCGCGCAAGTAGC
+TCGTCGATGAGATGCTCGGTCAGCATCTCCAGGTAGAAGCTGCGGGCACGCAGCATCTTCGCGGCACCCG
+AGGAATGGATCGTGTAGATGAAGTCCTGGATGCCTGAGACGTCGAAAGTTGTGAGCAGGAAGGCTTTTTC
+GTTGTAGAAGGTGTCCTGCTTGTCGAACAGCGCTGACTTGAAGTCGCTTTGTCCGGTGGCTTGTAGGTAG
+TGCCAGATGCAGGCGCCGAGCGCACCCGTCAGCTTCAGGTGGTCGAAGAGTGAGACGTCGACGACCTCGG
+ACGCGTCGGTCGAGGACGGCACGAACGACAGCGTCGCCTCGAGGACGTTGAGGAGGCTGGCGAGGTAGGT
+GTCGGAACGTTCGAGGTCGACCAGAATGGCTTTAAGTTTGTTGACGATGGCGGCGTAGCGGTCCTTGTCG
+AATTCGATCCGGCGTGGCGACGGTATATTGATCGGCTTGCGGTCGTCGAGCATCTCCGGGGCAAATGCCA
+GATTCGCTGTGCCGGAGCCGAATCGGTTGAACATCGAATACAGGGGCGTGTCCGGATCCCAAGTGCTCGC
+ACCATGGCCGTCGTCGGAGTCGGCCTTGCGGCGGTCGGTTCCGGCCGCGATATTGTCGGCGATGTAGGCG
+ATGTAGGCCGGCGCATCGGCGGCAAGGCGGCCATTCTCGGCCGCCGTACGCAGCGCAGAACTGTGGTGAT
+AGCTGATCGCGTCGAGAATGCGGCGGTCGGAGACCCCAATGTCAGCCTCATCCACCTCGTCGGTGAACTG
+CGACGGATTGCGGCTGTCGCGCAACCACACCTTCTTCATAAAAGCGCGGCCAATCGCACTGTGCCTGCCC
+GGGTAGCCGAGCGCCGCGCGCTGGACCGGTTTGCCAATGTCGTGCAAGAGGCAGCCGATTATGGCCTCGA
+TGAGTTGCGGGTTCATGGCTTCGGTACGCATTTTTCCCTCGGTGCCAGTGGCTGGACCCGGATCGCGCCC
+ATCCCCATGGATGCCTTTATTCCGCATCCCGAGAACTCCCCGAACCACAACAGCGCCGCGATATAGCTCG
+CAAAAGTATCCACACCGCGGACGGTGAACGTGGCCGAGCCGGTGAAGCCGGGAACACGCGCCGCGCCCAC
+CGCGAACGGGGCCGACGCCACCCGGAACGCGGAGAGGCGAACCGACTGACCGAATTCGGCGATGAGGCCA
+GGATCGGGCTCTTCGCCGTCGACAATTGCACCGTACTTCTGCGCGAGACTCTGAAACACGAGCCGCGGAT
+CCGGCCAGAACACGTACTCGCCGGATTGCTTGAATGCGGTAGGCGTCAGGAACTCGACCCGGAACTTGCG
+CGTCTCGGGCCGCGCGTAGAAAATGCGCGCGAATTGACTTAGCGGGTTCTGCTCCAGCGATCGCGACGTG
+ACCTGTGTCGCTATCCCGCTCGCACGGAGCCGAAAACCCGCAAACGCCGCGTCGTTGATAGGTCCGACGA
+TCTGCTGCCGCGCCTCGTTCGTCAGCGTGCTGATCTTCCACTCCAAAGATGTGGTCGAGCGGGCCAGCGC
+GTACTGACTGTACGGGTTCACCGGCACGGTGTGGAGGGTCTGCACATAATCGGCCGGGATCGACTCCATG
+AGGACGCCATGAAGATGCGGCCCCAGGGTCGCCACCCTCGCGCGTTCGAGCGGGGCATCAACCTCTAGAG
+TCAGCGTCAATCGCGACAAGGGTTCCGTCATCCGGCGATCTCCTCGGTGAGAAAAGCCCACCAGAATAAG
+CGTTGGTGAAATCCAGGTCAAGCCTGATTCCGCCGCACTCGCGCGATGTCGGCCTCGGGGCTGGCCACTC
+CGACGTAGCAGATCCGTCCTTCTGATGCCGCCTCGGCGAGCAGCCAAGGGATGGCTTCCTAACGAGCCGG
+GGTTGTAGCGGTGGGCGCCGGCCGCGCGGAGGATGGCGCCGCCAATGCTGCTGTTGCCCGCGCCGTCAAT
+TGACGCCAGCAGGGACCGAACCGACAGCAGATCACTCGCAGCGCCGACTGGGCGTACAGCTCAGACCCAA
+GCGATGCCGCCCAGTCAACCCACGGCCTCGCGGACCCGGGCGGCGACCTCGGCCAGCGCGGCCTCGTCGT
+GCACCGGCTCCGCCAGCTGCGGCGTCAGCGGCAGCTGCACCCAGCTGGTGCAACCGCCGTACTCGGGCCT
+ACGCGCCAGCCGGACCGGCTCGGCCAGCGGGATCGCGCAGACCACCAAGACGGCCAGTTTGTGCTTGGGC
+CGAAAGTCGAGCCGGTCGGCGCGCACCGACTCGGCGGTCCAGATGTGCAGATCCTCGATGGCGTCCAGAC
+CCTCTGGCCGGTTAACCGGCAGTGCGGCAACAACTTTCGCTGCGGCCCGCAGTAGCACACACTCGTCGGT
+GCTGTCGGCGGCCGCCGGGCCCAGCAGGTCGCGGTGCTCGGGGCGAACCCGCTCGGCGTGGCTGTGCGCG
+ACCGTCGGGAACAACAAGAACTCGTGGGCCGCCACCTCGAAGCGCTTCTCGCCGATCCCGCCCTTACGCA
+GCAGCACCGTCTGCCGGCCGTCCAGCAGCGCGTGCACCGCCGCGCTCCACTCCTTCAGCGCTGGCGTCAC
+CACGATCCCGCGAGCCGGACCGATGTCCGAATGACGCCAGCACCGCAGGGTTCCGAGGGGACGCCGATCA
+TCTCCGAGACGTTTTGCCCCGGGCAGTTCCATTGGTCCTGCTGAATCAGGCCGGTCATCCAGTGCATCCA
+ATAGTGATGACAGTACTCGTGTCTTGCTCACCACCACAGCCGGATTCGTGCCCAACTGCTCTCATCTAGT
+CGATTCAGCCGCGTCCAGCCGCAACCGTGCCAGCGGAACGGCACGATCGCCGGCAGGTTGATCAGGACCG
+CAGCACCGCCAGCGCGTTCTCCACTTCGCGGCGGTGCCGTTCGTCGCAGGCGGCCCACCGCTGCTCGTCG
+GCGTCGAGGTCAGTGAGGAACGCAAATCGCTTCCGAACGCGAGCTTCCCAGGCAGCCATAGCGACAGGAC
+GGGTCAGCACGCCGATCGAGTCGGGCTGGAAGTCGTGCTCGCTGCGGGCGGCGAGGACGTCTTCGACGCG
+TAGTGGCCGGGTGCCGCGCCGGTCATCGACGACATCACCCCACACCTTGAGCACCCACAGCCGCCGCACG
+AGCGGTTCGTCAATCGTTCGCGAGGCGAAGTGGTTCAGGTCGTACAGGTCCCGTGCCAGCGCAACGCGGC
+GGTACCGCGCGAGTTTCTCTGCGCAGGCTTCCGCTTCTGCCACGACCGGCAGTGTCGGCAGCCCAAAACC
+GTAAGCCTTATGGATCGGCAACTGGATGAATGCGAGCAGCTCAGACGGCAAAGCCAACGGCCGCCGTGCG
+AACTCGACGCTGGCGACGATCCGGGGCTCGCCCAATTCCGTGTGCCGCACCCGCAACTGCCAATGCCGGC
+CGTCGCCTCGTGTGCTCTGCACGCCGAATTCGAAGCCGCCGACACGGGCGCCGTCGATCAGCTCGCACAC
+CTCCAGCACGACCTCATCGTCGGGCGCGCTGAAGTCCAGATCAGTGGAGAACCGCCCGACGTTGCCCAGC
+CGGCACTTCCGTAAGCTGGTACCGCCTTTGAACACCAGGCGGTTATCGCCGAACTGGACGGTCTGCGACA
+GCAGGTACAGCAGGTGGTCCTGGGCGACGTCGAGCAGAGCGGCGTCGTATGCCTCGGCCCGACCAAGAGC
+GTGACGCGCAACGAGCGCACGGGTCAGACCGGCCACAGTCACGCCTTGCCGATCACGCGCAGCAGCGGTA
+CGACGAGCTCGTCGACAAGCTGATACTCGGGAGCCCAGACACTCTCGCCACGGTCGCGGCTGTGCGCGGT
+GGTGAATCGAGTCACCGGCATCACTTCGGTGTGCCGCTTGGCCAGCAGCGCCTGGCCTCGTGCCGGTTCA
+CCGCCCGAGTCCAGCAGGTAGCTTGCACGCTGCCAGGCCGATGTCGGCCGGCCCGACAGTAGACGCTCCA
+GACGCTCGTCACTGCAGTCGGCGACGAGGTCGTCAAGGTGGGGGACAAGGTCGGCCCACGGCCCGAACGA
+GGCCGGGCGCGTGGCGATTTGCACAAGTAATGCTTCTGGTCCTAGCGCCGGTAACCCGGTCGCCCACGCG
+ACGAGGTCGAGCCGCCGCCGGACCAGCAACGCGGGACGCGGAGCCAGCAGTGCGGTGTCCGCCGCGTTCC
+AGGGGATGCGCACGACGGACACATACGATGCTAGGCCGTCGGGCAGCCTTTTGGCCGGCGGCAGCCAGAT
+CGGGATGCGGCCGTCGGGTTGGCGGTCCAGGTATCCGAGGTGCCACGCTGCGGATGCACCGGCCAGCATG
+AAGCCCGCGTTCTGGTCACGGGCCAGCCACGAGCGCAGCGGTAGATACGGGTCCGAGATGGCGGCCTCGC
+CGGGGGGAATGAATGCCCAGGTGCCTTTCACCGGCAGTTGGACCAGCCACCCAATGCGGCGCAGTTCGCG
+GATGGCGGAGTCGGGGTCGCGTCCACACCCAGCCTCTGTAAGCCGTTGCGTCAGATCCTCTTTCGTGACG
+ACTACGGGCCGATCGCGAGCGAGGCCGGACACCACCCGTGACGCCCACGTGGGGATGCGCCGATCGGCGC
+CGGCTGGGCTCACCACCGAACTTGAATTCACACCGGAAACTATACTATATCTGTACGCAACAATGTTCAA
+ACTCAAGAAATCACTTGATTTAGGAACGGGCTTCGGTCAGTGACAGTACGAAACCCGTTCCAAACTCAAG
+TGCCCTGTACGGGCTGGCGGCGATGCGGTGCAACGGCGAGAGACAAAACGCGCTTCGCGGACGACCGGCC
+GACGCGCCGGAGAGTCGCCAAGAACGTCACCCCTGAAATCAAGTGGGACCAGGATGCACTGACGCGTTGC
+TCGGACCAGTCACCCAGGCGATGCGCCTCGGCTCAAAAACTCAACCCACGGCCTCGCGGACCCGGGCGGC
+GACCTCGGCCAGCGCGGCCTCGTCGTGCACCGGCGCCGCCAACGTCGGCGTCACCGGCAGCTGCACCCAG
+CTGGTGCAGCCGCCGTACTCGGGCGTACGCGCCAGCCGGACCGGCTCGGCCAGCGGGATCGCCGAGACCA
+CCAGCACGGCCAGCCGATGCTTGGGCCGAAAGTCGAGCCGGTCGGCGCGCACCGACTCGGCGGTCCAGAT
+GTGCAGATCCTCGATGGCGTCCAGACCCTCTGGCCGGTTAACCGGCAGTGCGGCAACAACTTTCGCTGCG
+GCCCGCAGTAGCACACACTCGTCGGTGCTGTCGGCGGCCGCCGGGCCCAGCAGGTCGCGGTGCGCGGGGC
+GAACCCGCTCGGCGTGGCTGTGCGCGACCGTCGGGAACAACAAGAACTCGTGGGCCGCCACCTCGAAGCG
+CTTCTCGCCGATCCCGCCCTTACGCAGCAGCACCGTCTGCCGGCCGTCCAGCAGCGCGTGCACCGCCGCG
+CTCCACTCCTTCAGCGCTGGCGTCACCGCGATCCCGCGAGCCGGGCAGCCACGTCGGGTCGGCGCAACGG
+CGGGACGGTCTTCGGCGGCTGCCGCCGGGGCGGCAGGGCGTCCAGCAACCGCGTCGTCGTCGCGGTCACC
+TCGGCGACGGCGGCCTCAAACGCCTCGGCGGTGGCCGCCGACGGGTGCGTGATGCCACTGACCTTGCGCA
+CATACTGGCGCGCCGCCGCCGCGATCTCGACGGGCGTGGCCGGGGGTTGCAGCCCGCGCAGTTCGGTGAT
+GTTGCGGCACATGCCCTCAACGATAGGCGCGGCTACCAGACGGTGACCGGTCGTGGGTGCCGATGACTGC
+GTAGCCGCCGGTCCTTGGTCACCAGCCGCCAGCCGTGTTCGATCGCGGTGGCGTAGATCAACCGGTCGGC
+CGGATCGCCGGGGAACGACGAGGGCAGCGCCACCGCCGTGGCGGCGACCGAGGGCGTGATACCGACGGTG
+CGAACGTGCTCGGCCAGCTGCTGAAGCCAGGACAGCACCGGAATCGCCAGTTGGATGCGTTCCTGTTCGG
+CAAGCCAAGCCAGCTCGAACCACGAAATCGCGGCGACGGCGAGCTCGTCGGCGTGTTCGATGGCCTGGCT
+CGCCGCCATGCTGAGACGCTGCGGCTCGGCCGACCACCAGTAGGCCACATGCGAGTCGAGCAGCACCGTC
+GTCATGAAACGTTCCACGAAACCCCGGTGGTGAAGAGTTCGTCGTCATCCACGGCCGCCATCGCCACACC
+CGAGAATCGACCCTTCAGCGCGTGCGGCCCCGTCGCTGCCACCAGCCGGGCCACGGTGCGGCCGTGTTTG
+GTGATCTCGATCTCCTCGCCCTGGGCCACTTCATCAAGCAAGGAGAGGATCTTCGCCTTCACCTCCGTAG
+CGGTCATTTTTCTGGTCATCAGGACAGTCTAACGGTCCTGTTACGGTGATCGAATGACCGACGACATCCT
+GCTGATCGACACCGACGAACGGGTGCGAACCCTCACCCTCAACCGGCCGCAGTCCCGCAACGCGCTCTCG
+GCGGCGCTACGGGATCGGTTTTTCGCGGCGTTGGCCGACGCCGAGGCCGACGACGACATCGACGTCGTCA
+TCCTCACCGGCGCCGATCCGGTGTTCTGCGCCGGACTGGACCTCAAGGAGCTGGCCGGGCAGACCGCGCT
+GCCGGACATCTCACCGCGGTGGCCGGCCATGACCAAGCCGGTGATCGGCGCGATCAACGGCGCCGCGGTC
+ACCGGCGGGCTCGAACTGGCGCTGTACTGCGACATCCTGATCGCCTCCGAGCACGCCCGCTTCGCCGACA
+CCCACGCCCGGGTGGGCCTGCTGCCCACCTGGGGACTCAGCGTGCGCTTGCCGCAAAAGGTCGGCATCGG
+CCTGGCCCGGCGGATGAGCCTGACCGGCGACTACCTGTCCGCGACCGACGCGTTGCGGGCCGGCCTGGTC
+ACCGAGGTGGTGGCCCACGACCAGCTGCTGCCCACCGCCCGCCGGGTGGCGGCGTCGATCGTCGGCAACA
+ACCAGAACGCGGTGCGGGCATTGCTGGCGTCCTACCACCGCATCGACGAGTCTCAGACCGCCGCCGGGCT
+GTGGCTGGAAGCCTGCGCGGCCAAGCAATTTTGCACTAGCGGCGATACCATCGCCGCCAACCGCGAAGCC
+GTGCTGCAGCGCGGCCGCGCGCAGGTGCGTTAGCGGCGATCGCAAGCGCGGCGAAGCCGGGTGCTGGGGG
+TACCTCCCGCGTGCGGGGGACGGGTCGCCGCCATCAGCCCTTCAGCGAAGCCGGGTCTCGGTGCGGCTGT
+TGAAGAGGCGCACCTCCTGCGAGTGCGGCACGATCGCCAACGACTCACCCACCCGCACCGCGGTACGCCG
+GTCGGTGCGGAACACGATGCGCGGTGCGCGTGACGACCAGCCCCGCTGGTCGACCGGCGTTGCGTAGACG
+AAGGATTCGAAGCCGAGCTCCTCCACCAACTCGACGTGCACGGTCAACGATCCCGGGGTGCCGATCGATG
+CCACGTCCCAGGACTCCGGCCGCACGCCGACCAGCACCCGCTCGGCCGCCGGGTCCGGAACCGGTATCGC
+CAAATCCGGTGCCCGCACCACACCGTGGGCGACGGCGGCGTCGATGAGGTTCATCGCCGGCGCGCCGATG
+AACGTGGCGACAAACGTGTTGACCGGGTCGTCATACAGCGCCCTCGGCGTGTCAACCTGTTGCAGCACAC
+CGTCTTTGAGCACCGCCACCCGGTCGCCCATCGTCATCGCCTCCACCTGATCGTGGGTGACGTAGACGGT
+GGTGGTGCCCAACCGACGCTGCAATCCGGAGATCTGTGAGCGGGTGCTCACCCGCAGCTTGGCGTCCAGA
+TTCGACAGCGGCTCGTCCATGCAGAACACCCGGGGCCGGCGCACGATCGCCCGGCCCATCGCCACCCGCT
+GCCGCTGCCCGCCGGAGAGCTTGGCGGGCTTGCGGTCCAGCAGATCCGTCAGCTCCAGCATGTCGGCGAC
+TTCCAGCACCCGCCGGCGGGTGTCCGCGCGCGACATCCCGGCGTTTCGCAGCGCGAACCCCATGTTGGCG
+GCCACCGTCATGTTCGGGTACAGCGCGTAGTTCTGGAACACCATCGCCACGTCACGCGCCCGCGGCGGCA
+GATGCGTCACATCCACGTCGCCGATGCTGATGCGCCCGCTCTCAATGGGTTCCAGCCCGGCCAGCACGCG
+CAGCGTGGTGGACTTGCCGCAACCGGACGGACCGACCAGAACCAGAAACTCCCCGTCGGCGATGTCGAGG
+TCCAAGTTGTCGACGGTCGGCGCGTCGGCGCCGGGATAGCGCTGGGTGACAGCAGAGTACTGAACGTTAG
+CCATGCCCCGCCAGCTTCCGCATGATCTGCCGATCCAGGATGACCTGCAACCGTTTTTGGATGTTCGTGA
+AGGTCTTGGTCACGTCGGCTCCGCGCAGCCCGATGGATTCCAGGCCGGCGGAGATGATCCGGTCACCACC
+GGGCAGGAAAACCCGTGCGTAGTCTTGTGTCCGGGTGTGTGGCAGCTGGTCGAGCGCCACCCGCGCACGG
+GGATTGTCCGCCAGATAGTGCCGTTCGCTGGCATCGTCGACGGCGGACTTGCGCACCGGCAGATAGCCGG
+TTTGCTGGCTGAAGTAGGCGGTGTTCGTCGGGTTGGTGACGAATGCGATGAACTTGAGCGCGTTGACTTT
+TCGCTCCTCGGAGAGCTTGGCCGGTATCGCCAGCCCCGCACCGCCCGTCGGACAGGCGGGCGCTGCGTCC
+GGGCCCGTGGGCAGCGGTGCGGCGCCGAAGTCGAATCGGGCAGATGCGGTGATGCCGGGCAGCGAGCCGG
+TGGATGCCACGGCCGAGGCCAGGATTCCGGTGGCGAACTCGTTGGCAATATCGTTGGCGACCGCCGCATA
+ACCCTTGCCATGGATGGAGTTCCGATAGAAGTTGCCGGCCGCGATCGTGGCGGGCTCGGTCAATGTCAAT
+GTCCACTTGTCGGAGTAGGCACCGCCGAATGCCCAGTTCGGTCCCTGAAACGTCCACGAGATGAGGTCGG
+CGTTAGCCCAGCCGTGCGCCGATCGACCGGCGCCGACCACGCGCTGTAACTCCGGACCCCACTCGTCGAA
+CTCTGACCAGGATTGCAGTCCGCGGTCGGGTAGGCCGGCCTGTTGCCACGCCGCCTTGTTGTAGTAGAAC
+AGCGGCGTCGAGCGAGCATACGGCACAGCGTAATGGCGGCCGTTGAACTCATAGTCGGCCAGCAGCGAAT
+CGACGTAATCCGTTGTGTCCACCCCAACTTGGCCGAACAGGTCGTCAAGGGCAGTGAGAACACCGATGAG
+GGCGAAATGGAACCACCATCGGTCGTCGAGCAAAACGACGTCGGGCACGTCGGTTCCGATGAGCGCCGCA
+TTGAATTTCTGTGCCACCTCGTCGTAGTCCTTGCCGGCGTCGATCAGCTTGACCGACAGAGTGGGGAATC
+GGTCCTGGAAACGACCGATCAGCTCCCGTTCCGCCGCGCTGGATTGGCCGGGATGACTGGACCAGAAGTC
+GATTGGGCCGGAACCGGACTTCACCGAACCGCCGCCGCCCATCCCGGCGCAGCCGGCGGTCACGCCGGCG
+GCGGCAGCGGCCAGCGCGAGGAATTGTCGGCGGTTCAGCGGGTCCATGCCTATCCCTTGACCGCGCCCGA
+GGTGAGGCCCTTTATCATCTGCCGCTGCAAGGCGATGAAGACCAGCAAGATCGGCAGCATCGCCAACAGC
+GTCACCGCCATCACCGGGCCCCAGTTCGTCACACCCTCGGCCTGCTGCAGAAACGTCAGACCTATCGGCA
+GTGGTGCCACCGATTCGTCGTCGGACATCAGGAACGGCCACAGGTATTCGTTCCATTCGTTGACCACGGT
+GATGACACCGACGGCGACCATGGTGGGCCGCGACATCGGCAACACCACCCGCAGCAGCAGTTGCCACCAC
+CGCGCGCCGTCCATCCGGGCCGCCTCGATGATCTCGGCGGGCAGCGACAGAAAGTGGTTGCGCATCAAGA
+AGGTTCCAAACGCCACCCCCGCCAGAGGCAGGATGATGCCGGCAAAGGTGTTGCGCAGGCCCAGGTGTGA
+GATCAGCGCGTAGTTGGAAATCACGGTGATCTGGTTGGGCACCATCAACGCGGCGATGATCACCAAAAAC
+ACCGCCGTGCGGCCCGGGAACCGGACAAACACCAAGCCAAAGGCGCTGAGCACACCGAGCGTGAACTTCA
+CCACCGCCAGCACCGACGTGATGATCAGCGAGTTGCGCAGAAACGTCCAGAACGGAATCTGCTCGGTGGC
+CGTGCGGTAGTTCTGCGGGTACCAGCGCAGCGGCCACCAACTGGTGGGCTGCGCATAGATGTCGGGCTGA
+TCCTTGAACGAGGTGAAGAACACGAACAGCAACGGCCCGGCAATCAGCGTGACCACCAGCAACATGGCCG
+CGTAGCCAACGCTGCTACGGAGCCGATCCGGCGTCACTGCCGCTGCCCCCGATCCATCACCCGCACCTGG
+TAGTACGTCACGGCCAGCAGCACCAGGAACATGATCGTGGCCACCGTGGCGCCATAACCGGCCCGGAAAT
+TGCGGAACGTCTCCACATACACCTGGTACACCATGGTGGTGGTGCCGGTGCCCTCCGGCCCGCCCCGGGT
+CATCACGTTGATCACATCGAACACCTGCAGCGAGTTGATCAGCACGGTGATCGACAAGAAAAACGTGGTC
+GGCCGCAGCTGCGGCAACAGCACTCGACGGAACACGGCCCACCGGCTGGCGCCGTCGATTTCGGCCGCCT
+CCAACAGATCTCGGCGTACCCCCTGCAACGCGGCCAGATAGATCACGAAGGTATAGCCGAGGTTCTTCCA
+GACGTAGGTGATGGTCACCATGAACAACGCCCAGCGCGCATCCTGGTAAAAGTCGGGCACCCCGACCCCG
+ATCCGGCGCAACAGGTCTTGAATCAGACCGAAATGCGGGTCGAAGACGAACTGGGCGGCCAGGCCGACAG
+CGGCACCGGAGATCACGAACGGCGCGAAAACAGTGGAGCGCACCAGGTTTCGTCCACGCAACGGTCGATC
+GAGCAGCATCGCCAGCGCCAACCCCAGCACCATCGAGCCGACCACCGCGGCACCGGTGAAACCGCCGTGT
+TGAACACGATCTGGCGGGTGTCCGACCGGGTGAACCACTCGGTGTAGTTGGATAACCCCACAAATCGGGC
+CGACGGATCGGAGACGTTCCAGTCGAAGAACGACAGCCGGATGTTGTCGGCCAACGGGCGATAGACGAAC
+AGCAGCAATAGCGCCACATTGGGGCCGACCAACACGACGAACAGCGCATAATCGCGCACGCGCTCTTTCG
+ATGACCGAAGCCGTGCTCGTTGCGGCGCCGCCATCGGCGCAGTGTAGCTCCGTATTCTGTCGGCGAGTTT
+GCCGCCACGGTCGATGAACCAATCACCGCCGTCACGGCAATGTCGGCCAGCTACGCCGCGCCCGTCACCG
+CCCACCGACCGCTGTACGCCCGCCATCCGACGAATATCAGCCGTAGCACGATAAACGTGCCCAGTCCCGA
+CCAGATACCCGCCAGCCCCCAGCCATACGCCAGCGACAACCAGACAAGCGGCAAAAAGCCCACCAACGCA
+CTCGCCACCGTCGCCGTCCGCATGAACGCGGCGTCGCCCGCGCCCAGCAGCACCCCGTCAACTGCGAAAA
+CAATTCCCGCAAAAGGCAATTGGACTACCATGAACCACCACAGCACCCCGATCGCGGCGAGTACCGATCG
+ATCGTCGGTGAATAGCCCGGGCAGCACCGAGGAGCCTAGCCCTAACGCCGCTGCCAAAATTCCCGCCGCC
+AACAGCGAAAACGCCGTCACCCGCCATGCCACCGCCTTAGCGTGCCCGGCATCACCGGCACCCAACGCGG
+CACCGACCAGCGACTGCGCCGCAATCGCTAGCGAATCAAGAACCAGCGCAAGAAGACCCCACAACTGCAA
+CACGACCTGGTGGGCCGCGAGCGCGGCAGCGCCGAACCTCGCGGCCACCGCCGCAGCCGAGACATAACAA
+ACTTGGAAGGCCAGGGTCCGCACGATCAGGTCCCGCGCCATCATCAGCTGGGCGCCCAGCACGGCGCGGT
+CCGGCCGCAGCGACACCCGCTCGGCCAGTAACGCACCGGCAAACAGCAGCGCCGCCAGCCACTGCCCCAC
+CAGATTGGCCACCGCCGAGCCGGTTAACCCCCAGCGGGGCAACCCCAGCCAACCGTAAACCAGCAGCGGG
+CACAGCAGAGCCGACGACCCGAAGCCGGCGACCACATACCGCAGCGGTCGCACGGTGTCCTGCACGCCGC
+GCAGCCAGCCGTTGCCGGCGAGCGAGACCAGGATCGCCGGCGTGCCCAGGATCGCGATCCGCAGCCACGG
+CAAGGCCGCCGCGGTGATGCCATCGCCAGAAGCGATCGCCGACACCAGCGGCGTCGCGGTGGCTTCCACC
+ACGACGACGACCAACGCGCCCAGACCCAACGCCAACCAGGTCGCCTGTACACCTTCGGTGACCGCGGCCA
+CCCGGTTGCCGGCACCGTAACGACGCGCCGCGCGCGCTGTGGTGCCGTAGGACAAAAACGTCGCCTGGGA
+ACCAACCAGGCCGAGCACCAGACTGCCGATAGCCAGACCCGCCAGCGATATCGCCCCCAGCCGGCCCACC
+ACGGCGATGTCGAACAGCAGGTACAGCGGCTCGGCGGCCAGCACGCCCAGCGCGGGCAACGCCAGCTGCG
+CGATCTGACGGCCGCCCGCGCGGTGCCCCACCTGGCTCAACGGCGGCTAACCAAGCGCCGCGCGCAACGA
+CGCCACAGCGTCGTCGATCGAGCCGGTGGTCGTATACCCCGCGGCCAGCCGGTGACCACCGCCACCGAAC
+CCAGAGGCAACCGCGGCCAAATTCACGGTCTTAGCCCGCATCGACACCGACCACCGATGCGGTTCGACCT
+CCTTGAACACCGCCGCGACCTCGGCTTGTTGCGTGGTGCGGACGATGTCGACGATGCTTTCCACTTCCTC
+CGAGCGCGCAGCGACCCACTCCCGGTTGTCGACGACGACGTAAACCAGCCCGCGGCCACCGACCGCCTCG
+GACACCAGCTGCGCCGAACCCAACACCCGCGATAGCAACGGCAACCAGGTGAAGGGATGGCTGTCCATCA
+AGGTCCTGCTGACGGTGGCGTTGTCCACACCGATCTCTACCAGCCGCGCCGCCAGCCGATACCCCCGCAC
+ACTGGCCCAGCGAAACGACCCCGTGTCGGTCGCCAACCCGGCGTAGATGCAGTGCGCGACGCGCGGGTCT
+ATCGGTTTCCCCCACGCGTCGAGGATCTCGGCAACCATCGTCGTGGTGGAATCCGCCGACGGGTCAATGA
+AATTCGCGGTGCCGAACAGGTCGTTGGAGGCGTGATGGTCGATTACCAGGAGCTCCCGCCCGGAATCAGT
+TAGATCGCCCAGAGCACCGAGCCGATCAACACTCGGAATGTCAACAGTCACAACCAAATCGACATCGCGG
+CGCATCACCTCAGGGCGGACCAGCAGATGGCAGCCCGGCAGCGAACGCAGCGACTCGGGCAGTGTCGCCG
+GCGCGGCAAAGCTGACCTCTACCCGCTTGCCGCACCCGTCCAACACCAATGCCAATGCCAATCCGGCGCC
+GATGGTGTCGGCATCGGGGTGGACGTGGCAGACTACCCCGACCCTGGCAGCGGCCGACAACAGCGCAGCG
+GCACCGACGGCGTCCACGCGGGCCCCCGCGCGACGCCGCCCGTCGACCAGCTCACTCCTTGGGTCGATCG
+TCGTCACCGGTGTCTCCCCCGCAAGTGAGCGGTGCCTCCACAGCCTCGGGTCCGTCGCTCGTTCTGATAC
+CCAGTCCCCCGGGAGCCGGTGATTGCGCCACCGACCCGTTATCACGGTACGGGTCGGCCTCCCCCGCCGG
+TTTGGCGCCCACCCGGACCCGCGCCAGATCGGCATCCGCGGCGCGAGCGCGGGCCAGCAACTCGTCCATC
+CGGTGCACACTGTCCGAGATCGTGTCGAGCGTGAACGTCAAGGTGGGAGTGAACCGAACGCCGGTGCCCG
+CCCCGACCTTGGTGCGCAGCACCCCTTTGGCCCGTTCCAGCGCGGCGGCCGCGCCGGCGCAGTTCGGCTC
+GTCGTGTAGCGTGCGTCCCATCACCGTGTAGTACACCGTGGCATCGTGCAAGTCGGCGGTCACCTTCGCA
+TCGGTGATGGTCACCCCGGCCAATCCAGGATCCTTGATCTCGTACTCGATCGCCGAGGCGACGATCGCGG
+CGATCCGTTTGGCCAGCCGCCGCGCCCTAGCAGCATCAGCCATCAGGCGCGTTCCTTCTGGACCAGCTCG
+TAGGACTCGATGACGTCGCCCTCCTTGATGTCGGCGTAACCCAGTGTCAGGCCACACTCGAAGCCGTCGC
+GCACCTCGGTCACGTCGTCCTTCTCCCGGCGCAGCGAAGCGATCGAAAGGTTCTCGGCGACCACGATGTT
+GTCCCGCAACAGCCGCGCCTTGGCGTTGCGCCGCATCACACCCGAGGTGACCAGGCAGCCGGCGATGAGG
+CCGACCTTCGAAGACCGGAACAACGCCCGGATCTCAGCCCGACCCAGCTGGTTTTCCTCGTAGATCGGCT
+TGAGCAGGCCACGCAGCGCCTGCTCGATCTCGTCGATCGCCTGGTAGATGACCGAGTAGTAGCGGATCTC
+CACGCCTTCGCGGCTGGCCAGCTCGGTCGCCTTGCCTTCGGCGCGCACATTGAAACCGATGATCACCGCA
+TCGGAAGCCGACGCCAGGTTGACGTTGGTTTCGGTAATGCCGCCGACACCGCGGTCGATCACCCGCAGCA
+CCACCTCGTCGTCCACCTGGATACCCATCAGGGCCTCTTCCAGCGCCTCGACGGTACCGGCGTTGTCGCC
+CTTGAGGATCAGGTTCAGCTGGCTGGTTTCCTTCAGCGCCGAGTCCAGGTCCTCCAGGCTGATCCGCTTG
+CGTGAGCGCGCCGCCAGGGCGTTGCGCTTGCGAGCGCTACGCCGGTCGGCGATTTGGCGGGCGATACGGT
+CCTCGTCGACGACGAGGAAGTTGTCGCCGGCGCCGGGCACCGACGTGAAGCCAATGACCTGCACAGGCCG
+CGACGGCAGCGCAACCTCGACGTCTTCGCCGTGTTCGTCGACCATGCGGCGAACACGGCCATAGGCGTCG
+CCGGCGACCACCGAGTCACCGACCCGCAGGGTGCCGCGCTGCACCAGCACGGTAGCCACTGGGCCGCGAC
+CACGGTCCAAGTGCGCCTCGATCGCCACACCCTGGGCTTCCATGTCGGGGTTTGCCCGCAGGTCCAGCGC
+GGCGTCGGCGGTCAGCAACACGGCCTCCTCCAGCGCCTCGATATTGGTGCCCTGCTTGGCCGAGATGTCG
+ACGAACATCGTGTCACCGCCGAATTCCTCTGGCACTAAACCATATTCGGTAAGCTGCCCGCGAATCTTGG
+CCGGGTCGGCACCCTCCTTGTCGATCTTGTTGACCGCCACCACGATCGGCACGTCGGCGGCCTGCGCGTG
+GTTGATGGCCTCGACCGTCTGCGGCATCACTCCATCGTCAGCGGCGACCACCAAAATGGCGATATCGGTC
+GCCTTGGCGCCACGGGCACGCATGGCGGTGAACGCCTCGTGGCCCGGGGTGTCGATAAAGGTGATCAGCC
+GCTGGCTGCCGTCCAGATCGACGGCCACCTGGTAGGCACCGATGTGCTGGGTGATGCCGCCGGCCTCGGC
+CTCGCGGACGTTGGCCTTGCGGATGGTGTCCAACAGCCGGGTCTTGCCGTGGTCGACGTGACCCATCACC
+GTCACCACCGGCGGGCGAACCTGAAGGTCCTCCTCGCCGCCCTCGTCCTCACCGTAGCTGAGGTCGAAGG
+ATTCCAGCAGCTCGCGGTCTTCGTCCTCCGGGCTGACGACCTGAACGTTGTAGTTCATCTCGCTGCCCAG
+CAACTCCAGCGTCTCGTCGCCGACCGACTGGGTGGCCGTCACCATCTCGCCGAGGTTGAACAGCGCCTGC
+ACCAGCGCCGCGGGGTTGGCGTCGATTTTGTCCGCGAAGTCGCTGAGCGACGCGCCGCGTGCGAGCCGGA
+TCGTCTCGCCGTTGCCGTGCGGCAACCGCACCCCGCCGACGACCGGAGCCTGCATCGAGTCGTACTCCTG
+GCGCTTCTGCCGCTTGGACTTGCGGCCGCGCCGGGGCGCACCACCCGGGCGGCCGAACGCGCCGGCGGCA
+CCGCCACGCTGCCCGGGACGGCCACCGCCGCCGCCCCCGGGACGGCCGCGGAAGCCCGTTCCGGGAGCGG
+CACCCACGCCGCCACCCCGGTAGTTGCCGCCGCCCGCGTCGGAACGGCCAGCGCCGGGCGCACCGGGCCG
+GCCCCCGGGTCGTGGCGCACCAGGACGTGGTGGACGGGCACCCCCGACAGCTCCACCGGGGCGTGGCGGC
+ATGCTGCCGGGCGAGGCGCCCGGACGTGGAACCCCGGGCCGGGCGGTACCGGGGCGGGGAGCCGGCGGAC
+GCGGGATGGGCCGGTCGGCGGGTTGCGCCGACGAGAACGGGTTGTTGCCGACGCGCGGGGTGCGAATCCC
+CGGCTTCGGCACCGGGCCCGGCCGCGCCCCGGGAGCCATGCCGGGGTGGGGTGCCTGAGGGCTGGGCGGC
+ACTGCGGTCGGAGGCTCGGGTGCGGCGGGGGTAGTTGGGGAGACGATTGCCGCCCCGCCGGAATCGGCGG
+CCTTGGCGGGCGCGGCAGTCGCCTTGCCGTTGCCTGCGGCCATGTCGATCGCGGCGTCCAGCGCCTTGTC
+AAGGGACTTGTCGGGGCCTTTGCCGGGGGACTTGGCGGTGCCTTTCGCCGGGGCAGGTTTGCTGCCACCG
+AACGATTCACGCAGCCGACGGGCAACCGGTGCTTCCACCGTCGACGATGCTGATTTGACGAATTCGCCCT
+GCTCGCTCAGCCGGGCGAGAACTTCCTTGCTGGTTACACCGAGTTCCTTAGCCAACTCGTGTACGCGGGC
+CTTACCTGCTGCCACTACATCTCCTGTCCATGAGGCGACAGTCGTGGGCCGCGCCTCGGGTTTAGCTATG
+ACGCATTGTCATCGGGACTTCACGGTGTGCTCATGTTCTATTGCTACCTGTTCTGTTGCCCGGTGGTTCG
+AGCTCGCCTAGAGACTCCAGGTACTCGACCACTGCGGATGTGTCCGGCGAACCGGCGATGCGCAGCGCTC
+TTGCGAAAGCCCGCCGCCGAATCGCTTGTTGCGCGCACTGCCGTAGCGGATGCAGCCACGCACCCCGCCC
+CGGCAGGCTGGTCGCTGTATCAACGATCACGGCGTAGTTGCCGTTCCCGGTCGACACAGCCACCACTCGA
+AGCAGTTCGACGGCCAACCCTCGCTTTCGGCACCCGACACACGTCCGCACCGGTCCGCGGGGATTATCCG
+GGCGTCGATGCGCCGAGGCCGAAGGCTCGCGCTGGATCACGGCTAAGTGTAGCGTCACCGGGCAAGCCCG
+ATTGCCCGGCTATCTGCCGTGGGATAACGCACGGCGCTAGCGGTCGTGCGCCATACCGCGGCTGACTCCG
+GGTTCGGGCTGACCGGGCGGGGGCGGCGGCGCATCGCCGCGAATATCGATACGCCACCCGGTGAGCCGGG
+CAGCCAGCCGGGCGTTCTGCCCTTCCTTTCCGATTGCCAGCGACAATTGGAAATCGGGCACCACCACGCG
+GGCGGCCCGGGCGGTCTGGTCGATCACCGACACCGACACCACCTTGGCCGGCGACAACGCGTTGGCGACA
+AAACGCGCCGGATCGTCGTCATAGTCGATGATGTCGATCTTCTCCCCGGACAGCTCGCTCATCACGTTGC
+GGACCCGTTGCCCCATCGGACCGATGCAAGCACCCTTGGCGTTCAAGCCGGCAACGTTGGACCGCACAGC
+GATCTTGGAGCGGTGGCCGGCCTCCCGGGCCACCGCGACGATCTCCACCGATCCGTCGGCGATCTCGGGG
+ACTTCCAGCGAGAACAGCTTGCGCACCAGATTGGGGTGCGTGCGCGACAGCGTAATCAGCGGCTCGCGGG
+CACCTCGGGTTACACCAACTACGTAGCAGCGCAGCCGGTTGCCATGTTCATAGCTCTCCCCCGGTACCTG
+CTCAGCGGCCGGGATCACACCCTCGGAAGCCTTGGTCTCGGTGCCAATCCGGACGACGACCAGACCGCGG
+GCGTTGGCCCGGCTATCGCGCTGGATCACTCCCGCAACGATCTCGCCCTCGCGGGTGGAGAACTCGCCGT
+AGGTGCGCTCGTTCTCGGCGTCGCGGAATCGCTGCAACATCACTTGGCGTGCCGTCGTGGCGGCGATCCG
+GCCGAAGCCCTCTGGAGTGTCGTCCCACTCGCTGATGAGATTGCCAGCCTCATCGGTCTCACGGGCGATC
+ACCCGAACGACACCGGTTTTCCGGTCGATCTCGATGCGCGCATCGGTCTGGTGACCTTGGGTGTGCCGGT
+AGGCAGTCAACAGCGCGGACTTGATCGTTTCGAGCAGTTCATTGACCGAGATACCCCGGTCCACCTCGAT
+GGCATGCAGAGCAGCCATGTCGATGTTCATGCTCCGGCCTCCGTCCCGCGGGCCAGCCCCATCTCGGAAG
+ACTGGGCCAGTTCCAACTCCGCCGGAGCCGGTGGCGAAAACTCAACCTGGACAACAGCTTTCACAATCTC
+AGCAAGCGGGATCTCACGGACTGCCCAGCCCCGGTCTTCCCGGATCACCAACGCCACCGTGCCAGCACGC
+ATCTCGCCGACCCGGCCGGTCAGTCGCGATCCGTCTGACAACACCAGCTCAACCTTGCGGCCTCGAGCAC
+GGCGGAAGTGCTTTTCGCTGGTCAGCGGGCGTTCCACACCGGGAGAGCTGACCTCGAGCAGGTAGCGGCC
+CCGGATCTTGTTCGCACCGTCCAGGCCGTCCAGCAAAGCCGATGCCCTGCGCGACAATGCGGCTATCGTA
+TCCAGGTCGAGAGGGGCGTCACCGTCGGCGATCACCGCTATCCGCGGCGGGCGGGCCCGCGCATCGATGA
+CCACGTCTTCGATCTCGTAGCCGGCGCACGCGAAATCTGCACCGAGTAGCTCGATCACCTGCCTCTGCGA
+AGGTAGCCCGGTGGTCACGGCGAGCTCCTCATCTTGAGTTGTCCGGTCATCTAGCGGAGGCGCCGCCAGG
+GCGGCTCCCAGTGTCCCGCCGGCACGCAGCAGCCGGCGTAGCTACCAACGATACGCCAGGAATCACGAAT
+GACGCCGTGATCACGCCGTTCAACGTCTCGCCTGCCTTCGTAGCGGCGTCTTTCTGATGGCAGGATGTTG
+CTGTGCTTAGAGCAGCACCAGTCATCAACCGGCTCACGAATCGACCCATCAGCAGGCGGGGTGTGCTGGC
+CGGTGGCGCCGCGCTGGCCGCACTGGGAGTGGTGTCCGCCTGCGGCGAGTCCGCGCCCAAGGCACCCGCG
+GTCGAAGAGCTGCGCTCGCCGTTGGACCAGGCCCGACACGACGGTGCGCTCGCAGCTGCCGCCGCCACAG
+CCATCGGGATCCCGCCGCAGGTTGCCGCCGCGCTGACCGTCGTCGCCACTCAGCGAACCTCGCATGCTCG
+AGCGCTGGCCACCGAGATCGCCCGGGCCGCGGGCAAGCTGGTATCCGCTACGAGCGAAACCAGCAGCTCC
+AGTCCCAGCCCAACCGATCCGGCGGCACCGCCACCAGCGGTGTCCGACGTGATCGATTCGCTGCGCACGT
+CAGCGGGGGAAGCCAGTCGACTAGTGGCGACGACATCGGGCTACCGAGCAGGGTTGCTCGCCTCCATTGC
+CGCGTCCTGCACCGCCTCCTATACGGTTGCGCTCGTGCCTTCAGGCCCGTCGATATGACCTCGTCCGAAC
+CCGCCCACGGTGCCACACCGAAGAGGTCCCCCTCCGAGGGGAGCGCCGACAACGCGGCGCTGTGCGATGC
+GCTTGCCGTCGAACACGCCACCATTTACGGCTACGGCATCGTCTCCGCGCTCTCGCCCCCTGGTGTCAAC
+TTCTTGGTGGCGGACGCGTTGAAGCAGCACCGCCACCGCCGAGACGACGTGATCGTGATGCTGTCCGCGC
+GCGGAGTCACCGCCCCGATCGCTGCCGCCGGTTACCAGCTGCCCATGCAGGTCAGCAGCGCGGCCGACGC
+GGCACGACTAGCAGTGCGGATGGAGAACGACGGGGCAACGGCCTGGCGGGCGGTTGTCGAGCATGCCGAG
+ACGGCCGATGACCGGGTGTTCGCTTCGACGGCTCTGACCGAGAGCGCGGTGATGGCCACCCGCTGGAACA
+GGGTGCTGGGCGCCTGGCCCATCACCGCGGCCTTTCCGGGCGGGGACGAATAGCTACCCGGTGACGGCCG
+CTGCGATATCGGTGGCCAGCGAGGCGCCGGCAACCAGCTCGCGAGTCTGACCGCTGAACCGGTCGCGCAG
+CTCGACCACGCCGTCCGCCCAGCCGCGCCCCACGACAACGATCCAGGGCATACCCAACAGCTCGGCATCT
+TTGAACTTGACGCCGGGCGATGCCTGGCGGTCGTCCAGCAACACCTCAACCCCCAGCCGATCCAGATCGG
+CGGCCAGCGCGGTCGCCCCGGCGCGAGCCTGCGCGTCCTTGTTCGCGATCACCAGGTGAACATCGAACGG
+CGCGACCGTCGACGGCCAGCGAAGGCCCAGCTCGTCGTGGTGCTGCTCGGCAACGACGGCAACCAACCGA
+GACACACCGATGCCGTAGGAACCCATGGTCAACCGCACAGGCTTGCCATCCTCGCCGAGCACGTCGGCGG
+TGAAGGCGTCGGTGTATTTGCTCCCCAGCTGGAAGATGTGCCCAATTTCGATACCGCGCGCCATGACCAG
+CGGACCGGCGCCGTCGGGAGATGGATCGCCTTCGCGCACCTCGGCGGCCTCAATGGTGCCGTCTGCGGTG
+AAGTCGCGGCCGGCCACCAAACCGACAACATGGCGGCCGGGTTGGTCCGCCCCGGTGATCCAGCTGGTGC
+CGTCGACTATCCGCGGGTCGACGAGATAGCGGACATTGTTCTCCCGCAACGCCTTTGGCCCGATATAACC
+CTTAACCAGGAACGGGTGCTTGGCGAAATCATCGTCGTCGAGCAACGCGTAGTCAGCCGGTTCCAGCGCT
+GCGCCCAACCTTTTGTCATCGACCTCACGGTCGCCGGGCACGCCGATTGCCAGCAGTTCGGTGTCCCCTC
+CCGGCTGTCGGACTTTGATTAAGACGTTCTTCAGGGTGTCCGCGGCGGTCACCGTGCGGCCGAGATCGGC
+CTCGTTGGCCCAGGCCACCAGGCTGGCGATGGTTGGGGTGTCGCCGGTGTCGTGGACCACCGCCTCGGGC
+AGCCCATCGATGGGCAGGGTGTCCGGGCGGGCGGTGACAACCGCCTCGACGTTGGCCGTATAACCCGACT
+CGAGGCACCGGACAAATGCGTCCTCCCCGGACGGACTCTCAGCCAAGAACTCTTCGGACGCACTGCCGCC
+CATCGCCCCGGACACTGCCGAAACGATGACATAGCGCACCTGAAGTCGGTCAAATATGCGCTGGTAGGCC
+TCCCGGTGAGCGCGGTAGGCCGCCTTCAGCCCGGCGGCGTCGATGTCAAAGGAGTAGGAGTCCTTCATGA
+CGAACTCCCGAGCGCGCAGGATGCCGGCCCGCGGCCGCGCCTCGTCGCGGTACTTGGTCTGGATTTGGTA
+CAGCGTGAGCGGGAAGTCCTTGTAGGAGCTGTACTCGCCCTTCACGGTCAGGGTGAACAGCTCTTCGTGG
+GTGGGGCCCAGCAGGTAGTCGTTGCCGCGGCGGTCCTTGAGCCGAAACACGCTGTCGCCGTATTGGGTCC
+ACCGGTTGGTCGTCTCGTACGGTGCCCGCGGCAGCAGGGCAGGAAATAGGATCTCCTGTCCACCGATGGC
+GTTCATCTCGTCGCGGATGACCCGTTCTATGTTGCGCAGCACTCGCAGGCCGAGCGGTAACCAGCTGTAC
+AGCCCGGGCGCGACGGGCCGGATGTAGCCGGCCCGGATCAGCAGTTTGTGGCTGGCCACTTCGGCGTCGG
+CGGGATCGTCGCGCAGGGTGCGCAAGAACAACTCGGACATCCGGGTGATCACAGGCGGCAAGCCTAATTC
+GCCGAGCAGACGCAAAAGCGCCCAGGTCTGCCCGAAAAGGGGAGCTTTTATGACTGCTCGGCGGGAAGGG
+TTACAGCTCGCCGGCGTCGATCGCTTCCTTGACCTCCTGCGCATGGGCAACCTGCTGCGGCGTATACCCG
+ATAAACAGCGCCATACCGCCGACGATGATGGCCGCTCCGGCCACCCACAGCAGGCCGTAGGTGTAGGCGT
+GGTCAAGCGCGGCCAACTGCACGTCGTTCATGAACTTCACCGGACCGGTGGTACCGCCCAGGTACAGCGT
+GCGCGACGTGATCACAGCCTGGATGACGGCGAGCACCAGCGGACCGCCCAGGCTCTGCAGCATCAGCGCA
+ATTGCCGATACCGGACCGATCTGGTCGAAGCCGACGCCAGCGATCGCCGACAGAGTCAGCGGGACGACGG
+CCATGCCGATGCCAATCCCGCCGACGACGATCGGCATGACCAGGTTGGGGAAGTAGGGCACACCACGGTG
+CATGAAAAATGAGCCGTACAGCATGGCGCCGAATAGCAGATATCCGCCGCCGATGGTCAACACCCGTGGC
+GAAAACCGGGACACCAGCTGCGAGGACACACCTAGGCCGATTCCCATCGCGATGACGAACGGGATGAAAC
+CTACGCCCGCGCGTAGCGCGCTGTAGCCCAAGATGTCCTGCACGTACAGGCCGATGCAGACGGTCAGGCT
+GAACATGACGCCGCCGGCCAACAGGATCGCGCTGAACGTGACCAACCGGTTGCGGTCGCGGAACAAGTGG
+AACGGCACGACGGGGTTCTCGGCAGTGCGCTCCACGATGACAAACGCGACAGCGGCCGCCAAGGCCACCA
+GGCCCGAACCGATGGTAATGCCTGACATCCAGCCCTTTTCAGGACCGATCGAGAAGGCGAAAACCGCCGC
+GGTGCATGCCAGCGTGGCCAGTATGGCCCCGGTGGCGTCGAGCTTCATCCGTTCTTTGTTGGTTTCCCGT
+AGGGCGGTGCGGGCCAGGTAGATCATCACCAGCCCGATCGGCACGTTCACCAGGAACGCCCACCGCCATG
+ACACCTCGGTCAGTGCTCCGCCGACCACCAGCCCCATCACCGACCCGATCGCGGTCATCGCGGCGAACAC
+CGCCGTCGCGGCGTTGCGGGCAGGTCCCTTGGGGAACGTGGTCGCCACCAGCGCCAGACCGGTCGGAGAT
+GCGATGGCCGACCCCACACCCTGGGACAACCGGGCGATCACCAACGTCGCCTCGTCCCAGGCGACCGCGC
+ACAGCACCGACGAGATGGTGAATAGCGCAACGCCAACAATGAAGGTGCGTTTGCGCCCGATGGTGTCGCC
+AAGCCGGCCGCCGAGCAGCATCAGCCCGCCGAAGGTCAGCACGTAGGCGGTGATCACCCAGCTGCGGCCG
+GCATCAGACAAGCTCAGCTCGTTTTGAATCTTAGGTAGCGCGACGATGGCGACGGTGCTGTCCATGGTCG
+CCAGCAGCTGCATCCCGCCGATAGCAATAACCGCAGCGATAAAGCTGCGCGAGGGCAGCCAAGTCGGGTA
+GTACCTGCTGGGGCGCTCTGAAGCGGTCTCCTCCGAGCGCGGCGGGCGCATCGGGGCCGGACGGTGTGGG
+CGTCCGGCCCTCCAGTTACGGACCGCCCGCTCTGTGTCGTTGAGAGCCGTCATAGCGGGTTACCTTACAG
+TATTCTTAAGAATTGTTTAAACCCCGAACGCCGCTCAGGCCGACTACAGCCCCGATCACGATGATCGCGG
+GAGGTCGGATCCCCGCCGCGCGGACCTTCTCCGGCGTGTCGGCAAGGGTGGCCCGCAACGTCTGTTGAGC
+GGCGGTCGTTCCGTGTTGAACCACCAGTACCGGCGTATCCGCAGTTCGGCCACCCTTTAGCAGAACGTCA
+ACGAAAAGCTCGATGCGTTCGACCGCCATCAGCAAAACGATGGTGCCCGTCAATGCAGCCAATGCATCCC
+AATTCACTAACGATTCGGGATGACCGGGCGCAAGATGGCCACTGACCACCACGAATTCGTGGGTCATGGC
+CCGGTGAGTGACTGGAACGCCCGCCATAGCGGGCACGGCTATGGCACTCGTCACACCTGGCACCACGGTG
+ACCGGGATTCCGGCGTGGGCACATGCCAGCACTTCTTCATAGCCCCGGGCGAACACGAAGGGGTCGCCCC
+CTTTGAGACGGACCACAAAGTTGCCGGATCTGGCCCGTTCGATCAGGACAGCGTTGATCGCGTCCTGGGC
+CATGGCCCGGCCGTAAGGGATCTTGGCCGCGTCGATGACTTCTACGTGCGGCGGCAGCTCGGCCAGCAGT
+TCGGGCGGGGCGAGCCGGTCGGCGACCACGACATCGGCCTGGGCAAGCAGCCGGCGACCGCGAACCGTGA
+TCAGTTCGGGATCGCCGGGACCGCCGCCGACCAACGCCACTCCGCCGCTGAGGACGTCGGAACTCTGCGC
+AGTGATGACGCCCTGCTGCAACGCCTCCCGGATTGCCGAGCGGATCGCCGCCGAACGGCGGTGCTCACCA
+CCGGCGAGCACCCCCACCGACAGGCCCGCATAGCTGAATGACGCCGGGGTCACCGCCGTCCCCTCCACCG
+CGATATCGGCCCGGACGCAAAAGATCCGTCGGCGCTCCGCCTCGGCGACGACAGCCACGTTCACCCGCGC
+GTCATCGGTGGCCGCGATCGCATACCAGGCGCCGTCAAGGTCGCCGTCGCGGTAGTCACGCACCGACAAG
+GTGATCTGGTCCATCGCCTCGACGGCGGGGGTGACGCTGGGGGCGATCACGTGCACGTCCGCGCCACTGG
+CGATCAGCAGGGGTAACCGGCGCTGGGCGACCGTGCCCCCGCCAACCACGACGACCTTCTTGCCAGCCAG
+CCGTAACCCGACCAGATAGGGGTTCTCGGTCACCCGCCAAGCCTAGTGGCGATCGCAAGCGCGGGGACCG
+GGCGCCGCGGGTCGCCACCATCAGGGCCAGTGGCGATCGCAAGCGCGGGGACCGGGCGCCGCGGGTCGCC
+ACCATCAGGGCCAGTGGCGATCGCAAGCGCGGGGACCGGGCGCCGCGGGTCGCCACCCCTTTGGCCGCGA
+ATGTAACGCCACTGCGAATTTCCGGCCCGGCTTTTCGCAGTGCCGTTACGCTCGTGGAGTATTGCAGGCC
+GCATGTGCGACGAAACGCGCCACCGCACCGGGTGTTGCGGCCGGATGGGTATGCAGGTAGGACGCGTGCA
+CGCCGCTGTGCACCGCGCCGTCTCGCACGTCGTCCACGTCTTGGCCCTGGTACACCCACGCGGGCTGATA
+GCTATCGGCGAATGTGACTGCGGTTCGGTGGAATTCATGTCCAACCACGCGCTCGCCGACGGAGTACAGC
+GCCGAATCAACAACCGCGACGGCGTCGCGATAACCCAGCTTGAGATGCTGGGTGAACCGCGCCGATCCGG
+CCACCACACCGCACATCGGGTGTCCGTCGAGTTCAGAAACCAGATAGAGCAGGCCGGCACATTCGGCATG
+CACCGGGGCGCCGGCAGCGGCCAGTTCGTTGATCTGCCGCCGGACGGTGTCGTTGGCGGACAACTCGGCG
+GTGAACTGCTCGGGGAATCCGCCGGGCAACACCACCGCGTCCGTACCCTCGGGCAGAGTTTCGCTGAGCG
+GGTCGAACTCGACCACTTCAGCCCCGGCGGCGCGCAACATCTCGGCGTGTTCGGCGTAGCCGAAGGTAAA
+CGCCCTTCCGGCCGCGATGGCAACCGTGGCTGGCTGGCGGGCGGTGTTGCCGACGGCAATCACCGGGTCC
+CATGGCGGGTGGGCCGCCTGGCTCCCGGCGCAGGCGATCACCGCGGCCAGATCGACGTGGCGAGCGACCA
+CAGCAGTCATCGCCTGCACGGCGAGCCGTGCGCGACGGCCGTACTCGACGGCGGTAACCAGACCCAGATA
+CCTTGTCGGCAGCTCTAGTTCAGCTGTGCGTGGAATGGCGCCCAAGACCGCGACACCGGCCTGGTCACAC
+GCCTGTCGCAGCACCTGTTCATGTCGGGCCGATCCGACCCGGTTGAGGATGACACCGGCGATCCGAGTTG
+CGGTGTCGAACGTGGAAAAGCCGTGCAGCAGTGCGGCAACGCTGTGACTCTGGCCGCGGGCATCGACCAC
+CAGGATCACCGGGGCGCCAAGCAGAGCAGCGACGTGCGCGGTGGACCCCGCTGCGGGCGCGCCCCCGGCA
+GGCCCAATGCGCCCGTCGAACAGCCCCAGCACCCCTTCGATCACGGCGATGTCCGCGCCCGCAACTCCAT
+GCGCGTACAGGGGGCCGATAAGCCGCTCCCCCACCAGTACCGGGTCGAGATTGCGGCCGGGCCGTCCCGC
+GGCCAGGGCGTGATAGCCGGGGTCGATAAAATCCGGGCCTACCTTAAACGGCGCGACGGTGTGACCGGCC
+TGCCGCAGCGCTCCGATCAAGCCCGTCGCGATCGTGGTCTTACCGCTGCCCGACGCAGGCGCGGCGACGG
+CCACCGCGGATACCCGCATCACCACTCGATGCCCTTCTGCCCCTTGCGGCCCGCATCCATCGGGTGCTTC
+ACCTTGGTCATCTCGGTCACCAGATCGGCGGCCGCAACCAACCGCTGGGGTGCGTCTCGCCCGGTGATCA
+CCACATGCTGATGGCCAGGCCGGGCTCGCAGGACATCGACGACTTCGTCGACGTCGAGCCAACCCCACTT
+CAGTGGGTAGGTGAACTCGTCCAGCAGATAGAAGTCGTGACGTTGCGTGGCCAGCCGGAGCGCGATCTCG
+GCGCAACCGTCCGCCGCCGCGGCCGCACGATCGACGTCGGTGCCGGCCTTGCGAGACGTACGTGTCCAGG
+ACCAGCCCGCACCCATCTTGTGCCACTCCACCGCTCCGCCGATCCCGTGCTGGTCGTGCAGCCGGCCCAG
+TTGACGAAACGCCGCCTCCTCACCCACTTTCCACTTAGCGCTCTTGACAAACTGAAACACCGCGATGTCC
+AGACCAGCGTTCCACGCCCGCAACGCCATTCCGAACGCCGCGGTCGATTTTCCTTTGCCTTCACCGGTGT
+GTACCGCCAGTATCGGCATGTTGCGCCGGGCCCGGGTGGTCAGGCCATCGTTGGGCACTGCGAGCGGATT
+GCCCTGCGGCATGTGTGGTTACCTATCCATCGTCAAGCCACGCCACGCACGGCATGCACTAGATAATCCG
+CGTGCAACTGCTCCAACCGAACCACCGGCGCACCCAGCTGACGAGCCAGTTGCGCTGCCAAACCCAGCCG
+TACATACGACGTTTCGCAGTCCACCACCACCGCGGCCGCGCCCTCGGCGACCAGCCCGGCAGCCGCGGTT
+CGGCTGCGGCCCAACGGGTCCGGCCCGGCGGTGGCCCGGCCGTCGGTCAGCACGACCACCAGGGGGCGTC
+GGGCGCGGTCGCGTACCTTCTCCCGGATGATCAGCGCACGCGCGGCCAGCAGTCCCTCAGCCAGCGGGGT
+CTTGCCGCCGGTGCTGAATCGGGCCAGTCGCCGGCCGGCGATGTGCGCCGACGACGTCGGCGACAGCAAC
+AGCGTTGCCTCGTGCTGGCGGAAGGTGATCACCGCCACCTTGTCCCTGCGCTGGTAGGCGTCGCGCAGCA
+GCGACAGGGTGGCGCCACTGACCGCAGCCATCCGGTCCCGAGCAGCCATCGATCCGGAAGCGTCGACGAC
+GAAGATCACCAGATTGCCTTCGCGACTCTCGCGGATGGCCCGGCGCACATCGTCCGGCCACGGGCGCAAC
+GGCCCGGCTCCGAACGCACGCTCGCCGGCGGCCAGCAGGGTAGCGAACAGGTGCAGTCCATGTGCGTCGG
+GGTCGCTGACCTCGGCGGCCGCCACCACACTGCCCGAGGCGTTGCGGGCCCGAGACCGTCGCCCCGGCGC
+GCCCGTGCCGACCCCCGGGACCCGCAGCGCGCGGGTCCGGAATATCTTTGACGGCGGCGCGCTCGGGCGC
+GGCGACGATCGCAAGCGCGGCGAAGCCGGGCGCGGCGGGTCGTCGCCCATCGAGCTCGGCGCACCAGGTT
+CTGTCGACTTCGAGCGTGAGTTCGGTTGTGAGGCAGGTTCATTGGCTGACTGGCCGCCCCCGGGCGGATC
+GGGCTCGGGCTCTGGGTCGACGCTCGCCAGCGCCAGCGCCTCATCCAGCTGGTCGCGGTCGATGCCGTGA
+TCGTCGAACGGGTCGCGACGACGACGATGCGGCAACGCCAGTTCTGCTGCCGCCTGGATATCCTGCTCCT
+CAACGGTGCGGACACCACGCCAGGCGGCGTGCGCGGCGGCGGTCCGGGCCACTACCAGATCGGCCCGCAT
+GCCGTCCACGTCGAACGCCGCGCACAACGCAGCGATGCGCCGCAACTCGTTGTCGCCCAACACCACATCG
+TCTACCGTGGCCCGGGCCGCGGCAATCCGGTGGGCCAGCTCCGCGTCGGCGTCGGCATAGCGTGCGACGA
+ACGCATCCGGGTCGGCTTCGTAGGCCATCCGCCGGCGGATGACCTGTACCCGCACGTCGATGTCACGTGA
+CGCCTGCACGTCGACGGTCAGCCCGAACCGGTCCAGCAGCTGCGGACGCAGTTCGCCCTCCTCCGGATTC
+ATCGTGCCGATCAGCACGAAACGGGCCTCGTGGGAATGGGAGATGCCGTCGCGTTCGACGTGTACGCGTC
+CCATGGCGGCGGCGTCGAGCAGGATGTCAACCAGGTGATCATGCAGCAGATTGACCTCGTCGACGTAGAG
+CACGCCGCCGTGGGCGCGAGCCAGCAGTCCCGGAGAGAACGCGTGCTCGCCGTCGCGCATCACCCGCTGC
+AGATCCAGCGAGCCAACCACCCGGTCTTCGGTGGCCCCCAGCGGCAGCTCCACGAGGCCGGTCTCGGTGC
+TCCCGGTCGCGACCGACAACAACGCGGCCAGCCCGCGCACCGCCGTCGATTTCGCCGTGCCCTTCTCGCC
+ACGGATGAGCGCCCCACCGATCTCCGGTCGCACGGCACACAACAACAACGCGAGCCGCAGCCGATCGTGC
+CCGACGATCGCGCTGAACGGATAAGGCTTCACGGCCGCTCCACCTGACCGGAGCCGGGCCGCAACATGGG
+CACATGCGGGATGCCGTCGTCCAGGAACTCGTCACCGTCGCGGACGAAGCCGTGCTGGGCATACATGGCC
+GTCAGGTAGGCCTGTGCATCAATCCGACAGGGGTAGTCGCCCACCTCGGCCAGTGCCGCGCACAGCAGCC
+GGTTGGAGTGGCCCTGTCCGCGGGCGTCGCGTTTAGTGCACAGCCGGCCGATCCGGAAGACCTTCTCACC
+CCCGGCGTGCTCTTCCATCAGGCGTAGCGTGCACGTCACCTCTCCGTCGGGCGTTTCCAACCAGAAATGC
+CTGGTCTCGGCAAGCAGGTCACGCCCGTCTAGCTCCGGGTATGGGCAGGCCTGTTCGACAACGAACACCT
+CCACCCTCAACTTGAGCAGCTCGTAAAGGGCCCGGGCGTCAAGGTCTTTGGCCCAGACGCGGCGCAGTGC
+TTCGGTCATAAGCGCCGCTCTCCCCCGCAAGCGGGCGGTACCCCCACTGTATCGTCGCCGGCGCGGGTCA
+TGCGGCACCTAACTTCAGCGCCTTGGTGCTCCATGACCACACCTCGTCGAACAGCGCGGGTTCATTCGAC
+AGCTGCACCCCCAGCGACGGCACCATTTCTTTGAGCGTGGGCAGCCAGGATTGATAGCGGTTGGCAAAGC
+ATTTCTGCAGCACGTCCAGCATGATCGCCACCGCGGTCGAAGCCCCTGGGGAGCCGCCCAGTAGTCCGGC
+AATACTACCGTCAGCATCGCCGATGACCGTCGTGCCGAACTCGAGCACCCCGCCGTTGCGTTCATCTCGC
+CGGATCACCTGTACCCGCTGACCGGCTATCGTCAACTCCCAGTCCGAATCGATTGCGCTAGGGGCGAATT
+CGCGCAGCGCACTGACCCGCTCGGGTTCAGAGAGACGCAGCTGGCTGATCAAGTAGTTCAGCAGTCTCCG
+CTCGGTGAGGCCCACGCCGAGCACGGACAACAGATTGTCCGGCCTGATCGACCGGGGCAGGTCGCTGATC
+TGCCCGTGTTTCAAGAACTTCGGCGACCAGCCGGCGTATGGCCCGAACACCAGCCACGACTTGCCGTTGA
+CAAACCGCAGATCCAGATGCAAGGCGCCCAACGGCGGGGCGCCCGGCGCCGGGAAGCCATATACCTTTGC
+CCGATGCGAGGCGGTGAGCGCCGGGTTCCCGGCGCGCAGGAACCGACCGCCAATCGGGAAGCCGGCGAAG
+CCTTTGACCTCTTTGATCCCGGATTTCTGCAGCACCGGCAAGGTGTCACCCCCGGCCCCGACAAAGACGA
+ACTTGGTGTTCAACTTGCGCTTTTCGCCGGTCCGGCGGTTGCACATGGTGACCGTCCAGCTGCCGTCGGA
+TTGCCGCGAGAGGTTGCGAACCTCGTGCCCGAACAACGCGGTAGTGCCATTTTGCACGCAATAGCCGATG
+AGTTGTTTGGCGAGGGCACCGAAGTCGACGTCGGTGCCGTCGGCGGCCCAGTTGAGCGCCACCGGCTCGG
+AGAAGGCCCGTTTAGCGGCCATGAACGGCAGCCGGCGGGCGAATTCGTCGGGACTCTCGATGAACTCGGT
+GCCGGCGAACAGCGGGTTGCCGGCCAACGCCTTTTGGCGGCGCCGTAGATACTCGACGCCCCGCGATCCA
+TGGACGAAACTCACGTGCGGCACAGGGTTGAGGAAGCTGCGCACGTCGGTGAGGATGCCGTTTTCGGCCG
+CGTATGCCCAGAACTGGCGGGTGACCTGGAATTGCTCGTTGACACGCACCGCTTTGGTGATGTCGATCGA
+GCCGTCCGGCATTTCTGGGGTGTAGTTCATCTCGCACAGCGCGGAGTGCCCGGTGCCGGCGTTGTTCCAG
+GGACCGCTGCTTTCGGCGGCTACCGCGTCCAGCCGTTCGATCAGGGTGATTGACCAGTTCGGTTCGAGCC
+GACGCAGCAGCACCCCCAGCGTGGCGCTCATGATGCCCGCACCGATCAGCACGACGTCGGTTCTGGCTAG
+GTCTGACACCGGACGGTTGGTTCCTTCCTTGGCTGCGCCGCTCCCAGGTTATCCCGACGGGTGTTAACAC
+GATGACGTCCGCCTCCTGGGCCAGTAACCCTGTGCAGCGCGGGGCAGCCAACCCAAGACAATTACCCCGA
+AGCCCACAATGTGCGTCCCTGGCCGCCATAGAATCCGCACTATCCGCCCAGTCCGGTTCTTCTTGGGAGG
+TAACGATGTTGTATGTAGTTGCGTCACCCGACTTGATGACCGCGGCGGCTACCAATCTGGCGGAGATTGG
+TTCGGCGATCAGCACGGCAAATGGTGCGGCGGCACTCCCGACTGTTGAGGTGGTGGCCGCGGCCGCCGAC
+GAGGTGTCCACGCAGATCGCGGCTCTATTCGGAGCGCATGCCAGGAGCTACCAAACCCTCAGCACCCAGG
+CAGCGGCGTTTCATAGTCGGTTTGTGCAGGCGTTGACCACGGCCGCGGCTTCCTACGCCAGCGTAGAGGC
+CGCCAACGCGTCGCCACTTCAGGTTGCGCTAGACGTGATTAATGCGCCCGCCCAGACACTGCTCGGACGT
+CCGCTAATTGGTAACGGCGCCGACGGATCGACACCGGGGCAGGCCGGCGGGCCCGGCGGGTTGCTGTACG
+GCAACGGCGGTAATGGCGCCGCCGGTGGGCCCAACCAGGCCGGCGGCGCCGGCGGCAACGCCGGCTTGAT
+CGGCAACGGCGGGGCGGGCGGCGCCGGGGGTGTTGGCGCGGTCGGCGGTAACGGCGGCACGGGCGGCCTG
+CTATTCGGCAACGGCGGGGCCGGCGGGCAAGGCGGGCTCGGCCTCGCAGGTATCAACGGCGGCAGCGGCG
+GGCAGGGAGGCCACGGTGGCAACGCCATCCTGTTCGGCCAGGGCGGTGCCGGCGGGCCAGGTGGCACCGG
+CGCCATGGGCGTCGCCGGCACCAATCCCACCCCCATCGGCACCGCAGCGCCTGGCAGCGACGGCGTAAAT
+CAGATTGGGAACGGTGGTAACACGGACCTCACCGGCGGCGCCGGTGGCGACGGCAATGCCGGCAGCACCA
+CCGTGAACGGCGGCAACGGCGGTACCGGCGGCGCAGCTAGGAACTCATCTGGTGGTACCGGTAACTCCTT
+TGGTGGTGCCGGCGGCGCCGGAGGCGACGGCGCCAACGGCGGCGACGGTGGCGCTGGCGGGGAAGCCCTC
+ACCGAAGGCGGTGCCACCGCCGTTAGTGGTGCTGGTGGTAAGGGAGGTAACGCCGAGGCTTCCGGCGGCG
+CCGGCGGCAACGGCGGCAAAGGTGGCTTTGCTCAGGCCACCACCAGCGTGACCGGGGGTAACGGCGGTAA
+CGGTGGCAATGGCCACGACAGTAACGCGCCGGGCGGCGCTGGCGGCAGCGGTGGCGTCGGCGGTGACGGC
+GGCCGTGGCGGCCTGCTGGCCGGCAACGGCGGCACCGGCGGTGCCGGTGGCAACGGCGGTACCGGTGGCG
+CCGGTGCCCCCGGCGGTGCCGGCGGCGCCGGCGGCAAAGCCGACATCGCCAACAGCCTCGGCGACAATGC
+CACCGTAACCGGGGGCAATGGCGGGACAGGCGGAGACGGCGGCAGCGCGCTGGGCACCGGGGGGGCTGGG
+GGTGCCGGAGGTCTAGGTGGTCACGGGGGTGCAGGCGGGCTGCTGATTGGCAACGGCGGCGCCGGTGGCG
+CTGGCGGCCTCGGCGGTGCGGGCGGCGCCGGCGGTGCGGGCGGTGAGGGCGGTGCCGGCGGCGCCGGAGG
+CGAAGCTATTCCCGGCGGGGCGTCCACCAACTCCGCCGGCGGTGACGGAGGGGCGGGCGGTACTGGCGGC
+AATGGCGGTGACGGCGGTGCCGGCGGAGCCCCCGGCCTCGGTGGCGCGGGCGGGGCCGGCGGATGGTTGA
+TCGGCCAGTCGGGCAGCACCGGCGGCGGTGGCGCCGGCGGTGCCGGTGGTGCCGGAGGTGCCGGTGGCGC
+GGGCGGCAGCGGCGGTGCGGGTGGCCATGGCGACACTACCTCCGGCAAGAACGGTTCGTCTGGCACCGCG
+GGCTTCGACGGCAACCCCGGGCAGCCCGGCTGAGCGGCACAAGATCTGAACGCGCTCTAAGCTGACCCCG
+TGACTGGCTGGGTGCCCGATGTGCTGCCCGGCTATTGGCAGTGCACAATTCCGCTCGGGCCGGATCCCGA
+CGACGAGGGCGACATTGTCGCAACCCTGGTCGGCCGCGGTCCGCAAACAGGGAAAGCCCGCGGAGACACC
+ACTGGGGCACACCACACGGTCCTGGCGGTGCACGGCTACACCGACTACTTCTTCCATACCGAGCTGGCCG
+ATCACTTCGCCAACCGTGGCTTCGCGTTCTATGCACTTGACCTGCGCAAATGCGGCCGATCGCGAGCGCC
+CGGCCAGACGCCGCACTTCATCACCGACCTGGCCCGCTATGACACCGAACTCGAGCACTCCCTGTCCATC
+ATCAACGAGCAGAACCGCTCGGCGAAGGTCCTGGTATACGGCCACTCCGCCGGCGGGCTCATCGTGTCGC
+TGTGGCTGGACCGGTTGCGCCAGCGCGGCGAGATCACCCGCGCGGGGGTCACCGGCCTGGTGCTCAATAG
+CCCGTTCCTGGATCTGCAAGGCCCGGCAATCCTGCGCCTGCCGCTGACCTCGGCGTTCTTCGCCGCGATG
+GCGCGAATGCGCCCCAAGTGGGTAGCCCGGCCACCAAAAGAAGGCGGTTACGGTTGCACGCTGCACCGGG
+ACTATGATGGAGAGTTCGACTACAACCTGCAATGGAAACCGGTGGGCGGTTTCCCGGTCACCTTCGGCTG
+GATTCATGCCAGCCGTCGTGGCCACGCACGGTTACATCGCGGGATCGACGTCGGTGTGCCCAACCTGATC
+CTGTGTTCGGATCACACGGTACGGGAAAAGGCCGACCCGGCGACCCTGCACCGCGGCGATGCGGTTCTCG
+ACGTCACCCATATCACCCGCTGGGCCGGCTGCATCGGCAACCGCAGCACCGTCATCGCGGTGGCGGACGC
+CAAACACGATGTGTTCTTGTCGCTGCCGCAACCGCGCCAGATGGCTTATCGCCGACTGGATCTCTGGTTG
+GACGACTACCTCGGCACACACAACGACACCGACGCTTCGGCATCGTCGGGGAAAGGGTGATGGCCCCTAC
+AAATGGAAACGTACGACATCGCGATCATCGGAACCGGTTCGGGCAACAGCATTCTCGACGAACGCTATGC
+CAGCAAGCGGGCGGCGATCTGCGAGCAGGGCACCTTCGGCGGCACCTGCCTCAATGTCGGGTGCATCCCC
+ACAAAAATGTTCGTCTACGCCGCCGAGGTGGCCAAGACCATCCGAGGCGCGTCGCGTTACGGTATCGACG
+CGCACATCGACCGGGTGCGATGGGACGACGTCGTCTCGCGCGTCTTCGGGCGCATCGATCCGATCGCGCT
+GAGCGGCGAGGACTATCGAAGGTGTGCGCCCAACATCGACGTGTACCGCACACACACCCGTTTCGGGCCG
+GTTCAGGCCGATGGCCGCTACCTGTTGCGCACTGACGCGGGTGAAGAGTTCACCGCCGAGCAGGTGGTGA
+TAGCCGCCGGATCGCGGCCGGTGATTCCGCCGGCCATCCTCGCGTCCGGCGTCGACTATCACACCAGCGA
+TACCGTCATGCGGATCGCCGAGTTGCCGGAGCACATCGTGATCGTCGGAAGCGGCTTCATTGCAGCGGAA
+TTCGCACATGTGTTTTCCGCTCTGGGCGTACGGGTCACCCTGGTGATCCGGGGCAGCTGCTTACTACGGC
+ATTGTGACGACACCATCTGCGAACGGTTCACCCGCATCGCATCGACCAAATGGGAGCTGCGCACCCATCG
+CAACGTTGTGGACGGCCAGCAGCGCGGCTCGGGCGTCGCGCTGCGGCTAGACGATGGTTGCACCATCAAC
+GCCGACCTACTGTTGGTAGCGACAGGCCGGGTGTCCAACGCCGACCTGCTGGATGCCGAGCAGGCCGGTG
+TCGATGTCGAGGACGGCCGGGTGATAGTCGACGAGTACCAACGGACTTCGGCGCGTGGGGTTTTTGCGCT
+GGGCGATGTCTCGTCGCCGTACTTGCTCAAGCATGTCGCCAACCACGAGGCCCGCGTCGTGCAGCACAAT
+CTGCTCTGCGACTGGGAGGACACCCAGTCGATGATCGTCACCGACCACCGATACGTACCGGCTGCGGTAT
+TCACCGATCCTCAGATCGCTGCCGTCGGACTCACTGAAAACCAAGCTGTGGCAAAGGGACTCGATATTTC
+GGTCAAGATACAGGACTATGGTGACGTCGCGTACGGCTGGGCGATGGAGGACACCAGTGGAATCGTCAAG
+CTCATCACCGAGCGCGGCTCTGGGCGCTTACTGGGCGCACACATCATGGGTTACCAGGCATCCTCGCTCA
+TCCAACCGTTGATCCAGGCGATGAGCTTTGGGCTGACCGCCGCCGAAATGGCCCGCGGCCAGTACTGGAT
+TCATCCGGCGCTGCCGGAGGTGGTGGAAAACGCGCTGCTTGGCCTGCGTTGACCGCAACGGCGAGCCGTC
+GTCCGGCAAGCGATTTGCATCCCGTCAGCGCCTTACCTACAGTCGGGACATCGCGTTCTGCCCCGTGCTG
+GAAGGACCGACATGGCCAGCAGCCAGCTCGACAGGCAGAGGTCGCGGTCGGCCAAAATGAACCGCGCTCT
+GACAGCAGCAGAATGGTGGCGTCTGGGCCTGATGTTCGCGGTGATCGTCGCCTTGCATCTGGTTGGCTGG
+CTCACCGTGACGCTCTTGGTGGAGCCCGCGCGGCTCAGCTTGGGCGGCAAGGCATTCGGCATCGGCGTCG
+GGCTGACGGCGTACACGCTGGGCTTACGGCACGCGTTCGACGCCGACCACATCGCCGCCATCGACAACAC
+CACCCGCAAGCTGATGAGCGACGGACACCGACCCCTTGCCGTCGGGTTCTTCTTTTCACTGGGCCACTCC
+ACGGTGGTCTTCGGGCTGGCGGTAATGCTGGTGACCGGACTCAAGGCTATCGTCGGACCGGTCGAGAACG
+ACTCCTCGACGCTGCATCACTACACAGGCTTGATCGGTACCAGCATTTCCGGCGCGTTCCTGTATTTGAT
+CGGCATCCTCAACGTCATCGTCCTGGTCGGCATCGTGCGTGTCTTCGCCCACCTGCGCCGCGGCGACTAC
+GACGAAGCCGAACTCGAACAGCAGTTGGACAACCGCGGACTGCTCATCCGGTTCCTCGGCCGCTTCACCA
+AGTCACTCACCAAGTCCTGGCATATGTACCCGGTCGGATTTTTGTTCGGTCTCGGGTTCGACACCGCCAC
+CGAGATCGCGCTGTTGGTGCTGGCGGGAACCAGTGCCGCGGCCGGCCTGCCCTGGTATGCCATCCTGTGC
+CTGCCCGTCTTGTTCGCCGCCGGCATGTGTCTGCTGGACACCATCGACGGTTCGTTCATGAATTTCGCGT
+ACGGCTGGGCCTTCTCCAGCCCCGTGCGCAAGATCTACTACAACATCACCGTCACCGGACTGTCGGTGGC
+AGTCGCACTGTTGATTGGCAGCGTTGAGCTGCTGGGCCTGATCGCCAACCAGTTGGGTTGGCAGGGCCCG
+TTCTGGGACTGGCTTGGCGGCCTCGACCTCAACACCGTCGGCTTCGTCGTCGTCGCGATGTTCGCGCTCA
+CCTGGGCCATTGCCCTGCTGGTCTGGCACTACGGCCGCGTTGAAGAGCGGTGGACCCCGGCGCCCGACCG
+CACAACTTGACCTCGGGCGATCAACCCTAGGGCGGTGCCGCCGGAATCGAGACGGTAGCCAAGCGAGCGG
+TCGACGTGTTGGAAAAGATCTTCGCCGAGAACGATGTCCGCGCGAACGTCAACCGGGCGGCGTTTGAGAA
+CAACGGGATCCGCGCGCTGGACCTGATGAGCTCACCGGGGTCGGGGAAGACGACCGTGCTGGGCGCCGCG
+CTCGACGAGCACGCCGACCAATTCGCAATCGGCGTTATCGAAGGCGACATCACCACCGACCTGGACGCGG
+CCAATGGCCGCGGCACCCAGGTGTCGCTGCTGAACAACCAGCATGGCTTTTGCGCCGAATGCCACCTCGA
+CGCACCTATGGTCAACCGCGCCCTAGCTGGTGCGCCCGACGGAGTTCGACGTCGGTAAGCGCCAAGGCGA
+TGGTCTCCTCGGTCACCGAGGGCAAGGACAAGCCGCTGATGTACCCGGCGACGTTCCGCTCGAGGGATGT
+AGTGCTGCTCGACAAGATCGACTTGGTGCCCTTTCTGGACGCCGACGTGGACGCGTATATCGCGCATGTC
+CGCGAGGTCAACGCAGCCGCGACGATCCTGCCGACCAGCACGCGCACCGGAGCCGGCATGGGGTCCTGGT
+CATGAGCCGCCGGAAACGGCTCGTCTCATCGGCTTTCACGGTGAGGCCACCGCAGCCGAAATGGACAACG
+TTGATCGTCTTCCGGGCCTGACAGCAATCCGACTGTGAAATGCACTACGCGACACGCTAACCCGTTGCGC
+AGTTCACACTCGGGGCGCGATCACAGCGGAGTGACATAGGCCGAGCTGATCCCACCGTCGACCAGGAACG
+TCGAAGCGGTGATGAATGATGCGTCGTCGCTGGCTAAAAACGCTACCGCAGCAGCAATTTCGTCGGGCTC
+GGCGAACCGGCCCAGCGGCACATGCACCATGCGGCGAGCGGCCCGTTCCGGGTTCTTGGCGAAAAGCTCT
+TGCAGCAGTGGGGTGTTCACCGGCCCCGGGCACAACGCGTTGACCCGGATGCCCTGCCGAGCGAATTGCA
+CGCCCAGTTCCCGTGACATAGCCAGCACTCCACCCTTGGAGGCGGTGTAGGAGATCTGCGACGTTGCCGA
+ACCCATCACCGCAACGAAGGACGCCGTGTTGACGATGGAGCCTTTCCCAGCAAGCACCATGTGGCGCAGG
+GCCGCCCGGCAGCACAAGTACACCGACTTCAGGTTGACGTCTTGTACCCGTTGCCACGCCGCGAGCTCGG
+TGTTTTCGATCAGATTGTCCTCGGGTGGTGAGATGCCGGCGTTGTTGAACGCAATATCTATGCGGCCGTA
+GGTTTCGGCTGCTCCGTCGAACAGCCCGTTGACGGCGTCCTCATCGCAAACGTCGGTTGGCACAAACAAG
+CCTGATAGTTCGTCAGCGGCCGCACCACCGGCCTCGACGTCGACGTCGCCGACCACGATCGTGGCGCCTT
+CCGCCCGCATCCGACGGCCGGCAGCCAGGCCAATACCGCTGCCACCGCCTGTGATCACCGCCACCCGGCC
+GGCCAGCCGTTGGCTGAGGTCCATCACATCTCCTCCCCGACGGCGATGAACACATTTTTGGTTTCGGTGA
+ACTGCAGCGGAGCGTCCGGCCCTAGCTCGCGGCCCACACCGGACTGCTTGAAACCGCCAAACGGGGTGTT
+GAAGCGCACCGACGAGTGCGAGTTTACCGACAGGTTGCCGGATTCGACCGCCCGCGCCACCCGCAGCGCG
+CGGGACAGGTCATCGGTCCAGATCGATCCGGACAGCCCGTACGCGGTGTCGTTGGCCAGGCTGATAGCGT
+CGGCCTCGTCGTCGAACGTCAGCACTACAACCACCGGCCCGAAGATTTCGTCGGTGACGGTGCGGTCGCC
+GCGTTTGGGTGTGAGAACGGTTGGTGGAAACCAAAATCCGCGCCCAGCCGGAGCCGTACCCCGAAACGCC
+ACCGGAGCGTCGTCGGGCACATAACCGGCGACCTTGTCACGGTGTGCGCGCGATACCAGCGGACCCATCT
+CGGTGGCGCGTGATCCGGGGTCCCCGACGACAATGCTGTGTACCGCCGGCTCGAGCAGCTCCATAAACCG
+GTCGTAAACGCTGCGCTGCACCAGGATTCGACTTCGGGCACAGCAATCCTGCCCAGCGTTGTCGAAGACC
+CCGGCCGGCGCGGTCGTCGCGGCGCGCTCCAGGTCGCAGTCGTGGAAGACGATGTTGGCGCTCTTGCCAC
+CCAGTTCCAACGTCACTCGTTTGACTTGAGCCGCGGCACCGGCCATGACCCGCTTGCCGACTTCGGTGGA
+CCCGGTGAACACGATCTTGCGAATGTCGGGGTGGGTGACGAACCGCTCCCCGACCACCGTGCCCTTTCCC
+GGCAACACCTGCAGCAGGTCTTCGTCCAGACCCGCCTCGACGGCCAGCTCACCGAGCCGCATCGTGGTCA
+GCGGCGTCAGTTCGGCGGGTTTGACCAGCACCGCGTTGCCGGCGGCCAGCGCCGGCGCGATGGCCCAGGA
+CGCGATCACCATCGGGAAATTCCATGGCGTGATCACACCGACCACGCCCATCGGTTCGTTGAAAGTGACG
+TCCACCCCGCCGGCAACGGGAATCTGCCTGCCGGACAACCGTTCCGGGCTGGCGGCATAGAACGCCAACA
+CGTCACGCACGTGGCCGGCTTCCCACTCGGCCGACACGATGGGATGTCCGGAATTGGCTACCTCGAGCGC
+GGCCAGTTCGTCGAGGTGGGCTTGCACGGCTGCCGCGAATGCGCGCAGGCCGGCCGCCCGCTGCGCCGGT
+GCCAACCGTGCCCAGCGCCGCTGCGCTGCTCGCGCGCGTTGCACGGCGTCGTCCACCGCGTTGGCGTCGG
+TGTGGTCAACTGAGGCCAGCACTTCCTCGGTGGCGGGATTGATCAGTTGCGTGGTACTCATCGTGGCTCC
+GCTTGGCTCTGCCGGCCCGCGTATCCGCTGGCGGCGTCCACCAACGCCTTAAACAGCCGCAGATCGTCCA
+ACGACTTCTCCGGATGCCACTGCACCGCTAGTACGAACGTGTCCCCAGGTAGCTCCAGCGCCTCGATTAC
+CCCGTCGACATCCACCGCACTGACCACCAGGCCCTCACCGACCTGGTCGATGGCTTGGTGGTGGTAGCAC
+GGCACGTCGGCGGATTCGCCGATCAGCTCGGCCAACCGGGTGCCCGATGCGGTGTGGACCGGCAACCTGG
+TGAAGACCCCGTTGCCCGCCCGATGCCCGCTATGGCCAAGGATGTCGGGCAGGTGCTGGTGCAGCGTGCC
+GCCGAGCGCGACGTTGAGCACCTGGGTGCCGCGACAGATGCCCAACACGGGCATCCCCCGCTGAAGCGCG
+CCCCGCAATAGCGCGAACTCCCAAGCGTCGCGGCCCGGGCGAGGGTGATCGGTGGCCGGATGCGGCTCCT
+GGCCATAAGCTGCCGGGTCCAGGTCGTAGCCCCCGGTGATCACCAGAGCGTGCAGGCTGTCCAGCACGCA
+GCCGACGCTCTCGGGGTCGACCGGCTGCGGCGGCAGCAGTACCGCAACACCCCCGGCCATGGTGATGCCT
+TCGAAGTAATCGGCGGGCAGATAACCCGCAGGAATATCCCAAACCCCGGTGCGCACCTGCTCCAGATAAG
+CCGTCAGGCCAACCACCGGGCGACTCGCGCCCAGTGGCGATCGCAAGCGCGGCGAAGCCGGGCGCAGCGG
+GTCGCCACCATCGGACACAGGCGATCGCAAGCGCGGCGAAGCCGGGCGCAGCGGGTCGCCACCATCGGAC
+ACAGGCGATCGCAAGCGCGGCGAAGCCGGGCGCAGCGGGTCGCCACCATCGGACCTAGAGGCGCTCAAAT
+CCACGTATCCTCTCCCAATCGGTGACCGCCGCGTTGAACGCCGCCAGCTCCACACGCGCGTTGTTCAGGT
+AGTGCGCGACAACATCCTCGCCGAACGCCTCGCGCACCAGCGCAGAATCCTCGAACAGCACCGCGGCGTC
+GGCCAGCGTAACCGGCAGCCGTTCGACATCGGCGCCTTGGTAGGCGTTGCCGACACAGGGCTCGGGCAGC
+TGAAGGCCCCGCTCGATACCGTACAACCCTCCAGCAATGAGAGCCGCCACCGCCAGGTACTGGTTGACAT
+CACCGCCGGGAACCCGGCATTCGACCCGGATGTTTTGCCCGTGGCCAACCACCCGCAGGGCGCAGGTGCG
+ATTGTCCAGCCCCCAAGCCAGCGCCGTCGGCGCGAAACTGCTATCGGCAAATCGCTTGTAGGAGTTAATG
+GTCGGCGCATAGCACAGCGTGAATTCGCGCAACGTGGCCAACTGGCCGGCGACGAAGCTGCGGAACATCG
+ACGACATGCCGTGCGGCCCGTTACTGTCGGCAAACACCGCGGAGCCATCCGTGCCACGCAGCGAGACATG
+GATGTGACAGCTATTACCTTCGCGTTCATCGTATTTCGCCATGAACGTTAGGCTCTTGCCGTGCTGGTCG
+GCGATTTCCTTGGCGCCGTTCTTGTAGATCGCATGGTTGTCGCAGGTGACCAGCGCCTCGTCGTAACGAA
+ACCCGATCTCCTGCTGGCCCATGTTGCATTCGCCTTTGACCGCCTCGAATCGCAGACCCGCACCGGCCAT
+ACCCAACCGGATGTCGCGCAGCAACGGCTCCATCCGCGAGGATGCCAATATCGCGTAGTCGATGTTGTAG
+TCGCTGGCCGGGGTCAGCCCGCGATACCCGCTGGCCCATGCCTGGCGATACGGCTGGTCGAACACGATGA
+ACTCCAGCTCGGTGGCCACATCGGCGACCAGTCCGCGCGCCTTGAGCCGATCGAGCTGACGGCGCAGAAT
+GCTGCGCGGCGAGACGGCGACCTCGCTGCCGTCGGCCCAGACCAGGTCGGCGATCACCAGCGCCGTTCCC
+GGTAGCCAAGGAATCAGCCGCAGAGTGGACAAGTCCGGCGTCATCACCATATCGCCGTAGCCGGTGTCCC
+AACTGGCCATCGCATAGCCGGGCACCGTGTTCAGGTCGACGTCCACGGCCAGCAGATAACTGCAGCACTC
+GACGCCGCGGGTGGCTATGTCGTCGACGAAATGCCGGCCCGATATCCGTTTGCCGGCCAGCCGGCCCTGC
+ATGTCGGTGAACGCGACGATGACGGTGTCGACGTCACCGGCCGCGACCAGTCGCTCCAACTCGGTCCACG
+CCAACGGCGGCGAACCGGGGCCGGTCACCGCACTTCCTCCCACACCATGGCCGCTAGTCAACCATCTATA
+GGCTCCGGGCCCACATGCTGGCTGTCGCGGGCACCGCGAACCGCCGGAGCCGGCGAGTAGACGCGAAAGA
+ACATGATGGGCGCTGGTGCCCATCATGTTCTTTTGCGCCTACTCGCGCTACAGACAGGTCAGGATCTCGA
+CGCCGGTATCGGTAACCAGCAGGGTGTGTTCGAACTGTGCGGTCCACTTGCGGTCCTTGGTGACCACCGT
+CCAACCGTCGTCCCAGATTTCGTAGTCCAGTGCGCCCAAGTTGATCATCGGCTCGATGGTGAAGGTCATC
+CCCGGCTGCATGATGGTCTCGACAGCGGGCTGGTCGTAGTGCAAGACGACCAGCCCGTTGTGGAACGTCG
+TGCCGATGCCATGACCAGTGAAGTCTCGAACCACGTTGTACCCGAACCGATTTGCATACGACTCGATGAC
+ACGACCGATAACGGACAACGCCCGCCCGGGCTTGACGGTGTTGATCGCACGCATGGTCGCTTCGCGGGTC
+CGGTCAACGAGCAACCGGTGTTCGTCTGCGACATCGCCGGCCGGAAACGTCGCGTTGGTGTCACCGTGCA
+CCCCACCGATGTAGGCGGTGACGTCGATGTTGACGATGTCGCCGTCGGTGATCACCGTCGAGTCGGGGAT
+TCCATGGCAGATGACCTCGTTGAGGGACGTGCAGCACGACTTCGGGAATCCCTTGTAGCCCAGCGTTGAT
+GGGTAGGCGCCGTTGTCGACCAGGTATTCGTGCGCGATCCGGTCGAGTTCGTCGGTGGTTACCCCGGGCG
+CGACCGCCTTGCCCGCCTCGGCCAACGCACCTGCGGCGATCCGGCCTGCCACGCGCATCTTCTCGATGAC
+CTCAGGTGTCTGCACCCACGGCTCGCTGCCCTCTTGGGCGGCCGGTTTGCCGACGTATTCGGGGCGCGCG
+ATCCAGTTGGGCACCGGCCGTGTCGGGGACAGCACGCCGGGGGAGAGCGCGGTACGACTAGGCATCCCGC
+TAGCTTAGCCGGGCAAATTTTGGCCGCGCCCGGCTATCAGCCCCGGTGTCGGCGCAGCAGTGCGCGCCGC
+GGTCCCTTGATGACCACCGACCCGCACACCATCCGACCGGTCAACACGACATGCGGTGTTCCTTCCGCCG
+GTGCGTCCTTGCGGCGGTCGCTCGCGCTACCCACATAGACCTCGACGTCGTCGATCGACGCACTGGCGCC
+GTTGGGCAGCCGGACCTCAAGTGAGCCGAACATCATATCGAGTTCGATCACCACCACCGGCCCCGCGAAA
+CGGGCCTTGACGAGGTCGAGTTCGATTGACCCCAGCCGACGCACCAGCGCCAGCCGGGTGGGCACGATCC
+ATTCGCCGTGGCGTTTCAGGGAGCCGGCCCAGCCGCGCAGCTCCACCCGGTCGGCCGCGGACGTGACGAT
+CGCGCCAGGCCTGGGCAGGTCACCGACCAGCCCATCCAGCTCGCTTCGCGTACGCGCGAAGGAAACCCGT
+GACGAGCGCTGCTCGAACTCGTCGATGTTGATAAGCCCGAGCGCCACGGCGTTGTGCAGTCGTCGCATTG
+TGCCGTTGGGGTCGGCGTCCGAGACCCGCAACGCCACCATGTCCCCACCGGTCTCCGTCATGGCCCATTC
+CCGAGAGTTCTGGCACGGCTTCAACGGCGAACTTCGCCTACCCCCCGCAACTTACCGCTGTTGAAAGGCC
+GCCGAAAACCTAGCAGTTTAGGTAATCCTTTCCGACGAAGAGCGGGAGGCGTTCCGGCAGCAAGCCGCAG
+CCCAGCAGATGTCCCTCAGTAACTGGCTGCGTCAAGCGGGGCTCAGGCAGCTCGAGGCACAGCGACAACG
+TCCCCTGCGCACCGCCCAGGAATTGCGCGAGTTCTTTGCGTCACGGCCCGACGAGACAGGGGCAGAACCT
+GATTGGCAGGCGCATCTGCAGGTGATGGCTGAATCGCGCCGTCGCGGCCTGCCGGCGCCATGATCTTCGT
+CGATACCAACGTCTTCATGTATGCGGTCGGTCGCGATCACCCATTGCGGATGCCCGCCCGTGAGTTCCTC
+GAGCACAGCCTCGAACACCAAGACCGCCTTGTCACGTCAGCCGAGGCCATGCAGGAATTGCTGAACGCGT
+ATGTGCCCGTCGGGCGGAACTCGACGCTGGACTCAGCATTGACCTTGGTGCGGGCGCTGACGGAAATCTG
+GCCCGTCGAGGCGGCCGACGTCGCGCATGCGCGAACCCTGCACCACCGCCACCCCGGTCTGGGCGCGCGC
+GATCTGCTACACCTGGCATGCTGCCAGCGTCGCGGTGTCACGCGGATCAAGACGTTCGACCACACACTGG
+CCAGCGCATTCCGATCATGACGCGTCCGTGTGGGCGCGAGCGTCCGCAGTTGTACGGCCCTAACGGCGTG
+TCGTCGTACAAACGAGGAGGGGCGAGCCGCGCTACGCCAGGTACCCCGGCGGCAGCGATTCGAACATCAC
+CTTGGTCATCCGCACCGCGTATTCCGAGCTACCGCCCCCGACGATCAGCGACGCAAATGCCAGATCGCCA
+CGGTACCCGGCGAACCAGGAATGCGATCCGCCCGGGAATTCGGCTTCGCCGGTCTTACCGAACACCTCGC
+CACAGCCAGCGATCTCCTTGGCGGTGCCATTGGTCACCACCAACCGCATCATGGGCCGCAGCGCGTCGAT
+CATCTTCTGGCTGATCGGTGTGGCATCGCCTTCGACGGCCGTCGGCCGGCCGGCGATCAGCTGTGGAACC
+GGGGTCTTCCCGGCGGCTACCGTCGCCGCCACCAAGGCCATGCCGAACGGGCTGGCCAGCACCTTGCCCT
+GGCCGAAACCGTCCTCGGTGCGTTCGGCCAGGTCCACCGTCGGCGGCACCGAACCGGTCACCGTGGTGAT
+GCCGTCCACCTGGTAGTCAAGCCCGATCCCGTACCGCCGGGCCGCCTGAGTCAGACCGCGGGGAGGCAGC
+CTGCTGCTCAGCTCGGCGAAGGTGGTGTTGCAGGAACTGGCAAACGCGCGTGACATCGGCACCACGCCCA
+GATCAAAGCCACCGTAGTTGGGAATGGTGCGATGCCCGATGTCGATCTCCCCGGGGCAACCCAGCAGCGT
+CTCAGGGGTAGCCAGGTCACGCTCGACGGCCGCACCGGCGGTGATCATCTTGAATGTCGACCCGGGTGGA
+TATAGACCGGTGGTCGCGACCGGACCGTCCGCATCGGCCCCGGCGTTCTGCGCGATCGCCAGGATCTCGC
+CGGTCGACGGCTTGATCACGACGATCATCGCCTTGCCGCCCCGGGTGTTCACCGCGTGTTGCGCGGCGTT
+TTGCACGACCCGATCCAACGTGATCGAAACCGACGACGCAGGTGATGGGGCGACCTCGTGCAGCACCGAG
+ACGTCGACGCCATTTTGGTTGACGCTCACCACCCGCCAACCCGCCTTGCCGTCGAGTTCATCGACGACGG
+CCTTCTTGACATCGTTGAGGACCGCCGGCGCGAAGTGCTTGTCGGTCGGGAGCAGCTCGGCCTGCGGTGT
+AATCACCACGCCAGGCAGCTGCCCGATCGCCGCGGCCACCCGGTTGCTGTCGTCGGCGTGCAACGTGACC
+AGGTCCAACGGCTGGGTCGACGAGCTGGCCTGTTCGGCCAGCAGCTGCGGATCATTGAGCGTGTCGTCGA
+AGGGGTGCAGCGCGCCCACCACCGCGTGTGCCGTGCCGAAGAGCTCGCGGCCGGCCTGGCCGGCGTCCAG
+CGAGTAGTGATACAGATAGCCCGGCACCAGCACATCGGTGCCGCCGACTTCGTTCACCGAGGCGCGCCGC
+GGCGGGTCGGCTCGTAGCGCGAACGTTTGATGTTCGCCTAGCTTGGGATGCAACCCGCTGGTGGTCCAGC
+GAACGTGCCAACGCCCTTCGTCGCGGGCCATCTTCAGCTGGCCGTCATAGGTCCAGATTCGGTCCTTGGG
+CAGATGCCAGCTGAAGCGATAAGCGACCGTACCGGTGTCCTCGGCGTACTTGGCGCTGAGAACCTGCGCA
+TCCAGGTGGGCGGCCTGCAGCCCCGCCCAGGCCGCGTTCAGCGCTTCGCGCGCCTCGTTGGGGTTGTCGC
+TGAGCTGGGCGGCGGAGGCGGTGTCACCGATGGCCAGCGCGGCGAAGAACTTTTCGGCCGCCGGACCGGG
+CCCTTGGGGACGCGGGGTGCAGCCCGACATGGCGACGACCGCAAGCAGCAGCAAACCTGAGGTGGCTGAG
+GCTAATGTTGTTTTAGTTACCATCGTTGCTGATGTTAAGAACTGTGACGGAGACACCGGCCGCGACACAC
+CGAGACCGAACCGTTACGCCGAGACTAGGTCGCGAATGGAACACCACCGCGAAAATCGTGGCCAGAAATC
+GCAACCACGTTACGCTCGCGACCGCTCAATCGAGCAAGGCGCCGACCGCAAGCACCAGCAAACCTGAGAC
+GCCGCGCACAAAGTGCGAAACCACTGGAAGGTGAGCCCTAATTTAGGGCTGAGCAGGACCTGTATAACGG
+CCTAGTATGGCGGTATGCGGATACTGCCGATTTCGACGATCAAGGGCAAGCTCAATGAGTTCGTCGACGC
+GGTCTCGTCGACACAGGACCAGATCACCATCACCAAGAACGGTGCACCCGCAGCCGTTCTGGTCGGCGCC
+GACGAGTGGGAATCGTTGCAGGAGACGCTGTACTGGCTGGCGCAACCCGGAATCAGGGAGTCGATCGCTG
+AAGCCGACGCCGACATTGCCTCCGGCCGCACCTACGGCGAAGACGAGATCCGCGCCGAATTCGGCGTCCC
+GCGACGCCCCCACTGAGCGGTGCCTTACACCGTGCGGTTCACCACAACCGCGCGTCGAGACCTCCACAAG
+CTGCCACCGCGAATCCTCGCGGCAGTGGTCGAATTCGCGTTCGGCGATCTGTCGCGCGAGCCCCTGCGGG
+TGGGCAAGCCCCTTCGGCGCGAGTTGGCCGGCACGTTCAGCGCGCGTCGCGGAACGTACCGCCTGCTGTA
+CCGGATTGACGACGAGCACACAACGGTAGTGATCCTGCGCGTCGATCACCGCGCGGACATCTACCGCCGA
+TAGCAACTCACCGACGGGCGCTCTGCCGTCCGACGGCAGCCATGACTGAGATCGGTCGGCCGGGCGGCTC
+CGAAAAGACCTGAACAGAACCTCAGGATTCCTATGCTCCCAATGTGGCGGCAATCACGAAGAAGCTAATC
+CTCGGCCAGATCCGGGAAGTGGCTGAGGCGAACGACGGCCGACCGCCCGGCTGTGAGCGCTTTGCCGCCG
+AGACCGGAATTCCAGCAAGCGCGTGGCGTGGACGGTATTGCTAACCCATTCTTTCAAGACCGACGATCCT
+GTTGGCATCGAGAGGTACTGGCAGCGCCGACACTTGCCAGACCGCATCGCCGTGCACAGGACGTCGTCAG
+CGCTGATATGCCCGCAGCTCGGCGCTCAGTCCAGCAACACCGTCGCGAACGTGCCGATCTCCTTAAAGCC
+CACCCGGGCGTAGGCGGCACGGGCCACCGTGTTGAAGCTGTTCACATACAGGCTGGCGATGCGCCCGCTG
+CCGACGATCACTGCGGCCAACGTTGCGGTACCAGCCGTGCCCAGACCGATACCGCGCCACTCCGGATGAA
+CCCAGACCCCCTGGATCTGCCCGACGGCCGGAGATTGCGATCCCACTTCGGCCTTGAAGATCACTTGACC
+GTGCTCGAATCGGGCCCACGCGCGTCCGGCCGCGATGAGGCCGGCCACCCGGCGACGATAGCCGCGACCA
+CCGTCTCCGAGCCGAGGGTCGACGCCGACTTCGCCGATGAACATGTCGACGGCGGCCACCAGGTAGGAGT
+CCAGTTCCTCGGGCCGTACCTGGCGTACGCCGGTGTCGATAGCGCAGCTGGGGTGAGTAGCCAGGGCCAT
+CAGCGGTTGGTTGTCGCGGACATCCCGCGCCGGACCCCACACCGGCTCGAGCCGCTGCCACATCGGCAAC
+ACCAGGTCGGCCCTGCCGACCAGTGACGAACACCGTCGCGGCGTGCTCATCGCCACGTCGGCGAACGCAT
+TCAGGTCGATCGGTCCGCCGCGCAGCGGGATGAGGTTGGCACCGGCGAAACACAGGGATTCGTGCGCGCC
+GCGTCGGGTCCACAGCTCCCCGCCAATCGCATTGGGATCGATGCCATGGTCTGCGACCCGGGCGGCGACC
+ATGCACGATTCGATCGGGTCGTCGTCGAGTACCCGCCACACGGCGGCGGCGTCACGCACCACGGACACTT
+GCCGCTCGCCGACAAGCCGAGAGATGGGCGGAGCCGACATCTGCGAACTCCCTTTGGTGGGAACTGACGG
+CCACTGAATGAAAAGCTGACCCCTATCAGCTTACGGTCACAATAGGCGAACCGCTCGGTGTCGCGCCCGG
+AGCTTGCTCGCCCATTTCGGCGGCCAGCCGCATCGCCTCCTCGATCAGCGTCTCGACGATCTGTGCTTCG
+GGCACGGTCTTGATCACTTCGCCCCGTACAAAGATCTGACCTTTGCCGTTGCCGGACGCCACGCCCAGGT
+CGGCCTCACGTGCTTCACCCGGACCATTGACGACACACCCCATCACGGCCACCCGCAACGGCACATCGAG
+ACCATCCAGGCCGGCGGTTACCTCGTTGGCCAGGGTGTAGACGTCGACTTGCGCGCGACCGCACGACGGG
+CAAGACACGATCTCGAGCGAACGCGGCCGCAGGTTCAACGACTCGAGAACCTGATTGCCCACCTTGACTT
+CCTCGACCGGCGGGGCCGACAACGACACCCGGATGGTGTCGCCTATGCCCCGCGACAGCAACGCGCCGAA
+GGCAACCGCGGACTTGATGGTGCCCTGGAAAGCAGGGCCGGCCTCGGTGACACCGAGGTGCAGTGGGTAG
+TCGCACCGTGCAGCAAGCAGCTCGTAGGCGGCGACCATCACCACCGGGTCGTTGTGCTTGACGCTGATCT
+TGATGTCACCGAAGCCATGCTCCTCGAAAAGCGAAGCCTCCCACAGCGCCGACTCAACCAGCGCCTCGGG
+CGTGGCTTTGCCATACTTCTCCATGAACCGTTTGTCCAGCGAACCGGCGTTGACACCGATTCGGATCGGG
+ATCCCGGCCGCACCCGCCGCCTTGGCGACCTCACCCACCCGGCCGTCAAACTCCTTGATGTTGCCCGGGT
+TGACCCGCACCGCGGCACATCCAGCGTCGATGGCGGCGAATATGTAGCGCGGCTGGAAATGTATGTCCGC
+GACTACCGGGATCTGGCTGTGCCGGGCGATCTCGGCCAGCGCGTCGGCGTCCTCCTGGCGCGGGCAGGCC
+ACCCGCACGATGTCGCATCCGGCCGCGGTCAGCTCGGCGATTTGTTGCAATGTCGAGTTGACGTCGTGGG
+TTTTGGTGGTGCACATCGATTGCACCGAGACCGGATGGTCACTGCCCACGCCGACGTTGCCGACCATCAG
+CTGACGGGTGGCGCGCCGGGGAGCGAGCGTGGGTGCCGGGGGCTGCGGCATGCCCAAGCCTACAGTCACT
+GAAAATCCTTTCTACCTACTGGAAAAGCCTAATCGGGTTGACCAGGTCGGCGGTGACGGTCAAGAGCATG
+TACCCGACGACAAGAACCAAGACCACATAGGTCGCCGGCAAGAGTTTGAGGTAATTCACCGGTGCGGCCG
+CCACCTTGCCACGAGCCGACCGGACCATGTTGCGGATCCTCTCGAACACCGCGACGGCAATATGGCCGCC
+ATCGAACGGCAGCAACGGCAGCAGGTTGATCGCAGCCAGGATGAGGTTCAGCTGGGCCAAGAAGAACCAG
+AACGCCACCCACAGCCCATGGTCGACGGTGTCGCCGCCGATGATGCTGGCGCCCACCACACTTATCGGCG
+TCTGCGGGTCACGCTGCCCGCCGCCGATCGCCCGCACCAGCGCACCTACCTTGGTCGGGAGGGCGGCCAG
+CGCCTTGCCCACCTCCACGGTCAGGTCGCCGGTGAACGCGAATGTGGCCGGCATGGCGGAGAACACGCCG
+TAGCGCACAGGCCCGACCCGGGCGGCGCCCACCCCAATCGCACCGACCGTTGCCGGCTGGAGCTCACCGC
+CCTGCCCGTTAGGGATCCAGCGTTGGGTGGATTCGATGTCCACGTAGGTAACAATCGCGGTGCCGTCACG
+CTCGACAACGATCGGGACGCTGCCGTGTGACTTGCGCACCGCGGCGGCCATCTCGTCGAAACTGGACACC
+GGGGTGTCACCGACCTTGACCACGACGTCACCGGAGCGAATTCCGGCCAGCGCCGCCGGACCGGGCCCGG
+TGCACTGCTCGAGCTTGCCCTGGCTCACTTCCTGTGCAACGCAGCCAGTTTCGCCGATTACGGCCCTGGT
+TGGCGGATGCAGGTTAGGCAGCCCCCAGACCAGCGCGATGGCATAGATCAGCACCAGGCAGATAGCGAGG
+TTCATTCCGGGCCCGGCGAATAACACTGCGACCCGCTTCCAGGTGGCCTGCTTGTACATCGCACGGTCAC
+GTTCGTCGGGGTCGAGTTCCTCGACCGGGGTCATGCCGGCGATGTCACAGAAGCCGCCCAGCGGAACGGC
+TTTGACACCGTATTCGGTCTCGCCGCGCCGGGTCGACCACAACGTGGGGCCAAAGCCGACGAAATAGCGA
+CGTACCTTCATCCCGGTGCGGCGCGCGACCCACATGTGACCACATTCGTGCAGGGCCACCGAAATCAGGA
+TCGCGAGCGCGAACAGCACAATGCCGGTAACAAACATCATCGAGGTGTCAGGACCTTTCTAACGTCGATG
+CGTGTCGACCCGCTGCGCCCGGCTTCGCCGTGCTTGCGATCGCCACCGAAGCCATACCAGATACCGCGCG
+CTGCGCTCGCTCGCGGGCCCAGCGCTGCGCGTCGAGTACGTCATCCACGGTAGCGGGTTCGACGGCCCAT
+TGGTCGGCAGCGTGCAACACGTCGGCGATGATGCCGACGATGGCCGGGAAGCCGATCCGGCCAGCAAGGA
+ACGCCGCTGCTGCTTCTTCGTTCGCCGCATTGTAAACCGCGGTCATGCAGCCACCGGCTACGCCGGCCTG
+CCGGGCCAACTCGACCGCGGGGAAGACGTCGGTGTCCAACGGCTCGAACTCCCAGCTCGACGCGGTATGG
+AAATCACAGGCAGCAGCGGCGCCGCTGACCCGACGCGGCCAGCCCAGCGCTAACGAAATCGGTAGCTTCA
+TGTCCGGGGGACTGGCCTGGGCGATCGTCGAACCGTCGATGAAGGTGACCATCGAATGGATGATCGACTG
+GGGGTGCACCACGACATCGATGCGGTCGTAGGGGATGCCGAACAGCAGGTGGGTTTCGATGACCTCAAGT
+CCCTTGTTGACCAGCGACGCCGAATTCAGCGTGTTCATCGGGCCCATCGACCACGTAGGATGCGCGCCAG
+CCTGCTCGGGGGTGACATGCTCGAGGTCGGCCGCGGACCAGCCCCGAAACGGCCCTCCCGAGGCCGTCAG
+CACCAGCTTGGCGACCTCGTCGGGAGTGCCGCCGCGCAGGCACTGGGCCAGCGCGGAGTGTTCGGAGTCG
+ACCGGCACGATCTGACCGGGCCGCGCCGCCCGCAGCACCAGCGAACCACCGGCGACCAGCGATTCCTTGT
+TGGCCAGCGCCAGCCGGGCACCCGTCTTGAGCGCGGCCAACGTCGGTCGCAGGCCCAACGCGCCGACCAG
+CGCATTGAGGACGACGTCGGCCTCGGTCTGCTCGACCAGCCGGGTGGCGGCGTCGGATCCGTGGTAGGGG
+ATGTCGCCGACCCGCTGCGCCGCGTGCTCGTCAGCGACGGCAATATTGGTCACCCCGGTCTGCGCACGTT
+GTCGCAGCAACGTGTCCAGATGGGCGCCGCCAGCGGCCAGCCCGACTACCTCGAAACGGTCCGGATTGTC
+GGCGATGACCTGAAGCGCCTGGGTGCCGATCGAGCCGGTACTGCCCAGCACCACCACCCGCAACCGGCCG
+TCAGCGCGCCCGTCGGTCGAGTTGGTCACCTCATCATTGTGCGCCACCACCTCGTTGTCACCGCGCCGCC
+GGATCACGACGCGTCCACCGGTAGCCACACTTCCCCGTGGAATGCAATCGTCTTGATGCCTGCGCTTGAT
+GCTAAGATGCCATGCGTGCGCACGACGATCCGTATCGATGACGAGCTGTACCGCGAGGTGAAAGCAAAGG
+CCGCTCGTTCCGGGCGTACCGTGGCCGCGGTTCTTGAAGATGCGGTGCGGCGTGGTCTCAACCCGCCTAA
+GCCGCAGGCCGCCGGCCGTTATCGAGTCCAGCCGTCGGGTAAGGGCGGCCTGCGGCCCGGTGTCGATCTA
+TCGTCCAACGCCGCACTTGCCGAAGCGATGAACGACGGCGTGTCGGTCGATGCTGTGCGTTGATGTCAAC
+GTGCTCGTTTACGCGCATCGGGCAGACCTACGGGAGCACGCGGACTATCGGGGTTTGCTTGAGCGGCTGG
+CCAACGATGACGAGCCGCTGGGTCTACCAGATAGCGTGCTCGCCGGCTTCATCCGGGTGGTTACCAACCG
+CCGCGTCTTCACCGAGCCGACGAGCCCACAGGACGCATGGCAGGCAGTCGACGCCCTACTCGCGGCACCC
+GCAGCCATGCGACTTCGGCCTGGCGAGCGCCACTGGATGGCCTTTCGGCAGTTAGCGTCCGATGTTGATG
+CGAACGGCAACGACATTGCGGACGCGCACCTGGCCGCCTACGCGCTAGAGAACAACGCAACCTGGTTGAG
+CGCCGACCGCGGCTTTGCCCGTTTCCGTCGACTGCGCTGGCGTCATCCGTTGGACGGTCAGACCCATCTA
+TAACCGGCCCCACTCCGAATCACTGGTGTCCACCCAGGAGGACGGCGTTCAACGCCGCCGCAGAAGCAAA
+GGAATCGAAGCGATGATCAACGTTCAGGCCAAACCGGCCGCAGCAGCGAGCCTCGCAGCCATCGCGATTG
+CGTTCTTAGCGGGTTGTTCGAGCACCAAACCCGTGTCGCAAGACACCAGCCCGAAACCGGCGACCAGCCC
+GGCGGCGCCCGTTACCACGGCGGCAATGGCTGACCCCGCAGCGGACCTGATTGGTCGTGGGTGCGCGCAA
+TACGCGGCGCAAAATCCCACCGGTCCCGGATCGGTGGCCGGAATGGCGCAAGACCCGGTCGCTACCGCGG
+CTTCCAACAACCCGATGCTCAGTACCCTGACCTCGGCTCTGTCGGGCAAGCTGAACCCGGATGTGAATCT
+GGTCGACACCCTCAACGGCGGCGAGTACACCGTTTTCGCCCCCACCAACGCCGCATTCGACAAGCTGCCG
+GCGGCCACTATCGATCAACTCAAGACTGACGCCAAGCTGCTCAGCAGCATCCTGACCTACCACGTGATAG
+CCGGCCAGGCGAGTCCGAGCAGGATCGACGGCACCCATCAGACCCTGCAAGGTGCCGACCTGACGGTGAT
+AGGCGCCCGCGACGACCTCATGGTCAACAACGCCGGTTTGGTATGTGGCGGAGTTCACACCGCCAACGCG
+ACGGTGTACATGATCGATACGGTGCTGATGCCCCCGGCACAGTAACGTTCGGCGCGGTCAAGGCGAGGCA
+GCCCGTGTAGGCGGTTTGCCTCGCTCATCCGGCGGCTTCGTGCCGATAGATCACGTGATATCCCAAGCGC
+ATGACGGTGACACCGCGCCCAGCGCAAGCCGATCCCCGCAGCATGCCTGCTGAAGTCGCGTCTCGCGAAC
+TGCGCAACAACACCGCCGGGCTGCTACTGCGCGTGCAGGCCGGCGAAGACATCACCATCACTGCCAACGG
+CAAACCCGTTGCGCTGCTGACCGCAGGCAGCCCGCACGGCGCCGATGGTTGAGTCGAGACGAGCTGCTGC
+GGCGGCTTCGGCATACGCAAGCAGATGCGGGATTGCACCCGCGACCTCGCAACGCTCACTGGCGACACCA
+CCGACGATCTCGGTCCCGTCCGGTGAGGGCCGCTGCCGTTGCCACGTCGCAAGGGGTGCCGGTCGTGACC
+CACGACGGCGACTTCGACGCCGTCGATGGTGTGGCCGATGTGGCTATCATTCGCATCTGACGGGTGGCGA
+GTTCGACGTGAACCGACTCTGTCAACAGCGCTCGCGTGAGCGGTCCTGCCAACTCGTTGCCGTCCCGGCA
+GATCCAAGACCTAAACGGCAACGAATAACCGATGTGTTGACCCTCGCACTAGTCGGCTTCCTCGGCGGCC
+TCATCACCGGAATATCACCATGCATTCTGCCGGTCCTGCCAGTAATCTTCTTCTCCGGCGCGCAGAGCGT
+CGATGCAGCGCAGGTGGCGAAACCCGAAGGCGCCGTAGCAGTCCGGCGCAAACGTGCGCTATCAGCGACA
+TTGCGGCCCTACCGGGTGATCGGTGGTCTGGTGCTCAGTTTCGGCATGGTCACCCTGCTCGGCTCGGCAT
+TGCTGTCAGTGCTGCATCTACCGCAGGACGCCATCCGCTGGGCCGCACTGGTCGCCTTGGTGGCAATCGG
+CGCCGGCCTCATTTTCCCGCGGTTTGAACAACTTCTGGAAAAACCGTTCTCCCGTATTCCGCAGAAGCAA
+ATCGTCACTCGCAGCAACGGTTTCGGGCTGGGTCTAGCCCTGGGCGTGTTGTATGTCCCCTGCGCCGGCC
+CGATTCTAGCTGCGATCGTCGTGGCCGGGGCTACTGCCACCATCGGGTTGGGAACCGTCGTGCTCACCGC
+GACATTCGCACTCGGAGCCGCGTTGCCGTTGTTGTTCTTCGCCCTCGCCGGCCAACGGATAGCTGAGCGG
+GTGGGCGCTTTTCGGCGCCGCCAGCGTGAGATCAGGATCGCCACCGGTTCCGTGACGATCCTGCTGGCGG
+TGGCGTTGGTGTTCGATCTGCCGGCCGCGCTGCAGCGGGCTATTCCTGACTACACCGCATCGCTGCAGCA
+GCAGATCAGCACCGGCACGGAGATACGGGAACAACTGAACCTTGGCGGCATCGTCAACGCCCAGAACGCA
+CAGCTGTCGAATTGCAGCGACGGGGCCGCACAACTCGAAAGCTGCGGCACTGCACCAGATCTCAAAGGCA
+TCACCGGCTGGCTCAACACGCCCGGCAACAAGCCGATCGACCTGAAATCATTGCGTGGCAAGGTGGTGCT
+GATTGACTTTTGGGCCTACTCCTGCATTAACTGCCAACGGGCCATCCCCCACGTCGTCGGTTGGTATCAG
+GCCTACAAAGACAGTGGTTTGGCGGTCATCGGCGTGCACACCCCCGAGTACGCTTTCGAGAAGGTCCCGG
+GCAACGTCGCCAAAGGCGCGGCCAATCTGGGCATCAGCTATCCGATTGCGCTCGACAACAACTACGCCAC
+TTGGACCAACTACCGGAATCGCTATTGGCCCGCCGAGTATCTGATCGACGCTACCGGGACGGTGCGGCAC
+ATCAAGTTCGGAGAAGGCGATTACAACGTCACCGAGACGTTGGTCAGGCAGTTGCTCAACGATGCCAAGC
+CCGGCGTCAAACTCCCCCAGCCCAGCAGCACCACCACGCCCGACCTTACCCCGCGGGCCGCACTTACTCC
+CGAGACGTACTTCGGAGTCGGCAAGGTGGTCAACTACGGCGGCGGCGGCGCATATGACGAAGGGTCGGCC
+GTGTTTGACTACCCGCCCAGTTTGGCAGCCAACAGCTTTGCACTGCGCGGCCGGTGGGCGCTGGACTATC
+AGGGTGCCACGTCCGACGGCAACGACGCCGCTATCAAATTGAATTACCACGCCAAAGACGTCTACATCGT
+TGTCGGTGGCACCGGCACCCTCACGGTCGTGAGGGACGGAAAGCCAGCCACACTACCGATCAGCGGGCCG
+CCGACCACCCATCAGGTGGTCGCCGGCGATCGGCTGGCGTCCGAAACACTTGAGGTGCGGCCCAGCAAGG
+GGCTACAGGTTTTTTCCTTCACCTACGGATGAATATCCATCCAAGACCCGGACGGCTCCGAAGAAATCAT
+GTCGGGGGTAGCGAGACGGCACAAGCCGCCGTCTCCGGCAGCGAAGGAGTGAACGGCATGAAGGTAAAGA
+ACACAATTGCGGCAACCAGTTTCGCGGCGGCCGGCCTGGCGGCTCTGGCGGTGGCTGTCTCACCGCCGGC
+GGCCGCAGGCGATCTGGTGGGCCCGGGCTGCGCGGAATACGCGGCAGCCAATCCCACTGGGCCGGCCTCG
+GTGCAGGGAATGTCGCAGGACCCGGTCGCGGTGGCGGCCTCGAACAATCCGGAGTTGACAACGCTGACGG
+CTGCACTGTCGGGCCAGCTCAATCCGCAAGTAAACCTGGTGGACACCCTCAACAGCGGTCAGTACACGGT
+GTTCGCACCGACCAACGCGGCATTTAGCAAGCTGCCGGCATCCACGATCGACGAGCTCAAGACCAATTCG
+TCACTGCTGACCAGCATCCTGACCTACCACGTAGTGGCCGGCCAAACCAGCCCGGCCAACGTCGTCGGCA
+CCCGTCAGACCCTCCAGGGCGCCAGCGTGACGGTGACCGGTCAGGGTAACAGCCTCAAGGTCGGTAACGC
+CGACGTCGTCTGTGGTGGGGTGTCTACCGCCAACGCGACGGTGTACATGATTGACAGCGTGCTAATGCCT
+CCGGCGTAATCGTCCGCGGAGGCCGCCGACCCGCCCGAGAGCGACTGAGCATGTGCCAGAATGTTCGGGC
+AGTGGGAGTTCGACGTCAGTCCAACCGGAGGAATCGCCGTGGCAAGTACCGAGGTGGAGCACTTCGCCGG
+CTCGCAACATGAGGTCGACACCGCCGAGGTTCCATCTGCAGCGTGGGGGCGGAGCCGGATCGATCACCGC
+ACCTGGCACATCGTCGGCCTGTGCATCTTCGGCTTCCTGCTGGCGATGCTGCGGGGCAACCACGTCGGCC
+ACGTCGAGGACTGGTTCCTGATCACGTTTGCCGCAGTCGTGCTGTTCGTCTTGGCGCGCGACTTGTGGGG
+CCGACGACGCGGCTGGATCAGATAGCCAGCACACCGTTCGGTGTGCCCGACCCGGTCAGCGCCGCACCCG
+CCGAAACCAGGTACCGGCGAAGGCACCGACCACCAGCACAACCAGCAACACCGCCCAAGGCCATGCACCG
+TGCTGGTTAACCCAGCCAGCCAGGGCACCTTGCAGGCGGCCGGCCGCGGCAATCACCGCATCCTGGGGAT
+TCGCCCCGACACCGGCAATCAGGCGCAGCTCGTAGAGACCGTAGTAACCCACGTACAGCCCGACCACCAC
+CAGCAGCGCGCCACTGATCCGGTTGACGAACGGCAAGATTCGCCGTAGGCGGTCGGCCAGCGCCGAGCTC
+GCGGTCGCGGCCGCGACGGCAAGCACGCCGACAACGAGGGTCAGGCCCGCGACATAAGCCAGATAGATCG
+CTACGCTCCCGACGACCGAACCGCCCCGCAGGCCTGCCCCGGTAACCGCGAGAAACGGCCCGATGGTGCA
+TGACAGCGAAGCAACCGCATAGCTGATGCCGTAGCCATACATGGAACCCAGCCGTACCGTTGGAGCCCAA
+CGCACGCCGAGGGATCGGGGCGTCAACGCCGTCAGCCCTCGTCCCAACAGCAGCCACCCGCCGAGGGCGA
+TGAGCGCCAGACCGATCAGCACCGTGGCATAGGGCAGGTATCGCTGCACCGCCGTGGCCGCGGAAATGGT
+CAGGGCTCCGAAGATGCCGAACACCGTCAAGAAGCCCAGCGCCATCCCGACCGTGGCGGCTGCCGCTCGG
+CCCACTGCGCTAAGCGGCCCCGTCCGGCCCGCCGAATCCTGCCCATGCACCACCAACAGCAGGTAGGCCG
+GCAACATGGCAAACCCGCATGGGTTCAGCGCAGCCACCAACCCGGCGGCGAACGCCAAACCGATCAGCGC
+CTCGTTCACCGGGTCAGGACGTCAGCGCAGCCACCCGGCCGGACAGCTCGTCCTGAGACATGGCCGCGGT
+GGGGTTGTTGACGAACGTCGATGTGCCGTCCGCGCGATAGAACACAAATGCCGGTTGCCAAGGCACGTTG
+TAGCGGGCCCAGATCACACCATCGGCGTCATTGAGGTTGGTGAAATTCAGGTTGTACTTCGAGACAAAGC
+TCTGCATCGCCCCGACGTCGGCGCGGGTGGCGATTCCGACGAAGGTGACCGCCGGATTAGCGGCCGCTAC
+CTGGCTGAGGCTGGGGGCTTCTGCGTTGCAGAACGGGCACCACGGCGTCCAGAACCACAACACCGCCGGC
+TTGCCTTGCAGGCTTGCGCCATCGAAGGGGGCACCGCTGAGCGTGGTTGCGGTGAACTGCAGACGTTCAT
+CGGCTGCCACCGCTCGCGGTGTATTGGCCAGACCGAACATCAGGACAACCGCGATAGCAACGGCCACAAT
+GCCGTCCGCAAACGCCTTGATCGGGGACACCAGGCGAAGACTCATGACAGACCTCACTTGTTCGTGTTTT
+GACCTAATGACGTAATACGCTCCGTGACGGTTCAGTACATCCCGGCGCCCCCTGCGCTCGCGGCCAGCTG
+TCCGCAGCGCTGGCTGATTCGCCTGCGCTCCAGCTACCCGCCTACGGCGGCCAGCTGTCCGCAGCGCTGG
+CTGATTCGCCTGCGCTCCAGCTACCCGCCTACGGCGGCCAGCTGTCCGCAGGCGGCGCTGATCTCCCGCC
+CACGGGTGTCTCGTACCGTGCAGGAAACTCCCTTCGCCCGAACCCGTTTGACGAATTCACGCTCAACCGG
+CTTGGGGCTGGCATCCCAATCACTGCCCGGAGTCGGGTTCAGCGGGATCAGGTTCACGTGCGCCAACGGC
+CCGAGAACACGATGCAGTCGCTTTCCCAGCAAGTCGGCCCGCCACGGTTGGTCGTTGACATCACGGATCA
+GCGCGTACTCAATAGACACCCGTCGCCCGGTCACATTGGCGTAGTACCGGGCCGCATCGAGCGCTTCGCT
+GATCCTCCACCGGTTGTTGACCGGAACTAGTGTATCGCGCAACCCGTCGTCGGGGGCGTGCAGCGACAGC
+GCCAGGGTCACGCCGAGCCGCGCGTCGGCAAGGTTGCGGATAGCAGGGGCCAGACCCACCGTCGACACCG
+TCACCGCGCGGGCCGAAATCCCGAAACCGGACGGCGGCCGCGCGGTAATGCGCTGAACTGCGGCCAACAC
+CCTGGCGTAGTTGGCCAGCGGCTCCCCCATACCCATGAACACCACATTCGACAACCGATCGCCGAAGTCG
+TCGCGCAACGCCGCGGCGCCGGCACGCACCTGCTCGAGGATCTCCGCCGTCGATAGGTTGCGAGTCAATC
+CGCCCTGGCCAGTGGCACAGAACGGGCAAGCCATGCCGCAGCCGGCCTGCGAGGAAATGCAGACCGTGTT
+GCGCCGCGGATAGCGCATCAGCACCGATTCGAACATGGTACCGTCGACGGCCCGCCACAACGTCTTTCGA
+GTCTGGCCGGCATCGCAGGTGATGTCGGCGGACGCGGTAAGCAAGTTCGGGAACATCGCTCCGGCGATCC
+GGTCGCGAACGGCCGCCGGAAGGTCGGTCATCTGACGCGGATCGGCGATCAGCCGACCGTAGTACTGGTG
+TGCAAGCTGCTTGGCCCGAAACGCCGGCAGCCCCAGCTCCGCGACGGCAGACGCTCGGCCCGCCGCGTCG
+AGATCGGCCAGGTGCCGCGGCGGCCGACCCGGACGCGGCTCATCGAACATCAACTCGGGGACCATGACCT
+GTCCAGTATCGCCGTTGTCAGGGCAGCAGTGTGAGGACTATCCAGGCCGCCACCGCGGAAGGCAGTATGC
+CGTCGAGCCGGTCCATCAGACCGCCGTGGCCGGGTAGCAGGCGGCCCATGTCTTTGATGCCGAGGTCACG
+TTTGACCTGCGACTCCACCAGGTCGCCCAGCGCGGTGGTGAGCACGAAAAGCACGCCGAGCAGTGCACCA
+ATCCACGGCGTTTTGCCGACCAGGAAAGTCGCGGTGATGATCGTTGCGGTGATCCCGCACACCAGCGAAC
+CGGCAAAGCCCTCCCACGACTTCTTCGGGCTGATCGTCGGAACCATCGGATGCTTGCCAAACAGCACCCC
+CACGGCGTAGCCGCCGACATCGGAAGCGATGACCGCGATCATCATGCAGAACACCCATCCCGAGCCATTT
+TCCGGGTAGACCAGCATTGCGCCGAAAGAGCAGAACAATGGGACCCACACGGCCAGGAAGACCGTGGCCG
+AGACGTCGGACAAGTAGTTTCCCGGCGACGGTGCACCGCCGGTCGTCGGGCGCGTCACGCTGTCCTGCAT
+GAACAGTCGCCAAATCATGCAGACAACGACCATGCCACCAAAGCCCGCCAATGCGCCGACCGCGCCGAAC
+GGCCAGGTCAGCCACACCGCGGCCTGCCCGCCAATCAGCAACGGGATAACCGGGATGAGATAGCCCGCTT
+CCCGCAACCTCCGCACCACCTCATGGGTAGCGACCAAGGTGGCGACGGCCACGATGGCAACCCAAACGCG
+CGGAACGAACACCAGCACCGCGATGAGGACTAGGCCTATGGAAAGGCCCACCACGATCGCTGCGCGCAAA
+TCACGGCCGGCGCGGGACGTTTCGGTCGCCGGCTGCTGTTTAGCACCACGCGCCGGCTGCTCGGCGGGGT
+TTCCGGTGCCGGCATCGTTGGTTGTCACGGATTTTGTTGCTGAGCGGCCGCTAGACCTCCAGCAGCTCGC
+CTTCTTTGTGTTTAACCAGCTCATCAATTTGGGTGACGTATTGGTGCGTGGTCTTGTCGAGATCCTTTTC
+TGCGCGACCGACCTCATCCTCGCCGGCCTCGCCTTCCTTACGGATGCGATGGAGTTCCTCCATCGCTTTG
+CGACGGATATTACGCACCGAAACCTTGGCCTCCTCCCCCTTATGCTTTGCCTGTTTGACCAGCTCTCGCC
+GACGTTCTTCGGTGAGCTGCGGTACGGCCACGCGAATAAGGGCGCCGTCGTTGGTGGGATTCACTCCAAG
+GTCGGAGTTGCGAATTGCAGTCTCGATAGCGCGCAACTGATTGGCTTCATACGGCTTTATCACGACTAGC
+CGCGCCTCGGGGACATTGATGCTGGCCAGTTGCGTGATCGGGGTGGCCGCACCGTAGTAGTCGATGGTGA
+TCCGAGAGAACATGCCAGGGTTGGCGCGGCCGGTACGGATAGTTGACAGGTCGTCACGTGCCACCGCCAC
+AGCCTTCTCCATTTTCTCTTCGGCGTCGAAGAGAGCCTCATCAATCATCTGCGCCGCTCCTCCTCATCGC
+TGCGCTCTGCATCGTCGCCGGCGCCAACCATCTGCGCCGCTCCTCCTCATCGCTGCGCTCTGCATCGTCG
+CCGGCGCCAACCATCTGCGCCGCTCCTCCTCATCGCTGCGCTCTGCATCGTCGCCGGCGCGAAGCAGCGC
+GTAGTCCCCTTAGGTGGTGACCAGCGTTCCGATCTTCTCACCCCGAACAGCACGGGCGATATTGCCATCG
+GTCAGCAGGTTGAACACCAGGATCGGCATGCCATTGTCCATGCAAAGGCTGAACGCGGTGGCGTCGGCTA
+CTCGCAGCCCGCGGTCGAGGACCTCACGATGACTGACGGCGGTGAGCAGTTCGGCCTCGGGGTTCACCCG
+CGGATCCTCAGCAAACACACCGTCGACCGCTTTGGCCATCAAGACCACGTCGGCACCGATCTCCAGCGCA
+CGCTGCGCTGCGGTGGTATCCGTCGAAAAGTACGGCAGCCCCATGCCGGCACCGAAGATCACCACCCGTC
+CCTTCTCCAGGTGGCGGACGGCCCGCAACGGCAGGTACGGTTCGGCCACCTGGCCCATGGTGATCGCGGT
+CTGGACTCGGGTAACGATGCCTTCCTTCTCCAGGAAGTCTTGCAGTGCAAGGCTGTTCATGACAGTGCCG
+AGCATTCCCATATAGTCCGACCTGGTGCGCTCCATACCGAGCTGCTGCAGCTGTGCGCCCCGGAAAAAGT
+TGCCGCCGCCGATCACGACGGCGATCTGGACGCCGCCGCGCACCACATCGGCGATCTGGCGGGCCACCTG
+CGCGACGACATCGGGATCCAGCCCGACCTGGCCTCCGCCGAACATTTCCCCGCCGAGCTTGAGCAACACT
+CGCGAGTACCCGGACAGCTGAGCCGCCGACGCGGCGCCAGTGCTCGCAGGCTCCGGCTTCGAAGCCGGCG
+CGCCGGCGACATCGGGCTCTGTCATCTGACTCCTCGCACGACAGTGCCATCCCGGCACCACCAGGACGGC
+ATCTCACATTCTGCCTCAATAGCCGCGCTCCGGCGTGGGCGGGGTGCGTTAGTCACGCAACAACGAGGGG
+CCGGCCGAGGCCAGGCCCGTCGACTATCTCAAGGTGTGAGCATCGCTCGAGCAACAAAGTTGGAATAGTT
+CTGTTCTGAACCGGGTACCCAGGGGTACCGGCAGACATCTCCGCGAGGGATGCCTACGGGCCCCACGACG
+GGGAAGTGGCACCCTCATGAAGTTTGGAGATATCTCTTGGAAGTTCTACTTCTTACCGATGAAGCCGATC
+TTGAATCGGCTCTGCCGGAGCTGGAGTCGTTCGCGCAGTCGGTGCAGCGCGCACCGCTGGACGACCCGGG
+CGCGGCCAAGGGTGCGGACGCCGATGTCGCGATCATTGACGCGCGCGCCGACTTGGCGGCCGCTCGCCGG
+GTGTGCCGCCGGCTGACGACTAGCGCACCAGCCCTTGCCGTGGTGGCTGTTGTTGCGCCGGCCAACTTTG
+TGGCAGTGGACGGCGATTGGATATTCGATGACGTGCTGTTGAACGCGGCCGGCGGGGCCGAGCTGCAGGC
+ACGGTTGCGGTTGGCGATCACACGTCGACGGAGCACGCTAGCGGGCACACTGCAATTCGGGGACCTCGTC
+CTTCACCCAGCCAGCTACACCGCGTCGCTGGGCGACCGGGACCTGGGGCTGACGCTCACCGAATTCAAAC
+TCATGAATTTCCTTGTGCAGCATGCCGGTCGGGCGTTCACCCGGACTCGGCTCATGCGTGAGGTGTGGGG
+CTATGAGTGCCATGGTCGCATTCGTACCGTCGATGTTCACGTACGACGACTGCGCGCAAAGCTCGGAGCC
+GAGCACGAATCGATGATCGACACCGTTCGCGGTGTGGGTTATATGGCGGTGACGCCACCGCAGCCGCGCT
+GGATCATCAGCGAATCGATACTAAACCGTTGCAAGTGAGTGATCTTTAGTGGTCACTTGACTTGCACCCC
+GTCTCGGGGTTGTTCGCCGGCCGGGTGGCCGGTTGCCTTCCGCGCTTCACGGCCACCCGGCCGGGCCAGG
+CCCGGTCTTACGGTCGGCTCCACGCTTGACGGCGGCCCCAACTGGGCCGACGACGCTAGGTGGTTCCTCG
+TAGCGTGCGAGGTTGATCGCGGCGTTGTCGTCACGTTGGTGCGTGATCGAACAGCCGTCGCATTGCCATA
+TTTCGTCCCAGCCGATGTCTTGCACATGCCGGCAGGCATGGCAGGTTTTCGACGATGGGAACCAGCGGTC
+GGCGACCACCAGACTCGATCCGTACCAGCCTGTCTTGTAGGACAGGTGACGGCGCGGGGTTGCCAGGGCT
+GCATCAGACAGTGCGCGCCGTCTGGCGCGCGCCCCCGGCAGTCCCTTTTGCCGCAGCATTCCCGCCGCAT
+CCAGACCTTCGACAACGATACGGCCGTGGGTTTTGGCCAATCGTGTTGTCAGCACGTGCAGGTGGTGGGT
+ACGGACATCGTTGACCCGACGGTGCAGCCGGGACAGTTCGGTGGTGCGCTCACAGTAGCGGCGTGAGCCT
+TTCGTGCAGCGTGAGCGTGCGCGGCTGACGCGGCGCAACCCGCGCAACGCAGCATCAAGCGGGCGAGGAT
+TCGGCACTTGTTCAAGCACCGTGCCCTCAGCGTCTGCAACAGTGGCCAAACGCCGCACACCAACGTCGAC
+ACCCACCCGTGAATCAGGAAGCGCCACACGCCGCTGTTGGGGGCGTTGGACGAGCACCCGCACGCTCGCA
+TCCAGGCGGGTGCCGTTGCGGCGCACGGTGATCGCCAGCACCCGCGCCCGACCTTTGGCGATGAGCCGCT
+CAACCCGGCGGGTGTTCTCGTACGTACGGATGGTGCCGATCACCGGCAAGGTGAGGTGGCGGCGGTCGGG
+CTCCACACGCATCGCACCGGTCGTGAAGCACACGCGATCGGCGTCGCGTCCCTTCTTCTTAAACCGGGGA
+ACGCCTACTGTTTTGCCAGCCCGTTTCCCGGCACGGCAGCTCTGCCAGTTCCAATACGCATCGACCGCGC
+CCGCGATGCCATCGGCATAGGCCTCTTTCGAGCATTCCGGCCACCACACCTGCCCGGTCTGCGCGTTGAC
+ACACACCTGGTCTTTGACCGTGTTCCACCGTTTGCGCAACACCCGCAGCGACGGCTTCGCCGACTCGGTG
+CCATCCGCGCGCCACGCCTTGATGTCGGCTTTAAGCGCCGTGACGGTCCAGTTGAATGCCTTACGGCGAG
+CACCAAAATGGCGCGCCAAGCTGGCAGCTTGCGTCTGGGTCGGGTTCAGCGTGAACCGAAACGCCTGCAC
+ACACCACCCCTCAGGCACCTTTAAGCGCGCCATCACCTAGCCTCGTGTCCCCCGGCGCGTGCCGCCGCGG
+CCACGGCACGCGCAGCACGGTTGCCAGCAGCGCGTTTGCCGTAGAGCCGCGCACATATCGACGTCAAGAT
+CTCGGTGATATCGCCCACAACGTCGTCATCGACATCGGCCGAATCGACCACAACCAGCTCACGGCCGTCA
+GCGGCCAGCACCGCCTGTACACACTCAAAGCCGAACCGCCCCAACCGGTCCCGACGTTTCATCACAATCC
+GCCTCACCGTCGGATCACCCAGCAGCGTAAGGAACGTGCGGCGGCGCCCGTACAGCGCCGACCCGACTTC
+AGTAACGACCTTGCCGACGGGTATCTGTTCCGCCGTGGCCCACGCGGTCACGCCTACCACTTGCCGATCC
+AGATCCACCTTCTGATCAGCCGACGACAACCGCGCACACACCGCCGTCCGCCCCCACCGCCCCGGCTGCC
+CGGCTGGCTCGTCGACAAGAATCACTCGCCCAACCCTGCGGGCGGGAACCGGCAACCGCCCGACACGCAA
+CCAGCGATACGCAATAACCCGCGCCACACCGTTGCCCTCAGCCCACACCACCAGATTCATACTTCCGTTC
+CTACAACACACCACCGACAACCAACGACCACCCAAACGCAACAGCTGACAGCCCCTTCCGGGCATCGGCA
+GCACCGGCCGAAGACTCCACAGCGCGTTAATGCGCCCAGGTGTTTGCAACGGCGGTGTCGAAGGCTGCCG
+AGAACACGCCCACTGCGGCAATGCGATGTAGGCTTCACGCCCGTGGCTATGGTTCCCGCTCAAACGACCG
+GCGGCACTGCCCACAAGCGCCGGGAGCGCATAGGAACGATTTACCGTTCGGCCCGGCACATGTGTCAGTA
+TCCTTGACATGGGTCTAGCCGATGACGCCCCGCTGGGCTATCTGCTCTACCGGGTGGGAGCCGTACTGCG
+GCCAGAGGTTTCCGCTGCGCTCAGTCCACTCGGCCTGACGCTGCCTGAGTTCGTCTGCCTGAGAATGCTT
+TCGCAGTCACCGGGACTATCCAGCGCCGAATTGGCCCGGCACGCAAGCGTCACACCGCAGGCGATGAACA
+CGGTGTTGCGCAAGCTGGAAGATGCCGGTGCGGTGGCCCGGCCCGCATCGGTGTCTTCCGGGCGTTCGCT
+ACCGGCTACATTGACCGCTCGAGGCCGAGCCCTGGCGAAGCGCGCCGAGGCCGTCGTACGCGCCGCCGAT
+GCCCGCGTCCTGGCCAGGCTGACCGCGCCTCAGCAACGCGAGTTCAAACGAATGCTGGAGAAGCTCGGGT
+CCGACTAGATCCGGACGCGGGCTACTCGGCGATATTTGGGGCGTGGATCCGGGCCCAGGGCCGGGCCTCT
+TCGAGTTCGTAAGCCAGCTCCAGCAGCAGCGCCTCGCGCCCGGTATCAGCCGAGAGCATCATGCCCACGG
+GCATGCCGTCCGCGGATTGAGCCAACGGTAGCGAAATCGCCGGCACCCCCGTGACGTTCTGCACTGGCGT
+GAACACGACCCAGCTGCTCAGCCGGTCGAGCACCGTCTGATAGTCGGTAGGCGCAAGGTATCCGACCTGC
+GGAGTGGCCTCCGCGACCGTTGGCGTGAGCAAGACGTCGTAGGTACCGAAGAACCGCACGCTGCGCCGCC
+GTAGCATGCGCAGACGCATGATCGCCAACGGCAGCCGGTGCAGGTTGCGGCCGGTATGGCGGGCCAGCCC
+CAAAGTCAGTTCGTCCAGCCGGGTAGGGTCGAACGTCCTGCCGAATGTGCGCCGGCCGCTGCGCACTTGC
+GCCAGGGCCAAGAACCCCCAATAGAGCACGAAATCGTCCACGAAACTGGCCGGTGCCGGTGGGTGGTCGA
+CGTGTTCTACCCGGTGACCTAGTTCCTCGAGCAGCCCTGCCAACTTCAGCGTCAGCTGCCGCACTTCGGG
+GCTGGCCTCGCGCAGAACCGAGCGGGTTACTACGGCAATCCTCAGCCGCTGCTTAACGGGGCTTGTGACG
+TCCCCGACCGGCGGCAGCTGGTGGTTACGCCAAAGGCGCTCGGCCTCGCGGTAGAAGGCTGCGGTGTCGC
+GTACCGTGCGGGTCAGGACGCCATTGGCGACGATGCCCACCGGCAACCTGCGATACTCCGGCTCCAGCGG
+CAACCGGCCGCGCGACGGCTTGAGCCCGACCAACCCGTTGCAGGCGGCCGGAATACGGATCGAGCCGCCG
+CCGTCGTTGGCGTGCGCGATCGGCACCACGCCGGCTGCCACCAAGGCGCCCGATCCCGATGAGGAGGCAC
+CCGCTGTGTAGTCGGTATTCCACGGATTACGGACCGGTCCCAGCCGAGGGTGTTCGGCCACGGCGCTGAA
+GCCGAATTCCGACAACTGCGTCTTGCCCAGGGACACCAGCCCGGTGCCCAGCACCACCCGGGTTATCTCG
+CTGTCGGCGACGGCCGCGTATGGTTCCCACGCGTCGGTGCCATGCATCGACGGCTGTCCGGCAACGTCGA
+CGTTGTCCTTGATGAAGGTCGGCACTCCACTGAAGAACGCTTCCTGGCCCGTACCCATCGCGGCCGCGTC
+TCGCGCCACGTCGAAAGCCGCATACGCCAACGCGTTCAGTGCCGGGTTAACGGCTTCGGCGCGGGCGATG
+GCGGCCTCGACGACGTCTGCCCGACCCACTCGACCTGATCGGATGGCGTCGGCGAGGGCGACCGCGTCGA
+GGTCACCAAGGGCATCGTCAACGAAAGCGTGTACGCGCGACATACCCGGCTAAGCCTGGCCCACCTCGAA
+GCGGACGAACCGTGTCACCATCACGCCGGCCACGTCGAGCAGGGCCTTGACGGTCTTCTTATTGTCGGAC
+ACCGACGCCTGCTCAAGCAGCACCGCATCCTTGAAGAAGCCGTTCAGCCGGCCCTCGACAATCTTGGGCA
+GCGCCTGCTCCGGCTTGCCCTCGGCCCTTGCCGTCTCCTCGGCGATGCGGCGTTCGCTGGCCACGATGTC
+TTCAGGCACGTCGTCGCGGGACAGGTACCGCGCCCGCAGCGCGGCGATTTGCAACGCAACGGCGTGCGCG
+GCGGCCGCGTCGTCGCCGCGGTACTCGACCAGTACACCCACCGCTGGCGGCAGGTCAGCGGAACGTCGAT
+GCAGGTAGGCTTCCACGGTCCCGTCGAAAATCGCCACACGACGCAGCTCGAGCTTCTCGCCGATCTTGGC
+CGACAGCTCGGCGATCGCCTGCTCGACGGTCTTGTCGCCGATGCTGGCACCCTTGAGCGCGTCGACGTCG
+GCGGGCTTAGCTGCTGCCGCCGCCGCGACCACTTGGTCGGCCAGCGTTTGGAACTCCGCGTTCTTGGCAA
+CAAAGTCAGTCTCGCAGTTGAGCTCGATCAGCGCGCCGTCCTTGGCCGCCACCAAGCCCTCGGCCGTAGC
+CCGCTCGGCACGCTTGCCGACATCCTTAGCGCCCTTGATCCGCAGCGCCTCGACGGCCTTGTCGAAGTCC
+CCGTCGGTTTCGGCCAGCGCGTTCTTACAGGCGAGCATGCCGGCGCCGGTCAGCTCCCTCAGCCGCTTGA
+CGTCAGCGGCAGTGAAGTTCGCCATATCAGCCTTTCCTAGGATGCATCTGTGGTTGGTTCGGTTGCGCCT
+GCGGGGGCGTCGGTGAGGGCAGTTGTTGACGCGGTTGCTGATGGCGTTGCCGAAGCTGTCGCCGAGGCCA
+GCAGCTCTTGCTCCCATTCGGCCAGCGGCTCGGCGGCTTCGGCCTCCGGCTTGCCGTCGGCGCGCCCCAG
+TCCGGCACGGGCCTGCAGGCCCTCGGCGACCGCGGAAGCGATCACCCTAGTCAGCAGCGCGGCCGAGCGG
+ATCGCGTCGTCGTTGCCTGGGATTGGGTAGTCGACCTCGTCGGGGTCGCAGTTCGTGTCAAGGATCGCGA
+TGACCGGGATGCCCAGTTTGCGGGCCTCACCGACGGCAATGTGCTCTTTGTTCGTGTCGACGACCCAGAT
+CGCCGACGGCACCTTGGCCATGTCGCGGATGCCGCCGAGGCTGCGCTCGAGCTTGTTCTTCTCGCGGGTC
+AATCCCAAGATTTCCTTCTTGGTGCGGCCCTCGAAGCCACCGGTCTGCTCCATCGCCTCAAGCTCCTTGA
+GGCGTTGCAGCCGCTTATGCACGGTGGAGAAGTTGGTGAGCATGCCTCCCAGCCAGCGCTGGTTCACATA
+CGGCATGCCGACCCGGGTGGCTTCGGCGGCCACCGACTCCTGCGCCTGCTTCTTTGTGCCGACGAAGAGC
+ACCGACCCACCGTGAGCGACGGTCTCTTTCACGAACTCGTACGCCTTATCGATGAAGGTCAACGTCTGCT
+GCAGGTCGATGATGTAGATGCCGTTGCGGTCGGTGAAGATGAAACGCTTCATCTTGGGATTCCAGCGACG
+GGTCTGATGCCCGAAGTGGGTGCCGCTGTCAAGCAGCTGCTTCATGGTGACTACGGCCATACCTATGCCT
+TACTCATGTGTCGGTTGTTCGCCCGGCATCGGCTGAAGCCGGGCCCTGGCGTCTGCCGCGATGCCGGACC
+CGGGAGGAAATCCCCGAAGGGAACCGCCGCGGGACCGCCCCGGCATGCTGTTGCGGATCCCGGAAAGGCG
+GGCCGCGGTGCAGACACGCGAAGTCAGCCCGCCGATGCGAGCTGCGCCGAGTAGTTTACACCGACCCAGC
+TGGTGATTTTCCCGGCAGCGGAATCCACAGCGACGACATTGTCCACAAAACGGGCGGCGGCGATTGGCCA
+AATCGCCCGCGCGGCGCTGCACTGCAAAGGTGCGGAGGGTTCTGAGCCGCAGCGTACTGATCCTTTGCTG
+GTCGCTGCTTGGTGCGGCGCCGGCCCATGCCGACGACTCCCGGCTGGGCTGGCCGCTGCGGCCGCCGCCG
+GCGGTAGTCCGGCAGTTCGACGCCGCATCGCCCAATTGGAATCCGGGGCACCGCGGTGTCGACCTGGCCG
+GGCGCCCCGGTCAGCCGGTTTACGCGGCCGGCAGCGCGACGGTCGTATTCGCCGGGCTGCTCGCGGGACG
+GCCGGTGGTTTCACTGGCCCACCCGGGTGGGCTACGCACCAGCTACGAGCCGGTAGTCGCCCAGGTCCGG
+GTCGGTCAGCCGGTGTCGGCGCCCACCGTGATCGGCGCGCTGGCGGCCGGGCACCCCGGGTGCCAGGCCG
+CCGCCTGTCTGCACTGGGGGGCGATGTGGGGCCCGGCTTCGGGCGCCAACTATGTCGATCCGCTGGGCCT
+GCTGAAGTCCACACCGATACGGCTCAAGCCGCTATCCAGCGAAGGGCGGACGCTGCATTACCGCCAAGCG
+GAACCCGTATTTGTGAACGAAGCCGCCGCCGGTGCTCTGGCCGGCGCTGGCCATCGGAAATCCCCGAAGC
+AGGGCGTTTTCCGCGGTGCCGCGCAGGGCGGTGACATCGTCGCCCGGCAACCGCCAGGCCGCTGGGTTTG
+CCCATCGAGCGCGGGCGGCCCAATCGGGTGGCACCGACAATGAACCAGCCGAGCTCCCCTTCCCCAAAGC
+GGCCGATACCGATCCGCCAATGCTTTCTCGGTCTAGTGCCCAGTACCAGTACGGCTGGGGCGTCTGAACC
+CCGCCAACAGCACCGCCGCCTGCCACACTTGGGCTCGCCCGCGGGCCGGCGAAGATGGTTGGACCCCAGC
+TGTCAAGCACCGAGGATCCCGAGTCACCGGCGCCGCCCGGGGTGCCCGGGATCGCTTGCTGGGCGAGCGA
+AGCCTCGAATTGCAGTAGCCCTTCGTCGAAGTAGCTGATGCCCAGCAACCGAACGATCGTCATCCTGTTG
+TCAGGCGTGAGACCGAGAAGATTCTCCGCGAGCCATTGCTGCAATGCCGAGTACCACGGGATCAGTGACG
+TCGACGAGAGTTGCTGCAACAGTTGGGGCACCGCGGCGGTGGTGGCCAGCGGTGGGACCGTCGACGATAC
+CGTCGCCGCCGCCTGGCCGGCCAGCGCGGCAGGGCTGGTAGTCACTGGCGCCGCGGTGAACGGGGTCAAC
+TCCGTGGCGATTGCCGCGGAGCCCGCATAGGCGTACATGGCGGCAGCGTCTTGGGCCCACATCTCGGCGT
+ATTGGGCCTCGGTGGCCGCGATCGCCGGGGTGTTCTGCCCGAAAAAGTTGGTCGCGACCAGCGCCACCAA
+CAGCGCGCGGTTGGCAACGACCACCGGCGGGGGCACCGTCATCGCAAACGCCAGCTCATAGGCTGCCGCG
+GCCGCTCTGGCCTGCATGCCCGCCTGTTCAGCCTGACCGGCGGTGGCGCTGAGCCACGCCACATAAGGCG
+TGACCGCGGCCACCATCGACGCCGCTGCGGGCCCCGCCCAGTACGCACCGGTCAGCTCCGAGATAGCCAA
+CCGGTAGCCGCCGGCGGCCAAGCCCAATTCAGCCGCCAAACTATCCCAGGCCGCCGCGGCGGCCATCATG
+GGCCCCGATCCCGGACCTGCGTACATTCGACCGGAGTTGATCTCGGGCGGCAACACCCCAAAGTCCAACG
+CCCATCCCTCCCTAGCCGGCCGGGATCACGGCGTGGTTACGCGCCCCACCCGAATAGGCAGTGGTACGTG
+ATGCGGTCACGAACTGGTCTTGAATCGCCAGCCTCAGGTCGCTGATCGCTGACAGCGGCCCCGGTCGTCG
+AACAAGCCAGTCCATCCTGTGCCCTCATCCCTGATAGCTGGATTTTGGCGGCTTGACATCGGCCGCACCA
+GCGTTTCTGGGTAAGTGCTTACAAACGAGACGCATTTGCTGTGACCGGAGCCGAATGTTTGATTCCCGGC
+CAGCTACCGTTCACCTGAAGGAAGTCGGCGCGTTACCCACAGCTCGATATTCGGGGTCCTGCCGGCCCGA
+ACCGCCACCGCACAATCGATGCCGGCTTCGCGGCTACCGTCGACTCCATGACCGTTGCCAGCACCGCTCA
+CCATACACGTCGGCTACGTTTCGGGTTGGCGGCACCGTTGCCCCGCGCGGGCACCCAGATGCGCGCCTTC
+GCGCAGGCTGTCGAGGCCGCCGGGTTCGACGTGCTGGCCTTCCCGGACCACCTGGTGCCTTCGGTTTCGC
+CGTTCGCAGGCGCGACCGCCGCGGCGATGGCCACGCAACGACTGCACACCGGCACATTGGTGCTCAACAA
+CGACTTTCGCCATCCCGTGGACACCGCTCGAGAGGCGGCCGGTGTGGCAACCCTCGCCGAAGGCCGCTTC
+GAACTGGGACTGGGCGCCGGACACCGGAGGTCCGAATACGACGCCGCCGGCATTACCTTCGATTCCGGGG
+CAACACGGGTGGCGCGGCTCATCGAATCGGCGCACCTGATCCGTGCGCTGCTGGACGCGGAGCCCGTCGA
+CTTCGACGGGCAGCATTACCGGGTGCACGCCGAAGCGGGCTCACTGGTGGCACCGCCGAAGGTCCGGGTC
+CCCCTGCTAGTGGGCGGCAACGGGACCGAGGTGCTGCGGCTGGGCGGACGCATCGCCGACATTGTCGGCC
+TGGCCGGGATCAGCCACAACCGCGACGCCACCCAGGTCCGGTTCACCCACTTCGACGCCGACGGCCTGGC
+CGACCGGATCGCCGTGGTACGTCACGCGGCCGGCGATCGCTTCGAAGCCATTGAGCTCAACGCGCTGATC
+CAGGCGGTGGTCTGCACCAACGACCGAAACGCGGCGGCCGCCGAACTGGCCGCCACCTTGGGCGGGATCA
+CGCCCGAGCAGGTCCTCGAGTCGCCGTTTCTGCTGCTCGGTACCCACGAGCAGATGGCCGAGGCTCTCGC
+CGCGCGGCAGCGGCGGTTCGGTGTCAGCTATTGGACGGTGTTCGACGAGTGGGCTGGCCGCGCGTCGGCA
+ATGCGCGACATCGCCGAGGTCATCGCGCTCCTGCGCTACGGCTAGGCCCGCGGATGGGCCCGCTCGTGCA
+CCGCCCGCAACCGGGCGACCGCGACGTGGGTGTACAGCTGCGTGGTCGCCAGGCTGGAATGACCGAGCAG
+CTCCTGGACCACCCGCAGGTCGGCGCCACCTTCCAGCAGGTGGGTCGCCGCGCTGTGCCGCAGCCCGTGC
+GGCCCCATATCGGGTGCGCCGTCCACCGCGGCCACGGTCTGGTGCACCGCAGTGCGTGCTTGCCGCACGT
+CAAGGCGCCGGCCCCGGGCACCCAGCAGCAGCGCGTGCCCGGACTCCGCGGTGACCAGCGCGCGACGGCC
+GTCGACCAGCCAGGCGTGCAGCGCATCGGCGGCTGGCTGCCCGAACGGGACGGTGCGCTGCTTGTTGCCC
+TTGCCGAGCACCCGAACCAACCGATGGCCGGTGTCGATGTCGTCGACGTCCAGGCCGCACAGCTCGCTGA
+CCCGGATACCGGTGGCGTACAACAGCTCGACGATCAACCGGTCCCGCAGCGCTAGCGGATCACCTTGCTC
+TGCACCAGATTCGGCAGCCGCCATGGCGCGCAGCGCCTGATCCTGACGCAGCACCGCCGGCAAGGTGCGA
+CGGGCCTTCGGCACCTGTAGCCGGGCCGCAGGATCACCGGCCAGTAGCCCGCGCCGCACCGCCCAGGCGG
+TGAATGCCTTAACCGCCGAAGTGCGCCGCGCCAGCGTCGTGCGGGCGGCGCCCGCTCCCGCCGTCGCGGC
+CAGCCAAGACCGCAGGACCGAAAGGGTTAGTGCGTCCAGACTCGATCCGCGATCGGCGAGAAACGCGAAG
+AGCGATCTTAGATCGCCCAGGTAGGCACGACGGGTGTGCACCGACCGACCGCATTGCAGGGCAAGGTATT
+CGTCGAACTCGTCAAGGATCGCCTGCACTCCCCCACAGTCGCAGGCATGACGTCTCGAGCCCGAGTCGAC
+GCGCCGCACCGTGTCCGGGGTGAGATCTTTCGGCCTGGGATAGCCGACCTAGTGAGTCCCGGCCTCCGCC
+TCAGCCAGTTCTTTCTTCCATTTGCGGAACATCTCCTCGGTGCGTCCGCGCCGCCAGTAACCGGAGATCG
+ACGACGCCCATTTGGCATCCACACCGCGCTCGTTGCGAACGTATGGCCGCAAGTTATGCATGACGGCTTG
+CGCCTCACCGTGAATAAAGACGTGGACCTGTCCCGGCAGCCACGCGGTGGTGGTGACCGCCTCGATCAGC
+GGCGCGTGATCACCGGCGCGGTCCTCGGGAACCAGATCGGCGCGCCCGCCGCGATAGACCCAGTTCACCT
+CGACGGCATCCGGCGCGGTCAGGCCGATCTCGTCGTCCGGGCCGGCAACTTCGATGAATGCCCTACCGAT
+TGCGTCGGGGGGCAACGCTTCCAGCGCGGCGGCGATGGCGGGGATCGCCGATTCGTCACCCGCCAGCAAA
+TGCCAGTCGGCGGCTGGGTCGGGGGCGTACGCGCCGCCGGGGCCCATCAGGTAGATCGGTTGCCCACGCT
+GGGCCCCAGCCGCCCACGGACCGGCTACCCCGTGCTCACCGTGCAGCACGATGTCCACGGCGATCTCGCG
+GGCCGCGGCGTCGACATGACGAACGGTCATGGTGCGCACCGGCGGCCGCTTCGCGGTGGGCAGGTCGGCG
+AAGCTGTCCAGGGTCAGCGGCCGGGGCAACCGCCCGACATCGACATCGTCGTCGACGAACACCAGCTTGA
+TGTAAGAGTCGGTGAAGTCGCTGGGGACGAATGTGTCGAAGCCGCTGCCGCCGAGCACTACCCGGACCAT
+GTGCGGCGCGAGGTGTCGGGTAGCGACAACCTCAAAGGCGTGCAATGGTCGACCCGCCACATGTCCTCCT
+GTCCAGACCCGACCCGCGTCGACTATACGAGCCGGGCCGCTGCACCCTTGGCCGCGGCCTGACCGGCACC
+GGCGCGCAATATTCGCCACCGCCCGTCGCGACACTCGGCCAACCCGGCGACCTCGAGGATTGCCAGCGGA
+CCTAGCACCTGCGCGGGCAGCAGCCCGGAGCCGACAGCGATCTCATCAATGGTAGCGGCGCCGCGGCCCG
+GCAGGGCCTCGTACACTTGGCGTTCGGCTTCGCTTAGCACGTCGAGCGCTGCGCCGGGCCGCGGTTCATC
+ACCGGCCAACTCACCGATGTGACCGACGAACTCGACGATATCGTCGGCCCGGGTGACCAACTCCGCGCCA
+TGGCGAAGCAGCGTATGACAGCCCGCCGATGCCGAGGATGTCACCGGGCCGGGCACCGCTGCCACCACCC
+GGCCCAATGCCCGCGCCCAGGCAGCGGTGTTGGCGGCGCCGCTGCGCAGGCCCGCTTCCACCACTACCGC
+CGCCCTCGCGACCGCGGCCACCAACCGGTTGCGGGTTAGGAACCGGTGCCGGGCCGGACGGACACCGGGC
+GGGTATTCGGTGAACAGCACCCCATGTTGGGCAATGCGATGTAGCAACGCCGAATGGCCCGCCGGATACG
+GGATGTCAAATCCGCCGGCCAGTACGGCCACGGTGATGCCCTCGGAATCCAGCGCCGCGCGGTGAGCCGC
+ACCGTCGATCCCGTAGGCGCCACCGGAGACGACCGCGACGTCGCGCTCTGCCAACCCGGCGGCCAGATCG
+GCCGCGACATGCTCGCCGTAGGCCGTCGCAGCCCGGGTTCCAACGACGGCGGCCGCACGTGGTGCCACTT
+CGTCCAGGCGCGCGGGGCCCAGGGCCCACAACACCAGCGGCGAGTGGCCGCACGGCCTTGCCCGGGCTCC
+GGCGCCACTGAAAGCGGCGAACGCCAGCACCGGCCACTCGTCGTCGTCGGGAGTGATCAGACGCCCACCG
+CGGCGCATGAGTAGCTCGAGATCGTCTGCGGCCCGGTCTATTCCGCGTCGGGCACCGGTGTGCTGCGCCA
+GCTCGTTACCGACCTGCCCGCGGCGCACCCGGTCGGCGGCCTCCACGGGGCCCACACATCGCACCAGCGC
+GGCCAGCTGGGCGCACGGCGGTTCGGCCACCCGGGACAGATAGGCCCACGCCCGCGCCGTCGGATCGATC
+ATCGTCGTGCTCCGGTTTGCCGGAAGCTCAGGGCGGCGGCGACCTCGTCGATGCCTGGCGATGTGCGACC
+GGCCAAGTCGGCCAAACTCCAGGCCACCCGCAAGGTGCGATCCACACCGCGGATGCTGAGTAGCCCGCGG
+TCCAGCGCGGTGCGCAACGGGAGCATCGCGGCGCTGCTGGGCCGAAACTTGCGGCGCAACAGCGGCCCGC
+TGACTTCGGCGTTGGTCCGGAACCCATGTGGCCGCCATCGTTGCGCGGCCGCCTCCCGGGCCAGCGCCAC
+CCGCTGGCGAACCTGCGACGTCGACTCGCCGTCCGCGGCCGAGAACGCCCCGGCCCGAAGCCGATGCATC
+TGCACCCGTAGGTCCACCCGATCCAGCAACGGCCCAGACAGTTTGCCCAGATACCGTCGTTTGGTAGCCG
+CCGCACAGATGCAATCCTGTGGATCGGCGGGCGCGCACGGGCACGGGTTGGCGGCTAGCACGAGCTGAAA
+CCGTGCCGGGTAGCACGCCACCCCGTCACGGCGCGCTAGGCGGATTTCACCGTCCTCCAACGGTGTTCGC
+AATGCTTCCAGCGCGCTAAGGCTGATCTCGGCGCACTCGTCCAGGAACAACACCCCGCGATGCGCCCTGC
+TGACCGCCCCTGGGCGAGCCATCCCCGATCCCCCGCCGACAAGCGCCGCAACGCTGGAACTGTGGTGCGG
+CGCCACGAACGGCGGCCGGGTAATCAACGGTGTGTCCCCCGACAGCAGGCCAGCCACCGAGTGGATCGCG
+GTCACCTCCAACGACTCGCTGCCCGACAGCGACGGCAACAGCCCCGGTAGACGTTGCGCCAGCATTGTTT
+TGCCGACACCCGGTGGACCAGTCAGCATGAGGTGATGCGCCCCGGCGGCGGCCACCTCGACGGCGAACCG
+TGCTTGGGACTGGCCCACCACATCGGCGAGGTCCGCCGCAGACTCGGGGGTGGTGTCGGCCGTGGTGATC
+CGCCCGGCCAAGCCGGTGGACCCGCGTAGCCAGCTCTGCAACTGCCCCAGCGTGCGAACACCCCGGACGT
+CGATTCCGTCCACCAGGCTGGCCTCGGGCAGGTTGTCGGCCGGAACGACGACGGCCGGCCAACCGTCACG
+TTTGGCTGCCAGCACGGCGGGCAACACCCCACGCACCGGACGCACCCGTCCGTCCAGCGACAATTCACCC
+AGCAGCAGCGTGTTCTCCAGACGTTCCCACGGCTTCTTTTGTTGCGCCGACAACACCGCCGCGGCCAGGG
+CGATGTCGTAGACCGAGCCCATTTTCGGCAGCGTCGCCGGCGACAGCGCGAGCGTGAGCCTGGCCATCGG
+CCAGCTGTTTCCGCAATTGGTGACCGCCGCGCGGACCCGGTCGCGGGACTCCTGCAATGCAGCATCGGGC
+AGACCCACCAGATGCACACCCGGCAACCCTGAGGTGATGTCGGCTTCGATTTCCACGATCTCGCCGTCCA
+GCCCCCGCACCGCGACCGAGAACGCACGCCCCAGCGCCATCAGCCGATCCCCTGCAGGTGGGTGAGCTCT
+GGGGTGCGGCCTGAATTCTTGGGGCCGACTCGCACGCCGATCACATCGATGCGCACCGCAGCCCAGCGCT
+CTTCCTGGTCGGCCAGCCACAGCCCGGCCAGGCGACGCAGGCGGCGAACCTTGCGCTCGGTCACCGCGTG
+CGCGAGCCCCCCATAACCGTCGCCGGTGCGGGTCTTGACCTCGACGAACACCACCGTGCGGGTGGCAGCG
+TCGCAGGCGATCACGTCCAGCTCGCCGTAGCGGCAACGCCAGTTGCGGTTCAAGATCCGCAACCCCATGC
+TGGTCAGGTAGTCCACCGCTAGGGCCTCGCCCATCGCTCCCAGCTGAACCCGAGTCATCGTCTTCAGGGT
+TGTCATGCGGCCAACCTGCACGCTGGCCCCGACATCACCTGCCACGAATCGCGTCTCACCGATGCCGCGA
+CGACCAGTTATCCCCAGTCGCGGCCCTGTCCACAGCCCCAGTACTGCGCGGGATCACGACACCGCGTCCT
+TGTCATCATCGTCTCCGTCACATAGCAACTTCTCGGGTCCCGGCTACTCGCAACGCACCGCAGGCGGCAC
+ACGCCGATCCAGCAACATCATGTTCGGCGCCGGAAGAGTCCCGTTAGGTGATTCGGTCCGCTCTGGTGTA
+GACGTTCATCGAGTCCCCCCGCAGGAAAGCCACCAGCGTGATCCCGGACGCGTCGGCCAACGAAACCGCC
+AGCGACGACGGCGCGGATACCGCGGCCAGCACCGGAATCCCAGCCATCAGCGCCTTTTGGGTCAACTCGA
+ACGACGCCCGCCCGCTGACCAACAACACCGAGGCGCCAAGCGGTATTCGGTCACGCTCGAAAGCCCAGCC
+GATGACCTTGTCGACCGCATTGTGCCGGCCGATATCCTCACGCACGGCAAGCATGGCGCCGTCCACCCCG
+AATAGTGCCGCAGCGTGCAGCCCACCGGTTCTCGCGAAAACCTTTTGCGCGCGCCGAAGTTGGTCCGGCA
+TCGCCTTGAGAGTGTCGGCGGCGACGGTAGCGGGATCGCCGCCCGGTGCGAATCGGCTGACCTGGCTCAC
+CGCCTGAAGCGACGCCTTACCACAGACTCCGCACGACGAGGTGGTGTAGAAGGTGCGGGTGACATCGACA
+TCGGGCGGCTTGACGCCGGGCGCCAGAGCCACATCCAAAACGTTGTACGTGCTGGCCCCTGTGGCATTGC
+CCTCGACGCGCCTGCCACAGTAGCTAACGGTCAGCACGTCTTCGCGGTGCGCAACCACCCCTTCGGCAAG
+CAGAAAGCCTTGCACCAGTTCGAAATCCGATCCTGGCGTGCGCATGGTCACGGTAACCGGCGTCCCATTG
+ACGCGGATCTCCAGCGGCTCCTCGACGGCCAAGGTTTCCGGCCGGGTGATCACCTGATCGGCGCTGAGAT
+GCCTGACCCGCCGATGCGCCGTTGCGTACCCCACTAGGCCGTTGGCTCCAATCGCACGATGATCGCCTTC
+GACACCGGGGTGTTCGATTGGGCCGCGGTATGGTCGAGCGGAACCAGCGGATTGGTCTCCGGGTAGTAGG
+CCGCAGCATTGCCGACCGGCGTCGAATATGCCACCACCAGAAAGTCTTTTGCCCGCCGTTCTTGCAGACC
+GCCTTGGCCGTCGGTCCACTCCGACACCAGGTCGACACGGTCACCCGCCGTCAAACCGAACGTTTCGATG
+TCGGCCGGGTTGATGAACACCACCCGGCGTCCGCCCTTCACGCCGCGATATCGGTCGTCGAGCCCGTAGA
+TCGTGGTGTTGTACTGGTCATGGCTGCGTAGGGTCTGTAGCACCAGCCGGCCGGGCGGCACCGGCACCCA
+CTGCAACGGATTGACCGCGAAGTTAGCTTTGCCTGTGCTGGTACGGAATTCGCGCGCATCGCGCGGCGGG
+TGCGGCAATTGGAATCCGTCGGGCACACGCACCTTGTGGTTGTAGTCGTCACAGCCGGGCACCACCGCGG
+CGATGGCGTCACGGATGGTGTCGTAGTCATCTGCGAACCGTTCCCATGGCACCGGATGTCCGGGGCCGAA
+CAAGGCGCGGGCCAGCTGGCAGATGATCTGCACCTCGCTGCGCACCTGATCGCTGGGCGGGTGCAGGCTA
+CCACGCGACAGATGCACCATCGACATCGAATCCTCAACCGACACCAATTGTTTGCGACCATTGCGGGTAT
+CGCGATCGGTCCGACCCAGCGTCGGCAGGATCAGCGCGGTGGCGCCGTGGACAAGGTGGCTGCGGTTGAG
+CTTGGTCGAGACTTGCACAGTCAGCGCGCACCTGCGCAAGGCCGCCTCGGTGACGGCGGTGTCGGGGGTG
+GCCGACGCGAAGTTTCCGCCCATGCCCATGAAGACGCTGACCCGACCGTCGCGCATGGCCCGGATTGCGG
+CCACGGTGTCAAAGCCGTGCGCTCGGGGGCTGGTAATGCCGAACTCACGATCCAGCGCCGCCAGGAACTG
+CTCGGGCATCTTCTCCCAGATCCCCATCGTGCGGTCCCCTTGTACGTTGGAATGCCCGCGCACCGGGCAC
+ACCCCCGCGCCGGGTTTGCCGATCATGCCCCGCAGCAGCAGCACGTTGGTGACCTCACCGATGGTGGCCA
+CGGCGTGGGCGTGTTGGGTCAAGCCCATAGCCCAGCAGATGACCGTGCGCTGCGACGCCATCAACATCGC
+GGCGACCCGCTGAAGTTGCGCGAGTTCGATGCCGGTGGCGTCCATCACGGTGTCCAAGCCGACCTGCAGA
+GTCCGGCGGCGGTACCCGTCGAATCCGGCACAATGGTTGTCGACGAACGACCGGTCGACAACGCTGCCGG
+GGACCCTCTCCTCGGCCTCCAACAACAACCTGCCTAACCCGGCGAACAATGCCATGTCCCCGCCGAGGCG
+GATCTGCACGAACTCGTCGGCGATCGGGATACCATGTCCCACAACCCCGTTCACCTTCTGCGGATCTTTG
+AACCGAATCAACCCGGCCTCGGGCAGCGGGTTCACGGCGATGATCTTGGCGCCGTTGGCCTTCGCTTTCC
+CCAGCACCGACAGCATGCGGGGATGATTGGTACCGGGGTTTTGTCCGGCGATCACGATCAGGTCGGCGTG
+CTCGACGTCACCGATGGTCACCGAGCCTTTTCCGATTCCGATCGAGTCGGTCAGCGCCGCACCCGAGGAC
+TCGTGGCACATGTTGGAGCAGTCGGGCAGGTTGTTGGTGCCGAAAGAGCGCACGAGCAGCTGGTAACAGA
+ACGCCGCTTCGTTGCTGGTGCGCCCCGATGTGTAGAACACGGCCCGGTCGGGACTGTCCAACCCGTTGAG
+CTGCTCGGCGATCAGCTGATAAGCGGCATCCCAGCTGATGGGCCGGTAGTGGTCATCACCGGGGCGCAAG
+ACCATCGGGTGGGCGAGCCGGCCTTGCTGGGACAGCCAATATTCGGGCTTCGCGGACAGCTCCGCCACCG
+AGTGCCGAGCGAAGAACTCCGCAGTGACGGTACGCTTGGTGGCCTCTTCGGCGACTGCCTTGGCGCCGTT
+CTCGCAGAACTCGGCCAGCTTGCGTCCGCCGGGCTCCTCCGGCCACGCGCAGCCTGGGCAGTCGAAGCCG
+TTACGCTGATTCAACCGAGCCAGCGCCGCCGCGGTGCGCAGCGCGCCCATCTGCTGCATCCCCCGCTGCA
+GCGATACCATCACCGCCCGCACGCCCGCGGCCTCGCGTTTGCGCGGCGCCACCGTTACCGCCTGCTCGTC
+ATAGTCGGCGAGGACGTCGCGAGACGCCGCCGACCGCTGCCACCTCACCGCCTCAACGTACATCCACGAC
+CGACCGACTGCCGCACACAGCCGATTGACGTGTGACGGCGCTTGGGGCAGCTATTCCGGCAGGCGCAGCT
+CGGGTTTTTCGACTTCCTCGATGTTGACGTCCTTGAACGTGACCACCCGCACCTGTTTGACGAACCGTGC
+CGGCCGGTACATGTCCCACACCCAGGCGTCAGCCAGCCGCAGCTCGAAGTACACCTCACCGTCGGTATTC
+CGCGGCACCATCTCCACACTGTTTGCCAAATAGAAACGTCGCTCGGTTTCTACGACGTAGCTGAACTGGC
+CGACGATGTCCTTGTATTCGCGATACAGCGAGAGCTCCATCTCGGTTTCATACTTTTCGAGATCCTCTGC
+ACTCATCTGCTCAGACGTCCTTCTCCCTGCCGGTTCCCCGGCTTCCCCGCTCAGTGCCCCTAAGTGCCCT
+GAGCGCGACCCGTGGCCCGCATTGTCGCTGGGTGGGAACTCTTGCTCCATCTTCCCTCACCCGTCTGTGC
+CGTCCCGTCCCGAGGGTCGGGTTGGCCGTCGGCGACCTCTGCGGTGTTCGACCCACTCGCCACCCGGCGA
+ACATTGATGAACGAGTAACGGTGCTGCGGGCAGGGTCCCAATCGGGCCAGCGCCCGGCTGTGCGCCGGGG
+TGCTGTAACCCTTGTGCTCCGCGAAACCGTACCCGGGGTGATCGGCGTCCAACGCAACCATCACGCGGTC
+CCGGCTGACCTTGGCGAGCACGCTAGCCGCGGCGATGCAGGCGGCTGCCGCGTCGCCACCGATCACCGGC
+AACGACGGCATCGGCAGTCCTGGCACGCGAAAGCCGTCGCTGAGCACATAACCGGGCCGCACCGCCAGAC
+CGGCCACCGCGCGCCGCATACCTTCGATATTGGCCACGTGCACGCCGTGGCGGTCGACCTCGGCCGACGG
+GATGAACACCACGTGATAGGCCACCGCATACCGGCAGATCAGCGGGAACAGCTTCTCCCGCGCTTGCTCG
+CTGAGCTTCTTCGAATCATCAAGGGCGGCAAGACTTGCTATCCGCCCGGGGCCAAGCACGCAGGCCGCGA
+CCACCAACGGGCCAGCGCAGGCGCCGCGACCCACTTCGTCGACCCCGGCCACCGGCCCCAGACCACCACG
+ATGCAGCGCGGACTCCAGGGTGCGCATTCCCCGCAAACCCCCAGATTTACGGATCACCGTCCGCGGTGGC
+CAGGTCTTGGTCATATTCCAGCCATGGCTACCGACCTTGCTGGGGATTCACCGAACGCACAACACCCCAA
+CGCGACGGCGGCCACACGATCAACCTGGCCTTACCGATGACGTTGGCCACCGGCACGGTCCCCGGTAGCG
+GATCGTTAGTACATAGCAACGGGCAGTGAGCGCGGGAATCCGCCGAATGGGTGCGGTTGTCGCCCATCAC
+CCAGACACGCCCGGGCGGGACGGTGACCGGCCCGAACTCGCTGCCCAGGCACGGGTATATCGACGGGTCG
+GCCATCATGGTGGCCGGATCCAGGTATGGCTCCTTCAGTGGCCTGCCGTTGACCGTCAGGCCGGTGTCGG
+ACCGGCATTGAACCGTCTGTCCGCCGACCGCGATGACACGCTTGACCAGGTCGTTCTCGTCGGGAGGCAC
+GAAACCGATGAACGACAACGCGTTCTGCACCCAGCGCACGGCGACGTTGTGCGAACGGATCGACTTGTAA
+CCAACGTTCCACGACGGCGGTCCCCTGAAGACGATGACGTCGCCAGGTTGCGGTGAGCCGAAGCGGTAGC
+TGAGTTTGTCCACCATGATGCGGTCGCCGACGCACGTCGAACACCCGTGCAACGTGGGTTCCATCGATTC
+CGACGGAATCAGATAAGGGCGCGCGACAAACGTCAGCATGACGTAGTAGAGCACCACAGCAATCACCGCC
+AGCACCGCGAACTCCCGCAGCGTTGATCGCTTCGCGGGCCGCGGCTCGTCCGTTTTGGCCGCCTTGGAGT
+CGCCTTCGGAGTCCGCATCCGGGGCTGCGTCGAACGGGGCTGCGTCGAAGACCTGGCCGGCAATGTCCGG
+GTCCCGGGAGGAGAGCTCCGGCTCTGCCGGACCCGGCTGGCGCTCCGATGGGGAGTCCGTGGTTTCGGTC
+ACGAGATCAGCGTAGCCAGCGCAGGTGGCGGCTTTCGAACATCGCCGAGACGTTCCCGGTCAGCGCTTCT
+CCTTGATCTTGGCCTTCTTTCCGCGCAGTTCGCGCAGGTAGTACAGCTTGGCGCGGCGAACATCGCCACG
+GGTCACCACCTCGATATGGTCGATGTTCGGCGAGTGCACGGGGAAGGTCCGTTCGACGCCGACGCCGTAG
+CTCTCCTTGCGCACCGTGAACGTCTCGCGGATGCCCCCGCCCTGCCGGCGGATCACCACGCCCTTGAACA
+CCTGGAGACGTTCCTTGGCGCCCTCGATCACCTTGACATGCACGTTGATGGTGTCGCCCGGGTTGAACGC
+CGGGATGTCGTCGCGCAACGACGGCTTGTCGACGAAGTCCAGCCGGTTCATTGGAAATGACCATCCTTGG
+GGTCGCGGCGTGGTTACCCCCCACACGCAGCGTGCGGTGGTCACCAAGCCGGTGGGTTCGGGCTTATTGG
+TGCATCTCGCAGCAGGCGGCACGCAACCCGGCCGACCACCGCGACAGACAACTGCTCAATTGTGCCAGAC
+GGTACGCATGCAGTGAAATCACAGGAAATCTCCGGTGGTTCGCGGCCGTCGAAAAGCGCCCGCAAATGGT
+ACACATGACTTACATATGACTAGGGTCAAACCGCGCGTGTGGAAACCCGAAGCTTGGCGTGACACCCAAC
+AGAGGGCACTTAAGAGGGCAATGCGGCCGCCTACCTGCACGTTTTCGCGATGTCAGAGGATGCCGAGGGA
+GAACAATGCGAGCACGGCCGCTGACGTTGCTCACCGCTTTGGCGGCGGTGACATTGGTGGTGGTTGCGGG
+CTGCGAGGCCCGAGTCGAGGCCGAAGCATATAGCGCGGCCGACCGCATTTCGTCTCGACCGCAAGCGCGA
+CCTCAGCCGCAGCCGGTGGAGCTACTGCTGCGCGCCATCACGCCGCCTAGGGCTCCGGCGGCGTCGCCGA
+ACGTCGGGTTTGGCGAACTGCCTACCCGGGTCCGGCAGGCAACCGATGAGGCCGCCGCCATGGGCGCCAC
+CCTCTCGGTGGCGGTGCTCGATCGCGCTACTGGCCAGCTGGTCTCCAACGGCAACACGCAGATTATCGCT
+ACCGCGTCGGTGGCCAAGCTGTTCATCGCCGACGATCTGCTGCTGGCCGAGGCCGAGGGCAAAGTCACAT
+TGTCCCCAGAGGACCATCATGCGTTGGACGTCATGCTGCAGTCATCCGACGATGGTGCGGCCGAGCGATT
+CTGGAGTCAGGACGGCGGCAATGCCGTCGTCACTCAAGTCGCGCGCCGATATGGGCTCAGGTCGACCGCG
+CCTCCCAGCGACGGGCGCTGGTGGAACACAATCAGCTCCGCGCCAGACCTGATCCGCTACTACGACATGC
+TGCTCGACGGGTCCGGCGGCCTACCACTGGATCGGGCCGCCGTCATCATCGCCGACCTGGCCCAGTCCAC
+ACCGACCGGGATCGACGGCTACCCGCAGCGGTTCGGCATCCCCGACGGTTTGTACGCCGAACCGGTCGCA
+GTCAAACAGGGCTGGATGTGCTGTATCGGCAGCAGCTGGATGCATCTGTCCACCGGGGTGATCGGCCCGG
+AACGCCGCTACATCATGGTGATCGAGTCACTGCAGCCCGCCGACGACGCCACCGCTCGAGCAACCATCAC
+GCAAGCCGTCAGAACGATGTTTCCCAACGGCCGGATCTGACGCTCGTCCGGTCGCCTCACCGGCGCGAGC
+AGACGCAAAAGCCACCGCACGTTCGGCGTGTCGGGGGATTTCGCGTCTGCTCGCCAGCGGGGCTAGTCGG
+GGTGGGACAGGTCGGGGCGTCGTTCGCGGGTGCGCTGCAGCGAGACCTCTCTGCGCCAGGCGGCAATTCG
+GGCATGGTCGCCGGAGAGTAGGACCTCGGGTACATCGAGGCCACGCCAGCTCGCCGGCCGGGTGTAGCTC
+GGACCCTCAAGGAGCCCGTCCAGGCCCGTTGAGTGCGAATCATCTTGGTGGGAAGCGGGATTGCCGAGAA
+CACCGGCCAACAGTCGCAGCACGGCTTCGACCATCACCACGGCCGCCGACTCCCCGCCGGGCAATACGTA
+GTCGCCGATCGAGACTTCTTCGACGCGCATTCGCCGGGCGGCATCCTGCACGACCCGCTGGTCGATGCCT
+TCGTAGCGGCCGCAGGCGAACACCAGATGGCTCTCGGTGGTCCAGCGCTGGGCGGTGGCCTGGGTAAACA
+ACACACCGGCGGGCGTGGGAACAATCAACAACGTTTCGCTGGAACAAATTTCGTCAAGCGCTTCACCCCA
+CACCGGCGCCTTCATCACCATTCCCGGGCCGCCGCCGTAGGGTGCGTCGTCCACCGAGTGATGCACATCG
+TGGGTCCAGCGCCGCAGGTCGTGCACGTTAAGGTCGACCAGGCCCGATTCGATCGCCTTGCCCGGCAACG
+ACTGTCGCAACGGGTCCAGGCAGGCGGGGAAGATCGTCACGATATCGATGCGCACGCCTTACTCCAGATT
+CAGCAAGCCATGGGGCGGATCAATCTCAACGATGCCGTCGTCCAATGACACCGACGTGACGATGGCACGC
+ACAAACGGCACCAAAACCTCATCGGAATCACGCTTGACCGCCAGCAACTCACCAGCGGCGGTGTGCACCA
+CTTCGGTGACGACACCAACACCCTCCCCCGTCGCCGTCTGGACCATAAGCCCCACCAGCTGGTGATCGTA
+ATAGGTGTCCGGCTCGTCGATCGGGGGCAAGTCATCGGCGTCGATCACGAACAAGCTGCCGCGCAACGCA
+TCGGCTGCGTCTCGATCGGCCACTCCAGCGAGTCGCACCAACAGGCGGCCGCCGTGCTGCCGCACACTTT
+CGATGACGTAACTCACCGCACTGCCCTCGGCACCACCGTCAAAAGGCCCCTTAGCGCGCAACCTGGTACC
+CGGCGCAAACCGGTCAGCTGGGTCGTCGGTGCGGATCTCGACGACGACCTCGCCGGTGACACCGTGCGAC
+TTCACCACCCGCCCGACTACCAGCTCCATGAGCGGGGCTCCGCTACTGGTCGGTGTCCACCACGTCGACG
+CGGATACCGCGGCCACCGATACCGGCTACCAGAGTGCGCAATGCGGTAGCGGTGCGTCCCCCACGACCGA
+TCACCTTGCCCAGGTCGTCTGGATGAACGTGGACTTCGACGGTGCGCCCCCGCCGACTGGTTATCAGGTC
+TACCCGGACATCGTCAGGATTGTCGACGATCCCACGGACCAGATGCTCAACAGCGTCAACGACGACGGCG
+CTCATTTCCCCGTCAGCTTTCCGCCGTCAGCTCGGCCTGCTCGCCACCCAGCGCCGGCGTGTCCGGCTGC
+TCAGGCTGCGGCGCTGGCTCAGCAGCCTTGGCAGCCTTTTTGGCCGGCGACTTCTTCTTCGGTTTGGTGG
+CCTCGGTGGTAGGACCACCGTCGGCGGCGGCCAACGCGGCGTTGAACACCTCGAGCTTGCTGGGCTTGGG
+TGCGGCGACCTTCAACCGGCCCTGAGCGCCAGGTAGGCCCTTAAACTTCTGCCAATCCCCGGTGATCTTC
+AGCAGCTTGAGGACGGGCTCGGTGGGCTGAGCACCCACCGAGAGCCAGTACTGGGCACGCTCGGAGTTGA
+TCTCGATGAGACTCGGCTCTTCTTTGGGGTGGTACCGGCCGATTACCTCGATCGCTCGGCCGTCGCGGCG
+GGTGCGCGCATCGGCGACGGCGACGCGGTACTGAGGATTGCGGATCTTGCCAAGCCGAGTGAGCTTGATC
+TTCACAGCCATGATTGAGCGCTCCTATTGGTGTCACGCTGCAATTCAGCGACCCGGGCGGGATGCCCGGA
+TCCGGTTTTGCCTCGCGTGTATGACCACCGGGCGGCAACCCCGAACAGGACAAGTCGTCGCGCGGTGGAC
+AGCCGCCAATTGTGCCAGAACGTGATGCTGGGGCAGTAATTCGCCCAGCGGGCTTCACATCATTTTCTGG
+AAGCACTTGGTTTCGACCCGCCTGATGATCCGCCAGCCATCGGGGGTGCGCACGAAATCGTCGTCGTACC
+ACAGTCCACAGAACAGCACTTGCTGCCGGTCGCCGGCGAACACCATCGGGTTGAAGCAGATCACCCGCGA
+CGACGCGGTATCGCCGTCGACACGGACCGAGAAGTTGCCCAACATGTGCGCATATACCGGGAAGTTTCCC
+AGCACCTGCGACAGCCATTGCTTGATCTTCGGATACCTGCCGTCGATGCCACCTAGCGCGCGATAGTCGA
+TATAGGCGTCGGGGGTGAACACCCGGTCAAGATCGTCGAATCGGCGCTGGTCAATCGCGCTGGAGTAGTC
+CACCAGCAACTGCTGGATTTCCAACCGGTCGGAAATTTCGGCCACGCTCAACATGCTCCGATCCAACACC
+GCACACATCGGCCGGACAGCCCCCGACCAGCCCGAGAATAGGCCTACCGGAGCCCTGGAAGTTAAACTCT
+GCGCCCATGCGAAAGCTCATGACCGCGACCGCCGCGCTCTGTGCCTGCGCAGTCACCGTCAGTGCGGGTG
+CCGCGTGGGCCGATGCCGACGTGCAGCCGGCCGGCTCCGTGCCGATCCCCGATGGCCCGGCTCAGACCTG
+GATCGTGGCCGACCTCGATAGCGGTCAGGTGCTAGCCGGCCGCGACCAAAACGTGGCCCATCCGCCCGCG
+AGCACCATCAAGGTGCTGTTGGCGCTGGTGGCACTCGACGAGCTGGACCTGAACTCCACGGTCGTCGCCG
+ACGTCGCCGACACACAGGCCGAGTGCAACTGCGTCGGCGTCAAACCGGGGCGCAGCTACACCGCGCGCCA
+GCTGCTCGACGGCCTGTTGCTGGTGTCGGGCAACGACGCCGCCAACACGTTGGCGCACATGCTGGGTGGC
+CAAGACGTCACCGTGGCCAAGATGAACGCCAAAGCCGCCACCCTAGGTGCGACGTCCACCCACGCGACGA
+CGCCGTCCGGCCTAGACGGACCCGGCGGCTCCGGGGCGTCCACCGCGCACGACCTGGTGGTCATCTTCCG
+GGCCGCGATGGCCAATCCGGTGTTCGCGCAGATCACCGCCGAGCCCTCGGCGATGTTCCCCAGCGATAAC
+GGCGAACAGCTGATCGTCAACCAGGACGAGCTGCTGCAGCGGTACCCGGGCGCGATCGGCGGCAAGACGG
+GCTACACCAACGCCGCTCGCAAGACGTTCGTGGGTGCCGCCGCCCGCGGCGGCCGCCGCCTGGTGATCGC
+CATGATGTACGGGCTGGTCAAAGAGGGCGGACCGACGTATTGGGATCAGGCTGCGACCCTGTTCGACTGG
+GGTTTCGCCCTCAACCCGCAGGCCAGCGTCGGCTCGCTCTAGCACCGCGAGCAGACGTGGGCGCTGGTGC
+GCCCATCATGTTCTTTTGCGTCTGCTGGCGCTCATAGGCCGGCGGTCAGCAGCGCCGTCAGCATGGGAAT
+CCGCTGTTCCTCGAGTTCGGGCTGCGGCAGTACCCCTCGCACAATGGCGGCGCCGTCGAAGACGTTGGTC
+ATCAACGCCACGATGACCGGAAATGTCTCCTCCGGAAAGCTCTCGGCACCCGGCAGAGCACGCGCGGCGT
+CGTGGATCTTCGCGCTGTACTGCCCCAGCACATTCTGCAGCGTCTCCTTGAGCTTCTCGTCGGTGCGCGC
+GGCGACCATAAGCTCGTAGAGCACCGCATTCGTGGAGCCGGCCGTGATGTCCCGCAAAATCGTCAGCGCC
+GCCGGAAGCGCCGGCCGATCGGCCGGTATTTCGGCGACTTGCTTGGTGAACGTTTCCAGCTGACGGCGCA
+ACACCTCGTATGCCGTGGCCGCCATGAAATCACCCATCGTTTCGAAGTGCCGGAACAGGGCGCCTACCGA
+CACCCCAGCCCGCTTGGTGATCACGGCAGCCGATGCCCGCGCGTAGCCGACCTCGATGATCGTGTCGATG
+CTGGCCTGCAGAAGCCGTGCAACGGTTTCTTCGCGGCGCTGCTGCTGGGTCCTGGCCATGTCAGGCAGAA
+CGGCTCAGAGCGGCGCCGAGCTCACCCGCCCGCAGGTAGCGACCCGACTTCACGTTCTGCCCGTAGCCGT
+CGCGGAACTGACCTCCGAACTGGCCTCCGCGGAATACCACGGTGCCGCCCACGCCCGTCGCAACCACGGT
+CGCATCGTTGCGGTTGACCATGCGTCGCAGACCGCCATAGTAGGGCACCGCCTCCTCGTGGTACCCGTCC
+ACCGATTCATCTAGGTGGGTAGGGTCAATCACCGCGAAGTCCGCACGGTCACCCTGGCGCAACGTGCCCG
+CGCCTATACCGAACCACTCGGCCAACTCACCGGTGAGGCGATACACTGCCCGCTCGATGGACAGAAACGG
+TTGTCCGGCCCGGTCGGCGTCTCTGGCTCGTTTGAGCAGCCGAAGCCCGAAGTTGTAGAACGCCATATTG
+CGCAGGTGCGCGCCGGCGTCGGAGAAGCCCATGTGGACACTCGGTTCGGCGGCCAGCTTGTTCAGCTGGT
+TGGGCCGGTGATTGGCGACGATGGTGGTCCATCGGACATTGCGCTCCCCGTTGTCCACCAGCACATCGAG
+GAACGCGTCCAGCGGGTGCAGCCCGCGCTCGTCGGCTATTGCCCCGAAACTCTTACCGATCAACGACTTA
+TCCGGGCATTCGACGATCACGGCGTCGTGGAAGTCCCGATGCCACAACGAAGGTCCGAGCTTGATGCGAT
+CGAACTCGCGCCGGAACGACCGGCGGTAAGACCTGTCGGCCAGGAGCTCGTTGCGCTGCAGTTGGTCACG
+CAGATGAAGGGCCGCCGTTCCGGCGCCGAACTCCTCGAAGACCGGCAGGTCGATGCCGTCGGAGTACAGC
+TCGAACGGGACCGGCAGATGCTGGAATCGCACCTGAGAGCCTAAGAGCTTGTTCAGCACGCGGGTGCCCA
+ACCCGAACACGTGTACCGCCAGCGGCATCGACTTGGCGTCGGCGGACACCAACATGCTCATTCGAACGCC
+CTTGCGCCGGTTGAATATCCGGCTGCTGGCCAAGAAAAACAGCAGCGCGGACACCGGGTTGTCGACGTCG
+GGTGCGCTCTGCAGTATCCGGCCCCGGTGGCGCAGCACCGAGATCAGCTTGCGACGCTCCCGCCAGGTCG
+CGAAGGTGGACGGCAGCGCACGCGAGCGGAAGCGGTCGCCGTCGAGCTTGTCGATAGCGGCGTCCATCCC
+GGACATGCCCAGCATCCCGGCCTCGAGCGCCTCATCGAGCAGTTTCGCCATCTTCGCCAGCTCGGCTTCG
+GTGGGCCGGACGGTGTCGTCGGTGGCACGATCAAGGCCCAGTACCGCGGTCCGCAGATCCGAATGGCCAA
+GCAGTGAACTCACATTCGGCCCGAGGGGCAGGGCGTCGATCGCTTCGATGTACTCCGCGGGCGTCGACCA
+CGTCTGGTTGTCCCGCAGGGCACCCAGGACAAATTCGCGGGGCACCGCTTCAACACGGCTGAACAGGTCG
+GCGGCATCCTCGGAGTTGGCGTAGACCGTCGACAACGAGCAGTTTCCCAGCAGCACCGTGGTGACACCGT
+GGCGCACCGACTCCCGCAAACCAGGATCGAGCAACACCTCGGCGTCATAGTGGGTGTGCACGTCGATGAA
+GCCAGGCACGACCCACTTCCCCGCCGCATCAACCACCTCCGGGCAGCCGGTCTCGTCCAGTGCGCCGGCA
+GCCACCGTGGCCACCACGCCGTCGCGAATGCCCAGAGTGCGAGTCAATGGCGCATTGCCGGTGCCGTCGA
+ACCACAGTCCGTCGCGAATGATCACGTCGTAGGTCACCGTTTCCTCCAGATCGTTGAGTTGCCGCCAAGC
+TAACATAGATAGCGATCACTCGCAATCTTTTTGGCTGACGCCGCTTCGCTGCCGCGGCGCTGGTCAAGTG
+GGTGTCAGCGACCGGGCCCCGGCGCCGTTGTGGTCGGCGGCGTCAGGGTGGCTGTGGACGTTGTATCGGG
+GGTATCAGGAATCGTTGCTGGGTCCGGCACGGTGACTGCCGGGGGAAGATCACCACTGCGGCTGGCCACC
+GCGGGAATCCGAATGACCGCTCCTTGTTGTCCACATTCGTTGCTATGCACAGTGACGACCATTTCGCCGA
+CGAGGTCGCCCTGCGGTTGCGGTCGCAGTGCGAGCAACTGCGTCGTGGCCTGTGTACTCGGCGAGCCGTT
+GGGCCCGACGCACGGGAACTGCACCGTCTCCGGCCGCGACTTCCACTGGCCCTCGCCGAACTGCATGAGG
+AACGGCCTAACGGGCGGAGTCTTGGCCTGGGTGTGGTCGTTGTCGTCGAGCATCGTTGCGGCCGCGAGAC
+ATTCGGTCGGAGTGCACGAAGTGCGGAACGCCCACCAGGTGTTCACGTCCGGCGGTTGCGGCGTAGGGGT
+GTAGTCGTAGGTCTGCTTTGAGCGTTGGATCTCGATGCGGTATGTGCCGTCCAGTGGGACCGGCGCGGTG
+ACCGCGACGGTGGTCGTCGGGGCGCTGGGCACAGCCGACCCACTGGTCGGCGGGCGCGCGACTTCGGTGG
+CGGTCGTGTTCGTCTTGCGCCCAATCACGATGCCGACCGCGAACAGGCCAGCCAATAGCAACACCGCTAC
+CGCACCGACCAGGATCCGGCGTGGCCGGCGCCTGGTGGGGCTCGCCGGAGCCTTGGTGGCGGTGGAGAAG
+TTGTCCAGGCGGCGCGCCAGCACCCCGGCCGCTGACTGCAGCATCGAGCCGCGCCGTTGGGGGGTCGGGG
+CCGCCGGCGCCGGTGCCCGGGCGGATGGTTCTTTGCAGTCGACGGCCTCGGGCCAACCATAAGCCGGGTA
+GTCGACGACATACGCTTCCTCACCGGCCGCCGCGGTGACCTCAGAAGCGTCGACACCCCCCGAGCTCTGA
+TCAGCGATCGCGACGCCGGCCTGTTCGTTCATCGCGTCGGCGAACTCGCGGCAGCTGCCGAACCGGTCCG
+CGGGCGCTGTGGCGAGCGCACGCGAGAGGACACCGTCGAGGCGTGCCAGGTCCGGGCGGAAGGCGGAGAG
+CTTCGGTGGCTGCAGCGGTCCGGTGTGCGAACGATCAACCGGCGGCGCACCGGCGAACAGGTGTATGGCG
+GTAAGCGCCAACGCGTACTGATCGGCACGCCCGTCAACGTCGGCCCCCGCCGACAGTTCGGGCGCCGGAT
+AGCTGGGTTGGCTGGCAATTCCGAAGTCGGCCAACAGGATCCGTTGGTCGCCAGCACTCTGACTGGTTAG
+CACGACGTTGGCGGGGTTGACGTCACGATGCAGCAGGCCGCGCTGGTGGGCGTAGTCGAGAGCTCCGGCT
+ACGGCAGTGACGATGGCGAGTACCTCACCAACCGGCAAGACCGCCGGAAACCGGTCGGCCATATGCTGCG
+TGGCGTCGATGCCATCGACGTAGTCCATCGCAATCCACAGCTGCCCGTCGAACTCACCGCGATCATGAAC
+TTCCAGGATGTGCGGGTGAAATAGCCGCGCGGCAACCTCGGTCTCCCGTTGAAATCGGCGGCGAAATTCG
+TCGTCCGCAGCCATCGCCGGCGAAAGCACCTTCAGCGCCTGCCAGCCGGGGAATCCGGGATGTTGCACGA
+GGTAGACCTCACCCATCGCGGAACAACCCAGCATCCGCACGACGGTGTAGCCGGCAAAGGTCACGCCGCT
+GGCCAACGCCATTGGCCGATAGTAACCGCGTTCGGCACGGCCCGCGCGGCCAAAGCTAGGGCCCAAAAGT
+CCTGCCGCGCAAAATCACCAGATCGGGATGCTGCAGCACACCCGGACCCTGCCGCGGATCCTGGGCGTAG
+CACAACAGGTCGGCCGATGCCCTATCGTCCAGCCCGGGCCGGCCCAGCCAGCGTCGAGCATCCCAGCACG
+CCGCGCCCAACGCCTCGTGCGCGGTCATCCCAATCCTCTGCAGCGCCGCTACCTCGTCAGCGATCCGTCC
+GTGCTCGATCGTGCTGCCCGCATCGGTGCCCGCGTATACCGGCACCCCCGCCTCCCGCGCCGCAGCGACC
+CGCCCATAGCCGCGGGCATACAGGTCGCGCATGTGCGCGGCATAGGTTGGATAGCGCCCTGCCGCATCGG
+CAATGCCCGGAAAGTTTTCCAGGTTGATCAGCGTGGGGACCAACGCGGTGCCGTGCTCGAGCATCAAGGC
+GATGGTGTCGTCGGTGAGGCCGGTGCCGTGCTCGATGCAGTCGATGCCGGCGTTGATCAAGCCGGGCAGC
+GCGTCCTCGCTGAAAACGTGCGCGGTGACCCGGGCGCCCTGAGCGTGTGCCGTGTCGATGGCGGCTTTGA
+GCACGTCATCGGACCACAACGGGGCAAGATCGCCGATTTGACGGTCGATCCAGTCACCGACCAGCTTGAC
+CCAGCCGTCACCGCGGCGGGCCTGCTCGGCTACCGCTGCCGGCAGCTGGGATTCGTCTTCGAGCTCGACC
+GCGAAGCCGGCGATGTAACGCTTGGGTCTGGCCAGGTGCCGTCCGGCGCGGATGATGCGGGGCAGGTCTT
+CGTGGTCGTCAAGGCCGCGGGTGTCGGTCGGCGAGCCGCAGTCCCGCAACAGCAGCGCGCCGACGTCACG
+TTCGGTCTCGGCCTGAGCGATCGCCTCGTCGAGTTCGACGTTGCCGTGTTTCCCAAGCCCGACATGGCAG
+TGCGCGTCGACCAGCCCGGGCAGGATCCAGCCGCCGTCAAAGACGGTGTCGGCTCCTGCCACCGGTTCGG
+TGCTAATGCGGCCGTCGACGATCCACAGTTGGATCGCCGTCTCGTCGGGCAGGCCCAAACCTCGCACGTG
+CAGGCGCACGGCGCGGCTACGGGGCCTGATGGTGTCGACCCGCTTCACCCGGCTCCGCCGCACTCGCGAT
+CGCCACTACTTCTTGCCTGGGAACTTCAGCTTGGACAGGTCGAAGTCGGCCAGGCCGGGCGGCAGCTCGT
+CGAGACCTTTGGGCATCTGTGAGAGATCAGGGAGCCCCCCAGGTAGCCCAGCCAAGCCCGGCATCCCGGG
+CACGCCGAACGGGCTCTTGACCTTCGGCGGCGTCGGACCGCGCGTCCCCTTCTTACTCTTCTTGCCGGAT
+TTGCCTTTTGCGCCCTTGCTCTTTCGCGTCGCGGATTTGCGCCCTATGCCCGGTATGCCCATGCCCCCGA
+GCATGGACGACATCATCTTGCGGGCTTCGAAGAAGCGCTCGACCAGCTGGTTGACCTCGGACACCGTGAC
+GCCCGAGCCGTTGGCGATGCGCAGCCGCCGCGAGGCATTGATGATCTTGGGGTCTGCCCGTTCCTGCGGC
+GTCATGCCGCGAATGATGGCCTGGACACGATCGAGTTGTTTGTCGTCGACCTCGGCCAACGCGTCCTTCA
+TCTGAGCCGCGCCGGGCAGCATGCCCAGCAGGTTGCCGATCGGGCCCATCTTGCGTACCGCGAGCATCTG
+CTCGAGGAAGTCCTCCAGGGTCAGCTCGCCGGCGCCGATCTTGGCTGCGGCCTCCTCGGCCTGTTGTGCA
+TCGAAGACCTGCTCGGCCTGTTCGATCAGGCTCAGCACATCGCCCATGCCCAAGATGCGACTGGCCATCC
+GGTCCGGGTGGAAGACGTCGAAGTCCTCCAGCTTCTCCCCGGTGGAGGCGAAAAGGATTGGAACACCGGT
+CACTTCGCGCACCGATAACGCGGCACCACCGCGGGCGTCACCGTCGAGCTTGGTCAAGGCCACACCGGTG
+AACCCGACGCCCTCGCCGAACGCCGCAGCGGTGGTGACCGCGTCCTGGCCGATCATCGCGTCCAGGACGA
+ACAGCACCTCGTCGGGGTTGATGGCGTCGCGGATGGCCGCGGCCTGGGCCATCAGCTCCTCGTCGATGCC
+CAGTCGTCCGGCGGTGTCGACGATGACGACGTCGAAGTGCTTGGCCCGGGCCTCGGCCAGCCCGGCCGCC
+GCCACCGCAACCGGGTCACCGGGGCCGGACTCCGGCGAGGCACCCGGATGCGGCGCGAACACCGGCACTC
+CGGCACGCTCGCCGACGACCTGCAGCTGGTTCACCGCGGCCGGCCGTTGCAGGTCACAAGCGACCAGCAG
+TGGCGTGTGTCCTTGTCCACGCAGGCGGGCGGCCAATTTGCCGGCCAGTGTCGTCTTCCCGGAGCCCTGC
+AGGCCGGCGAGCATCACGACGGTCGGCGGGGTCTTCGCAAACGCCAACTCGCGGGTTTCGCCGCCGAGGA
+TGCTTATCAGTTCCTCGTTGACGATCTTGACGACCTGTTGAGCCGGGTTGAGGGCACTTGACACCTCGGC
+CCCGCGGGCGCGTTCTTTGATCCGGTGGATGAATGCCCGGACCACCGGTAGCGAAACATCGGCTTCCAGC
+AGCGCCAACCGAATTTCGCGGGTAGTGGCATCGATATCGGCATCGGTCAGTCGGCCCTTGCCGCGCAGCC
+CCTGCAGGGCGGCGGTCAAACGGTCAGACAGCGATTCAAACACGCCCGCCAGCCTAATGGTGATCGCGAG
+CGCCGCGCAGCGGCACCGTTATCCGTTGACTCTGCGTCCACCACGCAAAAGTGCGAGTAACCCGCCTGGT
+GGACGCAGAGTCAACACGATGCGACGTCGGACCTGCGCCGAAAAGCGTTGCCATGCTACATTTCACCGCC
+GCCACCTCACGGTTCCGGCTGGGGAGGGAGCGGGCAAATTCGGTCCGTAGCGACGGGGGGTGGGGAGTCT
+TGCAGCCGGTCAGCGCGACCTTCAACCCTCCGTTGCGGGGTTGGCAGCGCCGGGCGCTGGTGCAGTACCT
+GGGCACCCAGCCGCGGGATTTCCTCGCGGTGGCCACTCCCGGATCTGGCAAGACATCGTTCGCGCTGCGG
+ATCGCAGCCGAACTACTCCGTTACCACACTGTCGAGCAGGTCACCGTCGTCGTGCCCACAGAGCACCTCA
+AGGTGCAGTGGGCGCATGCTGCGGCAGCACACGGCCTTTCCCTTGACCCAAAGTTCGCCAACTCCAATCC
+GCAGACCTCACCGGAGTATCACGGCGTAATGGTCACCTACGCCCAGGTCGCTTCGCATCCCACGCTGCAC
+CGAGTGCGTACCGAAGCGCGCAAGACGTTGGTGGTCTTCGACGAGATCCACCACGGCGGCGACGCCAAGA
+CCTGGGGAGACGCCATCCGGGAAGCTTTCGGTGACGCCACCCGCCGCCTTGCCCTGACGGGTACACCGTT
+TCGCAGCGACGACAGCCCAATCCCGTTCGTCAGCTACCAGCCCGACGCGGATGGCGTGCTGCGTTCTCAG
+GCTGACCACACCTACGGCTATGCGGAAGCCCTCGCTGACGGTGTCGTCCGGCCGGTGGTCTTCCTCGCCT
+ATTCGGGGCAGGCGCGCTGGCGGGACAGCGCCGGCGAGGAGTACGAGGCGCGACTGGGCGAGCCGCTGTC
+TGCCGAGCAGACCGCGCGGGCGTGGCGCACAGCGCTCGACCCGGAAGGCGAGTGGATGCCGGCGGTGATC
+ACGGCGGCCGATCGACGGCTCCGACAACTGCGTGCGCACGTACCCGACGCGGGCGGCATGATCATCGCCT
+CGGATCGCACCACGGCCCGCGCTTATGCCCGCCTGCTCACCACGATGACGGCCGAAGAGCCCACGGTCGT
+GCTCTCCGACGACCCCGGATCGTCGGCGCGTATCACGGAATTTGCCCAGGGCACCAGCCGTTGGCTGGTC
+GCGGTCCGCATGGTCTCCGAAGGTGTCGACGTGCCCCGGCTTTCGGTCGGGGTTTACGCCACCAACGCCT
+CCACGCCGCTGTTCTTCGCACAGGCCATCGGTCGGTTCGTGAGGTCCCGCCGACCGGGTGAAACCGCGAG
+CATCTTCGTGCCGTCGGTGCCTAACCTGCTGCAGCTGGCCAGTGCGTTGGAGGTGCAGCGTAACCACGTG
+CTGGGCCGACCGCACCGCGAATCGGCCCACGATCCCCTCGATGGTGATCCCGCCACCAGGACGCAAACCG
+AGCGGGGCGGCGCGGAGCGGGGCTTTACCGCGTTGGGGGCCGATGCGGAACTCGATCAGGTCATCTTCGA
+CGGTTCCTCGTTCGGCACCGCCACCCCAACCGGGAGCGACGAGGAGGCCGACTACCTAGGCATCCCCGGG
+CTGCTCGATGCCGAGCAGATGCGCGCCCTGCTGCACCGCCGCCAAGACGAGCAGCTGAGGAAACGGGCTC
+AGCTTCAGAAAGGGGCCACCCAGCCAGCAACGTCGGGGGCTTCGGCATCGGTGCATGGCCAACTGCGCGA
+CCTGCGCCGCGAGCTCCACACGCTGGTGTCGATTGCGCACCACCGCACCGGCAAACCGCATGGCTGGATC
+CACGACGAACTGCGCCGCCGTTGTGGCGGGCCTCCGATCGCCGCTGCCACCCGCGCTCAGATCAAGGCAC
+GCATCGATGCGTTGCGACAGCTCAACTCCGAGCGGTCATGAGCGTGCGATCCTAATCGCCGACGGGTTCG
+TCGACCACAACGTCGACGCTGGCGCCCAACACCTCCAGCAGGTGTTGCTCGACCGCGGCTCTCGCGTCCA
+ACTCCGCGGGGACCGTCACACAGAACACATCGGCCGCGGTCGATCCGAACGTATTGACCTTCGCCCAGAC
+AATGCCGGCTCCCGCGCCCTCCAGCGCCCCGGCCAGCAACGCGAGCAAACCCGCCCGATCCATGGCCCGA
+ACTTCGAGGATCAGCTTGGCCGGCGCGGCGGTGTCGAGCCACAGGATGCGGGGCGGAGCGGCCGTACGAG
+TCACGGGCACCCCGGCCTGCACGTCCCCGGCCCGAGCGGATACCAAGCTGGCGGCATCGCTGTCCCGCTT
+CTGCAGCATGCCCAGCACGTCGACGTCGCCGTTGAGGGCACCGACAAACTGCTGACGCACCAACTCCGCC
+GCGGGCGGGGACCCAAACAGTGGTGACACCACAAACTCGGTTATCGCGACACCCTGGTGGACGTTGACCG
+ACGCCGAATGTACGCGCAGCGAGTTCAGCGCCAGCACCGCGGCGGCTTTCGACACCAGTCCCCGCTCGTC
+CGGCGCCACTATTACGGCGTCGATGCGTTCACCGTCGCGCGGACTAATCTCCACATGCACCCCGTGGTCG
+GCCGCCAGCGAAAGATAATGGGGTGCAGTCGGTTCGGCTTGAGGCAGCGACTCTCCGGCCATCACCATCC
+GGCAGCGACGCACCAGGTCATCGACCAGTGACGCCTTCCAATCGCTCCACACCCCGGGGCCGGTGGCCTT
+CGAGTCCGCCTCCGACAGGGCGTGCAAAACTTCGAGCAGTTGCGGATCCCCACCCAGCGCCTCGGACACC
+GCCTCGATGGTTTTGGGGTCGTTTAAGTCACGTCGGGTTGCCGTAATCGGCAGCAGCAGGTGGTGGCGGA
+CCAGCTTGGAGAGCGTCCACACGTCCGGCGGCGACAACCCCAGCCTGGTGCAAACCGGGATTACCAATTC
+GGCCCCGAGCACACTGTGATCGGTGCCCCGTCCCTTGCCGATGTCGTGCAGCAGCGCGCCAAGCGCAAGC
+AGGTCGGGACGTGCCACCCGGGTGGCCAGTGGCGCCGCATGCACCGCGGTCTCGACCACGTGTCGGTCAA
+CCGTCCACTTGTGGGCGACGTCGCGCGGCGGAAGGTCGCGAATGGGCTCCCATTCCGGCAACAACCGGCC
+CCAGAGCCCGGTTCGGTCGAGCGCTTCGATGGTAGCCACCGTGGTGGGGCCGGCGGAGAGCACAACTAGT
+AAGTCGTCCAATGCCTCTTGCGGCCAGGGAGTCGGCAGATCCGGGACGCTGGCGGCCAACCGGCTCAGGG
+TGGCGGCGCCAATGGGCAATCCGGTGTCGGCCGACGCGGCGGCCACTCGGAGCACCAGGCCGGGATCGTG
+TTCGGGTTCGGCGTCGCGGGCGAGCACGATTTCGCCGGCATACTCGACGACACCCTCGTCGAGCGGTCGC
+CGCTTTGGCCGCCGCACCAAGGCCGAGATGCCGCGCCGCGGCAATGCATTCGCCGCAGTCCGCAGCCCGG
+CTTCGGCGTGGTAACCGATGGTGCGGCCAGCACTCGACAGTGTGCGCGCCAAATCGAATCGGTCACCGAA
+ACCCAACGCGGCGCTGATCTCGTCGGCGAACTGGGCCAGCAGGTGGTCGCGTCCGCGGCCCGACACCCGG
+TGCAGTTCGGTGCGCACATCCAGCAAGGTGCGATACGCACCGTCCAGCGAACCCGCCGGCCGGTCCGTGT
+GGCCGATACCGTGCCGGTCGATGAGCTGGGCGAGAGCCAGCGCGTCTAGCAACTGGACGTCCCGAAGGCC
+GCCGCGACCCAATTTGAGATCGGGCTCTGCGCGCTGCGCGATCCGGCCACAGCGCCGCCAACGCGCATAT
+GTCATTTCGACGAGTTCGCCCATGCGGGAACGAATTCCGTTGCGCCACTGGCGTCGCACGCCGTCGATCA
+ACGCGAACGAGAGCTGCTGATCGCCGGCGATGTGGCGGGCTTCCAGCATGCCTAGAGCGGCCATCAGATC
+GGAATTGGCGATGGTCAATGCCTCACTAACCGTTCGCACACTGTGATCGAGCCGAATGTTGGCATCCCAC
+AACGGATACCACAACCTGTCGGCGACGGGCCGCAAGATGTCAGCAGGCTTGCCATCGTGCAACAGCAACA
+CGTCCAGGTCCGAATACGGCAGCAGCTCGCGGCGGCCGAGCCCGCCGACCCCGACGATTGCAAAACCACT
+GGCATCGGCGATCCCGATCTCGTCGGCCTTGTCGATCAGCCAAGACTCATGCAGATCCAGCCACGTCTGC
+CGCAGCCCGACCGGATCCAGCTCGCGATGGTTGCCGGACAGCAGCTCGCGTCGGGCGACAGCTAAATCGC
+TTGCGGCACAAGGACTTTCTGCCTCCATCTCCCTCGCTAGCGCTAATTGGTGCGGCCGGGTTGGTTCAGC
+ACAGTGCGGCTAGTTTCATAACGCGTCGTGTCCGCGTTCACCGGTGCGCACCCGCACGATGGTGTCTACC
+GGACTCACCCACACCTTGCCGTCGCCGATCTTGCCGGTGCGCGCCGCCCGGACAATGCTGTCCACGACCT
+TATCGACAATGGAATCGTCAACAACGACCTCGATCCGAACCTTCGGTACGAAATCCACCGAGTATTCGGC
+CCCGCGGTAAACCTCCGTGTGGCCCTTCTGCCGTCCGTATCCCTGGATTTCACTGACCGTCATCCCCAGC
+ACTCCCGCGTCCTCGAGGCTCGTCTTGACGTCGTCGAGCGTGAACGGCTTCACGATCGCAGTGATCAGCT
+TCATTTCGGCTCCGCCTCCACTTTCTGGCCTATACGCTCCTGAATGCCGTTGCGGCTATCCTCCACGGTG
+ACCCGCGGGGGGAGAACCGAGCCGCTGGCGACGGCGAAATCGTAGCCGCTTTCCGCGTGCTCAGCCTCGT
+CGATGCCGGTGCTCTCTTGCTCCGCGTCAAGCCTGAGCCCGATGGTGAATTTCAGGATCAATGCCAAGAT
+CAGGGTGATGATTCCAGAGTAGACGAGAACACTGCAGGCACCGAGCGCCTGTCGTTCCAGCTGGGCGAAG
+CCTCCGCCGTAAAACAACCCCTTCGATACCCCGGCCACACCATTAATTGCCGGAGCCTCCGGAGCTGCCA
+GCAGACCCACCAGCAGTGTGCCCACCAGACCACCAACCAGGTGCACCCCGACCACGTCGAGCGAATCATC
+GAAGCCCAGTTTGAATTTCAGCCCCACCGCCAGCGCGCACAGCACCCCGGCCGACACGCCTACCGCCAAG
+GCACCCAGGACATTAACCGACGAGCAGGACGGCGTGATGGCGACCAGTCCGGCGACGATGCCCGACGCCG
+CGCCCAGCGTCGTAGCCTTGCCATCTCGGACGCGCTCCGTGAGCAGCCAGCCAAGCATGGCCGCGGCCGT
+CGCAATCGTGGTGGTGACAAACGTCGCCCCGGCAACACCGTTGGCGGTCGTCGCCGATCCTGCGTTGAAC
+CCGTACCAGCCGAACCACAGCAGGGCGGCCCCGAGCATCACAAACGGCAGATTGTGCGGTCGAAACAGCG
+TCGCCGGCCAACCGCGTCTTTTGCCCAGCACGATCGCCAGCATCAAGGCCGCCACACCGGCGTTGATATG
+AACCGCGGTGCCGCCGGCGAAGTCGATGGCGTGCAGCTTGTTGGCGATCCAGCCGCCGTGCTCAGCGGCG
+AAACCGTCAAATGCGAAGACCCAGTGTGCGACCGGGAAATAGACGAACGTCGCCCACAAACCGGCGAACA
+ACAGCCAGGCGCCGAACTTCAACCGGTCGGCCACCGCCCCGGAGATCAGCGCAACCGTGATGATCGCGAA
+CATCAGCTGGAATGCCACAAACACGGTCGCCGGCAGGGTACCCGCCAGCGGAATATTCACCGCGGCGGTC
+TGCGTGCTCGGATCGGCAGCAACAGCATTGACGCCGATGAGACCTTTGAGACCCCAGTATTGGCTCGGGT
+TGCCGGCGATGTTGCCAACGTCATCACCGAACGCAATCGAGTAGCCGTAAAGCGCCCAGAGCACCGTCAC
+GACACCCATCGCGCTGATGCTCATCATGATCATGTTCAGGACGCTCTTGGAACGCACCATGCCGCCGTAG
+AAAAATGCCAGACCCGGCGTCATCAACAGCACGAGCGCGGAACTCACCAGCATCCAGGCGGTGTCGCCGC
+CATCCGGAACGCCCATGATGGGGAATTGGTCCACTCGCTATCACCTCCAGTCGAGCGTTGGCACGGCCCC
+AGCCTTACGACTGACGACCTGATCCAGAACCATGCGCACTAGTTGTTGCGGCGATGGTGCCGCCATGTTT
+CATCAGGATTAACGTAAAACTTGCTGTGAAAGAGCTTTCCGTGGCGATCGCAAGCGCGGCGCAGCCGCGC
+GCAGCGGGTCGCCACCATCAAACCCCGTGGCGATCGCAAGCGCGGCGCAGCCGCGCGCAGCGGGTCGCCA
+CCATCAAACCCCGTGGCGATCGCAAGCGCGGCGCAGCCGCGCGCAGCGGGTCGCCACCATCAAACCCCGT
+GGCGATCGCAAGCGCGGCGCAGCCGCGCGCAGCGGGTCGCCACCATCAAACCCCGTGGCGATCGCAAGCG
+CGGCGCAGCCGCGCGCAGCGGGTCGCCACCATCAAACCCCGTGGCGATCGCAAGCGCGGCGCAGCCGCGC
+GCAGCGGGTCGCCACCTCGGCTAGCCGAGCAGGGCGTCGACGAATGCGGCGGGTTCGAAAGGCGCCAGGT
+CATCGGGGCCTTCACCAAGCCCGACCAGCTTCACCGGCACCCCAAGTTCCTGTTGAACGCGGAACACAAT
+GCCGCCCTTGGCCGTTCCGTCCAGTTTGGTGAGCACCGCGCCGCTGATGTCGACGACCTCGGCGAACACT
+CTGGCCTGCGCCAACCCGTTCTGTCCGATCGTGGCATCGAGCACCAGCAACACCTCGTCAACGGACGCTC
+GCCGAGTCACCACGCGCTTGACCTTGTCCAGCTCGTCCATCAGGCCAACCTTGGTGTGCAGCCGCCCGGC
+TGTATCGATGAGCACGACGTCTGCGCCGGCGGCGATGCCCTTGTCGACGGCGTCGAACGCCACCGATGCC
+GGGTCGGCGCCTTCGGGCCCGCGAACCACCGCTGCGCCAACCCGCGCCGCCCAGGTCTGTAGCTGATCGG
+CGGCGGCCGCACGGAAGGTGTCAGCCGCACCGAGTACGACCCGTCGGCCGTCGGCCACTAGTACCCGCGC
+CAACTTGCCGACCGTGGTGGTTTTTCCGGTGCCGTTGACGCCGACGACCAGCAACACCGAAGGATGGCCG
+GCGTGCGGTAGCGCGCGGATCGAGCGGTCCATGCCAGGTTGCAGTTCGTTGATCAGGACGTCACGCAATA
+CCGCCCGGGCGTCGGCCTCGGTACGCACGTTGCCGCTGGCCAGGCGGCTGCGCAGCTGCGACACCACCGA
+CGCGGTGGCCGCCGGTCCCAGGTCGGCGACCAGCAGGGTGTCCTCGACGTCTTGCCAGGAGTCCTCGTCC
+AGGTCGCCGCCGCCGATCAGTCCCAACAGGCCGCGCCCGAGGGCATTCTGCGATCTGGCGAGCCGTCCGC
+GCAGTCGTTCCAATCGACCTTCGGGCGGCGCGATGGCGTCAGCCTCGGGGACCTCTGGAGCCTGGGGTTC
+TGGCTCAAACTCGGGAAGGTGTACGTCGGCGATCGTGCGCTTGGGCGCGTCGCGAGGGACGGTCGCATCG
+TCGCCCACGGCGGGCAGTCCGCTCGTATCGATCCGCTCGGCCGGCTGGGTCGTCGGCGTCTGACTAAACG
+TGATGCCAGACGATGCGGTGTAACCGCCTGAGCGGTCGACAACGCCGCGCTCGGGCCGAGGCGACAGACT
+GATGCGCCGCCGACGGTAGAGCACCAGCCCCAGGGTCAGCGCAGCGATGACGACCAGGGCGGCGATGACC
+GCCGTGGCGATCCACAAACCTTCCCACACGCTGACAATCCTTCCAGGGGTCGCTTGCCCCGATGCTTAGG
+GACGAACCCTACGAGGAATTGGTAACCAGCTGATCCACCTGCTGACCGCGCATGCGCTGCGAGATGACCG
+CGGTGATGCCGTCGTTCTGCATGGTTACGCCGTACAGTGCGTCCGCGACCTCCATCGTCGGCTTCTGGTG
+GGTGATGATGATGATCTGCGACTGCTCTCGCAGCTGTTCGAACAGGCTGAGCAGTCGGCGCAGGTTCACG
+TCGTCGAGGGCGGCCTCCACCTCGTCCATGATGTAGAACGGCGATGGACGGGCACGAAAGATCGCGACCA
+GCATCGCCACCGCGGTCAGCGCCTTCTCGCCACCGGAGAGCAAAGACAGTCGGGTAATCTTCTTGCCCGG
+CGGGCGGGCTTCGACCTCGATGCCGGTGGTGAGCATGTCGTCGGGCTCGGTCAGCCGCAGCCGTCCTTCA
+CCACCGGGGAACAATGCGGTGAACACGCCGCGAAATTCGCGTTCCACGTCTACGAACGCGTCATTGAACA
+CCTGCAGGATGCGGGCGTCAACATCGGCGACGACGCCCAGCAGATCCTTGCGGGCAGCCTTGACATCCTC
+GAGTTGGGTGGACAGGAAATTGTAGCGCTCCTCCAAGGCAGCAAACTCTTCGAGCGCCAGCGGGTTGACC
+CTGCCCAACTCGGCAAGCGCACGCTCGGCGCGTTTGGCCCGGCGCTCCTGGGTAACCCGGTCGAACGGCA
+TGGGGGCGGGCGCAATCACCTGCTCGCCGCGTTCGCGGGCTTGCTCGAACTCAGCCATCTCGAGCTCGGT
+CGGTGGTAGCGCCACATGTGGACCGTATTCGGTGATCAAGTCGGCCGGCGCCATTCCGAACTGCTCTAGC
+ACCATCTGCTCAAGCTGCTCGATACGCAGCGCCGCCTGCGCGTTAGCCAGCTCGTCGCGGTGCAGCGAAT
+CGGTGAGTTCCCCCACTCGGGCGCTCAGCGTGTTCACCTCGTCGCGCACCGCGGCCATCGCCGCTAACCG
+CTGCTGACGTTGCGCGGCCGACGCGTCGCGCAGTTGCGACGCCCCGTCCACCGCCCGGTGCAACCGCCCG
+GCCAGCAGCCGTCCGCAGTCGGCGACCGCTGCGGCCACCGCGGCCGCATGCAGTCTTGCGGCGCGTGCTT
+GCTGAGCCCGCACCCGCGCCTCACGTTCCGCCGCAGCCGCACGGCGCAGCGAATCGGCCCGCCCGCGAAC
+CGCGTTGGCGCGTTCCTCGGCGGTGCGCACCGCCAGCCGGGCTTCCACTTCGACACCGCGGGCGCGATCG
+GCAGCGGCACTGATCGCCTGGCGGTCGATCGGTTGGGCCACCTGCACCCGTTGGGTCTCCTGGGCCTTAC
+GCAGCTGGGTCTCAAGTTGTATGACGTCGTCGAGAGTCTGTGTGCGCACGGCTTCCTGTTCCGTACGCTG
+CTGCAGCAACCGGTTCCACTCTTCTTCCGCCGCGCGGGCCTCCTGCCCGAGGCGGCCCAGCTGCTCGTAC
+ATCGCCGAGATGGCCGTGTCGGATTCGTTAAGCGCGGCCAAGGCTTGCTCGGCCGCGTCCTGGCCGGCGG
+ACTGCTCGGTCAGCGCACCGGCCAGGGCCGCATTCAATTGCGCCGCCAGCGCCTCGGCAGCGGCCAGCTC
+ACTCCTGGCCTTGTCGATCTCGGAGGTGACCTCCAAGGTGGACAGCTTGCGGTCCGATCCGCCGCTGACC
+CAGCCGGCGCCCACCAGATCACCGTCAACGGTGACCGCGCGTAGCTCCGGACGAATCTCGACCAGGCCCA
+TTGCCTCAGTCAGGTCGTTGACCACCGCGACACCCGAAAGCATGGCGATCATCGCGCCAACCAACTGCGG
+TGGAGACTCGACCAGGTCTAGGGCCCACTGGGCGCCGCTAGGCAGCATCTCCCCCGAGGCGGATTGGGGG
+GCTTGCGGGGCCGGCCAGTCACTCAGCACGAGGACCGCGCGACCGCCGTCGGCTTGTTTGAGTGCGCTGA
+CGGCACTACCCGCGGCAGTCAGGCCGTCCACCGCAAGTGCGTCGGCCGCCGGCCCGAGCGCCGCGGCCAG
+TGCCGCTTCATAGCCGGAACGTACCTTCACCAATTGGGCGATCGAACCGAAAAGCCCTGCGCCACTGCGA
+TTGTGCGCCAGCCACGCCGCGCCGTCCTTGCGCTGTAGCCCCACTGCGAGCGCATCGATGCGAGCCCGTA
+GCGATGCCACCTGGCGTTCGGCGGCGCGTTCGGCGGATTGCAGCTCGGCGACGCGTTCGTCGGCCAACCG
+CAACGCGGCCACAGTACGCTCGTGGTGCTCATCCAGGCCGACCTCGCCTTGATCCAGTTCACCGATGCGG
+CCCTGCACGGTTTCGAACTCGGCTCGGGTCTGCTGGGCGCGCATTGCGGCATCCTCGATCCGCTCGGACA
+ACCGTGCCACGCTCTCATCGATCGATTCGACACGCGCCCGCATGGTCTCCACCTGGCCAGCCAGCCGCGC
+CAGTCCCTCACGGCGGTCCGCCTCCTCCCGGACCGCCGCCAGGTGTGCCCGGTCGGCCTCGGCGGCGCGG
+CGCTCCCGGTCGGCCCGCTCTGCACGGGCAGCATCGAGTCGGGCACGCGCCGCGTCCAGCTCCGCTAACA
+GTTGTTGCTCGGCGACGGCCACCTGCTGGGCCTCGGCTTCTAGCTCCTCGGGCTTTCTGGGGTCGGTGTC
+GCTGACCGCTACCGGCTCGATATCGAGATGATGGGCGCGTTCGCTGGCGATGCGCACCGTAGCGTCCACC
+CGTTCGGCCAGCGCAGACAGCCCGAACCAAGTGTGCTGGATCGACTCGGCCCGCGTCGAGAGTTCGGCGA
+CCGCGGACTCATGCGCGGCCAGCTCCTCGGATGCCACCGCCAGCCGGGCGGCGGCCTCGTCATGCTCGCG
+GCGCATCGCAGCCTCGGCCTGAAAGACCGCTTCCCGTTCGGCTCTGCGGCTTACCAAGTCGTCGGCCGCC
+AGGCGCAGCCGGGCGTCGCGCAGATCGGCTTGGATGGCCGCGGCACGCTGGGCCGCCTCGGCCTGCCGGC
+CCAGCGGTTTGAGTTGACGCCGGAGCTCGGTGGTCAGATCGGTGAGCCGGGCCAGGTTCGCCGCCATCGT
+GTCGAGTTTGCGCAGAGCTTTTTCCTTGCGCTTGCGATGCTTGAGCACACCGGCGGCTTCCTCGATGAAC
+GCCCGCCGATCCTCAGGCCGCGACTGCAAGATCTCCTCGAGCTTCCCTTGCCCAACAATCACATGCATCT
+CACGGCCGATGCCGGAGTCGCTCAGCAACTCCTGCACATCCATCAAACGGCAACTGCTGCCGTTGATTTC
+GTATTCGCTGGCACCGTCGCGAAACATTCTTCGGGTGATCGACACCTCGGTGTATTCGATAGGCAGTGCG
+TTGTCGGAGTTGTCGATGCTAACGGTGACTTCGGCGCGGCCCAGCGGCGCACGCGACGAGGTGCCGGCGA
+AGATGACGTCTTCCATCTTGCCGCCGCGCAGCGTCTTTGCCCCCTGCTCCCCCATCACCCACGCCAGGGC
+ATCGACCACATTGGATTTGCCGGAGCCGTTGGGCCCAACGACGGCCGTAATGCCCGGCTCGAAGCGTAAA
+GTCGTCGGCGCGGCGAAGGACTTGAAGCCCTTCAACGTCAGACTCTTGAGGTACACGAGGGGCCAGATTA
+CCGCTCGCTGAACCCGGTGATCTGCTCCGTCGACTGCGACCAGTCGGCGACGACTTTGGCGACGCGGCCC
+GGTGTCGTGTCGCCCTGCAGCAGCTGCAGCAGCTTCTGGCACGCAGCGCGCGGACCCTGGGCGACCACCA
+GCACGCGTCCGTCGGCGTGGTTGGCCGCGTAACCGGTCAGGCCGAGCTCCAACGCTCGGCAGCGGGTCCA
+CCAGCGGAAACCGACTCCCTGCACCCACCCGTGCACCCAGGCGGTCAGCCGCACGTCAGGCGCCGACATC
+GACGACCTCCAAGTTGACCGTGGTGCCCGACTTGAGGGTGCGCCCGACGGTGCACGCCAGCTCCACCGCG
+CGGTTGATGACCACCAGCAGACGCTCCTTTTCGTCCTCGGTGAGGCCCGACAAGTCGAGCTCCATGGTCT
+CCTCGATCAGGGGATAGCGCTCCTGGTCGCGGTCGGCCGCACCGGATACCTTGACCACCGCCTGGTAGTC
+GTCGCCGAGCCGCCGGGCCAGCGGCTGGTCACTGGCCATCCCGCTGCATGCGGCGAGTGCGATCTTGAGC
+AGCTCTCCGGGGGTGAATACCCCGTCGACGTCCTCGGAGCCAACCAGCACCTGCGCCCCCCGCGTGCTGC
+GTCCGATGTAACGGCGCGTGCCGGTGCGCTCGACCCACAGTTGCGTCATGGCTTCTTTCTACCCGGGGGT
+CTTTGCGTCGAGATCGACGGCAGCGCCCCCGCGAGAGAGAGCATCGCGCTGACGTCGATCTCGATGCGTC
+AACACCCGCCCTACTTTCGGGGCCGCGGCTGGCATCGCGGGCAGTAGAACGACGAGCGGTTCATAAACCT
+CTCCCGGCGTATCACCGCGCCGCAGCGCCGACAGTTTTCGCCTTCGCGGCCATAAGCGTCCAGCGACCGC
+TCGAAGTAGCCCGACTCGCCGTTGACGTTGACATACAAAGAGTCGAACGAGGTGCCACCTTTCGCCAGCG
+CTTCGCGCATCACGTCGGCGGCGGCATGCAGGACCGCTCCCAGACGCCGGCACCTTAGTGTGGCGGCGAC
+GTGGGCGCCGTTCACCTTGGCCCGCCACAGCGCCTCATCGGCATAGATGTTGCCGATTCCCGACACCACC
+CGCTGATCCAGCAGCTGGCGCTTGAGTTCGGAATGCTTGCGCCGCAACACTTTAACTACAGCGTCACAAT
+CGAACCGCGGGTCAAGCGGGTCGCGCGCCAGGTGGGCGACCGGCACCGGTACCACGCTGCCGTCCACCGT
+CACCAGGTCGGCAAGCAGCCACCCTCCGAAGGTCCGTTGGTCAGCGAAGCTCAGCACGGTCCCGTCGTCG
+AGCAGCGCGGAAATCCGGACGTGAGCGGCACACGGCACCGCCCCGAGCAGCATCTGCCCACTCATGCCCA
+GGTGCACCACGAGTGCGGTGTCCGTCGGCCTATGGACCCCAGCCGTATTGAGTGTCAACCACAGGTACTT
+GCCGCGCCGATCGGTTCCGTTGATCCGCGCTCCCCGCAGCCGCGCCGTCAGATCCGCGGGCCCGGCATCG
+TGGCGGCGCACAGCGCGGGGGTGGTGCACCCGAACCTCGGTGATGGTCCGGCCGGTCACGTGAGCCTGCA
+AGCCGCGCCGCACCACCTCGACTTCGGGCAGCTCGGGCATCCAGTGATGATCGCAAGCGCGGCGAAGCCG
+GGCGCAGCGGGTCATCACCATCGAACCAGTGATGATCGCAAGCGCGGCGAAGCCGGGCGCAGTCCCCCGC
+AAGCGGGAGGTGCCCCCAGGTCATCACCATCGAACCAGTGATGATCGCAAGCGCGGCGAAGCCGGGCGCA
+GTCCCCCGCAAGCGGGAGGTGCCCCCAGGTCATCACCATCGAACCAGTGATGATCGCAAGCGCGGCGAAG
+CCGGGCGCAGTCCCCCGCAAGCGCGGCAAAGCCGGCGCCCCCAGGTCATCACCATCAATCCAGTTAGGCG
+GAGGTTTTGCCCGGCATGGCGTTGTCGAGCACTTCCAGGGCTTTCCAAGCGGCCGCCGCGGCTTTTTGCT
+CGGCTTCTTTTTTGGACCGGCCCACTCCTGAACCGTATTCGCTGTCCATCACGACAACCACCGCGGTGAA
+TTCCTTATCGTGGTCCGGGCCGGTGGAGGTGACCAGGTATGACGGCGCACCCAGCCCTCGCGCTGCAGTC
+AGCTCCTGCAAGCTGGTCTTCCAATCCAATCCCGCACCCAGGGTCGGCGCGGCGTCCAGCAACGGGCCAA
+ACAGCCGCAGGATCACCTCACGGGCCTTCTCCATACCGTGTTGCAGGTAGATCGCGCCCAGCAGCGATTC
+CATACCGTCGGCCAGAATGCTGGACTTGTCGGCCCCGCCGGTGTTCGCCTCGCCGCGACCCAATAGCACG
+TGAACACCGAGGCCTTCCGCACAGAGGCGGCGTGCGACGTCGGCCAGGGCCTGGGTGTTGACTACGCTGG
+CCCGCAGTTTGGCCAGATCCCCCTCCGACCGATCAGGATGACGATGGAACAGCGCGTCGGTGATGGTCAG
+CCCTAGCACGGCATCGCCGAGAAACTCCAAACGCTCGTTGGTCGGCAGCCCGCCGTTCTCGTAGGCGTAG
+CTGCGGTGGGTCAACGCCAGTGAGAGCAGCTCGTCCGGGAGGTCCACACCGAGTGCGTCGAGCAGGGGTT
+GTCGTGACCGGATCATCGCTCACCTCGTAATGTGTCGGACTCCGGCCCGAGCATTTCGACCAACTTCGCC
+CACCGCGGGTCGATCTGTTCATGGCGATGACCTGGCTCGCTGGCCAGCGGGACACCGCACTGCGGGCAAA
+GACCCGGGCAGTCCGGCCGGCACACCGGCGAAAACGGCAATTCCAGACCGACCGCATCGATGATCGGCTG
+CTCGAGATCGATGGTTTCGTCGACGACGCGTCCGACCTCGTCTTCCTCGGTGGTCTCGTCGGTGGCGCTA
+TCCGGATAGGCAAACAGTTCGGTCAGGGCTACCTGAACGCGACCCCGCACCGGGCTGAGGCAACGAGCAC
+ACTCGCCGACGGTCGGGGCGGCCACGGTCCCGGTCACCAACACGCCTTCGGACACCGACTCGACCCGCAG
+ATCCAGGTCCAGAAGGGCGCCCTGGTCAATCGCGATCAGCTCCAGCCCGATGCGTGCGGGGCTGTGCACG
+GTGTCATGCAGCTCGAACATCGCTCCCGGTCGTCGCCCCAACCGTGCGATGTCGACCGTCATCGGCGACG
+CCACATGTCGCTGCGCAGTGGGACCGTGCTGCCTGGCCATAAGAGAAATCCTACGGCGCACGCCACCCAG
+ATCCACGCCGCGTTGGGCGTTGGCCGGCGCTTGATCCTTGCGCCGGGTGAATGGTGTTAGCGCACCGCGT
+AGTCGTGAGTGCCGGCCGCTGTGCGGAGCTGGTGGCGACCGCGGCCAACGGACCGCAGGGTGCCGTTGAG
+GAATTCCTCGAATTCGGCGAGCTTGTTGTCGACGTAGATATCGCATTCTCCGCGTAGCCGGTCCGCCTCG
+GCGTGCGCCGTGTCGACGAGGCGGGTCGATTCCGCGTTGGCCGCCGCAACCACCTCGTTCTGCGATACCA
+GGCGCTGCTGCTCTTTGATGCCCTCCTGCACGGCTTTCTCGTAGGAGATGTTGCCGTTTTCGATCAGCCG
+GTCGCATTCGGCCTGGGCGCGACTGACGCTGGCCTCGTATTCGCGTTTCGCGGCGGTGGCGATGCGAATC
+GCCTCCTCGCGTGCATCGGCGACCATTCGCTCGCTGTGCTGGCGTGCCTCGCTGACCATCCGATCAGCCT
+GCGCCTTCGCGTCAGACAGGATCCGGTCAGCCTCGGTGCGGGCGTGGTTGAGTATCGACTCCGCCTCAGT
+GGTCGCCGAGGACACCATAGAGTCAGCGTGCGTCTTAGCGTCCTGCAACATCGAATCACGTGCGTCGAGG
+ACGTCCTGCGCGTCATCCAGCTCACCGGGGATCGCATCCTTGATGTCGTCGATCAACTCCAGCACATCCC
+CACGCGGGACGACGCAACCTGCCGTCATCGGCACGCCTCGGGCTTCTTCGACTATGGCGCTCAATTCGTC
+CAGCGCTTCAAAGACTCGGTACACGGCCACACCCTCCTGGCATCTTGCAAGATCCCTGTTGTTACCAGTG
+TGCCTGGTGTTTCGTCTGTGACTGCACTGGTGGCGCCGGTGTGTCGGGACACAATTTCATATTCGACGAG
+CCCGGGCGACCACTCAGATCACGCGGCCTGCTGGGCGCGTGTCGTAGACCGTTCGGCGGCTGACGGGTGA
+GCCTACGTCGTCTGGGCGATCTTGCCCGAGCGTGCCGACAACGTAGGTGTCGATGCTGGCCCGTCACGGA
+CCACGCTATGGTGGCTCGGTGAACGGGCACTCAGACGACAGTAGCGGCGACGCGAAGCAAGCCGCACCCA
+CGCTGTATATTTTCCCGCATGCCGGCGGCACCGCGAAAGACTATGTCGCATTTTCCCGAGAATTTTCCGC
+CGACGTAAAGCGGATTGCTGTCCAATACCCCGGCCAGCACGATCGTTCTGGCCTGCCACCGCTTGAGAGT
+ATTCCCACCCTCGCTGACGAAATCTTTGCAATGATGAAACCGTCGGCTCGGATCGACGATCCGGTGGCAT
+TCTTTGGGCACAGTATGGGCGGAATGCTAGCCTTCGAAGTAGCGTTGCGATACCAATCGGCGGGCCATCG
+AGTCCTGGCATTCTTTGTGTCGGCCTGCTCAGCACCGGGTCATATCAGATACAAGCAGCTCCAAGATTTA
+TCAGATCGCGAGATGTTGGACTTGTTCACCCGAATGACAGGAATGAATCCAGATTTCTTTACCGACGACG
+AATTTTTCGTTGGAGCGCTACCCACGTTGCGAGCGGTCCGAGCCATCGCCGGTTATTCCTGCCCACCAGA
+GACGAAGCTCTCGTGTCCGATTTATGCCTTTATCGGAGATAAAGATTGGATCGCAACGCAAGACGACATG
+GATCCGTGGCGCGATCGGACGACGGAAGAGTTCTCTATCCGTGTATTCCCTGGGGATCACTTCTACCTCA
+ACGACAATTTGCCAGAGCTAGTCAGCGACATAGAAGACAAAACACTCCAATGGCATGATCGAGCTTAGCT
+ATGCTCCGGATGTAGCTGGCCGAAGATCCAACTGGCCGAAGGGCTCGGGGGTCAACACCTGGACAGCCAT
+TCGCTGGACATTTGCTGAAGATTCACCGTACGTCGGCACCGGTCTGGAGCGGATGGCTTCAGACACACAC
+GGGGGCGGTGGCGGCCGACCGGTCACCCCGCCCCCGCCCGGTATGCACCATCTCGGGTGCAGCCGAGGCG
+TGTTGTTAATCTCGTCACAACGGGACGCCGGTCACAAGACGTGCGACCCAGCCGCCGGCGGCACTCTGAC
+CTCGGTTCTTACCTGACTACCAATTCGTCACCGGCATCGCACACGTCACACCAACCACAGCGGACGCGGC
+ACGGCACGCGGAAGGGACGCTAGACTCGGCTAGCACCACCACCGTGCCCAGGCAACGACGCCGGCCGTCG
+CTAAGAAATTTGGTTGACTTCATGAATAAGGCCGCGCCCGCCCCGACAAATGATTACCTTACATTTGCGG
+GCTAGGCATAGCGGAGCAGGGGTTTTAGTCTAGGGGGAGATCGGCTGGCGCTGCGCAGACATGCTGCGGA
+AGCAGAACTGCGTAATCGTCAGGTGGCTTGGTCAGTTCAGACCGGCACGTTTCAGAGCGGTGGGGATGTC
+CCGACGTGCGATCCGACAGGGGTTCGCAGGGTCCGCAAAAAACATAGTGAACGCCAGAAAGCCGAATGGG
+AGTACAAGGCGATGCCGGTGACCGACCGTTCAGTGCCCTCTTTGCTGCAAGAGAGGGCCGACCAGCAGCC
+TGACAGCACTGCATATACGTACATCGACTACGGATCCGACCCCAAGGGATTTGCTGACAGCTTGACTTGG
+TCGCAGGTCTACAGTCGTGCATGCATCATTGCTGAAGAACTCAAGTTATGCGGGTTACCCGGAGATCGAG
+TGGCGGTTTTAGCGCCACAAGGACTGGAATATGTCCTTGCATTCCTGGGCGCACTTCAGGCTGGATTTAT
+CGCGGTTCCGCTGTCAACTCCACAGTATGGCATTCACGATGACCGCGTTTCTGCGGTGTTGCAGGATTCC
+AAGCCGGTAGCCATTCTCACGACTTCGTCCGTGGTAGGCGATGTAACGAAATACGCAGCCAGCCACGACG
+GGCAGCCTGCCCCGGTCGTAGTTGAGGTTGATCTGCTTGATTTGGACTCGCCGCGACAGATGCCGGCTTT
+CTCTCGTCAGCACACCGGGGCGGCTTATCTCCAATACACGTCCGGATCGACGCGTACGCCGGCCGGAGTC
+ATTGTGTCGCACACGAATGTCATTGCCAATGTGACACAAAGTATGTACGGCTATTTCGGCGATCCCGCAA
+AGATTCCGACCGGGACTGTGGTGTCGTGGCTGCCTTTGTATCACGATATGGGCCTGATTCTCGGAATTTG
+CGCACCGCTGGTGGCCCGACGCCGCGCGGTGTTGATGAGCCCAATGTCATTTTTGCGCCGTCCGGCCCGC
+TGGATGCAACTGCTTGCCACCAGCGGCCGGTGCTTTTCTGCGGCACCGAATTTCGCCTTCGAGCTGGCCG
+TGCGCAGAACATCTGACCAGGACATGGCGGGGCTCGACCTGCGCGACGTGGTCGGCATCGTCAGTGGCAG
+TGAGCGAATCCATGTGGCAACCGTGCGGCGGTTCATCGAGCGGTTCGCGCCGTACAATCTCAGCCCCACC
+GCGATACGGCCGTCGTACGGGCTCGCGGAAGCGACCTTATATGTGGCAGCTCCCGAAGCCGGCGCCGCGC
+CCAAGACGGTCCGTTTTGACTACGAGCAGCTGACCGCCGGGCAGGCTCGGCCCTGCGGAACCGATGGGTC
+GGTCGGCACCGAACTGATCAGCTACGGCTCCCCCGACCCATCGTCTGTGCGAATCGTCAACCCGGAGACC
+ATGGTTGAGAATCCGCCTGGAGTGGTCGGTGAGATCTGGGTGCATGGCGACCACGTGACTATGGGGTATT
+GGCAGAAGCCGAAGCAGACCGCGCAGGTCTTCGACGCCAAGCTGGTCGATCCCGCGCCGGCAGCCCCGGA
+GGGGCCGTGGCTGCGCACCGGCGACCTGGGCGTCATTTCCGATGGTGAGCTGTTCATCATGGGCCGCATC
+AAAGACCTGCTCATCGTGGACGGGCGCAACCACTACCCCGACGACATCGAGGCAACGATCCAGGAGATCA
+CCGGTGGACGGGCCGCGGCGATCGCAGTGCCCGACGACATCACCGAACAACTGGTGGCGATCATCGAATT
+CAAGCGACGCGGTAGTACCGCCGAAGAGGTCATGCTCAAGCTCCGCTCGGTGAAGCGTGAGGTCACCTCC
+GCGATATCGAAGTCACACAGCCTGCGGGTGGCCGATCTCGTTCTGGTGTCACCTGGTTCGATTCCCATCA
+CCACCAGCGGCAAGATCCGGCGGTCAGCCTGCGTCGAACGCTATCGCAGCGACGGCTTCAAGCGGCTGGA
+CGTAGCCGTATGACGGGAAGCATCAGTGGTGAAGCCGACCTTCGCCACTGGCTAATCGACTACCTAGTAA
+CCAATATCGGCTGCACACCTGACGAGGTGGACCCCGATCTGTCGCTTGCCGACCTCGGCGTCAGCTCCCG
+CGACGCGGTCGTACTGTCCGGCGAACTGTCAGAGCTGCTGGGCAGGACCGTATCGCCGATTGACTTCTGG
+GAGCACCCGACGATCAACGCGCTGGCCGCGTATCTGGCCGCACCCGAGCCGAGCCCCGACTCCGACGCCG
+CAGTCAAGCGTGGTGCCCGGAACTCACTCGACGAGCCAATCGCCGTCGTCGGCATGGGATGTCGTTTCCC
+TGGCGGGATTTCGTGCCCAGAAGCATTGTGGGACTTTCTCTGTGAACGCCGTTCCTCGATCAGCCAGGTG
+CCGCCGCAACGATGGCAGCCCTTCGAAGGCGGGCCACCCGAGGTAGCCGCGGCGCTAGCGCGCACTACAC
+GGTGGGGCTCATTTTTGCCCGACATCGACGCCTTCGACGCGGAATTCTTCGAGATCTCCCCCAGCGAAGC
+CGACAAGATGGACCCCCAGCAACGCCTGCTGCTGGAAGTGGCCTGGGAAGCGTTGGAGCACGCGGGAATC
+CCGCCCGGCACGCTGCGCCGCTCGGCAACAGGAGTGTTTGCCGGGGCATGCCTGAGCGAATACGGTGCGA
+TGGCTTCCGCCGATCTGTCGCAGGTCGATGGTTGGAGCAATAGCGGTGGCGCGATGAGCATCATCGCCAA
+CCGCCTCTCGTATTTCCTTGACCTGCGCGGCCCGTCGGTGGCGGTAGACACCGCATGCTCGTCGTCGTTG
+GTAGCGATCCACCTGGCCTGCCAGAGCCTTCGGACCCAGGACTGTCACCTGGCAATCGCAGCCGGCGTGA
+ATTTGTTGTTGTCCCCGGCGGTATTTCGCGGTTTCGACCAAGTCGGCGCCTTGTCCCCGACAGGTCAGTG
+CCGTGCGTTCGATGCGACCGCCGACGGGTTTGTCCGCGGCGAGGGTGCCGGGGTAGTGGTGCTCAAGCGG
+TTGACCGATGCACAGCGCGACGGGGATCGGGTGCTTGCGGTGATCTGCGGTTCTGCGGTCACCCAGGACG
+GCCGATCCAACGGGCTGATGGCCCCCAACCCAGCGGCCCAGATGGCGGTGCTGCGTGCCGCCTACACCAA
+CGCGGGGATGCAGCCCAGCGAGGTCGACTACGTCGAAGCGCACGGAACAGGGACGCTGTTGGGCGACCCG
+ATCGAAGCCCGCGCTCTCGGAACGGTGCTGGGTCGCGGCCGGCCCGAGGATTCTCCGTTGCTCATCGGCT
+CTGTCAAGACCAACCTCGGTCACACCGAGGCTGCGGCTGGAATCGCGGGCTTCATCAAGACGGTGCTGGC
+TGTGCAGCATGGCCAGATTCCGCCAAATCAGCACTTCGAAACCGCGAACCCGCACATTCCCTTTACCGAC
+TTGCGGATGAAAGTCGTTGACACACAAACTGAATGGCCGGCAACGGGCCATCCCCGCCGTGCCGGTGTGT
+CGTCGTTCGGCTTCGGTGGCACAAACGCGCACGTGGTGATCGAGCAGGGCCAGGAGGTGCGCCCCGCGCC
+TGGACAAGGCTTAAGTCCGGCGGTGTCGACCCTGGTAGTGGCCGGCAAGACTATGCAGCGGGTGTCCGCG
+ACCGCGGGGATGCTAGCCGATTGGATGGAAGGGCCCGGCGCTGACGTGGCCTTGGCCGACGTGGCCCACA
+CCCTCAATCACCACCGATCGCGGCAACCCAAGTTCGGCACGGTGGTGGCCCGTGACCGTACCCAGGCGAT
+AGCCGGATTGCGTGCGCTGGCCGCCGGCCAACACGCCCCCGGCGTGGTCAACCCTGCCGAGGGCTCGCCG
+GGGCCGGGCACCGTGTTCGTCTACTCCGGCCGCGGTTCACAGTGGGCTGGCATGGGCCGTCAATTGTTGG
+CCGACGAGCCGGCTTTCGCGGCCGCGGTCGCCGAATTGGAACCGGTGTTTGTCGAGCAAGCCGGCTTTTC
+GTTGCACGACGTGCTGGCTAACGGCGAGGAACTGGTCGGTATCGAGCAGATTCAGCTCGGGTTGATCGGG
+ATGCAGCTGGCCCTGACCGAATTATGGTGTTCCTACGGGGTGCAGCCCGACCTGGTGATCGGCCACTCCA
+TGGGCGAGGTGGCCGCCGCCGTGGTCGCCGGGGCACTGACCCCGGCCGAGGGTCTGCGGGTGACCGCCAC
+CCGGTCACGGCTGATGGCACCGTTGTCCGGCCAGGGCGGCATGGCACTGCTGGAACTCGACGCGCCCACT
+ACCGAGGCGTTGATTGCCGACTTCCCACAGGTGACGCTCGGTATTTACAACTCACCACGGCAAACGGTGA
+TCGCCGGGCCCACCGAGCAGATCGATGAGTTGATCACTCGCGTGCGCGCTAGGGACCGATTCGCCAGCCG
+GGTCAATATCGAAGTGGCCCCGCACAATCCGGCCATGGATGCTTTGCAGCCGGCGATGCGTTCGGAGCTG
+GCCGATCTGACCCCACGGACCCCCACCATCGGAATCATCTCCACCACCTACGCAGACTTGCACACCCAAC
+CGGTCTTCGACGCCGAACACTGGGCCACCAACATGCGCAACCCCGTGCATTTCCAGCAGGCCATCGCTTC
+CGCCGGTAGCGGCGCCGACGGCGCCTACCACACCTTCATCGAAATCAGCGCACACCCGCTGCTGACCCAG
+GCCATCATCGACACTCTGCACAGCGCTCAACCCGGAGCCAGATACACCAGCCTCGGGACCCTGCAACGCG
+ACACCGACGACGTCGTGACCTTCCGGACCAACCTCAACAAGGCCCACACCATCCACCCACCGCACACCCC
+CCACCCCCCCGAGCCACATCCGCCCATCCCCACCACCCCGTGGCAACACACCCGTCACTGGATCACCACC
+AAATATCCGGCCGGCTCTGTTGGATCGGCCCCCCGAGCGGGCACACTGCTCGGCCAACACACCACCGTCG
+CCACGGTCTCAGCGAGTCCGCCCTCCCACCTCTGGCAAGCAAGGCTGGCTCCGGACGCCAAGCCGTACCA
+GGGCGGTCATCGATTCCACCAAGTCGAGGTGGTCCCAGCTTCTGTTGTGCTGCACACAATCCTTTCCGCT
+GCAACAGAATTGGGCTACTCCGCGTTGTCCGAGGTCCGATTCGAGCAACCCATTTTCGCCGACCGGCCAC
+GTCTAATCCAGGTCGTCGCCGACAACCGGGCGATCAGCCTGGCCTCGAGTCCGGCTGCCGGAACACCCTC
+AGACCGGTGGACGCGGCATGTTACCGCACAACTTTCCTCGTCACCGTCGGATTCGGCCAGCAGCTTGAAC
+GAGCACCATCGCGCCAACGGGCAGCCGCCCGAACGTGCTCACCGCGACCTGATTCCCGACCTGGCCGAGC
+TGCTCGCAATGCGCGGCATCGATGGCCTGCCTTTCTCATGGACCGTCGCGTCGTGGACACAGCACTCGAG
+CAACCTCACGGTTGCGATCGATCTCCCCGAAGCTCTGCCCGAAGGGTCGACTGGGCCGCTCCTTGACGCC
+GCGGTGCACCTCGCCGCGCTATCGGACGTCGCTGATTCGCGGCTCTACGTGCCGGCAAGCATCGAGCAGA
+TATCGCTCGGCGATGTCGTCACCGGGCCGCGTAGCTCGGTGACGCTGAACCGCACCGCTCACGACGACGA
+CGGGATCACCGTCGATGTCACCGTTGCAGCCCACGGCGAAGTGCCGTCCCTGTCGATGAGGTCGCTTCGA
+TACCGGGCTCTGGACTTTGGCCTAGACGTTGGTAGGGCGCAACCGCCCGCGTCGACCGGTCCGGTCGAGG
+CCTACTGTGATGCCACCAATTTCGTACACACGATCGACTGGCAACCGCAGACCGTTCCGGACGCGACGCA
+CCCAGGGGCCGAACAGGTAACCCATCCAGGACCCGTCGCGATAATCGGCGATGACGGCGCAGCGCTGTGT
+GAGACCCTCGAAGGGGCGGGCTACCAGCCGGCCGTGATGTCCGATGGGGTGTCGCAGGCCCGCTACGTCG
+TTTACGTCGCGGATTCTGATCCGGCTGGCGCCGACGAGACCGACGTCGACTTCGCCGTCCGGATCTGTAC
+CGAAATCACCGGTCTGGTGCGGACTCTCGCGGAACGCGATGCGGATAAGCCCGCGGCGCTATGGATCCTC
+ACCCGCGGAGTTCACGAATCGGTCGCCCCGTCCGCGCTGCGCCAGAGTTTCCTGTGGGGCCTTGCCGGTG
+TCATCGCCGCCGAACATCCCGAGCTGTGGGGCGGACTGGTCGATCTCGCGATCAACGACGACTTAGGCGA
+ATTCGGGCCGGCACTTGCCGAACTGCTTGCCAAACCAAGCAAGTCGATCTTGGTGCGTCGTGACGGCGTG
+GTGCTCGCCCCGGCCTTGGCTCCCGTCCGTGGCGAGCCGGCGCGCAAGTCCTTGCAGTGCAGGCCCGACG
+CGGCCTACCTCATCACCGGCGGCCTGGGCGCCCTTGGCCTGCTGATGGCCGATTGGCTCGCCGACCGCGG
+CGCTCATCGATTGGTGTTGACCGGCCGCACGCCATTGCCGCCACGGCGGGACTGGCAACTCGACACCCTC
+GACACCGAGCTGCGCCGGAGGATCGACGCGATCCGCGCCCTGGAAATGCGCGGGGTGACTGTCGAAGCCG
+TCGCCGCCGACGTCGGCTGCCGCGAAGACGTGCAGGCCCTGTTGGCCGCGCGCGACCGTGACGGAGCGGC
+ACCGATCCGCGGGATCATCCACGCCGCGGGCATTACCAACGATCAATTGGTGACGAGCATGACCGGCGAT
+GCGGTGCGACAGGTTATGTGGCCGAAGATCGGCGGCAGCCAGGTCCTACACGACGCATTTCCGCCCGGCA
+GCGTGGACTTCTTCTACTTGACCGCCTCGGCTGCCGGGATATTCGGCATTCCAGGGCAGGGTTCCTACGC
+CGCCGCCAATTCCTACTTGGACGCGCTGGCGCGGGCGCGCCGGCAACAGGGCTGCCACACCATGAGCCTC
+GACTGGGTAGCCTGGCGGGGGCTCGGATTGGCCGCGGACGCCCAGCTCGTCAGCGAAGAGCTAGCGCGAA
+TGGGTTCGCGTGACATCACGCCGTCGGAGGCATTCACCGCTTGGGAATTCGTCGATGGCTACGACGTCGC
+GCAAGCGGTCGTGGTGCCCATGCCCGCTCCGGCGGGCGCCGATGGATCCGGTGCGAACGCTTACCTATTG
+CCGGCGCGGAACTGGTCGGTGATGGCAGCGACCGAGGTGCGATCCGAGCTCGAACAGGGGTTACGCCGCA
+TCATTGCAGCCGAGCTGCGAGTGCCTGAGAAAGAGCTGGACACCGACCGCCCGTTCGCCGAGTTGGGTCT
+CAATTCCCTTATGGCAATGGCGATTCGGCGCGAGGCCGAGCAGTTTGTCGGCATCGAGTTGTCTGCCACC
+ATGTTGTTCAACCACCCAACGGTCAAATCACTCGCCAGCTACCTTGCCAAACGTGTGGCACCGCACGATG
+TGTCACAAGACAACCAGATTTCCGCGCTATCCTCGTCGGCCGGAAGTGTGTTGGACAGTCTATTCGATCG
+CATCGAATCGGCGCCGCCTGAGGCCGAGAGGTCGGTGTGATGCGAACGGCTTTCAGCCGGATTTCCGGTA
+TGACCGCGCAACAGCGCACCTCCCTAGCCGACGAGTTCGACAGGGTCTCTCGCATCGCCGTGGCCGAGCC
+GGTTGCGGTGGTTGGCATCGGCTGCCGCTTTCCGGGAGATGTGGATGGACCAGAGAGTTTCTGGGACTTT
+CTGGTCGCGGGCAGGAATGCGATCTCGACGGTGCCGGCAGATCGATGGGACGCAGAAGCGTTTTACCACC
+CCGACCCGCTAACACCGGGGCGGATGACGACGAAGTGGGGCGGCTTCGTCCCTGACGTCGCGGGCTTCGA
+CGCCGAATTCTTCGGTATCACACCGCGGGAAGCCGCGGCGATGGACCCGCAGCAGCGAATGCTGCTGGAG
+GTTGCCTGGGAAGCACTCGAACATGCCGGCATACCACCGGATTCCCTCGGCGGCACCCGAACCGCCGTCA
+TGATGGGGGTCTATTTCAACGAGTATCAGTCCATGTTGGCCGCCAGTCCGCAGAACGTAGACGCCTACAG
+CGGGACCGGAAATGCACACAGCATCACGGTGGGTCGCATCTCCTACCTGTTGGGATTACGGGGTCCGGCG
+GTCGCGGTGGACACCGCCTGCTCGTCGTCGTTGGTGGCTGTGCACCTGGCGTGTCAGAGTCTGAGGCTGC
+GCGAGACCGATCTGGCTCTCGCCGGTGGAGTGAGTATCACCCTTCGCCCAGAGACCCAAATCGCTATCTC
+TGCCTGGGGATTGCTGTCCCCGCAGGGCCGGTGTGCCGCATTCGATGCGGCGGCAGACGGATTTGTGCGC
+GGTGAGGGCGCCGGAGTGGTAGTGCTCAAGCGGTTGACGGACGCGGTGCGCGACGGCGACCAGGTGCTGG
+CGGTGGTGCGCGGTTCGGCAGTCAACCAGGACGGCAGGTCCAATGGCGTAACGGCGCCGAATACGGCAGC
+CCAGTGCGATGTGATCGCCGATGCCTTGCGATCCGGCGATGTGGCGCCTGACAGCGTGAATTACGTAGAG
+GCCCATGGAACCGGCACGGTGCTGGGCGACCCGATCGAATTCGAGGCCCTGGCCGCCACGTATGGCCACG
+GCGGGGACGCATGCGCGTTGGGTGCGGTGAAAACCAACATCGGTCATCTGGAGGCGGCCGCCGGGATCGC
+GGGGTTCATCAAGGCGACGCTGGCGGTACAACGCGCGACGATCCCGCCGAATCTGCATTTCTCGCAATGG
+AATCCAGCTATCGATGCCGCGTCGACCAGGTTTTTCGTTCCCACGCAGAACTCCCCGTGGCCAACCGCGG
+AGGGGCCGCGCCGGGCGGCGGTGTCGTCGTTCGGATTGGGCGGGACGAACGCACACGTGATCATCGAGCA
+AGGTAGCGAGCTGGCTCCGGTATCCGAAGGCGGCGAGGACACCGGGGTGTCGACGTTGGTGGTGACGGGT
+AAGACGGCCCAGCGGATGGCCGCGACGGCGCAGGTGCTGGCCGACTGGATGGAAGGTCCGGGCGCCGAGG
+TGGCCGTAGCTGATGTCGCCCACACGGTCAACCATCACCGGGCCCGCCAAGCCACGTTCGGCACCGTCGT
+AGCCCGTGACCGCGCCCAGGCGATAGCCGGACTGCGCGCGCTGGCCGCCGGCCAACACGCTCCCGGAGTG
+GTGAGCCACCAGGACGGTTCGCCGGGGCCGGGCACCGTATTCGTCTACTCCGGCCGCGGCTCGCAGTGGG
+CCGGGATGGGTCGCCAATTGTTGGCCGACGAGCCGGCTTTCGCCGCCGCGGTCGCCGAGCTGGAACCGGT
+GTTTGTCGAGCAAGCCGGCTTCTCGCTGCGCGACGTGATCGCCACCGGCAAGGAGCTAGTCGGTATCGAG
+CAGATCCAGCTTGGCCTGATCGGCATGCAACTGACATTGACTGAGCTATGGCGCTCCTACGGGGTGCAGC
+CCGACCTGGTGATCGGCCACTCCATGGGCGAGGTGGCCGCCGCCGTGGTCGCCGGAGCGCTGACTCCGGC
+CGAGGGTCTGCGGGTGACCGCCACCCGCGCACGGTTGATGGCGCCATTGTCCGGCCAGGGCGGCATGGCA
+CTGCTGGGACTCGATGCTGCGGCCACCGAAGCGTTAATCGCGGACTACCCGCAGGTGACAGTGGGGATCT
+ACAACTCGCCGCGGCAGACCGTGATCGCCGGGCCGACCGAACAAATCGATGAGTTGATCGCCCGGGTGCG
+CGCGCAAAACCGGTTTGCCAGTCGGGTCAATATCGAAGTCGCCCCGCACAATCCGGCCATGGATGCGCTG
+CAGCCGGCGATGCGTTCGGAGCTGGCCGATCTGACCCCACGGACCCCCACCATCGGAATCATCTCCACCA
+CCTACGCAGACTTGCACACCCAACCGATCTTCGACGCCGAACACTGGGCCACCAACATGCGCAACCCCGT
+GCGCTTCCAGCAGGCCATCGCTTCCGCCGGTAGCGGCGCCGACGGCGCCTACCACACCTTCATCGAGATC
+AGCGCACACCCGCTGCTGACCCAGGCGATTGCCGACACCTTGGAAGACGCGCACCGCCCAACCAAGTCCG
+CAGCGAAATACTTGAGCATTGGCACCTTGCAGCGTGATGCCGATGACACGGTCACCTTCCGCACCAACCT
+CTACACCGCCGACATCGCCCACCCACCGCATACCTGTCACCCGCCCGAGCCGCACCCCACCATCCCCACC
+ACACCCTGGCAACACACCCACCACTGGATCGCCACCACGCACCCGAGCACGGCAGCGCCAGAAGATCCGG
+GCAGCAATAAGGTTGTGGTGAACGGACAATCGACATCCGAGAGCCGTGCGCTCGAAGACTGGTGCCACCA
+GCTGGCCTGGCCGATCCGCCCGGCAGTCAGCGCCGACCCGCCCAGCACCGCCGCCTGGCTCGTGGTGGCA
+GACAACGAACTCTGCCACGAGCTGGCCCGTGCGGCCGATTCTCGGGTAGACAGCCTCTCGCCGCCGGCGC
+TCGCAGCAGGCAGCGATCCGGCCGCACTGCTCGACGCGCTGCGCGGTGTGGACAACGTGCTCTACGCTCC
+ACCCGTCCCCGGTGAACTCCTCGATATTGAATCGGCCTACCAGGTTTTCCACGCAACGCGACGGCTAGCC
+GCCGCGATGGTCGCCAGCAGCGCCACGGCTATTTCCCCGCCGAAGTTGTTCATCATGACCCGCAACGCCC
+AGCCCATCTCGGAAGGCGACCGAGCCAACCCTGGCCACGCTGTGCTGTGGGGTCTCGGCCGGTCGCTGGC
+ACTAGAGCATCCTGAAATCTGGGGCGGCATAATCGATCTCGACGATTCGATGCCCGCAGAGCTGGCCGTG
+CGGCATGTGCTGACTGCAGCCCACGGTACCGACGGGGAGGATCAGGTCGTATACCGGTCGGGCGCACGCC
+ATGTACCCCGGCTGCAGAGGCGAACTCTTCCGGGGAAACCGGTCACGTTGAATGCCGACGCCAGCCAGCT
+CGTCATCGGTGCGACCGGCAACATCGGACCGCATCTCATCCGACAGCTCGCGCGGATGGGGGCTAAGACA
+ATCGTCGCGATGGCTCGCAAGCCCGGCGCGCTCGACGAGTTGACCCAATGTCTCGCTGCGACCGGAACAG
+ATCTCATCGCGGTGGCCGCTGATGCGACCGATCCCGCCGCCATGCAAACCCTGTTCGACCGATTCGGCAC
+GGAGCTACCGCCACTGGAGGGAATCTATCTGGCGGCCTTTGCGGGCCGCCCAGCGCTGCTGAGCGAGATG
+ACCGACGACGACGTGACCACCATGTTTCGTCCCAAGTTGGACGCCTTGGCGTTGTTGCACCGACTGTCAC
+TGAAGAGCCCAGTGCGCCACTTCGTTTTGTTCTCTTCGGTGTCAGGTCTGCTGGGTTCTCGATGGCTCGC
+CCATTACACCGCGACCAGCGCCTTCCTGGACAGCTTCGCCGGCGCGCGTCGCACCATGGGCCTGCCGGCC
+ACCGTCGTCGACTGGGGACTGTGGAAGTCGCTGGCCGATGTGCAAAAAGACGCGACTCAAATCAGCGCGG
+AATCCGGGCTGCAACCCATGGCTGACGAGGTGGCCATCGGCGCGCTACCGCTGGTGATGAACCCCGATGC
+GGCAGTCGCGACCGTGGTGGTTGCCGCGGACTGGCCCTTGTTGGCCGCGGCATATCGAACGCGGGGAGCC
+CTTCGCATAGTCGACGACCTGTTGCCGGCACCGGAAGACGTCGGGAAGGGCGAAAGCGAATTCCGCACAT
+CGTTGCGTAGCTGCCCGGCGGAGAAACGACGGGACATGTTGTTCGACCATGTGGGCGCCTTGGCCGCCAC
+GGTGATGGGAATGCCGCCCACGGAGCCGCTCGATCCGTCGGCCGGCTTCTTCCAACTCGGCATGGACTCG
+CTAATGAGCGTGACACTTCAGCGGGCGTTGTCGGAAAGCCTGGGCGAGTTCTTGCCGGCGTCCGTGGTTT
+TCGACTATCCGACCGTTTACAGCCTCACCGACTACCTGGCCACCGTCCTGCCTGAGCTCCTCGAAATTGG
+GGCAACCGCAGTCGCAACCCAGCAAGCCACCGACTCCTACCACGAACTGACCGAAGCCGAGTTGTTGGAA
+CAACTTTCGGAACGACTAAGAGGAACACAATGACCGCAGCGACACCAGATCGCCGAGCGATCATCACCGA
+GGCGCTGCACAAGATCGATGATCTCACGGCGCGCCTGGAAATCGCCGAAAAATCCAGCAGCGAACCGATC
+GCGGTGATCGGCATGGGTTGCCGGTTCCCGGGCGGGGTCAACAACCCCGAACAGTTCTGGGATTTGTTGT
+GCGCCGGCCGAAGCGGCATCGTCCGGGTTCCCGCGCAGCGGTGGGACGCCGACGCCTACTACTGTGATGA
+TCACACCGTGCCGGGGACCATCTGCAGCACCGAAGGCGGTTTTCTCACCAGCTGGCAGCCAGATGAGTTC
+GATGCGGAGTTCTTCTCAATCTCCCCGCGCGAAGCGGCGGCGATGGACCCGCAGCAGCGATTGTTGATTG
+AAGTTGCGTGGGAAGCGCTAGAAGACGCGGGCGTCCCGCAACACACCATTCGCGGTACGCAAACCTCGGT
+ATTCGTCGGTGTCACCGCCTACGACTACATGCTCACGCTGGCGGGCCGGCTACGACCTGTTGACCTCGAC
+GCGTACATCCCAACCGGGAACTCGGCGAACTTCGCCGCCGGACGGCTGGCCTACATCCTCGGGGCACGCG
+GACCCGCGGTGGTCATCGACACGGCCTGCTCATCGTCGTTGGTGGCGGTGCACCTGGCATGCCAGAGCCT
+GCGCGGGCGGGAAAGCGATATGGCGTTGGTGGGTGGAACCAACCTTTTGCTGAGCCCGGGACCCAGCATC
+GCTTGCTCGCGATGGGGGATGCTGTCACCGGAGGGGCGGTGCAAGACCTTCGATGCGTCCGCCGATGGGT
+ACGTGCGCGGCGAGGGTGCCGCGGTGGTGGTGCTCAAGCGGCTGGATGACGCGGTGCGCGACGGCAACCG
+CATTCTTGCCGTGGTACGCGGTTCGGCGGTCAACCAGGACGGTGCCAGCAGCGGAGTGACCGTTCCCAAC
+GGGCCAGCGCAACAGGCGTTGCTCGCCAAAGCATTGACGTCGTCGAAGTTGACAGCGGCCGATATCGACT
+ACGTCGAGGCCCATGGAACTGGTACTCCGCTGGGCGACCCGATCGAACTCGATTCACTGAGTAAGGTTTT
+CAGCGATCGAGCGGGTTCGGATCAGTTGGTGATTGGATCGGTGAAGACCAATCTCGGTCACCTGGAAGCG
+GCGGCCGGTGTCGCCGGGCTGATGAAAGCCGTGCTCGCGGTACACAACGGCTACATTCCGCGGCATCTTA
+ACTTCCACCAGCTGACACCACATGCAAGTGAGGCCGCATCTCGGCTGAGGATCGCCGCCGATGGTATTGA
+CTGGCCAACCACCGGTCGACCTCGCCGGGCGGGGGTGTCGTCGTTCGGCGTCAGTGGGACGAATGCACAC
+GTGGTGATCGAGCAGGCACCCGATCCGATGGCCGCTGCGGGAACGGAGCCGCAGCGCGGCCCCGTTCCCG
+CGGTGTCGACGCTGGTGGTGTTCGGCAAGACCGCACCGCGGGTGGCTGCGACGGCATCGGTGCTGGCAGA
+TTGGCTGGACGGCCCCGGCGCGGCGGTGCCGCTGGCCGATGTCGCGCACACCCTCAACCATCACCGGGCC
+CGTCAGACCAGGTTCGGCACGGTAGCCGCTGTCGATCGGCGCCAAGCGGTGATCGGGTTACGCGCGCTGG
+CCGCGGGTCAATCCGCCCCCGGGGTGGTGGCACCCCGCGAAGGCTCCATCGGAGGCGGCACGGTGTTCGT
+CTACTCGGGACGAGGATCGCAGTGGGCCGGAATGGGGCGCCAACTGCTGGCCGACGAGCCGGCATTCGCC
+GCTGCCATCGCCGAACTGGAGCCGGAATTCGTTGCTCAAGGCGGGTTTTCGCTGCGCGACGTGATCGCCG
+GCGGAAAAGAGTTGGTTGGCATCGAACAGATCCAGCTGGGACTGATCGGGATGCAGCTGGCGCTGACCGC
+GTTGTGGCGCTCATACGGCGTGACACCCGATGCGGTGATAGGTCACTCGATGGGCGAAGTGGCCGCCGCG
+GTGGTGGCCGGGGCGCTGACCCCGGCCCAGGGATTACGGGTGACCGCGGTCCGGTCGAGGCTGATGGCGC
+CGCTGTCCGGGCAGGGCACGATGGCGTTGCTGGAACTCGACGCCGAAGCCACTGAGGCGCTGATTGCCGA
+CTACCCCGAGGTGAGCCTGGGGATCTATGCCTCCCCACGCCAAACCGTGATTTCCGGGCCGCCGCTATTG
+ATCGACGAGCTCATCGACAAGGTGCGCCAACAGAACGGCTTCGCTACCCGAGTCAACATCGAGGTGGCCC
+CCCACAACCCGGCCATGGATGCACTGCAACCGGCGATGCGTTCGGAATTGGCCGATCTCACCCCGCAACC
+GCCGACCATCCCGATCATCTCCACCACCTACGCCGACCTCGGCATTTCCCTGGGTTCCGGCCCCAGGTTC
+GACGCCGAGCACTGGGCAACCAACATGCGCAACCCGGTACGGTTCCACCAGGCCATCGCTCATGCCGGCG
+CCGATCACCACACCTTCATCGAGATCAGCGCCCACCCGCTGCTGACCCACTCGATCAGCGACACCCTGCG
+CGCCAGCTACGATGTCGACAACTATCTGAGCATCGGCACCTTGCAACGCGACGCTCACGACACCCTCGAG
+TTCCACACGAACCTCAACACGACCCACACCACCCATCCCCCCCAGACTCCCCACCCCCCCGAACCCCACC
+CCGTGCTGCCCACCACCCCATGGCAGCACACCCAGCACTGGATCACCGCCACGTCGGCCGCTTACCACAG
+GCCCGACACCCACCCGTTGCTTGGCGTCGGTGTCACCGACCCCACTAACGGCACCCGGGTTTGGGAAAGC
+GAGCTCGACCCTGATCTGCTGTGGCTCGCCGATCACGTCATCGACGATCTCGTTGTGCTGCCCGGGGCGG
+CCTACGCTGAGATCGCGCTGGCGGCCGCGACCGACACCTTCGCAGTCGAGCAAGATCAGCCCTGGATGAT
+CAGCGAGCTCGACCTTCGGCAGATGCTGCATGTGACCCCAGGCACCGTGTTGGTCACCACGCTCACCGGC
+GACGAGCAGCGATGCCAGGTCGAAATACGCACCCGCAGCGGGTCTTCGGGATGGACCACCCACGCCACCG
+CCACCGTTGCCCGCGCCGAGCCGTTAGCACCGCTGGATCACGAAGGACAGCGGCGCGAGGTAACCACTGC
+CGACCTCGAGGACCAACTGGATCCCGACGACCTGTATCAGCGCCTGCGCGGCGCCGGCCAACAGCACGGA
+CCCGCGTTTCAAGGCATCGTGGGGCTGGCCGTCACGCAAGCTGGCGTGGCCCGTGCGCAAGTACGGCTAC
+CCGCATCGGCCAGAACGGGTTCCCGTGAGTTCATGCTGCACCCGGTGATGATGGATATCGCGTTGCAGAC
+ACTGGGAGCCACCCGGACGGCGACCGATCTGGCCGGCGGCCAGGACGCCCGGCAGGGCCCATCTTCCAAC
+TCGGCCTTGGTGGTACCGGTGCGTTTCGCCGGTGTCCACGTGTACGGCGATATCACCCGCGGGGTTCGCG
+CGGTCGGCTCTCTGGCCGCAGCCGGTGACCGGCTGGTCGGCGAGGTAGTCCTGACCGACGCGAATGGCCA
+ACCGCTGCTGGTCGTCGATGAAGTCGAGATGGCGGTGCTCGGATCCGGCAGTGGCGCAACGGAACTCACC
+AACCGCCTATTCATGTTGGAGTGGGAGCCCGCACCGCTGGAAAAGACCGCCGAGGCTACGGGTGCCCTGT
+TGCTGATCGGTGACCCCGCCGCGGGTGACCCGCTGCTGCCCGCGCTGCAGTCGTCGCTGCGCGACCGCAT
+CACCGACCTCGAGCTGGCATCCGCGGCCGACGAAGCCACGCTGCGCGCGGCGATCAGCCGAACCTCCTGG
+GACGGGATCGTTGTGGTCTGTCCGCCCCGAGCGAACGACGAATCGATGCCGGACGAGGCTCAACTGGAGT
+TGGCACGCACACGCACGCTGCTGGTCGCCAGCGTGGTCGAGACCGTGACGCGAATGGGTGCCCGCAAGAG
+CCCCCGACTGTGGATCGTCACCCGTGGCGCTGCACAGTTCGACGCAGGCGAGTCGGTCACGTTGGCGCAG
+ACCGGCCTACGTGGCATCGCACGGGTGCTGACATTTGAGCATTCGGAGTTGAATACCACCCTCGTAGATA
+TCGAACCGGACGGCACCGGCTCGCTGGCCGCCCTGGCCGAGGAGTTGCTTGCCGGTTCCGAGGCCGACGA
+GGTCGCCTTGCGCGACGGTCAACGCTATGTCAACCGGCTGGTGCCCGCACCCACCACGACCAGTGGTGAT
+CTCGCCGCCGAAGCTCGCCACCAGGTGGTGAACCTGGACAGCTCGGGCGCTTCCAGGGCAGCTGTCCGAC
+TGCAGATCGATCAACCCGGACGGCTGGACGCACTAAACGTTCACGAGGTGAAACGGGGCAGACCGCAAGG
+CGATCAAGTCGAGGTTCGCGTCGTCGCCGCCGGACTCAACTTCAGCGACGTGCTCAAAGCGATGGGCGTG
+TATCCGGGACTCGACGGTGCCGCGCCGGTGATCGGCGGCGAATGTGTCGGCTACGTGACGGCCATCGGTG
+ACGAGGTTGACGGCGTCGAGGTCGGACAGCGAGTTATCGCATTCGGCCCTGGCACATTCGGGACCCATCT
+GGGGACCATCGCCGATCTCGTCGTCCCAATTCCGGACACGCTAGCCGACAACGAGGCGGCCACGTTCGGC
+GTCGCCTATCTCACCGCCTGGCACTCGCTGTGCGAGGTCGGGCGCCTATCCCCCGGCGAACGCGTGCTCA
+TCCATTCCGCCACCGGCGGTGTTGGAATGGCGGCGGTCTCGATCGCGAAGATGATCGGCGCCCGCATCTA
+CACGACGGCCGGTTCGGACGCCAAACGGGAAATGCTTTCCAGGCTCGGTGTCGAGTACGTCGGCGACTCG
+CGAAGCGTGGATTTCGCTGACGAGATCCTCGAGCTGACAGACGGCTACGGTGTGGACGTCGTTCTCAATT
+CGCTGGCGGGCGAGGCGATTCAACGCGGCGTGCAGATCCTTGCGCCCGGTGGCCGGTTCATCGAACTGGG
+CAAGAAGGACGTCTACGCCGATGCCAGCTTGGGCTTGGCCGCGCTAGCCAAGAGCGCGTCCTTCTCCGTG
+GTCGACCTCGACCTGAATCTCAAGCTGCAGCCGGCGCGCTACCGCCAACTCCTGCAACACATCCTGCAGC
+ACGTGGCGGATGGCAAACTCGAGGTACTTCCCGTCACCGCATTTAGCCTGCACGATGCGGCCGACGCATT
+CCGGCTTATGGCATCCGGTAAACACACCGGAAAGATCGTCATCTCGATACCCCAGCACGGCAGCATCGAG
+GCGATCGCTGCCCCGCCACCACTTCCTCTGGTCAGCCGCGACGGCGGCTACCTCATCGTCGGCGGTATGG
+GTGGTCTCGGATTCGTCGTCGCGCGCTGGCTGGCTGAGCAAGGTGCGGGACTGATTGTCCTCAACGGACG
+CTCGGCCCCCAGCGACGAGGTGGCAGCCGCTATCGCGGAGCTGAACGCCTCCGGTAGCCGGATCGAGGTG
+ATCACCGGCGACATCACCGAGCCAGACACCGCCGAGCGGCTGGTGCGGGCGGTCGAAGACGCCGGGTTCC
+GGCTGGCCGGGGTGGTGCACAGCGCGATGGTTCTCGCCGACGAGATCGTGTTGAACATGACCGATTCCGC
+CGCTCGGCGAGTGTTCGCCCCGAAGGTCACCGGCAGCTGGCGGCTTCATGTGGCCACCGCCGCGCGCGAC
+GTCGACTGGTGGCTGACCTTCTCCTCGGCCGCCGCGCTGCTGGGCACTCCCGGGCAGGGCGCGTACGCCG
+CCGCCAACTCGTGGGTCGACGGCCTGGTCGCGCATCGGCGCTCGGCCGGACTTCCCGCTGTCGGGATCAA
+CTGGGGCCCGTGGGCCGACGTTGGACGCGCGCAGTTCTTCAAAGACCTCGGGGTGGAGATGATCAACGCC
+GAGCAGGGGCTTGCCGCCATGCAGGCGGTACTCACCGCCGATCGCGGGCGCACCGGTGTGTTCAGCCTCG
+ACGCGCGGCAGTGGTTCCAATCGTTCCCCGCTGTGGCGGGGTCCTCGCTGTTCGCGAAGCTGCATGACTC
+GGCGGCCCGCAAAAGTGGGCAGCGGCGCGGCGGGGGCGCGATTCGCGCTCAGCTAGACGCCCTCGACGCG
+GCCGAACGCCCAGGCCACCTCGCGTCCGCGATCGCCGACGAGATCCGTGCGGTGCTGCGCTCAGGCGATC
+CCATCGATCACCACCGACCGCTGGAAACCCTGGGACTCGACTCGCTGATGGGCCTGGAATTGCGCAATCG
+GCTGGAAGCAAGTCTGGGCATCACGTTGCCGGTCGCGTTGGTGTGGGCATACCCGACGATCAGCGATCTC
+GCGACCGCCCTGTGCGAACGAATGGACTACGCGACACCCGCGGCTGCGCAGGAGATTTCCGATACAGAAC
+CCGAACTGTCCGACGAGGAGATGGATTTGCTCGCCGATCTGGTTGACGCCAGCGAGCTGGAAGCTGCGAC
+GCGAGGCGAGTCATGACAAGTCTGGCGGAGCGCGCGGCGCAACTGTCGCCGAACGCGCGAGCGGCCCTGG
+CGCGCGAGCTCGTCCGTGCGGGTACGACCTTCCCGACCGACATCTGCGAGCCGGTGGCGGTGGTGGGCAT
+CGGCTGTCGCTTTCCGGGGAATGTGACTGGGCCAGAGAGCTTTTGGCAGCTACTGGCCGACGGTGTGGAC
+ACAATCGAGCAGGTGCCGCCTGATCGGTGGGATGCGGACGCGTTCTACGATCCCGATCCTTCGGCGTCGG
+GTCGGATGACGACGAAATGGGGTGGTTTCGTTTCCGATGTCGACGCGTTCGACGCCGACTTTTTCGGAAT
+CACTCCTCGGGAAGCCGTGGCGATGGACCCGCAGCATCGGATACTGCTCGAGGTTGCCTGGGAAGCGTTG
+GAGCACGCGGGTATTCCGCCGGATTCCTTGAGCGGCACTCGAACCGGCGTGATGATGGGTCTGTCGTCGT
+GGGACTACACGATCGTCAATATCGAGCGCAGAGCCGACATCGACGCGTACCTGAGCACCGGAACCCCGCA
+CTGTGCCGCGGTGGGGCGGATCGCGTATCTGTTGGGATTGCGTGGTCCGGCCGTCGCCGTAGATACCGCT
+TGTTCGTCGTCGCTGGTGGCAATTCACTTGGCGTGTCAGAGCCTTCGCCTGCGTGAAACCGACGTGGCAT
+TGGCGGGCGGGGTGCAGCTCACCTTGTCACCGTTCACCGCCATCGCGCTGTCCAAGTGGTCGGCGCTGTC
+ACCGACCGGCCGATGCAACAGCTTCGACGCCAACGCGGATGGATTCGTGCGCGGCGAGGGCTGCGGCGTG
+GTGGTGCTCAAGCGGTTGGCCGACGCGGTGCGCGACCAGGACCGGGTGCTTGCGGTGGTCCGCGGTTCGG
+CAACTAACTCCGATGGTCGGTCCAACGGCATGACCGCACCGAACGCGCTGGCGCAGCGTGACGTGATCAC
+ATCCGCCCTCAAGCTTGCGGATGTTACCCCTGACAGCGTGAACTATGTCGAAACACACGGCACCGGAACG
+GTGTTGGGGGACCCCATCGAGTTCGAGTCGCTGGCGGCCACTTATGGCCTGGGTAAAGGCCAGGGCGAGA
+GCCCGTGCGCATTGGGGTCGGTCAAGACCAACATCGGCCACCTGGAGGCGGCCGCCGGTGTGGCTGGATT
+CATCAAGGCGGTGCTGGCGGTGCAACGTGGGCACATTCCCCGCAACTTGCACTTCACCCGGTGGAACCCG
+GCCATCGACGCGTCGGCGACGCGGCTGTTCGTGCCGACCGAAAGCGCCCCGTGGCCGGCGGCTGCCGGTC
+CACGCAGGGCTGCGGTGTCATCGTTCGGCCTCAGCGGGACCAACGCGCACGTGGTGGTCGAGCAGGCACC
+CGACACCGCAGTAGCCGCAGCCGGCGGCATGCCGTATGTTTCGGCGCTGAACGTCTCCGGCAAGACGGCC
+GCGCGGGTGGCGTCGGCGGCGGCGGTGCTGGCCGACTGGATGTCGGGGCCGGGCGCGGCGGCACCACTGG
+CCGACGTGGCACACACGTTGAACCGGCACCGGGCCCGGCACGCCAAGTTCGCCACCGTCATCGCGCGTGA
+CCGCGCCGAGGCGATCGCGGGGTTGCGAGCGCTGGCGGCCGGACAACCACGCGTTGGGGTGGTGGATTGC
+GACCAGCATGCCGGTGGGCCTGGCCGGGTTTTTGTGTATTCGGGTCAGGGCTCGCAGTGGGCGTCGATGG
+GCCAGCAGTTGCTGGCCAACGAACCGGCGTTCGCCAAGGCGGTAGCCGAGCTGGATCCGATATTCGTTGA
+CCAGGTTGGCTTTTCGCTGCAGCAAACGCTTATCGACGGCGACGAGGTGGTGGGCATCGACCGCATCCAG
+CCGGTGCTGGTCGGGATGCAGTTGGCGCTGACCGAGTTATGGCGGTCCTATGGGGTGATTCCAGATGCCG
+TGATCGGGCACTCGATGGGTGAGGTGTCGGCGGCAGTGGTGGCCGGCGCGTTGACGCCCGAGCAGGGCTT
+GCGGGTCATCACCACCCGGTCGCGGTTGATGGCGCGGCTGTCGGGGCAGGGAGCGATGGCGCTGCTCGAG
+CTGGATGCCGACGCCGCCGAGGCGCTGATTGCCGGCTATCCGCAGGTGACGCTGGCGGTGCATGCGTCAC
+CGCGCCAGACGGTGATCGCCGGGCCGCCCGAGCAGGTGGACACGGTGATCGCGGCGGTAGCGACGCAAAA
+CCGGTTGGCGCGCCGCGTCGAAGTCGACGTGGCCTCCCATCACCCGATCATCGATCCCATACTGCCCGAG
+TTGCGAAGCGCGTTAGCGGATTTGACTCCGCAGCCGCCGAGCATCCCGATCATTTCCACTACGTACGAAA
+GCGCGCAGCCGGTGGCGGATGCCGACTATTGGTCGGCCAACCTGCGCAACCCGGTGCGATTCCACCAGGC
+CGTCACCGCCGCCGGTGTCGACCACAACACCTTCATCGAAATCAGCCCTCACCCCGTGCTCACGCACGCA
+CTCACCGACACCCTGGATCCGGACGGCAGCCATACAGTCATGTCGACGATGAACCGCGAACTGGACCAGA
+CGCTGTATTTCCACGCCCAACTCGCCGCGGTCGGTGTGGCTGCGTCCGAGCACACCACCGGTCGCCTTGT
+CGACCTGCCCCCCACACCGTGGCACCATCAGCGATTCTGGGTCACGGATCGTTCGGCGATGTCCGAGCTG
+GCCGCGACCCACCCGCTCCTGGGCGCGCACATCGAGATGCCGCGCAACGGAGACCATGTCTGGCAGACCG
+ATGTCGGCACCGAGGTCTGTCCCTGGTTGGCAGACCACAAGGTGTTCGGTCAACCCATCATGCCGGCCGC
+GGGGTTCGCCGAGATCGCCTTGGCGGCGGCCAGCGAAGCCCTCGGCACAGCCGCCGACGCCGTCGCACCC
+AACATCGTGATCAACCAGTTCGAGGTGGAGCAGATGCTGCCCCTCGACGGCCACACGCCGCTAACGACGC
+AGTTAATTCGCGGCGGGGACAGCCAGATTCGGGTCGAGATCTATTCCCGCACGCGTGGCGGAGAGTTCTG
+CCGACACGCCACGGCCAAGGTTGAACAATCGCCGCGCGAATGTGCGCACGCGCACCCGGAAGCCCAAGGT
+CCCGCCACCGGGACAACAGTGTCGCCGGCCGATTTTTATGCCCTGCTCCGCCAAACCGGCCAACACCATG
+GTCCGGCGTTCGCGGCCTTAAGCCGGATCGTGCGCCTGGCCGATGGTTCCGCGGAAACCGAGATCAGCAT
+TCCCGACGAGGCGCCGCGCCATCCCGGGTATCGGCTGCACCCCGTGGTATTGGATGCGGCATTGCAAAGC
+GTGGGTGCCGCGATACCCGACGGCGAGATCGCGGGGTCGGCGGAAGCCAGCTATCTGCCAGTGTCGTTCG
+AGACCATCCGGGTGTACCGCGACATCGGTCGGCACGTCAGGTGTCGTGCCCACCTGACAAACCTCGACGG
+CGGCACCGGAAAGATGGGCAGGATCGTCCTAATCAACGACGCCGGCCACATAGCGGCCGAAGTGGACGGC
+ATCTATCTGCGTCGTGTCGAACGCCGTGCGGTACCCCTGCCACTAGAGCAGAAGATCTTCGATGCCGAAT
+GGACCGAAAGCCCGATCGCAGCCGTGCCGGCTCCGGAGCCAGCTGCCGAGACGACGCGGGGAAGTTGGCT
+GGTACTCGCCGATGCAACGGTGGATGCGCCAGGCAAGGCCCAGGCCAAGTCGATGGCCGACGACTTCGTG
+CAGCAGTGGCGCTCGCCGATGCGGCGGGTGCACACCGCCGATATCCACGACGAATCGGCGGTGCTGGCCG
+CATTTGCAGAAACGGCAGGCGATCCCGAGCACCCGCCGGTTGGCGTGGTGGTGTTCGTCGGCGGTGCCTC
+GAGTCGACTGGACGACGAGCTGGCGGCGGCGCGCGACACGGTGTGGTCGATCACCACGGTGGTTCGTGCG
+GTCGTCGGCACGTGGCACGGCCGATCACCGCGGCTATGGCTGGTCACCGGGGGCGGACTTTCCGTTGCCG
+ACGACGAGCCGGGAACACCCGCGGCGGCTTCCTTGAAAGGGCTGGTGCGGGTGCTCGCCTTCGAGCACCC
+GGACATGCGCACCACCCTGGTCGATCTGGACATCACACAAGACCCGCTGACCGCGCTGAGCGCGGAACTG
+CGGAATGCCGGGAGTGGGTCGCGCCATGATGACGTGATCGCGTGGCGCGGCGAGCGCAGGTTCGTCGAAC
+GGCTGTCGCGCGCCACGATCGATGTATCCAAAGGGCATCCGGTGGTGCGCCAGGGAGCGTCGTACGTCGT
+CACCGGCGGCCTCGGCGGTCTCGGCCTGGTCGTCGCTCGTTGGCTGGTGGACCGCGGCGCCGGCCGGGTG
+GTGCTGGGTGGCCGCAGCGATCCCACTGACGAGCAGTGCAACGTCCTGGCCGAACTGCAGACCCGCGCCG
+AGATCGTGGTTGTCCGTGGCGACGTGGCATCGCCGGGGGTGGCAGAAAAGCTGATTGAGACGGCCCGACA
+GTCTGGGGGCCAATTGCGCGGCGTCGTGCACGCCGCCGCGGTCATCGAAGACAGCCTGGTGTTCTCTATG
+AGCAGGGACAACCTAGAACGGGTGTGGGCACCCAAGGCCACCGGTGCGCTGCGCATGCACGAAGCCACCG
+CTGACTGCGAGCTCGACTGGTGGCTCGGATTCTCTTCCGCCGCTTCGCTATTGGGTTCTCCCGGGCAAGC
+GGCCTACGCGTGCGCCAGCGCGTGGCTGGACGCGCTGGTCGGATGGCGCAGGGCATCCGGCCTGCCGGCC
+GCGGTGATCAACTGGGGTCCGTGGTCGGAGGTAGGCGTCGCCCAGGCCTTGGTGGGCAGTGTTCTCGACA
+CGATCAGTGTCGCAGAAGGCATCGAGGCTCTCGACTCATTGCTTGCCGCCGACCGGATCCGCACTGGAGT
+GGCTCGGCTGCGTGCCGATCGGGCCCTGGTCGCATTCCCGGAGATCCGCAGCATCAGCTACTTCACCCAG
+GTGGTCGAGGAGCTGGACTCGGCGGGTGACCTCGGCGACTGGGGCGGGCCCGACGCGCTTGCCGACCTCG
+ACCCGGGCGAGGCGCGGCGCGCGGTGACCGAGCGGATGTGTGCGCGCATCGCTGCGGTGATGGGCTACAC
+TGACCAGTCGACTGTCGAACCCGCCGTGCCCTTGGACAAGCCCCTGACCGAGCTGGGGCTGGATTCTCTG
+ATGGCGGTACGAATACGCAACGGCGCGCGGGCGGATTTCGGCGTGGAACCGCCGGTAGCGCTGATACTGC
+AAGGCGCGTCCTTGCATGACCTGACGGCGGACTTAATGCGCCAACTCGGGCTCAATGATCCCGATCCGGC
+GCTCAACAACGCTGACACTATTCGCGACCGGGCGCGCCAGCGCGCGGCAGCGCGACACGGAGCCGCGATG
+CGGCGCCGACCTAAACCTGCAGTACAGGGAGGATAAGACCTGTGAGCATCCCCGAGAACGCGATCGCGGT
+GGTCGGCATGGCCGGCCGATTTCCGGGCGCCAAGGATGTTTCGGCGTTCTGGAGCAACCTTCGGCGCGGT
+AAGGAGTCGATCGTCACCCTGTCCGAACAGGAGCTGCGCGACGCCGGCGTCAGCGACAAGACGCTGGCCG
+ATCCGGCGTATGTGCGTCGCGCCCCGCTTCTTGACGGGATCGACGAGTTCGACGCCGGCTTCTTCGGGTT
+CCCGCCGCTGGCCGCGCAGGTGCTGGATCCCCAACACCGGTTGTTCCTGCAGTGTGCATGGCATGCGCTC
+GAGGACGCGGGCGCTGACCCCGCACGGTTCGACGGCTCGATCGGCGTATACGGAACCAGCTCCCCCAGCG
+GCTATCTGCTGCACAACCTGCTGTCGCATCGCGACCCGAACGCTGTGTTGGCCGAGGGACTCAACTTCGA
+CCAGTTCAGCCTGTTCTTGCAGAATGACAAGGACTTTCTGGCAACCCGGATTTCGCACGCGTTCAACCTG
+CGCGGGCCGAGCATCGCGGTGCAAACCGCGTGTTCATCGTCGCTGGTAGCGGTGCATCTGGCCTGCCTGA
+GCCTGCTATCCGGCGAATGCGACATGGCGTTGGCCGGCGGGTCGTCGCTATGCATCCCGCACCGTGTCGG
+CTACTTCACCTCACCGGGATCGATGGTGTCGGCGGTGGGCCACTGTCGGCCCTTCGACGTGCGGGCCGAC
+GGCACGGTCTTCGGCAGCGGTGTCGGGTTGGTGGTGCTCAAGCCGCTGGCGGCCGCCATCGACGCCGGAG
+ACCGGATTCACGCCGTCATCCGCGGATCGGCGATCAACAACGACGGATCGGCGAAGATGGGGTATGCGGC
+GCCCAACCCGGCCGCTCAAGCCGATGTCATCGCCGAAGCCCATGCGGTGTCCGGCATCGATTCGTCGACC
+GTGAGCTATGTCGAGTGCCACGGAACCGGCACCCCGCTCGGTGATCCTATCGAAATCCAGGGCCTGCGAG
+CGGCGTTCGAGGTGTCGCAGACGAGCCGTTCGGCCCCTTGTGTTCTGGGGTCGGTCAAGTCGAACATCGG
+CCACCTGGAAGTTGCTGCCGGCATCGCGGGTCTGATCAAAACGATTCTGTGCCTAAAGAACAAGGCACTA
+CCCGCGACGCTGCACTACACCAGCCCGAACCCGGAACTGCGCTTGGACCAAAGTCCGTTCGTCGTGCAAA
+GCAAGTACGGCCCCTGGGAGTGCGACGGCGTTCGTCGTGCCGGGGTGAGTTCGTTCGGGGTCGGGGGTAC
+CAACGCGCACGTCGTCTTGGAGGAGGCGCCAGCAGAAGCATCGGAGGTTTCAGCGCACGCCGAGCCGGCT
+GGCCCTCAGGTAATCCTGCTCTCGGCGCAAACGGCCGCGGCGCTCGGCGAGTCGCGGACCGCCCTGGCCG
+CGGCGCTAGAAACGCAAGACGGCCCGCGCCTGTCCGACGTGGCCTACACGCTCGCCCGGCGCCGCAAGCA
+CAACGTCACGATGGCCGCCGTCGTGCACGACCGCGAGCACGCGGCCACCGTGCTGCGGGCGGCCGAGCAC
+GACAACGTTTTCGTTGGCGAAGCCGCCCACGATGGGGAGCATGGCGATCGCGCCGACGCCGCACCCACGT
+CGGATCGCGTCGTTTTCCTGTTTCCCGGACAGGGCGCTCAGCACGTCGGAATGGCAAAAGGGCTCTATGA
+CACCGAGCCGGTCTTCGCCCAACACTTCGACACCTGCGCCGCCGGATTCCGCGACGAGACAGGCATCGAC
+TTGCATGCCGAAGTGTTCGACGGGACCGCAACAGATCTTGAGCGCATTGACCGTTCGCAACCGGCGTTGT
+TCACGGTGGAATACGCGCTCGCGAAGTTGGTCGACACTTTCGGCGTGCGCGCCGGGGCGTACATCGGATA
+CAGCACCGGCGAATACATCGCGGCCACCCTGGCCGGCGTATTCGACCTGCAGACAGCGATCAAAACGGTG
+TCGCTGCGCGCCCGCCTTATGCATGAGTCGCCGCCCGGTGCCATGGTCGCGGTGGCTCTTGGCCCCGATG
+ACGTCACGCAGTACCTGCCACCGGAGGTCGAGCTGTCCGCGGTAAACGATCCTGGTAACTGTGTGGTCGC
+CGGGCCCAAAGACCAGATCCGTGCACTGCGCCAACGTCTTACCGAGGCAGGGATTCCCGTTCGCCGCGTC
+CGGGCAACCCACGCGTTCCATACCAGCGCGATGGATCCCATGCTGGGCCAATTCCAAGAATTCCTGTCCC
+GTCAACAGCTACGTCCTCCGCGCACACCGCTGCTGAGCAACCTCACCGGTAGCTGGATGTCCGACCAGCA
+AGTAGTCGATCCGGCCAGCTGGACGCGTCAAATCAGCTCCCCCATCAGGTTCGCCGACGAGCTGGACGTG
+GTGCTGGCAGCTCCAAGTCGAATCCTGGTCGAGGTTGGTCCGGGCGGCAGCCTGACCGGTTCGGCTATGC
+GCCACCCGAAGTGGTCGACCACGCACCGCACCGTTCGGCTTATGCGCCACCCACTGCAAGACGTCGACGA
+CCGCGACACTTTTCTGCGCGCGCTGGGCGAACTCTGGTCTGCCGGAGTCGAGGTCGACTGGACGCCGCGG
+CGTCCGGCGGTGCCGCACCTCGTTTCCCTGCCGGGTTATCCATTTGCCCGTCAACGGCATTGGGTCGAAC
+CTAACCACACGGTTTGGGCGCAGGCTCCCGGCGCAAACAACGGCTCACCGGCCGGCACTGCGGATGGTTC
+CACGGCCGCCACCGTCGATGCAGCCCGCAACGGAGAGTCGCAGACCGAGGTTACGCTGCAACGCATCTGG
+TCACAGTGCCTCGGCGTCAGCTCGGTCGATCGGAACGCCAATTTCTTCGACCTCGGCGGCGATTCTTTGA
+TGGCGATCAGCATCGCGATGGCCGCCGCCAACGAGGGTCTGACCATCACGCCGCAGGATCTCTACGAATA
+CCCGACCCTGGCCTCGCTGACGGCCGCCGTCGACGCGTCGTTCGCGTCCAGCGGGTTGGCGAAGCCCCCG
+GAGGCACAGGCGAACCCGGCGGTTCCACCCAACGTCACGTACTTCCTCGACCGCGGATTGCGCGACACCG
+GCCGCTGTCGTGTCCCGCTGATCCTGCGCCTGGATCCCAAGATCGGGCTACCGGATATTCGAGCGGTGCT
+GACCGCAGTGGTCAACCACCACGACGCATTGCGCCTGCACCTGGTCGGCAACGATGGGATATGGGAGCAG
+CACATCGCGGCACCCGCAGAATTCACCGGGCTTTCCAACCGGTCGGTGCCCGACGGCGTGGCTGCAGGCA
+GCCCCGAGGAACGGGCCGCGGTCTTGGGCATCCTGGCCGAACTCCTTGAGGATCAAACGGATCCGAACGC
+GCCGCTGGCTGCCGTTCATATCGCCGCCGCGCACGGCGGTCCGCACTATCTGTGCCTTGCCATACATGCG
+ATGGTCACCGACGACTCATCGCGCCAGATCCTGGCGACCGACATCGTCACCGCGTTTGGACAACGGCTGG
+CAGGCGAGGAGATCACGCTGGAACCGGTCAGCACGGGGTGGCGGGAATGGTCACTGCGTTGCGCGGCCCT
+CGCGACGCATCCGGCGGCGCTGGACACTCGCTCGTACTGGATCGAGAATTCGACCAAGGCGACTTTGTGG
+CTGGCCGATGCCCTTCCCAACGCGCATACCGCCCATCCGCCCCGCGCCGACGAGCTCACCAAGTTGTCGA
+GCACGCTAAGCGTCGAGCAGACATCCGAGCTGGACGACGGCCGGCGCAGGTTCCGCCGGTCGATTCAGAC
+GATCCTGCTGGCCGCCCTCGGCCGCACAATAGCTCAGACGGTAGGTGAGGGTGTGGTCGCCGTGGAGCTC
+GAAGGCGAGGGCCGCTCGGTGCTGCGGCCGGATGTCGACCTGCGCAGAACGGTCGGCTGGTTCACGACGT
+ACTACCCGGTACCGCTGGCATGCGCAACAGGGCTGGGCGCGCTTGCGCAGCTGGACGCGGTGCACAACAC
+TCTTAAGTCCGTTCCGCACTACGGAATTGGATACGGGCTGCTGCGCTACGTTTACGCCCCGACCGGACGT
+GTCCTGGGCGCTCAGCGCACACCCGACATTCACTTCCGGTATGCGGGCGTGATCCCCGAGCTACCGTCCG
+GCGATGCTCCAGTACAGTTCGACTCGGACATGACGCTTCCGGTGCGCGAACCGATCCCAGGGATGGGCCA
+CGCCATCGAACTTCGGGTGTATCGGTTTGGTGGCTCACTGCATCTCGATTGGTGGTACGACACCCGCCGG
+ATCCCGGCGGCAACGGCAGAAGCGCTGGAGCGGACCTTCCCGCTGGCCCTCAGCGCGCTGATCCAGGAGG
+CCATCGCGGCCGAGCACACAGAGCACGACGACAGCGAGATAGTCGGGGAACCCGAGGCGGGCGCTCTGGT
+GGACCTGTCGAGCATGGATGCCGGCTGAGGAGGATCGGATGCGCAACGACGACATGGCGGTGGTGGTTAA
+CGGGGTTCGCAAGACCTACGGCAAGGGCAAGATTGTGGCCCTCGATGACGTGAGTTTCAAGGTGCGCCGC
+GGTGAAGTGATCGGGCTGCTGGGCCCCAACGGGGCCGGCAAGACGACCATGGTGGACATCTTGTCGACGC
+TGACCCGACCGGATGCCGGCTCGGCGATCATCGCTGGCTACGATGTTGTTTCCGAACCGGCCGGTGTACG
+CCGCTCGATCATGGTCACCGGGCAGCAGGTGGCCGTCGACGACGCGCTTTCCGGTGAGCAGAACCTGGTG
+TTGTTTGGTCGTCTGTGGGGACTGAGCAAGTCCGCGGCGCGCAAACGCGCCGCCGAACTGCTCGAGCAAT
+TCAGCCTCGTACATGCCGGAAAGAGGCGGGTGGGCACCTACTCCGGCGGAATGCGCCGACGAATAGACAT
+CGCGTGCGGATTGGTGGTCCAACCCCAGGTGGCGTTCTTAGACGAGCCCACCACCGGGCTCGATCCCAGG
+AGCCGGCAAGCTATTTGGGATCTGGTGGCCAGCTTCAAGAAGCTGGGCATTGCCACGTTGTTGACCACGC
+AGTATCTCGAGGAGGCGGATGCGCTCAGTGACCGCATCATCCTGATCGATCACGGCATAATCATCGCCGA
+AGGCACCGCGAATGAACTCAAGCACCGCGCCGGCGACACCTTCTGCGAAATAGTGCCCCGCGATCTGAAG
+GATCTGGACGCTATCGTCGCGGCGCTCGGTTCGCTGTTGCCCGAGCACCACAGGGCGATGCTGACGCCCG
+ACTCAGACCGCATTACGATGCCGGCGCCTGACGGCATACGTATGCTCGTCGAGGCAGCGCGCCGGATCGA
+CGAGGCGAGGATCGAGCTAGCCGATATTGCGCTGCGCCGACCGTCACTCGATGACGTATTCCTGGCCATG
+ACGACCGATCCCACCGAGTCTCTGACCCATCTGGTGTCGGGGTCCGCGCGATGAGCGGCCCGGCCATAGA
+TGCGAGCCCCGCCCTGACCTTCAACCAGTCAAGCGCGAGCATTCAGCAGCGACGCTTATCGACCGGGCGA
+CAGATGTGGGTGCTCTATCGGCGTTTCGCCGCGCCGAGCCTACTCAACGGTGAAGTACTCACCACGGTGG
+GCGCGCCGATAATTTTCATGGTGGGCTTCTATATCCCGTTCGCCATACCGTGGAACCAATTTGTGGGTGG
+CGCCAGCTCGGGCGTCGCCAGCAACTTAGGGCAATACATCACGCCGTTGGTCACACTGCAGGCGGTCTCG
+TTCGCCGCGATCGGGTCGGGCTTTCGAGCCGCGACCGATTCGCTGCTAGGCGTCAATCGTCGGTTTCAGT
+CCATGCCGATGGCCCCGTTGACGCCACTGCTTGCCCGCGTGTGGGTGGCTGTGGACCGATGCTTCACGGG
+TTTGGTGATATCGCTAGTTTGCGGCTACGTCATCGGATTCCGTTTTCATCGCGGGGCCCTCTATATCGTC
+GGTTTTTGCCTACTGGTTATCGCGATCGGGGCTGTGCTGTCATTCGCCGCTGACCTGGTTGGCACCGTTA
+CCAGGAACCCAGACGCGATGCTGCCGCTGCTGAGCTTGCCCATTTTGATCTTCGGACTGCTGTCCATTGG
+TCTTATGCCGTTAAAGCTGTTTCCGCACTGGATCCATCCATTTGTTCGCAACCAGCCGATCTCCCAGTTC
+GTCGCGGCGCTGCGGGCATTGGCCGGAGATACCACCAAGACAGCCTCACAGGTGAGTTGGCCTGTGATGG
+CTCCGACGTTGACGTGGTTGTTCGCTTTCGTGGTGATCCTGGCGCTTTCATCCACCATTGTTTTGGCTAG
+GCGGCCATGATCACGACGACAAGTCAGGAAATCGAGCTTGCACCCACACGTTTGCCAGGCTCGCAAAACG
+CTGCTCGGCTGTTCGTTGCGCAGACCCTTTTGCAGACCAACCGGTTGCTAACTCGATGGGCACGTGACTA
+TATCACCGTTATCGGAGCGATCGTGTTACCGATTCTCTTCATGGTGGTGTTGAACATTGTGCTAGGTAAC
+CTAGCTTATGTCGTAACCCACGACAGCGGGCTCTACAGCATTGTTCCGCTGATCGCACTCGGCGCCGCGA
+TCACTGGGTCAACTTTTGTCGCGATCGACCTGATGCGCGAGCGCTCCTTCGGACTGCTTGCCCGACTGTG
+GGTGCTGCCCGTGCACCGAGCATCGGGCCTGATCTCTCGAATCCTGGCAAACGCGATTCGGACTCTGGTC
+ACCACTTTAGTGATGCTAGGTACTGGGGTGGTATTGGGTTTCCGGTTTCGACAAGGCCTGATCCCGAGCC
+TCATGTGGATTAGTGTCCCGGTGATACTGGGCATCGCAATCGCGGCTATGGTCACTACCGTCGCGCTTTA
+CACAGCACAAACCGTTGTTGTCGAAGGCGTTGAGCTGGTGCAAGCAATCGCGATCTTCTTCTCCACGGGT
+TTGGTGCCGCTCAACTCGTATCCAGGCTGGATTCAGCCGTTCGTCGCCCATCAGCCGGTGAGCTACGCCA
+TCGCGGCGATGCGCGGTTTTGCAATGGGTGGTCCGGTCCTCTCTCCGATGATCGGGATGCTGGTGTGGAC
+CGCGGGTATCTGCGTCGTATGCGCCGTACCCTTGGCCATTGGCTACCGACGGGCCAGCACGCATTGACCA
+GCACCGCTGGCCCGGGATGCCGTGACGAGTTGGGAGTGTTGAGATGTTTCCCGGATCTGTGATCCGAAAG
+CTGTCGCACAGCGAGGAAGTCTTCGCGCAGTACGAGGTTTTTACTTCCATGACAATCCAGCTGCGCGGTG
+TTATCGATGTCGATGCGCTGTCGGATGCCTTCGACGCCCTCTTGGAAACCCACCCAGTCCTGGCCAGCCA
+CCTTGAGCAAAGCTCCGACGGCGGTTGGAATCTCGTTGCCGACGACCTGCTGCACTCTGGAATCTGTGTC
+ATCGACGGCACGGCCGCCACCAACGGGTCACCGTCGGGAAACGCCGAACTACGGCTCGACCAGAGCGTGT
+CCCTATTGCATCTGCAGCTGATCCTCCGCGAAGGAGGAGCCGAGCTGACGCTATACCTCCATCACTGCAT
+GGCCGATGGTCATCACGGGGCCGTTCTCGTCGACGAGCTGTTCTCCCGCTACACCGACGCGGTCACTACC
+GGTGACCCCGGCCCGATAACCCCGCAGCCCACGCCGCTGTCAATGGAGGCTGTGCTGGCACAGCGGGGTA
+TCAGGAAGCAAGGGCTTTCGGGAGCTGAACGTTTTATGTCGGTGATGTATGCCTATGAGATCCCTGCCAC
+CGAGACGCCGGCGGTCCTCGCGCATCCTGGGCTGCCCCAAGCTGTTCCGGTCACCCGACTCTGGCTTTCC
+AAGCAGCAGACATCGGACCTCATGGCGTTCGGCCGCGAGCATCGCCTCAGCCTTAACGCCGTGGTCGCGG
+CAGCCATCCTGCTGACCGAGTGGCAGCTGCGCAACACCCCGCACGTCCCGATTCCCTACGTTTACCCCGT
+CGACCTGCGATTTGTTCTAGCTCCCCCAGTGGCCCCGACAGAAGCTACCAATCTCCTCGGGGCGGCGTCT
+TACCTCGCTGAGATCGGGCCGAATACCGACATCGTGGATCTGGCAAGCGATATCGTTGCCACACTTCGGG
+CTGACTTGGCCAATGGTGTGATTCAGCAGTCGGGGCTCCACTTCGGCACGGCATTCGAAGGAACTCCTCC
+CGGCCTACCACCACTTGTCTTCTGCACTGACGCCACTTCATTTCCCACCATGCGCACACCGCCGGGCCTG
+GAGATCGAAGACATTAAGGGCCAATTCTATTGTTCGATCAGCGTCCCCCTCGATCTGTACTCGTGTGCCG
+TTTACGCAGGACAACTGATCATCGAGCATCATGGGCACATCGCGGAACCGGGGAAGTCCCTCGAGGCGAT
+ACGTTCACTGCTGTGCACCGTTCCCTCGGAGTATGGCTGGATCATGGAGTGACCTAACGAACCAGCCCGC
+CGATCGGGCTTCGGCCAGATCACGCACTCGCGTCCCGAACCGATCATCATATCCGCCCCAGCTGCGGTCG
+CGGCTGACAAGCCTTACCCCGCAGCTCACCTCATGATCTCACCACGAGGCTTGCGGCACAACAGAATTCG
+ACCGCTATGATGCCGCCGGTGCCGCCGCCTGCTCCTCGGCCAGCGTGTCCGCCAAGTACTGGGCCAAAGC
+GCGGGCGGTGTTGTTTGTGGCGATGACCTTGGGGGTCAGGCGTATCCCGGTCTCGGTTTCAACGTGGGTA
+CGCATCTCGAGCATGCCCAGCGAATCCAGGCCGTACTCGATGAATGAGCGGTCAGCGTCGATCGTGCGAC
+GCAGGATCACACTGGCCTGCTCAACCAGCAGACGCCGTAGCCGGCCGGCCCATTCATCTTGCGGCAGCGA
+AAGGAGCTCCATGCGGAATTTGCTTGGGCCCCTTGACCGCTGCCCAGTGGATGCGAACATTTCACCCCAC
+GGGCTGCGTCGGACAAGGTCGGCCAGCCATGGCGCCCCGAGGATCGGAATGTAACCGCTGTAGGCGCGGT
+CGTGGCGCACGAGCGTCTCGAAGGCATACGCACCTTCCTCCGGGGTGATCATGATTTCGCCCCCCTCGGC
+CAAGAACGTGGCGCGGCCGACCTCGCCCCACGCACCCCACGCAATCGCGCTGACCGGCAGGCCCTGGGCG
+CGGCGCCAGTGCGCGAAGACGTCGACCCAGCTGTTGGCCGCCGCGTAGGCGCCCTGACCCGGCGAGCCGA
+GCAATGCCGCTCCCGAGGAGAACAAGCAGAACCAGTCCAGCGGCTGACCGAGGGTGGCGCGGTGTAGGTT
+CCAGGATCCGAACACCTTGGGCGACCAGTCGCGATCGATGAGCTCATCGGTGATGTTGGTCAGCGTGGCA
+TCCTCGACCACCGCCGCCGAGTGCAGCACACCGCGCAGCGGAAGCCCGGTAGCGGTCGCCGCACTCACCA
+GCCGGTCCGCCGTGTCGGGTTCGGCGATGTTGCCACACTCCACCACGATGTCGGCCCCAGCCGCGCGCAG
+GCCTTCGATGGTCTGCCGCGCTTTGGGGTTGGGCTGGGAACGTGCGGTCAGCACGATCCGGCCACAGCCC
+GCCGCGGCCAGCTTCGAGGCGAAGAACAGGCCGAGGCCACCCAGGCCGCCGGTGATGATGTAGGAGCCGT
+CGCGGCGGTACAGCGGAGCTTGCTCCGGGGTGACCGCCACGCTTCTACGGCCGCTACGCGGTACGTCGAG
+CACGAGTTTGCCGGTGTGCTCGGCGTTGCTCATTGCCCGGATGGCGTCGGCCGCCTCGGCCAACGGGTAA
+TGAGTGCATTGCGGTGCGGTCAGCACCCCGTCTGCGGTGAGCTTGAACACCGTGGCCAGCAACTCACGGA
+CCCGGTCGGGCTGGGTGACCGACATCAGCGCGAGGTCCAAGTAGTAGAAGGTCAGTCCGCGACGGAACGG
+GAACAGCCCCAGCCGGGTGTTGCCGTAAACGTCGGCCTTGCCGATTTCGACGAAGCGTCCGCCGAAGGCC
+AACAACTCCAGCCCCGCACGTTGGGCGGCGCCGGTCAGCGAGTTCAGCACGATATCCACGCCGTACCCGT
+CGGTGTCGCGCCGGATCTGCTCGGCGAACTCGACGCTGCGCGAATCGTAGACATGCTCGACGCCCATGTC
+GCGCAGCATGGCTCGCTTCGCGGGATTGCCGGCGGTCGCGAAAATCTCCGCTCCCTTGGCGCGGGCAATC
+GATATGGCCGCCTGCCCCACACCGCCGGTGGCGGAGTGAATCAACACTTTGTCACCGGCCTTGATCTGAG
+CCAGGTCGTTGAGCCCATACCAGGCGGTGGCATGCGCGGTGGCCGCCGTGATCGCCTGCTCATCGGTCAA
+GCCGGGCGGCAGCGTGACCGCGAGGTTGGCGTCACAGGTGAGGAACGTCCGCCAACAGCCACCTTCGGAG
+AAACCGCCAACACGATCACCGACCTGGTGACCGGTGACACCTTCCCCGACCGCAGTCACCACACCGACGA
+AATCCATACCCAACTGCGGCTCGCGGTCATCGATAATGGGGAATCGTCCAAACGCGATCAAAACGTCGGC
+GAAGTTGATGCTGGACATGCTGACCGCGACTTCGATTTGCCCGGGGCCGGGCGGAACTCGGTCACTCGCA
+ACGAATTCCAACGTTTGCAAGTCTCCCGGCCTGCGGACCTGCACCCGCATACCGTCGTGGTCGGGATCCA
+AGACCGCGGTGCGCCGCTCTTCATGGCCCAGCGGACTGGGGGTCAAGCGGGCCACATACCAGTCGCCATT
+CCGCCAGGCCGTCTCGTCCTCTTCCGATCCGCTCAGCAGCTGCTGGGCCACCCGCTCAACGTCCGTGTGT
+TCGTCCACATCGATCAAGGTGGTGCGCAGCATCGGATGTTCACTGCTGATCACCCGTAGCAGACCACGCA
+GGCCGGCCTGCTCCAGGTTGGCTCTTTCTCCCGAGTCGTGCGGCTTCACTATCTGGGCTTGTCTGGTCAC
+CACGAACAAGCGCGGCAGCTCGCCCTCGAATTCAGCCAGTTCCCGGGTGATCCGAACCAGGTGACGGACC
+TGTTCACGACCGGCCAGCAGACTGTGCTCATCGGGGTCGCCGACGCGAGGCCCATACACGATCACCACAC
+CATCGCGGCCACGCAGCTGGCTGCCCAGCTTTTCGAGGCCAGCTTGATCGTTGGGCGGGGTGTCCTGGAC
+CGACCAGGACAGGCTGGCGCATTCGGTGCCTTGGGGGCCGTGGGACTTCAGCGCGTCCGTCAACGTGGAA
+GCCAACATGTCGGGGGTGTCGACGGCGTTGGAAGTGTCGATCAATAGCCACGATCCAGCCTCGCCGTCGC
+CAACCTCGGGCAGCGCTCGCTGCTGCCATCCGAGGGTCAGTAGCCGCTCGCTGACTAGGCGGTCACGCTC
+GTCGCGTTCGGAGGTCCCGGTTCCCATGCGTAGCCCACGCACGGCCAACAGGACGGTCCCGTGCTCGTCC
+AGCACGTCGAGGTCGGCCTCACCACCTCGGGTCCCGTCGTTGAAGGCCTTGGTCAACCGCGTGTAGCAGT
+AGCGGGCATTGCGGGTAGGCCCGTAGGCACGCAGGCTGCGCACACCCAACGGCAACAGCAGGCCACCAGT
+GGCCGTACCGGCCTGGACGCCCGCGCCGACCGACTGGAAACAAGCGTCCAGCAGCGCCGGGTGGATTCGG
+TAGGCGCCCTGCTGGAACCGGATCGACGCGGGCAGCGCGACCTCGGCCAGCACCGTCGCGGCTCCCGCCT
+CGGCGGTATGCGCGGTGGTCAGACCACCGAACGCGGCGCCCAAAGTAACACCACGCTCGGCGAACGATTC
+CCGCATGGCGGTCCCGTTCACGGCGTGCGGATGCGCCTGCAGCAGAGCGGTGATGTCGTACCCCGGCGGC
+GGGCAGTCATCTTCGGCGGCGCGCAGCGCCGCGGTGGCATGCCGGGTGGTTTCACCGTCCCGGTTGGTCT
+CCACGGTGAAGTTGACGACACCAGGCGCGTCGATCGATGCGACGGCGTCGATCGGGGTCTGCTCGTCGAG
+CAACAACATCTGCTCAAAGGTGATGTCGCGAACCTCAGCCGCTTCGCCGAAGACCTCAGCGGCCGCAGCC
+AAAGCCATCTCGCAGTAGGCGGCGCCGGGAAGGGCGGCAACGTTATGCACCTGATGATCGCTGAGCCAGG
+ACAGCACCGAGGTGCCAACGTCGCCCTGCCAGACGTGGCGCTCAGGTTCCTCAGTCAGCCGCACATGCGA
+GCCAAGCAACGGATGCACGGTGATGGTGCAGGCACCTTGTGCCCGCTGTTCTTGCCCATCATCGTCGATG
+AATAGGCGGGCGTGGGTCCACGCCGGCAGCGGCGCATCCACCAGCCGCCCAGCGGGATACAGCGCCGAAT
+AGTCCAAAGCGGCGCCCGCGCGGTGCAGCTCCGTCAGCAAGCCGCGCAGACCATGCGGCAGAGGCTGCTC
+TCGCCGCATGCCGGCCAGGGCGGCGACCGACATGTCGAGGCTTCGGCCCGTCTGTTCGACGGCGTGGGTA
+AGCAGCGGGTGGGGCGACAGCTCCGCGAAGACCCGGTAGCCGTCCTCCATCGCAGCCTGCACCGCCGCGG
+CGAACTGCACCGTGTTGCGCAGATTGTCCACCCAGTAAGCGCCATCGCACACCGGCTGCTCGCGCGGGTC
+GAACAGGGTCGCCGAGTAGTACGGCACCTTGGGCGTCATCGGAGCAATGTCCGCCAGCGCCGCGGCCAAA
+TCGTCGAGTATCGGATCGACTTGAGGCGAGTGCGACGCCACGTCGACGGCCACCTCGCGCGCCATCACGT
+CCCGCTGCTCCCAACGGGCGATGAGGTCACGAACGGTGTCGCTCGTACCGCCGATCACCGTGGATTGCGG
+GGACGCCACCACCGAGACCACAACATCGTCGATTCCGCGTGCCATCAGCTCCGAATTCACTTGCTTGGCG
+GGCAATTCCACCGAGCCCATGGCACCAGCACCGGCTATGCGGGTCATCAGCTTCGAGCGGCGGCAAATGA
+CGCGCGCCGCGTCCTCGAGCGACAGTGCCCCCGCGACGACGGCCGCGGCCGACTCACCCATCGAGTGTCC
+GACGACCGCGCCCGGCCGCACTCCGTAGGTTTGCTCCATGGTGGCGGCCAACGCGACCTGAACGGCGAAC
+ACTGCCGGCTGCACTTTGTCGATTCCGGTCACGGTCTGCTGCGCCGTTATCGCCTCGGTCACCGAGAATC
+CCGATTCTGCGGCGATCACCGGCTCCAGCTTGGCGATGGTGGCCGCGAACACTGGTTCGCTGGCGAGCAA
+TTGCGTGCCCATCGCCGCCCACTGCGACCCTTGCCCGGAGAAGACCCAGACCGGTCCTCGATCACCGTGT
+CCCACCGCCGCGTCATAGAGGGCGTCACCGTCGGCCACCTCGCGCAAACCCTCGACGAGCTCCGGCAGGT
+TGGCGGCAACCACCGCGGTGCGCACCGGCCGGTGCGCGCGGCCACGCGCCAGCGTGTAGGCCAGATCCGA
+GGCCGCCACGCAGTCCTGGTGTTCTTCCACCCAGGTGGCTAGTTGGCGGGCCGTCTGGCGCAGTGCGTCG
+CTGGACGTGGACGACAGCATGAATAGCCGCGGGCCCACCTCAGCGTCGCCCGGTGAACTCTCGGGTGCGG
+AAGCTTCTGCTGGGGCCTCTTCCACGATGGCATGCACGTTGGTCCCGGACATCCCGAACGAGGACACCGC
+GACCCGCTTCGGTGTGTGATCATTACCGTTGGGCCACGGCGTAACCGCTTGCGGCACAAAGAGCCCGGTC
+TCGACGTCGGAAAGCTCATCGGGCAGCCGATTGAAATGCAGCAGCGGCGGCACCACCCCGTGCCGCAGTG
+ACAGAATTGCCTTGATCAGCCCGACGGTCCCCGCCGATGCCGTGCTGTGCCCCATGTTGCTCTTGGCCGA
+TCCAAGCGCGCAGGGGGTGCCCGCGCCATACACCCGCGCCAGGCTGCGGTACTCAATCGGGTCGCCGATT
+GGCGTACCGGTGCCGTGCGCCTCGACCACACCGACCGTTTCGGGCTGCACGCCCGCCGCCGCCAACGCCG
+CACGGTACACGGCAACCTGGGCGTCCTCGGACGGCATGGTGAGCGTCTCCGTGCGGCCGTCCTGATTGGT
+GGCCGTGCCACGCACCACGGCGAAGATCCGATTACCGTCGCGCAGCGCATCCGGCAGTCGCTTCAGCAAC
+ACCATCGCGCAGCCCTCGGAACGCACAAACCCATCCGCGTCAGCATCGAATGAATGGCACCGACCGGTTG
+ACGACAGCATGCCCTGCGCAGACGCCGCCACACAGGCATGCGGCTCCAGCAGCACCGCACAACCGCCCGC
+CAAAGCGAGGTCAGCTTCGCCGTCATGCAGGCTGCGGCAGGCCAGGTGCACCGCCATCAGACCCGAAGAA
+CACGCGGTGTCAAACGTCATCGCCGGACCATGTAGACCCAATGTGTGCGCGATCCGCCCTGACGCCACAC
+TGTTGTTGAGGCCGGTAACCACATATGGACTGGCCAAACCGCCCGCCGTTGTGGTGAGTACCAGGTAGTC
+CTCGTGGGTCAGCCCAGTAAAAACGGCCGTCGAGGACCCGGCCAACGACGCCGGATCCAGACCAGCATGC
+TCGATCGCCTCCCACGACGTTTCCAGCAGTAGCCGCTGCTGCGGATCGATCGAGGTCGCTTCCCGCTCGC
+TAATCCCGAAGAACTCAGCATCGAAACCGGCGACGTCGTCAAGGAACCCACCCCACCGGGACACCGACCG
+CCCGGGAACCCCTGGCTCAGGGTCGTAATAGTCGTCGGCGTCCCAGCGGTCGGGCGGAATCTCGGTGACC
+AAGTCATCACCGCGCAGCAACGACTCCCACAGTTTGTCGGGCGAGTTGATCCCCCCAGGAAGCCGACATC
+CCATCCCGATCACCGCAACGGGAGTGACACGTGATTCCATACTCTTCCAACCTCGTCTCAGCTCAACCGG
+TGTTACCCGACGACATCAGCGAATTTTCACACCGGGAATGAAACGGCCGCGGTGCCGCTCTCCCAGCTCT
+TAAGTAATCCGAGCCAACCCGGATCCCGACACCAAAGACAAGTGTTACACGACGCCAAGACCCCCCGCGG
+GTAGCGCTGGAATACTAACACGAGCACATGTGCTCGCGACCGAGTCTCACCTCGGACCTGGGCAAATGAC
+CCCATGTCGCAGGTGCATGGAGTTGTTCGGGCAGTCTCGGCGAGGTTGCAGGGCTGTTCGACCAGCGGAT
+TTCGACACTCGGTAACGCAAGCCAGTTAGGGGCGGTCATCGGTGATGCTGCGCCACGAAGCACTACATCC
+GTTGCACCGCAATTATTTTCGGTGCCCGCATGACGGGCGCAATGCCTTAATTGCGTTAGCCGGCGACCCG
+CCGCGGGGGCGGCGCCACATCACATCCGACCGTGTCCGATGGTGGACCCATGGCGAGCCGGCAAACCCCT
+GCTGAGCTGGCCAGATGCGACTTGGCTAAGACCGCGGAGCGCGAGCACACCCCGACGGCGACTGCGACAA
+CTCCAAGCGTGGCCGGTAACGTGATGCCCATGATTGTGCGTTCCCTTCCCGCTGCGTTGCGCGCGTGTGC
+GCGTCTGCAACCCCATGACCCGGCCTTCACGTTTATGGATTACGAACAGGACTGGGACGGCGTTGCGATA
+ACCCTGACGTGGTCGCAGCTGTATCGGCGAACGCTGAATGTGGCACGGGAGCTGAGCCGTTGTGGTTCCA
+CGGGTGACCGCGTGGTGATCTCTGCTCCGCAGGGACTCGAGTACGTCGTCGCCTTTCTCGGCGCGTTGCA
+GGCCGGCCGCATCGCCGTGCCGCTTTCGGTTCCACAAGGCGGCGTTACCGATGAACGTTCCGATTCGGTA
+CTGAGTGATTCGTCGCCGGTGGCCATTCTCACTACATCGTCTGCCGTGGACGACGTCGTGCAACATGTTG
+CGCGGCGGCCCGGGGAATCCCCGCCATCAATTATCGAAGTTGATTTGCTCGATCTGGACGCTCCGAATGG
+GTATACCTTCAAAGAAGACGAGTATCCATCTACCGCGTATTTGCAATACACCTCCGGGTCCACCCGCACG
+CCCGCTGGCGTGGTGATGTCCCATCAGAACGTTCGGGTTAATTTCGAACAGCTGATGTCTGGCTACTTTG
+CGGATACCGACGGGATTCCACCGCCAAATTCCGCACTCGTATCCTGGCTACCCTTCTACCACGACATGGG
+TTTGGTAATAGGAATTTGCGCACCAATTCTGGGTGGATACCCCGCGGTGCTCACCAGCCCGGTGTCGTTC
+CTGCAGCGCCCGGCCCGGTGGATGCACTTGATGGCCAGCGATTTTCACGCCTTTTCGGCAGCACCGAATT
+TCGCCTTTGAACTAGCGGCACGAAGAACAACCGACGACGACATGGCCGGGCGTGACCTCGGCAACATACT
+GACCATCCTCAGCGGTAGCGAGCGGGTACAGGCCGCGACGATCAAGCGCTTCGCCGACCGCTTTGCTCGC
+TTCAATCTGCAGGAGAGGGTGATCCGGCCTTCATACGGGCTCGCAGAAGCAACGGTGTACGTGGCGACGA
+GCAAACCGGGTCAACCACCGGAGACCGTCGACTTCGATACTGAAAGTTTATCCGCCGGCCATGCGAAGCC
+GTGCGCAGGCGGCGGCGCTACATCGTTGATCAGCTACATGTTGCCGCGGTCACCGATCGTGCGGATCGTC
+GACTCGGACACCTGCATCGAATGTCCGGACGGAACCGTCGGCGAGATCTGGGTGCACGGCGACAACGTCG
+CTAATGGCTATTGGCAAAAACCCGACGAGAGTGAGCGCACGTTCGGCGGAAAGATTGTCACCCCTTCGCC
+GGGCACACCCGAAGGTCCTTGGCTAAGAACGGGCGACTCAGGTTTCGTCACCGATGGCAAAATGTTCATC
+ATCGGTCGGATCAAAGATCTCCTAATTGTGTACGGACGCAACCACTCCCCCGACGACATCGAGGCAACGA
+TCCAGGAGATCACCCGCGGGCGCTGCGCGGCGATCTCGGTTCCCGGTGACCGCAGCACCGAAAAGCTGGT
+CGCCATTATCGAACTCAAGAAGCGTGGCGACTCAGATCAGGACGCGATGGCTAGACTGGGCGCTATTAAA
+CGCGAAGTCACGTCGGCTTTATCGAGTTCGCACGGTCTCAGCGTCGCGGATCTGGTTCTGGTTGCGCCTG
+GCTCGATCCCCATTACCACCAGCGGGAAGGTCAGGAGAGGGGCGTGTGTCGAGCAATATCGACAGGATCA
+ATTCGCCCGCTTGGATGCCTAGTCCGGCTGGCCGTCTACACAGAATTCGGTATATCCGTTTGAAAAAGTC
+CTCCCCGGACTGCCGCGCCACCATCACCAGCGGGTCAGCCGACGGTCAGCGAAGGTCACCCCGGCTCACC
+AACCTGCTCGTCGTCGCCGCCTGGGTTGCCGCGGCGGTGATCGCAAATCTGCTTCTCACGTTCACGCAAG
+CAGAACCGCACGACACCAGCCCGGCGCTGCTGCCACAAGATGCCAAGACAGCCGCCGCCACCAGCCGGAT
+TGCGCAGGCTTTCCCCGGCACCGGTAGCAACGCTATCGCCTATCTCGTCGTGGAAGGCGGCAGCACGCTT
+GAGCCGCAGGACCAGCCTTACTACGACGCCGCCGTCGGTGCCCTGCGCGCCGACACCCGCCACGTGGGAT
+CCGTCCTCGACTGGTGGTCAGATCCCGTCACCGCCCCGCTGGGAACCAGCCCCGACGGCCGCTCCGCTAC
+GGCCATGGTGTGGCTGCGGGGCGAGGCGGGCACCACCCAAGCTGCCGAATCCCTCGATGCCGTCCGATCG
+GTGCTGCGCCAGTTACCGCCCAGTGAGGGGCTTCGCGCCAGCATCGTGGTCCCGGCAATCACCAACGACA
+TGCCGATGCAGATAACCGCCTGGCAGAGCGCGACGATCGTGACCGTTGCGGCGGTGATCGCCGTCCTACT
+GCTGCTGCGGGCGCGCCTGTCGGTGCGGGCCGCGGCGATCGTGCTGCTGACCGCGGACTTGTCGCTTGCG
+GTGGCCTGGCCGCTGGCCGCGGTGGTGCGGGGACACGATTGGGGAACCGATTCGGTATTTTCTTGGACGC
+TGGCCGCGGTCCTGACGATCGGAACCATCACCGCAGCCACCATGCTGGCCGCGCGGCTCGGGTCCGACGC
+AGGTCATTCGGCCGCGCCCACATACCGCGACAGCCTGCCCGCGTTCGCCCTGCCCGGGGCGTGTGTCGCC
+ATATTCACCGGCCCGCTGCTGCTGGCCCGAACCCCAGCGCTGCACGGAGTTGGCACTGCCGGGCTAGGTG
+TATTTGTGGCACTTGCGGCTTCGTTGACGGTGCTGCCTGCCCTGATCGCGCTTGCCGGAGCGTCACGGCA
+GTTACCGGCACCAACCACGGGTGCCGGCTGGACAGGCCGGTTGTCGCTACCCGTCTCTTCTGCTTCGGCC
+CTGGGCACAGCGGCAGTGCTGGCGATCTGCATGCTACCCATCATCGGGATGCGGTGGGGTGTGGCCGAGA
+ACCCGACAAGGCAAGGCGGCGCACAAGTCCTTCCGGGGAATGCGCTTCCCGATGTGGTGGTGATCAAATC
+CGCTCGGGACCTGAGGGACCCAGCCGCGCTCATCGCCATCAACCAGGTCAGCCACCGTCTGGTGGAGGTT
+CCCGGTGTGCGCAAGGTGGAGTCGGCGGCATGGCCGGCCGGTGTCCCGTGGACCGACGCCTCGCTCAGTT
+CCGCGGCCGGCAGGCTCGCCGACCAGCTGGGTCAGCAGGCTGGATCGTTCGTGCCGGCGGTGACTGCGAT
+CAAATCGATGAAGTCCATAATCGAACAGATGAGCGGCGCGGTCGACCAACTGGACAGCACCGTGAACGTG
+ACTCTCGCCGGGGCAAGGCAAGCACAGCAATACCTCGATCCCATGCTCGCCGCCGCGCGGAACCTCAAAA
+ACAAAACCACCGAACTGTCGGAATACCTGGAAACGATCCACACCTGGATTGTCGGCTTCACAAACTGCCC
+CGACGACGTCCTGTGCACGGCCATGCGCAAGGTCATTGAACCCTACGACATCGTGGTCACCGGCATGAAC
+GAGCTGTCCACTGGCGCCGACCGCATCTCCGCGATATCGACACAGACAATGAGCGCGTTGTCCTCGGCAC
+CGCGGATGGTGGCGCAGATGCGGTCGGCGCTAGCACAGGTGCGCTCGTTCGTACCCAAGCTGGAAACAAC
+CATCCAGGACGCCATGCCGCAAATAGCGCAGGCGTCGGCGATGCTGAAGAATCTCAGCGCCGATTTCGCC
+GATACCGGTGAGGGCGGCTTCCACCTGTCCAGGAAGGACCTGGCGGACCCGTCGTACCGGCACGTACGGG
+AATCGATGTTCTCGTCAGACGGAACCGCCACCCGGCTGTTCCTCTATTCTGACGGACAACTGGACCTTGC
+TGCGGCAGCACGCGCGCAGCAGCTCGAGATCGCCGCGGGCAAGGCGATGAAATACGGAAGCCTGGTCGAC
+AGCCAGGTCACGGTGGGTGGGGCCGCGCAAATAGCCGCGGCTGTCCGCGATGCCCTCATCCACGATGCTG
+TGCTACTGGCCGTTATCTTGCTCACGGTAGTGGCTCTGGCCAGCATGTGGCGCGGTGCCGTCCACGGTGC
+TGCGGTTGGCGTGGGTGTGCTGGCCTCTTACCTCGCCGCCCTGGGGGTCTCGATTGCACTGTGGCAACAC
+CTACTGGATCGCGAGCTCAACGCCTTGGTCCCGCTGGTGTCGTTCGCCGTCCTCGCTTCGTGCGGCGTCC
+CGTATCTCGTTGCCGGCATCAAAGCCGGTCGTATCGCCGACGAGGCAACGGGTGCGCGGTCCAAGGGGGC
+GGTATCCGGGCGGGGAGCGGTTGCGCCGCTTGCGGCGCTCGGTGGCGTATTCGGCGCTGGCCTGGTGCTG
+GTGTCGGGAGGTTCCTTCAGCGTGCTCAGTCAGATTGGCACGGTTGTTGTGCTCGGTCTGGGCGTGCTGA
+TCACGGTGCAGCGAGCGTGGCTTCCGACCACGCCAGGGCGGCGTTGACCGCCTGTTCGAGACCCCATGCC
+ACGCTCGGCTGGCCGACGACGATCACCCATCGCAGACACCACACTTGGTAGGGGTTGCCAGTTGTTGGCC
+GGGTGAGTGGTCGGCGCGCCGTTGCCCGGGGTAGGGTTCGAGGTCTTTGGATGATGGGCGTTTCCACGCT
+GCCCAAAGGATGACCTCGACGTGTCCGAGTTCACGTTGACCGCGTGAAGTTAAACCGGTGCCGAGCGTGC
+ACTGAGGGCGAAATCCGGCGCCGATTTTCCGCCCTGAGTTCACGTTGGGCGACGGCGCCCATGAACGACG
+CCACATCGCACATGGCGCTCAGGCCAAGCACCAGCCCATCTCCGTCGCCGGCCACCGTCACCGATCGAAC
+GACCTCGACCCCCGCCCTGGCAACAACACGCCGCTGCCCTCTACACCTCCGCGCTGTCGAAAATTGTCAC
+GGAGCCTTGCGGGGGCTGGTGCGACTGATATGACGCACCTTCCGCCAGAGGCTAGCCCGACGTTTACTGA
+CGTTACTGCTGCTTACCGTTTGTCGACGGCACGTGAAAACTGACCCCGGCGCGGCACCCGAATTTTGACC
+CCCTGGTCGGGTGGACTGGCTCTACCCGAGCCAGGAGGACCGAAGGGAATGTTGACTGTGGAAGATTGGG
+CTGAGATTCGCCGATTGCATCGCGCGGAGGGTTTGCCGATCAAGATGATCGCCCGGGTGCTGGGGATTTC
+CAAGAACACGGTGAAGTCAGCGTTGGAATCAAACCAGCAGCCGAAATATGAACGGGCACCGCAGGGTTCG
+ATCGTTGATGCGGTTGAGCCGCGGATCCGGGAGTTGTTGCAGGCCTATCCGACGATGCCGGCGACGGTGA
+TCGCCGAGCGGATCGGCTGGGAGCGCTCGATTCGGGTGCTCTCGGCGCGGGTGGCCGAGCTGCGCCCGGT
+GTATCTGCCGCCGGACCCGGCGTCGCGCACCACGTATGTGGCAGGCGAAATTGCCCAGTGCGACTTCTGG
+TTTCCGCCGATCGAGTTGCCGGTAGGGTTCGGGCAGACCCGCACGGCCAAACAGTTGCCGGTGCTGACCA
+TGGTGTGCGCCTATTCGCGCTGGCTGTTGGCGATGCTGCTGCCCAGCAGGTGTGCCGAGGACCTGTTCGC
+CGGCTGGTGGCGGCTGATCGAGGCGTTGGGGGCGGTGCCGCGGGTGTTGGTGTGGGATGGCGAGGGCGCG
+ATCGGGCGCTGGCGCGGCGGGCGGTCGGAGTTGACCACTGAGTGTCAGGCGTTCCGCGGCACGCTGGCGG
+CCAAGGTGCTCATCTGCCGGCCGGCCGACCCGGAGGCCAAGGGCCTCATTGAACGGGCCCACGACTACCT
+GGAGCGCTCGTTTTTGCCCGGGCGGGTGTTTGCCTCGCCGGCCGATTTCAACGCCCAACTGGGCGCCTGG
+CTGGCGCTGGTGAACACCCGCACCCGCCGGGCGCTGGGTTGTGCGCCCACCGATCGCATCGGCGCGGATC
+GGGCCGCGATGCTGAGCTTGCCGCCGGTGGCGCCGGCCACCGGGTGGTGCACCTCGCTGCGGCTGCCCCG
+GGATCACTATGTGCGCTGCGATTCCAACGACTACTCGGTGCACCCGGGTGTGATCGGGCATCGGGTGCTG
+GTGCGCGCCGACCTGGAGCGGGTGCATGTGTTCTGCGACGGTGAGCTGGTCGCCGACCACGAGCGGATCT
+GGGCGGTCCATCAGACGGTCTCCGATCCCGCACATGTGGAGGCGGCGAAGGTGTTGCGCCGCCGGCACTT
+CAGTGCAGCATCACCGGTAGTTGAGCCGCAGGTGCAGGTCCGCTCACTGAGCGACTACGATGACGCGCTG
+GGAGTCGACATCGATGGCGGGGTGGCCTGATGCCCACCACCAAAGCCACCCAGCGCCGTGATGTTTCCAC
+CGAGATCGCTTACCTGACAAGAGCATTGAAAGCTCCCACCCTGCGTGAGTCAGTGTCCCGGCTGGCCGAT
+CGCGCCCGCGCCGAGAACTGGAGCCACGAAGAATACCTGGCCGCCTGCCTGCAGCGGGAAGTGTCAGCCC
+GGGAGTCCCATGGTGGTGAGGGCCGCATCCGCGCCGCCCGCTTCCCGGCTCGGAAGTCGTTGGAAGAGTT
+CGACTTTGAGCATGCTCGTGGCCTCAAACGCGACACCATCGCACATCTGGGCACCCTGGATTTCATCACC
+GCCCGCGATAACGTCGTGTTTTTGGGCCCCGCCTGGCACCGGGAAGACTCATCTTGCGGTCGGCCTGGCG
+ATACGCGCGTGTCAGGCCGGTCATCGGGTGCTGTTCGCCACCGCCGCCGAATGGGTAGCACGGCTCGCCG
+AGGCTCACCACGCCGGGCGCATCTACGCCGAACTCACCCGGCTTTGCCGCTATCCGCTCCTGGTGGTTGA
+CGAAGTCGGCTACATTCCGTTTGAGCCCGAGGCCGCCAACCTCTTCTTCCAGCTGGTGTCCTCCCGGTAT
+GAGCGGGCCAGCTTGATCGTCACGTCCAATAAGGCCTTCGGCCGGTGGGGCGAGGTTTTCGGCGGCGACG
+ACGTCGTTGCTGCCGCCATGATCGACCGCCTCGTCCACCATGCTGAAGTCGTCGCCCTCAAAGGCGACAG
+CTACCGGCTCAAAGACCGCGACCTCGGCCGCGTCCCACCAGCCGGAACCACCGAAGAATAACCACCAACC
+GCCCGGTCTAGGGGGTCAATTTTCAGATGCCGTCAGGGGGTCAGTTTTCGGGTGCCGTTGACACCGTTCA
+CAAGGGCGTTTCGAGCAACGCGTCGACGCAACTTCGGCCTAGTCGACGTTGACGGGTTCGTTCCATTTCG
+ACTGCGTGAGCTGAATCGACCCGGATCCGAGGTCGATGCTCGCTCGGACGAGGTGGTGCGAGCCGTCCTG
+GGCAATCCACACGGTCGCCGGCCTTGCACTCTTGGCGCCAGGATCAAGCATCTTGACAGAGCTCGCGGGG
+ATGGTCCCGGTGATTTTGGTGGTCGAAATTCCGTCTATCACTTCGGTACCTTGCGCTTGGAGGTTCGTGA
+CACCGGACAGCAGCTGCGTCACCCCAGCGGCAGGATCGAGCACGCGTGAAGTTGACAGTTCAGAAATCGA
+GCCGAGATTGCTCCAGTCGTCGAACAGTTTCACCGAGATGTTGTCGCCTTGTACCCGAAACGGGACACCC
+TGCTCGTCGTTGTAGGTGCATACGCCCTTTGCCGCGAGCGGATTGGCCCGGACGTCGACATCGGCACTGG
+TAATACCCAGCAAGCTGTCGACTTTCCCGGTTGTTCGGACCGCTACGTGCACGCTGGTCAACCCTTTTGT
+CGCATCAAGCGACTGCCTGATCTCGGCGAGGAGCGCGGGGTCGGACGCCGTCGGGCTCACGGGAACACCC
+TGTTCCTCGGCATCAGGTTTCGGCGAAGAACATCCTGATAGCCACAACGCCAGGCAGGCACCTAGCACCA
+CCAGAACAGCGGACGTCACCGCCCGTTTTCCATCATTCATTTGCGCTCACTACCTCGATTGTCAAATGGG
+CCCGCAGGCCGAATGCAGGTTGATTGGATCACGCTGGGCATGACTGCCCGCCTCCTCACTCGCGCCATTC
+CGGCGCTCGCCGTCGCCGGGTCCCGCCAAATTGCCCGCCTCCTCACTCGCGCCATTCCGGCGCTCGCCGT
+CGCCGGGTCCCGCCAAATTGCCCGCCTCCTCACTCGCGCCATTCCGGCGCTCGCCGTCGCCGGGCCCCGC
+CAAATTGCCCGCCTCCTCACTCGCGCCATTCCGGCGCTCGCCGTCGCCGGGCTAGGCATGGACCGATACT
+TCCGCGGCGGCGGGTTCGACAACCTGCGACGTCGGATCACCGGATTCCGTTGGGCGGCTGCCAGACATTT
+GCTGGGCGACATACTCGGCGACCGCAGTGGGAGTGGGATGATCGAAAATCACGGTAGGTGGCAGCGTCAG
+TCCGGTGGCGGTTTTGAGGCGGTTGCGTAACTCCACAGCCGTTAATGAGTCGAAACCGAGGTCGCCGAAT
+TCGGTGTCGGGGTCGACGTCCTCGGCGGAGGGCCTACCCAGCACTGCCGCTGCCTGCAGACACACCAGCC
+CCACTAGCAGCTCGAGTTGTTCGTCCGCGGCCAGCCCGTGTAGGCGTTGAGCCAGCGCCGACTTCGACGA
+GGTGGCGTCACCGGTGTCGTCGATTTGGCGTCGGCGTGGGCGGCGCGCGAGCCCGCTGAACAGCGCCGGC
+AACGCACCGGCCTGGGCCCGGGCGTCTAGTGCAGCCCGGTCCAAGAGCGTGGCCACCGCCAGAGGGTGAT
+CGATGGCCAGCGCAGCGTCAAACAATTCCACCGCTTCGGCAGGGCTCATCGGAGCCAGCCCGCTGCGGCT
+CATGCGGGCCAGATCTCGGCTGCTCAAATGCGCGGTCATGCCGCCAGGCTGTTCCCACAAACCCCACGCC
+AGTGATATCCCGGCCAACCCTGCGGCCTGCCGGTGAGCGGCCAACCCGTCCAGAAACGCGTTTGCCGCCG
+AGTAGTTGCCCTGCCCCGGCGAGCCGACCGTGGCCGCGATCGATGAGCACAGCACAAACATCGACAAATC
+CAGGTCACTGGTGGCCTGGTGCAGGTTCCACGCCGCGTCCACCTTGGCCCGCAACACCGTATCGATGCGG
+TCCGGTGTCAACGAGGTGATCACTGCGTCATCGAGCACGCCGGCGGCATGAATCACCCCGCGCACCGGCG
+GGTACTCCCGCGACAGCTGGGCAAACAACCCCGCTACCGCAGCGCGATCGGCCACGTCACAGGCCACCAC
+CTGCCCCTTGGCGCCGGCCTCCGTCAAGTCGGCGGCCAATTCGGCCGCTCCCTCCGCGCGATCGCCCCGC
+CGACTGGCCAACACCAGATGACGCACCCCATAGGCGCCAACCAGGTGGCGGGCCAACACCCCACCAACCG
+CCCCGGTGGCACCGGTGATCACCACCGTGCCGTCGGCAAGCCGGTCGGCCAACGCCGAGGGCATGGTTAA
+GACAACCTTGCCGATATGGCGGGCCTGGCTCATGAACCGGAAGGCCGCCGGGGCGCAGCGCACATCCCAC
+GTGGTGACCGGTAGCCGGTGCAGCTCCCGGGTGTCGAACAGCTCCCGCACCTCGGCCAACATCTCCTGCA
+TGCGTGCCGGGCCGGCCTCCGACAGGTCGAACGCCCGATACTGCACGCCGGGATAATTAGCGGCGATCTC
+CTGCGCATCGCGGATATCCGTCTTGCCCATCTCGAGGAAACGCCCACCGCGGACCAGTAAGCGCAGCGAC
+GCATCCACGAACTCACCGGCCAGCGAGTCGAGCACCACATCAACCCCGCGGCCCTCGGTGACCGCCAGGA
+ACTTCTCCTCGAACTCGCATGTGCGGGAATCGCCGATATGGTCGTCGTCAAACCCCATGGCGCGCAGCGT
+GTCCCACTTGCCACGGCTGGCGGTGACGAAAACCTCCACGCCCCACTGGCGAGCCAGCTGCACAGCCGCC
+ATGCCCACACCGCCGGTACCGGCATGGATCAGCACCGATTCGCCCGCCTTGATCTCGGCTAAATCGGCCA
+ACCCGTACCAGGCCGTCAAGAACACCACCGGCACAGCGGCTGCCTGAGCAAACGACCAGCCTTGCGGCAC
+CCGGGTAACCAGTTGCTGATCCACCACCGCCAGCGGACCGGCCCCGCCCAGGAATCCCATCACGGCGTCA
+CCGACGGCAAGATCGGTCACTTCGGGACCGGTCTCAAGCACCACCCCGGCGCCTTCGGCACCCAGCGGTG
+GAGCCTGGCCGGGATACATCCCTAGGGCGGCCACCACATCGCGGAAGTTGACCCCGACGGCCGCCACCGC
+CACGCGCACCTGCCCCGCCTGTAGCGGTGCCTGTACCTCCGGGCAGGGCTGGATCACCAAATCCTCCAGG
+GTCCCGCCACCACCGGCGGCCAATCGCCACGCCGACTCTGCCGCCGGTAACGCTAGCAACGCCGGGGCCG
+GGGACAGCCGGGGGGCGTGCACAGTGCCGCCGCGCACCAGCAGCTGGGGTTCCCCGACGCCGGCTAGCAC
+CGAGGCATCCACCGCCGCATCGGTGTCGATCAACACGATCCGGCCGGGATTTTCGGCCTGCGCGGAACGC
+GCCATGCCCCACACCGCGGCGGCGGCCAGGTCGCTGATGTCCTCGCCAGCCAGCCCCACGCCACCATGGG
+TCAACACCACCAACGTGGCCGCCCGATCCGCGCCGAGCCAGGACTGCAACACCTCCAGGGCGGTGTGGGT
+GGCCGCATACACCGAGCCCACCACCGAGGATGCTTGGCCACCGGCAGACTCGAGTTCCCACACCACGACA
+CTGGCGTCACCATCACTGCCGGCGCAAAAGTCCGCCCAAGACACCGGGGCAGGTGGGGCGGACCCGTTAG
+CGCCGCCGCTGACCACCGAGATCGGCGACCACACCACTTCCAGCGGCCCCTGATCGGACGCACCGCCGGC
+CGCGGTCACGGCGGCGCGCAGCTGTTCTGCGGTTATCGGGCGAGTAACCAGCGAGCGCACCGTCAACACC
+GGCAGCCCAGTGGCGTCGCAGACGTCCACGGAAATCGCATCCGCGCCCGCGGACGCGAAGCGGGCCCGCA
+CCCGTCCAGCGCCGCCGGCATGCAGCGACACCCCACGCCAGCAAAACGGCAGTCTCGTCTCGGTGCTCGC
+CTGGGTCTTCTCGACGGCCAGCCCGAGGGCATGCAGCACCGCGTCCAACACCGCCGGATGCATCCCCATT
+CGGTCGACGGCCACGCCGGCCTCGCCGGGGGCTACAACTTCGGCGAACAGCTCCGACCCCCGCCGCCAGA
+TCGCCACCAGACCCTGAAACGCGGGGCCGTAGGCATAACCGCGCTCGGCCAACTGCGCATAGCCGTCCGA
+GATATCCACACTCTCCGCGCCCTCGGGCGGCCACACGGACAAATCCATCGGCGTCTCAGCGGCAGCCACC
+CCCAGCATGCCTTCGGCGTTCAGCAACCAACCCTGGGATTGATCACCGCGGGAATACACCGACACCGCAC
+GGTGCCCGGATTCATCGGCAGCCCCGACGACCACCTGCACCTGAACCCCGACACCCGGGTGCATCACCAA
+CGGTGCGGCCAGCACCAACTCTTCGATGAGCGCGCACCCGACCTCATCACCGGCGCGGATCACCAACTCC
+ACAAAACCCGCCCCGGGGAACAGCACCACCCCGTTCACCACGTGGTCGGCCAGCCACGGCTGATCCGCAA
+GCGACAACCGGCCGGTCAGCACCACCTCGTCAGAATCGGGCCGCTCGACCACCGCACCCAACAAGGCATG
+CTCGGTCGCGCCCAGACCCAACCCGGCCGCATCGGCGGGCCCATCCGCGCCCGGCGTCTCCCAAAACCGC
+CGTCGCTGAAACGCATACGTGGGCAGCTGCACCCGCCGTCCACCCGAGCCGGCGAACACCGCCGACCACT
+GCACCGGCACACCGGTGGTGAACACCTGACCGGCAGCACCGAGCGCCGAGGCCAGCTCGGGCCGGTCTTT
+GCCCAGCATCGACACCACCATCGCCTCAGCCGGGGCCAAGGACTGCTCGATCGAGCCAGTCAAACCACTT
+CCCGGGCCGGCCTCGATGAAGTGGGTCGCCCCAAGGGTCTGCAAATGACGCGCACTGTCCGCGAAGCGCA
+CCGGCCGACGAACGTGGTCCACCCAGTACTGCGCCGACCCGAAATCAGGGCCGGCCAACTCGCCCGTCAC
+GTTCGACACCAGCCCAAGCTGGGGCTCGCGTGCCTGCACCCGGGCCGCGACACGCGCGAACTCCTCGAGC
+ATCGGCTCCATCAACGGCGAATGAAACGCATGCGAGACCGCCAACTGGTGCACCCGCCGACCCTGCGCGG
+CGAACCGATCCGCAATCGCATTTGCCGCGGCCTGCGCACCGGAGATCACCACCGATTCGGGCGCGTTGAT
+CGCAGCGATCCCCACACCCTCACCCAGCAGCGGCTCCACCTCGTCCTCACTGGCAGCCACCGCCACCATC
+GCACCGCCTGCCGGCAGCGCCTGCATCAACCGGCCCCGCGCCACCACCAGCATCGCCGCGTCCGCCAACG
+TCAACACACCGGCCGCGTGCGCCGCCGCCAGCTCTCCAACGGAGTGACCCATGACGAAGTCCGGAAGCAC
+ACCCCAATCCCGCAACACCGCGAACGATGCCACCTCCACCGCGAACAACGCGGGCTGAGCAAATTCGGTG
+CTGTCAAGCAAATCCGCATCGGCACCCCAAATAACGTCGCGCAGCGGCAACCGCAGATGCCGGTCCAACT
+CGTCGGCCACCGCATCGAATGCCTGCGCAAACACGGGCAACTCGCCGTACAACTCGCGGCCCATCCCGAT
+GCGCTGCGCGCCCTGCCCAGGAAACACGACCACCGTCTTGCCCACCGACCCTGGCTGACCGACCGCCACG
+CCGGCACCCGGCTCGCCCGCCGCGAGCCCAGCCAGCCCGGCAATCAGTTGCTCACGGCTTGCGCCGACCA
+CCACCGCTCGGTGCTCAAACACCGAGCGACTGGCCAACGAGCACCCCACATCGATCGGATCCAGCCCTGG
+GTTGGCCTGCACGTGGGCCATAAGTCGACCCGCCTGCGCCGTCAACGCCTCAGCCGATCTCGCCGAAATC
+ACCCACGGCACCATCGACGGCCGCGGCCCCCCGGTGCTTTCGCTCGCCTCAACCGGCGCCTCTGCGGGGG
+CTGGTACGGGGGCCTCTTCCAAGATCAGATGCGCGTTGGTGCCGCTGATCCCAAAGGAGGACACCGCCGC
+CCGGCGCGGACGCCCGTCAACCGACCACTCCCTGGCCTCGGTCAACACCGACACCGCGCCGCTGGTCCAA
+TCCACCCGCGGGGAAGGCTCATCCACATGCAACGTCGCCGGCATCACCCCATGACGCATCGCCTGCACCA
+TCTTGATCACCCCGGCGACCCCCGCGGCGGCCTGGGTGTGGCCCATGTTCGACTTGATTGAGCCCACCCA
+CAGCGGCTGCTCCGCTGGACGTCCCTGCCCGTAGGTGGACAGCAATGCCTGCGCTTCGATGGGATCACCC
+AACGTGGTGGCGGTCCCGTGTGCCTCCACCACGTCTACGTCTGCGGCGGACAACCCGGCGTTGGCCAACG
+CCGCCTGGATCACTCGCTGCTGGGCGAGCCCATTGGGCGCGGTCAGCCCATTGGACGCACCATCCTGGTT
+GACCGCGCTCCCCCGCACCACCGCCAGCACCGAATGCCCCAACCGCCGGGCGTCCGATAGCCGCTCCAGC
+ACAACCACCCCGGCGCCCTCGCCCCACCCGGTGCCGTCGGCCGCGGCCGCAAACGCCTTACATCGCCCAT
+CGGCAGCCAACCCCCGCTGCCGGGAAAACCCCACAAAAATCGACGGCAGCCCCATCACCGTCACCCCACC
+GGCCAACGCCAAATCACACTCCCCGGAGCGCAATGACGACATCGCCCAATGGATCGCCACCAACGACGAC
+GAACAAGCGGTATCCACTGACACCGCCGGGCCCTGCAGCCCCAATACGTACGACACACGTCCCGAGGCCA
+CGCTGATTGACGTGCCGGTCAACCCGTACCCTTGCAGCCCCCCGGTATCCCTATTGCCGTAACTCGCCGC
+GAAAATGCCGGTGTACACCCCGGTCGCCGAACCACGCAACGACAACGGGTCAATCCCCGCGTGCTCCAAC
+GCCTCCCACGAAACCTCCAGCATCAACCGCTGCTGAGGATCCATCGCCAACACTTCACTAGGAGCGATGC
+CGAAGAACCCGGCGTCAAAGCCGGTGGCGTCGTCTAGAAATGCCCCCCATCGCGTGTAGGTTTTGCCCTC
+AGCGTCGGGATCCGGATCGTATAGCCCCTCAACATCCCAGCCCCGATCGGTCGGAAACTCCGACACCACG
+TCGCGCCCCGCCGAAACGACATCCCAGAGTCCGTCCGGGCCATCCACGCCGCCCGGAAATCGGCAGCCGA
+TTCCCACCACCGCCACCGGTTCTGTCGCGCGTTGCTCATATTCACGCAGCCGAGCGCGTGTCTCATCGAG
+CTCGACAGCAACCTTCTTTAGGTAGTGAAAAAGCTTTTCGCTCTGCTGGTCGGCACCTTCAACGCTCATC
+GTCCGTTGCTCCTCTATCACTTCCCAAGTTCGGAATCGATTAGCTGGAAAATTTCGTCAGGAGTCGAAGC
+AGCCTGGATCAGCTTGCCCAGGCCCGCCTCGCTGCCGGCGATGGTGCCCAGCAGGGCACGCAAACGGTCG
+GCCACCCGCTGCTTCTCGCCGTCGGCGATGACGGCCACCAGCTCTTCGACCTTGTTCAACTGCTCTTCGA
+TTGCCCAAAGACCCGTCGCGCCGCTATTCACCGGACCGGCTGATTTCAATCGACCATGCCCGCCGGCCAG
+TTCGGCCTCCAAATACTGGGCTAATCCCGATATCGACCCGTAGTCCCACCCAACCGTCTCGGGTAACCGC
+AGGCCGGTAACTGCCGCCAATCGCTTGCACAGCGTGACTGTCATTTGCGAGTCAAAACCCAGCTCCGAGA
+AGGCGAGATCCTGATCGACCGACCAAGGATCTGGCTCACCTAACATCTTCGCGGCCTCGGCGCATACGGC
+ATCCACCACCAGCCGCTGACGTTCTTGCCGCAAAGCGACCAACCGCTCGCGAAGAGTCGCCCCGCCGTCG
+TTTCCTCCGGCGATCGTCATGTTGGACGCCGACAGGTCATCACGCTGCGCCCGCACGCCGGACCCAGGTT
+CAGTCAACGAGAGTTCCCAAATCGGTTTGGTTGGACTCTGCTTGCGCAGGGCGCCACGCACCAATTTCCC
+GTTCGGGGTTCGAGGGAGTCGATCAACAACGGCAAACCTATGCGGCACCTTGAACGCAGACAATCGGTTG
+AGCAATCCGCGGTGAAGGTCTCGCATGACCGACCCATCGATGGTGGCACCGCTGGTCGCAACCAGAAAAG
+CCTGCAGTGTCGACGCGCCCGTGGACTCCCTTACCGCGACAACCGCGGCCTCAGCCACGGCTTCGTCCTC
+GATGATGAGTCGCTCGACCTCACGCGGATCAACGTTGACCCCTCCGATAACCTCGGTGTCGTCGGCGCGG
+CAGCGGTAGGTAACCCACCCGTCGCTGTCGATACACACCCTGTCCCGCGTGTCGAGCCAACCCTCATTCG
+CGACGGGGGAATCAGGCCGATTCCAATAGCCCTTAGCGATCGCCGGTCCGCGGACCCATAGGTCGCCCTC
+AACCCCAGGCCCGGCAGTTGTTCCATCCGGCGCTACAACACGAATCTCGTAGGGCGGCAGCACCCTTCCC
+AGCGTCCCCAGGCGCCATTCGTCAACCCGATTCGATACGAACGTCTGCCCGACCTCCGTAGATCCAATAC
+CGTCCAGAATGGGGATGCCGCCAAAGAATTCCATGAGCCGCTCGGCAAGACCCAGCTCAAGGGCCTCCCC
+GGCTGACACCACACATCGAAGCGAACGGAAGGAATCAGGAGAACATGAGTCGATGACTCTGGCAAAGAAA
+TTTGGCACACCGTAGAGCACCGATGGCCCAAATCGCGCGCTTAGAATGGCCGCTGCTTCTGGAGTTACCG
+GCGCCGAATTGATGACCGCGGAACCACCTGTCGCGAGTGGAAACCAGACCGAATTTCCTAGGCCGTAAGC
+AAAATACATGCGTGCACTACATAGCCCAGTATCTTCAGGAGTGAGCCGCAAGGCTTTACGACACATAGCG
+TCCACGAACGTCAACGGGTCGGCGTGCCGATGAATCGCCGCCTTCGGCGGACCCGTGGTACCAGACGTAT
+ACGTAGCGTATGCGAGTGCGTCACCACCCATCGGTTCGTAGCCTCCAGGCGCGACTCGAGCCGCCTCGGA
+CATGAGTTCCGCGGCTTCGGCCACCCGCGACGGCTGAAACCGATCGCGCAGCGCATCCGAGGTGACGACA
+AGCGCCGGTTCCGTGTTGCGTGCGGCCAACGCGTGGTCGTCGCGATGCAGCTCCGGATTCGCTAGAAACG
+CCATAACCCCACGAGCCAGGCACGCCAGCAATAGCTGCACCAGGTCGGGCGAATCCGGCAGGCACAACAG
+AACCCGATCACCACTGGATAGTCCGCGGTTTCTCAGCACTTCCCCAAGACGTGCGGCACCGTCGTGGATT
+TGACCATGAGTCACCACATCGGCCGCATAGAAGGCCGGCCGGTCGTACCATCCCGCCTCCGATGCCTGCT
+CAGCCAGGAGCCCCGCTAGATTCCCATTCCGCATTTATTGGATGACCGCCCTAGCGCGCCAGAGTGATGG
+CATTTGAAAACTGCCAGCGATCAGGTTCTTCATGCGGAGCATCTCGAAATACGCTTCGTAGAAAGTGCTC
+CGTCACCACCATGATCGGCTGGCCTCCGGAAATAACGCGATAACGGCGGGCAACGGCTCTCTTTCGGGAA
+TTCTGATACCCGTGGAGCGCGAGCCAACCTGGCAAATCTCCGACCCAGACTTTAGCCTCTTCCTTGAAGG
+TCTCGATGTGGCTGGCTGCCATAACCTCGCCGAGAGGATCGTTTGTCTGCGTCAACCTTGTTATAATTGC
+AGCCGGCAACCGATCAATCGCAATCAACGACTCCGCGGCTACAAATAAGTGTTCCGAGTTCCGACCTTTA
+AGTATGATGTACCGCTGCAGAACACGGCCGACCCCCACCTGCCCTAGCTGCTCGAATTCGGATAGCTTCG
+GTGAAACATCGTGAATCCGCTGCTTGACGATTTGCACGATCACCTCATCGTCAGCGACAATGTTGAGAAC
+CCTAGTGAGGGTGCCATTAGCTGCTATCAGTATTCGAAGGTCACGATTGAGCTTTCGGATCTCTTGATCA
+GATAGAAAACACTCGGTCATATTCTTCCCCCACATACATGCGCTGTTATGCCATAGCATCTAGGCGGCTG
+AATTCGTGATGTAGGTAACGCTCAACGCTGGCCGAACGCCGAACCTTACCGCTGGTGGTGACCGGAATAG
+AACCCGGCGCCACCATAACGACATCCGCGACGCGCAGACGATGTGACCTGGATATCGCGGAGGCGACTTC
+ACGTTTGACGGTGCGGAGTCGATTCTTTTCCTCCTCATCTGTGCGACCCCGCTTCATGAGTTCGATAATG
+GTTACCAGCTTTTCAGTACGGTCATCGGGCACCGCAATCGCCACAACCCGGCCGCCGGTGATTTCCTGGA
+TCGTCGCCTCGATGTCTTCCGGATAGTGGTTGGCCCCATCCACCACCAACAGCTCCTTGATGCGACCCGT
+GATGAACAGTTCGCCCTCGAAAATGACGCCGAGGTCTCCGGTCCGCAGCCACGGACCTTCCGAAGTCCCG
+GGCGAGGGAGTGACGAGCCGCGCGCGGAACGTCGCCTCCGTCTGCTGCGGGTTGCGCCAGTAGCCCAAGC
+CGACGTTGTCTCCCTGCACCCAGATTTCGCCAACCGTCCCCGCGGGATTCTCCATCCTGGTTTCGGGGTC
+GACGATCCGCACGGTTGACGCCCGGGGAGCTCCATAACTCACCAGGTTGGCTCCCTCGCTGCCGTTCTCG
+GTACGCTTCGCCTGACCGACCGACAGCTGCTGGTAGTCAAAGCAAACACTCTTCGGCGCGCGTCCCGGTC
+CGGCGGTCGCCACGTACACCGTCGCCTCCGCGAGCCCATATGACGGCCGGATTGCCGTCTCGCTGAGGTT
+GAACGGGGCGAACCGCTCGGTGAAGCGCCGCAGCGTCGCGACGTTTACTCGTTCGGCGCCGGTGACGATC
+GTCCGCACATGCCCGAGGTCAAGTCCAGCCATATCGTCGTCGGATGTTCTGCGTACCGCCAATTCGAAAC
+CGAAATTCGGTGCGCTGGAAATCTGTGCGCGGTGTTTGGCTAATAATTGCATCCAACGGGCCGGCCGCTG
+CAAGAATGCCATGGGACTCATCAACACCGCGGTGTCTTGATTGATCATCGGGAGAATGATGCCCAGCATC
+AACCCCATGTCGTGATAGAACGGCAGCCACGATACGGGAGTTGACGGAACCTTTTCCGAATCCCCGATGT
+AATCGGACATTAGCTGTACGCAGTTGGTGATGACATTCTTGTGCGAGAGGACAACACCGGCCGGCGCGCG
+GGTCGAACCGGATGTGTACTGTAGATATGCTGTGCTCGGACGCTCGAACCGAGTCGGATCGAGCGCTCTG
+GATGAGCTCAAGTCCAGAGCGTCCACAGCCACGACGATGGGCGCGGACTGGCCCTGTGCGGCGCACGCAT
+GTGGCGCATATGTCGTGACCTCGTCAATAACCGACGAGGTCGTAAGAATAATGGACGGCGCAGAGTCTCG
+TAATGCCGAAGATATTCGTTCGTCGTGAATGCCGAATTGTGGCACCGGAAGAGGAACCGCAATGAGACCA
+GCCTGCAGCACACCCATAAAGGCGATGATGTATTCAAGGCCCTGCGGGGCCAATATCGCGACCCGATCAC
+CGCTTGACGCGTATATCCAGAGCTCCTCTGCCACGATCATCGCTCGCCGGTGGACTTGCCACCACGTCAC
+GGTTTCGGTGAAGCCAGCCGGATCCGTGTCATAGTCAATGAACTTGTACGCCGCGCGATTGGGGTACTGG
+CTCGCCGCCTTCTGTAGGAGATCAGCGAGCGACGACTCGCTCATAGCGAATCGCGATGTGCTCCCGTTCA
+GCGGTTGTGCCGCTTGCTCACCGGTGCCCCATGCCGGTTGTGTCGCCACCTCGCCCGCGGCATGAAATGA
+CGAGTTGGTTTTCATGGTCTTCCTTCAGCTATGGACGGCAGAGAGCAGACGGCTGCGCTGCCGCTTTCAT
+ACGAATCCGAGTCGGCGCATAGCGTCTGTACCTTGCCCGGGCTCGCGACGCGATTCGTTAAGGTCTCACG
+ACCATAGCAGGTACGGGCCACACCCGAGGGCCTAATGGGATTGACGGAATCGTCAGCCGCGGCGTCAGCG
+CTGGCTGCAGCCCCATTCGCGAAACACACCGTTGGGCTGGCTTCGCTAAGCCTAATGAGCACCGTCTTCG
+ATGTCGACCTGCTGATCGTGCCGGAGCGAATTCGCCAGCGCCGTGCGATTCGTTCGATCCGGTCGCGACG
+GGTGGCACCCGCAGAGCGCTGTCAGACCCCACAGGTCACAGTTCAGAGACCGCAACCGACTGATCCCGCC
+GGTACACCGTGCCCCCACCAACACGAATCACGGCAAGCCCGTTGCGGCGAGGCCGAACCGAGTAACCGCT
+GATCAATGGCCTGACCTCAAGTCAGCTGAACGTGCGCACGGCTGACCTGTGGGCACTCTGGGAAATTCAC
+ATCGAGTTCCAAGCTCGACACGCCGAAATCGCCTGCCGCACGCCGCGATTGGCACGCCAGCCGCTGGGCC
+GGCTTACCCCATCTTCGCGAGAGTGGCGCAAATCATAGCTTCTTGAGCCCGCGCAAAACCTTGGCGTGCG
+GCAGGACAGCCGTCACCGTCTTGCGCAGGCTGGGGTTAACCAAACTGCCGTTGATCAGCACAACGTAGCG
+CAGCCCGTGATCTCGCCATTCCGCTACTTGATCGATGACTTCGTCAGGGGTTCCACTGAAGACGACTTCT
+TTCATAAGCGCAGCCGGGACCTTGGCCGCGTAGGACAAAACCGTCTGTTTGTCCATGGTTTGCGGGATGA
+TGTCCTGCACACCGGAGAAGTCGGCTCCCATTGGATGCTCGACGCCGTGACGCGCCCAGGCTTCCCCAGG
+TACCCCGAGCGCGGTCATCTTCACAACGACAGATTCCAGCGCCTCTTCCACGTCGTCGCGATTCCGTCCA
+GTGATGATGCCGCGCACCGCCGCCGGAGTAATCGACATTGGGTCGCGTCCGGCATCGGACGCCGCGCTGC
+GCACCGCTTCGAGTGCGCGACTGTAGTCGCTGGGACGAACCACAACAATGGGAATCCAGGCATCGGCGTA
+ACGTCCGGTGGCCCGTAACATCCGCGGCCCGTGGGCCGCGACCCAGATTTCGGGCCATTTCCCACGGTAT
+GGCGGAAGGTCGAACAAGGCGTTATGTAACGGAAAGTATGGCGATTCACGTGAGATAAGCTCCCCGTTTG
+AATTCCACAACGCGCGAATGGTGGCCAGGGCTTCTTCGAACCGCGCCACCGGTTTGGTCCACTCCACACC
+GTAGGGCTCGTTGCCTTCACGTTCCCCGACACCGATACCCAATATGGCTCGGCCTCGGGTAAGCAAGTGC
+AAAGTCGCGGCAGCCTGGGCTGTGACCGCTGGATTGCGCCGACCTGCATCGGTCACGCACACGCCCAGTC
+GCAGACGGCTGGGCAACCCGAAGGCGAGGTTTCCAAGCATCGTCCACGGTTCGTAATTGGCATCGATCTT
+GGGCACGAATTTCGCCGCAATTCCGAGATATTCGGAAGTCGCAATCGAGCGCGGCACCAGCGCATTCAGA
+TGGTCGCCGACCCAATACGAGTCGGCGCCCATCACGGTGGCGGCCGCCATGCTAGACCGTGCCGGCAGGG
+TCGGCGGCAACCGCGAGTGCACGAGGGCATCAACAAAACCGAAACGAAGTCCGCCCACGCCTACCCCTTG
+TCTACTACGCTGTTGACCAACGTCATGGCTAGGAACGCTACCTCAGCGAGTCATGTCCGCGCGGTCGCGC
+GTTGAGCAACACCGGGGTCGGATGTCATGGCATCGACCGCGGGCTCGGTGTTGCGCCAACTTCTCTTCTG
+ACGCATCGCTCGTACATACTGTCTGCCATACTCCTTGCCCATGGCCTTCAGTCGAACCCACAGCCTCCTC
+GCCCGCGCGGGCAGTACCTCGACCTACAAGAGAGTTTGGCGGTACTGGTACCCGTTGATGACGCGCGGAC
+TCGGTAACGACGAAATCGTGTTCATCAACTGGGCCTATGAGGAAGATCCGCCGATGGACCTGCCACTGGA
+GGCATCCGACGAGCCCAACCGAGCCCACATCAACCTGTACCACCGCACCGCGACCCAGGTCGATCTGGGC
+GGCAAGCAGGTGCTGGAGGTCAGTTGCGGACACGGCGGCGGAGCCTCTTACCTCACACGCACGTTGCACC
+CGGCCTCCTACACCGGCCTGGACTTGAACCAGGCGGGAATCAAGTTGTGCAAGAAACGACACCGGCTGCC
+TGGTTTGGACTTCGTGCGAGGTGACGCCGAAAACCTGCCCTTCGACGACGAATCCTTCGATGTTGTGCTC
+AATGTCGAAGCCTCGCACTGTTACCCGCACTTTCGGCGTTTCCTCGCCGAGGTGGTTCGCGTGCTGCGCC
+CAGGAGGGTACTTCCCATACGCCGACCTGCGCCCCAACAATGAGATCGCCGCATGGGAGGCCGACCTCGC
+TGCTACCCCGCTGCGGCAACTGTCGCAGCGGCAAATCAACGCCGAAGTGCTGCGCGGCATCGGAAACAAT
+TCACAGAAGTCACGGGACCTGGTCGACCGCCATTTGCCGGCCTTCCTGCGTTTCGCGGGCCGCGAATTCA
+TCGGTGTGCAGGGCACGCAGCTGTCCCGCTACCTGGAAGGCGGGGAACTCTCGTACCGGATGTACTGCTT
+CACCAAGGACTGAGCCAGTTTCGGGTAATGTCGCCCGGATGAGCCCAGCTGAGCGCGAGTTCGACATCGT
+TCTATATGGCGCCACCGGCTTCTCCGGCAAGCTGACCGCCGAACACCTCGCTCACAGCGGGTCAACAGCA
+CGGATCGCATTGGCCGGTCGGTCAAGCGAACGGCTGCGGGGCGTGCGGATGATGTTGGGCCCGAACGCAG
+CGGACTGGCCGCTGATCCTCGCCGACGCATCCCAACCCTTGACGCTCGAGGCGATGGCCGCGCGGGCCCA
+GGTGGTGCTGACCACGGTCGGCCCCTACACGCGTTACGGCCTGCCGCTGGTGGCGGCCTGCGCGAAGGCC
+GGAACCGACTATGCCGACCTGACTGGCGAGTTGATGTTCTGCCGAAACAGCATCGATCTGTACCACAAAC
+AAGCCGCCGACACGGGCGCCCGGATAATCCTGGCGTGCGGATTCGATTCGATCCCTTCGGATTTGAACGT
+GTATCAGCTGTACCGTCGGTCCGTCGAGGACGGCACCGGTGAACTGTGTGACACCGACCTCGTGCTGCGT
+TCATTCTCGCAACGCTGGGTCTCCGGCGGCTCGGTAGCAACGTATTCCGAAGCAATGCGCACGGCATCCA
+GCGACCCCGAGGCCCGTCGGCTCGTCACCGACCCGTACACGCTGACCACGGACCGGGGCGCCGAACCCGA
+ACTTGGTGCGCAGCCGGATTTTCTTCGGCGTCCAGGACGTGATCTGGCGCCCGAACTTGCCGGCTTCTGG
+ACCGGCGGGTTTGTGCAGGCTCCGTTTAACACTCGAATCGTTCGGCGTAGCAACGCATTACAGGAGTGGG
+CTTATGGCCGGCGGTTCCGCTACTCGGAAACAATGAGTCTGGGAAAGTCGATGGCGGCGCCGATTCTCGC
+CGCAGCCGTCACCGGCACTGTGGCGGGCACCATCGGGTTGGGGAATAAGTATTTCGACCGACTACCCCGA
+CGATTAGTGGAGCGCGTCACGCCAAAGCCAGGCACCGGTCCGAGCCGGAAAACGCAAGAGCGGGGCCATT
+ACACCTTCGAGACGTACACCACCACGACGACCGGTGCCCGCTACAGGGCGACTTTCGCGCACAACGTCGA
+CGCGTACAAGTCGACCGCGGTGTTGCTCGCGCAGAGTGGTCTGGCGCTGGCGCTCGATCGCGATCGGCTC
+GCCGAGCTGCGGGGGGTGCTCACTCCCGCAGCGGCGATGGGCGATGCGTTGTTGGCGCGCCTCCCGGGCG
+CCGGCGTGGTCATGGGAACGACCAGGCTGAGCTAACATCTCCACCCCGGCCGCCAGCAAGATTAGCTATG
+CCATGGGCACATTAGCCCAATCCTGTTCTCCCAGATCTGGGCCTTTGCCGCCGAGAATCAAACTCCTGAC
+GACAACCCACGTTCACATGTGGGCTTCAGCACCGGCGCTGCACCATCGGAAGCTCCTCGACCAGGGTCGG
+CAGGTTCAGCGGAGCCCGCGAAGCGACAAACACCGCACGAGCCAAACCTGTGGAAGCTATCGGTCCGTTC
+GCCCGCCAATCCAGTGGAAACTGCCGGTGCCGGGGCTGCGTAGCGGTCACATATACGTGCGGCATCTTCT
+CCCTCAGTCGGTTCATCACCCACACGCGCGAAGGCCGACACCCCGTGCCGGTTATCGCCTGGCTCGGCGA
+GGAAGCCCTCTCACTAACCAGAAAAGGCTCGTCTTCGCCGGAATAGCTCACGCATGTCTCCAGCAGCAGA
+AGGTCCACTGCGCGGTCACACATCCACGCCAGCGCCTCGGCAGGACGGGAGAGGTGGTAGAGCACTCCAT
+AGCAGTACACCACGTCGTATTGGTGCGCTTCTGCTGGGAGATCGCCGTCGAGATCTAGGTGGTCGACTGT
+GACATTGGGATTGGACCCGAAGCGTTGGCGAATGACATCCAGATTCTCCCCCCGGGGCTCGGTGCAGAGC
+ACCTTGCACCCGCGGTCGAGGAAGAACTGCGTGTGATCGCCGATCCCGGCACCAACCTCCAGCACGCTCT
+TGTTGCCGAGGTCGAGCCCCAGCGTGGCCAGGTGCTCCTGACGGCGGGCGTTGTGCCGAAGGTAAAAGAT
+GCTGTGAAAATGCCGTTCCGCAGTCGGGCGCAACATGCCGGGGAGTCGCATCAGGCGAGGATAGCGCACC
+TCGCCGAGGAGAAACGCTCGCCGATGGCTATCGAGCTGCTGACACGTCTGCGGCCCCAGCGTATCGACCT
+CCTCGAGCCCACGCCCGCTTGGCCCTGGACGCCACCGCCACCCAGCAGCGCAAACGCCCGGGGCAAGCAC
+TCGAGGTAGAGAGCGGCAGCCGGCGCCAGCTATCCCTTCCGGCTCGGAATAAAGAAGTAGCAGTACCGGT
+CGTCGCGGTGCCGTTGGTAGGGCTGCAGCCCCGCATCGTCGGCGTAGACGAACGGTTCGTAACCGTACGC
+GCGGATGTCCGCAATGGTCCGTTCCGGGTCCGGATTAGAGGCGGCGCCCCCGTAGATCTCCACCAGCAGG
+ACCGGGCGATCGCGCCGCAGAAGCTCCGCGGCGCCCGCGATGACCGCGCGCTCGAGGCCCTCAACGTCGA
+TCTTCAGCAGACCCACCGGGAGGGGCAGCTCGGCGGCGAGCGCGTCCAGCGTGGTACACGGCACCCGTGT
+CCGCTCGCGAATCCGAATTCGTCCCGTGTCGTTTAGCGAACTGAAGGCGCTGTCGGCCGCCACGAAAAAG
+TCGACCTCGCCGACCGCGTCCCCGGCGGCCGTCCGCAGCGTGCGGATGCGGTCTTGCAGGCCGTTGGCGG
+CCACGTTGGCCTCCAACCGCGAATGGGTGCCCGGCGCCGGCTCCAGGGCTACCACCGGGGCTAACCTCGC
+CCAGGCCAGGCTGTGTATGCCGACGTTGGCTCCGACGTCGAGGATGCAGCGGTCTGGGTAGAGCGCGGAA
+TAGAGCGCCGCCGCGATGTCGATCTCGGTCTCCTCGAACCCGCCGGTCAACCGAACGATCCACGCGATGG
+CCGACCCCGGCTCAAGGGTGACCTGGAGGCCGCGCCAATACCAGGGGGCCAGCCGCCACCGATGGGGGGG
+CAAGCCAAACGGCCGCCAGCGTTGCAGGCTTCGAACGAGGCGGTTTGGCATGGCGCACTCTAACATCCGG
+ATCGCCCGCATCCGGTAGGTCGGCCGTTGAGCTCCGAGGTTCTCGAAACAACCAGTGGTGCCCAGATCCA
+AAGGGTGCCAACGCCGCTGGCCCTTCGCCGGCCCAAGCCGTCTGCACACTACCACCCGCATCAGGCGCAC
+ATCTTGGAACTGCACCAGGTCCAATCGTCAGCAGCGCCTGGCGTTGTGACCGAACCTCGGGTCCGCAGAC
+CCACTACAATGTTGCGCGACCCAAACTATCCCCCGGGGCGGAGTATTTAGCGTGTTAGTGTTGCACAGTG
+AAATCGTTGAAACTCGCTCGTTTCATCGCGCGTAGCGCCGCCTTCGAGGTTTCGCGCCGCTATTCTGAGC
+GAGACCTGAAGCACCAGTTTGTGAAGCAACTCAAATCGCGTCGGGTAGATGTCGTTTTCGATGTCGGCGC
+CAACTCAGGACAATACGCCGCCGGCCTCCGCCGAGCAGCATATAAGGGCCGCATTGTCTCGTTCGAACCG
+CTATCCGGACCGTTTACGATCTTGGAAAGCAAAGCGTCAACGGATCCACTTTGGGATTGCCGGCAGCATG
+CGTTGGGCGATTCTGATGGAACGGTTACGATCAATATCGCAGGAAACGCCGGTCAGAGCAGTTCCGTCTT
+GCCCATGCTGAAAAGTCATCAGAACGCTTTTCCCCCGGCAAACTATGTCGGTACCCAAGAAGCGTCCATA
+CATCGACTTGATTCCGTGGCGCCAGAATTTCTAGGCATGAACGGTGTCGCTTTTCTCAAGGTCGACGTTC
+AAGGCTTTGAAAAGCAGGTGCTCGCCGGGGGCAAATCAACCATAGATGACCATTGCGTCGGCATGCAACT
+CGAACTGTCCTTCCTGCCGTTGTACGAAGGTGGCATGCTCATTCCTGAAGCCCTCGATCTCGTGTATTCC
+TTGGGCTTCACGTTGACGGGATTGCTGCCTTGTTTCATTGATGCAAATAATGGTCGAATGTTGCAGGCCG
+ACGGCACCTTTTTCCGCGAGGACGATTGATTGGAATCGCTTCGCGAGGCCCGGCACCAGACCGGGCACCA
+GAGGTCCGCGCAGATCGCCTGGGTCGAAGATGGTGCAGACGAAACGATACGCCGGCTTGACCGCAGCTAA
+CACAAAGAAAGTCGCCATGGCCGCACCAATGTTTTCGATCATCATCCCCACCTTGAACGTGGCTGCGGTA
+TTGCCTGCCTGCCTCGACAGCATCGCCCGTCAGACCTGCGGTGACTTCGAGCTGGTACTGGTCGACGGCG
+GCTCGACGGACGAAACCCTCGACATCGCCAACATTTTCGCCCCCAACCTCGGCGAGCGGTTGATCATTCA
+TCGCGACACCGACCAGGGCGTCTACGACGCCATGAACCGCGGCGTGGACCTGGCCACCGGAACGTGGTTG
+CTCTTTCTGGGCGCGGACGACAGCCTGTACGAGGCTGACACCCTGGCGCGGGTGGCCGCCTTCATTGGCG
+AACACGAGCCCAGCGATCTGGTATATGGCGACGTGATCATGCGCTCAACCAATTTCCGCTGGGGTGGCGC
+CTTCGACCTCGACCGTCTGTTGTTCAAGCGCAACATCTGCCATCAGGCGATCTTCTACCGCCGCGGACTC
+TTCGGCACCATCGGTCCCTACAACCTCCGCTACCGGGTCCTGGCCGACTGGGACTTCAATATTCGCTGCT
+TTTCCAACCCAGCGCTCGTCACCCGCTACATGCACGTGGTCGTTGCAAGCTACAACGAATTCGGCGGGCT
+CAGCAATACGATCGTCGACAAGGAGTTTTTGAAGCGGCTGCCGATGTCCACGAGACTCGGCATAAGGCTG
+GTCATAGTTCTGGTGCGCAGGTGGCCAAAGGTGATCAGCAGGGCCATGGTAATGCGCACCGTCATTTCTT
+GGCGGCGCCGACGTTAGCGCGATACCACCGCAACGTTGACTCGATGCCCTTGGGCGGCGTGATCTTGGGT
+GGCCAACCCGCCTCTTGCAAGACCGACACGTCTAACAGCTTGCGTGGTGCGGCGCCTGTCAAGCTCTTTG
+CGCCAGTGTCTCATTATGTGGACGCTATTTCGGATCTGGGGTGGGCGGGTTGATCCATGCCGCGGTCGCC
+GGTTTCGGGGGTTGCGGTGAGACGCCGAATGGATTCGGGTTGGCCGAGTAGGCGTTGGCCATGGCCGCGC
+CCATGTGGCCTGGCCAGGTGCGGGCGTGTTCGATCGAATCGAACCGTTCAGGAGAGTCGTTGCGGTACTT
+CAGCGTTTTGAACTGCGACACGCTCCCGAATCAGGTGCTCGACCGGACATCCGTTGGCTAGCCGGCGATA
+TCGTGGGCACCCTTTAGCAGACGAGCCGCAGCGCACTTTCGATGTGCTGCGGGAATCCGGCAAAGTCTGG
+TCCGAAGGCTTCGGCAAGCCGCCGGGCGGCTTGTCGGAACTCGGCCCCACTGAGCACCTGCTTTACGGCT
+GCCGCCACGCCTTCAGTGTTGAGCCGCTCGGTTCACAGGAGAACGCCGGCGCCGGCCCGCTCAAGGGCCT
+CCATGTTCAAGTGCTGGTCCATGTTGCTGGGGAGCCCGATCACCGGCACCCCGGCCGCCAACGCCTGCTG
+CGTCGTCGGGCTGCCGCCGTTGCAGAGCACCACGGCGGAGCGCGCTGCAGCCGCTTCGCCCGGCAGGTAG
+TCCGCGACGAAGGCGTTGGCCGGCACGTTCTTCAGGTGGTTCCGGCCAGCGGTGGCCGCGATCACCGTCA
+CGGGTAAATCGGCCCAGGGCGTTCAAAACCACCTGCAACAGGTTCTTTCCGCCGGAACTGCCGAGGGTCG
+CATAAATAATCGGCCGGTCTGTCGGCAGCGAGTGCCACCAAGTCGGCGGTTTTACGTCGGGCGACCACAG
+GACGGGTCCGAGATATCGATGGTTGGCCGGCAGGTTGTATGTCGGCACCAGCTCGGGTACGTCGGCATAC
+AGGGTGTAGTCACCGTCGGTGAAAATGCGGCACAAATCCCAGCCCAGACTCGACAGCCCGTGCTTCCGGC
+GGAGCCAGTTGAGCGGGAGACAATAGAGGGCAAAGATCAACGGACGGTACAGGCGGTACAGGATGCTGAC
+CGGCCTGACCCCGAAGAAGCGGGTCCACGGCACGTCTGGCAGCGGAAACCGACGGCGGGCCTGAGGACTC
+CAGTAGGCGTTCGCGATGGCGATGTACGGAATGCCGGCTAGTCGGGCGCTGACCGAGAGCGAAAGACGGT
+TGTCACCGACGACTACGTCCGGTGCGATCTCGTTCAGGATCTTCCTGTCAGCCGCGATGTATTTGCGCAA
+CGTCCGCGTGTTGTAGAAGAGGCGGCCCTGAGCGATTTTAAGGAGAACCTCCTCGCTGGGGACGGTGTGA
+ATCGGGTGATGTGGGAACGGGAGCGGGCCCAAAAGCTTATTGAACCGCGGGTCGCAGGCAAAGTGGACCT
+CATAACGACTCGGGTCCAGCGACCGCGCCAACACGAACGGCCGGACGACGTGGGCCAGGGTCGCGGCCTC
+CCCTACAAACAGGATCCGTTGCCTGCGAGCGACAGGCTCCGGTGCGGCGTTGGGCGCCGTGCTCGTCCCA
+GCGTCCGGTCCCGGGTCGCCGGCGACGCTTGTTTCCTCCATACTCGCCCCCTAATCTCGAGGCAGCCCGT
+ACCCGCAGGCAACCTCCCAAAAATGCAATCCCCCAAAATGCAATGCGTCGAGCTATTTCTCACACCGACC
+GCTAGTTGCGGATCAGAAATCCGTTGGGCGCGGAAGTCCAGCCGAATTTGTTCTCCCGCTCCGCATCATG
+CTTGTAATCGTTTGGAAATTCATCCTCATATGCCTCGATCGCTTCATAGGGTCCAGGCCCAAACCCGGGC
+AGGACTGGGTGGCCGTTGATGTTGGAATCCTCGACTACTAGGTAGTCACCGGCGGAGAGTAGCGGCCGTA
+GTAATTTCATCTCGGCCAGCACATGATTCATCGAGTGGTCGCTATCTAAGATGGCGAAGATCTTGCCAGG
+GTATTCGTTTTTGAGGCGTTGAATTTGTTCGGCAATCGCCGGGTCGGTGGATGACGATTCAACGAACAAA
+ACATCTGGTTCGCGCCGGGCTCTTGGATCGAGGGCTTTGTGTGAGTTGTCCACGGTAAGTACCTTGAATG
+GCTGGCCGATCTGCCTCATGATGTTGGCAAAATACACCGCCGAGCCGCCGTAGCGGGTGCCGAACTCGAT
+GACGAGGGATGGTTGCAACTCGCTCAGGATCTCCTGGTAATTCCACATATCGCTGACGGATTTCCAGCAA
+TTGATCCCCATATAAGTGGTCTTCGTCCACACTAAGTTGCCGTAGTACCACTTGTGGTATTCTTCCGCTA
+CTGCGTCGCTCGGCCGGTAGAATAACTGGGCCGCAAAACTCGCCACTAACCTGACTAGTCCGATCAGTTG
+CCCTACAAGACTAGTCCGACTGCGCCACACTAGCCCCATTCCATCATCTCCTCACTGCGAAACCGTAGTC
+AGTCGAATGTTGGTCATTTAGCAAGCCTCTTTAAGAGAACTGATGAGGTCGAAGCGGACTCAATACATGG
+CTGCGGCAATTCGTTAGACCGCGTTCGCGCCCACGTTGTGAGCTCCGCGCGCCGCATCCTTGGGGCTCGG
+TGCCGGGCATACGCGACCCAGCTTGCGGCTGAGCATCTTCTGGACACCGCCACCGCACGGCGGATGGTAG
+CAACAGATTGGGGTTACCCTCAAACCGCGGGTTATGGACTGCCAAAGGTAGCCAGCTTGTCCTGCTCGCG
+GTGACAGCGCAACCACGGGTAGTGACACTACCGCCGTGGCGTTCCTCCCCACGGCAGAAGGCCGGGGCCG
+GTCGAGTTCGGGCACAAGCCCCAGATCGTCGACAACGACGATGGCATCGTCCTGGATCACACCGTGGAGC
+ACGGCAATCCGCATGACGCGCCGCAGCTAGCGCCCGCGGTCGAACGGATCACCACACGCGCCGGACGCCC
+GCCCGGCACCGTCACCGCCGACCGCGGCTACGGCGAGAAACGCGTCGAAGATGACCTGCACGACCTCGGT
+GTACGTACGGTCGCGATACCGCGTAAAGGCAGACCCTCCCAGGCCCGGCGCGCCGAAGAACAACGGCCAT
+CGTTCCGACGAACAGTCAAGTGGCGCACCGGCAGCGAAGGCCGCATCAGCACCCTCAAACGAAACTACGG
+TTGGAACCGCTCCTGCATCGACGGCACCGAAGGAACCCGGATCTGGACCAGGCACGGCATCCTCACCCAC
+AACCTCATCAAGATCAGCAGCCTCGCAGCATGACCCGGCTCCCAGAGCACGAAGCTCTGCCCCACCAACA
+GTCCGGCGGCATTCGCCCACAAACGACTCACTTAGTCGCCGTCACTTTTTCAGGTCGAAGTAACTAGCTG
+GCCAACCATGTCCGGGGCCGGTTCTCCGGCATGAGGCGCAGAGCATTCTCCACATGCTGCGGGAATCCAA
+CGCGGTCTCGTCCGAAGGCATCGGCGAGTCGCGCGGCGGCTTGTCGGTACTCGGACCGACTGATCACCTG
+CATCACGGCCCCTGCCACCCGCTGACTCTTCAGCCGCTCAGTTCGCAGCAGCACGCCCGCCCCGGCCCGC
+TCAACGGCCTCCATATTCAAGTGCTGATCGAGATTGCCCGCGACCCCGATCACCGGCACCCCGGCCACCA
+AGGCCTGCTGGGTCGTCAAACTCCCGCCATTGCAGACCACCACGGCCGAGCGAGCCGCAGCGGCCTCACC
+CGGCAGGTAGTCCGCCACGAAGGCGTTGGCCGGCACGGTCTTCAGGTCACTGCGGCCCGCGGTGGCCGCG
+ATCACCGTCACCGGCAACTCAGCCAACGCGTTCAACACCAGTTGCAACAGATTTCTCCCGCCGGACGTGC
+CCAGGGTTGCGTACACGATCGGCCGGTCGGTTGGCAGCGAATCCCACCATGTCGGCGGCTTCCCGGCGGG
+CGACCACAGGACCGGGCCAAGGTACTCGTGGTTGGCCGGCAAGTCGTAGGTGGGCATCAGCTCGGGCACG
+TCGGCATACAGGGTGTGGTCCCCGTCGGTGAAAATGCGGCACAGGTTCCACCCCAGACTCGACAGCCCGT
+GCCTGCGGCGGACCCAGTTGAGCGGCATGCACTGCAGGGCGAAGAGCAAAGGGCGTTCCAGGCGGTAGAG
+GAGCTTGACCAACCTGACGCCGAACAAGCGGGTCCATATCACGTCGGGCAGCGGAAAACGCCGCTGCGCG
+TACGGACTCCAGTAGGCATTCGCGATCGCGATGTAAGGAATGCCGGCCAGTCGGGCGCTGACCGACAGTG
+AAATGCGAAGGTCACCGACGACGAGGTCCGGCGCGATCTCATCCAGGACCCGCAGGTCCGCCTCAACGTA
+CTTCCGCAGCGTCCGCATGGCATAGAAACGACCCTGAGTCAGATTGCCGAAAAACCGCTCGCTGGGGATG
+GTGTGAATCGCATGGTGACGGAAAGGGAGCGGACCTAGAAGCTGGTTGTAGCGCGGGTCGCAGGCGAAGT
+GCACTTCATAACGACTAGGGTCCAGCGACTGCGCAAGCGCGAATGGCCGGACGACGTGAGCCAGGGTCAC
+TGCTTCCGCGACGAAAAGGATCCGGCGCCTGCGTGCGGCAAGCCCAGGTGCGGCGTCCGGTGTCGTGCTG
+ATGGCCGCGTCCCCTCTCACCTCGCTAGCAACCGGTGGCCCGCCCCACCTCGACGCCGTAGCGTACACGC
+ACGACACGCGCACTCGGGGAAAACCTCGGCAAGAGTGGGGCGGCGATACGTTTAGCGGCACCACTGCGCG
+GTCGTTGCCCACCCCGGTGACTATACCCCCGGGTGGTATATGGTGGAGGGCAGAGCGTGACCTCAACCAA
+AGTGGAGGACCGAGTGACGGCAGCAGTGCTGGGAGCGATCGGGCACGCACTGGCGCTGACCGCGTCGATG
+ACCTGGGAAATCCTGTGGGCGCTGATCCTGGGCTTCGCGCTGTCGGCGGTGGTTCAAGCCGTGGTGCGCC
+GCTCCACGATCGTCACGCTGCTCGGCGACGATCGGCCGCGCACCCTGGTAATCGCCACCGGCCTGGGCGC
+GGCCTCGTCGTCGTGCTCGTATGCCGCGGTGGCTTTGGCTCGGTCACTATTCCGCAAAGGGGCCAACTTC
+ACTGCCGCTATGGCGTTCGAGATCGGTTCCACCAACCTCGTGGTGGAGTTGGGCATCATCCTGGCCCTGC
+TGATGGGCTGGCAGTTCACCGCCGCCGAGTTCGTTGGCGGTCCAATAATGATCCTTGTCCTGGCCGTGTT
+GTTCCGGTTGTTCGTCGGCGCCCGGCTCATCGACGCCGCCCGGGAACAGGCCGAACGGGGACTCGCAGGC
+TCGATGGAAGGCCATGCCGCCATGGACATGTCCATCAAGCGGGAAGGCTCATTTTGGCGACGACTCCTTT
+CCCCACCGGGATTTACCTCCATCGCCCATGTGTTCGTGATGGAGTGGTTGGCGATCCTGCGCGACCTCAT
+TCTCGGGCTGCTGATCGCCGGTGCTATCGCGGCATGGGTACCCGAATCGTTCTGGCAGAGCTTCTTTTTA
+GCCAATCATCCGGCCTGGTCGGCGGTCTGGGGTCCGATCATAGGACCCATCGTGGCCATCGTTTCGTTTG
+TTTGCTCGATCGGCAACGTGCCACTTGCCGCGGTGCTGTGGAACGGAGGCATCAGCTTCGGCGGGGTCAT
+CGCGTTCATCTTCGCCGACCTACTGATACTGCCGATCCTGAATATCTACCGTAAATACTATGGCGCCAGG
+ATGATGCTGGTGCTGCTCGGCACCTTCTACGCATCGATGGTCGTCGCTGGCTATCTCATCGAACTTCTCT
+TCGGTACAACGAATCTCATCCCGAGCCAGCGCAGCGCTACGGTCATGACCGCAGAAATATCGTGGAACTA
+CACCACCTGGCTCAACGTCATCTTTCTGGTGATCGCGGCGGCCTTGGTGGTCCGATTCATCACATCGGGC
+GGTCTCCCGATGCTACGCATGATGGGCGGCTCACCGGATGCCCCGCATGACCACCATGACCGCCACGACG
+ATCACCTCGGCCACTAGCGCCACCACGCCGATCAGTCGGCGCCGAAAAGGCCACCGGCGGCGGTATCCTG
+GCCTGCGGGTATTCCACCCATGGGCAAAGGGAGCATGACCGCGCACGCAACGCCGAACGAGCCGGATTAT
+CCGCCACCGCCTGGCGGTCCACCGCCGCCGGCCGATATTGGCCGGTTACTGCTTCGGTGCCACGACCGCC
+CTGGAATCATCGCCGCGGTGAGCACCTTCCTGGCCCGGGCCGGCGCCAACATCATTTCTCTGGACCAGCA
+CTCCACCGCGCCGGAGGGCGGAACGTTCTTGCAGCGCGCAATCTTTCACCTGCCCGGTCTCACGGCCGCC
+GTCGACGAACTGCAGCGCGACTTCGGCAGCACTGTGGCGGACAAGTTCGGCATCGACTACCGATTTGCCG
+AAGCAGCCAAGCCTAAGCGGGTCGCAATCATGGCATCGACAGAGGACCACTGCTTGCTGGACTTGTTGTG
+GCGCAACCGTCGCGGCGAGCTAGAAATGTCGGTTGTCATGGTGATTGCCAATCATCCTGACCTGGCCGCG
+CACGTACGCCCGTTCGGTGTGCCATTCATACATATTCCCGCCACTCGCGACACTCGTACGGAAGCCGAAC
+AGCGTCAGCTTCAGTTGCTAAGCGGCAATGTGGATTTAGTAGTGCTGGCACGCTACATGCAGATACTCAG
+CCCGGGGTTCTTGGAGGCGATCGGCTGCCCGCTGATCAACATTCACCATTCGTTCCTTCCAGCCTTCACC
+GGCGCGGCCCCGTACCAGCGCGCACGAGAACGCGGCGTCAAACTGATCGGCGCGACCGCCCACTACGTGA
+CCGAAGTTCTCGACGAGGGGCCCATCATCGAACAAGACGTCGTTCGTGTCGACCACACCCACACCGTCGA
+TGATCTGGTGCGTGTCGGCGCCGACGTCGAACGCGCAGTGCTTTCCCGCGCCGTGCTCTGGCACTGCCAA
+GACCGCGTCATCGTGCATCACAACCAGACCATCGTCTTCTGACATGGGTGACTGCGCGCGTTGCGGTCAA
+CTTCTTGGTGCCCATGATGGTCACGGCGTCGACTGGCCGTTTCGGCGCCGTCGCCCAGCGTGAACTGAGG
+GCGGAAAATCGGCTGGCCCGAATCTCGCCCCCAGTGCACGCTCGGCGCCGTTTGGCCTCACCCGGTCAAC
+GTGAACTGTCCGGGTGGGCGCTGTCACGTAGCGAGCCCACGTGGGGCCGGGGTCGGCCCGCCAAAAACGC
+CCCGGCGCGGCCAGCTCATGAGCGAGTACGCAAGCTCAAGGGACACCCGCTTTGCACTGTGGAAGAACCC
+CGAAGACCTGGCCTGCGGCAGGTGCGGTCAAAGGAGCGGAGTGTAGACAGGACCGGTGGGTCTGCTCAGC
+GCGGCCCCGAATTAGGACAATTTTCGCACCTAGCGCATCCAATATCGCTTTCGAAGAACGTTCACGCCAG
+TCCCACTGGGCCGGTGCGAATGGTGCAACGCGCCTTTCGTCGAAGGAAACGCCGTCCGCCACCGAGCCCG
+CGCTAGGCAAGTCGGTCCCAAGAACGTCGCAAGGATACGCCAAGCGGCCGCGGTCAATCTTGACTTGTCG
+GCCACCGCCGGCAAACCAACATTCAGCCACAACGCGACAGAGAGGTACCCAATGTTCACTGCCCGTATCC
+GCGCCCTCGCCGGCATGTCTCTGCTAGCCTCGGCGATCGGACTGGCGGCCTTCGGAGCCGCTACCGGCAC
+CGCCAATGCCGCCCCGACCCACCAACCCGAGTGGGGCACCTACACCTGCTACGACTACGCAACCCAGACG
+TTCTACGAGTGCTTTGACCCCAGCTAGTCGGCGAAGGCCTCACACGATCGGACCTAGTCCCGCAAAGGAG
+CTAGGTCCGTTCGGTGTTGAGCCTGTCCCGCAGCCGGCGATTCACCGGTTCGGGCAGCAACTCGGACACG
+TCACCGCCCAGCATCGCGACTTCTTTGGCCAGTGAGGACGACACGAACGAATACCGTGGCGCGGTCGCGA
+CGAAAAAGGTGTCCACACCGGCAATGTGTTTGTTCATTTGCGCCATCTGCAGCTCGTATTCGAAGTCGGT
+GCCGGTGCGCAGCCCCTTCACGATCGCGGTCATCCCGCAAGACCTGACAAAGTCGACCACCAAGCCATGC
+CCGACCTGCACGCGCAGATTGGGCAGGTGCGTTGTCGACTCCTTGACCATCGCGATCCGCTCGTCGAGGT
+CGAACATGCCCGTCTTTGCAGGGTTGACCAGGATGGCAACCACCACCTCGTCGAATTGGGCTGCGGCGCG
+TTCGAAAATGTCGACGTGGCCTAACGTCACCGGGTCAAATGACCCTGGGCATACCGCGCCCGTCATCTGC
+GCCGCTCCTCCTCATCGCTGCGTCCCCCGCAAGCGGGCACGGCCCCCACCGCATCGTCGCCGGCGGTCAT
+GACCGATGACGCTACACGTTGGCAAAAAGCCGTTCGGCCAGTTCCAAACGGGTGTCGCCGTAAACACGCT
+GGGGCCATCGGCGCCAGCCCTCCGGCCACGTCAACGGCGCGCACGTGGTCGCACGCTCCACCACCGCTAC
+GGTTCCCTCGCGCGTCCAGCCGTTGGTGCCCAGTGCGGCCAGGATGGCGTCAACGTCGGCGGAGTCGACG
+TTGTAGGGCGGGTCGGCCAACACCAGATCCACCGGGGACGTGGTCCCGGCCGCCACGACGGCCGCCACCG
+CGCCCCGGCGCAGCGTCGCACCGGAGAGACCTAGGGCCTCGATGTTGCGCGCAATGACGGCCGCGCTGCG
+CTGGTCGGACTCCACGAACAGCACGGACGCCGCTCCCCGCGACAACGCCTCCAGCCCCAGGGCGCCGGAA
+CCCGCATAGAGGTCCAACACCGCCAGACCGGTCAGATCCCGCCGCGCAGTCACGATGTTGAATAGCGACT
+CGCGCACCCGATCGGTGGTAGGTCTGGTTCCGCGTGGTGGGACGGCAATGCGCCGGCCTCCGGCGACACC
+GCCGATGATCCGGGTCAAGTGCGCCGCTCTCCCTCGCAAGCGGGCGGTACCCCCACCTCATCGCTTCGTC
+CCCCGCAAGCGGGCGGTACCCCCACTGCATCGTCGCCGGCGGTGCTCATCTGCGCCGCTCCTCCGCAAGC
+GGGCGGTACCCCCACCTCATCGCTTCGTCCCCCGCAAGCAGGCGGTACCCCCACTGCATCGTCGCCGGGG
+CGGTCAGCTCACCACCACCAACAGGTCTCCGCCCTCCACCTGGGCGGTGTCCGACACCGCCACCCGCTCC
+ACGGTGCCGGCAACCGGGGCGGTGATCGGGGCTTCCATCTTCATCGCCTCGATGGTGGCGATGGTTTGGC
+CGGCGCCGACCCGCTCGCCGACGCACACCCCGACCGTGACGACTCCGGCAAATGGCGCGGCGATGTGTCC
+GGGATTGCCGCGGTCGGCCTTCTCGGCGGCCGGAACGGCACTGGCAATGCTGCGGTCGCGCACTAGCACC
+GGCCGCAGCTGCCCGTTGAGGATGCACATCACCGTTCGCATGCCGCGTTCGTCGGGTTCGGAAATGGCCT
+CCAGCCCGATCAACAGCTCCACCCCACGCTCCAGCTTCACCCGATGCTCTTCACCTTGGCGCAGACCATA
+GAAGAACTGGTTGGCCGACAATTGCGACGTGTCGCCGTAGGCTTCCCGGTGCTCATTGAATTCCTTTGTT
+GGACTGGGAAATAACAGCCTGTTCAGGGTGGCCTGACGCTTGGCTCCGACCGACGATAGGGCAATCTCGT
+CGTCCGCCGCCAATTGCGCAGTGGGCCTGGCCGCCCCGCGACCGGCCAGCGCCGCAGTGCGCAGCGGTTC
+GGGCCACCCGCCGGGCGGATCACCCAGCTCGCCCCGCAGAAATCCGAGTACCGATTCCGGGATGCCAAAT
+CGCGCTGGATCGGAGGCGAATTCGTCTGCACTGACACCGGCGCCGACCAGTGCCAGCGCCAGATCGCCGA
+CCACCTTGGACGTTGGCGTGACCTTAACCAGCCTGCCCAACACTCGGTCGGCGCCCGCGTAGGCCTCTTC
+GATCTCTTCGAATCGATCTCCCAGACCAAGAGCAATTGCTTGCTGGCGCAGATTAGACAGTTGGCCGCCC
+GGAATCTCGTGGTGATAAACCCGCCCCGTCGGCCCCGGCAACCCAGACTCGAACGGCGCATACACTTTTC
+GTAACGCCTCCCAGTACGGCTCCAGGGCGCACACCGCCGAAAGCGACAGGCCGGTGTCGTACTCGGTGTG
+GGCAGCGGCAGCAACGATCGAGCTCAGCGCGGGCTGGCTGGTCGTTCCCGCCAGCGGCGCGGCGGCGCCG
+TCGACGGCATCGGCCCCGGCGTGCCAAGCGGCCACATAGCTGGCGAGCTGGCCACCCGGTGTGTCGTGGG
+TGTGCAGGTGAACGGGCAGGTCGAAGCGACTGCGCAGGGCGCTGACCAACCTTTGAGCGGCCGGCGGGCG
+CAACAGTCCAGCCATATCCTTGATCGCCAGCACATGGGCGCCGGCGTCCACGATCTGCTCAGCCAGTTTC
+AGGTAGTAGTCCAGCGTGTACAGCTGTTCACCCGGATCGGTAAGGTCGCCCGTGTAGCACATCGCGACTT
+CTGCTATCGCAGAACCTGTTTCGCGTACTGCGTCGATCGCCGGACGCATCGACTCGATGTTGTTGAGCGC
+GTCGAAGATACGAAAGATGTCGATACCGGTGGCTGTTGCTTCTTGCACAAACGCCGACGTCACGATTTCC
+GGGTACGGCGTGTAGCCCACGGTATTGCGGCCCCGCAATAGCATCTGCAAGCAGATATTGGGCATTGCTG
+CACGCAGTGTGGCCAGCCGTTCCCAGGGATCCTCCTTGAGAAAGCGCAGCGCCACATCGTAAGTCGCACC
+GCCCCAACACTCCACGGACAACAGCTGCGGCATGGTCCGCGCGAGATACGGTGCCACCCGCGACAGTCCG
+CTGGTGCGTACTCGGGTAGCCAGTAACGACTGGTGAGCATCCCGGAATGTGGTATCGGTGACCCCGACCG
+CGGCCGACTCCCGCAGCCAACGAGCAAATCCTTCCGGCCCCAACTTGACTAGTCGCTGCTTGGACCCGGC
+CGGTGGTGCGGCCCGCAGATCAAGATCGGGCAGCTTGTCGTCCGGGTAGATCGTTGACGGACGCGAGCCA
+TACGGGTTGTTGACGGTGACATCGGCCAGGAAGTTAAGGATCTTGGTGCCGCGGTCGGCCGAGGCGCGCG
+CGGTCAGCAGCTGCGGCCGCTCATCAATGAAGGACGTGGTGACCCGGCCCGCTCGGAAGTCCGGGTCATC
+CAGGACCGCTTGCAGGAACGGAATATTCGTCGATACCCCGCGGATCCGGAACTCCGCGATCGCCCGGCGC
+GCACGGCTCACTGCGGTAGGGAGGTCACGGCCCCGACAGGTCAGCTTGACCAGCATGGAGTCGAAGTACG
+GGCTGATTTCTGCGCCCAGGTTGGTGCTGCCGTCCAGGCGGACACCGGCACCGCCGGCGGTGCGCAACGC
+GCTGATCCGGCCCGTGTCCGGCCGGAAGCCGTTGGCCGGATCCTCGGTGGTGATCCGGCACTGTAGTGCG
+GCGCCATGCGGTGCGATGTCCTCCTGCCGCAGGCCCAATTGTTCGAGCGTCTCCCCGGCGGCAATGCGCA
+GCTGGCTGGCGACCAGGTCGACGTCGGTAATCTCCTCGGTCACCGTGTGCTCCACCTGAACCCGCGGATT
+CATCTCGATGAAGACATACTCCCCTCGCTCGTCCAGCAGGAACTCGACGGTGCCCGCGCAGCTGTACCCG
+ATATGGCGGGCGAAGGCGACCGCATCGACGCACATCTTGTAACGCAACTCGGCGTCCAGGTGCGGCGCGG
+GCGCCAGCTCGATGACCTTCTGATGGCGACGCTGCACACTGCAGTCACGCTCATAGAGATGGATCACGTC
+GCCGAGGTTGTCCGCCAGAATCTGCACCTCGATGTGGCGTGGATTGATCACTGCCTGCTCGAGATAGACC
+GTCGGGTCCCCGAACGCCGACTCGGCTTCCCGGCTGGCGGCTTCGATCGCCTCCGGAAGCGCCGCGATAT
+CGCCGACACGACGCATACCCCGGCCCCCGCCACCGGCAACTGCCTTGACGAACAACGGAAACGGCATGCC
+GGCCGCAACCGACAGCAGTTCGTCGACCGAGGCCGACGGCGCCGAGGACATCAGCACGGGCAAGCCGGCT
+TCGCGGGCCGCCGCGATGGCGCGAGACTTATTCCCAGCCAGCTCAAGCACTTCGGCGCTGGGACCGACGA
+AGCTGATGCCCGCCGCCGCGCATGCCGCAGCCAGATCCGGATTCTCCGATAGAAACCCGTAGCCAGGGTA
+GATAGCGTCGGCACCCGCCCGACGGGCCGTCGCGACGATCTCGTCGACCGACAGGTATGCATGCACCGGG
+TGACCGATGTCGCCGATCTGGTAAGACTCGTCCGCCTTGAGACGGTGCTGCGAATTGCGGTCCTCGTACG
+GATAAACGGCCACGGTTCCGACGCCCAGTTCGTAGGCGGCACGAAAGGCCCGGATCGCGATCTCCCCGCG
+ATTGGCGACGAGCACCTTGGAAAACACGTGTGGCTCCCTTATCCGGATGTCTCAGATCAGCGTCGACCAA
+TAGTCCCAAAAGCGGACCATGATCAGCAGGAATACTGTCGTGAACCAGAGCGTGGCCAGCGACCATCGCC
+ATTGATAGAGCAGCCGTGCCCCGACGCGCTCCTGGCTTCCCCGGTTTTCCCGCATCGGACCGAAAACGAT
+GGACGCGACCACCACCAGCAGTGTGGCGATGACCGCCCAGACCACCATGCAGTATGGGCACAGGGCACCG
+ATACGGTACAGGCTCTGGAATATCAGCCAATGCACGAACGCCACACCAACCAGGATCCCGACCGCCAGGC
+CGATCCAATACCACCTGGGCAACGGCACTTTCGCCACCGCCAGCACCCCGGTGACCACCACCACGGTGAA
+GCCCGCAATGCCGAGAAGCGGGTTGGGAAAGCCCAGCAACGACGCCTGCGGTGTGGTCATCACCGAGCCG
+CACGACACTATCGGGTTGACATTGCATGACGGCACATAGATCGGATCGAGCAGAATCCTGACCTTCTCCA
+CCGTGAGCGTCATCGAAGCGAACAGCCCGATCACACCGCCGATCAGCACCCACCACGCGCTAGGCACCGG
+CACCCGCACCGCAGCCGGGTCGCCGGATCGCTCGGCAGGTCGAGCTGCCACCACAATCGTCAGGATGTCG
+CGGTAGCAGCGGCCGAGTCAATGCCCGGCACATCACCCACAATTTCTTTGATCTTGGCGACCAGCGCCGC
+CGGCGTCGACCACTCGTACTCTGTGCCATTGACCCGGACCGTCGGGGTCGCGTGCACGTTGACCGCCGCC
+GCCAGCCCGTCGACTTTTTCGATGTACTTGCCGCTGTTGATGCAGTCGGGCACCTTGCCCACGACGCCGG
+CTTCGCGGGCAAGTTCGATCAACCGCGCGTTGTCGGGGAAATCCTTGCCGAGCTCGGCAGGCTGGATGTC
+CTTGCTGAACAAGGCGGCGTGGAAGCGGCGGAACGCCTCGATCGATTCGTCGGCAACGCAATAAGCCGCA
+GCAGCCGCTCGCGACGAATAGTGTTGATTGCTGGCGCTATCGAGAATGGCCACCATCGTGTAATCGGCCG
+CGACAGCGCCGATGTCCACGAGCTTGGACACGGTTGGCCCGAAACCGCGCTCGAATATGCCGCACGCCGG
+ACACAGGAAATCCTCGTAGAAGGACACCACGGCCTTGGGGTTGCTGGTTCCGGGCTGGGTGACCAGCTTG
+CTCGACGTCACCCGTACTGCATCGCCGGGGCCCGCGACGCCGTCCTTCTTGTCGTCGCGCGACGTCACGA
+TGTAGAAGACCAGGACGACGGCAAAAACGACGACGATGGTGGTGCCACCAATCTGGACGAGCCGGCCGAA
+GCTGCCGTCGGCGGACTTCAGATCGAATCGCGGGGGGCGTTTGGATTTGTCGGCCACAGTTTCGCTGATC
+CTCACGTGCTCGATTTGTCGGCTTGTCGCGGCCGCGGTCAGGCGACGGCGCCTCTAGCGTACCGGCGGCA
+AGCCAGCCTCGACTCAAACCCGGCTAAGGTGCGCGCGCAGCGCGGAGATCAGCTCGTTGGTCCCGGCAGC
+ACTGCCTCCCCCCAGCTGAAACAGGTTGAGGAAGCCATGCGTCAGCGAACCCAGATACCGCAAGTCCACT
+GCAGTCCCGGCAGCCCGCAGCGCCTTCGCATAGCTTTCTCCTTCGTCGCGCAATGGGTCGAAGCCGGCGA
+CCGCGATGAGAGCAGGCGCCAGCCCGGACAGCGATTCGGCCAACAACGGCGACAACCGCGGATCCGCCGG
+ATCGACATCGGAATCCCTGAGGTATTGCGTGTGGAACCAATCGATGTCCCGCTTGGTCAGCAGGAAGCCA
+TTGCCGAACAGGCCCATTGAGCGAGTCTGTGCGGTGAAATCGGTCCTGGGATACAGCAGCCACTGCAGCA
+CCGGGGTGGGCCCACCCTCGTAGCGAGCCTTGTCGCGCGCCAACTGACACACCACGGCCGACAGGTTGCC
+GCCCGCACTGTCCCCGCCCACCGCGACCCGCCCGGGGAGCGCACCGAACTCATCGGAAGCGTGCTCATGG
+GCCCATACAAAAGCCGCATAGGCATCTTCAACCGCGGCCGGCGCCGGATGCTCGGGAGCCAACCGGTAGT
+CGATCGACAGTACCTGGATGTCGGCGTCGCGACAGGTCAACCGGCACAGCGCGTCATGGGTGTCCAAGTC
+CCCGAGCGTCCAGCCGCCACCGTGGTAAAAGACCAGCAGCGGCGTGGCGCCACCGCCGCTGGGGCGGTAG
+TGCCGCGCCGGGATCTCACCGGCTGGTCCGGGTATTGACAGGTCGGTCACGTCGACGTGGATCTGCGGAC
+CGGGCATCGCCTCGCATATCGCGCGCATGTGCGCGCGAGAGGCGACGATGTCGTCGTCTACGGCCAGGCC
+GTCGACACCGAAGATCCGCGAAGTCGACAACATCAGCTGCAGGGTGGGGTCAAGCGTATTGCCATCGATA
+ATGACCGATCGGCCGGCCGACAGGATCCGTTTGGCAGGCGTCGGGATCCACGGAAGGACCTTGACTCCGA
+CGTTGACGACGGTGCCCTGCACACGCCGTGTCCACATGCGCGGGTGGTTTGCTCCGAGACGGAGGTCTGC
+CACACCTGGCAGACTCTTGGTCATGGGCTGCTCCCTACAAAACTCTGTCACGCGCAGCAACGGACACTCG
+ATCCGCGCCGTCAGGCTGGATGTCTTTCGGGTCCTGCCGGCCGACACCGGGCAAGCGGTAGGTGCCGCGA
+GTCCGGCGTGCCCAACGGCCAACTCTACGTGGTGACCAAAGTGTTGAATGCCGACCAGCACTATTCGCGG
+CTTACGCCGCCGTCGCCGAAGGCTGTGGCTCAGCACCTGCCCAGGTGTTGATTAGGTGGCATATCCAACT
+CGGTAATATCGTGATCCCCAAGTCGGTGAACCCAATGCGGATTGCGAGCAACTTCGACGCGTTCGATTTC
+CCTCGCTCGATGACGGAACCCGGCTTGGTCCGAATCCGAAAACCTTCAATTTCACAGGCAGGTGAGATGA
+CGTGACTGGCGAGTCGGGCGCCGCCGCCGCACCCTCGATTACCCTCAACGACGAGCATACGATGCCGGTG
+CTTGGCCTCGGCGTCGCGGAATTGTCGGACGACGAGACCGAACGTGCGGTGTCCGCGGCGCTGGAAATTG
+GCTGCCGGCTGATCGACACCGCCTACGCCTATGGCAACGAGGCCGCGGTCGGCCGCGCAATTGCAGCCTC
+CGGCGTTGCCCGCGAAGAGCTGTTCGTCACCACCAAGCTAGCCACCCCCGACCAGGGTTTCACCCGTTCC
+CAGGAAGCATGTAGAGCCAGTTTGGACCGCCTCGGCCTCGACTACGTCGACCTTTACCTAATTCACTGGC
+CGGCCCCGCCGGTGGGCAAGTATGTGGACGCCTGGGGAGGCATGATTCAATCCCGCGGAGAGGGCCATGC
+CCGATCGATCGGCGTGTCCAACTTCACCGCGGAGCACATCGAAAACCTTATCGACCTCACATTCGTCACG
+CCGGCGGTCAACCAGATCGAGCTGCACCCGCTGCTCAACCAGGACGAACTGCGCAAAGCTAACGCCCAGC
+ACACCGTCGTCACACAGTCCTACTGCCCCCTGGCACTCGGCAGGCTGCTGGACAACCCAACCGTCACATC
+AATCGCCAGCGAATACGTCAAGACGCCCGCACAAGTGCTGCTGCGGTGGAACCTGCAATTGGGCAATGCG
+GTGGTCGTCCGCTCGGCCAGACCCGAGCGCATCGCCAGCAACTTCGACGTCTTCGACTTCGAGTTGGCGG
+CCGAACACATGGATGCATTGGGCGGGCTCAATGACGGCACCCGGGTGCGCGAGGATCCACTGACCTACGC
+CGGCACCTGATACGCCGCCGACTGTGAACCGCGCGACGTCTCCTCGGCGTGTCACGTCGTGAGATTCACC
+GTCGGCGCGTGGACTAGCCCGTCGGGCAGGTGGCCGCGGCCTGACGCAGTACGTCGGACGATGGCTGATC
+CACTGGCAGTGAATAGCCGCGCAGCACGGCGATGAATTGCATCGCGTACTGACAGGCGAAGGCCTTGTTG
+GGTGGCATCCATTGGGCCGGTGGCGAATCGCCCTTGTCCTGATTTGCCTGCCCCTGCACGGCCAGCAGGT
+TGGCCGGATCGTTGGCGAAGCGCATTCGCTCGGAGTTCGGCCACCGATAGGCGCCCATGTCCCAGGCATA
+CGAGAGCGGAACGATGTGGTCGATCTGGACCGATTGGCCAACACTGGCGCCGCGTTGGAAGGCAACGGTG
+GTGTTGGTGTACGGATCGCGCAGGGTGCCGGTGGCCACCGCATTCGGACACCGCTTGATCGACACATATG
+TCTTGTCGACCAGATCCCGGTCGAGGATGTCGTCGCGGGTGTCGCACCCGTTGTGCCCTCCCGGCGCGTC
+ATTGCGATCGTCCCAGGGGTGACCGAATGCGGACCTGCGGTAGTCGTAGCGGTGGATCCGTTTGGGTAGC
+ACGGCGATGCCGGCGAGCACGTCGGCACCGGGTTGCACGGTTGGCACGCCAGCGCGGGCGGCGAACTCGT
+CAGCGTGCCTGCCCGCCGATGATCCCAGCGTCTGATACGCGACCACCAGCGCCAGCGCCGCGATCGCCGA
+CAGCCACAGTAGCGTTCTGCGGTTCATGACTTATCTAAGTATTCGATGCGGTCGGTGCTGGTGAATCGCG
+CGGCCATCAGCGCCAATGCGGGGTCTGTGGGGTTCTTGTAAGCCTCGATGCAGAAGTCCCGCGCGGCCAC
+TATGTATTCCTCGTGTTCGGCCAATGACAGCAACCGCAGCGTGATGGCCTTGCCGGATTGGTTGCGGCCC
+AGCACATCTCCCTCCTTGCGCTCCTTCAGATCCAGATCGGCGAGGGCGAACCCGTCCATTGTCCCGGCGA
+CCGCACGCAGCCGCTGACCCGCCGGCGTATCCGGCGGCACCCAGCTGGCCAGCAGACACACGCTGGGATG
+TTCGCCGCGCCCGATGCGGCCGCGCAGCTGGTGCAATTGGCTGATGCCGAACCGGTCGGCGTCCATCACC
+AGCATGACCGTAGCGTTGGGGACATCGACGCCAACCTCAATGACCGTGGTGCACACCAGCACATCGACCT
+CACCGGCCCGGAAAGCCGCCATCGCAGCGTCCTTGTCGTCGGCCGACAACCGTCCATGCATGAGCGCCAA
+CCGCAACTCTGCGAGCTCGGCGGAACGCAACCGGGAGAACAGGCCTTCGGCAGTGGCCGATGGTCGGACG
+CCGCCTTGAACGTCGGTGTCGTCGGACTCATCGATGCGGGGCGCCACCACATAGGCCTGGCGGCCGGCGG
+CAGCCTCTTCGATGATGCGCCGCCAGGCGCGGTCGAGCCAGGCGGGCTTGTCCTTGACAAAGATGACGTT
+GGTGGCAATCGGCTGGCGCCCGAGCGGAAGTTCGCGCAGCGTAGAGGTTTCCAGGTCGCCATAGACGGTC
+AGCGCGACCGTGCGCGGTATCGGCGTCGCGGTCATCACCAGCAGGTGCGGGGTAATGCCGGCGGGGGCCT
+TGGCGCGCAACTGATCTCGCTGCTCGACACCAAACCGGTGTTGCTCGTCGACCACCACCATGCCCAGGTT
+GTGAAAGTCGACGGCCTCCTGCAGCAGCGCGTGCGTGCCGATGACGATGCCGACCTGACCGCTGGCGATT
+TCGGCGCGAACTTGCTTCTTCTGCCCTGCCGTCATCGAACCGGTGAGCAGTGCCACCCGGGTGGCGTTTT
+CGGCGCCTCCCAGTTGGCCGCCCATGGCCAGCGGCCCTAGGACATCGCGGATCGATCGCAAGTGTTGTGC
+GGCAAGGACTTCCGTTGGCGCCAGCAGGGCACACTGGTAACCCGCGTCCACCATCTGCAGCATCGCCAAC
+ACCGCAACGATCGTTTTGCCCGAGCCCACTTCGCCTTGCAGCAGGCGATTCAGCGGGCGGTTCGCCGCGA
+GCCCGTCGGACAACACGTCGAGCACCTCACGCTGTCCCGCCGTCAGCTCAAAAGGCAACCGCCGCAGTAG
+CTCAGCGGCAAGACCGTTAGATTTCCAGGCCGCCGAGGGCCCGGATTCCGACAGTTCACCGTGCCGTCGG
+GCCACCAGCGCCCACTGCAGACCCACGGCCTCGTCGAAGGTCAGGCGTTCCCGGGCGCGCTCGCGTAACG
+ACTGGCTTTCGGCAAGGTGAATGGCGCGCAGTGCCTCGTCCTCGGGGATCAGGCCGTGCTTGGCGCGTAG
+TTCCGCGGGCAACGGATCATCGACCCGGTCGAGAACATCGAGCACCTGCCGCACGCATTTGAAGATGTCC
+CAGCTCTGCACTTTTGTGCTGGCCGGATAGATCGGGAAGAAACGACGCTCGAACTCCTCCACGACCAATT
+CACCGCTGATGGCCTTGGAGGCATCAGCGATACTTTTGAGCGACCTGGTGCCGTGGTTCTTCCCGTCCGG
+CGAGTCGAGGATGAGAAACGCCGGATGCGTGAGCTGCATCGCGCCCTTGTAGTAGCCGACTTCCCCGGAG
+AGCATCACCTTCGTGTGCTTGGTGAGGTCCCGCATGATGTAGTCCGCGTTGAAGAACGTGGCCGTCACCT
+TGTTGCGGCCGCCGCCGACGGTGATGCGCAGACATTTCCGATTCGGCTTCTTTTTCATCGGAAACGAATA
+CGTATCGGTGATCACGTCGACGATGGTGATGTGCTCGCCAGCTTCCGGTCGCGCGTCACCGATACCCACC
+CGCGCCGCGCCCTCGACGTAGCTGCGCGGGTAGTGGCGGAGCAGGTCGTCGACGGTCCGCATGCCGAACT
+GCTCGTCGAGGGCATCGGCTGCCGTGGCGCCGAGGACGCGATCGAGCCGATCGCTTAACGACGCCACCGC
+TACTCGACCCCGATCAGCAGCGCGTCGCCGCGGTGTCCGGTGCGGTAGGAGACCAGCTCGGTGCCTGGAT
+GGTGGTCGTGCACATGCCGTTCCAGGACGACAGCCACGTCTTCGGTTACGCCGGCGCCAATTAGCACCGT
+CACCAGATCGCCTCCCGATGCCAACAACAGGTCGACCAGACCGATGGCCGCCGCGGCGACATCGTCGGCG
+ACGATCAGCACCTCGTCGCCCGCGATACCCAGACCGTCGCCCGGCTTGCAGGTACCGGCCCAGGTCAGCG
+CCTTTTGGGTGGCAATGCGCACCGATCCGTGCCGGGAAGCACCGGCGGCACGGGCCATGCTGTAGCCGTC
+GTCGACGGCCTGGCGGGCCGCGTCATGCACGGCCAGCGCGGCCAACCCCTGCACCATCGATCCGGTCGGC
+ACGGGTACCACGTCGACGCCCCAGCCGATCGCCGCGGTACACCCGGCCACCAGTTCTTCGGCGGCCACAT
+AGCCATTGGGCAGCACCATCACGTGCGCGGCGCCGGTGTCTACCACGGCCCGCACCAGCTGGTGGGCACT
+GATATCGGCGGCCGGTGTCACGGCGTCTGGACCCGGTCGCAGCACGCAGGCGCCCTCCCCGGCGAACAGC
+TCGGCGGCACCGTCGCCGTCGACGACCGCCAGCACGGCGCGGCCCCGCGTCCAGCCACCGGCCGGCAATC
+CGCTGGTCCCGGAACCGAGCGCCGAGATCACGATCCGGCTAACTCGCCCCACCGCCAATCCGGCTTCCAC
+GGCGGCACCGGCGTCGTCGGTGTGGACGTGTACGGAGTAGCTGTCGGGCGGAGCAGCGGCGATGGCCACC
+GACTCACCCAATTCCTTGAGTCGATCCCGCAACTGGTCCGCCGCTGCAGCATCACATACCGCCAACAGAT
+ACATCACCTCGAATTGCGGGGCGGGGCGTTGGGTAGCCGTGTCGGTCGGCAACGCGCGCGGCGAGGGTTC
+GTAGACCGCCCGGGCAGGTGCCTGCCCGCAGATGGTGGAGCGCAACGCGTCCAGCAGAACCAGCAGGCCC
+CGTCCGCCGGCGTCCACCGCGCCCGCATCGGCGAGCACGTCAAGCTGTTCGGGGGTCTTTTCCAGCGCGA
+TGACCGCCGCGTCACCGGCGGCGGTGACCGCACCGGCCAACCCCTCGTGCGCGCACTGGTCGACGGCTCC
+GGCGGCGGCCCGCAGCACCGAGACGATAGTTCCCGGCACCTCCACGCCACCCATCGACGCGACGACCAAC
+TCGACGCCGCGCCACAACGCGGCCCCGAGGGCGTTGGCGTCGACCGCCCGCAATACCGCGCCAGAGGCGG
+CGGCCGCAGTCGCGGTCACCTCTGCGATCCCGCGCAGGATCTGGGACAGGATCACGCCGGAGTTGCCGCG
+AGCTCCGTTCAACGCGCCGGCCGCGAGAGCGGCCGCAACCCGCGCCACGTCTTCGGCGTCAGCCTGCGAA
+TTCGCGTGCAAATCAGCTTCTACGACCGCGGCACGCATGGTGAACAGCATGTTGACGCCGGTATCGGAGT
+CAGCGACCGGGAACACATTGAGCCGGTTGATCTCGTCGATGTGGAGGATCAGATCGCTGACGACGGCGTG
+TGCCCAGTCCCGCAAGGCCGAGGCGTCCAACGGCCGATCCGCCGTCCCCACTACAACACACCTCCTCCGC
+AACACACCTCCTCCGCGCCAGCCCGCGCCCCGAGCCTAACCAGACGTGGTGACAGCACGGTCACGACGCC
+GCTCTCCCGGCCAAGGCGGGTGCTGACATGTCCGCGAAGGGCTGATCGTTTTGGCGCTACCGCACAACAA
+TGGCTATCCTGTGCTAGCCGCGGGCTACACGTAGGCGTCCCGGCCAGGTCGCCGGACCTAAGAGATTTGA
+GGAGCTTGACGAATGGCCGCTGTGTGCGATATCTGCGGGAAAGGCCCCGGCTTCGGCAAGTCGGTGTCGC
+ACTCCCACCGCCGCACCAGCCGCCGGTGGGATCCGAACATCCAGACTGTGCACGCCGTGACCCGTCCCGG
+CGGCAACAAGAAGCGACTCAACGTTTGCACATCCTGCATCAAGGCGGGCAAGATCACCCGCGGCTGACGC
+CCGGTAACACCTGCACGACTCAGGGCAACCGCCAATCGATCGGCTCGGCACCCATCCCGACGAGCAGTTC
+GTTGGCGCGGCTGAACGGACGCGAGCCGAAGAACCCGCGCGATGCCGATAGCGGTGAAGGATGCGGCGAC
+TCGATCGCAACGCAGTTGCCCGCGGCCAGCATCGGCTTCAGAGTCGACGCGTCACGACCCCACAGGATCG
+CCACCAGCGGCGCTGCGCGCGCCGCCAGGGCGCGAATCGCGCATTCCGTGACCGCTTCCCAGCCCTTGCC
+CCGGTGCGACGCCGGGTTGCTGGGTCGCACCGTCAGCACCCTGTTCAACAGCAACACACCGCGTTGCGCC
+CAGGGCGTCAGATCGCCGTTCGAGGGCAGCGGATAGCCCAAATCCGCGGTGTACTCGTCGAAGATGTTGG
+CCAGACTGCGCGGCCACGGACGTACATCAGGGGCCACCGAGAAGCTAAGACCCACAGCATGTCCTGGAGT
+CGGATAAGGGTCTTGGCCAACGATAAGGACACGGACGTTGTCGAACGGGAAAGTGAAGGCGCGCAACACA
+TTCGATCCGGCGGGCAGGTATCTGCGCCCGGCCGCGATCTCGGCCCGCAAGAACTGCCCCATGTGGGCCA
+CCTGGTCGGCCACCGGCTCGAGCGCGGCGGCCCACCCCCGCTCGACGAGCTCACTCAACGGCCGTGCGGT
+CACTGCATCCCTTTCGCGTACAGACGGTCACCGCGTCACCCTAGCGAACCTTGATTGTCTGGCTCCCCAA
+ACGATTGCCAGCCCGCGTATCCAGTCCACTCCTCGCCGTCGACCAGCACCCTAGCCGGCCCGTCGAGAAC
+CCGGCCAATGGTGCGCCACCCGGCCGGCACCGGACCGACGAAACAGGCGACCAGGGCATGATCTTCACCC
+CCGCTTAGCACCCACGGCCAGGGGTCGGTGCCCAGAGCGGTTGCGGCCGCAGTCAAAGCGTCGCGGTCAG
+CGGCCAACGCCGCGGCGGACAGGTCGATGCGCACGCCGGATGCCTCGGCGATGTGCCGCAGATCGGCGAG
+CAGCCCGTCGGAGACATCGATCATCGCTTGAGCCCCGACAGCCGCGGCCGCCGCGCCGTGGCCGTAGGGC
+GGCTGCGGCACCAAATGGCGGCGGCGCAGTTCGGCGAAGTCTTCAATCCCGTTGCACCACAGCGCATAGC
+CAGCAGCCGAGCGGCCCAGCTCACCGACGACGGCCAGCACCGAGCCGGCCTTCGCCCCGGAGCGCAGCAC
+CGGGGCACGACCGTCAAGGTCACCAATCGCGGTGACCGACACCACCCACTGCCGGCAGCTGACCAGATCG
+CCGCCGACGATGCCGGCACCAATGCGCCCCGCCTCCTCCCACATTCCGTCGACCAACGCGCTCGCCTGCG
+CCGCCGGCGTCTCAGCGGGTGCTCCAAAGCCGACCACGAACGCGGTGGCCCGCGCCCCCATCGCCTCGAT
+GTCGGCGGCATTCTGGGCGATCGCCTTGCGGCCGACGTCCTGCGGTGTCGACCAGTCCAGCCGGAAGTGA
+CTATCTTGCACCAGCATGTCCGTCGACACCACAGTGCGACCATCGCCGGCAGACACCAGCGCGGCATCGT
+CGCCGGGCCCGAGCAGTACCGTGGCGGGTTGTCGGCGCCCCCGCACCAGCCGGTCGATCACGGCGAACTC
+GCCGAGCTGCTGCAGCGTCGGGGACTCCGTTGCAAGTGAGTGATCTTTAGTGGTCACGCGACTTGCACCC
+CGTCTCGGGGTTGTTCGGCAGCCTTGGGGCTGCTTCCCTTCCGCGCTTCACAGCCACCTGCCGGGCGAGG
+CCCGGTCTTACGGTCGGCTCCACGCTTGACGGCGGCCCCAACTGGGCCGACGATGCTGGATGTTTCCTCG
+TAGCGTGCGAGGTTGATGGCAGCGCAGTCATCACGCTGATGGACCACTGAGCATCGGTCGCATTGCCATT
+GTTCGTCCCAGCCGATGTCTTGCACATGCCGGCAGGCGTGGCAGGTTTTCGACGACGGGAACCAGCGGTC
+GGCGACCACCAGCGCCGACCCGTACCAGACTGTCTTGTAGGACAAGTGCCGACGCGGAGTGCCCAGGGCC
+GCATCCGACAGTCCGCGCCGACGAGCGCGGGCACCCGGCAACCCTTTTTGCCGCAACATCTCTGTCGCGT
+CCAAGCCTTCGACAACAATGCGGCCGTGGGTTTGAGCCAACCGTGTCGTCAGGACGTGCAGGTGATGGGT
+GCGGACATCGTTGACCCGGCGATGCAACCGGGAAATCTGAGTGGTGCGCTCACGGTAGCGCCGTGAACCT
+TTCGTGCAACGCGAACGGGCCCGGCACACGTGGCGTAGCTCGCGCAGCGCGGCGCCGAGCGGTCGTGGGT
+TCTCAACCTGCTCGATCGCCGTGCCGTCAGCGGTGGCGACCGTCGCCAGGCGCCGGACCCCGACATCGAC
+ACCAACCCGCGAACCGGGGTGCACCACCTTCGGCTGCTGCGGACGCTGGACAAGCACCCGCACACTGGCA
+TCCAGACGAGTGCCGTTGCGGCGCACCGAGATCGCCAATACTCGCGCCCGACCGGCCTTGATCAGGCGTT
+CGATACGGCGGGTGTTCTCGTGCGTGCGGACGGTCCCGATGACCGGCAGGGTGAGGTGACGGCGGTCGGG
+TTCCACACGCATCGCTCCGGTCGTGAACGACACTCGATCCTGGTCGCGGCCTTTGCGTTTGAAACGGGGA
+AACCCGACCCGTTTACCGGCGCGTTTGCCGGCGCGGGAGGTCTGCCAGTTCCAGTACGCCTCGACCGCAC
+CCGCGATGCCATCGGCGTAGGCCTCTTTTGAGCATTCAGGCCACCACGCGACACCGGTCTCGGTGTTGAC
+GCACACGTCGTCCTTGACGGTGTTCCAGCGTTTGCGCAGCACGCGCAGCGACGGTTTCGCTGTCACGGTC
+CCGCTGGCATGCCACGCCTGGATGTCGGCTTTCAGGGTGGCCACGGTCCAGTTGTATGCCTTGCGACGAG
+CACCGAAATGCCGTGCCAGCGCCTTGGCCTGGTCCTCGGTCGGGTCCAGCGTGAACCGAAACGCTTGGAC
+CGTCCAGCCATCGGGAACCTCGAACTTGGGCATCAGGCGGCCTCATGGTCCTCGCCAGCAGCGGCCGCCA
+ATGCGCGCTTGGTTCGATTCTCGGCAGCCCGTTTGCCATACAGACGGGCGCACATCGACGTCAGGATCTC
+GGTCATATCCCGCACCAGGTCGTCACCGACCTCGGCAGAGTCGACTACCACCAGTTCGCGGCCCTGCGCC
+GCAAACGCTGCCTGCACGTACTTCGAGCCCAACCGGCAGAACCGATCCCGGTGCTCCACCACGATCCGGT
+GGACTGACGGGTCGCGCAGCAGTGAAAGGAACTTACGGCGGTGCTCGTTGAACGCGGAACCGACCTCGGT
+CACGACCTTGTCGACTGGCATCTGTTGGGCCGCGGCCCACGCGGTCACCCGCGCGACCTGCCGATCCAGA
+TCGGCTTTCTGATCGGCCGACGACACCCGTGCATACACCGCGGTCGGTGATCGCATGCCAGCGTCCCCAG
+CCGGTTCGTCGACGAGAATCAGTCGGCCCACTCGCCTCGCCATCACCGACAACAGACCAGCACGAAACCA
+GCGGTAGGCGGTCCCCCGAGCAACACCGTTGCGCTCCGCCCACGTCGCCAGGTTCATATCTCTGTTCCTA
+CCGCACGCCACTGACAACTACCGACCACTCAACCCGCAACAGCTGGCACCCCCCGATGCGTCGTCGCCCA
+CGCCGCCTCCTTCGGCCCGTTCTGGCCCTGTGGACCTTCGAACACCTCGCCCGACCTGCGGTAAGTTGAG
+TCACTGCCGGCGCGAGCGGACCGCGCCAGTGTATGAGAGCAAAGAGGTGGCCGCGCAGGTGACAGGCGAG
+TCCGACGGGCCGCCGCGCGCCGTGCTGATCGCCGCGGCGGCGCTGGCGGCGGCGGTGATCGGGGTAATCC
+TGGTTGTCGCGGCGAACCGCCAGCCGCCGGAGCGACCGGTTGTCATTCCGGCCGTGCCCGCTCCGCAGGC
+CACCGGTCCCGGCTGCAAAGCACTGCTGGCGGCGCTGCCTCAACGACTCGGCGAGTATCGGCGCGCGCCC
+GTCGCGGAGCCGACCACTGCGGGTGCCACGGCCTGGCGAACGGGGCCAAACAGCACACCGGTGATTTTGC
+GCTGTGGACTCGACCGCCCGGCCGAGTTCGTGGTGGGTTCGGCCATCCAAGTCGTCGATCGGGTGCAGTG
+GTTTCAGGTGGCCGCGCAAAACCCGGACGAGCCAGGCCGGTCCACCTGGTACACCGTGGACCGGCCGGTG
+TATGTGGCGCTGACACTCCCCTCGGGATCGGGGCCCACCGCGATCCAGGAATTGTCAGACGTTATCGACC
+ACACCATCCCCGCGGTACCCATCGACCCGGCGCCGGCTCGCTAGTGCCGATCGCAAGCGCGGCGCTTGCG
+CCGGGCGCGGCGGGTCGGCACCATCGGGCTAAGTGCCGATCGCAAGCGCGGCGCTTGCGCCGGGCGCGGC
+GGGTCGGCACCATCGGGCTAAGTGCCGATCGCAAGCGCGGCGCTAGCGCCGGGCGCGGCGGGTCGGCACC
+ATCGGGCTAGTGCAGGCCCACGCCGCGGGCCAATGCCGTCTCGATCATCGTCGCCAGCAGGGTCGGATAG
+TCGACACCGCTGGCCGCCCACATCCGCGGGTACATCGAGATCGTGGTGAATCCCGGCATCGTGTTGATCT
+CGTTGATCACCGGACCGTCGTCGGTGAGGAAGAAGTCCACCCTGGCCAGACCCCGGCAGTCGATAGCCGC
+GAACGCCCGGATCGCCAGCTGACGAATCGCCTCTGCGACCTGGTCATCGACCTTGGCGGGCACGTCCAAT
+TCGGCTGCGTCGTCGAGATACTTGGTTGCGAAGTCGTAGAAAGAGTCCTCGCGTCCCCGCACCCCGGCCA
+CCCGGATCTCCCCCAGCGTGCTGGCTTCCAGTGTGCCGTCCGGCATTTCGAGCACACCGCATTCCAGCTC
+GCGGCCGCTGATCGCGGCCTCGACGATGACCTTAGGGTCATGCCGGCGGGCCCGCGCGACCGCGGCGGGC
+AGTTGATCCCAACTCGACACCCGGCTAACACCGATCGACGAGCCGCCTCGGGCGGGTTTGACGAACACCG
+GTAAGCCCAGCCGTTCGCACTCCTGGCGGTGCAGTGTCGACCGCGGCGGACGCAGCACCGCGTACGCACC
+CACCGGAAGTCCATCGGCGGCGAGCAGCTTCTTGGTGAACTCCTTGTCCATGCCGACGGCACTGGCCAGC
+ACACCGGCGCCCACGTAGGGCACCCCGGCGAGTTCGAGCAGTCCCTGGATCGTGCCGTCCTCGCCGTACG
+GGCCGTGCAGTACCGGGAACACCACGTCGACCGACTCCAGAACCTCGCCGGCCCCGGGCGGCAGCGACAC
+CAACTGGCCACCACGCCGCGGATCGGCCGGCAGCGCCAGCTCGGTGCCCGATCCTGATTTGACCTGAGGA
+AGCTCCCGGTTGGTGATCGTCAGGGCGTCGGGGTTGGCGTCGGTGAGCACCCACGAACCTGCCGGGGTGA
+TACCCACCGCGATCACGTCGAACCGCCGCGAGTCCAGGTTGCGCAGGATGCTGCCGGCGGACACACACGA
+GATGGCGTGCTCGTTGCTGCGCCCGCCGAACACGACGGCAACGCGGACACGCCGATCGTTAGCACTCACA
+ACCTGCAGAGGCTACCGGGTCAGGCAGACGGGCTCCCACGAGCTGCAGTTTTCGGTCGTGCCGGCCCGTG
+CGAGGCTCATTCGGGCTTGGTGCGGCGACCCAGCAGCAGCGTTATCGCCTCGTCCACCGACAGCCCTTTA
+TGACAGACCCGATGCACCGCGTCGGTGAGTGGCATTTCGACGTCGTAGCTGGACGCCAGCGCGAGCACGG
+ATTCGCACGACGTCACGCCTTCGACGACATGACAAGCCTTGCCCGCCGACTGCAACGTTTCGCCCCGGCC
+CAGGCGTTCGCCAAACGATCGGTTGCGCGAACGCGGTGAGGTGCAGGTGGCCACCAGATCACCGACCCCT
+GCCAGACCGGCCAACGTCGCGCCGTTGGCGCCGAGCGCCGTCCCGAGCCGGATGATCTCCGCCAGGCCCC
+GGGTGATGATCGCGGCCGCGGTGTTTTCGCCCAGCCCGATGCCCACCGCCATTCCGCACGCAAGCGCGAT
+GATGTTCTTGCACGCCCCGCCGATCTCGGTGCCGACGACATCGGCGTTGGTGTAGGGGCGGAAGTACCCG
+CTGTTCAGCGCGCGCTGCAAGGCAACCGCGCGGCCGGAGTCGCTGCACGCGACGACGGTAGCGGCGGGCT
+GGCATTCGGCGATCTCGCTGGCCAGGTTGGGTCCAGAGATCACCGCGACCTGCGCCGGCTCGGCACCGGT
+CACCGAGATGATGACCTGGCTCATCCGCATCAGGGTGCCCAACTCGATGCCCTTGGCCAGACTGACCAAG
+GTCGCACCCTCGGGCAACAGGGGAGCCCACCGCTCGAGATTGGCCCGCATGGTCTGCGCGGGCACTCCCA
+ACAGCACCGTGGATGCGCCCCCAAGTGCCTCCTCGGCATCTGCGGTGGCATGAATGCTCGGTGGTAACAG
+CGCACCGGGCAGATAGTCGGGGTTATATCGGGTGGTATTGATCTGATCGGCCACCTCAGCTCGCCGCGCC
+CACAGCGTGACCTCTCCGCCCGCGTCGGCCAGCACCTTAGCCAGGGCCGTGCCCCATGCACCGGCGCCCA
+TCACCGCGACGGTGCTTGCTATTCCGGCCATCCACACACACTAATCTGCGCCGCGGTTGCCGTCGGGACC
+GTGCCTGGGCCCCGGCCACGACCGTGGCGGCAATGCCGTCGAAGTGTGCCGCGTGGATCGACGCTGGCAG
+GATGACTTCATGAGCGGCACACCGGACGACGGCGATATCGGCTTGATCATCGCCGTCAAGCGCTTGGCCG
+CGGCCAAAACCAGGCTGGCCCCGGTGTTCTCGGCGCAGACTCGCGAGAACGTGGTGCTGGCCATGCTCGT
+CGACACGTTGACCGCCGCGGCGGGTGTCGGTTCACTGCGCTCGATCACTGTTATCACCCCCGACGAAGCC
+GCGGCGGCTGCGGCGGCCGGGCTGGGCGCCGATGTACTGGCCGACCCGACACCCGAAGACGATCCCGACC
+CACTGAACACCGCCATCACCGCTGCCGAACGCGTGGTTGCCGAAGGGGCCTCCAACATCGTTGTGCTGCA
+AGGCGATTTGCCGGCATTACAGACACAGGAACTCGCCGAGGCAATCTCGGCCGCACGCCACCATCGGCGC
+AGCTTCGTCGCCGACCGGCTTGGGACCGGCACCGCGGTACTGTGTGCGTTCGGCACCGCGCTGCACCCGC
+GGTTCGGGCCGGATTCGTCCGCGCGGCACCGCCGTTCGGGCGCTGTCGAGCTGACAGGAGCCTGGCCGGG
+CCTGCGCTGCGATGTCGACACCCCCGCCGACCTGACGGCCGCACGCCAGCTCGGGGTAGGGCCCGCGACC
+GCGCGAGCGGTCGCACATCGTTGACCGGGACGGGGCAACGCCGGCGAGGCATCCAGGGGGTGAACGGCAG
+ACCAACGGCGAACGGATGCCTGCCGAGTGCTGGCAACCCCACCCAATGATGAGCAATGATCGCAAGGTGA
+CCGAAATCGAAAACAGTCCCGTCACAGAGGTGCGGCCAGAGGAGCATGCGTGGTATCCAGACGACTCGGC
+GCTGGCGGCACCGCCCGCTGCCACCCCCGCCGCGATTAGCGACCAGCTACCCTCGGATCGCTACCTGAAC
+CGGGAGCTGAGTTGGCTGGACTTCAACGCGCGCGTGCTTGCCCTGGCCGCCGATAAGTCGATGCCATTGC
+TCGAGCGCGCCAAGTTTCTGGCAATCTTCGCGTCCAATCTCGACGAGTTCTACATGGTCCGGGTGGCCGG
+CCTCAAACGCCGCGACGAGATGGGGTTGTCGGTGCGCTCCGCCGACGGTCTAACACCGCGCGAACAACTA
+GGCCGGATCGGCGAGCAGACTCAACAGCTCGCCAGCCGGCATGCCCGGGTGTTCCTCGATTCGGTGCTAC
+CCGCGCTCGGCGAGGAAGGCATCTACATCGTCACCTGGGCCGATTTGGATCAGGCTGAGCGCGACCGATT
+GTCGACCTATTTCAACGAACAGGTCTTCCCCGTCCTGACCCCGCTGGCCGTCGATCCCGCCCACCCGTTC
+CCGTTTGTCAGCGGGTTGAGCTTGAACCTGGCGGTCACGGTACGCCAACCTGAAGACGGCACCCAGCATT
+TCGCGAGGGTCAAGGTGCCCGACAACGTCGACCGCTTCGTCGAACTCGCTGCACGTGAGGCCAGCGAGGA
+AGCTGCGGGGACCGAAGGCCGGACCGCGCTGCGGTTCCTGCCGATGGAGGAGCTGATCGCGGCCTTCCTT
+CCGGTGCTTTTCCCGGGTATGGAAATCGTCGAGCACCACGCATTTCGCATCACTCGCAACGCTGACTTCG
+AGGTTGAAGAGGATCGCGACGAGGACCTACTGCAGGCGCTCGAGCGAGAACTGGCCCGCCGCCGGTTCGG
+TTCACCGGTGCGACTCGAGATCGCAGACGACATGACCGAGAGCATGCTGGAGTTGCTGCTTCGCGAACTC
+GACGTGCATCCCGGTGATGTCATCGAAGTGCCCGGGCTGCTCGACCTATCGTCGTTGTGGCAGATCTACG
+CCGTGGACCGCCCGACGCTTAAGGATCGGACATTCGTCCCAGCTACCCATCCCGCCTTCGCCGAGCGGGA
+AACACCCAAAAGCATCTTCGCGACGCTGCGCGAAGGCGATGTGCTGGTTCACCATCCGTATGACTCGTTC
+TCCACCAGCGTGCAGCGATTCATCGAACAGGCCGCGGCCGACCCCAACGTGCTGGCGATCAAACAGACGC
+TGTACCGCACCTCCGGCGACTCGCCGATCGTCCGGGCGCTGATCGACGCCGCCGAAGCCGGAAAGCAAGT
+GGTGGCACTGGTCGAGATCAAGGCACGCTTCGACGAACAGGCCAACATCGCCTGGGCGCGCGCACTAGAA
+CAAGCCGGCGTGCATGTGGCGTACGGGCTCGTCGGGCTCAAGACGCACTGCAAGACCGCCTTGGTGGTGC
+GCCGCGAAGGTCCGACAATCCGGCGGTACTGCCATGTCGGCACCGGCAATTACAACAGCAAGACAGCACG
+ACTCTACGAGGACGTCGGACTGCTGACCGCTGCACCCGATATCGGCGCCGACTTGACCGACTTGTTCAAT
+TCGCTCACCGGCTACTCACGCAAGTTGTCCTACCGCAACTTGTTGGTGGCCCCGCACGGAATCCGCGCCG
+GCATCATTGACCGCGTCGAGCGGGAGGTCGCGGCGCACCGTGCAGAGGGTGCCCACAACGGCAAAGGCCG
+CATCCGACTCAAGATGAATGCCCTTGTTGATGAGCAGGTCATCGATGCGCTGTACCGCGCGTCGCGAGCC
+GGTGTGCGGATCGAGGTGGTGGTACGCGGCATCTGCGCGCTGCGTCCAGGTGCGCAGGGCATTTCGGAAA
+ACATCATCGTGCGCTCGATTCTCGGCCGCTTCCTCGAGCACTCGCGGATCCTCCATTTCCGTGCCATCGA
+CGAGTTCTGGATCGGCAGCGCCGACATGATGCACCGCAACCTCGACCGGCGAGTCGAGGTTATGGCTCAA
+GTCAAAAACCCGAGGCTGACCGCGCAGCTGGACGAATTGTTCGAATCCGCACTGGACCCGTGCACCCGGT
+GCTGGGAGCTCGGGCCCGACGGGCAGTGGACCGCGTCGCCGCAAGAAGGCCATAGCGTGCGCGACCATCA
+GGAATCGCTGATGGAACGGCACCGCAGCCCCTGACACTGCGTGGTGATTCCCGCTGCTGCACCGACCACA
+TCCACGACCGCGAGCAGCCTGGCCGAATTGACCTGCAGGAGTTGAGGTGTCGATCCAGAACTCGTCCGCC
+CGCCGGCGCTCGGCGGGCCGGATTGTGTACGCCGCCGGTGCGGTGCTCTGGCGACCCGGCAGTGCCGATT
+CGGAAGGGCCGGTCGAGATCGCTGTCATTCACCGCCCCCGTTACGACGACTGGTCGCTGCCCAAGGGCAA
+AGTGGATCCGGGCGAGACCGCACCGGTGGGGGCGGTGCGGGAGATACTCGAGGAGACCGGTCACCGCGCC
+AACCTGGGTAGGCGGCTCCTGACGGTGACCTACCCGACCGACTCCCCTTTTCGAGGCGTCAAGAAGGTGC
+ACTACTGGGCAGCGCGCAGCACCGGTGGGGAATTCACCCCCGGCAGTGAGGTCGACGAGCTGATCTGGTT
+ACCGGTTCCCGACGCGATGAACAAGCTTGACTACGCCCAGGATCGAAAAGTCCTGTGCCGGTTCGCTAAA
+CACCCGGCGGACACTCAGACGGTGCTGGTGGTGCGGCATGGCACCGCGGGCAGCAAAGCGCACTTCTCCG
+GGGACGACAGCAAGCGACCGCTAGACAAGAGGGGTCGTGCGCAGGCAGAAGCGTTGGTACCACAGCTGCT
+GGCGTTCGGCGCCACCGATGTTTATGCCGCCGACCGGGTGCGCTGCCACCAGACGATGGAGCCACTCGCC
+GCGGAACTGAACGTGACCATACACAACGAGCCCACCCTGACCGAAGAGTCCTACGCCAACAACCCCAAAC
+GCGGCCGACACCGAGTGCTGCAGATCGTCGAGCAAGTAGGCACACCCGTGATCTGCACGCAGGGCAAGGT
+CATTCCCGATCTGATCACGTGGTGGTGCGAGCGCGACGGTGTGCACCCCGACAAGTCCCGCAATCGCAAA
+GGCAGCACGTGGGTGTTGTCGTTGTCAGCCGGCAGGCTTGTGACAGCCGACCACATCGGCGGTGCGCTGG
+CCGCCAACGTGCGGGCCTAACACACGGATACCCTTCGTCACATTGCCACCGTGCAAAGGGTATCCGTGTG
+TCTTGACCTATTTGCGACCCCGCCGAGCGGTTGCCTTCTTGGCGGGAGCCTTGGTAGCCGGCCGCTTGGC
+CGCTGCCTTCTTTGCCGGCGCCTTGGTCGCCGCCTTACGCACCGATGCCTTGACCGCGGTCTTCTTCACC
+GCCTTGGTCACCTTCTTGGCGGGTGACTTCGTGGCCTTGACAGCTTTCTTGGCGGGCGCCTTGGTCGCCG
+CTTTCTTGGCGGGCGCCTTGGTCGCCGCCTTCCTGGCGGGCGCCTTGGTCGCCGCCTTCTTGGCGGCCTT
+TGTCGCCTTCTTGGCAGGTGCCTTCTTCGCTACCTTCTTGGCTGCACTGGCCCCCACACCACGCTTAACA
+GCGGGTCCTTCTGCCGGGAGACGCTGCGCGCCAGACACAACCGCTTTGAATTGCGCGCCCGGGCGGAACG
+CCGGCACCGACGTCGGCTTCACCTTTACTGTCTCGCCGGTACGCGGATTGCGGGCCACTCGAGCCGCGCG
+GCGACGCTGTTCGAACACACCGAACCCGGTAATGGTGACGCTGTCGCCTTTGTGTACCGCACGCACAATC
+GTGTCAACGACATTCTCGACGGCGGCGGTCGCCTGCCGACGGTCCGAGCCCAATTTCTGTGTGAGCACGT
+CAATGAGCTCTGCTTTGTTCATCCCAACCCTCCGAAACCAGTGGTCCTCGTTTGGAACCGACTAGTGGAC
+ACGGTAAACCCTTACCCGGCTGATTTCCAAGAGCCACGCGCAATTTCACTGAGCCAACGACCGGTTTTTC
+GCAATCCGGTTGCCGCCCTTGACCGGTGGCGCGGCCCCAAAATGGCTCAGGTTCTGCCGGCGGGTCACGC
+TGAAATTTCGCCCGGTTCTACGCCTCAGGGGGCGGGTAGAGTGCGCGGTTTCCAGTACGCGCACGCACCC
+TCAAAGGCCTCGATCTCGTCGAGTTTCCGCAGCGTAAGGGCTATATCGTCGAGACCTTCAAGCAGCCGCC
+ACGCCGAGTGGTCGTCAATCTTGAACGGCAGCACCACTGTTGCTGCGGTGATAATTCGATCTTGAAGATT
+GGCAGTGATTTCCAGGCCCGGACTCTGCTCAATGAGCTTCCACAGGAGTTCCACATCGTCTTGGGCAACC
+TCGGCCGCCAGCAGCCCGGCCTTGCCCGCGTTGCCGCGGAAAATGTCACCAAATCGGGATGAGATAACCA
+CCCGGAATCCGTAGTCCATGAGCGCCCAGACCGCATGCTCTCGCGAGGATCCGGTGCCGAAATCGGGCCC
+GGCAACCAGGACCGAACCCCGGTCAAAGGGACTGAGGTTTAGCACGAATGCAGGATCCGACCGCCAACCC
+GCGAACAAGCCGTCCTCGAAACCGGTTCGGGTGACCCGCTTCAGAAAGACCGCGGGAATGATCTGATCGG
+TGTCGACATTGGACCGCCGCAACGGCACGCCAATACCAGAGTGGGTGTGAAAGGCTTCCATGCTGATCCC
+CTAGCTGTTCTCAGTTCAATTCAAATCGGCCGGGCTGGACAGTGTGCCGCGAACCGCGGTGGCGGCCGCC
+ACTGCTGGGGACACCAAATGTGTGCGGCCGCCCGCGCCCTGCCGCCCTTCGAAGTTGCGGTTGGACGTCG
+CGGCGCAGCGCTCCCCGGACGCCAGCTGATCGGGATTCATGCCCAGACACATCGAGCATCCCGCCTGCCG
+CCATTGCGCGCCCGCGTCGGTGAAGATCTCACCGAGCCCTTCGGCCTCGGCCTGCGCGCGTACCCGCATT
+GAGCCCGGAACGATCAGCATCCGCACGCCGTCGGCCACCTTGCGGCCACGCAGCACTTCGGCGACCACCC
+GCAGATCTTCAATGCGACCGTTGGTACACGACCCGACGAACACGGCGTCGACCGCGATTTCGCGCATCGC
+GGTTCCGGGTCGAAGGTCCATGTACGCCAATGCTTTCTCGGCGGCCTGCCGCTCGGCGTCGTCGGTCATC
+AGTTGCGGATCTGGCACCGCGGCCGCCAGCGGTACCCCTTGGCCTGGGTTGGTGCCCCAGGTGACAAACG
+GGCTCAACGACGCGGCGTCGAGATACACCTCGGTGTCGAAAACGGCGCCGACGTCGGTGCGAAGCCGTTG
+CCAGTAGACGAGTGCGGTGTCCCACTGGGCACCGGTGGGTGCGTGCGGACGACCACGCAAGAACGCGTAG
+GTGGTTTCGTCCGGAGCCACCATGCCCGCACGAGCGCCGGCTTCGATGCTCATGTTGCAGATCGTCATCC
+GGCCTTCCATGGACAGCGATTCGATGGCGCTGCCCCGGTATTCGATGACATGCCCCTGGCCGCCGCCGGT
+GCCGATCTTGGCGATCAACGCCAGGATGATGTCCTTGGCCGACACACCGTCGGGCAGCCGCCCATCGACG
+TTGACCGCCATGGTCTTGAACGGCCGCAGCGGCAGCGTCTGGGTGGCCAGCACGTGCTCGACCTCCGACG
+TACCGATGCCCATCGCCAACGCGCCGAATGCGCCGTGGGTTGAGGTGTGGCTATCGCCACAGACGATCGT
+CATTCCCGGCTGGGTGAGACCCAATTGCGGTCCGACGACGTGCACGATGCCCTGCTCGATATCGCCCATT
+GAATGCAGCCGGATTCCGAATTCGGCGCAGTTTCGGCGCAACGTCTCCACCTGGGTGCGTGACACCGGGT
+CGGCGATCGGCTGGTCGATGTCGACGGTGGGCACGTTGTGATCCTCGGTGGCGAGGGTGAGCTCGGGCCG
+CCGCACCCGGCGCCCGGCCAGGCGCAGGCCGTCGAACGCCTGCGGGCTGGTGACCTCATGCACCAGATGC
+AGATCGATGTAGATCAAGTCGGGCGCACAGCCCCCGCCTGATACCACAATGTGGTCGTCCCAAATCTTCT
+CGGCCAGTGTGCGTGGCTCGCCGGTCTGCAAGGCCATCTCGAAGTGCCTCTATTCATTCGTTCGCGACTC
+GCTGGTCATCTCAAAATACGAGACGCTATGATCTCTTTGTGAGACAGCATAGCGGTATCGGTGTCCTCGA
+CAAAGCCGTTGGCGTGCTGCACGCGGTCGCGGAATCTCCCTGCGGACTGGCCGAACTCTGCGATCGAACC
+GACCTGCCCAGGGCCACCGCATACCGGCTGGCGGCCGCGCTGGAGGTGCATCGCCTGCTGGGGCGCGGCC
+AGGATGGCCACTGGCGGCTCGGTCCGGCCATCACCGAACTCGCGACCCATGTCGACGATCCACTGCTGGT
+GGCGTGCGCGGCGGTACTGCCTCAGCTGCGCGACGCCACCGGCGAAAGCGTGCAGGTATATCGCCGCGAG
+GGAACGTCGCGGGTCTGCGTGGCCGCATTGGAACCAGCTGCGGGCCTTCGCGATACGGTCCCGGTCGGGG
+CACGGTTGCCGATGACCGCGGGCTCGGGCGCCAAAGTGTTGCTGGCCCACACCGACGCCGCCACCCAAGC
+GGCCGTATTGCCAAAGGCGGTGTTCAGCGCCCGAGCGCTGGCCGAGGTGTGCCGGCGCGGCTGGGCGCAA
+AGCGTGGCCGAACGCGAGCCTGGCGTGGCGAGCGTGTCGGCGCCGGTGCGCGACGGCCGGGGCGTCGTGA
+TCGCTGCCATCTCGGTGTCCGGCCCGATCGACCGGATGGGCCGCCGCCCGGGGGTCCGATGGGCCGCCGA
+CCTGCTGTCCGCGGCGGACGCGCTCACCCGACGGCTCTAGCCGCGTTGTGCTACATCGGTTCGACCGCGA
+TCACATAGTCATTGCCGTGCCACAGACCGTCTTGCCGCTCGTTGAGCTGCAATGCCCGAGCGCGCAGTTC
+TTCCACATAGGCACGCATTGCCATGCCAAGCCCGTTGGAGGAGAATCGCTCGATTCGGGCCAAGCACATG
+TTGAGTTGGCCGTTCACGTAGCGAGCTCGGTAGCGGATGGGGAAGCGGCGCTCTTCAAGAATGCGAAAGC
+CCGCAAGGCCCAGTCGCCCCAGCATCCAGTCCAGCGGGAACTCTCGGTACGGTCGTTCGCCGGCAAGCAA
+CAGGCAGGCGTCGCGCACGCGACCGATTTCCCAGATGATTTTGCCACTTTCGGTTTCCGGCTCGAATTGC
+ACGTAGGGCTCCAAGCCGACTAGGTAAAGACGACCATGATCGGCGAGATGCGGGCGCAACCGCTCGAACA
+CGCGGTCCTGCCAGTACGGGGCGAAGCCTTCGATGGCCCCGACCAGGTAGTCGACCAAGATGGTGTCGAA
+CGTCTCGCCGGCAAGAAGGCTGTCGTCTACCCAGTTGCCGACGAGCAGGCGGTCCTGCGGGCGCATGGCG
+CTACCCAACGCGGCGCGGGTCTTGTCCGCCAGGCTGCGGGCGGCCGTGACCGCCGTCCAGCGCTCGGTCG
+GCAAAGTCTGTATCCACTGAAGCGATTTCACACCGGTACCGGCATCCAAGACAGTGCCCCAGGGTCTTTC
+GCCGTGCACGCCTTCGATGTAGCGGAACAAGGATGAGATCCCGGCCCTCAGTATGTACGAGCGACCGTGG
+CGGGCGTGTAGGTCTTCGATGTGGCGGATCAGGGCTGCGATCTTGGGCATTTCGGCCCAGGTCACACACA
+TCGCAGACGTCCATGCGGCCGGTTCGGCCGAGCGCGGTATCGCGGCGCCGGCTTCAGACCCTGCCAACCG
+AGCGATCGTCGTGGGTGCTTCCTCGGAGTAACCACTGTGATGTCTTCCTCACGGCTGAAGCTGGCGGACT
+ACCGATGAACCGACCCACCGAAACTCTATAGCAAACGATATTCATTTTCAAACTAGGCACCGCGAGCGTC
+ACTGGGGTGGCGACGACGCGCTACCGGCGGAGCCTTGCTGACACACTGACGCCATGGGAACCAAACAGCG
+CGCCGACATCGTCATGTCCGAGGCTGAAATCGCCGACTTCGTCAACTCGAGCCGTACCGGAACGCTGGCC
+ACCATCGGACCCGACGGCCAGCCGCACTTGACGGCGATGTGGTATGCCGTGATCGACGGCGAAATCTGGC
+TGGAGACCAAGGCCAAGTCGCAGAAGGCCGTCAACCTCCGACGGGATCCGCGGGTGAGCTTCCTGCTTGA
+AGACGGCGACACCTACGACACGCTGCGCGGCGTGTCGTTCGAGGGCGTTACCGAGATCGTCGAGGAGCCC
+GAGGCGCTGCACCGCGTCGGGGTCAGCGTGTGGGAACGCTACACCGGCCCCTACACCGACGAGTGCAAAC
+CGATGGTCGACCAGATGATGAACAAGCGGGTCGGTGTGCGCATCGTGGCCCGTCGGACCCGCTCGTGGGA
+TCACCGCAAGCTGGGGCTGCCACACATGTCGGTGGGTGGCTCGACCGCCCCGTAGCTGCCCGGCGAGCAG
+ACGCAAAATCGCCCATTTCGAGACGAAATTGGGCGATTTTGCGTCTGCTCGGCAGTTGTAGCCCCGATGG
+GATTCGAACCCACGCTACCGCCGTGAGAGGGCGGCGTCCTAGGCCGCTAGACGACGGGGCCGGAACCGAT
+CCGAGCTGCCAGCATAGCTCACGCCTTGTGCTGGGGTACCAGGACTCGAACCTAGAATGGCTGAACCAGA
+ATCAGCTGTGTTGCCAATTACACCATACCCCATGGGCTGCCTAAAACCGCTGCCGCCAGCTGTTATGGGC
+CGACGTGCAGACTACCAAAGATTCGCCACACAAGGCTCACGCGTGCCCGACCAGCTGGCGCGCCGCGCGC
+AGCCGCTGCATGCTGCGGTCACGACCGAGCAGCTCCAGCGATTCAAACAACGGCGGGCTGACGGTCGTGC
+CGGTGGCGGCCACCCGGATGGGGCTGAACGCCTTGCGGGGTTTGAGCGCCAAACCTTCGATCAAGGCGTC
+CTTAAGGGCCGCCTCGATCAGGGGTGCCGTCCAGTCCGTCACACTTGTCAGCGCGGCCAGGGCCGCGTCG
+AGCACCGCGGCCCCGTCTGGGCCTAGCTCCTTGGCCGCGGCCTTGGGATCGATCACATACTGATCGTCGT
+TGAAGAACTTCAACAGCTCCCACGCGTCACCGAGCACCACGATGCGGGTCTGCACCAACTCGGCGGCGGC
+GGCGAATGCCGCCTCATCCAACGCGATGTGATGGCCGTGGGTATCCAGATGGTCGCGCAGCCTGACCGTG
+AAGTCGCCCACGTCGAGCATCCGGATGTGCTCGGCGTTCAGCGCGTCGGCCTTCTTCTGGTCGAACCGGG
+CCGGGCTGGAGTTGACGTCGGCAACGTCGAACGCGGCCACCATCTCGTCGAGACCGAACAGGTCGTGGTC
+GTCGGCTATGGACCAGCCGAGCAACGCGAGGTAGTTCAGCAGGCCTTCGGGGATGAACCCGCGGTCGCGG
+TGGGCAAACAGGTTCGACTGCGGATCGCGCTTCGAGAGCTTCTTGGTGCCCTCCCCCAAGACCGTTGGGA
+GGTGCGCGAATTTCGGAATCCGCTCAGCTACCCCGATCCTGATCAACGCCTGATGTAGCGCCAGCTGGCG
+CGGCGTCGACGGCAGCAGGTCCTCGCCACGCAACACATGGGTGATCTTCATCAGCGCGTCGTCGCACGGG
+TTGACCAAGGTGTATAACGGATCACCGCTGGCTCGGGTCAACGCGAAGTCGGGTACGGAGCCAGCCGCGA
+ACGTCACGGGCCCGCGCACCAGGTCATTCCAAGCGAGGTCGTCATCGGGCATCCGCAGCCGCACCACCGG
+CTGGCGGCCCTCCGCCAGGTACGCCGCACGCTGCGCGTCGGTCAAGTGACGATCGAAATTGTCGTAACCC
+AGCTTGGGATTGCGCCCGGCCGCGACATGACGGGCCTCCACTTCCTCGGGTGTGGAGAAAGCGTGGTAGG
+CCTCGCCCGCGGCGAGCAGTCGGGCGAGCACGTCACGGTAGATTTCGGCGCGCTGCGACTGCCGGTACGG
+CCCGTACGGCCCACCCACCTCGGGCCCCTCATCCCAATCCAGGCCAAGCCAGCGCAGCGCGTCCAGCAGC
+GCCAGATAGCTTTCCTCGCTGTCGCGTTGGGCGTCGGTGTCCTCGATGCGGAACACGAAGGTGCCACCGG
+TGTGCCGGGCGTAGGCCCAGTTGAACAGCGCGGTGCGGACCAGACCGACGTGCGGAGTTCCGGTGGGTGA
+AGGGCAGAATCGGACCCGGACTGTTTCCGTGGCGGTCACGGCTTTCCTTTGCGGACTACGGGATTGGTGA
+GGGTGCCGATTCCCTCGATGGTGATCGAGACGGTGTCGCCGTCCTCGATGGGACCGACTCCCGCGGGTGT
+GCCGGTGAGGATGAGATCACCTGGCAGCAAGGTCATTATCGCCGAGATCCATTCCACGATGGCGCCGATG
+TCATGGATCATCAGCGAGGTGCGGGCGTGCTGTTTGACGTCGCCGTTGACGACGGTGCGCAGCTCGAGAT
+CGGCCGGGTCAAAGGGAGCGAGGTCGGTGACGATCCACGGCCCGACCGGGCAGAAGGTGTCGTGCCCCTT
+GGCTCGCGTCCACTGACCGTCGGATTGCTGCTGATCGCGGGCCGACACGTCATTGCCGATGGTGTAGCCG
+AGGATATTGTCGACGGCCTGGGCGGCCGGGACATCCTTGCACGCCCGGCCGATCACGATCGCCAGCTCAC
+CCTCGAAGTGCACCGGTGATGCGTTGGCGGGCAATCGAATTGGCGTATTCGGACCGATGATCGCGGTGTT
+GGGCTTGAGGAATATCACCGGGTCTGCCGGCGGCCGGCCACCCATTTCGGCGATGTGATCGGCATAGTTC
+TTCCCGACACAGACCACCTTGCTCGCCAGTATCGGAGCCAGCAGGCGAACGTCGGCCAGCGGCCAGGAGC
+GTCCGGTGAAGGTCGGCGTACCGAACGGGTGCTCGGCGATCTCGCGGGCCGTCATCTCACTCGGCTCGCC
+CAGCTCGCCGTCGATGCTGGCAAAAGCGACACCGTCCGGGCTGGCGATTCGACCGATACGCATTTGGATG
+AGCTTAGCCGGGCCCTGCCGGGCGACGATTCGGGCCGGCACGGCCCGATGAGGAGCCCGGCAATCAGACC
+CTGCCGGGCGACGATTCGGGCCGGCACGGCCCGATGAGGAGCCCGGCAATCAGACCCTGCCGGGCGACGA
+TTCGGGCCGGCACGGCCCGATGAGGAGCCCGGCAATCAGACCCTGCCGGGCGCTGCGGGCCCTCACCATC
+GGGCCCCGTGCCGGGTGACTGTGCCAGCATGGGTGGATGTCGCGAGATCCGACTGGGGTGGGTGCGCGCT
+GGGCGATCATGATCGTCTCGCTGGGGGTGACCGCAAGCTCGTTTCTCTTCATCAACGGTGTCGCGTTCTT
+GATCCCCCGGCTGGAAAATGCGCGCGGAACCCCGCTATCTCACGCGGGTCTGTTGGCGTCGATGCCCAGC
+TGGGGCCTGGTGGTCACGATGTTCGCCTGGGGCTATCTGCTCGATCACGTCGGCGAACGGATGGTGATGG
+CCGTGGGCTCGGCGCTGACCGCCGCGGCCGCCTACGCCGCGGCATCGGTTCATTCGCTGCTGTGGATCGG
+TGTCTTCCTGTTTCTCGGCGGCATGGCCGCCGGTGGTTGCAACAGCGCCGGCGGGCGGCTGGTCTCGGGT
+TGGTTCCCGCCCCAGCAACGCGGTCTGGCCATGGGAATCCGCCAGACCGCACAACCTTTGGGCATCGCCT
+CCGGCGCGTTGGTGATACCCGAACTGGCCGAACGCGGGGTGCACGCAGGGCTGATGTTTCCCGCCGTCGT
+GTGCACGTTGGCCGCGGTGGCCAGCGTGCTCGGTATCGTCGACCCACCGCGAAAATCCCGCACGAAAGCC
+TCCGAACAGGAGCTGGCCAGCCCTTATCGGGGATCGTCGATCCTGTGGCGGATACACGCGGCGTCGGCGT
+TGCTGATGATGCCGCAGACGGTGACCGTGACGTTCATGTTGGTCTGGCTGATCAACCACCACGGCTGGTC
+GGTCGCGCAGGCCGGTGTCTTGGTGACCATATCGCAGCTGCTGGGGGCGCTGGGCCGGGTCGCGGTCGGC
+CGCTGGTCGGACCATGTCGGGTCACGCATGCGTCCCGTCCGCCTGATCGCCGCTGCCGCCGCGGCGACGT
+TGTTTCTGCTCGCGGCGGTCGATAACGAGGGCTCGAGATATGACGTGCTGCTCATGATCGCCATCTCGGT
+GATCGCCGTTCTGGACAACGGGCTAGAAGCCACCGCGATCACCGAGTACGCCGGACCGTACTGGAGTGGC
+CGGGCGCTGGGTATCCAGAACACTACGCAGCGGCTGATGGCGGCCGCCGGACCCCCACTGTTCGGTAGTT
+TGATCACCACGGCGGCCTACCCGACGGCATGGGCCTTATGCGGTGTGTTCCCGCTGGCCGCGGTGCCGCT
+GGTGCCGGTTCGGCTGCTCCCACCCGGCTTGGAGACTAGAGCGCGGCGGCAATCCGTTCGCCGACATCGC
+TGGTGGCAAGCCGTTCGCTGCCACGCGTGGCCAAATGGGCCTCGACGGCCCGGTCCACCCGGGCAGCCGC
+GTCGTGTTCGCCAAGGTGGGACAGCAATAACGCCACCGACATGATCGCCGCCGTCGGGTCGGCGATGCCC
+TGACCGGCGATGTCCGGCGCGCTGCCATGCACCGGCTCGAACATCGACGGGTTGGCCCGGGTCGCGTCGA
+TATTCCCACTGGCCGCCAAGCCGATACCGCCACATACCGCCGCGGCCAGATCGGTGATGATGTCGCCGAA
+CAGGTTGTCGGTGACGATCACGTCGAAGCGACCCGGGTCGGTGATCATGTGGATGGTGGCGGCGTCGACG
+TGCTGGTAGGCCACCTCGACGTCCGGGTAGCATTCGCCGACCTCGTCGACGGTCCGCAACCACAATCCCC
+CGGCGAGGGTCAACACGTTGGTTTTGTGCACCAATGTCAGATGCTTGCGACGCCGTCGAGCCCGCTCGAA
+CGCGTCGGCAACCACACGCCGCACACCGAACGCGGTGTTCACGCTGACTTCGGTGGCCACCTCGTTGGGC
+GTGCCGACGCGAATCGCCCCGCCGTTGCCGGTGTAGGGTCCCTCGGTGCCCTCGCGCACCACCACGAAGT
+CGATGCCGGGATTGCCGGACAGCGGGCTGGCCACCCCCGGATACAGCCGGGCCGGACGCAGGTTGATGTG
+GTGATCCAGCTCGAAGCGCAGTCGCAGCAACAGACCGCGCTCCAAGACGCCGCTTGGCACCGACGGGTCA
+CCGATCGCCCCGAGCAGGATCGCGTCGTGGTTGCGCAGCTCGGCCACCACCGAGTCCGGCAGCACCTCGC
+CGGTGGCATGAAAGCGCCGCGCACCCAGGTCATAGCTGGTTTTCTGGACGCCCGGCACAACCGCGTCGAG
+CACTTTGACCGCCTCGGCGGTTACCTCGGGCCCGATCCCGTCACCGGCAATGATCGCGAGTTTCATCGGC
+GTGGAAGGGCTCACGACAGATCGACAACCTCGAGCTTGTAGGCGTCCACCGCCGCCGCGATCGCCGTCCG
+CACGTCGTCGGGCACGTCTTGGTCCAGCCGCAGCAGAATCGTCGCGCCCGGGCCTTCGGCGTCTTCGGAG
+AGCTGCGCGGCCTGGATATTCACCCCGGCCGTCCCCAGCAACGTGCCGATCTTGCCCAGCGCTCCCGGCC
+GGTCGACGTAGTGGATGATCAGGTTGATCCCCTGGGCGCGCAGATCAAAGTGGCGGCCGTTGATCTGCAC
+GATCTTCTGCGACAGCTGTGGGCCATACAGCGTGCCCGAGACGGTCACCACCGAACCGTCCGCGCCGACC
+GCGCGAACGTCGACGACGCTGCGGTGGTTGGGGCTTTCCGAGGCCTTACAGATCTCGGCGGTGACGCCAC
+GTTCGGCGGCCAATGCCGGTGCGTTGACAAATGTCACCGCATCCTCGATCACCGCCGAGAACAGGCCGCG
+CAGCGCCGAAAGGCGCAGCACCTCAACCTCTTCGGCGGCCAGCTCACCGCGCACCTGCACCGACAACGAC
+ACCGGCAGTTCGTCGGACAACACACCCGCCAGCACGCCGAGCTTACGCACCAGATCCAGCCAGGGCGCCA
+CCTCCTCGTTGACCACTCCGCCGCCGACGTTGACCGCGTCGGGCACGAATTCCCCTGCCAGGGCCAGCCG
+CACGCTCTCGGCGACGTCGGTGCCCGCCCGGTCCTGCGCCTCCGCGGTGGACGCACCCAGATGCGGTGTG
+ACCACCACCTGTGCCAGCTCGAACAGCGGGCTGTCGGTGCACGGTTCGGTGGCGAACACGTCCAGACCGG
+CCGCCCGCACGTGGCCGCCGGTGATCGCGTCGGCCAGTGCCGCCTCGTCCACCAGGCCGCCGCGCGCGGC
+GTTGACGATGATGACGCCCGGCTTGGTCTTCGCCAGCGCCTCCTTGTCGATCAGTCCCGCCGTCTCCGGT
+GTTTTCGGTAGGTGCACCGAGATGAAATCGGCGCGGGCCAGCAGGTCGTCCAGGGACAGCAGTTCGATGC
+CCAGCTGCGCCGCACGGGCCGGCGAAACGTACGGGTCATAGGCGACGACGTAAGCGCCGAACGCAGCGAT
+CCGCTGGGCGACCAACTGCCCGATGCGGCCCAGACCCACCACGCCGACGGTTTTGCCGAAGATCTCGGTA
+CCGGAAAACGACGAACGCTTCCAGGTGTGCTCGCGCAGCGACGCGTCGGCCGCCGGAATCTGGCGTGAGG
+CGGCCAGCAGCAGCGCCAGCGCATGCTCCGCGGCGCTGTGGATGTTCGACGTCGGGGCGTTGACCACCAG
+CACGCCGCGGGCCGTCGCGGCGTCCACGTCGACGTTGTCCAGCCCGACGCCGGCGCGCGCGACGATCTTG
+AGCTTGGGGGCGGCGGCCAGCACCTCGGCGTCAACCGTGGTGGCCGATCGCACCAGCAGCGCGTCCGCTT
+CGGGCACCGCGGCCAGCAGCTTGTCTCGGTCCGGACCGTCAACCCAGCGCACCTCGACCTGATCTCCCAA
+GGCGGCAACCGTTGATGGGGCAAGTTTGTCGGCGATCAACACAACAGGCAGGCTCACGCCGATAGCGTAT
+CGGCTGTAATTGACGAGTGGACGTCACCGTCGTCGGCAGCGGACCCAACGGGCTCGCCACGGCCGTCATC
+TGCGCCCGCGCGGGCCTGAACGTGCAGGTCGTCGAGGCCCAGGCGACCTTCGGCGGCGGCGCCCGCAGCG
+CGGCCGACTTCGAATTTCCCGAAGTTTTACACGACGTGTGCTCCGCGGTGCATCCGCTTGCTTTGGCGTC
+GCCGTTTTTCGCCGAATTCGACCTACCCGCGCGCGGAGTGACGCTGACCGTGCCCGACATCGCCTACGCC
+AACCCGCTACCCGGGCGGCCCGCGGCGATCGCCTATCACGATCTGGCGCACACCAGCGCCAAGCTGGACG
+ACGGCGCGTCCTGGCGGCGCCTGCTGGGCCCGTTGGTGGCGCACTCGGAGACGGTCGTGGAGTTCATGCT
+CTCCGACAAGCGGTCTTTGCCTACTGCACTGGGCTCGGTCCTGCGTCTCGGGCTGCGGATGCTGGCCCAG
+GGCACCCCTGCCTGGCGGTCGCTGGCGGGCGAGGATGCCCGCGCGTTGTTCACCGGCGTTGCCGCCCACG
+CGATTTCACCGTTGCCGTCACTGGTGTCGGCCGGCGCCGGACTGATGCTGGCAACGCTGGCCCATTCGGT
+CGGCTGGCCGATTCCGGTGGGCGGCACCCAGGCGATAGCCGACGCGCTGATCGCCGATCTACGCGCGCAT
+GGTGGTCGGCTCGCGGCCGGTGTCGAGATCACCGAACCGCAAAGAAGTGTGGTCGTCTTCGACACCGCAC
+CCACCGCCCTGCTGCGGGTTTACCGCGACAAGCTTCCACATCGGTATGCCAAAGCATTGCGCCGCTATCG
+ATTTCGCGCTGGCATCGCCAAGGTGGACTTCGTGCTCAGCGACGAGATCCCGTGGTCGGATCCGCGGCTG
+CGGCGGGCTGCGACCCTGCATCTCGGCGGCACCCGTGACCAGATGGCGCGCGCCGAGGCAGACGTCGCGG
+CGGGACGCCACGCCGACTGGCCGATGGTGCTGGCCGCGTGTCCGCACGTCGCCGACCCCGGCCGCATCGA
+CGAAACCGGCCGCCGTCCGTTCTGGACCTATGCCCACGTGCCGTCGGGGTCCACGCTCGACGCGACCGAG
+ACCGTAACCAGCGTCCTCGAGCGGTTCGCCCCCGGCTTCCGTGACATCGTGGTGGCGGCCCGCGCCGTGC
+CCGCCGCGCGGATGGCCGACCACAACGCCAACTACGTCGGCGGTGACATCACGGTCGGCGCCAACTCGAC
+CTGGCGCGCGATCGCCGGCCCCACCCCGCGGTTGAATCCCTGGCGCACACCGATTCCCAAGGTGTACCTG
+TGTTCTGCGGCGACTCCGCCCGGCGCCGGCGTGCACGGCATGTGCGGCTGGTATGCCGCTCGAACGCTGT
+TGCGCACCGAGTTCGGCATCACCCGCATGCCCCCCTTGGGCCATGAGCTGAGGCCATAACGAAGCTTGCG
+ATCATCGACTATTCGGAGGCGCGCCAGGCGGCAGCGGCGACAACCGGAACGTCGGCACGGTGCTCAATCA
+CGGGTGCACGGTGTGCATCAGAATGGCGGGGGTTCGTTGTCGCGGTGAGGCGTTCGGCGAGGAGGTAGTG
+TCTACCCCTTGCCCGCGGGTTCGTGCGGACTGAAGGGATTTCATTGGGACCCACGGCTGCGTATCGCAGG
+GCCTCGGTGACGTCTGCTTCCTCAAGCTCAGGAAGTTCGGCGAGAATCTCGGTGGATGTCATTTGGTCCG
+CGACCATCGCGACCACAGTCGCCACTGGGATGCGCAAGCCCCGGATGCATGGCATGCCTCCCATCACGTC
+GGGGTCGATGGTGACGCGGGTGACTCGCATGTCTATAAGGCTAGCCGGTGACAGCACGCTGGGGCGGTTC
+TCCACCAGCCGTCTTGGCTTAAGCTCAGCCAAGAGCAAGCCGGAGGGAGATTTCGGCACCGCCTGCGGCG
+CGGTTTCGGGCGGTGACGCTGGCGTGGTTGCGTTGGCTGAGGGTGTCGACGATGGCCAGTCCAAGCCCGG
+TGCCGCCGGTGGTGCGCGCGGTGTCGGTGGTTTCCGCGAGAGCCGAGCGGATTGCGGCGAGCAGTTCGGG
+GTTGCTTCGTGGACGCCGCAGGGCGAGTTCGAGTTCGGTGGTCAGGAGGCTAAGGGGGTGCGAAGTTCGT
+GGCCCGCATCGCTGACGAATTGACGTTCTCGCTCGAGCGCGTCTTGCAGCCGCTGCAGAAGGTCGTTGAA
+TGTTGTTCCAAGATACCGGATTTCGTCTCGAGCCAGTGGCAATGGCAGACGGGCATGTGGGTCGGTGGCG
+CTGATGCCCGCGGCGCGGATGCGCATGCGTTCCACGGGTCGAAGAGCCGCGGCGGCCAGCAGATACGCGC
+CCAGGGCGTCGATGAGGACGTCTGGCCGTGCCCGGATCGGTGCGATCGAGCTTCATCGTGGTTTCATAAT
+CACCCGATAGACCATGGCTAACCGAACTGCCATCCACGCCGTGGATGCAACGGATGGAGGGAACGCGCAT
+GGCGGGCGCCAAACATGCTGGGAGAATCGTCGCGATCACCACCGCGGCGGCGGTGATACTGGCGGCGTGC
+AGTTCGGGCTCCAAGGGTGGAGCGGGCAGCGGCCACGCCGGCAAAGCTCGTTCGGCGGTGACCACCACCG
+ATGCCGACTGGAAGCCGGTGGCCGACGCGCTGGGACGTAGCGGCAAGCTCGGAGACAACAACACCGCGTA
+TCGGATCAACCTGCCGCGCAATGACCTTCACATCACGTCCTACGGTGTGGACATCAAACCGGGGCTGTCG
+TTGGGCGGGTACGCGGCATTCGCCCGATACGACAACAACGAAACGCTGCTGATGGGCGACCTCGTGATCA
+CCGAGGAGGAGTTGCCCAAGGTCACCGATGCGTTGCAGGCGCATGGTATCGCCCAGACCGCACTGCACAA
+GCATCTGCTGCAGCAAGACCCGCCGGTGTGGTGGACCCACATTCACGGCATGGGTGATGCCGCCCGACTG
+GCCCAAGGACTCAAGGCGGCGTTGGATGCCACAACGATCGGCCCGCCTACCCCACCGCCGGCACGGCAAC
+CACCGGTCGACATCGACGTCGCCGGCGTCGACCAGGCGTTGGGCCGCAAGGGAACCCAAGATGGTGGGCT
+GTTGAAGTACAGCATCCCCCGCAAAGACACCATCATCGAGGACGGGCACGTGCTGCCCGCAGTGTCGCTG
+AACCTGACGACGGTGATCAATTTTCAGCCGGTGGGCCGCGGTCGCGCAGCGATCAACGGCGATTTCATCC
+TGATCGCCCCCGAGGTTCAGGAGGTCATCCGGGCAATGCGTGCCGGCAACATCACGATCGTGGAACTGCA
+CAACCATGGGCTGACCGAAGAGCCCCGCCTGTTCTACATGCATTACTGGGCCGTCGACGACGCGGTCACC
+CTGGCGCGGGCGCTGCGCCCGGCGATGGATGCCACCAACCTGCAGTCGTCATAATCCCGATGCAACCGCA
+TAAGGGCTGGTGTGGCTGATGCATCCTGATGGCGGTGCATGGTTTCCTGCTCGAACGGGTCAGCGTGGTG
+CGCGACGAGGCGACGGTGCTGCGGCAGGTCAGCGCGCATTTTCCCGCTGGCCGCTGCAGTGCGGTGCGGG
+GCGCCAGTGGATCGGGAAAGACCACGCTGCTGCGGTTGCTGAACCGGCTCATCGATCCGACGTCCGGAAA
+AGTCTGGCTTGACGGTGTGCCGCTCACCGATCTGGATGTGCTCGTGTTACGTCGGCGGGTCGGCCTGGTT
+GCGCAGGCTCCCGTGGTGCTTACCGATGCGGTGCTCAATGAGGTTCGCGTCGGACGCCCGGACCTGCCAG
+AAGGTCGAGTGACCGAGCTGCTGGCGCGGCTGTGTCTCGGCCAGTCCGCACGCGAAGCGTTCTTGCCGCA
+CCAACGATCCGCCTTGCGCACTGCGCTGATACCCGCGATCGACTCCACGAAAGTCGTTGGGCTGATTAGC
+CTTCCGGGTGCGATGTCCGGACTTATCCTGGCCGGGGTCGACCCGCTGACCGCGATCCGCTACCAAATCG
+TGGTGATGTACCTGCTGCTCGCCGCCACCGCGGTGGCAGCGCTGACCTGTGCACGCCTGGCTGAACGTGC
+CTTATTCGACCGCGCGCACCGGCTCGTTTCGCTGCCCGCGGCGACTCGTCGGGCATGAGTTCGCGACTCG
+ATCACAGCCAATCGCCGCTGTGGCATGTGGCCGTTGTCAGTCGTTATCCACGGTCTCCGTGCCCAGGAAG
+CGAAAGCCCTGATCCAGGTGCACTTCCACCTGAGTACCATCGGGTTTGGTGACGAGCACCCTCATCGCTT
+CATCCCTTCTTGTCGTCGTCGTGGTTACGAAGGCGACGCTAACGGCGCCAGATGAAGCCCCGATGAAGGC
+AGCGACGCCGGTGACACAACGGGGCGGACCTGCCCCGTGGCACACGGCGGTTGCCGGTCACGATCACTGC
+AGTGTCGAGACGGCCTAGGAGCTAGGCCGTCTCGGTGATCGGGCGGTCCACCCAGCTCATCAGGTCGCGG
+AGTTTCTTGCCGACGACCTCGATGGGGTGCTCGGCGTTTTGCCGGCGCAACTCTTCGAGCTGTTTGTTGC
+CGCCCTCGACGTCGGCGACCAGCTTGTGGACAAAGCTACCGTCCTGGATCTCCCGCAGGATGTCGCGCAT
+CCGCTCCTTGGTGCCGGCATCGATGACGCGCGGGCCTGAGAGGTAGCCGCCGAATTCCGCGGTGTCCGAC
+ACCGAGTAGTACATCCGCGCCAGGCCACCCTCGTACATCAAGTCGACGATCAGCTTCAGCTCGTGCAGCA
+CCTCGAAGTAGGCCAATTCCGCGGGGTAGCCGGCTTCGACCATGACCTCGAACCCGGCCTTGACCAATTC
+CTCGGTGCCGCCGCACAACACCGTTTGCTCACCGAACAGGTCGGTTTCGGTCTCGTCTTTGAACGTCGTC
+TTGATGACGCCGGCCCGGGTGCCGCCGATCGCTTTGGCATACGACAGCGCCAGCGCCAAGCCGTCGCCTC
+GCGGATCCTGCTCTACCGCAACCAAACACGGCACACCCTTGCCGTCGACGAACTGGCGGCGCACCAAATG
+ACCCGGTCCCTTCGGGGCGACCATCGCGACGGCGACGTCGGCGGGCGGCTTGATCAAGCCGAAGTGAACG
+TTGAGTCCGTGACCGAAGAACAGCGCGTCACCGGGCTTGAGGTTGGGTTCGATGTCTCCTGCGAAGATCT
+CGGCCTGGGCGGTGTCGGGGGCCAACACCATGACCACATCGGCCCATTTGGCGACCTCGGCGGGAGTGTC
+GACGTCCAGGCCCTGCTCTTCTACCTTGGGCCGCGACCGCGAACCCTGCTTCAGCCCGACGCGCACCTGC
+ACACCCGAGTCGCGCAGGCTTAGCGAGTGCGCGTGCCCCTGGCTGCCGTAGCCGATCACACCAACCTTGC
+GGCCCTGAATGATCGACAGGTCTGCGTCGTCGTCGTAGAACATCTCTAGTGCCACCGCTGAATCTCTCCT
+TACCTGCTAGCTACTTGGCGGTGCCGATGCCGCGCGGACCGCGGGACAGCGACACCATTCCGGATTGGGC
+GATTTCGCGAATACCGAACGGCTCCAACACCCGCAGCAGGGCCTCTAACTTGCCGCGGTTACCGGTGGCC
+TCGACGGTCAATGACTCCGGGGATACGTCAATCACGTTGGCGCGAAACAGATTCACCGCTTCGATCACTT
+GGCTGCGGCTGCCGGCGTCGGCTTGGACCTTGATGAGCGCCAATTCCCGTGACACCGAGTGCTCGTCGTC
+CTGCTCGACGATCTTGATGACGTTGATCAGCTTGTTGAGCTGCTTGGTGATCTGCTCGAGCGGAGTGTCC
+TCGGCGGAGACCACGATGGTCATCCGTGACCTGTCCTTGCACTCGGTGGCACCCACCGCCAACGACTCGA
+TGTTGAAACCGCGCCGGGAGAACAGCGCCGCCACCCGCGCCAGCACGCCGGGCTTGTCTTCGACCAACAC
+CGACAACGTGTGCGTCTTCGGGCTCATCAGGCGTGGCCTTCGGTGATGTCGTCGAACAGGGGGCGAATGC
+CGCGGGCGGCCTGGATCTCGTCATTGCTGGTGCCCGCGGCCACCATCGGCCACACTTGCGCGTCGGCACC
+GACGATGAAGTCGATCACCACCGGGCAGTCGTTGATCGCCCGCGCCTGGTTGATGACGTCGACGACGTCC
+TCTTCCCGCTCGCACCGCAACCCCACACACCCCAAGGCCTCGGCCAGTTTCACGAAGTCGGGGATGCGGT
+GCGAATGAGTGGCCAGGTCGGTCTGCGAGTACCGCTCGGCATAGAACAGGCTCTGCCACTGCCGCACCAT
+GCCCAGGTTGCCGTTGTTGATCAGCGCCACCTTGACCGGTATGCCCTCGACCGCGCAGGTGGCCAGCTCC
+TGGTTGGTCATCTGGAAGCAACCGTCGCCGTCGATCGCCCAGACCTCGGTGCCGGGGAGGGCGATCTTGG
+CGCCCATGGCCGCCGGGATGGCAAACCCCATGGTGCCCAGACCGCCGGAGTTCAGCCAGCTGCGCGGCTT
+TTCGTATCTGATGAACTGCGCGGCCCACATCTGGTGCTGGCCGACGCCGGCGACGAAGACGGCGTCCGGC
+CCGGCGATCTCGCCGAGCTTTTCGATCACGTATTCCGGGCTCAGGCTGCCGTCGCTCTGCGGCCCATAGC
+TCAGCGGATAGGTCTTGCGCACACCGTTCAGGTATGCCCACCAGTCGGCCATCTCGATGGTGCCGGGAAT
+GTGGTGGTGGCGCAGCATCGCGATCAGTTCGGTGATGACGGCCTTGACGTCACCGACGATGGGCACGTCG
+GCGTGGCGGTTCTTGCCGATCTCGGCCGGGTCGATGTCGGCGTGGATGACCTTGGCTTCCGGCGCGAACG
+AGTCGAGCTTGCCGGTCACCCGGTCGTCGAAGCGGGTACCCAGCGCGATCAGCAGGTCGCTGCGCTGCAG
+CGCCGCCACGGCGGCCACCGTGCCGTGCATGCCGGGCATGCCGAGGTTTTGCCGGTGGCTGTCGGGAAAC
+GCGCCGCGGGCCATCAGCGTGGTGACCACCGGGATGCCGGTCAGCTCGGCCAGCTCCCGGAGCTGCTCGG
+TGGCCTCACCGCGGATGACGCCGCCGCCGACATACAGCACCGGCTTGCGCGCGGCCGCGATCAGCTTGGC
+GGCCTCGCGGACCTGCCGGCTGTGCGGTTTGGTGTTGGGCTTGTAGCCGGGCAGCTCCATCCGCGGCGGC
+CAGCTGAACGTGCACTGGCCCTGCAGCACGTCCTTGGGGATGTCGACCAGCACCGCGCCCGGACGGCCGG
+AGGCCGCGATGTGGAAGGCCTCGGCCAGCACCCGCGGAATGTCGTCACCGGAGCGGACCAGAAAGTTGTG
+CTTGGTGATCGGCATCGTGATGCCCGAGATGTCGGCCTCCTGGAAGGCGTCGGTGCCGATCAGCCCCCGC
+CCGACCTGACCGGTGATAGCGACCACCGGGATCGAGTCCATCTGCGCGTCGGCCAGCGGGGTCACCAGGT
+TGGTCGCTCCGGGACCCGACGTTGCCATGCACACGCCCACCCGGCCGGTGACGTGCGCGTAGCCGCTGGC
+GGCATGCCCGGCGCCCTGTTCGTGGCGGACCAGCACGTGGCGCAGCTTTTTCGAGTCGAACAGCGGGTCA
+TACACCGGCAGCACCGCACCGCCCGGAATCCCGAAAATGACGTCGACGCCGAGTTCCTCCAGCGACCGGA
+TGACCGCCTGTGCACCGGTAAGCTGCTGCAGTGCAACATGTTTCGGACGAGCCGCCGGGTGCTTTGGCTC
+ATTCGCCGCGCTGTGTGGCTCTGGCTTGAATGTCGGTGAGTGTGGCTTGGTTGGTGCGCTCACTGTTGTG
+TGATCCTCTATTGCTCTGGAAGTCTCGTTGGTGGACAAGAAAAAACCCTCGCCAGCTCAGCTGCTGCACG
+AGGGTCGCGTTGGTGCTCGCTTGGGCTAGTCAGGCACCAACGCGCCGACCAATTACTACGAGCATCCCGG
+GCTTTCCGGCCTTGTCCATAGTGTCCGACGGTAGCCTTCACACAGCTCAGCAGTCAAATCCGCGGTGTCA
+GTCTTGATCCGCGAGCGTGACGGCACTGCGAAATCCCATGCGAATTTTCGCGGTGGCGTTACGCTCGCGA
+ACTCGACGCCCACCAAGCGGTGAGATGATGCTGGGGTGGCCACCACATCGCCGGTCGTGATCAAGGTGTC
+GCCGATGGCGCACTTCGCCGTGGGATTCCTGACCCTGGGTCTGCTGGTGCCGGTACTGACCTGGCCGGTG
+AGCGCCCCGCTGTTAGTCATTCCGGTGGCGTTGTCGGCATCGATCATTCGGCTCCGCACGCTCGCCGACG
+AGCGGGGCGTGACCGTGCGGACGCTGGTCGGCAGCCGCGCGGTGCGCTGGGACGACATCGACGGGCTGCG
+GTTCCACCGCGGGTCCTGGGCGCGCGCAACGCTCAAGGACGGTACCGAGCTGCGATTGCCCGCGGTGACC
+TTTGCGACGCTGCCGCACCTGACCGAAGCCAGCTCGGGACGGGTCCCCAACCCGTACCGATGACAGCGTT
+CAGGCCAGCGGATTTGCCCCGTTGAGCAGCACCCATACGGCAATACCCGCCGCGATGCCACCCAACAGCG
+CTACAAACGATCCGATAAATGGCCGATGAGCCCAGCCGCGGGCCGCGTCCAGACCGTAGCGGCCGGGACC
+ACTCAAGATAACGGCGACCGCCATCACGACCAGGGTGATCTGGTATTCATGCCCGTCCTGCAGGAAGTAC
+GCGACGGGCCGCGAATGCTGTGCCGAGATGCCGGCGAGCAGGCCGTTGATCAAGAAGGCCAGCGCGCCCG
+CGGCCGCCAGCGGAGTAAACAAACCCAACACCAGCAGCACTCCGGCGACGATCTCGCCGCCAGCGCTCAC
+ATAAGCGAGGATCTCGGCGTGCTGGTAACCAATGTCGGACAGCGAGTTCTGGAATCCGGCCAGACCCTGG
+CCGTCCCACCAGCCGAACAATTTCTGCAGCCCATGGGCGATAAGGACCGCGCCCAGACCGACCCGCAATA
+TCAGCAGCCCGAGATTCTGGGTGCCGCGCCGACCTGCGGCGCGTACCCGCTCGTCGTCGTCCATGTCGAT
+TCCGGCAGATCCCGCCGGTACCTGCCGGCCCGGCTGCGGCTGGACGTAGGGCAACGGCTCCGCAGCTTCG
+ATCAGGCTGTACCCGGAGTTGCCGACACCAGAGCTAGCGGCATCATAGGGCGGGATAACGGTGGTGGTTC
+CACTGCCAAAGTCCCCGGCATATCTGGCCGGCGTCAGGTCATCCTCGGGGTCGACCAGGCTTGCCGAGAC
+AGGCCGTCCAGGCATTGGCCCAGGCGAATCATCCGGCCGCTGCCAATGTGAGTCATTCGAACTGGTCACT
+CGTGTCAGGGTAAGGCCATTTAGTGCCGAATTGGGGATTTGAGCGGCGCTTTCGCCAGACAATCCGCACA
+TTGACCCTGACCAGCCCACCAAAAGGCCCCAATTGGGCCGCCATGCCGACAGTGCGCACCCCGGCAGGTG
+GCGGCGATGCCCACAATGTCCGTAGCCTGTCGGTCATGTGGACAACGCGGTTGGTTCGATCCGGACTCGC
+CGCGCTGTGCGCGGCAGTGCTGGTATCGAGCGGCTGCGCACGGTTCAACGACGCTCAATCTCAGCCGTTC
+ACCACCGAACCGGAGCTGCGGCCCCAACCCAGCTCGACACCTCCCCCCCCGCCGCCGCTGCCGCCGGTTC
+CCTTTCCCAAGGAATGTCCGGCGCCGGGCGTGATGCAAGGCTGCCTTGAGAGCACCAGCGGCTTGATCAT
+GGGCATCGACAGCAAGACCGCACTGGTCGCCGAGCGCATCACCGGTGCCGTCGAGGAGATCTCTATCAGC
+GCCGAGCCGAAGGTAAAGACGGTCATCCCCGTGGATCCTGCCGGTGACGGTGGCTTGATGGACATTGTGC
+TGTCGCCCACCTACTCGCAAGACCGGCTGATGTACGCCTACATCAGCACGCCCACCGACAACCGGGTGGT
+GCGAGTGGCCGACGGCGACATCCCCAAGGACATCCTGACCGGCATCCCCAAAGGTGCTGCCGGTAACACC
+GGGGCGCTGATCTTCACCAGTCCCACCACGCTGGTCGTGATGACCGGGGATGCTGGCGACCCGGCGTTGG
+CCGCCGATCCCCAATCGTTGGCCGGTAAGGTCCTGCGTATCGAACAGCCCACCACCATCGACCAGACGCC
+GCCGACGACGGCGCTGTCTGGCATCGGCTCCGGCGGCGGCTTGTGCATCGATCCGGTCGACGGCTCGCTA
+TATGTCGCCGACCGCACGCCAACGGCGGACCGATTGCAGCGCATCACCAAGAACTCGGAGGTCTCTACGG
+TATGGACCTGGCCGGACAAGCCCGGCGTGGCCGGGTGTGCCGCGATGGACGGCACCGTGCTGGTCAACCT
+GATTAATACCAAACTGACGGTGGCGGTCCGGCTCGCGCCGTCGACCGGTGCGGTCACCGGAGAACCCGAC
+GTTGTCCGCAAAGACACTCATGCGCATGCGTGGGCATTACGGATGTCGCCGGACGGCAACGTCTGGGGAG
+CCACCGTCAACAAGACCGCCGGCGACGCCGAGAAGCTCGACGATGTGGTGTTCCCGCTGTTCCCGCAGGG
+TGGCGGCTTCCCGCGCAACAACGACGACAAGACCTGACCCGGTTAGGGCACGTCGAGCGTGAACCTTACG
+ACGCCGTATCGGCGTGTCTCGTCGCCCCGTTCACGCTCGTAGAACCGGGGTGAGGCTTCCTTGCCAGGGT
+CGATGTCGTCGACATCAAAGTCGAGGTCGGAGAGGTAGAGCAGATCTTCCGAGCACTCCGGAGCCCACAC
+GCTCACGGGCTCCAACAGGTAAGCCACATAATCCCCGACATCGCTGCGACTGGCCGTCCTACCGATGAAC
+CAGGCGGCCGCGTCGTCGAGAATCGGCATTCCACAGGGGCCAGCGCGCCACGAGCAACGGGCGAACTTGT
+TGACCTCCTCCTCCGTTTGGCTGCCGAACAGTTCGGCGAGCACATGCTGCCGCTGCGAAAGCACGTGCAC
+GGCGAGGTGCTCGGATCGGCTCGCCACCTCGGAGGTGCCGGTGCTCCTCGGCAGGCCGACCATAAAACTC
+GGGGGCTGCACGCTCGTTTGGGTAGCGAAGCTGACCAGACAACCCGCGGGGTGACCATCGGCCTGGGTTG
+TCACCACAAACACCGGGTGGTCCAGCATCCCCATCAACTCGTCGAACGACTCATCGATCACATCACCATC
+ATGAATCCGCGCAACGTCTTCTGACACTCTTTCCGAGCGTTCAGTCGGCGAATCGCCGCTACCGCCATCA
+CGTCGACCGGTGAGGCCGCCGTCACGGCCCCAAATCGGCGACGATCTGGGCACGGAATCAGAACCTGATT
+GGGTCCCGGCCAGCCTCGCTGGCGTGGGAAGTCACCACGGTCGCGCCGCGGCTTCTCAACCCGGCCGACA
+CGCGCTCCCGATGCTCACTGTCGTCGCTGTCATAGGCATACTCGAATGTGGATTAGTGCTACACATGCCT
+GACAACGATTTGTGGTACTGCGGGCCATGGACACTATGGGTGATGGCCGGTAGGGGTGTTGCGTCGGGCG
+CGGGAGTGTGGCGAGGTGATCGCGTTGCGACGCCCCTTGCGGTGGCGATTACCGCAGCCGGATTGGTATC
+AGGGGCCCGGATAGGACCCGGTGCGGCTGCGAAACGCGACCCGCAGCTCGCACAGTGGAACGAGATTCGC
+AGTCACTACCAAGAGATCGCCGAGTGGATCGACCACGACACAGCAACCGCACACCCCGCTGTTGCCGCAA
+CGCAGATCAGTGCCGCTGGCTCTTTCGGCCGCGCCAATATGGTCGACTACCTGGGGCTCCTGGATTCCAG
+GGCCGACGAAACGGTCCGACGCGACGAATTTTCGCGGTGGCTGTCGGCCAAACCCGACTACTTGGTCACC
+ACCGAGCAATCTGTCGACGCCGCCACGATAGCCCTTCCTGAATTCCGCCATGCGTACGACCGCGCGGCCA
+CCATCGGGACACTCAACGTGTATCGTCGCAACTCCCCTGACGGTGATGAACCGCTACCCGCGGACGGCAA
+CTAACCCTGCCCGCAGGCCTCTAGAACGAGTTCGCGCACTCGGGCCGCGTCGGCCTGTCCGCGGGTCGCC
+TTCATCACCGCACCGACAATCGCGCCGGCCGCGGCCACCTTGCCGCCGCGAATCTTGTCCGCCACATCAG
+GATTTGCGGCCAGGGCCTCGTCGACCGCGGCCTGGGTCAACGAGTCGTCGCGGACCAACGCCAACCCTCT
+CGCAGTCATCACCTGTTCGGGCTCACCTTCACCGGCCAGCACACCCTCCACGACTTGGCGGGCCAAGCTG
+TTGGACAGCTTGCCCTCATCGACCAATGCCACCACGGCTGCGACCTGGGCAGGAGTGATGGCCAGTTCGT
+CCAGCCCGATGCCGGCCTCGTTGGCCTTTTGCGCCAGGAAGTTTCCCCACCAGGCGCGCGCCGCCTCGCT
+GGACGCGCCGTGCTCGACGGTGGCAGCAACCAATTCGACGGCGCCGGCGTTGACCAGATCGCGCATCACC
+TCGTCGGAAACACCCCACTCCTGCTGAATCCTCCTGCGGCTCAACCACGGCAATTCGGGGATCGTCTGGC
+GTAGTCGCTCGACCAGCTCGCGACTGGGCGCGACAGGCTCCAAATCCGGCTCCGGGAAGTACCGATAGTC
+CTCGGCGGTCTCCTTGGTGCGGCCCGCGCTGGTGTAACCGGCCTCGTGAAAGTGTCTGGTTTCCTGGGTG
+ATCCGACCACCAGACGCCAAAATAGCGCCCTGGCGCTGCATTTCGTAGCGGACGGCGACTTCGACGCTCT
+TCAGCGAGTTGACGTTCTTGGTCTCGGTCCGGGTGCCGAATTCGGTCGTCCCGGCCGGCTTCAGCGACAC
+GTTGGCGTCACAGCGCATCGAACCCTGGTCCATCCGGACATCAGATACATCTAATGCGCGCAGCAGATCC
+CGCAACGCCGTCACATAGGACCGGGCGATCTGCGGCGCCCGGGCACCGGCGCCCACGATGGGTTTGGTGA
+CGATCTCGATGAGCGGCACGCCGGCACGGTTGTAGTCGATCAGCGAACCGGTGGCACCGTGGATCCGGCC
+CGTCTCGCTGCCGATGTGGGTGAGCTTGCCGGTGTCTTCTTCCATGTGAGCTCGCTCAATCTCCACCCGC
+CAAGTGGTGCCGTCTTCCAAAGGCGCGTCCAGGTAGCCGTTGATGGCGATCGGCTCGTCGTACTGTGAGA
+TCTGGTAGTTCTTGGGCATGTCGGGGTAGAAGTAGTTCTTCCGGGCGAAGCGACACCAGGGTACGATCTC
+GCAGTTCAGCGCCAGCCCGATGCGGATCGCCGACTCCACGGCGGCCCGGTTGAGCACCGGCAGCGAACCG
+GGCAAGCCCAGACACACCGGACACACCTGGGTGTTTGGCTCGCCGCCGAATGTGGTGGTGCAGCCACAGA
+ACATCTTGGTCGCAGTGGACAGCTCGACGTGCACCTCGAGGCCGAGTACCGGCTGGAAGCGCGCGACGAC
+CTCGTCGTAATCGAGCAGTTCAGCCCCTGCGGCCTTGGCTGCCCCGGCAGCAACAGTCATAGCCGCGATC
+CTAGTTTGAGCACCCGACGTCAACCGAAGAAGGCGGCGGCGTCGTCGTAACGGCTCTGCGGCACCAGTTT
+GAGTTTGCGAACCGCATCCGCCAGCGGAACCCGACCGATGTCCTGGCCGCGCAACGTCACCATCTGGCCG
+TACTCGCCCGCATGCGCGGCGTCGGCGGCGTTCACCCCGAATCGGGTGGCCAGCACTCGGTCGTAGGCGG
+TCGGAGTACCACCCCGCTGGATGTGGCCCAACACCGTCACCCGGACATCCTTGTTGATGCGCTTCTCGAC
+CTCGACCGCCAGCTGCGCCGCTACACCTGTGAAACGCTCGTGCCCGAACTCGTCGAGACCACCCTCGCGC
+AGCATGATCGTCCCCGGAGCCGGTTTGGCGCCTTCGGCGACCACGCAGATGAAATGCGAGTCCCCGCGCT
+GGAAACGGCCTTTGACCAGTCGGCACACCTCTTCGATGTCGAACGGCTGCTCAGGAATCAGGGTCATGTG
+AGCACCGGAGGCCAGCCCGGCGTTCAGCGCGATCCAGCCGGCATGCCTACCCATCACCTCCACCAGCATC
+ACCCGCTCGTGGGATTCGGCGGTGCTGTGCAGCCGGTCGATGGCCTCGGTGGCCACGGTCAACGCGGTGT
+CGTGGCCGAAGGTCACATCGGTGCAGTCGATGTCGTTGTCGATCGTCTTTGGCACCCCGACCACCGGCAC
+ATTCTCTTCGGAGAGCCAACTCGCGGCGGTCAGCGTACCCTCACCGCCGATCGGGATCAGGACGTCGATC
+CCGTTGTCGTCCAAGGTCTGCATGATTTGGGGCAGCCCCGCCCGCAGTTTGTCGGGGTGCACCCGGGCCG
+TGCCCAGCATCGTGCCGCCCTTGGCCAGCAGCCGGTCATTGCGGTCGTCGTTGTGCAGTTGAACACGGCG
+GTTCTCCAGCAGCCCGCGAAAGCCGTTCTGAAATCCGACCACCGACGAGCCGTATCGGGCGTGGCAGGTA
+CGCACCACCGCACGGATGACGGCGTTAAGGCCGGGACAGTCGCCGCCTCCGGTAAGAACTCCAATCCGCA
+TACCCTCATCTTGCCTCGCGGCCGCCGACCTGGCGCGAGCAGACACAGAATCGCACGGGCGAGGGGCGCC
+GGATGCGAGTCTGTGTCTGCTCGCCGCTAAATGGCGCTCAGTAGCGGGCCGCGGGCGGCCTCATAAGCCG
+CCCCCACCCGGTAGAGCCGGTCGTCGGCCAATGCCGGCGCCATGATCTGTAGGCCAACCGGCAACCCGTC
+GTCCGGGGAGAGCCCCGACGGCACAGACATGCCGCAGTGGCCGGCCAAGTTCAGCGGCAGCGTGCACAGG
+TCGAACAAGTACATCGCCAGCGGATCGTCCACCTTCTCACCCAGCCGGAACGCGGTGGTCGGGGTCGTGG
+GCGACACCAGCACGTCGACGGACCGATACGCCGCGTCGAGGTCGCGGGCGATCAGCGTGCGCACCTTCTG
+CGCCTGGTTGTAATAGGCGTCGTAGTAGCCGGCCGACAACGCGTAGGTGCCGATCATGATGCGCCGCTTG
+ACCTCGGGCCCGAAACCGGCGGCCCGGGTCATCGCCATCACCTCCTCGGCGCTGCGGGTGCCGTCGTCGC
+CGACCCGCAGCCCGTAGCGCATCGCGTCGAAGCGCGCCAGATTGCTCGACACCTCCGAGGGCAGAATCAG
+GTAATAGGCGGCCAGGGCATGGTCGAAGTGCGGGCAGTCGACCTCGCTGACCTCAGCGCCCAGCGCGGTT
+AGCTGCTCCACGGCAGCCTCGAAGGAGGCCAGCACGCCCGGCTGGTAGCCCTCGCCGCCGTGCAGCTGTC
+GAACCACGCCGACCCGCACGCCACGCAGATCCCCGACCGCGCCGGCCCTAGCGGCGCCCACCACGTCGGG
+CACCTCGGCGTCGACCGACGTGGAGTCGCGCGGGTCGTGGCCGGCGATCACCTGATGCAACAGCGCGGTG
+TCCAAGACGGTGCGCGCACACGGGCCGCCCTGATCCAGCGAGGACGCGCAGGCCACCAGCCCATAGCGCG
+ACACCGTGCCGTAGGTGGGTTTGACGCCGACGGTCGCGGTCAGCGCGGCCGGCTGGCGGATCGACCCCCC
+GGTGTCGGATCCGATGGCCAGCGGCGCCTGGAACGCGGCCAGCGCCGCCGCGCTGCCGCCACCGGAACCG
+CCGGGTACCCGGTCGAGATTCCACGGGTTGCGGGTGGGACCGTAAGCGGAGTTCTCCGTCGACGAGCCCA
+TCGCGAACTCGTCCATGTTGGTCTTGCCCAGGATCGGGATCCCCGCGGCGCGCAACCGCGCGGTCAGCGT
+GGCGTCGTAGGGAGATCGCCATCCCTCCAGGATTTTTGACCCGCAGGTGGTGGGCATGTCGCTGGTGGTG
+AAGACGTCCTTGAGCGCCAGCGGCACCCCGGCCAGCGCCGACGGCAAGGGTTCTCCAGCGGCCACCTGCT
+TGTCGACGGCGGCCGCCGCCGCCAGCGCCTCATCGGCCGCCACATGCAGGAAGGCGTGGTACGTCTCGTC
+GGTCGCCTCGATCTGATCCAGGCAGGCCCGGGTGATCTCGGTCGACGACACCTCCTTGATGGCGATCTTG
+GCGGCCAACGTCGCGGCGTCGGATCGGATGATGTCCGTCACTGTTCATCCCCCAGGATCTGCGGGACGGC
+GAAGCGGCCGTCGACGGCATCGGGCGCCTGGTCGAGCACCTGACGCTGGGTCAGGCACGGCACGGTCTCG
+TCCGGGCGGGTGACGTTGACGTCCTTGAGCGGATTGTCGGTGGCCTGCACACCGGTGACGTCGACGGCCT
+GGATCTGGCTGACGTGGGTCAGGATGGCGTCGAGTTGGCCGGCGAAACTGTCCAGCTCGGTTTCGGTCAA
+TGCCAGCCGGGCAAGCCTGGCGAGGTGGGCAACCTCGTCGCGGGAGATCTGGGACACGACCGCAAAGCCT
+AATGGGTGGCCGGACGGCCGACGCCGGCTGCCGAAACGCCGTGGATACATCGTTGTGCCACAGTGTTGGC
+CGTGCGTTCGTATCTATTGCGTATCGAGCTGGCCGACCGGCCGGGCAGCCTTGGGTCGCTGGCGGTCGCG
+CTCGGCTCGGTGGGCGCCGACATCCTCTCGCTCGACGTGGTCGAGCGCGGCAACGGCTATGCGATCGACG
+ACCTGGTGGTCGAACTGCCCCCGGGAGCGATGCCCGACACGCTGATCACTGCTGCCGAGGCGCTGAACGG
+CGTCCGGGTAGACAGCGTCCGCCCGCACACCGGCCTGTTGGAAGCCCACCGCGAGCTGGAACTGCTCGAT
+CATGTGGCCGCGGCTGAGGGCGCGACCGCACGGCTCCAGGTTCTGGTCAACGAGGCCCCCCGGGTGCTCC
+GGGTGAGCTGGTGCACGGTGTTGCGCAGTTCCGGCGGGGAGCTGCACCGTCTGGCCGGCAGCCCAGGTGC
+GCCGGAGACCCGGGCCAATTCGGCGCCCTGGCTGCCGATCGAGCGGGCCGCGGCGCTGGACGGCGGCGCC
+GACTGGGTGCCGCAAGCCTGGCGCGACATGGATACCACCATGGTCGCGGCTCCATTGGGTGACACGCACA
+CCGCGGTGGTGCTGGGCAGGCCAGGCCCGGAATTTCGCCCGTCGGAGGTGGCGCGGTTGGGTTATCTAGC
+CGGCATCGTGGCGACGATGCTGCGCTGAGCGGTTCGTTGGCAACCAAGGTTCGCCGAGCGTAACGCCACT
+GCGAAAAACCGCGCGGAGATTCGCAGTGCCGTTACGTTCGTGACGCGGGTCCGTCGGCCAGCAGTCTCCG
+GAACCCATCCTCGTCCAGAATCGGCACCCCCAACTCCACCGCCTTGTCGTATTTGGATCCCGGCGAGTCT
+CCGGCGACGACATAGTTGGTCTTCTTCGACACCGAGCCGGCGGCCTTGCCGCCGCGGGCCACGATCGCCT
+CCTTGGCGTCGTCGCGGGAGAAACCGGTCAGCGAGCCGGTGACCACGATGGTCAGCCCGGCCAGCGTGCG
+TGGCACACTCTCGTCACGCTCGTCGACCATTCGCACCCCGGCGGCCCGCCACTTGTCGACGATCTCGCGG
+TGCCAGTCGACGGCGAACCACTCGGTGACCGCGGCGGCAATGGTCGGCCCCACCCCCTCGACGGCGGCCA
+GCTGGTCGGTGGACGCCGCGGCGATGGCGTCAAGGCTGCCGAACTCGGTGGCCAGGGCGCGGGCCGCCGT
+CGGCCCGACATGGCGGATGGACAGCGCCACCAGCACCCGCCACAGCGGTGCCGCCTTGGCCTTGTCGAGG
+TTGACCAGCAGCCGTTTGCCGTTGGCCGACAGTTCGCCTGCCTTGGTTCGGAACAGGTCGGTGCGCAGCA
+AGTCCCGCTCGGTCAGCGCGAACAGCTCGCCCTCGTCGGCGATCACCTTCGCCTGCAAGAGCGCCACACC
+CGCCTCGTAACCGAGCACCTCGATGTCTAGGCCGTTGCGGCTGGCGACGTGGAAAACCCGCTCCCGCAGT
+TGCCCCGGGCAGCCGCGGGCGTTGGGGCAACGGATGTCGGCGTCGCCTTCCTTCTCCGGCGCCAACGGCG
+AACCGCACTCCGGGCAGGTGGTGGGCATGATGAATTCGCGTTCGGAGCCATCGCGCAGTTCGACGACGGG
+TCCCAGCACCTCGGGGATCACGTCGCCGGCCTTGCGGATCACCACGGTGTCGCCGATCAGCACGCCCTTG
+CGCTTGATCTCCGAGGCGTTGTGCAGGGTGGCCTGTCCCACCGTCGACCCGGCCACCTTCACCGGCGTCA
+TGAACGCAAACGGCGTGATCCGCCCGGTGCGGCCGACGTTCACCCGGATGTCGAGCAGCTTGGTCTGCGC
+TTCCTCGGGCGGGTACTTGTAGGCGATGGCCCAGCGCGGCGCCCGCGACGTGGAACCCAGCCTGCGCTGC
+AACGCCACCTCGTCGACTTTGACCACCACGCCGTCGATTTCGTGGTCCACCTCGTGGCGGTGCTCGCCCC
+AGTAGTCGATGCGCTCGCGCACACCGGCCAGGTCGGTTGCCAGGGTGGTGTGTTCGGAAACCGGCAGTCC
+CCATGCCCGCAACGCCAGGTATGCCTGATGCAGGGTGGCCGGGCGAAAGCCCTCCACGTGGCCCAGCCCG
+TGGCAGATCATCCGCAGCCGGCGGCGCGCGGTGACCGCCGGGTCTTTCTGGCGCAGCGATCCCGCCGCGC
+TGTTGCGGGGGTTGGCGAACGGCGCCTTGCCCTCCTCGACGAGGCTGGCGTTGAGCGCCTGGAAGTCGTC
+CAGCCGGAAGAAGACCTCGCCGCGGACCTCGAGGACCTCGGGCACCGGGTAGTCGTCGCCGGGGGTGAGC
+CGTTCGGGAACGTCGGCGATGGTCCGGGCGTTCAGGGTGACGTCCTCGCCGGTGCGCCCGTCGCCGCGGG
+TGGAGGCCCGGGTCAGCCGTCCCTCGCGGTAGACCAAAGACAGCGCGACGCCGTCGATCTTGAGCTCACA
+CAGGTAATGTGCGGCGTCTCCGACCTCGGCATGGATGCGGCCGGCCCAGGCGGCGAGTTCGTCGGCGGTG
+AACGCGTTGTCGAGGCTGAGCATTCGTTCGAGATGGTCGACGGGCTCGAAATCCGTGGCGAAGCCGGCAC
+CGCCGACCAGCTGGGTCGGCGAATCGGGCGTGCGCAGCTCGGGATGCTGCTCCTCGAGGGCTTCCAGACG
+GCGCAGCAGCTCGTCGAATTCCGCGTCGCTGATGATCGGCGCGTCCCGCACGTAATAACGGAACTGGTGC
+TCACGCACCTCCTCGGCCAGTGCCTGCCACTGCCGCAACACCTCGGGAGCGGTCTGATCGGCGTCTGGGG
+AGCTCACTCTGGCAGGCTAGCCGAGGGGGCTCTTCCCTCAGATGGCCTCTGGGTCCCGCGCGAACGCCTC
+AGCGACATCACGGGCAAGCCCGACCGCGGTGCGGGCCCACTGCCCCGTCGCATTGGCCAGACCACACGCC
+GGGCTGACGCCGAGTCGATCGCGTAGCGCCGAGCGAGGAACGCCGAGCCGATCGGTGACCGCGACCGCCG
+CAGCAGCGACCTCTTCCATCGAAGGTGCTCGCTCCGGGGCGGTCACCGGGACCAGGCCCAGCACGACGGT
+TCGGCCCGACTCGACAAATGCCGCGACAGCATCCAAATCCGCAGCCTGCAGTGTGCTCGCATCCACCGAT
+ACCGCACTAATTCTGCTGCGCTGCAGCAGATCCCACGGCAAATCCGGACTGCAGCTGTGTAGCGCTACGT
+CCGCGTCGACAGCCGCGATGCAAGTGTCGAGCAGCGCTTCGGCCACCGTCTCGTCGAGCGGGGCAACCGG
+GCTCAACGCGGTCACCCCGGTCAGCCGGCCGCCCAACGCCGCCGGCAACGACGGCTCGTCGAACTGCACC
+ACCACCGGTGTGTCAAGTCGACGCGCCAGCGCCGCGCGATGCGCGGCAACGCCTTCGGCCAGCGAGGCGG
+CCAGGTCACGCACGGCTCCGGGGTCGGTGATCGCCCGGTGACCGTTGGCCAGCTCCAACCCCGCGACCAA
+TGTGACTGGCCCGGGCGCCTGCACCTTCACCGCCCGCCCACAGCCACGCAGGCCCGCGGTCTCCCAGGCC
+TCTTCTAAGGCATCCATATCCTCGTCGAGGAGGCTCGCGGCCCGCCGTGTCACCGCGCCGGGTCGAGCAG
+CGATGCGGTAGCCACGAGGCACGGTGTCAATCGCCACGTCGACCAGCAGTCCGCCGGCTCGCCCCAGCAT
+GTCGGCGCCGACGCCCCTGGCGGGCAGCTCGGTGAGATAGGCCAATGCACCCGCCAACTCCCCGACCACG
+ACCTGCGCGGCCTCTCGCGCGGCGGTGCCCGGCCACGATCCGATCCCGGTGGCCGTTGCGAAAACACTCA
+CCCGGCAACCGTATTCGACCTCACATCGTCGGCTGGCCGCCAGGGGTGTCTGCTGCAGGTTCGCCCGGGT
+ACCTTCGAAGCAGAAGGGTGGCAGATGGTGGGATTGACGCGGCCGCTGCTGTTATGTGGCGCGACACTAC
+TGATTGCGGCGTGCACCCGGGTGGTGGGCGGCACGGCTTCGGCGACTTTTGGCGGTGACCGACAGGGCAT
+GCTTGACGTCGCTACGATCCTGTTGGATCAGTCACGGATGCAAGCAATCACCGGCTCCGGCGATGACCTG
+ACGATCATCCCCACGATGGACACGACGTATCCCGTCGACGTCGACGATTTCGCCCAACCCATACCACGAG
+AATGCCGGTTCATCTATGCCGAGACGGCAGTCTTTGGCTCTGAGATCGAAGCGTTTCACAAGACCACCTT
+CCAGGACCGGCCAGATGGCAGTCTGATCTCCGAGGCGGCCGCCGCCTATCGGGATGCCGGCACCGCCCGG
+CGTGCCTTCGACACCCTGGCGGTCACCGTCCACGACTGCGCGGCAAGTCCGGCAGGCTGGCTGTTCGTCA
+GTAGGTGGACCGCCGGCGGCAATTCCCTACACATCCGGGCCGGCGATTGCGGTCGCGACTACCGGGTCCT
+ATCGGCGGCCCTGTTGGAAGTGACCTTCTGCGGCTTCCCGGAATCGGTCTCCGACATCGTGATGACGAAC
+ATCGCCGCCAACGTGCCGGGTTAGCACCTCGAGCCCGCGTTCAGGATGCCAGGACGGATGTCAACGTGGT
+CAGTTGTGCGTTGCGCTGCGCGACGACATTGGTGCTGACATTTCCACCACGCGCGTTTAGTCTCCGGCGT
+CGGCGGCCGTGGCTGGACCCGCATGGCGCGGGTCCAGCCACCGACCCCGGAACGACCCCACCCTAATCGT
+TCCGCAGTCTGACGAATCGCCTACCGGCCTTTCCAGCACCCCGATCTGGCGTAGTGCTCGCCGGCACCGA
+CGGTAGGCCCGCGCGAGAGCCTCCATGGCCTGATTCCACTGGGCCTGCCAGTCCTGATGACTCATCCCGA
+GATCACCTTGGCAAGCACGCGACGGCGCGGTGCGCTCACTGGCGATATCGGCCCCCAAGCTCTGCGTCGT
+GCCCGTATAACCGGCCATGTCTCCGACATTGGCCGTCATCGCCGGGTAGCTGTACATACTCTGCGACACC
+ACGAATCCCTTTCAAATATTCCGGGCAATGATTTTTAGACACTCTTTCGATCGAAAATTTGGTCGAGTTC
+ACGGCCGTCAGATCGTCAAACTGACACCAACCCCCCATCACCGGCCACACCGACCAAATCCGGCCCCCAG
+CTGCCCGGCAGCATCGGCACCGGCGCACCATCACCAAACTCATCGGCCAACACCGTCAACCCCGCCGGCT
+GCCCAACCGACTCCTTGCCAGCCGTCCCAACAAACCCCAACGCCCCAGCACCCCGATCAGAAGCCAGCAC
+CGACACCGACGTGCTCGCGGGAGCCGGCTCCACCGCCGACACCAACCGCGCCTGCGGCGACACCACACCA
+CCCGACACCGGCGCCACACTGCCCACCAACGCCGCCGGCGCGCCAGCAGCCGCACCCACCGCCGGCACAG
+CGGCCAATCCCGCCACCCCGGCCAACCCAGCTACACCCGGAACCACAGCAGCGGCCAACGCCCCCAACAA
+CGGCCCCCCCAAAAGGGGAACAACACCAAACAGATTCCCAATAACCCACTCGACAACTATGTCTATAACG
+CCCGCAATGGCATACAATAATCCGACCGCAACATAAGAAGCATTGATAGCGAACTCTGTCAATAGTTGAG
+CATTGGATGCCAACGTAATAATGAACCCAATAATGTTGAAACCCAGGATATCCACAAAGAGCTGGAACCA
+AACCCAAGCCACCGCAGGGAGTTCGGAAAGCAAAGCGGACAGATACTGGTCATATGCTGCGAACGTTTCT
+TCTAAAAACTGTACAATTTCGTGCCATGGGAATGGGGTTATGGTTGCGGCGGCCACGGCGTTGCTGGCTT
+CATTGGCGCCGGGTTTGACGATGACCGGTGCCGGGCCGGTGTGTGGTGTGGCCACCAGCGCGGCACCCAC
+CACCGCCTCATAGGCGCTCATCACGGTGGCCGCCTGGACCCACATCCGCACATAGTCGGCCTCGTTGAGC
+GCGATCGGGATCGTGTTGATCCCAAAGAAATTCGTCGCCACCAACACCGCATGCGTGAGGTGGTTGGCCG
+CCAACTCCGGCAACGTCGGCATCTCCGCCAACGCACAAACATAGCCAGCCGCCGCGGCCTCATGCTCACC
+GGCCGCCGCCGCGCTATCCGCACTGGCCTGCACCAACCACGCCACATACGGCACATAGGCGGCCACAAAC
+AACTCAGCACTGGGACCCTGCCACACCCCGGCCCCCACCGCGGCCACCACCGCGCTCAACTCTTGCGCCA
+CAGCGGCGTACTCGGCGCTTAACGCGCTCCACCCCGCCGCGGCCGCCTGCAACGAACCCGGCCCCGGACC
+AGCACTTAGCAGCGCCGAATGCACCTCCGGCGGCGACGCCAACCACACCGGCGTGCGGTGCGAGGACACC
+GGATCACCCGCTAGCGGAATCAATGTGCGGCGGCCAGCCGTGCGGTCAACGCCTCCACCGCCGCACTGGC
+GGCCGCCAAACCCTCAGGAACCACGCTCAGCGTCACCACGCACACTCCTTCCTTAGGCGCCTCCCACACC
+CATCTCCCGGATTTTTGCTCTATCAACTGTTGTAAATAGCTACGATTACCCAGGCGTAGACGACGACGCC
+GCAGATTCCTCACACCCGCGCCTGCGCAATTGGCCACGCACCACCGCCGGCAGCGAGGCCGCCAGCCACA
+CACCAAGCTCCTCGCCGACCACATCGGCTACCGGATCCACCAACAGCGCAACGGCATTCGGATGGGGGCC
+CATCAAACCCACCGATCATCCCGGCGTCGCCGACCACGCCCGCGCCGTGTGCTAGCCGCCCCACTTGGCG
+GCTTCGGCCCCATCTCGAGCCAACATCGCCATGGTGTTGGACTCATGGGTGCCAGACATCGACTGATAGG
+CCCGCACCAGATCCTCTAGGGCCTGGTTCCACTGGGTCTGCCAGCCCTGATACGTGATCCCGGTATCACC
+CTGCCAAGCACTGGACAGCACGGCCTGCTCACTGGCGATATCGGCCCCCAAGCTCTGCAGCGTGCCCGCA
+TAACCGGCCATGTCCCCGGCATGAGCCATCATCGCCGGATAGTTGTACATAATCTGCGACATCACAAACC
+CCTTTTCATTCCGAGCAGCGACTTTTTTAAAACCCGGTGTAGCTGGACGCGGCGGCGGCATCGGCGGCCA
+CATACGTGCCCGCGGCCTCACCCAAATTGGCTTGCGCGATATCCAGCAAGGTATTGACCTTGGCGGCCGC
+GGCCACAAACCGGGCATGCGCACCCTGAAACGCCGCCGCGGACTCTCCCTGATGAAACGCCTGCGCCGAC
+ATCGCCTGCTGCTCGGCCTGACCGATCGTATGCCGCATCAACCCCGCCTTAGCGGCAAACGCCGTATGCG
+AAGCGATCAACTGCGGAATATGGGCATCCAACAAACTCATCACAATTCCTTCCAATTCGAATCACCAATT
+ACTCGCCGTCAGATCGTCAAACTGACACCAACCCCCCATCACCGGCCACACCGACCAAATCCGGCCCCCA
+GCTGCCCGGCAGCATCGGCACCGGCGCACCATCACCAAACTCATCGGCCAACACCGTCAACCCCGCCGGC
+TGCCCAACCGACTCCTTGCCAGCCGTCCCAACAAACCCCAACGCCCCAGCACCCCGATCAGAAGCCAGCA
+CCGACACCGACGTGCTCGCGGGAGCCGGCTCCACCGCCGACACCAACCGCGCCTGCGGCGACACCACACC
+ACCCGACACCGGCGCCACACTGCCCACCAACGCCGCCGGCGCGCCAGCAGCCGCACCCACCGCCGGCACA
+GCCGCCAACCCCGCCAACCCCGTCACACCAGCCACACCCGGCACCACCGCAGCAGCCAACGCCCCCAACA
+ACGGACCCGCCAAAACCGGAATAGCGCCAAAAATATTCGAAATAATCCAACCAATACTGAGTATCGCCAG
+TTCCAAGACAACCGCGAATTCTAATAGCGGAACCAGAACAAATACGCCTAACGCAAAACCTACCGTGGCG
+AAAAACATATCGATCATCCCGGTAAGGACGAGCCAAGGCTCGAAATTTACCAGACCCGTGATCAGCTCGA
+CGAATCCCACAGCCCAGGCTTCGGCGCTCTTCATTATCAATTCGCCGACCTCTGTAAATGCTTGGGCAGC
+CATTTCCAAAAACTTCGCTAATTCTCCGAATGGGAATGGGGTTATGGTTGCGGCGGCCACGGCGTTGCTG
+GCTTCATTGGCGCCGGGTTTGACGATGACCGGTGCCGGGCCGGTGTGTGGTGTGGCCACCAGCGCGGCAC
+CCACCACCGCCTCATAGGCGCTCATCACGGTGGCCGCCTGGACCCACATCCGCACATAGTCGGCCTCGTT
+GAGCGCGATCGGGATCGTGTTGATCCCAAAGAAATTCGTCGCCACCAACACCGCATGCGTGAGGTGGTTG
+GCCGCCAACTCCGGCAACGTCGGCATCTCCGCCAACGCACAAACATAGCCAGCCGCCGCGGCCTCATGCT
+CACCGGCCGCCGCCGCGCTATCCGCACTGGCCTGCACCAACCACGCCACATACGGCACATAGGCGGCCAC
+AAACAACTCAGCACTGGGACCCTGCCACACCCCGGCCCCCACCGCGGCCACCACCGCGCTCAACTCTTGC
+GCCACAGCGGCGTACTCGGCGCTTAACGCGCTCCACCCCGCCGCGGCCGCCTGCAACGAACCCGGCCCCG
+GACCAGCACTTAGCAGCGCCGAATGCACCTCCGGCGGCGACGCCAACCACACCGGCGCCGTCACAACGAC
+CCACCCGAAACCAGATACGTCGCCGCCGCCACCGCATCACCGGCGGCATAACCGATCCCAGACTCACCCA
+CAGCGACCCCGGAACGACCCAGCTCCTCGACCCCTTCGCCCGCGATCGCCGCATGCTCGCTACCTAAGGC
+GCTAAACCCCACCGCACTCTGCAACGACACCGGATCCGCCGCCGGCGCCACCACCGCCGTAATCGCCGGC
+GCCGCGCCAGCGTGTGCGGCGGCCAGCCGTGCGGTCAACGCCTCCACCGCCGCACTGGCGGCCGCCAAAC
+CCTCAGGAACCACTCTCAGCGTCACCACCCACACTCCTTCCTTAGGCGTCACACACCCGCACGACCGGTT
+ACCGTCACCAGCGGAGCGAATTATTGACACCTGTCTTGACGCCTGTCTTGACATGCGTCAGGCAATATTG
+ATCTCACAGATCGTTGCGTATGTCAACTGTTATTGATAGCTACTATTACGTAGGCGTAGGTGACGGCTCC
+GTAGGATTCGGGGACTAGCCCGTTGCTTGGGCTGCCCGACCCCCGCCCCGTCCCACGCAACCCGGCTGCC
+CGTCGTCGGGCGACATCCCGGTCTCTATCGGCGGACCCGAGCAGCCGCCCGGCTAGCCAGTCGCGGCCAA
+GGCCAGGGACGTGGTGTACGAGTGAAGGTTCCTCGCGTGATCCTTCGGGTGGCAGTCTAGGTGGTCAGTG
+CTGGGGTGTTGGTGGTTTGCTGCTTGGCGGGTTCTTCGGTGCTGGTCAGTGCTGCTCGGGCTCGGGTGAG
+GACCTCGAGGCCCAGGTAGCGCCGTCCTTCGATCCATTCGTCGTGTTGTTCGGCGAGGACGGCTCCGACG
+AGGCGGATGATCGAGGCGCGGTCGGGGAAGATGCCCACGACGTCGGTTCGGCGTCGTACCTCTCGGTTGA
+GGCGTTCCTGGGGGTTGTTGGACCAGATTTGGCGCCAGATCTGCTTGGGGAAGGCGGTGAACGCCAGCAG
+GTCGGTGCGGGCGGTGTCGAGGTGCTCGGCCACCGCGGGGAGTTTGTCGGTCAGAGCGTCGAGTACCCGA
+TCATATTGGGCAACAACTGATTCGGCGTCGGGCTGGTCGTAGATGGAGTGCAGCAGGGTGCGCACCCACG
+GCCAGGAGGGCTTCGGGGTGGCTGCCATCAGATTGGCTGCGTAGTGGGTTCTGCAGCGCTGCCAGGCCGC
+TGCGGGCAGGGTGGCGCCGATCGCGGCCACCAGGCCGGCGTGGGCGTCGCTGGTGACCAGCGCGACCCCG
+GACAGGCCGCGGGCGACCAGGTCGCGGAAGAACGCCAGCCAGCCGGCCCCGTCCTCGGCGGAGGTGACCT
+GGATGCCCAGGATCTCTCGGTAGCCCTCGGCGTTGACGCCGGTGGCGATCAAGGTGTGCACTCCGACGAC
+GCGGCCTGCCTCGCGCACCTTGAGCACCAGGGCGTCGGCGGCGAGGAAGGTATACGGGCCGGCATCGAGC
+GGGCGGGTCCGAAACGCCTCTACGGCTTCGTCGAGCTCTTTGGCCATGATCGACACTTGCGACTTGGAAA
+GCTTTGTCACACCAAGTGTTTCGACCAGGCGCTCCATCCGGCGAGTGGATACTCCCAGCAGGTAGCAGGT
+CGCCACCACGCTGGTCAGTGCGCGTTCAGCTCGCTTGCGGCGCTGCAGCAGCCAGTCCGGGAAATAGCTG
+CCCTGGCGCAGCTTGGGGATCGCGACGTCGATGGTTGCGGCACGGGTGTCGAAATCACGGTGGCGGTAGC
+CGTTGCGCTGATTGGACCGCTCATCGCTGCGTTCGCGGTAGCCCGCCCCGCACAGGGCGTCGGCTTCAGC
+CCCCATCAAGGCGGCGATGAACGTCGAGAGCAGCCCGCGCAGCAGATCCGGGCTCGCCTGTGCGAGTTGG
+TCAGCCAGAAGCTGCTCGGTGTCGATAAGATGAGAAGAGGTCATTGCGTCATTTCCTTCGATTGACTTTT
+GCTGGTCGTTTCGAAGGATCACGCGATGACCGCCCACTACTGGGCTACGACACGCCCACCGGCCTTACCT
+GCCCGTACACCACACCCCTGGACGTAACTCCAGTCGCCGGGTTTCTACGAGTGATTTGGCGCCGAGTCAA
+GCCCCGGGGTTGCCGCCAGTCGACAACCCTGAAGCGCCGGCGATGGTCGCGCTGCCGAGCACCTCGTCAC
+CGGCTGGGTCAGGTCGGTAGAGCACCAGCGTCTGGCCGCGCGCCACGCCGCGCAGCGGGGCATGCAACTG
+CACGAAAAGCGCATCGCCGATCAATTCCGCTACCGCACTGACGGTTTCACCGTGCGCACGCACTTGGACC
+ACGCAGTCAACGGGTCCTGACGGCGCGGCTCCGGCGGTGAAGACGGGAGCGCGCCCAGTCAGCGTTTGCA
+CATCAAGGTCGGTCACGTCACCTACGTGAACGGTGGCGGTGTCGGCGTCGATCGCCGTGACATAGCGCGG
+ACGACCATTCGGGCCCGGCCCGGCGATGCCCAGGCCTCTACGCTGCCCGATGGTGAACCCGTGCACCCCA
+TCATGGGAAGCCAGCACCACACCATCCGCGTCAACCACCACACCACGGCGAACCCCGATGCGCTCACCCA
+AAAAAGCCTTGGTGTTCCCGGACGGTATGAAGCAGATGTCGTGGCTATCCGGCTTGTTGGCGACCGCCAG
+GCCGCGGCGGGCCGCCTCGGCACGGATCTGCCGCTTCGGCGTGTCGCCGATCGGGAACGCGGCGTGGCGC
+AGCTGCTGCGCAGTGAGCACGGCAAGCACATAAGACTGATCCTTGTCCCGGTCGACGGCGCGGCGCAGCC
+GCCCACCCGACAGCCGGGCGTAGTGGCCGGTGGCCACCGTATCGAAACCCAACGCCACAGCCCTGGCGGA
+CAGAGCAGCGAACTTGATCTGCTGATTGCACCGCACGCAAGGGTTCGGAGTTTCCCCGCGGGCATACGAC
+GACACGAAGTCGTTGATCACGTCCTCTTTGAACTTCTCTGCGAAATCCCAAACATAAAACGGGATTCCGA
+GCACATCGGCGACGCGGCGCGCGTCTGCAGCGTCCTCTTTGGAACAACAGCCCCGCGAGCCGGTGCGCAG
+CGTGCCGGGCGCGGTCGATAGCGCCATGTGCACTCCGACCACCTCGTGTCCGGCATCGACCATGCGGGCG
+GCAGCAACAGACGAGTCGACGCCACCGCTCATCGCGGCGAGAACTTTCATCGGGATGCTCCCGCGGCGGC
+TAGGGCGGCCCGCCGTGCACGTGCCACCGCCCCGGGAAGCACCTCCAACGCGGCATCGACATCAGCCTCA
+ACACTGGTGTGCCCCAGCGAGAGACGCAATGATCCGCGGGCGCTGGCCGCGTCGACGCCCATTGCAATCA
+ACACATGCGAGGGCTGCGCTACACCTGCCGTGCAGGCCGATCCGGTTGAGCACTCGATTCCGTTAGCGTC
+CAACAACATCAACAGCGCATCGCCTTCGCAGCCACGGAAAGTGAAGTGCGCGTTACCCGCTAGCCGCATC
+GGGTCATCGGCGCCGTTAAGGCAAACATCGTCAATCTCAGCCAGCACACCCTCGACCAGACGATCCCGCA
+GCAGCCGTAACCGCGCGCTGTTTTCCTCGAGTCCGTCCACCGCGATCTGCGCGGCCGTCGCCATTCCAAC
+TGCACTGGCGACATCGGGTGTGCCGGAACGAATATCGCGCTCCTGCCCACCGCCGTGCATAAGGGGCACG
+CAGGTGACGTCGCGGCGCAGCAGCAACGCACCCACTCCTGGCGGGCCACCGAATTTGTGCCCGGCCACGC
+TCATCGCCGACAGCCCGCTGGCCCCGAAGTCAAGCGGGAGCTGTCCCACCGCCTGAATGGCATCACTGTG
+CATCGGCACGCCGAATTCCATGGCGACAACTGACATTTCGGCGATCGGTAGAATAGTTCCGACCTCGTTG
+TTGGCCCACATCACCGATACCAGCGCGACGTCGTCGTGGCTCTGCAGTGCCTCGCGCAGCGCAGTTGCCG
+ACACCGAGCCGTCGGCGGCGGTCGGCAGCCAGGTCACATGGGCGCCTTCGTGTTCCACGAGCCAGTTCAC
+CGAGTCCAGTACGGCGTGGTGTTCCACCTCGGTGGTGACGATGCGACGGCGGTGCGGCTCCGCATCGCGG
+CGTGCCCAATAGATACCTTTGACAGCCAGGTTGTCGCTTTCGGTGCCGCCCGCGGTGAAGATCACCTCGG
+ACGGACGAGCGCCTAGCTTGTCCGCGATCAGCTCACGGGCCTCCTCGATCCGCCGGCGCGCCGAGCGCCC
+GCTGGTGTGCAGCGACGACGCATTGCCGATGGTGCGCTGCACGGCCGCCATCGCCTCGATGGCGGCGGGG
+TGCATCGGGGTGGTGGCAGCGTGATCCAGGTAGGCCATGACGCACCTAGAATACTGGCCCGGGCGGCGAC
+GCAGAACGTGCGCGCAGGCCACGGCCGCAGCAGCGGCTGGGCAATCTGGCTGGGGCCAGACCACTTAGGT
+CGCCGGCACGTGCCGGCGGCCTGGGCGTTGCCCCGACTGCCCCAAGGCTCCCGCAAGCACCGCTGACTGG
+CAACGGCGCGCGAGATTCCGACGATCGGTACCTGGCAGCTGCAAAGACTCGACGCGCACCCAGGCCAGCG
+TGCGGCGCACGGTCAGCAGCCGGCAAACCGACCGCACCAAGGTGTCGTCGCCGACAAAGGCCGGAGCGGT
+CGAGACGGTGCCGTCGACGTGGTGATATGTCAACCGGAGTGGCTGCACCGGGCGGCCGGCATCGATTGCG
+GCCTGGAACATCGCCGGATAGAAAGCCCCACAACCGCGATGCGAGCACCCGGCTCCTGCTCGGGCCGCTG
+GACGGCCGGCATCGTCGCCCGGCCGACCGCACCAGGTGGTGCCCTCGGGGAAGGCCACCACCGTCTGACC
+GGCGCGCAGCCGACGCGCGATGGTATCGACAACCCCGGGAAGCCGCCGCAGGCTGGCTCGCTCGATCGGA
+ATGATCTTCAGAATGCGCGCCACGATCCCTATAGTCCGTCCGGTGAACATGTCGGCGCGCGCGACGAACG
+ACCCGGGCAACACCGAACCGATGCAGAAGACGTCCAACCAGGACACGTGCCCGCTGACCACCAGGACTCC
+GCGCAGGTTCCGAACTGGACTACCCGACACCGTGATCCGGACACCGAAAAGGCGCAGCACCAACCGGCAG
+TAGATGCGTTGCACCCGCGTTCGGCCCGGCAGTGGCATCACCACCAGCGGCACTCCCGGTACCAGGAGCA
+GAGCCAACATGACGCGAAGCGCTACCCGCAGCACCACCAGCGGCCGCCGCACCTGCGCAGCGTCGCCGAC
+ACTCACGCAGCTGACGCCGCACGTTGCGCGGGGCAACCAGGAGTGTTCGGTGACTGCGGGAGCGCTCATC
+GCGCGTCGTTCACCATTTCCGAGGCCGCCGCAACCGACCGCAGTCGTCGCAGATATCGCGTATCGGCGTG
+GTCCTTATCCAGTAGCAGGCAGAAGTCGCCCACGCCAAAGTCCGGGTCGTGCGCCGGCTCCCCGCAGGCC
+CGCGCGCCCAGTCTCAGGTAACCGCGCATCAGCGGGGGAACTGCTGGCCGTGGCGGAGGGAGAATGTCGT
+CGAGGGACCTCCCGTCCACGCGCACCGGCCGGTAGGGGTACACCTGGCACTGCGGCGGCGCGGCATGCCG
+GTTGAGGATGAAGTCGCGCACCCCACGCAGCCGGCTGCCCGGCGTTTCACCGTCTCCCCCGATTGGTACT
+GACACACATCCGGTCACATAGTCATAGCCGTATCGGTCCAGGTAGGCCAGGATGCCCGCCCACATCAACA
+ACACCACCCCACCGTTGCGGTGACCCTCGCGCACCACGGCGCGGCCCATCTCCACCAACGACGGCCGCAG
+CGGATCGAACGCGCAAACGTCGAATTCCGTTGCGGTGTAGAGTCCTCCGGCGGCGATGGCACCCGCCGGT
+GCCAGCATCCGGTAGCAACCCACCAGCTCACCGGTGTCGTCGTCGCGGACCAGCAGGTGATCGCAGTACT
+CGTCGAACCGGTCGCCATCCCGGCGCGTATCCGCGGCCGCCGGCAGTGCGAAGCCTGGCGTAGTGCTGAA
+CACGTCATAGCGGAGCCGCTGCGCCGCCTCGACCATGCTGGGATCGGTGGATAGCAACAGGGAATAGCGC
+GGTCCGGTTGACGATCCTGTCGCGACGCCATGCGGTTTGTCACTGGGTACCAGCGCAGAAGCGATGCTCA
+TAGCACCAACGTGGCGCAGCCGATCAGCTAATCGGCATCAACGTTGTGACGTGTCGGTGCACGTCAGATG
+ACGAACTGTTGGGCTAGGTGAGCAGGCGCCAAGGCCCCCCACGCCTCGGCGTGTCGGGGTCTTTTGCGAC
+TGCTCGCGCAGGGAACCTAGCCCTTGCGGGCCTTGATGACCTCGGTCAGCTGCGGAGCGACCTTGAACAG
+GTCTCCCACCACCCCGTAGTCGGCGATCTCAAAGATCGGCGCCTCTTCGTCCTTGTTGACCGCGACGATG
+GTCTTGGACGTCTGCATGCCAGCGCGGTGCTGGATCGCCCCGGAGATGCCCAGGGCAATGTAGAGCTGGG
+GCGACACCGTCTTGCCGGTCTGGCCGACCTGGAACTGGCCCGGGTAGTAGCCGGAGTCGACTGCGGCACG
+CGAGGCCCCGACCGCGGCGCCCAGCGAGTCGGCCAGCGCCTCGACCACGCTGAAGTTCTCCGCGCTGCCG
+ACACCACGGCCACCGGCCACCACAATGGTCGCCTCGGTCAGCTCCGGCCGGTCGCCGGCGACCGCCGGTT
+CGCGCGCGGTGATCCTGGCGGCGTTCTCCGCCGCAGCCGGCACTTCCACGCTGACCTGCTCACCGGCGCC
+GGCGGCCGGCTCCGCCTCCACGGCTCCTGCGCGCACGGTGATCACCGGGGTGTCGCCGTTGGCCTGCGCT
+TCGACGGTGAACGCCCCACCGAAGATGCTGTGGACACCCACTCCACCTTCTCTCACGTCGACCACGTCGA
+CCAGCAGACCCGAGCCGATCCGAGCCGCAAGTCGGCCGGCGATCTCCTTGCCGTCCGCGGTGGCGGCGAT
+TAGTACGCCGGCAGGGGCCGAGGACTCGGCCAGCCCGGCCAGCACGTCGACCGCCGGGGTGATCAGGTAT
+TTGTCGACAAGGTCGGACTCGGCGACGTAGATCTTGGCGGCACCAGCCGCCTTAAGCCCGTCCACCAGCG
+GCGCGGCCGTCCCCGGCACACCGACGACGACGGCGGCTGGTTCGCCCAAGGCGCGGGCGGCGGTGATCAA
+TTCGGCGCTGACCTTCTTTAACGCGCCTTCAGCGTGCTCAACGAGCACCAGTACTTCAGCCATGGGTTAT
+ATCGCTCTCGTCTTTGGGAGGTGCGTATGTCTTAGATGATTTTCTGGGCAACCAGGTACTGCACGATCTG
+GTTGCCGCCTTCACCCTCGTCGGTGACCTTCTCCCCGGCAGTCTTGGCCGGTTTGGGCGTCGACGCCAGC
+ACGGTGGATCCGGCGTTGGCCAGCCCCACCTCGTCGCTCTCGACACCGATCTCGGCCAGGGTCAGCACGG
+TAACTTCCTTCTTCTTGGCGGCCATGATGCCTTTGAAGGACGGGAAGCGCGGCTCGTTGATCTTCTCGTT
+CACGCTGATCACCGCGGGCAGCGTGGCCTCGAGGGTGAATACGCCCTCATCGGTCTCACGCTCGCCGGTG
+ATCTTGCCGCCCTCGATCGACACTTTGCGCAGGTGGGTGAGCTGCGGCAGGCCCAGGTACTCGGCGATGA
+TGGCCGGCACCGCACCGCCCACCCCGTCGGTCGATTCGTTGCCTGCGATCACCAGCTCGGTGCCCTCGAT
+GGTGCCCAACGCGCGCGCCAAAGCCCACCCGGTTTGGATGACGTCCGAGCCGTGCATGCCGTCGTCCTTT
+AGGTGGACGGCCTTGTCGGCACCCATCGACAGCGCCTTGCGGATCGCCTCGGTGGCGCGCTCGGGGCCCG
+CCGTCAGCACGGTCACCGACCCTTCGATGCCGTCGGCGGCCTCTTTCTCCCGAATCTGTAGCGCTTCCTC
+CACGGCGCGCTCGTTGATCTCGTCCAGCACCGCGTCGGCGGCCTCGCGGTCCAGCGTGAAATCGCCGTCG
+GTCAGCTTGCGCTCCGACCAGGTATCTGGGACCTGCTTGATCAGGACCACGATGTTCGTCATGACTGTGG
+TTCGTCCTCCTCGAAGGCGGCCCGCAGCGCTCGACTGCGGAACCTCGGTCACACGTTTTGCAACCGCACA
+GCGATATTACTATTCGGTAAGTTCGCGTGGTGCGCCCTCACACCATAGCGGGTGGTAGAGCAGGTTCCCA
+CGCCTGTGCCTCGCCCACGACCGGCGGATACTCCCGGTGCCCGGTTCGCGAATCCGATGCCACGGGTTAG
+CCTGCCTTAACAATGTGCGCATTCGTTCCCCACGTTCCCCGCCATAGCCGAGGCGACAACCCGCCGTCGG
+CCTCCACGGCTAGCCCTGCGGTGTTGACGCTGACCGGCGAGCGCACCATCCCCGATCTGGACATCGAGAA
+CTACTGGTTTCGCCGCCACCAGGTCGTCTACCAGCGGCTGGCACCCCGCTGCACGGCCCGCGACGTGCTG
+GAAGCCGGCTGCGGCGAGGGATATGGCGCCGACCTGATCGCCTGCGTCGCTCGCCAGGTCATCGCGGTGG
+ACTACGACGAGACTGCGGTGGCCCATGTCCGGAGCCGCTATCCCCGAGTGGAGGTGATGCAAGCAAACCT
+GGCCGAGCTGCCATTGCCCGACGCGTCGGTAGACGTCGTGGTCAACTTCCAGGTCATCGAGCATCTGTGG
+GATCAAGCCCGATTCGTTCGCGAGTGCGCCCGGGTACTGCGGGGCTCGGGACTGTTGATGGTGTCCACCC
+CCAACCGGATCACCTTTTCCCCCGGCCGCGATACCCCGATCAACCCATTCCACACCCGCGAGCTCAATGC
+CGACGAGCTCACTTCGCTGTTGATCGACGCGGGATTCGTCGATGTGGCCATGTGCGGGTTGTTTCATGGC
+CCACGCCTGCGCGACATGGACGCCCGCCACGGCGGCTCCATCATCGACGCACAGATCATGCGGGCGGTGG
+CCGGCGCACCGTGGCCACCCGAGCTAGCCGCAGACGTCGCGGCGGTCACCACCGCCGACTTCGAGATGGT
+GGCAGCGGGTCACGACCGTGACATCGATGACAGCCTGGATCTGATCGCGATCGCGGTGCGGCCTTGAACA
+CGTCCGCAAGCCCGGTGCCCGGCCTGTTCACGCTTGTTCTGCACACTCACCTGCCCTGGCTGGCCCACCA
+CGGGCGCTGGCCGGTCGGCGAGGAATGGCTCTATCAGTCGTGGGCGGCGGCCTACCTGCCGCTGCTGCAG
+GTGCTGGCCGCGCTGGCCGACGAGAACCGGCACCGGTTGATCACCCTCGGGATGACGCCGGTGGTCAACG
+CCCAGCTCGACGACCCATACTGCCTCAACGGTGTGCATCACTGGCTAGCCAACTGGCAGCTGCGCGCCGA
+AGAGGCCGCCAGCGTGCGGTATGCCCGTCAGTCGAAGTCGGCTGACTATCCGTCATGCACACCGGAGGCG
+TTGCGGGCCTTTGGGATTCGCGAATGTGCCGATGCAGCTCGCGCGCTCGACAACTTCGCCACGCGGTGGC
+GGCACGGCGGCAGCCCACTGCTGCGCGGCCTGATCGACGCCGGCACGGTGGAGCTGCTCGGTGGCCCACT
+TGCCCACCCGTTCCAGCCGCTGCTGGCACCGCGGCTGCGCGAGTTCGCGCTGCGCGAAGGCCTCGCCGAT
+GCTCAGCTGCGGCTGGCGCACCGCCCGAAAGGGATCTGGGCACCCGAATGCGCATACGCCCCGGGGATGG
+AGGTCGACTACGCCACCGCGGGGGTCAGTCACTTCATGGTCGACGGCCCGTCGCTGCACGGCGACACCGC
+GCTGGGCCGGCCGGTGGGGAAAACCGATGTGGTCGCCTTCGGTCGCGACTTGCAGGTCAGCTACCGGGTG
+TGGTCACCGAAATCCGGCTACCCCGGGCACGCCGCCTACCGCGACTTCCACACCTACGACCACCTGACCG
+GACTCAAACCGGCCAGGGTCACCGGGCGTAACGTGCCGTCGGAGCAAAAGGCACCCTACGATCCCGAGCG
+CGCTGACCGCGCCGTCGACGTCCATGTTGCCGATTTCGTCGACGTGGTGCGCAATCGGCTGCTCTCCGAG
+TCCGAGCGCATCGGCCGGCCCGCCCACGTGATCGCCGCCTTCGACACCGAGTTGTTCGGCCACTGGTGGT
+ACGAGGGCCCAACCTGGCTGCAACGGGTATTGCGGGCTTTACCCGCCGCCGGTGTCCGGGTGGGCACCCT
+GAGCGATGCGATCGCCGACGGATTCGTCGGCGACCCGGTCGAATTGCCACCCAGCTCTTGGGGTTCCGGC
+AAGGACTGGCAGGTGTGGAGCGGTGCCAAGGTGGCCGATCTGGTCCAGCTCAACAGCGAAGTGGTCGATA
+CCGCGTTGACCACCATCGACAAGGCGCTGGCCCAGACAGCGTCCCTGGACGGACCGCTGCCTCGCGATCA
+CGTTGCTGATCAGATCCTGCGCGAGACCCTGCTCACCGTGTCCAGCGACTGGCCGTTCATGGTGAGCAAG
+GACTCCGCCGCCGACTACGCCCGCTATCGTGCTCACCTGCACGCACACGCCACCCGGGAGATCGCCGGCG
+CGCTGGCCGCGGGCCGACGCGACACCGCACGGCGGCTCGCCGAAGGGTGGAACCGCGCCGACGGTCTGTT
+CGGCGCCCTGGACGCTCGGAGGCTGCCCAAGTGAACGCCTCGCACAGGCGGAACCGGCCGCGCGCATGAG
+GATCCTCATGGTGTCGTGGGAGTACCCGCCGGTGGTGATCGGCGGACTCGGCCGCCACGTGCATCATCTG
+TCGACCGCGCTAGCCGCAGCCGGTCACGATGTCGTCGTGTTGTCCCGGTGTCCGTCGGGCACCGATCCCA
+GCACACACCCATCCTCCGATGAGGTGACCGAAGGGGTCCGGGTGATTGCGGCCGCGCAGGACCCGCACGA
+GTTCACGTTTGGCAACGACATGATGGCCTGGACCCTGGCGATGGGCCACGCCATGATCCGCGCCGGGCTG
+CGCTTGAAGAAACTTGGCACCGACCGCTCGTGGCGTCCTGACGTCGTGCACGCACACGACTGGCTGGTGG
+CCCATCCGGCCATCGCCCTTGCCCAGTTCTATGACGTGCCAATGGTTTCCACGATTCATGCAACGGAGGC
+CGGTCGACATTCCGGCTGGGTCTCCGGAGCTCTCAGCCGTCAGGTGCACGCGGTCGAGTCGTGGCTGGTG
+CGTGAATCCGATTCGCTGATCACATGCTCGGCGTCGATGAACGACGAGATCACCGAGCTGTTCGGGCCCG
+GGCTGGCCGAGATCACCGTGATCCGTAACGGCATTGACGCGGCGCGCTGGCCGTTCGCGGCCCGCCGCCC
+GCGCACCGGGCCAGCCGAATTGCTCTATGTGGGGCGGCTGGAGTACGAGAAGGGCGTGCACGACGCCATC
+GCCGCGCTGCCGCGGCTCAGGCGCACTCACCCAGGCACCACACTGACCATCGCCGGCGAAGGCACCCAGC
+AGGATTGGTTGATCGATCAGGCCCGCAAACACCGGGTGCTCAGAGCAACCAGGTTCGTCGGACACCTCGA
+CCACACCGAGCTGCTGGCGTTGCTGCACCGAGCCGACGCCGCGGTGCTGCCCAGCCACTACGAACCGTTT
+GGGCTGGTGGCACTGGAGGCCGCCGCGGCCGGCACCCCGCTGGTGACGTCCAACATCGGCGGTCTGGGTG
+AAGCGGTCATCAATGGACAGACCGGGGTGTCGTGTGCACCCCGCGACGTAGCGGGGCTGGCCGCCGCGGT
+GCGTAGCGTGCTCGACGATCCGGCCGCCGCGCAGCGGCGCGCACGAGCCGCCCGGCAACGGCTCACCTCC
+GACTTCGACTGGCAGACGGTGGCCACCGCGACCGCGCAGGTGTACCTGGCGGCGAAGCGCGGTGAACGGC
+AGCCGCAGCCCCGGTTGCCCATCGTCGAGCACGCTCTTCCCGATCGGTAGCCGTGGCAGGGACGTGATGA
+TCGGAGCACCGCAGTGAAACCGCAGGACCAGGGGCTCCACTTCCCCTATCGCTACGACCTTCGACTGGCG
+CCTATGTGGCTACCGTTTCGATGGCCGGGCAGCCAAGGCGTGACCGTGACCGAGGATGGCCGCTTCGTCG
+CACGCTACGGGCCGTTTCGCGTCGAGGCGCCACTGTCTAGCGTCCGCGATGCGCACATCACCGGCCCATA
+CCGATGGTGGACAGCGGTGGGCCCCCGACTGTCGATGGTCGACGACGGACTCACGTTCGGAACCAACGCA
+GCTGCCGGTGTCTGCATCCACTTCGAGCCGCGGATCCACCGCGTGATTGGACTGCGGGACCATTCGGCGC
+TGACAGTGACCGTTGCGGACCCCGAAGGGCTGGTCGCCGCGCTCAGCAGCTAGTTCGCCGAGCGCCCCGT
+GCTGGGCACAACCCGACTCGGCCTGGAGGCGCCTGCATCCAAGCCGCACCGGCGCACAATTATCTGCCGG
+AGGTCAACCCCCTTTATCGATTCGGTATCGAAGACGCCGTTTGACATGCCATGATCGGCGAATTCGCAGT
+TTCAGATGCCAGGGAGGCGACATGGCTCACTCGATCGTTCGCACGCTGCTGGCCTCAGGTGCCGCCACGG
+CCCTGATCGCCATTCCCACAGCCTGCTCGTTTTCGATCGGAACGTCGCACTCGCACTCGGTGAGCAAGGC
+CGAGGTCGCCCGGCAGATCACCGCCAAGATGACAGACGCCGCCGGCAACAAGCCCGAATCGGTGACGTGC
+CCAAGCGATCTCCCGGCAGAGGTCGGGGCCGAGCTGAATTGCGAAATGAAGATCAAGGACCGCACGTTCA
+ACGTCAACGTCACCGTGACCAGTGTCGACGGTAGCGACGTCAAGTTCGACATGGTGGAGACCGTCGACAA
+GAACCAGGTTGCCAACATCATCAGCGACAAACTGTTCCAGCGGGTGGGCGCCAGGCCCGATTCGGTGACC
+TGCCCCGACAATCTAAAGGGCGTCGAGGGAGCCAAACTGCGGTGTCGACTGACCGACGGCAGCAAAACGT
+ATGGCATCTCGGTGATTGTCACCAGCGTTGACGCCGGCGATGTCAACTTCGATTTCAAGGTCGATGACCA
+CCCCGAGTAGGCTCACCGTGGAATCGGCTGCCCGGCAGCCAATTTCGCGTACCCGATGTGGATGGTCGCC
+GGAGCACCATCGGCTTTAGGGTGCTCGGGGCTAGCGGGCCGCCTTCTTGCGTTCGATGTCGGCCAAGGCA
+GCGGCTAGCTCAGCGCGCTGCGCGGCCGATGCCTCCCAGGACAGCTGGCGGTTCTTGACCACCTTGGCCG
+GCGCCCCGACCGCGATCGAATAGTCGGGAATTGCGCCGCGGACCACCGCGTGCGAGCCGAGCACGCAGCC
+CCGTCCGATGGTGGTGCCGCGCAGCACGCTCACCTTCACGCCGATCCAGGTGTCGGGCCCGATCCGCACC
+GGACTCTTGATGATGCCCTGGTCTTTGATCGGCAGCGTGATGTCGTCCATCCGGTGGTCGAAATCGCAGA
+TATAGCACCAGTCGGCCATTAGCACCGAGTCCCCGATCTCGATGTCGAGATAGGTGTTGATGACGTTGTC
+CCGGCCCAGCACCACCTTGTCGCCGAACCGCAGCGAGCCCTCGTGGGCACGGATCGTGTTCTTGTCCCCG
+ATGTGCACCCAGCGGCCGATCTCCAGTTGCGCTAGTTCCGGTGTCGCGTGGATCTCCACACCCTTGCCGA
+GAAACACCATGCCGCGGGTGATGATGTGCGGGTTGGCCAGCTTGAACCTCAACAGCCGCCAGTAGCGCAC
+CAGGTACCACGGAGTGTAGGCGCGGTTGGCAAGCACCCATTTCAGCGATGCCAGCGTGAGGAACTTGGCC
+TGACGTGGGTCGCGCAGCCGCGATCCTCGCCACCTGCGGTGAAGCGGAGCACCCCACATGGTTGTCATTG
+GCGCAGAGCTTAGCTTAGCTGTCGGACCTGTTTGGGCGTATCGGCGCATCTGAGAATGCGCATCGGCGCG
+CGAGGTGACGCCGGTGGCCGCCCCCGCGGGGGCGGTGATCGGCACCCGGCCCCACACCACACCCGATGAC
+GAGCCCAAACTGAGGACGTTCACGACACTTACACCACGTACACGACACGCCCACGGACAACCGGGAACCG
+CCACCGGCCAAGGACGCGAGGAACCGAATCTCGCCCGCCTTGCCAGAATGTACGTGGTGACCCGAGCCGG
+GCAACCATTACACAGTTGGCCAGCACTGACCAACTTCATTTGTAGCGGTTACCCTCACCTGTACTCATTC
+GGCCGGGCCCGCCGATGAGCGACCCACGTAGCGGAAGGATCTGGGAACCTGCGAAAGGATAAGGCGCTTG
+CGCGACGCCTTCCGGCGGCCGTTGCGGCCGCCGTAATCGCGGTCGAGCTGGGCGGTTGCGGAAGTGCCGA
+CTCGTGGGTAGAAGCGGCCCCCGCACAAGGCTGGCCCGCACAATACGGCGACGCCGCCAACAGCAGCTAC
+ACCACGACGAATGGCGCCACCAATCTCACGCTGCGGTGGACGCGTTCGGTCAAAGGAAGCTTGGCTGCCG
+GACCAGCCCTGAGCGCACGCGGGTACCTCGCGTTAAACGGGCAGACCCCGGCCGGGTGTTCGCTGATGGA
+GTGGCAGAACGACAACAACGGCCGGCAGCGCTGGTGTGTGCGGCTGGTCCAGGGCGGCGGCTTCGCCGGC
+CCGTTGTTCGACGGCTTCGACAACCTCTACGTCGGCCAGCCGGGAGCGATAATCTCCTTTCCGCCGACCC
+AGTGGACGCGCTGGCGCCAGCCCGTGATCGGGATGCCGTCCACCCCGCGGTTTCTGGGGCATGGCCGCCT
+GCTCGTGAGTACACACCTGGGGCAGCTGCTGGTATTCGATACCCGCCGCGGCATGGTGGTCGGCAGTCCG
+GTGGACCTGGTGGACGGCATCGATCCCACCGATGCGACACGCGGACTGGCCGACTGCGCGCCAGCCCGGC
+CGGGCTGCCCGGTCGCGGCCGCCCCTGCGTTCTCGTCGGTCAACGGCACGGTGGTGGTCAGCGTCTGGCA
+GCCGGGCGAACCGGCCGCGAAGCTGGTCGGGCTGAAATACCACGCTGAGCAACTCGTCCGCGAGTGGACC
+AGTGACGCTGTCAGCGCGGGCGTGCTGGCCAGCCCAGTGCTCTCCGCCGACGGATCGACGGTCTACGTCA
+ATGGGCGCGACCACCGGCTATGGGCACTCAACGCCGCCGACGGGAAAGCGAAGTGGTCAGCTCCCCTGGG
+CTTTCTGGCGCAGACGCCGCCCGCACTGACCCCACATGGACTGATCGTGTCCGGCGGGGGCCCCGACACC
+GCGCTGGCGGCGTTCCGGGATGCCGGTGATCACGCCGAGGGGGCCTGGCGACGCGACGACGTTACTGCGC
+TGTCGACCGCGAGTCTGGCCGGCACCGGCGTCGGCTATACGGTCATCAGCGGTCCAAACCACGATGGCAC
+GCCCGGTTTGTCGTTGCTGGTCTTCGATCCGGCCAACGGCCACACGGTCAACAGCTATCCGCTACCCGGA
+GCGACCGGATATCCCGTCGGTGTATCGGTCGGCAACGACCGCCGCGTGGTGACCGCCACCAGCGACGGCC
+AGGTCTACAGCTTCGCACCTTAGATTGCCAGCGGCGGAATGGCGCTGCGCGGCACCTGGGCTTGGCAAGC
+GCCGACAAACGACGGCAGCAGCTCACCCTGGGCGAAGTAGAAAATCAGACTGTCGTCGGTGATAGCAAAG
+TTCTGGTAGTGAGCCGGGTCGAGGCCGGTCGAAGGCAATATCGCGGCACCGAAACCGGTCTGACGTGCCA
+GCTCGCGCTGAACGATGGGGTAGATGCTGTCCAGTGGCGTGGTGCCGGGCACGAACAACGTGTCGAAGGT
+GATGGGCTGCGAGGTCGCGAGGTTGTAGTTGAAGGCCTTGTACCAGGTGGACGGATGTGCCCCACCGAGG
+TCCTGGAAGAATTTGAGCACTACGCTGCGGGTGGCCTGCGGCGGCTGGCCGGAGCTGTGCTGTTCGCTGG
+TGGCGTCCATTTGGTAGGGCTGGTCTCGCAGCGGGGACCCCTGCGCGACGTTGACGAACCCGTCGCGGTT
+TTGCGTGATGTAGTCGGTCAGCGCCCGCTGGTCGGGATAGTCGACAGGAAATGTCATATCCAGCATGTAC
+TTAGGGCCCGAGGCGTGCACATGGCAGATCTGGCCGGCCTGCACAGTGCCGCCCAGGCCGGCGCATGACG
+GCGGCGCACCAGCCGCCGGCCAGCCCACCAGGACCACAGCAACGAGCACTGCGGTCGCTATCAGATAACG
+CATCGTCTAATCGTCCTCGCAGACCAAAGGCGTTGGCGCAGCTTAGGGGTGACCGCCGCCAGCCTACCCG
+TGCCGCTACCGGGACGGCCGACACACATAGGCGGTCACATGGCTCAAGGACCCGGCACCAATGCGGGTGA
+TGACCACCGCCAGCGGTCTGCTGCCCCGCAGCCGGAGCCGTCGCCGCAGAGCGTCGGGATCGATCGCAAC
+GCCGCGCACCAGGATTTCGGCTGCCCCGCAATCCAGCGCTGACAGCACCTGACGCAGCCGACGCTCGTCG
+AAGGCCAGCTGCTCGAGCACCTCGAACCCGCGCAACGCAGGCGGCAGCCGGTCACCGGACAGGTAAGCGA
+TTTGGGGATCGAGCTGCCACAGCCCATGCCGGGCGCCGTAGTTGCGTACCAGGCCGGCACGGACGACGGC
+GCCGTCGGGGTCGACGATCCATTTCCCGGCGGGCCGCACACCGCAGTCGTCGGGCTCGTCGTCACCGATT
+TGTTCACCGGAATCGAGGATGCTGGCTCGACGGCGGATACCCGATCCGGCCAACCCGGCCGACCAAAGAC
+ATGCTTCTCGAACCCCACCGCGGTATGAGATCACCTCGATCTCGCCCTCGAAACCGAGCCGGCCCACCTC
+CTCGAAATCTATTCCGGGAGCGCACTTGACGACCACATCACGGCCGCGGTAGCGGTCCAGTAGGGGGCCC
+AGGCCGGGCTGGTAGTCGGCGAGGTGGAAGCGTCGCCGCCCGTTGCTGCGACGCGCCGGGTCGATGACGA
+CGACCGCGTCGCGGGTCACCGGATGCAGCACATCGGCGCGGCACAGGTCAGCTTCCATTCCCAGGGCGGC
+CAGGTTGTGGCGCGCCATGGCCAGCCGCACCGGGTCGATATCGCTGCCGACCGCCCGGACAGCTAGCTCG
+CGCAGCGCGGCCAGCTCGGTGCCGATGGAGCAGGTCGCGTCGTGCACTACCCGACCGGCCAGTCGCCTGG
+CCCGGTGCCGGGCCACGGGTGCTGCGGTAGCCTGCTGCAGCGCCTCATCGGTGAATAGCCATTGCGACAC
+CCCAACGTTCGGACACAGCTCGCCCAGTTTGCCGGCGGCGCGGCGGCGCAGCAGCGTGGTCTCCACCAGC
+CACGGCGCCCGAGCGCCAAACCGGGCGCGCACCGCGGCGGTGTCGGCAATGCGAGTGGCAGCGGTCAGCT
+CGAGCTCTGCGACCGCGGCCAGCGCAACCGCACCCGATTCTGACCGCAGATAGCTGACGTCGGCGGTGGT
+GAACGTGAGACCAGTGAAGCCGCTGGTCAGGACGGCTTAACCCCGGTAATCATCACGTTGTAGAACCAGC
+CCTTCGGCACCACATGCCGCCAGACGTTGGCGTCCACCCAGCCCAGAGTCTTCCAGCTGGTGAAGGCGAA
+GCGCGCCCAACCCCAGCCCAGCCGCCCTGGCGGCACCGTGCACTCAAACGTGCGCAACGGCCAACCCAGC
+ATCGCCGCGGTGAACTCCTCGGTGGCGGTTTGGACCTCGACTGCACCCGCGTTGTGCGCGATCCGCTGCA
+GGTCCTGGGGCGTGAATGTGTGCAGGTCGACCAGGGCCTCCAGCGCCGCGGCGCGCGAGGACTCATCGAG
+CTCGCCTTGTGGTCGGCGCCAGCCTCTCAGGCCGGGCAGCTTGGTAGCGTTGGTGACGACACGCCAGGTC
+AGCGTGGACAGTGTGCGAGCGTAGCCGTCGCCGACGGTGGTCGGCTCGCCGGCGAACACGAAGCGCCCGC
+CCGGCTTGAGTACCCGAACCACCTCCCGCAACGACAGCTCGACGTCGGGAATGTGGTGCAGCACCGCATG
+CCCGACCACGAGGTCGAAAGCGTCGTCGTCGTACGGGATGCCCTCGGCGTCGGCGACCCGGCCGTCGATG
+TCTAGCCCCAGCGCTTGCCCATTGCGGGTGGCGACCTTGACCATGCCGGGTGAGAGGTCGGTGACCGATC
+CACGCCGGGCAACGCCAGCCTGGATCAAGTTGAGCAGGAAGAATCCGGTTCCACAGCCCAGTTCCAGTGC
+GCGGTCGTAGGGCAGCTGCGCGATGACCTCATCAGGCACGATCGCGTCGAACCGGCCGCGGGCGTAGTCG
+ACGCAACGCTGGTCATAAGAGATCGACCACTTCTCGTCGTAGTTCTCGGCTTCCCAGTCGTGGTAGAGCA
+CCTGGGCGAGCTTGCTGTCGTGCCGAGCTGCGGCCACCTGCTCGGCCGTGGCATGTGGATTGGGAGTGGC
+GTCGGCGGGGATGTTTGAACTCCTCGTCATATAGGCGAGCCTAACGGCCGCCCCGGTCACCCTTGCTGCC
+ACCACCTTGACCAGCGGCGAACACCTCGACATAGCGCCGACGCTCAGCGGCGATCCGCTCGGCCGGCGCC
+AGCTCGTAGACGTCGCTGATCCCGGCTTTGGCCGCGGCCAGCGCGTGCGGCGGGCCGTCAAGAAAGCGCC
+TCGCCCAGGCCGCCGCGGCGTCGTAAACGTCGTCGGGGGCCACCATGTCGTCGATCAGGCCCAGCGCCAA
+GGCCTCCTCGGCGTCGAAGAAGCGCCCGCTGAACACCAGCTCCTTGGCTCTGCTCGGACCGGCCGCACGG
+GTCAGCCGGGCCATTCCGTCGCCGCTGGGGATCAGGCCGGCCAGGATCTCGGTCGCGCCGAATTTCACGT
+TGTCACCGCTGACTCGCCAATCGGCGGCTAGGGCCAGCGTAAGGCCGGCACCCAACGCGTATCCGGTGAT
+GGCGGCCACGGTCGGCTTGGGGATCGCCGCAACGGCGTCGACGGCCTGCTGCCGAATCCGGGCGGCGGTG
+TCGGCCTCCTGCGCGCTCAATGTCCGCAGTTCGGGCATGTCGTCGCCGGCGGAGAAGATTTCGTGGCCGC
+CATACAGGATCACTGCGGCCACGTCGTCGCGTCGCCCCAGCTCGTTGGCCGCGGCGACCACTTCCCGGTA
+GACCTGGCGGGTCATCGCGTTGGTAGGCGGTCGCGATAGGAGCAACATGGCCAGGCCGGCATCCTGGGAG
+CCGTCACTGACCACGACGTTGACGAACTCGGGCACCGTTGGCGTCACAGCGGCCACCCGGTCGATCCGCC
+CGATCTCCGGGCCTGGTTATAGCGGTCGGAATCGAAGAACTCGATCTCCCAGTTGTCGCCGTTGCGGGCC
+AGCTGTGGCTGCACCGGGACGATTTGGCGTTCGACGGCCAGCACGTCGGCAACGGTATGACCGGCCAGCG
+AGTCCAGTTGCGTCCAGGTCGGCGGCAGCAAGAAGTTGCGGCCGGCGGCGAAGTCGGCGATAGCGTCGGC
+TGGCAACACCCAACCAGCCCGGTCGGATTCGGTGTTCTCGCCGTCGGCGCGCTGACCTTCAGGTAGGGCA
+CCCACAAAGAAGTAGGTGTCGTAGCGCCGGGTCAGTTCGGCCTCCGGGGTGACCCAGTTGGCCCAGGGCC
+GTAGCAGGTCGGATCGCAGCACCAGCTTTTCCCGCTGCAGGAAGTCCGCGAAGGACAGCGTCCGGTCGGC
+CAGTGCGCGACGCGCGTCGCCGTACACCGAGGCATCCGAGACGATGCTGTTCGGTGCCGAATGGTCCTGA
+TCGACCGGCCCGGCGAATAGCACCCCCGACTCCTCGAACGTCTCGCGGGCCGCCGCGCAGACCAAGGCTT
+CGGCGAGATCAGGCTCGATGCCGAACCGCTGCGCCCACCACTGCGGCGGCGGACCGGCCCATGCCCCCAG
+CCGGCCCAAGTCGGCGTCGCGGTCGCGGTCGTCGACTCCCCCGCCGGGAAACACCATTACCCCGGCGGCG
+AAATCCATCGCAGCGTGCCGCCGCATCAAGAAGACGGCCAGACCGGACGCTGATCCGGCGTCCGGGTCGC
+GGACCAACATCACGGTCGCCGCCGGCCTCGGTGTAGGCGGGGGTACCAGTGGCTCGCGAGGTGAATTCAT
+GACTGTCTCCGATGGGCTGCTCGGCTGCGACGCCGTCGGGCGAAATATCGCCCGTCGGCCACCTCCAGCG
+TGATCTCCTGGCCAAACGCGGTGGACAGGTTCTCGGCGGTCAGCGCGTCGGGAAGCAAGCCCGCGGCAAC
+CACCCGGGCCTCCGACAGCAGCAGGCAATGGCTGAAGCCGGGCGGAATCTCCTCGACGTGGTGGGTGACC
+AGAACCAGCGCGGGCGCGTCAGGGTCGGCTGCCAGGTCGGCCAGCCGGGCGACCAATTCCTCTCGGCCAC
+CTAAGTCCAGGCCGGCGGCGGGTTCGTCGAGCAGCAGCAGCTCTGGATCTGTCATCAAAGCCCGCGCAAT
+CAGCACTCGCTTGCGCTCGCCCTCCGACAGTGTTCCGTATGTGCGGTTGGCCAAATGCTCAGCGCCCAGG
+CTCTCCAGCATGTCGATCGCGCGGTGGTAGTCGACGGCCTCGTAGCGCTCGCGCCACCGGCCCAACACTG
+CATAGCCGGCGGAGACGACAAGATCGCGGACGCGTTCGTCGCCGGGCACCCGCTCCGCCAGCGCCGAGGA
+ACTGAGCCCGACCCGAGCACGCAGTTCCGAGACGTCAACCCGGCCTAGCCGCTCACCGAGCACAAAGGCC
+ACCCCCGACGACGGATGCTCAGCCGCGGCGGCAATGCGCAGCAATGACGTCTTGCCGGCCCCGTTGGGGC
+CGACGATCACCCAGCGTTCGTCGAGTTCGACCGCCCAATCCAGCGGGCCGACCAGCGTGCGCCCATTACG
+GCGCAGGGACACGTTTCGGAAGTCGATCAGCAGGTCGGGGTCGGCCGCATCAGGGCCGCCGTTGTCGAGC
+ACCCGACTATCGTGCCGCATGCTCCGCGAGCAACCTAGTCGGCCGGGATTTCGACGCGACGCACCCCACA
+GTCGCCGGCGTCGGCGGCCTCGATCTCACCGCGAGTCACGCCCAACAAGAACAACACCGTGTCCAGGTAC
+GGATGGCTCAACGACGCATCGGCGACCTCACGCAACGCCGGCTTGGCGTTGAATGCTATTCCCAGCCCGG
+CCGCGCCCAGCATGTCGATATCGTTGGCGCCGTCGCCGACCGCGACGGTCTGCTCCATCGGCACCCCATA
+CTGGCTCGCGAAGTCCCGAAGCGCCTTGGCCTTGCCGGGCCGGTCAACAATCGGCCCCACGACCCGGCCG
+GTAAGAATGCCATCGACGATTTCCAGCTCGTTGGACGCAACGAAATCCAACATCAACTCGCGTGCGAGCG
+GCTCGATGATCCGCCGAAAGCCGCCGGAAACCACACCGCAGCGAAAACCCAGACGCCGCAAGGTCCGGAT
+CGTGGTCCGAGCACCGGGCATCAGTTCGAGCTGCTCGGCGACGTCGTCTATCACCGTCGCGGGCAGCCCC
+GCCAAGGTGGCAACACGACGCTGCAGCGACTCGGCGAAGTCCAGCTCACCACGCATCGCGGCCTCGGTGA
+TCGCGGCGACCTGTCCCTGGGCACCCGCACGGGCTGCCAGCATCTCGATGACCTCGCCTTGGACCAGAGT
+GGAGTCGACGTCGAAGACGATCAGGCGTTTGGTGCGCCAAGCCAAGCCGTAGTCCTCGACGGCCACATCG
+ACATGCTCTTCGGCGGCCACCTTGGTCAGGGCGATCTGCAGCGGACCCACGCATCCAGGCGGCACCGAGA
+CCCGCAACTCCAGGCCGGTGACCGGGTAGTCGGAAATGCCGCGGATGAAGTCGATGTTGACGCCGAGTGC
+GGCCACTTCCCTGGCCACCGCGCTGAACGCTCCGGCGGTAATCGGGCGTCCCAGCACGAAAATGGTGTGG
+GTGGACGGTTGCCGAATGATTGGCAGATCGTCGCTGCGCTCGATGGCGACGTCTAGACCCACCCCGTGGA
+TGGCGGACGCGACGTCGTCGCGCAGCGCGGTACCGTCGGCAACGTCCAGCGGGCACGACACCAGCACACC
+CAGCGTGAGCCGGCCCCGGATCACCACTTGTTCGACGTTGAGCAGCTCGACTCCGTGCTGCGCGAGCACC
+TCGAAGAGCGCGGATGTCACGCCTGGCTGATCCATGCCGGTGACCGTGATCAGCACCGACACCTTGGCTG
+GCATGCTCACCTTCAGATGGGGCCCAACCGGTACGGCCCCATCAGCTCGAAGTCACCATGGCGGGCTCGT
+CATGATGACGCCCGACGTGGGCCTCGGCGCGAAGGCGTTCCACCATATGCGGGTAGTGCAGTTCGAACGC
+GGGACGCTCGGAGCGGATGCGAGGCAGCTCGGTGAAGTTGTGCCGCGGCGGCGGACAACTTGTCGCCCAC
+TCCAGCGAATTCCCGTACCCCCACGGGTCGTCGACGGTGACCACCTCGCCGTAGCGCCAGCTCTTGAAGA
+CGTTCCACACGAACGGGAACATCGACGCACCCAGGATGAAGGCCCCGATCGTCGAGACGACGTTGAGACC
+CTGGAAGCCGTCGGTGGGTAGGTAGTCGGCGTAGCGACGCGGCATACCCTCGTCGCCCAACCAGTGCTGC
+ACCAGGAACGTGGTGTGAAAACCGATGAACGTCAACCAGAAGTGCAGTTTGCCCAACCGCTCGTCGAGCA
+GCCGGCCGGTCATCTTGGGGAACCAGAAATAGATGCCGGCGAAGGTGGCGAACACGATCGTGCCGAACAG
+CACGTAGTGAAAGTGTGCAACCACGAAATAGCTATCGGTGACGTGGAAGTCCAGCGGCGGGCTGGCCAGC
+AGCACACCGGTGAGTCCGCCCAGCAAGAAGGTGACCATGAAGCCCACCGAAAACAACATCGGGGTTTCAA
+AGGTCAATTGCCCCTTCCACATGGTGCCGATCCAGTTGAAAAACTTGATCCCGGTCGGCACCGCGATCAG
+ATACGTCATGAAAGAGAAGAAGGGAAGCAGGACGGCTCCGGTCGCGAACATGTGGTGCGCCCATACCGCG
+ACCGACAACGCGGCGATCGACAGCGTCGCATAAACCAGCGTGGTGTAACCGAAGATCGGCTTGCGGGAAA
+ACACCGGGAAGATCTCCGAGACGATCCCGAAAAACGGCAGCGCGATGATGTAGACCTCGGGGTGGCCGAA
+GAACCAAAACAGGTGCTGCCACAGCAGGACTCCGCCATTGGCGGCGTCATAGATGTGAGCTCCCAGATGC
+CGGTCGGCGGCCAGCCCGAACAATGCCGCCGTGAGCAGCGGGAACGCAATCAATATCAGGATGGACGTCA
+CCATGATGTTCCAGGTGAAGATCGGCATCCGGAACATCGTCATCCCGGGTGCGCGCATGCACACCACGGT
+GGTGATCATGTTGACCGCGCCCAGGATGGTGCCCAGACCCGCAACGATCAAACCCATGATCCACAGGTCG
+CCCCCGGCGCCGGGCGAGTGAATGGCGTCGGTCAGCGGCGTGTAGGCGGTCCACCCGAAGTCCGCGGCCC
+CGCCCGGAGTGATGAAGCCGGCTGCCCCGATGGTGGCGCCAAATACGAACAGCCAGAACGAAAAGGCGTT
+CAGCCGGGGGAAGGCCACGTCGGGTGCGCCGATCTGCAGCGGCAGCACCAGGTTGGCGAAACCAAACACA
+ATCGGCGTGGCATAGAACAGCAGCATGATCGTGCCGTGCATGGTGAACAACTGGTTGAACTGCTCATTCG
+ACAAGAACTGCAGACCGGGTGCGGCCAGCTCGGTCCGCATCAACAACGCCAGCAGGCCACCGATGAAGAA
+AAAGCTTATGCACGCGACGCAGTACATGATGCCGATCATCTTGTGATCGGTGGTGGTGATCAGCTTGTAG
+ACCAGGCTCCCCTTGGGACCGGTGCGGGCCGGGTAAGGACGAATGGCTTCGAGTTCTCCCAGCGGGGGCG
+CTTCGGCTGTCAACGCACTCCTCCAAACATCCAGCCCGGACCGGGCCAAAACCCAGTATTGAGAGGCATC
+TTAGCCCTCGATCAGGCTGGCGGCAGGCCTGGTCCTACAAACCGTCGTAAATGCCAGACTCCGCCGGCGG
+GCCGTTGCAGACCAACGCTTTCCGCCCGCGCGAATCGGGGTCGACGGCTGGCCGAGTGCTACCGTCGAAC
+GCGTGCTGTCCGGCGGGATGCGATCCACTGTTGCTGTCGCCGTAGCGGCAGCCGTGATCGCAGCGTCCAG
+TGGTTGCGGCTCCGATCAACCGGCCCATAAGGCGTCACAATCGATGATCACGCCCACCACCCAGATCGCC
+GGCGCCGGGGTGCTGGGAAACGACAGAAAGCCGGATGAGTCGTGCGCGCGTGCGGCGGCCGCGGCCGATC
+CGGGGCCACCGACCCGACCAGCGCACAATGCGGCGGGAGTCAGCCCGGAGATGGTGCAGGTGCCGGCGGA
+GGCGCAGCGCATCGTGGTGCTCTCCGGTGACCAGCTCGACGCGCTGTGCGCGCTGGGCCTGCAATCGCGG
+ATCGTCGCCGCCGCGTTGCCGAACAGCTCCTCAAGTCAACCTTCCTATCTGGGCACGACCGTGCATGATC
+TGCCCGGTGTCGGTACTCGCAGCGCCCCCGACCTGCGCGCCATTGCGGCGGCTCACCCGGATCTGATCCT
+GGGTTCGCAGGGTTTGACGCCGCAGTTGTATCCGCAGCTGGCGGCGATCGCCCCGACGGTGTTTACCGCG
+GCACCGGGCGCGGACTGGGAAAATAACCTGCGTGGTGTCGGTGCCGCCACGGCCCGTATCGCCGCGGTGG
+ACGCGCTGATCACCGGGTTCGCCGAACACGCCACCCAGGTCGGGACCAAGCATGACGCGACCCACTTCCA
+AGCGTCGATCGTGCAGCTGACCGCCAACACCATGCGGGTATACGGCGCCAACAACTTCCCGGCCAGCGTG
+CTGAGCGCGGTCGGCGTCGACCGACCGCCGTCTCAACGGTTCACCGACAAGGCCTACATCGAGATCGGCA
+CCACGGCCGCCGACCTGGCGAAATCACCGGACTTCTCGGCGGCCGACGCCGATATCGTCTACCTGTCGTG
+CGCGTCGGAAGCAGCCGCGGAACGCGCGGCCGTCATCCTGGATAGCGACCCATGGCGCAAGCTGTCCGCC
+AACCGTGACAACCGGGTCTTCGTCGTCAACGACCAGGTATGGCAGACCGGCGAGGGTATGGTCGCTGCCC
+GCGGCATTGTCGATGATCTGCGCTGGGTCGACGCGCCGATCAACTAGTGAGGCGCAGCGCTAGGCTTTGG
+GATACCCACAGCTAAAAAATTAATCAAAGAAACGAAGAGGGTTGCCATGAGCACTGTTGCCGCCTACGCC
+GCCATGTCGGCGACCGAACCCCTGACCAAGACCACGATCACCCGTCGCGACCCGGGCCCGCACGACGTGG
+CGATCGACATCAAGTTCGCCGGAATCTGTCACTCGGACATCCATACCGTCAAAGCCGAGTGGGGCCAACC
+GAATTACCCTGTGGTCCCTGGCCACGAGATCGCCGGCGTGGTGACCGCCGTGGGCTCGGAGGTGACCAAG
+TACCGGCAGGGCGACCGCGTTGGGGTTGGCTGTTTCGTGGACTCGTGCCGCGAGTGCAACAGTTGCACGC
+GCGGCATCGAACAGTACTGCAAGCCGGGCGCAAACTTCACCTACAACTCGATCGGCAAAGACGGCCAGCC
+AACCCAGGGCGGCTACAGCGAAGCGATCGTCGTCGACGAAAACTACGTGTTGCGCATACCCGACGTGCTG
+CCCCTGGATGTGGCGGCGCCGCTGTTGTGCGCGGGCATCACGCTGTACTCGCCACTGCGCCACTGGAATG
+CCGGGGCGAACACGCGGGTGGCGATCATCGGCCTAGGCGGACTGGGTCACATGGGCGTCAAGCTGGGCGC
+CGCGATGGGCGCCGACGTGACGGTGCTGTCCCAATCGCTGAAGAAAATGGAGGACGGTCTGCGCTTGGGG
+GCCAAGAGCTACTACGCGACCGCCGACCCGGACACCTTCCGCAAGCTGCGCGGCGGCTTCGACCTGATCC
+TGAACACCGTCTCGGCTAACTTGGACCTCGGCCAGTACCTGAACCTGCTGGACGTCGACGGCACACTCGT
+GGAACTGGGTATCCCCGAGCACCCCATGGCCGTGCCGGCGTTCGCGCTAGCGCTCATGCGACGCAGCCTG
+GCCGGGTCCAACATCGGCGGGATCGCCGAGACCCAGGAGATGCTCAATTTCTGTGCCGAGCACGGCGTGA
+CACCCGAAATCGAGCTGATTGAACCGGACTACATCAACGACGCCTACGAGCGCGTGCTGGCCAGCGACGT
+GCGCTACCGCTTCGTCATCGACATCTCAGCCCTGTGAGGCCGGTGCGCGATCACTTCCGGATTCGGACTC
+GCCGACGTCGACGCCGGCCAGCGGCCATCCGGCGGCGGCCAGGATGCCTGCCACCCGTTGGATGTTTTCC
+GGTCCGGCGTCGTGATGGGTCACCTCGGAGATGAACTCGGCGATCTCGTCGCGGTCGATCACACGGTCCG
+CCACGGCGGGCGACCCGTTCTCGGTGAAGTGGCGCACCACCTCCCCGATCTGCTCCTCGGTCAGCGGGGT
+GCTGCGCAATAGCGACAGCAGCGCCACCCGGTCCGGCCCGGGGACGCCCTCGGGGTAGCCAACCTGAAGC
+CAGCGCAGCACCGAACGGAAGAAATGCGGGTGCGAGAACGTTTTCGTCACCCCACCAGTCTCAAGGTTTC
+GACATCACTCGCGCCAGTGTGGTGCGGCGCGATTCAGACAATTCACGAGGCGTTCACCACGATCGCGAGC
+CCATGGACCCATGAGCCCGTGACATTCTGCAGCGTCGTCTAGCGGGACGGCAACGACGAACTGGGTTTTC
+ACCCCGCTCGATTTTTCACCCCGCTCGATTAGGTGGCGTTTGGCAAGCTGGCTCGCGCGCTGCGGGGCAA
+GGCCATCTGGCGTTGCGCTGTCACGCGCTGGAGTGCCCTCGTGAGAAATGACCGGCCCCGGGCAGCGGAC
+GTCGACGGTGTCAGGCCGGCCAGTCGCCGCGGGTCAAAGAGCTTGGCGTGACGCTCCACCGGTAGCTATC
+GGATTCCAGAAGCTTGGGCAGCCAATTGTCCCAGGTGCCAGTCGCGCCGCCAGCGGTATGCACCGCGGTA
+CGCGCGGCAACAAACGCCTTGTGACGAGCGCGTCCGAGCGGTCATCGGCCTCCACCGTCATGCACAGCTC
+CTTCTCCAGGTCTACGCCGACGTCGCGGTCCACATTGGTGAGCTTGGCGAATGCCTCGGCAACCTCGTCG
+AAATGCGCCTCCGCGTCCGCATCGAACGGTCCGCCCATGTCAAAGATCAACTCGACGTAGTAGCTAGTTA
+CCGCATCAGGTCAGTGTTTGCTGGCCTCGGAGTCCGGCCGAACAATGGCCCATTTTCCCGCGACTCTAGA
+AGTCCCAGTCATCGTCCTCGGTGACGACCGCCTTGCCGATCACATAGCTCGACCCGGATCCGGAGAAGAA
+GTCATGGTTCTCGTCGGCGTTGGGTGACAGCGCCGACAGGATGGCCGGGTTCACGTCGGTCTCATCGCGG
+GGGAACAGCGCCTCATAGCCGAGGTTCATCAGCGCCTTGTTGGCGTTGTAGCGCAAGAACTTCTTGACGT
+CCTCGGTTAGCCCGACCTCGTCGTAGAGGTCCTGGGTGTATTCCACCTCGTTGTCGTAGAGCTCGAACAG
+TAGCTCGTAGGTGTAGTCCTTGAGCTCGGCGCGCGTGACGTCGTCAACCAACGCCAGACCACGCTGGAAC
+TTATAGCCGATGTAGTAACCGTGCACGGCCTCGTCGCGGATGATCAGCCGGATCATGTCGGCGGTGTTGG
+TCAACTTGGCCCGACTCGACCAGTACATCGGCAGGTAGAACCCAGAGTAGAACAGGAAGCTCTCCAGCAG
+GGTGGAGGCCACCTTGCGCTTGAGCGGCTCGTCGCCGCGGTAGTACTGCAGCACGATCTCGGCCTTGCGC
+TGCAGATTGCGATTTTCCTCCGACCAGCGGAAGGCGTCGTCGATCTCGGCGGTGGAACACAGCGTGGAGA
+AGATCTGGCTGTAGCTCTTGGCGTGCACCGACTCCATAAACGCGATGTTGGTCAACACCGCCTCCTCATG
+CGGAGTCAGCGCGTCGGGAATCAGGCTGACCGCACCAACGGTGCCCTGGATGGTGTCCAGCATGGTCAGG
+CCGGTGAAGACCCGCATGGTTAGTTGCTTCTCGCCGGCGGTCAGGGTGCCCCACGACGGGATGTCATTGG
+ACACCGGCACCTTCTCGGGCAGCCAGAAGTTTCCGGTCAGCCGATCCCAGACCTCGGCGTCCTTCTCATC
+TTGCAGTCGGTTCCAGTTGATCGCTGAGACTCGATCAATTAGCTTTGCGTTTCCAGTCACCAGAACCCCA
+CTTCACCAGGACAACAAGCTGCCTTGCTAGGCCTCAAACACTACCCCTGGGGTCCGACAAGGTACTGCAA
+CACAAGAAGTTGTGTTTGCGTGTCGCGAATCCGCTCGCCTGTTTCGCCGGCTAGTTCGCCGCAGCGACCG
+TCGCGCGGTCGCTCGACAAACCGTTGCCGATCCCGAAGAACCGGTACTCGGCGGGGTTGACCGAGCGGGT
+GGTCAGCCAGTATTGCCAGGTGTAGCCGCACCAGAGCACGGTGTTCTTGCCGTGCTCGTCGAGATACCAG
+CTGCGGCAGCCGCCACTGTTCCACACCGACCCAGCCAGCCTGCGCTGCAGCTCCTGGTTGAACCGGTCTT
+GCGCCTCGCGGGTGGGGGCCAGCGCTTGCACGCCCATCCGGTCGCATTTCGCGATCGCATCGGCCACGTA
+ATGGATCTGCGATTCGATCATGAACACCACGGAGTTGTGTCCCAGCCCAGTGTTCGGCCCCAGCAGGAAG
+AACAGGTTGGGCATGTTGGCGACGGTGATCCCGCGGTGTGCACCGATGCCCTCACGGTTCCAGCGGTCGA
+CCAGGTCCTCGCCGTGACGCCCCTTGATCTGCACATAGGTATAGGAGTCGGTGACGTGGAAGCCGGTGGC
+GTACACGATCACATCGGCTTCCCGGAAGACCTCACGGCCAGTGCCGTCGGCGGTGACGATCCCGTCGTGC
+GTGATCCGGTCGATGCGGTCGGTGATCAGTTCGGTCTTCGGGTCCGCCACCGCGGGGTAATAGGTAGAGG
+AGTTCAGGATCCGTTTGCAGCCGATACGATACCGCGGCGTCAGCTTGCGCCGCAGCTCGCGATCCTTCAC
+CGATCGACGAATATTGTATTTGGCATAGGCCTCGATGATCTTCAACGTGTTGGGCCGCTTGGTCATGCCG
+TAGGCCAGCGCCTCCTGGGCCCAGTAGATGCCGAGGCGCAACAGTGCCCGTAGCCCGGGGACGGTTCGCA
+ACGCCCGGCGCAGCGACACCGGCAGCTCTTCGTTGGTGCGCGGGACCACCCACGGCGGGGTGCGCTGATA
+GAGCTGAAGTTCGGCGACCTGGCCGACGATCTCGGGCACGATCTGGATCGCGCTGGCACCGGTCCCGACG
+ATCGCCACCCGCTTGCCGGTCAGGTCGATACTGTGGTCCCACTGGGCGGAATGGAAAGCGGGGCCGGCGA
+ATTCGTCGCGACCTGCGATCTCGGGGAAGGACGGGATGTGCAACGCACCGGCCCCGGAGATCAGGAACTG
+CGCGACGTATTCACGCCCGTCGGCGGTGAACACGTGCCAGCGGCATTCGTCGTCGTCCCAGTAGCCGCGA
+TCGACGAGCGAATTGAACTCGATGTAGCGGCGCAGGCCGTACTTGTCGGTGACCCCTTTGAGGTAGCCCA
+AGATTTCGTCCCAGTAGGAAAACAGGTGTTTCCAGTCCGCCTTGGGCTCGAACGAGAAGGAGTACAGGTG
+CGACGGGATGTCGCACGCGCAGCCGGGGTAGGTGTTGTCGCGCCAGGTGCCGCCGACGTCGTCGGCTTTC
+TCCAATATGACGAAGTCCACTCCTTGCTTTTGCAGTGCGATGGCCATGCCCAAACCGGAGAATCCGGTTC
+CGATGATGACGGCGCGGGTACGTACCGGCGGCTGGTTGGCCGGGCTTGGCGTGGACGGCTTGGCAGCCGT
+ATCGGCAATGCTCACAATGGATCGGTCTTCCTGTTCAGCGGCGAGTTTGGCGCTTCAGTCACCCTCGCCG
+GCGCAAATACCCAGTACCCAGGGTATCGGATATGACGAGTGTTGTTGATTGCCGCAGCGATGTCAACGGC
+CGCCGCGCTCAACGCACGGCGGGATTGTTGGGTACCGCGTCGTGGATCGGTTGGTCAGGGTCGACCGCGA
+TGCCCAGCGCTTCGGCGGTGCCGACGATCACGCCCATCATGATGGTGGTCAGATGCGCCACGAACTGCTC
+ACGCGGCATGCGGCGCGGGCTGTCGGGTTCGGGGCCCAACCACCACTCGGTTGCCGATGCGGCCGATCCG
+AACGCCGCGAATGCGGCGAGTTCGAGCGCGGCTCGATTCAGCTCCATCTCGCGCAGCTCGTTGTTGAACA
+TCTCGGCCATGGCCAGCGTGATCTCCCGGCCTTCGTTGAGGGTGCGTACCGTCGCCTCGGACTGCTTTGC
+CGAGCGGCCCTGAATGAACACCCGCAGCACGTTGGGGTGCTGGTCGACGAGGTTGACGTACTCCTCGACG
+CTGCGCCGGATAACTTCGCGGGCAGAGTCGGTGGCTAAGTCGAGCGACGGGAAGATCGCCGCCCACAGCA
+TGTCACGCAGTCGCATCCCGATAGCCTCGAGCAAATCGGACTTGTCGGTGAAATGCCGATAGATCTTGGG
+CTTGGCGGTGCCGGCCTCTTCGGCGATTTGGCGCACACTCAGCTCGGGGCCCAGCCGGTCGATAGCGCGG
+AACGCCGCGTCGACGATTTCGTTGCGCACCTTCTTGCGGTGCTCACGCCACCGTTCACTGCGGGCGTCGA
+CTTTCACCCCCGGCTTTGCACTGGGGTGGGGTCGGGGGATTCTGACCACATCAAGCACCTTACCGCGTTG
+CAAGCGCTGACCTGGGCAGACTGGCCACGCCAGGCTTGGTTGAATGTGAGGTTCACGACGCGACACGCCG
+CGAAGCCGTCGCCACTTTCACTCTGGCGCGCCGGTGCTACAGCATGCAGGACACGCAACCCTCGACCTCG
+GTGCCCTCCAACGCCATCTGCCGCAGCCGGATGTAGTACAGCGTCTTGATCCCCTTGCGCCAGGCGTAAA
+TCTGCGCCTTGTTCACGTCGCGGGTGGTGGCGGTGTCTTTGAAGAACAACGTCAGCGAAAGCCCTTGATC
+CACATGCTGGGTGGCCGCCGCGTAGGTGTCGATGATCTTCTCGTAACCGATCTCGTAGGCGTCTTCGTAG
+TACTCCAGGTTGTCGTTGGTCATATACGGCGCCGGGTAGTAGACCCGCCCGATCTTGCCTTCCTTGCGGA
+TCTCGACCTTCGACACGATCGGGTGAATCGACGACGTCGAATGGTTGATGTAGGAAATCGACCCGGTCGG
+CGGCACCGCCTGCAGGTTCTGGTTGTAGATGCCGTGCGCTTGCACCGACTCCTTGAGCCGACGCCAGTCG
+TCCTGCGTTGGGATGCGGATGCCGGCGTCGGCGAACAGCTGGCGTACCTTCTGGGTCTTCGGCTCCCAAA
+TCTGGTCGGTGTACTTGTCGAAGAATTCCCCGGACGCGTACTTGGACCGCTCGAAACCCTTGAAGTGCGT
+GCCGCGTTCGATCGCGATGCGGTTGGATGCCCGCAACGCGTGATACAGCACCGTATAGAAGTAGATGTTG
+GTGAAGTCGATGCCTTCGTCGGATCCGTAGAAGATGCGTTCCCGGGCCAGGTAGCCGTGCAGGTTCATCT
+GTCCTAGCCCGATCGCGTGGGAGTCGTTGTTGCCCTGCTCGATTGAGGGCACCGACTTGATATGGGTTTG
+GTCGCTCACCGCGGTCAACGCGCGGATCGCCACCTCGATCGTCTGCGCGAAGTCCGGCGAGTCCATCGTC
+TTGGCGATGTTCAGCGACCCCAGGTTGCACGAAATGTCTTTGCCCACTTTGGCATACGACAAGTCCTCGT
+TGAACAATGACGGCGTAGACACTTGCAGGATCTCCGAGCACAGGTTGCTGTGCGTGATCTTGCCATCAAT
+TGGATTAGCGCGATTGACGGTGTCTTCGAACATGATATAGGGGTAGCCGGACTCGAACTGCAGCTCGGCC
+AGCGTCTGGAAGAACTCCCGTGCCTTGATCTTGGTCTTGCGGATGCGCGCGTCATCGACCATTTCGTAGT
+ACTTCTCGGTGACCGAGATGTCAGCGAACGGCACACCGTAGACCCGCTCGACATCGTAGGGCGAGAACAG
+GTACATGTCATCGTTGCGCTTGGCCAACTCGAAGGTGATGTCGGGGATCACCACCCCCAGACTCAGCGTC
+TTGATCCGGATCTTCTCGTCGGCGTTCTCACGCTTGGTGTCCAGGAATCGGTAGATGTCGGGGTGATGGG
+CGTGCAGGTACACCGCGCCGGCACCTTGACGAGCGCCCAGCTGGTTGGCGTAGGAGAACGCATCCTCCAG
+CAACTTCATGATGGGGATGACGCCCGAGGACTGGTTCTCGATGTTCTTGATCGGCGCGCCGTGCTCGCGA
+ATGTTGGTCAGCAGCAACGCCACTCCCCCGCCACGCTTGGATAGCTGCAGCGCGGAGTTGATCGACCGTC
+CGATCGACTCCATGTTGTCTTCGACGCGAAGCAAAAAACAGCTCACGGGCTCCCCGCGCTGCTTCTTGCC
+AGAATTCAAAAACGTCGGTGTGGCGGGCTGGAAGCGGCCGTCGATGATCTCGTCGACCAGCAGCTCGGCA
+AGTGCGGTATCGCCGGCGGCCAACGTTAGCGCCACCATGACCACGCGGTCCTCGAAGCGCTCCAGATAGC
+GCTTCCCGTCAAAGGTTTTCAGCGTGTAGGAGGTGTAGTACTTGAACGCACCCAAAAACGTCGGAAACCG
+GAACTTTTTGGCGTAGGCGCGGTCTAGCAGCGTCTTGACGAAGTTGCGCGAGTACTGGTCGAGAACCTCA
+CGCTCGTAGTAATTCTCGCGGATCAGGTAGTCGAGCTTCTCGTCCTGATTATGGAAGAAGACCGTGTTCT
+GATTGACATGCTGCAAAAAGTACTGGTGGGCTGCTTCCCGATCCTTGTCGAACTGGATCTTGCCGTCCGC
+GTCGTACAGGTTCAGCATCGCGTTCAGCGCGTGATAGTCCGTTTCGCCCGGCCCCCCAGAGTAAGAGGCG
+TGCGCGCCGGAGGCTACAGGCTCTGCAATGACGGTTGGTGGCACGTCTGTTCCTTCCAGAATTCAGCGAG
+ACCGGTGCGGACGGCGGCGACGTCGTCCTCGGTGCCCATCAGTTCGAAGCGGTATAGGTAGGGAACGCTA
+CATTTTCGGGAGACGACGTCGCCGGCGTAGCAGAACTCGGCACCGAAGTTGGTATTGCCGGCAGCGATGA
+CCCCGCGCAGCTGCGCTCGATTGTGGTCGTTGTTCAAGAAGGCAATGACCTGTTTGGGGACGTATCCGCC
+GGCATCGAGACCCGGGTTGGCCCGGCCGCCACCGTAGGTGGGCAGTATCAGCACGTACGGCTCGTCGACC
+TCGATCCGGCCATGCAGCGGTATCCGCGTGGCGGGAATACCCAGTTTCTGCACAAAGCGGTGGGTGTTCT
+CCGACACGCTGGAGAAATAGACCAGGCTGCGCCCCGCGATATCCATGGCACCGCAATCTTCCTTATCTAT
+GTCTGCCGCGCTAGGCGGTCAGCGCTGCCCCGGCGAGCGCCTTGATGCGATCGGGGCGGAAACCCGACCA
+GTGGTCGTTTCCGGCGACCACGACGGGTGCTTGTAGGTAACCCAGCGCCATCACGTAGTCCCGCGCTTCG
+GAATCCAGGCTGATATCAACCTTCTGGTAGGCGATGCCCTGCTTGTCCAGCGCCTTGGAGGTGGCACTGC
+ACTGTACGCACGCGGGCTTAGTGTAAACGGTCACGGTCATGGGCGTACCGCTCCTTTGCGGAAATCGGGA
+ATCTGACAGGATCTGGCAACGACTCAAGTAGTGCATCTTCGATATGTTGAGCGGCCCGACAAGGCTCCAG
+ATTCCCGTCATAGCGCGACCACGTCCGTCGACCTGGCGATGCCGATGCCGGGAAGTTCATCGCGCCCCGT
+GGATCTGGTGAGACCTGGTGAACCTGGGATCTGCCGGTACTCGAAAACACTACACCTAGGGGGTGGCACG
+GAGAAGAGATACAAGATGTTCTGAATAACATTTTCGAAATTCCCTGGTCGTAAGCCTGGCTCGAGCACCG
+CGGCGGCGTGTCGCAGATCACCTCAGCCGCCGCCATACCCGTCTGACCCGATATATCACCGGCCACCGAC
+AACGTCGCCGCTAGCTTCCCGCCGAACCGCTACCAGCAAAGCCGATGGAGCCGCTATTGGCTGACCCGCC
+TCGGCCCAGGGATCAGCCGACCTCAGCGGCCAAGTTGCCGACGGCGTCGCGCACATTCGCCGCCAGCCCG
+GCGTCGTCCGCGACCGACTTGCCCAGAGTTTGGAACGGCACCGACAGTTTGATCGCATCGACCACCCGCG
+TGCCAGCGATGCTGAACGACTTGCGAGTCTCGTCGTGCGCCCATACCCCGCCGTAGCGGCCCATGGAGCC
+GCCGATCACGGCCAACGGCTTGTCCTTCAACGCGCCATCGCCGAATGGCCTGGACAGCCAGTCGATCGCG
+TTCTTGATCACGGCCGGAATGCTGCCGTTGTATTCCGGCGTGACCACCAAGGCAGCGTGCGCGTCAGACG
+CGGCCTCCCGCAACGCGCTCACCGGCGCCGGCACCTCCGTCGCTGTGTCGATGTCTTCGTTGTAGAACGG
+CAGGTCCCCCAGCCCCTCGAACATGGTGACGGTGACGCCGTCCGGAGCGACCTTGGCAGCCAGCTCGGCG
+ATCTGGCGGTTGAACGACGCCGCGCGCAGGCTTCCCACTAAGGCCAAGATTTTGATGTCGGACTTGGTAT
+CTGACACTGCTACGTTCCTTTCCGCTTGTTGGTCCACGTCCTTGCACGAGCCAACCGGACCATGGTCCGA
+TTTATTCCGATCGCGTTACAGTGCAAAGGTGAGCGGCGCCGAGCGGTTGGGTGACTTGCCTGTGTTCGCG
+AGGCAAGAGCCCGTACCAGAGCGGGGCGACGCGGCACGCAATCGTGCACTCCTGTTGGAGGCGGCGCGCC
+GCCTGATCGCCCGAAGCGGTGCGGACGCAATCACCATGGACGACGTTGCCGCGGCCGCTGGCGTCGGCAA
+AGGCACCTTGTTTCGCCGCTTCGGCAGCCGTGCCGGCCTGATGATGGTGTTGCTCGATGAAGACGAGCGA
+GCCAGTCAGCAGGCCTTCCTGTTCGGCCCGCCACCGCTGGGCCCGGATGCTCCGCCGCTGGACCGCCTGA
+TCGCATTCGGTCGGGAGCGAATGCGCTTCGTCCATGCCCATCACCAGCTGCTGTCGGAAGCCAACCGGGA
+TCCACAAACCCGCCACAGCGCGGCGCTATCGGTACTGCGCACCCATTTGCGGGTACTGCTGGCCTCGGCG
+CCGACCACCGGCGACCTGGATGCCCAGACCGATGCCCTGCTAGCGCTGCTCGACGTCGACTATGTCGAGC
+ACCAACTCAACGCCGGCGGCCATACCCTGCAAACCCTGGGCGACGCATGGGAGAGCCTGGCGCGAAAACT
+GTGCGGACGATGATCGATCACTATGCCGACAGCAGCACCGCGATGGATCCTGCACGTAGACCTCGACCAG
+TTTTTGGCGTCGGTCGAACTGCTCCGCCACCCCGAACTGGCAGGTTTGCCGGTCATCGTCGGCGGCAACG
+GTGATCCGACCGAACCGCGAAAGGTCGTCACCTGTGCGTCGTATGAGGCCCGCGCCTACGGTGTGCGCGC
+CGGCATGCCGTTGCGGACCGCCGCCCGACGATGCCCTGAGGCCACCTTCTTGCCGTCGAACCCAGCCGCC
+TACAACGCGGCGTCCGAGGAGGTGGTGGCGTTATTGCGCGACCTGGGATACCCGGTCGAGGTATGGGGCT
+GGGACGAGGCTTACCTCGCGGTGGCGCCCGGGACTCCCGACGACCCCATCGAAGTCGCCGAAGAGATCCG
+AAAAGTCATCTTGTCGCAAACCGGGCTGTCTTGCTCGATAGGTATCAGTGACAACAAGCAGCGCGCCAAG
+ATCGCTACCGGGTTGGCGAAACCAGCTGGCATCTATCAGCTCACCGATGCCAACTGGATGGCCATCATGG
+GTGACCGTACCGTCGAAGCACTGTGGGGTGTGGGGCCCAAGACTACGAAAAGGCTGGCAAAGCTTGGGAT
+CAACACCGTTTACCAACTTGCACACACCGATTCCGGGCTATTGATGTCCACGTTCGGTCCGCGAACCGCG
+CTGTGGCTGCTGCTGGCCAAAGGCGGAGGCGATACCGAAGTCAGTGCCCAAGCTTGGGTTCCACGCTCGC
+GCAGCCACGCCGTCACCTTTCCACGAGACCTCACCTGCCGATCCGAAATGGAATCGGCCGTGACGGAATT
+GGCGCAGCGAACACTCAACGAGGTGGTGGCTTCGTCGCGAACCGTCACCCGAGTCGCGGTCACCGTGCGC
+ACGGCGACGTTCTACACCCGCACCAAGATCCGAAAGCTGCAAGCTCCCAGCACCGATCCCGACGTCATCA
+CCGCTGCCGCCCGGCACGTTCTTGACCTATTCGAGCTGGATCGGCCCGTCCGGTTGCTGGGAGTGCGGTT
+AGAACTGGCCTAGAACCGGCGGGCACACCGCACCTGGGCGGCGCGAAGTCTTGACCGCACCGGCCGCTAT
+GGCCCGGGCCGAAGCGCGCGCGTGAAGAACACGTTGACTCGTCGCATCACCAGGGTGTATGGCCACCACG
+CATATCGCTTGAACGCATACAGCGCCCGGATGTCCGCCGACGTATAGACCAGGTATCTGTTCCTTGTGAC
+CCCGGCCAAAATTTTGTCGGCCGCCTTCTCCGGCGTCACGGCGTGACCACTGAACCGTTCGACCCAGCGG
+TTGACCCTCGGGTCGTCGCGATCCACTCCGGCGATCTCGACCGTATTGACCAGCGGGGTCTTGACGGCGC
+CAGGCACCACGACCGACACCCCGATGCCGTGCCGGGCCAGATCGAAGCGCAGCACCTCAGAAAGTCCCCG
+CAACCCGTACTTGCTAGCGCTATAGGCCGCATGCCACGGCAAGCCAACCAGCCCGGCCGCCGAGGACACA
+TTGACCAGGTGCCCGCCCCGACCGGCGGCGACCATCGGTGGGACCAAGGTCTCGATGACGTGGATTGGGC
+CCATGAGATTGATCGCGACCATCCTGCTCCACTGATCGTGCGTGAGCTGGTCAACGGTGCCCCAGGCCGA
+CACACCGGCGATGTTTAGTACCACGTCCATGCTGGGATGACGGGCGTGGATATCGGCCGCGAATGCCGCC
+ACGTCCTGGTAGTCGGAGACGTCCAGAACTCGATGCTCGGGCACCTGAGCGCCGAGTGCACGGGCGTCAC
+ACACGGTTTGCGCCAAGCCATCACGGTCGCGGTCGGTCAGATACAGCTCGGCACCTTGCGCCGCGAGGCG
+CAACGCGGTCGCGCGACCGATGCCACTGGCCGCGCCGGTGACAAAGCACCGCTTACCCGCGAAATACTGT
+CCGGCTCCCCTCTGCAACATGGTCGTGACGATACCGGCGGTACCGACACCCCCTCCGGTAGGACGATCGA
+TGCGCCCCGATAGCTATGGGGCCTTGCCGCCACCCCAAAGCGCGTTGAGCCACATCTGTTCAAGCACCCG
+AACCCGGCGCGCTGCGTCACTGTCGGGGCCGACGAGCAAAGCGTCACCGGTCAGCATCAGCGCGGTGGTA
+GCTGCCAGGGTGCGGACGAGCGTCGGGAGGTCTTCGCTGATCGGATGCGCAGTGCCGGCCTTCACCTCAG
+CCTCGAAGACGCCGATGGTTTCACGCAACAGCACTTGGAACTGCCGCTCGAGAATATCGCGGATCTCCAT
+GTCGCTCTGGCGTGCCGCATTACAGGCCCGCAGCACCGGGTCGTTGTTCGCGTAAACGGCGGCGACGCTG
+CCGATCATCCGGTTGACGAACTGCTCGGGTGACTCCCCTGGCTGACGGGCGGAGAAATGCTGGCTGGCTT
+CTTCGAGTTCTTCGGTGGCCTCGGCCAAGATCTGGGCGAGCACCGAGTATTTGGAATCGAAGTAGAAGTA
+GAAACCGGAGCGGGCTACCCCTGCGCGAAGGCTGATAGCGCGCACCGACAATTCCGCGAACGGTGTCTCC
+TCCAGCAGTTCGCGTGCGGCCCGCAGAATCGCCTGGCGATGCCTGTCACCACGCCGTCGCATCGGCGGCG
+CAGCCTGCTTCTCGTCTGCGGCATGACTGGTCACCTTTTGATCACCCCCTTGACCTTGCACCATGGCGTC
+TGAAAACGGAACATCGGTAGCCGTCAAATTGACCAGAAGGATAGATTTCAGTTACAGCCACCACCGGTAA
+GGAGCGCCAATGGCGACGATCCACCCCCCGGCATACCTCCTTGACCAAGCCAAGCGTCGCTTCACGCCGT
+CGTTCAACAACTTTCCCGGCATGAGTCTTGTCGAACACATGCTGCTGAACACCAAATTCCCGGAGAAGAA
+ACTCGCCGAACCGCCGCCAGGCAGCGGGCTCAAGCCGGTCGTCGGTGACGCGGGGCTGCCGATCCTTGGG
+CACATGATCGAGATGTTGCGCGGCGGACCGGACTATCTGATGTTCCTGTACAAGACGAAGGGTCCGGTCG
+TATTCGGCGACTCAGCTGTGCTGCCGGGTGTCGCAGCACTGGGCCCTGACGCGGCGCAGGTCATCTACTC
+CAACCGCAACAAGGACTACTCGCAGCAGGGCTGGGTGCCCGTGATCGGGCCCTTCTTCCACCGCGGCCTG
+ATGCTGCTCGACTTCGAAGAGCACATGTTCCACCGACGGATCATGCAGGAGGCGTTCGTCCGGTCCAGGC
+TCGCCGGCTACCTCGAGCAGATGGACAGGGTCGTCTCGCGGGTGGTCGCCGACGACTGGGTCGTCAACGA
+CGCACGCTTCCTTGTCTATCCGGCCATGAAGGCGCTCACGCTTGACATCGCCTCGATGGTCTTCATGGGC
+CACGAACCCGGCACCGATCACGAACTGGTCACCAAGGTGAACAAGGCGTTCACGATTACCACCCGTGCCG
+GCAACGCGGTGATCCGCACCAGCGTGCCACCGTTCACCTGGTGGCGAGGACTGCGAGCACGCGAGCTGCT
+GGAAAACTACTTCACCGCCCGAGTCAAAGAGCGCCGCGAAGCGTCGGGCAACGACCTGCTGACGGTGTTG
+TGCCAGACCGAAGACGACGACGGCAACCGGTTCTCCGACGCCGACATCGTCAACCACATGATCTTCTTGA
+TGATGGCCGCCCACGATACCTCGACGTCAACGGCCACGACGATGGCCTATCAGCTGGCCGCCCACCCGGA
+ATGGCAGCAGCGCTGCCGCGACGAATCGGACCGGCATGGCGATGGGCCGCTCGACATCGAATCCCTAGAG
+CAGCTGGAATCGCTCGACCTGGTGATGAACGAGTCGATCCGGTTGGTGACGCCGGTCCAGTGGGCGATGC
+GGCAGACGGTGCGCGATACCGAACTGCTGGGCTACTACCTACCCAAGGGCACCAACGTGATCGCATACCC
+AGGGATGAATCATCGCCTGCCGGAAATCTGGACAGACCCGCTGACATTCGACCCGGAACGGTTTACCGAG
+CCGCGCAACGAGCACAAGCGGCACCGCTATGCGTTCACGCCGTTCGGCGGCGGCGTGCACAAGTGCATCG
+GGATGGTGTTCGGCCAATTGGAGATAAAGACGATCCTGCACCGGCTGCTGCGCCGCTACCGGCTGGAGCT
+GTCCCGTCCCGACTACCAGCCCCGCTGGGACTACAGTGCCATGCCGATCCCGATGGACGGGATGCCGATC
+GTGCTGCGTCCCAGGTAGGCCCTCTTCGGCGGATTCCGCCAATCCACCGGTGCCGCAGATGAAAGTGCCA
+GTGCGCAGCCCGCACCCACTTTCGACCCGCGGCGGGAGTCGGTCTGGATCAGATCCCGCCGCGGGTCGCG
+CGAATGGTCAGCGTCGCTATCGTGCGCCGACGGTGCAAGCCCTTTCGACTTCTATGACGACCGTTTGAAT
+TTGGACGTCCCCTGTTGCAGAAAACCCTCGCTGCGGTGGAACCTGGCGATAGCATCTGATGACGGTGTGG
+AAACCGCGGAATATGGGTGTGCTCCAGCGACGAAAGGCTCAATCGATGAGCGCGACTAAAAGCAAGGGTT
+TGCGGGCGTTTCAGACACTGGTCGCGGCGCTGGCTGCGGTAGTTGCAGTACTAGCAGCGGGCTGCGCTAC
+CCAGCGCGTTCCCACGGTTCTGCCGGAATCGGAGTTAATTCCTCAAAGCCTCGGTTAGCTGCTCTGCGAC
+CTCGCCGGACGGGTGCAGCGCAACCACGCACATGCAGGAGCAAGAAGGGCGCGACCGATGATCGCAAAAG
+GCAACAGGCGGATCCGGGTAGGGCAATTGCTGGGCGCAGCACTGGTCGCTGCTTTTGCCCTGACAGCGGT
+GGGATGCACAATCCAGATGCCTCAGCCACCTCTCCCGCAGCAGGAGTTAAGGCGGTAGGTCCGGCCTCAG
+GGTAGCTGCTAACTACCCGATGGGGCAGTCACGTCGCCGTCGGGCACGGTGCGGACGAGCGCGGACACAC
+TCATCCGTACTTTGGTGCTTAGAGCCACCAGGAAGCGGCAGCGTCCAGATGGCGGCGGGTGCGGCAACGG
+GCCAGGCTGTCGTCACCAGAGCCGATCGCTTCGAGAATCCGTACGTGGGCATGTCCCACAGCGACCACGT
+CGCTCCATGTCGGCAGCGCCTGCTCTGTGCTCGACAAGTGCCGGCGGAACAGCTCGACCAGTATCAGCAG
+GAACAGATCCAGCATCGTATTGCCGGCCGCTCGCGCCAGTCCGACGTGGAACCGAAACTCCTCGACGGCG
+GCCGCGCGTACATCGTCGGTGGGGTTATCCAACCTCGGCCGCCCCAGCGTATCGAGGAAGGACGCAACCT
+CAGGTTCGCTGCGGCGCTTGACAACTTTCGCGACATTGTCGATCTCGATGGCATCCCGGACGCACCGTAG
+GTCTTCGCGGCTCGGCTTGCGGTACTGCAGATAGAGCGCGATGGTGTCGATGCTGGCTTGTGGCTGGGGG
+GTGGTGACGACCAACCCGCCGCCGGGTCCGCGGCGCATGTGCGCGATCGCGTGATATTCCAGCAGCCGCA
+CCGCTTCCCGAAGCACCGCGCGGCTCACCTGGTAGCGTTCCAACAGCGCTGTCTCGGTCCCGAAGACCGA
+CCCGACCTGCCAGCCGCTGGCGGCGATATCGTCGCCAATGGTGGCCGCCAACACCTCGGCCAGCTTGCCG
+CGGGGCGCGCCCAGGATCAGCTGCTGGGCCCGGCGCGGCTCACGCGCCCGGCCCCCGTTGCGGACGGCCG
+CATCGTTGCCGCGCTGGTGCTGCTGCAGCCAGCCGGCTACCGCCTCAACGTGTCGTTCGCTTAAGGTTTT
+GGCCCACGCCGAATCACCCGCCGTGACGGCCGCGACGATATCGGAATGTTCGTTGTGCACTTGACCGGCC
+GCCTCGACGGCCTCACCTGCGGATTGGGTACCTGACTTCTGGACGTATCGCTTGGTCAGCCGCATCAAGA
+TGTCGATAAACAGCTGTAGGACAGGGTTTTTCGATTGCTCCGCGAGCACGCGGTAAAACTGCTCAGGCGG
+CGGGGGCAAACCGGGCCGCCACCGTTCCTCTGCGCGCAAGACCGCTCGCAGCCTTTCGATGCCGGGTTCG
+TCGATATGCTCTGCGGCAAGAGAGGCCGCCAAGGGTTCGAGCACCAGACGCGCGCCGAGCAAGTCACCGA
+TGGTGGTGCCCAGGTATTCGAGATAGATGACCACGGCGCGGGTAGCGGGCCCGGCATTTGGCTCGCAGAT
+GAACAGCCCGCCGTTCGGTCCACGACGCATTCTTGCCACCTGATGGTGCTCAACCAGACGCACAGCTTCG
+CGCAGCACCGATCGACTCACGCAAAAGCGTTGCTGCAAAGCGCTTTCCGAACCCAAGGATGCTCCGATCG
+GCCAGCCGCGGCGGACGATGTCCGCCTCGATGCGGCGGGCGATCTTCGACGCTCGCTTGTCCGTCCAGAC
+CGCGTCCGGCTCGGTGCTCATTTCAATAGAGTGTACTGTATTGGCTGAGTCAAGGGCGCGAGCTGGGCCC
+TAGCTAATCAGGGGATCACGCGGCATGCCCAGGATCCGCTCGGCAATCTGATTGCGGGTCACCTCCGACG
+TGCCGCCGGCGATCGCCATGCCACGGGCGCCCATCACCGTTCGGCCAATCACCCTGCCGGGGCCGTCCAG
+CAACGCAATCTCGGGCCCCCATAGCGCGGCCGCGATGGCGGCGCCCTCGATCATGTGCTCTGCCACTTTG
+AGCTTGGTGATGTTGCCCTCCGGACCAGGGCCGGCTCCTTCGACGCTGCGAGCGGCACGGCGCAGGTTCA
+GCAGCCGCAGTGCGTGATCCTCTGCGAGGAAAGCGCCGACTCGAATTGGGGCGCCCGCAAACGCATCTGA
+CCGCCGCTGGACCAATTGCACCAGCTTCGCCGCCATTGCTTCGTAGTACGAGCCACTGCCGCCGATGCTG
+ACCCGCTCGTTGCCCAGCGTTGCCCGCGCCACCGTCCACCCGGAGTTCGGCGCCCCGACAACGTCCTCAT
+CGGGGACGAAGACATCGTTGAAGAACACCTCGTTGAATTCCGAGTCGCCGGTGATCTGCCGCAGCGGCCG
+CACCTCGACACCGGGGGCCAACATGTCGATGATCACCGTGGTGATGCCAGCGTGTTTGGGGGCATCCGGA
+TCGGTACGCACGGTAGCCAGGCCACGCGCGCAGTACTGCGCTCCGCTGGTCCACACCTTTTGCCCGTTGA
+TCTTCCAGCCGCCCTCCACCCGAGTTGCGCGGGTCTTGACCGAGGCCGCGTCAGACCCCGCGTCAGGTTC
+GGAGAACAGTTGGCACCATATCTCCTGCTGGCGCAGCGCTTTCTCGACGAATCTTTCAATCTGCCAAGGC
+GTTCCGTGCTGAATCAGCGTCAAGATCACCCACCCGGTGATCGAGTAATCCGGGCGCTCGATGCCCGCCG
+CGCTGAACTCTTCCTCGATCACCAACTGCTCCACCGCGCCCGCGGCACGACCCCACGGCCTGGGCCAATG
+CGGCATCACATAGCCCGTCTCGATCAGCTTGTCGCGCTGTGCATCCTTTTCCAGAGCAGCGATTTCAGCG
+GCGTCCGAACGGATGCGGGCGCGCAGCTCCTCGGCCTGTGCCGGCAGGTCCAAGCTGATCGCCCGGGTAA
+CGCCAGCCGCGGTGCGCTCGAAAACGTCTCGGACGGGCGCATCACCGCCGAACAATCCCACGGTCACCAA
+CGCCCGGCGCAGATGCAGATGCGCGTCATGCTCCCAGGTAAAGCCAATACCGCCGTGCACCTGGATGTTG
+AGCTCGGCATTGCGTGCATAGGCCGGAAACGCCAGGGCCGCAGCGACCGCGGCGGCCAGCCGAAACTGCT
+CCTCATCCTCTGCTGCCGCACGCGCGGCATCCCAGACCGCGGCGATCGCCGACTCGGCGGCCACCAGCAT
+GTTCGCGCAGTGATGCTTCACCGCTTGAAACGTGGCGATGGTACGGCCGAATTGCTGTCGCACCTTGGCA
+TAGGCCACGGCGCTGTCCACGCAGTCGGCCGCCCCACCGACGGCCTCGGCGGCCAGCAATGTGCGCGCGC
+GGGCCAAAGCCGATTCATACGCACCAAGCAGGATGTCGTCGGTCGTGACGCGCACGTTGTCCAGGCGCAC
+GCGGCCACTCCGCCGGGTCGGATCAAAGTTTTCCGGCACATCAACCGAGACGCCCTTGCGGCCGCGTTCC
+AACACCAGCACGTCGTCACCGGCGGCAACCAACAGCAGCTCGGCAAGCCCGGCGCCCAACACGATTCCCG
+CCTCACCGTCGGCAACACCGTCGGTAACCTGCACCTGACTATCCAGTCCCACACCCGCCGTCAGGGTTCC
+GTCAATCAGCGCCGGGCAACAGCCGTGCCCGTTGGTCATCAGTACCTTCTTTGGCGACCACCGCTGAGGC
+GATCACGGTCGGCACAAACAGCCCCGGTGCCACCGCACGACCGAGCTCTTCGATCACCACCACAAGCTCG
+GACAGGCCATAGCCAGAGCCACCGTGTCGCTCGTCGATATGCAGGCCGAGCCAGCCCAGCTCGGCGAGGT
+TCTGCCAGAACGGCGGGCGGGCGTCCCCCGCCGCGTCCAGTGATGCACGCGCCGCCCAGCGCACCTTCTG
+CGAAGTCAAGAACGCGCGAGCCACCCCGGAGAGCTCGCGATGGTCGTCGGTCAATGCAATACCCATCAAG
+GCCTCCTAGCGGCACTACCGGACCCACATAGCCCCCAGGCGGTATTGGTAAAGAGTATACTAATTGTCTG
+TCGCGGCCGCGAGACACGGCTTGCTCGGGCACGCCAGCCTTGCCCTCGCCAACGATGTCGGCGAGACATG
+CCAAGCTGAACCGTGCTCCTTCACGACGTGGCCATCACCTCAATGGACGTGGCCGCCACCTCGTCGCGGC
+TGACCAAGGTCGCGCGCATCGCCGCCCTGTTGCACCGCGCCGCGCCAGACACACAGCTGGTCACGATCAT
+CGTGTCGTGGCTCTCCGGCGAGCTGCCGCAACGCCATATCGGTGTCGGGTGGGCGGCATTGCGGTCCCTA
+CCGCCGCCCGCGCCGCAACCGGCGTTGACCGTCACCGGTGTCGACGCCACCCTCTCTAAGATCGGCACTC
+TATCGGGCAAAGGGTCTCAGGCGCAGCGCGCGGCACTCGTTGCGGAATTGTTCTCCGCCGCAACCGAAGC
+TGAGCAAACCTTTTTGTTGCGACTGCTCGGCGGTGAACTGCGCCAGGGCGCAAAGGGCGGGATCATGGCC
+GATGCGGTCGCCCAGGCCGCCGGGCTCCCGGCCGCGACGGTCCAACGCGCCGCGATGCTAGGCGGCGACC
+TGGCGGCAGCGGCGGCGGCCGGCCTGTCCGGCGCGGCGCTGGACACCTTCACCCTGCGAGTGGGCCGACC
+GATAGGCCCGATGCTGGCACAGACCGCGACCAGCGTCCATGATGCACTCGAACGTCACGGCGGCACAACC
+ATTTTCGAGGCTAAACTAGACGGCGCGCGAGTGCAGATCCACCGGGCAAACGACCAGGTCAGGATCTACA
+CCCGAAGCCTGGACGACGTCACTGCCCGGCTGCCCGAGGTGGTGGAGGCAACACTGGCACTGCCGGTCCG
+GGATCTAGTGGCCGACGGCGAGGCGATCGCGCTGTGCCCGGACAACCGGCCGCAGCGTTTCCAGGTCACC
+GCATCACGGTTCGGCCGATCGGTCGATGTTGCGGCTGCCCGCGCGACGCAGCCACTTTCGGTGTTCTTCT
+TCGACATCCTGCATCGGGATGGTACCGACTTGCTCGAAGCGCCGACCACCGAGCGGCTGGCCGCCCTGGA
+CGCACTGGTGCCGGCTCGGCACCGCGTGGACCGGCTGATCACGTCCGATCCAACGGACGCGGCCAACTTC
+CTGGATGCGACGCTGGCCGCCGGCCACGAGGGGGTGATGGCCAAGGCACCGGCCGCTCGTTACCTTGCGG
+GTCGCCGCGGAGCGGGCTGGCTGAAGGTCAAGCCGGTGCACACACTCGACTTGGTGGTGCTCGCGGTGGA
+ATGGGGCTCGGGACGCCGGCGCGGCAAGCTCTCCAATATTCACCTGGGCGCACGCGATCCGGCTACCGGT
+GGATTCGTGATGGTGGGCAAGACCTTCAAAGGAATGACCGACGCCATGCTGGACTGGCAGACCACCAGGT
+TTCACGAGATCGCGGTGGGTCCGACAGACGGCTACGTCGTCCAACTTAGGCCCGAGCAGGTGGTCGAGGT
+AGCCCTCGACGGCGTGCAAAGGTCGTCGCGCTACCCGGGCGGGCTGGCATTGCGGTTTGCCCGCGTGGTG
+CGCTACCGCGCCGACAAGGACCCGGCCGAGGCCGACACCATCGATGCCGTGCGCGCGCTCTACTGATCGC
+ACGGCGAGAGTGACTCCTGCGACGGGACACGCCGGCTGGGCGTCGCCAGATTCACGCTCGTCGACCAAGC
+GGGCGGGACAAGCAGCTGCAAGGATCAACGGAGATCGCACCCGTGATTGAGGGAGGTGACGGTGGCAGCG
+CCGACCCCGTCGAATCGGATCGAAGAACGCTCCGGACACGCCAGCTGCGTCCGCGCCGATGCCGACCTGC
+CACCCGTGGCCATCCTCGGTCGCTCCCCCATCACGCTTCGGCACAAGATCTTCTTCGTGGCCGTTGCCGT
+GATCGGCGCTCTCGCCTGGACCGTCGTCGCGTTCTTCCGCAACGAGCCGGTCAACGCGGTCTGGATCGTG
+GTCGCAGCGGGCTGCACCTACATCATCGGGTTCCGGTTTTATGCGCGGCTGATCGAAATGAAAGTCGTCC
+GTCCCCGCGACGATCACGCCACCCCGGCCGAAATCCTCGACGACGGCACCGACTACGTGCCCACCGACCG
+GCGGGTGGTATTCGGACACCACTTCGCCGCCATCGCCGGTGCCGGGCCGCTTGTCGGACCAGTACTGGCC
+ACCCAGATGGGTTACTTACCCAGCAGCATCTGGATTGTCGTCGGCGCGGTGCTGGCCGGATGTGTCCAGG
+ACTACCTGGTGTTGTGGATCTCCGTGCGGCGGCGTGGCCGCTCCCTGGGTCAGATGGTTCGCGACGAACT
+CGGCGCCACCGCCGGAGTGGCCGCCCTCGTTGGAATCCCGGTCATTATCACCATTGTGATCGCGGTGCTG
+GCGCTGGTGGTCGTGCGGGCCCTGGCCAAGAGCCCATGGGGCGTCTTCTCGATCGCCATGACCATCCCCA
+TCGCCATCTTCATGGGCTGCTACTTGCGGTTCCTACGTCCCGGGCGGGTGTCGGAAGTTTCATTGATCGG
+GATCGGACTGCTGCTGCTCGCCGTTGTCTCCGGTGATTGGGTTGCCCATACCTCCTGGGGCGCAGCGTGG
+TTCAGCTTGTCACCGGTGACACTGTGTTGGCTTCTCATCAGCTATGGCTTCGCAGCTTCGGTGCTGCCGG
+TGTGGCTGCTGCTCGCGCCACGCGACTACCTGTCAACGTTCATGAAGGTCGGCACCATCGCGCTTCTCGC
+GATCGGTGTTTGTGCGGCTCACCCGATCATCGAGGCCCCAGCGGTGTCGAAATTCGCCGGTAGCGGCAAC
+GGCCCGGTGTTCGCCGGCTCACTGTTTCCATTCCTGTTCATCACCATCGCGTGCGGGGCGCTGTCTGGAT
+TCCACGCGCTCATCTGCTCGGGCACGACGCCGAAGATGCTGGAGAAGGAAGGCCAGATGCGCGTGATCGG
+CTACTGCGGCATGATGACCGAGTCCTTCGTCGCCGTCATAGCACTACTCACCGCGGCGATCCTCGACCAG
+CACCTATACTTCACCCTCAACGCGCCGTCCCTGCATACCCACGACAGCGCAGCCACCGCCGCCAAGTACG
+TCAACGGGCTCGGTTTGACGGGCTCACCGGTGACCCCAGACCACATCAGCCAGGCCGCCGCCAGCGTCGG
+CGAACAGACGATCGTGTCGCGCACCGGCGGTGCGCCGACGCTGGCGTTCGGCATGGCGGAGATGCTGCAT
+CGAGTGGTCGGCGGTGTGGGCCTCAAGGCGTTCTGGTATCACTTCGCGATCATGTTTGAGGCTCTGTTCA
+TCCTCACCACCGTCGACGCCGGCACCAGGGCCGCGCGCTTCATGATCTCCGATGCGCTGGGCAACTTTGG
+CGGTGTGCTGCGCAAACTGCAGAATCCGAGCTGGCGTCCCGGTGCGTGGGCTTGCAGTTTGGTGGTCGTC
+GCGGCGTGGGGCAGCATCCTGCTGCTCGGTGTGACCGATCCGCTGGGCGGCATCAACACGCTGTTCCCGC
+TGTTCGGCATTGCCAACCAGTTGCTTGCCGGAATTGCGCCGACCGTCATCACCGTCGTCGTCATCAAGAA
+GGGGCGACTGAAGTGGGCTTGGATACCGGGTATTCCACTGCTGTGGGATCTGGCGGTCACCCTGACCGCA
+TCGTGGCAGAAGATCTTCTCCGCTGATCCTTCTGTCGGCTACTGGACTCAGCATGCTCACTACGCGGCAG
+CCCAGCACGCAGGCGAGACCGCGTTCGGCTCGGCCACCAACGCCGATGAGATCAACGACGTCGTCCGGAA
+CACATTCGTCCAGGGCACCCTGTCGATCGTCTTCGTGGTGGTCGTCGTGCTGGTTGTTGTCGCCGGAGTC
+ATAGTGGCGCTGAAGACAATTCGCGGCCGCGGCATACCGTTGGCCGAGGACGATCCGGCGCCGTCGACGT
+TGTTCGCGCCCGCTGGCCTGATTCCTACAGCCGCAGAGCGAAAGTTGCAACGACGTTTGGGCGCGCCGGC
+CTCGGCTTCCGTCGCGGCGCCCGACTAGCCCTCCCGCTGCAGTGGTACCGGCGCCGCAATCAGACGGCGA
+GTAGGCGTGGGTCCAACCCGCGATTCGCGGCAGCCGGCGGAGAAGGCGACCAAGAGACGTTATCGGTTCG
+CTCGGGGACTCATGGCCGGTCTGCTGGGCACGATGGCTCTCACGAGCGGCGGTGGTGTCGCTCGCGAGGA
+TCCATTGGAACCTGATCCGCTAGCCCCGATCATCGACGATTCCAGGTAAACGGATTCGAAGGCACCTATA
+GGGACGTGCCCTGACGCCCCGCCACAATGGACGCTTGGGTAGCCTGACCAGCCTTATGCAGTGACAGTGC
+GTCGAGCATCAATTGAGTAGATCCCACCACCGGTGAACACCAGCAGGAAGAAGCCGAAGCAGAACAGTAT
+CGCCGGAGTTCCGCCATTGCCGTCCGGTGGACCGCCGATCGGCCACAGTGCATACGGTTGATGCATCCAG
+AAGTAGGCGACCGCCATTTCGCCCGAGGCAACGAACGCCACAGCGCGGGTAAACAGCCCGGTTGCGATCA
+GCAGACCTGCCACCAACTCGATGACCCCGGCATACCAGCCGGGCCAGGATCCAAATTCGACGGGTTGAGC
+CGAGGTGACGGGCCAGCCGAAAAGGATCATCGATCCGTAGCCGGCGAACAGCAGCCCGTATACCAACCGA
+AAGAGGCTCAGCACAGCCGGCAAACAGCCGGCGAGCCGACGGTCGAGATCTTTCACCATGACACGACGTT
+ACGGGGATCGACCGCGCGAACGCTGGGCGGATTTTGTCTCCCACCGGTGTGCCTACTCACGTGTGGACGC
+ACGAGCCTCCTTTGTGTACATTTGTACATGTACAAATGTACACAAAGGAGGGGTCTTGATCTACCTATAC
+CTCTTGTGCGCGATCTTCGCGGAAGTGGTGGCAACCAGCCTGCTCAAAAGCACGGAAGGGTTCACTCGGT
+TGTGGCCCACGGTGGGCTGTCTAGTGGGTTATGGCATCGCTTTCGCGCTGCTGGCCTTGTCGATCTCGCA
+CGGCATGCAGACGGACGTCGCCTATGCGCTGTGGTCGGCAATCGGTACGGCCGCCATTGTGCTGGTCGCC
+GTACTGTTTCTCGGCTCGCCGATATCTGTGATGAAGGTGGTTGGCGTCGGCCTGATTGTCGTCGGCGTGG
+TCACGTTGAACCTGGCGGGTGCCCATTGACCGCAGGCTCCGACCGCCGTCCACGCGACCCAGCCGGTCGC
+CGGCAGGCGATCGTCGAGGCGGCCGAGCGCGTGATCGCTCGCCAGGGCCTTGGCGGGCTGAGCCACCGCA
+GGGTTGCCGCGGAGGCCAATGTACCGGTCGGGTCGACGACCTACTACTTCAATGACCTCGACGCGCTGCG
+GGAAGCCGCGCTCGCGCACGCCGCAAACGCCTCGGCCGACCTGTTGGCGCAGTGGCGCAGCGACCTCGAC
+AAGGACCGCGACCTGGCCGCGACCCTGGCCCGGCTCACCACCGTCTACCTGGCCGACCAGGACCGCTATC
+GCACGCTCAACGAGTTGTACATGGCGGCAGCTCATCGACCGGAACTGCAGCGCTTGGCCCGGCTGTGGCC
+AGATGGTCTACTCGCGCTGCTCGAACCGCGCATCGGTCGACGAGCCGCCAACGCGGTCACCGTGTTTTTC
+GACGGCGCTACGCTGCACGCGCTTATCACCGGTACCCCGCTGAGCACCGATGAGCTCACCGATGCCATCG
+CCAGGCTGGTTGCGGACGGCCCGGAACAGCGCGAAGTGGGACAATCTGCCCATGCGGGACGAACCCCCGA
+CTGACACCGCAGCGGCTCCCACCACCGGTGCGGCACCTGAGATTGACACCGCCCGCGAATACGAAGTAAC
+CGCCGAATACCAGTCCTGGCGGGTCGTCTGGGGAAGCGCCGCAGCATTGCTGACGGTCGGCGTCGGGATA
+GGCGCGGCCATCCTCCTCGGGTGGTTCACGTTAGCGCACCGGCACCCGGACCAGCCTGGGGCGGCCGCGA
+CACCACCCCCTGCGGGGCTAACAACACGGTCCGCGCCCACCGCCGCCCCGCCGTCAACGCTGCAAAGCCC
+AGACCTGGACAGCGTCTTTCTTGGCAACCTGCACGATCGCGGCATCTCGTTCACCAACCCCGATGCCGCC
+GTCTACAACGGCAAGATGGTCTGCACCAATCTCGGCGGCGGCATGACCGTGCAGCAGGTGGTCGAGGCAT
+TGCAGAGTAGCAGCCCTGCACTTGGCGACCGGACAACCGCTTACGTGGCCGTCTCGATTCGCACGTATTG
+TCCGAAGTACGACGCTGTGCTGCCACCGGGATCCTGAGTGGAGCTAAGGGGACTCGAACCCCTGACCCCC
+ACACTGCCAGTGTGGTGCGCTACCAGCTGCGCCATAGCCCCATGAAGTGATGCCCATCGAAGCTACACCA
+CCGCCGGAAAGCGTTCAAAGCCCCAGGTCAGCGAGCCTCACCCGATGACCCGATCGACCACTTCGCGGGC
+GGTCTGCTGCACCTCGACCAGATGTTGCGGTCCACGGAAGGACTCCGCGTAGATCTTGTAGACGTCCTCG
+GTGCCCGACGGACGCGCGGCAAACCACGCATTGGCCGTCGTCACCTTCAATCCGCCCAGCGCAGCACCGT
+TGCCGGGCGCGGTCGTCAGCTTTGCGGTGATCGGCTCACCGGCCAACTCGGTGGCGCTCACCTGGTCGGC
+CGACAGCCTGGCCAGGCGGGCTTTCTGCTCCCGATCGGCGGGCGCGTCGATCCGCGCATAGCACGGCCCA
+CCGTACTCGCCGGCCAGCGCGTGATATCGCTGCGACGGCGTAGCCCCGGTGACCGCCAGGATCTCGGCGG
+CCAGCAGCGCCATGATGATGCCGTCCTTGTCGGTGGTCCATACCGATCCGTCCCGTCGCAGAAATGATGC
+CCCCGCCGATTCCTCGCCGCCGAAGCCCAAGGTGGCGCCGATCAGACCGTCGACGAACCATTTGAATCCG
+ACCGGTACCTCAACGAGTTGACGGCCGATCCCGGCGACCACCCGGTCGATGATCGACGAGCTGACCACCG
+TCTTGCCCACGGCGATGCCGGCCGGCCAGGACGGGCGGTGGGTGTAGAGATATTCGATGGCCACGGCCAG
+ATAGTGGTTAGGATTCAGCAGCCCTTCGTCAGGGGTGACTATGCCGTGTCGGTCGGCGTCGGCGTCGTTG
+CCGGTGGCGATCTGGTAGCGCTCCCGGTTGCCGAACATCGTTCGGATGAGCCCAGCCATCGCATCCGGTG
+AACTGCAGTCCATCCGGATCTTCCCGTCGGTGTCCAGGGTCATGAACCGCCAGGTTGCGTCGACCAGCGG
+ATTGACCACGGTCAGGTCTAGGCCATGCCGGTGGGCGATCTCACCCCAGTAATCCACGCTGGCCCCGCCG
+AGCGGGTCGGCGCCGATCCGCACCCCGGCCTCGCGAATGGCGGCGATATCGACCACGTTCGGCAGGTCAT
+CGACATAGTGGCCCAGGTAGTCGTGTCGCTGGGCGGTGCGTAACGCGCGGGCCAGCGGCAACCGCTTCAC
+CATCGACCGAGCGAGCAGAATCTCGTTGGCACGCTTGGCTATTGCGGTGGTCGCAGCGGTGTCCGCCGGG
+CCACCGTTGGGTGGGTTGTACTTGATGCCGCCGTCGGACGGCGGGTTGTGCGACGGCGTCACAACGATCC
+CGTCGGCCAGCGCTTCGGTCCGGCCGCGGTTGTAGGTCAAGATGGCGTGGCTGATTGCCGGCGTCGGCGT
+GTAGCGGTCGCGGGAGTCGACGACGGCCACCACCTGATTGGCGGCGAGTACCTCCAGCGCCGATACCCAT
+GCCGGTTCCGAAAGGCCATGGGTGTCACGGCCGATGAACAGCGGCCCGGTGGTCCCCTGGGCGGCGCGGT
+ATTCGACGATAGCCTGGGTGATGGCCAGAATATGTAGTTCGTTGAACGTTCCGGTCAGGGCTGAGCCCCG
+GTGCCCTGAGGTGCCGAAAGCGACCTGTTGAGCGAGGTCGTCGGGATCGGGTTCGATCGAGTAGTACGCA
+GTCACCAGATGGGGCAGGTCGACGAGGTCTTCGGGCTGGGCCGGTTGACCGGCTCGTGGGTTGGCCACCA
+TGGCTACCAATTCTGCCCACAGGCCCTACAGTGCGAAGCGCAGCATTAGCACACCGAGAGGGATCGACCA
+GTGCCAAACCACGATTATCGCGAGTTGGCTGCGGTTTTCGCCGGCGGAGCGTTGGGTGCGCTGGCCCGAG
+CAGCGCTGAGCGCACTCGCCATCCCCGACCCAGCCCGGTGGCCATGGCCGACGTTCACGGTCAACGTCGT
+CGGCGCCTTCCTGGTGGGTTATTTCACCACCCGGCTGCTGGAGCGATTGCCCCTGTCGAGTTATCGACGC
+CCATTGCTCGGCACCGGATTGTGCGGCGGACTGACCACTTTCTCGACGATGCAGGTCGAGACGATCAGCA
+TGATCGAACACGGTCATTGGGGTTTGGCCGCTGCCTACTCCGTCGTCAGCATCACCCTCGGATTGCTGGC
+GGTGCACCTGGCCACGGTCTTGGTACGCCGAGTGCGGATACGCCGATGACGGCCTCGACGGCCCTGACGG
+TGGCAATCTGGATCGGCGTGATGCTCATCGGCGGTATTGGGTCCGTGTTGCGTTTTCTGGTCGATCGCTC
+GGTGGCCCGCCGGCTGGCCCGGACTTTTCCCTACGGCACACTGACGGTGAACATCACCGGAGCCGCGCTG
+CTGGGGTTTCTGGCCGGCCTGGCGTTGCCGAAAGACGCAGCCTTACTGGCCGGCACGGGGTTCGTCGGCG
+CCTACACCACCTTTTCCACCTGGATGCTAGAAACCCAACGGTTGGGAGAGGACCGCCAGATGGTTTCGGC
+ATTGGCCAATATCGTCGTCAGCGTTGTGCTCGGTCTAGCCGCGGCGCTACTCGGTCAGTGGATCGCCCAG
+ATATGAACGAGCAATGCCTGAAGCTGACCGCGTATTTCGGCGAGCGGCAACGCGCTGTCGGCGGGGCGGG
+GAGGTTTCTGGCCGATGCGATGCTGGATCTGTTCGGCTCCCATAACGTCGCGACCAGCGTGATGCTGCGC
+GGTACCACCAGTTTCGGGCCAAAGCACGAGTTTCGCTGCGATCAATCGCTGAGCCTGTCCGAGGACCCGC
+CGGTGACCGTCGCCGCCGTCGACATCGAATCGAAAATCCGCTCCCTGGTCGACGACGTCACAGCGATGAC
+CGACCGCGGCCTGGTGACCCTGGAACGGGCGCGACTGGTCACCCGGCACAGCGGCGCCGAGGAATTCGGC
+GACATCGACAGCCGAAACGGAGATGCCGCCAAGCTCACCATCTACGCCGGCCGCCAGGTGCGGGTTGCCG
+GGGCGCCGGCCTACTACACCATCTGCGAGCTTTTGCATCGACATGGATTCGCAGGTGCCACAGTGCTGCT
+CGGCGTCGACGGCACGGCACACGGTCGGCGCCGCCGGGCCCGGTTCTTCGGCCGCAACGTCAATGTTCCA
+CTGATGATCATTGCCGTCGGAACGCCTGCACAGGTTGCCGTGGCCGCAATGGAACTCACCGCAGCACTGC
+CTAACCCGCTGCTGACCATCGAACGGGTGCGGCTGTGCAAGCGCGACGGCGAGTTGTTCGCCCGCCCCCA
+ACAGCTGCCGCAGACCGATGACCAGGGACGCACCCTGTGGCAAAAGCTCATGGTTCACACCGCCGAAGCA
+ACCCATCATGAGGGGCTGCCGATCCACCGAGCGCTTGTCCATCGACTGATGCAGTCCGAAACGGCGCGGG
+GCGCTACCGCGCTGCGCGGCATCTGGGGCTTTTACGGCGACCATAAACCCCATGGGGACAAGCTATTTCA
+GCTGGTGCGTAGGGTGCCGGTGACCACGATCATCGTCGACACACCCCAGGCTATCGCGCGCAGCTTCGAC
+ATCGTCGATGAGCTGACGAACTGGCACGGGCTGGTAACCAGTGAGATGGTCCCTGCGGCCGTGTCACTCA
+CCGGGTCACGGGATGGCACGCAAAAGACCGGTGAAACCCCACTGGCGCGCTACGACTACTGAGTGCCAGC
+CGCCAGATTGGTCAGATCCCACGTCGGGGACGCTTACCCAACCCGCGATGCGAACATCCATTTGTCGGCC
+AGCGCCGATAGCCAGCCCGCTACGACCTCAGGATTATCCGGTGGCACCTCGACCAACACCAACTCGTCAA
+CGCCCAGTTCGCGAGCACATCGACATCACCAACCTGAGGATTAGCCAGGGCCACGGCCAGCCGCAGTTCG
+CCACGATCACGACCCGACTGTTGCCGTCGAACGATGCGACGTCGTCGCGCCATAATGTGCGCATTGCAGC
+GACGTATTCGGCGGTGCGCTCTGCGCGCCGCTCGAATGGCACTCCGAGCGCGTCGAACTCCTCCTTGGAC
+CATCCGACGCCACGCCTAGTGTCAGCCGCCTACCACTCAACCGATCCAGGCTCGCCGCTTCTTTGGCCAC
+TATCACCGGGTTGTGCTCAGGCAGCAGTAGCACGCCCGTCGCGACGTCCACCCGCGACGAGGCGGCAGCG
+GCGAAACTCAACGCGATCATCGGGTCAAGCCAATCCGCCTGTGCCGGAACCGCGATGACGCCGTCGCGGG
+AGTAGGGATAACGCGACGCGGGCCGGTCCACCATCACGACATGTTCGCCGACCCACAAGGTGGCGAAGCC
+ACAGTCGTCCGCCGCAACCGCGACGGCATCGACGACCGCCGGGTCGGCGCCGGCACCTATTCCAGCGCGT
+GCAGTCCCAGTCACATCGCACGAGCGTCTCACACAGGCCAATTGGCATTAGCGGCCGTTGAGCAACTGCG
+CCAAGACGGCCGCATGGCTGCGTGCCACGTGGCGCGTCGCGGTCACCGGGGTCACAACGCTGCGCCCGGT
+CAGCTTGCGCAGCTCGGCTAGTGCCGCGCTGTCGTGCAGCTCCTCCTGGTAGCGCGACGCGAATTCGTCA
+AACCGCTCCGGCTGGTGGTGGTACCACTCGCGCAGCTCTTTGGATGGTGCGACGTCTTTGCACCAGATGC
+CCACCCGCTGGTCATCCTTGCGGATTCCGTGCGGCCAGATGCGATCGACCAGGACACGCTGGCCGTCGTC
+GGGATCGATGTCTTCATAGACGCGGGCCACCCGCACCCGTGTCTCGCGCACCATTGTGCCAGCGTATAGC
+CGTTACCGCGGGGGCTTATCCACAGCCACCGGCGCCACCAGTTGTCCCGGTCTGTGCAGGCTGCTATTCT
+CGAACACATGTTCGAGACATTGACCGCGATCGACCCGGATGCCGAGGAAGCGGCGTTGATCGAGCGAATC
+GCCGAGCTGGAGCGGCTTAAGTCGGCAGCCGCGGCTGGCCAGGCGCGGGCGGCGGCCGCTGTGGACGCCG
+CCCGCAGAGCCGCCGAAGGAGCTGCCGGGGTGCCGGCTGCGCGCCGTGGACGTGGGCTGGCCAGTGAGAT
+TGCCCTGGCTCGACGAGATTCACCAGCCCGGGGCAGCCGGCATCTGGGGTTTGCCAAGGCCTTGGTTTAC
+GAGATGCCACACACGCTGGCCGCCCTGGACTGCGGCGCCCTCTCGGAGTGGCGGGCCACCCTGATCGTGC
+GCGAAAGCGCATGTCTGGATGTCGCGGACCGGCGCGCATTAGATGCCGAGTTATGTGGCGACCCCGGCGA
+CTTGGAGGGGATGGGCGATGCGCGGGTGGTCGCGGCCGCCAGGGCGATCGCCTATCGGCTGGACCCGCAG
+GCCGTCGTCGACCGGGCGGCCAACGCCGAAAATGACCGTACGGTCACCATTCGGCCGGCACCGGACACCA
+TGACGTATCTGACCGCCCTGTTGCCAGTCGCCCAAGGCGTGTCGGTGTATGCGGCGCTGACCCGAGCGGC
+AGACACCCGCTGCGACGGGCGCTCCCGCGGCCAAGTCATGGCCGACACCCTGGTCGAACGGGTCACCGGC
+CGCGACGCGGCGGTCCCGACCCCGATCGCGGTCAACCTGGTCATGTCGGATGAAACGCTGCTGGGTGCGG
+CCAACACACCGGCGCAGCTGTGCGGCTACGGTCCCATTCCTGCGGCCGTGGCACGGACCATGGTCGCTAG
+CGCCGTCACCGACCAGAGATCGCGGGCCACCCTGCGCAGGCTCTACGCTCATCCTCAGGCCGGGGCGCTG
+GTGTCGATGGAATCACGGGCGCGGCTGTTTCCCCGCGGTCTGGCCGCCTTCATCGAGCTGCGCGATCAGC
+GTTGCCGCACCCCCTACTGTGACGCGCCGATCCGACACCGCGACCATGCCCACCCCTGGGCCGACGGCGG
+CCCGACCAGCGCGCACAACGGGCTTGGGACCTGCGAACGCTGCAACTACGCCAAACAAGCCCCCGGCTGG
+CGGGTCAGCACAAGTGTCGACGAAAATCACACGCACACAGCCGAATTCATTACCCCGACAGGCAGTCGAC
+ACCGGTCCGGCGCCCCGCCGCACCTGCCTGCGGTCACCGTCAGCGAACTCGAGGTCCGAATCGGCATCGC
+GCTCGCTCGATACGCCGCCTAGTAGTGGTAGGTGTCAGTCGGAGCCGGCATGTGAACCGGTTCGTCCTCG
+AAGTCGGACACTTCGATGCCGTAGGCGCGGGCCAGATCGAGGATCTTGGTGGCCCGGGCAATGCGCGGCA
+GGTCAGACCCGTTGCGGATCTCGCCCCCGTCGCGGGCGAACTCAGCGAAAAATTCCTTCGCCCAGACGAT
+TTCGTCCTGCGACGGGGATAGCCCCTCATTCACCACCGGACATTGGTCCGGCGAAAGGCAGATCTTGCCG
+GTCATGCCAAACTCGGCGGAGACGGCCGTGGCCTCGATCAGCTTGAGCGCGTTGGAGCCGATGGTCGGCC
+CGTCAATCGCGCTGGGCAGACCGGCGGCCCGGGCCGCGATGGTAAAGCGCGACCGCGCGTAGGCCAATGT
+TGCCGGGTCTTCGCCAAAGCCGGTGTCCCGGCGAAAGTCGCCGATACCGAAGGCGAGCCGGAAGGTGCCC
+TTGGCCGCAGCAATCTCGTTGATGCGCTCCAGACCCCGCGCCGTTTCGACCAGTGCAACGATCGGCACGT
+TAGGTAGTCGTTTCGCGGTCTCGGTGACATGGTCCACCGATTCGACCATCGCCAGCATCACTCCGCCAAC
+GGGGCTATCGGCCAACATCGCTAGATCGTCCGCCCACCAAGGTGTGCCGAAGCCGTTGATGCGCACCCAG
+TCAGCGTTTCCGTCACCAAACCAACGCACGGCGTTGTCCCGGGCGGCATGCTTGTCTTTGGGAGCGACCG
+CGTCCTCGATATCGAGCACGACGATGTCGGCGCGTGAGTGCGCGGCGGACTCGAACCGGTCGCCGTGCGC
+GCCGTTGACCAGTAACCAACTCCGCGCGAGAACCGGATCGATACGAGACCCGGCCACCGGATCCGCCGTG
+TTGGTATCGACCTGTTCATACATTGAGGTCATCTAGTGTCTCTTCGCTCAGTCGATGTCGACATTGTTCT
+CCTTAAACCGTAGCGACGTCGCAAATCGGATTGGCAGGATGCCCCGCAAAACCCACGTCCATGGTGTTGG
+ATGGCGTGGTGTCCGACACTCGCCGCAGCCGGACGATAGCGGCCCGGCAGCAAACCATCTGGGACGTCCT
+GGCCGACTTTGGTTCCTTGAGTTCATGGGTCGAGGGCGTCGACCACTCCTGCGTCTTGAACCACGGTCCC
+GACGGCGGAGCTCTAGGCAGCACCCGCCGCGTGCAGGTCGGCCGCAACACGCTGGTGGAGCGTGTCATCG
+AGTTCGACCCACCCACGACACTGGCCTACCGCATCGAGGGCCTGCCCGCCCGGCTGCGCAAAGTCACCAA
+CCGCTGGACACTACGGCCGGCCGATCCTGTAGGCGCGGTGACGGTGGTCACCTTGACCAGCACGATCGAA
+ATCGGCGGCAACCCGCTGGCGCGTCTGGCCGAACTTGTCGTCGGCCGCGCCATGGCCAAGCGGTCCAACA
+CGATGCTCGCCGGGCTGGCACAACGATTGGAGGACAAACATGGCTAACCGTCCCGACATCATCATCGTGA
+TGACCGACGAGGAACGTGCGGTGCCGCCGTACGAGTCGGCCGAGGTGCTCGCCTGGCGTCAACGCAGCTT
+GACCGGCCGCCGTTGGTTCGACGAGCACGGGATCAGTTTCACTCGGCACTACACCGGTTCGCTGGCGTGC
+GTGCCCAGCCGCCCGACGATTTTCACCGGCCAATATCCGGATCTGCACGGCGTCACCCAGACCGACGGCA
+TCGGCAAGCGATTCGATGATTCGCGGCTGCGCTGGCTACGGGCCGGCGAGGTGCCGACGTTGGGTAACTG
+GTTTCGCGCGGCCGGGTATGACACTCACTACGACGGCAAGTGGCACATCTCGCACGCCGATCTGGAAGAC
+CCCGCGACCGGTGCACCACTGGCCACCAACGACAACGAGGGCGTCGTCGACTCGGCCGCGGTGCGGCGTT
+ACCTCGACGCCGACCCGCTCGGGCCATACGGCTTCTCCGGGTGGGTGGGCCCCGAGCCCCATGGGGCGGG
+GTTGGCCAACAGCGGTTTTCGTCGCGACCCGCTGGTCGCCGATCGTGTCGTCGCGTGGCTGACCGAGCGC
+TACGCCCGGCGGCGCGCCGGTGACACCGCCGCGATGCGCCCGTTCTTGCTGGTGGCCAGCTTCGTCAACC
+CGCACGACATCGTGCTGTTCCCGGCATGGGTGTGGCGCAGCCCGCTAAAGCCCTCCCCACTGGACCCGCC
+ACACGTACCGGCGGCGCCGACCGCCGACGAGGACCTGTCGACCAAGCCGGCCGCGCAGGTCGCCTACCGG
+GAGGCGTACTACTCCGGATACGGCCTAACGCGTATGGTCAGCCGCAACTATGCCCGCAACGCGCAGCGCT
+ACCGGGACCTCTACTACCGCCTGCACGCCGAGGTCGACGGGCCGATCGACCGGGTGCGCCGCGCGGTCAC
+CGAGGGCGGATCCGAGGATGCCATGCTGGTGCGCACCTCCGACCATGGCGATCTGCTCGGGGCGCATGGC
+GGACTGCACCAGAAGTGGTTCAACCTCTATGACGAGGCAACCAGGGTGCCGTTCGTCATTGCCCGCATCG
+GCGAGAAGGCAACCCAACCGCGCACGGTCTCGGCGCCCACCTCGCATGTCGACTTGGTGCCGACGCTGCT
+TAGCGCGGCCGGCGTGGACGTAGACGTGGTGGCCGCGGCCCTGGCCGAATCGTTCTCCGAGGTGCATCCG
+CTGCCCGGTCGTGACCTGATGCCGGTCGTGGACGGGGCTTCGGCCGACGAGGGTCGGGCCATCTACCTGA
+TGACGCGTGACAACGTGCTCGAAGGCGACACCGGCGCGTCCCTGCTGTCGCGGCAACTGGGCCGTATCGT
+GAATCCGCCTGCACCGCTGCGCATCAAGGTGCCCGCCCACGTCGCCGCCAACTTCGAGGGATTAGTCGTA
+CGGGTCGATGACACCGACGCCGCCGGTGGTGCCGGGCACCTGTGGAAACTGGTGCGTACCTTCGACGACC
+CGGCCACCTGGACCGAACCCGGTGTGCGTCACCTGGCCACCAACGGCATGGGCGGCGACGCCTATCGCAC
+CGATCCACTGGACGACCAGTGGGAGCTCTACGACCTGACCGCCGATCCCATCGAGGCATACAACCGGTGG
+ACCGACCCACAACTGCACGAGCTGCGACAGCATCTGCGGATGCTGCTCAAACAGCAACGTGCGGTATCGG
+TACCGGAACGCAACCAACCGTGGCCGTATGCTCATCGACTGCCGCCGAGCGGGGCATCCAACGGTTTGGT
+GCGGCGAGTGTTGGGAAGGTTCGTGCGCTAATTGCAGAAGCTGCTATTCACCATCGGGTTGGCCCTGTTC
+CTGATCGGCCTGCTTACCGGATTGGTCATCCCGGCACTGAAGAACCCGCGCATGGCGCTGTCGAGCCACC
+TCGAGGGGGTCCTCAACGGGATGTTCCTCGTCGTGCTCGGCCTGCTCTGGCCGCACATCGATCTGCCCGA
+GGCATGGCAGGTTATCGCGGTGGCGCTGATCGTTTACTCCGCCTACGCCAACTGGCTGGCGACCCTGCTC
+GCGGCGGCCTGGGGAGCGGGCCGTAAATTCGCGCCCATCGCGACCGGCGACCACAAAGCCCCGGCCGCCA
+AGGAGGGATTCGTCAGCTTTCTGTTGTTGTCCCTCTCGGTGGCCATCGTGATCGGCGTGGTCATCGTCAT
+CATTGGCCTCTGACGGCGACCCGTCCAACTACGCCAGCCGCGCTAGCTCGGCCTGAAGCTTGTCCAGATA
+TCGAAGCGTCGGGTCGCGAGGCTCGGTCGGCAGCTCCAGCAAAACCCGCTCCACCCCTAGATGCCGGTAT
+CCCTCAAGGTCTTTAGCCGCCGCTTCACCCCACTGGCACACGGTCACCGGCACGTCGCCCCCGGCCATGG
+CGCGCAACCGCTGAAGCGGACCCGACAGCCGCTGCGGTGATGGACTGATCGCGATCCACCCGGCATTGAG
+CCGGGCTATCCGCGGGAAGTTCGCCGGTCCCCCGCCCACATACAGCGGAGGATAGGGCTTTGTCACCGGC
+TTCGGCCAGCAGTAGATCGGATCGAAGTCCACATATGTCCCATGGAATTCCGCCTGCTCCTGCGTCCAGA
+TCTCGATTATCGCGCGCAACCGCTCATCGATCACACGTCCGCGCACCGCAGGGTCCACACCATGGTTGGC
+GACTTCTTCGCGCAACCAGCCCACACCCACGCCGAAGCGAAACCGTCCCTGCGACACCAGATCCAGCGAG
+GCGACCTCCTTGGCCGTGACGATCGGATCGCGTTCCGGGATCAGCGCGATGCCGGTGCCTAACACCAGTG
+ACTGGGTGGTAGCTGCCGCGGCCGCCAACGCCACAAAGGGATCCAGGGTGCGGTAATACTTCTCCGGAAT
+TGGGCCACCGCCCGGGTAGGGGCTCTGCGTGTTGACGGGAATATGGGTGTGCTCGGCGAGGAACAGCGAC
+TCAAACCCGCGGTGCTCGAGTGCCGCACCCAGCTCCGCCGGGCCGATTCCCTCGTCGGTGACGAACGTCA
+GGACACCGAATTGCATGCTTGCTCCCATCGTCTTGTGGCTGCAAGATCTGCACGACGATACGGCCGGCCG
+CGAGTTAGGCCAGTCCCGCATCGACCAGCAGACGTGACAGCCCGAGTTCGGCGCACTTCGTGGCTACCGG
+CGCCAGTTCGTTTCGCGCATCGGATTCCCGTCCGGTGGCGGCAAGCGTTTCGATATGAAGTATTTGCGCC
+TGCAGCGCCGCCAGCGGTCTGCGCGTACCGTCGATGGCGGCGGCGAGAGCACCGGCCCGTTGGCAGGCTT
+GGTCACGATCGGCGGAGTCGCCGGCGGACAACAGGCGCACCGCGGAGTCCTCGTCGAGTTCGGCTGTCAT
+GGTGGCGATTCCATTGTCGCGGGGGATGGTGCGGGGTGCCAGCAAATCGGCGGCCACCGCCGCAGGTAGC
+GCGATGCCCAGCCGGATCCGCTCGTTGTTGATTCGGGCAGCCAGGCGCGGCAGCCCCAGCTGGACGGCAG
+TATCGCCTCCGGTGGACAGGCGATCAGCCGCACCCTCATGATCCCCCTGGGCCGCCTTGACCCGCGCGCC
+GATCACGTACCTGGCGGCCAGGTAGTCCACTGCACCCCCCTCGGAACCCAGCAGATAGCTCTCGTCCATG
+AGACGACCAGCCCCGGCCAGATCGCCGGTCTCGTAGAGCAATTCGGCGAGCAGCGAACCCGCAAGCCGCG
+CCGCGTGCGAGTGGGCCCCCACTGCCGTGCCGACCTCGAACGCCGTTCGGAAGTTCTGTAGCGCAGCGAC
+AATGTCGAGCCGATTCCTGGCCGCCATGCCGCGCAAGCACTGCGCATAAACGGTGCCGAACGGTCCCATC
+ATTTCCTGGTAGGGCGCGGCCCAGTCCAGCAGTGGATATACCTCGGCGAACTCGAAGCGGCAGATCGCGG
+CCAACGCCGCGGTGTTGCCGGCGGTCCCGGGGACTCGCGGGGGCAGGGTGTCCGGTCTCGACATTGCCTC
+GGCGAGAAGGTCATCCACGCGCTCGACCCGGTCTGCGAACACCTCGGCGACCGCCCGCAACACGTCTGCC
+TCGGCCCGCAGATCCGCCTGCGTCGCCTCGGGAAGCTCGGCCCGGCCAAGGGCCGTTTCGAAACGATTCA
+GGGCACCGGTGGCCGGCGCCGGCCGTTGCAGCAGAATGTTCGCCCACGCGATGGCGAGTTGGAGCCGGGC
+CCGTGAAACCACCATCGACGTCGGCAGTTTCTGCACGATTGCCAGAAGTGTGGTCATCTTTGACTGCTCC
+GGCAGGTTCGTTTCATCCTGCTCGACAAGATCGACGGCGCGCGCGGGATCGCCCGCGGCCAGTGCATGGT
+CGACGGCTTCGTGCAGGTAGCCGTTCTCGGCGAACCAGGCCGATGCCCTGCGGTGCAGTTCCGCCACCCG
+GTGCGACCCGCCACGTTCGAGGCGACGGTGGAGAAAGTCGGCGAACATTTGGTGGAAGCGAAACCAATTC
+GGGTCGTCTTCGGTCCGTTGCAGGAACAAGCCGCGGTGCTCGGCCTCTTCCAGCATCGCCCGCCCATTGG
+TGATCCCGGCCAGCGCCGAGGCCAGCCCGCCGCACGTGCGTTCGGTGACCGATGCCACCAGTAGGAATTC
+GCGCAGTTCGGGTTCCAGGGTGTCCAGCACGTTTTCGCTCAGGAATTCGTGGATCACGTCACTGGCGCCG
+GAAAGTCCGCGCAGGAGTTGGGTCGCGTCGCCCCCGCCGCGCAGCGACAGCGCGGCCAGCCGCAGCGCCG
+CGGCCCACCCGTCGGTAGAGGTAGTCAGCGCCTGCACGTCTGCGCGCGGCAATCGCAGACCACCAGCATC
+GTTCAGCAGCGCGGCGGCCTCGTCGGTATCGAAGCGCAAAGCAGCCGAATCGATCTCGGCTAGTTCGTCG
+CCGATCCGCAACCTGCCCACCGGCAAACCGGCGCGAGACCAGCTGGTCACGATGAGCTGCAGGTGGTGAC
+ATCCGTTGTCCAGCAGGAAACCCAAGGCAGCTTGGGTGCGGCTGTCGGACACCCGATGCCAGTCGTCGAT
+CACCACCGCGATCCGGTCGTCGTTTTCGTGGATTTCGTCGATCAGCGAAGTCAACACGTAGCGGCCGGCG
+TCATCCCCATGCTCTTCGAGCACGTGCCCCAACGACTCGGCCAGCGTGGGCCGGACCCGCCGGATCGACT
+CGAGCAGGTGCGACAAGAACCACACCTCGTTGTTGTCGTCGTTGTCGATTGTCAGCCAGGCGACCGCGGC
+GCCGTCGCGCGAGAGCTCTTCCCGCCATTGCGCCGCCAGGGTGCTTTTGCCGAATCCCGAGGGCGCGTGG
+ATGAGGATCAGCCGGCGCCGTCCGCCGGCGCGCAGGATGTCGGTGAGCCGGCTGCGGGTGACCAGCGAGC
+CGGTGGGCACCGACGGCCGGTACTTGGTCGCGGGTGTCGGAGGCGTCGGGACCGTCGGGGTGCCGCCGCC
+GGTATGCCGATGCGCCGCGTGCGCCTCGGGCGAGCGTCGGCGTTCCACGCCCAGCTCGACGGGGAGGGGC
+ATCTCGTCGACGCTGACGCCGTTGCGGCGCTGAACGTCGCGAAGCTCCTCGCCAACGTCTGCCGCGGTCG
+CGGGACGATCCGCCGGATGGCGGGCCATCGCCCGTTCGATGGCGGCGGCCACGTCCGCGGGCAGTCCCTG
+CTTCCGCAGGTCGGGGATCGGCTGCGAGGTGATCCGCAGGAACTGGGCGATCACCCGCTCACCGCTGCGG
+CGCTCGTAGGCGGCATGGCCGGTCAGCACACAGAACAACGTCGCGCCCAGGGAGTACACGTCAGAGGCGG
+GCGTCGGCGATGCTCCTTCGAGAACTTCCGGCGCGGTGAAAGCCGGGGAACCGGCAATCACCCCGGTCGC
+CGTCTCGAAACCCCCGGCGATTCTGGCGATTCCGAAATCGGTCAGCTGCGGTTCCCCGTAGTCGGTCAGC
+AGGATATTCCCCGGCTTCACGTCACGGTGCAGGGTGCCGACGCGATGCGCGGCTTCCAGCGCTCCCGCGA
+GCTTGACGCCGATCGACAGCGTCTCGCGCCAGTCCAGCGGCCCGTGCCGGCGAATCAGCGTCTCCAACGA
+ATTCTTGGCGTGGTAGGGCATCACGATGAAGGGCCGCCCACCCGCCAACACGCCCACCTGCAAGACGGTC
+ACGATGTGCGGGTGCCCGGAAAGGCGGCCCATGGCCCGCTGCTCGCGCAGGAAGCGCTCGAGATTGTCCC
+GATCCAGGTCGGTGCTCAATACCTTGACGGCGACGGCGCGGTCCAGCGAGGGCTGGACGCAGCGGTAGAC
+GACGCCGAATCCGCCGCGCCCGATCTCCTCGACATTGTCGAATCCAGCCTCAAGCAGTTCCGCGGGAATA
+TTCGGGACCAGGTCCCGCCGCGTCGCGTGCGGATCAACGTCGGTCATCGACGGTCACTATCCTCGGCCGG
+GAGGGTATCACCACCAGTTTCATCGCCGGTGACCCCACACTATCGCCAAGCCGCGGCGTCGCGGCTCGAT
+ACCCACCGCACGCAAAAGCTCCGTTCCCAGACCAACGGAGGGAAGGACCGGCACCAGTTGACATACGAGC
+AGTTCGCTCGTATGTTGACGCTGATGGGGCCGAGCGATCTGTGGACGGTGGAACGCGCGGCGCGCCATTG
+GGGCGTGAGCGCGTCGCGCGCTCGCGCTATCCTGTCGAGCCGCCACATTCACCGGGTCAGCGGCTACCCC
+GCGCAGGCGATCAAGGCGGTCACCCTGCGCCAGGGTGCGCGCACCGACCTCAAAACCGCCAACCATCTCG
+TGCCGGCCGCACAAGCGTTCACCATGGCCGAGACGGGTGCCGCGATCGGAGAGACCGAAGATGAGCGGGC
+ACGACTGCGCATTTTCTTCGAGTTCCTCCGCGGCGCCGATGAGACCGGGACATCCGCGCTCGATCTCATC
+GTTGACGAGCCCGCGCTGATCGGTGAGCACCGGTTCGATGCTTTGTTGGCCGCGGCTGCGGAATACATTT
+CGGCGCGCTGGGGCCGGCCTGGACCCTTGTGGTCGGTGAGTATCGAACGGTTTCTGGACACGGCCTGGTG
+GGTCAGCGACCTCCCGTCGGCACGAGCGTTTGCCGCCGTGTGGACGCCGGCGCCGTTCCGGCGCCGCGGC
+ATTTACCTAGATCGCCACGACCTCACGAGCGATGGAGTGTGTGTCATGCCCGAACCGGTGTTCAACCGAA
+CCGAGCTCCAGCGGGCGTTCACTGCCCTGGCGGCCAAGCTGGAACGCAGAGGCGTTGTCGGTCAGGTGCA
+CGTTGTCGGCGGGGCGGCGATGCTACTCGCCTACAACTCCCGTGTCACCACTCGCGATATCGACGCGTTG
+TTCTCAACTGACGGGCCTATGCTCGAAGCGATTCGTGAGGTCGCTGACGAAATGGGTTGGCCGCGAACGT
+GGCTCAACAATCAGGCCAGCGGTTACGTCTCCCGCACACCAGGTGAAGGCGCCCCCGTTTTCGATCACCC
+ATTCCTGCATGTCGTAGCCACACCCGCGCAGCACCTTCTCGCGATGAAAGTCGTTGCGGCACGCGGCGTG
+CGTGACGGCGAAGACATTCGCCTCCTGCTCGATCGGCTGCGAATCACCAGCGCGGCCGGCGTATGGGAGA
+TTGTCGCACGCTACTTTCCCGCCGAAACCATCACCGACCGGTCGAGGCTCCTCGTCGAGGACCTCCTCAA
+CCAATAGCAGACCACTAGCAGTGAAGCCGCGGCCGCCGCGCGCAGCACCCCAGTGTCATGGATTATCCAT
+GATTCGGGCGTCCCCAATGCGAACCGCTTCTGTCAGTCGGGGCTGGGGTTTCACCACCCGTTTCACCGAC
+CGCTGACCCCACCATAGGCTCGATACTGCCGGGGTGTCATCCCAAACCAGCACCGGCACGACCGGTTGAG
+CGCGCTCTGCTCGGAATAGCCGAGCAGCACCGCGATTTGGCTCAGATACAACCCCGGTTGGGCGAGGTAC
+CTTGCCGCTTGCGCACGGCGTTCGCGCTCGATGAGGTCATGGCACCGGAGGCCCTCGGCAGCCAAGCGCC
+GCTGCAGCGTTCGTGGGTGCATGTCGAGTTGGTCGGCGATGGCCTCGGCGCTGCATTGGCCGGTCGGCAG
+CAGGCGGCGGGCCAACCCGACGACCCGCTCGGAGAGCGTGGCATCGCTCGGAAGGTATTGGGATTCCAAA
+TATTTCGTGGCGATGCGCTTGGTTTCCGGATCCGCATGGTCGATGGGCCTACCGGCGAGCCGGTGGTCCA
+CCTCGAACCCGCACCATGTCCGGCCGAACCGAACGGTACAACCCAACGCTTCGCGGTAGGCGGCGTCGGT
+GCCCAGTTGCGCATGTCGGAACGAGAAAACGCGCGCCCGCGCCTGCGGTCCGCCCAGCAGGCGGATCATC
+CGGGCGGCGTTGGCCATGCTCAGCTCGTATCCCTGCAGCGGATAGGGAATCCCCGGTTCGGTCACCTCAT
+AGCCGAACCGGACGTTGGACCGTGCGGTAGTTGATGAAACCGTCAGCGTCAGGGCGGGCGAATGGACGTA
+GAGGTAGCGACCGATCGCCTCCAGCCCGCCGAACAAGGTGGCAGCGTTGCGCGCGATCACCGCTACCGGG
+CCGAGAATGCCCAGGCCCTGCCAGCGTGCAAGGCGTAGTCCGAAGTCCGGGCAATCGAGCTCGGCGGCGC
+TGGCCTCCAGCATGCGCACGAACCCGGCCAGCGACATGAACGCGTCCTCTTGGTGTTCGATGCCCGGCGG
+GATGTCGAAGCGCCGCAGAAACGGCAGCGGGTCCGCGCCGAGCTCGCGCATCAGGTCGGTGTACCCCCAC
+AGGTTGGTGGCGCGGATGAGGCTGCCCAGCTCCATCACCTCCTGTCGGAAAATGATAAAAGGCTGTCGCA
+AAGTGTCAATACGTGGCGGGGGTCCTCCACCATGCTGGAGCCATGAACCAGCATTTCGACGTCCTGATCA
+TCGGCGCCGGCCTATCCGGCATCGGGACGGCCTGTCACGTGACGGCCGAGTTCCCCGACAAGACAATCGC
+CCTCCTGGAACGACGGGAGCGCCTGGGCGGCACCTGGGACTTGTTCCGCTACCCGGGAGTTCGTTCGGAC
+TCCGACATGTTCACCTTCGGCTACAAGTTCCGCCCGTGGCGCGACGTGAAGGTGCTCGCCGACGGCGCGT
+CGATCCGGCAGTACATCGCCGACACCGCCACGGAGTTCGGCATCGACGAGAAGATTCACTACGGCCTGAA
+GGTCAACACCGCCGAGTGGTCGAGCCGGCAGTGCCGTTGGACCGTCGCGGGCGTGCACGAGGCGACCGGC
+GAAACCCGGACCTACACCTGCGATTACCTCATCAGCTGCACCGGCTACTACAACTACGACGCGGGTTATC
+TGCCGGACTTCCCCGGCGTGCACCGGTTCGGCGGCCGGTGCGTGCACCCGCAGCACTGGCCCGAAGACCT
+CGATTATTCCGGCAAGAAGGTCGTCGTCATCGGCAGCGGCGCAACGGCGGTCACTTTGGTTCCGGCGATG
+GCCGGCTCCAACCCCGGCAGTGCCGCGCACGTGACGATGCTGCAGCGATCCCCGTCGTACATCTTCTCGC
+TGCCGGCGGTCGACAAGATCTCCGAAGTCCTGGGCCGCTTCCTGCCGGATCGCTGGGTCTACGAGTTTGG
+CCGCAGGCGCAACATCGCCATCCAGCGAAAGCTCTACCAGGCCTGCCGGCGCTGGCCCAAGCTGATGCGG
+CGATTGCTGCTGTGGGAGGTACGACGCCGCCTCGGCCGCTCCGTGGACATGAGCAACTTCACCCCGAACT
+ACCTGCCGTGGGACGAGCGGTTGTGCGCCGTGCCCAACGGCGATCTGTTTAAGACGCTGGCCTCGGGCGC
+GGCGTCGGTGGTGACCGATCAGATCGAGACCTTCACCGAGAAGGGCATCCTGTGCAAGTCCGGCCGGGAG
+ATCGAGGCCGACATCATCGTCACCGCGACCGGTCTGAACATCCAGATGCTGGGCGGGATGCGACTCATCG
+TGGACGGCGCCGAATACCAGCTGCCGGAGAAGATGACCTATAAGGGTGTGCTGCTGGAAAACGCCCCCAA
+TCTGGCCTGGATCATCGGCTACACCAACGCGTCATGGACCCTGAAGTCCGACATCGCCGGCGCCTACCTG
+TGCCGGCTGCTGCGGCACATGGCCGACAACGGCTACACGGTGGCAACGCCGCGCGATGCGCAGGACTGCG
+CGCTGGACGTTGGCATGTTCGACCAGCTGAACTCCGGCTATGTGAAGCGCGGCCAGGACATCATGCCGCG
+CCAGGGCTCCAAGCATCCGTGGAGGGTGCTCATGCACTACGAGAAGGACGCCAAGATCCTGCTCGAAGAC
+CCCATCGATGACGGCGTGCTGCACTTCGCCGCAGCGGCCCAAGACCACGCGGCGGCCTGAGCATCATGAA
+CCTGCGCAAAAACGTCATCCGGTCCGTATTACGTGGTGCCCGGCCACTGTTCGCTTCCCGCCGGCTGGGT
+ATTGCCGGCCGTCGAGTCCTGCTGGCGACGCTGACGGCCGGCGCGCGCGCCCCCAAGGGCACCCGCTTTC
+AGCGCGTCAGCATCGCCGGTGTCCCGGTCCAGCGGGTGCAACCCCCCCATGCGGCAACCAGCGGGACGCT
+GATCTACCTGCACGGCGGTGCCTACGCCCTGGGCAGCGCCCGGGGCTACCGCGGCCTGGCCGCCCAGCTC
+GCGGCGGCGGCCGGAATGACGGCGCTGGTCCCCGACTACACCCGCGCACCGCACGCCCACTATCCAGTGG
+CCCTCGAAGAGATGGCTGCGGTGTACACCCGCTTGCTCGACGACGGGCTCGACCCGAAAACGACCGTCAT
+CGCCGGTGATTCGGCTGGCGGAGGGTTGACCCTGGCGCTGGCCATGGCGCTGCGCGATCGCGGCATCCAG
+GCCCCGGCCGCACTCGGCCTGATCTGCCCGTGGGCCGATCTCGCCGTCGACATCGAAGCGACGCGACCGG
+CGCTGCGCGATCCGCTCATTCTTCCGTCGATGTGCACCGAATGGGCGCCGCGCTACGTAGGGTCCTCCGA
+TCCGCGGCTGCCCGGTATCTCCCCGGTCTACGGCGACATGAGCGGCCTGCCGCCCATCGTCATGCAGACC
+GCGGGCGACGATCCGATCTGCGTCGACGCGGACAAGATCGAAACCGCCTGCGCCGCTTCGAAAACAAGCA
+TCGAGCATCGCCGGTTCGCGGGCATGTGGCACGACTTCCATCTGCAGGTCAGTCTGCTCCCCGAAGCCCG
+CGACGCGATCGCCGACCTCGGGGCAAGGCTGCGCGGCCACCTCCACCAATCGCAGGGACAACCACGGGGA
+GTAGTCAAATGAGCTCATTCGAAGGCAAGGTCGCCGTCATCACCGGGGCCGGCTCGGGCATCGGCAGAGC
+GTTGGCACTCAACCTCTCCGAGAAGCGCGCAAAGCTTGCCCTTTCCGATGTCGACACCGACGGGCTGGCC
+AAAACCGTGCGCCTGGCTCAAGCGCTCGGCGCGCAGGTGAAGTCGGACCGGCTCGACGTCGCCGAACGCG
+AGGCGGTGCTGGCCCACGCCGACGCCGTCGTCGCACATTTCGGCACCGTGCACCAGGTCTACAACAACGC
+CGGCATCGCGTACAACGGCAACGTCGACAAGTCGGAGTTCAAGGACATCGAGCGCATCATCGACGTCGAC
+TTCTGGGGCGTCGTCAACGGCACCAAAGCCTTTCTGCCGCACGTGATTGCCTCCGGCGACGGACACATCG
+TCAACATCTCCAGCCTGTTCGGGCTGATCGCGGTGCCCGGGCAAAGCGCCTACAACGCGGCCAAGTTCGC
+GGTGCGCGGCTTCACCGAGGCGCTGCGCCAGGAGATGCTGGTCGCCAGGCATCCGGTCAAGGTGACGTGC
+GTGCATCCCGGCGGCATCAAAACCGCCGTCGCGCGCAACGCCACCGTGGCCGACGGCGAGGACCAGCAGA
+CGTTCGCGGAGTTCTTCGACCGCCGGCTGGCGCTGCATTCGCCGGAGATGGCCGCCAAAACCATCGTCAA
+CGGAGTCGCCAAGGGCCAGGCCCGCGTCGTGGTCGGCCTGGAGGCCAAAGCCGTCGATGTGCTCGCGCGC
+ATCATGGGCTCGTCGTATCAGCGGCTGGTTGCCGCCGGCGTCGCCAAGTTCTTCCCCTGGGCCAAGTAGG
+CCCATAGAGTTCTAGAAAGGGACACCACGATGAAAACCACCGCGGCGGTACTGTTCGAGGCGGGCAAACC
+GTTCGAGCTGATGGAGCTCGATCTCGACGGGCCGGGTCCGGGCGAGGTGTTGGTCAAATACACCGCCGCC
+GGGCTGTGCCATTCCGACCTGCACCTCACCGATGGTGATTTACCACCGCGGTTCCCGATCGTGGGCGGCC
+ACGAAGGGTCCGGGGTCATCGAGGAGGTGGGTGCCGGCGTCACCAGGGTCAAGCCCGGAGACCACGTGGT
+GTGCAGCTTCATCCCGAACTGCGGGACTTGCCGCTACTGCTGCACCGGCCGGCAGAACCTGTGCGACATG
+GGGGCCACCATCCTGGAGGGCTGCATGCCGGACGGCAGTTTCCGATTCCATTCCCAGGGAACAGATTTCG
+GCGCCATGTGCATGCTGGGCACGTTCGCCGAGCGGGCCACCGTCTCGCAGCATTCGGTGGTGAAGGTGGA
+CGACTGGCTGCCACTGGAAACCGCGGTGCTGGTGGGCTGCGGCGTGCCGTCCGGTTGGGGCACCGCGGTC
+AATGCCGGAAACCTGCGGGCCGGCGACACCGCCGTCATCTACGGCGTCGGCGGCCTGGGCATCAACGCGG
+TCCAGGGCGCGACCGCCGCCGGCTGTAAGTACGTCGTGGTGGTGGACCCGGTGGCTTTCAAGCGCGAGAC
+CGCGCTCAAGTTCGGCGCCACCCATGCCTTCGCCGACGCCGCCAGCGCGGCGGCCAAGGTCGACGAACTC
+ACCTGGGGGCAGGGCGCCGACGCGGCGCTGATCCTGGTGGGCACCGTCGACGACGAGGTGGTCTCGGCCG
+CGACCGCGGTGATCGGCAAGGGCGGCACCGTCGTCATCACCGGGCTGGCGGACCCGGCCAAACTCACCGT
+GCACGTCTCCGGAACCGATTTGACGCTGCACGAGAAAACGATCAAGGGCTCGCTGTTCGGTTCCTGCAAT
+CCGCAATACGACATCGTGCGGCTGCTGCGCCTCTACGACGCCGGCCAGCTGATGCTGGACGAACTCGTGA
+CCACCACCTACAACCTCGAACAGGTGAACCAGGGCTACCAGGATCTGCGGGACGGCAAGAACATTCGGGG
+CGTGATCGTGCACTGACCAGCTTCCACCAACCACGAATCCAGAGAGGACGATGATGCGCAGGCTCAACGG
+CGTTGACGCGCTGATGCTGTATCTCGACGGCGGCAGCGCCTACAACCACACCCTCAAGATCAGCGTGCTC
+GACCCGTCGACCGACCCGGACGGCTGGTCGTGGCCGAAGGCGCGGCAGATGTTCGAGGAGCGCGCCCACC
+TGCTTCCGGTCTTCCGGCTGCGGTACCTGCCCACACCGCTGGGCCTGCATCACCCGATCTGGGTCGAGGA
+TCCCGAATTCGACCTCGACGCGCACGTGCGCCGGGTCGTCTGTCCCGCCCCGGGCGGGATGGCGGAATTC
+TGCGCGCTCGTCGAGCAGATCTACGCCCACCCGCTGGATCGCGACCGCCCGCTGTGGCAGACCTGGGTGG
+TCGAGGGCCTCGACGGCGGCCGCGTCGCCCTGGTCACGCTGCTGCACCACGCCTACTCCGACGGCGTCGG
+CGTGCTGGACATGCTCGCCGCGTTCTACAACGACGCGCCTGACGAGGCCCCCGTGGTTGCGCCCCCGTGG
+GAGCCGCCGCCGCTGCCGTCCACCCGGCAACGCCTCGGTTGGGCCCTGCGGGACCTGCCCTCCAGGCTCG
+GCAAGATCGCGCCGACCGTGCGGGCCGTTCGTGATCGGGTGCGCATCGAACGGGAGTTCGCCAAAGACGG
+CGACCGGCGCGTCCCGCCCACGTTCGACCGCTCCGCACCGCCGGGCCCGTTTCAGCGCGGGCTGTCGCGC
+AGCCGGCGGTTCTCCTGCGAATCGTTCCCGCTCGCCGAGGTTCGCGAGGTGAGCAAGACGCTGGGCGTCA
+CCATCAACGACGTCTTTTTGGCGTGTGTGGCCGGTGCCGTTCGTCGCTATCTGGAGCGTTGCGGCTCCCC
+TCCCACCGACGCGATGGTGGCCACGATGCCGCTCGCGGTCACCCCGGCGGCCGAGCGCGCCCACCCCGGC
+AACTACTCGTCGGTCGACTACGTCTGGCTACGCGCCGACATCGCCGACCCGCTCGAGCGGCTACACGCGA
+CCCACCTCGCCGCCGAGGCCACCAAGCAGCACTTCGCCCAGACCAAGGACGCCGACGTCGGCGCGGTGGT
+CGAGCTGCTGCCGGAACGCCTCATCTCGGGCCTGGCGCGTGCCAACGCGCGCACCAAGGGCCGCTTCGAC
+ACCTTCAAGAACGTGGTCGTGTCCAACGTGCCGGGGCCGCGTGAGCCGCGGTATCTCGGCCGCTGGCGCG
+TCGACCAGTGGTTTTCCACCGGGCAGATCTCCCACGGCGCCACGCTCAACATGACCGTCTGGAGCTATTG
+CGACCAGTTCAACCTGTGCGTAATGGCCGACGCAGTCGCGGTTCGGAACACCTGGGAATTGGTCGGCGGC
+TTCCGCGCCTCGCACGAGGAGCTGCTCGCGGCGGCCCGTGCCCAAGCCACGCCCAAGGAGATGGCCACAT
+GACCCGCATCAATCCGATCGATCTGTCCTTCCTGCTGCTGGAGCGGGCCAACCGGCCCAACCACATGGCC
+GCCTACACGATCTTCGAAAAGCCGAAAGGACAGAAATCGTCGTTCGGGCCGCGCCTGTTCGATGCCTACC
+GGCACAGCCAGGCGGCCAAGCCCTTCAATCACAAGCTGAAATGGCTGGGCACAGATGTTGCGGCGTGGGA
+AACCGTCGAGCCCGACATGGGCTATCACATTCGACACCTCGCCCTGCCCGCACCGGGTTCCATGCAGCAG
+TTCCACGAAACGGTCTCGTTCCTCAACACCGGCCTGCTCGATAGGGGCCACCCGATGTGGGAGTGCTACA
+TCATCGACGGCATCGAGCGCGGCCGGATCGCGATCCTGCTCAAGGTGCACCACGCGCTCATCGACGGTGA
+AGGCGGCCTGCGCGCGATGCGCAACTTCCTCTCCGATTCACCGGACGACACGACGCTGGCCGGTCCCTGG
+ATGTCGGCGCAGGGCGCCGACCGGCCACGGCGCACCCCCGCCACGGTGTCGCGCAGGGCGCAACTGCAAG
+GACAACTGCAAGGAATGATCAAGGGGCTGACCAAGCTGCCGAGCGGCCTGTTCGGCGTCAGCGCGGACGC
+GGCGGACCTTGGTGCGCAGGCACTGAGCCTCAAGGCGCGCAAGGCGTCCCTGCCCTTCACGGCGCGACGC
+ACTCTGTTCAACAACACGGCGAAATCGGCGGCGCGCGCGTACGGGAACGTCGAGTTGCCGCTCGCCGACG
+TCAAGGCCCTGGCCAAGGCGACCGGCACCTCGGTCAACGACGTGGTGATGACGGTCATCGACGACGCGCT
+GCACCACTACCTCGCCGAACACCAGGCGTCCACCGACCGGCCGCTGGTGGCGTTCATGCCGATGTCGCTG
+CGTGAGAAGTCGGGCGAGGGCGGTGGCAACCGGGTGAGCGCCGAACTGGTCCCGATGGGTGCACCCAAGG
+CGAGTCCCGTTGAGCGCCTTAAGGAAATCAACGCGGCGACCACACGCGCGAAGGACAAAGGGCGCGGCAT
+GCAAACGACGTCCCGCCAGGCCTACGCGCTGCTACTGCTCGGCAGCCTGACGGTGGCGGACGCCCTGCCC
+CTGCTCGGCAAGTTGCCGAGCGCGAATGTGGTGATATCAAACATGAAGGGGCCCACCGAGCAGCTCTACC
+TTGCCGGTGCGCCGCTGGTGGCGTTCAGTGGCCTGCCCATCGTGCCGCCGGGCGCCGGGCTTAACGTCAC
+CTTCGCCAGCATCAACACCGCGCTGTGCATCGCCATCGGCGCGGCACCGGAAGCCGTGCACGAACCCTCC
+CGGCTGGCCGAACTCATGCAACGGGCATTCACCGAGCTCCAAACCGAAGCCGGCACAACGAGTCCCACAA
+CATCGAAGTCGAGAACCCCATGAAGAACATTGGCTGGATGCTCAGACAACGCGCGACCGTCTCGCCGCGG
+CTGCAAGCCTACGTCGAGCCGTCCACCGACGTCCGGATGACCTACGCGCAGATGAACGCGCTGGCGAACC
+GGTGCGCCGACGTGCTCACCGCGCTGGGGATCGCCAAGGGCGACCGCGTGGCATTGCTGATGCCCAACAG
+CGTCGAGTTCTGTTGCCTGTTCTATGGCGCGGCCAAGCTCGGCGCGGTAGCGGTCCCTATCAACACCCGC
+CTCGCCGCACCCGAGGTGAGTTTCATCCTGTCCGACAGCGGCAGCAAGGTGGTGATCTACGGTGCGCCGT
+CGGCGCCGGTGATCGACGCCATCAGGGCGCAGGCCGACCCTCCGGGCACGGTCACCGACTGGATAGGCGC
+CGACTCGTTGGCCGAACGCCTGAGGTCGGCGGCCGCAGACGAGCCGGCGGTCGAATGCGGCGGCGATGAC
+AACTTGTTCATCATGTACACCTCGGGCACCACCGGACATCCCAAGGGAGTGGTGCATACCCACGAATCGG
+TGCATTCGGCGGCCAGTTCCTGGGCCTCGACGATCGACGTGCGCTACCGCGACCGCCTGCTGCTACCGCT
+GCCGATGTTCCACGTGGCGGCGTTGACGACGGTCATCTTCAGCGCCATGCGCGGCGTCACGCTGATCTCG
+ATGCCGCAGTTCGATGCGACGAAGGTGTGGTCACTGATCGTCGAGGAGCGGGTCTGTATCGGTGGCGCCG
+TGCCGGCGATCCTCAACTTCATGCGCCAGGTGCCCGAGTTCGCCGAACTCGACGCGCCCGACTTCCGCTA
+CTTCATCACCGGTGGCGCGCCCATGCCGGAGGCCCTGATCAAGATCTATGCCGCCAAGAACATCGAGGTC
+GTGCAGGGTTACGCGCTCACCGAATCCTGTGGCGGCGGCACCCTGCTGCTCAGCGAAGACGCGCTGCGCA
+AAGCCGGCTCGGCCGGACGCGCCACCATGTTCACCGACGTGGCCGTGCGCGGTGACGACGGCGTGATCCG
+CGAGCACGGCGAAGGCGAAGTCGTGATCAAGTCCGACATCCTGCTCAAGGAATACTGGAATCGCCCGGAG
+GCCACCCGCGACGCTTTCGACAACGGTTGGTTCCGGACCGGCGACATCGGCGAAATCGATGATGAGGGCT
+ATCTTTACATCAAGGACCGGCTGAAGGACATGATCATTTCCGGCGGCGAGAACGTCTACCCGGCCGAGAT
+CGAAAGTGTGATCATCGGCGTTCCCGGGGTCAGCGAGGTGGCGGTCATCGGCTTGCCCGACGAGAAGTGG
+GGCGAGATCGCCGCCGCCATCGTCGTTGCCGACCAGAACGAGGTCAGCGAGCAGCAGATCGTCGAGTACT
+GCGGAACCAGGCTCGCACGCTACAAGCTGCCCAAGAAGGTGATCTTCGCCGAGGCCATCCCCCGCAACCC
+GACCGGCAAGATCCTCAAAACGGTGCTGCGCGAACAGTATTCGGCGACGGTGCCGAAGTGATGCACGGCC
+CGAGCCGCTAGGACGGCGCGAGCCGCACGATGCCGGGAACGAGGTAGCGCGCAACGTACGCACGCAGCCC
+CTCGTCGTCATCGAGCGGGATCGGGCCCTCCGGCGCAGCGACCGGTAATCCGTTGCCGTTGAGTGTGTTT
+GAGTTGCCCGTTCATGCGGCGGCGCTCGTCGATCTCCTCTTGCACCAGGGCCTCGACCGCCAGCCGCGAG
+CCGGTGATCCGGTCGTAGCTTCCGGTCCAGCGGCCGCCGCGGCTTGTCGCCCCATGCGGTTTGGATCACC
+CGCCGCGTGCTGCGGCTGGTGTCCAGCCAGGCGATTGCCCGCGCTCGCACCCGCTCGGCGCGCGGGTTGT
+CGGCGACCCCGAAGATGACCTCGGCGACGATGTCGAGCGCGATCGGGCCGGCGCGGTCTCGGAAACGGAC
+CTCCTCGCCCATTGGCCAGGTGGCGAGCGCCTTTCGGTCACGCGTTCCATGGCCCGCTCGTAGGACCTCA
+GCGCCTTTCCGCGGAAGGGCGGGCTGGCGTAGCGCCGGTCGGCGCGGTGCCTTCCATGCTGACCAGCGTG
+TGCTCGCCGAAGATCGCGTGGTGAGCCGGTCCATCGCCGGGGTCAGCTGAAGGACCGAGTTGCTCGCCGT
+GAAGACCCTCTTCACGTCTTCGGGATTGGGTCACGCACAGCGCGTCGACGGCTCCAGGCACGTTGAACAG
+GAAGCGATCAACCGAGTTTTGTGGTGCGCGCGTAAAACCGCTGGGGGCCAGCCAGTATTCGGCTCCAAAT
+GCGATCGAGGATAGGCGCACCCGGGGCCTCCATCGGGACTCTTCGAACTACCACCGCTCACCTTGCAGTG
+CGACTACCAAGCCCGCCGACGTGTCTGCGGCGCAGTATTCTTCACGCACCTGGCCCGCGTACTCCCCGAC
+CCAGCAAAGGAGTCCAGGAATGACATGGCAGATCGTGTTCGTCGTGATATGCGTGATCGTCGCCGGCGTC
+GCGGCATTGTTCTGGCGACTCCCCTCCGATGACACGACGCGCAGCCGGGCCAAAACAGTGACAATAGCCG
+CCGTGGCAGCGGCGGCCGTGTTCTTCTTCTTGGGCTGTTTCACCATCGTTGGCACCCGCCAGTTCGCGAT
+TATGACCACCTTCGGCCGTCCCACCGGCGTAAGCCTGAACAACGGCTTCCACGGCAAGTGGCCCTGGCAG
+ATGACCCATCCCATGGATGGTGCGGTGCAGATCGACAAGTACGTCAAGGAAGGCAACACCGATCAGCGCA
+TCACGGTGCGGCTGGGCAATCAATCCACCGCGCTGGCAGACGTCAGCATCCGCTGGCAACTCAAGCAGGC
+CGCTGCCCCGGAACTGTTCCAGCAGTACAAGACCTTCGACAACGTGCGCGTCAACCTGATCGAGCGCAAC
+CTCTCGGTGGCGCTCAACGAGGTGTTCGCCGGCTTCAACCCGCTGGACCCGCGAAACCTCGACGTGTCCC
+CGCTGCCTTCGCTGGCCAAGCGCGCCGCCGACATCCTGCGCCAGGACGTGGGCGGGCAGGTCGACATTTT
+CGATGTCAATGTGCCCACCATCCAGTACGACCAGAGCACCGAGGACAAGATCAACCAGCTCAACCAGCAG
+CGCGCGCAGACCTCGATCGCCCTGGAAGCACAGCGAACTGCCGAGGCCCAGGCCAAGGCCAACGAGATCC
+TGTCCCGCTCGATCAGCGACGACCCCAACGTGGTGGTGCAGAACTGCATTACGGCCGCGATCAACAAGGG
+AATCAGCCCGCTGGGTTGCTGGCCGGGAAGCTCAGCGCTACCCACCATCGCAGTGCCGGGACGGTAACCG
+CGAAGATTGACCCCATGCCGATCCCCTTTGCCGATGGGATGCTCAGCCGGCTGGGTCGCCGCGGGGCAGC
+GCTCGACCTGATCGAGGAGTTCGAGGACGAGTCCGGGGAGCCCCCCGCATCCCTGAGCCCCGCCGACCTG
+CTGGCCGCCGAACCGGCCCTGCTGCTGCAGAAGATGGAGAACCGCCTCGTCCGGCACCACCTAGCCAATC
+CGGACGTGTTGAGCGGCGAACAGCTGCGCAAGCTGCGCTACATCCTCAATTTCGCCAGGCTGGCCGACTT
+CGAACCGGGGGCCGCGGGGCCGGGCGGAAGCCGCGGTCGCGGGGACATCTCGGTGGGCGGCCAAGTCGCG
+CCTTGGCGGTCCCGGGTCGTCGACGCGTTGTACGCACCGCTGCGCGAGGAGCCCGATCCGGTCACGGCGC
+TGGAGGGCGCGAAAGACGTGCTGGCGACGCTGGTCGACGACCAGGACGATCAGCGTCGAGTGCTCATCGA
+GCGCCACGGCAGCGACTTCTCCGCGACGGAACTCGACGCCGAGGTCGGCTACAAGAAGCTGGTGACCGTC
+CTCGGCGGCGGCGGGGGCGCGGGCTTCGTCTACATCGGCGGCATGCAACGGCTGCTGGCGGCCGGCCAGG
+TGCCCGACTACATGATCGGCTCGTCGTTCGGGTCGATCATCGGCAGCCTGGTGGCCCGTGAACTGCCGGT
+GCCGATCGACGAGTACGCCGAGTGGGCCAAAACGGTGTCCTACCGCGCCATCCTGGGCCCGGAGCGGCGG
+CGCAGCCGCCACGGGTTGGCCGGAATGTTCACCCTGCGCTTCGACCAGTTCGCCCATACCCTGCTCAGCC
+GTGCGGACGGCGAACGGATGCGCATGTCGGATCTGGCAATCCCGTTCGATGTCGTCGTCGCCGGTGTGCG
+CAGGCAGCCTTATGCGGCGCTGCCGTCCAGGTTCCGCCATCGCGAGCGGTCTACACTGACGTTGCGGTCG
+CTGCCGTTTCTGCCGATCGGTATCGGCCCGTGGGTGGCGGCACGCATGTGGCAAGTCGCGGCCTTCATCG
+ACTTGCGGGTGGTCAAGCCGATCGTCATCAGCGCCGACGGCGCGACACGCGACGTCAACGTCGTTGACGC
+GGCGTCTTTCTCGTCGGCCATCCCCGGTGTGCTGCACCACGAAACCAGCGACCCGCGGATGCTGCCAATC
+CTCGACGAGTTGTGCGCCGACCAGGACGTCGCGGCGATGGTCGACGGCGGCGCGGCCAGCAACGTCCCGG
+TCGAATTGGCGTGGGAGCGGGTCCGCGACGGGCGGCTCGGCACCCGCAACGCGTGTTATCTGGCGTTCGA
+CTGCTTCCATCCGCACTGGGACCCCCGACATCTGTGGCTGGTACCGATCACCCAGGCGGTCCAGCTGCAG
+ATGGTGCGCAACCTGCCCTACGCCGACCACCTCGTCCGATTCGAGCCGACGCTGTCGCCGGTGAACCTGG
+CGCCGTCCGCGGCGGCCATCGACCGGGCTTGCCGGTGGGGGCGCGACAGCGTCGAACCGGCGATTGCGGT
+GACATCGGCGCTGCTGGAGCCGACGTGGTGGGAAGGCGACAGGCCCCCCGCCGCCGAACCCAAGGAACGC
+ACAAAGTCGGCGGCCTCGTCGATGAGCGCCGTGATGGCCGCGATTCAGGCGCCGACGGGCCGGTTTCGGC
+GATGGCGAAGCCGCCACCTGACCTAGCGACGGCTACAGGGAACGCGACCTCGGCGGTCGAAAGCAAACCA
+GGTGCACAAGTGCAACAACAACGATTCCGATCACCAACCCAGTCGCCGCGCACGCCGCGGTGCTGACCAA
+CCAGGTCAGCGCGCCACCAGCAGACCCCACCAGGTGGTCATCTAGGTGGTGAACCAGGCGGTACGGGGCG
+TGCCAGCCGAGGTGGTCGCTGCCCACAAGCACCATGTGGCCGCCCACCCAGAGCATGGCTCCCATCCCGA
+CCGCTGACAGCGCCGATAGCAGTTTGGGCATCCCCGCGACCAGGCCCCCGCCGATCCGCTGCCCGAATCG
+GGACGCGGTCTGGGTGAGGCGCAGGCCGACGTCGTCCATTTGGACGATGACGGCGACGACACCGTACACC
+GCGGCGGTGATGACGAGGGCGACGATGACGAGGACGATGAGGCGCGGCACGAATGGCTGGTCGGCCACCT
+CGTTGAGGGCGATCACCATGATCTCGGCGGATAGGATGAAGTCGGTCCGGATCGCCCCGGCCACCAGCTC
+GCGTTCGGCGACCTGCGGCGCGGCGTCGTGGCCACGGCCGCCGATGACGCCGCACACCTTTTCGGCGCCC
+TCGTAGCACAGATACGTGGCGCCCAACATCAGCAGCGGGGTCAACAGCCACGGCACGAGCTGGCTGAGCA
+GCAATGCACCGGGAAGGATGAGCAGCAGCTTGTTGCGCACCGACCCGATCGCGATGCGTTTGATGATCGG
+CAGCTCACGCTCAGCGGTGATCCGGTGGACGTATTGCGGCGTCACCGCCGTGTCGTCAATGACCACTCCC
+GCAGCCTTTGCCGTCGCACGACCGGCGGCGGCGCCGATGTCGTCAATCGAGGCGGCGGCCAGCCGTGCAA
+GAACCGCGACATGGTCCAGCAGTCCGAACAGACCGCCGCTCATCGCGACTCCGCCATCACGATCGAGGTT
+ACCGTCTGCCGTCGTTGTCGCCAGCGGTGCCGTAGAGCCCGCCGGGTCGCAGCGCTCGCAGAGCCACCCG
+GCCCCCCGGGTCTTCAGCGGTGGCGGGCACGACCGCGACGCAATCGGCACCGGCATCCGCGTAGGCGCGG
+AGCCGGGCCGCCACTCGATCGGGGCTACCCAACGCACACACCCGGTCGAGCAGTTCGCTGGGGACAGCGA
+CCGCCAGTTCGCGGCGAGTAGCCCGGGACCGCGCGCTACGGACCAGGCCGTCGAAACCCAGCGCGCTGAA
+CATTTCGCCATAGCCGGGCGGGGCGAGGTACACCGCCAGCTGAGCTGCCAGCTGGGAGTGCGCGGCCGCA
+CCGGGGTTGACGGCGACCGGCACCCACACCGTGAGGCGCGGCGCGGCACGGCCGGCCGCGGCGGCTGCGC
+TGTCGATCGCCGCACGAACCCGCCCGACACGGAACGGCGATGCCAGGTTGAGCACGACCTCATCGGCGTG
+CTGCGCGGCCAGGCGAATCATGCCAGGTCCAAACGCCCCCAACGCAATTCGCGTATCGGGCGCCGCACCG
+CGCAGCCGGAATCCGCGGCTGTTGACGTGACGGCCGCTGTATTCGACCCGCGCACCGGTAAATATCGACC
+GCAGGCATTCGATGGTTTCGCGCATGACCGGCACGTGGTGCGCCCAAGGTCGGCCATGCCAGCCGGCCAC
+GATCGCCGGACTGGAAGCTCCCAGCGCGAGGTCAACCCGACAGCCGGTGAGAGAAGCGACCGAACTGACC
+CCTAGCGCCAGCCCCACCGGACCGCGAACGCCGACGGCTAGCGGTCCGACCTTCAGCGTCATGTTTGGCG
+TGCGGAGCCCGATCGAGGTCGCGAGCGCGAACGCATCGTAGGTCGCCATTTCGCCGATCCACAGCGCAGC
+GAAACCCGTGTCAGCGGCCGCGAGCGCGACATCGGTTGCCTCGTGGTCGGGGCGGTCAAGCCAGAACGGT
+AGGGCGACTTCGATATCGGTCATAGCATCGACACGTCGGCCGGCTGGTCGAGCAGGACACGCCCGGGCAG
+TTCGCGTGATGCCTCGTTGACCTGGAAATGGGCGGTAGCGGTGAATGCGTCGCGGAACCGGCGCTGCAGC
+GGTGCGTTGTCGTAGATGGCGGTGCCGCCCGCCAGATCATACATGCTGCGCACCACGTCGGCCGAGGTCC
+GTACCGCGTGCGTGGCCGCCAACCGCAGCCGGTTGCGCATCGTCACCGGTACCGCCTCGGCATCGTGGCT
+GACCTGCCAGGCCGCCTCGATTACCTCGTAGAACAGGGCGCGGGCGGCGCCCAGCGCCGACTCGGCGGTT
+GCCGCCGCGGCTTGGGTCGCCGAACGTTCCGCCAAGGTCCGAGTGGACCCAAGCCCTTTCTTGCCGCCGG
+CCAGCTCGACCAGATCGTCAATCGCGGCGCGCGCATTGCCCAACGCAGCCGCGCCAATCGACAACGCGAA
+AAATCCAAACACCGGAAAGCGATACAGCGGCCGGTCCACGATTGGTCCGTCAAACACCGAGAACACGCGA
+TCAGCGGGCACGAAGACGTCGTCGGCAACGCAGTCGTGGCTGCCGGTGCCACGCAAACCCAATGTGTGCC
+AAGTGTCGAGGACCTGCAGCTCGTCCTTGTTCAGCGCGACGACCGACGGCACTTGCCGGTCGTCGACGAA
+GCAGCCGGCGAACATGATGTCCGCGTGGTTGATCCCGCTGCAAAACGGCCAGCGTCCGGACACCACGACA
+CCGCCGTCGACGGACCGGGCCGTGCCACGTGGCGCCCACACCCCCGCCGCGACACCCCGCCCCCCGCCGA
+ACATTTCCTCGCGGCTGCGCGCCGGCAGGTAGGCGACCAGCAGGGCACTGGTAATCGCGATCGACACACA
+CCATCCCGCTGACGCGTCACCACGCGCCACCGCCTCGGCGCACCGCAGCGCCCGCCCGGGTGCCAGCTCC
+GGCGCCGCAACCTCACGCGGCATGGTGGCGCGCAGCAAGCCGGCCTCGCGCAGCCGGGTCACCAGCTCGT
+CTGGCAGCCGACGATCGCGCTCGATTTCCGCGGATCGCGCTCGGGCCCACCGCGCGATCTTCTCGGCGAG
+GATCTCGATCTCGGTTTCGCTTTGGTTCACGGGCGGCTCCTGATGACGGTGGCGGTTCAATGAAGTTACC
+ACCCTTGGTTCAGTCATTGAACCAGGTACAGTTGGTGGACCATGGCCGTTTCCGATCTATCCCACCGCTT
+CGAAGGGGAGTCGGTCGGCCGGGCGCTCGAGCTAGTCGGTGAACGCTGGACGCTGCTTATCCTGCGTGAG
+GCGTTCTTCGGGGTGCGGCGGTTCGGTCAGCTCGCGCGGAACCTTGGCATTCCGCGGCCCACGCTGTCCT
+CGCGGCTGCGGATGCTCGTCGAGGTGGGTCTTTTTGACCGGGTGCCATATTCCTCCGACCCCGAGCGACA
+CGAGTACCGGCTCACCGAAGCGGGCCGCGATCTGTTCGCCGCGATCGTCGTCCTCATGCAGTGGGGGGAT
+GAGTACTTGCCACGCCCAGAAGGACCACCGATCAAGCTGCGCCACCACACCTGCGGCGAGCACGCCGACC
+CACGCCTGATCTGTACCCACTGCGGCGAGGAGATCACCGCGCGCAATGTGACACCTGAACCGGGGCCGGG
+CTTTAAAGCCAAGCTGGCGTCCTCATAACGATTCCCAACCTCAAATTGTTGCGAATCGATAATGCAAGCC
+GAACCACGTCGCCGAACAAGGCCGTACACCTTGGCCGGGAAACTATCGTCATTTTGTGCACCGTCGAACG
+GCCCTGAAGCTCCCGCTGCTGCTGGCGGCAGGCACGGTGCTGGGCCAAGCGCCGCGGGCCGCCGCCGGAG
+AACCAGGCCGGTGGTCGGCCGACCGCGCACATCGCTGGTATCAAGCGCACGGCTGGCTCGTCGGTGCAAA
+CTACATCACCTCGAACGCCATCAACCAGCTCGAGATGTTCCAGCCAGGCACATACGATCCCCGGCGCATC
+GACAACGAGCTGGGCCTTGCGCGGTTTCACGGGTTCAACACCGTGCGAGTCTTCCTCCACGACCTGCTGT
+GGGCCCAAGACGCGCCCGGTTTCCAAACCCGGCTCGCGCAGTTCGTCGCCATCGCGGCGCGATACCACAT
+CAAACCGCTCTTTGTCCTGTTCGACTCCTGCTGGGACCCGCTCCCCAGACCGGGTCGGCAGCGGGCGCCA
+AGGGCTGGGGTGCACAACTCCGGGTGGGTGCAAAGTCCGGGTGCTGAACGCCTCGATGACCGCCGCTATG
+CCAGCACGCTGTACAACTACGTCACGGGTGTGTTGGGCCAATTCCGCAACGACGATCGCGTGTTGGGTTG
+GGACCTGTGGAATGAACCCGACAATCCCGCGCGCGTGTATCGCAAGGTGGAAAGGAAAGACAAGCTCGAG
+CGCGTCGCGGAGCTCCTCCCCCAAGTGTTCCGATGGGCCCGCACGGTCGATCCGGTTCAACCGCTGACCA
+GTGGTGTCTGGCAAGGGAATTGGGGAGATCCCGGACGCCGCAGCACCATCAGCGCCATTCAACTCGACAA
+CGCCGACGTGATCACCTTCCACAGTTACGCCGCGCCGGCCGAATTCGAGGGCCGCATCGCTGAGCTCGCT
+CCGTTGCAGCGGCCAATCCTGTGCACCGAGTACCTGGCGCGGTCCCAAGGCAGCACTGTCGAGGGAATCC
+TGCCGATTGCTAAGCGGCACAACGTTGGTGCGTTCAATTGGGGTTTGGTGGCGGGAAAGACTCAGACCTA
+TTTGCCGTGGGATTCGTGGGATCACCCCTACCGCGCGCCCCCGAAGGTGTGGTTTCACGACCTGCTACAC
+CCCAACGGCCGGCCGTATCGGGACGGCGAAGTTCAAACGATTCGGAAGCTGAACGGGATGCCGAGCCAGG
+ACTAGGCTTTCCCCAGCCCGCATTGGGCGCGGCTCGCCGAATGCGAGCCCGACACCTACTGAAAACCATG
+TGCGCGGTCGGCCTGGCGGAACCGGATCAGGCGGCGATACCGAGTTGCTGGTTAATCTGCGGCCAGGACA
+GCAAACCCCAGGGGGTGAGCAGTATCCAGTCGTGGATTTGCCAGGGGGCCAGTACGAAGCTGAACGGCGC
+TCCTTGGACTACGGCTGTGTGCTCGAGGACAACCGCTTGTTGTGCGAGCGGATCAAGCGAGCCCGAATAG
+ACATACGTCGGCGGAAGACCGTTCAGCGACCCATACAGCGGACTGACCAGCGGGTCGTTGACCGCAAGAT
+TGCCTGCCCACGCCTGGCTGATCTGCCAGGTCCCCACATCGAGCCACGGGGACAGCAACACCATGGACGA
+CGGTACTGGGTTGCCCTGGCTCACCATGTATTGGGCGGCCGCCAGTGCGAGGTTGCCGCCCGCGGAGTCC
+CCGACCACGCTGACGTTGGAGACCCCGTGTTGCGCGATTTGCGTGGAGATGAGCCCGGCCATCGCCGGTA
+CTACCGTCCCGGCAGTGCCTCCTTCCTGCACCAACGGGTAAATCGGCACTTGCACGGTCGCGCCGGTCTG
+GTAAGCCGTCACCGAGTAGTTGAGCCAGTGGAAGATTGACGGCGGCAGGATAAACGCGCCGCCGTGAATG
+GCAACCACGTATTCGCCGGTTGGATGAGCCGGCGTGATCTGCACGACGCTCATCCCGTCATAGGTGGTGT
+ACTGGACCGTCTGTCCCAGCAGCGAGTTCAGCAACGGCGGTGGGGAGTTGCCAAGAAACCACGACAGCGG
+CGGTATGTCGCTGGCAATGAGCGCTAAAAGTGGATTGTTTGGGATTGCAAAGTGAGTTTCGAGCGCAGAC
+AAACTCAGCAGGGGTTTCACCGGCCACAGCGAAGCGATGTCGAATCCGGCAGCCCCTGACGGCGTGCCGG
+TGAAGATCCCTGCCTGCGCCGCCGCGAAAGGCGGAACCTGCGTGAATCCGGCGGCCAGCGCCGTGGGGGC
+CCGCTGAATTTCCTGGTGAATCGTGGCAAAACCGTTCCCGATACCGCTGGCGAATTCACTCTGCAACAGC
+GAAGCGTTGGCCAGCTCGGCGGCGGCATACCCCTTGGCCGCGCCTGTCAATGCCTGCACAAACCGCTCAT
+GAAACACCGCAAGCTGTGCGCTAAGAGCTTGATAGTCCTGACCATGGGCGGAAAACAAAGCCGCGATCGC
+GGCTGACACCTCGTCCTCGGCAGCGGCTAATACCGTCGTGGTGGCACCCGCGACACCCTGGCTCGCCGTC
+GCGACCACCGAACCAATCGAAGCCACGTCTGTGGCCGCGGCGGACATCACCTCCGGCAACGCAACAACAT
+AAGACACCACGCCGCTCCCGCCACCTCACGGCAACTTCCCCAGTTGCCCAGCCACTACCGATCGCCGAGT
+AGCCGGAGCTTATGCCCACGCCGAGTAGTCACGTGCCAGTTTGCGCGAATTCCCAAAGTTAGACCGGCAA
+ACGTGACGGCACCGATCCGTGTGGTGCAGCCGCCGGGAATCGAACACTCTCCGACGCAAAACGACCTGCG
+ATTACGCGCGGGGCGTTGATGGCCTCAAGAAGGAATGAGGCGGCGAACGCGGGCGTTGGGGTGCCGCTAT
+GCGTTGAACAATTGCTATACGATTGTGCAACATCAGCTATCGTCGTACTCATGACCGCGACCATCGGCTT
+CCGACCTACTGAAAAAGACGAGCAGATCATCAAGGCCGCAATGCGCAGCGGCGAGCGCAAGAGCGACGTC
+ATCCGGCGGGCACTGCAGCTGCTCGAACGGGAAGTGTGGATCAAGCAAGCTCGCACCGACGCTGAGCGAC
+TTCGAGACGAGGATGTCTCCACTGAACCGGACGCGTGGTGATTCGGGGAGCGGTCTACAGGGTCGACTTC
+GGCGATGCGAAGCGAGGCCACGAGCAACGCGGGCGGCGCTACGCCGTGGTCATCAGCCCCGGCTCGATGC
+CGTGGAGTGTAGTAACCGTGGTGCCGACGTCGACAAGCGCCCAACCTGCGGTTTTCCGACCAGAGCTGGA
+AGTCATGGGAACAAAGACACGGTTCCTGGTGGATCAGATCCGGACGATCGGCATCGTCTATGTGCACGGC
+GATCCGGTCGACTATCTGGACCGTGACCAAATGGCCAAGGTGGAACACGCCGTGGCACGATACCTTGGTC
+TGTGATGGCCGTCGCATCTGCAAATGGGCCACCGACCTGGCCCTTCGGTGGAGCTGCCGGGAATCGAACC
+CGGGTCCTACGGCATTCCCTCAAGGCTTCTCCGTGCGCAGTTCGCTATGCCTCTGCTCGGATCTCCCGGT
+CACGCGAACTAGCCGAGATGACGATCCCAGTCGCTGTGGTTGTCCCGAGGAGTCCCGCGACCGGACTCAT
+CGGTGGATCCCTCTAGCTGATGCCAGGGTCCGGGCCGAGGGCGTTCCCGGTCTGACAGACTAGCCGTCGC
+TTAGGCAGCGAGAGCGTAGTCGCGCTGATGTGAATCGGCGCTTATTTGGTCGCAACGACGCTTACGGTGG
+TCTCTTGCCTGCACCGGCACGCTTCCCTTGATTCGATGCGCGAAGTCGAAACCGTTCAGCCCCTCGCATC
+CCTGCCGACCTTCGGCAGGACCATCAATCCTACGCCGCTCTCAACAACCGGCAACGCCATTAACTTCCCG
+GTCAGATCACGAAGTTCAGGCGCTCGAGGATGTGACCGGCCAGCTCCTTGTCGCCGCCGAGTTCCACATC
+CTGGCTGCGCGCCGGGCTCATCGGGCGCCCGCCGGCGAGCCTGGTGAACTGCAGTCCGTCCAGGCGGATC
+GTCGCCGTCGGCGCCGGCCCACCGAAGTCGTCGACCACCCGCGCTCGACCGTCCACGGAAACGCGGATGC
+TGCGAGACAGCGGGCCGGTCAGCTCCAACAGCACGCGGGAGCCGTCGGGCGCTTTGGCCAGCTTGCCGAC
+GACGAACCCCATGGTGGCCGCTATCTCATCGAGGACCAGCGGTGACGCCGGCCCGCCGAGTTCGTCGTCG
+GACGACGGGCGCTGCACCGCCGCGCGGATGTCCTGTTCGTGCATCCAGCAGTCGAAGATGCGTATCCGCA
+TGAACCGCCCGTAGCTGTCGGGGCCCGAGGGGGTGGTCGTCGGCGCATTCCATTCGTCATCGGAAAGGCT
+CGCTAAGACCTTGCGGCGCTGGCTAGTCACTGCGCGAAACCGCTCCAGCAAGCCCACACCCGATTCTGTG
+CCCAGATGACGCACCCAGCACTCGTTCATCACGCCGATGGGGTTGCGGACATGCGCAAGCGCAGAGACGT
+CTGTGTCTGGTTCTGGTGCGGCGATGCCGAGCAGAAATGACTCGGTGCCGATGATGTGCGACACCACGGC
+CTTGACGTCCCAACCGGGCAGCGGACTCGTTGCCTGCCAGTCCGTCTCGAGCAGTCCATCGAGCAGCGCA
+TCCAGGGAGTGCCAAACGGCGAACAGCCCGGCCAGCACGTCGGACTTGTCCAGTGTGGTAAGGGGACGGC
+CCGGTGTGGTCACAAAGTGATGCTAAACCTCACATTGCCCAGTTCTCGATCAGGTCATGCCCTTAGCGCG
+CCGACCCAACTCGCGGAGCACTTCACGCTGGGCATCACGACGGGCCATGTCCTGGCGTTTGTCGCGGGCT
+TGCTTGCCTCGGGCCAGCGCAAGCTCAACCTTGACCTTGCCTTCGGCGAAATACAGCGACAACGGCACCA
+GGGCGAAGTTGCCTTCGCGGATCTTGCCGACCAAGGTGTCGATCTGGCGGCGATGCAACAGCAGTTTGCG
+GTTGCGTCGCGGCTCGTGGTTGGTCCAGCTGCCGTGCCGGTATTCCGGGATGTGCGCGTTGCGCAGCCAC
+ACTTCGCCGTCGTCGATGGTGGCGAACGAATCGGCCAGCGACGCCTGCCCTTCCCGCAGGCTCTTCACCT
+CCGTGCCTTGCAGCGCAACCCCGGCCTCGAACACCTCGATGATCGAATAGTTGTGCCGGGCTTTGCGATT
+GCTGGCAACGATCTGCCGGCCGCCACGCGACGACTTGGACACAGCTATCGCCGCACGTAGAGGCGCAGCG
+TTAAGTAAGCCGTCAACCCCGACATCGCCACGCCCAACAGCAGCAGCCACGGCGTGATGAAGAGGATGTC
+CGCATAGTCAACCTTGGCAATGAGATTGGCTTGATAAAACTGGTTGAGCGCATTCTCCAGGAACAAAGCC
+CGCACCACCATCAAGCCCGCTACGGCGATGCCGACACCCATCGTCGCGGCCAGCATCGCCTCCACTAGGA
+ACGGCAGCTGGGTGTACCAGCGGCTGGCACCGACCAAGCGCATGATGCCGATTTCGGTGCGCCGCGTATA
+GGCAGCCACTTGGACCATGTTGGCGATCAACAGAATCGCCCCGATGGCCTGAACCAGCGCGACCGCGAAC
+GCGGCACTGCTCAAACCATCAAGGACCGCGAACAGCCGGTCAATCAGCTCCTTTTGATTCAGCACGTCCA
+AGACGCCGGGCTGCCCCTTCATAGCGGTGTCAAAGTCCTTGTGCTGCTCGGGGTTCTCCAGCTTGACAAT
+GAACGACGCCGGGAACGAATCCTTGCCCGCCACGTCCTTGAACTGGGGAAACTTGCGGATGGCATCGTCA
+TAGGCCTGCTGGCGGTTAAGGAAACGCACCGCTTTGACGTCGGATCGCGTTTCGATCTTCTCCCGTAACG
+CTTTGCACGCAGTGGTATCGCAGGACGAGTCGTTGGCGGAAACGTCTTCGGTGAGAAAGACCTGAGATTC
+CACCCGGTCGAGATAGATGGCCCGGGAGCTGTCGGCCAACCGGACCACCAACATACCGCCGCCGAACAAT
+CCGACCGAGATCGCGGTCGTCAGGATCATCGCGATCGTCATGGTGACATTGCGACGAAAGCCGGTCAGGA
+CCTCATTTAGCAGGAAACCGAAACGCACTTAGCGATCCATCCCGTAGACGCCACGCTGTTCGTCGCGTAC
+CAGCCTGCCCAGGGACAACTCAACCACCCGTTGGCGCATCGAGTCGACGATGTGGTGGTCGTGCGTGGCC
+ATCAGCACCGTCGTGCCGGTGCGGTTGATCCGCTCCAATAAGTCCATGATGTCCCTACTGGTCTCCGGGT
+CGAGGTTTCCGGTGGGCTCGTCGGCCAGCAGTACCAGCGGCCGGTTGACAAAGGCGCGGGCGATCGCAAC
+GCGCTGTTGCTCGCCGCCCGACAGCTCGTCTGGCAGCCGATTGGCCTTGCCGGACAGACCGACCGTCTCG
+AGCACTTCGGGGACCACCCGGTTGATCGCGTCGGTGCGTTTGCCGATGACCTCCAATGCGAAGGCGACGT
+TGTCGTACACCGTCTTCTGCTGCAGCAACCGAAAGTCCTGGAAGACGCAGCCGATCACCTGACGCAGCTT
+CGGTACGTGGCGACCGCGGAGTTTGTTGACATGAAACTTCGAGACCCGGACATCACCACTGGTCGGCGTC
+TCCGCTGCCAGCAGCAGCCGCATGAAGGTTGACTTGCCCGAACCCGACGGGCCGATCAGGAAGACGAACT
+CACCCTTGTCGATCTTGACGTTGATGTCATCCAACGCCGGACGCGCCGACGATTTGTACTGCTTGGTGAC
+ATGGTCCAGGGTGATCATCACGGCACGCCAGTGTAGCGGTGAGATTAGCGGGCAGGCGAAATCAACGGGT
+CGGTGGCTCGGATTTGGGGTAGGTGCCGGCCGTCGGACCCGGCCCGGGCTGCGGTAGCGGTGCCGGTGGT
+GTTGGGGTCGTGGTGCCCGGGCCGAACGGCGGCGGCAACTCAAACGGCGGCGGGACAGCCGAATCGGTCG
+TGGTTTCGGGCGGGCTGACCGGCGGTGTGCTCGACGTGGTGGTCGGCGTCGCCTTGACGGTGGGTGGTTG
+CACTCTGGTTCGCGGCACCCAGGTGTAGTCAGGATCGGGCACGAAGCCCGGCGGCACCACCTGGGTCGGC
+GGAGAGTCACCAGGACCTGGTGCCTGTGGCCTATAGGTCTCGTAAATCCACCACACCGCCAGGAACGCGG
+CGATCAACACCAGGGTCGACGTGCGGATCCGGCCGAACAGATAGCCCGGCCAGTGCCGTTTCTGGTTGCT
+GAGCTTCACGCTACTGCTCCGGACTTTCTGCCACCGCGGCCCGCGCATCGGCCGCGGTGACTATCCCGGC
+GCGGGTGAGCGCGCGGATCACCAGCACCCGCAACTGCCGGCCCGCCTCGAACTGCTTGCCGGGTAGGGTG
+CGGGCCACCAGTCGCAGGGTGACGGTGTCCACTTCGATGCGCTCCACGCCCATGACCGTGGGCTCATCCA
+ACAACAGCTCTCCCAGCAGCGAGTCGTGGCGCGCGTGCTCACACTCCTGATGCAAGACCTCGTTCACGCG
+GCCGAGATCGGCGCTGGTCGGGACGGGGATGTCCACGACCGCGCGGGCCCAGTCCTTGGACAGGTTGACC
+GACTTGACGATGTTCCCGTTGGGAACGGTGAACACCTCACCCTCGCTGGAACGCAGCTTGGTCACCCGCA
+GCGTGACGTCCTCCACCGTGCCGGCCGCGTTCTCCGGTGACCCCACCATGCTGAGTTCGACCAAATCGCC
+GAACCCGTACTGCTTCTCCACGATGATGAAGAACCCGGCGAGTAGGTCCTGCACCAGGCGTTGGGCACCG
+AAGCCCAGCGCGGCGCCGAGCACCGCCGCCGGCCCCACCAACGCACCGACCGGAACCGGCAACACATCGA
+TGACCTCGTACACAACGACGACATAGATGAGGACGATCGACACCCACGAGATCACCGACGCTACGGCCTG
+GCGGTGCTTGGTTGCCTCCGAGCGCACCAACGCGTCGCTTTCGGTAAACCCCAGGTCGAGGCGCCGGGTC
+ACCCGGTTGGCAAGCCAAGTCACGAAGCGGGCCGCCAGCACCGCTGCGATCAGCAGCATGACGATGCGCA
+GGCCCCGGTTGAGGATCCAGTCGCCGATTTCACCGCGCCAGAAGTTATGCCAGTGCTGTGCTATCGAGGT
+GGCCAGAACTGTGCCGCTAGTCGTCATTACGTCGATTGCGCCACCGGATCCCGGCTTCCAGGAATCCGTC
+GAGGTCTCCATCCAGAACGGCCGCCGGATTGCCGACCTCGTACTCGGTGCGCAGATCCTTGACCATCTGA
+TATGGGTGCAGCACATAGGAACGCATCTGGTTACCCCAGGAGCTGCCGCCGTCGGCCTTCAACGCGTCGA
+GCTCGGCGCGTTCTTCTAAGCGCTTGCGTTCCAACAACTTTGCTTGCAGAACCCGCATCGCCGCGATCTT
+GTTCTGCAGTTGGGACTTCTCGTTCTGGCAGGTGACCACGATACCGCTGGGAATGTGGGTGAGCCGCACC
+GCTGAGTCTGTCGTGTTCACCGATTGCCCGCCGGGCCCGCTGGAGCGATAGACGTCGACGCGGACATCGC
+CCTCGGGGATGTCAATGTGGTCGGTGGTCTCCACCACCGGCAGCACTTCGACTTCGGCGAACGACGTCTG
+TCGCCGGCTCTGGTTGTCGAACGGGCTGATCCGCACCAGCCGGTGGGTGCCCTGTTCGACCGACAACGTG
+CCGTAGGCGAACGGTGCGTGCACGGCGAACGTGGCGCTTTTGATGCCGGCTTCTTCGGCATAGGAGGTGT
+CGAACACCTCGACGGGGTATTTGTGCTGCTCGGCCCAGCGGATATACATCCGCATCAGCATCTCGGCCCA
+GTCTGCGGCGTCCACCCCACCCGCGCCGGACCGGATGGTGACCAGCGCCTCACGCTCGTCGTATTCCCCC
+GACAGCAGGGTGCGCACCTCGGTGGCCTCGATGTCGGCGCGCAACGACTTGAGCTCCGCGTCGGCCTCGG
+CGACGGCATCGGCGGCGGCCGCGCCCGCTTCCTCGGCGGCCAGCTCGTAGAGCACCGGCAGGTCGTCCAG
+GCGGCGCCTTAGCTCCTCGACGCGCCGCAGCTCTCCCTGGGTGTGCGACAACTCGCTGGTCACCCGCTGC
+GCCCGGGTCTGGTCGTCCCACAAGTGCGGATCAGATGCCTCATGCTCGAGCTTCTCGATGCGGCTGCGCA
+GACCCTCGACGTCGAGCACCCGCTCCACCGTGGTCAGGGTGCAGTCCAAGGCGGCGATGTCGGCTTGACG
+GTCGGGGTCCACAGCAGCCAAGGTTACCGGCATCAGCGTCTAGCATCAGATGACCGTCATGTGCACCGCA
+CGACTGCGGCCCAGCCCATTCGCAGCCCCTTGCGCCGCAGCCGGGCACAACACAGAAGGCTCGAGTATGC
+GTCCCTATTACATCGCCATCGTGGGCTCCGGGCCGTCGGCGTTCTTCGCCGCGGCATCCTTGCTGAAGGC
+CGCCGACACGACCGAGGACCTCGACATGGCCGTCGACATGCTGGAGATGTTGCCGACTCCCTGGGGGCTG
+GTGCGCTCCGGGGTCGCGCCGGATCACCCCAAGATCAAGTCGATCAGCAAGCAATTCGAAAAGACGGCCG
+AGGACCCCCGCTTCCGCTTCTTCGGCAATGTGGTCGTCGGCGAACACGTCCAGCCCGGCGAGCTCTCCGA
+GCGCTACGACGCCGTGATCTACGCCGTCGGCGCGCAGTCCGATCGCATGTTGAACATCCCCGGTGAGGAC
+CTGCCGGGCAGTATCGCCGCCGTCGATTTCGTCGGCTGGTACAACGCACATCCACACTTCGAGCAGATAT
+CACCCGATCTGTCGGGCGCCCGGGCCGTAGTTATCGGCAATGGAAACGTCGCGCTAGACGTGGCACGGAT
+TCTGCTCACCGATCCCGACGTGTTGGCACGCACCGATATCGCCGATCACGCTTTGGAATCGCTACGCCCA
+CGCGGTATCCAGGAGGTGGTGATCGTCGGGCGCCGAGGTCCGCTGCAGGCCGCGTTCACCACGTTGGAGT
+TGCGCGAGCTGGCCGACCTCGACGGGGTTGACGTGGTGATCGATCCGGCGGAGCTGGACGGCATTACCGA
+CGAGGACGCGGCCGCGGTGGGCAAGGTCTGCAAGCAGAACATCAAGGTGCTGCGTGGCTATGCGGACCGC
+GAACCCCGCCCGGGACACCGCCGCATGGTGTTCCGGTTCTTGACCTCTCCGATCGAGATCAAGGGCAAGC
+GCAAAGTGGAGCGGATCGTGCTGGGCCGCAACGAGCTGGTCTCCGACGGCAGCGGGCGAGTGGCGGCCAA
+GGACACCGGCGAGCGCGAGGAGCTGCCAGCTCAGCTGGTCGTGCGGTCGGTCGGCTACCGCGGGGTGCCC
+ACGCCCGGGCTGCCGTTCGACGACCAGAGCGGGACCATCCCCAACGTCGGCGGCCGAATCAACGGCAGCC
+CCAACGAATACGTCGTCGGGTGGATCAAGCGCGGGCCGACCGGGGTGATCGGGACCAACAAGAAGGACGC
+CCAAGACACCGTCGACACCTTGATCAAGGATCTTGGCAACGCCAAGGAGGGCGCCGAGTGCAAGAGCTTT
+CCGGAAGATCATGCCGACCAGGTGGCCGACTGGCTAGCAGCACGCCAGCCGAAGCTGGTCACGTCGGCCC
+ACTGGCAGGTGATCGACGCTTTCGAGCGGGCCGCCGGCGAGCCGCACGGGCGTCCCCGGGTCAAGTTGGC
+CAGCCTGGCCGAGCTGTTGCGGATTGGGCTCGGCTGATCAGCGACCGAGCAACACCCCTGGGTTGAGGAT
+CCCGGCCGGGTCGAGTGCGGACTTCGCCGCCCGCAGGGCCGCCGCGAACGGGTCGGGACGCTGCCGGTCA
+TACCAAGCGCGGTGGTCGCGACCGACCGCATGGTGGTGGGTGATGGTACCGCCACTGGCGCTGATCGCCT
+CGGACACGGCAGCCTTGATCTCGTCCCACTGCGCGTCGAGCGACCCCCAGCGCCCGCCGGCATAGATGCC
+GTAGTAAGGAGCCGGGCCGTCCGGGTAGACATGGGTGAATCGACAGGTCACTACTCCGGTCCCGCATACC
+TTCCAGATCGCGGTCCGAGCGGCATCGGTCACCGCGGCATGTAGAGTATCGAATCCGTCCCAGGTGCAAG
+CGGTTTCGAATGTTTCGGCGATAACTCCGCGGCGAACCAGCGCGTCTCGTTGATACGGCATGCGCAGAAA
+CGCCGAGCGCCAGTTCGCGGCTGCGTTGTGTTCCGTTGCGTCGCTTGTAGTTCCGCGGCTACGTTGCGCG
+GTCACCGTGCCGCCGTGTTCGGCGGTGATCGCCACCGCCCGGTGCAGCCACGGGTCTATCGGGTGGTCGG
+CAGACTCGAACGCCAACACCAACAGCCCGCCACCAACGGACGTGCCGGCATTCAGCAACGCCTCGGCCGG
+ATCCAACAGCCGGCAGTTGGCCGGGTACAGCCCCGCCTGAGCGATCGTCCGGGTCGCGGCGACCGCGGCG
+GCCCAGTCGTCAAACACCACGGACACCGTGACCTGCCATCGCGGACGGTGTTGCAGCCGCATCCACGCCT
+CGGTGATGATGCCAAGCGTCCCCTCGGACCCGAGGAACAACCGGTCCGGGGATGGTCCGGCACCGCTTCC
+GGGCAGCCGCCGGGACTCGCTGATCCCCACCGGGGTGACAATCCGCAGCGATTCGGTCAAGTCGTCGATA
+TGGGTATAGAGCGTGGCGAAGTGTCCGCCGGAGCGGGTGGCCAACCAGCCACCGAGAGTCGAGAAGCCGA
+AGGACTGCGGGAAATGGCGCAGTGTCAAATCGTGTGGGCGAAGCTGATGCTCGATCGAGGGGCCGAACGC
+ACCCGCCTGGATGCGCGCGGCACGGCTGACACGGTCAATCTCAAGCACCGCGCTCATGGCAGTGACGTCG
+ACCGTGACCACCGGCTCATCGAAGCGCGGCTCGACACCGCCAACCACCGAGCTGCCACCACCGTATGGGA
+TGACCGCAATCCCCTCGCGCGCACACCAATCCAGCACGTCGATCACGTCCTGCTCGCTGCGGGGTCGGGC
+GATGAGGTCGGGCAGGTGGTCGAGCTGGCCCTGCAGGTTGCGTGCGATGTCGCGATACGCTTTGCCGCGC
+GCGTGTCCGGCCCGATCGACGAGATCGCTTGAGCAGAGCGCGGCCAGCGATGCCGGCGGGCTGACCCGTG
+GGGCCGCCAAACCGAGCGCGGTCAGGTCCGGCGGCGGGTGGTCGCTCAGGTCATGGCCGGACACCAGTGC
+CGCGACTCGCGACTGTAGCGCTTGCGTCTCCTGATCGGAGAGCGCGTCCTCGACTGTGCCCCAACCCCAC
+CACGAACGCATGCTGATGGTGTCAGCGTTTGAGGACGATCATGGCTCCGCCGACGACCACCAGCACCAGG
+GCCGCGACGATAGCCCATCCAGCACCGGCTAGCCACCACATGACACCCAATGCGGCGAGTACCGGCGACA
+GCGCGAAGAACACCATTACCGGGTGCTGCCTAATCACTGCGAGGGCACTGGTCGCCCGGACTCGATCGAT
+TTCCTTGCCTGGCATGCCCTTCAGGATGCCAGCTGACTACCACAATGCAAGCAGCGATGAGCCGACGAAC
+CGTCATCCTTGGCCTGCTCCCGCTCGCTGTTGTCGTCACGAATGGCGCACGATGCGGCGCACCAATGCCT
+GTGACCGAAGGCGGTTCGGGCTGTCATTGACAATTCATGAAGATGCCTGCCGCATCATATCCGTTGTGCC
+CGTTGTTCTAGAAGTCCGACGTGCTGAGCCTGCCCACCCGGCGACCCCATATCCGGAACCCCTCGCGCGC
+TGCAGCCGCTCACCTGGTCTGAACGAAAGCTCGCACATGAGTGGTCGGGTTCCGCCCTAACAACGCGCCA
+TAAACGCAGGCTCATGCGCTGCGCCACGATGCGCCGATGCATTTCGGTAACGATTGTTAGTTAACCCTTG
+TACGAAACTCTCTTGAGGCGCTTTAACCGACTGCGTCCAAAGTGGAGGATCGAAAAGATGATAGGAAAAT
+GAGTACGCCTACGCTGCCTGATATGGTAGCTCCATCCCCGAGAGTGCGAGTAAAAGACCGTTGTCGCCGG
+ATGATGGGGGACCTACGCCTTTCCGTTATCGATCAGTGCAATTTGCGATGCCGTTATTGTATGCCCGAAG
+AGCACTACACATGGTTGCCGCGGCAAGATTTGCTATCCGTCAAAGAAATCAGCGCCATTGTAGATGTTTT
+CCTTTCCGTTGGGGTAAGTAAAGTTCGAATCACCGGTGGCGAACCGCTGATCCGCCCAGATTTGCCGGAA
+ATAGTGAGGACATTGAGCGCAAAGGTCGGCGAAGATTCAGGTCTGAGAGACTTAGCGATCACGACGAACG
+GCGTCCTTCTCGCCGACCGCGTTGACGGCCTGAAGGCTGCGGGTATGAAACGCATCACTGTCAGTCTTGA
+TACGTTGCAACCCGAGCGCTTCAAGGCGATAAGTCAGCGTAATAGCCACGATAAGGTCATCGCGGGTATC
+AAGGCTGTCGCAGCCGCGGGATTTACGGACACAAAAATAGACACAACGGTGATGCGTGGTGCCAATCACG
+ATGAGCTGGCTGATCTGATCGAATTCGCTCGGACTGTTAACGCGGAAGTCAGGTTCATTGAGTACATGGA
+CGTCGGCGGCGCAACTCACTGGGCATGGGAGAAGGTCTTTACCAAAGCGAACATGCTCGAGTCCCTTGAG
+AAACGGTATGGACGTATTGAGCCTTTGCCCAAACATGATACGGCGCCCGCCAATCGATATGCGCTTCCGG
+ACGGAACTACCTTCGGAATTATCGCGTCGACAACGGAGCCATTCTGCGCAACCTGTGACCGTTCACGGTT
+GACCGCCGATGGCTTATGGCTGCATTGCTTGTACGCAATATCGGGTATCAACCTAAGGGAGCCGCTGCGT
+GCAGGCGCGACTCACGATGACTTGGTGGAAACCGTGACAACCGGATGGCGGCGACGAGCGGATCGCGGAG
+CAGAGCAGCGTCTTGCCCAACGCGAGCGCGGAGTGTTCCTGCCATTAAGCACGTTAAAGGCCGACCCGCA
+TCTGGAGATGCACACCAGGGGCGGGTAAGCCGAACGAACAGTCGATTGATCAACGACTCCACAGTTGAGG
+AAGGAACCATGACGGTCAGCACCCCTGAGCAACACGAGCAACGAGCATCCCACGATGCATCCGAGGGAAA
+GCACAACGTATGTCAGGGGAGGCTGGCCGCACTTGCCGACGCGGCCGTGTCAGAGAAACTCGGAGCACTA
+CCTGGCTGGCAGCTTCTCGACATGCGACTCAGCCGCGCTTTTCAGTGCACAAATTTCGACCAATCCATTG
+ACTTCATGAATAGGGTCGCATCAATAGCAAACGATATCAATCACCATCCCGATATCGCTGTACTGGACAA
+GCGTTCGGTGCGCGTGACGGCGTGGACGCGCAAGCTGGGCTATCTGACCGACATCGACTTCGATCTTGCG
+GCGTCCGTCGAGGCGATGTATGCGACAGAATTCGCTGACAGGCCAGCACGATGATCGACCATGCACTCGC
+GCTGACACATATCGATGAGCGTGGTGCGGCACGAATGGTCGATGTGTCCGAGAAACCCGTGACTTTGAGG
+GTTGCCAAAGCGTCAGGGCTCGTGATCATGAAGCCGTCTACCTTGAGGATGATTTCCGACGGTGCCGCTG
+CTAAGGGTGACGTCATGGCGGCGGCCCGGATAGCTGGCATCGCGGCGGCGAAACGTACGGGTGATCTTAT
+TCCGCTATGCCACCCGTTAGGGCTCGACGCTGTCAGCGTCACTATCACGCCGTGCGAGCCTGACCGGGTG
+AAGATTCTGGCGACAACCACCACGCTGGGGCGTACCGGCGTGGAAATGGAAGCGTTGACCGCAGTTTCAG
+TCGCCGCCTTGACTATCTACGACATGTGCAAAGCCGTCGATCGAGCCATGGAGATTTCTCAGATCGTGCT
+CCAAGAGAAAAGCGGCGGCCGGTCCGGAGTTTATCGCCGAAGTGCTTCTGATTTGGCCTGTCAGTCCCGA
+TAAGTAGGTGAGTGTCTGAATGATTAAAGTGAATGTTCTTTACTTCGGTGCCGTTCGTGAGGCGTGTGAC
+GAAACGCCTCGGGAGGAAGTAGAGGTTCAGAACGGTACCGATGTCGGAAATCTTGTTGATCAACTCCAGC
+AAAAATACCCTCGCCTTCGCGATCATTGTCAGCGAGTACAGATGGCGGTCAACCAATTCATCGCGCCGCT
+GTCGACCGTTCTCGGCGATGGTGATGAGGTCGCCTTCATCCCGCAGGTAGCCGGAGGCTGAACAAGGGGA
+TGACGGCCGTGAATGCGCTCTCATCGTCGCCGCTGTTCGGCAACGTGGGAGTTCCAGTGCCGGCGTGCAG
+AACGACCGAAATTCGCCGCACCCGAATAGTCGGGTCGCATAGATGACCAGCAGGGATGGATTCACCATCG
+TTTGCGATTGGAACGGGACGCTGTGCGACGACCGGACAATTCTTCTCGACGCGGTTGGGCAGACGCTGGT
+CAACGAGGGATTCGAGCCTCTTTCGCAACAGCAGCTGATCCAACGGTTCGCACGCCCACTACGAACGTTT
+TTCGAGAATGCGTGCGGTCGAGATCTCTTGACGTCCGAGTGGGAACGCGTCCAATCCACCTTTCGCCGAA
+TCTATCGATCGCGAGAAGCTGAAGTCACACTCGTCGAAGATGCGTACGACGTTCTGGCGCAGGGAAACCG
+CAGCGCCGCTGGGCAGTTCTTATTATCGCTGGCGCCTCACGACGAGCTTATGCACTTCGTCCAAAAATAC
+GGGATTGCCAAGTGGTTCAACGAAATCCGTGGCCGGACTCGGCCCGACCAAGAAAAACCCATGATGCTGG
+CAGAACTGATCATGCAGCGCTCTCTGAATCCCACTCGCGTGGTGCACATCGGCGATTCGCTTGAGGACGC
+CGCTGCTGCCAGCGCGGTCGGAGCCATTTCCGTCTTGGTCACCGGAGCTTCACGGCAGCCACCCGACCGA
+GTCATGCTCAAACAGTTGCAGCCCTTCGTTGCGAGTTCGCTGAAGCAAGCACTGCAGTACGCGGGTGGCG
+ACGGTGATTGACGACGAAGGTACGCAGGTGGTGGCGGCGCGCCTGCCGTTCGGATGGCCAGCCGACAGTG
+GGGTGACAGCCGACATCATCGAGGCAGCGATGGAACTTGCGATCGACACAGCGCGACATGCCACGGCACC
+GTTTGGCGCTGCGCTGCTTGATGTTACGACACTCCGAGCATTCTCGGGTGGCAACACCTATTTTGAATCG
+GGGGATCGCTTCGCTCACGCCGAAACCAACGTTCTACGGGCCGCAATGAGCACATTGCCGGAGCTTTCAA
+ATCACGTGCTGATATCCACCGCCGAGCCATGCCCGATGTGCGCGGCGGCCAGCGTGCTCAGCGGAGTGAG
+AGCCATCATCTTCGGCACATCAATCGAGACCCTTATCCAGTGCGGTTGGTTCCAAATCCGCATCAGCGCT
+TCGGATGTGGTGGCGGCCTCCACTCGTCCCACGCGTCCATCGGTGTATAGCGGTTTCCTCAGCCACAAGA
+CGGACTTGTTGTACCGGAACTCCGAAAACCGACGAGCAATGAACCCCTGGACCGATCCATCGCATTGACT
+CGGCTTGCCGACTACCTCACTGACCCAGGAGGAGAGTTACGTCCAGGGGTGTGGTGTACGGGCAGGTAAG
+GCCGGTGGGCGTGTCGTAGCCCAGTAGTGGGCGGTCATCGCGTGATCCTTCGAAACGACCAGCAAAAGTC
+AATCGAAGGAAATGACGCAATGACCTCTTCTCATCTTATCGACACCGAGCAGCTTCTGGCTGACCAACTC
+GCACAGGCGAGCCCGGATCTGCTGCGCGGGCTGCTCTCGACGTTCATCGCCGCCTTGATGGGGGCTGAAG
+CCGACGCCCTGTGCGGGGCGGGCTACCGCGAACGCAGCGATGAGCGGTCCAATCAGCGCAACGGCTACCG
+CCACCGTGATTTCGACACCCGTGCCGCAACCATCGACGTCGCGATCCCCAAGCTGCGCCAGGGCAGCTAT
+TTCCCGGACTGGCTGCTGCAGCGCCGCAAGCGAGCTGAACGCGCACTGACCAGCGTGGTGGCGACCTGCT
+ACCTGCTGGGAGTATCCACTCGCCGGATGGAGCGCCTGGTCGAAACACTTGGTGTGACAAAGCTTTCCAA
+GTCGCAAGTGTCGATCATGGCCAAAGAGCTCGACGAAGCCGTAGAGGCGTTTCGGACCCGCCCGCTCGAT
+GCCGGCCCGTATACCTTCCTCGCCGCCGACGCCCTGGTGCTCAAGGTGCGCGAGGCAGGCCGCGTCGTCG
+GAGTGCACACCTTGATCGCCACCGGCGTCAACGCCGAGGGCTACCGAGAGATCCTGGGCATCCAGGTCAC
+CTCCGCCGAGGACGGGGCCGGCTGGCTGGCGTTCTTCCGCGACCTGGTCGCCCGCGGCCTGTCCGGGGTC
+GCGCTGGTCACCAGCGACGCCCACGCCGGCCTGGTGGCCGCGATCGGCGCCACCCTGCCCGCAGCGGCCT
+GGCAGCGCTGCAGAACCCACTACGCAGCCAATCTGATGGCAGCCACCCCGAAGCCCTCCTGGCCGTGGGT
+GCGCACCCTGCTGCACTCCATCTACGACCAGCCCGACGCCGAATCAGTTGTTGCCCAATATGATCGGGTA
+CTCGACGCTCTGACCGACAAACTCCCCGCGGTGGCCGAGCACCTCGACACCGCCCGCACCGACCTGCTGG
+CGTTCACCGCCTTCCCCAAGCAGATCTGGCGCCAAATCTGGTCCAACAACCCCCAGGAACGCCTCAACCG
+AGAGGTACGACGCCGAACCGACGTCGTGGGCATCTTCCCCGACCGCGCCTCGATCATCCGCCTCGTCGGA
+GCCGTCCTCGCCGAACAACACGACGAATGGATCGAAGGACGGCGCTACCTGGGCCTCGAGGTCCTCACCC
+GAGCCCGAGCAGCACTGACCAGCACCGAAGAACCCGCCAAGCAGCAAACCACCAACACCCCAGCACTGAC
+CACCTAGACTGCCACCCGAAGGATCACGCGAGGAACCTTCACTCGTACACCACGTCCCTGGCCTTGGCCA
+GGAGGAGAGCAATCATGACTGAAGCCTTGATCCCGGCACCGTCGCAGATATCGCTGACCCGCGATGAGGT
+GCGCAGGTACAGCAGGCACCTCATCATCCCGGATATCGGCGTCAACGGCCAACAGCGGCTGAAGGATGCG
+CGCGTATTGTGTATCGGCGCCGGAGGATTGGGTTCGCCTGCTCTCCTGTATCTTGCGGCCGCCGGAGTCG
+GTACCATCGGCATCATCGATGGAGACCACGTGGATGAGTCGAATCTGCAACGCCAAATCATTCATGGCAC
+ATCCGACGTGGGTAGGCCGAAAGTAGAATCAGCAGCCGAGGCGGTGGCGGAAATCAACCCGCACGTCCGG
+GTGACGCAATATCGCGAAATGCTCACCCACGACAACGCACTGGAAATTTTTGGCGATCACGACCTCATTG
+TTGACGGCACAGACAACTTCACGACGCGCTACCTGATCAATGATGCCGCGGTCTTGGCCGGCAAACCATA
+TGTTTGGGGGTCGATCTACCGATTCAACGGCCAGACCAGTGTGTTTTGGCCCGGCCGGGGGCCGTGTTAT
+CGATGCCTTCATCCAGCTCCGCCCCCGCCCGGATTGGTGCCGTCGTGCGCTGAAGGCGGTGTACTCGGTG
+CCATCTGCGCCACGATTGCGTCGATCCAGGTAACTGAAGTGCTGAAGCTCCTTACCGGAGTCGGAACTCC
+CCTCGTCGGTCGCCTGCTCATGTATGAAGCTCTCGACGCGACATACCATCAAATCCGGATCGCGAAGAAT
+CCTGACTGCGCCATTTGCGGCGATGCGCCCACGATCACCGAATTGGTAGATGACAGCGTCAGCTGCGCAT
+CGACACAATCGGTGGATCCCGAACTAGTGATCAGTTGTGATGAGTTGCGAACCAAACAGCAGTCGGACCA
+GAACTTCCTCTTGGTCGACGTGCGAGAGCCCGCCGAGTTCGACATCGCGCACATTCCGGGCAGCATCTTG
+ATACCCAAAGGCGAAATCGGCTCGGCGGCGGGCCTAGCCCAGCTACCGCTGGACAAGGAAATTGTCCTGT
+ACTGCAAGAGTGGAATCCGATCGGCCCAGGCGCTAACCACGTTGAAAGCAGCCGGACTGCACAACGTGAA
+GCATCTCGACGGCGGTATCGCGGAGTGGACACGAACCATCGACTCCTCCTTGTTGGTGTACTAGCACCGA
+ACTATGCGAAAGGATTCCCGCCATGGCACGCTGCGATGTCCTGGTCTCCGCCGACTGGGCTGAGAGCAAT
+CTGCACGCGCCGAAGGTCGTTTTCGTCGAAGTGGACGAGGACACCAGTGCATATGACCGTGACCATATTG
+CCGGCGCGATCAAGTTGGACTGGCGCACCGACCTGCAGGATCCGGTCAAACGTGACTTCGTCGACGCCCA
+GCAATTCTCCAAGCTGCTGTCCGAGCGTGGCATCGCCAACGAGGACACGGTGATCCTGTACGGCGGCAAC
+AACAATTGGTTCGCCGCCTACGCGTACTGGTATTTCAAGCTCTACGGCCATGAGAAGGTCAAGTTGCTCG
+ACGGCGGCCGCAAGAAGTGGGAGCTCGACGGACGCCCGCTGTCCAGCGACCCGGTCAGCCGGCCGGTGAC
+CTCCTACACCGCCTCCCCGCCGGATAACACGATTCGGGCATTCCGCGACGAGGTCCTGGCGGCCATCAAC
+GTCAAGAACCTCATCGACGTGCGCTCTCCCGACGAGTTCTCCGGCAAGATCCTGGCCCCCGCGCACCTGC
+CGCAGGAACAAAGCCAGCGGCCCGGACACATTCCTGGTGCCATCAACGTGCCGTGGAGCAGGGCCGCCAA
+CGAGGACGGCACCTTCAAGTCCGATGAGGAGTTGGCCAAGCTTTACGCCGACGCCGGCCTAGACAACAGC
+AAGGAAACGATTGCCTACTGCCGAATCGGGGAACGGTCCTCGCACACCTGGTTCGTGTTGCGGGAATTAC
+TCGGACACCAAAACGTCAACATAGCATTTGGATATGGTCCACATGCTTGCCCGGCCTCAGCGTATTCACG
+CATGTGCTTGACGACGTTCTTCACCTCGCTTACCCAGCGATTTCCGCAACTTCAACTCGCAAGACCGTTT
+GAGGATTTGGAACGACGGGGTAAGGGCCTACATTCGGTGGGGATCAAGGAACTCCTTGTTACCTGGCCGA
+CGTGACCCCGCGTGCCAGCAAGGGACTGTTGACTTCTCCGACGGATGAAAGCCGCCCTGGAATATCCAAC
+CGCTCCTGCTCCTCGGTCAACTCAAGCCGAAACCGCCAACGGTGGCCACAAAATACGAGTTCGTCCACAA
+CGTCGGCAGCCGGGACCGCAACCACGCAAACTCCTCACGCACTACCCGCAACCGACGGCCCCTAATTGGG
+GTTGGGCCCATGATCGGTTGGCGGCTCATCAGGCGGTGCAGGATCTTGGTGTGCCCGCCTCGGCGCGGCG
+GAGCCGGGGTCGAGCATCTCTTTGCGAGTGATGAAGGCACAGCCCCGGCGCGGGGTGGGTGTGCAACACG
+AATGTAGGTAGCGGGAGTTGAGGCTGGGCGCGGTGTATTCTGGTTGTTGGATAAACAACCAGAATGGGGA
+GACGCGGGTGGGCGAGGACTCGCTGGAGGATCTGGAGCAGCGGCGAGCGCGACTGTATGACCAGTTGGCC
+GCGACCGGCGATTTCCGGCGCGGCTCGATCAGTGAGAACTATCGCCGCTGCGGCAAGCCCAATTGTGTGT
+GCGCGCAAGAGGGTCACCCCGGGCATGGGCCGCGATATTTGTGGACGCGCACGGTGGCCGGGCGGGGTAC
+CAAGGGGCGGCAGCTCTCGGTCGAGGAGGTGGACAAGGTGCGCGCCGAGTTGGCCAACTATCACCGTTTC
+GCGCAGGTCAGTGAGCAGATCGTGGCGGTCAACGAGGCGATCTGCGAGGCCCGCCCACCGAACCCGGCGG
+CCACGGCGCCCCCGGCCGGCACAACGGGGCACAAAAAAGGGGGCTCTGCGACCAGATCGCGGCGGAGTTC
+ACCGCCGAGTTAGAGCGGCTGGTTGCGCTCGCGGTCGGTGCGCTGGGATCCTCGGTGCCGACCTGGTCGC
+AGTGGAGTTGGCGATCCGCACTGCGATGACCCGGCTGGGCTCCTCGCTGCTGGAGCAGCTGCTGGGCGCC
+AACACCGGGCACCGGGGCCAGCGCATCGATTGCGGGCAAGGGCATTGCGCGTGGTTCGTCGGTTACCGCG
+ACAAGAACCTCGATACCGTGCTGGACCGGGTCCGGTTGCTCCGCGCCTGCTACCACTGCCGCACCTGCGG
+GCGTGGGATGGCGCCCCCTGGATCTGGAACCTGGCCACCGCGATCCTGCCCGAAGCCACCCCGATCGTGG
+ACCTCTACCACGCTCGCCAGCACGTCCACGACCTCGCCGGCCAGCTCGCACCCGCCCTCGGCGAACACCA
+CAGTGACTGGCTGACCGCCCGGCTGGTCGACCTCGACTCCGGCGACATCGAAACGCTGGTTCAACAACCG
+ATCGGGCAGCACACCGGTCACACGTAACGAAGTGTGCATGAAACCCGGAGTGGTTCAGGGGTCCGCCGCG
+CTCGTCCGCGCTGTGAGGGTCTCGGCACTACCACGAGATGAGATCGAGGCACCAGGTGCATTGTGCACCA
+CATTCTGGCGATGTTGGTGAGGTTTGTTCCTGCGCCCGTCCGTGGCGCGTTCGGGATCGTTGGGGTTGGC
+CGGTTGCCCACCTCGGCGGAAGCGGACGGTGAGCGCGGCCGAGTCGTCGACATTTGGCGGTAGGAGGTTT
+CGATGCTGTTTGTCAGCGTGGCCGCGGAGTCGGTAGGGGTGGCGGCGGCGACTCTTGTTGGGCCCCCGTT
+GATCGGCAACGGCGCCGATCGGCCCCCGGCACCGGACAAGCCGGCGGGATCTTGTGGGGCAACGGCCGTT
+TTCGCCCAATCACAGGAGTGGAGTTTTGAACGCAACGACGGCAGGTGCTGTGCAATTCAACGTCTTAGGA
+CCACTGGAACTAAACCTCCGGGGCACCAAACTGCCATTGGGAACGCCGAAACAACGTGCCGTGCTCGCCA
+TGCTGTTGCTATCCCGGAACCAAGTCGTAGCGGCCGACGCACTGGTCCAGGCAATCTGGGAGAAGTCGCC
+ACCTGCACGAGCCCGACGCACCGTCCACACGTACATTTGCAACCTTCGCCGGACCCTGAGCGATGCAGGC
+GTTGATTCGCGCAACATCTTGGTTAGTGAGCCGCCGGGCTATCGCCTTCTCATTGGAGATCGACAGCAAT
+GCGATCTCGACCGTTTCGTGGCAGCGAAAGAATCGGGACTGCGCGCTTCTGCCAAAGGATATTTTAGCGA
+GGCGATCCGTTATCTAGATTCGGCCTTGCAGAATTGGCGCGGTCCAGTACTGGGGGACCTACGCAGCTTT
+ATGTTTGTCCAAATGTTCAGCAGGGCGTTGACCGAAGATGAGCTCCTCGTCCATACGAAGCTGGCCGAAG
+CTGCAATCGCCTGCGGACGCGCCGACGTCGTTATCCCTAAATTGGAAAGACTCGTTGCGATGCATCCTTA
+TCGCGAGTCGTTATGGAAGCAGTTAATGCTCGGCTACTACGTGAACGAATACCAGTCCGCGGCAATCGAC
+GCATATCATAGACTCAAGTCCACGCTCGCAGAGGAACTCGGTGTTGAGCCGGCACCCACGATACGTGCGC
+TCTACCACAAAATTCTTCGCCAATTGCCCATGGACGATCTCGTCGGCCGAGTCACGCGTGGCAGGGTTGA
+CTTGCGTGGCGGCAACGGCGCTAAGGTAGAGGAACTGACCGAGAGCGATAAGGATCTCCTTCCCATCGGT
+TTGGCATAACTACGCCCCTCAATGCAAGCGAGCTGATTCGATGTTGTCGAGCCGGAGCCCGCTCCGACCT
+CCGTCACACAGACCGGACTACGAATACTGACCCGCGCTGCTAGCCAACCCCGGTTCGTGGAATCACAGTG
+AGACGTGCCTGCGTGACATGCCAACCCGCACCATCACGATCCATCAGCCCACCGGGCATACCAGCGCCGG
+CACCGCTAATACTCATTGGCATCAGCATCATCGGCATACCACCACCGGCGGCCCCGGCCGCCTGCGTCAG
+CGCGACTGGGTTAGGCGGCACACCCAACCCGGACATCGCTGAAGAAGCCATCGAAATGGGTATCGACCCC
+TGCCACGTCGGCGGCACCGACATCGACCCCACCAACTGAGCCTGCCCTAAGCCAGCGGACATCCCCGCAC
+CCAATTCCCGACCGCCTAGCGGCTTGAACGCCGGAATAGCCGCACCACTCGGGTTCGGCGTATTCGCGGC
+AGCCAACCCGCCAGCCGGCGGACCTAACCTGGTCGCGCTTTCACGCGCCATACTCGCCAACGTCGTTATC
+GGCGACGTCAGGATGCGGACCGGGAGAAACAACATCGACGCATGTTGCAACGGCAGCTGCGACACCAGCG
+ACTGCATCCCGCTCATCACGGTCGGCACCGACGCCATCGCACCCTCGACCACCGGCGTCACGGCAGCCGA
+CGCCGTCGTCGCCATCCCGGCAACCTGGGTACCCACCTGCGCGGCCAACCCGGCTAAGCTCACCGGCGGC
+AGACTAAATGGCGCCAACGTCGCCGCCACGGACTTTGCCCCAGCGTGATAGCCCACCATCGCAGCCACAT
+CCTGAGCCCACATCTCCAGGTAATCGAACTCCGTGGCTGCGATCGCCGGGGTGTTCTGACCCAAAACGTT
+CGCCGCTATCAACGACGCCAGCGACACCCGATTCGCCGTCACCGCCGTCGGATGCACCGTGGCCGCCAAC
+GCGGCCTCAAACGCCGTCGCTGCCGCGCGAGCCTGAATGGCCGCCAGCTGCGCCTGCGACGCCACCGTGC
+TCAACCACCCGACATACGGAGACGCGGCAGCAGCCATCGACATCGACGCCGGACCGGTCCACGGCCCAGT
+CGTCAACGCGGCGAGCACCGACTCAAACGACGATGCCGATGCCCACAAATCCACGGCTAGCCCCTCCCAC
+GCCGAGGCCGCCGCAAACAACGGCCCCGAGCCGGCTCCGGCAAACATGCGCGCCGAGTTGATCTCCGGCG
+GCAGCCACGAAAAGCCCAAAACCATCGCAACCCCAGCCCAATCAGCCGCCCAGAAGGGTCTCGTACAAGG
+GTTAACTAAACAATCGTTACCGAATGAATCGACACATCGTGACGCACCGATGGCTCAGCACGCCGGACTT
+CTAGAACAACGAGCACAACGGATATGATGCGGCAGGCATCTTCATGGATTGTCAATGACAGCCCAAACCG
+CCTTCGGCCACTGGCATTGGTGCACTGCACCGTGCGCCATTCGTGGCGACAACTGCGAGCGGGAGCGGGA
+CCAAGGATGATGGTCCCGGTCGCGACGGGCGCGATCCCGCTCCGGAGTGGTCAACGCATCAAACGACAAA
+GCGCTCAGCTCATCGACCGCAGCATCGAGCCGGTCCAGCGCCGCGACCAAACTAGAATTCTCGCGCAGAC
+ACCGCTGAAACGACAGTGACGCAAGGGATTTCATTGAGAGGACCAATGACCCTATTTGATCAAACCGGAT
+GACCATACCGTCAACGTTGTGGACATACAGGTGCTCAAGAACGCAGTCTTGCTGGCATGCCGGGCGCCGT
+CGGTGCACAACAGCCAGCCCTGGCGTTGGGTGGCCGAAAGCGGCTCCGAGCACACTACTGTGCACCTGTT
+CGTCAACCGCCACCGAACGGTGCCGGCCACCGACCATTCCGGCCGGCAAGCGATCATCAGTTGCGGTGCC
+GTACTCGATCACCTTCGCATCGCCATGACGGCCGCGCACTGGCAGGCGAATATCACTCGCTTTCCCCAGC
+CGAACCAACCTGACCAGTTGGCCACCGTCGAATGCAGTCCCATCGATCACGTCACGGCGGGACAGCGAAA
+CCGCGCCCAGGCGATTCTGCAGCGCCGAACCGATCGGCTTCCGTTTGACAGCCCGATGTACTGGCACCTG
+TTTGAGCCCGCGCTGCGCGACGCCGTCGACAAAGACGTTGCGATGCTTGATGTGGTATCCGACGACCAGC
+GAACACGACTGGTGGTAGCGTCACAACTCAGCGAAGTCCTGCGGCGGGACGATCCGTACTATCACGCCGA
+ACTCGAATGGTGGACTTCACCGTTCGTGCTGGCCCATGGTGTGCCGCCGGATACGCTGGCATCAGACGCC
+GAACGCTTGCGGGTTGACCTGGGCCGTGACTTCCCGGTCCGGAGCTACCAGAATCGCCGTGCCGAGCTAG
+CTGATGACCGATCGAAAGTCCTTGTGCTGTCGACCCCTAGCGACACGCGAGCCGACGCACTGAGGTGTGG
+CGAAGTGCTGTCGACCATCCTACTCGAGTGCACCATGGCCGGCATGGCTACCTGCACGTTGACCCATCTG
+ATCGAATCCAGTGACAGTCGTGACATCGTGCGGGGCCTGACGAGGCAGCGAGGCGAGCCGCAAGCCTTGA
+TCCGGGTAGGGATAGCCCCGCCGTTGGCAGCAGTTCCCGCCCCCACACCACGGCGGCCGCTGGACAGCGT
+CTTGCAGATTCGCCAGACGCCCGAGAAAGGGCGTAATGCCTCAGATAGAAATGCCCGTGAAACGGGTTGG
+TTCAGCCCGCCTTGATCAGGATGCCTTTGTGGATGTCGGGTAGGGCGGTGGGGATGTTAGCGAGGTAGAG
+CTGCTCGGTTTTCTCCTTGGCCAAGATGAGGAGTCGGTTCTGCAGGTCGGCGATTTTGCGGCCGATCTGG
+GCGGGGTTGAGGCTGTCTCGGTAGGTGATCAGGTCGGCCTGCTGGGCCGCGGAGAGCACCCTTGCGGCCA
+GTGGCCGGTCCAGCGGCGTCTGTGGGGCATCGTAGAGGCGTCGGCGGCGGCCGTCGGCGCTGCTGGCATA
+CCCGATCGGTTTGATGGTCGGGGTGAGGTAGTTGAGGCGGTCGTTGACCAGCTTCCACATCCGGTTGAGC
+ACGGCGCGTTCCTCGGCGGTGTCATAGCGGTAGTAGAACGCGTACTTGCGGACCAGGTGGTTGTTCTTGG
+ACTCGATGGTGGCCTAGTGGTTTTTCTTGTACGGGCGAAAGCGGGTGAAGTAGATACCGTTGTCGCCGGC
+CCAGCTGATGACCGGCTTGTTGAGAAACCCGGTGCCGTTGTCGAAATCTAAACCCGTTATCCCATGCGGG
+ATCTCGGTGACAGAAGCTTTGAGCCCGGCGAGGATGTGGGTACGGGCGTTGTTGCGGACGGTGCGGGTGA
+ACACCCATCCGATGTGCACGTCGGTCAAGTTCAGGGTGTGGGCGAACTCGCCTTTGAGCGTCGGACCGCA
+ATGGGCGACGGTGTCGCCCTCGAAGAACCCCGGCTCCGCCTCGACCTCATCGCCGGCCCTGCGAACCTTG
+ATCGAATTACGCAGCAGTGGTGAGGGTTTCGTCGTCGACACACCCGATATCTGGTCTTTGGCCTTCGCGG
+TCTTCAGATAACGATCGATGCTGGCCGCACTCATCGCCAACAGCTCCTCACGCACCTCGGGGCCATAGCG
+GTCACGCCCAAACTCCAACACACCGTGACGTTCCAACCCATCAAGCTGCAGCACCATCGAGGCGGCAAGA
+TACTTCCCGCACTGCCCACCCGAGGCGGACCACACCCTCTGCAACACCTTCAGCGCGTCATAGGAGTACT
+TCAGCGAACGCGGTTTGCGCCGCCGCTTGGCAACACTGCGGCCCAGCCCCGGCGATAGCTTGGCCGCTGC
+GACAAGCCGGCGCCGCGCGTTATCACGTGACTAGCCCGTCAGGTCAACCACCTGGTCGAAAATCCGGCCC
+CGGCTCTTCTTCAAAGCCTGCACATACGCCTTGGCGTACCTGCTGGTGACCTCCGCGCGAGATCTCATCG
+ACAACCCACTTCCCATGCCTCACGACGGTCACCATGTCGCGGGCATATTTACGTGAGGCACCGAGGGTGT
+TTCGCGGGCATTCTTGGTGAGTCAAGTCGAACGGTTGAGCCATGATCGACGATTCCGTTACCGTGCTGTC
+AGAAGACGAAAGTTGGCACCGGCTGGGCAGCGTTGCACTCGGTCGGCTAGTTACCACCTTTGCTGATGAG
+CCTGGGATCTTCCAGTCAATTTCGTGGTGCAAGGCCGCACCGTGCTGTTTCGTACCGCGGAGGGCGCCAA
+ATTATTTTCAGCCGTCGCGAAGTGCGCGGTGGCTTTCGAGGCGGACGACCACAACGTTGCCGAGGGCTGG
+AGCGTGATCGTCAAGGTTCGCGCCCAGGTGCTGACGACCGACGCGGGGGTCCGCGAAGCCGAACGCGCCC
+AGTTACTACCGTGGACCGCGACGCTGAAACGTCACTGTGTGCGGGTGATCCCGTGGGAGATCACCGGCCG
+CCACTTCAGGTTCGGTCCGGAACCGGACCGCAGCCAGACCTTTGCCTGCGAGGCCTCGTCACACAACCAG
+CGATAGCGCTCCGCGCCTGCGAGTCACCTTGCGCCGCTTACTGATCGCCACCAGCCGTGCGACGGCGTCT
+TCAATTCCTCGCGCCAGCTGGCCGGCATCTGCTACCACGTCGTAGTCGGCCAGGATCCCGAAGTACAGGT
+CGTCGGCGTAGCTGAGCATCGCGACACTGGTGCGCAGTTGCATCGCGATCGGCGAAACCGGGTATAGGTC
+AAGCACCCGTCTGCCCATAATCTGCAGCGGCCGTCGTGGACCCGGCACATTTGTCGCCACGGTGACAACA
+CCACGCTGCGGCAGCCGCATCAACAGCCCGACCGCCCATGCGGTCATGGGGAACGGAAGGCGGTTGGCAA
+TCGCCATCAAAGTATTTCCGAATTGTCTCTGTCCCCCCGCCTTGGCCCGAGTCAGCCGCGAGTGCACGAT
+CCGCAGCCGCTGCAGCGGGTTCTCTTGATCCACCGGCAGGTTGGGCAGCATTAACGAAACACGGTTATCG
+GTCTTGCTCAAAGCGCTGTTGGAACGCGTCGAGACCGGCACTAGCGTACGCAGCGAATCAAACCTAGGCC
+GCTCACCCCGCTGGATGAGGACGTTGCGGTAGCTTTCCGTAATCGCGGCAAGCGCAACATCATTGATGGT
+GACGTCGAATTTCCGGCACACCTGTTCGACGTCGGCGAGAGGGACCTTTGCTGCGCTGTAGCGACGCAAA
+TCACTGATCGGCCCGTTCAACGACGACGCGGCGGGACTTAGCACGCCGGCCGCGATCTCACTGGCACCCT
+TGGCCGCGCGAACGATGCCTGCCATCACGGCGGTCGACGCGGTCAACGCCTCGCTTGGATTGACACGGAA
+TCCACCCCGCCGCACAGATGCGGATTGCGACTGCATGGTCGTGTGGATGTTGCTCGCGAAGCTGTCGCTC
+ATACTTTCATCGGAGAGCCCAGCTAGCAGGTGAGTCGCCGCGATTCCGTCGGCCATGCAGTGGTGCAGTT
+TGGTCAGGATCGCCCACTTGCTGTCCGCCAGGCCTTCGATGACCCAGACCTCCCACAGCGGTCGACCCCG
+GTCCAAACGACGCGCCATCAGATCGGCGATCAGCTCGAATAACTGGTCTTCGTTGCCAGGCCGCGGCAAG
+GCGATGCGCCACACATGACGGCCAAGATCGAAGTCGGGATCGTCCACCCATTTGGGTGCACCGAGGTCGA
+ACGGGCGCAGGCGTAACCGCTGCCCGAACCGGGTACAGGGACGTAGGCGTTGAGCGAGCGACGATAAGAA
+GGCTTCCTGATCGGGAGCCGGCCCCTCGATGACCGCCAGAGCGCCGATTGCCAGACTCACGTGCCGATCC
+ACGTCTTCTGCCTTGAGAAACCCGGCGTCAAGTGTCGTTAGGTGATTCATGGTCAGCGCCTTCCCCGGTG
+ATCCGGATTATCTGCAACCGTCAGTACCACTCTCCGCTGCGAGGAGCCGTTGAGGCAGGGCCAAAGGTCC
+TCCGCTGGCGAGCCTTCGTGCTCTGCCACCGCGGCTGTCGACGCGCGATCCTTAATAGATGACCGCAGCC
+GTTGATGGGAAAGGCCCGGCAGCCATGAACACCCATTTCCCGGACGCCGAAACCGTGCGAACGGTTCTCA
+CCCTGGCCGTCCGGGCCCCCTCCATCCACAACACGCAGCCGTGGCGGTGGCGGGTATGCCCGACGAGTCT
+GGAGCTGTTCTCTAGACCCGATATGCAGCTGCGTAGCACCGATCCGGACGGGCGTGAGTTGATCCTCAGC
+TGTGGTGTGGCATTGCACCACTGCGTCGTCGCTTTGGCGTCGCTGGGCTGGCAGGCCAAGGTAAACCGTT
+TCCCCGATCCCAAGGACCGCTGCCATCTGGCCACCATCGGGGTACAACCGCTTGTTCCCGATCAGGCCGA
+TGTCGCCTTGGCGGCGGCCATACCGCGGCGACGCACCGATCGGCGCGCCTACAGTTGCTGGCCGGTGCCA
+GGAGGTGACATCGCGTTGATGGCCGCAAGAGCAGCCCGTGGCGGGGTCATGCTGCGGCAGGTCAGTGCCC
+TAGACCGAATGAAAGCCATTGTGGCGCAGGCTGTCTTGGACCACGTGACCGACGAGGAATATCTGCGCGA
+GCTCACCATTTGGAGTGGGCGCTACGGTTCAGTGGCCGGGGTTCCCGCCCGCAACGAGCCGCCATCAGAC
+CCCAGTGCCCCGATCCCCGGTCGCCTGTTCGCCGGGCCCGGTCTGTCTCAGCCGTCCGACGTCTTACCCG
+CTGACGACGGCGCCGCGATCCTGGCACTAGGCACCGAGACAGACGACCGGTTGGCCCGGCTGCGCGCCGG
+CGAGGCCGCCAGCATCGTCTTGTTGACCGCGACGGCAATGGGGCTGGCGTGCTGCCCGATCACCGAACCG
+CTGGAGATCGCCAAGACCCGCGACGCGGTCCGTGCCGAGGTGTTCGGCGCCGGCGGCTACCCCCAGATGC
+TGCTGCGAGTGGGTTGGGCACCGATCAATGCCGACCCGTTGCCACCGACGCCACGGCGCGAACTGTCCCA
+GGTCGTTGAGTGGCCGGAAGAGCTACTGCGACAACGGTGCTGACCATCGCAGCACTGTTCCGCTCGCGCC
+CGGTACGCTCGCGAGGGTGAATTCGCCGCCGGCCTGCTCTGCCCGCTGCCGCAGGTTCGTTAAGCCGCTT
+CCGGTGAACTCGTCGGGCAGCCCGCGGCCGTTGTCGGTCACCTCGATGCACAAGTCGTCGTCGACTTTGA
+CCCGGACGGTCAACGTGCTGGCCTTCGCATGGCGAACCGCGTTGCTGACCGCTTCCCGAACCACCGCCTC
+GGCCTGATCGGCGAGCGCGCTGTCGACCACCGACAATGGACCCACGAATTGAACGCTGGTGCGCAACCCC
+GAGTCGGCAAATTGGGCTACGGCCGCATCGATTCGCTGCCGGAGCCGAGTGATACCCTGCGATGCTCCGT
+GCAGGTCATAAATGGTGGTCCGGATTTCCTGTATAACGTCTTGCAGATCGTCTACCACGTCCGAGAGTCG
+TTGCTGCACTTCAGGATTACGTTCGTGCGGGACAGCACCCTGCAAAGCCAGGCCAATCGCGAAGAGCCGC
+TGGATGACATGGTCATGGAGGTCACGGGCGATACGATCCCGGTCGGTCAGTACGTCGAGTTCGCGCATCC
+GACGTTGCGAAGTGGCCAATTGCCAAGCCAGCGCGGCCTGGTCGGCGAACGCGGCCATCATCTCGAGTTG
+TTCGTCGGTGAAAGCCCCTGGACCGCCTTGACTCAGCACAACAACGACACCCGCTACGGTACCTCTGGCC
+CGCAGCGGCAACAGCAGCGCCGGACCTGCGTCGGCCAGTTCGTCCAGGCCTTCCAAATCGACCCGGTCGA
+CCCGTCGCGGAATGCCGTTGACGAAGACCTCCCGCAGCACCGCGCCCGCCACCGGAATCGTTCGCCCAAC
+AGTGGAAGCCACAGCGCTGCCGACTGTTTCAATCACCAGCAGCTCCCCCACGTCAGCGGCAGGCATGTCC
+TCGTCGACGGGAACGGCTACCAGGGCAGCGTCAGCCGCCGTCAGCTTGAGCGCCTCCGCGGCGACAAGCC
+GGAACACCGTCGCGGGTTCGGTGCCGGACAACAACTCGGTGGCGATGTCACGGGTGGCCTCGATCCACGA
+CTGACGCGCCTTAGCCTGCTGGTAGAGCCGGGCATTCGCGACTGCGATACCCGCGGCGGCCGCCAGCGCC
+TGGACCAGAACCTCGTCGTCGTCGCTGAACGGTTGCCCGTTGGTCTTGTCAGTCAGGTACAGAGTGCCGA
+ACGATTCATCGCGCACCCGAACCGGTACCCCGAGGAAGGTACGCATCGGCGGATGATACGGCGGAAAACC
+AATCGAGGCCGGGTGCGCAGAAACATCGTCCAGCCGTAACGGTTTGGGATCTTCGATGAGCAGCCCGATG
+ACGCCTAGGCCTTTCGGTAGGTGGCCGATCCGCCGAACGGTCTCCTCGTCGATGCCTTCATAGACAAAGT
+GCAATACCCGATGCTGCCGGTCGTGCACCTCCATAGCGCCATAGCGCGCATCGACAAGGCTGGTCGCTGA
+ATGCACGATAGCGCGTAGGGTTGCCTCCAGGTCCAGGCCCGCTGTGACCACGAGCATGGCCTCCACCAGA
+CCATCGAGGCGGTCCCGGCCCTCGACGATCTGCTCGACCCGGTCCTGCACCTCGACCAGCAGCTCGTGCA
+GGCGTAGTTGGGAGAGCGTGTGACGCAGTGGACGCATTGCGGCGCCGTCGTTTTCGTCGACGAGGCCCCC
+TGTTGTCATGGTCCATCACCGGGTGGCCGCGAGCGCTTCAACTCCGTCGCGAATACCGCGGCTTGCGTCC
+GACGTTCCATGCCCAGCTTGGCCAGCAACCGCGACACGTAGTTCTTCACCGTCTTTTCGGCTAGGAACAT
+TCGGTCGGCGATCTGCTTGTTGGTCAGGCCCTCGCTAAGCAGGCCCAGTAGCGTCCGCTCCTGGTCGGTA
+AGGCCTGATAGCGGGTCCTGCTTCTCGGCGGCACCGCGCAGCTTGGCCATCAGCGCGGCCGCGGCCCGAT
+TGTCCAGCAGCGACCGTCCAGCGCCCACATCTTTGACGGCGCGCGCCAACTCCATTCCCTTGATGTCTTT
+GACGACATATCCGCTGGCACCGGCGAGAATCGCATCTAGCATGGCCTCGTCAGAGGTGTAGGACGTGAGG
+ATCAGACAGCGCAGATCGGGCATGCGGGACAACAGATCGCGGCACAGTTCAATGCCGTTGCCATCGGGCA
+ACCGGACATCCAGCACCGCGACATCTGGGCGCGCGGCAGGAACCCTGGCCATCGCCTCGGCGACCGAACC
+CGCCTCACCTACGACGTCAAGCTCGGGATCGGCCCCAAGCAAGTCAACCAGACCACGACGCACCACCTCG
+TGGTCATCGACCAAGAAGACCTTTACCACCAGGGCACCACTCCCAAGATCCGCTCCCTACAAGTTGGCAC
+TGCGTACCGTAAGTACGGCGCATCCGGGCTGGTATGCACCGCACAATTCGTGCGCGGAGTGTGAGTCCGC
+GACGAACAGCTGACCCGGCTTTGCGTTGGCGGCCAGATGACGGCACGCACTGCCGCCGGCGATGGCCCGA
+TCCACCCGCACCTCGGGGTAGAGCCGGGTCCAGTGGGCGAGCCGACGGCTCAGGTGTACATGCGCCAACC
+GGCTGCCCTGTTCGACGTCATCGGGTGTTTCAGCAGCGTGGACAGCCACGGCCCGCAGCGGAACTCCGCG
+CAGCCTGGCCTCCTCGAATGCGTGCCGCAGCACCACACCATTGTCCACCTCCGCGACAACCGCGCTGACC
+TGGGAGGTTGTCGCTGGCTCGGCCGGCGACGGGTGAATCACCGCCACGGGGCATAAGGCCGACCCAGCCA
+GGGTCGCCGCGACCGAACCCCGGCGACCGCGGACATGATCAAGCCCCACCGAACCGACGCACAGCATCGC
+CGCGGACCTGGACTCCTGCATCAGCTTGGTGAGCGGCCTGCCGCACAGAACCTCCGTTTCGATCTTGACC
+GGTTGCCCGGTGGCCTCGACCTTCCGAGAGGCGTCGTGCAGCGCCGCTCGGGCCGCTGATTGCCCACCGC
+CCTCGCCGGCGGCGGACAGTTGGGACGGATCGATGACGTACACCAGTCGCAGCGGAATGTCTCGGTTCAC
+CGCCTCATCGACCGCCCACAACGCCGCATGCGTTGCCGCCCTTGACCCGTCGATACCAACGACCACTGCC
+CGAGCTGGCCGAGGATCGCTCATCGCCGTCTCCTTCGCTGGGGCGGATACATCCCGTCGGTTCAGCGGTA
+CGTTACTGGCGGGGACCGCTATCTCCCAGGGGCGTTGGTCCCCACCTGAGGGCCGTTAGTCCTTATCGAC
+CGATGACAGACGCAACCCGTCAGGGCGAGAATGAATCTCACCTATCGCACGGGTGGCTCGTCCAGGTCCA
+CAACCATCGCCCAGCTTTTCACAGCAAAGTCCCAGAAATGGCTTACAGTTGCCGACAGCTGCCGAACCAG
+CGGCCGTCCATCGGCTGCATATCGCTTGACCCACAGAATATTTGGGCATAGCCGCGCTGTGAGAGCGCAT
+CTCGATGCGGCCGGCACGGCGTCGATCAATCTCCGATCCGCCGTCAGTCGACTGCCATACAACCTGCCCG
+CCCAGTTGTACACTGGCCGCGGCACGAGTTGCCGCACTGGTCAACAAGTATCAGCCGGCCTGCGCCCGAG
+CGGAGCCCACTCGGAGCCGCTCGTGACCATGGGGGGAGCCACTGCCGTCTCCCGCATGCCCACACCGAGG
+TCCGAATTGGGCTGGGTGCGCAATCGACGTTAGGGGCCTGCGGAGTAATGGACTACGCGTTCTTACCACC
+GGAGATCAACTCCGCGCGTATGTACAGCGGTCCCGGACCGAATTCAATGTTGGTTGCCGCGGCCAGCTGG
+GATGCGCTGGCCGCGGAGTTAGCATCCGCAGCAGAGAACTACGGCTCGGTGATTGCGCGTCTGACCGGTA
+TGCACTGGTGGGGCCCGGCGTCCACGTCGATGCTGGCCATGTCGGCTCCATACGTGGAATGGCTGGAGCG
+GACCGCCGCGCAGACCAAGCAGACCGCTACCCAAGCCAGAGCGGCGGCGGCGGCATTCGAGCAGGCTCAT
+GCGATGACGGTGCCCCCAGCGTTGGTCACCGCCAACCGAGCCGAGCTGAAAGCACTGATCGCGTCGAACC
+TCCTGGGCCAGAACACCGCAGCGATCGCAGCCATCGAGGCACAGTACGCCGAGATGTGGGCACAAGACGC
+GGCCGCGATGTACGGCTACGCCACCACCTCAGCGGCGGCGAGACAGTTGACGCCGTTCTCCTCGCCACAA
+CAGACCACCAACCCGGCCGGGCTAGCCGCCCAGAACGCCGCGGTCACCCAGGCCGCCACCAACTCCGCCG
+GGAACACGCCGACCGCATTGTCGCAACTGTCCTCTTTCCTGTCGCAGGCAGTAGAGGCGCCGACGGGATG
+GCCCAACATTCTCCCGGATGACTTCACCATCCTTGACGGCATATTGGCTGCGTACGCAACGGTCGGCGTG
+ACGCAGGACATCGAGTCGATATGTGCGGGCATCATCGGGGCCGAGAACAACTTGGGCCTTTTAGGCGCCG
+CCAGTGAGAATCCGGCGGAGTTGGCGCCGGGCGCGTTCGGGATCGATGCGGCACTCAGTTCGGCAGAAAA
+AGGCGCTGCTGCGAGCATGCACGATGCGGTACTCGCGAGTGCCGGCCGGGCGGGTTCGATCGGGCCGATG
+TCCGTACCACCGTCCTGGGCCACGCCCTCGAGCACCCCGGTCTCGGCGTTGTCGGGCGCCGGCTTAACCA
+CGCTCGACGGGACCGACGTAGCCGAGCACGGTACGCCCGGCTTGCCAGGGGTGCCAGCAGGGACAGACAA
+GCGAGCCTCGGGTGTCATCCCCCGATACGGGGTCCGGCTCACGGTGATGTCGCGCCCGCCGGCGGCTGGG
+TGACGCGGCTGCCGCTGTCACTGTCATCCTGTAGGCGAGCCAACCCCGGTCACCACTAGCGTGCCGCAAA
+GATCTGCGCGCGGCCCGCGCACTGAGCCCCAGGAGGGGTCAGTGAATTCAGTTGTGTGACTGCGTCTTTC
+GTCGACACCGCGTCAGGTGCCGGCGTTTCTTTCTCGCGGCTACGATTCACCGCGCCCCAGGAATTCACTC
+GATAGCCGCCTGGAATTCACGCAGATCTGCCCACGCCGGCCGGAGACCTTTGCGAGTTTTATGACACGCT
+GTCACCGAAGGTAGCCCGAGATGCCCTTTGCGGATGCCTGGATACCAAGTCCGATAGCGTCTGCAAAGCG
+TTCCTGCCATCACACGGCACGCCACGGTAGCGCGAACCCCCGCCATACGCCCCAGCTGCGCCCCGGCCAC
+GACACCGGACCCCGACACGCGTCGGGTCGTACTACTCGCGTTCAACTGCCACGAGCGGCCATATGACTTG
+GATTACAACAGTTTTGACTCGGCAGCCGGATAGGTCAGGCATCCGGGGTGCCATCGTTGTCGAAACGGCC
+AGTGCCAGCAACACCGCTGGCACTCCACCTTGACCCATTCAGTTCTCGACCAGCACGACACCGTATCCGC
+ACAAATGTAAGGAGCTGAGACACAATGGATTTCGCACTGTTACCACCGGAAGTCAACTCCGCCCGGATGT
+ACACCGGCCCTGGGGCAGGATCGCTGTTGGCTGCCGCGGGCGGCTGGGATTCGCTGGCCGCCGAGTTGGC
+CACCACAGCCGAGGCATATGGATCGGTGCTGTCCGGACTGGCCGCCTTGCATTGGCGTGGACCGGCAGCG
+GAATCGATGGCGGTGACGGCCGCTCCCTATATCGGTTGGCTGTACACGACCGCCGAAAAGACACAGCAAA
+CAGCGATCCAAGCCAGGGCGGCAGCGCTGGCCTTCGAGCAAGCATACGCAATGACCCTGCCGCCACCGGT
+GGTAGCGGCCAACCGGATACAGCTGCTAGCACTGATCGCGACGAACTTCTTCGGCCAGAACACTGCGGCG
+ATCGCGGCCACCGAGGCACAGTACGCCGAGATGTGGGCCCAGGACGCCGCCGCGATGTACGGTTACGCCA
+CCGCCTCAGCGGCTGCGGCCCTGCTGACACCGTTCTCCCCGCCGCGGCAGACCACCAACCCGGCCGGCCT
+GACCGCTCAGGCCGCCGCGGTCAGCCAGGCCACCGACCCACTGTCGCTGCTGATTGAGACGGTGACCCAA
+GCGCTGCAAGCGCTGACGATTCCGAGCTTCATCCCTGAGGACTTCACCTTCCTTGACGCCATATTCGCTG
+GATATGCCACGGTAGGTGTGACGCAGGATGTCGAGTCCTTTGTTGCCGGGACCATCGGGGCCGAGAGCAA
+CCTAGGCCTTTTGAACGTCGGCGACGAGAATCCCGCGGAGGTGACACCGGGCGACTTTGGGATCGGCGAG
+TTGGTTTCCGCGACCAGTCCCGGCGGTGGGGTGTCTGCGTCGGGTGCCGGCGGTGCGGCGAGCGTCGGCA
+ACACGGTGCTCGCGAGTGTCGGCCGGGCAAACTCGATTGGGCAACTATCGGTCCCACCGAGCTGGGCCGC
+GCCCTCGACGCGCCCTGTCTCGGCATTGTCGCCCGCCGGCCTGACCACACTCCCGGGGACCGACGTGGCC
+GAGCACGGGATGCCAGGTGTACCGGGGGTGCCAGTGGCAGCAGGGCGAGCCTCCGGCGTCCTACCTCGAT
+ACGGGGTTCGGCTCACGGTGATGGCCCACCCACCCGCGGCAGGGTAACCCGGCGCCTAACCGACAGGCGG
+CCCGTTGGGCGTAAACGTCCAATTGTCAGGATTCTTCGGCGAGTACACCACCGGAAGTATTTGACCGACG
+GTCGGCCACTGGTCGACGTCGACGGCCATGCGCTGATACACGGCGTACTCATTGACCGTGGGCCCAGTGA
+TGATCCCGGCGATGGTGACATACTGCTGGCCGCCTGCGTCCGGTCGCGGGCTGACTCCGGTCACCAGGAG
+CGTGCCGCTGGCCAGATCTCCCCGCGGGCCGCGCGGGATAAGCCGCGGAGCAAGAAATACCGCTAGGACC
+GCGATCAGTATGAGTAGCACGCCAAACTCCCATCCCACCCGGCCATGGTAGGACTGCTGGCATGAGCCGT
+TATTACGCCGAGCGTGAACTCAGTGCAAGAACGCACGCGAAAAATCGCACTGGGTACACGCTCGGCGAAA
+GGATGGTGCACCAGTGAGCCACGACGATCTAATGCTTGCGCTGGCTCTGGCCGACCGTGCGGACGAATTG
+ACGCGGGTCCGGTTCGGGGCGCTCGATCTGCGCATCGACACCAAACCGGATTTGACGCCGGTGACCGACG
+CCGATCGGGCGGTCGAATCCGACGTGCGCCAGACGCTGGGCCGCGACCGGCCCGGCGACGGCGTCTTGGG
+CGAGGAGTTCGGCGGATCAACGACCTTCACCGGACGGCAGTGGATCGTAGACCCGATCGACGGCACCAAA
+AACTTTGTGCGCGGGGTGCCGGTGTGGGCCAGTTTGATCGCGCTGCTTGAAGATGGCGTCCCGTCGGTCG
+GTGTGGTGAGTGCGCCGGCGCTGCAACGGCGGTGGTGGGCGGCACGCGGCCGGGGCGCGTTCGCATCCGT
+CGATGGTGCGCGTCCACACCGGCTGTCGGTTTCCTCTGTGGCAGAGCTGCATTCGGCGAGCTTGTCGTTT
+TCCAGTCTGTCCGGGTGGGCGCGGCTGGGTCTACGTGAACGCTTCATCGGGTTGACCGATACCGTGTGGC
+GCGTGCGTGCTTACGGCGACTTTCTGTCTTACTGCCTGGTGGCCGAGGGCGCCGTCGATATTGCCGCCGA
+ACCGCAAGTGTCGGTATGGGATCTGGCGGCACTGGACATCGTGGTGCGTGAGGCGGGCGGGCGGCTCACC
+AGCCTGGACGGCGTCGCCGGCCCACACGGGGGCAGCGCCGTTGCAACCAACGGTCTGTTGCACGACGAGG
+TGCTGACACGGCTCAACGCCGGGTAACCTGGCGCTCGAGAGCGCCATGAGCGACCCGTTCACCATCGCAA
+CCAAACACTGGCACCGACTGCACGACAGCCGGATCCAGTGCGATGTATGTCCACGCGCATGCAAACTTCA
+CGAGGGACAGCGTGGCCTGTGTTTCGTCCGCGGCCGATTTGACGATCAAGTGAAGCTCACCAGCTACGGA
+CGCTCTAGCGGATTCTGTGTCGATCCGATCGAGAAAAAGCCGCTCAACCACTTCTTGCCAGGTTCGGCGA
+CGCTGTCTTTCGGCACCGCCGGGTGCAACCTGGCGTGCAAGTTCTGCCAGAACTGGGATATCTCCAAGTC
+CCGCGAGATCGACGTCCTGGCCAATCGGGCGGCCCCGGCCGACATCGCCCGGACCGCACACGAATTGGGT
+TGCCGCAGCGTGGCATTCACCTACAACGACCCAACGATCTTCTGGGAGTATGCCGCCGATGTAGCCGACG
+CCTGCCACGACCAGGGAATCAAAGCCGTCGCGGTGACGGCCGGGTACATGTGTCCTGAGCCCCGCGCGGA
+ATTCTACCGGCGTGTCGACGCCGCCAACGTCGACCTAAAGGCATTCACCGAAGACTTTTATCGCAAGGTT
+TGCGTCAGTCACCTGCGCAACGTCCTGGACACCCTGGCCTACCTGCGGCACCAGACGAATGTGTGGTTGG
+AGATCACCACCCTGCTGATTCCCGGACGTAACGACAGCGACGCGGAAGTCGCTGCCGAATGCAGATGGAT
+CCGCGAAAACCTGGGCGTCGACGTGCCGGTGCATTTCACCGCGTCCCATCCCGACTACAAGATGATGGAC
+ACCCCGGCTACACTACCCGCCACATTGACCCGAGCCCGCGAGATCGGCATTGGCGAAGGCCTGCGCTTCG
+TCTACACCGGAAACGTTCACGATGCCGTGGGTGGCAGCACCTCGTGCCCAGGCTGCCGGGCAACGGTGAT
+CGTTCGCGACTGGTATTCGATACGACATTACGCCCTCACCGAGGACGGCCGCTGCCAAGCATGCGGCTAT
+CAGATGCCTGGCGTGTACGACGGACCGGCCGGACACTGGGGCCAGCGCCGGCTGCCCTTGCTGACCAGCT
+TGTCCCGGATGTGAACAACTTAACAAGCACCCCTATCTTACTCCGGAGTAAGATAGGGTGGTCCGCTATC
+ACCCCGATGACCGAGGCTGCCGTATGACCAACACCACCTCTGCTGCAAATGCTGCAAAACCCTCCGGCGC
+ACGCACCGATAGACGCGGCCGCACGACCGGTGTCGGCCTGGCGCCCCACAAACGGACCGGCATCGACGTC
+GCACTGGCGCTGCTAACCCCGATTGTCGGCCAGGAGTTCCTGGACAAATACCGCCTGCGCGATCCGCTGA
+ACCGATCACTGCGCTACGGCGTGAAGACGATGTTTGCCACTGCCGGCGCCGCCACCCGTCAGTTCCAGCG
+GGTGCAAGGCCTGCGGGGCGGACCGACCCGGCTGAAGTCCAGCGGCCGAGACTACTTCGATCTGACGCCC
+GATGACGACCAGAAGCTGATCATCGAGACCGTCGACGAATTCGCCGAAGAGGTACTGCGACCCGCCGCGC
+ACGACGCCGACGACGCCGCGACCTACCCGTCCGACTTGACCGCCAAGGCCGCCGAGCTGGGCATTACCGC
+GATCAACATCCCCGAGGACTTCGACGGTATCGCCGAACACCGCTCCAGCGTCACCAACGTGCTGGTGGCT
+GAGGCACTGGCGTATGGCGACATGGGCCTGGCACTGCCGATCCTGGCGCCTGGCGGGGTGGCGTCCGCGC
+TCACCCATTGGGGCAGCGCCGATCAGCAGGCCACCTATCTCAAAGAGTTCGCCGGCGAGAACGTTCCGCA
+GGCCTGCGTGGCCATCACCGAACCGCAGCCACTATTCGATCCCACCCGGCTGAAGACCACCGCGGTGCGC
+ACCCCGTCCGGTTACCGGCTCGACGGCGTGAAGTCGTTGATCCCGGCCGCCGCCGACGCCGAGCTGTTTA
+TTGTCGGCGCGCAGCTGGGCGGCAAGCCCGCACTGTTCATTGTCGAGTCCGCGGCCAGCGGCCTGACCGT
+CAAGGCGGATCCGAGCATGGGGATTCGCGGCGCGGCGTTGGGCCAGGTCGAACTCTGCGGGGTGTCGGTC
+CCGCTTAACGCCCGGCTGGGCGAGGACGAAGCCAGCGACAACGACTATTCCGAGGCGCTTGCGCTGGCCC
+GGTTGGGTTGGGCGGCGCTGGCGGTCGGTACCTCTCACGCCGTGCTCGACTACGTCGTCCCGTATGTGAA
+ACAACGCCAGGCTTTCGGCGAGCCGATCGCTCATCGCCAAGCGGTGGCGTTCATGTGCGCCAACATCGCG
+ATCGAGCTCGACGGCCTGCGCCTGATCACCTGGCGCGGGGCGTCCCGTGCCGAGCAGGGTCTGCCGTTCG
+CAAGGGAAGCGGCGCTAGCCAAGCGGCTTGGCTCCGACAAGGGCATGCAGATCGGCCTGGACGGGGTGCA
+ACTGCTGGGCGGCCACGGCTACACCAAGGAGCATCCGGTTGAGCGCTGGTACCGCGACCTGCGAGCCATC
+GGCGTCGCCGAGGGCGTTGTTGTCATCTAGAACGAGCTGAAAGATCAATCATGGCAATAAATCTGGAACT
+GCCGCGCAAGCTGCAGGCGATCATCGTCAAGACCCATCAGGGCGCTGCGGAGATGATGCGGCCGATAGCC
+CGCAAGTACGACCTGAAGGAACATGCCTACCCGGTCGAACTCGACACCCTGATCAATTTGTTCGAGGGCG
+CCGCCGAATCGTTCAACTTTGCCGGAGCCCATTCGCTTCGCGACGAGGACGAAGGCAAGGACGAAAACCA
+CAACGGTGCCAACATGGCCGCCGTGGTACAGACGATGGAGGCCAGCTGGGGCGACGTCGCGATGATGCTG
+TCGCTGCCCTATCAGGGGCTGGGTAACGCAGCCATCTCCGCGGTAGCCACCGACGAGCAGCTGGAGCGGC
+TGGGCAAAGTGTGGGCAGCGATGGCCATCACCGAACCGGAATTCGGATCGGACTCGGCGGCAGTGTCGAC
+GACCGCCACCCTCGACGGCGACGAGTACGTGATCAACGGCGAGAAGATCTTTGTCACCGCCGGTTCCCGC
+GCCACCCACATCGTGGTCTGGGCCACGCTGGACAAATCCTTGGGCCGCCCGGCGATTAAGTCGTTCATCG
+TGCCCCGTGAGCATCCCGGCGTGACCGTCGAACGACTTGAACACAAACTCGGCATCAAGGGTTCTGATAC
+TGCGGTGATCCGGTTCGACAACGCCCGTATCCCCAAGGGCAACCTACTTGGGAACCCGGAAATCGAGGTC
+GGCAAGGGCTTTGCCGGGGTGATGGAGACCTTCGACAACACCCGGCCGATTGTGGCCGCCATGGCCGTCG
+GGATCGGCCGTGCCGCACTGGAGGAAATCCGTAGTGTCCTCACCGGGGCCGGCGTGGAGATCTCCTACGA
+CAAGCCCTCACACACCCAGAGCGCCGCGGCCGCCGAGTTCCTGCGGATGGAGGCCGACTGGGAGGCCAGC
+TACCTACTGTCCCTGCGCGCAGCCTGGCAGGCCGACAACAACATCCCCAACTCCAAAGAAGCCTCGATGA
+GCAAGGCCAAGGCGGGCCGGATGGCCAGCGACGTCACCTGCAAAACCGTCGAATTGGCAGGAACTACCGG
+GTATTCCGAGCAATCACTGCTGGAGAAGTGGGCCCGCGACTCCAAGATCCTGGACATCTTCGAGGGCACC
+CAGCAGATCCAGCAGCTGGTGGTCGCACGCCGACTGTTGGGCCTGTCGTCGTCCGAGCTCAAATAGCCTC
+GGCGAGCAGACGTCAAAGCCCCCGAATTTCAGTGAAATCGGGGGCTTTTGCGTCTGCTGGCGCCCGTCTG
+CACCCCCGCCAGTAGGCTGGTCGGCATGCGCGCGGTACGGGTGACTCGGCTGGAGGGACCAGATGCGGTC
+GAGGTGGCCGAGGTCGAGGAACCCACGAGCGCCGGTGTGGTCATCGAGGTGCACGCTGCCGGCGTGGCCT
+TCCCGGACGCACTGCTAACCCGTGGCCGTTACCAGTACCGCCCGGAGCCGCCATTCGTGCTCGGCGCCGA
+GATCGCCGGAGTGGTTCGATCGGCGCCGGATAACAGCCAAGTGCGTTCCGGAGACAGGGTTGTCGGCCTC
+ACGATGCTCACCGGCGGCATGGCCGAAGTCGCGGTATTGTCGCCCGAGCGCGTGTTCAAGCTGCCGGACA
+ACATGACTTTCGAGGCGGGCGCGGGCGTGCTGTTCAACGACCTGACGGTGTACTTCGCGCTGGCGGTCCG
+GGGCCGGCTGCAGGCCGGTGAGACGGTGCTGGTGCACGGGGCGGCAGGCGGGATCGGCACATCGACGTTG
+CGACTAGCGCCGGCGCTCGGGGCGTCTCGCACCGTCGCGGTGGTCAGCACGCAGGAGAAGGCCGAGCTTG
+CGACAGTGGCCGGGGCGACAGATGTGGTGTTGGCCGAGGGGTTCAAGGACGCGGTACAGGAGCTGACGAA
+CGGCCGTGGTGTCGACATCGTCGTAGACCCGGTCGGCGGCGACCGGTTCACCGATTCGCTGCGCTCGCTT
+GCTGCGGGAGGACGGCTGTTGGTCATCGGCTTCACTGGCGGCGAGATTCCCACCGTGAAGGTAAACCGCC
+TTCTGCTCAACAACATTGACGTTGTCGGGGTAGGCTGGGGCGCCTGGTCGCTGACCCACCCCGATGCGCT
+GGCCCAGCAGTGGTCACAACTCGAGCGGCTGCTACGCTCGGGCAAGCTGCCTCCTCCCGAACCAGTGGTC
+TACCCACTGGACCAAGCCGCTGCGGCGATTGCATCGCTGGAGAATCGCACCGCCAAGGGGAAGGTCGTAC
+TACGCGTGCGCGACTAACGCCCCTCCCGGGACGCGTCGCCGCCGTGCTCTGGCCAATTTGCCGCTTCCTC
+ACTGGTCGCCGTTGGCGTCGGCTACGTCCTGCCGCACAACTCGCAGCTTGCCTGGCGCCAGGCACGCGGC
+GTATCCGTGGTATTTGCCATACAGTTCCCATGCGGTGACGCGATCATCGGGGTGCACGTCGATCTGATGA
+CCGTCGGAGAACTCAAGATGGAGATCTCCGGTGTCATACCAGACGAAAGCTGTGCAGGTTGCCCCGGCGA
+AATCGAAGAGCGGACGCTCGTGGTCGGCTGGGTCGTTTGGGTCGATGGCGACCACTTCTGCGGGCGAGGT
+TTCGATGGCCGGCAGAGTCAGCTGTAGTGGTACCGAGATGACCAGCTCGTTGTAATCGTCGAAGTTCAGC
+ACCAGACCGTCGCGGAACATAATCCGCTGAACCGCACAGCCCTCTAACCACTGCTCGGTCATTTCCTGTT
+CGGTCATATATTCACTCTGGCCTTGTTGTGCCCATATGTCACGTACACAACCGCCGAAATCTCGTGCGGG
+ATTACACCCTAGGCGTCCGATGGACACCAGTACCATCTGACACCGTGCCCGACTCCAGCACCGCATTGCG
+GATCCTCGTCTACAGCGACAACGTCCAGACCCGCGAACGGGTGATGCGGGCCCTGGGCAAACGGTTGCAC
+CCGGATCTGCCCGATTTGACCTACGTCGAAGTGGCTACCGGTCCGATGGTGATACGCCAGATGGATCGGG
+GGGGCATCGACTTGGCCATCCTCGACGGTGAGGCGACACCGACCGGAGGCATGGGAATCGCCAAACAGCT
+CAAAGACGAACTTGCCAGTTGCCCGCCCATCCTGGTGCTCACCGGCCGTCCGGACGACACCTGGCTGGCC
+AGCTGGTCGCGGGCCGAGGCCGCAGTGCCGCATCCCGTCGACCCCATCGTGCTGGGCCGCACGGTGCTCT
+CACTGTTGCGCGCACCCGCCCACTAACCGGACGCGGCCGGCATTCGCGGCGCGAACGTTCAGCCGCCCCG
+CATTTGAATCTTCGGGTCCTGTCTTACCCGAGGTCGTAATTGGCCCGCTGCCGCTTCCGGCCGCAACGAC
+GGCGCTGTCTCCTCCGCCGCTGAAGTCTCTGAAGCCTGCTGACCTTGCGCGGTGCGTAGTGTCGATTCCG
+GAATTCCAGAACCCGCGGATTGGCCTACCCGCGTTGTCGACAGCGGAGCGGCCTTGGCCGCAACTTTCGG
+ATCCACAGTTGGCAGCACCCCCATTGCTGGAACTTCAAGTTCTGGAACTTCCACAACGGCTTCCGGTGGC
+GCGGAAGCCGCCGGCTCTGGCGCTCGAGCTGACTCGGTGGCAGTTCCCGGGGCAGAGTTAGTGCCGCCAC
+GTGCCATCTGACCCAGAGCGGCGAGCGCGAGCGGGGCACCGATGAAGCCGGGGCTCACAACGCCGGCATG
+GGCACTGGTAGCGCTCGACGCGACGACGTCTCCGGCGCCAACATCGCCACCGCCGAAATTCCCTTGGCCT
+ACACTGCCATGGGCCGGATCACCGGCCGCTAACCCGGCGCTAGCCACGCCGCCTCCGACGTAGCCGACGC
+CCCCGCCGCTAGCGGTTGCACCTCCGGTGCCGACGCTCTCACCGCCGCCGGTGCCGACGCTCTCGCCGCC
+AGTAGCGCCGGTGCCGACGCTCTCACCGCCAGTAGCGCCGGTGGCGCCGGCACCCAAACCCGGAAATCGC
+TGCAGCAAACTCGCCCACGGCACCACTTGCGCGGCAATCGCCGATGCCCCGGAGTAGTACCCCGACATGG
+CGGCCACATCCGCGGCCCACATCTCCTCGTACACACCCTCGGCGGCAGCAATCAACGGCGCGTTCTGCCC
+GAACAAATTCGTCATCACCAGCTGCACGAATGCGTCGCGGTTGGCGGCCACCGCCGCCGGAAGCACCGTC
+GCCGCCTGCGCCGCCTCGAAGATGCTGGCCACTGCGCGCGCCTGTCCCGCCGCCCCGGCCGACTGAGCCG
+CTGCCGCGGTCAACCACCCCGCGTAGGGAGCCGCCGCTGCCGCCATCGCCAAGGCTGCCGGACCCTGCCA
+CGCCTGACCCGCCAGCCCGGCCGTGACCGACGCAAATGATTGCGCCGCGGTCCCCAACTCTTCGGCAAGC
+CCGTCCCAGGCTGCCGCCGCCGCCAGCATCGGCGCAGTGCCTGCACCGATGAACATTCGCAAGGAATTGA
+TCTCCGGCGGCAGCACGACGAAACTCACAGCTCCCGTCCTTCCGCTTCGCTGCTCGATGCCACGCCGACC
+TCAATACGGCCAACGATTAACCGGCAAATGCCGAGATTAACAACAAATGCTGCGCTTATCAGGGGGTTAG
+ACCAACATTCATACAATTCGCCGGGACGCGCAATCCCCAGTTTTGCTTCGCAGCGACCGACGCCGGACCC
+AGCCACGGGTTCTGCTTCGACTCGCACAGGTATGCACCAGCCTGACCCCGGGAATGTGGGGTGGCCGTTG
+CGCGACTATGTTGAAGGGCACTGTGACGGCCCGAAGCCCCGGTTCGTCACGGCAGCCCGGTCACCGCCCG
+GCCGCCGCGCTGGCGGCCCCGTACGACGGATCATGGAGCGAGTTGAACGTCTACATACCCATCCTGGTAC
+TGGCGGCGCTGGCCGCCGCCTTCGCCGTGGTGTCGGTGGTGATCGCGAGCCTGGTCGGCCCGTCGCGGTT
+CAACCGGTCAAAGCAGGCCGCCTACGAATGCGGGATCGAGCCCGCTAGCACTGGAGCCAGAACCTCCATT
+GGCCCCGGCGCGGCGAGCGGGCAGCGGTTCCCCATCAAGTACTACCTGACCGCGATGTTGTTCATCGTCT
+TCGACATCGAAATTGTGTTCCTCTACCCGTGGGCGGTCAGCTACGACTCGCTGGGCACGTTCGCGCTGGT
+CGAGATGGCGATATTCATGCTCACGGTGTTCGTGGCCTACGCGTATGTGTGGCGCCGCGGGGGCCTGACG
+TGGGATTGAGGTAGGGCGTGGGCCTGGAAGAACAGCTGCCCGGCGGGATCCTGCTGTCGACCGTCGAGAA
+GGTGGCGGGCTATGTCCGCAAAAACTCCCTGTGGCCGGCAACATTCGGATTGGCGTGCTGTGCGATCGAG
+ATGATGGCGACCGCGGGACCAAGGTTTGACATTGCGCGGTTCGGGATGGAACGGTTCTCGGCCACGCCGC
+GGCAGGCAGATCTGATGATCGTGGCGGGCCGGGTCAGCCAGAAGATGGCGCCGGTACTGCGCCAGATCTA
+TGACCAGATGGCGGAGCCGAAATGGGTTCTGGCCATGGGTGTGTGCGCCTCGTCAGGTGGGATGTTCAAC
+AACTATGCGATCGTGCAGGGCGTGGATCATGTTGTTCCGGTCGACATCTACCTACCCGGCTGCCCGCCGC
+GCCCGGAGATGCTGCTGCACGCAATCCTGAAGCTGCACGAAAAGATTCAGCAGATGCCATTAGGTATCAA
+CCGGGAACGCGCTATCGCCGAGGCCGAAGAGGCGGCGTTGTTGGCCCGGCCCACCATCGAGATGCGCGGA
+CTGCTGCGATGAGCCCGCCGAACCAAGACGCCCAGGAAGGCCGCCCGGACTCCCCCACCGCGGAGGTGGT
+CGACGTTCGCCGCGGCATGTTCGGCGTCTCGGGCACCGGTGACACCTCCGGTTACGGACGGTTGGTGCGC
+CAAGTCGTCCTCCCTGGCAGCAGCCCCCGGCCCTACGGCGGCTACTTCGACGATATCGTCGACCGGCTGG
+CCGAGGCACTGCGGCACGAGCGCGTCGAATTCGAGGACGCCGTCGAGAAAGTCGTGGTCTACCGCGATGA
+ACTGACCCTGCACGTCCGCCGGGATCTACTGCCGCGGGTCGCCCAGCGGCTGCGCGACGAACCCGAATTG
+CGATTCGAGCTGTGTCTTGGGGTGAGCGGGGTGCACTACCCGCACGAGACGGGTCGGGAGCTGCATGCCG
+TCTACCCGCTGCAGTCGATCACCCACAACCGTCGCCTCCGGTTGGAAGTGTCTGCGCCGGACAGTGATCC
+GCACATCCCTTCCCTGTTCGCGATCTATCCGACCAACGACTGGCACGAGCGGGAAACCTACGACTTCTTC
+GGGATCATCTTCGACGGCCATCCGGCCCTGACCCGGATCGAGATGCCCGATGACTGGCAGGGGCATCCGC
+AACGCAAGGACTACCCTCTCGGCGGCATCCCGGTCGAATACAAGGGCGCGCAGATACCCCCGCCCGACGA
+GCGGAGGGGCTACAACTGATGACGGCAATCGCCGACTCGGCTGGCGGCGCCGGCGAGACCGTCCTGGTCG
+CTGGCGGGCAGGACTGGCAGCAGGTCGTGGACGCCGCGCGCAGCGCGGATCCCGGTGAACGCATCGTCGT
+CAACATGGGGCCCCAGCACCCGTCTACCCACGGGGTGTTGCGGTTAATCCTGGAGATCGAGGGCGAAACA
+GTCGTCGAAGCCCGGTGCGGAATCGGCTACCTGCACACCGGAATCGAGAAGAACCTCGAATACCGGTACT
+GGACCCAGGGCGTCACCTTCGTGACCCGAATGGATTACCTGTCACCGTTTTTCAACGAAACCGCCTACTG
+CCTCGGCGTGGAGAAGCTGCTCGGCATCACCGATGAGATACCCGAGCGGGTCAATGTCATCCGCGTGCTG
+ATGATGGAGCTCAACCGGATCTCGTCGCATTTGGTCGCATTGGCGACCGGGGGCATGGAATTGGGCGCCA
+TGACTCCGATGTTCGTCGGCTTCCGGGCACGCGAGATCGTGCTCACGCTGTTCGAAAAGATCACCGGTTT
+GCGGATGAACAGCGCCTACATCCGACCCGGCGGCGTGGCGCAGGACTTACCGCCCAACGCGGCCACCGAA
+ATCGCGGAAGCACTCAAGCAGTTGCGCCAACCACTGCGCGAAATGGGCGAGCTGCTCAACGAAAACGCCA
+TCTGGAAGGCCCGCACCCAGGGCGTCGGATACCTGGATCTGACCGGATGCATGGCACTGGGCATCACCGG
+CCCGATACTGCGTTCCACTGGGTTGCCCCACGACCTGCGGAAAAGCGAGCCCTACTGCGGATACCAGCAC
+TATGAATTCGATGTGATCACCGACGACAGCTGTGATGCCTACGGGCGCTACATGATTCGCGTCAAAGAGA
+TGTGGGAGTCGATGAAGATCGTGGAGCAGTGTCTGGACAAGTTACGACCCGGCCCGACCATGATCTCCGA
+TCGCAAGCTCGCCTGGCCGGCCGACCTGCAGGTGGGGCCCGACGGCCTGGGCAACTCACCCAAGCACATC
+GCCAAAATCATGGGCTCCTCGATGGAAGCGCTGATCCACCACTTCAAACTGGTCACCGAGGGCATCCGGG
+TGCCGGCGGGCCAGGTCTACGTCGCGGTGGAGTCCCCCCGTGGTGAGCTCGGCGTACACATGGTCAGCGA
+CGGTGGCACCCGCCCCTACCGGGTGCACTACCGGGATCCCTCCTTCACCAACCTGCAGTCCGTCGCCGCG
+ATGTGCGAAGGCGGGATGGTCGCCGATTTGATCGCGGCGGTCGCCAGCATTGACCCGGTCATGGGCGGGG
+TGGACCGGTGACACAGCCACCCGGTCAGCCGGTGTTCATCCGGCTCGGACCGCCACCGGACGAACCCAAC
+CAGTTTGTCGTCGAGGGCGCTCCGCGGTCGTATCCGCCGGACGTACTGGCGCGGCTGGAGGTCGACGCCA
+AGGAGATCATCGGCCGCTATCCCGACAGGCGCTCGGCGCTGTTGCCGTTGCTGCACCTGGTGCAGGGCGA
+GGATTCCTACCTGACGCCGGCGGGTTTGCGGTTCTGCGCCGATCAACTCGGGCTGACCGGGGCCGAGGTG
+TCGGCGGTGGCCAGCTTCTACACCATGTACCGCCGGCGCCCCACCGGCGAGTACCTGGTGGGTGTGTGCA
+CGAACACGCTGTGCGCCGTCATGGGTGGCGACGCCATCTTCGACCGCCTCAAAGAGCATCTCGGCGTCGG
+CCACGACGAAACCACCTCCGACGGTGTGGTCACCTTGCAACACATCGAATGCAACGCCGCCTGCGATTAC
+GCACCGGTGGTGATGGTCAACTGGGAATTCTTCGACAACCAGACGCCGGAGTCCGCGCGCGAACTCGTCG
+ACTCGCTGCGCTCCGACACACCGAAGGCGCCCACCCGCGGCGCGCCGCTGTGCGGCTTCCGGCAAACATC
+GCGCATCCTGGCGGGTCTACCCGACCAGCGTCCCGACGAAGGCCAGGGCGGTCCCGGCGCGCCCACCCTG
+GCCGGGCTGCAGGTGGCAAGGAAGAACGACATGCAGGCGCCACCAACCCCCGGAGCGGACGAATGACCAC
+GCAGGCCACCCCGTTGACCCCGGTGATCAGCCGCCACTGGGACGACCCGGAGTCGTGGACCCTGGCCACT
+TATCAACGCCACGATCGCTATCGGGGCTATCAGGCGTTGCAGAAAGCCCTGACGATGCCGCCCGACGACG
+TGATCAGCATCGTCAAGGATTCCGGGTTACGCGGACGCGGCGGCGCGGGCTTTGCCACCGGGACCAAGTG
+GTCGTTCATCCCGCAGGGCGACACCGGCGCCGCGGCCAAGCCGCACTACCTGGTGGTCAACGCCGACGAG
+TCCGAACCCGGTACGTGCAAAGACATTCCGTTGATGCTGGCGACGCCACATGTGCTCATCGAAGGCGTCA
+TCATCGCCGCCTACGCGATCCGCGCCCATCACGCGTTCGTCTACGTACGCGGTGAGGTGGTGCCGGTATT
+GCGCCGGCTGCACAACGCGGTGGCCGAGGCCTATGCCGCCGGCTTCCTAGGCCGCAACATCGGAGGTTCC
+GGATTCGATCTGGAGCTGGTGGTACACGCCGGCGCGGGCGCCTACATCTGCGGCGAGGAGACCGCCCTGC
+TCGACTCGCTGGAAGGCCGGCGCGGCCAGCCGCGGCTGCGGCCCCCCTTCCCCGCGGTGGCCGGTCTGTA
+TGGCTGCCCGACCGTGATCAACAACGTCGAAACGATCGCCAGTGTCCCATCGATCATCCTGGGCGGCATC
+GACTGGTTCCGGTCGATGGGCAGCGAGAAATCGCCTGGCTTCACCCTGTATTCGCTGTCCGGCCACGTCA
+CCCGCCCCGGCCAGTACGAGGCGCCGCTGGGCATTACGCTGCGCGAGTTGCTCGACTACGCAGGCGGGGT
+GCGCGCCGGGCACCGGCTGAAGTTCTGGACACCGGGCGGCTCGTCGACCCCGCTGCTCACCGACGAGCAT
+CTGGATGTGCCGCTGGACTACGAGGGTGTGGGTGCGGCCGGCTCGATGCTGGGGACCAAGGCGCTGGAGA
+TCTTCGACGAGACCACCTGCGTGGTGCGCGCGGTGCGCCGCTGGACCGAGTTCTACAAGCACGAATCGTG
+TGGGAAATGCACGCCGTGCCGGGAGGGCACCTTCTGGCTGGATAAGATCTACGAGCGGCTGGAAACCGGC
+CGGGGTAGCCATGAAGACATTGACAAACTGTTGGACATTTCCGATTCCATCTTGGGAAAGTCGTTCTGCG
+CGTTGGGCGACGGTGCCGCGAGTCCGGTGATGTCGTCGATCAAGCACTTCCGCGACGAGTACCTGGCCCA
+CGTCGAAGGAGGCGGTTGCCCATTCGACCCCCGAGACTCCATGCTCGTCGCGAACGGAGTGGACGCGTGA
+CCCAGGCGGCCGACACTGACATCCGGGTAGGCCAACCGGAGATGGTGACACTGACCATCGACGGCGTCGA
+AATCAGCGTCCCCAAGGGCACGTTGGTGATTCGCGCCGCCGAACTGATGGGAATCCAGATCCCGCGATTC
+TGCGACCACCCGCTGCTGGAGCCCGTCGGCGCCTGCCGGCAATGCCTGGTCGAGGTCGAAGGGCAACGCA
+AGCCGCTGGCGTCGTGCACCACCGTGGCCACCGACGACATGGTGGTGCGCACCCAACTCACCTCCGAGAT
+TGCCGACAAGGCCCAGCACGGTGTGATGGAACTGCTGCTGATCAACCATCCGCTGGATTGCCCGATGTGC
+GACAAGGGCGGTGAATGCCCGCTGCAAAACCAGGCAATGTCTAACGGCCGCACGGATTCTCGCTTCACCG
+AGGCCAAACGTACCTTCGCCAAACCGATCAACATCTCCGCGCAGGTGCTGCTGGACCGCGAACGTTGCAT
+CCTGTGCGCCCGCTGCACCCGGTTCTCCGACCAGATCGCCGGCGATCCGTTCATCGATATGCAGGAGCGC
+GGCGCCCTGCAGCAGGTCGGTATCTACGCCGATGAACCGTTCGAGTCGTACTTCTCCGGCAACACGGTGC
+AGATCTGCCCGGTGGGGGCGCTAACGGGGACCGCCTACCGGTTCCGCGCGCGTCCGTTCGATTTGGTCTC
+CAGCCCCAGCGTCTGCGAGCACTGCGCGTCGGGCTGCGCGCAACGCACCGACCATCGCCGCGGCAAGGTG
+CTGCGGCGGCTGGCCGGTGACGACCCGGAAGTCAACGAGGAGTGGAATTGCGACAAGGGCCGGTGGGCCT
+TCACGTACGCGACCCAGCCGGACGTGATCACCACTCCCCTGATCCGCGACGGTGGGGACCCCAAGGGCGC
+GCTGGTGCCCACCTCGTGGTCGCACGCAATGGCGGTGGCCGCCCAGGGACTGGCGGCAGCGCGGGGCCGC
+ACCGGGGTGCTGGTCGGCGGCCGAGTGACCTGGGAGGACGCCTACGCGTACGCCAAGTTCGCGCGGATCA
+CGTTGGGCACCAACGACATCGACTTCCGCGCCCGGCCGCACTCGGCCGAGGAGGCCGACTTCCTGGCGGC
+CCGCATCGCCGGGCGGCATATGGCGGTCAGCTATGCCGATTTGGAATCGGCTCCGGTGGTGCTGCTGGTG
+GGATTCGAGCCCGAAGACGAGTCGCCGATCGTGTTTCTGCGGTTACGCAAGGCCGCTCGCAGACACCGCG
+TCCCGGTGTACACGATCGCCCCCTTTGCCACTGGTGGCCTGCACAAAATGTCGGGCCGGCTGATCAAAAC
+CGTTCCTGGTGGCGAACCCGCGGCGCTGGACGATCTGGCCACCGGTGCAGTGGGCGACCTGCTGGCCACC
+CCGGGCGCGGTCATCATGGTCGGGGAGCGCTTGGCCACGGTACCGGGCGGATTGTCGGCGGCCGCTCGGC
+TGGCCGATACGACCGGCGCCCGTTTGGCGTGGGTGCCGCGGCGGGCGGGGGAACGCGGAGCGCTGGAAGC
+CGGAGCGTTGCCCACGCTGTTACCCGGTGGCCGCCCGCTGGCCGACGAGGTCGCCCGCGCGCAGGTGTGT
+GCGGCGTGGCATATCGCCGAATTGCCTGCCGCGGCTGGACGGGACGCCGACGGCATCCTGGCCGCCGCTG
+CCGACGAGACGTTGGCTGCGCTGCTGGTCGGGGGTATCGAACCCGCGGACTTCGCCGACCCGGACGCCGT
+GCTGGCCGCGTTGGACGCCACCGGTTTCGTGGTCAGCCTGGAGCTGCGACACAGTGCGGTCACCGAACGC
+GCCGACGTGGTGTTCCCGGTCGCGCCGACGACCCAGAAAGCCGGCGCGTTCGTCAACTGGGAGGGTCGCT
+ACCGTACATTCGAACCCGCGCTGCGCGGCAGCACACTGCAAGCTGGCCAGTCGGATCACCGGGTGCTGGA
+CGCGTTGGCCGACGACATGGGTGTCCATCTGGGCGTGCCCACCGTGGAGGCGGCCCGCGAGGAGCTGGCC
+GCGCTCGGTATCTGGGACGGCAAACACGCTGCCGGTCCCCACATCGCGGCCACCGGGCCGACCCAACCCG
+AAGCTGGTGAGGCGATCTTGACCGGGTGGCGGATGCTCCTCGACGAGGGCCGCCTGCAGGACGGCGAACC
+ATATCTGGCCGGTACCGCGCGCACACCCGTGGTACGGCTGTCGCCGGATACGGCAGCCGAGATCGGCGCC
+GCCGATGGCGAGGCGGTCACGGTCAGCACGTCACGCGGCTCAATCACCTTGCCGTGCAGTGTCACCGACA
+TGCCCGACCGCGTCGTGTGGCTTCCGCTGAACTCGGCGGGCTCGACGGTGCACCGACAGCTGAGGGTGAC
+AATCGGCAGCATCGTGAAAATCGGAGCGGGCTCATGAGCGTCTCCCCTTGCCGCGAGCGCGCGTGTTCCC
+CCGCAAGCGGGAGGTGCCCCCAGTACGCCGACACACCGATTTTGATGTACCAGTGCGGACCCTCGCGCAA
+GGAGTGGCGGCCATGACCACGTTCGGCCACGACACCTGGTGGCTGGTGGCGGCCAAAGCGATCGCGGTAT
+TCGTGTTCCTCATGCTGACGGTGCTGGTGGCGATCCTGGCCGAACGCAAGCTGCTGGGCCGGATGCAGTT
+GCGGCCCGGCCCCAACCGGGTTGGCCCAAAAGGAGCCCTGCAGAGCCTGGCTGACGGCATCAAGCTGGCG
+CTCAAAGAGAGCATCACACCCGGTGGCATCGATCGATTCGTATATTTTGTGGCGCCGATCATTTCGGTGA
+TTCCGGCATTCACCGCTTTCGCGTTCATCCCGTTTGGTCCCGAGGTGTCGGTGTTTGGCCACCGGACACC
+GTTGCAGATAACCGACCTTCCCGTCGCCGTGCTGTTCATCCTGGGACTGTCGGCGATCGGGGTATACGGC
+ATCGTGCTGGGCGGTTGGGCGTCCGGGTCCACCTACCCGCTGCTGGGCGGGGTGCGCTCCACCGCGCAGG
+TCATCTCCTACGAGGTCGCGATGGGCCTGTCGTTCGCGACGGTGTTCCTTATGGCCGGCACCATGTCGAC
+GTCGCAGATCGTGGCCGCACAAGACGGTGTCTGGTATGCCTTCCTGTTGTTGCCGTCATTCGTCATCTAT
+CTCATTTCTATGGTGGGTGAAACCAACCGGGCGCCGTTCGATTTGCCCGAAGCCGAGGGCGAGCTGGTCG
+CGGGATTCCACACCGAGTACTCGTCGTTGAAGTTCGCGATGTTCATGCTCGCCGAGTACGTCAATATGAC
+TACGGTTTCGGCACTGGCCGCGACCCTATTCTTCGGTGGCTGGCATGCTCCCTGGCCGCTGAACATGTGG
+GCGAGCGCCAACACCGGCTGGTGGCCACTGATCTGGTTCACCGCTAAAGTGTGGGGCTTTCTGTTCATCT
+ATTTCTGGCTGCGGGCTACGCTGCCGCGGCTGCGCTACGACCAGTTCATGGCGCTGGGCTGGAAGTTATT
+GATCCCCGTCTCGCTGGTGTGGGTGATGGTCGCCGCGATCATCCGCTCACTACGCAACCAGGGCTACCAG
+TACTGGACCCCGACTCTGGTGTTTAGCAGCATTGTCGTTGCCGCTGCCATGGTGCTGTTGTTGCGAAAGC
+CGTTGAGCGCTCCCGGCGCTCGCGCATCGGCACGGCAACGCGGGGACGAAGGCACCAGCCCTGAACCGGC
+ATTTCCGACACCACCGCTGCTAGCCGGTGCAACCAAGGAGAATGCAGGTGGCTAACACTGATCGTCCGGC
+TCTCCCCCACAAGCGGGCGGTACCCCCATCTCGGGCTGACTCCGGCCCGCGTCGTCGCCGGACTAAGTTA
+CTGGACGCCGTAGCCGGATTCGGGGTAACGCTTGGTTCGATGTTCAAAAAGACGGTCACCGAGGAGTATC
+CGGAAAGGCCCGGTCCGGTAGCAGCGCGCTACCACGGCCGTCATCAGCTCAACCGGTATCCGGACGGCCT
+GGAGAAATGCATCGGCTGCGAGTTGTGCGCCTGGGCCTGCCCGGCCGACGCAATCTATGTCGAGGGCGCG
+GACAATACCGAAGAGGAGCGGTTTTCGCCGGGCGAACGCTACGGCCGGGTGTACCAGATTAACTATTTGC
+GTTGCATCGGTTGCGGTTTGTGCATCGAGGCGTGCCCGACGCGGGCGCTGACGATGACCTATGATTACGA
+ACTGGCCGACGACAACCGCGCCGACCTGATCTACGAGAAGGACCGGCTGCTGGCCCCGCTGCTGCCCGAG
+ATGGCCGCGCCGCCGCATCCGCGGGCGCCCGGTGCCACCGATAAGGACTACTACCTAGGCAATGTGACCG
+CCGAGGGCTTGCGGGGCGTGCGTGAGAGCCAGACCACCGGAGATTCCCGATGACCGCGGTGCTGGCTTCA
+GATGTCATCGTCCGCACCTCCACCGGGGAAGCGGTGATGTTCTGGGTGCTCAGTGCGTTGGCGCTGCTGG
+GCGCGGTCGGGGTTGTGCTGGCCGTCAACGCCGTGTACTCAGCGATGTTTCTGGCGATGACCATGATCAT
+CCTGGCGGTGTTCTACATGGCCCAGGACGCGCTGTTTTTGGGTGTCGTCCAGGTGGTTGTCTACACCGGC
+GCGGTGATGATGCTGTTCCTGTTCGTGCTGATGCTGATCGGTGTGGACTCCGCGGAATCACTGAAGGAGA
+CGCTGCGCGGGCAGCGGGTCGCCGCGGTGCTGACCGGTGTCGGGTTCGGCGTTCTCCTGATCAGCACCAT
+CGGCCAGGTGGCGACCCGAGGTTTTGCCGGACTAACCGTCGCCAACGCCAACGGCAACGTCGAAGGCTTG
+GCCGCGCTGATTTTTTCCCGTTACCTGTGGGCGTTCGAGTTGACCAGTGCGCTGTTGATTACCGCCGCCG
+TCGGGGCGATGGTGCTAGCGCACCGGGAGCGTTTCGAGCGCCGCAAGACCCAGCGCGAACTCTCCCAGGA
+ACGCTTCCGTCCCGGCGGGCACCCCACCCCGCTGCCCAACCCGGGTGTCTACGCGCGCCACAACGCGGTC
+GACGTTGCCGCCCTGCTCCCCGACGGTTCCTATTCCGAATTGTCGGTCCCCCGGATGCTGCGCACCCGCG
+GGGCCGACGGCCTGCAAACACCCTCGCCCGGAGCCGTCTCCGGCTCTTTAGAAGGCGGTGCATCATGAAT
+CCGGCCAACTACCTTTATCTTTCGGTGCTGCTATTCACCATCGGAGCCTCCGGTGTGCTGCTGCGACGCA
+ACGCGATCGTGATGTTCATGTGCGTCGAGCTCATGCTCAATGCCGTTAACCTGGCGTTCGTCACCTTCGC
+GCGCATGCATGGCCATCTCGACGCCCAGATGATCGCGTTCTTCACCATGGTGGTGGCCGCCTGCGAAGTG
+GTCGTCGGCCTGGCCATCATCATGACGATTTTCCGTACCCGCAAATCGGCGTCGGTCGACGACGCGAATC
+TACTCAAAGGCTGACGACGCCACCGTGACAACTTCCTTGGGGACTCACTACACCTGGCTGCTGGTGGCAC
+TGCCACTGGCGGGTGCCGCAATCTTGCTGTTCGGCGGCAGACGCACCGATGCGTGGGGCCACCTGCTGGG
+CTGTGCCGCAGCGCTGGCGGCATTCGGGGTGGGCGCGATGCTGCTGGCCGACATGCTCGGTCGCGATGGG
+CTCGAGCGCGCGATCCATCAGCAGGTGTTCACCTGGATACCCGCCGGCGGACTCCAAGTCGACTTCGGGC
+TGCAGATCGATCAGTTGTCCATGTGCTTCGTGCTGCTGATCTCCGGGGTCGGATCGCTGATTCACATCTA
+TTCGGTCGGCTACATGGCCGAGGACCCGGACCGGCGCAGGTTTTTCGGCTATCTCAACCTGTTTCTGGCC
+TCGATGCTGCTGCTGGTGGTCGCCGACAACTATGTGTTGCTGTACGTCGGCTGGGAGGGTGTGGGCCTGG
+CGTCGTATCTGTTGATCGGTTTCTGGTACCACAAGCCGTCGGCGGCCACCGCGGCCAAAAAGGCATTCGT
+GATGAACCGGGTTGGGGACGCCGGCCTAGCGGTGGGTATGTTCTTGACGTTTAGCACTTTCGGCACCCTG
+TCGTATGCCGGCGTGTTCGCCGGCGTACCCGCCGCAAGTCGCGCAGTGCTGACCGCGATCGGGTTGTTGA
+TGCTGTTGGGGGCGTGCGCCAAGTCCGCGCAGGTTCCGCTGCAAGCCTGGCTTGGCGACGCGATGGAGGG
+CCCCACCCCGGTGTCCGCGCTGATCCACGCCGCCACCATGGTGACCGCCGGAGTGTATTTGATTGTGCGG
+TCGGGCCCGCTGTACAACCTGGCGCCCACCGCCCAACTGGCGGTCGTCATCGTCGGCGCGGTGACGCTGC
+TGTATGGGGCGATCATCGGCTGCGCCAAGGACGACATCAAACGTGCGCTGGCAGCCTCGACCATTAGCCA
+GATCGGCTACATGGTGCTGGCCGCGGGCCTGGGTCCGGCCGGCTACGCGTTTGCGATCATGCATCTGCTC
+ACTCACGGTTTCTTCAAGGCCGGCCTATTCCTTGGGTCCGGCGCGGTGATTCACGCGATGCACGAAGAGC
+AGGACATGCGCCGTTACGGTGGTCTGCGCGCCGCCCTGCCGGTCACGTTCGCAACCTTCGGCCTGGCGTA
+TCTGGCGATTATCGGGGTACCGCCGTTCGCGGGCTTCTTCTCCAAGGATGCGATCATCGAGGCCGCATTG
+GGCGCCGGCGGCATCCGGGGCTCGCTGCTGGGCGGTGCCGCGCTGCTGGGTGCGGGCGTCACCGCGTTCT
+ACATGACGCGAGTGATGCTGATGACCTTCTTCGGCGAAAAGCGTTGGACGCCAGGCGCCCATCCGCACGA
+GGCACCGGCCGTGATGACCTGGCCGATGATCTTGCTCGCCGTCGGCTCGGTGTTCTCCGGTGGCCTGCTC
+GCGGTGGGTGGCACGTTGCGGCATTGGCTGCAGCCAGTTGTCGGATCTCATGAAGAGGCCACCCATGCGC
+TGCCGACCTGGGTCGCCACCACCCTGGCGCTCGGTGTGGTCGCCGTCGGTATCGCGGTGGCCTACCGGAT
+GTACGGCACCGCGCCGATCCCGAGGGTTGCCCCGGTTCGGGTGTCGGCGCTGACCGCGGCCGCACGTGCG
+GACCTGTACGGCGATGCCTTCAACGAGGAGGTGTTCATGCGCCCTGGTGCGCAATTGACCAACGCGGTGG
+TCGCGGTGGACGACGCGGGTGTGGACGGCTCGGTTAACGCGCTGGCGACGCTCGTGAGCCAGACTTCGAA
+TCGCCTGCGGCAAATGCAAACCGGCTTCGCCCGTAACTACGCGTTATCGATGCTGGTAGGAGCGGTGTTA
+GTGGCGGCGGCGCTGCTGGTGGTGCAGCTGTGGTGAATAACGTGCCGTGGCTGAGCGTGCTCTGGCTGGT
+GCCGCTGGCAGGTGCGGTGCTGATCATCCTGCTACCACCCGGTCGGCGCCGACTCGCCAAGTGGGCCGGT
+ATGGTTGTCAGCGTCCTGACGTTGGCGGTGTCGATCGTCGTCGCGGCCGAATTCAAGCCCAGCGCCGAGC
+CGTATCAGTTCGTCGAAAAGCATTCCTGGATACCGGCGTTCGGCGCCGGCTATACCCTTGGTGTGGACGG
+CATCGCAGTGGTGCTGGTGTTGTTGACCACAGTGCTGATTCCGTTGCTGCTGGTGGCCGGCTGGAACGAC
+GCAACCGATGCTGACGACCTGTCCCCCGCAAGCGGGAGGTACCCCCAGCGCCCGGCTCCGCCGCGCTTGC
+GATCGTCAGGTGGCGAACGCACCCGAGGCGTGCACGCCTACGTGGCATTGACGCTGGCCATCGAGTCGAT
+GGTGCTGATGTCGGTGATCGCGCTGGACGTGCTGCTGTTCTACGTGTTCTTCGAGGCCATGCTGATCCCG
+ATGTACTTCCTCATCGGCGGCTTCGGCCAGGGGGCCGGACGCTCGCGTGCCGCGGTGAAGTTCTTGCTGT
+ACAACCTGTTTGGCGGGTTGATCATGCTGGCGGCGGTGATCGGGCTGTATGTGGTGACCGCACAGTACGA
+TTCGGGCACCTTCGACTTCCGTGAGATCGTGGCCGGCGTGGCGGCGGGCCGCTACGGAGCGGACCCGGCG
+GTGTTCAAGGCGCTGTTCTTGGGCTTCATGTTCGCGTTCGCGATCAAGGCTCCGCTGTGGCCGTTCCATC
+GCTGGCTGCCGGACGCCGCCGTCGAGTCCACCCCAGCGACCGCGGTGCTGATGATGGCGGTGATGGACAA
+GGTCGGCACCTTCGGCATGCTGCGCTACTGCCTGCAGCTGTTTCCTGACCCGTCAACGTATTTCCGTCCG
+CTGATCGTGACGCTGGCCATCATCGGGGTGATCTACGGCGCGATCGTGGCGATCGGCCAAACCGACATGA
+TGCGGCTGATCGCCTACACCTCGATCTCGCACTTCGGGTTCATCATCGCAGGCATCTTCGTCATGACCAC
+CCAGGGCCAGAGCGGGTCGACGCTGTACATGCTCAACCACGGCCTGTCCACGGCGGCGGTGTTCCTGATC
+GCCGGTTTCTTGATAGCGCGGCGCGACAGCCGATCGATCGCCGACTACGGCGGTGTCCAGAAGGTGGCGC
+CCATCCTGGCCGGCACGTTCATGGTCTCGGCCATGGCCACCGTATCGCTGCCCGGCCTAGCCCCGTTTAT
+CAGCGAATTCCTGGTTCTGCTGGGCACTTTCAGCCGCTACTGGCTGGCGGCGGCGTTCGGCGTTACCGCA
+CTGGTCCTCTCGGCCGTTTACATGCTGTGGCTCTACCAGCGGGTGATGACCGGTCCGATAGCCGAAGGCA
+ACGAACGCATAGGGGATCTGGTGGGCCGCGAGATGATCGTGGTGGCACCGTTGATCGCGCTGTTACTCGT
+GCTTGGGGTCTACCCCAAACCTGTGCTCGACATCATCAATCCGGCGGTCGAGAACACCATGACCACCATC
+GGCCAGCATGATCCCGCGCCCAGCGTGGCACACCCGGTTCCGGCCGTGGGCGCCTCCCGGACAGCCGAAG
+GACCGCACCCATGATCCTGCCCGCCCCGCACGTCGAGTACTTCCTGCTCGCTCCGATGCTCATCGTCTTT
+TCGGTTGCGGTCGCCGGTGTGCTGGCCGAGGCTTTCCTGCCGCGCCGGTGGCGCTATGGCGCCCAAGTGA
+CGCTCGCCCTTGGCGGGTCGGCAGTGGCACTCATCGCGGTCATCGTGGTGGCCAGGTCGATTCACGGGTC
+GGGTCACGCCGCGGTGCTGGGGGCCATAGCCGTGGATCGAGCGACCCTGTTTCTGCAAGGCACCGTACTA
+CTGGTCACGATCATGGCAGTCGTCTTCATGGCCGAACGCAGCGCCCGGGTGAGTCCGCAACGCCAGAACA
+CCCTCGCTGTGGCGCGGCTCCCTGGACTCGATTCGTTTACCCCGCAGGCTTCCGCCGTGCCCGGCAGCGA
+TGCTGAGCGCCAAGCGGAACGGGCGGGAGCCACCCAGACGGAACTTTTCCCGCTGGCGATGCTGTCCGTC
+GGCGGCATGATGGTGTTTCCCGCGTCCAACGACCTGTTGACGATGTTCGTTGCGCTGGAGGTGCTATCGC
+TGCCGCTGTACCTGATGTGTGGGCTGGCCCGGAATCGCCGCCTGCTGTCGCAGGAAGCCGCGATGAAGTA
+CTTCCTGCTGGGCGCCTTCTCGTCGGCGTTCTTCCTCTACGGCGTCGCGTTGCTATACGGCGCGACCGGC
+ACGCTGACCTTGCCGGGTATTCGGGATGCGTTGGCAGCGCGCACCGACGACTCAATGGCGTTGGCCGGCG
+TCGCGCTGCTCGCGGTCGGCCTACTATTCAAGGTCGGCGCGGTGCCATTCCACTCCTGGATTCCCGATGT
+GTACCAGGGCGCACCCACCCCGATCACCGGGTTCATGGCGGCCGCCACCAAGGTCGCGGCGTTCGGTGCG
+CTGCTCCGGGTGGTCTATGTCGCGCTGCCGCCGCTGCACGATCAGTGGCGCCCGGTGCTGTGGGCGATTG
+CCATCCTCACCATGACGGTGGGCACCGTCACCGCGGTAAACCAGACCAACGTCAAGCGTATGCTGGCCTA
+TTCATCGGTCGCGCACGTCGGTTTCATACTTACCGGCGTGATCGCCGATAATCCGGCGGGTCTTTCCGCG
+ACGTTGTTCTATCTGGTCGCCTACAGCTTCAGCACGATGGGTGCGTTTGCCATCGTGGGTCTGGTCCGAG
+GCGCCGACGGCTCAGCTGGTTCAGAGGATGCCGACCTGTCCCACTGGGCCGGGCTGGGACAGCGTTCACC
+TATCGTGGGCGTGATGCTGTCGATGTTTCTGCTGGCCTTCGCCGGCATCCCGTTGACCAGTGGATTCGTC
+AGCAAGTTCGCGGTGTTTAGGGCCGCCGCTTCCGCCGGCGCGGTGCCGCTGGTAATCGTCGGCGTGATCT
+CCAGCGGCGTCGCCGCCTACTTCTACGTGCGGGTGATCGTGAGCATGTTCTTCACCGAAGAATCCGGTGA
+CACACCACACGTGGCGGCACCCGGCGTGCTGAGCAAGGCCGCCATTGCGGTATGCACGGTAGTCACCGTG
+GTGCTGGGGATCGCCCCGCAGCCGGTGCTCGACCTGGCCGACCAGGCCGCCCAGTTGCTGCGCTGAATCC
+GTTAGGGCTGACCGAAGAAGCCCGACTGGTCACTGCCCTGATTGAAGCCCCCCGAGCTGTGGTCACCCGT
+GTTCGCCACACCCGTGTTGAGGGTGCCCGAGTTCGCAATGCCTGTGGTCTGCAGGCCAGAGTTTGCGATG
+CCCACGGTGCCGGCACCCGAGTTATAGAAGCCGACGTTGAAGCCGCCGGAGTTGGTGTTATTGATGCCCG
+ACTGAACGTCACCGTTGTTCCCATAGCCAGCCGAAACATTGCCCGTGTTAAAGAAGCCTGAGGAATTCAT
+GCCGGTGTTGCCGAAGCCCGAGCTCGAAACGGATTGGTCGACCGAGCTTCCAAACCCGGTGTTCCGGTCG
+CCCGAGTCGAAACCGCCCGTATTGATGCTGCCCGAGTTCGCGAATCCCGTATTGATACTGCCCGCGTTTG
+CGAAGCCCACGTTTAGGGTGCCCGCGTTGCCAAAGCCCACACTTTGGTTGCCCGCATTGCCAACGCCCAC
+GTTAAAGGAACCGCCGTTCCCGACGCCCATGTCTTCGTTGCCCGCGTTCCCGATGCCCATATTGAAGAAG
+CCGGCGTTTCCGAAGCCCGTGTTGGTGTCGCCGGCGTTTCCGAAGCCCGTGTTGATGTCGCCCGCGTTTC
+CAAAGCCGAAGTTGTTGTTGCCCGAATTGAAGAAGCCCACGTTGTTGTTGCCAGAGTTGAAGAAACCGAT
+GTTGTTGTTACCCGAGTTCCCGAAACCTAGATTCCCGATGCCCGAGTTCAGCGCGCCAATGCCCACCAAG
+TTGTCGCCGGTGAGCCCAAAACCGATGTTGTTGTTGCCATTGTTCCCGAGGCCGAGGTTATTGTCGCCGT
+TGTTTCCGAAACCGATGTTGGAGGAGCCGATGTTTCCACTGCCCAAGTTGAAGGAACCGAGATTTCCGCC
+GCCGAAGTTGGTACTTCCGGTGTTTCCACTGCCCAGGTTCCCACTGCCAAAGTTTCCGTTGCCGAGGTTT
+CCAAAGCCTCGGTTTCCGCTGCCCAGATTGACATTGCCAACGTTTCCGCTGCCGAGATTGGTGTTGCCGA
+TATTTCCGCTGCCCAAATTCGTGGCACCGTCATTTCCGCTGCCCACATTGGCGTTGCCGGAGTTTCCGCT
+ACCTACGTTGGCGTTGCCGGAATTTCCGCTGCCCAGATTGTATTCACCGGTGTTCCCGCCGCCCAGGTTC
+CCGACGCCGATGTTGCCGAGGCCGATCGCGGCGGCCAGCGCCGATGGCGCAGCTGGCAACGCCTGCTGCA
+GACCAATTGACCACGACGACAGCTGCGCCGCGGCCGCCGATGCCCCGCCGTGATAGCCCACCATCGCGGC
+CACATCGGCGGCCCACATCTGTTCATACATCGCCTCAGCGGCCGCGATCGCCGGCGCATTCTGCCCAAAC
+AGATTCGACAACACCAACTGCACAAACGCATTACGGTTGGCCGCCACCAGCATCGGATGCACCGTCGCCG
+CCCGCGCCGCCTCAAACGCACTGGCCACCGCCTTGGCCTGAGCCGACGCGCCAGCGGCCCGCGCCGCCGC
+AGCAGCCAACCACCCCGCATACGGCGCCGCCGCCGCGGCCATCGCCGCCGCCGCACCCTGCCAGGACTGA
+CCCGCCAACCCCGAAGTCACCGACCCAAACGAGGACGCCGCCACCGCCAACTCCGCGGCCAAACGATCCC
+AAGCCACCGATGCCGCAAGCATCGGCGCAGACCCCGCACCGGTAAACATCCGCAACGAATTAATCTCCGG
+CGGCAACACCGAATAATTCATCAGCCCAGCCCCTTCCCCAGCGCGCGACGCCGATGACACAGGCGTTCGC
+GCACGCTACTCCACCCGTAAGAACAAACTGTAGGGAAATCACGGCACCAATATCGGCGATTTGTCAAAAC
+ACTTGTACATTGCGAAAAATTCGGGCCCACCGATCGCCACCCTGGTCACCGCGACTCCTGCCACATTGCC
+GCCGCGGTACCTCATCGTGCCGGCTAATCGCCCCCAGCAACGTCGGGCTCGGTAGGCGTTACGGCTGGCC
+GAAGAACCCGGCCTGGTTATCGCCCTGGTTGAAGGCACCCGAGGAGTTGTCACCTGAGTTGGCGACACCG
+GAGCTGGCATTACCGGAGTTTGCGATGCCGGTGCTGGCCACGCCCGAGTTGTAGATGCCGTTGTTAAACA
+TGCCCGTGTTGAAGAAGCCCTCGTTGGAGTTGCCCGAGTTAAAGAAGCCGACATTCGCGTCGCCAATATT
+CTGGAAGCCTGAGGTGGAGTCGAAGACGTTCGAGTTCATGTTCCCAAAGCCCGAGGTAAGGTTACCCGAA
+TTATTGAAGCCCGAGACGCTGGTGCCGGTGTTACCGAAGCCCGAGACCGAACCAGGCTGATCGACCGTGC
+TGCCGATGCCGGTGTTGACGTCACCCGAGTTGAATAGGCCTGTGTTGAGATCGCCGGCATTTCCGAAGCC
+GGTGTTCAGATTGCCCGAGTTGAACGAGCCAGTGTTTCCACCGATCCCGCTGACCACACCGCCCGAGTTG
+AAATCGCCGGTGTTGGCCAAGCCCGCGTTTCCGGAGCCCACGTTGACACCACCTGCGTTTCCATGGCCCA
+TGTTCTGGAAGCCCGCGTTACCAAAACCGAAGTTTGTGTTACCACCGTTCCCAAAACCGGTGTTGAAGGG
+TCCCCCGTTCCAGAAGCCGGTGTTGACATCGCCCGCGTTGCCGAAGCCGGTGTTGCCGTCCCCGGAGTTA
+AAGAAGCCCACGTTGCCATTGCCGGAGTTGAAGAAGCCAATGTTGTTGTTCCCAGAGTTCCCGAAACCCA
+TGTTCCCGATTCCCGAGTTCAACGCACCAATGCCCACCAGATTGTCACCGGTGAGCCCAAAACCGATGTT
+GTTATTGCCGTTGTTCCCAAAGCCCAGGTTGTTGTTACCGAGGTTGCCGAACCCGATATTACTCATCCCC
+ATGTTGCCGCTACCCACGTTGAACGAACCAAAGTTCCCGCTACCGAGGTTTGTACTACCGACGTTGCCGC
+TACCCAGGTTTCCGTCACCGAAGGCGTTTCCGAAACCGAAGTTTCCGTTGCCGAGGAGGTTCCCGCTGCC
+AAAGTTGAGATTGCCTTGGTTGCCGTTGCCGAAGTTGGTGTTACCAATGTTGCCGCTCCCCAGGTTGGCA
+AAGCCCCAGTTTCCTCCGCCCAGGTTGGCATTGCCGGTGTTGCCGCCACCCAGGTTCAGGCTGCCAAAGT
+TCCCGCTGCCCAAGTTCAACAAACCGACGTTTCCGCCACCCAGGTTCCAGCTGCCAATATTCCCCAGACC
+CGTGTTCAGCGCCGGCGGGGTGACAGCCGCTGTCGCAGCCGCTGGGGCGGCAAACATGCTAGCCGCACCG
+CCGGAAATCGCGCTGGCCACCTGACCCAACCCCGGCAGGCCCCGCAATGCCTGCTGCCACGATGGCAACG
+CCGCCGCGGCCGCCGATGCCCCGCCGTGATAGCCCACCATCGCGGCCACATCGGCGGCCCACATCTGTTC
+ATACATCGCCTCAGCGGCCGCGATCGCCGGCGCATTCTGCCCAAACAGATTCGACAACACCAACTGCACA
+AACGCATTACGGTTGGCCGCCACCAGCATCGGATGCACCGTCGCCGCCCGCGCCGCCTCAAACGCACTGG
+CCACCGCCTTGGCCTGAGCCGACGCGCCAGCGGCCCGCGCCGCCGCAGCAGCCAACCACCCCGCATACGG
+CGCCGCCGCCGCGGCCATCGCCGCCGCCGCACCCTGCCAGGACTGACCCGCCAACCCCGAAGTCACCGAC
+CCAAACGAGGACGCCGCCACCGCCAACTCCGCGGCCAAACCATCCCAAGCCACCGATGCCGCAAGCATCG
+GCGCAGACCCCGCACCGGTAAACATCCGCAACGAATTAATCTCCGGCGGCAACACCGAATAATTCATCAG
+CCCAGCCCCTTCCCCTACAGGACGTCCCGGCCAATGACTCAGGCAACGGTGCACGTCTCTGTACTCGTAG
+AACAAACTGTAGGAAAACGGCGCGACGAATAACGGCGATTTCGTGAAAATTCTGGTTCCCGTCAGAAGCA
+CGCCACCCTCGGCCACCTCGTTTGCGCACGCCTAGAGCCCGCGGTCGGGGGGTGCGGTCTGGATCTCCAA
+AGCATCTGCTGCTGCCCGGATCTCGGCTAGCCGATCAGGGTCCGACAACAGCGCCGTCATCGCGAACTCG
+ACGATCTCGTCCGGGCTGACCGCGAATTCCGGCAGCGCCAGAGCGTCAAACAACGCCTGCACCAGCCTGG
+CAGCCGATAACGGATGCATTGCGCGCACATCACCTTCGCCTTGGCCGGTCTCGATCAGGCCAACCAGCGC
+GCGTTCCATCTCCGCGACTAGCTCCCGCTCCGCGACGAAGGATTCCTGATGCAGGTCCGGGGTGATGAGG
+ATGGAAACCAGCACATAGGGCGAAGCATGCAGGTGGTCCAGGGATTCCGTCAGCCAGCGGTGCAGCTTGA
+CCACCGCCGGAACCGGCATCGCGGTGATGTGACCGAACAGCTCAAGCGGCCACTCCACGGCGAGCCGCAC
+CAGGGCCGCAAGGATATCGCGTTTGGCCGAGAAGTGTTTGTAGATGGCCGGCTGCTCCACCCCGACGGCT
+GCGGCAATGTCTCGCGTCGAGGTGGAGCTGTAACCCCGCAGCGCGATGAGCTCGGCAGCGGCCCCCAGGA
+TGCGGAGTGCCGTTGGGCTCCAGCGGCCGGCCTGCCTCGGCATGCCGGCAAGGCTAGCTGGCACCTGGGT
+GGTCGCCAACCAGCGCCATGGCGAGGTTCCGGTAGAACGCGAGCATGCCGGGCCATTCTTTCGAGCTAAG
+GTGACCCCGTTCGGCGAATCGCGAGCCCGCCCCAACCTGCACGGCCTCCAGTCCGAGCCGGTCCTCGTCA
+TTGATCATCGCCATCACGAACTGCGACGTCTGAGCTGTTGCTGCCGCATCGGCGGCTAACTCGGGGGTGG
+TGAGCACGCCGCCGAGCACCTGCACCCGGTCGATGCTTTGCGGAATAAAGCCGAACCACACCACCCGCTC
+GCCCGCTATGGCCAGCGCGCTGTTCGGAAACGTCCACAACACGACCAGATTACTTTTCTGAACCTCGTTG
+AGCTGCAACGACTTCGCTTCTACTGGAACGGTGAAGGGAACCCTGAGGCGCAACGCCCACCGCGAATACT
+GCCGAACGTCCAGATCGCCCCCACCAGGAACGAACGGCTCCAGGGTTTGGCGATGCAGGCCGAGCACGTG
+GTAGTTCTCATGACCATTTTCCGCCGCCACCTTCCAATTAGCTCGCCACTCATGCGACCACGACTCGACC
+TGCACCATCTCACCGAGCCGATAGCCGGCGAATTCGTCGTCAGTCAGGTCCAGATGCGCCGCGATTGGTT
+CGGCATCGGCATCCAGGTTGATCCACACCAATCCATTCCAGGTGGCCACGGCGAACTGCGGAAGCCGGCA
+CTCCCTACGGTTGAAGTCTAAGTTGGCGGCCATATGGGGCGCTCCGCGCAACCGGCCATCCAGCCCATAG
+CGCCACAGGTGGTATTGGCAGGTCAACGTGTCGATGCGCCCCGCACCGGGTTCCACCATCAGCATCAACC
+GGTGCCGGCAGATCGGCGAAAGAGCGTGCAGCTGCCCGTCGACGTCCCGCACCACCATGACCGGCTCCCC
+TGCGACGGACACGGTGACGTAGTCACCGGTCTTGGCGAGTTGGTCGACATGCGCGACAAGCATCCAGGAC
+CGGTTGAAGATCCGTTCCCGCTCCAGCTGCCACAGCTCCGATGAGGTGTAGGCGGCCGGCGGCAGGCTTA
+GCGCCGGTGGATTGTCGTCGAGGTAATCCCCGATGTCGGTAAGGATGTCTCCGAGCTCGGCTCGGTTATC
+AGTTGATAACATACCCTCCATGTTATCGACTGATAACCGATTGTCAACAGCGCGCACCGGCCCGACCGGC
+CAGCCGGCGGTTCACCTCGAGAACGGACGGGTGGCCAGCACGTAGGTAGCCAACACGGCCAACGGTGCCG
+CCAACGGCAGCCATGGCACTTGCAGCGGGAACGACGTCGCAGCCAACCCAGCGAACGTGAAACCAACGGC
+GGCAACGGTCGTCGGCCAGCTCCCGGCGACAACACCGGCCCCGTATCGGCACACCAGGTAGACGGCGGCG
+CAAACCCCGACAATGCGGCAAGCACATGCGTCGGGCCGGACACCACGATCATCACCACCGACAACACCAC
+GGCAAGCGTTGCCGCCAGGCGAAACACCGCCGCCACCCCTACCGCAATCACCGCGGCAAGCCCCACGACA
+ACAGCCAGCCCGTGCGATCCCACAGCGGCCGACCCCACCATCATCAGTCCGAACACCGTGGAGAGCCCAC
+GAGTACCCGGGTGCGCAAACGAGGTCATGGCAGCCTCGCCCGGCTAGCTCTGCCCCGTCCGCGACGACGG
+CGATTGGGCAACGCACCCATCGACTGCTGAAGCGAGTGATCCGCCGGCCAGGACAGCACGTCGACCCCGA
+TGGTGGCCATGTCGCGATACATCGCGGAGCGCTGCAGCGCCCACATCCGGACCACCAGGGGATCCAGTTG
+GTCCTGGAGCGGACAGCTATCAAGAACGTCGACAGCAACCACGACGTGGCCGCGTTTACGCAGTTCGATC
+AACGCCAGCGCGAACTCGGTATCCAGCAGCGTGGAAAACGCAATGACAACCGCTCCTGCGGGAACAGCTG
+CGCGCGGAGCCAGCGTCCCGGTGGTGTTTTCGAACCCTTCCCCGGCGCCGAGCACGGTGTCGAGCACCCG
+ATAGAACTGGCGCTGCCCGATGTCGGCGCCCAGCCATCGCGGCCGATTGCCGCCCAGCGCAACGATCCCA
+GCACGGTCACCGTTTCGCAGCGCGGTTTGCACCACCTGAGCAGCACCCCGCACGACTCGTTCGGTGGCCT
+CGGTCGCCGGACCCGCCGGCTGTCGATACATGTCGATCAACACCACCACGTCAGCGGCCCGGTCGGTCAA
+CCGCCTTGTCACGTGCAGTCGGCCACGGCGCGCGCTTACCACCCAGTTCACGGCACGTAGCTGGTCGCCC
+GGGACATATGGGCGAATGTCGGCGTATTCGACACCCGGCCCGACGTGCCGGGTGAGATGAGCTCCCAGGC
+GGTCGAGCAATTCGGTCTGCGGCAGTGGCGTCGACTGCGGCGGTGTCAGCGGAAACACGACGATTTCGGC
+GGCGTCGACGGTTCCGGCTCCCATCAACAACCCACCGCGTGCGACGACGGCGACCCGGGCCCGGATAGGA
+TAGCGCCCCCAGCGTTGCGCCACCGCGGAAACCGTTGTCGTCCGGCGTGACACGGATTCCAGAGCTTCGA
+ACTGCATTCCCGCCAACGCCGATACCGTGAGTTCGACCGCGGCGTCCACGGATTCCGTTGTGACCCACAC
+GGTCACTCGCACATGTTCGTTCTCGAAACATCGCTGCGAATCCGGGTCACCGTGCACCTGGATCACCGGG
+ACCGGACGCTGCCAGCTGATCGAGCACAACACGCCGAGCAGCGGCGCCGCGAACGCAATCAGCTGCCAAC
+GACCAGCGACGACCGCTGCGGCTAGCGCAACTCCGGCACAGGTGGCAATCGCCAGCGTCAGTTGTGATGC
+ACGCCAGCGCAACTCGACTTCACACGTTTGGATCACATCGCGCCGTAGTTCATCCAGCCAACCCGCTACG
+TTCCACTAATTCGGGGAACAGGCAGACGCCGCAACAGCTCTGAGACCACATCAGCGCCCGCAATCTTGCG
+CACCCACATCTCCGGGCGCAATGTGATCCGATGCGCGACGGCCGCGGTCGCAAGTTCCTTGACATCTTCG
+GGTATGACGTAGTCCCGGCCGAGCAACAGAGCGCGGGCACGGGAGAGCTGGACCAGGTCGAGTTCGGCTC
+GCGGGCTGGCGCCGACGGCCACCTGCGGATGGTGCCGGGTAGCGTTGGCCAACGACACCACATAGTGCAA
+GACGTCCTCGTGCACGGTGACCTGCTCGACCGATTCACGCATGGCCAACAGATCGTGGCAGTCCACCACC
+TGATTCACCGTCGGATCCGCAGAACCGCGTTCCAGGCGACGGCGCAGCATCGAGGTCTCGTCTCGCTCGG
+AGAGGTAGCGCAGTTCCAACCGGATCGCGAACCGATCCAGTTGCGCCTCCGGCAGTGGATATGTGCCCTC
+GTATTCGATCGGATTGTCGGTCGCCAGAACGATGAATGGCATTGCCAGTTTATGGGTTTGGCCATCGATG
+CTCACCTGGCCCTCGGCCATTGCCTCCAACAGTGCCGCTTGCGTCTTCGGCGGCGTCCGGTTGATCTCGT
+CGGCGAGCAACAGGTTGGTGAAAATAGGCCCGGCCCGGAATTCGAAACGACCGGACTGCATGTCATAGAT
+GGTCGAGCCGAGCAGATCGGCCGGCAGCAAATCAGGCGTGAATTGCACTCGGGTGAAATCGAGCCCCAAC
+GCGGCGGCGAAGGATCGCGCGATCAGCGTCTTGCCGAGGCCGGGGAGATCTTCGATGAGCACGTGGCCAC
+GGGCGAGCACGGCGGTGAGGATGAGTGTCAGTGCAGAGCGCTTCCCCACCACCACACGTCCGATTTCGTC
+GAGCACCGCCTCGCAGTGGGCGGTGGTCGTCGCGGCCGGCATAATCATCGTTGAGTCATACCTGTTCTAA
+CTTCTGCAGAATTTCTTCCAGTGCCGCACGGCCGGGGCCTGGTTGACGGTCGCCGGTGTGCGTCACATTG
+TTCGGGTTGACCCATTCCCACAATTCGTCGCCGAAAAGCATTCGGCCGGTGGCAGCAAAGGCAACCGGGT
+CTTTGGCCTGTCTATGGCCGGTGGCGATTTCGAACCGTCGTGCGAGCATCGGACGCAAATGCCGGTCCCA
+GTCGGCTCGAGTGGACTCCGACCACCGGATCGTCGTCTCGGTGTTGGAGAGCCACCGGCGCAACCCCTCC
+CCCAGATCGTCGGAGTCCGGCGCAGCCGTGAGTTCGTCCCGGTTGCCCAGCATCCGGCGGACGTTGAGCA
+GCACCAGAGCCAGGGCGAGCCCCGACCCGGCGAGCACGAGCCGACGGTCGTGCAGTATCAGCGCCAGCAG
+CTCAATCCCCACGATGAGGAAAATCCCCAGGGCGATAAGCCTTTTCATATAGCGGTCCGAGTGCTCAGTT
+CGTCAAGAACCAGTCGAAGCAAACGCATCGCCACCTCACGGTGCTCCTCGTTCATCACGTGCGGGCTAAA
+ACGCGCCTCGGCGAACAGGCTCACCAACGCGGCGGCACTAGCACCATGGAGCGCACGGTGTTCGACGGCT
+CGGGCCAGCACCTCGGTCGGGGTGTCGAAGTCCTGAGGGGCAACACCGGGAACATGCGACAGTTCACGCT
+CCATCGCCACGTAACACGCAATTATCGCCTCCCGTGGTTCGCGGCGGAGGTCGGCCATCTCGGCCAGTCC
+GATCTCGGCGGCACGCGCCAGTGATTCCGAACGCGCCGAGGGCGCCGGAGACTCGATGCGATCGCCACTG
+ATACGAGCCGGTGCCGACTTGCGCTGTCGTCGCGAGGTAATCAGCGACCCCGCGACGACCATCAAGAACA
+GGCCGATTGTGCTGGCAAAGAGAATGCCGAGCACGTCGTCATTGTTGTCTTGCGGCGGTTGCGGGCGCGA
+CGGCGTGGTGCTGGAAGCATCCGGCGTAGCGGTTGAATCCGGTATGGGCGCAGCAGGACCGACATCATCG
+GGGACGAACAACCGTGCCAGCAGTATCGCAATCAGCAGCCAGGCCAGGATTGTCCCGAGTCCGAGCAACA
+GCACACGCCAGTTCGGACGCCCTGCTGCACCGCCAAGCATTGCCGAGAGCTCCCCCGCGCTGGGCGCCAC
+CGGGAGCGGATGTCGCAACCGGGTGATGATGGCGAGCGCTATCAGCGCGAGCGTCGCGGCAAGTGCGGCG
+ACAATGAACATCAGCGCCGCCCGGCTGCCGCCGGCCGCCGCGAGCGGTGCACCGTCGTCGGCCGGCAGGT
+GGCCGCGCAGGGCAGCGCCAGCAAGCATCAAGAGCACGATCACGACGACGACGCGCCCTGTCGGTTTGTC
+ACTACCGGGCTTAGTACCGGGCATACGCACACCACTCGACCGGTTGCCTGCCGCCGTTGCGGCCTGGGGG
+TTGGTTCAACCTGGCTTGGTTCATACTGGCACGTCAGACGACACTGCCGCCAGGAGCGGCGCGGTGGACC
+CCTCGCACGACGATCGCGGTGGTTTGGTCCACCCACGCGTCGTCCAGCATGTCGTCCGGGTACAGCAGCA
+TCCGCAGCATGGTGGCGCCCCCGATCAGCTCGATCAACCGGTCCGGGTCCACGTCGGGATGCGCCTCGCC
+GCGGTCGACGGCCTCGCGCAGGCGCATGCGCACCGCGGCGAATAAGTCGGCAAAACGCGCCAGCACCCGG
+GCGTTGAGTTCAGCGTCTGCGGTCATATCGGCTACCAGACCGGGTAACGCGGCCCGCACCACCGGGGTGG
+TGAACACATCGCGGGTGGCCGCGATCATCATTCGGATGTCGGCGGCGATATCACCGGCCGCAGCCTGCAG
+CGCGGTGGGCGCGGCGGGAAACGCGGCCTCGTGCACTAGTTCGGCCTTGCTCGACCACCGCCGGTACAAC
+GCCGATTTGGTGGTGCCGGCGCGTTCGGCGACCGCGGCCAAGCTGAGGTTCGAATACCCGATCTGCACAA
+GCAGTTCCGCCGTCGCCGACAGGATCGCCGAGTCGATGCGCGGATCACGCGGCCGCCCGGCGCCGGGGGC
+CTTGTCAAGGGAGGGCAGGTCTGCTTTCATAACGCTACCTAAAGTAGCGTAATTGCCGCACCAGGGAGGC
+GCTTGTGGCCAACGAACCGGCAATCGGAGCCATCGACCGACTCCAGCGCTCGAGCCGCGACGTGACCACC
+CTGCCGGCGGTGATATCGCGCTGGCTGTCGAGCGTGTTGCCCGGTGGGGCGGCACCCGAGGTGACCGTGG
+AAAGTGGCGTGGACTCCACCGGCATGTCGTCGGAAACCATCATCTTGACCGCGCGGCGGCAACAAGACGG
+GCGATCGATCCAGCAGAAGCTGGTGGCGCGGGTGGCGCCGGCCGCCGAGGACGTGCCGGTGTTCCCGACG
+TATCGGCTTGACCACCAATTCGAAGTGATCCGGCTGGTCGGAGAGCTGACCGACGTTCCCGTCCCGCGGG
+TGCGCTGGATCGAGACCACCGGCGACGTGCTGGGAACTCCGTTCTTTCTGATGGACTACGTCGAGGGCGT
+GGTGCCGCCCGACGTCATGCCGTACACGTTCGGTGACAACTGGTTCGCCGACGCGCCCGCCGAGCGCCAG
+CGCCAACTGCAGGACGCCACCGTCGCAGCGTTGGCCACACTACATTCAATCCCTAACGCCCAGAACACGT
+TTAGCTTCCTCACCCAGGGCCGCACCAGCGATACCACGCTGCACCGGCACTTCAACTGGGTACGGTCCTG
+GTACGACTTCGCGGTGGAAGGCATCGGTCGATCCCCACTACTGGAACGGACTTTCGAGTGGCTGCAAAGC
+CACTGGCCGGACGACGCTGCCGCGCGCGAGCCGGTGTTGCTGTGGGGGGACGCGCGGGTGGGCAACGTCT
+TGTACCGAGACTTTCAGCCGGTGGCGGTGCTGGACTGGGAAATGGTGGCGCTGGGTCCACGGGAACTCGA
+CGTCGCGTGGATGATATTTGCGCACAGGGTATTTCAGGAGCTTGCCGGTTTGGCGACGCTGCCGGGTTTG
+CCGGAGGTGATGCGTGAGGACGATGTGCGCGCCACCTACCAGGCGCTTACCGGCGTGGAACTTGGTGACC
+TGCACTGGTTTTACGTGTACTCCGGGGTCATGTGGGCATGCGTGTTCATGCGCACCGGTGCGCGGCGAGT
+GCACTTCGGCGAGATCGAGAAGCCCGACGATGTGGAGTCGCTGTTCTATCACGCCGGCTTGATGAAGCAT
+CTTCTTGGAGAGGAGCACTAATGCCGCAAATGCTAGGCCCACTCGACGAGTACCCGCTACATCAGCTTCC
+CCAGCCGATCGCCTGGCCGGGCTCCTCCGACCGCAACTTCTACGACCGCTCCTACTTCAACGCCCACGAC
+CGCACCGGGAACATCTTTCTGATCACCGGTATCGGCTACTACCCTAACCTGGGCGTGAAAGACGCGTTCG
+TGCTGATCAGGCGTGCGGACATACAGACCGCGGTGCATCTTTCGGATGCCATCGACTCCGACCGGCTACA
+CCAGCACGTCAACGGTTACCGGGTGGAGGTCGTCGAGCCGCTGCGAAAACTGCGTATCGTGCTCGACGAA
+ACCGAAGGTGTGGCGGCCGATCTCACCTGGGAGGGCCTGTTCGACGTCGTCCAGGAACAGCCGCACGTCT
+TGCGCTCCGGCAACCGGGTGACCCTGGATGCGCAGCGCTTCGCGCAGCTGGGCACCTGGAGCGGCCGCAT
+CGTCGTCGACGGCGAACGGATCGCCGTCGATCCGGCGACCTGGCTCGGCAGCCGGGACCGGTCCTGGGGC
+ATCCGGCCGGTGGGGGAACCAGAACCGGCGGGCCGGCCCGCCGACCCACCCTTCGAGGGCATGTGGTGGC
+TGTATGTGCCGTTGGCCTTCGACGACTTCGCCGTCGTGCTGATCATCCAGGAAGAACCCGACGGGTTCCG
+CTCGCTCAACGACTGCACCCGGATCTGGCGTGACGGCCACGTCGAGCAGCTGGGCTGGCCGCGGGTGCGG
+ATCCACTACCGCTCCGGCACCCGCATCCCGACCGGGGCGACGATCGAGGCAAGCACCCCCGACGGCGCGC
+CGGTGCACTTCGACGTGGAGTCCAAACTGGCGGTGCCGACCCATGTCGGTGGCGGCTACGGGGGTGACTC
+GGACTGGTCACATGGCATGTGGAAGGGCGAGAAGTTCGTCGAGCGAAGAACCTACGACATGACCGATCCG
+ACGATCATCGCGCGGGCCGGCTTCGGCGTCATCGACCACGTCGGTCGCGCGCTATGCCGCGACGGCGACG
+GGAATCCAGTGCAGGGCTGGGGTCTGTTTGAACACGGGGCGCTGGGCCGCCACGACCCATCGGGGTTCGC
+CGACTGGTCTACGCTGGCGCCCTAGGCGCTTCAGGCTTACTTCGGCACCGGTGAGGCTATCCGCATTCGC
+GAGTCCAGGGTTCCTGGGCGCCGGCCGGGAAACGGCCCGAAAACGACGGCAGCCGGAATAGCCGACCGGA
+ACCGCCGAAATGCGGTTGACTAGAGCGGTGACAAACCCACCGTGGACTGTCGATGTTGTCGTGGTGGGCG
+CGGGCTTCGCCGGGCTGGCCGCGGCCCGCGAGCTGACGCGACAGGGTCACGAGGTGCTGGTGTTCGAAGG
+CCGCGATCGGGTGGGCGGCCGCTCGTTAACCGGTCGCGTGGCAGGGGTGCCCGCGGATATGGGCGGCTCG
+TTCATCGGCCCGACCCAAGACGCCGTGCTGGCGTTGGCCACCGAGCTGGGGATCCCGACAACCCCGACCC
+ACCGCGACGGCCGAAACGTCATCCAGTGGCGGGGATCGGCACGCAGCTATCGTGGCACCATCCCCAAGCT
+GTCGCTGACCGGGCTCATCGACATCGGCCGGTTGCGTTGGCAATTCGAGCGAATTGCCCGCGGCGTTCCG
+GTGGCCGCCCCCTGGGATGCGCGGCGCGCGCGTGAACTCGACGACGTGTCGCTCGGGGAGTGGTTGCGCT
+TGGTGCGCGCCACATCGTCCTCGCGGAACCTGATGGCCATCATGACCCGGGTGACCTGGGGTTGTGAGCC
+CGACGATGTCTCGATGCTGCACGCCGCCCGCTACGTACGCGCGGCCGGCGGCCTGGACCGGCTGCTCGAC
+GTCAAAAATGGTGCCCAGCAGGACCGTGTGCCGGGGGGGACACAGCAGATCGCCCAGGCGGCCGCCGCCC
+AACTCGGCGCACGCGTCCTGCTCAACGCCGCGGTGCGTCGCATCGACCGGCACGGAGCGGGTGTGACGGT
+CACGTCCGATCAGGGTCAGGCCGAGGCCGGGTTCGTCATCGTCGCCATTCCACCGGCCCATCGCGTGGCC
+ATCGAGTTCGATCCCCCGCTGCCGCCGGAATATCAGCAGCTCGCCCACCATTGGCCGCAGGGCCGGCTGA
+GCAAGGCCTACGCGGCCTATTCGACGCCGTTCTGGCGGGCCAGCGGGTATTCCGGCCAGGCGCTGTCCGA
+TGAGGCGCCGGTGTTCATCACCTTCGACGTCAGTCCGCACGCCGACGGGCCAGGCATTCTGATGGGGTTC
+GTCGATGCTCGCGGGTTCGACTCGCTACCCATCGAAGAGCGCCGCCGCGATGCATTGCGCTGCTTTGCGT
+CGCTGTTCGGCGACGAAGCGCTCGACCCCCTTGATTATGTTGACTATCGTTGGGGTACAGAGGAATTCGC
+GCCGGGTGGTCCGACCGCGGCGGTACCGCCGGGGTCGTGGACGAAATACGGTCACTGGTTACGTGAGCCG
+GTCGGTCCGATTCACTGGGCGAGCACTGAGACCGCGGACGAATGGACCGGGTATTTCGACGGCGCCGTCA
+GATCCGGTCAGCGTGCCGCCGCCGAGGTCGCCGCCCTGCTATGAGCTGATCCGCCGGTCCCGGACGTGCC
+GGGTCACCGATTCGGCCAGCGCCCGCAGGTGGCTGTTCACCTCTTGGTGCCGTTCCAGCATCGAGCAGTG
+GCCGCCGGGCAGTTCAACGAGGCCGACGACATTGGGCGCGGTGCGCGCAATCCTGCGGGACTGGCTGATC
+GGCGTTAGTCGATCACGTACGCCGCCGATCACCAGGGTTGGCACCGTCAGACCATCCAGGTTGAGGTGTG
+CCGACCCTACTTCCTCGACGAGCATCTTCGCGCAGCCGCCGCGCCCCGCGGCAGACATCTGGGTGAACAA
+CTCATAGACCAGTCTCGTGGCGCTGGGGTCCGCGTCGGCGGCGACCGCCAGCGTGGAGATCACGTGCCGG
+CTTAAGGCCCTGGCCGCGCCGGGGAGTGGAAACCCGCCGAACGTGTTGACCAGGCTCCGGCCGGCCAGCA
+CCCGAACCGGGGACAACTCGCGTGGCACCGACAGCAGTTTCACCTTGCGCACCAGGTCGCCGGTGGTGGT
+GTTGATCAGCGCGACGGCGTCCGTGCGGCGGCGGACTTTGTGGCGGTAGCGGTCCGACCAGGCGGCAATG
+GTAATGCCGCCCATCGAGTGCCCAGCGACCACCGCACGCTCGCGCGGGGCCAACGTAGCGTCCAACACCG
+AATCGAGGTCGGCCGCAAGGTGATTGAGGCTGTAGGCGCCACGCCGTGGGACACCGCTTCGACCGTGGCC
+GCGATGGTCGAAGGCGATCACCCGGTAGTCGCCGGCCAGGTCGGCGATTTGGTATGCCCAGGCCCGGATG
+GCGCAGACGAAACCGTGCGTCAGCACAATCGGATAGCCGTGAGGCGGCCCGAACACCTGGGTGTGTAACG
+GGGTGCCGTCCGCCGCACGGACGGTCAAGGTGCGGCTAGGCGGTAGGACGTCTGGAATCTGGGTAGCCCC
+GCTGCTTCGAGTGGGTCTCCGAGCACTCATCGCCGCTCCCCCTTCGACGCGGCCCCGTTGCCGCCTTCCG
+GATGTCGCCCACTCTAGCGTGCAGTTACTTACGGGTAGCTGGAAATCGCTGAAGCATAGGATCACAGAAT
+AATAACGTCGCGGCCCCTGCTCTCAGCTGGTTTCGCATCGCCAGCCGATCAGTAGTCGTCTCAGTAATCG
+TCGAGGGCGGCCACGTTGCGCCAACTCGGCCACGTCGTCTCCCAGATCCGGTGAATTCGGCCGTTGCGGT
+AGGCGGCAATGAGTACCACCTCGATGCGGGTCGGCTCCTCGCCAGGTCGCGACGTGGTGATCCACACCCG
+CCCGGCAACCTTGTCTGGGCCTCTACCCATGCGTGCTCGTCGTATTCGACCGCGTAGCTGATCGCCGTGG
+CGTAGAGCTTGCGGTGGCTATCGCGGAATTTTGCGAAGCTCTGGCTCAGCCCGTCGGAGTACATCAGGAA
+GTCTGGGTCGTAGTAGTGCTCGATCAGCTCCGCGTTTTTGGCGACGACCATCCGATCGAACATTTCCCGA
+AGCAGCGCAACGGACATTCGGCGATCCTAAACCCTGGCCGCCGGCCATCTCACAACGTGAGCGTGGACGA
+ATCCCCATCCATTGCGATGACGAGTTCAGACCGGACGGGCCGTTGCCTGATCAATCAGGACCTCCGCTGC
+CGCTCGGGCGTGCGCCCAGGGGCCGGCATCGTCGAGGGAGGTGGACAGTGCGGCCGCGCCCTCGAACAGC
+ACGGCGAGTTGATTGCCCAGGCTGCGCGGATGCGCTGCGCCGGCTTCTCGGGCCAGCCGGGCGAGGCCTT
+TGATGTAGTCGCGTTTGTGCGAGTGGACGATCCGCTCGACTCCGGGCATCTCCCCGGCCGCCTCGACCGC
+CGCGTTGTGGAATGGACAACCTCGCATCCGCCCATCGCCCCTGTTTGGACGATCGAACAATGCGAGCAGC
+CGCTCGCGTGGTGTCGCGTTGGATGCCTTGGGCATCTTGTCGGCCTCGCCGGCGGCTTGCCGGAGCCCGC
+GCAGGTACTCCTCCACCAACGCGGACTTACTCGGAAAGTGTTGGTAGAGAGTCCGCTTGGATACCGAAGC
+CTTGTTCGCAATCAGTTCGACCCCGGTGGCGTTGATGCCCTCGCAGTAGAACAGCTCTGCAGCCGCCTTC
+AAGATACGCTGACGAGCGCCGCGGCCCCCGCGCCTGGGGGGTTCCGTTGTTCTGGTGACCGGCGGCATAG
+TGCTGAGTATACCGACCTGTTTACAACACCCCTTAGCGCGTGTACCGTCAAAGCACAAAGTACACCAATC
+GGTTTACTGTAGGAGGTCTCATGACTTCACTAGCCGAGCGGACCGCGCTCGTCACCGGCGCCAACCGCGG
+CATGGGCCGCGAATACGTCGCTCAGCTTCTCGGTCGCAAAGTGGCAAAGGTCTATGCCGCTACCCGCAAC
+CCGCTGGCAATCGACGTTAGCGATCCGCGCGTGATTCCGCTCCAACTCGACGTCACCGACGCGGTGTCGG
+TCGCCGAGGCAGCCGACTTAGCAACCGATGTCGGCATTCTGATCAACAATGCCGGCATCTCCCGGGCGTC
+CTCGGTGCTCGACAAGGACACATCCGCGCTTCGCGGCGAGCTGGAGACGAACCTGTTCGGACCGCTCGCG
+CTGGCCTCCGCGTTCGCCGACCGCATCGCCGAGAGATCCGGTGCCATCGTCAACGTTTCCTCGGTACTCG
+CCTGGCTTCCCCTTGGCATGAGCTATGGAGTGTCCAAGGCGGCGATGTGGAGCGCGACGGAGTCGATGCG
+TATCGAGCTGGCGCCGCGCGGTGTGCAGGTGGTGGGCGTCTACGTGGGGCTGGTCGACACCGACATGGGT
+CGATTCGCCGACGCGCCGAAGTCCGATCCTGCCGATGTGGTCCGCCAGGTGCTCGACGGAATAGAGGCTG
+GCAAGGAGGACGTGCTCGCCGACGAGATGAGCCGTCAGGTGCGCGCGTCGCTGAATGTCCCTGCGCGGGA
+ACGTATCGCGCGGTTGATGGGTAACTGAGTCCGAAAGTCGATATGGCCATGTCCGCCAAGGCCTCAGACG
+ATATTGCCTGGCTACCGGCGACCGCTCAACTCGCGGTGCTCGCCGCCAAGAAGGTGTCCAGCGCGGAGTT
+AGTCGAGCTGTATCTTTCCCGAATCGACACGTACAACGCGTCGCTCAACGCGATCGTCACCGTTGACCCC
+GACGCCGCCCGACGCGTCGCCAAGCGGTCCGATGCGGCACGAGCCCGCGGCGACGAACTCGGCCCGTTGC
+ATGGGTTGCCGATCACCGTCAAGGACAGCTATGAGACGGCCGGCATGCGCACGACCTGCGGTCGCCGCGA
+CCTTGCCGACTATGTACCCACCCAGGACGCCGAGGCGGTCGCCCGGTTGCGCCGGGCCGGCGCGATCATC
+ATGGGCAAGACAAACATGCCCACCGGCAACCAGGACGTCCAGGCCAGCAATCCGGTCTTCGGCCGCACCA
+ACAACCCATGGGACGCCGCGCGCACGTCCGGCGGCTCGGCCGGCGGCGGGGCGGCCGCCACCGCGGCCGG
+GCTGACCAGCTTCGACTACGGCTCGGAGATCGGCGGCTCTACCAGGATCCCGGCTCATTACTGCGGTCTG
+TACGGCCACAAATCGACCTGGCGCTCGGTTCCTCTGGTCGGGCACATTCCCAGCGCACCAGGTAATCCCG
+GGCGATGGGGGCAAGCCGACATGGCCTGCGCGGGCGTGCAGGTGCGCGGTGCCCGCGACATCATCCCCGC
+ACTGGAGGCGACCGTCGGGCCGATGCGGGCGGACGGAGGATTCTCGTATGCGCTCGCTCCGCCACGAGCC
+GGCGCGCTCAAAGACTTCCGGGTCGCGGTCTGGGCCGAGGACCCGCATTGCCCAATTGACGCCGACGTGC
+GTCGGGCCATGGATGATGCTGTCGCCGCGCTGCGCGCCGCGGGCGCACACGTCGTTGAGCAGCCCGCCAC
+CATCCCGGTCGATATGGCGGTGTCGCACAACATCTTCCAGAGTCTGGTGTTCGGCGCCTTCGCTGTCGAC
+CGGTCCACCCTCAGCCCAGCCTCCGCCGCCGCGCTCGGATTACGCGCGGTTCGGCATCCTCGGGGCGAAG
+CCGCCAACGCCCTGGGTGCGACGCTACAGAGCCACCGTGCGTGGTTGTTCGCCGATGCGGCGCGCCACGA
+AATGCGCGACCGGTGGGCCGGATTCTTCAACGAGTTCGACGTGCTGCTCCTGCCCGTCACGCCCACCCCC
+GCGCCGCTCCACCACAACAAGGACCACGACCGGTTGGGCCGCACCATCGACGTCGACGGCGTCTCACGAT
+CGTACTGGGACCAACTCAAATGGAACGCGCTGGCCAACATCGCCGGCACCCCGGCCACCACCATGCCCAT
+CACCACCACAGCTACCGGACTCCCGATCGGCATCCAGGCGATGGGGCCCGCGGGCGGAGACCGCACCACC
+GTAGAGTTCGCCGCCCTGCTCACCGAAGTCCTAGGCGGCTTCCGCGTTCCCCCTCTTTAGGAACGCTCGG
+GCAGGGCCGCAATAACCTCGGCGAGCCGATCGGGCTGCTCCGCTGTCGTCAGGTGGCCGCCCGCAAGCTC
+GGTGATTTCCACCGAATCCGCAAGCCGCTCTCGGGCGAGCCGCAGTTGCTCTCCCTCGAATGGATCCTCG
+GCGCTGCCCACCACACCAAAGGCGACCTCATCGCCCAGCGCCGAAATGATCCGCGCCAGGTCCCAGCGCG
+CTGCGTGCTCGCGATGCTCGTCCACGAAGCCCGCCGTGGCGGGCAGCACGCGCACGCCGTCGCGCCGGCT
+GATCGCGTCGTGGAGCTCCTTCATCTCCGCTGCGCTTAATGGGTATCCGCGCGAGAAGACGGGCGCAAGA
+ATGGGGCGAACATGCGCCATGAGCGCTGGCCGATCGGCGTGATCGCCGCGCCGAGCGGCGATGTGAGCAG
+CGGCGTCGTATACCAGGCGTGGGTGTGGCCGTCGGCAAAGATGCCGCCGTTGGCGAGCAGGCAAGCCGTG
+ATTCGGGTCCGCTGATCGTTTCCCGCCCGCTCGCGATCGATCCGCCGCGCCAGCAGCTCAAGGCTGACGA
+TGCAGGAGTAGTCGAAGGCAACGACGACGGTCTGCGCTATCCCCTCGGCGTGCCAGAGGGCTTCGACGAG
+ATCCGCGCGCTCGAAGGTCGAGTACGGGTAATCCCGGGGTTTGTCGGAGTCGCCGTGGCCGATGTAGTCC
+AGGTAGATGCGGGGGAAGTGGAATCGCGAGCTCAAGAAAGCTTCCACCTTCGCCCAACCGTAGGAACCAT
+CCGGCCAGCCAGGCAGGAACGTTCGCGTGACCCCCGTCCCAGCAGCGCGCCGTATGAACGCGCGCAGCGG
+CGAACGTGGGTTGATGCCCGGCCGCTCAGCGTCGTAGCCCACCCTCTCCCCAGCGGAGAACCACTCCTGT
+GCGCTGATGAGCGCGCTCGCCCGGTGCGTCATCGCGCGCTCGCTAGCCGTTGGCGGAGGTTGTCGAGGTC
+CATGTCGGTGCATCTCCGCAACCAAAGTACACCGATAAGTTTACGTGTCGCATTAACCGATGTACAGTGT
+CGGTTATAAGTACACCGATCAGTATACAAGGAGTCGGCGTGCCCCAGAGACAGGCCGGCGACATCGGCGC
+GACATACCAGGACGCGCCCACGAAGAGCATCAATGTGGGCGGAACGCGTTTTGTCTACCGGCGGCTCGGT
+GCTGATGCCGGCGTGCCGGTGATCTTTCTGCACCACTTGGGCGCGGTCTTAGACAACTGGGATCCACGGG
+TCGTCGACGGCATCGCCGCCAAGCATCCAGTGGTCACTTTCGACAACCGCGGTGTCGGCGCTTCGGAAGG
+CCAGACGCCGGACACCGTGACCACCATGGCCGACGATGCGATCGCCTTTGTCCGTGCCCTGGGGTTCGAT
+CAGGTTGATCTCCTTGGATTCTCGTTGGGCGGCTTCGTCGCGCAGGTGATCGCGCAGCAAGAACCGCAGC
+TCGTTCGCAAGATCATCCTCGCGGGTACCGGACCGGCCGGTGGTGTCGGCATCGGCAAGGTTACTTTCGG
+GACGATCCGCGAGAGCATCAAGGCCACACTGACTTTCAGGGATCCCAAGGAGTTGCGGTTCTTCACGCGA
+ACCGACAGCGGCAAATCGGCGGCGCGACAGTTCGTGAAGCGGCTCAAGGAACGGAAGGACAATCGCGACA
+AATCGATTACAGTGCGCGCGTTCCGCTCCCAGCTCAAGGCCATCCATGCATGGGGCACGCAAAAGCCTTC
+GGACTTGACGAGCATCGGCCATCCGGTCCTGATCGCAAACGGTGACGACGACACGATGGTGCCCACCAGC
+AACTCGTTGGACCTCGCTGACCGGCTGCCCGACGCCACGCTGCGCATCTATCCCGACGCCGGCCACGGCG
+GGATATTCCAGCACCACGCACAGTTTGTGGACGATGCCCTGCAGTTTCTCGAGTCGTGAAGCGATTTCGC
+ATGACCACCAAAGCCACGCCCAGACCAGTTGGATTCGCCGCTCCTCCCCACCGTTTCGCGGTATCGGCAG
+AGCGCACCCATGGATCTATCACCGCACCGGCGGACGAGTCGGCTGCAAGTTGCGACTCGGCGCCGGATTC
+CGCAAACCGGTGCCGACACTGCTACTCGAACACCGGAGCCGCAAGTCCGGCAAGAACTTCGTCGCACCAC
+TGCTTTACATCACCGACCGTAACAATGTCATCGTCGTTGCCTCTGCCCTTGGGCAGGCAGAAAACCCGCA
+GTGGTATCGCAACCTGCCGCCCAATCCCGACACCCACATTCAGATCGGATCCGATCGCCGCCCGGTGAGA
+GCCGTCGTGGCCAGCTCGGACGAGCGGGCGCGCCTATGGCCGCGCCCAGTAGACGCCTACGCCGACTTCG
+ATTCTTGCCAAAGCTGGACCGAGCGTGGGATTCCGGTGATCATCTTGCGGCCACGCTAATAGGCGTCGGC
+CTGCTCCGCGTGGTCGAGCGATCCCGGTGCGGTTACCCGCTACGGGGTGCTTTCGGCACCGCGATCGGCT
+AGGCCACCGAGGGAGCAGACATCGAATACAGCGGCCGAATCAAGTCGCTGGACCCGGCAACTCCCACGGG
+TGTCGTCACCGTCGCCGCGATGACTGGCGGCCGGAAGACCTTTGGCCAGGCGACGTTGAACGTCCGCTTC
+CGCTGACCCGGCGGCCTGGTGACGGCGGCCGAGGACAAAGAAGAGCGGCTTCGGCTGTCCGGAACCCGGA
+TCGAACTCGAGGAGCTACTTCAGCTTCCGGTCGATGTTGCGTACGAGGGCCTGTTGACGGACGACGTTTC
+CGAATCCGTTCGCAAAAAGCTCATTACGCTACGAGCCGGTCCCTCAAGAACCGCCTGCTCGAATCTGCGC
+AACCCCGCTGGCGTTGGGGCGGACGACGGTGCTCGGCGTGATGTGGTGCACCAAAGGGACATTGCCGACG
+GAACTGGCGTTGAGCCAGCAACACACCGTTGATCGCATGAGTGATGTCCACCCAACCGCGGTCACCGACA
+ACGGGGATCCAGTCGGGATCATCGCTGGCATAAGGATATCGGCCTGCACCGGCATTGTGTGCTCACGGCC
+ATCGCTGCCTGGGACCAATCACCAGCCCCTGGAAGGTCGACTACAGCCACAAGCCCGACGATGGTCGACA
+GATCAAGATACGTCTTTCGACAAAACAAGATCCAATGGTCGACAAAACAGGACAAACTATTCGACAAATC
+GGGATCAGATGTACGACAAAACAGGAGTACTTTGACGTTGTGGTGCATGATGAGGCTGGTCACGAGCTGA
+TCGAGCGGCACATGCTCGAACAGTTGCGCGAGGTTGCGGAGTACACCCGTGTCGTGCTGATCAATGGTCC
+ACGGCAGGCTGGTAAGACGACGCTGCTCCAACAATTGCACGCCGAGCTAGGCGGATGGCTGCGTTCGTTG
+GATGTTGACGTCGAACGCGCGTCGGCGCGAGCCGATCCCGAGGGGTACATCATGTCCGCGCCGCGCCCGA
+CGTTCTTGGACGAGGTCCAGTGCGCCGGGGATCCGTTGATCCTGGCGATCAAGACGGCAACCGATCGTGA
+CCGCCGGCCCAGACAGTTCTTCCTGTCGGGGTCGACCCGATTCCTGACGGTGCCGACGCTGTCGGAATCA
+CTGGCCGGACGGGTTGCGATCCTCGACCTCTGGCCGCTGTCTGTCGCTGAACGATCGGGTGTCCGGCCGG
+AGATCATTGCGCAACTGTTCACTGAACCCCAAGTGGTCCTGGGCACGGAGCCCGCCCCGGTCACGCGACA
+TGAGTATCTGCAGCTGGCCTGCGCGGGTGGCTTTCCGGAAGTTGTGCAGCGCCCGGCGGGTCGCGCCCGC
+AGCCGGTGGTTCTCGGACTATCTGCGCACGGTGACGCAGCGCGACGTGCGCGAGCTGAAGCGGATCGAGC
+AGACGGATCGCCTGCCGCGGTTCATGCGCTACCTGGCCGCTATCACCGCGCAGGAGCTGAACGTGGCCGA
+AGCGGCGCGGGTCATCGGGGTCGACGCGGGGACGATCCGTTCGGATCTGGCGTTGTTCGAGACGGTCTAT
+CTGGTACATCGCCTGCCCGCCTGGTCGCGGAATCTGACCGCGAAGATCAAGAAGCGGTCAAAGATCCACG
+TCGTCGACAGTGGCTTCGCGGCCTGGTTGCGCGGGCAAAGCGCCGACTCCCTGGCCAGGCCAACCGCGGA
+GGGCGCGGGCCCGATCATGGAAACGTTCGTGATCAACGAGCTGATGAAGCTACGTGCGGCGACCGAACTC
+GAGGTTGACCTGTATCACTTTCGCGATCGAGACGGACGGGAGATCGACTGCATTCTTCAGACCCCAGACA
+GTCGCGTCGTCGGTGTCGAGGTCAAAGCCTCGGCGACAGTGAACGTCCATGATTTCCGACACTTGTCATT
+CGCGCGTGACCGACTCGGCGACGAATTCATCACCGGAGTTCTCTTCTACACTGGTGCCCGGGCTTTGCCG
+TTCGGCGACCGGTTGATGGCTCTACCCATCAATCTCCTCTGGAACGGACAATCCGTCTCCAGCCTGTAGG
+CGCATACCGATCGCCATATTTCAAGAGCAGGTTGGAGCTTCTGCCCCCAATCATCGTGCGGCAACGATGG
+GCGGCTCTAGCGCTAGTCGACGCGCTATTCAACCAGCTCACACCGAGCTCCCGCGCGGCCACATACCCGC
+GACCGTGTGATGCAAGCACCCCACCAGCTCCGCGCATCACGCAACGAACCGGTCAAATCGTAGGCTTCCA
+AAATCTCCATGATCTCCTCGGCAGACTTCACGTCACCCCTTTTCGGGAGCTGAACAACCGACGCGGAGCC
+GTCGGCCGCGGATGCCCTGGGGCGGCGGTCCCCAAACCCGATATGGCTAACGTCAAGCGGTCGGATCACG
+GGTCGAGTTGGGCGGGGGCGACTCGGCACCCGGCGGCATGGGCTCCGGTGTGCAGGCGTCGGTCCCAAAC
+GGCGACTACCAGGCCGGGGTCGCCGACTGCCAATGCGCTGGCCAGATGAACGGCGTCGGCTCCGCGTAAG
+GCATGTGCTCGGGCGAGGTGGCCGGCGTGCTGTTCAACCGTCGCGGTGAGTTCGACTGGGCGGGTGGCGG
+CCCAGAAGTCCTCCCAGTCACGCTCGGCGTCGGCGAGCTCGGATTCGGTTAGGTCGTGATTGCGGGCCGC
+TGCAGCGAGTGCGGCGCGGACTTCGGGGTAGGCCAGGCGGCTGGACAATGCGGCGTCGCAGCCGTCCCAT
+AGAGCGGACGCCAGCGAGCTCCCTGTCTCGGTGGTGAGAAGTTTGACGAAGGCGCTGGCGTCGAAGTAGA
+CGAGCGGCACGGTCAGCGCCGCTGGTCGCTGACCCGGTCAGACACCGGCCGCTGCGGTCGGGGCCTGGGC
+CGTCCCGCGGCTACGGGCCGCTGCGCGGTCGCCTTGCCAATCACGCCTTCGGCCGTGAGACGCTCCAAGG
+TGTCTGTGCTGTCCAGCGCAGCGAGTCGTGCGATCGGAATCCCACGTTCGGTGATGACGACCTCGCCACC
+GGCCCGAGCTCGATCGAGCCAATCGCTGAGGTGCGCGCGCAACTCGGTCACGGATACATCCACACTTTGA
+ACTGTACACTCACTGAACCGTGATTTGTACATATCACTCTGCGTGCGGCAACGACGACGTGAGAGATTGA
+CCTGCGCAAGCCGGAGGCGAGGTGGCAACGGCCGGTACACCGATTCGTCCGCGGTGCTGGCGACGCCGAA
+ACGGTCGATGTCGTGGTGACTGGTCACCTTCCGTCCAAGCTGCATCCGAAGGTGTTGCAACGGAAGGTGT
+TTGCCGTCCGCGCTGGGCCTTCGGCGCAGCTGGCATTTGTGGTCAGCTGCATGGCGACGGCAGCGCCTCG
+GTGGTGAACGCCGGGTTTAGCTTGCAGCGGCCGAGCAGGCTGCCTCGTTCCTGCTCGGTGACAGTTGGCC
+CGACGATGACCGCGCACCGCCGCCACCACGAGATATAACCTAGAGGTTATACTGGTGCGGAAGCGTTGGC
+CGTGATCCTGCTCCCGCAGGTCGAACGGTGGTTCTTCGCGCTCAACAGGGATGCGATGGCCTCGGTCACC
+GGCGCCATCGACCTGCTCGAAATGGAGGGGCCGACGTTGGGCCGCCCGGTGGTCGACAAAGTGAACGACT
+CAACGTTTCACAACATGAAGGAGCTGCGCCCCGCCGGCACCAGCATCCGGATCCTGTTCGCCTTCGACCC
+GGCCCGGCAGGCGATCCTGCTGCTGGGCGGTGACAAGGCAGGCAACTGGAAACGCTGGTACGACAACAAC
+ATTCCAATCGCTGACCAGCGCTCCGAGAACTGGCTGGCGAGCGAGCACGGAGGTGGATGACCATGGCCCG
+CAACTGGCGTGACATTCGCGCCGATGCCGTCGCGCAGGGCCGCGTGGATCTGCAGCGGGCCGCCGTGGCA
+CGCGAGGAGATGCGCGATGCCGTCCTGGCGCACCGCCTGGCCGAGATCCGCAAGGCGCTAGGCCACGCAC
+GTCAGGCCGACGTCGCGGCGCTGATGGGGGTCTCTCAGGCCCGTGTCTCCAAGCTGGAGAGCGGCGACCT
+GTCCCACACCGAACTCGGCACCCTGCAGGCCTACGTTGCCGCCCTGGGCGGGCACCTGCGCATCGTCGCT
+GAGTTCGGCGAAAATACTGTCGAGCTGACCGCCTGAGCTAACTCACGCCCACACTTCCGGCCGGTCTCGA
+TCTCCCAAGCCCCAGCACAGCTCGTGTTCCCAATCTGTTCCCAACCAGATCCTTAGCTATGCGCATGTTC
+CCAAAAGTGTTCCCGCCCATGAAAACGGCCCCCGGAGTCTCCTCCGAGGGCCATTTCGCCGGTAGCGGGG
+ACAGGATTCGAACCTGCGACCTCTGGGTTATGAGCTAACCAGTCGCAATCTCTCCCATCGCGGTCGGTCT
+CATACGTCCAGATCAGCCTCTATTCCGCCGTCCAGCCTGTTCCGCCGCGTCGCGGTTGTACGGATTCGTT
+TCGGCCTGTTCTGTTCCCAAATCCGTTCCCAACACAGCAATCAGCAGCAATCCCAGGCCGAAATCGGTCA
+GACTCTTGGTGGACCTACAGCACCTCGCCTCCATGTGGTCGCGGAGCTAGTGAGGGTCCATCGGCAGCAC
+CACTTAGGGCGCCTCCGTTGTCATCATGGTCGATAAGCGGTAGCGTTTACGGTAGTAGAACCGGAAGTTG
+CGGAGGAACCACGATGGCGGTCACCCTGGACCGGGCGGTCGAGGCCAGCGAGATCGTCGATGCCCTGAAA
+CCCTTCGGCGTCACCCAGGTCGACGTCGCCGCGGTCATACAGGTGTCCGATCGGGCGGTACGCGGGTGGC
+GGACCGGCGACATCCGCCCTGAGCGGTACGACCGGCTGGCGCAGCTTCGTGACCTCGTCCTCCTGCTCTC
+GGATTCGCTTACCCCCCGAGGTGTCGGCCAGTGGCTGCACGCCAAAAACCGGCTCCTCGACGGGCAGCGC
+CCGGTTGACCTGCTCGCCAAGGATCGCTACGAGGATGTGCGAAGCGCGGCGGAGTCATTTATCGACGGCG
+CCTACGTGTGAAGCTTGCCGACGCGATCGCCACCGCACCGCGGCGAACGCTCAAAGGCACCTACTGGCAC
+CAAGGCCCCACACGTCACCCTGTGACCTCCTGCGCCGACCCCGCCCGAGGTCCTGGCCGTTACCACCGAA
+CGGGCGAGCCGGGAGTCTGGTACGCATCGAACAAAGAGCAAGGTGCATGGGCGGAGTTGTTCCGCCACTT
+CGTCGATGACGGGGTCGATCCATTCGAGGTCCGTCGCCGCGTCGGTCGAGTGGCGGTCACACTCCAGGTA
+CTCGACCTCACAGACGAGAGGACTCGATCCCATCTAGGTGTGGACGAAACAGATCTTCTGTCCGACGACT
+ACACCACCACCCAGGCCATCGCCGCCGCCCGCGATGCCAACTTCGACGCCGTACTGGCCCCGGCGGCGGC
+GCTCCCCGGTTGTCAAACACTTGCCGTGTTCGTTCACGCACTGCCCAACATCGAGCCCGAGCGATCCGAG
+GTCCGTCAACCGCCTCCGCGGCTCGCCAACCTACTCCCGCTGATCCGTCCGCACGAACACATGCCCGACT
+CCGTGCGCAGATTGCTTGCAACGCTGACACGTGCAGGAGCCGAAGCAATCCGGCGCCGACGACGTTAAAG
+GCTTCGAGACCGGACGGGCTGTAGGTTCCTCAACTGTGTGGCGGATGGTCTGAGCACTTAACGCTTCGTT
+GACCAAAGCCCCACTTGATGCGAGGACGCGATCAGACAACGGAATGGCCTAGCCGCCGTCGCGGTGGCTT
+TGCGCGACTGGGGCGGCTCACGGAATGGTCGTCGTTGGCACCTCTGCTGTCGGGCGTAATGCAAAGGGAA
+TCAATGTCAGGTGAATCTCGCGTTCGGGATCACCGTCGGCGTGCATGGTGAACTCGTACTGGTCTGCACC
+GGCCCGATGTGCGGGGCAGCGCTTATGATTCGGGTGCTCTTTGATCTTGGCGATGGCGTTATCGATGACC
+GCGGTCACGTCTTTGTTGCGGATAAAGAGCAAGATCGCGGCCTTGGTGTCGCGCCACACAAGGTAGCCGA
+ATAGCTGCTTCAGCGCATCGTCCATGGTTCTTGGGCCCGACCACACTTTGCATTCGCCAATGAAGATGTT
+GCGGTCGTCGACGCGAATGAGAATGTCGGTCTTGCCTGCGCCGTTGAAGAGTTCGCCCCCGGCATCGCCT
+TCAAACTGTGCGTTGAGGCCGACGAGCAGCATGTCTCGGATTTCTTCCCCGTCGAGCTTGGCGGCGACAG
+ATGGGGTGCGCTCCAACGCGTTCCGCTGGTTACGGAGCACCCGAAGTGCGGACTGGTAGTCCTCATCCTG
+CATTGCAGGCTCCGGCTTGAATGCTGCCCTCGCGCCCGCTGGGCGGTGTGGCCGCGGACGCACGCTTTTC
+CGACTGATCGGAGCTGCGTATGTGTCGGCGTCCTTCCTGCGGCGTACAGGGAAGCCGATCTCGGCCTGGA
+GGTTTCGGGTCGCTAAGAGCTGCTCACGGCGCCTCGCCACCATGCCCGGTAGCTCGTTGCGCAGTCCTTG
+GTTGTGCAAGTCGATCTGCCGGCGCGACCAACCGAGGTACTTCTCAATATTCGCGATCTGCTTATGAAAC
+GCCGCGTTGATCGCCGCGGCGTCATTCGACGGATTGTCGATCGCCAGGTGGATTTCGTGACCTTGTAGCC
+GCAGTACCTGCGGCGGCATGGTCGTGAACTGGTCCGGGCGAAGGTTAAAGATGTCCTTATGCCCCTCGAA
+GGGCACCACGAGAACGAGCCTCGTCACGCGTCGGGTGCGCTGTTCGCCCCAATCCCGGTACTGCTGGTCG
+ACCTCGGTGGCTGGCAGCATGAAAGCGTCGTCGACGCGCAGATCGGGGCATTCGACCGAACCCAATTCGA
+CGAGCTGTTCGACGACGTCATCAACGGGCGTGTTCAGCAGGTCGTCGGCGTCCCAGCTCTGAAGACGCTG
+CGCCGTGGCTTGGCTCGCCTTTCCGAGAAATCCGGCTAAGGAGCCAGCGAGATCGTTGAGGCGCCCCTTG
+GAAAACAGCTGAACATACTCCACTTACCCGAAGATAGTGCTCATCCCCGACGCGGCTACGGAGGCGTTTC
+GGCGGCGTGCCGCGATGCAATGCAGCCAGCGGAGCCACCGGGCCGTAGCCGACGTCGCGTCGTGGGTGGC
+GACGGGGTTCTCCGGGGTGCCGGAATCCTTCGACGAGCTTGTCGGGGGTCATGATTACTGTTCTCGATAT
+GAACGGATTCAAGGATGCGAGGCCCGATCGTCTTCCGCTTTCGGCATCGGTTTGGGATATCGCCCAGCGA
+TACAACAAGGGCGGACCTACCGTCACTGAGGCGCTATACGAGGCGCTGAAGGAACTCGAGGCCCAAGTCA
+TCGCTCTGCAGCGAAGCGAGGGTAAGGGCCTGCTCAGCCGCCTGAGCTGAACGACTAGAGGATTGGGGAA
+GGGGCCCCCGGGGAATGGATCATCCTACTGAGCGGGAATGGGCCAGCATCGCCGAACATACACGCGCCTC
+CAACTTCACCGGCGACCTGTTACGAATGCCGCCTTACCCGCTGATCCTCACCCTCCGAACGCTGGTGGGG
+TCTGCCGAGGTGGTCACTGCATCACATACCCTCTTCCTGTCGGCGGCAACTGAATACTGACCAGAGCGCG
+GCAAGGTGGGTTCTAGTCAACGTCGCAACAATTGATGGTCTGGTGAGGTTAGCAGCGCGGTGAAAAGTTC
+AGCGGGACTGCGGTGCCCGAGGACTTGGCGGGGTCGGTTATTGATCTCGTATTCGACAGCCCGCAGATGG
+TCGGGCGTGTAGGTGCTGAGGCTGGTGCCCTTTGGGAAGTATTGCCGTAGCAGACCGTTGGAGTTCTCGT
+TGCTGGCTCGCTGCCACGGTGAGCGGGAGTCGCAAAAGTAGACCGGCGCGCCCAGGTCGGCGGTGATGTC
+GATGTGCCGGGCCATTTCGATGCCCTGATCCCACGTGATGGACCGGACCAGCGTCACCGGCAAGTCGCTC
+ATGGTCTCGGTGATCGCGATGCGCAGGCAGTAAGCGTCGTGGGTCGGCAGGTGCAGCAGCCGAATCAGAC
+GTGTCTGTCGCTCGACGAGGGTGCCAATCGCCGAGCCCTGGTTCTTACCAACGATGAGATCTCCTTCCCA
+GTGGCCAGGCTCGGAGCGGTCGGCGGGATCGAACGGCCGCTGGTGAATCGACAACATCGGCTGGGCGAAG
+CGCGGGCGGCGACGGCCAGGACGCAGATGGGCGCGGCGATGAGTTCGTCCCGTGCGCAGAGGGCCACGGT
+GTGGCGACTTGACCTGCGGCGGCCGGATCAATCGTGATTGAGGCTGATAGACGGCCTGATAGATGCTTTC
+GTGGCACAACCACATCGACCGGTCATCGGGGTATTTCCGTCGCAGATGCCGGGCGATCTGTTGCGGGCTC
+CACCGCTGGGCCAGCAGCTCGGCGATCAGCTCACAAAGGTCGGGGTTTTTGTCGATCCGACGCCGGTGAC
+GGCGGACTCGGCGTTGAACCGCCCAGCGATGCGCTTCGAACGGCCGGTACTGGCCATCGCGGCGACTGTT
+GCGGCGTAGCTCCCGCGACACCGTCGAGGGTGCCCGTCCGAGCTGGTCGGCGATCTTGCGGATACTTAGG
+CCCGAGCGGCGCAGATCGGCGATGTTGATCCGCTCCTCCTCGGACAGATAGCGACTACTAATTTGGCGCA
+CAGCCAAACGATCGAGCGCGGGCACGAATCCGACGGCTTCGCCACGCCGATAGGTCTTGTATCCCCGCGC
+CCAATTGTTTGCTGCAGTCCGGGATACTCCAACTTCACGACCCGCTGCCGAGATGGACCAGCCCCGAGCC
+CGCAGCTCCATAAACCGTTGACGCTTGGCCGACTGTGGGCGCCGGCCCGGACCCTTTTTCACGCGACGAG
+ACGATGACAACACAACCTCCAGAACCTAGAGATGTGTTGCGACACCGCCTAGAAACCACCTTGCCGACAC
+CTGATCAGTTTTCGGTTGCCGCTGACACAATGAACATGGCCCGCTTCACCCGTTCAGCGTCACGTGGATA
+AGCGGCCCGTAGCGCGTCCCAGTCGGTTTCGGAGTAGTCGGGCCGTTGTACAGGGGCATCCGGCGCGGCC
+GGTGGCGGCATCTTGATGCCGCCACCGGCCGCGTCACGGTTCGCGGTTGGCGCTCGCCTGACGACGGTGC
+TGCTCCCGTTCCTGAGCACGCTGCTTTCTAGCCTTGCGGTCTCCCTGCTTTCCCATCTCCCGGTCCTCCC
+GGCGGGTCACGATAGCCGCGCACTCCGACATACCTGGCGCGGCGCGGGGCGCTGCGAACCGGATGGGCGC
+CACCACCGATAACCATTGCGCGTTGCGGCAGCCTTCGCATTAGCAATGCTGGCGCGCCGCTCGACGCCTC
+GGCTATCACCTCACCTGACCACCGCGCGCATCACCGACGAGACCTCATCATCGCGCCCGCTCTCGCAAAC
+ACCACGCCCGCCAAACGGGGCTGGCCCGAGACGATTTCAGAGGCCCCTACAGACCGATCCGCACGCCCGA
+AACCCGGGTTACCGCTAAGCAGCCCAGGACAGCAGCCGCAGTCCTGATCGGCGAAGACTGACGTTCAGAC
+CGCAAGCAAGCTAAATAGCAAGCCAAGCAATTAGCAAGACTAATGTTCCCAAATCCGTTCCCATCGGGCA
+TGAAAATGACCCCAGAGGTCGCACCTCTGGGGTCATTTCCGCTGGTAGCGGGGACAGGATTCGAACCTGC
+GACCTCTGGGTTATGAGCCCAGCGAGCTACCGAGCTGCTCCACCCCGCGTCGGTAAATGCCAGGCTACCG
+AACACGCACGAAGCTCGCCAAATCGCGGGTGCCGGAGTACGACCGCCCAGATCAGCGGAGCTCGGGCATA
+CAGCTGCGCCGTACGCGTCGATGCGATGATGATTCCGCAGCCGCTCAGCCAGCTCGGTGACCTGGCGCGT
+CGCCCAGGCCGCAGGGTTCTCTGTTCCCCGAAAACGGCCGCACCGTCGATCTCAAACGCAACTGTCGCCT
+CGCCGGCCGCGCCCGGCCTTGAGCTGTCCACCGGGATCGCGTTGGCGTTCCCGCGCGGTCCCTTCGTCCC
+GGCAGCCGCGGCGTGGGAGCTCCAGGAAGCTACCAGCGGGAAGTTCCAGCTCGGTCTGGGCACGCAGGTT
+CGCAAGAATGTGGTGCACCGATACGGTATGGCCTTCCACCGTCCCGGTCCGCGGCTGCGCTACCTGCTGG
+CCGTGAAGGCGTGCTTCGCCGTTTTCCAAACCGGGACACCGGATCACCACGGCGAGTTCGACAATCCCGA
+CTTCATCACTGCCCAATGGAGCCCGGCGCGCATTGACCCCCCCGGTCCCAGCCCCGCTGGGCCGCGGTGA
+ATCCGTGGATGCGGCGAGGTGGCCGACGGGGTGTGGGGCGAGGCCGGGTTCGAGGGGACGACCACGCGGA
+TCCGGGAGCCGACGAGCACCCGTGAGCAGACGCAGAAGTCCCCGATTTCCGGTGAAATCGGCGACTTCTG
+CGTCTGCTCGCCGCGAGCGCCCCGACTGACTACCCGGCGTCGTTGAACTTGGTGATGGCCTCATCAAGTC
+GCTGCAGCGCCGACCCGTAGGCGGCGAAGTCGCCCTTCTTCTGCGCATCCCGCGCCGCGCCGATGGCAGC
+CTGGATCTCCTGCAGCGCAGCAACTTTGGCCGGCGATAAGGTGACCGCCCCGACGGGAACCGGGGGCGCC
+GCAGTCACCGGCGGCGGTTGGGGTCCACTGGCAGGCGGCGGTGGATTCGCAGCGGGACTCGGTGGTACCG
+CTGCCTCCGTGGGCGCGATCCCGGTAGCCGTCGCACCGGCCCCGGGCCCGAACAAGCCGGTGAGCGCATC
+CCGCACCGTGGGGCCGTATCCCACCTTGTCGTTGTACATCATCGCCACCCGGATCAGCCGCGGGTAGGAC
+GAAGCAGCGTCGCTGGCTCCCGGGGATGCATAGACCGGTTCGACGTAGAGCAGTCCGCCCTGGGCCACCG
+GGAGCGTGAGCAAGTTGCCCCAGCGGATGCGGTTTTGGTTGTCGCGTCCGATGACACCGAGGTCCTGGGA
+CACCGCCGGATCGGTGGTGATCGCGTTGTTGGCCAACTTGGGCCCGTTGACCTGGCCTGGGATGGTCAAC
+ACCGTGAGATTGCCGTAGGTCGCGGGATCGGAACTGGCGCTGATGTAGGCGGCCAGATAGTCACGCTTGA
+ATCTGTTCATCGCGCTGATCAACTGATATGAGGCTGAATTATCGTCCTTAGCAATGTTTTTCGCGACGAT
+GTAATACGGCGGCTGATAACTGCTGGCGGTCGGATTCGGGTCCAGCGGCACGTCCCAGAAATCCGATGTG
+GAGAAGAACGTCACCGGATCATTGACGTGGTATTTGGCCAACAACATGCGCTGCACCTTGAACAGGTCCT
+CGGGATACCGCAGGTGCTCGGCAAGCTCCGGCGCAATGTCGCTCTTAGGCTTTACCGTGCCGGGGAAGAC
+CTGCATCCAGGCCTTGAGCACCGGATCCTTTTCGTCCTGTTGGTACAGCGTGACCGTTCCGTCGTAGGCA
+TCCACAGTGGCCTTCACCGAATTGCGGATGTAGGAAACCTTCTTGTCCGGGACCAACCGGTTGAACGCCA
+CCTCGTTGGAGTCCGCGGTCGCCGAGGACAGCGAGGTGAGCTCGGAGTACGGGTAATTGTCCAACGTGGT
+GTAGCCGTCGACGATCCACACCAGTCGCTTGTTGACGATCGCGGGATACACAGCGCTGTCTGTCGTCAGC
+CACGGCGCGACCGCCTCCACCCGCTGCGCCGGATCGCGGTTGAACAAGATCTTGCTGTTGGAGCCAATCA
+CATTGGAGAACAAAAAGTTTCGCTCCGCGAACTTCGCAGCGAACACGCTACGGGCTAACCAACCACCGAG
+CGGGACTCCACCGCTTCCGGTGTAGGTGTATCTCTTGGTGTCGATGTTAGTTTCGTAGTCGTATTCGCGG
+TCGTCGCCATTGCGTCCAACGATCGCATAGTCCGCGGACGTGTTAGAGATCACCGGACCGAAGTAGATCC
+GCGGCTGATCCAGTGGCGCCGGCCCATCAGACACCACGGTGCCATTGGCCCCGACGACGTTGACCAAGAA
+TTCGGGGTAACCGCCATTTTGATTCGGGTCGTTGGCGATACCGCGCACGGTGTTGGCCGGTGAGGCGATG
+AACCCGTTCCCGTGGGTGTACACGGTATGCCGGTTGATCCAGTCCCGTTGGTTGTCGATCAACCGGTCCG
+GGTTGAGTTCGCGGGCCGCGACGACGTAGTCGCGCAGGTTACCGTTGCGGTCGAGGTAGCGGTCGATCGA
+CAGCTGGTCCGGGAAATAGTAGAAGTTCTTGCCCTGCTGGAACTGGGTGAACGCCGGGCTAACGATTGTC
+GGGTCGAGTAGCCGGATGTTCGAGGTAGTCGCGCGGTCGGCAGCGACCTGTTGCGCGGTAGCCGGGCTAT
+CACCGCTGTAATTGCGATAGGTCACCACATCAGACGTCAGGCCATAGGCTTGCCGAGTTGCGGTGATACT
+TCGGCTGATATATTCGCTCTCTTTTTGCGCAGCGTTGGGTTTGACGCTGATTTGCTCGACGATCAACGGC
+CAGCCGGCGCCGACAATCAGCGACGACAGCAGCAACAACACCAGGCCGATCGCCGGAATCCGCAAGTCCC
+GCAGGGCGATCGCCGAGAACACTGCGGCCGCGCAAATCAACGCAATCGCCATCAGAATCAGCTTCGCCGG
+CAGGACGGCGTTGATATCGGTGTACCCGGCACCGGTGAACGGCTTGCCGCCACGCGTGTGCGACAGCAGC
+TCATACCGATCCAGCCAATAAGCAACGGCTTTAAGTAACACCAGTACCCCGACCAGGCTAACCAACTGGA
+CGCGCGCCGAGCGGCTCAGCGCACCGGTGCGTCCGGATAGCCGAATGCCACCGAAGATATAGTGCGCCAC
+CAGATTCGCCACGAATGCCAGAAATACCGAAACGAGCATGTAGCTGAGCATCAGCCGGTAGAACGGCAAC
+TCGAACGCGTAGAAGCCGAGGTCCCGCCCGAACTGCGGATCCCTAACCCCAAAGTCACCGCCGTGCAGGA
+ACAGCTGGATCCGAGCCCAGTAGCTTTGGGCGACGATGCCGGCCAGCAAGCCGATCGCCGCGGGGATTCC
+GATGCCGACTAGCCGCAGGCGTGCCAGCACGACGGCGCGATACCGTGCAACCGGATCGTTGTCGGCATCC
+GGGACGAACACCGGGCGAGTGCGGTAGGCCAAGGCGAGCCCGCCGAACACGATGCCGCCGACCACCACCC
+CGGCAACCAAGCACACCACGATGCGGGTAGCCAGCATGGTGGTGAACACTGAGCGGTAGCCAAGCTCACC
+AAACCACAGCCAGTCGACGTAAGCGTCGATCAAACGCGGGCCAGCGAGCAGCAGCACGATCACACCCAGT
+GCGATCATGATCAGAATCCGGCTGCGCCGTGTCAGTTTCGGCATCCTTGCGGCGGACCGCATTCCCACTA
+GCTACGCTCCCTGATCGTTCTGGCTGGTTGAGACTTTCTCGACGGTCATAACTCTACGCACCGCAACCAT
+CCGCAGCAGCCGGCGCGAGCTAGCAGCTCGGCGTCGGCGAGCCCGACGTCATCGCGTGCAGCGCGTCCAC
+CGCCTGGCTAAGCGTCTCGACCTTCACCAACTTCAAACCGGGCGGGCTGTCGGAACTTGCCTCGTAGCAG
+TTCTTCGCGGGCACCAGAAACACCGTCGCGCCGGCCGCTCGAGCAGCGGCCATCTTGTGGGTGATGCCAC
+CGATCTGGCCCACCTTGCCATCGACGGCGATCGTGCCGGTGCCTGCGACGAACGTCGACCCAACCAGGTG
+GCCACTGGTGAGCTTGTCGACGACGGCCAGACTGAACATCAGTCCGGCCGAAGGGCCGCCGACGTTGGCG
+AGGTGGAAGTCCACGGCAAACGGCGCCCACGGCGCGTCCACCACCTCTATGCCCAGGACGCCTTGGTCGC
+GATCCTTATTCTTGCCCAGCGTGATCTGCGCGATGCCGGGCGGCTCGTTCTTGCGGCGGAAGTCGATCGT
+CACCTCCTGGCCCGGTTTCGTGTTCTTCAACAGCGCGGTGAACTGGTCGAGGTTGCCCACCGGAGTGCCG
+TCGACGGCGTCGATGGCGTCACCGGCCTGCAGCTTGTCCACCGATGGCCCTGGATCCATGACCGAGGCGA
+CGGTGACTGCTTTCGGATACTTCAGGTACCCCAGAGCGGCGTACTCAGCGGCGGCCTCGGAGCGCTTGAA
+ATCAGCGGCGTTGTCATTTTCGATCTCTTCCCGCGACTTGCCCGGAGGGTAGACGAGGTCGCGTGGCATC
+AACTGTTCTTGACCCGAAAGCCACAGGGCCAGGGCTTCACCCAGGGTTAGACCGTCGCGCTGGGAGACCG
+TCGTCATGTTGAGGTGACCTGACGTCGGGTAGGTCTGGGTGCCCACGATCTGGACCACCTGCTTGCCGTC
+TATCTCGCCGAGCGTGTCGAACGTTGGGCCGGGTCCCAGCGCCACAAACGGCACGGTTACCACGGCGAGC
+AACACGCCGAATACCACGATCGGCACCAGCGCGACCATCAAGGTCAATATCCGCCTATTCACGCCGCATA
+CACTAGACGGACCTGGCCGGGCTGGTTCAGCTGCGAGCGTGACCGCTGATCGCACCTTCTGTTCCCGCGG
+TGAGTACCGGTGAGGTCATGGGTGACCTGCCTTTCGGCTTCTCTTCCGGAGACGACCCCCCGGAAGATCC
+GTCTGGGCGCGATAAGCGCGGGAAGGACGGTGCCGATTCCGGATCGGGCGCCAATCCGTTGGGCGCGTTC
+GGCATCGGTGGAGAATTCAACATGGCCGACCTGGGGCAAATCTTCACCCGCCTAGGAGAGATGTTCGGCG
+GCGTCGGCACCGCGATGGCCGCGGGCAAAACCTCAGGACCGGTCAACTACGACTTGGCCCGGCAGGTCGC
+GTCGAGCTCGATCGGGTTCATCGCGCCCATCCCGGCGGCCACGAACTCGGCGATCGCCGACGCGGTGCAT
+CTGGCCGACACCTGGCTTGACGGGGCAACCTCGCTACCCGCTGGCGCCACCAAGGCGGTGGGTTGGAGCC
+CCACCGACTGGGTCGACAACACCTTGGCTACCTGGAAACGGCTGTGCGATCCCATGGCCCAGCAGATCTC
+CACGGTCTGGGCGTCGTCGCTGCCGGAAGAGGCCAAGAGCATGGCCGGCCCGCTGCTGTCGATCATGTCG
+CAGATGGGCGGCATAGCGTTTGGTTCGCAACTGGGCCAAGCGCTGGGCCGGCTGTCCCGTGAGGTGCTGA
+CGTCTACCGACATCGGTCTACCGCTGGGGCCCAAGGGGGTGGCCGCAATACTGCCCGGCGCCGTCGAATC
+GTTTGCCGCCGGACTCGAGCAACCGCGCAGCGAGATTCTGACGTTCCTGGCCACCCGTGAGGCCGCACAT
+CACCGCCTGTTCAGCCACGTTCCCTGGCTGGCCAGTCAACTGCTCGGCGCCGTCGAGGCCTACGCCATGG
+GCATGAAGATCGATATGACCGGAATCGAGGAGCTGGCCCGCGATATCAATCCGACGTCGCTGGCCGATCC
+CGCCGCCATGGAACAGCTGCTGAGCCAGGGAGTATTCGAGCCCAAGGCAACGCCGGCCCAGACGCAGGCA
+TTGGAACGACTCGAAACACTGCTCGCCCTGATCGAAGGCTGGGTGCAGACCGTGGTGACTGCGGCGCTGG
+GCGAGCGAATTCCGGGTGAGGCAGCGCTCAGCGAAACGCTGCGCCGACGCCGAGCCAGTGGCGGCCCCGC
+CGAACAGACCTTTGCGACGTTGGTCGGGCTGGAGCTGCGGCCACGCAAACTGCGGGAGGCCGGAGCGCTG
+TGGGAGCGCCTCACCCGGGCCGTCGGCATGGACGCCCGCGACGCCGTCTGGCAGCACCCGGACCTGCTGC
+CCGCCACTGACGATCTCGACGACCCGGCCGCCTTTATCGACCGTGTCATCGGCGGCGACACCAGCGGTAT
+CGACGAAGCGATCGCCGAACTCGAGCGGGACCAGCAGGCCCGCGGCGCCGACGACTCCGGCCACGATGGC
+GGTCCTGTGGATAACTGAGCGGTGTGTCTGCTCGCAGTGTGGCACCGTCTCAGGTCATGCGGCGGGCTGC
+GTCTGCTCTGTATTCGTTGAATCCTGCGATGCCGGTGCTGCTAAGACCCGACGGTGCCGTGCAAGTGGGC
+TGGGATCCTCGTCGGGCTGTGCTCGTCCGTCCACCGCGTGGATTAACCGCGACAGGTTTGGCCGCGCTGC
+TGCGGTCCATGCGATCACCGATACCAATCACCGAGTTGCAGCGCCAAGCCGCCGAGCGTGGATTGGTTGA
+CGGTGACGCCATGGCGAACCTTGTCGCGCAACTGGTTGGCGCGGGTGTAGCGACCCCCCTAGCCAACCCC
+GGAAACCTGGATTCCCGGCGTCGCGCCGCGTCCATCCGGGTCCACGGTCGCGGGCCGTTGTCAGACCTGC
+TCGTCCAGGCGCTGCGCTGCTCCGGTGCCCGGATCAGGCACAGCAGCCAACCACATGCGGCGGTGACTCC
+CGCGGGCGTGGATCTGGTGGTGTTGTCGGACTATCTGGTGGCCGATCCGCACATGGTGCGCGATCTGCAC
+ACCGAGAGAGTTCCGCATCTTCCCGTTCGGGTTCGTGACGGCACCGGGATGGTCGGGCCCCTGGTGGTCC
+CCGGCGTGACCAGCTGTCTCGGTTGCGCTGACCTGCATCGCAGCGACCGCGACGCCGCGTGGCCGGCCAT
+CGCCGCCCAATTGCGGGACACCGTCGGGGTGGCCGACCGGGCCACGTTGTTAGCGACGGCGGCGCTGGCG
+CTCAGCCAAGTGAACCGGGTGATCGCCGCCGTGCGTGGACAGGAGGCGACCCCTGAGCCCCCGTCGGCGC
+TGAACACCACCTTGGAGTTCGATCTCAACGCTGGCTCTATCGTGGCGCGACAATGGACCAGGCATCCGCG
+GTGTTTTTGTTGACGTTACGTCTAACCCAGTCGTCCCTGCTCCGGCACGTTGGTCGAGATTGACGCATAG
+GCTCTGGCCAAGGTGTCGAGCACGTCCTCTGTCAGGGTGCGCTCGTTGCGGTGCTTGTCCAGCGTTTCGA
+TGATCGCTCTGAACAGGGCGTCGGCAGCGTCGTGCTGCGTTGATCTTGCTGACATGGTTTCTTGCGGTCC
+ACCCTCCTGCACATTTCACTGATGCGGCCAACACCACAACGCTTGTCGGCGCTTGTCGGCGCTTGTCGAC
+GCTTGTCGACTCGGGGCAAGCTCAACCGTCCGCACCCAGGCAGTTGTTACCAGATCAACACCCCGACCGG
+ATAACCGTCATGGATGATGGGAGTGTGTCAGATATCAAACGGGGCCGCGCCGCGCGCAATGCGAAGCTGG
+CCAGCATCCCGGTCGGCTTCGCCGGTCGGGCGGCGCTCGGGCTCGGCAAGCGACTGACCGGTAAGTCAAA
+AGACGAGGTTACCGCCGAGCTGATGGAGAAGGCCGCCAATCAGTTGTTTACCGTCCTCGGCGAACTCAAG
+GGTGGCGCGATGAAGGTCGGCCAGGCGCTGTCGGTGATGGAGGCCGCCATTCCCGACGAGTTCGGCGAAC
+CCTACCGGGAAGCACTGACCAAGCTGCAGAAGGACGCCCCACCGCTGCCCGCCAGTAAGGTGCACCGGGT
+ACTCGACGGACAGCTGGGCACCAAATGGCGGGAGCGGTTCAGCTCGTTCAACGACACCCCAGTGGCATCT
+GCCAGCATCGGCCAGGTGCACAAAGCAATCTGGTCGGACGGCCGAGAAGTGGCCGTCAAGATCCAGTATC
+CCGGCGCCGACGAGGCGCTGCGCGCGGACCTCAAGACCATGCAGCGCATGGTCGGCGTGCTCAAACAGCT
+CTCACCCGGCGCCGACGTCCAAGGGGTGGTCGACGAACTGGTTGAACGCACCGAAATGGAACTCGACTAC
+CGGCTGGAGGCCGCCAACCAGCGCGCCTTCGCCAAGGCGTACCACGACCACCCGCGCTTCCAGGTGCCTC
+ACGTCGTGGCAAGCGCACCGAAGGTGGTGATCCAGGAGTGGATCGAAGGTGTGCCGATGGCAGAGATCAT
+CCGTCACGGGACCACCGAGCAGCGTGATCTGATCGGTACGCTGCTCGCCGAGCTCACCTTCGACGCACCA
+CGGCGGCTGGGGTTGATGCACGGCGACGCCCACCCCGGTAATTTCATGCTGCTGCCCGACGGCCGGATGG
+GCATCATCGACTTCGGTGCCGTGGCACCGATGCCCGGCGGCTTCCCGATAGAGCTCGGGATGACGATTCG
+ACTGGCCCGAGAGAAGAACTACGACCTCCTGTTGCCGACGATGGAGAAGGCCGGGTTGATCCAGCGAGGA
+CGACAGGTGTCGGTTCGCGAGATCGACGAGATGCTGCGCCAATACGTCGAGCCCATCCAGGTCGAGGTCT
+TCCACTACACCCGCAAGTGGTTACAGAAAATGACCGTCAGTCAGATCGACCGCTCGGTTGCGCAGATCAG
+AACGGCGCGCCAGATGGACCTGCCGGCCAAGCTCGCGATTCCGATGCGGGTTATCGCATCGGTGGGCGCG
+ATCCTATGCCAGCTGGACGCGCATGTGCCGATCAAGGCCCTGTCGGAGGAGCTGATCCCGGGTTTCGCCG
+AGCCCGACGCGATCGTCGTCTGAGCCGGCTCGCGCCGGCGGGCGCACCATCGCGGGCTATGCAACAGCAT
+CCTTGCGCGGACGTCCGCGCGGACGCTTGTGACTCACGATCGAGCCTTGGTCGAATATCTCACCACCCCA
+AACGCCCCAGGGTTCAGCCCGCTGAAGCGCCGCGGCCAAGCACTGCCGCCTGATCGGGCAGCTCACACAC
+AGTGTCTTGGCTACCTCGAGACCGGCCGGGGTATCGGCGAACCACAGATCGGGATCACCGACGTGGCACG
+GCAAAACCGGCAATCTTTGTCTGGGGGTCTGTCTGGGGACTGTCAGTACCGACACGTCCTGTTTCACCTG
+CTTCCTGGTCTGGTGGCGGTTCTTCGAAAGTGATCCGGACCAGGGATGCTGCGGTGGGCAGATGTCCCGA
+AAGTTTGGCCACGGATCCTGTGACTTCGGGTCCGTGGCCATCTGGCGAAACGGGGCTGATTACGTAGCGC
+TTACGTAGAGCCCCGCTCCACGGACTCGTCAGTCGCGGCGGCGACACGGTTCTTGCTATGGGGGGTTCCC
+GCGGTTGGCACCGCGGCAGCCGCGCCGACACCAAATGCGTTGTTGTCAATCACCGCGGCCGCCCTCCTCT
+CGTGTCGCGCGCGGTTGCCAGCCCCCCAATGCCATCTCCAGGCTGGCAGCAGAATGCGACCTGGAGGTTA
+ACCGGTGGCAGCAGCTGACCACAACCGATTTTCTGACCTGCGCGTTTGCCGGTACAGGCCCGGTTCAGGT
+CCGACCGCGAACCAGCTGCAGCACGTCCGATCCGTATTGTTCCAGCTTGCGGGCACCGATGCCGGGGATC
+GCGATCAGCGCCGCGTCGTCGGTAGGTAGCAGCTCGGCGATCGCGATCAGGGTGTTGTCGGTGAAAACGA
+CATAGGCGGGGACGTTCTGTTCCTTGGCGGTGCTCAGACGCCAGGACTTGAGCTGCAACAACAACTCCTC
+GTCGACGTCGGCTGCACACGTCTCACACCGCCGCAGCATGACGGCCGCCGAAGTGTTCAGCTCGTTGTTA
+CAGATCCGGCAGCGCGCTGCGGCGCCCCGGTTGCGTCGGGATGTGCCCGGCACCGGATCGGCGCGCGTCT
+GCGGCGCAATGCCGTTGAGGAACCGCGAGGGCTTGCGGCTCTGGCGCCCGCCCGGGGACCGTGATAGCGC
+CCAGCTGAGCGCCAAATGGACTCGGGCCCGTGTGATTCCGACGTAGAGCAGCCGACGCTCTTCCTCTACG
+GGCTCGCTATTGGGGCCGTGTGCCAGCGCATGTGAGATGGGCAGCGTGCCGTCAGCCAATCCGACCAGGA
+ACACCGCGTCCCATTCCAGTCCCTTGGCGGCGTGCAGTGAGGCCAGCGTGACGCCCTGCACCACCGGTGG
+GTGCCGCGCCTCCGCCCGCCGGCGTAGCTCGGCAAGCAGGCCTGGCAGCTGCAGTGCGGGACGCTGCGCC
+AGCTCGTCGTCGACCAGCTCGGCCAGCGCGGTGAGCGCTTCCCAGCGTTCCCTGGCGCGGGTGCCGACCG
+GCGGTTGTGCCGTCAGCCCCAGTGGTGCGAGCACCGCGCGAACCACGTCGGACAACGCGGCATCGGTATC
+ACGTTCGGACACACGCTGTAAGGCAAGCAACGCCTGCTTGATTTCCTGACGGTTGAAAAACCCCTCGCCA
+CCGCGAACCTGATAGGCGATACCCGCCTGGGTCAACGCCTCTTCATAAACCTCTGACTGCGCATTGACTC
+GGTAGAGAATGGCTACCTCGGATGGCGGAGTGCCCGATGCGATTAACCGGGCGATTGACGCCGCCACCGT
+GGCAGCCTCGGCGGGCTCGTCGGAATGCTCATGGAACGACGGGACCGGACCCGGCTCACGCTGGCCGGAC
+AACCGTAGCTTGCTGCCGGCAACACGGCCCCGGGCGGCGGCGATCACCCGGTTAGCCAATGACACCACCT
+GCGGAGTTGACCGGTAATCACGCTCCAGCCGCACCACCGCGGCGTCCGGGAACCGCCGCGAGAAGTCGAG
+TAGGAAACGAGGCGAAGCCCCGGTAAACGAGTAGATGGTCTGGTTGGCGTCGCCGACGACGGTCAGGTCG
+TCCCGATCACCCAACCAGGCCGAGAGCACCCGCTGCTGCAGGGGGGTGACGTCCTGGTACTCGTCCACGA
+CGAAACACCGGTACCGGTCCTGGAACTCCTCGGCCACCGCGGCGTCGTTTTCAATCGCGGCCGCGGTGTG
+CAGCAACAGGTCGTCGAAGTCAAGTAAGGTGACGCCGTCGCCGCGGGCCTTGAGCGCCTCGTATTCGGAG
+TAGACAGCCGCGATTTGCGCGGCGTCCAACGGGGGGTCTCGGCGTGCGGCCGCCACTGCGGTCACATACT
+CCTCGGGGCCGATCAGGGACGCCTTGGCCCACTCGATCTCGCCGGCCAGGTCACGCACATCATCGGTGCT
+GGCGTGCAGCCTGGTGCGGCTGGCGGCGCGGGCCACCACGGCGAACTTGCTGTCCAGCAGCTGCCAGCCG
+GTGTCAGCGATTACGCGCGACCAGAAGTACCGCAGCTGGCGATACGCGGCCGCGTGAAAGGTCAGCGCCT
+GCACAGCGCCGACGCCCGAACCGGTCCGTGCCGCGGCGTCGAGTGCGCGCAACCGGCTGCGCATTTCGCC
+CGCCGCGCGCTGGGTGAATGTCACAGCCAGCACCTGCCCGGCGGCGACGTGACCGCTCGCGACCAGCGAA
+GCGATCCGGTGAGTGATGGTGCGGGTCTTGCCGGTTCCGGCACCGGCCAGCACGCACACCGGTCCACGCG
+GAGCCAGTACGGCTTCGCGCTGCTGGTCGTCCAGCCCGGCAATCAATGGGTCGCTGGCTATCGACATGAC
+GTCCATCTTGGCAGCGGTAGATGACAGACCGGGCGTGTCGCCACGCCGTGGGGCGTGCGACATGAACAAC
+TGCCGAGCCGCCACACCGCCCGGGTCGTCGCCGCGCTAGGTTAGCGTGTCATGATCACCGCTGCGCTCAC
+CATCTATACGACATCATGGTGTGGCTATTGCCTTCGACTCAAAACAGCGCTCACGGCCAACCGAATCGCT
+TACGACGAGGTCGACATCGAACACAACCGTGCGGCCGCGGAGTTCGTCGGCTCGGTCAATGGCGGCAACA
+GAACTGTTCCCACGGTGAAGTTCGCCGACGGGTCGACGCTGACTAACCCGAGCGCGGACGAGGTCAAAGC
+GAAGCTGGTAAAGATCGCGGGTTAACGACGTGGACTTTCATTCGCACGCTGCCCACGATTCGATGATCAC
+GCGGGCGATCGAGATCGACCCGGGCAGTAGCAGTTTCGACTCCGACGCACTGGACCAATCGCCGGCGGCA
+AGCGCTGCGCGCACCTCATCGCGGGTGAACCACGCGGCTTCGGCGATTTCGCCGTCGCTGAACGAGAACT
+CCTCATCCGGGTCACCCAAGGCATGAAAGCCAACCATTAACGACCGCGGGAACGGCCACGGCTGGCTGCC
+CAGATAGCGCACATCGCGAACGGTCAGGCCGATTTCCTCGCGGATCTCCCGGGCGACGCAGACTTCGAAC
+GACTCTCCGGCCTCGACAAAGCCAGCCAACAGCGAGAACATCCGTTCCGGCCACGCCGCCTGGCGAGCCA
+ACACGGCACGATCAGCGCCGTCGTGAACCAGGCAGATCACCGCCGGGTCGATACGGGGGAACTCCTCATG
+ACCGGTGATCGGGTTGACCCGTGACCAGCCGGCCCTGGCCGGTTTCGTCGGCGCGCCGTCTAGGGCGCTG
+AATCGTGCGTTGTCATGCCAGTTCAACAGCGCCGATGCCGACGACACCAGTTGGCTGCTGGTGTCGTCCA
+TGATTCGGCCGAGCCCACGAAGGTCCACCGCCTCGGCTGGTATGTCGGGATCAGCGATCGGCTGCAGCGC
+TGCCCGCACCGCCCAGACGTGGCGGCCGCCCTCGACGCGACCCAGGAATACCGCCTCTGGCGGTGGCTTG
+TCGGCCAGCTCGATGGCCGCGCCAAGCAACACCCGGCCGTTGGCGACCAGCACGCGATTGCGGGAATCCA
+CCCGCAGCAATGCCGCGCCTGGCCATCCCGCGGCGGCCGCCTCCATGTCGGTCCTCAGCCGGTCGGCCCG
+GTCGGCGCCGACGCGCGAAAGCAACGGAACGCTTCTCAGCTGAAAATCCACGCCGCTTACGTTCGTCACT
+GGCGCCCCACCTGGTGGCGACCCGCCGCGCCCGGCTCCGCCGCGCTTGCGATCGCCACTAGCGCCCCACC
+TGGCGAATATAGAGCAGCCGGTCGCTGGCCTCGATGGCGTCCACCTCGGGCGCCCCAATGCGCAGCAGCT
+GGCCGTCACGTACCACGCCGAGCACGATGTCGCGCAGGTGCCGCGGAGACCCGCCCACCTCGGCCTGCTC
+CACCTCACGTTCGGCAACGGCCAGGCCGGCTTCCGGGGTCAGCAGATCCTCGATCATCTCCACGACGCTG
+GGCGTCGTGGTAGCGATGCCGAGCAGCCGCCCGGCGGTCTCGGAGGAGACCACCACCGTGTCCGCACCCG
+ACTGCCGCAACAAGTGCTGGTTTTCGGCCTCCCGGATGGACGCCACGATCTTGGCTTTGGGCGCAATCTC
+GCGCGCCGTCAACGTGACGAGCACAGCGGTGTCGTCGCGACTGGTGGCGACGATGATCGAAGACGCATGC
+TGAGTGCCGGCCAACCTCAGCACGTCGGACTTGGTGGCATCACCATGCACGGTGACCAGACCGGCTGCCG
+CGGCACGTTCGAGGACACCCGAATCGGTGTCGACGACCACAATTTCACCCGGAACTAACTCGTCACTGAC
+CATCGCGGCCACCGCCGTTTTGCCCTTGGTGCCGTAGCCGATGACGACGGTATGGTTGCGCACTCTGCTC
+CTCCAACGCTGGATCTTGTACGCCTGACGGGATGTTTCCGTGAGGACTTCGAGAGTCGTGCCGACCAACA
+AGATCAAGAACGCAATCCGCAGCGGTGTGATGACGAAGATGTTGATCGCTCGCGCGAATTCGGAAATGGG
+CGTGATGTCGCCGTAGCCGGTCGTCGACAGCGTCACCGCAGCGTAGTAGAGGCAATCCAGAAACGTCAGC
+CGATCGCCCTGGGCGTCGAGGTAGCCGTCGCGGTCGACGTAGACGATCCCGGCGGTGAGCAGCAACGCCA
+CCACAGCGACGACCACCCGGCGTGAAATAACGCGAGCTGGACTGGCCCGCCTTTGGGGAATGCGCAGCAC
+GCCGACAAGCGCGTAACCAGGCTGCGCGGTCAGCTTCTCGTCGAGCCCCCGCAACCGCCGCCAGCTACCG
+GCCACCGAAATCCGTCACCGGTTAGCCCCAATGCACGCCAAACGCACGACACAAATGGTAACCACGTCAG
+GTGTCCGACCGCCGACCGGCGCAGTCGGTCAGTAGCATGGCCAACTCGCCGGGAGCGGGTAACTCGTCGG
+GGACGACCGTGATGCCGCTGCGCACGTAATAGAAGGCGGTACGCACCGAGGATGTCGGACATCCCCGCAA
+TGCGGCCCAGGCCAGTCGATAGACAGCGAGCTGGACAGCGGCCTGCCGCATGGCTGCCGGCCCGTGCGGC
+GGCTTGCCGGTCTTCCAGTCCACCACGGTGGCACCGCCGTCGGGGTCGACGAACACCGCGTCGATGCGGC
+CGCGCACCACGGTATCGCCGATCGGCATTTCGAACGGCACTTCGACCGCCGCCGGGGTGCGAGCCGCCCA
+CGATGATGCGGTGAACGCCCTCTGCAACGCGGCCAACTCCTCAGGATCGCCCACCTCGCGGTCCGCTGCA
+CCTGGCAGGTCACCCAGGTCAAACAGCAGTTCAGCACCGTAAAATTGCTGAACCCAGGCGTGAAATGCAT
+CGCCCAACCACGCGTGCGGGTCCGGGCGTTTTGGCAGCCGACACATCAGCCGCTGCCGCGCACCGACCGG
+GTCGCCGACCAGCTCCACCAAACTGCTGACCGACAAATGGTTCGGCAGACCACGGGCAGGTGCTCCCCGC
+GCCGCGTGCGCACGTTCAGCCAACAGTGCATCGACGTCAGTGGACCAGGGGGCATCGCCCGGGCGCGGGG
+GATGATCGATGTCGGTGGTGCTTCCGGGCAAGTCGGCCGACATGGCCGCCGCCACCAGCGCCGCGCCCCG
+CTCCACATCGCCGCGACGTGCGGCCAACGGATCAGCGGGCCAAACCGCCTCGATAGCGTTGTCACACAAT
+GGGTTTCGCTCATCGCCGGCGGGCGCCGACGCCCACTGCTCGACGACTCCGCAAGGATCACCGGCAGCGG
+CCGAACGGTCAATGATGTCCTTGAGTTCGCACAGGAATTCCGATGGCCCGCGCGGCTTTGTCCCGGTGGG
+CCCCCAATGGTGGCCGGACACCAGCAGAGTGTCCTCAGCCCGGGTAACGGCCACGTACAACAGTCGACGC
+TCCTCGTCAACGCGCCGCCGATCGAGCAGGCGACGATGTTCGGAGATCTTGTCCGACAACTGTTTTCGGT
+CAGCGACAGCTGACGTGTCCAGTACGGGGATGCCGTGCGCGCCGGCCGAGGCGCGATCCCCACGCAGCAG
+CGGCGGTAGTTCGGCGGGGTCGGTAAGCCAGCTGCTGCGCGACACCGTCGACGGAAACACTCCGCGCGAC
+AGGTGTGCCACCGCCACCACCTGCCATTCCAAGCCCTTGGCGGCGTGCACGGTCAGCACCTGGACCCGGT
+CGCAGGCGACGGTCAACTCGGCAGGCGGCAAACCGTTCTCGACCACCTCGGCGACGTCCAAATAAGCCAG
+CAGGCCCGCAACCGACGCCTCGCTGGACCTAGCGCTGGCCCGTTCGGCGTACCCCGCGACCACGTCGGCG
+AACGCATCAAGGTGCTCGGGTCCGGCCCAGCCACCTGAGACCGGGGCCGAGGCCCGCACCTCGCAATCGA
+CGCCAAGCACGCGGCGCACCTCGGCTACTAGGTCGGGCAGGGAATGACCGAGGCGACCGCGCAGCGCGCT
+CAGTTCACCGGCCAAGGCGCCGATGCGCCCATATCCCGCCACCGAATACCCCTCGGCGGAACCTGGATCG
+CTGATGGCGTCGGCCAGACACGGATTGTCGGCGTCCGCGCTGGCCGCCATCGCGATCGATTCGGGCGACG
+CCGTTGACGGTGATTCGCCACTCAGCGTCAGCGCACGCCGCCACAGCGCGGCGAGGTCCCGGGCGCCGAG
+CCGCCACCGTGGGCCAGTCAGCACCCGCATCGCGGCCGCCCCGGCCGTTGGGTCGGCAACCAGGCGCAGC
+ATGGCCACCACCTCGGCGACCTCGGGGATGGACAGTAGGCCGGCCAGCCCGACAACTTCAGCCGGGATTC
+CGCGGGCCCGCAGGGTATCAGCGATAGCGGCGGCGTCGGCGTTGCGGCGTACCAGCACCGCCGCGGTGGG
+CGGCTTGACACCGTCCGCTTCTGCCCGCTGGTAACGCATCCGCAAGTGGTCGGCGATCCATTCGCGTTCG
+GCCTGCACGTCGGGAAGCAACGCGCAGCGGACGGCTCCAGGCGGGGCATCCGGACGCGGCCGCAACGCGC
+GCACCGCAACCGAGCGCCGCCGCGCCTCCGCCGATATGCCATTGGCCACGCGCAGCGCTTGCGGCGGGTT
+GCGCCAGCTGGTCAGCAGCTCCAGCACCGGCGCGGGGGTGCCGTCCGATAAGGGGAAGTCGGTGGTGAAC
+CGGGGCAGGTTCGTCGCCGAAGCGCCGCGCCACCCGTAGATCGACTGAATCGGGTCACCGACAGCCGTCA
+GCGCCAACCCGTCATCAACGCCGCCGCCAAACAGCGACGACAACACAACGCGCTGCGCGTGCCCCGTGTC
+CTGGTATTCGTCCAGTAACACCACCCGGTAGCGCCTCCGCAGATCCTGGCCAACTTGGGGAGAGGTCGCC
+GCCAACCGTGCGGCCGAGGCCATCTGCATGGCGAAATCCATCACTTTGCCGGCGTGCATCCGCTCACCCA
+ACGCGTCAAGCAACGGCACCAACTCCGCGCGCTGGGTCTGGGTGGCCAGCATCCGCAGCAGCCACTGGCT
+GGGGCCGCGGTCACGCTGATAGCGGCCCGCCGGCAGAGCGTGGACCAGCCGTTCCAGCTCGACGTGGGTG
+TCGCGAAGCGCGCGGGTGTCGACCAGATGCTCGCCAAGCTGGCCCCATAACCGCACCACGATCGAGGTGA
+CCGCCGCCGGGCTCTTGTCGGTGCACAGCACGCCGTCGTACCCGCTGACCACATCGAATGCCAGCTGCCA
+CAGCTCGGTCTCGCTCAGCAACCTGGTATCGGGTTCCAGCGGTAGCAGCAGGCCGTAGTCGCGTAGTAGC
+GAGCCGGCAAAGGCGTGGTAGGTGCTGACTACCGGAGCGCAGGCCGCCGGGTCGCCGCAGCCGAGGCCGA
+TACCGGCCAACCTGGCCAGACGGGACCGAACGCGGCGCAACAGCTGGCCCGCGGCCTTGCGGGTGAACGT
+CAATCCCAGCACCTGGCCGGGTTCCGCGTAGCCGTTGGCAACCAGCCACACCACCCGGGCAGCCATCGTT
+TCGGTTTTTCCGGCGCCGGCTCCCGCGATGACGACCAGCGGGCCGGGAGGTGCGGCGATTACCGCGGCCT
+GCTCAGCGGTGGGCGGGAAAAGTCCTAGCGCGCAGGCTAGTTCAGCTGGACTGTAGCGTGCCGGTGCCGC
+GGTTTGGGTCATGGCGCCGACCCTCGGACGTGGGCCGGACAGCCCGGCCGCAGCGGGCAGTGGGTGCACC
+CGTCGTTGCGCCGAGCGATGAACTGGGGACCGGCTGTCGCCGCGGCCAGCTGCCGGACGAGGTTGCGCCA
+TTCGTCGCGCGCGGCCGGTGTGAGTGGATCCTGTTTGCGTTCGGCGACGCCAGCGGCCCCGCTTTTGCCG
+ACATAGACCAGCCGGGCACCGCCGGGCTCGTCCCCGGCGCGCACCAAGCCTTCGGCCACCGCCAGCTGAT
+ACATCGCCAGCTGGGCGTGCTGCTGGGCATCGTCCTTGCTGACCGGTGTCTTGCCGGTTTTGATGTCGAC
+GATCACCAGGCGGCCGGCCGGGTCGCGTTCCAGCCGATCCGCCCGGCCACGCAACCGAATTTTTCTGGCT
+TGACCGCTACCGTCCTCGAGGGCCCCATCGATGTCGACCTCCACGCCAACTTCGGTCAGCTCGGATCGAC
+TCTGAGCTCGCCACTGTACGAACGCCTGGATCATCGCGCGGTGCCGGGCAAGCTCGTTGGCCGAATACCA
+CTGAGCGCCGAACGGCAGATGGCCCCACACCCGGTCCAGTTCAGCCAGCAGTTGGGATTCGCTCCTGCCC
+GGCTCGGCAAACAGTGCGTGCAACACCGATCCGACGGCAGACGGCAGCTCGCGGGTGTTTGTTCCGCCGT
+GCCGCTCGGCCAGCCAGCGCAGTGGGCAGTCGTTGAGTGCCTGCAAAGTCGACGGCGTCAACGTGACGAG
+ATCGTCGCTATCGCACAACGGATCACTCGTGCTGACCGGGGCCAGGCCATGCCACTCGGACGGGTCGGCA
+CCTGGCACACCGGCTTTGGCCAACCGGGCCAATTGCGTTGCCGCACAATCGCGATCGGCGTCATCTACCG
+CGCAGGCAGGCGCGCACACCACAGCGCGTAACCGGCCTACCACCGCCGCAGCCGACAACACGCGCGGCGC
+CGAGACCGGCTGCATCGCGACGGGTTCGCCATCGCCGTCGGCCCACTGGGCAATCTCGAAAAAGAACGCC
+GATGGCAGCACCGCCTCGTGCCCGCCCCCGCCCGCGTCGCTATCTACGGCGGTCACCAGCAACCGCCGCC
+GGGCCCGCCCCATCGCGGTCACCAGCAGCCGGCGCTCCTCGGCCAGCAACGGCGCGCGCATCGAGGCATC
+CTTCGTGACACCGTCGAGTTCGTCCAGCAGCCGCTGGGTGCCAAGCACACCGCCACGTGGAACCGTGTTG
+GGCCACAAGCCGTCCTGTAGGCCGGCGATAACTACCAGATCCCATTCGTGTCCCAGCGCGGCATGTGCGC
+TAAGGACCATGACCTGCTCTGTCGGGGCTGCCGGTTCGGGTCGCACAACCGGCAGCTGCAGCGCGGTGAC
+GTGCTCGACGAGTCCGCGCAGGGACGCACCCGAGGTGCGGGACACGTAATGGTCGGTGATGTCGAACAAG
+GCGGTCACCGTTTCCAGGTCCCGGGTGGCCTGGACAGCCGCCGCACCACCATGCTCGCTGGCCGCCAGCC
+AGCGGCGTTGCAGACCCGACCGTTGCCAGGCAGCCCATAGCGTGTGGCGCGGATCCTGGCCACCCAGACT
+TCCTGAGCGGTGGCAGCGCGCGGCCGCGGTCAGCACGGCACGCACGCGCCGCAGTGCCCGCGACCCTGGC
+CCCGATGGCGGCGCGTCGCCGCCGAGCACTTCCACCAGCAGGTCGCCGAACTTCCTCGAAGTCTGGCCGG
+GACGTGCGCGTTGCAGAGTCCGGCGCAGCTGGCGAAGTGATACCGGGTCCACACCACCAATCGGCCCGGT
+GAGCAGGAGCAGCGCCTGGTCGCCGTCGAGCCCGTCAGCCGTCGCCTCGAGCACCGTGAGCAGCGCCCGT
+ACCGCCGGCTCCGCGGACAACGGCCCGCCAACTGCAGGTGGGGCCACCGGCACCCCGGCGGCGGCCAGAG
+CGCGCGGCAACCGCACAGCGCGCGGCACCGACCTGACGATCACCGCCATCTGCGACCAAGGCACCCCATC
+GATCAGGTGCGCGCGTCGCAGCGCGTCGGCAATCATCGCTGCCTCAGCGTGCGCCGAACCGGCCAGGCGC
+ACCGTCACCGATCCGACCTCGGTCCCGGTGCCCTCGATTCGCCGACCGACGCTTCGACCCGGTAGCCGTC
+GTGCGATGCCGGTGACGGCCCGCGCCACGGCGGGTGCACACCGATGAGAGACCGTCAACGTCACCGACGG
+AATGGGGGCACCACCTGCTGGCGGCGGATCGTCGGCCAGCAGGCCGGTGGGCTCGCCGCCGCGGAACCCG
+AACACCGCTTGGTTCGGATCACCGGCGATCAGGGCCAGCTCGGTGCCCGCCGCCAGCATCCGGACCAGGC
+GTGCCGCCTGCGGATCAAGTTGTTGGGCGTCGTCGACCAAAAGGGTCCGGACCCGGGCGCGTTCGGCGGC
+CAGTAACTCAGGATCGACCGCGAAGGCCTCCAAAGCTGCCCCCACCAGTTCGGCGGCACTCAGCGCCGGC
+GCCGTGGCCTGCGGCGCCGCCAGCCCCACCGCACCCCGCAACAACATCACCTGCTCGTACCGCTGGGCGA
+ATTGACCGGCGGCGATCCATTCCGGACGGCCGCGGCGACGGCCCAGTTGCTGCAACTCCAGCGGGTCCAG
+GCCGCGTTCGGCGCAACGTGCCAACAGGTTTCGCAGCTCGGTGGCGAAGCCGGCGGTAGTCAGCGCGGGC
+CGCAGATGCGCAGGCCAGGTGGTGGTGGCGGCCGGTCCGTCTTCGGCGTCCCCGGCCAGCAGTTCCCGAA
+TGATGGCGTCCTGCTCGGCGCTGGTAAGCAGCCGCGGCAAGGCGTCACCGGCGCGCTGTGCGGCCTTGCG
+CAAGACCGCATAGGCGTAGCTGTGCACGGTGCGTACCACCGGTTCGCGGATCGCCGCCCGGCAAGGGCCG
+TTGGTGCGCGACCGCAGCAGCGCCGTCGTCAGCGCACTGCGGGCCCGCATGCCCATTCGGCCGGAACCGG
+TCAGCAGCAGAACCGACTCCGGGTCGGTGCCGGCGCCGATGTGAGCGACCGCGGCCTCAACCAACAGTGT
+GCTCTTACCGGTGCCCGGGCCGCCCAGCACAAGCACCGGACCGCGCAAACCCGGCGCGAGGGCCGCACCC
+GCCTCGACACCCCAGATATGTGACATAGCCGCATGACATCACGAGGGTCTGACAAGCTCGGATACTGGAG
+CTGGCAAGAAAACCGAAAACGCGATGTGAGGGGTGGCTACCATGGCGGCGGTCGTAGGCGGCGGTCCACA
+GGACGAAATACCCGAAGCCGATGCGGTGGAGCAAGGGCGTGCTGTCGATTTCGACGACGAAGCCGGGTTG
+GACACCGCCTACCTCAGCGGCGGCGCCGGCGACCGAGACGCCAGCGAAGCCGACGTCGTCGACCAAGCCT
+TCGTCGTTCCGGTCGCCGACGACGAAGAAATCGACCGGTAGCAGGCGTCGCCGGGCTGGCATCATCGACG
+CGTGATCATCGACCTTCACGTACAGCGCTACGGCCCGTCAGGGCCCGCGCGGGTGCTGACCATCCACGGA
+GTGACCGAGCACGGGCGCATCTGGCACCGGTTAGCCCATCACTTGCCCGAAATCCCCATCGCCGCACCCG
+ATCTGCTGGGCCACGGTAGGTCACCATGGGCCGCGCCGTGGACCATCGACGCCAACGTGTCCGCCCTGGC
+AGCACTCCTCGACAATCAGGGCGACGGTCCGGTAGTGGTGGTCGGACACTCCTTCGGCGGCGCTGTCGCT
+ATGCACCTGGCCGCGGCCCGCCCAGACCAGGTCGCGGCGCTGGTGTTGCTCGACCCGGCGGTCGCTCTGG
+ACGGGTCCCGGGTACGCGAGGTGGTCGACGCCATGCTGGCCTCTCCCGACTACCTGGACCCCGCCGAGGC
+CCGGGCCGAGAAGGCGACCGGTGCCTGGGCGGACGTGGACCCCCCAGTGCTCGACGCCGAACTCGACGAG
+CACCTCGTCGCATTGCCCAACGGTCGGTACGGTTGGCGTATCAGCCTGCCGGCGATGGTGTGCTACTGGA
+GCGAACTGGCCCGCGACATCGTGCTGCCGCCGGTGGGAACGGCAACCACGCTGGTTCGGGCGGTCCGTGC
+GTCACCGGCGTACGTCAGCGACCAGCTGCTCGCGGCCCTGGACAAACGGCTAGGAGCCGATTTTGAGCTA
+CTAGACTTCGACTGCGGGCACATGGTGCCCCAAGCCAAGCCCACTGAGGTCGCGGCGGTGATCCGCAGTC
+GACTGGGACCGCGCTAGCCATGGCGCCGGTGACCGACGAACAGGTGGAGCTGGTGCGCTCACTGGTCGCG
+GCCATCCCACTCGGCCGGGTGTCCACCTACGGCGACATCGCAGCTCTCGCAGGGCTTTCCAGTCCGCGTA
+TTGTCGGCTGGATTATGCGGACCGATTCCTCGGATCTGCCCTGGCACCGGGTGATCAGAGCCTCCGGGCG
+CCCAGCACAGCACCTGGCCACCCGGCAGTTGGAGTTGTTGCGCGCAGAGGGCGTTCTCAGTGTTGACGGC
+CGGGTGGCGCTGAGCGAGATCCGCTATGAGTTTCCGCCGGGCTGAGTAGGTTTAGAGCACTAGCCGCACT
+AGGGCCGCGGTGTGGGCCAGGCCGGGAAACGCTTCGGCGGTGGATCGTGGGTGCAGCGCGTACACTGCTA
+GGCGGAACATCAACGCGCGCAACAACATCTGGGGCCACTCCGGCAGCGCGTTCCACCGCTCGATGAGCCC
+GTCGTCGGCCGCACCCCAGGACAGCGCGTCGACGACGGCCACCCCGGCCGCCCAGGATGCGGGCCGCCAG
+TAGGGCGTGATGTCGGTGATCCCTGGAGGGGCGGTGCCCGCGAAAAGCACTGTACCGTAAAGATCTCCGT
+GCACCAGCTGGTTCGGGCTCTTGGTCGGCTTACGCAACCCGGCAAGCTGATTGATCAGATCGATCGATCG
+CTGGGGGTCCGCTGCCGGGGGGGCGGTCGGCACGCCCGGTGGGACCGACTGTAATGGCCGCTCCTCCCAC
+CCAGCTCGGTCTGCGGCGACGAACACATCGATCTCGGCCCAGGGCGCCGCGGGTCCCTGGGTCAAGAATC
+GGGGGCGTTCCAGTTTTCCGGTGGCCTCATGCAGCCGCACCGCCGCCGAGACGACCTCATCATGCCTAGG
+CTCCGGCGCGCCGGCGACGAACGTGTCTGCCCGCCAACCAGACACCACGTACCGGCCGTCGGTCGATCGG
+ACGGGCCGAGCCAGGCGTACGCCGTCGACGAACAACGTCTCGCGCACCCGGGCCGACCAGGCCGCGCGGG
+CGTTGTCGGCCACCATCGACAACACCACCTCGCCGCATCGCCAGCCACCTTCCCAACCGGCACCCAACAG
+GATGGGTTGCGCACCTGCCAAACCGAACGCCACCAACACGTGCTCGGGCGGCGGCTCGACATTCACACCG
+GTCAGCCTAGTAGAGCCCATCGGGGTGTATTGGGCCTGTATCGGTCCTAGTACATCACCATGTCGGGCTG
+CATCTGCTTGGCCCACGCGACGATCCCACCCTGCAGGTGTACCGCGTCGGAGAAACCGGCTTTCTTGACC
+GCAGCCAATGCCTCGGCCGAGCGCACGCCCGTCTTGCAGTACAGCACGGCGGTGCGGTCCTGGGGGAGCT
+TGGCCAGACCCTCACCCGAGTTGATCAACGATTTCGGAATCAGTTGGGCTCCGTCGATATGCACGATGTC
+CCACTCCACGGGATCGCGAACGTCGATCAGTGCCAGCTTACGGCCGGAGTCCAGCCAGTCGCGCAGCTCG
+CGCGGCGTGATGGTGGAACCTTTGGCCGCCTGGGCGGCATCGTCAGCAACCACGCCGCAGAACTGTTCGT
+AGTCGACCAGCTCGGTGATCTTCGGTGTCGATGGGTCCTTGCGGATGGTGATCGTGCGATAGCTCATCTC
+CAGCGCGTCGTACACCAGCAACCGGCCAAGCAGTGTTTCACCTATCCCGGTGATCAGCTTGATCGCCTCA
+GTGCCCATCACCGATGCGACCGAGGCACAGATAATGCCCAGCACCCCGCCTTCAGCACAGGACGGCACCA
+TGCCCGGCGGCGGCTCGGGATACAGGTCGCGGTAGTTGACACCCAACCCGTCGGGGGCGTCCTCCCAAAA
+CACCGATGCCTGGCCCTCGAAGCGGTAAATCGACCCCCACACGTACGGCTTGCCAGCCAGCACCGCGGCG
+TCGTTGACCAGATACCGGGTGGCGAAGTTGTCGGTGCCATCCAAGATCAGGTCGTACTGCTTGAACAGGT
+CGACGGCGTTGCTCGGCGCAAGCCGCAGCTCGTGTAGTCGCACCCGGATCAGCGGGTTGATCGCGACAAT
+CGAATCGCGCGCCGACTGAGCCTTGGAGCGCCCGACGTCAGCTACCCCATGGATGACCTGGCGCTGCAGG
+TTCGACTCGTCAACCACATCGAAGTCGACGATGCCGATGGTGCCGACGCCGGCGGCGGCCAGATACAATA
+ACGTGGGCGCTCCGAGCCCGCCGGCGCCGATCACCAGTACTCGCGCGTTCTTGAGCCTCTTCTGCCCGTC
+AACACCCAGGTCAGGAATGATGAGATGGCGGCTGTAGCGAGCTACCTCTTCACGGCTGAGCGCGGATGCT
+GGCTCAACTAGTGGCGGCAAGGATGTCGACACCGAATATCTCCTCGGTTATATCCGAAACGTCTGCTGCG
+CGTCGTCCTGCAAATACCTCAACGCCCAGCTTGCCACCTTTGCTTCCCCGGGTTAGGGAATCGGGTAGGG
+CCAGGGATTGAATCGGCAGGTCTTTCCATCCGCCTTAACGAAGTCGGGGTCAAACTTGGCCGCGTCGTCA
+TTGGAGGTGGAAAACGTCTGCTGCATCATTACCGGAGCCAGACCGCCTTGTTGGTCGCACGGCTCGTGGC
+GCAGGTAACCGATGGCATGACCGACCTCGTGGTTGATCACATATTGCCGATAGGAACCTACGTCACCTTC
+GAATGGAACGGCTCCGCGTACCCAGCGCGCCTCGTTGATGAACACCCGCGATTGGCGATCCATGCCGCCG
+AACGACGGGTTGTAGCAGGACGTCTCGAGCCGGAATTCGTAGCCACACCCCCCGCGCACTGTCGTCGGCG
+ACACCAGCGAAATCCGGAAGTTGGGTTTTCCGCTGTCGATCCGCACGAACGCGAATTGCGGATTGTGGGT
+CCAGCCCTTGGGATTGGTCAACGTCTGGTCGACCATCTGGGCGAATGCGTTGTCACCGCCGTACATTGTG
+GGATCAAGACCGTTCTCGATCTCGACGGTATACCTGAACACTTTGACGGTGCCTTGACCGACCTGGGGAG
+TAGTGCCCGGAACGACACGCCAGGTCTTGTCACCAGCCTCGGTGAACGGGCCGCCATCCGGCAGCGTCCC
+GGCCGGCAGATTGGCATCGAACACTGCAAGACCGCGAGGCGGTGCGTCGAGGATCGCGGTCCCCACCACA
+CCAATGGCCGGCGAGTCCCGGACGGTCTGGGCCGCCGCGGGCCTTGGCGTGCTCGTCCCGGTCACCGTCT
+GGTACACCACCACCGTGGTCAGCACCATCAGAACCGGCAGGGCGTAGGCGCGCCAGCCGTACGTGGACAC
+GAACCGCCCCAACCAGGTTTGTTTGCGCCATTGACGCTTCCGGTCGCGGCGGGCCCGGACCCGTCTGTCA
+GTCGCGGCGAGCGGGTCGCGCAGGGCCCGCAGCGGCTCACGCCACTCGTCACGCAGCACGGGTACTCGAC
+TCGTGCTTCCGGCGGGCCACGGAGACGTCATTTCCTCAGGATGACACAGCTGGCCCGGGTCGCGACCCTG
+GCGCGCCCGAATGCAACACCCAACAAACTATCCCGCCGCTACCGATGCCGCAGGTAGTAATGTCATTCCG
+ACAGACGCGCGGCGGTGGGGGTTGGCACAGTGGCCCTCGAATTAGTGTGATCAGATTGAGGACTGATGAG
+CGATCTCGCCAAGACAGCGCAGCGACGTGCCCTCAGATCGTCCGGCAGCGCTCGGCCAGACGAAGACGTT
+CCGGCCCCGAACCGGCGCGGCAACCGACTGCCTCGCGACGAGCGCCGCGGCCAATTGCTTGTCGTTGCCA
+GTGACGTCTTCGTCGATCGGGGTTACCACGCGGCCGGTATGGACGAGATCGCGGATCGGGCGGGAGTCAG
+TAAACCCGTTCTGTATCAACATTTTTCGAGCAAGTTAGAACTTTACCTGGCTGTGCTTCATCGGCACGTG
+GAAAACCTGGTGTCCGGCGTGCATCAGGCGCTGAGCACGACTACCGACAACCGGCAGCGGTTGCACGTGG
+CCGTCCAGGCGTTCTTCGACTTCATCGAGCACGACAGCCAGGGTTACCGGCTGATCTTCGAGAACGACTT
+CGTCACCGAGCCCGAGGTCGCCGCACAGGTGCGGGTGGCCACCGAATCGTGCATCGACGCAGTGTTCGCG
+CTGATCAGCGCCGATTCCGGACTGGACCCGCACCGCGCCCGGATGATCGCGGTGGGCTTGGTCGGAATGA
+GCGTCGACTGCGCCAGATACTGGCTGGACGCCGACAAGCCGATTTCCAAGTCCGACGCCGTCGAGGGCAC
+CGTGCAGTTCGCCTGGGGCGGGTTGTCCCACGTCCCGCTTACCCGCTCGTAGCAACCTTTCCGGCGGACC
+CAGCTGCGGCGTCCACCCCGACGCCGAAGCCCACCCGGCGGGCGTCTGCGACACCGATCTCGACATAGGC
+GATCCTGGCGGTGTGAATTAGGAAGCGACGGCCCCGCTCGTCGGTCAGGGTCAGCAAACCAGAGTCGTCG
+CGCAGCGCGTTGCTGACGAGTTCTTCTACCTCACTGGGCGTCTGCGCACTGGAGAACACCAGCTCGCGCG
+GACTGTCCGTGATACCGATCTTGACCTCCACGGTGGCCCCTTCCATTGGCATTCCGTCACAGGCGTGTCA
+CCAGCAGGCTAGTAGACGCCCCTGGCCCCCATAACGGTTAGGTCTAGGCCAGCCCGACACGCCGCCAGAC
+ACCCCATCCGCCGGCAGGGGCTCGATAACATCAGCACCATCGGTAACACAGTTAACGACCTCTACGAGTG
+CGTTCGGAACGTCCGGGAAGTCCAGGACTACCCGGACGACGAGAGCTCGAGCGGCTTCGGGGCTGGCCGG
+ACCTGTTCGGAAGGCGAGTTTGCCTGGGCGGCTGACCGCCGATGGCGCCCGGTAGCTGCGATCCTCGGCA
+GTGTGGTGGCGCTTGGCGCGGTCGCGACCGCAGTCATTATCAACAGCGGAGATAGCACGTCGACCAAGGC
+CATTGTCGGGGCACCAGCCCCGCGCACGGTGATATCCACCTCGCCACGACCAACGGCCCCGACCAGCACG
+TCACCCCACCCTTCGCCCAGCACCTTGCGGCCGCAGCTCCCGCCGGAGACGGTCACCACGGTGGCACCGC
+CGGGCACCGGGCCTACTACCGTGCCGACGCGAACCCCCACCGCCGCGCCACCTCAGACTGCTGTGCCACC
+GCCGGCGCCGCTGAATCCGCGCACCGTCGTCTACCGCGTGACCGGCACCAAGCAGCTGTTCGACCTGGTG
+AACGTCGTCTACACCGATGCGCGGGGCTTCCCGGTGACCGACTTCAACGTGTCGCTGCCGTGGACGAAGA
+TGGTCGTTCTGAACCCCGGCGTGCAAACCGAATCGGTCGTCGCGACCAGCCTTTACAGTCGTCTCAACTG
+CTCGATCGTCAATACCGGCGCTCAGACGGTGGTGGCGTCAACCAACAATGCGATCATCGCGACATGCACT
+CGCTAGATCTGGGATCTAGCTGAGACCCAGTTCCCGCATGCGTTGGTCGTGGGTCTGCTGCAACCGGTCG
+AAGAAGGCACCAAGCTGGCTCAGTCCACCACTACCGGACACCACCAGGTCGACCAGCTCGTCGTGGTCGG
+CCAACACCAGCTGGGCCTGCGTTATCGCCTCGCCGAGCAGACGACGCGACCACAGCGCCAGTCGGCTGCG
+CTGTTTGCCGCTGGCCGTCACCGCTGCGCGCACTTCGGCGACGACGAACTGAGAGTGCCCGGTCTCCGAC
+AACGCCGCCCGCACCACGTCAGCAACCTCGTCAGGCAGCCCGTCGGCGATCTCCAGATACAAATCGGCGG
+CCAACGCATCGGCAACATAGGTCTTCACCAGGGCTTCCAGCCATGTGCTCGGCGTCGTCAGCCGGTGGTA
+GTTTTCTAACGCTGAGGTGTACTTCGACATCGCCGACACCACGTCGACGCCGCGACGTTCCAACGCATTG
+CGCAGCAGCTCGTAGTGCCCCATCTCGGCGGCGGCCATGGATGCCATCGAGATCCTTCCCCGCAGATCCG
+GGGCCATGCGCGCCTCATCGGTCAATCGGTAGAAGGCGGCAACTTCGCCGTAGGCCAGCAACGCGAACAA
+TTCGTTGACGCCGGGATGATCCGCCGGCAGCCGTGGCCTGGGTGAATCGGCCACCTGATCGGCGGATGAG
+GGCGATGGCATGGCAACACTCTAGTAGGCAGGCTCAGCGGCAAATGGGAACCTGCTGGCCGACCAGCTAT
+CATGCTCGTTAGGTGGCGGCATTGGTTCGACTGCCGCTACCGGCGAAATGTGCGTGCATGGAGTCTGCCC
+CGCCTGGACTGTGCTAGGGGCCGGCGACTCGGCGACGTAATCGGAGTCGGAACTCATGCGCGCGTGAACC
+GCGACAGAGAAACACCGACACACGACCGACACCGTCACCGAAAGGCCGCTTACCCTCGTATGACCGCAGT
+GAAACACACAACTGAATCAACATTTGCCAAACTTGGAGCCCGCGACGAAATAGTCCGCGCATTAGGGGAA
+GAGGGCATCAAACGGCCCTTTGCTATCCAGGAACTCACCCTGCCACTCGCGCTCGACGGCGAGGACGTGA
+TCGGCCAGGCCCGCACCGGCATGGGCAAAACGTTCGCTTTTGGCGTGCCGCTGCTGCAGCGCATCACCTC
+CGGCGACGGCACGAGACCGCTCACTGGCGCTCCGCGGGCCCTGGTCGTAGTCCCCACCCGCGAGCTGTGT
+CTACAGGTCACCGATGACCTGGCCACGGCGGGCAAGTACCTGACCGCCGGCCCCGACACAGACGACGCTG
+CCGCGGTACGGCGCCGGCTGTCGGTGGTGTCCATCTACGGGGGACGGCCCTACGAGCCGCAGATCGAGGC
+GCTACGCGCCGGCGCCGACGTCGTGGTCGGCACCCCGGGTCGGCTGCTCGACCTGTGCCAGCAGGGCCAC
+CTGCAGCTGGGCGGGCTATCCGTGTTGGTGCTCGACGAGGCCGACGAGATGCTCGACCTGGGCTTCCTGC
+CCGATATCGAGCGAATCCTGCGGCAAATTCCCGCCGACCGACAGTCGATGTTGTTTTCGGCGACCATGCC
+GGACCCGATCATCACGCTGGCCCGAACGTTCATGGTCCGGCCCACGCATATCCGGGCTGAGGCACCACAT
+TCCTCAGCGGTTCACGACGCGACCGAGCAGTTCGTCTACCGCGCCCATGCGTTGGACAAAGTGGAGTTAG
+TCAGCCGGGTGCTGCAGGCTCGTGACCGCGGCGCGACGATGATCTTCACCCGCACCAAGCGGACCGCCCA
+GAAGGTCGCCGACGAGTTGACCGAGCGCGGTTTCGCAGTCGGCGCCGTGCACGGTGATCTCGGACAGCTG
+GCACGCGAGAAGGCGCTCAAGGCGTTTCGCACTGGCGGCATCGACGTATTGGTGGCCACCGACGTGGCCG
+CCCGCGGCATCGACATCGACGACGTTACCCACGTGATCAACTATCAGTGCCCCGAAGACGAGAAGATGTA
+CGTCCACCGCATCGGTCGCACCGGCCGTGCCGGCCGAACCGGGGTCGCGGTCACCCTGGTGGACTGGGAC
+GAGCTGCCCCGTTGGAGCATGATCGACCAAGCACTGGGCCTGGGCTCCCCCGATCCGGCCGAGACATACT
+CCAACTCGCCGCATCTGTATGCCGAGCTGGCCATCCCGGCCACGGCCGGCGGTACCGTCGGCCCGGCGCG
+CAAATCGCAGGGCAGGCGACGTGACACCGACTGCGACGGCCAGAAAACGGCACAGCACGCCCGCAATACC
+CCCAGGCGTCGGCGCACCCGCGGCGGCAAACCCGTCACCGGACACCCCGGCACCAACCCAATCAGCAGCC
+CAATCGTGGGCGGCGACGCCACCTCGGAGCCGGGCTCCGGCACCGCATCAGATTCCGGGTCCGATGTTGT
+GTCCGGCTCCCGGTCCGGCAACGGCGAAGCTGCGCGACGCCGTCGTCGCCGCCGCCGACGCCCGACGCAC
+GCCCAGGACGGCTTCGCCGCGCGGGCTAACTGACCCGCCCACCGCATGGTTAAACCGGAGCGCCGCACCA
+AGACCGATATCGCGGCCGCCGCGACGATCGCGGTCGTGGTGGCCGTGGCCGCGTCGTTGATCTGGTGGAC
+CAGCGACGCCCGCGCCACCATCAGCCGGCCGGCGGCGGTTGCGGTGCCCACCCCGGCCCCGGCTCGCGAG
+GTCCCGACCTCGCTGAAGCAGCTGTGGACCGCCGCCAGCCCAGCCACCCGCGTTCCCGTGGTGGTGGGCG
+GAACAGTGGCTACTGGCGACGGACGCCAGGTGGACGGGCGCGACCCAGCCACCGGTGAGTCGCTCTGGAG
+TTACGCCCGAGACACCGATCTGTGTGGGGTGACCTGGGTCTACCACTACGCCGTCGCGGTCTATCGGTAC
+GACCGGGGTTGCGGTCAGGTCAGCACCATCGATGGATCCACCGGTCGCCGGGGAGCCGCCCGCAGCGGCT
+ACGCGGATCCGCGGGTGCGTCTTTTTTCCGACGGCACCACGGTGTTGTCGGCCGGGGACACGCGCCTGGA
+ACTGTGGCGTTCAGACATGGTCCGGATGCTGGCCTACGGCGAGATCGATGCCCGGGTGAAACCGTCGAAC
+CGCGGCCTGCAGTCCGGGTGCACGCTGGAGTCGGCGGCGGCCAGCTCGGCGGCCGTATCGGTGCTTGAAG
+CGTGTACGAACCAGGCTGACCTGCGGCTTGTGCTGTTACGCCCGGGCAAGGAGGACGACGAGCCCATCCA
+GCGCATTGTCCCGGAACCGGGGGCCCGGCCGGGTTCGGGCGCCCGGGTATTGGTGGTATCGCAGAACAAC
+ACCGCCGTGTACCTGCCTGCAAGATCAGGCGCGCAACCGAGAGTCGACGTGATCGACGAGACCGGCGCCA
+CAGTTTCGAGCACGCTGCTGGCCAAGCCACCGTCAACTTCGGCCGTGGCGTCGCGGACCGGCAACCTGGT
+GACCTGGTGGACGGGCGACGCGTTGTTGGTCTTCGACGCGGGCAACCTGACCCAGCGCTACACCATTGCC
+GCTGGCGAGACGACTGCGCCGGTGGGGCCAGGGGTGATGATGGCAGGTCAACTCCTGGTGCCGGTCACCG
+GCGGGATCGGTGTCTATGACCCGGTCAGCGGTGCCAACAACCGTTATATCCCGGTGACCCGGCCGCCAAG
+CACGTCAGCAGTGATCCCGGCAGTTTCTGGATCCAGGGTCATTGAGCAACGTGGCGACACACTAGTCGCT
+CTGGGTTGATCGCCTATGTTGGCGCGAGCAGACGCAAAATCGCCCGAAACCGATGGCTTTCGGGCGATTT
+TGCGTCTGCTCGCGCTACAGGTCCACCGTGAAGGTGGGCAGCGGCCTACCTGTCTTCCAGTGTTTGAGCA
+GCGCCTGCGCCAGCTCGCGGTAGGCCACCGCGCCTTTGTTCTTGCGCCCAGCCATCACCGACGAGCCCGA
+GGCGCTGGCCTCAGCGAAGCGCACAGTACGGGGGATGGGCGGAGCCAGCACCTGTAGGTCGTAGCGGTCG
+GCGACATCGAGCAACACGTCACGGGTGTGGGTGGTTCGAGAGTCGTACAGCGTCGGCAGTGCACCCAACA
+ACCGCAGATTCGGATTGGTGATCTGCTGGACATCGGCGACCGTCCGCAGAAACTGGCCGACACCCCGGTG
+CGCCAGCATCTCGCACTGCAGCGGCACGATGGCCTCGTCGGCGGCCGTCAGCCCGTTGAGGGTGAGCACA
+CCCAGCGACGGCGGACAGTCGATGATGACCACGTCGAACCGGTCGGAGAATTTGGCCAACGCGCGTTTGA
+GCGCGTACTCACGGCCTGCCCGCATCAGCAGCATTGCCTCGGCGCCCGCCAAGTCAATGTTGGCCGGCAG
+CAACGTCATTCCCTCCATGGTGGTGACCAGCACGGCGTTGGGCTCGACTTCACCGAGCAACACCTCGTGC
+ACAGACACCGGTAGTTTGTCGGGATCTTGACCAAGGGAGAAGGTCAGACAACCTTGCGGATCCAGATCGA
+CGAGCAGCACGCGCCGTCCCTTTTCCACCATCGCCGCACCGAGCGAGGCGACCGTAGTCGTCTTGGCCAC
+CCCGCCCTTCTGGTTGGCCACCGCTAGCACCCGGGTATCAGTCATAGGCGCCGCTCTCCCCCGCAAGCGG
+CAGGGACCCCCACCTCATCGTGCTCTCCCTTCGTCGTCGCCCGCGCAGTCACAGTGTCATCCTGGCATGC
+TGCTCGCACAGTGGTTCGGGCGACAGGCCTAGGATGTCGTCGGGCACAATCTGTCGGTATGGGCGTGCGC
+AACCACCGATTGCTACTGCTCCGCCACGGCGAGACCGCTTGGTCGACGCTGGGCCGGCACACCGGCGGTA
+CCGAGGTCGAGCTGACCGATACCGGGCGAACGCAGGCAGAGCTGGCTGGTCAGCTGCTGGGTGAACTCGA
+ACTTGACGACCCGATTGTCATCTGTAGCCCGCGTCGACGGACGTTGGATACTGCCAAGTTGGCCGGCCTG
+ACGGTGAATGAGGTAACTGGGCTGCTCGCCGAATGGGATTACGGTTCCTATGAGGGCCTTACGACGCCGC
+AGATCCGGGAATCCGAACCCGATTGGCTGGTGTGGACGCACGGCTGCCCAGCTGGAGAAAGCGTCGCACA
+GGTAAACGATCGCGCTGACAGCGCCGTCGCGCTGGCCCTGGAGCACATGTCCTCACGCGACGTGTTGTTT
+GTCAGCCATGGCCACTTCTCCCGCGCGGTGATCACGCGCTGGGTCCAGCTACCGCTCGCCGAAGGCAGCC
+GTTTCGCGATGCCCACCGCCTCGATCGGGATCTGCGGGTTCGAGCACGGCGTGCGTCAGCTCGCCGTGCT
+CGGGTTGACCGGTCATCCGCAGCCGATCGCAGCCGGGTGAGCGCACACGTGGCAACCTTGCACCCAGAAC
+CACCGTTCGCACTGTGCGGACCAAGAGGCACCCTGATTGCCCGCGGGGTGCGGACACGATACTGCGACGT
+GCGGGCCGCGCAAGCGGCACTTCGCTCAGGTACAGCACCAATACTGTTGGGCGCGTTGCCTTTCGACGTG
+AGCAGACCCGCCGCATTGATGGTGCCGGATGGCGTGCTGCGGGCCCGGAAGCTGCCTGACTGGCCGACCG
+GCCCGCTGCCCAAGGTACGCGTCGCCGCCGCCCTTCCGCCACCTGCCGACTACCTGACCCGGATCGGCCG
+CGCACGGGATCTGCTGGCCGCCTTCGACGGCCCGTTGCACAAAGTGGTGCTCGCGCGCGCCGTGCAACTG
+ACCGCCGATGCTCCGCTGGACGCGCGGGTACTGTTGCGCAGGTTGGTCGTCGCCGACCCGACCGCTTACG
+GCTATCTCGTCGACCTCACCTCTGCGGGCAACGACGACACCGGGGCAGCCCTGGTCGGCGCCAGCCCAGA
+GCTTCTGGTCGCACGATCCGGCAATCGCGTCATGTGCAAGCCATTTGCCGGCTCAGCCCCACGCGCCGCC
+GACCCCAAACTCGACGCCGCCAACGCGGCCGCACTAGCCAGTTCGGCCAAGAACCGACACGAACACCAAT
+TGGTCGTCGACACGATGCGGGTAGCCCTAGAGCCACTATGCGAGGACCTGACAATCCCAGCCCAGCCCCA
+GTTGAACCGCACCGCAGCCGTTTGGCATCTGTGCACCGCGATCACCGGCCGGCTGCGCAACATCTCGACG
+ACGGCAATCGATCTGGCTTTGGCGCTACATCCCACCCCGGCGGTTGGTGGGGTCCCGACAAAAGCTGCCA
+CCGAGCTCATCGCCGAACTCGAGGGCGACCGTGGCTTCTACGCCGGCGCGGTTGGTTGGTGCGACGGCCG
+GGGCGACGGCCATTGGGTGGTGTCTATCCGGTGCGCGCAACTTTCGGCTGATCGACGCGCAGCCCTTGCG
+CACGCTGGCGGTGGCATCGTCGCCGAATCAGACCCCGATGACGAACTTGAAGAAACCACAACGAAGTTCG
+CCACGATATTGACCGCACTGGGAGTTGAGCAGTGACCGATACCATCCGCCGCGCTACACCGGCGGATACC
+GCCGACATCGTGGCCATGATTCACGCGCTGGGCGGAATTCGAGTATGCCGCCGATCAATGCACTGTCACC
+GAAACACAAATACATACAGCACTTTTCGGAGATTTCCCGACGATGCGAGGCCACGTCGCTGAGGTTAATG
+GCGGAGTTGCCGCGATGGCGCTGTGGTTTCTGAACTTTTCCACCTGGGACGGCGTCGCGGGCATCTATGT
+GGAGGACTTGTTCGTCTGGCCGAGGTTTCGCCGCCGCGGCTTGGCCCGTGGCCTGCTGTCGACGCTGGCC
+AGAGAATGCGTCGACAACCGCTACACGCGGTTGGCCTGGTCGGTGCTGAACTGGAATTCCGATGCAATCG
+CACTGTATGACCGCATCGGCGGGCAACCGCAGCACGAGTGGACTATCTATCGACTGTCAGGACCGCGGTT
+GGCTGCGCTGGCCGCACCACGCTGATCACGCCCGGCGGCCCAGCGGATCGAAGGCGGACTGAACAGCAAT
+ACCAGCACGCCAAGCGCGATGATTCCCACCGGGATCCCGATCGCCGGCTGATGCGAACCCACAATCAGAT
+ACCACGCCACCGGCAGCAGCAGCAGCTGGGCGAACACCGCCAGCCCGCGACCCCAAAGCTTGCCAACCGC
+CAGCCTGCATCCGGCGGCGAGCACTGCTCCGCCGACCAGTACGAACCAACCTGCGGTGCCCAGGCCATTG
+ACGATGTGCTGGTCGGCGCCCGCGAGTCCGCGCACCAGCAACGCCGCGGCCACCACCAGGGCGGCCCCAC
+CCTGCACGGCGACGATCAGTCCGGCGCCGCGCACGGCGGCCGGGGCTCGAACAGGCACAGCATCAGCGTA
+GTCACCCGGCCGTGACCGGCCCGCATCGTCACACCACCCAGGCCCATTGCCGTCCTCCTCAACGGGCCGA
+CCCGGCCCGCATCGTCACACGGCCTAGGCCCATTGCCGTCCTCCTCAACGGGCCGACCCGGCCCGCATCG
+TCACACGGCCTAAGCCCATTGCCGTCCTCCTCAACGGGCCGACCCGGCCCGCATCGTCACACGGCCTAAG
+CCCATTGCCGTCCTCCTCAACGGGCCGACCCGGCCCGCATCGTCACACGGCCTAAGCTCGTGCGTCATGC
+GTGCAGTGCTGATCGTCAACCCCACTGCGACCGCCACCACACCAGCCGGCCGCGACCTGCTGGCGCACGC
+CCTCGAAAGCCGCCTTCAGCTCACGGTTGAGCACACCAACCACCGCGGTCACGGGACCGAACTCGGACAG
+GCGGCGGTAGCCGACGGGGTGGACCTGGTCGTGGTGCATGGCGGCGATGGCACGGTAAGCGCCGTAGTCA
+ACGGCATGCTGGGGCGCCCCGGCACGACGCCGGTCCGACCGGTGCCAGCCGTTGCGGTTGTGCCCGGCGG
+CTCGGCCAACGTACTAGCTCGCGCGCTAGGGATTTCCGCGGACCCGATCGCTGCCACCAACCAACTCATC
+CAGCTGCTCGACGACTACGGCCGCCACCAACAGTGGCGCCGCATCGGGCTGATCGACTGCGGTGAGCGGT
+GGGCGGTGTTCAACGCCGGCATGGGCGTCGACGCCGAGGTCGTGGCCGCGGTAGAGGCCGAACGCGACAA
+AGGCGGCAAGGTTACGGCGTGGCGCTATATTCGCGCTGCGGTGCGCGCGGTGCTCGCCTGCACTCGTCGC
+GAACCGGCTCTTACGCTGCAACTTCCCAACCGCGATCCAATTACCGGAGTGCACTTTGTGTTCGTGTCCA
+ACTCCAGTCCGTGGACTTACGCAAACAACCGGCCGGTATGGACCAATCCCGACTGCAGGTTCGAGTCGGG
+GCTGGGAGTGTTCGCCACCACCAGCATGAAGGTGGTCCCGACCCTGAGGGTGGTTCGGCAGATGTTCGCA
+AAACAGCCCAAGTTCGAGTTCAACCACGTCATCAACAACGACGACGTCGCGTGTCTACGCGTCACCTCCA
+TGGGGCCCCCGATCGCCAGCCAATTCGACGGGGACTACCTCGGCGTGCGCGAGACGATGACGTTCCGAGC
+TGTTCCCGACGCCCTCGCCGTAGTTGCCCCGCCCGCAAGAAAGCGAATCTGAGCTGCAGAAACAAAGATG
+TGATGGGTGTGCGACACAAACGTTGGGCGAAACTGGCAGCGTAGTGTAGTACAACTGGGTAAGGGCTGTG
+GAACGAGATCGCCAGAGTGAGATAGCCCACGCGCTTACGTAACACTATTGACATCTGTTGAGCCTGTGAA
+ACGATCAAAAGGTTGCATGTAGAGAAATGTAGGGGTACAGAAGCCTTTCTTGTGCACCCGTTACCAGCCA
+AGAAGAAACGCCTGTGCGTACCGCTGCGCACATAGTGAGGAGTAACGACTAATGGATTGGCGCCACAAGG
+CGGTCTGTCGTGACGAGGATCCGGAACTGTTCTTCCCGGTAGGAAACAGTGGTCCGGCACTTGCGCAGAT
+CGCTGACGCGAAACTGGTCTGTAATCGGTGCCCGGTCACCACAGAGTGCCTCAGCTGGGCACTGAATACC
+GGCCAGGACTCGGGCGTCTGGGGAGGCATGAGCGAAGACGAGCGGCGCGCGCTGAAGCGTCGCAACGCCC
+GCACGAAAGCCCGTACCGGGGTCTGACGACTCAGTTCTGCACAGTGCGGCCCCGACATACGTCGGGGCCG
+CACTGTTGCGTAGCGCGCTACAGCATCAACCGTCCCCGGCGTCCGACCGGTACCCGTAGCACCACATCGG
+TGCCACGTTCGCGGGCGTCCCGCATACCTAACGAGCCGTCCAATTCCGCAGAGACCAAGGTCCGCACGAT
+CTGCAGGCCCAGGCTGTCCGACTTCTCCAGGCTGAAACCTTGCGGCAGACCAAGCCCGTCGTCGTGCACG
+ACGACATCGAGCCAACGCGCAGAGCGTTCCGCTCGAATCGTCACGGACCCTTCCGCCGCCGCCGGGTCGA
+ACGCATGCTCGATCGCGTTCTGCACCAGCTCGGTGATCACCATGATCAGCGCCGTGGCGCGGTCGGAGTC
+GAGCACACCGAGGTCGCCAACCCGATTTATCCGGATCGGCCTGTCCACCGATGCCACATCGTTCATGATC
+GGCAGAATCCGGTCGATGACCTCGTCAAGGTTCACCTGCTCGTCCACCGACATCGACAACGCATCGTGGA
+CCAAGGCAATCGACGACACTCGGCGCACCGACTCGATCAGCGCTTCCCGCCCCTCGGCGTTGGACGTCCG
+GCGAGCCTGCAGCCGCAACAGCGCGGCCACCGTCTGCAGGTTGTTCTTAACCCGATGATGGATTTCCCGG
+ATCGTGGCGTCCTTGGATATCAGGGCTCGGTCGCGCCGCTTCACCTCGGTCACGTCGCGGATCAATATCG
+CGGCGCCGACATTGCGACCAGCTACCACCAGCGGCAGAGTCCGCAGCAGCACCGTGGCGCCGCCGGCGTC
+GACCTCCATCCGCATACCCTTTCCATCCCCGGCCAGCAAGTCCTGCACATGCTCGTCTACCTCGTGCGCC
+TCGAACGGGTCCGAGATCAGCGGGCGCGTCGCGTCAATGAGATTGACGCCCTCCAACTCGGTGGTCAAAC
+CCATTCGGTGGTAAGCCGATAGGGCATTGGGGCTGGCGTAAGAGACCACACCGTCGACATCGAGACGGAT
+GAAGCCGTCACCCGCGCGCGGGCTAGATCGCGACATCGCCACGTCCCCTGCGTCGGGAAAGGTGCCCTCC
+GCCAGCATCCGGAGAAGATCTGTGGCGCACAACCGATAGGCGGTCTCCAGGTGGCCGGATCTACGTCGCG
+CCGCCAGTTCGGGTTGATGCCGTGTCAGCACCGCCACCACCTGATCGCCAAAGCGCACCGGGGAGACTTC
+GACACTGTGGCCGTCGTGTTGACATGAATTCTGTTGGCCGACAGCGCCTTCCCGTCCCGGGACACCACCG
+GAGAAGGTCGCGGCGACCAGCGGCATGCTATTGGCGGCGACGACGGTGCCTACCGCGTCGGTATGCACCA
+CCGTCGGCCCGGTGTTCGGCCGGCATTGCGCAACGCACACCAGGACACCGTCGTTGCGGCGAACCCACAT
+CAGGTAATCGGCAAACGACAAGTCGGCAAGGAGCTGCCACTCCCCGACCACCGCATGCAGGTGGTCCACC
+GCGCTGCCCGGCAGCACCGTGTGTTCGGCGAGCAGATCACCGAGTGTGGACATGAGTGACTATCAACGAC
+TAGCTGATCACCGCGATAAGGTCGCCGGCCTGAATGACATCGCCCACCGATACCGCCACCTTGCTGACCG
+TTCCGGCAGCTTCGGCCAGGACGGGGATCTCCATCTTCATCGACTCCAGCAGCACCACGACGTCGCCCTT
+GTCGATCTGATCGCCTTCGTTGACAACGACTTCGAGAACGCTGGCCACGATCTCGGCGCGAACATCCTCG
+GCCATCATCACCCCACTCTTTTCGGCCATGCCGTATGCTGACTGCTGGTCATCGGACTTCCATCAAACTC
+AGGTATATCGAACCATAAGAACCCTGGGGAGCGCGGCACGCGGGCTATTGGGGTCGCGCGCGACGCCGCA
+TGAGAAACTGGGCAATGACCGGGCGGCCGCTGCCTGCCCGCACCTGAGCAATGACGGAGGTTCCGATGGC
+CAAGCGTGGCCGTAAGAAGCGTGACCGCAAGTACAGCAAGGCCAACCACGGCAAGCGGCCCAATTCCTAA
+CGCACTGCGCTAGGGCCCTCCACGGATGATGGTGGTCCGGCGGATCTCTAGCCGAAGACGCTCCCGCAAG
+CCCTCGGGGGCCCTGTCGCCTCGGCACTTGGTCCCGATCAACGCCTTGATCCGTTCCTCGAGCCCGTAAT
+GCCTCAGGCACCCCGGGCAGGCCTCGAGGTGTCGCCGCAGCCTCTCGCGGGTTTCCGGGGTGCATTCACC
+GTCAAGCAGGGTCCACACCTCGGCGATCACTTCCGCGCAACCCATGCCGCCGTGGGAATCGTCGTGGTCC
+GCGTGCGCATCGGTCGGACCGCAATTTTCGCTCACTGGTGCACCATCCTTGTGTCGGTGATCTCGGATGG
+ATTGCCGATGTAGAGGCGCCGCTGGGTTAGCGCCCCGCGCGCTTGACAGCCGTGATGTCCATCATGAGTT
+TTGCGGAGTCCGGCGGTTGCCCCGGACGCGCCGACCGTCGACAGGGCCAAGCGCCGACGAGCGCCGAACG
+ACTCGCCCCGCACGCCGACGCCCAGCCCGAATTGCTGGCCTGCTTGGCCGGCGTCGCCCGCTCCACCGGC
+TAGTCCGACAAAGTCACCCACGTCGGGTTCGGTTGGGCGGCAGACAAACAACTCCGCAACGGTGTCTGCG
+ACTTCGCCGGCGACAGCCGCCGAGCCAACCTCTAGGCCGCCGACCTGCACAACCGCACCCGAGCCCGCGG
+CCACGACCACCGGCACGCGGTACGCATCCTCGCCCGCGCCTGGCTTTACGTCATCTGACACCGCTGGCAA
+GACGGCATCGCTTACGACCCCACCCAACACCGAGCCCTGCAGGCTCTCCTTGACCAAGTTCGCCAAACGG
+CGGCTTGACACCGGGCTGCTCATGACGACACCCCCTCGTGCGCCTGCTCGCCCCTGGCAAACCCCCGATC
+CCTGGCCACATCGGCTAAAAGACCGCGCAACTGACGTCGGCCGCGATGAAGCCTCGACATCACGGTGCCG
+ATCGGAGTATCCATGATCTCGGCGATCTCCTTGTAGGGGAAACCTTCGACATCGGCGTAGTAGACCGCCA
+TCCGGAACTCTTCCGGCAATGCCTGCAGCGCCTCTTTGATCTCGGTGTCCGGCAACGCTTCTAACGCTTC
+GACTTCAGCCGAGCGCAGCCCGGTCGAGGAATGCTCGGCGTTGGACGCCAGTTGCCAATCGGTGATCTGC
+TCGGTCGGATACTCCGCCGGTTGCCGCTGTTTCTTGCGATAGCTGTTGATGTAGGTGTTGGTCAGTATCC
+GGTAGAGCCAGGCCTTGAGATTGGTACCGTGCCGGAACGAACGAAATCCCGCATAGGCCTTCACCATCGT
+CTCCTGGAGCAAGTCCTCGGCGTCGGCCGGATTGCGCGTCATCCGCAGCGCACCGCCGTACAGCTGGTCC
+AACAGGGGAATCGCGTCGCGCTCGAAACGCGCGGTCAACTCCTCGTCTGTCTCCTCAGACGGCCCAGGCT
+GCAGACCCGCCGAACCGGTTACACCATCGATGTCGGCCATCTTGATTAACTGGGTCCCTTCGTTTGCGGT
+GTCGCCGGACAGCACCGGCGCGGACACCGGACGTGCGAGCATGCGAGCCAACCGCTTCTCACCCAACAGG
+CTCGTCGCCGTTGACACCAGACTCCCCTCGTCCCAATGTAGAGGCCGCGACCGACACTGTCTGCACCGGT
+CTGGCCAGCCACGTGGCTGCAGGAACCGAACCAATCAACCGTGTTCGCCAGCGGGTTATTTCCAGCGCTG
+AATCGCATGCGGCCTGTCCCGCAGTCCGGTGGAATCGAGCAGGGCGTTAGGGTGACGCCATGTCACTCAA
+CGGCAAGACCATGTTCATCTCTGGCGCCAGTCGCGGTATCGGCCTTGCGATCGCCAAGCGGGCCGCGCGC
+GACGGCGCCAACATTGCCTTGATCGCCAAGACCGCCGAGCCGCATCCAAAGCTGCCAGGCACGGTGTTCA
+CGGCCGCCAAGGAACTCGAGGAAGCCGGCGGCCAGGCACTGCCGATCGTCGGGGATATCCGCGACCCGGA
+TGCGGTCGCGTCCGCGGTGGCCACCACCGTGGAGCAGTTCGGGGGCATCGATATCTGCGTCAACAATGCC
+TCGGCGATCAACTTAGGGTCCATCACCGAGGTGCCAATGAAGCGTTTCGACCTGATGAACGGCATCCAGG
+TGCGTGGCACCTACGCAGTATCCCAAGCGTGCATTCCCCATATGAAAGGCCGTGAGAACCCGCACATCCT
+GACGCTGTCCCCGCCGATCCTGCTGGAGAAGAAGTGGCTGCGGCCGACGGCCTACATGATGGCCAAGTAC
+GGCATGACGCTGTGCGCGCTGGGAATCGCCGAGGAGATGCGCGCCGACGGCATCGCGTCGAACACGTTGT
+GGCCACGCACGATGGTGGCCACCGCGGCGGTACAGAACCTGCTGGGCGGCGACGAGGCGATGGCGCGGTC
+CCGCAAGCCCGAGGTATACGCCGACGCGGCCTACGTCATCGTCAACAAGCCCGCCACCGAATACACCGGC
+AAGACGCTGCTGTGCGAGGACGTGCTCGTCGAATCCGGCGTCACCGACTTGTCGGTCTACGACTGCGTCC
+CAGGTGCGACGCTCGGCGTCGACCTGTGGGTGGAAGACGCCAACCCGCCGGGGTACCTCCCGGCCTAGCG
+ACAGCAAAACCCTGATCCTCGAGTTGCCCGACGAGCGGGCCGTCGCGATCGTGCCGGTGCCGTCGAAGTT
+GTCGCTGAAGGCGGCCGGCGGCCCTAGGGGTGCCCAAAGCGGCCATGGCTAAACCCGCTGCCGCCGAACA
+AGCCACCGGCTACGTGGTCGGCGGCATCTCCCCGTTCGGTCAGCGCAAGCGGCTGCGGACCGTGGTCGAT
+GTGTCGGCCTTGAGCTGGGACCGGGTACTGCGGTGCCGGCAAACGGCATTGGGCCGTCACGGTGGCCCCG
+CCGGACCTGATCACCTTGATCAGCGCGATCATCGCTAACATCCGGGCCTAGCGCCGTACCGGAAATCGGC
+GAGGACTTCACCGATGGCGTAGCGCGCGCTGGCCGCCAGCGGCGGGTTGGTGTCTTGGTAGTACGGGAGC
+GCGATCAAGGCGATGGCCAGAGCTCTGCCGCGCCCGCGCATCCAGTCGTCGTCGGCGGCGCCGACCGCGA
+CGCGGAACTGAGCACGGGCGGGCGCCGACAGGAGGTTCCACGCGATGATCAAGTCGACGCTGGGGTCACC
+GACGCCCATCAGACCGAAGTCAATGACGCCCGTCAAGCGTCCTTGCGCTGTCAGGATGTTGAACCGGGAC
+AGGTCACCGTGGAACCACATCGGCGGCCCCGCATACGGAGGAACGCGTAGGGCTGATTCCCACGCGGCAG
+TTGCCGCGTGGACGTCGATGATCCCGTCGAGGGCCGCCAGCGCTGCGCGTACCTCGGCATCCTGCTCCCC
+CAGCGGCGCACCCCGCTTGGCGGGCGGCCCGCCCATGGGGTCGGTGGCCCGTAAGGTGGTGATGAAGTCA
+GCCAGGTCCTCGACGGCCCGATTGGGCTCGACGAACTCGGCTGCCGACGGGTTCTCACCCGCAACCCAGC
+GGCACACTGACCACGGCCAACCGAACCCCTCAGCCGGGCTCCCCAACCCCACCGGAACTGGGCTGGCAAC
+GCCTAGATGCGCAGCGATCCGCGGCAGCCACTGTTGCTCGGTCCGAAGGCTCTCGATGGCCCAGCCAATG
+CGCGGGATGCGCACGGCCAGGTCCTCGCCTAGCCGGTACATTGCGTTGTCCGTGCCCGCCGAGCGCACCG
+GTGCAATGGGTAGATCCGCCCACTGTGGGAATTGTGCACGCAGCAGACGCCGCACCAGATCCTCGTCGAT
+ATCCACCTCATCGGCGTGCATCTTTGCCCTTAGGACACGTTCGTACCGGTCGAAGACGGTTCCGTCCTGC
+TCACAGATCCGCCGCACGAAAGCAAAGCCCGCCCGCAACGCCACCCTCGCCGATGCGGAGTTCTCCGGCT
+CCACCTTGATCACCGCTTCGGTCGCGCCGTGTTCGGCCGCATACTGGCACACCAGATCGACTGCGCGAGT
+GGCGAGTCCACGCCCTCGCCAGCTGGGGTAGAGCCCATAGGCAACGTTGACCTGCCCGCTAGCCAGCCCC
+TCGCCGTCGAAACGCAGATCAATCGTACCCACTATTGTTTCGGCAACCGTCCTGATGCCGAAAGAGCGCA
+GCGGCCCGCCGGTCACCCATTGCTCGCGGCAGTGCCGGATGTACGCTTCGACGCTTGCTCGAGTCGAGGG
+CATACCGCTAAGCCAACGCACTAGCCGTTCGTCCCCCCCAGCCAGATGCGCATCGACATCGTCCAGGCAC
+AGTGGCGATAGAGTGACGATCCCGTCTGATAGCCCGTCGGACAGCTTCGCAAAGCGCACCCCGCGATTGT
+CGGACTCACACTGGCTTCAGGCAAACCTGCCGCGAGCGCCCGGCGAGCGTAATGGCGCGGCAAGAAATCG
+CGCTTGGATTCGCCGCAGCGTCACACGCGTGGGCACAGACCCTCACAGCAGCTGGATCTGCTCGGGCTGC
+GACCTGGCCGGCTCCAACAGCTCAGGCCCGTTGTTGCGCACGTTGTTGACCAACGTGGACACTTGGCGCA
+GCGCGATGTCGCGCACATCCGGCGGGCGGGCCAGCAGCTCAGGATCCGGCGGGGCGTCTGGATTCAGCCA
+GTCGTCCCAGTCCTCTTCGGCCAGCAGCAGCGGCATCCGGTCATGGATCTCGGCCAGCTCGCCCACGGCA
+TCGGTGGTGATCACCGTGCAGCTCAGCAGCGGTGGGGCGGACCTGTAAGACTTCCAAACCGACCACAGCC
+CGGCCGTGAACAACAGGGCGCCGTCGTGGCGGTGCAGGAAGAACGGCGTCTTGGCGTTCGGCCTCCCCGG
+GGTGGCGTCGGGGTCGACGCGCCATTCGTACCAGCCGTCCATCGGCACCAGGCAACGCTTACTTCTGACC
+GCACTCCGGAACGCCGGCGACGTGGCGACCTTATCGGCGCGGGCGTTGATCAGCGGTGGGCCTTTGGCAT
+CGGGTGCGCCGCCGGGCCCGGCCTTGATCCACGACGGAATCAGTCCCCAGCGCATGAGCCGCACCCGGCG
+GGTGGGCTCGTCGTCGGGCTCGCTGTGGCGGGACACCACTGTCGCGATCGTGTCGGTGGGTGCCACGTTG
+TAGCTCGTCTTCCCGCCACCGCACCCGGTGGCCTCGTCTATGGCCGTGATTTTCTCGGCCAGCTGGGCCG
+GATCAGTGGTGACCGCAAACCGTCCGCACATGCTTCCTATGGTGCCTGGTACCCACGACACCCGCCGACA
+CGGCAGGATGAAGCGGTGAAGACATGGCCAGCCCCAACGGCGCCGACGCCGGTGCGCGCTACCGTGACCG
+TTCCAGGCTCGAAGTCGCAGACCAACCGGGCGCTGGTGCTAGCGGCGCTGGCGGCCGCACAAGGCCGGGG
+CGCATCGACCATCTCCGGCGCGCTGCGCAGCCGCGACACCGAACTGATGCTGGACGCGCTGCAGACCCTG
+GGCCTGCGCGTCGACGGTGTGGGTTCGGAACTGACGGTCAGCGGCCGAATCGAACCGGGGCCCGGCGCTC
+GGGTGGACTGTGGCTTGGCGGGCACGGTGTTGCGGTTTGTTCCGCCGCTGGCGGCGCTGGGCTCCGTCCC
+GGTCACCTTCGACGGCGATCAGCAAGCCCGGGGACGGCCCATCGCACCGCTGCTGGATGCGCTGCGCGAG
+CTCGGCGTCGCCGTCGACGGCACCGGTCTACCGTTTCGGGTTCACGGCAACGGGTCGCTCGCCGGCGGCA
+CCGTGGCCATCGACGCGTCGGCGTCCTCACAGTTCGTGTCCGGGCTGCTGCTGTCCGCGGCATCGTTCAC
+CGATGGCCTGACCGTCCAACACACCGGTTCGTCGCTGCCGTCTGCGCCGCACATCGCGATGACGGCGGCG
+ATGCTGCGGCAAGCCGGAGTCGACATCGACGACTCGACACCGAACCGTTGGCAGGTGCGCCCCGGTCCGG
+TGGCGGCGCGGCGCTGGGACATCGAACCGGACCTGACCAACGCGGTGGCTTTCCTGTCAGCGGCCGTGGT
+CAGCGGCGGCACCGTGCGCATCACCGGCTGGCCTAGAGTCAGCGTGCAACCCGCCGACCACATCTTGGCA
+ATTTTGCGGCAGCTCAATGCCGTTGTCATTCATGCTGATTCATCCCTCGAGGTGCGCGGTCCAACGGGAT
+ACGACGGGTTTGACGTCGACTTGCGCGCCGTCGGCGAGCTGACGCCATCGGTCGCGGCGCTGGCGGCGCT
+GGCATCCCCGGGATCGGTGTCCAGACTAAGCGGCATTGCCCATCTGCGGGGCCACGAAACCGACCGGCTC
+GCCGCGCTGAGCACCGAGATCAACCGGTTGGGGGGCACCTGCCGGGAAACACCCGACGGTCTGGTGATCA
+CCGCGACGCCGTTGCGGCCCGGCATCTGGCGGGCATACGCGGACCATCGAATGGCGATGGCCGGCGCGAT
+CATTGGGCTGCGGGTGGCCGGAGTCGAGGTCGACGACATCGCCGCCACCACCAAGACGCTGCCGGAGTTT
+CCGCGGCTGTGGGCCGAGATGGTCGGACCCGGCCAGGGGTGGGGGTACCCCCAGCCGCGCAGCGGCCAGC
+GGGCGAGGCGGGCAACCGGGCAGGGGTCCGGCGGTTGAGGCCCGGCGACTACGACGAGTCCGACGTCAAG
+GTGCGCTCCGGCAGGAGTTCGCGGCCGCGGACCAAGACCCGTCCCGAGCACGCCGACGCCGAGGCCGCCA
+TGGTGGTCAGCGTCGACCGCGGCCGCTGGGGGTGTGTGCTGGGCGGCCGCCCCGATCGCCGAATCACGGC
+GATGCGCGCCCGCGAGCTCGGCCGCACCCCGATCGTGGTCGGCGACGACGTGGACGTGGTCGGTGACCTG
+TCCGGGCGGCCCGACACCCTGGCCCGCATCGTGCGGCGAGCACCGCGACGAACCGTGTTGCGACGCACCG
+CCGATGACACCGACCCCACCGAGCGGGTGGTGGTCGCCAACGCCGACCAACTGCTGATCGTGGTCGCGCT
+GGCAGACCCGCCGCCACGCACCGGCCTGGTCGACCGGGCGCTGATCGCCGCCTACGCCGGCGGGCTGACC
+CCGATTCTCTGCCTGACCAAGACCGACCTCGCCCCGGCGGAACCGTTCGGCAAGCAGTTCGCCGACCTGG
+AATTGACCGTAACCGCCGCAGGCGTCGATGATCCTCTGCTCGCGGTGGCGGACCTGCTGGCCGGCAAGAT
+CACCGTCCTGCTCGGGCATTCCGGGGTCGGCAAGTCGACATTGGTGAATCGTCTTGTACCCGAAGCTGAT
+CGGGCGGTTGGTGAGGTCACCGAGATCGGCCGGGGACGGCACACGTCGACTCGGTCGGTGGCGCTGCCGT
+TGGGAGATACGCTGTCCGGTTCCGGCTGGGTGATTGACACCCCAGGAATCCGCTCATTCGGGTTGGCTCA
+TATCCAGCCCGACAACGTGCTATTGGCTTTCTCTGACCTCGCCGAGGCAACCCGCGAGTGTCCGCGCGGG
+TGCGGGCACATGGGACCGCCGGCCGATCCCGAATGCGCGTTGGATACCTTGTCCGGGCCCGCTGCCCGCC
+GCGCCGCGGCCGCCCGGCGACTACTGGCAGTGCTCAGCCAGACTTGACTAGCCGCATGCTCGTCGCGCGC
+CGAGCAATCTTAGGCTGCCAGATCGTCGGGTTCGGTGACCGACTTAGCCATACGCTTGCTGCGCCGCCGA
+CCCCGCACGGCGGCAATCGCGGTCTTTAACCCCCGACGACGTCCGGTCACCGGATCGGCGCCCGCGAAAC
+CCGGCCCCAGACCAGCGAACATCCGCTCACTGCGGGTCTCGGGTGCATCGTCAGCGTTGTCACGTAAGTA
+CTTATCCGGCAACGACAGCTTGGCAAGGGTGCGCCAGGTCTTGCCGTACTGCACCAAGAACGAGCCCGTG
+GTGTATGGCAAGTCGTATCTGTCGCAGACCTCACGCACCCGCACCGAAATCTCGTGAAGCCGGTTGCTCG
+GCAGGTCCGGATAGAGGTGATGCTCGATTTGGTGGCACAGATTGCCGCTCATGAACCGCAGCGCCGGCCC
+AGCGTTGAAGTTTGCGCTGCCCAGCATCTGCCGTAGGTACCACTGGCCCTTCGGCTCACCGATCATGTCC
+GTCTTGGTGAATTTCTCTGCGCCATCCGGGAAATGGCCGCAGAAGATCACCGCGTTGGACCACACGTTGC
+GGATCACGTTGGCCACCACGTTGGCGGTCAAAGTGGACCGATACGTCGCCCCCGGGGACAACGAGGTCAG
+CGCCGGGAACGCGACATAGTCCTTGAACACCTGGCGGCCCGCTTTGGCTGAGAATTCACGCAACCGGGTT
+TTAGCGGCCTCGCGGTCGGCCCGACCCTTGAAGATCTTGCCGATCTCCAAGTGCTGCAGCGCAACTCCCC
+ACTCGAAGCCGATCGCAAGGATGGTGTTCCACACCACGTTGAAGATGTTGTAGCGCTTCCAGCGCTGGTC
+ACGGGTGACGCGCAGCATGCCGTATCCGACGTCGTCATCCATACCAAGGATGTTGGTGTATTTGTGGTGC
+ACGAAGTTGTGGGTGTAGCGCCAGTGCTTGGACGATCCGCTCATGTCCCACTCCCACGTCGAGGAGTGAA
+TCTCCGGGTCGTTCATCCAGTCCCACTGGCCGTGCATGACGTTGTGGCCGATCTCCATGTTTTCGATGAT
+CTTGGCCACGCCAAGGGTCAGGGCACCTGTCCACCAGGCGAGGCGTCGTGAGCTGCCAGCCAGCAGTAGC
+CGACCGGACACCTCGAGCGCCCGCTGTGCGGCGATGGTGCGGCGGATGTAGCGGGCATCGCGTTCGCCGC
+GCGATTCTTCAACGTCTCGGCGGATGGCATCTAGCTCGGCGGCCAGGTTTTCAATGTCGGCGTCCGTCAG
+ATGCGCGAATACGTCGACGTCAGTGATCGCCATCGTCTTCTCCCTGCGTCATACGGCCGATGACCTACGC
+TATCGTAACTTACGATTCCGTAGGTTACCTATGAGTAACACTAGATGTCCAGCACGCAATCACCCGAGGC
+GGCCGACACGCAGGTCTGGACCCGGGTTCCGGGCTCATGCCGCTGGCCCGTGCGCAGATCCCGAACATGG
+CCTTCCACCAGGTCGACCACACACGACTGGCAGATGCCCATCCGGCAGCCGAAGGGTAGCTGCACGCCGG
+CGCCCTCACCGGCGTCCATCAACGACGTGGCAGCATCGGCGGCTACGCTCTTGCCACTTCGGGCGAACGT
+GACGGTCCCGCCCGCTCCAGCGGGCGCCGTTTTGGACACTGCGAACCGCTCCAGGTGCAGTCGGTCGCTG
+GCACCCGCCGATGACCAGACCTTGTCGGCCTGGTTGAGCACGCCCTCCGGCCCGCACGCCCAGGTCTGGC
+GTTCACGCCAGTCCGGCACCTGCTGACCGATCCGGGTCAGGTCCAGCCGGCCCTGGGCGCGCGTCTCGCG
+CACCGACAACCGATAACCGGGATGGTCGGCCGCCAGGGCAGCCAGCTCGGCACCGAACATCACGTCAGCT
+GCGGTGGGCGCCGAATGCAGGTGCACTACGTCGGTGATTTGGTTGCGGCGCACCAACGTTCGAAGCATCG
+ACATTACCGGCGTAATCCCCGACCCGGCAGTCAAAAACAGAATCAACGGGGGCGCCGGATCCGGTAATAC
+GAAATTGCCCTGGGGCGCAGCCAGCCGCACAATGGTCCCTGGCTTTACCCCGGCCACCAAGTGGGTGGAC
+AGGAAGCCCTCGGGCATCGCCTTCACCGTGACGGTCACCATGCGCGCGGACCCGGATGCCGCCGGACTCG
+ACGTCAGCGAATACGACCGCCAGCGCCAGCACCCGTCGACCAGCAGCCCGATCCCGATGTATTGGCCCGG
+CTGGTAGTCGAAACTGAAGCCCCAGCCCGGTTTGATGAACAGGGTCGCGGAGTCTTCCGTCTCTCGGCGG
+ACCCCTAGGATGCGCCCCCGCAATTCCCGCGCGGACCACAGCGGATTTGCCAGGTGAAGGTAGTCGTCGG
+GCAACAATGGCGTCGTGATGCGCGCGGCAATCTTGCGCAGCGCATGCCAGCCCGGATGCCGGTCGGCTCC
+GGCGACGGTGGGGCGCCTGGTGTCGATGATGCTGGCGTTAAGCGTCGTGTGTTTCTTGCTCATAGGAAGC
+TCCTGCTCGGCCTTAGCTTCCGCCCAACAAAGCTACGGTACCGTAACCTACGGTTCCGTATCTAGGCCCG
+GACGCGCAGACTGCGTCACACCCACGGCATCGTCAGAGCAGGTCCAGCAGAAATGGCAGCTCTTGGTTGG
+CGTACCAGGCGAGATCGTGGTCCTGGGCGTCACCGACCACCAGCTCAGCGTCCTCGTCGCCCAGGTCAGC
+GGCATCGATGACCGCAATCGCCGCCATCACGGCCGGCTCAGCGCCGGCATTGTCAACATATGCGGCGACA
+ACCTGATCGATCGTGATTGGCCCCGCCAGCCTGACGACCGCGTCATCAAGATCGGGACGGTACGTGGCAT
+CGTCGACCTCGGCGGCCAGCACCGCGCGTCTGGGCGGCAGGGCGTCTGCGGTGGCGCCGATGTCCGCCGC
+TAGCAGACGCAACGACGCCAACGCCGCTTCGCGCAGCGCCACCTCGGCAAGCTCCTCGTCGTCACCCTCG
+GCGTACGACTCACGCAACGTCGGCGTCACTGCAAAAGCAGTGCCGTTGACCGGCCACAACGCGCCATCGG
+CAACGAGTCGCTGCAACATGGCCAGGGTGGCCGGGATGTAGACCTGCGTCACCGGGCGATCAACGTGGCC
+ACATAGTCGTCGACGTATGTCGACAACTCGCGGGGCGGACGCCTGTAGTTGCCACTCACAAGCGGCCGTG
+GCGGCAGCTTGACCTTTGGCTTTTCCACATCTGCGTAGTCAATCGTGGACAGCAAGTGGGCCATCATGTT
+CAGCCGCGCGTGCTTTTTGATATCAGACTCCACCACGTACCAGGGGCTGACGGGGGTGTCGGTATGCACC
+ATCATCTCGTCCTTTGCGCGCGAATAGTCCTCCCACCGATACACCGATTCCAGGTCCATTGGGCTGAGCT
+TCCATTGCCGGACCGGGTCATTCCGTCGAGCCTTGAATCGGCGCAACTGTTCGGCGTCTGAGACTGAAAA
+CCAGTATTTGCGAAGCAGAATCCCGTCATCGATCAGCATCTGCTCGAAAATCGGGGTCTGCCGCAAAAAC
+AACACATACTCCTGCGGCGTACAGAAACCCATGACCTTCTCCACACCGGCGCGGTTGTACCAGGACCGAT
+CGAAGAGCACTATCTCACCTTTGGCGGGAAGATGGGCAATATAACGCTGGTAGTACCACTGACCCCGCTC
+GCGATCCGTCGGCGCGGGCAATGCCGCGATACGAGCCACTCGCGGGTTGAGGTACTCGGTGATCCGTTTG
+ATGGCGCCACCCTTACCAGCTCCGTCACGGCCTTCGAAGATGACCACCAGACGCGCACCCGAATGCCGGG
+CCCACTCTTGCAGCTTCACGAATTCTGTTTGCAGCCGAAACAATTCGGCTTGGTAGACGGCATCGGAGAT
+CTTGCGCCGGCCCGGCGCAGCTGATCTGTGTCCCTTCGCTCTCGACGACGCGCCGTCGTTGGTCGCGGTG
+CTCACATCAACGGATGGTATATCCACACATCACCATCGACCCCTAACAACTACCGCGAAGCCTCCAGAAG
+CTCGTCCAGTGCTTGGCTCAACAGCCCCGGCAGCAGATCGACATCGCTCATCGCGTCGCGGTCGGCATTG
+ATGCCGAAATACAACATCCCGTTATACGACGTCACGCTGATGGCCAGCGCCTGGTTGTGCAGTAGCGGCG
+GCACGGAGTAGGTCTCCAGCAGCTTGGTACCCGCAATGTACATCTGCGACTGGGTTCCGGGGGCATTGGT
+GATCAACAGATTGAACAACCGTGCCGAAAAGCTAGTGGCGACCCGCACCCCCATGGCGTGCAAAGTGGCC
+GGTGCTAACCCCGACAACGTGACGATAGTCCTGGCATCGACCAGGCTGGCGGCGGTCGGGTTGGATTCGG
+TGGCGTGCGCGATCTGCGACAACCGCACTACGGCATTGCCCTCCCCCACCGGGAGGTCAACCAAGAACGG
+TGTCACCTGGCTGATCGCCTGACCAGGGCCGGTTGAGTCGAGTTGGTCGTCGGCATAGACCGACAGCGGC
+GCCATCGCCCGAACAGTCGCGGTCGGTGCCACAGCTTCACCGCGTGACATCAGCCAGTTGCCCAAGGCAC
+CGGCAATCACCGTCAGCACCACGTCGTGGACGTCACAGTCGTAGCGAGCCCGCACCGTGCGATAGTCATC
+AAGACTTGCACGGGCAACCGTAAATCGCCGATTACGCGACACGGTGGCATTGAGCGGGCTACTGGGCGCG
+GTGCCCCGTGCCACCGTGCGGGCGATATCGAGAACCTTGCGGCCCGTCTCGACGAGTTGGCCGGAATTCG
+TTACCAACCCGGCGACCGCGGATCCGACGGCCTGTAGTTGTGCGCCCGGCCGCACCAGCCAGTCCCCGAC
+CGCGCGCAGCAGCAACCGCGTGGTGCCGGGGTCCCGTTCCGGGACCCAGATGTCTTCCGGAAACGCCGGT
+GGACGCCGCGTCCGGTCGGCGATCACGTGGCCTATCGCCAGCGCGGTCACCCCGTTGATCAGGGCTTGGT
+GCGACTTGGTGTAGAGGGCAATGCGATTCTTTTCCAGACCCTCGACGAGATACATCTCCCACAATGGCCG
+CGATTTGTCCAGCGGCCGAGCGGCCAGCCGTGCGATCAGCTCGTGCAGTTGCTCGTCACTACCCGGCGAC
+GGCAGGGCCGACCGCCGGACGTGGTAGGTGATGTCGAAGTCGCGATCGTCGATCCACACCGGCCTGGCCA
+GGCCCAATTTCACTTCCTGGACTTTCTGACGATAGCGCGGTATCTGCGGCAGCCGCTGTTCGACGGTTTC
+CAGCAGTGCCTCGTAGCTCAATCCGGCACGCGGACGGCGCAGGATCAACAGCAACCCGACATACATTGGG
+GTGGCTGTGTTCTCCAGCTGATAGAAGGAGGCGTCCGATGCAGACAACCGGGTGACCACTACGGCCCTGT
+CCTCCTTGTCAATTCGTCGCGACGAGTCACGTCGTCGCCCACGCTAACGGTTAGCCCGACCACTTCACGG
+CGCGGGTACACGCAAGCCCGCATTGTGCGATGATGGCCAGCAACCAAACCGCTGCGCAACACTCGTCTGC
+CACTCTCCAGCAGGCTCCTCGTTCGATCGATGATGCTGGAGGGTGCCCCTTGACCATCAGTCCTATCGCG
+AACTCACCGGGCGACACCTTCGCCGTCACACCCGTCGTCGAGTACGAGCCGCCGCCGCGAAACATCCCGC
+CGTGCGGCCAATCATCGCACGCAGCCCGGCGGCCGCACACCCCGCAGCTAGCTCGCCGACAACCAATCAG
+GCCGAGCGGCCGGGCACCGGCAGCGGTCACCTCCACGGCCAAGTCACCGCGGCTGCGTCAAGCGGGGACC
+TTCGCCGATGCCGCGCTACGCCGAGTGCTGGAGGTCATCGACCGCCGCCGCCCGGTGGGCCAGCTGCGCC
+CCCTGCTGGCACCCGGCCTCGTCGACTCCGTGCTCGCGGTGAGCCGCACGGCGGCCGGACACCAACAAGG
+CGCGGCCATGCTGCGCCGCATCCGGCTGACACCGGCCGGACCCGACACCGCGGACACCGCCGCCGAGGTC
+TTCGGCACCTACAGTCGCGGGGACCGGATCCATGCGATCGCCTGCCGGGTGGAACAACGGCCCGCCGGTA
+ACGAAACCCGATGGCTGATGGTCGCCCTGCACATCGGGTGAGATCGCCGGCCCACACCCTAGTTCGAAGC
+TACTGCGGCGGCCGGCAGCCCACCGCCGGTGTAGCGGGCCAGTATCGGACCGACGATCGCCATGACGAAC
+ACATACGCCGTGGCCAAGGCGGCAACCCCCGGGATCGAGGCACCGGCCAGCCCGATGATGATCAAAGAAA
+ACTCCCCCCGGGCAACGAGCGCGGTGCCAGCACGCAGCTGCCCACGCCGTGCCACTCCCTCCCGCCGGGC
+AGCGAACATCCCGGTGGCCACCTTGGTCGCTGCGGTGACAGCGGCCAGGGCCAGCGCTACCGGAAGCATT
+GAAACGAGCTTTCCCGGGTCAACCGACAGGCCGATTCCCAGGAAGAAGATCGTGGCGAACAAGTCACGCA
+GCGGAGTCAGCACCATGCGTGCCCGGTCTGCGGTCTCCCCGGTAAGCGTGAGGCCTACCAGAAACGCACC
+CACAGCCGCCGACGCGTGCAGCGACTCGGCCACCGCCGCCACGATCAAGGTGATGCCCAGCACCCGCAAC
+AACAATTGTTCGGAATCAGGATGAGTCACCAACCGGCCGACATGATGACCCCAACGATACGACGCCGCGA
+ACGCCCCAAGCAAAGCGGCGATCGCCACCGTCATGCCCACGACCGCCTCGAGCCAGCTGCCGTCTGTCGC
+GAGAACCGCGAACAGCGGCAAGTAGGCCGCCATCGCGAAGTCTTCGAGCACCAGCACCGACAGCACAGCC
+GGCGTTTCCCGGTTGCCGAGCCGACGCAGGTCCTCCAACAGCCGCGCGATCACACCCGAGGAGGAAATGT
+AGGTGACCCCGGCCAGACCGAGGATGGCAACACCGTCCAACCCCAAAAGCCAGCCCGCCACCGCACCGGG
+CGTGGCGTTGAGGACGATATCGACACCCGCCGACGGCAGGTGGTGGCGCAGACTGCTGGCGAACTCGGTC
+GCAGAAAACTCCAGACCCAGGGCCAAAAGCAACAACACGACACCGATGGGCGCACCGGTAGCGATGAACT
+CACCGGCGGCGGCCACCCCCAAGATGCCGCCATTGCCTAACGACAAACCCGCCAACAAATACACCGGAAT
+CGGCGACAACGCGAATCGTCGTGCCACTGCACCCAGCACCGCAAGCACCGCCAACAGGACGCCGAGCTCA
+AACAACAGCGCCCTCGAAACCTCCACCGGTTCAGCCCTTTTCGACGATCTGTTCGACCCCGGCGATCCCG
+TCCTCGGTGCCGATCACGATGAGGACATCTCCGGCTCGCAGCACATCAGTCGGGCCCGGCGAGGCCAACA
+CATCCTCGTCACGCACGATCGCCACAATCGACGCGCCGGTACGGGTGCGCGCACGGGTATCACCCAGCGG
+CCGGTCCACAAACAAGCTACCCGCCCGGATGTGAATCTGACCGGCCTTAAGCCCGGGCACCTCACGCGTC
+AGCTCGGTAAATCGCTCGGCGATCCTCGGCGCACCCAGAATCTGAGCCACCGCCTCGGCCTCTTCATCGG
+TGAGCCGCAAAACCGGTCGGGCTTCGTCCGGATCATCGCGGCCATACAGGACGACGTCGAAACCGCCACT
+GCGCCTGGCAACGATGCCGATCCGGTCACCGCGATAGCTGGTGAACTCGTATCGCAGGCCCACCCCCGGC
+AGCAGCACCTCCTTGACGTCCATAGGAGTCAATCCTTGACGAAATGCGGCCAAGATAGAAGCGGTACGGG
+CAATCTCGTTGACTCAGGTATGCCGGTGCGGCCACGGCAACAACATCGACACCTCGCGGCGGTAATCGCG
+GTATTGGTCGCCCAGCGCCGCGAGTAGGTCGCGCTCTTCGAACTGCAACGCGACCAAGATGTAGCCCGTC
+GCGCCGATCGCGAAAAGCAAGTGCCCCGCCGTCATCATGGGCGTCGCCCAGAACGCGACGACGAATCCGA
+GCATGATCGGGTGGCGTACCCACCGGTAGAGCAGATGAGCCTGAAAACCGATCTCGGTGTACGGCTTTCC
+GCGCCAAGCCAAATACACCTGCCGTAGGCCGAACAATTCGAAATGATTGATCATGAAAGTCGACGTCAAC
+ACCGTGGCCCACCCGAGCCAGAACAACGCCCACAACGCCACCCGGCCAGCCGGCTGCCGCACGTCCCAGA
+TGACCGCCGGCATCGTTCGCCATTGCCAGTACAGCAACAACAGCGCAACGCTGGCCAGCAGTACATAGGT
+GCTGCGCTCGATCGAGGGCGGCACGAATCGAGTCCACCAGCGTTTGAAACCCTGTCGTGCCATCACGCTA
+TGTTGGACGGCGAACACGCCCAGCAGCACCAAGTTGACCACGACCGCCTGGCCGATCGGCGCCGCGATCG
+CGTGATCTACGGTTCGTGGCACCACTACGTCGCCGACGAAACCGATCGCATACCCGAAGGCAACCAGGAA
+TACCAGATAGCTCGCGGCCCCGTAAATGATCGTCAAATAACGCTTCATAACCTGATTCTGCTCCGCAGGA
+GTGTGCAGCTGGGGCGTTCGGCCCGATTGGCGCCAATCAGCGATTCAACAGTGCCATGATGTGCGGCATG
+GCCTCGCGGGCCGCAACGCGTCCCGCCTCGCGGGCGGCGTCGATCTGGTGAAACTCCAGCAGCCCAACAG
+CACCGGTGTCGGGTCTGATAACGACCTGCGCAAGACTGAGTGCGGCATCCGCCCCACGCTGGCTGCCGAT
+TGTCATCGTGCGCATCAAGGTGTCGCCGATTCCTGGCACTTTTGGCGAGCCGTCCTGTCGAGCCGAGCCC
+GGCCCGCCACCACCTAAGCCGATGCTCACCGCGATCAATGGGCCATCAGGACTTGCCCGGGTCGAGACCG
+GAAGGTTGTCTAACACACCGCCATCCACATGCAGTCGACCGTTGTAGACCTGGGGCGGATAGATGCCCGG
+CAGCCGAAGGGAACACCCAATGACATCGACGAGTCGGCCTCGGCGGTGTACGACCGGTCGGCGGGCAAGC
+AAATCGACGCTAACGCAACGGAACTCCTTTGGCAGCTCCTCGACCAGTCGGTCCCCGAACGCTGCTTCTA
+ACAGGGTCAGCGTCCGTCGACCATGGACTAGCCCCCTGACCGGAAACGCGTAGTCACTGAGCGGATTGTG
+CCGAATGAAGTACTCGTATGCGTAGGCGTCCGCTGTTGCCGCGTCCATACCGCACGCTCCGAACACCGCA
+ATAACCGCCCCCATGCTGGTGCCGGCGAACCGGTCGATGGTGACCCCGACCCGCTCTAGCTCGTCAAGAA
+CCCCGAGGTGCGCAAAGCCGCGCGCGCCACCGCCGCCGAGGACTAGACCGATCGAGCGGCCGGCGATGCG
+TGCGGCGAGCGGGCGTACGTTTTCCAAGATGCGTCGGTAATGAACCACATGAACCGATCGCGGCGTGATC
+AATTCCTCCCACTGACGCCGGTGCTCCCGGCTGGCGGCCGGACCGGCCAGCACGAGGTCGGCACCCCGCG
+CACGCGCCGGCAGCCGCGCGGCTTGTGGGTTGGGATCTCCCGCGACCAGCACTATCCGGTCGGCGACGCG
+CAGGCAGAAGTCCCGCCAGCCGGCATCCTCGACCGCGGCATGTAGCACTACCTTGTCGGCGACTCGCTCC
+GCGCGATCAAGGCCGTCGCGGTCGACCCGGCCGGGGTCAACGGCACGCAACCGCGCCGACAGCGCGGTAA
+GCAGGCCAGCGGCCACTGCCGGCACGGGCGCGTCGCCGCTCACTCCGATCACCGAAACGACCACCTCAGG
+CGACGTCGAGTCAGTCGCCGGTGGCGGTGCCTCCCGCAGCCGCGTTGCCAGCACCTTTACCAACGCCGCC
+AGCGCACCATGGTCGGCGATCTCGTCGAACTGTGCCTTGGTGAGCCGCACTAGCTTGGTGTCGCGCAACG
+CCCGGACCGTCGCGGACCGGGGCGCGTCAATAAGTAGCCCAAGCTCCCCGAGAACCTCCCCGCGACCCAG
+TTCTTTGAGAACGATGCTGTCCTGCAGCACCTGCACGCGACCCGTGCGGATCACGTAAAGCGAATCGGAC
+GGGTCACCTTCGTGGAAGAGATAGCAACCCGCCTCCAACTCGACGTCCTCAACGTGCTCCCCGAGCTGTG
+CCAAGGTGGCCGCGTCCAGGCCGGCAAATAGCGGCAGATTCCCCAGCGGATCGGCGTCACCGGCCGCCCA
+ATGCTCAATCGGCGCGGCCGCCGGCTGGGGAATCGGTGGCTCCAACCGCGGCGCGATCGCGGGCTCCGGC
+GCCGGCATCTGGACGGGGTTGCGGTTGGTTCTACCCAGCACCGCGGCCGCGACAGCCACCGCGATGAAAC
+AGATGGCAGCCATAGCCCATCCGCGCCGCAACGCCTCCTCGGCAGTACCGTGCTCCGGCTTACCGATCAA
+GATCACCATCACCGCGACACCGAGCACCGCACCGAGCTGGCGAGTGGTGCTAACGACCGCCGACGAGGTG
+GCATAGCTGCCGCCCTTGGCGACCTCGGCCAGCGCTGCACTGCTCAACACCGGCAACGTCGCGCCGACAC
+CGATGCCCTGCAGCAGTTGGCCCGGCAGCCACACGCGGAGGAAATCCGGCTCGGACCCGACACGCTGCAA
+ATACCACACCAGGCTGCCGGCCCAGACCAGCGCACCAACGAGGACGATGACGCGATGCCCATGCCGACCG
+GCAACCCGACCCAGCGCCGCCGCCACCACGGCAGCCACCACCGCAGCGGGCGCGATCGCGAAACCCGCCT
+TCAGCAGCGAGTAGTGCCACACATAGTTGAGGTAAAGCACATGGGTAAGGCCATAGCAGTAAAAACCCGC
+TGCGGCGACCAGCGTGAGCAGGTTGCCCGCCACGAACGACCGGCTACGCAACAGCGCCGGCTCGACCAGC
+GGCGCGGGGTGCGACCGCGAGCTGTGCACGAACCCAACCGAGGTCAGGACGCTGGCCAGGAACGAACCGA
+CGGTGGCCACGCTCAACCAACCCCAGTCCGGCCCCTTGACCAAACCGAGGGTAACCAACCCGAGCGTTAC
+CGCAAGCAGCAGCGCACCGCGCAAGTCAGGCATGCGGCGCCGGCCCGAGGCGCGGCTCTCGACGAGCATG
+CGCTTGGTGGCGATCGCCGCGACGATGCCCAGCGGAACATTGACCAGTAACACCCACCGCCAGCCGGCCC
+ACTCCACGAGGAGCCCGCCGATCGGCGGGCCCAGGCCAGCCGCGATCGCTGCCGCCGCACCCCACAGGCC
+GATAGCGTGCGCGCGGCGCGCCGCGTCGAAGCCCTCAACGACCAGTGCGAGCGAAGCAGGCACGAGTATC
+GCAGCCCCGATGCCCTGCAGCACCCGGAACGCCACCAACTGCTCGACACTGCCGGCGACGGCGCACAGCC
+CGGACGCAATGGTGAACACCAGCACACCGGACAGGAATGTCCGTCTGCGGCCCAGCAAATCGGCCAACCT
+GCCGGCCGCAACCATGAAGGCGGCGAAGACGATGTTATAGCCGTTCAGAATCCAGGACAGGCTCCCGATG
+TCGTAGGACGGGAAGGAACGCTGGATATCCGGGAACGCGATGTTGACGATTGTCGAGTCGAGAAACGCCA
+GGAAAGCGCCGAACCCCGCTACCAGCAGAACCGACGCCGACGAAGGTCGGCGACGACGGGTGAGATTAGC
+GAACCCCTTGCCGCCGTGCAACGAAATGTGCATGCGCGCCGGGGCGCGGGGTGTGCCGGGAAGTGACTTC
+TGGGAACTGAGAAACCGATACACCCATCTGCAACCTACGCGCTAACGCTTCTTGACCGATTTCGGCGGCT
+TGGCGCCGCGGCCTTGTCGGCGGGCGGCTTCGCGCCGCTCGCGCCGGCTAGCACCGGCCGGCACTCCGGC
+CGGCGTCTTGTGGGCTCCACCGCCGTTGCGCTGCACCTGAGCCGAGCCATCCTCCGCGGGACCGGAATAG
+GTCAAAGCGGGCGACTCGCTGGCAACACCCTTGGCGCGTAATGCACTTGGAGCTCTTTCGCGCGCGCCAC
+CATCGACCGCGCTGCGTTGCTGCGCGGCGGCTGCGGCCGCGGCGGCGAATTCGGCAAGCTCTGCGGGTTC
+GGCAGCCGGGGCAACCGGCGGGGCGGGGACCGCCTCCACGGTGACGTTGAACAGGAAGCCGACCGATTCC
+TCTTTCATGCCGTCGAGCATGGCCATGAACATGTCGTAGCCCTCACGCTGGTACTCGACCAACGGATCGC
+GCTGCGCCATCGCGCGCAGCCCGATACCCTCCTTGAGGTAGTCCATCTCGTAGAGGTGTTCACGCCACTT
+ACGGTCTATGACGTTGAGCAGCACGTTGCGTTCCAGCTGGCGCATCGCACCCTCGCCGGCGATTTCCTCG
+AGTTCGGCTTCCCGTGCGGCATAGGCACGTTCGGCGTCCTTGAGTAGTGCCTCCAGCAACTCCTCGCGGG
+TGAGATCGTCGCGCTCGAATTCGTGGTCCTTGCGGGTCAGCGAGTCGGCGGTGATCCCCACCGGATAGAG
+GGTTTTGAGTGCCGTCCACAACGCGTCCAGATCCCAATCTTCGGCATAGCCTTCGCCGGTCGCGCCGTCG
+ACGTAGGCGGTGATGACATCGCGGACCATGTCCAGCGCCTGGTCCTTGAGGTTTTCGCCTTCGAGGATGC
+GCCGGCGCTCGGCGTAGATGACCTTGCGCTGCTGGTTCATCACCTCGTCGTATTTGAGGACGTTCTTGCG
+GACCTCAAAGTTCTGCTGCTCGACCTGGGTCTGGGCGCTCTTGATGGCCCGGGTGACCATCTTGGCTTCG
+ATCGGCACGTCGTCGGGCAGGTTCAGCCTGGTCAACAAGGTCTCCAAGGCCGCGCCATTGAAGCGGCGCA
+TCAGCTCGTCACCCAGCGACAAATAGAAGCGCGACTCCCCGGGGTCCCCCTGGCGGCCGGACCGGCCACG
+CAACTGGTTGTCGATCCGCCGCGACTCGTGGCGCTCGGTGCCCAGCACGTACAGGCCGCCGGCCTCGATT
+ACTTCCTTGGCCTCCTTGCTGGCTTCCTCTTTGACGATGGGCAGTTCGGAGTGCCAGGCCGCCTCGTACT
+CCTCGGGCGTCTCCACCGGATCCAGGCCGCGTTCGCGCAGCCGCTGATCGGTGAGAAAGTCGACGTTGCC
+GCCCAGCACAATGTCGGTGCCGCGACCGGCCATGTTGGTGGCGACGGTGACGCCGCCGCGGCGGCCCGCC
+ACCGCGATGATGGTCGCCTCTTGCTCGTGGTACTTGGCGTTGAGCACATTGTGCGGGATGCGCCGCTTGG
+TGAACTGCCGCGACAGATACTCCGAGCGCTCCACGCTGGTGGTGCCGATCAGCACCGGCTGTCCCTTCGC
+GTAGCGCTCGGCGACGTCGTCGACCACCGCGATGTACTTGGCCTCCTCGGTCTTGTAGATCAGGTCGGAC
+TGGTCTTCACGGATCATCGGCATGTTGGTCGGGATGCTGACCACGCCCAGCTTGTAGATCTCGTGCAGCT
+CGGCCGCCTCCGTCTGGGCGGTGCCGGTCATGCCGGCGAGCTTGTCGTAGAGCCGGAAGTAGTTCTGCAG
+CGTGATGGTGGCCAGCGTCTGGTTCTCGGCCTTGATCTCGACGTGCTCCTTGGCCTCGATGGCCTGGTGC
+ATGCCCTCGTTGTAGCGGCGGCCGATCAGCACCCGGCCGGTGAACTCGTCGACGATGAGCACCTCACCAT
+CGCGGACGATGTAGTCCTTGTCGCGGCTGAACAGCTCTTTGGCCTTCAGAGCGTTGTTGAGATAGCTGAC
+CAACGGCGAGTTGGCGGCCTCGTACAGGTTGTCGATGCCGAGCTGGTCTTCGACGAATTCCACACCCTTC
+TCGTGCACGCCGACGGTGCGTTTGCGTAGATCGACCTCGTAGTGGACGTCCTTTTCCATCAGCGGCGCCA
+ACCGGGCGAACTCGGTGTACCAGTTGGAGGCGCCGTCGGCGGGACCGGAGATGATCAGCGGGGTGCGGGC
+CTCGTCGATCAGGATGGAATCGACCTCGTCGACAATGGCGTAATGGTGCCCGCGCTGCACCAGATCATCC
+AGTGAGTGCGCCATGTTGTCGCGCAGGTAGTCGAACCCAAACTCGTTATTGGTGCCGTAGGTGATGTCGG
+CGTTATAGGCCACCCGGCGTTCATCGGGTGTCATGGTGGCCAAAATCACCCCGACCTGAAGCCCGAGGAA
+GCGGTGCACGCGGCCCATCCACTCACTGTCGCGTTTAGCCAGGTAGTCGTTGACGGTGACGATGTGCACG
+CCGTTGCCGGCCAGCGCATTGAGGTAAGCGGGCAACACACAGGTCAGGGTCTTGCCTTCACCGGTCTTCA
+TCTCGGCAACGTTGCCCAGGTGCAGGGCGGCCGCACCCATCACCTGCACGTCGAACGGCCGCTGGTCCAG
+CACCCGCCAGGCGGCCTCGCGGGCCACGGCGAAGGCCTCGGGCAACAGGTCGTCGAGGGTTTCTGGGTTT
+TTCTGGTCGGCCAGCCGCCGCTTGAACTCGTCGGTTTTCGCCCTCAGCTCGGCGTCGGTGAGTTTCTCGA
+CATCGTCGGACAAAGTGCCGACATAGTCGGCCACCTTCTTGAGGCGCTTGACCATGCGACCTTCGCCAAG
+GCGCAGCAACTTCGACAGCACAGCTATGTCCCCGCATGTGTAGGAGTCTTTAGATAAGGCGACTCCCATG
+GTAGGTGACGACGCGGCGCGCGCCGCCGATCACGCCAGACGGATCAAGCCGTAGTCGTAGGCGTGCCGGC
+GGTAGACCACCGACGGCCGTTCGGTGTCCTTGTCGTAGAACAAGAAGAAGTCGTGTCCAACCAGCTCCAT
+CTGGTAGAGCGCGTCATCGACCGACATCGGCTTGGCCGGGTGTTCTTTGGTGCGAACGATCCGCCCAGGC
+TCCCGCTCGACGACGGCACCGTCGTGATCGTGTGCCTCGGCTGGTCTGGTGTTGAAGCCGTTCTCCGGCG
+CTGGCACCACCGCGGTCGCCTCGGCCAGCGAAACCGGGGTTTTGTCGCCGTAGTGCACCTTGCGGCGATC
+CTTACCGCGGCGCAGCCGGCTCTCCAGTTTGACGACCGCTGATTCAAGCGCGGCATAGAAGCTGTCGGCG
+CAGGCCTCACCTCGCACCACCGGCCCTCGCCCACGCGCGGTGATCTCCACGCGCTGACAGGACTTGCGCT
+GGCGGCGATTACGTTCGTGGTCGAGTTCGACGTCGAACAGGTAGATGGTCCGGTCGAACCGCTCCAAGCG
+GGCGAGTTTCTGCGAAACGTAGATGCGGAAGTGGTCGGGGATCTCGACATTACGGCCCTTGAACACGATC
+TCAGCGTTTGATTTCGGTTCGGCCAGAACCTGACCTGAATCCACGGCTAGCCTTGACATACGTGACAACT
+CGTTTCTCTTTCCACGTCACACGCGCCCTGCGTGCCTGGCCTTCGGGGAGACGCGCCGACGGGGTGGGAG
+CGGTTGGAGAAGTTACCGCCGCAGGCTGCCCGCCGGAGCAAGATGTCGATTGCTCACCTCCTATCGCGGG
+ATGCTGATTCAACCTGGGAAGCGCGAGCGTGAGTCGTTAAAGGTTGATCTCGACGTTAGCCCGTGTTCGG
+CTCACCGTGCCACCAAATTGACCGACCTGTTTCGAGTTCTTCACGTTGTCTTGGCAACTGCACCGGCTCA
+GGCAGATCCTCACGCGGCCGCGACCGCCAACACGGCACCCACCCGCACACCGGCGGCCTGCAAGACCCGG
+ACCGACTCGCGCGCCGTCGCCCCGGTGGTGATGATGTCGTCGACGAGCACGACTTCGTTGCGCGGCCGCT
+GGCCCCGCAACAGCACCCGACCCGTGATGTTGCGCTCGCGCGCGGACGCCCCAAGACCTACCGAGTCCCG
+GGCTAGCGCTCGCATCCGCAGCGCCGGGACGACGGTGACGTCATGGTGGCGCCCAAGGGTGGCACCCGCA
+ATCCGCGCCATCCGGCTGACGGGGTCACCCCCACGCCGTCGCGCCGCCCACCGTCTCGTCGGCGCAGGCA
+CCATCGTCAGCGGGTTTTCGAGCATGCCCCAGGACAACAGGTGGTCGACACCGACAATCAGCGCGCACGC
+CAGTGGCGCGACGAGGTCGCGACGGCCGTGCTCTTTCATAGCGAGGATCGCCTGACGACGCACGCCCGCG
+TAGCGGCCGAGCGCGAACACCGGCACCTGTGGGTCAACACGAGGACTCACCACGTGCGGTTCACCGGCAG
+CCACCGACAGCTCGGCGGCACAGGCGGCACACCAGCGGGTCGCCGGCGCACCGCAGCCACCGCATTCCAG
+CGGCAGGACGAGGTCAAGCACACACCAAGTGTCGCGGTCACCGGTGACAGCAGTGCTGTCAATCGGCGCC
+GCTGCGCAGCGGCGGCCAGACAAAGCTGAGCGCACCCTGACTCAATTGGGTAATCACGCTTTCCAGATAA
+CGCAGCGGCAGCTCCGTTCGCCACTCCGGAAGCAACGCAGAGAGCTGCAAACAATCGGCTGCGAGGCTGA
+CGTCGGTGATGCGCAGCCCATGCGGCAGCTCAGGCAGTGGCACTCGGTAGGCCGGTGTCCGTGCCGGCAG
+TGTCCACCGCCGTTGTCCGGTGATCACGGTGCGCGGTCGCAGCCACAGTGTCGTCTGGGAGGTTGTGCCC
+GCCACGTCGACGTCGACCTCAAGACCTCCCCAGTCGGGCCGGCGCGCCCAGCGCAGCCGGGCCGCTCCGC
+TCTCGGACAACTCACCGCGCAGCTGCGGCGTCGCTTGACGGAGCACATCATCGAAAATCTCGGTCGGCAG
+GGCGGACGACAACTCGACGGGAGCGGCGATCACCAGCGGCGGCACACCCGGGCGGATGTGCACGTTGCGC
+AGGACGGCAACGGCGCTGTGCAAATGATGCTGATCCCAGCTGATGCCGCGAGCGGCCACCCGAACCTCGC
+CCAGCTGGCCGACGGCCAGCCCCTGCGGTTCCAGTGCCGAGTCCAGCTCGGTGACGGTCAGCACCACGTC
+ATGGTCCCCAATCCGAACCGTGACTTCCTTGCCGATGAGCAGCTGCTGCAAGGTGGTGAACAACGTCCGG
+TAGGGCGCCGCAACTGCCTGGGCGGCTCCCGCGCTGACCAGCGACATCCCGGTCGACGACCACAGCGAGG
+CCAGCATGTCCAAGGCACGGAAGGGATCATCCCAACGCAGCCGGGGAACTCTTGGCGACATCAACAAGCG
+CCTCCTCACTGCGAGGGTAGCCGGTGTGCTCAGGTCGCGAAAAACGCAGGCACAGCACTCATCCGGGCAA
+TACCGGCGCCGCCCCCGGCACCATCAGCCCCGGTACGTCCGCCCAGCCTGGTCGGCTTTCGACAGACGCC
+GAGTACATCAACACCCCTTGCGGGCCGGCGACATACACAGTCGACGGGTTGGCCGCGATCGCCGTCAGTG
+GAGTTTGCAACCCGCGGGACGGCGCGTCGGAGTTCACCCCGTCGAGGTTTACATAAGACACGGGATGGGC
+GGCGTCGGTGCGTGTCACCACGATGTCGTCACCGGTTCGCCAGGACAACGACACCACCGAGGAACCCAGC
+CCGAAACCCAGCCGCCGAGGGTAGGTCAGGGCGAACTGGCCAGCCTGGGTCTGCTCGACGCCGGCGAGGA
+TCACCTGCCCACCGATCACCATCGCGGCGCGCGTCCCGTCACGGGACAGTTGAAGATCGTTGATCGCCCC
+CGGGAAGCGGCTGGCCACCGCGGTCGAATCCACCGGAATCCGCGCGGGTTGCCCCGATGCCGGGTCCTGT
+ATCGCTCGCAGCACGACGTTGGTATCGACCACCACCCAGACCGCGTCGTCCAGCGACCAGCTGGGCCGCA
+ACAGGCTGTGCCCGTCGGCGGACTGCACCGCCTCGCCGCCGAGGTCGCCGACCCACAAAGACGCCGCCTC
+ATCCGGAGCCCCGCGCCCCAGCGTCACCACCGAGGCCACCTGACGCCCGCTGCGTGATACGGCGGCCGCC
+GTCTGCTCCGGCATCCGTCCGAAGGCCCCGGGCACGGGGGTGACTCGCTGTGCGTCCATCGCCACCAGTG
+ATCCGTTCACCAAGGCGTGCAACCCCGCGGCGGCACCGTCGGCCACCCCCGGGTCGGTGGCCGCGACATC
+GGAAGTGGTCCACCCCTCGGCAAACCTGTCTTCCAGCGGGGCGCCGTCGGCGTTGATCACGTACGGCCCC
+CTGATGTCGGCCCTGGCCAAGGTCCAGATGATCTGTGCGGCAAGTAATTGCCTGCTGTGCGGATCGGTGG
+TGGACAGCTTCTCCATGTCGACTCGCGCGCCGCCGTACCCGCGGCCGATTCCGCTCTTTCCGCCGTCGGC
+CCGAGTCACCGGCCCGCGCAGTCGTAGCGGCGGAGCGAGCAGATTACGCACCGTGCGCGCCATCTCCGGG
+CGTGGACCCGCCAGCAGTTTGGAGACGAGCTCCGTGGCCAGCTGGTCGCGGTCGGACACAGCGACGTAGC
+GCGGATCGGGAACCACGGTCTTGCCGGTGGGGTCGGCGAAGTACAGGGTGTTGCGCTTGTACGTTTCTTG
+GAACTGCTGCCAGTCCAGGAAAACCCCGTTGGGTAGGCGATCGATGCGCCAACCACCGGACGTCTTGACC
+AACTCGATCGGGCCCGGATCCGGCAGTTGACCCTCGGCGGTCTCAAACACCCCCACATCCGAGAGCGAGC
+CGAGAATGTCTGCCCGCATGGTTACCGAAACCTTCTCGGCGCTTCGGGTTTCGACGAACACCACGTGGTC
+GATCAACAACGCGCTGCCGGCGTCGTCCCAGGCGTTGGAAGCCGATTCGGTGAGGAACTGACGCGCCGCT
+AGGTGCCGGTTGGCCGGGTCGGCTGTGGCCTTGAGGAACTCGCGTAACAGCACGTCGGGATCCATACCCG
+GGCTCGGTTTGGGCAGATTCGACGGCACCGGACGTTCGACGGTTCCGATGGCTTGCGGGGCCGACGTGCT
+GGGCACACTGGCACAGCCGGCCAGCACTGCACCAAGGAACAACAAAATTGTCAGCCGCATCAACCGCTCC
+ACTCCGCGTGCTCACGTGGGCGCTGACGTTCCTTGTATTCCGGTGGCATCGGTTGCGGATTCGGTTGCGC
+GACCGGTTGCAGAACTGGCTGCGGGATCGGTTTCATGGGCAGCGGGCTGGTGGTGACCTTGTGGCCGCGC
+ACCAGCGGAAGCGTCAGCCGGAAGCAGGCGCCCTCGCCGGGTTCGCCCCACGCCTCAAGCCGACCCTGGT
+GCAATCGGGCATCCTCGACGCTGATCGCCAAACCCAGCCCGGTGCCGCCGGACCGACGTACCCGTGAGGG
+ATCCGAGCGCCAGAACCGGCTAAACACCAGCTTCTCCTCACCAGGCCGCAGCCCAACCCCGTAGTCACGC
+ACGGTGACGGCGACCGTGTCTTCGTCGGCGGCCATCCGGATCCGCACCGGTTTGTGTTCGGCGTGGTCGA
+TGGCATTGGCAATCAGATTGCGCAGGATCCGTTCTACCCGACGCGCATCGACCTCCGCGATCACCTGCTC
+GGCGGGCAGATCCACCAGCAACTCGATACCGGCCTCCTCGGCCAGGTGGCCCACATTGCCGAGCGCGTTG
+TTGACCGTTGTGCGCAAGTCGACCGCCTCAACCGACAACTCGGCCACCCCGGCGTCATGCCGCGAGATCT
+CCAGCAGGTCGTTGAGCAACGTCTCGAATCGGTCCAGCTCGCTAACCATCAACTCGGTGGACCGCCGCAG
+CGTGGGGTCGAGGTCGGCGCTGTGGTCATAGATCAAGTCGGCCGCCATCCGCACCGTGGTCAGCGGCGTA
+CGCAGTTCGTGGCTGACGTCGGAGGTGAACCGGCGCTGTAGGTTGCCGAACTCCTCCAGCTGGGCGATCT
+GTCGGGACAGGCTCTCGGCCATGTCGTTGAACGACACCGCCAGCCTGGCCATGTCGTCCTCGCCGCGCAC
+CGGCATGCGTTCGGACAGATGTCCCTCGGCGAAACGTTCGGCGATCCGCGACGCCGACCGCACCGGCACC
+ACCACCTGACGCGACACCAGCAGCGCAATGCCGGCGAGCAGGACTAGCAGTACCAGGCCGCCGGTGGCCA
+TCGTGCCACGCACCAGCGTGATCGTGGCTTGCTCGCTCGCCAGCGGAAAGATCAGGTATAGCTCCAGGTT
+GGCCACCCGCGACAACGTCGGAGTCCCGATGATCAGGGCCGGCCCGGAGAAACCTTCGGTCTGCACCGTG
+GCGTACTGGTAGGCGGCCTGCCCGGCCTTGACGAAGCCGCGCAGCGCGTTGGGCACCTGATCGACGGGTC
+CGGCAGTAGAGGCAGCGCGCGGCCCATCACCCGGCACCATCAGCACCGCATCGAACGCACCGGCGAGGCC
+AGCCCCCGAAGCGGGGTCGGTTTTCGACGTCAGAGTGTTGCGCGCAAGCTGCAGGCTACTGTCCAGTGAG
+CGCGTCTCCTCACCGTTGACGATCCCGCTGACGGTGGTGCGTGCCCGCTCGATCTGGTCGATCGCCGCCC
+TGACCTTGATGTCGAGGACACGATTGGTGACCTGGCTGGTCAGCACAAAGCCAAGCGCCAGGATGACGGC
+TAGCGACAGTCCAAGGGTCAGCGCCACGACCCGCAGCTGCAGCGATCGGCGCCACGCGACAGCTACGGCT
+CGACTCAACGCACTGAGGCCCCGTGTCATCGGGCCAGAGCGACCCCGGCGACCCCGAATGCGTCGGCGCG
+AGCCGAAGATCATCGGCGCCGCTCCTTAGCATCGCTGCGCTCTGCATCGTCGCCGGCGCGGATCACGGAG
+GTCCGGCCTTGTACCCCACTCCTCGAACGGTCAGCACCACAGTCGGGTTCTCGGGATCCTTTTCGACCTT
+GGCCCGCAGACGCTGGACATGCACGTTCACCAGCCTGGTATCGGCTGGGTGCCGGTAACCCCATACCTGT
+TCGAGCAGCACATCACGAGTAAACACCTGGCGCGGCTTGCGCGCCAATGCGACCAACAGGTCGAATTCCA
+GCGGTGTCAACGAGATCTGCTCACCGTTGCGAGTGACCTTGTGCGCCGGTACGTCGATTTCTACGTCGGC
+GATGGACAGCATCTCGGCGGGTTCGTCGTCGTTGCGGCGCAGCCGCGCCCGCACCCGCGCAACCAGCTCC
+TTGGGCTTGAACGGCTTCATGATGTAGTCGTCGGCGCCCGACTCCAGACCCAGCACCACATCCACGGTGT
+CGGTCTTTGCGGTGAGCATCACGATCGGAACACCGGAATCGGCGCGCAACACCCGGCACACGTCGATGCC
+GTTCATACCGGGCAGCATCAAATCCAATAACACCAGATCGGGGCGCAGCTCGCGCACCGCGGTCAGAGCC
+TGAGTACCGTCGCCGATGACCGCGGTGTCGAAGCCTTCCCCCCGCAGCACGATGGTGAGCATCTCAGCCA
+ACGAAGCGTCGTCGTCAACGACCAAAATCCTTTGCCTCATGGTGTCCATGGTGTCACCACATCGGGACAA
+AACTGGCGCACCACACGGGCGTTTCTTGCTTGATTAGGGCAAATACCCTCAACTTGGCACGTCTGGAGGC
+GCCAAAGTCGCCGCTAGTCGGCCCGGATCAACATCGGCGCCGACAACCAGCCACCGGCCGCCCCACCCTT
+GGGCCGCCAACTCGGCGTAGACCGCACCGGTGCGCTGCTGAAGTTCAGCGTCGCGTTCGTAATTGTCGCG
+CGCCCGACCGGGGTCACGCTGGGCACGGCCGCGGGATCGTTCCCCGGCGAGCTCGGCAGAGACCGCAAGG
+AGCACCTGCCAGTCGGGCTTGGGCAACCCGAGTCTTGCAAATTCGATCCGCTGAACCCAGGCCGCTGCCT
+TCCCGGCCGCGTTTTCATGTAGGCGCGCCGCGCTGTAGGCCGCGTTGGAGGCGACGTAGCGATCCAGGAT
+CACCACGTCGTAGCCGCGACACAGCCCCTGGATCGTGTGGACCGCGCCAGCGCGGTCGAGCGCGAACAGC
+GTCGCCATCGCATACACCGACGATGCGAGGTCACCGTGCTCGCCGTGCAGCGCCTCCGCTGCGATGTCGG
+CGGCCACCGACTGTCCGTAGCGCGGGAACGCCAGTGTGGCCACCGATCTCCCGGCTGCTCGAAAGGCCCC
+GGACAGCTTTTCCACCAACGTCCGCTTGCCAGCGCCGTCAACGCCCTCAATCGCGATTAGCACGGCGCGG
+CCCTGTCGGTGGCGGCGCGAGCAGACGCAAAATCGCCCTTTTCGTCATGAAAATGGGCGATTTTGCGTCT
+GCTCGCGGGTGGGAGGCACTCAGTAGCGGTAGTGGTCCGGCTTGTAGGGACCCTCGACGTCGACGCCGAG
+GTATTCGGCCTGCTCCTTGGTCAGCTTGGTCAGGTGACCGCCAAGGGCCTCGACATGGATTCGAGCCACC
+TTCTCGTCGAGGTGCTTGGGCAGCCGGTACACCTCGTTGTCGTACTCGTCGTTCTTGGTCCACAGCTCGA
+TCTGGGCGATCGTCTGGTTAGCGAAGCTGTTGCTCATCACGAACGAGGGGTGCCCGGTGGCATTGCCCAG
+GTTCAGCAGCCGCCCCTCGGACAGCACGATGATCGAGCGGCCCGTGTCGCCAAAGGTCCACAGGTCGACC
+TGAGGCTTGACGTTGACCCGTGTCGCCCCGGAGCGCTCCAGCCCGGCCATGTCGATCTCGTTGTCGAAGT
+GGCCGATATTTCCCAGGATCGCGTGGTCCTTCATCGCCTTAATGTGCTCGAGCATGATGATGTCTTTGTT
+GCCGGTCGCGGTTACGACGATGTCGGCGTCCCCGATGGCCTCCTCGACGGTGACCACGTCGAAGCCCTCC
+ATCATGGCCTGCAGCGCGTTGATCGGGTCGATCTCGGTGACGGAGACCCGCGCTCCCTGGCCCTTCATCG
+CCTCCGCACAGCCCTTACCGACGTCGCCGTAGCCGCAGATGAGGACCTTCTTACCGCCGATCAGCGCGTC
+GGTGCCGCGGTTGATGCCGTCGATCAGGGAGTGCCGAGTGCCGTACTTGTTGTCGAATTTGGACTTGGTC
+ACCGAGTCGTTGACGTTGATCGCCGGGAAGGCCAGATCCCCGGCCGCGGCGAATTGGTAGAGCCGCAGCA
+CGCCGGTGGTGGTCTCCTCGGTGACGCCCTTGACCGACTCGGCTATCTTGGTCCACTTGTCCTTGTCGGT
+CTCGAAGCGGGTCCGTAGCAGGTTCAGGAAGATCTTCCACTCGGCGGGGTCGTCCTCCTCGGCGGGCGGC
+ACCACGCCGGCCTTCTCATACTGCATGCCGCGCAGCACCAACATGGTGGCGTCACCGCCGTCATCGAGGA
+TCATGTTGGCCGGCTTGTCGGGGTCCGGCCAGGTGAGCATCTGCTCGGCGGCCCACCAGTACTCTTCGAG
+CGTCTCGCCCTTCCACGCGAACACCGGGACACCCTTGGGCTCGTCGGGGGTGCCGTGCGGGCCGACCACG
+ACGGCGGCGGCGGCGTGATCCTGGGTGGAGAAGATGTTGCACGAGGCCCAGCGGACTTCGGCGCCCAGCG
+CGGTGAGGGTTTCGATCAACACCGCGGTCTGCACCGTCATGTGCAGCGAACCCGAGATCCGGGCCCCCTT
+CAGGGGTTGCACCTCGGCATACTCGCGCCGCAGCGACATCAGGCCGGGCATCTCGTGCTCGGCGATCCGG
+AGTTCTTTGCGGCCGAAATCCGCTAGTGACAGGTCGGCGATCTTAAAGTCGATGCCGTTACGAACGTCAG
+GGGTCAGCGAATTTTTGGTCACCAAATTTCCGGTCATAGGGGCTTTCATCCTTCTTTGGGGGCTCACAGG
+GATCCGAGCGGGCTACTTAGCCTAGGTACGCTCTTGCAGTCACTGTAGCCGCCGTCGGTCAGCCCCGCAG
+GTCAGGGGACATTGATCACACCGTGACGCTCCGCGAACGGCGTTATTAGCCGTGCTAGGTCCGCTGCGAC
+ATCATGGTCGGCCTCGGGCGGCATCGACACGTAGCTCAAGCACAGCCGCACGATCGCACGCGAGAGCACA
+TTGGCGTCGTTATCGGTGGTGGCCACCCAGGTATCGGTGAAGGCCGGCGCCAGCCGGGCCGACGCGCGGG
+TGATGATCGGCGCGCTGTCGGTGGTGATCAGTTGCAGCAGATCGGGCTTGGCGACACCGGTCAACAGCGA
+GATGACCAACGGATCTGCCGCCGACTCGGCGAAGAACGACCGAAAGCCCTGCAGGAACGCTTCGTAAAAG
+TTGCCGACGTTGGCGTCCAACGATGCATGGACGTTGTCCACTAATCGGTCGGCCAGGCGCAGCGCGTATC
+CCTGCGCCAGGCCTTGCCGGGAACCGAATTCGTTGTAGATGGTCTGCCGGCTGATGCCCGCCGCGCGGGC
+CACGTCGGACAGCGTGATGGCGGACCAGTCGCGGGTCAGCAGCAGATCCCGCATCGCATCCAGCACCGAA
+TCCCGCAACAGGGCCCGCGAGGCCTCGGCATAGGGTATCCGCTTCACAGGCGCGACAGTAGCGCTTGGAG
+TGCTCACGAGCGAGCCACCTCCACCATCTCGAAATCCGACTTTGCCGCACCGCAATCCGGGCAACTCCAG
+TCATCGGGGATGTCGTCCCAGCGGGTGCCGGCCGCGATGCCGTCCTCCGGCCAACCCAGCGCCTCATCGT
+ACTCAAAGCCGCATTGGATACAGCGGAACAGTTTGTAGTCGTTCACTTAGTTACCCTCCTATCTTTTCGA
+AATCGACCTTCTCGCGCACCGCGCAGTCCGGGCAGCACCAGTCGTCGGGAATTTGATCCCAGCCTGTGCC
+GGCTGGGAAGCCTTCCCTGGCATCACCGTTGGCCTCGTCGTAGACGTAGTCGCAGACCGGGCACCGGTAG
+GCGGCCATCATGCCGAGGCTCCGTAACGGGCGAGTGCCTTCTCCCGCACGCGCGGGTGCAGGTTAACCCG
+AGTGATATCGCCGCCGTAGTGCTCCAGCACCCGGTGATCCATTACCTTGCGCCACAACGGCGGGAAGTAG
+GTCAGCGAGATCATCGATGCATACCCACTGGGCAGGTTGGGCGCACCCGCCATGCTCCGCAGTGTCTGAT
+AGCGGCGAGTGGGGTTGGCGTGGTGATCGCTGTGTCGCTGCAGGTGGTAGAGGAACAGGTTGGTGACGAT
+GTGGTCGGAGTTCCAGCTGTGCACCGGGGCGCAGCGCTCGTAGCGGCCGTTGGCGCTCTTCTGCCGTAGC
+AGTCCGTAGTGTTCGAGGTAGTTGACGGCCTCTAACAGGCTGAAGCCGAAGACTGCCTGGATGATGACGA
+ACGGGATCAGCGCCGGGCCGAAGACCGCGATCAGCCCACCCCACAACACCACCGACATCAGCCACGCGTT
+GAGCACGTCGTTGCGCAGATACGTCATGGGATTCCAGGGGCTGACGCCGAGCCGACGCAGCCGTTGGGCC
+TCCAAATGAACGGCCGAGCGCAAGCCGCCGATAACACTGCGGGGCAGGAACTCCCACAACGTCTCGCCGA
+ACCGCGCCGACGCCGGGTCCTCCGGTGTGGACACCCGGACGTGATGGCCACGGTTGTGCTCGATGTAGAA
+GTGCCCGTAGCAGGTCTGGGCGAGGGTGATCTTGGACAGCCACCGCTCCAGCGAATCCTTCTTGTGCCCC
+ATTTCGTGGGCGGTGTTGATACCGACGCCGCCAAGCACACCGACCGACAGCGCCACCCCAAGCTTGCCCG
+CCCAGCTCAAGGCGCCGTCAAAGCCGAGCCAACTGAGGTTTGCGGCGGTGAACAGGTATGCGCCCAGCAC
+CACGCTGAGGTACTGGAACGGGATGTAGATGTAGGTGCAGTAGCGGTAGTACTTGTCATTCTCCAGCCGG
+TCGGTCACCTCGTCGGGCGGGTTCTGCCCGTCGGGCCCGAAGCGTAGGTCAAGAAGCGGCAACAAGACGT
+AGAGCAGGATCGGTCCGATCCACAGCGGCACCTGCGCGGCGGCGTGCCAGCCGAGCTGGTTCATCCCCCA
+GATCAGCGGCAGCATCACCACCAAGGCCGTCGGGGCGATGAGGCCCATAAGCCACAGGTAACGCTTCTTG
+TCCCGCCACTCCTCGACTTCGGGCGGCCGGGGGGCTTCGGGTCCACCAGAGCCGATTTGCGTGGTCATAT
+GCCAAACCTCCTCATGAGCCACACCACGTTGGGATTTGACAATAGAGCAGTTTGCGTCTTATGTCTAGAC
+ATATAACGCAATTTGTAAATACGCGGCGAAGCTAGTTCAACACCTCCGGGTCGCGCTCTCTCGAGCTTGC
+CGAAGGCCCTGCGCCGAGTGCCGGCGCCCGTAGCCGACATAAATCGCGGTTCCGGCCACCAGCCAGATCC
+CGAACCGGATCCAAGTCAACGCGGTGAGGTTCAGCATCAGCCACAGGCACGCGCACACTGCGGCGATCGG
+AAGTAACGGCACCCACGGAGCTGTGAACCCCCGCTGAAGGTCGGGTCGGGTCCGGCGCAGCACGACCACT
+CCGGCCGAGACGAGGATGAACGCGAACAGTGTCCCGACGTTGACCATCTCCTCAAGCTTGGTGATCGGAA
+ACACCGACGCCGTCGTGGCCACCAACACCGCGACCAGCACCGTGACCCGGACCGGGGTGCCGCGCGAACC
+GGTCTTGGCCAATTGCCGCGGCACCAAGCCGTCGCGCGCCATGGCGAACAGCACGCGGCATTGCCCGAGC
+ATCAACACCATCACCACCGTGGTAAGCCCGGCCAGCGCGCCGACGGAGATGATGCCGCTGGCCCAGTACA
+CCCCGTTGGCCTGGAACGCGGTGGCCAGATTTGCCGGCCCGCGGCCCGGTACGGTCCGCAGTTGGGTGTA
+TGGAACCATGCCCGACAGCACCACCGATACCGCGACGTAGAGAAGGGTCACGACCCCCAGCGACGCGAGA
+ATCCCTCGAGGGACGTCTCGTTGAGGACGCTTGGTCTCCTCGGCCATGGTGGCCACGATGTCAAACCCGA
+TAAACGCGAAGAACACGATCGATGCCCCGGCCAGCACGCCGTACCATCCGTAGTGGCTGCCTTGGGCTCC
+GGTCAGCAACGAGAAGACGGATTGATCGAGCCCGCCGCCGTGGTGCTGGACTTCGGGCTCGGGAATGAAC
+GGCGAGTAGTTGGCGGCCCTGATGTAGAAGGCACCGACGACCACCACCAAGACGACCACCGACACCTTGA
+TTGCGGTGACCACCGCGGAAAATCTCGACGACAATTTGGTGCCCAACGCGATCAGGGTCGCCACCAACGT
+GACGATCACGAGCGCACCCCAGTCGAGCTGCAGCGATCCGAGATGGCCTGTGCCATTACCGAATCCGAAC
+ACGGTGCCCAAGTAGCTGGACCAGCCTTTGGCGACCACGGCCGCACCCATCGCCAGTTCCAGCACCAGAT
+TCCAGCCGATCACCCAGGCCAAGAACTCCCCGAAGGTGGCATAAGAGAAGGTATAGGCGCTGCCGGCCAC
+CGGCAGCGTCGAGGCGAACTCGGCGTAGCACAGCGCGGCCAGCGCACAGGTCGCCGCCGCGATCAGAAAC
+GATATCCAGATGGCCGGGCCGGTGATATCGCCAGCGGTCGACGCGGTAACCGTGAATATTCCGGCGCCAA
+TCACCACCGAGACGCCGAAAACAACCAGGTCCCACCAGGTGAGGTCCTTGCGCAGCCGAGTGGTGGGCTC
+GTCGGTGTCGGCGATTGACTGTTCTACCGACTTCATGCGCCGTCGACCGGCCATGCACCCGTCCTCTCGC
+ACTCGTTGTGACCGCACAGTACTGGGTACTCTGCGAGGATGACGGGTCGCGTAGGGAACCCGAAGGACCA
+CGCCGTGGTGATCGGAGCTAGCATCGCCGGGTTGTGCGCCGCGCGGGTGCTCTCGGACTTCTACTCCACG
+GTGACGGTTTTCGAGCGCGACGAGTTGCCGGAAGCGCCGGCGAACCGGGCCACGGTCCCTCAAGACCGAC
+ACCTGCACATGTTGATGGCCCGCGGGGCGCAGGAATTCGACAGCCTGTTCCCCGGCCTGTTGCACGACAT
+GGTGGCCGCGGGCGTGCCCATGCTTGAGAACCGGCCGGACTGTATCTACTTGGGCGCCGCCGGCCATGTC
+CTCGGGACGGGGCATACCCTGCGCAAGGAGTTCACCGCCTACGTGCCCAGCCGGCCGCACCTGGAATGGC
+AGCTGCGGCGACGGGTCCTGCAGCTCTCCAACGTCCAGATTGTGCGGCGCCTGGTCACCGAGCCACAGTT
+CGAGCGCAGGCAGCAGCGAGTGGTCGGCGTGCTGCTGGATTCCCCTGGTAGCGGCCAAGATCGGGAACGC
+GAAGAGTTCATAGCTGCCGACCTTGTCGTCGACGCAGCCGGCCGGGGTACCCGACTGCCGGTTTGGTTGA
+CGCAGTGGGGATATCGGCGGCCGGCCGAAGACACCGTGGACATCGGCATCAGCTATGCCAGCCACCAATT
+TCGCATTCCCGACGGGCTGATCGCCGAGAAGGTGGTGGTCGCCGGCGCCTCACACGATCAGTCGCTGGGG
+CTAGGCATGCTGTGCTACGAGGACGGCACCTGGGTCCTCACCACCTTCGGGGTGGCCGATGCCAAACCGC
+CGCCGACTTTCGACGAGATGCGTGCACTCGCGGACAAACTGCTGCCGGCCCGCTTCACCGCCGCGCTGGC
+GCAAGCCCAACCGATCGGCTGTCCGGCGTTTCATGCTTTCCCAGCCAGCAGATGGCGTCGCTACGACAAG
+CTGGAACGTTTCCCGCGCGGAATCGTCCCGTTCGGCGATGCGGTGGCCAGCTTCAATCCCACCTTCGGGC
+AGGGCATGACGATGACCTCACTGCAAGCCGGCCACCTACGACGGGCGCTCAAAGCCCGCAACTCAGCTAT
+GAAAGGCGACCTGGCCGCCGAACTCAATCGGGCCACCGCCAAGACCACCTATCCGGTGTGGATGATGAAC
+GCAATCGGCGACATCAGTTTCCACCACGCCACCGCTGAGCCCCTTCCCCGATGGTGGCGCCCAGCCGGTT
+CGCTGTTCGACCAATTCCTCGGGGCCGCAGAAACCGATCCTGTTCTCGCCGAATGGTTTCTGCGACGGTT
+TTCGCTGCTGGACAGCCTGTACATGGTGCCGTCGGTACCGATCATCGGTCGCGCCATTGCTCACAATCTG
+CGATTGTGGCTAAAAGAGCAGCGTGAGCGTCGGCAACCCGTCACAACCCGACGGTCGCCCTGAACAGCTT
+GGCGGGTTGGCCGGCGGTCAGCCGGATCGGGCCGTCGTCGGCCGCCACCCAGGCGGCCGTGCCGCGCTGT
+AGCGTGAGCGACCCGCACTTCCCGTGCACCGTCGCCGAACCCTCGGTGCATAACAAGATCTGTGGACCGT
+CATGGCCGGACGACGCGTCGACCTCGTGGCCGAGGTGATCGCCGTCGAGCACCAGTAGCGTGGCCGCGAA
+CTCATCGGTGGGCGTCTCAAAGACCAGCCCCAGCCCCTCGCGCCGGATCGGGGGCCGCAGCCGAGCCTTC
+GGCGTGGGGGCGAAGTCCAGCACCCGCAACAACTCGGGCACATCGACGTGCTTAGGGGTAAGTCCACCGC
+GTAACACGTTGTCGGAGTTGGCCATCACTTCCACACCGAAACCACGCACATAGGCGTGCAGGTTGCCGGC
+CGGCAGGAAGATCGCCTCCCCAGGAGCCAAGCTGATGCGGTTGAGCAACAACGCCGCCAGCACACCGGCG
+TCGCCGGGATAACGTTCGCCGAGTTCCAGCACTGTCTTGGCTTCGGCGCCAAATTCCGTTGCGCCGGAGC
+TGACGTACTGGATAGCGCCGTCCAGCACGGCAGGCACCAGCACGTCGATGTCGGGCTGGGGTGCGGTAAT
+CCAGGTGGTGAACAGCGCACGCAAACCATCGGCATCGGACCCCTCGCTCAGCAAGTCGATGAACGGGTCG
+AGGTCGGATACGGCCAGCGCCCGCAGCAGCTCGGTGGTGCGAGCCGCCTCCCGGAATCCGGCCAGCGCCT
+CGAACGGCTGCAGCGCCACCAATAACTCTGGCTTGTGACTGGTGTCGCGGTAGTTGCGGACGGGTGAGGA
+CACCGGAATGCCCATTCGCTCTTCCCGCAGGTAGCCCTCAACCGCCTGCTCGGCGCTCGGATGGGCCTGC
+AACGATAGTGGCTCGTCGGCCGCCAACACCTTGACCAAGAACGGCAACACATCGCCGAATCGCGCGCGCG
+ACGCGGAGCCGAGCTGCCCCTCCGGATCCGCGACCAACGCTTCGAGCAACGAGGTTTGGCCATGCGGCGT
+CTGCAGCCAAGCCGGATCACCCGGGTGTGCACCGAACCATAGTTCGGCCTCGGGGTGAGCGGCCGGCACC
+GGACGCCCGGTGAATTCGGCGATAGCGGTGCGCGATCCCCAAGCGTAGGTGCGTAACGCGCCACGTAGCA
+GTTCCACCGGCGATCTATCCTCGCACCAGTCGCAGATACACGGCGGCCATCTCCAGCCGAACGGCCAATA
+CCGCCCCCCCGGATCCCACGGGGGCGTCGAGCAGCTCCGGCACATCCTCAGCCGCGACCAGATAGGCGTC
+ATCGAGCCCGGCAACCCGAGCGGCCACCACCGTCCGCTCGCCGGCCAGCGCCAGCGCCAACACCCGCAGC
+CGCTGCGGTGCCGGCCCATCGATTTCCTCGTCATGGAACAGCGCATCCGGCGGCGTCCCGGCACGTAGCG
+CCACAACCGCATCCGAAAGCCTGGTAGCGGCCACAACCTGGTTTGCGATCCGCAGCATGACCGAACTCCC
+ATGCCGGGCCAGCGCCAGCGTCGCGGCATTGTCTCCAGCCAGGGCCAGCTGGCAACCGGAAACGCGAGCG
+GCAAGTGCCTTGGCCGGGTTGGTGAACACCTCTCGGCCGGCGCTGTTGCGGAGCGCCTCAGCATCCAGCT
+CGTCTGCCAGCGACGCCAGATCGATGCGCAGCTTGGGATCCACGGTTTGCAAGGCCGCCAGACCCGCGGC
+CAGGTACCGGGACAACCCGAACTCGTCAGGAACCCGCAGCCGCGGTTCCAGCACCGCGACGCGACCGGCC
+GTGCTGTCCCGCAGCGGACCCTCATACGGTGCCACCACGACAACCCGCGCGCCCCTGCGCACCCCGATCG
+CGGCGGCCCCGACCAGCGCCGGGTCGCCGGGGTCGTCGCCGGCAACGATCAGCACGTCAAGCGGCCCGAC
+CCAGGGCGGCGCCGCACTGGCGAGCACGATCGGCTCGGCGGCCCCGGCACCTAGCGTCGAGGCCAGGATG
+GTCCCGGCGGTCTCAGCGGTCCCCCGGCCGGTCACCCAGATCACCGAGCGGGGACGGTCACTACCGCGCA
+GCAAGTCCAGTTCGCCCTCGTCGGCCGCGGCAGCGATGGCACGCACCTGTGCGCCGGCCATCGATGCGGC
+CCGCAGCAGGGCACCCCGGTCGGCAGCGATCAGGCCTTCGGTGTCCTCGAGATCGATCGCCCGGGCGACG
+TTCACGGTCCGGCCTTCGCATGTGCGCTCTGGGCAGCGATTTCAGCGCTGACCTGACGTACCACCGCGTC
+AACGTCCCCGACGCTGCGGCCCTCCACATTGAGCCGCAGCAACGGCTCGGTGTTTGAGCTGCGCAGGTTG
+AACCAGCTGTCGTCGCCTAAGTCAACGGTCACGCCATCGAGGTGATCAATACTGACAATCCGGTTGCCGA
+ACGATTTCAACACGGCCTCCACACAGGCCGAAGAGTCGACCACGGTGAAGTTGATCTCGCCGGAGGATTC
+ATAGCGTTGGTAGTCCGCGGTCAACTCCGACAGCGGTCTGCTCTGCTCACCGAGGGCGGCCAGCACATGC
+AGTGCGGCCAGCATTCCGGAATCGGCACCCCAGAAGTCACGGAAGTAATAGTGCGCCGAATGTTCACCAC
+CGAAAATCGCCCCGGTCTCGGCCATCAGTGCCTTGATATAGGAGTGCCCAACCCGCGAACGCAGCGGCGT
+ACCGCCGCGCTCGGCGACCAGCTCGGGCACCGCGCGGGAGGTGATCACGTTGTGGATGATGGTGGCGCCG
+ATCTCCCGGTTGAGTTCCCGCGCGGCCACCAATGCGGTAACCGTCGACGGCGAGACCGGCTGGCCGCGTT
+CGTCGACCACGAAGCAGCGGTCGGCGTCGCCGTCGAAAGCAAGCCCGATATCGGCGCCGGTGTCACGCAC
+ATAGGCCTGCAGATCCACCAGGTTCGCCGGGTCCAGCGGATTGGCCTCGTGATTGGGAAACGATCCGTCG
+AGCTCAAAATACAAGGGCAACAAGGTGATCGAGTCGATCACCCCAAGGACCGCCGGCGCGGTGTGACCGG
+CCATGCCGTTGCCGGCGTCCACGGCCACCCGCAACGGACGTAGCCCCGAGGTGTCCACCAGCGATCGCAG
+GAACGCCCCGTAGTCGACCAGCACGTCCTGGTCGGCAATGGTTCCGGGCGTCCCGTCGTATCGTGCGACG
+CCGGCGATCAGGTCGTCACGGATGGCGGTCAGCCCGGTATCGGCTCCGACTGGTTTGGCGGCGGCCCGAC
+ACATCTTGATGCCGTTGTATGCCGCCGGGTTGTGGCTCGCGGTGAACATCGCTCCCGGGCAGTCCAACAG
+CCCCGAGGCGAAATAAAGCTGATCGGTGGACGCCAAACCAACTCGCACCACGTCGAGGCCCTGCCCGGTC
+ACCCCGGCCGCGAACGCGTCGGCCAGCGACGGCGAACTGTCCCGCATGTCGTGACCGATCACCACTGGTC
+GCGCATCCTCGGTCCGCATCAACCGCGCGAATGCGGCGCCGAGATCGGTAACCAGCGACTCGTCGATCTC
+TTCGCCGACCAGCCCGCGTACGTCGTAAGCCTTGATAACGCGGTCCACAGCCGCGGCGGGCCAAGACATG
+CGCGGGCTCCTGACAACCTAGATTTTCTGCGACTCTTGGCCGCCAGCCTATCGGCCCGCGAACGACGCGG
+GCCGAATCGGTCTCGAACAGCATGGGAAGACTAGTCGGCGGGGTCGGGCAACACCCGTAGATGTCCGCGC
+CGGCGCCCGGCCCCAGGCTCGGGCGGCGCAAGCACGCCACCCCCGGTGGGCGCTCCGGTCGCCGCAGCGG
+GAAAATCGTCGAAACCATGCAGTGGCGCGCCATTTCCGCCTGGATGATGCCGGCGCCCCGCGCTCGGGCC
+ACCCTCGCGCACCGCGTCCGCCAGGGCCACCAGGTCGTCCTCGTCGGGGTGGCTGGGCAGCGGCCCGGCG
+TGACGCACGAGTTCCCACCCGCGCGGTGCAGTGATGCGACCGGCATGGCCGACACACAGATCCCACGAAT
+GGGGCTCCCGCGCAGTGGCAAGCGGACCGATCACCGCCGTCGAGTCCGAGTAGACGAACGTCAACGTCGC
+CACTGCATAGTGCGGACACCCGGGCCGGCAGCAGCGACGGGGTACGTTCACGACCGAAAGGCTATCGTGC
+ACCAACGCCGCCGAAGCGCCGGACACGCGCATCCGTCCACGCCGCGATGTTTAACCGTTACCATCGGCGC
+GTGAGCGATTCCCGCAGCTCCTCGTGGAGCCGTCGGTCGCGGGGCGGGTCGGTAGCGCGGCGAGCAATCC
+GGCGGGGCCGCGAGATGCGCGGGCCACTGCTGCCGCCGACAGTCCCGGGGTGGCGCAGCCGGGCCGAGCG
+GTTCGACATGGCAGTGCTGGAAGCCTACGAACCCATCGAGCGACGCTGGCAGGAGCGGGTGTCGCAGCTG
+GACATCGCGGTCGACGAGATCCCGAGGATCGCAGCCAAAGATCCCGAAAGTGTGCAGTGGCCGCCGGAAG
+TCATCGCCGACGGACCGATCGCGCTGGCCCGGCTCATCCCGGCCGGCGTGGACGTCCGCGGAAATGCGAC
+GCGCGCGCGAATCGTCTTGTTTCGCAAACCAATTGAACGACGGGCCAAGGACACCGAGGAACTTGGTGAA
+TTGCTGCACGAAATCCTGGTGGCCCAGGTGGCCATCTACCTGGACGTCGACCCATCCGTCATCGACCCGA
+CGATCGACGACTAGTTCGCGCCGCCGACTCCGGCGGCCGGGTCAGATGATCCCGCGTTTGAGGCGGCGGC
+GCTCGCGTTCGGAAAGACCACCCCAGATGCCGAACCGCTCGTCATGAGCCAGGGCGTACTCCAGACACTC
+GTGCCGCACCTCGCAGCCCATGCAAATCTTCTTGGCCTCACGCGTGGAGCCGCCCTTCTCCGGGAAGAAC
+GCTTCGGGATCCGTTTGCGCACATAGCGCACGGTCCTGCCATTGGTCGGTGGCTTCCGGCGGCAGAGGTT
+CCTCGAATGGCGCCGGCGCCTCGGGAACCAAACTCAGATGCGGTCGCAAAACTGCCGTTGCTGATGCGGT
+AGCCGATCCGGTAGTGGTATGCGGTGTGCCTCCCATTACACCCCGAAGGTGTTCATAGGACATGCCTCCG
+CCTCCTCACTCGATAGATAGTGAAATGGTTTCCCACTGTTTTGATGTACAGTTAACCCAATTCGAACAAG
+TGATCGAATCTCGGTCTGCGACACCGAAACCGGCCGGCCAACCGCGAAATGACACTGATGTGATTAGACA
+CAAGTTGGGGACGCGGGTCAAGTGTGCCGGCGCATTTCCATATCATCTCGTAATAAAATTTCCGCGGTTC
+TGTTGTGGTTGGGTCCCGGCGTGTCGAGCGTGACTCGTAACCAACGTTTGGTGATGGGCGCCGGGAGGTA
+CTGTCCTGCGATGTGAAGGTCACCGTTCTGGCCGGTGGAGTCGGCGGCGCCCGCTTCCTGCTCGGGGTCC
+AGCAGCTGCTCGGCCTGGGCCAGTTTGCTGCCAATTCTGCCCACTCGGACGCCGACCACCAACTGAGCGC
+TGTCGTCAACGTCGGCGACGACGCCTGGATCCACGGGCTGCGTGTCTGCCCGGATCTGGACACCTGCATG
+TATACCCTGGGCGGCGGGGTGGACCCCCAGCGCGGCTGGGGCCAGCGTGACGAAACTTGGCACGCCATGC
+AGGAACTGGTGCGCTATGGCGTGCAGCCCGACTGGTTCGAGCTCGGGGACCGCGATCTGGCCACCCATCT
+GGTGCGCACCCAGATGCTGCAGGCCGGCTACCCCCTGTCACAGATCACCGAGGCCCTATGCGATCGCTGG
+CAACCGGGCGCCCGCTTGCTGCCTGCCACCGACGACCGTTGCGAAACCCATGTAGTGATCACCGACCCGG
+TCGACGAAAGCCGCAAGGCGATCCATTTTCAGGAGTGGTGGGTGCGCTACCGTGCCCAGGTGCCGACGCA
+CAGCTTTGCTTTTGTCGGCGCTGAAAAGTCCAGCGCTGCAACCGAAGCGATCGCCGCCCTGGCCGACGCC
+GACATCATCATGCTGGCGCCGTCTAATCCGGTGGTCAGCATCGGCGCCATCCTGGCCGTCCCCGGGATTC
+GCGCGGCGTTGCGGGAAGCAACCGCACCGATCGTCGGCTACTCGCCGATCATCGGCGAAAAGCCGTTGCG
+CGGCATGGCCGATACGTGCCTTTCGGTTATCGGGGTGGATTCCACCGCGGCCGCTGTGGGCCGGCACTAC
+GGCGCGCGGTGCGCCACCGGGATACTGGACTGCTGGCTGGTGCACGACGGCGACCACGCTGAGATTGACG
+GGGTGACGGTGCGGTCGGTGCCGCTGCTGATGACCGACCCGAACGCGACGGCTGAGATGGTTCGCGCCGG
+GTGCGACCTTGCGGGAGTGGTAGCTTGACCGGCCCCGAACATGGCTCCGCCTCGACCATCGAGATCCTGC
+CCGTCATCGGGCTGCCCGAATTCCGTCCCGGCGACGATCTGAGCGCCGCCGTCGCCGCGGCGGCACCGTG
+GCTACGCGACGGTGACGTCGTGGTGGTTACCAGCAAGGTGGTGTCCAAATGCGAGGGCCGGCTGGTTCCG
+GCTCCCGAAGACCCCGAGCAAAGAGACCGATTGCGCCGCAAGCTGATCGAGGATGAGGCAGTGCGCGTGT
+TGGCGCGCAAGGACCGCACGTTGATCACCGAGAATCGACTCGGGCTGGTTCAGGCGGCCGCCGGCGTGGA
+CGGATCCAACGTCGGCCGGTCCGAGTTAGCGCTGCTGCCGGTCGATCCTGACGCCAGTGCCGCAACCTTG
+CGCGCCGGGCTGCGCGAGCGGCTCGGCGTCACCGTCGCCGTGGTCATCACCGACACCATGGGACGCGCCT
+GGCGCAACGGCCAGACCGATGCCGCAGTCGGCGCTGCCGGTCTGGCGGTGCTGCGCAACTATGCCGGTGT
+CCGCGACCCATACGGCAATGAGTTGGTGGTCACCGAGGTCGCAGTCGCCGACGAGATCGCCGCGGCCGCC
+GACTTGGTCAAAGGCAAACTGACCGCGACGCCGGTGGCGGTGGTGCGTGGGTTCGGCGTGTCCGACGACG
+GCTCGACAGCCCGGCAACTGCTGCGGCCGGGCGCCAACGACCTGTTCTGGCTCGGGACCGCCGAAGCGCT
+CGAGCTGGGTCGCCAGCAAGCCCAACTGTTGCGCAGGTCCGTTCGCCGGTTTAGCACCGATCCGGTGCCG
+GGCGACCTCGTCGAGGCTGCGGTCGCCGAGGCCCTCACCGCGCCAGCCCCACATCACACCCGGCCGACCC
+GATTCGTGTGGCTGCAGACACCGGCCATCCGCGCGCGGCTGCTAGATCGGATGAAAGACAAGTGGCGGTC
+TGATCTCACCAGTGACGGCTTGCCCGCCGACGCGATAGAACGCCGGGTGGCACGCGGCCAGATCCTCTAT
+GACGCACCCGAAGTCGTCATACCGATGCTGGTGCCCGACGGAGCACACAGCTACCCCGATGCCGCCCGCA
+CCGACGCCGAGCACACCATGTTCACGGTCGCCGTCGGAGCGGCCGTACAAGCCTTGCTGGTCGCGCTGGC
+CGTGCGCGGGCTGGGCAGTTGCTGGATCGGCTCGACGATCTTTGCCGCTGACCTGGTCCGCGACGAGCTG
+GACCTGCCAGTCGACTGGGAGCCGTTGGGCGCCATCGCGATCGGATATGCCGACGAGCCGTCCGGGTTGC
+GCGACCCGGTGCCTGCCGCCGATTTGCTGATCCTGAAGTGACATTCGCTCTAGCGACGATAGGCTACCCA
+GACATGGCGGTCCTGCAGCCGATGCCAACCATCAACCTCCCGACGGATCAATTCACCGCGTTCGGTCAAA
+AGTGGCTCCTCGGCTCGAAATTCTCCAAGAAGGACGACAGGACTTAGGCGCCGTGATAGATGCCGCTGTG
+GGCGGCGCACTGTCGGTGATGCTCGGCAACATCCCATTGGTGGTTCCGAACGCCAACCAGCTGTAACCTT
+CCCAAGCGCCGACGTGTACCGCTGCTATCCGGCCCGATTCCAGGGACAGCCACCCCATGCAACCTAGTCA
+TCCGACGCGCCCTGGTGCGGTCATCAGATATGTCGGTAGCTCCCTTGATACTTGTCCCATGACGACGTTC
+GCCGGCAAAACGGCTGCGTCCGCTGACAAGGTGCGCGGGGGCTACTACACGCCGCCGGCGGTGGCCCGAT
+TCCTTGCCCACTGGGTTCACCAGGCGGGGCCGAAGATCCTCGAACCATCCTGCGGCGATGGCCGAATCCT
+GCGCGAACTCTCCGCCATCACAGACCACGCGCACGGTGTGGAACTCGTTGCGCGCGAGGCGAAAAAGTCG
+CGGGACTTCGCGTCCGTCGACACTGAGAACCTTTTTACCTGGCTGCACAAGACCCAACTCGGCAGCTGGG
+ATGGCGTTGCCGGCAACCCGCCCTACATCCGCTTCGGAAACTGGGCATCCGAACAACGGGATCCGGCACT
+CGAATTGATGCGGCGTGTGGGCCTACGACCGACCAAACTGACCAATGCCTGGGTCCCGTTTGTCGTGGCG
+AGCACGACGCTAGCGCGTGACGGCGGCCGAGTGGGCCTGGTGGTCCCGGCGGAATTGCTTCAAGTCACCT
+ACGCGGCGCAGCTACGCGAATTCCTGCTGAGCCGCTATCGGGAGATCACCCTGGTTACCTTCGAGCGGCT
+GGTGTTCGACGGAATCCTGCAGGAAGTTGTGCTGTTCTGCGGCGTCGTCGGTCCCGGTCCTGCACACATA
+CGCACCGTCAGGCTCGGCGATGCGAACGATCTGAACGCGCTGGGGGACAAGGACTTCACCAATGAGTCAG
+CGCCGGCGCTTCTCCACGAAAAGGAGAAGTGGACCAAGTACTTCCTCGACCCCGCTCAAATCCGGCTACT
+GCGAGGACTCAAACAGTCCGCCACTATGATCAGGCTCGGCGAACTGGCCGACGTGGATGTGGGCATCGTG
+ACCGGCCGCAACAGCTTCTTCACGTTCACCGATGCCAAGGCACAAGCGCTGGGATTGCGAGCGCACTGCG
+TTCCCCTGGTCTCTCGCAGCGCCCAACTCAGCGGGCTGATCTATGACGAGGATTGCCGGGCATGCGATGT
+CGCCGGCAACCACCGAACGTGGCTACTCGACGCCGCGGACTATCCAACCGATCCAGCTCTCGTCGCTCAC
+ATCACCGCGGGTGAAGCGGCCGGCGTCCACCTCGGCTACAAGTGCTCGATCCGCAAGCCATGGTGGAGCA
+CACCATCGCTGTGGATGCCCGACCTCTTTATGCTGCGCCAGATCCACTTCGCCCCGCGGCTGACCGTCAA
+CGCTGCCGCGGCGACCAGCACCGATACCGTGCACCGGGTCCGGCTCGACCCGAACGTCGATCCGGCAACT
+CTTGCCGCGGTGTTCCACAACAGCGCGACATTCGCGTTCGCCGAGATCATGGGCCGCAGTTATGGGGGCG
+GCATCTTGGAGTTGGAGCCTAGGGAAGCCGAGCAACTACCTATGCCACCGCCGGCGTACGGGAGCGCAGA
+ACTTGCCCAGGATGTTGATCTCCTGCTGAAAGCAAACGAGATCGACAAGGCGCTCGACGTCGTGGACCGT
+CACGTTCTGATCGACGGGCTCGGCTTGTCGCCGCGCCTGGTCGCAGGTTGCCGAGCGGCATGGCTCACGC
+TCCGCGACCGCAGGACCAAGCGCGGATCTCGGCGATAACCGCGGCGGGTGAGCGCCTCGCGTGCCCGGCC
+AACGATGTCGATCTCGGCGCAAGAAGCTCAAACGTCGGACGAGTAACGGATCCCGCCGTCGGGAAGAAAG
+ACACCGGGCCATACCCGGGCACCACTTAACAACTCGCAGCGCGCGCCGATGTCGGCCCCGTCACCGATCA
+CACCGTCGCGGATCAACGCCCGCGGTCCGATGCGAGCACCGAAGCCGATGATCGAACGCTCGATCACGCA
+CCCGGCCTCCACCCGGACACCATCGAAGATGACCGCGCCGTCCAATCTGGTGCCGGGGCCGATTTCGGCA
+CCACGCCCCACGACGGTGCCGCCAATCAGCAACGCACCGGGAGATACCGCCGCACCGTCGTGCACCAACT
+GCTCACCGCGGTGACCACGCAAGGCCGGAGACGGGGCGATGCCGCGCACCAGATCCGCCGATCCGCGAAC
+GAAGTCTTCCGGTGTGCCCATGTCCCGCCAATAGCTGGCATCGACATAGCCGTAGATCTTGCAGTCGCCG
+TCGGCGAGCAAGGCCGGGAACACCTCGCGTTCCACCGAAACCTCCCGGCCCTGCGGAATCCGGTCGATGA
+CGTTGCGTTCGAAGACATAGCAGCCGGCATTGATCTGGTCGGTCGGCGGATCCTCCGTCTTCTCCAGAAA
+GGCGACTACGCGGTCCTCCTCGTCGGTGGGTACGCAGCCGAATGCCCGCGGGTCGCCCACCCGCACCAGT
+TGCAGCGTGACATCGGCTCGATTGCTTCGGTGGAAGTCCAGCAGTTGGGCCAGATCCGCGCCCGAGAGCA
+CATCGCCGTTAAACACCATCGCGGTGTCGTTGCGCAGCTTGCCGGCAACGTTGGCGATGCCGCCGCCAGT
+CCCCAAGGGATGCTCCTCGGTCACGTATTCGATCTGTAGGCCCAGTGCGGACCCGTCGCCGAACTCCGCT
+TCGAAGACTGCGGGTTTGTAGGACGTACCCAGGATCACGTGCTCGATGCCCGCTGCGGCGATCCGCGACA
+GCAGATGGGTGAGGAACGGCAGTCCGGCGGTAGGCAGCATTGGCTTGGGCGCCGACAGCGTCAACGGCCG
+CAGTCGGGTACCCTTGCCACCGACCAGGACCACCGCATCGACTTGGTGAGTTGCCAACTCAGTGCCGCCC
+TTCTACCAGCTTCAGTTTCCGTCTGCGGGACCTGCGCACCATGAGGTGGGAACGCAGCGCCAGTGATCCC
+CGCAGGGTCCAGCGCAGCGGAGCCCGCCACCAACCAGAATGTCGGTCGGCTAAGAAGATATAGGTGCTTT
+TGTGATGGGCGGCCAGATGGCTTGCCGGGTCGCGACCCGTCGAATGCGCCTTGTGGTGCAGAACCTCGGC
+TGACGGCACATACACCGACAGCCAACCGGCTTTGCCAAGCCGGTCGCCAAGGTCGACGTCCTCCATGTAC
+ATGAAGTAACGTTCGTCGAATCCGCCGACCTGGCCAAACGCCGACCGGCGCACCAGTAGGCAAGACCCCG
+ACAACCAACCCACCGGCCGTTCACTGGGCTCCAGCCGCTCCTGCCGGTAGGCCGTCGTCCACGGATTGCG
+CGGCCAGAACGGCCCGAGCACTGCGTGCATGCCGCCGCGGATCAGGCTGGGCATCTGCCGCGCCGACGGG
+TACACCGACCCGTCGGGGTCCCGAATCAGCGGGCCCAGCGCGCCCGCGCGGGGCCAGCGGGAGGCGGCGT
+CCAGTAGTGCATCGATACTGCCCGGGCCCCATTGCACGTCCGGGTTGGCCACGATCACCCAGTCATCGAC
+CCAGGGTTCGCCGGCATCGCCCGCCATTTCACCGAGCTGGGCGATCGTCCGATTCACCGCGGTTCCGTAC
+CCGAGGTTGGCCCCTGTGGGCAGCAGCCGCACGTTGGGGTAGCGCTGCACCGCGGCCTGCGGGGTGCCGT
+CGGTGGAGCCGTTGTCTGCCAACAGCACGCTGACCGGCCGCTCGGTGGCCAGCGACAACGACGCCAGGAA
+CCGCTCTAGATGGGGCCCCGGCGAGTAGGTCACCGCTACCACCGGCAGGACGTCAGTCACGCGTTGAGGG
+TAACCGTCGATCGATCGAAGTTGAGTTCGCAGGTGCTGCCAGCGCCGTGGCCAGTGCGCTGCGCCAGTGC
+CGTAGCGGCGTCAAGCCCGCCAGCGCCCACTGCCTGCTCGACAGCGCGGAATAGCTCGGACGCGGCGCGG
+GCCGCGGAAACTGCGCGCTGCTGACCGGACGCACCCGCTGTGGGTCGGCACCGCATTCTTCGAACACCGC
+GCGGGCTTGACCGAACCGGGAGACCACGCCCTCGTTAGCGGCGTGCAACACGCGTCCGCGCACGCCCGCG
+TCGGCCAACGCCAGCAGCGCCTCGGCCAGGTCGGCGACGTAGGTCGGCGACCCGGTCTGGTCGTCGACCA
+CATCCACCCGACCGTGTCCGGCGGCCAGCCGGCGCATGACGGCGACGAAATCCTTGCCGGTCCCGCCGGT
+GTAGACCCAGGCGGTCCGTACCACGGCAGCCTCCGGGAACGCTGCCAGCACAGCCTGCTCGCCGGCGAGT
+TTGCTGCGGGCATACACGCCCTGCGGCGCGGTTTCATCGGTGGGCTCGTAGGGCCGGGGCTCGGCGCCGC
+CGAAGTCGCCATCGAATACGTAGTCGGTGGAGACGTGGATTAACCGAGCACCCACACGAGCGCACGCACG
+GGCGAGGTGTTGCGGGCCAGTGGCATTGACCGCATAGGCGACTGCCTCATTGCTCTCGGCGCCGTCGACG
+TCGGTGTAGGCGGCGCAATTGATCACCACGTCACCGTGTCGGATGATCCGCTCGGCCGCAGCGGGGTCGG
+TGATATCCCACTGCGAGGAAGTCAGCGCCAGCATATCGCGGCCTTCCCGGGCGGCCTGTGCCGTCAGATG
+GCTGCCCAGCTGCCCGCCCGCACCGGTGATGACTAGCCTTTCTGACCTGCCCGCCATGTGTTTGAGTCTG
+GCACGCCTCGGGCACGCCGGGGTTGGCTACCCGACAGGGCGCCGTTACACAAGTAGTCTAGTGTGATGTC
+TGCGCAACGTGTGGTTCGTACGGTTCGTACCGCTCGGGCTATTTCCACGGCACTGGCCGTCGCGATCGTC
+CTTGGCACCGGGGTGGCGTGGAGCAGTGTCCGGTCGTTCGAAGACGGCATCTTCCACATGTCGGCGCCCT
+CGCTGGGGCACGGCGGCGACGACGGCGCGATCGACATTTTGCTGGTCGGCCTGGACAGCCGTACCGACGC
+GCACGGCAACCCGTTGAGCGCCGAGGAATTGGCGACATTGCACGCCGGCGACGAGGAAGCCACCAACACC
+GACACCATCATCCTGATCCGGGTACCCAACAACGGAAAGTCGGCGACCGCAATCTCTATACCGCGGGACT
+CCTACGTCGCGGCTCCCGGTCTGGGTAAGACCAAGATCAACGGCGTCTACGGGCAAACCAGAGAGACCAA
+GCGGGCCGGCCTGGTCCAAGCCGGTGCCTCGCCGACCGAAGCGGCCGCCGCCGGCACCGAGGCCGGGCGT
+GAGGCGTTGATCAAGACGGTCGCCGATCTGACCGGCGTCACCGTCGACCACTACGCCGAGATCGGGCTGC
+TCGGTTTCGCGTTGATCGCCGACGCACTCGGCGGCGTCGACGTCTGCCTCAAAGAGCCTGTATACGAACC
+ACTTTCGGGTGCCGATTTTCCAGCCGGGCGGCAAAAGCTCAACGGTCCGCAAGCGCTCAGCTTCGTTCGC
+CAGCGGCATGATCTGCCCCGCGGCGACCTGGACCGGGTGGTACGTCAGCAGGCGGTGATGGCGGCGTTGG
+CCCACCGGGTCATCTCCGGACAGACGCTATCCAGCCCCGCCACGCTGAAGCGGTTGGAGCAGGCCGTGCA
+GCGCTCGGTGGTGCTGTCCTCCGGGTGGGACATCATGGATTTCGTCCGCCAATTGCAGAAGCTGGCCGGC
+GGTAACGTTGCCTTCGCCACCATCCCGGTGCTCGACGGCGCCGGCTGGAGCGACGACGGCATGCAAAGCG
+TGGTGCGGGTGGATCCGCGTCAGGTGCAGGACTGGGTCGTCGGCCTGCTGCACGAGCAGGACCAGGGCAA
+GACCGACGAGCTGGCCTACACACCCGCCAAGACCACGGCCAACGTGGTCAACGACACCGATATCAACGGG
+CTTGCGGCAGCGGTGTCAAAGGTGTTGAGCTCCAAGGGGTTTACCACCGGATCCGTCGGCAACAACGACG
+GCGACCACGTGCCTGGCAGCCAGGTGCGGGCCGCAAAGGCCGACGACCTGGGCGCACAGCAGGTCGCCAA
+GGAACTGGGCGGGTTGCCGGTGGTCGCCGATGCGTCAATCGCGCCTGGGTCGGTGCGGGTGGTGCTGGCC
+AACGACTACAGCGGTCCGGGCTCCGGGCTGGGGGGTAGTGATCCGAACGGCGTCGTATCGCCGGCCCGCG
+CGTTCAACCTCGGGTCCGCCGACGACACGACTCCCCCGCCGTCGCCAATCCTTACCGCCGGCTCCGACGC
+GCCGGAGTGCATCAACTGACCACACCGACCACCCTGAGCGGGGCGATCCTGGATCCGATGCTGCGCGCCG
+ACCCGGTCGGCCCGCGCATCACCTACTATGACGATGCCACCGGTGAGCGCATCGAGCTATCCGCGGTGAC
+ACTGGCTAACTGGGCCGCCAAGACCGGCAACCTGTTGCGCGACGAGCTGGCGGCCGGACCCGCCAGCCGA
+GTCGCGATCCTATTACCGGCCCATTGGCAGACCGCGGCGGTGTTGTTCGGCGTGTGGTGGATCGGTGCGC
+AAGCGATACTCGACGATTCTCCCGCCGATGTGGCACTGTGCACCGCCGACCGTCTGGCCGAAGCCGACGC
+CGTCGTCAACAGCGCGGCGGTAGCCGGCGAGGTAGCCGTGCTGTCGCTGGATCCATTCGGTCGACCGGCA
+ACCGGCCTGCCGGTCGGCGTCACCGACTATGCGACCGCGGTGCGGGTACACGGCGACCAGATAGTTCCCG
+AACACAACCCCGGTCCGGTGCTTGCCGGTAGATCCGTCGAGCAGATCCTGCGCGACTGCGCGGCGTCCGC
+GGCCGCCAGGGGTTTGACGGCGGCGGATCGGGTGCTGTCCACCGCTTCCTGGGCCGGACCCGATGAGTTG
+GTGGACGGCCTGCTGGCGATCCTGGCCGCCGGTGCGTCGTTGGTGCAGGTGGCCAATCCCGATCCGGCGA
+TGCTGCAGCGCAGGATTGCGACCGAAAAGGTCACCCGCGTCCTGTGACGCAGGCCGCGTCCAGCAGGCGA
+AGGCATCAGAGCAATACATATTGATATCGCGATATATAGATGTTAATGTCACTGCAACGAGCTGCCGCTG
+CAATTACAGACCCGGAAGAAAGGTACAGGCAATGGCGATACAAGTGTTCTTGGCGAAGGCGACAACGACG
+GTGATCACCGGCTTGGCCGGCGTGACCGCCTACGAGATCTTAAAAAAGGCCGCGGCCAAAGCGCCGCTTC
+GTCAGACCGCGGTATCGGCAGCAGCGCTGGGTCTGCGCGGAACCCGCAAGGCCGAGGAAGCCGCGGAATC
+GGCCCGCCTAAAGGTGGCCGACGTGATGGCCGAGGCTCGTGAGCGCATCGGCGAGGAATCGCCCACTCCA
+GCGATCAGCGACCTGCACGACCACGACCACTGAGCGCCTCGCCATGACCCTGGAAGTGGTATCGGACGCG
+GCCGGACGCATGCGGGTCAAAGTCGACTGGGTCCGTTGCGATTCCCGGCGCGCGGTCGCGGTCGAAGAGG
+CCGTTGCCAAGCAGAACGGTGTGCGCGTCGTGCACGCCTACCCGCGCACCGGGTCCGTGGTCGTGTGGTA
+TTCACCCAGACGCGCCGACCGCGCGGCGGTGCTGGCGGCGATCAAGGGCGCCGCGCACGTCGCCGCCGAA
+CTGATCCCCGCGCGTGCGCCGCACTCGGCCGAGATCCGCAACACCGACGTGCTCCGGATGGTCATCGGCG
+GGGTGGCACTGGCCTTGCTCGGGGTGCGCCGCTACGTGTTCGCGCGGCCACCGCTGCTCGGAACCACCGG
+GCGGACGGTGGCCACCGGTGTCACCATTTTCACCGGGTATCCGTTCCTGCGTGGCGCGCTGCGCTCGCTG
+CGCTCCGGAAAGGCCGGCACCGATGCCCTGGTCTCCGCGGCGACGGTGGCAAGCCTCATCCTGCGCGAGA
+ACGTGGTCGCACTCACCGTCCTGTGGTTGCTCAACATCGGTGAGTACCTGCAGGATCTGACGCTGCGGCG
+GACCCGGCGGGCCATCTCGGAGCTGCTGCGCGGCAACCAGGACACGGCCTGGGTGCGCCTCACCGATCCT
+TCTGCAGGCTCCGACGCGGCCACCGAAATCCAGGTCCCGATCGACACCGTGCAGATCGGTGACGAGGTGG
+TGGTCCACGAGCACGTCGCGATACCGGTCGACGGTGAGGTGGTCGACGGCGAAGCGATCGTCAATCAGTC
+CGCGATCACCGGGGAAAACCTGCCGGTCAGCGTCGTGGTCGGAACGCGCGTGCACGCCGGTTCGGTCGTG
+GTGCGCGGACGCGTGGTGGTGCGCGCCCACGCGGTAGGCAACCAAACCACCATCGGTCGCATCATTAGCA
+GGGTCGAAGAGGCTCAGCTCGACCGGGCACCCATCCAGACGGTGGGCGAGAACTTCTCCCGCCGCTTCGT
+TCCCACCTCGTTCATCGTCTCGGCCATCGCGTTGCTGATCACCGGCGACGTGCGGCGCGCGATGACCATG
+TTGTTGATCGCATGCCCGTGCGCGGTGGGACTGTCCACCCCGACCGCGATCAGCGCAGCGATCGGCAACG
+GCGCGCGCCGTGGCATCCTGATCAAGGGCGGATCCCACCTCGAGCAGGCGGGCCGCGTCGACGCCATCGT
+GTTCGACAAGACCGGGACGTTGACCGTGGGCCGCCCCGTGGTCACCAATATCGTTGCCATGCATAAAGAT
+TGGGAGCCCGAGCAAGTGCTGGCCTATGCCGCCAGCTCGGAGATCCACTCACGTCATCCGCTGGCCGAGG
+CGGTGATCCGCTCGACGGAGGAACGCCGCATCAGCATCCCACCACACGAGGAGTGCGAGGTGCTGGTCGG
+CCTGGGCATGCGGACCTGGGCCGACGGTCGGACCCTGCTGCTGGGCAGTCCGTCGTTGCTGCGCGCCGAA
+AAAGTTCGGGTGTCCAAGAAGGCGTCGGAGTGGGTCGACAAGCTGCGCCGCCAGGCGGAGACCCCGCTGC
+TGCTCGCGGTGGACGGCACGCTGGTCGGCCTGATCAGCCTGCGCGACGAGGTGCGTCCGGAGGCGGCCCA
+GGTGCTGACGAAGCTGCGGGCCAATGGGATTCGCCGGATCGTCATGCTCACCGGCGACCACCCGGAGATC
+GCCCAGGTTGTCGCCGACGAACTGGGGATTGATGAGTGGCGCGCCGAGGTCATGCCGGAGGACAAGCTCG
+CGGCGGTGCGCGAGCTGCAGGACGACGGCTACGTCGTCGGGATGGTCGGCGACGGCATCAACGACGCCCC
+GGCGCTGGCCGCCGCCGATATCGGGATCGCCATGGGCCTTGCCGGAACCGACGTCGCCGTCGAGACCGCC
+GATGTCGCGCTGGCCAACGACGACCTGCACCGCCTGCTCGACGTTGGGGACCTGGGCGAGCGGGCAGTGG
+ATGTAATCCGGCAGAACTACGGCATGTCCATCGCCGTCAACGCGGCCGGGCTGCTGATCGGCGCGGGCGG
+TGCGCTCTCGCCGGTGCTGGCGGCGATCCTGCACAACGCGTCGTCGGTGGCGGTGGTGGCCAACAGTTCC
+CGGTTGATCCGCTACCGCCTGGACCGCTAGCAGCCGCAGCCGTGACCACGCCAGGTGCGGATGCCCTGCC
+AGACCGCGATACCGGCGATGGCCAGCCCGATCGCGGGGTCAATCCACCAGCCGTTCGACCACACGGCAGT
+GATCGCCAGCCCAAGCAGAACCGCGGCGGCCTGAGCAGCACACAGGTAGTTCTGGGTGCCCTCGCCCGCG
+GTGGCCCCCGATCCCAGCCGCTCACCCACTCGGTGGTTGGCCCAGCCCAGGACCGGCATCAGCAGCAGGG
+CGATGGCCGTCAGTCCGATGCCGATCACCGAGGTCTCGGCACGATGCTCGCCGGCTAGGTGGCGGATGGA
+TTCGGCAACGAGGTAGGGGGCCGTCAGCCAAAAAGACACCGCAACTCCACGCTGTGCGCGGTGCTCCGCG
+GTCGCGGACCAAGTGCGGTCGCCGGTGAACCGCCAGAGCACCATCGCGCTGGCCAGGCCCTCGGATCCGC
+CACCCAGCGCCCACCCGGTCAACGCGACGGATCCGACCGCAATACCCTGCCACAGCCCCACGGCACCTTC
+GGTGAGCAATACCGCCAGGCTGACCCACGCCAGCCAGCGGGCCCACCGAACGTTCCGCTGCCATTCGGCC
+TCTCGCGCCACCGACACGGGCGAATCCAGCGTGGATTCATCGCGGTGTTCCGTCGTCGTCTCCATCCCGA
+CGATGGTAGAGGCAAGACATGCCGGGCGGTCGCCGCGGCGTCGCGAACCCGTATGGTTCAGGGAGGATGC
+CGCACGCCAGGGAAGGTCACCACCGATGCCGACCAGCAACCCCGCCAAACCACTTGACGGGTTTCGGGTA
+TTGGATTTCACCCAGAACGTGGCCGGGCCGCTGGCCGGGCAGGTGCTGGTCGACCTGGGGGCTGAAGTCA
+TCAAGGTGGAGGCGCCCGGCGGTGAAGCGGCCCGTCAGATCACCTCGGTGTTACCCGGACGCCCGCCCCT
+GGCCACCTACTTTCTGCCCAACAATCGTGGCAAGAAGTCGGTGACGGTGGACCTAACCACCGAGCAGGCC
+AAGCAGCAGATGCTGCGGCTCGCGGACACCGCCGACGTTGTCTTGGAGGCGTTTCGGCCCGGCACCATGG
+AAAAGCTGGGCCTAGGCCCTGATGACTTGCGCTCTCGTAACCCCAACCTGATCTACGCGCGCCTAACCGC
+TTACGGCGGCAACGGCCCGCACGGCAGCCGGCCGGGAATCGACCTGGTGGTGGCCGCCGAGGCCGGCATG
+ACCACCGGAATGCCCACGCCTGAGGGCAAGCCACAGATCATCCCATTTCAGCTCGTCGACAACGCCAGCG
+GTCACGTGCTGGCCCAGGCCGTGCTGGCCGCGCTGCTGCACCGCGAGCGGAACGGGGTGGCCGACGTCGT
+CCAGGTCGCGATGTACGACGTCGCGGTGGGACTACAAGCCAACCAGCTGATGATGCATCTCAATCGGGCC
+GCTAGCGACCAGCCGAAGCCTGAACCGGCACCGAAGGCCAAGCGGCGCAAGGGAGTCGGCTTCGCTACCC
+AGCCATCGGACGCGTTTCGCACCGCCGATGGGTACATCGTCATCAGCGCATATGTGCCCAAACACTGGCA
+GAAGCTGTGCTACCTCATCGGCCGGCCTGACCTCGTTGAAGATCAACGATTTGCCGAACAACGCTCCCGG
+TCGATCAACTACGCCGAGTTGACCGCCGAGTTGGAATTGGCACTGGCCAGCAAGACCGCCACCGAATGGG
+TCCAGTTGCTGCAGGCAAACGGCCTCATGGCCTGCCTCGCCCATACCTGGAAACAGGTCGTCGACACCCC
+CCTTTTCGCCGAGAGCGACCTCACCCTGGAAGTCGGTCGCGGGGCGGACACCATCACGGTGATCCGCACA
+CCGGCGCGCTACGCCAGCTTCCGCGCGGTCGTCACCGATCCCCCGCCCACCGCCGGCGAACACAATGCCG
+TGTTTCTGGCCCGGCCCTGACGCTGTGACCATTCCGAGGAGTCAACACATGAGCACCGCAGTCAACAGCT
+GCACCGAGGCGCCCGCATCGCGATCACAGTGGATGCTGGCTAATCTGCGGCACGATGTTCCCGCATCACT
+TGTCGTCTTCCTTGTTGCGTTGCCACTTTCGCTGGGGATCGCGATCGCCTCCGGGGCCCCGATAATCGCC
+GGTGTGATCGCCGCCGTCGTAGGCGGCATTGTCGCCGGGGCGGTCGGTGGGTCGCCGGTTCAGGTCAGCG
+GCCCGGCCGCGGGTCTGACCGTGGTGGTCGCCGAGCTGATCGATGAGCTCGGTTGGCCGATGCTGTGTCT
+GATGACGATCGCCGCGGGTGCACTGCAGATCGTGTTCGGCCTAAGTCGGATGGCGCGCGCCGCGCTGGCC
+ATCGCCCCGGTCGTGGTGCACGCCATGCTGGCCGGCATCGGTATCACCATCGCGCTGCAGCAAATTCATG
+TTCTGCTCGGTGGTACGTCGCACAGCTCGGCGTGGCGGAACATCGTAGCGTTGCCGGACGGCATCCTCCA
+TCACGAACTGCACGAAGTGATCGTCGGCGGGACGGTTATCGCGATCCTGTTGATGTGGTCAAAGCTGCCC
+GCCAAGGTGCGTATCATTCCCGGCCCACTGGTAGCCATCGCGGGCGCGACCGTGCTTGCGTTGCTACCCG
+TGCTACAAACCGAACGAATCGACCTGCAGGGCAACTTCTTTGACGCGATTGGCTTGCCCAAACTTGCCGA
+AATGTCCCCGGGAGGACAGCCGTGGTCTCATGAGATCAGCGCCATCGCGCTCGGTGTCCTCACCATTGCG
+CTGATCGCAAGCGTCGAATCGCTGCTGTCGGCGGTCGGTGTCGACAAGCTGCATCACGGCCCGCGCACCG
+ACTTCAACCGGGAGATGGTCGGGCAGGGCAGCGCGAACGTGGTGTCCGGATTGCTCGGCGGGCTGCCCAT
+CACCGGTGTCATCGTGCGCAGCTCGGCCAACGTGGCCGCCGGCGCCCGAACCCGGATGTCGACGATCCTG
+CACGGAGTGTGGATCCTGCTGTTTGCGTCACTGTTCACCAACCTGGTGGAACTGATTCCCAAGGCGGCGC
+TGGCCGGCCTGCTCATCGTGATCGGTGCCCAGCTGGTCAAGCTGGCGCACATCAAACTAGCTTGGCGCAC
+AGGAAATTTCGTAATCTACGCCATCACCATCGTGTGTGTGGTGTTCCTCAATCTGCTGGAAGGCGTGGCC
+ATCGGGCTGGTCGTGGCGATCGTATTCCTGTTGGTGCGGGTGGTACGCGCGCCCGTCGAGGTCAAGCCGG
+TCGGCGGCGAGCAGTCCAAGCGATGGCGGGTCGATATCGACGGCACGTTGAGCTTCCTGCTGCTGCCCCG
+CCTGACCACGGTGCTCTCGAAGCTGCCGGAAGGGTCGGAGGTGACGTTAAACCTGAACGCAGACTACATC
+GACGACTCCGTTTCCGAGGCCATCTCCGATTGGCGGCGCGCCCACGAGACGAGGGGCGGAGTGGTAGCGA
+TCGTGGAAACGTCGCCGGCCAAACTGCACCACGCACACGCCCGACCACCGAAGCGCCACTTCGCGTCTGA
+TCCGATTGGACTGGTTCCGTGGCGATCAGCGCGCGGCAAAGACCGCGGCAGCGCTTCGGTTCTCGACCGC
+ATCGACGAGTATCACCGCAATGGCGCGGCCGTGCTGCACCCGCATATCGCCGGGCTGACCGATTCACAGG
+ACCCGTATGAGCTGTTCCTCACCTGTGCCGACTCGCGGATTCTGCCGAACGTCATCACCGCCAGCGGCCC
+CGGCGACCTGTACACCGTCCGCAACCTCGGCAACCTGGTGCCGACCGATCCGGACGACCGATCGGTTGAC
+GCGGCACTCGACTTCGCCGTCAACCAGCTCGGCGTCAGCTCGGTTGTCGTCTGCGGACATTCGTCGTGTG
+CTGCGATGACGGCGCTCCTGGAAGACGACCCGGCCAACACGACGACTCCCATGATGCGTTGGCTCGAGAA
+TGCCCACGACAGCCTGGTGGTGTTCCGCAATCACCACCCGGCACGCCGCAGCGCCGAATCCGCCGGTTAC
+CCCGAAGCCGACCAGCTGAGCATCGTAAACGTTGCCGTTCAGGTGGAAAGGCTGACCCGCCACCCGATCT
+TGGCGACCGCGGTCGCCGCTGCTGATCTACAGGTCATCGGCATATTCTTCGACATCTCGACCGCCCGGGT
+ATACGAGGTGGGTCCGAACGGCATCATCTGCCCGGACGAGCCGGCCGACCGCCCCGTCGACCACGAATCA
+GCGCAGTAGCGCCCGCGACATCACTACCCGCTGAATCTGATTGGTGCCCTCATAGATCTGGGTGATCTTG
+GCGTCGCGCATAAACCGCTCGACCGGGAAGTCGGTGGTGTAGCCGGCGCCGCCGAACAGTTGTACGGCAT
+CGGTGGTGACCTCCATCGCGACGTCGGAGGCGAAGCACTTCGAGGCCGCCGAAATGAAGCCCAGATCCGG
+CTCACCGCGTTCGGCGCGGGCGGCGGCGGAGTAAACCATCAGCCGAGCCGCCTCCACCTTCATCGCCATG
+TCGGCCAGCATGAACTGCACGGCCTGAAACGTACTGATCGACTCACCGAACTGCTTGCGGTCCTTGGTGT
+AGGCGATGGCAGCATCCAGCGCGCCCTGGGCGATACCCACGGCCTGCGCGCCAATCGTGGGACGGGTGTG
+GTCCAACGTGGCCAGCGCGGTCTTGAAACCGGTACCGGGCTCACCGATGATGCGATCGCCGGGGATGCGG
+CAGTTCTCGAAGTACAGCTCGGTGGTCGGTGACCCCTTGATCCCGAGCTTGCGTTCTTTCGGACCGACGG
+TGAACCCCTCGTCGTCCTTGTGCACCATGAACGCCGAGATGCCGTTGGCGCCCCGGTCGGGATCGGTCAC
+CGCCATCACCGTGTACCAGGTCGACTTGCCGCCGTTGGTGATCCAGCACTTGGCGCCGTTGAGAATCCAG
+TGATCCCCATCGGCCTTGGCCCGCGTCCGCATGGACGCCGCGTCACTGCCGGCCTCGCGTTCACTCAATG
+CATAGGAAGCCATCGCCCCTTCGGCGGCCAACGCCGGCAGCACCTGCTTCTTCAGCTCCTCGGAGCCCCG
+CAGGATCAGGCCCATGGTGCCCAGCTTGTTGACCGCGGGGATCAACGACGCGGACGCGTCGACGCGGGCC
+ACCTCTTCGATCACGATGCAGGTAGCTACCGAGTCGGCACCCTGACCGCCGTACTCCTCCGGAATGTGGA
+CGGCGTTGAAACCGGAGGAATTGAGCGCCACTAGCGCTTCTTCGGGGAACCGCGCCTTCTCGTCCACCTC
+GGCGGCATGCGGAGCGATCTCCTTTTCCGCCAAAGCCCGTATCGCCGATCGCATTTCGTCGTGTTCCTCG
+GGCAGCTTGAACAGATCGAACGACGGGTTTCCGGCCCATCCAACCATCTTGGAGCCCTCCTAATCTCCGT
+GCTAGTCGCGGGTTAACTTACCCGCAAGCCGCTGCAGTTCCGCATCCTTGGCCGCCACGACGTCGGCCAG
+CCGGTCCTGGAATGCGACGATCCGGGCCCTCAGCTGGGGGTTGGCGGCTCCCAGCATCCGCACCGCCAGC
+AGTCCGGCATTACGGGCGCCCCCGATGGACACCGTGGCCACCGGAACCCCGGCCGGCATTTGCACGATCG
+ACAGCAGGGAGTCAAGGCCGTCCAGCCTGCCCAGCGGTACCGGCACCCCGATCACCGGCAGCGGCGTCGC
+GGCGGCGACCATACCGGGCAAGTGCGCGGCCCCGCCCGCTCCGGCGATGATCACCTCGAGACCGCGCTCG
+GCCGCGCCGCGCGCATAACTGAACATCGCCTCAGGGGTGCGATGGGCCGAAACAACCCGAACCTCGGCCG
+GAATGTCGAACTCGGCCAGCGCCGCCGCAGCGTCGGCCATCACCGGCCAGTCGCTGTCGCTGCCCATGAT
+CACCCCGACCCGGGGCCGCTCGCCGGCAGGAGTCATAGGCGCCGCTCCTCCTCATCGCTTCGTCCCCCGC
+ACGCGGGTGGTACCCCCACTGCATCGTCGCTGGCGCGGTGTGGGTCCCATCCGTCAGTCCACCGCCCATG
+GGACAACCAGTGTGCCGCCAGCTCAGCGCGTTCACACAACTGGGCGACATCGGAGCCAAGGAAGTTGATA
+TGCCCCACCTTGCGACCGGGTCGCTCGGCCTTGCCGTAGAGGTGAACCCGGGCGTCGGGCATTCGCGCAA
+ACAGATGGTGCAGCCGCTCGTCGACGCTCATGGCCGGCGGCTGCGCGGCGCCGAGCACATTGGCCATCAC
+CGTCACGGGCACCACGGCGTCGCTGTCGCCGAGCGGGTAGTCCAAGACCGCGCGCAGATGCTGCTCGAAC
+TGGCTGGTGCGCGCCCCGTCGATGGTCCAGTGCCCGGAATTATGTGGCCGCATCGCGAGCTCGTTGACCA
+GCAACGCCCCGTCGGTCGTCTCGAACAGCTCGACGGCGAGCACGCCGACCACACCGAGTTCGTCGGCCAG
+CTGCAACGCCAACCGTTGCGCCGCGGTGGCCAGGTCGTCGGGCAGCGCCGGCGCCGGCGCGATCACCAGC
+ACACACGTGCCGTCACGTTGCACCGTCTGGACCACCGGCCACGCCGCACCCTGGCCGAACGGCGAACGCG
+CCACCAGTGCCGACAGCTCGCGGCGCAGGTCCACCCGTTCCTCGACCAGCACCGCCACGCCGTCAGCCAG
+GCATTCGCGAGCGAAATCACGGGCATCCGCCACATCACGTGCCATCCGAACGCCCCGGCCGTCGTAACCC
+CCGCGCACTGCCTTGACCACGATCGGGGCGTCGACACGTGCGGCGAAGACGTCGATTTCGTCGGGGTCTT
+TGATGCCCGCGTAGCGGGGCACGGCGACGCCTGCTGCAGCCAGACGCTGCCGCATGACGAGTTTGTCCTG
+GGCGTGCACCAGCGCCTGCGGCGACGGTGCGACATTGACGCCATCGGCGACTAGCTTCTCCAACAGCTCG
+TTCGGGACGTGCTCGTGGTCAAAGGTCAGCACGTCGGCGCCGGCCGCAACGCGGCGCAAGGCGGCAAGAT
+CGGTGTGCGAGCCGATCACCACGTTGGGGGTGACCTGCGCGGCAGGGTCATCTGCCGAGGTGACCAATAC
+ACGGAGGTTCTGCCCCAGCGCGATGGCAGCCTGATGGGTCATCCGGGCCAGCTGACCGCCACCGACCATC
+GCAACGAGGGGGGCAATGAACGAGGTGACCGCCGGGGTGCGTGAGCTCGCCACGGCCATCATGGTGTCAC
+GGCATCTGACCGGCGTACTTGCCGGCCACGGCAGCCAAACCGTTACGTATCATTTTGCGTCGATTTTGTG
+TTCGTCCGTACACTCACTTGTTGTGTCCTTTGCCGATGCCACCATCGCGCGCCTTCCCGGGGTGGTCCAG
+CCCTATGCGCAGCGCCACCATGAGCTGATCAAATTTGCCATCGTCGGCGGCACCACATTCATCATCGACA
+CAGCAATTTTCTACACCCTCAAGCTGACGGTTCTCGAACCCAAGCCGGTGACCGCGAAGGTGATCGCCGG
+CATCGTCGCCGTCATCGCGTCCTACGTGTTGAACAGGGAGTGGAGCTTCCGCGACCGCGGCGGTCGCGAG
+CGCCACCATGAGGCGCTGCTGTTCTTTGCGTTCAGCGGCGTGGGAGTGCTGCTGAGCATGGCGCCGTTGT
+GGTTTTCCAGCTACATCCTGCAGCTACGGGTGCCAACGGTGTCACTGACCATGGAAAACATCGCCGACTT
+CATCTCGGCCTACATTATTGGCAACTTGCTGCAAATGGCGTTCCGCTTCTGGGCGTTTCGGCGCTGGGTG
+TTCCCCGACGAGTTCGCCCGCAACCCCGACAAGGCCCTGGAATCCGCCCTTACCGCGGGCGGCATCGCCG
+AAGTCTTCGAGGACGTCTTGGAGGGCGGCTTCGAGGACGGCAACGTCACCCTGCTGCGGGCCTGGCGTAA
+CCGGGCCAACCGGTTCGCTCAGCTGGGCGACTCGTCGGAGCCCAGGGTGTCGAAAACCTTGTGATACAGC
+AACGCATGCACCTCCCGCAGGCGCGGAATGTTGTAGAACTCGAGCGGATCTTGTGACGCGGACTCGATAA
+TCAACGTCCCGGTGCGAAAAATCCGCTCGAAGATCCGGTCCCGGAACTCCACGCTGTTGATCCGTGCTAG
+CGGTATGTCGATCCCGCTGCGGGTCAGCACACCATGCCGGAACATCACCCGCCGGTTGGTCACCACGAAA
+TGTGTGGTCAGCCAGCTCAGGAATGGCCACAGCGTGAGCCAGCCGACGATCACCAACCAGATCCCCCAGA
+TGACCGCGTGAATCACGTTCTTAGCGATCTGCTGCCAAGGTGTCGAGTTGACGAATCCGGACCCGAACGC
+CGCCAACCCGGTCAGCAAGACCAGCACCACGACGGGCCAGATTAAGCGATTCCAGTGCGGATGGCGGTGC
+AGAACGACCTGCTCGCCAGCGGCCAGGACATTCTCCGGATAGCTCATGCCCGCGACCTTAATCTTTTGGG
+GACGCCAGCTCCGCGCGAGTTAACGCAAATGCACCACGTCGCCCGCTGAAACAACTACCGTTCGACCGCC
+GACGTCCAGACACAGCCGACCCTGGTCATCGATGTCACGCGCGATCCCGACGACGTCCTGGCCACCGGGG
+AGCTCGACGCGCACGCGCGACCCAATGGTCAGGCTGCGAGCACGGTAGTTGGCCGCCAGTTGTGGGTTGG
+CGTTGCGCCACTGGATGATCCGAGCTTCGAGCTCGCGCAACAGCCTGCTGGCTATGCGGTTGCGGTCCGG
+TGCCGCCACTCCGAGGTCCAGCAATGAGGTCGCGTCGGGATCAACCTCTTCGGGGGCCTGGGTGACGTTG
+AGTCCCACACCGAGTACCACAAACGGCTGCGCGACCTCGGCCAGGATGCCGGCTAACTTGCCACCCCGGG
+CCAGCACGTCATTGGGCCACTTGAGGCCCGTTTCGGCCGGCGGGACTGCAATCAGGGGGGCCACCGAATC
+GAGCACCGCCAGACCCGCGGCCAGTGACAGCCAGCCCCACGCTTGCACCGGGACGTCGACCACACGCACA
+CCGACCGACAGGATGATCTGCGCTCGGGCAGTGGCCGCCCAGCCGCGGCCATGACGCCCCCGCCCAGCGG
+TCTGATGCTCGGCGATCAACACCACCCCGTCGATATCGGCCCCGGATGCCGCCCGGGCCAGCAAGTCGGC
+GTTGGTGGAACCGGTTTGGGCCACGACGTCAAGTTGGCGCCACCCGGATCCAGCACCGATCAGCTGGTCG
+CGCAGTGAGCGTTCGTCCAAAGGCGGCCTGAGCCGATCGCGGTCGGTCACCGCCCCAGCCTAAGGAAGTA
+GTGTGCGGCAGCCGATAACATCGACTCCCATGACAAGCGTTACCGACCGCTCGGCTCATTCCGCAGAGCG
+GTCCACCGAGCACACCATCGACATCCACACCACCGCGGGCAAGCTGGCGGAGCTGCACAAACGCAGGGAA
+GAGTCGCTGCACCCCGTCGGTGAGGATGCCGTCGAAAAAGTACACGCCAAGGGCAAGCTGACGGCTCGCG
+AGCGTATCTACGCGTTGCTGGATGAGGATTCGTTCGTCGAGCTGGACGCGCTGGCCAAACACCGCAGCAC
+CAACTTCAATCTCGGTGAAAAACGCCCGCTCGGCGACGGCGTGGTCACCGGCTACGGCACCATCGACGGG
+CGCGACGTGTGCATCTTCAGCCAGGACGCCACGGTGTTTGGCGGCAGCCTTGGCGAGGTGTACGGCGAGA
+AAATCGTCAAGGTCCAGGAACTGGCGATCAAGACCGGCCGTCCGCTCATCGGCATCAACGACGGTGCTGG
+CGCGCGCATCCAGGAAGGTGTCGTCTCGCTGGGCCTGTACAGCCGTATCTTTCGCAACAACATCCTGGCC
+TCCGGCGTCATCCCGCAAATCTCGTTGATCATGGGAGCCGCCGCCGGTGGGCACGTCTACTCCCCCGCCC
+TGACCGACTTCGTGATCATGGTCGATCAGACCAGCCAGATGTTCATCACCGGGCCCGACGTCATCAAGAC
+CGTCACCGGCGAGGAAGTCACCATGGAAGAACTCGGCGGCGCCCACACCCACATGGCCAAGTCGGGTACG
+GCACACTACGCCGCATCGGGCGAACAGGACGCCTTCGACTACGTTCGCGAGCTGCTGAGCTACCTGCCGC
+CCAACAACTCCACCGACGCGCCCCGATACCAAGCCGCAGCCCCGACAGGGCCCATCGAGGAGAACCTCAC
+CGACGAGGACCTCGAATTGGATACGCTGATCCCGGACTCGCCCAACCAGCCCTATGACATGCACGAGGTG
+ATCACCCGGCTCCTCGACGACGAATTCCTGGAGATACAGGCCGGTTACGCCCAAAACATCGTGGTGGGGT
+TCGGGCGCATCGACGGCCGGCCAGTCGGCATTGTCGCCAACCAGCCGACACACTTCGCCGGCTGCCTGGA
+TATCAACGCCTCGGAGAAAGCGGCCCGGTTTGTGCGGACCTGCGACTGCTTCAATATCCCCATCGTCATG
+CTGGTGGACGTCCCGGGCTTCCTGCCGGGCACCGACCAGGAATACAACGGCATCATCCGGCGCGGCGCCA
+AGCTGCTCTACGCCTACGGCGAGGCCACCGTGCCAAAGATCACGGTCATCACCCGCAAGGCCTACGGCGG
+TGCGTACTGCGTTATGGGCTCCAAAGACATGGGCTGCGACGCCAACCTGGCGTGGCCGACCGCGCAGATC
+GCGGTGATGGGCGCCTCCGGCGCAGTGGGCTTCGTGTACCGCCAGCAGCTGGCCGAGGCCGCCGCCAACG
+GCGAGGACATCGACAAGCTGCGGCTGCGGCTCCAGCAGGAGTACGAGGACACACTGGTCAACCCGTACGT
+GGCCGCCGAACGCGGATACGTCGACGCGGTGATCCCGCCGTCGCATACTCGCGGCTACATCGGGACCGCG
+CTGCGGCTGCTGGAACGCAAGATCGCGCAGCTGCCGCCCAAAAAGCATGGGAACGTGCCCCTGTGAGTCG
+AGTGAGCGGAACGAACCTGTGAGTCGAGTGAGCGGAACGAACGAAGTGAGTGACGGGAACGAGACGAACA
+ATCCGGCAGAAGTGAGTGACGGGAACGAGACGAACAATCCGGCAGAAGTGAGTGACGGGAACGAGACGAA
+CAATCCGGCCCCTGTGAGTCGAGTGAGCGGAACGAACGAAGTGAGTGACGGGAACGAGACGAACAATCCG
+GCCCCTGTGACCGAGAAGCCGCTGCATCCGCACGAGCCCCACATCGAGATACTGCGGGGACAACCCACCG
+ATCAGGAGCTGGCCGCGTTGATCGCGGTGCTGGGCAGTATCAGCGGTTCAACCCCGCCCGCGCAACCCGA
+GCCCACCCGGTGGGGGCTGCCGGTCGACCAGTTGCGGTACCCCGTCTTCAGTTGGCAGCGCATCACACTG
+CAAGAAATGACGCACATGCGCCGATGACCCGGCTGGTGCTCGGGTCCGCCTCCCCTGGCCGGCTCAAAGT
+CCTTCGTGATGCCGGCATTGAGCCGCTGGTCATCGCCTCGCACGTCGACGAGGATGTCGTCATCGCGGCG
+CTGGGGCCGGACGCGGTCCCGAGCGATGTGGTGTGCGTACTGGCCGCGGCAAAGGCCGCGCAGGTCGCGA
+CCACGCTGACCGGAACGCAACGCATTGTGGCCGCGGATTGCGTTGTCGTTGCCTGTGATTCGATGCTCTA
+CATCGAAGGCAGGCTACTCGGCAAGCCAGCGTCAATCGACGAGGCGCGCGAGCAGTGGCGGTCGATGGCG
+GGCCGGGCCGGCCAACTCTATACGGGCCACGGTGTTATCCGGTTGCAGGACAACAAAACCGTGTACCGTT
+CTGCTGAAACAGCAATAACCACAGTATATTTCGGAACACCTTCGGCCTCCGATCTGGAGGCTTACCTGGC
+CAGTGGGGAGTCGCTGCGGGTCGCGGGTGGATTCACCCTGGACGGTCTGGGCGGCTGGTTCATCGACGGC
+GTGCAGGGCAATCCGTCGAATGTGATCGGCTTGAGCCTGCCGTTGCTGCGGTCGCTCGTGCAGCGATGCG
+GGCTGTCCGTCGCCGCACTGTGGGCAGGAAATGCGGGCGGCCCAGCGCACAAGCAGCAGTAGCTTCGGAC
+TGGGCCAGGTCGCCAGCGGTAGGCTCGATGATGTGCCGCTTCCCGCAGACCCTAGCCCCACCTTGTCGGC
+CTACGCCCATCCCGAACGGCTCGTGACCGCCGACTGGTTGTCGGCACACATGGGCGCGCCGGGCCTGGCG
+ATCGTCGAATCCGACGAGGACGTCTTGCTCTACGACGTCGGCCATATTCCCGGCGCCGTCAAGATCGACT
+GGCACACCGACCTCAACGACCCACGGGTGCGCGACTACATCAACGGCGAGCAGTTCGCCGAATTGATGGA
+CCGCAAGGGCATCGCCCGCGATGACACCGTGGTGATCTATGGCGACAAGAGCAATTGGTGGGCCGCCTAT
+GCGTTGTGGGTGTTCACGCTGTTCGGTCACGCCGACGTGCGACTCCTCAACGGCGGCCGTGACCTCTGGC
+TCGCCGAGCGCCGGGAAACCACCTTGGACGTCCCGACCAAGACCTGCACCGGTTATCCCGTCGTGCAGCG
+CAACGATGCACCCATCCGCGCATTCAGAGACGACGTGCTGGCCATCCTGGACGCTCAGCCGCTGATCGAC
+GTACGCTCTCCCGAGGAGTACACCGGCAAGCGCACCCATATGCCCGATTACCCCGAGGAAGGGGCGCTGC
+GGGCCGGTCACATCCCCACGGCGGTGCACATTCCGTGGGGGAAGGCCGCCGACGAAAGTGGACGGTTTCG
+CAGCCGCGAGGAATTGGAACGGCTCTATGACTTCATAAACCCGGACGACCAAACCGTCGTCTATTGCCGC
+ATCGGTGAACGCTCCAGCCATACCTGGTTCGTGCTCACACACCTGCTGGGCAAGGCAGATGTACGGAACT
+ACGACGGCTCGTGGACCGAGTGGGGCAACGCCGTGCGAGTGCCGATCGTCGCGGGCGAAGAACCAGGAGT
+GGTACCCGTCGTATGACCGCGCCCGCGAGCCTGCCCGCGCCGCTAGCAGAGGTGGTATCCGACTTCGCCG
+AAGTCCAGGGTCAAGACAAGCTGAGGCTGTTGCTGGAATTCGCCAACGAGCTGCCGGCGCTTCCGTCGCA
+CCTGGCCGAGTCCGCTATGGAGCCGGTCCCCGAGTGCCAGTCTCCGCTGTTTTTGCACGTCGACGCGAGT
+GACCCCAACCGGGTGCGCCTGCATTTCAGCGCGCCGGCCGAAGCGCCAACCACGCGCGGGTTCGCCTCGA
+TCCTGGCCGCCGGCCTAGACGAGCAACCGGCCGCCGACATCTTGGCGGTGCCCGAGGATTTCTACACCGA
+GCTGGGTCTGGCTGCCTTGATCAGCCCACTGCGGTTGCGGGGAATGTCGGCGATGCTGGCCCGGATCAAG
+CGCCGGCTGCGCGAAGCGGACTGAATCGAGGAACCGCGTGAGCGGGTCAGCGGCGCGACGCTTAAACTTC
+CCCCGACAAGACTTGTAAGAAAATCTCTTAGAGACGAAGAATCAGCCCGACAGGAGGCGCAGTGGCTAGT
+CACGCCGGCTCGAGGATCGCTCGGATCTCTAAGGTTCTCGTCGCCAATCGCGGCGAGATCGCAGTGCGGG
+TGATCCGGGCGGCCCGCGACGCCGGCCTGCCCAGCGTGGCGGTGTACGCCGAACCCGACGCCGAGTCCCC
+GCATGTTCGGCTGGCCGACGAGGCGTTCGCGCTGGGCGGCCAGACCTCGGCGGAGTCCTATCTGGACTTC
+GCCAAGATCCTCGACGCGGCAGCCAAGTCCGGGGCCAACGCCATCCACCCCGGCTACGGCTTCCTAGCGG
+AAAATGCCGACTTCGCCCAGGCGGTGATCGACGCCGGCCTGATCTGGATCGGCCCCAGCCCGCAGTCGAT
+CCGCGACCTGGGCGACAAGGTCACGGCCCGTCACATCGCGGCCCGCGCTCAGGCGCCCCTGGTGCCGGGT
+ACCCCCGATCCGGTCAAAGGCGCCGACGAGGTGGTGGCATTCGCCGAGGAGTACGGCCTGCCGATCGCGA
+TCAAGGCCGCCCACGGCGGCGGCGGCAAGGGCATGAAGGTGGCCCGCACCATCGACGAGATTCCGGAGCT
+GTACGAGTCGGCGGTGCGCGAGGCCACGGCCGCGTTCGGCCGCGGTGAGTGCTACGTGGAGCGCTATCTC
+GACAAGCCGCGCCACGTCGAAGCACAGGTGATCGCCGACCAGCACGGCAACGTCGTCGTCGCCGGCACCC
+GGGACTGCTCGCTGCAGCGCCGCTACCAGAAGCTGGTCGAGGAGGCGCCCGCACCGTTCCTGACCGACTT
+TCAACGCAAAGAGATCCACGACTCGGCCAAACGGATTTGCAAAGAGGCCCATTACCATGGCGCCGGCACC
+GTCGAATACCTGGTCGGTCAGGACGGCTTGATCTCGTTCTTGGAGGTCAACACGCGCCTTCAGGTAGAAC
+ACCCGGTCACCGAGGAAACCGCGGGCATCGACTTGGTGCTGCAGCAATTCCGGATCGCCAACGGCGAAAA
+GCTGGACATCACCGAGGATCCCACCCCGCGCGGGCACGCCATCGAATTCCGGATCAACGGCGAGGACGCG
+GGGCGTAACTTCCTACCGGCGCCCGGGCCGGTGACAAAGTTCCACCCGCCGTCCGGCCCCGGTGTGCGGG
+TGGACTCCGGTGTCGAGACCGGCTCGGTGATCGGCGGCCAGTTCGACTCGATGCTGGCCAAGCTGATCGT
+GCACGGCGCCGACCGCGCCGAGGCGCTGGCGCGGGCCCGGCGCGCGCTGAACGAGTTCGGTGTCGAAGGC
+CTGGCGACGGTCATCCCGTTTCACCGCGCCGTGGTGTCCGACCCGGCATTCATCGGCGACGCGAACGGCT
+TTTCGGTACATACCCGCTGGATCGAGACCGAGTGGAATAACACCATCGAGCCCTTTACCGACGGCGAACC
+TCTCGACGAGGACGCCCGGCCGCGTCAGAAGGTGGTCGTCGAAATCGACGGTCGCCGCGTCGAAGTCTCG
+CTGCCGGCTGATCTCGCGCTGTCCAATGGCGGCGGTTGCGACCCGGTCGGTGTCATCCGGCGCAAGCCCA
+AGCCGCGCAAGCGGGGTGCGCACACCGGCGCGGCGGCCTCCGGTGACGCGGTGACCGCGCCTATGCAGGG
+CACCGTAGTTAAGTTCGCGGTCGAAGAAGGGCAAGAGGTCGTGGCCGGCGACCTAGTGGTGGTCCTCGAG
+GCGATGAAGATGGAAAACCCGGTCACCGCGCATAAGGATGGCACCATCACCGGGCTGGCGGTCGAGGCGG
+GCGCGGCCATCACCCAGGGCACGGTGCTCGCCGAGATCAAGTAAGCCCGGCGGCTACTCCAACTGATCCC
+GTAGCCGTGCCAATGACTTGGCCAGCAGCCGCGACACGTGCATCTGTGAGATACCGACGCGCTCGGCGAT
+CTGCGTTTGGGTCATCGAGTCGAAGAACCTGAGCACCAAGACCGTTCGTTCCCGCTCGGGCAACGCCTCG
+AGCAACGGACGAAGCACCTCCCGATTCTCGATCTGGTCAAGACCCGCATCCACGTCGCCCAGGGTGTCTG
+TGATTGCGCGGGCATCGTCGTCGCTGCCGCCACCGCTGTCGATGGACAAGGTGTGGTAGGAACTACCCGC
+CAGCAAACCTTCGATAACCTCAGCGCGGTCCATCCCGAGCTCCGCGGCGAGCTCCGATGCCGACGGCGCC
+CGCCCGAGCCGCTGCGACAAATCGGCGGTGGCGGTACCTAGCCGCAGATGCAGTTCCTTGAGACGCCGGG
+GAACCTTGACCGACCAGCTGTTGTCGCGGAAGTGTCGTCGGACCTCGCCCATGATGGTAGGAACCGCGAA
+GGAGACGAAGTCCGACCCGGTCTTCACGTCGAAGCGAACCGCGGCGTTGACCAGCCCGACCCGCGCGACC
+TGAATAAGGTCGTCACGCGGTTCGCCGCGACCCTCGAACCGCCGCGCGATGTGATCGGCCAGCGGCAAGC
+ACCGCTGAACGATCTTGTCCCGGTGCCGCTGGAATTCCGGTGAGCCGGCAGGCAAACCAACCAGCTCGCG
+AAACATCTCCGGAACGTCGGCGTATTCGTTAGCTCGCGATGCAGAACCGCCGGCAGCGCGCGCCGTCACC
+TGCTGGATGCCGCCCGTCGGGCGGTCAACGTGATGCCGAAGACACTGCCGGCTACATCGGGCTGGCGACC
+GTCGTGGAAGGTCTGGACGTCGTCGGCCAGCGCGGTCAGGACATGCCAGCTAAAGCTGCCCGGTGCCACC
+ACGTCGTGGGTGTCGCAGGCAGCAGAAGCCTCCACCACAACTTCGTCTTTTCGCGGATCGACCACCAGGC
+GCAGGGTGGCATCCGGCAAGGCCGAGCGAATCAACCGGGTGCACACCTCGTCCACCGCCAACCTCAGGTC
+GGCCACGGCGTCGAAATCCAGGTCCTCGAAGGTGCCGATGGCGCCGACCAGGGTGCGCAGCAGCGCCAGG
+TTCTCCAGGCGGGCAGCAACGTTCAGCTCGACGGCGCGGACACCGCGTTGGCGCCCCTTGGTGGGTAAAT
+CCGAGTCGGCCATGCACCCTCCCGGCAAGCTTCGATCGACAGTACTCCCGCCTTGGGTCTGGTCTTCGAG
+CTGGTCGGTCATGGTCGGACCTGCTGGTAGTGGGGATCTAACGCAACATGGTCGGGATTCATCATGGTGT
+ACCCGTGATACCCATTCGCAGCTGCCGGTGAAACCCCGCGATGCCGGGATTTCCAGCCGCACTAGGATGT
+CTAGCCGGCCAGCCGCTGCCGCCGGACTTCGGGATGTTCGGTATACCAGCGATCGGCAATCTTGCGTATC
+CGCCGATGCTCGAACGCTAGCCACGCCAAACCAACCACTGTGACGACAATCGCCACCACACCAAAGGTCA
+TGCCCTCGGCGTGATGTCCGGTGCCGAAAGCCGCAAGAGCTCCGACGCCGCCGACGACACCGGCCACAAT
+CAACAGATACCCAGGCCAATGCACCACGTCGATCAGCGACTCGCCGGCAAGCGGCCGCGTCGTCCGCAAG
+TGGTCGACGGGGTCACGATAGGTGTCGCCCATGGCCTCCTCCGTTTCCGTCCTATTCCGCCATTTCTGCC
+CATTACCAGGCACTACCATCAACGGTAGAACTCGTCGAACGGGTTGTGGAGGGATCTGACCCATTTATTT
+GTTGACCGCGGCCGACCTGGCCGACGGCTCACGGTGCCATGACCGGGCCGGCGATCGGTGGGACGCCTAT
+GCAGAGCGTCAGCACCATCAGCGTCAACAAAAACCAGCCGGCGCCGTGCCATCCCCACCAGGTACCTTCC
+GCACGCCATACCCGGTAGGTGCGCAGAAACGCCCACAGCCCGGCCGCACACAGGATCAGCGGGCCCCCCA
+GCGCCAGCAGGATCCGCTGGGGCGGGCCGCAGGCCGCGGTGTCGACGCCGCTGCACGTGCTGACCAACAA
+CGCTCCCATAATGAGGAAACCGACCCCGACGACAGCGGCCACAACAGCAAACCGAATCGCCGAGTGCACC
+TCGCTGTCATCCCGGCCTAGCCGATCGCCGCGTGACGGCCCACCTACTTCGTGCATCGGCGAATCTCCAT
+CCCGCTCTTGGCGGCTGCCTTACGTCACCACCGGTAACGCGCTGCGCACCGCGGCTATCGCGGCGTCGAT
+CTCGGCGGTTGAAACCGTCAGCGGTGGACGGAATCGCACGGTGTCTGCACCGGCCGGCAACACAATCACC
+GCACGTTGCCACAGCTGGCGGATCAACTCGTCACGGTCGGCGGTGGTCGGCAGGCTAAACGCACACATCA
+GCCCGCGGCCGCGCGGATCGAGAACCACTGCCGGGAAGTCCGCGGCGAGTTCGTCAAGCCGGGCGCGCAG
+ATACTTACCGTGCTGCACCGCCCGCTCGAACAGGCCCTCGGCTTCGATGACCTCCAAGATGCGGCGGGCG
+CGCACCATGTCGGTAAGATTGCCACCCCATGTCGAGTTGAGCCGTGATGGGACCGCGAACACATTGTCGG
+CGACCTCGTCCACCCGCCGACCGGCCATCACTCCGCATACCTGCGTCTTCTTGCCGAACGCCACGATGTC
+GGGTGCGACATCCAACTGCTGGTATGCCCAGGCGGTTCCGGTCAACCCGCAGCCGGTCTGTACTTCGTCG
+AAGATCAGCAGTGCATCAAACTCGTCGCACAGCTCGCGCATCGCAGCGAAAAACTCCGGGCGGAAATGGC
+GGTCGCCACCCTCGCCCTGGATGGGTTCGGCCACAAAACACGCGATGTCGTGCGGGCGGGTCTCGAATGC
+CGCGCGGGCCTGGCGTAGCGCCTCGGCCTCTAGCGCGGCCATAGCGGGCTCATCCAGGCCGGGCCGCATG
+TACGGCGCATCGATGCGTGGCCAGTCGAATTTCGGGAACCGGGCGGTAATGGTCGGCTTGGTGTTGGTCA
+GCGACAGGGTATAGCCGCTGCGGCCGTGAAATGCCCCGCGCAGGTGGAGCACTTGAGTGCCCAGCGCCGG
+GTCGATCCCATGGGCTTGGTTGTGCCGACTCTTCCAGTCGAACGCGGCTTTGAGCGCGTTCTCCACCGCC
+AGGGCGCCCCCTTCGACGAAGAACAGATGCGGCAGCGCCGGGTCGCCCAAGACACGGGCGAAGGTCTCGA
+CGAAGCGGGCCATCGCCACCGAGTACACGTCGGAATTGCTGGGCTTGTTCAGCGCGGCCTGCATGAGTTC
+GGCATGGAACTCCCGGTCGTCCACCAGCGCCGGGGGATTCATACCCAGTGCCGAGGAGGCAACGAATGTG
+AACATGTCCAGGTAGCGCCGACCCGTTATAGCGTCGACCAGATATGAACCGCCCGAACGGGTCAGATCGA
+GCACTATGTCCAGACCGTCGACCAGCATGCTGCGCCCTAGCACCTCATGAACCCGGTCTGGTGTTGTTGG
+TCTACCGGCAAGAGCGACGGACTTCACGACGGCGGCCATGACGCTATGATAGCAGGATTTACGGAATATT
+GATATTTATGCTGGAAAAATTATGGTATATGCTGCCTATCGCTGTAAAAAGTGTTCAGAATGATCGTGCT
+TCGCGTCCGCACGTTCGCCGTTGTCCGGATCCGTTGCAACAGGTCCTCGAGCGCCCGTGCGGACGCGACG
+CGCACCAGCAAGACGTAGCTCTCTTCGCCGGCCACCGAGTAACAGGACTCGACCTCCTCGATATGTTCTA
+GGCGCGCGGGGGCATCATCTGGTTGAGACGGATCAAGAGGAGTGATAGCCACGAACGCCGACAACAAATG
+CCCAACCGCCTCGGGATTGATTCGCGCCGAATATCCCTGGACCACACCACGAGACTCCAGCCGGCGCACT
+CGCGATTGGACCGCCGAGACCGACAGCCCGGCTCGCGTGGCCAACTCTGACAGCGTCACACGTCCGTCGG
+CGGCCAGTTCGCGCACCAGGATCCGATCGATATCGTCGAGCGCCTCGTTCATGGCCGGAGACTATCGCAA
+CGGCAGTGCCGCATGAGCCGCTCGAAAAGACTGCAGACTGGCCAGCTGCGCGCGCGCTTCGCCGCCGGGT
+TGTCAGCCATGTACGCCGCTGAGGTGCCCGCCTACGGCACGCTGGTCGAGGTATGCGCACAAGTCAACTC
+CGATTACCTGACCCGGCATCGGCGAGCCGAGCGGCTGGGGTCGCTTCAGCGCGTCACCGCCGAGCGCCAC
+GGCGCCATCCGAGTGGGCAACCCGGCCGAACTCGCTGCGGTCGCCGACCTGTTCGCCGCGTTCGGGATGC
+TGCCGGTCGGCTACTACGATCTGCGCACCGCTGAGTCACCAATTCCAGTGGTGTCCACCGCATTTCGCCC
+AATCGATGCGAACGAGCTGGCACACAACCCGTTTCGGGTGTTCACCTCGATGCTGGCCATCGAGGATCGG
+CGGTACTTCGATGCCGACCTACGCACCCGAGTGCAGACCTTCCTCGCGCGCCGGCAACTCTTTGACCCCG
+CGTTGCTCGCCCAGGCGCGGGCAATCGCGGCTGACGGCGGCTGCGATGCCGACGACGCACCGGCTTTCGT
+CGCCGCGGCGGTGGCCGCGTTTGCGCTGTCGCGGGAACCGGTCGAGAAATCCTGGTACGACGAGTTGTCC
+AGGGTGTCGGCGGTGGCCGCTGATATCGCTGGAGTCGGCTCCACACACATCAACCATCTGACGCCTCGGG
+TGCTCGACATAGACGATCTGTACCGTCGGATGACCGAGCGCGGCATCACCATGATCGACACCATCCAAGG
+CCCTCCCCGCACCGACGGACCCGATGTGTTGTTGCGGCAAACCTCATTTCGCGCGCTGGCCGAACCACGC
+ATGTTTCGCGACGAGGACGGTACCGTGACGCCGGGAATCCTGCGGGTGCGGTTCGGTGAGGTCGAGGCGC
+GCGGTGTCGCGCTGACCCCGCGAGGGCGCGAACGCTACGAAGCCGCGATGGCGGCCGCAGATCCGGCCGC
+GGTCTGGGCCACTCACTTTCCCTCGACGGATGCGGAGATGGCCGCTCAAGGCTTGGCCTACTACCGAGGT
+GGTGACCCGTCAGCGCCGATCGTCTACGAAGACTTCCTGCCCGCTTCGGCCGCGGGCATCTTCCGCTCCA
+ACCTGGATCGCGACTCGCAAACCGGTGACGGACCCGACGATGCCGGCTACAACGTCGATTGGTTGGCCGG
+GGCAATCGGCCGACACATTCACGACCCGTATGCGCTCTATGACGCGCTCGCCCAGGAGGAGCGGCGCTGA
+TAACCACTGACGCGTTACGAGCCCAGGTGCTCGAAGCCTGCCAAGCGATCGGCGTAACCGCCGCCCTTGG
+CGAGCCGGGCGAACACAGCCTGCCCGCGAGCACACCGATCACCGGCGACGTGCTGTTCAGCATCGCACCG
+ACCACCCCGGAGCAGGCCGACCACGCGATCGCCGCGGCGGCCGCAACATTTACGGCATGGCGAAGCACGC
+CGGCCCCGGTGCGCGGCGCGCTCGTGGCCCGGCTCGGCGAGCTGCTCACCGCACACCAGCAGGACCTCGC
+GACACTGGTCACAGTCGAAGTAGGCAAGATCACCGCCGAGGCGCGCGGCGAAGTGCAGGAAATGATCGAC
+GTCTGCCAGTTCTCGGTGGGTCTGTCACGCCAGCTCTACGGCCGCACCATCGCGTCAGAGCGCGCTGGGC
+ACCGGCTCCTGGAAACCTGGCATCCGCTGGGAGTGGTGGGCGTGATCACCGCGTTCAACTTCCCGGTCGC
+GGTCTGGGCGTGGAACACCGCGGTGGCACTGGTCTGCGGCGACACGGTGGTGTGGAAACCCTCGGAGCTG
+ACGCCGTTGACGGCGCTGGCCTGCCAGGCGCTGCTCAGTCGGGCCGCCGCTGATGTCGGCGCGCCGGCCG
+CGGTGGGCGGCCTGCTGTTGGGCGGCGCCGAGCGTGGTGCGCAACTCGTCGACGACCCGCGGGTTGCGTT
+GTTGTCGGCGACGGGTTCGGTGCGGATGGGCCAGCAGGTCGGTCCACGCGTCGCCCGGCGCTTCGGGCGG
+GTGCTGCTGGAGTTGGGCGGCAACAACGCGGCCATTGTGGCGCCGTCGGCCGACCTGGAGCTGGCGGTGC
+GCTGCATCGTGTTCGCCGCGGCCGGCACCGCAGGTCAGCGCTGCACCAGCCTGCGCCGGCTGATCGTGCA
+CCGCTCGGTGGCTGACGATGTGGTGGCACGCGTCGTCGGCGCCTATCGCCAGCTGGCGATCGGTGACCCG
+TCGGCCCCGGACACGCTGGTAGGCCCACTCATCCACGAGGCCGCCTACCGCGACATGGTGGCAGCGCTCG
+AGCGGGCACGCACCGACGGCGGCGAGGTCATCGGCGGTGATCGTCGCGAGGTGGGCTCACCGGGCGCCTA
+CTATGTCGCGCCCGCTGTGGTCCGAATGCCGTCCCAGACCGCCATCGTGGCGACCGAAACGTTCGCACCA
+ATCCTGTACGTGCTCACCTACGACGACCTCGACGAGGCGATAGCCCTCAACAACGCGGTACCACAAGGGC
+TTTCGTCGTCGATCTTCACGACCGACCTGCGTGAGGCCGAGCACTTCCTCGACCAGTCCGACTGCGGTAT
+CGCCAACGTCAACATCGGGACGTCGGGAGCGGAGATCGGTGGTGCCTTCGGCGGCGAGAAGCAGACCGGC
+GGCGGCCGCGAGTCCGGGTCCGACGCGTGGAAGGCCTACATGCGCCGGGCCACCAACACCGTCAACTACT
+CGAGCGAGCTGCCGCTGGCGCAGGGCGTGAAGTTCGGGTAACCATGCCCGTGGGTGCGTCTGGGCATCAT
+CGACGCGCGCTTGGGGTTGGGCGGGGTGGAATTCATCCATTTCATTCAGTGCCCGTTGCGAATCCCCAAG
+CTACCCCGACGGCGACCAGAGGATGTCGATGGGGACGGCGGCGAGGCGGTCGCCGAATGGCTGGGCTTGT
+GGGCCGGTGTGCAGGATCACGCCGCCGGCGAAGCGTGCGCCGACTTTGTCGCGGAGTCTGCTGATCGAGC
+GGGTGTCTCTACCACGGAGGGTTGCCGCCGACTTGATTTCGATCGCGGCAATGAGGCCGTCTGCGGTTTC
+CAGTATGAGGTCTACTTCGGCGCCGTCTCGATCGCGGTAGTGGAACAGTCGAGGTGCCTGTTGCGACCAT
+CCGAGTTGTCGCCGGAGTTCTGCGATCACGAAAGTTTCGATGATGGCTCCGGCCGCGTTGGGGTTGGCAT
+GTGGACCGGCTCCGGTAGGCGAGACATTGACGAGGCGAGCGGCCAGTCCGGAGTCGAGAAGGAGGACTTT
+CGGTCTATCGACGACCCGCTTGGAAAGGTTGGTCGACCACGCGGGTATGCGGTCGATGAGATACAGGGTC
+TCGAGGAGGTCGAGGTACGGCGGCAGGGTACGTACGGGGATTTCGGCGTCGGTAGCTAGGGAGCTCAGGT
+TAAGTTCGGACGCGCTGCGTGCGGCTAGAAGTCGGATGAGGCGCGGCAGGTCGGCGATGCGTTGGAGATT
+GGAGACGTCGGCCGCGTCACGTTTGACGACGCGGTCGACGTTCCTAGCTTTCGCCGATTCGCGACAAAGC
+CGTCGCCGATACGCGGCACTATCTTCGCCAATTCGCGGATATCTCCTCACCGATTCGCGATATCTGGCGG
+AGCCGGTGGTGTCGCAGCAGGGACGTCGGGGCAGACCCACCCCACCGAAAGAACCACCACCACCTGCTCG
+CCTAGCCGAACGTGTGGTCTACGTGAGTAATATCTGTCACATGGCGACAGCCAGAAGGCGGTTATCCCCG
+CAGGACCGCCGCGCTGAACTGCTCGCTCTGGGGGCGGAGGTCTTTGGGAAGCGGCCTTACGACGAGGTTC
+GCATCGATGAGATCGCCGAGCGCGCTGGGGTGTCGCGGGCACTGATGTATCACTACTTCCCGGACAAGCG
+GGCGTTCTTCGCCGCGGTCGTCAAGGACGAGGCCGACCGGCTGTACGCGGCGACCAACAAGGCGCCCGCC
+CCTGGGATGACGATGTTCGAAGAGATACGAACCGGCGTGCTGGCCTATATGGCCTACCACCAACAAAACC
+CCGAGGCGGCGTGGGCCGCCTACGTCGGCCTCGGCCGATCGGACCCGGTTCTGCTCGGTATCGACGACGA
+AGCCAAGAACCGCCAGATGGAACACATCATGTCCCGCATCGCCGAGGTCGTGAGCGGGATTGACCGCGAT
+AACACCCTGGACCCAGAGGTCGAGCGCGACCTGCGGGTGATCATCCACGGCTGGCTGGCGTTCACCTTCG
+AGCTGTGTCGTCAGCGGATCATGGACCCGTCGACCGACGCTGAACGGCTCGCCGATGCTTGCGCACACGC
+GCTGCTGGACGCCATCTCCCGGCTGCCGCAGATCCCTGCCGAACTGGCTGACGCGATGGCAACCGCGCGA
+ATGTGAGCGGTAGGCGGTTTTTGTCGGTGCCTGTTGGCACGATGGCTAGGTGAGGTTCGCGCAGCCTTCA
+GCACTGAGCCGATTCAGCGCGCTCACCCGAGACTGGTTCACCAGCACTTTCGCCGCGCCCACCGCCGCCC
+AGGCCAGCGCCTGGGCGGCCATCGCAGACGGCGACAACACGCTGGTCATCGCTCCCACCGGATCCGGGAA
+GACCCTGGCGGCGTTCCTGTGGGCCCTGGATAGCTTGGCCGGTTCGGAACCTATGTCCGAGCGGCCGGCG
+GCCACCCGCGTGCTGTATGTGTCGCCGCTCAAAGCGTTGGCCGTCGACGTCGAGCGCAACCTGCGCACTC
+CGCTGGCCGGACTGACCCGACTCGCCGAACGCCAGGGTCTGCCCGCGCCCCAGATCAGGGTGGGCGTCCG
+TTCGGGCGACACCCCGCCCGCACTTCGCCGCCAGCTCGTCAGCCAGCCGCCCGACGTGCTGATCACCACC
+CCGGAGTCATTGTTTTTGATGCTCACTTCGGCCGCACGCCAAACTCTGACCGGTGTGCAGACCGTCATCA
+TCGACGAAATTCATGCCATCGCCGCCACCAAGCGCGGCGCACACCTGGCACTATCCCTAGAACGGCTCGA
+CGACCTGTCTAGCCGGCGACGGGCGCAGCGCATCGGGCTGTCGGCGACCGTACGTCCTCCCGAGGAACTC
+GCAAGGTTCCTGTCCGGACAGTCCCCGACGACCATTGTGGCGCCCCCGGCCGCCAAGACCGTTGAGCTGT
+CCGTGCAGGTGCCGGTGCCCGACATGGCCAACTTGACCGACAACACCATCTGGCCGGATGTGGAGGCTCG
+GCTGGTCGACCTGATCGAATCACACAACTCGACCATCGTGTTCGCCAATTCGCGACGATTGGCCGAGCGA
+CTTACCGCACGGCTCAACGAAATTCACGCCGCGCGCTGCGGGATTGAGCTCGCGCCAGACACCAACCAGC
+AGGTTGCCGGCGGCGCCCCGGCGCACATCATGGGCTCGGGCCAGACGTTCGGAGCGCCGCCGGTGCTGGC
+CCGCGCCCACCATGGCTCGATCAGCAAGGAGCAGCGCGCCGTTGTCGAAGAGGACCTCAAACGCGGGCAA
+CTCAAAGCGGTGGTGGCGACGTCCAGCCTGGAGCTGGGCATCGACATGGGCGCGGTCGATCTGGTGATCC
+AAGTACAGGCACCACCATCGGTGGCCAGCGGGCTGCAGCGCATTGGCCGGGCCGGTCATCAGGTCGGCGA
+GATTTCGCGGGGGGTGCTGTTTCCCAAGCATCGCACCGACCTACTCGGCTGCGCGGTCAGCGTGCAGCGC
+ATGCTTGCCGGTGAGATCGAGACCATGCGGGTGCCGGCCAACCCACTCGACATTCTGGCCCAGCACACGG
+TGGCGGCGGCTGCGCTGGAACCGTTGGATGCCGACGCGTGGTTCGACACCGTGCGGCGGGCCGCCCCGTT
+CGCGACCCTGCCGCGTAGCCTGTTCGAGGCCACCCTGGACCTGCTGTCCGGCAAGTACCCATCCACCGAG
+TTCGCTGAGCTGCGGCCGCGGCTGGTGTATGACCGCGATACCGGCACGCTGACCGCGCGACCCGGAGCCC
+AGCGACTGGCCGTCACCTCCGGCGGCGCCATTCCCGATCGCGGGTTGTTCGCCGTCTACCTCGCTACCGA
+GCGGCCGTCGCGGGTAGGCGAACTCGACGAGGAAATGGTTTACGAGTCCCGCCCCGGTGACGTGATCTCG
+CTGGGTGCCACCAGCTGGCGAATCACCGAGATCACCCACGACCGGGTGCTGGTGATCCCCGCGCCGGGCC
+AGCCGGCCCGATTGCCGTTCTGGCGCGGAGACGATGCCGGCCGCCCCGCCGAGCTCGGCGCCGCACTCGG
+CGCCCTCACCGGCGAGCTGGCCGCCCTGGACCGTACGGCATTCGGCACACGTTGTGCGGGTTTGGGTTTC
+GACGACTATGCCACCGACAACCTGTGGCGACTGCTGGACGACCAACGCACCGCTACCGCAGTGGTACCCA
+CCGACAGCACATTGTTGGTCGAGCGGTTTCGTGACGAGCTGGGCGATTGGCGGGTGATCTTGCATTCGCC
+GTATGGGCTGCGGGTGCACGGACCGCTCGCGCTCGCAGTCGGCCGGCGGCTGCGCGACCGCTATGGCATC
+GACGAGAAGCCGACCGCCTCCGACAACGGCATAATGGTGCGCCTACCGGACACCGTGTCCGCTGGCGAAG
+ACAGCCCGCCGGGTGCCGAACTGTTCGTTTTCGACGCCGACGAGATCGACCCGATCGTCACCACCGAAGT
+GGCCGGTTCGGCGCTGTTCGCGTCACGGTTCCGGGAATCGGCGGCCCGCGCTCTGCTGCTGCCCCGCCGG
+CACCCCGGCCGCCGCTCGCCGCTGTGGCAGCAGCGGCAGCGCGCCGCCCGGCTGTTGGAAGTGGCCCGCA
+AATACCCCGACTTCCCGATTGTGCTGGAGACGGTCCGCGAGTGCCTGCAGAACGTCTATGACGTCCCGAT
+CTTGGTCGAGCTGATGGCGCGGATCGCCCAGCGGCGGGTGCGTGTCGCCGAAGCCGAGACCGCCAAACCT
+TCGCCATTTGCGGCATCGCTGTTGTTCGGCTACGTCGGCGCCTTCATGTACGAGGGCGATACGCCGCTGG
+CCGAACGGCGCGCCGCCGCGCTCGCGCTGGACGGCACGTTGCTGGCCGAGCTGCTAGGCCGGGTGGAGCT
+GCGCGAGCTGCTCGATCCTGACGTCATCGCCGCTACCAGCCGCCAGCTCCAGCATCTGGCGGCCGACCGG
+GTAGCCCGTGACGCCGAAGGGGTTGCCGATCTGCTGCGGCTGCTGGGTCCGCTCACCGAAGACGAGATCG
+CTGCCCGGGCGGGCGCGCCCGAGGTCAGCGGCTGGCTGGACGGCTTACGCGCCGCCAAACGCGCGCTCGT
+GGTGTCCTTCGCCGGCCGCAGCTGGTGGGTTGCCGTCGAGGACATGGGCCGGCTGCGCGACGGCGTTGGC
+GCGGCGGTTCCGGTGGGGCTGCCGGCCAGCTTCACCGAGGCGGTAGCCGACCCGCTGGGCGAACTACTGG
+GCCGCTACGCACGCACCCACACACCGTTCACCACCGCTGCGGCCGCAGCCCGGTTCGGTCTTGGGCTGCG
+GGTGACCGCCGACGTGCTGGGCCGGCTGGCCAGCGATGGCCGGCTGGTGCGCGGCGAATTCGTGGCCGCG
+GCCGAAGGATCCGCCGGCGGCGAGCAGTGGTGTGACGCCGAGGTGTTGCGAATTCTGCGGCGCCGCTCGC
+TGGCCGCACTGAGGGCGCAGGCAGAGCCGGTCAGCACCGCCGCCTACGGACGCTTCCTGCCGGCCTGGCA
+GCACGTTTCCGCGGGCAACTCGGGCATCGACGGGCTGGCCGCGGTCATCGATCAGCTCGCCGGCGTCCGG
+ATACCGGCCTCGGCGATCGAACCGCTGGTGCTTGCCCCACGGATCCGCGATTACTCGCCGGCGATGCTCG
+ACGAGCTGCTCGCGAGCGGGGACGTCACCTGGTCGGGCGCCGGGTCGATCTCAGGCAGTGACGGCTGGAT
+CGCCCTGCACCCCGCCGACTCGGCGCCCATGACGCTGGCGGAGCCGGCCGAGATCGACTTCACCGACGCC
+CACCGGGCGATCTTAGCCAGCCTGGGCACTGGCGGCGCGTACTTCTTCCGCCAGTTGACCCACGACGGCC
+TGACCGAGGCGGAACTCAAAGCCGCTCTGTGGGAATTGATTTGGGCCGGACGAGTGACCGGCGACACGTT
+CGCACCGGTACGCGCGGTACTCGGCGGGGCGGGCACCCGGAAGCGTGCTGCTCCCGCACACGGCGGGCAT
+CGACCGCCGCGCCTGAGCCGATACCGCCTCACGCACGCCCAGGCCCGCAACGCTGACCCGACCGTCGCCG
+GGCGGTGGTCCGCGCTGCCGCTTCCCGAACCGGACTCCACGCTGCGCGCCCATTACCAAGCCGAGCTGCT
+GTTGAACCGCCACGGCGTGTTGACCAAAGACGCAGTTGCTGCCGAGGGTGTGGCGGGCGGGTTCGCGACG
+CTCTACAAGGTGCTCAGTGCGTTCGAGGATGCCGGCAGGTGCCAGCGTGGCTACTTCATCGAGTCGTTGG
+GGGGCGCTCAGTTCGCCGTCGCCTCGACCGTAGACCGGCTGCGTAGCTACCTCGACGGTGTCGACCCCGA
+ACAGCCGGACTACCACGCGGTGGTGCTGGCCGCTGCCGACCCGGCCAACCCGTATGGGGCGGCGTTGCCC
+TGGCCAGCGTCGAGCGCTGACGGTACCGCCCGGCCGGGCCGCAAAGCCGGCGCACTGGTCGTTCTGGTGG
+ACGGCGAGTTGGCCTGGTTCCTCGAGCGCGGCGGGCGGTCGTTGCTGACGTTCACCGATGATCCCGAGGC
+CAACCACGCGGCGGCCATCGGGCTGGCCGACCTGGTCACCGCCGGGCGCGTCGCGTCGATTCTGGTCGAG
+CGGGCCGACGGCATGCCGGTGCTGCAGCCCGGCGGGCGGGCGTCGGCGGCACTGACGGCGCTGCTGGCAG
+CCGGCTTCGTCCGCACACCTCGCGGTCTGCGGCGGCGGTAAGCCATGCCCGAGGGCGACACCGTCTGGCA
+CACCGCGGCCACGTTGCGGCGGCATCTGGCCGGTCGCACGTTGACACGTTGCGACATCCGAGTGCCACGG
+TTTGCCGCCGTCGACCTCACCGGCGAGGTAGTGGACGAGGTGATCAGTCGGGGCAAGCACCTGTTCATCC
+GAACCGGGACAGCCAGCATTCATTCGCATCTGCAGATGGACGGCAGCTGGCGGGTCGGCAACCGGCCGGT
+GCGGGTGGATCATCGGGCGCGAATCATTTTGGAAGCCAACCAGCAAGAACAGGCCATCCGGGTGGTCGGC
+GTCGACCTAGGCCTGTTGGAGGTCATCGACCGGCACAACGACGGCGCCGTCGTCGCACACCTAGGACCTG
+ATCTGCTGGCCGACGATTGGGACCCGCAGCGTGCAGCCGCCAACCTGATCGTTGCCCCGGACCGGCCCAT
+CGCCGAGGCACTGCTCGACCAGCGGGTGCTCGCCGGGATCGGCAACGTGTATTGCAACGAACTGTGCTTC
+GTCAGCGGAGTATTGCCGACGGCCCCGGTGAGCGCGGTCGCCGACCCGCGCCGCCTGGTCACCCGCGCCC
+GAGACATGCTGTGGGTCAACCGCTTCCGCTGGAATCGGTGCACCACTGGCGATACCCGGGCCGGCCGGCG
+ACTGTGGGTCTACGGGCGGGCCGGGCAGGGTTGCCGCCGCTGCGGCACGCTCATCGCCTACGACACTACC
+GACGAGCGGGTGCGGTATTGGTGCCCGGCCTGCCAGCGCTGAACCGGGCGATCAAAGCCAGCACCTAGTC
+GCGGCCGTGGGTAGCGAAGAACTGGGCAATGACTTGCGACCCGTCGAACGCGCGCGTGGTCGCCCCGATG
+ACCGCCTTGGGCAGATATTGCCTGCCACCCGGCCAGGTATGTCCGCCATTGTCGATCTGGTAGGAGATCA
+CCTCGGTGCCGGCCGCACATGAGCTGGAATCGAAAAGGTGCACCATTGTTCCGTCCCCGACGTCAGGCAG
+CTCCGCCGCCGACGGATCGCCCTGACACCCATCGACCGCCCGCCAGCGATCCACCAAGCTCGCAACCGAG
+ATGGAATGGCTGAGCCCGCCGCGACCACGCACCGCCCCGCCGTTGAACGGCACCAGCGGGTCGGCGGTGC
+CGTGTGCTTCGAGCACCGACACCGGCCGCGACGGATTACATGTCACACCCACACCCAGCGTGCCCGCCAC
+CGGCGCGACCGCGGCGAAGATATCGGCACGGTCACACGCCAGCCGGTTGGACATGAAGCCACCGTTGGAC
+ATGCCGGTGGCGAAGACGTGCCCGGGAGCGATGTCGAAGTCGTGCACCAGCTTTGCGGCCAGCGCGACCA
+AGAACCCAACGTCGTCGAGATGACGGCGATCCGCCGGCGACGCCCCCCTCCCGTCGGCCCAGCTTTTGTC
+GTAGCCGTCAGGATAGACAACCAACAAGTCGGCGGCGTCGGCAACAGCGTCGAAATCGGTGAGAGCCTCC
+TGTCCGGCTCCGGTGCCGCCACCACCGTGCAGGCTGATCACCAACCCGGAGGGCTCAGCGGGCGGCACGT
+GCAAGCGATAACTGCGGGTCAAGCCCCCGAACTGGAACGTCGCTACCGAACTGGCATGCCTGGCCAGTAG
+CTGATCACCGCCACACCCGGCCAGGCAAACCATGAGAACGATAAGCGACAGCATTCGCGCCCACGGCATC
+TCGTCAAGGTACCGATCGCGAGCGCTCAGCCCGCGGCGCCCTGTCCCACCGCTTGGACCGATGCGTGCTC
+GTGCAACGCCCTGGCGGCTTCGGGATGTACGGGCTTGAGGTCGAAGATGACCTCGGTGACGGTCCCGGTG
+AACGCATAGGGCGCCTTGTCCTCATAGCCGCGGTCAACGACCAGGCCGTTGTCGCGGCCGATGTCCATGC
+CGGCATAGGAGGTAAAGGCCAGCGGCACCGTCTGGGGCAGCTCACCCTCTCCGATCAACCGATCGTCGGC
+CCAGAGCGTCACCCGACCACCGGAGGCGGCGACGGGTTGATGGGAATCGAACAGCATCCGCACCGTGACA
+TCCCCGGTGGGGAGCGGCTCGCTGGACACCTGCCGGTAGGTTTCGACGCCCAGGAAGGAGTAGGTGTGGT
+GCAGGTGCCGCTGTTCGTCGACCCATAGCGCGAACCCTCCCATGAAGTCGGCGTTGGCGACGATCACACC
+CTGCGCGCCGCCGTCGGGGATGTGCAGCCGTGCCTCGATCGCGTAAGAACGACCGCAGATACGGGGGACC
+ATGCCGCGCTGAATGTTCTGCACGTCACCTTTGAAACTGAACCGTGCGGTGGTGGGCAGGGGCGGCAGGT
+CGCCGAACATTACCGCGAGCCCGCCCAGCAGCGGCAGCACCCGGTTTCGTTCGGCCTCCTGCCACCACAG
+CTGGGTGAGCTCGGCGACCTTGTCGGGATGCTCGGCTGCCAGGTTTTTCGCCTGGGAGAAGTCATCTGGT
+AGGTAGTACAGCTCCCAGACGTCCTGGTCCGGGTCGTAGGTCCCCGGCGCGAACCGTCGCATCGTCTCCG
+GTGACAGATCCCAGGGCGCCTTGTCCAAGCGAGCGCACGCCCACCAGCCGTCTTTGTAGATGGCACGGCT
+GCCGAAGTTTTCGAAGTACTGCACGGTGTGGCGGTCTTCGGCTTCAGCGTCGTCGAAGGTCCGCACGAAA
+CTGGTTCCGTCCATCGGTTCCTGCTCGAAGCCGTCGACATGGGTCGGCTCCGGTAAACCGATGGCCGCCA
+ACACGGTCGGCGCGATGTCGATGCAGTGGGTGAACTGGCTACGAACACGGCCGTCTGGCCGGATCCGGGC
+CGGCCAAGCGACCACCAATGGATCGCGCGTGCCGCCCAGGTGGCTGGCCATCTGCTTGCCCCACTGCAAC
+GGGGTGTTGCTCGCATGCGCCCACGCGCTGGCGAAATGCGGTGCGGTGAACTCGTCGCCGAGTGCGGCGA
+TGCCGCCGTATTGTTCGATCAGCTCCAATTGCCGCTCGGCATCCAGATCCAGGCCGTTAAGGAACGTCAT
+CTCATTGAACGAACCGGTGTTGGTGCCCTCCATGCTGGCGCCATTGTCGCCCCAGATGTAGAACACCAAC
+GTGTTGTCGGACTCGCCGAGATCCTCGATCGCGTCCAGCAGCCGGCCAACATTCCAGTCCGCATTTTCCG
+AGAACCCGGCGAACACCTCCATCTGGCGGGCAAAGAGCCGTTTTTGCGCCTCCGACATACTGTCCCACGC
+GGGGAATAGGTCGGGCCGCTCGGTGAGTTCGGCGTCGGGTGGAATGATCCCGAGTCGCTTTTGCCGTTCG
+AATGTCTTCTGCCGGTACACATCCCAGCCATCATCGAACTCACCTCGGTACTTGTCGGCCCATTCCTTGA
+ATACGTGGTGTGGCGCGTGGGTGGCGCCGGTCGCGTAGTACAGCATCCACGGCTTGGTGGCATTCTGGGC
+CCGCACGGTGTGCAGCCACTCGATAGCCTTGTCGGTGAGGTCGTCGGGGAAATAGTAGGGACGGCCGTCT
+TCCCCAGAACCCTCGGGTATGCCTATGACGGAGTTGTCCTGACTGATGATCGGGTCGTACTGACCCGCGG
+CGCCGCTCGGGAAGCCCCAGAAATGGTCGAATCCCCAACCCAGCGGCCAGTTGTCGAACGGCCCCGCGGC
+TCCCTGGACATTGTCCGGGGTCAGATGCCACTTGCCGAAAGCGCCAGTCACATAACCGTTGTCGCGCAGA
+ATACGCGGCAGCGCTGCGCAACTGCGTGGCCTGACCGCCGAATACCCCGGGTACGGGCCGGGGAACTCGC
+AGACCGACCCGAAGCCCACCCGGTGATGGTTACGCCCGGTCAACAGCGCCGCACGGGTCGGCGAGCACAC
+CGCGGTCACATGAAAACGGTTGTAGATCAACCCATTCTGGGCTAGCCGGGACAGCGTCGGGGTTCGGATC
+GCGCCGCCGAATGTATCCGGTCCGCCGAACCCAGCGTCATCGATCAACACGATCAGCACATTCGGTGCGT
+CGTCGGGCGGAAAGGGACTGGGGACAATCGACCAGTCGCCGACCGACTCTGCCATGGTGCGGCCAACCAC
+GCCACCAAAGCGGCGCTGCGGTAGCGGCAGCCGGGTGCGGTCTGGGTTGAACTTGCCCATCGCCTCTCGC
+AACGCCGCACCCAGGCTTCGCAACGTCGAACGACTCAGCTCCGCAACCGATTTCATTGGAGAGCTAGCCA
+ACGCCTGCCCCGCTTCCAGTCGGCCTTGTGCCTCCGTCACGGCGATGACCACTGCTCGGCCCGCCGCCAG
+CGCTTGGCCGATCTTGTCGGCCAGCCCGGTCTTGATCCGATGGTGGGCGAAGGTGCCGGCCAATGCTCCG
+GTCGCGGCGCCGAGCGCCGCCGAGGCCAACAGTGCCGGCGAGAACAGGCCGATCGCCAGGCCCACCCCGG
+CGCCCCACGCGGCGCCGCGCCGGCCGAGCCGATTTCCGGTGTCGACCAAAACCGGACTGCCCTCGGCGTC
+CTTGCCGATCAGCACCGCACCCTGCAGCGGAATGCTTTTGTCCTTGGCGGCATCGACGAGGGTTTGAAAA
+TCGTGACGAGCCGAATCGAGGTCCTGATAGCCGGCGACGAGCACCAGCGCGTTGTCTTCACTCATCACGA
+AACTCCCGATATGTGTGTCACGGCCGGCAATCGGCCGCGGCTGACCATGTTGGCAACGTAGCACCGGTCA
+ACGTGCGCGTGCTGGCGAACTCGCGGTGCGACCCGGTCAGCGGATCGTCGAACTCGATGCGCTGCGCGAG
+CAACTGCAGCGGTGTGCTGAAGTCGTGGGCGGCCACGGATATCACGTTGGGGTACAACGGGTCACCCATG
+ATCGGTATCCCCAGCGCCGCCATGTGCACTCGCAGCTGGTGGGTGCGCCCGGTGGTCGGTGTCAGCCGAT
+ACAGACCGTCGCGCGCTATCCGCTCCACCAGCGTCTCCGCGTTGGGAACGCCGGGCTCACAGACCGCCTG
+CAGATGGCCCCGGCGCTTGACGATGCGACTGCGGACCAGGCGCGGCAGGGCCAGACCCGGGGCAACGGGT
+GCGCGAGCCAGATAGGTCTTGCGCACCAAACCGCGGGCGAACATCGTCTGGTAGCTGCCGCGCACCTCGC
+GTCGGGTGGTGAACAACAACACCCCGGCGGTCAGCCGGTCCAGCCGGTGGGCCGGGCTCAGCTCGGGCAA
+TCCCAGTTCGCGACGCAGCCGCACCAGCGCGGTCTGCGCGACGTGTCGCCCCCGAGGCATGGTCGCCAAG
+AAATGTGGCTTGTCGACGACGACGATGTCGGCGTCTTGATGCAGCACTGGGACATCGAAGGGCACCGGCA
+CCTCGTCGGGCAGGTCGCGATACAGGTGCACAACCGAACCGGGCGGCAGCACCGTGCCACTGTCGACCAC
+CGCACCGTCGTTGTCGACCACCTCCCCGGCCAGCACCTTCGCACGGGCCGCCACGCCAAACCGTGCGGTC
+AGCTCGGCTAACACCGACCCGCCAAGCAGTCGCACCCGCACCGGCCCCAGCACGTCGTGCACGCTAAGCA
+AACGATCCTCTGGCCGCAACGCCACACGAGACCCTCTCAGTAAGTGGAAATCTCGTCCTCGGTCGGTAGC
+ACCCCGGTGACCATGAAGATGACGCGGCGGCCCACTTCCACAGCGTGGTCGGCGAAGCGCTCAAAGAAAC
+GACCCAGCAACGCCGTTTCCACACCGACGCGAACGCCGTGCCGCCATTCTCGATCTATCAGCACGCTCAG
+CAAATGCCTATGCAGGTCATCCATCGCGTCGTCACGATCGTGCAGTTGCGCGGCTTCCTGCGGGTCACGG
+TTCACCAGCACTTGTCTTGCACTGTCACCCAACGCGATTGCCACCTTCGCCATGTCGGCGAAGCAGTTGC
+GAACTTCCTCAGGAAGCACCTGGTTCGGATACTCGCGTCGGGTGATCTTGGCAATATGCACAGCCAACGC
+ACCCATGCGCTCGGTGTCGGCGATGATCTGCACCGCACTGAAGATTTCCCGCAGCTCGCCGGCCACCGGA
+TGTTGCAACGCCAGCAGCGCGAACGCTTCCTTTTCGACTTGGGCTCGCATCGCCACGATCCGCTCATGGT
+CACGGATTACTTGTTCAGCGGCGCCAATGTCGGCCTCGAGCAGAGCCTGCGTTGCGCGTTTCATCGCTAT
+CCCGGCCAGGCTGCACATCTCTCCCAATCGTCCGGCCAACTCGGTTAGCCGCTGGTGATAGACCGTCCGC
+ATGGTGTCACGCCTCTCTGACCCTGAGTCGTCGTGTGGTGCTGCCGCGGATCCACACCGCCATCATCGAC
+CATGGCGGCACCGCGCGACATACCCGCTTGGCGTAGCCTTCAATCCAAAGGCACCGGCTCGAGGATCTCG
+GCACGCGCCTCGGGTGCGCTGGCCCGCAACATGTCCGCCGAAACGTCGTCGGGCTGGGCCTGGGAGAGCA
+CCTCGGCCTCCACGCGCGCCATATAGTTCGCGACCTCGCGGTCGATGTCTGCGGCGGTCCACCCGAGCAC
+GGGCGCGACCACCTCGGCCACCTCCCGGGCGCAGTCGACGCCCCGGTGCGGGTATTCGATGGAAATCCGC
+ATCCGACGGGCCAGGATGTCCTCGAGATGCAGGGCGCCCTCGGCGGCGGCGGCGTAAGCGGCTTCCACCT
+TCAAATAGCCCGGTGCCTCCGTTATCGGGCTCAACAGGCTGGGATCGGAGGCCGCCATCGCTAGAACGTC
+GCTGATCAGCGAACCATAGCGGTCCAGCAGATGGCGCACCCGGTACGGGTGCAGGCCCTGCAGCGCGCCG
+ACGTGTTCGGCCTGATTGACCAGTGCAAAGTAACCGTCGGCGCCCAGCAGGCTGACCTTCTCGGTGATCG
+ACGGCGCAACGCGGGCGGGGATGAACTGCACAGCAGCGTCGATCGCGTCGGCCGCCATTACTCGGTAGGT
+GGTGTACTTGCCACCGGCGATGGCCACCAGGCCCGCCGCCGGCACAGCCACGGCGTGTTCCCGGGACAGC
+TTGGAGGTGTCGTCGCTTTCCCCGGCAAGCAGCGGCCGCAGCCCGGCGTACACTCCGTCAATGTCGGCGT
+GCGTCAACGGGGTCGCCAACACGGCGTTGACAGTGCCCAGGATGTAGTCGATGTCGGCCTTGGTGGCCGC
+GGGGTGCGCCAGGTCGAGGTTCCAGTCGGTATCGGTGGTTCCGATGATCCAGTGACTTCCCCACGGAATG
+ACAAACATCACCGACTTCTCCGTGCGCAGGATCATCGCGACGTCACTGACAATCCGGTCCCGCGGCACCA
+CCACATGCACGCCCTTGGATGCGCGCACCTGGAAGCGCCCGCGCTGTTTGGACAACGCTTGAATCTCATC
+GGTCCAGACCCCGGTCGCGTTGACCACGACGTGGCCGCGAACCTCGGCAACCGCGCCGTTCTCGGAGTCG
+CGGACGCCCACGCCGATCACCCGGTCACCCTCTCGCAACAAGGCCACTACCTGGGTGGAGCAGCGGACAA
+CCGCGCCGTAATGCGCCGCGGTGCGCGCGACCGTCATGGTGTGCCGGGCGTCGTCGACGACGGTGTCGTA
+GTAACGGATACCACCGATCAGCGAGCTGCGCTTCAAGCCGGGGCTCAGTCGCAGCGCACCGGCGCGAGTA
+AAATGCCGTTGCGCCGGAACCGATTTCGCGCCACCCAGCCGGTCGTAAAGAAAGATACCCGCGGCGATGT
+AGGGACGCTCCCACCAGCGTTTGGTCAGCGGGAACAAAAACGGCAGCGGCTTGACCAAATGCGGTGCCAG
+CGTGGTCAGCGACAGTTCACGTTCATAGAGCGCCTCACGCACCAGCCCGAACTCCAGTTGCTCGAGGTAG
+CGCAGCCCGCCGTGGAACATCTTCGAGGAGCGGCTCGACGTGCCGGAGGCCAAGTCCCGCGCCTCGACCA
+ACGCCACCTTGAGCCCACGGGTGGCAGCATCCAAAGCGCATCCGGAGCCCACTACTCCGCCGCCGATCAC
+CACGACGTCGAATTGCTCGGTTCCGAGTCGCTTCCAGGCGACCGCGCGCTGTGCAGGTCCCAGCGCCGCG
+GCGGGCCACCCCTGCCCGCCGTCCGGTGCCTGGATTGGGTTGCTCACGAAACCGGCTCCTGTCAGTTACT
+CGTCGGTAGGTGGTGTGGCACCAAGGCTAGTTGTTCAGCCGCGTCTTGAGCTGCCGTTCAGTCCAGATCG
+TCGTGCGCCATCAGCCGGCGGGCCGCCTCGGTTATCGAACCCGACAACGATGGGTAAACGGCCAGTGTCT
+GGGCCAGCTCGTTGACGGTGATGCGGTTCTGAACGGCTACGGCGATGGGCAGGATCAGCTCCGATGCGAT
+CGGCGCCACCACCACGCCGCCGATCACAACGCCGGTGGACCGCCGGCAGAAGATCTTGACGAACCCGTGA
+CGCATCTCCGACATCTTGGCGCGCGCGTTGGTTCGTAACGGCAGCATGATGGTCCGGGCGGCCACCGAAC
+CGGCGTCGATGACCGATTGCGGCACCCCGACCGCGGCGATCTCGGGCCTGGTGAAAACCGTCGCGGCCAC
+CGTGCGTAACCGGATCGGGCTGACGCCCTCCCCCAGCGCGTGGTACATCGCGATGCGGCCCTGCATTGCG
+GCGACCGACGCCAGGGGCAGCAAACCCGTGCAGTCGCCCGCGGCGTAGATGCCGGTCGCCGACGTCCGCG
+ACACCCGGTCCACGGTCAGGTAATTGCCCCGGCCAAGCTGGATGCCGACCCGTTCCAGGCCCAGGCCGCT
+GGTGTTGGGCACCGACCCGATGGTCATCAGGGCGTGGCTGCCCTCGACGGTGCGACCGTCGGTCATCGTG
+ACGAGCACCCCGGCCCCGGTGCGGGTGACCGATGCTGCCCGGGCATTTTTGAACAGCCGGACTCCCCGTT
+CGGCGAACGACTCTTCCAGGACCAGCGCAGCGTCAGCGTCCTCATACGGCAGCACGTGGTCCTGGCTGGC
+CACCACCGTGACCGGCACCCCCAATTCGGTATAGGCGTCCACGAACTCAGCACCGGTAACCCCGGAGCCC
+ACCACGATGAGGTGGTCGGGCAACGCGTCCAAGTCGTAGAGCTGCCGCCAGGTCAGAATGCGCTCACCGT
+CCGGCTGGGCCGACGGCAGGATCCGCGGGCTGGCGCCGGTGGCGACCAGCACGACGTCGGCCTCATGCTC
+ACTGGTGGAGCCGTCGGCGGCGGTCGCCTTAATGCGATGGCGCGCCAGACCCGGTGTGGAGTCGATCAAC
+TCGCCCCGGCCGGCGATCACCTGAACCCCCATGCTGAGCAGCTGGGCGGTGATGTCGGCCGACTGTGCGG
+CGGCCAGCGTCTTGACCCGGGCATGGATTTGCGGCAACGAGATCTTGGCGTCGTCGAAGTCGATATGAAA
+GCCCAGGTGCGGCGCTCGGCGCAGTTCGGTACGCAGCCCGGTGGAGGCGATGAACGTCTTCGACGGCACA
+CAGTCGTCCAGTACGGCAGCCCCGCCGATGCCGTCGCAGTCAATCACGGTAACTTGGGCTGTTTCCGGGT
+GTGAGGTGGCGGCCACCAGTGCGGCCTCGTAACCGGCCGGGCCGCCACCGAGGATCACGATGCGGGTCAC
+CACAGCCCATAACCTAGCTCGGCGACGATGCACGCCGCGCAGCGGCGTGAGGAGGAGCCGAGCAGTCCAA
+CACAGCTCGGCGACGATGCACGCCGCGCAGCGGCGTGAGGAGGAGCCGAGCAGTCAAGCACAGCTTGACG
+ATGACCCGCACCGCAGCGCGGCGCGATGGGTACCACCCGAGCCCCCGCCGTCTAAGCTTTCCCCCGTGCC
+GCTCTACGCCGCCTACGGGTCGAACATGCATCCCGAGCAGATGCTCGAGCGCGCACCCCACTCGCCGATG
+GCCGGAACCGGCTGGTTACCCGGGTGGCGGCTGACGTTCGGCGGCGAGGACATCGGCTGGGAAGGGGCGC
+TTGCCACCGTCGTCGAAGACCCAGATTCGAAGGTGTTCGTCGTGCTCTACGACATGACCCCGGCGGACGA
+GAAGAACCTTGACCGGTGGGAAGGCTCCGAGTTCGGCATCCACCAGAAGATCCGATGCCGCGTGGAGCGC
+ATTTCCTCGGACACCACAACGGATCCCGTCCTCGCGTGGTTGTACGTTTTGGACGCCTGGGAGGGTGGCC
+TGCCGTCGGCCCGCTATCTAGGTGTGATGGCCGATGCCGCTGAGATCGCGGGCGCGCCAAGTGATTACGT
+ACATGACTTGCGTACTCGCCCGGCCCGCAACATCGGCCCGGGAACTATTGCCTAATTATCGCGAGCGCCC
+AGGCTAATGCGCGGCGGCCTGCTCGATGATGTTGACCATCACCCGCAGCCCGATCGCCAGGGCTCGCTCG
+TCGATGTCGAACGTCGGCTGATGCAGGTCCAACTGCAGTCCGTCACCGGACCACACGCCCAGTCGAGCCA
+TCGCGCCGGGAACCTCCTCCAAATACCAGGAGAAGTCCTCACCACCGCCGGACTGCCGGGTATCGGCCAG
+CACACCTGGGCCAATAGCCTCAATAGCGTGGGCGAGAATGCGTGTCGAGATTTCCTCGTTGACCACCGGC
+GGCACCCCCCGACGGTATTGCAGCGTGTGCTCGATCGCCAACGGTAATAGCAACGCCGAAATGGCTTGGC
+GGACAAGCTCCTCAAGGTCAACCCAGGTCTGCCGGCTGGCCGTGCGAACAGTGCCGGACAGAACTCCGGT
+TTGCGGAATGGCGTTGGCGGCCATACCCGCGTTGACCGCGCCCCACACCAGCACGGTGCTGTTACGTGGG
+TCGATGCGACGCGACAGCACCCCGGGCAGCCCGGTGACCAGCGTGCCGAGCCCGTAGACGAGGTCGGCGG
+TCAAGTGTGGACGCGACGTGTGCCCGCCCGGCGAATACAGCGTGATTTCTATCGAGTCGGCCGCCGACGT
+GATGGGGCCTTGCCGAACGGCGACCTTGCCGACTTCAAGCCGGGGATCGCAGTGCAGGGCGAAGATCCGC
+GACACCCCGGCCAACGCGCCGGCCGCGATCGCGTCGATGGCACCACCGGGCATCAGTTCCTCGGCCGCCT
+GGAAGATCAACCGCACCCCCACCGGCAGCTCCGGTACCGAAGCCAATGCCAATGCGGCACCCAGCAGGAT
+CGCGGTGTGCGCATCATGGCCACAAGCATGCGCGACGTTGGGCATGGTCGAGGCGTAGGGCGCGCCGGTC
+CGCTCGGCCATCGGCAGCGCATCCATATCGGCGCGCAGCGCGATCCGCGGCTGATGCTGAGGACCGAAGT
+CGCAGGTGAGTCCCGTTCCACCGGGCAGCACCTTGGGGTTCAGCCCCGCGTCGGCTAACCGCTCGGCGAC
+GAACTGGGTAGTGGCGTATTCCTGACGGCCCAACTCCGGATAGCGGTGGATGTGCCGGCGCCAGCCGACC
+AGGTCGTCGTGGTGGGCGGCTAGCCATGATTCGGCGGCGTCGGCGAGGCTCATCGCGCCGCCCTGCGCTG
+CTGCGCGGCCAGCACCCGGTCACGCTCATCAGGAGTCTGCGCGAGACGGACAACCGTGCGTGCCAACATG
+ATCGCGCCGTCAACCACCGCGCGGTCGGCGCTGGCACCAGCGGAAGCGACGGTGAAGGCCCGTTGGTGCA
+CCGTCGCCGCGCCGGCGTCCAGGCCGATCACCGGATGGATCCCGGGCAGCACCTGCGTCACGTTGCCCAT
+GTCGGTGCTACCCAGCGGCAGCTCTGCCTCCAAGGCTGGCAGCAACGGCTCGCGCCCCAGCCGCTGCATC
+TCCTCCCGGCACACGTCAGCCAGCCACGGGTCGGGTTTGAGCTCCGCGTATGCCGGTGCAGCCTCGTCGA
+TTTCGTATTCGCACCCGGCGGCCAGCGCGCCGGCCGCAAAGCAGGCGAACATTCTGGTCTGCAGCTCGCG
+CAGCGAATCCGATTCGACCGCACGCATCGCATACTGCAGCCTCGCCTGCCCGGGGATGACATTGACCGCC
+TGCCCGCCGTCGGTCACAATGCCGTGCACCATTTGCCCGGGCGCCAATTGCTGTCGAAGTACCCCAATAG
+CGACCTGCGCCACGGTCACGGCGTCGGCGGCGTTAACCCCTAGGTGCGGCGCGACGGCCGCGTGCGATTC
+CTTACCCCGATAGCGCACGGTGACCTCGGACAGGGCCAGTGATCGTGCGCCGGCGATATCGGTCGGCCCG
+GGATGGACCATCACGGCCACCGCAACGTCATCGAACGTCCCGGCCTGCAGCATCAGCGCCTTACCGCCGC
+CGGACTCCTCGGCAGGGGTCCCCAGCAGAGCCACGGTCAAGCCCAGGTCGTCCGCCACCTCAGCCAGTGC
+CAGCGCGGTGCCCACCGCGGAGGCCGCAATAATGTTGTGCCCGCAGGCGTGTCCGATCCCGGGAAGCGCG
+TCGTACTCGGCGCACACTCCGACAACCAACGGTCCGCTGCCGTAGTCGGCGCGAAACGCCGTGTCCAACC
+CACCGGCGGCCGTGGTGATCTCGAAACCGCGTTCGGCGACCAGCGCCTGAGCCTTGGCGCAGCTGCGATG
+CTCGGCGAACGCCAGCTCGGGCTCGGCGTGGATGGCATGGGACAGCTCGACCAGCTCGCCACCACGGCGC
+CGCACCAATTCCTCGACGCGGTCGGATGCGCTGGCTGCTGGCATGCTCGCAGTATCTCATCGACGAGCAC
+CCGCTCCCCGGCGAGCGGCTCAGTTAAGCTCGCCCAGTGTGGCTGACCCGCGCCCCGATCCCGACGAACT
+GGCCCGGCGGGCGGCGCAGGTCATCGCTGACCGCACCGGGATCGGCGAACATGACGTCGCGGTCGTGCTC
+GGGTCGGGATGGTTACCGGCCGTTGCGGCGTTGGGCTCCCCGACCACCGTGCTGCCGCAGGCCGAACTGC
+CCGGGTTTGTGCCGCCAACCGCAGCCGGGCATGCGGGCGAGCTACTGTCCGTGCCCATCGGTGCGCACCG
+GGTGCTGGTGCTGGCCGGTCGCATCCACGCCTACGAGGGACACGACCTGCGCTACGTCGTGCATCCGGTT
+CGGGCGGCCCGTGCGGCAGGGGCGCAGATTATGGTGCTCACCAACGCCGCCGGTGGGCTGCGGGCGGACC
+TTCAGGTCGGCCAGCCGGTGCTGATCAGCGATCACCTGAACCTGACCGCACGTTCGCCACTGGTTGGCGG
+GGAGTTCGTCGACCTGACCGACGCCTACTCACCGCGACTGCGGGAACTCGCCCGCCAATCCGACCCGCAG
+CTGGCCGAAGGCGTCTACGCCGGCCTGCCGGGGCCGCACTACGAGACACCGGCGGAGATCCGGATGTTGC
+AGACACTGGGCGCCGACCTGGTCGGCATGTCCACGGTGCACGAGACCATCGCGGCCCGGGCGGCGGGCGC
+TGAGGTACTGGGCGTATCCCTGGTGACAAATCTGGCGGCCGGGATCACCGGCGAGCCGCTGAGCCACGCC
+GAGGTGCTCGCCGCCGGAGCCGCATCGGCGACTCGGATGGGCGCGCTGCTAGCCGACGTGATCGCCCGGT
+TCTAAGCCGTGACGCCAGAGAATTGGATCGCCCACGACCCGGACCCGCAGACGGCCGCCGAGCTCGCCGC
+CTGCGGCCCCGACGAGCTGAAAGCGCGGTTCAGCCGCCCACTGGCGTTCGGCACCGCGGGGTTGCGCGGG
+CACCTGCGGGGCGGGCCGGACGCGATGAACCTGGCGGTGGTGTTGCGCGCCACCTGGGCGGTGGCACGGG
+TGCTCACGGATCGAGGTCTGGCTGGTTCGCCGGTGATCGTGGGGCGCGACGCTCGGCACGGCTCACCGGC
+GTTTGCCGCTGCGGCCGCCGAAGTGCTTGCCGCCGCAGGTTTTTCCGTGCTGCTTCTGCCCGATCCCGCA
+CCCACCCCGGTGGTGGCGTTCGCGGTGCGGCACACCGGCGCCGCCGCTGGGATACAGATCACGGCGTCAC
+ACAACCCGGCGACCGACAACGGCTACAAGGTCTATGTCGACGGCGGCCTTCAGCTCCTCGCCCCTACCGA
+CCGGCAGATCGAAGCCGCGATGGCCACCGCGCCCCCGGCCGATCAGATCGCCAGGAAGACCGTCAACCCC
+AGTGAAAACCGCGCCTCCGATCTGATCGACCGTTATATCCAGCGTGCGGCCGGGGTCCGAAGGTGCGCCG
+GTTCGGTCCGGGTGGCCCTGACGCCGCTGCACGGGGTTGGCGGGGCGATGGCCGTCGAGACCCTTCGGCG
+AGCCGGTTTCACCGAGGTGCATACCGTGGCGACGCAATTCGCGCCGAATCCCGACTTCCCCACCGTGACA
+TTGCCGAACCCCGAGGAGCCCGGAGCCACCGACGCACTGCTCACCCTGGCTACCGACGTGGACGCCGACG
+TCGCGATCGCGCTGGATCCCGATGCGGATCGCTGCGCGGTCGGGATACCCACGGTGTCGGGATGGCGGAT
+GCTGTCCGGTGACGAAACCGGTTGGCTACTAGGTGATTACATCTTGTCGCAAACCGACGACCGGGCGTCG
+CCGCCGGAAACCAGGGTGGTGGCCAGCACCGTGGTGTCGTCGCGGATGCTGGCGGCGATCGCCGCGCATC
+ACGCTGCCGTGCACGTGGAGACCCTCACCGGCTTTAAGTGGCTGGCGCGCGCCGATGCGAACCTGCCCGG
+CACCCTGGTGTACGCCTACGAGGAAGCGATCGGGCACTGCGTCGACCCCACCGCGGTGCGTGACAAAGAC
+GGCATCAGCGCCGCGGTGTTGGTGTGCGATCTGGTGGCCGCGCTCAAAGGCCAGGGTCGTTCGGTGACCG
+ACGCGCTCGACGAGCTCGCCCGATGCTACGGCGTGCATGAGGTTGCCGCCCTGTCACGCCCCGTGGGCGG
+CGCCGTCGAGACCACCGACCTGATGCGACGGCTCCGCGAGGACCCGCCGCGTCGGCTGGCCGGTTTCCCC
+GCCACGGTCACCGATATCGGCGACACGCTGATCCTCACCGGCGGCGACGACAACATGTTGGTCAGGGTGG
+CGGTGCGGCCTTCTGGAACAGAACCGAAGCTGAAGTGCTACTTGGAGATTCGCTGCGCGGTGACCGGTGA
+CCTACCAGCTGCCCGACAGCTGGTGCGGGCGAGGATCGATGAGCTGTCGGCTAGCGTGCGGCGGTGGTGG
+TGACTCAGCGCGGGCCGAACTGGCGATCGCCGGCATCGCCGAGACCGGGCACAATGTAGGCGACCTCGTT
+AAGCCCTTCGTCGATGGCCGCAGTGAACAACCGCACGTTTGGCGCAGCCTTCTGCAGCGCCGCGATTCCT
+TCTGGCGCCGCAACCACACACAGCACCGTGATATCCGCTGCACCGCGCGAGATCAGCAGACCGAGGGTGT
+GCGTCATCGACCCGCCGGTGGCCACCATCGGGTCAAGCACCATGACCGGTACATCCGTCAGGTCGTCGGG
+CAGCGAGTCCAGATACGGCACCGGCTGGTGGGTTTGCTCGTCGCGGGCGACACCGACAAAGCCAACGTGC
+GCCTCCGGCAAGGCGGCATGCGCCTCGTCGACCATCCCCAACCCCGCCCGCAACACAGGAACCAGCAGGG
+GTGGCTTGGTTAGCCGCGACCCGACCGTCTCGGCCAGCGGCGTACGGATCGGGACTGGCTCGCAGGGCGC
+ATCGCGGGTGGCCTCATAGATCAACAGCAGCGTGAGCTCGCGCAGCGCTGCCCGGAAGCCGGCGTTGTCG
+GTGCGTTCGTCACGCAGCGTGGTCAGTCGGGCCGCGGCCAGTGGGTGGTCAACGACATGGACCTGCACGG
+CGTTGAACCCTATATAACAATCGTGGCTCGGTCCCCTAAAAGGGGGCTGATACGGGTGCGTCCATCCGCG
+CGACCGGTCAACCCCGTCCATATACTCCCGGCATGCTCCGCGGAATCCAGGCTCTCAGCCGGCCCCTGAC
+CAGGGTATACCGTGCCTTGGCGGTGATCGGTGTCCTGGCAGCATCGTTGCTGGCCTCATGGGTCGGCGCT
+GTCCCACAAGTGGGTCTGGCAGCGAGTGCCCTGCCGACCTTCGCGCACGTGGTCATCGTGGTGGAGGAGA
+ACCGCTCGCAGGCCGCCATCATCGGTAACAAGTCGGCTCCCTTCATCAATTCGCTGGCCGCCAACGGCGC
+GATGATGGCCCAGGCGTTCGCCGAAACACACCCGAGCGAACCGAACTACCTGGCACTGTTCGCTGGCAAC
+ACATTCGGGTTGACGAAGAACACCTGCCCCGTCAACGGCGGCGCGCTGCCCAACCTGGGTTCTGAGTTGC
+TCAGCGCCGGTTACACATTCATGGGGTTCGCCGAAGACTTGCCTGCGGTCGGCTCCACGGTGTGCAGTGC
+GGGCAAATACGCACGCAAACACGTGCCGTGGGTCAACTTCAGTAACGTGCCGGCGACACTGTCGGTGCCG
+TTTTCGGCATTTCCGAAGCCGCAGAATTACCCCGGCCTGCCGACGGTGTCGTTTGTCATCCCTAACGCCG
+ACAACGACATGCACGACGGCTCGATCGCCCAAGGCGACGCCTGGCTGAACCGCCACCTGTCGGCATATGC
+CAACTGGGCCAAGACAAACAACAGCCTGCTCGTTGTGACCTGGGACGAAGACGACGGCAGCAGCCGCAAT
+CAGATCCCGACGGTGTTCTACGGCGCGCACGTGCGGCCCGGAACTTACAACGAGACCATCAGCCACTACA
+ACGTGCTGTCCACATTGGAGCAGATCTACGGACTGCCCAAGACGGGTTATGCGACCAATGCTCCGCCAAT
+AACCGATATTTGGGGCGACTAGCCGCCGTCGCTATTCTGTGCCGCATGGTTGCTGACCTCGTACCCATCC
+GCTTGAGCCTGTCCGCTGGTGACCGCTACACGCTGTGGGCTCCTCGCTGGCGGGATGCCGGCGACGAGTG
+GGAGGCGTTCCTGGGCAAAGACGACGACCTGTATGGCTTCGAGAGCGTCTCTGACCTGGTCGCGTTCGTG
+CGCACCGACACCGAGAACGACCTGGTCGACCACCCGGCATGGCAAGACCTGACCGGAGCCCACGCGCACA
+ACCTCAATCCGGCCGAAGACAATCAGTTCGACCTGGTCGTCGTCGAGGAACTGCTGGCTGAGAAGCCGAC
+GGCGGAGTCAGTGGCCGCGCTGGCCGCCTCATTGGCGATCGTATCCGCCATCGGATCGGTGTGCGAACTG
+GCGGCAGTGTCGAAGTTCTTCAACGGCAATCCCATCCTGGGCACGGTTTCCGGCGGGCTCGAACACTTCA
+CCGGAAAAGCCGGCAATAAACGCTGGAATTCGATTGCCGAGGTCATCGGACGCAGCTGGGACGACGTGCT
+CGCGGCCATCGACGAGATCATCAGCACCCCCGAGGTCGACGCTGAGCTGTCGGAAAAGGTCGCCGAGGAG
+TTGGCGGAGGAGCCCGAGGGCGCCGAGGAAGTGGCGGCGGAGGTGGAGGCCACGCAGGACACGCAGGAGG
+CGGCCGAGTCCGACGACGAGGAAGCCGACGCACCCGGTGACAGTGTCGTACTGGGCGGCGATCGGGACTT
+CTGGTTGCAGGTGGGCATCGACCCGATCCAGATCATGACGGGCACCGCCACCTTCTACACGCTTCGCTGT
+TACCTGGATGATCGACCGATCTTCCTGGGCCGCAATGGTCGGATCAGTGTGTTTGGCTCCGAGCGGGCAT
+TGGCCCGCTATCTTGCCGATGAGCACGACCACGACTTGTCGGACCTGAGCACCTACGACGACATCCGCAC
+GGCCGCCACCGACGGCTCGCTGGCGGTTGCCGTTACCGACGACAACGTCTATGTGCTCAGTGGGCTGGTC
+GACGATTTTGCCGACGGGCCGGACGCGGTGGACCGTGAGCAGCTCGACCTGGCCGTCGAGCTGCTCCGCG
+ATATCGGCGACTACTCCGAGGACAGCGCAGTCGACAAGGCACTCGAGACAACCCGCCCGCTGGGCCAGCT
+GGTGGCCTATGTGTTGGACCCCCACTCGGTCGGCAAACCCACGGCCCCGTATGCGGCGGCTGTCCGTGAA
+TGGGAGAAATTGGAAAGGTTCGTGGAGTCGCGGCTCAGGCGCGAATAGGCACCGTCAGCCGGCGAAGGCT
+AGCCGCCGCGGCGCTTGCCGATGTCCAGGGCACACGCGGCGAGGATCGCATCCCAGTCTTCGATGTTGAA
+ATGGCCCTTGCCGTGCGCCCAGTGCAAATCAACGTGCGGAATCGCGCGCTGCAGGTATTCGCCCATGGCG
+CGTGGCACGAAGGAGTCACGATCACCCAGCCAGATATGGGTAGGCACGGCCACCTCGGCGAGGTCGAAAC
+CCCACGGCCGAAATTGCAGAAATGATTCATAGGCTGCGCCGCGGCTGCCCTGTCGGAACGCTTCGAGCTG
+GATGGCGCGCAGGTGGCGGCCGAAGCGTTCGTCGCTCAGCAGGTGCTTGTCGGCCGCGGGGACCGCAGCC
+GCCAACAACGTAGAAAACAGCCCGGGCGTGTATTTCGCGCACCAGCCGAGCGGGGCAAACAACGCACCGA
+ATAGCCGCGGCCCGCTTCGCGCCAACCGCGCGTAGCACCGATCGGCCGCGTTGAGGCTGCGCATGATATC
+CGGCGTCGCCAGTGGACCCCATGGTCCGAGCGCGCCGACGAACGCTAGTCGGGTCCGCGGGATGACGGCA
+CCGCAGGCGAATAGGTGCGGTCCCGCGCCCGAATGCCCGACCACCCCGAACTCCTCCAGCTCGAACGCGT
+CAGCCAGGGCACACACGTCCGCGGGCCAATCGCGAAAATTGCGTCCCGCTTGAAAGGTGGAGCGCCCGTA
+CCCGGGCCGATCAATCGCTATCAGTCGGAAGCCGGTGCGCCGCGCGGCACCATCGGCGAAGGCCCCCTCG
+AGCCGCGAACTTGGCGTGCCGTGGAAGTAGAACGCTGGGTAGCCGGTGCTATCACCCCATTCCAGGTAGG
+CAAGCGCCCGCCCGTCGGGCAGCATGAGCACATCCGCCTCGTCGGTGCGAATGCGCTCGGGCAGCGATGG
+CGGTGGCCCGGTCAAGAGCACACCAGCGATGGTATGCCGGTCAGAGTCGATTCAGCGCGCGTGCCATGCA
+CGAGTCCTCGAGGAACCGATAGCGCCTAGGCTGGGACTGCCGCAACCACAGCCGATCCAGCGCCGAACGC
+ACGATCCGGCGAACGGGTGTGCGGGTAACAGCCTTGTCGATGTCGATGGTGGAGGCGCTGTCGCCGTTCA
+TGACAGGTTCCCTTCAAGCGTCCTGCAAGCGGTTGCCAAAGCCGTCGCCTATTTTCTGTCATCGGACGGC
+GCGATCCATCGGCACGGGAGCGTAAATCTGCCCCGCCGGGGGTCGTAGCTTGCCGGGGGCACGCCCGGGT
+TTATACGCGTATTCGCTGATGCGGCCCGGTCAACGAGCGCTATGCGCCGCCACCGGCAGCCGGGGGCGGC
+GGCGCAGCACCGGGATCGTCAAGCACGGGACCTTCGAGGATGGGTCCGGGGTAGTCGCGGCTGTGGTCGG
+GGCCGTCGCTGTCGCGGTGGAAGTCGTCATGGCAGGTGTAGGGATCCCAGTTGGGCCCCCATGCGGGGTC
+GAAAGGCTGCCCCGGGCACCAGTAGTAGTCGGGCACCGGCGCGGTTTGGGCTGCGGACTGCGCGCCGACC
+CCGAGACCCGCCACACCCGTGGCCAGGATGCACGCCGCCAGCATGAGCGTGCGGCACGCGAACCGGTACA
+TGCGATGACGGTACGAAAGCGATCTGGCAAGCAACTGGACGCTAGGTGCGATATACCAGAGAACTTGCTG
+ATTACTCGCTGTGACCCATGAGCGCCGCGAACCGCGGCTTGATCACTTCGTCGATTATCGCCAGCCGCTG
+GTCGAACGGAATGAACGCGGATTTCATCGCATTGACGGTGAAGCGCGCCAGGTCGCTCCAGCCATAACCG
+AAAGCCTCTACCAAACGATGCATTTCGAGGCTCATCGAGGTGTCGCTCATCAGCCGGTTGTCGGTATTGA
+CGGTCACCCGGAACCGGGCCCGAGCCAGTAGGTCGAACGGATGCTCGGCGATGCTTGCGACCGCGCCGGT
+CTGCACGTTGGAGCTGGGGCACAGCTCCAGCGGAATTCGCTTGTCCCGCAGGATAGCTGCCAGCCGACCC
+AACTGGAAACCGCCGTCGGCATCCACGTCGATGTCGTCGACGATCCGCACCCCGTGACCCAGCCGGTCGG
+CACCGCAGAAGGCGATCGCCTCGTGGATGGACGGCAACCCGAACGCCTCACCGGCATGAATCGTGAAGCG
+CGCGTTGTGATCACGCATGTACTCGAATGCATCCAAGTGCCGGGTTGGCGGGTGGCCGGCCTCCGCGCCG
+GCGATGTCGAATCCGACAACTCCCTTGTCCCGGAACCGGATCGCCAACTCTGCGATCTCCCGGGACATTG
+CGGCGTGCCGCATCGCGGTGACCAGACAGCGGACGGTGATGGGTTGACCATCGGCGGCACACGCCTTCTC
+GCCGGCGGCGAAGCCCGTCAGAACGGTGTCGACGACGTCGTCGAACGACAGCCCGCAGCTGATGTGCAGC
+TCCGGCGCGAACCGCACCTCGGCATAGACCACCGAATCGGCGGCCAGGTCTTGCGCGCATTCGAAGGCGA
+CCCGATACAAGGCCTCGGGAGTCTGCATCACCGCCACCGTGTGCGAAAACGGTTCCAGGTAGCGCTCCAG
+CGAGCCGCTGTGCGACTGGGTGCGAAACCAACTTGCCAGCGCGTCGACGTCAGTTGCCGGCAGGTCGTCG
+TATCCGACCTGCCCGGCAATGTCCAGCACGGTGGCCGGCCGCAGCCCGCCGTCGAGGTGATCGTGCAGCA
+ACGCCTTGGGGGCTAGCCTGATCGTCTGCAGGGTCGGCGCAGCGGTCATCAGACGATCCGATCGACGATT
+AGCGGCCGCACCTGCGGCGGACTGTCCCGGATACTCCAACCGCCGGCCAGCTCGGCTCGCGCCGCACCAA
+AGCGCTCGGGAGCATTCGTGTAGAGGGTGAACAACGGCTCACCGACCACAACCGGCTCCCCCGGGCGGCG
+ATGAATCCGCACCCCCGCACCGTGCTGTACGCGTGCGCCCGGGCGGGACCTGCCCGCACCGAGTCGCCAT
+GCCGCTAACCCCACTGCCATCGCATCGATGTCGCCCATTGTGCCGCTCGCGCCCGCCGTGACGGTTTCCG
+AATGCGAACCGATCGGCAACGGTTTCGACAAGTCACCTCCCTGCGCGGCAACCAACCAGCGAAACCGGTC
+CATTGCGGTGCCGTCCCGCAGCGTCTGGGCCGGGTCCCGGCCGTGGATCCCGGCAAGCTCGAGCATCTCG
+CCGGCCAGCCGCAACGTCAGCTCCACCACGTCGGGCGGTCCGCCGCCGGCCAGCACCTCCAGCGCCTCGG
+CCACCTCGAGCGCATTGCCGACGGTTCGACCCAGCGGGCAGTTCATCTCCGTCAGCAGGGCACGGGTGGG
+CACGCCATGCGCCGCGCCCAGTTCGACCATGGTGTGCGCAAGTTCGCGCGCCTGCACTGGCGACCTCATG
+AAGGCCCCGGAACCAACCTTGACGTCGAGCACCAGTGCACCCGCACCCTCAGCCAGCTTCTTGCTCATAA
+TCGAACTGGCGATCAACGGCAGCGATTCGACGGTGCCGGTAATGTCGCGCAGCGCATACAGCTTGGCATC
+GGCTGGCGCCAGCTGGCCGGCGGCGAAGATCGCGGCGCCGACGTCGCAAAGCTGCTCGCGCACCCGCTGG
+TTGGACAGATTCGCGGTGAACCCGGTGATGGATTCCAGCTTGTCCAGGGTGCCGCCGGTGTGGCCGAGTC
+CGCGGCCCGACGCCTGGGGCACTGCGCCACCGCAGGCGGCGACGACGGGCACCAATGGCAGCGTGATTTT
+GTCACCTACCCCGCCGGTGGAATGCTTGTCCACGGTCGCTAGTGGCAGATCGGTGAAATCCAGCCGGGCA
+CCCGAGGCCAGCATGGCCGCCGTCCATCTGGCGATCTCGCCGCGGTCCATGCCCCGCCAAACGATCGCCA
+TCAGCAGCGCCGACATCTGTTCGTCGGCGACCCGGCCGTCGGTATAGGCCTTGACGACCCAGTCGATGGC
+GGCGTCGGACAACCGGCCGCCGTCACGTTTGGTGCGGATGACGGTCGGGGCGTCGAATGCGAAGTCGGTC
+ACCGGCGTTCCCGGGGGAGGTCGTCGAGGCCGAAGGCGTCGGGCAGCAGGTCGCCGAGCCGGCGGGGTCG
+CACCGGATGGTCGATCAGTAGCTCGGAACCCCCGTGTTCGAGCAGCACCTGACGGCATCGCCCGCACGGC
+ATCAGCACGGATCCATGGCCGTCGACGCAGGCCAGCGCGAGCAGCCGGCCGCCGCCGGTCGAATGCAGGG
+CGCACACCACCGCACATTCGGCGCACAAAGTCAAGCCATACGAGACGTTTTCCACGTTGCATCCGGTCAC
+CACGCGACCATCGTCGACCAGTGCGGCCGCACCCACCGCAAACCGCGAATACGGCACATAGGCTCCGGCT
+GCTGCCTGGGTTGCATTGCCCCGCAGCATATTCCAATCGACATCAGGCATTCGGCAACCCCGCTCGTCGA
+TGGGCCGACTAAGAAAAGCCAGCCTAACCCCGGATCCACACACGATCCCGATCGGACTGTTCGACACCGC
+GGGCAACCTGGCCAAGTTAAGCTCGATTGCCCGGCTCTAGCTGTTCGATAGTGCTTTTAAGGGGTTTGCC
+AGCGGTGAATACAACGGCGACAACCGTCTCGCGCGGGCGGCGGCCACCTCGGACCCTGTATCGGGGAGAT
+CCCGGTATGTGGTCGTGGGTATGCCATCGCATCAGCGGCGCGACGATTTTCTTCTTCCTGTTTGTCCATG
+TCCTGGACGCCGCCATGCTGCGGGTGAGCCCGCAGACCTACAACGCGGTGCTGGCGACCTACAAGACCCC
+GATCGTCGGCCTGATGGAGTACGGCCTAGTCGCCGCGGTCCTTTTTCACGCACTGAACGGGATTCGGGTC
+ATCTTGATCGATTTCTGGTCGGAAGGCCCGCGCTATCAGCGGCTGATGTTGTGGATCATCGGCAGCGTCT
+TCCTCTTGCTGATGGTTCCGGCAGGCGTGGTGGTGGGCATCCACATGTGGGAGCACTTCCGATGAGCGCC
+CCGGTCAGACAGCGCAGCCATGACCGTCCAGCCAGCCTGGACAACCCACGATCACCACGGCGGCGTGCCG
+GCATGCCCAACTTCGAGAAATTCGCCTGGCTGTTCATGCGGTTTTCCGGTGTTGTGTTGGTGTTCCTGGC
+GATCGGGCACCTGTTCATCATGCTGATGTGGGACAACGGCGTGTATCGCCTGGACTTCAACTTCGTTGCC
+CAACGCTGGGCGTCGCCGTTCTGGCAGACCTGGGATCTGCTGTTGTTGTGGCTGGCGCAGCTGCACGGCG
+GCAACGGTCTGCGCACCATCATTGACGACTACAGCCGCAAAGACACCACCCGATTCTGGCTGAACTCGTT
+GCTGGTGTTGTCCATGCTGTTCACCCTGATGCTGGGAACCTACGTGATAGTGACATTCGACCCGAACATC
+TCCTGAAAGGCCCGGAAGGAGCACATGATCACGCCACCTCTCCCCCGCAAGCGGGCGGTACCCCCACCTC
+ATCGCTGCGGCCCCCTCGTCGCTTCGCGGCTGGGGGTGCCCCCACTGCATCGTCGGCGGCGGCGTTGATC
+TGCCAACACCGATACGACGTGGTGATCGTCGGCGCGGGCGGTGCCGGGATGCGCGCCGCGGTCGAGGCGG
+GTCCGCGGGTGCGTACCGCGGTACTGACCAAGCTGTATCCCACCCGCAGCCACACCGGCGCGGCCCAGGG
+CGGCATGTGCGCCGCGCTGGCCAACGTCGAGGACGACAACTGGGAGTGGCACACGTTCGACACCGTCAAG
+GGCGGCGACTATCTCGCCGACCAGGACGCCGTGGAGATCATGTGCAAGGAAGCCATCGACGCGGTGCTCG
+ACCTGGAGAAGATGGGGATGCCGTTCAACCGCACCCCCGAGGGCCGCATCGACCAGCGCCGCTTCGGCGG
+GCACACCCGCGACCACGGCAAGGCCCCGGTGCGCCGGGCCTGCTACGCGGCCGATCGCACCGGCCACATG
+ATTCTGCAGACGCTGTATCAGAACTGCGTCAAGCACGACGTCGAGTTCTTCAACGAATTTTACGCGCTGG
+ATTTGGCTTTGACTCAAACGCCGTCGGGCCCGGTGGCCACCGGGGTGATCGCCTACGAGCTAGCGACCGG
+TGACATCCATGTCTTTCACGCCAAGGCCGTCGTGATCGCGACCGGCGGCTCGGGCCGCATGTATAAGACC
+ACGTCCAACGCACACACCCTGACCGGCGACGGCATCGGCATCGTGTTCCGCAAGGGACTTCCCTTGGAGG
+ACATGGAGTTTCACCAGTTTCACCCTACCGGCCTGGCCGGTCTGGGCATCTTAATCTCCGAAGCGGTGCG
+CGGCGAAGGCGGCCGGCTGCTCAACGGGGAAGGTGAGCGTTTCATGGAGCGCTACGCCCCGACGATCGTC
+GACCTAGCGCCCCGCGACATCGTCGCCCGCTCGATGGTGCTGGAAGTGCTGGAGGGACGCGGCGCCGGAC
+CGCTCAAGGACTACGTCTACATCGACGTCCGCCACCTGGGCGAGGAAGTGCTCGAGGCCAAGCTGCCCGA
+CATCACCGAGTTCGCCCGCACCTACCTGGGCGTGGATCCGGTCACCGAGCTGGTGCCGGTCTACCCGACG
+TGCCACTACCTGATGGGCGGCATCCCGACCACAGTCACCGGGCAGGTGCTGCGGGACAACACCAGCGTTG
+TCCCGGGCCTGTATGCGGCCGGCGAGTGCGCGTGCGTGTCGGTGCATGGCGCCAACCGGCTGGGCACCAA
+CTCGCTGTTGGATATCAACGTCTTCGGTCGTCGGGCCGGCATCGCCGCCGCCAGTTATGCGCAGGGTCAC
+GACTTTGTCGACATGCCGCCCAACCCGGAGGCCATGGTGGTGGGCTGGGTCAGCGACATCCTGTCCGAAC
+ACGGAAACGAGCGGGTCGCCGACATTCGCGGGGCGCTGCAGCAGTCGATGGACAACAACGCCGCGGTGTT
+CCGCACCGAGGAGACCCTGAAGCAGGCGCTCACCGACATCCACGCGCTCAAGGAGCGCTACTCCCGAATC
+ACGGTGCACGACAAGGGGAAACGCTTCAACACCGACCTGCTGGAAGCCATCGAGCTGGGATTTTTACTGG
+AGCTGGCCGAGGTCACGGTGGTCGGCGCTTTGAATCGCAAGGAGTCCCGCGGCGGTCACGCCCGCGAGGA
+CTATCCCAACCGCGACGACGTCAACTACATGCGACACACCATGGCCTACAAGGAAATTGGGGCCGATAAG
+GAGGGCCCCGAGCTGCGCAGCGATGTCCGCCTTGATTTCAAACCCGTCGTGCAGACCCGTTACGAACCCA
+AGGAACGGAAGTACTAATGAGCGTCGAGCCGGACGTCGAAACTTTGGATCCGCCCCTACCGCCGGTACCG
+GACGGCGCGGTGATGGTGACCGTCAAGATCGCCCGGTTCAACCCCGACGAGCCCGACGCGTTCGCGGCCA
+CCGGCGGCTGGCAGAGCTTCCGGGTGCCCTGTTTGCCCAGCGATCGGCTGCTCAACCTGCTCATCTACAT
+CAAGGGCTACCTCGACGGCACGCTCACCTTCCGGCGATCCTGCGCCCATGGGGTGTGCGGCTCTGATGCC
+ATGCGCATCAACGGGGTGAACCGGCTGGCCTGCAAGGTGCTGATGCGTGACCTGCTGCCGAAGAAGAAGG
+GCAAATCGTTGACCGTCACGGTCGAGCCGATCCGCGGGCTGCCGGTGGAAAAGGACCTGGTGGTCGACAT
+GGAGCCGTTCTTCGACGCCTACCGGGCGATCAAACCGTACCTGATCACCAGCGGCAACCCGCCCACCCGC
+GAACGGATCCAGAGCCCGACCGACCGCGCCCGCTACGACGACACCACCAAGTGCATCCTGTGCGCGTGCT
+GCACCACCAGCTGCCCGGTGTTCTGGCACGAGGGCAGCTACTTCGGCCCGGCGGCGATCGTCAACGCGCA
+CCGCTTCATCTTCGACAGCCGCGACGAGGCCGCCGCCGAGCGCCTCGACATCCTCAACGAGGTCGACGGG
+GTGTGGCGCTGCCGCACCACGTTCAACTGCACCGAATCCTGCCCACGGGGCATTGAGGTGACCAAGGCGA
+TCCAGGAGGTCAAGCGCGCGCTGATGTTCACCCGCTGAGGGCTTGCGCGAGCAGACGCAAAATCGCCCGA
+AAACCAGTGGTTTTGGGCGATTTTGCGTCTGCTCGCGCAGCCGGGTCTACAGCGTTGCCAGGTGCTGTTT
+GGTTGCGCCAGGAACCGCAGTCAACGCAATCGACTGATCGAAGGTGACAAATCGGCCATCATGAGCGACC
+GCGAGGGCCAGCAAGTACGCGTCGGTGACCTGTTTGGGGCTGTGCAGGCGGGAACGATCGATGACCTTTG
+AGTCGAGAATGCTGACGGTGCAGGACCAGAACTCGTGATAGCGCGTGTGCGTCGCACGAGCCAACAAGTC
+GATGGCATGGGCTACCGAGATTGGGCTGGGATAGCGCGGTTGGCTGATGACGCGGACGAACCCGTTTTGG
+GTGATCGCACAGGAAGCCCATCCCCGCTCGATCTGCCCGGTGATCCACGCTCGGGCGCGCTCGTGGTCGA
+CGTGATCGCGGTCCAACAGCGCCAGTAGCACGTTGACGTCCAACAGCGCTCGCATCGATCACACGGCCTC
+CTCGTCACGAAGCCGATCGATCAGCGCGTTCGATACCGCTCCACCGCGATGAGGCAGGGGTTCGAAGCCA
+TGAAAGGCGTCCTCCTGGCTCGCCGCAGGCTGGGGATTCTGGTTGGTTAACGCTTGCCGGGCCAGATCCG
+ACAGGATTTCACCCGCGGTGCGCTTCTCCCTGCGTGCCCGTTCCTTCACGGCCAGCAATACATCGTCGTC
+GATGGACAACGTGGTGCGCATGCATCAGATGCTATCGCACCAATCTGGGCGCAACGCGTCTACAGGATGG
+CCAGCGCTCGCGGCATTGAGAATCTCCTTCGTGGGTGCACTCCCACGCGAGGTAGGGGCCGACGACCACC
+ATCTATGCCCCTGGCAACGGTGAGCGCCGCGCGATCATGATCCGCGACGGCGCCGAATCGCAGTTACCCT
+GCCCCTCGTGTACAACGGTGAAGTCGGCAGGAAGCAGACACGCTGGCTCTCCCGGCTTGACACGTCGCTT
+CGCGCTGGCTGTGCCCGCCTCGGCGCCACTGAGAGCCAGCGACTCCCATGCCAATACGCCGCCTGGCATC
+ACCGCCTCACAGGCGCGGTGAAATATCGCCGCATCCCAAAAGAGCCTGCTGAGCACCAGCGCGAAACGCG
+TCTCGCCGGGTTCCCAGCAGCCCAAGTCGGCCTGCACGAGGTTGAGCCGATCGGCCACGCCTCGACGCAC
+GGCCTCGCTGTCCAGCTGCAGCAGCGCGACATCGGACACATCGATTGCGGTGACCTGGCGGCCGTGGGCG
+GCCAACGCCAGTGCGGTACCCGATCGACCGCTAGCTAACTCCAGAACGGGACCGTCCGGAACGCCTGCTC
+TGAGGACATCGGCGAGCCAAGGCACCGGGGCAAACGGCGCGTGCGCCGAACCCGCGCGTTCGTATCGCGC
+GTTCCAGTCGACGCGGTTGGGGTGCTCCCGCAGCGCCGGATCCGTCTGCACGCTCATGGCCGATTGGCCA
+CCCACTCAACACCGTCGAGTGCGAACTCCTTCTTCCATATCGGCACATCCTGTTTGAGCCGCTCGATGCA
+CATGCGAGCGGCGTCGAACGCGGCCGCGCGGTGAGGAGCCGAAGCACCGATGACAACCGCCGCATCACCG
+ATGCGCAATTCACCGGTCCGGTGTGCCACGGCAACTCGCACACCGTCGGCCTGTCGTTCACACTCTTCGA
+TGATGTCCATCAGCGTGCGGTGCACCATGGCCGGATAGGCCTCGTAGTACAACTTGGTCACTTCGTGGCC
+GTTGTTGTTGTTACGCACGGTACCCACGAAGATGACGGCGCCGCCCTGGGAAGGTCCAGATATCGCGTTG
+AGCACTTCATCGACGCTCAGCGGCTCATCGGTGAGCCGGCAGTAGACATCGGAGCCCCCGGCAACCTGCG
+GTATGAACGCCACCGTGTCGCCATCGTCGAGAATCGTTGATGCTGGCGCTATGGATTCGTTAACGGCCAT
+CCGCACTCGCTTGCGAAAATCAGCAAGTGGCGGATAGTCGATTTGCAATTGGTCGACTAAGCCGTCGACG
+GTGGTGCCGCTTTCGAGTGAGATCTTCTCGTGAGCGACCTTGCACGCTTCGCGAACCGCGCCAAAGTAGA
+GCACATTGACAGTAATCATTCAACATCCATCCTCGGTGGAGCCACCATCGCTGGGTTTGACGTCCGCGTC
+GTGCCGCCGGTAATGACCCGATCGGCCACCGCTTTTTTCGTCCAATCTGATATCCGTGATCGTCATGGCA
+CGGTCGACTGCTTTGCACATGTCGTAAACCGTGAGCGCTGTCACCGTAACGGCGGTCAACGCCTCCATCT
+CCACACCCGTACGTGCCACCGTGGTCACCGTCGCCGCAATCGAGAGCCGGTCCGCGCCCTGCGGCTCGAG
+CGTGACGGTGACCGCCTCGATCCCCAGCGGGTGACACAGCGGGATAAGCTCACCGGTCCGTTTGGCCGCC
+ATAATGCCGGCTATCCGTGCGGTCGCTATGACATCGCCCTTTGCCGCGGTGCCGTGACAGATCATGTCCA
+GGGTCGACGGTTTCATCAGGACGGCCCCGGATGCCCGCGCTCGCCGCAAGGTCACCGCCTTCGCCGACAC
+ATCGACCATTCGGGCGGCGCCTTGTTCATCAAGGTGGGTAAGCACCCCATCGTGGTCGTTCACCGTGCCA
+CCTGCTGGCTGCATTGCTCATCGTGCACTGCGCTGAAAGCCTCGGCGAGGTCGAAGTCGACGCGAGTCAA
+ACAGTGCATCTGGCGCGTCCAACAAGTCAACCGCACCGACCGCTTGTTATGGACACAGATATCGGGGTGA
+TGATTGAATTTGTCGGCGATGGCGGCGATCTTCGCCACAAATTTCATGGATTGATCGAAGCTCCCAAACC
+CAAATGTGTGGCGGAGCTTTCCATCGACGAGCTCCCACCCGGGCAGTGCCGTCAACCTCTCGGACAGCTC
+CCTGTCGGTGAGAGCCGACAGCCTGCCGCAGCACACGTCGTGAAGGCTTGACTCCTCACATCGACTGACG
+TTGCCGTGTGCCATGGTTCCCTCCTGGACTTGGTTGGATTGATGGTGGATGTCGCACCTGGTCGCCCAGC
+GAGTGCGCGCATGCGGGCATGGGCACCAGACCGGCCGGAATTATCCGCCTCTGGTGTGCATCTCCAGATG
+TGGGTCGCGTTTCAAGCGGGACACCGGAAGAAAGACCTGTCGCGTTCGTTGGGCCAAGCGTTGTTCTGCC
+CCACGGTTCGCGCGGTCCCGCCAGCCACGCTGCAGAATCTGCACAACGTCATTGGCGGACGCTCCCGCAC
+GCACGGATTCCCGCAAATTGATGCCGGACAGGGCGTAAAGGCAATGTAGCCAGATGCCATCGGCGGTCAG
+TCGCGACCTGTCACAGGTTGCACAGAATGGCTCGGTGGTCGAAGCAATGATGCCGAATGTTGTTCCGTCC
+GGCAATCTGTAGCGGTTCGCGGGCGCGGAATCGTACTTCGGCAAGGCCGCGATGGGACCGTATTTCTTCC
+CGAGAGTTGACAGCATCTGCGCTTTCGTGAAGACCTTGTCCATCGACCATTGCGTCGCACCGCCGACGTC
+CATGTATTCAATGAATCTCACCTCGGCATTGACGTTGCGAGCGAATTCGATCAGATCGGACAACTCATCA
+TCGTTGAAGCCACGTATCACCACGGAATCAAGCTTCGTATCGGTGAAGCCCGCCGCCGCAACCGCCTCAA
+TGCCTTCGATAACTTTATAGTGGGTCCCGCGCTGGCTGATTGCTTTGAACCGGTCCGGCCGCAACGTATC
+AAGACTAATGGTGATGCGCCGCATGCCCGCCGATTTTAACTTTCTGGCCTGGTCCGCGAGCAGCACGCCA
+TTAGTTGTGATCGCCAAATCCTGTAAACCGCTGCCATCGCCAACTTTCGCGCTTATAACCTCAATGATTG
+CCGCCAGATCCGAGCGGATCAGCGGTTCTCCACCGGTGAGCCGAATTTTATCGACACCGACAGCGATAAA
+TGCATCGACGATCAGGCTGATTTCGTCCACAGACAGCAGATCCGCCCGCGGCAACCAGGCGTACTCGGCC
+TCGGGCATGCAGTAGCGGCAGCGGAGGTTGCACTGATCGATCACAGAAAGCCGCAGATCACCCATGGTGC
+GACCACAGCGGTCCCTGATGGGGGATTCATTGATGCACAAGCCGGACCGGCTCACCGAGGCGACATCCGT
+GATCTGATAGCGCGACTGTTCCGGTCCGGACAATGCTGGATGAAAAACCCGAGTCATTGGATAGCTCCGC
+CGACAAGGCCACCGACGGCGATGGGCGACGCCAGGCATCCCCGCAGGGATCTAGGACATCGGGCGTTATC
+GGGGGCTGGCCGCGGCGATGGCGCCCGCGAAGACCATCGCAACACGTTTCGCGTGCACACTGGCACCACA
+TGCCTCCTTCTCATTCGCGCGCTTTCCGGGGTTCACGTTCATTACTGTTCAACACCGGCCTCAATGGAAT
+CTCAATGCGCACGGCGCACGACCGGATTCGGCGGCGCATGTGGGTCCGGCAAGGCAACGGCCACCCGTTG
+GCCGTTCATCCACGACGGTGACCCGAATTCCCGACAGTGATGTCGAGAAGCCAGGTAGCTCCGGTTCGGT
+GTCGAGCACCGGGCCGGAGGTCGCCGCACGGCGTCATGGTAGGCGTTGCGGGTGCGACCGCAATCGGTCA
+CCGCCACGTTCCAAATCGGTCACACTTGACACCCGTCATGTCGGCGGAGCCGGTATTCTTCGAATTCGAG
+CTTTCCCCATCAGGCCCTGGCGCCCGGTGAATCGCTCATCAAACGGACCCGCGACCGACGAGGATTGTGA
+TGGCCCGAAACGAACTCCGGTTCGGTATTCTCGGACCGCTAGAGATAAGCGCAGGTTTCCGCAGTCTACC
+GTTGGGCACACCGAAGCAACGTGCGGTCTTGGCGACGCTGATCATTCATCGTAATCGCCCGGTTGGGATC
+GACTCGTTGATCGACGCGGCTTGGGAGCAGGACCGGCCGGAGGGATCACGAGCGACCGTGTATACGTATG
+TCTCGAATTTGCGTCGGTTGGTAAGCACCACGGGGGCGGATTCGCACAGCATCTTGGCTAGCGCACCGCC
+AGGGTATCGACTCGCCGTTGCCGATAACCAATATGATGTGGCACGTTTTATCAGCCAAAGGTCGGCCGGG
+CTGCGCGCCGCCGCTGCCGGTTCTTTCGAACAGGCCAGTGACCATTTGTCGGCCGCGCTGGCCGAGTGGC
+GCGGCCCGGTCCTGGACGATCTGCGTGAATTCAGCTTTGTCACCCGCTTGGCCAACTCATTGGTTGAAGA
+CAAAATCATCGCCCACACAGCTCTCGCGGAGGCTGAAATCGCCTGCGGGCGTGCCGATTCAGTGATCAGC
+GAGCTCGAGGAGCTGATCCTGGAGCATCCTTATCACGAGGCCCTGTGGCGGCAACTCATCGCCGCATACT
+ATGTCTCGGAACGTCAATCCGATGCCCTGGACGCCTACCGGCGATTAAAGACCAGCCTGGCCGAAGACCT
+CGGCGTCGACCCGGGACCCAAGGTACGCACGCTATACGAGCAAGTGCTGCGCCAACAAGCACTGGACACG
+CGAGTCGTCGTCCAGGCTGCCGCAGGAGATATCATCAGGGCCCTCGAACACTCTCCCGGCATGACCGACC
+GTTCGCCGCGCGCCGCAATACGCGACGCCGCGGGGCACCGGTCTCCACTTGGCCGGTTGCCCCTTCGTAT
+CGGGCGTAGCAAAAGTAACGACATGGTGCTGCCGGACGGCAAAGTCAGTCCCTACCATGCCGTTATCGTC
+AACACCGGTGAAAGCTTCATGATCACCGACCTGCGATCGGTCAACGGCGTCTACGTGCGTGGGCGGCGCA
+TCGCGACCACAGCCACCCTCAACGACGGCGACCACATTCGCATCGGCGACCATGAACTCACGTTCGAGGT
+CATACCGCACGAATCGGGCCGTTAGCCGGCGGGTTTGCCCATCCCCGGTTCTGCGCCCACCCGCGCCTAC
+CCTTCGGTAGGCAGGCCGGCTCGCCGACCCGCCGCGGACACCAGGATGCCTACCGTGCTGGCACCAGCAC
+ACTCTCGTCGTATTGCCTCACCAGGTCTTCGACCACGGTCTGCCACGAGGCATCGTCCACGCAGAGGCGG
+CTGGCGGTAAGTACTAGCCGGTCGGGACTTCCGGGGAGCAGAGAAACCGCGAACAACCTGCCGGTGTACA
+TATCGAAGCTCGCGCTGTGCCGTGCGATCACCTCCGCGACGGCGGCTCCCGGGGGTTCCACTCCCCAGCC
+CCACCCGCCGCCGCCCGGGCGAGAAGTCAAGGTGTCAACGCGCGGCTCGAATACGGTGCCAAGGGCCGGA
+TGGGCGTCGAAGACCGCCTCCACCGCCGCGCGGATACGCCCCTGGTCCACCCGTGAGTTCGCAATCAGAA
+CGTCGGTGTGCGCGCCAGGCTCGATGTCCTCGAGCCTGGGAAGCTCAACGAAATACGAATACGACATGAC
+CACAGACTCCGGCACACCCCTCAGCGAATTCTTGGCAACTTCTTGGACCTGGGCCGAGCAGACGCAAAAG
+CACCCCATTTCGGCACGAAATGGGGGCCCTTTGCGTCTCAGTGTCGGTGTTGTGTGTGCCGCGAGGTGGG
+TGTGTCGGTGTGACAGACGCCGTGTCGCGGTGGTTTGTTCCGGATCACCTGGTGTCTGGCTCACTTTGCG
+TCTGCCGTCCTCTTGGGGTTGGCGTTGAGCAGTATTGCCGGCACTAGGTGAGAAGGACCGGCCGGCGTGA
+CTTGATAGGAGCGTGGCTTTCGCCCCGACTGAGATGTGTCCGCCGACCGGCCCAACCTCAACACCCCCTC
+AAGTGAAGGAGGCAACCACCATGGTTGTTGTTGGAACCGATGCGCACAAGTACAGCCACACCTTTGTGGC
+CACCGACGAAGTGGGTCGCCAACTCGGTGAGAAGACCGTCAAGGCCACCACGGCCGGGCACGCCACAGCC
+ATCATGTGGGCCCGTGAACAGTTCGGCCTCGAGCTGATCTGGGGCATCGAGGACTGCCGCAACATGTCGG
+CGCGTCTGGAGCGTGACCTACTGGCGGCCGGCCAGCAGGTGGTGCGGGTACCCACCAAGCTGATGGCCCA
+GACCCGCAAGTCGGCGCGCAGTCGGGGCAAGTCGGATCCGATCGATGCGCTGGCGGTGGCGCGGGCGGTG
+CTGCGTGAAACCGACCTACCCCTGGCCACCCACGACGAGACGTCGCGGGAGTTGAAGTTGTTGACTGACC
+GTCGAGATGTCCTTGTGGCCCAACGCACGTCGGCGATCAACCGGTTGCGCTGGCTCGTCCATGAACTCGA
+TCCCGAGCGGGCACCGGCAGCACGCTCGCTCGATGCCGCCAAGCACCAGCAGGCCCTGCGGACCTGGCTG
+GACACCCAGCCAGGATTGGTCGCCGAACTCGCGCGCGCCGAGCTGACCGACATCATCCGGCTCACCGGCG
+AGATCAACACCCTGGCCCAGCGCATCAGCGCCCGAGTCCACCAGGTCGCCCCCGCACTGCTGGAAATCCC
+TGGCTGCGCGGAGCTGACTGCAGCCAAAATCGTCGGCGAAGCCGCCGGAGTGACCCGGTTCAAAAGCGAA
+GCCGCCTTCGCCTGCCATGCCGCAGTGGCTCCCATCCCGGTGTGGTCGGGCAACACCGCCGGCCAGATGC
+GGCTCAGCCGCTCGGGCAACCGCCAGCTCAACGCCGCCCTACACCGCATCGCACTGACCCAAATCCGGAT
+GACCGACAGCCGGGGCCAGGCCTACTACCAAAGGCTGCAAGACGCCGGGAAAACCAAACGCGCAGCACTA
+CGCTGCCTCAAACGCCGCCTAGCCCGCACCGTCTTCCAGGCCCTGCGCACCGTCCATCAGCCCAGCTCCG
+AACACACCCAACCCGCGGCCGCTTGCCATAGGAGCTATTGCTCGTCACACCTCGGCGAGCCACCTCGTCT
+AACGGATATGACACAGAAAACCCGCATCCAGCCCCTACCTCCCAAGCGAGCCGGCCTGTTGATCCGCGCA
+CTGTATCGGATCGCCAAGCGGCGCTTCGGCGAAGTTCCCGAGCCGTTCACGGTCACCGCACATCATCGGC
+GGCTGCTGATCGCCAATGTGGTGCACGAAGCCCTGCTGCAGCGAGCGTCGCGGAAGCTACCGCCCAGCGT
+CCGTGAGCTGGCGGTGTTTTGGACCGCCCGCAGCATCGGCTGCTCGTGGTGCGTGGACTTCGGAGCCATG
+CTGCAGCGCCTGGACGGGCTGGACGTGGACAGGCTCACGGACATCGACAATTACGCCACCTCATCGAAAT
+TCAGCGACGACGAACGCGCCGCCATCGCCTACGCCGAGGCGATGACCGCAGACCCGCATTCGGTGACCGA
+CGAGCAGGTGGCCGACCTGCGGGCCCGCTTCGGCGAGGCCGGCGTGATCGAGCTGACTTACCAGATCGGC
+GTGGAGAACATGCGAGCCCGGATGAATTCGGCGCTGGGCATCACCGAGCAAGGCTTCAATTCCGGTGATG
+CCTGCCGCGTCCCGTGGGCTGCGCCCGACGTTCCTTCAGCGGAGAGCCGGTGAACTTGTCGGGATTGGCG
+ATATCCCACAGCGCGCACACCTTTCCGTCGCGCACGGTTATCGCGGTGATCCGCGGCGCCATCGCCCGAT
+ACCCGTCGACCCCGGGTAAGCCCGCCGTGTAGGCGCCGAGCTCTCCGTTGACCAGCGCCAGCTGATTCGC
+GCCGAAGAGCCCCGGGCCGTAACGCTGGACCAGCCCGAGTATGAACCGGACCACCTTGTCGGATCCGCGG
+ACGGCCCGTACCGCTGTGGGCGCCTTGCCATTCGAATCGCCGGTAAACGTCACGTCGGGATGCAGCAGCG
+ACACCACCGTGTCCAGGTCACCAGCGGCCATGGCGGCCATCAGCCGGCCGACCACCTCGTTGTGGGCCGG
+ATCCGGATCCCCCGATATCAGGGCGGGCTGCGCCGTGACGGCCTTGCGGGCCCGCGACGCCAGCTGGCGC
+GCGGCGGCCTCGCTGGTTCCCAGCACCTCGGCCACTTCGGCAAACGGCACGGCGAACCCGTCGTGCAGCA
+CGAACGCGACCCGCTGATCGGGGCGCAGCCGCTCCAGCACCACCATGGCCGCGAACCTGGCGTCCTCGGC
+GGCCACCACGGCGGCCAACGGATCGGTCGCGTCCAAGCCGGTGACCACCGGTTCGGGCAGCCAGGTGCCG
+GTGTAGGTCTCCCGCCGGTGCGCCGCCGACCTCAACTTGTCCAGACCCAGCCGGCTCACCACGGTGGTCA
+GCCAGGCCCGCGGGTCGGCGATCACGGTGTCCTGTGAGTCCCAGCGCAGCCAGGCCTCCTGCACGATGTC
+CTCAGCATCGGCGACCGTGCCGGTCAGCCTGTAGGCGACCGACATGAGATGCTGTCGCAGTGCCTCGAAT
+TCGGAAACCTCCATCGAGGTCATTGCCCGAGCCTAGCGCTGCGCTCGCCAACACGACGACACGAAACCTT
+TGGTTGCACTTCGCCCGGCACGGTGCCGGCATCCAACACCCGGTCATCGTCCGCGGCGACGGCGTCACCA
+TCTTCGACGACCGCGGCAAGAGCTATCTGGACGCCTTGTCCGGGCTGTTCGTGGTGCAGGTCGGTTACGG
+CCGGGCCGAACTCGCCGAGGCGGCCGCGCGGCAAGCCGGCACGTTGGGGTATTTCCCGCTCTGGGGGTAT
+GCCACCCCGCCGGCGATCGAGCTCGCCGAGCGCCTGGCCCGCTACGCGCCCGGGGACCTAAACCGGGTGT
+TTTTCACCAGCGGCGGCACCGAGGCCGTCGAAACCGCCTGGAAGGTGGCCAAGCAGTACTTCAAGCTCAC
+CGGCAAACCGGGCAAACACAAGGTCATTTCACGCTCGATCGCCTACCACGGCACCACCCAGGGCGCGCTG
+GCGATCACCGGCCTGCCATTGTTCAAGGCGCCATTCGAACCGCTGACGCCGGGCGGCTTCCGGGTGCCCA
+ACACCAATTTCTACCGAGCACCGTTGCACACCGACCTCAAAGAGTTCGGGCGATGGGCTGCTGACCGGAT
+CGCCGAGGCCATCGAGTTCGAAGGCCCCGACACCGTGGCCGCGGTGTTTTTGGAGCCGGTGCAGAACGCG
+GGCGGCTGCATCCCGGCGCCGCCGGGTTATTTCGAACGGGTCCGCGAGATCTGTGACCGCTACGACGTGC
+TGCTGGTCTCCGACGAGGTGATCTGTGCGTTCGGCCGGATCGGGTCGATGTTCGCCTGTGAAGACCTCGG
+CTACGTGCCCGACATGATCACCTGCGCCAAGGGCCTGACGTCGGGCTACTCGCCGCTGGGCGCGATGATC
+GCCAGCGACCGGTTGTTCGAACCGTTCAACGACGGCGAGACGATGTTCGCACACGGCTACACGTTTGGCG
+GTCATCCGGTGTCGGCGGCCGTCGGCCTGGCCAACCTCGACATCTTCGAGCGCGAGGGTCTCAGCGATCA
+CGTCAAGCGGAATTCCCCCGCGCTGCGGGCCACCCTGGAGAAACTGTACGACCTGCCCATCGTCGGCGAC
+ATCCGCGGCGAGGGGTATTTCTTCGGCATCGAACTGGTCAAAGACCAGGCGACCAAGCAAACCTTCACCG
+ATGACGAACGCGCACGACTGCTAGGCCAGGTATCCGCGGCGCTCTTTGAGGCCGGGCTGTACTGCCGCAC
+CGACGACCGCGGGGACCCCGTCGTCCAGGTGGCTCCCCCGCTGATTAGCGGACAGCCCGAGTTCGACACC
+ATCGAAACCATCCTGCGCAGCGTGCTCACCGATACCGGACGCAAATATCTTCATCTGTAACTTTCGTCCC
+GCCAGTCACAGCGCGGCTCCTCGCGGTCGGGCCGCCGATCACCTACTCTGCACAGACGATGGCCTTCTTA
+CGTTCGGTATCGTGCCTGGCAGCAGCCGTGTTTGCGGTAGGCACCGGAATTGGTCTACCTACCGCGGCCG
+GCGAACCCAATGCCGCACCGGCGGCGTGCCCGTACAAGGTATCCACCCCACCCGCCGTGGACTCGTCGGA
+GGTTCCCGCGGCCGGTGAACCCCCACTGCCGCTGGTGGTACCCCCCACCCCGGTCGGCGGCAACGCGCTG
+GGCGGCTGCGGCATCATCACCGCCCCTGGCAGCGCGCCAGCGCCCGGCGACGTCTCAGCCGAGGCCTGGC
+TGGTGGCGGACCTGGACAGCGGCGCGGTGATCGCCGCCCGGGATCCGCACGGCCGGCACCGCCCGGCCAG
+CGTCATCAAGGTGCTGGTGGCGATGGCGTCCATCAACACGCTCACCCTCAACAAGTCGGTCGCCGGAACC
+GCCGACGACGCGGCGGTCGAGGGCACCAAAGTCGGGGTGAACACCGGTGGCACCTACACCGTCAACCAGC
+TGCTGCACGGGCTGCTGATGCACTCCGGCAACGACGCTGCGTACGCGCTGGCCAGGCAGCTCGGCGGCAT
+GCCGGCCGCGCTGGAGAAAATCAATCTGCTGGCCGCCAAGCTGGGCGGCCGGGACACCCGAGTGGCCACG
+CCGTCCGGACTGGACGGGCCCGGCATGAGCACGTCGGCCTATGACATCGGCCTGTTCTACCGGTACGCGT
+GGCAGAACCCGGTCTTCGCCGACATCGTCGCGACCCGCACCTTCGACTTCCCGGGGCACGGCGACCATCC
+AGGCTACGAGTTGGAGAACGACAACCAGCTGCTCTACAACTATCCGGGCGCGCTCGGCGGCAAGACCGGC
+TATACCGACGACGCGGGGCAGACCTTCGTGGGCGCGGCCAACCGCGACGGCCGGCGGCTGATGACGGTGC
+TGCTGCACGGGACCCGGCAGCCGATCCCGCCGTGGGAGCAGGCGGCGCACCTGCTCGACTACGGGTTCAA
+CACCCCGGCAGGCACCCAGATCGGGACACTGATCGAACCCGACCCGTCGCTGATGTCCACCGACCGCAAT
+CCCGCCGACCGGCAACGAGTCGACCCCCAGGCCGCGGCGCGGATATCGGCCGCCGACGCCCTTCCGGTGC
+GGGTTGGCGTGGCCGTCATCGGCGCCCTGATCGTGTTCGGGTTGATCATGGTCGCGCGGGCGATGAACCG
+CCGGCCGCAGCACTAGCTGCTTACCCCGATACCTTCGGCGTCGTTTGCGGGCGGGCATCCTAGCCGGCCT
+TGGTCGGCACCGAAATCGGGGCTTGACCAGCGGTTGACCGCGTGACGACGCTGTGGCAGCCTCATCGAAA
+TGACTACAGCCCTATACCAGGACGCGGGGTTCACGCCCGCCGGGGCGCCCGACGACCCCGACCGCGTGGT
+GGACGTGCTGAGCGCCCCGGTACCGGTCAACTGACCAGATCGGGGCGCCGGGCGCTCCTCGTCGGGCTCA
+CCGCCGCCAGCGTCGGCGTCCTCTACGGGTACGACCTTTCCGCCATCGCGGGTGCGTTGCTGTCTCTCAG
+CGAGGAATTCGAACTCACCACTCGAGAACAGGAGTTGCTGACCACCACGGCGGTGCTCGGCCAGATCGCC
+GGGGCGCTTGGCGGCGGCATCCTCGCCAACGCGATCGGACGCAAGAAATCGGTGGTGCTCATCGTCGCCG
+GCTACGCAGTGTTCGCCCTGCTCGGCGCGACCTCGGTGTCCGTACCGATGCTGGTGGTGGCGCGTCTGCT
+GCTGGGTGTGACAATCGGCCTGTCGGTGGTGGTGGTGCCGGTGTATGTGGCCGAGTCGGCGCCGGCGGCG
+GTGCGTGGGTCGTTGGTGACCGCGTATCAGCTGGCGACGCTTAGCGGCATCGTCGTCGGTTACCTGGTCG
+GCTACCTGTTGGCCGGATCGCACGGCTGGCGCGCGATGTTCGGGCTGGCCGCCGCGCCGGCCACGCTGCT
+GTTGCCGTTGTTGTGGCGCATGCCCGATACCGCCCGCTGGTATCTGCTCAAGGGCCGGATCGCCGACGCG
+CGTAGCGCGCTGCGGCGGATCCAGCCGGAGGCCGACATCGATGCCGAGCTGGCCGATATGGCGGCCGCGG
+TCGACGAACGCGGCGGCGGTATCGGCGAAATGGTGCGGCGGCCGTATCTGCGGGCCACGCTGTTCGTCAT
+CGCGCTCGGCTTCCTCGTCCAGATCACCGGGATCAACGCGATCATCTACTACAGTCCGCGACTTTTCGCC
+GCCATGGGCTTCGCGGGCTATTTCGCGATGCTTGCCCTGCCCGCGATGGTGCAAGTCGCCGGCTTGGCGG
+CGGTGTGTGCCTCGCTGTTTCTGGTCGATCGGCTGGGCCGTCGCCCGATCCTGTTGTCCGGCATCGCGAC
+GATGATCACCGCAGATGCCGTGCTGATCACCGTATTCGCCAACGACTCCGATGGTGGCACGGGGCTGGTG
+TTGGGGTTCGCCGGCGTGCTGCTGTTCATCATCGGGTTCAACTTCGGATTCGGCTCGCTGGTCTGGGTGT
+ACGCCGCGGAGAGCTTCCCGTCCCGGCTGCGGTCGATGGGATCGAGCCTGATGCTCACCTCGACACTGAC
+GGCCAACGCGATCGTTGCCGCCTTCTCGCTCACCATGCTGCGTGTGCTCGGCGGCGCAGGCGTTTTCGCG
+GTCTTCGGCACGTTCGCCGTCGTCGCGTTCGTGGTCGTGTACCGCTTTGCGCCGGAGACCAAGGGCCGCA
+AACTCGAGGAGATCCGGCACTTCTGGGAGAACGGCGGCCGCTGGCCCGCCGAGCGGTCACCGGCGGCGGA
+CGAACCGTGACCGTGCTCGGCGCCGACGCCGTCGTCATCGACGGCCGGATATGCCGGCCAGGGTGGGTGC
+ACACCGCCGATGGTCGGATTCTCTCCGGTGGCGCTGGGGCACCGCCCATGCCGGCCGACGCGGAATTCCC
+CGATGCGATCGTGGTGCCCGGCTTTGTCGATATGCATGTGCACGGCGGGGGCGGCGCGTCGTTCGCCGAC
+GGCAACGCCGCAGACATCGCCCGTGCGGCCGAGTTTCACCTGCGGCACGGCACCACTACCACGCTGGCCA
+GTCTGGTCACCGCGGGCCCCGCCGAGTTGCTCTCCGCCGTGGGCGCTTTGGCCGAGGCAACTCGGGACGG
+CGTCGTCGCGGGCATCCATCTGGAGGGGCCGTGGCTGAGCCCAGCGCGGTGCGGAGCGCACGACCACACC
+CGGATGCGTGCCCCGGATCCCGCCGAGATCGAGTCGGTGCTCGCCGCCGCCGACGGCGCCGTCCGGATGG
+TCACGTTGGCACCCGAGTTGCCCGGAAGCGATGCGGCGATCCGGCGCTTCCGTGACGCCGAAGTGGTTGT
+CGCCGTGGGGCATACGGATGCGACCTACACACAGACCCGACACGCCATCGACCTGGGCGCGACAGTCGGC
+ACCCACCTGTTCAACGCGATGCCGCCGCTGGACCATCGGGCGCCCGGACCCGTGCTGGCGTTGCTGTGCG
+ACCCGCGGGTGACCGTCGAAATCATCGCCGACGGCGTGCACGTGCACCCCGCGGTGGTGCACGCGGTGAT
+CGAAGCCGTCGGTCCCGATCGGGTCGCCGTGGTCACCGACGCGATCGCCGCGGCCGGATGCGGCGATGGC
+GCGTTCCGGCTCGGCACAATGCCGATCGAGGTCGAGTCGAGCGTGGCACGGGTGGCTGGTGCGTCGACGC
+TGGCGGGCAGCACCACCACCATGGATCAGCTCTTCCGGACGGTGGCTGGGCTCGGCTCGAAGTCGGACTC
+AGCCGGCGATGTGGCGCTGGCCGCCGCGGTGCAGGTGACCTCGGCGACGCCGGCCCGCGCTCTCGGGCTC
+ACCGGGGTGGGCCGGCTGGCGGCGGGCTATGCCGCCAATCTTGTTGTGCTGGACCGTGATCTGCGGGTGA
+CGGCCGTCATGGTCAACGATGACTGGCGGGTGGGCTGAGCGTCCGTGGAGGCCCGTCACAATGCCCAGGC
+TCGCACCGTGAGTACTCGGTCAACGTTGACGGTTGCCCCGGCGACCCGGTCACTCTGGCGAGGGCTACCG
+GCGCCGCGCGGCTTGTACCGCAATCATCCGATCGCCGCGAAGCGCTCGGCAGCCGGCTTGGGCGGTAGCC
+GACGACACGGGTACGGTCTCACGGCGCGAGCCTGATAAAGCCCGGCGGCATGGGTCGTGCAGGCGACGGC
+TCTACCGGTCCGTCACCACCGCCGCCACCACCGCTGCCGGCGCCGCCACTGCCGGCAGCGCCCCCGGACT
+GCGGAACACCAGCAGGCGGCTCAACCTCTGGCGGCGGGGGCGGCGGCTGTTGCGGCGGCGCTGGTCGCGG
+TGGCGGCGGTGCCACGATCGGCGGGGGTGGAATCAGGGTCTGCGCCGCCGGCGGCGGTACCGGAATCGGC
+GGCGGATTCGGTATCAGGGGATCCCCCGCGCGAACCGCTCCGAGCACCGAGGCAAGCATCGCACCCGTCG
+GTTCCCGCCATCCCGGCGACATGATGGTCATGTCCGACACCGACGCCCGCAGGTCGCTTCCCGAGTTGAC
+CGCGCTGCGCGTGGACGCCGCAACGCGATGCGTCGGTTCATTCGATCCCGGCTCGAAATTGGCCATGGCG
+AACGCCATCTTGCTGTGATGGTTCGGGCAGTAGATCTCCACTGCCGCACTGATAAATCGGGTCATGGTCG
+TCGTGAGGCGGACAGGGTAGAGGCGCATGACCGGGTCTATGTTGTAGGCATCGTTGCGTAACCCGTCCAC
+AATGTCGTTCACCGGCATGCCGCCATCGAGTTTGCGACACACTTTGTGGGCCGCGTCGATGACGCGAGGC
+ACATTCGCGACGGCGGGGATTTCCTTTTTCTCGAGCAGCGCCAGAAACCGATCGTCTTGGTTTGGGTCGG
+CCGCTGCTGGGCCGTCGTGCAGAATTGCGGCGCCGATCAGCACCACTAAGGCGGCACCCAGGGCGCCGGC
+ATGGCTAGCGATGCCGGTGAACATGATGGGGTTTCCGTTCTGCTAAAAGCCGTTACCTGGCGGGCTTTGG
+ATCGCGATCCACGCCATAGGTGTGGCTGTCTGGTCAGGTTTGACCGGCGCCATGATGTCGTTTCACAGCG
+CCGATGCAGTCTGGGAGGGGACCAGGGCATGGGTGCATTGAGGAGCCAGATCCAGAGAACCACACCGGAG
+CCGCTGGCCGAGGCTCATCCACAAGCCTTCGATCCCGCTCCCGTTGTCGGCATGGGCGCCTGCCGACGGA
+ATCAGCGGATGGTCATAGTGGCGTCGGGCGCCAGGCCTGCGCGGGCACACGCGGTGCGGTGTCGATGGTT
+GTTCTCATCTGGTAACTCCTTTCCGCAGGCCGCAATTCAGCGGTATGGGCTCACCGAGATCAGGCTCGTC
+ACGATCGCCCGCACTGCTGGCGGCTCACATGTACCCAGTGTTAACCTTCTAGTGCACTAGAAGGTCAAGG
+GGAGTCGCATGAAGATCAGCGAGGTAGCCGCGCTCACCAACACCAGCACCAAGACCCTCCGCTTCTACGA
+GAACTCGGGGCTGCTGCCGCCGCCTGCACGCACAGCATCGGGGTATCGCAACTATGGACCCGAGATCGTG
+GATCGGCTGCGGTTTATCCATCGGGGCCAAGCGGCCGGGCTGGCATTACAGGAAGTACGCCAAATCCTGG
+CCATCCACGACCGCGGCGAGGCGCCGTGCGCACACGTCCGCCAACTACTGAGCACCCGCATCGACGAAGT
+CCGCGCGCAGATCGCCGAACTGATTGCCCTCGAAGGCCACTTGCAGACCCTGCTTGACCACGCTTCATAT
+GGCCCGCCCACCGAACACGACCACTCCACGGTGTGTTGGATCCTGGAAAGCGACCTCGATGAGCCCACCG
+CCATCGAGGTCAGCGACATTCACGCCTAGAGGTCGCTGGGTACGCGGGCTGGCCCACGGGTTTTACGCCG
+AAGCCGTCGCCGCCCACGCGGTGGCGAACAGGATCAGCCACGCGGTGACGAACGCGAACACCATCAACCC
+CAGCACCGGCCCGAACACCGCGCCCGCCGGGCTGCGCAACACTATCTGCAGGTAGATCGCCCCCACCTGC
+TTGAACAGCTCGAAGCCGACCGCCGCCATCAACCCGGCCCGCGCCGCGGTGACCAAACCGACCGGCTCCC
+GCGGCAGCCGGCCAATCATCCAGGTGAACAGCACCCACGACACCAGCACCGATACCAGCACCGAGATGCC
+CCGAAAGATCTCGTCGAACACTGAAAACTGGGGTATTTCAAGCCATCTCAGTACCGCAGCCATCGGCCTG
+GCATGGCCGAGCACGGTGAGCGCGATGGTGGCCACGATCACCACGAACGTCCCCACCATGGCCGCTAGAT
+CCGACAGTTTGGTGCGCAAGTAGCCCGCCGGAGCGACTGGATGTGCCCACATCTGGCTCAACGCTTCCCG
+CAGGTGCCACATCCAGCCCAGGCCCACCCAGGCCGCGGTCGCCAGACCGATCACCCCGACCGACGCGCGT
+GCATCGATCGCCGAATTCATCAGGTCGACCAGCTGCTGTCCCACCGCACCGGAGACCGAGGTGCGGATGC
+GCTCCTCGAGCGTGGTCAGCAGCTCCGGACGACGCGACAACGCGAATCCACCCACCCCGAAACCGACCAT
+CAGCAAAGGAAATATCGCAAAGATCGTGTAGTAGGTGAGTCCGGCCGCAAAAAGACTGCCGTTGCGATCG
+TTAAAGCGCGTGAACGCACGCACGACATGGTCCAACCACCCGAACCGGGCCCGCAGCCGGTCAAGCACCC
+CTGGCTCGGCGAGCTCGCCCATGATCGACTGCCCTACCCCCGTTATAGAAGGAACCCGAGCCGATCGTAG
+ACTCGCTGAACCGTTTTGCTGGCCACATCGTGGGCGCGCTGCGCCCCGGCGGCGAGCACGGCCTCCAGCT
+CCGCGGGATCTGCGGTCAATTCGTCAACTCTGGCTTGGATCGGGTTGACGAATTCGACGACGGCCTCGGC
+GGTGTCTTTCTTCAAATCGCCGTAGCCGTGTCCGGCATAGCCGTCGACGAGAACGTCGATGTCGGTCCCG
+GTGACCGCCGACTGGATGTTCAACAGGTTAGACACCCCTGGCTTGACGTCCGGGTCATAGCGGATGTCAC
+GTTCGCTGTCGGTCACGGCGGAGCGAATCTTCTTGGCGGACAATGCCGGATCGTCGAGCAGGTTGATCAA
+ACCGGCATCGGTGCCCGCCGATTTGCTCATCTTTGACGTCGGGTCTTGTAGATCGTAGATTTTGGCGGTC
+ATCTTGGGGATGAGCACGTCGGGAACCACCAGGGTGCCGGGGAATCGGCTGTTGAACCGTTGCGCGACGT
+CGCGGGCCAGCTCGAGGTGCTGCCGCTGATCCTCCCCGACGGGCACCAGCTCGGTGTCGTAGGCCAACAC
+GTCCGCGGCCTGCAGTACCGGGTAGGTGAACAGGCCGACGGTGGTGGCCTCGCTGCCCTGACGCGCCGAC
+TTGTCTTTGAACTGGGTCATCCGCGACGCCTGGCCAAAGCCGGTGAAACAACCCAGCACCCACGCCAGCT
+GGGTGTGAGCCGGCACCTGACTTTGCACGAAGATGGTGGCGCGGCCGGGATCGATTCCCAACGCCAGGTA
+TTGCGCGGCGGTAATCAGGGTCCGGCGCCGCAGTGCCTCGGGATCCTGAGGGATGGTGATCGCATGCAGG
+TCGACCACGCAGAAGAACGCATCGTGGTCATCCTGCAAGCCAACCCATTGGGCGACGGCGCCCAAGGCAT
+TACCGAGGTGAAGCGAGTCAGACGTGGGCTGCACGCCGGAGAAGATCCGGCGGGACCCGGTAGGGGTGCT
+CATGATGCCCCGATCCTTTCACGCGGGGTGCCCTCCCCGTCGACCACCGGTCACCACGCTGCTTGCGGTA
+CCGGCGGTACCGGCTTTAGTGTCGGCTCTATGCGCAGTCCGATACGCGTGGGTTCGGGAGAGCCGGTCCT
+ACTGCTACACCCGTTCTTGATGTCCCAAACGGTGTGGGAGAAGGTCGCCCAGCAGCTGGCCGACACCGGC
+CGCTTCGAGGTATTTGCCCCCACGATGGCCGGCCACAACGGCGGACCGGCCTCGGGCACCCGGTTTTTGT
+CCTCGGCGGTGCTGGCCGACCACGTCGAACGCCAGCTCGACGAACTGGGCTGGGAAACCAGCCATATCGT
+CGGCAACTCGTTGGGCGGCTGGGTCGCGTTCGAACTCGAACGACGTGGCCGGGCACGCAGCGTGACCGGT
+ATCGCCCCGGCGGGCGGTTGGACCCGCTGGAGTCCGGTCAAGTTCGAAGTGATCGCTAAGTTCATCGCAG
+GGGCGCCGATCTTGGCCGTCGCCCACATTCTTGGCCAACGGGCGCTTCGGCTGCCGTTCAGCCGCCTGCT
+GGCCACCCTGCCGATCAGCGCCACACCGGACGGCGTGAGCGAGCGCGAGCTGTCCGGCATCATCGACGAC
+GCCGCGCACTGCCCGGCCTATTTTCAGCTGCTGGTCAAGGCGCTGGTGCTGCCCGGGCTGCAGGAGTTGG
+AACACACCGCCGTGCCCTCGCACGTGGTGCTGTGCGAGCAGGACCGGGTGGTCCCTCCCAGCAGGTTCAG
+CCGTCATTTCACCGACTCACTGCCGGCGGGCCACCGGCTCACCGTGCTCGACGGCGTCGGTCACGTTCCG
+ATGTTCGAGGCTCCGGGGCGCATCACTGAGCTGATCACCAGCTTCATCGAAGAGTGCTGCCCGCATGTCC
+GGGCCAGTTAGCGGGCGCGAGCAGACGCAAAATCGCCCATTTCGGCACGAAATTGGGCGATTTTGCGTCT
+GCTCGCCCTAATTGGCCAGCTCCTTTTCCAGGTTGTCGGCGATCGCATCGAGGAATTCCTCGCTATTCAG
+CCAGTCCTGCTCCGGACCGATGAGGATCGCGAGGTCCTTGGTCATCTTCCCGCTCTCCACCGTGGCGATG
+ACGACGGACTCCAGCTTGTGGGCGAAGTCGATGACTTCGGGAGTGCCATCCAGCTTGCCGCGATGCTGTA
+ATCCGCGGGTCCAGGCAAAGATCGACGCGATCGGGTTTGTTGAGGTCGGTTTACCGGCCTGATACTGCCG
+GTAATGCCGGGTGACGGTGCCGTGGGCGGCTTCGGCCTCGACTGTCTTGCCGTCGGCCGTCATCAGCACC
+GACGTCATCAGGCCCAGCGAGCCGTAGCCCTGTGCGACGGTGTCCGACTGCACGTCGCCGTCGTAGTTCT
+TGCACGCCCAGACGTAACCGCCTTCCCATTTCAGGCAGGCGGCGACCATGTCGTCGATCAACCGATGCTC
+GTAGGTCAGCCCCGCCGCTTCGAACTGCGCCTTGAATTCCTCTTCGTAGACGCGCTCGAACTCGTCTTTG
+AACATCCCGTCGTAGGCCTTGAGGATGGTGTTCTTGGTGGACAGATATACCGGCCATTTCGCGTTGAGGC
+CGTAGGAGAACGACGCGCGCGCGAAATCCCGGATGGATTCCTTGAAGTTGTACATCCCCAGCACGACGCC
+GCCGTCCTCGGGGATGGACACCATTTCGTGCACGATCGGCGCGCTGCCGTCGGCGGGCGTGAAAGTCAGT
+GTGACGGTGCCCGGTTGGTCGACCTTGAAGTTCGTCGCCCGATATTGGTCACCAAAAGCGTGCCGGCCGA
+TGACGATCGGCTTGGTCCACCCCGGAACCAGTCGCGGCACATTAGAAATCACGATAGGTTCGCGAAAGAT
+TGTGCCGCCCAAGATGTTCCGGATTGTCCCATTGGGCGACAGCCACATCTTCTTCAGGTTGAATTCCTCG
+ACACGGGCCTCGTCGGGGGTGATCGTCGCGCACTTTACGCCCACACCGTGTTTCTTGATCGCATACGCCG
+CGTCGATCGTCACCTGGTCGTCGGTGGCGTCGCGGTGCTCGATGCCCAAGTCGTAATAGTCCAAGCGGAT
+GTCGAGATAGGGAAGGATAAGCATGTCCTTGATGAGCTTCCAGATGACACGGGTCATCTCGTCACCGTCG
+AGCTCTACGACCGGACCGCTGACTTTTATCTTGGGTGCGTTGGACATGGGAGTCCACATCAGATTACTAG
+CAGCCCGCGCGGGCCCCTAGCGGCCGGTAAAGGGCCAGTTGAGACCGCCGGAGTTGTGCTTTGAGTTGGC
+ACTGAGTAGCTGCCATGCGCTAGGCTTCGAGTCGGTCATGAGCGCCAGCGTCAAGCCCCGGCTTGCTGGC
+CGGCAACCCTCCAACCGCGGTGGGGTGCCCCGGGTGATGACCAGGTTGAGTAGCCATCGCCGGCTGCGCG
+GCAAGCGCGGGTCCGCCATGACGGGCCCCTGACCAGACGGGGAAAGCTCATGAGCGCCGACAGCAATAGC
+ACCGACGCCGATCCGACCGCGCATTGGTCGTTCGAAACCAAACAGATACACGCTGGTCAGCACCCTGATC
+CGACCACCAACGCCCGGGCTCTGCCGATCTATGCGACCACGTCGTACACCTTCGACGACACCGCGCACGC
+CGCCGCCCTGTTCGGACTGGAAATTCCGGGCAATATCTACACCCGGATCGGCAACCCCACCACCGACGTC
+GTCGAGCAGCGCATCGCCGCGCTCGAGGGCGGTGTGGCCGCGCTGTTCCTGTCGTCGGGGCAGGCCGCGG
+AGACGTTCGCCATCTTGAACCTGGCCGGCGCGGGCGATCACATCGTGTCCAGCCCGCGCCTGTACGGCGG
+CACCTACAACCTGTTCCACTATTCGCTGGCCAAGCTCGGCATCGAGGTCAGCTTCGTCGACGATCCGGAC
+GATCTGGACACCTGGCAGGCGGCGGTACGGCCCAACACCAAGGCGTTCTTCGCCGAGACCATCTCCAACC
+CGCAGATCGACCTGCTGGACACCCCGGCGGTTTCCGAGGTCGCCCATCGCAACGGGGTGCCGTTGATCGT
+CGACAACACCATCGCCACGCCATACCTGATCCAACCGTTGGCCCAGGGCGCCGACATCGTCGTGCATTCG
+GCCACCAAGTACCTGGGCGGGCACGGTGCCGCCATCGCGGGTGTGATCGTCGACGGCGGCAACTTCGATT
+GGACCCAGGGCCGCTTCCCCGGCTTCACCACCCCCGACCCCAGCTACCACGGCGTGGTGTTCGCCGAGCT
+GGGTCCACCGGCGTTTGCGCTCAAAGCTCGAGTGCAGCTGCTCCGTGACTACGGCTCGGCGGCTTCGCCG
+TTCAACGCGTTCTTGGTGGCGCAGGGTCTGGAAACGCTGAGCCTGCGGATCGAGCGGCACGTCGCCAACG
+CGCAGCGCGTCGCCGAGTTCCTGGCCGCCCGCGACGACGTGCTTTCGGTCAACTATGCGGGGCTGCCCTC
+CTCGCCCTGGCATGAGCGGGCCAAGAGGCTGGCGCCCAAGGGAACCGGGGCCGTGCTGTCCTTCGAGTTG
+GCCGGCGGCATCGAGGCCGGCAAGGCATTCGTGAACGCGTTGAAGCTGCACAGCCACGTCGCCAACATCG
+GTGACGTGCGCTCGCTGGTGATCCACCCGGCATCGACCACTCATGCCCAGCTGAGCCCGGCCGAGCAGCT
+GGCGACCGGGGTCAGCCCGGGCCTGGTGCGTTTGGCTGTGGGCATCGAAGGTATCGACGATATCCTGGCC
+GACCTGGAGCTTGGCTTTGCCGCGGCCCGCAGATTCAGCGCCGACCCGCAGTCCGTGGCGGCGTTCTGAG
+GAATTCTGACATGACGATCTCCGATGTACCCACCCAGACGCTGCCCGCCGAAGGCGAAATCGGCCTGATA
+GACGTCGGCTCGCTGCAACTGGAAAGCGGGGCGGTGATCGACGATGTCTGTATCGCCGTGCAACGCTGGG
+GCAAATTGTCGCCCGCACGGGACAACGTGGTGGTGGTCTTGCACGCGCTCACCGGCGACTCGCACATCAC
+TGGACCCGCCGGACCCGGCCACCCCACCCCCGGCTGGTGGGACGGGGTGGCCGGGCCGGGTGCGCCGATT
+GACACCACCCGCTGGTGCGCGGTAGCTACCAATGTGCTCGGCGGCTGCCGCGGCTCCACCGGGCCCAGCT
+CGCTTGCCCGCGACGGAAAGCCTTGGGGCTCAAGATTTCCGCTGATCTCGATACGTGACCAGGTGCAGGC
+GGACGTCGCGGCGCTGGCCGCGCTGGGCATCACCGAGGTCGCCGCCGTCGTCGGCGGCTCCATGGGCGGC
+GCCCGGGCCCTGGAATGGGTGGTCGGCTACCCGGATCGGGTCCGAGCCGGATTGCTGCTGGCGGTCGGTG
+CGCGTGCCACCGCAGACCAGATCGGCACGCAGACAACGCAAATCGCGGCCATCAAAGCCGACCCGGACTG
+GCAGAGCGGCGACTACCACGAGACGGGGAGGGCACCAGACGCCGGGCTGCGACTCGCCCGCCGCTTCGCG
+CACCTCACCTACCGCGGCGAGATCGAGCTCGACACCCGGTTCGCCAACCACAACCAGGGCAACGAGGATC
+CGACGGCCGGCGGGCGCTACGCGGTGCAAAGTTATCTGGAACACCAAGGAGACAAACTGTTATCCCGGTT
+CGACGCCGGCAGCTACGTGATTCTCACCGAGGCGCTCAACAGCCACGACGTCGGCCGCGGCCGCGGCGGG
+GTCTCCGCGGCTCTGCGCGCCTGCCCGGTGCCGGTGGTGGTGGGCGGCATCACCTCCGACCGGCTCTACC
+CGCTGCGCCTGCAGCAGGAGCTGGCCGACCTGCTGCCGGGCTGCGCCGGGCTGCGAGTCGTCGAGTCGGT
+CTACGGACACGACGGCTTCCTGGTGGAAACCGAGGCCGTGGGCGAATTGATCCGCCAGACACTGGGATTG
+GCTGATCGTGAAGGCGCGTGTCGGCGGTGACGTGCTCCCGACGCGACATGTCCCTGTCGTTTGGCTCCGC
+GGTCGGCGCCTACGAGCGCGGGCGCCCCTCGTATCCACCGGAAGCCATCGACTGGCTGCTGCCGGCCGCC
+GCCCGCCGCGTGCTCGACCTGGGAGCGGGCACCGGCAAGCTGACCACCCGGCTAGTCGAGCGCGGCCTGG
+ACGTGGTTGCCGTCGACCCGATCCCGGAGATGCTGGACGTGCTGCGTGCTGCGCTGCCGCAAACCGTCGC
+GCTGCTGGGCACCGCCGAAGAGATTCCGTTGGACGACAACAGCGTTGACGCGGTGTTGGTGGCTCAGGCG
+TGGCACTGGGTGGATCCCGCCCGGGCGATTCCGGAGGTCGCCCGGGTGTTGCGTCCGGGCGGGCGGCTCG
+GCCTGGTGTGGAACACCCGCGACGAACGGCTGGGCTGGGTGCGCGAGCTGGGTGAGATCATCGGTCGCGA
+CGGCGATCCGGTGCGCGACAGGGTGACGCTGCCCGAGCCGTTCACTACGGTGCAGCGCCATCAGGTCGAG
+TGGACGAATTACCTGACACCACAAGCCCTTATCGACCTGGTGGCTTCGCGCAGCTATTGCATCACCTCAC
+CGGCGCAGGTCCGCACCAAAACGCTCGACCGGGTGCGGCAGTTGCTGGCCACCCATCCGGCGCTGGCGAA
+TAGCAACGGCCTGGCGCTGCCCTACGTCACGGTCTGTGTGCGGGCGACTCTGGCCTGACGCCGCCTTTAG
+GGCCCGGTGCCGGTGTAAATCAGGCCCGCCAGTTGCTGGCCGACGTTGCCGAAGCCGGAGACCAGGGCCG
+AGGTGATCAGGCCCAGCGCGCCGGTGTTGTACACACCCGAGATGTCCGCGCCGCGGTTGAGGATGCCGGA
+GAGTTGGGTGCCGAAGTTGGCGAAGCCCGACGCCGATCCGAGCAGCGGATCCGAGATCGCGTTGAGCACG
+CCCGACATGCCCGCGCCGAGGTTGTGGAAGCCCGACAACCCGCCGCCACCGCCGATGTTGAAGAACCCCG
+ACGACGGGACCGCGGTGGTGTTGCCGAATCCCGGGACGGGCGGGATGACCAACCCGGCGTTGATGGGGCC
+GAGCAGCGCGTTGACGTCGAGAACCACTGGGATTCGGTCGATGGTGATCTCCAGAGGGAAGGCGAAGGCG
+GGGGTGGCGCCGGACAACGCGAGGCCCAGCGGGAGTTGGGGAATGGTGATTTCCGGGCTCACGAAGGGTC
+CGATGGTGACGGACAGGGGCAGCTCGACATGGATTGGATCGACGGGTATGTGGAATCCCGGGATGGTGAT
+TTCCGGTGTTAGATGGGTCACGCCAAGCGAACTCAGCAGCACGGTGAATGGCAGAATCTCGCTGGGCGCC
+GTTTGGATGGCGGGGACATTAACGTTGATGAACCCCAGCAGCGTAAGGCTGAATGGATCGATGATGGAGC
+CTGAGCTGAATATCGGGCCCACGGTGACACCGGTTGCGGGGTCGAGTCCCAGGGCGGGAATCGTGATGTC
+CTGGACGGTGATGGGGCCGAGGTCGAAGACTGGGTCGATGCGAACCGTGATCGGGGAAATGGACACCGGC
+GGGATGGTGAAGCCGCCGATGTGGCCGGTTGCGCTGAGGTCCAAGGGAATTGCCGGAAATTGGATCGACG
+GAACGATGATGGGTCCGGCGCCGCCGGACGCGTGGATGTTCGCGACAGTGAATTCGGGAATGATGGTGCT
+GGTGTAGGAGAAGCCGAGCAGGCCCTGGTAGTCGCCCCGCCAGAAGGCGCCGTTGCTGTAGTTGCCGGAG
+ATGAAGGCGCCGGTGTTGACGTCGCCGGAGTTGGCCACCCCGGTGTTGGTGTCACCGGTGTTCAACCAAC
+CCGTGTTGACACTGCCCGGGTTGAAACCGCCCGTATTGGCCTGCCCCGCGTTGAAACTGCCGGTGTTGTA
+GCTACCCGCATTGACCACACCCGTATTGAACCCACCCGCGTTGAACAACCCCGTGCTGGCAATCCCCGAA
+TTACCGATCCCGGTATTATAACTCCCCGAATTGAACACCCCCCAGTTCCCGGTGCCAGAGTTAAAGAACC
+CCACATTACCGGTCCCCGAATTAAACAACCCCACATTCCCGCTACCGGTATTGAAACCACCGAACCCGGT
+CAGATTATCACCGGTCAACCCAATACCGAAATTCCCACTGCCGGTGTTAGCGAACCCAATATTGCCCACA
+CCCATATTCGCCAAACCGAAATTGTAGCTGCCGGCATTACCAAACCCGATATTACCCAAACCCATCAGAC
+CCGGCGTTAACCCCGAATTCCCGAGCCCAAAGTTGCCCCACCCGACATTGCCCAACCCGACATTGTTGCC
+GCCGATATTGCCGCCACCCACATTGAACCCACCGACGTTGCCCGCACCCAGGTTAAAGTCCCCGACATTG
+CCCAACCCGACATTGCCCAACCCCACATCGGCCAACCCGAAATTGAGGACCAGACCCTGATGCAGCGCCG
+TCCCGCTCGCCAACAATCCCGACAACTGCTGACCGACACTACCCAAACCCGACACCAACGCCGGCGCACC
+CAACCCCAACACGCTGGTGTTGAACAGCCCCGACATGCCAGAGCCGAAATTCAGCACACCCGAATGCAGC
+GTGCCGGCGTTGAAAACACCCGAACCCCCACCCAGCAACGCCGACGGAGCCTGATTCCAGCCACCCGACA
+CCATCGCGCCGACATTCCCAAACCCCGACACCCCACCCGCACCGGAGTTGAAGAAACCCGACGACGGAGC
+ACCGGTCGTATTCCCGAACCCCGGCACGGCGGGAAGGTCGATGAGGATGTGAACGGGGCCGAGCGTGCTG
+TGGGCCACGAGGTCAAAGGGGATTTCGCCGATGGTGATTGCCGGAATGGTGACGGCGCCGGTGCCACCGG
+ACAGGTTGATGCTCAGCGGGTTCATCGCGGGGATCGTGAGGCCGCCCGGGAAGATGTCGACGGGCTCGCT
+GTGGCCGGTAATGCTGGCCAGCAGCGGGATCTCGTCAATGGTGACGACGGGGGTGCTGAACGGCAGGTTG
+GCCAGGAAAGCCGTGATGGTCCCTTGCGACGAGCTAGCACCGATGACTATCTGGCTTAACGCCAGGGGGG
+TAAGGCCGATGGGGGTGTTGAAGAGTCCCGTAATCGGACCGATTTTCAGGGGCCCGCCGGGTTGTGAGCC
+AAACAAGTAATTCAGCGTGACGGGCACCCGTGGAATATCGAGGTGCGGGACGGTGATGGGGCCGAGGCCG
+ACGCTGACCGTGGTGGCGGCCAGGTCGATCTGGGGAATCGGGATGCTCGGCACAGTGAAGCTGTCGATGG
+CGACGTTGGCGCTGAACTCGGGGCGGATCGCGGGAATGTCGATGGCGGGGATAACGACGGAGCCCAGTCC
+GCCGGTGAGGGTGAGGTCCAGGAACGGCGTTTGGGGAAGCACGGCGGGGCGGTAGGAGAAGCCGAGCAGG
+CCCTGGTAGTCGCCCCGCCACAAGACGCCGTTGCTGTAGTTACCGGAGATGAAGGCGCCGGTGTTGACGT
+CGCCGGAGTTGGCCACCCCGGTGTTGGTGTCACCGGTGTTCAACCAACCCGTGTTGACACTGCCCGGGTT
+GAAACCGCCGGTATTGGCCTGCCCCGCGTTGAAACTGCCGGTGTTGTAGCTACCCGCATTGACCACACCC
+GTATTGAACCCACCCGCGTTGAACAACCCCGTGCTGGCAATCCCCGAATTACCGATCCCGGTGTTATAGC
+TCCCCGAATTGAACACCCCCCAGTTCCCGGTGCCGGAGTTAAAGAACCCCACATTACCGGTCCCCGAATT
+AAACAACCCCACATTCCCGCTACCGGTATTGAAACCACCGAACCCGGTCAGATTATCACCGGTCAACCCA
+ATACCGAAATTCCCACTGCCGGTGTTAGCGAACCCAATATTGCCCACACCCATATTCGCCAAACCGAAAT
+TGTAGCTGCCGGCATTACCAAACCCGATATTACCCAGACCCATCAGACCCGGCGTTAACCCCGAATTCGC
+CAACCCGACATTGCCAAACCCGACATTGCCCAACCCGACATTGTTGCCACCGATATTGCCGCCGCCCACG
+TTGTAGCTCCCGACGTTGCCGGCCCCCACGTTGTAGCTGCCGACGTTGCCGCTTCCCGCGTTGAAGAGGC
+CAACGTTGGCCAAACCCAGATTGACGGCGAGCGACTTGGCCGGCTCGGCGGCGGCCGCCAGGCTTGCCAG
+CGGCGAGCCAAACGGCGCCAACGCCTCGGCCGCCGCCGAGGCGCCGGTGTGGTACCCCAGCATCGCGGCC
+ACGTCCTGGGCCCACATCAGCTCGTAGTCGAACTCCGCGGCCGCGATCGCCGGCGTGTTCTGGCCGAACA
+GATTCGATAACGCCAGCGACACTAACCTCGACCGATTGGCCGCGATGACGAAGGGGTCCACCGTCGCGGC
+CAACGCCGCCTCGAACACACCCACCACCGCCCGGGCCTGCCCGGCCGCCGACTCGGCGGAGGCCGCCGCC
+GCGCTCAACCACCCCGCATACGGGGCGGCCGCCGCCGCCATCGCGACCGAGGACGGCCCCTGCCAGATAC
+CACCGACCAGCCCCGAGGTCACCGACCCGAAAGCCGCCGCCGCCGAGCCCAGCTCGGCGGCCAGCTCATC
+CCAGGCCGCGGCCGCCGCCAACAGGGGGCCCGGACCCGCCCCGGTATATATCAGCAGGGAGTTGATCTCT
+GGCGGCATTACGACAAAACTCATGCCGCCAGCCCTTTCCCGTGCGTTCCCAACATCGCTGTCAACCGGTG
+ATCAGGGTGTTGCGCCGGCGCCGCCGAGGCCGCCGTCGCCGCCGAACCCTGGCTCCGTGCCTGAGTTGGG
+CTGGCCGGCCTGCCCTTTGCCGCCGGCGCCGCCGGCCTTGGCGCCGCTGTTGCCGCCGTTGCCGCCGTCA
+CCGCCGTCACCGCCGTCACCGCCGAGGCCGGTCGCGCTCTGAGTGCCGCCGCCAATGCCGCCCTGGCCAC
+CCTTACCGCCGTTGCCACCGAAGCCGCCGTCCGGGGCGTTGCCTCCGCCACCGCCCGCGCCGCCAAGGCC
+GCCGTTGCCGCCGGTGGAGCCGCCGCCATTGCCGCCCTGCCCACCGAGGCCGCCCTGGCCGCCGGCACCG
+GCAAAGACGCCGTCGCCGCCCCGGCCGCCGACACCGCCGTTGCCGCCGCCACCGGCCACGGTGCCGACGG
+TACCGCCGCCGTTGGGGCCGCCCTGACCGCCGTCGCCGCCGAAGCCGCCCTTGCCGCCGAAAAAGCCGCT
+GCCGCCGGCGCCGCCGGCGCCGCCGCCACCGCCGCTGCCGCCTTGGGTGACGGAGCTGTTGCCGCCGACG
+CCGTCACCGCCGTGGCCACCGTCGCCGCCCTTGCCGCCCTCGCCGGAGCTAAGGCTGCCGTTTCCGCCGG
+CGCCGCCAGCGCCACCGGCCCCACCGGAACCGCCGACGATGCCGCTGTTGGCGCCGATCGAGCCCCCGTT
+GCCGCCGGCACCGCCGTTGCCGCCCTTGCCGCCGTCGCCACCTGAGCCGTTGGGGTTGCTGCCACCGGCG
+CCGCCCTTGCCGCCGTTGCCGCCGGGGGCGCCCGTGACCCCGATGGAGGCGGGGCCGCTGGTAGCGCCGA
+AGCTCCCATCACCGCCATTGCCACCGGCGCCGCCCTTGCCGCCTGAGCCGGTGGCGTTACCCCCGGCGCC
+ACCGTTGCCGCCGGAGCCGCCGGCGCCGCCGCGGCTGCCGCTGCCCGGGTTGGTGGCAGGCCCACCGTGG
+TCACCGTTGCCCCCGTCGCCGCCCTTGCCGCCAAGCACGACGCCGGTGCCGCCGGCGCCGCCGTTGCCGC
+CGTTGCCGCCGGCGCCGCCGCCAATGCCGCTGCCGCTGCCCCCGGTGCCACCGAACCCACCCTGGCCACC
+TGCGCCGCCGGCGCCGCCCGTGTCGCCGCTGCCGCCGGCGCCGCCGTGGCCGCCGTTACCGGCGTTGCCA
+CCGCGAGCGTTGCCGTTGCTGGAACCGCCGTTGGCGCCAGCGCCGCCCTTGCCGCCCGCGCCGCCGGTGG
+AGCCAGGGCCGACACCGTCGCCGCCCTTGCCGCCATTGCCGCCTGAGCCGGCGTTGCCGGCATCGCCACC
+GCCACCGTTGCCGCCGGCACCGCCGTTGCCACCGGCACCACCGGCGCCGCCGTTGCCGGCCGAGCCAGCG
+CCGCCGTTGCCACCGGCACCACCGCTGCCGCCGTGGCCGCCGGACTGGCCTGTGCTCAGGCTGCCCCCGC
+CAGCACCGGCGCCGCCGTTGCCGCCGGCCGCGCCGGCGCCGCCCGTGGTGCCGCTGCCACCGCTGCCGCC
+GCTGCCGCCGTTGCCGCCGCTGCCGCCGTGGCCGGCGGCGCTGGAAGTGCCGCCGCCGTTGCCGCCGGCG
+CCGGCGGCACCACCGGCCAAGCCCGCGACGCCGGTGCTGTTGCCGGAGTTGCCGCCGTTGCCGCCGTTGC
+CGCCGTGGCCGGCGGTGACGTTGACGACGCCTGAGCCGCTGGCGGCACCGCTGCTGCCGTTGCCGCCCTT
+GCCGCCGGCGCCGCCCGTCGTGCCGTCGCCGCCGTGGCCGCCGTTGCCGCCGTTGCCGCCGTCGCCGCCC
+ACAGCGTTGCCGAAGGACACGCCGGCGACACCCGCGTTGCCGCCGGCCCCGCCAGCACCGCCCGCGCCGT
+TGAGGCCAGTGCCCCCATTACCGCCGGCACCACCGGAGCCGGCGTTGCCGGTGGTCGTGCTTTTGCTGCT
+ACCGCCGTTACCGCCAGCGCCACCGGCCCCTCCGGCACCGCCCGCGTCGGTGCCGATACCGCCATTGCCG
+CCCGCGCCGCCGAAGCCGCCGTTGCCGCCCTGGCCGCCTAAGGAAATGCCGCCACCGCCGTCGCCGCCGC
+TACCGCCGTTGCCGCCTGTGCGCCCTTCCCCGCCGATGCCGCCCTGGCCGCCGAAGCCGCCGACCCCGCC
+GGCACCGCCGTCCCCGCCGGCGCCGCCGACACCGCCAACACCGCTAGCAAAGTCGCCCGCGCCGCCGGGA
+CCGCCGGCGCCGCCTGGGCCACCCAACCCGGTGCTAGCGAAGCCGCCGGCACCGCCATTGCCGCCAGCGC
+CGCCCGTTGTCGCGGCGACGTCAACGGCGCCGCCACCGCCGGCGCCGCCGAAGCCGCCGAGGCCGCCGTT
+GATCATGCCGGCACCGCCATTGCCGCCGTTACCGCCTTTGCCGCCCGTGCCGAAGAAGCCGGCCTGGTTC
+AGCGCCCCACCGCCGTTGCCGCCGTTGCCGGCGTCACCGCCGTTGAGGCCGGAGCCGCCGTTGCCGCCGT
+TGCCGCCGGCCGCGCCGCTCCCGTTGCCGGCGGTGCCGCCCTTGCCGCCGTTGCCGCCATTGCCGCCGTT
+ACCGCCGTTGGGGGTGATGCCGTCGGTGCCGTCCAAGCCCGTCAAGGAGCCGGTGCCGGCCTTGCCTCCG
+GTGCCGCCGACGCCGGCGTTGCCGCCGTTGCCGCCGTTGCCGCCGGTACCGGGGTTTCCTACGGTGCCGC
+CGCCCGGCAGCATGGCCCCGCTGTTTAGGCCGTTTGCGCCGGCCCCGCCGTCACCGGCTTTGCCGCCATC
+GCCGCCGTTGCCGCCGTCGCCGCCGGTGCCCGTGGCGCCGTCGGTGTACCCGGCCGCCTGCGCCTTGCCG
+CCCGCGCCGCCATTGCCGCCGGCGCCGCCGTCGCCACCGTTACCACCGCTACCGCCGTTCTCGCCGTTTG
+CGCCGTTAGCATTGGGGCCGGCGCCGTCGGCGCCTCTCTCGCCGGCGCCGCCGATGCCACCCTGGCCGCC
+GTTAACACCCTTACCACCGTTGCCGCCGTGGCCGGCCAGTGTTCCGCCGGCGCCGCCCGCCCCGCCGTTG
+CCGCCAGCCCCACCGTCGGTGCCCGAGGTGCCGGAATCACCGCTGGTAGGGCCCGGCGTACCGGCTTGGC
+CGGCCGCGCCGTTGCCGCCGGCCCCGCCATTGCCGCCATTGCCGACATTCCCGCCGCTGCCGCCCTTGCC
+GCCGTCACCGCCGTTGCCGCCCGCGACGGTGGGGCTGGCGCCGTTGCCGCCGTTGCCGCCGTCACCGCCG
+CTGGTGGGTGCGGTGCCATCGGCGCCGGTCGCACCCTTCATGGCTGGAATGGCGCCCTTGCCGCCGGCCC
+CACCCTGGCCGGCAACGCCCACATTGCCGCCGTTGCCGCCGGCACCGCCGGCGCCCTGGTTGATGGCCAA
+GGTCACGTCACCGGCGGCGCCGCCGCCGCCATTACCGGCGGCGCCGCCGTTGCCGCCGGCACCGCCGTTG
+CCGGCCTTAGCGAACGTGGCGAAGGCGTCACCACCCTTGCCGCCGATGCCGCCGTTGCCGCCGTTGCCGC
+CCTGTCCGCCATTCGCGCCATTGGCGGACGCGGAGAAGTCTTGGCCGTTGGCTCCGGCGCCCCCGTTGCC
+GCCCTTGCCGCCGTCCCCGCCCGTGCCGGCCGCCGATCCGCCGTTGCCGCCGATGCCGCCGTTGCCGCCG
+TTGAGGGCAAGGCCGGTGCCGGCGACGCCATTTCCGCCGGCACCACCCGCACCGCCGTTACCGACCGACC
+CGCCATGGCCGCCGTTACCACCGGCGCCGCCGTTTTCTCCCGCGACGGTGGGGGTGGCGCCGGCACCTCC
+GTTGCCACCGTTGCCGCCGCTGGTGGGCGCGGTGCCGTTCGCCCCGGCCGAACCGTTCAGGGCCGGGTTC
+GCGCTAACACCGCCGGCCCCACCCTTGCCGCCAACGCCCACTTCACCGCCGTTGCCGCCGTCACCGCCGG
+CACCCTGGTTGACGGCCAAGGTCACATCACCGGCGGCACCGGCTCCGCCATCACCGGCCTTGCCGCCGTC
+ACCGCCGGCGCCGCCGTCCCCGGCCTTGCCGGCGGTGCCGGCGACCGCGGTGCCGCCGGCGCCGCCACCA
+CCGCCGTCACCGCCCTTGCCGCCGTTGCCGCCCATACCGCCATCGGCACCGGGCGAACCCAAGGTGGCGG
+CGTCGAATCCGTTTCCGCCGGCGCCGCCGCTACCGCCGGCACCGCCCTTGCCGCCGACGCCGCCGTCGCC
+GTGCTGGGCGCCGCCATTTCCGCCATTACCGCCGTGGCCCCCGGCGCCGCCATTGGTGCCGTTACCGCCC
+GTCGGTTGTAAGGCGGTACCGGTAGCGCCGGTGGAACCCGCATGACCGGCACCGCCGGCGCCGCCGGTGC
+CGCCGTTGCCGACCAACCCGCCATGACCGCCATTACCGCCGGCCCCGCCGGCTTGTAGGGGTGAGTTGGC
+GGTGGCGCCGATGCCGCCATCGCCGCCGTTGCCGCCGCTGGTGGGGGTGGCGCCGGCGGCACCGTGCGCA
+CCCGCCAGCAGGCCGCCGGCCCCACCGGCCCCGCCCACGCCGGGGTTGCCGCCGTGACCGCCGTTACCGC
+CGGCACCGTTGTTGACGGCGAAACTCGGATCGCCAGCGCCGCCCTTACCACCGTCGCCGCCGACGCCGCC
+GGCCCCGCCGGCCCCGCCGTTGCCAACCAATAACCCGCCGCGCCCGCCGTTGCCGCCGGTTCCGCCGTTG
+CCGCCGTCGCTGCCGTCGCCGCCGTTGAGGCCGGCGGCACCCGGCAGGCCCGCGGCCCCGGCCCCCCGGC
+GCCGCCGTTCCCGAACAGCCCGGCGTCGCCACCGTTGCCGCCTATACCTCCGATGCCGCCGATCCCGCCG
+GCGCCGCCGTTGCCGTAGACAAATCCGCCGGACCCGCCGACGCCACCATTGGTGCCGGCGCCGCCGGACC
+CGCCGGCCCCGAACAACCAGGCGTTGCCGCCGGCACCACCGTTAGCGCCGGTCCCGCCGGCCCCGCCGGC
+CCCGCCGTTGCCGTTCAACCACCCGCCGGATCCGCCGACACCGCCGGCAGCGCCGGCCCCGCCGGACCCG
+CCGGACCCGCCGTTGCCGAACAACCCGGCCGCGCCGCCGGGCCCACCGACTTGACCGGCCGCCCCCGAAC
+CGCCGTTACCGCCATTACCCCACAACAACCCCCCGGCCCCACCGGGCTGCCCGGTCCCCGGCGCCCCGTG
+AACGCCATCACCGATCAGCGGGCGCCCCAACCACAGCTGTGTGGGCGCGTTGATCGCACCCAACACTTGC
+TGCTCCAGCGCCTGCAGCGGTGATGCATTCGCCGCCTCGGCAGTCGCATACGCGCTGCCAGCCGCAGTCA
+GCGAGCGCACAAACTGCTCATGAAACGTCGCCACCCGGGCGCTCAACGCCTGGTACTCCTGCGCGTGGGT
+ACCAAACAACGCCGCGATCGCCGCCGACACCTCATCACCGGCGGCCGCCAACACCTGCGTCGTCGGGCCC
+GCTGCCGCCGCATTCGCCGCGCTGATGGCCTGCCCAATCCCGGTCAAGTCCGCCGCGGCCGCCGCCACCA
+GCTCCGGCGCCACCATCAGCGACATGACCATTCCTCCAACACCAATGGCGCGTACAGCCGGCTCGCGCGA
+GCCTTGACCGCCGGCGGCAACCCGAGCGATCCCATGGCCCTAGGCGGTTCTCGGGCGAACGCCACGTTTA
+GCGGATCGATTCACCCGGTCGTTGCGTTGCGGCGCAGCAATAGACATCTCGAAGCACTCCGGCTGCCAAT
+CTCGTCGCGTTTATTCTGCTCGTGACCAGCGCAGGAAAGGGGGGGATTACGAAAGTCTTCGGGATCTCAG
+TGCACAGTGCACACATGTTTAACCAATCACCGTGGCATAACGCACACCAAAGGCCGAGAGCGCGGAAAAC
+GCAGAACATCAATTGGATCGGTTGCTAGCTTTGCCGCACCGTGGTCAGCCGCGCCAGGATCGGTCGGCAA
+TGGCACCACCGGAGCAGGCGAAAGGTACCCGGTTCTAGCCCGTCCCCAACGGGTCAATGGTGGATGCGAT
+ATAGACCATGGCCGCCGCGACCGTCACGGTCGTCACGAAATCGATCCCCTTGCTGCGCACCACCAACAGG
+CCGGCCCGTTCCTCGGACAACACCAACCGCAGCACCGCCGCCACCCCAACGCCGATACCGATCAGCAGCG
+CACCACGGCGCCAGAAGTTGACCCCCGCCAGGATCGGCCACTGGGCGCCAACAGTGCGCCGCAAAACGGC
+CCTCACGGTCATCGCCGCTCAGCCAGCTCCACGACACTTGTCAGCAAGGACGCCCGGGGCGAAGGGCGTT
+CGCCAAGTCTGTAGATGAGCTGCGGGAGATGGCCGGCGGCGAGGGTTGAGAAGCGTCAACTTCGATCGTG
+ATGCCTGGGAGGACTTCTTATTTCATACGCGATCGGTGATGCCGCCCTGAAGCCGAGGTCGACGGCAGCG
+CGGAGACGTTCGAGAAGACGTCGCGGTGAGGTCAATCCCGGTGTGACCAACGGCCGGTTACGGCCCGGTG
+CCCGCGAACAGCAGGCCCGACAGCTGCTGGCCGACGTTCATAAAGCCCGAGACGAAGGCCGATGTGACCA
+GGCCAAGCGTGCCCGTGTTGTACACGCCCGAGATGCCCGCGCCACGGTTGAGGATGCCGGAGAGCTGGGT
+GCCGAAATTGGCGAAGCCCGACGCCGACCCGAGCAGCGGATCCGAGATCGCGTTGAGCACCCCCGACATG
+CCCGACCCGGAGTTGGAGAAGCCGGACCCGCCACCACCGCCGGTGTTGAAGAAGCCCGACGACGGCGCGG
+TGGTGTCGTTGCCAAAGCCCGGTGCTCCGCCGAACCCGAAAATCGGGAGGCTGACGGGGCCGATGGTGGT
+GCTGGCGTGTAACTCCACCGGGATCCGGTCGATAACGACCGTCGGGAGATCAAAGGGTGGGGTGCCGCCG
+GACAAACCGAGGCCCAGCGGGAGTTGGGGAATCAGGGTGCCGCCCGGGATGGTGAAGCCCGGAATGGTCA
+GCGACAGCGGCAGGCCGATGTGGATGGGTCCGGTGGGAATGGTGAATCCGGGGAAGTGCAGTGTCGTCGG
+GTTCAAGTTGATGGGTGCCACGGTGAATGGTTGAAGTATGGAGACCTCGCCCCCGGGCATGCCGTCGGGT
+CCGACCGCGAAGAATGAAAAGCTGGGTCTGACCTTGAATCCGGAGCTGCTTCCGGACGTCATCCTGATCT
+CCGAGACGGCAGCATCCAAACTTAGGCCAGGGATGGTGAGGGTGATGGGGTCCACGGTGATAGGGCCGAC
+GTCGAAGGTGGGATCGATGCCCAGGTGGATCGAGGGGATGGCGATGTTCGGGATGCTGATCGGCCCGATG
+TGGCCGATCGCGGCGAAGCCCAACGGGATGGACGGGATGTGGATGGGCGGAATGATGGTGGCGGGGCCGA
+TGTCGCCGGTGACGTCGGCGCCCACCGCGGGGAACAGCGGAATGGGGTACCCGAAGGAGAAGCCGGCCAA
+GCCCTCGTAATTGCCCCGCCATAAGATGCCGTTGCTAAAGTTGCCCGTGATGAGGGCGCCGGTGTTGACA
+TTGCCCGCGTTGGCGACGCCGGTGTTGGCGTTACCGGTGTTGAACCAGCCGGTGTTGGTGCTGCCTGGGT
+TGAAGCCACCGGTGTTGGTGTCACCAGCATTGAAGCTGCCCGTGTTGTACGACCCGGCGTTTGCCACACC
+GGTGTTGAAGCCGCCGGCGTTGACCAACCCGGTGCTGGCCACCCCGGAGTTGCCGATACCGGTGTTGTAG
+CTGCCGGAGTTGAACAACCCGAAGTTGGCAGTCCCGGAGTTGAAGAAGCCGATATTGCCTGTGCCGGAGT
+TGAACAGGCCAATGTTGCCAGTGCCGGAGTTCAAGCCGCCGATGCCGGACTGGTTGTCGCCGGTGAGCCC
+GATCCCGAGGTTGTTGGTGCCGGTGTTGCCAAACCCGATGTTGCCCAGGCCCATGTTGGCCCAGCCGACG
+TTGCCGCTGCCGGCGTTGCCCAGCCCGATATTGCCCATGCCGGCCAGGCCCGCCGCCAGACCCGAATTCC
+CGAACCCGAAGTTGGCATCGCCGATATTGCCGAACCCGACGTTGCCGCCGCCGATGTTGCCGAAGCCCAG
+GTTCACGTCGCCAATGTTGCCGAATCCCAGGTTCACGTCGCCAATGTTGGCCGCACCCAGGTTGAGGTTG
+CCGATGTTGCCGAGGCCGACGTTGCCGTTGCCGACGTTAGCCAACCCGATGTTGACGATGGTGATGGGGT
+TTTGCCCCACGTTGGAGGCCAACAAGCCCGACAGGTGATCACCGACGTTGCCCAGGCCCGACACCAACGC
+CGGCGTCCCAAGCGGCAGCGTGCTGGTGTTGTAGATCCCCGACAGCCCCGAACCGAGGTTGAGCACGCCG
+GAGTGCAGTGTGCCGACGTTGGCAATACCCGAACCCGCGCCTGCCAAAGCGGTGTGCGCCTGGTTCCACC
+ACCCCGACATGTTCGCGCCGAAGTTGCCGAAACCCGAGCCCCCGCCCGCCCCGGTGTTGAAGAAGCCCGA
+CGACGGAACGGTGGTGGTGTTCCCAATGCCCGGGGTGGGCGGGATGTTGATCAGCGGGATGTTGCCGGCG
+ATGACGTAGAGTTCGCCGTCGGCGTTCGCCGGGATCTCCGGGAACGTGATCGCCGGAATGGTGGCGCCGG
+GGGTGCCGACGAACACATCCAGGTTCAGCAGCGAGTTCGCCGGGAACGTCAGACCACCGGGGAACAGGGT
+GATCGCGTCGATGCTGCCCGGCACCTGGAAACCCAACGGGATCTGGTGAATATTGAGCGCCGGGGTGTTG
+AACGCCTGAGATGCCGCATTGAAGACGGCATGCACCGGGCCGGTCGTGCTGAGCGTCGGGATTCCCGAGA
+TGATATTGCCGCCGACGAACAGGTCACCGGCGTTGTAGATTCTGCCGACCGAGTACCACGTTGGGCCGAT
+CGCACCGGATGACGTCCAGACGATAAACGGCTCTATTTCGCTGGTCGCCCCGACCGACGCGGCCATATCG
+AGGACCGCTCGTGCGGCGGTCAGGGCGGGAATGGTGACCGAGGGGACCGCGATGGGGCCGAAGCCGACGC
+TTCCGGTGACGTTCGGATTGAGGGCGGGAATATCGATTTGCGGGATGGTGAAGGCGCCCATCGCCGCGTT
+GCCGGTCAGGTGCGCGTTGATCGCCGGAACCGGGATGGGCGGGACGACCACCGGGCCGAAGGCCCCGGTG
+AAATGCGCGTCCAGGATGGTGATCCGGGGAACGTCGAGGCTGTAGGAATAGCTGAATAGGCCTTCGTAGT
+TGCCCCGCCACAGGATGCCGTTGCTGAAGTTGCCCGACATGAGGGCGCCGGTGTCGACATTGCCCGAGTT
+CGCGATGCCGGTGTTGGCGTTACCGGTGTTGAACCAGCCGGTGTTGATGCTGCCCGGGTTGAAGCCACCG
+GTGTTGGTGTCACCGACATTGAAGCTGCCCGTGTTGTACGACCCGGCGTTGGCCAGACCCGTAGTGAAAC
+CACCGGCATTGAAAAGCCCAGTACTGCCCGTTCCGCTATTACCGATGCCGGTGTTGAAGCTGCCCGAGTT
+GAACAACCCCCAGTTTCCGGTCCCGGAGTTGAAGAACCCGATGTTGCCGGTGCCGGAGTTGAACAGGCCA
+ATGTTGCCGGCACCGGAGTTCAAGCCGCCGATGCCGGTCTGGTTGTCGCCGGCCAGCCCAATCCCGAGGT
+TGTTGGTGCCGGTGTTGGCGAACCCGATGTTGCCCACACCCATGTTGGCCAGGCCAACGTTGGTGCTGCC
+CGCATTGCCCAACCCGATATTGCCGATGCCGAGCGCCGCCCCAGGCCCGAATTGCCAAACCCGACGTTGC
+CGTGGCCGATATTGCCGAAGCCGACGTTGGCGTTCCCGATATTGCCCAACCCTAGGTTGAGGTCGCCGAG
+GTTGGCCGCGCCCAGGTTGAAGTCCCCAACGTTGCCCAACCCGAGGTTGTAGTTGCCGACATCGGCCAAC
+CCGAGGTTGATGATGGGGCTTTGGGTCAACGCCGTCCCGGCCGCCAACACCCCCGACAGCTGCTGGCCCA
+CGTTGCCGGCACCCGACACCAGCGCCGGCGTCCCCAAACCCACGATAGCGGTGTTGTACAGCCCCGATAT
+CCCCGAGCCGACGTTCAGCACACCCGAGTTCAGCGTGCCAACGTTGAGAACGCCCGAGCCCGCGCCCGCC
+AACGCGGCATGCGCCTGGTTCCACCAGCCTGAGCTGCCGGCCCCGAAGTTGCCGAAACCCGACACCCCGC
+CCGCGCCGGAGTTGAAGAAACCCGACGACGGGGTGGCGGTCGCGTTCCCGAAGCCGGGCGTCGGCGGAAC
+GATGATGATCGGAACGCTGCTGTCCGGCACGCTGATGTTGAGGGCCAGGCTCAGTGGCAGCGGATCGATC
+GTGAAACCACCCGGGAATATCGTGATCGGATCCAGCACGCCGGACGCATCGATGGTCAACGGGATCGCAT
+TTTGCGGGATGTTGAGGCCACCGGGGAACAGCGTGAAGGCCGGAAGACCGCCCGACACATCGATCTTGAG
+CGGGATAGGCGATGTCGTGATCGTTGGGATGGTGACGGTTGGGAGGGTTAGTGCGAGGCTACCGGTGGTT
+GCGCTGCTGGGACCGGTATGGATCAGGATGCCCTGAGTGGGTGCGGTGACAAAGCCACCACTCATTCCGG
+TTGAGTTGGACGCCCCAACGATCCAGTTGTCGCCGAGCGCATTCACGAACAGCAACGGAAGTCTGAAGGG
+CGGCGGGGCGGGGGCCGGGGGCGTGTCGAGCGGAATCGTGTAGGTCTGACCGCCGATCGTCATGCTCGGC
+AGGAAGACGATGGGCGGGATGACCATCGTTTCGTGGATGTCCAGCACCACTGCGGGGACATCGATGGGCT
+CGATCCTGAAGGGCCCGATGTTGACGAGTTCGTGGATGTCGAACAGCGACATGCCGGGAATATCGATCTG
+ATCGATGTGGACGGGACCGAGGTTGAGGGTTTCGTTGATGTCCACCAGGGTGCTGCCGGTGATTTCGATG
+CTGTAGGAGAAGCCGACCAGCCCGTGGTGATCACCGGTCCACAGCGCGCCGTTGTTGAAGCTGCCGGAGT
+TGAACGCGGCGGTGTTGACATTGCCCGTGTTGAAGCCGCCGGTGTTGGTGTGGCCGGCGTTGAACCAGCC
+GGTGTTGACATTGCCAGGGTTGAAGCCGCCGGTGTTGGTGTTGCCCGCGTTGAGGCTGCCGGTGTTGTAA
+CTACCGGCATTGGCCAGACCCGTGTTGAAACTCCCGGCATTGAAAAGCCCGGTACTGCCCGTTCCGCTGT
+TACCGATGCCGGTGTTGTAGCTGCCCGAGTTGAACAACCCCCAGTTTCCGGTCCCGGTGTTGAAGAACCC
+GATGTTGCCGGTGCCGGAGTTGAACAACCCCAGGTTGCCGGCACCGGAGTTCAGGCCGCCGAACCCGGTC
+TGGTTGTCGCCGGTCAGCCCGATCCCGAGGTTGTTGGTGCCGGTATTGCCGAACCCGATGTTGCCCAGGC
+CCATGTTGCCGAAGCCGACGTTGTTGCTGCCGGCGTTGCCCAACCCGATGTTGCCGATCCCCGGCAGCGC
+CCCCAGGCCCGAGTTGCCGAACCCGACATTGCCGTGGCCGAGGTTGCCGAACCCGACGTTGCCGTCCCCG
+AGGTTGCCCAACCCCAGGTTCTGCCCGCCGAGGTTGCCACCGCCGAGGTTGAGGTTGCCGAGGTTGCCCG
+CGCCCAGGTTGACGTCGCCGACGTTGGCGAAGCCGAGGTTGTAGCTGCCGACGTTGCCCAGGTTGACGAT
+GTTCAGCGGATTCAGGTGCCGCAGCTCGGCGATCGCCGCGTCGATGATGCTCGGCTGCCCGGAGCCGCCC
+GACCCGCCGCTGGTCAGCATCGCCAGCAGGCCATCGATGGACACCCCCGACACGTGGTTGCCCAGGTTGC
+CGAAACCCGAGATCACCGCCGGCGCGGAGCCCAGCGTGCTCACGTTGAACATGCCCGAGATGTCGACGCC
+GGAGTTCAGCACACCGGATGCCAGGCTGCCGGCATTGCCCAGGCCGGAGAGCGTCCCCACCATCGGACTC
+GAGGCCTGGTTCAGCAAGCCGGACACCCCCGCGCCGAAGTTGGCGATGCCCGAGCCGCCACCGCCGCCGG
+TGTTGAAGAAGCCCGACGACGGCAGCTCGGTCGAGTTGCCAAAGCCCGGCAGCGCCGGAATGTCGATGAT
+CGAGATGTTGATGGGTCCGGCGCTGCTGAGAACGTCGAAGTTCAGCGGAATCGGGTCGATCCTGGTGCCG
+GTGATGGTGACCGCCGGAATGTCGACGGACACATCGATCGGCACGACCTCCGACATCGAAATTCCGTTGA
+TAGTGGAGGCCGGGATGTCGATCGGCGGAATGTCGATGGGTATGGATTGGCTGAACGAGATTGCCGGCAA
+TTCGATGGCGTCGATGGTCTGCTGCAGCGGCAGGGCCAATCCGCCCAGCGTTGCCGAAGTAAGGGGTATG
+GCGACCTGTATCTGAACCGAGATTGTGGGATCGGGAAATTCATTTGGGAACGCGTCGTGGAGGAACTGAA
+GCTTGAGGTTAACGTTGAACGGATTGAGCTGGACGTTTGAGACGGTGATCGGGCCGAACCTGAATTGTCC
+GGTAATGCCCAGCGCAGAAAGCAGGGTGGTGGCCGAGGCGGTGAAGCCGGCGTCGGCGGCACCGTCGAAG
+TCGATGTGGATTGCCGGAATGGGGATGTCCGGCACGGCGAAGCCGTAGTTCGCTTGTCCCGTGAGGCCCA
+GGTGGATGGGGGGAAGGATCGTGGTGTCCGGGATGATAATGGGGCCGATGCCGCCGGTTGAAGTCCAGTG
+GATCGGGAATTCGGGAATCGTGATGCCGACGTTCAGGCCGAACAGGCCCTCGAAGTTGCCTCGCCACAAG
+ATGCCGTTGCTGTCGTTGCCGGTGATGAAGGCGCCGGTGTTGACGGTGCCCGAATTGGCGACGCCGGTGT
+TGGCGTTGCCGGTGTTGAACCAGCCGGTGTTGATGCTGCCCGGGTTGAAACCACCGGTGTTGGTGTCACC
+CACATTGAAGCTGCCCGTGTTGTACGACCCAGGGTTGGCCACACCGGTATTGAAATTACCGGCATTGAAA
+AGCCCAGTACTGCCCGTTCCGCCATTGCCGATCCCGGTGTTGTAGCCGCCCGAGTTGAACAACCCGAAGT
+TCCCGGTCCCGGAGTTGAACAACCCGACGTTGCCGGTGCCGGAGTTGAACAACCCGATGTTGCCGGCACC
+GGAGTTCAAGCCGCCGATCCCAGTCTGGTTGTCCCCGGTCAGCCCAATCCCGAGGTTGTTGGTGCCGGTG
+TTACCGAACCCGATGTTGCCCACACCCATGTTGCCGAAGCCGACGTTGCCGCTGCCGGCATTGCCCAACC
+CGATGTTGCCCACCCCGGCCAGGCCCGCCGCCAGACCCGCATTGCCCAACCCGAAGTTGGCATCGCCGAT
+ATTGCCGAACCCGACGTTGCCGCCGCCGACATTGCCCAAACCCACGTTCAAGTCGCCGATATTGGCCGCA
+CCCAGGTTGAAGTCCCCGACGTTGCCGAAACCGACGTTTACGCTGCCCACATCGGCCAGCCCGAGATTGA
+TGATGAGGCTCTGGTTGAGTGCCGTCCCCGCCGAGGACAACCCCGACAGCTGCTCACCAACATTGCCGAT
+GCCCGAGACCACCGCCGGGGTCCCCGGCGGCAACCCGCCGGTGTTGTACAGCCCCGACACACCCGAGCCG
+AAGTTCAGCACACCCGATCCCAGCGAGCCGAAGTTGGCGAAACCCGAACCCGCCCCAGCCACCTCGGTCT
+GCGCCTGGTTCCACCAACCCGAGCTGCCCGCACCGAAATTCCCGAAGCCCGACACCCCACCGTCGCCGGA
+GTTGAAGAAACCCGACGACGGAGCGGTGGTCGTGTTGCCAAAGCCCGGGGTCGCCGGGATATTAACGCCG
+TTGATCAGGATAGGGCCGACAGTGACGCTGGCGCCGAGGTTCAGCGGGATGCGGTCGATCGTGATCGGCG
+GGGTGCTGAAGCCGTCAATCTGGCCGTCTATGTCGATCGTCAGCGGCAGCGGCGCAGCGGGAATGGTGAA
+GCCCGGGATCGTGAATCCCAGCGTGCCGATCGACGCGCTGGCCAGCAGCGCCAGTGGATTGTTGGGAATA
+CTGATGCCATTCGGGAAGATCGTTACTGCCGGGGTACTCCAGTTGACGGTCACCGGGAATGACTGGTTAA
+TTCTGGTGTCGATATTAAGGTTACCTAATTGGAGGGTGACGTTGCCGGCAAGATCTTTGATTTCGATTCC
+TGAAATGTTGACGACCCCCAAGCCAAAGAAGGGGCCGACGGGGAAAGTCGTGTTGAAGTTCTGAGCCGGG
+AACAGGGTGATGGGCGAGATGGTGATGGGGCCGACGCTGATAGGTATGGCCGTACCGCCACCAAAAGCGG
+GGATCACGATGTCCGGAACGACCAGCGGGCCGAGGCTGAAGGTTTGGTGAATGTTGAGCGGGATGGTGGG
+CAAAATCTGGATCGGCAACACGGTGATGGGGCCGACGCCGCCGTTGAGCTCGAGACCAATGGGGATCGCC
+GGAATGGTCGATCCACCGGAGAGCCCCCACAGGCCCTCGTAGTCACCCCGCCACAGCACACCGTTGCTGA
+AGTTGCCCGAGATGAACGCGCCGGTGTTGACATTGCCCGAGTTGGCGATGCCGGTGTTGGTGTTGCCGGT
+GTTCAGCCAGCCGGTGTTGACGTTGCCCGGGTTGAAGCCACCCGTATTGGTGTTGCCCGCGTTGAAGCTG
+CCCGTGTTATAGCTACCCACGTTGGCCACACCCGTGTTGAACCCACCAACGTTGAACAACCCGGTACTGG
+CCGTCCCCGCATTACCGACACCGGTGTTGTAGCTGCCCGAGTTGAATACCCCGAAGTTGCCGGTCCCCGA
+ATTGAAGAACCCGATGTTGCCGGTGCCGGAGTTGAACAACCCCAGATTACCGGTTCCTGAATTCAGGCCC
+CCAATGCCAGTCAGGTTGTCCCCGGTCAACCCGATCCCGATGTTGTTGCTACCCGTGTTGGCAAAACCGA
+TGTTGCCCACACCCAGGTTTGCGAGGCCGTAGTTGCTGCTGCCCGCATTGCCCAACCCAATATTGCCCAT
+GCCCGGCGGCAACCCAAGACCCGAGTTGCCGAACCCGAAGTTGGCGTTGCCGATATTGCCGAAACCGAAA
+TTCCCGCTACCGGCGTTGGCAGCACCCAAATTCTGCGCACCGACATTGGCTGCGCCCAGGTTGAATATCC
+CGACATTGCCCAACCCGACGTTGTAATTACCGACATTGCCCAAGCCCGCGTTAAGCCTCAACATCTTCGC
+GGGTCCGGCAAATATAGCATTGAGGAACGCGCCGACACCACCCCCCAACGCCTGCGCCGGTGGGCTGAAC
+GCCGGCAACGCCGCGGCAGCAGCCGACGCGCCGGAATGGTAGCCGGCCATCGCCGCCACATCGGCGGCCC
+ACATCAACTCGTACTCGGCCTCGACGGCCGCGATCGCTGCGGCGTTCTGCCCCAGCAGGTTCGACATCGC
+CAACGCCCGCATCGCCATCCGGTTGACCGCCACCGCCGCCGGATCCACCGTCGCCGCCAACGCCGCCTCA
+AACGCCGCCACCGCGGCCCGCGCCTGCCCGGCCACCGCCACGGCCTGCGCCGCCACCGAACCCAACCACC
+CCGCATACGGGGCCGCCGCGGCCGCCATCGCCGCCGCCGCCGCACCCTGCCACACCCCCGCCGTCAGGCC
+CGACGTCACCTGCCCAAACGACACCGCCGCCGACCCCAACTCCTCAGCCAGCCCATCCCACGCCGCGGCC
+GCCGCCAGCAATGGGCTCGACCCCGCACCCGAATACATCAGCACGGAGTTGATTTCCGGGGGCAGAACTG
+GAAAATTCAACCGCCCCTACCTCTGCCGCTCACGATGCGTTCACACCTCATCGTCTCACCACGACGTGGT
+GAGCGCGGGCACTTCGACAAACTAATCTGCAATATCCCGATCGCGTACAAACGTGCCGACATTTGCGGCG
+CATTAATGCCCATATCGGCTTGTATCTCTTGTAGTGCCGCTTTGACGGGGTGGTGGTCAGGTACGGTGGC
+CTCGGGAGAGGCTGGAGGGCTCGACGTTTGGGCTGAGTGTCTGGGCCCGTGAAAGAGATCGTCTGCTCCA
+GCTTTGTCTCCTGAACTGACCCGGTTTAGGGAATTGGTGGCCAGGTTGCGGAAGTGCGCAGCATCGACGT
+GTACCTGGGTGAGGCATCGAATCATCGACAAGCACCGGAGCCGCGCGTGAACTCCCGCCGCGTTGTGGTC
+GGGGATGATGTGGGAGACCGGCCGGCAGTGCTGTGTACGAAGGTTCTCCCACCGCAACGAGTTCACGCAC
+GACGGTCGGCTGGGTGGGCCCTGGAATGCGTGAACTCTTCATCAACACAACATGATTGACGATGAAGGGG
+AGAACCTCCATGCACAACAACGCTAACCCGTGACTGCCGAGAATCCAGGACGGAGCAGGCGGACGCTGGT
+CGGAATCGACGCGGCGATCACGGCCTGTCACCACATCGCGATCCGCGATGATGTCGGTGCGAGGTCGATT
+CGATTCAGTGTCGAACCCACGCTGGCCGGACTGCGCACCCTCACCGACAAGCTCAGCGGTTACGACGATA
+TCGACGCCACCGTGGAACCGACCTCGATGACGTGGCTGCCGCTCACGATCGCTGTCGAGAATGCCGGTGA
+CACCATGCACATGGCCGGCGCGCGGCATTGCGCCCGGCTGCGGGGTGCGATCGTGGGCAAGAGCAAGTCC
+GACGTCATCGACGCCGAGGTTCTCACCCGCGCCAGCGAGGTGTTCGACCTGACGCCGCTGACACTGCCGA
+CGCCCGCGCAGTTGGCGTTACGTCGATCGGTGATCCGACGTGCCGGCGCAGTGATTGACGCGAACCGGTC
+CTGGCGTCGGTTGATGTCGTTGGCGCGGTAGGCGTTCCCCGATGTGTGGACCGCGTTCGCCGGGTCGTTA
+CCGACCGCGACAGCGGTGCTGGGGCGTTGGCCCGACATCCGCTTGCTGGCCGGCGCACCGACCCGCCACG
+TTGACCGCCGTCATCGCCGCGCACACCCGCGGTGTCGCCGACACCCCGGCCCGGCCGAGGCCATCAAGAC
+CGCCGCAACCGGCTGGGCCGCGTTCTGGGACGGGCACCTCGACCTGGACGCACTGGCCGTCGATGTCACC
+GAGCATCTCAGCGACCTCACCGACGACCGATGCGCGCGTTGGTGATGCCGGTGACCAAGAAGGTGTTGAT
+CTTGGGTGACTAGTCAATGGTGGTGGCCAGGGTGAGCAGTTCGGGGATCTGCGAGTCGATGCGCCAGGCA
+GGAAGCGGTGTAGGTGATGGCGCGCCAGGTGGGGGTCCCCGCCGGTGCGCACGGTCGACAGCAGGGTGCG
+CAGCTCCTCTTTGGCGATCCAGGCCGAGAGAATCTGCGCGCGGGGGTCGACGGCGTTGATCCGATTCCGC
+ATTTTGGCGAAGCTTTTGTCCGACAAGCGTTCCCGGGCGGTCAGCAAGCGACGTCGGTTGGCCCACTGCG
+GGTCGATCTTGCGGCCGCGCCGGTCGTGGAACGCCCAGGTCACCCGGCGGCGCACCGCGGTCAGCGCGTC
+GTTGGCCAGCGTGGTCACATGGAAGTGGTCGACGACGAGCTTGGCGTTGGGCAGCAGCCCGGGCGTGCGG
+ATCGCCGAGGCGTAGGCAGCGGCGGGGTCGATGGCCACCGTACTGGATGCTCTCCCGGAACTGCGGTGTG
+CGCGCTTGCAGCCATGCCAGCACCGCCGCGCCGCCGCGGCCTTCATGCTGCCCCATAAACCCCTGATCAC
+CGGCCAGGTCGACGAACCCGGTATCCCACGGGTCGACCCGTACCCACCGGCCAGTCTTGGCGCAGCGCTC
+TGGGTTTTCCTCGCCGTGTCTGGTCAACGCCCAGCACCGGGGTGGGCAACGGCTCGGTCAATACCCGTCT
+CGGCGTAGGCAACAAACGCCCGATGTGCCGTCGGCCACGACACGGCGTCAGCCTGGGCGACCTCGGCCCA
+CCGAGCGGGCCGCATCCCCGATCGCCTTGGCCATCTGCCGACGCAGCCGCAGCGTGCTGCGGACGCGGGC
+AGGTACCTGGGTGATGGCCTCGATGAACGGCCCCAGCTTGCAGTAGTCTTCTCGGCATCGCCAGCGAATT
+TTGTTCCAGCGCACCATGATGCGGTCTTCGCCATAAGGTAGATCTTTCGGTGAGGTAACCGCGTATTCCT
+TCACTGATATCGAGACCACCCCCGCACGACGGGCACGCCGCCGCCGTCGGCTCATCGGTGATCACATCGA
+CCACCCGGGTCCCGTCACTGCGGCGCTCGACACGCTCAACCCGTGCTCCTGGCAGCCCGAACAACACTGT
+CGTAGCGTCAGACACAGCCCTTGGCTCCTTCCTCGGCCTGAATGCTTCGCAACACTTAGACTTCAGAAGG
+CCAAGGGCCCTCAGCCGCTAAACACGCCGACCAAGATCAACGAGCTACCTGCCCGGTCAAGGTTGAAGAG
+CCCCCATATCAGCAAGGGCCCGGTGTCGGCGCAAAATTTAGCGTCGTTGCGCCCACACCAGAGTTACCGC
+CGCACACACGGCGTGACCACCGGCGTGCATTTAAGAATCCGTTAGGGCCCGACGCCGGTGAAGAGCAAGC
+CCGACAGTTGCTGGCCGACGTTGCCGAAACCCGAGACGACGGCCGCGGTGACAACACCCAGCGCGCCGGT
+GTTGTACACGCCCGAGATGCCGGCGCCGCGGTTGAGGATGCCGGAGAGCTGGGTGCCGAAGTTGGCGAAG
+CCCGACGCCGACCCGAGCAGCGGATCCGACATCGCGTTGAGCAATCCCGACATGCCCGCGCCGGTGTTGC
+TAAAGCCCGAACCGCCGCCAGCTCCGGTGTTGAAGAAGCCCGACGACGGCAGCGTGGTCGAGTTCCCGAA
+ACCCGGCGCCCCGCCGAACCCGGCGATCGGGACGTTGATCGGGCCGATAGTGGTGTCGGCGTGCAGGTCC
+AGCAAGATCCGGTCGAGAACGATGGCCGGGATGTCGACGGGCGGGATGCCATTGGACAACGCGAGGCCCA
+GCGGGAGGGTGGGGATCAGGGTGCCGCCCGGGATGGTGAACCCCGGGATGGTCAGCGACACCGGCAGGCC
+GATGTCGATCGGGTCGAGGGGGATGGTGAATCCCGGGAAGGTCACCGTGCCGGAGGGGATGGAGATGGGC
+CCCACAAAGTATGCCCCTTGCGTGGACGTTGCACCCCCGCCGCTAGAGGGCGCGATCCGGATTCCGGGGA
+AGAAGCTGGGCTTGACCCAAATCTCTGAGGTTGGTCCGGACGTGCTGGTGACGGCTCCTTGGGAGTAACT
+GACGAGCACGGGCGGGGTCCTGACGGTAATGGGGTTGACGGTGATGGAGCCGACATGGACGGCGGGGTCG
+AGGCCCAAGTGAATGGATGGAACAGAGATGTCCGGGATGGCGATCGGGCCGATGCCACCGACCGCGGCGA
+AGCCGACCGGAATGGGCGGGATGTGGATGGGCGGCAGCACGGTAATCGGGCCGATCCCGCCGCTGACGTC
+GGCGCCCACCGCGGGGAACAGCGGGAGGGTGTAGCCCACGGCGAAGCCGGCCAGGCCCTGGTAGTCGCCG
+CGCCACAGGATGCCGTTGCTGAAGTTGCCGGTGACGAAGGCGCCGGTGTTGACATTGCCCGCGTTGGCCA
+CCCCGGTGTTGGCGTTGCCGGCGTTGAGCCAGCCGGTGTTGATGCTGCCCGGGTTGAAGCCCCCGGTGTT
+GGTGTCACCGACATTGAAGCTGCCCGTGTTGTAGCTGCCGGCGTTGGCCACACCGGTGTTGAAACTGCCG
+GCATTGAAGAGCCCAGTGCTGCCCGTTCCGCTATTGCCGACGCCGGTGTTGAAGCTGCCGGAGTTGAACA
+ACCCGAAGTTGCCGGTCCCGGTGTTGAAGAACCCGACGTTGCCGGCGCCGGAGTTGAACAACCCCAGGTT
+GCCGGCACCGGAATTTAGGCCGCCGATGCCGGTCTGGTAGTCGCCGGTCAGCCCGATCCCAATGTTGCCG
+GTGCCGGTGTTGGCCAACCCGATATTGCCCACGCCCACGTTGGCCAACCCCCAGTTGTTGCCGCCGGCAT
+TGCCCAACCCCACATTGCCCAGGCCCGGCACGCCCGCGGTCAGACCCGAGTTGCCGACTCCGACATTGCC
+GTGGCCAATATTGCCGAACCCCAGGTTGCCGGCGCCGATATTTCCGAAGCCCAGGTTGTGCGCGCCGAGG
+TTGGCCGCGCCCAGGTTGACCTCCCCGACATTGCCGAAACCGGCGTTGTGGCTGCCGACGTTGGCCAACC
+CGATATTCAGAACGGTCACCGGGTTCACCGCGGACCCGCCGGAAAGCAGCCCCGACAGTTGGTGGCCGAC
+GTTGCCCAGGCCTGAGACCAGCGCCGGGGTCCCCACCCCCAGCGTGCTGGTGTTGTAGATCCCCGAGACA
+CCCGAGCCCAGGTTGAGCACACCGGAATGCAGCGTGCCAACGTTGGCAAAACCCGAGCCCGCCCCCGCCA
+GCGCGGTGTGCGCCTGGTTCCACCAGCCCGAGGTGCCCGCGCCGAAGTTGCCGAAGCCCGATCCCCCGCC
+CGCGCCGGCGTTGAAGAAGCCCGACGACGGGGTGATGGTGCTGTTCCCAATGCCCGGGGTGGGCGGGATG
+TTGATCAGCGGGATGCTGCTGGCGAGGACATACACTGAGCCGTCGGCGCTCGCCGCGATCTCGGGCCAGG
+TGATGGCCGGGATGTCCACGCCGCCGGCGCCGGCGGTCACGTCCAGGTTCAGCAGCGAGGTCGCCGGGAA
+CGTCAAACCACCGGGGAAGAGGGTGATCGCGTTGACGCTGCCGGGCACCTGGAAGCCCAACGTGATCGGG
+CCAGTTTCGAGCTGCGGAGTGGTAAACGCCCCGCTGGACGCGGAAATGGTGAGATGGCTTCCGTCGCTCG
+TGCCGGCGCCGAAAACGAGTGGGCCGGTGGCGTAGGGCGAACCGTCGGCCGATCCGAATGAATAGAAGGT
+TATACCAAGGCCATTAGTGCCTTGAGTCCACATTTCGAAGGGATCTATCCTCATCTCCGCCCCAACCGAG
+GCGTTGATTATTTGCTCCACAATGACACTCACCGGCGGAATGCGCACGGACCCCACAACGATGCGGAAGG
+CGGCGCTTCCGGTGATGTTTGGGGTGAGTGCGGGGATGTCGATCTGCGGAATGGTGAATGCGCCCATCGC
+GACGTTTCCGGTCAGGTGCGCATTAACGGCCGGCACCGGGATGGGCGGGAGGACCACGGGTCCGAAGCCG
+CCGTCGAGGTGGGCGTCCACGATGGTGATCCGGGGCACGTCGAGGCTGTAGAACAGGCTGAACAGGCCCT
+CGTGATCACCCCGCCACAACAGGCCGTTGCTGAAGTTGCCCGACATGAACGCGCCGGTGCCGACGTTGCC
+CGAGTTGGCGATGCCGGTATTGGTGTGGCCGGTGTTGAACCAGCCGGTGTTGATGGTGCCCGGGTTGAAC
+CCCCCGGTGTTGGTGTCGCCGGCATTGAAGCTGCCGGTGTTGTAGCTGCCGGCGTTGGCCACGCCGGTGT
+TGAAGCTGCCGGCATTGAAGAGCCCAGTGCTGCCCGTTCCGCTATTGCCGATGCCGGTGTTGAAGCTGCC
+CGAGTTACCGATGCCGAAGTTGCCGGTCCCGGAGTTGAAGAACCCGATGTTGCCGGTGCCGGAGTTGAAC
+AAGCCGATATTGCCGGCACCGGAGTTCAGGCCCCCGATGCCGGTGAGGTTGTCCCCCACCAGCCCGATCC
+CGATGTTGCCGGTGCCGGTGTTGGCCAACCCGATGTTGCGCACGCCCTGGTTGGCGAAACCATAGTTGGC
+GCTGCCGGCATTGCCGAACCCCGTGTTGCCCAGGCCGGCCGCGCCGGCGGTCAGACCCGAATTGCCGAAA
+CCGATATTGCCGTGGCCGACGTTGGCGAAGCCGAGGTTGCCGGTGCCGACGTTGCCCAGCCCCAGGTTTT
+GCGCACCGAGGTTGGCCGCGCCCAGGTTAACGTCCCCGACGTTGCCGAACCCGACGTTGAAGTTGCCCAC
+ATCCGCCAACCCGATGTTGAGGATGGGGATCTGGTTCAACGCGGTCCCGGCCGCAGACACGCCCGACAGC
+TGATGGCCGACGTTGCCGAGGCCCGACAGCACCGCCGGCGTCCCGAGCGGCAACACGCTGGTGTTGTAGA
+TCCCCGAGACACCCGAGCCGACGTTGAGCACACCCGAGCCCAGCGTGCCGACATTCAACACCCCCGATCC
+CGACCCCGCCAGCGCGCTCGCCGCCTGGTTCCACCAGCCCGACAGGTTCGACCCGACGTTTCCGAACCCC
+GACACCCCACGGCGCCGGAGTTGAAGAACCCCGACGACGGGGTCGCCGTGGTGTTGCCGAACCCTGGCGT
+CGGCGGGACATCGATGATCGGGATGCTGCTGTCGGGCACGGTGAGATTCAGCGCCAGGTGCAGCGGCAGC
+GGGTCGATCGTGTACCCACCCGGGAAAATCGTGATCGGATCCAGCGCGCCGGACGCATCGATCGTTAACG
+GGATGGCGTTCGTGGGGATCGTCAGGCCACCCGCGAACAAGGTGAAGGCCGGCAGACCACCGCTGATGTT
+CACGTCCAACAGGAATCTCGTGGTAGCGATTTGCGGAATCTCGAAACCCGGAATAGATATCTTGAGCTCG
+CCGGTCGTTCCGGGGCCAGGGCCGGTGTGAATGGTGATGCCCTGGGTGGGCGCCGGGAAGGGGTCTCCGA
+AATTGGGAATCGCCGCGGTCGACCCGAGGATCCAGTCCTCGCCTTCGAAGCGCATGCTGATGAGCGGAAG
+CGTCATGGTTGACCCGGGTGAGGCGGGGATGTCCAGCGGAATGGTTCTCGTCTGTGCGGGAATTGTGGTG
+GCGGGCACCAGGACGATGGGATCCATGTGGATCGATTCGTGGATCTCTAGCGGTATCGCGGGAACATCGA
+CCTGCGGGATGGTGAAGGGTCCGATCTCGACGATTTCGTGGACGTCGAACAGCGACATGCCGGGGATGTC
+GATCTGCTCGATGTGGATGGGGCCCAGGTTGAGGGTTTCGTTGAGGTCCAGCAGGGTGCTGCCGGCGATG
+TCGATGCTGAAGGAGAAGCCGACCAGCCCGTGGTAGTCACCGGTCCACAGCGCCCCGTTGTTGAAGCTGC
+CGGAGTTGAACGCGCCGGTGTTGACGTTGCCGGTGTTGAACAGGCCGGTGTTGGTGTGGCCGGTGTTGAA
+CCAGCCGGTGTTGACGGTGCCCGGGTTGACGCCGCCGGTGTTGAAGCTGCCCACGTTGAGGCTGCCGGTG
+TTGTAGGAGCCGGCATTGGCCAGACCGGTGTTGAAGTTCCCCGCGTTGAACAACCCGGTGCTGGCCGTGC
+CCGCATTCCCCACACCGGTGCTGTAACTGCCCGAGTTGAACAGCCCGAAGTTCCCGGTCCCGGTGTTGAA
+GAACCCGATGTTGCCGGTGCCCGAGTTGAACAACCCGAGGTTCCCGGTGCCCGAGTTCAGGCCGCCGATC
+CCGGTCCGATAGTCCCCGGTCAGCCCGATCCCGATGTTGCCGGTGCCGGTGTTGGCCAACCCGATATTGC
+CCACACCCACGTTGGCCAACCCCCAGCTGCCGCTGCCGGCGTTACCCAACCCCACATTGCCCAGGCCCCC
+CGCGCCCGCGGTCAGGCCCGCGTTGCCGAATCCGAAATTGCCGGCACCGATGTTGCCGAACCCGAGGTTG
+CCGGTCCCGACGTTGCCCAACCCCAAGTTGCTGCCGCCGAGGTTGCCGGCGCCGACGTTGATGTTGCCGA
+CGTTGCCCGCACCCAGGTTGAACTCACCGACGTTAGCCAAACCGAGGTTCACCCCGCCGACATTGCCCAA
+GGCCAAAGCGTTGCCGATGTCGAGGTGCTGCAGCTCGGCGATGGCCGCGTCGATGATCTGATCGAACACG
+GACTCGGCAGGTGGGAAGGTGAGGATCGCGATCAGGCCATCGATGGACACCCCCGACATATGGTCGCCGA
+GGTTGCTGAACCCCGAGATCACCGCCGGGGTGGTGGCGTCCAGCGTGCTCACGTTGAACAGCCCGGAGAT
+GGCGGTGCCGGAGTTCAGCACACCCGAGGCCAGGGTGCCGGCATTGCCCAGCCCCGAGAGTGTCCCCACC
+AGTGACCCCGCGCCGGCCTGGTTGAGCAGGCCCGACACGCCCGCACCCAAGTTGCCGATGCCCGATCCGC
+CGCCGGCACCGGTGTTGAAGAACCCCGACGACGGCATCTGGGTCGAGTTCCCGAAGCCCGGCGCCGCCGG
+GATGTCGATGATCGGGATGTTGAGGGGTCCGGCACTGGTGCGAATGTCGAAGCCCAGCGGGATCGCGGAA
+ATGGTGGTGCCTGTGATCGTGACCGCCGGGATGTCCACGGACGCATCGATCGGCACCACTTCCGACATTG
+AAATCCCATCGATGACCGAGGCCGGAATATCAACAGGTATGCGGATAGGAATCGACTCACTCAACGAAAT
+CACATCCAGGGGGATGGGCTCGATCTCCAGGGGCACACCGATCCCGGCCACCACGATTGGCTCAAGATGA
+ATTGGTCCGAGTTGGCCCGTGATAGGACCAAGAACGGGCAGGCCTAACGTGAAATCCATGGGCGGAATAT
+CGATATTCGAGAGCGTGATGGGGCCGAAGCTGATGAAGCTACCGTTATTCTTCAGGGCGGACAGCAGGGT
+GGCTTCCGGGGCGGTGAAGCCGACGGTGACGACGCCATTGATGCCGATGTGGATGGCGGGGATGGGGATG
+TCGGGCACGGTGAAGCTGTAGTCCGCGTCGCCGGTGATCTGCAGGTGCAGCGGCGGAAGGATCGTGGTGT
+CCGGGATGACGATGGGGCCGATACCGCCAGTCGTGGTGATGCGGATCGGGAATTGCGGGATCGTGATGCC
+ATAGGACAGGCCGAACAGGCCCTCGTGGTCGCCGCGCCACAGCATGCCGTTGCTGTCGGTCCCCGACATG
+AGGGCGCCGGTGTTGCGGGTGCCCGTATTCATAATGCCGGTGTTGAACCAGCCGGTGTTGATGTCGCCCG
+GGTTGAAACCACCGGTGTTGGTATCACCGACATTGAAGCTGCCCGTGTTGTACGACCCGGGGTTGGCGAT
+GCCGGTGTTGAAATTGCCGGCATTGAAGAGCCCAGTACTGCCGGTTCCGCTATTACCGATGCCGGTGTTG
+AAACTACCGGAGTTGAACAGTCCGAAGTTGCCGGTGCCGGTGTTGAAGAACCCGACATTGCCGGTGCCGG
+AATTGAACAATCCGATATTGCCACTACCCGAGTTGAGGCCGCCGATGCCGGTCTGGTAGTCGCCGACCAG
+CCCGATCCCGATGTTGCCCGTGCCGGTGTTGGCCAACCCGATGTTGCCCACACCCAGGTTGGCCAGCCCC
+CAGTTGTTGCTGCCGGCATTGCTCAACCCCACGTTGCCCAGGCCGGCCAGGCCCACCGCCGGACCCGAGT
+TGGCGAACCCGACGTTGCCGGCACCGATGTTGCCGAACCCGACGTTCCCGCTGCCGAGATTGCCCAGGCC
+CAGGTTCTGCGCGCCGATGTTGGCCGCACCCCAGTTGAGGTCCCCCACATTGCCCAACCCGGTGTTGAAC
+GCGCCCACATCGGCCCACCCGATATTGACAATGGGGCTCCGGTTGAGCACGGTCCCATTTGCCAAGAACC
+CCGACAGCTGCTGGCCGAGGTTGCCGATGCCCGAGACCACCGCCGGGGTGCCCGCTCCCAGGGTGCTGGT
+GTTGTACCACCCGGAGATCCCCGAGCCGACGTTCAGCACGCCCGAGCTCAGCGTGCCGGCATTGGCAACT
+CCCGAGCCCGCCCCTGCTAACACGTCGTGCCCCTGGTTCCACCAGCCCGACGTGCCCGCGCCGACGTTGG
+CGAACCCCGATCCACCGCCGCCGCCGGTGTTGAAGAACCCCGACGATGGGGCCGTGGTGGTGTTGCCGAA
+CCCCGGCACCGCCGGCACATCGATGATCGGGATCGGGATATCGCCGATGAGGATGGTGCCGTCGAAGGTC
+GCCGGCACGGTGTCGAGGGTGAACCCGTCGGGCAACAGCGTGAACGCGTCCAGCCCCACGGACAGTCCGG
+TGACCCCGGCGGAGGCCCGCGGAAAGGTCAGCCCACCCGGGAAGAAGGTGAACCCGTCGTTGGCGACCTC
+CATACCCACCGTCACGGGGGTTTGCGCGGGAATGGTGAAACCATTCGGGAAAAGCGTCCACGGGGTGGTG
+TCCAAGTTGAGGGTTAGGGGAATTGGTGTCGGGGTGACCAATATCTGACCGCTAACCGTGAGGCCGGGCA
+CAATGATGTTCTCTAGGAACAAGACACCGGCAACAACTTGGAACGCATCAATGGTGATAAATGGGTCACT
+GAGGCGGAACGGCTCGAGAAAAAGCCCTATCGAACCGGCGAGCGGGTCAAGAGCGCGAATCGGCGAGATG
+GTGTTTGCGGCCAGGTCCACGCTTCCGGTGATGCTGGCGATGGGAAGTGAGGGAATGCTGATCGGTGGGA
+CGGTGAACGGACCCAGGCCGACGGTGGCGTCGGTGATCTCGACGTGCACGGCGGGTACCGGGACGGGCGC
+CACATGCAGCGGGCCCACCCCGCCGATCGCGTGCACGGTGACCGGGAATTGGGAGATCGTGGGCCCGACG
+CGGACGCCGACCAGGCCCTCGTAGCCGCCCCGCCACAACAGGCCGTTGCTGTAGTCGCCCGTCATGAAGG
+CGCCGGTGCCGAAGGTGCCCGCGTTGGCCAACCCGGTGTTGGCATGCCCGGTGTTGAACCAGCCGGTGTT
+GATGCCGCCCGGGTTGAAGCCACCGGTGTTGGTGTCGCCGGCGTTGAAGCTGCCCGTGTTGTAGTCACCA
+GTGTTGGCGATGCCGGTGCTGAAGCTGCCGGCATTGAAGAGCCCGGTGCTGGCCGTTCCGCTATTACCGA
+TCCCGGTGTTGAAGCGGCCGGAGTTCCCGATGCCGAAGTTGCCGGTCCCGGAATTGAAGAACCCGACGTC
+GCCGGTGCCGGAGTTGAACAACCCGATATTGCCGATGCCGGAGTTCAAGCCCCCGATCCCGGTCCGATGG
+TCCCCGACCAGCCCGATCCCGATGTTGCCCGTGCCGGTGTTGGCAAACCCAATATTGCCCACACCCATGT
+TCGCCAAGCCATAGTTGTTGATGCCGGCATTGCCAAAACCAACATTGCCCACCCCCGCCGCGCCGGCGGT
+CAGGCCCAAGTTGGCAAACCCCAGGTTGCCATGGCCGATGTTGCCCAACCCCAGGTTGCCGTCCCCGACA
+TTGCCCAGGCCCAGGTTGTGCCCACCGATGTTGGCCGCACCCAGGTTGACGTCCCCGACATTTCCGAACC
+CGGTGTTGAAGTTGCCCACATTGGCCAACCCGAGGTTGCCGGCGAGCATCGAGCGCAGCGTGGTTCCCGC
+CGCCGACACCCCCGACAGCTGCTGGCCCAGGTTGCCGATGCCCGACACCGCCGCCGGTGTCCCGAAAGGC
+AACACGCTGGTGTTGTAGAACCCCGAGATCCCTGAGCCCAGGTTGAGCACACCCGAGCCCAGGGTGCCCA
+CGTTGCCAACACCCGAACCGGCCCCCAACAGCGCGCTCGGCGCCTGGTTCCACCAGCCCGAGCTGCCCGC
+GCCGACGTTGCCGAAACCCGACACCCCACCCGCACCGGAGTTGAAGAATCCCGACGACGGGGCCGTGGTG
+GTGTTCCCCACTCCCGGCGCCGCCGGGATATGAAGGCCCTGGATCGTGATGGGGCCGATCGTGACCCCGC
+CCCCCACGGTCAGGGGGATGCGATCGATCGTGATCGGCGGGGTGCTGAACCCGTCGATCTGGCCCTCGAT
+ATCGATCGACAACGGCAACGGCTGCGCGGGAACACTAAATCCCGGGATGGTAAAGCCCGGGTTACTGATC
+GACACACTCACCAGCAACCCCAAAGGATTATCGGGAGCACTGATGCCATTCGGGAACAGCGTGATCGGAG
+GGGTATCCCATCTGATCGTTAAATCAATCTGTGGATTGGTGGGTCCGGGAATGGTGGTGTCGATAACGAT
+AGGGCCGATAAAGCTGACAAGCTGACCGTTAGAATCAAAGGTTTGGATTTGTGGAATTGTGATTTTCCCT
+AAACTGAAGGTGGGAAAGGGCAATTGGTTGACAAATGTCTGTTGGGCAAACAGGGTGATGGGTGTGATGG
+TCAGCGGGCCGATGTTGATGGGTATGCCGATACCGCCGCCGAACGCGGGGATCACGATGTCGGGAACCAC
+CAGCGGGCCCAAGTTGACGGTTTGGTGAATGCTGAGCGGGATGGTGGGCAGGATCGGGATGGGCTGGATG
+GTGATCGGGCCGATGTCGCCGTTGAGCACCAGGCCGATGGGAATTGCGGGGATCGACGAGCCGGCGGAGA
+CGCCGAACAGGCCCTGTTAGTCACCCACCCACAGCACGCCGTTGTTGAAGTTGCCCGAGATGAACGCGCC
+GGTGTTGACGTTGCCCGAGTTGGCGATGCCGGTGTTGGTGTTGCCGGTGTTCAGCCAGCCGGTGTTCACA
+CCGCCGGGGTTGAAGCCACCGGTGTTGGTGTCGCCGGCGTTGAAACTGCCGGTGTTGTAACTGCCCACGT
+TCACCACGCCGGTGTTGAAATTGCCGGCATTGAACAACCCCGTGCTGGCCGTCCCCGCATTACCGACACC
+GGTGTTGTAATTACCCGAGTTGAACACCCCGAAGTTCCCGGTCCCCGAATTGAAGAACCCCACATTCCCG
+GTGCCGGAGTTGAACAACCCGATATTCCCGGTGCCCGAATTCAGGCCCCCGATACCCGTCAGGTGGTTGC
+CGGTGAGCCCGACGCCGACGTTGTTGGTGCCGGTGTTGCCGAAACCGATGTTGCCCACACCCAGGTTTGC
+GAAACCATAGTTGCTGCTGCCCGCATTGCCCAACCCGATATTGCCCAAGCCGGCCAGGCCCGCCCCCAGA
+CCGGAGTTGCCGAACCCGACATTCCCGTTACCGAGGTTGCCGAACCCGACATTGGTGCCACCGGCATTGC
+CGAAACCCAGATTCTGCCCACCCACATTGCCCGCGCCCAGGTTGAACACCCCGACATTGCCCAACCCGAC
+GTTGTAATTGCCGACATTGCCCAAACCCGCATTCAGGCTCAGCGCCTTCGCAGGGCTGGCGAACAGGGCG
+GTAAGGAACGCGCCGACACCTCCCCCCAGCGCCTGCGCCGGTGGGCTGAACGCCGGCAACGCCGCGGCAG
+CAGCCGACGCGCCGGAATGGTAGCCGGCCATCGCCGCCACATCGGCGGCCCACATCAGCTCGTACTCGGC
+CTCGGCGGCCGCGATCGCCGGCGTGTTCTGCCCCAACAGATTCGACACCGCCAACGCCACCAGCCGCGCC
+CGGTTGGCCGCCACCAGCGCCGGATCCACCGTCGCCGCCAACGCCGCCTCAAAGACCCCCACCACCACCC
+GCGCCTGCCCGGCCACCGCCTCGGCCGCGGCCGCCACCGAACCCAACCACCCCGCATACGGCGCCGCCGC
+GGCCGCCATCGCCGCCGCCGCCGCACCCTGCCACACCCCCGCCGTCAGGCCCGACGTCACCTGCCCAAAC
+GACACCGCCGCCGACCCCAACTCCTCAGCCAGCCCATCCCACGCCGCGGCCGCCGCCAGCAACGGGCTCG
+ACCCCGCACCCGAATACATCAGCACGGAGTTGATTTCCGGTGGCAACACCGGAAACTCCATCACCCATTC
+CCCTTCCCAGCCCGACACCAATCCCCACCGACACCCCCCACATGACGTGTCGACGCCCCGATAATTTTGC
+TCGCATTGCCAACGGCCCAAGAACGATTCCCCGATAATCGCGGGTACTGGGTGCACTTTGCACAGACGCC
+GCAGCAAAATGCGCATATGCCCTGTCCAGACCGGCGAGCGGCAGGGCGTCATCTGCCCTGACACTTCGAC
+TGCTGGCGGAGTCCGCGAGCATGCTCACCGCCGCGGCGTGCGCCGAACCGGCAGCGCCGGCAAATCCATG
+ACCCCAGCCTGTTCTTGGGTCACTGCGACGTTCACTTTTAAGCGCGACCACGTAAGGTTGGGCAAAGTTC
+CCAAGCGTTTCACAGTGTCAGTGCACAGTGCGCACCTGATTACCAAAACCCCGAACCTCACTCGAAAGCC
+GAGAGCGGGTAAAAGTCGTTCAGCGACCTGTCTGGTAGAGAAATCCAGACCCGAGTACATGATCCGGTCG
+GGATCGTACTTGCGCCGCACTGTGGTCAGCCGCGACAGGTTCGCGCCGAAGTATTGTGACGCCGCGGCGT
+TGGCCTCCAGGTAGTTGACATAGCCGCCGACCGAAAAGTGTTGCACCGCGTGGTGTGCGTCGCTCAGCCA
+TTTGTTGGCCGTCGCCACCTGGCCGTCGCTGGGGGTGTTGACATACCACTGCACCACAGCGGACTGGCGG
+CACCAGGGAAATGCCGAGCCCTCCGGGTCCATGTCGCCCACCGCGCCGCCCAGCGAATCGATCAGAGCCG
+ACGCGCGGCCCGCAGCGGGTGGCCATGTTCCGATGGCGGCGACGATGGCTTGGGCCGCGGCCGGATTCGT
+CGTCCCGATGACATCGGATCCAGCCACGAAGCCCTCCGGCGGATAGGTCGTATGGCCGCCGGCCAGATAC
+CTCACCAGGTCCATACGGCGCAGCGTCTTGTGCTCAACTCCACTGGGTTGCACTCCAACCGCGGACTTGA
+TCGCATCCGCGACAGCCGCGCCGGACCGCGCCGGGCAGCTCGCCAGCACATGACAATTGCCTCCGGATGA
+GCTGACCGCGGGGTCAACCAGACCCCACGTGGTGCGGTCGGCCCCGGCCAGCCACGTCTGTCAGCCGACC
+AGCACCTGCGCGGCCGCAGACGGCGCGAAATCGACACGGACGACATCGCAGTCCGCGGTGGGGAACCTCG
+CGAACGTCATCGATGTCGTCACCCCGAAGTTGCCGCCCCCGCCGCCACGAAGCGCCCAGAACAGCTCCGC
+GTGGTCGTCGGCAGACGCGCTCACCGCATCACCGCCGGGCAACACCACCGTCGCCGACTTGAGCGCATCG
+CAGGTCAACCCCGCATGGCGAGAATCGGCGCCTAACCCGCCGCCCAGGGTCAAACCCGCCACACCCACGG
+TCGGGCAGCTGCCGGTCGGAATCGCCCGGCTCTCACCGGCCAACGCTTGATGGACCGCATAGAGATCGGT
+CGCGGCCGACACCGTACGTTTCTCGTGGCGCTGTCGAAATGCACCCCGCCCGGTAGGCCCAGCAGATCGA
+GCACCATGGCGCCATTGGCCGACGAGGCGCCGATGTAGGAATGTCCGCCGCCGCGCACAGCGATCTTGAG
+CTTGCTGGCCGCCGCTACGAAACCGCCTTCCGGACGTCTGCCTGCGAGGCGACCGTCACCACCGCGGCCG
+GATTCAAGCCGCTGTAGTTCGAATTGAAGATCTGCTTTCCGCTCGTGAACGCCCTGCCGTTGGCCGGCAG
+CAGCACCTGCCCGCCTATCGATGAGGCCAGACTGGCCCACCCATCACCCGGTGTTGCGCGCGCCAATATC
+GTCGGGAAGACCGCCGACGTCGCCGGCGCTCCGACGGCGCCGCGAAGAAACGTCTGGCGAGACATCACGA
+CCGCGATCGTGTCGTATCGAGAACCCCGGCCGGTATCAGAACGCGCCAGAGCGCAAACCTTTATAACTTC
+GTGTCCCAAATGTGACGACCATGGACCAAGGTTCCTGAGATGAACCTACGGCGCCATCAGACCCTGACGC
+TGCGACTGCTGGCGGCATCCGCGGGCATTCTCAGCGCCGCGGCCTTCGCCGCGCCAGCACAGGCAAACCC
+CGTCGACGACGCGTTCATCGCCGCGCTGAACAATGCCGGCGTCAACTACGGCGATCCGGTCGACGCCAAA
+GCGCTGGGTCAGTCCGTCTGCCCGATCCTGGCCGAGCCCGGCGGGTCGTTTAACACCGCGGTAGCCAGCG
+TTGTGGCGCGCGCCCAAGGCATGTCCCAGGACATGGCGCAAACCTTCACCAGTATCGCGATTTCGATGTA
+CTGCCCCTCGGTGATGGCAGACGCCGCCAGCGGCAACCTGCCGGCCCTGCCAGACATGCCGGGGCTGCCC
+GGGTCCTAGGCGTGCGCGGCTCCTAGCCGGTCCCTAACGGATCGATCGTGGATGCGATGTAGACCATGGC
+CGCCGCGACCGTCACGGTCGTCACGAAATCGATCCCCTTGCTGCGCACCACCAACAGGCCGGCCCGTTCC
+TCGGACAACACCAACCGCAGCACCGCCGCCACCCCAACGCCGATACCGATCAGCAGCGCACCACGGCGCC
+AGAAGTTAGCCCCCGCCAGCACGAACCCCACCGCGAAGATCGACCCAACCAGCAGGATCGGCCACTGGGC
+GCCAACAGTGCGCCGGAAAACGGCCCTCACGGTCATCGCCGCTCAGCCAGCTCCACGACATTGGTCAACA
+AGAACGCCCGGGTCAACGGGCCCACGCCGCCCGGATTGGGTGACACGTGGCCGGCGAGCTCCCACACATC
+GGGATGCACGTCGCCGACCAGTCCGTCATCAGTGCGGCTGACGCCGACGTCGATTACCGCGGCACCCGGG
+CGCACCATGTCAGCCGTCAACAGGTGCGCCACCCCGACCGCGGCCACGACGATGTCGGCCTGCCGGGTCA
+ACGCGGGCAGGTCGCGGGTACCGGTGTGGCACAACGTCACCGTGGCATTCTCCGAGCGCCGGGTCAGCAA
+CAGCCCCAGCGGCCGGCCCACCGTCACACCACGACCGATAACGACCACATGCGCGCCGGCGATCGAGATG
+TCGTAGCGCCGCAGCAGGTGCACAATGCCGCGCGGAGTACACGGCAGCGGCGCCGGGGTGCCCAGCACCA
+GCCGGCCCAGGTTGGTCGGGTGCAACCCATCGGCGTCCTTGGCCGGGTCGACGCGCTCCAACGCCGCGTT
+CTCGTCGAGATGCTTGGGCAACGGCAACTGCACGATGTAGCCGGTGCAGTCGGGGTTGGCGTTCAGTTCG
+TCGATGGTCTCATTCAGCGTGGCGGTGCTGATGTCGGCGGGCAGGTCGCGGCGAATCGACGTGATGCCCA
+CCTTGGCGCAATCAGCGTGCTTACCGCGCACGTAGGCCTGCGACCCCGGGTCGTCACCGACCAGGATGGT
+GCCCAAGCCGGGCGTGCGGCCCGCCGCGTCCAATGCGGCCACCCGCGGCTTGAGGTCACCGAAGATCTCG
+TCGCGGGTAGCCTTGCCGTCCAGCATGATCGCGCCCACGCCAGCCAGTCTGGCATGCGTGTCCGCGGTGC
+CGATGGTGACGACCCGCTCACGCGCCCACCGTACGGACAACTTGTACCATTGTGGTACAGATTATCCGTA
+CATCTTTCTAAGAGAGGACGCATGAGCATCAGTGCGAGCGAGGCGAGGCAGCGCCTGTTTCCACTCATCG
+AACAGGTCAATACCGATCACCAGCCGGTGCGGATCACCTCCCGGGCCGGCGATGCGGTGCTGATGTCCGC
+CGACGACTACGACGCGTGGCAGGAAACGGTCTATCTGCTGCGCTCACCGGAGAACGCCAGGCGGTTGATG
+GAAGCGGTTGCCCGGGATAAGGCTGGGCACTCGGCTTTCACCAAGTCTGTAGATGAGCTGCGGGAGATGG
+CCGGCGGCGAGGAGTGAGAAGCGTCAACTTCGATCCCGATGCCTGGGAGGACTTCTTGTTCTGGCTGGCC
+GCTGATCGCAAAACGGCCCGTCGGATCACCCGGTTGATCGGAGAAATTCAGCGTGATCCGTTCAGCGGGA
+TCGGCAAACCCGAGCCGCTCCAAGGTGAGTTGTCGGGATACTGGTCGCGCCGGATCGACGACGAACACCG
+GCTAGTGTATCGAGCGGGCGACGACGAAGTCACGATGCTGAAGGCCCGATACCACTACTGATTTGGGGGC
+TGGTGGTATTCCGGCGGGCTTAAGCTCCCCATGTGGCTCCCGGCAGCTGCGAAGCCCCGGACGTGTTCAA
+CCCGGCCAAACTCGGTCCGCTCACGCTGCGGAACCGGGTCATCAAGGCCGCCACCTTCGAGGCCCGCACA
+CCTGACGCGTTGGTGACCGATGACCTGATCGAGTACCACCGGCTGCCGGCCGCGGGCGGGGTCGCCATGA
+CCACCGTCGCCTATTGCGCGGTCTCCCCCGGCGGACGCACCGGCGGCAACCAGATCTGGATGCGCCCGCA
+TGCGGTGCCGGGACTGCGCCGGCTCACCGAGGCGATCCACGCCGAGGGGGCGGCGATCAGCGCCCAGATC
+GGCCACGCCGGCCCGGTGGCCGACGCCCGCTCCAACCAGGCGACCGCGCTGGCTCCGGTGCGGTTCTTCA
+ATCCGATCGCTATGCGGTTCGCCCAGAAGGCGACCCGCGAGGACATCGACGATGTGCTGGCCGCGCACGC
+CCATGCCGCCCGGCTGGCCGTCGACGCCGGCTTCGACGCCGTCGAAATCCATTTGGGGCATAACTATCTG
+GCGAGCGCGTTTCTGTCTCCGCTGCTCAACCGGCGTGATGACGAGTTCGGCGGTTCGTTGCAGAACCGGG
+CGAAGGTAGCTCGCGGATTGGTGATGGCCGTGCGCCGCGCCGTCCGGCAGCAGGTCGCGGTGACCGCCAA
+GCTCAACATGACCGATGGCATCCGCGGCGGCATCACAGTCGACGAGGCACTGACCACCGCCAGGTGGCTG
+CAGGACGACGGCGGGCTAGACGCGATCGAGCTCACCGCGGGCAGCTCGCTGGTCAACCCGATGTATTTGT
+TCCGCGGCGACGCGCCGGTTAAGGAGTTCGCCGCCGCGTTCAAACCACCGCTGCGCTGGGGCATCCGGAT
+GACCGGCCATAGGTTTTTCCGCGAATACCCCTACCGCGATGCCTATCTGTTACGCGAGGCTCGGTTGTTT
+CGCGCCGAGCTGACAATCCCGCTGATTCTGCTGGGCGGCATCACCAACCGAACGACCATGGACCTGGCGA
+TGGCCGAAGGGTTCGAGTTCGTCGCGATGGCTCGGGCGCTGCTCGCCGAGCCCGACCTGGTCAATCGGAT
+CGCGGCCGAAGGCAGCCAGGTGCGGTCGGCGTGCACACACTGTAATCAGTGCATGGCCACGATTTATCGC
+CGCACTCACTGTGTGGTCACCGGGGCTCCATAGCGTCCAGATTGACGCCACCGTGAAGAAGTGCAACCCA
+TTGTGCCGGAAATCCGGTTGACTTCCCCGCGCGAATCCGGCTCAAGCACTATTGACCGCGCGCAGCATAA
+TTTGAACCGATGAGTCGACCCCATCCACCGGTGCTGACAGTTCGGTCCGATCGGTCGCAGCAATGCTTCG
+CCGCGGGCCGCGACGTGGTTGTCGGGAGTGATCTTCGTGCCGACATGCGCGTGGCGCACCCACTGATCGC
+CCGTGCGCACCTGTTGCTGCGCTTCGATCGGGGCAATTGGATCGCGATCGACAACGATTCGCAGAGCGGG
+ATGTTCGTCGACGGCCAGCGGGTGTCGGAAGTCGACATTTATGACGGCCTGACTATCAACATCGGGAAGC
+CCACCGGGCCGTGGATCACCTTCGAGGTCGGCCATCACCAGGGCATCATCGGACGGCTGTCACGCACCCC
+GTCGTCGCGTCCCGGCTCACCGATCTAGCCCCCTGCCAAGCACAGCCCGTGCGCCGCCGCAAAGGCCACG
+GCTTGGTCGACGTCGACACGCGCACCCACCAACGACGCGGTCCGCCACAATACCGGGTCCACGGTCGCGC
+CCCGCAAGTCGGCGTCATCCAGCCGGGCGCCCGTGGTACGGGCACCACTGAGGTCGGCGCCGCGCAGCAC
+GCACTTGCGCAAGTCGGTATCCACCAGGCTGGTCTCTCGCAACCGGCAGCCGGTCAAGTTGAGACCACGC
+AGATCATTTCCGCCGAGCACGGCGAGCGTGAAATCCACGTCGTCCAACGTCAGCGGCCGCAGCCGGCAAG
+CCACGAAGACCGAGCCCAACATGCTGCACTGGGCAAATGTGCTGTGCCACAGTGTCGTCCGTTCGAAGGT
+GCAATTACGAAACGCCGACCCTCGGTGTTGTGACTCGGCCAGATTCACGCCGCTGAAATCGCATTCGCTG
+AACATCGCCCGTTCGGTGTGCAGGCGGCTAAGGTCCTCGTCGCGGAAGTCTCGACCGGTGAATTCGCAAT
+CAACCCACTGCTGCAACGCTTTTCAACCGCCCGCAGGAGACAGGGTGGCCAGCGCGTATTCGCTCACCGC
+GATCAGTGCATCGGTCGCCGACCTGCGATTGCGGGCGTCAACATTGATCACCGGAATGTGTGCGGGCAGC
+GTCAACGCGTCGCGCACCGCGCTAACCGGATACCTTGGCGCGCTGTCGAACTCGTTGATGGCGATCAAGA
+ACGGCAGGTTGCGGTGTTCGAAGAAGTCGACCGCCGCAAAGCTGTCCTGCAGACGCCGGCAGTCGACCAA
+GACGATCGCCCCGATGGCACCACGCACCAGGTCGTCCCACATGAACCAGAACCGGCGCTGGCCCGGGGTA
+CCGAATAGATAAAGCACCAGATCCTCGCCCAAGGTGATGCGGCCGAAGTCCATCGCCACCGTGGTGCTCC
+GCTTGTCGGGAGTGGCCTCCAGCATGTCGACGCCGGCGGAGGCATCGGTGACCATCGCTTCGGTGCGCAA
+CGGCATGATCTCCGAAACAGCGCCGACGAATGTGGTCTTGCCGGACCCGAATCCGCCCGCGATGACGATC
+TTCGTCGACGCGGTGCCGGATGCCTCAGAGTGCTTTAAGGCCACGCAGGGTCCTTCCTATGAGTTCGTGG
+CGTTCGTCGCGGGTCGATCGGTCGGTCAAGGTCGCGTGCACCCGAAGGTAACCGGACGTGACCAGATCAC
+CGACCAGCACACGCGCCACACCCACCGGCAAATCCAGCCGAGCCGAGATTTCCGCGACCGACGGACTGCC
+AATGCACAATTGCAAGATCCTGCGTCGCATGTCGTAGGCCGGCCAGCGGCCAGCCGGTCCCGCCGGCAGG
+GTCTGCACCGGCGCCTGAAGCGGAAGGTCGACGTCGGTACCGGTACGTCCGGCGGTCAGCGTGTAGGGGC
+GGACCAGGCCCGCCTTCGGTCTATCGCCGGCAGGATTGAACAACGCCGCCCACCCGCTCGACAAGGATGG
+CCATCTCATAACCGATCTGGCCGATATCGCATCCGGTCGCGGCCAGCGCCGCCAGCGCCGACCCGTCTCC
+CACCTGCATCAACAGCAGGTAGCCGTTCTGCATCTCAACCACCGACTGCAGCACCTGCCCGCCGTCGAAC
+AGTTGCGCGGCGCCGCCGGCCAGGCTGGCCAGCCCGGACGTCACCGCGGCCAACTGATCGGCGCGTTCGC
+GTGGTAGATGTTCGCTGGCCGCCACGGGAAGCCCGTCGACCGACACCAGCAATGCATGGGCCACCCCGGG
+AACCTCGCGGGCGAACTTCGACACCAGCCAGTCAAGCGGGCTGTCCGGCAAGCGGGCTTTCATTGCTGAT
+TGGGTCCCTGACTGCTCTCGCGGGCATGCGACCGCCCGGTGCGCACGCCGCCGAAATGGCTGCTGATGGA
+GGCACGAACCGCGTCGGGGTCGCGTACCGCAGCCGCGTGCCGCGGCGCTCGGCCGGGATGAAGTCCGCCG
+TTGGATGCTAGCGCTGCACCCGGATGCTCCCGATCGGGTCCCTCAGGCACCGCCGCCCCCGGCACTAACC
+GGGCCCCGGGTTCGCGCACCGGCAGGCCGTAGTCCGTGCGGGACTGCACGGGCTTGTCCGCGGCCTCGGC
+GGCCGCCGACCAGCCGTGGTCCCACACCGACTTCCAGTCCAGATCGGGGCTGTGGGCCAGCTCGTGCGGG
+TCACCCACCATCTCGGAGAGCATCCGCCGGTAGATGACGTCGTCATCAACCGGGCCCGCCGGTGGCGCGG
+GTTTGGCGGGCGGCGGCGCCGGTCGCGGTTCTGGTGCGGGCGGTTGTTTGGGCTCCTGTTGAAACCTATC
+CTCCCACCAGGGTGTTTTCAGCTCGCGCCGCCGCTGCTGCATCGGCTGGGCCGGGACGTCGGCGATGCCA
+CTGGACCCCGGGGTACGGCGCGGGAGCAACGTGACCGGTGGTAGCGGCCCGATGGCGGCGGGAACGTCCG
+TCGGATCGGCCGCCGCGGGTTCAGGACACGGCGGCTTGATCGCAAATACCCGCGGCTTTGGCGGCTGCGC
+TGGGGCCGTCCCCTCGAGCACGGCTAGCGGCAGGTAGACCTCGGCGGTGGTGCCGGTGCCCTGTTCACCG
+GTCACCGGACCGCGCAGCCCGACTCGGATGCCGTGCCGACCGGCCAGCCGGCCGACTACGAACAGACCCA
+TGTGCCGGGCACTATCCGGGGTGACCTCACCGCCGGCCCGCAGCCGCATATTGGCCATCCGCCGATCGGC
+ATCGGTCATGCCCAGGCCGGAATCCGAGATTCGCAGCAGAACACTGCCTTCGCTGCCGATTGCGGCGGCA
+ACCCGAACGGGTGTGGTCGGTGACGAGTAGCGCAACGCGTTGTCGATCAGCTCGGCAAGCAGATGAATGA
+CGCCACCAGCCGCTGCGCCGACTACCGCACAGTCGGGTACCCTCGCGATGTCGACGCGGCGATAGTCCTC
+GACCTCTGACACGGCGGCGCTGATCACGGTTGACAGCGGCACCGGCTCGCGGTGGTCACGGGTAATCTGC
+GCACCGGCCAGCACCAGCAGGTTGGCGCTGTTGCGGCGCAGCCGGGCGGCCAGGTGATCGAGCCGGAAAA
+GGCTGTCGAGTCGGGCGGGATCCTCCTCGTTGCGCTCCAGTTGGTCGATGACCGACAGCTGCTGGTCGAC
+CAGGGAACGGCTACGCCGCGACATGGTCTCAAACATCTCGTTGACCAGCAGTCTCAACCGCGTTTCCTCG
+CCGGCCAGCAACAGGGCCCGGGTGTGCAGCTCGTCGACCGCATGCGCGACCTGACCGATTTCCTCGGTGG
+TGTACACCGCCAGTGGCTCGGGGATCGGCTCGTCGCCGGCGCGGACCGCCGCGATCTCGCCGTCGAGATC
+GGTATGAGCAACCTTGAGCGCCCCATCACGCAGTACCCGCATCGGCCCGACCAGCGTGCGCGCCACCACC
+AACACGACGACGATCGCGGTCGCGATGGCGGCCAACACCAGCACGGCGTCGCGAATCGCGGCATCCCGCC
+GGTCGGTGGCCTGGCTTTGCACCGACTTCGTCACCGCCTCGGTGGTGTCGGTGATCACCTGCTCGGCAAT
+GTCGCGGGTGATCTGTATCGAGTGCAGCAGCTCTGGGTTGTTGACCAGTGCAACGGCCGGATCGGACATG
+ATCGCCATCCTGGTCACCATTTGCTGCTGCAGGTTCTTGGTGTCCGGCGAGCCTGCACCGAGCGCCGCGC
+TCATCCCGAACAGCGTCGAGGGTTCGGTGCCGGCCAGGGTAACCATCGCGCTGCGCAGTTGCGGCTCGGC
+AAGGTCGGCGCCGCGAGTCACCAGGATCTCCTGCATCGTCATCTGCCCGCGGGCGCCAACGGCTCGGCTC
+AAACCCTGCACCTGGGTTCGGATTTGCTCGCTGTCAACCCGCACCGACGCGTCAATCACGTTCTGGGCCG
+TCAACAGCAGCGGCGCGTAGGCGGTGACCCGATCCCGCAAGCCGATGCTGTCGGCCAGCACCTTATCCAG
+CAGCGCCTGACCGCCGTTGAGCAGCGTGTTCACTCCCGACCGCACGTCTGCGATGACGTCGGTGTCGGCC
+AGTCGCGTCTGCAGCTCGTACTTGCGGGCGGTGAAGTTTTTCTGCGCCCCCTCCACATCGTGTCCGGTCG
+AGCTGGCCAGCACGGCGACGTCCAGCGCCGACATGTATTTCGTGATCGCGGGTATCATTTCGGCGCGCGC
+GGCGACCAGCCGCAGGCCGCTGGTGCTGGCCATCGCAGCCTCGACCCGCAATCCTGCTAACACCATCGCC
+ACTACCAGCGGCAGAAGCGCGATCGTGAACACTTTCCATCGGACCGGCCAGTTGCGCGGCGACCAGGACG
+GCGGGCGTTGCTGAGGTTTGCCGCGGGCCGGTTGAGCCGGGGCGGAAATATCAGAAGCGGCCGCCGCGAC
+CGGGATGGTCGGGCGGGCGAACATGGTCACGTGGCCGCGGCCGTGCCACCGGCCGCACCCTTATGCAGCG
+CTCGAAAAACGGAGAGACTCATAGACTTCCTGCTCATGCCTTGATGCCGTCCGCCCCAGCCGGCCGGGCG
+CGGACGTAAACAACTGGCAATCCGACGAGTATGACAGCCCACGGCCGAGGTCTCCACCGCTGTCACCGAG
+CATGTCACCGGACAGGCCGGCAAACGGGCACCGGGCGCTTTGCCATGATCGGCGGATGTTCCGGCTGCTG
+TTCGTATCTCCGCGTATCGCCCCCAACACCGGCAACGCCATCCGGACGTGCGCCGCAACCGGCTGTGAAC
+TGCATCTGGTCGAGCCGCTCGGCTTCGACCTGTCCGAACCCAAGCTGCGACGGGCCGGGCTGGACTACCA
+CGACCTGGCCTCGGTCACCGTTCATGCCTCGCTCGCGCACGCCTGGGAGGCGCTGTCGCCAGCGCGGGTG
+TTCGCCTTCACGGCGCAGGCGACGACGTTGTTCACCAACGTCGGCTACCGGGCCGGTGACGTGTTGATGT
+TCGGGCCCGAACCCACCGGCCTGGACGAGGCCACCCTGGCTGATACGCACATCACCGGGCAGGTGCGCAT
+TCCGATGCTGGCGGGCCGGCGCTCGTTGAACCTGTCCAACGCCGCAGCCGTCGCGGTCTACGAGGCCTGG
+CGTCAGCACGGCTTTGCCGGGGCGGTCTAGTCGCGACCAAGGTGACACCGAACCAGCCGGTATGCGCACA
+ACGAAGCTCATCGGCGTCGGGCGCCGGACAGGAGCACCCAACCGGTGACAGCACACCGAACGCAACCCGG
+GCGATCACATCGGACCACGACATCCCGGGAAAATCGATGCCGGTGAGCTTGCGCGTCCAGCTACCACCAC
+CGTCAGCGGTGACACCTTCACCGGCAACAACGGCAGCGCAGGCGCAGCTGTCAGCGGCGGCGCGCAGCGA
+AGGCGTTGCGGTCAATGAATCTGCCGCAAACCCCACGCCCGTTGGCCCATATTGCGCTAGCATCCGGGTG
+TTGTGATCTCGCAGGTTGCGTGCTGGCAGCCTGGGGGTGGGTTGTGATGTCGTTTGTCGTAGCAGTCCCG
+GAGGCATTGGCGGCGGCCGCGTCGGATGTGGCGAACATCGGTTCTGCGCTAAGTGCCGCGAATGCAGCGG
+CAGCCGCCGGCACAACGGGGCTACTGGCAGCCGGTGCCGACGAGGTCTCGGCCGCCCTGGCGTCGCTGTT
+TTCCGGGCACGCTGTGAGCTACCAACAGGTCGCGGCCCAGGCGACGGCGTTACACGATCAGTTTGTCCAG
+GCCTTGACCGGTGCCGGCGGATCGTACGCCCTCACCGAGGCCGCCAACGTCCAGCAGAATCTGCTGAACG
+CAATTAACGCGCCCACTCAGGCGCTGTTGGGGCGCCCGTTAATTGGCGACGGGGCTGTCGGCACCGCCAG
+CAGCCCCGACGGGCAAGATGGCGGTCTGCTGTTCGGCAACGGGGGCGCCGGCTACAACAGCGCCGCCACG
+CCCGGAATGGCCGGCGGCAACGGCGGCAACGCCGGATTGATCGGCAACGGCGGTACTGGCGGGTCGGGCG
+GTGCCGGCGCGGCCGGTGGCGCCGGCGGCAGCGGCGGCTGGTTGTACGGCAACGGCGGAAACGGCGGCAT
+CGGCGGGAATGCGATCGTCGCGGGCGGTGCCGGCGGCAATGGGGGCGCTGGCGGCGCCGCCGGATTGTGG
+GGCAGTGGCGGCAGCGGCGGCCAAGGCGGCAACGGTCTGACCGGCAACGACGGCGTGAATCCGGCCCCCG
+TCACAAACCCCGCGCTAAATGGCGCCGCCGGCGACAGCAATATCGAGCCGCAAACCAGCGTCCTGATCGG
+CACCCAAGGCGGTGACGGCACGCCCGGGGGTGCTGGCGTCAACGGCGGCAACGGTGGCGCGGGCGGAGAC
+GCCAATGGCAACCCCGCAAACACCTCGATCGCCAACGCAGGCGCCGGCGGGAACGGCGCCGCCGGCGGTG
+ACGGCGGTGCCAATGGCGGTGCGGGCGGCGCCGGCGGGCAGGCCGCGTCCGCCGGTAGTTCCGTCGGCGG
+TGACGGCGGCAACGGCGGTGCCGGCGGTACGGGCACGAACGGGCACGCCGGCGGTGCGGGCGGCGCCGGC
+GGGCAGGCCGCGTCCGCCGGTAGTTCCGTCGGCGGTGACGGCGGCAACGGCGGTGCCGGCGGTACGGGCA
+CGAACGGGCACGCCGGCGGTGCGGGCGGCGCCGGCGGTGCCGGTGGTCGCGGCGGGTGGCTGGTCGGCAG
+CGGTGGCAACGGTGGCAACGGTGGCAACGGTGCCGCCGGCGGCAACGGCGCCATCGGCGGTACCGGTGGT
+GCCGGCGGCGTCCCCGCCAACCAGGGCGGTAACAGCGCCCTAGGCACCCAGCCGGTCAGCGGCGACGGCG
+GCGACGGCGGCAACGGGGGCACCGGAGGCACCGGCGGGCGTGGCGGCGACGGCGGATCCGGCGGCGCGGG
+CGGCGCGAGCGGTTGGTTGATGGGCAACGGCGGCAACGGCGGCAACGGCGGCACCGGCGGCTCAGGCGGT
+GTCGGCGGCAATGGCGGCATCGGCGGTGACGGCGCCGGCGGCGGAAACGCCACGAGCACGTCGAGCATCC
+CCTTCGACGCCCACGGGGGTAACGGCGGCGCTGGTGGCGACGCTGGTCACGGCGGAACGGGCGGCGACGG
+CGGTGACGGGGGGCATGCCGGCACCGGTGGACGTGGCGGGTTACTGGCCGGCCAGCACGCCAACTCCGGC
+AATGGCGGTGGCGGCGGTACCGGCGGTGCCGGGGGCACCCATGGCACCCCCGGCAGCGGCAACGCAGGCG
+GCACCGGCACCGGTAACGCTGACAGCACAAACGGCGGGCCAGGCAGCGACGGCCTCGGCGGGGACGCGTT
+TAACGGCAGTCGCGGCACCGACGGCAACCCCGGCTAATTACCAGCCGTTCCAGTGCGTCACGCTCTCGGC
+CGGCAGCCGCTTGGCCGGCCGGAAGTCGATGCCTTGTGTGTAGGCGATCGGAAGCAGCCCGCCTTGGCTG
+TATTCGTCGTAGGGAATGCCGAGCACGTCGGCCACCTTGTGCTCGCCGTTGTCGAGCAGGTGCAGCGTCG
+TCCAGCACGAACCCAGCCCGCGGGAGCGCAGCGCCAGGCAGAAGCTCCACACCGCCGGGAACAGTGAGGC
+CCAAAACGACACGCCACCCACCGCCGACTCGTCTTCCCGGCCTTTCAGGCAGGGGATCAGCAGCACCGGC
+GCCCGGTGCATGTGTTCGGCGAGATAGGTCGCCGAATCGCGGACCCGCCCCATCCGCTCGCCGCGGGTGT
+CGCCGTCGGGGTACTCGGGCGCCGGCCCGCTGAGGTAGCCCCGGGCGTTGGCCAGGTAGACGTCGGCGAT
+CGCCTTTTTCTTGGCGGCGTCCTCGACGAACACCCACTGCCAGCCTTGGGAATTGGAACCGGTGGGCGCC
+TGCAGCGCCAGCTCGAGGCATTCCATCAGCACGTCGCGTGGCACCGGCTTGTCGAAATCGAGACGCTTGC
+GCACCGAGCGGGTAGTGGTCAGGACCTCGTCGACGGACAGGTTGAGGGTCATGTGGGCAGGCTACCGTTG
+GGCCATGAGCGTCGAACTGACACAAGAGGTTTCTGCCAGGCTCACGTCCGACCTTTACGGGTGGTTGACC
+ACCGTCGCCCGATCGGGGCAGCCGGTTCCGCGGCTGGTGTGGTTCTACTTCGACGGGACCGACCTGACGG
+TGTACTCCATGCCTCAGGCGGCCAAGGTCGCCCACATCACCGCCCATCCGCAGGTCAGCCTGAACCTGGA
+CTCCGACGGCAACGGCGCCGGGATCATCGTGGTGGGCGGGACGGCGGCGGTGGTGGCCACCGATGTCGAC
+TGCCGCGACGACGCGCCGTATTGGGCCAAGTACCGCGAGGATGCCGCGAAGTTCGGGCTGACCGAGGCGA
+TCGCCGCCTACAGCACCCGGCTGAAGATCACCCCGACCCGGGTGTGGACGACGCCCACGGGCTGAGCGGG
+CTGGCCCCCGCTCGCCGCCAGAGTGAAATCCACGACGCGTTTGCGGCGTGTCGCGTCGCCCGTTTCACTG
+TCGGCGCAGAGGTTCACCGGAAGTCGCGCGAGCGCGCGCCGACCGCCAGGGTGAGGCGGCCCATCCGTTC
+GGCGACGACGGTGATTGCGCCGCTGGCGTTTTGGACCTGGCCGCGGATCAGCAGCGCCGGCGCCGTGTGC
+GCGAGCTTGCGGTGTCGCGCCCACACCCCGGGCGTGCAGAGCACGTTGACCATCCCGGTCTCGTCTTCGA
+GGTTGATGAACGTCACCCCCTGGGCCGTGGCGGGTCGCTGCCGATGAGTCACCGCGCCGGCGATCAGCAC
+GCGGTCGCCGTCGGACACCGATCCCAGCCTCTCGGCGGGCAGCACCCCCATCGCGTCCAGGTCCGCCCGC
+AGGAACTGGGTCGGATAGCTGTCCGGGGAGACGCCGGTGGCCCACACGTCGGCGGCGGCCAGCTCCAGCT
+CGCTCATCCCCGGCAGCGCCGGGATGTGCGACGACGAGCCCACCCCGGGTAACCGGTCCGGCCGGCCCGT
+GGCCGCGGCCCCGGCCGCCCACAGCGCCTCCCGCCGAGACATGCCGAAGCAGCCCAGCGCCCCGGCCGTC
+GCCAGCGCTTCGACCTGCGGCACGGAAAGCTGCACCCGCGACGTCAAGTCCGGCAGGGAGGTGAACGGGC
+CGTTGGCTGTTCGCTCCGCGACCAGCTTCTCGGCCAGCTCGGCGCCGAGGTAGCGGACGGCGCCCAAGCC
+CAAACGCACCTCCGTTCCGGCGTTCTCACACGTGGCGTGCGCCAGGCTGGCATTGACACACGGGCCGTGC
+ACCGCCACGCCGTGCCGGCGGGCGTCGGCCACCAGCGACTGCGGCGAATAGAAACCCATCGGCTGGGCGC
+GCAGCAGCGCCGCACAGAACGCCGCCGGGTGGTGCAGCTTGAACCACGCCGAGTAGAACACCAGCGACGC
+GAAACTCAGTGCGTGGCTCTCGGGGAAGCCGAAATTGGCAAACGCCTCCAGCTTTTCGTAGATCCGGTCG
+ATCACCTCGTCGGGGGCGCCGTGCAGCGCGCGCATGCCGTCGTAGAACCGGCCGCGCAGCCGGCGCATGC
+GTTCGGTGGAGCGTTTAGACCCCATGGCGCGGCGCAGCTGGTCGGCCTCGGCGGCGGAAAAGCCGGCGCA
+GTCGACCGCCAACTGCATCAGCTGCTCCTGAAACAGCGGCACTCCCAGCGTCTTTCGCAATGCCGGCGCC
+ATCGACGGGTGCTCGTAGATGACCGGGTCGACGCCGTTGCGCCGCCGGATGTAGGGGTGCACCGATCCGC
+CCTGGATGGGCCCGGGGCGGATCAGCGCCACCTCCACCACCAGGTCGTAGAACACTCTCGGCTTAAGGCG
+CGGCAGGGTGGCCATCTGCGCACGTGACTCCACCTGGAACACGCCGACGGAATCGGCGCGGGCCAGCATC
+TCATACACCGCCGGCTCGGAGAGGTCGAGGCGGGCCAGGTCCACCTCGATGCCCTTGTGCTCGGCCACCA
+GGTCTTTCGCATAGTGCAGCGCCGAGAGCATGCCCAGCCCGAGTAGGTCGAATTTCACCAAGCCGATTGC
+CGCGCAGTCGTCTTTGTCCCATTGCAGGACGCTGCGGTTGGCCATGCGCGCCCATTCCACCGGGCACACG
+TCGGCGATCGGGCGGTCGCAGATGACCATGCCGCCGGAGTGGATGCCTAGGTGCCGCGGCAGGTTGCGGA
+TCTGGGTGGCCAGGTCGATCACCTGCTCGGGGATGCCGTCAACGTCGTCGGCCTGCCCGGTCCAGTGGCT
+GACCTGCTTGCTCCACGCGTCCTGCTGGCCCGGCGAGAAGCCCAGGGCGCGGGCCATGTCACGCACCGCG
+CTGCGCCCCCGGTAGGTGATGACGTTGGCGACCTGGGCGGCGTAGTCGCGGCCGTATTTGTGGTAGACGT
+ACTGGATGACCTTTTCGCGCTGATCCGACTCGATGTCGATGTCGATGTCGGGTGGCCCGTCGCGGGCGGG
+CGATAAGAAGCGCTCGAACAACAGCTCGTTGGCCACCGGGTCGACGGCGGTGACGCCCAGGGCATAGCAG
+ACCGCGGAGTTGGCCGCCGATCCCCTGCCCTGACACAGGATGTCGTTGTCCCGGCAAAACCGGGTGATGT
+CGTGCACCACCAGGAAGTAGCCCGGAAATCTCAGTTGGGCAATGACTTTCAGCTCATGCTCGATCTGGGA
+GTACGCCCGGGGCGCGCTCTTGGGCGGCCCGTAACGCTCGCGGGCGCCCGCCATGACCAACGACCGCAGC
+CAGCTGTCCTCGGTGTGCCCGTCGGGAACATCGAACGGCGGCAGCCGCGGCGCGATGAGCTGTAGGCCAA
+AGGCGCACCGCTCGCCGAGCTCGGCGGCCGCGGTCACCGCCTCGGGGCACCACGCGAACAACCGGGCCAT
+CTCCTCCCCGGACCGCAGGTGCGCCCCACCCAGCGGAGCCAGCCACCCGGCCGCGGAGTCCAGCGACCGC
+CGGGCCCGGATGGCCGCCATCGCCATCGCCAGCCGCCCACGTGACGGATCCGCGAAGTGCGCCCCGGTGG
+TGGCGACGATGCCGACACCGAAGCGCGGCGCCAGTCCGGCCAGCGCGGCGTTGCGTTCGTCGTCGAGCGG
+GTGACCATGATGGGTCAGCTCGATGCTGACCCGGCTGGGGGTGAACCGGTCCACCAGATCGGCCAGCGCC
+CGCTGCGCCGCGGCCGGGCCACCCTGGGAAAGCGCTTGGCGCACATGGCCTTTGCGGCAGCCAGTCAGGA
+TGTGCCAGTGCCCGCCGGCGGCCTCGGTTAGCGCGTCGAAGTCGTAGCGCGGCTTACCCTTTTCGCCGCC
+GGCCAGATGCGCCGCCGCCAGTTGCCGCGACAACCGCCGGTAGCCTTCCGGGCCGCGGGCCAACACCAGC
+AGGTGCGGGCCGGGCGGATCCGGCCGCTCGGTGCGAGCCGTGGCGCCCAGTGACAGCTCGGCGCCGAAGA
+CCGTGCGCACGTCGAGTTCCGCGGCCGCTTCGGCGAACCGCACCGCCCCGTACAGGCCGTCGTGGTCGGT
+CAGCGCCAGGGCACACAGGCCCAGCCGGGCGGCCTCCTCGACCAACTCCTCGGGCGTGCTGGCCCCGTCG
+AGGAAGCTGTACGCCGAATGCGCATGCAGCTCGGCATACGCGACGGACGATCCGACCCGTTCCCGGCCCG
+GCGGCTGGTACGCCCCGCGCTTGCGGGACCGTGGGACGTCCCCATCCGCGTCGAACGCCGGCACCCCGGC
+ATGGCGCGGCTTGCCGTTAAGCACCCGTTCCATTTCCGCCCAGCTCGGCGGCCCGTTGCTCCACCCCACA
+TTCCACAGTATATCGAACAATTGTTCGATACAGCGCAGTTGTTCAGCACATCTTCACCTGCGAAACATGT
+TCTTAACCGTTTGGGCCTTCTGCTTCCGGTGCGGTCCGGCGGACACTTATACCTGGGGTCGCAAAACGAC
+GGTGGGGACTTGTCATGGCACAACTGACGGCACTGGATGCGGGTTTTCTCAAGTCCCGCGATCCGGAGCG
+GCACCCGGGCCTGGCGATCGGCGCAGTTGCCGTCGTCAACGGTGCCGCCCCCAGCTACGACCAGCTCAAA
+ACGGTTCTCACAGAACGGATTAAGTCGATACCTCGATGTACCCAGGTGTTGGCGACCGAGTGGATCGACT
+ATCCGGGATTCGACCTCACCCAGCACGTGCGACGGGTGGCGCTTCCCCGGCCCGGCGACGAAGCCGAGCT
+GTTCCGGGCCATCGCGCTGGCACTGGAGCGTCCCCTCGACCCGGACCGCCCGCTGTGGGAATGCTGGATC
+ATCGAAGGCCTCAACGGCAACCGCTGGGCGATCTTGATAAAAATCCACCATTGCATGGCCGGCGCCATGT
+CGGCGGCCCACCTGCTGGCCAGGCTCTGCGACGATGCCGACGGCAGTGCCTTCGCTAACAATGTTGATAT
+CAAACAGATTCCGCCGTATGGCGATGCGCGGAGCTGGGCCGAAACGCTGTGGCGAATGTCCGTCAGCATC
+GCTGGCGCCGTCTGCACGGCCGCGGCACGCGCCGTCAGCTGGCCGGCAGTGACGTCACCGGCCGGCCCGG
+TCACCACCAGGCGGCGGTACCAAGCGGTGCGCGTTCCCCGCGACGCCGTCGACGCCGTGTGCCACAAGTT
+CGGGGTGACCGCCAACGACGTCGCGCTCGCGGCCATCACCGAGGGCTTCCGAACGGTTCTGCTGCACCGC
+GGCCAGCAACCGCGCGCCGACTCACTGCGTACCCTGGAGAAAACCGATGGCAGCTCGGCCATGCTGCCCT
+ATCTCCCCGTCGAGTACGACGACCCGGTGCGGCGATTGCGCACCGTGCACAACCGGTCACAGCAGAGCGG
+CCGTCGTCAACCCGACAGTCTGTCGGACTATACGCCTCTCATGTTGTGCGCCAAGATGATTCACGCGCTA
+GCTCGGTTACCGCAACAAGGCATCGTCACCCTGGCGACCAGTGCACCCGGGCCACGCCACCAGTTACGGC
+TGATGGGCCAGAAGATGGACCAGGTGCTGCCCATCCCGCCCACCGCACTGCAGCTGAGCACCGGGGTCGC
+GGTCCTCAGCTACGGCGATGAGCTGGTGTTCGGCATCACCGCTGACTATGACGCCGCGTCCGAAATGCAG
+CAGCTGGTCAACGGTATCGAACTGGGTGTGGCGCGTCTGGTGGCGCTCAGCGACGATTCCGTGCTGCTGT
+TTACCAAGGATCGGCGTAAGCGTTCATCCCGCGCACTCCCCAGCGCCGCGCGGCGGGGGCGGCCCTCTGT
+GCCGACCGCCCGAGCGCGTCACTGACGCCATCTCCGTCGGCGTTGACCCCCGTGAGAGGGTGGGTCGTGC
+GCAAGTTGGGCCCGGTCACCATCGATCCGCGCCGCCATGACGCGGTGCTGTTCGACACCACGTTGGACGC
+CACCCAGGAACTGGTCCGGCAACTCCAGGAAGTCGGTGTGGGCACCGGCGTCTTCGGTAGTGGCCTAGAC
+GTTCCGATCGTAGCGGCCGGCCGTCTGGCGGTGCGGCCGGGCCGGTGCGTGGTCGTCTCGGCCCACTCGG
+CGGGCGTCACGGCCGCACGCGAAAGCGGATTTGCGCTGATCATCGGTGTCGACCGCACCGGGTGTCGGGA
+CGCATTGCGTCGCGACGGCGCCGACACGGTGGTCACCGACCTAAGCGAGGTCAGCGTGCGCACCGGGGAC
+CGACGCATGTCGCAGCTGCCCGACGCGTTACAGGCACTCGGCCTGGCCGACGGCCTGGTCGCCCGGCAGC
+CCGCGGTGTTCTTCGACTTCGACGGCACGCTGTCCGACATTGTCGAGGATCCCGACGCGGCCTGGCTCGC
+CCCCGGTGCCTTGGAGGCACTGCAGAAGTTGGCCGCGCGCTGTCCGATCGCGGTGCTCAGTGGCCGCGAC
+CTGGCCGACGTGACACAGCGGGTGGGTCTGCCCGGCATCTGGTATGCCGGCAGCCATGGTTTCGAATTGA
+CCGCACCCGACGGAACGCACCACCAGAACGACGCCGCGGCGGCAGCCATACCGGTGCTGAAACAGGCGGC
+TGCCGAGCTGCGCCAGCAACTTGGACCCTTCCCGGGTGTTGTGGTGGAGCACAAGCGGTTTGGCGTCGCC
+GTGCACTACCGCAACGCGGCCCGGGACCGGGTCGGCGAAGTCGCCGCGGCGGTGCGCACGGCCGAGCAGC
+GTCATGCGCTGCGGGTGACGACGGGCCGCGAAGTCATCGAGTTGCGTCCCGATGTCGACTGGGACAAGGG
+GAAAACGCTGCTGTGGGTTCTTGACCATCTGCCGCATTCGGGCTCGGCTCCCCTGGTGCCGATCTACCTC
+GGCGACGACATCACCGACGAGGACGCTTTCGATGTGGTCGGCCCCCATGGTGTTCCAATTGTGGTGCGCC
+ACACCGACGACGGTGACCGCGCCACCGCCGCACTGTTTGCGCTGGACAGTCCCGCACGGGTCGCGGAGTT
+CACCGATCGGCTGGCGCGTCAGCTCCGTGAGGCTCCCCTGCGGGCAACGTGAGACGCGGTGCCGCCGCGG
+GCGATACGCTCCGACCGTCAACGAGGAGGACGGCCATGTGGTTTGCATTGGTGAACCCGGAGATGCTGGC
+CGCGGCGGCGACAGACTTGGGCGGCATCAGGTCAGGGATCAGCGCCGCCTATGCGCGTCCTCTGCGGTGA
+CCTGGCTGGTAGCTTAGGCACGTCTTTATCGACACCGGGTGCTGCCAGAGAACTCGAGACGCGGCACAGG
+TCGGCACCATGAGGCGGCGTGCAATGACGAAGATGGACGAGGCTAGCAATCCGTGCGGCGGGGACATCGA
+AGCTGAGATGTGCCAGTTGATGCGCGAGCAACCACCCGCCGAAGGCGTCGTCGATCGTGTCGCGCTGCAA
+CGCCATCGAAACGTTGCGTTGATCACGCTGAGCCATCCGCAGGCGCAGAACGCACTCAACCTGGCGAGCT
+GGCGTCGGCTGAAGCGGCTGCTGGACGATCTCGCCGGCGAATCGGGGCTGCGGGCGGTGGTGCTGCGGGG
+CGCCGGTGACAAGGCGTTCGCCGCGGGTGCCGACATCAAGGAGTTTCCGAACACCCGCATGAGCGCCGCG
+GACGCCGCGGAGTACAACGAGAGCCTGGCCGTCTGCCTGAGGGCGTTGACCACGATGCCGATCCCAGTCA
+TCGCGGCGGTCCGGGGGCTCGCCGTCGGTGGCGGCTGTGAGCTGGCGACGGCCTGCGATGTGTGCATCGC
+GACCGACGACGCGCGCTTCGGCATCCCGCTGGGCAAGCTCGGCGTCACGACGGGCTTCACCGAGGCGGAC
+ACCGTCGCGCGCCTCATCGGTCCGGCGGCGCTGAAGTATCTGTTGTTCAGCGGAGAACTGATCGGCATTG
+AGGAAGCCGCCCGCTGGGGATTGGTGCAAAAGGTCGTCGCACCACAGGATTTGGCGGCCGCGACGGCCAA
+ACTGGTCGGCCAGGTCTGTCGGCAATCCGCGGTGACCATGCGTGCGGCGAAGGTGGTCGCCAACATGCAC
+GGCCGAGCGCTGACCGGCGCCGACACCGATGCGCTGATCCGGTTCGGTGTCGAAGCCTACGAGGGGGCGG
+ACCTACGCGAAGGGGTGGCGGCCTTCAGCCAGGGACGCCCACCCAAATTTGATGATTAGCGCCATGACCG
+ATGCTGACAGTGCGGTCCCTCCCCGACTCGACGAGGACGCGATCTCGAAACTCGAGCTGACCGAGGTCGC
+CGACCTGATCCGCACCCGGCAACTGACGTCGGCAGAAGTGACCGAGTCGACGCTGCGGCGTATCGAAAGG
+CTTGACCCCCAGCTGAAGAGCTACGCCTTCGTCATGCCGGAAACTGCGCTAGCGGCGGCACGTGCCGCCG
+ACGCCGACATCGCGCGCGGCCACTACGAGGGTGTCCTGCACGGCGTACCGATCGGCGTGAAGGATCTCTG
+CTACACGGTCGACGCCCCGACCGCGGCCGGCACCACCATCTTTCGTGACTTTCGCCCGGCATACGACGCG
+ACGGTTGTCGCGAGGTTGCGCGCGGCCGGCGCGGTGATCATCGGCAAGCTGGCCATGACGGAGGGGGCCT
+ATCTCGGCTATCACCCCAGTCTGCCGACCCCGGTCAATCCCTGGGACCCGACAGCGTGGGCGGGCGTGTC
+CTCGAGCGGCTGCGGCGTGGCCACCGCGGCGGGATTGTGCTTCGGCTCGATCGGGTCGGACACCGGGGGG
+TCGATTCGCTTTCCGACGAGCATGTGCGGCGTCACCGGGATCAAACCGACGTGGGGCCGGGTCAGCCGTC
+ACGGCGTCGTCGAACTTGCGGCAAGCTACGACCACGTCGGGCCGATCACCCGTAGCGCTCACGATGCGGC
+GGTATTGCTCAGTGTCATAGCGGGATCCGATATCCACGATCCCTCGTGCTCGGCGGAGCCCGTTCCGGAC
+TATGCCGCCGACCTCGCCTTGACACGGATTCCGCGTGTCGGGGTGGACTGGTCGCAGACGACGTCGTTTG
+ACGAGGACACCACGGCGATGCTGGCCGATGTCGTCAAAACGCTCGACGACATCGGATGGCCCGTCATCGA
+CGTCAAGCTGCCCGCGCTTGCGCCGATGGTGGCAGCGTTCGGAAAAATGCGCGCGGTCGAAACGGCGATC
+GCGCATGCCGACACCTACCCGGCGCGCGCCGACGAGTACGGGCCGATCATGCGCGCAATGATCGACGCCG
+GACACAGGCTGGCTGCGGTGGAATATCAGACGCTGACCGAGCGGCGTCTGGAATTCACGCGATCGCTGCG
+TCGCGTGTTCCACGACGTGGACATCCTGCTGATGCCCAGCGCCGGAATTGCCTCGCCCACACTGGAAACC
+ATGCGCGGGCTCGGACAAGACCCGGAGCTGACCGCCAGACTGGCGATGCCGACAGCACCGTTCAACGTCA
+GCGGTAATCCCGCGATATGCCTACCGGCGGGAACGACGGCGCGCGGAACGCCGCTCGGCGTCCAGTTCAT
+CGGCCGTGAATTCGACGAGCACTTGCTCGTCCGAGCCGGCCACGCATTTCAGCAAGTCACCGGGTATCAT
+CGCCGACGCCCGCCGGTGTGAAAAACCCTCGGCCGCAAAAGGCTTGCGAATGTCGCACCGAAGGTCGCGG
+CGAATCGCCTTACTGGTATGTTTACGAACACAATCTGTGGCCATCAAGGGAGGACGCGTTGAGCATTAGC
+GCGGTTGTTTTCGACCGTGACGGTGTGCTCACCAGCTTTGACTGGACACGTGCCGAGGAGGATGTGCGGC
+GAATCACGGGCCTACCATTGGAGGAGATCGAACGCCGCTGGGGTGGGTGGCTCAACGGATTGACTATCGA
+CGACGCGTTCGTTGAAACCCAGCCAATTAGCGAGTTCCTCTCGAGCCTGGCGCGCGAGCTCGAGCTCGGT
+TCGAAGGCAAGAGACGAGCTAGTGCGCCTCGACTACATGGCGTTCGCCCAGGGATATCCAGACGCGCGTC
+CAGCCCTTGAAGAAGCCCGGCGCCGTGGCCTCAAGGTCGGTGTTCTCACAAACAACAGCCTGTTGGTCAG
+CGCCCGCAGCCTCCTTCAGTGCGCCGCTCTGCACGACCTCGTCGACGTCGTGCTGAGTTCGCAGATGATC
+GGAGCTGCCAAGCCTGACCCGCGGGCCTATCAAGCGATCGCGGAAGCCCTCGGCGTCTCGACAACGTCAT
+GCCTGTTCTTCGACGACATCGCCGACTGGGTTGAGGGCGCACGGTGCGCGGGCATGCGCGCGTACCTCGT
+GGACCGTTCCGGACAAACTCGCGACGGCGTCGTTCGCGATTTGTCCAGCCTTGGAGCGATCCTGGACGGC
+GCGGGACCATGACCGAACGTGACGAGCCGGACATCGCCGACAGGGACGCCTCATTGGTTACTCTCATCGA
+CCAGCCGCAGTGCACTTAGGATGGCAGCCTTAACTACCGTCGCCGAGCAGTAAAGTGTCTTGGCAATCCA
+CAACGGCGCGTATGGCGGTTCGCAGTGTTGCGATAGCCACCCACCCGCGCGACTGATCTGCGCCGACAAG
+GATGTGCCGCTGTGCCTCTGCCAATGCGCCAGAGCTTGAATGCAATATGCTGTCTCTTCCGCAGTCGCTT
+GGCCGTCGAAAAATCCCCACGAGCCATCGGGCCTCTGCGTATTAAGAATCCACCAACCGCATCTGAGCAT
+AGGGCATCATCATAGTTACTGGCAGCACATATCAGATGCGCAGTCGTATAATATGCCGATCGGTGCCACT
+TATCCCGCCAGCAGAACCGTCCAGGCTCCTTGCTTGATCGGATGAATTCCAGAACCTTTCGTACTCGTGG
+ATGACATTTGTCGTAGCCCGCCTGCTTCAACGCACCGAGCACGTGGACGTTCGTCGATATCGAGGGGCCG
+ACTTCGTGAAAGTAGGTACGGAACCAATCGGCGTCTTCGAATTGTAATACGGCTCCGATATCCGGCGACC
+GTCCAAACTTCGACAAAACATCGTAGGCCACACTTGTGGTGTCACAATCTTCCAAGGTGGAATTTCCTGT
+CCACCCCACACCTCGACCACGGACCCAATGTTGTTCGACATGGTCAAGATAGGGTAGGTACGTACGAACG
+ATCTCAGGATCGGACAAATCAATATCCGTACGCGAGAGATTCCATAGAGACCAAACAATTTCAAAAATCT
+CGGCTTGATAGAAGGCCGGCGCACCGCCATCGCCGGCTTGAATTATCGATGAGATGTACGCCAAGGCCCG
+CTTGTCTCCTGGTTTAACATGTAACGCGAAGTAGGCTGACGCTGATGGCGAATACTTGACCGATCCATTT
+GTCTCCTGCAAGTTATCGACATCCAACATACCGACACCGTCTTGGCCGGCCAGTTCTACGGAGAAAGCTG
+CGGTGATATGTTTATTGATTTTGCTTCCGCCGAGTTTTCTCAACTTCTGCTCACGCACTCCGACAAGCTC
+GCCGAGGATGGATTCCTCGTGGCAAATGGCAAGGCCAAGTCGCGCCGCCTCAGCCATCAGCGTAGGTGCG
+ATTAACTCAAACCCGACGGTTGCGTCTTTTATATCAAGTTGAGGGCCTTCGAAAGCACCCGAGGTAAGGT
+TCTTCAGGGCTAGCAAGCCTTTTTCAACTTGCGCTGCGCGCCTCCGACGATGCTTATTCGACGTGAGGCT
+GATCATGGCCGCCAAAGTGGAGAGCAGTCGATCTTCGTAGCAGAAAGGGAACTCGGCTCCCCATGAGCCG
+TCAGGAAGCTGGCGCTCGCAAAGCCAGTTGAGGGCGAGGTCGCTTAGCTCATCATCGAGCTGGCCCAGCT
+TCGCGACCCACGCGGTGTCATAGGCTGTGCTCGAGATGCCGTTGCCTAGTGCCGCTTTCGCTAGCAGAGT
+CCTGAAAGTCTCCATACCATCAGCCCTCCGCGAACCAGATTCCATCATGAACACAACCCACACCGAAAAC
+TCTGTCAGGCTGGGCTCGATATCTGTTGCGCAGTACATTGAGCTGATCGGCCGACATCGCTGAATAGTCA
+GGTTTGGGCCGGAAATGACGGAGATAGATATGATCGTACAAGATCCTCCGGAGCGTTGTTTCGGTCATAT
+AGTATGAGGGAGCAACGGTGAAGTATAGACTCGTTTTTCCTGAGCTGAGCAGCGGAAAATCGAAAGTGCT
+GAAACGCCCAAATCCGATGAACATGTCAGCCTTGTCAACATACTCGCCGTAATAACCTTCGATAATCTCT
+CTCCGCGTGGGAGGTTTACCATGTGTTTCGTTCCACGAGATAGAAAACTGCGCAACAGACTCAGCCGCAT
+CGTTGCCAAAAACACCGAAGCATAGTCTGTGTTCAGTGTTGGATGACGTAGAGATTGTTAGGTCATCGAA
+TGACTTGACAACGGCTGCCCCTTGCGCGGTCGAAGGCAATCTTTTCTTATAATCACCATAAAAAAGAACG
+TGGACCTCGTGTTCTTTATAGAACGACAGAATTTCCTCGTCGTTGGCAAGCAAGGCCATCCCTTCGAGCG
+CCTGTACGATATATCGATCACCACGATCCAGAAGATCGTCGCTAAAGATTGGCGAGATTACTGTTTCGAT
+GCCGTGCTCGAAGAGCATCTTCAGAATACGAATTGATTGACGCAAGGCGGCCTGCTGATAATCGTCGTAC
+TGCGGATTACATTCGAGGTGAAACCAGCGGCGTGTGCCATCGAAGGGAAAGACGGATACCTTCGGTCCAC
+GGCAACGTACAATCTCTGCTACGGATACTAGAGGAAGATCCAAGAATTCTTTTTCGCTAACCAAGTTCAT
+GCTTCCTCTTAATAACTATCGCCGGAATCAGGATGGTCTTCGGGTCCAGGGACTTCATGTAGTGCGTTAA
+GTAGTGATTTGCATCTTATGCGGATTGCGGGGCCGGTGAGTCCGTGGCTGGAAAGGATGTGGTCGCGGCT
+GGCGTGGGGAATGTAGGCCGGTGGCAGTCCCAGTGTGTAGGTGCGCGTCCGCGGGTGTGTCCGCCCGATG
+TGGTGGCTAAGGTGCGCGCCGATTCCCACGTCGGCAATCGCATCTTCGACACACACGGTGATCCGATGGC
+GGCCAGCCAGCTCGGTCAGTGCCGGGCTGATTGGCCAGACCCATTGTGGATCAACGACTGTCACCCCGAT
+CTGCTCCTCGCTGAGGCACCGGGCGGCGTCCATGCATGGTCGACTCATGGCACCCACTGCGACCAAGAGC
+ACGTCGGGTCGCCAATGCGGTGGTGGTGTATGCAAGACGTCGAGGCCACCGATGGTGTGTTCGGCCGTGA
+TCGGTTCGCCCGGCGCCCCTTTGGGGAAACGCACGGCGGTGGGAGCCGCGGTCGCGATCGCGGTACGCAA
+CTGTTGTCGTAGCCGAGGCGCGTCGCGCGGACAGGCGATCTGAAACCCGGGCACGCAGGCCAGCAGCGCC
+AGATCCCACAAACCGTGATGGCTGGGTCCGTCGGGCCCGGTTACCCCAGCCCGGTCCAGCACCAGCGTCA
+CGGGTAACCGGTGCAGCCCGATGTCGAACAGAAGTTGGTCAAAGGCGCGGTGCAGAAACGTCGAGTACAC
+CGCGACAACGGGATGGGTTCCCGCGGCAGCTAGCCCGGCCGCGCTGGCCAACAGGTGTTGTTCGGCGATG
+CCCGAATCGAACACCCGATGCGGGTATCGCCTCGACAGCGCGCCTAGACCAGTGGGCAGACGCATCGCCG
+CGGTCAGCCCGACGACGTCGGATCGGTCGTCAGCAATGCGCGCGATTTCGTCCTCGAACACGTCGGTCCA
+GCTCCGCTGACTGGGTGTGCTAGCGAGGCCGGTGGCAATGTCGACCACCCCGTAGGCGTGCATATGGTCC
+CTCTCGTCAGCTTCGGCTGGAGGATAACCCCGGCCCTTACTAGTCACTGCGTGAACAACAACGGGCCTAG
+CTGCCGCGGCCGCTTTTCGTAGAACCGCGCACGTGTCGGGGATGTTGTGCCCATCGACCGGACCGATGTA
+GGTAAATCCCATGTTCTCAAAGAGGTTCGGCCCTCGGGGTGTGCCGACGCGAAGTTCTTCTAGGTGTGCC
+GCAAGAGCCCCAGCGGTGGGGTCGTAGGAGCGGCCATTGTCATTGAGCACGACGATCACGGGCCGGGTAG
+CGGCACCGAGGTTGTTCAGGCCCTCCCATGCCACGCCCCCGGTGAGGGCGCCATCACCGATCACCGCGAT
+GACACGTCGGTCGCATTGCCCCTGCAGGGCCAATGCTTTGGCGATGCCGTCCACCCAGGCGAGGCTGACC
+GAGGCATGGGAGTTCTCGACCCAGTCATGTGGCGATTCATGGCGGTTGGGATACCCCGATAGACCATCGG
+CCTGGCGCAGCGTGGCGAAGTCTTTACCGCGGCCGGTGAGCAGCTTGTGCGGATAGGTTTGGTGCCCGGT
+GTCGAACACCACGATGTCGTGTGGCGAGGTGAACACCCGATGCAATGCGATGGTCAGCTCTACCATGCCA
+AGTCCCGCGCCGAGATGGCCACCGGTAGCCGTCACTGTTTCTATGAGCCGCCGACGCATCTGCACGGCCA
+GCTCTGGCAGCTGGCTTTCGGGCAATGCCTGCACATCGCAAGGTCCGCCGATCGCGGTAATCAAGTCCCC
+GCGTCCGTTGCGAATCGTGGTTGTCATTGCGCGCGAACCTGTTTGGGAAGGCCGAATCGCACCGTCTCGG
+TCGCTATCGAGCGTTCCACCACGGTGATCGAGGCGTATCCGCGAAGTGCATCAATCACCTGCCCCACCAG
+TCGTGGCGGCGCGGAGGCTCCCGCGGTGACACCGATCGTCGAGACCGACGACAGCCATTCGGGCTCAATG
+TCATCAGGCCCGTCAATCAAGTAGGCCGGCGTCCCACTTCGCTGCGCCAACTCGACCAGACGCCGCGAAT
+TCGACGAATTGCACGAGCCAATCACCAACACAACGTCACATTCACCGACCATCGATTGCAGCGCACGCTG
+TCTGTTCGTGGTGGCATAGCAGATGTCTTCAGAGGGGGGTTGGCCCAACGTCGGAAACCTCGCGCGCAGC
+GCATCAATGACATCGGCAGTTTCATCAAGTGCCAGGGTTGTCTGGGTCAGATACGATAGCTGGGTACCCT
+CGGGCAGGTTCAACGCTGCCACATCAGCGGGTGTCTGCACCAATAATGTTGACCGCGGAGCGACGCCAAG
+CGTGCCTTCGGTCTCCTCATGTCCGGCGTGCCCGATGAAGACCACCGTGTCACCGCGCGCGGCAAACCGT
+GCGGCTTCAGCGTGGACTTTCGCCACCAGTGGGCAGGTCGCGTCGACGACCTGCAGTCCCCGCTCATCAG
+CGCCCGCGCGCACCGCCGGGGAAACCCCATGCGCGGAGAACACCACGACCGCCCCCGGCGGCGGCGGATC
+GGGAATCTCGTCGAGATCCTCGACGAACACTGCTCCCCGGTCCCGCAACTCGGCAACCACAACAGTGTTG
+TGCACGATTTGCTTGCGCACATACACCGGGCCTTCGGCCACGTCAAGCACTCGCTTGACCGTCTCGATAG
+CACGCTCTACACCGGCGCAAAACGACCGCGGCGACGCCAACAGCACCGTGACTTCACCCGAAGCGTATCC
+CTGTGCGACCGGTCCCACGAACACCTCAGCCATCAGCACTCCCGGCGACATATCAGTTGCGACAACGCGA
+TCAGGTCTGGGGATCGCACCGCATCGGGCAGTGCCGCAATAGCAGCCTGGATGCGTTCATCGGCGCATCG
+CTGCGCCACATGACCACCCCCGGCCACCTTGACAAGCGCGGTAGCCCGCTCGACATCGCTTGCTGTCATT
+GCGGCAGGTGCTTGATAGAGGGCCGCCAATTCGGTCGCCGCTTCGGATCGCGAGTTCAGGGCGGCAACAA
+CTGGCAGTGTCGCCTTACGTCGGGCAAGGTCGTTGCCGACCGGCTTTCCCGTCACACCAGGGTCACCCCA
+GATGCCGATCAGATCGTCGACGCATTGAAACGCAAGACCCAACTCATGGCCAAAACGCTCCAACGCAGCA
+ATCGTCGCGTCGTCTGCATTGGCCACTAAAGCTCCCAGAGCGCAACAACAACCGGTCAGGGCGGCCGTCT
+TGCCCGCGGCCATCCGCAGATAGTCATCGACTGTAACTTCGGGCTGTCCCTCCAATAAACAATCCTCAAA
+CTGGCCGATACACAAGTCCAGGCACGACATCTGCAATCGCCTTATCGCCCTGACCGCCACACACTCGTCG
+GTCAGGCCGGTCAGTATCCGAACGGCCGTGGCGTGCAACGCATCTCCCAACAGGATCGCGCCGCCCACAC
+CCCACACACTCCATACCGTCGGCCGTCCCCTGCGAGTCGCATCCCCATCCATCACATCGTCATGCAACAA
+CGTGAAGTTGTGCACCAACTCCACAGCCGCCGACACCGGAGTAGCATCACCGACATCACCACCGCAAGCC
+GCGGCCGCCGCGTAGACAAGGGCGGCGCGAAAATACTTGCCCGACGATCCTGCCGCTGTGGATCGATCGG
+CGTTCCACCAGCCAAGGTGATATCCCGCCATCGTCGCCAACGGCTCGCGCATCGACTCAATGGCCCGATG
+CAGCACAGGGCCACAATCCGCTCGAGCCCGTTCTAACAATGCTTTCCCAAGGTCAGCAGGGACACTCCCC
+AGAAAAGCCGCATCCAGAGTCAATACGCCTCCCATTCTTAACCTCACCGGAGCAACAGTGAGTCGCTATT
+TTCAGCGAACGAGCAATCGGCGATATTGCTTCACTTCGGAGATACCCAAATATTTCAAATATCAACGCAA
+CATGTACCTATGCCCGTCGACCAACACGACCATCAGGGTTGTTAGCAATGATCTCGGAATTCGAGTTGTC
+CAGACGCCCCGGGTCATCCACTACAGAAAGACACGCATACCCTGCGGCGACCTATACTTCCCATCACGGC
+GGGTAGGTTGCCTTCGACAATACTGCAACATTCAATTGCCTGGCCTTTCTCGGAGTATCTTGCGGACTTG
+AAGCTCACACATCGGCCGGCGTCGAACGCCTCACGCTGCAGAGCAGTTTAGTGGATTTCATCAGCATCGG
+ATATGCATAATTGAAACCACAGCACTTTCATAAACAGTGTCCAGATGATTTACACCTAATTTGGGCGGCG
+AATGCTACGCAATGGTGGTGCGCTTCCCAAGGGAGCACAACGCGAAGCTAAAGCAGTTGCACGCCGAGAC
+CGAGCCGAAAGGTCGCCCTGCGGGGAAGGCGGCCACGGGAGAATTGTGAGCTCGGCGGTCGACCACGACG
+TACCCGCCACGCCGTAGTAATGGGCATTTGTACATGTACATTCGCACACAAGGAGAGGTCTTGACGTATC
+TATTCCCTCTCTGCGCGATCGCGGCGGAGGCGGCGGCAACCAGCCTGTTCAAGGGCAGTTTCGGGGACTT
+TCGCGTCTGCTCGCCGGGTCACGACGGGGCGATCACGGCCATGCCGAGCGTCTTGGCGGCGTCGCGCATC
+CGGTCGTCGTAGGTGCACAACCGGCCCAGATCGACGCCGAGCCGCTGCGCCGTCGCCAAGTGGATGGCAT
+CGAGCGTGCGCAGCTCGAATGGCAGCAGCCCACCAGCGAGATCGAGGACGCGCTTGTCGACGCGCAGCAG
+ATCGAGATGAGCCAGCGCCCGGCGGCCGGCTTTCCGCGCTGATTCACCCTTGTCAAGCAGGGCCCGCATG
+ACCTCCGCGCGCGCAAGGGCACTCGACACTCGCGGGTGGCGGGTGCGAAGGTAGCGGCGCAGCGCGTCCG
+ACTCTGGCTCGCGAACCGCGAGCTTGACGATCGCGGACGAGTCGAGATAGATGGCCGCCATCAACGCTCG
+TGCTCACGCAGGCGCGCAAGCGTCACCGACGGCAGCTCGACGCCCGCGTCGAGGTCGAGCGGTTCGGGCA
+GATCAACGACGTCGAGCGTGGCACGCTCGATCTCGCCGCTTGCCAGCAGCTGCTCGTATGGACCGCCCTG
+CGGCAGCGGCGAGAGCAGGGCGACGGGCCGGCCGCGGTCGGTGATCTCGATCGTCTCGCCGGCCTCGACT
+CGGCGCAGCAGCTCGCTGGCCCGCTGCCGCAGCGCACGCACCCCCACCGAGGTCATTGTGCTAACTGTAG
+CACAAGCGGTCGGCGTCATGGGCCGACGTTCGGCTCGCGCAGGCTTTAAGTAACGTCGGTGTTAATTACT
+AGGACCTGAAAAAGTCGGCGCGTTGTTCCTCGGTTGGTTGGCGCTGAGCTGGGAGGATGGCCTCAATGCC
+CTTGTTGCGGAAGGGATTGAGGCCATCGTGTTTCGTACTGTAGGCGATCAGGCATCGTTGTGGGAATCCG
+TGCTGCCCGAGGAGTTGCGGCGGCTGCCCGAAGAGCTGGCCCGGGTGGATGCGCTGCTCGATGATTCGGC
+GTTCTTCTGCCCGTTTGTGCCGTTCTTCGACCCGCGGATGGGTCGGCCGTCCATACCGATGGAGACCTAT
+TTGCGGTTGATGTTCTTGAAGTTCCGTTACCGGTTGGGCTATGAGTCGCTGTGTCGGGAGGTCACCGATT
+CGATCACCTGGCGGCGGTTCTGCCGTATTCCGTTGGAGGGATCGGTGCCGCACCCAACCACGTTGATGAA
+GCTGACCACGCGCTGCGGTGAGGATGCGGTGGCCGGGCTCAATGAGGCGCTGCTGGCCAAGGCGGCCAGC
+GAAAAGCTGTTGCGCACCAACAAGGTCCGTGCCGACACCACCGTGGTGGAGGGCGATGTGGGCTATCCCA
+CCGACACTGGACTGCTCGCCAAGGCGGTCGGCTCGATGGCGCGCACCGTGGCGCGGATCAAAGCCGCGGA
+CGCGGGATCGGCGCCGCTCGGTGGGTCGTCGGGCCCGCGCGATCGCCTCCAAGCTGCGGTTACGCGGCGC
+GCAGCAACGCGATCAGGCGCAGGCCTTCGTGCGCCGGATCACCGGGGAGCTAGCCGGGATCGCCGAGCAG
+GCGCTGACCGAGGCTGCCGCGGTGGTACGTAACGCCCAACGTGCGGTGCGCCGCGCCAGTGGGCGGCGCA
+AAGCCTGGCTACGCCAGGCCATCAACCATCTCGAGAAGCTGATCGGACGCACCGAGCGGGTGGTGGACCA
+GGCCCGTAGCCGGCTGGCCGGGGTAATGCCCGACTCAAGCAGCCGCCTGGTCAGTCTCCACGATGCCGAC
+GCTCGCCCGATCCGCAAGGGACGATTGGGCAAGCCGGTCGAGTTCGGCTACAAGGCCCAGGTCGTCGACA
+ACGCCGACGGTGTCATCCTGGACCACAGCGTCGAGCTCGGAAACCCCGCAGATGCACCGCAATTGGCACC
+CGCCATCGAACGGATCAGCCGCCGCACCGGACGCCCACCACGGGCAGTGACCGCTGATCGGGGCTGCGGA
+GACGCATCGGTCGAAGATGATCTCCACCAGCTCGGGGTGCGCAACGTGGCCATCCCACGCAAGAGCAAAC
+CCAGCGCCACCCGCCGCGCATTCGAACACCGACGGGCATTCCGCGACAAGATCAAATGGCGAACCGGATC
+CGAAGGACGCATCAACCACCTCAAGCGCAGCTACGGCTGGAACCGCACCGAACTCACCGGCATCACCGGC
+GCCCGAACCTGGTGCGGACACGGCGTCTTCGCCCACAACCTCGTCAAGATCAGCACCCTGGCAGCGTGAC
+AGACACCCGCGCCCACCCCGACCACGCCACGCAGGTCGCCCAGCCCGCCGCCGTCAATGCAACCGCGACT
+TTTTCAGGTCTTAGTAATTAGTGGCCGCCGCTTTGGGTCCACCGGGGCCCTGCGGCGAAACACCAGACGT
+GATGCCGTGATCGGCGATACCCTTCGACCCATTGAAGGGAGAACAGCCATGTCGTTTGTGATCGCGAACC
+CCGAGATGCTGGCAGCGGCGGCGACCGATTTGGCCGGCATCCGGTCGGCGATCAGCGCCGCGACCGCGGC
+GGCCGCGGCCCCGACGATCCAGGTTGCCGCGGCCGGCGCCGACGAGGTGTCGCTGGCCATCTCGGCGCTG
+TTTGGCCAGCACGCCCAGGCCTATCAGGCGCTCAGCGCCCAGGCGACGATCTTTCACGACCAGTTCGTGC
+AGGCCCTGACCTCCGGCGGCAACCTGTATGCGGCCGCCGAGAGCCACACCGTCGAGCAGATGGTGCTCAA
+CGCGATCAACGCGCCCACCCAGACACTGTTCGGCCGCCCGCTGATCGGCGACGGCGCCAACGGGACCGCG
+GAGAACCCGGACGGCCAAAACGGCGGCCTGCTGTTCGGCAACGGCGGCAACGGCTTTACCCAGACGACCG
+CCGGGGTGGCCGGCGGCAACGGCGGCAGCGCGGGGTTGATCGGCAACGGCGGGGCCGGCGGCATCGGGGG
+CGCGGGCACCGGAACCGGTGGTCACGGCGGGGCCGGCGGGGCCGGCGGCCGGGCCTGGCTGTGGGGCACC
+GGCGGGGCCGGCGGAGCCGGCGCCGCCGCCATCGGCAACGCCGTCACCCCCGGCGGGGCCGGCGGCGCCG
+GCGGAGCCGGCGGTGACGGCGGCTGGTTGTTCGGCGACGGCGGGGCCGGCGGCACCGGCGGCAACGGCGG
+CAGCGGCTTTAACAGCTTGACCTCTTCGGTCGGCGGCGCCGGCGGGGCCGGTGGGCACGCCGGGCTGTTC
+GGCGCCGGCGGGACCGGCGGGACCGGCGGCATCGGCGGGCAAAACACCGAGACCGGCCCGGCCGCCAGCA
+ACGGCGGCGCGGGCGGCGCCGGTGGCGGCGGCGGGTACCTGGTCGGCGATGGCGGCGCCGGCGGGACCGG
+CGGGGCCGGCGGGAAGAATTCCAGCGGTGGCGCCACCCTCACCGGGGGCACCGGAGGGACCGGCGGGGCC
+GGCGGGGCGGCCGGGTGGCTCTACGGCAGCGGCGGTGCCGGCGGCGCCGGCGGGCTCAACAACGCCGGTG
+GTGCCACCGGCGGCACCGGCGGTACCGGCGGAGCCGGCGGCTCTGGAGCGTGGCTGTACGGCAACGGCGG
+GGCCGCCGGGGCCGGCGGCAACGGCGGCAACAATACCAGCGCCGGCACCGGTGGTGTCGGGGCTAGCGGC
+GGGACCGGCGGAAACGCCGGGCTGATCGGCGCCGGCGGCCACGGCGGGGCCGGCGGCGCCGGCGGAAACC
+AAACCGGTGGCGTGGGCAACGGCGGGGCCGGCGGGAACGGCGGCGCCGGCGGGGCCGGTGGTCAGCTGTA
+CGGCAACGGCGGGGACGGCGGCAACGGCGGGGCCGGCGGGGCCAACATCGCCGGCGGCAATGGCAGCGAC
+GGCGGCGCCGCCGGCCACGGCGGGGCCGGCGGGAGCGCCCGGCTGATCGGAGCCGGCGGCCACGGCGGGG
+ACGGCGGCGCCGGCGGGAACACCGCCGGCAGAAGGGCCGACGCGATCGCCGGCACCGGCGGGGACGGCGG
+CAACGGCGGGAATGGCGGCTTGCTAAGCGGCAACGCCGGGGCCGGCGGCCACGGCGGGGCGGGCGGGAGC
+AGCACCGCGACCACCACCACCGGAACACCCCCAACGGGTGCAACGGGCGGCAATGGCGGCAACGGCGGGG
+CCGGCGGCACGGCCGGGTTTACCGGCAGCGGCGGCATCGGCGGCAACGGCGGGGCCGGCGGCACCGGCGG
+TAACGCCGGTGTCGCCTTGTCGGTTGGCAGCACGGGCGGACTGGGCGGTAACGGCGGCAGCGGGGGCCTC
+GGCGGCGGCGGCGGGTCGCTCTTCGGCAATGGCGGGGCCGGCGGTGTCGGCGCAACCGGCGGAAACGCCG
+GAAGCGGTATCGGGCCCGCCAGCGTGGGTGGCAACGGCGGCAAGGGCGGCGTTGGTGCGGCCGGCGGGCT
+TGCCGGGCAGATCGGCAACGGCGGTAGTGGTGGGTCCGGCGGTGCCGGGGGCAACGGCGGGACCGGCGAT
+ACCGCCGGCAACGGTGGCAATGGTGGTGCCGGCGCGGTCGGCGGCAACGCCCAGCTCATCGGCAACGGCG
+GCAACGGCGGTGGCGGCGGGAACGGCGGAACCGGCGCCACCCCCGGCACCGGCGGCGCCGGCGCCGCCGG
+CGGCACCGGCGGCACGCTGTTCGGCGCCCCCGGAACCACCGGCGCCGACGGCACCTAAGGCCCGCGAGCA
+GACGCAAAATCGCCCAATTTCGTGCCGAATTGGGCGATTTTGCGTCTGCTCGGCGCAGCTAACCCGCCAC
+GTACTCCACCGCGCCGTCGTCGAGCACCACCCGGGCCTCGGCGCCGTCGGAGCCGGCCACCTCGGTGCGG
+AACACCGCCCGGCCCGGCTCGGTGCGCCAGATCACCGTCGACAGCGTCTCGCCGGGAAACACCGGCTTGG
+TGAACCGCGCGGCGATCGAGGTGATGTTGGCCGCCACACCGCCGCCAAGCTCGGCCACCAGCGCCCGGCC
+CGCCACCCCGTAGGTGCACAACCCGTGCAGGATCGGCTTGGGAAACCCGGCCAGCTGCGTGGCGAACCAG
+GGGTCGCTGTGCAGCGGGTTGCGGTCACCGGAGAGCCGGTAGATCAGCGCCTGGTCCTCACGGGTCAGCA
+TATCGATTCGGGCGTCGGGGTGGCGGTCCGGAAATTCCGGCGCGGCCGGCCGCTCACCCCGCGCTCCTCC
+GAAACCCCCCTGACCCCGAAGCACCAACGTGGTAAGCGTTTCGGCAACCAACGAACCCGATTCCGGGTCG
+CAACCGCGGCCGCGCAGCACAACGATGGCGTTCTTGCCCTCCCCCTTGTCCTGGATGTCGGCGACCTCGG
+TGACCACCGACAGTTTTCCCGCCGCCGGCAGCGGCGCATGCAGCCGGATGCCCTGGGAGCCGTGTAGCAG
+CGCCGCCGGGTTGAATGTTCCCACCTTTGCGGCCGCACCAAACGCCGGACAGCAAATCACCGCATACGTC
+GGCAACACTTGCTGGTCGATGCCGTGGCTGTTCTCCGTGGTGAACGCCAGATCTCCGGTCCCGGCGCCCA
+CCCCGATCGCGTAAAGCAGCGTGTCCCGGTCGGTCCACTCGAACAACATCGGCTCGGTCACTGCACCTAT
+GGAGTTCGGATCAATCGCCATGCAACTCTCCTCCCGGTTGGAAAATCATCGCAAGCCCTTCCCCCGGACG
+GTATCGACAGGGCAGGCTATCGCCATGGCGAAGCGCACCCCGGTCCGGAAGGCCTGCACAGTTCTAGCCG
+TGCTCGCCGCGACGCTACTCCTCGGCGCCTGCGGCGGTCCCACGCAGCCACGCAGCATCACCTTGACCTT
+TATCCGCAACGCGCAATCCCAGGCCAACGCCGACGGGATCATCGACACCGACATGCCCGGTTCCGGCCTC
+AGCGCCGACGGCAAAGCAGAGGCGCAGCAGGTCGCGCACCAGGTTTCCCGCAGAGATGTCGACAGCATCT
+ATTCCTCCCCCATGGCGGCCGACCAGCAGACCGCCGGGCCGTTGGCCGGCGAACTTGGCAAGCAAGTCGA
+GATTCTTCCGGGCCTGCAAGCGATCAACGCCGGCTGGTTCAACGGCAAACCCGAATCAATGGCCAACTCA
+ACATATATGCTGGCACCGGCAGACTGGCTGGCCGGCGATGTTCACAACACTATTCCGGGGTCGATCAGCG
+GCACCGAATTCAATTCCCAGTTCAGCGCCGCCGTCCGCAAGATCTACGACAGCGGCCACAATACGCCGGT
+CGTGTTCTCGCAGGGGGTAGCGATCATGATCTGGACGCTGATGAACGCACGAAACTCTAGGGACAGCCTG
+CTGACCACCCATCCACTGCCCAACATCGGCCGCGTGGTGATCACCGGCAACCCAGTGACCGGCTGGAGGC
+TGGTGGAATGGGACGGCATCCGTAACTTCACCTGACCGCGCGGTTGACGCTTACCGCCGCTGACCGCCAC
+GATTGACCGCATGCGGTACGTCGTTACCGGCGGTACCGGGTTTATCGGGCGCCACGTGGTATCCCGTCTC
+CTGGACGGCCGACCCGAGGCACGGCTGTGGGCGCTGGTTCGCCGCCAGTCGTTAAGCCGCTTCGAGCGCC
+TCGCCGGCCAGTGGGGTGACCGGGTAAGACCGCTGGTCGGTGATCTCACGGAGCTCGAACTGTCCGAGCG
+GACCATCGCCGAGCTAGGCGATATCGACCATGTGCTGCACTGTGCGGCGGTACACGACACCACCTGGGCC
+GACGCCACCCGCGCCGTCATCGAGCTGGCGGCACGCCTTGACGCCACGTTTCATCACGTGTCGTCGATCG
+CGGTGGCCGGAGACTTCGCCGGCCACTACACCGAGGCCGACTTCGACGTCGGCCAGCGCCTACCGACCCC
+GTATCATCGGATGACATTCGAGGCCGAACGGCTGGTGCGCTCCACGCCCGGCCTGCGCTATCGCATCTAC
+CGCCCGGCGGTGGTGGTGGGTGATTCGCGCACCGGCGAGATGGACACGATCGACGGACCCTACTACTTGT
+TCGGGGTGCTGGCCAAGCTGGCGGTGTTGCCGTCGTTCACCCCGATGCTGCTGCCGGACATTGGGCGCAC
+CAACATCGTGCCGGTCGACTATGTGGCCGACGCGCTGGTGGCGCTCATGCACGCCGACGGCCGGGATGGG
+CAGACGTTTCATTTGACCGCGCCGACAGCAATCGGACTGCGCGGCATCTACCGCGGGATCGCCGGCGCGG
+CCGGACTGCCCCCGCTACTCGGGACGCTGCCCGGCTTTGTGGCCGCACCGGTGCTCAACGCGCGCGGCCG
+CGCCAAGGTGCTGCGCAACATGGCGGCCACCCAACTGGGAATTCCCGCCGAGATTTTCGACGTCGTCGGC
+TGCGCGCCCACGTTCACGTCCGACACAACCCGGGAAGCGTTGCGCGGCACCGGCATTCACGTCCCCGAAT
+TCGCCACCTACGCGCCCGGGCTGTGGCGGTATTGGGCCGAGCACCTCGACCCCGACCGCGCGCGTCGCAA
+CGATCCGCTGCTGGGCCGCCACGTCATCATCACCGGTGCGTCCAGCGGCATCGGGAGGGCATCGGCGATC
+GCCGTCGCCAAACGGGGTGCGACGGTATTCGCGCTGGCCCGCAACGGCAACGCGCTAGATGAGCTGGTCA
+CCGAGATCCGCGCCCATGGCGGTCAGGCGCACGCATTCACCTGCGACGTCACCGATTCCGCGTCGGTGGA
+GCACACCGTCAAGGACATCCTGGGCCGTTTCGACCACGTGGACTACCTGGTGAACAACGCCGGCCGGTCG
+ATACGCCGCTCGGTGGTCAACTCCACCGACCGGCTGCACGACTACGAGCGGGTGATGGCGGTCAACTACT
+TCGGCGCGGTGCGCATGGTGCTGGCGCTGCTGCCGCATTGGCGCGAGCGCCGGTTCGGCCACGTCGTCAA
+CGTCTCCAGCGCCGGCGTGCAGGCCCGCAATCCCAAGTACAGCTCGTATCTGCCCACCAAGGCCGCGCTG
+GACGCGTTCGCCGACGTGGTCGCCTCCGAGACGCTGTCCGACCACATCACGTTCACCAACATCCATATGC
+CGCTGGTGGCCACCCCGATGATCGTGCCGTCGCGGCGGCTCAACCCGGTGCGCGCGATCAGCGCCGAACG
+CGCGGCGGCGATGGTGATCCGCGGACTCGTGGAAAAGCCGGCGCGCATCGACACTCCGTTGGGTACGCTC
+GCCGAAGCCGGCAACTACGTCGCGCCACGGCTGTCGCGCCGAATTCTGCACCAGCTCTATCTGGGCTATC
+CCGATTCAGCTGCAGCGCAGGGGATTTCGCGTCCAGACGCGGACCGCCCACCGGCGCCGCGGCGTCCCCG
+GCGATCCGCCCGCGCGGGAGTCCCGAGGCCGCTCAGGCGCTTGGGGCGACTGGTGCCCGGTGTGCATTGG
+TAGTCACTTCTGGCAGGTGAACTGGTTGACGTCGATGTATCCGATGCGAAACATCTCGGCGCAGCCGGTG
+AGGTACTTCATATACCGCTCGTAGACTTCCTCGGATTGCAGCGCGATGGCCTGGCCCTTGTTGGCCTGCA
+ACGCCGCGGACCAGAGGTCGAGGGTTTTCGCATAGTGCGGCTGCAACGATTGAACTCTGGTGACGGTGAA
+GCCGTTTGCGCTGGCACACTCCTGCACCATCGGTATCGAGGGCAGCCGCCCACCCGGAAAGATCTCGGTC
+ACAATGAATTTCAGGAAACGAGCGAAGGTGAACGACATGGGCAGGCCGCGTTCGTGGATCTCTTTCGGAT
+GCAACCCGGTGATGGTGTGCAGCAGCATGACCCCGTCAGCGGGCAGCAGGCGATGCGCCAGGCTGAAGAA
+CGCGTCGTAGCGCTCGTGACCGAAATGTTCGAAAGCACCGATGCTGACGATGCGGTCGACGGGCTCGTCA
+AACTGTTCCCAGCCGGCCAGCAGAACGCGTTTGGAGCGTAGACTTTCGGAGTTGGCGACCAGCTGCTGAA
+CGTGGTTGGCCTGGTTTTTGCTCAGGGTCAGACCGACGACGTTGACGTCGTATTTTTCCACCGCGCGCAT
+CATGGTGGCGCCCCAGCCGCAGCCGACGTCCAACAGTGTCATGCCCGGCTGCAATCCGAGTTTGCCCAGC
+GCGAGATCGATCTTGGCGATCTGCGCCTCTTGCAGCGTCATGTCGTCGCGCTCGAAGTAGGCGCAGCTGT
+AGGTCTGAGTGGGATCGAGGAACAGCCGGAAGAAGTCGTCGGACAGGTCGTAGTGCGCCTGCACGTTGGC
+GAAGTGCGGCTTCAGCTCGTCGGGCATTGGGATAGCGTATCGTCGTCGCGGTGAGCGTCGTATTCGCCGA
+CGTCGACACCGGCATCGACGACGCGCTGGCCGTGATCTATCTGCTGGCCAGTCCCGACGCCGATCTGGTC
+GGCATCGCCTCGACCGGCGGAAACATCGCGGTAGGTCAAGTGTGCGCGAACAACCTGAGCTTGCTCGAAT
+TGTGCGGTGCCGCAGACATCCCCGTGTCCAAAGGCGCCGATGAGCCGCTCGGCGGCCGGTGGCCCGATCA
+CCCAAAGTTTCACGGCCCCAAGGGGATAGGCTATGCCGAGCTGCCGGCCAGCAATCGCCGGCTCACCGAT
+TATGACGCCACGACGGCCTGGATCGCGGCGGCGCACTCCCACGCCGGCGACCTGATCGGTCTGGTCACCG
+GCCCGCTGACCAACCTGGCGCTGGCGCTGCGCGCCGAACCCGCGCTGCCGAGGCTGCTGCGCCGGCTGGT
+GATCATGGGCGGCATGTTCGACGGCCAGCCGATCACCGAATGGAACATCCGGGTGGATCCCGAGGCGGCC
+AGCGAGGTGTTCACCGCGTGGGCCGGACAACGACAACTGCCGATCGTGTGCGGTTTGGATCTCACCCGGC
+GGGTCGCGATGACACCGGACATTCTCGCCCGGCTGGCGTCCGTCTGCGGCTCGTCTCCGGTGATGCGGGT
+GATCGAGGACGCGCTGCGGTTCTACTTCGAGTCTCATGAGGCGCGCGGACATGGGTACCTGGCATATATG
+CACGACCCGCTGGCCGCCGCGGTCGCAATGGACCCGGAACTCCTGACGACCCGGACCGCGACGGTGGATG
+TCGACCCGACGGGGGCGACGGTCACCGACTGGTCCGGGAAGCGAAATCCCAACGCGCGGATCGGCATGAG
+CGTCGATCCGGCGGTGTTCTTCGACCGGTTCGTCGAACGGATCGGACGATTCGCGCGCCGAACGTGAACT
+GACGGCGGGATTTTCCCGAAATTCTCGCCCTGACGTCACGTTCGGCGCAAGTCATTCGTAGCTTCCCTCC
+AGATACCACCGCCGCTGCCGGTAGCACAGCAGCAACGCGGTGCCGGGATCGCCGTCCAGCAATACCTGAG
+CGCGCGCGGTGCGGCCACTCGCCCGATCCGGATCCCACCACCGCTCGTCGTCCGGCCACGGTCCGGCCCA
+CCAGCGCAGCCGATCGTCTCGGCCACGAACCCTCAGCCGCGCCGGGTCCGCGGAGAACATCCCCCGGCTG
+GTCACCCGTATCGGGTTTCCTTGGGCGTCAAGCAAGTCCACCGGATCGTCGAACAGCACCGCCGGCGACG
+GGTCGGGCAACCTGCCGGGCCACGGCTGACCGGGGTCGGCCTGCGGCACCGGCTCAGGGGCTACTAGGCC
+CAGCACGGTCAACGTGATGCGTTCGGCCGGGCCGTGTCCGCCGGATAGCACCGGCACCCGCACGGCCTCC
+GGACCGAGCAAGCCCTGCACCCGCACCAGCGCCCGACGGGCCCGAAGCCTGTCCTGTTCACCGAGCCCGC
+CCCATAGCGGCAACTGCAAGCCTTCCGATGCGGACACCGTCTCCACCGCCTGCAGCCGCAGCAGAGTCAC
+CGCCGCGGTGGGCCGGTCACGAGCATTCCGGTTGTTCAACCACCCGTCCAGTTGCCAGCGCACCCGGTCG
+GCGGTGGCGTCCTCGGTCAGCGGCTCGGCGCACCGCCACACCCGGCTGCGCTCTTCGCCGTTGGCGGTGA
+CGGCATGAATGGCCAGCCGGGTGCAGCCCACTCCGGCGGCCATCAGCGCCCGATGCAGCTCGGCGGCCAG
+CGAGCGCCCGGCGAACGCCGCGGCGTCGACCCGGTCGATCGGCGGATCGCATGCCAGCTCGGCGGCCAGA
+TCCGGCGGCGGCTCCCGCCCGCAGGGCGCCCGTTCCGGTTCGCCGCGGGCGAACCGGTGCGCGGCCACCG
+CGTCGGCACCGAACCTGGACGCCACGTCGGTACGAGACAGCGCGGCGAACTGTCCGATGGTGCGAATCCC
+CATCCTCCACAACAGATCCGTCAGGTCGTCCCGGCCCGGCCCGGACAGGCTCGGCTCGGTGGCAAGTTGG
+CGGATCGACAGCAGCGACAGAAACCGCGCATCGCCTCCCGGCTCCACGATGCGGCCAGCACGCGCGGCGA
+AAACCGCGGTAGACAACCGGTCGGCGATTCCGACCTGACACTCCGCGCCGGCCGCGGCCACCGCGTCGAT
+CAGCCGCTCGGCCGCCATCTGCTCGGACCCGAAAAAACGGGCCGGCCCGCGCACCGGCAACACCAGGAGC
+CCGGGCCGCAGCAGCTCGGCGCGGGGCACCAGATCGTCTACCGCCGCGATCACCCCTTCGAAGAGCCGGG
+CGTCGCGGTCGGCGTCGGCAGTCGCTATAAACAGTTGCGGACACCGCGCCGCCGCCTCCCGACGCCGCAA
+CCCTCGGCGCACCCCGGCCGCCCGCGCGGTCGCCGAGCAGGCGATCACCCGGTTTGCCAACGTGACCGCG
+ACCGGGGCCGTCGCGGATAGGCCCGCGGCCGCGGCCGCCGCGACCGCGGGCCAGTCCATACACCAGATCG
+CCAGCACGCGAGCGGAGGCCATCACCGTCCACGCCCGTTGATCTGCAGCCGCACCCCACTGATCCGCCCC
+AACCCCGGGGTGGGCACGCCCCTGAGGGCCGGGGTGATCTCATAGCCGCAGACCCGGGCCGCAAGCCGCG
+TCGACACGCCTTGCCAGTCGCCGTCGGTGACCAGCAGGGTGCAGCCTTTTTGACGGGCACGGGCCACCAC
+TGCCCGCGCCCGCGCCCGCGTCACCCGGCGCCCTCCCAGACCGAGCACCACCAGATCCATGCCGTCGATC
+AGCACAGCGGCCACCTCAACCGGATCGGTCCCGGGATCTGGTATCATCGCGAGCCGGCTCAGATCCGCCC
+CCATCTCCACCGCGGCCAGCAACCCGATATCCGGCTGGCCAACGATGGCCGCGTTTCCCCCGGCCGCCGT
+CACCGATGCCACCATGCTCAGCAGCAGTGACCGCGCACCCGACAGCACTCCCACCGTCCCCGGGGGCAAC
+GACACCGGTCCCGCCGGCACCAGGTCGCCCGAACGGCTGGGCCCCCCGGACACCTTCTCGGACAGCAAAG
+CCATCTGCCGTCGTAGTGATTCGAGCTGCTCAGCACCATTTTCAAGGCGTTGGTCGGAGGCGAAGGCCAC
+AGTCATGACCAGCCTCCTGTTCGAAAATATGTTCGAAGTCAGTAAACACCCGTCCTTGGAGTCCGTCAAG
+GTCATGAGAGGCTGCCTTGTGCAATCGCGTAAAACCACCTCGGTACTGGCGGCTGCCCTGCTGTTTTGCG
+GCCTGTTAGGCCCAGGGACGGCCCCACCGGCCACCGGTGGCGGGCCTGCCTGCCGGCCGGCAGAGCTCTT
+CGCCACCGACAACACCACCGATGGGTTCGAGCTACCGGCCGTTGCGACTATCGCACTAACCGGCACGGTG
+GTGACCGGATCGACCCTGGTCGACGGCGTGTTCTGGTCGAATGAGCGCCAGCAGATCGGCTACGAGCGCT
+CCCGTGAATTTCATCTGTGCGTTGTCGACGCGCCCACATTGCACAACGCCGCCGAGGCACTGCACCGCCA
+GTTCAACCAAGAAGCGGTGCTGACCTTCGACTACTTGCCGCAGAATGCACCCGAGGCGGACGCGATCCTC
+ATCACCGTGCCCGACATCGGCATCGCCCGCTTCCGCGATGCCTTCGCATCTGATTTGGCTGCACACCACC
+GATTACGGGGCGGATCTGTCACCACAGCCGACCACACCTTAATCCTGGTCGCCGGCAACGGCGATCTCGA
+TGTCGCCCGCCGACTCGTCGAGGAGGCCGGCGGGGACTGGAACGCAACCACCATTGCCCATGGCAGGCGT
+GAATTCGTGAACTAGCTGATCAAGGGCGCTCCGCTGGCCACCCGAGCCGGGTTGGTCACATTAGTTAGTC
+ACAGCAATCTCTGGGCCGGCGGGCACAACGCGTATTCATCCCGACAGATACCAATGTGTCGCCTGTGACA
+AAAGCCGGGCCTGGCTAATGCTGGCCGCCGCTACTCCCACTCGATGGTGGCGGGCGGCTTGCTGGTGATG
+TCCAGCACCACGCGGTTGACCTCGGCGACCTCGTTGGTGATCCGGGTCGAGATGCGCTCGAGCACCTCGT
+AGGGCACCCGGGTCCAGTCGGCGGTCATCGCGTCTTCACTCGACACCGGACGCAGCACAATCGGGTGGCC
+ATAGGTGCGACCGTCACCCTGCACACCCACCGAGCGGACATCGGCCAACAGCACCACCGGACACTGCCAG
+ATCTGGTTGTCCAGGCCCGCCGCGGTCAGCTCCTCACGCACGATCGAATCGGCGTGCCGCAGCGTATCCA
+ACCGCTTGGCGGTGACCTCCCCGACGATCCGAATACCCAACCCCGGTCCCGGAAACGGCTGGCGCGCCAC
+GATCTCCTCCGGCAGACCCAACTCCCGCCCGACCGCGCGCACCTCGTCTTTGAACAGCAGCCGCAGCGGC
+TCAACGAGGGTGAACTTCAGGTCGTCGGGCAGGCCGCCGACATTGTGGTGGCTCTTGATGTTCGCGGTGC
+CGCTGCCCCCGCCGGACTCCACCACATCCGGATACAGCGTGCCCTGCACCAGGAACTCAGCAGTCTTACC
+GTCCAGCACATCCCGCACCGCGCCCTCGAACGCGCGGATGAACTGACGGCCGATGATCTTGCGTTTGCCC
+TCGGGGGCGCTCACGCCCGACAGCGCCTCGAGGAAGGTCTCGGCCGCGTCGACGGTGACCAGGTTGGCGC
+CGGTGGCGGCCACGAAATCGCGTTGCACCTGCGCCCGCTCACCGGCGCGCAACAGCCCGTGGTCGACGAA
+GACACAGGTCAACCGGTCGCCGATGGCCCGCTGCACCAGGGCCGCGGCCACCGCGGAATCCACGCCGCCG
+GATAGCCCGCAGATGGCGTGGCCGTCGCCGATCTGGGTGCGCACCTGCTCGATCAGCGCGTTGGCGATGT
+TGGCGGGCGTCCACTGGGCGCCGAGCCCGGCGAAGTCGTGCAAAAACCGGCTGAGCACCTGTTGCCCGTG
+TGGGGTGTGCATCACCTCCGGGTGATACTGCACCCCGGCCAGGCGCCGGTCGAAGGCCTCGAAGGCGGCC
+ACCGGGGCACCGGCGCTGCTAGCCACCACGTCGAATCCGTCCGGCGCGGCCGTGACCGCGTCACCGTGAC
+TCATCCATACCGGCTGAACCTCGGGAAGATCCGAATGCAGTTTGCCACCAAGGACTTTCAGTTCAGTCCG
+ACCGTATTCGCGAGTGCCGGTGTGGGCGACGATCCCCCCGAGCGCCTGCGCCATGGCCTGAAACCCGTAG
+CAGATGCCAAGAACCGGTACACCGAGGTCCAGTAGCGCCGGATCGAGTTTCGGAGCGCCGTCGGCGTAGA
+CACTGGCCGGTCCACCGGAAAGCACGAGCGCCACCGGCTGACGGGCCCTGATCTCCTCGATCGAGGCGGT
+GTGCGGAATCACCTCGGAGAAAACCCGTGCTTCTCGAACCCGACGGGCAATCAACTGGGCATATTGGGCA
+CCGAAGTCGACCACCAACACCGGTCGAGCCGGTGTCTCAGGCACGTCAATGTCAGCAGGCTGCACCACGG
+CCAGTCAGTCTAGTGGCTGGGGTGACTCCCGAGGTCGGCCGGTAGCGGTCCATGGGCCGGTCCGCAGGTT
+ACCGAAGAGGCCAGTGCTGCCGCCGCCACTTGGGCCTTCTTCAGTCCCGACAGAGAGATTCGCCGATCGT
+AGACGACCGCCGGCGATGCTCTGATCAAGGCGAGCTGACGGCGGTAGATGCCAGACATGGCCGCACAGCA
+GGCAGCGCTGCGGCGGTCGAGGTGTGGAATCAGCCGCAGTCCCAGCGAATACCAGTCTGCGGCGCGGTCG
+GCACTGAACCGCAGCAGTGCCGCGAGCCGTCCGTCGGGGTCATCGAGTGCCCCGGTGTCGTCCAGGCGGA
+GGCGTACGCCTAATCGGTCCAGCTCGTCGCGCGGCAGGTAGATCCGTCCATTCAAAAAGTCCTCTCGAAC
+GTCGCGCAGAATATTGGTTTGCTGCAGAGCGATTCCCAACTGCTCGGCGTATCGCGACGTCGCCGTGCTG
+ACGGGTCCAAAGATGGAAAGACAAAGCTTTCCGATCGTGCCGGCCCCCCGGCGGCAGTAGACGATCAGCT
+CGTCGAAATCGCGGCAACCAGTCCAGTCGATTTCCATACGGGCGCCGTCAATCAACTCTGCGAACATCGC
+GATCGGCACCGGAAACCGGCGAGCCGCGTCAGCCAGCGCAACCAGCACCGGATCGGATGAATCATCAATA
+TTATCAAGTGATTTCCTGATGGCATCGAGCTCGGTGATCTTGGTCTCGGGGGCCAGCTCGCCGTCGGCGA
+CGTCGTCGATCCGGCGGCCGAGCGCATAGACCGCAGATAGTGCCGCTCGCTTTTCGCGCGGCAAGAGTCG
+GATGCCGTAGTAGAAGTTTCTGGCGGCCGTGCGCGTGATCGACTCGGTGATTCGATACGCCTGTTCGATC
+TCGGTCATGCCGTCCTCCAACTACGGTGTTGGTCAGTCACGCCTGACGATCGACGATGTAGTGAGCCAAA
+TCCTGAAGCTCAGCGGCCGGGCGATCGGGAATGCCGATGCGCGCCACCATGTCGATGCCTTGCGTTACGT
+GTCGGCGGGCCTCCGCGCTTGCCCACCTGCGCCCCCCACCGCACTCGATCAGTTCTGCGACCGCTGCGAG
+CTCATCATCGGACGCTGTCTGGCTGCCCGTCTCGTCCACCAGCCACGCTGCGAGGCGGCGGCCGGCCGAA
+CCGCCGTGCGCCACGGTCCAGGTAACGGGCAGAGTTTTCTTGCGGGAGCGAAGGTCCGAGTACACCGGCT
+TGCCGGTGATCTCAGGACGGCCCCAAATGCCGAGCAGGTCGTCGACCAATTGGAAGGCAAGTCCAATGTG
+ACGACCGTAGGCAACCAACGCTTCTCGCACCGAACGCGGTGCGCCAGCGAGTAACGCGCCGACCTCTGCG
+CTGGCTGCCATCAGTGCTGCGGTCTTGCCTTCAGCCATCTTGAGACACTCATCGAGTGCGACGTCGGTTC
+GGCTTTCGAACGCGGTGTCGGCGGCCTGCCCACGGATCAACTCACGGGTGGCTTCCGAAATCGCGCGCAG
+CGCCGCACCGACGTGTGGTGAATCGCAATCCAGCAGGACCTCGTGCGCCAGCGACAGCATCGCATCACCG
+GCCAATAGCGCCATCGCATCGCCCCACAGTGCCCACACCGTCGGCCGGTGCCGACGGTGCTCGTCGCGGT
+CCATGAGGTCGTCATGGACGAGCGAGAAGTTGTGCACCAGTTCAACCGAGACGGCTCCGGGAATCGCCGA
+GTGGGGGTCGGCGCCGGCGGCTTCGGCGGCGACAAACACCAAAGCAGGACGGATTGCCTTGCCGCAGTTG
+TTGTTCACTGGACGGCCGCGTTCATCAGACCAGCCGAGGTGGTAGGACACGACGGGCCGCATGTGGGGAT
+CGAGGCGGTCAGCCATCTGGCGCAGCGTCGGTGTGATGAGTTCGTGTGCGAGTCCCAAAACGGGAAGCGT
+GCGACGGGTCATACGGTCGCTGTCGGGTTGCGGTGGCAGTCCGTACTTTTCGTCGGTACCGCGCATTGCG
+TGAATCTAGCATTCGCTCATGGCACGGCCCATGGGCAAGTTGCCCAGCAATACGCGAAAATGTGCACAAT
+GTGCAATGGCGGAGGCACTATTGGAGATCGCTGGTCAGACTATTAATCAAAAGGACCTTGGCAGGAGCGG
+ACGGATGACGCGTACCGACAATGACACTTGGGATCTGGCCTCCAGCGTGGGGGCGACCGCCACAATGATC
+GCCACCGCCCGGGCGTTGGCTAGCAGGGCCGAAAACCCTTTGATCAATGATCCATTCGCCGAGCCGCTGG
+TGCGCGCCGTCGGCATCGACCTGTTTACCCGGCTGGCCAGCGGCGAGTTGAGGCTTGAGGACATCGGCGA
+CCACGCCACCGGGGGTCGGTGGATGATCGACAACATCGCGATTCGGACCAAGTTCTACGATGACTTTTTC
+GGTGACGCAACCACGGCGGGTATTCGGCAGGTAGTGATTCTGGCGGCTGGGCTCGACACCCGCGCGTACC
+GACTGCCCTGGCCCCCGGGCACGGTGGTCTACGAGATCGACCAGCCCGCAGTCATCAAGTTCAAGACACG
+GGCCCTCGCCAATCTGAACGCCGAACCCAACGCAGAACGGCACGCCGTGGCCGTCGATCTGCGAAACGAT
+TGGCCGACGGCGCTGAAGAACGCCGGCTTCGACCCGGCCAGACCGACAGCCTTCAGCGCCGAGGGGTTGC
+TGAGCTACCTGCCCCCACAGGGGCAGGACCGCCTGCTCGATGCGATTACCGCGCTCAGCGCCCCTGACAG
+CCGGTTGGCCACCCAGAGCCCACTGGTGCTCGACCTGGCCGAGGAAGATGAGAAGAAGATGCGCATGAAA
+TCCGCGGCCGAGGCATGGCGGGAACGCGGCTTTGATCTGGACTTGACCGAGCTGATCTACTTCGATCAAC
+GCAACGACGTGGCCGACTACCTCGCCGGCTCCGGCTGGCAGGTCACCACCAGCACCGGCAAGGAACTCTT
+TGCGGCCCAAGGGCTGCCGCCCTTCGAGGACGACCACATAACTCGGTTCGCCGACCGCCGCTACATCAGC
+GCGGTGCTGAAGTAGGTGGCCCCGGCACTATAGCCGGGCCTAACTCGTAGGCTTGGTACGCGGGCAGAGC
+CGCCAGGCATGGCGAACTGGTATCGCCCGAACTATCCGGAAGTGAGGTCCCGCGTGCTGGGTCTGCCCGA
+GAAGGTGCGTGCTTGCCTGTTCGACCTCGACGGTGTGCTCACCGATACCGCGAGCCTGCATACCAAGGCG
+TGGAAGGCCATGTTTGACGCCTACCTAGCCGAGCGAGCCGAGCGCACCGGCGAAAAATTCGTTCCCTTCG
+ACCCTGCCGCGGACTATCACACGTATGTGGACGGCAAGAAACGCGAAGACGGCGTTCGATCGTTTCTGAG
+CAGCCGCGCCATCGAAATACCCGACGGTTCCCCGGATGACCCGGGCGCCGCCGAGACGGTGTATGGCCTG
+GGCAACCGCAAGAACGACATGTTGCACAAGCTGCTGCGCGACGATGGGGCCCAGGTGTTCGACGGGTCGC
+GGCGCTACCTGGAGGCGGTCACGGCCGCGGGTCTCGGTGTGGCCGTGGTGTCTTCGAGCGCCAACACCCG
+CGACGTGCTCGCGACCACCGGTCTGGACCGGTTCGTCCAGCAGCGGGTGGACGGCGTGACGTTGCGCGAA
+GAGCACATCGCCGGCAAGCCGGCCCCCGACTCCTTCCTGCGCGCGGCAGAACTGTTGGGGGTTACCCCCG
+ACGCGGCGGCGGTGTTCGAGGACGCCCTGTCCGGGGTGGCGGCCGGCCGCGCCGGCAACTTCGCCGTAGT
+GGTGGGCATCAACCGAACGGGCCGGGCGGCTCAGGCCGCCCAGTTGCGCCGCCATGGCGCCGACGTGGTG
+GTAACCGATCTCGCCGAGCTGCTGTAGGGCATGATCGGGCGATGATCACCGAGGACGCCTTCCCCGTCGA
+ACCGTGGCAGGTCCGCGAGACCAAGCTCAACCTGAACCTGCTGGCCCAGTCCGAATCCCTATTCGCCTTG
+TCCAACGGGCACATTGGATTACGCGGCAACCTCGACGAGGGCGAACCCTTCGGACTGCCGGGCACCTACC
+TGAACTCTTTCTACGAAATCCGGCCGCTGCCGTACGCCGAGGCCGGTTATGGATATCCGGAGGCCGGCCA
+GACCGTTGTCGACGTCACCAACGGCAAGATCTTTCGCCTGTTGGTCGGCGACGAGCCGTTCGACGTCCGG
+TATGGCGAATTGATCTCCCACGAACGGATCCTCGACCTGCGCGCCGGGACGCTGACCCGCCGCGCGCACT
+GGCGCTCACCGGCGGGCAAGCAAGTCAAAGTGACGTCCACCCGGCTGGTGTCGCTGGCCCACCGCAGCGT
+CGCGGCGATCGAGTACGTCGTCGAGGCAATCGAGGAATTCGTTCGCGTGACCGTGCAGTCCGAACTCGTC
+ACCAACGAGGACGTACCGGAGACCTCGGCCGACCCGCGGGTGTCGGCCATCCTGGACAGGCCGCTACAGG
+CCGTCGAGCACGAACGCACCGAGCGGGGTGCACTTCTCATGCACCGCACCCGAGCCAGCGCGCTGATGAT
+GGCCGCAGGGATGGAACACGAGGTCGAGGTTCCCGGGCGGGTCGAGATCACCACCGACGCCCGCCCGGAC
+CTGGCCCGAACCACCGTGATCTGCGGGCTGCGCCCGGGACAGAAGCTGCGCATCGTCAAATACCTGGCCT
+ATGGCTGGTCCAGCCTGCGCTCCCGCCCGGCGCTGCGCGACCAGGCCGCCGGCGCGCTGCACGGTGCCCG
+CTACAGCGGCTGGCAGGGGCTGCTGGACGCGCAACGCGCCTACCTCGACGACTTCTGGGACAGCGCGGAC
+GTGGAGGTCGAGGGCGACCCGGAATGTCAGCAAGCGGTGCGTTTCGGGTTATTTCACCTGTTGCAGGCCA
+GCGCGCGCGCCGAACGCCGCGCGATCCCCAGCAAGGGGCTCACCGGAACCGGGTATGACGGCCACGCCTT
+TTGGGACACCGAAGGTTTCGTGCTACCGGTGCTCACCTACACCGCACCGCATGCGGTCGCCGACGCGCTG
+CGGTGGCGGGCGTCGACGTTGGACCTGGCCAAGGAGCGGGCGGCCGAGCTCGGCCTGGAAGGTGCCGCCT
+TTCCCTGGCGGACCATCCGCGGACAGGAGTCCTCGGCCTACTGGCCGGCCGGCACGGCGGCCTGGCACAT
+CAACGCCGACATCGCGATGGCGTTCGAGCGGTACCGCATCGTCACCGGCGACGGTTCGCTGGAGGAGGAA
+TGCGGCCTTGCGGTGCTGATCGAGACCGCCCGGCTGTGGCTCTCGCTCGGGCACCACGACCGCCACGGCG
+TCTGGCACCTCGACGGGGTCACCGGTCCCGACGAGTACACGGCGGTCGTCCGCGACAACGTGTTCACGAA
+TCTGATGGCGGCGCACAATCTGCACACCGCCGCCGATGCTTGCTTGCGCCACCCCGAGGCGGCGGAGGCC
+ATGGGTGTCACCACCGAGGAGATGGCCGCCTGGCGCGACGCGGCCGACGCCGCCAACATTCCCTACGACG
+AGGAACTCGGTGTCCACCAGCAGTGTGAAGGGTTCACCACCCTTGCGGAGTGGGATTTCGAAGCCAACAC
+CACTTATCCGTTGCTACTGCACGAGGCCTACGTGCGCTTGTATCCCGCACAGGTGATCAAGCAGGCCGAC
+CTGGTGCTGGCGATGCAGTGGCAGAGTCACGCGTTCACGCCCGAGCAGAAGGCGCGCAACGTCGACTACT
+ACGAACGGCGCATGGTGCGCGACTCGTCGTTGTCGGCCTGCACTCAGGCGGTGATGTGCGCCGAGGTCGG
+CCATCTCGAGTTGGCCCACGACTATGCCTACGAAGCCGCCCTGATCGACCTGCACGACCTGCACCGCAAC
+ACCCGTGACGGCCTACACATGGCTTCGCTGGCCGGAGCCTGGACGGCGCTGGTCGTAGGCTTCGGCGGCC
+TACGCGACGACGAGGGCATCCTGTCCATCGATCCGCAGCTGCCCGACGGCATCTCGCGGCTGCGGTTCCG
+GCTGCGATGGCGCGGCTTCCGGCTGATCGTCGACGCCAACCACACCGACGTCACCTTCATCCTTGGCGAC
+GGTCCCGGCACCCAGCTGACCATGCGCCACGCCGGCCAAGATCTGACGCTGCACACGGACACACCGTCCA
+CCATCGCCGTGCGCACCCGTAAGCCGCTGCTGCCGCCACCACCGCAGCCGCCAGGCCGCGAGCCAGTGCA
+CCGCCGGGCTTTAGCCCGGTGACGATACGGGCCGCGTAGCGGCCCGAGGAGGAGCCGGGCAATCGGCTTA
+GCCCGGTGACGATGCGGGCCGCGTAGCGGCCCGAGGAGGAGCCGGGCAATCGGCTTAGCCCGGTGACGAT
+ACGGGCCGCGTAGCGGCCCGAGGAGGAGCCGGGCAATCGGCTTAGCCCGGTGACGATGCGGGCCGCGTAG
+CGGCCCGAGGAGGAGCCGGGCAATCCAGCCTGAGCCCGGTGACGATGCGGGCCGCGTAGCGGCCCGAGGA
+GGAGCCGGGCAATCCAGCCTGAGCCCGGTGACGATGCGGGCCGCGTAGCGGCCCGAGGAGGAGCCGGGCA
+ATCCAGCCTGAGCCCGGTGACGATGCGGGCCGCGTAGCGGCCCGAGGAGGAGCCGGGCAATCCAGCCTGA
+GCCCGGTGACGATGCGGGCCGCGTAGCGGCCCGAGAAGGAGCCGGGCAATCGGCTTAGCCCGGTGACGAT
+GCGGGCCGCGCTGGGGGCACCATCCGCTTGCGGGGACGCGTCTGCGTCTACCTGGGCGGCACCGGTGAAC
+GTCTCATTCACCGCGCACCTCCGCTTCCTGCACGGCGGCGACGACCCGGGCAACGTCATCCGGGGCCATG
+TGGTCGTGGACTGGCAGCGACACGATTCGCGAGCAAATGTCCGCCGTGACGGCTAGATCGGTCGACTCGA
+CTAACTCGGCATTCGTCACAAAGTACGGATGTCGGTGCTGCGGTGGGTTCTAGTAGTCGCGCGCCTCGAT
+CGCGTGCCTACGCAGGCTACCCAGAACCGCGGCCTTGTGGTCGGCGGACGTGCAGCAAGCGCTCGCGAAA
+CAGAGCGACGCAACATTGGCGTTGTCCTGGAAACGCACACCCGCGTCGGCCATACCGGTGCGATAGCACT
+CGAGGACCTTGCGGCGACTTGCCAGGCGGCGATCAAGCCCGACTAGTTGGCGTAGGCCAATAGCGGCGCT
+GATCTCCGACAGCTTGCCGTTCATTCCGAGCTGGATGGACTCGCGTGTTTGCACCAAGCCGAAGTTCTGG
+AACTTGTATGCGTGCTCGACGAGCCGTGGATCGCGAGAAACCAGAGCGCCGCCCTCACCAACCGCGAACG
+GCTTGGTCGCATGGAAGGAGAAGATCTCGCATGCACCGCGTCCACCGAGGCGCTCGCCGTCGGCGTACGT
+GGAGCCGAAGCCGGCCGCCGAGTCGAGCACAATCGGTAGCTCCCATTCGGCGGCGAGCTCCTCCCAGACG
+CTGATCTGGGGATTGCCGACGCCGAACACATTGGCCAGCAGGATGCCGGCGATCCGGTCGCGGAAGCGTT
+CGATGACGGCGCAGGCGGAGTGGACGCATGGCTGCCATGTGTTGGCGTCGATGTCGATGAACCAGGGACG
+GTACCCAGTCCATAGCGCAGCCTGAGCCACGCCGACGAACGTGAACGACGGCATCAGCAGGTAGCGGTCC
+CGCGTACCGGCGCCGAAACTGACGTGGAGCGCCGCGAGGAGTGCCAGGGTGCCGTTGGCGAGGGTAGCAA
+CGTGCAGATGAGGTCCCAGATAGTCGCGCAGGGCGCGGGCAAACCGCCGCTCGTTCGGACCGAAGTTCGT
+GTACCAGTTAGCCTGGGCGATCTGTACGAAGTCCTCGGCGAGCTCGGCTGGCCCGGGAAAGCTCGGGCGG
+ATGAAGGGGATCTTGGGGATCGTCGAGCCACCCGGCTCGAGTTTTAACATGGACGTGCCTGGGGTCGCGC
+GTACTGCGGACGGCGGCTCCAGCACCGAGCCGGATAACGTTCGGATCTTCATATATGCAGAGCTCAAGGT
+CCGTTTGCAGCGCGTCGGGACAGTTTCCGCAGCGCACTTCGTCGCACCATCGTTGGCATCGGCGCCTGAA
+GCAGTTACCGCGAGAACCGCATCATGTCGAACTTGAGGTTAGCCTTACCTCTTAAGAATGTCACCCCCGG
+GGAGTGACCCCGGCTGTCCACGCGTGGGCGACCCGGCACGCACGGTGCACGTTCCCTGGTGTCTCACCCG
+CCTCATTCGTCCCGGCGCCACAGGGCTAGCGATATGGCCGCCTCGCGTAGTCGGTCCGGGTCGGTACGCG
+TGGGGCAGATGAGGAAGGTGCGGCGCATTGAAGCAGCCTGTCAAGCCCGGCTCGGTGACCGGCACGGCGC
+GTTCAGCATGGGGCCAGTGCGACGGGCTGGAGCGAAGCAAGCAGGCTGGCCGCCAGCGATTTCGCCAGCG
+ACCGGACGCGCGGTGCGCTCTCGACGTGCCAAAAACGGATCTTGGGAGTGAAATTGCCGCCGACTAGGGG
+CCCGATGACGCAAAAACCTGGGCTGGCCTCGAAGTCGTCGTTAACCAGAAGGCCACGGTTGGTGCGGTTC
+GGGCGGCACAGCCCGTTCTGCATCGCGCTGACCAGGAACGGCGAGGAACACGTGTCCAGCTCCTCGAAAC
+CGCCACAATTCACCACCGCAGCGAAGGGGACGGGGTGGGTATGCTCGGCTCCCGCGGCTCGGTAGGTCAT
+GGTGGCGAACGGCTGGCCGGACGCGCAGGCATCCACGCGCAGTACTTCGCCGGCGAGCAGGCTCAGCGTG
+CCGTCCGCGGCTAGCTCCTCGGATGCCTGGCGGCAATCGCGTCCCGCACGCCGCACCAACTTGGTGAAGT
+TCATGCCGTGCACGCAGAAGAACTCTTCCTGCTGCACGAGATCCATCTTGTGCAGCGCCTGCCCAAACAG
+GGCGGCAACGGCGTCGTACAAATCGGCCAGGTTCAACGAGCGTTCTTCGGCCGTCGCGAGATCGTCGCGG
+ATCGCGGACATGAGATCCGCCGCGGCGATCGCTTCCGTACAGAGCAGCGTGCGCAGCCGCGGGAAGTCAA
+ACTCCGGCGGCTGATTGCAGATCATGTAGGGCAGCACGCCGGAGCGCGAGATGACGGTGATGGACCGGAC
+GCGTGCGCGGATGCGCGCGTCGTGACGCATTAGGTAGAGCGCTTCCAGCGAGGTGGCGTTGGAACCCACG
+ACCAGTACGTTGCGCTTCTCCCACGACTCGACGCGGTCGAGCGAATCGCGCAGTCGCGCTACGTTGCTCT
+CCCCGCCGGGGGAGTAGAAATCGTTGATATAGGTGAATGCGGGTTCGGAATCGCTCGCAAGGATGGCTTT
+GGTCGGGGGGCTGCCAATGGCCACAACCACTTTGCCTGCAGCAATTGCCGTTGGACCGTTTCCAGACGGG
+CGGAGGCCGATTCGGTAGTGGCCGTCTGCGGAGTGGGCGCTCATGGCCTCAGCGCGGATGGTGACGATTT
+CGGCCAGGTCACGCTCGCCGAGCGCGGCGATGGCGGCAATCATCTGCTCCGACAGAAATACACCGAAGAG
+AAACCGCGGCAGGTAGAGCTCCCCCCACTGGTTGCCGTCCAATGCGTCGCGGTTGTCGCAGATCCAGCGG
+GCCGCGGCCGCACCGCCCTCTGCCTGGAAGAACGCCAGCCAGCGCTGCTTGTTCTGCTCCAGCCAGATCC
+GGTAGGCGGCCTTTTCCGGCTCGTCGGCGAAATCGTCGAGCTTCTGAATGGCCAGCGATCCGATGCTGGA
+GCGTTGGCCATAGGGGATTCCGCACCAGAACTGCTCGTCTCGCTCCACCACCGCGATGCGCAACTTGGGC
+GATGCCGAGGGGCTGCTCAGCAGGGCATCGGCCATTTCCAGCAGAGTCATAGAGCACGCGGCCCCGCTGC
+CGATGAACGCAACGTCGAAGGTAGGTGGAGTGATCATAGTCATCAAATAAGGGAAGGCTAACATAACCTC
+GAGGCGGTGGTTAGGCTTCCGCGGGCTTCTCCGGTTCGAGCACGACGCGGACAAACACCTTGCGGCCTGA
+CGCATCGACGAACCAAGCGTTGCGGAAATCATCATGGGTCAACGCGCGCAGGCGATTCAGGAAATGCCCA
+AACGTTCCGCGCTCGTTCAGGTCTAGCCGCCGGAGTTGTTCGAAATCCTTTTTCAGGTTGAGGTTGCCCT
+CGGTGGCCGGCGATTTAGCCGTGTAGCTGCCGTCCCGGATGGCGTCGAAATGTTCCAGCACCAACTCACG
+CTCGATGTCCATCAGCCGGGCGTAGACACTTCCCGAGGAATCCCACGACTCGATCGCGCATTCCCGCTGG
+GCGATGATCGGACCATGGTCCAACTGATCGTCGATCTCGTGGATCGTCACGCCGACTTTTTGCCCGTCGA
+TGATCGAGAAGACCTGGGGAAACCAGCCGCGGTTGTAGGGGTTGAAACCCGGATGAACATTCACACACCT
+GACCCCATCGATCAAAGCGGCGGGAAACCTCTGTTTACAGTGGAAGGAAAGGACGAGGTCATACCGCTCC
+ACGATTTCCGCGACGCGCTCTGCGACATCACATCGCGGGACACCCGGCAGCTGGCCGATGGGGGACTGAT
+AGACGTCCATATCGCCATGCCTGGCCTGCAGATCGACCGCCAGAGCATGGGCGTGGACGTTGTCGGTCAG
+GATCAATATCGTCACGACTCGCCCCCGCCAGCCTGCCCAGCGCCCATCAGCGGAGCCCCCAACACCAGCT
+CACCCTACTTCAGGGCCGACGCATACCGGACGGCCACGCTGGGGCCAGCGCAGGGACATCAGTCAGTGCG
+GTTCCAGGATCCGGGCTACCGCATCGTTCACGGACAACCGTAGTTCGTCACCGGTCAGCTCGTCGATACC
+CGTCGCCGAGCGCAGCATGGGCGCAAAGAGCCGCCAACCGAATTGCAGCGCAAGGGCGTGCGCGACCGCC
+AGCCGCGCGCCCAAGTCGCTGTCGTAGCGAGGCCGTACCGCGTCGAGCAGCTCCGCAACATTGGGAAATC
+GCTGTTGCAGCTGGCCCACGGGATATCCGTCCAGCAGTGCCCGGGCTAAGACCCGCCCATGTCGGTCGAG
+AGCCCGTTCGATGATGTCAGCGGGCGCCTCGGAGTGCAACAGTCTGGTCAGCTTCGTGCCCAGGTGATCG
+AGCACGGCCCCAACCAGTTGGTCCTTGGTGCCGAAGTGACGAAACACCAGCCCGTGGTTGACCTTGGATC
+GAGCGGCGATGTCGCGAATCGACGTCGCGGCTGGCCCACGCTCGGCGAACAGGTCGGTGGCGGCCTGCAG
+GATTGCGGCCGCTACCTCTTCCCGCCCAGTGGGCATCTTGCGGCGGTCGGTTGCCGGACGCGTAGTCATC
+CGGCTACAGTAACCGATGTAGTCATCTGACTACACTAACCATTCATTGAGGACGCCAGCAATGACAGATC
+TGATTACCGTGAAGAAGCTGGGCAGCCGTATCGGCGCCCAAATCGACGGGGTGCGCCTCGGAGGCGATCT
+GGACCCCGCCGCAGTCAACGAGATTCGCGCGGCACTACTGGCCCACAAGGTGGTCTTCTTCCGCGGTCAG
+CACCAACTCGATGACGCCGAGCAGCTGGCGTTTGCCGGGTTACTGGGCACCCCGATCGGCCACCCGGCCG
+CGATCGCCCTCGCCGACGATGCACCGATCATCACGCCGATCAACTCCGAGTTCGGCAAGGCGAACCGCTG
+GCACACCGACGTCACGTTCGCCGCCAACTATCCGGCCGCCTCGGTACTGCGCGCGGTCTCCCTGCCCAGC
+TATGGCGGGTCGACGTTGTGGGCCAACACCGCCGCGGCCTACGCGGAGCTGCCCGAGCCGCTCAAGTGCC
+TCACCGAAAACCTGTGGGCGCTGCACACCAACCGCTATGACTACGTCACGACCAAACCGCTGACCGCGGC
+GCAGCGGGCCTTCCGTCAGGTGTTCGAGAAGCCGGACTTCCGCACCGAGCATCCCGTGGTGCGGGTACAC
+CCGGAGACCGGTGAGCGCACGCTGCTAGCGGGCGACTTCGTGCGCAGCTTCGTCGGGTTGGACAGCCACG
+AATCAAGGGTGTTATTCGAAGTGCTGCAACGGCGAATCACCATGCCCGAAAACACCATCCGCTGGAACTG
+GGCGCCGGGCGACGTAGCCATCTGGGACAACCGGGCCACCCAACACCGGGCGATCGACGACTACGACGAC
+CAGCACCGGCTGATGCACCGGGTCACCTTGATGGGCGACGTGCCCGTCGACGTGTACGGGCAGGCTAGCC
+GGGTGATCAGCGGGGCGCCGATGGAGATCGCTGGCTGATCAACCAGTAAGCGCAACGCAATTATGTAGCA
+CCATGCGTGCTACCGTTGGGCTTGTGGAGGCAATCGGAATCCGAGAACTAAGACAGCACGCATCGCGATA
+CCTCGCCCGGGTTGAAGCCGGCGAGGAACTTGGCGTCACCAACAAAGGAAGACTTGTGGCCCGACTCATC
+CCGGTGCAGGCCGCGGAGCGTTCTCGCGAAGCCCTGATTGAATCAGGTGTCCTGATTCCGGCTCGTCGTC
+CACAAAACCTTCTCGACGTCACCGCCGAACCGGCGCGCGGCCGCAAGCGCACCCTGTCCGATGTTCTCAA
+CGAAATGCGCGACGAGCAGTGATCTATATGGACACCTCGGCCCTGACTAAGCTGCTCATCTCCGAGCCCG
+AGACGACCGAACTGCGGACATGGCTGACCGCGCAAAGCGGCCAGGGCGAGGACGCGGCGACAAGCACCCT
+TGGCCGGGTCGAGTTGATGAGAGTCGTTGCCCGATACGGACAACCAGGCCAAACTGAGCGTGCGCGTTAC
+CTACTCGACGGGCTCGACATCCTCCCGCTCACCGAACCGGTGATCGGTCTAGCTGAAACGATCGGACCGG
+CCACCCTACGTTCTCTCGACGCGATTCACCTCGCGGCCGCAGCCCAGATCAAGCGGGAACTGACAGCCTT
+CGTCACCTACGACCACCGATTGTTGAGCGGATGCCGTGAGGTCGGCTTCGTCACCGCCTCACCCGGCGCA
+GTCCGGTGACCATATCCAACGACCGCACGCTTCCTGATGCCTCAGCCCGCGTTGCTGACCGGATCGATCG
+GCAACCACCGCAGCGCGCCCGGGGCGTCGGCAGGCACCACCGGGTGCGCCGGTTGGATCGGCGCCAGCCG
+ACGATAGGGCTCACCCTGCGGTGGCCGCCGGTCGGTTTCGCCCTTGTTCGGCCACAGCGAGGCGGCCCGC
+TCGGCTTGAGCGGCGATGGACAGCGACGGGTTGACACCCAGGTTCGCCGAGATCGCCGCACCGTCAACCA
+CGTACAGCGTCGGATAGCCATAGACCCGGTGATAGGGGTCGATGACGCCGTGCTCGGGGTCGTCGCCGAT
+CACCGCGCCGCCGAGAAAGTGCGCGGTGAGCGGGATGTTGAACAGCTCACCCCAGGTGCCGCCGGCCACG
+CCGTCGATTTTGGCGGCGATGCGACGGGTGACCTGGTTGCCGATCGGGATCCATGTAGGGTTCGGCTCGC
+CGTGTCCCTGCTTGCTCGAGTACCAGCGGATACCCAGCTTCCCGCGCTTGGTGAACGTGGTGATCGAGTT
+GTCCAGGTGCTGCATGACCAGCGCGATCACGGTGCGCTCGCTCCATTGCCGGGGATTGAGCATCCGGATG
+GTGCCGCGCGGATCCTGACTGGCGGTCTGCAGCAACTGCCTCCAGCGCGGCACATCGGTGCCCTGCGGAC
+CGGAGCCGTCGGTCATCAAGGTCTGCAGCAGCCCCATCGCGTTGGAGCCTTTGCCGTAGCGCACGGGTTC
+GATGTGGGTGTCGGCCGTCGGGTGAATCGACGACGTGATCGCCACGCCGTGGGTCAGGTCCAGGTCCGGA
+TTGACCTTCAAGGTGGCGGCCCCGACGATCGATTCTGAGTTGGTGCGGGTAAGGACACCCAATCGCTTCG
+AGAGACCAGGGAGCCGACCCCTATCCCGCATCTTGAACAGCAGATGCTGGGTCCCCCAGGTGCCCGCGGC
+CAGCACCAGCTGCGTTGCGGTGAAGGTGCGCCGATCCCGGCGCAGCCAACTGCCGGTTCGCACTGTGCGG
+ACCTCCCACAACCCGTCGGACCGCCGCTCAAACCCCTTCACCGTGGTCATCGGAATCACTTGCGCGCCAG
+CTGATTCCGCGAGGCCAAGGTAGTTTTTCACCAGGGTGTTCTTGGCACCGTGGCGACAGCCCGTCATACA
+GCAGCCGCATTCCAGGCAGCCGGTGCGCGCCGGCCCGGCACCGCCGAAGTAGGGATCGGGCACGGTCTTG
+CCGGGCGTCTTGGTGCCGTCGGGGCCGAAGAACACTCCAACCGGGGTCGGCACCCAGGTGTCGCCAAACC
+CCATCTCGTCGGCGACCTCCTTGACGATGCGGTCGGCGTCGGTGAAGGTCGGGTTTTGCACCACCCCGAG
+CATCCGCTGCGCCTGCTGGTAGTGCGGCATCAGCTCGCCACGCCAGTCGGTGATGTGTGACCACTGCTGG
+TCGGCGAAGAACGGCTCCGGCGGCACGTACAACGTGTTGGCGTAGTTGAGGGAGCCCCCGCCCACCCCGG
+CGCCGGCCAGGATCATCACGTTGCGCAGCGGGTGGATACGTTGAATGCCATAGCAGCCCAACCTCGGCGC
+CCAGAGAAACTTGCGCAGGTCCCACGACGTCTTGGCGAACTCCTCGTCGGAGAACCGGCGGCCGGCCTCC
+AGCACGCCGACCCGGTAGCCCTTTTCCGTCAGCCGCAGCGCGGTGACGCTGCCCCCGAAACCCGATCCAA
+TAATCAGGACGTCGTAATCCGGCTTCATCGCTGCAGTATGACCCCCTTTACATCGGGCCAGTTAATCAGT
+CTCTCAGGTGGCGTCAGCCCCCAACGGTCAGGCCGACCTTCTGGAACTCCTTGAGGTCGCAATACCCGGC
+CTTGGCCATCGATCGGCGTAGCCCACCGACCAGATTCAGGCCGCCGAACGGGTCGTCCGACGGCCCGCCC
+AGCACCCGCGCCAGCGGCGGCCGCTCGCCGACCGCGATCTGCAGCAACGCCCCCCGCGGCAACGACGGGT
+GCGCCGCCGCGGCCGGCCAGAACCATCCCTCGCCGAGCGCCTCGGCCGATTCGGCTAACGGGGTACCCAG
+CACCACCGCGTCGGCGCCGCAGGCGATGGCCTTGGCCAACTCGCCGGAAGTGTGGATGTCGCCGTCGGCC
+AACACGTGCACGTAGCGGCCGCCCGTCTCGTCGAGGTAGTCGCGCCGCGCGGCGGCAGCGTCGGCGATCG
+CGGTCGCCATCGGCACGCTGATGCCCAGCACCTCGTCGGTCGTCGTCACCCCCTGGGTGGAGCCGTAGCC
+AACGATGACGCCGGCGGCGCCGGTGCGCATCAGATGCAGCGCGGTGCGGTGGTCGAGCACCCCGCCGGCG
+ACGACCGGTATGTCGAGCTCGGAGATGAAGGTCTTCAGGTTGAGCGGCTCGCCGTCGCTGGCGACGCGCT
+CGGCGGAGACGATGGTCCCCTGGATGACCAGCAAGTCAATACCGGCCGCAACCAGTACCGGTGTCAGCCA
+CTGGGCGTTTTGCGGGCTCACCCGCACCGCGGTGGTCACCCCGGCCTCGCGGATGCGAGCCACCGCGGCA
+CCCAACAGGTCGGGATTTAGCGGTGCCGCGTGCAGCTCCTGCAGCAACCGGATCGCCGTCGACGGTTCGG
+GGTCGGCCGCTGCAGCTTCCAAGAGTTGGGCGATTTTTGCCTCGACATCGAGGTGGCGGCCGATCAGCCC
+CTCGCCGTTGAGCACGCCCAGCCCGCCCAGCCGGCCGAGCTCGATCGCGAACTCCGGGGACACCAGGGCA
+TCGGTGGGGTGTGCCACCACCGGGATCTCGAACCGGTAGGCGTCCAGCTGCCAGGCCGTGGAGACGTCCT
+TCGACGAGCGGGTGCGCCGCGACGGCACGATGCTAATCTCGCTGAGTTCATAGGTGCGGCGGGCGGTGCG
+GCCCATGCCGATCTCGACCATCTAGATATCCAGGTCGCCGTTAGCGCGCGTAGTAGTTGGGCGCCTCGAC
+GGTCATCGCGACGTCGTGGGGATGACTCTCCTTGAGGCCCGCGGGTGTGATCCGGACGAATTGCGCCTGC
+TGTAGCACCTCGATGGTGGGCGACCCGGTGTAGCCCATCGCGGCGCGCAGGCCACCGGTCAACTGGTGGA
+TCACCGACGACAGCGGACCACGGAACGGCACCCGCCCCTCGATCCCTTCCGGCACCAGTTTGTCTTCCGA
+CAGCGCGTCGTCGGCGAAGTAGCGATCCTTGGAATACGACGTCGCCCCCCCACGCCCTCGCATGGCACCC
+AGTGATCCCATGCCGCGATAACTCTTGTACTGCTTGCCGTTCACGAAGATCAGCTCACCGGGCGCCTCGG
+CTGTGCCGGCCAGCAGCGAGCCCAGCATGGCCGTCGACGCACCGGCGGCCAGCGCCTTGGCGATGTCGCC
+GGAGTACTGCAGTCCGCCGTCGGCGATCACCGGCACGCCAGCAGGACGACAAGCCGCTACAGCTTCCAAG
+ATCGCCGTGATCTGCGGCGCGCCCACCCCGGCCACCACCCTCGTCGTGCAGATCGACCCCGGCCCCACGC
+CGACTTTCACCGCGTCGGCTCCGGCGTCGACCAGGGCCGCGGCCGCGGACCTGGTGGCGACGTTGCCGCC
+TACCACCTCAACCCGGTCGCCGACTTCGGACTTGAGTTTGCCCACCATGTCGAGCACCAACCGGTTGTGC
+GCGTGCGCGGTGTCCACGACCAGCACGTCGACCCCGGCGTCGACCAACATCATGGCGCGCACCCAGGCAT
+CGCCGCCGACGCCGACGGCCGCCCCCACCAGCAGCCGGCCGTCGCTGTCCTTGGTGGCCAGCGGGTGTTG
+CTCGGTCTTGACGAAGTCCTTGACGGTGATCAGCCCGGTCAGCCGGCCGCGGCCGTCGACCACGGGCAGC
+TTCTCGATCTTGTTGCGGCGCAACAGGCCCAGCGCCGCGGACGCACTGACACCCTCTTGAGCGGTGATCA
+GCGGGGCTTTGGTCATCACCTCGGCGACCTGCTTGGACTGGTCGACCTCAAACCGCATGTCACGGTTGGT
+GATGATGCCCACCAGCGCACCGTCGTCGTCGACCACCGGCAACCCGGAGATCCGGAACCGGGCGCACAGC
+GCATCGACCTGGGCCAAGGTGTTGTCCGGCCGGCAGGTGACGGGATCGGTGACCATGCCGGCCTCGGATC
+GCTTCACCATCTCGACCTGGCCGGCTTGCTCGGCAACGGGCAGGTTGCGGTGCAACACCCCCATGCCACC
+CGCCCGTGCCATCGCGATGGCCATACGCGACTCGGTGACGGTGTCCATCGCCGAGCTGACCAGTGGCACC
+TTGAGCCTGATCTTCTTGGTGAGCTGGCTGGAGGTATCCGCGGTGGCGGGCACCACGTCGGAAGCCGCCG
+GCAACAACAAGACGTCGTCGAATGTCAGCCCCAGCATCGCCACCTTGTGCGGGTCGTCGCCGCCGGTGGG
+CACCGGGTCAGTAGTCAGGCCGCCCATGCGAACGTACGGGCTGACCACCAGGTCGGAGCTGTCTTCCAGG
+CCGGACATGCCACGGGACATCGGTGGGGCCCTCCATACGCATGTTTTCAGTGAGAAGCCCATCCTATCGG
+CTCGTAACCGCCCGGTGACGATGCGCGCCGCAGCGCTGGCCGAGAAGAACCGGACAATCACACCGCGACG
+AGGCTGCGCCAGCGTGTGGTCAGCCCGACACGAAGCGAGAACTCAATTTCTGGCGTTATCACCGCGTGCT
+TGCGTAGTGTAGAGGGGTGCGCGACCACCTGCCGCCGGGTTTGCCGCCCGATCCGTTTGCCGACGACCCC
+TGTGACCCGTCGGCCGCACTGGAGGCAGTCGAGCCTGGCCAGCCCCTCGATCAACAAGAGCGGATGGCCG
+TCGAGGCCGACTTGGCCGATCTGGCCGTATACGAAGCTCTGTTGGCGCACAAGGGAATTCGTGGACTTGT
+AGTGTGCTGCGACGAGTGCCAGCAAGACCACTATCACGACTGGGACATGCTGCGTTCCAATCTGTTGCAA
+CTGCTTATCGACGGCACCGTCCGCCCGCACGAGCCGGCCTACGATCCCGAACCGGACTCCTACGTCACCT
+GGGATTACTGCCGGGGATATGCCGATGCTTCGCTCAACGAGGCAGCACCAGACGCGGACAGGTTCCGCCG
+CCGCTGATCGCGCTCGCTAGTGCGTCGGACTCACCGGCGTTTCCGGTGCTGGCTGCCCCGCCGGATTCGT
+CGCCTCGTCGGCGGGTTCCAACGAGGGGTCAATTGAGCCCGGCTCGGGTTTTGATGACGGCGTGCTGGGG
+CTGGCTGCCACCGTGGACGTGGAGTTCGGCATGGGGCTCTCCGAGACGCCTGCCGACATCGACGGTTCAG
+CTGCCGATGCAGGCGTCGGGGGGGTCGGCGGCTCGACGACTGGAGCCAGCGGAGTCCACGAGTTTCCCAC
+CGAACCCGGAGCCGCAGGGTTGGACGGCGAGCCGGGCCGCAGCGTGGCGTTCGGGTCGCGCGTCTCCACC
+TTGGTATTCAGCAGGTTCACCTCGTTGATCAGGTCCTGCCGGCGGCTACCGTCAGTCACGGCCTGCACGG
+TGCTGCTGACCTCAGCCAGCTCATCCTGCGCCTCGGCCCATTGGCCTTGGGCAATCATTTGCTCGACCTT
+CGCCAGATTGGCCTTGGCCGACAGCACGATCTGATCGTCGCTGACCCGCGATCGGTTGAACATCATCGCG
+TGCAGGCCGTACAACAGGTCCCCGGGGCGAGCATCGGCCACCACGGCGCCGAACCCGCTCAGCACCAACA
+GCGCCGCGGCCACCGACCCGACGGCCGCCAGGCTGCGACGAGCCCGTCGCCGTTGCGCTACCCCGGCGCG
+CAACGCGGCGACGGCCTCGTCCTGTGAAACCAGGGCACTGGCCGGCGGCCACCTCAAGTCGTCGCGCCAC
+TGTCCGAGCAGGGCGGCCAACGCGTCATCGCGAGGATCCGCGAAGTCAACCTCCTCCCGTTCGGCGAGTG
+CGTCGAGCAGCAGATCGGTGCGGGCCAGCTCATCCAATGGCGGCCGATCGCCAAGGGGATTACCAAATTC
+ACGCATAGTCACCTGCCGCAACAATCTCGTCCTTCAGCCGCTGAAGTGCACGGTGTTGGGCCACCCGGAC
+CGCCCCCGTGGTGCTGCCGACGGCGGCGGCGGTCTCTTCCGCGGACAGGCCGACGACAACACGCAGAATG
+AGGATCTCGCGTTGCTTGGCCGGCAAGATCTCAAGCAATTCGTTCATCCGGGTGACCGAATCGGCCTCGA
+TGGCCATCTGCTCCGGGCCGGCGTCGGCTGACCAGCGCTCAGGAAGCGTTTCGGCGGGATAGGCCCGGTC
+ACGGCCGGCTGCCCGATGGGCGTCGGCAACCTTGTGCGCCGCGATGCCGTACAGAAACGCCAGGAATGGC
+CGGCCGCGGTCCCGATAGCGCGGCAGCGCCGTTATGGTGGCCAAGCACACCTCCTGTGCCACGTCATCTG
+CTGACAGGCCGCTCCGCTCGACCGTGCCGACTCGCGCTCGGCAATATCGCACGACGATCGGGCGGATGGT
+CTCCAGCACCTCCCGAAGCGCGTTCCGGTCTCCTGCCACGGCCTCCGCAACCACAGCGTCGAGACGTTCC
+CCTTGCATTGTCATCGACGGCGATATCTCCAACGTTACGAAGCGGACACATCCCGGGCTAACTCCCGGAT
+CGACCATAACGGCCCAACCGCGTTTTAAGCGGTACGCCAGCATCCACCGGCGCGCCGCACCTGGCCTGCG
+CAAATATTGCGTATTTTGGTGAGTTCGCGCAGCTGTTGTGCTGAAAACGTGACGGTGCCGATATCGATCA
+GCAAGCATGCCAGCGCCCACCGCAGCGGCAAGAGCCCAAACCGGGCGGTGGCATCGAGAGCCTCTTCACC
+GACGGCGCGTGCTCGCGCGACGGCGCCAGCACTGCACAGCGCGGCGGCCAACACCACGTCGCTTTTGACG
+CGGTGGCGCGCCGACGCGACGGCCATGGCCTGCGTCAGCTCGACCGCTTCCTCGGCATGGCGGACAGCAG
+TTGCGCCGTCGCCGGTGGCCATCGCCAACTCGGCGGCCACCCACCGCCGACGCACCGCCAGGCGGTCCGC
+CACGAGCGGGGACACCACCAACGGATCCGCGCGATCTAACAATGCCCCCGCGGCGGCGAAGCGGCCGACG
+CCAAGCGCATCGGCCGCCAGCCCGATCAGTGCATCGGCACCAGCTTCCCGATCGGCGCCGGCCAACGCCA
+AGGCACGACCATCCCAGCCGCGCGCCAGCGTGTGCCAACCAAGCTGCCGCAACAACGATCCCTGCGTACT
+ATGCGCCAGCGATGCCAACGGGCCCGCCGGCACCAGGCGTCGCAGCACCGACAGGTCGCCATAGGCGTGG
+GCGTAACGACCCTGCCCACCAGCGGCCACGGCGCGCAACCACAAGTGGTGCGGCGTGATCGCCGTCGGTA
+GCGGCCAGCTGCCCGGCTGGTTTCCGAAGGCGGCAGCGACCAACACTTGCTCAACCACCGGAGCGTGAGG
+AGTTTCATTCACCGTGATAGCCGTGCCTTCATCAGTAAAAAGTTGGTGGTTTCTTCGTTAACGGCATATT
+ACTCACAGCTTTCTTTGCGCTAATTTAGGCGTACTCACAGCATGGGATGACCTGGGCAAATACCTCATCT
+ATCCGCCCGGGATAGCATGCGGCGCAGGCGGCGAATGCGGCGCAGATGAACGCAGAGTTAATTCTCACGC
+AACGGTCCGATATTGCACGCCAACGGACGCCTATTGACGGAAATTCGGCAGCGCCCCTAGCGTCTATCCT
+TGACGGTAGTCATCGGTGACGCCACTCCACTTCAGTTGCACAACTCGCGCGTCCGCGAACCCAACCTCCA
+CTTGGGCGTGTCGTGCAGAGAGGGAATCAGCAATGCCACAGCCGGAGCAGCTACCGGGACCCAACGCAGA
+CATCTGGAACTGGCAATTGCAAGGCCTGTGTCGCGGCATGGACTCATCGATGTTCTTCCATCCCGACGGC
+GAGCGTGGCCGTGCCCGAACGCAGCGCGAACAACGCGCCAAGGAAATGTGTCGGCGCTGCCCCGTGATCG
+AGGCGTGCCGATCCCATGCGTTAGAGGTCGGTGAGCCCTATGGCGTTTGGGGTGGCCTGTCCGAATCCGA
+GCGCGACCTACTCCTCAAGGGCACCATGGGACGCACCCGCGGCATCCGCCGCACAGCTTAAGCCGCGCGA
+GCAGACGCTAAAGCCCCCGCACGCTCGGCGTGTCGGGGGCTTTTGCGTCTGCTGACCGGAGTTCAGTGCG
+CGTGCCCGTGGTGATGGTCGTGATCTTCTGCCTTGGCCGGCTTGTCGACCACGACCGTCTCGGTGGTGAG
+TACCATCCGGGCAACCGATGACGCGTTCAACACCGCCGACCTAGTCACCTTGACCGGGTCGATGACGCCG
+TCAGCGGCCAAGTCACCATAGCTCAGGGTGTTCACGTTCAGCCCATGCCCGGCGGGTAGCTCGCTGACCT
+TGTTGACCACCACCGAGCCGTCCAAGCCAGCGTTGGCGGCGATCCAGAACAACGGCGCGGCAAGGGCTTC
+GGAGAACACGTCGACACCGAGGACCTCGTCACCGGTCAGCGACGCACGCAGTTCGGTCAGCGCCTTGCGG
+GCCTGGTGGATGAGCGAGGCTCCCCCACCAGGGACGATGCCCTCCTCGACCGCGGCCTTGGCGGCCGCGA
+CCGCATCCTCGACGCTTTCCTTGCGCTCCTTGAGTGCGGTCTCGGTGGCGGCACCCACCTTGATGACAGC
+AACCCCGCCGGCCAGTTTGGCCAGCCGCTCGCCAAGCTTTTCCCGATCCCAATCCGAATCGCTCTTGTCG
+ATCTCGGCACGCAAGTGCTTCGCCCGGTTGGCCACCGCTTCTGCGGTGCCGCCGCCGTCGACAATGACCG
+TGTCGTCCTTGCTGACCACCACGCGTCGGGCCGAGCCCAGCACCTCCAAGCCCACCTCGCGCAGCACCAT
+GCCGGCGTCGGGGTTGACCACCTGGCCACCCGTCACCACCGCCAGGTCCTCAAGGAACGCCTTACGGCGG
+TCACCGAAGTACGGCCCCTTGACCGCGACCGCTTTCAACGTCTTGCGAATCGCGTTGACGACCAGCGTCG
+CCAACGCTTCGCCCTCCACGTCTTCAGCCACGATCAGTAGTGGCTTACCCGTTCCTGCAACCTTTTCCAG
+CAATGGCAACAGATCGGGAAGCGAGCTGATCTTGTCTTGGTGCAGCAGGATCAACGCGTCCTCGAGCACC
+GCCTGCTGGTTATCGAAGTCGGTAACGAAGTATGCCGACAAGAAGCCCTTGTCGAAGCCGATACCCTCGG
+TGAACTCCAACTCGGTGCCCAGCGTCGAGGATTCTTCGACGCTGACCACGCCGTCGTGGCCGACCTTGCT
+CATCGCTTCGCCAACCAGGTCACCGATCTGCTCGTCGCGCGAGGACACCGTCGCCACCTGCGCGATGCCG
+GTCTTGCCGGACACCGGCGTGGCCGATGCCAGCAGCGCCTCGGATACCGCGTCGGCGGCCTTGCCGATTC
+CCACGCCGAGCGCGATCGGGTTGACGCCGGCGGCCACTAGCCTCAGGCCGCCCTTGATCAGTGCCTGCGC
+CAAGATGGTTGCGGTGGTGGTGCCGTCACCGGCCACATCGTTGGTCTTGGTGGCCACCGACTTCACCAGC
+TGGGCGCCCAAGTCTTCAAACGGATCTTCCAGCTCGATCTCACGTGCCACCGTGACGCCGTCGTTGGTAA
+CCGTGGGTCCGCCAAACGCCTTGGCCAGCACCACATGCCGGCCGCGCGGCCCCAGCGTCACCCGCACGGT
+GTCGGCCAGCTTGTCCATGCCGACCTCCATGGCGCGACGCGCGGTTTCGTCGTATTCGATCAGCTTGCTC
+ATCAGGCTCCTCTACGCAGGGCTAGTCCGCTAACGCATGCCGCCCCGGAAATCACCCGTGGTGAGCACGG
+GGATCGCCGGGGCGGAACACGCTCTACTACTTGGAAACGACGGCCAGCACGTCGCGTGCCGACAGGATCA
+GGTATTCCTCGCCGTTGTACTTGATCTCGGTGCCGCCGTACTTGCTGTAGATGACGGTGTCACCCTCCGC
+AACGTCCAGCGGGATCCGCTTCTCGCCGTCCTCGTCCCACCGGCCAGGGCCGACGGCAACGACGGTGCCC
+TCCTGCGGCTTCTCCTTGGCGGTGTCAGGAATGACCAGACCGGACGCGGTCGTGGTCTCGGCCTCGTTGG
+CCTGCACGAGAATCTTGTCCTCGAGTGGCTTGATGTTCACCTTCGCCACGATTGGAGCCCTCCACTATTT
+GGATCAGAGCCCGGGACGCTCGCCCGGACCGGAGTTGGCGGTCGGTCCGGGGCGTGCCCCGGAACCGTCC
+GAATTACCAGGTGATTCGGCATTCGTCCGCGCCCTCGCGCCGTCGTCGCGGGTGCCGACGCAGGGGTTAG
+CCGATTGCCATCTAGCACTCTATACATGAGAGTGCTAGCACTCAAGGGCGCCCCCTTGCTTCCTGGTTGC
+CAGCGTGTCCGGGTACGCCAGGTGCAATGTCCGGGTCACCGCACCTGCCCCTGCATCACGGGCAGACCCG
+GGTCACTGGGCACGTCCAGCGGCGACGGCGGCGCTCCCGCGGCCACCAGCTGCGCGGCGAACGCCGCGAT
+CATCGCCCCGTTGTCGGTGCATAGCCGGGGACTGGGGATCCGCAACGTCCGGCCCGCCTCGCCGCAGCGC
+TGTGTGGCCAGCTCTCGCAGCCGGGAGTTCGCCGCCACTCCCCCCGCGATCAGCAGCGTTGAGACGCCTA
+GCGCAGTGGCGGCCCGTACCGCCTTCATGGTCAACACGTCCGCGACGGCCTCCTGGAATCCGGCGGCAAT
+GTCGGCGGTACGGAAGCCCGGGTCAGCCGCGTGGCTTTCCACATACCGCGCGACGGCCGTCTTGAGCCCG
+GAGAAGCTGAACGCATAGCGGTCATCGGCCGGGCCACTCATGCCGCGCGGGAAAACGATGGCGTCCCGAT
+CACCGGTGCGCGCCAGGTCGTCGAGCGCCTTGCCACCCGGATAGCCCAATCCCAGCAACCGGGCCACCTT
+GTCGTAGGCCTCGCCGGCGGCGTCGTCGACGGTGCTGCCCAGCTCGATGATCGGCTCACCGAGCGAGCGA
+ACGTGCAACAGGTGGGTATGTCCTCCGGACACCAACAACGCCACACACTCGGGCAGCGGCCCGTGTTCGT
+AGACGTCGGCGGCCAAGTGCCCGCCCAGATGATTCACCGCATAGAACGGCACCCCCCAAGCAGCCGAATA
+TGCCTTGGCCGCAGCCACTCCCACCAACAGGGCGCCCGCGAGCCCGGGACCGATGGTGGCCGCGACAATG
+TCTGGCTGTTTCAAGCCGGCGGCCGCCAGCGCGCGGCGCATCGCGGGACCCAGTGCCTCCAGGTGCGCAC
+GGGAGGCAATCTCGGGGACCACGCCGCCGAACCGAACATGCTCGTCGACACTGGAAGCCACCTCGTCGGC
+CAACAATGTCACGGTGCCATCGGGATCGAGCCGCGCGATGCCGACACCGGTTTCATCGCAGGAGGTTTCG
+ATGCCCAAGACTGTCGTCATGACGGGTCCCCCGAATCCCTACGCATCGTGTACGCGTCGGCGCCGCTGAC
+CCGGTAATATCGCCGGCGCAAGCCGACCCGCTGGAATCCCACGCTGCGATACAGCGCAAGAGCGGCGTCA
+TTATCGGTGCGGACCTCCAGGTAGACCACACCACCCCTGGCAAAGTCCAGCAGTTCGCGCAGCAACCGAC
+GGCCGATGCCCCGCCCCTGGTAGGCCGGGTCCACGCCGATGGTGTGCACCTCGTACTCGAACGGCGGTGT
+TCGGCCCAACCGCGAGATTCCGGCGTAACCGACCAGCGTGCCACCGCTGCGCGCACCCACATAGTGGTTG
+TGCGGGCTGGCCAGTTCGCGGTTGAACGCCGCCGGCGGCCAGGGATCGTCACCGACGAACAGCTGGGCCT
+CCAGCTCGGCGCACCGCTGGGCGTCCGCGCGCGTCAGCGCGCCGATGGTGACGGGCTCGGTGTCGGCCGT
+CACGTGCAAACCGCCAGCGGCTTGGCATCCGGCCGGCGAAGATACAGCGGCACTAACGGCGCCGGCTTGT
+CGGCCCAGTTCACCGCGGCTACCAGACCCGCCGGCGACGGGCGGCTGGGCTCAACGCAGGGGAGCGCGAA
+CAGCGCCGCGTGCTCCGGCGCACCGGCGACCGCCAATGCCGGGCCGGGATCGACGTCGGCCGCGGCATTA
+ACGGCTGGTCCGACCGTACGAATCCCGTCGCAGTAGCGTGCCCAGTAGACCTCACGCCGGCGTGCATCGG
+TGACCACCAGCGTGTCACCGATGGTTTGCCCGCCGATGGCGTCCAGGCTGCACACGCCATACACCGGGAT
+GCCCAGTGCGTGCCCGTACGCGGCGGCGGAGGCCATGCCTGCGCGCAGCCCGGTGAACGGGCCCGGACCG
+CAGCCCACCACGACGGCGTCCAGGTCGGCCATTGTGAGCGCGGCATCGGCAAGCGCAGCCAGCACGTTGG
+GAGTCAGCCGTTCCGCGTGCGCTCGGGCGTCGACGGTGACCCTCTCGCCCAGCACAACCAGATCATGACG
+CCGCACGATACCCGCCGTGACCGCCGGTGTAGCGGTGTCGATGGCCAAGACGGTGCTTATTTGCACGCGG
+CTCATGACCGGCCCCACGACCAAGTCGCGATCCTGGTGTCGGAGTGGCTAACCCGCTCCAGGCGGACGTC
+GAGGTGGCGCTGCGAGAGCCGCTCGGCCAGGCCCTCGCCCCACTCCACCACGACGACGGCGTCTTCAAGA
+TCGGTGTCGAGGTCCAGTGAGTCCAGCTCACTCAGCAGGTCGGCGCTGTTGTGGTCCAGCAGTCGGTAGA
+CGTCGACGTGGACCATCGCCGGCGTGCCCGGCCGCCGCGGCCGGTGCATTCGCGCCAGCACGAACGTCGG
+CGATGTGATCGGCCCCTCGACATCCATCGCCATGGCAATACCCTTGGCCAGCACCGTCTTTCCCGCACCG
+AGCGGACCGGAGAGCACCACCACGTCGCCAGCGCACAGCTGCTCACCCAGCCGGGACCCCAGCGTTAGGG
+TGTCCTCGACGCGCGGCAGCGTCGCCGTGCCGCCGCCCGTAAGCCCAGCCCTGGCTTTCGGTCGTCTGCG
+GATACCCTCACGGCTCAACGGTTTTCAGCCTCGCGATAGGTCCTGGTGATACGTCCTCGCGGGCTGGTGA
+CCACTTCGTAGTGGATGGTGCCGACAAGATCGGCCCAGTCCTGAGCCGTGGGCTCACCCCGGATGCCCGG
+CCCGAACAAAATCGCCTCGTCGCCTTCGGCCACATCAAGCGGCCCGGGGCCCAGGTCGACCATGAACTGG
+TCCATGCAGATCCGCCCCACACCGGGGCATCGTCTGCCGTTGATCAGCACCTCCAGCCGCCCGCCCAGCG
+ACCGGAACACGCCGTCTGCGTAACCGATCGGCAGCAGCGCCAGATTGGTGTCGCGTGGCGCGATCCATGT
+GTGCCCATACGACACGCCCTCCCCCGCACGAATCGATTTCACCAGCGCAACAGCACATTTCACGGTCATC
+GCCGGCACCAGCCCCATGTCACCGAGGGCGGGTACCGGGCTTAGCCCATACACCGCGATGCCCGGCCGCA
+CCAGGTCGAACGTCAGGTCGGGGCGCGCCATAGTTGCTGATGAGTTCGATAGATGCGCCACCTCGAACCG
+CACCCCTTGTTCGCGGGCCTGCGCCAGAAAGGCGGTAAACCGTTGGGCCTGAACATCGTTGATGGAATCG
+TCAGGCTTGTCGGCGTAAACCATATGCGACATCAGCCCCCGCAGCCGGACGGCGTCCTCGGCCATGGCTT
+GGCGTAACGCGGTCAGCATGGCCGGGAATTGTGCCGGTCCCACGCCATTGCGGTTCAGCCCGGTATCCAC
+CTTGACGGTCACCGTCGCCGTCCGGCCGGTCCGGCGCACCGCGTGCAACAGTTCGTCGAGTTGGCGCAGC
+GAGGACACCGCGACCTGCACGTCGGCCAGCAGCGCGGGCCCGAAGTCGATGCCGGGCGGATGCAGCCAGG
+CCAGCACCGGTGCGGTAATGCCATCAGCGCGCAGCGCTAGCGCCTCGTCGACGGTGGCGACGCCGAGTTC
+GGCCGCACCGGCTCCCAGGGCGGTTTGGGCGACGCGCGTAGCACCGTGACCGTAGCCGTCGGCCTTGACC
+ACCGCCATCAGCTGCGCGTGGCCGGCGTGCTCACGCAGCACCCGCACGTTGTGTTCAATAGCGCCCAGAT
+CCACCATGGCCTCGGCGAGGAGGCCAGGTGTCTGGGATATCGGTGTCATGGCCAACGAAGTCGTGCCCCG
+CCCATCTGTCGTGTCGTTTGGCTTTCCGACATTCTCCCAGAACCGTTTCACTGAGCAGTATTCCGGCCTG
+TGCCCGATTGCCCCGGGTCGCGGTGCTGGGCTGCAGCCGTGTCGGCGTGACTGTCCTGTGGCTCGGTGGT
+TGGTTGCCGATCACCCGGTGTTTGGCTCAGATTGCCGGTGCCGCATGATGGTTGGCGTCAATAGAGTGCG
+GATCGGCCGGCATGAATTGACGGGAGCGTAGCTTGACCGCGGCCCATCACCCGTGGCAGGAAACAGTTGC
+AGTGTGTACTATTCGCCCTAGACTGCCGCAGTTCCGGGGGAAGTGAACCTATTGCGCCCGTGCATCACTG
+CACGGGTATGGGCTTTGGCGGTCGCTTCGCACCATCAACGCCGACAGTGCGGACAGCGCAAACCGACGGC
+ACACCCCTTGCACGGATGTGGGGTGTTTTTGAGATGGAGCGAAAGTAGGCGTGTCTTTTATTTTCACAAC
+CCCCCAGGCATTGGACAACGCGGCTAAGTCCGTGTCGGGGATTCACGATTTGTGGCGCAAAGGACGCTAA
+GGCATCGATCCCGGTGGTCAACGCTATTTGAGCCCCCCGCTTCCGACCCGGTGTCGAATAGGGATGAGGC
+CGCTCCTCCGCCAGCACATGAGGCAGTATCACCAGATCAGCTTTCCGGCCATAGAGCATCGTCACCGGGT
+TAGGCATGGTTTAGGCAGCGCTTAGCTGAGAACGCCGAGGCGTGTCGGCTCGCCGAGGCCCAAAACAGCA
+CAACCTTGCACTGATCTAGCTGAAGACCAAACCGGCACAGCAGACATTGCCATACGCGACAACAGCCGTC
+ATCAACCGAAAGGAGCAAAGAACAAACAGATGCATCCAATGATACCAGCGGAGTATATCTCCAACATAAT
+ATATGAAGGCCCGGGCGCTGACTCATTGTTTTTCGCCTCCGGGCAATTGCGAGAATTGGCTTACTCAGTT
+GAAACGACGGCTGAGTCGCTCGAGGACGAGCTCGACGAGCTGGATGAGAACTGGAAAGGTAGTTCGTCGG
+ACTTGTTGGCCGACGCGGTTGAGCGGTATCTCCAATGGCTGTCTAAACACTCCAGTCAGCTTAAGCATGC
+CGCCTGGGTGATCAACGGCCTCGCGAACGCCTATAACGACACACGTCGGAAGGTGGTACCCCCGGAGGAG
+ATCGCCGCCAACCGCGAGGAGGTGCACAGGCTGATCGCGAGCAACGTGGCCGGGGTAAACACTCCAGCAA
+TCGCAGGACTCGATGCACAATATCAGCAGTACCGGGCCCAAAATATCGCTGTCATGAACGACTATCAAAG
+TACCGCCCGGTTTATCCTAGCGTATCTGCCCCGATGGCAGGAGCCGCCGCAGATCTACGGGGGCGGGGGC
+GGGTAGGTCCAGAAGGCCGGGGCGGAACCTGTCAACATTTCTGAGACACGATTTTCGGGGATTTATTGAG
+TCGGCTGGTCCTCCTTCGGTGGTGGGTTGATCGCGCTGAAGGCCGGTAGCGCGGGTGGCTCGGGTGGTTT
+GCGAACGAATCCGCTCGAGGTGGTCTCGGTAGGCGGTGTCCAGAACGGTGGCGCGGTGCCGGCGGATCTG
+ATCGGCGCGGCCGTAGTGCACGTCGGCGGGCGTGTGCAGTCCGATGCCGGAATGCTTGTGTTCGTGGTTG
+TACCAGCCGAAGAACCGGTCGCAGTGCACCCGGGCCGCCTCGATCGACTCGAACCGTTTCGGGAAGTCGG
+GCCGGTACTTGAGGGTCTTGAACTGGGCCTCAGACAACGGGTTGTCGTTGCTGGTGTGCGGGTGTGAGTG
+CGACTTGGTGACACCGAGGTCGGCCAGCAGCAGTGCCACCGGTTTGGAGCTCATCGACGAGCCGCGGTCG
+GCGTGCAGGGTCAGCTGGTCGGCGCTGATGTGCTGGGCGGCAAGGGTTTGCGCGATCAGCCGCTCGGCCA
+AGACCTTCGACTCACGCGAGGCCACCATCCACCCGACCACGTAGCGGGAGAAGATGTCGAGGATCACATA
+CAGGTAGTAATAGCTCCACTTTGCTGGGCCACGCAGCTTGGTGATATCCCACGACCACACCGAATTCGGC
+TGATGAGCAACCAACTCTGGCTTCACCGCAGCCGGGTGGGTGGCCTGGCGGCGGCGATCACCGGTCTGGC
+CGCGCTCACGCAGCAGCCGATACATCGTGGACTCGCTGCACAGGTAGATGCCCTCGTCGAGCAGCGTGGC
+ATATACCACCGCCGGCGCCATGTCAGCGAAGCGCTGCGAGTTCAGCACCGCCAGTACGTGCTCACGTTCG
+GCCGCACTCAGCGCCCGCGGCTGCGCGCTCTCCCGCGGTCCCGACGGGTCGGTCACCGCCGTGCTGGTGA
+ACGTATCCGATTGTGCCGACAACCGTTTCGAGTGGGCCCGGTAGTAGGAGGCCGGCGCACGACCGGTCGC
+CGCACACGCGGCCCGAACCCCGATCAACGGGATCATCTCCTCGATGGCCGTGTCGATCACGCTCAGCGCT
+CACTCTCGCACATCGCCGCGCTGTCGGCTCAGAGCCTCTCCAAGAGCGCGGACAGTTCCCCCTGCACACG
+GATCACCTCGCGTGCGGTGTCGAGCTCGGCGCGCAGCCACGCGATCTCGGCGTCAGCGGCATTGGCGCCG
+GCCTTGCCCGGCTTGGGGCCCCGCCGCGCCGACAGCGCCGCCAACGCCCCCCGATCACGCTGATGGCGCT
+ATTCGGTCAGCAACGACGAATACAGGTTCTCCCGCCGCAAGATCGCACCCCTTTCCGTGCGATCGGCGCG
+GTCATACTCATCAAGGATCGCCAGCTTGTACTTCACGGTGAACGTACGCCGCTGCGCCCGCTCAGGCACC
+TGAGGATCAGGCACCTCGTCCACGGTGACCGACGAACCCCGTCGGCCAGTACCAGCCCTATTAGTCAACC
+TCGTTCTCTTCGTACTCGCCCTCAGGCTCAGTAAACATCTCCACTCGCAGTGTCTCACTCAAGGTTGACA
+GAGAGGGTCGGCGACGCGGTCCCACTGAGCGCCGACCTCCTCAGGGTCGGTGTGGGCGAAAATCGTCTTG
+ACCGCCACGGTCACCGCCGGGGCGTGTTTGGCCGCTACCGCGGTGTACAGGTTTCGCATGAAATGCACCC
+GGCAACGCTGCCACGACGCCCCACTGAACTGTTGTGCCACAGCGGCTTTCAGCCCAGCATGGGCATCGGA
+GATCACCAGATGCACCCCGGTCAGCCCACGCGCTTTCAGTGAGGCCAAAAACTCACGCCAGAACTCGTAA
+GACTCGCTGTCACCCACAGCGGTGCCCAACACTTCGCGGGTGCCGTCGATGGACACCCCGGTGGCCACCA
+CCAGAGCCTGAGACACCACGTGCGCCCCGACACGCACCTTGCAGAAGGTCGCATCGCAGAACACATACGG
+GAACTCGGTGTGGGTCAAGCTGCGGGTCCGAAACGCCTCGATCTCGGTGTCCAGACCGGCGCAGATGCGT
+GAGACCTCGGATTTAGACACCCCGGCCTGCACGCCCATCGCGGCCACCAGATCATCGACACTGCGCGTCG
+ACACCCCGTGCACGTAGGCCTCCATGATCACCGCGTGCAACGCTTTATCGATGCGGCGGCGCCGCTCCAA
+AAGCGACGGGAAGAACGAACCGGCCCGCAGCTTGGGGATCTGCACCTCGATATCGCCGGCCGTGGTCGAC
+ACTGTCTTGGGCCGGTGCCCATTGCGGTGCACGATGCGCCCATCGGAGCGCTCGTAGCGGCCTGCACCGA
+TCGCCTCGGTGGCTTCGGCCTCGATCAACGCCTGCAACCCGGCACGGATCAGCTCGGCAAACACCGCCGA
+GGCATCAGCAGCTTCACTCGCGTTACGGACCGCTCAGTTGCTTCCCCCAACGGGGCTTTCGACGCTGGGC
+TTCGACCCTGCCCGTTTCCAAACCAAGCGGCCAGCCTGCTACCGGGCCTCCTGACAGCTACCCGGACCGG
+ACTCCCACCGGCAGGCGACGACGAGCTTTGATCAGGTCATGACCTAAGACATCACCTCCTGATCACTGGG
+CGCACCGGCTGCAGTACTAGTGCGCGAAATGCTGTGCGTCGAAGTGGCCACCCGGCTTGACCTTGTCCAG
+GGCAGCCAACGCGGTGACCGCGTCGTCGTGCAGGGCCCGCGCCAGGTCGGCGGAGAGTCCTTCCCGAACC
+ACGATCCGCAGCACCGCCACGTCGGTGGCGTTGTCCGGCATGGTGTAGGCGGGCACCTGCCACCCGAAGG
+TCCGCAGCTCATGGGAGACGTCGAACTCCGTGTACCCGCGGTCGCCGGCGAGCCGGAAGCTGACCACCGG
+GATCGCCGAACCATCCGAGATCACCTCGCAATGATCCACCTCGCGCAGCTGGTCACCCAGCCACCGGGCG
+GTGTGCGACAGCGCCTGCATCACCTTGGTATAGCCGTCGCGCCCCAGCCGCAGGAAGTTGTAGTACTGGC
+CCACCACCTGGTTACCGGGACGGGAGAAGTTCAGGGTGAAGGTCGGCATGTCGCCGCCGAGGTAGTTGAC
+CCGGAAAACCAGATCCTCCGGCAGGTGCTCGGGCCCGCGCCACACGACAAACCCGACGCCGGGATAGGTC
+AGCCCATACTTGTGGCCGCTGACGTTGATCGACACCACGCGGGGCAGCCGAAAATCCCATACCAGGTCCG
+GATGCAAAAACGGCACCACAAAGCCCCCACTGGCCGCGTCGACGTGTACCGGGACGTCCACACCCCCGCC
+AGCCGCCAGTTTGTCCAGCGCGGCGCAGATCTCGGCGATGGGTTCGAGTTCACCGGTATAGGTGGTGCCC
+AAGATCGCCACCACGCCGATGGTGTTCTCGTCGACGGCGGCGAGCACCTGCTCGGGGGTGATGACGTAGC
+GGCCCCGCTCCATCGGCAGGTAACGGGGTTCGACGTCGAAGTAGCGGCAGAACTTCTCCCACACCACCTG
+GACGTTCGAACCCATCACCAGATTGGGCATGCGCCCCTTCCAAGACCCCACCCGTTGCCGCCAACGCCAT
+TTCAGGGCCAGCCCACCCAGCATCACCGCCTCGCTGGAGCCGATGGTGGACACCCCGGTGGCGCTGGTGG
+GGTCGTGGTCGCGCAGACCCTCGGCGTGAAACAGGTCGGCGACCATGGACACACAGCGCGCCTCGATGGC
+CGCGGTCGCCGGGTATTCGTCCTTATCGATCATGTTCTTGTCGAACGTCTCGGCCATCAGCTTTTCGGCC
+TCCGGGTCCATCCAGGTGGTCACGAAGGTGGCCAGATTCAGCCGCGAGCTACCGTCGAGCATCAGCTCGT
+CGTGGATGAAGCGATAGGCCGCCTCGGGATCCATCGACTCATCGGGCATCCGCAGCGCCGGCACCGGTGC
+GGTGAACATCCGACCGGTGTAGGCCGGAGCGATCGAATGCGCGGGCACGGACGGGTGACTGCGAGACACG
+GCGGATCCTTTCCGGGCTTGTTGCGGACTGGCAGGACTACAGGGCAGCCAGAGCGGCCCGAATGTGGCCG
+CTGATGCGCGACGCCGACGTGGGCGCATCGCCGGGGCCGGGATCGGCGGCCGCGGCCGCCGCCGCCCGGG
+CGTGCACGAACGCCGCGGCCGCGGCCGCCTCCCCAGACGGCAATCCCGACGCCAGCAGCGCACCGATCAT
+CCCGGACAGCACGTCACCGGACCCGGCGGTGGCCGCCCAGGACTGGCCGGCCGGATTGAGATAGACCGGG
+CCGCCGGGATCGGCGATGACGGTGACATTGCCCTTGAGCAGCACGGTGGCGCCCAGCGCGTCGGCCAGCT
+GGCGGCAGGCCCCCACGCGGTCGTCACCGGGCGGCGCCCCGGCCAGCCGGGCGAACTCACCGGCGTGCGG
+CGTCAAGACCGTCGGGGCGTTGCGGCCCGCCACCAGATCGGGGTGGTCCGCCAGCATGGTCAGCCCGTCG
+GCGTCGACCAACACCGGCAGGTCGGTGTCCAGCGCGAACCACAACGCGGCGGCCCCGGCTTCGTCGGTGC
+CCAGGCCCGGCCCGACGACCCAGGCCTGCACCCGCCCGGCCGCCGCCGGGGTGGGCGAGGCGATGACCTC
+CGGCCAGTGCGCGAGGACTTCCGCATGGGCGGTCCCGGCGTAGCGGACCATGCCGGAGGTGGCGGCGACG
+GCCGCCCCGGTGCACAGCACGGCCGCACCCGGATACGTCGACGACCCGGCCAGCACGCCGGTCACGCCCT
+GGGTGTATTTGTCGTCGCGGGGACCGGGCACCGGCCAGCGCGCGGCCACGTCGGTAGCCTCGAAACCCAA
+CACGTCGGTGTGCGCCAGGTCCAGCCCGATATCGACAAGGACGACGCGGCCGCAGTCGGCCAGCGCGTGC
+ACCGGTTTGAGCCCGCCAAAGGTGACGGTCAGCGCGGCGTGCACGGCGGGGCCGGTGATCGCCCCGGTCG
+CCACATCGATGCCGCTGGGGATGTCGACGGCGACCACCGGTATGGCGGCGGCCTGAACCGCGGCGAACAC
+CTGCGCGGCCGCCGGTCGCAGCGGCCCCGAGCCGGAGATGCCGACCACCCCGTCGATGACGAGATCGGTC
+GCCGCCGAGACACTCTCGACGAGGCGACCCCCGGATTTGGTGAACGCCGCCAGCGCCTTGCGATGCGTGC
+GGTCCGGGTTGAGCAGCACCGCGTCGGCGGCGGCGCCGCGGCGTCGCAGGAACGTCGCCGCCCACAGCGC
+GTCGCCACCGTTGTCGCCGGATCCGACGACCGCGCACACCCGGCGGCCGACCACCCCACCCGTGCGAGCG
+GTCAACTCACGGCCGATCTCGGTGGCCAGCCCGAAGGCCGCGCGTCGCATCAGCGCACCGTCGGGCAGGC
+TGGCCAACAGGGGCGCCTCAGCCGCGCGGATGGTGTCGACAGAGTAGTAGTGGCGCATCTCAGGCCCGCC
+GTCCTCGGGTGCCGCGCCTGTGCAGCAGACTTTTGATTCTGGCCGGATTCCACAGCCGACCGTCGCGTTC
+CCGGGCCATCGGATAGAACAGCAGACCAATCAGGATGGACGCGAAGTGACCGACCGTGGTGAAGTCCAGC
+TCGGCTTTGTCCATCGCGATCAGCGGAAAACCAAAGATGACCAGCAGCACCCCGAGATAGCCCCAGCGCC
+ACGGTTTGGCGATGTGATAGGTCAATACCGCCATCACACCGACCAGGAAGTAGCTGACCCCGATATCACG
+AGCGTGCACCATCCTTTCGGAGGCGTCTCGGTGCTGGATCGCCAGATAGAGCAGGCCTTCGCTCAAATAG
+GTGGCACCGATGTGAGCGGTCAATCCCACGGTGAGCCAACGCAAGTGGCCGAGCCAATGCTCGGCGGGCG
+CTAGGAACAGGGTGAACAGCAGCAGGTACGGTTCCAAATTCCGGCCGTCGATCCACAACAGGCTGGAAAA
+CAGCACCTCGAGCGGATCGCGCCCCAACTCGGCGATGTTGGTGGACCGGTGCAGGAGCACGAAATGCAGC
+TGGCTCCCGGTGAGATTGTTCTGGATGATCGTGGTGATCACCAACACGACCAGCCAGGCATAGGTCAACG
+GGGCGTTGCTGACGAAGTGCCACACCGCGAGCGCCCACGATCGCAGCCGTGCCACCACCGATGCGTCCGC
+CACGGGTCAACACTTACATGGTTTCGTCGACGTCAGGCTTCAGGTGCCACCACCAGCAGAGGATATACAG
+CACCATCGAGGTCACCAATGCGACGACCACCCAGAGTACGACCGTGACGTCGATCCAAAATCCGATTGGG
+GGCGCGTCGGGAAGCGCATTGCGCAGCGGTATCACCGCAAAAAGCATTGCCGCATACCACGTTGTCATCG
+GCGGCTGGAATTGCCGCCGGCCACGTGCGGTTTGAACCGCAACGAACAGGCCCACCCCGGCCAGCGCGAT
+CAACACACCGACGATGACGGTGCCGAATGCCACGCTGCTCGGCGATCGGTGCAACCCCACTCGGTACGGG
+GCAGGCACATTGGCGTCGCCGACACCGGAAATGTCGACGTTCCAGCCCGGAAGCCGGTCGACGAATGTCA
+CCGACACACGTTCCGGCGCGTGCGCGGCTCCGCGGTAGAGCTGGACCGTGATCGGCCCCGAACGGTAGTG
+GTCGAACGGCCAATTCGCGGGATCCCCGGAGATGGTCAGCGGGACGGGAAAGACGCCGGGCAGCGAACCA
+CTCGACCAGGTGCGCTTGGTAGGCGTTACCACGGATGTGACCGTGACGGTGAGGTCGTCCTTGAGGCCCT
+GGGTTTGCGAATCCAGCAGCTCAGTCCCAGGTGACACGGCGAGGTTGGCAACCAGCACGCCCTTGATCGT
+CTGAAGCTGCTCGACGTGCAGGGTCACCGTGGTCCCGTCGGCCGTCGGCCGACCGTGGGCGACTTCATGA
+GGTCGGCCGAGGCCGGTGCTGTGATACAACGCGATCACGGTGACGTAGGCCGCAATCACGAGCACCAAAC
+CGACAACGACTCTCAGGATGCGTCCCAACTCGCTACCCGCCCACTTGTGCGTTCCGGCCCGGAAATTGTA
+ACCGCGGGACCCCTCCGTCAGCGGATGCCACCGCCAGGCCACGTGATTGTGCGACAGCCGCCATCTTCCT
+GTGGTAGGTGATCATCGCCGTCAACTCCGCACCCAACGTCTCCGCGGTCGCCACGTGGATCGCGTCGAGT
+GTCTTGGGCCGCCAGGTCCCGTACCGTGAGCCACCTCGACTATTCGACGGTGACGGACTTGGCCAGATTC
+CGCGGCTTGTCGACATCGTAGCCGCGGGCGCGCGCCACCGAAGCCGCGAACACCTGAAGCGGAATGGTTG
+ATAGCAGCGGCTGCAATAGCGTTGACACCGCTGGGATTTCGATCAGGTGATCGGCGTAGGGGCGCACCGT
+TTCGTCGCCCTCCTCGGCGATCACGATGGTCACCGCACCGCGGGTCTGGATTTCACGGATGTTGGACAGC
+AGCTTGGCGTGCAGCGTGGCCGACCCCTTGGGTGAGGGCATGACGACGATGACCGGTAGGCCGTCTTCGA
+TCAGCGCGATCGGGCCGTGCTTGAGCTCGCCGGCCGCGAAACCCTCGGCGTGCATGTAGGCCAACTCCTT
+GAGTTTGAGTGCACCCTCCAGCGCCACCGGATAGCCGACATGGCGACCCAGGAACAGCACGGTCGACGAC
+TGGGCGAACCGGTGGGCCAGCTCGGCCACCGGTCCGGTCGCCGCGATCACCCGGGCCACCAGGTCCGGCA
+TCGCTTCCAGTTCGTGGTACTCGCGCTCGACCTCGTCGGGGTATTTGGTGCCGCGGGCCTGCGCCAAGGC
+AAGGCCGAGCAGATAGTTGGCAGCAATCTGCGCCAGAAACGTTTTTGTGGACGCCACACCGATCTCCGGG
+CCGGCGCGGGTGTAGAGCACCGCGTCGCACTCGCGCGGGATCTGCGAGCCGTTGGTGTTGCAGATCGCCA
+GCACCTTGGCTTTCTGCTCCTTGGCGTGTCGGACCGCTTCCAGCGTGTCGGCGGTTTCCCCGGACTGCGA
+GATCGCCACCACCAAGGTGCTACGGTCCAACACCGGATCCCGATACCGAAACTCGCTGGCGAGTTCCACT
+TCCACGGGCAGCCGCGTCCAGTGCTCGATCGCGTACTTGGCCAGCAGCCCGGAGTGATATGCGGTACCGC
+AGGCCACCACGAACACCTTGTCGATCTCGCGCAGTTCCTGGTCGCTCAACCGCTGCTCGTCGAGCACGAT
+CCGGCCACCCACGAAGTGTCCGAGCAAGGTGTCGGCCACCGCGGCGGGCTGCTCGGCGATCTCCTTGAGC
+ATGAAGTACTCGTAGCCGCCCTTTTCGGCGGCAGCCAGATCCCAGTCGATGTGGAAGGGGCGGAAATCGC
+GCCCAGCTTGTAGGCCATCGTTGCCGTCGAAATCGCTGATCCGGTAGCCGTCGGCGGTGATCACCACCGC
+CTGGTCCTGGCCGAGCTCGACCGCTTCCCGGGTGTGCTCGATAAACGCGGCCACGTCGGAACCGACGAAC
+ATCTCGTTGTCGCCGATGCCCAGCACCAGGGGCGTGGAACGGCGGGCCGCCACGAGGGTGCCGGGGTCGT
+CGGCATTGGCGAACACGAGCGTGAAATGCCCCTCAAGCCGGCGCAGCACGGCAAGTACGGAGCCGACGAA
+GTCATCGGCCGTCTCGCCGTGCCGATACGCCCGCGCCACCAGGTGCGCCGCGACCTCGGTATCGGTGTCG
+CTGGCAAACTCGACACCGGCAGTCTCCAGCTCCCGGCGCAAGACGGCGAAGTTCTCGATGATGCCGTTGT
+GGACGACGGCGATCTTGCCGGCAGCGTCGCGGTGCGGGTGCGCGTTGCGGTCGGTGGGACGACCGTGGGT
+GGCCCAGCGGGTGTGGCCCAGGCCGGTAGTACCGGACAGCGCCGTGGACGGCATTTCCGCCACGGCTTCC
+TCGAGGTTGGCCAGCCGGCCCGCACGCCGGCGCACGGTGAGTGTGCCACCGTCGACCAGCGCGATGCCCG
+ACGAGTCGTAGCCGCGGTACTCCATCCGGCGCAGCGCGTCCATGACGACGACGTAGGCGGGGCGCCGCCC
+GACGTAACCGACAATTCCGCACACAGCAGACCAGGGTAGTGCAGCATGGTCGGTAGGGCAGTCCCGTCGC
+CCAACCGACGCTATCGTCGAGTTTGGCCACCGCGCACGAAAGGCCAACACTTGTCCAACCCATATGCCCA
+GCACCAGCTGAAGCTCATCAGGCACACGGGTGCGCTGATCCTGTGGCAGCAACGCACCTACGTGGTCTCC
+GGGACGCGCGAGCAATGCGAAGCGGCGTACAAGTCGGCGCAGACCTACAACCTGCTCGTTGGTTGGTGGA
+GTTTGGTGTCGCTCCCCGCGATGAACTGGATCGCGCTGATTTCCAACTTCAATGCGATTCGGCGGGTGCG
+AGCCGCCGCCGACGGGGCGTCCGTTCCCCACGGCCCGCACGCCATCGCCCATCCAGCCGTTCCCCGGGGA
+CCCATACCGGCGGGCTGGTATCCAGACCCGTCCGGGGCGGGACTGCGTTACTGGGACGGTGCGACGTGGA
+CCCACTGGACCCATCCGCCACGTCACCGCTAACGTCGACGGGTGCCCCGGATCCGCAAGCTCGTCGCCGC
+CCTGCACCGCCGGGGACCACACCGTGTTTTGCGCGGTGACCTGGCTTTTGCCGGCCTACCCGGGGTGGTG
+TACACCCCCGAGGCGGGGCTGCACCTTCCCGGTGTCGCCTTCGGCCACGACTGGCTCACCGGCACCTCTC
+GCTATTCGGGTCTATTGGAGCATTTGGCGTCATGGGGCATCGTGGCCGCCGCCCCCGACAGCGAGCGCGG
+ACTGGCCCCATCGGTCCTGAATCTGGCCTTCGATCTGGGCGTTGCCCTCGACATCGTGGCCGGTGTCCGC
+CTTGGGCCTGGAAAAATCAGCGTGCACCCCGCCAAGCTCGGGCTGGTGGGCCATGGTTTCGGTGGCTCGG
+CCGCCGTGTTCGCCGCCGCCGGCTTGACCGGCACGCACGTCAAGTCCGTGGCGGCGATATTCCCGACGGT
+GACCAATCCGGCCGCGGAGCAGCCAGCCGCGACCCTAGACGTTCCGGGACTGATTCTGACCGCACCTGGC
+GATCCGAAGACGCTGACCTCCAACGCCCTCGGGCTATCCCGGGCTTGGGATAAGGCCACCCTACGCATCG
+TCAGCAAAGCCCGAGCCGGTGGTCTGGTTGAGGGCAGACGACTGACGAAGGTGTTGGGGCTCCCAGGCCC
+ACACCGCCGGACGCAGCGTTCGGTCCGGGCGCTGCTGACCGGGTACCTGTTGTACACGCTCGGCGGCGAC
+AAGACTTATCGCAGGTTCGCCGATCCAGACCTGCAGCTGCCCAAGACGGACCCGATCGACCCTGAAGCGC
+CGCCGATCACCCCGGGGGAGAAGATCGTGACGCTGTTGAAGTAGCGCGGGATACCCCGACCCGTCACGGC
+CCCGCCTGCGGAAGCTCGTCGGCGGCGATCTCACAGGGGGTGGCTCCCTCGGACAGCGCTTCCGGCGAAG
+GCCCATTCGCCGGTTCCGGCGCACCCGGCGGCGCCGGCGCAGCGACCGGAGGCGGTGGTTCGGCGACCGG
+AGGCGCGGCAGGCGGCGGCGGTTCGGCGACCGGCGGCAGCGTGGCCTCCTCGGCGACATCCTGGGCACGT
+TCAGCGGGCACCGATTCGTCGGCGTCGTCGACCTCGTCTGCTTCGTCGGGCTCTGTTGCTTCCTTCGGCT
+CCGCTGCCTCGTCGGCCTCTTCCGGGTGGGCATCGTCGCCGTCATCAGCGTTGTCGGCCGCGTCTTCAGC
+GAACGGATCGACGGCACCCGGCGGATTGTCAGCTGCCAACGGATCCCCCAGCTGTTCGGCCACCGAACCC
+AGCAGGCTATCCACCGCATCGACGATCCGGTTGGCAAGCCCGGCAAGCCCGGCAAACCCGCCCAGACCGC
+CGGTGCCGCCGGCATCGCCGAAACCACCGGCGCTGCCAACACCCGCCGGCGTCGCGGAACCATCACCTGG
+CGCCGATCCAAAATCCGACGGCGTCACTGGCCGCGAGGTCACGGCCGGCACCGGATCCGGCGGGGGAAGA
+GCGGCCGCGGGCGTAATCGCTGCCGTCGCGCTCGGTTGAGCCGGCACCGATGCCGGAGAAGGTTGGCGAC
+CGGGCCCGAGATCGTCCGGAATCTCGAAGTGCGCGCGCGGCGCGCTGGCCAGCTGATCGGTGACCGCATC
+ATACGACGCCGCCACACCGGCCGTTGTCGATCGCATCGTGGTCAGCCAGTCGTTGCGAACATCGTCGTCC
+ACGTAGGGCTGTATCTGTTGGCGAACCACTTCGACGGCCGTCGGCCGATCTGCCCCCTCCGTCGTGAGCG
+CTTCGGCCGCAGCCAACCATGCCGGCCGCTGCGCCAGGGCACGCTCGTCGATCGCAATGGCCGTCGCGAC
+TTTGGAGTCCACCAGCTGCCAGAGGTTGTCGCGCAGCGATTCGCAGCGTTGGGCCGCGGCACGGACTTCG
+GTGACCACCGAATTTCCAGTCTCACAGTGACGCTGCACAAAGTGCACCGCCGCGTCGGCCCCCGATCCCG
+TCCATGCCGCTGCCAAGACGGCGACCTGGCTACGCTCCATCCGCAGCGCCTCCATGAGCACACTGGCGGC
+AGCCCGCAGCTGCGCGCAGTCAGCGTCGAGCGCGTGCAGGTCAAGTCCGTCTTCGCTGCCGTACCAGTCG
+TGGATCTGGGCAGGGTAGGCGGTCAGGTCGGGATGTTGGTAGCCCACCAGGTGGCAAGCCCGCACGTAGC
+TTTGCGTGTGCTCGGCTGCGGGCCTGCCCTCGGCGAGACGCTCAGCGACGTTCAACCGGTCAGCCACCCT
+CACCCGATCCGCGCCGCCGCGCACAGGTCGGCCTCGGCGTAGCGGTTGGCGCCCGCCCGCAACGCAAACG
+CGATCTGCACAGCCGCCCGGGACCACACTGACAACTCGCCGGCCAACCGGTCTAGCCTGCAGCGCAACGC
+ATCGCCACGCGAGGCGTGCCCCCGGCCCGCGCAGGCTCCGCCAAAAGCCAGCCTCGTCAGGTGATTGCCG
+ATGGCGTCATCGATGAGTTCGGCGGCGGCGCTGAACCGGTCGGCAACCGCGTATACCGCTGCTATGTCTA
+TGCCGGCGCTGTTTACGCTATCGGGTCTCATGCCTATTCGGACGCCCCGCGCCGCGTCGGGGTTCCAGCA
+TTTCCGGTTCAGCGCGCGGTGCTCACCGCGTCGGCGACCGTGGCCGCCAGCCGCTGGGCGACGCCCTCGT
+CGGCTGCCTCCACCATCACCCGAATCATCGGCTCAGTTCCGGACGGGCGCAAGAGGATTCGACCCGTGTC
+ACCCAGCTCGGCCGCGGCCTGCTCGACCGCCGTTCGGACCGAGGGCGCCGCGGCGGCGGTGGCCTTGTCG
+ACAACCTCGACGTTGATCAGCACCTGCGGCAACGTCCGCATCGCCGACGCCAGGTCGGACAACGACGAGC
+CGGTCTGCACCATGCGGGTCATCAACCGCAGCCCGGTGACGATGCCGTCACCGGTGGAGCCCAGCGCCGG
+CATGACGATGTGGCCGGATTGTTCGCCTCCGAGGCTGTAGTCACCGGCCCGCAGCTCTTCGAGGACGTAG
+CGGTCACCGACGGCGGTTGTACGCACGGTGACGCCGGCCGAGCGCATGGCTAGGTGCAGCCCGAGGTTAC
+TCATCACGGTGGCCACCAATGTGTTGCAGGCCAACTCACCGGCCTCTTTCATTGCCAGCGCCAGCACCAC
+CATGATGGCGTCACCGTCGACGAGGTCACCGTTGGCGTCGACGGCCAGGCACCGATCGGCGTCTCCATCA
+TGGGCCAGGCCCAGGTCGGCCCGATGGGCGAGCACCGCTGCCCGCAGCGGGTCAAGGTGAGTCGATCCAC
+AGCCGTCGTTGATGTTGCGTCCGTTGGGTTCGGCGTTGATCGCGATAACCCGGGCACCGGCCGCTCGGTA
+GGCGCGCGGAGCCGCCGACGACGCGGCCCCATGAGCGCAGTCGACCACCACGGCCAGGTCATCGAGCCGG
+GCGGTGGCGGCCTTGGCCACGTGGCGCAGGTAGCGTTCGGTCGCATCCTCGGCGTCGATAACGCGGCCAA
+TCCCCGCGCCGGCCGGCCGCAACCCGGGTCCGCGGGAGACGCCGAGGACCAGATCCTCGATCTGATCCTC
+GGTGTCGTCATCTAATTTGTGGCCGCCGGGCCCGAAGATTTTGATGCCGTTATCGGGCATCGGGTTATGC
+GACGCCGAGATCATCACCCCGAAGTCGGCGTCGTAGGCGCCGGTCAGATAGGCCACCGCGGGGGTCGGCA
+ACACCCCGACCCGCAGCGCGTCGACGCCCTCACTGGTCAGGCCGGCGATCACGGCGGCCTCCAGCATCTC
+GCCGCTGGCCCGCGGATCGCGGCCAAGCACCGCGACTCGCCGACCCGGTGCGCCCGACCTCGACAATCGT
+CGCGCCGCCGCGGCGCCCAGTGCCAGGGCCAGTTCCGCGGTCAACTCGCGATTGGCGACACCGCGCACAC
+CATCGGTGCCAAACAGTCGACCCATACGGACAACCTTTCACAGTTGACGGCTGCGCACATATCCACTCTT
+GGCAGCGAATATGCCTGTTGGTTCACCGACACGCCGACGAGCGCACACAAACATGCACGCTTGTCGCCCG
+AAAGTGATGTCAGCGCTTGCTGTACTGGGGCGCCTTGCGGGCCTTCTTCAGGCCGTACTTCTTGCGCTCG
+GTGGCGCGTGGATCACGGGTCAAGAAGCCGGCCTTCTTCAGCGCGGGCCGGTCCTCCGGCGATACCAGAA
+TCAATGCCCGGGCGATACCCAGGCGCAGCGCGCCGGCCTGACCCGACGGGCCGCCGCCGCCCAGGTGGGC
+AAAGATGTCGAAACTTTCCACCCGATCCACGGTGACCAGGGGTGCCTTGATCAACTGCTGGTGCACCTTG
+TTTGGGAAGTAGTCCTCCAAGCTGCGGCCGTTGAGGTCGAACTTGCCGGTGCCGGGCACCAGCCGCACTC
+GTACCACGGCCTCCTTACGGCGCCCAACGGTCTGGATGGGCCGCTCCAACACGAACGATTGTGCGGGCCC
+GGCCGGGGCCGCCGGGGTTTGCGGGGCTGGGGTGGTTTCGGTCATTGCGCCACCTGCTTGAGCTCGTACG
+GAACCGGCTGCTGAGCGCTGTGCGGATGCTCCGGGCCGGCGTAGACGCGAAGCTTGCGCTGGATCTGGCG
+GCTGAGCCTGTTCTTGGGCAACATGCCGAGGATCGCCTTTTCCACCACGCGGTCGGGGTGGCGTTGCATT
+AGCTCACCGATGGTGCGCTTGTGCAGGCCGCCGGGATACCCCGAGTGCCGGTAAACCATCTTGTGCTGCA
+GTTTGTCGCCGCTGATGGCGACCTTGTCGGCGTTGATCACGATGACGAAGTCACCGCCATCGACATTGGG
+GGCGAACGTCGGCTTGTGCTTGCCGCGCAGCAGGTTGGCCGCCGCGACGGCAAGGCGGCCAAGCACCACG
+TCCGTGGCGTCGATGACGTACCACGATCGCGTGGTGTCACCCGCCTTGGGCGCGTACGTGGGCACAGCGC
+TTACCTTCTTTTCTCTCGGGTGGATCCCGGGGTGCCCCGGGCGCCGGTCAGGCGTGAACGGCGGGTTGGT
+CTCGGCGACCGACATTGACCCGAGGTCCCGGCGTACCGCACGCCAACCGAGCAGCTTACCGACGAGCATC
+CACGCAGGTCAAAATGACTGTGTGGTCCCGACGGCTCTCCCCCGTCGGGACCACACAGGGGTCTGTTGCG
+CGCTCCGGGGCCCGGAACTAGCGTGCCCAAGCTCCAGCCGCCCGCCGGTCGGCATGCGCCACGTCGTCGG
+CACCGTGGCGAACCGCGTTTCCCAAGTCGATCAGGATCTCGTTGAGCGCGCTGGCCGCCTGGTGCCACTT
+GAGTTGCTCCGCGTGGTAGGCGGCGGCCGCTTCCCGTGTCCAGAGCTGCTGCAACGGCGCGATCTGCGAC
+CTCAGCTCTTGCAGCGCAGCGTTGAAACGGGCCGCGGTGGTGTGGATCTCCTGACGAACGGAGTATTCGA
+TGGCGTCAAAGTTGTACGACAACACGGGGTCTGCGTTCATAGTCGAGGCTGATCCTCGGTCTATAGGTCG
+CCGCCGGCGGCGGCGATGTGGCGGGCATGGATTTGGCCGGCTTCCCGCAGCGCGGCCTCGTTGTGGCGGA
+TGGTGTCGGCGATCGCGTGCAGGACGTGGTAGAGCCGCGTCGACTCGGCGTTCCAGCGATCCACCACATC
+CTGGAACCGAGCGGCCGCGAGCCCACCCCACACCGACGGCGGCACACCGCTCATGCGGCCGATGAATGCC
+TGCAGCATCGCACGGATTTCCTCATTGCGGGCGTCCGTGATACCCGCAACCGAACGCATCAGGTCAAAGT
+CGGCGTTCAGCGTGTTCGGTGTGCTCACATCAAGTAGGACCGCCGCCAACCTCGTCTGGTTCCCTCCGAT
+CCTTCCCGGTTCAACCAACGGCGTGGACGGACCGTACGGCTTGCGCACACACCTCCCTGAGGAGGTCTTC
+ATGGCCGGGCCCGCTCTGGCAGCCGACGCTGATCCGGACCGCTCCGTCGAGCAGAATCGTCCACCGCACC
+TGATGCCCGGCGCGGACCTCTCGATAGGTCACCGCGGGCCGGCCGGCTCTGATATCGGAGGGGTTGAAGT
+CGACGAATACCCCGGCCGGTGACGCGTCGATCGCCCGCTTCAACCGCTGCGCGGTGCCAGGCAGCGTCTC
+ACCGGGAACCGGTGATTGTGTGACGTGCAACGCCACCTCGGGATCGGCCGGTGAAGTGACCTGTACCCGC
+GCCGAACCGGGACCGGAGACCACCCGCTGCGTGGACCAGTCCGCCGGAATCGTCAGCGCCACCCGGCCCT
+CTACCAGAAGCGTCGTCGGTGGTCTTTGCAGGGTTGTCGCACCGTGGCGGACCACGGCAGCCGGCGCCAG
+TAACGCCAAGGCGACACCGGCGGCCGCAACCCGGGCAAGTGTCGGGACCCGAGAGCGGGTGGCAGGCCGC
+GCCGCCGGATCGGCGGGCTCGTCGGAAGGCGGCAGGGCGGCCCTGGCCAACCGCGCCAGCCGCACGCCGT
+CGATCTCGACCACGCTGCTACCGGTACCCCGCACCGCACCGGCGATTGCCGCCGCGAGCGCTGCCGCCCC
+GGCGACCGTACTGGGCACGTCGATCAGCACCACCGCGGTAATACCCCGCGTCATCCGCGCAATGACACTG
+CCTACCTGGCCGGCAACGGACTCGGCGTCCGTGCGGCGGGCCACCGCGGCGACCTCGGCGCCGGCCACCA
+ACACCAGTCGCTCCGCGATCTCCACCACCACCGTTGCGGCCGAAACCCCCGAGGACGCCTGCCTCAGCAG
+CCACGACCGCGGGTGCACGACGACATCGCGGGTCAGCGTGCGTGCGGCTGCGGTGACCACCTCGACCCGA
+GCCGCCGACCACCACGACGGGTGCACGACGACCGGGCCGTCACGGTGGTCGACGGCCACCGATCGCAGGG
+CGTCGAACCACAGCGAATCCACGGCGACTGGCCGTTCGTCCAGCAGCGCTACCTGGTCGTCGATCGCCGC
+CAGCGCGGCGGCAGACACTGCGGTGTCCGCGACTACGTCTGCGCCACAACACAATCGGCGGATGGCACCC
+GGACCCGCCTCGATCACCGCGCGATGTGGGCTCACGGGGGTGGGCTCCAGGCGACTTGAACCAGTTGCTC
+GTCACCGGCACCGGTGACCAGGATGCCCCGGCCCGGTGGCAGCGGCATCGGGCGGCTCGACCCGAACAGT
+GCGCCTTCATCCGGACGTCCGCTCATCAGCAGTGCCCGGCAGCCCAGGTCACGCAGGCTGGCAAGCACCG
+GCTCGAACAGCGCCCGAGCAGCACCCCCGCTGCGCCGCGCCACCACCAGGTGTAAACTGAGATCTCTTGC
+GTGCGGCAAATATTCGAGCAAGACCATCAGCGGGTTGCCCGATGAGACCGCAACCAGGTCGTAGTCGTCG
+ACCACGACATAGATATCCGGACCCGACCACCAGGACCTGGCTCGCAGCTGCGCCTGGCTCACATCCGGGG
+CGGGCATCCGCGCCTGGAGCAGGTCGACCAGACTCGACAGCTTGGCACCCAGCGCCGCCGGCGAGCTGAC
+GTAGCCGCCCATATGTTCCGACTCGATGACGTCGAGCAGGGTGTGCCGGAAGTCGACGATGAGAAGTTGG
+GCTCGCGCGGCGGTATGGGTCCGGACGATCTCGCGGCACAGGGTCCGCAACGCGGCCGTCTTTCCGCACT
+CGTTGTCGCCCAGCACCAGCAGGTGCGGGTGGCGTCCGAAATCGACGGCCACCGGCTGGCCTCGACGTTC
+CTCGAGGCCGAGCAAGATGTGCGCACCGAGTTCGTCGCCGGCTCGGGCCACGACGCTGTCGTAGTCCACG
+CGCGCGGGCAGTAGCGGTATCGGGGGCGCCACCGGATCACCACTTCGGCGTCGTAGCGCAACTCCATCCA
+GGTCGGGCAGGGCGATCACCATGTGCATCCCGTCGCGGGAGAGGCCACGGCCCGGTCTGTCGACCGGCAC
+CCGTTGCGCCTGCCTACGGTCCAATTCGGAATCCGCGGGATCCGCCAGCCGTAACTCGATTCGACTGCCG
+ATCTGATCCCGCAGCGACGGCCTGATCTCCGCCCACCGTGCTGCCGATAGCGCCACATGTACGCCGAATG
+AAAGCCCTTGAGCTGCCAGGGCAACGATCGACTCCTCAAGGGCCGCGAACTCCTGGCGTAAGCTTGCCCA
+GCCGTCGATGACAAGAAATATGTCCGCAAAAGACTCAGCGGCCGACTTTGCTCGCAGCTGGCGGTACCGC
+GCCACCGAGTCGATGCCGTGGTCGCGGAAGAATGCCTCCCGAAATCGCACGGCCGACTCCAGTTCGGCGA
+GCATCCGCGATGCCAGCTGCGGCTGCGCCCTGCCGGCCACGGCACCCACATGCGGCAGTTCGTCCACCTG
+GGCCAGCGCCCCGCCGCCGAAGTCCAAACAATAGAACTGCACCCGGCCCGCATCGTGGGTAGCAGCCAAC
+GCCATGATCAGCGTCCGCAGCGCGGTTGACTTGCCCGTTTGCGGTGCACCTACGACCGCGACATTGCCTG
+CGGCCCCGGACAAGTCGATCGTCAGCGGCACCCGTGACTGCTCGAACGGCCGATCGACAATGCCGATGGG
+TACGGCCAGCTCGGCCTGCGCCGGCTCAGCGTCACGCAGTAGGGCGCCCAGCATCGGTGGCTCGTCCAGC
+GGCGGTAGCCAGACTTGATGCGCAGCCGGTCCATGACCGACCAGCCGGTCGAGCACCGCATGCAAGACGG
+TAGGCGTGGGCACCTCGGCTGTCCCGCCGACGGGACCGGCTGTGACCGGCGCCGCAGCGTGCGTGGTGAA
+CGGTCGCACCGACGGCGGGGCTACCGGGTGGACCGCTGAGGGACTCGCCCGTCGAAGCGGCCCGGAAACG
+AACGCGGTCTGAAATCGGATCAGCTCTCCGGTTCCCGTTTGCAGCAAGCCCGCACCGGGGGTGTTGGGCA
+GTTGATATGCGTCCTGCGTCCCGAGCACGTTGCGTGATTCACTGGCGGACCACGTTTTCAGGCACATTCG
+ATAGGACAGATGGGTTTCCAGTCCACGCAGTCGGCCCTCGTCGAGCCGCTGACTGGCCAGCAGCAAATGC
+ATGCCCAGCGACCGGCCCACCCGACCGATCGCGAGGAACACGTCGACGAATTCGGGATGTTGGCTCAGCA
+ATTCGGAAAACTCGTCGACGACGATGAACAGGATCGGCAGGCAGGGAAGTTGCGCACCCGTTTGGCGTGC
+CCGCTGATATGCCGTGACACTGACCAAGTGGCCTGCCATCCGCAGCAGCTGTTGCCGGCGGCTCATCTCG
+CCGGCCAATGCGTCTTGCATCCGTGCGACCAGCGGTGCTTCCTCGGCAAGGTTGGTGATGACCGCGGCTA
+CATGTGGGGCTCCCGCGAGGTCGAGAAATGTTGCACCACCCTTGAAGTCGACCAGAAGGAGGTTGAGGAC
+TTCGGGCGAATTGCGTGCCATCATCCCCAGCGCGATGGTACGCAGCAGCTCCGATTTGCCTGATCCGGTG
+GCGCCGACGCACAGCCCGTGTGGACCCATGCCCTGTTCCGCGGCTTCCTTGATGTCTAGCTGCACGGCGG
+TACCGTCGGGCGTGACTCCGATCGGGACACGGAGCCGATCATGTTGGTTTACGTTGCGCCACAACGTGCT
+CGGATCGAAAGCGGCCACATCGCCGATGCCGACCAGTTCCGCCCAACCCGAGCCACGGATGAACGTGCGA
+CCCGAGTGCCCGACCCGGTGAGCGGCCAGCCGACGGGCGCATACCAGCGCGTCTTGAGGCTCCAGCTGGT
+CCGGGCACGCTAGCGCTGTCACTTCGCCGGCACATCTGACCACCGGCGGTGCACCGTCTCGTCTGGCGCC
+CACCTCGATCGTGATCACGCCGGTGATCGCGCCGTTGCCACGTTCGGCCGTGTCGACGATCGCAACAACG
+TGGGCCAATACCGTTGCGGCTAGCGCATTTTGCATCTCTGCCAGGGTCGAGTACACCATCGGGGCTGGCC
+CCAAGGCATCACAGGCATTCGGATGTTGGTTGTGCGGCAGCCATTTCAGCCAATCCCAGTGCGCGCGGTT
+GCGGTCACTGACCACGCCGGCGATCAGCAACTCCTCCGGTGAGTGCCATACGGCCAGCTGGCAGATCATC
+GCCCGCAGCAGCCCGCGGACCTTGGTCGGGTCACCGTCGATGGCGATCGGACCGCCGACCCGCAAGGGGA
+TCGCGATGGGCGCATCCGCAATGGTCGCGTGTGCGGCAAGGAAACAGCGCAGCGCGGCGCGGGTGACCGG
+ATCCGCACGCTGCGCCGGCGGAAGCTGCCCGACCACCAAGCGGGTGGCCAGCGGTGCAGATCCAACTCCG
+ACACGGATGCGACAGAAGTCGGCAGCACCCGGTCGACGCTCCCACATTCGCGGACCACCGATCAATGTCC
+ACAAGGTGGCAGGATCGGGATGCGTCCAGTTCAGTGATACGTGTTGTGCTGCAGCCGTTTGGGTGACAGA
+TGTGCGCAAGACACTCAGGTACCCGAGGTAGTCGACACGGTCGTTGTGGATACCGGAGACATGCCGCCGG
+CCGCGTCCGGTTACCGCAGTCACCACCAACGAGACCAGCATCATCATTGGGAAGGCCAGAAACGTGGGGT
+GGCGCGTGGCCGGCGAGCCCGGCAAGAACACCGTCACCATGACACCCACGGTCGCCACCGACATGACGAC
+CGGGAGCAGGCGAATCAGCAGGCTGGACGGTTCCGACCGCCGCAACTCGGGCGGCGGGGCAACCAGGATG
+TCCGCAGTCGCGCACGCCGGCCCTGAATTCATGCTGGGCGACGGTATGCAGCGCGAGAATCCGCCGCAAG
+TCGCTTGTGGACAACCGAATACCGGGCGATCGAGAACCGGCTACCGTTCCGGTGATCCGAGAATAAAGGG
+GGAGAATGCCTACGTCTGATCCGGGACTGCGCCGGGTCACCGTACATGCCGGCGCCCAGGCCGTCGACCT
+GACCTTGCCCGCCGCGGTGCCCGTCGCGACTCTGATCCCGTCGATCGTCGACATCCTGGGTGACCGTGGC
+GCCAGCCCGGCGACGGCGGCGCGCTACCAGCTGTCTGCCCTGGGGGCGCCAGCTCTGCCAAACGCAACGA
+CATTGGCGCAATGCGGTATCCGCGACGGCGCCGTCCTGGTCTTGCATAAGTCCAGCGCCCAGCCGCCCAC
+CCCCCGCTGTGACGATGTGGCCGAAGCGGTGGCGGCGGCGCTTGACACCACAGCCCGGCCCCAATGCCAG
+CGCACGACCCGGCTCAGCGGTGCGCTGGCGGCAAGCTGCATCACCGCCGGCGGCGGCCTGATGCTGGTTC
+GAAACGCCCTCGGCACCAACGTAACCCGCTACTCCGACGCCACGGCCGGAGTTGTAGCGGCGGCCGGCTT
+GGCTGCCTTGCTGTTTGCGGTGATTGCATGCCGGACATATCGGGACCCGATCGCCGGCCTCACGTTGAGC
+GTTATCGCCACCATATTCGGTGCTGTTGCCGGCCTACTGGCGGTGCCCGGGGTCCCCGGTGTCCATAGCG
+TGCTAGTTGCCGCGATGGCGGCGGCCGCCACGTCGGTGCTGGCAATGCGCATAACGGGTTGTGGGGGTAT
+CACGTTGACCGCGGTGGCGTGCTGCGCGGTAGTCGTCGCGGCCGCTACGCTGGTCGGCGCGATCACTGCG
+GCCCCGGTGCCTGCCATCGGTTCGCTGGACACGCTGGCATCCTTTGGTCTGTTAGAGGTATCCGCGCGGA
+TGGCAGTCCTGTTGGCGGGGTTGTCGCCACGATTGCCGCCCGCGCTGAACCCCGACGACGCCGATGCCCT
+GCCCACCACGGATCGGCTGACCACCCGAGCGAACCGTGCAGATGCTTGGTTGACGAGCCTGCTGGCGGCC
+TTCGCGGCCTCGGCGACCATCGGTGCCATCGGAACCGCCGTCGCAACCCACGGCATCCACAGGTCCAGCA
+TGGGCGGTATCGCGTTGGCCGCCGTCACCGGTGCGCTGCTGCTGCTACGAGCACGTTCAGCAGACACCAG
+AAGGTCACTGGTGTTTGCCATCTGTGGAATCACCACCGTTGCAACGGCATTTACCGTCGCCGCGGATCGG
+GCTCTGGAACACGGGCCGTGGATTGCCGCGCTGACCGCCATGCTGGCCGCCGTGGCAATGTTTTTGGGCT
+TCGTCGCTCCCGCGTTGTCGCTCTCGCCCGTCACGTACCGCACCATCGAATTGCTGGAGTGTCTGGCGCT
+GATCGCAATGGTTCCATTGACCGCTTGGCTATGCGGCGCCTACAGCGCCGTTCGCCACCTCGACCTGACA
+TGGACATGACCACGTCCCGTACCCTGCGCCTGCTGGTGGTATCAGCGCTCGCGACGCTGTCTGGGTTGGG
+AACGCCGGTTGCCCACGCGGTTTCGCCGCCGCCGATCGACGAAAGATGGCTACCCGAATCTGCGCTGCCG
+GCGCCGCCGCGGCCGACCGTACAACGTGAGGTATGCACCGAGGTCACCGCCGAATCGGGACGGGCTTTCG
+GCCGGGCTGAGCGGTCCGCTCAACTCGCCGACCTCGACCAGGTCTGGCGACTCACCCGCGGCGCCGGCCA
+ACGGGTCGCGGTCATCGACACCGGCGTTGCGCGCCATCGACGGTTGCCCAAGGTGGTTGCCGGCGGTGAC
+TATGTCTTCACCGGGGACGGCACCGCGGATTGCGATGCACACGGCACGCTGGTGGCCGGAATTATCGCGG
+CCGCACCGGATGCGCAAAGCGACAATTTCAGCGGGGTGGCACCCGATGTCACCTTGATTAGCATTCGCCA
+GTCCAGCAGCAAGTTCGCACCGGTCGGCGACCCGTCCAGCACAGGTGTTGGTGACGTCGACACCATGGCG
+AAGGCCGTGCGGACGGCCGCCGACCTCGGCGCGTCGGTGATCAACATCTCGTCGATTGCCTGCGTTCCGG
+CCGCGGCTGCGCCGGACGACCGCGCGCTAGGTGCCGCTTTGGCCTATGCGGTCGATGTCAAGAACGCCGT
+CATCGTGGCCGCGGCCGGCAATACCGGCGGCGCCGCGCAGTGTCCGCCGCAGGCCCCCGGGGTAACCCGG
+GACAGCGTCACGGTTGCGGTGAGTCCGGCCTGGTACGACGACTACGTGCTGACCGTAGGTTCGGTGAACG
+CCCAAGGCGAACCCTCGGCATTCACTCTCGCCGGCCCCTGGGTGGATGTCGCCGCCACCGGCGAGGCGGT
+GACCTCGCTCAGCCCGTTCGGTGACGGGACCGTGAACAGGCTTGGCGGACAGCATGGTTCGATTCCGATA
+TCCGGAACCAGTTATGCGGCGCCGGTCGTCAGCGGCCTGGCCGCCCTGATCCGGGCCCGCTTTCCGACGT
+TGACCGCACGGCAGGTGATGCAGCGCATCGAATCTACCGCGCATCACCCACCCGCCGGATGGGATCCGCT
+CGTCGGCAACGGCACGGTCGATGCCCTGGCTGCGGTCAGCAGCGACTCGATTCCGCAGGCCGGCACCGCA
+ACGAGCGACCCCGCTCCGGTGGCGGTGCCGGTCCCTAGGCGGTCAACGCCCGGCCCATCGGATCGCCGCG
+CCCTACACACCGCCTTTGCTGGTGCCGCGATCTGCCTGCTCGCGCTGATGGCAACCCTGGCCACCGCCAG
+CCGCCGGCTACGGCCCGGGCGCAACGGTATCGCGGGCGACTGACGCGTTGGCTCTACTCAGCTCCGGTCC
+GGACGGCAGTGTCGCCAACACCGGCCACGGCGCCGGGATGGCAGCCGTCGGCAGACCGAGGTCGTGTGCC
+ACGTCGTCGTCGTGGATCGCGAACCGCACCCCGGTGTCGGTGACCAGGTAGCGCGTGCCGGTGCCGCCGC
+CGGACAGGCTGCGCGCGGCTACGTAGGCGCTGCGTCCCGGCGGCAGGTACACCGCGTCCAGTGCGGGGCC
+GCGACCGTCGGCTTGTGCCAGTGTCACCGGAACCCCTCCGAGGGGCACCGGCGGGCCGCTGCCCGCCAAG
+AACGCGACGCGAGCAGCACCCGGCTGCGCGGGCGTCCAGGTCACGCACAACGTGGTGACCGCCCTTCCCG
+GCGAGCCGTCCACCGGTGTTGGCGGCCGGTCGGGAAAGGCCGACACCGGCAAGGTGTTCACGATCGGAGC
+GACGCGAATCACATCGGGGGCCACCGTCGGGACGTTGACGCTGCCCTGCGAATCGCCGAACCGCAACAAA
+TCCGCGGCGACCTGGCCGATGCGCTGCACGCCGTCCTCCAGCACCACGTAATACTCATCACCGCTCGCGC
+GAGTGATGCGCACCACACCGCCGACCAGAAACCCGGGCAGCCCGACCGAGGCCCGCCCGCCGCCACGAAT
+CCGGGGAGCCGTGATGCGCGGTGCCTCCGGGACGGCGTTGAGCAACGATTGCGCGACCACGTGCGGGACC
+CGGCCCTGCAGCCGCAGCGCCCACACCACCGCCGGGTCGGCCAGATCCACCACGGCCCGCCGACCGCCGT
+AGAGCAGGTAGGTGGGCGAACCTGATTCGGTCGCCACCAGGATCATCTGTTCGGCGGTCAGCACCTGCGC
+CGACGAGTCTTCGGCGGGCCCGACGACGACAGTCGTTGATCCGCCATTGTCGCTATCGCAGATCGCCCAC
+GCCGATTCGGCGCCGGCTAGCGGCTGGTCAAGCAGCTGCGGCGCACCTGGAATACCGAGCAGTGGACCGC
+GTTTGGTGTGGCCCAATTCGGACTCGGACACCGGTTGCGGGTTGGCGTTCGTCGCCGCGATCAACCGCGC
+CGAAGCCAGGTTCAACACCGGATGCCAGACATCGTCCACTCGCACGTAGAGTGCCCCGGATTCCCGACCC
+ATCACGATCGGCGCCTGACCGAGCGCCGACTGTGGCCGCAGCAGCGCAACGAATGCGCATCCCATCGCGG
+CGACGATCGCCAGCACGCACCCGAGGGCCAGCGATGTTGTGCGCGCGCGCAGTGCTCCGGTCGCTGCGCA
+GACATCCCCGAACAGCAACGCGCACTCGATGCGCCGCAGCAGAAATCGGTACCCGCTGACGTGCAGCCAG
+GTCGTCGCTGGGCTCGGCACTGGCTCTCCCACGGTGGCGCGCTGATTTCTCCCCACGGTAGGCGTTGCGA
+CGCATGTTCTTCACCGTCTATCCACAGCTACCGACATTTGCTCCGGCTGGATCGCGGGTAAAATTCCGTC
+GTGAACAATCGACCCATCCGCCTGCTGACATCCGGCAGGGCTGGTTTGGGTGCGGGCGCATTGATCACCG
+CCGTCGTCCTGCTCATCGCCTTGGGCGCTGTTTGGACCCCGGTTGCCTTCGCCGATGGATGCCCGGACGC
+CGAAGTCACGTTCGCCCGCGGCACCGGCGAGCCGCCCGGAATCGGGCGCGTTGGCCAGGCGTTCGTCGAC
+TCGCTGCGCCAGCAGACTGGCATGGAGATCGGAGTATACCCGGTGAATTACGCCGCCAGCCGCCTACAGC
+TGCACGGGGGAGACGGCGCCAACGACGCCATATCGCACATTAAGTCCATGGCCTCGTCATGCCCGAACAC
+CAAGCTGGTCTTGGGCGGCTATTCGCAGGGCGCAACCGTGATCGATATCGTGGCCGGGGTTCCGTTGGGC
+AGCATCAGCTTTGGCAGTCCGCTACCTGCGGCATACGCAGACAACGTCGCAGCGGTCGCGGTCTTCGGCA
+ATCCGTCCAACCGCGCCGGCGGATCGCTGTCGAGCCTGAGCCCGCTATTCGGTTCCAAGGCGATTGACCT
+GTGCAATCCCACCGATCCGATCTGCCATGTGGGCCCCGGCAACGAATTCAGCGGACACATCGACGGCTAC
+ATACCCACCTACACCACCCAGGCGGCTAGTTTCGTCGTGCAGAGGCTCCGCGCCGGGTCGGTGCCACATC
+TGCCTGGATCCGTCCCGCAGCTGCCCGGGTCTGTCCTTCAGATGCCCGGCACTGCCGCACCGGCTCCCGA
+ATCGCTGCACGGTCGCTGACGCTTTGTCAGTAAGCCCATAAAATCGCGTCATGAGGTTCATCGGGGTGAT
+CCCACGCCCGCAGCCGCATTCGGGCCGCTGGCGAGCCGGTGCCGCACGCCGCCTCACCAGCCTGGTGGCC
+GCCGCCTTTGCGGCGGCCACACTGTTGCTTACCCCCGCGCTGGCACCACCGGCATCGGCGGGCTGCCCGG
+ATGCCGAGGTGGTGTTCGCCCGCGGAACCGGCGAACCACCTGGCCTCGGTCGGGTAGGCCAAGCTTTCGT
+CAGTTCATTGCGCCAGCAGACCAACAAGAGCATCGGGACATACGGAGTCAACTACCCGGCCAACGGTGAT
+TTCTTGGCCGCCGCTGACGGCGCGAACGACGCCAGCGACCACATTCAGCAGATGGCCAGCGCGTGCCGGG
+CCACGAGGTTGGTGCTCGGCGGCTACTCCCAGGGTGCGGCCGTGATCGACATCGTCACCGCCGCACCACT
+GCCCGGCCTCGGGTTCACGCAGCCGTTGCCGCCCGCAGCGGACGATCACATCGCCGCGATCGCCCTGTTC
+GGGAATCCCTCGGGCCGCGCTGGCGGGCTGATGAGCGCCCTGACCCCTCAATTCGGGTCCAAGACCATCA
+ACCTCTGCAACAACGGCGACCCGATTTGTTCGGACGGCAACCGGTGGCGAGCGCACCTAGGCTACGTGCC
+CGGGATGACCAACCAGGCGGCGCGTTTCGTCGCGAGCAGGATCTAACGCGAGCCGCCCCATAGATTCCGG
+CTAAGCAACGGCTGCGCCGCCGCCCGGCCACGAGTGACCGCCGCCGACTGGCACACCGCTTACCACGGCC
+TTATGCTGGCGCCGGACCCCGCCCGCCAGGCGCGCCGCCCGTCAACGCAGCCGAATGCGCATTTGTCCGC
+CGAATGCGCCGCGATGAACCGCAATCATTTCACCGGAAGGGAAGTGTGCGGACACGCTAACCGGACGCTC
+GGGCTAACTTCGACCGCTATTGCGCTGAGGAGGGTTGATGCCGGGCGTCATAACAAACAGTGAAAGCCCA
+ACCGCAGCCGACCACGACAGAATTACGGCCACCAGAGAGACGCTGGAGGATTACACACTGCGGTTGGCGC
+CGCGCAGCTATCGCAGGTGGCCCCCGGCGGTGGTGGGCATCTCCGCTCTCGGCGGCATCGCCTACCTGGC
+GGACTTCGCGATCGGCGCCAATGTCGGTATCACGTGGGGTACCGCGAACGCGCTGTGCGGAATCGCAATC
+TTCGCACTGGTGGTCTTCGTCACCGGCTTGCCGCTGGCCTACTACGCGGCGCGGTACAACATCGACCTGG
+ATCTGATTACCCGCGGTAGCGGTTTCGGCTACTACGGCTCGGTGGTCACCAACGTCATCTTTGCCACGTT
+CACGTTCATCTTCTTTGCCCTGGAGGGCTCGATCATGGCTCAGGGCCTTAAGCTAGGCCTGCACATTCCG
+CTGTGGGCGGGTTACGCGTGCTCGACCCTGATCATCTTCCCGCTGGTGGTCTACGGGATGAAAGTTTTGT
+CACAGCTGCAACTTTGGACCACCCCGCTCTGGCTGATCCTGATGGCGGCCCCATTTGGCTACCTGGTAGT
+CAGCCATCCCGATTCGATTGGACAGTTTTTCTCCTACGCCGGCAAGGATGGTCATGGCGGCCTTAGCTTC
+GGTTCTGTCCTGTTGGCAGCGGGAGTGTGCCTGTCACTCATCGCTCAGATCGCCGAGCAGATCGACTACC
+TGCGCTTCATGCCGCCACGGACGCCGGAGAACGCGAACAGGTGGTGGACGTGGACGCTGCTGGCCGGTCC
+CGGCTGGGTTGCATTTGGGGCGACCAAACAGATCATCGGCCTGTTCCTGGCGGTCTATCTGATGGCCAAC
+ATCCCCGGCTCGTCGACAATCGCCAACCAGCCGGTGCACCAATTCATGCAGATATACCGCACCTTCGTAC
+CGGGCTGGCTGGCGTTGACACTCGCCGTCATCCTGGTGATCTTGAGCCAGATCAAGATCAACGTCACGAA
+CGCGTATTCGGGCTCGCTGGCGTGGACCAATTCATTCACACGGCTCACCAAGCACTATCCCGGGCGGGTC
+GTGTTTCTTGGGGTTAACCTCGCGATTGCGTTGATTCTCATGGAAGCCAACATGTTTGACTTCCTGAACA
+CAATCCTGGGTTGCTACGCCAATTGCGGTATGGCCTGGGTGGTGGCGGTGGCGTCGGACATCGGCTTCAA
+CAAGTATCTGCTCGGCCTGTCGCCGAAGACTCCCGAATTCCGCCGCGGCATGCTATACGCCATCAACCCG
+GTCGGCTTCGGGTCGTTGCTGCTGGCCGCGGGGCTGTCGATCGTCACCTTCTTCGGCGGTCTGGGTGCGG
+CACTGCAGCCTTATTCACCATTGGTGGCAATCGTCACCGCGTTGGTAATGCCGCCCATTCTGGCAGCCGC
+GACCAAAGGCAAGTACTACCTTCGCCGCACGCACGACGGTATCGATCTGCCCATGTACGACGAGCACGGC
+AATCCCTCGGCCGCGGTGTTGACTTGCCATGTCTGCCACCAGGATTTCGAGCGGCCCGACATGCTGGCCT
+GCCAGACCCATGGTGCGCATGTCTGTTCGCTGTGCTTGTCCACGGACAAGCAGGCCGAGCATGTGCTTCC
+TGGGTTAGCCCGAGCGCACATCCCGGGTGACCAAGTTCCGTGACGCGAGCTGGTCATCGGGCGGATAGTC
+CACCTGGATCAACGTCAACCCGTGCGCCGGCGCGACCGCGAAGTCGCTGGATCGTCCTGTCGCGGTGAGC
+AGCTCACGACACCAAGTTGTCGCGCGACGGTGCTCGCCGACCGCCAGTAGCGCCCCCACCAACGACCGCA
+CCATCGACCAACAGAACGCGTCGGCGGTGACGTGCGCGGTGACCAGGGTGCCGGCACGCGACCAGTCCAG
+CCGCTGCAGATCACGAATCGTGGTGGCGCCCTCGCGATGACGGCAGAACGCCGCGAAGTCGTGCAGCCCC
+ATCAAATCTCGCGACGCGGCCGTCATCGCATCCAGATCAAGCTCGCGTGGCCAAGCGGTGATGTAGCGCG
+CCTGCTGCGGCTCGACACCGTAGGGTGCTGTCGACAGCCGGTACACGTAATGCCGCCGCAGCGCCGAGAA
+TCTGGCGTCGAAACCCGCTGGTGCGCGCGTGATATCGAGGATTCGAACGTCGGCGGGCAGAAATCGACCC
+AGCCTCCGCAACAGCGGCAGGAATTCCGGATCACCGACGTGGCCGGCGCGCGGGTAAGCGTTCGGCAAGG
+CATCGGCGGGCACGTCAACGTGGGCGACCTGGCCGCTGGCGTGCACGCCCGCATCAGTGCGTCCGGCCGC
+CCGCAGCCGCACCGGGGTGCGGAAGATGGTAGTCAGCGCCGCATCGAGATCGCCCGCGACCGTGCGCTGC
+CCCACTTGTGCAGCCCAGCCCGCGAAATCGGTTCCGTCGTAGGCGATATCGAGCCGAAGACGGACAACGC
+CGCTAATTCTCGGGGGCCTCTGCGGGGGGCTCTTCGGGGGCCTTCGCGTCAGGCTCACTGGCGCCGACCA
+CGTCACCCTCCTCAGCAGGCTTGGCCTCGGACTCCTCGGTCGGCATGGCCGCCGCCTTCTTGGCCTTCGC
+CTGCGCGGCAGCTACCCGGCGTGCTCGATTGGCCTCCGAGGTCACCGTCTTCTCCCGGACCAGTTCGATC
+ACGGCCATCGGAGCGTTGTCGCCCTTACGTGCCTCGATTTTGATGATACGGGTGTAGCCACCATCGCGGT
+CGGCGAAGAACGGTCCGATCTCGGCGAACAAGGTATGCACCACATCCTTGTCACGGAGCTTCTTGAGCAC
+CTCGCGCCGGTTGTGCAATGCGCCTTTTTTGGCATGCGTGATCAGCTTCTCCGCGTACGGACGCAGCGCC
+CGGGCCTTCGGCTCGGTCGTCGTGATCCGCCCATGCTCGAACAGGGACGTGGCGAGGTTGGCCAAGATCG
+CCTTCTGATGTGAAGACGACCCGCCGAGGCGAGGGCCCTTGGTGGGCTTGGGCATAGCTGACGCTCCTGT
+CTGGATTAGAGGCAGTCTAAAGCTGTTCGGTTTCGGCGTAGTCCTGCTCGTCGTACGCGCCCTCGGTCGA
+CCAGGTGCCGGTGGCGACGTCGTAGCCCGCGACCTCCGAGGGGTCGAAGCTCGGCGGGCTGTCCTTGAGT
+GACAGGCCCAGCTGGTGCAGCTTGATCTTCACCTCGTCGATGGACTTCTGACCGAAGTTGCGGATGTCAA
+GCAGGTCGGATTCGGTGCGCGCCACCAGTTCGCCCACGGTGTGCACCCCCTCGCGCTTGAGGCAGTTGTA
+GGACCGCACCGTCAGATCCAGGTCGTCGATCGGCAGGGCGAATGACGCAATGTGATCGGCCTCGGCCGGC
+GACGGCCCGATCTCGATGCCTTCGGCCTCGACGTTGAGTTCCCGTGCCAGGCCGAACAACTCGACCAGCG
+TCTTGCCAGCCGACGCCAGCGCGTCGCGCGGGCTGATTGAATTCTTGGTCTCCACGTCCAGGATCAGCTT
+GTCGAAGTCGGTGCGCTGCTCGACCCGGGTGGCGTCCACCTTGTAGGTCACTTTGAGCACCGGTGAGTAG
+ATGGAATCGACTGGAATGCGCCCAATTTCGGCACCCGAAGCCCGGTTTTGCACCGCCGGGACATAGCCGC
+GGCCACGCTCGACGACGAGCTCGACTTCCAGCTTGCCCTTATCGTTCAGCGTGGCGATGTGCATGCCGGG
+GTTGTGCACGGTGACGCCGGCCGGCGGCACGATGTCGCCGGCGGTAACCTCACCCGGACCCTGCTTGCGT
+AGGTACATGGTGACCGGCTCGTCCTCCTCCGAGGACACCACCAGGCTCTTGAGATTCAGGATGATCTCGG
+TGACATCTTCTTTGACCCCGGGCACCGTGGTGAATTCGTGCAGTACACCATCGATGCGAATGCTGGTGAC
+GGCCGCTCCGGGAATCGACGACAGCAGGGTGCGACGCAGCGAATTGCCCAGGGTGTAGCCGAATCCCGGC
+TCCAGCGGTTCGATCACGAACTGGGATCGGTTGTCGGTGAGGACGTCCTCGGACAGGGTGGGGCGCTGTG
+AGATCAGCATGGTGTTTCTTCTTCCTTTCGACGTCCGCCATATGACGTCTGTGGGGGCACTCGGGGGCGG
+CGCCCCCGAGGGTGGGGGTACTCGGGGGGCGCCCCCCGAGGGTTGGGTTGGGGGGTACTCGGGGGCGGCG
+CCCCCCGAGGGTTGGGTTTACTTTGAGTAGTACTCGACGATCAGCTGCTCGGTGAGTGGGACGTCGATCT
+GCGCGCGCTCGGGTAGCTGGTGGATCAGGACGCGTTGCCGCTCCCCCACCACTTGCAGCCAGCTCGGGAT
+CGGACGCTCGCCCGCCGTCTCCCGGGCAATCTGGAACGGCACCGTGTTCAGGGACTTGTCCCGCACGTCG
+ACGATGTCGTACTGCGACACCCGGTAACTGGGGACGTTGACGTGCACGCCGTTGACGTTGAAATGCCCGT
+GGCTGACCAGCTGGCGAGCCATCCGCCGGGTGCGCGCCAGCCCGGCACGGTAGATGACGTTGTCCAGCCG
+GCTTTCGAGGATCTTCAGCAGTTCTTCACCCGTCTTGCCGGGCTGCCGCACGGCCTCTTCGTAGTAGCGG
+CGGAACTGCTTTTCCATTACGCCGTATGTGAAACGGGCCTTCTGCTTCTCCTGCAGCTGAAGCAGATATT
+CGCTTTCCTTGATCCGCGCGCGACCGTGTTGGCCGGGCGGGTAGGGACGCTTCTCGAAGGCCTGGTCGCC
+ACCGACGAGGTCGGTGCGCAACCGCCGTGATTTGCGGGTGACGGGTCCGGTGTAACGAGCCATCTTCTCT
+CCTAGACGCGCCGGCGATTGGGGGGCCGGACACCGTTATGCGGCTGGGGGGTGACATCCGAGATCGCGCC
+CACCTCCAGGCCGGCGGCCTGCAGCGACCGGATCGCGGTCTCGCGGCCCGAGCCCGGGCCCTTGACGAAC
+ACGTCGACCTTGCGCACCCCGTGGTCTTGGGCCTTGCGAGCGGCGTTCTCCGCGGCCAGCTGGGCCGCAA
+ACGGGGTCGATTTCCGGGAACCCTTGAAGCCGACGTGCCCCGACGATGCCCAGGCAATGACGTTGCCTTG
+CGGGTCGGTGATGGTCACGATCGTGTTGTTGAACGTGCTCTTGATGTGGGCGGCGCCGTGCGGGACGTTC
+TTCTTCTCCCGCCGGCGGGTCTTCTGGCCCTTCCTAGCCGACGTTGCCGGCCCTTTTTTTGCTGGTGGCA
+TCGGTTACCTAGCCTTCTTCTTGCCTGCGATGGTGCGCTTGGGGCCTTTGCGGGTCCGCGCGTTGGTTTT
+TGTCCGCTGGCCGCGTACCGGCATACCGCGGCGGTGCCGCAACCCCTGATAGCAGCCAATCTCGATCTTG
+CGACGGATGTCGGCCTGTACCTCGCGGCGCAGGTCACCCTCCACCTTCAGGTTCGCTTCGATGTAGTCGC
+GCAGGTGGATCAGCTGTTCTTCGGTGAGATCTCTGGTGCGCAGATCCCGGTCAATGCCGGTGGCCGCCAG
+GATTTCGTTCGAGCGGGTACGGCCGATGCCAAAGATGTAGGTCAGGGCGACCTCCATCCGCTTATCGCGC
+GGCAGGTCGACGCCGACGAGTCGAGCCATAGGTGGCGTTTCCTCTTCCTCTGCGGAGGTATGGTCCCAGT
+CCGTTCCCTGCCCAAAAAAGATCTTTGGGTGTGGGGCCCGGCCTCCGTCCGGGCGTGAATGAGCTGGCCC
+ATCTCCATCGATGCCAGCCGCTCATTGGTGCTGGGGGTCTGCATTTAGTTGTCGGGCCGTCCGGCTCCTC
+CTCGGACCACTACGCGGCCCGCATCGTCGCCGAACTAGCCCTGCCTTTGTTTGTGACGCGGATCGGAACA
+GATCACCATAACCCGCCCGTGCCGACGGATCAGCCTGCACTTGTCACAGATCGGCTTGACGCTCGGGTTT
+ACCTTCACGACTGTCTCGGTCCTGTTCTATGGGTATGTCGCTACTTGTACCGGTACACGATGCGGCCCCG
+GGACAGGTCGTAGGGCGACAATTCCACCACCACCCGGTCCTCGGGCAGGATGCGAATGTAGTGCTGACGC
+ATCTTGCCGCTGATGTGGGCGAGCACCTTGTGGCCGTTCTCCAGCTCAATGCGGAACATGGCATTGGGCA
+GGGGCTCGACCACGCGACCCTCGACCTCTATGGCACCGTCCTTCTTGGCCATTACTTTCTGGCGATCCTT
+CTCTTCCTTGTCGGTGCACCCGATTCCGGCGCAGCACGTGCTCGGACTACAAACGTGAGCCGGTGGTGGA
+AATTCCGCGAAGGGCTCCGAGAAATTTTCAAAACTGGGCACGCCAAACCGGCACGGGACACCGCACCGCC
+AACCCACATTACCCGCATCGCCGTGCTCTGCGCAAAACGCCGTAGGCCACGCGCTCACCGGAATAGCACC
+GGTGAGCCGAGCGGTTAGAGCAACCATGACCAATTGTGCCGCCGGCAAACCCAGCTCAGGCCCTAACCTC
+GGCCGATTCGGATCGTTCGGACGCGGCGTCACCCCCCAGCAGGCCACAGAAATCGAGGCGCTGGGCTACG
+GGGCGGTCTGGGTGGGAGGCTCACCACCCGCCGCACTGTCCTGGGTGGAACCGATTCTGCAAGCGACCAC
+CACATTGTGTGTGGCCACCGGCATTGTCAATATCTGGTCGGCACCGGCCCAGCGAGTCGCCGAATCGTTC
+CACCGCATCGAGGCGGCCTACCCGGGCCGCTTTCTGCTGGGTATCGGAGTCGGGCATGCCGAGATGATCA
+GTGAGTACCGCAAGCCCTACAACGCGCTGGTGGAATACCTAGACCGGCTCGACGACTATGGGGTGCCCGC
+CAACCGCCGGGTGGTGGCCGCACTGGGCCCCCGGGTCCTGGGCCTGTCCGCACGCCGCAGCGCCGGGGCG
+CACCCGTACCTGACCACACCCGAACACACGGCACGGGCCCGTGAGCTGATTGGTCCGTCGGCGTTCCTGG
+CGCCCGAACACAAGGTGGTGCTGACCACCGACTCGGCAAGGGCCCGTACGGTGGGACGCCAGGCGCTCGA
+TATGTACTTCAACCTGGCTAACTACCGCAACAACTGGAAACGGCTGGGCTTCACCGACGACGAAGTCTCC
+CGGCCGGGCAGCGACCGCCTGGTTGACGCCGTGGTCGCCTACGGCACTCCAGACGCGATCGCGGCACGGC
+TGAACGAACACCTGCTTGCAGGCGCCGACCATGTCCCTATTCAGGTCCTCACCGAAGATGACAACCTGGT
+GTCGGCGCTGACCGAACTCGCGAAGCCGCTCCGACTGACTTGATCCCGAAACGGAGGGTTGCGAACCCAA
+CTGGTCGCGGCTCCACTCGGTTAAGGCTCGGTTAGGGTTTGATCCATGCGGTTGCTAGTCACCGGTGGCG
+CGGGATTCATCGGCACGAATTTCGTGCACAGCGCCGTACGTGAGCATCCAGACGATGCGGTTACCGTACT
+CGACGCCCTGACCTACGCCGGCCGGCGCGAGTCGCTGGCCGACGTGGAGGATGCCATCCGGCTGGTTCAG
+GGCGATATCACCGACGCCGAGCTGGTTTCGCAGCTGGTGGCCGAGTCCGACGCGGTGGTGCATTTTGCCG
+CCGAATCCCATGTCGACAATGCACTGGACAATCCGGAGCCGTTTCTGCACACCAACGTCATCGGGACCTT
+CACCATCCTGGAAGCGGTGCGACGCCACGGTGTGCGCCTGCACCACATCTCCACCGACGAGGTCTACGGC
+GACTTGGAGCTCGACGACCGGGCGCGGTTCACCGAATCGACGCCCTATAACCCGTCCAGCCCTTACTCGG
+CGACCAAGGCGGGCGCAGACATGTTGGTCCGGGCCTGGGTTCGGTCCTATGGCGTACGCGCGACGATCTC
+CAACTGCTCCAACAACTACGGGCCGTATCAGCACGTCGAGAAGTTCATTCCGCGTCAGATCACCAATGTG
+CTCACCGGGCGGCGGCCCAAGCTCTACGGCGCGGGCGCCAATGTCCGTGACTGGATCCACGTCGACGACC
+ACAACAGCGCGGTGCGGCGAATCCTGGACAGAGGCCGCATCGGCCGAACCTACCTGATCAGCTCCGAGGG
+CGAGCGTGACAACCTGACCGTGCTGCGCACGCTGCTGCGACTGATGGACCGCGATCCGGACGACTTCGAC
+CACGTCACCGACCGCGTCGGCCACGACCTGCGCTATGCCATCGACCCGTCCACGCTCTACGACGAATTAT
+GCTGGGCGCCAAAGCATACCGATTTCGAGGAGGGCCTGCGGACCACGATCGACTGGTACCGCGACAACGA
+ATCGTGGTGGCGTCCACTAAAAGACGCCACGGAGGCCCGCTATCAAGAACGCGGTCAATGAGATGAAAGC
+ACGCGAACTCGACGTCCCCGGCGCCTGGGAGATTACCCCGACCATCCATGTCGATTCCCGCGGACTGTTC
+TTCGAATGGCTTACCGATCATGGGTTCCGCGCATTCGCAGGTCACAGTTTGGACGTCCGGCAAGTGAACT
+GCTCGGTGTCATCGGCCGGTGTGCTGCGCGGCCTGCACTTTGCCCAGTTGCCGCCGAGCCAGGCCAAGTA
+TGTGACCTGCGTTTCCGGCTCGGTGTTCGATGTCGTCGTCGACATCCGAGAGGGCTCACCGACATTCGGC
+CGATGGGACTCGGTGCTGCTCGACGACCAAGACCGTAGGACGATCTACGTCTCCGAAGGCCTAGCGCACG
+GCTTCCTTGCACTGCAAGACAATTCGACGGTGATGTACTTGTGCTCGGCGGAATACAATCCGCAGCGCGA
+GCACACCATCTGCGCCACAGATCCGACGTTGGCGGTCGATTGGCCGCTGGTCGATGGCGCTGCCCCCAGC
+CTGTCCGACCGTGATGCCGCTGCGCCCAGCTTCGAGGATGTGCGCGCGTCTGGCCTGCTGCCCAGGTGGG
+AACAGACGCAGCGGTTCATTGGGGAGATGCGCGGCACCTAGCTCGGTAATCCCTTGTGTTGCTTTAGCTT
+CAGCGGTCACAGCGCGGCGATTGTTGTCGGTGGCCCCTCGTAGAATTTGGGGTATGGGTTCGGGTAGCCG
+CGAACGGATTGTCGAGGTCTTTGATGCGCTGGATGCCGAGCTGGACCGCTTGGACGAGGTGTCTTTTGAG
+GTGTTGACCACCCCGGAACGGCTGCGGTCTCTGGAACGTCTGGAATGCTTGGTGCGCCGGCTACCGGCGG
+TCGGGCACACGTTGATCAACCAACTCGACACCCAAGCCAGCGAGGAAGAACTGGGCGGCACGCTGTGCTG
+CGCGCTGGCCAACCGGTTACGCATCACCAAGCCCGACGCCGCCCTACGCATCGCCGACGCCGCCGATCTC
+GGACCTCGTCGAGCACTCACCGGCGAACCGCTAGCCCCACAGTTGACCGCCACCGCCACCGCCCAACGCC
+AGGGCCTGATCGGCGAGGCGCACATCAAAGTGATTCGCGCCCTTTTTCGCCCACCTGCCCGCCGCGGTGG
+ATGTGTCCACCCGCCAGGCCGCCGAAGCCGACCTGGCCGGCAAAGCCGCTCAATATCGTCCCGACGAGCT
+GGCCCGCTACGCCCAGCGGGTCATGGACTGGCTACACCCCGACGGCGACCTCACCGACACCGAACGCGCC
+CGCAAACGCGGCATCACCCTGAGCAACCAGCAATACGACGGCATGTCACGGCTAAGTGGCTACCTGACCC
+CCCAAGCGCGGGCCACCTTTGAAGCCGTGCTAGCCAAACTGGCCGCCCCCGGCGCGACCAACCCCGACGA
+CCACACCCCGGTCATCGACACCACCCCCGATGCGGCCGCCATCGACCGCGACACCCGCAGCCAAGCCCAA
+CGCAACCACGACGGGCTGCTGGCCGGGCTGCGCGCGCTGATCGCCTCCGGGGAACTGGGCCAACACAACG
+GTCTTCCCGTCTCGATTGTGGTCACCACCACCCTGACCGACCTGCAAACCGGCGCCGGCAAGGGCTTCAC
+CGGCGGCGGCACCCTGCTACCCATGGCCGATGTGATCCGCATGACCAGCCACGCCCACCACTACTCCCCC
+GCAAGCGGGAGGTACCCCCAGGCGATCTTCGACCACGGCACACCCCTGGCGCTGTATCACACCAAACGCC
+TAGCCTCCCCGGCCCAGCGGATCATGCTGTTCGCCAACGACCGCGGCTGCACCAAACCCGGCTGTGACGC
+ACCGGCCTACCACAGCCAAGCCCACCACGTCACCGGCTGGACCAGCACCGGACGCACCGACATCACCGAG
+CTGACCCTGGCCTGCGACCCCGACAACCGACTCGCCGAAAAAGGCTGGACCACCCGCAAAAACACCCACG
+GCCACACCGAATGGCTACCACCACCCCACCTCGACCACGGCCAACCCCGCACCAACACCTTCCACCACCC
+CGAACGATTCCTCCACAACCAAGACGACGACGACGAACCCGATTGACCCCCAGCAGTCAAAGCCACACGC
+CACAACGCCGCACAACCATAAACACCGAGTCCGTCAGGGCCTGGCCGGAGCAAACACGCCACGGTGGTAG
+GAGCTGTGGGCATATGCCTTGGAGCCCACCAGTTGTGACAACGGCGTGTGCACCGACTGCCCGCGTGCGA
+GTCTGGCGGCGACCGCGTTTAGGTCGAACCGCGGACGCCAATTCAAGTCACGGCGAGCGCGGGAGTTAAC
+GTACACGCGGTCGAGGCGGTCGGGGAAGCGCCAACCACGCTGGGTCCACACAGCCGCGGCCAGCGGTACC
+CGCCGGGCGAACACCGATGCCGCGTCGGTGCGCAGCTGCGTCAGGTCATCACGGGTAAACGGTGTGGTCG
+CCGACACCAGATAGCGCCCGAACCCCAGCTGGGGAGCTCGCTGCGCGGCGTTGAGGTGCGCATCTACCGC
+GTCTTCGAGCGCGACCCGCCGGCAGGCATATTCGTTGGCTTTGATGTTGTCCTGGCTGCGCCCGTCATAC
+AGGTCAGGCATGTCATCGCCCTCGACGAAGAATCGGGCAACACGCAGCACGACGCAGGCCAAACCGTCGT
+TGCGATGTGCCAACTGGCAGAGGTCCTCGGAGCTAGCTTTGGTCACGCCGTAGATGTTCTTGGGAATGGG
+CGTGACGGATTCGTCGATCCACGCCGCGGGCTGGTCTGCCGGCGGTGTCAGGGCGTCGCCGAAAACGGTC
+GTCGATGATGTCATGACGAAGGCGCGGACGTTGGCGGCGACCGCAGCATCCAGCACGGTCTGGGTACCGA
+TGATGTTCGTGTCCAGAAACGCCTGACGCGGCAGGAAGGCCAGTTGCGGCTTGTGATGGGCGGCCGCGTG
+GAACACCACCTCAACGCCGGCCATCACGTCTCGCAGCAGTGCTCGATCACTCACGCAGCCAACGATATTC
+GTGTACCGCGACGGTCTGCTGTCGAGGCTGACGACGTCGGCGCCCCGTGCACGCAGAGTGCGCACCAGCG
+CCTCGCCCAGGTGACCGGAGCTGCCGGTAACCAGGGTACGCATCCCGCTCTCGGCGGCGGCAGCCGTCGG
+AGGCGTGCCCGCGTGCAACAACAGCGGACTGGACCGCACGCCGGCGCGGACTCTCATGGTGGCTGCATGT
+GTTCCCACGACTCACGCCCTCATTCCCACGACCACTCGATCGATGTCTTGCGGGGACAACCACTGCCCCG
+CATGACTTTTCGCGGTCTGCCGAATAACGTGGGACACGGAAAGCCCCGCCTGTTGGGCCGCTGCGCGGAG
+GTGCTCGACCTGCAGCGAATCGAGTCCGTGGAATCCGAACGAGATCTCCCACGGATCGATGCCGTAACTC
+TGCGGGCTCCGGCCCAACATATCCGATCGCGCTGCGTCGAAAATCCGATCCAGGTCGACTGCCGCCAGGT
+GCCCGCGCCGCTGCAACGCGGCGACGAGGCACTCGATCTGGCAATTCCCGGCCCCGCGACCGAAACCCAT
+CAGCGTTCCATCCAGGAAATCGGCCCCGGCGTCGAATGCCTCCAAGGTGTTGGCGACGGCCATGGCGAGG
+TTGTTGTGCCCGTGGAAGCCGACGGAGACATCGCTGGCACCGCGGAGAGCCTCGACGTAGCGGCGCGCGT
+CCTCGGGCAGGAAGGTTCCCGTCGTATCCACCACGTAAACGATCCGGACGCCCACATCGCGGGCCCGCTT
+CCCGGCAGCAGCAAGCACATCGGGCTCGAAGAGATGCGACTTCACCAGCTGGATCGAAACCTCCAGACCT
+TTTGACTGCGCACGCTCGACGAACGGCATCACCAACTCAAATTCGGTGGCGATGACACATATGCGCAGAA
+AGTCCAGATAGTCTCCGGCCAAATCGACCGTCTCGATGCGGGCCAGGGCCGGCACGATCACGGCACCAAG
+TCTCGCGTTTCGAACCACCGATCGGGCGGCGCGGAAATATTCTTCGTCGGTGTGAGCCGCCGGGCCCTGC
+GCCGCGGCGGCTCCGATGGTGACGCCGTGACCGATTTCAATGTAGGGAATTCCCGCTGCGTCGAGATCCC
+CGACAATCCTGCGGACATCGTCGTCGGTGTACTGGAAGTTCACCGCATAGCTGCCGTCACGGACGGTCGT
+GTCCAGGACAATCGGCTCTCTGTGGGTCGCAGTCATGAGCATCAGTGTCAGCCCGCACCCTTGCCGGATC
+CTTGATGAATTCTTGGACGCGCGGCTGGTGTCCTATCGACCCAGTCCAATGTCGGGTTTGTTGATCTCTG
+GATCGATCGCGATATCGAGGACGCAGGGACCGGTGGCGGCCAACGCTTTTTGCACACCGGCGCGCAGCTC
+GCAGCGCGTATCGACCCGAATCCCTTCCGCTCCAAGGGCGCGGGCCATCGCCGCCAGATCGTTCGCGCCG
+ATGCGAGCGACCGGCGACGGATCCATCCGCCCGCTGACCGGGCCGGCGCTGGCACTCATTTGTCCGTCGT
+TGAGGACAGCCCAGGTCACCCTGATCCCGTGCGCAACCGCAGTGGAAATCTCCGTGCCATGCATCAAGAA
+AGCCCCGTCCCCGGCGATGCATATGACGTGTTCTTCCGGTCGAGCCAGGGCCACGCCAATGGCTCCGGCG
+ATGCCGCATTCCATGGGCGAAAAGTCAACGGTGGCAAAGAATCTGCCGGGCCGCCGCACCGGTATCCCAC
+GAAACGTCCAAGAAATGCAGGTACCCACGTCGGCGCATATCGTGGCGTTGGGTGCAAGCTCGCGGTCCAG
+TTCGTGCATCAGCTCAAGCGGGTGAATCGATTCCCCCCGCGCTTGCGGGGTCCCCGGCAACGCCGCTGGC
+GCCGGCGGCCGCACGCCCACCCTCCGACAAAAGCGTGGCGGCCGCCCGCAGTTCAGGGCATTGACGAACG
+CGCGCCCGGACGTGGTGATCCCGAGCGACGTAGCGACGAATCGGCCAACTGCCGATGGATCGGGATCGAC
+ATGGACGACGTCGGCTTTCAGCCCGCGCCAGCGGGGCGAAAAGGAGCGGGTAACCAACCCGCCGAAGGAA
+ACACCGACCGCGATCAACAGGTCGCACGGTGTGTCGAAGAGGTACTCGTCGGCCCTGCCGTCACCAAATA
+TGCCGAGCACACCCAGAGACAGCGGATGGGTTTCCGCGACGATCCCCCGCCCGTTCGGTGTGGTCGCAAA
+AGGAAGTCCCGCCTTCTCGCAAAACGCGACGATCTGCTCGCCGATGCCGTCCAGCCGGCAGCCATTCCCC
+AGCACGAGCATGGGGGCACGCGACCGATCCAGCCTACCGATCACCTCGTCAGCGACATCAGGACCGCACG
+GCGCCAGGGTTCTTAGGCCCCCAAGACCGGCCGCGGCAGTTCCAAGTTGGTGAGCCGGCAGCCGCTCGTC
+CACTAGATCGCGCGGCAGAGCAATGTGCACCGGTCCGCGAGGGATGCTCGCCAAGGCCCGGAACGCCGAA
+TCGATCTTGCTGCGCGCATTGGCGATCGATTCGATGGACACCGAACAGCGGCAGAACCGGCGGAAGGTTG
+CGCCCAGGCCCAGTCCGTCGTCGCTCGTATCCTGCTGCGAGTGCAGGCCGAATTCTCCGACCGCCACCTC
+CCCGGTCAGGATAAGCATCGGAACCTGATTCACCGACGCATTGGCCACGGCGCTAATGACGTTGGTCGCC
+CCAGGTCCCGCCACAAACACCGCAGCGGACTTGCCGGACGCGCGGGCGAACCCGTCGGCCAGGTAGCCGG
+CGCCGCCCTCGTGCCGGGCCAACACGATCTGAAAGCCGGCATCGCGGGACAGACGCACCAGCAACGAATC
+GAGCCGGGAAGTCGGTAGCCCGCATACGACCGAAATGCCGGCTGCGCGCATCCTGGCGACGAGATGATCC
+CCGACGGTCACGGGAGTCACGGCCATGCCCCGATCACGGCGGCCTCGCCCATGCGCTGATCGCGTTCCGG
+TAGGTAGGCCGGGCCCCAGGCGCACAAGAATGTCAACGGAACTGAACCTAGGGCCCGGATTTTCTGCGGG
+ACACCAGCCGGTATCCAGACCGCATCGCCGGGCCCGACCTCGCCAGATTCGTCTCCGACCGAAACCAGCC
+CGCGCCCCGAGAGAACAAAATAGATCTCATCGGTGGCTTGCAATCGGTGCCATACGGTCTCGGCTCCCGC
+CGCCACGGTCGCATGGGCCAGACTGACCGAGGCGACGCCCACAGTGGCCCGATCCACCAGGACCCGAATC
+TCGGACAAGTCCGGCGCCACGAACGGCTCTGCCTCCCTGGCGTTGCTGACGAACATGGCAGCAGCGTGTG
+CCCGCGCTCTTGGCGGATCCTTGACGAATCCTCGGAACGCGGGTTTGTGACCGGCGGAGAGCGCGACGGT
+TGCCTGCAGCACAGCGTCTGTCGACGTTGACGCTCGCTCCCGTTCGGGCCGGGTTGACATCCCCCACCAC
+CGGCCACACAATGCGCCCGGTGGATGAGCAGTGGATCGAGATACTCAGGATCCAGGCACTGTGTGCTCGG
+TACTGTTTGACGATCGACACCCAGGATGGCGAAGGCTGGGCGGGATGCTTTACCGAGGACGGTGCCTTCG
+AGTTCGACGGCTGGGTGATCCGGGGGCGGCCCGCATTACGCGAATACGCAGATGCGCATGCCCGCGTCGT
+GCGGGGCCGCCACTTGACCACGGATCTTCTCTACGAGGTCGACGGGGACGTCGCCACCGGGCGCAGCGCC
+AGCGTGGTCACTCTGGCCACTGCCGCCGGCTACAAGATCCTCGGCTCGGGCGAGTACCAGGATCGCCTCA
+TCAAGCAGGACGGCCAGTGGCGTATCGCGTACCGGCGATTGCGCAACGATCGGCTGGTGTCGGATCCCAG
+CGTGGCGGTAAACGTCGCCGATGCCGACGTCGCCGCGGTCGTCGGTCACCTTCTCGCGGCCGCGCGCCGG
+CTCGGAACCCAGATGAGCGACACGTAGGGGCGACAAGCTAGGGCCGACGTCGGTGTACGGACACACGCGC
+TCGCGGGTTGGCTGTGCAGGACCTTCCCTAACCCCATCATCGGACGCCGACATGCCGAGCGAGAAAATCT
+AGGACCGCCCCTGCGAAAGCGTCGTTGCGATCGCCGGCGACCATATGTCCGGCGCCGCGCACATCGGTGA
+ACTCGACTTGCGGAAACCGCGAGAGAAATTGGTCGGCGCTTTCTTGGCGGACGATGTCGCTGACTTGGCC
+GCGCACGAGAAGCACCGGCACTTCGTCGCGCAGGATCGTCGCAACGGCTGCATTCATGCGGTCGACGTCG
+GTGACCTCTACGGGAGGAAACGCCGCGATACCACCGATGAACTGCGGATCCCAGTGCCAATACCAGCGAT
+CACCGCGGCGGCGCAGGTTGGCCACCAAGCCATCCGGATCCGAAGGCCGCGGCCGATGCGGGTTGTAGTT
+GGCGATGACGTCAGCCACCTCGTCCAACGAGCCGAACCCCGATTCCACCCGTTCGGCCATGAACGCGTGG
+ATCCTGCTCGCCCCGGCCAGGTCCATATTCGGCACGATGTCCACCAGCACCACTGCGCTGGCAATGCCCG
+GCGAGAGCTCCCCCGCCAGCAGCATCGCGGCAAACCCACCCAAGGAGGCGCCCACCAGCGCCGGCTGCCC
+AGGCAGGTTGCGCAGCACTTCCTGGATATCGCCGGCGAAGCTGACCAACCGATAGTCGCCTTCGCTCGAC
+CAGTCGGATTCGCCATGCCCGCGCAGATCGATCGTGACCGCTTGCCAGCCACGTTCGGCGACAGCGGCTG
+CGGCCCGACCCCATGAGCGTCGCGTCTGTCCACCGCCATGCAAGAACACCACGGCACGCGCTCGCGGGTC
+TCCCAAGCGGTCGGCGACGATACGGGCACCGCCCGGCCCGTGGACCGAGAACGATTCAGCTGCCATTGAT
+ATCGGGTCCATCAGGGGATCCAGAACCATCCGTTTGCATGCCCTACCACGATCCTGTCCTACCGAGCGGC
+CCGCAGTCACCCCAGATTCGGCGTCAATCCGGCACCCGGTTCGTGGTCCATCCACGGAACCCAAGGCGCC
+ATTTTCGCAGTGATTGCACGCTCGGCGAAAGGTGTTACCCAGACGCTACAGCTATGCGTGCCCGTAGAAT
+GCAAATCCCTGCTCGCGGTCGAGGTAGGTATCGGCCTTGTTCTTGATGAAAAACACATAGACAATCAGCG
+AGACCGCTATGCACGCGGTCACGTAGGCGATGAACATCGGCACCTGATCGCGTTCCTTAAGAGCCTGGTA
+GATCAGCGGCGCGGTGCCGCCGAAGACCGAGTTCGCCAGTGCATAGCCGACTCCGACACCAAGGGCGCGC
+ACGTGCGCGGGGAACAGTTCGGACTTGACCAGTGCATTGATCGAGCAGTATCCGGTCAGAATCACATAGC
+CGACGGCCACCAATAGAAACGACATTGTCGGCGAACGTGTTTCGGGAAGATAAGTAACAAGGACGTAGGT
+ATAGATGAGTCCGCCGACGCCGAACCACAGCAGCAGTGGCTTGCGGCCGATCTTGTCGCTGATCATGCCC
+CCGATGGGCTGCAGCATCATCAACAGAATCAGACCAACCAGGTTGATCCAAGTAGCGGTCATCGCCTGCG
+AACCGTAGACACTCTTGACGATCGCAGGTGCATTGACGCTGTAGGTATAAAACGCGACCGTGCCGCCCAA
+CGTGACGAGGAAACAGAGCAGCAATGGCTTCCAATAGTGGGTGGCCAGTTCACGGAGCGACCCGGAGTCG
+TGGTCCCGCCCGGCCTTGATCGCAGTCAGGCGTTCCTGACTGAGCGATTCATCCATCGTGCGCCGCAACC
+AGAACACCACGATCGCGGCGCCACCGCCTACGGCGAAGCCGATGCGCCAGCCGAATTCGTGAACCTGCTC
+GCGGGTGAAGACCGCCAGGATGACTAGCAGGGTGAACTGGGCAAGCACGTGCCCACCCACCAGCGTCACA
+TACTGAAACGACGAGAAGTAGCCGCGCCGCTCCCGCGTCGCGGCCTCAGACATGTACGTCACCGACGTGC
+CGTACTCTCCGCCGGTCGCAAATCCCTGGACGAGCCGACACAAAATAAGCAGGATCGGCGCAGCGACGCC
+AATGCTCGAGCGAGACGGCACCAACGCCACGATCAGCGAACAGGCGGCCATCAGCGACACACTGAACGTC
+AGCGCGGCCCGGCGGCCGCGGCGGTCGGCAAACCGACCAAAGAACCACGATCCGACGGGCCGGGTCACGA
+AGGTAACAGCGAAGATCGCGTAGACATAGACCGTCGAGTTGCGATCGGCCCGATCAAAGAATTGGTCCTC
+GAAATACGTAGCGAACACGGTGTAGACGTAGACGTCATACCACTCGACCAGATTGCCCGACGATCCCCGG
+ATCGTGTTCCAAATGGCCCGACGGGTCTCGGCCTGACTCGGGCGCGATGGAGGTGCAATGGAAACGGTCA
+TGGTGTCCTCCATGCGATTCGCATTGTCGCGCCGTCTGACGGTCACCATAGTGACCGACGTCAGCACCCG
+CCGTGCAGGGCTGGAGCGTGGTCGGTTTTGACTCTGCGGTCAAGGTGACGTCCCTCGGCGTGTCGCCGGC
+GTGGATGCAGACTCGATGCCGCTCTTTAGTGCAACTAATTTCGTTGAAGTGCCTGCGAGGTATAGGACTT
+CACGATTGGTTAATGTAGCGTTCACCCCGTGTTGGGGTCGATTTGGCCGGACCAGTCGTCACCAACGCTT
+GGCGTGCGCGCCAGGCGGGCGATCAGATCGCTTGACTACCAATCAATCTTGAGCTCCCGGGCCGATGCTC
+GGGCTAAATGAGGAGGAGCACGCGTGTCTTTCACTGCGCAACCGGAGATGTTGGCGGCCGCGGCTGGCGA
+ACTTCGTTCCCTGGGGGCAACGCTGAAGGTTAGCAATGCCGCCGCAGCCGTGCCGACGACTGGGGTGGTG
+CCCCCGGCTGCCGACGAGGTGTCGCTGCTGCTTGCCACACAATTCCGTACGCATGCGGCGACGTATCAGA
+CGGCCAGCGCCAAGGCCGCGGTGATCCATGAGCAGTTTGTGACCACGCTGGCCACCAGCGCTAGTTCATA
+TGCGGACACCGAGGCCGCCAACGCTGTGGTCACCGGCTAGCTGACCTGACGGTATTCGAGCGGAAGGATT
+ATCGAAGTGGTGGATTTCGGGGCGTTACCACCGGAGATCAACTCCGCGAGGATGTACGCCGGCCCGGGTT
+CGGCCTCGCTGGTGGCCGCCGCGAAGATGTGGGACAGCGTGGCGAGTGACCTGTTTTCGGCCGCGTCGGC
+GTTTCAGTCGGTGGTCTGGGGTCTGACGGTGGGGTCGTGGATAGGTTCGTCGGCGGGTCTGATGGCGGCG
+GCGGCCTCGCCGTATGTGGCGTGGATGAGCGTCACCGCGGGGCAGGCCCAGCTGACCGCCGCCCAGGTCC
+GGGTTGCTGCGGCGGCCTACGAGACAGCGTATAGGCTGACGGTGCCCCCGCCGGTGATCGCCGAGAACCG
+TACCGAACTGATGACGCTGACCGCGACCAACCTCTTGGGGCAAAACACCCCGGCGATCGAGGCCAATCAG
+GCCGCATACAGCCAGATGTGGGGCCAAGACGCGGAGGCGATGTATGGCTACGCCGCCACGGCGGCGACGG
+CGACCGAGGCGTTGCTGCCGTTCGAGGACGCCCCACTGATCACCAACCCCGGCGGGCTCCTTGAGCAGGC
+CGTCGCGGTCGAGGAGGCCATCGACACCGCCGCGGCGAACCAGTTGATGAACAATGTGCCCCAAGCGCTG
+CAACAGCTGGCCCAGCCAGCGCAGGGCGTCGTACCTTCTTCCAAGCTGGGTGGGCTGTGGACGGCGGTCT
+CGCCGCATCTGTCGCCGCTCAGCAACGTCAGTTCGATAGCCAACAACCACATGTCGATGATGGGCACGGG
+TGTGTCGATGACCAACACCTTGCACTCGATGTTGAAGGGCTTAGCTCCGGCGGCGGCTCAGGCCGTGGAA
+ACCGCGGCGGAAAACGGGGTCTGGGCGATGAGCTCGCTGGGCAGCCAGCTGGGTTCGTCGCTGGGTTCTT
+CGGGTCTGGGCGCTGGGGTGGCCGCCAACTTGGGTCGGGCGGCCTCGGTCGGTTCGTTGTCGGTGCCGCC
+AGCATGGGCCGCGGCCAACCAGGCGGTCACCCCGGCGGCGCGGGCGCTGCCGCTGACCAGCCTGACCAGC
+GCCGCCCAAACCGCCCCCGGACACATGCTGGGCGGGCTACCGCTGGGGCACTCGGTCAACGCCGGCAGCG
+GTATCAACAATGCGCTGCGGGTGCCGGCACGGGCCTACGCGATACCCCGCACACCGGCCGCCGGATAGCA
+CGACCGGTTTGCGCGGATGCGTCGGCGTTGTTCCCCGCCGCGGTTGGCGTGCTCTGGCAATCTGGTCTAA
+GGGACCCGACCCCACCGGGCGGACCCCACGGCATCGAGGGGCTGTCGATGGCATTCGAAAAGCCGTCACC
+GGTAACGGCATTGACGCAGGAACTACGATTCGCGACGACCATGACGGGCGGCGTCAGCCTCGCGATCTGA
+ATGGCCGGTGTTACGCGGGAGATCAACCTGCTCGCGCAGGCCTCACAATGGCGCAGGCTGGGGGGAACCT
+TCCCGACCAACAGCCAACTCACCAACGAGTCAGCCGCTTCCCTGCGGCTCTACGCTCAACTAATCGACCT
+CCTCGACATGGTCGTCGACGTCGACATCTTGTCGGGAACAAGTGCGGGCGGCATCAACGCGGCTTTGCTT
+GCGTCATCCCGAGTCACCGGGTCTGACCTGGGCGGGATCCGCGACCTCTGGCTCGATCTTGGGGCCTTGA
+CCGAGCTTCTCCGAGATCCGCGGGACAAGAAAACACCGTCCCTCTTGTACGGCGACGAACGCATATTCGC
+CGCTCTGGCCAAGCGGCTTCCCAAGCTGGCGACCGGGCCGTTCCCGCCCACGACCTTTCCGGAGGCCGCG
+CGCACCCCGTCCACCACCCTGTACATCACGACGACGCTGCTAGCCGGGGAAACAAGCAGATTCACCGACT
+CATTCGGCACTCTCGTCCAGGATGTCGACCGCCGCGGTCTGTTCACCTTCACCGAAACCGACCTGGCGCG
+GCCAGACACGGCGCCGGCGCTGGCACTAGCAGCGCGCAGTTCCGCCTCATTCCCACTTGCGTTCGAACCC
+TCCTTTCTGCCGTTCACGAAGGGAACCGCCAAGAAGGGAGAGGTGCCGGCTCGACCGGCGATGGCGCCGT
+TCACCAGCCTTACCCGTCCGCACTGGGTTAGCGATGGTGGCTTGCTGGACAACCGGCCAATTGGCGTTTT
+GTTCAAGCGCATCTTCGACCGTCCAGCCCGACGGCCGGTTCGCCGGGTGCTCCTGTTCGTCGTACCATCG
+TCCGGACCCGCACCCGACCCGATGCATGAGCCACCACCGGACAACGTCGACGAGCCACTCGGGCTCATCG
+ACGGGCTGCTGAAGGGCCTGGCCGCGGTCACCACCCAGTCGATCGCGGCCGACCTACGCGCGATCCGCGC
+CCATCAGGACTGCATGGAAGCGCGCACAGATGCCAAACTGCGGCTCGCAGAGCTGGCGGCAACGCTGCGG
+AACGGCACACGGTTGCTCACCCCGTCCCTGCTCACGGATTACCGGACCCGCGAGGCAACCAAGCAGGCCC
+AGACCCTCACCAGCGCTCTGCTGCGCCGGCTTTCCACCTGTCCGCCGGAGTCGGGCCCGGCAACCGAAAG
+CCTTCCCAAGAGCTGGTCAGCCGAACTCACCGTCGGTGGTGACGCCGACAAGGTGTGCCGGCAGCTTGCA
+TCATTTCGGTGCGTTCTACAAGAGGTCATGGCGAGCCAATGACTGGATGTGGGGCCGACTCGACGGAGCG
+GGATGGCTCGTCCACGTGCTGCTAGACCCGCGCCGGGTGCGCTGGATCGTCGGGGAGCGCGCCGATACCA
+ACGGGCCGCAGAGCGGTGCACAATGGTTCCTAGGCAAACTCAAAGAACTTGGGGCACCTGACTTTCCGAG
+TCCGGGCTACCCGCTGCCGGCGGTCGGCGGCGGGCCGGCCCAACATCTGACCGAGGACATGCTGCTCGAT
+GAGCTTGGCTTCCTGGACGACCCAGCAAAGCCGCTGCCGGCCAGCATTCCGTGGACCGCGCTGTGGTTGT
+CGCAGGCGTGGCAACAACGAGTCCTCGAAGAGGAATTGGACGGACTGGCCAACACGGTGCTCGACCCACA
+GCCCGGAAAATTGCCGGACTGGAGCCCGACGAGTTCACGAACATGGGCGACCAAGGTATTGGCCGCTCAC
+CCTGGCGACGCCAAATATGCTCTGCTGAACGAAAATCCAATCGCAGGCGAAACATTCGCCAGCGACAAGG
+GCTCACCACTGATGGCGCACACGGTCGCCAAAGCCGCCGCGACTGCGGCCGGAGCGGCCGGCTCGGTCCG
+GCAGCTGCCCAGTGTATTGAAGCCACCACTGATCACGTTGCGGACACTCACCCTCAGTGGATACCGAGTG
+GTCTCGTTGACCAAAGGCATTGCCAGATCGACCATTATCGCCGGCGCGCTGCTACTTGTGCTCGGCGTCG
+CGGCGGCGATCCAGTCGGTGACCGTGTTCGGAGTCACTGGCCTGATCGCGGCCGGGACTGGGGGCTTGCT
+GGTCGTCCTAGGCACTTGGCAGGTCTCCGGCAGGCTCCTTTTTGCACTGCTGTCTTTCTCGGTTGTCGGC
+GCGGTACTCGCGTTGGCGACGCCCGTCGTACGCGAATGGCTGTTCGGCACCCAGCAGCAGCCCGGCTGGG
+TAGGCACTCACGCGTATTGGCTTGGCGCCCAATGGTGGCACCCCCTGGTCGTCGTCGGGCTCATCGCACT
+GGTGGCCATCATGATCGCAGCGGCCAACCCAGGACGACGGTGACGATGCGTGCGGTGATCCGGAATTCAG
+GAACCGAGGCCCGCGGCGCCGTCAGCCGCCGCCAACTGATCGAGCGCTTCGCCGGTGTAGACGGCGAGCC
+GCTGCAGGTGTGGCAGTGTGTCACGGCAGCCGATGAATCCAAAGTTCAGCGTGCCGGCGTAACTCTGCAA
+AGTAACGTTGAGAGCCTGGCTGTGCGCCACCAGGGAGACCGGATAGGACGCCTCCATCCGGCTGCCCCGC
+AGGTAGAGCACGTCCTCGGGCCCCGGCACATTGCTGACACACAGGTTGAACGTGTACGGCCAGGGTGGCT
+TCACCCCACTGAGCGTGCTGGCCAACTGCACCCCGTACGGCGCCATCAACGCGGCGCTATAGGCCAGGAT
+CGCGTCCTTGTCCATGGACCTCAGCTGAGCCTTGGCCGCGCGGGTTGACGCCGTGACCGCCGCCAGCCGC
+TGCACCGGATCGGCAACGTCGGTACCCAACGTCGCCAGGATGGTCGCGACCGCGTTGCCGCCGCCCTCGT
+CGTCCTTGGGTCGCACGTTGACCGGCAAGACCACGATCAGCGACTTGTTGGGCAGCTCACCCAGCTCGTC
+CAGAAAACGTCGTAAGCCGCCTCCGATGATCGCCAACGCGACGTCGTTGATTGTGGCATCATATTGAGCC
+CCAATGGCTTTCAGTCGATCCAGCGGATATTGCTGGGTGGCGAAGCGGCGGTTGCGGCTGATGCGGGTGT
+TGAGTATGCAGTGCGGCGCTTGCACCGAGCCGACGAGGTTGCGGTACTCGTGATCACTGCGCAGCTGGGC
+GTTGACCAGCGCCTTGGTGAGCTCGAACGTCGATCGTCCCGCACCGGCCACCGAACCTAAGACGCTACCG
+ACCCCGCTGACGCCCGCCCAACCCCCGCACCACGTCGCCCAGGCCATCGAGCACGTTACCGGCCCCAGCT
+ATCAAACCGCCGCCGACGGAGTCTTGAGTGTCGGCGGGTGATCGGCCAGGTGTGGGAATGTTGAAGAACA
+ACGGGTGGGTGGTGTCGTGCGGGTCGGTGGACAGGCTGCGGGCCAGCATTTTCTGGCCGGTATAGCCGTC
+TATCAACGAGTGGTGCATCTTGATGTAGATCGCGAACCGGCCACCTTCGAGGCCTTCGATGAAATGCACT
+TCCCACGGCGGACGGCGTAGGTCCAGGGCGTGACTATGCAAGCGGGACACCGGGATCCCGAGTTCACGCT
+CGTCGCCAGGGCTGGCCAGCGCCGACCGGCGCACGTGGTAGTCCAGGTCGAAGTTGTCATCAACGACCCA
+GGACTGCGTGGGATGGTATAGCAGCTCCGGATGGCTCAGTCTTAGGCTCCAGGGTTCGACGACCTCGCTG
+GCCTTGCTTTCGTCGACGAGTTGGCGCAGCAAGTCCGGCGGCGCACCCGAGGGCGGCGTGAACGGCATCA
+ACGCACCAACGTGCATCATCGTGGTCGACGATTCGGAGTACAGGAAAAACATGTCCTGCGGACCCAACCG
+CCGGGCCGTCTGGCTCACGGGCCACTCCTTCGTTGGAGGCATTCTCAGGCCGTCTAGCGCCGCCAGATAA
+CTACCGTAGATGATCGCGGCCGTGCGTTGTACGCCGCATCACATCGCGTGAACTCCGTTGTAGAGCAGCA
+GTAAACCGATCACGACCAGAATGGCCGCGACCATCCCGGCATGGTTCTTCTCCATCCAGTCTTTAAGTCG
+TTCCAGCGAATCGTCGAGTCGGTCACCGGCAGCCACGTAGGCCAATATCGGGATCGCGACCGTGGATGCA
+GCCAACATGGCAAAGAATGCCGTGTAAATCCAGGAACCCGCGGCGCCGTGGCCGCCGCTGCCGATGGCCA
+ATCCGGCCGCCGCGCAAATGATCAGCACCTCGGGTCTCACCACCACCAGCACGGCCCCTACCAATCCGGC
+GCGTGCCGGGGTGAAGCTGGCGAATGCGCGCATCCAGCCCGGCATTTCGGTGTGGCGATGCCGGGTCAGC
+CACCGAAGCACGCCGAACACGATCAGTGCCGACCCGAGGACCACCCGTAGCCAGGATGCCCAGGCCGGCG
+ATGTTGTGCTCAAACCGCCAAGTGCGCCGGAGGCCGCAACAAAGACGGCGGTCACCACGGCCAAGCCCAA
+CAGCCAGCCGCCCAGGAAGGCCAGGCTGCTCGGCCGCGGCTGCGGCGAGTGTACGACCAGTACCGCTGGG
+ATCACCGACAACGGCGAGAGCGCAATGACCAACGCCAGCGGCACGAGCCCGGTGAGCACGGAGACCCAAT
+GACCTGCCACGGGCAGCAATCCTCGCATTGACACCGCCTCGGTGACCACCGAGCGCCCCAATTCGACGAA
+ATTGCGCGCACCCAACCGCCGTTCGGGCTGTTGATAGCCATCGCGAGACGTCGATCGCCGAAACGTACGT
+GCAAAGACGGCGGCTTGGTGAGCCGACGATTAACGACGCTGCCCGGCCAAACGCTCGCCCTGACAGAATT
+GCGACCCGAAGTCCACCGTCACGGTCGACGGCGTGCGGAACTGAGCGGCGAAGGTGAGCTGGGGATCCAC
+CGGCGCCTGATCGAGCCCCAGTCGCTTTGTCTCGAGGTTGATCTCCACGGTATCGGGGGCAGTTCTGCGC
+GCATTGGTGTTCCGGTCCGGCCGCATGTTCGGCTCGGTGCCTCTGCTTTCGCCGGGCTTTCTGATGGCAA
+GTTCATCGGTGTCCTGCTGCGGGCCCAGCTCGGCGAACTCCTTGCCATTGTTGGCGATGGTGTAGGTCAG
+CAGGTAACCGGCAAAGCCCGACGCAAACGAGCCCGATGGCGACGGTGGCAGCGGCTCGGCGAATCGAACT
+ACCAGCCGAAGGACCGCGCCTCGGGGATGCGAGACGTCCACGGAGGCCACGGTAATGGTCGCGGGCGGTG
+TCGGCCCGGGCCGCAACTGGCAACTGAGTCGCTTCGGCAGCTGCGACCAGTCGTCTGGCAGCGGCCTGAT
+CCAGGCGTAGACCGCGACACCTACCATCGTCAGCACTGCCGCGACCGGAACTGTCAACCGCAGGCCGGCC
+GGCATGCCCAGCCAGCGGCTCCGGAGACCGTCGACACGCAGGGCCAGCGGTGATCGTGGTGCAGAGGGGT
+TGGGTCGACGATGTCTGGTCCAGCGGTCACCGTCCCAATATCGTTGCCCCGCTGAACCGTCAGGATCGGT
+ATACCATCCTGCCGGCGGCGAAGTCGCCACGTCGTGCTCCATTCAACAGTCGGTAAGGATCAGCTGCGGT
+GCCGCTCCTCGCGGACTACGGCGGCGCATCGAACAACTCCGGTAGCGAATCGAGGATCTGCACGTGGTCG
+CCGCGCCACGCAAACCCCACAATCGTCAAGATGCCATCTTGGCAGCCGTCACAGCTTTGACGTGTCCGAT
+AGCTCAGCACCACGATGTCGTTTGTGGATGCCGGACCGATCAAATTGGTGAACGGGTAGGCCCTCGGCGT
+TGCGGTTCCGACGAACGTTCCCCGATGAAACATCAGCGCCTGGTCCGGGGAGCTGTTGGTGGCGTCTTGC
+ACCGTCACCAGCACCGCGGACAGGTCCGCGCACGGGTCGTAGTTGCTGTCCTCCGGCGTACTATTCCACG
+GCCTGCCGGTTTTGGAATCGGGGGCAAGCTGGGCCAGCGCGGCGCGCACGGCCGTTGCCTCGTCCGGCCC
+ACACGGGCCAACCTGGGATGCCGGGGAAGTGGGGCGCGCCGGTGCGGACGTCGTTGCCGGCGCCGCCTGG
+TTGGCACCTGGTCGGACCCGATGCATACCGGCGTACGCAACGACCGCGGCAGCCACACAGGCCAGGACCA
+CGAGCGCCACCAGCCAGGCGGTGGGCCAAGACCCGCCTGGGGCGGGCGGAGTGGTATCGACGTCATCGGA
+CGGCTGGTATGCCGGCGCAGGCCAGTCGGGGTCAATCTCGTCAGACACCTAACCCGCTAACCCTCCCGGT
+ACCCGCCCGCTGGCTGTGCGATACTTGCCGAGCTTGCCGAATTGTAGCCAGAACGTGCAGGTAGCGGAAA
+CAAGCGGGCCGTCTCGAGGGGCCCCGCCGGCCGGTGAGGCTGACCACATCCAGCATTCTGATAGCTGGCT
+TCACAGCAATCTGGCCCCATACTAGACGTCATGCAGCAAGCGACGGCACCGCAACCGCTGGCAGCGCGCC
+AGTTGGTTCGACGGCGCCTGGCCGAGGCATATGATGGCGCGTTCTGAGGGCAATCGCCCACGCCATCGCG
+CTGTGCCTCAGCCGTCGCGGATCCGCAAGCGGCTGTCGCGGGGCGTTATGACGCTCGTGTCGGTGGTTGC
+CCTGCTGATGACCGGCGCAGGGTATTGGGTAGCCCACGGCGCGCTGGGCGGCATCACCATTTCGCAGGCC
+CTAACCCCCGAGGATCCCCGTTCCAGCGGCAACAACATGAACATCTTGCTCATCGGGCTGGACTCGCGCA
+AAGACCAGGAAGGCAACGACCTGCCCTGGTCGGTCTTGAAGCAGCTACACGCGGGCGATTCCGACGACGG
+CGGCTACAACACGAACACGCTGATACTTGTGCACGTCGGTGCCGATGGCAAAGTGGTGGCCTTCTCGATC
+CCCCGCGACGACTGGGTGCCCTTCACCGGCGTTCCGGGATACAACCACATCAAGATCAAAGAGGCGTACG
+GGCTGACCAAGCAATACGTGGCAGAACAGCTGGCCAACCAGGGTGTGAGCGACCGGAAAGAGCTCGAGAC
+CCGGGGCCGTGAAGCTGCCCGGGCCGCGACCCTGCGGGCGGTGCGAAGCCTGACCGGCGTCCCGATCGAC
+TACTTCGCCGAGATCAATTTGGCCGGTTTCTACGATTTGGCCCAGACCCTCGGCGGCGTTGATGTGTGCC
+TGAACCATGCCGTCTACGACTCGTACTCCGGAGCCGACTTCCCCGCCGGGCGTCAACGGTTGAATGCCGC
+GCAGGCGCTGGCGTTTGTCCGGCAGCGTCATGGCCTAGACAACGGGGACCTGGACCGCACCCACCGCCAG
+CAAGCATTCCTGTCGTCGGTCATGCGCGAACTTCAGGATTCGGGCACCTTCACCAACCTGGACAGGCTCG
+ACAACCTGATGGCCGTGGCACGCAAAGATGTGGTGCTGTCGGCCGGCTGGGACGAGGACCTGTTCCGCCG
+GATGGGCGACCTGGCGGGCGGTAACGTCGAATTCCGGACGCTGCCCGTGGTGCGCTACGACAACATCGAC
+GGCCAGGATGTCAACATTATCGACCCGACCGCGATCCGGGCCGAGGTAGCGGCGGCATTTGGCAGCGCGC
+CGCCAACGTCGCAGACCGCCGCGGCCGCCAAACCTAACCCATCCACCGTCGTCGATGTGGTCAATGCCGG
+CAGCATCAGCGGACTGGCCAGCCAGGTCTCCGGTGCGCTGCTGAAGCGCGGCTACACCGCGGGTCAGGTG
+CGTGACCGCGAATCCGGCGATCCGTTCACCACCGCCATCGAGTACGGTGCCGGCGCGGAAACGGACGCCC
+AGAACGTGGCAGACCTGCTCGGTATCGACGCCCCCAACCATCCCGATCCCGCCGTCGCGCCCGGACACAT
+CCGTGTGACGGTGGATACCAACTTCTCCCTACCGGCACCCGACGAAGCCACCGCCGCCGCGACGTCCACC
+GAAACCAGCACATATCCGCTGTACGGCGGCGGCACCACCACCGACCCGACACCGGACCAAGGGGCGCCCA
+TCGATGGCGGCGGCGTGCCCTGCGTGAACTAGGTAAGTTATCCGACCACTCCACGCAGCCCGTCGGCGCC
+GAACACCGGCTCCAGCATGGGCGAGAAGTCCGGGCCCCTTCGCAGCATGTGGCCGCCGTCGACGTTGATG
+ACCTGTCCGGTGATCCAACTGGCCGCGTCGCTGAGCAAAAACATTGCTAGGTTCGCGACGTCTTCGACCT
+CACCCACCCGCGGTAATGGCGTGCAGACCCGGTAGTCCGCGCTCAGCTCCGGCGACTCTGTGACGGGCAC
+AACCAGATCTGTACGGATCAGGCCCGGGCGGATGCTGTTGACCCGTACCCACGACGGGCCGAGTTCGTCA
+GCGGCCAGTTTCATCATGTGGTCAACGGCCGACTTGGTGACCCCGTAGGCGCCGAACCAGCGATGGGTGT
+TGCTGGCCGCGATCGAGGAGATGCCGACGAACGAACCGCCGCCGCCGCGTACCAATTCCCGCGCGGCGTG
+CTTGAGCACGTACATGGTGCCATTGACATTGAGGTCCACGGTGCGCCGCCAGGCCTGCGAGTCGATCTGG
+GTGATTGGCCCAATGGTCTGAGACCCGCCCGCGCAATGCACCACACCGTGCAGCCGGCCATGCCACGCGG
+TTGCCGCGTCCACCACACGCAGGGTCTGCTCCTCGTCGGTGATGTCGGCCGGCTCATAGCCGATCGCTCC
+GGTCTTGAGCGCCTCGATGTCTTTGACAGCCGCCGCCAGCTTGTCTGGATTTCGTCCCACGATCATGACG
+GCGGCTCCAGCCGCGACCAACCCGGCGGCCACCCCCTTGCCGATTCCGCTGCCACCTCCGGTGACCAGGT
+AGGTCCGGTCTTGGAAAGAAAGCTGCACTTGAGGCCCCTCACGCCGAAACTGAAACAGGTTCTCGCCATT
+TTGGACCATGCGGCCCGTCACTTGCGCCGAAGGTGAACTCACGGCGAGGTTTCGCGGCGCTCGCGAATTC
+ATGCCCTCAGTTCACGTTCGACGTTCGTGATCAACGGTGCCGCCATCGTGGAGGGATTCCATAGGTTGCG
+GCTTGTTGCCACATTGCGGCCAGTGTGCGCCGCCGGGTGCGCGTCCACGGTAGGCTTCAACCACGAATTA
+TCGGGCAACGATATCGGAGTCGGAGTTGGCAATAACTGGTTCGGCCGCACCGTCATGGCCGCGACTATTG
+CACGCCGAGGGCCCCCCTTCCGTCATTTGTATACGGCTGTTGGTGGGGTTGGTGTTTCTCAGTGAGGGAA
+TCCAGAAATTCATGTATCCAGATCAGCTGGGTCCGGGCCGCTTCGAGCGGATCGGCATCCCCGCCGCCAC
+GTTCTTCGCCGATCTGGACGGGGTGGTCGAGATTGTCTGCGGCACACTGGTCCTCCTCGGCCTGCTGACC
+CGGGTCGCGGCGGTGCCGTTGCTCATCGACATGGTGGGAGCGATCGTGCTGACCAAACTCCGAGCACTGC
+AGCCGGGCGGGTTTCTCGGGGTAGAGGGCTTCTGGGGCATGGCCCACGCTGCCCGGACCGACCTGTCGAT
+GCTGCTCGGATTGATCTTCCTGCTGTGGTCCGGCCCCGGCCGGTGGTCACTAGATAGGCGACTGTCCAAA
+CGCGCCACGGCTTGCGGCGCGAGGTGAACCCGCGACGTAGCGCGACCGATGCACCGGACTCAACGACGAG
+TCAGCGGTGGCGTCGCGAATGAACTGCCCGATCTGACGCAACGAACGGGTCGCTTCGGGCACCAGCGGTG
+TGGCGAGTTGGAAAAGATGAGCCTGACCGGGCCAAACCCGTACCTCGGCACAGACGCCTGCCGCCGCCAG
+CTTGCCGGCGCCCAGCTGCGCGTCGTGCAGCAGCACTTCGGAGCCGGAAACGTGAATAAGTGTCGGCGGC
+AAGCTGGATTCGATATGGTCGAGCGGCTCATAGAGGTCTTCGGGCCTGCCGTCGACCATGTTCTTGGCAG
+CGGCCGCCCTGACCCATGCCGCCAAGGCATCGAATGCCCGCGCCGGAAACATCGCGTCGGTCCCGATGTT
+GGGATGGTCCTGCTTGGGCCCCTTGGCCAGCTGCAGCAACGGAGAGATGGCCACTATTGCCGCCGGTTTC
+TCGTCGTCGCACTGCAGCCGCTGCGCAAGCGCGAGCGCAAGGTAACCACCCGCGGAATCACCGGCCAACA
+CGATCTGTTCCGGCCGGTATCCGCGCGCCCGCAACCATTGGTATGCATCGTGGCAGTCGTCGAGCGCCAT
+CCCCAGCGAATGCTTAGGGATCAGCCGATAGTCGACTATCAACACGGGTGATTCGGCAAATCCTGACAGC
+GCGTTGACGATCCTGCTGTGCGAATTCGGCCCGCACATGACAAACGCGCCGCCGTGCAAATAGAGCACCA
+CCCGCCCAGCGCCGTCGGCCGCCCGCACCCCAGGCGCACGCACCAACTGGGCGGTAGCATTCGGCAAATT
+TATCGTTGTTCGGACCGTGCCCTGCCCGGGGCGCCAAACCCTGCATGCGAAGTCGACGAACCCCAACGGC
+AGAGGCAGGGGCGATAGGTAACTGCCCACAGTCATAAGTGGCTTGATCGTCATGCGCGATGCCAGTGCCG
+CCAACCGACCTGCAACACTAGGGCCGCTTTCGGTGATCTCGATGGGAGCCCCGTCCCAGCACGAATCGGA
+ATTCGAGCATCCCGACGATTGCAGGGGCCGGCGTGCGTAATACGAGGACATTTTCAGCACGTTTCGCCGG
+AATGTGGCCGGTGGTTGGCGTTAGCTGCACGGAAGCGCCTGAGCTGGCCCGCCGTCACCGCCCGATTTAT
+CAATCGCAAATCTCGCACTTCCCGTTTACGTAGTTGCTCCAACCAGACGCAGCCCAATTCGGGCTCCTCC
+CCCCATCAATCATTCGGTGGCGCGAAGTTCACCAGAGTCCCGGACACGCTCACGCGAACTACCTGCATTT
+AGGGGATCACAGGCACCTTGAAATGCATCGGTGTATGACTGGGAGTTTGCTGTACGTCTATTGGTAAGTG
+CGAATTCGCCGCCGGCTACCCGCACCCCGTAGAATCGCAAGCCGATATCGGCTTGGTCACCTGAGGTGTT
+CTATGCGGGAGTTTCAGCGGGCCGCGGTGCGCCTGCACATCCTGCACCACGCTGCCGACAACGAGGTGCA
+CGGCGCGTGGCTGACCCAAGAACTGAGCCGGCACGGCTACCGGGTCAGCCCCGGCACGTTGTACCCGACC
+CTGCACCGGCTCGAAGCCGACGGCCTGCTGGTGTCCGAGCAACGGGTCGTCGACGGCCGCGCGCGCCGCG
+TCTACCGGGCTACCCCGGCTGGCCGGGCAGCACTGACCGAGGATCGCCGGGCACTGGAAGAGCTGGCCCG
+CGAAGTCCTCGGCAGGCAATCGCACACCGCTGGTAACGGGACCTGAACCGCGTCGACGGTACCCATCGCC
+GGGGCCAAACCGTGACGACGTCTGCAGCGCAATGCGGGCTTGGCTTACAGTTATGTAATGTCTACCAAAT
+CTGACCACGGCGAAATCGGTGACGTCGAACCGCTGGCAGACAGCACCGCGAGCCAGGCCAGGCGAGTCGT
+CGCCGCATATGCGAACGACGCCGACGAGTGTCGGATCTTCCTGTCCATGCTCGGTATTGGACCGGCCAAA
+CTCGAGAGCTAATGGCTCCCTCGGGAGGCCAGGAGGCGCAGATTTGCGATTCGGAGACCTTCGGGGACTC
+TGACTTCGTGGTGGTAGCCAATCGACTGCCCGTCGATCTGGAGCGTCTTCCCGACGGCAGCACAACCTGG
+AAACGCAGCCCCGGAGGCTTGGTCACCGCCTTGGAGCCGGTGCTGCGGCGTCGGCGCGGGGCCTGGGTCG
+GCTGGCCCGGCGTTAACGACGACGGGGCCGAACCCGACCTCCACGTGCTGGACGGCCCCATCATCCAAGA
+CGAGCTGGAACTTCATCCGGTACGGCTGAGCACCACGGACATAGCTCAGTACTACGAGGGATTCTCCAAC
+GCCACACTGTGGCCGCTGTACCACGACGTCATCGTCAAGCCGCTCTACCACCGCGAATGGTGGGATCGCT
+ACGTCGACGTCAACCAGCGCTTTGCCGAGGCCGCGTCGCGCGCCGCCGCCCACGGCGCAACCGTGTGGGT
+ACAGGACTACCAGCTGCAGCTGGTACCGAAGATGCTGCGCATGCTGCGGCCCGATCTGACCATCGGTTTC
+TTTTTGCACATCCCGTTCCCGCCGGTAGAGCTGTTTATGCAGATGCCGTGGCGCACCGAGATCATCCAGG
+GCCTACTGGGCGCCGACCTGGTGGGCTTCCATCTTCCGGGCGGTGCCCAGAATTTCCTGATCCTGTCCCG
+GCGTCTGGTCGGCACCGACACTTCCCGCGGAACCGTCGGTGTGCGGTCGCGGTTCGGTGCGGCGGTGCTC
+GGGTCCCGCACCATACGAGTTGGCGCCTTTCCTATCTCGGTTGACTCCGGCGCGCTCGACCACGCTGCCC
+GCGACCGCAACATCAGGCGCCGGGCCCGCGAGATTCGCACCGAACTGGGAAATCCGCGCAAGATCCTGCT
+CGGTGTTGACCGGCTCGACTACACCAAGGGCATCGACGTACGGCTGAAGGCCTTTTCCGAGCTGCTGGCC
+GAGGGCCGCGTCAAACGCGACGACACCGTCCTGGTCCAGCTGGCTACCCCGAGCCGCGAGCGGGTGGAGA
+GCTACCAGACGCTGCGCAACGACATCGAACGCCAGGTCGGCCACATTAACGGCGAGTACGGTGAGGTTGG
+CCATCCGGTAGTGCATTACCTGCATCGACCGGCTCCGCGCGACGAGCTTATCGCTTTCTTCGTGGCCAGC
+GACGTCATGCTGGTCACCCCACTACGCGACGGGATGAACCTGGTGGCCAAGGAGTACGTCGCTTGCCGCA
+GCGATCTTGGCGGTGCCCTGGTGCTCAGCGAATTCACCGGGGCCGCAGCCGAACTCCGGCACGCATACCT
+GGTCAACCCGCACGACCTGGAAGGCGTCAAGGACGGGATAGAGGAAGCGCTCAACCAGACGGAGGAGGCG
+GGCCGGCGGCGAATGCGGTCGCTGCGACGCCAAGTGCTCGCCCACGACGTGGACCGCTGGGCACAGTCGT
+TTCTCGACGCTCTCGCCGGGGCACACCCGAGGGGCCAAGGCTAACGGTCAAGCCGCTCCCGCTCGCGAGC
+AGACGCAGAATCGCCCATTTCGGCACGAAATTGGGCGATTCTGCGTCTGCTCGCGCCCTGGAAGCTGGTG
+CGGCTGCCCAAAGGCTGTGATACTCGATGGAGCGCGAAGGCCCGAAGGAGGGCATGTGAACATCCGTTGC
+GGACTGGCCGCTGGGGCCGTCATCTGCTCGGCCGTCGCACTGGGAATTGCGCTGCACTCCGGTGACCCGG
+CGCGTGCGCTCGGACCGCCGCCGGATGGCAGTTACTCCTTCAACCAGGCCGGAGTGTCCGGGGTGACGTG
+GACGATTACCGCGCTGTGCGATCAGCCGTCGGGAACCCGTAACATGAACGACTATTCTGACCCCATCGTT
+TGGGCGTTCAACTGCGCTCTCAACGTGGTGAGTACGACGCCCCAACAGATCACCCGTACGGACCGGCTGC
+AGAACTTCAGCGGCAGGGCTCGGATGAGTAGCATGCTGTGGACCTTCCAGGTGAATCAGGCAGACGGCGT
+GGCGTGTCCGGACGGCAGCACGGCACCGTCCAGCGAAACCTATGCGTTCAGCGACGAGACGCTGACCGGG
+ACGCACACCACCGTGCATGGCGCCGTGTGTGGCCTGCAGCCAAAGTTGAGCAAACAACCGTTTTCACTGC
+AGCTCATCGGCCCGCCACCCAGCCCGGTCCAGCGTTATCCGTTGTACTGCAACAACATTGCGATGTGCTA
+TTAAATCGGCGTGATGTAGGCGATCAGCCATTTGCCGTCAATCCGCTGGAAATCCACCCGCAGTCGGCTG
+CCGTCGTAGAGCGGCTGTCGCGTCTTGTCGGTCACGGTGCGGTTCAAATAGACCATCACCGATGCGCAAT
+CGCGTTTGGCATCCATGACTCCCACACCGACGACATTGGCCTGGACCACCACTTCACGCTTCTTCGCCTC
+CGGGATGATCTGCGCATTGGCGCTCTTCTGGAACTCCTGGCGATAGTCCGGCGTCAGCAGCGGGTACACC
+GCGGTGAGGCTGCGCTCGACAGTTTGGTAGTCGTAACCGAAGACTTGTGGGATTTCCTGCATGGCCAGCT
+TCGGTAACAGTGCCCGCGCCGACGCTTCGCCCCCGGTCTGCACCCGGTCCCAGTAGAACCAGCCACCGGC
+CGCGGACAAACCCACGATGGTGGCGACCATCAGCGCGTAGGCGACGGAAATCAACCGTCTCATCAGTTGC
+CCCCGTCCGGGTACTTCAGGTCGTAGCCGGTCATCCGGCCGTTCTCGTCCTCATGCACGATGACCCGAAG
+ACGATAGGGCATGGACGGCTTGTTGACGCCGTCGATATCGGCGACCGTCACCCGCACCGACACCAATACC
+GATGCGTTGTCGCTGATTTCGTCAATGCCCTCCAACGCGGCGCCGTTGACGACGGCCTCCGATGTCGCGT
+TGGTGGCCCGGAATAGACCCTTGAGGTTGTCCACGTTGTTGTTGGCGTTCAGCATGCCGCGTAGCGGCCC
+ACTGGTGCCGTTGACGAACCGGTTCACGCTCTCGTCGATGGTGTCCGGCGTGTAGCTGAACATGTTGACC
+ACGGTCTGGGTGGCGGCATCGACAAAACGCTGGTTGCGGGCTTGCCGGGCGTCCGCATCCCGGTTCTGCA
+TAACCAGTGCGGTCACACCCCATGCCAGCGCGGCAATCGCCAATAGGCCTGCCGCCAGCGAAAGCCAGCC
+GACCAGGACGCGGTGTGCCGGCCGGCGTGGCGGCGGTTTGACCGGCCTCAGGGCGGGCTTGGCGGCTTTC
+GCCGGCTTCGATTCGGTCCGCGCCGCGGCCCTCACCGTCGCCGCACCCTGGGCGGGACGGCTCGACTCGC
+CTTCCGCCGGACCCGCGGGGCGGGACGCCTTACGACGAGCGCGCCGCGTCGTCGACTGCTGTCCGCCGGC
+TACACCGGTATCTGCGGCCACTACAGCTGCCTCGGATCGCGCATGAGATCCACCCAATTCTCGGCGCTGG
+ATGCGCCCGTCATCCCGGGCGCGAAGATACCAGTGCCGCCGGCCGGGTCCGCGAAGGCTCCGCTGAGTTG
+GTCATAGATGGTGTAGGCCGGACCGCTGGCCTGCGGTTGGGGGCCAGGCGCCGGCCCGGGCGGAGGCCCG
+GTGCCTTCCGGTGGTGGCGGCGGCGGAATGGTCGCCGGGTATGGCACCTGGGGTGGCTCCGGCGGGTACC
+CGGGCGGCATCCATGACGTGAACGGTGGAGGCGGACCGTTGTCGTTGGGCGGCGGCGCAGGCTGCGCCGG
+CTGGTGCGGCGCCGGCCCGGGGCCGGCCACCTGGCCGGGTGGCGGCGGTCCGACGATGGGCACGCCCGGG
+TCGGGATCCGCGCCCGGCGGGATGTAAGGGAACTTGTTGGGCGGCAGAATGTTTCGCCCATCCGTCACCT
+CGGTGCCGTACGGGATCGGCGGACCGCGCCACGGGTTGGTTCCAACTGGCACATAGCCACGCGGATCCCG
+ACATAACTGCACCGTCGGTGCCCGCTTACCGGGGAATTCCTGGCACGGGTAGTTGCGAGCGCCGCGCACC
+GTGCTCGGGTCGTTCTGCGCGGTCTTGCAGTACATGTCCCGGGGAATCTCGCGTACCGACTCGTCGGCCG
+GCGACCGGACCAGCGGCGGGGGCAAGAACCCGGTCATGCAGGGCGGCGGGTCGTGCAGGTCGATCTTGAA
+GTCCAGCTTGGCGCCCTCGTCCTGGGGTACGCCGCCCGCCGAGGTGATGATCGCGGCGAACAGCGCCGGG
+AAAACCACCAGGAGCTGTTCGATCGACTTGTGATAGATCACGCCCACCCGGCCCAGGTTGGCCAGACTGG
+CCGCCAGCGCGGGAAACGAAGGACGAATCCCGGAGAACGCGGTGTTGGCCTCGTCGATCGCATCCGGGGC
+GCCGGCCAACGTGTCGCGCAGCCGCGGGTCTGCCGCACGGAGCTGCCAGGTGAACCGCGCCAGCCCATCG
+GCGAGTGACTTGATGTCCCCGCCGGCGCGGATCTGGGCTTGCAGGAACGGGCCGGCCTGATCGATCAACT
+GCGAAACCTGTGGATAGTTGGCGTTGGCCTCATCCACCAGCAACCGGGCCGACTCGATCAGCCGGGCCAG
+TTCCGGACCGGCGCCATTGGTCGCGATGAACGCCTCGTGCAGCAGCTCCCGCAGCCGGGTGTCGCCAAGG
+CTGCCGAGCAGCGTCTCGGCCTGACGCAACAGGTCGGCGACGTCTTGCCCGATTCGGGTGTTCTGCCGCT
+GGATCCGGAAGCCGTTGCGCAACTTGGTCGACGACGGGTTCTCCGGCGGCACTAGGTCGATGTACTGCTC
+ACCGATGGCCGAAACGCTGCGTACGGTGGCGGTGACGTTCGACGGAATGGCGGTGCCACTGTTCAGTCGC
+ATGTGCGCGGTAACGCCATTGGGATTTAGCCCCACCGACTCCACCCGCCCGACCGCGACACCGCGGTAGG
+TGACGTTGGCGTTCTTGTACAGGCCACCGCCCGCGACGAAGTCGGCACTCACGCCGTAGGTTCCGATGCC
+GAACGTGGCGGGCAGACGCAGATAAAAGATCGCCATCACGCTCAGGGTGATGACGGTGATCACCGCAAAA
+ATGGACAACTGGATCTTGGCGAGTCGGTCGATCATGTCCGGGCCCCTACTGTCCCGACGCCGTACCGGGT
+GGAATCTTAAATGGGTCGGCCGCTTGCCCGGACAGGTTGGCCAGTTCGCCAATCAGGAAGTCGGGCGGGT
+TGAGGATCTCGTCCATGTGCGCCATGTTCGGGTCGAAGTACGCCGTGGTGAAGAACGTCTCACCAATCCG
+GCGCAGGGTGAGGTCGAAGGTGGTGAACACGTTAAGATAGTCGCCGCGCACCGCCTGCTTGATACCGAAG
+TTGGGAAATGGGAACGTCAGCAACAGCTGCAGCGAGGTGACGAAATCCTTTCGGTCGTCGTTGAGGGCCT
+TGACGATCGAGTAGAGGTCTTTGAGGTCTTCACCGAAATCCACCTTGGTCTCGGCCAGCACGTGCGACGT
+GACCATCGTCAACCTTTTGAGCGCGGCGAACGCGTCGACGATGTGGTCCCGGTTCTGGTTGAGCACGCGA
+ACCGCGTCGGGCAGCGTGTCCAGTGCTCGGCCCAGGTTGTCCTTGTCACGTGCCAGGATCGCGGAGACTC
+GGTTCAGCCCATCCAACGCATCGATGATGTCGTGAACCTGCCGGTTCAGGCCCGCCGTCAACTCCGCGAG
+CCTGGGGACCAGGTTGACGAACTGGGCCTGCCGACCCGCCACCGCCTGGTGGGTCTCGTCAATGATCTCT
+TCCAACGCACCGACGTTACCCTTGTTGACCACCACCCCCAGCGCCGAGAAAACCTCCTCGGTGGTGGGGA
+ATCGGTCGGTGTTGGCCTCGGTGATTCTCGAGCCGTCAACCAACCTCCCGGTCGGCGGGCGGTCCGTCGG
+TGGCGCCAGCTCTACATGTAACGAACCCAGCAGCGAGGTCTGGGAGACCTTCGCCACGGCGTTGGCCGGC
+AGCAACACATTCTTGTCCAGGTCCAGCTTCACGGCGGCATAAAAGGATCCGTCGGGTCGTTGGACCGCGA
+CAATGCCGGCCACGCTGCCGACGGTGACGTCATCGACCATGACCGGTGAGTTCTGCGGCAACGTCGCCAC
+ATCAGCCATTTCGACGGTGACCGAGTAGGCACCTTCACCGTGCCCGGCGGTGCCAGGCAGCGGCAGCGAG
+TTCAGCCCGCCAAACTGACAGCCGGCAAGCAGCGCGCTGCTGGCCGTCAATATGATGGCGCGCAACCAGA
+TTCGGTTCATCCGCCGCCCCCATGCTCGCCCGGTCCTGCCCCCGGCGCCGGCGGGGCCGGTGCCGGACCG
+GGCGCCGGTGGGACGAGTAGGCTCTGCAGATCCGCGGGGTTGCCCACAGGCGCTCCTCCTCCCGCGGGTA
+CCCAAGTCAATTCCGGAACCGGCGTCTCCGACTTGGCCTCGGTGGCCGGGGTGTCGTAGATGATCTGGCC
+CTTGTACGCCGTGATCGTGTTAAGCGGGTGGAACATGATCGGCGGGTAATTCACCGTGAGCCGGCGCAGC
+ACCGGCCCCAGCCGCTCACGGCAGATCTCGGCGCGCCGGTAGTAGTCCGGCGCCGACGGGCCCGCGGCGG
+TATCGAAGGAACCGCCGCAGATGAACTGCACCGGGTTAGCGAAGTTGGGTATCGACAACAGACCGTTGAG
+GGTGCCTTGCGCAGGGTCATAGATGTTGTAGAAGTTGGTGATCCCCGGCCCAGCCACGTGCAGCACTTGC
+TCGATGTTCTCGCTCTGGTCACTCAACGTCTGCGCAAAGTCGTTGAGCTGATTCACCGTTTCGATCAGCG
+TCGAGTTGTTCTCGCGCAAGAACCCCCTGATGTCGGACAGCGCCTGGTTGAGCGTGCCCAGGGTCTGGTC
+CAGATTGGCCGAGCTGTCGGCGAGCACCTGCGACACCGATGCCACGTGGCCGGCGAACTGCACAATCTGC
+TCGTCGCTCTCCGATAGCGCGTCGACCAGTACCTGCAGGTTCTTGACGGTGCCGAAGATGTCGCCGCGCG
+AATCCCCCAGCCGCCCGGCGACCTGCGCAAGCTCGCGCAACGCGTTGTGTAACGAGTCTCCGTTGCCGTC
+AAGGGTGTCCGCGGCCTGGTTGATCGCCGCGCCCAGCGGCCCCTGCAGCTCGCCCGCCGCCGGACTCAGG
+TCGGCGGCCAACCGGGTGAGCCCCTCTTTCACCTCGTCCCATTCCACCGGCACCGCGGTGCGATCCAGAT
+CGATCCGACCGTTGTCGGGCAGTACCGCCCCGCCGGTATACACCGGGGTGAGCTGAATGAAGCGCGCCGC
+CACCAAATTCGGCGACATGATCACGGCCTGCACGTCCACGGGCACCTTGACGTCCTTGGACACCGACATA
+GTGATCTTGACGTCGGACGACCGCGGCTCGATCATGTCGATCTCACCCACCGGGACGCCCAGGACGCGGA
+CCTGGTCACCGGGATAGAGCCCGACAGCAGAGGTGAAGTAGCCCACGATGGTGCGCTTATTACCGGTGGA
+CGAGAGCACGTACACGCCGCCCACCAGCGCGGCCACCAGCGCGATCACCGTGGCGTAGCGCAATCCCCGG
+CTCCCCGTCAACATGGCGACCCGGCCCATCACGGCGACTTCGGTCTGATGATCCAGCGCTCCTGGATAAA
+CCCGCGCAAGTAATCGGCGAGGCTATCCGGCAGCTTGCCCGGCTGAAAGACCAGGTCGAACACGGTCGCC
+ACCAGCGGCCCGGGCAGCACGCTGTAGACGTTGACATTGAATCCGGGTCCGGATCCGACCACCTCCCCCA
+GCGTGGTCGCGTACGTGGGCAGCCGCTTGAGGGCCTCGGTGATATAGTCGCGGCGCTCGTTGAGGTTGGC
+CAGCACCAGGTTGAGCTTGCTCAAAGCCGGGCCGAACTCCTTACGGTTGTCGGCGACAAAGCCGGAAATC
+TGCGCTGCAACATCGTCGATCCCAGAGATCAACGCGCTGAGCGCGGCCCGCCGGGCATCGAGCGCCGCAA
+ACAACTGGTTGCCGTCCTCGACCAGCTTGTTGACCTGTTCGGCGCGTTCGGACAACACCGATGTCACCGA
+CTTGGCGTGCGCCAGCAGGCCTTGCAGCGCTTCGTCGCGACGATTCAGGGCGCGCGACAGCGACGTCAGC
+CCGTCCACGGCACCACGCACCTGCGGGGTGGCGTCATGCAAGGCCTGGGTGAACACGTTCAAGGCCTGCT
+CGAACTGCGGCCTATTCAGGTCGTTGGCGTTGCGGCCCAGATCCTGCAGCACCCCGTTGAGCGTGTAGGG
+CGTGGTGGTCCGGCTCAACGGAATCGTGGTCGACTTGCCGGAGCCAGCCGGACTGACCGCGATGGAGCGC
+TCGCCGAGGATGGTGTCGGTGCGGATCGCGGCCAGGGACTGGTCGCCGACGACGATGCTGCGGTCCACGC
+TGAAGGTGACCTTTGCACTGTTTCCGGCCAGACTCACGGCCGACACCGCGCCCACCTTGAGGCCCGAGAC
+ATAAACCGAGTTACCGGGGGTGATCCCACCGGCGTCGGTGAAATACGCGTCGTAGGTTTTGCCCTGTGGC
+CAGAAAGGCAACCCGCTGTAGCCGAATGCGATCAGGACGACGCAGATCACCAGCACCAGGCCGAAGATGC
+CGGTGCGGAGCGGGTCGCGTTCGTGTTTGCTACTTGGCTTCCTATTTAGCAAAGGCGCACCTCCCCTTGC
+TGGGATCCGGCTGGCCGCCGATCGGCAGCAGGATGTCGCTGCCGGCCGGTCCGTTGATCTTGATCGTCAC
+CGAGCAGAAGTAGATGTTGAAGAATGCTCCGTAACTGCCCAGCGCGGACAGGCGCAGGTAGTCCTCGCCG
+AGCTGCTCGATGTCGTTGTTGACCTCGGCCTTTCGGTTGTCCAGCTCGGTAGCCAGCGGCCGGGCGTTTT
+CCAGGATGCCTTGCAGCGGCCGGCGCGAATTCCGCAACAGTTCCGTAAGATCCGTCGTCGTCGACGCCAG
+CGGCGAAATGGCGCCCGCGATCGGATCCCGGTTCTTGGCCAGGCCGCTGACCAGCTGCTGCAGCTGGTCG
+ACACTGGCCGAAAATTGCGCGCTCTTTGCATCGACGGTCGCCAGCACCGCGTTGAGGTTGGTGATTACCT
+CGCCGATCAGCTGGTCGCGTGCGCCCAGCGCCGCCGAGAAGGCACCGGTGTCGGCGAGCACGTTCGCCAA
+CGGACCACCCTGGCCCTGCAGCAACTCGATGACCGCACTGGTGATGGTGTTGATCTTGTCAGCGTCAAAG
+CCTTTCAGCACCGGCCGTAGCCCACCCAGCAACGCATCGAGATCCAGTGCGGGCTGGGTGTGGGCCACGT
+TGATGGTGCCACCCGGCGGCAGCTTGCGCAGTTCACCCGGACCCGACGTGATCTCCAGGAACCGGTCGCC
+CACCAGGTTTTCGTACCGGATCACCGCACGCGTGGACGAGTACAGCGTGTAGCTGCGGTCGATCGCGAAT
+GCCACGTCGATGCTGTGGTCTGGGTTGAGCTTGACCGCCTTCACTGAACCGACCGGCACACCGGCGATGC
+GAACCTTCTGGCCTGCCTTCAGCCGCGACGCGTCGGTGAAGGTGGCGTGGTAGACGGTTGTGGGACCAAA
+CCGGAAGTCCCCGAAGACCACCACCAGACCGGCGGCCACCAGCAGCATGACCACCGCGAAGACGCTGACC
+TTGATCACCATCGACCGGTGCGAGGGAACGCCCGAGCCCGCCATCAGAAGTCGTCCCGTTCCGCGAACGC
+ACCGTTGAACAGGAACTGCAGCGTCGACGGCGCGTCAACCTGTAACTCGGTGAACGGCTGGTATGGGATC
+AAAGCGTTGTCGGTGACCAGGAACGGCGCGCGGTAGAACGACCCGCCCGTCTGCTTGGTCGGGATATCGG
+GCAACCCTCGGCAGTTCGGACCGCCGGAGGCGTTGACGATCGGCAGGCTCTCCGGATAGGTGTACGACGG
+CGCACCCAACACGAAGCTCGACGAGGTGAACAGCCCAGCCTTACGGACACCGATTAGCGGGGCAAACTCC
+TTGACACCGCGCGCGATGCCCTTGAAAAGGCAGCCGAATACCGGGGAGTAGTCGGAGGTCACTTTGAGCG
+GGGCTCGGAGCCGGTTGATGGCGTCGATGAAATTCTGTTCGGCGGGCGCCAACGTCTCATAGGCGTTATT
+AGACAGACCGATGGTGGCTAGCAGCGTGTCGTTGAGGTTGTCCTTCTGGTCGACGATCGTCTTGTTGATC
+GTCGGCAGGTTATCGAACACGGTGTTCAGGTCCCCGGCGGCGTCAGCATAGACGTTGGCCACCACCGCCG
+CCTTGCGGAAATCCTCCTGAAGGGCGGGTAACTTTGGGTTCGCTTGGCGGGTCAGCGTGTTCAGTCCCGA
+CAACAGCGCACCCAGGTCATCGCCGTGGCCGCGCAGGCCTTCGGACAGCGCGCTCAGCGTCGCGTTCGTT
+TCAAGCGGATCGATCTTGTGTAGCAGGTCGATGAGCGATTGGAACAACGTGTTGACCTCAAGCTGTACCT
+GAGACGCCGCCACGTGCGCATTCGGACTTAGCGGCTTGGGCGACGGCGTCTTTGGCGGAATGAATTCCAC
+CGATTTGGCGCCGAAGATGGTGTTTCCGGCGATGCGCACCGTCGCGTTGGAGGGGATAAAACCCATCTCG
+CCGCTGTCGATGGCCAGCTTGAGCCGTGCTTGGTTGCCGCTGTAGCTGATATCCGTGACCTTGCCTACCT
+GGATGCCACGGTATTTGACCTTGGCGCCCTTCTCCATAACCAGGCCGGCCCTCGGCGACGATACCGTGAC
+GGTGTCCGTAGACGTGAAAGCCGCCGTATACGAAAGATAAGTCAGCACTGCGGATCCCACCATCAGCCCG
+GCCAGCAGCGCCGCTGCCACCCTGACACTGGTGCGTCGAGATCCGCCGCCGGACATGTTTCCTTTCTGAA
+GGTTTTTACCCCGAGAGGTTGAAGTTACCGGACGCGCCGTAGACGGCGAGCGAGATGAACAAGGTGATGA
+CAACAACCACGATCAGCGAGGTCCGTACGGCCTGCCCGACCGCGACCCCGACCCCAACCGACCCGCCGCT
+GGCGTTGTAGCCGTAGTAGGTATGCACCAGCATTACCGCGATCGACATAGCGATGGCTTGCATAAACGAC
+CACAACAGGTCGGAAGGGATGAGGAAGGTGTTGAAGTAATGGTCATAAAGGCCCGCGGACTGCCCATTGA
+CGAACACCGTGGTGAAACGAGCGGCGAAGAACGCGGCCAGCACCGACAACGAATACAACGGAATGATCGC
+CACCAGGCCGGCGATCAGCCGGGTTGACACCAAATAGGACACCGAGTGCACCGCCATGCATTCGACGGCG
+TCGATCTCCTCAGAGACCCGCATGGCACCCAGCTGCGCGGTGGCTCCGGCCCCGATGGTGGCCGCCAGCG
+CGATACCCGCGATCACCGGCGCGACAACGCGGACGTTCAAAAACGCCGACAGGAACCCGGTCAACGCCTC
+GATACCGATGTCGCCCAGCGACGAATACCCCTGCACGGCGATCACGCCACCGGACGCCAGGGTCAAAAAG
+GCCGCCACCCCGACCGTGCCGCCGATCATGACCAGCGCTCCGGCGCCCAGCGTCATCTCGGCGACCAGCC
+GGACCGTCTCCTTCCGGTAGCGGGTGATGGCGTTGGGCACATAGCGCATGGTTTCGCCGTAGAACAGCGC
+CTGCTCACCGAAGTTGTCGACCGGCCGCTGCAGCCGCGAAAAGAAACGGCGAAACCGGATAGTGACGTCG
+TAGCTCATCGCTTCATCACCATCGCTCGCTCACCGTCGTTTGTTACTGCGCCGAGATTCGCACACCTATA
+GCGGTCATGACTACGTTGATCACGAAAAGGCAGATGAACGCGTAGACGACGGTCTCGTTGACCGCATTGC
+CCACCCCCTTGGGCCCACCCTTGACCGTCAGACCGCGGTAACACCCGACCAGCCCGGCCATGACCCCGAA
+CAGTAGCGCCTTGATCTCCGCCAGTATCAATTCGCGCAGTCCGGTGAGCACGGTCAGACCGTTGATAAAC
+GCACCCGGGTTGACGCCCTGAAGAAAGACCGAGAACGCGTAGCCGCCGGACAGGCCAATGGCGCACACCA
+AGCCGTTGAGCAGCAGCGCAACCAATGTGGACGCCAACACCCTGGGGACCACGAGCCGTTGAATTGGGTC
+GATGCCCAGCACCCGCATCGCGTCGATTTCCTCACGGATGGTGCGAGCGCCCAGGTCGGCGCAGATCGCC
+GTGGCGCCAGCACCTGCCACCACCAGCACAGTCACGACCGGGCCCAGCTGGGTGATGGTGCCGAACGCCG
+TTCCGGCGCCGGACAAGTCGGCGGCCCCAATTTCACGCAACAGAATGTTGAGGGTGAACGCCACCAGGAC
+CGTGAACGGAATGGACACCAGCAACGTCGGGACTAGCGAAACGCGGGCCACCATCCAGGTCTGGTCCAAA
+AACTCGCGGAACTGGAACGGCCGCCGGAAAGCGGCACGCGCGGTGTCCATCGACATTTCGAAGAACCCGC
+CGACGGCCCGGGCCGGAACCGCAAGTTGTTGGATCAACTGGGGTCCCCCCGTCTACTGCTCGCGGCGAAG
+TCTGTGAGTCTCCTGAACGCGCTTAGGGCCCGCACGTTGCACGGTGTGAGCCGGCCCATCCTAACCCAGA
+ACGAGTTTGCGGTGTCAACGAACCGCACACCGGATCAACTGGGTCAATTTCGCTGGTTAAGCCCTATGTT
+GGCGTGGTGATTCGGACACCGATTCCAATAATCGGCCGCCTATATCCACGGGTCACTGACGCATCAGATC
+GGTCGCCGAAAAGCTCTGTTCCGGATCCCGACCAGCAAAGTAGTCCCGCAGCGTCGCGGTGAGCTCGGTG
+GGATCCCAGGACGTGCCGTCCGCGCTGAACCGGCGCTCCATGTGCGGCGGTGACACCAGCGTCACCTGCG
+GACCGTAGACGATGAACACCTGACCGTTGACTTCCGCGGCAGCCGGGGACGCCAGAAACTGGACCAGGCT
+TACCACATGCTGCGGCGACAGCGGGTCGATCTGGCCCGCTTCGACATCGGGTGCGGCGCCGAAGACATCG
+GCCGTCATCGCGGTGCGCGCCCGCGGACAAATCACATTGGCGCAAACGCCGTAGCGCCCGAGCGCCCGCG
+CCGCCGACAGGGTTAGCGCGGTGATGCCAGCCTTGGCGGCGGCGTAATTGGCCTGCCCCACCGGGCCCAC
+CAGACCCGCCTCCGACGAGGTGTTGACGAGCCGGCCGAAGACCGATCCCCCTTCGGCATCCTTGGCTTTG
+TCCCGCCAGTAGGCAGCGGCGTTGCGGGTGAGCAGAAAATGGCCGCGCAGGTGCACCGCGATCACGGCGT
+CCCACTCCTCGTCGGACATGTTGAACAGCATCCGGTCGCGGGTGATGCCGGCATTGTTCACCACGATGTC
+CAGTCCGCCCAGCCCGACGGCGCTGGCGAGCAGTTCGTCGGCCGTCGCGCGCTGGCTGATATCACCGGCT
+ACCGCGACGGCCTTAGCACCAGCATCGGCAGCGGCGGCGCCGATCTCGTCGACGACGTCGGAAGCATCCA
+GGGCGGAAGCAACATCGTTGACGACGACGGTGGCGCCCAACCGGGCCAGGCCGAGCGCTTCGGCCCGACC
+CAAACCCGCGGCCGCGCCGGTGACCACCGCCACCTTTCCGGACAGATCGGTCGTGTTCGTGGTACGCGGC
+GAGCGATTGGACTCAGTCAATTTCAATTTATGAATACCTCTAGTTCCGTCCTACTCACCACGCGACAACG
+CCGCACGCGGGCATTCCGCGATGGCCTGCTCGGCCAGATCCTCCTGATCAACCGGGATCGGATCGGTCTT
+GACCACGGCATAGTCCTCGTCGTCCAGGTCGAAGATATCCGGTGCGATTCCCAAGCACACCGCGTTGCCT
+TCACATCGGTCTCGGTCCACGATCACCCGCACGGCACCCTCCTTACCCTGACCATCCCCCCGGTCGCTGC
+TAGTTCCACCATAAGGCCCTGCTACATCCGAGGAAACGGTCGCTGGATTCAGAGACTAGAACGTGTTACA
+ACCGGGAAGACGGCCGGGTTGCCGTTGGCGTTGGTTGTCGACAGCTAGTGGACGGCTGCTGACGGCCAGT
+GATAAAGACGCGATCATTCAATCGGAGGCAGCTGAGATGCGCATCAGTTACACCCCGCAGCAGGAGGAGC
+TGCGCCGCGAGCTGCGCTCGTACTTTGCCACGTTGATGACGCCGGAACGCCGGGAGGCGCTGAGCTCGGT
+CCAGGGTGAATACGGCGTCGGCAATGTCTACCGGGAGACGATCGCGCAAATGGGCCGCGACGGGTGGCTT
+GCGCTGGGCTGGCCCAAGGAATACGGCGGCCAGGGCCGCTCGGCGATGGACCAGCTGATCTTCACCGATG
+AAGCCGCCATCGCCGGTGCACCGGTGCCGTTCCTGACCATCAACAGCGTGGCGCCGACGATCATGGCCTA
+CGGAACCGACGAGCAGAAGAGGTTTTTCCTGCCCCGGATCGCCGCCGGGGACCTGCACTTCTCGATCGGC
+TACTCCGAGCCCGGCGCCGGCACCGACCTGGCCAACCTGCGCACCACCGCGGTTCGCGACGGCGATGACT
+ATGTGGTCAACGGCCAGAAGATGTGGACCAGCCTGATTCAGTACGCCGACTACGTCTGGTTAGCGGTACG
+CACCAACCCGGAGTCTTCTGGGGCCAAAAAACACCGTGGCATATCGGTGTTAATCGTGCCGACGACCGCT
+GAGGGCTTCTCCTGGACTCCAGTGCACACCATGGCCGGTCCGGACACCAGCGCCACCTACTACTCCGACG
+TGCGGGTACCGGTGGCCAACCGGGTCGGTGAGGAAAACGCCGGCTGGAAGCTGGTGACCAACCAGCTCAA
+CCACGAGCGGGTCGCCCTGGTGTCGCCGGCACCGATTTTCGGATGCCTGCGCGAGGTCCGCGAATGGGCA
+CAAAACACCAAGGACGCCGGCGGCACCAGGCTGATCGACTCGGAGTGGGTGCAGCTCAACCTGGCCCGGG
+TACACGCCAAGGCCGAAGTCCTCAAGCTGATCAACTGGGAGCTGGCTTCCTCGCAAAGTGGGCCGAAGGA
+CGCTGGACCGTCACCGGCCGATGCGTCGGCGGCCAAGGTGTTCGGTACCGAGCTGGCCACCGAGGCCTAC
+CGGCTGCTGATGGAGGTGTTGGGCACTGCGGCGACCCTGCGCCAGAATTCGCCAGGCGCGTTGCTGCGCG
+GCCGCGTCGAACGGATGCACCGGGCGTGCCTGATCCTGACGTTCGGCGGCGGCACCAACGAAGTCCAGCG
+CGACATCATCGGCATGGTCGCGCTGGGACTGCCGCGAGCCAACCGCTGAGCGGACCTGAGAGGACAAGAC
+GTCATGGATTTCACGACAACCGAAGCCGCCCAGGATCTTGGTGGTCTGGTCGACACCATCGTGGACGCGG
+TGTGCACGCCGGAGCATCAACGTGAGCTGGACAAGCTCGAGCAGCGGTTCGACCGCGAGCTGTGGCGCAA
+GCTGATAGACGCCGGCATCCTGTCCAGTGCGGCGCCGGAGTCGCTGGGCGGCGATGGCTTCGGCGTGCTC
+GAGCAGGTTGCGGTGCTGGTGGCGTTGGGGCATCAACTGGCCGCGGTGCCGTACCTGGAGTCGGTGGTGC
+TCGCCGCCGGCGCCCTGGCCCGGTTCGGCTCGCCGGAACTGCAGCAGGGCTGGGGGGTGTCGGCGGTCTC
+CGGCGATCGGATCCTCACCGTCGCCCTCGACGGTGAGATGGGCGAGGGTCCGGTGCAGGCCGCCGGCACC
+GGACATGGCTACCGCCTCACCGGCACACGCACCCAGGTCGGGTACGGCCCGGTGGCCGACGCATTTCTGG
+TACCCGCCGAAACCGATTCCGGTGCAGCCGTTTTCCTGGTTGCCGCCGGCGACCCAGGGGTTGCGGTGAC
+CGCACTGGCCACCACCGGACTGGGCAGCGTCGGACACCTCGAGCTAAACGGGGCCAAAGTGGACGCCGCC
+CGCAGGGTCGGCGGAACCGATGTCGTGGTTTGGCTCGGCACGCTTTCCACCCTGAGCCGCACCGCTTTTC
+AACTCGGTGTGCTCGAGCGCGGACTGCAAATGACGGCCGAATATGCGCGCACCCGTGAACAATTCGACCG
+CCCGATCGGCAGCTTCCAGGCGGTGGGGCAACGGTTGGCTGACGGCTACATCGACGTCAAGGGATTGCGA
+CTGACGCTTACCCAGGCGGCCTGGCGGGTGGCCGAAGATTCCCTGGCAAGCCGGGAGTGCCCCCAGCCAG
+CCGACATCGACGTCGCCACCGCGGGGTTCTGGGCCGCCGAAGCCGGGCATCGGGTGGCGCATACCATCGT
+GCATGTGCATGGCGGCGTCGGCGTCGACACCGATCATCCCGTACACCGGTATTTCCTGGCCGCCAAGCAG
+ACCGAGTTCGCGTTGGGCGGCGCCACCGGTCAGCTCCGCCGAATCGGCCGTGAACTGGCGGAAACCCCTG
+CCTAGCCCTGCCTAGCCCGGCGACGATGCGGTCCGCGCAGCGGACCGAGAAGGAGCGGGCGAATCGAACC
+CACCGATGACTCCCACTCACCCGACCGTCACCGAACTTCTGCTGCCGCTATCCGAAATCGACGATCGGGG
+CGTCTATTTCGAGGACTCGTTCACCAGTTGGCGCGACCACATCCGGCACGGTGCCGCAATCGCCGCAGCG
+CTGCGGGAACGCCTGGACCCGGCGCGGCCGCCACACGTCGGTGTGTTACTGCAGAACACGCCGTTCTTCT
+CGGCGACACTGGTGGCCGGCGCGCTGTCGGGGATCGTCCCGGTGGGCCTCAACCCGGTGCGCCGCGGCGC
+GGCACTGGCCGGCGACATCGCTAAAGCCGACTGCCAGTTGGTGCTCACCGGCTCGGGATCGGCGGAGGTA
+CCGGCCGATGTCGAGCACATCAATGTCGACTCCCCCGAATGGACCGACGAGGTGGCCGCACACCGGGATA
+CCGAGGTGCGTTTTCGATCCGCGGATCTCGCAGACCTTTTCATGCTGATCTTCACCTCGGGCACCAGCGG
+CGACCCGAAGGCGGTGAAGTGCAGCCACCGCAAGGTTGCGATCGCCGGCGTGACGATCACGCAGCGCTTC
+AGTCTGGGCCGCGACGACGTCTGCTACGTCTCGATGCCGTTGTTCCATTCCAACGCGGTGCTGGTCGGCT
+GGGCGGTGGCTGCGGCCTGCCAAGGCTCAATGGCGTTGCGACGCAAATTTTCGGCGTCGCAGTTCCTGGC
+CGACGTCCGCCGTTATGGCGCCACTTACGCCAACTACGTGGGCAAGCCTCTTTCGTATGTGCTTGCGACA
+CCGGAGCTTCCCGACGACGCGGACAACCCGCTGCGGGCGGTGTACGGCAACGAGGGAGTACCCGGTGACA
+TCGACCGTTTCGGGCGCAGGTTCGGCTGCGTTGTCATGGACGGCTTCGGCTCGACTGAAGGCGGGGTGGC
+GATCACGCGGACACTCGACACCCCGGCGGGCGCCCTGGGCCCACTGCCGGGGGGAATCCAAATCGTCGAC
+CCCGACACCGGCGAACCGTGCCCGACAGGAGTGGTCGGCGAACTGGTCAACACCGCCGGGCCGGGCGGTT
+TCGAAGGCTATTACAACGACGAGGCCGCCGAGGCCGAGCGGATGGCCGGCGGCGTCTACCACAGTGGCGA
+CCTCGCCTATCGCGACGACGCCGGCTACGCCTATTTCGCCGGTCGGCTCGGCGACTGGATGCGAGTCGAC
+GGTGAAAATCTAGGCACCGCACCGATCGAGCGGGTGCTGATGCGCTACCCGGACGCCACCGAGGTCGCTG
+TGTATCCGGTACCCGATCCGGTGGTGGGTGATCAGGTGATGGCCGCGTTAGTGTTGGCGCCCGGCACCAA
+ATTCGATGCCGACAAGTTCCGGGCGTTTCTGACCGAGCAGCCCGACCTGGGGCACAAGCAGTGGCCGTCG
+TATGTGCGGGTCAGCGCGGGGCTGCCGCGCACCATGACCTTCAAGGTGATCAAGCGCCAGTTGTCGGCCG
+AAGGTGTCGCCTGCGCCGATCCGGTGTGGCCGATTCGCCGGTAGCCTCACGGCGCGCCACCATGCTCACC
+GGGATCTGGCCGGATGGTGGACCCGAATAATCGGGTAGAACCGCCGAATGAGCTGCCCGGATCGCGATAC
+GATCCATTCCTAGCAATTGCACCGATGATGCACGGCCGCGGCCGGGTTCGGCTTGGGCTGGTGCGAGGTA
+CCGGATGTCGTTTGTGTTGGTTTCGCCGGAGACCGTGGCGGCGGTGGCCACGGATCTCAAGCGCATCGGC
+GCCTCGCTGGCCCACGAAAACGCGTCGGCGGCCGCTTCGACGACGGCGGTGGTCTCCGCGGCCGCCGACG
+AGGTATCGACGGCGGTCGCCGCTCTGTTCTCCCAACACGCCCAGGGCTACCAAGCGGCGGCCGCTCAGGT
+AGCAGCGTTTCATAGCCGGTTTGTGCAAGCCCTGACGGCCGGTGCCGGGGCGTACGCATTTGCCGAGGCG
+GCCAACGCGTCGCCGCTACAGTCAGCCATGGGTGCGGTAAGCGCGTCTGCGCAGACGCTGTTGTCGCGCC
+CGTTGATCGGCAATGGCGCCAATGCGACGACGCCGGGCGGTAACGGCGGCGACGGCGGATGGCTATTCGG
+CAGCGGCGGCAACGGCGCGCCCGGCGCGGCGGGCCAGTCCGGCGGTAACGGCGGGTCAGCCGGACTGTGG
+GGTAACGGCGGCGCGGGTGGCGCCGGCGGCAGCGGCGGCGCCGCCGGCGGCAACGGCGGTAACGGCGGGT
+GGCTGTTCGGCGCCGGCGGCACCGGCGGTATCGGCGGCACCGGTGCTCCCGGCGCCATGGGCGGCACCGG
+CGGCAACGGCGGCAACGGCGCGCTGCTGATCGGCGGCGGCGGCCTCGGCGGCGCCGGCGGCATGGGTGGC
+ACCGGCGGCGGCACCGGCGGCACCGGCGGCAACGGCGGCAACGGCGCGCTGCTGATCGGCGCTGGTGGTG
+TCGGAGGTGCTGGCGGGATCGGTGGCCAGGGTACCGGCGCCGGCGGTGCCGCCGGCGCCGGCGGCACCGG
+GGGCAACGGCGGCGCCGGGGGGTTGTTCATGAACGGCGGCGACGGCGGCGCCGGCGGTCAAGGCGGCGAC
+GGTGCGGCCGGCGACGCGGCTGCCAGCGCCGGCGGCACCGGCGGCAAAGGCGGCCAAGGCGGCGACGGCG
+GCACCGGAGGGGCCGGCGGCGCAGGCCCAGTGCTGTTCGGCCACGGCGGCGCCGGCGGCATGGGCGGCCA
+AGGCGGCACCGGTGGAATGGGCGGCGCCGGCGGAGACGGCACCACCGTCATCGCGGCCGGTACCGGGGGG
+GAGGGCGGCACCGGCGGCACCGGCGGTACCGGCGGCAACGGCGCTGACGCCGCTGCTGTGGTGGGCTTCG
+GCGCGAACGGCGACCCTGGCTTCGCTGGCGGCAAAGGCGGTAACGGCGGAATAGGTGGGGCCGCGGTGAC
+AGGCGGGGTCGCCGGCGACGGCGGCACCGGCGGCAAAGGTGGCACCGGCGGTGCCGGCGGCGCCGGCAAC
+GACGCCGGCAGCACCGGCAATCCCGGCGGTAAGGGCGGCGACGGCGGGATCGGCGGTGCCGGCGGGGCCG
+GCGGCGCGGCCGGCACCGGCAACGGCGGCCATGCCGGCAACACAGGTGACGGCGGCGACGGCGGGACCGG
+CGGTAACGGCGGCAACGGCACCGGAGGCGTGAACGGCGCCGACAACACCCTCAACCCCGACACCCCCGGC
+GGCGCCGGGGAGCCCGGCGGGGCCGGCGGGGCCGGCGGGGCCGGCGGGGCCGCCGGCGGCCCGGGCGGTA
+CCGGCGGTACCGGCGGCAACGGCGGCAATGCCGGCAACAACAGCACCAATGCCCCAGTCGGTGGCGAAGG
+CGGCGCCGGCGGCGACGGCGGCGCCGGCGGCGCAGGCGGGGCCGCCAACGGCGGCACCGCGGGCAGCCAG
+GGCACTGGGGGCGTCGGCGGCGACGGCGGCGCGGGCGGCAACGGCGGCGGCGGCAAGGCTGGCACCGGCA
+ACAGCGGCAACTTTGGGGTGGACGGCGAAGCCGGCTTCAGCGGCGGCGCCGGTGGCAACGGCGGCGTAGG
+CGGGGCCGCCGGCGCCAATGGCGGAACCGGCGGCAGCGGTGGTAATGGCGGTGACGGCGGTGCGGGAGGC
+ATTGGCGGGGCCGGCGGCAACGGCATACCGGGCACTGGCACAGAGCCTGCCGGGGGCACCGGCGCCAAAG
+GTGGAGACGGCGGCGACGGTGGCGCCGGCGGCGCAGGCGGCAATGCCGGCGGGGCCGGCGGTAACGGCGG
+GGCCGGCGGCCAGGGCGGCAATGCCGGCCAGGGTGGCGCCGGCGGTGCGGGCGGCAACGCCGTGATTCCC
+GGCGACGGCGTCGGGAAGGCGCCGCACGGCGGCGCGGGCGGCAGCGGCGGAGACGGCGGCAAAGGCGGCC
+AGGGCGGTAGTGGCGGCACCGGCGGATCCGGTGCCCCGATCGGTGGCGGCGCCGGAGGCACCGGAGGGTC
+CGGCGGACACGCCGGCAAGGGTGGCGCCGGCGGCATCGGCGCACAGGGCACCACCATCACCGTGCCCGGG
+AACGGCGGCAACGCCGGCGACGGCGGCAACGGCGGTGGCGGCGGCGCGGGCGGCACCGGCGGCGACGGCG
+CCACCGGCACGCCAGCCGGCAACGGCGGCAACGGCGGCAACGCCGGCGACGGCGGCAACGGCGGCTCCGG
+CGACTTCGGTGGCAATACCACCAGCGGCGCCTCCGGCAGCGGCGGCAACGGCGGCAACGCCGGCACCGCG
+GGTAGCGGCGGTGCGGGCGGAACCGGCGGCACCGGCCTTAGCGGCGGCAACGGCGGCAACGGCGGTGACG
+GCGGTAACGGCGCCCACGGCACCGTCGGCGCCCAGTTCGTCCCGGCCACCAGCTTGCCCACACCCAACGG
+CGGGGCCGGTGGCAACGGTGGCACCGGAAGCAACGGCGGCGCGCCCGGCCCCGCCGGGGCGCCCGGCCCC
+ACTACCGGCGGTAACGCTGGCAGCCAGGGCATCGGCGGCGACGGGGGCAACGGCGGCGACGGCGGTAAAG
+GCGGTGACGGCGCCGACGCTGTCAACGTCGTATTCATGCCGACTGAGCCACAGGCCGCGACCGGCACTGC
+CGGCAGCGCCGGTGACCCCACCGGCGGTAACGGAGGGCCCGGCACTCCCGGCAGCCCCATGGTTGCCCCG
+CCCCCGCCAACGCCAATCACTCAAGTCCAACAGGGCGGTGACGGTGGCGCCGGGGGCACCGGATCCACCA
+ACGCCAACGACGGCACAGCCACCGGCGGAAAGGGCGGAGAAGGCGGAGTCGGCAGCATTCTCGGCGGGCC
+CGGCGGCAACGGCGGAACTGGCGGCAACGCCTCGGCAACCGGCACCAACGGGGTGGCCAACGCCGGGAAT
+GGCGGCAAGGGTGGCGACGGCGGCCAGTTTGGGGCCGGCGGCAACGGTGGTGCCGGCGGCAGCGTAACCG
+ACGGATCCGCCGGCAGCACCGCAGGCAACGGCGGCAACGGCGGCAACGCAACCAACGGCACCATCGCAGG
+CCAACCCGCCGGCGGCAACGGCTCGGCCGGCGGGAAAGGCGGCGACGGCGGCAACATCGCCGCCGGTGCC
+ACCGGCACCGCCGGCAACGGCGGGAACGGCGGCAACGGCAACGACGGCGCCGTCAACGCCGGCACCGGCG
+GCTCCGGCGGGAACGGCGGTAACGCCGGTGGCGGCGGCGCCAATGGCGGCGACGGCGGCGCCGGCGGCGC
+CGGCGGGGCCGGCGGGCGTGGCGGCAAGGGCATCGACGGCGGGTTCGGCGGTGACGGCGGCAACGGCGGC
+AGCAACAACGGCACCGGCGCCGGTGGCAACGGCGGCAACGGCGGCACCGGCGGGGTCGGCTCGGTTGGCG
+CGGCTGGTGGCGATGGCGGCAACGGCGGCACCGGAGGCTTCGCCGGTTTCGGCGGCACCGCAGGCAATGG
+CGGTTCCGGCGGCACGGGCGGGGCCGGCGGCGACGGCGGCACCGGCGGGGGCGGCGGCAACGGCGGCACC
+GGCGTTATCGCCGGCGGCGGGGGGACCGGCGGCAACGGCGGCGCCAGCGGGGCCGGCGGCGCCGGCGGCA
+CGGGCGGGTTCGCCGGCAACGGCAATGCCGGCGGCAATGGCGGCACCGGCGGCGCGAGCGAGGACGGCGA
+CAACGGCAACGCTGGCAGCGGCGCCACCGGCGGTACCGGCGGCAACGGCGGCACCGGCGGCGACGGCGGC
+GCTGCCGGGCTGGGCGGCGTCGCGTGAGGTTGACCGGCGATCACCGTAGCCAGCACGGCCCGTGACACCG
+GTCCGGCACGCCACCCTCGTCGTTCAGGTGGTGTCGCCACTCGCGCTACACAACGCTTCACGGCACTCGT
+CGAGACTTATGCTCGAGTTCTGATACGTGGAGCAACTGTTTTGGCGTTCGACCCGTATTGCGCAGGTGGC
+GGTACTGGAAAACGTAGACGTGTTGGGCGGGTGACGAATAAGATCCTGGCCTAACTACTGCGTCAATTAT
+GCCGCGGTGGCCGCGCCGTCCGGTTGGGAGTTCGCCCATGTCGTTCGTGTTGATCGCACCGGAATTCGTG
+ACAGCAGCCGCGGGGGATCTGACGAATCTGGGTTCGTCGATTAGCGCGGCCAACGCGTCGGCAGCCAGTG
+CGACCACGCAGGTGCTGGCTGCGGGCGCCGATGAGGTGTCTGCCCGTATTGCGGCGCTGTTCGGCGGGTT
+TGGCCTGGAGTACCAGGCGATTAGTGCGCAGGTGGCGGCCTACCACCAGCGGTTTGTGCAGGCCTTGAGT
+ACCGGCGCGGGCGCATATGCCTCGGCCGAGGCCGCCGCCGCTGAGCAGATCGTGCTGGGCGTGATCAATG
+CGCCCACCCAGGCGCTGCTGGGGCGCCCGTTGATCGGTGACGGCGCCAATGCGACGACTCCCGGCGGGGC
+CGGCGGGGCCGGCGGTCTGCTGTTCGGCAACGGCGGGGCCGGGGCAGCCGGGGCGCCCGGCCAGGCCGGC
+GGGCCTGGCGGGCCCGCCGGATTGTGGGGCAACGGCGGGCCCGGCGGGGCCGGCGGCAGCGGTGGGGGCA
+CCGGCGGTGCCGGCGGCGCCGGTGGGTGGCTGTTCGGGGTTGGCGGCGCCGGCGGTGTCGGTGGGGCCGG
+TGGCGGCACCGGCGGGGCGGGCGGGCCCGGTGGTTTGATCTGGGGCGGCGGCGGGGCCGGCGGTGTCGGT
+GGGGCCGGTGGCGGCACCGGCGGGGCCGGCGGCCGCGCCGAGCTGCTGTTCGGCGCCGGCGGTGCGGGCG
+GCGCGGGTGGGGCGGGCACCGACGGCGGGCCCGGTGCTACCGGCGGGACCGGCGGACACGGCGGAGTCGG
+CGGCGACGGCGGATGGCTGGCACCCGGCGGGGCCGGCGGGGCCGGCGGGCAAGGCGGGGCAGGTGGTGCC
+GGCAGCGATGGTGGCGCGTTGGGTGGTACCGGCGGGACGGGCGGTACCGGCGGCGCCGGTGGCGCCGGCG
+GTCGCGGCGCACTGCTGCTGGGCGCTGGCGGACAGGGCGGCCTCGGCGGCGCCGGCGGACAAGGCGGCAC
+CGGCGGGGCCGGCGGAGATGGCGTTCTGGGGGGTGTCGGTGGCACTGGTGGTAAGGGCGGTGTCGGCGGC
+GTGGCTGGCCTCGGCGGGGCCGGTGGTGCCGCGGGCCAGCTCTTCAGCGCCGGAGGCGCGGCGGGTGCCG
+TTGGGGTTGGCGGCACCGGCGGCCAAGGCGGCGCCGGCGGCATGGGTGGCTCCGGTGCTGATAATGCCAG
+CGGGATTGGCGCCGACGGCGGCGCGGGTGGGACTGGCGGTAACGCCGGCGCCGGCGGGGCCGGCGGGGCC
+GCCGGCACCGGAGGAACCGGCGGGGTTGTCGGCGCCGCGGGCAAGGCCGGTATCGGCGGCACCGGCGGCC
+AAGGCGGCGCCGGCGGCGCGGGCAGCGCCGGCACGGATGCGACCGCTACCGGTGCCACCGGCGGCACCGG
+GTTTTCCGGTGGAGCCGGCGGGGCCGGCGGGGCCGGCGGCAACACCGGGGTTGGCGGCACCAACGGCTCC
+GGCGGGCAAGGCGGCACCGGCGGCGCGGGCGGCGCCGGTGGTGCTGGCGGTGTCGGCGCCGACAACCCCA
+CCGGCATCGGCGGCGCCGGCGGCACCGGCGGCGCCGGCGGCACCGGCGGCACCGGCGGAGCGGCCGGAGC
+CGGCGGGGCCGGCGGAGCGGTTGGCACCGGTGGTACCGGTGGCGTTGTAGGCGACGTTGGTAACGCAGGG
+ATCGGCGGCACCGGCGGGAAAGGCGGCGCCGGCGGCACCGGGTTCGCCGGTGGCGCCGGCGGGGCCGGCG
+GGCAGGGCGGTAGCAGCGGTGCCGGCGGCACCAACGGCTCTGGTGGCGCTGGCGGCACCGGCGGACAAGG
+CGGCGCCGGGGGCGCTGGCGGGGCCGGCGCCGATAACCCCACCGGCATCGGCGGCGCCGGCGGCACCGGC
+GGCACCGGCGGAGCGGCCGGAGCCGGCGGGGCCGGTGGCGCCATCGGTACCGGCGGCACCGGCGGCGCGG
+TGGGCAGCGTCGGTAACGCCGGGATCGGCGGTACCGGCGGTACGGGTGGTGTCGGTGGTGCTGGTGGTGC
+AGGTGCGGCTGCGGCCGCTGGCAGCAGCGCTACCGGTGGCGCCGGGTTCGCCGGCGGCGCCGGCGGAGAA
+GGCGGAGCGGGCGGCAACAGCGGTGTGGGCGGCACCAACGGCTCCGGCGGCGCCGGCGGTGCAGGCGGCA
+AGGGCGGCACCGGAGGTGCCGGCGGGTCCGGCGCGGACAACCCCACCGGTGCTGGTTTCGCCGGTGGCGC
+CGGCGGCACAGGTGGCGCGGCCGGCGCCGGCGGGGCCGGCGGGGCGACCGGTACCGGCGGCACCGGCGGC
+GTTGTCGGCGCCACCGGTAGTGCAGGCATCGGCGGGGCCGGCGGCCGCGGCGGTGACGGCGGCGATGGGG
+CCAGCGGTCTCGGCCTGGGCCTCTCCGGCTTTGACGGCGGCCAAGGCGGCCAAGGCGGTGACGGTGGCAG
+CGCCGGCGCCGGCGGCATCAACGGGGCCGGCGGGGCCGGCGGCGACGGCGGCGACGGCGGGGACGGCGCA
+ACCGGTGCCGCAGGTCTCGGCGACAACGGCGGGGTCGGCGGTGACGGTGGGGCCGGTGGCGCCGCCGGCA
+ACGGCGGCAACGCGGGCGTCGGCCTGACAGCCAAGGCCGGCGACGGCGGCGCCGCGGGCAATGGCGGCAA
+CGGGGGCGCCGGCGGTGCTGGCGGGGCCGGCGACAACAATTTCAACGGCGGCCAGGGTGGTGCCGGCGGC
+CAAGGCGGCCAAGGCGGCCTGGGCGGGGCAAGCACCACCTCGATCAACGCCAACGGCGGCGCCGGCGGCA
+ACGGCGGCACCGGCGGCAAAGGCGGCGCCGGTGGTGCGGGAACCCTGGGCGTCGGCGGCTCCGGCGGCAC
+CGGCGGGGACGGCGGCGATGCGGGCGCTGGTGGTGGCGGCGGCTTCGGCGGGGCCGCGGGTAAGGCCGGC
+GGCGGCGGAAACGGCGGTGTTGGCGGTGACGGCGGCGAGGGAGCCAGCGGTCTCGGCCTGGACCTCTCCG
+GCTTTGACGGCGGCCAAGGCGGCCAAGGCGGGGCCGGCGGCAACGCCGGCGCCGGCGGCATCAACGGGGC
+CGGCGGCACCGGCGGCACCGGCGGGGCCGGTGGTGACGGCGCCCCGGCGACCCTGATCGGCGGACCCGAC
+GGCGGTGACGGCGGCCAAGGCGGCATCGGCGGGGACGGCGGCAACGCCGGATTCGGCGCCGGTGTTCCCG
+GCGACGGCGGGATCGGCGGCACCGGCGGGGCCGGGGGCGCCGGCGGGGCCGGGGGCGCCGGCGACGCCGG
+CGCCGACGGGGACCCCAGCATTGACGGCGGCCAAGGTGGTGCCGGCGGCCACGGCGGCCAAGGCGGCAAA
+GGCGGCCTGAACAGCACCGGGCTAGCCAGCGCCGCCAGCGGTGACGGCGGCAACGGCGGGGCCGGCGGGG
+CCGGCGGCAACGGCGGCGACGGCGACGGCTTTATCGGCGGGTCCGGCGGCACCGGCGGGACCGGCGGCGA
+CGCCGGCGCCGGCGGCCTGGCCAACACCGGCGGAACCGCGGGCAACGCCGGTATCGGCGGGGCCGGCGGC
+CGCGGCGGCGACGGCGGGGCCGGCGACAGCGGCGCCCTCTCCCAAGACGGCAACGGCTTCGCCGGCGGCC
+AAGGCGGCCAAGGCGGGGCCGGCGGCAACGCCGGCGCCGGCGGCATCAACGGGGCCGGCGGCACCGGCGG
+CACCGGCGGGGCCGGTGGTGACGGCGCCCCGGCGACCCTGATCGGCGGACCCGACGGCGGTGACGGCGGC
+CAAGGCGGCGGCGCGGGATTCGGCAGCGGCGTAGCCGGCGCCGCCGGCGCCGGCGGCAACGGCGGTAAGG
+GAGGTGACGGCGGGACCGGCGGGACCGGCGGGACTAACTTCGCTGGCGGCCAAGGCGGTGCCGGTGGCCG
+AGGAGGTGCTGGCGGCAATGGCGCCAACGGCGTTGGCGACAACGCCGCCGGGGGCGATGGCGGCAACGGC
+GGAGCCGGCGGGCTCGGCGGGGGCGGTGGCACAGGCGGCACCAACGGCAACGGCGGCCTCGGCGGAGGCG
+GCGGCAACGGCGGAGCCGGCGGTGCCGGGGGAACGCCCACCGGCAGTGGCACCGAGGGGACCGGCGGCGA
+CGGTGGAGATGCCGGCGCCGGCGGCAACGGCGGCTCTGCCACCGGCGTCGGTAACGGCGGTAACGGCGGT
+GATGGCGGCAACGGCGGCGACGGCGGCAACGGCGCACCCGGCGGCTTCGGTGGCGGCGCTGGCGCCGGCG
+GCTTGGGCGGCTCCGGCGCCGGCGGCGGCACCGACGGCGACGACGGCAACGGCGGCAGCCCCGGCACCGA
+CGGCAGCTAAGCTAACGGCAGCCCAAAGCGCCAGCAGCCACCCGACAACGCTGGGCGGCTACCCATGGCC
+CGTTGGCAGCACAGGCTGGCGATGGCCGTCCGACCGATAACACCCGGGCCATCGCATCCCCAGCACAACC
+AGCTGTCCTCGCGGGCTTATGCACGACGGGGGAGCACTACCCCACAAGCGATGGCACCACTACATCGATC
+AGATGCGGCCCGGGCTCGGCGAAGGCCGCGCGCAGGGCGTCGGCGAATTCCTCGCAGGTGGTGACACGAC
+GTGCAGGAACACCCATACCTTCGGCGATCTTGACGAAATCCATTGTGGGACGCGATATATCAAGGAGATC
+CAGGGCCTTCGGGCCAGGATCCGACCCCGCGCCGACACGTTGCAGCTCGATCCGCAGAATGTCGTAGGCG
+CCGTTGTTGTAGATGACGGTGGTGACGTCGAGGTTCTCCCGCGCTTGGCTCCACAATCCTGAAATCGTGT
+ACATTGCCGACCCGTCGGATTCCAGGCACAACACCGGGCGGTCGGGCGCGGCGACCGCGGCACCGACCGC
+AGCCGGGATGCCGTAACCGATTGCCCCGCCGGTCAGCGTAAGCCAGTCATGGGCCGGGGCCCCGGCGGTG
+GCCTGCGGCAGCAGGACACCACAAGTATTCGACTCGTCGACAACAATCGCCCGTTCCGGCAGCAACGCAC
+CGACCACATCGGCCGCCGACACCGACGTCAGGTCACCCGTCGGCAGCTGCGGACGTGACGCGCCCGCCAC
+CGGGGCAACCGTCCCGGGCGCTACCTCGTCGGCCAACGCGGCCAGTGCGTCGGCCGCACCACCGGGTTCG
+GCAAGCACGTGCACCTCACAACCGGCCGGCACCAGGTCACTGGGCATACCCGGGTAGGCGAAAAACGACA
+CCGGCGACCTGGCCCCGGCCAGCACGAGATGTTTGACCCCGTCCAGCTGGGCCGCGGCACCTTCAGCGAA
+ATAGGCCAGCCGTTCGACGGCGGGGATACCGGCGCCACGTTCCAGGCACGTCGGAAACGTCTCGCATAAC
+CAACGGGCCCCGGTTGCCTGCACGATCCGCGCAGCCGCGGTCAGCCCCGGCCCGCGGGTGGCATCCCCAC
+CGATCAGCATCATGGCGGGTTCCCCTGAGCGCAGCACCCCAGCCACCGGCCCCACGTCCACTGGCGCCGC
+CGCCGCCTGAGCCGGCACGCCCGCGGCCGCGTGGGCACCGTCGCTCCAACACACATCCGCGGGCAGAATC
+AGCGTCGCGATCTGTGAACCTGACCGGCTGGCCGCAATGGCCGCTTCAGCGTCGGCCCCGACGTCGGCGG
+CAGCCTCCGTCCGGCGCACCCATCCCGAAACGGTGCCAGCGACCGCATCGATATCGGATTCCAGCGGGGC
+GTCGTACTTCTTGTGGTAAGTCGCGTGGTCTCCGACAACCACCACCATCGGCACCCGGGCACGGCGCGCG
+TTGTGCAGGTTGGCCAGGCCGTTGCCCAGTCCGGGGCCCAGATGCAGCAGCACCGCCGCCGGCCGGCCAG
+CAATGCGGGCATAACCGTCGGCGGCCCCGGTAGCCACGCCTTCGAACAGGGTCAGCATGCCACGCATGCG
+CGGGACGGCGTCTAGCGCCGCCACGAAATGCATTTCCGACGTGCCAGGGTTGGCGAAGCACACATCGACA
+CCCCCGTCGACCAGGGTGTTGATCAGGGCCTGAGCACCGTTCACGTCTGCACCTTTCCTCGTGGGTCCAG
+CTTGAATACCCGCACAGCGTTGCCGTGCAGAAAGTCGCGACGAGCTTCGTCGCTTAGCCCCAGTTCGTCA
+AGACCGGTCAGGGCGTGCGTGTGGGCGATCATCGGGTAATTGGTACCAAACAGCACCTTGCGCTGTCCCG
+TGTCGGTTTTCATGAACCGCACCAGCTTCCCGGGCAGCCGCTTGATGGTGTAGGCCGAGGTGTCGATGTA
+GACATTCTCGTGTTTGCGGGCGACCGCGACCATCTCCTCGGTCCACGGATAGCCGACATGTCCGCACACG
+ATCACCAGTTCCGGAAAGTCCAACGCCACCTGGTCGATGTAGGGAATGGGGCGTCCGGTCTCCGACGGCC
+GCAGCGGGCCGGTGTGACCAACCTGGGTGCAGAACGGCACCGCGGACTGCACGCATTCGGCGAACAACGG
+ATAGTAGCGGCGGTCGGTCGGCGGGGCGCCCCATAGCCAAGGCACCACCCGCAGGCCGACGAACCCCTCA
+CCGACTCGGCGCCTCAACTCCCGGACGGCCGCCATCGGGCGATCCAGGTCGACCGCCGCCAGACCGGCAA
+AACGGTTGGGGTACAACCGGACCCATTCCGCAACAGCGTCATTAGAGATGAGGTCCTGGCCGTTGGGGCC
+ACGCCAGGCGCTGAGCAAACCCAGGGTGACGCCGCCGGCGTCCATCGAGGAGACGGTCGCTTCGATCGGG
+ATGTCGGTCTCCGGGATAGACCCACCGGTCCACCGGCGCAGCGAGGCGAACATATCGCCGTGTAGGAACC
+GTTGCGTCGGATGCTGCATCCACACATCGATGGTCATCGCGTTTCAGACTGTAGCCGCCCGGGCGGCGAC
+TACCCGCGGCGACGCTGCAGATCATCGCCCGGCCAGGGTGCTACCAGGTTGCTGCCATCCCCGAATGTTC
+GCGGTCGGAGGGCGACGCGACGTGTTGAAACGCCGTACGTTCGGGCCTTCCCGCGAGAAGCCCTAGCCGC
+CCGAGATTGTCCCTCCCGGCGTTCGTGGCCACGCGGTGCTTCGCCTTTTTGCCCATCCCAAATTACACGG
+GTGGTACTCACGAGAAAGCTTGGACGTATTGGGCGGGTGCTGAATTATGATCCCGACACAACTGCATCAA
+TTTAGCCGCGTCGTGATGCTATCCGCCGACGGTTTGGAGCTGGTCCGTGTCGTTCGTGTTGATCTCACCC
+GAAGTTGTGTCCGCCGCCGCCGGGGATCTAGCGAACGTGGGATCGACAATCAGCGCCGCCAACAAGGCGG
+CAGCGGCTGCGACCACGCAGGTGCTGGCCGCGGGCGCCGATGAGGTGTCAGCGCGCATCGCGGCGCTGTT
+TGGTATGTACGGCCTGGAATATCAGGCGATCAGTGCGCAAGTTGCCGCGTATCACCAGCAGTTCGTGCAG
+ACGTTGCGCACCGGAGCGGCCTCGTACATGTTGGCCGAGGCCACCAACGTCGAGCAAAATCTACTGAACC
+TCATCAACGCGCCGACCCAGACGCTGCTCGGGCGCCCGCTGATCGGAGACGGGGCCAACGCGACGACGCC
+GGGCGGGGCCGGCGGAGACGGCGGGCTGCTGTTTGGCAGCGGCGGCAACGGCGCGCCCGGTGCACCCGGC
+CAGGCTGGCGGTGCCGGTGGGTCTGCCGGGCTACTGGGCAACGGCGGGAGCGGCGGAGCCGGCGGGACGG
+GCGCGCCCGGCGGAAACGGCGGCAATGCCGGTTGGCTATACGGCCGCGGCGGAGTCGGCGGCGCCGGGGG
+AATCGGCGGCGGAACAGGCGGGGCCGGCGGGCACGCGTGGCTGTTCGGCCACGGGGGAACCGGCGGTATC
+GGTGGCGGGCCCGGCGGCAACGGCGGGTGGCTGCTCGGCAACGGCGGACATGGCGGCGCTGGCGGAATCG
+GTGGCGGCAGCGGCGGCGCTGGCGGGAACGGCGGGTGGCTGCTCGGCAACGGCGGTATCGGCGGAGCGGG
+CGGAACCGGCGGCGGAGCGGGCGGCACCGGTGGCAACGCCGCGTGGCTGCTCGGCGGTGGTGGTACCGGC
+GGCGCCGGCGGAATCGGTGGTGGCAACGGCGGGCACGGCGGCAACGGCGGGTGGCTGCTCGGCAACGGCG
+GCAACGGCGGCCTCGGCGGTGACGGTGACGGCGGTACTGGCGGCGGCCACGGCGGCAACGGCGGGAATCC
+CGGGTGGCTCTTGGGCACAGCCGGGGGTGGCGGCAACGGTGGCGCCGGCAGCACCGGTACTGCAGGTGGC
+GGCTCTGGGGGCACCGGCGGCGACGGCGGGACCGGCGGGCGTGGCGGCCTGTTAATGGGCGCCGGCGCCG
+GCGGGCACGGTGGCACTGGCGGCGCGGGCGGTGCCGGTGTCGACGGTGGCGGCGCCGGCGGGGCCGGCGG
+GGCCGGCGGCAACGGCGGCGCCGGGGGTCAAGCCGCCCTGCTGTTCGGGCGCGGCGGCACCGGCGGAGCC
+GGCGGCTACGGCGGCGATGGCGGTGGCGGCGGTGACGGCTTCGACGGCACGATGGCCGGCCTGGGTGGTA
+CCGGTGGCAGCGGCGGCACCGGCGGTGACGGCGGCGCCCCCGGCAACGGTGGCGCCGGGGGTGCCGGCCA
+GTTGTTGAGCCATAGCGGCGTGGCCGGTGCTAGCGGCAAAGGTGGTGCCGGCGGCACCGGCGGCAACGGC
+GGGGCCGGCAGTGCCGGCGCCGACGCCCCCGCAGGCTCCGGCGCGATGGGTAGCACTGGCTTTGCTGGCG
+GCGCCGGCGGTGACGGCGGTAACGGCGGCGGGAGCGGTGCCAGCCAAGGCAACGGCGGCAACGGCGGCAA
+CGGCGGCACCGGCGGCAAAGGCGGCACCGGCGGGGCCGGCATGAACAGCCTCGACCCGCTGCTAGCCGCC
+CAAGACGGCGGCCAAGGCGGCACCGGCGGCACCGGCGGCAACGCCGGCGCCGGCGGCACCGGCTTCACCC
+AAGGCGCCGACGGCAACGCCGGCAACGGCGGTGACGGCGGGGTCGGCGGCAACGGCGGAAACGGCGCAGA
+CAACACCACCACCGCCGCCGCCGGCACCACAGGCGGGGCCGGCGGGGCCGGCGGGGCCGGCGGAACCGGC
+GGAACCGGCGGAGCCGCCGGCACCGGCACCGGCGGCCAACAAGGCAACGGCGGCAACGGCGGCAACGGCG
+GCACCGGCGGCAAAGGCGGCACCGGCGGGGCCGGCATGAACAGCCTCGACCCGCTGCTAGCCGCCCAAGA
+CGGCGGCCAAGGCGGCACCGGCGGCACCGGCGGCAACGCCGGCGCCGGCGGCACCGGCTTCACCCAAGGC
+GCCGACGGCAACGCCGGCAACGGCGGTGACGGCGGGGTCGGCGGCAACGGCGGAAACGGCGCAGACAACA
+CCACCACCGCCGCCGCCGGCACCACAGGCGGGGCCGGCGGGGCCGGCGGGGCCGGCGGAACCGGCGGAAC
+CGGCGGAGCCGCCGGCACCGGCACCGGCGGCCAACAAGGCAACGGCGGCAACGGCGGCAACGGCGGCACC
+GGCGGCAAAGGCGGCACCGGCGGGGCCGGCATGAACAGCCTCGACCCGCTGCTAGCCGCCCAAGACGGCG
+GCCAAGGCGGCACCGGCGGCACCGGCGGCAACGCCGGCGCCGGCGGCACCGGCTTCACCCAAGGCGCCGA
+CGGCAACGCCGGCAACGGCGGTGACGGCGGGGTCGGCGGCAACGGCGGAAACGGCGCAGACAACACCACC
+ACCGCCGCCGCCGGCACCACAGGCGGGGCCGGCGGGGCCGGCGGGGCCGGCGGAACCGGCGGAACCGGCG
+GAGCCGCCGGCACCGGCACCGGCGGCCAACAAGGCAACGGCGGCAACGGCGGCAACGGCGGCACCGGCGG
+CAAAGGCGGCACCGGCGGCGACGGTGCACTCGCAGGCAGCAGCGGTGGTGCCGGCGGTAAAGGCGGCAAC
+GGCGGCGACGCCGGCAAGGCCGGTACCGGCTCCGCTCCTGGCACGGCGGGGACCGGCGGCGATGGGGGTA
+AGGGCGGCAACGGCGGCATTGGCGCTGCCGGCACAACCGGCCCCGTAGGCACCGGCGCGTCCGGCGGCAC
+CGGTGGTAGTGGTGGCGCCGGCGGAACCGGCGGTGACGGCGGCGCCGCCAACGGCGGCACCGCCGGGGCT
+GGCGGGGCGGGCGGCAATGGCGGCAAAGGCGGCGACGGTGGAGCAGGCGTCACCAGCAGCACCGCCGGCA
+ACAGCGGCGGCGCGGGCGGCAGCGGCGGAAAGGGCGGAGACGCGGGCGCGGGCGGCGCCGGTGCCACTCC
+GGGCGCCAACGGTATCGCTGGCAATGGCGGCGACGGCGGAGATGGCGCGGCTGGTGCCGTCGGCATCTCC
+GGCGCAACCGGCGCTGGCGACGGCGGGCATGGCGGAACCGGCGGGGCCGGCGGCAACGGTGGAACCGGCG
+GTGCTGGCGGTAGCGGCATCGACGGCGTCGGCGGCGGGACCGGAGGTACCGGCGGCAACGGCGGCAACGG
+CGCCATCGGCGGCGCTGGCGGAGACGCCGGTGGTAGCGGAAATAGCGGCGGAAACGGTGGGACTGGCGGA
+AAGGGCGGAAACGCCGGTGCCGGTGGTGCCGCGGGCAGCAACGGCGGTACCGTCGGCGCCAACGGTACCG
+GCGGCGACGGCGGCAACGGCGGCGCTGCCGGGGCCGCCACGGCTGGCAGCAACGGTGGGGCCGGCACCGG
+CTCGGCCGGCGGCAACGGCGGCACCGGCGGCAGAGGCGGCAGTGGTGGCGCCGGCGGCGACGGTATCGGT
+GGCGTCGGCGGCGGCAAGGGCGGCAACGGCGCGGACGGCGAAGTCGGCGGTGCGGGCGGCGCCGGCGGCA
+GCGGGCCCAACACCAGTCCCGGCGGCAACGGCGGGCAAGGAGGTCAAGGCGGCAGCGGTGGTGCCGGTGG
+GGCGGCCGGGGCTGGCGGCGCGGGTGGCGGCGCTAACGGCACCGCTGGCAACGGCGGCCAAGGCGGTGCC
+GGCGGCACCGGCGGCGCCGGCGCAGCCTCCTCAGCTACCAACGGCGGCAGCGGCGGCGCCGGCGGCACCG
+GAGGCGCCGGCGGCACCGGCGGCGCTGGTGGCGATGGCGTCGGCGGCGCCGGCGGCGGCAATGGTGGCCA
+CGGCGGTGACGCCGGAGACGGTGGCAACGGCGCCAACGGCAACAACCGCAGTTCCGGCTCCTTCCTCGCA
+GCCGGCGGCACCGGCGGGGCGGCCGGCGACGGCGGACAAGGTGGCCAGGGCGGCGCCGGCGGCGGTGCCG
+GTGGTCAAGGTGGTGCCGGCGGTGCCGGCGGGACCGGCGGCAACGGCGGCAATATCACCGGCGGCACCGC
+GGGCACCGCGGGGGCCGCCGGTAACGGCGGCGCCGCCGGAAAGGGTGGCGCCGGCGGCCAAGGCGGCACC
+GGTGGCGGGACCGGGGGTCAGGGTGGCGCCGGCGGCGACGGCGGTGCCGGCGGCACCGGCGGCGACCGCA
+CCGTCGGCGGTGGCACGGTCCCCGCCGGCTCCGGTGGACAAGGCGGTAACGCTGGCGGTGGTGGGGCCGG
+CGGGCAGGGTGGAGCCGACGGCGGCAGCGGCGGCGACGGCGGCGACGCCGGCACAGGTGGCAATGGCGGT
+AACGGCGGCAACCGTAATTCCGGCAATGGCACCGGCGGCGCTGGCGGCAACGGTGGTGGTGGTGCTAACG
+GTGGCGCCGGCGGCGCTGGGGGCAGCGGCGGCGGCACCGGCGGCAACGGCGGCGCTGGCGGCGACGCCGG
+CGACGCCGGCAACGGCGGCAACGGCAACGGCACCGGCAACGGCGGCAACGGCGGCAACGGCGGCATCGCC
+GGCATGGGCGGCAACGGCGGTGCCGGGACGGGCAGCGGCAACGGCGGCAACGGCGGCAGCGGCGGCAACG
+GCGGCAACGCCGGCATGGGCGGCAACAGCGGCACCGGCAGCGGCGACGGCGGTGCCGGCGGGAACGGCGG
+CGCGGCGGGCACGGGCGGCACCGGCGGCGACGGCGGCCTCACCGGTACTGGCGGCACCGGCGGCAGCGGT
+GGCACCGGCGGTGACGGCGGTAACGGCGGCAACGGCGGCAACGGAGCAGATAACACCGCAAACATGACTG
+CGCAGGCGGGCGGTGACGGTGGCAACGGCGGCGACGGTGGCTTCGGCGGCGGGGCCGGGGCCGGCGGCGG
+TGGCTTGACCGCTGGCGCCAACGGCACCGGCGGGCAAGGCGGCGCCGGCGGCGATGGCGGCAACGGGGCC
+ATCGGCGGCCACGGCCCACTCACTGACGACCCCGGCGGCAACGGGGGCACCGGCGGCAACGGCGGCACCG
+GCGGCACCGGCGGCGCGGGCATCGGCAGCCTTGGCGGCGGCACTGGCGGCGATGGCGGCAACGGCGGTAC
+CGGCGGCAACGGCGGTACCGGCGGCGAGGGCGGCGAGGTCGGCGGCGCCGGCGGCACCGGCGGTGCGGCC
+GGCAATGGCGGCGATGGCGGCACCGGCGGCACCGGCGGCGGGGACGGGGGCGCCGGCGGCACCGGCGGCA
+CCGGCGGCACCGGCGGCCTCGGCGACCCCCGGGTCGGCGGATCCGGCGGCGACGGCGGCACCGGCGGCAG
+CGGCGGTGCGGCCGGCAATGGCGGCAACGGCGGCAACGCCGGCGCGGGAGGCAATGGCAACGGCGGCACC
+GGTGGGGCCGGCGGTATCGGCGGCACCGGCGGCAATGGCGGCGACGCCGAGCCCGGAGTGCCCCCGGGAG
+CCGGTGGTGCTGGCGGCGCCGGCACCACCGGCGGCAAGGGTGGCACCGGCGGCAACGGCAGTGGCACCGG
+CTCGGGCGGCACCGGCGGCGATGGCGGCACCGGCGGTGGTGGTGGGAACGGCGGCACCGGCTGGAATGGC
+GGCAAGGGAGACACCGGCAGCGGCGGTGGCGCCGGAGACGGTGGTAAGGCACCAGCCGGTGGCACCGGCG
+GCGCCGGCGGCGACGGCGGAGCGGGCGGCAAGGGCGGCAGCGGCGGCGTCTAGTCGCGATGGGCCCAGCG
+GCCGCGATGGTGCGCCGGGCGTCCGCCGGCGAGTGGTCCAGCCAGATTTGACGACAAACGGCGACCCAGC
+GGTATCCCCCAGCCGCGGCGCCATAGCCGCGACCCGCGCAATCAGGAACCGCTCGTCACGTGTCCCGCAT
+GCACGTCATCGGCTGGCCGCGCCTCGGTCTGCTCCTTGGCCCAGCGGTAGTCCGGCTTACCGGCGGGCGA
+ACGCTTCACCTCGTCGACAAACCACAGACTGCGCGGCACTTTGTAGCCCGCGATCTCGGAGCGCACGAAC
+GAGTCCAACTCGGCCAACGACGGCCGACAACCCGGCCGGGCCTGCACCACGGCGGCCACCTGCTGGCCGT
+AACGCGGATCGGGCACCCCGACCACCAGAGCGTCGAACACGTCGGGATGCCCCTTCAAAGCGGCCTCGAC
+CTCTTCGGGGTAGACCTTCTCGCCGCCGCTGTTGATCGACACCGAGCCACGACCCAGCATGGTGACCGTG
+CCGTCCTCCTCGACTTGGGCGTAGTCCCCCGGAATGGCGTAGCGCACACCGTTAATCGTCCGGAACGTCT
+CGGCCGTCTTCTTCTCGTCCTTGTAGTAGCCGACGGGAATGTTGCCCTTCTTGGCGAGCGTGCGCGCGGG
+TCGCACTGCTTGGCGCCTGGTGCACCGGTCGCCGGGCGGCTCCTCCCCAGGGCGCTCCAGGTTCGTTGCG
+GCATTACCAGAAAGCCGGCACATATTAGATGAGTGGCAACTAAGGTTCTCACTTAAAGATGCCGCCATAT
+CGGCCGTGGTTGCACCGGCGCAAAGATGGTTGGGAGTTCGCCCATGTCGTTCGTGTTGATCGCACCGGAA
+TTCGTGACAGCAGCCGCGGGGGATCTGACGAATCTGGGTTCGTCGATTAGCGCGGCCAACGCGTCGGCAG
+CCAGTGCGACCACGCAGGTGCTGGCTGCGGGCGCCGATGAGGTGTCTGCCCGTATTGCGGCGCTGTTCGG
+CGGGTTTGGCCTGGAGTACCAGGCGATTAGTGCGCAGGTGGCGGCCTACCACCAGCGGTTTGTGCAGGCC
+TTGAGTACCGGCGCGGGCGCATATGCCTCGGCCGAGGCCGCCGCCGCTGAGCAGATCGTGCTGGGCGTGA
+TCAATGCGCCCACCCAGGCGCTGCTGGGGCGCCCGTTGATCGGTGACGGCGCCAATGCGACGACTCCCGG
+CGGGGCCGGCGGGGCCGGCGGTCTGCTGTTCGGCAACGGCGGGGCCGGGGCAGCCGGGGCGCCCGGCCAG
+GCCGGCGGGCCTGGCGGGCCCGCCGGCCTGTGGGGCAACGGCGGGCCCGGCGGGGCCGGCGGCAGCGGTG
+GGGGCACCGGCGGTGCCGGCGGCGCCGGTGGGTGGCTGTTCGGGGTTGGCGGCGCCGGCGGTGTCGGTGG
+GGCCGGTGGCGGCACCGGCGGGGCGGGCGGGCCCGGTGGTTTGATCTGGGGCGGCGGCGGGGCCGGCGGT
+GTCGGTGGGGCCGGTGGCGGCACCGGCGGGGCCGGCGGCCGCGCCGAGCTGCTGTTCGGCGCCGGCGGTG
+CGGGCGGCGCGGGTGGGGCGGGCACCGACGGCGGGCCCGGTGCTACCGGCGGGACCGGCGGACACGGCGG
+AGTCGGCGGCGACGGCGGATGGCTGGCACCCGGCGGGGCCGGCGGGGCCGGCGGGCAAGGCGGGGCAGGT
+GGTGCCGGCAGCGATGGTGGCGCGTTGGGTGGTACCGGCGGGACGGGCGGTACCGGCGGCGCCGGTGGCG
+CCGGCGGTCGCGGCGCACTGCTGCTGGGCGCTGGCGGACAGGGCGGCCTCGGCGGCGCCGGCGGACAAGG
+CGGGATGGGGGGTGCTGGCGGGGCCGGCGCCGATAACCCCACCGGCATCGGCGGCACCGGCGGTGACGGC
+GGCACCGGCGGTAGCGCCGGTGAGGGCGGGGCCGGTGGTGCCGCGGGCCAGCTCTTCAGCGCCAGCGGAG
+CGGCCGGTAACGCCGGTGTCGGCGGGGCCGGCGGCCAAGGCGGTGACGGCGGAGCCGGCGGGGCCGGCGC
+CGACGCCGACCAGCCCGGCGCCACCGGCGGCACCGGGTTCGCCGGTGGAGCCGGCGGAGCCGGCGGGGCC
+GGCGGTAGCAGCGGTGCCGGCGGCACCAACGGCTCCGGCGGCGCCGGCGGCACCGGCGGACAAGGCGGGA
+TGGGGGGTGCTGGCGGGGCCGGCGCCGATAACCCCACCGGCATCGGCGGCACCGGCGGTGACGGCGGCAC
+CGGCGGAGCGGCCGGAGCCGGCGGGGCCGGCGGAGCGGCCGGCACCGGAGGCACCGGCGGCATGATCGGC
+ACCACAGGCAACGCCGGTGTCGGCGGGGCCGGCGGCCAAGGCGGTGACGGCGGAGCCGGCGGGGCCGGCG
+CCGACGCCGACCAGCCCGGCGCCACCGGCGGCACCGGGTTCGCCGGTGGAGCCGGCGGAGCCGGCGGGGC
+CGGCGGTAGCAGCGGTGCCGGCGGCACCAACGGCTCCGGCGGCGCCGGCGGCACCGGCGGACAAGGCGGC
+GCCGGGGGTGCTGGCGGGGCCGGCGCCGATAACCCCACCGGCATCGGCGGCACCGGCGGTGACGGCGGCA
+CCGGCGGAGCGGCCGGAGCCGGCGGGGCCGGCGGAGCGGCCGGCACCGGAGGCACCGGCGGCATGATCGG
+CACCACAGGCAACGCCGGTGTCGGCGGGGCCGGCGGCCAAGGCGGTGACGGCGGAGCCGGCGGGGCCGGC
+GGGGCCGGCGGTAGCAGCGGTGCCGGCGGCACCAACGGCTCCGGCGGCGCCGGCGGCACCGGCGGACAAG
+GCGGCGCCGGGGGTGCTGGCGGGGCCGGCGCCGATAACCCCACCGGCATCGGCGGCACCGGCGGTGACGG
+CGGCACCGGCGGAGCGGCCGGAGCCGGCGGGGCCGGCGGAGCGGCCGGCACCGGAGGCACCGGCGGCATG
+ATCGGCACCACAGGCAACGCCGGTGTCGGCGGGGCCGGCGGCCAAGGCGGTGACGGCGGAGCCGGCGGGG
+CCGGCGCCGACGCCGACCAGCCCGGCGCCACCGGCGGCACCGGGTTCGCCGGTGGAGCCGGCGGGGCCGG
+CGGGGCCGGCGGTAGCAGCGGTGCCGGCGGCACCAACGGCTCCGGCGGCGCCGGCGGCACCGGCGGACAA
+GGCGGCGCCGGGGGTGCTGGCATCAGCTTCAGCAACGGCAGCAACGGCGGCACCGGCGGCACCGGGGGCG
+TGGGCGGCACCGGGGGCGACGGCGGCAACGCAGGCACCGGCGCCGGCGACCCCGGCAAAGGCGGCACCGG
+CGGCACCGGCGGCAGCGGCGGGGCCGGCGGTAGCGGCGGGGCCAACTTCAACGGCGGCACCGGCGGCACC
+GGCGGCACCGGCGGCACCGGCGGCAAAGGCGGCATGGGCGGCATCGCTGGCGACGGCGGGCCCGGCGGTG
+ACGGCGGCAACGCCGGGGTCGGAGGAAAAGGCGGCACCAACGGCAACGGCGGCAGCGGCGGGACCGGCGG
+CACAGGCGGGCCCGGCGGCAGCGGCGGCGCGCCCACCGGCAGCGGCACCGGCGGCAAAGGCGGCGCCGGC
+GGTGACGGCGGCGATGGCGCCGACGGAGGGGCAGCCACCGGCGTCGGCGACGGCGGCGACGGTGGTAACG
+GTGGTAACGGTGGTAACGGCGGCACGGGCGTCGGCTCGCCCGGCGGCCTCGGCGGGGCAGGAGGCACTGG
+AGGCCTCGGCGGCGCCGGTGCAGGCGGCGGAGCCGACGGCGATGATGGCGACGACGGCCAACCCGGCAAC
+AACGGCAGCTGAAGCACCACCTGCCACCAGACAACGCCGTCGATGTGGCGCTCCGGCGTGCGCAAGGCAA
+ATCGGTGCGATCCTGACCAGCCAGGTGATTACCTGGTTCGACTCATGCCGAGCGACCGTCCCAGCGCCGC
+AGTGGATGCATACACGGTAGGTTCGACGGACACCCTGGGCTGGCTGACCGAATGGCCGCCGCAGCTCCCC
+GACCGAACCGTCAGCGGCAACATGTCACCTGCATCGTCGCCAAGCCCAGGCGATCGCCCGGCCCCGCAAG
+CGGATGTGTTCTCCTGCCCTCCGTGGGCAGCGCGCCCGACACCCGTAAGCGGATGTCCCCGACGGACTCC
+GGCCGGCCTAGCCGATGGCTACCCCAGGGAGTGCCGCACGATGGCCGTCGATCAAGTGCGGTCCGGCTTC
+GGCGAACCCTCCGCAGCTATTTCGCGACGCGCGAGAACACCCGTGCCTTACTTCCATCCACATCGATGTC
+GGCTCGGCCCCCGAGAGGCACGACAGCCGACCCATGTCGACCTTCCGTGCGGGGTGTCCGGAGCCGGTCG
+CAGCCGCACCCATCACCCACCGCTCGTCACGTGTCCCGCATGCACGTCATCGGCTGGCCGCGCCTCGGTC
+TGCTCCTTGGCCCAGCGGTAGTCCGGCTTACCGGCGGGCGAACGCTTCACCTCGTCGACAAACCACAGAC
+TGCGCGGCACTTTGTAGCCCGCGATCTCGGAGCGCACGAACGAGTCCAACTCGGCCAACGACGGCCGACA
+ACCCGGCCGGGCCTGCACCACGGCGGCCACCTGCTGGCCGTAACGCGGATCGGGCACCCCGACCACCAGA
+GCGTCGAACACGTCGGGATGCCCCTTCAAAGCGGCCTCGACCTCTTCGGGGTAGACCTTCTCGCCGCCGC
+TGTTGATCGACACCGAGCCACGACCCAGCATGGTGACCGTGCCGTCCTCCTCGACTTGGGCGTAGTCCCC
+CGGAATGGCGTAGCGCACACCGTTAATCGTCCGGAACGTCTCGGCCGTCTTCTTCTCGTCCTTGTAGTAG
+CCGACGGGAATGTTGCCCTTCTTGGCGATGACGCCCCGCATCCCCGAGCCGGGCTTGACTTCGTTGCCGT
+CGTCATCGAGCACGACGGTGCGATGGTCGATCCGCACCCGGGGCCCGCCGCCATGCGCCTGCCCGGCAGC
+AACGACGCTGGTACCGCCAAAACCCGTCTCCGACGAGCCAATTGAGTCCGTGATCACCCGATTCGGCAGC
+AGCTCAAGGAGTTTCTCCTTGATGCTCGGCGAGAACAGCGCCGCGGTGCTGGCCAACAGGAACAACGACG
+ACAGGTCGTAGTCGTTGCCCTTGACCAGCGCGTCGACCAGCGGGCGGGCCATCGCATCACCGGTGAAGAA
+CAGCAGGTTCACCTTGTGTTTGTGGATCGTGCGCCACACCTCGTCGGCGTTGAATTCCGGTGCCAGTACC
+GTGGTTTGGCCCGAGAAGAGCGCCATCCAGGTGGCCGACTGGGTGGCGCCGTGGATCATCGGCGGGATCG
+GGTAGCGGATCATCGGTGGATTCGCCGCGGCCGCCTTGGCCAGGTCGTATTCGTCTTTGACGAACTCTCC
+TGTCGCAAAGTCGGTTCCACCGAACAGCACACGATAGATGTCCTCGTGACGCCACATCACACCCTTGGGG
+AAACCGGTGGTGCCGCCGGTGTAGAGCAGATAGATGGCGTCGGCGCTGCGTTCGCCGAAGTCACGCTCCG
+GCGAGCCCGCCGCGATCGCGGAATAGAACTCGACGCCGCCGTAGCGCCGATAGTCCTGGTCCGAGCCGTC
+CTCGACGACCAAGATCGTCCTTACATGGGGCGTGTCGGGGAGAACGTTGGCGACCCGGTCGGCGTAGCGG
+CGTTCGTGCACCAACGCGACCATGTCGGAGTTGTCGAACAGGTAGCGAAGTTCGCCCTCCACGTAACGGA
+AGTTGACGTTCACCAAGATGGCGCCCGCCTTCACGATGCCCAGCATCGCGATCACGATCTCGATGCGGTT
+GCGGCAGTACAGGCCGACCTTGTCGTCCTTTTGCACGCCTTGATCGATCAGGTGGTGCGCGAGGCGGTTG
+GCCTTATCCTCCAGCTGGGCGTAGGTCAACTGCTCATCGCCGCAGATAACGGCGACACGGTCAGGCACGG
+CGTCGATGGCGTGCTCGGCGAGATCGGCAATATTCAGGGCCACGGCCACCAAACTAGAACGTGTTACATT
+TCTTGACAAGCTCACACCCGACGGGCAGAAAGAGGTGGCGGCCGTGGCAACCGTGGAATCCGGACCCGAC
+GCGCTGGTGGAGCGGCGCGGCCACACCCTGATCGTGACCATGAACCGGCCGGCCGCCCGCAACGCGCTGA
+GCACCGAAATGATGCGAATCATGGTGCAGGCCTGGGATCGCGTCGACAACGATCCCGACATCCGTTGCTG
+CATCCTCACCGGAGCCGGTGGCTACTTTTGCGCCGGCATGGACCTCAAGGCGGCAACCCAGAAACCGCCG
+GGCGACTCTTTCAAGGACGGCAGCTACGACCCGTCGCGCATCGATGCCCTGCTCAAAGGGCGCCGCTTGA
+CCAAACCGCTGATCGCCGCCGTCGAGGGGCCCGCGATCGCCGGCGGCACCGAGATCCTGCAGGGCACCGA
+CATCCGGGTCGCCGGTGAAAGTGCGAAGTTCGGCATCTCCGAGGCCAAGTGGAGCCTGTACCCGATGGGC
+GGCTCGGCCGTGCGGCTGGTCCGGCAGATCCCCTACACTCTGGCCTGCGACCTGCTGCTGACCGGACGGC
+ACATTACCGCCGCCGAGGCCAAGGAAATGGGCCTGATCGGCCACGTGGTGCCCGACGGCCAGGCGCTGAC
+CAAGGCTCTAGAACTTGCCGACGCCATCTCGGCTAACGGACCCCTGGCCGTGCAGGCCATCCTGCGGTCC
+ATCCGCGAGACCGAGTGCATGCCCGAAAACGAGGCGTTCAAGATCGACACCCAGATCGGCATCAAGGTCT
+TCCTGTCCGACGACGCCAAGGAAGGCCCGCGCGCGTTCGCCGAGAAGCGCGCACCCAACTTCCAGAACCG
+CTAGGCGCCGAGCGTGAACTGAGGGCGAGATTTCGGCCGATTTTCCGCCCTCAGTTCACGTTGGACGGCG
+GTGTCGGTGCACGACGGCACACTGCGATCGTGATCGAACCATTCCTCGGCAGCGAAGCGATTGCCTCCGG
+CGCGTTGACGCGGCACCGGCTGCGAAGCGCATACGCCACGATCCACCCCGACGTCTATGTCTCCCCCGGC
+GCCGACCTGACCGCATGGAGTCGCGCTCAGGCCGCCTGGCTATGGTCGCGGCGGCGCGGCGTCATCGCCG
+GGCAGTCGGCGGCGGCGATGCACGGCGCCAAATGGGTCGACGCGCGACAGGCGGCCGAGCTGCTCTACGA
+CCACCGTCGCCCGCCGGCCGGCATCCACACCTGGTCGGACCGTGTCGCCGACGACGAGATCCAGCCAATC
+TCCGGCATGAATACGACCACACCGGCGCGCACCGCCCTCGACCTCGCCCGCCGCTATCCGGTCGGCAAGG
+CCGTCGCGGCCATCGATGCGCTCGCCCGCGCGACGGACCTCAAGCTGGCCGATGTCGAGATGCTCGCCGA
+ACGCTACCGGGGAAGCCGCGGCATCCGAAATGCTCGTATCGCATTGGATCTGGTGGATCCAGGTGCCGAG
+TCACCTCGCGAGACGTGGCTGCGTCTGCTACTCATCCGAGCGGGCTTTCCAAGACCACAGACCCAGATCC
+CGGTTTACGACGAGTACGGCCAGCTGGTCGCGGTTATCGATATGGGTTGGGCAGGAATCAAGGTCGGCGT
+GGATTACGAGGGCGACCATCACCGGACCGACCGCAGAACGTTCAACAAGGACATCAAGCGTGCCGAAGCG
+TTGACCGAGCTTGGGTGGACCGACGTACGCGTGACGGTCGAGGACACCGAGGGTGGCATCATCTGGCGGG
+TGTCAGCGGCCTGGCAGCGCCGAACGTGAACTCACGGCGGAGATTCGGCCGATATTCCGCCCTCAGTTCA
+CGTTCGGCGTGGCTCAGCCCAGCGGCGGGCTCGGCGTGAACACCACCGGCATGGATTCCAGGCCGCTGAC
+AAAGTTCGCCGGCCGCAGCGGCAACACGGAGTCATCGGCGACCAACCGCAGGTCGGGTAGCCGCCGCAAC
+ACCCGTTCCGTCATCAACGACAGCTCCAACCGGGCCAGCTGATTGCCCAGGCAGAAATGCGTGCCGAAGC
+CAAACGCCAAGTGGCTGTTTGGATTTCGCTGAACATCAAACTTTTCCGGTTCACAGAAAACCGCCTCGTC
+GAAGTTCGCCGACTCGAAGAGCAGCATCATCTTCTCGCCGGCACACAACGCCGTGCCGTGAAACTCGGTA
+TCCGCGGTCAACACCCGGCACATGTTCTTTACCGGGGCGGTCCAACGTAGCATCTCCTCGATGGCCCCGG
+GCAGCAACGACGGGTCGCGCTGCAGCAGGTCCCACTGGTCACGGTTGCGCAGCAGCTGCTCGGTACCACC
+GCTCAAGGTATGCCGCGTGGTCTCGTCGCCGCCGATCAGGATCAGCAGCGTCTCCATGACCAGCTCGTCG
+TCGCTTAGCCGCTCGCCGTCAACTTCGGAACTCACCAGCACGCTGACCAGGTCGTCGGTGGGTCCGCTCG
+CCGTGCCGCAATGGTGGCCCGGGTGAAGTCGTTGTAGGCCGCGAAGGCGTCCATGGTGATCTGGAAATCC
+TCTTGAGACACATGCGAACTGAGGAATGTCACCAGATCGTCGGACCACCGCAAGAACATGTCCCGCTGCT
+CTGGACGCACCCCGAGCATGTCGCCGATCACCGCCATCGGTAGCGGCGCGGCCAGGTCCCGCACGAAGTC
+ACACTCGCCGCGTTCGCACACGGCGTCGATCAGGGTGTCACACAGCGCGGCAATCGACGCCTCCTTGTCC
+TTCACCCGCTTGCGGGTGAAGCCGGCGTTAACCAGCTTGCGCCGCAACAGATGTGCGGGATCGTCCATGT
+CGATCATCATCGGCAGGGCGGGCTGGTCGGGGCGGATGCCGCCGGCGTTGGAGAACAGCTCGGGTTGACG
+TTCGGCGTCGATCACCGCCTGGTACGTCGACGCGGCCGCCAGGCCGTTGCGATCGCGGAACACCGGTTGG
+TTGGCCCGCATCCACCGGTACGCGGCCCGCGCCTCGCGGCTGGCGTAGAAGTTGCCGTCGGCCAGATCCA
+CGTCCGGAGCTTCAGTCATCGCGATCCTCCGCACTACAGTGGGCGATATGCCCGTCTCGCAACACACCAT
+CGCCGGCACGGTGCTCACCATGCCGGTGCGCATTCGCACCGCCAACCTGCATTCCGCGATGTTCTCGGTG
+CCCGCCGACCCAGCGCAGCGCCTCATCGACTACAGCGGGCTGCGGGTGTGCGAATACCTGCCCGGTAAGG
+CAATCGTGATGCAGATGCTGGTGCGCTACGTCGACGGGGATTTGGGGCGATACCACGAGTACGGCACCGC
+GATCATGGTGAACCCGCCCGGCACCCAACGCCGCGGGCCCAGAGCCCTCACCCGAGCCGCCGCGTTCATC
+CATCATCTGCCGGTAGATCAGGTGTTCACGCTTGAGGCCGGGCGCACCATCTGGGGCTTCCCGAAGATCA
+TGGCGGACTTCAACGTCACCGACGGCCGGAGGTTCGGCTTCGACGTCAGCGCCGACGGACGGTTGATCGC
+CGGGATCGAGTTCAGCACCGGCCTGCCGGTGCCGACCCTCGGGTGGCAAATGTTGAAGACCTACTCCCAC
+CATGACGGCGTAACTCGCGAGATTCCCTGGGAAATGAAAGTCTCGGGCCTGCGCGCCCGGCTCGGCGGCG
+CCCGACTGCGGTTGGGAGACCATCCCTACGCCAAAGAACTGGCATCGCTGGGCCTGCCGAAGCGGGCTCT
+GTTGTCCCAGTCGGCGGCCAACGTAGAAATGACCTTCGGCGACGGTCACCCGATCTGAACCGCAAGAAAG
+CGAAGCCATCAGCCCAATCTAGAACGCGTTCTAGCCCGCTGGCAAGGATCGATCAGACCAGGGCGGCAAG
+GTCGCGGACCTGCTCTGCGCTGCCGGCGGTCACCACCATCATGGTGACCCCGGCGGCCTCCCAGACGGCC
+ATCTGCTTACGCACGTGGTCGATGTCACCGACGATCACGGCGTCGTCGACGAGCTCGTCCGGGATGATCT
+CGGCGGCCTCGTCCTTGCGGCCAGACCGAAATAACTTGGTGACCTCATCGACCACTTGCGTGTACCCCAT
+CCGGCGATAGACGTCGGCGTGGAAGTTGGTCTCTTCGGCGCCCATCCCGCCCATGTAGAGCGCCAGGAAC
+GGCTTGATTCCGGCAAACGCGGCCGCCCGATCGTCGGTGATGACCACCTGCGCCGTCGCGCAGATCTCGA
+AGTCCTCGCGGCTACGCCGGGCGCCGGGCCGGGCGAATCCTTCGTCGAGCCATTCGTTGTACATGCCGGC
+CATGCGTGGCGAATAGAAGATGGGCAGCCAGCCATCGCAGATCTCGGCGGCCAGCGCGACGTTCTTGGGC
+CCCTCGGCCCCCAGCATGATTGGTATGTCGGCGCGCAGCGGATGGGTGATGGGTTTGAGCGCTTTGCCCA
+GACCTGTCGTGCCCTCCCCCGTCAGTGGCAGCCGGTAGTGCGGCCCGGCGCTGGTCACCGGCGATTCTCG
+GGCCCACACCTGGCGCACGATGTCGATGTATTCGCGGGTGCGAGCCAGCGGCTTGGGAAACCGCTGCCCG
+TACCAACCCTCGACCACCTGCGGACCGGACACGCCGAGCCCGAGAATGTGCCGGCCACCGGACAGATGGT
+CCAGTGTCAGCGCGGCCATCGCACAGGCCGTTGGTGTGCGCGCGGACAGCTGGATCACCGACGTACCCAG
+CCGCACCCGTTGCGTCGACGAGCCCCACCAGGCCAGCGGCGTGTAGGCGTCGGACCCCCACGCCTCGGCG
+GTGAACACCGTGTCAAAACCCGCATCCTCGGCCGCGGCGACGAGTTCCGCATGGTTCTGCGGCGGCTGCG
+CGCCCCAATACCCCAGCTGTAGTCCGAGCTTCATCCCTGCCTCCACGACGCCCTTCAGGAGGGCAATGTT
+GAAACCGTTGTTAGAACCTGTTCTACTCGACAGGCGTGACAGCCAGCTCGAGCGGCCCGGCGCTGATCGA
+TCACTCTGAGCCGCCCCTTTCCGCGCCCCTCACGTTGTCCTTCGACTACACCCGTTCGGTGGGGCCCACG
+TTAAGCAGGTTTTTCACCGCCTTGCGTGCACGCCGCATTGTCGGGGTGCGCGGATCCGACGGCCGAGTCC
+ATGTGCCGCCGGTGGAATATGACCCGGTTACCTACGAACCCCTGAGCGAAATGGTACCGGTGTCCAGCGT
+CGGCACCGTCGCGTCCTGGACCTGGCAACCCGAGCCGCTAGCCGGCCAGCCCCTGGACCGGCCGTTCGCC
+TGGGCGCTGATCAAGCTCGACGGCGCCGACACCTTGCTGATGCACGCCGTTGATGTGGGAACCGCCGGCC
+CTTCCGCCATCCACACCGGCGCCCGGGTGCACGCGCATTGGGCCGACCAACCGGTGGGCGCCATCACCGA
+TATCGCCTGCTTTGCGCTCGGCGAGACCGCAGAACCGGTGGCGGCTCACAAGACCGAGGATGCGCGGGAC
+CCGGTCACCATGATCGTCACGCCGATCCAGCTGGAAATTCAGCACACCGCCTCGCACGAGGAGAGTGCGT
+ATCTGCGCGCCATCGCCCAGGGCAAGCTCGTGGGCGCCAGAACCGGAAAGACCGGCAAGGTATACTTCCC
+GCCGCATGGCGCCGACCCGGCCACCGGGAAACCCACCTCCGAGTTTGTCGAGCTGCCCGACAAGGGCACG
+GTGACGACGTTCGCGATCGTCAACATCCCGTTCCTGGGCCAGCGAATCAAGCCGCCCTATGTGGCGGCCT
+ACGTGTTGCTCGACGGCGCCGACATCCCGTTTTTGCATTTGGTTTCCGACGTCGACGCGCACCAGGTGCG
+GATGGGCATGCGCGTCGAGGCGGTGTGGAAGCCGCGGGAGCGGTGGGGACTGGGCATCGACAACATCGAG
+TACTTCCGCCCCACCGGCGAACCGGATGCCGACTACGACACCTACAAGCACCACCTGTAAAGGGCCCACC
+AACCAATGAGCGTTCGCGATATTGCCGTTGTCGGCTTCGCCCACGCCCCGCACGTGCGCCGCACCGACGG
+CACTACCAACGGCGTCGAGATGCTGATGCCGTGCTTCGCCCAGCTATACGACGAGCTGGGCATCACCAAG
+GCCGACATCGGATTCTGGTGTTCGGGTTCGTCGGATTACCTGGCTGGACGAGCATTTTCGTTCATCTCCG
+CGATCGACTCCATCGGAGCCGTACCGCCGATCAACGAATCGCACGTCGAGATGGACGCCGCCTGGGCACT
+GTATGAGGCCTACATCAAACTGCTGACCGGCGAGGTCGACACCGCGCTGGTGTACGGCTTCGGGAAGTCC
+TCGGCCGGAACGCTGCGCCGTGTGCTGTCCCGCCAGACCGACCCGTACACCGTCGCGCCGCTGTGGCCGG
+ATTCGGTATCGATGGCGGGACTACAGGCGCGGTTGGGGCTGGACTCCGGCAAGTGGACCCACGAGCAGAT
+GGCGCGAGTGGCGTTCGATTCCTTCACCAACGCTCGCCGGGTGGATTCCGTGGAGCCGCCGATCACCGTC
+GGGGAACTGCTGGCACGGCCGTTTTTTGCCGATCCGCTGCGGCGCCACGACATTGCGCCGATTACCGACG
+GTGCCGCCGCGGTCGTGCTCGCGGCCGACAACCGCGCCCGAGAACTGCGCGAAAATCCGGCGTGGATCAC
+CGGAATCGAACATCGCATCGAGTCTCCGGCGCTGGGGGCGCGCGACATCACCGAGTCTCCGTCGACCAAA
+CTGGCGGCCAAGATAGCCACCGGCGGACACACCGGCGACATCGACGTGGCGGAGATCCATGGGCCCTTTA
+CCCACCAGCACCTGATCGTCGCGGAGGCCATCAGGATTCCGGGTAAGACGAAAGTGAATCCGTCCGGCGG
+CCCGTTGGCCGCCAACCCCATGTTCGCCGCCGGCCTTGAGCGTATCGGCTTTGCCGCACAACATATCTGG
+GACGGATCGGCGCGGCGCGTGCTGGCGCACGCCACCAGCGGACCGGCGCTGCAGCAAAACCTGGTCGCGG
+TCATGGAAGGACGGGGATAGTGGAGGGGCAGCGCTGATGGCCGGAAAGCTGGCCGCCGTACTCGGCACCG
+GGCAGACCAAGTATGTCGCCAAGCGCCAAGACGTTTCGATGAACGGTCTGGTGCGGGAGGCCATCGACCG
+AGCGCTGGCGGATTCCGGTTCCACCTTCGACGACATCGACGCCGTCGTGGTCGGCAAGGCGCCCGACTTC
+TTCGAAGGGGTGATGATGCCGGAGCTATTCATGGCCGACGCCATGGGCGCGACCGGCAAGCCGCTGATCC
+GGGTACACACCGCCGGTTCGGTTGGCGGATCCACCGGGGTAGTGGCTGCCAGCCTGGTGCAATCCGGCAA
+ATACCGCCGGGTCCTGGCATTAGCCTGGGAAAAGCAGTCGGAATCCAATGCCATGTGGGCGTTGTCGATT
+CCTGTGCCGTTCACCAAACCGGTCGGTGCCGGTGCGGGGGGATACTTCGCCCCGCATGTCCGGGCCTATA
+TCCGCCGCTCGGGCGCACCGGCACACATCGGTGCTATGGTTGCGGTCAAGGACCGGCTCAACGGCAGCCG
+CAACCCGTTGGCACATCTGCAGCAGCCCGACATCACCCTGGAGAAGGTGATGGCATCTCAGATGCTCTGG
+GATCCAATACGTTTCGATGAGACGTGCCCGTCGTCAGACGGTGCGTGCGCGGTTGTCGTCGGCGACGAGG
+AGATCGCCGACGCGCGACTGGCGCAAGGGCATCCGGTGGCCTGGATTCATGGCACCGCATTACGCACCGA
+GCCGCTGGCTTTCGCCGGGCGCGACCAGGTCAACCCGCAGGCCGGCCGCGACGCGGCGGCGGCGCTGTGG
+AAGGCCGCGGGCATCACCAGCCCCATCGACGAAATCGACGCCGCCGAAATTTACGTCCCGTTCTCCTGGT
+TCGAGCCGATGTGGTTGGAGAATCTGGGATTTGCCCGCGAGGGCGAGGGCTGGAAGCTCACCGAGGCCGG
+CGAGACTGCGATCGGCGGTCGACTACCGGTGAACCCTTCCGGCGGCGTGCTGTCCGCCAATCCGATCGGC
+GCATCGGGCCTGATCCGCTTCGCCGAGGCCGCGATCCAAGTCATGGGCAAGGCGGAGGCGCGTCAAGTTC
+CGGGTGCGCGAAAGGCCTTGGGGCACGCTTACGGTGGCGGCTCGCAGTACTTCTCTATGTGGGTGGTCGG
+CTGCGAGAAACCCAAACAGGCAGCCGCATAATCGCCCGGCGCGATCCGGGCGACGCCGCAGACCATCCGA
+GCATGGTGAAGTTCACACCCGATAGCCAGACGTCAGTTCTGCGCGCGGGCAAGTGCTCAGGTACTCTTTC
+TCCGTCGCGGTCGCGATTGCAAAGGGGGAGCTGGCCGGTGGATTCCGAACGCCGACGCTACGGGTGGCCG
+CGGAATCGACGCACCTTAGCCATTACTGGAGCTGCAGTCGTTGTCGTGGTGACCCTCGCAGCCATTGGTT
+ACCTGATCTTTGAGCCAAAAATTTCTGGGTCGTCCACGTCCAGGCAGGCCGCATCGCCAACCACTCCTTC
+CCCGCCCAGCCAGGTCGTGGTGCCGATCGACCTTTGGAATCCCGACGGGGTGACGGTGGACCTGGCGGAC
+GCCGTTTACGTGGCCGACTCCGGTCACAAGCGACTGCTGAAACTGCCGGCCGGCTCCAACACCCCGACCA
+CGTTGCCATTCACCGACACCATCGGTCCAGGCGGCGTGGCGGTAAACAGCAACCGCGACGTCTATGTCAT
+CGATGAAGACAGCCACCATGTGTTGAAACTCGCGGCCGGCATCGAACCCCCGGTCGAGCTCCCGTTCGGC
+AGCCTTGGCGATGCGCATGGTTTGGCAGTGGACCGCAGCGACAGCGTCTATGTCGTCGACTATGACAATG
+CCAAAGTGTTGAAACTGCCCCCAGGCGCAGATACCCCTACCGAACTGCCGTTCGTCGGGCTCGACCACCC
+CTATGATGTGGCGGTGGACGGTGCTGGCACCGTCTACGTGACCGACAGCGGCCACAATCGCGTGGTGGCG
+TTGACCGCGGGGTCGGCCACGCCGGTGCACCTCCCATTCGCCGATCTCAGCTTTCCCGCCGGTGTGACGG
+TGGACCGCGACGATAGCGTCTATGTGGCCGATCTGAACAACAATCGGGTGCTGAAGCTGGCGGCCGGCTC
+GAATGCGCAGTCGCAGCTGCCGTTCACCGGACTCTTCTCCCCAACTGATGTGGCGGTGGACAACGACGGC
+GCCGTCTACGTGATCGACTTTTACAACCGGATGTTAAAACTGCCGACGGCTTAACCCGCAGCGACGCCTA
+CATGGGTTCCAGTCCGGCCAGATGCCGTGCAGCCAGGTCACGATAGGCCTGCGGATTGACGTTAACCCAC
+ATTTCCGCGCCCGTTCCTTCAATCGGTCCCTTCACCTTGGCCGGCGCTCCCGTTACCAGCATTCCGGCCG
+GAATCTGAGTGCCGGCCACCACCAGCGCTCCCGCGGCGATCATGCAGCGCGCGCCGATTACCGCTCCGTC
+GAGGACCGTCGCGTGGTTGGCGATCAGAGCCTCAGACCCGACGTGGACGCCGTGGATCACACACAGGTGC
+GCCACTGTCGCCCCCGGGCCGATGTCTACCGGGATGCCGGGCGGTGCGTGTAATACCGCCCCGTCCTGCA
+CATTGGCCCCCTCGCGCACGACGACGGGCGCATAGTCGCCGCGCAGCACGGCATTGAACCAGACCGACGC
+CCCAGCCTCGATGGTGACGTCGCCGATCAGGGTGGCTGTCGGGGCCACAAACGCGGTGGGATCGATCCGG
+GGCGATCGGCCCTCGAAAGAAAACAGCGGCATCGTTTAGATATACGCCCGTCGTACATATGCCGTGGCCA
+GACTCGCTGTCGTTGCGCTCACCGGAGAGAAAACTGTAACGTGTTCTAGTTAGCGATACCGATCGGGAGG
+TGACAGGTGAGTACCGACACGAGTGGGGTCGGTGTTCGGGAGATCGATGCCGGCGCCTTGCCGACCAGGT
+ATGCGCGTGGCTGGCATTGCCTGGGCGTCGCGAAGGACTATTTGGAAGGGAAGCCACACGGGGTAGAGGC
+GTTCGGCACCAAGCTGGTTGTGTTCGCTGATTCCCACGGGGACCTGAAAGTCCTCGACGGCTACTGCCGG
+CACATGGGCGGCGACCTGTCCGAGGGCACCGTCAAAGGCGACGAGGTCGCTTGCCCGTTCCACGACTGGC
+GCTGGGGTGGCGACGGCCGCTGCAAATTGGTGCCGTATGCCAGGCGCACACCCAGAATGGCGCGCACTCG
+GTCGTGGACGACCGATGTGCGCAGCGGGCTGCTGTTTGTCTGGCACGACCATGAGGGCAATCCACCCGAC
+CCCGCGGTCCGGATCCCCGAGATTCCCGAGGCGGCCAGCGACGAGTGGACCGACTGGCGGTGGAACCGCA
+TCCTCATCGAAGGGTCCAACTGCCGCGACATCATCGACAACGTCACCGATATGGCGCACTTCTTCTACAT
+CCACTTCGGTTTGCCGACGTACTTCAAGAACGTCTTCGAGGGCCACATCGCCTCGCAGTATCTGCACAAC
+GTGGGCCGGCCCGATGTCGACGATCTGGGGACGTCTTACGGTGAGGCGCATCTGGATTCGGAGGCGTCTT
+ACTTCGGGCCGTCGTTCATGATCAACTGGCTGCACAACCGCTACGGCAACTACAAGTCCGAGTCGATCCT
+GATCAACTGCCACTACCCGGTGACCCAGAACTCGTTCGTCCTGCAATGGGGCGTCATCGTCGAAAAGCCC
+AAGGGTATGAGCGAAGAGATGACCGACAAGTTGTCGCGGGTGTTCACCGAGGGCGTCAGCAAGGGCTTCT
+TGCAGGATGTCGAGATCTGGAAGCACAAGACCCGCATCGACAACCCGCTGCTGGTTGAAGAGGACGGCGC
+CGTGTATCAGCTGCGCCGCTGGTATGAACAGTTTTATGTCGACGTAGCCGACATAAAACCAGAGATGGTG
+GAGCGCTTCGAGATCGAGGTCGACACCAAGCGCGCCAACGAGTTCTGGAATGCCGAGGTAGAGAAGAACT
+TGAAATCGAGAGAAGTTTCCGACGACGTGCCCGCCGAGCAACACTGACGGACATGCCTGACGATCAGCCG
+GCGGTTCCCGACGTCGATCGGCTGGCCCGGTCGATGCTACTGCTGCACGGTGATCATCACGATCACAACG
+ATTCCCCCGAGCAACACCGCACATGTGGATCCTGGTCGAAGTCAAGGGATTTCGCTGACGACCCGCAGCG
+TGCTGCCGCGGTGCGCGAAGCCAGCCGCGCCGAGCGCGACCGTTATCTGACCTCAGGCCTGCAACCGGTG
+GATTGCCGGTTCTGCCATGTCACGGTGACCGTAAAGAGGCTGGGGCCGGGTCATACCGCTGTGCAATGGA
+ACACCGAGGCGTCGCGGCGCTGCGCGTACTTCACCGAGCTGCGGGCACGCGGCGGGGATTCCGCACGCAC
+CAGGTCCTGTCCCCGGCTGACCGACAGCATCGAACACGCAGTGGCCGAGGGCTACTTGGAGCACCACGAC
+CCAAACCGATAACGTCGCACACCCGCTTGCCGCGGGATACGGTGCCGCATCCGGCACGGTGCCACCGAGG
+CGTACGGTTTGTGACGGCGGTTCCGGGACTGAGCTTCCTATGAAGCCTCTCCGGTGTGCGCGAGTCGATC
+GAGGCGCACCAGAGCATCGTGTTCGCCGCCCTGGCGGTCAGAACTGGATTGAACACCAAACAGGTTGGAG
+CATCAAGAAATTCGTTCAAACACTACGTCGCTACCGCACCGTGACCCCGCGCCGGCAACCACACCCTCCG
+TGCGGGACCTTCAGGGTCCGATGCAAGAGCACCGGTCTGTTGGATGGGGATGCGACTCGTAGGCGATGCC
+CTGTCCATTCACTCGAGATCCATTCACTCGAGGTCGACTTCGCCCGGCCCGCCCCGCATCTCACAAAACG
+AGGGTTTACTGTGACCTTATTGTCGCGCAAAAAGAAAGGCCCGATTCTGAATATTGGGCAGCCAGCCAAA
+TCCGCGGCAATCCTCCTTGTAGAGCAGCTTGAAACCGAGTTCAGAAGCTTTTGATTCGAGATCAGCGTCG
+GTGATACCCCATTGCCAGATGTCTGGTATATCGCGCCACGGCTTGTCATGATCCGGGTGCTTTTTATCGA
+GTTTTTGAAAGAGATCTCTATAAGCCTTGTTAAGTTTGCTGTGCGGGACGTTACGAAAGTAGTGCTTTTC
+ACCCAGATCCAACAATCTAACTGTGGTTGTTGAACCTATCCATTGTTGATTATAAATCAGCAAACAACGT
+ACATTCTTTGCGTACATATCCAGGATAGTGTCCCAATCAGGCGACACTTGGTGCAGCAGCACATCGAATA
+GGAAGAGGGCGTCGACATTACCGACTTTATCGGCAATCTCCTGGTCTCCGAAGTTCCCCTCAATAACGCG
+AAGTTGCGGATATGAATTTGCACGGGCCGCGACTGTTGGAGTTATGCGGCCATCGACCAATACTGCCTCT
+TTTACCGGGTACTTATCCAGGGCGCGAAATGTATAGGCGCCTTCCACTCCCCAAACGGCACCGAGATCCG
+CGAACGACTCTATGCGACATGATGTGAAAGCCCGATCTATCAGGTTGATTTTGCCTCTAACGAGCCAATA
+GCCACCCTGTCGTAACCGATCCAACATCATTTCACCTCAAATACGTGTGTTCAACTGGCGTCTCGCTGGA
+TGGTAGATCACCGCTAGCTGGTCCAGTATGCCGCCTGCCATGAGCTTGGGACCAGTGTGATCTGCTTGTG
+CCAGGGGGAGGACGGGACCACCTTGATTGCCAGTCACGGGACCACGGCGCGCCGCGCCGGTGGTCTTTTC
+GCTTATTCGTGCGATCGTCGTGACAGCTCAAGTCACGGGAGGCGGCGGGCATGGCTTTTCGGGAGGTCAG
+TATGAACAAGATCAGGGAAGTGCTGCGGGTCTGGCTGGGGGTGGCCGGGTTGCCGGCCCCGGGGTGCCGC
+ACGATCGCCGCGCATTGCGGTATGGACCGCAAGACGGTGCGGCGCTACGTGGAGGCCCGCGCAGGCACCC
+GGTCTGCCCCGCGACGACGATGTCAGCGCTATCGATGACGGGTTGATCGGGGCGGTCGCCGACGCGGTGC
+GTCCGGCCCGGCCGGATGGTCATGGTGCGGCGTGGGAGCAACTGCTGGGGGTAGCGAACTGTTCACTACC
+CCCTGGCAATCAGGTGGTCCCGTCTCCCTGGCAAGCGACAGCTCGGGCAATCCACCTGGTAATCAAACAA
+TTTCGGGCGGCTGGCGAGTTGTCGCGCTGAGGCGGGCAAATTGCGTATCTGCTCGACCAATGCGACGCGG
+CTGGCCAAACAGCACACCGAATCACAGCCCGGCGAACCGCTCTTTGACCATTTCGACCGTGAGCCCGTAG
+TCAGCCAACGAATAGGAATGCTTTGGGGCCCGGGCACCGCTCTGGCTCTCGGCGTGGACGGTTGTCATTG
+CCTGTCGAGCCTCGTCGGACAGCGTCAACCCGAAGTGCCGGTAGATATCTGCCACCGTACCCAGCGGATC
+GGCAATCAAGTCGTGGTAGTCCACGTCGTAGAACTGGGCCGAATCATATTTGGCCCGTGCGGCATTGAAC
+CGCTCCAGCCCACGCGACCAGGTGTCCATCGCGTCCGCACCGATCTGGGCGCCCACAAACTTCGTCGACC
+ACCCTTCTGTGGTGTGCTGCGCCAGCGAGCACATCGACGCCATGATCGTCTCCACCGGCCGGTGAGTCTG
+CACCACCAGGGCATCGGGATAGGTCGCCATCAGCGCATCCAGGGCAAATAGATGACTCGGATTCTTTAGT
+ACCCACCGCTTTTCGGCATCGTTGAGCCCAATCAGCTGCAGGTTGCGGCGGTGCCGGCAATACGACGGCG
+TCCAGTCCTGGCGTGACAACCAGTCGGCATAGCTGGGTACATGCGCCAGCGCCTCGTACGACACCGAATG
+CAGCGACTGCCGCAACAGCTGCCAACACTCCTCCAACTCGTAGGCCGCCATGAAATGCAAGCCGGTGTAT
+CCCGGATTCTCGGCATGATGCTGGGTGAACTGTGCATCGAGCTGGCGATACAACGGGTTTGACTCCCAGG
+TCTCGCGCGGGGGGCGCGGCTGCGGGTACTCGGCCAGCCACATGTGCAGGCCTTGGTGGGCCGGGTCGGC
+GCCCAGCAGCCGGTGCAGCGCAGTGGTTCCGGTGCGCACCAACCCGGTGACGAAGATAGGCCGTTTGATG
+GCAACGTCGACGTGCTCCGGATACTGCTTCCACGCGGACTGGGACAGTAGCCTGGCCACCAGCGCACCGC
+GCAGGAAGAACCGGTTCATCTTGCTGCCCAACACGGTGAGGCCGGCTTCGCCCTGGTAAGCGTCCAGCAA
+CACACCCAGCGCCTCACGGTAGTTGTCGTCGTCGGTGCCAAAATCGTCGAGACCCACCAGTTTGGTAGCC
+GATGCGTGCAGTTCGTCGACGGTGGCCACATCTTTCCGATCGGGACGCCGAGTCATTACGTGTGGTACTC
+CCCGCAATTGACGTCCAGGGTCTGCCCGGTGATGCCGCTGGCCAGGTCGCTGGCCAGGAAAAGAATCGCT
+GAGGCCACCTCGTCTTCGGTTGGCAGCCGTTTGAGATCGGAGTTTGCCGCGGTCGCCTGATAGATCTGAT
+CCACGGTAGTGCCGTATTTGCCGGCCTGATGGTCGAAATAGCTTTTCAGCGTGTCACCCCAGATATAGCC
+GGGTGCAACGGAATTGACGCGAATTCCCTGCTCGCCCAGTTCCGTGGCCAGCGAATGCGACATAGCTAGC
+AGTACGGACTTGGCCATCTTGTAGGTGCCGTATTTCGGCTGCGAGTGCCGGATCACCATGGAGTTGACGT
+TGACGATCGCGCCGTGAGACTGCGCCAGCGCGGGCGTAAACGCCTGGATGAGTCGCAGCGTCCCCAGCGC
+GCTGAGCTCTATCGCGTCACGGATGTGCTCAAATGTGGTGCCGGCCAATGGTTTCATCGATGGCACCCGG
+AACGCGTTGTTGATCAGCACGTCGGCCTTGCCGTACGCCGCCAGCGTGGCCTGCACAAGGTTGCTTACGT
+CGTCGTCGTCGGTGATGTCGGTGCGCACCGCCACCGCCCGTCGCCCGGTGTCGATGATCTGCTTGGCGAC
+GTCGTCGAGACGCTCCGCGCTGCGCGCAGCCAGCACCAGATCGGCGCCGTCTCGCGCACATCGGTGCGCC
+AGCGTCGTGCCCAGCCCCGGTCCGACGCCACTGACGACGATCACCTTGCGCTTGAGCATCCCGGTCATCC
+CAGCATCCTGGTCGCGATTTGCCGTTGACGCAACGCAATTCGCGCCCGCCAATCATCCTCGGAAATCTTG
+TTGTGCTGGTAATGCGGCAGTGCCGCCGGGATGGCGTCGAAGTCGACCAGTTCGACGGTGGGCCCATCGG
+CCTCGGTGAGCTCACGGGATACCCGCTGCCAGCGGAACTGCAGAAACCCGCGCCGATGGCCGAGCGTTTC
+CACCCAGTTGGTCACACCCGGATTCTGCTCGGCGACCACGATGCGCACCTTGCCATCCGGGTCCGCTTGG
+GCCTGGCTGGCATTCAACGAGGTCTGATGATTGATATAGTCCAGCGAGATGTACCACATGCTGCCCAACT
+GAAACCCTAAGTAGGGGGCGTCGCTCACCGGCACCGTGATCACCAGCGCTTGACCCGGCCGCAGCTCGAA
+ATGACCGGCTGACGAGTATTGGGTGGCCAGGCCACCGGGAGTCAACCGAGGCGCCACCATGGTGTTAACC
+GGGATATTGAGGTAGAACCACTGGGGAAACTGTAACCAGGTTTTCACCCGGTTCACAAGCTGGGATCCCG
+CTGTGGCATAACGCTTTTCCATGAGCTCGCGAGTCAGCGGCGGCGGCGCGGTGCCGACGGTGTCCAGCCT
+GGCGATGGCCAGCGTGCCGCGCTGTTGTGACCAATCGCCGTACACCTCCCGGATCACTAGTTGCCCGGGA
+GCGCTGGGCCGCAACCGCCATTCGAAGCTGCCGTCCGCGGCGATGTCGAGCTCACGGTCGTCGAACGCGG
+CCTGGCTGGCCGGCACGTTATAGTCAGTGTACTCGCCGCCGAGCAGCTGAAAGCTCAGGTCGGTGGTGGT
+GCCGCGCCGTCCGCTGACCACATAGTCGCGGTTGGCCTGCAGCCGGGTGCCGAAGTAGAGGGTGTCGGGG
+TTGTCCAGGCCCATCTTCGTGAACGGCCCTGTTCCGGACTGCAGGAACGGGTGGTCACGCTCGTAGTCGA
+AGGCCAGGTGCATGCAGCCCGCGATGCAGCCGGCCAGGTATTGCAGCCCTTCGAGCAGGTCGGCTTCAGT
+CTCGATGTGCGGGGCGGCGGCTACCAGCTGCTCGGCTTCTGCGATCGCCTCGCGCAGCGGGTCGGAGTAC
+ACGACTTCGACACTAGAACGTGTTCCTGTTTTGCGTCAATGGCGAACATCTGCCCCCGTCATTTACGGCA
+ATTGAAGACAAAGCCCGCTCGCTTCCAGAGCCCTGCGCACGAGCTACCCATTATTGATCTAGCTTATTGT
+TGCGTTATACGACAGTCTGAGCAGTATATTGTCCGCTATATGTGTATTCGTAGCGGCGTGGATTGACGCG
+AGGCTGGTCGAGACCCGGTCCGTGAGATGCGCCGGAAAGGGTGTCGCGATGCGGAACTCTACTGACCGTC
+CAGCGGCGGCTAACGAAGTCTGCATCCGCGACAGCCACCCAATGACGCGCCTGCCGTTGCGATCTCAGCA
+CTGACGGCAGCCCGGCCTATCCGCGACCAGCTAGGGAAAGGCATTCGCAGATGTTCATGGATTTCGCGAT
+GCTTCCGCCGGAAGTCAACTCGACACGGATGTATAGCGGGCCGGGAGCGGGCTCGTTGTGGGCCGCCGCC
+GCCGCCTGGGATCAGGTGTCGGCGGAATTGCAGTCGGCGGCGGAGACCTACCGCTCGGTGATCGCCAGCC
+TCACCGGCTGGCAATGGCTGGGTCCATCGTCTGTGAGGATGGGTGCGGCGGTCACCCCGTATGTTGAGTG
+GCTGACCACCACCGCCGCGCAGGCAAGGCAGACGGCCACCCAGATCACCGCGGCCGCGACCGGATTTGAG
+CAGGCGTTCGCCATGACGGTGCCGCCACCGGCAATCATGGCCAACCGTGCACAGGTGCTATCGCTGATAG
+CGACCAACTTTTTCGGCCAGAACACCGCGGCGATTGCGGCCCTGGAGACCCAGTACGCCGAGATGTGGGA
+ACAGGACGCCACCGCCATGTACGACTACGCGGCCACCTCGGCGGCAGCGCGGACTTTGACACCATTTACC
+TCCCCGCAGCAAGACACCAACTCAGCCGGTCTGCCGGCGCAAAGCGCCGAAGTCAGCCGCGCGACCGCCA
+ACGCCGGCGCCGCCGACGGCAACTGGCTGGGAAACCTCCTGGAAGAAATCGGAATACTGCTGCTGCCGAT
+CGCGCCCGAGCTGACACCCTTTTTCCTGGAGGCGGGCGAAATCGTCAATGCGATACCTTTCCCGAGCATC
+GTCGGGGACGAGTTCTGTTTGCTCGACGGCCTACTGGCTTGGTACGCAACGATCGGCTCGATCAACAACA
+TCAATTCGATGGGTACCGGCATCATTGGGGCCGAGAAGAATTTGGGGATCTTGCCCGAGCTAGGGAGCGC
+GGCTGCGGCGGCCGCTCCCCCACCAGCCGACATCGCCCCGGCGTTCCTCGCGCCGCTGACCAGCATGGCC
+AAGTCACTATCGGACGGAGCACTACGCGGCCCGGGCGAAGTTTCGGCCGCGATGCGCGGCGCGGGTACCA
+TCGGGCAAATGTCGGTGCCGCCCGCCTGGAAGGCGCCCGCGGTCACCACCGTCAGGGCGTTCGATGCCAC
+CCCAATGACCACACTGCCCGGCGGCGACGCCCCCGCCGCTGGAGTGCCTGGACTGCCCGGGATGCCAGCC
+TCGGGGGCCGGACGGGCTGGCGTGGTGCCCCGATACGGCGTACGGCTGACCGTGATGACACGTCCACTCT
+CGGGCGGGTGACATCAGTGCGTGATGGCGGCGCACCTTGACCGTCGCGCATTGCGCTTCCAACACCAACG
+AACTGGGACTGCAGTAGTAGCGCAACCGCGCTTGGAGCGGGTCCCCACCGGTTATGGCATTCGATACCGC
+ACCAAAGCGAAATCAGTTCCCGAACCCCGACCGCTGGTTCTCGCTGTTGAAGCCGCCCGAGTTGTGGACG
+CCCGAGTTGAAGAATCCGGAGTTTAAGACGCCCGAGTTTGCGATACCCACCGTTTGGGCGCCGGTGTTTC
+CGAAACCCGCCGCGATGACGGTGCCGACCGCGTTTTGCAGGCCCGAGTTGTTGCTGCCCCCGTTCTGGAA
+CCCCGAGCTGCCAACGCCCGTGTTGAAGAAGCCCGAGTTGTTCGTGCCGGCGTTGCCGAAACCCGAGTTC
+GGGCCGGAGCCGGTGCCGACGGCGCCGAACCCGGTGTTGAGCGAACCCGCGTTGAAGGCGCCGGTGTTAG
+TGAGGCCCGAGTTTGACCAGCCGGTATTTCTGACGCCGGCGTTGAAATCACCGGTATTGCCTTGTCCGGA
+ATTGAAGTTGCCCGTGTTGATGCTGCCCGCGTTGAAGCTGCCCGCATTCAACTGGCCCGAGTTCCCGAAG
+CCGAGGTTTATTGCGCCGCCGTTTCCGAAACCGGTATTCACGCCCCCGGCGTTTCCCATGCCCGTGTTGA
+GCGAACCCGAGTTCCCGAAACCGGTGTTATGGCCCGCCACGAACGGGCCCACGGTGGCCCCCGAGTTTCC
+GATGCCCACATTCGCGTCGCTGGAGTTGCCGATACCCAGGTTGCCGTTGCCGGAGTTGAAGAAACCGACG
+TTGTTGGTGCCCGAGTTGAACAAGCCGATGTTTCCGCTGCCCGAGTTCAGCCCACCGATGCCCACCTGGT
+TGTTGCCGGTGAGCCCGAAGCCGATGTTGCCGTTGCCGGTGTTGCCGAAACCGATGTTGCCAATGCCGTT
+GTTGCCGAAGCCCCAGTTGCTGCTGCCGGTGTTCCCGGCGCCGATGTTGCCGCTGCCGGCGTTTCCGGTG
+CCGACGTTGTTGTTGCCGGTATTCCCGAACCCGACGTTGGAGTTGCCGGTATTGCCGCTGCCCAGGTTGC
+TGTTGCCGAGGTTCCCGTTGCCGACGTTCCCACTGCCTGGAAGTCCCGCCCTCCCGTTGCCGCTGCCGAA
+GTTGCCGTTGCCGACGTTCCCGCCGCCCACGTTGGAGTTGCCGATGTTGCCGCTGCCCAGGTTCGCGTCA
+CCCCGGTTCCCGCTGCCCAGGTTGGTGTTACCGATGTTGCCGTTGCCGGTGTTCAGGTCGCCGGTGTTGC
+CGCCGCCCAGGTTGGCGTTGCCGATATTGCCGATACCCAGGTTCGGCAGCTGCTGCAGCGCCTGCTGAAA
+GGGCACCAACTGCTCGGCCGCCGCCGAGGCCCCGGAGTGGTAGCCCACCATCGCGGCCACATCCGCGGCC
+CACATCTGTTCGTAGGCGCCCTCAACGGCCGCAATCAGCGGCGCGTTCAGCCCGAACCAATTCGACATCA
+CCAACTGCGCAAACGCATTGCGGTTGGCCGCCACCAGCAAAGGGTGCACCGTCGCCGCCCGTGCCGCCTC
+GAACGCGCTGGCCACCGCCTTGGCCTGGGCCGCCGCCCCCGCGGCCCGGGCCGCCGCAGCGCTCAACCAT
+CCCGCATACGGTGCCGCCGCCGCCGCCATCGCCGCCGCCGCCGGCCCCTGCCACGCCTGACTTGCCAAGT
+CCGAGGTCACCGACCCAAACGAGGACGCCGCGGACCCCAACTCTGCGGCCAGCCCGTCCCAGGCCACCGC
+CGCCGCCAACATCGGCGCCGAACCTGCACCCGTGAACATCCGCAACGAATTAAGCTCCGGCGGCAATACC
+GCATAGTTCATGACCCCGTCCCTTCCCGACCTGACAATCAGTCAGAACCGTAGGACAAACCGGGTCGGAC
+CATCTGCGTTTCCGTGAAATCCGCGAACCAGCGGTGTCGTCAATGCGTTACGGCCGCACCGCTATCCAGC
+TCGCGTTTGATTTCCAGCGCGATGTCGATGAGCTGGTCTTCCTGGCCACCGATGAGCTTGCGCTGACCGG
+CCCGGTGCAACAGCGCCGACGCCGGCACGCCGTAGCGCTCGGCCTGGCGGACCGCATGCTTGAGGAAGCT
+GGAGTAGACCCCGGAATACCCCATGATCAACGCGTTGCGGTCGAGCAGACATTCGGCCGGCATGGCCGGG
+CGCACCACGTCCTCGGCGGCGTCGGCAATGTCGAAGAAATCAATGCCGGTCTTGACGCCGATCTTGTCGA
+ACACCCCGATCAGCGCCTCGACCGGCGCGTTACCCGCCCCGGCGCCGAAACGCCGGCAGGACCCGTCGAT
+CTGCTTGGCGCCCGCGCGCACCGCCGCCACCGAATTGGCCACCCCGAGACCGAGGTTCTCGTGCCCATGA
+AAGCCCACCTGGGCGTCTTCGCCGAGCTCGGCGACCAGGGCCGACACCCGGTCGGCCACGCCGTCGAGCA
+CCAGGGCACCGGCGGAGTCGACGACGTAGACACACTGGCAGCCGGCGTCGGCCATGATGCGGGCCTGGGC
+GGCCAGTTTCTCCGGCGCAATGGTGTGGGCCATCATCAAAAACCCGACGGTTTCCAGACCCAGTTCGCGG
+GCCAGCCCGAAATGCTGGATCGACACGTCGGCCTCGGTGCAGTGGGTGGCGATCCGGCAGATCGACCCGC
+CGTTGTCCCGCGCCTCTTTGATGTCGTCCTTGGTGCCCACACCGGGCAACATCAAAAACGCGATCCGGGC
+CTCTTTCGCGGTCGCCGCGGCCAGCTTGATCAGCTCCTGCTCAGGGGTTTTCGAGAAGCCATAGTTGAAC
+GATGAGCCGCCCAGGCCGTCGCCGTGGGTCACCTCGATCACCGGCACGCCAGCGGCGTCTAGGGCGGCCA
+CGATGGCACCGACCTCGTCCTTGGTGAATTGGTGGCGTTTGTGGTGCGACCCATCCCGCAGCGAGGTGTC
+CGTGATGCGGACGTCCCACATATCGGTCATCGCGCTCCTCCTACAACCAGCGTCTCCTTGGCGATCTCCT
+CGCCCACCTTGGTGGCCGCCGCGGTCATGATGTCCAGGTTGCCCGCATAGGGCGGCAGGTAATCCCCGGC
+GCCCTCAACCTCGACGAACGTGGTGACCAGCGCCTGCCCGCCCGAGTTGATCGACGGCTCGTCGAACTGC
+GGTTCGTTGAGCAGCCGGTATCCAGGCACGTAGGTCTGCACCTCTTTGACGACGTCGTGGATGGAGGCGG
+CGATCGCTTCGCGGTCGGCGTCGGTGGGGATGGCGCAAAAGATGGTGTCGCGCATGATCATCGGCGGGTC
+GGCGGGATTCAAGATGATGATCGCCTTGCCGCGGGCGGCCCCGCCGATGGTCTGGACCCCACGGGCGGTG
+GTCTTGGTGAACTCGTCGATGTTGGCGCGCGTGCCCGGTCCCGCTGAAACGGAAGCCACCGACGCCACGA
+TCTCGGCGTAGGGCACCTCCACGATCCGAGACACCGCGTACACGATCGGAATGGTCGCCTGTCCCCCGCA
+GGTGATCATGTTGACGTTCGGCGCGTCCAGGTGCTCGCGCAGGTTCGCCGGCGGGATCACCGCCGGACCC
+ACCGCCGCCGGCGTCAGGTCGATGGCCCGGATCCCGGCCTCGGCGTACTTGGGCGCCGCGTCCCGGTGCA
+CGTAGGCACTGGTTGCCTCGAACACCAGGTCGGGTTTATCGGGCTGCGCCAGCAGCCAGTCCACCCCCTC
+GTGGGTGGTCTCCAAACCCAGCTTGGCCGCGCGCGCCAGGCCATCGCTCTCCGGGTCGATGCCCACCATC
+CAGCGCGGCTCCAGCCACTCCGATCGCAGCAGCTTGTACAGCAGATCGGTGCTGATATTTCCCGACCCGA
+CAATCGCCACTTTTGCCTTGGACGGCATGTTGCTCCCCTTATTCGAACGACAACCGGACCAAACCCAGCC
+CGGTGAAGTCGGCGACAAACTCGTCGCCGGCCCGCGCCTCGACCGCGAACGTGCATGACCCGGGTAACAC
+GATGTCGCCTTTGCGCAGCCGCACGCCGAAACTCTCGACCTTGCCGGCCAGCCAAGCCACCGCGGTCGCC
+GGGTTACCCAACACCGCATCACTGCGGCCCTCGGCCACCACCTCGCCGTTGCGGGTCAGCTTCGCATCGA
+TCGCCCTGACGTCAAGATCGGCCGGCGGCACCCGGGCCGCGCCCAACACGAAGCCCGCCGCCGAGGCGTT
+GTCGGCGATGGTGTCGCAGATCTTGATCTGCCAATCCTTGATCCTGGTGTCGATCAGCTCGATGGCGGGC
+ACCAGGGCCTCGGTGGCCGCCAGCACGTCGTCCTCGGTGCAGCCCGCACCCGGTAGGTCGGCGGCCAGGA
+TGAAGCCCACCTCCACCTCAACCCGCGGAGACAGGTACCGGGACGCCTGGACCGGCGTGTCTTCGAACAC
+CTGCATGTCGTCGAGCAGGTGTCCGTAGTCTGGTTCGTCAACCCCCATCATCTGCTGCATGATCGGCGAC
+GACAGCCCGACCTTATGACCCACCACGCGGGCACCCTCGGCCACCCGCTGCCGGATGTTGATCAACTGGA
+TCTCGTAGGCGTCGACGACATCGATCTCGGGATGGGCGGCGGTCAGTTGACCGATCGGGTCGCGGCTTCG
+CTCGGCTTGTGCTAGGTCGGCGGCCAGCTCATCACGGGTGGCATCACGGAGCATTCGGCGAAGTCCCCTC
+GTAGGCGTGACCGGGCCAGTAGCGCCCGACCCGAGCAATTCTATAACGTGTTCTACATGACTGTGCAGGA
+GTTCGACGTCGTGGTGGTCGGCAGCGGCGCCGCCGGCATGGTTGCTGCGCTGGTCGCCGCTCACCGAGGT
+CTCTCGACGGTAGTCGTCGAGAAGGCCCCGCACTACGGCGGCTCCACCGCACGCTCGGGCGGCGGCGTCT
+GGATCCCCAACAACGAGGTCCTCAAGCGCCGCGGCGTTCGAGATACACCGGAGGCGGCACGCACCTATCT
+GCACGGCATCGTCGGCGAAATCGTCGAGCCGGAACGCATCGATGCTTACCTCGACCGCGGGCCCGAGATG
+CTGTCGTTCGTGCTGAAGCACACGCCGCTGAAGATGTGCTGGGTACCCGGCTACTCCGACTACTACCCCG
+AGGCTCCGGGCGGCCGCCCGGGCGGACGTTCGATCGAGCCGAAACCGTTCAACGCGCGCAAGCTTGGTGC
+CGACATGGCCGGGCTGGAGCCCGCGTATGGCAAGGTTCCGCTCAATGTGGTTGTGATGCAGCAGGACTAC
+GTTCGCCTCAATCAGCTCAAACGTCACCCCCGTGGCGTGCTGCGCAGCATGAAGGTCGGCGCCCGCACGA
+TGTGGGCGAAGGCAACAGGTAAGAACCTGGTCGGCATGGGTCGAGCCCTCATTGGGCCGTTGCGGATCGG
+GTTGCAGCGCGCCGGAGTGCCGGTCGAACTCAACACCGCCTTCACCGATCTTTTCGTCGAAAATGGCGTC
+GTGTCCGGGGTATACGTCCGCGATTCCCACGAGGCGGAATCCGCTGAGCCGCAGCTGATCCGGGCTCGCC
+GCGGCGTGATCCTGGCCTGTGGTGGTTTCGAGCATAACGAGCAGATGCGAATCAAGTACCAGCGGGCACC
+CATCACCACCGAGTGGACCGTGGGCGCCAGCGCCAATACCGGTGACGGCATTCTCGCCGCCGAAAAGCTC
+GGCGCAGCACTGGATCTGATGGATGACGCTTGGTGGGGCCCGACGGTACCGCTGGTCGGCAAACCATGGT
+TCGCGCTCTCGGAGCGCAACTCTCCCGGTTCGATCATCGTCAACATGTCAGGCAAGCGATTCATGAACGA
+ATCGATGCCATACGTCGAAGCCTGTCATCATATGTACGGCGGCGAACACGGCCAGGGGCCCGGACCGGGC
+GAGAACATTCCGGCGTGGCTGGTGTTCGACCAGCGATACCGGGACCGCTACATCTTCGCGGGACTACAAC
+CAGGGCAACGCATTCCGAGCAGGTGGCTGGATTCCGGCGTCATCGTCCAGGCCGATACCCTTGCGGAGCT
+GGCCGGCAAGGCCGGTCTACCCGCGGACGAACTCACTGCCACCGTCCAGCGTTTCAACGCATTCGCCCGG
+TCCGGTGTCGACGAGGACTACCACCGCGGGGAAAGTGCCTACGATCGCTACTACGGCGACCCGAGCAACA
+AGCCCAATCCGAACCTCGGCGAGGTCGGCCACCCGCCCTATTATGGCGCCAAGATGGTTCCGGGCGACCT
+GGGGACCAAGGGCGGTATCCGCACCGATGTCAACGGACGTGCTCTGCGGGACGACGGCAGCATCATCGAC
+GGCCTTTACGCTGCAGGCAATGTCAGTGCCCCAGTGATGGGACACACCTACCCCGGTCCGGGCGGCACGA
+TAGGCCCGGCGATGACGTTCGGGTACCTGGCGGCGCTGCACATTGCCGATCAGGCGGGAAAGCGCTGATA
+TGCCCATCGACTTGGACGTCGCGCTGGGTGCACAGCTACCGCCCGTCGAATTCTCTTGGACCAGTACCGA
+TGTGCAGCTCTACCAGCTGGGACTGGGCGCCGGCTCTGATCCGATGAACCCCCGTGAGCTGAGTTATCTG
+GCGGACGATACACCGCAGGTGTTGCCGACGTTCGGCAACGTCGCGGCCACCTTCCACCTCACCACACCAC
+CGACCGTCCAGTTTCCGGGCATCGATATCGAGCTCAGCAAGGTGCTGCACGCCAGCGAGCGAGTCGAGGT
+TCCCGCCCCGCTGCCGCCGTCGGGTTCGGCCAGGGCGGTCACCCGGTTCACCGACATCTGGGACAAGGGC
+AAAGCCGCGGTAATCTGCAGCGAAACGACGGCGACCACACCGGACGGCTTGCTGCTGTGGACGCAGAAGC
+GGTCGATCTATGCCCGTGGCGAAGGCGGATTCGGCGGCAAGCGCGGGCCGTCGGGATCAGATGTCGCGCC
+GGAGCGGGCGCCCGATCTGCAGGTCGCGATGCCGATTCTGCCGCAGCAAGCGCTGCTCTACCGGCTCTGC
+GGCGACCGCAACCCGCTGCACTCGGATCCCGAATTCGCCGCTGCCGCAGGCTTTCCCCGGCCTATTCTGC
+ATGGCCTGTGCACCTATGGGATGACCTGCAAGGCGATCGTCGATGCATTGCTGGACTCCGATGCGACGGC
+CGTGGCCGGCTACGGCGCACGCTTTGCTGGCGTGGCGTACCCGGGCGAGACGCTCACGGTCAACGTGTGG
+AAGGACGGCCGCCGCCTGGTGGCCAGTGTCGTCGCACCCACTCGTGACAACGCTGTGGTGCTCAGCGGAG
+TGGAGCTAGTGCCGGCATAGCGGTGCGGTCGGCGCTAAAGGTTTGGTGAGACTGCGGATTTCGCAGAAGT
+CGACATGACATTGCTGCTATGGTCTGCGGTGACGGGGCCGTCGCAGTGGTGGCGCGGCGGTTGGGCCGAG
+CCGGCGGGATGTTGTCATGGCGGATTTCTTGACGTTGTCACCAGAGGTGAATTCGGCCCGGATGTACGCG
+GGTGGGGGGCCCGGGTCGCTATCGGCGGCCGCGGCGGCCTGGGATGAGTTGGCCGCCGAACTGTGGTTGG
+CGGCGGCCTCGTTCGAGTCGGTGTGCTCCGGCCTGGCGGACCGTTGGTGGCAAGGGCCGTCGTCTCGGAT
+GATGGCGGCGCAGGCCGCCCGCCATACGGGGTGGCTGGCCGCGGCGGCCACCCAGGCAGAGGGAGCAGCC
+AGCCAGGCTCAGACGATGGCGCTGGCCTATGAAGCGGCGTTCGCCGCAACCGTACACCCGGCGCTGGTCG
+CGGCGAACCGCGCCCTCGTGGCCTGGTTGGCGGGGTCGAATGTGTTCGGGCAGAACACCCCGGCGATTGC
+GGCCGCCGAGGCCATCTACGAGCAGATGTGGGCTCAGGATGTTGTCGCGATGTTGAACTACCATGCGGTG
+GCCTCGGCGGTCGGGGCGCGGTTGCGGCCGTGGCAGCAGTTGCTGCATGAGCTGCCCAGGCGGTTGGGCG
+GCGAACACTCCGACAGCACAAACACGGAACTCGCTAACCCGAGTTCAACGACGACACGCATTACCGTCCC
+CGGCGCATCTCCGGTGCATGCAGCGACGTTACTGCCGTTCATCGGAAGGCTACTGGCGGCGCGTTATGCC
+GAGCTGAACACCGCGATCGGCACGAACTGGTTTCCGGGCACCACGCCAGAAGTGGTGAGCTATCCGGCCA
+CCATCGGGGTCCTTAGCGGCTCTCTTGGCGCCGTCGATGCCAACCAGTCCATCGCTATCGGTCAGCAGAT
+GTTGCACAACGAGATCCTGGCCGCCACGGCCTCCGGTCAGCCGGTGACGGTGGCCGGACTGTCGATGGGC
+AGCATGGTCATCGACCGCGAACTTGCCTATCTGGCCATCGACCCCAACGCGCCACCCTCGAGCGCGCTCA
+CATTCGTCGAGCTCGCCGGCCCGGAACGCGGTCTTGCCCAGACCTACCTGCCCGTTGGCACCACCATTCC
+AATCGCGGGGTACACCGTGGGGAATGCGCCCGAGAGCCAGTACAACACCAGCGTGGTTTATAGCCAGTAC
+GATATCTGGGCCGATCCGCCCGACCGTCCGTGGAACCTGTTGGCCGGCGCCAACGCACTGATGGGCGCGG
+CTTACTTTCACGATCTGACCGCCTACGCCGCACCACAACAGGGGATAGAGATCGCCGCTGTCACGAGTTC
+ACTGGGCGGAACCACGACAACGTACATGATTCCGTCGCCCACGCTGCCGTTGCTGTTGCCACTGAAGCAG
+ATCGGTGTCCCAGACTGGATCGTCGGCGGGCTGAACAACGTGCTGAAGCCGCTCGTCGACGCGGGCTACT
+CACAGTACGCCCCCACCGCCGGCCCTTATTTCAGCCACGGCAACCTGGTGTGGTAGTTAACCCAGGATCA
+GCCCGGACGTAGGCACCCCGGTGCCCGCGGTGACGAGCACATGCTCGACGCCCGCCACCGGGTTCACCGA
+GGTGCCGCGCAGCTGCCGCACCCCCTCCGCGATGCCGTTCATGCCATGGATGTAGGCTTCGCCGAGTTGA
+CCGCCGTGGGTGTTGATGGGCAGCCGCCCGCCCACCTCGATCGCGCCGTCGGCGATGAAGTCTTTCGCTT
+CGCCCTTGCCGCAGAATCCCAACTCCTCCAACTGAATCAGGGTAAACGGCGTGAAGTGGTCGTAGAGGAC
+TGCGGTCTGGACATCGGCCGGCGTCAGCCCCGACTGCGCCCATAGCTGCCGGCCCACCAGGCCCATCTCG
+GGCAGGCCGTCGAGTTCCGGCCGGTAGTAGCTGACCATCGTGTACTGGTCTGGACTGCAGCCCTGCGCAG
+CCGCCTCAATGACCACCGGGCGCTGCTTGAGGTCCCGTGCGCGCGCAGCTGACGTCACCACGATCGCGAC
+CGCGCCGTCGGTCTCCTGGCAGCAGTCCAGCAGCCGCAGCGGCTCGGCGATCCACCTCGAATTCTGGTGG
+TCCTCAATGGTTATCGGCTTGCCGTAGAAGTACGCCTTGGGGTTGTTGGCGGCATGCTTGCGGTCGGCCA
+CCGAGACAGCACCGAAGTCCCGGCTGGTCGCACCAGACAGGTGCATGTACCGGCGAGCGATCATCGCCAC
+TTGCGCGGCGGGCGTGGAGAGCCCGTGCGGATACGAAAACGAATTGTCCACGCCGGTGGAGTCGGCATTC
+TCGGTCAAACGAGTTTGCACCTGACCGAACCGCATGCCGGATCGTTCGTTGAATGCCCGATACGCCACCA
+CGACGTCAGCCACCCCGGTGGCCACTGCCATAGCGGCGTGCTGCACGGTCGCACATGCGGCGCCACCGCC
+GTAGTGGATCTTGGAGAAGAACGTCAGCTCGCCGATGCCGGCCGCACGCGCCACGGCGATTTCGGTGTTG
+GTGTCCATCGTGAACGTGGTCAGCCCGTCGACATCGGTCGGGCTCAGGCCCGCATCGGCCAACGCATCCA
+ACACCGCCTCGGCCGCCAGCCGCAGCTCACTTCGACCGGAGTTCTTCGAAAAGTCGGTGGCGCCGATACC
+GACGATGGCCGCCTGACCCGATAACACTACGAATCCCTCATCGAAAGTTCCACCGTCGCGGTCACGTGGT
+CGCCAAGGGTATTGCGGCCCACCACCTTTACCGTGATCAAGCCGTCGTTCACCGCGGTCACCTCACCGGA
+GAACGTCACCGTGTCGTAGGCGTACCACGGCACCCCCAGCCGCAGCCCAATCGACTTGATCAGCGCCGAC
+GGGCCCGCCCAGTCGGTGACGTAGCGTTGCACCAGCCCGGTGTCGGTGAGGATGTTGACGAAAATGTCTT
+TCGACCCCTGGGCGACGGCCTTGTCTCGATCATGATGCACATCCTGGAAGTCCCTGGTAGCCAGCGCCGT
+TGAGACGATGAACGTCGGGTCTCCGTAGAGCTTCAGCTCAGGCAGCACAGCACCAACAACCGTCATTCGT
+CAGGCTCCCATGCGTAGAGGCTCCAGTCGGGGAAATCGATATAGGTCGCTCGTACCGGCATACCGATCGC
+AACACGAGCAGGATCGGCCCCCCGCAGCTCGCCCAGCATGCGTACCCCTTCCTCGAGCTCCACCAGCGCG
+ATCACGAAGGGCACCGTGCGACCCGGAACTTTCGGCGCGTGATGCACCACGAAGCTGAACACCGTGCCGC
+GACCGCTGGAGACGACGTAGTTGATCGGCACCGATTTGTCTTGCCACACCGCCGGCACCGGTGGGTGCCG
+CAGGCTGCCATCGGCAAGCCGCTGGATCCGCAATTCGTGGGCCTTGACTCCATCCCAGAAAAACGCGGTG
+TCCCGCGACGACGAGGGACGCATCATAGCGTCGGGATCCAAATCGTCAGGCACCGAGCTCGGAGAACCCG
+CGGGCTTGAATTTGAGGATGCGCCAATTCATCTCTGCGACGTCCTCGTCCCCGACTTGCCATACGATGTG
+CTGGTTGATGAACCAGCCCTCGCCGAGCGCGGTTTGCTTGGGTCCGACGACGTCACCGAGCTCGGCGCTG
+ATGCTGACTTGCTCCCCGGGCAATAGGTAGCGGTGGTAGGTCTGCTCGCAGTTGGTGGCAACCACACCGA
+TGTAGCCGGCGTCGTCGAACAGCTTGATGATGGGTCCCAGCGGATCGTCCTTCGGACGCACTCCGCCCAG
+ACCCATCATGGTCCACACCTGAATCATGGCCGGTGGCGCGACGATTCCGGGGTGGCCGGCGGCGCGAGCC
+GCCGCGTCGTCCACATAGATGGGGTTGCGGTCGCCGATGGCCTCCACCCAGTTGTTGATCATCGGCTGGT
+TCACCGGGTCACGGGCCAGGCGCGGCTTGCTGGGCCCGGCCGCCTTGATCTGGGCAACCGCTTCCTGAAT
+GTCGCTCACCCCGGTCACCTGGGCACCCTTGGCACTTTGAGGCCAGACGCGGCGATCATCTCGCGCATGA
+CTTCGTTCACACCCCCGCCGAAGGTGATCACCAGGTTGCGCTTGGTCTGGGCGTCCAGCCAGCGCAGTAG
+CTCGGCGGTGTCGGGTTCGGCGGGGTTGCCGTACTTGCCAACGATTTCCTCGGCGAGCCGGCCGGCACGC
+TGAACACGCTCGGTGCCAAAGACTTTCGTGGCCGCGGCATCGGCCATGTTGATGTCCTCACCGGCGGACG
+CTACCTGCCAGTTGAGCAACTCGTTGATCCGCCAGATCGCACGAATCTCACCAAGAGCCCGCTTGACGTC
+GTCGTGGTCGATCGGCGTCACGCCGTTGCCACCCGGCACGGACGCCCACGCGTGCACCCGGTCGTAGATG
+CTGGCGAACCGCCCGGCCGGGCCGAGCATTACCCGTTCGTTGTTGAGTTGGGTGGTGATCAGCCGCCAGC
+CGTCGTTCTCCTTTCCGACCAGCATGTCGACCGGCACGCGCACGTCGTTGTAGTACGTGGCATTGGTGTG
+GTGGGCGCCGTCGGCCAAGATGATCGGCGTCCAGGAATAGCCGGGATCCTTGGTGTCGACGATTAGAATG
+GAAATGCCTTTGTGCTTAGCGGCATTCGGGTCGGTGCGGCAGGCCAGCCAGATGTAGTCGGCGTCGTGTG
+CGCCGGTGGTGAAGACCTTCTGGCCGTTGACGATGTAGTGGTCGCCGTCGCGAACGGCGGTGGTGCGCAA
+CGACGCCAGGTCGGTGCCGGCTTCCGGCTCGGTGTAGCCGATCGCGAAGTGCGCCTCACCGGCCAGGATC
+GCCGGCAGGAACTTCTTCTTCTGCAGCTCGCTGCCGTGCGCCTGCAGCGTGGGGCCGACGGTCTGCAGCG
+TCACCGCGGGCAGCGGCACGTCGGCGCGATGGGCCTCGTTGACGAAGATCTGCTGCTCGATCGGACCAAA
+ACCCAGACCGCCGAACTCTTTCGGCCACCCAACACCGAGCCTGCCGTCCCGGCCCATGCGCCGTATCACC
+GCACGGTAGGCCGGGCCGTGCCGGTCTTTCTCCATCTCCGTGCGCTCGTCGGGCGAGATGAGATTCGAAA
+AGTATTGCCGTATCTCGGCTTGCAGCTGGCGCTGCTCCGGCGTCAGGTCAATGAACATCGCGCTCCCAGG
+AGCTCAAGGCGATGCGAGGGCCCGCCCAGCAGCCGGGTGAGGTCCTTGATCGTGGAGTAGTAGCGGTGCA
+TCGGATACGTGACGTCCATCCCCATGCCGCCGTGCAGGTGATGGCAGATTTGCATCGCCGGCGGCGCCTG
+CGATGTCACCCAGTACCCGAGGACGCCCAGATCATCTCCCGCATCCAGATCCTCGGCCAGTCTCCAGATC
+ACCGACTTGGCCACCAGGTCAATGGTGCGCGAGGCGATGTAAACCTCGGCGAGCTGCGCGGCCACGGTCT
+GGAAGGTTGACAGCGGCTTACCGAACTGCTTCCGGTTCGCCACGTAGTCGGCGGTCAGCCGCAGCGCCCC
+GGCGACCAGCCCGTCGGCGTATGCACCCATGACGGCCAGCGCTAGCTGATTGACCCGGTGCGCGGCTACA
+TCCGCCAGGATGTCACAGTCGGCAACCGCCACGCCGTCCATCGTCATCACATACTCGTCTGAACCATTCG
+ATGTGGGCGTACGAACCATGCGCACACCGTCGGCCGTCGGCGACACCACCACGACGGCGTTGTCGGCGGT
+CACCAACATCCAGTCCGCCTGTTCGGCGTAGCCAACACCGACTTTGGTGCCCGACAACCGCCCACCCACA
+AAGCTAGTGGCAGGCCGATCCGGCAGCGCCGCCCCGGGCTCGTTGAGCGCGGCGGTCAGTACTCCTCCCT
+TGGCCACCCCGGCCAGGAAGCGGTCCTGTTGCTCGGCGGATGCCAGCTCGAGCAGCGGCACCACCCCAAG
+ACCCAGCGTTGCCAGCGCCGGCGTGACGGCGCCGTGGCGACCCACCTCGGTGAGCAGCGCGCCGACTTCG
+AATAGGCCCACGCCGTCGCCGCCGAGACGTTCCGGCACCGGCAGCGCCGTCACACCACCGCAGACCAGCG
+CCTCCCACGAGATGTCCCGCTCCAACACCGACGTGACCACGTCGGCGACGGCTTGCTGTTCCGCAGTGGG
+ATCGAAATCCATTAGTGAGCAACCGGGCATCTACCGGTGTAGTCGACCTGCCAGTGCTTAATGCCGTTGA
+GCCAGCCGGACCGCAGCCGCTCGGGCGCCGAGATCGGCTTGAGGTCGGGCATGTGGTCGGCTACGGCGTT
+AAAGATTAGGTTGATCGTCATCCGGGCCAGATTCGCACCGATGCAGTAATGAGCGCCGGTGCCGCCGAAG
+CCGACGTGCGGGTTGGGGTTGCGCAGGATGTTAAATGTGAACGGATCCTGGAAAACCTCTTCGTCGAAGT
+TAGCCGACCGGTAGAACATCACCACCCGCTGACCCTTCTTAATCTGTACGCCGGACAACTCGTAGTCCCG
+CAGCGCGGTGCGCTGAAAAGCGGTGACCGGGGTTGCCCAGCGCACGATCTCATCGGCCGCGGTCTCCGGA
+CGCACTTTCTTGTACAGCTCCCACTGGTCGGGGTGTTCAGCGAACGCCATCATGCCCTGGGTGATGGAGT
+TGCGGGTGGTCTCGTTACCGGCCACCGCCAGCATCACCACGAAGAAGCCGAACTCGTCGTCGGAGAGCTT
+CTCGCCGTCGATATCGGCTTGGATCAACTGAGTCACGATGTCGTCGGCGGGGTTCTTCGCCTTCTCCTCG
+GCCATCTTCATCGCATAGCCGATCAGCTCCGCCGAGGACGCCTTCGGATCGATGTGGGCGTATTCCGGAT
+CCTCGTTGCCGGTCATCTCGTTTGACCAGTGGAACAGCTTGCCGCGGTCCTCCTGCGGCACGCCCAGCAA
+GCCCGCGATCGCCTGCAATGGCAGCTCACAGGAAACCTGCTCGACAAAGTCTCCAGAACCCGCGGCGGCC
+GCCTCCGCGGCGATCTTCTGGGCGCGCTCCTGGAGCTCGTCATGCAGGCGTCCGACCGCACGTGGCGTGA
+AGCCGCGAGAGATGATCTTGCGCAGCCGGGTGTGGTGCGGCGCGTCCATGTTGAGCATGACGAAGCGCTG
+AACCTCGATGTCCTCACGCGCGATGTCGTTCTTGAATCGCGGGATCACCCCGTTTTCGTAGCTGGAGAAC
+ACGTCGCTATGCCGCGATATCTCTTTGACGTCGTTGAGTTTGGTGATCGCCCAGAAACCGCCGTCGTGAA
+AGCCGCCGCCCTTGCCAGGATCCTGCCCGTTCCACCAGATCGGCGCCGCGGACCGCAGCTCGGCGAATTC
+GGCAACCGGCAGCCGTTCGGCGTAGATTGCGGGGTCGGTGAAATCGAACCCGGGCGGCAGATTGGGGCTG
+GGCACGGTAGTTCTCCTTACTGCAATCTCCACTGACTGGTGATTCCACGACACTAGCTGTCCTAGTGAGG
+ACCTTCTGCCAGTAAAACATGCCTTCACCGCAGACAAAAGGCATTGAAGCAACCTTGCTTGTCATAGTAA
+TGAAACGTGTTCTAGCCTGGCCCCATGGGTTACCCGGTCATCGTTGAAGCCACCCGCAGCCCCATCGGCA
+AACGCAACGGATGGCTGTCGGGGCTGCATGCCACCGAGTTGTTGGGCGCGGTGCAAAAGGCGGTGGTCGA
+CAAGGCCGGCATCCAGTCCGGCCTTCACGCCGGTGACGTCGAACAGGTCATCGGCGGTTGCGTGACCCAG
+TTCGGGGAGCAATCCAACAACATCAGCCGGGTGGCCTGGCTGACGGCCGGTTTGCCCGAACACGTCGGCG
+CCACCACCGTCGACTGCCAGTGCGGCAGCGGCCAGCAGGCCAACCATCTGATTGCCGGGTTGATCGCGGC
+CGGTGCCATCGATGTCGGCATCGCCTGCGGCATCGAGGCGATGAGCCGGGTCGGGCTGGGCGCCAACGCC
+GGGCCGGACCGCTCGCTGATCCGCGCGCAGTCATGGGATATCGACCTGCCGAACCAGTTCGAGGCCGCCG
+AGCGGATCGCCAAGCGGCGCGGCATCACCCGCGAGGACGTGGATGTCTTCGGGCTCGAGTCGCAGCGACG
+CGCGCAGCGGGCCTGGGCGGAGGGCCGCTTTGACCGCGAGATCTCGCCGATCCAGGCGCCGGTGCTCGAC
+GAGCAGAATCAGCCCACCGGCGAGCGGCGCCTGGTCTTTCGCGACCAGGGCCTGCGCGAGACCACGATGG
+CGGGGCTAGGCGAGCTGAAACCGGTGCTCGAGGGCGGCATCCACACCGCGGGCACGTCGTCGCAGATCTC
+CGACGGCGCGGCAGCCGTGTTGTGGATGGACGAAGCCGTGGCACGTGCGCACGGCCTGACCCCGCGGGCC
+CGGATCGTCGCCCAGGCACTCGTCGGCGCCGAGCCCTACTACCACCTGGACGGCCCGGTGCAGTCCACCG
+CGAAGGTGCTGGAGAAGGCCGGCATGAAGATCGGCGACATCGACATCGTCGAGATCAACGAGGCGTTCGC
+GTCCGTGGTGCTGTCCTGGGCGCGGGTGCACGAGCCCGACATGGACCGGGTCAACGTCAACGGCGGGGCG
+ATCGCGCTGGGGCATCCGGTGGGCTGCACCGGCAGCCGGCTGATCACCACCGCCCTGCACGAGCTCGAGC
+GCACCGACCAGAGCCTCGCGCTGATCACCATGTGCGCCGGCGGGGCCCTGTCCACCGGCACCATCATCGA
+GCGGATTTAACCTAGCTGCGGCAGGGCACCGTGCGGCGTGACTGCAACATGAAGCGACCGATGATTAGAT
+AGCGAGGCGGACGCGCGCCTTTGGCGACCCTTGGTCGCTAGGATCAGCGTCATGCCGAAATCACCGCCGC
+GGTTTCTGAATTCGCCGCTCAGCGACTTCTTTATCAAGTGGATGTCACGGATTAATACCTGGATGTACCG
+CCGCAACGACGGGGAGGGTCTGGGCGGCACCTTCCAGAAGATTCCGGTCGCGCTGCTGACCACCACCGGC
+CGCAAGACCGGCCAGCCGCGGGTCAACCCGCTCTACTTCCTGCGCGACGGTGGGCGGGTCATTGTCGCGG
+CCTCCAAGGGCGGCGCGGAGAAGAACCCGATGTGGTACCTCAACCTCAAGGCCAACCCCAAGGTTCAGGT
+ACAGATCAAAAAGGAAGTGCTGGACCTTACCGCGCGGGACGCGACCGACGAGGAGCGCGCCGAATATTGG
+CCACAGTTGGTCACGATGTACCCAAGTTATCAGGACTACCAGTCCTGGACCGACCGCACGATCCCGATCG
+TGGTTTGCGAACCCTGACCGTTCCCAACTTCGCCGAACGTGAAGCCAGGGCGAGAAAACGGCCGAAATCT
+CGCCCTGAGTTCACGCTCGGCGCAGATAACTAGGCCCCATAGACCGGAACCGGCGGCCGCGACTTGGCCA
+ACAGGTCGCTGACGACGGGCCCCAGCTCGGCCGGATCCCATTTCACGCCCTTGTCCACCTGCGGGCCATG
+CGCCCAGCCCTCGGCGACCCGGATGATGCCGCCCTCGACCTCGAATACCTTCCCAGTGACATCGCGGGAC
+TCCGCACTGCCCAGCCATACCACCAAGGGTGAGACGTTCTCCGGGGCCATCGCGTCGAACCCCTCCTGCG
+GCTTGGCCATCACCTCCGCGAACACAGTCTCGGTCATGCGGGTGCGCGCCGCCGGCGCGATCGCGTTGAC
+GGTCACGCCGTACCGCCTCATTTCGGCGGCGCCGACGAGCGTCAGCGCCGCGATTCCGGCCTTGGCGGCG
+CTGTAGTTGCCCTGCCCCACGCTGCCCTGTAGGCCCGCGCCAGAGCTGGTGTTGATGATCCGCGCGTCAA
+TGTCTTTCGGGGCTTTGCCCGCCTTGGACAGTCCCCGCCAATGGGACGCGGCGTGCCGCATGGTGGCGAA
+GTGGCCCTTGAGGTGCACCGCGATGACAGCGTCGAACTCCTCTTCGCTGGTGTTGGCGATCATCCGGTCC
+CGCACGATGCCGGCATTGTTCACCAGGACGTCCACACCACCGTACGTCTCGACGGCGGCCTGGATCAGGT
+TGGCCGCCTGGTCCCAGTCCGAGATGTCCGACCCGTCGGCGACGGCTTGGCCACCGGCCGCAAGGATCTC
+GTCGACCACGTCTTGGGCTGCGCTGCCGCCGCTTGCCGGCGAACCGTCCAGGCCCACACCGATATCGTTG
+ACCACCACGCGCGCACCCTCGGCCGCGAAGGCCAACGCATGTGCGCGGCCGATGCCGCCACCCGCTCCGG
+TGACGATGACCACCCGGCCGTCGACCAAGCCCATGACCCCATTGCTCCTTTGCTCGTCACTTGTTGGCAC
+TCGAGGCGCCCAGGTACGGCGGCGGCTCACCGCCGCCGTGCACCTCGAGCGTCGCCCCGCTGATATATGA
+CGCCGCATCGGACGCCAAAAACGCTGCAGCCCAACCAATGTCGGCAGGTCGTGCCAGCCGGCCCAACGGC
+ACCGTGGCGGCGACGCGAGCGATCGACTCGGCATCACCGTAGAACAGTTCGGACCGTTCGGTTTCCACCA
+TGCCGACCACCACGGCGTTGACCCGAACCTTGGGTGCCCATTCCACCGCCAGCGTGGTGGTCAGGTTTTC
+CAGGCCTGCCTTGGCCGCGCCATAGGCCGCCGTGCCGGGAGTGGGACGGCGACCGCTGACGCTACAGATG
+TTTACGATCGACCCACCGTTGGGCTGCGCTTGCATCAGCACGTTGGCGTGCTGGGAAACCAGCAGCGGTG
+CAAGCACATTGAGCTCGACGATCTTTCGGTGGAAGTTGTGTGTCGCCTCGGCGGCCAGCGCGTATGGCGA
+GCCGCCCGCGTTGTTGACCAGCATGTCGAGTCGGCCGTGCCGCTCCCCGATCTCACCGACCAGGCGCTTG
+ACCGAGTCCTCGTCCCGGATGTCGCAGCGGTGGAACTCATACGGTTGGCCGTCGACCGCTCGTCGCGCGC
+AGGTGATCACGGTCGCGCCCTGTTCGGCGAATACCGAGCTGATGCCCGCGCCTACCCCGCGGACACCGCC
+GGTGACCAAAACCACCCGCCCGGCCAGCCCGAAATTGATGGCGTCGGCTGCCTCGGCGAGAGTCACTGTG
+CTAGCGTACCAAGCAAGTGCTTGCTTAGGTAGCGAACCCGCAGGAGTGCAATGCCGATCACCTCCACCAC
+GCCCGAACCGGGCATCGTCGCGGTCACCGTCGACTACCCGCCGGTCAACGCCATCCCGTCGAAAGCGTGG
+TTCGACCTGGCCGACGCGGTGACGGCCGCGGGCGCCAACTCCGACACCCGCGCGGTGATCCTGCGGGCCG
+AGGGGCGCGGCTTCAACGCCGGGGTGGACATCAAAGAGATGCAACGAACCGAAGGTTTCACGGCGCTGAT
+CGACGCCAACCGCGGCTGCTTCGCCGCATTCCGCGCCGTCTACGAGTGCGCGGTGCCGGTGATCGCCGCC
+GTGAACGGATTCTGCGTGGGCGGCGGCATCGGCCTGGTCGGCAACTCCGACGTCATCGTGGCCTCCGAGG
+ACGCCACCTTCGGCCTGCCCGAGGTGGAACGGGGCGCGCTGGGCGCGGCCACGCACCTCTCGCGGCTGGT
+GCCCCAGCACCTGATGCGACGGCTGTTCTTTACGGCGGCCACCGTGGACGCGGCCACCTTGCAGCACTTC
+GGCTCGGTGCACGAGGTGGTGTCCCGCGATCAGCTGGACGAGGCCGCTTTGCGGGTGGCCCGCGACATCG
+CCGCCAAAGACACCCGGGTCATCCGCGCCGCCAAGGAGGCGCTGAACTTCATCGACGTGCAACGGGTCAA
+TGCGAGTTACCGGATGGAGCAAGGTTTTACCTTCGAGCTCAACCTCGCCGGAGTCGCCGACGAGCACCGC
+GACGCCTTTGTGAAGAAGTCATAGTGCCCGATAAACGAACCTCTCTTGACGACGCCGTCGCGCAATTGCG
+CAGCGGCATGACCATCGGCATCGCCGGCTGGGGCTCGCGGCGCAAGCCCATGGCGTTCGTGCGGGCCATC
+CTGCGCTCGGATGTCACCGATTTGACGGTGGTCACCTACGGCGGGCCGGACCTGGGGCTGCTGTGCTCGG
+CGGGCAAGGTCAAGCGGGTCTACTACGGGTTCGTCTCGCTGGACTCGCCGCCGTTCTACGACCCGTGGTT
+CGCGCACGCCCGCACCAGCGGCGCGATCGAGGCCCGGGAGATGGACGAGGGCATGCTGCGCTGCGGTTTG
+CAGGCCGCGGCACAACGGCTGCCGTTCCTGCCTATTCGCGCCGGGCTGGGCAGCTCGGTACCACAGTTCT
+GGGCAGGCGAGCTGCAGACGGTCACGTCGCCGTATCCGGCGCCTGGCGGCGGGTACGAGACACTGATCGC
+CATGCCGGCACTGCGCCTGGATGCCGCCTTCGCCCACTTGAATCTCGGTGACAGCCACGGCAATGCGGCC
+TACACCGGCATCGACCCCTACTTCGACGATCTCTTCTTGATGGCCGCCGAGCGGCGCTTTCTGTCGGTGG
+AGCGCATCGTCGCCACCGAGGAACTGGTCAAATCGGTGCCGCCGCAGGCGCTGTTGGTCAACCGGATGAT
+GGTCGACGCCATCGTGGAAGCACCCGGCGGCGCCCACTTCACCACCGCCGCACCGGACTACGGGCGCGAC
+GAGCAGTTCCAGCGGCACTACGCCGAAGCGGCGTCGACACAGGTGGGTTGGCAGCAGTTCGTGCACACCT
+ACCTATCCGGCACCGAAGCGGACTACCAGGCCGCGGTGCACAACTTTGGAGCATCACGGTGAGCACCCGA
+GCCGAAGTGTGTGCCGTCGCCTGCGCCGAGTTGTTCCGCGATGCAGGCGAAATCATGATCAGCCCCATGA
+CCAACATGGCCTCGGTAGGGGCGCGGCTGGCGCGGCTCACCTTCGCGCCGGACATTCTGCTGACCGACGG
+CGAGGCTCAGCTGCTCGCGGACACACCGGCATTGGGCAAGACGGGCGCCCCAAACAGGATTGAGGGGTGG
+ATGCCGTTCGGCCGGGTTTTCGAAACCCTGGCCTGGGGGCGCCGGCACGTGGTGATGGGCGCCAATCAGG
+TCGACCGCTATGGCAATCAGAACATCTCGGCGTTCGGGCCGCTGCAGCGGCCGACCCGGCAGATGTTCGG
+CGTCCGCGGCTCGCCGGGCAACACCATCAACCACGCCACCAGTTACTGGGTGGGCAACCACTGCAAGCGG
+GTCTTTGTCGAGGCCGTCGATGTGGTCTCCGGCATCGGCTACGACAAGGTGGATCCGGACAATCCGGCCT
+TCCGGTTCGTCAACGTCTACCGGGTGGTGTCCAACCTAGGCGTGTTCGACTTCGGCGGCCCCGACCACTC
+CATGCGGGCGGTATCCCTACACCCCGGGGTGACGCCCGGCGACGTCCGCGACGCCACCTCGTTCGAGGTG
+CATGACCTCGACGCGGCCGAGCAGACCAGGCTGCCCACCGACGACGAACTGCACCTGATCCGCGCGGTAA
+TCGATCCGAAGTCGTTGCGGGACAGGGAGATACGATCATGATTGTTCCGCCTCCTCTCCCCCGCAAGCGG
+GAGGTGCGCCCACATCGCTTCGTCCCCTGCAAGCGGGTGGTACCCCCACTGCATTGTCGGCGGTGGCTAT
+GAGGCTGCGTACGCCGCTGACCGAGCTCATCGGCATCGAGCACCCGGTGGTGCAGACCGGGATGGGCTGG
+GTGGCCGGTGCCCGGCTGGTGTCGGCCACCGCCAACGCGGGCGGGCTGGGCATCTTGGCCTCGGCCACCA
+TGACGCTGGACGAGCTGGCGGCGGCGATCACAAAGGTCAAGGCCGTCACCGACAAGCCATTCGGGGTGAA
+CATCCGCGCCGACGCAGCCGACGCGGGCGACCGCGTCGAGTTGATGATCCGCGAGGGGGTGCGGGTGGCC
+TCGTTCGCGTTGGCACCCAAACAGCAGCTGATCGCCCGGCTCAAAGAAGCCGGCGCGGTGGTCATACCGT
+CGATCGGCGCGGCCAAACATGCGCGCAAGGTGGCGGCCTGGGGCGCCGACGCGATGATCGTGCAGGGCGG
+CGAGGGCGGCGGCCACACCGGGCCGGTCGCCACCACGCTGCTGTTGCCGTCGGTGCTGGACGCCGTGGCG
+GGCACCGGCATCCCGGTGATCGCCGCCGGCGGCTTCTTCGACGGGCGCGGGCTAGCCGCGGCGTTGTGCT
+ACGGCGCCGCCGGGGTGGCCATGGGCACCCGGTTTCTGCTCACCTCGGATTCCACCGTGCCCGACGCGGT
+CAAACGGCGTTACCTGCAGGCCGGCTTGGACGGCACCGTGGTCACCACCCGCGTCGACGGGATGCCGCAC
+CGGGTGCTGCGCACCGAGCTGGTCGAGAAGCTGGAAAGCGGCTCGCGGGCACGAGGTTTCGCGGCCGCGC
+TGCGCAATGCCGGCAAGTTTAGACGGATGTCGCAGATGACCTGGCGGTCGATGATCCGAGACGGCCTGAC
+CATGCGCCACGGCAAGGAATTGACCTGGTCACAGGTGCTGATGGCGGCAAACACCCCGATGCTGCTCAAA
+GCCGGCCTGGTCGACGGCAACACCGAGGCCGGGGTGCTGGCATCGGGCCAGGTAGCGGGCATTCTTGACG
+ACCTACCGTCGTGCAAAGAGCTGATCGAGTCGATCGTGCTTGACGCCATCACACATTTACAAACCGCATC
+TGCGCTGGTGGAGTGACTGACGCGTGTCAAGCAGAGTACGCTATCGCAGCTATGTCGACCGTCGAGATGG
+ACCAGGCGGCTCCAGAGTCCGCCGCGCACCACCCTCTGCCGGACCCCGGTGAGTCGGTCCCCAGACTCGC
+GCTGCCCACGATCGGGATCTTCCTGGCCACGCTCACCGCGTTCGTCGGTTCTACGACCGCTTACATCAGC
+GGATGGATCCCGTTCTGGGTGACGATCCCCGTCAACGCCGCGGTCACGTTCGTGATGTTCACCGTCGTGC
+ATGACGCATCGCATTACGCGATCAGCTCCATCCGGTGGGTGAACGGGCTGTTCGGGCGGCTGGCGTGGCT
+TTTCGTCGGGCCGGTGGTCGCGTTCCCGGCCTTCGGGTACATCCACATCCAGCACCACCGCCATTCCAAC
+GACGACGAGCAAGACCCGGACACCTTCGCCTCACACGGCTCGCTGTGGGTGCTGCCGTTGCGCTGGTCGA
+TGGTCGAGTACTTCTACATCAAGTACTACCTGCCTCGCGGCCGCAGCCGGCCGGTCATCGAGGTCGCCGA
+GACGCTGGTGATGATGACCCTGTTCCTGACCGGCCTGATCGTCGCCATCGTCACCGGCAACTTCTGGACG
+CTGGCGATCGTCTTCCTGATCCCGCAACGTATCGGCCTTACCGTGCTGGCCTGGTGGTTCGACTGGCTGC
+CCCACCACGGTCTGGAGGACACCCAGCGCAGCAACCGCTACCGCGCGACCCGCAACCGGGTTGGCGCCGA
+GTGGCTGTTCACCCCGGTGCTGCTGTCGCAGAACTACCACTTGGTGCACCACCTGCACCCGTCGGTGCCG
+TTCTACCGGTACCTGCGCACCTGGCGGCGCAACGAGGAGGCGTATCTGGAACGCAACGCCGCGATCTCCA
+CGGTCTTTGGCCAGCAACTGAATCCGGACGAGTACCGGCAGTGGAAGGAGCTCAACGGCCGGCTCGCGCG
+ACTGCTGCCGGTGCGGATGCCGGCCCGCTCCAGCTCGCCGCACGCGGTGCTGCACCGCATCCCGGTCGCG
+TCGGTGGATCCCATCACCGCCGATGCCACCCTGGTGACTTTCGCGGTGCCGGAAGCATTGCGGGACGCGT
+TCCGATTCGAGCCGGGCCAGCACGTGACGGTGCGCACCGACCTGGGCGGCCAAGGCATCCGGCGCAACTA
+CTCGATCTGCGCCCCGGCCACCCGCGCCCAGCTGCGCATCGCCGTCAAACACATTCCCGGCGGGGCGTTT
+TCGACGTTCGTGGCCAACGAACTGAAGGCCGGCGACGTGCTCGAGCTGATGACACCGACCGGCCGGTTCG
+GCACCCCGCTGGATCCGTTGCACCGCAAGCACTATGTGGGCCTGGTGGCCGGCAGCGGGATCACCCCGGT
+GCTGTCCATCCTGGCGACCACGCTGGAGATCGAGACCGAAAGCCGATTCACGCTGATCTACGGCAACCGC
+ACCAAGGAATCGACGATGTTTCGGGCCGAGCTGGATCGTCTGGAGTCGCGCTATGCCGACCGGCTGGAAA
+TCCTGCACGTGCTCTCCAGCGAGCCGCTGCACACCCCGGAGCTGCGCGGGCGCATCGACCGAGACAAACT
+CACCAGGTGGCTGACGAGTACCCTGCGGCCGGCCGGTGTGGACGAATGGTTCATCTGCGGCCCGCTCGCC
+ATGGCCACCGCGGTGCGCGAGACCCTGATCGAGCACGGCGTGGACTCCGAGCGCATTCACCTGGAGTTGT
+TCTACGGGTTCGACACGCCCCCGGCGACCCGTCCCTCCTATGCGGGAGCCACCGTCACCTTCACGCTGTC
+CGGGCAGCGGGCGATATTCGATCTGGTGCCCGGCGACTCGATTCTGGAAGGGGCGCTGGGGCTGCGCAGC
+GATGCGCCGTATGCGTGCATGGGCGGCGCATGCGGCACCTGCCGAGCCAAACTGATCGAGGGCAACGTCG
+AGATGGACCACAACTTCGCCCTCCGGAAGGCGGAGCTGGATGCCGGCTACATCCTGACCTGCCAGTCACA
+CCCGACGACACCATTCGTCGCCGTCGACTACGACGCCTAGGTTCGTGGCGCCGCCCCATACTTGCGCCGA
+CTGTGAATCTGACGACGCGACACGCCGATTCGCCGTCGTGTGGTTCACTCTCGGCGCTCATGGGCGCCAT
+CCCGCCGCCCGCATCGCGGCATCGACGCGGCCAACGAACGTGCCCCGGCGGTACCGGAGCAGCTCACTGG
+TGACCCTGATGATCGTCCAGCCCAGATCCAGCAACGCGGTGGACCGCTCGATGTCCCGAGCCCGCTGCGC
+CGGGTCTGTCCAATGCTGTGGCCCGTCATACTCGACACCGACTCGCAATTGCTCGTAGCCCAGGTCGATG
+CGGGCGACGAAGTCCCCGTAGTCGTCAAACACTCTGATCTGTGTTTGCGGCTTCGGCAGACCGGCATCGA
+TCAACACCAATCGGGTCCACGTCTCCTGTGGGGATTCCGCACCCCCGTCGATCAGCGGCAGCACCGCACG
+GAGGCGGACCAGGCCGCGCGCACCGGTATGTTCGGCAATGACGGCCTGCACGTCGGCGACCTTGACATCG
+GTCGAATTCGCCAACGCGTCCAGCCGTTGAACGGCCTGCAGCCGCGAGGGTGTGCGCCGCCCGATATCGA
+AGGCGGTGCGCGCCGGGGTGGTTACCGCGACACCGTCAACCGCAACCGTCTCGTGCGGCGCCAATCGATC
+CGTGTGCACGACGATGCGCGGCGGAGGCTTTCGATTGGCGTGCACTAACTCTGCGTCAAGCGCTGGGTTT
+ACCCACTTCGCGCCAAGCAGCGCCGCCGCCGAATTGCCGGCCACGACGGCGCGGCGCCGCGACCACAGCC
+ACGCCGCGTGGGCGCGCTGGCGCGCCGTCAGCTCCACACCGGCCGGGGCGTAGACGCCCGGGTAGACTGG
+CTCGTAGAGCTGTCTCATGGCCCGCTCCGGAATGGCCTTTGCGGCCAACACTTCCGAGCCCAGGACGGGC
+CATGGAAGTTCGTCCATGGCCACATCCTGGCATCACCCACCGACACCCCGCCGACAGTGAATCGCACGAC
+GCGACACGCCGACGACCCGTCGTGAGATTCACCCTCGGCGCCAACGAAGGCCTACAGCCGCTCGATAATG
+GTGACGTTGGCGGTGCCGCCGCCCTCGCACATGGTCTGCAGCCCGTAGCGGCCACCGATGCGCTCCAGCT
+CGCCCAGCATGGTGGTGAACAGTTTGGCGCCGGTGGCGCCTAGCGGATGCCCCAGCGCGATCGCGCCGCC
+GTTGGGGTTGACCTTCGCCGGGTCGGCCTTGATTTCCTTGAGCCAGGCCATAACTACCGGCGCGAACGCC
+TCGTTGATCTCGACGGTGTCGATGTCGTCGATGGCAAGCCCGGTCTTGTCCAGCGCGTACCGGGTGGCGG
+GGATGGGTCCGGTCAGCATGAATACCGGGTCGGCGGCGCGCGCACTGATGTGGTGGATGCGGGCACGGGG
+CCTAAGTCCATGGTCTTTGACGGCCCGCTCGGAGGCCAGCAACACTGCACTGGCGCCGTCGGAGATCTGA
+CTGGCCATCGCCGCCGTCAGCCGGCCGCCCTCGACCAGCGGCTGCAAGCCGGCCATCTTCTCCAGCGACG
+ACTCCCGCGGGCCCTCATCAACCCGGAACGGCCCGGATTCGGTTTCCACAGTGATGATTTCGTTTTCGAA
+GTGGCCGGCGCGGATCGCCGCGAACGCGCGTTCGTGGCTGGTCAGCGAGTACCGCTCCATCTCTTCACGG
+GACAGGTTCCACTTCTCGGCGATCAGCTCCGAGCCACGGAACTGTGAAATCTCCTGGTCGCCATACCGGT
+GTAACCATTGCTTGGATTCGTTGGTCGGCGAGGTGAACCCGAACTGTTCGCCCACGGTCATCGCCGACGA
+GATCGGGATCTGGCTCATGTTCTGCACGCCGCCGGCCACGATGACATCCGCCGTCCCGGACATGATCGCC
+TGCGCGCCAAAGGAAATCGCCTGCTGGCTGGATCCGCACTGGCGGTCCACGGTGACACCGGGGACCTCTT
+CGGGATAGCCGGCGGCCAGCCACGACAGTCGGGCGATGTTGCCCGCCTGTCCGCCGATGGCGTCGACACA
+TCCGGCGATCACGTCGTCGACGGCGGCGGGGTCGATGTCGGTCCGGTCCAGCAGTCCGCGCCAGGCCAGG
+GCACCCAGGTCGACGGGATGGATACCGGCCAGTGCGCCGCCCCGCTTGCCGACCGCGGTCCGTACGGCGT
+CGATGACGTACGCCTCTGTCATAACCGCTCCTCTCCCGTTGCCAGTGAGTGGTACCCCCACCGCATCGTC
+GTCGACACGGGGCATTTCAGACTCCCTCTTTGGTGATCCCGCCAAGCACGATGGCTAGGTATTGCTGGCC
+CACCTGCTGGGCGGTGAGCGGCCCACCGGGTCGATACCAGCGCACCGACACCCAGGTGGTGTCACGGATG
+AATCGGTAGACCAGGTCGACGTCTAGGTCGGGCCGGAAGTAGCCCTCTTCGATGCCCTGGTTGAGCACGT
+CCACCCACATCTTGCGCTGCTGCTTGTTACGGTCCTCGATGTAGGAAAACCTGGGTTGCGACGCCAGCCG
+TTGCGCTTCATCCTGGTAGATCACCACTTGCGCGTGATGATGCTCGATCGCCTCAAACGACGCCATGAAC
+AGGCCCTGCAGCCGCTCCAGCGGATTGGCCGTGCTATCCACGATGTCGCGGTAACGGGCGAAGAGCCAAT
+CGAGGAAACCGCGTAACAGCTCATCGACCATCTCCTCTTTGGAGGCGAAATGGTGATACAGGCTGCCGGA
+TAGGATGCCGGCGCCGTCGGCGATATCGCGCACGGTGGTGGCGCGCAGTCCGCGCTCGGCGAACATCGCC
+GCCGCGAGCTCCAGCAACTCGCCTCGCCGGCTATTGACCTGACCGGCCACTCGATCCATCCGACCAGACT
+ATCAACCAAGCGCTTGCTCGGCCAGCTGCGACCTCGATGGGGTGGGAATCCGGGAATTCGGTACGAGGGA
+TGCGCCCTTCGCTCACCGGGGCATTAGATGCGACGTTGCTGGCGCTGGATGGACGCCTTGCCCGCACAGC
+CCGGCCCAGGTGCAGGATCGAGGGGCTTGGTACCTGATCACGGGAGACATCTGGGGTATCGGCGGAGAGT
+GCCTAGCGTTCTGGGCATTCTGGCGGATTGCGCATATTCTTCCGCGCGTCGTCATAGCCTAATCGGACTA
+CGCGGATCGTGCCGATCACCCTGGTGCGGCGGCGGCGCCAGTAACGAGGAGGTCAACATGGCTCATTTTT
+CGGTGTTGCCGCCGGAGATCAACTCGTTGCGGATGTACCTGGGTGCCGGTTCGGCGCCGATGCTTCAGGC
+GGCGGCGGCCTGGGACGGGCTGGCCGCGGAGTTGGGAACCGCCGCGTCGTCGTTCTCCTCGGTGACCACG
+GGGTTAACCGGGCAGGCGTGGCAGGGCCCGGCGTCGGCGGCGATGGCCGCCGCGGCGGCGCCGTATGCGG
+GCTTTTTGACCACAGCCTCGGCTCAAGCCCAGCTGGCTGCCGGGCAGGCTAAGGCGGTGGCCAGCGTGTT
+CGAGGCCGCCAAGGCCGCGATCGTGCCTCCGGCCGCGGTGGCGGCCAACCGTGAGGCGTTCTTGGCGTTG
+ATTCGGTCGAATTGGCTGGGGCTCAACGCGCCGTGGATCGCCGCCGTTGAAAGCCTTTACGAGGAATACT
+GGGCCGCTGATGTGGCGGCGATGACCGGCTATCACGCCGGGGCCTCGCAGGCCGCCGCGCAGTTGCCGTT
+GCCGGCCGGCCTGCAACAGTTCCTCAACACCCTGCCCAATCTGGGCATCGGCAACCAGGGCAACGCCAAC
+CTCGGCGGCGGCAACACCGGCAGCGGCAACATCGGCAACGGAAACAAAGGCAGCTCCAACCTCGGCGGCG
+GCAACATCGGCAATAACAACATCGGCAGCGGCAACCGAGGCAGCGACAACTTCGGCGCCGGCAACGTCGG
+CACCGGAAACATCGGCTTCGGCAACCAGGGCCCCATAGACGTTAACCTCTTGGCGACGCCGGGCCAGAAC
+AACGTGGGCCTGGGCAACATCGGCAACAACAACATGGGCTTCGGCAACACCGGCGACGCCAACACCGGCG
+GCGGCAACACCGGCAACGGCAACATCGGTGGCGGCAACACCGGCAACAACAACTTCGGCTTCGGCAACAC
+CGGCAACAACAACATCGGAATCGGGCTCACCGGCAACAATCAGATGGGCATCAACCTGGCCGGGCTGCTG
+AACTCCGGCAGCGGCAATATCGGCATCGGCAACTCCGGCACCAACAACATCGGCTTGTTCAACTCCGGCA
+GCGGCAACATCGGCGTCTTCAACACCGGAGCCAATACCCTGGTGCCTGGCGACCTCAACAACCTGGGCGT
+CGGGAATTCCGGCAACGCCAACATCGGCTTCGGGAACGCGGGCGTTCTCAACACCGGCTTCGGGAACGCG
+AGCATCCTCAACACCGGCTTGGGGAACGCGGGTGAATTAAACACCGGCTTCGGAAACGCGGGCTTCGTCA
+ACACGGGGTTTGACAACTCCGGCAACGTCAACACCGGCAATGGGAACTCGGGCAACATCAACACCGGCTC
+GTGGAATGCGGGCAATGTGAACACCGGTTTCGGGATCATTACCGACAGCGGCCTGACCAACTCGGGCTTC
+GGCAACACCGGCACCGACGTCTCGGGCTTCTTCAACACCCCCACCGGCCCCTTAGCCGTCGACGTCTCCG
+GGTTCTTCAACACGGCCAGCGGGGGCACTGTCATCAACGGCCAGACCTCGGGCATTGGCAACATCGGCGT
+CCCGGGCACCCTCTTTGGCTCCGTCCGGAGCGGCTTGAACACGGGCCTGTTTAACATGGGCACCGCCATA
+TCGGGGTTGTTCAACCTGCGCCAGCTGTTGGGGTAGCGCGACACTCACGGGTGCTGGCAGGATACCGAAA
+TCACCTCACCAGTCAGGTAACTCGAGTAGTCGCTGGCCAGAAACGCGATGGTGGCCGCCACCTCCCAGGG
+CTCGGCGGCCCGGCCGAACGCCTCGCCGGCCACCAGCCGGTCCAGCAGCTCGGCCGAGGCGGTCTTGTCC
+AGGAACTTGTGCCGGGCGATGCTGGGCGAGACGGCGTTGATCCGCACCCCATACTCGGCGGCTTCGATTG
+CGCTGCACCGGGTCAACGCCATCACCCCGGCCTTGGCGGCGGCATAGTGCGACTGCGAATGCTGGGCCCG
+CCAGCCCAGCACGCTGGCGTTGTTGACGATCACCCCGCCATGCGGCGCGTCGCGGAAGTAGCGCAATGCG
+GCCCGGGTGGCCCGGAACACCGACGTCAGGCTCACGTCTAACACGCGGTCCCACTCGTCGTCGGTCATGT
+CGGCCACCGGCGTCTGCCCGCCCAGCCCGGCGTTGTTGACCAGCACGTCGAGCCGGCCCATCCGGGCGGT
+GGTCGAGTCGATCAGCGCGTCGACCTGGGCGGTGGACGTCACGTCGCACACCACATGCTCCACCCGGCCC
+AGCCCCAGCGCAGACAACTCGGCGGCCGTCTCCCCCAGCCGTCGTTCATGGTGGTCCGAGATCACCACGT
+CGGCGCCCTCCGCCAAGGCTCGCCGCGCGGTGGCCGAACCGATGCCGGTGCCCGCAGCCGCCGTCACGAC
+GACCACCTTGCCATCCAGAAGTCCATGTCCGGCAATCTCTTTCGGCGCTACGGACAGGTTCATCCCTTGG
+CCTCCCGGGGCAGACCGAGCACCCGCTCGGCGATGATGTTGCGCTGGATCTCGTTGGATCCTCCGTAGAT
+GGTGTCGGCGCGGGTGAATAGATATAGCCGCTGCCACTCGTCGAACTCGCCGTCGGGCATGGTCATTCCG
+GGTTTACCGATCACGTCCATGGCCAGCTCACCCAGGTTGCGATGCCAGTTGGCCCACAACAACTTTGACA
+CATTGTCCTGGCCGGGCTGCTCAACGGCTGGCCCTTCCATGGTGGCCAAAGCATAGGAGCGCATGGCGCG
+CAGCCCGGTCCACGCCCGGGTCAGCCGCTCCCGGATCAGCGGGTCATCCGCGGCGGCGGTGCGCCGCGCC
+AGCTCGACCAGATTGGAAAGCTCACGGGCGTAGACGATCTGCTGACCCAGCGTCGAGACGCCGCGCTCGA
+AGGTCAGCGTCGCCATCGCGACCCGCCAGCCGTCGCCCGGTGCGCCGACCACCAGGTCGGCGTCGGTGCG
+GGCGTCGTCGAAGAACACCTCGTTGAACTCCGCGGTGCCGGTGATCTGCACGATCGGCCGGATCTGCACG
+CCGGGCTGGTCCAGCGGCACCAGCAGATACGACAGGCCGGCGTGGCGCTGCGAGCCCTTCTCGGTGCGTG
+CGAGCACAAAGCACCATTGCGACAGGTGCGCCAGCGACGTCCACACCTTCTGGCCGTTTATCACCCACTG
+GTCGCCGTCGAGTTCTGCGGTGGTCGCAACGCTGGCCAGGTCGCTGCCAGCGCCGGGCTCCGAATATCCC
+TGACACCACAGCTCGGTGACGTCGCGGATGCGCGGCAGGAAGCGCCGCTGCTGCTGCGGCGTTCCGAACG
+CGATCAGCGTCGGACCCAGCAGTTCCTCGCCGAAGTGGTTGACCTTGTCCGGCGCGTCGGCGCGGGCGTA
+TTCCTCGTAGAACGCCACCCGGTGCGCGGTCGAGAGCCCCCGCCCGCCGTGTTCTTCCGGCCAGCCCAGG
+CAGGTCAGCCCCGCGGCGGCCAGGCGCTGATTCCACGCCCGGCGTTCCTCGAACGCTTCGTGCTCGCGCC
+CCGGCCCGCCGAGGCCCTTAAGTGCCGCGAATTCGCCGGCCAGATTGTCGGCGAGCCAACCGCGGACCTG
+CGCCCGGAACTCCTCGACGTCCTGCATGCCCTGTAGGCTAACCTACCAAGCACTTGCTTTGTTAGGAGCG
+TCCGTTGATAAACGATCTGCGCACCGTGCCCGCGGCGCTGGATCGTCTCGTGCGCCAGCTACCCGACCAC
+ACGGCGTTGATCGCCGAGGACCGGCGTTTCACGTCGACCGAGCTGCGCGACGCGGTCTACGGCGCCGCGG
+CGGCGCTGATCGCCCTCGGTGTCGAACCCGCAGACCGGGTGGCCATCTGGTCGCCGAACACCTGGCACTG
+GGTGGTGGCCTGCCTGGCGATCCACCACGCCGGCGCCGCGGTGGTGCCGTTGAACACCCGCTACACCGCC
+ACAGAAGCCACCGACATCTTGGACCGAGCCGGCGCGCCGGTGCTGTTCGCGGCGGGCCTCTTCCTGGGCG
+CCGACCGGGCGGCCGGCCTGGACCGGGCCGCGCTGCCCGCGTTGCGGCACGTCGTGCGGGTGCCGGTCGA
+AGCCGACGACGGGACCTGGGACGAGTTCATCGCCACGGGTGCCGGGGCCCTGGATGCCGTCGCAGCCCGT
+GCCGCCGCCGTCGCACCCCAGGACGTCAGCGACATCCTGTTCACCTCCGGCACCACCGGCCGCAGCAAAG
+GCGTGCTGTGCGCGCACCGGCAGTCGCTGTCGGCCTCGGCATCCTGGGCCGCCAACGGGAAGATCACCAG
+CGACGACCGCTACCTGTGCATCAACCCGTTCTTCCACAACTTCGGCTACAAGGCCGGCATCCTGGCCTGC
+CTGCAGACCGGTGCCACGCTGATCCCGCACGTGACGTTCGATCCGCTGCACGCGCTGCGGGCCATCGAGC
+GCCACCGCATCACCGTGTTGCCGGGCCCTCCGACCATCTACCAGAGCCTGCTGGATCACCCGGCCCGCAA
+AGACTTCGACCTGAGCTCGCTGCGGTTCGCGGTCACCGGTGCGGCCACCGTGCCGGTGGTGCTGGTGGAG
+CGCATGCAGTCCGAACTTGACATCGACATCGTGCTGACCGCCTACGGGTTGACCGAGGCCAACGGGATGG
+GGACGATGTGCCGCCCCGAGGACGACGCGGTGACCGTTGCGACGACGTGCGGGCGGCCGTTCGCCGACTT
+TGAGTTGCGCATTGCGGACGACGGGGAAGTGTTGCTGCGCGGGCCGAACGTCATGGTGGGCTATCTGGAC
+GACACGGAGGCGACCGCGGCCGCCATCGACGCCGACGGCTGGCTGCACACCGGCGACATCGGTGCCGTCG
+ACCAGGCGGGCAACCTGCGCATCAACGACCGCCTGAAGGACATGTACATCTGCGGCGGATTCAACGTCTA
+TCCCGCCGAGGTCGAGCAGGTGCTGGCCCGGATGGACGGCGTCGCGGACGCCGCGGTGATCGGCGTTCCC
+GACCAGCGGCTGGGCGAGGTCGGCCGGGCGTTCGTGGTGGCGCGCCCCGGCACGGGCCTCGACGAGGCAT
+CGGTGATCGCTTACACCCGTGAACATTTGGCGAACTTCAAGACACCCCGGTCGGTGCGGTTCGTCGACGT
+ACTGCCGCGCAACGCCGCCGGTAAGGTGAGCAAACCACAACTGCGAGAGCTGGGCTAGATGGACCTGAAT
+TTCGACGACGAGACCCTGGCCTTTCAGGCCGAGGTGCGCGAGTTCCTCGCCGCCAATGCCGCATCGATCC
+CGACGAAGTCCTACGACAATGCGGAAGGCTTTGCGCAACACCGTTATTGGGACCGAGTACTGTTCGACGC
+GGGCCTGTCGGTGATCACCTGGCCGGCTAAGTATGGTGGCCGGGACGCGCCGCTGCTGCACTGGATCGTG
+TTCGAGGAGGAGTACTTTCGCGCCGGCGCCCCGGGCCGGGCCAGCGCCAACGGCACCTCGATGCTGGCGC
+CGACGCTGTTCGCGCACGGCACAGCCGAACAGCTTGACCGGATCCTGCCGAAAATGGCTAGCGGCGAACA
+GATCTGGGCGCAGGCCTGGTCGGAGCCGGAATCCGGCAGCGACCTGGCGTCGCTGCGCTCCACCGCGAGC
+AAGGTCGACGGCGGCTGGCTACTCAACGGGCAGAAGATCTGGAGCTCGCGGGCGCCGTTCGCCGACATGG
+GTTTTGGGCTGTTCCGCTCCGATCCCGCGGTCGAACGGCACCGCGGGCTCACGTATTTCATGTTCGACCT
+GAAAGCCAAGGGTGTTACCGTGCGCCCAATCGCCCAACTGGGCGGCGACACCGGTTTCGGTGAGATCTTT
+CTCGACGACGTGTTCGTCCCCGACCGGGATGTGATTGGGGCACCGAACGACGGATGGCGCGCGGCCATGA
+GCACGTCAAGCAACGAGCGCGGCATGTCGCTGCGCAGCCCAGCCCGCTTCCTGGCCTCCGCCGAACGGCT
+GGTCCAGCTGTGGAAGGACCGCGGCTCGCCCCCGGAGTTCGCCGACCGGGTCGCCGACGCCTGGATCAAG
+GCGCAGGCCTACCGGCTGCAGACCTTCGGCACGGTGACCAGGCTGGCCGCCGGTGGCGAACTGGGGGCGG
+AATCGTCGGTGACCAAGGTGTTCTGGTCCGAGCTGGACGTGCACTTGCATCAGACCGCGCTCGACCTGCG
+CGGCGCCGATGGGGAGCTGGCCGGCCCGTGGACCGAGGGGTTGCTGTTCGCCCTGGGCGGCCCGATCTAT
+GCCGGGACCAACGAAATCCAGCGCAACATCATTGCCGAACGGCTGCTGGGCCTGCCACGCGAGAAGACGT
+GACCATGGAATTCGCACTCAACGAACAGCAGCGCGACTTCGCGGCCAGCATCGACGCGGCGCTCGGCGCC
+GCCGACCTGCCCGGCGTCGTCCGTGCTTGGGCTGCCGGTGATGTGGCGCCCGGCCGCAAGGTGTGGCAGC
+AGTTGGCCAACCTGGGCGTCACCGCGTTGGGCGTAGCGGAGAAGTTCGACGGACTGGGTGCCAGTCCGGT
+CGATCTGGTTGTCGCGCTCGAACGTCTCGGGCGCTGGTGCGTGCCCGGCCCGGTCACCGAATCCATTGCC
+GTGGCACCGATTCTGCTGGCTCATGATGATCGGGCTGAACGCAGCCATGGGCTAGCTTCCGGTGAGCTCA
+TCGCCACCGTGGCCATGCCGCCGCGGGTTCCGCGCGCCGTCGACGCCGACACCGCCGGGCTGGTACTGCT
+CGCGGGCGATGGCAGCGTCACCGAAGGGACGCCGGGTGATTGCCACCGGTCCGTCGACCCCAGCCGGCGG
+CTGTATGAGGTGGCGGCATCCGGCCAGGCCTGGCGGGCCCCGAAAGACGTAGTGGCGCGCGCCTATGAGT
+TCGGGGCGCTGGCCACCGCCGCACAACTGGTCGGCGCCGGGCAGGCGCTGCTGGAGGCCGCCGTCAACTA
+CGCCAAACAGCGCACGCAGTTCGGCCGGGCGATCGGCTCGTATCAGGCCATCAAGCACAAACTCGCCGAC
+GTGCACATTGCGATCGAGCTGGCCTGCCCCCTGGTTTACGGCGCGGCCGTGTCACTCGAGCCGCGCGATG
+TCAGCGCCGCCAAAGCCGCCGCGAGCGAGGCGGCTCTGCTGGCGGCACGCTCGGCGTTGCAGACCCACGG
+CGCCATCGGGTTCACCTGCGAGCATGACCTGTCGCTGTGGTTGTTGCGGGTGCAGGCGTTGCACTCGGCC
+TGGGGTACGCCGCAGGAGCATCGGCGGCGTGTGCTGGAGGCGCTATGACCCCCCCTGAAGAACGGCAGAT
+GCTACGGGAAACCGTCGCCTCCCTGGTGGCTAAGCATGCCGGCCCGGCGGCGGTGCGCGCAGCGATGGCC
+TCCGACCGCGGCTACGACGAATCGCTGTGGCGGCTGCTATGTGAGCAGGTCGGTGCCGCCGCGCTGGTCA
+TTCCGGAGGAGCTGGGCGGCGCGGGCGGTGAACTCGCCGATGCCGCGATCGTCGTGCAGGAGCTGGGCCG
+GGCGCTGGTGCCTTCTCCGCTGCTGGGCACCACGCTGGCGGAGCTGGCGCTGCTGGCCGCAGCTAAGCCG
+GATGCGCAAGCACTCACGGAGCTTGCCCAAGGCAGCGCGATCGGCGCGCTGGTGCTGGACCCCGACTACG
+TGGTCAACGGCGACATCGCCGATATCGTCGTCGCCGCCACCAGCGGGCAGCTGACCAGGTGGACTCGCTT
+TAGCGCGCAGCCCGTCGCCACCATGGACCCCACTCGCCGGCTGGCCCGCCTGCAATCCGAAGAGACCGAG
+CCGCTGTGCCCCGATCCCGGAATCGCCGACACCGCAGCAATCCTGTTGGCGGCCGAGCAGATCGGCGCCG
+CCGAACGCTGCCTGCAGCTGACCGTCGAATACGCCAAGAGCCGAGTGCAATTCGGCCGCCCGATCGGCAG
+TTTCCAGGCCCTCAAGCATCGGATGGCCGACCTGTATGTGACCATCGCCGCGGCCCGGGCCGTCGTCGCC
+GACGCCTGCCACGCGCCCACACCCACCAACGCCGCCACCGCGCGGCTGGCCGCCAGCGAGGCGTTGAGCA
+CCGCGGCGGCCGAGGGCATCCAACTGCACGGCGGCATCGCGATCACCTGGGAACACGACATGCACCTGTA
+TTTCAAACGAGCGCACGGCAGTGCACAATTGCTCGAGTCGCCACGAGAGGTGCTGCGCCGTTTGGAATCT
+GAGGTGTGGGAGTCGCCGTGACGGATCGTGTCGCCCTGCGTGCCGGCGTTCCCCCGTTCTACGTGATGGA
+CGTCTGGTTGGCGGCCGCGGAGCGCCAGCGCACCCATGGGGATCTGGTGAATCTTTCGGCGGGCCAACCC
+AGTGCGGGCGCTCCGGAACCGGTGCGTGCGGCCGCGGCCGCCGCCCTGCATCTCAACCAGTTGGGATACT
+CGGTGGCGCTGGGTATTCCGGAGCTGCGCGACGCTATCGCCGCGGATTACCAACGCCGGCATGGCATCAC
+CGTCGAACCCGATGCGGTGGTGATCACCACGGGCTCCTCGGGCGGCTTTCTGCTCGCGTTTCTGGCGTGC
+TTCGACGCCGGTGATCGGGTCGCGATGGCCAGTCCCGGCTACCCGTGCTACCGGAATATCCTGTCAGCGC
+TGGGATGTGAGGTCGTGGAGATCCCGTGCGGACCGCAGACCCGATTCCAACCGACCGCGCAGATGCTGGC
+CGAGATCGACCCACCGCTGCGCGGTGTCGTCGTCGCCAGCCCGGCCAACCCGACCGGAACCGTCATCCCG
+CCCGAAGAACTGGCGGCCATCGCGTCGTGGTGTGACGCATCGGATGTCCGGTTGATCAGTGATGAGGTCT
+ACCACGGCCTGGTGTACCAGGGGGCACCGCAAACCAGCTGCGCCTGGCAGACGTCGCGAAACGCGGTGGT
+AGTCAACAGCTTTTCCAAGTATTACGCGATGACGGGCTGGCGGCTGGGCTGGCTGCTGGTGCCGACGGTG
+CTGCGCCGCGCGGTGGACTGCCTGACCGGCAACTTCACCATCTGCCCGCCGGTCTTGTCGCAGATCGCCG
+CGGTGTCCGCGTTCACCCCGGAGGCGACCGCCGAGGCCGACGGCAACCTGGCCAGCTACGCGATCAACCG
+CTCGCTGTTGCTGGACGGTCTGCGTCGCATCGGCATCGACCGGCTGGCACCCACCGACGGCGCATTCTAC
+GTCTACGCCGACGTCTCGGACTTCACCAGCGATTCGCTGGCCTTCTGCTCAAAGTTGCTGGCCGACACCG
+GTGTTGCGATCGCACCCGGAATCGATTTCGACACCGCACGGGGGGGTTCGTTTGTTCGGATATCGTTTGC
+CGGGCCAAGCGGCGACATCGAAGAAGCCTTACGGCGCATCGGCTCCTGGCTGCCGAGCCAATAGCTCGTC
+GATGCGCGTCTCGAGCGCGCCGCGCTCGCCGATATCTGCCACGTTGATCCCGAACCGTTCGCTCAGGGTG
+TCGACAACCGCTGCCGCATCGGCAAGGCGGATCTTCTCGGTACCACCGGCACGGTGAACGGCAAGGTCGC
+GGCCAGATAGGTTCCACCGGGCGTCGTCGGTGATCACCGCGGCGGTCAGTCCCGTGACGAACTTCGATGC
+CGGGTGTGTTGAGGCGTACCAGCTGGCCACTTTCAGATCGATCTGCGGGCGGGTCTGGGTGGTGAATTCG
+TACAGTGTCTGCCATGTGTCCCGGACCATCGCCTGCAAGACAAAGCCGTCGACGCGGTCCTCGAGCCGAT
+AAGGTTCGTGCGTTGTCGGCTGGACGGCGCCGGTTTCGAGGCGAAGCGGTGAGGTCGGTGTTTGGCCGCC
+GAATCCGACGTCGACGAGATAGCATCCGCCCGAGCCGGGGAACGTGACCCCCAGCAGGGTGTGCGTCTGC
+GGCGGCAGGGGCGCGTCCGGCGCGAGCTTCCAGACGACGCGGGCGGCGAATCGGCGCACCCGATAGCCGA
+GTTCGGCCAGCACATAACCCATCAGCCCGTTGTGCTCAAAGCAGTACCCGCCTCGGCGCCGAAGTACCAG
+CTTGTCGGCCAGCGCCTGTGGACTGAGGTCGTCGACCGGCACCCCCAGCAGCGGGTCGAGGTTCTCGAAC
+GGAATCGTTCGACTGTGCACGGTCACCAGATCCTGCAGAACATCCAGGGTTGGATCGGTAGCGCCGCGAT
+AGTTGATGCGATCGAAGTACGCGGTCAGATCCAGTGCCATGTTGCCATTCTGACCTCGTCGCCGCGTCGG
+ACCGACCGCAGGGTATTCGGGCGTTCGTCGCGCAGCCGGCCAACTATGTCGCACCGATTGTGGTTTGCCA
+CATGAGTTTCTGGGTCGACGGCAAACAAAGTGCCCTCGCAGCGACACGTGTCGGCGGCTACGGCAAACTG
+CCCGCTGACACTCACCCATCCGGTGGCTGCTCGCGCCATCTGGCCGAATGCCCGGCGGGTCGGAGGATCG
+GCGCCGGACACAACAACGCATCATGATGCCTGTTACTGATGCTATTGCCGACCCACGGCACCGGAGGCTT
+GCAGGCCGGTGTCGACTTGGACGACAAGGAAGCCCTCGCCGAACTGATCGGCGACAATGCTGCTCCTTGA
+CGTAAGCGTCTGCATATTCGCCATCCGCGAGGACAGCTGCCCCAACCACGCGACATACCGGACGTGGCTC
+ACCAGACTGCTTACCGGCGACGGCGAGCAGACGCAAAATCGCCCAACACGCCCGCAAAATGGGCGATTTT
+GCGTCTGCTCGCGCCACTAGAGCCAGGTGTCCTGGGTGGTGGTGGTGAGGAAAGCCTCCAGGTCGTCGCG
+CCAGTGCGCCGGCGTGGTCTTTTCCGGCTCGATGCCGGTGTAGTCGCCGCGATAGAACAGCAGCGGCCGC
+GGCTTGACCGCCGGGACCTCTGACAGTGACTCGACGGCACCGAACACCACGAAGTGATCGCCGCCGTCGT
+GCACCGACGCCACCGTGCAGTCAATGTAGGCCAGCGATCCCTCGATGATCGGTGAGCCTAGTTCCGAAGG
+GCGCCAATCGATACCGGCGAACTTGTCCGGCTCCTTCGAGCCGAATCGCGCCGAGACGTCTTTCTGCTTT
+TCGGTCAGTACGTTGACGCAGAACCGGCCGCTGGCCTCGATGGCCTGCCAGGACCGCGACACCTTAGTGG
+GGCAGAACAGCACCAACGGCGGTTCCAACGACAGCGCCGCGAACGACTGGCACGCAAACCCGACGGGCAC
+GTCGTCGTGCACAGTGGTGATGACAGTGATCCCCGTACAGAACTGACCGAGCACGGAGCGGAACGTGCGT
+GGATCGATCTGAGCCGACATCGTTTGCTTTCGAGCTAGCCGCGAGCGCCTACGGTGAAATCGTGACCCCA
+TAGGCTGACCGCAGTACTCTCCCGGGCGATCCAGTCCCGATCGTCGACTTGCCTGCCCTCACAACCGAAT
+TCGATGTCGAAGCCACCGGGCGTCTTCATGTAGAACGACAGCATCAGGTCGTTGACATGCCGGCCCAGGG
+TGGCCGACATCGGCACCTTGCGCCGCAACGCCCGGTCCAGGCACAGGCCCACGTCGTCGGCCTGCTCGAC
+CTCGACCATCAGGTGCACGATGCCGCTGGACGTCGGCATCGGCAGGAAGGCCAACGAGTGGTGACGCGGG
+TTACAGCCGAAGAAACGCAGCCAGGCTGGCGGCCCGTCGGCGGGCCGCCCTACCATCCGTGGCGGTAGCC
+GCATCGAGTCACGCAGCCGAAAGCCGAGCACGTCTCGGTAGAAATGCAACGCCTCAGCATCGTCGCGGGT
+GGACAGCACCACATGGCCCATACCCTGCTCACCGGTGACGAACCTGTGCCCATACGGGCTGACCACTCGG
+CGGTGTTCCAGCGCGGTACCGTGGAAGACCTCCAGGCAATTGCCGGAAGGGTCGGCAAACCGGATCATCT
+CGTCCACCCGGCGATCGGCCAGCTCGGCGGCGGTGGCCTCTTTGTACGGCGTGCCCTCCAAATCCAGGCG
+GTTCCGGATTTCCTGCAGGCCTTCGGCATTCGCGCATTCCCAACCGGCCTCCAACAGCCTGTCGTGCTCA
+CCGGGCACGACCACCAGCCGGGCCGGAAAGTCATCCATCCGCAGATACAGGGCCCCTTCTGGGGCCCCTT
+TGCCCTCGACCATGCCCAGGACCTTCAGTCCATACTCCCGCCAGGCAGCCATGTCAGTGGCCTCGATGCG
+CAGATAGCCCAGCGACCGGATGCTCATCTGCCACCTCCCAGAAATTCAATCGTCAGCTTGTTGAACTCGT
+CGAACTTCTCCACCTGCACCCAATGCCCACACTGCCCGAATACGTGCAGCTGCGCACGCGGAATCGTTTT
+CAACGCAACCAGCGCGCCGTCCAGCGGGTTGACCCGGTCCTCACGACCCCAGATCAGCAACACCGGCTGG
+CGCAGCCGATACACCTCGCGCCACATCATGCCGGCCTCGAAGTCGGCTCCGGCGAACGACTTTCCCATCG
+CCCGTGTTGCCGTCAACGACTCCGGGGTGCTGGCCAGCGCAAACCGCTGATCCACCAACTCGGGGGTGAT
+CAGGTTCTTGTCGTAGACCATGACCCGCAGGAACGCCTCGAGGTTCTCCCGGGTGGGCGCAACGGAGAAC
+TTCGACAGCCGTTTGACTCCCTCGGTCGGGTCGGGCGCAAACAGGTTGATACTCAGGCCCCCCGGGCCCA
+TCAGCACTAACCGTCCTGCCCGGGCCGGGTAGTCCAGCGCAAACCGGACCGCGGTTCCCCCGCCCAACGA
+GTTGCCCACCAGCGGTACCCGCCCCAGCCCCAGCTGATCGAAGAGCCCCTTCAGCGCCATCGCGGCATAG
+CGATTGAACTGGCCGTGCTCGGCCCGCTTGTCGGAATGGCCGTAACCGGGCTGGTCGACGGCCAGCACAT
+GAAAGTGCCGCGCCAGCACCGCGATATTACGCGAGAAGTTCGTCCAGCTCGCCGCGCCGGGCCCACCGCC
+GTGCAGTAGCACCACCGTCTGGTCGTTGCCCACGCCGGCCTCGTGGTAGTGCAGTTTCAGCGGCCCGTCG
+ACGTCCACTTCCGCAAAGCGCGAGGTGGATTCGAACGTCAATTCCTCGGTAGCTGTCATTTCGCCTAGAC
+CAGCTAGACCATGGTGTCGCCGGGCGGCAACCCGAACTCGTGGTTTCCAAAGATCACGTATGCCCGCTCG
+GGGTCGTTGGCGGCGTGCACCCGACCGGCGTGCGCGTCGCGCCAGAACCGTTGAATCGGAGCCTCATTGG
+ACAACGCGGTGGCACCGGACGCCTCGAACAGCCGGTCGATCGAGGCGATTGAGCGACCGGTGGCGCGCAC
+CTGGTCGCGGCGCGCACGGGCGCGCAGTTCGAACGGAATCTCCTTGCCGGCAGCCAGCAGCGCGTATTCG
+TCGCTCACATTACCGATCAGTTGGCGCCACGCGGCGTCGATGTCGCTGGCCGCCTCGGCGATACGGACCT
+TGGCAAACGGGTCGTCTTTGGCCTTTTCCCCGGCGAACGCCGCGCGCACCCGCTTGCCCTGGTGCTCGAC
+GTGCGCGGCGTAGGCACCGTAGGCCATGCCGACAATCGGCGCCGAAATCGTAGTGGGATGCATTGTGCCC
+CATGGCATTTTATAGACAGGTGCGCTGTTGGTCGCCAGCCCTCCCGCGGTGTGGTCGTTCATCGCCTTGT
+ACGACAAGAACCGGTGCCGGGGCACAAAGACATCCTTGACCACCAGGGTGTTGCTGCCGGTACCACGTAA
+GCCGACCACGTACCACACGTCCTTGATCTCGTATTCGCTGCGCGGGATCAGGAAACTGCCGAAGTCCACC
+GGCCGGCCGTCCTTGATGACCGGGCCGCCGACGAACGTCCAGCTGGCATGGTCGCAGCCCGAGGACCAGT
+TCCACGACCCGTTGACCAGGTAGCCACCGTCGACCACCACGCCCGCCCCCATCGGTGCGTACGAGGACGA
+GATCCGCGTACTCGGGTCCTCGCCCCAGACCTCCTCTTGGGCCCGTTGGTCGAACAGCGCCAGATGCCAG
+TTGTGCACGCCGACGATTGAGCTCACCCACCCGGTGGAACCACACACGCTCGCCAGTCGACGCGTCGCCT
+CGAAGAACAGCGCAGGGTCGCACTGCAGTCCGCCCCACTGCTGCGGCTGCAACAGGGTGAAGAAGCCGAC
+GTCGTCGAGCGCCTTGACGGTCTCGTCGGGCAGCCGCCGCAGATCCTCCGTGGCCTGGGCGCGATCCCGA
+ATCTCCGGCAGCAGATCATCGATGGCAGCCAAGACAGACTGAGCATCACGCTGTTGAATGGACGTCACTT
+ACTTTTGCCTCTCCGGGTTGCGAACTTAGAGAAAGACTAGAACACGTTCCGATTTGTGTCGAGCTAGGTA
+TTCCTGCGGCAGGTAGCGATACCAAATGGGTTTTCTGTAACATGTTCTAGTTATGACGGAAGAGAGGACG
+GGTCTTGACCGAGGCAATTGGAGACGAGCCACTCGGCGACCACGTCCTTGAACTGCAGATCGCCGAGGTC
+GTCGACGAAACCGACGAGGCGCGATCGCTGGTCTTCGCGGTGCCCGACGGATCGGACGACCCGGAGATCC
+CCCCTCGGCGCCTGCGTTACGCCCCCGGCCAATTCTTGACGCTGCGCGTGCCCAGCGAGCGTACCGGTTC
+GGTGGCGCGCTGCTACTCGTTGTGCAGTTCGCCCTACACCGACGACGCCTTGGCGGTCACGGTCAAACGA
+ACCGCCGACGGGTACGCCTCCAACTGGTTGTGCGATCACGCGCAGGTGGGCATGCGCATCCACGTGCTGG
+CCCCGTCGGGCAACTTCGTCCCCACAACCCTCGACGCCGATTTCCTCCTGCTGGCAGCGGGTAGCGGCAT
+CACCCCGATCATGTCGATCTGCAAATCGGCGCTTGCCGAGGGCGGTGGACAGGTGACGCTGCTCTACGCC
+AACCGCGACGACCGCTCGGTCATCTTCGGAGACGCGCTGCGCGAGTTGGCGGCGAAGTATCCCGACCGGC
+TCACGGTGCTGCACTGGCTAGAGTCGCTGCAGGGGCTGCCGAGCGCGAGCGCGCTGGCCAAGCTCGTCGC
+GCCCTACACCGACCGGCCGGTGTTCATCTGTGGGCCCGGCCCGTTCATGCAGGCGGCCCGGGACGCCCTG
+GCGGCGCTGAAAGTGCCCGCCCAACAGGTGCACATCGAGGTGTTCAAGTCGCTGGAATCGGATCCGTTCG
+CGGCCGTCAAGGTCGACGACAGCGGTGACGAGGCGCCGGCGACCGCGGTGGTGGAACTCGACGGCCAAAC
+CCACACCGTCTCCTGGCCGCGCACCGCCAAGCTGCTCGACGTGCTGCTGGCCGCGGGCCTGGACGCGCCG
+TTCTCCTGCCGGGAAGGCCACTGCGGTGCGTGTGCGTGCACCCTGCGCGCCGGCAAAGTGAATATGGGAG
+TCAACGACGTGCTCGAGCAGCAGGATCTCGATGAGGGACTGATTTTGGCCTGTCAATCTCGCCCGGAATC
+TGATTCGGTGGAAGTGACCTACGACGAGTAGTCCCGGAAGGGAGCGAGATGACGCGGCTGATACCGGGTT
+GCACGCTCGTCGGGCTGATGCTGACGTTACTGCCCGCGCCCACCTCGGCGGCCGGGAGCAACACCGCCAC
+CACCCTGTTCCCGGTCGACGAGGTCACCCAGCTGGAGACGCACACCTTCCTCGATTGCCACCCCAACGGC
+AGCTGCGACTTCGTCGCTGGAGCAAATCTGCGCACACCCGACGGCCCGACGGGCTTTCCGCCCGGGCTGT
+GGGCGCGCCAAACCACCGAGATCCGTTCGACGAACCGGTTGGCCTATCTGGACGCGCACGCCACCAGCCA
+GTTCGAACGGGTAATGAAGGCGGGCGGATCCGACGTGATCACCACCGTCTACTTCGGCGAGGGTCCGCCG
+GACAAATACCAGACCACCGGGGTCATCGACTCGACCAATTGGTCGACCGGTCAACCGATGACCGACGTCA
+ACGTCATCGTGTGTACACACATGCAGGTGGTCTACCCGGGGGTCAACCTCACCTCGCCCAGCACCTGCGC
+GCAAGCCAACTTTTCCTAGCTAGGACTCGTCCTGGTACTCGCTGAGCCGGTAAATCAACGCGGCAGACCC
+AGCAGCCGTTCGGCGGCCACCGTCAACAGGATCTGCTCGGTACCGCCGGCTATCGTCAGGCACCGGGTGT
+TGAGGAAGTCGTACACCGCGCGGTTCTCGACGAGCCCGCCCCCGTCGGACACCTCCATCAGGTATTCGGC
+CAGCGCCTGTCGGTAGCGCACGCCGATCAGTTTGCGGACGCTGGATTGCGCCCCCGGATCCTGGCCGCCG
+ACGGCCAACTCGGCGATCCGCCGGTCCAACAGCGCACCGGCCTGAGCCAGCAGGATCAGCCTGCCCAGCC
+GATCTTGCTGCGCGACATCGAGTTCCATGTCACCCAAGACCTTGAGCAGCTCTTCCATCGGGTTGCCCAG
+CGCGGTCCCGGTGGCCATCGCGACCCGCTCGTTGGCTAGCGTGGTGCGCGCCAGCCGCCAGCCGTCGTTC
+ACGGCGCCGACGACCATCTCGTCGGGGACGAACACATTGTCCAGGAAGACCTCGTTGAACAGCGAGTCGC
+CGGTGATCTCGCGCAGCGGTCGGATCTCAATTCCCGGTGTGGTCATGTCCACCAGGAAGTAGGTAATGCC
+CTTGTGCTTCGGAGCATCCGGGTCGGTGCGCGCCAGGCACACCCCCCACCGAGCCTTGTGAGCCGCCGAC
+GTCCACACCTTCTGTCCGGTGAGCAGCCAGCCGCCGTCAGCCCGCACCGCCTTGGTACGCAGCGACGCCA
+GGTCCGAACCGGCCCCCGGCTCGGAAAATAGCTGACACCAAAGGAATTCACCGCGCATGGTGGCCGGGAC
+GAAACGTTCGATCTGTTCCGGCGTGCCGTGTTCAAGGATGGTCGGCGCCGCCCACCAGCCGATCACCAGG
+TCCGGGCGCTCAACCTTGGCCGCGGCCAGTTCCTGATCGATCAGCAGTTGCTCGGCCGGGGACGCGCCGC
+GCCCGTACGGCGCCGGCCAGTGCGGCGCCAGCAGGCCGGTGTCCGCCAGCGCCACCTGACGTTTCTCCTC
+GGGCAACGCGGCCACCTCGGCGACCGCCGCCGCGATCTCCGGTCGCAGGCCGGCCACCTCGGCCAGGTCG
+ACGCCCAAGCGACGACGGACACCGGCCTGGGTCAGCGCCGTAACCCGACGCAGCCAGCGCCCGGATCCAC
+CGAGGAACCCACCGATTCCGTGGGCCCGGCGCAGATACAAATGCGCGTCGTGCTCCCAGGTGCAGCCGAT
+ACCACCGAGCACCTGGATACAGTCCTTGGCGTTGGCTTTGGCGGCGTCGATGCCGATGCTCGCGGCCACC
+GCCGCGGCGATCGAAAGTTGGGTGCCATCGGAATCGGCTGCGGCGCGGGCCGCATCGGCGGCGGCCACAT
+CGGCCTGCTCGGCACGGCACAACATCTGAGCACACAGGTGCTTGACAGCCTGGAAGCTGCCGATCGGCTT
+GCCGAATTGCTCCCGCACCTTGGCGTAGGCAACCGCGGTATCGAGCGTCCATCGAGCCACCCCGGCCGCC
+TCGGCCGCCAGCACGGTAGCGGCCAGGTCTTCCACCCGCTCCCCCGACACCTCCAGAACGGTGACCGGTG
+CCGATGTCAGCACCATCCGGGCCAGCGGCAGCGAAAAGTCGGTGGCCCGCAGCGGCTCCACTACGACCTC
+GTCGCAAGCAGTGTCCACCAGCAGCCAATTCCCGTCGGCCGGCAACAGCACGACGCCGCCGGGCGCGCCA
+CCAAGCACTCGGCCGACGGTGCCCGACGCGGTCGACGTCTTCGGGTCGACCTGCACGCCACCGTCGATAG
+CCACCCCGGCGAACCGTTCACCCGACGCTAGCGCGCTGCGCAGCTTGGGATCGGAGACAACCAAAGTGGC
+CACCGCGGTGGTCGCGACCGGCCCCGGTACCAACGCCCTGGCCGCCTCGTCGACCATCGCACACAGGTCC
+TCGATGCTGCCGCCAGCTCCGCCACAATCCTCTGGGACGGCGACACCGAAGAGGCCCAGGCCCGCCAGCC
+CGGCGAACACCGGCCGCCATGCGTCCGCATTTCCTTCTTCGAAGCCGTATTCCATGTCGCGGACCGCCGC
+AGTCGCGGCCGCACCTGAGGCCGCGGTGCGGGCCCAGCCGCGCACCAACTCACGAGCCGCGGATTGTTCG
+TCGGTGACGGTCGCTACCACCTGCAGACCTCCGCGTCGACAATTTCACATAGCAATGGAGCGTTCTTGCC
+CACTAGAACGTGTTCTAATAGTGCTAACGATCAACCGTCAAGTCGAAGGCAATAACTCCAGCACATGTCG
+TCGTCTCGGCTGTCGGGAGGTGGGAAATCTACACACAGCATGCGTATCGTTTGCAAACGAACCGCCCGGA
+AGAGGAGCTGCCCGCTACATGTCGTCAGCGAACACGAACACCAGTAGCGCTCCCGACGCACCACCTCGCG
+CGGTCATGAAAGTGGCGGTACTTGCCGAGTCCGAGCTCGGATCGGAGGCACAGCGGGAGCGCCGCAAGCG
+CATCTTGGACGCCACCATGGCTATCGCGTCCAAAGGCGGCTATGAGGCGGTGCAGATGCGCGCCGTCGCC
+GACCGCGCCGACGTCGCGGTTGGCACGCTGTACCGGTACTTCCCGTCGAAGGTGCATCTGCTGGTGTCGG
+CGCTGGGTCGGGAATTCAGCCGCATCGACGCGAAAACCGACCGCTCCGCGGTCGCCGGGGCCACCCCCTT
+CCAGCGGCTGAACTTTATGGTCGGCAAGCTCAACCGCGCGATGCAACGCAATCCGCTACTCACCGAGGCC
+ATGACACGTGCCTACGTGTTCGCCGACGCCTCGGCGGCCAGCGAGGTCGACCAGGTCGAAAAGCTCATCG
+ACAGTATGTTCGCGCGTGCAATGGCCAACGGCGAACCAACCGAGGACCAGTACCACATAGCGCGGGTGAT
+CTCGGACGTGTGGTTGTCGAACCTGCTCGCGTGGCTTACCCGACGAGCCTCGGCTACCGACGTCAGCAAG
+CGGCTGGACCTGGCCGTGCGGCTGCTGATCGGCGATCAAGACAGCGCCTAGAAGACTTACGCCGGCGGAC
+CCGCGGTGCGGCCCCGGACCAGCTCGGTATCGAGCACCTCGATGACGGGCAGTCCGGACCGCGGCGGCTT
+CAGCAATAGCTCGCCCGCCCGGTGCCCCTTGTGCAGACTCGGCTGCGCGACCGTGGTCAGCCCCCGGCTC
+AGCGCCTCTGGCACTCCGTCAAACCCTGTGACGGTCATCTGCCCGGGCACGTAAATCCCGTGCGCCCGAA
+GGTAATCCATAGCTGAGAGCGCCAAGATGTCCGCTGTGCACATCAGCGCGGTCAGCCGCGGATTGGCCTG
+CAGAGCCACCTTGGCGGCAGTGCCGCCGGACGTCGGCAAATGCTCGTAGCTTTCCACCACGGTCAGCGAG
+TCCGGGTCGACGCCGGCGGCCGTCATCGCCTCCCATACGCCGACGATGCGTTCGCGCTGTACGTCGAAGG
+TCGGCGACCGCAGCCGCTCGGCGTCCACCAAGTCTTGCCGCCGATCCCGTCCCAGCCGCATGGTCAGCAG
+GCCGAGCTCGCGATGCCCCAACCCGAGTACGTAGCCGGCAAGCTCACGCATCGCCGCCCGGTCGTCGATG
+CCGACCCGGGACACTCCGGAGAGGTCTTTGGGCTGGTCGACCACCACCACCGGCAGCCGCCGCTGCAGCA
+CGACCTGCAGGTAGGGATCGTCGTCGCCTACCGAATACACCACGAAGCCGTCCACCCCAGCGCCGAGCAC
+GGCAGCTGTGCCGTCCGCAAGGCTCCGACTGGAGCCGACGGAAACCAGCTGCAGGCCCTGCCCCAGCTCT
+TCGCACGACTGCGCCACTCCCGCAACAAAATCCCGCGCGGCCGGGTCGCTGAAGAAATAGGTCAGCGGTT
+CGGCCATCACCAAACCGACCGCACCGGCTTTGCGGGTCCGCAACGATCGCGCCACCGGATCCGGTCCGGC
+ATAGCCCAGTCGCTTGGCCGTGGCAAGCACTCGTTCACGTAGATCGGCGGAGAGCTGATCCGGTCGGTTA
+AAAGCATTCGAGACAGTGGTGCGGGACACCTTGAGCTCGGCTGCTAACGACGCCAGAGTCGCCCGCCTCC
+GCGGTGTGGGACTCACGTTCGGTGAGGGTACAGCGGACCCTCGAGCACGCAATATCGTGGGCCGGCTGGC
+AACCGTCGGTTTCGACGTTGGTGACGACCCCTCGTTCATGAATCGTTCTTGAGCTCCCCGTTTTGCTGGA
+TGCCCAGGCACCGCCGGTACTGCTGCGCTTAAGCTTGTCGCACATGGTGCCGGCAGGGAGGAACAGTGGG
+CAAGCAGCTAGCCGCGCTCGCCGCGCTGGTCGGTGCGTGCATGCTCGCAGCCGGATGCACCAACGTGGTC
+GACGGGACCGCCGTGGCTGCCGACAAATCCGGACCACTGCATCAGGATCCGATACCGGTTTCAGCGCTTG
+AAGGGCTGCTTCTCGACTTGAGCCAGATCAATGCCGCGCTGGGTGCGACATCGATGAAGGTGTGGTTCAA
+CGCCAAGGCAATGTGGGACTGGAGCAAGAGCGTGGCCGACAAGAATTGCCTGGCTATCGACGGTCCAGCA
+CAGGAAAAGGTCTATGCCGGCACCGGGTGGACCGCTATGCGCGGCCAACGGCTGGATGACAGCATCAATG
+ACTCCAAGAAACGCGACCACTACGCCATTCAAGCGGTCGTCGGCTTCCCGACCGCACATGATGCCGAGGA
+GTTCTACAGCTCCTCGGTGCAAAGCTGGAGCAGCTGCTCGAACCGCCGGTTTGTCGAAGTCACCCCCGGA
+CAGGACGACGCCGCCTGGACTGTGGCTGACGTTGTCAACGACAACGGCATGCTCAGTAGCTCGCAGGTTC
+AGGAAGGCGGCGACGGATGGACCTGCCAGCGTGCCCTGACTGCGCGCAACAACGTCACTATCGACATTGT
+CACGTGCGCCTATAGCCAACCGGATTTGGTGGCGATTGGCATCGCTAACCAAATCGCGGCCAAGGTTGCT
+AAGCAGTAGGCATGGCCGACGGTCCCCTTGCCATCACGGCGAAATCGGTTTACATACATGGCTATTCGGT
+AGATACGGCAGAGATTCCAACAGCTGTGCGTGGCCACCCGAATGCCGCGGGAACCGCGATCAAGGACCGC
+CGCTGATGCGGCCGAAACTTGGGCGTCCCAATATCGCGCGGTATTCCAACAGGTTTAGCGTGCCTACCGC
+CAGATCCGATGCTCCGTTGTCGGTGACCTGGATGGGCGTTGCGACGCTGCTGGTCGACGACGGATCGTCG
+GCCCTGATGACTGATGGCTACTTTTCCCGGCCCGGCCTGGCACGGGTGGCGGCGGGTAAAGTGTCGCCGT
+CAGCGGAGCGGGTCGACGGTTGCCTTGCCCGGGCCAATGTCTCCCGGCTGACGGCCGTTATCCCGGTGCA
+CACTCACATCGACCACGCGATGGATTCCGCGCTGGTCGCCGACCGTACCGGAGCCCAGCTGGTCGGGGGG
+GAGTCGGCGGCCAATGTCGGGCGCGGATACGGGTTGCCTGAGGAGTCTCTTGTCGTCGCCGTCCCAGGTG
+AACCAATCCAGTTGGGCGCCTTCGACGTGACGTTGGTGGAGTCGCATCACTGCCCACCCGACCGGTTTCC
+CGGTGTGATCAGCGCACCACTGACACCGCCGGTGAAGGCGTCGGCCTACCGCTGCGGTGAGGCGTGGTCG
+ACGCTGGTGCACCACCGGCCATCGGGGCGCCGGCTGTTAATCCAGGACAGCGCCGGTTTCGTCAGCGGCG
+CACTGGCCGGTTACCGCGCCGATGCCGCCTACCTCAGTGTCGGCCAGCTCGGCCTGCAACCGCCGTCATA
+CCTGCTCGAATACTGGACCGAGACCGTGCGCACGGTGGGCGTCCGCCGCGTGATTCTCATCCACTGGGAC
+GACTTTTTTCGGCCGCTGTCAAAGCCGTTGCGGGCCTTGCCATATGCGGCCGACGACCTAGACCTGTCGA
+TCCGCATCCTCGACGAGCTGGCCGCCCAGGACGGCGTCGCGCTGCAGATGCCGACGGTGTGGCGCCGCGA
+GGATCCCTGGATGTGAAGCGCTCTAGCCCTTGACACTTGCTGTTGCGCTGATACTGCTTGCCGTGGTCCT
+GGGGTTCGCGGTTGCCCGCCCACGCGGCTGGCCGGAGGCAGCGGCGGCGGTTCCGGCAGCGGTCATCCTG
+TTAGCGATCGGGGCGATCTCGCCCCAGCAGGCGATGGCGCAGGTGTCCGGGCTGGCGCGCGTGGTCGCGT
+TTCTGGGTGCGGTTCTGGTGCTGGCTAAGCTGTGCGACGACGAAGGCCTGTTCGAGGCAGCCGGCGCGGC
+CATGGCTCGAGCGAGCGCGGAGTCGCACCGACTGCTACGGCAGGTGTTCGCCGTCTCGGCCGCCATCACC
+GCGGCGCTCTGCCTGGACGCCACCGTGGTGCTGTTGACCCCGGTGGTGCTGGCGACGGTCCGCCGGCTGC
+GGACCCCGGTGCGCCCCTATGCCTACGCCACCGCCCACCTAGCCAACGCCGCTTCGCTGCTGCTTCCGGT
+GTCGAATCTGACCAACCTGCTCGCCTACCACGGTGCCGGCATCTCGTTCACCAAGTTCACGCTGCTGATG
+GCATTGCCTTGGCTGTCCGCCGTGGCCGCGGTCTATGTGGTCTTCCGCTGGTTTTTCGCCCGGGATCTAC
+GCGTGGTGCCGGACCGGCAGCAACTCAAGCCGGCGCCGCGCCTGCCAATGTTCGTGCTGGTGGTGGTGGC
+GCTGACACTCGGGGGCTTCGCCGTCGCCGAGTCGGTGGGACTGGCCCCAACGTGGGCGGCGCTGGCTGGC
+GCCGCAGTGTTGGCGCTGCGAAGTCTGCGGCGTGGACACACTTCGGTGCTGCGGATCGCGCGCGCCGTCA
+ACGTGTCGTTCCTGGTCTTTGTGTTGGCCCTGGGTGTCGTGGTGCACGCGGTCATGCTCAACGGCATGGC
+CGCCAGGATGTCCGCCGTGCTGCCGACCGGGTCCGGGTTGCCCGCGCTGCTCGGCATCGCCGCGCTGGCC
+TCCGTGCTGGCCAACGTGGTCAACAACCTGCCCGCGACTCTGGTGTTAGTGCCGCTGGTGGCGGCCGGCG
+GGCCGGCGGCCGTGCTGGCCGTGCTACTCGGGGTCAACATCGGACCCAACCTGACCTATGCCGGTTCGCT
+GTCTAACCTGCTGTGGCGGGGCGTGCTGCGCCGGCACAACGTCGACGCCAGCGTCGGCGAGTACACCCGA
+CTGGGACTGTGCACCGTGCCTGCGGCCCTGGCGATGGCGGTGCTCGCGCTGTGGGCCAGCGCCCAGGTTC
+TGGGGATCTAGCCGCAAGGGCGCGAGCAGACGCAGAATCGCATGATTTGAGCTCAAATCATGCGATTCTG
+CGTCTGCTCGCGAGGCTCGCGTGGCCGCCGGCGCTGGCGGGCGATCGCGGCGAGCACCACCCCAGCGGCC
+ACCGAGGCGTTCAGTGATTCGGCCTGAGCGGCCATCGGGATGGACACCACCTCGTCACAGTTCTGCCTTA
+CCAACCGGGACAACCCCTTGCCTTCCGACCCAACGACCACCACCAACGAGTCAGTGCCATCTACATCGTC
+GAGCGCGGTGCCGCCACCGGCGTCCAGTCCGATCACCCGCACTCCACGATCGGCCCAGCCCTTCAGCGTC
+CTGGTGAGATTGGTGGCCCGGGCCACCGGAATCCTGGCCGCCGCCCCGGCGCTGGTGCGCCACGCCACCG
+CGGTCACCGACGCAGAACGGCGTTGCGGAATCAGCACCCCATGGCCACCGAACGCGGCCACCGACCGCAT
+GATCGCACCGAGGTTGCGCGGGTCGGAAAGGTTGTCCAAAGCGACCAGCAGCGCAGGCGGTTGGTCGAGG
+GCGGCGGCCAGCAGGTCATCGGGATGGGCGTAGTTGTACGGTGGCACCTGTAGCGCGATGCCTTGATGGA
+GGTGGTTGGCGGTCATCCGATCCAGGTCGGCACGTAGCAGCTCGACGATCGCAATCCCTGAATCAGCCGC
+CCGCGCAACGCATTCAGTCAGTCGCTCGTCGGCCTCGGTACCAAGGGCGACGTATAGCGCGGTGGCCGGA
+ACACCCGCGCGCAGGCATTCCAGCACTGGGTTGCGACCCAACACCGTCTCGGTCTCGTCCGCGCGCTTGA
+CCGGGCGGCGTGGCTGTGCACGTGCCCGCTTGGCGGCGGGATGGTGGGGACGCAGGTGCGCCGGCGGGGT
+AGGCCCGCGCCCTTCCAGCCCACGGCGTCGCTGACCGCCCGAGCCGACGCCTGCGCCTTTCTTGGTACCG
+GATTTGCGGACCGCACCCCGCCGCCGAGAGTTACCGGGCATCTACTTGGTGTCACCACCCAGCAGCGACC
+ACTGTGGCCCGTCGGCGGTGTCGGTGACCTCGATGCCGGCTCTCTTCAGCCGACCCCGGATCTCGTCGGC
+GAGCGCCCAGTTGCGCTGCTCGCGGGCCTTTTCCCGATTCTGTAGTTCAGCCTGGACCAGCACATCGACG
+GCGGCCAGCGCTGCCGAGGTTTCGTCTCGGGATTCCCAGCGCTGGTCGAGCGGGTCACAGCCCAGGATGC
+CCATCATCGCCCGAATCGCGCTAGCGCTTCGCAAGGCCCCGTCGTGGTCGCCGGCATCGAGTGCCCGGTT
+GCCTTCCGCCCGCACGTGGTGAATCTCGGCGAGCGCGATCGGAACGGACAGGTCGTCGTCGAGCGCTTCG
+GCGAACCGTGGGGTCGGATCGCCGGGGCAGACGGCGCCCACCCGGGTGCGAACGCGGTGCAGGAAGTCCT
+CTAGCCCGACATAGGCTTTCACCGCATCCTGCATAGCGGTCTCGGAGAACTCGAGCATCGACCGGTAGTG
+CGCGCTGCCCAGGTAATAACGCAGCTCAGCCGGCCGCACCCGCTGCAACATCGCCGGCATGGACAACACG
+TTGCCCAGCGACTTGCTCATCTTCTCCCCGCCCATCGTCACCCAGCCATTGTGCAGCCAGTAGCGGGCGA
+ACCCATCACCGGCGGCGCGGCTCTGGGCGATTTCGTTCTCATGATGCGGGAAGACTAAATCCATTCCACC
+GCAATGGATATCGAATTCCGGCCCGAGATAGCTGCGAGCCATTGCCGAGCATTCCAGATGCCAGCCCGGA
+CGCCCGCGGCCCCACGGCGTCGGCCACGACGGTTCACCCGGCTTTTCGCCCTTCCACAAAGTGAAGTCGC
+GCTGGTCCCGCTTGCCGGCAGCCACACCTTCGCCCTGATGGACGTCATCGATCTTGTGACCGGATAACTG
+GCCGTACTCCGGGTAGCTCAGAACGTCGAAGTAAACGTCACCGCCACCGGTATACGCGTGGCCGGCCTGG
+ATCAGGCGCTCGATCATCTCGATCATCTGGGTGATATGCCCGGTGGCGCGCGGCTCCGCGGACGGCGGCA
+AGACGTCCAGAGCGTCGTAGGCCGCGGTGAAGGCACGCTCGTGGGTAGCCGCCCACTCCCACCACGGCCG
+GCCCGCCGCGGCGGCCTTGGCCAGGATCTTGTCTTCGATGTCGGTCACGTTGCGGATAAACGCGACGTCG
+TAGCCACGCGCGAGCAACCATCGGCGCAGGATGTCGAAGGCGACCCCGCTGCGGACATGCCCGATATGCG
+GTAGGCCCTGCACCGTGGCACCGCACAGGTAGATCGAGACGTGTCCAGGTCGCAACGGGACGAAATCCCG
+CACGACACCGGCGGCAGTGTCGTGTAGCCGCAAGCGAGCCCGATCGGTCACGACGTGCCAGCTTACCTGC
+CCAATTGCTGCAACCTGCGGCGCGCGCGTCCGGACCAGGAGTGCGCTACCGCAACGAAACCACCAATGCC
+GTAGCGATTGCGGCCAAGCCCTCGCCGCGGCCAGTGAGGCCCAGCCCGTCGGTGGTGGTAGCCGACACCG
+ACACCGGCGCGTTGAGCAGACGTGACAGCACCGCCTGCGCCTCGAGCCGGCGCCAACCGATCTTCGGTCG
+GTTGCCGATCACCTGCACCACAGCGTTGCCGACCCGATAGCCATGCTGGGTGATCAGGACGACGACATGG
+CGCAACATGTCGGCACCACTGACACCCTGCCAACGGGGATCGTCGACGCCGAACACCTCGCCAATGTCGC
+CTAGCCCCGCGGCCGACAGCACCGCGTCGCACAGCGCATGAACGGCCACGTCACCGTCGGAGTGGCCCGC
+GCAACCGTCGGCGCTCGGGAACAACAACCCCACCAGCCAGCACGGACGTCCGGGTTCGATCGGATGCACA
+TCGGTCCCCAAACCAACGCGGGGCAGCTGATTCACCCGCGCACTATAGCTTGGGCCAGCAACAGATCCAG
+TTTGGTGGTGATCTTGAACGCCAGCGGATCGCCGTCGACCACCTGCACCTGGCCGCCGATATGCTCGACC
+AGCGACGCGTCATCGGTGTACTCGGCGGCTGGAAGGTCTAGGGAGCCGCGCTGATATGACCGCAGCAGCA
+GGTCGGTAGTGAACCCTTGTGGGGTCTGCACGGCCCGCAGCCCGGCTCGTTCCGGCGTGCCCAGGACCAC
+CCCGTTGGCATCCACGGCCTTGATGGTGTCAGAAAGCGGCAGTACGGGAACGACGGCGGCATAACCGTCC
+CGCAACGCCTCGACCACCCGGGCGACCAGGGCCGGTGGTGTCAGTGCCCGCGCGGCATCATGCACAAGCA
+CAAACTCCGGCTCCGCGGTCCCGGACAGCACTGCCAGCGCCAGGTTCACGGTGTCAGTGCGATTCGACCC
+ACCCGCCACAATCATCGCCCTGTGGCCGAGGATCTGCCTCGCCTCGTCCGTACGGTCGGCGGGCACGGCC
+ACAACAACGGTGTCAACTACCCCCGAATCCAGCAGGCCATCGACGGCCCGCTCAATGAGAGTCTGCCCGT
+CGAGCTGGTAAAACGCCTTGGGCACACCGACGGCCAACCGCTCCCCCGACCCCGCAGCCGGGACGATCGC
+AACTACTTCGCCCGCTTCCCTGACCACTAGAGCCTCAGGGCGGTCAAGACGCGGCGGCTAAAACCTCGTC
+AAGGATGGTCTCGGCTTTGGCGTCATCGGTGCTCTCAGCCAACGCCAACTCGCCGACCAGAATCTGCCGG
+GCCTTGGCCAGCATGCGCTTCTCACCGGCCGACAAGCCACGCTCCTGGTCGCGACGCCACAAATCGCGCA
+CTACCTCGGCCACCTTGTTCACATCGCCGGATGCGAGTTTCTCGAGGTTCGCCTTGTAACGACGTGACCA
+GTTCGTCGGCTCCTCGGTGTGCGGGGCACGCAACACCTGGAAAACCTTGTCCAGGCCTTCCTGCCCGACG
+ACATCGCGAACACCGACGTATTCGGCGTTTTCAGCGGGAACTCGTACTGTCAGGTCGCCCTGCGCAACTT
+TCAAGACGAGATACTCTTTTTGTTCCCCTTTGATGGTCCGGGTTTCGATCGCCTCGACTAACGCAGCACC
+GTGGTGTGGATAGACAACGGTGTCTCCGACCTTGAAAATCATCTGATTTGAGCCCCTTTCGTTACTCCAT
+GCTAACACGGGCCCTAACGGGCGCCGAACAACGGTGCAGGTCAGGGGCATAGCGCGGGAAGATTGGGGGT
+TGACAGACGGGCCTAGAAGTGCATCGCCGAATCTGGGACGCCCCTGAGAACGGGGTGCCCGGGCTACCGC
+GCCGGTCCGGTCGACGCCGCGGTCCCCACCGCTACCGTCGGCGGCACCTAACTACTACTGTGCATAGTCG
+AGCCGCAGGCACCATGCCGCGCCAAGGCCGAGCAGGAGGCATCCGAGTGAACCGCTGCAACATCCGCCTG
+CGTCTTGCCGGGATGACCACCTGGGTGGCGAGCATCGCCCTGCTGGCCGCCGCACTGAGCGGTTGCGGGG
+CCGGTCAGATCTCCCAGACAGCGAACCAGAAGCCGGCCGTCAACGGCAATCGGCTCACCATCAACAACGT
+GTTGCTGCGCGACATCCGCATCCAGGCCGTCCAAACCAGCGATTTCATCCAGCCAGGCAAAGCGGTGGAT
+CTGGTGCTGGTAGCCGTCAACCAATCACCCGACGTTTCGGACCGGCTGGTGGGCATCACCAGTGATATCG
+GCTCGGTGACGGTGGCCGGCGACGCTCGACTGCCCGCATCCGGGATGCTTTTTGTCGGGACGCCGGACGG
+CCAGATCGTGGCGCCGGGGCCCTTGCCATCCAATCAAGCGGCCAAGGCGACCGTTAACTTGACCAAGCCG
+ATCGCAAACGGCCTCACCTACAACTTCACCTTCAAGTTCGAGAAGGCCGGTCAGGGCAGCGTAATGGTGC
+CGATCTCGGCCGGATTGGCTACGCCGCACGAATAGGCGCCGCATCGTCGCCAGACGAGCGACTCGCTCGG
+GTTGTCACACCCCCCCGATACGGTCACGGCGTGGCCAACGCTCGTTCGCAGTACCGCTGTTCGGAATGCC
+GCCATGTCAGCGCGAAGTGGGTGGGACGCTGCCTGGAGTGCGGCCGCTGGGGCACCGTAGACGAGGTGGC
+GGTGCTCAGTGCCGTCGGTGGCACCAGGCGCCGTTCGGTGGCGCCGGCGTCGGGCGCCGTTCCGATCAGT
+GCCGTCGACGCGCATCGGACCCGACCCTGCCCAACCGGCATCGACGAACTGGACCGGGTGCTAGGTGGCG
+GTATCGTTCCCGGTTCGGTGACACTGCTGGCCGGCGATCCCGGAGTGGGTAAGTCGACGCTGTTGCTCGA
+GGTCGCGCACCGCTGGGCCCAGTCCGGACGGCGCGCGCTCTATGTCTCTGGTGAGGAATCCGCCGGTCAG
+ATCCGGCTGCGTGCCGACCGGATCGGCTGCGGCACGGAGGTCGAGGAGATCTACCTCGCCGCACAATCCG
+ACGTGCACACCGTGCTCGACCAGATCGAGACGGTGCAGCCGGCACTGGTCATCGTCGACTCGGTGCAGAC
+CATGTCCACCAGCGAGGCCGACGGCGTCACCGGCGGGGTCACGCAGGTCCGTGCGGTTACGGCTGCCCTG
+ACCGCTGCCGCCAAGGCCAACGAGGTCGCATTGATTCTCGTCGGCCACGTCACGAAGGACGGGGCCATAG
+CCGGACCGCGTTCGCTAGAGCACCTCGTCGACGTTGTGCTGCATTTTGAAGGGGACCGCAACGGTGCGCT
+GCGGATGGTCCGCGGGGTCAAGAACCGATTCGGCGCCGCCGATGAAGTCGGATGTTTCCTCCTGCACGAC
+AACGGAATTGACGGTATCGTCGACCCGTCGAACCTGTTCCTGGACCAGCGGCCGACACCCGTCGCCGGTA
+CCGCGATCACCGTGACGCTGGACGGAAAACGGCCGCTCGTCGGGGAAGTCCAGGCATTGCTGGCCACACC
+GTGCGGCGGCTCGCCGAGGCGGGCCGTCAGCGGGATCCACCAGGCCCGCGCTGCGATGATCGCTGCTGTG
+CTGGAAAAGCACGCACGGCTGGCGATCGCCGTTAACGACATCTACCTGTCCACCGTGGGCGGCATGCGGT
+TGACCGAGCCGTCGGCGGATCTGGCGGTCGCCATCGCGCTCGCCTCGGCCTATGCAAATCTGCCGCTGCC
+CACCACTGCCGTCATGATCGGCGAGGTAGGTCTGGCCGGCGACATCCGGCGGGTCAACGGGATGGCGCGG
+CGCCTTAGCGAAGCCGCCCGCCAAGGGTTCACCATCGCCTTGGTCCCGCCCAGTGACGATCCGGTGCCGC
+CCGGTATGCACGCGCTGCGCGCATCCACCATCGTCGCGGCGCTGCAGTACATGGTCGACATTGCCGACCA
+CCGCGGCACCACCCTCGCAACCCCGCCCTCACATTCCGGGACTGGACACGTCCCACTAGGGCGCGGTACA
+TAGCAGAATGCACGCTGTGACTCGTCCGACCCTGCGTGAGGCTGTCGCCCGCCTAGCCCCGGGCACTGGG
+CTGCGGGACGGCCTGGAGCGTATCCTGCGCGGCCGCACTGGTGCCCTGATCGTGCTGGGCCATGACGAGA
+ATGTCGAGGCCATCTGCGATGGTGGCTTCTCCCTCGATGTCCGCTATGCAGCAACCCGGCTACGCGAGCT
+GTGCAAGATGGACGGCGCCGTGGTGCTGTCCACCGACGGCAGCCGCATCGTGCGGGCCAACGTGCAACTG
+GTACCGGATCCGTCGATCCCCACCGACGAATCGGGGACCCGGCACCGCTCGGCCGAGCGGGCCGCGATCC
+AGACCGGTTACCCGGTGATCTCAGTGAGCCACTCGATGAACATCGTGACCGTCTACGTCCGCGGGGAACG
+TCACGTATTGACCGACTCGGCAACCATCCTGTCGCGGGCCAACCAGGCCATCGCAACCCTGGAGCGGTAC
+AAAACCAGGCTCGACGAGGTCAGCCGGCAACTGTCCAGGGCAGAAATCGAGGACTTCGTCACGCTGCGCG
+ATGTGATGACGGTGGTGCAACGCCTCGAGCTGGTCCGGCGAATCGGGCTGGTGATCGACTACGACGTGGT
+CGAACTCGGCACTGATGGTCGTCAGCTGCGGCTGCAGCTCGACGAGTTGCTCGGCGGCAACGACACCGCC
+CGGGAATTGATCGTGCGCGATTACCACGCCAACCCGGAACCACCGTCCACGGGGCAAATCAATGCCACCC
+TGGACGAACTGGACGCCCTGTCGGACGGCGACCTCCTCGATTTCACCGCGCTGGCAAAGGTTTTCGGATA
+TCCGACGACCACGGAAGCGCAGGATTCGGCGCTGAGCCCGCGTGGCTACCGCGCGATGGCCGGTATCCCC
+CGGCTCCAGTTCGCCCATGCCGACCTGCTGGTCCGGGCGTTCGGAACGTTGCAGGGTCTGCTGGCGGCCA
+GCGCCGGCGATCTGCAATCAGTGGACGGCATCGGCGCCATGTGGGCCCGTCATGTGCGCGATGGGTTGTC
+ACAGCTGGCGGAATCGACCATCAGCGATCAATAATTATCCGCCTTGCGCGGGAGACTCCGGCGGAGGCGC
+CTGCGCTGGACCCGGAGCGGGTACCGGCCCGGGCGGCGGCGGCGGCTGATTCAGGATGAACGGAACCGGC
+AGCGAGCGCAGATTGCCCAGTTGTACCACGAGATTGTAGGTGCCCGGCCCGATCGCCGGCCGCGGCAATG
+GGCAGCGCGGCGCCGATCCCATCCCGGTCCAGGTCACCGCGGTCGTTACCTGCTCACCGGGGGAAAACGT
+CTTGACCAGCGTCTCATTCGAGGGCGCGCAGTCCAGGTTGGACCACAACCGCTTGTTGTCCAGCGAGTAA
+ACGTAGGCGGCCAACACCGCGGCCCCAACGTCGCGTTTACAGGACACCAGGCCGATGTTGGTGACCACCA
+TGGTGAACTTCGGCTGGTCGCCGACGTAGTACTGCGGCGCGTTGGTCAAACCTTTGACGGCCAGCGTCGA
+ATCGGGGCAATCGTCCCCTTCCTTGAGCACCGGCGGCGGCTGCACCGCGGCGGTGGGCGTGGGTGTCTCG
+GGGTTTTGGCCCTGCGGCGGGGCCGCGGCGGCGTTACCTTCGGTTTGCCCGGCCGGCTGGGGTGCTTGGG
+GTGCCGGCGAGCCCGGATGGCTCTGGGCGGAGGCCGGCTTGTCGGCGCTGACCGGTTTGGCACCGGCGCT
+GCTGTCGACGAAGGCGATGACGATGGCCACCGCGATCCCGACTACGACGACCGCGATGCCCAGGGCCAGC
+CCCCTGCGCCGCCAGTAGATCTCGGTAGGTAGCGGGCCACGCGGTTCCAGATCCAGCACGATTACACCGT
+AGGGCCAGGTCACGCAAACGCGCTTGACCCGCCTCGGCGTGTCGCCGGCTTCGCTGGCCGACGCCGTGTT
+AACGGTGGCCTGTTATCGGGCGGTAACTCAGACCTCCTCGCCGATGTTGCCGATGTGGTCGCGCAGTACA
+GCCCGCCCATCGTCGAGTTGATAGGTGACGCCCACGATCGCCAGGCTGCCCCCTGCGATTCGTTCTGAGA
+TGGCCGATGAACGCGCCATGAGGATCGCCACCGTCTCGTGTACATGTCGTTGCTCGAACTCGTCGACACG
+ACTCAGACCGTCACGGCGGCCGAGCAGGACCGACGGCGCAACCCTTTCCACGACGTCTCGCACGTAGCCG
+CCTGGCAGGGTGCCGTCGTTGATCGCGGCCAAAGCGGCGTTCACGGCGCCGCAGCTGTCGTGGCCGAGGA
+CGACGATGAGCGGCACATTGAGCACGGTCACCGCGTACTCTATGGAGCCCAGCACGGCCGAGTCGGTGAC
+ATGCCCGGCGGTGCGGACCACGAACATGTCGCCCAGGCCTTGGTCGAAGATGATCTCAGCGGCCACTCGG
+CTGTCCGCGCAGCCGAAGATCACCGCCGTGGGCTTCTGCCCGGCGGCCAAGCCGGCTCGGTGGTCGACGC
+TCTGACTGGGATGCTGGGGCCGGCCGGCGACGAATCGCTCGTTACCCTCTTTGAGTGCTTTCCACGCGGC
+TACCGGATTGGTGTTGGGCATGCCTCACATACTGCCGGAACCGTCGGTGACCGGCCCGCGACACATATCA
+GATACCAATCTTCTCGCTTGGTATCAGCGATCGCACCGGGATCTGCCCTGGCGAGAGCCCGGTGTCAGCC
+CGTGGCAGATCCTGGTCAGCGAGTTCATGCTGCAGCAGACGCCGGCCGCCCGGGTGCTGGCGATCTGGCC
+GGACTGGGTGCGGCGGTGGCCCACGCCGTCGGCCACCGCCACGGCCAGCACCGCCGATGTGTTACGCGCC
+TGGGGCAAGCTGGGCTATCCCAGGCGAGCCAAGCGCTTACACGAGTGCGCCACCGTCATCGCCCGCGACC
+ACAATGACGTGGTGCCCGACGATATCGAGATCCTGGTCACCCTGCCGGGCGTCGGGAGCTACACCGCGCG
+CGCGGTGGCGTGTTTCGCTTACCGCCAGCGGGTGCCGGTGGTGGACACCAATGTGCGGCGCGTGGTGGCC
+CGCGCCGTTCACGGCCGCGCCGACGCCGGTGCGCCATCGGTGCCGCGCGACCACGCCGACGTCTTGGCGC
+TGTTGCCGCACCGCGAGACGGCGCCTGAATTTTCGGTCGCGCTGATGGAGTTGGGTGCGACGGTGTGCAC
+CGCCCGCACACCCCGGTGCGGGTTATGCCCGCTGGACTGGTGCGCATGGCGGCATGCCGGTTATCCGCCG
+TCGGACGGTCCGCCGCGCCGGGGGCAGGCCTACACCGGAACCGACCGCCAAGTCCGCGGACGGTTACTGG
+ATGTGTTGCGCGCCGCGGAGTTTCCCGTCACCCGGGCCGAGTTGGACGTGGCGTGGCTGACCGATACCGC
+ACAGCGTGACCGGGCGCTGGAGTCGCTGCTGGCCGATGCGCTGGTGACCCGGACGGTCGATGGCCGGTTC
+GCGTTGCCCGGCGAAGGGTTTTAGCCGGGTAGGCCGTCCGCACCGGCGGCGCCGAAACCGCCGGGATCAC
+CGGGGTTGCCCGCGACGACTGTCCCAGCTCCCGCGGCGCCACCCGCGCCGCCAGCGCCGCCGGCACCTCC
+CTGGCCCCCGGTACCGCCCGCACCGTGGACACCTGGCTGGCTGAACATTCCGGCACCTCCGCCGGCACCT
+CCGGCACCGCCCTTGCCGCCGTTGCCGCCGGCGCCGCCGGCACCACCGTTGCCGCCGTCACCGCCGACCA
+GGCCAGAGCCGCCCTTGCCTCCGGCGCCGCCCGAGGCACCCGTGCCGCCGATGCCGCCGGCACCGCCGGC
+GCCCCCGTTACCGCCGTCGCCGAACAGCAGCCCGCCCTGACCGCCCGCACCCCCGACACCGCCGACACCC
+CCGGTGCCGGCGGTGTTGGCGCCAGCCCCGCCGGGGCCGCCGTCGCCTCCGCTACCAAAAAAGGTCAGCG
+TGCCGGTGGCGCCGCCGCCAATGCCACCATTGCCGCCCGCAGCCCCGGTGCCGCCCCGGCCCCCGGCGCC
+ACCGTTGCCGCCGATCCCGTTGCCACCGTTTAGCGCTAGGCCGTTGCCCCCGTTGCCCCCGTCGCCGCCC
+CGGGCGCCGGCGCCACCGTCACCGCCATTGCCCCCGTTTCCCCCGTAGGCCCAGCCAGTACCGGTATTGA
+CACCGATGCCGCCGGGTGCGCCGTTGCCGCCGGGCGCGCCGGGACCGCCGTCGCCGCCATTGCCTCCGTT
+GCCCCCCGTCACAGGGCCTTCACTCGTATCGCTGCCGCTGCCGCCTAAACCGCCAGCGCCGCCAGCCCGC
+CCTGGTACGGCACCCGGGTTGCCGGGCAGCCCTGCGCCACCGCTACCGGCGCCGTTGTTGGCGCCGGGGC
+TTCCGTTTGCCGCCTGGCTGGTCTGGTTCGGCGGCGGGTTCATCCCGTTGGTTCCGGGGGCACCCACCCC
+GCCGACGCCGCCGTCGCCGCCGGCGCCGATCAGCCCCGCGTTGCCGCCGGCACCCCCATTGCCGGGCAAC
+CCGCCGATGACCGCGGCCCCGCCCGCCCCGCCCACACCGCCATTGCCGAACGCGCCGGCGGCGCCGCCGG
+CTCCTCCGTTGCCACTGACGGTCGTTCCCACCCCGCCGAACCCGCCGGCACCGCCGTTGCCGACCAGCCA
+GCCCGCCCCACCGGCTCCGCCCACACCGCCGGCGCCGGCGGCGTTGCTCCCGCCGGCCCCGCCATTGCCG
+CCGTGCCCGAACAGCCCGGCGGCGCCGCCGCTACCACCGGGCCCGCCCACACCGGCCACACCCGACCCGC
+CGTTGCCGCCATTACCCCACAGCAGCCCGCCGGGCCCGCCCGGCTGCCCGGTTCCCGGCGCCCCGTCGGC
+ACCGTTGCCGATCAACGGGCGCCCCAGTAGCGTCTGCGCGGGCCCGTTGATCAAGCCGAGCACCTGCTGC
+TCCACGGCTTGCAGCGGCGACGCGTTGGCGGCCTCGGCGCTGGCATAGGAGTTCACTCCCGCGTTTAACG
+CCTGCACGAACTGGGCATGAAACCCCGCCGCCTGGGCGCTGAGCCTCTGGTACTCCTGGGCGTGCGCGCC
+GAACAGCGCCGCCATCGCCGCCGACACCTCGTCCGCGGCGGCCGCTAGCACACCCGTGGTCGGGGCGGCC
+GCGGCGGCGTTGGCGGCATTGAGCGCCGAACCGATACCGGCCACCTCTGAAGCCACCGACATCAGCGCTT
+CCGGCGCCACGATCACAAACGACATCTGACACCCCTTTCCGCGGCGCGGCCTGACGGCCCGATCGTAGCG
+CGATCACGGGCCGACAAAACCCGTTATGGCCAGGCTTTTCGCCACATTGCCCGCGCCGCGTGGGCTCACG
+GGGTAAGCCCCGCCAGGAACGACTCCACCGCCCGCCGGTAAACCTGTGGAGCCTCGTCATGAACCAGATG
+ACCGGCGTCGGGAACACGCAAATACGCTGTCGGATAATCTCTTTCAGCCATCGCGCGCATCTGGCCCGGG
+GGAGTTACCCCATCGCCGGCCTCGATGAGCAGCGCCGGCGACCGTACGGCCCGCCACTGCGCCCAGTAGT
+CACGGGTGCCCCATTCGGCGGCGATCTCGATCCATCGTGCGGTGCGCCCGTGTAGCCGCCACCCGGTGGC
+CGTGCGGTCGAATGCGTCCAGGAAGTACCGGCCGGCGACGGGCCCGAACTCGGCGAATACCTGTTCGGCA
+GAGTCGAATTCGACCGGAAGGGCGCGCAGCCACGGCTCCCATGGGCCGGTGGTCCTACCACGGAAGTCCG
+GCGCCATGTCCTCGACCACCAGCGCCGAAACCAGTTCCGGGCGCTCGGCAGCCAGACACCACGAATGCAA
+GGCTCCCATCGAATGTCCGACCATCCTGGTCGGCGCGCCCAGCGCCGAAACCGCGTCGCCCAGATCGGCC
+ACGAAGCGTTCGGTGCTGATCGGGTGTGGATCGGCGACGTCACGCCCGCGGTGCCAGGGCGCGTCGTAGG
+TGTACACGGCGCCTAACAGCGTCAGCCACGGAAGCTGACGGGCCCAGGTGGAACCCCTACCCATCAAGCC
+GTGCACCAGGACCAACGGCTCGCCCCGTCCGCCGCGATGGGTTAACAGATTCGCTGGCATGCGGGGCACG
+GTAGCCTAGCGGCATGCCAGTGGTGAAGATCAACGCAATCGAGGTGCCCGCCGGCGCTGGCCCCGAGCTG
+GAGAAGCGGTTCGCTCACCGCGCGCACGCGGTCGAGAACTCCCCGGGTTTCCTCGGCTTTCAGCTGTTAC
+GTCCGGTCAAGGGTGAAGAACGCTACTTCGTGGTGACACACTGGGAGTCCGATGAAGCATTCCAGGCGTG
+GGCAAACGGGCCCGCCATCGCAGCCCATGCCGGACACCGGGCCAACCCCGTGGCGACCGGTGCTTCGCTG
+CTGGAATTCGAGGTCGTGCTTGACGTCGGTGGGACCGGCAAGACTGCATAACCGGCGCGCGGGGCGCCGG
+ATGCTGGCGTTAAGCGCCGCGGCGGCATTGATTGTGGCGCTGGCGTCGGGTTGCTCCTCAGCTCCGACGC
+CGTCCGCGAACGCGGCAAATCACGGGCACCGGATCGACACCAGAACTCCGCCTGGTCTGCGGGCGCAACA
+GACCATGGACATGCTCAACTCGGACTGGCCGATCGGCGAGATCGGCGTTGGCACTCTCGCCGCGCCCGGG
+CAGGTCGACACGGTCAAGACCACCATGGAAGCGCTCTGGTGGGATCGCCCGTTCGCGCTGGCCGGCGTCG
+ATATCGGCGCCAGTGTGGCCGCGTTGCACCTCATCTCCTCTTACGGCGCGCAACAAGACATCCGCATTCA
+TACCGACGACGACGGCTGGGTTGACCGATTCGACGTCGAAACGCAGGCGCCGTCGATCGCTTCGTGGCGC
+GACGTCGACGCGGTGCTGAGCAAGACCGGCGCCCGCTACTCATTTCAGGTGGCAAAGGTCGACAACGGTC
+GCTGCGACCCGGTGGCGGGCACCAGCACCGGCGAATCCCTGCCGCTGGCATCGATCTTCAAGTTGTACGT
+GTTACATGCGCTGGCCGGTGCGGTCCAACACAACACGGTGTCCTGGGATGATCTGCTGACGGTCACCGCC
+AAAAGCAAAGCCGTGGGCTCTTCCGGCCTGGAACTGCCTGTGGGGGCACGTGTTTCGGTTCGCACAGCCG
+CCGAGAAGATGATCGCCACCAGTGACAACATGGCCACCGACTTGCTGATCGAAAGGCTGGGCACCCGCGC
+CATCGAGGAAGCGCTGGCCAGCGCCGGCCATCACGATCCGGCCAGCATGACCCCCTTCCCCACGATGTAC
+GAGCTGTTCTCCGTCGGCTGGGGCAAGCCAGATCTGCGTGACCAGTGGAAGCATGCGACCCAACAGGTCC
+GTGCCCAGATACTGCGGCAAACCAATTCCACGCCCTACCAACCCGACCCAACGCGCGCTCACACTCCGGC
+GTCAAACTACGGTGCGGAATGGTACGGCAGCGCCGAAGATATCTGCCGTGTGCACGCGGCACTGCGAGCC
+GACGCGGTCGGCCCGGCCTCGCCCGTCCGACAGATCATGTCCGCCGTCCCGGGTATCCAGCTGGACCGCA
+GCGTGTGGCCCTATATCGGCGCGAAAGCAGGTGGCCTGCCAGGCGATCTGACGTTCAGCTGGTACGCCGT
+CGACAAGACCGGCCAACCATGGGTGGTGAGCTTTCAGCTGAACTGGCCCCGCGATCACGGACCGACGGTG
+ACCGGCTGGATGCTGCAGGTCGCCAGGCAAGTCTTTGCGTTGATAGCGCCACAATAGATCGCTACAGCCC
+AGGCATCCGGAGGTATCCGCGGCTCGCTTCCGTAACGACCGGCCGGTCGTGCTCGACGTGAACAACGAGA
+CACTTCCCGCGCCGGTGCGTTCGACGGCCGATTCGCTCCGGCTCACCGATAGGAGGCGCCACCGTGGGAT
+GGATCGGCGATCCGATTTGGCTCGAGGAGGTGCTACGGCCGGCACTCGGCGAGCGCCTGCGGGTGCTCGA
+CGGCTGGCGGGAACGCGGACACGGCGACTTTCGCGATATCCGCGGTGTGATGTGGCACCACACCGGCAAC
+TCACGTGAGACCGCCAAAAGCATTGCCCGCGGCCGGCCCGACTTACCCGGCCCGCTGGCCAATCTGCACA
+TCGCGCACAGCGGGGTCGTAACGATCGTCGCGGTAGGCGTGTGCTGGCACGCCGGCCGCGGCAGCTACCC
+GTGGCTGCCAACCGACAACGCCAACTGGCACATGATTGGCGTCGAGTGCGCGTGGCCGACCATCCGGCGT
+GACGGCTCCTACGACGCCGGTGAGCGCTGGCCTGACGCGCAGATCGTGAGCATGCGAGACGTCGCCGCGG
+CGCTCACGCTCAAGCTCGGCTACGGGCCCGAACGCAATATTGGGCACAAAGAGTATGCCGGGGCGGCTCA
+AGGCAAATGGGACCCGGGAAACCTGTCGATGGACTGGTTTCGCGCCGAGGTGGCAAAGGACACGCGGGGC
+GAGTTCGACCACCCCCTCACCCCGCCGCCGGCGGTGATTGCCCGCCCACCGATTCTGCCCAAGCCGCGCA
+ACCCGCGTGACGATCGCATCCTGCTCGAGGAGGTGTGGGACCAGCTACGCGGCATCGAGGGCCGCGGCTG
+GCCGGTACTCGGCGACAAGACGATCGTCGACTACCTAGCCGAGCTCGGCAATAAGGTCGACGCCCTGGCC
+GCAAAACTCGACGCGCGCGAGGGCCTCGACCGGCCCAGTGACACTCGGTAGCTGCTCCAGCAGGCGGCGG
+GGTGCTGACGGACCCGCTGCAACGATGTCAACCGGGCTGGCCCGGCTGGCCGGGCTGGCCGGGTGCACCT
+TCAGGGCCGAACTGGCCGAGGTTGCCGTCGCCGCCACGGCCCGCAGGCCCAACGCCCGGGGAGCCGGCCA
+CACCGGGCTCACCACCGCCCCCGCCATTACCCCCGCTACCGGCGGCACCGCCCAGCCCGGAGCTACCGGA
+GACGCCGAACAGGCCGCCCGCGCCGCCCGCGCCGCCCGCGCCGCCGTCTCCGCCGGCGCCGCCGTCACCG
+CCGATCCCGCCGTTACCCCCGTCACCAGCGTCACCCCCAACGCCTGGTTGCCCGGCGCCGCCCATTCCGC
+CCTGACCGCCGGTGCCGCCCCGGGCGCCGATGCCGCCTTCGCCCCCTGTGCCCCCGATGCCACCTGCGCC
+GCCGTCGCCGACCAGGAGCCCACCCCGACCGCCAGAGCCGCCGGCCCCGCCGGTCCCCCCGGTGCCGCCG
+GGCGCGCCGGGGCCACCGTTTCCGCCGGTCCCGCCGGTCCCGCCAACGGACAGGCCAGTACCGCCAGTGC
+CACCGGTGCCACCGGTTTGCCCGAACTCGGTGCCTGGCTGGCCGGGCCGCCCGGTTCACCGTTGTTACCC
+ATGCTGCCCTGGCCCGCCGGGACGGTCAGGGGGTTGACCCCGGCGGCACCCGCCGCGCCGGCCGCGCCGA
+GCCCCCCGGCCCCACCGTTGCCGAATAGCCACGCGTTGCCGCCGGCACCACCGGCGCCGCCGTTGCCGCC
+GGGGATAGTCGCCGCCCCGCCGTTGCCGCCCGCGCCGCCGTTGCCGTACAGCAGCCCGCCTTGTCCGCCG
+GACCCGCCGGCCGCACCGGCTCCGCCGGCACCACCGGATCCGCCGTTGCCGATCAACCCGGCCGCCCCGC
+CGCTGCCGCCGGCAATCCCCGCGTTCACCCCGGCCGCGCCATTACCGCCATTGCCATACAGCAGCCCGCC
+CGCCCCGCCGTTTTGCCCGGGCGCCGTCCCGTCGGCACCATCACCGATCAACGGACGTCCCAACAGTGCC
+TGGGTGGGCGCATTGATCGCGTTCAGCAAACTCTGCTGAACGTTGGCGGCCTCGGCGTTGGCATACGCCC
+CCGCACCCGCACTCAAGGTCTGCACGAACTGGGCATGAAACGTCGCCGCCTGCGCGCTGATCGTCTGATA
+CGCCTGGGCGTGCGCGCCGAAGAGCGCCGCAATCGCCGCCGATACGTCATCTGCGCCCGCGGCCAGCACG
+CCGGTGGTCGGGATGCTGGCAGCCGCGTTAGCCGCGCTGATCGTCGAACCGAGATTGGCCAAATCCGTGG
+CCGCCGCCGACAGGAACTCCGGAACGGCAATCACAAACGACATTGGCCACCTCCGAACAGCTTCCGGACA
+AACCGACGTCAGCAGAGTCTATTGTCACAGCGGATCGGCGGTCGCGGTTTTCGCCTAATACGGCCGATGG
+ACCTAGACCGCTACCGCGCGGCCGGCTCCGGGCCGCCCGCGCTGTGCGCTCCAGCCTTGGCCAGATCCGG
+CTCGGCCGGCGGCTTGCGGGTACCGGTGAAGGTGAACACCGCGTCCTCGCCGGGACCTTCACCGTCCCAG
+TTGTCCACGTCGACGGTGACCACCTGACCCGGCCCGACCTCCTCGAAGAGGATCTTCTCCGAGAGCTGAT
+CTTCGATCTCACGCTGGATGGTGCGCCGCAACGGGCGGGCCCCCAGCACCGGGTCGAAGCCACGCTTGGC
+CAGCAGCGCCTTGGCCGCATCGGTCAGCACCAGCGCCATGTCCTTGCTCTTGAGCTGGCCGGCGACCCGG
+CTGATCATCAGGTCGACCATCCGGATGATCTCCTCGCGGGTCAGCTGGTGGAAGACGATGATGTCGTCGA
+TGCGGTTGAGGAACTCCGGGCGGAAGTGTTTCTTCAGCTCGTCGTTGACCTTCTGTTTCATCCGCTCGTA
+GTCGTTCTCACCGCCGCCCTTGGAAAAGCCCAGACCGACCGGCTTAGAGATGTCGGAGGTGCCCAGATTG
+GACGTAAAGATCAGCACGGTGTTCTTGAAGTCCACCGTGCGGCCCTGCCCGTCGGTGAGCCGGCCATCCT
+CGAGCACCTGCAGCAGGCTGTTGTAGATCTCCTGATGCGCCTTCTCGATCTCGTCGAACAGCACCACCGA
+GAACGGCTTGCGCCGCACCTTCTCGGTGAGTTGGCCGCCCTCCTCGTAGCCGACGTATCCGGGCGGCGCG
+CCGAATAGCCGCGACGCGGTGAACCGGTCGTGGAATTCACCCATGTCAATCTGAATAAGCGCGTCGTCGT
+CACCGAACAAGAAGTTGGCCAGCGCCTTGGACAGTTCGGTCTTACCGACACCGGACGGGCCGGCGAAGAT
+GAACGAGCCCGACGGGCGCTTGGGGTCTTTCAGCCCGGCCCGGGTACGCCGGATGGCCTTGGAAACGGCC
+TTGACGGCGTCCTCTTGCCCGATGATCCGCTTGTGCAGCTCTTCTTCCATCCGCAACAGCCGGGTGGTCT
+CGGCCTCGGTGAGCTTGAACACCGGGATACCGGTCCAGTTGCCCAGCACCTCGGCGATCTGCTCGTCGTC
+GACCTCCGCGACCACGTCAAGATCGCCTGAACGCCACTGCTTTTCGCGCTCAGCACGCTGTGCGACCAGT
+GTCTTCTCCCGGTCGCGCAGGCTGGCGGCCTTCTCGAAGTCCTGGGCGTCGATAGCCGATTCCTTCTCCC
+GACGAGCCTCGGCGATCTTCTCATCGAACTCGCGTAGGTCTGGCGGTGCGGTCATGCGACGAATCCGCAT
+CCGAGCACCCGCCTCGTCGATCAGGTCGATCGCCTTGTCGGGCAGGAACCGGTCGTTGATGTAGCGGTCG
+GCCAGGGTCGCGGCGGCCACCATCGCCGCATCGGTGATCGACACCCGGTGGTGCGCCTCGTACCGGTCCC
+GCAGGCCCTTGAGGATCTCGATGGTGTGCTCCACCGTCGGCTCACCCACCTGCACCGGCTGGAAGCGGCG
+CTCCAGCGCGGCGTCCTTCTCGATGTACTTGCGGTATTCGTCGAGCGTGGTGGCGCCGATCGTTTGCAGT
+TCACCGCGAGCGAGCTTCGGTTTCAGGATCGAGGCGGCGTCGATCGCGCCCTCGGCGGCTCCAGCACCGA
+CCAAGGTGTGCAGCTCGTCGATAAACAGGATGATGTCACCGCGGGTGTTGATCTCCTTGAGCACCTTCTT
+GAGGCGTTCCTCGAAGTCACCGCGGTAGCGGCTACCCGCCACCAGCGATCCCAGATCCAGCGTGTAGAGC
+TGCTTGTCCTTGAGCGTCTCGGGCACCTCGCCGTGCACGATGGCCTGCGCCAGTCCTTCGACGACCGCGG
+TCTTGCCGACGCCGGGCTCGCCGATCAGCACCGGGTTGTTCTTGGTGCGCCGAGAGAGCACCTGCATGAC
+CCGCTCGATTTCCTTCTCGCGGCCGATGACCGGGTCCAGTTTGCCTTCCATCGCCGCCGCCGTGAGGTTG
+CGGCCGAACTGGTCGAGCACCAAGGACGTAGACGGAGAGCCGGACTCTCCCCCGCGGCCGCCGGTGCCGG
+CTTCGGCGGCCTCCTTGCCTTGGTAACCGGAGAGCAGCTGGATCACCTGCTGGCGCACCCGGGTCAGCTC
+GGCGCCCAGCTTGACCAGCACCTGGGCGGCCACGCCTTCACCCTCTCGGATGAGGCCCAGCAAAATGTGT
+TCGGTCCCGATGTAGTTGTGGCCAAGCTGCAGCGCTTCACGCAAGCTCAGCTCGAGGACCTTTTTGGCGC
+GGGGGGTAAACGGAATGTGCCCAGACGGCGCCTGCTGGCCCTGGCCGATGATCTCCTCGACCTGACTGCG
+CACACCTTCCAGCGAGATCCCCAACGACTCCAGTGACTTGGCGGCAACGCCTTCCCCTTCATGGATCAGG
+CCTAAAAGAATGTGCTCGGTGCCGATGTAGTTGTGGTTGAGCATCCTGGCCTCTTCCTGAGCCAGGACGA
+CGACCCTGCGGGCACGGTCGGTAAATCGTTCGAACATCGGTGGCTACCTGCTCTCCCTCACCATCGGATA
+CAGCGGTCGACACCGCGTACCTGCCGTCCACTGTAATGGTCGGCCTGCCAGGGTTCCTAACCTTGCGGTG
+CCTGGTCGGTTCCGGGGCGCAGCGCCCCAAGTCGCCGTTGAACAGAACCGCATAGGAGATAAACGAGAAA
+ACCACCCAAGCGTTTCCGGCGCCGAGCGGCCATCGGTTCGCCGCCAGCGAACGCGGCAAAGTACCGGCGC
+CCAGGCTTTCGCCTGGGCGCCGGTAGCCAAATGTCAGGTCGCCGCGTGGTATGCGTCGATGACGTCGGCC
+GGGATCCGGCCTCGCGTCGACACATTGTGCCCGTTACGACGAGCCCATTCGCGGATCGCCGCGCTCTGCT
+CGCGGTCGATCGCGCCACGTCCACGGCCGGATCCGGAACGGCCGCGCCGGCGCCCACCGACGCGACGGCC
+CGCCGCCACCCATTGCTTCAGGTCGCCACGCAGTTTCGTGGCATTCTTAGTGGAAAGGTCGATCTCATAG
+GTCACCCCGTCAAGCCCGAATTCGACCGTTTCGTCGGCGGCGCCCGAACCGTCGAAATCGTCGACCAAGG
+TGACGGTTACTTTCTTCGCCATTGGCTTACCCTCGCGTTTCTTCCTGTGCAGTACGGATAGACTCCCCGG
+TCACCAATCTGCCATAAGAACGCAGAATACTCAATCCAGACACAACACCCACAGTTCAGTTGGAGTGTGG
+TCGAACAATCGGGAACAAAACTGTCTCCCTAATTGACAACCCAGTCAAAGACATCAACAACCGATCGATA
+CCCATTCCGGTTCCGGTGCACGGTGGCATGCCGTACTCCAGAGCGGCCAGAAAATCCTCGTCAAGCACCA
+TCGCTTCGTCATCGCCAGCGGCCGCGGCACGGGCCTGGTCGGCGAATCTCTCCCGCTGGACTACCGGGTC
+GCTTAATTCCGAGTAGCCGGTGGCAAGTTCGATTCCGCGCAGATAGAGGTCCCACTTCTCGGTTACGCCG
+GGGATACTGCGGTGCTGACGGGTCAAAGGCGTTGTCTGAACCGGAAAATCCTTGACAAATGTGGGTGCGC
+TCAAGCTCTTGCCCACTGTGCGCTCCCAGAGTTCCTCGATGAGTTTGCCGTGGCCGAAGCCACGGTTGTC
+ATGAATCGCTGGGTCTTTCTCCAGGCCAAGGCTATCGGCGATCCCACGTAAGCGATCGACCGTCGTCTGC
+GGTGTGATCTCTTCACCGAGCGCCACAGACAGCGACGGGTACATTTGTATAGTCGCCCATTCTCCGTCGA
+TGTCATAGACACTGCCGTCGGGCAACGGCAGTTGTCTGGTTCCGATCGCCTCATCGGCCACCTCTTGAAT
+AAGCTCCCGGGTGACGACTGCCGAATCGTCATAGGTTCCGTAGGTCTGGTAGGTCTCCAGCATGGAGAAT
+TCCGGAGAATGCGTGGAATCGGCTCCTTCGTTTCGGAACACTCGATTAAGTTCGAAGACCTTGTCGAAAC
+CACCCACGATGCAGCGCTTGAGGAACAGTTCCGGCGCGATCCGCAGGTACAGATCGATGTCTAGGGCATT
+GGAATGAGTGGCGAACGGACGGGCCGCCGCACCACCGGCTAACGTCTGCAAGACGGGCGTCTCGACTTCC
+AGGAACCCACGACGTTGAAGCGCCGTCCGGATCGCGCGGACGACGGCGATCCGTAGTCGAGCCACCGCGC
+GCGCTTCCGGTCGAACTATGAGGTCAACATAGCGCTGACGAACCCGCGACTCTTCACTCATCTCTTTGTG
+CGCGACGGGAAGCGGCCGCAGCGACTTGGCGGCGATCCGCCAGCAATCCGCCAGGACGGACAGCTCGCCG
+CGGCGCGAACTGATCACCGCGCCATGCACGTAGACGATGTCGCCCAGGTCGACATCGGCTTTCCATGCGT
+CGAGAGCAGCCTGGCCGACCTTGTCGAGGCTGATCATCACTTGCAGCTGGGTACCATCGCCGTCCTGAAG
+TGTCGCAAAGCATAGCTTTCCCGAGTTGCGCGCAAAGATCACTCGGCCCGCGACGCCGACGATGTCTTCG
+GTCGCGGTATCGATCGGCAAGTCAGGGTGGGCGGCGCGAACCTCGGCCAACGTGTGAGTGCGCGGCACCG
+CGACGGGATAGGGATCGCGCCCCTGGGCCAGCAAGCGAGCGCGCTTGTCCCGGCGAATCCGGAACTGCTC
+AGGAAGGTCTTCTGCTGTGTCAGCGGCACTCACGACGTGCCAGCTTAAATGACCTCACGCCGACGCTCGT
+GGGTGGCGTCGAGCCTGTCGGCGGCGGGCGACCCGGTACCCAGACTCGATGCCGGCATCGACGTCAGCGC
+GCCGTCTTGAGCCGGCCGCGCTGGACTTCGAGGTTACGCTCGAACACCAGCCGCAGACCCTGCAAGGTCA
+GGTGCTGGTCGTAATGGTCGACGGTGTGCAATTCCGGCAGCAGCAGGGGCGCGGTATGCCCGGTAGCCAC
+GATCGCGACATCGTGGTCGACGGAGAAACCGGACACGTCCTCGCGGATGCGGCCTACCAACCCGTCTACC
+AGCCCGGCGAAGCCGAACACCGCACCGGCTTGCATGCATTCGACGGTGTTCTTGCCAACCACCGAACGTG
+GGCGGGCAAGTTCAACGCGGCGCAATGCCGCCGAGCGGGCCGCCGCGGCATCGGAAGACACCTGCACCCC
+GGGCGCGATGGCGCCGCCAAGAAATTCACCCTTGGCCGATACAACATCAACACAGATCGAGGATCCAAAG
+TCAACGACGATGGCGGCCTTCCGGAACCGGTCATAGGCGGCCAAACAGTTCACGATGCGGTCTGCGCCCA
+CTTCCTTCGGGTTGTCGACGAGCAAAGGGATCCCGGTGCGTACTCCGGGCTCGATCAGCACGTGCGGCAC
+CGACGGCCAGTACTGGTCGAGCATTATCCGCACCTCGTGCAGCACGGACGGGACCGTGGACAAGGCGGCG
+GTACCGGTGAGCCGCTCGGAATCCTCGCCGATCAGCCCGTCGATCGTCAGTGCCAGTTCGTCGGCGGTGA
+CTTCGGATTCGGTGCGTATCCGCCACTGCTGCACGACCTTTGCGTGCTCTTTCATTCCGGACAGCAGGCC
+CACAACGGTGTGGGTGTTGCGGACGTCAATCGCCAGCAGCACGGCTATCCCACACCGAGCCGGGGGTCTA
+GCAGCTCGCCCGCGTTTTCGGGCACAAATGCCGGATCGTGGCCCATGTCGATCGGTTTGTTGTAAGCGTC
+GACAAACACGATCCGCGGCTGGTATGTGCGGGCCCGGGCGTCGTCCATCGTCGCGTACGCAATCAGAATC
+ACCAGATCCCCCGGATGCACCAAGTGCGCGGCGGCACCGTTGATGCCAATCACACCACTGCCGCGTTCGC
+CGGTGATCGCGTAGGTGACCAGTCGAGCACCGTTGTCGATATCGACGATGGTTACCTGTTCGCCTTCCAG
+CAGGTCGGCGGCGTCCATCAAGTCGGCATCGATGGTCACCGAGCCGACGTAGTGCAGGTCGGCGCAGGTC
+ACCGTGGCGCGGTGGATCTTCGACTTCAGCATCGTCCGTAACATCAGTTTCTCCAATGTGATTCGAGGAT
+TGCCCGGTATCCGTCCGGGCGGTCGGTGCCGGCGAAAGTTCCGATTTCAATCGCAATGTTGTCCAGCAGC
+CTGGTGGTGCCAAGCCGGGCAGCAACCAGCAGCCGACCGGAACCGTTGAGCGGCATCGGGCCAAGCCCGA
+TATCGCGCAGCTCCAGGTAGTCGACCGCCACGCCGGGTGCAGCGTCGAGCACCGCACGGGCGGCATCCAG
+CGCGGCCTGCGCGCCAGCCGTTGCCGCATGCGCTGCGGCCGTTAGCGCCGCCGAGAGCGCGACGGCCGCC
+GCACGCTGGGCCGGGTCCAGGTAGCGGTTGCGCGACGACATCGCCAGCCCGTCGGCTTCGCGCACGGTCG
+GCACGCCGACCACCGCGACATCGAGGTTGAAGTCCGCGACCAGCTGCCGGATCAGCACCAGCTGCTGGTA
+GTCCTTCTCACCGAAGAACACCCGATCCGGGCGCACGATCTGCAGCAGCTTTAGCACGACCGTCAGCACG
+CCGGCGAAATGGGTTGGCCGCGGGCCGCCCTCGAGTTCGGCGGCCAACGGACCGGGTTGCACGGTGGTGC
+GCAGGCCGTCGGGATACATCGCCGCGGTAGTTGGCGTGAAAGCGATTTCCACGCCTTCGGCCCGCAGTTG
+CGCCAGGTCGTCGTCCGGGGTGCGGGGATAGGCGTCGAGATCTTCCCCGGCACCGAATTGCATCGGGTTG
+ACGAAGATCGACACGACGACGACCGATCCGGGCACCCGCTTGGCCGCACGCACCAACGCGAGGTGGCCTT
+CGTGCAGCGCACCCATAGTAGGCACCAACATCACTCGCCGGCCGGTGAGTCGCAGTGCGCGACTGACATC
+GGCGACATCCCCCGGTGCCGAGTACACATTGAGTTCACCGGGATGGAACGCAGGAATCGTCATGCCGTCA
+AAACCTCGACGACATCCGCGGGGGCGTGTGCGCGCTGCGCGGTCCGCAGCGCGTTTATCCGGTATGCCTG
+GGCCAGCGCTGCGTCGACGTCCGCGAGGGCCGCCAGATGATCCGCGACCGCTGCCGCATCGCCGCGGGCG
+ACCGGTCCGGTGAGCGCGGCCTGTCCCCGCTGCAGCGTGTTCTCCAGCGCCGCTCTGGCCAGCGGCCCGA
+CGATGCGCTCCACGATCCCGCCCGGCTGGTCGTCGACGGTTTGTTGGCCGAGCAGTTCCCCCCCGCTCAG
+GGCGGCCCGCAACGCCTCGAGCGCATCGGCCAGCACGGTGACGATGTGGTTGCTCGCATGGGCCAGCGCC
+GCGTGGTAGAGGATGCGGGCGTCTTCGCGCACACAAAACGGCTCCCCGCCCATCTCAAGAACCAGTGACT
+GTCCGATCGCATACCCGACGTCGTCGGCCGCGGTGATCCCGAAGCAGGTATCCGGCAGCCGGCTGATGTC
+CTCGTCGGAGCCGGTGAAGGTCATCGCCGGGTGAATCGCCAATGGTATGCAGCCCTGTTGGGCTAGCGGC
+GCCAGAATGCCAATCCCGTTAGCTCCGGAGGTGTGCGCCACAATCGTTTGTGGCCGCACCGCCGAGGTGG
+CTGCCAGGCCGGATACCAGGCCGGCGAGTTCGCTGTCGGTGACCGCCAATAGCAGCAGCTCAGCGCTGGC
+CGCGACGTCCAGCGGTGGCAGCACCGGGGTATCAGGCAGCCGGCGCTGCGCGCGCCGCCGGGACGCATGA
+GAGATGGCGCTGCACGCCACCACAACATGGTCGGCGCGCTGCAGCGCGACCCCTAGCGCGGTGCCGACCC
+GGCCAGCCGAGATGATCCCCACCTTGAGCCTGGCCGGACGCAAACCGTCGAACCGCTCCATAGCAGACGG
+CCTCACAGGTTTCTTGGTTCGTTCCAGTCCCATGCCCGGGTACCGGACGGTCACCAAGACTGTAGTCGAT
+TTGCACGTCAAGACCCACCCAGGGCACTGCTGATTTGGTCACTACACCAACAGTGTCGGTTGCCGGCGGC
+AATCGGGCGGGTACACCCTGGCACAAGCGGCGCCGCTATTCACCGCGGCGGCGACGCCGGCCGCCTCCGG
+TCGACTCGACCTGAAGCCTCGCCATAAGGTCGGCGACCGACTGGCCGCCGGTTAGCGGGTCCCGCGCATG
+CAAACCACCGGAGTCATCCGGCGGCGTGTCCGCGGTGCGGTGCCGGCGTGTGGGCTCAGCAGGCGGCGGC
+GGGGCCATTGGAGGTGACGGCGGACGCTCACCCGTCCCGGCACCGGAGCCGCCGATGTCATGGTCGCGGT
+GCTCCGCCGAATGACGCGACCGGCGACCGGATTCACCGTATTGTGCCGCGAGCTCGACGTAGGCGGGCGG
+ATTGTAGGCCTGGTCTGCTGGGCTGGCATGCCGGGCGCGGCGCCGGCGCCCCGGCGGCGGGGCCGCCGGC
+GTGGTTTCGGGTTCGACGGATGCCCACTGGCTGCCAGGTGTTTCGGCAGGCAGCCACTGCCCGTGGCTGG
+TGACCGGCTGCCAGACTGGTCGCTCCTGTTGCGGCGGGAGCGGCGGGGGCCGGTGGCGCGGCTCGAATAA
+CGGCTCAGGTTGCGGCGGTGGCGGAGCCTCATAATGCCGCGGTCCTCCGCTCACCGGTGGTACCCCCACC
+TCCGGCACATCGATGATCGAGGCCTCGTCGGTGCGGCTGGCGCCATCACCCCCGCGGACCGCCATAACCC
+GATCGCTGGATACCCAGTCCGCGGGAGGGCTCTCGCCATCGAGGGCACGCGCGGCCCTGGCCTCTTTCTC
+CCCGGTCCCCAGCGCCGGACGGTGCTCGAGGTCGGCGTCGAACAAAATCTCCAGGCTGGTTCGCAGCGCG
+GCCAGTTCGGCCCGCAGGGCTGCTACCTCGTCGGCGGCCGGAGCGCGCAACTCCGAGGCCAGCTCGCGGC
+GCAGCTGAGATTCCAGGGTCAGCTCGTACTCCCGGCGCGCCGAAATCTCGCGATCCAACTGAAGGTCATA
+GACCAGCTTCAGGTCACGCACCCGGGCCTGATCCACGTCGCTTTGCCGGCGGTAAAGCACCGACACAAAC
+GCACCCGCGACCGCCGCCCACAGCGCCAGCAGAACAGCGAGCTTGAGAAGTTCCACGCGATCGGTGAAAA
+CCAATGCGGAACTGGCCCCAATCGCCAGGACCAGCAACGCCGTCAAAAGCACCCACCCCGGCCTGCGGCC
+GCCGCGCCGGACCCGGGCGCCGCGGGACAGAACGGTCATGGCCTGACTGTACCCGGGCGAGGTCAATCCG
+CGTGTCGCGCCGGTCCGGCGATTCCCGCATGGCTTAGCCGGGTAGGCAGTTCGGCCAAATTCGCCGCGTA
+GACAACCCCGCATTCCGGGTCGGCCGCCCGGCCAGCAACGTCGACGACCGACGCCCATCGCCGGTTCGGC
+CATGGCCGACGCAGCGCGCGGCACCGTCGGGTGTGGGCTAGCTTTCCGCGCCGTCGGCGTGCTCGGTCGG
+ATCCTGCGGAGACTTGCAGCAATGTTGCAGCCAAAGCGCGGCAACCACCAACGCTAGCGCGCTGCCCGCC
+GCCACCACCGTGCCAGTGGTGTCCTCGGCGGCCGCCCGCAGCCATGACCGCCGCGGCAGGAAGTACGCCA
+GCACCCCGATCCACCACCCCGTCACCAGCGCACCCACCCAGGCCGAGGCCTTGGCTACCATCAAGCTGCG
+CGCCACCACAAGCGGGTGCAGCCAGCCGGGCCCGTCTCCGATCTCACCATCGCTGATCTTGACCCGCACG
+TAGCGAGCCCACAACGCCTCGGCGACCGCGACCGCGAGCAAGGACAAGCCCGTCCACACCGTGATCGGCG
+GAAACCACCGGTAAAGCACCGCCACCAACAGATATCCCACCGCCGCGGCGCCGACCACCGCGGCGGTCAG
+ATCACGTTTTCGGGTCGGTCCCATCAGCTTTCCGGTGCCCGACTGACGGGGTGTCTGCTATTCAGATCGA
+ACGACGGCCTAAACAACCGCACACTGTCGCGGTCGGCGGGCTCCAGCTCGGCCAGCAGTCGCGTGACGGG
+CCGCGGGCACCCGGCAACCGTCAGCTGCGCCGTTGGGTCGACGGCAATCCACGGGATCAACACAAAGGCC
+CGCAGATGCGCCAGTGGGTGCGGCAGCGTGAGGTGGTTCTCCCGCGCGGTCACTTCGACCAGAGCCTCGG
+TGGCCGAGGTCTGGTAGCAGGCGATCAGGTCGACGTCGAGATTTCGTGGACCCCAGCGCTGGCCACGCAC
+CCTGCCCGCAGCGCGCTCGAACTCCTGCGCCCGCCGCAGCCACTCCCGCGGTTCGCAGGTAGGATCGTCG
+GCGATCAGCACCGCATTGAGGAACTGCCCCTGCTCCACCCCACCCCAGGGGTCGGCCTCATATATCGGGG
+AAGCCGCAATCAACGCATCGCCGAGACCGTCGGCGACCGACCGCAATCGTGCCAGGCGGTCACCCAGGTT
+GGAGCCAACCGAGAGCACTACCCGCGTCATACCGCGCCGCCCGCCGGGACTACCCAACCGCGGCCGCCGC
+GCCGTGAGCGTCGGATCACCACCGCCACATCGTCGAACGTCTGCGGAATGGGCGCCTGCGGCTTGTGTAC
+CGCCACCTCAACGGCATGCACTCGCTGGTCGTCCATCACGTGATCAGCGATCTCGGCCCCGACCGTTTCG
+ATCAGCTTCCGCGGGGGTCCGGCGACGATCTCGGCCGCCCGCGAAGCCAGCCGCACGTAGTCATAGGTGT
+CGGCCAAGTCGTCGCTGTTGGCGGCCTCGGCCAGGTCTATCCACACGGTGACATCGATGACAAACCGCTG
+CCCGGCCACTCGCTCGTGGTCGTAGACCCCGTGCCGACCATGCACGGTCAGGCCGCGCAGTTCGATTCGG
+TCAGCCATCGCGTTCTATCCTTTCCGCTCCCATCCACGCTTCGACCACCTTGATGGCATCGACCGAGGCC
+CGCACATCATGCACCCGCACACCCCAGGCCCCGTGCAGTGCGGCCAGCGCGGAAATCACCGCCGTCGCGG
+TGTCACGCCCATCGGTTGGCCGCATCACGCCGTCGGGCCCGGCCAACAACGCACCGAGGAAGCGCTTGCG
+CGAAGCACCCACCAGCACTGGGATTCCGGTCGCGACCAGTTCCGGAAGGGCATGCAAGATCGCCCAATTA
+TGTTGCGCCGTCTTGGCGAATCCAAGCCCGGGATCGAGCACCAGCCTTGCCGGGTCGACGCCTGCGGCCA
+CCGCGTCGGCGACGCTGGCCAGCAGGTCGGCACGGACCTCGGCCACCACGTTGCCGTAGCGCACAGGCAC
+ATGCGGGGTATCGGCCGATACCGCCCGCCAGTGCATCAACACCCACGGCACATCGGCCTCGGCCAACAGC
+GGCCCCATCGCCGGATCGGCCCGCCCACCCGACACGTCGTTGACCATCTGGGCACCGTTCTGCAACGCCG
+CCCGAGCGACATCCGCGCGCATGGTATCGATGCTGACGGTGATGCCTTGTGCTGCAAGCTCTTTGACGAC
+GGGTATGACACGAGACGTCTCCACCGCCGGGTCAACCCGAGTGGCACCGGGCCGGCTCGACTCACCACCG
+ACGTCGACGATGCCCGCACCTGCGGCTGCCATCGCCAGACCGTGCTTCACCGCATCGTCGAGATCGAGAT
+AACACCCGCCGTCCGAGAAAGAGTCGTCCGTGACGTTTAGAACCCCCATCACCTGCACGGGCGCCGGACT
+CACTTCCGCAAAATGAGGTCGAGCGCTTCGGCTCGAGAAGCGGCATTGGTTTTGAACAGTCCGCGCACCG
+CCGACGTAGTGGTGACCGAGCCGGGCTTGCGAACCCCGCGCATCGCCATGCACAGATGCTCAGCCTCGAT
+CACCACGATTACCCCGCGTGGATCGAGTTTTTTCATCAGGGCATCGGCGATCTGACTGGTGAGCCGCTCC
+TGGACCTGAGGTCGCTTGGCGTACAGATCGACCAGTCGCGCGATCTTTGACAAGCCGGTCACCCTGCCGT
+CGTCGCCCGGGATGTAGCCGACGTGGGCCACACCGTGGAACGCCACCAGGTGGTGTTCGCAGGTGGAGTA
+CATAGGGATTTCCTTGACCAACACCAGCTCGTCGTGGTCTTCGTCGAACATGGTGTTCAACACCGAGTCG
+GGGTCGGTGTAGAGCCCGGCGAACATTTCGCGGTATGACCGGGCAACCCGGGACGGGGTGGCTACCAAGC
+CGTCCCTATCCGGATCCTCGCCGATCGCGTACAGCAATTCGCGCACCGCGGCCTCGGCACGTTGCTGGTC
+GAACACACGGATACGAGCAGATGCGCTGCGCGAATCCAGCTGCGACATCGAATGCTCCGTTCGTCAGCCG
+TGGGCCGGCTTGGTCCGACTGACCTCGTCATCCTGCTCCGCCGAGGACTCATCGGAACCCGGATCGGCTT
+GACCGGTCGGGTAGGGCTGACCCGGATACGTCGGTGCCGGTTCACCGCTATAGCTGGGCCGATGAGATGA
+CCTTGGGGGCCATCCCGGCGCATGCCAGCCCGCCGGGGCACCGTAGTCAGGCTGGGTGGAGCCGTACTGG
+CGGTCACCGGACCGGTGGGTGCCGGCGGGCGAACCGTTGGCGCCGTGCCCGGTTTGGCCGGCGTCGGACC
+GGGCGGCCTCAGCGGCTTGGGTAGCCTGCGCAATCGCCGCCTTGAACGCCGGCTCGGGGACCGGCTGGGG
+CCAAGGTTCGCCGCGTTCGATCGCGAGCTCGCCGGGTGTCTTGATGGGCGGTTTGTCCGACGGGATCCGG
+CCACCGAAGTCGTCGAACATGGTGAGCCGCGGCCGCTTTTCGACGTCAGCGAAGATGCTTTCCAGCTCGG
+GTCGGTGCAGGGTCTCCTTTTCCAGCAGCTCGCCGGCCAAAGTGTCCAGCACGTCGCGGTATTCGGTCAG
+GATTTCCCACGCTTCGGTATGCGCCGCCTCGATAAGCTTGCGGACCTCTTCGTCGATCTCGCGGGCGACC
+TCGTGGGAGTAGTCCGGCTGGGTGCCCATGGTACGTCCGAGGAACGGGTCGCCGTGTTCGGAGCCGTATT
+TGACCGCGCCCAGCTTGGAGCTCATTCCAAATTCGGTGACCATTGAGCGCGCTATCTTGGTGGCCTGCTC
+GATGTCGGACACCGCGCCGGTGGTCGGCTCACGAAACACCAGTTCTTCGGCGGCGCGCCCACCCATCGCG
+AACACCAGTTGCGCGATCATTTCCGAGCGGGTCCGCAGGCCCTTGTCTTCTTCCGGCACCGCCACCGCGT
+GCCCGCCGGTACGCCCGCGCGCCAGGATCGTCACCTTATAAATCGGCTCGATATCGGGCATCGCCCAAGC
+GGCCAGGGTGTGCCCGCCCTCGTGATAGGCGGTGATCTTCTTCTCCTGCTCGCTGATGATCCGGCCTTTG
+CGGCGCGGGCCGCCGATCACCCGGTCCACCGCTTCCTCGAGGGCGGGACCGGTGATGACGGTGCCGTTCT
+CCCGGGCGGTCAGCAGCGCCGCCTCGTTGATGACGTTGGCCAGGTCGGCTCCGGTCATGCCGACGGTCCG
+CTTGGCCAGTCCGTCGAGGTCGGCGTCCGCGGCCATCGGCTTGCCCTTGGAGTGCACGCGCAGCACCGCC
+CGCCGACCCGCCAGATCGGGGTTGGATACCGGGATCTGGCGGTCGAAGCGGCCCGGCCGCAACAGCGCCG
+GGTCCAGGATGTCGGGCCGGTTGGTGGCCGCGATCAGGATGACGCCGGCGCGATCGCCAAAACCGTCCAT
+TTCGACTAGCAACTGGTTGAGGGTCTGCTCACGCTCGTCGTGACCGCCGCCCAGCCCGGCGCCTCTTTGT
+CGGCCGACGGCGTCGATCTCGTCGACGAAGATGATGCACGGGCTGTTCTGCTTGGCCTGCTCGAACAGGT
+CTCTGACACGGGATGCGCCGACGCCGACGAACATTTCGACGAAGTCGGAGCCGGAGATGGTGAAGAACGG
+CACTCCGGCTTCGCCGGCCACCGCACGAGCCAGCAACGTCTTACCGGTTCCCGGCGGCCCGTAGAGCAGC
+ACGCCTTTGGGGATCTTGGCGCCCAGCGCTTGGTACCTGCTGGGGTTCTGCAGGAAGTCCTTGATCTCGT
+AGAGCTCCTCGACCGCCTCGTCGACACCTGCGACGTCGGCGAAGGTGGTCTTGGGCATGTCCTTGCTCAG
+TTGCTTGGCGCGTGACTTGCCGAACCCGAAGCCCATCCGGGCGCCGCCTTGCATGCGGGAGAACATCACG
+AACAGCCCCACCAGCAACAGCAGCGGCAGCACGTAGACCAGCAGCTCGCCCAGGATGCTGCCCTGGTTGA
+CGACCGTGCTGACCTTCGCGTTTTTGGCGCTGAGCGCGTTGAACAGGTCGACGGCGTACCCGGTGGGGTA
+CTTGGTGATGACCTTCTCGGACCCGTCGGTCTCGTTGTTACCCTTCTTCAGGATCAGCCGCAGCTGTTGC
+TCGCGATCGTCGATCTGTGCGCTCTTGACGTTGTCGCCGTTGATCTGTGTTATCGCCACCGAGGTATCAA
+CGGGCTTGTAGCCGCGGGTGTCGTCGCTGAAGTAAAAGAACGACCAGCCGAGCAGCACCACGACGGCGAT
+CGCTGTTATGGTGCGAGTCACGTTTTTCCGGTTCATCGATCATCGGCCGTGCCGGCCAGGTCCTTCCCGA
+TACACGCAGCTGGAAAGTCCAGGTTACCGCTCGTGGCGATCGCAAACCCGGCGGAGCCGGGTGCAGCGGG
+TCGCCACCATCAGCCCCGTGGCGATCGCAAACCCCGCGCCTGGCGACAATGCGGCCCGCAAAACGGGCCG
+AGGAGGAGCCAGGCAATCACCCCAGAGCCGGGTGCAGCGGGTCGCCACCATCAGCCCCGTGGCGATCGCA
+AACCCCGCGCCTGGCGACAATGCGGCCCGCAAAACGGGCCGAGGAGGAGCCAGGCAATCACCCCAGAGCC
+GGGTGCAGCGGGTCGCCACCATCAGCCCCGTGGCGATCGCAAACCCCGCGCCTGGCGACAATGCGGCCCG
+CAAAACGGGCCGAGGAGGAGCCAGGCAATCACCCCAGAGCCGGGTGCAGCGGGTCGCCACCATCAGCCCC
+GTGGCGATCGCAAACCCCGCGCCTGGCGACAATGCGGCCCGCAAAACGGGCCGAGGAGGAGCCAGGCAAT
+CACCCCAGAGCCGGGTGCAGCGGGTCGCCACTGGCTAGACCAACGACCGGTAGTTCCCGACGGCGTCGGA
+AAATCCGACAGCTGAGCGTTCGGGTCAAACACGCGGTGCACCGGACCTGATTTGGCTCGAATTGGTGCGC
+ACCGAGGGTCGGGCACATCGCTCCGGTCGCATGTGTCACTGCACCGGGCGACACCCGATCTGCCCAGCTC
+TCAGCGACAGCTGCCTGACCTGCGGTTTTGTTCACAAGTTGGTTGCGGCTGTGCGGGATTGTAGGCGGCG
+TTGACCGGCAGAAACCGAGTTGTCGCGCATAGGTGAGCACAGCGACCATCGCCCCCGGTGGAGTCCAGTG
+TTGCGGACGTGACTAAAGAGCAGCACGGGCAGCGGGAGCAGAACTCGGGTCAATTGAGTCATCCAGCGCG
+CGAACGTGGTTCGGCGCAGCCCCGGTTGGCTGTCTGGGCGTGAAGGTGCTCCCGAGCGGCCGGCCCGCCA
+TGAAGGCGCGCCAAAGCTTTGGCATTGTGCACATTTTCCACCCGTGCTCTATTAATGCTGAGCCGCGAAT
+TGTGAGCCCAGTCGGGAAACACGCGGAGCACCAGAGTCACCGCAGCGGCCGGGGCGGTTCAACTCACCAT
+GGATCGCTCTCGTCGTCTGGTGCTGGACAATCGTCGCTGTAGCGCGTCGCGAACACCTCAGCTTCTGCTG
+CCGCGGCTTCTTCCGGCGATGGTAACCCCCAGGTTTCGCCCACGGTCTTACGTAGCAGTGCGACGCGGTG
+TTCATCTGCATCGACCTGTTGACTCATCCTGTCAAGGATGAAGGCGTACTGGGCCGACTGCGCCTTCTGC
+CGCGCCAGGTCGGCAATCACCAGGATCTCAGAAGCGAGCTGCGACTCACTCATCCAGGCCACCCTGGCCG
+ACAGCTCGACATGGTCAATCCGGCCGTCCATCAGCGTCGATACCGACACCGTGCGTGGGGGATTCGTCAC
+GGTAAAAAGCGCGATCTCTTGTTCGGTGTCCGTCTCCGCCTGACCGTGGGCATTGTCCAGGTCGGGTCCG
+GTGTCCGGGGTCGCCGCCGACCCGACGCCAATAATCGGATCCGCAGTCCAGCCCTCCGCGCCGTCGGCGC
+CCCAGAGATCCACGGCGTCGAAATCGTTGCTGTCAAAGTCATTTCCGGGCAAGTCCACCGTCCCTTCGGA
+ATTCATTGCCACCCGGGAAGGGTCGGCCTGGGCAGCTGGCGTGGTCAGTCCGAACAGGTCGTTGGGAAGA
+CGCTGTGGCCTGCACTGCGGGCAGCAAACGTGGTCAGGTAAACAACCCGTCGATAGCCTTGCGCCACGCT
+TCGTCGGCCTCGCTATATATTTTCGCCGCAATTCGAAGACTTTTGGCGAGATCGACACCGGCCGTATGCA
+AGGACGAGCCCAGGGCATTGTGGGCAGTCAAGTACACATTTAACGTGTCGTTGAACTGTGAGCAGTACGG
+ACCGTGAGTGATCGCCACAGATTCGCCTAGGCCAGCGGCAGCTTCGACGCCCGAGGAGGCATCGACCGCC
+GCGTTGTCATGGTGCGACGCCAGTACACCGAGACGCTCGGGCTGGACGGTCAAGTTTTCCGTCATTGATC
+GTGTCCCTTCCGTTTAGCATTGCGCGTTGTTAGGCGCTGGCTAGCAATGGATTTGGCTCGCCATGCCGTT
+AGACGACGTTTCGTACCAGCACCTTTTGCCCACCGCCCGCGTCAGCTTCGACTGGCGCGCGCTCGGCGTC
+TTCAGTGCCCGCCGCCGCGCCTTCCGAGTACTTCTTCGTCGTCGTCCCTTTCGACGCCCCCGAAGAGGGG
+TGCATGCCGCCCATGCCTACGGGTCCGCCCATACCTTGGGAACCCTGCGCGGAGACCAGCTGCGACTGCC
+CGCCGACCTGCTCGGCAGCGGCGCCGACCGGGCCATCAGCTCGGGGCCGTAGCGCCTGCCGAGTTGAGGC
+GGCATGGACCTGAGCCAGGCTCGGCAAGCCCCCAAAACCGGACCCGCCCCCAATGCCGGCCAGGGCGGGC
+AAGCTGGCTGAGCTCGCCAGGCTATCCGCGTGAGCCAAGCCCGACGATGCGGACAGACCGGCCGCACCGA
+ACAAGCCAGTCACTTGCGACAAGCCGCTGGTCGCGCCGGTCAAGCCGGGGACGCCCGCAAAGAAGGACTC
+CAGGTTCGACCACCCTCGAGAGAACAGTCCGGTCACCCACCCCGTGAGCTTGTCCCAAAGCTCTTTCAGG
+CCGTTGAGCGCGTTTGTGATGAACTCCCACACTTCTCCGAGGATGCCCTTGATGATGTCCGCCACATCCG
+AAATGATGTCCGCAATGGCGGCCGCGACCAACTCCGCCAATTTGGCAAGCAATTTGAGGAGTTGAGTCGC
+GTTGATCAGCGTTTTCACGGCCAAGTAGGCAAGCGCGCCGCCCACTACGGCCATCGCGCCCGCGCAAAAC
+GGCGCCTGGAAGGCGGCCGATAGGGCGTGCCCGACGACCGGGATGTAGGTCAGGTCCACAGCCACCGGGC
+GCACGAACTCGAGACCTTTCTTGGCGCCCTCCAGGATGTCGCGGGTCGTCTGGACCGCGTTGGCCTGGTC
+GTGGATCAGGCTGATGAGCTGACGATCGAGGTCTGCCAGTTCCTGGAAAAAATTCACGTGGTTGCGGTTT
+TTGCCGGCGTATTTGTCCGCGGCCGAACCTAACCAGCCATCACCCGGAAACGCTGCTGCCAGCTCCTCCA
+GGGCTTTTTCGAAGTACTCTAGTGAGGAGTAAAGGATACCCCCTTGGTTGGGTATTCCAATCCCCAGAAG
+GTCGTACAAGCCGTCAATGGCACTGATCGTTGGATCGATGATGAACGCTCTGCTCATGCCTGCCGCCTAT
+CTCAACGGTCGTCGATTCCATGCATAGACTTGGTTCTGCATTGCGCGCGTAGGGCCTACAGTCTGGCTGT
+CATGCTTGGCCGATGTCAACAGTTTTTTCCCATGCTAAGCAGATCGTCAGTTTTGAGTTCGTGAAGACGG
+CATGTTCACTTGTTGTCGACTACATCGTCTGCGCACATTTGCCCTCCTGCAACTGCGCTGCGACAATGCG
+CCAACCGCCGTGTAGGCGGCGCGATCCCAAGGCAGTGTCTCCGACGTCGATGCCTGCGCTTCGCCTTCGA
+TCGGTATGAGATCTGTTGCAGGAGAGTCTATATAGTGTGCTCATGGGGCTAGCCGGCGGCGGCCTCGTGG
+CGGGCACAATCACCTCGCCGGTGGCGCAATCAGGGCTGTGCTAACCCACCATCACTCACCCGATTCGGCG
+TCGAAGCGGGGCGCTCTCATGGTTGCGAGGCAATGAACCAGACCAATGATCGCCAGCAAGCGGTGATCGA
+TGCACTGGTGGGTGCCGGCCTGGACCGCAAGGACATCCGCACCACCAGGGTCACCGTGGCACCGCAGTAC
+AGCAATCCGGAGCCGGCCGGAACCGCCACCATCACCGGGTATCGGGCAGACAACGACATCGAGGTGAAGA
+TCCACCCGACCGACGCCGCGTCGCGGCTGCTGGCCCTCGTCGTCAGCACCGGCGGTGACGCCACCCGGAT
+CAGCTCGGTCAGCTACTCGATTGGCGACGACTCGCAGCTGGTGAAGGATGCCCGGGCGCGCGCCTTCCAA
+GACGCCAAGAACCGTGCGGACCAGTACGCACAACTGTCGGGGCTGCGGCTAGGCAAGGTGATCTCGATCT
+CCGAGGCATCTGGCGCCGCGCCCACGCACGAGGCGCCGGCGCCGCCGCGCGGCCTATCCGCGGTGCCGCT
+GGAACCCGGCCAGCAGACGGTGGGCTTCTCGGTCACGGTGGTCTGGGAACTGACCTAGCCGCCTACTGAT
+AGACCCTGGGGTCCAGCGTCCCGATGTATGACAGGTCACGGTAGCGTTCGTCGTAGTCCAGGCCGTAGCC
+CACGACGAAGTCGTTGGGAATGTCGAAACCCACGTACGCGATTTCGACGTTGGCGTGCACCGCATCGGGC
+TTGCGCAGCAGCGTGCACACCCGCAATGACCGCGGATTCCGGCTCGTCAGGTTCCGCGACAACCACGAAA
+GCGTAAGGCCGGAGTCGACGACGTCCTCGACGATCAGCACGTCGCGGCCGTGGATGTCGCGGTCGAGGTC
+CTTGAGGATCCGCACCACGCCCGACGAGGATGTCGATGACCCATACGAACTCACCGCCATGAACTCGAAC
+TGGGTCGGCACGGGAATCGCTCGCGCCAGGTCGGTGACGAAGAGCACCGCGCCCTTCAGCACGGTGATCA
+GCAGCAGATCCTGGCCGGTGGTAGCGGACAGCTCGCGGTAGTCGTTGCCGATCTGCTCGCCGAGCTCGGC
+GATGCGGGCCTGAATCTGCTCGGCCGTGAGCAGCACCGACTTGATGTCCCCCGGATAAAGCTCCGCCGTC
+TGCCCGGGGGTGATCGCCGAGGAGCTCTGGGTCACGTGCACAGCGTGCCACGCCGCGGGACCAACGACCA
+ACGCGGGCGTCAAACGGGCTCGCGCCGCAACACAAGTACGCCGTCGCGCCGCCCGGCGACCAGTCGCTGA
+CCGCGCAACGTGGACCCAACCGCTACCCCGCCCTGACCGCGCCACGCGGTGACCAGCCGGTCCACTCCGC
+GGATCTGCCTGTCGGTCAGTCCGGTCGCGCCGCCGGCCAGCAGCCAGCCCCGAATCACCCGGCGCCGCAC
+CGCATCCGGCAGCGCGGTCAAGGCGCTGGTACTCAACTCCTGTCCCCGTGAGCCAGCAACAGCGGCTCCG
+GGCAGCGCCTGCGCAGCGATCGTGTCGATGAGGTCAGTGTCCTCGCGCAACGCTGTCGCGGTGCGAGCCA
+GCGCTTCGGCCACACCTCCGCCCAGCACGTCCTCCAGCAGTGGCAGCACTTCGGTGCGCAATCGGGTTCG
+GGTGAAGCGGCGGTCGGTGTTGTGCGGATCCTGCCAGGCGGTCAGGCCCAGCTCCCGGCAGGCCGCATGT
+GTCACGCTGCGGCGCACCCCCAGCAGCGGCCGGCACCAGGGCGGATCGTACGGACGCATGCCGGCGATCG
+ACCGGGCCCCCGAACCACGGCCAAGCCCCAACAACACTGTCTCGGCCTGATCATCGAGCGTATGGGCCAA
+CAGCACCGGGCCATCGCGGTGCTCCTCCAATGCCGAGTAGCGGGCGCTGCGCGCCGCCGCCTCCCGGCCG
+CCGGCCGCGCCCACCTGAACGCAAAGCACCCGCGCGTCCACACATCCCAGCGAAATCGCTTGTATGCGAG
+CTGTTTCCGCGACCGTGGCCGAGCCGGGCTGCAGACCGTGGTCCACGATCAGTGCGGTGGTGGGCCACAG
+CCGTGCGGCTACAGCGGTGAGCGCCAACGAGTCCGGGCCGCCGGAGAGCCCCACGCTCCAACGGTCGCAG
+GCGTCGAGATGGACCCGAGCGAACTGCTCCGCAGCCGCACGCAGCTGCGCTACAGCACTCTGTCGATCCA
+TCGCTGCGGGTTTTCGATCTCGGCAGGCAACGGCAGCGTCTCGGGGCCCGACCAGATCGTGTTGAACAGC
+TTCATTCCCGCCCGGTCGACCACATGGTCGACGAATGCCTTGCCTCGGGTGTACTGGCTGAGCTTGGCGT
+CGAAGCCCAGCAGAGCTCGCACCAGCCGCTGCAGCGGCGGCTGTTTGTGATGACGACGGTCGTCGAAGCG
+GCGGCGGATGGTGGCCACCGAGGGCACCACCATCGGCCCGACCGCATCCATCACATGCTCGGCATGGCCT
+TCCAGCAGCGTGCCAAGTACCAGCAGCTGGTCTAAGGCCTTACGTTGCGGCTCGGATTGCACGGCTCGCA
+CCAGGCCCAGAATGCCCGACGGGTTGACCTCGGAATCGTCGGTACCGTGTCCACGGCTGCGGATGAAGTC
+CGCCAGCCGGCTCACCACCCGCCCGATGTCGTCAACGGGTTCGAAGGTCAACAGGTTTAGCGCCTGCGAC
+ATGTAGCCGGACAGCCAGGGGTTGGCGGTGAACTGGACTCGGTGGGTGACCTCGTGCAGGCACACCCACA
+ACCGGAAATCGGACGGCTCGACCCGCAGTTGACGCTCGACGGCGATCACATTGGGATATACCAGCAGCAA
+GCAGCCTTCTCCGGCGGCTCCGAACGGGTCGTACTGGCCGAGGATGCCCGAGGCCACAAACGCCAGCACG
+GCACCGGTCTGCGCACCGGTGATCCGACCGGTGAGAAACCCCCGCGGTTTGGCGCTTCCGTGCGTCATCG
+CCCGCATCGATTCGGCGGCCGAGCGAATCCACGCCGGCCGGTCGACGACACGGGCCGGCGGCACCACACC
+GTCGGCGATCAGACCGGTGACGTCGCGCACCGGCGGTTCGGCCTTCTCCGCCGCGACGGTCAGCTCGTCG
+ATCACCTGGCGACGGGTGTATTCGGTGGACGGCGGAGCGGGCCGGGCCAGCCGCTCCCCGACGCTGGCCG
+CAAATTCCCAATCGACCGTGTTCCCCAGTGTCAGCTCGGACGCTCCGGTCACGTCGTGCACCCGCAGAAC
+CACAACTTAGTGGCCAGAGCGTCCATCGCGTTGCGACCGTTGGGACCGGCTTCGTTGGAGATGAACGCGA
+AGGTGAGCACTCGGCCGCTACGGTCGGTGAGCACCCCGACTAGCGAGTTGATCGCGGTCAGCGAGCCGGT
+CTTGGCCCGCAACCACCCGGCCGGACCCTGGTCGGTGGCCGCGTCGAGGAAGCGCTCGCCCAGCGTGCCA
+CTGCCACCGGCGATCGGTAGCAGATCCAGCAGCGGCCGCAACGCGGGCTGGTCGGGTCCAGCCGCGGCCT
+GCATCGTTGCATCGAGCGTCCGAGCGGTCAGGCGGTTGTCGAGCGACAATCCACTAGAATCCACCAGCGC
+AGCGCCGGCGGTGTCGATGTGTGCGGTGTTCAATCGGCTGGTCACCGCGTCGACCGCGCCACTAAAGCTC
+TGCGGCCGGTTGATCGCGACCGCTACCTCGCGGCCGATGCACTCGGCCATCACATTGTCGGAGGCGTTCA
+TCATCTGAGACAGTCGCTGGATCAACGGCGCCGACTGCACCACGGCCAGCTGCCGCGCGCCGGCCGGAGC
+CGATGCGATCGTCACCGCCGCGGGGTCCAGGCCAAGGGCTTTGGCCAACTCCCGACCGGCATCCAGCGCC
+GGGGTGCGGGACCGTCTCGAATTGACGGTGGTCGGCTGGATACGCCCGGCGTCGATCATCGCCGCTTCGA
+TCGGCGCGATGTCACCGTTGTCGATATCGGCCGGATCCCAACCCGGCGCCATCGTCGGACCGCTAAACGC
+CGAAGCGTCCACCTGCACGGCGGTGGGCGTCACACCGCTGCGGCGAATTTGTTCGACGAGGTCACCGATG
+CGAGCCGCGCCGTGATACCAGGTGTCCTGACCGGGCGGCGCTGCCGACAGCGTCGGATCGCCCGCGCCCA
+CCAACACGACAGGTCCCTGGGGGTTCTGGCCGCCGGCCACCACCCGCGTGCTGATCCGGGCCTGTCGGTC
+CAGTGTCAGCAGAGCCGCCGCCGCCGTCAGGATTTTGTTGGTCGAAGCCGGCACCAAGGGCACGTCGTCT
+AGCCGCTGCCAAAGTTCTTGTCCGGTCAGGGCATCGGTGATCCGACCTGCTAACTTGCCCAGATCAGGAT
+CGACCGCCACCACCGCAAGCGCCGCGGTCACGCCAGCGGCACTCGGTGTCGCAGCGGTGTCCGCCACAGG
+GACCACTCCCGCCTTGACTGTGGGTGGCCGCGGTGGAGGCACAGGTGCGCGCACGCCAGCCCGGTGACCA
+CCAGTAGTGACCAGCGCTGCGGCCGCCACCACAACGGCGACAAACGCCAGCACGGCCGCGCCGACGACCA
+CGTGCGTGGATTTCCGCCAGCGTGTGGGACCCATGAGCTCTCCTGCCTTTCCGGTCCCATTCTGCCGAAC
+CGGCCGGGCGACGCTGCCACGGTACCGGCTCGACTAGGGTGTCCACGGACGCATTGGACCTGCCCGTTGT
+CCCATGCACTCTGATCTGAAGGAGCCGACGCGTGCAATTCGACGTGACCATCGAAATTCCCAAGGGCCAG
+CGCAACAAATACGAGGTCGACCATGAGACGGGGCGGGTTCGTCTGGACCGGTACCTGTACACCCCGATGG
+CCTACCCGACCGACTACGGCTTCATCGAGGACACCCTAGGTGACGATGGCGACCCGCTGGACGCGCTGGT
+GCTGCTACCGCAGCCGGTCTTCCCCGGGGTGCTGGTGGCGGCGCGGCCGGTGGGGATGTTCCGGATGGTC
+GACGAGCACGGCGGCGACGACAAAGTGCTGTGCGTCCCAGCCGGTGACCCCCGGTGGGACCACGTCCAAG
+ACATCGGGGACGTTCCGGCTTTCGAGCTGGATGCGATCAAGCATTTCTTTGTGCACTACAAGGACCTGGA
+ACCAGGTAAGTTCGTCAAGGCGGCCGACTGGGTCGACCGCGCCGAAGCCGAGGCAGAGGTGCAGCGTTCA
+GTGGAGCGCTTCAAGGCCGGTACACACTGATTTGGGCTTAGGGCGCCCGCCCCGCGCCTTGGCACCCTCC
+GCCGGTCATGATCCGAACTTCGTGGGGGACCTGACTGTTAGGCGATTGCGCCGCACACTCTCGGTGAACG
+CCGCCCCGATAAAAACCACCCCCACCGAAGCGGTGACCCACTCGGGGACGGCGAATCGGTGGTCGATGGA
+CAACAGCAAGATTATGGCGAGCGCGCCAATCGCCCAGTGTGCGCCGTGTTCCAGGTACACGTACCGGTCC
+AGTGTGTCCTGTCGCACCAGATAGATCGTGATCGACCGGACAAACATCGCACCCACCACACCAAGGCCGA
+GCGCGATGATGATCGGGTCCGTAGTGATCGCAAAGGCCCCGGTGACGCCGTCGAAAGAGAAGGCGGCGTC
+GAGCACCTCCAGATACAGGAACAACGCGCAACCAGCCTTTCCGGCCGCCTGCCTCGCCTGCACGCCCGGC
+GTGGCTTCACCCAACCCCGCCGGCCGGAACGCCCGGCTGATCCCGTTGACGACAAGATAGGTCACCATGC
+CCAAAAGGCCGGCGATCAGCACCGTACCCCGCTGATCGCTGGAGTGTGTCAACAGCGCGCCGGCAAGGAC
+CAACCCAACACTGGCCACTATCACCGGGACCTGACCGAGTCGACCGATGCGGGCAAAGGGGACCTCAATC
+CACTTCAGCCATTTGATATCGCGGTCGTGAACGACGAAGTCCAGGAAAAGCATCAGCAGGAACATGCCGC
+CGAACGCCGCGATCTGCGGATGCGCAGCGGTGATCAGTTTTTCATAGCTGGGCGATCCGTCCGCAAATTC
+CAGCGCGCCATGGGCCGGTGGACGAAGCGCCAGCTCCATTGCGCGGACGGGGTCCAGGCCCGCGGTGGTC
+CAGATGATGGCCAGCGGGAACACCAGCCGCATCCCGAACACCGCAATAAGAATCCCGATGGTCAGGAACA
+TCCGCTGCCAAAACGGGCTCATCCGCTGCAGAATCGCGGCGTTGATGATGGCGTTGTCGAACGACAGCGA
+TACCTCAAGGAGCGCCAGAACCGCCAGCAAGAACAGGGCGGTCGGCCCGCCGTGCAAATATCCGGTAACC
+AACGCCACCACCGTCATCAGCAGCGAGAAGCCGAAGATGCGGAACGTTGACATGGATCCTTCCGAGGAAA
+AACCCCACAATAGCGACGAACCGACATCAATTGGTCAGGTTCGCGCCGCGCAGCGCGGCCAACCGGCCCG
+CCTACTATTTTCAGTCGTGACGATCCATGTCGGTTGGCCGTTGGCGCCGCCGCGGTGACCGAAGTCGGCG
+ATACGGCATCTCCTGTTGGCTCCTCGGGCGCCTCTGGCGGAGCTATCGCAAGCGGCAGCGTAGCCCGGGT
+CGGCACGGCGACCGCGGTTACCGCGCTGTGCGGCTACGCGGTGATTTATCTGGCGGCCCGCAACCTGGCT
+CCCAACGGCTTCTCGGTATTCGGGGTGTTCTGGGGCGCATTCGGACTGGTCACCGGGGCCGCCAACGGCC
+TGCTGCAAGAAACCACCCGCGAGGTCCGCTCGCTGGGGTACTTGGACGTCTCTGCAGACGGCCGCCGTAC
+CCATCCGCTGCGGGTCTCCGGGATGGTCGGCCTCGGCTCGTTGGTCGTGATCGCCGGTAGCTCACCGTTG
+TGGAGCGGGCGGGTATTCGCCGAGGCGCGCTGGCTATCGGTCGCATTGCTCAGCATCGGGCTGGCTGGGT
+TTTGCCTACACGCCACCCTGCTGGGCATGCTGGCCGGCACCAACCGGTGGACCCAGTACGGCGCGCTGAT
+GGTGGCCGACGCGGTCATCCGGGTGGTGGTCGCCGCGGCCACGTTCGTGATCGGATGGCAGCTGGTCGGG
+TTCATCTGGGCAACCGTGGCGGGTTCGGTTGCCTGGCTGATCATGTTGATGACCTCACCCCCGACACGCG
+CGGCCGCCCGCTTGATGACGCCCGGCGCTACTGCGACATTCCTGAGGGGCGCCGCCCATTCGATCATCGC
+GGCCGGTGCCAGCGCGATATTGGTGATGGGGTTTCCGGTCTTGCTGAAGCTAACCTCCAATGAACTGGGC
+GCGCAGGGAGGCGTTGTCATCCTTGCGGTGACGTTAACCCGGGCGCCACTGCTGGTGCCACTGACCGCCA
+TGCAAGGCAACCTCATCGCGCATTTCGTCGATGAACGCACCGAGCGGATTCGGGCGCTAATCGCGCCGGC
+GGCGCTCATCGGCGGCGTTGGCGCAGTCGGGATGCTGGCGGCCGGCGTCGTAGGTCCATGGATTATGCGC
+GTCGCGTTCGGGTCGGAATACCAGTCCAGCAGCGCATTGCTGGCCTGGTTGACGGCGGCCGCGGTGGCGA
+TCGCAATGCTGACACTCACCGGTGCCGCCGCGGTCGCGGCCGCACTGCACCGGGCGTATTCGCTGGGCTG
+GGTTGGTGCGACGGTTGGGTCGGGCTTGTTGCTGCTGCTGCCGCTGTCCTTGGAGACCCGCACCGTGGTC
+GCGTTGTTATGCGGTCCGCTGGTGGGAATCGGCGTCCATTTGGTGGCGCTGGCGCGGACGGACGAGTAAG
+CGGCCGATCAGCCCCTGACCAACGTGTAACTTGTGGGCTTAAATGGCCTCGAAAATGGACACTGAAACGC
+ACTACTCGGACGTCTGGGTCGTCATTCCCGCCTTCAACGAAGCCGCCGTGATCGGCAAGGTCGTCACCGA
+TGTGCGGTCAGTCTTCGACCACGTCGTCTGCGTGGACGACGGCAGCACCGACGGCACCGGCGACATCGCC
+CGGCGGTCCGGTGCTCACCTCGTACGCCATCCGATCAACCTGGGCCAGGGGGCGGCCATTCAGACCGGAA
+TCGAGTACGCCCGCAAGCAGCCGGGCGCCCAGGTCTTTGCCACCTTTGACGGCGACGGCCAGCACCGCGT
+CAAAGACGTGGCCGCAATGGTCGACCGGCTCGGCGCAGGTGACGTCGATGTGGTGATCGGAACGCGGTTC
+GGCCGGCCCGTGGGCAAAGCTTCGGCCAGCCGACCGCCACTGATGAAGCGGATCGTGCTGCAGACAGGAG
+CGCGGTTGAGCCGTCGAGGCCGCCGACTTGGCTTGACCGACACCAACAATGGCCTGAGGGTGTTCAACAA
+GACCGTGGCCGACGGGCTGAACATCACCATGAGCGGCATGAGCCACGCCACCGAGTTCATCATGTTGATC
+GCCGAAAACCATTGGCGGGTAGCGGAAGAACCGGTCGAGGTGCTCTACACCGAGTATTCGAAGTCGAAAG
+GCCAACCGCTGCTCAACGGCGTCAACATCATTTTCGACGGGTTTCTGCGAGGGAGGATGCCACGATGAAC
+TGGATCCAGGTGCTGTTGATCGCGTCGATCATCGGGTTGCTGTTCTACCTGTTGCGGTCGCGCCGAAGCG
+CGCGGTCGCGTGCCTGGGTCAAGGTGGGCTATGTCTTGTTCGTGCTCGCCGGCATCTATGCCGTGCTGAG
+ACCGGACGACACCACAGTGGTCGCAAACTGGTTTGGGGTGCGCCGCGGCACCGACCTGATGCTCTACGCA
+CTGGTGATGGCGTTCAGTTTCACCACACTGAGCACCTACATGCGGTTCAAGGACCTCGAGTTACGCTACG
+CGCGCATCGCCCGGGCTCTGGCACTTGAGGGCGCACAGGCGCCCGAACAGTGCCGGTAAGACCCAGCCAC
+TTGAGGGCGCACAGGCGCCCGAATTAAGCCGCGATTCGATCTGCGCAGACCGTAGCCAGGAAGGACCCGG
+CGGCCTACAGTTCTTAGAGTTACTGCATCTCTGACCAGCAGGAGGCGATATGTCCGACCCTGACGACGTC
+ACCACATCATCTGACGACCGCGACGAGGGCGAACCGGAAATAGACCTGCTGCCGGCCTGATGACTCAGAG
+CTCATCGGTCGAACGCCTGGTCGGCGAGATCGACGAGTTCGGTTACACCGTAGTCGAGGATGTCCTCGAC
+GCCGATTCGGTTGCCGCATACCTAGCGGATACCCGTCGGCTGGAACGGGAGCTACCGACCGTCATCGCCA
+ACTCCACAACCGTCGTCAAGGGCCTGGCGCGGCCCGGCCATGTCCCGGTCGACCGGGTCGACCACGACTG
+GGTGCGCATCGACAACTTGTTGCTGCACGGCACCCGCTACGAGGCGCTGCCGGTACACCCCAAGCTGCTG
+CCGGTCATCGAGGGTGTGCTTGGCCGCGACTGCCTGTTGTCGTGGTGTATGACGAGCAACCAGCTGCCGG
+GCGCGGTGGCTCAGCGCTTGCACTGCGACGACGAAATGTATCCGCTGCCGCGGCCGCATCAACCGCTGCT
+GTGCAACGCGTTGATCGCGCTGTGCGATTTCACCGCCGACAACGGCGCCACCCAAGTGGTGCCCGGTTCA
+CATCGCTGGCCCGAGCGGCCGTCGCCGCCATACCCGGAGGGCAAGCCGGTCGAGATCAATGCGGGCGACG
+CGTTGATCTGGAATGGCAGCCTGTGGCATACCGCCGCAGCGAACCGCACCGATGCCCCGCGGCCGGCATT
+GACCATCAACTTCTGCGTGGGGTTCGTGCGCCAGCAGGTCAATCAACAGCTGTCCATCCCGCGAGAGTTG
+GTGCGCTGCTTTGAACCTCGGCTACAGGAACTGATCGGCTACGGGCTATACGCCGGAAAGATGGGCCGAA
+TCGACTGGCGACCGCCGGCCGACTATCTCGACGCCGACCGGCATCCGTTCTTGGACGCCGTAGCGGACCG
+TCTGCAGACTTCGGTCAGGCTCTGATCAATCAGTGTGCTTGTGCCGGAAGTACTCGACCGTGCGACGCAC
+GCCGTCGGCCAACTCGATCTGCGGACGCCAGCCCAAAACCCGTTCGGCTAAGCCGATGTCAAGGCAGGAC
+CGCTTAAGATCGCCTAGCCGCGGCGGGTGGAACTCAGGGTCGTCGGGCCCGCCGACAGCCGCGGCCACCG
+CCGAATGCAGTTGGCGGTCCGACGTTTCCTTACCGGTGCCGATGTTGAAGCGCAGCCCACCGCCGACGTC
+CGCGGACACCCGGACAAACGCGTCGACCACGTCGTCGACAAACACATAGTCGCGCGTATTGGTGCCGTCG
+CCGAACACCCTGGTGGGTTTGCCCGAGAGCAGCGCCTGCGCGAAGATCGCTACCACACCCGCTTCACCGT
+GTGGGTCCTGGCGAGGACCGTAGACGTTAGCCGGTGCGATATGCGAGCAGTCCAGGCCGTAGAGATGTCG
+AAAGGTGTTCAGGTAGATTTCGCCGGCCACTTTGCCCGCGGCATACGGCGAGGCCGGATCGGTGGGCGCT
+GTCTCAGGGGTTGGATACTCCGGCGGGGTGCCATAGATCGATCCTCCCGAGGAGGTGTGCACGATCTTGC
+GGACACCGGTCTGCCGCGCGGCCTCGGCTAGGCGCACCGTGCCGATGACATTGACCGCGGCGTCGAATTG
+CGGGTCAGCCACCGAACGGCGGACATCGATCTGGGCCGCCAGGTGAAATACCACCTCGGGCCGGTGCTGC
+TCGAGGATGGCGTGTAGATCGGCGGTCACAATGTCGGCTTCGACGAAGACGTGTGCGGAGTTGTCGGCCA
+GATGCTCGAGGTTGGTCGCCCGGCCGGTCGCGAAGTTGTCCAATCCCACCACCGAATGACCATCTGCCAG
+CAACCGGTCGACTAACGTCGAGCCGATGAATCCGGCCGCCCCAGTGACCAGTGCGCGCACCGGCCCACCA
+TACCGGCGGCCCATGCCAGCGCCCCGTATGCCTCGGGTCGCCCTGGTCGCCGTATTGCTGATCACGGTGC
+AGCTGGTGGTTCGCGTGGTGCTGGCATTTGGGGGCTATTTCTATTGGGACGACTTGATCCTCGTCGGCAG
+GGCCGGCACTGGGGGCCTGTTGTCGCCGTCGTACCTGTTCGACGACCACGACGGCCACGTGATGCCCGGT
+GCCTTCCTGGTTGCGGGCGCCATTATCCGGGTGGCACCCCTGGTGTGGACCGGACCAGCGATCAGCCTGG
+TGGTGCTGCAGCTGCTGGAGTCGCTGGCGTTGCTGCGCGCGTTGTATGTGATATCGAGCTGGCGGCCGGT
+ACTCCTGATCCCATTGACGTTCGCGCTGTTCACACCGCTAGCGGTGCCGGGGTTCGCGTGGTGGGCGGCT
+GCGCTCAACTCGCTGCCGATGCTGGCCGCGCTGGCGTGGGTGTGCGCCGATGCCATCCTGCTGGTGCGGA
+CCGGCAACCACCGCTACGCCGTCACCGGTGTCCTGGTTTACCTCGGTGGCCTGCTGTTCTTCGAGAAGGC
+CGCGGTGATCCCGTTCGTCTCCTTCGCGGTGGCCGCGCTGCAGTGCCATGTGCGCGGCGACCGGTCAGCT
+TTGGCGACGGTGTGGCGGGCCGGTGTCCGGTTGTGGACGCCGTCGCTGGCACTGACCGTCGGCTGGGTAG
+CCCTTTATCTGGCGGTGGTGGATCAACGGCGATGGAGTTCCGATCTGTCGATGACGTGGGATCTGCTGTG
+CCGTTCGGTCACCCACGGCATAGTGCCGGCACTGGCCGGCGGGCCGTGGGACTGGGCGCGCTGGGCTCCG
+GCATCCCCGTGGGCCACTCCCCCGGCGGTGGTGATGGTGCTCGGCTGGCTGGTGTTGATCGCAGTGCTTG
+CGCTGTCACTGGTCCGCAAGCGACGCATCGGCCCGGTGTGGCTGACCGCGGCCGGCTACGCGGTGGCCTG
+CCAGGTGCCGATCTTTCTGATGCGCTCGTCGCCGTTCACCGCGCTCGAGTTGGCCCAGACCCTCCGGTAC
+TTCCCGGATCTTGTCGTCGTGCTGGCGCTGCTAGCCGCCGTCGCGCTGCAGGCACCCAATCGCGCCGGCA
+CCCGCTGGCTGGACGCCTCGCCGGCCCGAGCCGTTGCGACAGTCGCTTCGGCCGTGTTGTTTTTGACCAG
+CAGCCTGTATTCGACCGCGACGTTTCTGGCCAGTTGGCGTGACAACCCCACCGAGGGATACCTGAAGAAC
+GCCCAGGCAAGTCTGGCCGCGGCCGCGTCAGGTGCGCCGCTACTGGATCAGGAAGTCGATCCGCTGGTGT
+TGCAACGAGTGGCCTGGCCGGAGAACTTGGCCAGCCACATGTTCGCCCTGCTGCGCGTCCGACCGGAATT
+CGCTACGACAACAACACAATTGAGAATGTTCACCAGCACAGGTCGGCTGGTCGACGCGAAAGTGACCTGG
+GTCCGGACGATCATCGCGGGGCCGGTGCCGCAGTGCGGCTACTTCGTCCAGCCGGACCGGCCGGAACGTC
+TGATCCTCGACGGCCCCTTGCTGCCCGGCGACTGGACCGTCGAACTCAACTACCTGGCCAACAGCGACGG
+CTCGATGGCGCTGGCACTTTCTGACGGACCTGAGCGGAAGGTTCCGGTGCATCCGGGTCTCAATCGGGTG
+TACGCCCGGCTACCAGGGGCCGGCGACGCAATCACGGTGCGAGCCAACACCACCGCGCTTTCGCTGTGCA
+TCGGAGCGGCGCCGGTGGGATTTCTGGCACCGGCCTGACCTCAACGCCGGTCGCCACAGCCGCTCAAACG
+TGGCGGCCGCGCGTATTCGACCGTCCGTAGTGGTTCGTTAAAGCGTTGCAGTACAACGCATACAACAATC
+AATCGGCCATTGAGTTCGCACGCTCATGCAGTTGCGAATGGTCGGTGGATGCTCGAAGCCAATGCAGAAA
+GCGACCGGCTCGATGAGCTGCACCAGCAGTATCACCGAGATGATCTTGGCGGTAATCAGGCTTGTATCTC
+TTGTAGTGTGGCGGCGGCAACTGAATACTGACCAGAGCGCGGCAACTGAAAATTGACCAGCTTCCTGGAG
+AGCCTTGGCTATGGGCCAAGGAGGAAGCGAGTGTTGAGCGTGGAGGATTGGGCCGAGATCCGGCGGTTGC
+GCCGGTCGGAGCGGTTGCCGATTTCGGAGATCGCGCGGGTGTTGAAGATTTCGCGGAACACGGTGAAGTC
+GGCGTTGGCCTCCGATGGGCCGCCGAAGTACCAGCGTGCGGCGAAGGGCTCGGTTGCAGATGAGGCCGAG
+CCGCGGATCCGGGAGTTGTTGGCAGCCTATCCGCGGATGCCTGCGACGGTGATCGCCGAGCGGATCGGTT
+GGTGGTATTCGATCCGGACGCTCAGCGGGCGAGTACGCGAGTTGCGGCCGCTGTATCTGCCGCCGGATCC
+GGCGTCGCGCGACATATGTGGCCGGTGAGATCGGGCAGTGCGACTTCTGGTTCCCCGATGTCGTTGTGCC
+GGTGGGGTACGGCCAGGTCCGCACCGCCACGGCGTTACCTGTGCTGACCATGGTGTGTGGGTATTCGCGG
+TGGGCCTCGGCGCTGTTGATCCCGACACGCACCGCCGAAGACTTGTATGCCGGGTGGTGGCAGCATCTTT
+CGACGTTGGGCGCCGTTCCAAGGGTGTTGGTGTGGGACGGCGAGGGCGCGGTCGGGCGGTGGTGGGCGCG
+CCAACCTGAACTGACTGCGGCATGCCATGCCTTCCGCGGCACCCTGGCCGCCAAAGTGTGGATCTGTAAA
+CCGGTGATCCCGAAGCCAAGGGGCTGGTCGAACGTTTCCACGACTACCTGGAGCGGGCGTTCTTGCCGGG
+TCGGGTCTTTGCCTCTCCGGCGGATTTCAATACCCAGTTGCAGGCCTGGCTGGTGCGGGCCAATCACCGC
+CAGCACCGAGTGCTGGGATGTCGACCGGCAGATCGCATCGAGGCCGATACCGCAGCGATGCTGACATTGC
+CGCCGGTCGGGCCCAGCATTGGGTGGCGAACCTCGACACGGCTGCCGCGCGATCATTACGTGCGCCTCGA
+CGGCAACGACTACTCGGTGCATCCGGTCGCGATCGGCCGGCGCATCGAGATCACCGCAGATCTGAGCCGG
+GTCCGGGTCTGGTGTGGCGGCACCCTGGTCGCCGATCATGACCGCATCTGGGCCAAACACCAGACGATCA
+GCGATCCCGAGCATGTCGTGGCCGCCAAACTGCTGCGACGCAAACGGTTCGACATCGTCGGTCCACCCCA
+CCACGTTGAGGTCGAACAACGTCTCCTGACCACCTACGACACCGTGTTGGGCCTTGACGGGCCGGTGGCC
+TGATGGCAGCCAAGACCGCTACCAACAGCCGCGATGTGGCCGCCGAGCTGGCGTATCTGACCCGGGCGCT
+GAAAGCCCCCACCCTGCGCGGGGCCATCGAGCAGCTCGCTGACCGCGCCCGCACCAAGACTTGGAGCTAT
+GAGGAGTTCCTCGCAGCGTGTCTGCAACGCGAGGTGTCGGCCCGCGAATCCCACGGCGGCGAAGGACGCA
+TCAGGGCCGCCCGCTTCCCATCGCGCAAGTCGTTGGAGGAGTTCGACTTCGACCACGCCCGCGGTCTCAA
+ACGCGACACCATAGCGCATCTGGGCACCCTGGACTTCGTCACCCTAGCAATCGGGATCGCGATCCGCGCC
+TGCCAGGCCGGCCACCGCGTCCTATTCGCCACCGCCTCGCAATGGGTTGATCGTCTGGCCGCCGCCCACC
+ACAGCGGCACCCTGCAATCTGAACTGATTCGGCTGGCCCGATACCCGCTGCTGGTCGTCGACGAAGTGGG
+CTACATCCCCTTCGAACCCGAAGCCGCCAACCTGTTCTTCCAATTGGTGTCGTCCCGCTACGAACGGGCC
+AGCCTCATCGTCACGTCAAATAAGCCCTTCGGGCGCTGGGGCGAAGTATTCGGCGACGACGTCGTAGCCG
+CGGCCATGATCGACCGACTCGTGCACCACGCCGAAGTCATCGCACTCAAAGGAGACAGCTACCGCATCAA
+AGACCGAGACCTCGGCCGCGTCCCCACCGTCACGGCCGACGACCAATGAAACCAAGCTGGTCAATTTTCG
+ATTGCCGACACCTGATCAGTTTTCGGTTGCCGTTGACATAGTGCCCAAAACACGCACCCACATCAGATGC
+AGAACCCCTTGACAACCAATAGGGAATCTCTTCGCATGATGGAGGTTGCTGGCACCAATCCATCAGGAAG
+GCCCTTGTTGACCGGCACTGGGTTGGGGGTCCACCGCGATGGGTGAGTATGGCAAGTGCGGCACGTATGC
+ACCCGTCTTGGTGCACGCGGCCAAGGGCAGCCCGTTAGCGCCGTCGCCCAGCGTGAACTGAGGGCGGAGA
+ATCGGCCGGAATCTCGCCCTCAGTGCACGCTCGGCGCCGTTTGGCCTCACCCGGTCAACGTGAACTGTCC
+GGGGCGGGCACTGTCGCGTAGCGAGCCCACGTGGGGCCGGGGTCGGCCCGCCAAAAACGCCCCGGCGCGG
+CCAGCTCATGAGCGGGTACGCAAGCTCAAGCAGATCTCCGTAGCCGTGACGGAGTGCTTCATCGATGTCC
+GCAGCGATGGCAGCGGCCAGTGCGTGCCTAAACCCGTCTTGCGCAGAGTCGTTCGCAGCGGGCGGGTAGT
+TGCACGTCGTCGCCGAAGTGCTGACGATCCCGTTGCGGTCGGAGACCGCGAGTAGCCAGCGCGCGTCCGG
+GGCAGCATCTCGCGCAGCACGCTGAAGTGTCGCGGCACCGGAAGCCGGGGGCGTGAAGAGACCCGCCATG
+ACACCGGCTGGACGGCGCGGGGCAGAGTCCCGCGGAGTGGTGGGCTTCGACGTTGAGTTCGTCGGTGCCT
+ACTGGCCGCCGCTGATTGCGGCGACCACAGCATTATCGCTATCGGGGTAGAGCAGCGCCATAGAGGCCTC
+GGAGAGGTAGCGGCGCTCGCTGGCCTGCCATTCGTCGTGCATGTCGGCCAGGACGGCGCCCACAAGGCGG
+ATCACGGCTGCAGGATTCGGGAAGATCCCCACGACGCGGGAGCGTCGCTTGATCTCCTTATTGATGCGCT
+CCAATGGATTGGTCGACCAGATCTTTTGCCAGTGCGCCTTGGGAAATGCGGTGAACGCCAATACTTCTGC
+CCTGGCGTCGTCCATCAGCGGGCCGATCTTGGGAAACGACGCGGCGAGGCGATCACGGACCTCCTCCCAG
+GTCGCGTGCACCGCCTCGGCGTCGGGTGCCGAGAAAATCATTCGAAACATGCTGGCGACCATGTCGGCCT
+TGTCCTTGGGCACGTGGGCGAGCAGATTGCGCGCGAAGTGCACCCGACAGCGCTGATGCCCAGCGCCCTG
+GAAACAGCGCTTCAACGCCTTCACCAGCCCGGCGTGCTGGTCACTGATCACCAGCCGGACACCACCGAGG
+CCGCGCCCCTTGAGCGAGGTCAGGAACCCGCGCCAGAAGGTCTCATCCTCGCTGTCGCCGACGTCGAGGC
+CGAGGATCTCGCGTGACCCGTCGGCGGCGATGCCGCTGGCAACGATGACGGCCATCGACACCACCTGGCC
+AGTACCGTTGCGCACGTTGAGATAGGTGGCGTCGAGGTAGACGTAGGGGAACTCGATGTGCCCGAGCGTG
+CGGGTGCGGAACGCGCCGACGATCTCGTCGAGTCCGGCACAGATCCGCGACACCTCGGATTTGGAGATGC
+CGGTCTCCACACCCATCGCCTCGACCAGGTCGTCGACCGCACGGGTAGAGATACCGTGCACGTAGGCCTC
+CATCACCACCGCGTACAAGGCCTGATCGATCCGCCGGCGCGGCTCGAGGATCGCCGGGAAGAAAGAGCCC
+TTGCGCAGCTTAGGGATTCGCAGTTCCACGTCACCGGCCTGCGTGGACAGCACCCGCGATCGGGCACCGT
+TGCGATCGGTCACCCGAGTGTCGCTGCGTTCATAACGGGCAGCGCCGATCCGTTCAGTGGCTTCGAGCTC
+GCTGAGTTCCTGCAACACCAGACGGACGGCATCACGGATCAAGTCGACGCCATCACCAGTGCGGAACGCG
+TCGAGCAACTCGGACAGGGCAGACTGTGGCAAGGCCATCGGCGGGATCTCCTTCGGTGCGTGCTTGGCGG
+TACACACCGACGATCTCGCCGACGGCCCCTACCTCATCGGAGCCACTCCGCAACAACCCCTAAACCCACC
+ACGCTGCGGGAGGCTTACCGGCGGCGTGGCACAACGTTCGGTATCGCTGATCGGCATCAGGAGGTTAGTG
+CGATCAGAAGTCGTAAGTGGGCTCGGCGTCGAGGATCCCCTTGAACATCGCGACCAGGCCCGTGAGATCA
+GAGTTGGCGCGCGCCACGTGACAAGCGCCGTGCAACTCTTCCAGGTCGGTCTTCCCCCAGTCGAGGCCAG
+AACCGCGTTCGGACAACAGGAGATCGAAGAACTCGCGGGTCGAGCGGCCGTTGCCCTCGCGGAACGGGTG
+GGCATAGTTCACGTAGTCGTACCGGTATGCGACCTGGCCAGCGAGATCACCTTCGCCGACCGCTCTGAGC
+CGGTCGAGCTGGTAGATCTCCGCAGCCACATGCTCCATGGGCCGACTGATGCCGCCCGGCGCGCAGAAAG
+ACTCGTCCTCCTTCTCGATGCCGACTGTCCGCAGATCTCCCGCCCAGACGTAAATGTCCTGGAACAGCTG
+GCGGTGAATCGCCCGCAGGTATGCGAGATCTGTGCGGTCGCCCAGCAGATTGGGATCCTCGCGGAGTTCG
+ATCACCCGGGCCTCAACGAGGTCGTTCTCGGCATCACGCAGTTCGGCATGCGTTCGAGCGCCGACCCGGT
+TCCTCAAGACGGACATAGCGGGGATGAAGTAGCCCTGCCAATTCCGTTCGTGATCGCCGGTGTCCCATGG
+ATGCGGCACTCCACCCCGGTTACTGGATGTTGTACCGGCGGCGGACGCGCTCACCCAACTCGGCTGCCGT
+GATCTTGCCGCGGGCGTAGTCGTTCTGATCGGCACGGGTGGCGGCGGTGCTGCGGGTGCCCTCCAGCTCG
+GTGTTGCGGCGAGTTGCCCTGACATTCCTGAAGCGCCGCTTCACCTTCTGCAACTCGGTCGCCTGGACAA
+ACACTTCATCTCATTTGGTGGTCCTGACCAGGATAGTCGACAGCGCTGACATTGCAGGAAGTTGACCGTC
+AAGCACAGCACGGTTCTCCACCGCTGATGTACGACCATCATGTCTCGTTGGTCCTGTAATCGACGGCGTC
+CCACCGGCTCGACAAGAAATCCCACCAGGTGACTGGACGCAAGGCCGGTGGGGCCCCCTACACCGTCACC
+ATCCCGGAGTTCGGAGCCGCAGCTTTGCGCGAGCAGCGGGCACTGGTCATCCCGTTCGACCCGGTGTTTC
+CGGCCCGGCGCGGCACCCGCTAGTCCGAGGCCAACGTCGCACCCACTGGCGGGCGATCCGCGGAGAGGAC
+TTCAAATGGGTTGTCCCGCACTCGATCCGCAAGTCCGTCGTCACCGCGGTGGAACGCTCGATAGGGCTGG
+AAGCCGCGGCCCAGCAGGCCGGGCACAGCGGCAGCGAGATCACCCGGCGGCACTACGTCGAGCGGTCCGT
+GACGGTGCCCGACTACACCGCCGCCCTGGACGAGTATTCGCGCCCTATCCGCGCCTTCAGGCCATTAAAG
+AGCAACAGGCCGGGTGATATACCGACCTGACCTGCAAAGATGGAGCCGCCTAGGAGAATCGAACTCCTGA
+CCTATTCATTACGAGTGAATCGCTCTACCGACTGAGCTAAGGCGGCTTTTCCCCTGGGTGCCCGCTTGCC
+GGGCGGCACGAGTCTACGGCAGGCGGGCCGGCCCGCCCAAGTTTGCGGCGGTCGCTACCGCAGTTCCTGG
+CCGATGGTGGCGACCATGGCATCGACGGCGAACTTCGGTTTGACGTTGACCGCTAGCGCTTCCCTGCACG
+CCAACACCGCTTCGATGCAGCGCAGCAGCCGCTCCGGCGGGGCGTGGGCGGCCAGCGCAGCAACCCGGTC
+GGCCATATCCGGGTGGTTGGCCCGCACCCCACCCGCGTGGGCTGCGACCAACAGTGCATCCCGGAAGTAG
+GTCGCCAGATCGATCAGTGCCCGGTCCAGCGCATCGCGCGAGGCCCGCGTCTGCCGGGATTTCTGCCGTC
+GTTCAAGATCCTTCATCGCGCCGGTGGCACCACGCAACGCCGCGCCGGTGCCTTTACCGGTACCTCCGGC
+TCCCAGCGCCGTCCGCAGTTCTTCGGTCTCGGCCTCGATACGCTGCGCGGTCAACGCTAAGGCCTCGGCC
+TCGGCGCCGGCCACCAACTCCTCGGCGGCTGCGTAGGCACGCGAGGGTGTCGCGGCGTCACGTGCCAGCC
+CCAAAGCCCGCTCGCGTCGCTGCCGGGCCTGCGGATCGGTGGCCAGCCGGCGCGCTCGTCCGACATGGCC
+ACCACTGACCGACGCCGCCCAATTGGCCGTGTCGGGGTCCAACCCGTCGCCGTCGCTCAGCACCTGCGCG
+ATCGCGTGGGTCGACGGAGTCACCAACGCGACATGCCTACACCGGGATCGCAGCGTGACCGCAATGTCCT
+CGGGATCCACCGACGGCGCGCACAGCAGGAACACCGTCGACGGCGGCGGCTCCTCGACAACCTTGAGCAA
+CGCGTTGGCGGCGCCTTCGGTCAACCGATCGGCGTCCTCAATCACCACGATCTGCCAGTGCCCGGTAGTC
+GGCCGGCGCGCGGCGATTTGCACGATGGCCCGCATTTCGTCCACACCGATCGACAGACCTTCGGGAATCA
+CCCGGCGTACGTCGGCGTGGGTGCCCGCCAGCGTGGTCGTACACGCCCGGCAGCGCCCGCACCCGGGCTC
+CCCGCCCGACGTACATTGCAAAGCCGCCGCGAAGCACAGCGCGGCAACCGAGCGCCCAGAACCGGGCGGA
+CCGGTGAGCAGCCACGCGTGTGTCATAGTCCCGCCGCCACCCGCGCTGTGAGCCGAATCACGACGGGCCG
+CCTTGGCCGTGGCAAGCAGCTCGGCTTCCACCGCTTGCTGGCCTACCAGCCGCGTAAACACCCCGGACAT
+CATCGGCAACAGTAGCTATCCGCGCCGACAGATACCGATCAGCGTTCGTTTCGCGACAATTCCGTGATCT
+TTCGTCGCCATTTGGATGGATGCCGAGGCGTTCGTCGGTTTCCGGCAAGTCCCCGCCGCCCGATACGGTG
+GGCTAATGGCAACCACGGCGGCGCTACCCAGACGGATCCATGCATTCGTCCGGTGGGTAGTGCGCACTCC
+GTGGCCGCTGTTCTCGCTGAGCATGCTGCAGTCCGACATCATCGGCGCATTGTTCGTGCTCGGATTCCTG
+CGCTACGGCCTGCCGCCTCAGGACAATATCCAACTGCAGGATCTGCCACCGGTCAACCTACTGATCTTCG
+TCAGCACGGTAATCATCTTGTTCCTCGCCGGGGCCGTGGTGAACCTGAAGCTGCTGATGCCGGTCTTTCG
+ATGGCAGCGCCGCGACAACCTGCTCACCGAGCCTGATCCGGCCGCCACCGAGCTGGCCCGCAGCCGCGCA
+TTGCGCATGCCGTTGTACCGCACTCTGATCAGCCTGGCGGTCTGGGCTACCGGCGGCGGGGTGTTCATCC
+TCGCCAGCTGGTCGGTGGCCAAGCATGCGGCCCCCGTCGTGGCGGTGGCCACCGCGCTGGGTGCCACCGC
+CACCGCCATCATCGGCTACCTGCAGTCTGAACGGGTGTTACGGCCGGTGGCCGTCGCGGCGCTGCGCAGC
+GGTGTGCCGGAAAACGTCAACGCACCCGGCGTCATACTGCGACTGATGCTGGCGTGGATTCCGTCCACCG
+GCGTACCACTCCTGGCGATTGTGCTGGCCGTAGCGGCGGACAAGATTGCCTTGCTGCACGCCACACCAGA
+GGCGCTGTTCAATCCCATCCTGATGATGGCACTGGCCGCGCTGGGCATCGGATCCGTCAGCACCCTGTTG
+GTGGCCATGTCGATCGCCGACCCGTTACGCCAGTTGCGCTGGGCGCTAAGCGAGGTGCAGCGCGGCAACT
+ACAACGCCCACATGCAGATTTACGACGCCAGCGAACTGGGCCTGCTACAAGCCGGCTTCAACGACATGGT
+CCGCGAGCTGTCCGAGCGGCAGCGGTTGCGTGACTTGTTCGGTCGCTACGTCGGCGAAGACGTGGCCCGG
+CGGGCCCTGGAGCGCGGCACCGAGTTGGGCGGTCAGGAACGCGACGTCGCGGTGCTGTTCGTGGATCTGG
+TCGGCTCCACGCAACTGGCCGCGACACGACCGCCCGCCGAGGTGGTCCAGCTGCTCAACGAGTTCTTCCG
+GGTGGTGGTCGAAACCGTCGCCCGGCACGGTGGGTTCGTCAACAAGTTCCAAGGCGACGCCGCGCTGGCC
+ATCTTCGGTGCACCCATCGAACACCCCGACGGTGCTGGTGCCGCGCTATCGGCAGCACGTGAGCTCCACG
+ACGAACTCATCCCAGTGCTGGGTTCCGCGGAGTTCGGCATCGGCGTGTCGGCCGGAAGGGCCATCGCCGG
+CCACATCGGCGCTCAAGCCCGCTTCGAGTACACCGTCATCGGCGACCCGGTCAACGAGGCCGCCCGGCTC
+ACCGAACTGGCCAAACTCGAGGATGGCCACGTTCTGGCGTCGGCGATCGCGGTCAGTGGCGCCCTGGACG
+CCGAAGCATTGTGTTGGGATGTTGGCGAGGTGGTTGAGCTCCGCGGACGTGCTGCACCCACCCAACTAGC
+CAGGCCAATGAATCTGGCTGCACCCGAAGAGGTTTCCAGCGAAGTACGCGGCTAGTCGCGCTTGGCTGCC
+TTCTTCGCCGGCACCTTCCGGGCAGCTTTCCTGGCTGGCCGTTTTGCCGGACCCCGGGCTCGGCGATCGG
+CCAACAGCTCGGCGGCGCGCTCGTCGGTTATGGAAGCCACGTCGTCGCCCTTACGCAGGCTGGCATTGGT
+CTCACCGTCGGTGACGTACGGCCCGAATCGGCCGTCCTTGATGACCATTGGCTTGCCCGACGCCGGATCT
+GTTCCCAGCTCGCGCAGCGGCGGAGCCGAAGCGCTTTGCCGGCCACGACGTTTCGGCTCTGCGTAGATCT
+TCAGGGCTTCGTCGAGCGTGATGGTGAATATCTGGTCTTCGGTGACCAGTGATCGAGAATCGTTGCCGCG
+CTTTAGATACGGTCCGTAGCGCCCGTTCTGCGCGGTGATCTCCTCACCCGAGGCGGGGTCCACTCCGACC
+ACGCGCGGCAGTGACAGCAGCCTCAGCGCGTCTTCGAGGGTGACCGTCTGTAGGTCCATGCTCCGCAGCA
+ACGAACCGGTGCGCGGTTTGGGCCCGGCGGCCTTCTGGCGTTTCTTGACTCCCTGAGCGGCCGCGGCCGC
+ATCAGCCGCAGGCTCCGGCAGGATCTCGGTCACATACGGCCCAAACCGGCCTTCCCTGGCCACGATCTCG
+TGGCCGGTTTCTGGGTCCAAGCCCAAAGTCCGTCCCTGTTGCGGTGTGGCAAAGAGCTCTTCGGCCACCT
+GTAGAGTCAGCTCGTCCGGGGTAATCGAGTCGCTGAGGTTGGCCCGCTGCGGCGTGGGCTCACCGGTGTC
+GCCGGCCACCAAACGTTCCAGGTAGGGACCGTTCTTGCCCACCCGAACATATATGGGGCGTCCGTGGGTG
+TCGTCAAAAAGCTTGATAGAGTTTACTTCTCGTGCGTCGATGCCCTCGAGATTGATCCCGACAAGCTTCT
+TGAGGCCACCCGATCGGGCTACCGAATCGGGCACACCGTGATCGCCACCAAAGTAGAAGTTGTTGAGCCA
+GTTGGTGCGGCGCTCGTTGCCGGCGGCGATCTCGTCGAGCTCGTCTTCCATCGCCGCGGTGAAGTCGTAG
+TCGACGAGCCGACCGAAATGCTGCTCGAGCAGACCGGTTACCGCGAACGCCACCCATGACGGCACCAGTG
+CACTGCCCTTCTTGTGCACGTAGCCGCGATCCTGGATGGTCTTGATGATCGACGAGTAGGTCGACGGGCG
+GCCGATGCCCAGCTCCTCGAGCGCTTTGACCAGCGACGCCTCGGTGTAGCGGGCCGGCGGGTTGGTGGCA
+TGGCCGTCTGGGGTCAACTCGACGATGTCCAACCGTTGACCCGGGGTCAGATGGGGCAGTCGCCGCTCGG
+CATCGTCAGCCTCGCCGCCGACCAGCTCGTCCACGGTCTCCACGTAGGCCTTGAGGAAGCCCGGGAACGT
+CAAGGTGCGTCCGGTCGCGGAGAACACCACCTCCTGGTGCCCCGACATGCCAGTGATCCGCAGGCTCAGC
+GTCATGCCCCGCGCATCGGCCATCTGCGAGGCTACGGTGCGTTGCCAAATCAGCTCATAGAGCCGGAAAT
+CATCAATGTTGGGACCGTCGAGTTCGCGACGCACCGCGTCCGGGGTGGCAAACGTTTCACCGGCGGGCCG
+GATAGCCTCGTGCGCTTCCTGGGCGTTCTTCACCTTGCGGGTGTATTGGCGCGGCGCCGGCGCGACGTAC
+TCGTCGCCGTAGAGCTGGCGCGCCTGGGTACGTGCGGCGTTGATCGCCGACTCCGACAGCGTGGTGGAGT
+CGGTACGCATATAGGTGATGTAGCCGTTTTCGTACAGCCGCTGGGCGATGCTCATCGTCCGCTCGGCGGA
+GAACCGCAGCTTGCGGCTGGCCTCTTGCTGCAGCGTGGAGGTCATGAACGGCGGGTACGGGCGCCGGGCG
+TAGGGCTTCTCCTCGGCCGAGGCCACGGTCAGCTGCGTGCCATCCAGGCCCGCGGCCAACGCGGTCGCGC
+TCCCCTCGTCGAGCACAATGACTTCGTCGCCTTTGCGCAGCGTGCCCAGCGAGTCGAAATCGCGGCCAGT
+GGCCACCCGCCGGCCAGCCACGGCCGTCAGCCGGGCGCTGAAGGTGGGCGGCGCGGCGTCCGGGTCGGAC
+ACGCTGGCATCCAGCTTGGCAAGGATGTCCCAGTAGGCCGCGCTGCGGAACGCCATGCGGTCGCGTTCGC
+GCGCCACGATGATGCGGGTGGCCACCGACTGCACCCGGCCCGCCGACAACTTGGGGGCGACCTTCTTCCA
+CAGCACTGGGCTGACTTCGTAGCCGTACAGCCGGTCCAGGATGCGCCGGGTCTCCTGCGCGTCGACCAGG
+TCGATGTCTAGGTCGCGGGGGTGCTCGGCGGCGGCGCGGATCGCCGGTTCGGTGATCTCGTGGAAGACCA
+TCCGCTTTACCGGTATGCGCGGTTTGAGGGTTTCCAGCAGATGCCAGGCAATAGCTTCGCCCTCACGGTC
+CCCATCCGTGGCCAGATACAGCTCGTCCACGTCTTTGAGCAGGCCCCTGAGCTCGCTGACGGTGCTCCGT
+TTCTCCGGGCTGATGATGTAGAGCGGTTCGAAGTCGGCGTCGACGTTGACCCCGAGCCGCGCCCACGGCT
+GCGACTTGTACTTTGCGGGTACATCCGACGCGGCCCGCGGCAAGTCACGGATGTGCCCCCGGGAGGACTC
+GACGATGTAGCCAGAGCCCAGGTAGGAGGCCAGCTTGCGCGCCTTGGTGGGCGACTCGACGATGACCAGT
+CGCCGGCCGCTGCCATTGCCGCCGCTGCCACGGCCCTTCGTTTTCGGGTCAGCCAACTGCGCCCACGCTC
+CATCTCTTATCCCGGCCCCTATCGAGACCGCCCCGGTAGGTAGAGGACGCGGCCGACTGCCGAATCCCAG
+GTGAATTCCGGTACGCCGGCGTTCCCTCGCCTGTGGGCAACTGACAATCTCGCACTCTAGGGCGGGCCTG
+CGCAAACCGGCTGCAAACAGATTACCCACACCAAAGGCTCAAACGGGCCGCTCAGGACGCTCGGAGATCC
+GCATCGTCGCCGAACTAGGTCCGACTGCCCGGCTCCTCAGCGGACCCCAGCGGGACCGCATCGTCGCCGA
+GCTAGGTCCGACTGCCCGGCTCCTCAGCGGACCCCAGCGGGACCGCATCGTCGCCGAGCTAGGTCCGAGG
+CCACTGTACCCATGCCTCGGCCCCGTCTGGGGGTTCCCCCACGTTCTCTACCAGGCGCGATAACCTGCGT
+CGCCCGCTAATCCGCAGCGCTGGTCGGGTCCCCCGGGTACCGATCAGGGTGGGCGCAATCCCGACCCTCA
+TCAGCGCCGACGCCAGCGGAGAATGGGTGTCCGGCGCGTGTGGATCCAGGCCCAGCAAATAGCGGTCGGC
+CTCCGGGCTGCCTGCCGCCAGAGTCCAAGCCCTCAGCTCGCGCGGCCCGGGCAGCCATCGCGGGGGCACG
+GTCTTGACCGCACCGCGCGTCCACTCGGCGGCGATGCCGCACAACAGCGGGTCGACGGCCGTCCGCACCA
+GCGGGGTGTTTTCGTCGGTACGGGCGACCTCGGGTACCAAACCAGCCTCCTGGATCATCTCGGCCAGGGC
+CGATGCGCGCCAGGACTCGGCGACGACTACCGACAGCCGAGCGCCGCAACCAACCAGCACGATCTGGCCC
+GGGCCCGCCAGCACCCCGGAAAGATCCGCGACCGCGGGAGGTACTGACTCCGCGGCGAAGAAGGAAAGCT
+GGCTCACCTCACCGACAGTAAGCCAGCGAGCGGGTCGCTGGCTTTAGGCATCCGGCGCGGCGGCAGCGCG
+CCATGTGGCGAGCAGACGTAAAGCCCCCAAAACGGAACCGTTTTGGGGGCTTTTTGCGTCTGCTCGCGGG
+GGTAACTCAGAGCGAGCGGACTCCGGTGGCCTGGGGGCCCTTAGGGCTGTGGCCGATCTCGAACTCGACC
+TTCTGGTTTTCTTCAAGGGTGCGGAAGCCCGTTCCCTGGATCTCCGTGTAGTGGACAAATACATCCGCGG
+AACCGTCTTCGGGGGCGATAAAGCCGAACCCCTTCTCCGCGTTGAACCACTTCACAGTTCCCTGTGGCAT
+TTCTCGATCTTTCCTTTTCTTCTGGGTGCGGTGCACCGCCTTTCGGTGCCCCGGGCCAGCTGCGGCCGCC
+ATACCTCGCCGAGTCGCCGGAACTTCACCCGACCGATAACCTCGCAGGAACCGCGGCCGCAACGTCGATC
+CTGCGAAAGTTTGACACGAACACAGAAGCTGCGACCGCCAATCAGTCAATCATGTTCATCGCGTCGGCAA
+CAGCCTCTGGGTGTGGACGGAGCTACGAAGGGTCCGCAAATGGCGAGTTTCGGCAGCCACCTGCTGGCCG
+CAGCGGTCGCCGGGACCCCGCCGGGCGAGCGTCCGCTGCGCCACGTCGCCGAGCTGCCACCGCAGGCCGG
+CCGGCCGCGCGGTTGGCCGGAGTGGGCCGAGCCCGACGTGGTGGATGCGTTTGCCGACCGCGGCATCAGC
+TCGCCGTGGTCACACCAGGCTGAGGCCGCCGAGTTGGCGTACGCCGGCCGCCACGTGGTGATAGGCACCG
+GCCCGGCGTCTGGAAAGTCGTTGGCCTATCAACTTCCCGTGCTCAACGCGCTGGCAACCGACTCCCGGGC
+GCGTGCGCTGTATCTGTCGCCGACGAAGGCGCTCGGCCACGACCAGTTGCGCGCCGCACATGCGCTGGCG
+GCCGCGGTGCCACGGCTGGCTGACGTCGCGCCGACGGCCTATGACGGCGACAGTCCCGACGAGGTGCGCC
+GCTTTGCCCGCGAGCGCTCCCGGTGGCTGTTCTCCAACCCGGAGATGACACACCTATCGGTGCTTCGAAA
+CCATGCGCGCTGGGCTGTGCTGTTGCGGAATCTCCGCTTTGTGATCGTCGACGAATGCCATTACTACCGT
+GGTGTTTTCGGCTCGAATGTGGCGATGGTACTGCGCCGTTTACTACGGCTGTGCGCGCGCTACTCTGCGC
+ACCCGACGGTGATCTTCGCCAGCGCGACAACGGCCTCGCCGGGCGCGACGGCTGCCGACCTGATCGGCCA
+GCCGGTCGTGGAGGTCACCGAGGACGGCTCACCCCGGGGGGCTCGCACGGTGGCATTGTGGGAGCCCGCG
+CTGCGGTCGGATGTGATCGGCGAGCACGGCGCCCCGGTGCGACGCTCCGCCGGTGCCGAGGCGGCCCGGG
+TGATGGCCGACCTGATCGTCGAGGGAGCGCAGACCTTGACGTTCGTCCGATCGCGGCGCGCGGCGGAACT
+GACTGCACTGGGTGCCCGGGCGCGACTGGTCGACATTGCCCCGGAACTGTCGGACACGGTGGCGTCGTAT
+CGGGCCGGTTATCTTGCCGAGGACCGTAGCGCGCTGCACCAGGCCCTGGCCGAGGGCCAGCTGCGCGGGC
+TGGCTACCACCAACGCTTTGGAGTTGGGCGTTGATATCGCCGGACTGGATGCGGTGGTGCTGGCTGGTTT
+TCCCGGGACGGTGGCCTCGTTCTGGCAGCAGGCGGGCCGGTCGGGCCGGCGCGGCCAGGGCGCGCTGGTG
+GTGTTGATTGCCCGTGACGATCCGCTGGACACGTATTTGGTCCACCATCCCGCAGCATTGTTGGACAAAC
+CGGTCGAGCGCGTGGTGATCGATCCGGTTAACCCGCACCTGCTGGGTCCCCAATTGCTTTGTGCAGCAAC
+AGAACTGCCTTTAGACGACGCCGAGGTCCGGTCCTGGGGCGCCGTTGAGGTGGCGGAGAGTCTGGTTGAC
+GACGGGCTGTTGCGGCGCCGGAACGGCAGGTACTTTCCGGCGCCCGGGGTGAAACCGCATGCCGCCGTGG
+ATGTCCGGGGGGCTATCGGTGGCCAGATCGTCATCGTGGAGGCCGGAACCGGGCGGCTCTTGGGCAGCGT
+GGGCGTCGGTCAGGCCCCGGCCGCAGCGCACCCAGGCGCGGTGTACCTGCACCAGGGCGAGACCTACGTC
+GTTGACTCGCTGGATTTCCAGGACGGAATCGCCTTCGTGCACGCCGAGGATCCCGGCTATGCCACGTTCG
+CGCGAGAGGTCACCGACATCGCGGTCACCGGCACCGGCGAGCGGTTGGTCTTCGGGCCCGTTGCTTTGGG
+TTTGGTGCCGGTGACTGTCACCAATCACGTCGTCGGCTACCTGCGCCGCCAGCTGTCCGGGGAGGTGCTG
+GACTTCGTGGAGCTGGACATGCCGGAACATACCTTGCCCACAACCGCGGTCATGTACACAATCACTTCGG
+ATGCATTGGTCCGCAGCGGTATTGAGGCCACACGGATTCCCGGGTCGTTGCACGCCGCCGAACACGCGGC
+CATCGGGCTGCTGCCGCTGGTGGCCAGCTGCGACCGCGGCGATATCGGCGGCATGTCCACAGCGACCGGG
+CCCGAGGGGCTGCCCAGTGTCTTTGTCTACGACGGCTATCCGGGTGGAGCCGGATTCGCCGAACGCGGCT
+TTCGCCGGGCCCGCACCTGGCTGGGCGCCACCGCGGAGGCCATCGAAGCCTGCGAATGCCCCAGTGGGTG
+TCCATCGTGTGTGCAATCCCCCAAGTGCGGCAATGGCAACGACCCGTTAGACAAGGCGGGCGCGGTGCGG
+GTGCTGCGGCTGGTGCTCGCCGAGTTAAGTGAGGAATCACCGTGAGCAGCCCAGCGTTCCGGCGTTGTCG
+GGCAAAGCGGGGTCGTCGTCTTAGCCGATGTGATGCACTTGACATCAGTGTCTTCGGCCTATCACGTAGT
+GGTCGTGGGCGCCGGCCGAAGATCCGGGCGGGAGGTGACACGTGTCGTTTGTGATCGCGGCGCCGGAGGC
+GTTGGACTCGGCAGCAACGGACCTCGTGGTCCTGGGCTCGACGTTAGGCGCGGCCACTGCGGCCGCGGCG
+GCCCAGACGACGGGTATCGTGGCCGCGGCCCACGACGAGGTGTCGGCGGCGATCGCAGCCCTGTTTTCCG
+CCCACGGCCAGGCCTATCAGGCCGCCAGCGCGCAGGCCGCGGCGTTTCACACCCGGTTCATCCGTGCGCG
+CTCCCGACATCCGCAGCAGGAAACGACCTGTCGCCGTGTGCGATAGGCAAATCACCAGGCAACACGCCGG
+CAGCTCCGGTAAGGCCAACATCGACCACCTACCCAGGGCATTCCCATGCACGTCACCGCCGCATAGCAAG
+TTGCGGATGCTGAGTGGTCCGCTACCACCCGGTATGGCAACGCCGGTGGTCATGGCACCACCTCGGGTCT
+GATCTGCCTCGGAGGCCGGCCGCTGGCACGAAGGCAACGACGGTTCGGGCGGGTTGGCCTAGCGATACCA
+CACGCATGCGCTGTCCTGCAAGGGAATTCCCTCGGCGACCACCGGTACCCCACCGAGTCAACGGCGCACC
+GCGTCCGTAGACTGCTCGCATGACCCACGACTGGCTGCTCGTGGAGACGCTGGGGGACGAACCGGCCGTG
+GTAGCACGGGGGCGTGAGCTGAAGAAGCTCGTCCCGATCACCACGTTCCTGCGTCGCAGTCCCTATTTGG
+CGGCGGTCCGCACAGCTATCGCCGAGACGCTGCAGACCGGCCAAAGCCTGACCAGCATCACTCCCAAGCA
+CGATCGCGTCATCCGCACCGAACCTGTAATAATGACCGACGGCCGCATGCACGGCGTGCAGGTGTGGAGT
+GGCCCCACAGACGCCGAACCGCCCGACCGGCCGATCCCAGGCCCGCTGAAGTGGGACCTGACCCGTGGTG
+TGGCCACCGACACCCCGGAGTCACTGACCAACAGCGGCAAGAATCCCGAGGTCGAGATCACCTACGGCCG
+AGCCTTCGCCGAAGACCTGCCGGCGCGCGAGCTCAATCCGAACGAAACCCAGGTGCTTGCCATGGCAGTT
+AAAGCCAAGCCCGGCAAAACACTATGCAGCATTTGGGATCTCACTGATTGGCAAGGAACACCCATCCGGA
+TCGGCTTCGTGGCGCGAAGCGCTCTGGAGCCGGGACCAAACGGCCGCGATCACCTGGTCGCCCGGGCAAT
+GAATTGGCGTGCTGAGACCAAGGCCCCTGCAGTGCCCGTCGACGACTTGGCTCAGCGGATCCTTATCGGA
+CTGGCGCAGGCCGGAGTCCACCGGGCACTGGTCGATCTCAAAACCTGGACCCTGCTGAAATGGCTCGACC
+AACCCTGCTCTTTCTACGACTGGCGGCGTAGCGCGGCCGATGGGCCTCGTCTACATCCCGACGACCAGCA
+CGTGATCGACGCCATGACAAGAGACCTCGCCAACGGATCGGCCAGTCATGTGCTGCGCTTGCCTGGGCAC
+GACGTCGATTGGGTGCCGGTCCATGTCACCGTCAACCGGATAGAGCTCGAACCGGATACCTTCGCTGGAC
+TGGTCGCTCTGCGACTGCCCACCGACGAAGAACTTGCCGACGCCGGACTGCCGAAAGCCACCGACGTCAC
+CACCTGACAACCAGTCCTTTCGACTCAGCAACGGCAGCTGCCGATCCGCGGCTACCGTTGCTTGTCGTGA
+ACGGTTTGACGGTGATCCGGACTGCGCGCTCGCTGAGCGGCCTACGCCCACGCTGTCGGTCAGATTGCGT
+CGATGAATCCTATGCGCTCTGAACTGAACTGGGCTGAATGCGCGAGCCGCCGACGTAGGGAATCGGCAAC
+GCCCGTCGGACGACCCCGCCGATCTCGTCGTCGACATCCAGTGGCGCCGGCATCAGCAGGGTGGTGACGA
+TTGCCCGTTCAGACAGTCGCCGCAAGGCCCCGGGCCTGCTAGGAGGTCGGGTTCCCCGGGACGTCGACCA
+CACCCTGGTCGCAATGTCCAACGTAAGCAACAGGTTTGAGTATGAGGTGCCGGTAGCGAGGATGAATTCG
+CCAGTCCTGGTACACGCGCACGGACATCGCAGGTGCCGCGATGCGGCCGGCCTCTGGCCACCGCCGAATC
+GGCGTAGCCGTCGGGCACTTTCAAGATCGGGTCAGCGCGCCTGATGCGCACCGGGCCGCCACCTCAGCGC
+CATGGTGTTTCGGACATCCTCCAATCGCCGCCGATCCCCGAGGAACACCAGGTCGCCCGCGTGCGGGCGA
+AAGGCAGCGAGGACTTTTGGGAAACCCACGCACATGCTTCCCGGATAGCGATAAGCTGCGCTCCAGCAGA
+TTGTCCGCCGGTGACCGGGCGGCCCTTCGATCGGCATCGCGCGGTGGTCGGAGGTGTCCGATGTCATATG
+TGATCGCGGCGCCGGAGGCGCTGGTGGCGGCGGCCACGGATTTGGCTACTCTCGGCTCGACGATCGGCGC
+CGCCAACGCGGCCGCTGCGGGCTCGACAACGGCGTTGCTGACCGCCGGCGCCGACGAAGTGTCGGCGGCG
+ATAGCGGCCTATTCGGAATGCACGGCCAGACCTATCAGGCACTCAGTGCGCGGGCGGCGGCGTTCCATGA
+GCGGTTCGTGCAGGCCTTGGCCACAGGTGGGGGCGCCTATGCGGCCGCCGAGGCCGCCAGCGTCTCGCCG
+CTGCAGAGCGCGCTCGATTTGCTGAATGCGCCCACTCAGGCGCTGTTGGGGCGTCCGTTGGTGGGCAATG
+GCGCCAATGGGGCCCCGGGGACTGGGGCAAACGGCGGCGATGGCGGGATTTTGTTCGGGTCCGGGGGGGC
+CGGCGGGTCCGGAGCGGCCGGCATGGCGGGTGGCAACGGCGGGGCCGCCGGGCTGTTCGGCAACGGCGGA
+GCCGGCGGAGCCGGCGGCAGCGCGACGGCCGGTGCGGCCGGGGCGGGCGGGAACGGCGGGGCCGGCGGGC
+TGCTGTTCGGTACCGCCGGGGCCGGCGGCAACGGCGGGTTAAGCCTCGGTTTGGGCGTCGCCGGCGGCGC
+CGGCGGCGCCGGCGGGTCGGGCGGTAGTGACACCGCCGGACACGGGGGGACCGGTGGTGCCGGCGGCCTG
+CTATTCGGCGCCGGCGGCGCCGGCGGCGCCGGCGGGCTGGGCGGATTCCGCGGTGCCGGCGGCACCGGCG
+GTGCCGGCGGGGACGGCGGCAACGCCGGGCTGTTCGGCGACGGCGGCGCCGGCGGCGCCGGCGGCGCCGG
+CGAGGACGGCACAACGCCCGGTGGCAACGGTGGGGCGGGCGGTGTCGCCGGGCTGTTCGGCGACGGCGGC
+AACGGTGGTAACGCCGGAGTTGGCACGCCCGCGGGCAACGTCGGCGCCGGCGGCACCGGCGGCCTGCTGC
+TCGGCCAGGACGGCATGACCGGGTTGACGTAGCCGCGTGGCGGGGCCGCGCCTTGCTTCCGGGACTACCA
+CCCGCAGGTCGCTGGCCGTAGTTGGTTCTCCCCGCTAGCCCACCACTAGCTTCGCTTGCCGATAGAACTA
+GATCGTCGTCAACCCGGTGTCGTGGGCACCTTGGCCGGCCCCGCCCGCGCGGTGGCGGTCGCCACACCCG
+CGAACGCGACAGCCACCTCGACGGTGACGACCACGTCGAGGTCCACCACCCTGCACTGCGCGTGCTCGAC
+GCGCATCGCACGGGCCACCAGCGTCGCACGCGCGCAGGCCGCCGCCAGTCCGGACGGCAGCCGGGCGGCA
+GCGGCTAACGAAGCCAGATCAGCCGCCGCCTGTGCGCGGTGACGAGCCACCACCGCCGACCCTAGATATG
+CACCCGCACCGGTGACGCACAGCAGCACCGCGACCATCGCGACGGCAAGCACGGTGGCCGAGCCGCGGTC
+ACCCCGGCTCGGCCACCGAAATTGCCCTAGCAGCAATGTCCAACGTAGGCAACAGGTTTGAGTGTGCTGT
+GACAGTGGCGACCACAAACTCGCCGTCCCGGTGCACCTGGACCAGCGCCGCACGCGGGGCGATGCTGCGG
+GCGACGTCGGTCGCCGAGCGTACGTCACCGCGCGCGGCCAATCGAGCGGCCTCGCGGGCCGCGTCGATAC
+AGCGCACCTGCATTGATACCGCGGTGACGCCCGCCAGGCACAGCACCAGCACCAGCACCAGGGTGGCGAT
+CGCCAACGCCGCCTCCACGGTGCTCGCACCCGCACACGACGCTAAACCTTGGTGCTGAGCGCGCGACCGA
+TGATGCGGTTGAGCGCCGACACAATGGAATCCCCGGTGACGACCGTGTAGAGGATCGCACCGAAGGCAGC
+CGCCGCGATGGTACCGATGGCGTATTCCACGGTGGACATGCCCGACTCGTCGACCGCCAGCGCCGTCATC
+CGCGCCACGAGTACACGAAACATGGTGATCACCAACATATTCCTTTCTCATACCAGGCCAAACTGCAAGA
+CATCACCGGCCAGCCCGACTACTAGCGGGACAATGCCCACACACAGAAACGCCGGTAAGAAGCACAGTCC
+CAGCGGGCCGGCGATCAGCACACCGGCCCGCTCGGCGGCCGCCGCGGCCGCCTGTGCGGCGTCGTGCCGA
+ACCTGGACGGCCAGTTCGACAATGCCATCGGCGAGCGCCGCGCCCGAAGCCGCCGAACGCCGTGCCAACC
+GCAGTACCGCATCGGTCTGCGCATCGTGGGTGCCCGGCGGCAAATCCGGCGGCCTCGACCAGGCGATGTT
+GGGGTCGGCACCCAATGCCAGCAGGTCGGCGGCCCGGCGCAACACGCGCGCCAGCCGCGGCGGCGCGACC
+GCAGCGGTGGCGGCCGCGGCCGTCGACACCGCCATCCCCGCAGCCAGACACACGGCCAGCACGTCAAGGC
+TGGCTGCGACGGCTAGCGGGTCCGCGACATCCGTCCGCCCTAGCAGCAGCCCCTGGTGTGGCCGATGCGC
+GCGGGGCGGCCTCCCGGCTCGCGCCCGTACCACCGACGGGCCGGCACCGAGCCACAACGCCATGGCCAGC
+AACACCGCCGCCGCACTCACAACACTGGCCGATCGGTGATCCGGTCCGACCACAGCAGCCCGGCGCAGGC
+CAGTGTCAGCCCGACCACCAGCAGCCATCCGCCCACGCGTCCCGTCAGCAGAAAGCTCAGCGGCCGGGCG
+CCGATCAGTTGACCAAGCAGCACCCCGAGCAGCGGCAGGATTGCCAATATGGCCGCACTGGCCCGGGCAC
+CGGCCATCCCCGCTGACACCCGCGCGGAGAACCGTTGCCGCTCAGCGACATCACGTTGGGCGGCACGCAT
+CAAACTGGCTATCGCCAAGCCGTGATCACTGCCCAGTTGCCAGCAGACCGCGAGCCGCTCCCAGTACGCG
+GGCAGCGCCGAGGATCGGGCCGCAGCGAGCAGGCCAGCCGTGACGTCGGCACCCAATCGTGCCCGCGCCG
+CGACCGCGCGCAAGGCAACGGCAACCGGGCCGCCGGTCTCGTCAGCCGCGATGCTGAATGCGCGGACTGG
+ATGGGCGCCCGCGCGCAGTTCACCCACCACCAGCTCAAGCGCGGCCTCCAGCGCCTGCCCCTCGCGGCTG
+CGGCGCAGGTAGCGGCGACGCCGGCGGTAGCGCAGGCCGAGTGTTGCGCCCAGCACCGCGACAGCCACAA
+CGGTCGGTAACGGTAGCAAGGCTGCCACACCAACCGCGACACAGCCAACACCCCAGGCAACCCGCCGGGC
+GCCGACCAGAAGCACCCGCCGGCCGGTGTCGTCTGGAGTAAGGCGGCACCGCGGCGACCCGGGCAACACC
+ACGAGCGCAAGCGACAAAATCAGGGCAGCGGACGCTATACCGCTCATGCCGATGCCCGGCTTCTCAGCAA
+ATCGTGCAGGGCGGCCGCGTCGTCACTCATCCCACGGTCCGCGTGCCACACCGTCACCGCCTGGACCCGC
+CCTTCAGCTTGGCGCAGCACGGCGATCTCGGCGAGCCGGCGACGGCCTGCCCGATCGCGCGCGACGTGCA
+GCAGGACTTGGACTGCCGCGGCGAGCTGGCTGTGCAGAGCAGCGCGGTCAAGGCCGCCGAGCGCCCCCAA
+CGCTTCCATGCGTGCAGGGACCTCACCCGGGTTGTTGGCGTGTACGGTGCCCGCGCCGCCCTCGTGACCG
+GTATTGAGCGCCGCCAACAGATCCACCACCTCGGCTCCCCTAACCTCACCGACCACGATGCGGTCGGGCC
+GCATCCGCAGCGCCTGTCGGACGAGTTGACGCACGGTTACCTCACCGATTCCTTCGACGTTCGCACGCCG
+CGCAACCAGCTTGACCAGATGTGGATGCCGAGGGGCCAGCTCGGCGGCATCCTCGACGCACACGATCCGC
+TCATCGGGCGACACGGCGCCCAACATCGCTGCCAGCAACGTTGTCTTCCCGGCACCGGTTCCGCCGCACA
+CGAGGAATGCCAGCCGGGCGGTGACGATGTCGGCGACCAGCGCGGCGGCCGCGGGGTCGATCGCGCCCGC
+CGCAGCCAACGCGGCCAGATCCTGAGTCGCGGGACGCAACACCCGCAACGACAAGCAAGTGCCCTGGGTC
+GCCACGGGCGGCAACACCGCATGCAGCCGCACCGCGAACCCTCCGACGCCGATCCCGGTTAGTTGACCGT
+CCACCCAGGGTTGCGCGTCGTCGAGCCGACGGCCGGCCGCCAAAGCCAGCCGTTGTGCCAACCTTCGCAC
+CGCTGACTCGTCAGCAAACCGAATCTGGCTGCGTCGCAATCCGTTTCCGTCGTCCACCCACACCGAGTCG
+GGCGCGGTGACCAGAACGTCGGTGGTGCCGTCTGCGGATAGCAGCGGTTCGAGGATGCCAGCGCCGGTCA
+GTTCTGTCTGCAGCACACGAAGATTCGCCAGCACTTCGGTGTCGCCGAGCATCCCCCCGGACTCGGCCCG
+GATCGCGGCGGCCACCACACTGGGCCGCAGCGGGCCGGATTCGGATGCCAGCCGTTCGCGGACGCGTTCG
+ATCAGGGAGCCGGTCATGCCGCCCTACCGTGTCGCCCTGACCCAGCACGTGGCAGCACACCAAGTACCCG
+TCGGGCAGCCGATGCCAGCACCGATCGCCGTCGCAGTCGAAGACCCCCGTGTTCCAGCTGTTCGGCTAGC
+CGCGGCTGGGCCCTCATGGATGCCAGTAGCGGCACCCCGGCGACGTCCGCGACCTCTGCCGCCCGCAATC
+CCCCCGGGGAGGGCCCCCGCACCACCAGACCCAGGTTGGGGTTGATCGCGGTCAGCACAGGCGCCATCGT
+CGCGGCGGCCGCACATGCCCGCACATCGCATGGGCTGACCAGGACGACGAGATCGGCGGCATCCAGCGCT
+GCTTGGGTGGCATCGGTCAGACGACGTGGAAGATCGCAGACCACGGTGACTCCCCCACGTCGGCCGGCGT
+CGATCACGGCGTCCACCGGCCCGGCGTCTAACTCGTAGCCGCGCCGAGTTCCCGAGAGCACGCTGATCCC
+CCGCGGTCGCGGCAATGCCGCACGCACCGCCGACCAATTCAGCCGTCCACCCTGTAGCGCCAGGTCGGGC
+CAACGCAGACCGGGGGCGGTTTCGCCGCCCACCAGAAGATCGATGCCGCCGGCCCACGGATCGAGATCGA
+CCAACAGCGCATCAGCGGCGGCCTGCGCCAGGGCAACCGCAAACAACGATGCCCCAGCGCCACCGCGACC
+CCCGATGACCGCGACCACCGCCCCGCAGATCCCGTCATCGCGTGCCGATTCAGCAGCTTCGGCGAGCTCG
+CGGACCAGTTCACCCTCCTGCTCGGGCATCCTCAGCACGTGCTGGGCCCCGACGGTTATGGCAGCCGCCC
+AGGTCGCCGTCGCGGCTTCGGTTCCGGTCAACACGCTGACGTGGGTGCGCCGGGGTAGCGCGAGCCGCCC
+ACACCGGTCCGCCGCCGCGTGGTCGAGCACCACAGCCGCCGCCGCCGACCACGTCTTTCTGCTCACCAGA
+TGGCGGCCGCCGAGATGAACAACGCGAACCCCGACGGCTGCGGCGACTCGGTCCAGCTCGTCGCGCAACC
+CCGGATCGGTCAGCATCGCCAACACGCCCGAGCCCACCGGGTGGCTACCAGACGGGCCACCAGGGCCTGA
+GAAGACTGTCACCCACCCACCGTGCGGGGTCCATGGTGTGGGACACCAGTCCCAAAGGCGCAATTGGGGA
+CAGACGTGCAACTGTGCACAAACGCCCCTGAGGGGGTCCGGGCAACACGATTCCCGCAACGCCCAGAAAG
+CTGGGCTAAGCACCGGGCTGACGACGTTTGCGTGGCTGCCAAAAGGGACGACCCCCGCCAGGGGGGGGAG
+GAGGCGAGGGTCGTCGTGCATCAGCCCCGGGGGGTCGGACTGATACACCCTCGGCTATGGCCGAGTAATG
+CTTACTATACACATGACAGTGCGCAGTCACGCAAGTACCGGACGCAATGGAAAGCACAGCTTGAGCCGTG
+TAAATGCTCTTGACTTCTCGACAACATCGGTAGTCAATTGACCTGTTCGGGAACAAGGTCGCCGGCCGGT
+CCAACTGCCGACCTATGCTGGGTCGGTGACCGTCTCCGACTCGCCCGCCCAGCGGCAAACCCCACCGCAA
+ACACCGGGAGGCACCGCTCCGCGAGCCCGCACCGCGGCCTTTTTCGACCTGGACAAGACCATCATTGCCA
+AGCCCAGCACACTGGCGTTCAGCAAACCTTTCTTCGCTCAGGGACTGCTCAACCGCCGCGCCGTGCTGAA
+GTCCAGCTACGCGCAGTTCATCTTTCTGCTGTCCGGTGCTGACCATGACCAGATGGACCGGATGCGCACC
+CACCTGACCAACATGTGCGCCGGTTGGGACGTAGCCCAGGTGCGGTCGATAGTCAACGAAACCCTGCACG
+ACATCGTGACCCCACTGGTGTTCGCCGAGGCCGCGGACCTCATCGCCGCCCACAAGCTGTGCGGCCGCGA
+CGTCGTGGTGGTCTCGGCTTCGGGCGAGGAGATCGTCGGCCCGATCGCCCGCGCGCTGGGCGCGACCCAT
+GCGATGGCGACCCGGATGATCGTCGAGGACGGCAAGTACACAGGCGAGGTCGCGTTCTACTGCTACGGCG
+AAGGTAAGGCGCAAGCCATCCGTGAGCTGGCTGCCAGTGAGGGCTACCCGCTGGAACACTGCTACGCGTA
+CTCCGACTCGATCACCGATCTGCCGATGCTTGAGGCGGTTGGGCATGCCTCGGTGGTCAACCCTGATCGC
+GGCTTACGAAAGGAAGCCAGCGTGCGCGGTTGGCCCGTGTTGTCGTTCTCTCGGCCGGTGTCGCTGCGCG
+ACCGGATCCCGGCACCGTCAGCCGCGGCGATCGCCACGACTGCGGCGGTGGGTATCAGCGCCCTAGCCGC
+CGGCGCGGTCACCTACGCGCTACTACGCCGCTTCGCGTTTCAGCCCTAGCGACGATGCGGGCCACACAGT
+GGCCCGAGGAGGAACGGGGCCACGAAGCAGGCCGCCGGATCGCGCCCGAGCGGGCGGGCAGCAAACGTCT
+AGCCCACGCAATCCAAAGCCGCTTCGTAACTTTCGCAGAATTGGGCCTTGCTGTGTTAAAGGTCTAGTAG
+TACAAAGGAACCACGGAAGCCCGGTGAGGCCAAGGCTCGATCCAGAAGAGAAGGTTCGGTCTCCCGACCC
+GGGCGCCCAGCATGGTTCCCGGCACCCACGCGGAGTCATAGCCACGATAACGGCAGAAGTGTTGCGGGTC
+TGCGTAATTGCGAACAGCAGATGGCATCGACGGCCCTTTGGGTGGGGCTACAGCTAGAAGCGTCGCAAGA
+TCGCCGAGGCCACCCACGCAACCCCAGGAGTGCACGCTTGGTAACCGAGAACCGTGTTGGTGGGCGGCGA
+TTCGAGTTCTTCGGGTCGCCGCCCGCTTTTTGTTTTCTGGATCAAGTATTACGGCCATTCGAGGCCCGCC
+GGTTAGCCGCTCGGCTATCTAGGCGCGTAATTCAGTGACCGTTTGGCCGGGCTGTCTCGCGGCTGTGCCA
+GATCACAGCGGCGAAGTGCCGCAGCCGTGACCCGCTCGGGGTAGCCGGGCTGTTTGAGCAACCAGACACG
+CCGAACGTGCAACCACGGCGGCTCCACCCGGCGGGGCGTGTCCCCGCCACCAATGCACGTTCGGCGCAGC
+CGGCGCACCCTCGGCGCGGAGTTTAGGAACTACTCATCCAGGTGACAACGACTCGGCAATCGACAAAGCC
+TCCCGCGCGCCGTCGAGCATCGCGCCGCAACACAGCAACAGCCAGCCCGCCACCCCATCAGGTGTGCCCC
+CGGCGAACCTGCGGGCAGCGTCGTGGTATTCGGCGGGTTGGCGCATCCAAATCACTTCGGGAACACCCAG
+CCCGTGCGGATCCAGTCCGGTGGCGATTGTCACCAGCCGCGACACCGCGCGGGCCACCACACCGTCGGCA
+CAGCCAAACGGCCTCAGCGTCAAGAGCTCCCCGTGTGCGACCGCAGCAACCACCGGCGCCGATGCCAGGG
+TGGGGTGGGTTACCACATCCGCGAGCAACTCCAAACGCGGGCCAACGTCGGCATCGGACCGCGGACGCCC
+AAGCCGATCGTCATCGACCTGGTCGGCGGCCGCCAGCATGTGTAGGCGGGCCAGCGCCTGCAACGGTGCC
+CGCCGCCACACCCCGACCACCGGACCCGCGCCGCCTTCCAGCGCCTGCCCCACCCGAAGCGCTCCCGCGA
+ACACCGGATCGCTGAGCGCCGGCTTGCCCGAGGTGGGCGCCCCCGCGTCGTGCAGCCGCGCAGGACCACC
+GTCGAGCACCGAGGAGGCCCGCGCCGCCCGCAACGAGGCCTCGGCGGCGGCCACCGGCCAGCCCCGCAGG
+TTGGTCCGGTGCCGGTGCACGCGGCTCAGCGCGTCGCGCACCCGGTCGCTGGCCGCAGCAACGCCCGGGA
+GCTCCATTAGCGGAGCCAGCGGGTCGACCGTCACAGGTTGCCAACCTTTCGGGGAGCTGAGGGGGCACCG
+GGAATGGCCTGAAGCAACTGGCGGGTGTACTCGTGGCGGGGCCGGCTGAACACCTCCTCGGTAGAGGCGT
+GCTCCACCACCCGGCCGGCCCGCATGACCAGGACGTCGTCGGCAATCTGCCGGATCACCGCCAGATCATG
+GCTGATGAACAAATACGTCAAACCCAGGTCGGCCTGCAGATCGGCCAGCAGATCCAGGATCTGTGCCTGC
+ACCAATACGTCGAGCGCCGACACCGCTTCGTCGCACACCAATACCTCCGGGCGCAGCGCCAGCGCACGCG
+CGATCGCTACCCGCTGCCGCTGACCACCCGACAGCTCACGGGGCCGCCGGCCCAGTATCGACGACGGCAG
+CGCCACCTGATCGACCAGCTCACGCACCGCCCTTTGCCGCTGCCGGCGGTCACCGACGTGATGGACGCGT
+AACGGTTCCTCGATGGCGCGAAACACCGAGTACATGGGATCCAGGCTGCTGTATGGGTTTTGGAACACCG
+GCTGGACCCGGCGGCGAAAGGCCAGCACCTGGTCCCGGGCCAGCGCGCCGACGTCGTAGGTGCCGTCGAA
+AACGACCGTGCCCGAGGTAGGTTGGAGCAGCCCAAGCACCATCCGCGCTAGCGTCGACTTGCCTGACCCG
+GATTCGCCGACGATTGCCAGGGTGCTCGCCCGCGGTAGCCGGAATGACACTCCGTCGACGGCGCGAGACT
+CCACCCGCCGCCACGGTGCGCCGCGGGACTCCCGGTAAATCTTGGTCAGCTCCGAGACGACGAGAATGTC
+GCCGGCCTGCGTGGTTGCCCGTGACCGGGATTCCGGCGGACGTCTGCTGCGCGCCGTCAGCGATGGAGCC
+GCGGCCACCAGGCGCCGGGTGTACTCGTGCTGAGGGCTTTGCAGGATTGACTGCGCCGCACCGGATTCCA
+CCACCACTCCACGACGGACGACGACGACAGCCTCGGCCCGCTGCGCGGCCAACGCCAGATCGTGGGTGAT
+CAGTAGCAGCGCGGTGCCTAGTTCGTCGGTGAGTCCCTGAAGATGATCGAGCACCTGCCGCTGCACGGTG
+ACATCCAACGCGGACGTCGGCTCATCGGCGATCAGCAGCCGCGGCCTGCCCGCCAAGCCGATCGCAATCA
+ACGCCCGCTGGCACATGCCGCCGGACAGCTGATGCGGGTAGCGTCCGGCTTGCTTCGCCGGATCCGGCAG
+GCCCGCCTCAGCGAGTAGCTCCACCGCCCGTCGTCGTGCTGCGCGACCGTCGGTATTGGCCCGCAACGCT
+TCTGTGACCTGAAAGCCGACCTTCCAAACCGGATTGAGGTTGGTCATCGGATCCTGGGGAACATAGCCGA
+TCTCCCGTCCCCTTATCGACCGTAGCCGCTTGGCATCGGCCCCGGTGATGTCGCGCCCGTCGAACACAAC
+GCGTCCAGCGGTGATCCGTCCACCAGCCGGAAGCAACCCAAGAATCGCCGCGGCCGTCGTGGATTTGCCC
+GACCCGGACTCACCCACCACGGCGACGGTTTGACCGCTCCGGACGGCCAGATCCACCCCACACACGGCGG
+GAGCATCGGTGCCGAACGTAACTTCCAGGCCCTCCACCGACAACAGCGGCGCTGCTGGGACGCTCATGCC
+CGCCATGCCCGCGAAGCCGGATCCAGCGCGTCGCGCAAAGCGTCGCCCATCATCATGAACGCCAGCACCG
+TAATCGCCAGCGCGCCCGCAGGATAGAACAAAATTGGCGAGCCCGACCGTAGCCGGGTCTGCGCGACATT
+GATGTCGCCACCCCAGGACACCACCGACGTCGGCAATCCGACCCCGAGGTAGGACAGCGTGGCCTCGGTG
+ACGATGAAGATCCCCAGAGCGACGGTAGCCACCGCGATCACCGGGCCCACGGCGTTGGGCAGCGCGTGCC
+GAAGCAGAATCTGAAACCTATTCAACCCCAATGCCTTAGCTGCAAGGACGTAATCGCTGGCACGCACCTC
+GAGCACCGCACCGCGCGCGATCCTGGCCACTTGCGGCCAGCCGAACAATGCCAAGATGGCGATCACCGTC
+CACACCGTGCGGTGATGCATGACTTGCATGAGCACGATGGCGGCCAACAGCAACGGCAAGCCGAGAAACA
+CATCGGTGACCCGCGAAACCACCGCATCGATCCAGCTCCCGTAAAAACCGGCCAATGCGCCTAACGCCCC
+GCCCACGACGAACACGGCCAGCGTTGCCCCCAACCCGACCGTGACCGAAGCCCGCGCACCATACACCGTG
+CGCGAATAGATGTCGTGGCCCTGCAGGTCGGTGCCGAACCAGTGCGCGGCCGATGGCGCAAGCATGCTTT
+GGCTGGGATCGGCATAGGTGGGATCGGCTGCGGTAAACAACGACGGAAACGCCGCCACGACAAGAATCAG
+CAGGATCAGCGCCGCGGCGATCACGAATTTAGGACGCCGGCGCAACCCGCGCCAGGCATCGAGCCAGAAC
+CCCGTGTGCTCAGCCATAGCGGATCCGCGGGTCCAGGGCCGCATACAGCAGATCCACCAACAGATTGGTG
+ATCAGGTAGATCAGCACCAGCACCGTCACGATCGACACCACCGTCGGCGTCTCCTGACGCGTGACCGCTT
+GATACAGCACGCCCCCGACGCCGTGGATGTTGAAGATTCCTTCGGTCACAATCGCTCCGCCCATCAGCGC
+GCCCAGATCCGCGCCCAGGAAGGTCACCACCGGAATCAGCGAATTGCGCAGAATGTGCACCGTCACCACC
+CGGGGCCGCGACAACCCCTTGGCGGTGGCGGTGCGGACATAGTCAGCGTGTGCGTTGGCCGCCACCGCCG
+AGCGGGTCAATCGCACCACGTAGGCGAATGACATGGCGCCCAGCACGATCCCGGGTAGCAGCAGGCGGCC
+GACGCTCGCCCGTTCGCCCACCGTGACCGGCGCGATTTCGAGCTGGACCCCGAATAAGAACTGCGCCAGA
+AAGCCCAGCACGAAGATGGGGATCGCAATAATGACAAGTCCGGTAACCAGCACCGCGGAATCGAAGATTC
+CACCCTGACGTAGGCCGGCGATCACGCCGAATCCGATTCCGAGCACTGCCTCCACCGCCAGGGCGATCAA
+GGCCAGCCTGATGGTGACCGGAAACGCATGCGCCAGAACGGCACTGACCGGCAGCCCAGAATACGCACGA
+CCCAAGTCACCGTGCAGAATTCCGCCCAGATAGCGCAAGTATTGCACGAGGAACGGATCGTCGAGGTGGT
+AATGCGAACGCAGCTGCGCGGCCACCGCGGGAGTCAACGGACGGTCGCCCGCCAGCGCGGCAACTGGGTC
+ACCGGGCAGCAGAAAGACCATGCCGTAGATCAGCAGTGTCGCGCCCAGGAAAACCGGCACCATCACGGCG
+ACTCGGCGCGCAACATACCAGCCCATGTCAGGCCTTGACGATGTTCTCGTAGTCGGGCAGACCATTCCAG
+GTGACGGTGACGTTGCTGACTTGCGACGACCATCCGACGACACTGATGTAATCCCAGAGCGGCACAACTG
+GCATGTCGTGAAACAGGATTCGCTGCGCGTCGTTGACCAGCTCGTGGGATTCGGTTAACGTGGGGGCGGC
+TTCGGCGGCGGCCAGCGCCGCGTCGAATTCCGGGTTGATGTAGCCGACGTCGTTGGATCCGGCGCCGGCG
+GTGAACAGCGGAGCGAGAAACCCGATCATCGACGGGTAGTCGCCCTGCCATCCAGCGCGAAATGCACTGT
+CGATGGCGCGGTTGGTGATCTGGGTGCGAAATCCGGCGAAGGTGGGCTGCGGCGCGGCCACCGCATCGAT
+GCCCAACACGTTCTTGATGCTGTTGGCCACCGCGTCCACCCAATCCCGATGGCCAGCGTCAGCGTTATAG
+GCGATCGCGTACCGGCCGCTCCACGGTGAGATCGCATCGGCCTGCGCCCAGAGCCGCCGAGCCCGCTGCG
+GGTCGTAGTCCAGCACCTCGTTGCCCGGCAGGTTGGGATCGAAGCCCGGCAACGACCGGGCGGTGAAATC
+GCGGGCCGGACTGCGGGTTCCGGCGAAGATCTGCTGGCAGATTTGCGGCCGGTTGATGGCGGCCGACAGC
+GCCAACCGGCGCAGCCGCCCCTCCTCGCCACCGAAATGCGGCAGCCGCAACGGAGTGTCGAGGGTCTGAT
+TGATCGCTGCGGGCCCGCTGGTAGCGTGGTCGCCCAGGTCGCGCTGGTAGACCGTCAACGCGCTCGGCGG
+AATCGTGTCCAGGACATCGAGATTGCCGGACAGCAAGTCGGCATAGGCGGTGTCCAGATTGGCGTAGAAC
+TCGAATCGCAAACCTTTGTTACGGGGCTTGCGGTTGCCGTGGTAGTCGGGGTTGGGCACCAGGTCGATTC
+TGACGTTGTGTTCCCAGGCCGGCCCGGCTGGGCCGTCGGCGAGTTTGTACGGGCCGTTGCCGATCGGGTT
+GCGGCCGAACGCGGCCATGTCCCGAAATGCGGAGTCCGGCAGCGGATAAAACGAGCTGTGGCCAAGGCGC
+AACGTGAAGTCGATGGTCGGCGCCTTAAGCCGCACGGTGAACTCCAGGTCGTTGACCACGCGCAACCCGG
+ACATGGTGGTCCGGCTCTTATCCCCTGGCGCGCCGGCCACGTCATCGAACCCTTCGATCGGGCTGAAAAA
+GTGCTGCTGCAGTTGGGCATTGGTGCTCAGGGCTCCGTAGTTCCACGCGTCGACGAACGAGTGGGCCGTC
+ACCGGCGAGCCGTCGGTGAACTTCCAGCCGGGTTTGACAGTGATCCGGTAGTTGACGTTATCGGCGCTCT
+CGATTGACTGCGCGACCTCCAGCGACGGCTTGCCAACGGCGTCATAGGACATCAGGCCGGCGAACAACCG
+ATCGATGATGCGCCCACCGTTGCTGTCGTTGGTGCCGGTCGGGATCAGCGGGTTGGGCGGTTCCCCGCCG
+TTGACCAGCACCACGTCAGGGCTCAGGACACCGCCGCCACAACCGGCCACTGGCGCAAGCACCAGCAATC
+CGGTGGCAAGGGCTGCCAGGGCCGCCCGCATCCGACGCACCATGACAGCGACCCTAAAGCCTTCTTGTGC
+AGTCCGGCTCCCCAGCCGGTGAAGTGCGGCCTGGCCAGCGCAGCCGACACACTCGCCGGTGACCGTTAGC
+TACCACGCCACCCAGAGTGCCGGCGAACCGGTGGGACGATGTTTTGGGAACGCTCACACCGTCGTTCGCG
+ATCCGGTGTTGGCTACCCACCGCGACTGCGCTTCCCAAGGGAAGACCTCGCCCGACCGGGCGCTGTTGGC
+GTGCGGCATCCTCGAGGAGGACCGGTGGTGTCGGCGCTGTGGCGAGGAAGGCAGCCCGCGCGACACCGTG
+ACCAGGAGGTTGACTCACTGGTGTGGGCTGCACCCGGGTGTGAGCGTAGATCACTCATGTCTTAGCCGAT
+GCTGCCGCTTGGATTGCCGCCGTCGTGGCCCAGCGGTGCCCCAACGCGATCCGCCGCGCCGATAAAGCTA
+ACCGGTGCCAACGAACGACGCCACATCGCACATGTCGCTCACGCCAGCCGATCTCCGTTGCCGGCCACCG
+TAACCGTCAGCACGACTCGGCACAATGCCAGCCGCACGCTGCAAGGCCGACCAACGTGTGATGTGTAGCC
+TGCAAGACACCGGCTTTCTTGGCTATGACTGCATCCTGGTCAGCGATTGCACTGTGACGACTTTGCCCAG
+CTCAACCTCTGCCATGCCGGCTGTATCGTCGCGCGGTTAGGCTCACATCCGTGAGTGAGTCCACCCCCGA
+AGTCTCCTCGTCATACCCGCCGCCAGCGCACTTCGCCGAGCACGCGAACGCCCGCGCCGAGCTTTACCGC
+GAGGCCGAGGAAGACCGGCTGGCTTTTTGGGCCAAGCAGGCCAACCGACTGTCCTGGACGACGCCGTTCA
+CCGAGGTGTTGGACTGGTCGGAGGCGCCGTTCGCCAAGTGGTTCGTGGGCGGCGAGCTCAACGTCGCCTA
+CAACTGTGTGGATCGTCACGTCGAGGCCGGCCATGGAGATCGGGTCGCCATCCACTGGGAAGGCGAGCCG
+GTCGGCGACCGGCGCACGCTGACCTATTCCGATCTGCTTGCCGAGGTATCCAAAGCCGCGAACGCGCTCA
+CCGACCTCGGTCTGGTGGCCGGTGACCGCGTCGCCATCTACCTGCCGTTGATCCCTGAGGCCGTGATCGC
+CATGCTGGCCTGTGCCCGGCTAGGCATCATGCATAGCGTTGTTTTCGGCGGGTTCACCGCTGCGGCCTTG
+CAGGCCCGGATCGTCGACGCCCAAGCCAAGCTGCTGATCACCGCGGACGGGCAGTTTCGGCGCGGCAAGC
+CATCGCCCCTCAAGGCGGCCGCTGACGAGGCCCTTGCAGCGATCCCCGACTGCTCGGTCGAGCACGTTCT
+GGTGGTGCGGCGCACGGGAATTGAGATGGCCTGGAGCGAGGGCCGCGACCTGTGGTGGCACCATGTCGTC
+GGCTCAGCTTCACCGGCACACACCCCGGAGCCTTTCGATTCCGAGCACCCGCTGTTCCTGCTGTACACGT
+CAGGCACCACCGGCAAGCCCAAAGGCATTATGCACACCAGCGGCGGCTATCTCACTCAGTGTTGCTACAC
+GATGCGCACCATTTTCGATGTCAAGCCGGACAGCGACGTGTTCTGGTGCACCGCCGACATCGGCTGGGTC
+ACCGGCCACACCTACGGCGTCTACGGCCCGCTGTGCAACGGAGTCACCGAGGTTCTCTACGAGGGCACGC
+CGGATACCCCCGACCGACACCGGCATTTCCAGATCATCGAAAAATACGGCGTGACAATCTATTACACCGC
+CCCCACCCTCATCCGGATGTTTATGAAGTGGGGCCGTGAGATCCCCGACAGCCACGACCTGTCCAGCCTG
+CGGCTGCTGGGGTCGGTCGGCGAACCGATCAACCCCGAGGCTTGGCGTTGGTACCGCGATGTCATCGGCG
+GCGGACGCACCCCGCTGGTAGACACCTGGTGGCAGACCGAGACCGGCTCCGCGATGATCTCCCCGCTGCC
+CGGAATCGCTGCGGCCAAACCGGGTTCAGCGATGACGCCGCTGCCCGGGATCTCGGCCAAGATCGTCGAC
+GATCACGGTGATCCGTTGCCACCGCACACCGAGGGCGCCCAGCATGTTACCGGGTACCTCGTCCTAGACC
+AGCCGTGGCCGTCGATGTTGCGCGGCATCTGGGGCGACCCCGCGCGGTATTGGCACTCTTACTGGTCCAA
+ATTTTCCGACAAGGGCTACTACTTCGCCGGGGACGGCGCTCGCATAGACCCCGACGGCGCGATCTGGGTA
+CTAGGCCGCATCGACGACGTGATGAACGTGTCCGGGCACCGGATCTCGACCGCCGAGGTGGAATCGGCGC
+TGGTCGCTCACTCTGGCGTGGCCGAGGCGGCGGTGGTCGGGGTTACCGACGAGACCACGACCCAGGCCAT
+CTGTGCGTTCGTCGTGCTACGCGCCAACTACGCCCCCCATGACCGCACAGCCGAAGAGTTGCGCACCGAA
+GTGGCTCGAGTGATCTCGCCCATCGCACGGCCACGCGACGTCCACGTAGTGCCCGAACTACCCAAGACTC
+GTAGCGGCAAAATCATGCGTCGACTGCTGCGCGACGTCGCGGAAAACCGTGAGCTTGGCGACACGTCGAC
+GCTGCTCGATCCCACCGTATTCGACGCGATCCGGGCCGCCAAGTAGGTCGCGGCACGATCAACCGGGTCA
+GCCCAGCCAACTCAGGCCGGTACCGGGACGAATCCCGCGCCCGGCCGGTTCTTGGCGTTGATGTCGGCCA
+GGTCGGCGTTGATCGACATCACCACCGCCGGGGTGTGCAGCGGGATGTATTTGGTGATGCAACTCGGCAG
+ATTGTCGCTGAATGCGCCGTGGATCATCCCGACCAGCAGATTGTCGACGGTCACCGGCGCACCGGAGTCG
+CCCGGTCCGCCGCAGACCTGCATCACAAGGGTGCCCGGACTCTCCCCTGGCCCCCAGGTAACCCCGCACG
+AGTTACCGGTGGTGCGGCCCTGCTTGCAGGCGATCTGGCCGAACGACGGGTCCGGGCCAATGCCGTTGAT
+CGCAAACCCGTTGAAGACGGCCACCGGGGTCACCTTGGCCGGGTCGAACTTGATCACCGCGTAGTCCAGG
+CCGTCGTTGCCGGCGACCATGATGCCTACCGGGCCCGCGTTCTCGGCACCCTCAGCGGCGATCTGCGCGC
+CCGGGCCCCCACAGTGGGCGGAAGTGAAGCCGATGAGGTCACCGTTCTTGTCATGGCCGATGGTGGTTAG
+GGTGCACATGGTGTCCCCGTTGACGACGATGCCCGCACCACCGCCCAGCGGTAGCTTGTCGTCGGCTGCC
+GCGGTGTTCGCAGGTAGGCACACAACGGCCAAAAGCACGGCCGCGAATGCCGCGGCAAAGCGCCTGTGCG
+CCGTCTGCAACGCAATGCTCCCGTCATATCGTCAGACACTTGAGAACAGATCCGCCAGTTTAGACGATCG
+CACCGCAACATCGGCCTCTGTTCAAACGGCCGCACACGTCAAGACGTGGCTAACTCTGTCCCGCCGCCCT
+TGGTGTTGGCTGGCCTCGTATGGCACCGCACCGCATGGCAACATGAACCGCGATGCCAGCCGAACCGCTC
+GGCGACGATGCGGGCCGGATGACGGCCCGAGGAGGAGCCGAGCAATCGAACCGAGCTCGGCGACGATGCG
+GGCCGGATGACGGCCTAGGGTGGGGTACCGCCGCTGGCGAGGGCGAGCCGAGCAATCGAATCGAGAGGAC
+CGTCTGTGAGCAAGATCGATCGCAAGAACGGTGTGCCCAGCACGCTGACCACGATTCCGTTGGCCGACCC
+GCACGCCGGACCTGCTGAGCCGTCGATCGGTGACCTGATCAAAGACGCGACAACGCAGATGTCGACGCTG
+GTCCGAGCCGAGGTCGAGCTGGCCCGCGCCGAGATCACCCGGGACGTCAAGAAGGGACTGACCGGCAGTG
+TTTTCTTCATCTCCTCGCTGGTGGTCGGGTTCTACTCCACCTTCTTTTTCTTCTTTTTCGTCGCCGAACT
+GCTCGATACCTGGATCTGGCGCTGGGTGGCTTTCTTGCTCGTGTTCGCCATAATGGTCGTGGTCACCGCC
+GTGTTGGCCCTCTTGGGTTTCCTGAAAGTCCGGCGCATCCGGGGACCGCGGCAGACCATTGCGTCGGTCA
+AAGAGACGCGCACCGCACTTACCCCGGGCCATGACAAAACCCCTGTGACACCAAAACCCGTCACATCTGA
+TCGCGCGACGCCGGTTGACCCCTCGGGTTGGTAGATGGCGGCACCAGATCCGTCGATGACCCGCATCGCC
+GGGCCATGGCGTCATCTGGACGTGCACGCCAACGGCATCCGATTCCACGTCGTCGAGGCTGTGCCGTCCG
+GCCAGCCGGAGGGCCCGGATGCGGCTACGCCCCCCATGCAGCCGGCCCTGGCGAGGCCGCTGGTCATACT
+GCTCCATGGTTTCGGCTCGTTCTGGTGGTCCTGGCGTCATCAGTTGTGCGGCCTGACCGGGGCGCGGGTG
+GTCGCGGTCGATCTGCGCGGCTACGGCGGCAGCGACAAACCGCCCCGCGGGTACGACGGCTGGACGCTGG
+CCGGCGATACGGCCGGTCTCATCCGTGCGCTCGGGCACCCATCGGCGACGCTGGTCGGCCACGCCGATGG
+CGGACTGGCCTGCTGGACCACCGCGCTGCTGCATTCGCGGCTGGTGCGCGCCATAGCGCTGATCAGCTCA
+CCGCACCCCGCCGCGCTACGGCGATCCACGCTGACCCGGCGTGATCAGCGGCACGCACTGTTACCGACAT
+TGCTGCGTTACCAGCTGCCGATCTGGCCGGAGCGCTTGCTGACCCGCAACAACGCAGCGGAGATCGAGCG
+CCTCGTGCGCGCCCGTGGCTGCGCCAAATGGCTTGCATCCGAGGACTTCTCGCAAGCAATCGACCACCTT
+CGACAGGCGATCCAGATCCCGGCGGCGGCGCATTGCGCACTCGAGTACCAGCGCTGGGCGGTGCGCAGCC
+AGCTGCGCAGCGAAGGGCGGCGATTCATCAGGGCGATGACACAGCAACTGGGGATGCCGCTGCTGCACTT
+ACGAGGCGACGCCGACCCTTACGTGCTGGCCGACCCGGTAGAGCGCACCCAGCGCTACGCACCACACGGG
+CGGTACATATCCATTGCCGGCGCAGGACATTTCAGTCACGAAGAGGCGCCGGAGGAAGTCAACCGACATC
+TGATGCGTTTCCTCGAGCAGGTGCACCAGCTCAGCTGACGCAGGCCCCGGTGCCGACCGGTTGGGTAGCA
+CCGATTTTGGCAAGCTGCCCCGCCACCTCGCCGGCCGTCAGCACAAACCCAGTTTCGGCGTCGTCGACGG
+CTGCGCCGAACACCACACCGAGCACCTGACCGTTGAGGTCGATCAGGGGCCCACCCGAATCACCTTGCTC
+CACATCGGCTCTGATGGTGTACACGTCGCGGGTAACCGGCTCCGGGTCCCCGTAAATATCGGGGCCACTG
+AGTCTGATGGCCTCGCGAATCCTGGCGGGTGTGGCAGTGAAATTGCCGCCGCCGGGATAACCCAGCACCA
+CAACGTCGGCACCGGTTTTCGCCGGCTCCGCAGCGAAGACCAGCGGCGGCGGCGGCAAGTGCGGAACGGC
+CAGGATCGCTACGTCGACCGACGGGTCGTAGGACACCACCGTGGCCTCGAAGGGCTTGTCGCCGGCATAC
+ACCGTGACGTTGTTGGATCCGGCCACCACGTGCGCGTTGGTCATCACCCGATCGGGTGAGATCACGAAGC
+CGGTGCCCTCCAACACTTTCTGGCATCTGGGTGCCAGGCTGCGGATTTTGACGACACTTGGCTCGGTGGC
+CGCCACCACCGGATTGTTGACCAGCGCTGGGTCGGGTGAGGCCACTGGAATGACCGGCGTGCGGCTGAAC
+GGCTCCAAAACCGCGGGCAGGCCGGAGGTGTTCAGCAGGGCCGACAGCCGCTTGGGCACCGTCTTCAGCC
+AGGTGGGTGCCGCCTCGTTGACCCGGGCGAGCACCCGCGAACCCTTCACCGCGGCAGCCAGCTCGGGCTG
+CTCTTTCGACTGTGTCAGCGGCATCGCCAACAACCACGCCGCGGTGAGCACCACGACCAGCTGCACCCCT
+ACCCCAATGACCGAGTCGATCAACCGGATCGGCCGGTTACGGATCGCCCCGCGGACGGCGCGGCCCAGCA
+CCACACCAGCGACCTCGCCGACTACGACCAGTGCCAGGATCAGGAACAGCGCGGCAAACAGTTTGGCCCG
+CGGAGCGCTGATTTGACTGACGATATGCGGCGCCAGCAGCACGCCGGCTGTCGCGCCCAGCAGCACCCCG
+CCAAACGACAGCATTGAGCCCAGCGCACCGGCACGCCAGCCGGAGATGGCTGCAATAAATGCGACCGCCA
+AGACGGCGATATCCAGCCACTGCGACGGGGTCATCGAATTCATCGCGGGTCACTCTCGTCGTCGATCAGC
+ACCATTGCCGCGTCCAACTCGCGGATGTCACCGGTGTCCCAGGGTTGTGCCCAGCCCGCGACATCGAGCA
+CCGCGGAAATCACCTGGCCAGTGAAGCCCCATACCAGCATCTGGTTTAACAGGAACGCCGGCCCGGCCCA
+GCGACGAGTGTGCGGGCGGCGGTACACCATGAGCCGATTGGCCGGATTGATGAAGGCGCGCACCGGTACC
+CGCGCGACGATCGCCGTTTCGGCCTCGTTGACGACGGCCACCGGCCCGGGATCCGGCGAGTACGCCAGCA
+CCGGGACAACATGGAACCGCGACGGCGCAATGAACGTCCGCTCCATGGTGGCCAGCGGATGCAGCCTGGA
+CGGGTCAATCCCGGTTTCTTCGTTCGCCTCACGCAAGGCGGTGGCCACCGGCCCGTCGTCGGCGGGGTCG
+ACCACACCGCCGGGAAAAGCCGCCTGGCCGGCATGGTGGCGCAATGTCGAGGCCCGCACGGTCAGCAGTA
+GGTCGGCGTCGTCTGGGACACCACCGTCGCCTGGCCCGGCCTCCGGGCCAGAAAACAGCACCAGAACGGC
+CGCCTCGCGGTGATCCCGGCGCGACGATGTCATTGCCGACACAGCCCCGGCGGCCGTCACCATCGCTAGC
+ACATCGGCGGGCAACCGACGCCGGTAGGCGTCGGGTATCTGGCCAACGTTGTCGACCAGTGGACGCAGCC
+AGGACGGGCCGGCATCAGGCCGCAGGGCAACCGTCCCCCGTGAACCGGTGGGGGTCGCTCCCGCTTGCAG
+GGGGGTACCCCCAGCACTCATCGGCGCCTCCTTTGGGTCCAAAGTTGCCCAGCTCCTCTTCAAGCCGCTA
+ACCCGGCCCACATCACCGCCGAGTGGAGCCCACCTGCTCAGAGCAGGCCGGACCGGCTACGCGGCCCGCA
+CCGCAACCGTACTCATCCCGCGTCGTTCCCGACCGCAGCCACGATCTCGTCGGCACTGCCGAAAGCCCGC
+GGCAGGGTCTGGGCAACGCTACCGTCCGGCCGCAGAACCACCGTCGCGGGCATCACATTTGCGACCCGCA
+GCGCGGCCGCCACCCTGCGGCGGTCATCCTGCAGCGTCGGCAACCGGACGCCGAGATCGGCCAGCCGCGA
+CAGCGCGGCCGCCTCGTTCTGGCCCTGATGCACCGTCACGACCAGCACGGCGGGCCCGACCCGTCGTTGA
+TATTCGGCCATCACGGGCAGCTCGGTCATGCACGGCGCGCACCAATGCGCCCACAGATTGATGACCACCC
+GACGTCCGGCCAGCGCGCGGGCGACGTCGACGGCCGAACCGTCGCCCGCACACACCACCACAACACCGCG
+TAGTGCCGCCGCGCCCGGACCGTTACCTGCCGCGGGACAGGGCGGCAGGTTTGCGCGCTGCCGGGACCAA
+GCCAATGCTTCCGGGGTATCGCCGTCGCGATGTTCGCGCGGGGCGGGCCGCTGGCTGATCGTGCTCGAGG
+CGGAATAGTCATGCAGTTGGGCAACCAGCGCCGCCATCAGCGCTGCCACCACCGCCAGGATCGCGATGGT
+CCAGCGGGTCTTTCCGGTTAACGTCGTCATTGCGGTCTCAGCGGGGGTTGTTGGCAGGCTTGGCATTACA
+GTCCAGCCAGGGCCAGCAGGTGATCGGTCTCGGGGCCCTGGACCAGGGGCGCCGCGAGCAGCGGTTCAGT
+GGGGCCAAGCCCGAAGGAGGGGCAGTCTTTGGCAAGCACACAAACACCACACGCCGGTCTGCGGGCGTGG
+CACACCCGCCGTCCGTGAAAGATCACTCGGTGGCTGAGCAAGGTCCACTCCTTGCGTTCGATCAGCTCAC
+CGACCGCCTGCTCCACCTTGACCGGGTCCTCTGCGGTGGTCCAGCGCCACCGGCGCACCAATCGTCCGAA
+ATGAGTATCCACCGTGATTCCGGGGATACCGAATGCGTTACCCAGGATGACATTGGCGGTTTTGCGCCCC
+ACCCCGGGCAGCGTCACCAACTTGTCCATGGTGGCCGGCACCTCACCGCCAAACCGCTCAACTAGGGCCT
+GCCCCAGGCCGATGAGAGAGGCCGCTTTGTTGCGGTAGAAGCCGGTGGGGCGGATGAGGCTCTCGAGCTC
+GGTGCGATCCGCCTGGGCGTAGTCCCGTGCCGTCCGATACCGCGCGAACAAGGCTGGCGTCGTCAAATTC
+ACCCGTTTGTCGGTGCTCTGCGCCGAAAGTATGGTTGCCACGGCTAGCTCGAGCGGCGTGGTGAAGTCCA
+GCTCGCAGTATACGTGCGGAAATGCCTGTGCCAAAGCGCGATTCATTCGCCGCGCCCGTCGCACCAAGGC
+GAGCCGGGTTTCTGCAGACCAGCGCCCGGGCACGTCGGCGGCACGCGCCGCTGGCTTCGATCTGGATGAC
+TTCGCCGCTGTCACCTACGACAGAGTACTGATTTCGTGATCTCACTGAGACCTCGTGTTGATTCGAAGCC
+ATGTTTACTCTCCTTGTGTCATGGTTGCTCGTGGCCTGCGTTCCTGGGTTGTTGATGCTGGCGACCCTCG
+GGTTGGGACGGCTGGAAAGGTTTCTGGCCCGAGACACGGTCACGGCGACCGACGTCGCGGAGTTTCTCGA
+GCAGGCCGAGGCCGTGGATGTGCATACGCTCGCTCGGAATGGAATGCCGGAGGCGCTGGATTACCTGCAT
+CGACGTCAAGCCCGGCGAATCACCGATTCACCGCCGCTTGGGTCTGGCGCTGGGCCACGGTATGCCGGGC
+CGCTGTTTGTCACCGATCTCGATAGCCCCGTCGAGCCACCCCGGCATGGCCAGCCCAATCCGCAGTTTAG
+AACGGCTCGACACGCAAATCACGTGTAGCGTTGGCACGGCGAACCGGTTGGCCTACCTCTAGACTCTTCT
+CGTTGGCAAACGGTTAGTGTGCCCGTATCACTTCGTCGGAAAGTTGAAGAGGCAACGTGGACGAGATCCT
+GGCCAGGGCAGGAATCTTCCAAGGCGTGGAGCCCAGCGCAATCGCCGCACTGACGAAACAGCTGCAGCCC
+GTCGACTTCCCCCGTGGACACACGGTCTTCGCGGAAGGGGAGCCGGGCGATCGGCTGTACATCATCATCT
+CGGGGAAGGTCAAGATCGGTCGCCGGGCACCAGACGGCCGAGAAAACCTGCTAACCATCATGGGCCCGTC
+GGACATGTTCGGCGAGTTGTCGATCTTCGACCCGGGTCCGCGCACGTCCAGCGCGACCACGATCACCGAG
+GTGCGGGCGGTGTCGATGGACCGCGACGCGCTGCGGTCATGGATCGCCGATCGTCCCGAAATCTCCGAAC
+AGCTGCTGCGGGTGCTGGCCCGCCGGCTGCGCCGCACCAACAACAACCTGGCCGACCTCATCTTCACCGA
+TGTGCCCGGTCGGGTGGCCAAGCAGCTGTTGCAGCTCGCCCAGCGTTTCGGCACCCAGGAAGGTGGCGCA
+TTGCGGGTCACCCACGACCTGACACAGGAAGAAATCGCCCAGCTGGTCGGGGCCTCACGCGAGACGGTGA
+ACAAGGCACTGGCTGATTTCGCTCACCGCGGCTGGATCCGCCTTGAGGGCAAGAGTGTGCTGATCTCTGA
+CTCCGAAAGACTGGCCCGCCGAGCGAGGTAAGCGCGCGCAGCGCGGGCGCAACCGAGCGAGCTAGCTTCC
+TCACGCCCAGCAGACACAGAGTCGCACGCAAACGACGGATTTTGTGCGATTGTGCGGCTGCTCGCGCTAC
+CGAGTCCGCAGATAGTCCAGTTGTGCCTGCACCGACCATTCGGCCGCATTCCAAAGCTTTTCGTCAACGT
+CGAGGTAGACGTGTTCGACGACCTCGCGGACCGTGGCGTCGTCACCGAGATCCCGCAACGCGGCGCGTAT
+CTGCTCCAGACGTTCGTGCCGGTGCAGCAGGTATCCCGATGCAATCGCTTCCAGGTCGAGCAAGTCCGGC
+CCGTGCCCCGGCAGCACGGTCCGCCGGCCCAGGCCACGCAGCCGGTGCAGCGATTCCAAGTAGTCGGCTA
+GGCTGCCGTCTTCCTTGTCGATGACGGTGGTCCCGCAACCCAACACGGTGTCGGCGGTCAACACGGCGTC
+GTCGAGGACAAATGACAGCGAATCTGCGGTGTGGCCAGGGGTGGCCAACACGGTAATGGTTAACCCGGCA
+ACGTCGATCACTTCCCCGTCGGTCAGCGTCTCCCCATCACGTCGCAAGAACTGCGGATCCGCGGCCCGTA
+CCGGCGCCCCGGTCAGCGCGACCAGTTTGTCGATGCCGCTGGTGTGGTCGCCATGACGATGACTGATCAG
+TACCAACGCGATGCGGCCAAGCGCGGCAACCCGTGCCAGGTGCTCGTCGTCGTCCGGGCCTGGATCGACA
+ACGACCAGCTCGTCACTGAGCGGGCCGCGCAGCACCCAGGTGTTGGTGCCGTCCAACGTCAGCAAACCGG
+GGTTGTCGGCCAACAGGACCGACGCGGTGTCGGTGACCGCGCGCAGCTGGCCGTAGGCGGGATGGGTCAG
+CGACTCAGCTGTCTTCGACATCGGCCGCTAGCCGACCTCCACGATCAACTCGACTTCCACCGGCGCATCC
+AACGGTAGCTCGGATACGCCGACCGCCGAACGCGCATGCGCGCCGCTATCGCCGAACACCTCGGCCAGCA
+GATCGGAGGCCCCGTTGATCACGCTCGGCTGGCCGTGAAACCCCGGTGCCGAAGCGACAAACCCGACGAC
+TTTGACCACCCGGGTCACCGCGTCGAGATCCACCAGCGAATCAACGGCTGCCAGCGCATTGAGCGCGCAG
+ATCCGCGCGAGCGTCTTGCCCTCCTCCGGGTTGACGTCGGCGCCGAGCTTGCCGGTCCGCACCAGCTTGC
+CTGCCTCCAACGGCAGCTGGCCCGCGGTGTAGACCAGGTTGCCGGTGCGCACAGCTGGAACGTAGGCCGC
+CAGCGGCGCCGCCACTTGCGGTAGCGTGACACCGAGTTGCCCTAATCGGGCTTTAGCGCTCATTAACCCC
+GATACCTCCTACTTCGGGCGCTTCAGGTAAGCGACGTGCTGCTCACCGGTGGGCCCGGGCAGCACCGCCA
+CCAGCTCCCAGCCATCGGCTCCCCACTGGTCGAGGATCTGTTTGGTGGCGTGCGTCAACAGCGGGACCGT
+GGCGTACTCCCATGCGGTGGGTTGGGTCATGACGCGAGCTTATCGGTCGGACTGGACCCGCTCCGCTCAG
+CCCGGTAGCCCGGAAAGATCGCCAGGCCATCGGGCTAGCATGCCATGGTGGCAACCACATCTAGCGGCGG
+TAGTTCCGTCGGCTGGCCGTCACGCTTGTCGGGGGTCCGACTGCACCTTGTCACCGGCAAAGGCGGTACC
+GGGAAGTCGACGATCGCGGCCGCGCTCGCGCTGACGCTGGCAGCGGGCGGCCGCAAAGTCCTACTCGTCG
+AAGTCGAGGGGCGCCAGGGGATTGCGCAACTCTTCGACGTCCCGCCACTGCCCTACCAGGAACTTAAGAT
+CGCGACCGCCGAGCGCGGCGGCCAGGTCAACGCCTTGGCAATCGACATCGAGGCCGCCTTCCTGGAATAC
+CTCGACATGTTTTACAACCTCGGTATCGCAGGCCGGGCCATGCGCCGTATCGGCGCGGTCGAGTTCGCGA
+CGACGATCGCGCCCGGTCTGCGCGACGTGCTGCTCACCGGCAAGATCAAGGAGACGGTGGTGCGCCTCGA
+CAAGAACAAGCTGCCGGTCTATGACGCAATCGTCGTCGATGCGCCTCCGACCGGGCGCATCGCGCGCTTC
+CTGGATGTCACCAAGGCGGTGTCCGATCTGGCCAAGGGCGGACCGGTGCATGCGCAAAGCGAAGGCGTGG
+TGAAGTTACTGCACTCCAACCAGACCGCCATCCATTTGGTCACTCTGTTAGAAGCGCTGCCGGTGCAGGA
+GACACTGGAAGCCATCGAGGAGCTTGCGCAGATGGAACTGCCGATCGGCAGTGTGATCGTGAACCGCAAC
+ATCCCCGCCCATTTGGAGCCTCAGGACTTGGCGAAGGCCGCCGAGGGCGAGGTCGATGCAGACTCGGTGC
+GGGCCGGGTTGTTGACGGCCGGGGTCAAGCTTCCCGACGCCGATTTCGCCGGCCTGCTTACCGAGACCAT
+CCAGCATGCCACCCGAATCACCGCACGCGCCGAAATCGCACAACAGCTTGACGCCTTGCAGGTTCCGCGA
+TTGGAATTGCCGACGGTCTCTGACGGCGTCGACCTTGGCAGCCTCTACGAGCTCTCGGAATCACTTGCCC
+AGCAGGGGGTTCGATGAGTGTCACACCGAAGACCCTCGATATGGGCGCAATCCTGGCCGACACATCCAAC
+CGGGTGGTTGTGTGCTGCGGCGCCGGTGGGGTCGGCAAGACCACTACCGCGGCCGCGCTGGCGTTGCGCG
+CGGCCGAGTATGGCCGCACTGTGGTCGTTTTGACGATTGACCCAGCCAAGCGATTGGCACAAGCACTGGG
+GATCAACGATCTTGGCAACACACCACAACGCGTGCCATTGGCACCCGAGGTTCCCGGCGAGCTACACGCG
+ATGATGCTCGACATGCGCCGCACGTTTGACGAAATGGTTATGCAATACTCTGGACCCGAACGGGCGCAAT
+CGATTCTGGACAACCAGTTCTATCAGACCGTCGCCACATCGCTTGCCGGCACCCAAGAGTACATGGCTAT
+GGAGAAGCTGGGCCAACTGCTAAGCCAGGACCGCTGGGACCTGATTGTGGTAGACACTCCGCCGTCGCGT
+AACGCGCTGGACTTCTTAGACGCGCCAAAGCGACTGGGCAGCTTCATGGATAGTCGGCTGTGGAGGCTGT
+TACTCGCTCCCGGCCGGGGCATCGGGCGGCTGATCACCGGCGTGATGGGATTGGCCATGAAGGCGTTGTC
+CACCGTGCTCGGTTCCCAGATGCTGGCCGACGCAGCAGCGTTCGTTCAATCGCTGGACGCCACGTTCGGT
+GGTTTCCGCGAGAAGGCAGACCGCACTTACGCGTTGTTGAAACGGCGCGGCACCCAGTTCGTGGTGGTGT
+CGGCGGCCGAACCCGACGCACTGCGCGAGGCGTCCTTCTTCGTCGACCGGCTATCGCAGGAGAGCATGCC
+GCTAGCGGGGCTGGTCTTCAACCGCACGCACCCGATGCTGTGCGCATTGCCGATCGAGCGGGCAATCGAC
+GCCGCCGAAACGTTGGATGCCGAGACCACCGACTCCGACGCCACATCGCTGGCCGCAGCGGTGCTGCGTA
+TCCATGCCGAGCGCGGGCAGACAGCCAAACGGGAGATCCGGCTGCTGTCCCGGTTCACCGGAGCCAACCC
+CACCGTGCCGGTCGTTGGGGTACCGTCGCTCCCGTTTGACGTCTCTGACCTGGAAGCGCTGCGGGCGCTC
+GCCGACCAGCTCACCACGGTCGGCAACGATGCGGGCCGCGCAGCGGGCCGCTGAGGAACCGGCCCATCAG
+TGACGGTCGGCGACGATGCGGGCCGCGCAGCGGGCCGCTGAGGAACCGGCCCATCAGTGACGGTCGGCGA
+CGATGCGGGCCGTACAACATCTGACCGGGATCCGGCTATTGGGCACAAGCCAGTTCCTATTGGGCACAAG
+CCAATTAGAAATGAATGGCTTTTGCTGTAACCAAACCGTAATCAGAAGCGACGGGACCGCGGCACCTATC
+CGCAGTCCCTGAGTGGCTATCCGGCGGTGCCGGTGCGGCGCTTGCGCTTCTCAAGGTAGTCCGACCACGA
+AACCACCTCGGGATGTTGCTTGAGCAGAGCCCTGCGCTGGCGCTCGGTCATGCCACCCCAAACACCGAAC
+TCGACCTTGTTGTCCAGCGCATCTGCCGCACACTCTTGCATTACCGGACAGTGACGGCAGATCACCGCGG
+CCTTGCGTTGTGCGGCTCCTCGAACAAAGAGTTCGTCAGGGTCGGTAGTCCGGCACAGCGCCTTGGATAC
+CCACGCGATCCGCTCTTCCGCGTCTACGCTGCGTACCACGTTCTGTGCAGCCGTGAGGTTAGTCCTTCGA
+GCGGCTGGACGGGTTCCTGACACGAGCTGATCCCTTCCTCCCGGCCGCCGTGTGCGACCGCCCTCCTCGG
+AAACAGCCGATGCTGCGAGCGACGCCACACCATGCACATCGGTGTTACCTGTATCTCACTGATCTGTATA
+AGTTAGGTGGTCGTGTGCCAATTGCGCAACAGTACGATAACGCTTTTTTGGGACGAGCGTGCCGTCTTGT
+CTGGATCGGCCGGGGGAAATGCCGCCGCTTCGGTCCCGTTTACGGGGTCTGACCAGTGACGCAGCCGCAA
+ATATCGCGCCCGCCCCGATCCCGCAGTGACTCACCCGCCCGCGGAAAGATTCTATTGGACCGAGCGGCAC
+GGTGGAGTGACAGGAGGTCGCTACTGTAGTACGCATGCCCGAGCGCCTCCCGGCCGCGATCACCGTTCTG
+AAGCTGGCTGGGTGCTGTCTGTTGGCCAGTGTCGTCGCCACTGCGCTGACGTTCCCGTTCGCAGGCGGGC
+TAGGGCTGATGTCCAATCGTGCCTCTGAGGTCGTTGCCAACGGCTCGGCCCAGCTGCTCGAGGGGCAAGT
+GCCTGCGGTATCGACGATGGTCGACGCGAAGGGCAACACGATCGCGTGGCTGTACTCGCAGCGCCGGTTC
+GAGGTGCCCTCGGACAAGATCGCCAACACGATGAAGCTGGCGATCGTCTCGATTGAAGATAAGCGGTTCG
+CCGACCACAGCGGCGTGGACTGGAAGGGCACCCTGACCGGCCTGGCGGGCTACGCGTCCGGCGACCTCGA
+CACGCGCGGCGGCTCGACGCTCGAACAACAGTACGTGAAGAACTACCAACTGCTGGTGACAGCCCAAACC
+GATGCCGAGAAGCGAGCGGCCGTCGAAACCACTCCGGCCCGCAAGCTTCGCGAGATCCGGATGGCACTCA
+CGCTGGACAAGACCTTCACAAAATCTGAAATCCTGACCCGATACTTGAACCTGGTCTCGTTCGGCAATAA
+CTCGTTCGGCGTGCAGGACGCGGCGCAAACGTACTTCGGCATCAACGCGTCCGACCTGAATTGGCAGCAA
+GCGGCGCTGCTGGCCGGCATGGTGCAATCGACCAGCACGCTCAACCCGTACACCAACCCCGACGGCGCGC
+TGGCCCGGCGGAACGTGGTCCTCGACACCATGATCGAGAACCTTCCCGGGGAGGCGGAGGCGTTGCGTGC
+CGCCAAGGCCGAGCCGCTGGGGGTACTGCCGCAGCCCAATGAGTTGCCGCGCGGCTGCATCGCGGCCGGC
+GACCGCGCATTCTTCTGCGACTACGTCCAGGAGTACCTGTCTCGGGCCGGGATCAGCAAGGAGCAGGTCG
+CCACGGGCGGGTACCTGATCCGCACCACCCTGGACCCAGAGGTGCAGGCACCGGTCAAGGCCGCCATCGA
+CAAGTACGCCAGCCCGAACCTGGCCGGTATTTCCAGCGTGATGAGCGTGATCAAACCGGGTAAGGATGCG
+CACAAGGTGTTGGCCATGGCCAGTAACCGCAAATACGGGCTGGATCTAGAAGCCGGCGAAACCATGCGGC
+CGCAGCCATTCTCCCTGGTTGGCGACGGCGCCGGGTCTATCTTCAAGATCTTCACCACGGCCGCTGCTCT
+GGACATGGGCATGGGTATTAACGCCCAACTCGACGTGCCGCCCCGATTCCAGGCCAAAGGTCTGGGAAGT
+GGCGGGGCAAAGGGGTGCCCCAAAGAGACCTGGTGTGTGGTGAACGCCGGCAACTACCGCGGCTCGATGA
+ATGTCACCGACGCGCTGGCAACCTCGCCAAACACCGCGTTCGCCAAGCTGATCTCGCAGGTCGGGGTGGG
+GCGTGCGGTCGATATGGCCATCAAACTCGGGCTGAGGTCTTATGCGAATCCCGGCACCGCACGCGACTAC
+AACCCCGACAGCAATGAGAGCTTGGCTGACTTCGTCAAACGACAGAACCTGGGTTCGTTCACCCTCGGCC
+CCATCGAGTTAAACGCGCTGGAGCTGTCCAACGTGGCGGCCACGTTGGCATCCGGCGGCGTGTGGTGCCC
+CCCCAACCCAATCGACCAGCTCATCGACCGCAACGGCAACGAAGTCGCGGTCACCACCGAGACGTGCGAC
+CAGGTGGTGCCCGCAGGGCTGGCGAACACCCTCGCCAACGCGATGAGCAAGGACGCCGTGGGCAGCGGCA
+CGGCGGCCGGTTCGGCCGGCGCGGCGGGCTGGGATCTGCCGATGTCCGGCAAAACCGGCACCACCGAGGC
+GCACCGGTCGGCCGGCTTCGTGGGCTTCACCAACCGCTACGCGGCGGCGAACTACATCTACGACGACTCC
+AGCTCGCCGACAGATCTGTGTTCCGGCCCGCTGCGCCATTGCGGCAGCGGCGACTTGTACGGCGGCAACG
+AGCCATCCCGCACCTGGTTCGCCGCGATGAAGCCGATCGCCAACAACTTCGGCGAAGTGCAGCTACCACC
+GACCGATCCACGCTATGTCGACGGCGCACCAGGCTCACGGGTACCAAGCGTGGCCGGTCTGGATGTCGAC
+GCCGCACGCCAGCGCCTCAAGGACGCGGGCTTCCAGGTCGCCGACCAAACCAACTCGGTCAACAGCTCCG
+CCAAGTATGGTGAGGTGGTCGGAACGTCGCCCAGCGGTCAAACAATTCCGGGTTCGATCGTCACGATCCA
+GATCAGCAACGGCATCCCGCCGGCTCCGCCTCCGCCACCGCTGCCTGAGGATGGTGGGCCGCCACCGCCG
+GTCGGATCGCAGGTGGTGGAGATTCCGGGGCTGCCGCCGATCACCATTCCGCTGCTGGCGCCACCACCCC
+CAGCGCCTCCCCCGTAGGCCCTCCCAATCGGCCTCGTGCCGCTGCAGACGCGCGATCAGACCTCGACCGG
+CAGTAGGCTGCGTGCATGGCTGCTGTCTTGCCCACCTTGATCCGCACCGGCGCCGTGGCGTTGGGCTCGG
+CCATCGCCGGGATTGGTTACGCTGCGCTGGTCGAGCGCAATGCATTCGTCCTGCGCGAGGTGACCATGCC
+AGTCTTGACTCCGGGCTCCACACCGCTGCGGGTGCTGCACATCAGCGATCTGCATATGCTGCCCAACCAG
+CACCGCAAACAGGCCTGGCTGCGCGAGCTCGCCAGCTGGGAGCCGGATCTGGTCGTCAACACCGGTGACA
+ACCTGGCTCACCCCAAGGCGGTGCCCGCCGTCGTCCAAACCCTGAGCGATCTGCTGTCCCGGCCGGGTGT
+CTTCGTGTTCGGCAGCAACGACTACTTTGGGCCGCGCCTGAAGAACCCAATGAACTATCTGACCAGCCCG
+GATCACCGCGTCCGCGGAGCAGCGCTGCCCTGGCAGGATCTGCGGGCGGCGTTCACCGAACGTGGGTGGC
+TCGACCTAACCCATACCCGCCGCGAGTTCGAAGTTGCCGGTCTGCACATCGCCGCTGCGGGCGTCGACGA
+CCCGCATATCGACCGAGACCGCTACGACACCATCGCCGGCCCGGCCAGCCCGGCCGCCAACCTGCGGCTG
+GGGCTCACCCATTCACCGGAGCCGCGGGTGTTGGACCGCTTCGCCGCCGATGGTTACCAGTTGGTGCTGG
+CCGGCCACACCCACGGCGGGCAGCTGTGCCTGCCGTTGTACGGGGCGCTGGTCACTAACTGCGGTCTGGA
+CCGCTCCCGGGCCAAAGGAGCGTCACACTGGGGTGCAAACATGCGGCTGCACGTCTCCGCCGGGATCGGC
+ACTTCGCCGTTTGCGCCGGTGAGATTCTGCTGCCGGCCCGAAGCAACCCTGCTGACGTTGATCGCGACCC
+CAATGGGCGGGCGCGATTCGAGCAGCAACCTGGGCCGCTCACAGCCGACAGTGTCGGTGCGTTGAGCGGC
+GGGGCCTGTATCGCGGTCCGCAGCCTATCCCGGAGCTGGACGGACAACGCGATCCGGTTGATCGAGGCGG
+ACGCCCGCCGTAGCGCCGACACCCACCTGCTGCGCTACCCACTGCCCGCTGCCTGGTGCACGGATGTCGA
+CGTCGAGCTGTACCTCAAGGACGAGACGACCCATATCACCGGCAGTCTCAAACACCGGTTGGCACGTTCG
+TTGTTCCTCTATGCGCTATGCAACGGCTGGATCAACGAGAACACCACGGTGGTGGAGGCATCGTCGGGTT
+CAACGGCGGTGTCCGAGGCCTATTTCGCGGCGCTGCTGGGTCTGCCGTTCATCGCCGTGATGCCGGCCGC
+GACCAGCGCTTCCAAAATCGCGTTGATCGAATCACAAGGTGGCCGTTGTCATTTCGTCCAGAATTCAAGT
+CAAGTGTACGCCGAGGCGGAGCGCGTCGCCAAGGAAACCGGCGGCCACTATCTGGACCAGTTCACCAACG
+CGGAGCGCGCAACCGACTGGCGCGGCAACAACAACATCGCCGAGTCGATCTACGTGCAAATGCGCGAAGA
+GAAGCACCCCACCCCGGAATGGATCGTCGTGGGTGCGGGCACCGGCGGAACCAGCGCGACGATCGGCCGC
+TACATCCGCTACCGACGGCACGCGACCCGGCTGTGCGTCGTCGATCCGGAGAATTCCGCGTTCTTCCCCG
+CGTACTCCGAAGGCCGGTACGACATCGTCATGCCCACATCGTCCCGTATCGAGGGCATCGGCCGGCCGCG
+GGTCGAGCCGTCGTTTCTGCCCGGTGTGGTCGACCGCATGGTGGCGGTCCCCGACGCGGCGTCGATCGCT
+GCCGCCCGGCATGTCAGCGCCGTTCTGGGGCGCCGAGTGGGACCGTCTACCGGCACCAACCTCTGGGGCG
+CGTTCGGACTGCTCGCCGAGATGGTCAAGCAGGGCCGCAGCGGCTCGGTGGTCACACTGCTCGCCGACAG
+CGGCGATCGCTACGCCGACACCTACTTTTCCGACGAGTGGGTCAGTGCCCAGGGGCTCGATCCGGCCGGG
+CCGGCTGCGGCGCTGGTGGAATTCGAGCGCTCCTGTCGATGGACGTGACGGTCGGACCTGCGGTTTGGCT
+AGTCAACGGTCCGGTGCGATAGGCTGTCGTGGCTTCAAGCGGGGTGTGGCGCAGCTTGGTAGCGCGCTTC
+GTTCGGGACGAAGAGGCCGTGGGTTCAAATCCCGCCACCCCGACCGAGAGATCGCTGACGACAGCCTTAC
+CCGGCGCAGCGTGGTAGCTTGCTGCAGTCTGCTCGGGCGGCAGCGCCACCCTGACGGTGCTGGTTGACCA
+TGCCGGACAGCACGTCAACGCACAGGCATTTCCAACGGAAGTTGTAGGTTACCGGCCGCCCTAAAACACG
+GTGCACTTTTCGTTAAAGGTTGTGGGTGTGGATCCAACGAAATTCGTTGCCCCGGCGTGGGCAGCGCCGT
+GTCCACAGGGGGACCCGCCGCGCATTACGCCTATGGGCCCACCCCCGTACCGCGGGAGTTGGCTCTGCAC
+CCCGAGCCAATCATGCTTCTCTCGGAGTCCGACGCGGGACTGGGACGACTCGCATGAGCCGGACGCCTCC
+TGCCTGACCCCCACCTGCTAGGAACGTAAACCGGGAGAGTTTCGTCGGAGCCAGAATTGGATTTCCTCCC
+CGAGCAATCGGCCCGAAACCGCGGGGTTGTTTCCGCCGACCGTCGACAACATGTGGCGTGCGTTGGATGA
+CTGGGAAATGTATCTCCACGACGCAGCGCCACAACTGCCGCTCTTGATCCGTTGCGCCCTGGTGCATTAC
+CAATTCGAGGCGATCGGGCCATTTCTCGACGGCAACGCACGACTCGGGCGTCTGTTCATCATCCTTTGCC
+TTGTTGCATTGGGACGGTTGCCGCTAACGGGCGGGGCGAAACCGCACCCGAGTGCCGCGGCGGGGCACAA
+GCATGATGGAGCGCCGCACGATCCGCTCTGGCTCGTCGTCGACGGCGGTGAACTCGCCCTCGCGCAGCAG
+CACGTGCAATACGGTGATCAACTCTCGCATCGAAAAGTTCGCACCCAGACAGCGTTTCACGCCGCCGCCG
+AACGGAACCCAGGCATAGGTTTGCGGCCGCGTACCGAGGAACCGCTCGGGGCGGAACTCGTGTGGGTGCT
+CATACACCTCGGCGCTGCGGTTGATCGCGATGATGTGGACCACGATTCGTGTGCCAGCCTCCACACGGTA
+ACCGCCGATGGTTAGTGGTTGCGCGGCGACACGAGCCGTCAACGGCGCGGGCGGACGCACCCGCAACGTC
+TCGTTGATCACCGCCGTCGTGAAGGCTTCCCCACCGCCAACGGCCTCCGCTCGCACGCGCCGCAACGCGT
+CCGGATGGTGCAGCAGCAAGTCGAACGCCCACGCCAACGTGGTCGCCGTGGTTTCATGCCCCGCCAGCAC
+GAGGGTGATCAGATCGTCGCGGATCTCGCTGTCTGACAACTGTTCCCCGGACTCTCCGCGCGCGCTCACG
+AGCAACGACAGGACGTCGTGTCGCTCGCCCAGGCGTGGATCGGCGCGCCGCTGCGCAATGAGCGCCATGA
+CGACGTCGTCGATCTCGGTGTTGGCGCGGGCGCGTGCAGGCCAGACTCGTAGTGCGCCCAACCGACGCAG
+TGCGTAGCGCACGGTCAACTGCTCTGAAACACCAAGATTCAACAGCCGCTCGAACGGCCGGCCCAAGCGC
+CGGACCTCCTCGGGGTCGTCGACCCCGAATATGACCTTGACGATCACATCCAGCATCAGCGACCGCGCCA
+CCGTCAACATCGCAAACGGACGGTCAACCGGCCATGTATGCATCGCCGCGCGAGTGGAGTTCTCGATAAT
+CGGAACGTAACGATCCAGCGCAGCGCCATGTAATGGCGGCGTCAAGAGTTTTCGACGTCGAAGATGCTGC
+GGCTCCTCCTGGACAAACATCGACCCCGACCCATAGATCGCCGCTGCCGGCCCCACCCCCTCGCCCCCGA
+GCAGGACGTCGGTGGGAGCGGTGAAAACCTCCTTGGCCAGCGCCGAGTCGGACACGATCGCAACGTCACC
+CAGGCTGAGAATGGGCATCGTCATGATCGGTCCGTACCGACGGATCAGTCGCAGCATCCGGCGCTCGCCA
+CCCGCCAGGTAGGCAACCGCGTAGGCGGCCGCGAAGGCCGCGCGAAATCCACGGGGCGCCGGCAAGCCCG
+GTGGGCCGCCCAAAGCATCCGGCGCGTGCTCCCGGCGAACCGCAAACGCTGCCACGCCTACGACAGAAGC
+ACAGCGTTTCGGGTCGGTCAACGCAGCAGGGCTAGCAAGCGACCTCAGCACCATCGGTTCCCGAAGGTGC
+GGTCCGGCGCTACCGCGTCGAAAATCGCAGACCGCGCCAGCCGGTTGGGAATGAGGCCGTTTCACCGGCG
+GGCGTCCCGCGCAGCGTTTCGCCGCAGACCCTATGTTGGCCATGCGCGATATAGGCCACCCGGCACCAAG
+GTGCCATGACCGCCACAACCAGGGCCGCGGCGGCAACCGCCAGGTGTCCGATCGTCAGCGCAACTAAACC
+CGCAACCAGCCCGACAGCCCACACGGCAGCCACCACCAGCCCCGGCACATTGACACTCGCGGGGACGCTG
+CCGCTACCGCTTGGCTGCGGCGCGGATGCATGATCACCGGCGTCACTCCCGGTGTAGACCATGACCACTC
+CCAGCGATAAAAGGTTGCCGATCAAGGTAACCCATACAGGCCGTCGGCAGCCACCGGCGAACAGCTCTTC
+GAGGATGCCGTCAGGACATTGACAGCTACCAGACACCATTTCCACACCGTCAAAATGTGGCGCGTGACAC
+GCACGGCGGCACGCTGGCAACGTGGCGTGCGCCGCAGGCCTCGACTATCTGGTGCCGATCACAGCATGCA
+TGCTCGTCGGTTTGTACGGCGTTACCGGTCGATCCTGCCGCCCCGTACCCCAGTCAAGGCATCGTGGAGC
+GTGGAAAACAACCGAAAGGTCTTGTCCAGACCCATCAGATGAATCGGCCTTCTGGTTACCGAACCCCGTG
+CAACCACCCCGAACTTGACGGATTGGCCTATCTTTTCGGATGTTGCCGCCAAAATCTTCAGCCCCACCGA
+CCCCAGAAACTCCACCGCGGAAAGGTCGATGACTAGCGCCGTCGGATTGTCGGCCACAACTTCGCCGATG
+GCCTCTTAAAGTGCCGCAGCGGTGATCAAATCAATCTCACCACCGATGCTGAGCACGGCGACCCCGTTAT
+GGTCGGCAACCGTGACGGTGATCGAGTCGGGAGCTGACAATGGCGATCCTCTTGTCCGAGCCGTCCGTGT
+GGTGAAAGCCTAGCCCGCCTGCGAACTGCGGCGGCGGCCCATCAGCGTAGGATTTGCCGGCTGCACACGA
+CCTGTGTGCGGGCCGCAATCGCGGCGAAGGCGCTGGGGCGTGGGTGAATTGCCTAACAACCCTCGAGTGC
+GGACACGCATATAGCCTCCGTCGAAATTGGCCTATAGGCGTTCCTTGACCGCCGCCGACAAGCGTGCGCC
+GTCGGCTTTCCCGGCGGCGATCACGGTGGCCGCCTTCATTACCAGACCCATCTGTTTCATGCTGGGCCGA
+TGCCCGAGTTCTTCGGCCACCTCGGCTATGGCGGTGTCGGCGACATCGGCCAGTTCCCCCTCGGTGAGCG
+GCGTCGGGAGGTACTCGTCAATGATCCGTGCCTCGGCATGCTCGGTGGCGGCGAGCTCACCGCGGCCGTT
+TTGGGTGTAGATCTCCGCCGCCTCACCACGCTTGCGCGATTCCCTGGCCAACACCTTGATCACCTCGTCG
+TCGGAGAGCTCTCTTGCCTGCTTGCCAGAGACCTCCTCGGTCTGGATCGCGGCCAGCAGCATGCGTATGG
+TCGCGGTCCGCAGCTTGTCCTGCGTCTTCATCGCTTGGGTCAGGTCTGACCGAAGCTGGGATTTAAGTTC
+CGCCATTGCACAAACGCTACGCGCCGCAACGCCCGAAACCCGACACTGAGACCTACATTGAGAAATGCAC
+CGACCGCCGACAGGATGGAGGCCATGACGAACGACGACAGCTGCTGCGTCCGGTGAGCATGCTGCCGCCT
+GGCTACCCGGTTGAACCACCGCCCGTGGCGCCGGGATATGCGCCGGCCGGATATCCGCCCTACCCCGCTA
+CACCACCCGGGTACGGCCCGCCGGGTTATGGTGCGCCGCCCAGCTATGGCCCCCCGCCTGGCTATGGTCC
+ACCCCTCGGCTACCCCGCCGCACCGCCCGGCTGCGGCCCACCGCCCGGCTATGGCCCACCGCTCGGCTAT
+GGCCCACCGCTCGCCCCGGGCGCGGTCAAACCAGGAATAATCCCGCTGCGGCCGTTGACCTTGAGCGATA
+TCTTCAACGGCGCGGTCGGCTACATCCGCGCTAACCCGAAGGCGACGCTGGGATTGACCGCCATGGTCGT
+GGTGACCCTGCAAATCATCTCACTGGTGGCCCTATTTGGCCCCATGACCGCCTTCGGTGACATCGTGACC
+GGGGAGCCCGACGAGCTGACCGGCGCGGTGGTGGGCGGTTGGTCAGCGTCATTCGGCGCCAGTCTCCTGG
+TCAGCTGGCTAGCGGGTGTGCTGCTCAGCGGCATGCTCACCGTCATCGTCGGGCGGGCCGTGTTCGGTTC
+GCCGATCACCGTCGGCGAGGCGTGGGCCAAGGTTCGCGGTCGCCTGCTCGCGTTGTTCGGCCTGGCACTG
+CTGGAAGCAGCCGGCGTGGTGGCGGTGCTCGGGCTGGCGGTCGTCATACTTTCCGGGGTCGCGGCGGCGG
+CCAACGAGGCAGCGGCGGCCCTCCTCGGCTTCCCGCTGCTGCTCGTGGTTGGGGTGTCGCTGGCCTATTT
+GTATGTCGTCCTGCTGTTCGCACCCGTGCTGATCGTGCTGGAGAGGCTGCCCATCGTCGAGGCGATCACC
+AGATCCTTTGCGCTCGTGCGTCATGGCTTCTGGCGGGTCCTGGGCATCCGCCTGCTGACGGTGCTGGTGG
+TGGGCGTAGTTGGTAATGCGATCGCGGCTCCTTTCATGATCGTCGGCGAGATAGTGACGGCCGTCACAGC
+GTCCGACGGGTCAGTCACCATGCGGCTCGTCGGCGCTACGCTCTCGGCCATCGGAGTGACGATCGGCCAG
+ATTGTCACCGCGCCGTTCAGCGCCGGAGTTGTCGTGCTGTTATACACCGACCGCCGTATCCGTGCCGAGG
+CCTTCGACCTGGTATTGCAGACCGGCTTAGAAGCCGGCCCCGCCGGCGGGCCCGCCCCGGTGGAGTCCAC
+CGACAACCTATGGCTCACGCGGCCTTTCTAAAGGGAGTTAGTGAGGACAGGCTGACAGTGCCCTCCATCG
+ACATCGACCGCGAAGCCGCACACCAAGCCGCACAACGCGAGCTCGACAAACCGATCTACCCCAAAGACTC
+CCTGACCAAGGAACTCACCGACTGGATCGACGAGCAGCTGTACCGGATTTTGGAGAAGGGATCCTCGATA
+CCTGGCGGTTGGTTCACCATCACCGTGCTGCTCATCTTGCTGATGATCGCGGTGACCGCCGCCGTCCAGA
+TCGCACGGCGCACCATGCGCACCAACCGCGGCGGTGACTACCAGTTGTTCGACGCCGGCCAATTGACCGC
+AGCCCAGCATCGCTCCACGGCTGAAAGCTATGCCGCCGAGGGTAATTGGGCTGCGGCGATCCGCCACCGG
+CTACAAGCCGTGGCTCGCGAGTTGGAGGAGACCGGCATGCTCAACCCGGCTGCCGGGCGCACCGCCAACG
+AGCTGGCCAGCGATGCGGGCGAGGTTTTACCGCATCTGGCAGGGGAATTGACGCAGGCGGCAACCGCTTT
+CAACGACGTCACCTACGGCGAGCGGCCCGGAACCCAAGGCGCCTACCAAATGATCGCCGACCTCGATGAC
+CATCTGCGGTCCCGTTCACCGGCCGTCGTATCTGCAGTGCAGCACCCGGCCGTGTTCGACTCGTGGGCGC
+AGGTCCGGTGATTCCCACACGTCTCGCAACCGTGCGCCGCCGACGGCCGTGGCGCGGGGTGTTGCTCACG
+CTGGCCGCAGTCGCCGTCGTGGCCTCGATCGGCACCTATTTGACGGCGCCACGGCCTGGAGGCGCCATGG
+CCCCCGCGTCCACCAGCTCGACGGGGGGCCACGCGCTGGCGACGCTGCTTGGCAACCACGGCGTCGAGGT
+TGTCGTGGCCGACTCCATCGCCGATGTCGAAGCCGCGGCACGCCCCGACTCGCTGCTGTTGGTGGCGCAG
+ACGCAGTATCTAGTCGACAACGCACTGCTGGATCGGCTGGCGAAAGCCCCCGGTGACCTGTTGCTGGTGG
+CACCCACCTCACGAACTCGTACGGCGCTGACGCCGCAACTGCGCATCGCGGCCGCCAGCCCATTCAACAG
+TCAGCCGAATTGTACGCTGCGGGAAGCTAATCGGGCAGGATCGGTGCAGTGGGGGCCCAGTGACACCTAC
+CAGGCCACCGGCGACCTGGTGTTGACCAGCTGTTACGGCGGGGCATTGGTCCGCTTTCGTGCTGAGGGCC
+GAACCATCACGGTGGTTGGCAGCAGCAACTTCATGACCAACGGCGGCCTGCTGCCGGCCGGCAATGCCGC
+ACTGGCCATGAACCTCGCGGGCAACCGGCCTCGTCTCGTCTGGTACGCGCCCGACCACATTGAGGGGGAA
+ATGTCTTCTCCGTCATCTCTTTCCGACCTGATTCCGGAGAACGTGCACTGGACCATCTGGCAATTGTGGC
+TGGTGGTGCTCTTGGTGGCACTCTGGAAAGGCCGGCGGATCGGTCCACTGGTGGCCGAGGAGTTACCCGT
+TGTGATCCGCGCGTCGGAGACTGTCGAGGGTCGCGGTCGGTTGTACCGATCCCGTCGGGCGCGTGATCGC
+GCCGCGGACGCACTACGCACCGCGACGCTGCAACGCCTGCGGCCCCGACTTGGGGTGGGCGCAGGCGCGC
+CGGCGCCAGCAGTGGTGACAACCATAGCGCAGCGCAGCAAAGCTGACCCGCCGTTTGTTGCCTACCATTT
+ATTCGGCCCGGCACCGGCCACCGACAATGACCTGTTACAACTTGCCCGTGCGCTCGACGACATCGAAAGG
+CAGGTCACCCACTCGTGACACAGTCCGCGTCCAACCCGCAAGCTCCTCCCACCCAAACCCCTGGCGCTGA
+ATTGCCCGGCTATCCCCCGCAAGCGGGTGGTGCCCCTACAGCGGCCCCTTCCGGGCCGCATCCTCACCGG
+GCTGAAGCAGAATCGGCACGTGATGCATTGCTGGCATTACGCGCCGAGGTCGCCAAGGCCGTCGTCGGAC
+AGGACGGGGTGATCAGCGGCCTGGTGATCGCTCTGTTGTGCCGTGGGCACGTGCTCCTGGAAGGTGTTCC
+AGGAGTGGCGAAGACGCTGATTGTCCGCGCTATGTCCGCCGCTTTGCAACTGGAGTTCAAGCGGGTGCAG
+TTCACCCCTGACCTGATGCCAGGCGACGTCACCGGTTCACTGGTCTACGATGCCCGCACCGCCGAGTTCG
+TGTTCCGGCCGGGCCCGGTGTTCACCAATTTGCTGCTGGCCGATGAGATCAACCGCACCCCACCCAAGAC
+GCAGGCCGCGCTGCTCGAGGCGATGGAAGAGCGTCAAGTCAGTGTGGAGGGTGAGCCTAAGCCGCTGCCC
+AACCCGTTCATCGTCGCCGCGACGCAGAACCCGATCGAATACGAGGGCACCTATCAGTTGCCCGAAGCCC
+AACTGGATCGTTTCCTGCTGAAACTGAATGTGACACTGCCGGCACGCGATTCCGAGATCGCCATCCTTGA
+CCGGCACGCGCACGGGTTCGACCCGCGCGATCTATCCGCGATCAATCCGGTGGCCGGGCCGGCCGAGCTG
+GCGGCTGGCCGCGAGGCGGTGCGCCACGTGCTGGTCGCTAATGAGGTGCTGGGCTACATCGTCGACATCG
+TCGGGGCCACCCGCTCCTCGCCCGCACTACAGCTCGGTGTGTCGCCGCGTGGGGCAACCGCCCTGCTGGG
+CACCGCCCGGTCCTGGGCGTGGCTGTCCGGGCGCGATTACGTCACCCCCGACGACGTGAAGGCGATGGCC
+CGACCGACGCTACGCCACCGGGTGATGCTACGCCCGGAAGCCGAGCTGGAAGGCGCCACACCCGACGGCG
+TTCTCGACGGAATTCTGGCCTCGGTTCCGGTGCCCCGCTAGTGATCCGTGTGATCGGCGCCGGCGACGAT
+GCAGTGGGGGCACCACCCGCTTGCGGGGGACGAAGCGATGGGGTGGGGGTACGCCCCCACAAGTGGGAGG
+TACCCCCACCCGCTTGCGGGGGAGAGCGGCGCAGATGATCCTAACCGGACGCACCGGCTTGCTGGCCCTG
+ATCTGCGTCCTGCCGATAGCGCTGTCCCCTTGGCCGGCAAGGGCTTTCGTGATGTTGCTGGTGGCGCTTG
+CGGTAGCGGTGACCGTGGACACCCTGCTAGCGGCCAGCACCCGTAAGTTGCGCTTTACCCGCTCGCCGTA
+TACCTCCGCCCGGCTCGGGCAGCCCGTGGACGCGAGCCTGCTGCTCTGCAATGGGGGCCGCCGCCGGTTC
+CGCGGCCAGGTTCGTGACGCCTGGCCGCCCAGTGCCCGTGCGCAGCCGCACACCCACGATGTCGACGTGG
+CTGCCGGGCAGCGCCAGCAGGTGCACACCGCACTGCGGCCAGTTCGGCGTGGGGACCAGCGCGCAGCAAT
+GGTCACGGCCCGTTCGATCGGACCACTGGGGTTGGCGGGACGGCAGAGTTCACAGTCGGTGCCCGGCTTG
+GTCCGGGTGCTGCCGCCGTTCCTGTCTCGCAAGCACCTGCCGTCGAGGCTGGCCAAGCTGCGGGAGATCG
+ACGGGCTGTTACCCACGTTGATACGCGGCCAAGGCACCGAATTCGATTCGCTGCGCGAGTATGTCGTCGG
+CGACGACGTCCGCTCGATCGATTGGCGCGCGAGCGCACGCCGCGCCGATGTCATGGTCCGCACCTGGCGG
+CCCGAACGGGACCGCCGAGTCGTCATCGTGCTCGACACTGGACGCATGGCGGCGGGGCGGGTCGGTGTCG
+ACCCGACCGCCGCCGATCCCGCCGGGTGGCCGCGGCTGGACTGGTCCATGGATGCCGCACTGCTGTTGGC
+GGCACTGGCGTCACGAGCCGGCGACCATGTCGACTTCCTGGCCCACGACCGGATCAGCCGCGCCGGCGTG
+TTTGGCGCCTCGCGTAGCGAACTGCTTGCCCAACTGGTCGATGCCATGGCCCCGCTGCGACCGGCGCTTA
+TCGAATCCGACTGGCATGCAATGATTGCCACCATCTTGCGGCGCACCCGGAGGCGATCGCTGGTGGTGCT
+GCTGACCGACCTCAACGCGACCGCTCTCGACGAGGGCCTGTTGCCGGTGCTGCCGCAGTTGTCGGCCCGA
+CACCATGTGCTGGTCGCCGCGGTTGCCGACCCGCGCGTCGATCAACTGGCCGCCGGGCGGTCCGACGCGG
+CAGCGGTGTACGACGCTGCGGCTGCGGAGCGCGCCCGCAACGACCGGCGTGCGATCGCGTCACAACTGCG
+CCGAGGCGGGGTAGATGTCATCGACGCTCCTCCCGCCGAAATCGCACCCGGACTTGCGGATCGCTACCTG
+GCGATGAAAGCGACCGGCCGCCTCTAATTTCCGACCTCCATTGTGAAATGTGCGACGCCAGCGCGGCGTG
+TCGTGTCGCGAGTTTCACTCTCGGGGGAGTTCAGCCGGTCGGGACCACGTCGGGCGCGTCCTCCATGTCG
+CCGGTCTCCCCGGCTTGCGCGGCACGACGACCGAAGTAGCCGATGTAGGACAGAAACACCGCCTCGGCGA
+TGATCCCGACGGCGATCCGAACAAACGTCGGCAACGGCGACGGTGTCACCACCGCCTCGATCAGACCTGC
+GACCAGAAACACACCCACCAAGCCCACCGCGACCGACACGACACCACGTCCTTGCTCGGCGAGGACCTGT
+CCGCGCGGGCGGTTGCCTGCAGATATCACCGACCACCCCAGCCGCATCCCAATCGCCGCGGCGAGAAAGA
+CGGCCGTCAGCTCCAGCAGCCCGTGCGGAAGAAGCAGGCCCAGCAGGAAATCGCCCTTCCCCGCCTGGAA
+CATCAGCCCGGCGATCAGTCCGACGTTGGCGGCGTTATCGAAAAGCACCAGCGGTATCGGCAGCCCCAGC
+ACAACAGACATCGCGATGCACGTGGTAGCCACCCAGGAGTTGTTCACCCAGACCTGCAGAGCGAACGACG
+CGGCCGGGTGCTCGCTGTAATAGGACTGGACGTCATGGCTGACCAATTCGTCTATCTCAGTGGGCGTCCC
+GATCGCGGACTGCACCTCGTGACTGCCGGCCACCCAGAACCCGATCAGCACCACGACGGCGAAAAACGCC
+ACCGCAGTCGCCAGCCACCACCGCCAGGTACGGTAGGCCACGACCGGGAACGACACTGTCCAGAACCGAA
+TGAACGTACGGGTCAGCGGTGCGTGCGCGCCTGTGACCGCGGACCGAGCCCGCGCGACTAGACTCGACAG
+CCGACCGGTCATCAACTGGTCCGACGAAGCCGATCTGAGCATCGACAGATGCGTGGACACACGCTGATAT
+AGCTCGACGAGTTCGTCGATTTCGGCTCCGCTCAGTGAATGGCGCTTCTTGATCAAGTGGTCGAGCCGGT
+CCCACGTGCCGCGGTTGGTCAGCAAGAACGCGTCGACGTCCACCCTGCGCAGCCTACCTAAGCCGCCGAG
+CGTGAGCGGTGGCCAATGCCGAGTGCAGCAGAGCACCGCACCAAAGCCTGTAGCGTTTGTTGGTATGTCG
+GAGGTGGTGACCGGCGACGCCGTGGTGCTCGACGTACAGATCGCCCAGTTGCCGGTGCGCGCGGTCAGCG
+CGGTCATCGATATCACCATAATATTCATCGGCTACATCCTCGGTCTGATGCTGTGGGCGACCGCCCTGAC
+CCAGTTCGACGAAGCCTTGACCACCGCATTCCTGATCATCTTCACGGTGCTGGCGCTGGTCGGCTATCCC
+CTGGTCTGGGAAACCGCAACGCGGGGCCGATCAGTGGGGAAGATCGTGATGGGTCTGCGGGTGGTGTCAG
+ACGACGGTGGCCCGGAGCGGTTCCGGCAGGCGCTGTTTCGCGCGTTAGCGTCGGTGGTGGAGATCTGGAT
+GCTGCTCGGGAGCCCCGCCGTGATCTGCAGCATGTTGTCGCCAAAAGCCAAGCGAGTCGGCGACGTCTTC
+GCGGGCACGGTCGTTGTCAGCGAACGTGGTCCGCGGTTGGGGCCGCCGCCGGTGATGCCACCGTCGCTGG
+CCTGGTGGGCGTCGTCGCTGCAATTGTCTGGGCTTACCGCCGGCCAAGCCGAGGTTGCACGTCAATTTCT
+GGTGCGGGCACCGCAACTCGATCCTGCGCTACGCGAGCAGATGGCCTACCGGATCGCCGGTGATGTGGTT
+GCCCGCATCGCTCCGCCGCCGCCACCCGGAGTTCCACCACAGTTGGTCCTGGCCGCCGTCCTCGCCGAAC
+GACACCGGCGTGAACTGTTGCGACTGCGTCCCACGCTGCCTCCCGCAGGACAGGCGCCATGGGCCCAAAT
+GGCGCCTCATCGGGGTTGGCCGCCCGGTTTGTCCGGCGCCACGCCGTGGTCTCCTCAGCAGCCGGTGATC
+CCCTGGCCGGAGCCAGATCCGCCACCGCAAGCCGCTCCCTGGCCGCAGCAGGCGCCGGACGGCCCGGGAT
+TCTCGCCGCCGGGCTAGCAGCTAGTCTTCGCTGCGCCGGATCCCCCGAGCGTGCGGACATGTTCAGGCGC
+ACAGCGAAAGCTAGGACACGTCAACCCAATCCAGGGTCCGCTGCACCGCCTTGCGCCAGCCGGCATAACC
+CGCGGCACGCTCGTCGTCGTCCCACGTCGGTGTCCACCGCTTGTCCTCTCGCCAGTTGGCCCGCAGATCG
+GACGGAGCCGCCCAGAACCCGACCGCCAAGCCCGCCGCGTAGGCCGCACCTAGTGCGGTGGTCTCGGCGA
+CCACCGGCCGCACCACATCCACACCCAACACGTCGGCCTGGATCTGCATACACAGGTCGTTGCCGGTGAT
+CCCGCCATCCACCTTCAACACCTGCAGGCGAACACCGGAGTCTGCTTCCATGGCGTCCACCACATCGCGG
+CTCTGGTAGCAGATCGCCTCCAGCGTTGCGCGCGCCAGGTGCGCGTTGGTGTTGAACCGCGACAACCCGA
+CGATCGCGCCGCGCGCATCGGACCGCCAGTATGGCGCGAACAGCCCGGAAAACGCCGGCACGAAATACAT
+GCCGCCGTTGTCGGGGACCTGGCGGGCCAGCGCCTCACTCTGTGCGGCGCCGCTGATGATGCCCAGCTGA
+TCGCGTAGCCACTGCACCGCCGAGCCGGTCACCGCGATCGAACCTTCAAGCGCGTACACGGGTTTAGCGT
+TCCCGAATTGGTAGCACACCGTGGTTAGCAGGCCGTTATTCGATCGCACGATCGTTTCACCGGTGTTCAG
+CAGCAGAAAATTGCCGGTCCCATAGGTGTTTTTCGCCTCCCCTGGGGCCAGACAGACTTGACCGACCATG
+GCCGCATGCTGATCAGCGAGAACTCCGGTGATCGGCACCTCACCGCCGACAGGCCCGGTCGCCAGCGTGA
+CACCGTAAGGCTCCGACGGCGCCGACGATGCGATCTCGGGCAGCATGGCCCGAGGTATCGAAAACAACGA
+CAACAGCTCGTCGTCCCAGTCCAGCGTCTCTAGATCCATCAACATGGTCCGGCTGGCGTTGGTTACATCG
+GTGACATGCACACCCCCCCCGCGGCCCGCCGGTCAGATTCCACAACACCCAGGTGTCCGGTGTGCCGAAC
+AATGCGTCGCCGTTCTCGGCGGCCGCGCGGACTCCATCGACATTTTCCAGGATCCACTGCAGCTTGCCGC
+CAGAGAAATAAGTTGCCGGCGGCAGGCCCGCCTTGCGGCGGATCAGGTTTCCACGACCGTCTCGATCCAG
+CGCCGACGCGATGCGGTCGGTGCGGGTATCCTGCCATACAATCGCGTTGTAGTAGGGCCGTCCGGTGTGC
+CGATTCCATACCAGCGTCGTCTCACGTTGGTTGGTAATCCCCAACGCGGCAATATCTTTCGGCGATAGGT
+TGGTGGCGTTGAGCACCGAGATCAACACCGACGCGGTGCGCTCCCAGATCTCGACCGGGTTGTGCTCCAC
+CCAGCCGGCCCGGGGCAGGATCTGCTCGTGCTCGAGCTGGTGGCGGGCCACCTCGGCACCGTGGTGATCG
+AAGATCATGCAGCGGGTGCTGGTGGTGCCCTGGTCGATGGCGGCTATGAAATCCGAGGACTCGGCCAATT
+GCTCTCCTAGGATGGCGTCGGACACTGCATGTAATCGTCCATGATGGTCCACCGCAGCGGCGGGTCCGAC
+GCCGTCAGCCGGAGAAGGGGTCGCGAATTCTAATGCCCTCGAACTTGCGGAAGTCGCGGTCGTGACTCCA
+GATCGTGGCGATGCCGTGATGGCGCATGAGCGCGACGAGGTGGGCGTCGGGAACCAGATTGCCTCGCGGC
+TTGACCGGGTCGGCTACTCGCCGATAGACGGGCCAGAATCCGTTGGCCTCGCCGACCTGCCGCACGTGCG
+GTCGTGAGGTGAATTGCTCGATGTTTTCGACGGCGACCTCAGGCGCCAGCGGCGCACCCAACAACGTCGG
+ATGGGTGACAACCCGTAGATAACCCAGCGCGACGGGCCACAATAGATATACCAGCCCTGGCCTAGCCAGG
+AATCGCTCAACGAGCGTCTTCGCCTTATCGTGAAACGGGCTGGCTCGGTGCGTCGCATGGACCAGAACAT
+CGACGTCAAAGGTTTCGCTCACCCACGGTCCAAAATCGCCCAAACAGCGTCCTTGTCGTCAAGATCCACA
+CGGGGCCGCAAGTCGGCAGTCGACCAGCGGATGTCAACGTTTGGAGGAGGCTCGGCCGCCAGAGCTTGCG
+CAAGCAATTCGGAGGCGAGCTGCCCTAACGTTTTGCGCTCCTCGCGCTGGCGTCGTTTCAACGCCCGCAG
+TATGTCGTCATCGAGGTCGATCGTAGTGCGCATACATCAGATGCTAACTCGATATGCATCTGATGCGCAC
+GATCTCACCCTTCTTGCGCTGCCGGCACGAAACCTGTTGCATCAGCAATGTGGGCGAAGAGGTAACGCGC
+ACCACATATAGCCGCGAACATCAGCGCGAGTACCGGCGCAAGGTGCGGCTGTGCTTGGACGTCTTCGAGA
+CCATGCTTGCGCAGACCAGGTTCGAGGCCGACCGGCCACTCACCGGCATCGAGATCGAATGCAACCTCGT
+CGACGCCGACTACCAGCCGGCCATGTCGAACCGCTATGTGCTGGATGCCATCGCCGACCCGGCGTACCAG
+ACCGAATTAGGCGCTTACAACATCGAATTCAATGTTCCGCCTCGCCCGCTACCGGGACGCACTTGCCTAG
+AGCTGGAGGACGAAGTCCGCGCCAGCCTCAACGATGCCGAGACCAAGGCCAGCTGCAGCGGAGCTCACAT
+CGTGATGATCGGCATCTTGCCCACACTGATGCCAGAGCATCTGACCGACGGCTGGATGAGCGCATCAGCG
+CGTTATGCGGCTCTCAACGAGTCGATTTTCAAGGCCCGCGGCGAGGATATCCCCATCAACATCGCCGGCC
+CGGAACCGCTGAGCTGCCATGCCGGATCCATCGCACCCGAATCCGCTTGCACCAGTGTGCAATTACATTT
+GCAGCTAGCACCGGCGGATTTTCCGGCTAACTGGAATGCGGCTCAGGTACTGGCCGGACGGCAGTTAGCA
+CTAGGTGCCAACTCGCCCTATTTCTTCGGCCACCAGCTGTGGTCGGAAACCCGCATCGAGCTGTTCACAC
+AGTCCACTGATGCCCGTCCCGAGGAGCTGAAATCGCGAGGGGTGCGCCCCCGGGTATGGTTTGGCGAACG
+CTGGATCACCTCCGTCCTCGACTTGTTTCAGGAAAACATCCGCTACTTCCCCACCCTGCTACCCGAGGTG
+TCCGACGAGGACCCCCTCGCAGAGCTTTCGGCTGGACGCATCCCACACCTGTCCGAATTGCGGCTGCATA
+ACGGCACGGTGTACCGGTGGAACCGGCCGGTGTACGACGTGGTCGACGGGCGCCCGCATCTGCGGCTGGA
+GAACCGGGTGCTACCCGCCGGGCCGACGGTCGTTGACATGCTGGCGAATCATGCCTTCTACTACGGCGCA
+CTACGCGGTCTGTCCGAGGCCGACCCCCCATTGTGGACGCAGATGAATTTCGCTGCGGCACAAGCGAATT
+TCCTGGCAGCCGCCAGGTACGGCATGGACGCCCAGTTGGATTGGCCGGGCTTGGGCGAGGTGACGACGCG
+GGAGTTGGTGTTGGGCACGTTGTTGCCAATGGCACACGAGGGACTGCGGCGGTGGGGTGTCGACGCGGAG
+GTACGCGACCGGTTCCTGGGTGTCATCGGCGGTCGCGCCCAGACCGGCCGCAACGGCGCGCGCTGGCAGG
+TCGCCACCGTGGCGGCCCTACAAGACGGCGGGCTGACCCGGCCCGCGGCACTGGCTGAGATGCTGCGCCG
+GTACTGCGAGCACATGCACAGCAACGAACCCGTGCATACCTGGGACACGTAGTCCACGAGTAGGTTGGGA
+GCCATGACCGACGAGGTAATGGACTGGGACAGCGCCTACCGTGAGCAAGGCGCCTTCGAGGGGCCGCCGC
+CGTGGAACATCGGTGAACCCCAGCCTGAGCTGGCAACGCTGATCGCGGCCGGCAAGGTCCGCAGTGACGT
+GCTAGACGCCGGATGCGGATACGCCGAACTGTCATTGGCCCTTGCCGCCGACGGCTACACCGTGGTCGGC
+ATCGACCTCACGCCCACCGCCGTCGCGGCTGCCACCAAGGCCGCTGAGGAGCGCGGTTTGACCACGGCCA
+GCTTCGTGCAGGCCGACATCACGGAGTTCGCGGCTTATCCAGCCGGCTCCGCCGGCCGCTTTTCCACGGT
+GATCGACAGCACCCTGTTTCATTCGCTGCCGGTGGACAGCCGCGACCGCTATCTGAGCTCGGTGCACCGC
+GCGGCGGCCCCGGGCGCCAGCTATTACGTGCTGGTCTTCGCCAAGGGCGCCTTCCCCGCCGAGCTGGAAG
+TCAAGCCAAACGAAGTCGACGAGGACGAGTTGCGTGCCGCGGTGAGCAAATACTGGAAGATCGACGAAAT
+CCGGCCCGCCTTCATTCATGTCAATCCGGTCACGATTCCGCCCCAGCTGGCCGGAGCGCCAGTCGAATTC
+CCGCCATACGATCACGACGAGAAGGGTCGGGTGAAGTTCCCCGCCTATCTACTCACCGCCCACAAGGCCG
+GCTGAGGCTAACGTTCGCCGCTGGTCGCCGCGGTCGCCGCGACCAACGCCTCGGCGAAGGCGTCCAGGTC
+ATCGGCGGTGTTGTCCACGTGCGGCGAGATCCGCAGCACCGGCGCCGGCAGTTCCAGCGGTGCCCGCTCC
+ACTCCGGCGTAGGTGGTCACGATCCGCCGCTGCGAGAGCAACCAGGCCCGCACCGCTGCCGGGTCGGCGC
+CGTCGATCGGCGCCAGGGTGGTGATCGCGCTAGGCTCGTCGACCGCTTCGACCACCCGCCAACCGGACAC
+ATCGGCGAGTACGGTCCTGGCGATGTCGCCCAGCTCAGCCAAGCGTGCCCGAATAGCCTGCGGCCCGCAC
+GCCAGATGCTCACCGAGTGCGACCGAAAACCCCACTCGCGCAGCTACATTGGCTTCGCCAAATCCGAGTT
+GTTGGGCCACTGTCAGCGGCGGCATCCAGTCTGGCGCGGGCAGCCTCGCACGTAACCGCTCCATCAGCTC
+AGGACGAACCGCCAGCACCCCAACTCCGCGGGGCCCGGCGATCCACTTGCGCGACGAGGCATACGTGACG
+TCGGCACCCACCGCACAATCCACGTGGCCCAGGCCCTGCGCGGCATCCACGACCAGCGGCAGTTTCAGCT
+CGGTGCACAGTTGCGCCACCATCGCCAGCGGCTGTGCGACGCCACGGTGGCTGGCCACCACGGTCAGGTG
+CACTAGGTCGGGCGGGTCGTCGGCCAACATGAAGGCCGCGTCGTCGAGCGCTACCCTGCCGTCCTGCAGA
+GTTGGTAACGGACGCACGTCGAAGCCATGGGCGGCCATCACAGCCAGGTTCGGCCCGTATTCGCCGGGCA
+AGCAAGCCAGCGTCCGGTTCTCCCCAGGCCAGCTGCCCAGCAGCAGATCCAACGCGTGCAGCGAGCCGGT
+GGTGAACACCACCTCGGCGTCGGGCAGGCCGCTCAGTGCGGCGACCGCCGCACGTCCGGCGTCGAGCACG
+GCGGCGGCGGCCTCAGCCGCGACATAACCGCCAACCTCGGCCTCGTGCCGCGCGTGCTGGGCTGCGGCGT
+CGAGTGCGGCGAAACTCTGGCGCGAACAGGCCGCGCTGTCCAGGTGTAGCCCCGCGACGGGCGGGCGCGC
+TGCCCGCCATCGGTCGGCCAGCGAATCGCCGGCGGGGCTGTTTGCGCCGCTTCTCCTCATCGCTTCGTCC
+TGCATCGTCGCCGGCGCGGCTCACTTGGCGGCCAGCGACAGGCCAAAGTCACCGGCTTCATCGGTCCACC
+ATCGGATGCGATGCAGTCCGGCCGCGGCCAACTCGGCACCGACCGCTTGCGGCCGGAACTTGCACGAGAC
+CTCGGTCAACATCTCCTCCCCGGCGTCGAAGTCGACGGTCAGGTCCAGTGCACCGACCCGTACCCGCTGG
+CGACCGTCGGCACGCAACCACATCTCAATCCGCTCTTCTGCGCTGTTCCAACGGGCGACGTGCTGGAAGG
+CATCGACGTCGAAATCCGCTTCGAGTTCCCGGTTGATCACGGCAAGCACGTTGCGATTGAACTGAGCCGT
+CACCCCGCCAGGATCGTCGTAGGCGCGCACCAGCCGGGCCGCGTCCTTGACCAGGTCGGTGCCCAGCAGC
+AGGCTATCGCCCGGCCGCATTACCCCGGCCAGGGCCGTCAGGAACTGCGCGCGCGGCCCGGGCGTGAGGT
+TGCCGATCGTGGACCCCAAGAACACAAACAGGCGCCGTCCTCCCCTGGGAATCTCGGTTAAATGCTCCTC
+GAAATCCCCACAAACAGCGTTGATTTCGACACCACTGTATTCACGCTGAATTGCGGTCGCAGTTGCCGAC
+AGCACGCTGGCGTCGACGTCGAACGGGACGAATCTGCGCAGCGATCCCCGGTGGCGCAACGCATCCAGCA
+GCATCCGGGTCTTCTCCGAGGTGCCGCTACCCAACTCGACCAAAGTATCGGCCCGGCAGGCGGAAGCCAC
+TTCGGCCGATCTGGCCCGTAGGATTTCGGCCTCGGCTCGGGTCGGGTAGTACTCCGGCAACCGGGTGATC
+TGATCGAACAGTTCACTACCCACCGTGTCGTAAAACCACTTGGGCGGTAACGATTTCGGTGTCTTCTGCA
+GGCCAGAGTACACATCGCGGCGCAACGCCAGATGCCCCGCATCCTCGCCCAGATGGTTGGCAACCGACAC
+TCTCATCGAGGTCCTTTCGCGCGGTCCAATGCGGTCAGCGTGACACCCTTTTGGGTTACCTCCACCAGGT
+GGCGGTCCGGCACGTCGCCCCAACCGGAGTCGTCGTCGTATGGTTCGCTGGCCAGCACCACCCCGTCGGC
+GCGCCGCAGGATGGACAGCGTGTCTCCCCAGGTGGTCGCGATGAGCCGGGAACCGTTGGCCGCCAAGATG
+TTTAGTCGGGCATTTGGGTCGGCCGCGCCGACCTTGACAATGGTGTCTCCCAGAGCGTCCAGACCGTGAG
+CGAAGATGGTGGCCGCGAGTATCGCGCTGTCACAGACCGATTCGGCCGCCGGGCCCGCCGGCAACACGGC
+ACGATCAACCACACCGTTGTGCGCTAGCAACCAGTGCCCATCGGTGAACGGCGGGGTCGCGCTGACTTCG
+ATCGGCATACCGACAGTCGCCGAGCGCACCGCGGCGAGGATGCAGTGACTACGCAGCGCCGGCGCCACCG
+AGTGAAACGACGTGTCCCCCCACAGCGGAGCCGGGCTGCGCCAACGCCGGGGAATGGCACCGTCGAAGAA
+GCCGACACCCCAACCGTCGGCGTTCATCAGCCCGTGCTTTTGCCGACGCGGCGCATATGACTGCACCCGC
+AGACCCTGCGGCGGGTCCAGCACCAACGAAGAAACCGCGACCTGTGCCCCGAGCCACCCCAGGTGACGAC
+ACATCAGATGTCCCACGCCAACCGGACACCGGCAAAGATCTGGCGGCGATACGGGTGATCCCAGTTGCGG
+AAGCTGGGCCGCAGGATGGCCGGCTCCACCGCCCACGAGCCGCCGCGTAGCACGCGGTAGTCGCCGCCGA
+AGAACGGCTGTGAGTACCGCTCATAGACCATCGGGACGAACCCCGGCCAGGGCCGCAACGGCGAGGTGGT
+CCACTCCCAGACATCGCCCAGCATCTGCTCGGCCCCGCACGCCGATGCCCCGGCCGGGTAGGCACCCACC
+GGCGCGGGGCGCAGCGTTTGACCGCCCAGGTTGGCATAGGTGTCTGTGGGCTCCTCGGTTCCCCACGGGT
+AGCGGCGGCGGGAACCAGTCGCCGGATCCCACGCGCAAGCCTTCTCCCACTCCACCTCGGTGGGCAACCG
+CGCGCCTGCCCAGGCGGCGTACGCCTCGGCCTCAAAGTAGCTGACATGCTGCACCGGCTCATCGGCGGGA
+ATGTCCTCGACGTGCCCGAACCGGGTCCGCGTCCGCCCGCCCGACCTCCAGAATTGCGGAGCGGTCAGCC
+CCGCGCGCTGGCGGTGCTGCCAGCCACGTTCCGACCACCACCGCGACTGGGTGTAACCGCCGTCGTCGAT
+GAAGTCTTGCCATTCACCGTTGGTGACCGGAACCCGGCCGATCCGGAATGCGGGCACGTCGACGACGTGA
+GCCGGACGTTCGTTGTCCAATGAGCACGGTTCGTCCGCGGCGTCCACGCCCAGCACGAACGGGCCGCCGG
+CTACCAGCACCGACGTTCCGGCCATCCTCGGCCGTCCGGCGGGCAGGGCGGAAGTCGCGGCCAACAGTGG
+CGAGCCGGTCCGTAGGTTCAAGGCCTGCAGCATGGTTTCGTCGTGCTGGTTTTCGTGGCTGATCACCATC
+GCGAACACGAAGCTGTCGCCGTCTTCAGGTAGAGCGGCAAGGGCATCCAGCGCAGCGGAGCGCACCGTTG
+CGCAGTAGGACCGCGCCCGCGCCGGGGACAGCAACGGCAGTTCCACGCGACTGGCGCGGGAATGCTCGAA
+GGCGTCGTAGAGACCCTCGACCGCCGGCGGCAAAAGCCCGGGCTGGCCTGGGTCGCCGCCGCGTAGCAGC
+CACAACTCCTCCTGCTGACCGATGTGTGCCAGGTCCCACACCAGCGGGCTCATCAACGGGTCATACTGGC
+AGCAAAGCTCGGCATCGTCGAAGTCGACCAGCCGCAACGTCCGCGCCCGCGCCCGCGCCAGATGACAAGC
+CAGCTGCTCGGGTGAAGTCACGACGCCCCGTGCATCATCCCGGTGACGGCTGACGCGATGCCGCCCGCGA
+TCACCCGGTCGGAGAAATCGTCTGCCGGGCAAACACCCCTGTCGACGTGGTCCACCAACCGCTGCATCGC
+GCCGATGAGTTCAGTCGGTACCCGCCGCGCGGCGATGGCCAGGCATCTGTTGGCTGCCAGGTAGAGCCGC
+CGGTCGGCCAGGCCGATCCGGGCCGCGGTGTCCCAGGCCGTGGCCACCGGTTCGACCGCGTCGACCGCCA
+AATCTGCCGCCACCGGGTCGTCGAGCAGCGTCACCAAGGTGAACACCACCGCGGGCCACACCTCGTCGGG
+CACGCTGTCGAGGTAGCGAATTTCCAGCCATTGCCGAGGACGCACCGGCGGGAACAACGTTGTCAGGTGG
+TAAACCAGGTCGGCGACGGTAGCGCGGCGACCGTCCAGCAGCACCCGACCGTCAACCCAGTCGGTGAAGG
+GCACGTAGTCCGTCACCGCACGGGTGTCTTGAGTGTCCGGGCTTCGCACCATCATCACCGGCGCCTTCAA
+GGCATACTTAGCCCAGTCGATGCCGGGGTGGTCGCCACTGGCACCAAGAATGGGGCCGCAGCGCGCGGAG
+TCCATCTGGCCCCACACCCGCTGCCGGGTGGACTGCCAGCCGGAAAACCGGCCGCCCAGCATCGGGGAGT
+TGGCGGCAATCGCGATCATCGTCGGCCCCAAGGCGTGCGCCAGGCGGACTCGCTCAGCCCATCCTTCCTG
+CGGTCCGGCATCCAGATTGACCTGGATCGCGGCTGTCGAGGTCATCATCGCCGCACCCGGCACTCCGCTA
+TGGCTGGCGGCGAAAAACTGCTCCATGGCCCGATAGCGTGCGCCCGGATTGACCCGCACCGGCGACCGCA
+GCGGGTCTGCACCCAGGAAGACCAAACCCAGCCCGGCATTGGCAAGCGCCGACCGTAGCACCGCCTGATC
+GCGCGTCATGGCACCGATGGCTGCCAGCACGCCGTCGGCGGGCGGTCCGGACAGTTCGACGGCACCACCG
+GGCTCCACGCTGACCACGCTGCCGCCCGGCAGCGGACTGAGCCATTCGAGAACCTCGGTGATCTCTTCCC
+AGCTGGGCCGGCGAAACGGATCGGCCGGGTCGAAGCAGTGCGCCTCCATCTCCAGACCGACGCGTCCCAA
+CGGACCATCGACGAGGCAGCCGTCCGCGATGTATTCCGCGGCGGCCGATGAATCGGTGATCTCGACGTCG
+TCCGGGGCAGCGTTATCCAGCTGCGAGGCCGCGGCGGTCATGGCGGCAAGCGTCATATCACGATCCCTCC
+GGGCCCGGCGCATGCCTAAAACATGCCCTGCGGACCGTTGGTTGCGCAGCTACCAGAACGATAGCCGCCA
+CCGGTTTATCCTGCCGACCGCCCCGCCGCGCGAATGAACTGGCCAACTCAGCCCAGTGTGTTCTGCATTG
+CCCCGGCCAGCACGTTGACCGCGGGACCGGCGTTGCCGGACTGACAGACCTTGGCCTGCAGCAATACGTT
+TTCGCGCAGCCTGGTTTGAACAAAGCATCGTCGATCGGTGCCGGCCTCTTGTTTGGTCCAGGCCTCGTCG
+GTGCCGGTCGACGGCCCACCGGCGAACGACCACACCTGCGTCGTCCCGTCGTCCAGGTGGATCGCGGTGG
+TCTGCCCCGAGCAGCCCACGGTTCGGTCGACAACGCGGTGAAACGCCCGGTCTGCGGCATCGTTGCTGGC
+GAATACCCCAACCGCCTGCTTGACCAGGTGGGTTTGGTCGGTGGCGGACGTCTGCGTGGTAGCGCCGTTG
+AACGACGCCAGGTCGGGATCGTCGTACACCTCGGGCAGCCCGATGTCCACCCAGTTGTTGCACGCCGGTA
+GTTCGACCCAAAACGCCTGGAACGGCCTGGTGAACACCGCCTCCCACCCCATTGGGGCGCCGACGATGTT
+GCCGACCGACCCCTTTCCGAGCACCGCGTAGGACACAACCCCGGGCTCCGACGGGTGTGCGTCGGCAACA
+GGTACCGCGAACCCTGCTATGACGGCTAGACCGATGCTCACCACCGCGGCGGCGATTCGCATGGAGCTAG
+ACCTTGGCCGAGATGTCGACGTCGATGTTGCCCATGGGTCACGATCATGCCAACATGGCCGACCAAACAG
+AAGGCCCTTTTCTTGAACGAGTCAAGAAAAGGGGCTGGTGCGCCCGGCCGCTAGGGGCGCGCCGGCGCGG
+TGGTGGGACCCGGACCAGTCGGACCAACAGCCGGGCCACCCGGGCCTCCAGGGAAACCGGGGCCCATGCC
+TGGGGGAGGGGGTCCGCCGGGGAACCCGAACACCCATCCCATCCCTGGACCGGGGGCAACGGGACCGACG
+GGGCGGAACATGCCGTGGTGGTAATAGCGGTGGTAAGGGCATTTCCCCTGCCCGAGAACCAACGCGCCAG
+AGAAGAAGATGACTGCGACGGTGAAAACAATTCCGGCCACGATCACCACCCACGCTGCGGCCCGGTAGAG
+CCTGGGCGGCTTTTCCTGCTGCGGCGATGGCGGCGGTGAAGTTGTGGCGGCGGACGGCGGTGGCGCTGCG
+GGTTGGGGTGTCTCGGTCATCTTTTGAATATCGCTCGGCCGGCAACCACCGTAAAGGGTTGCGGTTACAA
+ACGTGCCATGAACTGGTGCAGCCCGGTGCCTTGGGTGGACACCGGGCTGCTGGTTGTCGGTTACGGAGCG
+GGTGTCGCGGGAGGACTGACGGACGACGGCACCTGGCCGGGCCCGCCCGGGCCTGGGCCGGGACGCACTG
+CCGCGGGCCCACCGTGCGGACTGCCCGGTCGCAGCATCATCGCCGGGTGCTGGTGGTGTTGCCGGTGGTG
+GAAGCCGCCGTGACCGGCATGCTTGCCGAGGATATAGCCGGTGAAGAAGATGACCGCCACGATGAACACG
+GTTCCGGCGGCAATGGCTACCCACGCCGCGGCTTTGAACACCTTGGGGGTCTGGTGAGGCGGTGGTGTTG
+GGGTTTCAGATGTTTCACTCATGTGTCGCATGATGCCTTGGCAAACAGTAACGCGACTATGCGTCCCTTA
+TGTAGCAGCTGTGAGCGCGCGGGCTGGGTATCGGCCCGGGACACCACCATGGCTGCGTCTCGGTGTCAGA
+GCACCAGAGCTACGGGTCTGACCAGGGCTTGAACGGGTTGACCGCGAACTGAATCACCCGGTACGGCCCA
+TTCTGCCGGGCCCGAGTGTCCCACTGGCTGACGAAGATCCGCAGTTCGTCGATGGTGGACCCGGGCGAGA
+TGTAGCCGCCATACGGTTGTGCGAGTCGATTGTCGTAGGGCGGTGGCAGGCTTTCCGCCGGCTCCGGCCA
+CTCGTCGTGGCGCACCACCGTGGTCACCGGGGCGGCGCCCAGCGACGTCGGGTGGTGTGCCACCCGAACC
+TCCATGTTGCCGGTGCTGGCGTTGAAATACGACAGCACCGTCTGGCCGTCGATCTGACGGATGCTCATCT
+CGCCGAGCTGGTCGGGCCAGAGCGGAGTCGGCGGCTTGTTCCAACCGCCGTCGGGGCCGCCCGCCCAGCC
+CTGCCAGCGGGACCGGTCGGTGAACGATTCCGGGGTGGCCCGATACAGCACCGCCGGCTCCCCACGGGTG
+AAGCTGTCGGCCACGATGTAGACCCACCCAGTTGGCGAATCGGGCGTGGGAACCGGGTCGTAGTATCCGC
+TGATCTGTGTCTGCCGGCCGTCCTGGTAGGCGGCGTTGCGCCTGGACCCCGACACGGTCTGCCAGCCGCC
+GCGCGCCGCCTCGGCCCGCACCAGGCGGGAATTCTGCGGCTGCAGGTCCTTGGTGGTGGTCACCATCAGG
+TAGTTGCGGCGGTTGATCTGCACCACACCGGCGGGCAGCTGTGAGTCTCCAGGCGGCGTGGGATCGGCCA
+GCAGCGGCGTGCCGACGCCGGTGACACCGGTGTAGCGCACCCCGGCCGGATCGTCGATCGACTCGGTGTC
+GACGTGCAGCGCGACCGGCGCATACCAGCCACCGAACCCGACACCCTGACCGGCGAAGCTGTCCCCGCAC
+ACCTGCAGCAGTTGACTGGGGAATTCCACGAACTCGCACAGGTCGGTGGCACCGATGCCGTAGTCCCCGG
+TGGGGGTTCCGGTACCGGCCGTCGGACCGATTCGCAGCACTTGACCGGGCGCCAGCGGCGGCAGGATGGG
+CCGGGGCGCCGGCGCCGGCGGATCGGCGCGTGCATACCAAACACATTGCGGGACAAGGAAAGACACTACC
+AGCGAGCACCGCACGACCCAGGCGGAGCACACCCGCATATCACAAGTCGGCGGTCAGCAGCTCGGCGATC
+TGGATGGTGTTCAGCGCCGCCCCCTTGCGCAGGTTATCCCCCGACACGAACAGCGCCAGACCACGCCCGT
+CGGGCACCCCCGGGTCGCGCCGGATCCGGCCGACCAGAGATTCGTCGACACCGGCGGCGGCCAGCGGCGT
+CGGCACGTCGACCAGCTGCACGCCCGTAGCACCGTCGAGCAGCTCGCGCGCCCGCTCCGGCGAGAGCGGC
+TGCGCGAACTCGGCGTTGATCGACAAAGAGTGTCCGGTGAACACCGGAACCCGCACACAGGTGCCGCTGA
+CCAACAGGTCGGGGATGCCAAGGATCTTGCGGCTCTCGAAGCGCAACTTTTGATCCTCGTCTGTCTCGCC
+GGAGCCGTCGTCCACCAGGGATCCGGCCAGCGGCACCACGTTGAACGCGATCGGGGCGACGTAGGTGTTC
+GGCGGCGGGAACTCGAGCGCGCCGCCGTCATACACCAGCTGCTCGGCCCCACCGATGACCGCACGCGCCT
+GCTCGGCCAGCTCGGCCACCCCGGCCAGGCCGCTACCGGACACCGCCTGATACGACGAGACCACCAACCG
+CACCAGTCGGGCTTCGTCGTGCAGCACCTTGAGCACCGGCATCGCGGCCATGGTGGTGCAGTTCGGGTTG
+GCGATGATGCCCTTGGGCCGGCGGTGCGCGTCGCGTTCAAAGTTCACCTCGGACACCACCAACGGCACGT
+CGGGGTCCTTACGCCACGCCGACGAGTTGTCGATCACCGTGACTCCGGCCGCCGCAAAGCGGGGCGCCTG
+CACCTTCGACATGGCCGAGCCGGCGGAGAACAACGCGATATCCAGCCCGCTCGGGTCGGCCGTCTCGGCG
+TCTTCCACTTCGATCTCCTGGCCGCGGAAGGCCAGCTTGCGGCCCTGCGATCGGGCCGACGCGAAGAACC
+GCACCGCGCTCGCCGGGAAATCCCGCTCGTCGAGCAACGTGCGCATGACCTGACCCACCTGACCGGTGGC
+CCCCACGATCCCTATTGACAGGCCCATCTACCGTCCCGTCCCCGCGTACACCGTGGCCTCCTCGTCGCCG
+CCGAGCCCGAACGCTTCATGCAGCGCGACCACGGCCTTGTCCAGTTCGGTGTCGCGGCACAACACCGAGA
+TCCTGATCTCCGAGGTGGAGATCAGCTCGATGTTGACCCCCACCGCCGCCAGCGCCTCACAGAACGTCGC
+GGTGACCCCGGGGTGGCTGCGCATGCCGGCACCGATCAGCGATACCTTGCCGATGTGGTCGTCGTACAGC
+AGCTGTGAGAAGCCGATCTCGTTTCTGAGCGAGTCCAGTTTTTCCACGGCGGCGGGCCCGACGTCGCGGG
+AGCAGGTGAAGGTGATGTCGGTCTTGCCGTCCTCGACCTTGGAGACGTTCTGCAGCACCATGTCGATGTT
+GACGTCGGCGTCGGCCACCGCCCTAAACACCTTGGCCGCATACCCGGGGATGTCGGGCAGCCCGACGATG
+GTCACCTTGGCCTCGCTGCGGTCGTGCGCGACTCCGGTCAGGATGGGGTCTTCCATGGGTACGTCCTTGA
+TCGATCCGACAACGACGGTGCCCGGTCTGTCCGAGTACGACGACCGGACGTGCACCGGAATATTATGGCG
+GCGAGCGTATTCCACGCAGCGCAGCATCAGCACCTTGGCGCCGCAGGCCGCCATCTCGAGCATTTCCTCG
+AAGGTCACGGTGTCGAGCTTTCGGGCGTTGCGCACGATGCGCGGGTCGGCGCTGAAGATGCCGTCCACGT
+CGGTGTAGATCTCACAGACATCGGCACCCAGCGCGGCGGCCATGGCGACGGCGGTGGTGTCCGAGCCGCC
+GCGGCCCAACGTCGTGACATCCTTGGTGTCCTGGCTGACCCCTTGGAATCCGGCCACCAAAACGACCCGC
+CCCTCCTCAAGGGCGGTTTGCAGCCGCCCCGGCGTGACGTCGATGATCTTGGCGTTGCCGTGGGTGCCGG
+TGGTGATCACCCCGGCCTGCGAACCGGTGAACGACCGGGCATGCGCGCCGAGCGACTCGATGGCCATGGC
+CACCAACGCATTCGAGATGCGTTCACCGGCGGTAAGCAGCATGTCCAGCTCCCGAGGCGGCGGCGCCGGG
+CACACCTGCTGAGCCAGATCCAGCAGGTCGTCGGTGGTATCCCCCATGGCAGAGACGACGACGACGACGT
+CATTGCCTTGCTTCTTGGTGGCGACGATGCGTTCGGCGACGCGGCGAATCCGTTCGGCGTCGGCCACCGA
+GGATCCGCCGTACTTCTGCACGACGAGCGCCACTGTTTCCCTTTCCGGGGAAGATTGGAGACAGGTCCAG
+AATAGGGGGCGCGCCGGCCTGCGCTGACTCTGCGTCCACCACGGGAATGTGCGAGTAGCCCACACGGTGG
+ACGCAGAGTCAACGTGTAAAGTGCTTCATGTGCAGCGGGTGCTCCTCCTCGGACGCCGCGACGGGGTCTG
+ATCCAGACCGGCTTCCCGTCGCGGGACGTTCGCGATGCGCCGGTCTGAGGTTCCTTCTCACCATCCCGGA
+GCAACTACCGTGACAACTTCTGAATCGCCCGACGCCTATACCGAGTCGTTTGGGGCCCACACCATCGTGA
+AACCCGCCGGCCCACCTCGCGTCGGTCAGCCCTCGTGGAATCCGCAGCGAGCCTCGTCGATGCCGGTCAA
+CCGCTACCGGCCGTTCGCCGAGGAGGTCGAGCCCATCCGGCTGAGAAACCGCACGTGGCCTGATCGCGTC
+ATCGATCGTGCGCCGCTGTGGTGCGCGGTCGACTTACGCGATGGCAACCAGGCGCTGATCGACCCGATGA
+GCCCGGCCCGCAAGCGCCGCATGTTCGACCTGCTGGTCCGGATGGGCTACAAGGAGATTGAGGTGGGGTT
+CCCCTCGGCCAGCCAGACCGACTTCGACTTCGTCAGAGAGATCATCGAGCAGGGCGCCATTCCCGACGAC
+GTCACCATCCAGGTGCTCACCCAATGCCGTCCCGAGCTGATCGAGCGCACCTTCCAGGCGTGTTCGGGCG
+CACACCGGGCCATCGTGCACTTCTACAACTCGACGTCAATCCTGCAGCGCCGCGTGGTCTTTCGCGCCAA
+CCGGGCTGAGGTGCAGGCCATCGCGACAGATGGGGCGCGCAAGTGCGTCGAGCAGGCCGCCAAATACCCG
+GGCACGCAGTGGCGATTCGAGTACTCCCCGGAGTCCTACACCGGCACCGAACTGGAATACGCCAAACAGG
+TGTGCGACGCCGTCGGCGAGGTCATTGCGCCGACGCCGGAGCGCCCGATCATCTTCAACCTGCCCGCCAC
+GGTGGAGATGACGACGCCCAATGTCTACGCCGACTCGATCGAGTGGATGAGCCGCAACCTAGCCAACCGG
+GAGTCGGTCATCCTGAGCCTGCACCCGCACAATGACCGCGGAACCGCCGTCGCCGCAGCGGAATTGGGTT
+TCGCGGCCGGGGCTGATCGGATCGAGGGCTGCCTGTTCGGCAACGGCGAGCGCACCGGCAACGTGTGCCT
+GGTCACGCTGGGACTCAACCTGTTCTCCCGAGGTGTGGACCCGCAGATCGACTTCTCCAATATTGACGAG
+ATCCGGCGCACGGTGGAGTACTGCAACCAGCTGCCGGTGCACGAACGTCACCCCTATGGCGGCGACCTGG
+TTTACACCGCGTTCTCCGGTAGCCACCAGGACGCCATCAACAAGGGCCTAGACGCGATGAAGCTGGATGC
+GGATGCCGCCGACTGTGACGTCGACGACATGCTGTGGCAGGTGCCGTATCTGCCCATCGACCCGCGCGAT
+GTCGGGCGCACCTACGAGGCGGTGATCCGGGTCAACTCGCAGTCCGGCAAGGGCGGCGTGGCCTACATCA
+TGAAGACCGACCACGGCCTTTCCCTGCCGCGGCGGCTGCAGATCGAGTTTTCCCAGGTAATCCAGAAGAT
+CGCAGAGGGTACAGCAGGCGAGGGTGGCGAGGTCTCGCCCAAGGAGATGTGGGATGCGTTCGCCGAGGAG
+TATCTGGCCCCGGTGCGGCCTTTGGAGCGGATAAGGCAACATGTGGACGCTGCCGACGACGACGGCGGCA
+CGACCAGCATCACGGCGACCGTCAAGATCAACGGCGTGGAGACCGAGATCAGCGGGTCCGGTAACGGTCC
+GTTGGCCGCGTTCGTCCATGCGCTGGCCGATGTCGGGTTTGACGTGGCCGTGCTGGACTACTACGAGCAC
+GCGATGAGCGCCGGCGACGACGCTCAGGCCGCCGCGTATGTGGAGGCCTCCGTGACGATCGCGAGCCCGG
+CGCAGCCGGGCGAAGCGGGTCGGCACGCATCGGACCCCGTGACGATCGCGAGCCCGGCGCAGCCGGGCGA
+AGCGGGTCGGCACGCATCGGACCCCGTGACGATCGCGAGCCCGGCGCAGCCGGGCGAAGCGGGTCGGCAC
+GCATCGGACCCCGTGACGATCGCGAGCCCGGCGCAGCCGGGCGAAGCGGGTCGGCACGCATCGGACCCCG
+TGACGATCGCGAGCCCGGCGCAGCCGGGCGAAGCGGGTCGGCACGCATCGGACCCCGTGACGAGTAAGAC
+GGTGTGGGGTGTCGGTATCGCACCGTCAATCACCACCGCGTCGCTGCGCGCCGTGGTGTCGGCGGTCAAC
+CGGGCGGCACGCTAGGACGGCGCTGAACTAGGGTCGGGGTCCGCGGCATGATTTTTCGCAGTGACGTTCC
+GCTCGCCGTTTCAGAACAACGCTAACTGCTTTTCGACGGGAGCGACGTCGGTGAAGTCCTCCACGCTGGC
+GCCCCCGACGACGGCACCGATGCACTCCATGAATCGCGCTTCAGGCATCACCGGAACCCCCAGCTGCAGG
+GCGTGATAGCCCTTGCCGTGTTCGGGGGCGGTCGCGTTGCAGACCACCAGTGAGGTATCCCGGTCTACGA
+CGTCGCTGTAGGCCAGCCCGGCGTGCAGAATCCGTTCGACGAGTTCCTCGTGGGTCCGTTTTACCTCGGC
+CGCCAGCCCCACCCGCATGCCCTGGACCAGCGGGCGGCCCTGGACATACCGGCCCGGGTTGAGGTAGGGG
+CAGGCCATCCGGGCTGCCAAGGCCTTCAGCGGTCGCAGCTCGTCGTGAGTCACCCGGCCGTTGGGCCACC
+GGCGCCGTGTCACCGGGTGCACCGGCAGCCAGACGTCGAGTTCGCGCGCACTCTCTAGGGCAGCTGCCAG
+TATCCCGGTCAATACCCGGGCGTCGTCGAATGCATCGTGCGGCCGTTGCTGGGGCACACCCCAATGCGCG
+GCAAGTGTCTCCAGCCGCAGATTGTCGACGCCAAGCTGCAGCCGGCGGGCCAGCTCGACCGTGCACATGA
+CGAAGTCAACCGGGAGTTCGGCCTCGGCGATCTCGGCCTCCGCAGCGAGAAACGCATAGTCGAACGCGAC
+ATTGTGCGCGACCAGAGTGCGCCCGCGCAGCACGTCGACAACCTCACCGGCGATATCGGCGAACTGTGGC
+TGGTCATCGAGCATGGCGGCGGTCAGGCCGTGCACGTGGGTGGGGCCCGGGTCCACCTTGGGATTTAGCA
+GGCTGACCACGGATTGCTCTAGTCGGCCGGCGGCGTCCAGGCCGAGCACCGCAAGGCTGATGATCCGGGC
+CTGGCCCGGCCGAAAGCCCGAGGTCTCGACGTCGATGACGGCCCAACCCCGATCCTGGTGGCTGGCTGGC
+CGTCCCCAGGTGTGGCTCACAAGACGAGGATGACACGTCCGAGCGACATCACCTGGTCGCTACGCATCGT
+GTCGGCCCGTAAAACCCGGACGCGGGCGACCCGCCGCACCCGGCGACAAGCGCCGAGCTTGCGATCGCCC
+TGAATCCAACGCGGGCGACCCGCCGCACCCGGCGACAAGCGCCGAGCTTGCGATCGCCCGTAAACTGCCC
+GGGTGGTAACCACCCGGGCACGCCTGGCCCTAGCCGCCGGCGCGGGCGCACGCTGGGCGTCGCGGGTCAC
+CGGTCGCGGCGCCGGAGCGATGATCGGCGGTCTGGTCGCCATGACCCTGGACCGCTCGATCCTGCGCCAA
+CTCGGGATGGGCCGGCGCACCGTCGTCGTCACCGGCACCAACGGCAAGTCGACCACCACACGGATGACCG
+CGGCCGCGCTGGGCACGTTGGGAGCCGTGGCCACCAACGCCGAGGGCGCCAACATGGACGCCGGCCTGGT
+GGCCGCGCTCGCCGCTCACCGCGACGCCGAGCTGGCGGTGCTGGAAGTCGACGAGATGCACGTACCGCAC
+ATCTCCGATGCCGTCGATCCCGCCGTCGTCGTCTTGCTCAACCTCTCCCGAGACCAGCTGGACCGGGTCG
+GCGAGATCAACGTCATCGAACGCACACTGCGGGCCGGGCTGGCCCGGCACCCCGACGCTGTCGTGGTCGC
+CAACTGCGACGACGTGCTGATGACCTCGGCCGCCTACGACAGCCCCAACGTCGTTTGGGTGGCTGCCGGC
+GGCGCGTGGTCAAACGATTCGGTCAGCTGCCCGCGCAGCAGCGAGGTCATCGTTCGCAAGGCCCCCTCTC
+AGGAAGACCACTGGTACTCCACCGGCGCCGACTTCAAGCGGCCCGCCCCGCACTGGTGGTTCGACGACGC
+CACGCTGTATGGGCCCGACGGGCTGGCGCTGCCGATGCGGCTGGCACTGCCAGGCTCGGTGAATCGCGGC
+AACGCCGCCCAAGCCGTGGCCGCCGCAGTCGCCCTCGGCGCCGATCCGGCTGTGGCCGTCGCCGCCGTCT
+GCCAGGTCGACGAGGTCGCCGGACGCTACCGGACCGTTCGTATCGGCGCGCACCAAGCCCGGATCCTGCT
+GGCCAAAAACCCGGCCGGCTGGCAGGAAGCGCTGGCGATGGTCGACAAGCATGCAGACGGGGTGGTCATC
+GCGGTCAACGGGCGGGTTCCTGACGGCGAGGACCTGTCCTGGTTGTGGGACGTGCGCTTCGAGCACTTCG
+AGACGACCCGAGTGGTAGCCGCTGGGGAGCGCGGCACCGATTTGGCGGTTCGCCTCGGATATGCAGGCGT
+CGAGCACACCCTGGTGCACGACACCGTGGCCGCCATCGCCTCATGCCCACCCGGGCGGGTGGAGGTCGTC
+GCCAACTACACCGCGTTCCTGCAGCTGCAACGAGCATTGGCGCGTCGTGGCTGATTCTGTGGTGCGGATC
+GGGCTCGTGCTGCCCGACGTGATGGGCACCTACGGCGACGGCGGCAACGCCGTGGTGCTACGACAGCGGC
+TGCTGCTGCGCGGCATCGCCGCCGAGATCGTCGAGATCACGCTGGCCGATCCGGTGCCGGATTCGCTGGA
+CCTCTACACGCTGGGCGGAGCGGAGGACTACGCGCAGCGGCTGGCCACCCGGCACCTACGTCGATATCCG
+GGCCTGCAACGCGCGGCGGGCCGGGGTGCTCCAGTATTGGCGATCTGCGCGGCCATCCAGGTGCTTGGGC
+ACTGGTACGAGACGTCGTCGGGAGACCGGGTCGACGGCGTGGGGTTGCTGGATGTGACCACGTCACCGCA
+GGATGCGCGCACCATCGGCGAGTTGGTCAGCAAGCCGTTGCTGGCCGGTTTGACCCAACCCTTGACCGGT
+TTTGAGAACCACCGCGGCGGCACCGTCCTCGGGCCCGGAACGTCGCCCTTGGGCGCGGTGGTCAAGGGAG
+CCGGCAACCGGGCCGGCGACGGTTTTGATGGCGCGGTTGCGGGCAGCGTGGTCGCGACCTACATGCACGG
+GCCGTGCCTGGCCCGCAACCCGGAGCTTGCCGACCTGCTGCTGAGCAAGGTGGTTGGTGAGCTGGCGCCG
+CTGGATTTGCCCGAGGTGGACCTGCTGCGCCGCGAACGGCTATCCGCGCGTTAGGTGGGGCGTTAGGGCC
+GCCATCCCCTGGCCAGCAGAGCGGCACGCACGCGGTTCACCACGTCGTCGGGGTTGTCCTCGGCGATCAC
+GCGAATGACGATCCAGCCCAACTCGGCCAGCTTGCGGAGCCGCCGCTGGTCTTTCACGTAGCGACCGCGG
+TCGCTGCGATGCTGATCACCGTCGTACTCGGCGGCCACCATGTATTTCTCCCAGCCCATGTCGAGCACGC
+CAACGTTGCGCCAGCGGTGGACCACCGGAATTTGCGTCGTGGGGACCGGCAGGCCGGCGTCGATCAACAA
+CAGCCGCAGCCAGGTCTCCTTGGGCGACGCGGCGCCGCCATCAACAAGGGGCAGCACGTCACGCAACCGG
+CGGACACCTCGGGCGCCCGCGTGACGCTTGGCCAATAGAAGCACGTCGTCGCGGGAAAACGGGGTGGCAC
+GCATGAGGGCATCGAGACGAGCCACGGCTTCGCCGCGGGACAGATGGCGGCCGAGGTCGTATGCCGTCCG
+CGCCAGTGTGGTGACCGGCAGGCCCACCACCCTGGTGATCTCGTCGTCGCACAAGGTCTCACGACGTATG
+ACAAGACCGTGCTGCGGGCGGGTAGTGGGAGAAATCAGCTCGATGGCCACGTCGACGTCCACCCACTGAG
+CACCATGCAGCGCAGAGGCCGCATTACCAGCTATGACGCCATGGCGCCTCGTGGCTAGCCAGGCGCCAAC
+CGTGCGATCCCAAAGTGTGGGCACTGAGCGCCTCGAGACGTACACACCGCGGAACATCGGCTGATACCAA
+CGTTGCAGCTCGTGCCTGGTCAGGCGACCAGCGGTGATGGCCTCGCTGCCGATGAAGACGTCACCCATGA
+CGGACATGCTGGCACTCCGCACCGACATCCGTGAGATCAACATTTTGCAGGCAAGGTGCGAGTAGCGGCC
+TGCAGAACGTTGATCTCGGCGAAAGTCGGATGTCGGCGAATCAGGCGAGCACGCGGCGGCCGGCGAGCGC
+TCGGCCCAGGGTGAGCTCGTCGGCGAATTCCAGGTCACCGCCCATCGGCAGCCCGGACGCGATCCGTGTG
+ACGGTCAGGCCGGGGATGTCGCGCAGCATTCGCACCAGGTAGGTGGCCGTCGCCTCGCCCTCGGTGTTGG
+GGTCGGTGGCGATGATGACCTCGGTGACGTCGACGTCGTCGACCCGTTCCCCGATGCGGCTCAGCAGTTC
+GCGGATCCGCAGCTGATCCGGCCCAATTCCGGACAGCGGGTCAAGCGCCCCGCCCAGGACGTGATAGCGA
+CCCCGGAACTCGCGGGTGCGCTCGACGGCCTGGATGTCTTTGGGTTCCTCGACAATGCACACCACGGACG
+CATCGCGACGGATATCAGAGCAGATTCTGCAACGCTCGTTGTCAGAGACATTCCCACACACCGCGCAGAA
+TCGCACGCCGTCCCGAACCTTCGCCAGCACACCGGTCAGCCGGTCGATGTCCGACGGTTCTACCGACAAC
+AGGTGGAAGGCGATTCGCTGCGCACTCTTGGGTCCGATCCCCGGCAACTTGCCGAGTTCGTCAATCAGGT
+CCTGGACGGGTCCCTCAAACATGTCGGTGCAGGTCAGATCCCTGGTACAGGTGGTGCGCCCGGCGCACCC
+GGCATACCCGGCATACCCGGCATACCTGGCGCTCCCGGCGGCGCAGCCGGTGGTGCCGGCGGGCGCATCG
+CGCCGGCCAATGCACCCAGCCGTTCCTGCGCCATCTTCGTCACCTGCTGGGACGCGTCGCGCATCGCACC
+GACGATCAGGTCCTGCAAGGTCTCGATGTCGTCGGGATCGACGACCTTGGGGTCGATCGTCACGCCGATC
+ACCTCCCCGCTGCCTTTGACGACGACCTTGACCAGGCCCCCACCGGCTTGACCGTGCACCTCAGAGTTCG
+CCAGCTGTTGCTGGGCCTCCAGGAGCTTTTGCTGCATCTGCTGCGCCTGAGCGAGCAGCGCCGACATGTC
+GCCTCCGGGTTGCATGACAGTCCCCTAGCATCTTGGTCTCGAGTTGGTTTCGCCTGTGGTTGTCGGGCGA
+TTCGGAACATTCAGCCTAGACCGCGCCGCGTTACCTTTGCGCCGTGGACCTACGAGTTGGCCCGCGTGTC
+GGGTTCGCCATGATAGTCGGGGTACTCGTCGCAGCAGCGACGCCGATCATCTCGTCCGCGAGCGCAACCC
+CCGCCAACATCGCCGGCATGGTCGTCTTCATCGACCCCGGACACAACGGAGCCAACGACGCATCGATCGG
+CCGCCAGGTACCCACCGGTCGCGGCGGCACCAAGAACTGCCAGGCCAGCGGAACGTCAACCAACAGCGGC
+TACCCGGAGCACACCTTCACCTGGGAAACCGGGCTGCGGCTGCGGGCCGCGTTGAACGCATTGGGGGTTC
+GGACCGCCCTGTCACGTGGCAACGACAACGCGCTCGGACCGTGTGTCGATGAGCGCGCCAATATGGCCAA
+CGCGTTGCGCCCCAACGCGATCGTGAGCCTGCACGCCGACGGCGGACCGGCGTCTGGCCGCGGATTCCAC
+GTCAACTACTCGGCCCCGCCGCTCAACGCGATACAGGCCGGTCCCTCGGTTCAGTTCGCTCGAATCATGC
+GCGACCAGCTGCAGGCCTCGGGCATTCCGAAGGCGAACTACATCGGCCAGGACGGCCTGTACGGACGTTC
+GGACTTGGCCGGCCTGAACCTAGCCCAATATCCGTCGATCCTGGTCGAGTTGGGCAACATGAAGAACCCC
+GCGGACTCGGCGCTGATGGAGTCCGCCGAGGGCAGGCAAAAATACGCCAACGCCCTGGTTCGCGGCGTCG
+CCGGCTTCCTGGCCACCCAGGGCCAGGCGCGTTAGCCCCGCACACAGGCGGCACCCCCACCGCGCCCGCA
+TCGTCGTCAGGCGTCACCCTCGAGTTCGGTCTTGAGGTTGGACAGCACCTCGGCCTGGATCTTCTTCAGC
+CCTAGCGGCGCAAAGGTCTTCTCGAAGAAACCCTTGACCCCGCCCGCGCCGGTCCAGGTGGTCTTCACCG
+TGACGCTGGAACCGGGTCCGGCGGGAGCGACCGTCCAGTTGGTGACCATGGACGAATTCATGTCCTTCTC
+GATGACGGTGTGCCCGGCAACGTCCACGTTCACCTGCACATCGCGAACACGCGACTGCGTCGCCTGCAGC
+CGCCACTTGGCGACTGTGCCCCGCCCCTTGCCGCCCTCGAGCACCTGGTACTCGCTGTAGTGCGGGGACA
+GGATTTTAGGACGGACGGTCTCATAGTCGGCCAGCGCGTCGAGTGTGGCCGTGGGCTCAGCATTGATCAA
+GATCGTGCTGGCTGCGCTCACCTGTCCCATCAGGGCCGGACTCCTTCGTTTGTGATTGCTGCACCGCCCG
+CACCCGGATGCAGGGGCAGTTGTCGAGGACTAGGGTATATGCGGTGCCTGTCCCTGGATCTGCACAGTCG
+GCTTACGCCTGCGGCGTCGAGCGGTTGCTGGCGAGCTATCGATCCATCCCCGCGACTGCATCCATCCGGC
+TTGCCAAGCCCACCTCAAATCTGTTCCGCGCCCGCGTCAAACACGATGCACGCGGCCTGGACGCATCGGG
+ACTGACCGGTGTCATCGGTATCGATCCCGAGGCCCGCACCGCCGACGTGGCCGGCATGTGCACATACGAG
+GACCTAATCGCCGCGACACTGCACTACGGTCTGTCACCATTGGTGGTTCCGCAGCTGAGGACGATCACAT
+TGGGCGGAGCGGTCACCGGCTTGGGTATCGAGTCGGCGTCGTTCCGCAACGGCCTGCCCCACGAGTCGGT
+GCTGGAGATGGATATCCTCACCGGCGCAGGAGAACTTCTCACCGTCTCGCCCGGACAGCACTCCGACTTG
+TACCGTGCATTCCCTAACTCGTATGGGACACTGGGCTATTCAACCCGGCTTCGAATCCAGCTGGAGCCGG
+TCCGGCCGTTTGTCGCGCTGCGGCACATCCGATTTAGCTCGTTGACGGCGATGGTGGCCGCAATGGAGCG
+CATCATCGACACCGGCGGACTGGACGGCGAATCGGTGGACTATCTCGACGGGGTGGTTTTCAGCGCTGAC
+GAAAGCTACCTGTGCATCGGCATGCAGACGAGCGTACCGGGCCCGGTCAGCGACTACACCGGACAAGACA
+TCTACTACCGGTCGATCCAACACGAGGCGGGGATCAAGGAAGACCGGTTGACCATCCACGATTACTTCTG
+GCGCTGGGACACCGATTGGTTCTGGTGCTCACGATCGTTTGGTGCCCAAAACCCGCGGCTGCGCCGCTGG
+TGGCCGCGGCGCTACCGGCGTAGCAGTGTCTACTGGAGGTTGATGGCGCTCGATCAGCGCTTCGGGATCG
+CCGACCGGTTCGAGAACAGCAGGGGTCGTCCCGCGCGTGAACGGGTGGTGCAGGATATCGAAGTGCCGAT
+CGAACGGACCTGCGAGTTTCTGGAGTGGTTCGGGGAAAACGTGCCCATTTCGCCAATCTGGTTGTGCCCG
+TTGCGGCTACGCGATCACGCCGGCTGGCCGCTGTACCCGATCCGGCCTGACCGTAGCTATGTCAACATCG
+GGTTCTGGTCGTCGGTGCCGGTTGGCGCCACCGAGGGCGCCACCAACCGCAAGATCGAGAACAAGGTGAG
+TGCGCTCGACGGGCACAAGTCGCTCTACTCCGACTCCTTCTATACCCGCGAGGAGTTCGACGAGCTCTAC
+GGCGGCGAGACTTACAACACTGTGAAGAAAGCCTACGATCCCGATTCGCGTCTCCTCGATCTTTACGCAA
+AGGCGGTGCAACGACGATGACAACGGGCAGACTCAGCATGGCCGAGATCCTGGAGATCTTCACCGCGACC
+GGGCAACACCCGCTGAAGTTCACCGCGTATGACGGCAGCACCGCGGGACAAGACGACGCCACACTGGGCC
+TGGATCTTCGGACGCCCCGCGGCGCCACCTACTTAGCTACCGCTCCCGGCGAACTCGGCCTGGCCCGCGC
+TTATGTGTCGGGTGACCTACAGGCACACGGAGTACATCCCGGCGATCCGTACGAACTGCTCAAAACGCTG
+ACCGAAAGGGTCGACTTCAAACGGCCGTCGGCGCGGGTGCTGGCTAATGTGGTGCGCTCGATCGGCGTTG
+AGCACATACTGCCCATCGCGCCGCCACCCCAAGAGGCGCGACCCCGGTGGCGTCGAATGGCTAATGGCTT
+GCTGCACAGCAAGACCCGTGACGCCGAGGCTATCCATCACCACTACGACGTCTCCAACAACTTCTACGAG
+TGGGTGCTCGGGCCATCGATGACCTACACGTGCGCGGTGTTTCCGAACGCTGAGGCTTCGCTGGAGCAGG
+CCCAAGAGAACAAATACCGACTCATTTTCGAAAAGCTACGGCTAGAGCCGGGTGACCGGCTACTCGACGT
+CGGCTGCGGCTGGGGCGGCATGGTGCGCTACGCCGCCCGACGCGGTGTCCGGGTGATCGGCGCCACGCTC
+TCGGCCGAGCAGGCCAAGTGGGGCCAGAAAGCAGTCGAGGACGAGGGATTGAGCGACCTCGCGCAGGTGC
+GGCATTCCGACTACCGCGACGTAGCCGAGACCGGTTTCGACGCCGTTTCTTCGATCGGGCTAACCGAGCA
+CATCGGCGTCAAGAATTACCCGTTCTACTTCGGGTTTCTCAAGTCGAAGTTGCGCACCGGCGGCTTGCTG
+CTCAATCACTGCATCACCCGCCACGACAACAGGTCGACGTCCTTTGCCGGCGGGTTCACCGACCGTTACG
+TTTTCCCCGACGGGGAGCTGACGGGCTCGGGACGTATTACCACCGAGATCCAGCAGGTCGGCTTGGAAGT
+GCTGCACGAGGAGAACTTCCGCCATCACTACGCGATGACGCTGCGCGACTGGTGCGGCAACCTCGTCGAA
+CACTGGGACGACGCGGTCGCCGAGGTCGGTCTGCCGACCGCCAAGGTGTGGGGCCTGTACATGGCGGCTT
+CGCGGGTGGCCTTCGAACGAAACAACCTGCAGCTACATCACGTATTGGCGACCAAGGTGGACCCCCGGGG
+CGACGACAGCTTGCCACTGCGGCCCTGGTGGCAGCCCTAGGCGTTGTCTATCCGGCGCGCGCCCAGCTCG
+TTCTGCAGCAGCTCGAGTGCAACCTCTTCCGGGTCGCGACGCGGCGACGGGTCGCCACGGCCGGCTTCGG
+CGAGCATGTGCTCCTCTTCGTCGCGCTGAGTGGAATTCGCTGTGGGGGCAGGGTTTACGGCCTTGGCGGT
+CGCCACGTTCGCTCCCCCGCCGACGGGTGATGCCGCCGCAGCCGGTTCACCGGTCTCACACCGCACCCGC
+CAGTTGACTCCCAGCGCGTCTTTAAGCGCCTCGGCGAGGACATCGGCGTTGCGCTGTTCGGACAGCCGCC
+GCGCCAGCGGCGCCGATTCGTGGGTCAGCACCAGCGTGTTGTCCTCTAGCGCACGGACGGTGGCACCCGC
+CAGCATCACCTCGGTGGTACGGCTGCGCAGGCGCACCTTGTCGCGCACCGTCGGCCACATGGACCGAACC
+GCGGCCACGGTGGGTTCGCTCGAGGCCGGTGTGGGGGCCAGCACCGGTCTCGGTTCACGCGCGGGCTGGT
+GTTTCGGCTCGGCAGCCGCAGCCGACGGGCGTGGTACGGCTTGCGGCGCCGGGATCGACATGTCCAACCG
+GGTCTCGATCCGTTCGACCCGCTGCAACAGTGCCGATTCGGCGTCGCTCGCCGAGGGCAGCAGCAGTCGC
+GCGCAAACCACTTCCAGCAGCAGACGCGGCGCGGTCGCACCGCGCATCTCGCCTAGCCCGGCCTGCACCA
+CCTCGGCATATCGGGTCAGGGTCGCCCGCCCGATCCGGGCGGCTTGCTCGCGCATCCGATCCAGCGCGTC
+TTCGGGCGCATCCACCACCCCGCGAGATGCCGCGTCGGGAACCGATTGCAGCACAATCAGGTCGCGGAAT
+CGCTCCAGCAGATCGGTAGCGAAACGCCGAGGGTCATGTCCGCCATCGATCACCGATTCGATCGCCCCGA
+ACAATGCGGCCGCATCGCAAGCGGCCAGTGCGTCGACCGCGTCGTCGATCAGGGCGACGTCGGTGACACC
+CAGCAGCCCCAGCGCCCGGGTGTAGGTCACGTGGGTGTCCGCGGCCCCAGCCAGCAATTGGTCCAGCACC
+GAGAGCGTATCCCGTGGGGAACCTCCGCCGGCCCGGATCACCAACGGGTACACCGCATCGTCGACGACGA
+CGCCCTCCTGCTCGCAGATCCGCGCGAGCAACGCCCGCATAGTGCGCGGCGGCAGCAGCCGGAACGGGTA
+GTGATGAGTGCGCGACCGAATCGTCGGCAGTACCTTCTCCGGTTCGGTGGTGGCGAATATGAAGATCAGG
+TGTTCGGGCGGTTCCTCCACGATCTTGAGCAGCGCGTTGAATCCCGCGGTGGTCACCATGTGCGCCTCGT
+CGACGATAAATACCCGGTACCGTGACTGGACCGGCGCATAGAACGCGCGGTCCCGCAGCTCGCGGGTGTC
+GTCCACGCCGCCGTGGCTGGCGGCATCCAGCTCTACCACGTCGATGCTGCCGGGGGCGTTGGGCGCCAAC
+GAAACGCAGGATTCGCAGACCCCGCACGGGTTGGCGGTAGGGCCCTGCGCACAGTTCAACGACCGCGCCA
+GGATACGCGCTGACGACGTCTTTCCGCAGCCACGCGGCCCAGAGAACAGGTACGCGTGGTTGATCCGGCC
+GGCATCCAGCGCCACCGACAGCGGCGCGGTGACGTGCTCCTGCCCCACCACCTCCGCGAAGCTTGCCGGT
+CGGTACTTGCGGTAGAGAGCCACGTCAGCAGGCTACCGACCCTAGGCGACGAGTGTGTTCGCAGCGTCGA
+ATGTGAACGTTCGGCGTGATTTCGGCGCGCGGGTTCCCGCTCTCAGCGCACGTTCGGCGCCGAGGAGGCT
+AGTCCCTGGTTAAGCAATGTCTCGGTCGCCGCCAGCAGCGCGCAGGTCGCCAACCCGTCAACCGCGTTGC
+GCAGGTCCGGTACCGACGGAAACGACGGCGCGATCCGGATGTTCTTGTCGTCCGGATCCTTTCGATACGG
+GAACGACGCCCCCGCCTCGGTCACCGCGATACCAACGTCCTTAGCCAAGGCTACGGTCCGGCGCGCGGTC
+CCGGGCAACACGTCGAGGCTGATGAAGTAGCCACCCTTGGGCTCGGTCCAGGAGGCGATCTTGGACTCGC
+TTAGCCGCTGATCCAGAACTTCGGCCACCAACGCGAATTTCGGCGCCAGTATCTGCTGGTGACGCAACAT
+GTGTAGACGTACCCCATCGGCGTCGCCGAAGAAGCGTAGATGCCGCAGCTGGTTGACCTTGTCCGGGCCG
+ATCGACTTCTTCCCGGCGTACTGCAGATACCAGGCGATGTTGCCTAACGATCCACCGAAGAAGCTGACAC
+CGCCGCCGGCGAAGGTGATCTTCGAGGTGGACGCGAAGACGTAGGGGCGGTTGGGGTTGCCGGCCTTGGC
+GGCCAGCCCGAGCACGTCGACCTGGCGCGGGAAATCCAGCGTCAGGGTATGCACCGCATACGCGTTGTCC
+CAGAACAAGCGGAAGTCAGGTGCCGCCGTCCGCATCTGGACGAGTCGGCGAACCGTTTCCCAGGAATAGG
+TGACGCCCGAAGGGTTGCCGAAGACCGGTACCGTCCACATCCCCTTGATGGCTGGGTCGACGGCAACCAG
+TTCTTCGATCAGATCGACGTCGGGCCCATCCTGCAGCATGGGTATCGGGATCATCTCGATGCCCATGGTC
+TCGGTGATGGCAAAGTGCCGGTCATAGCCGGGGACCGGGCACAGGAATTTGATGCCGTCCTGCTCCTGAA
+TCCAAGGCCGCGGCGAGTCCACGCCGCCATACAACATGGAGAAGGCGACGATGTCGTGCATCAATTCCAG
+GCTGGAGTTGTTGCCCGCGATCAGGTTGGGCACTGCGATGCCGAGCAGTTCGGCGAAGATAGCCCGCAGG
+CCCGGCAGGCCGTGCTGGCCACCATAGTTGCGGGTGTCGGTGCCCTCCGGGTCGCGGTAGTCGTCTCCGG
+GCAAGCTCAGCAGCTGGTTCGACAGGTCGAGCTGCTCTGCGGATGGTTTGCCGCGGGTGAGATCCAGAGC
+CAGCTTCATGCCCTGAAGCGCCGCATAATCCTGCTGATGGCGTGCGTGTAGTGCCGCTAGCTCTTGGGGG
+CTAAGAGAGTCGAACGACACCGTGGGCCCTTTCGCCGAGTCGAAAACCGTGGGTATACCGAGGTCCAGTC
+AGTGCCCCGGCTGAAGGGGACCCCGCGCACCCGACAGAGCCCGTTGACCCTTGCTGCCTTCCAGCCCTGG
+GGGAGTTCACAGGATAGACGCCGCGCGGGGTCCACCGTGAGTCTAATACCTGGGCTGGAACGCCCGGGAC
+GGACTCAGCGGGCTACCATATGCTGCGGAGGATTCGCCTAGTGGCCTATGGCGCTCGCCTGGAACGCGGG
+TTGGGTTAACAGCCCTCGCGGGTTCAAATCCCGCATCCTCCGCCAGGTGGTCCGCAGCGCGGACGGGAAC
+GCGGACGGGAACGCGGACGGGAACAATGTGGGCTGGTCGGCTTCTCACCGGCTCGGTTCACCAGCCTAAG
+GAGGGGTATGGGGCGCAAGGTCGCCGTGCTGTGGCACGCGTCGTTTTCGATTGGCGCCGGCGTCCTCTAC
+TTCTATTTCGTATTGCCCCGTTGGCCTGAGCTGATGGGTGACACCGGACACTCGCTGGGGACTGGGCTCC
+GGATTGCCACGGGCGCGTTGGTCGGTCTGGCCGCACTGCCGGTGGTATTCACTTTGCTGCGCACCCGCAA
+GCCGGAGCTGGGCACCCCGCAGCTGGCGCTGTCAATGCGAATCTGGTCGATCATGGCTCACGTGCTGGCC
+GGCGCGCTGATCGTCGGCACCGCGATTAGCGAGGTCTGGCTCAGCCTGGATGCCGCCGGGCAGTGGTTGT
+TCGGGATCTACGGAGCTGCCGCCGCGATCGCGGTGCTCGGGTTCTTCGGGTTCTACCTGTCGTTTGTCGC
+CGAGCTGCCGCCGCCACCGCCGAAGCCGCTCAAGCCGAAGAAACCCAAGCAGCGACGCCTTCGCCGCAAG
+AAGACGGCCAAGGGCGACGAGGCTGAGCCGGAAGCCGCCGAAGAAGCCGAGAACACGGAGCTGGCGGCGC
+AGGAGGACGAGGAGGCCGTCGAAGCTCCCCCGGAAAGCATAGAAAGCCCGGGAGGTGAACCCGAGTCGGC
+GACCCGGGAAGCTCCGGCAGCAGAGACCGCCACCGCCGAGGAGCCCCGGGGCGGGTTACGGAATCGCCGC
+CCCACCGGCAAAACCTCACATCGACGCCGGCGCACTCGCAGCGGTGTCCAGGTCGCCAAGGTCGACGAAT
+AGCCGCGGTCAGGTGCTGTAGCGGCGGCTGTGAACCCTGCGACGCAATGTCGGCGTGTCACGTTGTCGGA
+TTCACTGTCGCCGGCTAGCGCTTTCCCGTCAGAAGACGAGAAGCCTCCCCGATCTCCAACTAGCATCGAG
+ATCGGGCTTGCGAAGGTTGGGTTGCAAAATGGATGTCATCAGATGGGCTCGCCGGCTTGCGGTGGTGGCG
+GGCACAGCAGCGGCAGTGACCACTCCTGGGCTACTGAGTGCGCACGTTCCGATGGTCTCCGCCGAACCGT
+GTCCCGACGTCGAGGTGGTGTTTGCCCGTGGCACCGGGGAGCCACCTGGTATTGGCAGCGTCGGAGGACT
+GTTCGTCGACGCACTGCGTTCCCAGGTTGGCGCCAAGTCACTCGGGGTCTACGCCGTTAACTACCCCGCC
+AGTAACGACTTTGCCAGCAGCGACTTCCCTAAGACGGTCATCGACGGAATTCGCGACGCGGGCTCTCATA
+TCCAGTCAATGGCGATGAGCTGTCCCCAGACCAGGCAAGTACTCGGTGGATACTCCCAAGGTGCGGCCGT
+GGCCGGTTATGTCACCTCGGCTGTGGTACCGCCGGCTGTACCCGTGCAGGCGGTACCGGCACCGATGGCC
+CCGGAGGTAGCAAACCACGTCGCCGCGGTCACTCTGTTCGGCGCACCGTCGGCTCAATTCCTGGGCCAGT
+ACGGCGCGCCGCCGATAGCCATCGGTCCCCTGTACCAGCCGAAAACGCTTCAGTTGTGTGCCGATGGCGA
+CTCGATTTGTGGCGACGGCAACAGCCCGGTCGCGCATGGCCTGTACGCGGTGAACGGCATGGTAGGCCAG
+GGCGCGAATTTCGCCGCCAGCCGCCTGTAGCCAGAACTGCGCTGCCACCCCAGCGAGAGCTGGGCGGTGA
+TCCAATGCAGAATGCCACCATGCGCGTTCTGGTCACCGGCGGTACGGGATTTGTGGGCGGGTGGACTGCC
+AAAGCCATCGCTGACGCGGGCCACTCCGTCCGGTTCCTGGTGCGAAATCCCGCACGGCTGAAGACGTCTG
+TCGCGAAACTGGGCGTCGACGTGTCGGACTTTGCGGTTGCAGACATATCCGACCGCGATTCGGTACGGGA
+GGCGTTGAACGGATGCGACGCCGTCGTGCACAGCGCCGCGCTGGTGGCAACCGACCCGCGTGAGACTTCG
+CGGATGCTGAGTACGAACATGGCGGGCGCCCAAAATGTTCTCGGTCAAGCCGTCGAGCTCGGAATGGATC
+CGATCGTGCATGTGTCGAGCTTCACGGCGCTGTTTCGTCCCAACTTGGCGACGCTGAGCGCTGATCTGCC
+GGTTGCCGGTGGGACGGATGGATACGGACAATCCAAAGCGCAGATCGAAATCTATGCGCGCGGTCTTCAG
+GACGCCGGCGCACCGGTGAACATCACTTATCCTGGCATGGTCCTCGGCCCGCCGGTGGGCGATCAATTCG
+GTGAAGCCGGGGAGGGTGTCCGGTCCGCATTGTGGATGCATGTCATTCCCGGGCGCGGCGCGGCGTGGTT
+GATCGTCGACGTCCGAGATGTGGCGGCACTGCACGCGGCGTTGTTGGAATCCGGGCGTGGGCCGCGCCGC
+TACACTGCGGGAGGTCATCGGATTCCGGTGCCCGAGCTCGCGAAAATTCTGGGCGAGGTCGCCGGCACCA
+CGATGCTGGCCGTCCCGGTGCCCGATTCCGCGCTGCGTGTCGCGGGATCGGTGCTGGATCAAGCCGGGCC
+CTATCTGCCTTTCAATACTCCGTTCACCGCGGCAGGTATGCAGTACTACACACAGATGCCGGAGCCCGAC
+GATTCGCCGAGCGAAAAAGAACTAGGCATCACCTACCGCGATCCGCGCGACACCGTGGCCGACACCGTCA
+CGGCCCTGCGCGGCCTGGGCAGCTAACTGCCGTCGGGAGGTTCCGCCGGTTCCGCGTCGGGGCGCGAATT
+CTTCAACCACTGCTTCAGCCGGAGCAGTTCGTTGACGACGATGCCGACGCCCAGGAGGATGACCAGCGTC
+ACCACAATAGCGGTGGCCACGTAGTCCATGGTGACAGCCCCGCCACGGCGCACGTTCAGGCCGCTTGCTG
+TCGGATCGAGAGGACCTACGCGATGAAGGCGGTGACCTGCACCAACGCAAAGCTCGAGGTAGTCGACCGG
+CCGTCCCCGGCGCCGGCCAAGGGTCAACTGTTGCTCGATGTGCTGCGGTGCGGTATCTGCGGATCGGACC
+TGCATGCCCGCTTGCACTGTGATGAACTGGCCGACGTGATGGCCGAATCTGGCTACCACGCCTTCATGCG
+ATCGAATCAGCAGGTGGTGTTCGGACACGAGTTCTGTGGCGAGGTGGTCGATTACGGTCCCGGCACCCGC
+AGGACCCCTAGGCGCGGCACCCCGGTCGTCGCCATGCCGCTGCTGCGGCGTGGCAACAAAGAGGTGCACG
+GGATCGGGCTTTCGACAATGGCGCCGGGCGCCTACGCCGAGCGGCTCGTCGTCGAGCAGTCGCTGACGTT
+TCCTGTCCCGAACGGGCTGGCGCCCGAGATAGCCGCGCTGACCGAGCCCATGGCCGTCGGATGGCACGCC
+GTCCGGCGCGGCGAGGTGGGCAAGGGCGACGTCGCGATCGTGATCGGGTGCGGTCCGATCGGCCTCGCGG
+TGATCTGCATGCTGAAGTCGCGCGGGGTACACACGGTGATCGCAAGCGACTTTTCACCCGGCCGTCGTGC
+CCTCGCAACCGCCTGTGGCGCTGATTCCGTAGTCGATCCCGTACAGGACTCACCGTATGCGGTAGCCGCC
+GGCCTTGGACAGGGAAACAGACACCTGCAAAGCATCCTCGACGCGTTCGACCTCGCAGTCGGCACGGTCG
+AAAGCCTGCAGCGGCTGCGGCTGCCGTGGTGGCACCTTTGGCGGGCTGCCGAAGCAGCTGGCGCCGCAAC
+GCCAAAGCGTCCAGTCATCTTCGAATGTGTTGGCGTTCCGGGAATTATCGATGGCATCATCGCCAGCGCA
+CCGCTGTTCTCGCGCGTCGTCGTGGTCGGCGTCTGCATGGGCTCAGACCACATCCGGCCGGCGATGGCGA
+TCAACAAAGAGATCAACCTGCGGTTCGTCCTCGGCTACACACCGTTAGAGTTCCGCGACACGTTGCACAT
+GCTGGCCGACGGCAAGGTCAACGCCGCGCCGCTGATCACCGGGACGGTCGGTTTACCCGGCGTGGCGGCA
+GCATTCGATGCGCTCGGCGATCCCGAGGCGCACGCAAAAATCATGATCGACCCCAAGAGCAACGCCGCGA
+GTCCCCAACCATTCCGCGTGGAGTGAATGATGCGGGATAGCCGCACGGCGTTGGATCCACCCGGGACGAC
+AGCTTGAATTCAGGCGGCCTCTGCTTTAAAGCGCACACTACCGCGCCTGCTGCGGCATGGATCCAAATAT
+CCGCCAAAGTACGTATGGACATCCGATAGCCCGGCGCACCTACGACCCGCCGCGCAGACACATTTACGCG
+TTCGCACCGATGGCTGCGGACCCAGCAAATGGCAGAGTTAGAGCGTCGGCCGTGTCTTGAGTCAATGCTT
+CCAGGCCGGCACCTTTTCTCCCGTGGACCGCATGTGCCCACGGTCGCGTCAGTACCGCCCGAATCATTCC
+TTGAGGCCTATTGCAGATGAAACCGTCGCCTGCCGATACCCACGTCGTGATTGCCGGTGCTGGCATCGCG
+GGATTGGCTGCCGCCATGATCCTGGCCGAAGCCGGGGTGCGAGTCACATTGTGCGAAGCTGCATCCGAAG
+CTGGGGGCAAGGCCAAGAGTTTACGTCTCGCGGACGGCCACCCGACCGAGCACAGTTTGCGGGTTTACAC
+CGATACTTACCAAACCCTGCTGACGCTGTTCTCGCGTATACCCACCGAACATGACAGGACCATGCTAGAC
+AACCTGGTCGGCGTCAGCATGGTTTCGGCTACCGCGCAAGGCGTGATTGGCCGAATCGCTGCGCCAGTTG
+CCTTGCAACGCCGGCGGCCAACCTTCGCGCGGATCATAGGCAAGGTAGTCGAACCGCCGCGGCAACTTGT
+CCGGATCTTGTTGCGCGGCCCAATGGTAATCGTTGGTCTGGCCCAACGAGGTGTGCCGGCCACCGACGTC
+CTCCATTACCTCTACGCCCATCTACGGCTGCTGTGGATGTGCCGAGAGCGACTCTTGGCGGAGCTGGGCG
+ATATCTCGTATGCGGATTATCTGCAGCTCGGCTGCAAGTCTGCCCAGGCGCAGGAATTCTTTTCTGCTGT
+GCCGCGCATTTACGTCGCGGCGCGCACCAGTGCCGAAGCGGCGGCCATTGCGCCCATCGTTCTCAAGGGG
+CTGTTTCGCCTGAAAAGTAATTGTCCATCAGCCCTCAACGACGCAAAGCTGCCCGCGATCATGATGATGG
+ATGGACCGACCAGCGAGCGCATGGTCGATCCCTGGATTCGCCACCTGACAAGGCTCGGCGTGGACATCCA
+CTTCAACACGCGTGTCGGCGATCTCGAGTTCGACGACGGTCGCGTCACCGCATTGATATCGTCCGATGGC
+CGCCGGTTTGCCTGCGACTATGCCCTGCTCGCGGTGCCCTATCTGACGCTGCGAGAGCTGGCCAAATCAG
+CTCATGTCAAGCGATATCTCCCTCAGCTCACACAGCAGCACGCCCTTGCGCTTGAGGCATCGAACGGAAT
+CCAGTGTTTTCTGCGCGACCTCCCTGCGACGTGGCCTCCGTTCATCCGCCCTGGAGTCGTCACTACGCAT
+CTGCAAAGCCAGTGGTCGCTGGTCTGCGTTCTGCAGGGAGAAGGTTTCTGGAAAAACGTCCGCCTGCCGG
+AAGGAACCCGCTACGTTCTGTCAATAACCTGGAGTGATGTGGAAACGCCCGGACCTGTTTTTGATCGGCC
+ATTGAGTGAATGTACGCCAGATGAGATCTTGACCGAGTGCCTGACGCAGTGCGGCCTCGATAAATCGAAC
+GTCTTGGGCTGGCGGATCGATCACGAGCTGAAGCACTTAGACGAGGCCGAATACGAAAAGGTGGCGAGCG
+AGCTGCCTCCTCATCTTGTCTCGGCGCCTGCGCGCGGGCAGCGCATGGTGAATTTCTCGCCGCTTACCGT
+ATTGATGCCGGGCGCGCGCCACCGCTCCCCGGGTATTTGCACCTCAGTGCCTAACCTTTTGCTAGCCGGT
+GAGGTGATCTATTCACCCGACCTGACCTTGTTTGTTCCGACCATGGAGAAGGCGGCATGCTCCGGCTATC
+TGGCCGCCCGCCAAATCATGAACATGGTTGCTTCGCACGCCGCACCGCTGCGGATCGACTTCCGGGATCC
+CGCCCCATTTGCGGTTCTGCGGCGGGTGGACCGATGGTTTTGGAGCCGCCGCCGACGACCGCCAGACCGG
+TCGACATTTGCAACCCCACCAACCGCCATGCCGGCGCCGAGCCACCTGACCGACGTGGATCGCTCTGCAA
+GTTAGCCGCCGGTAACCCACCAAGCCTCGTCACGCTACAAGTCCACCGTTGAACCGACGGCGTTGACGCG
+TCACATATCCCTGATCCTTCAAGAACGTGGAGTTTCCCTTGACTGTGCACACCGTCGCCACCAACAATGC
+TGCGCCCGTCATAGCCGCCGGTCCCGTCGGCCCTAGCAGACGACGCCGTCGCGTGCACGCCCCACTTACG
+CGACGCCGCCAACCCTCCTCCTCGGCGGTGCTGCTGGTGGCGGCTTTCGGCGCCTTCCTCGCTTTCCTTG
+ACTCCACGATCGTCAACGTCGCGTTCCCCGATATCCAGCGGCACTTCCACAGCGACATCAGTGACCTGTC
+CTGGATGCTCAACGCCTACAACATTGTTTTCGCGGCGTTCCTGGTGGCCGCCGGCAGGCTGGCCGACCTG
+ATGGGGCGCAAGCGGGTGTTCATCTTGGGGGTGGCGTTGTTCACCGTCGCGTCCGGGCTGTGCGCGATCG
+CCGAAAGCGTCGGGGAACTGGTTGCGTTCCGTGTGCTGCAAGGCATCGGCGCAGCGGTTCTGGTACCGGC
+TTCGCTGGGGCTGGTCGTCGAGGCCTTCCCGGCCGAGCGGCGCGCGCACGGGGTCAACCTGTGGGGTGCG
+GCGGGGGCCATCGCCGCGGGCCTCGGCCCGCCGATCGGTGGCGCCCTCATCGAGGCGGATGGCTGGCGGT
+GGGTGTTCCTGGTGAACCTTCCGCTGGGGGTATTCGCTGTGCTGGCCGCTCGGCGGGCACTGGTGGAGAA
+CCGGGCCGCCGGACGTCGGCGTGTGCCCGACGTGCGCGGCGCGGTGCTGCTGGCTTTCGCGCTGGGCCTT
+TTGACGCTGGGATTGATCAAGGGCCCGGATTGGGGTTGGGCCAGCCTGCCGACCAGCGGGTCATTGCTGG
+CCGCGGCGGTCGCGATGGTTGGGTTTGTGATGAGCTCACGACACCACCCGGCACCGATGGTCGAGCCCAC
+GCTGTTGCGCATCCAGTCGTTCGTGGCCGGCACCGGGCTGACCGCCGTGGCCAGCGCCGGCTTCTACGCC
+TATCTGCTGACGCACGTGCTGTTCCTCAACTACGTCTGGGGTTACACGCTGCTGGAGGCTGGCATGGCCG
+TCGCCCCCGCCGCGCTGGTCGCCGCCGTCGTCGCGGCGGTGCTTGGCCGCGTCGCCGACCGGCACGGTTA
+CCGCTTCATCGTCGGCATCGGCGCGTTGATCTGGGCTGCCAGCCTGCTGTGGTATCTCAAGGTTGTCGGG
+TCCCAGCCCGATTTCCTCGGTGAATGGCTGCCCGGCCAGATACTGCAGGGAATCGGGGTGGGCGCTACCT
+TCCCGCTGCTCGGCAGTGCCGCCTTGGCCCGGCTGGCCAAGGGCGGCAGCTACGCCACCGCTTCGGCGGT
+GACCGGCACCATCCGCCAGGTTGGCGCCGTCATCGGCGTCGCGGTGCTGGTGATCCTGGTCGGCACACCG
+GCACCGGGCGCAGCCGAAGAGGCGTTGCGTCACAGGTGGGCGTTGGCCGCGATCTGTTTCGTGGCGGTGG
+GGATCGGGGCGCTGTCGCTGGGTCGCATCCGCCCAGTCCCAGCTGCGGTTGAACCCCCGCCGGGGCCGCC
+GGTGGCTCCGTTGGGAGCGCGGCGGCCGCCGAGACCCGCACCGGTGGCCTCACCCGCCGCGGCAGTGGCC
+CCGACCCCCAAGACTTCCCGCGAAGTCAACCTGCTGGAGGCTCTGCGGTTTGCCAGGCCGGACACGCAAC
+AGATTGAGCTGCAAGCAGGCTCGTATTTGTTCCACGCGGGCGATGTGTCCGATGCGCTCTACGTGGTGCG
+CAGCGGCCGCCTGCAAGTCCTCGCCGGCGACGGCGCAAAGGACGAAGTGGTGGCCGAGCTGGGCCGTGGT
+CAGGTGGTCGGGGAGCTCGGGGTGCTGCTCGATGCGCCGCGGTCCGCGTCGGTTCGTGCGGTACGCGACT
+CGTCCCTGATGCGAGTGACCAAGGCCGAATTCGCGAAGATCGCCGATGCCGGGGTGCTTGGGGCGCTGGC
+GGGGGTACTGGCCAAACGACAGCACCAGACACGCGTGGCCTCTCAGCGGACAACGCCGGAGGTCGTTGTC
+GCGGTCGTCGGTGTCGACGCCAATGCACCGGTCGCAATGGTGGCCACCGAATTGTGCAGGGCACTGTCGA
+CACGGCTACGTGCTGTCGCCCCCGGCCGGGTCGACTGCGACGGGTTGGAACGTGCCGAGCAGACCGCCGA
+CCGGGTGGTGCTGCATGCGGCCGTCGGCGACGCGCGGTGGCGGGAATTCTGTTTGCGTGTCGCCGATCGC
+GTGGTGCTGGTGGCCAGCAACCCGGCCGTGCCTGTGGCCCCGCTGCCGACCCGAGCGACCGGCGCCGACC
+TGGTGCTGGCCGGACGGCCCGCCGGCCGGGAGCACCGACGTGCCTGGGAGCAGTTGATCACGCCGCGGTC
+GATGCATGTGGTCCGACGCGAATTTGTCGCCGACGACCTGCGGGTGCTCGCCACGCGTATCGCGGGCCGT
+TCCGTGGGGCTAGTCCTCAGCGGTGGGGCAGCGAGGGCGTGTGCCCACTTGGGCGTGCTGGAGGAACTGG
+AGGCCGCCGGGGTCACCGTCGACCGCTTTGCCGGCACCAGCATGGGCGCAATCATCGCGGCTCTGGCGGC
+CAGCGGTTTGGATGCTGCCGGGGTGGATGCGCAAATCTACGAGCACTTCGTGCGCAAGAGCCACGGCGAC
+TACACCCTGCCGAGCAAGGGGCTGATCCGCGGGAAACGCACCCAGTCCACGCTACGCACGATCTTCGGAG
+ACCATTTGGTGGAGGAGCTGCCGAAACATTTCCGCTGCGTCAGTGTCGACCTATTGGCCCGGCGTCCCGT
+CGTGCACCGCCAAGGCCCGCTCGCCGACGTCGTCGGCTGCTCGATGCGGCTGCCTTTTCTGTATGCGCCA
+CTGCCCTACGGCGGCACCCTGCACGTCGACGGCGGTGTGCTGGACAACGTGCCCGTCACCACGCTGGTGG
+GCAAGGACGGCCCACTGATTGCGGTAAACGTGGCCTCTGGCGGAAATCCAAGCCCCGCGTCCGGCGGCCA
+TCGCCGCGGCAAACCACGGGTGCCCGGCCTAACCGACACCCTGCTGCGCACCATGACAATCAGCAGCGCG
+ATGGCATCGGAAAAAGTGTTGGCCCAGGCCGACCTGGTGATCAAGCCCAACCCGATCGGCGTCGGACTCA
+TGGAGTACCACCAGATCGACCGCGCCCGTGAAGCGGGCCGGATCGCGGCCCGTGAAGCGTTGCCACAAAT
+CATGGAGCTGGTGCACGGCTGAACCTGGGCAGGGCCGCTAAGATACTGTGACCACGGCCACGCTATCGGC
+GGCCTGGCCAGCTTTCCGGGCCGCTACCCGATGGGAGTCCTCACCCACGCCGCCGGCGGACCCAACCCCG
+ATTGTTCGACCGCAGACACTGATCTATCGCGCAGGCGTTGCCGCATGGTGGACTAGCCCAATGACGCGGG
+CTGACGGCAAGCGCGACCGTGACGAGATGTTCGTCGAATACACCAAGAGCATCTGCCCCGTCTGCAAGGT
+CGTGGTCGACGCCCAGGTCAATATCCGCCACGACAAGGTGTATTTGCGTAAGCGCTGCCGCGAGCACGGA
+AGTTTCGAGGCCCTGGTGTACGGGGATGCCCAGATGTATTTGGAATCAGCACGATTCAACAAACCGGGCA
+CCTTTCCGCTGCGGTTTCAGACCGAGGTGCGCGACGGCTGTCCCAGTGACTGCGGGCTGTGCCCGGACCA
+CAAGCAACACGCCTGCCTGGGGTTGATCGAGGTCAACACACACTGCAACCTGGACTGCCCGATCTGTTTC
+GCCGACTCTGGCCACCAACCCGACGGCTACGCCATCACCGCGGCGCAGTGTGAACGGATGCTCGACACGC
+TCGTTGCCGCCGAGGGTGAACCCGAAGTGGTGATGTTCTCCGGTGGCGAACCGACCATCCACAAACAACT
+CCTCGAGTTCGTCGACGCCGCCCAGGCCCGCCCGGTCAAGACCATCATCATCAACACCAACGGCATCCGG
+CTGGCCTCCGACCGGCGATTCGTCGACCAGCTCGCCACCCGCAACCGTCCCGGCCACCCCGTGCACATCT
+ACCTGCAGTTCGACGGCCTGGACGAGGCAACACATCGTCGAATCCGGGGCCACGATCTGCGGGACGTAAA
+GCAGCGGGCCCTGGACAACTGCGCCGCGGCGGGCCTGACCGTCAGCCTGGTGGCCGCGGTGGAACGCGGC
+CTCAACGAGCACGAGCTCGGCGCGGTCATCCGCCACGGCATGGCGCAGCCCGGAGTGCAATCGGTGGTAT
+TTCAGCCGGTCACCCACGCCGGCCGGCATGTGCAGTTCGACCCGCTGACCCGACTGACCAACTCCGACAT
+CATCGCCTGCATCACCGCGCAACTGCCCGAATGGTTCAGGCCCGGTGACTTCTTTCCGGTGCCATGCTGC
+TTCCCCAGCTGCCGATCGATCACCTACCTGCTCACCGACGGGGAGCATGTGGTCCCGATTCCGCGGCTGC
+TCAATGTCGAGGACTACCTCGACTACGTCTCCAACCGGGTGATCCCTGACCTGGCGATCCGCGAAGCCTT
+GGAGAACTTGTGGTCGGCGTCGGCGGTGCCAGGCACCGACACCATGACCGCACAGCTACAGCGGGCTACC
+GCCGCCCTGAACTGCGCCGAGGGCTGCGGGATCAACCTGCCCGAGGCCCTCACGCACCTCACCGACCGGG
+TCTTCGCCATCGTCATCCAAGACTTCCAGGATCCCTACACCCTCAACGTCAAACAGCTGATGAAATGCTG
+CGTGCAACAGATCACCCCGGACGGACGGCTGATCCCGTTCTGCGCCTACAACTCGGTCGGCTATCGAGAG
+CAGGTGCGTGAACAGCTCACCGGGGTACCGGTACCCGACATTGTGCCCAATGCCATCCCACTCGCCGGGT
+TGCTGGCGGACGCACCACACGGATCAAAACAGGCCAATACCGGTGGGAGTATCGCCAGGCTCGCGGGGCC
+AACCCGAGGTGCGCCGATGGCACTGCCACCACAGCAGATCAAAGCGTGTTGCGCCGACGCCTATTCCCGC
+GACATCGTCGCCTTGCTACTCGGTGACTCCTTTCACCCGGGCGGCGCGACATTGACCCGTAGGTTGGCTG
+ACCAACTCGGGCTGAGGTCGACAGGCGACCCGCGGCGGGTCGCCGACATCGCCGCCGGGCCCGGCGCCTC
+CGCACGGCTGCTGGCCAGCGACTACGGTGTGGCTGTCGACGGGGTCGACATCAGCGAGATCAACGTGAAG
+CGCGCCCAAGCCGCCGTCGCGCAAACCGGCCTGACCGAGCGGGTGCGCTTCCACCTGGGCGACGCCGAAT
+CAGTCCCGTTGCCCGACGACACATTCGACGCGCTGGTGTGCGAGTGCGCGTTCTGCACATTCCCGGACAA
+GAACGCCGCCGCCCAGCAGTTCGCTCGGATTCTGCGTCCTGGTGGCCTGGCCGGCATCACCGATGTCACT
+GTCGGGGACGGCGGCCTGCCGGCGGAGCTGACCCCATTGGCCGCGTGGGTCGCCTGCATCGCCGACGCCC
+GAACCGTCACCGACTACACCGACATCCTCGAAGGGGCCGGATTGCGCACCCGCCACATCGAGTCTCATGA
+CGAGAGCCTGCTGGACATGATCGACCGCATCGACGCGCGGATCACCGCCTTGCACGTCGCCGCACCGGAG
+ATCCTCGCCGACAACGGCATTCGCCACGACTCGGTGCGCGATTTCACAGCGCTCGCACGCGCCGCGGTAC
+AAACCGGACGAATCGGATACACGTTGATGATCGCGGAAAAGCCGTGATAATCCAGGAAATGTGGGACAGA
+CCAATCGCATTTCCCGCATCTGAGGAGCGAGCCGCACCGCGTTACTTCGACGTGTTTCCCCCCTTCAAGT
+CGGTATCCCGGCTCGGCTGCACCCGCTTGGGTTCGCCCGGCATCTTCGGATAGTTCGGCGGATACGGCAT
+GTCACCGAGCCCGCGCTCCTCGTCGGCGGCGGCCAAGTCCAGCAATGGTGCAATCGACTGGGCCACGTCG
+TCCATCCCGGCCCAGGGGTCGTCGCGGATCTTCACCAGCTCGGGCACCGTGGTCATGGTGTAGTCGTCGG
+GATCCGCGCCGGCCAGCTCTTCCCAGGTCAACGGCATCGATACCGTCGCGATCGGGGTAGGACGCACCGA
+ATAGGCCGACGCCATGGTGCGGTCGCGGGCGTTTTGGTTGAAGTCGATGAAGATACGCGCGCCCCGTTCT
+TCCTTCCACCACGACGTCGTCACCGCATCCGGTGCGCGGCGCTCGACTTCCCGGGCCAACGCAATGCCCG
+CCCGACGCACCTCGACGAAGTCCCAGTCGGTGGCGATGCGCAGGAATACGTGAATCCCTCTACCCCCGGA
+TGTCTTCGGATAACCGACCAGACCGAGGTCGTCCAGCACGGACCGGAGCACATCGACGGCGACCGTACGC
+GCCTCCACAAAGCCGGTGCCCGGTTGCGGATCTAGATCGATGCGCAATTCGTCGGGGTGCTCGGTGTCGG
+GGCAGCGCACTTGCCACGGGTGCAGGGTGATTGTGCCCATCTGCGCCGCCCATACGATCGCCGCCGGGTG
+GGTCACCTTCAGCGCGTCAGCCATCCGCCCCGACGGAAACGTCACCCGGCACGTCTGCAGGTAGTCAGGG
+CGGTGCCGCGGGATCCGCTTTTGGTAGATCTGCTCGCCGTCGACGCCGTCCGGGAAGCGCTGCAAGTGCG
+TCGGCCGGTCACGCAGCGCCGTCAGCATCGGACCCCCGGCCACGGCGAAGTAGTACTCAACGAGGCGGCG
+CTTGGTGCCGTGCGACCCCAGCTTCGGGAAATACATCCTGTCCGGGCTAGTCAACCGCACCGCGATGCCG
+TCGACGTCGAGTTCCTCAGCTGCCGCCGCCATATCGGAATTCCAGCATGCCGCACGCAAGAATGAGCACA
+TGCAGTTACCCGTCATGCCGCCGGTGTCGCCGATGCTGGCCAAATCGGTCACCGCAATCCCGCCGGACGC
+GTCGTATGAACCCAAATGGGACGGATTCCGCTCCATCTGCTTTCGCGACGGTGATCAGGTCGAACTGGGT
+AGCCGCAACGAGCGGCCGATGACCCGCTACTTCCCCGAGCTGGTCGCCGCGATCAGGGCCGAGCTGCCGC
+ATCGCTGTGTGATCGACGGGGAGATCATCATCGCCACCGACCACGGCTTGGACTTCGAGGCGCTGCAACA
+GCGCATCCATCCTGCCGAGTCGAGGGTGCGAATGCTTGCCGACCGCACACCAGCCTCCTTCATCGCATTC
+GACCTGCTGGCCCTCGGCGACGACGACTACACCGGGCGACCGTTCAGCGAAAGACGAGCCGCTCTGGTCG
+ATGCCGTAACTGGTTCGGGGGCCGACGCTGACCTGTCGATCCACGTCACCCCGGCAACCACCGACATGGC
+GACCGCACAACGATGGTTCTCCGAGTTCGAGGGGGCCGGTCTAGACGGTGTCATCGCCAAACCGCCGCAC
+ATCACCTATCAACCGGACAAACGCGTTATGTTCAAGATCAAACACCTGCGGACCGCCGATTGCGTGGTGG
+CCGGCTACCGGGTGCACAAGTCCGGCAGTGACGCGATCGGCTCACTGCTGCTAGGGCTTTACCAGGAGGA
+CGGCCAACTCGCGTCGGTCGGCGTGATCGGCGCGTTCCCCATGGCCGAACGACGCCGGCTATTAACCGAG
+CTGCAGCCGCTGGTCACCAGCTTCGACGACCACCCATGGAACTGGGCCGCCCACGTTGCCGGCCAGCGCA
+CCCCACGTAAGAACGAGTTCTCCCGCTGGAATGTCGGCAAAGACCTGTCGTTCGTGCCGCTGCGACCCGA
+GCGGGTGGTCGAGGTCCGCTACGACCACATGGAAGGCGCGCGGTTCCGCCACACCGCACAGTTCAACCGG
+TGGCGCCCCGACCGCGACCCACGCTCATGCAGCTATGCCCAGCTCGAACGCCCGCTCACCGTCAGCCTCT
+CCGACATTGTGCCGGGCCTACGCTAAGGTGCGACCCTCTTCGGTCAGTTGATCCCCGGTGGGCCGATCGG
+CTCGGGCGCCACATCCGGGTCGGTTCGTTGCGTTCGGCCGCGTAACATCTGCGGCATGGCGGTGCTGCCC
+GCGTGCCGGTTGGGACTTGTCGTCTGTGTGGCGACCGCAGTGATCACAGCAACCATGGTGTTGGCTACGC
+CGAGCTATGCATGCGCCTGCGGTGCCGCGGTCACAGCACATGGCTCCCAAGCAACTTTGAATCATGAAGT
+CGCGCTGCTTCATTGGGACGGGACGACCGAGACGATCGTCATGCAGCTGGCAATGAACGCCGATACCGAC
+AACGTTGCCTTGGTAGTGCCCACCCCGACGCCGGCGATAGTTACAACCGCGGACCAGTCCACGTTCGGCG
+AGCTGGACACGCTCAGTGCGCCGTTGATCGAGCATCAGCGACATTGGAGCTTAAGGCGCGGTGTCGGTGC
+CTCCGGTCCCCAGGAGGCCGCCGCCCGGGCCCCGCATGTGCTCAACCAGGTTCGCCTTGGCCCGCTGGAG
+GCCACCACCTTGACCGGCGGGGATCTGAGCGGCCTGCAGACTTGGTTGTCTGACAACGGCTATGCGATTC
+GACCGGCGGTGTCAGCGGCGCTGGATCCCTACGTGCGTGACGGATGGGCGTTCGTGGCGATCCGGCTGAC
+CAGCACCGACCTGATAGTGGGCGGGCTCGATCCGGTGCGGATGACCTTCCGATCGTCGCGGTTGGTGTAT
+CCCATGCGGCTATCGGTCGCCGCTCAGGAGCCGCAACATGTCACCATCTTCACCCTGTCCGATCACCGGC
+AGCAGCGCACCGACGCCGACGCTGCCACACAGACAACCCACGTCCGGTTCGCGGGCGACATGTCCACTGC
+GGTTCGTGACCCTCTGTTGCGCGAGCTGATCGGCAACCACGGCTCATATCTGACCAAGGTCGAGGTGGAC
+ATCTATCAGACATCGCGAATCTCTTCGGATTTCACGTTCGGCAACGCACCAAACGACGATCCGTACCGGC
+AGGTGGTCACCGTTTACGACGATGTCGCACTCCCCCCGCTGCTGCTGGTGGTCGTGTCGGCGATCGCGGT
+GGGCGCGGCGGGCGGGGCCGTTGTGGTGGTTCTGCGGCGACGGCGGCGCGCCCACACTGGGTAGTCCGCC
+ACGGTGAGGGCGCTCAGCGAGGCAGGGATTCTGGTCCTTCAGACAAACCCGCCACGGCCGGGTGCGCCAT
+CAACCGGTCGAGAAAACCCCGCTGCCCCTTGAGCAGTTTGGTGCGTGCCCGCGCTACCGGAAACCAGCTC
+ACCCGGTCGACCTCGGGGAACTTACGCATCTTGCCCGAGCCCTTCGGCCAGTCCAATTCGAAGGTGCTGC
+TTCGTGCGTCGGTGATGTCCAGATCCGCCCGGACACCGAACACGGTCACCACCTTGCCGCCGGACTGTTT
+CAGCGACCCGAAGTCGATTCGCGGCCCGTCAGGCACGCACAACCCGATCTCCTCGGAGAACTCGCGCCGG
+GCGGCCAGCCACGGATCTTCGCCGCCGGTGTATTCGCCCTTCGGGATCGACCAAGCGCCGTCGTCCTTTC
+CCGCCCAAAACGGGCCGCCCGGATGCGCCAGAAGGACGTCGACGACACCGGCGCGCGCCCGATACAGCAG
+CACACCCGCGCTGAGCTTGGGCATGAGTACGGGTTCTTTAGATCCCGACGGCCTGTTCCAGATCCTTCAG
+CGACGATTCCAGGTGCGCAAGCAGCCGCTGCAAGTGGGGCACACTGCGACGGCACCCGACCAGTCCGAAG
+TCGAGATTCCCAGCATTGTTCACCAGGGTGATGTTCAACGCTTGACCGTCCGGGATGTTCGACAATGGGT
+AACTACCGTCAAGCCGGGCCGTGCCGTAGTAGAGCGGGTCTACCGGCCCCGGCACATTCGAGATGACGAT
+GTTGAACGGTGGCGGCACTGCCGACAAGAAACCCGGTACACCCGCCAACGTCAGCGGCGCCATATTCAAT
+GCCGACAATGCAAGCACCTGCAGCTGCGGCAATTCGGAGAGCACTTTCTTGTTGCCGTCCATGGACGCGC
+TGATGGTCTGAATCCGTTGCGCTGGGTCGTCGACATGGGTGGCGAGATTGCACAGGACGCTGCCGACCAA
+GTTGCCGCCGGCGTCAGCGTCCTCTTTGGAGCGTAGGCTCACCGGAACCATCGCGATCAGCGGTCTGTCC
+GGCAGCGCATTCCGCTCTATCAGGTAGTAGCGCAACGCACCGGCACACATCGCCAGGACGGCGTCGTTGA
+CGGTCACACCGGCGGCCTGCTTGACGCTCTTGATCCGGTCCAGCGACCAGGACTGCGCAGCGCACCGGCG
+GGCTCCCCCGACCTTGACGTTGAACATGCTGTGTGGCGCCGCGAACGGCAGCGTCAACTGCTGCTCGAGT
+AGCGCCGCACGAGCCAGCTTCAGCGTCGACGGTGCAAGTCCGACAACGGATCCCGCCATCTTGAACAGCG
+CATCCAACAGTGACGAGCCGTCCGATGGCGGGCGCGTACGTGGGCGCGGAGGCAGGTTCCAGATGGCGCG
+CACCTCGGCGTCGTCCGGGTCAGCCGACAGCGTGCGCTGCGCCAGCTTCATCGCCGAAACACCGTCGATC
+AGGGCGTGGTGCATTTTGGTGTACATAGCAAACCGGCCGTCGTTCAGCCCCTCCACCACGTGCAGCTCCC
+ACAGCGGGCGGTGGCGATCGAGCAGGCTGGTATGCAGCCTTGAGGTCAGCTCGAGCAGATCGCGGACTCG
+TCCTGGCGAGGGCAGCGCCGAGCGGCGAACGTGGTAATCGATGTCGATGTCGTCGTCATAAGCCCATGCC
+ACACGGGCGATTCCACCCCCGATCGTCGCAGGGTGCTTTCGGAACATGGGCTGGAATTCGTCGTTGGCAA
+CCAAACGCTCGGTGAACTCACGGACGAACTCAGGACCAGCTCCCTGCGGTGGCTCGAACAACGACAAGCC
+ACCCACATGCATGGGGTGTTCACGAGATTCAATGAAAAGAAACATCGAGTCGTTGGGCATCATCAGATCC
+ATGCACCCATTACACCCATTACCGAGTGATCCGGGAAGGCTTCTGTGGTGCCCGAGGTTCGGCAAGTCGC
+AAGAACATCGCCGCCCAGCTGACTTCGGGATGACAACGCATGTAGTCCGGAGCGGCTTGAGGTTGCAACG
+TCGGGTGGGCGAAGTAGTCCGGCTGAGAGGTATTGGTGGCAGCATGGGTTTGTGACCTCAATGTCGTTGG
+CCTGGGATGTGGTGTCGGTCGACAAGCCGGACGATGTCAACGTCGTGATCGGCCAGGCGCACTTCATCAA
+AGCGGTCGAAGACCTGCACGAGGCCATGGTCGGCGTGAGCCCATCGCTACGGTTCGGGCTCGCCTTTTGC
+GAGGCTTCCGGGCCCCGGTTGGTTCGACATACCGGCAACGATGGCGATTTGGTCGAACTCGCGACCCGCA
+CTGCGCTGGCCATCGCGGCCGGGCATAGCTTCGTGATCTTCTTACGTGAGGGGTTTCCCATCAACATCCT
+CAACCCGGTGCAGGCGGTGCCCGAGGTCTGCACGATCTACTGCGCCACAGCCAATCCGGTCGACGTTGTC
+GTCGCGGTGACCCCGCATGGTCGCGGCATCGTGGGTGTTGTCGACGGGCAGACCCCTCTGGGAGTGGAGA
+CCGATCGCGACATTGCGCAGCGGCGTGACCTGTTGCGCGCCATCGGTTACAAGCTCTGATACGGGCCGCC
+GGTCCGCCCTTGACAGCGGGACGTCCGCCGCAGAGGGTCGACGGCATGTCCGTGGTGCGCGGGACCGCTC
+TGGCTAACTACCCGAGCCTGGTTGCCGGGTTGGGCGGTGACCCGGCCACTCTGCTACGGGCCGCGGGTGT
+TCGGGATCAGGATGTCGGCAACTATGACGCGTTCATTTCGATCCGGGCAGCGATTCGGGCAATCGAATCG
+GCCGCAGCGGTCACCGCCACAATGGATTTCGGGAGACGATTGGCACAGCGGCAAGGGATTGAGATCCTGG
+GACCGGTCGGTGTGGCGGCCCGCACGGCCGCCACGGTCGGTGACGCTCTGGCGATCTTCAACACCTTCAT
+GGCGGCCTACAGCCCAGTTATCGCCATCCGGATCACGCCGCTGGCCGGACAGCGGTCATTTATTGCACTC
+GAGTTCCTGCTCGACGAGCCGGCGTCGTATCCGCAGACCATGGAGCTGGCGCTCGGGGTGGCGCTCGGGG
+TGATCCGGTTGTTGTTGGGCGCTGACTACGCCCCACTGGCCGTGCACTTACCCCACGACCCACTCACACC
+CGAAGCCTTCTACCTGCAGTACTTCGGCTGCCGGCCTTACTTCGCCGAACGTGTTGGTGGTTTCACCATG
+CGCACCGCGGACCTGAGCCGTCCCCTCAACCGCGACGATGTCGCCCACCGGGTGGTCGTCGACTACCTGA
+GCAGCATCACGCCGCTGGGCGAGGGGATCGTGGAATCGGTGCGCACCATCGTGCGCCAGCTGCTGCCCAC
+CGGAGCGGCGACGCTCAACGTGGTCGCCGAGCAGTTCCACCTGCACCCGAAAACGCTGCAACGTCGACTT
+GCGGAGGAGAACACCACATTCGTTATTCTGGTCGATCGGGTCCGCAAGGATGTCGCCGATCGCTACCTAA
+GGACCACCGGGATCGGCCTTACCCATTTGGCACGTGAACTGGGCTACGCCGAACAAAGCGTGTTGACCCG
+CTCGTGCAAACGCTGGTTCGGAACCGGACCGGCCGCCTACCGCAACCAGGCCAGGTTACAGACAACCGTG
+AGCGCACCTGGCAGCGGGCGTGGTCCGAATCCAGGTAACGTCTCAGTATCCTGCTGACCGATGGATCAAG
+ATCGATCGGACAACACGGCATTGCGCCGTGGTCTGCGAATTGCCCTGCGCGGGCGCCGCGATCCGCTGCC
+CGTGGCGGGCCGGCGGAGCCGGACCTCCGGCGGAATCGGTGACCTGCACACCCGGAAGGTGCTTGACCTG
+ACCATCCGGCTCGCCGAGGTGATGTTGTCGTCCGGCTCTGGCACCGCGGATGTCGTCGCCACAGCCCAGG
+ACGTGGCTCAGGCCTACCAGCTCACCGATTGCGTTGTCGACATCACCGTTACCACCATCATCGTGTCCGC
+GCTAGCGACCACAGACACTCCGCCGGTCACCATCATGCGGTCGGTCCGGACCCGGTCCACTGACTACAGC
+CGGCTGGCCGAACTCGATCGACTCGTTCAGCGGATAACCTCCGGTGGCGTCGCAGTCGACCAGGCTCACG
+AGGCTATGGACGAGTTGACCGAACGGCCCCACCCCTACCCGCGCTGGCTCGCGACCGCGGGGGCGGCGGG
+CTTCGCACTCGGCGTCGCCATGTTGCTCGGCGGAACCTGGCTGACCTGCGTCTTGGCTGCCGTGACGTCT
+GGCGTGATCGACCGACTGGGCCGGCTGCTGAACCGGATCGGGACCCCGTTGTTCTTCCAGCGCGTGTTCG
+GCGCGGGGATCGCGACCCTGGTCGCGGTGGCGGCTTACCTGATCGCCGGCCAGGATCCGACCGCGCTGGT
+GGCCACCGGAATCGTTGTGCTGCTGTCTGGGATGACCTTGGTGGGTTCGATGCAGGACGCGGTCACCGGG
+TACATGCTCACCGCACTCGCCCGGCTTGGCGACGCCCTGTTCCTGACCGCAGGGATCGTCGTCGGCATCC
+TCATCTCGTTGCGGGGCGTCACCAATGCCGGCATCCAGATCGAACTGCATGTCGACGCAACCACGACGCT
+CGCCACCCCGGGCATGCCGCTACCGATTCTCGTCGCGGTAAGCGGTGCGGCGCTGTCCGGCGTGTGCCTG
+ACGATCGCGAGCTATGCGCCGCTACGTTCTGTGGCCACCGCCGGACTCTCGGCCGGACTCGCCGAACTGG
+TGCTCATCGGACTCGGCGCGGCCGGGTTCGGCCGAGTGGTCGCCACCTGGACCGCCGCGATCGGCGTCGG
+CTTCTTGGCCACCCTGATCTCAATCCGTCGGCAGGCTCCCGCCTTGGTGACGGCCACCGCCGGCATCATG
+CCGATGCTGCCGGGCCTTGCGGTCTTCCGTGCCGTGTTCGCGTTCGCCGTCAATGACACACCCGACGGCG
+GTCTGACCCAGCTGCTGGAAGCGGCCGCGACTGCACTCGCGCTTGGCAGCGGGGTGGTGTTGGGCGAGTT
+CCTCGCCTCACCATTGAGGTACGGCGCCGGCCGGATCGGCGACCTCTTTCGGATCGAGGGTCCACCCGGG
+CTCCGGCGGGCGGTCGGCCGTGTGGTGCGCCTACAGCCGGCCAAGAGCCAGCAGCCGACCGGCACCGGTG
+GCCAACGGTGGCGAAGCGTCGCGCTGGAGCCGACGACGGCCGACGACGTGGACGCCGGCTATCGCGGCGA
+TTGGCCCGCTACCTGCACCAGCGCGACCGAGGTGCGCTAGCCAGCCTCGCCAGCGCCGACCAACTGCTCC
+CAGCTAGCGGGCACCATCGGCACCGACGGACTACCCCCGAACTCACCACCGGCCAACGTGGTCAACCCCG
+CAGGACGCCCAACGGACTCCTTGCCAGCGGTCCCGGCAAACCCCAACACGCCGGCACCCCGATCCGAAGC
+CAGCACCGACGCCGACGTGCCCGCGGGAGCTGGCGCCACCGCCGACACCAGCCTGGCCTCCGGTCGCACC
+GCGGCAGACTCACGCAACGGCGGCGCCGCTGCAGGTCGTACGGCAACGGGCGCCACGTCCGCCGTTATAC
+GTCCCTTTACACCAGGCAGATAAACTGGGCTGGCTTTGGTCAAACCCAGCGCGACCCGCAGCACTTCCTC
+ATAGCCCGACCGCGCGCTCCAGTTCCTTCAACGAGGTCTCCAGATGGCTGAGTACCCGCTGCACGTGTGG
+AACGCTGCGGCAGCAACCCACGACTCCGAAGTCGAGACTATCGGCGGTGCTGGTCAGGGTGATGTTGAGC
+GCTTGTCCGTCGAGCACCAACGACATTGGATAGTTGCCGACCATCCTGGCGCCGTTGAAGTACAGCGGTT
+CGCGCGCACCGGGCACGTTCGAGATGCACACATTAAACGGCGGTGGCGTTGCCTTGGCCAAGCCCGGCAG
+GGTGTTCAGCGCAGCTGGGCTCAACAGCAGCAGTGACACCGCCAACGCCTGGGCGCGGGGCAGCTGCGAT
+AGTACGTTCTTATTACCGCGCATCGAAGCGTGGATGGCGTTCAGCCGGTCGGCTGGATCATCAAGGTGGG
+TGGCCAGATTACACAACACCGCCCCGACCATGTTGCCGCCGACCGAGTCGCGGTCGGTGCGCAGGCTCAC
+CGGAACCATCGCAACCAGCGGCGTGTCCGGCAGCGCGTCGTTGTCGTCCAGATATTCGCGAAGTGCGCCG
+GCGCACATCGCCAGCACCACGTCGTTGAGGCTGACCCCGGCCGCGTCTTTCACCGCCTTGACCCGGTCCA
+ACGGCCAGGACTGCGCGGCGCAGCGCCGCGCTCCCCCGACGGCGACATTGAGCATGGTGTGCGGGGCCCC
+GAAGGGCAGTGTCAACTGTTGTTCGATCAACGCGGAACGCGCCAGTCGCAACGTTGAGGGAGCGAGCCCG
+GCAACCGATCCCAGCATGCCCCCCAGCTGTTGCAGGCGGCCGCGCCGTCGCTTGATGGCGGTGTGCTGCG
+TCGCCGGTGACCAGGCGGTGCGCAACTTGCCCTCGATGGGGTCGGTGGTCATCGGCTGGCGCATCAGCGT
+AAGTCCGGACACCCCGTCGACCAGGGCGTGGTGCATCTTCGAATAGATCGCAAAGCGTCCATCCCGGAGG
+CCCTCGATCACGTGTGTTTCCCAGAGCGGGCGGTGCCGGTCGAGCAGATTGGAGTGTAACCGTGACGTCA
+GTTCCAGCAGCTCACGCACCCGGCCCGGCGCCGGCAGGGCAGACCGCCGCGCGTGGTAGCCGAGGTCGAC
+GTCAGCGTCGGTCGACCAGCCGAGGTTGATGAGTGCACCGTGAAGCGACGTGGGGCGCTTGCGAAATAGC
+GGTGCTATCTCGCGGCACTGAAGCATCGCCTGATAGGTTTCCCGCACAAACCCACGTCCCGCCCCCGCGG
+GTGGCTCGAACAGTTGCAGCGCGCCGACATGCAGCGGATGCTCTCGCGACTCGGCTGATAAGAACAGCGC
+ATCGATCGGTGACATCAGTTCCATGGCGTGCTCCTGGTGATGCGCTTCACCGTCAGCCGGCTCGCCGAAG
+CCGACGTCGTAAAGCGCAGGTGATCGTCGTCGACCGGGCCCTCGCGCAACACCTTGAGGTCCGCCAGGGG
+GCTTCGGCGCCCTGCAGCGGCCGGGTCGGCATGGCTGCGGGCAGCTGCGGACAGCAGATGGTGTGCCCGG
+GTGCGTCCATGTGGGCCGGCGAAGTTGGACACGTCGCTGAGCAGGAAACCCTTGAATGCCACCTTCTCGG
+CAACGTCCACGGCGACTCCGTCGACCGAGAGGTTGATGCCACCGAAGGCCAGCAGATTGAGGCCGGTGGC
+AGTGATGCTGATGTCGGCCGCCAATTCGCGTCCGGATTGCAGCCGGATTCCGTTTTCGGTAAAAGTATCG
+ATCGCCTCGGTGACCACCGAGGCCCGGCCGTCGCGGATGGCCTTGAACATGTCGGCATCTGGCACCGCGC
+ACAGGCGTTGGTCCCATGGGTTGTAGACCGGCTTGAAGTGCTCGTCGGCCGGATATCCGGCGGCCAGCTG
+CTTGGCGTTGAGATGACGGATCAGTCGCCGGGCGGCTCTCGGATACCGTTGGCATAACCGCCACACCAAC
+CGTTGCTTGGCGATGTCTTTGCGCCGGGTGACGGCGTAGGCCCGATCGCGGCCTATCATTTGGGCATGGT
+TACCGCGCCGGCGGTCTGGGCCATGGCCGGCACCAGCGTGACCGCGGTCGCGCCGCTGCCGATGATCACC
+ATCCGCAGCTCATGGTGACGTGTTCGCCGGTGTCGAAGCGTTCGATCTCCACCAGCCAGCGAGCGTCCTC
+GGTGGACCATGATGGCGTCCGCGCTGGCGGTCGCCTTCTCGTGCTGCCACGGCTTGAACTCATAGCTGAA
+CGTGTGCAGGTCGGAGTCGGATCGAATTGCTGGATACCGGGCTTCAACGATCGCGAATGTCTTGGCCGGC
+TGCATTGTCTTTAGGTAGTAGGCGGCGCCAGTGCCGGAGATGCCGGCGCCAACGATCAGCACGTCGACGT
+GTTCGATGCTGGCTGACTGCTCGGAGTGCACGGCGTACTTCCTGTTCGGGCGAAGGCTGACCCGCGACTT
+CGTTGTCAACCGGGGGTGGTGTGCGTCACCGAACTCACTGTGCACCAGCACTCGGCCTTGAGTCTTGACA
+CTAGAAGACAACAATTTGACTTTTCAAGACACAGCGTCACCTGTGCGCGGTGCCAGCGGCGCGGCGCCAG
+GCCGTGTGGCGCAGTAGGCGCAGCCCATTGAGTCCGACGATGATGGTGGAACCTTCGTGTCGGGCGACGC
+CCAGTGGCAATGGCAACGTGAAGGCCAGGTCCCACACAACGAGCCCGGCGATGAATGTCACGGCCACGAT
+GAGGTTGGCGACCACGATGCGGCGGGCTCGCCGCGACATGGCGATAACGGTGGGAATGGTGGTCAGGTCA
+TCGCGGACGACGACGGCGTCGGCGGTCTGCAGGGTGAGTTCCGATCGGGCGCTGCCCATGGCGATGCCGA
+CATGCGCGGCCGCTAAGGCCGGAGCGTCGTTGATACCGTCACCGACCACGGTCAATCTGGCACCTCCAGC
+TTGCAGCTGCCGCACGGCTGCGACCTTGTCGTCGGGCAGTAGCCCGGCCCGTACGTCGTCGATGCCAACC
+TGTACACCGAGCCGATCGGCGGTGGCCCGGTTGTCGCCGGTAAGCAATACCGGTTTGGCCCCGGTCAGTT
+TGGTCGCAGCGGAAATCGCCGCGGCGGCTTCGGGGCGAAGCTGATCGGTGATGGCGAGTAGCCCGACGGG
+ATGGCTATCGCATACCACGACGACGACGGTGTAGCCCTCGCCTTGCAGAAAGTCGACCGCCGTGATCATG
+GAAGCTTCGAGCGCGGCGGCGCCGGCAGTGCCCAGCAGTGCCGTCGCCGATCCGACCGCAATGACGTGGC
+CATCGACGCGGGCGGTGACACGGCAACCTGGGTGTGCGGTGAACTCGCCGACGGTCGGCAGCCGGATGCG
+GCGAGACTGGGCGGCTTTCACGATGGCCGCACCCAGTGGGTGCTCACTGGGATACTCCGCTGCAGCCGCA
+AGCCGCAGCAGTTCATCATCGGTGAATCGTCGTTCGTACACCCAGATGCCGGCGAGTTCGGGGGTACCGC
+GGGTAAGGGTGCCGGTCTTGTCGAACGCGATCCGTGTGGTGGTTCCAAGTTGTTCCATCACGATCGCGGA
+CTTGGCGAGCACCCCGTGGCGGCCGGCGTTGGCGATTGCGGCCAATAGTGGCGGCATGGTGGCCAGCACG
+ACCGCACACGGCGACGCGACGATCATGAACGTCATGGCTCGCAGCAACGCCCGCTGCAGGGTCTCCCCCC
+ATAGCGGGGGCACCGCGAATACGGCGAGGGTCACGGCGACCATGCCGATCGAGTAGCGTTGTTCGACTTT
+CTCGATGAACAGCTGGGTGCGCGCCTTGGTCTGGCTGGCCTGTTCAACCAGGGTGGCAATGCGAGCGACG
+ACGGAATCCCGCGCGAGCCGGTCGACCCGGATCCGCAGGGCGCCGGTGCCGTTGACAGTGCCGGCGAACA
+CCTGATCGCCGATTGACTTGTCGACGGGCAGCGGCTCTCCGGTGACGGTGGCCTGATCGACTTCGCTGCC
+GCCGGCAAGCACGGTTGCGTCCGCCGAGATGCGCTCACCGGGCCGTACCAGCACGATGTCCCCAATCCTT
+AGGTCGGCGGCGTTGACCGTTTCCTCACCACCGCCGGCGCCCACGCGGGTCGCGGTGCCCGGCGCGAGGC
+CCATTAGCCCACGCACCGAGTCCGCGGTGCGGGCCGTTACCAGTGCTTCCAGAGCACCGGAGGTTGCGAA
+GATGACAATGAGCAGAGCGCCCTCGGCGATCTGCCCGATGGCGGCCGCGCCGATCGCCGCGACCACCATC
+AGCAGATCGACATCTAGGGTCCTTCGCTGTAGCGCCTGTAGCCCGGCCAGCCCTGGCTCCCAACCGCCGG
+TCGCGTAACACGCCAGAAACAGCGCCCACCGCACCCATTGCGGTGCTCCGCACAGCTGTGTCAGTAGTCC
+CGCTGAAAACAGGCCCAACGCCAGCGCGGCCCAACGCATCTCCGACAACGCGAACAGCTTGGTTCGGCGC
+GCTAGGACCAACGGCGACGCTGAGGTGCACCGGGCGGGAGAGAGTTCACGAACAGCCACCCGGCCAACAT
+ATCAGAATATATGATCATATGTTCATTTATTTCTTTGGGGATAGGCTGCCTAACCATGGGGCACGGGGTC
+GAAGGCAGGAATCGTCCGTCAGCGCCGTTGGATTCCCAGGCCGCCGCGCAGGTCGCGTCCACACTGCAGG
+CGTTGGCGACTCCGAGCCGGCTGATGATCCTCACCCAGCTACGGAACGGCCCGCTTCCGGTAACCGACCT
+CGCCGAGGCTATTGGAATGGAACAGTCCGCCGTCTCGCATCAACTTCGAGTGTTGCGGAATCTCGGCTTG
+GTCGTGGGCGACCGGGCAGGCCGTAGCATCGTCTACAGCCTCTACGACACGCATGTGGCGCAGCTTCTTG
+ACGAAGCTATTTACCACAGCGAGCACTTGCACCTTGGTCTCTCCGACCGGCACCCCAGCGCGGGCTAAGC
+GGTCAGGCTCATAAGCTCGCGGGTCACTTTCACCCATGACCGGCGAGCTTTACAGACCCCAGCGCCTCAA
+GGGGCACCACCTCAAGGGCGCAGCCACCGTGGCGGGCGCGCAATCGACAGGTCGTTGCCGACCGAGCGCT
+GGTGTGCCAGGAATTCGGTGGTCATGACGGCGCAGATGGTGTGCCAACCGAGGTCCTCGGGTCCGGTCGC
+ACAGCAGCCGTCACGATAGAAGCCGGTAAGCGGATCGGTGCCACCCTGTTCCAGGGCGCCGCCCAGCACA
+TTGCAATCGGACATGGACCTAAGTGTCTAAGCTGCGCCAGCCACGCCGTCGGACCTATCAGCTAATTCGG
+CGCGCGTCGCGGCGCACTATTCCCGCGCGAGGGTCTGGCCGGGTCGCGGAATTGCTTCGAGCAAGCAGGC
+GGCCGCCCTGACGTCGGCGTCCGAATACATCCGGGCGATCGCGGTAAACACCTCGCCCGCCTTTCTCAGC
+TCTTCCTGCGCCGCTTGATTCAGCGCCAGCAGCCCGGTGGCCGCCGTCGTGAACGCCGTTACCGCCCACG
+CCGACACCTCCTCGGCCCCGGCGGGCAATAGCGAGCTCAGCGAGACCCACGCCACCGCACCGGCCTGTAG
+CCCTTGGAATGCGTTGTTGACGACCTGCGATCCGATGTCGGCAACGGCCGGATCGAATGACATGGACTGC
+ATGTGTCTCTCCCTAGATTGCGCGGGCTCGGGCCCCAACGACGAGATCTAAGCGAGGAATTCAGTTGTCG
+GTAGCGATAGTAGTAATAGGATATAGTCCGCGCTGACGAAATAGAAGACGAGATATGCCGTCGCACTGAA
+TAATTTGTCACCAAGGGCGCTGCCGCCCCGTGCTACCCCTGGGCATGTTGTCCACCTGCGGCGCGGTAGG
+TTCAGCGGCGTGATACTTACGGGTGCGTTCTTGGCCGATGCCGCCGCAGCGGTGGACAACAAACTCAATG
+TGCAAGGCGGCGTGCTGTCCAGATTTGCGGTCGGTCCTGACCGGCTGGCCCGATTTGTGTTGGTGGTGTT
+GACGCAGGCGGAGCCTGACAGTTCGGACCGCGACATTACGGTCGAGATGAGGCCGCCGACCGATGACGAA
+CCGATACGCCTGAATTTCGAGGCGCCCGAAGCGGCCGTTGCCGAGTTCCCCGGATTCGCATTCTTCGAAA
+TCCAACTGCGCCTGCCGGTTAACGGCCGTTGGGTGCTGGTGGTGACTGGCGGCACCGGAGCGATATCGCT
+TCCGGTGCTGGTGAGCGACATGCCTGCGACGATAGGTTTTTGACGCGCCGGTCTTGAGCGACGACCCCCG
+GGGCTTTGCAGAAAGGTTGTCCCGTGCACCAGCAGCATCCCTACAACGCAGCTGGGTTCGGCTGACCGTG
+CTGACACCCAACCCAGCGGTAGGTTCGGCAGCGTGATAGTCGGGGCCTTCCTCGCCGAAGCGGCCTCGGT
+GGTGGACAACAAGCTCAATGTCTCCGGCGGCGTGCTGTACCGATTTGCGGTGGATCCGGACCGGTCGGCC
+CAGTTTCTGCTGGTGGTGTTGACCCAGGCCGAGACCGATGATCCGGATCGGCGGGTCGACGTAGAGGTTT
+GGCCTCCGACGGGCGACGACGCGCACCACATCGAGTTCGAGCTACCCGAGGCCGCCGTCGCCGCCGAGGT
+CGGATTCGCCATCTTCCGGATCGAGGTAAACCTGCCCGTCGACGGCCGTTGGGTGCTGGTGGTAACCGGC
+GACGCCGGAACGATCTCGCTGCCGCTGATCGTGACGGGGTGAGGCGTAGGCCCCTGCCGACGGAGCTGCC
+AGCCCTATTGATCGAATGGGAGCAGGACGCCGAGGCCGAATGGCGATCCGGACGGGAACAGACGCCGTGC
+CTTAGCGGCGAACTGTGGGACCTGCTCGCCCAGCGCATCTAGCAGGCTGTGCGGCGTGAACGGCGGGTCG
+ATGTAGGCGTCGACCATCCCGAGGATCACTGCTTTCGTTGCCTCTTCGTACAAATCCAACTGATCGAGGA
+GAAAGTCGTCGGGATGCAAAGCTTTGATCTGATAGGGCTTTAGCGCGTCATCAGGGAAGTGCTTGAGGTT
+TGTCGTGACTATCACCTCCGCGCGCTCTCGGACCGCTGCAGCTAGCACATGTCGATCTTTGTAATGGTTG
+TTCATGGCGGCGATGAGGTCGTTGTACCCGAAAGCGAATGCGGTAGTCAGCCCGTTCGGTGCTGATGTTG
+AGGCGGTCGACCATGGTTCGCCGAGTCTCGGCCAGGATGTCCTCCGACCACAGAGGCCGATAGGTGCCCT
+CGTCAGCGAACCGCAACAGGGCATCAACCAGCGGGTGTGGCACGAGCACGCACGCGTCCAGTACTACGGG
+GAACGGCATGCTCGGCCTCCTCTACTTCTTTTCTGCAAGCGCCGCCTGGAGCTCACCAAGGGCGTCGCGG
+CTCAACTCGCCTAGTGCTGCACGGCGATTCGACCGGGTTTCTTGCTGATATTCGAGCAGCGCGTCAAGGC
+TCACTCGGCGGTGGCGGCCCGGCTTCTCAAATGGGATTCGACCATCCTCCAAGAGCCGAACGAGGGTCGG
+GCGTGAGATGTTCAATAGGTCGGCGGCTTCTTGGGTGGTTAGTTTGAGGTGGCGTGGCACCAATGAAATG
+CCTTTGCCTTGCGACAAGGCCAGCACGACGTTGTACAGCGCATCTCTGACTGGTTCAGGAAGCGTCATCG
+GTTGTCCGGCGTTGCCACACACGGAAACTTCAGGCGCGCCAAGCACCTCCAGCAAGGAGGTCATGTCCTG
+CGGGTCGCGGGGTGGAAGTACTGTCCGTTCCTGGACTGCGGCTGTCATGCAGCTTAGCGTAATTCGAACA
+AAACGAAACGTCGAGTCTCTGACCAGGCATTTACGCAAGCTACTGCGCCGCTAACCGCGCCGGGTCGCGC
+ACTTGGCCGCCTCAAACGCCGCCTAGCACGGTGACGTCGAGCCCGGCGGAGCGCACCAGCTGATCAGAGC
+TGGAAACCGGCGCGCGTCTGCCGCGGCCGAAGCCTACACGCGGGCGGATCTGCGGCGCGGTGAAGCGCGC
+AAAGGTCCAGCAGATCACTCCGCACGATTTGCGGCACACCGCGGCCAGCTTGGCGGTGTCGGCCGGCGTC
+AACGTTTTGGCGCTGCAACGGATTCTCGGGCACAAGTCCGCGAAGGTCACCCTGGACACGTATGCGGATC
+TCTTCGATGCCGATCTTGATGCAGTCGCCGTCACTCTCGGGAAAGATGCCGACCAGCAAACCTGAAAATA
+CCCTGCTGAACTGCACTAACAGTCAAAGGGATTTGGCGGTGGCGGAGGGATTTGAACCCTCGGACGGTGT
+TAGCCGTCACACGCTTTCGAGGCGTGCTCCTTAGGCCGCTCGGACACGCCACCGCGGTGAAGCTTACCGA
+ATCGGCGCACCCTCACCCCAATCGCTGGCGGGCGAAGAAGGCCTCCAGCGGCGCGGCGCACTCCCGCGCG
+AGCACACCGCCGCGTACCTCCGGGCGGTGATTGAGCCGACGATCACGGACCACGTCCCACAACGAGCCGA
+CCGCCCCGGTCTTGGGCTCCCAGGCACCGAAGACCAGCCGCGCGACGCGGGCCAGCACCAGGGCACCGGC
+ACACATAGTGCACGGTTCGACGGTGACCGCCAAGGTGGTCCCCTCCAGCCGCCACCCGTCGCCGAGCACA
+CCGGCCGCCAACCGCATCGCCAGGATTTCCGCGTGCGCGGTGGGATCGCCGAGCGCCTCGCGGGCATTCA
+CCGCCCGGGCGAGTTCGGTTCCGTCGGCGCCGACGACCACCGCGCCCACCGGCACGTCGCGCGGACCCGC
+CGTCGCCGCGACCGCCAACGCCGCACGGATCAGATCTTCGTCAGTGGTCACCGCCCGCGCTTGCGGTCAC
+CGACCTAGGCGGTCGATCACCGCCGACAGCTGGTCAGCGAAGCCCATTTCGCGGGCGATGCGGCCCAGCT
+GTTCGTCGGCGTAAAGGTCGGTCTCGTCGAGGATGACTCCCAGAACCGCCTCGGGCAGGCCGATGTCGGA
+CAGCAGGCCCAGGTCGCCTTCCTCGAACGGATCGGCATCCTCGAGGTCTTCGGGATCGATCTCGGCGTCC
+AGATTGTCCAGGACCTCCGCGGCGATGTCGTAGTCCAGCGCGGCGGTGGCGTCGGACAGCAACAGCCGAG
+TTCCCGAGGGCGCCGGGCGCACAATGACGAAAAATTCGTCGTCGACGTCGAGTAGCCCGAAGACGGCTCC
+CGCGCTACGCAGCTCACGCAGTTCCGTCTCGGCAGCCCGCAGACTGGTCAACGCTTTGGGGCCCATCGGA
+GAGCAGCGCCAGCGGCCCTCTTCACGCACAACCGCAACACCGAAACCGTCCGGTGTGTCCGCGGCCGGTC
+TTTGCGTGGAGGCCCGTTGTGCTCCCATGGGCGCCTACGGTAGTCGCTGACCAGGCCTCCTGACCAGATG
+GTGCTCAGACAGCGGAGATCTGGTCGCCCCTCAGGGCGCCGCCACGGGCTACCTATGCCAACCTTGGACT
+GTGACTCGGACTGTCGCGGCGCCACCGGTGTGCGTGCTTGGGCTGGGACTCATCGGCGGTTCCATCATGC
+GGGCCGCCGCAGCGGCGGGCCGTGAAGTCTTTGGCTACAACCGGTCGGTGGAGGGTGCCCACGGCGCCCG
+CTCCGACGGGTTTGATGCCATAACCGATCTCAACCAAACGCTAACCCGGGCCGCCGCTACCGAGGCGTTG
+ATCGTGCTGGCCGTTCCGATGCCGGCCTTGCCAGGCATGCTCGCCCATATTCGCAAATCGGCACCTGGCT
+GTCCGTTGACCGACGTCACCAGCGTCAAATGCGCGGTTCTCGACGAGGTCACGGCGGCTGGTCTGCAGGC
+GCGCTACGTCGGCGGTCACCCGATGACGGGCACCGCGCACTCGGGTTGGACCGCCGGTCACGGCGGCTTG
+TTCAACAGAGCCCCCTGGGTGGTCAGCGTCGATGACCATGTCGACCCCACGGTGTGGTCGATGGTGATGA
+CGCTGGCGCTGGACTGCGGGGCGATGGTGGTGCCCGCCAAATCCGACGAGCACGACGCCGCCGCTGCTGC
+CGTCTCGCACCTGCCACACCTGCTCGCTGAGGCGCTCGCCGTCACTGCGGCCGAGGTACCACTTGCCTTC
+GCGTTGGCTGCAGGGTCTTTCCGCGATGCCACCCGGGTGGCAGCCACCGCTCCTGACCTAGTGCGGGCAA
+TGTGTGAAGCTAACACCGGCCAACTGGCGCCGGCCGCGGACCGGATCATCGACCTGCTGAGCCGTGCGCG
+TGATTCGCTGCAATCCCACGGTTCGATAGCCGACCTCGCCGACGCGGGCCACGCCGCACGCACACGCTAT
+GACAGCTTCCCGCGCTCCGACATCGTCACCGTCGTTATTGGCGCGGACAAATGGCGCGAGCAACTGGCCG
+CCGCGGGGCGGGCGGGCGGGGTGATTACATCCGCTCTGCCAAGCCTGGATAGTCCACAATGAACCCGTCG
+GAGTCGACGGTCACGGTGGTGTCAGCCACCGGTGAGCGCAGCTTGATCCCATCCAGACGTCCTTCGCTGG
+TATAGCTCACGGTGGCCGCATCGACGCTCATCTCGGGCACGTTTACATAGACCACCGGCAGCGCGATCGA
+TTCCGCTCGTTCGTGCAGCCCAAGGCGACGAATCGGCAACGCATTGAAGAATGGACTGAACACCAAATCG
+ATGTCCAATGCACCGTTGTATGCTGCGCGCCGTTCACCCTGGTGGTCAGTCACCAACCACATGTTCTCCT
+CGTCGCGGGCGATGGCGAGCTGGCGTTCCCGCTCGGCTAGTGTGACCGTCAGCCCGAACCGTTTGGTGGC
+ACCGGTTTCGTCGGTCTGCAGATCGTAGTGCGCGCCAAACGCCGGATTATTCGCGGTAGCCGCGGCCACA
+ATGCGGCCGTTCGCCCTAATCCGCTTGCCGGACAACTGGACTCGTACCGATTCCATGCGCGAGATGTCCT
+GCGCACGCCAGGTCAACATGGCCGGCCAGACGCGCGGAGTCAGATCAGAGGGGACTGCGTTCACACTGTC
+TACCGTAGGGCGTGTCCACCGCCTGCGGCAGGTTTGTCGACAACCGCGGCGAGCTTGCGCATCCTCCCGG
+TGCCCGGCACCGATACCCACCCCGCCAACGCCAGCAGTCCGTCGAGGGTCAACGCCAACGCGGCCACCAT
+CATCGCACCGACCAGAGCGATGTGGAATCGACGCTCCTTGATCCCGTCGATCAAGTAGCCACCCAGCCCC
+CCGAGACTGGCGTAGGCGGCCACCGTCGCGGTGGCGACCACTTGCAGCGTCGCGCTGCGTAGTCCGCCGA
+GCATCAGCGGTAGTGCATTGGGTACCTCGACGCGCAGCAGCACCTGGGACTCGGTCATGCCCATCGCCCG
+GGCGGCATCGACCACCAGCGGATCAACACTGGCAATGCCGGCGTACGTGCTGGCCAGCAAAGACGGGATA
+CCCAACAGCATCAGCGCCACCAGCGGCGGCCCCAATCCCAGCCCGAATAGCAGCACCCCTAGCAGCAGCA
+CACCCAACGTGGGCAAAGCGCGCAAACCATTGACCGCACCCACCACCAGCAGCGTCCCGCGACCGGTGTG
+CCCGATAAGCAGCCCGACTGGCACGGCGATCAGTGCTGAAGCGGCCACCGCCACCGCGGTGTATTCCAGG
+TGCTCACACGTGCGGACTGCCAAGCCGACTGGACCGGTCCAGTTACTGGCGGTTAGCAGGTAGGACAGCG
+CCTGCTGCAGGAAATTCATCGCGCTCCGCCCGTGATCGGGGCCGCGACCTGGCGGCGCCGACGGGCTGCC
+CGCGGCGCCCGTTCCCATGGCGTGGCCAGCCGACCGGCGAGGTTGATCACCACGTCGACGACAATCGCCA
+GCAGGAACATCGCTACGACGCCGGCAACGATCTGGTCACTCTTGTTGGTCTGATACCCCGCGGTGAACCA
+GGTTCCCAGGCCCCCGATTCCTATCACCGAACCCACGGACACCATCGCGATGTTGGTAACCGCGACCACC
+CGCAGCCCGGCTACCAGCACGGGGATAGACAGCGGCAGTTCGACTTTCAACATCTGAGCGATCCGCGAAT
+AGCCGATGGCGGTGGCCGCGTCATGCACCTGCGCCGGCACCGCGTCCAGCGCTTCGAGCACCGCCCGCAC
+CAGCAGGGCCGTGGTGTAGGCCGCCAACGCCACAATGACATTGGCCTCGTCGAGGATCCGGGTTCCGATG
+ATCAGCGGCAACACCACGAATAGCGCTAGCGACGGGATGGTGAATATAACGCTGGCGGTCGCCGTCGTCA
+GCCGGCGAAGCAGCGGCGCGCGCTGCACCAGCAGGCCCAACGGCACCGCGCTCATCAGCCCGATCAGCAC
+CGGCAGCAACGAGAGGCGCAGATGGACGACGGTCAGCGCCCAGGCCGCTCCCGGGTGGGTCATCAGGTAG
+TGCATGGCTTAGCTCCGCCGCCGGCCTTCTTGCCTTTTTGGAACTCGGCCAGCACGTCGGCGGCCAGTAT
+CCCGCCGATGACCTTGCCACCGCCGTCAACGGCGACACCGACCCCCGACGGCGAGGACAAGGCGGCGTCC
+AGCGCCTGGCTGAGGTTACCGTTCGGGCGGAACACCGAACCGCCGACGGTCATGGCATCCGACAATGCCG
+CGCCGCCGCGGTGACGCCGCCGGCCATCGGCGTCGATCCAGCCCAACGGCGCACCCGCACCGTCGACCAC
+CAGCACCCAGCCGTCACGAACTTGCCTGTCCCGGGCATCGGAAAGGCCGTTCACCGAGACTTGCTCGATG
+TCGCGCACAGGTAGTCCGGCCGCGTCGAACAGCTGCAGCCACCGATAGCCGCGACCGAGACCGATGAACT
+TCGACACGAAGTCATTCGCCGGACTGGATAACAGCCGGGCAGTTTCGTCGTACTGCGCAAGCGCGCCGCC
+CGGGGCGAACACCGCCACCAGATCGGCGAGCTTCAACGCCTCGTCGATGTCGTGCGTCACGAAGACAATG
+GTCTTGTGCAACTCGGCTTGCAGACGAAGTATTTCGTTCTGTAGCTCGTGGCGAACCACCGGGTCGACGG
+CCGAGAACGGCTCGTCCATCAACAAGATCGGCGGATCGGCCGCGAGTGCCCGTGCCACGCCGACCCGTTG
+CTGTTCGCCGCCCGAGAGCTGGGCCGGGTAGCGGGTGGCGACCTTGGGGTCCAGCCCGACACGCTCAAGC
+ACCTCATAACCGGCTTTGCGGGCTGCCCGGCGCGGCTGACCCTTCAGCACCGGCACCGTTGCGACGTTGT
+CGATGACCCGTTGATGAGGCATCAGCCCCGCGTTCTGGATGACATAGCCAATTCCCAGGCGCAGCTTCAC
+CGCATTGACCGTCGACACGTCGGTACCGTCGACAGTGATGGTGCCCGAGGTCGGATCCACCATTCGGTTG
+ATCATTCGCAGCGCCGTCGTCTTGCCGCAGCCGGAGGGGCCGACGAAGACGGTCAGCATGCCGTTAGGGA
+CTTCCAGCGTCAGCCGGTCTACGGCGGTGGCACCGTGTGCGTACACCTTGCTGACATCGTCAAAGCAGAT
+CAACGTGGTGCCTACTGCCGCACTGGGTGATCGAAACCGTTGTCCCGCACCCATTTCCGCGCGGCCTGGT
+CGGGGTCCACCCCGGAGTTGCCGGACACCGCTGCATTGAGCTCGGCCAGGCCGGCAGTGGTCAGCTTTGC
+CGACACCGCGTCCAGCACATCTTTGAGGTGATCCGACTTCTTTCGCGAATTCACAAGCGGCACAATGTTT
+CCGGCTAGGAAGTTATGTTCGGGATCTTCCAGCACCACCAGGTGGTTTTGCGGGATAGCCGCAGAGGTGC
+TGAAGAGGTTGGCGGCTGTGGCCGTTCCCTCCACCAGTGCTCGCACGGTCACCGCACCGCCGCCGTCGTT
+GATGGTCACGAAGTTGCCCGGCGCGATGTCGAGTGAGTATTTGTGCCGCAGCCCGGGCAACCCGGACGGC
+CGGGTCTGAAAGACCGACGGCGCCGCGAACTTCACATCCGCGGAATGCGGGGCCAGGTCGGCGATCGTTT
+TCAGGTTCCACCGGGCGGCGGTAGCGGCGGTGACGGTGACGGTGTCAGTGTCAGAGGCCGGCGACGGCGT
+CAGGATCGACAGATCGCCGGGAAGTCGCTTGTAGAGCTCCAACTCAACGGCATCGAGCATGGTCACCGTG
+GCGTCGGGTTGAAAGTACAGCAGCAAGTTGCCGATATACTCCGGCACCAGGTCGATGGAATGATCTTTGA
+GCGCCGGGATATACGTCTCTCGACTGCCAATTCCCAACCGCCGCCCCACGTCGAAACCGTTGGCCTGCAA
+CACTTGTGCGTAGATTTCGGCGATCACCTGCGATTCCGGAAAATCACCGGACCCGACGACGATGGACTTC
+ACACTGCCGGTCGCTGACCCGAGCGGATCAGCATTGGCGCAGGACGCAACCAGGCACACCGTCGCGAGCC
+ACACAGCCGCAGCGACAGTTGCGCGACGTAGGCGTCGCAGCATCCTCATGCAGTTGACACTATCGTCAGC
+GGCGGCGCCGTGCTTCCACAACTCGGCATGTACTGGGATTTTTCCGGCGTGGTTTGGTTTCATTCTGTGT
+GGGATAGGACAAAAATGGTGTCATGACCAGCAATCCCTCTTCCTCGGCTGATCAACCACTCAGCGGTACA
+ACGGTGCCTGGCTCGGTGCCCGGTAAGGCACCGGAAGAGCCACCCGTCAAGTTCACCCGCGCCGCCGCCG
+TATGGTCGGCGCTGATCGTCGGCTTTCTGATCCTCATCCTGTTGCTGATATTCATCGCCCAGAACACCGC
+CTCGGCCCAATTTGCGTTCTTCGGCTGGCGCTGGAGCCTGCCACTAGGGGTGGCTATCTTGCTGGCGGCC
+GTGGGCGGCGGGCTGATCACCGTCTTCGCCGGCACCGCGCGGATCCTTCAGTTGCGACGTGCGGCCAAAA
+AGACCCACGCGGCCGCCCTTCGCTAACTGGGCATCCCCGACGCGGGATTACCCGCTCTTCTTGGCAATCT
+CTGCCAGACCGCGAGCGATCAGCGGCGCAACAACGTCAGGCACCGACTCAGCCGCGGTGTCCTTCCCCTC
+GGCCTGCTCGGACATGCGTCGGCGGTAGTCGATGCCGGCGGCGATGATGGCGAGCTTGAAATAGGCCAAG
+GCCATGTAGAACTCCCAGTGGCCTAGCGGCTGCCCGGAGACGAGTGAATACCGATCGGCCAGCTCGTCGG
+CTGCTGGCAGCAGCGGCGAAGTCCACGCTGCCTGCGCATGCACAATTAAGTCCAGCGCGGGGTCGCGGTA
+TACGCACATCAGGGCCGCGTCGGACAGCGGATCCCCCAGGGTGGAGAGCTCCCAGTCCACCACCGCGCGA
+ACATGGCATGGGTCATCGGTGTCCAAGATCGTGTTGTCGATCCGGTAGTCGCCGTGCACGATCGATGTGC
+GGCTCTGTTGTGGAATGGCTTGCTGCAGGGCTAAATGCAGTCGCGAAATGTCGGCGTCGCGGTGGTCGTC
+GGGCAGCCGCACCAGCTCCCATTGTGACCCCCACCGGCGCACCTGCCGTTCCAGATAGCCGTCGGGTTTG
+CCGAAATCGCTCAGTCCGACGGCCTTCGGGTCGATGCTATGCAAGTCGACGAGTACCCGGATCAAGGCGT
+CGACACAGCCCTCGATGACCGAACGGCTGCCGAGCGCTTCGAGTTCGGCGCGCCGGCGCACCACTTGCCC
+GGCAACGAATTCGACAACCTGGAACGGCGCGCCCAGCACCGAGTCGTCCTGGCACAGCGAGATCGTGCGC
+GCCACCGGAACCGGTGTGTCTCCCAGCGCGGCGACCACCCTGTACTCGCGGGCCATGTCGTGCGCCGACG
+GTGTCAGCCCGTGCAGGGGCGGACGGCGCACCAACCAGCTCGACGCGTCATCATAGACCCGGAAGGTCAG
+ATTGGAGCGTCCACCGGAGATCAGCTCGCCACGCAACTCGCCGTCGCGCCCGATCCCCAGCGAACGCAGA
+TACCGGTCCAGCGCGCCCAGATCGAGCCCGTCGAGTCGGTCAACCGAAGTCACCGAACTTGTTTACCACT
+CGCGCAATGCCCGGCTTTAGCTCAGGCCGCCTTCGACTCGGCGCCGAGCGGTACCGCCGAACTACGGCGT
+CACGATGTTGAAGGCCGAATCGGGCCGGTCGAGGACGCTCAAGAATGTCTGCAGCACCGTCCGGTCGCCG
+AACACCTCGAAACCGGGTGAGCTGATATCGCCCAGCGCCGCGGCGACCAACCGAACCTTGTCGCCCACCG
+TCACCGTCGCGTTCGCCGTCGCCGGATCGGCGGGAAGCTTGCGATGTATCAACACGCCGTTGCGCAGCGT
+GAGCCGATAGTTGACATCCGGCTCGGTGAAGGTGAAATCGATGGCCAGGTCGAGGTCCCATGCGCGTGGG
+CCATTGATGCTGATCGCCAGGACGTCAAAGATTTGGTCCGGCGTCAGCTGGGCGAAAAACGTGGGCGCCG
+GGACTTGCCCGGAGCTGCCCGGGTTCCCGTCGCGCAGCTCGGCGGCCCCGGTCAGAAAGAAATTGCGCCA
+GGTCGCACACTCCGCGCCGTAGGCCAGCTGCTCCAGGGTGTCGGCATAGAGCCCGCGGGCCGCAGCGTGC
+TCGCTGTCGGCGAACACCGCATGGTCGAGAAGCGTTGCCGCCCAACGGAAATCACCTGCGTCGAAGGCTT
+CGCGGGCCAGCTCCAGCACTCGGTCGATGCCACCCAACGCGTCGACATAACGCGGCGCCAGCGCCTCGGG
+CGGATGCGGCCACAACCAGCCCGGGTTACCGTCAAACCAGCCCATGTAACGCTGATAGATCGCCTTCACG
+TTATGGCTGACCGACCCGTAGTAGCCGTGGGTGTGCCATGCCCGCTGCAGCGCCGGTGGCAGCTGGAACA
+TCTCGGCGATCTCCACACCGGTGTAGCCCTGGTTCAGCAGCCGCAGCGTCTGATCGTGCAGATATGAATG
+CATGTCGCGCTGTTGCGACAAGAACTCGACGATCTTCTCGCGTCCCCACGTCGGCCAGTGGTGCGAGGCG
+AACACCACGTCGGTTCGGTCGGCAAAGGTGTCAATCGCCTCGGTGAGATAGCCCGACCAGGCGCGCGGAT
+CGCGCACCAAGGCGCCGCGCAGGGTCAGCAGGTTGTGCAGGTTATGCGTGGCGTTTTCGGCCATGCACAA
+CGCGCGGAAGCGCGGGAAATAGAAGTGCATCTCCGCAGGGGCCTCGGTGCCCGGGGCCATCTGGAACTCG
+ATCTCCACCCCGTCGATGGTGTGGGTCTCCCCGGTCTCGGTGATGTCGACCGTCGGCACGACGAGCGAAA
+CCTCACCGGTCGACAGTGTCTGCCCGAGGCCGCAGCCGACGTGCCCCCGGAGACCGCGCGCCAACACGGT
+GCCGTACATGTAGCCCGCACGGCGCATCATCGCCGAGCCGGCGTAGATGTTTTCCTGCACGGCGTGCGCG
+GTGAACCCCTCCGGCGCCAGCACCGCCACCTTTCCCGCGTCCACGTCGGCCTGGGTGGTGCCGCCGAGCA
+CCCCACCGAAATGATCGACATGGCTGTGGGTGTAGATGACCGCGACCACGGGGCGGTCGGCTCCGCGGTG
+GGCGCGATACAAGTCCAGCGCGGCGGCGGCCACCTCGGTGGACACCAACGGGTCGATGACGATCAGCCCA
+GTGTCACCCTCAACGAAGCTGATATTGGAGATATCGAATCCGCGGACCTGATAGATGCCCGGCACCACCT
+GGTAGAGGCCCTGTTTCGCGGTCAGCTGGGATTGCCGCCACAGGCTGGGATGCACCGATGTCGGCGCGGC
+ACCGTCGAGAAACGAGTACGCGTCGTTGTCCCACACCACGCGACCATCGGCAGCCTTGATCACACACGGG
+GACAGCGCGGCAATGAATCCGCGATCGGCGTCGTCGAAATCCGTTGTGTCATGCAACGGTAACGAGTGTT
+CACCGTGTGCCGCCTGGATGACGGCAGTGGGAGGTTTGTGTTCCATCGGCACTACATTGCCACTACTACG
+GTGCACGCCGGTAGATGCCGTTGGCGAACCACGCTACCGACCAGAAAGAGAGAATTTTCCGCCGCACCTA
+GACCTCGGGCCCTGCTAACGCGCATACTGCCGAAGCGGTCCTCAATGCCGATGGACCGCTACGACAGGCA
+AAGGAGCACAGGGTGAAGCGTGGACTGACGGTCGCGGTAGCCGGAGCCGCCATTCTGGTCGCAGGTCTTT
+CCGGATGTTCAAGCAACAAGTCGACTACAGGAAGCGGTGAGACCACGACCGCGGCAGGCACGACGGCAAG
+CCCCGGCGCCGCCTCCGGGCCGAAGGTCGTCATCGACGGTAAGGACCAGAACGTCACCGGCTCCGTGGTG
+TGCACAACCGCGGCCGGCAATGTCAACATCGCGATCGGCGGGGCGGCGACCGGCATTGCCGCCGTGCTCA
+CCGACGGCAACCCTCCGGAGGTGAAGTCCGTTGGGCTCGGTAACGTCAACGGCGTCACGCTGGGATACAC
+GTCGGGCACCGGACAGGGTAACGCCTCGGCAACCAAGGACGGCAGCCACTACAAGATCACTGGGACCGCT
+ACCGGGGTCGACATGGCCAACCCGATGTCACCGGTGAACAAGTCGTTCGAAATCGAGGTGACCTGTTCCT
+AACCTAAAGCGTGTCGATGCGGGCTGTGAACAGCGCGTCGGAGCCGGGCAGTCAGGCCTAGCGCGGCGAC
+GATTCGAGCGGTTGCCATCCGTCAAGTGGCAACCGCACCGCAAACTCGGTATATCCGGGTGAGCTACTCA
+CGGTGATCGTTCCGTTGTGCGCCTTGACCACAGCGGAGACGATCGCCAGGCCGAGCCCGGTGCTACCGGC
+TTGGCGGGACCGTGACGTATCGCCGCGGGCGAACCGCTCGAAAACCTCGGACTGCAGCGCGGCCGGAATA
+CCCGGCCCATTGTCGATCACCTGCAGCACGACGTGCGTCGGCCCGGTGCTCAAGCGCGTCGTCACGATCG
+TGCCGGGACCGGTGTGCACGCGGGCGTTGGCCAGCAGGTTGGTCACCACCTGGTGCAACCGTGCCGCATC
+ACCCGGGATGACCACCGGTTCGGGGGGCAGGTCGAGCGCCCACTGGTGATCTGGTCCGGCAACATGAGCG
+TCGCTGACCGCGTCAACCGCAAGCCGCGACATGTCCACCGGTCCGCGTTCCAGCGGCCGCCCCGAGTCCA
+GACGCGCCAGCAGCAGCAGGTCCTCGACGAGACGTGTTATCCGCTCGGTCTCCGATGCCACCCGGCTCAT
+CGCGTGTGCGACGGCCTCGGGATCGTCCCCTATCCGCTGCGTCAATTCCGTGTAACCACGGATCGCCGCA
+AGGGGAGTTCGCAGTTCATGACTGGCATCGGCAACGAACTGGCGCACACGGGTTTCACTGGCCTGCCGCG
+CCGACAGTGCGGCAGCGATGTGGTCGAGCATCCGGTTGAGCGCCGACCCGAGTTGCCCCACCTCGGTGGA
+GGGGTTTGCGTCAGGTTCGGGCACCCGGACCGGTAGCTTGACCTCGCCGCGATCCAACGGTAGGTCGACG
+ACTTCGCTCGCGGTTTGCGCGACGCGCCGCAACGGCGCCAGCGCCCGCTTGATGATGACGATTCCGGCGG
+TCGTCGCGGCGACCAACGCAATCACCGTGACGATTCCGAAAATGATCAGCATCTGCAACATCGTGGCGTC
+GACGTTGCCCATCGACAGGCCGGTGACGATGACGTCGTGCCCGTTTCGGCTCGGAGCGGCCAGCACACGG
+TACCGGCCCAGACCGTCGAGATCCAGGGTCAGCGGTGTGCGGCTGCCGGCGATCCGTTCCAGCTGGGACC
+GGCCGGTTGACGTCAACGCCGCCCGCGAACCACTGCCGGTCAGATATCCGGCGGCGACCGTCGTGCCGTC
+GCTGACCACCGCCGCCACCATCCCGGCCGGCTGGCCCGGAGCATCGAGAAACCTCGGACCGGGGCCCGAC
+CGGATGTAGTTGTGCGTCTCGCGCCGCCAGGGCGGACGGGGCATTTTCTCCGGATACATCAACACCGAGC
+GGTACGACGTTCCGCCGAGTTGGTTGTCAAGTTGTGCCACCAGATGACGACGCAGCGCCATTTCGGTTGC
+CGCGGTGATTCCCACACACACCACGGCGAGGACGACAACCTGTCCGACCAGGAGCCGCAGCCGAAGCGAC
+CAAATTCGCGGACTGCTAGCGGGCCGGCTTGAGCACATAGCCGGCGCCGCGCAGCGTGTGAATCATGGGT
+TCGCGACCGTTGTCGATCTTTTTGCGCAGGTACGAGATGTACAGCTCCACGATATTGGACCGGCCGCCGA
+AGTCGTAACTCCAGACGCGGTCCAGAATCTGGGCTTTGCTCAGCACCCGCTTGGAGTTGTGCATCATGAA
+CCGCAGCAGCTCGAACTCGGTGGACGTCAACGACACCGGTTCGCCGGCGCGCATCACCTCGTGGCTGTCT
+TCGTCCAGCACCAAGTCTCCGACCACTAGCTGGGCACCGCTGTCGACTGTCGTCACCCCCGTGCGACGCA
+GTAACGCCCGCAGCCGAAGCACGACCTCCTCGATGCTAAACGGCTTGGTGACGTAGTCGTCGCCCCCCGC
+GGTCAACCCAGCTATACGATCTTCCACCGCGTCCTTGGCCGTCAGCAGTAGAACCGGCAGGCCTGGATTC
+TCGCTGCGCAACTTGTGCAGCACGTCAAGACCGCTCATGTCAGGCAACATCACGTCGAGCACAACCACAT
+CGGGCCGCTGGCGGCGGGCCGCCGCAATCGCCGACGATCCGTCACCGGCGGTGGTGATGTTCCAACCTTC
+ATACCGCAATGCCATGGACACCATCTCGGCCAGAACGGGTTCGTCGTCGACCACCAGCACAGTGACCGGT
+TGGCCATCGGCGCGCCGCATTACGACACGCTCAACCGAGATGCGGTGCTGCGTCACAGCGTCAAGTATCC
+GCACACGGCTGAGCAGACGCCATGCGGATCCTATGTGCGCGCTATGAAACCCGATTTGGGGCACGTTCGG
+AGCCTGCCAGCGGGCCGGATCCGGGCGGTACCCCACTCACGTCGGCGCGCATGTTGGTACCAGTAGCGGC
+TGCTGGCGACCGGGCTGCTGAAGCAAATCCCGCTGCCACGCTTGAGGCAGCGTCCCGGACCAACGCCAAT
+TGGTCGCTCTCCGTCGCCGTTGTGGAAGTCGCCGACCCGGACAGTTCGATCAGACATAGCCAAGGATCGG
+TAGCATGACGATACGCATTCCGATAGCGGGGAATTGAGGTGCCGTGACAGACACTTTGTCCGCAGATGTC
+TCCGAATATCAAGTGCCCGTGAATAACTCGTATCCCTACCGAGTGCTGTCGATCCGCGTCTGCGACGGCA
+CCTATCGGGATCGTAATTTCGCGCACAACTACCGATGGATGCGCTCGGCATTCGACAGCGGGCGACTCAC
+ATTCGGAATCGTCTACACCTACGCCCGTCCGAATTGGTGGGCCAATGCCAACACCGTGCGCTCGATGATC
+GACGCAGCGGGCGGCTTGCATCCCCGGGTCGCGCTGATGCTGGATGTCGAATCAGGCGGGAACCCGCCCG
+GTGACGGGTCGAGCTGGATCAACCGGCTGTACTGGAACCTGGCAGACTACGCCGGCTCGCCCGTGCGAAT
+CATCGGTTATGCCAACGCCTACGACTTCTTCAACATGTGGCGTGTTCGCCCGGCGGGCCTGCGCGTCATT
+GGCGCGGGTTATGGTTCCAATCCGAACCTTCCCGGACAAGTGGCGCACCAGTACACCGACGGCAGTGGGT
+ATAGCCCCAATCTTCCACAGGGCGCTCCACCGTTCGGTCGATGCGATATGAACTCTGCCAACGGACTAAC
+ACCGCAACAGTTTGCCGCCGCATGCGGCGTCACAACGACCGGAGGACCGCTGATGGCACTCACCGACGAA
+GAACAAACCGAACTACTGACCAAAGTCCGCGAGATATGGGACCAACTGCGCGGGCCCAACGGCGCCGGGT
+GGCCTCAGCTCGGACAGAACGAACAGGGCCAGGACCTCACTCCGGTTGACGCGATAGCGGTGATCAAGAA
+CGACGTGGCGGCCATGCTCGCGGAATAGCCCGCGATCTCCGTCAGCTCGTGGCCCGCTGCGCGGATACGA
+AAAGGTTTGGCGGGATTGAGTCTTCGCCACTGTGAGGGATGCTGCGGCCATACCGAGCCAGCAGCTCGGG
+CAACGTTGCCGTCGACACGTCCCAGCCACGTTCACGCAGCCACTCGGCGACCGCGGTGCGCTGCTCTGCA
+TACCAGAGGTCATCGACATCTGATATCTCAGTTTCGACCAGCTTGGCTGCCGCGGCCCGCATCCGCCGCA
+TGTCCGCACGCTGGCGTCGCATTCGCTCAGGGTCGAGAAAACCGGCGCCGGGGACGTTGGACGCCAACCA
+ACTGCCCGGCCTGCTGAGCGCATCGATACGCTCGAACAACAGATCCTGAGCCCGCGCCGGCAGGTACCGC
+ACCAACCCTTCGGCTAACCACGCACACGGCTTCGATGGGTCAAATCCGGCTTTCTGCAGTGCCTTTGGCC
+AGTCCTGACGAAGGTCTATGGGAACGTTCACCAGCTGCGAAGCCGGCTGCGCGCCATGCTGGCGCAACGT
+GGCTGATTTGAATTCCAGCACCTTGGGCTGGTCCAGCTCGTACACCACGGTGCCGTCCGGCCAGGGCAGC
+CGCCAGGCACGCGAGTCCAGGCCCGAGGCGAGGATCACTACTTGCCTCACCCCAGCGTCGGCGGTAGCCA
+GGAAATACTCGTCGAAAAACGCGGTCCGGGCGGCCATGAAATCGATCATCTGCTGTATCGGCGCCCGCAG
+GTCCGGGTCGAGGTCGGTCGCACCGGCCAGCAACGTGCGATTCGTGTACATGCTCCATATCCCGTCGCCG
+GCCGCGTCCACAAAGATCCGCGCGAACGGATCGTTGATCAATGGGTTGTCGCTCTCGGTCTCGGCCGCAC
+GCGCCGCCGCCACACCCAGTGCGGTGGCGCCCACGCTCTCGGTAATGGCCCAGGAATCGTTGTCGGTCCG
+CGGCACAGTTAATCCTCCCCCAGGCCGGAAACGTCAGTTTTGCAAACTATTCTTCCAGCCGCCGAGGGGC
+CCGCGCGCTCGTCAAGAGTGTCCTACGCTTTCTCCCAGATGGTCTACAGGTTGCAGAGGAGCGCGATGGG
+GTCCACGCCGCCACGTACGCCGCAGGAGGTATTCGCCCACCACGGCCAGGCGCTCGCCGCGGGCGACCTC
+GATGAGATCGTCGCCGACTACGCCGACGACTCCTTTGTCATCACTCCGGCCGGTATCGCGCGCGGCAAGG
+AAGGTATTCGCCAACTGTTCGTCAAGTTGCTCGACGACATACCAAACGCACTGTGGGACTTAAAGACCCA
+AATCTTCGAGGGCGACATACTGTTCCTGGAGTGGACCGCGAATTCCGCGGTCAGCCGAGTCGACGACGGA
+GTCGATACTTTCGTATTCCGAGACGGCACGATCTGGGCGCATACCGTCCGGTACACCCCGCACCCCAAGA
+CCTGACGTTTCGAGCAGGTGGCGGATGTGGACCTCGAGGCGGTCGCCTATTACCGATCAGACCGAGGCAC
+TGTTGTCTGACGCGGGCGGATACCCCCAGGGGGCGCGTTCCTCGCCGCGCACGAAGTCGGTAGGTTGCAG
+CCGCACTTTGCGGAGGAACCGCCTGCTGATCTGCCGGATAGGATGAGCCCGTGACGACGCTGAAGGAGCT
+TGGAGCACGGGTCGCCGCTCTGGAAGCGAACCAGGCCGACTATCGAGCCGTCCTCGCGGCCGTCAACCCG
+CCGGGCGCCAACCAGCGAGAAATCGCGACGACCGTCCGGGAACACACCGGACGACTGGACCGCGTGACGA
+CCAAAGTCGGCCAGCTCGCGGCCAAGTCCGACGACACCAATGCGCGGGTGCGGTCTCTGGAAGAGGGACA
+GGCCGAGATCAAGGACCTTCTGCTCCGCGCCCTCGACAAGTGATTCTCCGAATGGCTGCGCGATTTTTTG
+AGCCCGGCATCGAACGGTGATCTGTGGTCGGTGAATCCGCGACACGCCGTGGTTTCGGGTCGTGCCGGAT
+GGCGTCAAATGGCCAGATCAGAACACCTTTCGAGACCACGATTTTCGAGACCACGATCAGGTGCTGTTGC
+AGGCTCTCCTAAAGCCGTAGGGCGTGTTTGAACCGCACCATGATGGGGTGCGCGGACATCGGTTGGCGAT
+ACGGGCTCGAGGTTGCAGATCCTGTCCGCGCTCGTGGCCGGCACCCGAGCGACCCTGTCGAAGACCGCGC
+CTTGATTACCTGGCGGTGAGCGCGAGCCGCCTGACCAGGGCCGCGAAGCACAGCGGCGCCAGCAGCCAGG
+TCAGCTGCATGGCCGCTGTCACCGGGTGACCACGAAACCAGAACATCACCGGGTTGAACCACAGGTCGTC
+GACGTAGGACCAGGTCCCGGCGAGGATCGCCGACAACTCCACGGCCAGGGCCGTGAGCTGTCCCCAGAGC
+ACCTGGACGGTCAGGCCGAGGGCGCCCGCGGGCTCGCCCGTGAGCGCTCGCGCCAGCAGCCAGCCCATGG
+TCAGGAGGGCACCATCCCACACGGAGTGGGCGAGCAGGAACACCACGGTGGGGAGCGGGAGCGGCGTGGC
+CCACTCGATGATCGGGGTGTTGGTCCAAGCGCTGAGCCCGAACACCGGCAGCTCCCAGACCAGACCGATG
+AGCGTGCCGAGCAACAGCATCCGCGCGAGCTCGGGTCGAGTCCTTCGAGCGCGCAGCATGAGCACCACGA
+CCGCGAGCGCGACGAGCAGGTCGGCTACGTAGTAGCCATGGGCGAGGGGATCGTTATCCATAAGCGTGTT
+CTGTTGTATGCCACTAAGCATCGTATTTGCCTCCGCGAACCTTGGTGAGCAACAGTGACGAACAGTGACG
+GCGAGCCGCCAGTTGACCCGCACGTGGGCACAACGGCGAGCTTCCCGCACCGATGGCTACGAACCCCGGC
+CACGCAACGCTATGCGGTCGCCAGCCAGCTGGGCGCGCAGGATCCGTTGGATCGCCCCAGCGGTACGGTC
+CGGGTTCTCGGGGCGCAGCGCCACCGCCAACTCCAGCACCTCGACCGGGGTGCGCAGCGTGCACTGGCAC
+GGGTTTGGGCACCAAGGCGTCGAACCCACCGGCGCGCCAGTCCCTAATTCCTAATCCAGCGGTCGATGGT
+ATGCCGGCTGATCCGAACCTTCCGCCCGAACGGGTCGGTGTGCTCACGGGAGGCCAGCTCGCGCACCATC
+TTTCCCCGCTCCTTGGTGGAATGCGCTGCATCGGCGGCCTCCCGGATCAACTGATACCGAAACAATCCGA
+TCGCCCTCGCGCGCTCCGCGCGCACCTCGCCTTATCATCGCCGACCGCCACCGGCCGCTCCTTTCCGTTT
+GGTGTCCCGTGAACACACGACAGCGCACAGGATTACGGCCCAATCGGCGGTTAGGGCAGGGTCGACTCGT
+GTTGCACCCACTCGCCGGGTCACCCCGGCGCCACCAGCCGCCCACCCGATACCGCCACCGCCGTCTCGGC
+CAGCGACACCGTGGACAGCGCGAACTGGCACTCGATCACGGTCACGACCGCGGCGATCACCGTCACCGCA
+TAGGCGAACACCCCGACGGCCGCATCCGGCATCACCGGATCCGGATCCACCGCGCGCAACATGACGGTGA
+ACACCGACCGAACCGCCTCGGCACGCTCGGCAAAGCGACGCAGCCAACCCCGCACCGTCTCGGCCGGGCG
+AGCCAAATCCGCGGCGATGCGGCGGAACCCGACCTGGCTCAAGGCCTTCTCCGCCGGCGCGGGCACAGCT
+CCACCACGTATGTGCGCTCGCAGCCCGACATGCTGGCCGACGGCGCGCAGAGTTGGGCACGAGTTGTGAC
+AATCCGTGACAGCTTTCCCGGCGCCTGATACCAACGGAACGCGTTTGCGCTAGTAAAGAGCGCGCCCGAA
+GAGATTCGAACTCCCAACCTTCTGATCCGTAGTCAGATGCTCTATCCGTTGAGCTACGGGCGCTTGTCTT
+CAGTTGTGTCCCCTAAAGGACTGCGGAGGCGAGAGGATTTGAACCTCCGGTCCCCTTGAAGGGGGACAAC
+TCATTAGCAGTGAGCCCCATTCGGCCGCTCTGGCACGCCTCCATGGACTTCCCGAGAGTACCCGGACTCC
+CCGAGCCGCCGGAGGCCTAGCGTACACAGCCGCCACATATGCTGTCGACGTGACCGCCCGCCTGCGACCC
+GAGCTGGCTGGGCTGCCGGTTTATGTGCCCGGCAAAACGGTGCCGGGCGCCATCAAGCTGGCCAGCAACG
+AAACCGTGTTCGGCCCGCTGCCCAGCGTCCGTGCCGCCATCGACCGGGCTACCGACACGGTCAACCGCTA
+CCCCGACAACGGCTGCGTGCAGCTCAAGGCCGCGCTGGCCCGGCATCTTGGCCCGGACTTCGCTCCCGAG
+CACGTCGCCGTCGGTTGCGGCTCGGTCAGCCTCTGCCAGCAACTCGTTCAGGTCACCGCCTCGGTTGGTG
+ACGAAGTGGTCTTCGGCTGGCGCAGCTTTGAGCTCTATCCACCACAGGTCCGGGTCGCCGGCGCTATCCC
+CATCCAGGTGCCGTTGACCGACCACACGTTCGACCTCTACGCCATGCTCGCCGCGGTCACCGACCGCACC
+CGGCTGATCTTCGTGTGCAACCCCAACAATCCGACCTCCACCGTCGTCGGTCCGGACGCGCTGGCCCGCT
+TCGTCGAGGCGGTTCCGGCGCACATCCTGATCGCCATCGACGAGGCGTATGTGGAGTACATCCGGGACGG
+CATGCGGCCCGACAGCTTAGGCCTGGTTCGCGCACACAACAATGTCGTTGTGCTGCGTACGTTTTCGAAA
+GCGTACGGCCTGGCGGGGTTGCGGATCGGCTACGCGATCGGCCACCCCGACGTCATAACCGCGCTGGACA
+AGGTCTACGTGCCATTTACCGTGTCGAGTATCGGGCAGGCCGCGGCCATCGCGTCCCTGGACGCCGCCGA
+CGAGCTGCTGGCCCGTACCGACACCGTGGTTGCCGAGCGCGCCCGCGTCAGCGCCGAGTTGCGTGCTGCC
+GGGTTCACGCTGCCGCCATCGCAGGCCAACTTTGTCTGGCTTCCGCTGGGATCCCGCACCCAAGACTTCG
+TGGAGCAGGCCGCCGATGCACGCATCGTGGTCCGCCCGTACGGCACGGATGGCGTTCGGGTCACCGTCGC
+CGCACCAGAGGAGAACGACGCGTTCCTGCGGTTCGCCCGCCGCTGGCGGAGCGACCAATGAGCGTGGCCC
+GTAAGAAAATTCGACGCCCACGCTCGAGCGTCACGGCTATCTGGCCGGGTTGCGGCCGGTGAACGCGATC
+AGCCGCTCCAGCGCCCCGCCATCTTCCGGCACGTCGACCGGTTCATTGAAACCGGCCACACTACGTTCCT
+CCGGCTTGATGAGCTTTCGTGCCAGCTCTAGGACGTATTCGGCCAACGAATCGGCAGCCTTCAGCTCACT
+CCCGACGGCGACCGCGTAATCCCAGGCGTGCACCAGAAATTCGACCGAGAAGACCGAGACGGCAACCTTG
+GCCGACATCGAGCCGGGACCCAGCGATACGTCTCCTTCCAGACCGTGACGGTGCCAGGCGTCCAGGGCCG
+AACGGGCGGCGCCGCTCACCAGGCGCTCCACAGAGTCAATGTCCGCACGCAGTGAGAATTCCGCGCCGAC
+CATGCCGCCGAGGACCATGATTGAGTTGAGCAAATGCTCGGTTAGTTTTTTTCACGTCGTACCCCGGGCA
+CGGTGTCTGCTTGGCCTTGTCCTGGCGGCCGATGGTGTGCAGCACTTGCTGCAGCACCTGCAGCGCGGCT
+TCCGCGCACGCCAGCTCGTCGGTCGGTGGGGAATCTGGTCCGGGTCGCGATTCAGGCGGCATACTGGCCA
+CGCTACGGTCTGGGCATGGGCGAAACCTACGAATCCGTCACCGTCGAAACCAAGGACCAGGTCGCGCAGG
+TGACGCTGATCGGGCCGGGCAAGGGCAACGCGATGGGGCCCGCATTCTGGTCGGAGATGCCCGAGGTGTT
+CCATGCCCTGGACGCCGACCGTGAGGTGCGGGCCATCGTCATCACCGGATCGGGCAAGAACTTCAGCTAC
+GGCCTGGACGTACCGGCCATGGGCGGAATGTTCGCCCCGTTGATCGCCGACGGCGCGCTGGCCCGCCCAC
+GCACGGACTTCCACACCGAAATACTGCGCATGCAGAAGGCGATCAACGCCGTCGCCGACTGCCGCACCCC
+CACGATCGCGGCCGTCCAGGGTTGGTGCATCGGCGGCGCCGTCGACCTGATCTCCGCGGTCGACATCCGG
+TATGCCAGCGCCGACGCGAAGTTCTCGGTGCGCGAGGTCAAGCTAGCGATTGTTGCCGACATGGGCAGCC
+TGGCGCGCCTTCCACTAATCCTGAGCGACGGCCATCTACGAGAACTCGCGCTGACCGGCAAAAATATCGA
+CGCGGCCCGCGCCGAGAAGATCGGCCTGGTCAACGACGTCTACGATGACGCCGACCAGACGCTGGCCGCG
+GCCCACGCGACTGCCGCCGAGATCGCCGCCAACCCACCTTTGGCGGTCTACGGCATCAAGGACGTTCTCG
+ACCAACAACGCACGTCCGCCGTCTCGGAGAACCTGCGCTATGTCGCCGCCTGGAACGCCGCGTTTCTGCC
+GTCCAAGGACCTCACCGAAGGTATTTCCGCGACGTTCGCCAAGCGCCCGCCCCAGTTCACCGGCGAGTAG
+ACCCGGCGACCATGCGCGCTGGCGACGGCAAGATCCGTGTCCCGGCCGACCTAGACGCCGTCACGGCAAC
+CGGCGAAGAGGACCACTCCGAAATCGACGGTGCGGCCGTCGACCGGATCTGGCGGGCCGCACGCCATTGG
+TATCGGGCCGGTATGCATCCCGCGATCCAGTTGTGCATTCGGCACCATGGGCGGGTCGTGCTCAACCGCG
+CGATCGGGCACGGCTGGGGCAACGCCCCCACCGATGAGGCCGATGCCGAGAAGATCCCGGTGACGACTGA
+CACCCCGTTCTGCGTGTACTCGGCGGCCAAGGCGATCACGGCGACCGTTGTACACATGCTCGTCGAGCGC
+GGACACTTCGCGCTCGACGACCGCGTCTGCGAGTACCTGCCCTCCTACACCAGTCATGGCAAGCACCGCA
+CCACGATCCGGCACGTGCTGACCCACAGCGCAGGCGTCCCGTTTCCCACCGGGCCCCGACCCGACGTCAG
+ACGCGCGGACGACCATGAATACGCGGTGGAAAGGCTCGGCGAACTACGGCCGCTATATCGGCCCGGACTG
+GTACACATCTACCACGCGCTGACCTGGGGTCCGTTGATGCGTGAGATCGTCTACGCGGCCACCGGCAAGG
+AAATCCGCGAGATCCTGGCCACCGAGATCCTCGACCCGCTGGGCTTTCGGTGGACCAACTTCGGCGTCGC
+CGAGCGCGATGTGCCGCTGGTCGCGCCCAGTCACGCCACCGGGCGGCAGCTGCCGCCGGTGATCGCCGCG
+GTGTTCCGCAAGGCGATCGGCGGAACCGTGCACGAGATCATCCCCTATACGAACACCCCGTTCTTCCTCA
+GCACCATCCTCCCGTCGTCCAACACTGTGTCAACGGCCAACGAGCTGTCCCGCTTTATGGAAATCCTGCG
+CCGCGGTGGCGAACTCGACGGTGTTCGTGTACTGAGTCCCGAGACGCTGCGCGGCGCGGTGACGGAATGC
+CGGCGCTTGCGACCGGACTTCGCCACCGGGCTGATGCCGCTTCGCTGGGGCACCGGGTTCATGCTGGGGT
+CCGCCAAGTACGGGCCGTTCGGGCGCAACGCGCCGGCGGCATTCGGCCATCTCGGTCTGGTCAACATTGC
+GGTTTGGGCCGACCCCGAACGAGCTCTGTCGGGCGGTTTGATCAGTAGCGGCAAACCCGGTAGGGACCCC
+GAGGCTGGGCGCTACGGCGCCCTGCTGAACGCCATTACCGCCGAAATACCACGGGCATCGTCGGGCTGAT
+CTGCCCACGAGCACGCCACGCCGCCCTAACCGAGCCGGACGGCTTTGTCGTGCCGGTCACATGTCGGCCT
+GTTGCCTTATGTCAAGATGCGCCGCCGTACGCGCGCATTATCAACGAGTCAACGTGGTCGGTGCAGACCT
+GCTATACTCGAACGTATGTTCGAGATATCGTTGTCGGACCCGGTGGAGCTGCGCGATGCCGACGATGCCG
+CGCTGCTTGCCGCAATCGAGGACTGCGCGCGTGCCGAGGTGGCCGCCGGCGCCCGCCGCCTGTCAGCGAT
+CGCCGAACTCACCAGCCGGCGCACCGGCAATGACCAGCGGGCCGACTGGGCGTGCGACGGCTGGGACTGC
+GCGGCCGCCGAGGTGGCCGCCGCACTGACCGTAAGCCACCGTAAGGCCTCCGGGCAGATGCATCTGAGCC
+TCACCCTAAACCGACTGCCCCAGGTGGCGGCGTTGTTTTTGGCCGGGCAGCTCAGCGCGCGGCTGGTGTC
+GATCATCGCCTGGCGCACCTACCTGGTTCGCGACCCCGAAGCGCTGAGTCTGCTCGATGCCGCCCTGGCC
+AAACACGCCACAGCGTGGGGTCCGCTGTCGGCCCCCAAACTGGAAAAGGCTATCGACTCCTGGATTGATC
+GGTACGATCCCGCCGCACTGCGACGCACCCGTATCTCGGCCCGCAGCCGCGACCTGTGCATCGGTGATCC
+CGACGAAGATGCCGGCACCGCCGCACTATGGGGCCGGTTGTTTGCCACCGACGCCGCCATGCTGGATAAG
+CGCCTCACCCAGCTGGCCCACGGCGTCTGCGACGACGATCCCCGAACCATCGCCCAGCGGCGCGCCGATG
+CGCTGGGCGCGCTGGCCGCCGGCGCTGATCGGCTTACCTGCGGCTGCGGTAATTCCGACTGCCCATCCAG
+TGCTGGCAACCACCGGCAGGCAACCGGTGTGGTCATCCACGTCGTCGCCGACGCGGCAGCACTAGGCGCT
+GCACCTGACCCACGCCTATCCGGCCCGGAACCCGCGTTGGCACCCGAAGCACCCGCCACCCCGGCGGTCA
+AGCCGCCGGCCGCGCTGATCAGCGGCGGGGGTGTGGTGCCCGCGCCACTGCTGGCCGAGCTGATCCGCGG
+TGGGGCCGCCCTCAGCCGCGTGCGCCATCCCGGCGATCTGCGATCGGAGCCGCACTACCGGCCGTCGGCC
+AAGCTGGCCGAATTCGTCCGGATCCGAGACATGACCTGCCGATTCCCCGGCTGCGACCAGCCCACCGAAT
+TCTGCGACATCGACCACACACTGCCCTACCCACTCGGGCCCACCCACCCGTCCAACCTGAAATGCCTCTG
+CCGCAAACACCACCTTCTCAAGACCTTCTGGACCGGCTGGCGTGATGTGCAACTGCCCGACGGCACCATC
+ATCTGGACCGCGCCCAACGGCCACACCTACACCACTCATCCCGACAGCCGAATCTTCTTACCTAGCTGGC
+ACACCACCACCGCCGCACTACCCCCAGCACCATCCCCGCCAGCCATTGGTCCCACTCACACCCTGCTGAT
+GCCACGACGGCGCCGGACCCGAGCGGCCGAGCTGGCCCACCGCATTAAACGCGAACGCGCCCACGTCACC
+CAACGCAACAAGCCACCCCCAAGCGGCGGGGATACAGCGGTGGCGGAGGGATTTGAACCCCCGGACGGTG
+TTAGCCGTCTCTCGCTTTCAAGGCGAGTGCATTAGGCCGCTCTGCCACGCCACCGCTGATAAGGGTAACG
+AGCCGGTAGCGTGACCATCATGCGTGCCGTCGTCGCCGAATCCTCAGATCGACTGGTATGGCAGGAAGTC
+CCCGACGTGTCGGCTGGGCCGGGCGAAGTGCTCATCAAGGTTGCCGCTTCCGGTGTCAACCGCGCCGACG
+TGCTACAGGCCGCCGGCAAATATCCGCCGCCCCCGGGAGTAAGCGACATCATCGGCCTGGAGGTGAGCGG
+CATCGTCGCTGCGGTCGGTCCCGGGGTTACCGAATGGTCTGCCGGACAAGAGGTTTGCGCCTTGCTTGCC
+GGCGGCGGCTATGCCGAATACGTTGCCGTTCCGGCCGACCAGGTGCTGCCGATTCCGCCGAGCGTCAACC
+TGGTCGACTCAGCCGCCCTGCCCGAAGTGGCGTGCACGGTGTGGTCGAACCTGGTGATGACCGCTCATCT
+GCGGCCGGGTCAGCTGGTGCTGATTCACGGCGGGGCCAGCGGCATCGGCAGCCACGCGATCCAGGTGGCC
+CGCGCCCTGGCAGCACGGGTGGCGATCACCGCCGGCTCACCGGAGAAACTGGAGCTCTGTCGCGACCTGG
+GCGCCCAAATCACCATCAACTACCGCGACGAGGATTTCGTCGCGCGGCTGAAGCAAGAGACCGATGGTAG
+CGGCGCTGACATCATCCTCGACATCATGGGAGCGTCCTACCTGGACCGCAATATCGACGCGCTGGCCACC
+GACGGCCAGCTGATAGTCATTGGCATGCAGGGCGGGGTGAAGGCCGAGCTCAACCTGGGCAAGCTGCTCA
+CCAAGCGGGCGCGCGTCATCGGTACCACGCTGCGGGCCCGGCCGGTCAGCGGCCCGCACGGCAAGGCGGC
+CATCGCCCAGGCGGTGGCGGCCTCGGTCTGGCCGATGATCGCCGCGAACCGGGTCCGGCCCGTCATCGGC
+ACCCGGCTGCCCATCCAACAGGCGGCACAAGCGCATGAACTGATGTTGTCGGGCAAGACGTTCGGAAAGA
+TTCTGCTGACGGTATAGGCGAACCTCGCGGCCGGATCAACCTAGCGACGCCAGCGCGCGCACCAGCTGGT
+CGACTTCGGCCATCGTCGAGTAATGCGCCAGCCCGACGGTGACCGCGCCGCCGACGTCGTTGACGCCCAG
+CACGTCGAGCACGCGTGAGCCGGTGTTGGCGATCGCGAGAATTCCGTTGTCCGCCAGCCGCTGCACCACG
+CGGTCAGCCGGCACCTTGTGGACCGCGAAGCTGACCACCGGTATCTGTGCTTCCGGGCGACCGATCAGCA
+TCACCAATGGCAGCGAGCGCAACGACACCATCAGATAGTCGAAGACCCGGTTCAGGTACGCGTCAGCAGA
+TTGCATCGACACCGCTAGTCGTTCGCGTCTGCTGCCGCGAGCCGACTCGTCGAGCGCCGCCAGGTACTCA
+ATGCTGGCGACCACACCAGCCAGCAGACCAAACTGGTGCACGCCGATCTCCAGGCGCGCCGGCCCGGTGG
+CATACGGATTGGTCGAAACCGATCCGAAGGAATTCATCACTGACGGGTCACGGAAAACCATCGCCCCAAT
+CGGCGGACCACCCCAGGCATGCGCATTCACCGTCACCACGTCGGCGTCGGTTTCTCTGATATCGAGCAAC
+CGATACGGCGCGGCCGCGGAATGGTCGACCACCACCAGTGCCCCCACGTCGTGCACCAGTTTGGTCATCG
+CCCGCAGATCGGTGACCCCGCCCAGCGTTCCGGATGCGGAGTTGACGGCGACCAGCCTGGTTGACTTGCT
+GATCAGGCTCTCCCACTGCCACGTCGGCAGCTCGCCGGTCTCGATGTCGACCTCGGCCCACTTAACCTTG
+GCGCCGTAGCGGTGCGCCGCCCGCAGCCACGGAGCGATGTTGGCCTCGTCGTCAAGACGACTGACGATCA
+CTTCGTATCCCAGCCCGGCGCGTGAGGACGACGCTTCGGCCAGCAACGACAGCAGCACCGCCCGGTCGGC
+GCCCAGCACCACGCCGCCCGGGTCAGCGTTGACCAGATCGGCCACCGCTTCACGGGCGGCGTCGAGTACC
+GCCGCGCTACGCCGCGCCGACGGGTGAGCACCCACTGTGCTAGCGCCCGACCGGCGGAAGGCCGTCGACA
+CGGTGGTCGCGACGGAATCGGGAATCAGCATTCCGGCCGGTGCATCGAAGTGCACCCATCCGTCACCCAG
+CGATGGGTGCAATCCGCGCACCCGGGCGACGTCGTATGCCATGCCAGCCACCTTAGAACTCGGGTGTCCT
+AGACGTCCCAGCCCGCCCGGGCTTCCCTGAGCCATGTCACCCGGCCAGCCATACTAATCGAGTGGGCCTG
+TGGTTCGGTACGCTAATCGCTTTGATTTTGCTGATAGCGCCGGGGGCAATGGTTGCTCGCATCGCCCAGC
+TGAGGTGGCCGGTCGCCATCGCGGTTGGCCCGGCGCTGACATACGGCGTGGTGGCACTCGCGATCATCCC
+CTATGGCGCGCTCGGAATTCCCTGGAACGGTTGGACCGCGCTGGCCGCCTTGGCGGTGACGTGCGCTGTA
+GCGACCGGTTTGCAGCTACTGCTTGCCCGTTTTCGGGACCTCGACGCCGAGGCACTTGCGGTTAGCCGCT
+GGCCCGCGGTTACGGTCGCCGCCGGGGTGCTGCTGGGCGCCCTGTTGATCGGATGGGCCGCATATCGCGG
+CATACCGCACTGGCAGTCCATCCCCAGCACCTGGGACGCGGTCTGGCACGCCAACACCGTACGTTTCATC
+CTGGACACCGGCCAGGCGTCCTCGACTCACATGGGGGAGCTTCGCAACGTCGAGACCCATGCCCCGTTGT
+ACTACCCGTCGGTGTTCCACGGGCTGGTCGCGGTGTTCTGCCAGTTAACCGGCGCGGCACCCACCACCGG
+CTACACACTGAGTTCGCTGGCCGCCTCGGTCTGGCTGTTTCCGGTCAGTGCAGCCGTTCTCACCTGGCGC
+GCGGTGCGCTCACACCCGGGCGCGCTGTGGTCGGCCTCCTGCGCCTCGGCAGAGTGGCGCGCCGCCGGAG
+CGGCGGGCACCGCCGCGGCACTCTCGGCGTCGTTCACCGCGGTGCCCTACGTCGAGTTCGATACCGCCGC
+TATGCCCAACCTGGCGGCCTACGGCATCGCGGTGCCGACGATGGTGCTGATCACCTCGACATTGCGGCAC
+CGCGACCGCATCCCGGTGGCCGTGCTAGCGCTGGTCGGCGTCTTCTCACTGCACATTACCGGCGGTATCG
+TCGTAGCGCTGTTGGTGTCGGCCTGGTGGCTTTTCGAGGCACTGCGGCATCCTGTGCGATCAAGGCTGGC
+CGACCTGTTGACGCTGGCCGGCGTGGCAGCGATGGCCGGGTTGGTCATGTTGCCGCAGTTCTTGAGCGTC
+AGGCAGCAGGAAGACATCATCGCCGGACACGCTTTTCCCACCTATCTCAGCAAGAAGCGTGGGCTGTTCG
+ACGCTGTTTTCCAGCACTCCCGCCATCTCAACGACTTCCCGGTCCAGTACGCGCTCATTGTGTTGGCCGC
+CATCGGCGGGCTCATTCTGCTGGTCAAGAAGATCTGGTGGCCGCTGGCGGTTTGGCTGCTGTTGATTGTG
+ATGAACGTCGACGCGGGAACACCGTTGGGCGGACCTATCGGAGGGGTGGCCGGCGCACTCGGCGAGTTCT
+TCTATCACGATCCGCGCCGCATCGCGGCGGCCACAACCCTGCTGTTGATGCTGATGGCAGGTGTGGCGCT
+GTTCGCGACAGTCATGTTGCTAGTGGCCGCGGCGAAACGACTGACCGACCGTTTCAGACCCCAGCCGGTG
+TCTGTCTGGGCATCGGCGACCGCGACACTACTGATCGGAGCCACTCTGGTCAGTGCGTGGCATTACTTTC
+CCCGGCACCGATTTCTGTTCGGCGACAAGTACGACTCGGTGATGATCGACCAGAAAGATCTCGACGCCAT
+GGCATACCTGGCGAGTTTGCCCGGCGCACGCGACACGTTGATTGGCAACGCCAACACGGACGGCACCGCG
+TGGATGTATGCCGTGGCCGGCCTACACCCGCTGTGGACCCACTACGACTACCCGCTGCAACAGGGCCCGG
+GCTATCACCGGTTCATCTTCTGGGCCTATGGCCGCAACGGGGAGAGCGATCCTCGGGTACTCGAGGCCAT
+CCAAGTCCTCCGTATCCGCTATATCCTGACCAGCACTCCGACGGTGCGGGGGTTTGCCGTGCCGGACGGA
+CTAGTGTCGTTAGAGACATCGAGGTCGTGGGCGAAGATCTACGACAACGGCGAGGCCCGAATCTACGAAT
+GGCGCGGCACTGCCGCAGCAACACACTCCTAGAAGGTGCGTAAGAGGATGGTGATTGGATTGAGTACCGG
+CAGCGACGACGACGACGTCGAGGTCATCGGCGGCGTCGACCCGCGGCTGATAGCGGTGCAGGAGAACGAC
+TCCGACGAGTCGTCGCTGACCGACCTGGTCGAGCAGCCCGCCAAGGTGATGCGCATCGGCACCATGATCA
+AGCAACTGCTCGAGGAGGTTCGCGCCGCCCCACTCGACGAAGCCAGCCGCAATCGGCTACGCGATATCCA
+CGCCACCAGCATCCGCGAACTCGAAGATGGTCTGGCCCCGGAACTGCGCGAGGAGCTCGACCGGCTTACC
+CTGCCGTTCAACGAGGACGCCGTGCCCTCGGACGCCGAGTTGCGCATTGCCCAGGCACAGCTGGTCGGCT
+GGCTGGAAGGGCTGTTCCACGGCATCCAAACCGCGCTATTTGCTCAGCAAATGGCGGCGCGCGCGCAGCT
+GCAACAAATGCGCCAGGGTGCGCTGCCGCCCGGGGTCGGCAAGTCGGGCCAGCACGGCCACGGCACCGGA
+CAATACCTGTAAGCCGTGTCGGATCCGCACCATCCCCATATCCAGACGCACAACGCGTGGGTGGAGTTCC
+CTATCTTCGACGCCAAGTCACGTTCGCTGAAGAAGGCGGTCCTGGGTAAAGCGGGCGGCACCATCGGGCG
+CAACAACTCCAACGTCGTCGTCATCGAAGCGTTGCGCGACATCACCATGGAGCTGAACCTGGGTGACCGG
+GTCGGTCTGGTCGGACACAACGGAGCCGGCAAATCGACGCTGCTACGCCTGCTTTCGGGCATCTACGAGC
+CCACCCGCGGCTGGGCGAAGGTCACCGGAAGGGTGGCGCCGGTCTTCGATCTGGGCATCGGCATGGACCC
+CGAGATCTCCGGCTACGAGAACATCATCATTCGTGGGCTGTTTCTGGGACAGACCCGCAAACAGATGCAG
+GCGAAAGTGGATGAGATCGCCGAATTCACCGAATTGGGCGAGTACCTTTCGATGCCGCTGCGCACCTATT
+CCACCGGGATGCGAGTCCGCCTGGCGATGGGCGTGGTCACCAGCATCGACCCAGAGATCCTGTTGCTCGA
+CGAAGGCATCGGCGCCGTGGACGCCGACTTCCTGAGGAAGGCCCAGTCCCGGCTGCAGAATTTGGTCGAA
+CGTTCCGGGATCCTGGTTTTCGCAAGCCATTCCAACGAGTTTTTGGCTCGACTATGCAAGACCGCGATAT
+GGATTGACCATGGCGTCATCAGGCTCGCCGGTGGTATCGAAGAGGTGGTACGGGCCTACGAGGGTGAGGA
+CGCCGCCCGGCACGTGCGCGAAGTACTGGCCGAGACCCAGGCCGACAGACAGAACGTCCAGGGATGACTG
+AATCGGTCTTCGCCGTTGTGGTAACCCACCGGCGCCCCGACGAGCTGGCCAAGTCGCTGGATGTGCTGAC
+CGCCCAGACCCGGTTACCGGACCACCTGATCGTGGTCGATAACGACGGTTGCGGCGACAGCCCGGTCCGC
+GAGCTTGTCGCGGGACAACCGATCGCCACCACGTATTTGGGGTCACGCCGAAACCTGGGCGGTGCCGGCG
+GTTTCGCGCTGGGCATGCTGCACGCGCTGGCACAGGGCGCCGATTGGGTGTGGCTGGCCGACGACGACGG
+GCACGCGCAAGATGCTAGGGTACTGGCAACCCTGCTGGCGTGCGCCGAGAAGTACAGCCTCGCCGAGGTG
+TCACCGATGGTGTGCAACATAGACGACCCGACGCGGCTGGCGTTTCCGTTGCGGCGTGGCCTGGTATGGC
+GCAGGCGCGCAAGTGAATTGCGCACCGAGGCGGGCCAAGAGCTGCTGCCTGGGATCGCATCACTGTTCAA
+CGGCGCACTGTTTCGGGCATCCACCCTAGCGGCGATCGGCGTGCCTGACCTGCGGCTGTTCATCCGCGGC
+GACGAGGTGGAGATGCACCGCCGGCTGATCCGGTCCGGTCTACCGTTCGGAACCTGTCTGGACGCGGCCT
+ACCTGCACCCCTGCGGATCAGACGAATTCAAGCCGATCCTTTGTGGCCGCATGCACGCCCAATATCCCGA
+CGATCCCGGGAAGCGGTTTTTCACCTACCGCAACCGTGGCTATGTATTGTCGCAACCCGGCCTGCGCAAA
+CTATTGGCCCAGGAATGGCTGCGGTTCGGCTGGTTCTTCCTGGTGACCCGCCGCGACCCTAAAGGCCTGT
+GGGAGTGGATTCGGTTGCGCCGCCTGGGCCGTCGGGAGAAGTTTGGCAAGCCTGGAGGATCTGCATGACA
+TTCATGGATGCTCAAGCTAGCTTCCAGACACAGTCGCGGACACTGGCCCGCGTCCGAGGCGATCTGGTCG
+ACGGGTTCCGCCGCCACGAGCTGTGGCTGCACCTGGGCTGGCAGGACATCAAGCAGCGGTACCGCCGCTC
+GGTGCTGGGGCCGTTCTGGATCACCATCGCCACCGGAACGACCGCCGTCGCGATGGGCGGCCTGTACTCC
+AAGCTGTTTCGGCTCGAGCTGTCTGAGCACCTGCCCTACGTCACGCTCGGGCTGATCGTCTGGAACCTGA
+TCAACGCCGCCATCCTGGACGGCGCAGAGGTTTTCGTCGCCAACGAAGGTCTGATCAAACAGCTGCCGGC
+ACCGTTGAGCGTGCACGTCTATCGGTTGGTGTGGCGGCAGATGATCTTCTTCGCCCACAACATCGTCATC
+TACTTCGTCATCGCGATCATCTTTCCTAAGCCGTGGTCGTGGGCGGATCTGTCGTTTCTTCCGGCGCTGG
+CGCTCATTTTCCTCAATTGCGTTTGGGTGTCACTGTGTTTCGGCATCCTGGCGACCCGCTACCGCGACAT
+CGGCCCGCTGCTGTTTTCCGTTGTGCAGTTGTTGTTCTTCATGACGCCGATCATCTGGAACGACGAGACC
+CTGCGTCGGCAGGGCGCGGGCCGCTGGTCGAGCATCGTCGAGCTCAACCCGCTGCTGCACTATCTGGACA
+TCGTGCGGGCGCCACTGTTGGGCGCTCACCAGGAGCTGCGGCACTGGCTGGTGGTGCTGGTGTTGACCGT
+CGTCGGCTGGATGCTGGCGGCGTTCGCGATGCGGCAGTATCGCGCGCGGGTGCCCTACTGGGTGTAGGGA
+CTATTCCGGCGGCTATAGCCGACCGGCTTCTTTCACGCGGCTTGCGCGTGACGGGCCGCCGTTGATCTCA
+AGATCGGCTGGCAACGGCCGCGTACCAGCGGCAGCATGGATTAGGTTCACCGTTTGCCGATGAGGCTCAG
+AGGGCGGGACGGATGGAAATACTTGTCACCGGGGGCGCGGGCTTCCAGGGAAGCCATCTGACCGAGTCAC
+TGCTGGCCAATGGGCATTGGGTCACTGTCCTCGACAAGTCTTCGAGGAATGCGGTTCGTAACATGCAGGG
+ATTTCGTTCGCATGACCGCGCCGCGTTCATATCCGGTTCGGTAACCGACGGCCAGACGATCGACCGCGCG
+GTGCGGGACCATCACGTCGTATTTCACCTGGCCGCGCATGTCAACGTGGACCAGTCCTTGGGCGACCCGG
+AGAGCTTTCTCGAAACCAATGTCATGGGAACCTACCGCGTCCTGGAAGCCGTCCGGCGCTACAGGAACCG
+CTTGATATACGTATCGACGTGCGAAGTCTACGGCGACGGACACAATCTCAAGGAAGGCGAACGACTTGAC
+GAACACGCGGAGCTGAAGCCGAACAGTCCATATGGCGCTTCCAAGGCGGCGGCCGACCGCTTGTGCTACT
+CGTACTTTCGCTCCTACGGACTCGACGTCACGATCGTCCGTCCGTTCAACATCTTCGGCGTCCGCCAAAA
+GGCTGGGCGATTCGGCGCGCTGATTCCGCGGCTGGTCCGCCAGGGCATCAACGGTGAAGGCCTGACAATC
+TTCGGCGCAGGTAGCGCAACCCGGGATTACCTGTATGTCAGTGACATCGTGGGCGCGTACAACCTGGTAT
+TACGAACTCCAACCCTGCGTGGTCAGGCCATCAATTTTGCCAGCGGGAAAGATACCCGGGTGAGGGACAT
+CGTCGAGTATGTTGCGGACAAGTTCGGTGCCAGGATCGAGCACCGCGACGCTCGCCCCGGAGAGGTCCAG
+CGCTTTCCCGCTGACATTTCGCTTGCCAAAAGCATCGGGTTCCAGCCGCAAGTCGAAATTTGGGACGGCA
+TCGATCGCTATATCAATTGGGCCAAGGATCAGCCCCAATACCCATATGAGCAGGACGGGTTTAGCGGTTC
+CAGCGTTCTCTAATACACCCGTCGCCGCCATCGTCTGCCGGTAAAGTGGGCCGAAATGGCGCGGAACTAC
+CAGCTGGAAGGATTACCTCCCATTCGATGGTGACCGTAGCACGCCGACCGGTGTGCCCGGTGACGCTGAC
+ACCGGGTGACCCGGCGCTAGCGTCGGTGCGCGACCTGGTCGACGCGTGGAGCGCGCATGATGCGCTGGCG
+GAGCTGGTCACGATGTTCGGCGGCGCGTTTCCGCAGACGGACCATCTGGAAGCGCGGCTGGCGAGCCTGG
+ACAAGTTCAGCACGGCATGGGACTACCGGGCGCGCGCACGTGCAGCACGAGCGCTCCACGGCGAACCGGT
+GCGGTGCCAGGACTCCGGCGGTGGGGCGCGATGGCTGATCCCCCGCCTGGACTTGCCGGCCAAGAAGCGG
+GACGCGATCGTCGGGTTGGCGCAGCAGCTGGGGCTCACCTTGGAATCGACCCCGCAGGGAACAACCTTCG
+ACCACGTTCTAGTCATCGGCACCGGACGTCATTCCAACCTGATCCGGGCCCGCTGGGCCCGGGAATTGGC
+AAAGGGTCGCCAGGTTGGTCACATCGTGCTCGCCGCCGCATCGCGTCGATTGCTGCCCTCCGAGGATGAC
+GCGGTCGCGGTCTGTGCGCCGGGCGCACGCACCGAATTCGAGCTATTAGCGGCCGCGGCAAGGGACGCAT
+TCGGCCTGGACGTCCACCCAGCGGTGCGGTATGTGCGCCAGCGGGACGACAACCCGCACCGGGACAGCAT
+GGTGTGGCGCTTCGCCGCCGACACCAATGACCTAGGCGTTCCGATCACCCTGCTGGAGGCGCCATCGCCG
+GAGCCCGACAGCAGCCGCGCCACCTCGGCCGACACCTTCACGTTTACCGCACACACGCTGGGTATGCAGG
+ACTCAACGTGTCTGTTGGTGACCGGGCAACCGTTCGTGCCCTACCAGAACTTCGACGCACTGCGAACTCT
+GGCGCTGCCCTTCGGGATACAGGTGGAGACAGTGGGCTTCGGCATCGACCGCTACGACGGGCTGGGTGAG
+TTGGACCAACAACACCCTGCCAAGCTGCTGCAGGAGGTCCGCTCGACGATCCGGGCGGCCCGAGCCCTGC
+TGGAACGGATCGAGGCCGGCGAGCGCATGGCTACCGATCCTCGGCGGTGATGGTGCATGGCGTGGCCGGC
+GGGTAGCTGCCCGATACGGCTCGCAACCGTCCCGGTGGCGGCCACGGCCGTAGTCCCATGTTGGCTAGGT
+ACCGCACCGGATTGACATGCCCGTCCTGCGTGCGGACCTCGAAATGCAGATAACCATCTGCCGATTCGCC
+TTGCGCACCGATGGTGCCCAGTTGCGCTCCCGCGGCGATTCGATCACCAAGGACAAGGCGGCCCTCGTCC
+CCGGGCCGAAATACATAGACAACGTCGAGCTCGCAGCGTGCGATCGTCAGCGACACCAGGCCATCGACCT
+CGTCGATCGCGCTGACGGCCCCGGAAGCGACCGCGTAGACGGGTGTTCCCGGATCGGTGGCGAAGTCGAC
+ACCGGGATGGAAACCACCCGCGTGCGGACCGTACCCGCGGCCGATCGCGCGCGGCTCCCGGTCGATCGGC
+AGCCGCCCGCCCGGCTCGAGCGGATCGAAGTCGCCGCGGATGCGCCGCCGGTAGTCGGCTTTGAGCAGGT
+CGACCTCGTCGAGTGCGTAGCCAAACAACAAAGATCGGTCGTAGGCCACCCCGAAGTTGAACCGATAGTC
+CGGATCGAGCCGCAGATAGTGCTCCACCCTCAAGATCCGTTCCGCCAGCGTCGACCAGCCGCTATGCACC
+AGCCGAACCCCCGGAAGCTGTCCGATGCGACCGTGATCGGTGATGTTGGCCGGCCAATGCGGGTTGTGCA
+TCAGCTTGCCGCCTGCCCGCAGACCCGGGTACCAGCGCCACAACGGTCCACGTAGCGCTTCGGCGGTTCC
+CATCACCGGAATCAGGTCGGGATACTCCGGATCATCCCAGCGTGACACCATCGGACACATCAGCGCCACG
+ATGTCGTCCGGTGTGCGGGCTAACACCGCCCGAAGATCGATGTCGGTCTCGACCAACCAATCGGCATCGA
+CCATCATCACCCAGTCCGGGCGGCAGAAGTCCGCCATCCGATACAGCAGTTCCAGCCCGGCGGACTCAGG
+AATCAGCCATGGCGTGGGCGGCAGATCTGGTCGGGCCCGCACCACGTTCGTCACCGCAGGATGGTTCGCC
+AGGATCTCGGCGGTGTCATCGGTGCTGCGGTCGTCGATCACGTAGATGTCGTCGCTGAACACGGCCAACG
+AGTCCAACGTTGCGGCTAGTGTCCGCCCGGCGTTGTGCGCACGCGTCATCGCCAGAATCCGCATGCCGCC
+TCTCTATCACCCCAGAACACAGGTCCAGTAATTGGGTCTGTCCGCCAATCCAGCGGGAAGGGCGGGCGCC
+GCGGGCAGATCGTGGGCGGCCAGCAGCTGCGCGGTGGTGGTCCCCACCGAGCGCCATCCGTGGTTGTCCA
+GGTAGCCGGACACCTCGTGGCGGGGGCCGGCATAGTTGAGTGCCCAGATGTCCAGATGAAAGCCATGCTC
+TCGCCAGCCTCGGGTCGCGGTGCGGATCATCTCTTCCACCCGAGCGGAATCCCGATCCGCAGAACCGAGG
+AAGGCCTCGAGGGCCAGCCGGCTCCCGGGCGCGCTCAAGTCGGTGACGTGGTCCAGCAGACGATTCTGCG
+CGTCCGGGGGAAGGTATCCGAACAAACCCTCGGCGATCCACGCGGCCGGCTCGGCCGCATCGAAGCCGCC
+GCGGCGCAGCGCATCGGGCCAATCGTGACGCAGGTCGGCCGGCACCATCCGCAGATCCGCGGTCGGCTGG
+GCACCCAAGCCGGCGAGCGTTTGAGCCTTGAACTCGAGCACCCGAGGCTGATCGACCTCGAACACCGTCG
+TATCCGCCGGCCATGGCAGCCGGTACCCGCGTGCGTCGAGCCCCGACGCCAGGATCACCGCTTGCCGAAC
+GCCGGCGGCGGCCGCGTCCAAGAAGAACTGATCGAAGTAGCGGGTGCGCACCACCAACTCGGTCGTCATT
+CGCTGCAAGCCCCAGGCCGCGTCGGGGTCGTCCACATCGGCAGCATCCAGTTCTCCGGTTGCCCATCGGG
+TGAGGAACTCGACACCCACGGCACGAACCAACGGTTCGGCGAACGGGTCGTCGATGAGGGGCTGGGCCGC
+CCTGGCCGCCCTGGCCCTTCCCGCGGCGACCAGCGTGGCGGTCGCGCCGACACCGGTGGCTAGGTCCCAG
+CTATCGTCGTCGGTACGCGCCACGGATCCATCTTCGGCCCGGTCCGGCCGCCAACGCTCCGCTGTCGACC
+CGAACAACCGGTTACAACTGCGTGACGAATATCGATGACGGCTGCACCTTAAGGGTGTAACACTGAAGCG
+CCACGAATCCGATTTATCGTCCTGTGGTGATCGGTGAAACGGCACCCACAGCACGCTATTAGGTAAACAG
+CTATCCGGGCGCAGGCGACAACGCAGTCACCGAAGCGCCGCGAAAGGTCGGCGGACGTGAGCGAGAAAGT
+CGAGTCAAAGGGGCTAGCGGATGCGGCACGCGATCACCTCGCGGCTGAGTTGGCCCGGCTGCGGCAGCGA
+CGCGATCGGCTGGAGGTCGAGGTCAAGAACGACCGGGGCATGATCGGCGATCACGGCGACGCGGCCGAGG
+CGATACAACGTGCCGACGAACTGGCCATCCTCGGTGACCGGATCAATGAACTGGACCGGCGGCTGCGCAC
+CGGGCCCACCCCCTGGAGCGGGTCGGAAACGCTGCCCGGCGGCACCGAGGTGACCTTGCGGTTCCCTGAC
+GGTGAAGTCGTCACGATGCATGTAATCTCCGTCGTCGAAGAGACGCCGGTGGGCCGAGAAGCCGAAACCC
+TGACGGCGCGCAGCCCACTAGGTCAGGCCCTGGCCGGTCACCAACCCGGCGACACGGTGACCTACTCGAC
+CCCGCAGGGTCCTAATCAGGTCCAGCTGCTTGCTGTCAAGCTGCCCTCATAATTCGCACACCGCACCAGG
+CTCGCCGCCCCCATTAGACTTCCCCCGATGATCCGATCGGAGTCTGGTGCCGCGCCGCCACGCCAACACC
+TGCACCTGTCGGCACAGGTAATGCGGTTCGTTGTCACCGGCGGCCTCGCTGGGATAGTTGACTTTGGCCT
+CTACGTCGTGCTGTACAAGGTGGCGGGCCTACAGGTCGACCTGTCCAAGGCCATCAGCTTCATCGTCGGC
+ACCATCACCGCGTACCTGATCAACCGCCGGTGGACATTCCAGGCCGAGCCCAGCACGGCCCGATTCGTCG
+CGGTCATGCTCCTCTACGGAATCACCTTCGCCGTGCAGGTCGGACTCAACCACCTCTGCCTCGCACTCTT
+GCACTACCGGGCGTGGGCCATCCCCGTCGCGTTTGTGATCGCGCAGGGCACCGCCACGGTAATCAACTTC
+ATCGTGCAGCGAGCCGTGATCTTCCGGATCCGCTGAGCCGGTCAGGGTCGAATCGGGCGGGTACCCTCTT
+TGACGATGTTGAGCGTGGGAGCTACCACTACCGCCACCCGGCTGACCGGGTGGGGCCGCACAGCGCCGTC
+GGTGGCGAATGTGCTTCGCACCCCAGATGCCGAGATGATCGTCAAGGCGGTGGCTCGGGTCGCCGAGTCG
+GGGGGCGGCCGGGGTGCTATCGCGCGCGGGCTGGGCCGCTCCTATGGGGACAACGCCCAAAACGGCGGTG
+GGTTGGTGATCGACATGACGCCGCTGAACACTATCCACTCCATTGACGCCGACACCAAGCTGGTCGACAT
+CGACGCCGGGGTCAACCTCGACCAACTGATGAAAGCCGCCCTGCCGTTCGGGCTGTGGGTCCCGGTGCTG
+CCGGGAACCCGGCAGGTCACCGTCGGTGGGGCGATCGCCTGCGATATCCACGGCAAGAACCATCACAGCG
+CTGGCAGCTTCGGTAACCACGTGCGCAGCATGGACCTGCTGACCGCCGACGGCGAGATCCGTCATCTCAC
+TCCGACCGGCGAGGACGCCGAACTGTTCTGGGCCACCGTCGGGGGCAACGGTCTCACCGGCATCATCATG
+CGGGCCACCATCGAGATGACGCCCACTTCGACGGCGTACTTCATCGCCGACGGCGACGTCACCGCCAGCC
+TCGACGAGACCATCGCCCTGCACAGCGACGGCAGCGAAGCGCGCTACACCTATTCCAGTGCCTGGTTCGA
+CGCGATCAGCGCTCCCCCGAAGCTGGGCCGCGCGGCGGTATCGCGTGGCCGCCTGGCCACCGTCGAGCAA
+TTGCCTGCGAAACTGCGGAGCGAACCTTTGAAATTCGATGCGCCACAGCTACTTACGTTGCCCGACGTGT
+TTCCCAACGGGCTGGCCAACAAATATACCTTCGGCCCGATCGGCGAACTGTGGTACCGCAAATCCGGCAC
+CTATCGCGGCAAGGTCCAGAACCTCACGCAGTTCTACCATCCGCTGGACATGTTCGGCGAATGGAACCGC
+GCCTACGGCCCAGCGGGCTTCCTGCAATATCAGTTCGTGATCCCCACAGAGGCGGTTGATGAGTTCAAGA
+AGATCATCGGCGTTATTCAAGCCTCGGGTCACTACTCGTTTCTCAACGTGTTCAAGCTGTTCGGCCCCCG
+CAACCAGGCGCCGCTCAGCTTCCCCATCCCGGGCTGGAACATCTGCGTCGACTTCCCCATCAAGGACGGG
+CTGGGGAAGTTCGTCAGCGAACTCGACCGCCGGGTACTGGAATTCGGCGGCCGGCTCTACACCGCCAAAG
+ACTCCCGTACCACCGCCGAAACCTTTCATGCCATGTATCCGCGCGTCGACGAATGGATCTCCGTGCGCCG
+CAAGGTCGATCCGCTGCGCGTATTCGCCTCCGACATGGCCCGACGCTTGGAGCTGCTGTAGATGGTTCTT
+GATGCCGTAGGAAACCCCCAGACGGTGCTGCTGCTCGGTGGCACCTCCGAGATCGGGCTCGCCATCTGCG
+AGCGCTACCTGCACAATTCGGCGGCCCGCATCGTGCTGGCCTGCCTGCCCGACGACCCACGGCGGGAGGA
+CGCGGCCGCTGCGATGAAGCAGGCCGGCGCGCGGTCGGTGGAGCTGATCGACTTTGACGCCCTGGATACC
+GACAGCCACCCGAAGATGATCGAGGCGGCCTTCTCCGGCGGTGATGTGGACGTGGCTATCGTCGCGTTCG
+GCTTGCTCGGCGACGCCGAAGAGCTGTGGCAGAACCAGCGCAAGGCGGTGCAGATCGCCGAAATCAACTA
+CACCGCAGCGGTTTCGGTGGGCGTGCTGCTGGCTGAGAAGATGCGCGCTCAGGGCTTCGGTCAGATCATC
+GCGATGAGCTCGGCCGCCGGTGAGCGGGTGCGACGGGCGAACTTCGTCTACGGCTCCACCAAGGCCGGTC
+TGGACGGGTTTTACCTGGGGTTGTCAGAAGCGCTGCGCGAGTACGGTGTTCGTGTGCTGGTGATCCGGCC
+CGGCCAGGTGCGTACCCGGATGAGCGCGCACCTCAAGGAAGCTCCATTGACCGTCGACAAGGAGTACGTC
+GCCAACCTCGCGGTGACCGCGTCCGCAAAAGGTAAGGAATTGGTTTGGGCGCCAGCAGCGTTCCGCTACG
+TCATGATGGTGTTGCGTCACATCCCGCGGAGCATCTTCCGCAAGCTGCCCATCTGAGTATGCCGAGCAGA
+CGCAAAAGCCCCCAATTCGGGCACGAAATGGGGGCTTTTACGTCTGCTCGCGCCCGGGAGGTGCTGGTCG
+CTCTTGGCCAGCTGGCAGCGGCGGTGGTAGTGGCCGTCGGTGTCGCGGTGGTGTCCCTGCTCGCCATTGC
+GCGGGTGGAGTGGCCCGCCTTCCCGTCGTCCAACCAGCTGCATGCGCTGACCACCGTCGGCCAGGTCGGC
+TGCCTGGCCGGGCTGGTCGGCATCGGCTGGTTGTGGCGGCACGGTCGATTCCGGCGACTGGCCCGGCTGG
+GCGGGCTGGTTTTGGTATCCGCGTTTACCGTCGTGACGCTGGGCATGCCGCTGGGCGCCACCAAGCTGTA
+TCTGTTCGGCATCTCTGTCGACCAGCAGTTCCGCACCGAATACCTCACCCGGCTCACCGACACCGCCGCC
+CTGCGCGACATGACCTACATCGGACTGCCACCGTTTTACCCACCGGGCTGGTTCTGGATCGGCGGACGCG
+CGGCGGCGCTGACCGGGACGCCGGCCTGGGAGATGTTCAAGCCGTGGGCGATCACCTCGATGGCCATTGC
+GGTGGCCGTCGCGCTGGTGCTGTGGTGGCGGATGATCCGCTTCGAATACGCCTTGCTGGTCACCGTCGCC
+ACAGCGGCGGTGATGCTGGCCTACAGCTCGCCGGAGCCCTACGCCGCGATGATCACGGTGTTGTTGCCGC
+CGATGCTCGTACTGACCTGGTCGGGCCTGGGCGCGCGCGACCGTCAGGGCTGGGCCGCGGTGGTCGGTGC
+CGGCGTCTTCCTGGGCTTCGCGGCCACCTGGTACACCCTGTTGGTCGCCTACGGCGCGTTCACGGTGGTG
+CTGATGGCGCTGCTGCTGGCCGGGTCGCGGCTGCAATCCGGAATCAAGGCGGCGGTAGACCCGCTGTGCC
+GGCTTGCCGTCGTCGGCGCGATCGCGGCCGCCATCGGATCCACCACCTGGCTGCCCTACCTGCTGCGGGC
+GGCCCGCGACCCGGTCAGCGACACCGGCAGCGCCCAGCACTACCTACCCGCAGACGGCGCCGCACTGACC
+TTCCCCATGCTGCAGTTCTCCCTGCTGGGCGCGATCTGTCTGCTGGGCACGCTGTGGCTGGTGATGCGCG
+CGCGATCATCGGCGCCAGCCGGCGCCCTGGCCATCGGCGTGCTGGCCGTCTACCTGTGGTCCCTGCTGTC
+GATGCTGGCCACATTGGCGCGCACCACACTGCTGTCGTTTCGCCTGCAGCCGACGCTGAGCGTGCTGCTG
+GTGGCGGCCGGTGCGTTCGGCTTCGTCGAAGCGGTCCAAGCCCTTGGCAAACGGGGTCGCGGTGTCATTC
+CGATGGCCGCCGCCATCGGGTTGGCCGGCGCGATCGCGTTCAGCCAGGACATCCCCGACGTGTTGCGGCC
+GGACCTGACCATCGCCTACACCGACACCGACGGCTACGGCCAGCGCGGCGACCGGCGACCGCCCGGCTCC
+GAGAAGTACTACCCAGCCATCGATGCCGCCATCCGGCGCGTCACCGGCAAGCGCCGCGATCGGACCGTCG
+TGTTGACCGCCGACTACAGCTTCCTGTCGTACTACCCCTACTGGGGCTTTCAGGGGTTGACGCCGCACTA
+CGCCAACCCGCTGGCACAGTTCGACAAGCGCGCCACACAGATCGACAGCTGGTCGGGACTCTCCACCGCC
+GACGAGTTCATCGCCGCGCTGGACAAGCTGCCCTGGCAGCCGCCGACCGTCTTCCTCATGCGCCACGGCG
+CACATAACAGCTACACCCTGCGGCTGGCCCAGGACGTCTACCCCAACCAGCCCAATGTTCGCCGCTACAC
+GGTGGACCTACGGACCGCCCTCTTCGCCGACCCGCGTTTCGTCGTCGAGGACATTGGCCCGTTCGTGCTG
+GCCATCCGCAAGCCGCAGGAGAGCGCGTGATGGCTACCGAAGCCGCCCCACCCCGTATCGCCGTCCGGCT
+ACCATCTACCTCCGTGCGCGACGCGGGAGCAAACTACCGGATCGCCCGGTACGTCGCTGTGGTGGCGGGT
+CTGCTAGGCGCTGTGCTGGCCATCGCCACCCCACTGCTGCCGGTCAACCAGACCACCGCGCAATTGAACT
+GGCCCCAAAACGGCACGTTCGCCAGTGTCGAGGCACCGCTGATTGGCTACGTGGCCACCGACTTGAACAT
+CACCGTCCCCTGCCAGGCCGCCGCCGGACTGGCCGGATCGCAGAACACCGGCAAGACGGTGTTGTTGTCA
+ACGGTGCCCAAGCAGGCGCCTAAGGCCGTCGATCGCGGGCTGCTGCTGCAACGGGCCAACGACGACCTGG
+TGCTTGTGGTGCGTAATGTCCCGTTAGTCACCGCCCCGCTGAGTCAGGTGCTCGGCCCGACCTGTCAGCG
+GTTGACATTCACCGCGCACGCCGATCGGGTCGCCGCCGAATTCGTCGGACTGGTGCAGGGACCCAATGCT
+GAGCACCCCGGTGCACCGCTGCGCGGTGAGCGCAGCGGCTACGACTTCCGCCCGCAGATCGTCGGGGTGT
+TCACCGACCTGGCCGGGCCGGCGCCACCGGGTCTGAGCTTCTCGGCGAGCGTGGATACCCGCTACAGCAG
+CAGCCCCACGCCGCTGAAGATGGCCGCCATGATCCTCGGGGTAGCGCTCACCGGCGCCGCCCTGGTGGCG
+CTGCACATCCTGGACACCGCCGACGGCATGCGGCACCGGCGGTTCCTGCCCGCGCGCTGGTGGTCGATCG
+GCGGTCTGGACACCCTGGTTATCGCCGTGCTGGTGTGGTGGCATTTCGTCGGGGCCAACACCTCCGACGA
+CGGCTACATCCTGACCATGGCCCGGGTGTCCGAGCATGCGGGCTATATGGCCAACTACTACCGCTGGTTC
+GGCACACCCGAGGCGCCTTTCGGCTGGTACTACGACCTGCTGGCGCTGTGGGCTCATGTCAGCACGGCCA
+GTATCTGGATGCGCCTACCCACCCTGGCGATGGCGCTCACCTGCTGGTGGGTAATCAGCCGTGAGGTCAT
+TCCCCGGCTGGGGCACGCCGTCAAGACGAGCCGGGCAGCGGCGTGGACGGCGGCGGGCATGTTTCTGGCT
+GTCTGGCTGCCGCTGGACAACGGCCTTCGGCCCGAGCCGATCATCGCCCTGGGCATCCTGCTGACCTGGT
+GCTCGGTGGAGCGGGCGGTGGCCACCAGCCGGCTGCTGCCGGTGGCAATCGCCTGCATCATCGGTGCCTT
+GACCCTGTTCTCCGGGCCGACGGGCATCGCCTCGATCGGTGCGCTGCTGGTCGCGATCGGGCCGCTACGG
+ACCATCCTGCACCGGCGTTCCAGGCGGTTCGGCGTGCTACCACTGGTGGCGCCGATCCTGGCCGCGGCCA
+CCGTCACCGCGATCCCGATCTTTCGTGATCAGACCTTCGCGGGCGAGATCCAGGCCAACCTCCTCAAGCG
+TGCCGTAGGGCCCAGCCTGAAGTGGTTCGACGAACACATCCGCTACGAGCGGCTGTTCATGGCCAGCCCC
+GACGGCTCGATCGCCCGCCGCTTCGCCGTGCTGGCCTTGGTGCTGGCGCTCGCGGTATCGGTGGCAATGT
+CGTTACGTAAGGGCCGCATTCCAGGTACCGCTGCTGGACCGAGCCGCCGCATCATCGGCATCACGATCAT
+TTCCTTCCTCGCGATGATGTTCACCCCGACAAAGTGGACCCATCACTTCGGGGTGTTCGCGGGGTTGGCC
+GGGTCGCTGGGGGCGCTTGCCGCGGTCGCGGTGACGGGCGCTGCGATGCGCTCGCGGCGGAACCGGACCG
+TGTTCGCCGCCGTGGTGGTCTTCGTGTTGGCCCTGTCGTTCGCCAGTGTCAACGGCTGGTGGTACGTGTC
+CAACTTCGGTGTGCCATGGTCGAACTCGTTTCCGAAGTGGCGATGGTCGCTTACCACCGCACTCCTCGAG
+CTGACGGTGCTGGTGCTGCTGCTAGCGGCATGGTTCCACTTCGTCGCCAACGGTGACGGGCGCCGAACAG
+CCAGGCCAACCCGGTTTAGGGCACGACTAGCCGGAATTGTCCAGTCCCCGTTGGCAATTGCCACGTGGTT
+GCTGGTGCTTTTCGAGGTGGTATCGCTGACCCAGGCGATGATTTCCCAGTACCCGGCGTGGTCGGTTGGC
+CGGTCTAACCTACAGGCTTTGGCCGGCAAGACCTGCGGGCTGGCCGAAGACGTGCTGGTGGAGCTGGATC
+CCAACGCAGGCATGCTGGCGCCGGTGACCGCGCCGTTGGCCGACGCCCTGGGAGCCGGCCTGTCTGAAGC
+CTTCACACCCAACGGCATTCCCGCCGACGTCACCGCCGACCCGGTGATGGAACGTCCAGGGGATCGCAGT
+TTCCTCAACGACGACGGGCTGATCACCGGCAGCGAACCCGGCACCGAAGGGGGCACCACGGCCGCACCGG
+GAATCAACGGCTCCCGCGCCCGGCTGCCCTACAACCTGGACCCGGCCCGTACACCGGTGCTGGGCAGCTG
+GCGAGCCGGCGTGCAGGTGCCCGCCATGCTGCGGTCGGGCTGGTACCGGCTGCCCACCAACGAGCAGCGG
+GACAGGGCGCCGCTGCTGGTGGTGACGGCGGCCGGGCGATTCGACTCCCGCGAGGTCCGGTTGCAGTGGG
+CCACCGACGAGCAAGCGGCCGCCGGACACCACGGTGGGTCGATGGAATTCGCCGACGTCGGTGCCGCGCC
+GGCCTGGCGTAACCTGCGCGCACCACTGTCCGCCATCCCGAGCACCGCCACCCAGGTCCGGTTGGTCGCC
+GACGACCAGGATCTGGCGCCGCAGCACTGGATCGCCCTCACACCACCGCGGATTCCGCGGGTGCGCACGC
+TGCAGAACGTGGTGGGCGCAGCGGATCCGGTGTTCCTGGACTGGCTGGTGGGGCTGGCATTCCCCTGCCA
+ACGCCCGTTCGGCCACCAATACGGCGTCGACGAGACACCCAAGTGGCGGATCCTGCCGGACCGGTTCGGC
+GCCGAAGCCAACTCACCGGTGATGGATCACAATGGCGGTGGCCCGCTGGGCATCACTGAGCTGCTGATGC
+GCGCAACCACGGTGGCCAGCTACCTCAAAGACGACTGGTTTAGGGACTGGGGCGCGTTACAGCGGTTGAC
+GCCTTACTACCCCGACGCCCAGCCCGCTGATCTGAACCTAGGAACGGTGACTCGCAGCGGGCTGTGGAGT
+CCGGCGCCGTTGCGCCGCGGCTAGAAGTGCCGTGGCCACCGACTCGGCGACAACCTCCGCGGCCCCGCAT
+CCTCACCGCCCTTAACCGCGTCGCCTACCATCGAGCCTCGTGCCCCACGACGGTAATGAGCGATCTCACC
+GGATCGCACGCCTAGCAGCCGTCGTCTCGGGAATCGCGGGTCTGCTGCTGTGCGGCATCGTTCCGCTGCT
+TCCGGTGAACCAAACCACCGCGACCATCTTCTGGCCGCAGGGCAGCACCGCCGACGGCAACATCACCCAG
+ATCACCGCCCCTCTGGTATCCGGGGCGCCACGCGCGCTGGACATCTCGATCCCCTGCTCGGCCATCGCCA
+CGCTGCCCGCCAACGGCGGCCTGGTGCTGTCCACACTGCCGGCCGGTGGCGTGGATACCGGTAAGGCCGG
+GCTGTTCGTCCGCGCCAACCAGGACACGGTCGTCGTGGCGTTCCGCGACTCGGTGGCCGCGGTGGCGGCC
+CGCTCCACGATCGCAGCGGGAGGCTGTAGCGCGCTGCATATCTGGGCCGATACCGGCGGCGCGGGCGCTG
+ATTTTATGGGTATACCCGGCGGCGCCGGGACCCTGCCGCCGGAGAAGAAGCCACAGGTTGGCGGCATCTT
+CACCGACCTGAAGGTCGGAGCGCAGCCCGGGCTGTCGGCCCGCGTCGACATCGACACTCGGTTTATCACG
+ACGCCCGGCGCGCTCAAGAAGGCCGTGATGCTCCTCGGCGTGCTGGCGGTCCTGGTAGCCATGGTGGGGC
+TGGCCGCGCTGGACCGGCTCAGCAGGGGCCGCACCCTGCGCGACTGGCTGACCCGATATCGCCCGCGGGT
+GCGGGTCGGATTCGCCAGCCGGCTCGCTGACGCAGCGGTGATCGCGACCTTGTTGCTCTGGCATGTCATC
+GGCGCCACCTCGTCCGATGACGGCTACCTTCTGACCGTCGCCCGGGTCGCCCCGAAGGCCGGCTATGTAG
+CCAACTACTACCGGTATTTCGGCACGACGGAGGCGCCGTTCGACTGGTATACATCGGTGCTTGCCCAGCT
+GGCGGCGGTGAGCACCGCCGGCGTCTGGATGCGCCTGCCCGCCACCTTGGCCGGAATCGCCTGCTGGCTG
+ATCGTCAGCCGTTTCGTGCTGCGGCGGCTGGGACCGGGCCCGGGCGGGCTGGCGTCCAACCGGGTCGCTG
+TGTTCACCGCTGGTGCGGTGTTCCTGTCCGCCTGGCTGCCGTTCAACAACGGCCTGCGTCCCGAGCCGCT
+GATCGCGCTGGGTGTGCTGGTCACGTGGGTGTTGGTGGAACGGTCGATCGCGCTCGGACGGCTGGCCCCG
+GCCGCGGTAGCCATCATCGTGGCGACGCTTACCGCGACGCTGGCACCGCAGGGGTTGATCGCGCTGGCCC
+CGCTGCTGACTGGTGCGCGCGCCATCGCCCAGAGGATCCGGCGCCGCCGGGCGACCGATGGACTGCTGGC
+GCCGCTGGCGGTGCTGGCCGCGGCGTTGTCGCTGATCACCGTGGTGGTGTTTCGGGACCAGACGCTGGCC
+ACGGTGGCCGAATCGGCACGCATCAAGTACAAGGTCGGCCCGACCATCGCCTGGTACCAGGACTTCCTGC
+GCTACTACTTCCTTACCGTGGAGAGCAACGTTGAGGGGTCGATGTCCCGCCGGTTCGCGGTGCTGGTGTT
+GCTGTTCTGCCTGTTCGGGGTGCTGTTCGTGCTGCTGCGGCGCGGCCGGGTGGCGGGGCTGGCCAGCGGC
+CCGGCCTGGCGACTGATCGGCACTACGGCGGTCGGCCTGCTGCTGCTCACGTTCACGCCAACCAAGTGGG
+CCGTGCAGTTCGGCGCATTCGCCGGGCTGGCCGGGGTGTTGGGTGCGGTCACCGCGTTCACCTTTGCCCG
+CATCGGTCTACATAGTCGACGCAACCTCACGCTGTACGTGACCGCGTTGCTGTTCGTGCTGGCGTGGGCA
+ACCTCGGGCATCAACGGGTGGTTCTACGTCGGCAACTACGGGGTGCCGTGGTATGACATCCAGCCCGTCA
+TCGCCAGCCACCCGGTGACGTCGATGTTTCTGACGCTGTCGATCCTCACCGGATTGCTGGCAGCCTGGTA
+TCACTTCCGGATGGACTACGCCGGGCACACCGAAGTCAAAGACAACCGGCGCAACCGCATCTTGGCCTCT
+ACGCCACTGCTGGTGGTCGCGGTGATCATGGTCGCAGGCGAAGTCGGCTCGATGGCCAAGGCCGCGGTGT
+TCCGTTACCCGCTTTACACCACCGCCAAGGCCAACCTGACCGCGCTCAGCACCGGGCTGTCCAGCTGTGC
+GATGGCCGACGACGTGCTGGCCGAGCCCGACCCCAATGCCGGCATGCTGCAACCGGTTCCGGGCCAGGCG
+TTCGGACCGGACGGACCGCTGGGCGGTATCAGTCCCGTCGGCTTCAAACCCGAGGGCGTGGGCGAGGACC
+TCAAGTCCGACCCGGTGGTCTCCAAACCCGGGCTGGTCAACTCCGATGCGTCGCCCAACAAACCCAACGC
+CGCCATCACCGACTCCGCGGGCACCGCCGGAGGGAAGGGCCCGGTCGGGATCAACGGGTCGCACGCGGCG
+CTGCCGTTCGGATTGGACCCGGCACGTACCCCGGTGATGGGCAGCTACGGGGAGAACAACCTGGCCGCCA
+CGGCCACCTCGGCCTGGTACCAGTTACCGCCCCGCAGCCCGGACCGGCCGCTGGTGGTGGTTTCCGCGGC
+CGGCGCCATCTGGTCCTACAAGGAGGACGGCGATTTCATCTACGGCCAGTCCCTGAAACTGCAGTGGGGC
+GTCACCGGCCCGGACGGCCGCATCCAGCCACTGGGGCAGGTATTTCCGATCGACATCGGACCGCAACCCG
+CGTGGCGCAATCTGCGGTTTCCGCTGGCCTGGGCGCCGCCGGAGGCCGACGTGGCGCGCATTGTCGCCTA
+TGACCCGAACCTGAGCCCTGAGCAATGGTTCGCCTTCACCCCGCCCCGGGTTCCGGTGCTGGAATCTCTG
+CAGCGGTTGATCGGGTCAGCGACACCGGTGTTGATGGACATCGCGACCGCAGCCAACTTCCCCTGCCAGC
+GACCGTTTTCCGAGCATCTCGGCATTGCCGAGCTTCCGCAGTACCGGATCCTGCCGGACCACAAGCAGAC
+GGCGGCGTCGTCGAACCTATGGCAGTCCAGCTCGACCGGCGGTCCGTTCCTGTTCACCCAGGCGCTGCTG
+CGCACCTCGACGATCGCCACGTACCTGCGTGGGGACTGGTATCGCGACTGGGGATCGGTGGAGCAGTACC
+ACCGGCTGGTGCCGGCCGATCAGGCTCCAGACGCCGTTGTCGAGGAGGGCGTGATCACTGTGCCCGGCTG
+GGGTCGGCCAGGACCGATCAGGGCGCTGCCATGACACAGTGCGCGAGCAGACGCAAAAGCACCCCAAGTC
+GGGCGATTTTGGGGGCTTTTGCGTCTGCTCGCGGGACGCGCTGGGTGGCCACCATCGCCGGGCTGATTGG
+CTTTGTGTTGTCGGTGGCGACGCCGCTGCTGCCCGTCGTGCAGACCACCGCGATGCTCGACTGGCCACAG
+CGGGGGCAACTGGGCAGCGTGACCGCCCCGCTGATCTCGCTGACGCCGGTCGACTTTACCGCCACCGTGC
+CGTGCGACGTGGTGCGCGCCATGCCACCCGCGGGCGGGGTGGTGCTGGGCACCGCACCCAAGCAAGGCAA
+GGACGCCAATTTGCAGGCGTTGTTCGTCGTTGTCAGCGCCCAGCGCGTGGACGTCACCGACCGCAACGTG
+GTGATCTTGTCCGTGCCGCGCGAGCAGGTGACGTCCCCGCAGTGTCAACGCATCGAGGTCACCTCTACCC
+ACGCCGGCACCTTCGCCAACTTCGTCGGGCTCAAGGACCCGTCGGGCGCGCCGCTGCGCAGCGGCTTCCC
+CGACCCCAACCTGCGCCCGCAGATTGTCGGGGTGTTCACCGACCTGACCGGGCCCGCGCCGCCCGGGCTG
+GCGGTCTCGGCGACCATCGACACCCGGTTCTCCACCCGGCCGACCACGCTGAAACTGCTGGCGATCATCG
+GGGCGATCGTGGCCACCGTCGTCGCACTGATCGCGTTGTGGCGCCTGGACCAGTTGGACGGGCGGGGCTC
+AATTGCCCAGCTCCTCCTCAGGCCGTTCCGGCCTGCATCGTCGCCGGGCGGCATGCGCCGGCTGATTCCG
+GCAAGCTGGCGCACCTTCACCCTGACCGACGCCGTGGTGATATTCGGCTTCCTGCTCTGGCATGTCATCG
+GCGCGAATTCGTCGGACGACGGCTACATCCTGGGCATGGCCCGAGTCGCCGACCACGCCGGCTACATGTC
+CAACTATTTCCGCTGGTTCGGCAGCCCGGAGGATCCCTTCGGCTGGTATTACAACCTGCTGGCGCTGATG
+ACCCATGTCAGCGACGCCAGTCTGTGGATGCGCCTGCCAGACCTGGCCGCCGGGCTAGTGTGCTGGCTGC
+TGCTGTCGCGTGAGGTGCTGCCCCGCCTCGGGCCGGCGGTGGCGGCCAGCAAACCCGCCTACTGGGCGGC
+GGCCATGGTCTTGCTGACCGCGTGGATGCCGTTCAACAACGGCCTGCGGCCGGAGGGCATCATCGCGCTC
+GGCTCGCTGGTCACCTATGTGCTGATCGAGCGGTCCATGCGGTACAGCCGGCTCACACCGGCGGCGCTGG
+CCGTCGTTACCGCCGCATTCACACTGGGTGTGCAGCCCACCGGCCTGATCGCGGTGGCCGCGCTGGTGGC
+CGGCGGCCGCCCGATGCTGCGGATCTTGGTGCGCCGTCATCGCCTGGTCGGCACGTTGCCGTTGGTGTCG
+CCGATGCTGGCCGCCGGCACCGTCATCCTGACCGTGGTGTTCGCCGACCAGACCCTGTCAACGGTGTTGG
+AAGCCACCAGGGTTCGCGCCAAAATCGGGCCGAGCCAGGCGTGGTATACCGAGAACCTGCGTTACTACTA
+CCTCATCCTGCCCACCGTCGACGGTTCGCTGTCGCGGCGCTTCGGCTTTTTGATCACCGCGCTATGCCTG
+TTCACCGCGGTGTTCATCATGTTGCGGCGCAAGCGAATTCCCAGCGTGGCCCGCGGACCGGCGTGGCGGC
+TGATGGGCGTCATCTTCGGCACCATGTTCTTCCTGATGTTCACGCCCACCAAGTGGGTGCACCACTTCGG
+GCTGTTCGCCGCCGTAGGGGCGGCGATGGCCGCGCTGACGACGGTGTTGGTATCCCCATCGGTGCTGCGC
+TGGTCGCGCAACCGGATGGCGTTCCTGGCGGCGTTATTCTTCCTGCTGGCGTTGTGTTGGGCCACCACCA
+ACGGCTGGTGGTATGTCTCCAGCTACGGTGTGCCGTTCAACAGCGCGATGCCGAAGATCGACGGGATCAC
+AGTCAGCACAATCTTTTTCGCCCTGTTTGCGATCGCCGCCGGCTATGCGGCCTGGCTGCACTTCGCGCCC
+CGCGGCGCCGGCGAAGGGCGGCTGATCCGCGCGCTGACGACAGCCCCGGTACCGATCGTGGCCGGTTTCA
+TGGCGGCGGTGTTCGTCGCGTCCATGGTGGCCGGGATCGTGCGACAGTACCCGACCTACTCCAACGGCTG
+GTCCAACGTGCGGGCGTTTGTCGGCGGCTGCGGACTGGCCGACGACGTACTCGTCGAGCCTGATACCAAT
+GCGGGTTTCATGAAGCCGCTGGACGGCGATTCGGGTTCTTGGGGCCCCTTGGGCCCGCTGGGTGGAGTCA
+ACCCGGTCGGCTTCACGCCCAACGGCGTACCGGAACACACGGTGGCCGAGGCGATCGTGATGAAACCCAA
+CCAGCCCGGCACCGACTACGACTGGGATGCGCCGACCAAGCTGACGAGTCCTGGCATCAATGGTTCTACG
+GTGCCGCTGCCCTATGGGCTCGATCCCGCCCGGGTACCGTTGGCAGGCACCTACACCACCGGCGCACAGC
+AACAGAGCACACTCGTCTCGGCGTGGTATCTCCTGCCTAAGCCGGACGACGGGCATCCGCTGGTCGTGGT
+GACCGCCGCGGGCAAGATCGCCGGCAACAGCGTGCTGCACGGGTACACCCCCGGGCAGACTGTGGTGCTC
+GAATACGCCATGCCGGGACCCGGAGCGCTGGTACCCGCCGGGCGGATGGTGCCCGACGACCTATACGGAG
+AGCAGCCCAAGGCGTGGCGCAACCTGCGCTTCGCCCGAGCAAAGATGCCCGCCGATGCCGTCGCGGTCCG
+GGTGGTGGCCGAGGATCTGTCGCTGACACCGGAGGACTGGATCGCGGTGACCCCGCCGCGGGTACCGGAC
+CTGCGCTCACTGCAGGAATATGTGGGCTCGACGCAGCCGGTGCTGCTGGACTGGGCGGTCGGTTTGGCCT
+TCCCGTGCCAGCAGCCGATGCTGCACGCCAATGGCATCGCCGAAATCCCGAAGTTCCGCATCACACCGGA
+CTACTCGGCTAAGAAGCTGGACACCGACACGTGGGAAGACGGCACTAACGGCGGCCTGCTCGGGATCACC
+GACCTGTTGCTGCGGGCCCACGTCATGGCCACCTACCTGTCCCGCGACTGGGCCCGCGATTGGGGTTCCC
+TGCGCAAGTTCGACACCCTGGTCGATGCCCCTCCCGCCCAGCTCGAGTTGGGCACCGCGACCCGCAGCGG
+CCTGTGGTCACCGGGCAAGATCCGAATTGGTCCATAGCGTCAGGCTCCGCAGTCGATAGCGGCACGATGT
+TCGTCATTAGACGGCCCCATCAGTTAGGCCTCCTATGCTGCTCGGTATGCACCAGGCCGGCCATGTTGGC
+ACACACGAACGGCGCGCAGCCGCAACGAGGCGGTCCGCCCTGACTGCGGCAGGGTTAGCCGTCGTCGGCG
+CAGGGGTGTTGGGCGCGTCGGCGTGCAGTCCACAAAAGTCTCCTCAGCCATCATCACCCCGGTTGCCCGA
+CAATGCGCTGATCACGCTCGGGGTGGCCGCCGGCCCGCCGCCTACGCCCAGCAGAGTAGGAATCTCGTCG
+GTGCTGAAAATTGGCCGCGATCTGTACGTGATCGATTGCGGCCTGGGCTCGCTGAACGCATTCACCAACG
+CGGGCCTGCAATTCGACGATCTCAAAGCCATGTTTATCACCCACTTGCACACCGACCACATCGTCGACTA
+CTACAACTTCTTTCTCTCCGGTGGCTTCCTTGCCCCACCCGGTCGAGCGCCGGTCCTGGTCTATGGTCCG
+GGCCCAGCTGGGGGTTTGCCGCCAAGTGAAGTCGGCAACCCGAATCCAGCCACCGTCAACCCCGCCAACC
+CGACACCGGGCCTTGCCGCGGCCACCGAAGCGCTGCATCGAGCGTTCGCTTACACCAGCAACATCTTCAT
+CCGCGACTACGGCATTGACAACGTTGCGGACCTGGTTAAAGTCACGGAGATCGGGCTACCACCAGGATCG
+GACTACCGCAACAGAGCGCCAAAGATGAGCCCGTTCTCGGTCGCATCGGACGACAACGTTTCCGTCACCG
+CAACGCTGGTCTCCCACTACGACGTCTACCCAGCGTTCGGATTCCGCTTCGATCTGAAGAAATCGGGTGT
+GTCCGTTACCTTCTCGGGTGACACCACTAAGTCCGACAACCTGATTACCCTCGCTCAAGGCACTGACATT
+CTGGTCCACGAGGCGGTGTTCAGCCTCGATACGGCTTACTTTGGCAACGCTTTCCCCCCGAACTATCTGG
+TGAACTCACACATCTCCGCAGAGCAGGTGGGGGAGGTGGCCGCAGCGGCCAAGCCCAAACAATTGATCCT
+GAGCCACTACGCCCCTGACGACCTACCCGACTCGCAGTGGCTCGACAAGATCAAGAAGAATTACTCGGGC
+ATGACCACCATCGCGCGGGACGGCCAGGTCTTCGCCCTCTGATCCGTTAGCGGTAGCGCCCCGTTCGACG
+ATCGCTGCCTAGAGCTAGACATATATAAAACCTATGCAATAGGGTCGCGGCATGCCCGAGTACGACCTAG
+AGGCCGTGGACAAGCTGCCCTTCTCGACCCCTGAAAAGGCGCAGCGCTACCAAACGGAAAACTATCGCGG
+GGCCATGGGCCTCAACTGGTACCTCACGGATCCGACCCTGCAGTTCATCATGGCCTATTACCTACGACCC
+GATGAATTGGCGTTCGCAGAACCCCATCTGACCCGCATTGGTGAGCTGACGGGCGGGCCAGTGACGCGTT
+GGGCCGAGGAAACCGACCGCAACCCCCCGCGGCTCGAACGCTACGACCGGTGGGGGCATGACATCAGCCG
+GGTAGTGCTGCCGGAATCGTTCATCCAATCCAAGCGCGCCGTCATCGAGGCGCGACAAGCCGTGCGCGAC
+GACGCGGCACGGGCCGGCGTCAAGCCGTCGCTGGCACTCTTCGCCGCCGACTATCTGCTCAACCAGGCCG
+ATATCGGTATGGCTTGCGCGCTCGCCACTGGCGGCAACATGGTCCGGTCGCTGGTGACTGCCTACGCGCC
+ACCCGATGTGCGCGAATTCGTCCTAGGCAAACTCAATTCCGGCGAGTGGGACGGCGAGGCCGCGCAGCTG
+CTGACGGAGCGTGCGGGCGGCTCCGATCTGGGAGCTCTGGAGACGACGGCCACCCGCAGCGGCGACGTGT
+GGCTGCTGAACGGCTTCAAGTGGTTTGCGTCCAACTGCGCCGGGGAGGCGTTCGTGGTGTTGGCCAAGCC
+CGAGGGGGCGCCTGACTCGACTCGAGGTGTGGCCACCTTCCTCGTGCTACGGACGCGCCGTGACGGTTCC
+CGCAACGGCGTGCGTATCCGTCGGCTGAAGGACAAGCTCGGCACCCGCTCTGTCGCCTCCGGTGAAATCG
+AGTTCGTCGACGCCGAAGCCTTTCTGTTGTCCGGCGAACCGAGCGCTGACGCGGGCCCGTCCGACGGCAA
+GGGACTCACCCGCATGATGGAGCTGACCAACAGATTGCGGTTGGGCACCGCCTCGTTCGCCCTCGGCAAC
+GCGCGCCGCGCGCTGGTCGAATCGCTGTGCTACGCCGGGCAGCGGCGGGCATTCGGTGGGGCGCTCATCG
+ACAAGCCGCTGATGCGCCGCAAGCTGGCCGAAATGGTCGTTGATGTGGAAGCCGCGCTGGCGATGGTGTT
+CGACGGCTTCGGAGCGGCGAACCACCGCCAGCCCAGATGCCTGCCGCAACGTATCGCGGTGCCGGTCACC
+AAGCTTAAGACTTGCCGGCTCGGGATCACCGTGGCATCGGATGCGATCGAGATCCACGGCGGCAATGGCT
+ACATCGAGACCTGGCCGGTGGCCCGGTTGCTGCGTGACGCGCAAGTCAACACGATCTGGGAGGGCCCCGA
+CAACATCCTGTGTCTGGATGTGCGGCGCGGGATCGAGCAGACGCGCGCTCACGAGACACTGTTGGCGCGG
+CTGCGCGATGCGGTGTCGGTGTCCGACGATGACGACACCACGCGGCTGGTCTCGCGCCGCATTGAGGACC
+TCGACGCGGCGATCACCGCTTGGACCAAACTCGACAGGCAGCTGGCCGAGGCGCGGCTGTTCCCGCTGGC
+CCAATTCATGGGCGACGTCTACGCCGGCGCGTTGCTCACCGAGCAGGCCGCCTGGGAACGGGCAACCCGC
+GGCACCGACCGCAAGGCACTCGTCGCCCGCCTGTACGCGCGCCGGTATCTCGCCGACCAAGGCCCGCTGC
+GCGGTATCGACGCAGATTGCGATGAGGCGCTGCAGCGTTTCGACGAACTCGTGGCGGGCGCGTTCACTGC
+CGAGCAGACGTAAAAGCCCCCAATTCGTGGCTCTTCTGACACTTCCGTGGGTGAGTTTGTGTCCTGAGTA
+GGCGCACGTCGTTGTGGCTTAAGGTTTCTGGCTTGTCAAGGATCAGAAACACAAGGAGCCGACAACGACG
+TGCGCAATGTGAGGCTATTTCGTGCGCTGCTGGGTGTCGACAAGCGCACCGTGATTGAGGACATCGAATT
+CGAGGAGGATGACGCCGGAGACGGTGCGCGGGTGATCGCCCGGGTGCGGCCACGAAGTGCAGTGTTGCGC
+CGCTGTGGTCGCTGCGGTCGCAAGGCGTCCTGGTATGACCGCGGTGCGGGCCTGCGCCAATGGCGCAGTC
+TGGATTGGGGCACCGTCGAGGTGTTCTTGGAGGCCGAGGCGCCGCGGGTGAACTGCCCCACCCATGGGCC
+GACGGTGGTGGCGGTGCCGTGGGCGCGTCATCATGCCGGGCACACGTATGCTTTCGATGACACGGTGGCC
+TGGCTGGCGGTGGCGTGTTCGAAGACCGCGGTGTGCGAGTTGATGCGGATCGCCTGGCGCACCGTCGGGG
+CGATCGTGGCCCGGGTCTGGGCCGACACCGAAAAGCGCATTGACCGGTTCGCGAACTTGCGCCGCATCGG
+TATCGATGAGATCTCCTACAAGCGCCACCACCGGTACCTGACGGTGGTCGTCGATCACGACAGCGGCCGG
+TTGGTGTGGGCCGCCCCGAGCCACCCTGGGCTTGTTCTTCGATGCCCTGGGCGCTGAGCGGGCCGCCCAG
+ATTACTCACGTTTCGGCCGATGCCGCGGACTGGATCGCTGACGTGGTCACCGAGCGCTGCCCGGATGCGA
+TTCAATGCGCCGATCCGTTTCATGTGGTGGCCTGGGCCACCGAGGCGCTCGACGTCGAGCGGCGCCGAGC
+CTGGAACGACGCACGGGCGATCGCGCGCACCGAACCCAAGTGGGGCCGGGGCCGGCCCGGTAAGAACGCC
+GCACCACGTCCGGGCCGCGAGCGGGCACGGCGGCTCAAGGGCGCCCGCTACGCGCTGTGGAAGAACCCCG
+AGGACCTCACCGAACGCCAAAGCGCCAAACTGGCCTGGATCGCCAAGACCGATCCCCGTCTGTATCGCGC
+CTACCTGCTCAAAGAGAGCCTGCGGCATGTGTTTTCGGTCAAGGGCGAGGAAGGTAAACAGGCCCTGGAC
+CGGTGGATCTCCTGGGCCCAGCGCTGTCGCATCCCGGTATTCGTCGAGCTTGCCGCCCGCATCAAACGCC
+ACCGGGTGGCCATCGACGCCGCCCTCGACCACGGCCTATCCCAAGGCCTGATCGAATCCACCAACACCAA
+GATCCGCCTACTGACCCGGATCGCGTTCGGATTCCGCTCACCACAAGCCCTCATCGCCCTAGCCATGCTC
+ACCCTCGCCGGCCACCGCCCCACCCTGCCAGGCCGACACAACCACCCACAGATCAGTCAGTAGAGCCCGA
+AATGGGGGCTTTTACGTCTGCTCGCGCTACCCAGCTAGACCGGGATCAGGCCGTGCTTGCGGCCCACCCG
+CCACCACAGCTGCTTGTCCCGCAGCAGGTGCATCGACTTGCGCAACAGCAGCCGGGTCTCATGCGGGTCG
+ATGACGGCATCGATGAACCCGCGCTCGGCGGCGATCCACGGGATCGCCATGTTGAGGTTGTAATTCTCGA
+CGAAGCTCTTCCGGATCGCTTGCGCCTCCGGCGCATTCGGGTCCGGGAAACGCTTCATCAGCAACTGCGC
+GGCCCCGTCGGCGCCGATCACCGCGATGCGCGCGGTGGGCCAGGCGAAGTTCAGGTCGGCGGTCAGCTGC
+TTGGACCCCATCACCGCGTAGGCACCGCCGTAGGACTTGCGGATGGTGATCGTCACCTTCGGCACATCAG
+CCTCGACCACCGCGTACAAGAACCTCCCACCGCGCTTGATGATCCCGTTCTTTTCCTGTTCCACCCCGGG
+CAAAAACCCCGGTGTGTCCACGACGAACACCAGCGGGATGTCGAACGCGTCGCTAAACCGGATGAACCGT
+GCGGCCTTGTCGGACGCCTCGTTGTCGATCGCCCCCGACATGTGCATGGGCTGGTTGGCCACCACACCAA
+CGGTCCGCCCGTCCACCCGCGCGTAGCCGGTGATGATCGCCTGCCCGGCCTGGGCAGCGACGTCGAGGAA
+GTCGCCGTCGTCGAAGATCCGCAGCAGGACCTCGTGCATGTCGTAGGCCATGTTGTCCGAGTCCGGCACG
+ATCGAGTCGAGTTCCAGATCGTGGCCGGTGATTTCGGGTTCCAGCCCGGGGTTGACGACCGGCGGTTTGT
+CGAAGCAGTTGGACGGCAGAAACGACAGAAAGTCCCGCACGTACTGGTATGCGGCGGCCTCGGACTCCAC
+CACCTGATGGATGTTGCCGTAGCTCGCCTGGTGGTCGGCGCCCCCCAGCTCGTCGAGGCTGACGTCCTCA
+CCGGTGACGTCCTTGATGACGTCGGGGCCGGTGACGAACATGTAACCCTGGTCGCGCACCGCCACCACCA
+GATCGGTCTGGATCGGCGAATACACCGCTCCCCCAGCGCATTTGCCCAAAATGATGGAGATCTGCGGCAC
+CAGCCCACTGAGCAGTTCGTGGCGGCGCCCCAGCTCGGCGTACCAGGCCAGCGAGGTGACGGCGTCTTGG
+ATGCGGGCGCCGCCGGAGTCGTTGATGCCGACGATCGGGCAGCCGACCATCGCGCACCACTCCATCAGCC
+GGGCCACCTTGCGGCCAAACATCTCCCCGACGGTGCCGCCGAACACGGTTTGGTCGTGCGAGAACACGCC
+GACCGGCCGGCCGTTGATGAGGCCATGTCCGGTGACCACGCCGTCCCCGTAGAGCGCGTTGGGGTCACCG
+GGGGTGCGGCACAGCGCTCCGATCTCCATGAAGCTACCCGGATCGACCAGCTCGTAGATGCGGGCGCGGG
+CACTCGGGATGCCCTTCTTGTCGCGCTTGGCGGCGGCCTTCTCACCGCCGGGTTCCTTGGCCAACTCCAG
+GCGTTCGCGCAGCTCCGCCAGCTTCTCGGCGGTGGTGTGCAGAACCGGCTCGGTGACGGTCACTGCTTGC
+CTACCTCACTTGTTCGATCGGCCTCGATCTGCCCCAACGCGCGGCTCATGTGTTCGCCCACCTTGGCGAT
+GATCGGCTCGTCGATGGCCTGAATGTGCTCGCCACCGATCGGCACCACCTCGAGGTCGGAAACGTACTCG
+CCCCACCCGCCGTCCGGCTGGCGCACGGCGTAGCGGGGCTCGAACATGATCGCGTCGTCATGGTAGCGAT
+CGGCCATGTAGAGGGTGACATGCCCGTCGTACGGCTGGATCTGGGCGGTGTCGATCGCCCGGTTGTCCAG
+ATACGACGTGCGTTGGTGTTCGATGATCCCGGCCGGGATCTGCACACCGGACTGGCTGACGGCGTCCAGC
+ACGAACCGGACCTGGCCCTCGTCGTCGAGCTCCTCGAGCTGCTCGTACGGGATCGCCGGGATGGTCACGT
+TGAACGTCTTCTCGGCGAAGGCGGCGTAGCGGTCCCAGCGCTTGCGGATCTCCTCCTTGGTCTGCGGGAT
+CTCCTCACCGGCGCGCACCGCGTCGATCAGCCCGACGAACCGCACGTCCTTGCCCAGCCGCCGCAAACCG
+ATCGCGCACGCGTAGGCCAGCACACCGCCCAGCGACCAACCCACCAGGACATAGGGCCCGTCGCCCTGCA
+TCTCGATCAGCTTCGGCACGTACTGCTGTGCACGCTCTTCGATCGACCCCTCGACCCGTTCGAAGCCATA
+CATTGGGGTGTCCGCCGGCAGCCGGCCCAGCAGCGGCTCGTACACCACCGTCGAGCCGCCGGCCGGATGA
+AACACGAACACCGGCACCTTCCCGCCTGCTTCGGGCCGCGCCCGCAGGGTGCGGACGAACCCATCGATCT
+GCCCGGCCTCCAAATACGTGCGCACCTTGTCGGCCAGCGCCTCGATGTTCGACGACGTCAGCACGTCCTC
+GGCGGTGATCGGGCCTTCGGCGCGCTCGGAAAGCCGCTGCGCAATCTTGGCCGCGGCCTCGTCGTCCAGC
+CTGGGCAGCTCGTTGAAGATGCCGCCCGGGGACTTGCCGGTGACGATCGCCCAGGTGGCGAAGGTGACCC
+GCTCGGCAGCGTCCCGCGGCGGCACGTCGACGTTGAGCGCGGGCCCTGTCGGGTTTGGCTGCTCGCCGTT
+TTGCGGCGACGGGAGCGCAACCCCGGCTTCCGAGTCGACCGGCTCGGTCTTGCCCACCTTGCCATGCAGC
+AATTCGGCCTGGGCCCGCGCGATCTCCTCAGCGGTCTGGGTTTTCTGGTGCTCGTGCAGCTGCTGCACCT
+CGTCGCGGTGCTCGACCGCGTATTCGATCAGCTTCTCCACGTTGTAGAGGTTGGCGTCGCGCACCGCGGT
+CAGCTGGATCGGTGGCAGGTCGAAGTCGTACTCGACGCGGTTTTTGATGCGCACCGCCATCAGCGAGTCC
+AGGCCAAGCTCGATCAGCGGCACCTCCCACGGCAGGTCCTCGGGCTCATAGCCCATCGCAGACCCGACAA
+TCAGGCCCAGCCGCTCGGCGATGGTCTCACCGGAATCAGGCGACCATCGGGTCATGCCGGACGGCATGTA
+ACGGGTGGTCAGGCTGTCCGAAAGCGTCTCGGCGTCCGCGTCTTCGGCGGGCGTTTCCGGCGCGACAGGC
+GCCCCGTCCGCAACCGCGATCGCCGTCGCCGCACCCACCGCGGTGGGCAACACCGATTCGGACCCCGCTC
+GGGACACCAGGGCGTCGTAGACCAGCGTGAAGGACTCGTCGATGCGGGCGTGCACCTGCACCGAGGCGCC
+GCCGGGGTGACGGGTCATCGTCGTCACCAGCCGGGCGCCGTCGCCGGGCACCGCGCGCTGCTCGGCGGCG
+GTCAGTTGCGCGTCCGGAAGCACGTGGGCGGCGGCGGCCCTGACCAACGCGGCCAAGTCCACATTGCCGT
+CCCGCGGCGCGTACTCCCAGACGTGCCGCCCATCCGGCAGGGCGACATGGGTGCCCGGCATGTACGTCGA
+GCCGTCGCCGGAGAAGTGCGCGGGCAGCCAGTGCTCCTTGCGCTTGAACCGGGTCGGCGGAATGTTCGCG
+TAATCCTGCGGCCCACTGGCGCGGCTAAACAGCGTGCGTATGTCCAGGTCGTGGCCGTACACATACAGCT
+GCGCCATGGTCGAGACCATCGAGGAGACCTCGTCTTGCTTGCGGGCCAGCGTCGGGATCAACTGGGCGTC
+ATGCAGCCCGGCATCGGCGGTGGTCAGGGCGACCTGCATCAGCGCCACCGGATTGGGTGCCAGCTCCAGG
+AAGGTGGTGTGCCCGCTGTCGACGGCGTTGCGGATGCCGTGGGTGAAGTAGACGGAATGCCGCAGCCCCT
+TCTTCCAGTATTCGACGTCGTGGATGGGTTCGCCGCCGGGTTTGATGTAGCGGCCCTCGTGCACCGTCGA
+GAAGATCCCACACGTCGGGCTCGTCGGCTTGATGCCTTGCAGCTCCGCGGTGAGCTCGCCCAGCAGCGGG
+TCCATCTGCGAGGTGTGGCTGGCGCCCTTGGTCGCGAATTTGCGGGCGAACTTGCCCTCGGCCTCGGCGC
+GGGCAAGGATCGCGTCCACCTGCTCGGGGGGGCCGCCGATGACCGTCTGGGTGGGCGCGGCGTAGACACA
+CACCTCCAGATCGGGGAAGTCGGAGAACACTTCTCTGATTTCGTCGGCGGAGTATTCCACCAGCGCCATC
+AACCGGATGTACTCGCCGAACAGCATCGCCTCACCCTCGCCCATCAGGTGCGAGCGCGAGCAGATCGCCC
+GGGTGGCATCCCGCAGCGACAGCCCGCCGGCGAAGTAGGCCGACGCGGCCTCACCCAGCGACTGGCCGAT
+GACCGCGGCCGGTTTGGCGCCGTGATGGCGCAGCAGCTCACCCAGCGCGATCTGGATCGCGAAGATGGTG
+ACCTGGGTGGTCTCGATGCCGTAGTCCTGCGCGTCGTCCAGGATCAGCTCCAGCACCGAGTAGCCCAGCT
+CGTCTTGGACCAGGGCGTCGACCTTCTCGATCCACGCCGCGAACACCTCGTTGCGCAGGTACAGGCTCTT
+GCCCATCTTGCGATGCTGGGCGCCGAATCCGGCGAGCACCCAGACCGGGCCGGTGGTCACCGGCCCGTCG
+ACGCTGAACACGTTCGGCGCCTGCTTGCCCGCGGCGACCGCGCGCAGGCCCTTGATGGCCTCGTCGTGGT
+CGTGGGCCAACACCACCGCGCGGGAACGGCCGTGGTTGCGCCGCGACAACGACCTGCCGATCGATTCCAG
+CGAGGAGGCCTGGCCTTCCGGGCTTTGCATCCAGTCCGCCAACTCGGCGGCCGCCGCCTTCTTGCGGGAC
+GTCAGAAACGCCGACACCGCCAACGGGACCAATGGTGCCGTAACCTCTTGGGCCGCAAGCTCTTCCAACG
+CGGCTTCCTTGAGCCGCAGCGCCTCCTCGGTGACTCCGGGCAGTTCGGGCTCCGGCTCTTCGGCGACCGC
+CGAGTCGGTGATGATGTTGCCGAACTCGTCGAACCGCAGCGCGTGGCCTGCCAACGTGGGCGCCTCGGCG
+GGTTCGGCGGCCGCCTTGGGTTCCGGCTCGGGTTCCGGTTCCTTTTCCACCACGTCACGCGGCAGGACCT
+CGCGCACCACCACGTGCGCGTTGGCGCCGCCGAAGCCGAAGCTGGACACCCCGCCCAGCGCGTAGCCGCC
+GTATCGCGGCCAGTCGGTGGGCGTGGTGATCATCTTCAACCGCATCGCGTCGAAGTCGATGTAGGGGCTG
+GGGCCGGCGAAGTTGATCGACGGCGGCAGTTTGTCGTGCTGCAGCGCCAGCACCACCTTGGCCATGCTGG
+CCGCGCCGGCCGCCGATTCCAGGTGCCCGACGTTGGTTTTCACCGCACCCAGCAGCGCCGGCCGATCGGC
+CGGACGGCCCCTACCGACCACCCGGCCCAGCGCCTCGGCCTCGATTGGGTCGCCGAGGATGGTGCCGGTG
+CCGTGCGCCTCGATGTAGTCGACGGTGCGCGGATCGATGCCGGCGTCCTTGTAGGCCCGGCGCAGCACGT
+CGGCCTGCGCGTCCTGGTTGGGTGCGATCAGGCCGTTGGACCGGCCGTCGTGGTTGACCGCGCTGCCGGC
+GATCACGGCCAGGATCGCGTCGCCGTCGCGGCGGGCGTCGTCGACCCGCTTGAGCACCAGCATGCCGCCG
+CCTTCGGAGCGGGTGTAGCCGTCGGCGTCGGCTGAGAACGACTTGATCCGGCCGTCGGGCGCCAGCACCG
+CACCGATCTCGTCGAAACCCAGGGTGACCATCGGTGTGATCAACGCGTTCACCCCGCCGGCGACCACTAC
+GTCGGCCTCGCCGTTGCGCAGCGCCTGCACCCCCTGGTGGATGGCCACCAGCGAACTCGAGCACGCGGTG
+TCAATGGTGACCGACGGTCCGTGGAAGTCGTAGAAGTAGGACACCCGGTTGGCGATGATCGAGCTGCTGG
+TGCCGGTGATCGCATACGGGTGCGCGACCGTCGGGTCCGACACCGCCAGGAAGCTGTAGTCGTTGGTGGA
+GCTGCCGATGTACACACCGACGGCCTGGCCGCGCAGGCTCGACGCCGGGATGCGGGCGTGCTCGAGCGCC
+TCCCAGGTCAGCTCCAGCGCCATCCGCTGCTGCGGGTCGATGTTGTCGGCTTCGGTCTTGGCCACCGCGA
+AGAACTCCGAATCGAAGCCCTTGATGTCCTTCAGGTAGCCGCCCCGGGTGCGGGCCCCGGCGACCCGCGC
+GGCCAGCCGCGGCTCTTCGAGGAATTCCGACCAGCGCCCGTCGGGCAGGTCGGTGATCCCGTCGCGGCCT
+TCCAGCAGCGCCTGCCAGGTCTGCTCGGGGGTGTTCATCTCGCCCGGGAAGCGGGTGGACAAGCCCACGA
+TCGCGATGTCGACGCGCTCGGCCGGGCCGGTGCGCGACCAGTCTTCGGCGTCATCGCCCGCTAGGTCGGT
+CTCCGGCTCGCCCTCGATGATCCGGGTGGCCAGCGATTCGATGGTCGGATGCGCGAACGCCACCGCGACC
+GACAGCGTGACCCCGGTCAGGTCTTCTATGTCGGCGGCCATCGCGACGGCATCGCGCGACGACAGACCCA
+GCTCCACCATGGGCACCGATTCGTCGATCGAGTCCGGTGCCTTTCCGACGGCCTTACCCACCCAGTTGCG
+CAGCCACTGGCGCATCTCGGGGACCGTTAGCTCGGCCCTTTCGGCGGGGGCGTTCTCCTGGGATTCCGCT
+ACGTCAGCCATGGGTCCTCAGTCCGAAGTGGCGAAGACCGTCGGGGAACCCACGCCACTGCGCAGGCTGC
+CGTCGAGGTAGGCCGCACGGCAGGCGCGGCGGCCGATCTTGCCGCTGGAGGTTCGCGGAATCGTGCCGGC
+CGACACCAGCAGGACGTCACGCACGGTCACCCCATGCCCGACGGCGATGGCCGCCCGGATGTCATCGACG
+ATGGGCTGGTGGTCGAGCTTATGCGTGCCGGCCGCCCGTTCGCCGACGATCACCAGCTGCTCGGAGGTGT
+CCTCGGGGTCGAATTTCAGCCCGGCGTGCGAGTCGTCGAACACTGTCTGAGGAAGCTGGTTGGCCGGAAC
+CGAGAAGGCCGCCACGTAGCCAACCCGCAACGCCTTGGTCGACTCCTGCGCCGTGCACTCGAGATCCTGT
+GGGTAGTGATTGCGGCCGTCGATGATGACGAGGTCCTTGATCCGGCCGGCTATGTAGAGGTGGTCCTTGA
+AGTAGGTGCCGTAGTCGCCGGTACGCACCCACAGCGCGTCGTCTGGGGCGCCCTCGGCGCGCGACTCGCT
+GATCCGCGATTTGAGGATGTTCTTGAAGGTCTGGGCGGACTCTTCTTCTTTGCCCCAATAACCGGTACCC
+AAGTTGTTGCCGTGCAGCCAGATCTCACCGATCTGTCCGTCCGGCAGTTCGCTGGCCGTGTCGGCGTCGA
+CGATGACCGCCCATTCGCTGACCCCGACCTTGCCCGCAGAGACCTGGGCGACGGCGTTGGGTGCATCGGC
+GGCCACCTCAACGAACCGCTGGTTGTTCAGCTCGTCGCGGTCCACGTGGATCACGGTGGGCACCTCGTCC
+ATCGGCGTGGTCGAGACGAACAGCGTGGCCTCCGCTAGCCCATAGGACGGCTTGACGGCGGTCTGCTTCA
+AACCGTACGGCGCAAATGCTTCGAAGAACTTGCGCATCGACGCCGGCGACACCGGCTCGCTGCCGTTGAG
+GATGCCCTTGACGTTGCTCAGGTCCAGCGGCGGCTCGTCGTCTCGAGGCACACCGCGCACCGCGGCGTGT
+TCGAATGCGAAGTTCGGCGCCGCAGAGAAGGTGCCACCGGTTTCTCCGGGCTTGCGGGCGAGCTCGCGGA
+TCCAGCGACCGGGCCGCCGCACGAACGCCGCGGGCGTCATAAAGGTGAAGCTGTGGCCTAGCACCGACGC
+CAGCAGCACCGTGATCAGACCCATGTCGTGGAAGAACGGGAGCCAGCTGACCCCGCGGTCGCCTTCCTGT
+CCTTCCAGGGCATTGAGCACCTGCACCACATTGGTGGGCAGGTTCAGATGGGTGATCTGCACGCCGCTCG
+GTATGCGGGTGGAACCCGACGTGTACTGCAAGTACGCGACGGTTTCCTCGTTGGCCTCGGGCTGCTGCCA
+GGTGGCGGCGACTTCGGTGGGCACCGCGTCGACGGCAATGACGCGCGGGCGCTCCTTGGCCGATCGGGCC
+CGGATGAACTTGCGGACCCCTTCGGCGGAGTCGGTGGTGGTCAGGATCGTCGACGGGGCACAGTCGTCGA
+GCACCGCGTGTAACCGACCGACGTGCCCCGGCTCGGCCGGGTCGAACAACGGCACCGCAATGCGGCCGGA
+GTAGAGGGCGCCGAAGAAGGAGATGAGGTAGTCCAGGTTCTGCGGGCACAGGATGGCGACGCGGTCACCC
+GGCTGGGTGACTTGCTGCAGGCGGGCTCCCACCGCACGGTTGCGCGCGCTGAAGTCAGACCACAAGATGT
+CGCGCGCGACACCGTCTCGTTCGGTGGAAAAGTCCAGGAACCGGTAGGCCAGCTTGTCGCCACGAACCTT
+CGCCCACTTTTCGACGTGACGAACCAGGTTGGTGTTGGCTGGGAACCTGATCTTTCCATTCACGATGAAC
+GGGTTGTGGTACGCCATCCCACTCTCTCCTGTCACAAACATCTCGGCCGGCTCTGCCGGCGGCCACCGGG
+TGTCGGCTCCGCCAACGGGTTACCCGCGCACATCAACCCCTACCGCGCTCACGTCGGCGAACGCAGTTTG
+CAGCCAGCTTTGACCCGACTGGGTCCTGCACATGCTCTTAGTTTTCTCTTAATGTTAAGGGCCGGTGCCT
+GACAGACCAAATCACAAGGTACCGCTGTTCGAGGCCGCCATCAGCGTACGCGGGGCGGTGTCGAGTCGCC
+CGGTTCATCGGTGGACCGCCGCCTAGCGTCCATCGTCCTCGGGGAAATATCACCTATGTTTGGGGTGGGG
+CGCATTTTCGATAAGTTGATGCGCCCAGTTCAACGTCCACTCGGTCGCCGGTTCTCCATCGGAATTCCAG
+AATTCGGGTGTCGCATACATAGCATGGACCGGCTGGCCGGCGCCGCCGGCCAGGGTGTTCAGCGTAGTCG
+GCAAGTTGGCGGGACTGAACGCCTGTGCCGGGGCCGCACAGATCAGGTCGCCCTGGGCGCAGATCTCGTT
+GGTCCGGCCGTCGAGCGCACCAAAACCGCCCGGCCGCGGGCCGGTCATAGTCAAACCAAGCCCGGACAAC
+ACTGGGACTTCGTGCAGGGTGATCTCGGCGCCTTCGCCGCGCGGGCTAGGCGGGACCTGATTACCCACCC
+CCTGCTGACGACGACCGTCGGCGATCAGCGTCACGCCTAGTACTAGGTCCTCGTCCACGGGTCCCCGGCC
+GTTGCCGATATCGCTAGCCACGTCGCCCGCGATCACCGCGCCCTGCGAAAACCCGATCAGCACATAGCTG
+GTCAACGGGCACCTGTTGTTCATATCGGTCATCGCTGCCACCATCGCGCGGGTGCCCTCTGCCCGGCTGT
+CGTTGTACGACATCTGATTATCCGTGGTCAGCGGATTGTGGAATTGGGCCGTGTAGGCAACTGTGTAGGT
+CTGCACCCGGGCGGGTGCGAATTGCTGGGCGATCGGCCCAGTTACCTTGAGCAGCAACGCCTTCGGAAAC
+TGCACCGGATTCAGTGGGTTCTGCTGCGGCGATGACTCCCAGGTTCCGGGAACCGAGATCATCTGCACGT
+CGGGGCAGGACGCATCCTGGAAGGCCGGTCGGGGTTTGTGCGGATGTGCTGGGGTGGGCCCCGGTGGTAA
+AACTCCTGGCGGCACCGCGCTGGGCGGCGATTCGGCGCCGCGCAGCATGATCACCACGGCCACGATGACC
+AGCGCTACGACGGACGCCATCGCGCCCGCCGCTATCCAGGCAAGGATTCGGTGGCGCTTACGCCGAGAGT
+TCTTGGCCATGTTCTCCTGCTAACAGAGTCGGTAGCGCACGCGAAAGGGGTGCACCCGCGCCGCGCGATA
+GCGCGGCCATCCCGCCCGTTGCCGCACTCCCTCTACGGTACCGGCCCGCTACGCGGCTTCGCCCGAGTCG
+CGATGTCGTGCACGTCTGCCGCAAGGATCATCCGATAGCGGCCAGGCAGCTCGCATCGGCACCTGGCTTA
+GCGGATCGCACCGACGATATCGCCCGACATAGCGCCCAGCTGGGGCGCCCACGAGCCCCAGCCGTTGTCA
+CCGCTGGCTGGGAAGTCGAAGTGTCCGTTGTGCCCGCCGACGCTGCGATACTGGTTGTAGAACATGCGGC
+TGTTACCCATCGCCTCGGCGGCTTGGCCGATCATGGCGGCGGGATCGCTGGCTCCCGGGTTGGTCGGGCT
+CCACACCCACACCCGGGTGTTGTTTTGCGCCAGCAGGCTGGCATGCACCCACGGGTCGTGCCACTTCCAC
+CGACCCAGCTGTGGTGCTCCCCACATTCCGTTGGTGTCCACACCGCCGAATTGCTGCATGCCCGCCGCGA
+TCGCACCGTTGGTGGTGGTGTTCGACGGGTACAAAAAGCCCGACATCGAGCCAGCGAAGCCGAAGCGGTC
+GGGGTGGAAGGCCGCCAGCGCCATCGCCCCGTAACCGCCCTGAGCGGCGCCAACGGCCGCATGGCCACCG
+GGGGCCAAGCCCCGGTTAGCGGCCAGCCAGTCGGGCAGCTCAGCGGACAAGAAGGTGTCCCACTGCTTGC
+TGCCATCCTGCTCCCAGTTGGTGTACATGCTGTACGCACCACCGGCCGGTGCCACCACCGAAATCCCCTT
+GCCCGCCAACGTGTTCATCGCGTTACCCGCGGTGACCCAGTTACTGACATCCGGGCCGGCGTTGAAGGCG
+TCCAGCAGATACACCGCGTGCGGCCCACCGGCTAGGAAGGCCACCGGGATGTCCCGGCCCATCGAGGGCG
+ACGGCACCATCAGGTTCTCGTATGGGGCGGCCTTGGCGGTGGGTTCCGCGGCTACCGCGACACCGCCCAA
+CCCGAATGACAGTGCGGCAATCCAGAGCGCCCGCAGCAGCGCCGACCGACCCTTCATGTGTCCACCTCCG
+TCGTGTAAGGCTGTGTGCACCCGGCGTCAGACCGCCCCGGCCAACCCCTAGCCCGTCAGGTAGCTAACCA
+CACGGCCCGCGGCGGGAGCTAGGGACGGGATTTAGGAAACATCTAGCGGCGGCGACCACAAGGGTCACCG
+CCGCTAGATGTTGTGTCTGTTCGGAGCTAGGCGCCCTGGGGCGCGGGCCCGGTGTTGGGCGTGGCACCCA
+GTGCCCGTTGCAGGTCGGGCTTCATAGCGTTGAGCTGCGCCCCCCAGTACTCCCAGCTGTGCGTACCGCT
+GTCCGGGAAGTCGAACACGCCGTTGTGGCCGCCACCGGCGTTGTAGGCGTCTTGGAACTTGATGTTGCTG
+GTCCGCACGAAGCCCTCGAGGAACTTGGCCGGCAGGTTGTTGCCACCCAGATCCGACGGCTTGCCGTTGC
+CGCAGTACACCCAGACGCGGGTGTTGTTGGCGATCAGCTTCCCGACGTTCAACAGCGGGTCGTTGCGCTG
+CCACGCCGGGTCCTCCTTCGGGCCCCACATGTCGGAGGCCTTGTAGCCGCCAGCGTCACCCATCGCCAGG
+CCGATCAGGGTGGGACCCATCGCCTGGGAGGGGTCCAACAGGCCCGACATCGCTCCCGCGTAGACGAACT
+GCTGGGGGTGATAGATCGCCAGCGTCAGCGCCGAAGAAGCAGCCATCGAAAGACCGACGACGGCGCTTCC
+GGTGGGCTTGACGTGCCTGTTGGCCTGCAGCCACCCCGGCAGCTCGCTGGTCAGGAAGGTCTCCCACTTG
+TAAGTCTGGCAACCGGCCTTGCCGCAGGCGGGCTGGTACCAGTCGGAGTAGAAGCTTGACTGGCCACCCA
+CCGGCATGACCACCGACAGGCCCGACTGGTCGTACCACTCGAACGCCGGGGTGTTGATGTCCCAGCCGCT
+GAAGTCGTCCTGCGCGCGCAGGCCGTCGAGCAGGTACAGGGCGGGCGAGTTGGCACCACCACTTTGGAAT
+TGGACCTTGATGTCACGGCCCATCGACGGCGACGGCACCTGCAGGTACTCCACCGGCAAGCCCGGCCGGG
+AAAATGCCCCCGCGGTCGCCGTGCCACCGACGGCGCCGACCAGACCCGACACTAGGGCCGCGCCGACGGC
+CCCGACCACGAGTCGACGCGACATACCCGTGACGGCGCCACGAACCCTGTCAACAAGCTGCATTCTTGCT
+TCCCTCATCCTCATCTCAACGCATCCATGCATGTTTGGGCGCATCCTGAATTAGGTCAGACTGCAGGCGC
+TGGGCCCGGCAGTGCTCGTGTAGTCAACCACAACTTCGGGCGTCCACCCGCATCAAGCGCACCGCCGAAA
+CCCTTATCCGGCGGTCGTTCACGGCCAATTCGGGACCGACGCGACGGCCTGAAGGTGGCATTTCCGCAGT
+GTCTGGGCATGTGTCGACCGCTAGTGCCGGCTCAATTGTGATCTTGCTGTCAGTATTGCCCCCGCGCTCA
+TTGCCCCTCACTCCCGCGGTGGCGGGCCGGGCCCGTCGGGAACATCGAGCCCACACCGGACCAATTCATA
+GCGCGGAACGCGGTCGATGCGGTAACGGGTGAACTCGTAGGAATGCAACACGTTGGAGAGGAATCGGTGC
+AGGGTGATCGGGGCGCGCACAGAATTAAGCACCGCCCGAGTCGCGGGGCATTGCAGGGCCGCTTCGGCTT
+GCGTGACCCACTGCTGGTCGATGTAGCCGGGAATACCCGGGTACCACTTCACCCAGGGTCCGTCGGCGAT
+CACCCAGTCCGGGAACAGATTCTTGTCATGGCCGATACGGGCATGCTTCAGCCGCTCGGTGTGCGCGGCC
+AATGGGTTTACCAGCCCGATTTGGTCGATCACCCGGACATCGAGCCCGACGTTCATGCCTAGCATGCCCA
+TGTTGGTGAAAAACACTGCGTGCTGCGGTTTCGGCGCCGGCTTGCCACCCGGCGCGGTCCCCGACGAGGG
+CCGGATCATCGGCACCAGGTCCCACTGGTTGTAGTTGCCCGACGGCAATAGCAACGCCCCTTCCGGGGTG
+TTGTTGAGCGCTGTAAGCACGGCAGCCATTCGCGGGTAATCGAGGTAGTCCGCGGCGGTCAGCGGATGCG
+CGTGCCCGGTGGCCTGGGCGTAGAAGCGGCGCTCGTCGACGATGCCCGAATAGGTGACCCGGGTGGCGTC
+GTCACCCATGCCCGGCGAGTTTGCCGCCCACAGCGACCAACCCGCGATCCCCAGCCAGAGCCCGCTGAGC
+GCGCCGACTAGCCAGCGACCGGTCTCCCGCGAAAAGTCCTTACCGTCGGGCAGCAAAATAGGAATGACCC
+CCACCGGGGCCAGCAAACAAAACAGCGGCGCCAGCAACACCCGGCCGTGCATAAAGTCGCCGCCTTGCCG
+AACCCAGTACAGCGCCTGCAGCACGCCGCTGCCGACGATGAAAGCCACCACGGCCGGCGGACTTTGCACC
+GCCCGGGCCACCCGACCGTAGTCGGGTGCCAGCACGGGACGCAGGAACGACGGCCGGCGGCGCGCCGTCA
+TCAACAGCAATCCCAGCGGCACCGACAGCACCAACGGCACCCACAGTGCGTACGGCCGGTTGAAGTTCGA
+CACGTAGATCATGCCTTGCGACCACTTGTCGCCCGCGGCATCCTTGGCCAGCGCGGTACTCGGAACCAGC
+AGTCCGTAATAGCCCATCCGGAAGATCTGGTAGGCCACCGGCAAGAATCCGCCGGCCAGCACGATCAGCA
+CGCGGCGACGCCAGGTCCGCGCGGCGATCAACATCATGATCAGCGCCAGCCCGCCGATCAGCGCGAATTC
+CGGCCGCACTAGCACGCTGCATCCGGCGACGAAGGCCAACGCGCCGAGGAACATCTGGCTGTCCGGGCGG
+GCCCGCAGCGGCTGTGACCAGCAGACCATCATCCACCACAACAGCCCCAGATAGGCCAACACCAGCCCGC
+TCTCCAGGCCGGAGGTGGCGAAGTCGCGGGCCGGTGGCACCGCGATATATACCAGCGCCCCGGCCGGAAG
+CATGATCGCCCGACGGCCCCGCAGGCTGGGTGCGTACAACCGGCCGGTCCCCAGCATGAGCAGCACCATT
+CCCAGCAGCGAAAGCACCATGGCCAGGGCCAACGCCACGTACTCCAGGCGCATCGGCCCGCCCACCCAGC
+CGCCCACATACAGCAGATACGTCCACGCTGTCGAGGTGTTCGCTTCGACTCGCTCGCCCTGGTTGAAGAC
+CGGTCCGTTGCCGGCCAATAGGTTGCGTACCGTCCGCAGGACGATCAGTCCGTCGTCAGCGATCCAGCGA
+CGTTGCCAGCTCCCCCAGCCGAACAGCACGGCGACCGCCGTCACCGACAGCCACAAGCTGACCCGGACCA
+TGGGCTCATACGGAAACACCGGCCGACCGACCCGCCCGACCACCGGCCGGCGGGGCAGCACCCCGACTGG
+GAGGACGTTGAGCTTGAGGCTAGCCGAAGGCAACAGCGGCCCCAACCGTTGCTATCCACGCCAGCGCCAG
+CAGCTGCAATACCCGGTCACGCAGCGCGATATCTTCCGGCTCCCCGGCCAGGCCGCCATCGACGTCCACC
+GCGTAGCGCAGGATCGCGATGGTGAACGGAATCATCGACACCGCGAACCAGGACCCGCTGTAGCCGTCGC
+GCTCGAAAGCCCACAGCCCGTAGCACAAGACCACCGCGGTGGCCGACAACGTCCAGACGAACCGCAGATA
+GGTGCTGGTGTAGCTTTCCAGCGACTTGCGGATCGCAGCGCCGGTGCGTTCGGCCAGATGCAGCTCGGCG
+TAGCGCTTGCCGGCCACCATGAACAGCGAACCGAATGCCATGATCAGCAAAAACCACTTGGACAGCGGGA
+TTTTGGTGGCCACGCCCCCGGCGATAGCGCGGATCAAATACGCCGACGACACGACGCAGATGTCCACCAC
+CGCTTGATGCTTGAGACCAAAGCAATACGCCAACTGCATGGCGAGGTAGACGACCATTACCAGCGCCAGG
+TTCGGGGTCAGCATCCAGGCACCGGCCAGCGATGTCACTCCCAGTACCACCGCCACGGTGTACGCCAGCC
+ACTCGGGCACCACGCCGGCGGCGATCGGCCGGAACCTTTTGGTGGGGTGCTCCCGGTCTGCCTCGACGTC
+GCGCACATCGTTGACGAGGTACACCGCCGAGGCGGCCAGGCTGAACACCACGAAGGCCATCGACACCTTG
+CTGAGCACCTCGACGTAGTCGTAGCGGACACCGCCGCCCAACGCGGCCAGCGGCGCGGCCAGCACCAGCA
+CGTTTTTCACCCACTGGCGCGGGCGGATCGCCTTGACCACCCCGGCGACCAGGTTTGCCGGAGGTTGAGT
+CACCACATCTTCACTCATCCGAGCTCATCTCTTCCGGGCCCTTTGCCGGCCCCCGCCGACGCTGTCCACG
+ATGGCCCCGACGGTGGCGCCCAGAGCAACACCCACGGCCACATCACTGGGGTAGTGGACCCCCAGCAGTA
+TTCGCGACAGCGCCATCGGCGGCACCAGCACAACCGGTAGCGGCAGCCCGGTGGCTCTGCCCATGAGCAG
+GGCCGCGGCCGTGGTCGAGGTGGCGTGTGCCGACGGAAAGCTCAGTTGACTTGGCGTGTCCACGTTGACC
+GCGATGGCCGGATGATCCGGCCGCTGACGCCGCACCAGCCGCTTGATCAGCACGGCGATGGCATGGGCGA
+CGAACGCGCCCGCCCCCGCCACAAGCCATTCCCGGCGGCGCCGTGGCAGGGCTATCGCGCCCAGCAGCGC
+CAGGATCAGCCAACCGATGCAGTGCTCGCCGAAGTGGGAGAGTCCGCGCGCAGTGGCCAGCATCCCCGGA
+CGGTCGACCAGCGCCGACTGCACGGCCACCATCACGGCGACTTCGCCGCGTGGCGCCCGTTCAGCCATGC
+TCGGGCTCTTGGTTTGCCGCCGGCAGCAGCGCCGTCTCCCACTTCTGCTTGCTGGACAGCGTCGGCAACG
+CGTCGCGATAAATCCGGCGCATCTCCTCGAACCGTTTCAGCAACTGGCGCTGACGGCGCAACGACTGCCA
+CAGCAACGCGAACATCTTGGCCCGGTCGCGCTGCCGGTAGACCACGCCGCATCCGTCGGCCGTGGTGACG
+GTGGCCCCGTCGACAGTGCACAGCAGGAACCAGCGCGCATCCTGGGTCGGAACGTTGAACTCCGGGCGAC
+GGTGGTGTTGGGGGTTGGCGGCGGTCAGGTTGTGCATGATCCCGCGGGCCAGCCGGTAGCCGATGACCAA
+CGGGTTCACCGGCGGCTTCATTGCCTTGTTCTTGTGCAACGGCGGCGGCAACTCACTGGCCGCCGGCAGC
+ACCACCGCGTCCGGATAGCTCTTGCGGATGCGGTGCACTTGCGGCAGCGCCGATTCCAGGATCGAAAAGA
+TGTGCTCGGGGCCGGCGAGAAAGTCGTCGATGGCCTTGTTCTGGATTGCCACCGTCGAATATTCCAGGCA
+GGCAAGGTGTTTCAGGGTTGCCTTGAGATGGCTGCGGACCAGGCCGATGACTTGCGCCTTTGGGCCGTCC
+CAGTGCATGGCGGCCACCACCAGCCGGTTGCGCAGATGGAAATAGGCCTGCCAGTCGATGGCGTCATCCT
+TATCGCTCCAGGCCATGTGCCAGATCGCCGCACCGGGCAGCGTGACGGTCGGATACCCGTGCTCGGCGGC
+CCGCAGGCCGTAATCGGCGTCGTCCCATTTGATGAACAACGGCAGCGGCTGTCCTAGCTCTTCGGCGACC
+TGGCGTGGGATCATGCACGTCCACCAGCCGTTGTAGTCGACATCGATACGCCGGTGCAGCAACTTGCTAC
+GGGAGTTGTTGTCGTTCAACGGGTATTCGGCGAAGTCGTGGTCATACTCGGCATGCGGCGCGGCGGTCCA
+CATGAATATCGACCGGTCTACGACTTCGCCCATGATGTGCAGGTGCGACGGCTCCTGCAGGTTGAGCATC
+TGACCACCCACCAGCATCGGCGCCTTGGCGAACCGGTGCATGGCCAGCACCCGCAGAATCGAGTCCGGCT
+CGAGGCGGATGTCGTCGTCCATGAATAGGATCTGCTGACAGTCGGTGTTTTTCAGTGCCTCATACATCAC
+CCGGCTGTAGCCGCCGGAACCGCCCAGGTTGGGCTGGTCGTGGATGGAGAGCCGACTACCCAATCTCGCA
+GCCGCGGCGGGGAAATCCGGGTGGTCGCGCACCTTGCGCTCACCCTGATCAGGCACGATCACCGCCCCGA
+TCACCTGGTCCACCAGCGGATCGGCGGTGAGTTCTCGCAGCGCGTTGACGCAGTCTGCGGGGCGGTTGAA
+CGTCGGGATGCCGACCGCGATGTTGGCCGTCCCCGGAGCGGGGCTGGTGGCATACCAGCCACCACTGTGC
+AGGGTGACCGCGGTGTCGGTGGTGATGTCGAACCAGACCCACCCGCCGTCTTCGAAAGGCTGCAGCACCA
+CTTCGGTCTCCACGGCGGCTGGCTGATCCTCGGTGCCGGTGAAGTCGTGGCCCTCAACGAAGATCCGGGC
+ACCGGTGGCCTTGGTCCGGTAGACGTCTACCCGCCCGGCGCCGGTCACCTGCACGCGCAACACCACCGAT
+TTGCACGTCGTCCAACGTCGCCAATAGCTAGCCGGGAAAGCGTTGAAGTAGGTGGCGAACGACACCTCGG
+ACTCCGCGCCAATCTGTAGCGAGGTCCGGGTTGGCGCATGCGCGCGCCGGGCGTTGGTCGTTGACTCCTC
+GAGGTACAGCTTGCGCACGTCAAGGGGTTCACCTGGGCGCGGCAGGATGACCCGAGACAGCAGGCTCGCG
+GCGAGTTCACTCATGCGCCGTCCTGAAGCAGTGGGACGCCGTCGCGCAGATGCGGCGCGAGGACGTTGTC
+GTACATGTTCAAGGCGCTGGCAATGGCCATATGCATATCCAGATATTGGTAGGTGCCCAACCGGCCGCCG
+AACAGTACCTTCGATGACGCGGTCTCGGACTTCGCCCTGGCCCGATAGGTGGCCAACAGGGCGCGGTCAG
+CCTCGGTGTTGATCGGATAGTATGGCTCGTCGTCGTCCTCGGCGAACCGGGAGTATTCCCGCATGATCAC
+CGTTTTGTCCGTTGGGTAGTCACGCTCGGGGTGGAAGTGGCGGAACTCGTGGATGCGCGTGTAGGGGACG
+TCGAGATCGTTGTAGTTCATCACCGCGGTGCCCTGAAAGTCCCCGATCGGTAGCACTTCCACCTCGAAGT
+CCAAGGTGCGCCAGCCCAATCGGCCTTCGGCGTAGTCGAAGTAGCGGTCCAGCGGGCCGGTGTAAACGAC
+CGGGGCCGCCGGGCTGCCGGGGCGCAGCTGGCCGCGCACGTCGAACCAGTCGGTGTTCAGCCTGACCTCG
+ATGCGGTGGTCAGCGGCCATGTTTTGCAACCACGCCGTGTACCCGTCGGTCGGCAAACCCTCGTAAGTAT
+CGCTGAAATACCGGTTGTCGAAGGTGTAGCGCACGGGAAGCCGCGTGATGTTGGCGGCCGGAAGTTCTTT
+GGGGTCAGTCTGCCATTGCTTGGCCGTGTACCCCTTGACGAACGCTTCGTAGAGCGGCCGGCCGATCAGC
+GAGATGGCCTTCTCCTCGAGGTTCTGCGCGTCGGCGGTGTCGATCTCGGCGGCCTGCTCGGCGATCAGCT
+GGCGGGCTTGCTCGGGCGTGAAGTACTTGCCGAAGAACTGCGATACCAGGCCGAGCCCCATCGGAAACTG
+ATATGCCTGCCCGTTGTGCATCGCGAAGACCCGGTGCCGGTAGTCGGTGAAGTCGGTGAACTGCCGCACG
+TAGTCCCACACTCTCTTATTAGAGGTGTGAAACAGGTGCGCACCGTACTTGTGGACCTCGATGCCGGTCT
+GTGGCTCGGCTTCGGAATAGGCATTGCCCCCGATGTGCGGGCGCCGCTCGAGGACGAGCACGCGCTTGTC
+GAGTTGGGTGGCCACGCGCTCGGCAATCGTCAGGCCGAAGAATCCTGAGCCGACGACGAAAAGGTCAAAA
+CGAGCGGTCATCGGTTGCATAGGGTAACCGACCTTGCTGGCAAAACCCGATTTGGCAGCTCGTGGCGGTC
+ATGGCCCGAACGGGTTTCACCGCAGGTGCGCATGGCCGACCAGTGTGGGTGGCCGGAGGTCGTTTGGTCG
+CGATTGCCTCACGATTCGATATAACCACTCTAGTCACATCAACCACACTCGTACCATCGAGCGTGTGGGT
+TCATGCCATGCACTCGCGACCGCGGGAGCCGGCGAACCCGGCGCCACACATAATCCAGATTGAGGAGACT
+TCCGTGCCGAACCGACGCCGACGCAAGCTCTCGACAGCCATGAGCGCGGTCGCCGCCCTGGCAGTTGCAA
+GTCCTTGTGCATATTTTCTTGTCTACGAATCAACCGAAACGACCGAGCGGCCCGAGCACCATGAATTCAA
+GCAGGCGGCGGTGTTGACCGACCTGCCCGGCGAGCTGATGTCCGCGCTATCGCAGGGGTTGTCCCAGTTC
+GGGATCAACATACCGCCGGTGCCCAGCCTGACCGGGAGCGGCGATGCCAGCACGGGTCTAACCGGTCCTG
+GCCTGACTAGTCCGGGATTGACCAGCCCGGGATTGACCAGCCCGGGCCTCACCGACCCTGCCCTTACCAG
+TCCGGGCCTGACGCCAACCCTGCCCGGATCACTCGCCGCGCCCGGCACCACCCTGGCGCCAACGCCCGGC
+GTGGGGGCCAATCCGGCGCTCACCAACCCCGCGCTGACCAGCCCGACCGGGGCGACGCCGGGATTGACCA
+GCCCGACGGGTTTGGATCCCGCGCTGGGCGGCGCCAACGAAATCCCGATTACGACGCCGGTCGGATTGGA
+TCCCGGGGCTGACGGCACCTATCCGATCCTCGGTGATCCAACACTGGGGACCATACCGAGCAGCCCCGCC
+ACCACCTCCACCGGCGGCGGCGGTCTCGTCAACGACGTGATGCAGGTGGCCAACGAGTTGGGCGCCAGTC
+AGGCTATCGACCTGCTAAAAGGTGTGCTAATGCCGTCGATCATGCAGGCCGTCCAGAATGGCGGCGCGGC
+CGCGCCGGCAGCCAGCCCGCCGGTCCCGCCCATCCCCGCGGCCGCGGCGGTGCCACCGACGGACCCAATC
+ACCGTGCCGGTCGCCTAAGCCCCGGGTCGGCCGAAAACGCACCCGCGGCCAAGGCGTCGGTCATTGCTTC
+GGCCCGTCACAATTACTCGCCTAAGGGTCGCTAGGTGTTCTCGAGAGTTTTATCGCACCGATTCCGTGTC
+GTCTCATTAATACCAATAGAAACACACGTAACATCAGCTGGTGCCGTCCCGCACCCGCGCGCCGACGACG
+CTGCTCACCGCGATGGCAGCGACCGTCGTCATCGTCGCGTGGATAGCGAATCGTCCACCCGCCAGCTCCC
+ATGAACCATCGCCGACGCCCAACACCCAGCTCGCCGAGCAGCCACTGATCGGGCTCGGCGGCGGCGTCAC
+GGTACGCGAACTCACCCAGGACACACCGTTTTCATTGGTGGCGTTGACTGGCGACCTGGCCGGTACCTCC
+GCTCGTGTGCGCGCCAAGCGCCCGGACGGTGACTGGGGGCCGTGGTATCAGACCGAGTATGAAACCGAAC
+CACGCGATCCGGCGGGCACCGACGGGTCCGTGGAACTTGGAGGACTCAATCCGGGTCCCCGTAGCACCGA
+TCCGGTGTTCGTGGGCACCACCACCACCGTGCAGGTCGCGGTGACTCGCCCGATCGACGCACCGATAACT
+CAACCGCCGGCGGGGCGGCCGCCCAACGACTTGCTCGACAGCGGTTTGGGATACCGTCCAGCCACCAAGG
+AACAGCCATTCGGGCAGAACATCTCCGCGATCCTGATCTCGCCGCCGCAAGCGCCGCCCGGAACGCAGTG
+GACGCCACCAACCGCAGTCACCATGGCAGGCCAGCCGCCGGCCATCATCAGCCGGGCGGAATGGGGCGCA
+GACGAGTCACTGCGATGCGAAACACCGGAGTACGACAGGGGGGTTCGTGCCGCGGTGGTCCACCACACCG
+CGGGGAGCAACGACTACTCTCCGCTGGAGTCCGCCGGCATAGTCAAAGCCATCTACACTTACCACAGCAA
+GACCCTGGGCTGGTGTGACATCGCGTACAACGCCCTCGTCGACAAGTACGGCCAGGTGTTCGAGGGTAGC
+GCCGGCGGCCTCACCAAGCCGGTCGAAGGGTTCCACACCGGCGGATTCAACCGCAACACCTGGGGGGTTG
+CCATGATCGGCAACTTCGACGATGTGGCCCCCACGCCGATCCAGATCCGAACCGTCGGCCGGCTGCTCGG
+CTGGCGGCTGGGCATGGACGACGTCGATCCCAGGAGCATGGTGGATCTGCAGTCAGCGGGTAGCTCGTAC
+ACCACGTTTCCGGGTGGCGCCATAGCGCGATTGCCCGCCATCTTCACCCATCGCGACGTCGGCAACACCG
+ACTGTCCGGGCAACGCCGCCTACGCTGTGATGGACGAGATCCGGGACATCGCAGCACATTTCAACGACCC
+GCCGGAGGAGCTGATCAAGGCGCTGGAAGGCGGCGCGATCTATCAGCGCTGGCAGGCGTTGGGCGGCATG
+AACAGCGCGCTGGGTGCACCGACCTCGCCGGAGGCCGACGCCGCGGATGGGGCGCGGTATGCAACCTTCG
+CTAAGGGCGCCATGTATTGGTCGCCGGTGACCGACGCTCAGCCGATCACGGGGGCAATCTATGAGGCCTG
+GGCTTCGCAGAGCTACGAACGCGGCCCGCTGGGACTGCCGACCAGCGCGGAGATCCAGGAGCCGCTGCAG
+ATCACGCAGAACTTTCAACACGGAACCTTGAACTTCGAGCGCCTCACCGGCAATGTCACCGAAGTCGTCG
+ACGGGATCACGACGCCACTGGCGACGCGGCCCCCGAGCGGCCCGACGGTGCCGCCCGAACACTTCACGCT
+GCCAACGCATCCGATCACCTGAGTCGCGGGTGTGCACTATTCACATTATGTGTGTGCACTTTTCACATTC
+TGGCTTTTGCGGCGCGGAATCGCCGGCGCATAGACACCCTGTGCCATTAGGCTCCATTTGCCGGGCTGAT
+CACCGGGTCGCCGCAGGCCAGTCGAGAGGAACAACGTGTCGTTCGTGGTCACAGTGCCGGAGGCCGTGGC
+GGCTGCGGCGGGGGATTTGGCGGCCATCGGCTCGACGCTTCGGGAAGCGACCGCTGCGGCGGCGGGCCCC
+ACGACCGGGCTGGCGGCCGCGGCCGCCGACGACGTGTCGATCGCTGTCTCGCAGCTGTTCGGCAGGTACG
+GCCAGGAATTTCAAACCGTGAGCAACCAACTGGCCGCGTTTCATACCGAGTTCGTACGCACGTTGAACCG
+CGGCGCGGCGGCGTATCTCAACACCGAAAGCGCTAACGGCGGGCAGCTGTTCGGTCAGATCGAGGCGGGA
+CAGCGCGCCGTTTCCGCGGCCGCGGCCGCCGCTCCGGGCGGCGCATACGGCCAACTCGTTGCCAACACGG
+CCACCAACCTGGAATCCCTCTACGGCGCATGGTCGGCCAACCCGTTCCCATTCCTCCGCCAGATCATCGC
+CAACCAGCAGGTTTACTGGCAGCAGATCGCCGCGGCGCTCGCCAACGCCGTCCAGAACTTCCCCGCCCTG
+GTGGCGAATTTGCCAGCGGCCATCGACGCGGCCGTCCAGCAATTCCTGGCCTTCAACGCGGCGTACTACA
+TCCAACAGATTATTAGCTCGCAGATCGGCTTCGCCCAGCTATTCGCCACGACGGTCGGTCAGGGGGTCAC
+CAGCGTCATTGCCGGGTGGCCCAACCTTGCGGCGGAGCTTCAGCTAGCGTTTCAACAGCTTCTGGTGGGT
+GACTACAACGCCGCGGTGGCGAACCTGGGTAAGGCCATGACAAACCTTCTGGTCACCGGGTTCGACACCA
+GCGACGTGACGATCGGCACAATGGGCACCACCATTAGTGTCACCGCGAAACCCAAGCTGCTGGGCCCGCT
+GGGAGATCTGTTCACCATCATGACCATCCCGGCACAAGAGGCGCAGTACTTCACCAACCTGATGCCCCCC
+TCCATCCTGCGAGACATGTCGCAGAACTTCACCAACGTGCTCACGACGCTCTCCAACCCGAACATCCAGG
+CGGTCGCTTCGTTCGATATCGCAACCACCGCCGGGACTTTGAGCACCTTCTTCGGGGTGCCATTGGTGCT
+CACTTACGCCACATTGGGTGCGCCGTTCGCGTCACTGAACGCGATTGCGACGAGCGCGGAAACCATCGAG
+CAGGCCCTGTTGGCCGGCAACTACCTAGGGGCGGTGGGTGCGCTTATCGACGCCCCGGCCCACGCGTTAG
+ACGGCTTCCTCAACAGCGCAACCGTGTTGGATACGCCGATCCTGGTGCCCACGGGGCTCCCGTCCCCTCT
+GCCCCCGACGGTCGGGATCACGCTGCACTTGCCTTTCGACGGGATTCTCGTGCCGCCGCATCCCGTCACC
+GCGACGATCAGCTTCCCGGGTGCTCCGGTTCCTATTCCCGGTTTCCCAACCACCGTAACCGTTTTCGGCA
+CACCCTTCATGGGAATGGCTCCGCTGCTGATCAACTACATTCCCCAACAGCTCGCCCTGGCAATCAAACC
+GGCGGCTTAGCGCGGCGTGGCCCGTTGGTTAGTGTCGTAGGTTGCCATGCCAAGCTCCAACCATGCGGTT
+AGCAGCCGCTGATCTGCCGCCGCGGCCACAACCTCGTCGTCATCGAGTTGCTCGGCCGATGCGCAGTGCA
+CCGCGTCGTAGCCACGCATGGGCCAGGTCAGCCGCGCGGGTCACGACCTGCTCATCCACCTCGATGGCGT
+CCATCTCGGACCACATCTGGTCACGGTTCGCCCGTCGCCAATCTGCGCGAGGGGCCGGCTCAGTCACGCA
+CTCCCGAGCCACAAAGGCGCCGGGTCACGTGGGCCATGCTAGGACCACCAGCGCTCCAGCACCCGCGCGA
+CGCCGTCCTCGCTATTGGGTGCAGTGACCTCGTCGGCGACGGCCAGCGCGTCGGGATGCGCGTTACCCAT
+CGCCACACCCAAACCGGCCCGCAGCAGCATCGGCACGTCGTTGGGCATGTCGCCGAACGCCACCACCTCC
+GCGTCGGAAATTCCAAGCGGCCGGGCAATCTCGTCGACACCGGTGGCCTTGCTGATACCGAGCGGCACGA
+TCTCCACCAGCCCGTTATTGGTCGAGTAGGTGATATCGCCCTCGAAACCGACATGCTTAGCCAGTTCGGC
+GGCCATGTCGGCACTGGCAGCACCGGCTTTACGGATCAGCAGTTTGATCGCCGGCGCGCTGAGCAGGTGG
+TCGATCGACACTTCGGTGTTGTCCGGATTCAGCCACGCATGCTCGTAGCCCGGCGAGCTGACGAACTGGG
+GGGTCGCCGTGTCGTGTGCGCGCTCGCCGATCCGCTCGACCGCCAGTCCCGCACCCGGTATGACGCGGGT
+CGCAACTTCGGCCAACGTTGCCAGGGCGTCGACGGGCAGGGTGCGCACCGACGTCACCCGATCGGTCCCG
+GGGTCGTAGATGACGGCGCCGTTGGCGCACACCGCCATCGGCGCGAAGCCGAGGGCATCGACGATGGGTC
+GCACCCAGCGCGGCGGCCGGCCGGTGGCCAGGATGAAGTGCGTGCCGGCGTCTACCGCGGCATGCACCGC
+GTCGCGAGTGCGTTTGGTGACGGTTTCTCCGTCATCGAGCAGGGTTCCGTCGACGTCACACGCGACGAGC
+GCCGGCACAGTCGGTTTCAAAGTTGGCTGGCTTGTCAGTGCGGGCCGACTTGGCTGCGCCGTGATGAGGT
+CACGCCGTCGTATCCGCGCTTTTGCCGCCGCTTCGCCAATTCAGCGATTCTGAGCTGCCTGGACTCCTCC
+ACCGTCGGCGCGCCGCCGCCCAGCCGCCGCGGCACCCAGTGCTCCCCCTTGGGATGTGGATACTCCTCCT
+GTACGCGGTAGAGAATCGCATTCATCGCTTGGCGCAGCACGGCATTGAGCTGCTCGGCATTGCCCTCCGG
+CCGCACCGGCGATCCGATCGCCGCGACGATCGGAATCTTGTTGCGGAACAGGTTCTTTGGATGATCCTTG
+GGCCAGATCCGGTGCGCGCCCCAGACGATCATGGGAATAATCGGCACCTGCGCCTCCAGCGCCATCCGGG
+CCGCTCCGGTCTTGAACTCGCGCAGTTCGAGGCTGCGGCTGATAGTCGCCTCCGGGTGTAACCCAACGAG
+TTCCCCGGCCCGCAACCGCTGCACTGCCACCGCGTACGCATCGGCCCCCACACTGCGATCCACCGGGATG
+AGCTGGGCATGCTTGATCACGTAGTTGACCGCCCGTACGTCTTGCATCTCGGCCTTGATCATGAACCGCA
+GCCGCCGCCGCCGATGGTGGGCGGCGATCGATGCCGGAACCCAGTCCACGTAGCTCGTGTGATTGAGTGC
+GATCAACGCGCCGCCACGTTCGGGGATGTTCTCCAGGCCTTCGAATGTGATCTTGTTTCCGTTGGCCGCG
+ACGATCGACGGAACAAGAATCTCCATCATCCGGAAGAACGGCTCAGCCATGTATTCTCCTTCACCTCTTA
+CCGCGATTCATGCGGTGTCCGGCTAGCGGCCCTTGCCGCCGCCTCGTCAGCCTCCATCCGTGCCGCCTCG
+GCCAGCGTTGGCGCGCCGCCGCCGAGTCGGCGGGGCACCCAGTACGCCCCAGCCGGATGCGGATACCGCT
+CCTGCGCTTGCCACAGCAGCGCGGTCATCGACTCACGCAGCGCCGCGTTGGTCTGTTCGATGCCTGCCGC
+GGCCCGCAGCGGCCGACCCACCTGTACCGTGACCGGCACCTTGGCGCGTCCTATCTGCCTGGGATGGTCC
+TTGGTCCAGATCCGCTGAGCACCCCAGACAACGACGGGCACAATCGGGACATCCGCTTCCGCGGCCATTC
+GGGCGGCCCCCGTCTTGAACCCTTTGAGCTCGAAGCTACGGCTGATGGTGGCCTCCGGGTAGACCCCGAC
+CAGTTCCCCTTCGCGCAGCCGCTGCACCGCCACCGCATAGGCGCTACCGCCGGCGCCCCGGTCCACCGGA
+ATGGTCCGGGTGTGCCTGATCAGGAAGTTGACCAACCGCACCCGTTGCATCTCGGCCTTGATCATGAACC
+TCATCCGGCGACGCCGACGATGCATGGCCAACGCGGCCGGCAGCCAATCGACATAGCTGGTGTGATTGAT
+AGCGACCACGGCGCCGCCTTGGTCGGGCACATTCTCCTCGCCGACGTAGGTGATCCGGGTTCCGGTGGCC
+AGCACCAGCAACTGGGCCAGGATCTCTAAGACGCGATAGGTCGGCTCCGCCATCGGTCACTGCTCCGGCG
+CCCCGGCGGGATGGGCTCGCTGAGCGCGGCGCGCAGCCCTAACCGCCGCCTCCTGCGCGTCCAACCGGGC
+CGCCTCGGCAAGCGACGGGGCGCCGCCGCCCAGCCGGTGCGGCACCCAGAACTCGCCGGCCGGATGCGGT
+CCGTACAGTTCTTGGGCCCGCTCCAGCAAATGTTGCATCCGGGAGTGCAGCAGGCCGTTCAGTTCAGCGG
+TGGGCAGCGTCGGTTCGATCCGTTCACCGACGACAATCGTGACCGGCACCTTCGGGCGAAACAGCTTTTT
+GGGACGGTCCTTAGTCCAGATCCGCTGCGCACCCCAAACAATATGCGGAACGATCGGCACCCCGGCCTCG
+ATCGCCATTCGGGCCGCCCCCGTCTTGAATTCCTTGATCTCGAAGCTGCGGCTGATGGTCGCCTCGGGGT
+ACACGCCGACGAGTTCGCCGGCCTTCAGCATCCTGACGGCGGCGTCGTAGGACGCGGACCCGTCCTGCCG
+ATCCACCGGGATGTGGCGCAGGCTGCGCATAATGGGACCGGTGATCTTGTGATCGAACACCTCCTGCTTG
+GCCATGAACCGCACCTTGCGCCCGAGGCCCTGTTGGTAGGCGGGCAAACCCGCAAAGGTGAAGTCGAGGT
+AGCTGGTGTGGTTGATCGCGACGACGGCGCCGCCGCTGGTCGGTAGGTTATCCACACCCGTGACGGTGAT
+CTTCAAACCCTGTATGCGCCAGGACAAGCGAGCAAGCCGAATGACGGTGCCGTATACCGGTTCCACAGCA
+GTTCAGCCTAGTGGTCCCGGCTGCAAGCCGCCCAAAGTGGCGAAAACCCAAATTGACGAAAGAGGTGAGC
+CGTGTCCTTCCCCTCATCGCCACCCGCGCTGCCCGCGATCGTTGCCCGGTTTGCCGTCGGCAGGCCGGTG
+CGCGCGGTGTGGGTCAACGAACTGGGCGGCGTCACCTTCCGGGTGGACTCCGGCATGGGCGCCGGCTGCG
+AGTTCATCAAGGTCGCCAGGAGGGGTACCGCCGACTTCGCTAATGAGGCGCGGCGGCTGCGCTGGGCCGC
+GCCGTACCTGGCGGTGCCGCGGGTACTGGGTGTCGGGGTCGACGGCGATTGGGCCTGGTTGCACACCGAT
+GCGCTGCCCGGCTTGTCCGCGGTGCACCCGCGCTGGCGGGCGTCCCCGCAGGTCGCGGTCCCGGCGCTGG
+GTGCGGGGCTGCGCACCCTGCACGACAGCTTGCCGGTGCACTCATGTCCGTTCGACTGGTCGACGGCCAG
+CCGGCTGGCCAAGCTGGCCCCGGCGCGACGCGCGGAACTGGGTGACTCACCGCCGGTTGATCGGTTGGTC
+GTCTGTCACGGCGACGCGTGCTCACCCAACACCATCCTCGATGACACCGGCCGCTGTTGCGGACACGTCG
+ACTTCGGCAATCTCGGTGTGGCCGATCGGTGGGCCGACCTCGCGGTCGCGACGCTGTCGTTGCAATGGAA
+CTTTCCCGACTACCCGGGCCAGGTCAGAGATGACGAGTTCTTCGCCGCCTACGGTGTGGCGCCGGACCCG
+GCTCGCATCGACTACTACCGCCGGCTGTGGCAGGCCGAAGACGACAGCTCACGCTAAGCTCGAGGCTGCG
+CTTTGCGCTCGTAAGCTCTTCCGAAAGGTAGCTGTGCAGGTCACAAGCGTTGGTCACGCCGGCTTTCTGA
+TCCAGACCCAGGCCGGCAGCATCCTGTGCGACCCTTGGGTCAATCCGGCCTACTTTGCGTCTTGGTTTCC
+GTTCCCCGACAACAGCGGGCTGGACTGGGGCGCTTTGGGTGAGTGCGATTATCTGTATGTCTCGCACCTA
+CATAAGGACCACTTCGACGCGGAAAATCTACGAGCGCACGTCAACAAGGACGCCGTCGTGCTGCTGCCCG
+ACTTTCCGGTACCCGACCTGCGAAATGAGTTGCAGAAGTTAGGATTTCATCGGTTCTTCGAAACCACCGA
+CTCGGTCAAACACCGCCTGAGGGGACCCAACGGCGATCTCGACGTGATGATCATCGCACTGCGGGCCCCC
+GCCGACGGTCCGATCGGCGACTCGGCGCTAGTCGTTGCCGACGGCGAAACAACGGCTTTCAACATGAACG
+ACGCCCGCCCGGTCGATTTGGACGTGCTGGCATCGGAGTTCGGTCACATCGACGTGCATATGCTGCAGTA
+CTCGGGCGCGATCTGGTACCCGATGGTCTACGACATGCCGGCGCGCGCGAAGGATGCGTTCGGCGCCCAA
+AAGCGGCAACGGCAGATGGACCGTGCTCGCCAGTACATCGCGCAGGTGGGAGCGACGTGGGTGGTGCCGT
+CGGCGGGGCCGCCATGCTTTTTAGCCCCCGAGCTGCGCCACCTCAACGACGACGGTAGCGATCCGGCCAA
+TATCTTCCCCGACCAGATGGTGTTCCTGGATCAGATGCGGGCGCACGGCCAGGACGGCGGGCTGCTGATG
+ATCCCCGGCTCGACTGCGGATTTCACTGGTACAACCCTGAATTCATTGCGCCATCCACTGCCCGCCGAAC
+AGGTCGAGGCCATCTTTACCACCGACAAAGCCGCATACATCGCTGACTATGCCGACCGGATGGCGCCGGT
+GCTCGCCGCGCAAAAGGCTGGCTGGGCCGCCGCCGCCGGCGAGCCACTGCTGCAGCCGCTGCGCACCCTG
+TTCGAGCCGATCATGCTGCAAAGCAACGAGATCTGCGACGGCATCGGATACCCGGTCGAGCTCGCCATCG
+GTCCCGAAACCATTGTTTTGGACTTTCCGAAAAGAGCTGTACGAGAACCGATTCCCGACGAGAGGTTCCG
+CTACGGGTTCGCGATCGCGCCGGAGCTGGTGCGCACGGTGCTGCGCGACAACGAACCCGACTGGGTCAAC
+ACCATCTTCTTATCCACCCGATTTCGGGCATGGCGGGTTGGTGGCTACAACGAATACCTTTACACGTTCT
+TCAAGTGTCTGACCGACGAACGCATCGCCTACGCCGACGGCTGGTTCGCCGAGGCCCACGATGACTCCTC
+ATCGATCACCCTGAACGGTTGGGAGATCCAGCGCCGCTGCCCCCATCTCAAAGCCGACCTATCGAAATTC
+GGTGTGGTGGAAGGCAACACGCTCACTTGTAACCTGCACGGCTGGCAGTGGCGTCTGGACGACGGTCGCT
+GCCTCACCGCCCGGGGCCATCAACTACGCAGTTCACGGCCATGATGCAGTTCTACGACGACGGCGTTGTA
+CAGCTGGATCGTGCTGCACTCACGCTGCGCCGCTATCATTTTCCTTCGGGCACGGCCAAGGTCATCCCAC
+TGGACCAGATCCGCGGATATCAGGCTGAATCGCTGGGCTTTTTAATGGCCCGGTTCAATATCTGGGGCAG
+GCCAGACCTTCGCCGCTGGCTGCCACTGGACGTGTACCGGCCGCTGAAGTCGACGTTGGTCACCCTCGAC
+GTACCGGGGATGCGGCCGAAACCAGCCTGCACGCCCACGCGCCCCAAAGAATTCATCGCACTGCTGGACG
+AGTTGCTCGCCCTCCACCGAACGTGAACCCACGGTTTCGCGCGCGATTTTCGCACTGCCCTGGGGCACAG
+CCTCACTCCAGACTTAAGCCACAGCGACGATCCAAGCGACGTGTCATGTGCCTGGTTTAAGTATCGCGAG
+CGTGCCGTCGGCGGTGCGGATATAGATGGATTTCATGGCCGCGATGTAATTGGCGACGGATTCGCTTGCG
+ATCGGGTTGTCCGGGAATAATACCGTCACTGTGGTCTGATGCTGATACCGATTGACCCACATCGAGACCT
+GATGAGAAACCCTACCTTCGTCGTAAATCCTAAAATTCAGATCGGAATTAGCGACCGTAGAAAGAGGCGC
+AATGCTGGCATCCAGAAAGGACATCACGAAATTGCCCGGCCGGGGCGGCCTCAGCCCCGTTTCGGGGCGT
+GCCAGCTCCAATACGCGGTCGAATGGTACGGTCGCCAGGTCCTTACCCGAATCGAAGGAGATCTGCGCGA
+CACGGGCGGCGCTATCGAAAAGTCCTGAGGCGACCGGCACGGTGATCGGCACCAACCCGGTAAACCAGCC
+CGTCGTTCTGAGTTCTGTCGGCGTCCTACGTGTATCAGTCGTCGTTACCACGTCAAACGTTTCACAGTTG
+GTCAACTCGCGCTCAGCGAGGGCGGCGCAGGCGAAAACGCCACCGCTAAAACGGGCGCCCGCAGCGACGC
+AGGCGGCTTCGAATCGCTCGCCCTGTTGCTCGTCCATCAGCGTTTCGGTAAGCAGCTTTCCGGTATGGGG
+CACCGATAGATCGCCGAGCGGCAACGGGAAGTGCGGCAGGGTTCCGTCGTTGTTGGCAGCGAATTCGACC
+CAACGGCGCACCCGGGCGGAGTCCAACGTCAAGGCGGCCGTGTCGGCGTACTGTCGGACACAGTGGTCGT
+CGTAGCGGCCCGCCGGCGGGAGCTCGATCGGCGGGTCGCCTCCCACCAATGCGGAGTACATCATATGGAT
+CTCGATGAAAAGGACGCCCACAATCATCGGATCGACACAGAGATGAGCGATACTCGCATAGAAGGTGAAG
+TGATCGTCACTCTGAATAATCCCGAACAAGAAGCAGTCCCACTGCAACGGCTGCGGCGTTGCAATGTGGT
+GGCGCAGCTCCGCCGACGTCATGTTCTGATGCTCAGCTTGGACGACTTCGATATCTGCAGGGTCAGCGAT
+GGTATGCCGAACGATGTGTTCGGCATTGTCGAACTCAAACCAACTGTGGTAGGTGTCGTGGCGGCGAAGG
+TGTGCGTTGATCGCATAATTCATGGCGCGGATGTTGCACCGGCCAGGTAGATCCCAGGTGAAGATCATCA
+GGCGCGACATATCGAGACCGCGCGCTACATGATCGCGATAACGTCGAAGGTGTTGAGCTTGTTGATAGCT
+GGGCGGCACCTCACTTATCGGCGCTTGCCGGGCTTTCGCCTTCGCCGTCGGTGATGCGTGCCAACAGATA
+ATCGAACCTGGGTCCGGCGTCCAGTCGCGGAGCGTTGTAATGCTAAACACTCATTCCTCCTGCACTCGGA
+CCGAGCCCCGCCAGGGCACGCAAGTAAGCTACGGCCAGACGGTGTGACACTCAAACCGGCGGGCGTAATT
+TCCTCCGACGACGCTCCGCAGACCACAATCGTCAGCGGCGGAGTACGGTTGCTCACCATGTGGTCCACCG
+TGCTGGTCTTGGCGCTCTCGGTGATCTGCGAGCCGGTACGGATCGGTTTGGTGGTCCTCATGCTCAACAG
+GCGCCGCCCGCTGCTCCATTTGCTCACATTCTTGTGCGGTGGTTACACGATGGCTGGTGGCGTGGCCATG
+GTGACGCTTGTGGTCCTCGGGGCCACTCCGTTGGCCGGACATTTCAGTGTGGCCGAGGTACAGATCGGGA
+CCGGGCTGATTGCCTTGCTTATCGCGTTTGCGCTGACCACAAATGTCATAGGCAAGCATGTCCGGCGAGC
+TACCCACGCCCGCGTCGGAGACAACGGTGGCAGGGTCCTACGGGAGTCGGTACCGCCAAGTGGTACGCAT
+AAGCTGGCTGTGCGTGCACGTTGTTTTCTGCAGGGCGATTCGCTGTATGTCGCCGGGGTGAGTGGCCTAG
+GAGCCGCACTGCCTTCGGCCAACTACATGGGCGCGATGGCCGCCATTCTTGCCTCCGGCGCTACGCCGGC
+AACACAGGCACTGGCTGTCGTTACGTTCAACGTGGTGGCATTCACAGTGGCCGAAGTCCCCCTCGTCAGC
+TACCTGGCAGCACCGCGTAAGACCCGCGCGTTCATGGCTGCGCTGCAATCATGGCTGCGGTCCCGTAGCC
+GCCGCGACGCCGCGTTGCTGGTGGCCGCCGGAGGTTGCCTGATGCTCACGCTAGGCCTGAGCAACCTGTA
+GGCGGCGGCGGGCTTGCCTAACGCAGAGCTCTCACATGAAATGTCCAGGCGTCTCCGACTGCGTTGCGAC
+CGTAAGGCACGATAACGTGTTTGCTATTGCTGCTGGTTTGCGTTGGTCGGCCGCTGTACCGCCGCTACAC
+AAAGGGGACGCTGTGACCAAACTGCTCGTCGGGGCCATCGCGGGCGGAATGCTAGCTTACGCAGCTATAT
+TGGGCGACGGAATCGCTTCGGCCGATACTGCGTTGATAGTACCCGGTACCGCACCGTCCCCGTACGGGCC
+ACTCAGGTCGCTCTATCATTTCAATCCCGCGATGCAGCCTCAGATCGGCGCGAATTACTACACCCCCACC
+GCTACCCGCCACGTCGTTTCATATCCAGGCAGCTTTTGGCCTGTCACAGGCTTGAATTCGCCCACCGTCG
+GCAGTTCTGTCAGTGCCGGGACGAACAATCTCGATGCGGCGATCCGCAGCACTGACGGGCCAATCTTCGT
+GGCCGGGTTATCACAGGGCACGCTCGTGCTTGACCGCGAGCAGGCACGGTTAGCGAATGACCCGACGGCT
+CCTCCCCCTGGGCAACTCACATTCATCAAGGCCGGCGACCCTAACAATCTTCTTTGGCGGGCGTTTAGGC
+CGGGAACCCACGTGCCGATCATCGACTACACCGTTCCGGCCCCAGTGGAAAGCCAGTACGACACAATCAA
+TATCGTGGGCCAGTACGACATTTTTTCTGACCCGCCTAATCGTCCGGGCAACCTACTCGCTGACCTCAAT
+GCGATTGCCGCGGGCGGATACTACGGCCACAGCGCCACCGCATTCTCGGACCCAGCTCGCGTTGCGCCTA
+GGGACATTACGACGACAACGAACAGTTTGGGTGCGACGACCACGACCTACTTCATCCGGACCGATCAGCT
+ACCTCTGGTGCGGGCGCTGGTGGACATGGCGGGCCTGCCCCCGCAGGCGGCGGGAACAGTTGATGCCGCA
+CTGCGGCCCATAATTGACAGGGCTTATCAGCCCGGACCAGCACCCGCTGTGAACCCGCGTGATTTGGTCC
+AGGGCATCCGCGGTATCCCCGCCATCGCCCCTGCCATCGCCATCCCTATCGGCAGCACCACCGGGGCCAG
+TGCCGCCACCAGCACCGCTGCCGCCACGGCAGCAGCAACAAATGCGCTCCGCGGGGCCAACGTGGGCCCG
+GGCGCCAACAAGGCGTTGTCGATGGTCCGGGGTTTGCTACCCAAAGGGAAGAAGCACTAGCCATAAAGTC
+CACGACCTACGGTGGCGTTTCGCAGTTGGGGGTGTAAAGGGGGTTGAGGTCTTCGACGATGGCGGTTGCT
+GCTGGCCCACCAATCCGTTGCTGCTGACGCCAATCCATCGGGAAGGCCCTGGGTGGCGTCTTGGTGCGCC
+CGGAGGGGCAGCCCGTTGGCGCCCGTCGTCGAGCGTGAACTGAGGGCGGACCTCGGGCAGACACGCCGAG
+GTCTTCCTTTTGGGCAGCGTGGAACCGCCCATCATCGAAAGACCTCGACCCCTACCCCGGCAACGACGCG
+CCGACTACCTCACACCCTCAACTGCGAAGAGATCCTAAAGCCTGAGCCCGTCGTGTAACCAAAGACCGAT
+CAGATCGTCGTCGTCGGGCGGTGATTGCTCTTCTTCTTCCTTGGGCAACAACGGCTTACGTTTGGTTCGT
+TGGGCACGGCCACGGCGTCGGCCAAGGGGCCACCAGGTTGCCGGCCGCCAGCTTGACGGCAACCACCAGT
+TCGCCTGCCCAACCAACACGGCAATGGCGGGCACGGTAACGGTACGCACCAAGAAGGTATCCAGCAAAAG
+CCCGGTCCCTAGGACGAACGCACCTTGAACCACGCTACCCAAGCTGGCGAATACCAGACCGTACATCGAG
+GCAGCCATGATCAAACCCGCCGCAGTGATCACACCACCTGTTGAGGCCACGGTCCGGATGACACCGGAAC
+GCACCCCCAAGACGGCCTCTTCACGCAGCCTAGAAATAAGCAGCATATTGTAATCTGCGCCCACCGCGAC
+CAATATAACGAAGGTCAATCCCGGAATGCTCCAATGCATTTCCTGACCGAGTAAAAATTGGAACACGATA
+ACGCCAATACCGAGCGCCGCCAGGTACGATACGATAACCGAGCCGATCAGATACAGCGGTGCCACAATCG
+CACGCAGCAAAACGATCAATATGAGCAGAACGATGCAGACGGTCATGGCGATGATCAATCGGAGGTCGTG
+ATCGGAGTAGTCGCGCGTGTCCTTGAGAACGACGGGCAATCCGACGACAGACACCTTGGCATCGGCCAGT
+GCGGTATTTGGTTGCGCCCCTCGAGCGGCCGCCGTGATCGCGTCAATTTGGTCCATGGCAGCAGTGCTGA
+ATGGATTCAGGTCGGTTTGTATCAAATACCGTATTGAGTGGCCGTCGGGTGAAATGAAGGCCGCCGCGAC
+TTTTTTGAGTTGGTCTACATTCAGCCCGCCTAGCAGATCCCGATACTCTGACGGCATCGTCTCGGCTTTG
+ACGCTCTCACCGGTGGCATACGACAACAACTCCGGGGGAATATAGAACCCCGCCATCGCCGGCGTGGTCG
+CGGTGTCCTTCATTGCCAATAGGAACGCCGAGGCCTCGCCCAACCCGAAACCCATCTTCTTCACCTGGTC
+GACCAACAACTGCACGCCCTCAGCCAGTTGCCGGCTCCCGTCGGCGAGATCATTGACCCCCTTGTTCACC
+AGGTTGATCTTGGATCGCACACCACCAGGACTGCTCATCCCCAGTGAACCCATCGCCCTGATGACGGTGG
+CCAGCGCCCCGCGTAATCCGGACACGGTGGCTGCCAGGGTCTGCACTGCGCGCGTGGCCTGCAGCTGTCG
+AGCCAACTCAGATATCTTTGCCAGCGTTCCGTCGTCGCGCGCTGTGACCAAACGCTGCAGTTCGGTGCGC
+GCACTGGCACAAGCCGGATCGGCAGTGCACATCGGGCTGCTATCCAGCGCCCCCAGCACCGGGCTTGCCC
+ACTCGGTGTTGTTCGCTACAAAGCTCGCATCCGCGTCAATGGTGTCACCGAGTGCCCGCATGCTGCCGAT
+CAGCTTCTCCGCGCCTTCCAGTTCGCCGAGAACCCTGTTGCCCCCGAGCAGGTCCTGAAGGTACGCCAGC
+GCGTCGATGAGGCCGCCGACCGTGGATATGGCCCGGTTAACTTGGGCCCGTACGTCGCCGAGTTTGCTCG
+CCATCAGGTTGGCTCCACCGGCCAGTTTGTCGATGTCGCCGGTGTGCGCAGCGATCTGCTTGGAACCCTC
+ATCCAGCTTGCTGCCGACTTCGCCAGCCTGCCAGGACGTCCGGGCCTGCTCCAGCGACCGTCCAGCGGGT
+CGGGTAATGCCCCTGACCATCGCGACACCCGGCACTTGGCTCACCCGCTGCACCATCTGCTCTAGGTCGG
+CGAGAGCCTTCGGCGTGCGCAGATCCGTCGAGGATTGGATGAACAGGTACTCGGGAATGATCAGGTTAGA
+CGGGAAATGCTTGTCCAACGCGGCATACCCGATCGAACTCTCGACGGAAGCCGGAAGCGTCTTGCGATCG
+TCGTAGTTGTACCGGGCCAGTCCTGCGCAGCCGGCCAGAATAACCAGCACCAGCGCGCTGGCGAGCAGAT
+GAGTCTTGGGCCGACGCACGATGTGCACCCCCGAACTCCGCCAAAAGCGCCGGGTGAGGTCACGGCGCGG
+CGCGATCCAACCGCGACGCCCGGTCAGCACCATCAGGGCGGGTAGCAGTGTGACAGCTGCGAAGAAGACC
+ACGGCTACCGAGATTCCCAACATCGGACCAACCGTTTTGAGAATTCCCAGTTGGGTAAACACCATCCCGA
+GAAAGGTGATTGCTACGGTAGCCGCGGATGCGGCGATCACCTTACCGATGGATGTCAATGCCTTCTTGAC
+GGCTTGATCCGAATCCGCGCCCTGCCGTAAATAGTCGTGATATCGACTAATCAGAAATACCGCGTAATCC
+GTTCCCGCACCGACCATCATCCCGCTCATAAAAATAATGCTCTGGTTAGCAATACCGAGGCCCGCCAAGC
+CGGCTATTGCAACGAGGCGCTGTGCAACCACCACGGACATGCCAATTGTTATCAATGGCAACACCATGGT
+GATCGGATTCCGGTAGATGATCAGCAAAATGACCAACAACAGGATCGTGATCGCAAACTCGATGCGACTG
+CGGTCCCGTTGCCCGGTGAGGTTCAGATCGGCGACGGTGGCCGCGGGCCCGGTCAGGTTAGCCGTCAGTG
+TCGAGCCTGCGACCTGGTGTTCGACGATGTCAGCGACGCGGGCGTACGCCTGCTTGGACTGGGTCGAACC
+CAGGTCGCCGGGAAGGCCGACCGGCAGGATCCAGGCCTGATTGTCTTTGCTGGTCATGAGCTCCCGCAGG
+GGCGGTGTGGTGACGAAGTCCTGGAGCATCACGACGTCTCGAGTATCGCGTCGCAGGGCGTCAACCAGCT
+CTTTGTAGCTGCGTTCATCGGCCGCGCCGAGCCCTTTGGCATCGCTGAGCACCACCACCGCAACGCTCTG
+CAACCCGGCTTCACGAAATGCCGCGGTCATCTGCCGGGTCGAGACCAACACCGGGGCGTCCGATGGCAGA
+ATCGCCACTGGATGCCGCTGGGAGATCGCGTCCAGGGACGGCACCGTCGGCGCAAGCAGACCCGCAAGCG
+CGACCCAGAAGGCGATCACCACCCACGGCCTTCGGACGATAAGGCGCCCTAGCCGCGGAAAGACACCCCC
+GTCACCGGTTGGCCTAAGCGGTTTCGATCGTAAGTTCGTCGAGGGTCTCGGTGTTCTGACAGGCTGCATC
+AAGACGTCGCACATTCCTCATCTGCTCCGCACGTGCCCGCCTTGAGCGCCAGCCGTGGTGGTCGCTGTGA
+GGCGAGTGAGACAGCAGGGGATCGGTCACCTGACGAATTTACGTGCGCAACCACTAAGCTTCTCTATCTA
+CCGTCACATTCGCAACCTTTAGATTGCAGATATCGATAAAATCACCCGCGCGACAAGACCGCCATGTCAT
+CCTTTCGATGTTATTTCGCCGGCCTGGGGAAAGCGCAACGACGTTGCCTACACGTTCCGCCGTCCCACCG
+TTGGCAATGCGCATACACACCGATCTAATTGCCCTCAGATATGCGGTAACGGATTCGCGAGCGACCGGAT
+TATCTGGGAATAGCACGCTCGCCGCGGTCTCGTCGAAACGACCGACCATCGTACTTAGCGGATAGGTGAC
+CCTCCCGTCGCTGTAGGTACCAACGTTGAGGCCCTCGAACAGTTTCGTCACCGCCGAGAGCGGTCCCACT
+TGTGCGTCGAAAAAGTTCACCAGGGAAAAAAGCGGTTGGGGCCTGCGCAGCGACGGCGACAATTCGACGA
+CCCGTTCGAACGGCACTTTAGCCAGATCCGCACCAGTATCGAAGGAGGTCTGCGCGATTCGTGCAATCTC
+GTTAAAGGACAATCCGGCGACTGGAACGGTCACCGGGATCTGCCCGGTGAACCACCCCTGCGTCATAAGG
+TCGGCTGGTGTGCGGATATCTTTGGGAGTAATTCCAAAATAGGTATCGGCGCCGGTCAACTCGTGTATCG
+CGATGGCGATGCAAGCCAGCATGCCACCAATGAAACGAGCGTTCGCCGCCATGCAGGCGGATTCGAATCG
+CTGTGTTTGCTGCTCGTCCATTAGCATCATGCTGAGCAGGTCGCCGCCGCAGCGTACAGACGGATCTCCG
+AGGGGCAGCGGAAATTCCGGGAAAGTTCCGTTATTGATTTCGGCGAAGTCGATCCACGCGCGCACCTCCG
+GGGAATCGACGGTCAACGCCGAGGTGTACTCGTGCTGCCTGACGCAGAAGTCCACATAGCTGCCAGCCTC
+CGATAACCCAATCGGTGGCTCACCCATTATCAGCGCGGTGTACATCGACTGGAACTCCATGAGTCCGACT
+CCTACGAACTGACCGTCCGCATGCAGATGATCGATGCTGGCATAGAACGTGAAGGAGTCTGCTCGCTGAA
+TGACTCCGAAGCTGAAGCAGTCCCAATGAAGCGAATCCGGTGTCGCCACGATGTGCTGTCGCAGGTCCGC
+GCTCGTCATCTCGCCATGTGTGGTCGGAACAAATTCGATATCCGCCGGATCGGCGATGCTGTGCCGAACG
+ATGTGGTCGGTATCTCGAAGCTCGAACCAGCTGCGGTATGTATCGTGCCGACGAAGGTGCGCATTGATGA
+CATAGGTCATGGCGCGCAGATCGCAGTGACCAAACACCTCAACGGACGCAATGAGCAGCCGCGAGTGATC
+GAGCCCCCGGGCAGCCTGCTCAGAAAAGCTCCGAATTTGTCTGGCTTGTACATAACTGGGAGGCACAGCA
+CTCACCGGCGCTGCAAGGGCTTTCGCGCACGAGGCAGGTGTTGGGTGCCACGAAACTAACACGCCGGGCG
+CTGGGTCCCAGTCTTTGACCGCTGACAACTCTACTGGTCCTATTCGCACTAATAGCTCCTATTTCAGCGC
+GTGCGGAATACGTATGCGGCGAAACGTTCTTACTGTGACGACAGCGCGGCAGCAGGAGCGTCGTCGGGCG
+CCAGCTGTTCATACAAGTGATCCGCTAAGCCCCGCACCGTGGCGCTGACGTTCTTGGGTGCCAACCGGAT
+TCCGGTCTCGGTCTCGATCCGAGTGCGCAGCTCTAGTGCGCCCAACGAATCAAGTCCATACTCGGGTAGC
+GGGCGGTCAGGGTCGACGGTGCGCCGCAGAATCAGGCTGACCTGCTCGGCGACCAGCTGCCGAAGCCGCG
+CCGGCCACTCGTCGCGTGGCAGCTCGTTCAGCTCGACGCGGAATTTGCTTGTGCCCGAACCGTTGCTGCT
+GGAGAACACTTCGAAAAACCGGCTGCGCTCTGCGAAGGCGACCAGCCACGGGGCTCCGATGACCGGGGCA
+TAGCCGGTATAGACGCGGTTGTGGCGCAATAGCGCCTCGAACGCGTAAGCACCTTCGTCGGGAGTGATCG
+CCGTGTAGTTGCTTTCCTCCAATGCCGAAGCCCGCGCGGGCGATGCCGACCACCACCCCAACTGGCCGAT
+ATCCGACCAGGCTCCCCACGCGATCGCGGTAGCCGGCAGGCCCTGAGCTTGCCGCCAATGCGCGAAGGCG
+TCCAGCCAGCTGTTGGCCGCTGAGTAGGCACTCTGTCCCGGCGAGCCGGTGAGAGCTGCCGCCGACGAAA
+ACAAGCAGAACCAGTCAAGCGGCTGTCCGCTGGTTGCTTCATGCAACTCCCAGGCACCGTGAACCTTTGG
+CGCCCAGTCGCGCGCCAGCAACTCGTCGGTGATATTGGCCAAGGTGGCGTCCTCGACCACCGCGGCCGCG
+TGTAGCACGCCTCGTACCGGAAGCCCGGTGGCCACAGCGGTCGCCACCAACCGCTCCGCGGTACCCGGTT
+GGGCGATGTCACCGCATTCCACCACGACTTCAGAGCCCATCGCCGCGATGGCCTCGATCGTTTCCCTCAT
+CTTTTGCGTCGGCTGGGTGCGGGAATTCAGCACGATCCGGCCGCAACCGGCCGCGGCCATCTTCTCGGCC
+AGGAACAGCCCTAGCCCACCGAGGCCGCCGGTGATGATGTAGGAGCCGTCGGGACGGAACACCTGAGCTT
+GTTCCGGAGGCAGGGTAACGAGGCTTTTTCCGGTCTGTGGGATGTGGAGGACGAGTTTGCCGGTGTGCTC
+GGCGTTGCCCATCACACGGATGGCGGTGGCCGCCTCGACGAGGGGGTAATGGGTGCTCTGCGGCATCGGC
+AACTCGCCGGCTGCGGTCAAGCGATAGACCGTGCCGAGCAGGTCGCGCAGCTCTTCTGGGTGTGTCGCAG
+ACAGCAACCCCAGGTCTACGGCGTAGAAGGACAGGTTGCGCCGGAAGGGAAAGAGCCCCAGCTTGGTGTC
+ACCATAGATGTCGCGCTTGCCAATCTCGACGAACCGTCCCCGGAAGGCGAGCAGTTTCAGCCCGGCAAGT
+TGCGCGGCGCCGGTCACCGAGTTGAGCACGACATCGACACCCCGGCCGTTAGTGTCCCGCCGAATCTGCT
+CGGCGAACTCGATGCTGCGCGAGTCATAGACATGCTCAATACCCATGTTGCGCAATAGCTCTCGACGCTG
+TGGGGTACCGGCGGTGGCGAAGATCTCAGCGCCCGCCGCGCGGGCTATAGCGATCGCCGCTTGTCCGACC
+CCGCCGGTGCCGGAGTGAATTAGCACCGTGTCACCCGCCCTAATCCGGGCGAGCTCATGCAGTCCGTACC
+AGGCGGTGGCGTGCGCGGTGGTCACCGCAGCGGCCTGTGCGTCACCCAGGCCCGGTGGCAGCGTCGCGGC
+CAGCCGAGCGTCACACGTGACGAATGTGCCCCAGCAGCCGTTAGGCGACATGCCACCAACATGGTCACCA
+ACCTTGTGGTCAGTGACGCCTGGTCCGACCGCGGTCACCACGCCGGCGAAATCCGTGCCCAGCTGGGGCA
+GGTGTCCCTCGAAGCTGGGGTAGCGACCGAAAGCGATGAGTACATCGGCAAAGTTGACGCTGGACGCACG
+GACCGCAACCTCGATCTGTCCTGGTCCTGGTGGAACGCGGTGAAACGCGGCCAGCTCTATCGTTTGCATA
+TCGCCGGGGGTACGGATCTGCAGGCGCATGCCGCTCTGCTGATGATCCGCGACGATGGTGCGCCGCTCCT
+GAGGACGCAACGGGGTCGGACACAAGCGCGCCACGTACCACTCGTTGTCTCGCCAGGCGGTCTCGTCTTC
+TTCCGACGTGGCCAGCAATTGGCGTGCCAGCTGCTCGACACCGGTCTGTTCGTCCACGTCGATCTGGGTG
+GCACGCAGGTGAGGGTGCTCGGCGCCGATCGTCCGCAGTAGACCACGCAGCCCGCCCTGCTCAAGATTGA
+CGCAGTCGTCGGCCAGCACCCGCTGGGCACCCCGCGTCACGACGTACATGCGCGGCACCGCCCCGGGAAG
+GTCTGACAATTCGCGAGCGATACCCACCAGCCGGCGAACGTACTCAGCGCCGCGATCCGCGCTCCCCTGA
+TGCGGCGTACCGGTGTTCGACCCGGTGAGCACGACCACGCCGCTAAACTCGTCGCTACCAACTTGATCGC
+GTAGCTGGTCGGCGGCGGCCAACTGGTCGTCGTGCAGTGGCCACCGCATCGTCGTGCACGCCGCGCTGTG
+TTCCCTAAACGCGTCCGCTAGCCGGGTAGCGGTCACATCAGAGGCAGCGCAGTCACTGATCAGCAGCCAT
+TTTCCAGCGCCAGAGGGGTCCATCTCGGGCAGCTCACGCTGGTGCCATTCGATGGTGAGTAAGCGCTCAT
+TCAGCACCCGATTGTGTTTATCGCGCTCGGACACTCCCGTACCGATTCGCAGTCCGCACACGGCCAGCAA
+CACCGTGCCGTGCGCGTCCAGCACGTCGATATCGGCCTCGACGCCGACCAACTCGACTTTGGTCACCCGC
+GTGTAGCAATAGCGAGCGGTACGCACCGGAGCATAGGCACGGACTCGGCGCACCCCCAACGGCACCAATA
+GGCCGCTACCTACCGACTGGCTATCGGGATGCGCGCCGACCGACTGGAAACAGGCATCCAGGAGGGCCGG
+GTGGATTGCGTACAGGCCCTGCTGCGAACGAATCGAGCCGGGCAGCGCGACTTCGGCCAGCATTGTGGCG
+GTCGCATCCTCCGCGACATAGGCCACGGCCAGGCCGGTGAAGGCCGGACCATATTGCACACCGTGCTTGT
+CGAATTGCCGGCGCAGATCCTCACCGTCCACGCGGCAAGGGTGGGCTTCCAATAAGGAGGCCATGTCGTA
+CGCCGGCGGCTCGCATTCGCCGGATACCTGCTGCAGCACCGCCGACGCACGCCGCAAGTGATGCCCAACG
+CCTTCCTGCAAGGCCTCGACGGCGAAGTCGACGACACCGGGCGAGGTCACCGTTGCCACGGTGGACACCG
+GGGTCTGGTCATCCAGCAGCAGCATCGCCTCAAAGCGCATGTCGCGTACTTCGGACTGCTCGCCGAGGAC
+GGCACGGGCCGCAGACAACGCCATCTCGCAGTAGGCGGCCCCTGGAAGAGCAGCCACGTTGTGTATCCGG
+TGATCGCCCAACCAGGGCAAGGTTGCGGTACCAACATCGGCCTGCCAGGCGTGGCGTTCCGGCTCTTCGG
+GCAATCGCACGTGTGCGCCCAACAACGGGTGCACGGCTACCGTGGAGCCACCCGGCGACCGATTGTCAAC
+GCCTTCGCGGTCATAGAACAGGAACCGGTGCGACCACGCCGGCAGCGGAGCATCGACCAAGCGGCCTTGG
+GGACAGAGCACCGAGAAGTCCACTGCCGCACCAGCGTTGTGCAGATCCGTCAGCAGGCGACGGAGCCCCA
+GCGGCAATGGCTGCTCCCGCCGCATACCGGCCAGCGCGGCAACCGGCATGCCTACACTGCCGGCAATCTG
+ATCGACCGCGTGGGTCAGCAGCGGGTGCGGCGAAAGCTCGGCGAAGACTCGGTACCCGTCGTCGAGCGCC
+GAGCGCACCGCAGCGGAGAACCGCACGGTGTGGCGCAAATTGTCGGCCCAGTAACGCGCGTCGCACGCCG
+GCGCTTCGCGCGGGTCGAAAAGCGTCGCCGAATAGTAGGGAATCTCAGGAGCTTTCGGATTCAGGTCGGC
+CAGCGCAGCTATCAACTCGTCGAGGATCGGATCCACCTGCGGCGAATGCGAAGCCACGTCGACGGCCACC
+GCCCGCGCCAGCACGTCTCGCCGCTCCCATATGTCGACCAGCTTGCGCACCGACTCGGTGCCTCCGGCGA
+TCACGGTGGACTGCGGCGCGGTCACCACGGCGACCACCACATCGTCGATGCCTAGAGCGGTCAATTCCGA
+CTGCACAGCTAAGGCAGGCAACTCCACCGACGCCATCGCCGCGGAACCGGCGATCGTCGCCATCAGTTTT
+GATCGTCGGCAGATGACGCGTACCCCATCTTCGGCTGACAGCACTCCTGCGACCACAGCCGCGGCCGACT
+CACCCATTGAGTGGCCGATCACGGCGCCCGGGCGCACTCCGTATGCCGCCATCGTGGCTGCCAACGCGAC
+CTGCATCGCGAAGATGGTCGGCTGAACTCTGTCGATGCCAGTCACGGTCTCGGGCGCCGTCATCGCCTCG
+GTGACCGAGAACCCGGACTCCGCGGCGATCAATGGCTCTAGCTCCGCAACGGTCGCGGCGAACACCGATT
+CGTTCGTCAGCAGATCGGCGCCCATCGCTGCCCACTGCGACCCTTGCCCGGAGAATAACCAGACCGGCCC
+GCGGTCATCCTGCCCCACCGCGGGCTGGTAAACGGTGTCACCGTCGGCGACCTCGCCCAAGCCGGCAATC
+AGCTCGTCGACGCTGCTCGCGATGACCGCCGTGCGCACCGACCGGTGCGTACGCCGCCGCGCCAGCGTGT
+ACGCAAGATCCGAGAGCACCAGGGAGTCGGCGTGCTGCTGTATCCAGTCGGTCAACCGCTGAGCAGTCTG
+CCGCAGCGCGTCGGCCGAGGAAGCGGACAGCGTGAACAAGGCAGGGGTGCCGGTCGGGGGGGTGCTCGCC
+GCGTGGGGCTGGGCTTCGGTTTGCGGAGCTTGCTCCACAACAGCGTGCACGTTCGTTCCCGAGAACCCAT
+AAGACGACACTGCCGCCCGCCGGGGCACCTGACGACCGTTGGTGGGCCACGGTGTGGTCACCTCGGGCAC
+GAAGAGGTTGGTGGTGATGCCAGCAATCTCATCGGGCAGCCGAGTGAAGTGCAGATTACGTGGAACCACA
+CCATGTTTCAGAGCGAGAACCACCTTGATTAGCCCTAGCACCCCGGCGGTCGACTGGGTGTGTCCGAAGT
+TGGTCTTCACCGATGCGAGTGCGCACGGGCCGTCGACCCCATACACCTCGGAGACACTTGCATATTCAAT
+GGGGTCACCGATCGGGGTGCCGGGGCCGTGCGCTTCGACCATGCCGACCGTCGCGGCGTCCACGCCACCG
+GCAGCCAACGCCGCTCGATAAGCCGCAACCTGTGCGGGCTGCGAAGGCGTCGCGATATTGACCGTGTGGC
+CATCCTGATTTGCGGACGTGCCACGAATTACCGCCAGGATCCGGTCACCGTCGGCCAATGCATCCGGCAA
+CCGCTTGAGCACCACCACGGCACAACCCTCGCCTGACACGAACCCGTCAGCCGCGACATCGAACGCGCGA
+CAACGTCCGGTCGGGGACAACATGCCCAAAGCGGATCCAGCAGCGGCCTTGCGTGGCTCCAGCATCAAGG
+CGACACCCCCCGCCAAGGCAACGTCGCTTTCACCCTCGTGCAGGCTGCGACACGCCATGTGCACGGCCGT
+CAGGCCGGACGAGCATGCGGTATCAACGGTTATTGCCGGACCGTGCAGTCGCATCGCGTAGGCGACCCGG
+CCCGACGCCATGCTGAAGCTGTTGCCCAGATATCCGTACGGCTCCTCCAATTGTTTGGCGTCGGCCGCCA
+CCATCGTGTAGTCACCATGGGTGACACCCGCGAACACGCCGGTCGCCGAGCCTGCCAGCGTTTGCTGAGT
+AAGACCGGCGTGCTCCATGGCCTCCCAGGACGTCTCCAGCAACAGACGTTGCTGCGGATCGATCGCAATC
+GCCTCCCGCTCGCCGATGCCAAAGAACTCGCAATCGAAATCCGCGGGGTTATCCAGGAAACCGCCCCACT
+TGCACACCGTCCGACCGGGCACGCCCGGCTGCGGGTCGTAGAACTCGTCGCAATCCCACCGGTCCGGCGG
+CACCTCGGTGATCAGGTCGTCGCCTCGTAACAACGCCTTCCACAACAACTCGGGGGAATCGATCCCGCCG
+GGCAGCCGGCAAGCCATGCCGATAACAGCAACCGGAGTCACACGTGGTTCAGCCAACGTCCATGCACCCC
+TATCTGCACCAGTGCCTGACGCCGCCGACCCCAAGCCCAATGCCGGAGGCGATACGTAGCCTAACTAGCA
+ATCCTTCGATGTAGCTGTGTCTTTGGTGGCTCTTTAGTTCTAAGCGGCTGTGCTACTGGGGCACTGGGCC
+CTACTTCGGTTTGTCGTGGCATGGGCAGCCCGCGGTCTGCCGCAGTCTGAAGTTCGCGGCCTGAGCGCGC
+GCTATCTTCCACGCCGGGCCGGTAGTCTGACGCTTCATGGTTTCGCTTTCCATCCCCTCGATGTTGCGCC
+AGTGCGTCAACCTGCACCCGGACGGCACGGCATTCACTTACATCGATTACGAACGGGATTCGGAGGGCAT
+AAGTGAAAGCCTGACGTGGTCGCAGGTGTATCGGCGAACCCTAAACGTTGCAGCAGAAGTCCGCCGCCAT
+GCCGCAATTGGTGACCGTGCAGTGATATTGGCCCCACAAGGACTCGATTATATTGTTGCTTTTCTGGGCG
+CTTTACAGGCCGGTCTTATTGCGGTTCCACTTTCGGCTCCGCTCGGCGGCGCCAGCGATGAACGTGTTGA
+CGCGGTAGTGCGTGACGCGAAACCCAATGTCGTTCTGACAACATCCGCGATAATGGGCGATGTCGTCCCG
+CGCGTTACGCCACCGCCCGGTATTGCCAGCCCGCCAACGGTTGCGGTCGATCAACTAGATCTGGACTCGC
+CGATACGATCTAATATTGTGGACGATTCTCTCCAAACAACCGCATATTTGCAGTATACGTCGGGATCGAC
+CCGCACACCTGCCGGTGTAATGATTACCTACAAGAATATATTGGCAAATTTCCAGCAGATGATTTCCGCC
+TATTTCGCCGACACCGGAGCCGTACCGCCATTGGACCTTTTCATTATGTCGTGGCTACCGTTCTATCATG
+ACATGGGTTTGGTTCTGGGAGTTTGTGCGCCGATTATCGTAGGATGCGGCGCTGTGCTCACAAGCCCGGT
+GGCGTTTCTGCAGCGACCAGCCCGGTGGCTGCAATTGATGGCACGCGAGGGCCAGGCGTTTTCGGCGGCA
+CCGAACTTCGCCTTCGAACTGACGGCAGCAAAAGCAATAGATGACGACTTGGCCGGGCTCGACCTTGGAC
+GGATCAAAACCATCCTCTGCGGCAGTGAAAGGGTGCATCCGGCGACCCTCAAGCGCTTTGTCGACCGGTT
+TAGCCGTTTCAATCTTCGAGAATTCGCAATTCGGCCCGCGTACGGACTCGCGGAAGCCACGGTGTATGTG
+GCGACCAGCCAAGCCGGCCAACCCCCAGAAATCCGTTACTTCGAACCCCACGAACTTTCCGCTGGGCAGG
+CCAAGCCGTGCGCAACCGGGGCGGGCACAGCTCTGGTCAGTTACCCGCTGCCGCAATCACCCATTGTTCG
+GATCGTCGATCCCAACACCAATACCGAGTGCCCACCCGGAACAATCGGTGAGATCTGGGTACACGGCGAC
+AATGTCGCCGGCGGCTATTGGGAAAAGCCTGACGAGACTGAACGCACCTTCGGAGGAGCACTGGTCGCTC
+CCTCGGCCGGCACACCCGTAGGGCCTTGGCTACGAACTGGCGACTCGGGCTTCGTGTCTGAGGACAAGTT
+TTTCATCATCGGCAGAATAAAGGATCTGTTGATTGTTTACGGCCGCAATCATTCTCCCGACGACATCGAG
+GCAACGATCCAGGAGATCACTCGGGGCCGCTGTGCGGCGATAGCGGTTCCGAGCAATGGCGTGGAGAAGC
+TCGTTGCCATCGTCGAACTCAACAACCGCGGCAACTTGGACACAGAGAGGCTGAGCTTCGTCACGCGTGA
+AGTCACCTCGGCGATATCCACCTCGCATGGATTGAGCGTGTCGGATCTGGTTCTGGTGGCGCCCGGCTCG
+ATTCCGATCACCACGAGCGGCAAGGTCAGACGTGCCGAGTGTGTGAAGCTGTATCGACACAACGAGTTCA
+CCCGGTTGGACGCTAAGCCGTTGCAAGCGAGCGATCTTTAGTGGTCACGCGACTTGCACCCCGTCTCGGG
+GTTGTTCGGCAGCCATGCGGCTGCCTCCCTTCCGCGCTTCACAGCCACCAGCCGGGCAAGGCCCGGTCTT
+ACGGTCGGCTCCACGCTTAACGACGGGAACCAGCGGTCGGCGACCACCAGCGCCGACCCGTACCAGCCCG
+TCTTGTAGGACAAGTGCCGGCGCGGAGTGCCCAGGGCCGAGTCCGACAGTCCGCGCCGGCGGGCGCGGGC
+GCCGGGAAGCCCCTTTTGCCGCAGCATCCCCGCAGCGTCCAAACCTTCAACAACGATGTGGCCGTGGGTT
+TGAGCCAATCGTGTTGTCAGGACATGCAGGTGATGAGTGCGGACATCGTTGACCCGGCGATGCAGCCGGG
+AAATCTCGGTGGTGCGCTCGCGGTAGCGCCGTGAGCCTTTCGTGCACCGCGACCGCGCACGGCTGGCGTA
+CCGTAGCTCTTTGAGTGCCGCGTCGAGTGGCCGTGGATTGGGCACTTCTTCGAGCACTGCGCCCGCCTCG
+TTGGCGACCGTGGCCAGCCGGCGCACCCCGACGTCAACGCCAACCCGTGAACCGGGCTGTGCCACGTTGG
+GCTGCTGCGGGCGTTGCACGAGGACCCGCACACTGGCGTCGAGCCGGGTGCCGTTACGGCGCACCGAGAT
+TGCCAGCACCCGCGCCCGGCCTGTGGCGATGAGCCGTTCAATCCGGCGTGTGTTCTCGTGCGTACGGACG
+GTCCCGACGACCGGCAGTGTGAGATGACGGCGATCAGGTTCGACGCGCATCGCTCCGGTCGTGAATGTCA
+CGCGGTCCTGATCGCGGCCTTTCTTCTTGAACCGGGGGAAGCCCATTGTCTTGCCCTCACGTTTACCGGA
+TCGGGAGTTCTGCCAGTTCCAGTACGCATCGACAGCGCCGCCAATGCCGTCGGCGTAAGCCTCTTTCGAG
+CACTCCGGCCACCACACCGCCCCGGTCTCGGCGTTGACACACACCTCGTCCTTGACGGTGTTCCACCGTT
+TACGAAGCACCCGCAGCGACGGCTTGACAGTCCCGATACCAGTAACGCGCCACGCCTCGATATCGGCTTT
+CAAAGTAGCGACCGCCCAGTTGTAGGCCTTGCGGCGAGCGCCGAAATGCCGCGCCAGCGCGCGGGCCTGG
+TCCTCGGTTGGGTCCAGCGTGAACCGGAACGCCTGCACACACCAGCCTTCTGGCACCTCGAATCTGGCCA
+TCAAGCTGCCTCCGCGTCCCCGACCGCAGCAGCAAGGGCACGCTTGGCCCCGTTCTGTGCAGCGCGTTCA
+CCATAGAGCCGAGCACACATCGAGGTCAGGATCTCGGTCATATCGCCCACCAGGTCGTCATCAACCTCAG
+CCAAGTCGACCACCACCAATTCCCGGCCCTGGGCGACAAGAGCGGCCTCGACGTACTCAGAGCCAAACCA
+GCAGAACCGATCCCGGTGCTCCACCACGATCCGCGTCACCACCGGATCACCCAGCAGCGCAAAAAACTTA
+CGGCGATGTCCATTCAACGCCCAACCACCCTCGGCCACCACCTTGTCGACAGAGAGATGTTGCGATGTGG
+CCCACGCGGTCACCCGCGCGACCCGCCGATCCAGATCGGACCTCTGATCCGCTGACGATACCCGCGCGTA
+CACCAACGTCCGCCCGCGCCCAGACTCCTCGACTGCCGGATCGTTCACCAGAATGAGCCGACCCACTCGC
+TGCGCCGGAACCGGCAACAGCCCGGCTCGAAACCAGCGATACGCGATCACCCACGCAACACCGTTGCGCT
+CCGCCCACACCGCCAAATTCATCCATCTGTTCCTACAGCACACCACCGACAACTACCGACCACTCAAAAC
+GCAACAGTTGGCAGCCCTACGATCGGCCAGCGCCTGACGGGCGGCGTTATATCCAGGGATGAACGTGATT
+CCCGGCCCACCGTGACAACCGGCACTGCCCAGGTACAACCCGGCTATCGGGATCGGCTGGCCGATAAAGC
+CTTTCGGGCCAGGCCTGTTGGGGCCGATCTGGTCCGAGTGCAGCAGGGCATGGCAGTAGTCCCCACCCGG
+GGCACCGAACATCACACCCATGTGTTTGGGGGTAAAGGTGGTGTACCGGAGAATGCTGCCTTTGAAGTTC
+GGTGCCAACCTAGTGATCTTGTCGATCACGTTCTGCCCCATTTCGACCTTTGCCCGGCCGTACCCTCCGT
+ATTTTGAGCCACCCTCGATCGGGAACCACATTGCGAACGCCGACGCGGCCTGCTTACCCGCCGGGGCCAG
+GCTGGGATCATGCAGCGACGGGATCTGCAACACCACGGTCGGATCGGCCGGGACGATCCCACGCCGGCAA
+TCCTCCCACTGCTGCTGAACCTGCTCCGGTGTACAGAAAATGCCCATCGATGCCTGCATGCTCGGATCGT
+TGAGTGCCTGGTAGGGCGCCGCGAAGGCCGGTGGCTGCGCGAGCGCAAAATGCATCTGCAGATAGCTGCC
+GCGGTGGTCGATGCGCAAATAGCGATCGCGGATTTCCGACGGCAACACTGCCGGATCGATCAGCTCGTTG
+ATGGTGACGTCGGGTGCTATGGCGGAGACCACGATCGGGGAGGTCAAGGTGTCCCCCGCCGCGGTGCGCA
+CGCCCCGCACGCGGGCTGACGACCGACTATTGTCAACCACGATCTCGGTCACCTTGGAACGTAACCGGAC
+CTCGCCGCCGGTGCGTTCCAGCAATTGCGACAGATGGGTGGTAAGCGCGCCGATGCCACCGCGCAATTTC
+TTCCACCGCACGAAGTCGCCCTCCGGGACACCCAATCCGAAGGCGAGCGCGGCAGCGCTGCCCGGTGTGG
+CCGGCCCGCGATAGAGCGTGTTCACGGCCAGCACGGTCATCGACCCGCGCAGGGCGCCGTGCTTCTCGCG
+GTCCGGGAAATGGCGGTCCAACACGTCGGTGACCGATCCGAACAGCATGTCATCGATCGCTGACCGTTCG
+AATTCATTTGTGGCACAGGCATACATCTCGTCGAAGCTCTTGGGCAGAGTTCCGGCTTCGAAACGCCCCA
+GCGCCCGGGTCGGCGCCTGGCTCCACGCCAGCAGGCCCGCCATCCCGGTGACGGCGTCTGCCCCGTGCAC
+CCGATGGAGGTGGGTAAGCATCTTCGTCGGGTCGGTGAATTGGACCACCGGATCGTCCCCGACACCGCGC
+AACGCTACCGACATCACCTCCAGATCGACCGTCGGCAAGCTGTCCAGGCCTAACTCGCTGCTGACCGCCG
+AGGAGGTCGGGAACTGCACCGATCCGGCGATATCGAACCGGTACCCGTCGAACAGCTCCACCGTGGAGGC
+CATCCCGCCGGCGTAGCGCTTAGCGTCCAGACACGCGGTCCGCAGTCCGGCTCGCTGCAGCAGCACTGCC
+GCGGTCAGCCCGTTGTGCCCGGCGCCGATAACTATCGCGTCATAACCAGTCATACGCGTCTCCAGCAATG
+CAGGCTCGCACGCGCTCGATGTTTTGTCAATTATGACGAAACTGTGAGGGTAGTCCAGGTGTCGGAGATG
+CCGACGCGCAGCGACTCCAGTGCGACGTGGCAGACCCGCGCCAGCTCCCCGAGCGACCGGTCACTCCCAA
+GCATCCAGGCTTCCATCGCGCCGAACACCGCCGCGGCGACGCATCGTGCGGTGACGGCGATGTGCAATCG
+GGCATCGGGTGCACCCGCGATATCGCAGTTACGTCGCCGCAATTGGGCCTGGATGGCATCGGCGAAGTCG
+GCTTCCACCTCGCGCATATGGCGGACGATCCGGCTCGGCTCCAACTCGCCGCGCCGCAACGACGCAATCT
+TCGTCACTGCGTCAACGTCATAAGGAAACGAGAAGATAGCCGCTTGCACGGAATCGATGATCGATTCGTC
+GGCCGGTCTAGCATCCAGCGCCGCGCGAAACCAGTGCAGTCCGGCGTCGTAGTCGGCAAACAGCAAATCG
+TGCTTGGATCTGAAGTGGCGATAGAAAGTACGCAGCGACACCCCGGCGTCCTCCGCAATCTGCTCGGCTG
+AGGTAGCCTCGACGCCCTGGGCCAGAAATCGCACCAGGGCGGCCTGGCGCAGTGCCTCGCGAGTGCGTTC
+GCTGCGCGCCGTCTGCGGGGGCCGGACCATGACTGCAAGCTATCGTCAATTTTCGTTCTGTCAACATTGA
+CAAAACTGTTGGCCACGGCGAGACTGCGCGCATGGTGTCGCTTCTTGTTCACGCTGCGCTGGGAGTAGTC
+GTCATCGGCTGGATCGTCTCGTCGAACCCGAAGGTTTTCACCAGGCCGGCCGGCGGATCGTGGTTCTCGC
+TGCCGGAGTGTGTGTACTACGTCGTCGGTATTGCCTCGATCGCGCTGGGGTGGTACTTCAACATTCGTTT
+TGTGCAGCAGTACGCGCACGGAGCCGCCAACCCTCTCTGGGGTCCCGGCAGCTGGGCGGAGTACGTCCGG
+CTGATGTTCACCAACCCGGCGGCCAGTTCGGCCGGCCAGGACTACACCATTGCCAACGTGATCCTGCTGC
+CGCTGTTTTCCACCACCGACGGCTACCGACGTGGTCTGCGGCGGCCCTGGCTGTATTTCGTGAGCAGCCT
+GTTCACCAGTTTTGCATTCGCGTTCGCGTTCTACTTCGCCACCATCGAACGTCAGCACCGACACGAACGT
+TCCCGTGCGACGGTCGGCGCCTAGGCGGCGACTGGCTTGGTGGCCCGCCACCTCAGGCGAGCGCCCGCGA
+CATCGACGTGGATATCAGTGAATCCCACAGCTCGCAGCCGACCGGGGAGGTCCGCCGGGGCGATCGGAGT
+GTAGGTGTCGGCGATGTGTATTAGGCGAAACGGCAGCGACGGCACACCGTCGCTGCCGGCAAAGACGCCA
+CCTGGTTGCAGCACCCGGTACGCCTCAGCGAATAGCTGGTCCTGCAGTTGGGCGCTGGCAACATGGTGCA
+GCATCGTGAAACACACCACGGACGTGAAGTGATCATCGGGCAGCCCGGTCTGGGTGCCATCGCCGCGGAT
+GATGCGCGCCCGCTGGCCGTAGCGGCGGTTCAGGCGCTCGACCATCGAGTTGTCGACTTCAACGGCGGTG
+AGCGAGGCGGTCAGGCCAAGGAGCGCTTGCAGTGTCGCCCCATAACCGGGGCCGATCTCCAGCGTCCGGG
+GGCCGAGTTCGACGTGCTGCAACGCCCAGGGCAGGAGCTGATTGGCCACCGCTTTTTCCCAGCCTGCCGA
+GCTGCAATGACGCCGATGTAGAAGATTCATGGCCATGGCCCAGAACACTAGTTAGCCACCGGCCGGCAGT
+CTTCCGATATTCTGCCTTAATATGTCGGAAAACAGCCACCACAGGCTGGCCACAACCTCGTTGACGCTCC
+CGCCGGGAGCGCGGATCGAACGCCACCGCCATCCGTCACACCAGATCGTCTATCCGTCCGCAGGGGCGGT
+CTCGGTCACCACTCACGCGGGAACCTGGATTACGCCGGTAAATCGGGCAATCTGGATACCGGCGGGCTGT
+TGGCACCAACACAAGTTCCACGGCCACACGCAATTTCACGGCGTAGCGCTGGATCCGCAGCGCTATCGCG
+GCGGCCCGGCAACCCCGACGGTGCTCGCGGTCAATCCGTTGATGCGCGAACTCATCATCGCGTGTTCGCA
+GGCCGACCGAACCGACACCGACGAGCACCACCGGATGTTGGCCGTACTGCAGGATCAACTGCCAACAACG
+AGCATCCGCGAGCCACTGTGGGTTCCCTCACCAACCGATCGCCGGTTGCGGCACGCGTGCGCGTTGATCG
+CCGACAACCTGACCCAGCCCTTGACGCTGCAGCAGATCGGCGGCCGGATCGGTGTCAGCCAGCGCACGCT
+GAGCCGTCTGTTCAGCGACGAGCTGGGTATGACGTTCCCGCAATGGCGCACCCAGCTGCGCCTGCAACAT
+GCGCTCGTGTTGCTCGCCGAGCGCCACGACGTCACGTCCGTGGCGTCCGAATGCGGTTGGGCCACACCAA
+GCGCGTTCATTGACACCTACCGACAAGCCTTCGGACACACTCCCGGCCAAGCCGCTAAGCCAATGGCGGC
+GACCCGCCTCACCCGGCTCCGCCGCGCTCGCGATCGCCGCTAAGCGACCGGCTCCAGCACTTCGACACCC
+ACGAACGGAACCAGTGCGTCCGGGACTCTAACGCTGCCGTCGGGCCGCTGGTGGTTCTCCAGGATCGCAA
+CCAGCCACCGGGTGGTGGCCAGCGTTCCGTTGAGGGTGGCCGCGATCTGCGGCTTGCCGCTGGCATCCCG
+GTAGCGGGTCGCCAACCGGCGCGCCTGAAAGGTGGTGCAGTTCGACGTCGACGTCAGCTCGCGATAGGCC
+CCCTGCGTCGGAATCCACGCCTCGCAGTCGAACTTGCGGGCGGCCGACGAGCCGAGATCACCCGCGGCCA
+CGTCGATGACCCGATACGGCACCTCGATGCGTGCCAGCATCTGGCGCTGCCAGCCCAGCAGCCGCTCATG
+TTCGTGCTCCGCGTCGGCCGGTGTGCAGTAGACGAAGCCCTCGACTTTGTCGAACTGGTGCACCCGGATG
+ATGCCGCGCGTGTCCTTGCCATGGCTGCCGGCCTCACGTCGGAAACACGACGACCAGCCCGCATACCGCA
+GCGGCCCGCGGGAAAGGTCCAGAATCTCGCCGGAGTGATACCCCGCCAGCGGTACCTCGGAGGTGCCCAC
+AAGGTAGAGGCCGTCGCCCTCTACCCGGTACACCTCCTCGGCGTGGGCGCCTAGAAATCCCGTGCCTACC
+ATCACTTCCGGGCGCACCAGCACCGGCGGGATCGTAGGGACAAAGCCGTTGTCGACGGCTAGCTTCAGCG
+CCAGCTGCAGCAATCCAAGCTGCAGTAGGGCACCCCGACCGGTCAGGAAGTAGAACCGTGAACCCGACAC
+CTTGGCGCCGCGCTGCATGTCGATCAGGCCCAGCGACTCGCCGAGCTCCAGGTGGTCCTTGGGGTTCTCG
+AGGTAGCTGGGCTCGCCGACGACGTCGAGCACCGCGTAGTCGTCCTCCCCGCCGGCGGGTACCCCGTCCA
+CGATGACATTCGAGATCGCCAGGTGCGCCGCGGTGAACGCCGCCTCCGCTTCGACCTCGTCGGCCTCAGC
+GGCTTTGACCTGCTCGGCGAGTTCCTTCGCGCGCCGCAGCAGCGGCGGGCGCTCTTCGGGAGACGCGCCA
+CCCACGCTTTTGCTGGCGGCTTTCTGCTCGGCCCGTAACGAATCGGCGGTCGAGATCACGGCCCGGCGGG
+CGGCGTCGGCCGTCAGCAGGGCATCTACCAGCGCCGGGTCCTCGCCGCGGCTGAGTTGTGAGCGGCGTAC
+CGCGTCGGGGTTTTCACGAAGCAGCTTCAGGTCGATCACGGCCGCAAGACTACTTTTGACGCCCAGTCAG
+GGTGGCGGCAGAGGACCATCCACCCGCGATGAAGCGATCCCGCAAGCTGACAACTGCAACATTGGTCATG
+CGGCCCCGCCGACCCTGTCAGAATGGAGCGGATGTTGGACGCGCCCGAGCAGGACCCCGTCGATCCCGGC
+GACCCGGCCAGCCCCCCGCACGGGGAGGCGGAACAGCCGCTGCCCGGGCCTCGGTGGCCACGCGCCCTGC
+GCGCGTCGGCGACCCGGCGAGCGCTACTCCTCACCGCTTTGGGTGGCCTGCTGATTGCCGGGCTGGTCAC
+CGCGATTCCCGCCGTCGGCCGCGCGCCGGAGCGGCTGGCCGGCTACATCGCCAGCAATCCGGTGCCCAGC
+ACTGGCGCCAAGATCAACGCTTCGTTCAACCGCGTCGCCAGTGGTGACTGCTTGATGTGGCCGGACGGCA
+CGCCGGAGTCTGCCGCCATCGTCAGCTGTGCCGACGAGCACCGGTTCGAAGTCGCCGAGTCCATTGACAT
+GCGGACATTCCCCGGCATGGAGTACGGGCAAAACGCTGCTCCCCCGTCGCCCGCCCGCATTCAGCAGATC
+AGCGAGGAGCAGTGCGAAGCTGCTGTGCGCCGCTACCTCGGCACGAAGTTCGATCCCAACAGCAAGTTCA
+CCATCAGCATGCTGTGGCCCGGCGACCGGGCGTGGCGGCAGGCCGGTGAGCGCCGCATGCTCTGTGGCTT
+GCAGTCGCCCGGTCCGAACAACCAGCAGCTCGCCTTCAAGGGCAAGGTCGCCGACATCGACCAGTCCAAG
+GTCTGGCCGGCCGGTACCTGCCTGGGCATCGATGCCACCACCAACCAGCCGATCGACGTGCCGGTGGACT
+GCGCGGCACCGCACGCGATGGAGGTATCCGGCACGGTCAACCTGGCCGAGAGGTTTCCCGACGCGCTGCC
+GAGCGAACCCGAGCAGGACGGGTTCATCAAGGACGCGTGCACCCGGATGACGGACGCCTACCTCGCACCC
+CTCAAGTTGCGTACCACCACCCTGACGCTGATCTACCCCACGCTGACGCTGCCCAGCTGGTCGGCGGGTA
+GCCGCGTGGTCGCATGCAGTATCGGCGCGACCCTGGGCAACGGGGGGTGGGCAACCCTGGTGAACAGCGC
+TAAGGGGGCGCTGCTGATCAACGGCCAGCCGCCGGTACCCCCACCCGACATTCCCGAGGAGCGGCTCAAC
+CTGCCGCCGATTCCGCTTCAGCTGCCAACGCCTCGGCCCGCCCCCCCGGCTCAGCAGCTGCCAAGTACCC
+CACCAGGCACTCAGCACCTCCCTGCCCAACAGCCAGTGGTTACGCCCACCCGGCCACCCGAATCGCATGC
+GCCAGCGTCGGCAGCACCGGCCGAGACCCAGCCACCGCCACCAGACGCCGGAGCGCCGCCGGCGACCCAA
+TCACCAGAGGCCACACCGCCTGGCCCCGCCGAGCCCGCACCGGCAGGCTAGCCGGGTGACAGTACGGATG
+GACCCGCAGCGGTTCGACGAACTGGTGTCCGACGCACTCGACCTCATTCCGCCCGAACTGGCGGACGCCA
+TGGACAACGTCGTCGTGTTAGTCGCCAATCGCCACCCCCAGCACGAAAATCTGCTCGGCCAGTACGAAGG
+GGTCGCGTTAACCGAGCGCGGCTCCGACTACGCCGGATCGCTGCCTGATGCCATCACGATCTACCGCGAG
+GCGCTGCTGGACGCCTGCGACTCTGAGGATGAGGTCGTCGACCAGGTCGCCATCACGGTGATCCATGAGG
+TCGCCCATCACTTCGGCATCGACGACGAGCGCTTGGACCAACTGGGCTGGGCGTGACGAACCAGCGCCCG
+GGCGCGGCAACCCGGATTTGTCGGCACCCGATGCTATGAACGGCCCATGAGCACGGACTGCCGCGACTGC
+CGGGCGGGCTTGGATCACTGCCACGGCACCGTCATTCGTCATCCCTTGGCACGGCCGGAATGCACCGAGC
+CGGACTGTGTCAGCCCCGAGCTGCAACCCCATATCTTCGTCCTAGACTGCAATACCGTCAGCTGCGAATG
+CACTGAATCGGCCACGGCGCCCGGGTCCTTCAGATCAGCCCATCGGGTCGGTGCTTGACGTCACCGCGTG
+TGTGACCGGGCTGGCTGCGGCTTCAGCGGGGTCCGGACAAAACGGCGGCTTCCGGAGGCCCCACTGCACA
+CAACTCCATCGCCCATCGGTTATCGGGGCCAGCACCACCGACTCGACGTTTTCCAAGTGGTTGTCCAACA
+CAAAGTTGCCGTCCACCCCGGCAAGCACCGCGGCGGCCAGCCGGATCGCCGCGCTGTGGCTCACGACGAC
+GATGTCGCCGTCCCAGTCACCGTCGTCGAGGTAACGCATGCGCAGGTCGGCGAGCACCGGCAGATAACGA
+TCCAGGACGTCGTTGGCGGTCTCGCCACCGGGCAGCGGCACATCCAACTCCCCGCGATGCCAGCGGCTGT
+AGGTGGCGTTGAACTCGGCGACCGCCTCGTCGTCGTTGCGGTTTTCCAGCTCCCCTACCTGTACCTCGTG
+AATGCCGGCAACCTCGTGGGCCACCATGTCGAGTTCGGCAGCGACCACCGCGGCCGTCTGGTAGGCCCGG
+ATAGCCACCGAGTGTGCGAGCAGTGCCGGCCGGCGACAACCGCTGCGCGCGAACGCCCTGGCCTGATCAC
+GACCCAGCGGTGTCAGCGCCGTTCCCGGCGGCAGGGTATCCAACCTGCGCTCGACGTTGCCATAGGACTG
+GCCGTGCCGCAGCAGCACCAAACGACCGCTCATGCTTGCGCCCCCTGGTCGTCCGGGCGAACCAGGGTCT
+GCTCGGGTTTGCCCGCGCGGAGCCGCGCTAACCAGCGTGATGCTTCGTCTACCAGGGGCGGCTGCGCCCC
+TGCCGCTGGCCCCGTCGGCCAGGACCCCAGGTATCGCACATCAGCACAACGTCGGTGCACCGCCTTGAGT
+GCCTCGGCGACGGCCTCGTCGTCGATGTGGCCGACGCAATCCACGAAGAACAGATAGGTGCCAAGTTCGG
+TACGGGTGGGCCGGGATTCAATCCGAGTGAGATCGATGCCGCGGATGCCGAACTCGGCCAGCGCAGCTAC
+CAGCGCACCGGGCTGGTTGTCGATGCGCAGCACTGCAGACGTGCGATCGGCTCCGGTGCGCGCCGGAGGC
+GGCCCGGGCCGACCAACCAGGACGAAGCGGGTGCGGGCATTGGATTCGTCAACGACACCGTCGGCCAGGG
+CCGCCAATCCCCAACGAGCGGCCGCCAGCGGCGAGGTCACCGCGGCGTCAACCAAGCCGTCAGCCACCTG
+CCGGGCCGCGTCCGCGTTGGAATAAGCCGGCCGCAGGTCGGCGGCGGGAAGATGGGCCGCCAACCACTGC
+CGCACCTGTGCAGCCGCCACCGGAAAGGCCGCCAGGGTCCGCACGTCCGCGGCGTTGCGCCCGGGTTTGA
+CCACGATGCTGAACGTCACGTCCAGCGTTGTCTCGGCGAACACCTGCAGGCGCACACCGATGGCCAGGCT
+ATCCAAAGTAGGCAGCACGGAACCGTCGATCGAGTTCTCGATCGGCACGCACGCATAATCCGCACCGCCG
+TCGCGGACCGCAGCCAGTGCTGCGGGCGCGCTCTCGACCGGCATCCGCTGCAGTGCATCGGGCCCGGTCT
+CGGGAACTAGGCCGGCGGCCACCATCCGGACCAGGGCTGCCTCGGTGAATGTCCCTTCCGGACCGAGGTA
+AGCGATACGCACCACGCTCACAACCCTAACGACGCAAAGCCGACCGCCAACTCTTGCGACCAGACCGTGC
+ATTAGTTAACTTAGGCTTACCTAAACACAGGAGGTCGTGGATGCCGCCGCTCACCAGTCTCGCGCCGACT
+ACTGCCGAGCGAATTCGCAGCGCCTGCGCGCGGGCCGGGGGCGCCTTGCTGGTGGTTGAGCGGGAGGATC
+CGGTCCCCGTGCCCATACACCATTTGTTGTACGACGGGTCCTTCGCCGTGGCGGTTCCGGTCGATCGTGG
+CGAGGTGTCCGGTTCGCAAGCGCTGCTGGAGTTGACTGACTATGCGCCGCTGCCGGTGCGTGAACCCGTC
+CGTTCGCTGGTGTGGATCCGCGGCTGCCTCCACCAGATCCCGCCCGCAGAGCTGGTTGAGACCCTGGACC
+TGATCGCCACCGATAATCCGAATCCGGCCCTGCTACAAGTCGAGACCCCGAGGTCCGGGCCGGCCGATGC
+GGCGGAGACCCGGTATACCATGCAGCGGCTGGAGATCGAATCCGTAGTGGTGACCGACGCCACCGGCGCC
+GAACCCGTTACCGTGGCGGACCTGCTCGCGGCCCGACCCGATCCGTTTTGTGAAATCGAATCAACCTTGC
+TCTGGCACCTAGCCACCGCCCATGACGATGTGGTCGCGCGGCTGGTATCCAGGCTGCCGGCACCGCTACG
+ACGCGGACAGATCCGCCCCCTCGGTCTCGATCGGTACGGCGTCCGGTTTCGCATTGAAGCTCGCGACGGA
+GACCGCGACATCCGACTGCCGTTCCATAAGCCGGTGGACGACATGACCGGGCTAAGCCAGGCCATCCGGG
+TGCTCATGGGTTGCCCGTTCCGCAACGGGCTGCGCGCCCGCAGGTAGCAGGCACAGCCGCCGCTCGGCCG
+CGTTGGCCGGCTGCATCCAAAGGTTCAGCCACGTACGTTGTCTAGGTCCGGGGTTGGCATCCGACAACCC
+GACGACACTGATATCGATCCCGCGTGACTCTTATGTACCGATCCCTGGCCACGGCCGGGACAAAATCAAC
+GCCGCGTTCGCGCTGGGCGGGGGGCGGCTGCTGACCCAAACGGTCGAGTTGGCTACTGGCCTGCACCTGG
+ATCACTATGCCGAGGTCGGATTCAGCGAGTTCGCCGACCTCGTCGACGCCTTCGATCCGTTGGCCGGCGT
+CGATCTACCGGCAGGCTGCCAAACACTTGACGGACGTGCAGCGCTGGGCTACGTCCGGACTCGGGCCACA
+CCACGGGCCGATCTAGAGGGCTCCGACGTGCCGGTGCCAGCCGCCGCGTTCGAAACACAGCCCTAACGAC
+ACGCTGCCGAATATGACCCGTGTCGGAAATTAGGGCGACAAGAGTAATGCGGCTCAACATAGCCTTGCTT
+TACTTAGGCAAACCTGCCTTCAACCAGGAGGTTATTATCATCCTGTGGTAACTAGGAAAGCCTTTCCTGA
+GTAAGTATTGCCTTCGTTGCATACCGCCCTTTACCTGCGTTAATCTGCATTTTATGACAGAATACGAAGG
+GCCTAAGACAAAATTCCACGCGTTAATGCAGGAACAGATTCATAACGAATTCACAGCGGCACAACAATAT
+GTCGCGATCGCGGTTTATTTCGACAGCGAAGACCTGCCGCAGTTGGCGAAGCATTTTTACAGCCAAGCGG
+TCGAGGAACGAAACCATGCAATGATGCTCGTGCAACACCTGCTCGACCGCGACCTTCGTGTCGAAATTCC
+CGGCGTAGACACGGTGCGAAACCAGTTCGACAGACCCCGCGAGGCACTGGCGCTGGCGCTCGATCAGGAA
+CGCACAGTCACCGACCAGGTCGGTCGGCTGACAGCGGTGGCCCGCGACGAGGGCGATTTCCTCGGCGAGC
+AGTTCATGCAGTGGTTCTTGCAGGAACAGATCGAAGAGGTGGCCTTGATGGCAACCCTGGTGCGGGTTGC
+CGATCGGGCCGGGGCCAACCTGTTCGAGCTGGAGAACTTCGTCGCACGTGAAGTGGATGTGGCGCCGGCC
+GCATCAGGCGCCCCGCACGCTGCCGGGGGCCGCCTCTAGATCCCTGGCGGGGATCAGCGAGTGGTCCCGT
+TCGCCCGCCCGTCTTCCAGCCAGGCCTTGGTGCGGCCGGGGTGGTGAGTACCAATCCAGGCCACCCCGAC
+CTCCCGGCAAAAGTCGATGTCCTCGTACTCATCGACGTTCCAGCAGTACACCGCCCGGCCCTGAGCTGCC
+GAGCGGTCAACGAGTTGCGGATATTCCTTTAACGCAGGCAGTGAGGGTCCCACGGCGGTTGCCCCGACCG
+CCGTGGCCGCACTGCTGGTCAGGTATCGGGGGGTCTTGCCGAGCAACACCGTCGGCAGCAGCGGTGCAGC
+CCGCCGGATCCGCCAGACCGCGGCGGCCGAAAACGACATCACCACCGCACGGGATCGATCTGCGGAGGCG
+GGTGCGGCAATACCGAACCGGTGTAGCAGCGCCAGCAGCTTGTTTTCCACCAGCGAGCCGTATCGGACGG
+GATGCTTGGTCTCGACGAAGATCTTCACCGGCCGGTGCCAGTCCAAAACCAGCGAAACAAGCGCGTCCAG
+GGTCAGCAGACTGGTGTCGCCGTGCGAACCGTCGGGGCGCCAGCTGTCGTGCCACGCGCCGTACTCCAGC
+TCGCGTAGCTGGGCCAGCGTCATCGTGCTGACCAAGCCGGCTCCCGTCGAGGTTCGGTCCAGGCGGCGGT
+CATGCACACAGACCAGATGCCCGTCCCGGGTCAACCGCACATCACATTCCACGCCGTCGGCGCCCTCTTT
+GAGCGCCAGGTCGTAGGCGGCAAGGGTATGCTCCGGCCGAGCCGCCGACGCACCACGGTGAGCAACCACA
+AAGGGATGTCCGGCGAGCACCTCGTCGGCCCATGTCATGTCCACTATGCTGCCGGTTCCTGCCCGTCCAA
+CTCAACCGCAACAGAAGATGCCGGCGCGGAACGCCCGTCTGTGTTCACCACCACCCAGCGATGCGCTGGG
+CGTTCGACCGGCTTTTGCTCGAACCCCTCGAAGACCCGCGCAGCAGCGGCCACCGCGGCCGCCGCACACA
+GATACGCCAGCACCATCATGGTGGTGTTGTTGGCGATGCCCTGAGCGTCGGTGACCCAGCTGGTGGCGAA
+CGCGAACATCGATATCGCGTTGCTGACGATCCACACGATCCACCACACCACGATCGGCCTGCGCAGCCGC
+GTGTAGCGGTCCTCGACCAGCGCCAACTCGATGACGTACAGCGGAGCCCACAGCAGATTGACCATCGGCA
+ATAGGCAGCCGGCCCATAACTCACGGGCGGAACGCCGCTCCGGCAAGCCTTGATGCATAAACGCGGCGGC
+CCGACGGGCGACCAGCCACCGGACCAACAGGACAATGGTAGTGCCGGCCGCCGCAATCGCCGCCAAGCTG
+ACCAAAACCCCCAGCCAGACCGAGGCGCTGGCCACCACCGAGTTCAACAATGTGTTTCGGTTGATGACCA
+GCAACACATACCGCACCACAAACACCACGACCGCGATGCTGAACACCAGCAGGCTCACCAACAGCGTGGT
+GCGCACCGCCGCCGGCGATGGCCCTGCTTTCGCCGAGGCCGGCACGGGAGCCTGGTCGACATGGTCGGTT
+AGCCCCCACCGCGGTATCCCGGCGTAGTGGGGAGTAGGCCCACGTAACCGTGGGCCGTGCCGTGGCGGCG
+GTGCCGCCCCGGGTCGCACCGCTATCCACCGAAAACCTGGGGGAAGCCGCGGCGGTGTGCGCCGCGTGTC
+GGAGGCCGTCGGCACCTGCGGGCGCGCCGGTGTACGCCAGCGCGCCTCGGCCGGCATATCCGCCAACGGC
+GCCAGCAACATCCCCCGACAGCGTGGACACCACACGCGTTGCCGCTCACGGACGTTCCAGCGAGTTCCGC
+ACTGGGAGCACACTTGGATCACCAGACCAGCCTAGTGACTTCTCCGCCCCGCACCGGTACGGCATTGTCC
+GCGCCGTCAACAGGCGTTGAGGCAGGCTTCCGCGCTGGATTGGGCGCGCCCGGTCGCGGCACGTCCAGCA
+CGACACAGCTACCTACGACTATCCACAGTTTCCACAGCTTTATCCACAGCGGTAAGAATCCGACGAATGG
+CGTTAACACCGGCTCCATCCGTCAGCCAGGCCCACAACTGTGGATAACAGCGCCCGTCAATGCGTTCTCA
+TCGACAGCCTGGCAGGTACCCGAGCGAAATGGATTGTCGCACTAAGCATCCACATCTGCCCCGGCTGCAC
+CTAGCAGCCTGCCCGCCCGGGCCCGGCCTGCTCCTGCGATCGTCAAACCACACATTTCGCGGCGCTGCCG
+GCGCAGTATCCGGACGTCTTGTGGCGCTGCGAGGTACCAATTTTTCCCCACCATTCACCAGGAGTTATTA
+TCGCGTGCACGACACTTCGTTGTGACTTACCTCACCGTCGTGAGGTGAGCATGCAGGTGAAAGGCGACTG
+ATGGCCACACACTCGTACGGCCCAGGGTCTACAACGCCGCCGAACTCTGGCTCGCCGGAGTGGAACCACG
+CCTACGGCATTGCCGCTTTGCGGGCCGCCCTGATCGCTCTGGCGTTACTGGCGATTCTGGCCGTCATCGC
+TTTGGTTTGAGTCCCCGGCCACTCGGGTGGCACCGAGTCGGTCCGGACGCCCTGGTCAGAACCGGTTCTC
+GGATTTGGGTAACCCCCCTTGTGTCACTGCCGTTTCGGTGGTCACAGCACGGCAATTGTTGTGGGTGGCC
+TTTCATAGAACTGCGACATGGATTACCGCGGTCGTGAGGAAATCGTCGAGGCTGGTTGCACCCCCACGGA
+GCCAGCCAGAAATTCTGTAGATCAGAGTTGGCTTGATTATGAATCATGCTCTAGCACAGGGCAACTCGTG
+AGTGTGTTGAACACTACCGTCCTGTTCTGCGTTCCGGCACTCGAATAACCTCCCGTCCCACTCGAAATAT
+TGCGCAGCCTAAGATAAATCAGCTTCATAGCCGAATCCTTGCCTGGCAAAAGGACCGCGGTTATTGATTA
+ACTTGCGCAGCTCGATCGGATAGTCCAGGAATGGCACGAATTCCGGCTACGCATGCGCCCAGACAAAATT
+CCTTGAGCGCGAGCTCGGCGGCCTCCACGGTGACGGCGCCATGAATCCCGGCATCGACGAGACGCCCCGG
+GCTGTCTTGGATCGGCCGGCCCGAGGCGTCTTTGCGCCCGTCAAGGTCCACCCTGATAGCCAAATGCGCC
+AGCTGGCGGCAACCACCCCGTTGTCTTCGATCCGCAGCCGTAAACCGTCGTTCGTCGGCGCCCGTCGCCC
+AACGTGAACTGAGGGCGGAGAATCGGCCGGAATCTCGCCCTCAGTTCACGCTCGGCGCCGTTTGGCCTCA
+CCCAGTCAATGTGATCTGTGCGGGCGGGCGTTGGCGCGTAGCGAACCCCAGTGGCGCCGGCCCGCCAAGC
+ACGCCCCGGCGCGGCCAGCTCATCAGCGGCTACGCAAGCGCAACGGCGCCCGCGATGGGCTGTGGAAGAA
+CCCGGAGGATCTCACCGAACACCAGAATGCCAAGCTGTCGCGCTCATCTACTCAAAGAAGGCCTACGGCA
+CCTGTTTTCGGTCAAAGGCGAAGAGAGTAAGCAGGCACTGGACCGGTTGATCTTCTAGGCGCGGCCCCGA
+GTGAGCATACTTTGGTGGCTTGTATCTCTTGTAGTGCCGCTTTGACGGGGTGGTGGTCAGGTACGGTGGC
+CTCGGGAGAGGCTGGAGGGCTCGACGTTTGGGCTGAGTGTCTGGGCCCGTGAAAGAGATCGTCTGCTCCA
+GCTTTGTCTCCTGAACTGACCCGGTTTAGGGAATTGGTGGCCAGGTTGCGGAAGTGCGCAGCATCGACGT
+GTACCTGGGTGAGGCATCGAATCATCGACAAGCACCGGAGCCGCGCGTGAACTCCCGCCGTGTTGTGGTC
+GGGGATGATGTGGGAGACCGGCCGGCAGTGCTGTGTACGAAGGTTCTCCCACCGCAACGAGTTCACGCAC
+GACGGTCGGCTGGGTGGGCCCTGGAATGCGTGAACTCTTCATCAACACAACATGATTGACGATGAAGGGG
+AGAACCTCCATGCACAACAACGCTAACCCGTGACTGCCGAGAATCCAGGACGGAGCAGGCGGACGCTGGT
+CGGAATCGACGCGGCGATCACGGCCTGTCACCACATCGCGATCCGCGATGATGTCGGTGCGAGGTCGATT
+CGATTCAGTGTCGAACCCACGCTGGCCGGACTGCGCACCCTCACCGACAAGCTCAGCGGTTACGACGATA
+TCGACGCCACCGTGGAACCGACCTCGATGACGTGGCTGCCGCTCACGATCGCTGTCGAGAATGCCGGTGA
+CACCATGCACATGGCCGGCGCGCGGCATTGCGCCCGGCTGCGGGGTGCGATCGTGGGCAAGAGCAAGTCC
+GACGTCATCGACGCCGAGGTTCTCACCCGCGCCAGCGAGGTGTTCGACCTGACGCCGCTGACACTGCCGA
+CGCCCGCGCAGTTGGCGTTACGTCGATCGGTGATCCGACGTGCCGGCGCAGTGATTGACGCGAACCGGTC
+CTGGCGTCGGTTGATGTCGTTGGCGCGGTAGGCGTTCCCCGATGTGTGGACCGCGTTCGCCGGGTCGTTA
+CCGACCGCGACAGCGGTGCTGGGGCGTTGGCCCGACATCCGCTTGCTGGCCGGCGCACCGACCCGCAACT
+GGCGGCGTTCTACCACCGGCTGATGACCACCCAGAGGCATTGCCACACCCAGGCCACCATCGCCGTAGCC
+CGCAAGCTGGCCGAACGCACCCGGGTGACGATCACCACCGGCCGCCCCTACCAGCTGCGCGACACCAACG
+GCGACCCTGTCACCGCCCGCGGCGCGAAAGAACTGATCGACGCCCACTACCACGTCGACACCAGGACCCA
+CCCACACAACCGCGCCCACACTGACACCATGCAGAACTCGAAACCGGCACGCTGAACACCACTGTCGGCA
+GGGGATCCGGTTGCACACGCAACGGTCACTTGAGGCGATCGTCTCCATTCCTGGCTCCTTGCCGCCCATT
+GTTGTCGGCGAGCAAGGAGTCACAGTGGAGTCCCCGCAGCGTAGCGAGGAAAACCGACCTTGACGCCCGA
+CGAGCGGCAACGAGAACCGGCAACGAGGAATGGTCTTCGACAAGCCCACCGTGAGTTGTCTATCGGTTTC
+TCATTTTCAGCGTCTTTTCAGAGTCGCGCAACACAATCCGATGCCCGTCGAGATCCGTCGCGACTACACA
+CACACCCAGCATCTCGACCATCGCGACTCCGGCCGACGACGGCTAACGAGCAGCTTCGCCCCACCCGCCC
+CCGCAGCAACAACACAACGGCACGGCAGCAGCTGATCACTGCCCAAAACACGCACCCACATCAGATGCAG
+AACCCCTTGACAACCAATAGGGAATCTCTTCACGAATGAGGGGGCAGTTGGGGTTTGAATCCGCCGGTTT
+CCAGTAGGTATCTGTCGGCTTAGTTGGTGAGATTGCGAAAGCCGAGGGTCGATCCCCGGAGGTGCTCGAC
+GCGGCCGCTGATCGCTTCGGTCGGCGGGTTGACCGTGGTCACTGTTTTGGGCGTCGATCCACTGCGGGAA
+TTCCCACTACCACGTCCGGCCGGATCACCGGCGACTCGCGGTGCACGGCCCGCTCCAGCACCTCCTTGGT
+CAATTCGTTAGCCGTCCCCGCCAACTGCCCAGCCGTCGACTTCTTCTTGCCCACCCACCCCATAGACCTT
+CGCCACACAGCGCCTTCCGTCCACCCAACAGCGGTCCGATGACGGACCCCCGACGGGGACTTCAGCGACC
+AGGAACGCGCCCATAGACGTGGTATCAGCCTGGGGGCGTCCTGGTAGCCTATGCCGTCCGCCCTGGGGCA
+TCGACCCCAAGGTCGTTGTTGCGACGCGAGCGGTCATGGAGCAGGGTTGACTTGTCAAGCTAGAGCCAGC
+CCATCGCGTGGGAGGCACCCGCGCGAAAAGAAACATCGGACGATCATTTCATCGAAGGAAGGAATGCCGT
+GGCCGAATACACCTTGCCAGACCTGGACTGGGACTACGGAGCACTGGAACCGCACATCTCGGGTCAGATC
+AACGAGCTTCACCACAGCAAGCACCACGCCACCTACGTAAAGGGCGCCAATGACGCCGTCGCCAAACTCG
+AAGAGGCGCGCGCCAAGGAAGATCACTCAGCGATCTTGCTGAACGAAAAGAATCTAGCTTTCAACCTCGC
+CGGCCACGTCAATCACACCATCTGGTGGAAGAACCTGTCGCCTAACGGTGGTGACAAGCCCACCGGCGAA
+CTCGCCGCAGCCATCGCCGACGCGTTCGGTTCGTTCGACAAGTTCCGTGCGCAGTTCCACGCGGCCGCTA
+CCACCGTGCAGGGGTCGGGCTGGGCGGCACTGGGCTGGGACACACTCGGCAACAAGCTGCTGATATTCCA
+GGTTTACGACCACCAGACGAACTTCCCGCTAGGCATTGTTCCGCTGCTGCTGCTCGACATGTGGGAACAC
+GCCTTCTACCTGCAGTACAAGAACGTCAAAGTCGACTTTGCCAAGGCGTTTTGGAACGTCGTGAACTGGG
+CCGATGTGCAGTCACGGTATGCGGCCGCGACCTCGCAGACCAAGGGGTTGACATTCGGCTGACCCCGCTG
+CCGCAAGCGTCGGGCTCAGTATTCCGGAGTCGCGCATCACCATCGCCCTTATCCTGGCCTTATATTGCAG
+CTTTGTGAACACGGCCGCGGTGGCCGTGTCGAGTTGCAGGGCGCGTAAACCACGCGCATGCTTGGTTACT
+CGAGCTACCATTTATTTCGAGCTACCAGCGTGGTTAGGACGGAGGCGTCGCGGAGGGGCGAGATGGGTAC
+CGGGTCAGGTGGGCCTATTGGGGTTTCTCCCTTCCATTCGCGTGGTGCCCTGAAAGGGTTCGTGATCTCT
+GGACGTTGGCCTGATTCGACCAAAGAGTGGGCCCAGCTGCTGATGGTCGCAGTTCGGGTCGCGTCGTTGC
+CCGGCTTGCTCTCCACCACAACGGTGTTTGGTGCCCGCGAAGAGTTGCCCGACGAACCCGAGCCGGGGAC
+CGTCGGTCTGGTGCTGGCCGAGGGCACCGTCTTCGGTGAATCAGCAATTCAGCCAGGATATTTCGCTGAT
+CATCAACCCCCTGCATTGCTGATGCTGCATCCACCCTCGGAGACCACGCCGTCGCTGCCGGAATGCACCG
+GGGCGGCGTCAGGGTGCGTGCTGCTGCCGGGATTACCGTATCTGGGATTGGAACATCGTGCGGCTTGGGT
+GGAGGCTGAAGCCGACGGCACCATCACATCTATGGTGAGCCGGGTGGGCGTCGACCCGATAAGCCATCCC
+GACACCGCAATTCTGGCAATGCTGCTTGCAGCATAAGGAAATTCGAAGGAGTCTGTTCGGGCGGCGAATC
+GCCAAATACGGGTGGCCGAACTTGTCCGACATCCTGGTGCACACCAAATATGACCGCTAGCCTGGGGACG
+TTAGCGAAGGGGAGTAGTCCCGAATCGTCGAGTCGACATACTGGCGAAAAGCCCGGCTGGCGAACCGTTT
+GATACCAACGGTGGGCGAGACCTTCGACCGATGTTCGATGACCGACTGGTCGTCGACAACGCGTCGAAAG
+GTCGCCTGCCATGCTCGCCGCCACACTGCTAAGTCTGGGAGCCGTTTTCCTTGCTGAGCTCGGCGACAGA
+TCCCAGCTCATCACGATGACCTACACACTTCGCTACCGCTGGTGGGTGGTGCTGACCGGGGTGGCGATCG
+CAGCGTTCACGGTGCACGGGGTAGCGGTGGCGATCGGCCACTTTTTGGGCTCGACCGTGCCGGCCCGGCC
+GGCCGCCTGCGTATCGGCGATCGCATTCCTGATCTTTGCCGTGTGGGTCTGGCGGGAGGACACGGCCAGC
+GACAGCGAAACCTCGCCAACCGCTGCCGAACCCCGACTCGCGCTGTTCACCGTGGTCTCGTCGTTCGCAC
+TGGCTGAGCTGGGTGACAAGACAACGTTGGCGACGGTGACCTTGGCCAGCGATCACCACTGGGCCGGCGT
+ATGGATCGGCACCACCCTGGGCATGATCCTGGCCGACGGCCTGGCGATCGGCGCAGGGCTGCTGCTGCAC
+CGGCGCCTTCCGGAGCGGTTGCTGCAGGTCCTGACTGGCCTGCTGTTCCTGCTGTTCGGACTGTGGTTGC
+TGTTCGACGACGCGTTGGGCTTCAGATCGATTGCCATCGCCGTGACAGCGGCGGTGGTGCTGGCCGCGGC
+AACTACGGCGGTATCGGTGCGGGTGGCGCAAACTCGTCGGCGGCGGCCAACCGCTGCTGCAACACCAGAA
+GATGACTCGACACGCCCCGAGCGGTCGTCGGTCGCGCCGGGCCATCCCGGGAGCATCTTGCTACCGCTTC
+CGGAAGTGTCTTTGCGGGGGCGCCGACCGCCCTCAGGGTCGCCTGACGAGCGCTGTGCGGACCCAGGCAG
+CAAAGGAGGCTCTCGGCGAATCTCCGTTGGCTGCTGGTTGCCCGGAGTCGGCCGCATCCGCCCGACACGG
+TCATCCTGATCTGCTCGCCGAACACGTGGGCGACGGACCAACGCGCGTGTTTTCATCGGATATTCTGCGG
+ATAACCTGTGAAATCCGTTCGTCGTGTGGACACATCACCGAATCGGTTGGACCCTCATCGGGGGGGTCTT
+CGTTGACCCCTCACAACGTCAGCACCCAATCCGCTCAGGTTTGCACTTGGTTGTGGACACAACTGTCGCT
+ACCATGATCAGCAAATACATACAGATAACCGTTTGCTCTTGGAGCCCGGTGGAGGTCACATCGATGAGCA
+CGACGTTCGCTGCCCGCCTGAACCGCCTGTTCGACACGGTTTATCCGCCCGGACGCGGGCCACATACCTC
+CGCGGAGGTGATCGCGGCGCTCAAGGCAGAGGGCATCACGATGTCGGCTCCCTACCTATCACAGCTACGC
+TCAGGAAACCGTACGAACCCATCGGGGGCGACCATGGCCGCCCTGGCCAACTTCTTCCGCATCAAGGCGG
+CCTACTTCACCGACGACGAGTACTACGAAAAGCTCGACAAGGAATTGCAGTGGCTGTGCACGATGCGCGA
+CGACGGCGTGCGCCGGATCGCGCAGCGGGCCCACGGGTTGCCCTCCGCGGCGCAGCAGAAGGTGTTGGAC
+CGGATCGACGAGCTGCGGCGTGCCGAAGGGATCGACGCTTAGTCCCTGATACCGACCGCCCGCTCCACCC
+GACCTGGCGGGTTGGGGTTGGTCTGCCCCGATTAGGGTTGCCCCAGCGATCACCGCGATAGTCCACGAGA
+TACCGGGAGGCGGCCGGGAATGGGCCTGTTCGGCAAGCGAAAGAGCCGCGCGACCCGTCGCGCGGAAGCC
+CGCGCGATCAAAGCCCGCGCCAAGCTCGAGGCCAAGCTGTCGGCCAAGAACGAGGCGCGCCGCATCAAGG
+CCGCCCAGCGCGCGGAATCAAAGGCGCTCAAGGCGCAGCTGAAGGCCCGGCGGGACAGCGACCGGGCGGC
+GCTCAAGGTCGCCGAAGCCGAGCTCAAGGTAGCACGCGAAGGCAAGTTGCTGTCACCGACGCGGATTCGC
+CGGTTGCTGACGGTTTCTCGGCTCCTGGCCCCGATACTGACGCCGGTGATATACCGGGCCGCGATGGCTG
+CCCGCGGGTTGATCGACCAGCGGCGCGCCGATCAGCTCGGGGTCCCGCTGGCACAGATCGGCCGGTTCTC
+CGGTCATGGCGCCCGGTTGTCGGCGCGGGTTGGGGGAGCCGAGCGATCGTTGCGGATGGTGCAGGAAAAG
+AAGCCGAAGGACGTAGAAACCAAACAGTTCGTGTCGGCGGTGACCAATCGGCTCACCGATCTGTCGGCGG
+CCGTCGCGGCCGCGGAGCACATGCCCGCAAAGCGGCGCCGGACGGCCCACTCGGCGATCTCGTCGCAGCT
+GGATGGCATCGAGGCGGACCTGATGGCCCGGCTCGGGTTGACCTAACCGGCGGCCCGATGACCGCAATTG
+GCATGTCACATCCGCCTCGCGTGCATCGGCGGGTCGGCGGGCAGCGCACTGCACTGACCGCGGGCATCGG
+CCTCTTGCTGGCCGCCTTGGTGCTGACCACCATCGCGAACCCACCTGCGGCGTTTGCGCACACCGCGCAG
+CTGTCCACCGCTACGCCCGCACCCGCAGTCGCCGCCACCGACGCGAACGACGTCCCGACGTGGCCATTCG
+TCGTAGGGACCGTGGCGGCGGTTGCCGTGGCTGCATTGTGGGCCGTTCGGCGCGGGCGCTAACCAATCAA
+CCCCGGTAGCCCGGAAGGTGCGGCACCGTGTCCTGGCATGATGGGACCGAGCGTTTGCGATCTAGTGAGC
+GACGACAATGCTGCAAAGGAGCGGCCACATGCCAGACCCGCAGGATCGACCCGACAGCGAGCCGAGCGAC
+GCATCGACGCCGCCAGCTAAGAAGCTGCCGGCCAAGAAGGCCGCCAAGAAAGCACCAGCAAGAAAGACGC
+CGGCGAAGAAGGCACCCGCCAAAAAAACACCCGCCAAGGGTGCTAAGTCCGCGCCACCAAAGCCTGCCGA
+GGCGCCCGTCAGTTTGCAGCAGCGGATCGAAACCAACGGCCAGCTTGCAGCTGCTGCTAAGGATGCAGCG
+GCACAAGCAAAGTCGACAGTGGAAGGCGCCAACGACGCCCTGGCGCGCAACGCATCAGTGCCGGCGCCGA
+GTCACTCGCCCGTGCCGCTGATCGTTGCCGTCACGCTTAGCCTGCTGGCGCTGCTGCTGATCCGGCAACT
+GCGCCGCCGCTGAACGCGCTGGCACCATAGTGGCCATCTCATTTCGCCCAACCGCTGACCTCGTCGACGA
+CATCGGGCCCGACGTGCGCAGCTGTGACCTACAGTTCCGCCAATTCGGCGGCCGATCGCAGTTCGCCGGA
+CCGATCAGCACCGTGCGGTGTTTTCAGGACAATGCGTTGCTGAAGTCGGTGCTCTCGCAGCCAAGTGCGG
+GCGGTGTGCTGGTCATCGACGGCGCCGGGTCCCTGCACACCGCGTTGGTCGGTGATGTCATCGCCGAGTT
+GGCCCGCTCTACCGGCTGGACCGGGTTGATCGTCCACGGCGCGGTGCGAGATGCCGCCGCGCTGCGCGGC
+ATCGACATCGGCATCAAAGCGCTGGGCACCAATCCCCGCAAGAGCACCAAGACCGGTGCCGGAGAACGCG
+ACGTTGAAATCACGCTGGGCGGGGTGACATTCGTTCCGGGCGATATCGCCTACAGCGACGACGACGGCAT
+CATCGTCGTCTGACTATGGCCTAAACCGGCGCTAAACCGTCGCTAAAGCTAAACCCCCACCGGGGCAGGC
+CTTTTGGCGAACCGCAGACCCTCGTCGTCGATCTTGCCGCGCCGGATGAGCCGGATGTCACGTAGGTAGT
+TCTGATTCAGGCGCCACGGTGTACGCGAACCCTGCTTGGGCAGCTCGTCCAGCGAGCGCAGCACGTAACC
+TGGGGTGAACTCCATGAAGGGCCGCTCTTCGACATCTGAGCCCGGTCGCTCGACGACCACGGTGTCAAAA
+CCGTTGTCGTCCATGTAATTCAACAAGCGACAGACAAACTCCGACACCAGGTCGGCCTTCAGCGTCCAGG
+AGGCATTGGTGTAGCCAACCGTGTAGGCCATGTTGGGGATGCCGGAAAGCATCATGCCCTTGTAGGCCAT
+CGTCGTGGTGATGTCCACTTGTTGTCCGTCGATAGTCGCCGTCGCCCCACCAAAAAGCTGCAGGTTCAAC
+CCCGTTGCGGTAATGATGATGTCAGCCGGCAGTTCGCGACCTGAGTTCAGCCGGATTCCGGTCGCGGTGA
+ACCGTTCAATGGTGTCGGTCACCACCTCGACCTTCCCGTGACGAATGGCCCGGAACAGGTCGCCGTTGGG
+CACCAAGCACAATCGCTGGTCCCAGGGGTTGTAGTGCGGGCCGAAGTGCTTTCGCACGTCGTACCCCTCG
+GGTAGCTGGCGCTGGATCAGGCTCAGGAACATCTTCCGCATGCGCCGTGGCCACTTCTGGCAGGCGCTGT
+ACACGGCCGCCTGGCGCAGCACGTTCTTCCACCGTACCGCGGTGTAGGCCATGGTCTCCGGCAGCCAGCG
+GTTGAGCTTCTCGGCGATGCCGTCCCGGTCTGGCTGCGACACGATGTAGGTGGGTGAGCGCTGCAGCATC
+GTGACGTGCTTGGCGCCCGAGTCCGCCAGCGCCGGCACGAGCGTGACCGCCGTTGCGCCACTGCCGATCA
+CGACGATGTTCTTAGCGTCGTAGTCGAGGTCCTCGGGCCAGTGCTGCGGATGGATGATCGGCCCGACGAA
+ATCCTCCGAGCCGGCGAATCTCGGCGAGTAGCCCTCGTCGTAGTTGTAGTAGCCGCTGCACAGAAAGAGG
+AATTCGCAGGTGAGGGCGCTGAGCGTGCCGTGGCTTTGGATGTGAACGGTCCAGCGGTTTTCCGCGGTCG
+ACCAATCGGCACTGATCACCTTGTGGTGGAACCGGATATGCCTGTCGATTCCATACATGGCCGCGGTGCT
+CTTGACGTACTCGAGGATGGGCTTGCCGTCGGCGATCGCCTGCCGTCCGGTCCAGGGACGGAATCGGAAA
+CCTAGCGTGTACATGTCGGAGTCGGAGCGAATTCCGGGATAACGGAACAAATCCCAGGTGCCGCCCATGG
+ATTCCCGCTTTTCCAGGATGGCGTAGCTCTTGGTCGGGCAACGGTCCTGCAGGTGCCAGGCCGCGCTGAC
+ACCGGAGATTCCAGCGCCCACGATGACAACGTCGAGGTGCTCGGTCATGGATCCACGCTATCAACGTAAT
+GTCGAGGCCGTCAACGAGATGTCGACACTATCGACACGTAGTAAGCTGCCAGGGTGACCACCTCCGCGGC
+CAGTCAGGCTTCGCTGCCTAGGGGCCGGCGCACCGCGCGGCCGTCCGGCGACGATCGTGAACTGGCGATC
+CTCGCCACCGCCGAGAACCTTCTCGAGGACCGTCCGCTGGCCGATATCTCGGTCGACGATCTGGCCAAGG
+GCGCCGGTATCTCGAGGCCGACGTTCTACTTCTATTTCCCATCCAAGGAAGCGGTGCTGCTGACCCTGCT
+GGACCGGGTGGTCAATCAAGCCGACATGGCCCTACAGACCCTTGCCGAGAATCCCGCCGACACCGACCGC
+GAGAACATGTGGCGCACCGGGATCAACGTGTTCTTCGAGACATTCGGGTCGCACAAGGCGGTAACCCGAG
+CCGGTCAGGCCGCCAGGGCAACCAGTGTCGAAGTCGCCGAACTGTGGTCGACGTTTATGCAGAAGTGGAT
+CGCCTACACGGCCGCCGTGATCGACGCCGAACGCGACCGAGGCGCGGCGCCGCGCACCCTGCCGGCCCAT
+GAACTGGCCACAGCGCTCAACCTGATGAACGAGCGGACGCTGTTCGCGTCATTCGCCGGCGAACAGCCCT
+CGGTGCCGGAAGCCCGCGTGCTGGATACGCTGGTGCACATCTGGGTGACCAGCATTTACGGCGAGAACCG
+CTAAGCCGCACTCGGTCGGGGGTGCTCGGTCGATGCTCAGTGCCAAAGCGGCATGCAGATCTCACGGAGG
+TCCGGTGGACGATCTGGCAGCCGAAGTGGCGCCTTGGGTAGGCAATGGCGTGCGGTCATATAGGAGCGGG
+TGCATTCGCATGTCGGACACGTGGCGTTGCCGCCTGGTACCGCGGTGTTCGTGGCCGACAGCGGGCTAAT
+GCGACCCGGTCCACGCCAGGAGCGTGTCGGCCGGCCAGGTGTTGACGATCCGGTCGGCGGGCACCTCCGC
+GTCCAAGGCGCGCTGGGCGCCGTAGCCGAGGAAGTCCAGCTGGCCGGGTGCGTGCGCGTCGGTGTCGATG
+CTGAACACGCAGCCGATGTCGCGCGCTAGGTGCAACAGGCGCGTCGGTGGGTCTCGGCGTTCCGGACGGG
+AGTTGATCTCCACGGCGGTGCCGTGCTCACGGCAGGCGGTGAACACCGCCTCTGCATCGAACTTCGATTC
+TGGCCGGATGCCACGATTGCCGGCGATCAGCCGGCCGGTGCAGTGGCCCAGCACGTCGGTGTGACCGTTG
+GCCACGGCGCGCACCATCCGTCGCGTCATCGCTGCCGAATCCATCGACAGCTTGGAGTGCACGCTGGCCA
+CCACGATGTCGAGGCGGTCCAGCATCTCGGGTTCCTGGTCCAAGCTCCCGTCTTCGAGGATGTCGACCTC
+GATCCCGGTCAGGATGCGCAGCGGCGCGAACTTCTCGCGCAGCTCGTCGATCACGTCCAGCTGCTTGCGC
+AACCGGTCCGGAGACAGGCCGTTGGCGATCGTCAACCGCGGTGAGTGATCGGTCAATGCGCAGTACTGGT
+GACCTAGCGCCGCCGCGGTGGCCATCATCTCCTCGATCGGCGCGGACCCGTCCGACCAGTTCGAATGCAG
+ATGCAGATCCCCGCGCAATGCGGCACGGATCGCCCCTCCACCGAGATCCTCAGCGTCAGCGCGTAATTCA
+GCCAGCAGGTCCGGCTCGCGGCCAGACCAGGCCTGGGCGATGACTTTCGCGGTTTTGGGACCGATACCCG
+CCAGCGACTGCCAGCTGTTGGCCTGGCCGTGCCGCTGCCGCGCCGCGTCGTCAAGGCCCTCGATAATGTC
+GGCGGCATTGCGATAGGCCATCACCCGCCTCGGGTCGTGGCGGTTCCGGTCCTTGTAATAGGCGATCTGC
+CGCAGCGCTGTTACCGGGTCCATTATCGGGCTCACACCAGTTGCCCGAAGACGACCCCGGTGACAACCAC
+CGCGAAGCCGGCCATTTCGCCGAGGATGAGCAACGCCATTAACACCCCCGCACCCTTTGCGGGACGCTCG
+AATTGGTTCGCGGTGGCACGGCGCGCGCCATGGGTGACATAACTCGCCAACAGGATGGGTTTCGTATCAA
+ATCCGAGGGCACAGTTCATCGCTTCACTGAGTTTAGTTGGGACCTAGGCCCAGATGCCGTCGCGGCCTGG
+GGCGCCATTGCCCTAGATAACAATCTGATAAAGCGGAGCAAACAAGCTGTGGTGCACACTCGGGCACGTA
+TCAGGTTGGCTACACAGCGAAGCGCAACAGCTCTTCAGTGGTTATCAGGCGCTCGTTCTTGGCGGGGAAC
+TCGTGGCTTTTGACCGGGTGGCGAAACCATGACCAGGCGATTCGCCCCATCCGTGACCGGGGTACTGGGT
+TGGTACGCACAGCGACACTCCTGCGATCGGACAACTCGACTGGCACCTCACATTAAACCTCTATGTGACG
+AAGCCCACATCGACTCATTAGACACCTCGGAGCTGGCAAACAGTGAACGGCGCGCCGAGCAATTATCAAA
+TGTTTCTGATGTGACTCTAGTGATTATTGAAGCGGTGCAGCGGTCGGCTTAACAGGCGCCGGCAGGGCAC
+TGGAACCCATCAAGTACCGGTCTACGGCCGCGGCAGCGGCCCGGCCCTCGGCAATCGCCCAGACGATCAA
+TGACTGGCCCCGGCCCATGTCACCGGCTACGAACACACCAGGAACCGAGGTGTCGAAGTCGTCGCCACGG
+GCCACGTTCCCATGCTCGGTGAACTTCACTCCGAGGTCGGTCAACAGGCCCGCCCGTTCCGGGCCGACGA
+AACCCATCGCCAGCAACACCAGGTCGGCTTCGAGCTCGAAGTCGGAGCCCTCAACCTTGACGAACTTGCC
+ATCCAGCATGGTCACTTCGTGTGCCCGCAGCGCGCTCACGCGCCCGTCCGTGCCGACGAACGCCTCGGTG
+TTGACCGAGAACACCCGCTCGCCACCCTCCTCATGCGCGGCCGATACCCGATACATCAGCGGGTAAGTCG
+GCCATGGGGTGGATTCGGCGCGGGCGTCCGGTGGACGCGGCATGATCTCGAACTGGTGCACGGCGATCGC
+GCCCTGGCGGTGCACGGTACCCAGGCAGTCCGCCCCGGTGTCGCCGCCACCGATGATGACGACCTTCTTG
+CCCTTTGCGGTGATCGGCGGCTGCCCGTCCTCATCGAGGACGTCATCTCCTTCTTGCACCCGGTTGGCCC
+ACGGCAGAAACTCCATCGCCTGATGGACGCCCTCCAGCTCGCGGCCGGGAATCGGCAGCTCGCGCCAAGC
+GGTTGCGCCACCGGCCAATACGACCGCATCGAAATCAGCGCGCAGCTTTTCGGCGCTAATGTCGACCCCG
+ACGTTGACGCCCGGCCGGAATTCGGTTCCTTCGGAGCGCATTTGGTCCAAACGCCGATCAAGATGCCGCT
+TTTCCATCTTGAATTCCGGGATGCCGTAACGCAGCAGCCCGCCGATGCGGTCTTCGCGCTCGAAAACGGT
+GACGGTGTGACCCGCCCGGGTGAGTTGCTGGGCGGCGGCCAAACCCGCCGGCCCCGAACCCACCACAGCA
+ACCGTTTGCCCGGTCAGCTTCCGCGGCGGACGTGGTTGCACCCATCCTTCGTCGAAGGCCTTGTCGATGA
+TCTCCAGCTCGATCTGCTTGATCGTCACCGGATCCTGGTTGATGCCCAGCACACACGCCGGCTCGCACGG
+AGCCGGGCACAACCGGCCGGTGAAGTCGGGGAAGTTGTTGGTGGCGTGCAGCCGTTCGATTGCGTCGCGC
+CAGCGGCCCCGGCGGACCAGATCGTTCCATTCCGGGATCAAGTTACCCAGCGGACATCCGTTGTGACAGA
+ACGGAATGCCGCAATCCATGCAGCGGGTCGCCTGTTGGCGCAGGCTCTCGTTGTCGAATTCCTCGTAGAC
+TTCCCGCCAGTCTCGCAGCCGCAGCGGGACCGGCCGTCGCTTCGGCAATTTCCGGTGGGTGTATTTGAGG
+AAGCCGCCCGGATCAGCCATGCGCAGCCGCCATGATCGCCTTGTCGACATCAACGCCGTCACGTTCAGCC
+AGGGCGATCGCCTGCAGGACCCGTTTGTAGTCACGCGGCATCACCTTGACGAAGTGGCGCTGCTGTCCCG
+ACCAGTCGGACAGAATCCGCTGGCCGACAGCGGAATCGGTAGCGTCGACGTGCACTTGTATGGTGCCGTG
+CAGCCAGTCCGCGTCATCCTCGTCGAGGGTCTCGAGTTCGACCATCTCCGAGTTGAGGTTGGCCGGCAGT
+TCACCGTCGGGATCGTAAACATAGGCCACACCGCCGGACATACCCGCCGCAAAGTTACGGCCGGTGCGGC
+CCAGAATGACAACCCTGCCGCCGGTCATGTACTCGCAGCCGTGATCGCCGACACCCTCTACCACGGCGTG
+GGCCCCGGAATTGCGCACCGCGAACCGTTCGCCTACCACACCGCGCAGGTAAACCTCGCCACTGGTTGCG
+CCGAACAGAATCACATTGCCCCCGATGATGTTGTCCTCGGCGACATAATCCTGCGGCGCGTCATCCGACG
+GCCGCACCACAATCCGGCCACCGGATAGCCCTTTGCCGACGTAGTCATTGGCGTCGCCATACACCCGCAA
+GGTAATTCCCTTGGGCACGAAGGCTCCGAAGCTGTTTCCCGCGGATCCGTCGAACGTGATATCGATGGTT
+CCGTCCGGCAAGCCTTGGCCGCCATAGGCCTTCGTCAGCTCGTGGCCGAGCATGGTGCCCACCGTGCGGT
+TGACATTGCCTATGGTGGTGGAGAAGCGGACCGGCTTGCCGGAATCCAGTGCTTCCCTGCTCATCACGAT
+CAGCTGCTGATCGAGCGCCTTGTCTAGACCGTGATCCTGGCGCGAACTGCAGTACAGATCCTGATTCATG
+AAGGCCGACTCCGGCTCGTGGAGCACCGGCGCCAGATCCAGCTTATGCGCCTTCCAGTGCGCGCGTGCCA
+GCGTGGTGTCCAGCGCACCTGCCTGTCCAACCGCCTCGTTCACAGTGCGGAAGCCCAACTGCGCCAAATA
+TTCCCGGACTTCCTCGGCGATGAACATGAAGAAGTTCTCCACGAACTCGGGCTTCCCGGTGAACCGCTCC
+CGGAGCAACGGATTCTGGGTGGCCACACCAACCGGGCACGTGTCCAGGTGGCACACCCGCATCATGATGC
+AGCCGGCCACTACCAACGGCGCGGTCGCGAATCCGAACTCTTCTGCCCCGAGCAGCGTAGCGATCATCAC
+ATCGCGACCCGTCTTGAGCTGACCGTCCACCTGGACCACAATTCGATCACGTAACCCGTTGAGCAGCAAC
+GTCTGCTGTGTCTCAGCCAGACCCAACTCCCAGGGTGCTCCGGCGTGCTTCATCGATGTCAGCGGGGTCG
+CGCCGGTGCCACCATCGTGCCCTGAGATCAAGACCACGTCGGCGTGGGCTTTGGAAACGCCAGCCGCAAC
+CGTCCCTACCCCGTTTTCGGAGACCAGCTTGACGTGTACCCGCGCGGATGGATTGGCGTTCTTTAGGTCG
+TGGATCAGCTGCGCCAGATCCTCAATGGAGTAGATGTCGTGGTGGGGCGGCGGTGAGATCAGACCGACAC
+CGGGCGTGGAGTGCCGGACCTCGGCCACCCAAGGGTACACCTTGTGCCCCGGAAGCTGACCTCCCTCACC
+AGGTTTCGCGCCCTGCGCCATCTTGATCTGGAGGTCGGTGCAGTTGGTCAGGTAATGCGAGGTGACGCCA
+AACCGGGCGGAGGCTACCTGCTTAATGGCGCTTCGGCGCCAATCCCCGTTGGGGTCGCGGTCAAATCGCT
+TGACGTCCTCGCCGCCTTCACCACAGTTTGACCGGGCACCAAGCCGGTTCATTGCGATGGCCAGCGTCTC
+GTGCGCTTCAGCGGAAATCGAGCCGTAGCTCATCGCCCCCGTTGAGAAGCGCTTGACGATTTCGCTGGCC
+GGCTCGACCTCGTCCAGCGGGACTGGAGGACGAACCCCGGTACGGAACTTGAGCAGACCACGCAGCGATG
+CCATCCGCTCGCTCTGGTCGTCGACCAGACGGGTGTACTCCTTGAAGATCTTGTACTGGCCGGTTCGCGT
+GGAGTGCTGCAGCTTGAACACAGTCTCCGGGTTGAACAGGTGGTACTCGCCCTCGCGGCGCCACTGGTAT
+TCCCCACCCACCTCGAGTTCGCGGTGAGCGCGTTCGTCCGGCCGGTCCAGATAGGCCAGCCGGTGCCGGG
+CTGCGACATCGGCCGCGATGTCATCCAGGGTGATCCCGCCGGTGGGGCAGGTAAGCCCGGTGAAGTATTC
+GTCGAGCACTTGCTCGGAGATGCCGACAGCCTGGAACAGTTGCGCACCGGTGTAGGAGGCCAGCGTCGAG
+ATGCCCATCTTCGACATCACTTTCAGCACACCCTTACCTGCGGCTTTGATGTAGTTGTTCAGCGCCGCCG
+TACGGTCGATGCCCTCGATAACACCGCGGTCGAGCATGTCCTCGATCGACTCGAACACCAGGTAGGGGTT
+GATCGCGGCCGCGCCGAATCCGACCAGCGCGGCCATGTGGTGCACCTCGCGGGCATCACCGGACTCGACC
+ACCAGACCCACTTGGGTGCGGGTCCGTTCCCGAACCAGGTGGTGGTGCACTCCCGCAACGGCGAGCAGCG
+ACGGTATCGGAGCCATTTCCTCGTCGGACTCGCGGTCGGACAAGATGATGATCCGAGCGCCGTCGGCGAT
+TGCCGCCGCCGCCGCGCCACGTACCTCTTCCAGCGCGGCAGCCAGCCCAGCACCTCCCTCGGAGACCCGG
+TACAGACAGCGAATCACCTTGGACCGCAATCCGTGTGGGCGCCCATTGACCTTGTCGTTGGGATCGAGGC
+TGACCAGCTTGGCGAGCTCGTGGTTACGCAGAATCGGCTGGGGCAGCACGATCTGGTGGCAGGAGTTCTC
+GTCCGGGTTGAGCAAGTCACGTTCGCCGCCGGTGGTGCCCTGCAGGCTGGTCACCACCTCCTCGCGGATG
+GCGTCCAACGGCGGGTTGGTCACCTGGGCGAACAGCTGATGGAAGTAGTCGTAGAGCATGCGCGGACGCT
+GCGACAACACCGCAACTGGAGTGTCGGTGCCCATCGACCCGATTGGCTCGGCACCGAGCCGAGCCATCGG
+CGCTACCAGCAGGTTGAGCTCCTCGTAGGTATAGCCGAATGCCAACTGCCGCATGACGATTCGATGGTGG
+GGCATCCGCACGTCTTTGCCCTCCGGCAATTCGTCGAGCGGAACTAGTCCGTTGTCAAGCCACTCCTGAT
+ACGGATGCTCGGCCGCCAGGTCGGCCTTGATCTCCTCATCGGAGACGATGCGGCCCTGCGCGGTGTCCAC
+CAAGAACATCCGGCCCGGCTGCAGCCGCATCCGGCGCACCACCGTCGACGGATGCAGGTCCAACACACCG
+GCCTCGGAAGCCATCACCACCAAACCGTCGTCGGTGACCCAGATTCGCGACGGGCGTAGGCCATTGCGGT
+CCAGCACGGCGCCCACGACGGTGCCGTCGGTGAACGTCATCGACGCCGGGCCGTCCCACGGCTCCATCAA
+CGAGGCGTGATACTGGTAAAACGCCCGCCGCGCGGGGTCCATCGACTCGTGGCGCTCCCAGGCCTCAGGG
+ATCATCATCAGCACCGCGTGGGCCAGGCTGCGTCCGCCCAGGTGCAGCAGTTCGAGCACCTCGTCGAAGC
+GCGCGGTGTCCGAGGCACCCGGGGTACAGATCGGGAACAGCTTTTCGACATCGGCCGCCGACCCAAAGAT
+GTCGGTCTTGATCAGCGCCTCGCGGGCCCGCATCCAGTTCTCGTTACCGGTGACGGTGTTGATCTCCCCG
+TTGTGCGCGATCCGCCGGAATGGATGCGCCAGCGGCCAGGACGGGAAAGTGTTCGTGGAGAACCGCGAGT
+GCACGATGCCTAGCGCGCTGGTCAGTCGCTCGTCCTGCAAATCGAGGTAGAAGGCCTTGAGCTGCGGGGT
+GGTCAGCATGCCCTTGTAGACGAGCGTCTGGCCGGACAGGCTCGGGAAGTACACGGTTTCCCGGCCCGGC
+CCGTCTTGACCCGGACCCTTGGTGCCGAGTTCATGCTCGGCCCGCTTGCGGACCACATAGCAGCGCCGCT
+CCAACGCCATGCCGGACGCGCCAGCCAAGAACACCTGCCGGAAGGTGGGCATGGCATCACGGGACAGCGC
+GCCCAGCGATGAGTCGTCGGTGGGGACGCTGCGCCAACCCAGGACTTGCAGCCCCTCGGCCTCGGCGATT
+TTCTGTACGGCGGCGCAGGCCGCGGCGGCGTCTTTAGATGACTGCGGCAAGAACGCGATACCCGTGGCAT
+AGCTGCCTGGGGCAGGCAACTCGAAATCCACGGCTTCGCGAAGGAATTCGTCCGGAACCTGAATCAGGAT
+GCCCGCGCCGTCACCGCTGCGGGGTTCGGCGCCTTGCGCGCCCCGATGCTCGAGGTTGAGCAGGGCGGTG
+ATCGCCTTGTCCACGATGTCGCGGCTACGACGGCCGTGCATGTCCACAACCATGGCAACCCCGCACGAAT
+CGTGTTCGAACGCGGGGTTATACAACCCGACGCGCTTAGGCGTCATACCCACCTAACCCTTCAGCAGACT
+TTCTGCGCGGCCGCCTTTGCGGATTCGACGGGGCCGCACCCGGAGGTAGCGGGCAAGACCCCTTCGGTCT
+TGTCGATAGGCTGTCCGTCAAGCGGGCGTGATCCGGTCGGGGCTTCGTCCGTGCAGCAGTGAACGCTTGG
+CCCTGGAATCGGACTCGACAAGTCGTAAAACGATATGACAAAACCCGCTTGACATGCCAACTTTCCCAAT
+ACTAACTCGTCAGCCGGCGGCACCGTAGCTGCCGCGTGGCCAGCAACCGACCGTATCGTCACATGCATTT
+TTCCTCGTCCAAATCCGGCTGCGCTAGCTGCGTGGCGGTCTGATCGCCAGCCACAGGAAATGCTTAGATA
+CGTTTGCTGTGAAATCCGGAGCACCGCTGTTTCGCCACTTGCGCCGGTGGGAACAACCGCCGGAACGGCG
+GGTATCTGTGTTGTTGCATGGCGATGCCGCCGCGACGACTACCCAGCGCAACCCCCCAGAGTTTGCGCGA
+TACTAAAAGGGGTCTAAAAAGGGCGTCTAGACAGCCAGCAGTCAGTCCAGGGAGCTAGCCGATACGGGAC
+GATATTGGTCGGCGTCCGGCATGGGCGATCTTACCGTGGGGCTCATCAGCCGCGAGCTCGCCTCAGCCGG
+CCACCGGCGCGACAATCGATCGCCTGTCACCTGAGGAGCTTATGTACGAGCGTGACGAATTCCTGCGCGA
+TCGGATCCGACCACACCAGCCCGGCACCCCGCGGGGATACTCGCCCCGTCCGCCGTCCGGAGATCGCTGC
+CCCGCGCCACCGCCTGGCCGGCACGCTGCTGCCGCTACGCCACCAGGGCCGCCGCGCCTGCCTTCAGCTC
+CACTGCGTCCATTGCCGGACCCGGCTTGGCCACGCCAGCCGGAGGCCCCGCCACCGAGCACCTGGGCCGA
+CCCCGCCCTGGCGCCGATACGCAGTCGGACGCGACCCGGCGAGCGTGGTTGGCGACGCATGGTGCGGCTG
+GTCACCTTTGGCCTTGTCGGCCTGGGCCGGTCGGGCATGCAGCGCCAGGAGGCCCAATTCGAAGCAACGA
+TACGAACCGTCCTGCATGGCAACCACAAGGTCGCCGTGCTGGGCAAAGGAGGTGTGGGAAAGACGTCGGT
+TGCGGCGTGCGTCGGATCGATCCTTGCCGAACTGCGCCAGCAGGACCGTATCGTCGGGATCGACGCCGAC
+ACCGCCTTCGGCAGGCTGAGCAGCCGAATCGATCCTCGAGCAGCTGGTTCGTTCTGGGAGCTGACCACCG
+ACACGAATCTGCGGTCCTTCACCGATATCACCGCGCGCCTGGGCCGAAATTCCGCGGGACTGTACGTCCT
+GGCAGGCCAGCCGGCATCCGGTCCGCGCCGGGCGCTCGATCCGGCCATCTACCGCGAAGCCGCCCTAAGG
+TTGGATCACCATTTCGCAATCTCGGTGATCGACTGCGGTTCCTCCATGGAGGCGGCGGTCACCCAGGAAG
+TATTGCGCGATGTGGATGCTCTGATCGTGGTGTCCTCGCCCTGGGCGGATGGTGCCTCCGCTGCCGCCAA
+CACCATCGAATGGCTGTCGGATTATGGCCTGACAGGTTTGTTGCGACGCAGCATCGTGGTGCTCAACGAT
+TCGGACGGACACGCCGACAAGCGCACCAAGTCATTGCTGGCCCAGGAATTCATCGACCACGGGCAGCCTG
+TGGTCGAGGTGCCCTTCGATCCCCATTTGCGGCCCGGGGGGGTCATCGATATGAGCCACGAAATGGCCCC
+GACGACGCGGCTGAAAATCCTGCAGGTCGCCGCGACGGTGACGGCGTACTTCGCGTCGCGACCCGCCGAC
+GCACACGGCAGCCCGCCCCGGTGACCTGGCTGGCTGACCCGGTCGGCAACAGCAGGATCGCCCGAGCGCA
+GGCCTGCAAAACGTCAATCTCGGCGCCCATCGTCGAATCCTGGCGGGCGCAACGCGGCGCGCAATGTGGA
+CAGCGCGAGAAATCTTGTCGATGTTCTCGCGCTGTCCACATCCAGGGCATCTCACCGCCACTGTTCCGCA
+GACCCCTCGAACCAGCGGTCCAGGCGGCGGTTGCGTCATGCCGATTGGGCAGACACCCGGTGGTCGCGCA
+CCGGGTAACCGTTGCGCTCGGCCAGGGATCGCAGCTGGCCCAACGCGAATGCCCGCGCCCGGCCTGATTC
+GGGAATTACGACCCCTGCCCACAGCCCTTCCGCACCCGCGGACTCGACGGCGTCGCGTGCACACAGCCAC
+CGGCGCGGGCAAGCCCGGCACAGGGTCTTGGCCTCGTCGTCGGGAGTCGTCGTCCAACGATCGGGATCTT
+GCGTGCAAACGCCGAGCGGGACCTCATACAGGGCGGTTACTGTCATGTCTACGTTCCTCCAGAAAGCGTT
+GCAGGTTGTAGCCTCTGCCGCGAAAGCGTATCGCATTAACCATAGCGATGCAACAGTTTCCTCCTCTGCC
+TGCCTAGCGGTGCTGCGGCTCCGGTTCGGCGAGCTCCGAGTCTAGTGCGCGCACCGCCGAGTACCAGGGC
+ATAGATCCTGTTAATCAGCTGTGTATCTGGCCTCGCCGGCGCGTATCCGACCCCTTCGGGCAGATCTTCC
+AGGAAAAGTGTTCTGACATGCGACAGTTCAGGTGTAAAGTGAACTGTAGCGGCAGTTCGGTTTGGCTAGG
+AAACTATTTCCATAGCGGGCCGTCGCGTCGCTAGATCCAAAATGTAGCGAAGTCATAGCAGTAGAAGGGT
+GCAACGGTTAGGATGGCGGGCGAGCGGAAAGTCTGCCCACCGTCCCGGCTAGTACCCGCGAATAAGGGAT
+CAACGCAGATGTCTAAAGCAGGGTCGACTGTCGGACCGGCGCCGCTGGTCGCGTGCAGCGGCGGCACATC
+AGACGTGATTGAGCCCCGTCGCGGTGTCGCGATCATTGGCCACTCGTGCCGAGTCGGCACCCAGATCGAC
+GATTCTCGAATCTCTCAGACACATCTGCGAGCGGTATCCGATGATGGACGGTGGCGGATCGTCGGCAACA
+TCCCGAGAGGTATGTTCGTCGGCGGACGACGCGGCAGCTCGGTGACCGTCAGCGATAAGACCCTAATCCG
+ATTCGGCGATCCCCCTGGAGGCAAGGCGTTGACGTTCGAAGTCGTCAGGCCGTCGGATTCCGCTGCACAG
+CACGGCCGCGTACAACCATCAGCGGACCTGTCGGACGACCCGGCGCACAACGCTGCGCCGGTCGCACCGG
+ACCCCGGCGTGGTTCGCGCAGGGGCGGCCGCGGCTGCGCGCCGTCGTGAACTTGACATCAGCCAACGCAG
+CTTGGCGGCCGACGGGATCATCAACGCGGGCGCGCTCATCGCGTTCGAGAAAGGCCGTAGTTGGCCCCGG
+GAACGGACCCGGGCAAAACTCGAAGAAGTGCTGCAGTGGCCCGCTGGAACCATCGCGCGAATCCGTCGGG
+GCGAGCCCACCGAGCCCGCAACAAACCCCGACGCGTCCCCCGGACTCCGGCCTGCCGACGGCCCGGCGTC
+CTTGATCGCGCAGGCTGTCACCGCCGCCGTAGACGGCTGCAGTCTGGCTATCGCAGCGTTGCCGGCGACC
+GAGGACCCCGAGTTCACCGAACGTGCCGCGCCGATCCTTGCTGATTTGCGCCAGCTCGAGGCGATTGCCG
+TCCAAGCAACCCGCATCAGCCGGATTACCCCGGAATTGATCAAGGCGTTGGGCGCGGTACGTCGCCACCA
+CGACGAATTAATGAGGCTGGGAGCAACCGCCCCTGGTGCCACACTGGCGCAGCGCTTATATGCCGCACGG
+CGGCGCGCGAACCTTTCCACCCTGGAGACTGCCCAAGCGGCCGGCGTCGCAGAAGAAATGATCGTCGGCG
+CCGAAGCCGAGGAAGAGTTGCCAGCCGAGGCCACCGAAGCGATCGAAGCACTGATCCGTCAGATCAATTG
+AGGTCGGCTCCGAGCGTCCCACAAGTACAGGCACGCCGTAACGCTCAAGTTCAACGGTCCGGGGAACGCG
+CGCGTTCTCCGGCGTTTGACGGTGCGTTCCATCGTGCCGCGAACTTGAAAACGCCAGCGTCACCAAAAAA
+TTCGTGCACCAACCCCCCTCCGAGCGCTGCTAAGCTCAATGTGCAGTGCAAAGGTGCAGATAATGATGGC
+GCACCGGAACGGCGAGCGTAAGGAAACACATAAATGGCATCGGGTAGCGGTCTTTGCAAGACGACGAGTA
+ACTTTATTTGGGGCCAGTTACTCTTGCTTGGAGAGGGAATCCCCGACCCAGGCGACATTTTCAACACCGG
+TTCGTCGCTGTTCAAACAAATCAGCGACAAAATGGGACTCGCCATTCCGGGCACCAACTGGATCGGCCAA
+GCGGCGGAAGCTTACCTAAACCAGAACATCGCGCAACAACTTCGCGCACAGGTGATGGGCGATCTCGACA
+AATTAACCGGCAACATGATCTCGAATCAGGCCAAATACGTCTCCGATACGCGCGACGTCCTGCGGGCCAT
+GAAGAAGATGATTGACGGTGTCTACAAGGTTTGTAAGGGCCTCGAAAAGATTCCGCTGCTCGGCCACTTG
+TGGTCGTGGGAGCTCGCAATCCCTATGTCCGGCATCGCGATGGCCGTTGTCGGCGGCGCATTGCTCTATC
+TAACGATTATGACGCTGATGAATGCGACCAACCTGAGGGGAATTCTCGGCAGGCTGATCGAGATGTTGAC
+GACCTTGCCAAAGTTCCCCGGCCTGCCCGGGTTGCCCAGCCTGCCCGACATCATCGACGGCCTCTGGCCG
+CCGAAGTTGCCCGACATTCCGATCCCCGGCCTGCCCGACATCCCGGGCCTACCCGACTTCAAATGGCCGC
+CCACCCCCGGCAGCCCGTTGTTCCCCGACCTCCCGTCGTTCCCAGGGTTCCCCGGGTTCCCCTCCCTACC
+CGGTTTCCCCGGGCTCCCCGGGTTCCCGGAGTTCCCCGCCATCCCCGGGTTCCCCGCACTGCCCGGGTTG
+CCCAGCATTCCCAACTTGTTCCCCGGCTTGCCGGGTCTGGGCGACCTGCTGCCCGGCGTAGGCGATTTGG
+GCAAGTTACCCACCTGGACTGAGCTGGCCGCTTTGCCTGACTTCTTGGGCGGCTTCGCCGGCCTGCCCAG
+CTTGGGTTTTGGCAATCTGCTCAGCTTTGCCAGTTTGCCCACCGTGGGTCAGGTGACCGCCACCATGGGT
+CAGCTGCAACAGCTCGTGGCGGCCGGCGGTGGCCCCAGCCAACTGGCCAGCATGGGCAGCCAACAAGCGC
+AACTGATCTCGTCGCAGGCCCAGCAAGGAGGCCAGCAGCACGCCACCCTCGTGAGCGACAAGAAGGAAGA
+CGAGGAAGGCGCGGCCGCAGGCGTGGCCGAGGCGGAGCGTGCACCCATCGACGCTGGCACCGCGGCCAGC
+CAACGGGGGCAGGAGGGGACCGTCCTTTGATCGGACACCGAGTCGCCAGCAGGTCTGTGCCATAGCGAGT
+CGAAGCCATAGCGAGTAGAAAGTTAAACGTAGAGGAGGGTTCAACCCATGACCGGATTTCTCGGTGTCGT
+GCCTTCGTTCCTGAAGGTGCTGGCGGGCATGCACAACGAGATCGTGGGTGATATCAAAAGGGCGACCGAT
+ACGGTCGCCGGGATTAGCGGACGAGTTCAGCTTACCCATGGTTCGTTCACGTCGAAATTCAATGACACGC
+TGCAAGAGTTTGAGACCACCCGTAGCAGCACGGGCACGGGTTTGCAGGGAGTCACCAGCGGACTGGCCAA
+TAATCTGCTCGCAGCCGCCGGCGCCTACCTCAAGGCCGACGATGGCCTAGCCGGTGTTATCGACAAGATT
+TTCGGTTGATCATGACGGGTCCGTCCGCTGCAGGCCGCGCGGGCACCGCCGACAACGTGGTCGGCGTCGA
+GGTAACCATCGACGGCATGTTGGTGATCGCCGATCGGTTACACCTGGTTGATTTCCCTGTCACGCTTGGG
+ATTCGGCCGAATATCCCGCAAGAGGATCTGCGAGACATCGTCTGGGAACAGGTGCAGCGTGACCTCACAG
+CGCAAGGGGTGCTCGACCTCCACGGGGAGCCCCAACCGACGGTCGCGGAGATGGTCGAAACCCTGGGCAG
+GCCAGATCGGACCTTGGAGGGTCGCTGGTGGCGGCGCGACATTGGCGGCGTCATGGTGCGCTTCGTCGTG
+TGCCGCAGGGGCGACCGCCATGTGATCGCGGCGCGCGACGGCGACATGCTGGTGCTGCAGTTGGTGGCGC
+CGCAGGTCGGCTTGGCGGGCATGGTGACAGCGGTGCTGGGGCCCGCCGAACCCGCCAACGTCGAACCCCT
+GACGGGTGTGGCAACCGAGCTAGCCGAATGCACAACCGCGTCCCAATTGACGCAATACGGTATCGCACCG
+GCCTCGGCCCGCGTCTATGCCGAGATCGTGGGTAACCCGACCGGCTGGGTGGAGATCGTTGCCAGCCAAC
+GCCACCCCGGCGGCACCACGACGCAGACCGACGCCGCCGCTGGCGTCCTGGACTCCAAGCTCGGTAGGCT
+GGTGTCGCTTCCCCGCCGTGTTGGAGGCGACCTGTACGGAAGCTTCCTGCCCGGCACTCAGCAGAACTTG
+GAGCGTGCGCTGGACGGCTTGCTAGAGCTGCTCCCTGCGGGCGCTTGGCTAGATCACACCTCAGATCACG
+CACAAGCCTCCTCCCGAGGCTGACCCCTCACATCTCCGCTACGACTTCAGAAAGGGACGCCATGGTGGAC
+CCGCCGGGCAACGACGACGACCACGGTGATCTCGACGCCCTCGATTTCTCCGCCGCCCACACCAACGAGG
+CGTCGCCGCTGGACGCCTTAGACGACTATGCGCCGGTGCAGACCGATGACGCCGAAGGCGACCTGGACGC
+CCTCCATGCGCTCACCGAACGCGACGAGGAGCCGGAGCTGGAGTTGTTCACGGTGACCAACCCTCAAGGG
+TCGGTGTCGGTCTCAACCCTGATGGACGGCAGAATCCAGCACGTCGAGCTGACGGACAAGGCGACCAGCA
+TGTCCGAAGCGCAGCTGGCCGACGAGATCTTCGTTATTGCCGATCTGGCCCGCCAAAAGGCGCGGGCGTC
+GCAGTACACGTTCATGGTGGAGAACATCGGTGAACTGACCGACGAAGACGCAGAAGGCAGCGCCCTGCTG
+CGGGAATTCGTGGGGATGACCCTGAATCTGCCGACGCCGGAAGAGGCTGCCGCAGCCGAAGCCGAAGTGT
+TCGCCACCCGCTACGATGTCGACTACACCTCCCGGTACAAGGCCGATGACTGATCGCTTGGCCAGTCTGT
+TCGAAAGCGCCGTCAGCATGTTGCCGATGTCGGAGGCGCGGTCGCTAGATCTGTTCACCGAGATCACCAA
+CTACGACGAATCCGCTTGCGACGCATGGATCGGCCGGATCCGGTGTGGGGACACCGACCGGGTGACGCTG
+TTTCGCGCCTGGTATTCGCGCCGCAATTTCGGACAGTTGTCGGGATCGGTCCAGATCTCGATGAGCACGT
+TAAACGCCAGGATTGCCATCGGGGGGCTGTACGGCGATATCACCTACCCGGTCACCTCGCCGCTAGCGAT
+CACCATGGGCTTTGCCGCATGCGAGGCAGCGCAAGGCAATTACGCCGACGCCATGGAGGCCTTAGAGGCC
+GCCCCGGTCGCGGGTTCCGAGCACCTGGTGGCGTGGATGAAGGCGGTTGTCTACGGCGCGGCCGAACGCT
+GGACCGACGTGATCGACCAGGTCAAGAGTGCTGGGAAATGGCCGGACAAGTTTTTGGCCGGCGCGGCCGG
+TGTGGCGCACGGGGTTGCCGCGGCAAACCTGGCCTTGTTCACCGAAGCCGAACGCCGACTCACCGAGGCC
+AACGACTCGCCCGCCGGTGAGGCGTGTGCGCGCGCCATCGCCTGGTATCTGGCGATGGCACGGCGCAGCC
+AGGGCAACGAAAGCGCCGCGGTGGCGCTGCTGGAATGGTTACAGACCACTCACCCCGAGCCCAAAGTGGC
+TGTGGCGCTGAAGGATCCCTCCTACCGGCTGAAGACGACCACCGCCGAACAGATCGCATCCCGCGCCGAT
+CCCTGGGATCCGGGCAGTGTCGTGACCGACAACTCCGGCCGGGAGCGGCTGCTCGCCGAGGCCCAAGCCG
+AACTCGACCGCCAAATTGGGCTCACCCGGGTTAAAAATCAGATTGAACGCTACCGCGCGGCGACGCTGAT
+GGCCCGGGTCCGCGCCGCCAAGGGTATGAAGGTCGCCCAGCCCAGCAAGCACATGATCTTCACCGGACCG
+CCCGGTACCGGCAAGACCACGATCGCGCGGGTGGTGGCCAATATCCTGGCCGGCTTAGGCGTCATTGCCG
+AACCCAAACTCGTCGAGACGTCGCGCAAGGACTTCGTCGCCGAGTACGAGGGGCAATCGGCGGTCAAGAC
+CGCTAAGACGATCGATCAGGCGCTGGGCGGGGTGCTTTTCATCGACGAGGCTTATGCGCTGGTGCAGGAA
+AGAGACGGCCGCACCGATCCGTTCGGTCAAGAGGCGCTGGACACGCTGCTGGCGCGGATGGAGAACGACC
+GGGACCGGCTGGTGGTGATCATCGCCGGGTACAGCTCCGACATAGATCGGCTGCTGGAAACCAACGAGGG
+TCTGCGGTCGCGGTTCGCCACTCGCATCGAGTTCGACACCTATTCCCCCGAGGAACTCCTCGAGATCGCC
+AACGTCATTGCCGCTGCTGATGATTCGGCGTTGACCGCAGAGGCGGCCGAGAACTTTCTTCAGGCCGCCA
+AGCAGTTGGAGCAGCGCATGTTGCGCGGCCGGCGCGCCCTGGACGTCGCCGGCAACGGTCGGTATGCGCG
+CCAGCTGGTGGAGGCCAGCGAGCAATGCCGGGACATGCGTCTAGCCCAGGTCCTCGATATCGACACCCTC
+GACGAAGACCGGCTTCGCGAGATCAACGGCTCAGATATGGCGGAGGCTATCGCCGCGGTGCACGCACACC
+TCAACATGAGAGAATGAACTATGGGGCTTCGCCTCACCACCAAGGTTCAGGTTAGCGGCTGGCGTTTTCT
+GCTGCGCCGGCTCGAACACGCCATCGTGCGCCGGGACACCCGGATGTTTGACGACCCGCTGCAGTTCTAC
+AGCCGCTCGATCGCTCTTGGCATCGTCGTCGCGGTCCTGATTCTGGCGGGTGCCGCGCTGCTGGCGTACT
+TCAAACCACAAGGCAAACTCGGCGGCACCAGCCTGTTCACCGACCGCGCGACCAACCAGCTTTACGTGCT
+GCTGTCCGGACAGTTGCATCCGGTCTACAACCTGACTTCGGCGCGGCTGGTGCTGGGCAATCCGGCCAAC
+CCGGCCACCGTGAAGTCCTCCGAACTGAGCAAGCTGCCGATGGGCCAGACCGTTGGAATCCCCGGCGCCC
+CCTACGCCACGCCTGTTTCGGCGGGCAGCACCTCGATCTGGACCCTATGCGACACCGTCGCCCGAGCCGA
+CTCCACTTCCCCGGTAGTGCAGACCGCGGTCATCGCGATGCCGTTGGAGATCGATGCTTCGATCGATCCG
+CTCCAGTCACACGAAGCGGTGCTGGTGTCCTACCAGGGCGAAACCTGGATCGTCACAACTAAGGGACGCC
+ACGCCATAGATCTGACCGACCGCGCCCTCACCTCGTCGATGGGGATACCGGTGACGGCCAGGCCAACCCC
+GATCTCGGAGGGCATGTTCAACGCGCTGCCTGATATGGGGCCCTGGCAGCTGCCGCCGATACCGGCGGCG
+GGCGCGCCCAATTCGCTTGGCCTACCTGATGATCTAGTGATCGGATCGGTCTTCCAGATCCACACCGACA
+AGGGCCCGCAATACTATGTGGTGCTGCCCGACGGCATCGCGCAGGTCAACGCGACAACCGCTGCGGCGCT
+GCGCGCCACCCAGGCGCACGGGCTGGTCGCGCCACCGGCAATGGTGCCCAGTCTGGTCGTCAGAATCGCC
+GAACGGGTATACCCCTCACCGCTACCCGATGAACCGCTCAAGATCGTGTCCCGGCCGCAGGATCCCGCGC
+TGTGCTGGTCATGGCAACGCAGCGCCGGCGACCAGTCGCCGCAGTCAACGGTGCTGTCCGGCCGGCATCT
+GCCGATATCGCCCTCAGCGATGAACATGGGGATCAAGCAGATCCACGGGACGGCGACCGTTTACCTCGAC
+GGCGGAAAATTCGTGGCACTGCAATCCCCCGATCCTCGATACACCGAATCGATGTACTACATCGATCCAC
+AGGGCGTGCGTTATGGGGTGCCTAACGCGGAGACAGCCAAGTCGCTGGGCCTGAGTTCACCCCAAAACGC
+GCCCTGGGAGATCGTTCGTCTCCTGGTCGACGGTCCGGTGCTGTCGAAAGATGCCGCACTGCTCGAGCAC
+GACACGCTGCCCGCTGACCCTAGCCCCCGAAAAGTTCCCGCCGGAGCCTCCGGAGCCCCCTGATGACGAC
+CAAGAAGTTCACTCCCACCATTACCCGTGGCCCCCGGTTGACCCCGGGCGAGATCAGCCTCACGCCGCCC
+GATGACCTGGGCATCGACATCCCACCGTCGGGCGTCCAAAAGATCCTTCCCTACGTGATGGGTGGCGCCA
+TGCTCGGCATGATCGCCATCATGGTGGCCGGCGGCACCAGGCAGCTGTCGCCGTACATGTTGATGATGCC
+GCTGATGATGATCGTGATGATGGTCGGCGGTCTGGCCGGTAGCACCGGTGGTGGCGGCAAGAAGGTGCCC
+GAAATCAACGCCGACCGCAAGGAGTACCTGCGGTATTTGGCAGGACTACGCACCCGAGTGACGTCCTCGG
+CCACCTCTCAGGTGGCGTTCTTCTCCTACCACGCACCGCATCCCGAGGATCTGTTGTCGATCGTCGGCAC
+CCAACGGCAGTGGTCCCGGCCGGCCAACGCCGACTTCTATGCGGCCACCCGAATCGGTATCGGTGACCAG
+CCGGCGGTGGATCGATTATTGAAGCCGGCCGTCGGCGGGGAGTTGGCCGCCGCCAGCGCAGCACCTCAGC
+CGTTCCTGGAGCCGGTCAGTCATATGTGGGTGGTCAAGTTTCTACGAACCCATGGATTGATCCATGACTG
+CCCGAAACTGCTGCAACTCCGTACCTTTCCGACTATCGCGATCGGCGGGGACTTGGCGGGGGCAGCCGGC
+CTGATGACGGCGATGATCTGTCACCTAGCCGTGTTCCACCCACCGGACCTGCTGCAGATCCGGGTGCTCA
+CCGAGGAACCCGACGACCCCGACTGGTCCTGGCTCAAATGGCTTCCGCACGTACAGCACCAGACCGAAAC
+CGATGCGGCCGGGTCCACCCGGCTGATCTTCACGCGCCAGGAAGGTCTGTCGGACCTGGCCGCGCGCGGG
+CCACACGCACCCGATTCGCTTCCCGGCGGCCCCTACGTAGTCGTCGTCGACCTGACCGGCGGCAAGGCTG
+GATTCCCGCCCGACGGTAGGGCCGGTGTCACGGTGATCACGTTGGGCAACCATCGCGGCTCGGCCTACCG
+CATCAGGGTGCACGAGGATGGGACGGCTGATGACCGGCTCCCTAACCAATCGTTTCGCCAGGTGACATCG
+GTCACCGATCGGATGTCGCCGCAGCAAGCCAGCCGTATCGCGCGAAAGTTGGCCGGATGGTCCATCACGG
+GCACCATCCTCGACAAGACGTCGCGGGTCCAGAAGAAGGTGGCCACCGACTGGCACCAGCTGGTCGGTGC
+GCAAAGTGTCGAGGAGATAACACCTTCCCGCTGGAGGATGTACACCGACACCGACCGTGACCGGCTAAAG
+ATCCCGTTTGGTCATGAACTAAAGACCGGCAACGTCATGTACCTGGACATCAAAGAGGGCGCGGAATTCG
+GCGCCGGACCGCACGGCATGCTCATCGGGACCACGGGGTCTGGGAAGTCCGAATTCCTGCGCACCCTGAT
+CCTGTCGCTGGTGGCAATGACTCATCCAGATCAGGTGAATCTCCTGCTCACCGACTTCAAAGGTGGTTCA
+ACCTTCCTGGGAATGGAAAAGCTTCCGCACACTGCCGCTGTCGTCACCAACATGGCCGAGGAAGCCGAGC
+TCGTCAGCCGGATGGGCGAGGTGTTGACCGGAGAACTCGATCGGCGCCAGTCGATCCTCCGACAGGCCGG
+GATGAAAGTCGGCGCGGCCGGAGCCCTGTCCGGCGTGGCCGAATACGAGAAGTACCGCGAACGCGGTGCC
+GACCTACCCCCGCTGCCAACGCTTTTCGTCGTCGTCGACGAGTTCGCCGAGCTGTTGCAGAGTCACCCGG
+ACTTCATCGGGCTGTTCGACCGGATCTGCCGCGTCGGGCGGTCGCTGAGGGTCCATCTGCTGCTGGCTAC
+CCAGTCGCTGCAGACCGGCGGTGTTCGCATCGACAAACTGGAGCCAAACCTGACATATCGAATCGCATTG
+CGCACCACCAGCTCTCATGAATCCAAGGCGGTAATCGGCACACCGGAGGCGCAGTACATCACCAACAAGG
+AGAGCGGTGTCGGGTTTCTCCGGGTCGGCATGGAAGACCCGGTCAAGTTCAGCACCTTCTACATCAGTGG
+GCCATACATGCCGCCGGCGGCAGGCGTCGAAACCAATGGTGAAGCCGGAGGGCCCGGTCAACAGACCACT
+AGACAAGCCGCGCGCATTCACAGGTTCACCGCGGCACCGGTTCTCGAGGAGGCGCCGACACCGTGACCCG
+CGCCGGCGACGATGCAAAGCGCAGCGATGAGGAGGAGCGGCGCCAACGGCCCGCGCCGGCGACGATGCAA
+AGCGCAGCGATGAGGAGGAGCGGCGCGCATGACTGCTGAACCGGAAGTACGGACGCTGCGCGAGGTTGTG
+CTGGACCAGCTCGGCACTGCTGAATCGCGTGCGTACAAGATGTGGCTGCCGCCGTTGACCAATCCGGTCC
+CGCTCAACGAGCTCATCGCCCGTGATCGGCGACAACCCCTGCGATTTGCCCTGGGGATCATGGATGAACC
+GCGCCGCCATCTACAGGATGTGTGGGGCGTAGACGTTTCCGGGGCCGGCGGCAACATCGGTATTGGGGGC
+GCACCTCAAACCGGGAAGTCGACGCTACTGCAGACGATGGTGATGTCGGCCGCCGCCACACACTCACCGC
+GCAACGTTCAGTTCTATTGCATCGACCTAGGTGGCGGCGGGCTGATCTATCTCGAAAACCTTCCACACGT
+CGGTGGGGTAGCCAATCGGTCCGAGCCCGACAAGGTCAACCGGGTGGTCGCAGAGATGCAAGCCGTCATG
+CGGCAACGGGAAACCACCTTCAAGGAACACCGAGTGGGCTCGATCGGGATGTACCGGCAGCTGCGTGACG
+ATCCAAGTCAACCCGTTGCGTCCGATCCATACGGCGACGTCTTTCTGATCATCGACGGATGGCCCGGTTT
+TGTCGGCGAGTTCCCCGACCTTGAGGGGCAGGTTCAAGATCTGGCCGCCCAGGGGCTGGCGTTCGGCGTC
+CACGTCATCATCTCCACGCCACGCTGGACAGAGCTGAAGTCGCGTGTTCGCGACTACCTCGGCACCAAGA
+TCGAGTTCCGGCTTGGTGACGTCAATGAAACCCAGATCGACCGGATTACCCGCGAGATCCCGGCGAATCG
+TCCGGGTCGGGCAGTGTCGATGGAAAAGCACCATCTGATGATCGGCGTGCCCAGGTTCGACGGCGTGCAC
+AGCGCCGATAACCTGGTGGAGGCGATCACCGCGGGGGTGACGCAGATCGCTTCCCAGCACACCGAACAGG
+CACCTCCGGTGCGGGTCCTGCCGGAGCGTATCCACCTGCACGAACTCGACCCGAACCCGCCGGGACCAGA
+GTCCGACTACCGCACTCGCTGGGAGATTCCGATCGGCTTGCGCGAGACGGACCTGACGCCGGCTCACTGC
+CACATGCACACGAACCCGCACCTACTGATCTTCGGTGCGGCCAAATCGGGCAAGACGACCATTGCCCACG
+CGATCGCGCGCGCCATTTGTGCCCGAAACAGTCCCCAGCAGGTGCGGTTCATGCTCGCGGACTACCGCTC
+GGGCCTGCTGGACGCGGTGCCGGACACCCATCTGCTGGGCGCCGGCGCGATCAACCGCAACAGCGCGTCG
+CTAGACGAGGCCGTTCAAGCACTGGCGGTCAACCTGAAGAAGCGGTTGCCGCCGACCGACCTGACGACGG
+CGCAGCTACGCTCGCGTTCGTGGTGGAGCGGATTTGACGTCGTGCTTCTGGTCGACGATTGGCACATGAT
+CGTGGGTGCCGCCGGGGGGATGCCGCCGATGGCACCGCTGGCCCCGTTATTGCCGGCGGCGGCAGATATC
+GGGTTGCACATCATTGTCACCTGTCAGATGAGCCAGGCTTACAAGGCAACCATGGACAAGTTCGTCGGCG
+CCGCATTCGGGTCGGGCGCTCCGACAATGTTCCTTTCGGGCGAGAAGCAGGAATTCCCATCCAGTGAGTT
+CAAGGTCAAGCGGCGCCCCCCTGGCCAGGCATTTCTCGTCTCGCCAGACGGCAAAGAGGTCATCCAGGCC
+CCCTACATCGAGCCTCCAGAAGAAGTGTTCGCAGCACCCCCAAGCGCCGGTTAAGATTATTTCATTGCCG
+GTGTAGCAGGACCCGAGCTCAGCCCGGTAATCGAGTTCGGGCAATGCTGACCATCGGGTTTGTTTCCGGC
+TATAACCGAACGGTTTGTGTACGGGATACAAATACAGGGAGGGAAGAAGTAGGCAAATGGAAAAAATGTC
+ACATGATCCGATCGCTGCCGACATTGGCACGCAAGTGAGCGACAACGCTCTGCACGGCGTGACGGCCGGC
+TCGACGGCGCTGACGTCGGTGACCGGGCTGGTTCCCGCGGGGGCCGATGAGGTCTCCGCCCAAGCGGCGA
+CGGCGTTCACATCGGAGGGCATCCAATTGCTGGCTTCCAATGCATCGGCCCAAGACCAGCTCCACCGTGC
+GGGCGAAGCGGTCCAGGACGTCGCCCGCACCTATTCGCAAATCGACGACGGCGCCGCCGGCGTCTTCGCC
+TAATAGGCCCCCAACACATCGGAGGGAGTGATCACCATGCTGTGGCACGCAATGCCACCGGAGCTAAATA
+CCGCACGGCTGATGGCCGGCGCGGGTCCGGCTCCAATGCTTGCGGCGGCCGCGGGATGGCAGACGCTTTC
+GGCGGCTCTGGACGCTCAGGCCGTCGAGTTGACCGCGCGCCTGAACTCTCTGGGAGAAGCCTGGACTGGA
+GGTGGCAGCGACAAGGCGCTTGCGGCTGCAACGCCGATGGTGGTCTGGCTACAAACCGCGTCAACACAGG
+CCAAGACCCGTGCGATGCAGGCGACGGCGCAAGCCGCGGCATACACCCAGGCCATGGCCACGACGCCGTC
+GCTGCCGGAGATCGCCGCCAACCACATCACCCAGGCCGTCCTTACGGCCACCAACTTCTTCGGTATCAAC
+ACGATCCCGATCGCGTTGACCGAGATGGATTATTTCATCCGTATGTGGAACCAGGCAGCCCTGGCAATGG
+AGGTCTACCAGGCCGAGACCGCGGTTAACACGCTTTTCGAGAAGCTCGAGCCGATGGCGTCGATCCTTGA
+TCCCGGCGCGAGCCAGAGCACGACGAACCCGATCTTCGGAATGCCCTCCCCTGGCAGCTCAACACCGGTT
+GGCCAGTTGCCGCCGGCGGCTACCCAGACCCTCGGCCAACTGGGTGAGATGAGCGGCCCGATGCAGCAGC
+TGACCCAGCCGCTGCAGCAGGTGACGTCGTTGTTCAGCCAGGTGGGCGGCACCGGCGGCGGCAACCCAGC
+CGACGAGGAAGCCGCGCAGATGGGCCTGCTCGGCACCAGTCCGCTGTCGAACCATCCGCTGGCTGGTGGA
+TCAGGCCCCAGCGCGGGCGCGGGCCTGCTGCGCGCGGAGTCGCTACCTGGCGCAGGTGGGTCGTTGACCC
+GCACGCCGCTGATGTCTCAGCTGATCGAAAAGCCGGTTGCCCCCTCGGTGATGCCGGCGGCTGCTGCCGG
+ATCGTCGGCGACGGGTGGCGCCGCTCCGGTGGGTGCGGGAGCGATGGGCCAGGGTGCGCAATCCGGCGGC
+TCCACCAGGCCGGGTCTGGTCGCGCCGGCACCGCTCGCGCAGGAGCGTGAAGAAGACGACGAGGACGACT
+GGGACGAAGAGGACGACTGGTGAGCTCCCGTAATGACAACAGACTTCCCGGCCACCCGGGCCGGAAGACT
+TGCCAACATTTTGGCGAGGAAGGTAAAGAGAGAAAGTAGTCCAGCATGGCAGAGATGAAGACCGATGCCG
+CTACCCTCGCGCAGGAGGCAGGTAATTTCGAGCGGATCTCCGGCGACCTGAAAACCCAGATCGACCAGGT
+GGAGTCGACGGCAGGTTCGTTGCAGGGCCAGTGGCGCGGCGCGGCGGGGACGGCCGCCCAGGCCGCGGTG
+GTGCGCTTCCAAGAAGCAGCCAATAAGCAGAAGCAGGAACTCGACGAGATCTCGACGAATATTCGTCAGG
+CCGGCGTCCAATACTCGAGGGCCGACGAGGAGCAGCAGCAGGCGCTGTCCTCGCAAATGGGCTTCTGACC
+CGCTAATACGAAAAGAAACGGAGCAAAAACATGACAGAGCAGCAGTGGAATTTCGCGGGTATCGAGGCCG
+CGGCAAGCGCAATCCAGGGAAATGTCACGTCCATTCATTCCCTCCTTGACGAGGGGAAGCAGTCCCTGAC
+CAAGCTCGCAGCGGCCTGGGGCGGTAGCGGTTCGGAGGCGTACCAGGGTGTCCAGCAAAAATGGGACGCC
+ACGGCTACCGAGCTGAACAACGCGCTGCAGAACCTGGCGCGGACGATCAGCGAAGCCGGTCAGGCAATGG
+CTTCGACCGAAGGCAACGTCACTGGGATGTTCGCATAGGGCAACGCCGAGTTCGCGTAGAATAGCGAAAC
+ACGGGATCGGGCGAGTTCGACCTTCCGTCGGTCTCGCCCTTTCTCGTGTTTATACGTTTGAGCGCACTCT
+GAGAGGTTGTCATGGCGGCCGACTACGACAAGCTCTTCCGGCCGCACGAAGGTATGGAAGCTCCGGACGA
+TATGGCAGCGCAGCCGTTCTTCGACCCCAGTGCTTCGTTTCCGCCGGCGCCCGCATCGGCAAACCTACCG
+AAGCCCAACGGCCAGACTCCGCCCCCGACGTCCGACGACCTGTCGGAGCGGTTCGTGTCGGCCCCGCCGC
+CGCCACCCCCACCCCCACCTCCGCCTCCGCCAACTCCGATGCCGATCGCCGCAGGAGAGCCGCCCTCGCC
+GGAACCGGCCGCATCTAAACCACCCACACCCCCCATGCCCATCGCCGGACCCGAACCGGCCCCACCCAAA
+CCACCCACACCCCCCATGCCCATCGCCGGACCCGAACCGGCCCCACCCAAACCACCCACACCTCCGATGC
+CCATCGCCGGACCTGCACCCACCCCAACCGAATCCCAGTTGGCGCCCCCCAGACCACCGACACCACAAAC
+GCCAACCGGAGCGCCGCAGCAACCGGAATCACCGGCGCCCCACGTACCCTCGCACGGGCCACATCAACCC
+CGGCGCACCGCACCAGCACCGCCCTGGGCAAAGATGCCAATCGGCGAACCCCCGCCCGCTCCGTCCAGAC
+CGTCTGCGTCCCCGGCCGAACCACCGACCCGGCCTGCCCCCCAACACTCCCGACGTGCGCGCCGGGGTCA
+CCGCTATCGCACAGACACCGAACGAAACGTCGGGAAGGTAGCAACTGGTCCATCCATCCAGGCGCGGCTG
+CGGGCAGAGGAAGCATCCGGCGCGCAGCTCGCCCCCGGAACGGAGCCCTCGCCAGCGCCGTTGGGCCAAC
+CGAGATCGTATCTGGCTCCGCCCACCCGCCCCGCGCCGACAGAACCTCCCCCCAGCCCCTCGCCGCAGCG
+CAACTCCGGTCGGCGTGCCGAGCGACGCGTCCACCCCGATTTAGCCGCCCAACATGCCGCGGCGCAACCT
+GATTCAATTACGGCCGCAACCACTGGCGGTCGTCGCCGCAAGCGTGCAGCGCCGGATCTCGACGCGACAC
+AGAAATCCTTAAGGCCGGCGGCCAAGGGGCCGAAGGTGAAGAAGGTGAAGCCCCAGAAACCGAAGGCCAC
+GAAGCCGCCCAAAGTGGTGTCGCAGCGCGGCTGGCGACATTGGGTGCATGCGTTGACGCGAATCAACCTG
+GGCCTGTCACCCGACGAGAAGTACGAGCTGGACCTGCACGCTCGAGTCCGCCGCAATCCCCGCGGGTCGT
+ATCAGATCGCCGTCGTCGGTCTCAAAGGTGGGGCTGGCAAAACCACGCTGACAGCAGCGTTGGGGTCGAC
+GTTGGCTCAGGTGCGGGCCGACCGGATCCTGGCTCTAGACGCGGATCCAGGCGCCGGAAACCTCGCCGAT
+CGGGTAGGGCGACAATCGGGCGCGACCATCGCTGATGTGCTTGCAGAAAAAGAGCTGTCGCACTACAACG
+ACATCCGCGCACACACTAGCGTCAATGCGGTCAATCTGGAAGTGCTGCCGGCACCGGAATACAGCTCGGC
+GCAGCGCGCGCTCAGCGACGCCGACTGGCATTTCATCGCCGATCCTGCGTCGAGGTTTTACAACCTCGTC
+TTGGCTGATTGTGGGGCCGGCTTCTTCGACCCGCTGACCCGCGGCGTGCTGTCCACGGTGTCCGGTGTCG
+TGGTCGTGGCAAGTGTCTCAATCGACGGCGCACAACAGGCGTCGGTCGCGTTGGACTGGTTGCGCAACAA
+CGGTTACCAAGATTTGGCGAGCCGCGCATGCGTGGTCATCAATCACATCATGCCGGGAGAACCCAATGTC
+GCAGTTAAAGACCTGGTGCGGCATTTCGAACAGCAAGTTCAACCCGGCCGGGTCGTGGTCATGCCGTGGG
+ACAGGCACATTGCGGCCGGAACCGAGATTTCACTCGACTTGCTCGACCCTATCTACAAGCGCAAGGTCCT
+CGAATTGGCCGCAGCGCTATCCGACGATTTCGAGAGGGCTGGACGTCGTTGAGCGCACCTGCTGTTGCTG
+CTGGTCCTACCGCCGCGGGGGCAACCGCTGCGCGGCCTGCCACCACCCGGGTGACGATCCTGACCGGCAG
+ACGGATGACCGATTTGGTACTGCCAGCGGCGGTGCCGATGGAAACTTATATTGACGACACCGTCGCGGTG
+CTTTCCGAGGTGTTGGAAGACACGCCGGCTGATGTACTCGGCGGCTTCGACTTTACCGCGCAAGGCGTGT
+GGGCGTTCGCTCGTCCCGGATCGCCGCCGCTGAAGCTCGACCAGTCACTCGATGACGCCGGGGTGGTCGA
+CGGGTCACTGCTGACTCTGGTGTCAGTCAGTCGCACCGAGCGCTACCGACCGTTGGTCGAGGATGTCATC
+GACGCGATCGCCGTGCTTGACGAGTCACCTGAGTTCGACCGCACGGCATTGAATCGCTTTGTGGGGGCGG
+CGATCCCGCTTTTGACCGCGCCCGTCATCGGGATGGCGATGCGGGCGTGGTGGGAAACTGGGCGTAGCTT
+GTGGTGGCCGTTGGCGATTGGCATCCTGGGGATCGCTGTGCTGGTAGGCAGCTTCGTCGCGAACAGGTTC
+TACCAGAGCGGCCACCTGGCCGAGTGCCTACTGGTCACGACGTATCTGCTGATCGCAACCGCCGCAGCGC
+TGGCCGTGCCGTTGCCGCGCGGGGTCAACTCGTTGGGGGCGCCACAAGTTGCCGGCGCCGCTACGGCCGT
+GCTGTTTTTGACCTTGATGACGCGGGGCGGCCCTCGGAAGCGTCATGAGTTGGCGTCGTTTGCCGTGATC
+ACCGCTATCGCGGTCATCGCGGCCGCCGCTGCCTTCGGCTATGGATACCAGGACTGGGTCCCCGCGGGGG
+GGATCGCATTCGGGCTGTTCATTGTGACGAATGCGGCCAAGCTGACCGTCGCGGTCGCGCGGATCGCGCT
+GCCGCCGATTCCGGTACCCGGCGAAACCGTGGACAACGAGGAGTTGCTCGATCCCGTCGCGACCCCGGAG
+GCTACCAGCGAAGAAACCCCGACCTGGCAGGCCATCATCGCGTCGGTGCCCGCGTCCGCGGTCCGGCTCA
+CCGAGCGCAGCAAACTGGCCAAGCAACTTCTCATCGGATACGTCACGTCGGGCACCCTGATTCTGGCTGC
+CGGTGCCATCGCGGTCGTGGTGCGCGGGCACTTCTTTGTACACAGCCTGGTGGTCGCGGGTTTGATCACG
+ACCGTCTGCGGATTTCGCTCGCGGCTTTACGCCGAGCGCTGGTGTGCGTGGGCGTTGCTGGCGGCGACGG
+TCGCGATTCCGACGGGTCTGACGGCCAAACTCATCATCTGGTACCCGCACTATGCCTGGCTGTTGTTGAG
+CGTCTACCTCACGGTAGCCCTGGTTGCGCTCGTGGTGGTCGGGTCGATGGCTCACGTCCGGCGCGTTTCA
+CCGGTCGTAAAACGAACTCTGGAATTGATCGACGGCGCCATGATCGCTGCCATCATTCCCATGCTGCTGT
+GGATCACCGGGGTGTACGACACGGTCCGCAATATCCGGTTCTGAGCCGGATCGGCTGATTGGCGGTTCCT
+GACAGAACATCGAGGACACGGCGCAGGTTTGCATACCTTCGGCGCCCGACAAATTGCTGCGATTGAGCGT
+GTGGCGCGTCCGGTAAAATTTGCTCGATGGGGAACACGTATAGGAGATCCGGCAATGGCTGAACCGTTGG
+CCGTCGATCCCACCGGCTTGAGCGCAGCGGCCGCGAAATTGGCCGGCCTCGTTTTTCCGCAGCCTCCGGC
+GCCGATCGCGGTCAGCGGAACGGATTCGGTGGTAGCAGCAATCAACAAGACCATGCCAAGCATCGAATCG
+CTGGTCAGTGACGGGCTGCCCGGCGTGAAAGCCGCCCTGACTCGAACAGCATCCAACATGAACGCGGCGG
+CGGACGTCTATGCGAAGACCGATCAGTCACTGGGAACCAGTTTGAGCCAGTATGCATTCGGCTCGTCGGG
+CGAAGGCCTGGCTGGCGTCGCCTCGGTCGGTGGTCAGCCAAGTCAGGCTACCCAGCTGCTGAGCACACCC
+GTGTCACAGGTCACGACCCAGCTCGGCGAGACGGCCGCTGAGCTGGCACCCCGTGTTGTTGCGACGGTGC
+CGCAACTCGTTCAGCTGGCTCCGCACGCCGTTCAGATGTCGCAAAACGCATCCCCCATCGCTCAGACGAT
+CAGTCAAACCGCCCAACAGGCCGCCCAGAGCGCGCAGGGCGGCAGCGGCCCAATGCCCGCACAGCTTGCC
+AGCGCTGAAAAACCGGCCACCGAGCAAGCGGAGCCGGTCCACGAAGTGACAAACGACGATCAGGGCGACC
+AGGGCGACGTGCAGCCGGCCGAGGTCGTTGCCGCGGCACGTGACGAAGGCGCCGGCGCATCACCGGGCCA
+GCAGCCCGGCGGAGGCGTTCCCGCGCAAGCCATGGATACCGGAGCCGGTGCCCGCCCAGCGGCGAGTCCG
+CTGGCGGCCCCCGTCGATCCGTCGACTCCGGCACCCTCAACAACCACAACGTTGTAGACCGGGCCTGCCA
+GCGGCTCCGTCTCGCACGCAGCGCCTGTTGCTGTCCTGGCCTCGTCAGGATGCGGCGGCCAGGGCCCGGT
+CGAGCAACCCGGTGACGTATTGCCAGTACAGCCAGTCCGCGACGGCCACACGCTGGACGGCCGCGTCAGT
+CGCAGTGTGCGCTTGGTGCAGGGCAATCTCCTGTGAGTGGGCAGCGTAGGCCCGGAACGCCCGCAGATGA
+GCGGCCTCGCGGCCGGTAGCGGTGCTGGTCATGGGCTTCATCAGCTCGAACCACAGCATGTGCCGCTCAT
+CGCCCGGTGGATTGACATCCACCGGCGCCGGCGGCAACAAGTCGAGCAAACGCTGATCGGTAGTGTCGGC
+CAGCTGAGCCGCCGCCGAGGGGTCGACGACCTCCAGCCGCGACCGGCCCGTCATTTTGCCGCTCTCCGGA
+ATGTCATCTGGCTCCAGCACAATCTTGGCCACACCGGGATCCGAACTGGCCAACTGCTCCGCGGTACCGA
+TCACCGCCCGCAGCGTCATGTCGTGGAAAGCCGCCCAGGCTTGCACGGCCAAAACCGGGTAGGTGGCACA
+GCGTGCAATTTCGTCAACCGGGATTGCGTGATCCGCGCTGGCCAAGTACACCTTATTCGGCAATTCCATC
+CCGTCGGGTATGTAGGCCAGCCCATAGCTGTTGGCCACGACGATGGAACCGTCGGTGGTCACCGCGGTGA
+TCCAGAAGAACCCGTAGTCGCCCGCGTTGTTGTCGGACGCGTTGAGCGCCGCCGCGATGCGTCGCGCCAA
+CCGCAGCGCATCACCGCGGCCACGCTGGCGGGCGCTGGCAGCTGCAGTGGCGGCGTCGCGTGCCGCCCGA
+GCCGCCGACACCGGGATCATCGACACCGGCGTACCGTCATCTGCAGACTCGCTGCGATCGGGTTTGTCGA
+TGTGATCGGTCGACGGAGGGCGGGCAGGAGGTGCCGTCCGCGCCGAGGCCGCCCGCGTGCTCGGTGCCGC
+CGCCTTGTCCGAGGTAGCCACCGGCGCCCGCCCAGTGGCAGCATGCGACCCCGCGCCCGAGGCCGCGGCC
+GTACCCACGCTCGAACGCGCGCCCGCTCCCACGGCGGTACCGCTCGGCGCGGCGGCCGCCGCCCGTGCGC
+CCGGGACACCGGACGCCGCAGCCGGCGTCACCGACGCGGCGGATTCGTCCGCATGGGCAGGCCCCGACTG
+CGTCCCCCCGCCCGCATGCTGGCCCGGCACACCAGGTTGCTCCGCCAACGCCGCGGGTTTGACGTGCGGC
+GCCGGCTCGCCCCCTGGGGTGCCCGGTGTTGCTGGACCAGACGGACCGGGAGTGGCCGGTGTAACCGGCT
+GGGGCCCAGGCGATGGCGCCGGTGCCGGAGCCGGCTGCGGGTGTGGAGCGGGAGCTGGGGTAACGGGCGT
+GGCCGGGGTTGCCGGTGTGGCCGGGGCGACCGGGGGGGTGACCGGCGTGATCGGGGTTGGCTCGCCTGGT
+GTGCCCGGTTTGACCGGGGTCACCGGGGTGACCGGCTTGCCCGGGGTCACCGGCGTGACGGGAGTGCCGG
+GCGTTGGTGTGATCGGAGTTACCGGCGCTCCCGGGATGGGTGTGATTGGGGTTCCCGGGGTGATCGGGGT
+TCCCGGCGTGATCGGGGTTCCCGGGGTGATCGGGGTTCCCGGCGTGATCGGGGTTCCCGGTGTGCCCGGT
+GTGCCCGGTGTGCCCGGGGATGGCACGACCAGGGTAGGCACGTCTGGGGGTGGCGGCGACTTCTGCTGAA
+GCAAATCCTCGAGTGCGTTCTTCGGAGGTTTCCAATTCTTGGATTCCAGCACCCGCTCAGCGGTCTCGGC
+GACCAGACTGACATTGGCCCCATGCGTCGCCGTGACCAATGAATTGATGGCGGTATGGCGCTCATCAGCA
+TCCAGGCTAGGGTCATTCTCCAGGATATCGATCTCCCGTTGAGCGCCATCCACATTATTGCCGATATCGG
+ATTTAGCTTGCTCAATCAACCCGGCAATATGCCTGTGCCAGGTAATCACCGTGGCGAGATAATCCTGCAG
+CGTCATCAATTGATTGATGTTTGCACCCAGGGCGCCGTTGGCAGCATTGGCGGCGCCGCCGGACCATAGG
+CCGCCTTCGAAGACGTGGCCTTTCTGCTGGCGGCAGGTGTCCAATACATCGGTGACCCTTTGCAAAACCT
+GGCTATATTCCTGGGCCCGGTCATAGAAAGTGTCTTCATCGGCTTCCACCCAGCCGCCCGGATCCAGCAT
+CTGTCTGGCATAGCTGCCCGTCGGCCTGGTAATACTCATCCCCTACTGCCCTCCCCAAACCGCCAGATCG
+CCTCGCGGATCACCGTCCGGTTGGCCTCCGGCATTTCACGCCGGCTCGGCCGCTGGATCCACCCCGCGCC
+GGTATTCGCAGTAACCCGTTGAATCCGCGCGCATGATGCACCGCTTGGGCGATCAGCCGGGTGGTCACCT
+CGCTTGCGCTGGCCGCGCTGTCGCACGGGGCGCTCGGTGGTAACGGACGTCATAATTAACCAGCGTAACC
+GAACCTAAGACCAGCTAGCTGCGGCAATATTGGCGACCAGGACTATGGCGCCCTCCGAACCCGGCCGATC
+CATGTCAAAACATTGACAATGCGTACTCACGCCGTGTCGGGCGCGCTGAATGACCGCATTGCGGCGCTCA
+TTCGGTGCGTAGTCGCTACCACCGCAACAATGGGCTTAGGCCATTCCTTCGTTCATCGCGCGGGACATGG
+CCGATAACGCAGCGGTCAGCTGCTCGCCCGCCGCGTCGTTATACGCGGACGCCGCGGCCTGCGCATTGTG
+CAGCGCCTCGTTGACCCGCTGAGCCACCGCCTCGGCACCCAGCTTCTTCAGCAAACCATCTTCGATGCGC
+AGGCCGGTGAGCCACTGGTGCCCATTGATCGTCACTTCGACGGTCTCGGCTTCGTCGGTGGCGCGGAAGG
+ATCCGTTGTTCATCTGATTGAGCGTCCCGTCTAGGGCCGACTGAAACCGCGCCGCCAGCGTCAACGCCCG
+GGCGACATGCGGGTCCAATTCGTCCATGCTCACTTCGACTCCTTACTGTCCTGGCGCCGACGGTTACCAA
+TGACGGCCTCGGTCCATGCCCGATCCTCGGTGTAGAGCGCCTCGTCTTCCTGCTGAGAACCCTTGGACTT
+GGCGCCCCCTTGTCCCTGATGCGCGGCACCCATCGGCATTCCCATGCCACCGCCGCCCAGCGCGGCGCCG
+CCGCCGGCCCTTCCCTGGCCTAAGCCGGCAATGTCACCAGCGCCAGCGGGCCGCACCGATTCGGCGCCCC
+CGATCGCGGATCCCAACGGCGCCGACGGCACCCCGCCGCCTCCACCGCCACCGAGCGATGCCGCTTTGAC
+CGCCACGTCGCCCGACAGCGCTGCGGCTTCCCGCCCAGCCGACGTCAGCTGCGCCGCCGTGTCAGCCGGG
+AGGCCACCACCCGGCGATCCGGTAGGCGGAACCATCGGTGCGGCTGGCATCCCGGTACCGGGAGTCACAC
+CGGAGCCGTCAGACGGCGGCATCAGGAAGCCAGGGATCAATCCCTGCTCTTGCGGAGGCGGGGCGGGTCG
+ATCTTGATGGCGGGGGGGAGGCTTCGGCGGGTTTACCGGTTCCAGGGCTGCCTTGTTGTTGTATTCGGTC
+AGCACCTTCTCCGACCTCTGCTGATACTCCGCGTACACCGGGAGAATTTGGTCGCGGGCCGAAGGGTTTT
+CCGCGTAAAGCCGTTCGAGCCCGACTATGTCTTCATAAGTCGGATGTTCCCGCCTAGCCCACACGTGCAG
+CTGCGCGACATATTGAGCCTGCTTGGCCATCGCAGCGCTCAATTTGGCCATGTGGAGTATCCATTGCCGT
+TGTTGATCGAGCGAAGCCTCGCAAGCGGTAGCCGCATCGCCTTCCCAGTTGTCAAACCCCCGGAACCGCT
+TGACGTCGCCTTGCAGCGTCAGGTTGAAAGTGTTCCACCCATCCGCAAAGTGCGCGAGCGATGCGCCTTG
+GTCGCCCGTTTCGAGCTTCCTTGCCGCTTCTTTGAGATCCATGAAGTTGGGTTCACCGGCCGTGGCCACC
+CTCGGCGTATCGGTTAGTTCGGCCGAACTGTCCCCTCCGACGGCCCCGGCCGATTCTGCCTGCACAGTTC
+CTTCGCCGTCGTTGTCCAGCGCGGTCGCAGCCTCCTCATCAACCTCGCCATACGCCTTGGCCGCGTTGCG
+CAGCGAGGTCGCCAGACGCTGCCGCTCTTTGGCACCGGCCGCCAGGTATTCCCGCATGTTGTCGGCGGAC
+AATACCAGCTGTTGGGCGGCGTTTTTAGCCGCCGTGAGTTCGCACGGTGTGATGGGGACATCAGTCGGTG
+GGTCCGCCATCGGGGCCTCCACCTCGTTGGCCCTGTTCAAAATCTCTTGCTGATCCACCGTCACGGTCTG
+CGACTGCGTCATATCGGATCATCCTCCTTAGTGCTATAGCCATTATCGTCGCTAAACTGAAAGGTTCCTG
+CACTAATTTGATGCCGCCCGTTCATGCCGGCATCGCGAACGGATCGCCCTACTTCGGCAGCGCCATCTGG
+TAGCGGCTTTCCTCGGGTGGGGAAACCCGGCGAATCGGCAGCTGCCGATGCCGCGGGGTACCGATCACAT
+TGTGCCGCAGAATCACCCGGTCAATACCGGGATGCGGGCCGAGATAGGTCGTCGCATTCGGCCACGCCAC
+CTTTACCTCCTGCCCGATGTGTGCGCCGATCAACCGGGCAAATTCCTCGAACTGTGGCCCGACTGTGACC
+ATCGCACCTGCCGCCGCCGCACGCACCACGAACTGGGTGAATGTCTGAGCGTCACCCAGGTTGAGGGCGA
+TGTCGACATCGTCGAAGGGCATGTAGACCGGGCATCGGTTCACCGTCTCGCCGACCAGTACCCCAGCTGA
+CCCGATCGGCAGCTGGCAGTGGCGGTTGGCCACCAGATGCTGGCCTTGCAGCGCGGGCCGCTGCCCGCCA
+AATAGGCGGGCGAAGCCCCTGGGTGTCTTGGGCTTGTCCGCCGTGGTCAGCAACACCGTGGACTGCGGGG
+CCATCCCCGGCGCGACCCGGACTCTGGTGATGGTGTGGTCCGCGCGCGCCGACCACCATACATCCGGACC
+TCCGGGCGCCGCGTAGGCGGCAGTGTAGGCATCGCGCCCCTTGATCATCGACCATTTCTCCCGCACAAAG
+CCGATGTCGGTGGCGTGGTCGTAGTCATCGAAGCTGCGGCCACACACCGCGTCGACACCATGGCTAGCCA
+GTCGATCGGCAATGCGCGTCGCGGACGCCACCAAATACCGGGCCAGTCCTGCGACGCCTTCATCGCGGCG
+CTGCGCCGATTTGCGGGTGCGTTCCGGGTCGGCGCGCAGCACGATCCAGGTCCGGCGGTTCGCCGGCGCC
+GGGTCTGTCCCGATCACCTGCTGATACAGACTCACCACGTCCGGCGCTGCGGTATTGCCGACGCGGTAGC
+CGGCTGAGACGATATCGGCCTCCAAGTCGGGACAGTGCACCGACAGGAGCTCCTCCACCAGTCCGGTGTC
+CAGCATGTCGTCGGTGTGGGCTTGCCCGTCGACGATGACCGTCGGCGTGAATGGTCGGGGAATGAGCTCG
+ATTACGGCGACCAGAAACTCGCCTTGCCAGCGCACCGCAACGTGATCTCCTGGCTTCACGGTGGCCCCGA
+CCACAGGTTCTGACGAGGAATCCGGGGGCCGTCGGCGCCGCCGCAACCACGCGTACACCGCCGCCACCCA
+GCCGGTGATCCGGCGGCCGTAGAAAGTGACCGTGGCCACGATGACGCCCAACGAGGCCAGCGCAATCCCC
+GCCCACCAGTAGCGCGTCTCCAAGAATGCGATGATGCATGGCGGGGCCAACGCGGAGGCAAGCAAGGCGT
+GCCCGGTGCTGAACCGCAGCCCTAAAGGATTTCTCATCGGCGGCTCAGCGCCCGTCTAGCCAGCGCGCCC
+AGGCCCAGGGCCAACGTAAGGCCGACGGCCACCAACGCCACAGCCGTAATCGGGCGACGATCGGGACCCG
+GCTCCACCACCGGGGGTGGAAGTCGTCTGACGTTGTATGGCGCCGAAGCAGGGCCGGGCGGAATGTCCCA
+CGTCAGCGCGGCCACCGCATCGATGACGCCGGCGCCGACCAGGTCGTCGACCCCGCCCCCGGGGTGTCTC
+GCGGTGGCGGTGATCCGGTGGATGATCTGCGCCGGCGTCAGGTCGGGGAACCGCTGCCGAAGCAGGGCCG
+CCAGACCCGACACATATGCCGCGGCAAACGAGGTGCCGGCGATGGGTACCGGCCCCTCCCGGCCTTGCAA
+CGCATTCACCGGTTCACCGGTGTCGCCGAGCGCGACGATGTTTTCTGCGGGCGCGGCCACGTCCACCCAC
+GGTCCGTGCATCGAGAACGAGCTGGGCATCCCGGTCTGGCCGATACCGCCGACGCTTAACACCAGCGGTG
+CGTACCACGCCGGGGTGACAACGGTCTGCACATTGTTCCAGCCGCGTGGGTCGCCGGGTGTGGACGGGTC
+CGGCGCCGGATTCTGTACGCAATCGCCACCGGTGTTGCCGGCCGCGACCACCACCACCACGCCTTTGACG
+TTGACCGCATAGTCGATGGATGCACCCAGTGAGGTTTCATCGATCGGCCTGCTCACCTTGTAGCAGGCGG
+CTTCACTGATGTTGATCACACCCACGCCGAGGTTGGCGGCGTGCACCACGGCGCGGGCAAGACTGCGGAT
+GGAACCGGCGGCCGGGGTGGCGTTGGGGTCATTCGGGTTGGCTTGTGAGCCGACCGGTTCGAAGGCCTCA
+GACGTCTGACGTAGCGAGAGCAGTCGAGCGTCGGGCGCGACGCCGACGAACCCGTCGGTGGGCGCGGGCC
+GGCCCGCGATGATGGATGCTGTGAGAGTCCCATGGGCATCACAGTCAGACAGGCCGTTACCGGCCTGGTC
+GACGAAATCGCCGCCAGGTTCCGCCGGGACCCGTGGCGAAGCGTCGACACCGGTGTCGATCACCGCCACC
+GTCACCCCGGCCCCGGTCGCGAACTTGTGGGCATCGGCCACGCCCAGATACGTGTTGCTCCACGGCGGAT
+CGTGGAACCCGGACCCCGGCAGCGTGGTGGGCGACGCGCACAAAACGCGCTGTTCGGTAGGCTGATCCGG
+GCCCGCCACGTCGGGCGGCAACGCGCCCGGATCGATCGGCGGTGGCGTGATGGCCGATGCGGGCGACGCG
+GTGAGCAACGCCAGCGCCACCGTGATCAGAAAGATACGGTGCACTCCCAGAACACTCCATTCGTTGAGAT
+TCATTGCGATTCATTGAGCTGCGTTGCTACCTTGGGCCACTTGACGGACCTGTGTGCATTTTAGACGTAA
+CGGCTGGGCAAACAACGCTGTCACGCCTGGGCTGGTCCGCCGCGCCGACCAGGGCGCGTAGGCGCTGTAC
+CTGGACCACGCCGGGACTCAACGGTTTTGCTACCGCACTAGCCGATATGCGGCTGCTACCAAACGATCGC
+GGCCATGTCTCGGTTGTCTGAGCACACGCTGCGTATCGCGGCATCGATGTCGGTGGCGGTGATGATCTGC
+AGATCCTGAACCGATACCGGTTGGCCCGCACGTTTTTGCGCAACCACCCGGGTGTCCCGGAACCCTTCGG
+CGCGTTCGATCACGTTGCGGGCGAACCGACCGTTTTGCATAGCGTCGATACCGTGCTGCCCACTAGGGGT
+GGTGTAGTTACGGATGGTGGTGACCGCGTCGAGGAATACCTCCCGTGCGGCGTCATCGAGCTGGCTGGCG
+CGCGGTGTAGCGTAGCGGTGTCCAATCTCGACGATCTCCACCGGCGAATAAGACTCGAACCGCAGCTTTC
+GGTTGAACCGGCCAGCCAAACCCGGGTTCACGGTGAGGAATTCATCCACCTGATCCTCATAGCCGGCCCC
+GATGAAACAGAAGTCGAATCGGTGTGTTTCCAATTGAACCAGGAGTTGATTGACCGCCTCCATGCCGATC
+ATGTCCGGTGTTCCGTCTTGATGACGTTCGATCAGCGAGTAGAACTCGTCCATGAAAATGATTCGCCCGA
+GTGACTTTTCGATCAGCTCGTTCGTCTTGGGTCCTGACTCCCCGATGTAGTGCCCACAGAAGTCCGATCG
+GCGAACTTCTCGAATTTCGGGGTGACGCACGATCCCCATGCCGGCGTAGATCTTGCCGAGCGCTTCAGCG
+GTGGTTGTCTTACCTGTGCCTGGTGGCCCCACCAGCAACATGTGGTTGGTCTGCCCCTCCACCGGTAGGC
+CGTGCTCTAGGCGCATCATGCGCACCTCGAGTTGGTCTTCCAGCGCCGATACCGCTTGCTTGACCGCCGC
+CAGGCCCACCTGTTTGGCCAGCAGTTCCCGGCCCTCGGCTAGCAGCTCGCCGCGCCGCTGCGCTGCATTG
+TCGTCATCGAGCTGGTCGCGGCTTTTCGCCGTCGAAGCATCCCAACGGTCGGAGCGGCTGGCGATGGTTC
+GTTCATCGGTAACAATCAAGCGCAGGTTCGGGTCCGCCAGGGCTTCTTTGGCGGCGTCGGTGAGCACCCC
+GTTGATGGTGGCCTTCGACAGCCAGATCTGGGCCTTGTCCTCCTCATGCAGTTGCCGGTACACCATCCCC
+CGCACATACGCCAAGTCGGCGACCAGCAGCGGAATATCGGCCGGTCCGATCGCCGCGGTGAGCACGTCGG
+CGCCGAACCGCCCCGATGACCTGCTGTGTCCGATCACGTCCACCCGGTCCAGCCAGTCCAGGGCCACTCG
+CCCCTGCCCGAGATGGGCCGCGGCGTGGGCTGCCAGCGCACAAATCGACGCGGTCACCGCCGGCATGACG
+ATCGCCTGTGGCGGCAGATCCTCGGCGGCCGTCGACAACACGTCGGGCCATCGCTGCGTGACGTACATCA
+GGAACGCCCGAGCCAGCTGATGCCACTGGTAGTTGCGCCACGAATCCAATAGCTCGCGGTTTGCTAACAG
+GGCATCGGCCTTCGCATACTCCCCCGCGATCGTCAACGCCGACGACAGCGCCAGCCCCACCTGAGATGCG
+TCGGTCACCGTGATCCCGATGGATGGTCCCAGCTGGACCTCAGCGGCCAACGTCCGGCCGATCCGCGTGG
+TCTCGCGGTGCAGCCACTCGCTATGGGCGTTGAGCTGCTTAAGCGAGGCCAGATCGCGGTCACCGCAGGC
+GATACGACCCAGCCACGCGTCGGCCATCGACGGATCGGCCTCGGTGGCAGCCACAAACTCAGGCAACGCC
+GCCACGCATCCCTGGCCATTCTTGATCGTCATCGCCCGATCGAAATGCCGGCGCGCAGTGAGTAAATCAC
+CCATCGTGTCCACCATTCTCGACATCGCCGCCGCTGTCACCGCGGTTGCAACGTGTGTCTGTCACTCTGT
+GCCTCAAATTCCGTTGGCAACGTTCTACCGGCCTATCGACATCGTGACCGGCTCAAGGCTGACATAGCGG
+TTCTCCGCACGGAACATTTCCATCTCAACCAGCCAGTTTTGTCCTGCCGCACCGACTTTCACCGTTGCCC
+GATCGATTTGTTCGATGGTCACCTCGAAGCCATGCCGATCGCTCTCGGACAGCGAGGTACCGGGTCGGGC
+AATGGTGATGACACTGGCTGGCCGTGGCGTGGGCGAAATCGCGACATCGACACCGCTGCCTTCAGATTTG
+CCGTCATCGCCGTTCTTGCGCCGCCGCACGTACTCCACGACGCCGACAGTGGTGCGCGGCGCGGGCCGTG
+GTGTGCCGACGATGCTCAACTGCGGCATGCGTACGCTGGCCCAACGCTCTTGGTCGCGAGTGTGCACACA
+CACCCGCTCACCGGCACCGACGACGCGAATCACGATCCTCTTGGCGATCGTGTCGTCCGCGGCCACGAAG
+ACGCGCGACAGCTCACCGGCGTCGGTAACGGGAATCATCAGCCGGTCCCCGTTGCTCAGCTTGCCAATCA
+ACACCCCCGACGGTCCGATCTCGGTGACTAGCTGCGCCGGCAACGGGCAGCGCCGCTGTCCGCGTAGGTG
+TGGACGTGGCCCGCACATGTTGGCCGCAGCCGCGGCGGCTTGCTCACCATTGAGCCGACGCAAGATCACA
+CTGGGCGGGGTAGGCGCCGGCGTCGGTGTGCGCACGGTGATGGTCGCGGTGCACGTCGCGTCCGGGTACA
+CCGTTACGTTCTGGATGACCTCATCGGCACGCAGCGTCCAGGCTTGCGAGAGAACCCGCGACGAAATCGC
+CTCAGCCGGGTACGCATACGTCGTCATCCACCCGGCTTCACCGCGGATAGCTTTCCAGCGCTGCGCACTC
+CCGGCTACCGCGTCCGACCCCAGCCGGCGATCAAGCTCAGCCAAGTCTGTTGCGGTGGCCAGTTTGGCGC
+GCAAGCCCTGACAGCGCAGGGAGCTGGCAACGCGTTGGGCGACCGAAATGGCAGCGGCCCCAACGCTGGT
+ACGCCAGCGTAAAGCTTGGGTGTTGCCGATCACCGGAAGCCGCATGATCAGCCACGTTTCGCGCCGCCCG
+GCATACGGCGGCGTACCGATCTCCGCGTCATACACCCGCGGGTAATCGCCGACGGTGCCGGTTCGCGAGC
+CGAAGGTGACGACGCTGATTGAATCGAGTTCCAGGTCCAGCGGGTGGCGCGGCAACGGCGCGAGCTCAAC
+GACGTCAATCACGTTGTCGCTTTCTACGGTCACCGACCCGGTGACCGTAGTCGCCCGGTGCGCTCGGCCG
+AGAAGTTGCACCGCCACCACCGCGACACCGTCTTGCACGCGGACGCCACCCCCGGATCGGTTGTTGGCCA
+AGGTAATTGGGTCATTCCATTTGACGGGACGCCGACCCCGCAGCCCCAGTACCGCCCACGACCACGCCGG
+CTGACCCCACCACTGTACGAACACCAAGGCGACGCCGACCACGACAGCCATGACCGCACCTAGCTGGCCG
+CCCAGCGCCCAGCCCGCCGACGCGAGCACGAACACTGTCCACACCCCGGCGACCCGCCTCGCACTGCGCG
+GGCTGAACCCGGTCAGCTTGGACGTCAACGCGCCCTCCGTAGCCGAGCCCCGATTGCCATTGCCAGCACA
+CCGGTGGCCACTGCGCCGACGAACCCGATAGCGATATTGCGCGCCCGGTGATCGGGCGGAGGGGGTGGCG
+CGGCGGGCGTGATCACCCGGCTCTGTGCACCCGGGGCCATCCGATCACCGGATGGGATGTTAAACGTCAA
+TGCGGCGACCGGATCCACCAGCCCGTACCCCAGTTTGTTGTCCACGCCCGCAGGCGGATTGTGCGCCGAC
+TGCACGATCCGGTTGATCACTTGGTAGGCAGTCAACTCGGGGAATTTGGCCCGCACCAGTGCCGCGACGC
+CGCTGACGTAGGCCGCCGAAAAGCTGGTGCCCCAGAACGGCATATTCTTCTCGCCTGGCCGCGACGGCGG
+GTAGGCATTGACCGGTCCGCCGCCTTGTGGCGATAGACCCATGATGTGGGTTCCCGGTGCCGCGACACCG
+ACCCACGGACCCGACATGCTCTTGTCCAGTGCGGCGCCGTAGGCATCGACGGCACCTACCGACAGGACGT
+AATCAGAGAACCATGACGGTGACGACACAACCGTGACCTGATGCCAGTCCCGGGGATCTGACGGGTCCAG
+CGGGTCATACATCGGGTTGTTGCCGCAGCCGGCCTCCCCGTCGTTGCCGGCTGCTGCCACGATCACCGCA
+TCCTTGACGGTGGCCGCATACCACAGCGCGGCGCCCAGCACCCGCTGGTCGCCCGGAGCCGCCGCAGGCA
+GACATGCGGTCACCGAAATGTTGATCACTTTCGCCCCCATGTTCGCCGCGTGTACCACGGCACGCGCCAC
+CGAGTCGAGGGTGCCCGCTTTGACTTTCTCATCGGAGTTGGGACCCGCCGACGACGGGTTGACCGGCTCG
+AAGGCCCGCGAGGACTGCCGAATCGAGATGATGGTCGCATGCGGGGCCACCCCCACCACCCCGTCCGGGG
+CGCCCGGCGGGGGTGGGGGCACCGCGGGTTCGTCTTCGGTTTGCGGATCCGGCGGTCCATTGGACGGCGC
+CATGGCGCCCGCATCCTCGGGTGGTGGTGGCGGTGGCGCAACGGTTTGGGTGATCGTCACCGGCGGCGGC
+GGGGGCATCGGGGGCGGGACTTCTACCGGCGGCGCCGGCGCGGCGGTGACCGGCGGCGGCCCGGCCGGCG
+GTGGGAACGCCGCGGTGGCCGGCATGGCCCTTGGCATCGGTAAAATCCCAAGCGGTGCAGCGGCAATGAT
+CGAACTCACCACCGTGCCGTGCGCGTCGCAATCCGATAGGCCGTCCTCCCCCATGATGTAGTCGCCACCG
+GGCACCACCGGCAGCCGCGGGTTGGGACTGACGCCGGTGTCGATGACTGCCACGGGCACACCGTTGCCGG
+TGCTGTACTGCCACGCCTTGCTGATGTTGACCAGGTTGAAGCCCGGTGCTAGCTGCGCCACGTCGGGATT
+TCTTACGGTGATCGGTGTGGAGCAGCTGTTGGAGCGGCGCATGGGCTGATCAGGTCCAGGCCGCGCGTCT
+GCAGGCACCATCGCCGGATCTACCGACGGCGGTGGGATAGCCTGTGCCGCAGGAACATTAGCTGACAAAG
+CAACGAGGGTGAGGGCGGCGCTCGCGGCCGCGGCCCGCAGGCCAGGTCGGTTTAGTGGCGAAGCCATGCA
+AACAGCCCCCCTAGGGCCGCAGCCGCTGGTAACAACGCGATCATGGCCAGCACTTCTAGCCATTCCACGG
+TCAACCGGATGATCGGCCTAAACCGCGTCGCCGGTACCACGAGGGCCACGGCCAAACCCAATGCGGCGAA
+AGCCGCGACGAAGATCGCAGGCCAAAGCAGCCCGGTCTGAACACCTTTCGGGGTGTCGAGGGCGTACTTA
+AGCACCCCGGCACACACCGCGGCGGACGCCCCGCACACCAATGCGACCGCTTGGTATTTGGCGGCGAACC
+CGCGGCCCTGGGTGATGAAGAGGCCCACCGTCAAGCCGGCAACCAACAACGCCAACCAGGCCCACGGTTG
+ACGTGGCGTCAGCACCCCCCATACCGCGGCGGGCAGTACGAGCGACACCCCGACGCACATACCCACCTGT
+ACCGCGTTAACCAGCCGCGCCGACGCGGCGATCGCGGTGCCGCGGGCGGTGATGCCGGTCAGTTCATTGT
+CCTCATCGTCGGCGTCGGCTTCGCTGACCGGAGCCACCGTATCGACGGGCATTCCCGCACGGCGCGCGAA
+CAGATCCCGGCCGGTGATCGATCCGAAGTGCGGGGGTCGTACCCGTGCCACCCACAACGCAACGGTCGGA
+GTCATCCTGATCAGGACAAGCAGCCCTACCAGCACGCAAATCGCCAGCACCTGCATCGAAACCGGCCTAA
+ACATTCGGACGGCGGCGACAGCGGCAAGGATCCCGCACACCGTTACCACCGCGGTGACCACTGCGGTCTG
+CCACCGCTTGCGGGTCGCCACGCCGATCGTGATCGCACCCAGAACCACCACCACGAGCCCGATCAGCGCA
+TGAGCCGCCATTCACGGACCATGGGGTCGGCATTACCGGCCTGGTCCAGAGCCCCCACCGCCATCAACTC
+GGCGGCCACCGGGTGGCGAAGTGCCCGCTCGGCGGTGTCCAACCGCGGCAACAATGGCCGTAATCCCAGT
+TCCGGACAGGTTTGTTCCACCCCGGTTACCGCTTGTAGTACCCACAGGCCATCGACCGTCGTCGTCAGCA
+TGTCACGTTCATCTCAACCAGCTAGCAGCAAGCAGAAGGTGGGGCAGACGCGCGGTCCGCGCATGTACCC
+CACCTTCACTCGGCCCACGGCCGGCTTTAGAACAAGCCCGCGATGGCCTGGTCGGTTCCGATCGCGTTGT
+CCAGCACGTGGCCGGTGGTAGTCCCATGCTGACCCACCGTCTCAATGAGCCCCTGCAGCCCCGACAGCAT
+CTGCGCCTGGCGTCGAAAAACCCTTGCGCGCCGTGGCCCGCGAAAAACTCTTGCAGCGCATTTGTTTTGC
+TGGCGGTGTCTTCGTAAATCATGTGGAGCTGGCCGGCGCGCGAGCCCACGTCGGAAGCGAAGTCGGATAC
+GGCTCCCGGGTTATACGTGATTTGATCTGACATGTGAAATTCCTTTCCGAGGCGTGAAACGAGTTGGGTC
+AGGATCCGTGGCTAGCGCCGAACAGCGCCTGAAACGCTGTCTGCGAGTCCGCCTCGTGTCCCTCCATCAG
+GGCTGCGGCCTGCACGAGGCCCTCGGCCAGGCGCGTGCCCCCGGTAAGGACCTTGTTCAATTCATTGGTG
+ATCTCGGTGGCTGTCATATGCGAAGCAACGACGCCGGCACCAGACCAGGTGGCGGGGTTCATGACGTTTT
+CCTGGTTGGCTAGGTAGCCCTTGGCGATTCCCATGGCTTGCTCCATATTCGCCTGGATATCGTTGGCGGT
+GCTGCGCAGCATCTGCGGTGTTACCTGAATTGTGTCTGCCACGGCCCTTCTCCTTTACTGCCGTTAGCCG
+TTCCCCCTCAAATATCGGGGCATGACGCGAAGTGTATGGCTGCTCTGCGGACCTGTCGATTCACCCTGTG
+CCCGAGCTAGATCTACCGCCGGTCATCGACAACACGCACCGTCGCGGCCTGCTCGGACTTGCCATGGGAT
+CCGCGGTGACCCCCCGCCGCATGTCCGACCGGCATGCCTCCGATAGGGGTGCCACCCACCGTGGTCGTCG
+GCGCGCGCACGACGTCGGCGCCCAAAGCCCCGCTGGGCCGCAACCCGACCGGCCTGCCGCTGGTGCCCGA
+TTCGAAAGCGCTGACGGGACGTGTGAAGCTCGTCGCTGGCATACCGCCGCCGCCCAGGGCGGCGCCTCCG
+CCGCCCGCACCGACCTCGGTGGCCGCGGCCGATATCCCACCGGCCGCCGAAGCCGCCGAGGCTCCCGGCG
+CCGCCCCGCCCATGCCCAGTGCGCCCGGGTTGGCGAACATGCCCACCATCGATTGCAGCGGCTGCATCGC
+GCTCATCGGTGCCTGCATCAGTCCCGACGGCGCCTGCAGCGCCTGCGGGGCCGCTTGCATCACCGCCTGC
+ATCGGCTGCATGAACGTGCTGAGCTGATTGCCGAAGTTCTCACCCGCCGACGTTGACTGACCCGCGCCGG
+TTGACCCTGCCTGCACGCCCTGGTAGGCGGAACGCATCCCGTCACCGGCCGCGGCCTCGGCGGCCGCCTG
+GCCAACCGCCGCCGCAGCCTGTGCCGGAGCGGCCGGAGATGCACCCATGGTCGCGACCGGCGGCGGAATT
+GCCAGACTCTCGGCCAGCGCGGCGAGAACCCCTCCGTAGGTGGCGCCCACCGCGGCGTTATTCGGCCACA
+TCACCCCGAAATACTCGACGTCCAAAGAGACGATTCGAGGCGTTAGTGTCCACAGCACGCTGGGGTTGAT
+GGCGTTGTCGACGCCCCATTCGTCGCGGTTCTCCATGCACTCGGGGGCAGGGCGCATGGCCGCGTTGGCG
+GTCTCAAACGCCGCGATCGCGGTCGATACCACGGCCGGCTTCACGTCGACCCAGCCGGCCAGTCCGTGCA
+GCGTGGCGTTGAGCATGGTGACGTTAAGCGCCGAGGCCGCCGACCCGACACCCAACCAGCTCGCCGCGGT
+GGCGGCGGTGTTGATCGCCGACGCGACACCCGAGGCGTGGTGGCTGGCGCCCAGTGTGGTCCACGCCGTT
+TGATTGGCCAGATGGGTGCCCACGCCGGTGCCCGCCTTGAGCAGCAGGTCGTTGGCCTCAGGTGTCCGCG
+CAGCCCATCCTGGATCGGGCATGCCTACTTACCCTTGCAGCGCCGATGCCGCCGCGCGCGCCGCTTCTGT
+GGTCACGTACACGCCCGACGCGAGGCCCTGCTAACCCGCGAACAGGCCGCGCTGACTGGCGTGTTCGGCA
+ACGACACCCAGGTAGCTGGCACCGCACGCGTTGAGCGCTGCGGAGAACATCGCGGAGTCGGGATCACCAC
+CCATCGGCGTGGTGCTAAGCAGGGCTGGCGCCGCTCCGGCGGCCGCTGCCTCGGTTTCCGCACTGATCGC
+CGACTCGGCAGCTGCCGACGCCAGCACTGCTTCTGGTTGCACAGACCAAACCATGTTCGCCCCTCCGATT
+GCTTCTGCAATGCGTGATGGTCGCTGAGTGTAATGCGAGTCGGCCGATCGCGTATGCGCAAATCAGTCGT
+CTGCACCGATGCCGACGTCGAACTGGTCCACGCCGCCCCATGTGTTCCAGCATGTCAGCGGTACGTGTGG
+GGCGGATGTGAAATCTGCGACGCCTGGAGGATACGCGCGGGTGTCACTGAACCCGTACAGCGACATGGTC
+AGGCAGAAAGTAGCCATGCGCGCTATCTTGCGATCCGGCCCTACTGCTCGCCGGGCACCGACGGATACCC
+CACCAAAATCCCCTCGACGTCGCCGTCGGCACCGACCAACAGACCTCGTCCAGGCGGCAACGTTTGGGCT
+CGCACCGATCGATTGATTCGGTTTTGCGGATCGTTATCCATATACAACTGGGCCACTTTCGCCGAGGTCT
+GGGATTTCACCCAGGGGTCCATCGGCATCGTGGCCCAGTTCGCGCTGTTGCGCGTGCTGAATACGTGCAA
+ACCGACCTGGCGGGCGCGTTCCATCAACTTCCACAGCGCCGCACCCACCGGCGGCTTCTGTGGGTAGCTC
+TGAGCCGGCCGCAGGTCCTGCACGTCGTCGATGAGCACAAAGTGCCGCGGTCCTTCCCACGGCTTGAGTG
+CGCGCAACTCCTCCTGGCTCAAACCCTTGGGCGGCAACCGCGGCAGCAAGATCTGCTGGGCCAACTCGGT
+GATCACCTCGTCGATTTCATCTTGGTCGTAGGCATACGCGCGCACATACCCAGGGGCGTGCAGATCTCGC
+AGACCGTGCGGAGCCGTTTTAGGGTCGATCAGCGTGAGCTGCGCCTGCTGCGGGCTGAACCGGTTCATCA
+CCGCCTCGCCGATGGCCACCAGCGCCGTGGTCTTGCCGCAGCCTTGCCGACCTAAGATCATCAACCCTGG
+GCTCTCGCGCAGCTTGATCGGCACCGGACCCAGCTCGTGGCGCTCTCCGATCGCAAACGCGATCGACAGA
+TCGTCACCGCCCTGGTGGACGGCCTCGTGCTCGACAATCGCCGACAGTTCCACCCGCTGTGGCAGCCGCT
+GCAGACTTGCGTGCTTGGTCACCCCGGCCACGTCGGCGATTCGCGCCCCGACATCGGTGATGCCCACCAG
+CTCGCCGGTACCGGGGTCGGCCAGGGCCGGAACACCGATTCGCAGCTCGTGCAGGCTTTCCGTCAAACCA
+AATCCTGGGCGGTTCAACGTCCGCCGCGCCGCCTCCCGCGATTCGATCGACAAATGCCCCATCTGGCTCT
+CACCGGGATCGGCCAGCCGCAACTGAATTCGCGCCGTGACATTCTGCAGCAGGCTCTGCCGCTGCCCATG
+AATCCAGCCGCCGGCACTGCACATCAGGTGCACCCCGTATTCGGGACCGCGGCTGCTCAACGAGATGATG
+CGGTCCCCCAACAGGGTGTCCTTGGCGTACAGGTCGTCGTAGTCGTCGAGCACCACAAAGACATCGCCGA
+ACGCGTCGGTGGGATCGGTGCCACCCACCCCGTCGCCGCCGATCCCGAACCGGCGCTCGCGGAACCCGTC
+CATGTCGATCTTGGCTCGCCGAAACGCCTCTTCCCGCGCATCGATCAGCGCATCCATGGTGCTCAAGATG
+CGTTCGATGCCCTCGGCATCCTTGGGCGACACGATATCGGTAACGTGTGGAAGCGACCCAATCTGGGCCA
+TGGTCGCCCCGCCGATGCAAAAGAACGTCACTCGCTCCGGGGTGTACATCGTTGCCGCCGAACACATCAG
+CGCCATCAAGGTTGTGGTCTTGCCGCGCTGCTTGGCGCCCACCACGATGATGTTGCTGCGTAGCGCGTCG
+ACGGCGTGTACCACTTGCTGGGATTCTTCGGGGATGTCCATCACTCCCACCGGGAACATCAGTCCCGGGT
+TTTGACCGTAGTCGACATGCCAGGGTTTGCCACGATACGCAGCCACCAGCCTATCGACCGGCTCGGGGTC
+TTCCAGCGGCGCCAACCACGGCCGGCGCGGCGATCGGTGCGGCACGTTGTATAGCGACTCCCGCAGCACG
+TCGACGATCTTCTTCTTCTTGAAACCGTCGTCGTAATAGAGGAATTCGTCGGGTTCCGCATCGGCGGCCG
+CGGCGGTCGCCAATGCCTCGGCGTCGGCGGGCATCCAGCGGTTGGTACTGCCAGTCGTACAGCCGGGGTT
+GGGTCAACGTCATGTCGATGGTTCGGGCCACCTCTTTCTTCTTCGGCACCACAAACGGCGCAGAGAGGTA
+AAAGCAGCGGAACGGTTCCAGATCCCGCGGCCCCACCTTGAGCAGCGCGAAACCGTTCTCCTTCGACGGC
+AGATGGTAGGCGGCGTCGCTGCCGATCACTTCGCGGCTGTCATCACCGGATTCAGCGCGCAGCGCAATCC
+GAAACGCGATGTTGGACTTGACCTTTTGCAGCGACGACAGGTCCAGCCGTTGACCGCCTAGCATGAAGAA
+GACGTTGGCGCCGCGACCCTCCTGACCGATGTGGATGATCAGATCAATCCACTTTTTGTGGTTGGCGAAC
+AGCTCCAGGTATTCGTCGACGATCACCAGCAGCACCGGCACCGGCGGCAGATCGCGTCCGGCGAGGCGAA
+TCTCTTCGTAGTCGTTGGCGTCGCGCGCACCTACCGATTTGAACAGTTCGTAGCGCTGTTTGATCTCGCC
+GTCGATAACTCTGCGCATCCGCTCGGCCAGATGCCGCTCGTCTTTGCCGAGGTTGGATAGCGCGGCCACC
+ACGTGCGGGATGCCCAGGATGTCCTGGGCAGCCGATTCGAATTTCATGTCGACGAAGATGACGTTGAATG
+TTTCCGGTGAGTGCGTCAGCGCGATCCCATAGACCAACGACAAGAAGAGCTCCGACTTGCCCGAGCCGCT
+GGTTCCGATGACCACTGAGTGAAACCCGAAGCCGCCAAAGTCCTTGGCGCGCAGGATGATGTTCTGCAGC
+TCGCCGTTCGGTTTGGCGCCCACCGGAATCTCACACCACCGATCGTCGCCGCGACCGCGCCGCTCGGCCC
+ACAACCGATCGACATCCAATTCCCGGGGGTCGCTAATGCCGAGCGAACGCAGCAGCTCGGCCGCGCCGCT
+GGTGGAATCGGTGACCTCGCTGCGACTGGTCGGTGACCACCGCGCCATCGCCCGCGCATATCGGTAGGCC
+CGGTGGATGGACAGCTGGTCGGCATGCGCGAAGAACGTGCCGCGCGCTCGCAACAGCGGCGCCGGGCGCT
+GGTCGTCATCGGCGTCTGCGCCATCGCGACCGGCCTTGACCGCGGTTGCCGCCCCATGTCGTTGGGCCAT
+CTCGAAGACCTGGTCCTCGGCGAACCCCACACCGGTGCCCACCCGGGACGCGATGCGCAGCACCGTAAGC
+CCGGCCTTGCCGACCTGCCCGACCACGCTCTCCCACGCATCCGGGCTGCCGGTGTTGTCGTCGACGATCA
+CCAGGTGCGGCCCCAAATCCACGCCGACCTGCCCGGTTTCCAGCGCCGAGCCCATCGCGGTTGGGCTGGC
+CACCGTCGGCGGGGTCCATGCGCCTCGCTTGCCCTTCATATGCAGCTCGGCTCCCAGCGCCGCCTCCAGT
+TCCTCGGGTGTGGCAAAGATCAGCCGCCGCCAGCCGCAGGCATCGAACAGCTCGTCGTGCAGGTTGTGGG
+GGAGCCACACCATCCACGCCCACACCTCGGGGTTGCGCGTCACCACCATCAGCTTGACGTCACGCGGGTT
+GTGAAACACCGCCAGCGAGCACAACACCGACCGCATCAGCGACCGCACCCGGTCCAGGTCCTCGCTCACG
+AAGCTGAAGCCTGGTGCCGACCGTAGGTTCACCACCTTGGCGATATCGCGAATCTTGCGCTGCTCCAAGA
+TGAAATCGCGCAGCGCCTGCCCGGTCACGGGCTCTAGCTCCTCATCGGAGGAAATGTCCGGCCAGGTCAC
+CGACAACACCGAATCTGGTGCGTGCTGCACACCCGTGCCCACCCGCACCTCTAAGAAGTCGACGTCGCCG
+CGGCCACGCTCCCACATCCGCGGACCGCCAATGATGGCGCCCAGTCCGGGTGGGTCCGAATGCACGGCGT
+TCTGCCATTCACGTTGCGCACACACCGCCGTCTGGATTTCGTCGCGGTTGGTGTCCAGGTCACGAAGATA
+TCGACGACGCCCCTTCTCCAACTCACCCCAGGTGATCTTGCGGGCTCGACCGAATCGTCCGGAGAACGCC
+AGCATGCTGAACGCGCCGATGCCCATCAGCGGGAAGAACCCCGTGGCCAAGCTGCGCACGCCCGACACGT
+ACAGCATGACGATGGTGCCGATCAGCGCCACGATCAACGCGGGAACGCCGATCATCACCCAGATGTTGCG
+CGGCTCGCGCTCCGGCAGAGCTATCGGCGGATTCGGAGCCACCCGAACGGGTTTCGGCGGGTCGATGTTG
+ACGCGGTTGATGGGAAACGCTTTCTTGGACATCTAGGCGCCCGCCTTCGCCGTTGTCGTCACAATGGCCA
+CCTGGCCGAGGGTGGGCACAGTATCGCGAGCCAAGAGTGCCGCATCCCGCGACAGAGCCGGTCCCGCAGC
+AAAAGTCCGCAGCAACGGCCACGGCGCCTGCACGGCCGCACCCGGATCCAGGCCCAGCGCCCGCAGCGTC
+GCCTCGTCGTTGGCGATCCCGAATCGCACCCCATTGCCGGACACCCAGAACAACGATTCGCGCGACTCGG
+CGGTGATCACACCGCTGGTCGATGTCACGAAGTTGGCCGCGCCGGGCAACACCAGCACCTGGGTGGCCAC
+CACCGACGCCGGGGCGCGGTCATCGCGTACCAGCCGCACGATCCGGCTGTCCATCGACGGGGGCACCGGA
+AGCCCCCGCCCGTTGTAGACCGCGACCCGGGCCTGTGGACCCGTCGACGCCTTCTCCCACGACACGCAGG
+TGGTCGGATCCGCCGCGGTGTCAACGAAATTCAGCCGCCCGGCCGGGTAGTACTCCACCGGCAGCGAGGT
+CACCTGCGGTGTGTGGACCAGCACATCGGGGGTCACCACCCGCGGCGCCGCCGCCCCGTAGGAGTTCGCG
+CTGCGCAGCAGATCGGCCACGAAGCTGCTGATCTTTTGCACCCCGTCGGGCAGCAGCACATAGAACTGGC
+TGCCCCCGCCGGCGGTTTGGGCCTGCAACACCGATCCCACCCGAGCGCCCGGCACCCACGTCGACGGGGT
+GCCCGCCTCGGGCACCGCTGGCACCCGCAGCGGCTCGGTCGCGGGCAGCCCGTCGAAGAGCGCCCGTGAG
+ATCTGTATTGGTGATGTCACGCCGGGGTCGAGCCCCAAGCTCAAGGTGACCGCCCTGTTGGTCGGATCGA
+TCTGTGAGCGTTTGCCACCCCAGATCACGTAGGTGCTGCCGTCGAAAGTCACCAGCAGCCCGGCGTCGTC
+GCGCAGGTGTGTGGCGCGGCCACCGCCGGTGATCGGGCCCGCGATCGAGGTGACCACCGGCTTGTCCGCG
+CTGCGCGGGCGTCCCGCCGTGTCGCACACCGCCCACGCCGAGACCGCGCCCCGGTTCACCGGCATGGCCG
+CGGGTGCGCCCGGGATGCCGACCAGCGGCCCGGTCGGATACTTGGCGATCTCGGCGGGCTTGACCCATGT
+CGGCTGCCCCGCCGTGCCGGTGGCCAGCCGCGCGGACGTCAAGTTCAGCGCCGGATACAACCGGCCGTCG
+ATGCGCGCGTAGAGTGCCCCGGAGTCGCGGTCCCCGATGATCGCCGAGTCACCCACAATGCCGGTGGGCT
+TGAGCACGTTGAGCAGCATCATCCATCCGGCGGCAATGGCCACCAACACCATCGACAACGCCAGCGCGGC
+GGTCTGCTTGCGGTCGTCGTGTTTCATGCGCACCGAGAACCGGGTGGTCGCCGCCCGCAGCCGCCGGTTG
+TAGAACAGATGACCGGAATTTTGGTCGCGGTTGGACAAACTCAGCGGCATTCTCAATACCCCCTGGGGCT
+GCGGCGAGGATCGGCCTGCTGGATCAGATCGGCCAGATTCGATGCGTCGGCGGCCACCCCGTAGTGGCCT
+CTCGCGTAGTTGATGAACGCGCACGCCTGGGCGACCAAATCGTGGATGTTGGTCGACGTGCCCGGCTCGT
+GATGGCCGCGAACGTCGGAGCGATGAACTGCCAGACGCCCCTGCTGGGGGTGCCCCGCGCGGCGTTGGAA
+TCCCAGTGGTTTATGGCGTTGGCGTTGTAGTTCGATTCGCGACGGGCCACCAGGTCCATGCCGCGAGTCC
+AGCGTGCCCGCGCGGCTGGATCGTGAACGCCTTTGATATCCAACGCTTTTTGGACCGCCGCCAACACTTG
+GGCGCGTCCACCGGGTGTGGTTACCTGGGGTCGTCTTGCCGCGGCGGTGCGCAGGTAGCGCAGCCGGCGC
+AGCCGCAGCCCCAATAGCCGCGCCCGCGACCTACATCGCGCGATGTGCCGATGCTGAGCCCGCAGCCGGG
+CGGCCATCCGGGCCATCGCCTCCCGCCGGCCCAGCGGTGTGTCGGTCAAGGCCATGGCATCGGTCTTGGC
+GGCTTCCAGGAGTGCACGCGTCGCGGTCCTGGCGTGCGCATGATCGATCTGGGCTGCCGCCATGATCTGG
+GCCAGCGCCTCACCGGTGTTGGCCAATCGACGCAGCGCTCTTGCGGCGCCGCGCCAGCGGTACGCCGCTG
+CGGTGGGAACGGCGTTGGCCACCCAGGATATCGCGTTCGCATACTGCTGGATCTGCGGCGCGTCGATGTC
+GGCGCCGGAAACGCCGCCCGCGAACAGGCCGTGGCCCCGGGACAGCGCCGCTATCGCCTGCGTGGTCAGG
+GGATCAGTCAAGGGTTCGCCTTCGGTGCCAATCCTGTGCCATGTGCTCACATCCGTTGCCGGGTGCCATC
+ACCTCGGCCGTACCGACCAGACCACGACCTTGTCGATTGCGGCCGGTGCCCCTGCGCCACGACCATACTG
+CCGTTGACGCGACCCGACTACTCAGTTGTGGCGCGAAGGCCGACCTCGCCCCAGGGCGACTATTCCTTAA
+CCTTGTCGTCGTTCGGCACAACAAGGATCCGTCGCGTCGACTTGGTGACCACCGGCTTGTCGTCGGCAGA
+TTTCACCGGAACACTCGGCGGTACTGTTAAGCGGCCCTTGACCGGTTGACCATTCGGCACAGCCGGGGCC
+GTCACCCGCTTCTCGACCGGCTTGTCCTTATTGGCTCCTTCCGCGCCCGCACCCAACGCGCCCGGCGGCA
+CCATCGGCATGCCGGTCATGCCGGCCGGCCCCGACGCCCGCGGGGTGCCACTAACCGGGTCCGGCGTCAC
+CGACTTGGCCGGCGCCCCGGCTGGAGTCGTCGGTGGCGACGACGTCGGCACGGGTGGGGGACCCAGATAG
+CCCGTCGGGGTGGTGCCACCACCCCCGCCGCCGGCGCCGACGTCACCAGCGCCCGGCTCGCCGCCGAGGC
+CGGGCTCACCTTCGATGCTGTCCACCAGCCGCGCCCCGTCCGCGACGTCCAGTCCCTCCGCGCCATAGGT
+CTGTTGAAGCGCACTCATCAGCGGCTGCATTGCTCCCTGCCCCGCTTGCATGGCCTGCTGGGGAAGCTGC
+GTGAGTGGGCCCATGACGCCGCCGACCGCGCCGCCGAGCGCGCCGGTAATGCCCGACACCGCTTGTTGCA
+TCATCTGCGTCGCCCCCTGGGCCTCCGCCTGAGCGCCCACCCCCTGGAATTGTTGGGCCGCATCGGCCTC
+ATTCGCCGAGAACTTTTGCACGGCATCGGCCGCATGCGCCCGCCGATCTAGGTCCTCCAGGCCGCTGGAC
+TCGACGTCGCCGGGCACACCGGAATTACCGGCGGCGAAAAGTGCCCCATTAGCGATGTCGGCAGGTGCGG
+GTAGGTCTACGGGGACAGCGGGAAACGGCGCCGGTCCGGACGCTGGCGGCGTCGTCAAAACCTGCAATAA
+GATTTCCGGCGTCACCTTGATCGGAACTCCCGGAGCCGGGCCGGGTGCCGGATTCTGATCTCCGGTCATG
+ATCACACCTCGAACTTCATCGGTAGCGCCCCTTCGGACGCTCTTTCGTGTGCTTGTCGACATTGGCCGCA
+GCATCGCCATTTTGTCACGCCGCGCGTCGACCGGTATTCAGCTCACGGTGTCGGGCCTCGTATGGTGATC
+AGGGAGTTTCGGGCAGCGGTTCAGGCAGCGAACCCTCGTGAGCCGCCACGCCTGGTGGTTACGGCATACC
+AGGCCAGGTGATAGTTGGCGAGGTAGTCCTGCTCGTCGATCAGTGCCTCGATCGCCGCCAGCAGCATCCA
+ATCCCCGACAGCGGTGAGCTCGTGACTGGGATAGGCCTTGAGCACCGACTCCTTGACCGCGGTGATGCAG
+CCGTGCAGCAGCTCGGCTTCGTTTTCCAGCACGCCGGTTTTGCGTACCGCCGGCAGCGCGATCGCCTGCG
+CGATCCGCGGCAGGCTATCGCGGCGGCGCACAGCTTCGACCAAGGTCGGCCCGAACTCGTCCACCTTGGG
+TATCGCCGAGCGCGCTGACCGATCACCGGTCAGCGCAGGCGCATCTGGCCCCGGCTCGGCAACGTAGGTG
+TTGGACTCGTGGGCTGCCACGGCGACGACGGCGCCCAGCAAGTCGATCACGTCGGCATCACGGCGTCGCG
+CGGTTGGCTCCAGCAGCGTCACGTTCGCGGGCAGCCGGACGTGGGGCGGAATCCACCCGCCGGCCAAATC
+GGTGACCAGCAGGGTGGTGGTGCCGTCGTCGCGCAGCCCGGCCGCCCATGAGATTCGCGGCTCCTGGCGC
+GCCACGGCATCCACGATTCGCTGTAGGCGTTGCTGCTCAGCCGCCCGAGCCGATACCGCGCCCGCCGTCG
+CGCCGGCGGTGGCCGACAGTGCCGAGGCGCCGGCCATTGTCGACGAGCTCGCACCAGCCTGTCCAGCCAC
+AGCTTTCGAGGCTGCGCGCTCCACCGGAGAAACCAGCGCCCCACCCGCCGATGGGGCCGATGACGCCGAG
+GGCGCCACCGGCGCGCCGGATACGGGCGCCGTAGGAACCGAGGGCACGGCGGGGGCTGCCACGACGGGGG
+CCGTAGATCAGAGCCGTAAGCCGGCAGCGGTCCCGCGGGGACAGCCGAGCCACCAACCACCGGCGCAGCG
+GGTGCCGCCACCGGCCCGGCGGTCACCACGGTCGGCGCGACCGGCCCGGTAGTACCGGTCGACGCCGGTG
+GAGCGCCCGGGGTGTTCGCCGGCGTGTCAACTGGCCCGTGTGTGGCTTCGATGCCCGCAGCCATGGTCGG
+CGCAGACACCACGGGCGGTGTCGTTATCGGAGGAGTGGCCTGCGGCGGGGGAACCGACCCCGACTGCATC
+GCCGTCATTGCCCCTTCCGACAGCGAATGCGCGCCAGCCGCGGCCGGTTGCCCCGTCACCATCCCGGTCG
+CAAACGATTGCCCAATCGACGTAGGCGATACGCCCTGTCCGAGGGCCGCCGGCGACAGCGACCCGCCGGG
+CATCGCCACCGGGGGCCAGTGGCGATGACTGGCGGTGTAGCAGCGGCGGGTGTTGTGACCACCGGGGCAG
+GTGGTACAGGTCCTGCGCTGGCGTGCCGACTCGAAGCGCCTATTGCTCGCGGCGCCGGTTGTGAGCAGGC
+GGCCTGGACACCACTGCCAGAAAAGCCGCCAGCACCCACCGATTGTGGCGATGCCAGGTCTCCGGCGCCC
+TCAACACTCCCAAAGCTACCGCCACGCGCGCCGGGACCGGTCAGCGCTGCCAGATCGTTCTCCCTGATCA
+GGCGGGGTGGTGGTGCGTCGTCGACGTTGAAACCATTGGCCCGTGCCCACGTCCGGGGATCGTCACCGAT
+ATCTTCGGCTTCGAGGATCTCCTGCATGGCCGTCATGACCTTGTCGACGGCGTCCCGGGATGCGTTCGCC
+GCATCGGCATTGCACCTGGTTTGGATCGCCTGGATTTCCGCCAACTGCTCCGGCAACGGCTTTTTCGACG
+CAAGAACGTCGTCGATTTCCTTATTTCCTTCCCCTGCAATGCCGGTCAACCGGCTCCGCAAATAGTCGAT
+GGCGTCAGCGGCGGTATTGAAGGCGCCCTTCTTTATTTCGTACTTCTCTGCCTTAGTGACCTCGGATTTC
+GCTCCCCGAAGGTACCGGCCAATCAGGTCTTCGGCCGTTCTACCCTGATTCCGCAACAAAAGATCATGTT
+GGCTGATCAGATTCCTTGCGAGCTCTTGCTTTTGCATGGCCCAAGTGGCCCAGTGTTGCGCGGCGGCACG
+CAGGGCCGCCGACGGGGCCGGCCACCACGCCCCCACCAGCACCGCGCTCCACCTACCGGGCGGAAGATCA
+GCCGCCACCACATACCTGCTTCATAGCAGCATCTTTCACGTTGCCGTCGTCAAGTGCAGCCTGCCACTCA
+GCTTGAGTGCCACCACTCGCCATTACGATCGTTGTGCGGTAAGCGGTCGCTAGCGCGCGCGGCGTCGCGG
+TGTTTGGCATCTAGGGCGGGATCGGCTGCTGCATTGTCGAGGATTGCCGCAGCATTTGTGAGCGTGATGC
+GGGCCAGTGCCTTATCGCTCCCGTTCGTGTCAACTGGTACAGCATGGGCCACCAGCTTGTATGTGTCGCA
+CAATTGCCGCTGAGCCGCGGCAGTCTGGGCAGCGGTGTAGGTAGGCACCGAGGTCGTAGCCGGTGTAGCC
+GCGGGCCTGGCGTTTGTCAGGGCCACGATCAGCGCAGCGACCGCCACCACAGCAGCGATCGCGGCCACCA
+CGATGGCGGGCCAACTACGTGTGCGTGGTATGGGCCAGGGTGCTGGCGCGGTCACGCCGCAGATGGTATC
+CGCTGACCGCCTGTTTGCCGCTTGCACCAGACCACACCAACCCGGACACGCCGCGGCGGATGCGTTACGT
+CACCGGTGACCACGCGGTGCAGGTGTTCCAACTGACCAGCACCGTTATCGATCTCACCACCAAGCGCAAA
+CACACCACGGTCGTGTACGCGGCCACCTCCATGTCGGGAACGCCACCCCTGCACAGGTAGCCTGCTGGTT
+GCTGGGTCATTGCGCCATGCCTTCGAGAACAAATTGCATCGGATGCGCGACGTCACCTACGCAAAACCCC
+TCCCAAGTCCGCGCTGGTCAGGGCCCCAAGGTTAGGGCACCCGCGCAACAGCGCCGCCGGCCCGCTCCGT
+ATCGACGGCCACGACAACATCGCGTCCACGCTACGCCGCAATGACGCGGCCCTCGCCAGCCCGTTAAACC
+ATCACAGTCCTGTTGAAACGCCATTTTGCCGAGGCCTTGGGCGCATCGCCGGTAAGCGCTGCTGACCGCC
+CGGCTGAAATCGATGAGCATCACTATCTTATCTACTGTTTTAGTATGCGGATTGTCGCGACAATGGCATC
+GCACGAGAAACGTCAACCTAACCCTTATAGTCCTTCCAAAGGGTGAATAAGGGCTTACCTTCGCTATCCA
+GGAAAGAATCCTTTATCACGTTGACAGATACGTCTAGGTAATGTGACAATTCAACCAGTCGATCAGCCGC
+GGTAATTGCAACAACCGTTCCACTGGAATCGATAAGGGTATCCCGTTGCCGACCGGCAAACGTCATCGTC
+CCGATGCTATATTCCGGCATCAGCTCTTCGGGCTGAAAAGGTGCCCGGATCGCCGGCAGTTCACGCTCGC
+TTCGGACGGAGCCTCCGAAATACCCGTAAAGATATTTTTCGATCACGGACATTGATGCAGCGGCGAATTC
+ATAGCCTTCCCGGCTCATGCGATCGGATGACGTAATAACATACCATCCGGCGAGCCGGTCGATAAAGTAG
+CGGACTTCACCGCCCTTGTTCCAAAGGATAGTCCGGCCGTCATTCGTTTCCGACCCTTGGATCATGTTCA
+TGCCAGATAAGCGGATCCAGTCCTGCAAATCCGTTGACAGGTCCACACCTATTGTCACTGTCGCAACACC
+CCGCGCCTTATTAACTCTTCCACTTTGCGCATCTCGTTCTGATGATCGAATATCCGCACTTGGATGGATC
+CGCCCGGCTGGCCGCACCCCGGCGCGACCTCAGATACTTCGATGAACCATCCCTCAGGCAACCAATCAAT
+GGTATACGCGTGGTAGGGGTCGCGTAACGACGTCACGTGCAGGGCACGTTGTTCCCATGATGCCGGGCGC
+CCATGTTCCATGATCGCCAGGTACTTGCCCTGATCGCCGCCTATACGATCTAGCTGGGGGCCGTAGTCAC
+TAAGAAATTTTTCGAGATTAGTGTAGGCGATCCTTGTCCCTGGAACCGCACCATTGTTAGGCGGAAAATT
+AGAGTACTGCTGGCCCCATGGGCCTACACTATTAAATCGCTCTTGATACCGTTCTTGGGTATAGGGCTGT
+CCCTGAGGATCGCGGCCGAATGGGGCGTTGGGGTCCTCCATGAGCTGGGCCACAACCGGGTTTATCCGAC
+TGCGATCGGCCGGATTGTCTGTAAAGTCCCAGTGGCGCGATAATGGCTCGCCATACTGCGGGTCAACCGC
+TTCGTCGGATAACCGATGCCAACCCTCTCCAGCTGGTTCGTTCGAATGCATTGCAAGCTGCTGCTCGCGA
+TGCGGCGCATGCAGCCCAGGTGGCTCGCTACCGCTACCGTGGCCTGACCCGTGAGACGCACCGTCGTGGG
+TCGGCTCGGATCCGTGTGCGCTCAGTGATCGGCCGTGAGGCCCCGATTCGGTTGAGTGAACGCCTCCGGG
+CGTGGAATGCGGCGCCGCCGCGGGTGCTGCTGGTGTGGTCGCCCACTGGGGTTGGTGCGCGGTAGCGGGC
+GCTGACTCGACAGGAGGTCCGCCAAGCAACGTCGTCGCCGGTGGTGCTTGCGCCGGGACATGTTCACCCG
+GTTGCGGCAGGCCATGCGGCACATGTGTGCCGGGCGTGGTGGCTGCGGATACCCGGGGCTGGCCTGCCGA
+CGCCGACGACGGCGCCACCGGTTCAGCCGGTCTGTCGACGGGCGGCGGTTTGGATTCGGTGGGGCTGTGC
+GGCAGTGGACCGTTGGCGGGCACGGGCGCCGGTTTCGCCGCGGGCGCGGGTGCCGGGTGGCCCGATTCTG
+GTGGTTCGATCCGTGGTGGTTGCGGTCCTGGCCGCGGCGGCGTTGCTGGGGGCTCAAGGTGCGGTGTCGT
+CGGCTCAAGCCGCTCCTTGAGGCCTCGCACGCCCGCGAGAATGTCGCGGCCCTTGCTGCCAAGTTTCGAC
+AGCGGCCCGCCCGGCAAAGCTAGCGTCGCGGCGTCGAATACGGTCTTGCCTAGCGCCTCATTAGGGTTGG
+TCGTCCACTCATCCCAATGGATGAGGCTTTTGCCGAACTGCTTCCACGACTCCACAACGCCGGGAGCGTT
+CTCGCCGCCCAGGCCCGCCAGCGGCGCCATCCCAGTCAGCATCTCCTCCCAGGAGCGATACCACCCGAAC
+GGGTCTATCGAGGCGCGCAGTGGCCCTAGGTCCCAGGAGTCCTTGGCCATCCCGAAGGCCTCCTCGCCGA
+AGCCTTTGAGCTGCTGCCCGGTGCCATCGATGACCACACCCACCGGGTTGCTGTGCAAGAACCGATCCCA
+TTGTTTGCCTGCGTGGTCTGCCATCGCGGTGATCACCGCCTCGGCGTGCGACACCACCGCGGTGATCTCC
+GCAGCCAACGCGTCCACTTCCCCGCTGAACTGGTCGACCACCACCGCGATGTCATGGGCGATGCGCTGGA
+TCTCGTCTTCGTCCTGGTCGGTCAGAAACTCCCACACCTCTTTGATCCCGGTCAGCGGATCGCAGATGCG
+GGCCAACAAATCCAGGACCGCCGCATGCACCGCGTCGATGCGGGCGGCATAGGCGTCTAGCTGGGCCGCC
+AGCTGGTGGCATTGGCCCACGACAGCGGTGGTGCTGGCGTACGCGTCAGCAAACGCCGACTCGATCAGCC
+CCGCCTCCGGGAGCTGCTGGGCGCGAATAACGCCCATCGGCCCCGCCGTCGACTGAATCTCAGTCAGCGC
+GAACTGCGTGCCCGCGCTGCGCCACGCCACAGCCGCCGCACGTAGCTTTGTCGAATCCCCGTTCGGCCAG
+ATCATCCCGATATACGGGGCCACCCACCCCCAGCCCTTCGGGGCGCCACCGCCGCCACCGACCGCCGACG
+GCGGCGCACCCACGCCGACACAGCCGCTCGGCGGCGGCGCCGGCAACGGCGCCGCCCGCCCAGCGACATC
+CGACATCGCCTCGGCCAACGAGTAGTTGTGCGCGCTCATGCGCACCCCATCGCCGAGGTTGCACAATCCG
+TTGCGCGCCACCGACATCGCCTGCACCAGCGCGGCCGCCGAACCGTCATAGGAGCGCCCGAACACCGCCC
+CAGCCGGATCATCACCGGCCATCCCCGCACACCCGGCCAGCGCCGCGGTCAGCGACGAGATCACCGCACC
+CAAACCCGCACCCGCAGCCACCACCGCGCCGCCCGCGCTATCAAGGGCCGCGGGATCGACCGCCAACGGC
+GCCATCAGCTCACGACCACATACCCAAATTCGTGGCCACCGCGCCGGTGTAGTTGGCGTGCGCGCTCTGC
+CCCGCGGCCGTGAGCTGGGCCAACGCCTGGCGCATCATCGCCTCACCGGCAGCCCAATGTCGTTGCGCCT
+CAGCATGAGCCGCCGCGCCCTCCCCCGTCCACGTCACATGCAGCCGGGTAACCAAGGACTCAATCTCGGC
+GACCAGCTCCTCGACGTGGCGACCGAATTCGGCCATCCGCGCCACCGCATCAGCCAACACGGTCGGATCC
+ACCCGAAACGGCTCAGCCACCGCCCACCTCACGAAGCACCTGCGCCGACGCGGTCTCGTTGTGTTGATAA
+CCCGCACCGGCGTGAGCTATCGCCGCCGCCAGCATCGACAATCCCAGCTGCACCTCACCGGCCCCGCGAT
+GCCATAGCTCCTACGCCGAGCCATACGCACTGCCCGACGCCCCGCGCCACCCGCCCAACATCTGCCCGAC
+CTGAGCGTCCAGCTCGGCCAGTTGAACCGCGAGATGCTCGGCCGCTCCATCCAACGACGCGGCGAAACCC
+TGCATCACCGCAGGCTCTACGCGCAGCGTGTCGTCGGCACCCATGGCCGCAACCTAACAATGCCCAGGCA
+CCGCCACAATTCAGCCGCCCGGGCGCACCCGCCGCAGCCCTAAAGGCTGCTGGCGCCGTCGGCGGTGCCG
+TCGCCGTCGGTGTCGGTCAGCCGTACGTCCCAGCGGCCGTCGCCATCGGTGTCGACGTATCCGGTCACAC
+GCTGCTCACCAGCACACAGCACCCGATCGGCCAGCCCGTCACCGTCGGTATCGAGTAGCCGGTCGTCTAA
+ACCACCGAACCCGTCGAAGTCAACCAGTGGACCACCGGTGTGCTCGACGCCGTCGAGCCCATACCAGCGC
+AGTTGTCCGCCGCGGTCGACGGCGACCGCCCAGGTCCCCGATCCGTCGTCGATGAAGTAGCTTTCCGGGG
+TGCCGTCGTTGTCGACGTCGAATACGGCGTGGTCGGCAACGTCGTCGCCGTCGAAGTCGGCCAGCGCGTC
+ATCGCGCAGACCGTCGCCGTCGAGATCCAGGCCAATCGCGTCCAGCCGGCCGTCACCGTCGAGGTCGACG
+TCGAACGGGCGGTTCCAGATCCCGGCGCTGCCGTCGTCGCCGGCTATGCAGTACTCCACAACCGTTCTGA
+CGCGACTCCCAAGCTAGCGGTTCCCCCGTGATTTCCACCAGGACAGCAGCTCGGTTGTCGCCTCCTCGGT
+GGACAACGGGCCGCGCTCTAGCCGCAGCTCCTTCAAGTAGCGCCACGCCTCGCCGACTTGCGGGCCCGCC
+GGAATGTCGAGCACCGCCATGATCTGGTTGCCGTCCAGGTCGGGGCGCACCCGATCCAGATCCTCCTGGG
+CGGCCAGCTCCGCGATCCGCTCTTCCAGCCGGTCGTAACTGGCCTGCAACCGCGCGGCCCGGCGCTTGTT
+GCGGGTCGTGCAGTCGGCGCGCACCAGCTTGTGCAGCCGTGGCAGTAGGGCCCCGGCGTCGGTGACATAG
+CGGCGCACCGCAGAGTCGGTCCATTTCCCATCGCCGTAGCCGTGAAACCGCAGATGCAGGTAGACCAGCT
+GCGAGATGTCGTCGATCATCTGCTTGGAATACTTCAGCGCCCGCATCCGCTTGCGCACCATCTTGGCGCC
+GACCACTTCGTGGTGATGGAAGCTCACCCCACCGTCGGGTTCGTGACGGCGGGTGGCGGGCTTGCCGATG
+TCGTGCAGCAGCGCCGCCCAGCGCAACACCAGATCCGGGCCGTCGTCCTCCAGCGCGATCGCCTGCCGCA
+GCACGGTCAAGGAATGCTGATAGACGTCCTTGTGCTGGTGATGTTCGTCGATCGCCATCCGCATCCCACC
+GATTTCAGGCAAGACCACAGCACCCATACCGCTCTGCACCATCAGGTCGATACCCGCGGCCGGATCCTCA
+CCGACCAGCAGCTTGTCCAGCTCGGCGGCCACCCGTTCGGCGCTGATTCGGGCCAACTGCGGCGCCATCT
+CTTCGATCGCCGCGCGCACCCGCGGCGCCACCGCGAATCCAAGTTGCGAGACGAACCGCGCGGCGCGCAG
+CATCCGCAACGGATCGTCGCCAAAGGACCCCGACGGCGCCGCCGGGGTGTCTAACACCTTGGCCCGCAGC
+GCCGCCAAGCCACCAAGCGGATCCAGGAATTCGCCCGGCCCAGTGGCGGTGACGCGCACAGCCATTGCGT
+TCGTGGTGAAGTCGCGGCGGACCAGATCGCCCTCGAGGCAATCGCCGAAACGTACCTCTGGATGACGCGA
+AACCCGGTCGTAGCTGTCGGCACGGAATGTGGTGATCTCCATGCGGTGGTCGCTCTTACCCACGCCGACG
+GTGCCGAATTCGATTCCGGTATCCCACACCGCATCGGCCCACGGCCGCACGATCTCCTGCACCCGCTCGG
+GACGGGCGTCGGTGGTGAAGTCCAGGTCGGGGCTCAACCGGCCCAACAGTGCATCTCGCACCGAACCGCC
+GACCAGATACAACTCGTGTCCCGCGGCGGCGAACACCGACCCGAGTTCCCGCAATAAGGCAGCATGCCTG
+TTCAAGGCAACCGCAGCGGCGGTTAGCAGATCGGCTTCCTGGACGGCTTCCGGCACGTTCGATCAGCCTA
+ATGGCAGTCGAAGTGGGCCGGGACGGTCGGTGGAGGAACCGGCAACCCTCGTTGCCGCACCCGTCGCATT
+GGCCGGTGTCGGGACGAGGTGTCGTCGTGCCCATCTCCGCGCGACAAACAGCCGGCGACAATATTAAGAA
+TCCTTGGGTGCGGTCGCGTCTTGTCGCTCGAAGGTGGGCAAATCGTGCGCCCCCGACACAGCGACTTCTG
+TGATAGATGTGACTGGCGCGACTCAATTGGTCAGCGCGGGTCGCCTGCACCGCCCCGCTCCCTCGCCCAA
+CGAATAAGTCCTGGCCGACGATGGGCGCTCAGACGGCGAGTACATCGGGAACACCCGCCCGTACCAGCTA
+CTATCGCTGGGGTGTCCGACGGCGAACAAGCCAAATCACGTCGACGCCGGGGGCGGCGCCGCGGGCGGCG
+CGCTGCGGCTACAGCCGAGAATCACATGGACGCCCAACCGGCCGGCGACGCCACCCCGACCCCGGCAACG
+GCGAAGCGGTCCCGGTCCCGCTCACCTCGTCGCGGGTCGACTCGGATGCGCACCGTGCACGAAACATCGG
+CTGGAGGGTTGGTCATTGACGGTATCGACGGTCCACGAGACGCGCAGGTCGCGGCTCTGATCGGCCGCGT
+CGACCGGCGCGGCCGGCTGCTGTGGTCGCTACCCAAGGGGCACATCGAGTTGGGCGAGACCGCCGAGCAG
+ACCGCCATCCGCGAGGTCGCCGAGGAGACCGGCATCCGCGGCAGTGTGCTTGCCGCGCTGGGGCGCATCG
+ACTACTGGTTCGTCACCGACGGCCGGCGGGTGCACAAGACCGTCCACCATTATTTGATGCGGTTTTTAGG
+CGGAGAGCTGTCCGACGAAGACCTCGAGGTAGCCGAGGTAGCCTGGGTGCCGATCCGGGAACTGCCGTCT
+CGACTGGCCTACGCCGACGAACGTCGACTAGCCGAGGTGGCCGACGAACTGATCGACAAGCTGCAGAGCG
+ACGGCCCCGCCGCGCTTCCGCCGCTACCACCCAGCTCGCCTCGTCGACGGCCGCAAACGCATTCACGCGC
+TCGTCATGCCGATGACTCAGCACCGGGTCAGCACAACGGTCCCGGGCCGGGGCCGTGACCGCACTGCAAC
+TCCGCTGGGCCGCTTTGGCGCGCGTCACCTCAGCGATCGGCGTCGTGGCCGGCCTCGCGATGGCGCTCAC
+GGTACCGTCGGCGGCACCGCACGCGCTCGCAGGCGAGCCCAGCCCGACGCCTTTTGTCCAGGTCCGCATC
+GATCAGGTGACCCCGGACGTGGTGACCACTTCCAGCGAACCCCATGTCACCGTCAGCGGAACGGTGACCA
+ATACCGGTGACCGCCCAGTCCGCGATGTGATGGTCCGGCTTGAGCACGCCGCCGCGGTCACGTCGTCAAC
+GGCGTTACGCACCTCGCTCGACGGCGGCACCGACCAGTACCAGCCGGCCGCGGACTTCCTCACGGTCGCC
+CCCGAACTAGACCGCGGGCAAGAGGCCGGCTTTACCCTCTCGGCCCCGCTGCGCTCGCTGACCAGGCCGT
+CGTTGGCCGTCAACCAGCCCGGGATCTACCCGGTCCTGGTCAACGTCAATGGGACACCCGACTACGGTGC
+GCCTGCGCGGCTCGACAATGCGCGGTTCCTGTTGCCCGTGGTCGGAGTGCCACCCGACCAGGCCACCGAC
+TTCGGCTCCGCTGTTGCACCAGAAACGACGGCGCCGGTCTGGATCACCATGCTGTGGCCGCTGGCCGACC
+GGCCCCGGTTGGCCCCCGGGGCACCCGGTGGCACCGTTCCCGTCCGGCTGGTCGACGACGACCTGGCAAA
+CTCGCTGGCCAACGGCGGCCGGCTGGACATCCTCCTGTCGGCGGCCGAGTTCGCCACCAACCGGGAAGTC
+GACCCCGACGGCGCCGTCGGCCGAGCGCTGTGCCTGGCCATCGACCCAGATCTACTCATCACCGTCAATG
+CGATGACCGGCGGCTACGTCGTGTCCGACTCGCCCGACGGGGCCGCTCAACTACCGGGCACCCCGACCCA
+CCCGGGCACCGGCCAGGCCGCCGCATCCAGCTGGCTGGATCGATTGCGGACGCTAGTCCACCGGACATGC
+GTGACGCCGCTGCCTTTTGCCCAAGCCGACCTGGATGCTTTGCAGCGGGTTAATGATCCGAGGCTGAGCG
+CGATCGCAACCATCAGCCCCGCCGACATCGTCGACCGCATCCTGGATGTCAGCTCCACCCGCGGCGCAAC
+CGTGCTGCCCGACGGCCCGTTGACCGGCCGGGCGATCAACTTGCTCAGCACCCACGGCAGCACGGTTGCC
+GTCGCGGCCGCCGATTTTAGCCCCGAGGAACAGCAGGGTTCGTCCCAGATCGGCTCCGCGCTCTTACCCG
+CTACCGCGCCCCGGCGGTTGTCCCCGCGGGTGGTAGCGGCGCCGTTTGATCCCGCGGTCGGGGCCGCGCT
+GGCCGCCGCGGGAACAAACCCGACCGTTCCTACCTATCTAGATCCCTCGTTGTTCGTTCGGATCGCGCAT
+GAATCGATCACCGCGCGCCGCCAGGACGCCTTGGGCGCAATGCTGTGGCGCAGCTTGGAGCCGAATGCCG
+CGCCCCGTACCCAAATCCTGGTGCCGCCGGCGTCGTGGAGCCTGGCCAGCGACGACGCGCAGGTCATCCT
+GACCGCGCTGGCCACCGCCATCCGGTCTGGCCTGGCCGTGCCGCGACCACTACCGGTGGTGATCGCTGAC
+GCCGCGGCCCGCACCGAGCCACCGGAACCCCCGGGCGCTTACAGCGCCGCTCGCGGCCGGTTCAATGACG
+ACATCACCACGCAGATCGGCGGGCAGGTTGCCCGGCTATGGAAGCTGACCTCGGCGTTGACCATCGATGA
+CCGCACCGGGCTGACCGGCGTGCAGTACACCGCACCACTACGCGAGGACATGTTGCGCGCGCTGAGCCAA
+TCGCTACCACCCGATACCCGCAACGGGCTGGCCCAGCAGCGGCTGGCCGTCGTTGGAAAGACGATCGACG
+ATCTTTTCGGCGCGGTGACCATCGTCAACCCGGGCGGCTCCTACACTCTGGCCACCGAGCACAGTCCGCT
+GCCGTTGGCGCTGCATAATGGCCTCGCCGTGCCAATCCGGGTCCGGCTACAGGTCGATGCTCCGCCCGGG
+ATGACGGTGGCCGATGTCGGTCAGATCGAGCTACCGCCCGGGTACCTGCCGCTACGAGTACCAATCGAGG
+TGAACTTCACACAGCGGGTTGCCGTCGACGTGTCGCTGCGGACCCCCGACGGCGTCGCGCTGGGTGAACC
+GGTGCGGTTGTCGGTGCACTCCAACGCCTACGGCAAGGTGTTGTTCGCGATCACGCTATCCGCTGCGGCC
+GTGCTGGTAACGCTGGCGGGCCGGCGCCTTTGGCACCGGTTCCGTGGCCAGCCTGATCGCGCCGACCTGG
+ATCGCCCCGACCTGCCTACCGGCAAACACGCCCCGCAGCGCCGTGCCGTAGCCAGTCGGGATGACGAAAA
+GCACCGGGTATGAGACCCTCCCCTGGAGAGGTGCCCACGGCATCGCAGAGGCAGCCCGAGCTGTCCGACG
+CGGCGCTGGTATCGCACTCCTGGGCAATGGCATTCGCGACGCTGATCAGCCGGATCACCGGCTTTGCCCG
+GATCGTGCTGCTGGCCGCGATCTTAGGTGCGGCGCTGGCCAGCTCGTTCTCGGTGGCCAACCAGCTGCCG
+AACCTGGTCGCCGCACTCGTGCTGGAGGCCACCTTCACCGCCATCTTCGTACCGGTGCTGGCCCGCGCCG
+AGCAGGACGACCCGGACGGCGGCGCGGCGTTCGTGCGCCGTTTGGTCACGTTGGCAACCACCCTGCTGCT
+GGGCGCCACCACGCTGTCGGTGCTGGCCGCGCCACTGCTTGTGCGGTTGATGCTGGGCACAAACCCACAG
+GTTAACGAGCCGCTGACCACGGCGTTCGCTTACCTGCTGCTACCGCAAGTCCTCGTCTACGGCCTCTCGT
+CGGTATTCATGGCGATCCTGAACACCCGCAATGTGTTCGGGCCGCCGGCCTGGGCGCCCGTCGTCAACAA
+TGTCGTCGCCATCGCGACCCTAGCGGTGTATCTGGCGGTCCCCGGCGAGCTTTCAGTCGATCCGGTTCGG
+ATGGGCAACGCCAAGCTGCTGGTGCTCGGCATCGGCACCACCGCAGGCGTGTTTGCACAGACCGCGGTGC
+TGCTGGTGGCCATCCGGCGCGAGCACATCAGCCTGCGCCCCCTGTGGGGAATCGATCAGCGGCTCAAGCG
+CTTTGGCGCGATGGCCGCCGCGATGGTGCTCTATGTGCTGATCAGCCAGCTCGGCCTGGTGGTCGGTAAC
+CGGATCGCCAGCACGGCAGCGGCTTCCGGCCCCGCGATCTACAACTACACCTGGCTAGTGCTGATGTTGC
+CATTCGGCATGATCGGCGTGACGGTGCTGACCGTGGTGATGCCGCGGCTGAGCCGCAATGCCGCGGCCGA
+CGATACCCCGGCCGTGCTCGCCGACCTGTCGCTAGCCACCAGGCTGACCATGATCACGCTGATCCCAACG
+GTGGCGTTCATGACGGTCGGCGGTCCGGCGATCGGTAGCGCGCTTTTTGCATACGGCAACTTCGGCGACG
+TTGATGCCGGGTACCTGGGGGCGGCGATCGCATTGTCGGCGTTCACGTTGATCCCCTATGCGTTAGTGCT
+GTTGCAGCTACGCGTGTTCTACGCCCGCGAGCAGCCGTGGACACCAATCACGATCATCGTGGTCATCACC
+GGCGTCAAGATCCTCGGCTCGCTGCTGGCGCCGCATATTACCGGTGATCCCCAGCTGGTCGCGGCCTATC
+TCGGGCTGGCTAACGGACTCGGATTTCTCGCCGGCACGATCGTCGGCTACTACATACTGCGTCGGGCCCT
+GCGGCCCGACGGCGGCCAGCTGATCGGCGTCGGCGAGGCGCGAACCGCCCTGGTGACCGTCGCCGCGTCG
+TTGCTTGCCGGACTGCTGGCACACGTGGCCGATCGGTTACTAGGGCTAAGCGAGCTGACGGCCCACGCGG
+GCAGCGTCGGTTCGCTGCTGCGGCTGTCGGTGCTGGCTCTCATCATGCTGCCAATTCTGGCTGCGGTCAC
+CCTCTGCGCACGGGTGCCCGAGGCGCGGGCGGCGCTGGATGCCGTGCGAGCCCGAATCAGGAGCCGGCGC
+TTGAAGACCGGGCCTCAGACCCAGAATGTCTTGGATCAATCGTCTCGCCCCGGACCGGTCACGTACCCTG
+AGCGGAGGCGTTTGGCCCCGCCGCGGGGGAAAAGTGTGGTCCACGAGCCGATCCGGCGCAGGCCTCCGGA
+GCAGGTAGCCAGAGCCGGGAGAGCGAAAGGACCGGAGGTGATCGACCGCCCATCGGAGAACGCCTCGTTT
+GGTGCCGCGTCGGGTGCCGAGCTGCCGCGGCCCGTCGCCGACGAGCTTCAGCTCGACGCGCCAGCCGGCC
+GTGACCCCGGCCCCGTTTCCCGGCCGCACCCATCCGACCTGCAAAACGGCGATCTGCCCGCCGATGCGGC
+CCGTGGGCCGATTGCGTTCGACGCGCTCCGCGAACCGGACCGAGAATCGTCGGCCCCCCCAGATGATGTG
+CAGCTGGTTCCCGGCGCCCGCATCGCTAACGGCCGCTACCGCCTGCTGATCTTCCACGGGGGTGTACCAC
+CCCTGCAGTTCTGGCAGGCGCTTGACACAGCGCTGGACCGCCAGGTGGCGCTGACCTTCGTCGACCCGCA
+GGGCGTCCTGCCCGACGACGTCCTCCAGGAGACCTTGTCCCGTACGTTGCGGCTCAGCCGGATCGACAAG
+CCCGGTGTCGCCCGAGTGCTTGACGTCGTGCACACCCGGGCCGGTGGTCTGGTAGTCGCGGAGTGGATCC
+GCGGCGGTTCGTTACAGGAAGTCGCCGACACCTCACCGTCGCCGGTTGGCGCCATCCGGGCGATGCAGTC
+CCTGGCCGCGGCCGCAGATGCTGCCCACCGCGCCGGTGTTGCGCTGTCGATCGACCATCCCAGCCGGGTG
+CGCGTGAGCATCGACGGCGACGTCGTGCTGGCCTACCCGGCGACCATGCCGGACGCCAACCCGCAAGACG
+ACATCCGCGGCATCGGCGCCTCCCTGTACGCCCTGCTGGTCAACCGGTGGCCGCTGCCGGAGGCCGGCGT
+GCGCAGCGGGTTGGCACCCGCCGAGCGCGACACCGCTGGCCAGCCCATCGAACCCGCCGACATCGACCGT
+GACATCCCCTTCCAGATTTCCGCGGTGGCGGCCCGGTCGGTTCAAGGAGACGGCGGGATACGCAGCGCGT
+CAACGCTGTTGAATCTAATGCAGCAGGCGACCGCGGTGGCCGATCGCACCGAGGTGCTGGGACCGATCGA
+CGAAGCACCGGTCTCCGCGGCCCCGCGCACATCCGCGCCCAACAGCGAAACCTACACCCGCCGCCGTCGC
+AACCTGCTGATCGGCATCGGCGCGGGTGCTGCCGTCCTCATGGTGGCCCTGCTGGTCTTGGCTTCGGTGT
+TGAGCCGGATATTCGGCGATGTCAGCGGCGGCCTCAACAAGGACGAACTGGGCCTCAACGCACCCACCGC
+GTCGACCTCGGCGGCCAGTTCGGCGCCGCCCGGCAGCGTCGTCAAACCCACCAAGGTCACGGTCTTCTCC
+CCCGACGGCGGCGCCGACAACCCCGGGGAGGCTGATTTGGCCATCGACGGCAATCCGGCCACTTCCTGGA
+AGACCGACATCTATACCGACCCCGTCCCGTTCCCTAGCTTCAAGAACGGAGTCGGTTTGATGTTGCAGCT
+GCCCCAGGCCACGGTGGTCGGCACCGTCGCCATCGACGTGGCCAGCACCGGCACCAAGGTGGAGATCCGC
+TCGGCATCCACGCCGACGCCGGCAACGCTGGAGGATACCGCCGTGTTGACTTCGGCCACCGCGCTGCGGC
+CCGGCCACAACACCATCTCGGTCGAGGCGGCCGCGCCCACCTCGAATCTGCTGGTGTGGATCTCTACCTT
+GGGAACCACCGACGGAAAGAGTCAAGCCGACATCTCGGAGATCACGATTTACGCCGCGTCCTGACCGGGC
+CGGGCACGGCCAGCCAGGGTGAAGTGCTATGCCGCCACCGATTGGTTACTGTCCGGCCGTGGGTTTCGGG
+GGCCGTCACGAGCGCAGCGACGCCGAGCTGCTGGCCGCCCATGTCGCCGGCGACCGGTACGCCTTCGATC
+AGTTGTTCCGCCGTCATCACCGCCAGCTACACCGGCTCGCGCGGCTCACCAGCCGGACCTCCGAGGACGC
+CGACGATGCGCTGCAAGACGCGATGCTGTCAGCGCACCGCGGCGCCGGCTCGTTCCGGTACGATGCCGCC
+GTCAGCAGTTGGTTGCACCGCATCGTGGTCAACGCTTGCCTGGACCGGCTGCGTCGGGCCAAAGCCCATC
+CGACCGCCCCTCTAGAAGATGTCTATCCGGTCGCGGACCGGACCGCGCAGGTCGAGACCGCGATCGCGGT
+GCAGCGGGCACTGATGCGGCTGCCCGTCGAGCAGCGGGCCGCGGTGGTCGCCGTGGACATGCAGGGCTAT
+TCGATCGCCGACACCTCCCGGATGCTGGGCGTGGCCGAGGGCACCGTCAAGAGCCGCTGCGCCCGGGCGC
+GGGCCCGCCTAGCGCGGCTGCTGGGCTATCTCAACACCGGGGTGAACATCCGGCGCTGACCCCGTTGCCG
+GTCCGTCGTAGCATCGATCCACGGGCTCGCCGCTACCCCACATCTGGCTATTGCCACCGGGCATGACGGA
+CACTGGGGCCGATGAGTGCAGCCGACAAGGATCCAGACAAACATAGCGCCGATGCGGACCCGCCGCTGAC
+CGTTGAGCTGCTGGCCGACCTGCAAGCAGGTCTGCTGGACGACGCAACCGCCGCCCGCATCCGCAGCCGG
+GTCCGCTCAGACCCGCAGGCTCAGCAAATCCTGCGCGCGTTGAACCGGGTACGCCGCGATGTCGCCGCGA
+TGGGTGCCGACCCCGCTTGGGGGCCAGCTGCTCGCCCAGCGGTCGTCGACAGCATTTCGGCGGCCTTACG
+GTCGGCGCGCCCGAACAGCTCACCCGGCGCCGCTCACGCCGCCCGTCCGCACGTCCACCCCGTCCGAATG
+ATCGCCGGCGCGGCCGGATTGTGCGCCGTGGCCACAGCGATCGGTGTCGGCGCCGTGGTCGATGCACCGC
+CACCCGCACCGAGTGCACCGACAACCGCGCAGCACATCACGGTGTCAAAACCTGCCCCGGTGATTCCGCT
+GTCTCGGCCGCAGGTTCTCGACCTGCTTCACCACACCCCGGACTATGGCCCACCCGGAGGCCCGCTGGGC
+GATCCGTCCCGGCGTACGTCCTGCCTGAGCGGCCTCGGCTATCCGGCGTCCACGCCGGTGCTGGGCGCGC
+AGCCGATCGATATCGACGCTCGGCCCGCCGTACTGCTGGTGATACCCGCGGACACGCCCGACAAACTGGC
+CGTTTTTGCGGTCGCGCCGCACTGCAGCGCCGCCGATACCGGGTTGTTGGCTAGCACCGTGGTCCCCCGC
+GCATGATGGGTCTGGGTGCTGTCGCTCGCCTGCGGGAACAGCAGTGCCTACGCTGGCGTTCGTTGTCTCA
+AGATCTGCCCTCGCACTCGAAAGGCTCGCATGACCGCCCCGCCTGTCCATGACCGCGCACACCACCCCGT
+TCGCGACGTGATCGTTATCGGCTCCGGTCCCGCGGGGTACACTGCGGCGCTCTACGCCGCCCGTGCCCAG
+CTGGCGCCGCTGGTCTTCGAGGGCACGTCTTTCGGCGGCGCGCTGATGACCACCACCGGCGTGGAGAACT
+ACCCGGGATTTCGCAACGGCATCACCGGTCCAGAGTTGATGGATGAGATGCGGGAACAGGCGCTGCGATT
+CGGCGCGGACCTGCGTATGGAAGACGTCGAGTCGGTATCACTTCACGGGCCGCTGAAATCGGTCGTCACC
+GCCGACGGACAGACCCACCGGGCCCGAGCCGTGATCCTGGCAATGGGCGCAGCGGCACGCTATCTGCAGG
+TGCCCGGCGAACAGGAATTGCTCGGGCGCGGGGTGAGCTCGTGCGCCACCTGCGACGGATTCTTCTTCCG
+CGATCAGGACATCGCCGTCATCGGCGGCGGTGACTCGGCAATGGAGGAAGCTACCTTCCTGACCCGATTC
+GCTCGCAGTGTGACGCTGGTGCATCGCCGCGACGAGTTCCGGGCTTCCAAAATCATGCTCGATCGCGCCC
+GCAACAACGACAAGATACGGTTCCTCACCAACCACACCGTGGTCGCGGTGGACGGGGACACCACAGTGAC
+CGGCTTGCGGGTACGCGACACCAACACCGGTGCCGAAACCACCCTGCCGGTAACCGGTGTTTTCGTCGCG
+ATCGGCCACGAGCCGCGGTCGGGCTTGGTGCGCGAGGCCATCGACGTCGACCCGGACGGCTACGTGTTGG
+TGCAGGGGCGTACCACCAGCACCTCACTGCCGGGCGTGTTCGCTGCCGGCGACCTGGTGGATCGCACCTA
+TCGCCAGGCGGTTACCGCAGCGGGCAGTGGCTGCGCCGCGGCTATCGACGCCGAGCGCTGGCTCGCCGAG
+CACGCAGCAACCGGAGAAGCTGACAGTACCGACGCATTGATAGGAGCACAACGATGACCGATTCCGAGAA
+GTCCGCCACCATCAAAGTTACCGACGCATCCTTTGCCACCGACGTGCTATCCAGCAACAAGCCTGTGCTG
+GTTGACTTTTGGGCGACATGGTGTGGACCTTGCAAGATGGTAGCGCCCGTTCTCGAGGAAATCGCCACCG
+AGCGCGCAACAGACCTCACCGTCGCCAAGCTCGACGTGGACACCAACCCGGAGACCGCCCGCAACTTCCA
+GGTCGTCTCGATCCCTACCCTGATCTTGTTCAAGGACGGCCAGCCGGTGAAACGAATCGTTGGCGCCAAG
+GGTAAGGCTGCGTTGCTGCGCGAGCTCTCAGACGTGGTTCCCAACCTCAACTAGCCCCCGCGGTTAGCCT
+GGGGTTTTCCCGAAATCGGCAAGGATCTGCGACAATACCGGTTGGCTGGTCCGCATTGTCAACGATGTGA
+GCTAATCCCGGAGGGCCCTTGGTATGCCGAGTCCGCGCCGCGAAGACGGCGATGCGCTGCGCTGTGGCGA
+CCGCAGTGCGGCCGTCACCGAGATCCGGGCTGCGCTGACCGCGTTAGGGATGCTGGATCATCAGGAAGAA
+GACCTGACGACGGGCCGTAACGTCGCCCTTGAGTTGTTCGACGCGCAGCTCGACCAGGCGGTCCGTGCCT
+TCCAACAGCATCGCGGCCTGCTGGTGGACGGCATCGTCGGTGAGGCCACCTACCGCGCGTTGAAAGAAGC
+CTCCTACCGGCTCGGGGCCCGCACGCTGTACCACCAATTCGGCGCCCCGCTCTACGGGGACGACGTCGCT
+ACACTGCAGGCCCGGCTGCAGGATCTTGGTTTCTACACCGGGCTGGTCGACGGTCATTTCGGGTTGCAGA
+CCCACAATGCGTTGATGTCCTATCAGCGTGAGTACGGACTTGCCGCAGACGGTATCTGCGGCCCAGAAAC
+GTTGCGCTCCTTGTACTTTCTAAGTTCGCGAGTCAGCGGTGGCTCGCCACATGCGATTCGCGAAGAAGAG
+CTGGTCCGCAGCTCGGGGCCGAAGCTGTCTGGCAAACGGATCATCATTGATCCCGGTCGCGGCGGCGTGG
+ACCACGGACTTATCGCGCAAGGTCCGGCTGGGCCCATCAGCGAAGCAGACTTGTTGTGGGACTTGGCAAG
+TCGGCTCGAAGGACGGATGGCAGCTATCGGTATGGAGACCCACCTGTCCCGTCCGACCAACCGTAGTCCG
+TCCGACGCAGAGCGTGCCGCCACCGCCAACGCCGTTGGCGCAGACCTGATGATCAGCCTGCGCTGCGAGA
+CCCAGACCAGTCTCGCGGCCAACGGCGTGGCTTCCTTTCACTTCGGCAACTCGCACGGCTCGGTGTCTAC
+CATCGGCCGCAATCTTGCCGATTTCATTCAACGAGAAGTGGTGGCGCGCACCGGTTTACGGGATTGCCGT
+GTGCATGGTCGAACGTGGGATCTGTTGCGGCTGACCAGGATGCCGACCGTTCAGGTCGATATCGGCTACA
+TCACCAACCCCCACGATCGTGGGATGCTGGTCTCAACGCAGACGCGCGATGCCATCGCCGAAGGCATTCT
+CGCCGCGGTCAAACGGCTGTATCTGTTAGGCAAGAACGATCGGCCCACCGGCACATTCACTTTCGCCGAG
+TTGCTGGCCCACGAACTGTCTGTCGAGCGAGCGGGTAGACTCGGCGGTTCTTAAGCCCAGTGGCCGCGTG
+GGGTTTACGACGTGTTGCCGGCCGTCGACCCCGCTGCTATCGGCTCTTGCAGTCGAGCATTCTCCAGCAA
+GCGTTCAAGAGCGGCCTCGACTTCGGCTTTCCACCCCAGCCCTTTGTCCAGTTCGAGGCGTAGCCTCGGA
+AAGTACGGGTGCGGTGCCACCACGACGAAACCCACGTCCATCAAGAAGTTCGCGTCGATGATGCAGTGTT
+CGACACAGCAGTCGCCGAGGGCCTCCAACACCGGCCGCACATCAGGTGTTACCGCGCCCGGGTTTTGCAA
+ATCGGTGGCCGCTGGTGTCCGGCCGAAAGCTTCCAGCGCCCGGACGCCGCGCCGAACCAACTCTTCAATC
+ACCCGGGCAATCAGACTGTGCGGTAAGTCGTCATCTGCTTGCCCGCGCTCGATGCCCATCGACGTAAGCA
+GCACCGCGTCCGCCGACACCGGCGCGGTAGGAAACCGCTGGGCTCGCGGCACCGCACTGGGCGGAGCGTA
+GAGCACATACCCGAGGCAGGGTGGTTCGGCGTGGCTGCGCTCATCCGGGACTGCCGTTGCGACCTGACCG
+CACGAACCCCACTCCAGCATCACCATCGACAACCAGGCTTCCTTTTCGAATTCGGGGTCGGCGAGGTGGT
+CGTCTTTGCCGAGAATCGCGGGGTCGACCTCCCAGAAAACGCAGCGCCGCGCATGCTTGGGGAGCTGCTC
+GAAGGCTTCGAGTCGTAACGCTGTGATACGAGCGGACACTAGTCTCCTGGCCTCCGTGCGGCATTGCAAC
+CGATGGCCCTACACCTCCGCGGGCCAATGTGCACCAGCAACCCTTCTAGAATAAGAGAGTCGATCGCTAT
+CGGGCCAGTATTCGCGATGCCACTCCAGCCGACTTGCACCGCATCGTGTCCGGCCGGTGACAATTGTCCG
+GTCCATTGCCCCGTCCAATCTCGAATCCGCTTGCCGCACACCGCGTCTCCGTTGATTCCCGCTCCCCGCA
+GCGGGTTGGCTTAGGCGCCGGAACCGGCGCGTTGTCACAGTGACGTAATTACAGAGCGTCCCTGTGCAGG
+CCTTTATCTCGGCCATCAGTGGTCATCAAACCGACTATGCGCGCTAAATCATCGACCGAGCCGAACTCCA
+CCACAATCTTACCCTTGCGTTTGCCCAGACTGACGGTCACCCGCGTGTCAAAGGTGGTCGATAGACGCTC
+AGCAACATCTTGGAGGCCAGGCATCTGAATCGGCTTACGCCGCGGCGGCGCGGGTGTAGTCGCGTCGCTG
+TGATGGGCTTGGCGATTGGCCTCGTGATTGGCCAGCGTGACCGTCTCCTCGGTGGCTCGCACCGACAGGC
+CCTCCGCGACGATCCGGCTCGCCAGCTCCTCTTGCGCCTCCGGTCCGGCCTCGAGCGACAGCAGGGCGCG
+AGCATGCCCGGCCGACAGCACGCCGGCGGCCACTCGCCGCTGTACCGGGATGGGGAGTTTGAGCAATCGG
+ATCATGTTGGTGATCAAGGGCCGCGAGCGGCCGATGCGCGCCGCCAGTTCATCGTGGGTGACCCCGAATT
+CGTCGAGCAATTGCTGGTATGCCGCCGCTTCTTCTAACGGATTCAGCTGTACTCGATGAATATTTTCCAG
+GAGGGCGTCGCGCAGCAGATTATCGTCGCCGGTCTCACGCACGATGGCCGGGATGGTGGCCAAGCCCGCC
+TCTTGGGCAGCCCGCCAGCGCCGCTCCCCCATCACTATCTGGTAGCGCACGCCGGTTTGGGATCCAGCCA
+ATGACCGCACCACGATCGGCTGCAGGAGACCGAATTCGCGGATGGAGTGCACCAACTCGGCCAGTGCCTC
+TTCGTCGAACACCTGACGCGGCTGACGGGGATTAGCCTCGATGGCGCTCGGTGGGATTTCCCGATAGATG
+GCGCCCATCACGGAAGTGTCCGGGACCGGTCCGCCGATTACGACATCTGCCGTGGCAGATCCCATCCGGG
+GACCCAAGGTCGGTGGCCCCGATTCTCCGTCTGCCGGGCCAGTCGGGATCAGCGCAGCCAGGCCACGGCC
+GAGGCCACCCTTTCTGCGTGACGGCTGGGTCATGGTCGTCCCTTCGCGGATGGTGGTCGGTCACGCTCGG
+CAAGTTCGCGGCTCGCGTCGAGGTAACTCATCGCGCCGCGCGAACCGGGATCGTAATCGATGATGGTCAT
+GCTGTAGCCCGGCGCTTCGGAAACCTTGACGCTGCGTGGAATCACCGTCCGCAACACTTTGCTTCCGAAA
+TACTGACGGACCTCGTCGGCTACTTGATCGGCGAGCTTTGTCCGGCCGTCATACATGGTAAGGATCACGG
+TGGTGACCTCGAGTTGGGGGTTGAGGTGGGCCTTCACCATCTCGATGTTGCGCATAAGCTGCGACACACC
+CTCCAACGCGTAGTACTCGCATTGGATCGGGATCATCACCTCCGGTGCCGCGACGAGTGCGTTGATGGTC
+AGCAGCCCCAGCGAGGGCGGGCAATCGACGAAAACGTAGTCGAAGTCGAAGTTGTCGAGTGCGGCCAGGG
+CGGTGCGCAACCGGTTCTCGCGCGCCACCATGCTCACCAATTCGATTTCGGCGCCGGCCAGATCGATCGT
+CGCCGGGATGCAGAACAGCCGCTCGCTGTGCGGGCTGCGCCGTAGCGCCGTGTGCAACGAAACCTCGCCG
+ATAAGCATCTCGTAGGACGAGGGTGTGCCGGATTGCCGGTCGGTGATACCCAATGCGGTGCTCGCGTTGC
+CCTGGGGATCGAGATCGATCACGAGTGTCTTGAGGCCCTGCACAGCAAGCGCGGCAGCGATATTGACGGC
+GGTGGTCGTCTTACCGACCCCGCCCTTCTGATTCGCGATGGTGAGCACCCGGCGTCGACCCGGCCGCTGC
+AGCGGCTCGTGGGTGGTGTGCAGGACCCGCATCGCACGTTCTGCTGCAGCGCCGATGGGGGTGTCGAATT
+CTGTCGATGTTTCACGTGAAACATTCATCGTCGGATTGTGCGCGGCCTCAGGCGTCGGTGTCGGTGGTGT
+CATTTCCCGCTGGAATGGTTCGATAGTTGAAGCCTGGCCCGACCTTACGAGCGCGGACGGTCCAGCGGCC
+ACCGGGCCCCACGGAGCACTCACGCCGTCCCTCCACTCGCCATCCGTGCCGACCCTCGGGCGATCTGCTT
+TCCACGTCGCGCGAACACCACGGTCGCGGGCGGACGCAAATAGTTCGCGCCACATGTCACCACCCTGACA
+TCAACCGCGCCCGATGCGATCATCACACGCCGGTGCTCCCGTACTTCGTCGTGAGCCCGCTCGCCTTTGA
+TGGCGAGCATTCGCCCGTTCGGCCGTATCAACGGCATGCTCCATTTCGTCAACTTGTCCAACGCGGCCAC
+CGCCCGTGACACCGCAGCGTCGCTGCCGCCCAATTGGTCCTGCACCCAGGACTCCTCGGCGCGCCCCCGC
+ACGATCTCAACGGCCACGCCCAGATCTGTCACCATCTCTCGAAGAAACTCGGTGCGGCGCAGTAGCGGTT
+CTAGGAGAACTACCTGGAGGTCCGGCCGCGCTATCGCCAATGGCACGCCCGGCAACCCGGCTCCGCTACC
+GATATCCACGACCCGGTCACCGCGTTCGAGGAGCTCACCGATCACGGCGCAGTTCAGTAGATGCCGGTCC
+CATAGCCTACCGACTTCGCGGGGTCCCACCAGCCCCCGCTCCACACCGGGTCCCGCCAACGCTTCGGCGT
+ACCGCCGAGCAAGGCCAAGCCGCGGTCCGAAGATCGCAGACGCCGCGGGCTCGATCGGAGACATTACGCA
+CTCCGCCGGCTCGTGAGGTCTGTGTCATGTTTCACGTGAAACATTCTCCGCTCTCGAGACGCTGGCCCAG
+CCGCTCGGCCACGCATCGCTTACTGCGGCGTCGGTCGGAGCCGCTGGCTCGCGAGCTAGTCGCGGAGCAC
+AACGACTCGGCGTTCTGGCTCCACGCCTTCGCTTTCGCTGTGCACACCTGGCACCGCTGCAACCGCATCG
+TGGACGATCTTCCGTTCGAACGGCGTCATTGGAACGAGTTCCTCGCGGTCACCGGTTTCGGCCACTCGCC
+GCGCCACCTCGTCGGCCAGCGCCGCCAATTCCTCCCGGCGCCGCCGTCGCCACCTCGCGATGTCTAGCAT
+CAACCGGCTCCACACACCGGTCTTCTGATGCACCGCCAACCGGGTGAGTTCCTGCAGAGCGTCGAGCACC
+TCGCCCCCGCGCCCGACCAACTTGTTCAGGTCGTCACTGCCGTCGATGCTCACCACCGCACGATTGCCTT
+CGACATCGAGGTCGATGTCGCCATCGAAGTCCAACACGTCCAATAACTCTTCCAGGTAGTCGCCTGCAAT
+CTCGCCCTCGGCGACCAATCTCTCTTCTTGATCGTCGGCCTCGTCAGCATCCGTCGCCGTGTCCTCCCGG
+ACGCCTCCACCCGGTGCTTCTGCGTCGACGTCGAAGTCGGTGGTGTCAGCGTCGGCCATGGCTTGCTCTC
+CCCTCGTCTGCGGGTGGGTTGTGTTTGTGGGACCGCCTGCCCGGCTGCCCGGAAGGATTGTCAACGTTTG
+CGTTTTTTCGGTCGCACCCCGGGCCGCGGCGTACGGGCGCTCGGGCCGCTGTTGCGTCTGGCCGGATTGG
+ACGTGTCGGCTGGTCGCTCAGTGCTGGCGTCCGACTCTGCCCCGTCATCGGTGTCCCCGGCTTCTGTTGG
+GGCTGCCGCATTGGTCGCTGGAGCGGTCTTCGGGCTCCGCTTGGGCTTAGCTCCCGGGGCCGGCGCGTTG
+GCCGCCCGGCGCCGGACCGCCTCCTGCTTTTTGGCCTCCTCCTCCTTTTCGATCATGCCGAAGACGTAAT
+GCTGCTGCCCGAACGTCCAGATATTGTTCGAGAACCAATACAAGATGATCGCCAGTGGCAGGAACGGTCC
+GCCGACGACTACGCCGAGCGGAAATACGTACAGCGCCAGCTTGTTCATCATCGCGGTCTGTGGATTCGCA
+GCCGCCTCGGCGCTCTGCCGCGCGATAGACGCGCGACTGTTGAAGTACGTCGCGATGCCGGCCAAGATCA
+TCACCGGCACACCCACCGCGATCAACGCAGGGCGACTGAAATCGACGAACGCATCCAACCCGGACCGTTG
+CGTCATGTACGCCCCGATCGGAGCGCCGAACAAGTTGGCATCTAGGAAGTGGCCGACGTCGACCGGGCTA
+AAGACGTAGTTCCCAGTCAGTCGGTTCTCGATCACCGACAAGTGTGGTTGACCAAAGCCCCCGGTCGTAC
+GGTTAAACGAGCGCAACACATGATAGAGCCCAAGAAACACCGGAATCTGCGCCAGCATCGGCAAACATCC
+GAGAATGGGGTTGAAGCCGTGCTCGCGTTGCAGCTTTTGCATTTCGAGCGCCATCCGCTGACGATCCTTG
+CCGTATTTCTTTTGCAAGGCCTTGATCTGTGGTTGCAGTTCCTGCATCTGCCTGGTGGTGCGAATCTGGC
+GCACGAACGGCTTGTACAGCAGCGCACGCAGCGTGAAGACCAGGAACATCACCGACAACGCCCAGGCGAA
+GAAGTTGGATGGTCCTAGCACAAACGCGAACAGCCGGTACCAAACCCACATGATCCACGACACCGGGTAG
+TAGATGAAGTCGAGACTGAAGAAATCAAACAAAAGACTCACGCTCCCCTCGCTTTGACGCAGGGTTCCAG
+TCGTCGTTCGCGCCGTCGACGTCTGTCTGGCAGCTCCGGCCTGTCGTTAAGCCTTCCGGTATCGGATCCC
+ATCCTCCCCGATGCCATGGTCCGCACTTTGCGAGCCTGATCATGGTCAACCAGCTTCCCCGCAACAGGCC
+ATACTCGGTGAGCGCATCGACGGCGTACTGACTACAGGTAGGGACAAAGCGGCACGACGCCGGTCGTAGC
+GGCGAAAGCATGTGCCGATAGACCTGGATAACGAAAATCAACCCCCGCGCTGATGCTCTACCGGTAACCC
+GGACCACGCGCCCACAGCTTTGCCTAGACAGACTCACCGATCACTACCTGCCAGTTCGACAGCCCTCCGC
+AAGCCGCATCGCAGTTGCTGCTCCAACCGAGCCGAGGAGACATGCCGGCTGCTCGGCAGCGCGCGGATCA
+CCACATGATCGGACGGGTGGAGTTCTTTGACGATCGACCCAGCCACGTGCCGCAGCCGACGTGCCACGCG
+GTGGCGTTCCACGGCCGACCCCACCGACTTGGCGATAATCAGTCCGACGCGCGGCCCACCGCCACTCCCA
+CGCCACCAATAAACGACCATGTCAGACCGCACGGTACGCATCCCGTGCTTCACCGTTGTTTCAAAATCCG
+CTGACCGCCTCATGCGGTTGCGTGCACGAAGCACCGCAAATAAGCCCGGTGTTGCAATCAAGCACTGAGC
+GTGCGCCGACCCTTGCGTCGCCGGCTGGACACAATTGACCTCCCGGCGCGGGTACGCATCCGTAAGCGGA
+AACCGTGAACACGAGCTCGCCGCCGGTTGTTCGGCTGGAAGGTCCTTTTGCCCTTGGTCACGGGCGTCTC
+CTCGCTATGTCTGGCAACATCACCATCCGGCCACTCACTGCCTTCCAACTCGATTGGCCCGCGGGACAGT
+CGGAGGTGGTTTTCGCTGCTGGCCGGCGCGGTCCCTGGACTAATCCAGGTCGCAGCCGCATCGCCGACTT
+TCGGGCGACTGTTCGAGGGTACTTACGCGCCTTCGCCTGGTCAAACCTCGCCCACCCGGCAACCGCTTCA
+GGGCATCCTGCCCGCTAAGCTGCTCACCATCCGTACACCCGAGACCGCCACACTCACAAAGAACCCACCA
+CAACGCAAAACAACGGTTGGCAGCCGTACGGAAAACTGTTAGCTTCGGGCGGTGTAGTTATCACGCCGTT
+TCAGCGTGGAAACGGCACTCGACAATCAAGCGAGGATGGCGGATCGACTAGCGGCCCGGACAACTTGAAC
+CGGGTGTTTTCAACACGAGGATCGCGAGCCGTTGCCGGTAGGTTGCGGCTGGTTATCGACGGTACTGTCC
+ACATTTGTGGATAGCCATGTGGACAGTTCACCTGCCCACAACAACGGTTGTAGCTCGACCCGGAACCAAG
+ACCCGGAACTAACGAGAACCAGGGAGATACGTCG
+
diff --git a/resources/genome/NC_002945v4.fa.amb b/resources/genome/NC_002945v4.fa.amb
new file mode 100644
index 00000000..bb900be1
--- /dev/null
+++ b/resources/genome/NC_002945v4.fa.amb
@@ -0,0 +1 @@
+4349904 1 0
diff --git a/resources/genome/NC_002945v4.fa.ann b/resources/genome/NC_002945v4.fa.ann
new file mode 100644
index 00000000..bf787904
--- /dev/null
+++ b/resources/genome/NC_002945v4.fa.ann
@@ -0,0 +1,3 @@
+4349904 1 11
+0 NC_002945v4 Mycobacterium bovis AF2122/97 genome assembly, chromosome: Mycobacterium_bovis_AF2122/97
+0 4349904 0
diff --git a/resources/genome/NC_002945v4.fa.bwt b/resources/genome/NC_002945v4.fa.bwt
new file mode 100644
index 00000000..b87b3e84
Binary files /dev/null and b/resources/genome/NC_002945v4.fa.bwt differ
diff --git a/resources/genome/NC_002945v4.fa.fai b/resources/genome/NC_002945v4.fa.fai
new file mode 100644
index 00000000..d8d89f85
--- /dev/null
+++ b/resources/genome/NC_002945v4.fa.fai
@@ -0,0 +1 @@
+NC_002945v4 4349904 102 70 71
diff --git a/resources/genome/NC_002945v4.fa.pac b/resources/genome/NC_002945v4.fa.pac
new file mode 100644
index 00000000..945a0e3b
Binary files /dev/null and b/resources/genome/NC_002945v4.fa.pac differ
diff --git a/resources/genome/NC_002945v4.fa.sa b/resources/genome/NC_002945v4.fa.sa
new file mode 100644
index 00000000..2eba15c2
Binary files /dev/null and b/resources/genome/NC_002945v4.fa.sa differ
diff --git a/resources/genome/NC_002945v4.gb b/resources/genome/NC_002945v4.gb
new file mode 100644
index 00000000..27bab335
--- /dev/null
+++ b/resources/genome/NC_002945v4.gb
@@ -0,0 +1,219092 @@
+LOCUS NC_002945 4349904 bp DNA circular BCT 25-MAY-2020
+DEFINITION Mycobacterium bovis AF2122/97 genome assembly, chromosome:
+ Mycobacterium_bovis_AF212297.
+ACCESSION NC_002945
+VERSION NC_002945v4
+DBLINK BioProject: PRJEB15187
+ BioSample: SAMEA20450668
+KEYWORDS .
+SOURCE Mycobacterium tuberculosis variant bovis AF2122/97
+ ORGANISM Mycobacterium tuberculosis variant bovis AF2122/97
+ Bacteria; Actinobacteria; Corynebacteriales; Mycobacteriaceae;
+ Mycobacterium; Mycobacterium tuberculosis complex.
+REFERENCE 1
+ AUTHORS Malone,K.M.
+ TITLE Direct Submission
+ JOURNAL Submitted (06-DEC-2016) School of Veterinary Medicine, Tuberculosis
+ Molecular Microbiology Research Group, University College Dublin,
+ Tuberculosis Molecular Microbiology Research Group, School of
+ Veterinary Medicine, University College Dublin, D4, Ireland
+REFERENCE 2
+ AUTHORS Malone M,K., Farrell,D. and Malone,K.
+ TITLE Direct Submission
+ JOURNAL Submitted (15-APR-2020) School of Veterinary Medicine, Tuberculosis
+ Molecular Microbiology Research Group, University College Dublin,
+ Tuberculosis Molecular Microbiology Research Group, School of
+ Veterinary Medicine, University College Dublin, D4, Ireland
+COMMENT On Jan 31, 2017 this sequence version replaced BX248333.1.
+FEATURES Location/Qualifiers
+ source 1..4349904
+ /organism="Mycobacterium tuberculosis variant bovis
+ AF2122/97"
+ /mol_type="genomic DNA"
+ /isolate="AF2122/97"
+ /isolation_source="Mycobacterium bovis subsp. bovis strain
+ AF2122/97. This strain is a fully virulent strain that was
+ isolated in 1997 in the UK from a cow suffering necrotic
+ lesions in lung and bronchomediastinal lymph nodes. The
+ strain was also reported to infect and persist in badgers
+ that are considered to be a significant source of bovine
+ infection."
+ /db_xref="taxon:233413"
+ /chromosome="Mycobacterium_bovis_AF212297"
+ gene 1..1524
+ /gene="dnaA"
+ /locus_tag="BQ2027_MB0001"
+ CDS 1..1524
+ /gene="dnaA"
+ /locus_tag="BQ2027_MB0001"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0001, dnaA, len: 507 aa. Equivalent to Rv0001,
+ len: 507 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 507 aa overlap). dnaA, chromosomal
+ replication initiator protein (see citations below),
+ equivalent to other Mycobacterial CHROMOSOMAL REPLICATION
+ INITIATOR PROTEINS e.g. P46388|DNAA_MYCLE from
+ Mycobacterium leprae (502 aa); Q9L7L7|DNAA_MYCPA from
+ Mycobacterium paratuberculosis (509 aa); P49990|DNAA_MYCAV
+ from Mycobacterium avium (508 aa); P49992|DNAA_MYCSM from
+ Mycobacterium smegmatis (504 aa); etc. Also highly similar
+ to others except in N-terminus e.g. Q9ZH75|DNAA_STRCH
+ CHROMOSOMAL REPLICATION INITIATOR PROTEIN from
+ Streptomyces chrysomallus (624 aa); Q9ZH76|DNAA_STRRE from
+ Streptomyces reticuli (643 aa); DNAA_ECOLI|P03004|B3702
+ chromosomal replication initiator protein from Escherichia
+ coli strain K12 (467 aa), FASTA scores: opt: 986, E(): 0,
+ (43.2% identity in 389 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop) and PS01008 DnaA
+ protein signature. BELONGS TO THE DNAA FAMILY. Note that
+ the first base of this gene has been taken as base 1 of
+ the Mycobacterium bovis genomic sequence. Protein product
+ from Mb0001 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0001 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CHROMOSOMAL REPLICATION INITIATOR PROTEIN DNAA"
+ /protein_id="SIT98333.1"
+ /db_xref="GOA:P49991"
+ /db_xref="InterPro:IPR001957"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR010921"
+ /db_xref="InterPro:IPR013159"
+ /db_xref="InterPro:IPR013317"
+ /db_xref="InterPro:IPR018312"
+ /db_xref="InterPro:IPR020591"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P49991"
+ /translation="MTDDPGSGFTTVWNAVVSELNGDPKVDDGPSSDANLSAPLTPQQ
+ RAWLNLVQPLTIVEGFALLSVPSSFVQNEIERHLRAPITDALSRRLGHQIQLGVRIAP
+ PATDEADDTTVPPSENPATTSPDTTTDNDEIDDSAAARGDNQHSWPSYFTERPRNTDS
+ ATAGVTSLNRRYTFDTFVIGASNRFAHAAALAIAEAPARAYNPLFIWGESGLGKTHLL
+ HAAGNYAQRLFPGMRVKYVSTEEFTNDFINSLRDDRKVAFKRSYRDVDVLLVDDIQFI
+ EGKEGIQEEFFHTFNTLHNANKQIVISSDRPPKQLATLEDRLRTRFEWGLITDVQPPE
+ LETRIAILRKKAQMERLAIPDDVLELIASSIERNIRELEGALIRVTAFASLNKTPIDK
+ ALAEIVLRDLIADANTMQISAATIMAATAEYFDTTVEELRGPGKTRALAQSRQIAMYL
+ CRELTDLSLPKIGQAFGRDHTTVMYAQRKILSEMAERREVFDHVKELTTRIRQRSKR"
+ gene 2052..3260
+ /gene="dnaN"
+ /locus_tag="BQ2027_MB0002"
+ CDS 2052..3260
+ /gene="dnaN"
+ /locus_tag="BQ2027_MB0002"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0002, dnaN, len: 402 aa. Equivalent to Rv0002,
+ len: 402 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 402 aa overlap). dnaN, DNA polymerase
+ III (beta chain) (EC 2.7.7.7) (see citations below),
+ equivalent to other Mycobacterial DNA POLYMERASES III BETA
+ CHAIN e.g. NP_301130.1|NC_002677 from Mycobacterium leprae
+ (399 aa); Q9L7L6|DP3B_MYCPA from Mycobacterium avium
+ subsp. paratuberculosis (399 aa); P52851|DP3B_MYCSM from
+ Mycobacterium smegmatis (397 aa); etc. Also highly similar
+ to others e.g. P27903|DP3B_STRCO DNA POLYMERASE III BETA
+ CHAIN from Streptomyces coelicolor (376 aa), FASTA scores:
+ opt: 1189, E(): 0, (52.8% identity in 337 aa overlap);
+ P21174|DP3B_MICLU from Micrococcus luteus (310 aa);
+ P52023|DP3B_SYNP7 from Synechococcus sp. strain PCC 7942
+ (375 aa); etc. Overlaps and extends CDS in neighbouring
+ cosmid MTCY10H4.01. Protein product from Mb0002 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0002 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA POLYMERASE III (BETA CHAIN) DNAN (DNA
+ NUCLEOTIDYLTRANSFERASE)"
+ /protein_id="SIT98337.1"
+ /db_xref="GOA:O33914"
+ /db_xref="InterPro:IPR001001"
+ /db_xref="InterPro:IPR022634"
+ /db_xref="InterPro:IPR022635"
+ /db_xref="InterPro:IPR022637"
+ /db_xref="UniProtKB/Swiss-Prot:O33914"
+ /translation="MDAATTRVGLTDLTFRLLRESFADAVSWVAKNLPARPAVPVLSG
+ VLLTGSDNGLTISGFDYEVSAEAQVGAEIVSPGSVLVSGRLLSDITRALPNKPVGVHV
+ EGNRVALTCGNARFSLPTMPVEDYPTLPTLPEETGLLPAELFAEAISQVAIAAGRDDT
+ LPMLTGIRVEILGETVVLAATDRFRLAVRELKWSASSPDIEAAVLVPAKTLAEAAKAG
+ IGGSDVRLSLGTGPGVGKDGLLGISGNGKRSTTRLLDAEFPKFRQLLPTEHTAVATMD
+ VAELIEAIKLVALVADRGAQVRMEFADGSVRLSAGADDVGRAEEDLVVDYAGEPLTIA
+ FNPTYLTDGLSSLRSERVSFGFTTAGKPALLRPVSGDDRPVAGLNGNGPFPAVSTDYV
+ YLLMPVRLPG"
+ gene 3280..4437
+ /gene="recF"
+ /locus_tag="BQ2027_MB0003"
+ CDS 3280..4437
+ /gene="recF"
+ /locus_tag="BQ2027_MB0003"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0003, recF, len: 385 aa. Equivalent to Rv0003,
+ len: 385 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 385 aa overlap). recF, DNA replication
+ and repair protein (see citations below), equivalent to
+ others Mycobacterial DNA replication and repair proteins
+ e.g. NP_301131.1|NC_002677 from Mycobacterium leprae (385
+ aa); Q9L7L5|RECF_MYCPA from Mycobacterium avium subsp.
+ paratuberculosis (385 aa); P50916|RECF_MYCSM from
+ Mycobacterium smegmatis (384 aa); etc. Also highly similar
+ to others e.g. P36176|RECF_STRCO DNA REPLICATION AND
+ REPAIR PROTEIN from Streptomyces coelicolor (373 aa);
+ NP_440892.1|NC_000911 from Synechocystis sp. strain PCC
+ 6803 (384 aa); NP_469352.1|NC_003212 from Listeria innocua
+ (370 aa); etc. Contains PS00017 ATP/GTP-binding site motif
+ A (P-loop), PS00617 RecF protein signature 1, and PS00618
+ RecF protein signature 2. BELONGS TO THE RECF FAMILY.
+ Protein product from Mb0003 detected using SWATH mass
+ spectrometry. Mb0003 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA REPLICATION AND REPAIR PROTEIN RECF
+ (SINGLE-STRAND DNA BINDING PROTEIN)"
+ /protein_id="SIT98339.1"
+ /db_xref="GOA:Q7U314"
+ /db_xref="InterPro:IPR001238"
+ /db_xref="InterPro:IPR003395"
+ /db_xref="InterPro:IPR018078"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR042174"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U314"
+ /translation="MYVRHLGLRDFRSWACVDLELHPGRTVFVGPNGYGKTNLIEALW
+ YSTTLGSHRVSADLPLIRVGTDRAVISTIVVNDGRECAVDLEIATGRVNKARLNRSSV
+ RSTRDVVGVLRAVLFAPEDLGLVRGDPADRRRYLDDLAIVRRPAIAAVRAEYERVVRQ
+ RTALLKSVPGARYRGDRGVFDTLEVWDSRLAEHGAELVAARIDLVNQLAPEVKKAYQL
+ LAPESRSASIGYRASMDVTGPSEQSDTDRQLLAARLLAALAARRDAELERGVCLVGPH
+ RDDLILRLGDQPAKGFASHGEAWSLAVALRLAAYQLLRVDGGEPVLLLDDVFAELDVM
+ RRRALATAAESAEQVLVTAAVLEDIPAGWDARRVHIDVRADDTGSMSVVLP"
+ gene 4434..4997
+ /locus_tag="BQ2027_MB0004"
+ CDS 4434..4997
+ /locus_tag="BQ2027_MB0004"
+ /note="Mb0004, -, len: 187 aa. Equivalent to Rv0004, len:
+ 187 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 187 aa overlap). Conserved hypothetical
+ protein (see citation below), highly similar, but longer
+ 21 aa in N-terminus, to AAF33696.1|AF222789 unknown
+ protein from Mycobacterium avium subsp. paratuberculosis
+ (166 aa); and highly similar to NP_301132.1|NC_002677
+ conserved hypothetical protein from Mycobacterium leprae
+ (189 aa); S70990 hypothetical protein from Mycobacterium
+ smegmatis (194 aa). Also similar to in C-terminus to
+ C-terminal part of P35925|YREG_STRCO HYPOTHETICAL 19.8 KDA
+ PROTEIN (IN RECF-GYRB INTERGENIC REGION) from Streptomyces
+ coelicolor (190 aa), FASTA scores: opt: 404, E(): 3.9e-18,
+ (40.7% identity in 189 aa overlap). Mb0004 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Zn-ribbon-containing, possibly RNA-binding
+ protein and truncated derivatives"
+ /protein_id="SIT98341.1"
+ /db_xref="InterPro:IPR007922"
+ /db_xref="InterPro:IPR023007"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U313"
+ /translation="MTGSVDRPDQNRGERLMKSPGLDLVRRTLDEARAAARARGQDAG
+ RGRVASVASGRVAGRRRSWSGPGPDIRDPQPLGKAARELAKKRGWSVRVAEGMVLGQW
+ SAVVGHQIAEHARPTALNDGVLSVIAESTAWATQLRIMQAQLLAKIAAAVGNDVVRSL
+ KITGPAAPSWRKGPRHIAGRGPRDTYG"
+ gene 5123..7267
+ /gene="gyrB"
+ /locus_tag="BQ2027_MB0005"
+ CDS 5123..7267
+ /gene="gyrB"
+ /locus_tag="BQ2027_MB0005"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0005, gyrB, len: 714 aa. Equivalent to Rv0005,
+ len: 714 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 714 aa overlap). gyrB, DNA gyrase
+ subunit B (EC 5.99.1.3) (see citations below), equivalent,
+ except in N-terminus, to other Mycobacterial DNA GYRASES
+ SUBUNIT B e.g. T10005 from Mycobacterium leprae (697 aa);
+ Q9L7L3|GYRB_MYCPA from Mycobacterium avium subsp.
+ paratuberculosis (677 aa) (has its N-terminus shorter);
+ P48355|GYRB_MYCSM from Mycobacterium smegmatis (675 aa);
+ etc. Also highly similar to others e.g. T10969 from
+ Streptomyces coelicolor (686 aa); P50075|GYBS_STRSH from
+ Streptomyces spheroides (684 aa); etc. Contains PS00177
+ DNA topoisomerase II signature. BELONGS TO THE TYPE II
+ TOPOISOMERASE FAMILY. Protein product from Mb0005 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0005 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA GYRASE (SUBUNIT B) GYRB (DNA TOPOISOMERASE
+ (ATP-HYDROLYSING)) (DNA TOPOISOMERASE II) (TYPE II DNA
+ TOPOISOMERASE)"
+ /protein_id="SIT98343.1"
+ /db_xref="GOA:A0A1R3XU15"
+ /db_xref="InterPro:IPR001241"
+ /db_xref="InterPro:IPR002288"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR006171"
+ /db_xref="InterPro:IPR011557"
+ /db_xref="InterPro:IPR013506"
+ /db_xref="InterPro:IPR013759"
+ /db_xref="InterPro:IPR013760"
+ /db_xref="InterPro:IPR014721"
+ /db_xref="InterPro:IPR018522"
+ /db_xref="InterPro:IPR020568"
+ /db_xref="InterPro:IPR034160"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU15"
+ /translation="MGKNEARRSALAPDHGTVVCDPLRRLNRMHATPEESIRIVAAQK
+ KKAQDEYGAASITILEGLEAVRKRPGMYIGSTGERGLHHLIWEVVDNAVDEAMAGYAT
+ TVNVVLLEDGGVEVADDGRGIPVATHASGIPTVDVVMTQLHAGGKFDSDAYAISGGLH
+ GVGVSVVNALSTRLEVEIKRDGYEWSQVYEKSEPLGLKQGAPTKKTGSTVRFWADPAV
+ FETTEYDFETVARRLQEMAFLNKGLTINLTDERVTQDEVVDEVVSDVAEAPKSASERA
+ AESTAPHKVKSRTFHYPGGLVDFVKHINRTKNAIHSSIVDFSGKGTGHEVEIAMQWNA
+ GYSESVHTFANTINTHEGGTHEEGFRSALTSVVNKYAKDRKLLKDKDPNLTGDDIREG
+ LAAVISVKVSEPQFEGQTKTKLGNTEVKSFVQKVCNEQLTHWFEANPTDSKVVVNKAV
+ SSAQARIAARKARELVRRKSATDIGGLPGKLADCRSTDPRKSELYVVEGDSAGGSAKS
+ GRDSMFQAILPLRGKIINVEKARIDRVLKNTEVQAIITALGTGIHDEFDIGKLRYHKI
+ VLMADADVDGQHISTLLLTLLFRFMRPLIENGHVFLAQPPLYKLKWQRSDPEFAYSDR
+ ERDGLLEAGLKAGKKINKEDGIQRYKGLGEMDAKELWETTMDPSVRVLRQVTLDDAAA
+ ADELFSILMGEDVDARRSFITRNAKDVRFLDV"
+ gene 7302..9818
+ /gene="gyrA"
+ /locus_tag="BQ2027_MB0006"
+ CDS 7302..9818
+ /gene="gyrA"
+ /locus_tag="BQ2027_MB0006"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0006, gyrA, len: 838 aa. Equivalent to Rv0006,
+ len: 838 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 838 aa overlap). gyrA, DNA gyrase
+ subunit A (EC 5.99.1.3) (see citations below), equivalent,
+ except in N-terminus, to other Mycobacterial DNA GYRASES
+ SUBUNIT A e.g. Q57532|GYRA_MYCLE|T10006 from Mycobacterium
+ leprae (1273 aa); P48354|GYRA_MYCSM from Mycobacterium
+ smegmatis (842 aa); etc. Also highly similar to others
+ e.g. P35885|GYRA_STRCO DNA GYRASE SUBUNIT A from
+ Streptomyces coelicolor (864 aa); NP_346654.1|NC_003030
+ from Clostridium acetobutylicum (830 aa);
+ NP_387888.1|NC_000964 from Bacillus subtilis (821 aa);
+ etc. Contains PS00018 EF-hand calcium-binding domain.
+ Protein product from Mb0006 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0006 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA GYRASE (SUBUNIT A) GYRA (DNA TOPOISOMERASE
+ (ATP-HYDROLYSING)) (DNA TOPOISOMERASE II) (TYPE II DNA
+ TOPOISOMERASE)"
+ /protein_id="SIT98345.1"
+ /db_xref="GOA:A0A1R3XU07"
+ /db_xref="InterPro:IPR002205"
+ /db_xref="InterPro:IPR005743"
+ /db_xref="InterPro:IPR006691"
+ /db_xref="InterPro:IPR013757"
+ /db_xref="InterPro:IPR013758"
+ /db_xref="InterPro:IPR013760"
+ /db_xref="InterPro:IPR035516"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU07"
+ /translation="MTDTTLPPDDSLDRIEPVDIQQEMQRSYIDYAMSVIVGRALPEV
+ RDGLKPVHRRVLYAMFDSGFRPDRSHAKSARSVAETMGNYHPHGDASIYDTLVRMAQP
+ WSLRYPLVDGQGNFGSPGNDPPAAMRYTEARLTPLAMEMLREIDEETVDFIPNYDGRV
+ QEPTVLPSRFPNLLANGSGGIAVGMATNIPPHNLRELADAVFWALENHDADEEETLAA
+ VMGRVKGPDFPTAGLIVGSQGTADAYKTGRGSIRMRGVVEVEEDSRGRTSLVITELPY
+ QVNHDNFITSIAEQVRDGKLAGISNIEDQSSDRVGLRIVIEIKRDAVAKVVINNLYKH
+ TQLQTSFGANMLAIVDGVPRTLRLDQLIRYYVDHQLDVIVRRTTYRLRKANERAHILR
+ GLVKALDALDEVIALIRASETVDIARAGLIELLDIDEIQAQAILDMQLRRLAALERQR
+ IIDDLAKIEAEIADLEDILAKPERQRGIVRDELAEIVDRHGDDRRTRIIAADGDVSDE
+ DLIAREDVVVTITETGYAKRTKTDLYRSQKRGGKGVQGAGLKQDDIVAHFFVCSTHDL
+ ILFFTTQGRVYRAKAYDLPEASRTARGQHVANLLAFQPEERIAQVIQIRGYTDAPYLV
+ LATRNGLVKKSKLTAFDSNRSGGIVAVNLRDNDELVGAVLCSADDDLLLVSANGQSIR
+ FSATDEALRPMGRATSGVQGMRFNIDDRLLSLNVVREGTYLLVATSGGYAKRTAIEEY
+ PVQGRGGKGVLTVMYDRRRGRLVGALIVDDDSELYAVTSGGGVIRTAARQVRKAGRQT
+ KGVRLMNLGEGDTLLAIARNAEESGDDNAVDANGADQTGN"
+ gene 9914..10828
+ /locus_tag="BQ2027_MB0007"
+ CDS 9914..10828
+ /locus_tag="BQ2027_MB0007"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0007, -, len: 304 aa. Equivalent to Rv0007, len:
+ 304 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 304 aa overlap). Possible conserved
+ membrane protein, highly similar to Z70722|MLCB1770_7 from
+ Mycobacterium leprae (303 aa), FASTA scores: opt: 812,
+ E(): 1.6e-25, (54.2% identity in 319 aa overlap).
+ C-terminal part highly similar to C-terminus of
+ CAB92992.1|AL357152 putative integral membrane protein
+ from Streptomyces coelicolor (185 aa); and N-terminal part
+ highly similar to C-terminus of NP_302684.1|NC_002677
+ hypothetical protein from Mycobacterium leprae (123 aa).
+ Protein product from Mb0007 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0007 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIT98347.1"
+ /db_xref="GOA:A0A1R3XW78"
+ /db_xref="InterPro:IPR021949"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW78"
+ /translation="MTAPNEPGALSKGDGPNADGLVDRGGAHRAATGPGRIPDAGDPP
+ PWQRAATRQSQAGHRQPPPVSHPEGRPTNPPAAADARLNRFISGASAPVTGPAAAVRT
+ PQPDPDASLGCGDGSPAEAYASELPDLSGPTPRAPQRNPAPARPAEGGAGSRGDSAAG
+ SSGGRSITAESRDARVQLSARRSRGPVRASMQIRRIDPWSTLKVSLLLSVALFFVWMI
+ TVAFLYLVLGGMGVWAKLNSNVGDLLNNASGSSAELVSSGTIFGGAFLIGLVNVVLMT
+ ALATIGAFVYNLITDLIGGIEVTLADRD"
+ gene 10887..10960
+ /locus_tag="BQ2027_ILET"
+ tRNA 10887..10960
+ /locus_tag="BQ2027_ILET"
+ /product="tRNA-Ile"
+ /note="ileT, len: 74 nt. Equivalent to ileT, len: 74 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 74 nt overlap). tRNA-Ile, anticodon gat."
+ gene 11112..11184
+ /locus_tag="BQ2027_ALAT"
+ tRNA 11112..11184
+ /locus_tag="BQ2027_ALAT"
+ /product="tRNA-Ala"
+ /note="alaT, len: 73 nt. Equivalent to alaT, len: 73 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 73 nt overlap). tRNA-Ala, anticodon tgc."
+ gene complement(11874..12311)
+ /locus_tag="BQ2027_MB0008C"
+ CDS complement(11874..12311)
+ /locus_tag="BQ2027_MB0008C"
+ /note="Mb0008c, -, len: 145 aa. Equivalent to Rv0008c,
+ len: 145 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 144 aa overlap). Possible membrane
+ protein. Protein product from Mb0008c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0008c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIT98350.1"
+ /db_xref="GOA:P59977"
+ /db_xref="InterPro:IPR024245"
+ /db_xref="UniProtKB/Swiss-Prot:P59977"
+ /translation="MSEQVETRLTPRERLTRGLAYSAVGPVDVTRGLLELGVGLGLQS
+ ARSTAAGLRRRYREGRLAREVAAAQETLAQELTAAQDVVANLPQALQDARTQRRSKHH
+ LWIFAGIAAAILAGGAVAFSIVRRSSRPEPSPRPPSVEVQPRP"
+ gene 12468..13016
+ /gene="ppiA"
+ /locus_tag="BQ2027_MB0009"
+ CDS 12468..13016
+ /gene="ppiA"
+ /locus_tag="BQ2027_MB0009"
+ /standard_name="cfp22"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0009, ppiA, len: 182 aa. Equivalent to Rv0009,
+ len: 182 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 182 aa overlap). Probable ppiA
+ (alternate gene name: cfp22), iron-regulated
+ peptidyl-prolyl cis-trans isomerase A (EC 5.2.1.8),
+ equivalent to NP_301138.1|NC_002677 putative
+ peptidyl-prolyl cis-trans isomerase from Mycobacterium
+ leprae (182 aa), FASTA score: (90.1% identity in 182 aa
+ overlap). Also highly similar to others e.g. T36725 from
+ Streptomyces coelicolor (177 aa); T43805 from
+ Halobacterium salinarum (180 aa); NP_219383.1|NC_000919
+ from Treponema pallidum (215 aa); etc. BELONGS TO THE
+ CYCLOPHILIN-TYPE PPIASE FAMILY. Alternative start codon
+ has been suggested. Protein product from Mb0009 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0009 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE IRON-REGULATED PEPTIDYL-PROLYL
+ CIS-TRANS ISOMERASE A PPIA (PPIase A) (ROTAMASE A)"
+ /protein_id="SIT98352.1"
+ /db_xref="GOA:P65763"
+ /db_xref="InterPro:IPR002130"
+ /db_xref="InterPro:IPR020892"
+ /db_xref="InterPro:IPR024936"
+ /db_xref="InterPro:IPR029000"
+ /db_xref="UniProtKB/Swiss-Prot:P65763"
+ /translation="MADCDSVTNSPLATATATLHTNRGDIKIALFGNHAPKTVANFVG
+ LAQGTKDYSTQNASGGPSGPFYDGAVFHRVIQGFMIQGGDPTGTGRGGPGYKFADEFH
+ PELQFDKPYLLAMANAGPGTNGSQFFITVGKTPHLNRRHTIFGEVIDAESQRVVEAIS
+ KTATDGNDRPTDPVVIESITIS"
+ gene complement(13222..13557)
+ /locus_tag="BQ2027_MB0010C"
+ CDS complement(13222..13557)
+ /locus_tag="BQ2027_MB0010C"
+ /note="Mb0010c, -, len: 111 aa. Equivalent to Rv0010c,
+ len: 141 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 110 aa overlap). Probable conserved
+ membrane protein, equivalent to NP_301139.1|NC_002677
+ putative membrane protein from Mycobacterium leprae (137
+ aa); and similar to Rv1417|P71686|YE17_MYCTU HYPOTHETICAL
+ 16.4 KD PROTEIN from Mycobacterium tuberculosis (154 aa),
+ FASTA scores: opt: 121, E(): 0.097, (29.6% identity in 81
+ aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a single base deletion (g-*) leads to
+ a shorter product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (111 aa versus 141 aa). Mb0010c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIT98354.1"
+ /db_xref="GOA:A0A1R3XUN1"
+ /db_xref="InterPro:IPR019692"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XUN1"
+ /translation="MQQTAWAPRTSGIAGCGAGGVVMAIASVTLVTDTPGRVLTGVAA
+ LGLILFASATWRARPRLAITPDGLAIRGWFRTQLLRHSNIKIIRIDEFRRYGRLVRLL
+ EIETVSGGC"
+ gene complement(13713..13994)
+ /locus_tag="BQ2027_MB0011C"
+ CDS complement(13713..13994)
+ /locus_tag="BQ2027_MB0011C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0011c, -, len: 93 aa. Equivalent to Rv0011c, len:
+ 93 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 93 aa overlap). Probable conserved
+ transmembrane protein, equivalent to NP_301140.1|NC_002677
+ conserved hypothetical protein from Mycobacterium leprae
+ (93 aa); and similar to AL079308|SCH69_24 hypothetical
+ protein from Streptomyces coelicolor (84 aa), FASTA
+ scores: opt: 135, E(): 0.0068, (32.6% identity in 92 aa
+ overlap). Protein product from Mb0011c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0011c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT98356.1"
+ /db_xref="GOA:P67377"
+ /db_xref="InterPro:IPR009619"
+ /db_xref="UniProtKB/Swiss-Prot:P67377"
+ /translation="MPKSKVRKKNDFTVSAVSRTPMKVKVGPSSVWFVSLFIGLMLIG
+ LIWLMVFQLAAIGSQAPTALNWMAQLGPWNYAIAFAFMITGLLLTMRWH"
+ gene 14088..14876
+ /locus_tag="BQ2027_MB0012"
+ CDS 14088..14876
+ /locus_tag="BQ2027_MB0012"
+ /note="Mb0012, -, len: 262 aa. Equivalent to Rv0012, len:
+ 262 aa, from Mycobacterium tuberculosis strain H37Rv
+ (99.2% identity in 262 aa overlap). Probable conserved
+ membrane protein, similar to AL079308|SCH69_23|T36722
+ hypothetical protein from Streptomyces coelicolor (237
+ aa), FASTA scores: opt: 506, E(): 1.9e-25, (39.8% identity
+ in 236 aa overlap). Some similarity to BLU0|1958_35A2
+ DIVIB (fragment) (188 aa), FASTA scores: opt: 204, E():
+ 8.9e-07, (35.6% identity in 90 aa overlap); and
+ G1129091|DDS cell division and sporulation protein from
+ Bacillus subtilis (231 aa), FASTA scores: opt: 180, E():
+ 3.8e-05, (30.7% identity in 101 aa overlap). Also similar
+ to Rv1823|MTCY1A11_20 from Mycobacterium tuberculosis
+ FASTA score: (30.1% identity in 246 aa overlap); and
+ MTCY1A11_18 FASTA score: (25.5% identity in 235 aa
+ overlap). Contains probable N-terminal signal sequence.
+ Protein product from Mb0012 detected using SWATH mass
+ spectrometry. Mb0012 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIT98357.1"
+ /db_xref="InterPro:IPR010273"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU20"
+ /translation="MRLTHPTPCPENGETMIDRRRSAWRFSVPLVCLLAGLLLAATHG
+ VSGGTEIRRSDAPRLVDLVRRAQASVNRLATEREALTTRIDSVHGRSVDTALAAMQRR
+ SAELAGVAAMNPVHGPGLVVTLQDAQRDANGRFPRDASPDDLVVHQQDIEAVLNALWN
+ AGAEAIQMQDQRIIAMSIARCVGNTLLLNGRTYSPPYTIAAIGDAAAMQAALAAAPLV
+ TLYKQYVVRFGLGYREEVHPDLQIVGYADPVRMHFAQPAGPLDY"
+ gene 14913..15611
+ /gene="trpG"
+ /locus_tag="BQ2027_MB0013"
+ CDS 14913..15611
+ /gene="trpG"
+ /locus_tag="BQ2027_MB0013"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0013, trpG, len: 232 aa. Equivalent to Rv0013,
+ len: 232 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 232 aa overlap). Possible trpG,
+ anthranilate synthase component II (glutamine
+ amidotransferase) (EC 4.1.3.27), equivalent to
+ NP_301141.1|NC_002677 putative p-aminobenzoate synthase
+ glutamine amidotransferase from Mycobacterium leprae (232
+ aa). Also highly similar to others e.g. P26922|TRPG_AZOBR
+ Anthranilate synthase component II from Azospirillum
+ brasilense (196 aa), FASTA scores: opt: 703, E(): 8.6e-40,
+ (56.7% identity in 187 aa overlap); T36720 probable
+ glutamine amidotransferase from Streptomyces coelicolor
+ (212 aa); T44524 anthranilate synthase from Nitrosomonas
+ europaea (199 aa); etc. Also similar to E235740
+ para-aminobenzoate synthase (232 aa), FASTA scores: opt:
+ 1273, E(): 0, (79.7% identity in 232 aa overlap). Contains
+ PS00606 Beta-ketoacyl synthases active site; and PS00442
+ Glutamine amidotransferases class-I active site.
+ SIMILARITY TO OTHER TYPE-1 GLUTAMINE AMIDOTRANSFERASE
+ DOMAINS. Note that previously known as pabA. Protein
+ product from Mb0013 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0013 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ANTHRANILATE SYNTHASE COMPONENT II TRPG
+ (GLUTAMINE AMIDOTRANSFERASE)"
+ /protein_id="SIT98358.1"
+ /db_xref="GOA:A0A1R3XU22"
+ /db_xref="InterPro:IPR006221"
+ /db_xref="InterPro:IPR017926"
+ /db_xref="InterPro:IPR029062"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU22"
+ /translation="MRILVVDNYDSFVFNLVQYLGQLGIEAEVWRNDDHRLSDEAAVA
+ GQFDGVLLSPGPGTPERAGASVSMVHACAAAHTPLLGVCLGHQAIGVAFGATVDRAPE
+ LLHGKTSSVFHTNVGVLQGLPDPFTATRYHSLTILPKSLPAVLRVTARTSSGVIMAVQ
+ HTGLPIHGVQFHPESILTEGGHRILANWLTCCGWTQDDTLVRRLENEVLTAISPHFPT
+ STASAGEATGRTSA"
+ gene complement(15589..17469)
+ /gene="pknB"
+ /locus_tag="BQ2027_MB0014C"
+ CDS complement(15589..17469)
+ /gene="pknB"
+ /locus_tag="BQ2027_MB0014C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0014c, pknB, len: 626 aa. Equivalent to Rv0014c,
+ len: 626 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 626 aa overlap). pknB, transmembrane
+ serine/threonine-protein kinase (EC 2.7.1.-) (see
+ citations below), equivalent to MLCB1770_9|T10009 probable
+ serine/threonine-specific protein kinase from
+ Mycobacterium leprae (622 aa), FASTA scores: opt: 3600,
+ E(): 0, (86.4% identity in 626 aa overlap). Also similar
+ (highly similar in N-terminus) to others e.g. T36717 from
+ Streptomyces coelicolor (673 aa); NP_389459.1|NC_000964
+ from Bacillus subtilis (648 aa); NP_465345.1|NC_003210
+ from Listeria monocytogenes (655 aa); E235741 protein
+ kinase pknB (315 aa), FASTA scores: opt: 1839, E(): 0,
+ (90.8 identity in 305 aa overlap); etc. Contains PS00107
+ Protein kinases ATP-binding region signature, and PS00108
+ Serine/Threonine protein kinases active-site signature.
+ Contains Hank's kinase subdomain. BELONGS TO THE SER/THR
+ FAMILY OF PROTEIN KINASES. Experimental studies show
+ evidence of auto-phosphorylation on serine/threonine
+ residues. Protein product from Mb0014c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0014c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="TRANSMEMBRANE SERINE/THREONINE-PROTEIN KINASE B
+ PKNB (PROTEIN KINASE B) (STPK B)"
+ /protein_id="SIT98359.1"
+ /db_xref="GOA:P0A5S5"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR005543"
+ /db_xref="InterPro:IPR008271"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="InterPro:IPR017441"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5S5"
+ /translation="MTTPSHLSDRYELGEILGFGGMSEVHLARDLRLHRDVAVKVLRA
+ DLARDPSFYLRFRREAQNAAALNHPAIVAVYDTGEAETPAGPLPYIVMEYVDGVTLRD
+ IVHTEGPMTPKRAIEVIADACQALNFSHQNGIIHRDVKPANIMISATNAVKVMDFGIA
+ RAIADSGNSVTQTAAVIGTAQYLSPEQARGDSVDARSDVYSLGCVLYEVLTGEPPFTG
+ DSPVSVAYQHVREDPIPPSARHEGLSADLDAVVLKALAKNPENRYQTAAEMRADLVRV
+ HNGEPPEAPKVLTDAERTSLLSSAAGNLSGPRTDPLPRQDLDDTDRDRSIGSVGRWVA
+ VVAVLAVLTVVVTIAINTFGGITRDVQVPDVRGQSSADAIATLQNRGFKIRTLQKPDS
+ TIPPDHVIGTDPAANTSVSAGDEITVNVSTGPEQREIPDVSTLTYAEAVKKLTAAGFG
+ RFKQANSPSTPELVGKVIGTNPPANQTSAITNVVIIIVGSGPATKDIPDVAGQTVDVA
+ QKNLNVYGFTKFSQASVDSPRPAGEVTGTNPPAGTTVPVDSVIELQVSKGNQFVMPDL
+ SGMFWVDAEPRLRALGWTGMLDKGADVDAGGSQHNRVVYQNPPAGTGVNRDGIITLRF
+ GQ"
+ gene complement(17466..18761)
+ /gene="pknA"
+ /locus_tag="BQ2027_MB0015C"
+ CDS complement(17466..18761)
+ /gene="pknA"
+ /locus_tag="BQ2027_MB0015C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0015c, pknA, len: 431 aa. Equivalent to Rv0015c,
+ len: 431 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 431 aa overlap). pknA, transmembrane
+ serine/threonine-protein kinase (EC 2.7.1.-),
+ magnesium/manganese dependent (see citations below),
+ equivalent to MLCB1770_10|NP_301143.1|NC_002677 putative
+ serine/threonine protein kinase from Mycobacterium leprae
+ (437 aa), FASTA scores: opt: 1883, E(): 0, (72.1% identity
+ in 434 aa overlap). And also highly similar to other
+ kinases from Mycobacterium leprae e.g. MLCB1770_10 from
+ Mycobacterium leprae (437 aa). Also similar to PKNA_MYCLE
+ protein kinase (253 aa), FASTA scores: opt: 1525, E(): 0,
+ (95.0% identity in 242 aa overlap); etc. Also highly
+ similar in part to others e.g. N-terminus of
+ NP_243370.1|NC_002570 from Bacillus halodurans (664 aa);
+ N-terminus of T36717 from Streptomyces coelicolor (673
+ aa); etc. Also similar to others from Mycobacterium
+ tuberculosis: MTCY10H4_15, MTV021_9, MTCY28_5,
+ MTCY4C12_28, MTCY50_16, MTCY8D9_8, MTCY49_28, MTCY4C12_30,
+ MTCY28_9, etc. Contains PS00108 Serine/Threonine protein
+ kinases active-site signature. Contains Hank's kinase
+ subdomain. BELONGS TO THE SER/THR FAMILY OF PROTEIN
+ KINASES. It has been shown that sodium orthovanadate
+ inhibits the activity of the enzyme in vitro. Protein
+ product from Mb0015c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0015c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="TRANSMEMBRANE SERINE/THREONINE-PROTEIN KINASE A
+ PKNA (PROTEIN KINASE A) (STPK A)"
+ /protein_id="SIT98360.1"
+ /db_xref="GOA:P65727"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR008271"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="UniProtKB/Swiss-Prot:P65727"
+ /translation="MSPRVGVTLSGRYRLQRLIATGGMGQVWEAVDNRLGRRVAVKVL
+ KSEFSSDPEFIERFRAEARTTAMLNHPGIASVHDYGESQMNGEGRTAYLVMELVNGEP
+ LNSVLKRTGRLSLRHALDMLEQTGRALQIAHAAGLVHRDVKPGNILITPTGQVKITDF
+ GIAKAVDAAPVTQTGMVMGTAQYIAPEQALGHDASPASDVYSLGVVGYEAVSGKRPFA
+ GDGALTVAMKHIKEPPPPLPPDLPPNVRELIEITLVKNPAMRYRSGGPFADAVAAVRA
+ GRRPPRPSQTPPPGRAAPAAIPSGTTARVAANSAGRTAASRRSRPATGGHRPPRRTFS
+ SGQRALLWAAGVLGALAIIIAVLLVIKAPGDNSPQQAPTPTVTTTGNPPASNTGGTDA
+ SPRLNWTERGETRHSGLQSWVVPPTPHSRASLARYEIAQ"
+ gene complement(18758..20233)
+ /gene="pbpA"
+ /locus_tag="BQ2027_MB0016C"
+ CDS complement(18758..20233)
+ /gene="pbpA"
+ /locus_tag="BQ2027_MB0016C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0016c, pbpA, len: 491 aa. Equivalent to Rv0016c,
+ len: 491 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 491 aa overlap). Probable pbpA,
+ penicillin-binding protein, equivalent to
+ NP_301144.1|NC_002677 putative penicillin-binding protein
+ from Mycobacterium leprae (492 aa); and highly similar to
+ MLCB1770_1 penicillin binding protein from Mycobacterium
+ leprae (474 aa), FASTA scores: opt: 2516, E(): 0, (82.4%
+ identity in 472 aa overlap). Also similar to others e.g.
+ T36716 from Streptomyces coelicolor (490 aa);
+ AAF61246.1|AF241575|PbpA from Streptomyces griseus (485
+ aa); NP_347146.1|NC_003030 from Clostridium acetobutylicum
+ (482 aa); E235825|pbpA penicillin binding protein (325
+ aa), FASTA scores: opt: 1618, E(): 0, (78.3% identity in
+ 323 aa overlap); etc. And also similar to MTCY270_5 and
+ MTV003_8 from Mycobacterium tuberculosis. Protein product
+ from Mb0016c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0016c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PENICILLIN-BINDING PROTEIN PBPA"
+ /protein_id="SIT98361.1"
+ /db_xref="GOA:A0A1R3XU21"
+ /db_xref="InterPro:IPR001460"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU21"
+ /translation="MNASLRRISVTVMALIVLLLLNATMTQVFTADGLRADPRNQRVL
+ LDEYSRQRGQITAGGQLLAYSVATDGRFRFLRVYPNPEVYAPVTGFYSLRYSSTALER
+ AEDPILNGSDRRLFGRRLADFFTGRDPRGGNVDTTINPRIQQAGWDAMQQGCYGPCKG
+ AVVALEPSTGKILALVSSPSYDPNLLASHNPEVQAQAWQRLGDNPASPLTNRAISETY
+ PPGSTFKVITTAAALAAGATETEQLTAAPTIPLPGSTAQLENYGGAPCGDEPTVSLRE
+ AFVKSCNTAFVQLGIRTGADALRSMARAFGLDSPPRPTPLQVAESTVGPIPDSAALGM
+ TSIGQKDVALTPLANAEIAATIANGGITMRPYLVGSLKGPDLANISTTVGYQQRRAVS
+ PQVAAKLTELMVGAEKVAQQKGAIPGVQIASKTGTAEHGTDPRHTPPHAWYIAFAPAQ
+ APKVAVAVLVENGADRLSATGGALAAPIGRAVIEAALQGEP"
+ gene complement(20230..21639)
+ /gene="rodA"
+ /locus_tag="BQ2027_MB0017C"
+ CDS complement(20230..21639)
+ /gene="rodA"
+ /locus_tag="BQ2027_MB0017C"
+ /note="Mb0017c, rodA, len: 469 aa. Equivalent to Rv0017c,
+ len: 469 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 469 aa overlap). Probable rodA
+ (alternate gene name: ftsW), cell division protein,
+ integral membrane protein, equivalent to
+ MLCB1770_12|T10012 probable cell division protein from
+ Mycobacterium leprae (465 aa), FASTA scores: opt: 2475,
+ E(): 0, (81.9% identity in 469 aa overlap). Also highly
+ similar to others e.g. T36715|SCH69.16 from Streptomyces
+ coelicolor (479 aa); NP_243432.1|NC_002570 from Bacillus
+ halodurans (366 aa); NP_347145.1|NC_003030 from
+ Clostridium acetobutylicum (400 aa); etc. Also similar to
+ MTCY270_14 from Mycobacterium tuberculosis FASTA score:
+ (32.2% identity in 369 aa overlap). BELONGS TO THE
+ FTSW/RODA/SPOVE FAMILY. Protein product from Mb0017c
+ detected using SWATH mass spectrometry. Mb0017c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CELL DIVISION PROTEIN RODA"
+ /protein_id="SIT98362.1"
+ /db_xref="GOA:P63761"
+ /db_xref="InterPro:IPR001182"
+ /db_xref="InterPro:IPR018365"
+ /db_xref="UniProtKB/Swiss-Prot:P63761"
+ /translation="MTTRLQAPVAVTPPLPTRRNAELLLLCFAAVITFAALLVVQANQ
+ DQGVPWDLTSYGLAFLTLFGSAHLAIRRFAPYTDPLLLPVVALLNGLGLVMIHRLDLV
+ DNEIGEHRHPSANQQMLWTLVGVAAFALVVTFLKDHRQLARYGYICGLAGLVFLAVPA
+ LLPAALSEQNGAKIWIRLPGFSIQPAEFSKILLLIFFSAVLVAKRGLFTSAGKHLLGM
+ TLPRPRDLAPLLAAWVISVGVMVFEKDLGASLLLYTSFLVVVYLATQRFSWVVIGLTL
+ FAAGTLVAYFIFEHVRLRVQTWLDPFADPDGTGYQIVQSLFSFATGGIFGTGLGNGQP
+ DTVPAASTDFIIAAFGEELGLVGLTAILMLYTIVIIRGLRTAIATRDSFGKLLAAGLS
+ STLAIQLFIVVGGVTRLIPLTGLTTPWMSYGGSSLLANYILLAILARISHGARRPLRT
+ RPRNKSPITAAGTEVIERV"
+ gene complement(21636..23180)
+ /gene="pstp"
+ /locus_tag="BQ2027_MB0018C"
+ CDS complement(21636..23180)
+ /gene="pstp"
+ /locus_tag="BQ2027_MB0018C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0018c, ppp, len: 514 aa. Equivalent to Rv0018c,
+ len: 514 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 514 aa overlap). Possible ppp,
+ serine/threonine phosphatase (EC 3.1.3.16), equivalent to
+ MLCB1770_13|T10013 PUTATIVE PHOSPHOPROTEIN PHOSPHATASE
+ from Mycobacterium leprae (509 aa), FASTA scores: opt:
+ 2517, E(): 0. Also highly similar to others e.g. T36714
+ probable protein phosphatase from Streptomyces coelicolor
+ (515 aa); CAA10712.1|AJ132604 pppL protein from
+ Lactococcus lactis (258 aa); NP_248765.1|NC_002516
+ probable phosphoprotein phosphatase from Pseudomonas
+ aeruginosa (242 aa); etc. Also similar to BSUB0009_46 YLOO
+ PROTEIN from Bacillus subtilis (254 aa), FASTA score:
+ (34.0% identity in 250 aa overlap). Protein product from
+ Mb0018c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0018c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="phosphoserine/threonine phosphatase pstp"
+ /protein_id="SIT98363.1"
+ /db_xref="GOA:A0A1R3XV75"
+ /db_xref="InterPro:IPR001932"
+ /db_xref="InterPro:IPR015655"
+ /db_xref="InterPro:IPR036457"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XV75"
+ /translation="MALVTLVLRYAARSDRGLVRANNEDSVYAGARLLALADGMGGHA
+ AGEVASQLVIAALAHLDDDEPGGDLLAKLDAAVRAGNSAIAAQVEMEPDLEGMGTTLT
+ AILFAGNRLGLVHIGDSRGYLLRDGELTQITKDDTFVQTLVDEGRITPEEAHSHPQRS
+ LIMRALTGHEVEPTLTMREARAGDRYLLCSDGLSDPVSDETILEALQIPEVAESAHRL
+ IELALRGGGPDNVTVVVADVVDYDYGQTQPILAGAVSGDDDQLTLPNTAAGRASAISQ
+ RKEIVKRVPPQADTFSRPRWSGRRLAFVVALVTVLMTAGLLIGRAIIRSNYYVADYAG
+ SVSIMRGIQGSLLGMSLHQPYLMGCLSPRNELSQISYGQSGGPLDCHLMKLEDLRPPE
+ RAQVRAGLPAGTLDDAIGQLRELAANSLLPPCPAPRATSPPGRPAPPTTSETTEPNVT
+ SSPAAPSPTTSASAPTGTTPAIPTSASPAAPASPPTPWPVTSSPTMAALPPPPPQPGI
+ DCRAAA"
+ gene complement(23269..23736)
+ /gene="fhaB"
+ /locus_tag="BQ2027_MB0019C"
+ CDS complement(23269..23736)
+ /gene="fhaB"
+ /locus_tag="BQ2027_MB0019C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0019c, -, len: 155 aa. Equivalent to Rv0019c,
+ len: 155 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 155 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ MLCB1770_14|NP_301147.1|NC_002677 conserved hypothetical
+ protein from Mycobacterium leprae (155 aa), FASTA scores:
+ opt: 902, E(): 0, (91.0% identity in 155 aa overlap). Also
+ highly similar to T36713|AL079308|SCH69_14 from
+ Streptomyces coelicolor (172 aa), FASTA scores: opt: 389,
+ E(): 6e-21, (46.2% identity in 171 aa overlap); and
+ similar in C-terminus to others e.g. NP_342559.1|NC_002754
+ Conserved hypothetical protein from Sulfolobus
+ solfataricus (209 aa); etc. C-terminus also highly similar
+ to C-terminal part of AAF07901.1|AF173844_2|AF173844
+ putative signal transduction protein GarA from
+ Mycobacterium smegmatis (158 aa). Also similar to
+ Rv1827|MTCY 1A11.16c from Mycobacterium tuberculosis (162
+ aa), FASTA score: (41.2% identity in 85 aa overlap);
+ MTMOAIS_3; MAU66560_1 and MLCB1788_15. Protein product
+ from Mb0019c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0019c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FHA-domain-containing protein"
+ /protein_id="SIT98364.1"
+ /db_xref="GOA:A0A1R3XU87"
+ /db_xref="InterPro:IPR000253"
+ /db_xref="InterPro:IPR008984"
+ /db_xref="InterPro:IPR032030"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU87"
+ /translation="MQGLVLQLTRAGFLMLLWVFIWSVLRILKTDIYAPTGAVMMRRG
+ LALRGTLLGARQRRHAARYLVVTEGALTGARITLSEQPVLIGRADDSTLVLTDDYAST
+ RHARLSMRGSEWYVEDLGSTNGTYLDRAKVTTAVRVPIGTPVRIGKTAIELRP"
+ gene complement(23860..25425)
+ /gene="fhaA"
+ /locus_tag="BQ2027_MB0020C"
+ CDS complement(23860..25425)
+ /gene="fhaA"
+ /locus_tag="BQ2027_MB0020C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0020c, TB39.8, len: 521 aa. Equivalent to
+ Rv0020c, len: 527 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (97.9% identity in 527 aa overlap). TB39.8,
+ conserved hypothetical protein, identified by proteomic
+ study by the Statens Serum Institute, Denmark (spot
+ TB39.8) (see citation below). Highly similar to
+ NP_301148.1|NC_002677 conserved hypothetical protein from
+ Mycobacterium leprae (488 aa); and
+ Z70722|MLCB1770_15|T10015 hypothetical protein from
+ Mycobacterium leprae (463 aa), FASTA scores: opt: 1213,
+ E(): 2.2e-32, (72.3% identity in 506 aa overlap).
+ Alternative start codon in position 24979 has been
+ suggested. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a 18 bp deletion leads to a shorter product
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv (521 aa versus 527 aa). Protein product from
+ Mb0020c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0020c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG00824290: FHA domain protein"
+ /protein_id="SIT98365.1"
+ /db_xref="InterPro:IPR000253"
+ /db_xref="InterPro:IPR008984"
+ /db_xref="InterPro:IPR022128"
+ /db_xref="InterPro:IPR042287"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XUP2"
+ /translation="MGSQKRLVQRVERKLEQTVGDAFARIFGGSIVPQEVEALLRREA
+ ADRIQSLQGNRLLAPNEYIITLGVHDFEKLGADPELKSTGFARDLADYIQEQGWQTYG
+ DVVVRFEQSSNLHTGQFRARGTVNPDVETHPPVIDCARPQSNHAFGAEPGVAPMSDNS
+ SYRGGQGQGRPDEYYDDRYARPQEDPRGGPDPQGGSDPRGGYPPETGGYPPQPGYPRP
+ RHPGQGDYPEQIGYPDQGGYPEQRGYPDQRGHQDQGRGYPDQGQGGYPPPYEQRPPVS
+ PGPAAGYGAPGYDQGYRQSGGCGPSPGGGQPGYGGYGEYGRGPARHEEGSYVPSGPPG
+ PPEQRPAYPDQGGYDQGYQQGATTYGRQDYGGGADYTRYTESPQVPGYAPQGGGYAEP
+ AGRDYDYGQSGAPDYGQPAPGGYSGYGQGGYGSAGTSVTLQLDDGSGRTYQLREGSNI
+ IGRGQDAQFRLPDTGVSRRHLEIRWDGQVALLADLNSTNGTTVNNAPVQEWQLADGDV
+ IRLGHSEIIVRMH"
+ gene 25625..25707
+ /locus_tag="BQ2027_LEUT"
+ tRNA 25625..25707
+ /locus_tag="BQ2027_LEUT"
+ /product="tRNA-Leu"
+ /note="leuT, len: 83 nt. Equivalent to leuT, len: 83 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 83 nt overlap). tRNA-Leu, anticodon cag."
+ gene complement(25894..26862)
+ /locus_tag="BQ2027_MB0021C"
+ CDS complement(25894..26862)
+ /locus_tag="BQ2027_MB0021C"
+ /note="Mb0021c, -, len: 322 aa. Equivalent to Rv0021c,
+ len: 322 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 322 aa overlap). Conserved hypothetical
+ protein, similar to various proteins e.g.
+ NP_464341.1|NC_003210 protein similar to oxidoreductases
+ from Listeria monocytogenes (309 aa);
+ NP_357973.1|NC_003098 Enoyl-acyl carrier protein(ACP)
+ reductase from Streptococcus pneumoniae (324 aa);
+ 2NPD_NEUCR|G726338 2-nitropropane dioxygenase precursor
+ from Neurospora crassa (378 aa), FASTA scores: opt: 383,
+ E(): 1.1e-16, (32.2% identity in 348 aa overlap); etc.
+ Also similar to AE001747_25 from Thermotoga maritima
+ section 59 (314 aa), FASTA scores: opt: 442, E(): 1.5e-19,
+ (30.5% identity in 325 aa overlap). Also similar to other
+ proteins from Mycobacterium tuberculosis e.g. Rv3553 (355
+ aa), FASTA scores: E(): 6.8e-15, (35.3 identity in 235 aa
+ overlap); and Rv1533 (375 aa), FASTA scores: E(): 4.7e-12,
+ (34.4% identity in 262 aa overlap). Mb0021c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative oxidoreductase, nitronate monooxygenase
+ family"
+ /protein_id="SIT98366.1"
+ /db_xref="GOA:A0A1R3XU19"
+ /db_xref="InterPro:IPR004136"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU19"
+ /translation="MVLSTAFSQMFGIDYPIVSAPMDLIAGGELAAAVSGAGGLGLIG
+ GGYGDRDWLARQFDLAAGAPVGCGFITWSLARQPQLLDLALQYEPVAVMLSFGDPAVF
+ ADAIKSAGTRLVCQIQNRTQAERALQVGADVLVAQGTEAGGHGHGPRSTLTLVPEIVD
+ LVTARGTDIPVIAAGGIADGRGLAAALMLGAAGVLVGTRFYATVEALSTPQARDPLLA
+ ATGDDMCRTTIYDQLRRYPWPQGHTMSVLSNALTDQFEDTELDILHREEAMARYWRAV
+ PARDYSIANVTAGQAAGLVNAVLPAADVITGMAQQAARTLTAMRAV"
+ gene complement(27004..27423)
+ /gene="whiB5"
+ /locus_tag="BQ2027_MB0022C"
+ CDS complement(27004..27423)
+ /gene="whiB5"
+ /locus_tag="BQ2027_MB0022C"
+ /note="Mb0022c, whiB5, len: 139 aa. Equivalent to Rv0022c,
+ len: 139 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 139 aa overlap). Probable whiB5,
+ WhiB-like regulatory protein (see citation below), similar
+ to WhiB paralogue of Streptomyces coelicolor, wblE gene
+ product (85 aa). Shows some similarity to
+ O88103|AJ239086|SCO239086_1|WHID|SC6G4.45c|WBLB WHID
+ PROTEIN from Streptomyces coelicolor (112 aa), FASTA
+ scores: opt: 125, E(): 0.055, (37.1% identity in 97 aa
+ overlap); and slight similarity to G466960|WHIB WHIB
+ PROTEIN (102 aa), FASTA scores: opt: 112, E(): 0.14, (34.3
+ identity in 67 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transcriptional regulatory protein
+ whib-like whib5"
+ /protein_id="SIT98368.1"
+ /db_xref="GOA:A0A1R3XU30"
+ /db_xref="InterPro:IPR003482"
+ /db_xref="InterPro:IPR034768"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU30"
+ /translation="MAHPCATDPELWFGYPDDDGSDGAAKARAYERSATQARIQCLRR
+ CPLLQQRRCAQHAVEHRVEYGVWAGIKLPGGQYRKREQLAAAHDVLRRIAGGEINSRQ
+ LPDNAALLARNEGLEVTPVPGVVVHLPIAQVGPQPAA"
+ gene 27576..28346
+ /locus_tag="BQ2027_MB0023"
+ CDS 27576..28346
+ /locus_tag="BQ2027_MB0023"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0023, -, len: 256 aa. Equivalent to Rv0023, len:
+ 256 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 256 aa overlap). Possible
+ transcriptional regulator, equivalent to
+ CAB96432.1|AJ251434 hypothetical protein from
+ Mycobacterium avium subsp. paratuberculosis (146 aa).
+ N-terminus showing similarity with other transcriptional
+ regulators e.g. AE0002|ECAE000240_9 from Escherichia coli
+ strain K12 (178 aa), FASTA scores: opt: 149, E(): 0.0048,
+ (33.3% identity in 84 aa overlap); etc. Contains probable
+ helix-turn helix motif from aa 19 to 40 (Score 1615, +4.69
+ SD). Protein product from Mb0023 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0023
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT98371.1"
+ /db_xref="GOA:P67705"
+ /db_xref="InterPro:IPR001387"
+ /db_xref="InterPro:IPR010982"
+ /db_xref="UniProtKB/Swiss-Prot:P67705"
+ /translation="MSRESAGAAIRALRESRDWSLADLAAATGVSTMGLSYLERGARK
+ PHKSTVQKVENGLGLPPGTYSRLLVAADPDAELARLIAAQPSNPTAVRRAGAVVVDRH
+ SDTDVLEGYAEAQLDAIKSVIDRLPATTSNEYETYILSVIAQCVKAEMLAASSWRVAV
+ NAGADSTGRLMEHLRALEATRGALLERMPTSLSARFDRACAQSSLPEAVVAALIGVGA
+ DEMWDIRNRGVIPAGALPRVRAFVDAIEASHDADEGQQ"
+ gene 28343..29176
+ /locus_tag="BQ2027_MB0024"
+ CDS 28343..29176
+ /locus_tag="BQ2027_MB0024"
+ /note="Mb0024, -, len: 277 aa. Equivalent to 5' end of
+ Rv0024, len: 281 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 192 aa overlap).
+ Putative secreted protein, p60 homologue, similar in part
+ to others and relatives proteins e.g. P60_LISIV|Q01837
+ protein p60 precursor (invasion-associated protein) from
+ Listeria ivanovii (524 aa), FASTA scores: opt: 245, E():
+ 1.5e-08, (37.0% identity in 100 aa overlap);
+ CAB92656.1|AL356832 putative NPL/P60 family secreted
+ protein from Streptomyces coelicolor (347 aa); etc.
+ Similar to Mycobacterium tuberculosis proteins Rv1477,
+ Rv1478, Rv1566c, Rv2190c. And several homologues in
+ Streptomyces coelicolor e.g. AL049497|SC6G10_8|T35517
+ probable secreted protein (338 aa), FASTA scores: opt:
+ 399, E(): 9.8e-18, (34.9% identity in 292 aa overlap).
+ COULD BELONG TO THE E. COLI NLPC / LISTERIA P60 FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0024 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (c-*) splits Rv0024 into 2 parts, Mb0024 and
+ Mb0025. Mb0024 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE SECRETED PROTEIN P60-RELATED PROTEIN
+ [FIRST PART]"
+ /protein_id="SIT98373.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU42"
+ /translation="MNYSEVELLSRAHQLFAGDSRRPGLDAGTTPYGDLLSRAADLNV
+ GAGQRRYQLAVDHSRAALLSAARTDAAAGAVITGAQRDRAWARRSTGTVLDEARSDTT
+ VTAVMPIAQREAIRRRVARLRAQRAHVLTARRRARRHLAALRALRYRVAHGPGVALAK
+ LRLPSPSGRAGIAVHAALSRLGRPYVWGATGPTSSTVPVWSSGPTPRRVFTWIAPPIN
+ RSTRGSRCRAHRSGRAIWSSRTPGTCSWRSATIWSSRRPMRARRFGSARWATTCRFGD
+ R"
+ gene 28918..29187
+ /locus_tag="BQ2027_MB0025"
+ /pseudo
+ CDS 28918..29187
+ /locus_tag="BQ2027_MB0025"
+ /note="Mb0025, -, len: 89 aa. Equivalent to 3' end of
+ Rv0024, len: 281 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 89 aa overlap). Putative
+ secreted protein, p60 homologue, similar in part to others
+ and relatives proteins e.g. P60_LISIV|Q01837 protein p60
+ precursor (invasion-associated protein) from Listeria
+ ivanovii (524 aa), FASTA scores: opt: 245, E():
+ 1.5e-08,(37.0% identity in 100 aa overlap);
+ CAB92656.1|AL356832 putative NPL/P60 family secreted
+ protein from Streptomyces coelicolor (347 aa); etc.
+ Similar to Mycobacterium tuberculosis proteins Rv1477,
+ Rv1478, Rv1566c, Rv2190c. And several homologues in
+ Streptomyces coelicolor e.g. AL049497|SC6G10_8|T35517
+ probable secreted protein (338 aa), FASTA scores: opt:
+ 399, E(): 9.8e-18, (34.9% identity in 292 aa overlap).
+ COULD BELONG TO THE E. COLI NLPC / LISTERIA P60 FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0024 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (c-*) splits Rv0024 into 2 parts,Mb0024 and
+ Mb0025.;PUTATIVE SECRETED PROTEIN P60-RELATED PROTEIN
+ [SECOND PART]"
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene 29225..29587
+ /locus_tag="BQ2027_MB0026"
+ CDS 29225..29587
+ /locus_tag="BQ2027_MB0026"
+ /note="Mb0026, -, len: 120 aa. Equivalent to Rv0025, len:
+ 120 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 120 aa overlap). Conserved hypothetical
+ protein, showing some similarity to other proteins from
+ Mycobacterium tuberculosis e.g. Rv0739 (268 aa), FASTA
+ score: (37.6% identity in 101 aa overlap), and Rv0026
+ FASTA score: (35.4% identity in 113 aa overlap); etc.
+ Protein product from Mb0026 detected using SWATH mass
+ spectrometry. Mb0026 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT98375.1"
+ /db_xref="InterPro:IPR019710"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU54"
+ /translation="MSEQAGSSVAVIQERQALLARQHDAVAEADRELADVLASAHAAM
+ RESVRRLDAIAAELDRAVPDQDQLAVDTLMGAREFQTFLVAKQREIVAVVAAAHELDR
+ AKSAVLKRLRAQYTEPAR"
+ gene 29702..31135
+ /locus_tag="BQ2027_MB0027"
+ CDS 29702..31135
+ /locus_tag="BQ2027_MB0027"
+ /note="Mb0027, -, len: 477 aa. Equivalent to 5' end of
+ Rv0026, len: 448 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (94.4% identity in 449 aa overlap).
+ Conserved hypothetical protein, showing some similarity to
+ other proteins from Mycobacterium tuberculosis: Rv0025
+ FASTA score: (35.4% identity in 113 aa overlap) and Rv0739
+ (268 aa), FASTA score: (32.4% identity in 142 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a 4
+ bp insertion (*-atcg) leads to a longer protein with a
+ different COOH part compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (477 aa versus 448
+ aa). Mb0027 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT98377.1"
+ /db_xref="InterPro:IPR019710"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU28"
+ /translation="MAFDAAMSTHEDLLATIRYVRDRTGDPNAWQTGLTPTEVTAVVT
+ STTRSEQLDAILRKIRQRHSNLYYPAPPDREQGDAARAIADAEAALAHPNSATAQLDL
+ QVVSAILNAHLKTVEGGESLHELQQEIEAAVRIRSDLDTPAGARDFQRFLIGKLKDIR
+ EVVATASLDAASKSALMAAWTSLYDASKGDRGDADDRGPASVGSGGAPARGAGQQPEL
+ PTRAEPDCLLDSLLLEDPGLLADDLQVPGGTSAAIPSASSTPSLPNLGGATMPGGGAT
+ PALVPGVSAPGGLPLSGLLRGVGDEPELTDFDERGQEVRDPADYEHSNEPDERRADDR
+ EGADEDAGLGKSESPPQAPTTVTLPNGETVTAASPQLAAAIKAAASGTPIADAFQQQG
+ IAIPLPGTAVANPVDPARISAGDVGVFTDRHALALGPSKALLDGQIQHISAVRGRNFL
+ GWIHPAATATAPARTEAPTPTRPAAAR"
+ gene 31173..31490
+ /locus_tag="BQ2027_MB0028"
+ CDS 31173..31490
+ /locus_tag="BQ2027_MB0028"
+ /note="Mb0028, -, len: 105 aa. Equivalent to Rv0027, len:
+ 105 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 105 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0028 detected using SWATH
+ mass spectrometry. Mb0028 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein"
+ /protein_id="SIT98378.1"
+ /db_xref="GOA:P64668"
+ /db_xref="InterPro:IPR022536"
+ /db_xref="UniProtKB/Swiss-Prot:P64668"
+ /translation="MTDRIHVQPAHLRQAAAHHQQTADYLRTVPSSHDAIRESLDSLG
+ PIFSELRDTGRELLELRKQCYQQQADNHADIAQNLRTSAAMWEQHERAASRSLGNIID
+ GSR"
+ gene 31498..31803
+ /locus_tag="BQ2027_MB0029"
+ CDS 31498..31803
+ /locus_tag="BQ2027_MB0029"
+ /note="Mb0029, -, len: 101 aa. Equivalent to Rv0028, len:
+ 101 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 101 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0029 detected using SWATH
+ mass spectrometry. Mb0029 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein"
+ /protein_id="SIT98380.1"
+ /db_xref="InterPro:IPR024426"
+ /db_xref="UniProtKB/Swiss-Prot:P64670"
+ /translation="MTDANPAFDTVHPSGHILVRSCRGGYMHSVSLSEAAMETDAETL
+ AEAILLTADVSCLKALLEVRNEIVAAGHTPSAQVPTTDDLNVAIEKLLAHQLRRRNR"
+ gene 32041..33138
+ /locus_tag="BQ2027_MB0030"
+ CDS 32041..33138
+ /locus_tag="BQ2027_MB0030"
+ /note="Mb0030, -, len: 365 aa. Equivalent to Rv0029, len:
+ 365 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 365 aa overlap). Conserved hypothetical
+ protein, showing some similarity to other proteins from
+ Mycobacterium tuberculosis e.g. C-terminal region of
+ Rv2082|MTCY49_21|E247006 hypothetical 73.6 kDa protein
+ (721 aa), FASTA scores: opt: 453, E(): 1.2e-22, (38.5%
+ identity in 265 aa overlap); Rv3899c|MTY15F10_12
+ HYPOTHETICAL 40.8 KD PROTEIN (410 aa), FASTA score: (33.7%
+ identity in 252 aa overlap); etc. Protein product from
+ Mb0030 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0030 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Vegetative cell wall protein gp1 precursor"
+ /protein_id="SIT98382.1"
+ /db_xref="InterPro:IPR040604"
+ /db_xref="InterPro:IPR040833"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU96"
+ /translation="MAIFGRWSARQRLRRATRESLTIPTFSSSLDCTTRVIGGLWPAE
+ LSSNTAETATLAEHLKADLHRIVGSANDELMVIWRAGMADSTRRAEEDRVIDRARASA
+ MRRVESAMRELRQITGRVPVEIPRMRGAGGSDLDTTRLMPAVTVVQPADQACTDWPVA
+ AAEDDEARLQRLLAFVARQEPRLNWAVGVNADGTTVLVTDVAHGWIPPGIALPEGVRL
+ LAPARRAGRAPELVGITTCCKTYTPGDSLRRAVDSTAPTSSVQPRALPAIAGLSVELG
+ IATQRHDGLPKIVHAMATAAGNGAAAEEVDLLRVHVDTALHHVLAQYPRVDPALLLNC
+ MLLAATERSVTGDPIAANYHFAWFRELDSRR"
+ gene 33208..33537
+ /locus_tag="BQ2027_MB0031"
+ CDS 33208..33537
+ /locus_tag="BQ2027_MB0031"
+ /note="Mb0031, -, len: 109 aa. Equivalent to Rv0030, len:
+ 109 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 109 aa overlap). Hypothetical unknown
+ protein. Mb0031 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein"
+ /protein_id="SIT98384.1"
+ /db_xref="InterPro:IPR024296"
+ /db_xref="UniProtKB/Swiss-Prot:P64672"
+ /translation="MVSGSDSRSEPSQLSDRDLVESVLRDLSEAADKWEALVTQAETV
+ TYSVDLGDVRAVANSDGRLLELTLHPGVMTGYAHGELADRVNLAITALRDEVEAENRA
+ RYGGRLQ"
+ gene 33566..33778
+ /locus_tag="BQ2027_MB0032"
+ CDS 33566..33778
+ /locus_tag="BQ2027_MB0032"
+ /note="Mb0032, -, len: 70 aa. Equivalent to Rv0031, len:
+ 70 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 70 aa overlap). Possible remnant of a
+ transposase, showing partial similarity to mycobacterial
+ transposases in a short overlap, e.g. Rv2791c|MTV002_57
+ (459 aa), FASTA score: (72.2% identity in 36 aa overlap);
+ Rv2885c, Rv2978c, Rv3827c, etc. Mb0032 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible remnant of a transposase"
+ /protein_id="SIT98386.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU29"
+ /translation="MLARHFGAGRKAHSRAVATLKADIQAWHPAGIQTPKPRCESDVF
+ ARIGHTSHPSTRKSRVGPGASEAPLA"
+ gene 34279..36594
+ /gene="bioF2"
+ /locus_tag="BQ2027_MB0033"
+ CDS 34279..36594
+ /gene="bioF2"
+ /locus_tag="BQ2027_MB0033"
+ /note="Mb0033, bioF2, len: 771 aa. Equivalent to Rv0032,
+ len: 771 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 771 aa overlap). Probable bioF2,
+ 8-amino-7-oxononanoate synthase (EC 2.3.1.47), with its
+ C-terminal similar to others e.g. BIOF_BACSU|P53556
+ 8-amino-7-oxononanoate synthase from Bacillus subtilis
+ (389 aa), FASTA scores: opt: 775, E(): 0, (37.9% identity
+ in 346 aa overlap); P22806|BIOF_BACSH from Bacillus
+ sphaericus (389 aa); etc. Also similar to
+ BIOF1|Rv1569|MTCY336_35 from Mycobacterium tuberculosis
+ (386 aa), AF041819_4 from Mycobacterium bovis, and
+ BIOF_MYCLE|P45487 from Mycobacterium leprae (385 aa).
+ Contains PS00599 Aminotransferases class-II
+ pyridoxal-phosphate attachment site. BELONGS TO CLASS-II
+ OF PYRIDOXAL-PHOSPHATE-DEPENDENT AMINOTRANSFERASES."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE 8-AMINO-7-OXONONANOATE SYNTHASE BIOF2
+ (AONS) (8-AMINO-7-KETOPELARGONATE SYNTHASE)
+ (7-KETO-8-AMINO-PELARGONIC ACID SYNTHETASE) (7-KAP
+ SYNTHETASE) (L-ALANINE--PIMELYL CoA LIGASE)"
+ /protein_id="SIT98388.1"
+ /db_xref="GOA:A0A1R3XU34"
+ /db_xref="InterPro:IPR001917"
+ /db_xref="InterPro:IPR004839"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="InterPro:IPR038740"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU34"
+ /translation="MPTGLGYDFLRPVEDSGINDLKHYYFMADLADGQPLGRANLYSV
+ CFDLATTDRKLTPAWRTTIKRWFPGFMTFRFLECGLLTMVSNPLALRSDTDLERVLPV
+ LAGQMDQLAHDDGSDFLMIRDVDPEHYQRYLDILRPLGFRPALGFSRVDTTISWSSVE
+ EALGCLSHKRRLPLKTSLEFRERFGIEVEELDEYAEHAPVLARLWRNVKTEAKDYQRE
+ DLNPEFFAACSRHLHGRSRLWLFRYQGTPIAFFLNVWGADENYILLEWGIDRDFEHYR
+ KANLYRAALMLSLKDAISRDKRRMEMGITNYFTKLRIPGARVIPTIYFLRHSTDPVHT
+ ATLARMMMHNIQRPTLPDDMSEEFCRWEERIRLDQDGLPEHDIFRKIDRQHKYTGLKL
+ GGVYGFYPRFTGPQRSTVKAAELGEIVLLGTNSYLGLATHPEVVEASAEATRRYGTGC
+ SGSPLLNGTLDLHVSLEQELACFLGKPAAVLCSTGYQSNLAAISALCESGDMIIQDAL
+ NHRSLFDAARLSGADFTLYRHNDMDHLARVLRRTEGRRRIIVVDAVFSMEGTVADLAT
+ IAELADRHGCRVYVDESHALGVLGPDGRGASAALGVLARMDVVMGTFSKSFASVGGFI
+ AGDRPVVDYIRHNGSGHVFSASLPPAAAAATHAALRVSRREPDRRARVLAAAEYMATG
+ LARQGYQAEYHGTAIVPVILGNPTVAHAGYLRLMRSGVYVNPVAPPAVPEERSGFRTS
+ YLADHRQSDLDRALHVFAGLAEDLTPQGAAL"
+ gene 36591..36854
+ /gene="acpA"
+ /locus_tag="BQ2027_MB0034"
+ CDS 36591..36854
+ /gene="acpA"
+ /locus_tag="BQ2027_MB0034"
+ /standard_name="acpP"
+ /note="Mb0034, acpA, len: 87 aa. Equivalent to Rv0033,
+ len: 87 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 87 aa overlap). Probable acpA
+ (alternate gene name: acpP), acyl carrier protein, similar
+ to others e.g. ACP_BACSU|P80643 acyl carrier protein (acp)
+ from Bacillus subtilis (77 aa), FASTA scores: opt: 149,
+ E(): 0.00026, (41.4% identity in 70 aa overlap);
+ NP_224500.1|NC_000922 Acyl Carrier Protein from
+ Chlamydophila pneumoniae (79 aa); NP_228471.1|NC_000853
+ acyl carrier protein from Thermotoga maritima (81 aa);
+ etc. Also similar to proteins of Mycobacterium
+ tuberculosis Rv1344 and Rv2244 (31.5% identity in 73 aa
+ overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL CARRIER PROTEIN ACPA (ACP)"
+ /protein_id="SIT98390.1"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU46"
+ /translation="MKEAINATIQRILRTDRGITANQVLVDDLGFDSLKLFQLITELE
+ DEFDIAISFRDAQNIKTVGDVYTSVAVWFPETAKPAPLGKGTA"
+ gene 36851..37246
+ /locus_tag="BQ2027_MB0035"
+ CDS 36851..37246
+ /locus_tag="BQ2027_MB0035"
+ /note="Mb0035, -, len: 131 aa. Equivalent to Rv0034, len:
+ 131 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 131 aa overlap). Conserved
+ hypothetical protein, showing weak similarity to
+ AE001980|AE001980_7 hypothetical protein from Deinococcus
+ radiodurans (120 aa), FASTA scores: opt: 141, E(): 0.0028,
+ (29.3% identity in 123 aa overlap). Protein product from
+ Mb0035 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Ketosteroid isomerase-related protein"
+ /protein_id="SIT98392.1"
+ /db_xref="InterPro:IPR032710"
+ /db_xref="InterPro:IPR037401"
+ /db_xref="UniProtKB/Swiss-Prot:P64674"
+ /translation="MTDDADLDLVRRTFAAFARGDLAELTQCFAPDVEQFVPGKHALA
+ GVFRGVDNVVACLGDTAAAADGTMTVTLEDVLSNTDGQVIAVYRLRASRAGKVLDQRE
+ AILVTVAGGRITRLSEFYADPAATESFWA"
+ gene 37243..38931
+ /gene="fadD34"
+ /locus_tag="BQ2027_MB0036"
+ CDS 37243..38931
+ /gene="fadD34"
+ /locus_tag="BQ2027_MB0036"
+ /note="Mb0036, fadD34, len: 562 aa. Equivalent to Rv0035,
+ len: 562 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 562 aa overlap). Probable fadD34,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), similar to many
+ e.g. MBU75685_1 acyl-CoA synthase from Mycobacterium bovis
+ (582 aa), FASTA scores: opt: 408, E(): 8.2e-20; etc. Also
+ similar to G1171128 SAFRAMYCIN MX1 SYNTHETASE B (1770 aa),
+ FASTA scores: opt: 445, E(): 1.3e-21, (28.1% identity in
+ 573 aa overlap). Also similar to other proteins from
+ Mycobacterium tuberculosis e.g. MTCY02B10.09, FASTA score:
+ (32.3% identity in 468 aa overlap), MTCY349_40,
+ MTCY4D9_17, MTCY338_18, MTV045_3, MTCY409_4, MTCI237_30,
+ MTCY24G1_8, MASC_MYCLE MASC PROTEIN, U00010_6, MTV005_21,
+ MTCY19G5_7, MTCY9F9_39, etc. Protein product from Mb0036
+ detected using SWATH mass spectrometry. Mb0036 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY-ACID-COA LIGASE FADD34
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="SIT98393.1"
+ /db_xref="GOA:A0A1R3XU59"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR040097"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU59"
+ /translation="MTAALLSPAIAWQQISACTDRTLTITCEDSEVISYQDLIARAAA
+ CIPPLRRLDLKRGEPVLITAHTNLEFLSCFLGLMLHGAVPVPIPPREALKTTERFMTR
+ LGPLLRHHRVLICTPAEHDEIRAAASTDCQISRFTALAEAGDEQFGRATAQQLADTAT
+ ADWPLCTLDDDAYVQYTSGSTAAPRGVVITYRNLLSNMRAMAVGSQFQHGDVMGSWLP
+ LHHDMGLVGSLFAALFNSVSAVFTTPHRFLYDPLGFLRLLTSSGATHTFMPNFALEWL
+ INAYHRRGADIEGIDLHKMRRLIIASEPVHAEGMRRFAATFAGVGLAPTALGSGYGLA
+ EATVAVSMSAPNTGFRTETHAAAEVVTGGRVLPGYEVRIDAAPGARAGTIKLRGDSVA
+ AKAYVGGKKLDALDEEGFCDTHDLGFLVDDEIVILGRQDEVFIVHGENRFPYDIEFII
+ RGESEQHRTKVACFGVNERVVVVLESPLDSIIDKAEADRLRCQVVAATGLQLDELITV
+ RRGAIPTTTSGKLKRRAVAQAYRDGTLPRLATHAWTADPDSAPKTTRSSLEGAH"
+ gene complement(39040..39813)
+ /locus_tag="BQ2027_MB0037C"
+ CDS complement(39040..39813)
+ /locus_tag="BQ2027_MB0037C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0037c, -, len: 257 aa. Equivalent to Rv0036c,
+ len: 257 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 257 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ CAB95889.1|AL359988 conserved hypothetical protein from
+ Streptomyces (276 aa). Also some similarity to
+ Rv3099c|MTCY164_10 (283 aa), FASTA scores: E(): 3.3e-05,
+ (25.9 % identity in 205 aa overlap). Protein product from
+ Mb0037c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0037c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT98395.1"
+ /db_xref="GOA:P64676"
+ /db_xref="InterPro:IPR013917"
+ /db_xref="InterPro:IPR017517"
+ /db_xref="InterPro:IPR017518"
+ /db_xref="InterPro:IPR024344"
+ /db_xref="InterPro:IPR034660"
+ /db_xref="UniProtKB/Swiss-Prot:P64676"
+ /translation="MADPGPFVADLRAESDDLDALVAHLPADRWADPTPAPGWTIAHQ
+ IGHLLWTDRVALTAVTDEAGFAELMTAAAANPAGFVDDAATELAAVSPAELLTDWRVT
+ RGRLHEELLAVPDGRKLAWFGPPMSAASMATARLMETWAHGLDVADALGVIRPATQRL
+ RSIAHLGVRTRDYAFIVNNLTPPAEPFLVELRGPSGDTWSWGPSDAAQRVTGSAEDFC
+ FLVTQRRALSTLDVNAVGEDAQRWLTIAQAFAGPPGRGR"
+ gene complement(39861..41186)
+ /locus_tag="BQ2027_MB0038C"
+ CDS complement(39861..41186)
+ /locus_tag="BQ2027_MB0038C"
+ /note="Mb0038c, -, len: 441 aa. Equivalent to Rv0037c,
+ len: 441 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 441 aa overlap). Probable conserved
+ integral membrane protein, member of major facilitator
+ superfamily (MFS) possibly involved in transport of
+ macrolide, showing some similarity to Rv1258c|MTCY50_24
+ (419 aa), FASTA score: (25.2% identity in 408 aa overlap);
+ and to AL049826|SCH24_20 from Streptomyces coelicolor (425
+ aa), FASTA scores: opt: 725, E(): 0, (36.1% identity in
+ 418 aa overlap). Also similarity with several
+ MACROLIDE-EFFLUX PROTEINS e.g. from S. pyogenes (405 aa),
+ FASTA scores: E(): 1.3e-06, (22.8% identity in 416 aa
+ overlap). Protein product from Mb0038c detected using
+ SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT98398.1"
+ /db_xref="GOA:P0A5C2"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5C2"
+ /translation="MPRVEVGLVIHSRMHARAPVDVWRSVRSLPDFWRLLQVRVASQF
+ GDGLFQAGLAGALLFNPDRAADPMAIAGAFAVLFLPYSLLGPFAGALMDRWDRRWVLV
+ GANTGRLALIAGVGTILAVGAGDVPLLVGALVANGLARFVASGLSAALPHVVPREQVV
+ TMNSVAIASGAVSAFLGANFMLLPRWLLGSGDEGASAIVFLVAIPVSIALLWSLRFGP
+ RVLGPDDTERAIHGSAVYAVVTGWLHGARTVVQLPTVAAGLSGLAAHRMVVGINSLLI
+ LLLVRHVTARAVGGLGTALLFFAATGLGAFLANVLTPTAIRRWGRYATANGALAAAAT
+ IQVAAAGLLVPVMVVCGFLLGVAGQVVKLCADSAMQMDVDDALRGHVFAVQDALFWVS
+ YILSITVAAALIPEHGHAPVFVLFGSAIYLAGLVVHTIVGRRGQPVIGR"
+ gene 41288..41896
+ /locus_tag="BQ2027_MB0039"
+ CDS 41288..41896
+ /locus_tag="BQ2027_MB0039"
+ /note="Mb0039, -, len: 202 aa. Equivalent to Rv0038, len:
+ 202 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 202 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ MLCB1770_16|Q50191|Y038_MYCLE hypothetical 22.0 kDa from
+ Mycobacterium leprae (202 aa), FASTA scores: opt: 1194,
+ E(): 0, (88.6% identity in 202 aa overlap). Also highly
+ similar or similar to other hypothetical proteins e.g.
+ CAB72194.1|AL138851|SCE59.07c from Streptomyces coelicolor
+ (193 aa); AAC06288.1|AF050466 from Mycobacterium bovis (82
+ aa) (similarity in N-terminus); NP_224347.1|NC_000922|YqgE
+ from Chlamydophila pneumoniae (188 aa); YQGE_ECOLI
+ HYPOTHETICAL 20.7 KD PROTEIN (187 aa), FASTA score: (29.5%
+ identity in 166 aa overlap); etc. Protein product from
+ Mb0039 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0039 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="UPF0301 protein YqgE"
+ /protein_id="SIT98399.1"
+ /db_xref="InterPro:IPR003774"
+ /db_xref="UniProtKB/Swiss-Prot:P67758"
+ /translation="MVAPHEDPEDHVAPAAQRVRAGTLLLANTDLLEPTFRRSVIYIV
+ EHNDGGTLGVVLNRPSETAVYNVLPQWAKLAAKPKTMFIGGPVKRDAALCLAVLRVGA
+ DPEGVPGLRHVAGRLVMVDLDADPEVLAAAVEGVRIYAGYSGWTIGQLEGEIERDDWI
+ VLSALPSDVLVGPRADLWGQVLRRQPLPLSLLATHPIDLSRN"
+ gene complement(41988..42335)
+ /locus_tag="BQ2027_MB0040C"
+ CDS complement(41988..42335)
+ /locus_tag="BQ2027_MB0040C"
+ /note="Mb0040c, -, len: 115 aa. Equivalent to Rv0039c,
+ len: 115 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.1% identity in 115 aa overlap). Possible conserved
+ transmembrane protein, highly similar to
+ NP_301154.1|NC_002677|Z70722|MLCB1770_18 hypothetical
+ protein from Mycobacterium leprae (113 aa), FASTA scores:
+ opt: 492, E(): 7.8e-27, (64.9% identity in 114 aa
+ overlap). Mb0040c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT98400.1"
+ /db_xref="GOA:A0A1R3XUB4"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XUB4"
+ /translation="MFLAGVLCMCAAAASALFGSWSLFHTPTADPTALALRAMAPTQL
+ AAAVMLAAGGVVAVAAPGHTALMVVIVCIAGAVGTLAAGSWQSAQYALRRETASPTAN
+ CVGSCAVCTQACH"
+ gene complement(42417..43349)
+ /gene="mtc28"
+ /locus_tag="BQ2027_MB0041C"
+ CDS complement(42417..43349)
+ /gene="mtc28"
+ /locus_tag="BQ2027_MB0041C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0041c, mtc28, len: 310 aa. Equivalent to Rv0040c,
+ len: 310 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 310 aa overlap). mtc28, secreted
+ proline rich 28 kDa antigen protein (has hydrophobic
+ stretch at N-terminus) (see citation below). Highly
+ similar to O33075|PR28_MYCLE|MT10019 Proline rich 28 kDa
+ antigen from Mycobacterium leprae (278 aa), FASTA scores:
+ opt: 1007, E(): 0, (65.0% identity in 257 aa overlap); and
+ Q9CD47|LPQT_MYCLE|NP_301305.1|NC_002677 putative
+ lipoprotein from Mycobacterium leprae (218 aa). C-terminal
+ part very similar to lipoprotein Rv1016c from
+ Mycobacterium tuberculosis. Mb0041c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SECRETED PROLINE RICH PROTEIN MTC28 (PROLINE
+ RICH 28 KDA ANTIGEN)"
+ /protein_id="SIT98401.1"
+ /db_xref="InterPro:IPR019674"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Q7"
+ /translation="MIQIARTWRVFAGGMATGFIGVVLVTAGKASADPLLPPPPIPAP
+ VSAPATVPPVQNLTALPGGSSNRFSPAPAPAPIASPIPVGAPGSTAVPPLPPPVTPAI
+ SGTLRDHLREKGVKLEAQRPHGFKALDITLPMPPRWTQVPDPNVPDAFVVIADRLGNS
+ VYTSNAQLVVYRLIGDFDPAEAITHGYIDSQKLLAWQTTNASMANFDGFPSSIIEGTY
+ RENDMTLNTSRRHVIATSGADKYLVSLSVTTALSQAVTDGPATDAIVNGFQVVAHAAP
+ AQAPAPAPGSAPVGLPGQAPGYPPAGTLTPVPPR"
+ gene 43546..46455
+ /gene="leuS"
+ /locus_tag="BQ2027_MB0042"
+ CDS 43546..46455
+ /gene="leuS"
+ /locus_tag="BQ2027_MB0042"
+ /note="Mb0042, leuS, len: 969 aa. Equivalent to Rv0041,
+ len: 969 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 969 aa overlap). Probable leucyl-tRNA
+ synthetase (EC 6.1.1.4), equivalent to
+ NP_301156.1|NC_002677|MLCB628_3 leucyl-tRNA synthase from
+ Mycobacterium leprae (972 aa), FASTA score: (83.6%
+ identity in 972 aa overlap); and highly similar to
+ MLCB1770_20 from Mycobacterium leprae (824 aa), FASTA
+ score: (82.8% identity in 824 aa overlap). Also highly
+ similar to others e.g. CAB66249.1|AL136518 leucyl-tRNA
+ synthetase from Streptomyces coelicolor (966 aa);
+ NP_244147.1|NC_002570 leucyl-tRNA synthetase from Bacillus
+ halodurans (806 aa); SYL_BACSU|P36430 leucyl-tRNA
+ synthetase from Bacillus subtilis (804 aa), FASTA scores:
+ opt: 714, E(): 3.1e-38, (43.7% identity in 938 aa
+ overlap); etc. Contains PS00178 Aminoacyl-transfer RNA
+ synthetases class-I signature. BELONGS TO CLASS-I
+ AMINOACYL-TRNA SYNTHETASE FAMILY. Protein product from
+ Mb0042 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0042 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LEUCYL-tRNA SYNTHETASE LEUS
+ (LEUCINE--tRNA LIGASE) (LEURS)"
+ /protein_id="SIT98402.1"
+ /db_xref="GOA:P67511"
+ /db_xref="InterPro:IPR001412"
+ /db_xref="InterPro:IPR002302"
+ /db_xref="InterPro:IPR009008"
+ /db_xref="InterPro:IPR009080"
+ /db_xref="InterPro:IPR013155"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="InterPro:IPR015413"
+ /db_xref="InterPro:IPR025709"
+ /db_xref="UniProtKB/Swiss-Prot:P67511"
+ /translation="MTESPTAGPGGVPRADDADSDVPRYRYTAELAARLERTWQENWA
+ RLGTFNVPNPVGSLAPPDGAAVPDDKLFVQDMFPYPSGEGLHVGHPLGYIATDVYARY
+ FRMVGRNVLHALGFDAFGLPAEQYAVQTGTHPRTRTEANVVNFRRQLGRLGFGHDSRR
+ SFSTTDVDFYRWTQWIFLQIYNAWFDTTANKARPISELVAEFESGARCLDGGRDWAKL
+ TAGERADVIDEYRLVYRADSLVNWCPGLGTVLANEEVTADGRSDRGNFPVFRKRLRQW
+ MMRITAYADRLLDDLDVLDWPEQVKTMQRNWIGRSTGAVALFSARAASDDGFEVDIEV
+ FTTRPDTLFGATYLVLAPEHDLVDELVAASWPAGVNPLWTYGGGTPGEAIAAYRRAIA
+ AKSDLERQESREKTGVFLGSYAINPANGEPVPIFIADYVLAGYGTGAIMAVPGHDQRD
+ WDFARAFGLPIVEVIAGGNISESAYTGDGILVNSDYLNGMSVPAAKRAIVDRLESAGR
+ GRARIEFKLRDWLFARQRYWGEPFPIVYDSDGRPHALDEAALPVELPDVPDYSPVLFD
+ PDDADSEPSPPLAKATEWVHVDLDLGDGLKPYSRDTNVMPQWAGSSWYELRYTDPHNS
+ ERFCAKENEAYWMGPRPAEHGPDDPGGVDLYVGGAEHAVLHLLYSRFWHKVLYDLGHV
+ SSREPYRRLVNQGYIQAYAYTDARGSYVPAEQVIERGDRFVYPGPDGEVEVFQEFGKI
+ GKSLKNSVSPDEICDAYGADTLRVYEMSMGPLEASRPWATKDVVGAYRFLQRVWRLVV
+ DEHTGETRVADGVELDIDTLRALHRTIVGVSEDFAALRNNTATAKLIEYTNHLTKKHR
+ DAVPRAAVEPLVQMLAPLAPHIAEELWLRLGNTTSLAHGPFPKADAAYLVDETVEYPV
+ QVNGKVRGRVVVAADTDEETLKAAVLTDEKVQAFLAGATPRKVIVVAGRLVNLVI"
+ gene complement(46565..47191)
+ /locus_tag="BQ2027_MB0043C"
+ CDS complement(46565..47191)
+ /locus_tag="BQ2027_MB0043C"
+ /note="Mb0043c, -, len: 208 aa. Equivalent to Rv0042c,
+ len: 208 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 208 aa overlap). Possible
+ transcriptional regulatory protein, MarR-family, highly
+ similar except in N-terminus to CAC32228.1|AL583926
+ putative MarR-family regulatory protein from Mycobacterium
+ leprae (243 aa). Also similar in part to others e.g.
+ AB76343.1|AL158061 putative MarR-family transcriptional
+ regulator from Streptomyces coelicolor (163 aa);
+ NP_384406.1|NC_003047 PUTATIVE TRANSCRIPTION REGULATOR
+ PROTEIN from Sinorhizobium meliloti (164 aa);
+ NP_531782.1|NC_003304 transcriptional regulator, MarR
+ family from Agrobacterium tumefaciens (151 aa); etc. Also
+ some similarity to Mycobacterium tuberculosis proteins
+ Rv2327, Rv0880, and Rv1404. Protein product from Mb0043c
+ detected using shotgun mass spectrometry. Mb0043c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY MARR-FAMILY)"
+ /protein_id="SIT98403.1"
+ /db_xref="GOA:A0A1R3XU39"
+ /db_xref="InterPro:IPR000835"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU39"
+ /translation="MSVVRSIGKKMQRISGPNALAVKGRPTQVYGHTHVRLDCRFMAD
+ SEFTAPEVTQLAEGLHRALSKLISMLRRGDPNGAAAGDLTLAQLSILVTLLDQGPIRM
+ TDLAAHERVRTPTTTVAIRRLEKIGLVKRSRDPSDLRAVLVDITPQGRAVHGESLANR
+ RAALAALLSQLPRSDLETLRKALAPLERLASGEPASGPASNSPARKRA"
+ gene complement(47350..48084)
+ /locus_tag="BQ2027_MB0044C"
+ CDS complement(47350..48084)
+ /locus_tag="BQ2027_MB0044C"
+ /note="Mb0044c, -, len: 244 aa. Equivalent to Rv0043c,
+ len: 244 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 244 aa overlap). Probable
+ transcriptional regulator, GntR family, similar to others
+ e.g. NP_420584.1|NC_002696 transcriptional regulator GntR
+ family from Caulobacter crescentus (221 aa);
+ NP_294539.1|NC_001263 transcriptional regulator GntR
+ family from Deinococcus radiodurans (267 aa);
+ YIN1_STRAM|P32425 hypothetical transcriptional regulatory
+ protein from Streptomyces ambofaciens (236 aa), FASTA
+ scores: opt: 170, E(): 9.8e-05, (27.6% identity in 127 aa
+ overlap); etc. Similar also to SC9B10_7 from Streptomyces
+ coelicolor FASTA score: E():0.00038; and Rv0165c|MTCI28_5
+ from Mycobacterium tuberculosis (264 aa), FASTA score:
+ (27.7% identity in 130 aa overlap). Mb0044c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY GNTR-FAMILY)"
+ /protein_id="SIT98404.1"
+ /db_xref="GOA:P67738"
+ /db_xref="InterPro:IPR000524"
+ /db_xref="InterPro:IPR008920"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P67738"
+ /translation="MPKKYGVKEKDQVVAHILNLLLTGKLRSGDRVDRNEIAHGLGVS
+ RVPIQEALVQLEHDGIVSTRYHRGAFIERFDVATILEHHELDGLLNGIASARAAANPT
+ PRILGQLDAVMRSLRNSKESRAFAECVWEYRRTVNDEYAGPRLHATIRASQNLIPRVF
+ WMTYQNSRDDVLPFYEEENAAIHRREPEAARAACIGRSELMAQTMLAELFRRRVLVPP
+ EGACPGPFGAPIPGFARSYQPSSPVP"
+ gene complement(48217..49011)
+ /locus_tag="BQ2027_MB0045C"
+ CDS complement(48217..49011)
+ /locus_tag="BQ2027_MB0045C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0045c, -, len: 264 aa. Equivalent to Rv0044c,
+ len: 264 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 264 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), highly similar to
+ AAD32732.1|MmcI|AF127374| F420-dependent H4MPT reductase
+ from Streptomyces lavendulae (264 aa). Also similar to
+ Mycobacterium tuberculosis proteins e.g. Rv1855c, Rv0953c,
+ Rv0791c, Rv0132c, etc. Protein product from Mb0045c
+ detected using shotgun mass spectrometry. Mb0045c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="SIT98405.1"
+ /db_xref="GOA:A0A1R3XU55"
+ /db_xref="InterPro:IPR011251"
+ /db_xref="InterPro:IPR022480"
+ /db_xref="InterPro:IPR036661"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU55"
+ /translation="MTSLVRPDLPVRIGVQLQPQHAPHYRAVRDAVRRCEDIGVDIAF
+ TWDHFFPLYGDPDGPHFECWTVLGAWAEQTSHIEIGALVTCNSYRNPELLADMARTVD
+ HISGGRLILGIGSGWKQKDYDEYGYRFGTAGSRLDDLAAALPRIKARLGKLNPPPTRD
+ IPVLIGGGGERKTLRLVAEYADIWHSFTAGDSYLAKSAVLSTHCSTVGRNPATIERSA
+ AVDGGGLIASAEALAGLGVTLLTVGCDGPDYDLSAAAALCRWRDGR"
+ gene complement(49027..49923)
+ /locus_tag="BQ2027_MB0046C"
+ CDS complement(49027..49923)
+ /locus_tag="BQ2027_MB0046C"
+ /note="Mb0046c, -, len: 298 aa. Equivalent to Rv0045c, len
+ 298 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 298 aa overlap). Possible hydrolase
+ (EC 3.-.-.-), showing similarity with others eg
+ NP_107230.1|NC_002678 putative hydrolase from
+ Mesorhizobium loti (278 aa); CAB56730.1|AL121600 putative
+ hydrolase from Streptomyces coelicolor (302 aa);
+ NP_438361.1|NC_000907 putative esterase/lipase from
+ Haemophilus influenzae Rd (287 aa); etc. Also similar to
+ Mycobacterium tuberculosis proteins Rv3473c, Rv1123c,
+ Rv1938, Rv3617, Rv3670, etc. Protein product from Mb0046c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0046c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE HYDROLASE"
+ /protein_id="SIT98406.1"
+ /db_xref="GOA:A0A1R3XU63"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU63"
+ /translation="MLSDDELTGLDEFALLAENAEQAGVNGPLPEVERVQAGAISALR
+ WGGSAPRVIFLHGGGQNAHTWDTVIVGLGEPALAVDLPGHGHSAWREDGNYSPQLNSE
+ TLAPVLRELAPGAEFVVGMSLGGLTAIRLAAMAPDLVGELVLVDVTPSALQRHAELTA
+ EQRGTVALMHGEREFPSFQAMLDLTIAAAPHRDVKSLRRGVFHNSRRLDNGNWVWRYD
+ AIRTFGDFAGLWDDVDALSAPITLVRGGSSGFVTDQDTAELHRRATHFRGVHIVEKSG
+ HSVQSDQPRALIEIVRGVLDTR"
+ gene complement(50005..51108)
+ /gene="ino1"
+ /locus_tag="BQ2027_MB0047C"
+ CDS complement(50005..51108)
+ /gene="ino1"
+ /locus_tag="BQ2027_MB0047C"
+ /standard_name="tbINO"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0047c, ino1, len: 367 aa. Equivalent to Rv0046c,
+ len: 367 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 367 aa overlap). ino1 (alternate gene
+ name: tbINO), myo-inositol-1-phosphate synthase (EC
+ 5.5.1.4) (see citations below), equivalent to
+ Q57240|Y046_MYCLE|U00015_14|G466956|B1620_F3_113
+ HYPOTHETICAL 40.3 KDA PROTEIN from Mycobacterium leprae
+ (369 aa), FASTA scores: opt: 2221, E(): 0, (91.8% identity
+ in 366 aa overlap). N-terminus similar to N-terminus of
+ myo-inositol-1-phosphate synthases e.g. INO1_SPIPO|P42803
+ myo-inositol-1-phosphate synthase (510 aa), FASTA scores:
+ opt: 144, E(): 0.021, (25.2% identity in 365 aa overlap);
+ CAC21218.1|AJ401007 myo-inositol 1P synthase from
+ Thermotoga sp. SG1 (335 aa); etc. Also highly similar to
+ other hypothetical proteins e.g. AL049826|SCH24_21c
+ hypothetical protein from Streptomyces coelicolor (360
+ aa), FASTA scores: opt: 1790, E(): 0, (77.8% identity in
+ 360 aa overlap); AE000881_1 conserved protein from M.
+ thermoautotrophicus (368 aa); etc. Protein product from
+ Mb0047c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0047c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MYO-INOSITOL-1-PHOSPHATE SYNTHASE INO1 (Inositol
+ 1-phosphate synthetase) (D-glucose 6-phosphate
+ cycloaldolase) (Glucose 6-phosphate cyclase)
+ (Glucocycloaldolase)"
+ /protein_id="SIT98407.1"
+ /db_xref="GOA:P59967"
+ /db_xref="InterPro:IPR002587"
+ /db_xref="InterPro:IPR013021"
+ /db_xref="InterPro:IPR017815"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P59967"
+ /translation="MSEHQSLPAPEASTEVRVAIVGVGNCASSLVQGVEYYYNADDTS
+ TVPGLMHVRFGPYHVRDVKFVAAFDVDAKKVGFDLSDAIFASENNTIKIADVAPTNVI
+ VQRGPTLDGIGKYYADTIELSDAEPVDVVQALKEAKVDVLVSYLPVGSEEADKFYAQC
+ AIDAGVAFVNALPVFIASDPVWAKKFTDAGVPIVGDDIKSQVGATITHRVLAKLFEDR
+ GVQLDRTMQLNVGGNMDFLNMLERERLESKKISKTQAVTSNLKREFKTKDVHIGPSDH
+ VGWLDDRKWAYVRLEGRAFGDVPLNLEYKLEVWDSPNSAGVIIDAVRAAKIAKDRGIG
+ GPVIPASAYLMKSPPEQLPDDIARAQLEEFIIG"
+ gene complement(51169..51711)
+ /locus_tag="BQ2027_MB0048C"
+ CDS complement(51169..51711)
+ /locus_tag="BQ2027_MB0048C"
+ /note="Mb0048c, -, len: 180 aa. Equivalent to Rv0047c,
+ len: 180 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 180 aa overlap). Conserved
+ hypothetical protein, equivalent to NP_302717.1|NC_002677
+ conserved hypothetical protein from Mycobacterium leprae
+ (180 aa). Also showing strong similarity to other
+ hypothetical proteins e.g. AL049826|SCH24_22|T36587 from
+ Streptomyces coelicolor (225 aa), FASTA scores: opt: 583,
+ E(): 9e-31, (51.4% identity in 177 aa overlap); etc. Some
+ similarity to Rv1176c from Mycobacterium tuberculosis and
+ to P94443|YFIO from Bacillus subtilis (182 aa), FASTA
+ scores: E(): 0.00066, (24.9% identity in 177 aa overlap).
+ Also some similarity to G1163121 MITHRAMYCIN RESISTANCE
+ DETERMINANT, ATP-BINDING PROTEIN (219 aa), FASTA scores:
+ opt: 143, E(): 0.0091, (29.4% identity in 180 aa overlap).
+ Protein product from Mb0048c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0048c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, PadR family"
+ /protein_id="SIT98408.1"
+ /db_xref="InterPro:IPR005149"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWC5"
+ /translation="MLELAILGLLIESPMHGYELRKRLTGLLGAFRAFSYGSLYPALR
+ RMQADGLIAENAAPAGTPVRRARRVYQLTDKGRRRFGELVADTGPHNYTDDGFGVHLA
+ FFNRTPAEARMRILEGRRRQVEERREGLREAVARASSSFDRYTRQLHQLGLESSEREV
+ KWLNELIAAERAAPNPAEQT"
+ gene complement(51812..52681)
+ /locus_tag="BQ2027_MB0049C"
+ CDS complement(51812..52681)
+ /locus_tag="BQ2027_MB0049C"
+ /note="Mb0049c, -, len: 289 aa. Equivalent to Rv0048c,
+ len: 289 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 289 aa overlap). Possible membrane
+ protein. Protein product from Mb0049c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0049c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIT98410.1"
+ /db_xref="GOA:A0A1R3XVA5"
+ /db_xref="InterPro:IPR012551"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVA5"
+ /translation="MAKWLGAPLARGVSTATRAKDSDRQDACRILDDALRDGELSMEE
+ HRERVSAATKAVTLGDLQRLVADLQVESAPAQMPALKSRAKRTELGLLAAAFVASVLL
+ GVGIGWGVYGNTRSPLDFTSDPGAKPDGIAPVVLTPPRQLHSLGGLTGLLEQTRKRFG
+ DTMGYRLVIYPEYASLDRVDPADDRRVLAYTYRGGWGDATSSAKSIADVSVVDLSKFD
+ AKTAVSIMRGAPETLGLKQSDVKSMYLIVEPAKDPTTPAALSLSLYVSSDYGGGYLVF
+ AGDGTIKHVSYPS"
+ gene 52815..53228
+ /locus_tag="BQ2027_MB0050"
+ CDS 52815..53228
+ /locus_tag="BQ2027_MB0050"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0050, -, len: 137 aa. Equivalent to Rv0049, len:
+ 137 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 137 aa overlap). Conserved
+ hypothetical protein, only equivalent to
+ AL022118|MLCB1913_20 hypothetical protein from
+ Mycobacterium leprae (138 aa), FASTA scores: opt: 768,
+ E(): 0, (83.9% identity in 137 aa overlap). Mb0050 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT98412.1"
+ /db_xref="InterPro:IPR035169"
+ /db_xref="UniProtKB/Swiss-Prot:P64678"
+ /translation="MDYTLRRRSLLAEVYSGRTGVSEVCDANPYLLRAAKFHGKPSRV
+ ICPICRKEQLTLVSWVFGEHLGAVSGSARTAEELILLATRFSEFAVHVVEVCRTCSWN
+ HLVKSYVLGAARPARPPRGSGGTRTARNGARTASE"
+ gene 53221..55689
+ /gene="ponA1"
+ /locus_tag="BQ2027_MB0051"
+ CDS 53221..55689
+ /gene="ponA1"
+ /locus_tag="BQ2027_MB0051"
+ /note="Mb0051, ponA1, len: 680 aa. Equivalent to Rv0050,
+ len: 678 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 680 aa overlap). Probable ponA1,
+ penicillin-binding protein (class A), bienzymatic protein
+ with transglycosylase (EC 2.4.2.-) and transpeptidase (EC
+ 3.4.-.-) activities, highly similar to many e.g.
+ NP_302715.1|NC_002677 penicillin-binding protein from
+ Mycobacterium leprae (708 aa); AAB53123.1|L39923
+ penicillin binding protein from Mycobacterium leprae (686
+ aa), FASTA scores: (82.3% identity in 679 aa overlap);
+ Q9F9V7|PONA|AAG13121.1|AF165523_1|AF165523
+ penicillin-binding protein 1 from Mycobacterium smegmatis
+ (715 aa) (see citation below); CAB88838.1|AL353832
+ probable penicillin-binding protein from Streptomyces
+ coelicolor (756 aa); etc. Also similar to
+ ponA2|Rv3682|MTV025.030 BIFUNCTIONAL MEMBRANE-ASSOCIATED
+ PENICILLIN-BINDING PROTEIN 1A/1B from Mycobacterium
+ tuberculosis (810 aa). BELONGS TO THE TRANSGLYCOSYLASE
+ FAMILY IN THE N-TERMINAL SECTION, AND TO THE
+ TRANSPEPTIDASE FAMILY IN THE C-TERMINAL SECTION.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, two
+ insertions of 3 bp each (*-tcc, *-cgt) leads to a slightly
+ longer product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (680 aa versus 678 aa). Protein
+ product from Mb0051 detected using SWATH mass
+ spectrometry. Mb0051 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BIFUNCTIONAL PENICILLIN-BINDING PROTEIN
+ 1A/1B PONA1 (MUREIN POLYMERASE) (PBP1):
+ PENICILLIN-INSENSITIVE TRANSGLYCOSYLASE (PEPTIDOGLYCAN
+ TGASE) + PENICILLIN-SENSITIVE TRANSPEPTIDASE
+ (DD-TRANSPEPTIDASE)"
+ /protein_id="SIT98414.1"
+ /db_xref="GOA:A0A1R3XUS2"
+ /db_xref="InterPro:IPR001264"
+ /db_xref="InterPro:IPR001460"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="InterPro:IPR023346"
+ /db_xref="InterPro:IPR036950"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XUS2"
+ /translation="MNSDGRHHQSSSGAPRGPANPGQRGQVPPDDRLTAILPPVTDDR
+ SAPHADSIEAVKAALDGAPPMPPPRDPLEEVTAALAAPPGKPPRGDQLGGRRRPPGPP
+ GPPGSSGQPAGRLPQPRVDLPRVGQINWKWIRRSLYLTAAVVILLLMVTFTMAYLIVD
+ VPKPGDIRTNQVSTILASDGSEIAKIVPPEGNRVDVNLSQVPMHVRQAVIAAEDRNFY
+ SNPGFSFTGFARAVKNNLFGGDLQGGSTITQQYVKNALVGSAQHGWSGLMRKAKELVI
+ ATKMSGEWSKDDVLQAYLNIIYFGRGAYGISAASKAYFDKPVEQLTVAEGALLAALIR
+ RPSTLDPAVDPEGAHARWNWVLDGMVETKALSPNDRAAQVFPETVPPDLARAENQTKG
+ PNGLIERQVTRELLELFNIDEQTLNTQGLVVTTTIDPQAQRAAEKAVAKYLDGQDPDM
+ RAAVVSIDPHNGAVRAYYGGDNANGFDFAQAGLQTGSSFKVFALVAALEQGIGLGYQV
+ DSSPLTVDGIKITNVEGEGCGTCNIAEALKMSLNTSYYRLMLKLNGGPQAVADAAHQA
+ GIASSFPGVAHTLSEDGKGGPPNNGIVLGQYQTRVIDMASAYATLAASGIYHPPHFVQ
+ KVVSANGQVLFDASTADNTGDQRIPKAVADNVTAAMEPIAGYSRGHNLAGGRDSAAKT
+ GTTQFGDTTANKDAWMVGYTPSLSTAVWVGTVKGDEPLVTASGAAIYGSGLPSDIWKA
+ TMDGALKGTSNETFPKPTEVGGYAGVPPPPPPPPSEVPPSETVIQPTVEIAPGITIPI
+ GPPTTITLAPPPPAPPAATPTPPP"
+ gene 55686..57368
+ /locus_tag="BQ2027_MB0052"
+ CDS 55686..57368
+ /locus_tag="BQ2027_MB0052"
+ /note="Mb0052, -, len: 560 aa. Equivalent to Rv0051,
+ len:560 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 560 aa overlap). Probable conserved
+ transmembrane protein, equivalent to NP_302714.1|NC_002677
+ conserved membrane protein from Mycobacterium leprae (564
+ aa); and highly similar to C-terminus of
+ AAF25828.1|AF187306_1|AF187306 putative transmembrane
+ protein from Mycobacterium smegmatis (692 aa). Also highly
+ similar to MSGDNAB_5|G886306|L222-ORF5 (418 aa), FASTA
+ scores: opt: 2163, E(): 0, (78.4% identity in 412 aa
+ overlap). Also similar to AL049826|SCH24_24|T36589
+ probable transmembrane protein from Streptomyces
+ coelicolor (502 aa), FASTA scores: opt: 492, E(): 1.4e-23,
+ (35.8% identity in 522 aa overlap). Mb0052 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT98416.1"
+ /db_xref="GOA:A0A1R3XU43"
+ /db_xref="InterPro:IPR016570"
+ /db_xref="InterPro:IPR018584"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU43"
+ /translation="MTGALSQSSNISPLPLAADLRSADNRDCPSRTDVLGAALANVVG
+ GPVGRHALIGRTRLMTPLRVMFAIALVFLALGWSTKAACLQSTGTGPGDQRVANWDNQ
+ RAYYQLCYSDTVPLYGAELLSQGKFPYKSSWIETDSNGTPQLRYDGQIAVRYMEYPVL
+ TGIYQYLSMAIAKTYTALSKVAPLPVVAEVVMFFNVAAFGLALAWLTTVWATSGLAGR
+ RIWDAALVAASPLVIFQIFTNFDALATGLATSGLLAWARRRPVLAGVLIGLGSAAKLY
+ PLLFLYPLLLLGIRAGRLNALARTMAAAAATWLLVNLPVMLLFPRGWSEFFRLNTRRG
+ DDMDSLYNVVKSFTGWRGFDPTLGFWEPPLVLNTVVTLLFVLCCAAIAYIALTAPHRP
+ RVAQLTFLTVASFLLVNKVWSPQFSLWLVPLAVLALPHRRILLAWMTIDALVWVPRMY
+ YLYGNPSRSLPEQWFTTTVLLRDIAVMVLCGLVVWQIYRPGRDLVRTGGPGALPACGG
+ VDDPVGGVFANAADAPPGRLPSWLRPRLGDEHARERTPDAGRDRTFSGQHRA"
+ gene 57400..57963
+ /locus_tag="BQ2027_MB0053"
+ CDS 57400..57963
+ /locus_tag="BQ2027_MB0053"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0053, -, len: 187 aa. Equivalent to Rv0052, len:
+ 187 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 187 aa overlap). Conserved
+ hypothetical protein, similar to others e.g.
+ AL049587|SC5F2A_30S|T35272 hypothetical protein from
+ Streptomyces coelicolor (211 aa), FASTA scores: opt: 531,
+ E(): 3.4e-29, (49.5% identity in 182 aa overlap);
+ NP_420588.1|NC_002696 ThiJ/PfpI family protein from
+ Caulobacter crescentus (267 aa); etc. Some similarity to
+ Escherichia coli G1100872|thiJ (198 aa), FASTA scores:
+ opt: 178, E(): 6.1e-06, (29.9% identity in 137 aa
+ overlap). Also similar to Rv1930c from Mycobacterium
+ tuberculosis (174 aa). May be a membrane protein. Protein
+ product from Mb0053 detected using shotgun mass
+ spectrometry. Mb0053 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Intracellular protease"
+ /protein_id="SIT98418.1"
+ /db_xref="InterPro:IPR002818"
+ /db_xref="InterPro:IPR029062"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU47"
+ /translation="MPSFDVVFVGHRRGEVRSDNAMLGLLCDAAFDELTRPDVVIFPG
+ GIGTRTLIHDQTVLDWVREAHRHTLLTTSVCTGGLVLAAAGLLNGLTATTHWRVQDLF
+ NSLGARYVPQRVVEHLPERVITAAGVSSGIDMGLRLVELLVSREAAEASQLMIEYDPQ
+ PPVDAGSLAKASPATHRLALEFYQHRL"
+ gene 58182..58472
+ /gene="rpsF"
+ /locus_tag="BQ2027_MB0054"
+ CDS 58182..58472
+ /gene="rpsF"
+ /locus_tag="BQ2027_MB0054"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0054, rpsF, len: 96 aa. Equivalent to Rv0053,
+ len: 96 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 96 aa overlap). Probable 30S ribosomal
+ protein S6, equivalent to RS6_MYCLE|P46389 30s ribosomal
+ protein s6 from Mycobacterium leprae (96 aa), FASTA
+ scores: opt: 570, E(): 1.1e-36, (91.7% identity in 96 aa
+ overlap).Also highly similar to many e.g. Q9X8U2|RS6_STRCO
+ 30S RIBOSOMAL PROTEIN S6 from Streptomyces coelicolor (96
+ aa); etc. Note that the putative product of this CDS
+ corresponds to spot 6_26 identified in culture supernatant
+ by proteomics at the Max-Planck-Institut fuer
+ Infektionsbiologie (see citations below). Contains PS01048
+ Ribosomal protein S6 signature. BELONGS TO THE S6P FAMILY
+ OF RIBOSOMAL PROTEINS. Protein product from Mb0054
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0054 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s6 rpsf"
+ /protein_id="SIT98421.1"
+ /db_xref="GOA:P66592"
+ /db_xref="InterPro:IPR000529"
+ /db_xref="InterPro:IPR014717"
+ /db_xref="InterPro:IPR020814"
+ /db_xref="InterPro:IPR020815"
+ /db_xref="InterPro:IPR035980"
+ /db_xref="UniProtKB/Swiss-Prot:P66592"
+ /translation="MRPYEIMVILDPTLDERTVAPSLETFLNVVRKDGGKVEKVDIWG
+ KRRLAYEIAKHAEGIYVVIDVKAAPATVSELDRQLSLNESVLRTKVMRTDKH"
+ gene 58576..59070
+ /gene="ssb"
+ /locus_tag="BQ2027_MB0055"
+ CDS 58576..59070
+ /gene="ssb"
+ /locus_tag="BQ2027_MB0055"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0055, ssb, len: 164 aa. Equivalent to Rv0054,
+ len: 164 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 164 aa overlap). Probable ssb,
+ single-strand binding protein, equivalent to highly
+ similar to others e.g. SSB_MYCLE|P46390 single-strand
+ binding protein from Mycobacterium leprae (140 aa), FASTA
+ scores: opt: 792, E(): 0, (92.6% identity in 135 aa
+ overlap); and AAK30583.1|AF349434 single-stranded
+ DNA-binding protein from Mycobacterium smegmatis (165 aa).
+ Also highly similar to others e.g. T36594 probable
+ single-strand binding protein from Streptomyces coelicolor
+ (199 aa); etc. Also similar to Rv2478c|MTV008_34c
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium
+ tuberculosis (161 aa), FASTA score: E (): 1.1e-06. Note
+ that the putative product of this CDS corresponds to spot
+ 3_210 identified in culture supernatant by proteomics at
+ the Max-Planck-Institut fuer Infektionsbiologie (see
+ citations below). BELONGS TO THE SSB FAMILY. Protein
+ product from Mb0055 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0055 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="single-strand binding protein ssb
+ (helix-destabilizing protein)"
+ /protein_id="SIT98423.1"
+ /db_xref="GOA:P0A611"
+ /db_xref="InterPro:IPR000424"
+ /db_xref="InterPro:IPR011344"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="UniProtKB/Swiss-Prot:P0A611"
+ /translation="MAGDTTITIVGNLTADPELRFTPSGAAVANFTVASTPRIYDRQT
+ GEWKDGEALFLRCNIWREAAENVAESLTRGARVIVSGRLKQRSFETREGEKRTVIEVE
+ VDEIGPSLRYATAKVNKASRSGGFGSGSRPAPAQTSSASGDDPWGSAPASGSFGGGDD
+ EPPF"
+ gene 59112..59366
+ /gene="rpsR1"
+ /locus_tag="BQ2027_MB0056"
+ CDS 59112..59366
+ /gene="rpsR1"
+ /locus_tag="BQ2027_MB0056"
+ /note="Mb0056, rpsR1, len: 84 aa. Equivalent to Rv0055,
+ len: 84 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 84 aa overlap). Probable rpsR1, 30S
+ ribosomal protein S18-1, equivalent to
+ NP_302711.1|NC_002677|O53125|RS18_MYCLE 30S RIBOSOMAL
+ PROTEIN from Mycobacterium leprae (84 aa). Also highly
+ similar to others e.g. Q9X8U4|R18A_STRCO 30S RIBOSOMAL
+ PROTEIN S18-1 from Streptomyces coelicolor (78 aa);
+ RS18_B|ACST|P10806 30s ribosomal protein s18 (bs21) (77
+ aa), FASTA scores: opt: 220, E(): 4e-10, (52.2% identity
+ in 67 aa overlap); etc. Also similar to MTCY63A_5 from
+ Mycobacterium tuberculosis. BELONGS TO THE S18P FAMILY OF
+ RIBOSOMAL PROTEINS. Note that previously known as rpsR.
+ Protein product from Mb0056 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0056 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s18-1 rpsr1"
+ /protein_id="SIT98425.1"
+ /db_xref="GOA:P69231"
+ /db_xref="InterPro:IPR001648"
+ /db_xref="InterPro:IPR018275"
+ /db_xref="InterPro:IPR036870"
+ /db_xref="UniProtKB/Swiss-Prot:P69231"
+ /translation="MAKSSKRRPAPEKPVKTRKCVFCAKKDQAIDYKDTALLRTYISE
+ RGKIRARRVTGNCVQHQRDIALAVKNAREVALLPFTSSVR"
+ gene 59399..59857
+ /gene="rplI"
+ /locus_tag="BQ2027_MB0057"
+ CDS 59399..59857
+ /gene="rplI"
+ /locus_tag="BQ2027_MB0057"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0057, rplI, len: 152 aa. Equivalent to Rv0056,
+ len: 152 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 152 aa overlap). Probable rplI, 50S
+ ribosomal protein L9, equivalent to RL9_MYCLE|P46385 50s
+ ribosomal protein l9 from Mycobacterium leprae (152 aa),
+ FASTA scores: opt: 847, E(): 0, (88.7% identity in 150 aa
+ overlap). Also highly similar to others e.g.
+ Q9X8U5|RL9_STRCO 50S RIBOSOMAL PROTEIN L9 from
+ Streptomyces coelicolor (148 aa); etc. Contains PS00651
+ Ribosomal protein L9 signature. BELONGS TO THE L9P FAMILY
+ OF RIBOSOMAL PROTEINS. Protein product from Mb0057
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0057 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l9 rpli"
+ /protein_id="SIT98427.1"
+ /db_xref="GOA:P66316"
+ /db_xref="InterPro:IPR000244"
+ /db_xref="InterPro:IPR009027"
+ /db_xref="InterPro:IPR020069"
+ /db_xref="InterPro:IPR020070"
+ /db_xref="InterPro:IPR020594"
+ /db_xref="InterPro:IPR036791"
+ /db_xref="InterPro:IPR036935"
+ /db_xref="UniProtKB/Swiss-Prot:P66316"
+ /translation="MKLILTADVDHLGSIGDTVEVKDGYGRNFLLPRGLAIVASRGAQ
+ KQADEIRRARETKSVRDLEHANEIKAAIEALGPIALPVKTSADSGKLFGSVTAADVVA
+ AIKKAGGPNLDKRIVRLPKTHIKAVGTHFVSVHLHPEIDVEVSLDVVAQS"
+ gene 59886..60407
+ /locus_tag="BQ2027_MB0058"
+ CDS 59886..60407
+ /locus_tag="BQ2027_MB0058"
+ /note="Mb0058, -, len: 173 aa. Equivalent to Rv0057, len:
+ 173 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 173 aa overlap). Hypothetical unknown
+ protein. Mb0058 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT98430.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64680"
+ /translation="MPVVTAVGRRRGFAMPWVSTARSGAVMLANYSAGVCGRVSSPGL
+ NVRKMCLKANTPGAVTWLDTPKRFLSTQTASRCMAVNSSDVVTGRIDPQVLHTPLNTD
+ VDGYAHAMHSSINSGPLEYLPATFSVFPALGDVGDLGGGVGAATYALDRLSNMRSGAC
+ VGGGESPWRSLMT"
+ gene 60386..63010
+ /gene="dnaB"
+ /locus_tag="BQ2027_MB0059"
+ CDS 60386..63010
+ /gene="dnaB"
+ /locus_tag="BQ2027_MB0059"
+ /note="Mb0059, dnaB, len: 874 aa. Equivalent to Rv0058,
+ len: 874 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 874 aa overlap). Probable dnaB,
+ replicative DNA helicase (EC 3.6.1.-). Contains an intein
+ (position 61630..62838) similar to, and in the same
+ position as, those in Sycnechocystis and Rhodothermus
+ marinus (see citation below). Highly similar to others
+ e.g. DNAB_SYNY3|Q55418 replicative dna helicase (872 aa),
+ FASTA scores: opt: 533, E(): 0, (32.5% identity in 424 aa
+ overlap). Also similar to intein recA|E1173867|AL008967
+ RECA INTEIN from Mycobacterium tuberculosis (442 aa),
+ FASTA scores: E(): 3.8e-16, (27.0% identity in 426 aa
+ overlap). C-terminal extein (position 62839..63015)
+ similar to many dnaB proteins e.g.
+ NP_302709.1|NC_002677|P46394|DNAB_MYCLE REPLICATIVE DNA
+ HELICASE from Mycobacterium leprae (604 aa);
+ DNAB_ECOLI|P03005 replicative dna helicase from
+ Escherichia coli (471 aa), FASTA scores: opt: 148, E():
+ 1.5e-07, (37.9% identity in 58 aa overlap); etc. THIS
+ PROTEIN UNDERGOES A PROTEIN SELF SPLICING THAT INVOLVES A
+ POST-TRANSLATIONAL EXCISION OF THE INTERVENING REGION
+ (INTEIN) FOLLOWED BY PEPTIDE LIGATION. BELONGS TO THE
+ HELICASE FAMILY, DNAB SUBFAMILY. IN THE INTEIN SECTION;
+ BELONGS TO THE HOMING ENDONUCLEASE FAMILY. Mb0059 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE REPLICATIVE DNA HELICASE DNAB"
+ /protein_id="SIT98432.1"
+ /db_xref="GOA:P59966"
+ /db_xref="InterPro:IPR003586"
+ /db_xref="InterPro:IPR003587"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR004042"
+ /db_xref="InterPro:IPR004860"
+ /db_xref="InterPro:IPR006141"
+ /db_xref="InterPro:IPR006142"
+ /db_xref="InterPro:IPR007692"
+ /db_xref="InterPro:IPR007693"
+ /db_xref="InterPro:IPR007694"
+ /db_xref="InterPro:IPR016136"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR027434"
+ /db_xref="InterPro:IPR030934"
+ /db_xref="InterPro:IPR036185"
+ /db_xref="InterPro:IPR036844"
+ /db_xref="UniProtKB/Swiss-Prot:P59966"
+ /translation="MAVVDDLAPGMDSSPPSEDYGRQPPQDLAAEQSVLGGMLLSKDA
+ IADVLERLRPGDFYRPAHQNVYDAILDLYGRGEPADAVTVAAELDRRGLLRRIGGAPY
+ LHTLISTVPTAANAGYYASIVAEKALLRRLVEAGTRVVQYGYAGAEGADVAEVVDRAQ
+ AEIYDVADRRLSEDFVALEDLLQPTMDEIDAIASSGGLARGVATGFTELDEVTNGLHP
+ GQMVIVAARPGVGKSTLGLDFMRSCSIRHRMASVIFSLEMSKSEIVMRLLSAEAKIKL
+ SDMRSGRMSDDDWTRLARRMSEISEAPLFIDDSPNLTMMEIRAKARRLRQKANLKLIV
+ VDYLQLMTSGKKYESRQVEVSEFSRHLKLLAKELEVPVVAISQLNRGPEQRTDKKPML
+ ADLRESGCLTASTRILRADTGAEVAFGELMRSGERPMVWSLDERLRMVARPMINVFPS
+ GRKEVFRLRLASGREVEATGSHPFMKFEGWTPLAQLKVGDRIAAPRRVPEPIDTQRMP
+ ESELISLARMIGDGSCLKNQPIRYEPVDEANLAAVTVSAAHSDGAAIRDDYLAARVPS
+ LRPARQRLPRGRCTPIAAWLAGLGLFTKRSHEKCVPEAVFRAPNDQVALFLRHLWSAG
+ GSVRWDPTNGQGRVYYGSTSRRLIDDVAQLLLRVGIFSWITHAPKLGGHDSWRLHIHG
+ AKDQVRFLRHVGVHGAEAVAAQEMLRQLKGPVRNPNLDSAPKKVWAQVRNRLSAKQMM
+ DIQLHEPTMWKHSPSRSRPHRAEARIEDRAIHELARGDAYWDTVVEITSIGDQHVFDG
+ TVSGTHNFVANGISLHNSLEQDADVVILLHRPDAFDRDDPRGGEADFILAKHRNGPTK
+ TVTVAHQLHLSRFANMAR"
+ gene 63190..63882
+ /locus_tag="BQ2027_MB0060"
+ CDS 63190..63882
+ /locus_tag="BQ2027_MB0060"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0060, -, len: 230 aa. Equivalent to Rv0059, len:
+ 230 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 230 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0060 detected using
+ shotgun mass spectrometry. Mb0060 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT98434.1"
+ /db_xref="InterPro:IPR029494"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XUE0"
+ /translation="MITRYKPESGFVARSGGPDRKRPHDWIVWHFTHADNLPGIITAG
+ RLLADSAVTPTTEVAYNPVKELRRHKVVAPDSRYPASMASDHVPFYIAARSPMLYVVC
+ KGHSGYSGGAGPLVHLGVALGDIIDADLTWCASDGNAAASYTKFSRQVDTLGTFVDFD
+ LLCQRQWHNTDDDPNRQSRRAAEILVYGHVPFELVSYVCCYNTETMTRVRTLLDPVGG
+ VRKYVIKPGMYY"
+ gene 63899..64957
+ /locus_tag="BQ2027_MB0061"
+ CDS 63899..64957
+ /locus_tag="BQ2027_MB0061"
+ /note="Mb0061, -, len: 352 aa. Equivalent to Rv0060, len:
+ 352 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 352 aa overlap). Conserved
+ hypothetical protein, showing weak similarity to
+ NP_104623.1|NC_002678 hypothetical protein from
+ Mesorhizobium loti (155 aa); and AP000062|AP000062_92
+ hypothetical protein from Aeropyrum pernix (194 aa), FASTA
+ scores: opt: 186, E(): 4.2e-05, (30.9% identity in 165 aa
+ overlap). Protein product from Mb0061 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0061 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ADP-ribose 1-phosphate phophatase related
+ protein"
+ /protein_id="SIT98436.1"
+ /db_xref="InterPro:IPR002589"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XUT5"
+ /translation="MITYGSGDLLRADTEALVNTVNCVGVMGKGIALQFKRRYPEMFT
+ AYEKACKRGEVTIGKMFVVDTGQLDGPKHIINFPTKKHWRAPSKLAYIDAGLIDLIRV
+ IRELNIASVAVPPLGVGNGGLDWEDVEQRLVSAFQQLPDVDAVIYPPSGGSRAIEGVE
+ GLRMTWGRAVILEAMRRYLQQRRAMEPWEDPAGISHLEIQKLMYFANEADPDLALDFT
+ PGRYGPYSERVRHLLQGMEGAFTVGLGDGTARVLANQPISLTTKGTDAITDYLATDAA
+ ADRVSAAVDTVLRVIEGFEGPYGVELLASTHWVATREGAKEPATAAAAVRKWTKRKGR
+ IYSDDRIGVALDRILMTA"
+ gene complement(65002..65340)
+ /locus_tag="BQ2027_MB0062A"
+ CDS complement(65002..65340)
+ /locus_tag="BQ2027_MB0062A"
+ /note="Mb0062A, len: 112 aa. Equivalent to Rv0061c len:
+ 112 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 112 aa overlap). Transferred from
+ H37Rv annotation using Rapid Annotation Transfer Tool
+ (Nucleic Acids Res. 2011 May; 39(9): e57). Conserved
+ hypothetical protein supported by RNA-seq data. Similar to
+ MMAR_3839, 76% identity in 112 aa overlap. Replaces
+ questionable ORF Rv0061 (MTV030.04). Protein product from
+ Mb0062A detected using shotgun mass spectrometry. Mb0062A
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Hypothetical protein"
+ /protein_id="SIT98437.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU77"
+ /translation="MKLKFARLSTAILGCAAALVFPASVASADPPDPHQPDMTKGYCP
+ GGRWGFGDLAVCDGEKYPDGSFWHQWMQTWFTGPQFYFDCVSGGEPLPGPPPPGGCGG
+ AIPSEQPNAP"
+ gene 65542..66684
+ /gene="celA1"
+ /locus_tag="BQ2027_MB0063"
+ CDS 65542..66684
+ /gene="celA1"
+ /locus_tag="BQ2027_MB0063"
+ /note="Mb0063, celA1, len: 380 aa. Equivalent to Rv0062,
+ len: 380 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 380 aa overlap). Possible celA1,
+ cellulase (EC 3.2.1.4), similar to many e.g.
+ AB65568.1|AL136058 putative secreted endoglucanase
+ (cellulase) from Streptomyces coelicolor (332 aa);
+ P07984|GUNA_CELFI ENDOGLUCANASE A PRECURSOR from
+ Cellulomonas fimi (449 aa); GUN1_STRHA|P33682
+ endoglucanase 1 precursor (cellulase) from STREPTOMYCES
+ HALSTEDII (321 aa), FASTA scores: opt: 702, E(): 1. 2e-27,
+ (38.9% identity in 319 aa overlap); etc. SEEMS TO BELONG
+ TO CELLULASE FAMILY B (FAMILY 6 OF GLYCOSYL HYDROLASES).
+ Note that previously known as celA. Protein product from
+ Mb0063 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0063 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CELLULASE CELA1 (ENDOGLUCANASE)
+ (ENDO-1,4-BETA-GLUCANASE) (FI-CMCASE) (CARBOXYMETHYL
+ CELLULASE)"
+ /protein_id="SIT98438.1"
+ /db_xref="GOA:A0A1R3XU64"
+ /db_xref="InterPro:IPR016288"
+ /db_xref="InterPro:IPR036434"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU64"
+ /translation="MTRRTGQRWRGTLPGRRPWTRPAPATCRRHLAFVELRHYFARVM
+ SSAIGSVARWIVPLLGVAAVASIGVIADPVRVVRAPALILVDAANPLAGKPFYVDPAS
+ AAMIAARNANPPNAELTSVANTPQSYWLDQAFPPATVGGTVARYTGAAQAAGAMPVLT
+ LYGIPHRDCGSYASGGFATGTDYRGWIDAVASGLGSSPATIIVEPDALAMADCLSPDQ
+ RQERFDLVRYAVDTLTRDPAAAVYVDAGHSRWLSAEAMAARLNDVGVGRARGFSLNVS
+ NFYTTDEEIGYGEAISGLTNGSHYVIDTSRNGAGPAPDAPLNWCNPSGRALGAPPTTA
+ TAGAHADAYLWIKRPGESDGTCGRGEPQAGRFVSQYAIDLAHNAGQ"
+ gene 66913..68352
+ /locus_tag="BQ2027_MB0064"
+ CDS 66913..68352
+ /locus_tag="BQ2027_MB0064"
+ /note="Mb0064, -, len: 479 aa. Equivalent to Rv0063, len:
+ 479 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 479 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), similar to many e.g.
+ HDNO_ARTOX|P08159 6-hydroxy-d-nicotine oxidase from
+ Arthrobacter oxidans (458 aa), FASTA scores: opt: 343,
+ E(): 3.4e-13, (27.4% identity in 467 aa overlap);
+ AAD28454.1|AF127374_9|AF127374|MitR oxidase from
+ Streptomyces lavendulae (514 aa); AAF81732.1|AF254925|EncM
+ putative FAD-dependent oxygenase from
+ Streptomycesmaritimus (464 aa); etc. Also similar to
+ Mycobacterium tuberculosis proteins e.g. Rv3107c, Rv1257c,
+ etc. Contains PS00862 Oxygen oxidoreductases covalent
+ FAD-binding site. Protein product from Mb0064 detected
+ using SWATH mass spectrometry. Mb0064 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="SIT98439.1"
+ /db_xref="GOA:A0A1R3XU80"
+ /db_xref="InterPro:IPR006093"
+ /db_xref="InterPro:IPR006094"
+ /db_xref="InterPro:IPR006311"
+ /db_xref="InterPro:IPR012951"
+ /db_xref="InterPro:IPR016166"
+ /db_xref="InterPro:IPR016167"
+ /db_xref="InterPro:IPR016169"
+ /db_xref="InterPro:IPR036318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU80"
+ /translation="MAREISRQTFLRGAAGALAAGAVFGSVRATADPAASGWEALSSA
+ LGGKVLQPDDGPQFATAKQVFNTNYNGYTPAVIVTPTSQLDVQKAMAFAAANNLKVAP
+ RGGGHSYVGASTANGAMVLDLRQLPGDINYDATTGRVTVTPATGLYAMHQVLAAAGRG
+ IPTGTCPTVGVAGHALGGGLGANSRHAGLLCDQLTSASVVLPSGQAVTASATDHPDLF
+ WALRGGGGGNFGVTTSLTFATFPSGDLDVVNLNFPPQSFAQVLVGWQNWLRTADRGSW
+ ALADATVDPLGTHCRILATCPAGSGGSVAAAIVSAVGTQPTGTENHTFNYLDLVRYLA
+ VGNLNPSPLGYVGGSDVFTTITPATAQGIASAVDAFPRGAGRMLAIMHALDGALATVS
+ PGATAFPWRRQSALVQWYVETSGSPSEATSWLNTAHQAVRAYSVGGYVNYLEVNQPPA
+ RYFGPNLSRLSAVRQKYDPSRVMFSGLNF"
+ gene 68610..71549
+ /locus_tag="BQ2027_MB0065"
+ CDS 68610..71549
+ /locus_tag="BQ2027_MB0065"
+ /note="Mb0065, -, len: 979 aa. Equivalent to Rv0064, len:
+ 979 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 979 aa overlap). Probable conserved
+ transmembrane protein, highly similar to NP_301532.1|
+ (NC_002677) putative integral membrane protein from
+ Mycobacterium leprae (983 aa). Also similar to other
+ hypothetical proteins from ARCHAEOGLOBUS FULGIDUS and
+ Synecocystis sp. e.g. P72637|D90899 HYPOTHETICAL 117.2 KD
+ PROTEIN from SYNECHOCYSTIS SP. (1032 aa), FASTA scores:
+ opt: 1004, E(): 3.6e-32, (31.0 % identity in 848 aa
+ overlap); and CAC01334.1|AL390968 putative integral
+ membrane protein (fragment) from Streptomyces coelicolor
+ (815 aa); etc. Also similar to Rv3193c from Mycobacterium
+ tuberculosis (992 aa), FASTA score: (50.3% identity in 985
+ aa overlap). Contains probable coiled-coil domain from aa
+ 948 to 976. Mb0065 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT98440.1"
+ /db_xref="GOA:Q7U2X8"
+ /db_xref="InterPro:IPR005372"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U2X8"
+ /translation="METGSPGKRPVLPKRARLLVTAGMGMLALLLFGPRLVDIYVDWL
+ WFGEVGFRSVWITVLLTRLAIVAAVALVVAGIVLAALLLAYRSRPFFVPDEPQRDPVA
+ PLRSAVMRRPRLFGWGIAVTLGVVCGLIASFDWVKVQLFVHGGTFGIVDPEFGYDIGF
+ FVFDLPFYRSVLNWLFVAVVLAFLASLLTHYLFGGLRLTTGRGMLTQAARVQLAVFAG
+ AVVLLKAVAYWLDRYELLSSGRKEPTFTGAGYTDIHAELPAKLVLVAIAVLCAVSFFT
+ AIFLRDLRIPAMAAALLVLSAILVGGLWPLLMEQFSVRPNAADVERPYIQRNIEATRE
+ AYRIGGDWVQYRSYPGIGTKQPRDVPVDVTTIAKVRLLDPHILSRTFTQQQQLKNFFS
+ FAEILDIDRYRIDGELQDYIVGVRELSPKSLTGNQTDWINKHIVYTHGNGFVAAPANR
+ VNAAARDAENISDSNSGYPIYAVSDIASLGSGRQVIPVEQPRVYYGEVIAQADPDYAI
+ VGGAPGSAPREYDTDTSKYTYTGAGGVSIGNWFNRTVFATKFAQHKFLFSREIGSESK
+ VLIHRDPKERVQRVAPWLTTDDNPYPVVVNGRIVWIVDAYTTLDTYPYAQRSSLEGPV
+ TSPTGIVRQGKQVSYVRNSVKATVDAYDGTVTLFQFDRDDPVLRTWMRAFPGTVKSED
+ QIPDELRAHFRYPEDLFEVQRSLLAKYHVDEPREFFTTNAFWSVPSDPTNDANATQPP
+ FYVLVGDQQSAQPSFRLASAMVGYNREFLSAYISAHSDPANYGKLTVLELPTDTLTQG
+ PQQIQNSMISDTRVASERTLLERSNRIHYGNLLSLPIADGGVLYVEPLYTERISTSPS
+ SSTFPQLSRVLVSVREPRTEGGVRVGYAPTLAESLDQVFGPGTGRVATAPGGDAASAP
+ PPGAGGPAPPQAVPPPRTTQPPAAPPRGPDVPPATVAELRETLADLRAVLDRLEKAID
+ AAETPGG"
+ gene 71616..71855
+ /gene="vapB1"
+ /locus_tag="BQ2027_MB0065A"
+ CDS 71616..71855
+ /gene="vapB1"
+ /locus_tag="BQ2027_MB0065A"
+ /note="Mb0065A, len: 79 aa. Equivalent to Rv0064A len: 79
+ aa, from Mycobacterium tuberculosis strain H37Rv, (98.7%
+ identity in 79 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Possible vapB1,
+ antitoxin, part of toxin-antitoxin (TA) operon with Rv0065
+ (See Arcus et al., 2005; Pandey and Gerdes, 2005). Weakly
+ similar to others in Mycobacterium tuberculosis e.g.
+ Rv0300 (73 aa),Rv1721c (75 aa) Protein product from
+ Mb0065A detected using shotgun mass spectrometry. Mb0065A
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible antitoxin VapB1"
+ /protein_id="SIT98441.1"
+ /db_xref="GOA:A0A1R3XU88"
+ /db_xref="InterPro:IPR010985"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU88"
+ /translation="MATIQVRDLPEDVAETYRRRATAAGQSLQTYMRTKLIEGVRGRD
+ KAEVIEILEQALASTASPGISRETIEASRRELRGG"
+ gene 71848..72249
+ /gene="vapc1"
+ /locus_tag="BQ2027_MB0066"
+ CDS 71848..72249
+ /gene="vapc1"
+ /locus_tag="BQ2027_MB0066"
+ /note="Mb0066, -, len: 133 aa. Equivalent to Rv0065, len:
+ 133 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 133 aa overlap). Conserved
+ hypothetical protein, similar to several hypothetical
+ proteins from Mycobacterium tuberculosis: Rv0960 (127 aa),
+ Rv1720c (129 aa), and Rv0549c (137 aa). Protein product
+ from Mb0066 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0066 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc1"
+ /protein_id="SIT98442.1"
+ /db_xref="GOA:A0A1R3XU79"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU79"
+ /translation="MDECVVDAAAVVDALAGKGASAIVLRGLLKESISNAPHLLDAEV
+ GHALRRAVLSDEISEEQARAALDALPYLIDNRYPHSPRLIEYTWQLRHNVTFYDALYV
+ ALATALDVPLLTGDSRLAAAPGLPCEIKLVR"
+ gene complement(72301..74538)
+ /gene="icd2"
+ /locus_tag="BQ2027_MB0067C"
+ CDS complement(72301..74538)
+ /gene="icd2"
+ /locus_tag="BQ2027_MB0067C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0067c, icd2, len: 745 aa. Equivalent to Rv0066c,
+ len: 745 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 745 aa overlap). Probable icd2,
+ isocitrate dehydrogenase NADP-dependant (EC 1.1.1.42),
+ equivalent to NP_302705.1|NC_002677 isocitrate
+ dehydrogenase [NADP] from Mycobacterium leprae (746 aa).
+ Also highly similar to many members of the monomeric-type
+ family of IDH e.g. NP_251314.1|NC_002516 isocitrate
+ dehydrogenase from Pseudomonas aeruginosa (741 aa);
+ IDH_AZOVI|P16100 isocitrate dehydrogenase (nadp) from
+ Azotobacter vinelandii (741 aa), FASTA scores: opt: 3106,
+ E(): 0, (61.4% identity in 735 aa overlap);
+ NP_230786.1|NC_002505 isocitrate dehydrogenase [Vibrio
+ cholerae (741 aa); etc. BELONGS TO THE MONOMERIC-TYPE
+ FAMILY OF IDH. Protein product from Mb0067c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0067c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ISOCITRATE DEHYDROGENASE [NADP] ICD2
+ (OXALOSUCCINATE DECARBOXYLASE) (IDH) (NADP+-SPECIFIC ICDH)
+ (IDP)"
+ /protein_id="SIT98443.1"
+ /db_xref="GOA:A0A1R3XWE0"
+ /db_xref="InterPro:IPR004436"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWE0"
+ /translation="MSAEQPTIIYTLTDEAPLLATYAFLPIVRAFAEPAGIKIEASDI
+ SVAARILAEFPDYLTEEQRVPDNLAELGRLTQLPDTNIIKLPNISASVPQLVAAIKEL
+ QDKGYAVPDYPADPNTDQEKAIKERYARCLGSAVNPVLRQGNSDRRAPKAVKEYARKH
+ PHSMGEWSMASRTHVAHMRHGDFYAGEKSMTLDRARNVRMELLAKSGKTIVLKPEVPL
+ DDGDVIDSMFMSKKALCDFYEEQMQDAFETGVMFSLHVKATMMKVSHPIVFGHAVRIF
+ YKDAFAKHQELFDDLGVNVNNGLSDLYSKIESLPASQRDEIIEDLHRCHEHRPELAMV
+ DSARGISNFHSPSDVIVDASMPAMIRAGGKMYGADGKLKDTKAVNPESTFSRIYQEII
+ NFCKTNGQFDPTTMGTVPNVGLMAQQAEEYGSHDKTFEIPEDGVANIVDVATGEVLLT
+ ENVEAGDIWRMCIVKDAPIRDWVKLAVTRARISGMPVLFWLDPYRPHENELIKKVKTY
+ LKDHDTEGLDIQIMSQVRSMRYTCERLVRGLDTIAATGNILRDYLTDLFPILELGTSA
+ KMLSVVPLMAGGGMYETGAGGSAPKHVKQLVEENHLRWDSLGEFLALGAGFEDIGIKT
+ GNERAKLLGKTLDAAIGKLLDNDKSPSRKTGELDNRGSQFYLAMYWAQELAAQTDDQQ
+ LAEHFASLADVLTKNEDVIVRELTEVQGEPVDIGGYYAPDSDMTTAVMRPSKTFNAAL
+ EAVQG"
+ gene complement(74656..75225)
+ /locus_tag="BQ2027_MB0068C"
+ CDS complement(74656..75225)
+ /locus_tag="BQ2027_MB0068C"
+ /note="Mb0068c, -, len: 189 aa. Equivalent to Rv0067c,
+ len: 189 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 189 aa overlap). Possible
+ transcriptional regulator, highly similar except in
+ N-terminus to T44726 probable transcription regulator from
+ Mycobacterium leprae (189 aa), FASTA scores: opt: 829,
+ E(): 0, (68.3% identity in 189 aa overlap). And similar to
+ others, often many members of the tetR family, e.g. T36918
+ probable transcription regulator from Streptomyces
+ coelicolor (202 aa); NP_535866.1|NC_003306 transcriptional
+ regulator TetR family from Agrobacterium tumefaciens
+ strain C58 (Dupont) (194 aa); UIDR_ECOLI|Q59431 uid operon
+ repressor (gus operon repressor) from Escherichia coli
+ (196 aa), FASTA scores: opt: 200, E(): 7.2e-06, (24.7%
+ identity in 186 aa overlap); etc. Also similar to
+ MTCY8D5_28 from Mycobacterium tuberculosis cosmid (229
+ aa), FASTA score: (32.7% identity in 168 aa overlap).
+ Contains probable helix-turn-helix motif from aa 34 to 55
+ (Score 1523, +4.37 SD). Protein product from Mb0068c
+ detected using SWATH mass spectrometry. Mb0068c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY TETR-FAMILY)"
+ /protein_id="SIT98444.1"
+ /db_xref="GOA:A0A1R3XVC8"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVC8"
+ /translation="MAPTDRRVRADAARNRARVLEVAYQTFAADGLSVPVDEIARRAG
+ VGAGTVYRHFPTKEALFQAVIADRMHRIIDKGHALLKSKHPGDALFAFLRSMVLQWGA
+ TDRGLVEALAGVGIEISSAAPEAEADFLDLLTDLLRAAQRAGTVRPDVDVLEVKTLLV
+ GCQAMQSYNAELAAKVTDVALDGLRANRK"
+ gene 75328..76239
+ /locus_tag="BQ2027_MB0069"
+ CDS 75328..76239
+ /locus_tag="BQ2027_MB0069"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0069, -, len: 303 aa. Equivalent to Rv0068, len:
+ 303 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 303 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), equivalent to
+ NP_301343.1|NC_002677 putative oxidoreductase from
+ Mycobacterium leprae (304 aa). Also highly similar to many
+ e.g. NP_485762.1|NC_003272 probable oxidoreductase from
+ Nostoc sp. PCC 7120 (311 aa); NP_279536.1|NC_002607|YajO1
+ probable oxidoreductase from Halobacterium sp. NRC-1 (316
+ aa); OXIR_STRAT|Q03326 probable oxidoreductase from
+ Streptomyces antibioticus (298 aa), FASTA scores: opt:
+ 430, E(): 1.3e-16, (34.9% identity in 295 aa overlap);
+ etc. Also highly similar to MTV037_3 and MTV022_13 from
+ Mycobacterium tuberculosis. Protein product from Mb0069
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="SIT98446.1"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XUE4"
+ /translation="MTKWTAADIPDQTGRTAVITGANTGLGFETAAALAAHGAHVVLA
+ VRNLDKGKQAAARITEATPGAEVELQELDLTSLASVRAAAAQLKSDHQRIDLLINNAG
+ VMYTPRQTTADGFEMQFGTNHLGHFALTGLLIDRLLPVAGSRVVTISSVGHRIRAAIH
+ FDDLQWERRYRRVAAYGQAKLANLLFTYELQRRLAPGGTTIAVASHPGVSNTELVRNM
+ PRPLVAVAAILAPLMQDAELGALPTLRAATDPAVRGGQYFGPDGFGEIRGYPKVVASS
+ AQSHDEQLQRRLWAVSEELTGVVYPVG"
+ gene complement(76264..77649)
+ /gene="sdaA"
+ /locus_tag="BQ2027_MB0070C"
+ CDS complement(76264..77649)
+ /gene="sdaA"
+ /locus_tag="BQ2027_MB0070C"
+ /note="Mb0070c, sdaA, len: 461 aa. Equivalent to Rv0069c,
+ len: 461 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 461 aa overlap). Probable sdaA,
+ L-serine dehydratase (EC 4.3.1.17), equivalent to
+ NP_302203.1| NC_002677 L-serine dehydratase from
+ Mycobacterium leprae (458 aa). Also highly similar to many
+ e.g. NP_251133.1|NC_002516 L-serine dehydratase from
+ Pseudomonas aeruginosa (458 aa); O86564|SDHL_STRCO
+ L-SERINE DEHYDRATASE from Streptomyces coelicolor (455
+ aa); SDHL_ECOLI|P16095 L-serine dehydratase 1 from
+ Escherichia coli (454 aa), FASTA scores: opt: 1381, E():
+ 0, (51.1% identity in 460 aa overlap); etc. BELONGS TO THE
+ IRON-SULFUR DEPENDENT L-SERINE DEHYDRATASE FAMILY.
+ COFACTOR: IRON-SULFUR (4FE-4S) (PROBABLE). Protein product
+ from Mb0070c detected using SWATH mass spectrometry.
+ Mb0070c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE L-SERINE DEHYDRATASE SDAA (L-SERINE
+ DEAMINASE) (SDH) (L-SD)"
+ /protein_id="SIT98448.1"
+ /db_xref="GOA:P66774"
+ /db_xref="InterPro:IPR004644"
+ /db_xref="InterPro:IPR005130"
+ /db_xref="InterPro:IPR005131"
+ /db_xref="InterPro:IPR029009"
+ /db_xref="UniProtKB/Swiss-Prot:P66774"
+ /translation="MTISVFDLFTIGIGPSSSHTVGPMRAANQFVVALRRRGHLDDLE
+ AMRVDLFGSLAATGAGHGTMSAILLGLEGCQPETITTEHKERRLAEIAASGVTRIGGV
+ IPVPLTERDIDLHPDIVLPTHPNGMTFTAAGPHGRVLATETYFSVGGGFIVTEQTSGN
+ SGQHPCSVALPYVSAQELLDICDRLDVSISEAALRNETCCRTENEVRAALLHLRDVMV
+ ECEQRSIAREGLLPGGLRVRRRAKVWYDRLNAEDPTRKPEFAEDWVNLVALAVNEENA
+ SGGRVVTAPTNGAAGIVPAVLHYAIHYTSAGAGDPDDVTVRFLLTAGAIGSLFKERAS
+ ISGAEVGCQGEVGSAAAMAAAGLAEILGGTPRQVENAAEIAMEHSLGLTCDPIAGLVQ
+ IPCIERNAISAGKAINAARMALRGDGIHRVTLDQVIDTMRATGADMHTKYKETSAGGL
+ AINVAVNIVEC"
+ gene complement(77646..78923)
+ /gene="glyA2"
+ /locus_tag="BQ2027_MB0071C"
+ CDS complement(77646..78923)
+ /gene="glyA2"
+ /locus_tag="BQ2027_MB0071C"
+ /note="Mb0071c, glyA2, len: 425 aa. Equivalent to Rv0070c,
+ len: 425 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 425 aa overlap). Probable glyA2, serine
+ hydroxymethyltransferase (EC 2.1.2.1), equivalent to
+ NP_302318.1|NC_002677 serine hydroxymethyltransferase from
+ Mycobacterium leprae (426 aa). Also highly similar to many
+ e.g. O86565|GLYA_STRCO SERINE HYDROXYMETHYLTRANSFERASE
+ from Streptomyces coelicolor (420 aa);
+ AAK60516.1|AF327063_1|AF327063 serine
+ hydroxymethyltransferase from Corynebacterium glutamicum
+ (434 aa); GLYA_ECOLI|P00477 serine
+ hydroxymethyltransferase from Escherichia coli (417 aa),
+ FASTA scores: opt: 1462, E(): 0, (54.3% identity in 416 aa
+ overlap); etc. Also highly similar to MTV017_46 from
+ Mycobacterium tuberculosis. Contains PS00096 Serine
+ hydroxymethyltransferase pyridoxal-phosphate attachment
+ site. BELONGS TO THE SHMT FAMILY. COFACTOR: PYRIDOXAL
+ PHOSPHATE. Protein product from Mb0071c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0071c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="serine hydroxymethyltransferase glya2 (serine
+ methylase 2) (shmt 2)"
+ /protein_id="SIT98450.1"
+ /db_xref="GOA:Q7U2X3"
+ /db_xref="InterPro:IPR001085"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="InterPro:IPR019798"
+ /db_xref="InterPro:IPR039429"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U2X3"
+ /translation="MNTLNDSLTAFDPDIAALIDGELRRQESGLEMIASENYAPLAVM
+ QAQGSVLTNKYAEGYPGRRYYGGCEFVDGVEQLAIDRVKALFGAEYANVQPHSGATAN
+ AATMHALLNPGDTILGLSLAHGGHLTHGMRINFSGKLYHATAYEVSKEDYLVDMDAVA
+ EAARTHRPKMIIAGWSAYPRQLDFARFRAIADEVDAVLMVDMAHFAGLVAAGVHPSPV
+ PHAHVVTSTTHKTLGGPRGGIILCNDPAIAKKINSAVFPGQQGGPLGHVIAAKATAFK
+ MAAQPEFAQRQQRCLDGARILAGRLTQPDVAERGIAVLTGGTDVHLVLVDLRDAELDG
+ QQAEDRLAAVDITVNRNAVPFDPRPPMITSGLRIGTPALAARGFSHNDFRAVADLIAA
+ ALTATNDDQLGPLRAQVQRLAARYPLYPELHRT"
+ gene 79513..80229
+ /locus_tag="BQ2027_MB0072"
+ CDS 79513..80229
+ /locus_tag="BQ2027_MB0072"
+ /note="Mb0072, -, len: 238 aa. Equivalent to Rv0071, len:
+ 235 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.7% identity in 238 aa overlap). Possible maturase,
+ similar to many proteins of the group II intron maturase
+ family e.g. P95451|U77945 MATURASE-RELATED PROTEIN from
+ PSEUDOMONAS ALCALIGENES (297 aa), FASTA scores: opt: 395,
+ E(): 1.7e-20, (43.5% identity in 147 aa overlap);
+ N-terminus of AAD16434.1|AF101076 maturase-related protein
+ from Pseudomonas putida (473 aa); N-terminus of
+ NP_437373.1|NC_003078 putative reverse
+ transcriptasematurase protein from Sinorhizobium meliloti
+ (453 aa); etc. Also similar to MLCL581_1 from
+ Mycobacterium leprae. Contains 5 VDP repeats at
+ N-terminus, these are also found in two Streptococcus
+ plasmid hypothetical proteins Q52246|X17092 and
+ Q54942|X66468. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 9 bp insertion (*-cggtggacc) leads
+ to a longer product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (238 aa versus 235
+ aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MATURASE"
+ /protein_id="SIT98452.1"
+ /db_xref="InterPro:IPR000477"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XU78"
+ /translation="MSSITVSVDPVDPVDPVDPVDPVDPVDAVVAAGSDGLTVARIES
+ EIGALEFLNELRTELKSGQFRPQPVRERKIPKPGGLGKVRRLGIPTVADRVVQAALKL
+ VLEPIFETDFEPVSYGFRPARRAHDTIAEIHLFGTQEYRWVLDADIKACFDRIDHADL
+ MDRVRHRIKDKRVLRLVNWQRIRHRWNWTDVRRWLTDPTGRWHPISADGITLFNPAAV
+ PIRRYRYRGNTIPTPWTQAV"
+ repeat_region 80272..80586
+ /note="REP'-1, len: 315 nt. Equivalent to REP', len: 315
+ nt, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 315 nt overlap). Probable pseudogene
+ fragment,len: 105 aa; similar to many Mycobacterium
+ tuberculosis proteins inside REP13E12 elements eg.
+ TR:Q50655 (EMBL:Z95390) MTCY13E12.20 (317 aa), FASTA
+ scores; opt: 324 z-score: 432.5 E(): 6.8e-17, 43.4%
+ identity in 99 aa overlap, but no possible startsite."
+ /rpt_family="REP"
+ gene 80660..81709
+ /locus_tag="BQ2027_MB0073"
+ CDS 80660..81709
+ /locus_tag="BQ2027_MB0073"
+ /note="Mb0073, -, len: 349 aa. Equivalent to Rv0072, len:
+ 349 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 349 aa overlap). Probable
+ glutamine-transport transmembrane protein ABC-transporter
+ (see citation below), showing weak similarity to
+ NP_465894.1|NC_003210 protein similar to putative
+ ABC-transporter transmembrane subunit from Listeria
+ monocytogenes EGD-e (367 aa); NP_471800.1|NC_003212
+ protein similar to putative ABC-transporter transmembrane
+ subunit from Listeria innocua (367 aa); E1204111|AJ003195
+ MEMBRANE SPANNING SUBUNIT DEVC from ANABAENA VARIABILIS
+ (385 aa), FASTA scores: opt: 155, E(): 8.1e-07, (22.0%
+ identity in 381 aa overlap). Also highly similar to
+ Rv2563|Y0A5_MYCTU|Q50735|MTCY9C4.05c from Mycobacterium
+ tuberculosis (388 aa), FASTA scores: E(): 0, (76.2%
+ identity in 349 aa overlap). Note that supposed act with
+ near ORF Rv0073|MTV030.17 ATP-binding protein
+ ABC-transporter. Protein product from Mb0073 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0073 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUTAMINE-TRANSPORT TRANSMEMBRANE
+ PROTEIN ABC TRANSPORTER"
+ /protein_id="CAB5247775.1"
+ /translation="MLFAALRDMQWRKRRLVITIISTGLIFGMTLVLTGLANGFRVEA
+ RHTVDSMGVDVFVVRSGAAGPFLGSIPFPDVDLARVAAEPGVMAAAPLGSVGTIMKEG
+ TSTRNVTVFGAPEHGPGMPRVSEGRSPSKPDEVAASSTMGRHLGDTVEVGARRLRVVG
+ IVPNSTALAKIPNVFLTTEGLQKLAYNGQPNITSIGIIGMPRQLPEGYQTFDRVGAVN
+ DLVRPLKVAVNSISIVAVLLWIVAVLIVGSVVYLSALERLRDFAVFKAIGTPTRSIMA
+ GLALQALVIALLAAVVGVVLAQVLAPLFPMIVAVPVGAYLALPVAAIVIGLFASVAGL
+ KRVVTVDPAQAFGGP"
+ gene 81712..82554
+ /locus_tag="BQ2027_MB0074"
+ CDS 81712..82554
+ /locus_tag="BQ2027_MB0074"
+ /note="Mb0074, -, len: 280 aa. Equivalent to 5' end of
+ Rv0073, len: 330 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (94.9% identity in 275 aa overlap). Probable
+ glutamine-transport ATP-binding protein ABC-transporter
+ (see citation below), similar to many ATP-binding proteins
+ e.g. NP_070646.1|NC_000917 ABC transporter ATP-binding
+ protein from Archaeoglobus fulgidus (231 aa); T34822
+ ABC-transporter ATP binding protein from Streptomyces
+ coelicolor (230 aa); YBJZ_ECOLI|P75831 hypothetical ABC
+ transporter ATP-binding protein from Escherichia coli (648
+ aa), FASTA scores: opt: 531, E(): 6.8e-30, (38.6% identity
+ in 233 aa overlap); etc. Also highly similar to
+ Y0A4_MYCT|Q50734|MTCY9C4.04c hypothetical ABC transporter
+ ATP-binding protein from Mycobacterium tuberculosis (330
+ aa), FASTA scores: E(): 0, (83.3% identity in 330 aa
+ overlap). Contains PS00017 ATP/GTP-binding site motif A
+ (P-loop), PS00211 ABC transporters family signature, and
+ PS00889 Cyclic nucleotide-binding domain signature 2.
+ BELONGS TO THE ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC
+ TRANSPORTERS). Note that supposed act with near ORF
+ Rv0072|MTV030.16 transmembrane ABC-transporter.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0073 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (a-*) splits Rv0073 into 2 parts, Mb0074 and
+ Mb0075. Mb0074 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUTAMINE-TRANSPORT ATP-BINDING PROTEIN
+ ABC TRANSPORTER GLNQ"
+ /protein_id="CAB5247776.1"
+ /translation="MGDLSIQNLVVEYYSGGYALRPINGLNLDVAAGSLVMLLGPSGC
+ GKTTLLSCLGGILRPKSGAIKFDEVDITTLQGAELANYRRNKVGIVFQAFNLVPSLTA
+ VENVMVPLRSAGMSRRASRRRAEELLARVNLAERMNHRPGDLSGGQQQRVAVARAIAL
+ DPPLILADEPTAHLDFIQVEEVLRLIRELADGERVVVVATHDSRMLPMADRVVELTPD
+ FAETNRPPETVHLQAGEVLFEQSTMGDLIYVVSEGEFEIVHDWPTAVRNWSRLPGRGI
+ TSAR"
+ gene 82557..82703
+ /locus_tag="BQ2027_MB0075"
+ CDS 82557..82703
+ /locus_tag="BQ2027_MB0075"
+ /note="Mb0075 found to be expressed during exponential
+ growth in Sauton's minimal media by
+ RNA-sequencing.,Mb0075, -, len: 48 aa. Equivalent to 3'
+ end of Rv0073, len: 330 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 70 aa
+ overlap). Probable glutamine-transport ATP-binding protein
+ ABC-transporter (see citation below), similar to many
+ ATP-binding proteins e.g. NP_070646.1|NC_000917 ABC
+ transporter ATP-binding protein from Archaeoglobus
+ fulgidus (231 aa); T34822 ABC-transporter ATP binding
+ protein from Streptomyces coelicolor (230 aa);
+ YBJZ_ECOLI|P75831 hypothetical ABC transporter ATP-binding
+ protein from Escherichia coli (648 aa), FASTA scores: opt:
+ 531, E(): 6.8e-30, (38.6% identity in 233 aa overlap);
+ etc. Also highly similar to Y0A4_MYCT|Q50734|MTCY9C4.04c
+ hypothetical ABC transporter ATP-binding protein from
+ Mycobacterium tuberculosis (330 aa), FASTA scores: E(): 0,
+ (83.3% identity in 330 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A (P-loop), PS00211 ABC
+ transporters family signature, and PS00889 Cyclic
+ nucleotide-binding domain signature 2. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Note that supposed act with near ORF Rv0072|MTV030.16
+ transmembrane ABC-transporter.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0073 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (a-*) splits Rv0073 into 2 parts, Mb0074 and
+ Mb0075. Protein product from Mb0075 detected using SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUTAMINE-TRANSPORT PROTEIN ABC
+ TRANSPORTER GLNQ"
+ /protein_id="CAB5247777.1"
+ /translation="MLFHLPRSATVRARSDATAVGYTVQAFRERLGVGGLRDLIEHRA
+ LAND"
+ gene 82783..84018
+ /locus_tag="BQ2027_MB0076"
+ CDS 82783..84018
+ /locus_tag="BQ2027_MB0076"
+ /EC_number="3.4.13.9"
+ /note="Mb0076, -, len: 411 aa. Equivalent to Rv0074, len:
+ 411 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 411 aa overlap). Conserved
+ hypothetical protein, similar to Rv2915c|MTCY338.03c
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium
+ tuberculosis, and showing some simlarity to various
+ enzymes or hypothetical proteins from other organisms, eg
+ NP_243801.1|NC_002570 aryldialkylphosphatase from Bacillus
+ halodurans (394 aa); NP_421471.1|NC_002696 putativ Xaa-Pro
+ dipeptidase from Caulobacter crescentus (429 aa);
+ NP_343436.1|NC_002754 Prolidase (Xaa-Pro dipeptidase)
+ (pepQ-like2) from Sulfolobus solfataricus (408 aa);
+ Q50432|M91040 ORGANO PHOSPHATE ACID ANHYDRASE OPAB from
+ MYCOBACTERIUM SP. (409 aa), FASTA scores: opt: 166, E():
+ 3.9e-11, (31.2% identity in 430 aa overlap); etc. Protein
+ product from Mb0076 detected using SWATH mass
+ spectrometry. Mb0076 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Xaa-Pro dipeptidase (EC"
+ /protein_id="CAB5247778.1"
+ /translation="MGDLSISQVSARPGRIGIRARQMFDGYRFQRGPVLVVVEDGRIS
+ AVDFAGSACPDMNLVDLGESTLLPGLVDAHAHLCWDPDGRPEDLAGDPHAVLVGRARR
+ HAAAALRSGITTIRDLGDRDYAALALREEYRQKTTVGPELVVSGPPLTRSGGHCWFLG
+ GVADSVEELVDAVQERAARGADWIKVMATGGFVTTASDPWQPQYGSGQLAAVVAAAEQ
+ VGLPVTAHAHATAGIAAAVAAGVDGIEHCTFLSEGSAAASPDVVEAIVAQGVWCGMTI
+ PRVYPEMPENLVAVVQDGWRNIRRLIDAGARVALSTDAGVAPGRRHDVLPDDLVYLSR
+ HGFTSTEVLTGATAAAAASCGLGHRKGRIAPGYDADLLAVAAGVDHDPAGLCDVKAVW
+ RSGTQVPLQASAVGYNTPS"
+ gene 84031..85203
+ /locus_tag="BQ2027_MB0077"
+ CDS 84031..85203
+ /locus_tag="BQ2027_MB0077"
+ /note="Mb0077, -, len: 390 aa. Equivalent to Rv0075, len:
+ 390 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 390 aa overlap). Probable
+ aminotransferase (EC 2.6.1.-), similar to many CLASS-II
+ PYRIDOXAL-PHOSPHATE-DEPENDENT AMINOTRANSFERASES (MALY/PATB
+ SUBFAMILY) e.g. NP_302217.1|NC_002677 aminotransferase
+ from Mycobacterium leprae (402 aa); PATB_BACSU|Q08432
+ putative aminotransferase b from Bacillus subtilis (387
+ aa), FASTA scores: opt: 684, E(): 5.4e-33, (31.3% identity
+ in 384 aa overlap); etc. Also similar to several
+ cystathionine beta-lyase (beta C-S lyase) e.g.
+ AAK69425.1|AF276227_1|AF276227 from Corynebacterium
+ glutamicum (368 aa); etc. Also similar to other proteins
+ from Mycobacterium tuberculosis e.g. Rv2294, Rv0858c, etc.
+ Protein product from Mb0077 detected using SWATH mass
+ spectrometry. Mb0077 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE AMINOTRANSFERASE"
+ /protein_id="CAB5247779.1"
+ /translation="MQDSIFNLLTEEQLRGRNTLKWNYFGPDVVPLWLAEMDFPTAPA
+ VLDGVRACVDNEEFGYPPLGEDSLPRATADWCRQRYGWCPRPDWVRVVPDVLKGMEVV
+ VEFLTRPESPVALPVPAYMPFFDVLHVTGRQRVEVPMVQQDSGRYLLDLDALQAAFVR
+ GAGSVIICNPNNPLGTAFTEAELRAIVDIAARHGARVIADEIWAPVVYGSRHVAAASV
+ SEAAAEVVVTLVSASKGWNLPGLMCAQVILSNRRDAHDWDRINMLHRMGASTVGIRAN
+ IAAYHHGESWLDELLPYLRANRDHLARALPELAPGVEVNAPDGTYLSWVDFRALALPS
+ EPAEYLLSKAKVALSPGIPFGAAVGSGFARLNFATTRAILDRAIEAIAAALRDIID"
+ gene complement(85218..85607)
+ /locus_tag="BQ2027_MB0078C"
+ CDS complement(85218..85607)
+ /locus_tag="BQ2027_MB0078C"
+ /note="Mb0078c, -, len: 129 aa. Equivalent to Rv0076c,
+ len: 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 129 aa overlap). Probable membrane
+ protein, with membrane-spanning domain at C-terminus.
+ Mb0078c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE PROTEIN"
+ /protein_id="CAB5247780.1"
+ /translation="MPAVTTPSNHWGDERRKLSHQPPVRGQILGRRQARRLSQHFARV
+ GVEAPPKRLQEMLLGAPAADEEWTDVKFALIVTQLNHEKRVAKFHRLQRRATHSLICL
+ GLVLVALNFLICLAYIFFSLTQHAAAL"
+ gene complement(85671..86501)
+ /locus_tag="BQ2027_MB0079C"
+ CDS complement(85671..86501)
+ /locus_tag="BQ2027_MB0079C"
+ /note="Mb0079c, -, len: 276 aa. Equivalent to Rv0077c,
+ len: 276 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 276 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), weakly similar to others e.g.
+ CAC44600.1|AL596162 putative oxidoreductase from
+ Streptomyces coelicolor (275 aa); P33912|BPA1_STRAU
+ NON-HAEM BROMOPEROXIDASE BPO-A1 (BROMIDE PEROXIDASE) (EC
+ 1.11.1.-) from Streptomyces aureofaciens (275 aa);
+ BPA1_STRAU|P33912 non-haem bromoperoxidase bpo-a1 from
+ Streptomyces aureofaciens (274 aa), FASTA scores: opt:
+ 230, E(): 1.5e-07, (26.1% identity in 249 aa overlap);
+ etc. Also similar to MTCY05A6_35 and MTCY1A11_10 from
+ Mycobacterium tuberculosis. And shows some similarity in
+ part with AAL17935.1|AY054120 putative epoxide hydrolase
+ from Mycobacterium smegmatis (203 aa). Protein product
+ from Mb0079c detected using shotgun mass spectrometry.
+ Mb0079c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="CAB5247781.1"
+ /translation="MSTIDISAGTIHYEATGPETGRPVVFVHGYMMGGQLWRRVSERL
+ AGRGLRCIAPTWPLGAHPKPLRPGADQTIGGVAGIVADVLAALELKDVVLVGNDTGGV
+ VTQLVAVHYPERLGALVLTSCDAFEHFPPPILKPVILAAKSATLFRAAIQVMRAPAAR
+ NRAYAGLSHHNIDHLTRAWVRPALSNPAIAEDLRQLSLSLRTEVTTAVAARLPEFDKP
+ ALIAWSADDVFFALENGQRLAATIPRARFEVIEGARTFSMVDSPDRLADQLSTVAVRT
+ "
+ gene 86563..87168
+ /locus_tag="BQ2027_MB0080"
+ CDS 86563..87168
+ /locus_tag="BQ2027_MB0080"
+ /note="Mb0080, -, len: 201 aa. Equivalent to Rv0078, len:
+ 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 201 aa overlap). Probable
+ transcriptional regulator, equivalent to
+ NP_302706.1|NC_002677 putative TetR-family transcriptional
+ regulator from Mycobacterium leprae (236 aa), FASTA
+ scores: opt: 755, E(): 0, (71.4% identity in 175 aa
+ overlap). Also similar to others e.g.
+ NP_103770.1|NC_002678 probable transcriptional regulator
+ from Mesorhizobium loti (208 aa); NP_384275.1|NC_003047
+ PUTATIVE TRANSCRIPTION REGULATOR PROTEIN from
+ Sinorhizobium meliloti (197 aa); NP_250960.1|NC_002516
+ probable transcriptional regulator from Pseudomonas
+ aeruginosa (196 aa); etc. Also similar to
+ TETC_ECOLI|P28815 transposon tn10 tetc protein from
+ Escherichia coli (197 aa), FASTA scores: opt: 181, E():
+ 9.7e-05, (24.8% identity in 165 aa overlap). Contains
+ probable helix-turn-helix motif from aa 35 to 56 (Score
+ 1348, +3.78 SD). Protein product from Mb0080 detected
+ using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5247782.1"
+ /translation="MEIKRRTQEERSAATREALITGARKLWGLRGYAEVGTPEIATEA
+ GVTRGAMYHQFADKAALFRDVVEVVEQDVMARMATLVAASGAATPADAIRAAVDAWLE
+ VSGDPEVRQLVLLDAPVVLGWAGFRDVAQRYSLGMTEQLITEAIRAGQLARQPVRPLA
+ QVLIGALDEAAMFIATADDPKRARRETRQVLRRLIDGMLNG"
+ gene complement(87243..87836)
+ /locus_tag="BQ2027_MB0081C"
+ CDS complement(87243..87836)
+ /locus_tag="BQ2027_MB0081C"
+ /note="Mb0081c, -, len: 197 aa. Equivalent to Rv0078A,
+ len: 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 197 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0081c detected using
+ shotgun mass spectrometry. Mb0081c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247783.1"
+ /translation="MNAVESTLRRVAKDLTGLRQRWALVGGFAVSARSEPRFTRDVDI
+ VVAVANDDAAESLVRQLLTQQYHLLASVEQDAARRLAAVRLGATADTAANVVVDLLFA
+ SCGIEPEIAEAAEEIEILPDLVAPVATTAHLIAMKLLARDDDRRPQDRSDLRALVDAA
+ SPQDIQDARKAIELITLRGFHRDRDLAAEWTRLAAKW"
+ gene complement(87833..88039)
+ /locus_tag="BQ2027_MB0081A"
+ CDS complement(87833..88039)
+ /locus_tag="BQ2027_MB0081A"
+ /note="Mb0081A, len: 68 aa. Equivalent to Rv0078B len: 68
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 68 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Conserved protein.
+ Protein product from Mb0081A detected using SWATH mass
+ spectrometry. Mb0081A found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Conserved protein"
+ /protein_id="CAB5247784.1"
+ /translation="MAVSVAAQKLRLALDMYEVGEQMQRMRLGRERPNADVVEIEAAI
+ DAWRMTRPGAEEGDSAGPTSTRFT"
+ gene 88239..89060
+ /locus_tag="BQ2027_MB0082"
+ CDS 88239..89060
+ /locus_tag="BQ2027_MB0082"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0082, -, len: 273 aa. Equivalent to Rv0079, len:
+ 273 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 273 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0082 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0082 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Ribosome hibernation promoting factor Hpf"
+ /protein_id="CAB5247785.1"
+ /translation="MEPKRSRLVVCAPEPSHAREFPDVAVFSGGRANASQAERLARAV
+ GRVLADRGVTGGARVRLTMANCADGPTLVQINLQVGDTPLRAQAATAGIDDLRPALIR
+ LDRQIVRASAQWCPRPWPDRPRRRLTTPAEALVTRRKPVVLRRATPLQAIAAMDAMDY
+ DVHLFTDAETGEDAVVYRAGPSGLRLARQHHVFPPGWSRCRAPAGPPVPLIVNSRPTP
+ VLTEAAAVDRAREHGLPFLFFTDQATGRGQLLYSRYDGNLGLITPTGDGVADGLA"
+ gene 89057..89515
+ /locus_tag="BQ2027_MB0083"
+ CDS 89057..89515
+ /locus_tag="BQ2027_MB0083"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0083, -, len: 152 aa. Equivalent to Rv0080, len:
+ 152 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 152 aa overlap). Conserved hypothetical
+ protein, similar to several hypothetical proteins from
+ Streptomyces coelicolor e.g. SCJ12.26|AL109989|SCJ12_24
+ from Streptomyces coelicolor cosmid J1 (137 aa), FASTA
+ scores: opt: 291, E(): 4e-13, (46.5% identity in 129 aa
+ overlap); etc. Protein product from Mb0083 detected using
+ SWATH mass spectrometry. Mb0083 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative DNA-binding protein"
+ /protein_id="CAB5247786.1"
+ /translation="MSPGSRRASPQSAREVVELDRDEAMRLLASVDHGRVVFTRAALP
+ AIRPVNHLVVDGRVIVRTRLTAKVSVAVRSSADAGVVVAYEADDLDPRRRTGWSVVVT
+ GLATEVSDPEQVARYQRLLHPWVNMAMDTVVAIEPEIVTGIRIVADSRTP"
+ gene 89610..89954
+ /locus_tag="BQ2027_MB0084"
+ CDS 89610..89954
+ /locus_tag="BQ2027_MB0084"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0084, -, len: 114 aa. Equivalent to Rv0081, len:
+ 114 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 114 aa overlap). Probable
+ transcriptional regulator, highly similar to others e.g.
+ AL078610|SCH35_52|T36657 probable transcription regulator
+ from Streptomyces coelicolor (117 aa), FASTA scores: opt:
+ 404, E(): 4.8e-22, (58.2% identity in 110 aa overlap);
+ AAG02351.1|AF210249_10|AF210249 metal-dependent regulatory
+ protein from Streptomyces verticillus (113 aa);
+ NP_435817.1|NC_003037 Putative transcriptional regulator
+ from Sinorhizobium meliloti (115 aa); etc. Protein product
+ from Mb0084 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5247787.1"
+ /translation="MESEPLYKLKAEFFKTLAHPARIRILELLVERDRSVGELLSSDV
+ GLESSNLSQQLGVLRRAGVVAARRDGNAMIYSIAAPDIAELLAVARKVLARVLSDRVA
+ VLEDLRAGGSAT"
+ gene 89959..90438
+ /locus_tag="BQ2027_MB0085"
+ CDS 89959..90438
+ /locus_tag="BQ2027_MB0085"
+ /note="Mb0085, -, len: 159 aa. Equivalent to Rv0082, len:
+ 159 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 159 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), highly highly similar or
+ similar to other various oxidoreductases e.g.
+ NP_143304.1|NC_000961 NADH-ubiquinone oxidoreductase
+ subunit from Pyrococcus horikoshii (173 aa);
+ NP_126406.1|NC_000868 CO-induced hydrogenase related,
+ subunit L from Pyrococcus abyssi (170 aa);
+ HYCG_ECOLI|P16433 formate hydrogenlyase subunit 7 from
+ Escherichia coli (255 aa), FASTA scores: opt: 442, E():
+ 8e-29, (43.2% identity in 148 aa overlap); etc. Protein
+ product from Mb0085 detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="CAB5247788.1"
+ /translation="MGWVAKIFRVGRVVEPAAPLPAAIAEPPAGVRGSLQIRHVDAGS
+ CNGCEVEISGAFGPVYDAERFGARLVASPRHADALLVTGVVTHNMAGPLRKTLEATPR
+ PRVVIACGDCALNRGVFADAYGVVGAVGEVVPVDVEIAGCPPTPAAIMAALRSVTGK"
+ gene 90435..92363
+ /locus_tag="BQ2027_MB0086"
+ CDS 90435..92363
+ /locus_tag="BQ2027_MB0086"
+ /note="Mb0086, -, len: 642 aa. Equivalent to Rv0083, len:
+ 640 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 640 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), showing some similarity to
+ other various oxidoreductases e.g.
+ AAK06855.1|AF335723_1|AF335723 hydrogenase-4 component B
+ from Burkholderia pseudomallei (668 aa); HYFB_
+ ECOLI|P23482 hydrogenase-4 component b from Escherichia
+ coli strain K12 (672 aa), FASTA scores: opt: 995, E(): 0,
+ (32.2% identity in 571 aa overlap);
+ AAF13041.1|AF157639_1|AF157639 putative formate
+ hydrogenlyase integral membrane subunit from
+ Desulfitobacterium dehalogenans (637 aa); etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base transversion (a-t) leads to a slightly longer
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (642 aa versus 640 aa). Protein
+ product from Mb0086 detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="CAB5247789.1"
+ /translation="MTAAPTAGGVVTSGVGVAGVGVGLLGMFGPVRVVHVGWLLPLSG
+ VHIELDRLGGFFMALTGAVAAPVGCYLIGYVRREHLGRVPMAVVPLFVAAMLLVPAAG
+ SVTTFLLAWELMAIASLILVLSEHARPQVRSAGLWYAVMTQLGFIAILVGLVVLAAAG
+ GSDRFAGLGAVCDGVRVAVFMLTLVGFGSKAGLVPLHAWLPRAHPEAPSPVSALMSAA
+ MVNLGIYGIVRFDLQLLGPGPRWWGLALLAVGGTSALYGVLQASVAADLKRLLAYSTT
+ ENMGLITLALGAATLFADTGAYGPASIAAAAAMLHMIAHAAFKSLAFMAAGSVLAATG
+ LRDLDLLGGLARRMPATTVFFGVAALGACGLPLGAGFVSEWLLVQSLIHAAPGHDPIV
+ ALTTPLAVGVVALATGLSVAAMTKAFGIGFLARPRSTQAEAAREAPASMRAGMAIAAG
+ ACLVLAVAPLLVAPMVRRAAATLPAAQAVKFTGLGAVVRLPAMSGSIAPGVIAAAVLA
+ AALAVAVLARWRFRRRPAPARLPLWACGAADLTVRMQYTATSFAEPLQRVFGDVLRPD
+ TDIEVTHTAESRYMAERITYRTAVADAIEQRLYTPVVGAVAAMAELLRRAHTGSVHRY
+ LAYGALGVLIVLVVARCT"
+ gene 92363..93313
+ /gene="hycD"
+ /locus_tag="BQ2027_MB0087"
+ CDS 92363..93313
+ /gene="hycD"
+ /locus_tag="BQ2027_MB0087"
+ /note="Mb0087, hycD, len: 316 aa. Equivalent to Rv0084,
+ len: 316 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 316 aa overlap). Possible hycD
+ (alternate gene name: hevD), formate hydrogenlyase (EC
+ 1.-.-.-), integral membrane protein, similar to others
+ e.g. HYCD_ECOLI|P16430 formate hydrogenlyase subunit 4
+ from Escherichia coli (307 aa), FASTA scores: opt: 570,
+ E(): 2.1e-26, (33.8% identity in 305 aa overlap);
+ AAK06856.1|AF335723_2|AF335723 formate hydrogenlyase
+ subunit 4 from Burkholderia pseudomallei (316 aa);
+ NP_457244.1|NC_003198 formate hydrogenlyase subunit 4 from
+ Salmonella enterica subsp. enterica serovar Typhi (307
+ aa); etc. Also similar to NUOH_ECOLI|P33603 NADH
+ dehydrogenase I chain H from Escherichia coli (325 aa),
+ FASTA scores: opt: 207, E(): 9.5e-06, (26.5% identity in
+ 260 aa overlap). BELONGS TO THE COMPLEX I SUBUNIT 1
+ FAMILY. Mb0087 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE FORMATE HYDROGENLYASE HYCD (FHL)"
+ /protein_id="CAB5247790.1"
+ /translation="MSYLAGAAQIGGVMVGAPLVIGMTRQVRARWEGRAGAGLLQPWR
+ DLLKQLGKQQITPAGTTIVFAAAPVIVAGTTLLIAAIAPLVATGSPLDPSADLFAVVG
+ LLFLGTVALTLAGIDTGTSFGGMGASREITIAALVEPTILLAVFALSIPAGSANLGAL
+ VASTIDHPGHVVSLAGVLAFVALVIVIVAETGRLPVDNPATHLELTMVHEAMVLEYAG
+ PRLALVEWAAGMRLTVLLALLANLFLPWGIAGAAPTALDVLTGVVAVAAKVAILAVLL
+ ATFEVFLAKLRLFRVPELLAGSFLLALLAVTAANFFTVGA"
+ gene 93324..93986
+ /gene="hycP"
+ /locus_tag="BQ2027_MB0088"
+ CDS 93324..93986
+ /gene="hycP"
+ /locus_tag="BQ2027_MB0088"
+ /note="Mb0088, hycP, len: 220 aa. Equivalent to Rv0085,
+ len: 220 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 220 aa overlap). Possible hycP,
+ hydrogenase (EC 1.-.-.-), integral membrane protein,
+ weakly similar to P77524|HYFE_ECOLI HYDROGENASE-4
+ COMPONENT E from Escherichia coli (216 aa), FASTA scores:
+ opt: 204, E():1.2e-07, (25.5% identity in 216 aa overlap).
+ Protein product from Mb0088 detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE HYDROGENASE HYCP"
+ /protein_id="CAB5247791.1"
+ /translation="MSNANFSILVDFAAGGLVLASVLIVWRRDLRAIVRLLAWQGAAL
+ AAIPLLRGIRDNDRALIAVGIAVLALRALVLPWLLARAVGAEAAAQREATPLVNTASS
+ LLITAGLTLTAFAITQPVVNLEPGVTINAVPAAFAVVLIALFVMTTRLHAVSQAAGFL
+ MLDNGIAATAFLLTAGVPLIVELGASLDVLFAVIVIGVLTGRLRRIFGDADLDKLREL
+ RD"
+ gene 93986..95452
+ /gene="hycQ"
+ /locus_tag="BQ2027_MB0089"
+ CDS 93986..95452
+ /gene="hycQ"
+ /locus_tag="BQ2027_MB0089"
+ /note="Mb0089, hycQ, len: 488 aa. Equivalent to Rv0086,
+ len: 488 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 488 aa overlap). Possible hycQ,
+ hydrogenase (EC 1.-.-.-), integral membrane protein,
+ weakly similar to P77437|HYFF_ECOLI HYDROGENASE-4
+ COMPONENT F from Escherichia coli (526 aa), FASTA scores:
+ opt: 948, E(): 0, (35.9% identity in 493 aa overlap); and
+ AAK06855.1|AF335723_1|AF335723 hydrogenase-4 component B
+ from Burkholderia pseudomallei (668 aa). Also similar to
+ d9087711 & NUOL_ECOLI|P33607 NADH dehydrogenase I chain L
+ from Escherichia coli (613 aa), FASTA scores: opt: 360,
+ E():3.2e-13, (27.9% identity in 488 aa overlap); and to
+ NUON_ECOLI|P33608 NADH dehydrogenase I chain N from
+ Escherichia coli (425 aa), FASTA scores: opt: 375, E():
+ 3.9e-14, (25.0% identity in 432 aa overlap). Mb0089 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE HYDROGENASE HYCQ"
+ /protein_id="CAB5247792.1"
+ /translation="MTGLLLAAILAPLAASIASLITGWRRTTATLTALSATTVLACAV
+ AMGFWMGSGAQFGLGGLLRADALTVVMLVVIGIVGTLATAASIGYIDTELAHGHIDGR
+ SARLYGVLTPAFLCATVLAVCANNIGVIWVAIEATTVITAFLVGHRRTRTALEATWKY
+ VVICSVGIAVAFLGTVLLYFAARDSGAAAAGALNLDILAEHAAGLDPGVARLAGGLLL
+ IGYGAKAGLFPFHTWLADAHSQAPAPVSALMSGVLLAVAFSVLIRLRPILDAVSGPAY
+ LRNGLLVVGLATLLVAVLMLTVTGDVKRMLAYSSMEHMGLIAIAAAAGTTLAIAALLL
+ HVLAHGIGKTVLFLAGGQLQAAHDSTAIADITGVMRRSRLIGVSFAVGLIVLLGLPPF
+ AMFASELAIARSLANERLAWVLGAALLLIAIGFTALARNSGRMLLGTPAAGAPAITVP
+ ATAAAALMVGIVVSAALGITAGPLADLLGIAASNVGLP"
+ gene 95449..96927
+ /gene="hycE"
+ /locus_tag="BQ2027_MB0090"
+ CDS 95449..96927
+ /gene="hycE"
+ /locus_tag="BQ2027_MB0090"
+ /note="Mb0090, hycE, len: 492 aa. Equivalent to Rv0087,
+ len: 492 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 492 aa overlap). Possible hycE
+ (alternate gene name: hevE), formate hydrogenlyase (EC
+ 1.-.-.-), similar to others e.g. HYCE_ECOLI|P16431 formate
+ hydrogenlyase subunit 5 from Escherichia coli (569 aa),
+ FASTA scores: opt: 680, E(): 1.8e-38, (31.2% identity in
+ 449 aa overlap); NP_457243.1|NC_003198 formate
+ hydrogenlyase subunit 5 from Salmonella enterica subsp.
+ enterica serovar Typhi (569 aa); NP_275541.1|NC_000916
+ formate hydrogenlyase subunit 5 from Methanothermobacter
+ thermautotrophicus (370 aa); etc. Also some similarity
+ with NUOD_ECOLI|P33600 NADH dehydrogenase I chain D from
+ Escherichia coli (407 aa), FASTA scores: opt: 245, E():
+ 8.9e-10, (24.5% identity in 368 aa overlap). BELONGS TO
+ THE COMPLEX I 49 kDa SUBUNIT FAMILY. Protein product from
+ Mb0090 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="possible formate hydrogenase hyce (fhl)"
+ /protein_id="CAB5247793.1"
+ /translation="MMSASWLRHRVSERGLIATAEQLWADSFRLALVAAHDDGDSLRV
+ VYLFLAGYPDRRVELEYVVPADNPEIRSLAYLSFPAGRFEREMADLYGIRPVGHPKPR
+ RLVRHAHWPDWHPMRTDAGPAPEFTDTGAFPFLAVEGPGVYEIPVGPVHAGLIEPGHF
+ RFSVAGETIVRLKARLWFVHRGIEKLFHGRPATAAVDLAERISGDTSAAHALAHSLAI
+ EDALGIELPHEIHRLRALIVELERLYNHAADLGALANDVGYSLANAHAQRIRENLLRR
+ NAAVTGHRLLRGAIRAGGVALRALPDTDELAALAVDLAEVATLTLANSVVYDRFAGTA
+ VLHPDDASALGCLGYVARASGLRSDARVEHPTIVLPITEIGAPDGDVLARYTVRRDEF
+ AASAALAQHIVESHTGPIEYAATLHPVGAPSSGIGIVEGWRGTIVHRVEIDVDGRITR
+ AKVVDPSWFNWPALPVAMADTIVPDFPLANKSFNQSYAGNDL"
+ gene 96962..97636
+ /locus_tag="BQ2027_MB0091"
+ CDS 96962..97636
+ /locus_tag="BQ2027_MB0091"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0091, -, len: 224 aa. Equivalent to Rv0088, len:
+ 224 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 224 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0091 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0091 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible polyketide cyclase/dehydrase"
+ /protein_id="CAB5247794.1"
+ /translation="MSVYKHAPSRVRLRQTRSTVVKGRSGSLSWRRVRTGDLGLAVWG
+ GREEYRAVKPGTPGIQPKGDMMTVTVVDAGPGRVSRSVEVAAPAAELFAIVADPRRHR
+ ELDGSGTVRGNIKVPAKLVVGSKFSTKMKLFGLPYRITSRVTALKPNELVEWSHPLGH
+ RWRWEFESLSPTLTRVTETFDYHAAGAIKNGLKFYEMTGFAKSNAAGIEATLAKLSDQ
+ YARGRA"
+ gene 97793..98386
+ /locus_tag="BQ2027_MB0092"
+ CDS 97793..98386
+ /locus_tag="BQ2027_MB0092"
+ /note="Mb0092, -, len: 197 aa. Equivalent to Rv0089, len:
+ 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 197 aa overlap). Possible
+ methyltransferase (EC 2.1.1.-), showing some weak
+ similarity to others e.g. NP_299749.1|NC_002488
+ 3-demethylubiquinone-9 3-methyltransferase from Xylella
+ fastidiosa 9a5c (246 aa); CAC44277.1| (AL596030) putative
+ methyltransferase from Streptomyces coelicolor (285 aa);
+ NP_111415.1|NC_002689 Predicted SAM-dependent
+ methyltransferase from Thermoplasma volcanium (245 aa);
+ etc. Also some similarity with many biotin biosynthesis
+ proteins e.g. P12999|BIOC_ECOLI|B0777 BIOTIN SYNTHESIS
+ PROTEIN from Escherichia coli (251 aa), FASTA scores: opt:
+ 202, E(): 4.5e-07, (39.0% identity in 118 aa overlap);
+ etc. BELONGS TO THE METHYLTRANSFERASE SUPERFAMILY. Mb0092
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE METHYLTRANSFERASE/METHYLASE"
+ /protein_id="CAB5247795.1"
+ /translation="MDQPWNANIHYDALLDAMVPLGTQCVLDVGCGDGLLAARLARRI
+ PYVTAVDIDAPVLRRAQTRFANAPIRWLHADIMTAELPNAGFDAVVSNAALHHIEDTR
+ TALSRLGGLVTPGGTLAVVTFVTPSLRNGLWHLTSWVACGMANRVKGKWEHSAPIKWP
+ PPQTLHELRSHVRALLPGACIRRLLYGRVLVTWRAPV"
+ gene 98515..99285
+ /locus_tag="BQ2027_MB0093"
+ CDS 98515..99285
+ /locus_tag="BQ2027_MB0093"
+ /note="Mb0093, -, len: 256 aa. Equivalent to Rv0090, len:
+ 256 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 256 aa overlap). Possible membrane
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="CAB5247796.1"
+ /translation="MAKNQNRIRNRWELITCGLGGHVTYAPDDAALAARLRASTGLGE
+ VWRCLRCGDFALGGPQGRGAPEDAPLIMRGKALRQAIIIRALGVERLVRALVLALAAW
+ AVWEFRGARGAIQATLDRDLPVLRAAGFKVDQMTVIHALEKALAAKPSTLALITGMLA
+ AYAVLQAVEGVGLWLLKRWGEYFAVVATSIFLPLEVHDLAKGITTTRVVTFSINVAAV
+ VYLLISKRLFGVRGGRKAYDVERRGEQLLDLERAAMLT"
+ gene 99719..100486
+ /gene="mtn"
+ /locus_tag="BQ2027_MB0094"
+ CDS 99719..100486
+ /gene="mtn"
+ /locus_tag="BQ2027_MB0094"
+ /note="Mb0094, mtn, len: 255 aa. Equivalent to Rv0091,
+ len: 255 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 255 aa overlap). Probable mtn
+ (alternate gene name: pfs), MTA/SAH nucleosidase,
+ including 5'-methylthioadenosine nucleosidase (EC
+ 3.2.2.16) and S-adenosylhomocysteine nucleosidase (EC
+ 3.2.2.9), similar to others e.g. NP_521493.1|NC_003295
+ PROBABLE BIFUNCTIONAL PROTEIN (MTA/SAH NUCLEOSIDASE)
+ (P46): 5'-METHYLTHIOADENOSINE NUCLEOSIDASE AND
+ S-ADENOSYLHOMOCYSTEINE NUCLEOSIDASE from Ralstonia
+ solanacearum (261 aa); AAC45731.1|U55214 Pfs from
+ Treponema pallidum (249 aa); P96122|MTN_TREPA MTA/SAH
+ NUCLEOSIDASE from Treponema pallidum (269 aa);
+ PFS_ECOLI|P24247 pfs protein (p46) from Escherichia coli
+ (232 aa), FASTA scores: opt: 214, E(): 3.8e-08, (30.5%
+ identity in 246 aa overlap); etc. BELONGS TO THE MTN
+ FAMILY. Protein product from Mb0094 detected using SWATH
+ mass spectrometry. Mb0094 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable bifunctional mta/sah nucleosidase mtn:
+ 5'-methylthioadenosine nucleosidase (methylthioadenosine
+ methylthioribohydrolase) + s-adenosylhomocysteine
+ nucleosidase (s-adenosyl-l-homocysteine
+ homocysteinylribohydrolase)"
+ /protein_id="CAB5247797.1"
+ /translation="MAVTVGVICAIPQELAYLRGVLVDAKRQQVAQILFDSGQLDAHR
+ VVLAAAGMGKVNTGLTATLLADRFGCRTIVFTGVAGGLDPELCIGDIVIADRVVQHDF
+ GLLTDERLRPYQPGHIPFIEPTERLGYPVDPAVIDRVKHRLDGFTLAPLSTAAGGGGR
+ QPRIYYGTILTGDQYLHCERTRNRLHHELGGMAVEMEGGAVAQICASFDIPWLVIRAL
+ SDLAGADSGVDFNRFVGEVAASSARVLLRLLPVLTAC"
+ gene 100618..102903
+ /gene="ctpA"
+ /locus_tag="BQ2027_MB0095"
+ CDS 100618..102903
+ /gene="ctpA"
+ /locus_tag="BQ2027_MB0095"
+ /note="Mb0095, ctpA, len: 761 aa. Equivalent to Rv0092,
+ len: 761 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 761 aa overlap). Probable ctpA,
+ cation-transporting P-type ATPase A (transmembrane
+ protein) (EC 3.6.3.-), highly similar to others e.g.
+ CTPA_MYCLE|P46839 cation-transporting P-type ATPase A from
+ Mycobacterium leprae (780 aa), FASTA scores: opt: 3454,
+ E(): 0, (74.4% identity in 741 aa overlap);
+ CAB66270.1|AL136519 probable cation-transporting P-type
+ ATPase from Streptomyces coelicolor (760 aa);
+ NP_391230.1|NC_000964 protein similar to heavy
+ metal-transporting ATPase from Bacillus subtilis (803 aa);
+ etc. Also highly similar to MTCY251.22c from Mycobacterium
+ tuberculosis, FASTA score: (68.3% identity in 742 aa
+ overlap). Contains PS01047 Heavy-metal-associated domain,
+ and PS00154 E1-E2 ATPases phosphorylation site. BELONGS TO
+ THE CATION TRANSPORT ATPASES FAMILY (E1-E2 ATPASES),
+ SUBFAMILY IB. Protein product from Mb0095 detected using
+ SWATH mass spectrometry. Mb0095 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="cation transporter p-type atpase a ctpa"
+ /protein_id="CAB5247798.1"
+ /translation="MTAAVTGEHHASVQRIQLRISGMSCSACAHRVESTLNKLPGVRA
+ AVNFGTRVATIDTSEAVDAAALCQAVRRAGYQADLCTDDGRSASDPDADHARQLLIRL
+ AIAAVLFVPVADLSVMFGVVPATRFTGWQWVLSALALPVVTWAAWPFHRVAMRNARHH
+ AASMETLISVGITAATIWSLYTVFGNHSPIERSGIWQALLGSDAIYFEVAAGVTVFVL
+ VGRYFEARAKSQAGSALRALAALSAKEVAVLLPDGSEMVIPADELKEQQRFVVRPGQI
+ VAADGLAVDGSAAVDMSAMTGEAKPTRVRPGGQVIGGTTVLDGRLIVEAAAVGADTQF
+ AGMVRLVEQAQAQKADAQRLADRISSVFVPAVLVIAALTAAGWLIAGGQPDRAVSAAL
+ AVLVIACPCALGLATPTAMMVASGRGAQLGIFLKGYKSLEATRAVDTVVFDKTGTLTT
+ GRLQVSAVTAAPGWEADQVLALAATVEAASEHSVALAIAAATTRRDAVTDFRAIPGRG
+ VSGTVSGRAVRVGKPSWIGSSSCHPNMRAARRHAESLGETAVFVEVDGEPCGVIAVAD
+ AVKDSARDAVAALADRGLRTMLLTGDNPESAAAVATRVGIDEVIADILPEGKVDVIEQ
+ LRDRGHVVAMVGDGINDGPALARADLGMAIGRGTDVAIGAADIILVRDHLDVVPLALD
+ LARATMRTVKLNMVWAFGYNIAAIPVAAAGLLNPLVAGAAMAFSSFFVVSNSLRLRKF
+ GRYPLGCGTVGGPQMTAPSSA"
+ gene complement(102850..103698)
+ /locus_tag="BQ2027_MB0096C"
+ CDS complement(102850..103698)
+ /locus_tag="BQ2027_MB0096C"
+ /note="Mb0096c, -, len: 282 aa. Equivalent to Rv0093c,
+ len: 282 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 282 aa overlap). Probable conserved
+ membrane protein, equivalent only to CAC30943.1|AL583924
+ probable integral membrane protein from Mycobacterium
+ leprae (237 aa). Protein product from Mb0096c detected
+ using SWATH mass spectrometry. Mb0096c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5247799.1"
+ /translation="MLAQATTAGSFNHHASTVLQGRRGVPAAMWSEPAGAIRRHCATI
+ DGMDCEVAREALSARLDGERAPVPSARVDEHLGECSACRAWFTQVASQAGDLRRLAES
+ RPVVPPVGRLGIRRAPRRQHSPMTWRRWALLCVGIAQIALGTVQGFGLDVGLTHQHPT
+ GAGTHLLNESTSWSIALGVIMVGAALWPSAAAGLAGVLTAFVAILTGYVIVDALSGAV
+ STTRILTHLPVVIGAVLAIMVWRSASGPRPRPDAVAAEPDIVLPDNASRGRRRGHLWP
+ TDGSAA"
+ gene complement(103745..104464)
+ /locus_tag="BQ2027_MB0097C"
+ CDS complement(103745..104464)
+ /locus_tag="BQ2027_MB0097C"
+ /note="Mb0097c, -, len: 239 aa. Equivalent to Rv0094c,
+ len: 239 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (72% identity in 317 aa overlap). Member of 13E12 repeat
+ family, showing some similarity to U15187|MLU15187_7 from
+ Mycobacterium leprae (94 aa), FASTA score: (49.4% identity
+ in 79 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="13E12 repeat family protein"
+ /protein_id="CAB5247800.1"
+ /translation="MLAKLAAPGATNPDDHTPVIDTTPDAAAIDRDTRSQAQRNHDGL
+ LAGLRALIASGELGQHNGLPVSIVVTTTLTDLQTGAGKGFTGGGTLLPMADVIRMTSH
+ AHHYSPASGRYPQAIFDHGTPLALYHTKRLASPAQRIMLFANDRGCTKPGCDAPAYHS
+ QAHHVTGWTSTGRTDITDLTLACDPDNRLAEKGWTTRKNTHGHTEWLPPPHLDHGQPW
+ TNTFHHPERFLHNQDDDDKPD"
+ repeat_region complement(103748..105251)
+ /note="REP-2, len: 1504 nt. Equivalent to REP, len: 1503
+ nt, from Mycobacterium tuberculosis strain H37Rv, (97.0%
+ identity in 1504 nt overlap). REP251, member of REP13E12
+ family."
+ /rpt_family="REP"
+ gene complement(104469..105251)
+ /locus_tag="BQ2027_MB0098C"
+ CDS complement(104469..105251)
+ /locus_tag="BQ2027_MB0098C"
+ /note="Mb0098c, -, len: 260 aa. Equivalent to Rv1588 and
+ Rv0095c, len: 222 aa and 136 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (98.2% identity in 222 aa
+ overlap and 92.5% identity in 134 aa overlap). Member of
+ 13E12 repeat, also partially similar to AF0418|AF041819_8
+ from Mycobacterium bovis BCG (222 aa), FASTA score: (89.6%
+ identity in 96 aa overlap). REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium tuberculosis strain H37Rv, Rv0095c and
+ Rv1588 exist as separate genes in their respective
+ positions. In Mycobacterium bovis, a 73 bp substitution
+ leads to a single combined gene. Mb0098c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247801.1"
+ /translation="MRYLPVSTRRIWVNPLCHFSFTVISGALFVSARRYDSNMLANSR
+ EELVEVFDALDAELDRLDEVSFEVLTTPERLRSLERLECLVRRLPAVGHTLINQLDTQ
+ ASEEELGGTLCCALANRLRITKPDAALRIADAADLGPRRALTGEPLAPQLTATATAQR
+ QGLIGEAHIKVIRALFRPPARRGGCVHPPGRRSRPGRQSRSISSRRAGPLRPAGHGLA
+ TPRRRPHRHRTRPQTRHHPEQPAIRRHVTAKWLPDPPSAGHL"
+ gene 105360..106751
+ /gene="PPE1"
+ /locus_tag="BQ2027_MB0099"
+ CDS 105360..106751
+ /gene="PPE1"
+ /locus_tag="BQ2027_MB0099"
+ /note="Mb0099, PPE1, len: 463 aa. Equivalent to Rv0096,
+ len: 463 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 463 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family, similar to many
+ e.g. Z46257|MLACEA_3 aceA gene for isocitrate L from M.
+ leprae (438 aa), FASTA scores: opt: 1207, E(): 0, (55.3%
+ identity in 380 aa overlap). Also similar to
+ Z97559|MTCY261_19 from Mycobacterium tuberculosis (473
+ aa), FASTA score: (40.2% identity in 478 aa overlap);
+ YHS6_MYCTU|P42611 hypothetical 50.6 kd protein (517 aa),
+ FASTA scores: opt: 365, E(): 4.6e-12, (37.6% identity in
+ 178 aa overlap). Also similar to MTCY274.23c from M.
+ tuberculosis FASTA score: (31.1% identity in 383 overlap).
+ Some similarity also to MTCY31.06c and MTCY48.17 and other
+ mycobacterial PPE family proteins."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe1"
+ /protein_id="CAB5247802.1"
+ /translation="MAIPPEVHSGLLSAGCGPGSLLVAAQQWQELSDQYALACAELGQ
+ LLGEVQASSWQGTAATQYVAAHGPYLAWLEQTAINSAVTAAQHVAAAAAYCSALAAMP
+ TPAELAANHAIHGVLIATNFFGINTVPIALNEADYVRMWLQAADTMAAYQAVADAATV
+ AVPSTQPAPPIRAPGGDAADTWLDVLSSIGQLIRDILDFIANPYKYFLEFFEQFGFSP
+ AVTVVLALVALQLYDFLWYPYYASYGLLLLPFFTPTLSALTALSALIHLLNLPPAGLL
+ PIAAALGPGDQWGANLAVAVTPATAAVPGGSPPTSNPAPAAPSSNSVGSASAAPGISY
+ AVPGLAPPGVSSGPKAGTKSPDTAADTLATAGAARPGLARAHRRKRSESGVGIRGYRD
+ EFLDATATVDAATDVPAPANAAGSQGAGTLGFAGTAPTTSGAAAGMVQLSSHSTSTTV
+ PLLPTTWTTDAEQ"
+ gene 106770..107639
+ /locus_tag="BQ2027_MB0100"
+ CDS 106770..107639
+ /locus_tag="BQ2027_MB0100"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0100, -, len: 289 aa. Equivalent to Rv0097, len:
+ 289 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 289 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), equivalent to
+ NP_302343.1|NC_002677 putative oxidoreductase from
+ Mycobacterium leprae (289 aa). Also highly similar to
+ BAB69377.1|AB070955 putative oxidoreductase from
+ Streptomyces avermitilis (296 aa); and weakly similar to
+ others e.g. NP_518867.1|NC_003295 PUTATIVE
+ ALPHA-KETOGLUTARATE-DEPENDENT TAURINE DIOXYGENASE
+ OXIDOREDUCTASE PROTEIN from Ralstonia solanacearum (301
+ aa); NP_286110.1|NC_002655 taurine dioxygenase
+ (2-oxoglutarate-dependent) from Escherichia coli strain
+ O157:H7 (283 aa); NP_252624.1|NC_002516 taurine
+ dioxygenase from Pseudomonas aeruginosa (277 aa);
+ ECAE00014310 (283 aa), FASTA scores: opt: 304, E():
+ 2.6e-13, (27.8% identity in 288 aa overlap);
+ TFDA_ALCEU|P10088 2,4-dichlorophenoxyacetate monooxygenase
+ from A. eutropha (287 aa), FASTA scores: opt: 188, E():
+ 3.5e-06, (26.6% identity in 188 aa overlap); etc. Contains
+ PS00077 Cytochrome c oxidase subunit I, copper B binding
+ region signature. Protein product from Mb0100 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0100 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="CAB5247803.1"
+ /translation="MTLKVKGEGLGAQVTGVDPKNLDDITTDEIRDIVYTNKLVVLKD
+ VHPSPREFIKLGRIIGQIVPYYEPMYHHEDHPEIFVSSTEEGQGVPKTGAFWHIDYMF
+ MPEPFAFSMVLPLAVPGHDRGTYFIDLARVWQSLPAAKRDPARGTVSTHDPRRHIKIR
+ PSDVYRPIGEVWDEINRTTPPIKWPTVIRHPKTGQEILYICATGTTKIEDKDGNPVDP
+ EVLQELMAATGQLDPEYQSPFIHTQHYQVGDIILWDNRVLMHRAKHGSAAGTLTTYRL
+ TMLDGLKTPGYAA"
+ gene 107636..108187
+ /gene="fcot"
+ /locus_tag="BQ2027_MB0101"
+ CDS 107636..108187
+ /gene="fcot"
+ /locus_tag="BQ2027_MB0101"
+ /note="Mb0101, -, len: 183 aa. Equivalent to Rv0098, len:
+ 183 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 183 aa overlap). Conserved
+ hypothetical protein, equivalent to CAC30948.1|AL583924
+ conserved hypothetical protein from Mycobacterium leprae
+ (183 aa). Also some similarity with BAB69378.1|AB070955
+ hypothetical protein from Streptomyces avermitilis (172
+ aa). Protein product from Mb0101 detected using SWATH mass
+ spectrometry. Mb0101 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable fatty acyl coa thioesterase type iii
+ fcot"
+ /protein_id="CAB5247804.1"
+ /translation="MSHTDLTPCTRVLASSGTVPIAEELLARVLEPYSCKGCRYLIDA
+ QYSATEDSVLAYGNFTIGESAYIRSTGHFNAVELILCFNQLAYSAFAPAVLNEEIRVL
+ RGWSIDDYCQHQLSSMLIRKASSRFRKPLNPQKFSARLLCRDLQVIERTWRYLKVPCV
+ IEFWDENGGAASGEIELAALNIP"
+ gene 108192..109814
+ /gene="fadD10"
+ /locus_tag="BQ2027_MB0102"
+ CDS 108192..109814
+ /gene="fadD10"
+ /locus_tag="BQ2027_MB0102"
+ /note="Mb0102, fadD10, len: 540 aa. Equivalent to Rv0099,
+ len: 540 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 540 aa overlap). Possible fadD10,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), equivalent to
+ MLACEA_4|Q50176 LONG CHAIN FATTY ACID-COA LIGASE from
+ Mycobacterium leprae (532 aa), FASTA scores: opt: 2580,
+ E(): 0, (74.6% identity in 531 aa overlap). Also similar
+ to many e.g. BAB69379.1|AB070955 long-chain fatty
+ acid--CoA ligase from Streptomyces avermitilis (518 aa);
+ NP_419782.1|NC_002696 putativ long-chain-fatty-acid--CoA
+ ligase from Caulobacter crescentus (530 aa);
+ NP_435326.1|NC_003037 probable long chain fatty acid CoA
+ ligase from Sinorhizobium meliloti (508 aa); etc. Also
+ similar to ACSA_BACSU|P39062 acetyl-coenzyme A synthetase
+ from Bacillus subtilis (572 aa), FASTA scores: opt: 415,
+ E(): 9.8e-20, (27.1% identity in 539 aa overlap). Contains
+ PS00455 putative AMP-binding domain signature. BELONGS TO
+ THE ATP-DEPENDENT AMP-BINDING ENZYME FAMILY. Protein
+ product from Mb0102 detected using SWATH mass
+ spectrometry. Mb0102 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE FATTY-ACID-COA LIGASE FADD10
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="CAB5247805.1"
+ /translation="MGGKKFQAMPQLPSTVLDRVFEQARQQPEAIALRRCDGTSALRY
+ RELVAEVGGLAADLRAQSVSRGSRVLVISDNGPETYLSVLACAKLGAIAVMADGNLPI
+ AAIERFCQITDPAAALVAPGSKMASSAVPEALHSIPVIAVDIAAVTRESEHSLDAASL
+ AGNADQGSEDPLAMIFTSGTTGEPKAVLLANRTFFAVPDILQKEGLNWVTWVVGETTY
+ SPLPATHIGGLWWILTCLMHGGLCVTGGENTTSLLEILTTNAVATTCLVPTLLSKLVS
+ ELKSANATVPSLRLVGYGGSRAIAADVRFIEATGVRTAQVYGLSETGCTALCLPTDDG
+ SIVKIEAGAVGRPYPGVDVYLAATDGIGPTAPGAGPSASFGTLWIKSPANMLGYWNNP
+ ERTAEVLIDGWVNTGDLLERREDGFFYIKGRSSEMIICGGVNIAPDEVDRIAEGVSGV
+ REAACYEIPDEEFGALVGLAVVASAELDESAARALKHTIAARFRRESEPMARPSTIVI
+ VTDIPRTQSGKVMRASLAAAATADKARVVVRG"
+ gene 109819..110055
+ /locus_tag="BQ2027_MB0103"
+ CDS 109819..110055
+ /locus_tag="BQ2027_MB0103"
+ /note="Mb0103, -, len: 78 aa. Equivalent to Rv0100,
+ (MTCY251.19), len: 78 aa. Conserved hypothetical protein,
+ equivalent only to CAC30950.1|AL583924 conserved
+ hypothetical protein from Mycobacterium leprae (78 aa).
+ Mb0103 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pp-binding family protein Rv0100"
+ /protein_id="CAB5247806.1"
+ /translation="MRDRILAAVCDVLYIDEADLIDGDETDLRDLGLDSVRFVLLMKQ
+ LGVNRQSELPSRLAANPSIAGWLRELEAVCTEFG"
+ gene 110037..117575
+ /gene="nrp"
+ /locus_tag="BQ2027_MB0104"
+ CDS 110037..117575
+ /gene="nrp"
+ /locus_tag="BQ2027_MB0104"
+ /note="Mb0104, nrp, len: 2512 aa. Equivalent to Rv0101,
+ len: 2512 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100.0% identity in 2512 aa overlap). Probable nrp,
+ peptide synthetase (EC 6.-.-.-), similar to others e.g.
+ AAD44234.1|AF143772_40|PstB peptide synthetase from
+ Mycobacterium avium (2552 aa); 7476034|S77657 cyclic
+ peptide synthetase from Mycobacterium leprae (1401 aa),
+ FASTA scores: opt: 4268, E(): 0, (65.7% identity in 1091
+ aa overlap); part of CAB55600.1|AJ238027 peptide
+ synthetase from Mycobacterium smegmatis (5990). Also
+ similar to e.g. AAD56240.1|AF184977_1|AF184977 DhbF
+ protein from Bacillus subtilis (2378 aa);
+ SRF1_BACSU|P27206 surfactin synthetase subunit 1 (3587
+ aa), FASTA scores: opt: 1708, E(): 0, (30.6% identity in
+ 1633 aa overlap): etc. Contains PS00017 ATP/GTP-binding
+ site motif A (P-loop), 2 x PS00455 Putative AMP-binding
+ domain signature, and PS00012 Phosphopantetheine
+ attachment site. BELONGS TO THE ATP-DEPENDENT AMP-BINDING
+ ENZYME FAMILY. THOUGHT TO BE NOT INVOLVED IN MYCOBACTIN
+ BIOSYNTHESIS (see citation below). Protein product from
+ Mb0104 detected using shotgun mass spectrometry. Mb0104
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PEPTIDE SYNTHETASE NRP (PEPTIDE
+ SYNTHASE)"
+ /protein_id="CAB5247807.1"
+ /translation="MHRVRLSRSQRNLYNGVRQDNNPALYLIGKSYRFRRLELARFLA
+ ALHATVLDNPVQLCVLENSGADYPDLVPRLRFGDIVRVGSADEHLQSTWCSGILGKPL
+ VRHTVHTDPNGYVTGLDVHTHHILLDGGATGTIEADLARYLTTDPAGETPSVGAGLAK
+ LREAHRRETAKVEESRGRLSAVVQRELADEAYHGGHGHSVSDAPGTAAKGVLHESATI
+ CGNAFDAILTLSEAQRVPLNVLVAAAAVAVDASLRQNTETLLVHTVDNRFGDSDLNVA
+ TCLVNSVAQTVRFPPFASVSDVVRTLDRGYVKAVRRRWLREEHYRRMYLAINRTSHVE
+ ALTLNFIREPCAPGLRPFLSEVPIATDIGPVEGMTVASVLDEEQRTLNLAIWNRADLP
+ ACKTHPKVAERIAAALESMAAMWDRPIAMIVNDWFGIGPDGTRCQGDWPARQPSTPAW
+ FLDSARGVHQFLGRRRFVYPWVAWLVQRGAAPGDVLVFTDDDTDKTIDLLIACHLAGC
+ GYSVCDTADEISVRTNAITEHGDGILVTVVDVAATQLAVVGHDELRKVVDERVTQVTH
+ DALLATKTAYIMPTSGTTGQPKLVRISHGSLAVFCDAISRAYGWGAHDTVLQCAPLTS
+ DISVEEIFGGAACGARLVRSAAMKTGDLAALVDDLVARETTIVDLPTAVWQLLCADGD
+ AIDAIGRSRLRQIVIGGEAIRCSAVDKWLESAASQGISLLSSYGPTEATVVATFLPIV
+ CDQTTMDGALLRLGRPILPNTVFLAFGEVVIVGDLVADGYLGIDGDGFGTVTAADGSR
+ RRAFATGDRVTVDAEGFPVFSGRKDAVVKISGKRVDIAEVTRRIAEDPAVSDVAVELH
+ SGSLGVWFKSQRTREGEQDAAAATRIRLVLVSLGVSSFFVVGVPNIPRKPNGKIDSDN
+ LPRLPQWSAAGLNTAETGQRAAGLSQIWSRQLGRAIGPDSSLLGEGIGSLDLIRILPE
+ TRRYLGWRLSLLDLIGADTAANLADYAPTPDAPTGEDRFRPLVAAQRPAAIPLSFAQR
+ RLWFLDQLQRPAPVYNMAVALRLRGYLDTEALGAAVADVVGRHESLRTVFPAVDGVPR
+ QLVIEARRADLGCDIVDATAWPADRLQRAIEEAARHSFDLATEIPLRTWLFRIADDEH
+ VLVAVAHHIAADGWSVAPLTADLSAAYASRCAGRAPDWAPLPVQYVDYTLWQREILGD
+ LDDSDSPIAAQLAYWENALAGMPERLRLPTARPYPPVADQRGASLVVDWPASVQQQVR
+ RIARQHNATSFMVVAAGLAVLLSKLSGSPDVAVGFPIAGRSDPALDNLVGFFVNTLVL
+ RVNLAGDPSFAELLGQVRARSLAAYENQDVPFEVLVDRLKPTRALTHHPLIQVMLAWQ
+ DNPVGQLNLGDLQATPMPIDTRTARMDLVFSLAERFSEGSEPAGIGGAVEYRTDVFEA
+ QAIDVLIERLRKVLVAVAAAPERTVSSIDALDGTERARLDEWGNRAVLTAPAPTPVSI
+ PQMLAAQVARIPEAEAVCCGDASMTYRELDEASNRLAHRLAGCGAGPGECVALLFERC
+ APAVVAMVAVLKTGAAYLPIDPANPPPRVAFMLGDAVPVAAVTTAGLRSRLAGHDLPI
+ IDVVDALAAYPGTPPPMPAAVNLAYILYTSGTTGEPKGVGITHRNVTRLFASLPARLS
+ AAQVWSQCHSYGFDASAWEIWGALLGGGRLVIVPESVAASPNDFHGLLVAEHVSVLTQ
+ TPAAVAMLPTQGLESVALVVAGEACPAALVDRWAPGRVMLNAYGPTETTICAAISAPL
+ RPGSGMPPIGVPVSGAALFVLDSWLRPVPAGVAGELYIAGAGVGVGYWRRAGLTASRF
+ VACPFGGSGARMYRTGDLVCWRADGQLEFLGRTDDQVKIRGYRIELGEVATALAELAG
+ VGQAVVIAREDRPGDKRLVGYATEIAPGAVDPAGLRAQLAQRLPGYLVPAAVVVIDAL
+ PLTVNGKLDHRALPAPEYGDTNGYRAPAGPVEKTVAGIFARVLGLERVGVDDSFFELG
+ GDSLAAMRVIAAINTTLNADLPVRALLHASSTRGLSQLLGRDARPTSDPRLVSVHGDN
+ PTEVHASDLTLDRFIDADTLATAVNLPGPSPELRTVLLTGATGFLGRYLVLELLRRLD
+ VDGRLICLVRAESDEDARRRLEKTFDSGDPELLRHFKELAADRLEVVAGDKSEPDLGL
+ DQPMWRRLAETVDLIVDSAAMVNAFPYHELFGPNVAGTAELIRIALTTKLKPFTYVST
+ ADVGAAIEPSAFTEDADIRVISPTRTVDGGWAGGYGTSKWAGEVLLREANDLCALPVA
+ VFRCGMILADTSYAGQLNMSDWVTRMVLSLMATGIAPRSFYEPDSEGNRQRAHFDGLP
+ VTFVAEAIAVLGARVAGSSLAGFATYHVMNPHDDGIGLDEYVDWLIEAGYPIRRIDDF
+ AEWLQRFEASLGALPDRQRRHSVLPMLLASNSQRLQPLKPTRGCSAPTDRFRAAVRAA
+ KVGSDKDNPDIPHVSAPTIINYVTNLQLLGLL"
+ gene 117750..119735
+ /locus_tag="BQ2027_MB0105"
+ CDS 117750..119735
+ /locus_tag="BQ2027_MB0105"
+ /note="Mb0105, -, len: 661 aa. Equivalent to Rv0102, len:
+ 661 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 661 aa overlap). Probable conserved
+ integral membrane protein, highly similar to
+ P53525|Y102_MYCLE|ML1998|NP_302349.1|NC_002677 possible
+ membrane protein from Mycobacterium leprae (659 aa), FASTA
+ scores: opt: 3107, E(): 0, (70.2% identity in 662 aa
+ overlap). Also similar to others e.g. CAC01497.1|AL391017
+ putative integral membrane protein from Streptomyces
+ coelicolor (316 aa); etc. Contains PS00343 Gram-positive
+ cocci surface proteins 'anchoring' hexapeptide. Protein
+ product from Mb0105 detected using SWATH mass
+ spectrometry. Mb0105 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5247808.1"
+ /translation="MGTHGATKSATSAVPTPRSNSMAMVRLAIGLLGVCAVVAAFGLV
+ SGARRYAEAGNPYPGAFVSVAEPVGFFAASLAGALCLGALIHVVMTAKPEPDGLIDAA
+ AFRIHLLAERVSGLWLGLAATMVVIQAAHDTGVGPARLLASGALSDSVAASEMARGWI
+ VAAICALVVATALRLYTRWLGHVVLLVPTVLAVVATAVTGNPGQGPDHDYATSAAIVF
+ AVAFATLTGLKIAAALAGTTPSRAVLVTQVTCGALALAYGAMLLYLFIPGWAVDSDFA
+ RLGLLAGVILTSVWLFDCWRLLVRPPHAGRRRGGGSGAALAMMAAMASIAAMAVMTAP
+ RFLTHAFTAWDVFLGYELPQPPTIARVLTVWRFDSLIGAAGVVLAIGYAAGFAALRRR
+ GNSWPVGRLIAWLTGCAALVFTSGSGVRAYGSAMFSVHMAEHMTLNMFIPVLLVLGGP
+ VTLALRVLPVTGDGRPPGAREWLTWLLHSRVTTFLSHPITAFVLFVASPYIVYFTPLF
+ DTFVRYHWGHEFMAIHFLVVGYLFYWAIIGIDPGPRRLPYPGRIGLLFAVMPFHAFFG
+ IALMTMSSTVGATFYRSVNLPWLSSIIADQHLGGGIAWSLTELPVIMVIVALVTQWAR
+ QDRRVASREDRHADSDYADDELEAYNAMLRELSRMRR"
+ gene complement(119951..122209)
+ /gene="ctpB"
+ /locus_tag="BQ2027_MB0106C"
+ CDS complement(119951..122209)
+ /gene="ctpB"
+ /locus_tag="BQ2027_MB0106C"
+ /note="Mb0106c, ctpB, len: 752 aa. Equivalent to Rv0103c,
+ len: 752 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 752 aa overlap). Probable ctpB,
+ cation-transporting P-type ATPase B (transmembrane
+ protein) (EC 3.6.3.-), equivalent to CTPB_MYCLE|P46840
+ cation-transporting P-type ATPase B from Mycobacterium
+ leprae (750 aa), FASTA scores: opt: 3615, E(): 0, (76.5%
+ identity in 752 aa overlap). Also highly similar to others
+ e.g. CAB96031.1|AL360055 putative metal transporter ATPase
+ from Streptomyces coelicolor (753 aa);
+ NP_241423.1|NC_002570 copper-transporting ATPase from
+ Bacillus halodurans (806 aa); etc. Also highly similar to
+ Z46257|MLACEA_7 aceA gene for isocitrate L from
+ Mycobacterium leprae (750 aa), FASTA scores: opt: 3615,
+ E():0, (76.5% identity in 752 aa overlap). And similar to
+ MTCY251.11 from Mycobacterium tuberculosis, FASTA score:
+ (68.3% identity in 742 aa overlap). Contains PS01047
+ Heavy-metal-associated domain, PS00154 E1-E2 ATPases
+ phosphorylation site. BELONGS TO THE CATION TRANSPORT
+ ATPASES FAMILY (E1-E2 ATPASES), SUBFAMILY IB. Protein
+ product from Mb0106c detected using SWATH mass
+ spectrometry. Mb0106c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CATION-TRANSPORTER P-TYPE ATPASE B
+ CTPB"
+ /protein_id="CAB5247809.1"
+ /translation="MAAPVVGDADLQSVRRIRLDVSGMSCAACASRVETKLNKIPGVR
+ ASVNFATRVATIDAVGMAADELCGVVEKAGYHAAPHTETTVLDKRTKDPDGAHARRLL
+ RRLLVAAVLFVPLADLSTLFAIVPSARVPGWGYILTALAAPVVTWAAWPFHSVALRNA
+ RHRTTSMETLISVGIVAATAWSLSSVFGDQPPREGSGIWRAILNSDSIYLEVAAGVTV
+ FVLAGRYFEARAKSKAGSALRALAELGAKNVAVLLPDGAELVIPASELKKRQRFVTRP
+ GETIAADGVVVDGSAAIDMSAMTGEAKPVRAYPAASVVGGTVVMDGRLVIEATAVGAD
+ TQFAAMVRLVEQAQTQKARAQRLADHIAGVFVPVVFVIAGLAGAAWLVSGAGADRAFS
+ VTLGVLVIACPCALGLATPTAMMVASGRGAQLGIFIKGYRALETIRSIDTVVFDKTGT
+ LTVGQLAVSTVTMAGSGTSERDREEVLGLAAAVESASEHAMAAAIVAASPDPGPVNGF
+ VAVAGCGVSGEVGGHHVEVGKPSWITRTTPCHDAALVSARLDGESRGETVVFVSVDGV
+ VRAALTIADTLKDSAAAAVAALRSRGLRTILLTGDNRAAADAVAAQVGIDSAVADMLP
+ EGKVDVIQRLREEGHTVAMVGDGINDGPALVGADLGLAIGRGTDVALGAADIILVRDD
+ LNTVPQALDLARATMRTIRMNMIWAFGYNVAAIPIAAAGLLNPLIAGAAMAFSSFFVV
+ SNSLRLRNFGAQ"
+ gene 122353..123867
+ /locus_tag="BQ2027_MB0107"
+ CDS 122353..123867
+ /locus_tag="BQ2027_MB0107"
+ /note="Mb0107, -, len: 504 aa. Equivalent to Rv0104, len:
+ 504 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 504 aa overlap). Conserved hypothetical
+ protein, showing weak similarity with other cAMP-dependent
+ protein kinases e.g. AAC37564.1|M65066 cAMP-dependent
+ protein kinase RI-beta regulatory subunit from Homo
+ sapiens (380 aa); etc. Mb0107 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="cAMP-binding proteins - catabolite gene
+ activator and regulatory subunit of cAMP-dependent protein
+ kinases"
+ /protein_id="CAB5247810.1"
+ /translation="MTPVTTFPLVDAILAGRDRNLDGVILIAAQHLLQTTHAMLRSLF
+ RVGLDPRNVAVIGKCYSTHPGVVDAMRADGIYVDDCSDAYAPHESFDTQYTRHVEWFF
+ AESWARLTAGRTARVVLLDDGGSLLAVAGAMLDASADVIGIEQTSAGYAKIVGCALGF
+ PVINIARSSAKLLYESPIIAARVTQTAFERTAGIDSSAAILITGAGAIGTALADVLRP
+ LHDRVDVYDTRSGCMTPIDLPNAIGGYDVIIGATGATSVPASMHELLRPGVLLMSASS
+ SDREFDAVALRRRTTPNPDCHADLRVADGSVDATLLNSGFPVNFDGSPMCGDASMALT
+ MALLAAAVLYASVAVADEMSSDHPHLGLIDQGDIVASFLNIDVPLQALSRLPLLSIDG
+ YRRLQVRSGHTLFRQGERADHFFVIESGELEALVDGKVILRLGAGDHFGEACLLGGMR
+ RIATVRACEPSVLWELDGKAFGDALHGDAAMREIAYGVARTRLMHAGASESLMV"
+ gene complement(124016..124300)
+ /gene="rpmB1"
+ /locus_tag="BQ2027_MB0108C"
+ CDS complement(124016..124300)
+ /gene="rpmB1"
+ /locus_tag="BQ2027_MB0108C"
+ /note="Mb0108c, rpmB1, len: 94 aa. Equivalent to Rv0105c,
+ len: 94 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 94 aa overlap). Probable rpmB1, 50S
+ ribosomal protein L28-1, highly similar to others e.g.
+ Q9X8K8|R28B_STRCO 50S RIBOSOMAL PROTEIN L28-2 from
+ Streptomyces coelicolor (78 aa); RL28_ECOLI|P02428 50s
+ ribosomal protein l28 from Escherichia coli (77 aa), FASTA
+ scores: opt: 167, E(): 6.2e-06, (40.7% identity in 59 aa
+ overlap); etc. Also similar to MTCY63A_2 from
+ Mycobacterium tuberculosis. BELONGS TO THE L28P FAMILY OF
+ RIBOSOMAL PROTEINS. Mb0108c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l28-1 rpmb1"
+ /protein_id="CAB5247811.1"
+ /translation="MSARCQITGRTVGFGKAVSHSHRRTRRRWPPNIQLKAYYLPSED
+ RRIKVRVSAQGIKVIDRDGHRGRRRAARAGSAPAHFARQAGSSLRTAAIL"
+ gene 124410..125606
+ /locus_tag="BQ2027_MB0109"
+ CDS 124410..125606
+ /locus_tag="BQ2027_MB0109"
+ /note="Mb0109, -, len: 398 aa. Equivalent to Rv0106, len:
+ 398 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 398 aa overlap). Conserved
+ hypothetical protein, similar to others e.g.
+ AL049841|SCE9_33 from Streptomyces coelicolor (370 aa),
+ FASTA scores: opt: 282, E(): 2.5e-11, (32.0% identity in
+ 381 aa overlap); etc. Some similarity to P94400 HOMOLOGUE
+ TO NITRILE HYDRATASE REGION from Bacillus subtilis (397
+ aa), FASTA scores: opt: 226, E(): 5.4e-08, (26.4% identity
+ in 405 aa overlap). Also similar to COBW_PSEDE|P29937
+ FASTA score: (25.3% identity in 186 aa overlap); and
+ P47K_PSECL|P31521 47 kd protein (p47k) (419 aa), FASTA
+ score: (25.9% identity in 401 aa overlap). Protein product
+ from Mb0109 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0109 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Metal chaperone, involved in Zn homeostasis"
+ /protein_id="CAB5247812.1"
+ /translation="MRTPVILVAGQDHTDEVTGALLRRTGTVVVEHRFDGHVVRRMTA
+ TLSRGELITTEDALEFAHGCVSCTIRDDLLVLLRRLHRRDNVGRIVVHLAPWLEPQPI
+ CWAIDHVRVCVGHGYPDGPAALDVRVAAVVTCVDCVRWLPQSLGEDELPDGRTVAQVT
+ VGQAEFADLLVLTHPEPVAVAVLRRLAPRARITGGVDRVELALAHLDDNSRRGRTDTP
+ HTPLLAGLPPLAADGEVAIVEFSARRPFHPQRLHAAVDLLLDGVVRTRGRLWLANRPD
+ QVMWLESAGGGLRVASAGKWLAAMAASEVAYVDLERRLFADLMWVYPFGDRHTAMTVL
+ VCGADPTDIVNALNAALLSDDEMASPQRWQSYVDPFGDWHDDPCHEMPDAAGEFSAHR
+ NSGESR"
+ gene complement(125701..130578)
+ /gene="ctpI"
+ /locus_tag="BQ2027_MB0111C"
+ CDS complement(125701..130578)
+ /gene="ctpI"
+ /locus_tag="BQ2027_MB0111C"
+ /note="Mb0111c, ctpI, len: 1625 aa. Equivalent to 5' end
+ of Rv0107c, len: 1632 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.7% identity in 1572 aa overlap).
+ Probable ctpI, cation-transporting ATPase I P-type (EC
+ 3.6.3.-), highly similar to NP_302704.1|NC_002677 probable
+ cation transport ATPase from Mycobacterium leprae (1609
+ aa); and similar to others e.g. CAB69720.1|AL137166
+ putative transport ATPase from Streptomyces coelicolor
+ (1472 aa); ATA1_SYNY|P37367 cation-transporting ATPase
+ pma1 from Synechocystis sp. (915 aa), FASTA scores: opt:
+ 603, E(): 6.6e-29, (32.4% identity in 710 aa overlap);
+ etc. Also similar to MTCY39.21c and MTCY22G10.22c from
+ Mycobacterium tuberculosis, FASTA score: (34.4% identity
+ in 796 aa overlap). Contains PS00154 E1-E2 ATPases
+ phosphorylation site. BELONGS TO THE CATION TRANSPORT
+ ATPASES FAMILY (E1-E2 ATPASES).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base insertion (*-t) leads to a product with a
+ different COOH part compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv. Protein product
+ from Mb0111c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0111c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CATION-TRANSPORTER ATPASE I CTPI"
+ /protein_id="CAB5247813.1"
+ /translation="MKIPGVATVLGGVTNGVAQTVRAGARLPGSAAAAVQTLASPVLE
+ LTGPVVQSVVQTTGRAIGVRGSHNESPDGMTPPVRWRSGRRVHFDLDPLLPFPRWHEH
+ AAMVEEPVRRIPGVAEAHVEGSLGRLVVELEPDVDSDIAVDEVRDVVSAVAADIFLAG
+ SVSSPNSAPFADPGNPLAILVPLTAAAMDLVAMGATVTGWVARLPAAPQTTRALAALI
+ NHQPRMVSLMESRLGRVGTDIALAATTAAANGLTQSLGTPLLDLVQRSLQISEAAAHR
+ RVWRDREPALASPRRPQAPVVPIISSAGAKSQEPRHSWAAAAAGEASHVVVGGSIDAA
+ IDTAKGSRAGPVEQYVNQAANGSLIAAASALVAGGGTEDAAGAILAGVPRAAHMGRQA
+ FAAVLGRGLANTGQLVLDPGALRRLDRVRVVVIDGAALRGDNRAVLHAQGDEPGWDDD
+ RVYEVADALLHGEQAPEPDPDELPATGARLRWAPAQGPSATPAQGLEHADLVVDGQCV
+ GSVDVGWEVDPYAIPLLQTAHRTGARVVLRHVAGTEDLSASVGSTHPPGTPLLKLVRE
+ LRADRGPVLLITAVHRDFASTDTLAALAIADVGVALDDPRGATPWTADLITGTDLAAA
+ VRILSALPVARAASESAVHLAQGGTTLAGLLLVTGEQDKTTNPASFRRWLNPVNAAAA
+ TALVSGMWSAAKVLRMPDPTPQPLTAWHALDPEIVYSRLAGGSRPLAVEPGIPAWRRI
+ LDDLSYEPVMAPLRGPARTLAQLAVATRHELADPLTPILAVGAAASAIVGSNIDALLV
+ AGVMTVNAITGGVQRLRAEAAAAELFAEQDQLVRRVVVPAVATTRRRLEAARHATRTA
+ TVSAKSLRVGDVIDLAAPEVVPADARLLVAEDLEVDESFLTGESLPVDKQVDPVAVND
+ PDRASMLFEGSTIVAGHARAIVVATGVGTAAHRAISAVADVETAAGVQARLRELTSKV
+ LPMTLAGGAAVTALALLRRASLRQAVADGVAIAVAAVPEGLPLVATLSQLAAAQRLTA
+ RGALVRSPRTIEALGRVDTICFDKTGTLTENRLRVVCALPSSTAAERDPLPQTTDAPS
+ AEVLRAAARASTQPHNGEGHAHATDEAILAAASALAGSLSSQGDSEWVVLAEVPFESS
+ RGYAAAIGRVGTDGIPMLMLKGAPETILPRCRLADPGVDHEHAESVVRHLAEQGLRVL
+ AVAQRTWDNGTTHDDETDADAVDAVAHDLELIGYVGLADTARPSSRPLIEALLDAERN
+ VVLITGDHPITARAIARQLGLPADARVVTGAELAVLDEEAHAKLAADMQVFARVSPEQ
+ KVQIVASLQRCGRVTAMVGDGANDAAAIRMADVGIGVSGRGSSAARGAADIVLTDDDL
+ GVLLDALVEGRSMWAGVRDAVTILVGGNVGEVLFTVIGTAFGAGRAPVGTRQLLLVNL
+ LTDMFPALAVAVTSQFAEPDDAEYPTDDAAERAQREHRRAVLIGPTPSLDAPLLRQIV
+ NRGVVTAAGATAAWAIGRWTPGTERRTATMGLTALVMTQLAQTLLTRRHSPLVIATAL
+ GSAGVLVGIIQTPVISHFFGCTPLGPVAWTGVFSATAGATAVSALAPKWLASTVGVVQ
+ PDERPDDAEDSDAGG"
+ gene complement(130932..131141)
+ /locus_tag="BQ2027_MB0112C"
+ CDS complement(130932..131141)
+ /locus_tag="BQ2027_MB0112C"
+ /note="Mb0112c, -, len: 69 aa. Equivalent to Rv0108c, len:
+ 69 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 69 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0112c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0112c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247814.1"
+ /translation="MVPVETLHSGDPITDVNGGGQRYIVLESKTVGDSCVVLELESRV
+ NHQLQVIEKSFPAGYHVGRAHHRIL"
+ gene 131420..132910
+ /gene="PE_PGRS1"
+ /locus_tag="BQ2027_MB0113"
+ CDS 131420..132910
+ /gene="PE_PGRS1"
+ /locus_tag="BQ2027_MB0113"
+ /note="Mb0113, PE_PGRS1, len: 496 aa. Equivalent to
+ Rv0109, len: 496 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 496 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to many
+ e.g. Q50615|Y0DP_MYCTU HYPOTHETICAL GLYCINE-RICH 40.8 KD
+ PROTEIN from Mycobacterium tuberculosis (498 aa), FASTA
+ scores: opt: 1772, E(): 0, (57.3% identity in 513 aa
+ overlap); etc. Mb0113 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs1"
+ /protein_id="CAB5247815.1"
+ /translation="MSLLITSPATVAAAATHLAGIGSALSTANAAAAAPTTALSVAGA
+ DEVSVLIAALFEAYAQEYQALSAQALAFHDQFVQALNMGAVCYAAAETANATPLQALQ
+ TVQQNVLTVVNAPTQALLGRPIIGNGANGLPNTGQDGGPGGLLFGNGGNGGSGGVDQA
+ GGNGGAAGLIGNGGSGGVGGPGIAGSAGGAGGAGGLLFGNGGPGGAGGIGTTGDGGPG
+ GAGGNAIGLFGSGGTGGMGGVGGMGGVGNGGNAGNGGTAGLFGHGGAGGAGGIGSADG
+ GLGGGGGNGRFMGNGGVGGAGGYGASGDGGNAGNGGLGGVFGDGGAGGTGGLGDVNGG
+ LAGIGGNAGFVGNGGAGGNGQLGSGAVSSAGGMGGNGGLVFGNGGPGGLGGPGTSAGN
+ GGMGGNAVGLFGQGGAGGAGGSGFGAGIPGGRGGDGGSGGLIGDGGTGGGAGAGDAAA
+ SAGGNGGNARLIGNGGDGGPGMFGGPGGAGGSGGTIFGFAGTPGPS"
+ gene 133058..133807
+ /locus_tag="BQ2027_MB0114"
+ CDS 133058..133807
+ /locus_tag="BQ2027_MB0114"
+ /note="Mb0114, -, len: 249 aa. Equivalent to Rv0110, len
+ 249 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 249 aa overlap). Probable conserved
+ integral membrane protein, similar to many e.g.
+ AL079308|SCH69_25 from Streptomyces coelicolor (297 aa),
+ FASTA scores: opt: 552, E(): 6.1e-29, (45.4% identity in
+ 251 aa overlap); P54493|YQGP_BACSU HYPOTHETICAL 56.4 KD
+ PROTEIN from Bacillus subtilis (507 aa), FASTA scores:
+ opt: 320, E(): 4e-15, (32.4% identity in 210 aa overlap);
+ etc. Mb0114 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5247816.1"
+ /translation="MRVGPVGHQCAECVREGARAVRQPRTPFGGRQRSATPVVTYTLI
+ SLNALVFVMQVTVMGLERQLALWPPAVASGQTYRLVTSAFLHYGAMHLLLNMWALYVV
+ GPPLEMWLGRLRFGALYAVSALGGSVLVYLIAPLNTATAGASGAVFGLFGATFMVARR
+ LHLDVRWVVALIVINLAFTFLAPAISWQGHVGGLVTGALVAATYVYAPRERRNLIQAT
+ VTITVLVAFVVLIGWRTVDLLALFGGRLNLS"
+ gene 133988..136045
+ /locus_tag="BQ2027_MB0115"
+ CDS 133988..136045
+ /locus_tag="BQ2027_MB0115"
+ /note="Mb0115, -, len: 685 aa. Equivalent to Rv0111, len:
+ 685 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 685 aa overlap). Possible
+ transmembrane acyltransferase (EC 2.3.1.-), equivalent to
+ AA22904.1|AL035300 putative acyltransferase from
+ Mycobacterium leprae (696 aa). Also similar to others e.g.
+ C69975 acyltransferase homolog yrhL from Bacillus subtilis
+ (634 aa), FASTA scores: opt: 520, E(): 4e-22, (36.4%
+ identity in 382 aa overlap). Very similar to Mycobacterium
+ tuberculosis proteins Rv0228, Rv1254, Rv1565c, etc. Mb0115
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSMEMBRANE ACYLTRANSFERASE"
+ /protein_id="CAB5247817.1"
+ /translation="MPARSVPRPRWVAPVRRVGRLAVWDRPERRSGIPALDGLRAIAV
+ ALVLASHGGIPGMGGGFIGVDAFFVLSGFLITSLLLDELGRTGRIDLSGFWIRRARRL
+ LPALVLMVLTVSAARALFPDQALTGLRSDAIAAFLWTANWRFVAQNTDYFTQGAPPSP
+ LQHTWSLGVEEQYYVVWPLLLIGATLLLAARARRRCRRATVGGVRFAAFLIASLGTMA
+ SATAAVAFTSAATRDRIYFGTDTRAQALLIGSAAAALLVRDWPSLNRGWCLIRTRWGR
+ RIARLLPFVGLAGLAVTTHVATGSVGEFRHGLLIVVAGAAVIVVASVAMEQRGAVARI
+ LAWRPLVWLGTISYGVYLWHWPIFLALNGQRTGWSGPALFAARCAATVVLAGASWWLI
+ EQPIRRWRPARVPLLPLAAATVASAAAVTMLVVPVGAGPGLREIGLPPGVSAVAAVSP
+ SPPEASQPAPGPRDPNRPFTVSVFGDSIGWTLMHYLPPTPGFRFIDHTVIGCSLVRGT
+ PYRYIGQTLEQRAECDGWPARWSAQVNRDQPDVALLIVGRWETVDRVNEGRWTHIGDP
+ TFDAYLNAELQRALSIVGSTGVRVMVTTVPYSRGGEKPDGRLYPEDQPERVNKWNAML
+ HNAISQHSNVGMIDLNKKLCPDGVYTAKVDGIKVRSDGVHLTQEGVKWLIPWLEDSVR
+ VAS"
+ gene 136327..137283
+ /gene="gca"
+ /locus_tag="BQ2027_MB0116"
+ CDS 136327..137283
+ /gene="gca"
+ /locus_tag="BQ2027_MB0116"
+ /note="Mb0116, gca, len: 318 aa. Equivalent to Rv0112,
+ len: 318 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 318 aa overlap). Possible gca,
+ GDP-mannose 4,6-dehydratase (EC 4.2.1.47), similar to
+ others e g. U18320|PAU18320_1 GDP-D-mann from Pseudomonas
+ aeruginosa (323 aa), FASTA scores: opt: 415, E(): 4.4e-21,
+ (27.0% identity in 318 aa overlap). Similar to Rv3634c,
+ Rv3784, etc from Mycobacterium tuberculosis. Contains
+ PS00061 Short-chain dehydrogenases/reductases family
+ signature. SEEMS TO BELONG TO THE GDP-MANNOSE
+ 4,6-DEHYDRATASE FAMILY. COFACTOR: NAD(+). Protein product
+ from Mb0116 detected using SWATH mass spectrometry. Mb0116
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE GDP-MANNOSE 4,6-DEHYDRATASE GCA
+ (GDP-D-MANNOSE DEHYDRATASE)"
+ /protein_id="CAB5247818.1"
+ /translation="MKVWITGAGGMMGSHLAEMLLAAGHDVYATYCRPTIDPSDLQFN
+ GAEVDITDWCSVYDSIATFRPDAVFHLAAQSYPAVSWARPVETLTTNMVGTAIVFEAL
+ RRVRPHAKIIVAGSSAEYGFVDPSEVPINERRELRPLHPYGVSKAATDMLAYQYHKSY
+ GMHTVVARIFNCTGPRKVGDALSDFVRRCTWLEHHPEQSAIRVGNLKTKRTIVDVRDL
+ NRALMLMLDKGEAGADYNVGGSIAYEMGDVLKQVIAACKRDDIVPEVDPALLRPTDEK
+ IIYGDCSKLAAITGWQQEICLTQTIADMFDYWRSKSESALMV"
+ gene 137357..137947
+ /gene="gmhA"
+ /locus_tag="BQ2027_MB0117"
+ CDS 137357..137947
+ /gene="gmhA"
+ /locus_tag="BQ2027_MB0117"
+ /note="Mb0117, gmhA, len: 196 aa. Equivalent to Rv0113,
+ len: 196 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 196 aa overlap). Probable gmhA
+ (alternate gene name: lpcA), phosphoheptose isomerase (EC
+ 5.-.-.-), similar to many e.g. AE0005|HPAE000596_11 from
+ Helicobacter pylori (192 aa), FASTA scores: opt: 451, E():
+ 1.9e-24, (45.1% identity in 162 aa overlap). BELONGS TO
+ THE SIS FAMILY, LPCA SUBFAMILY. Mb0117 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable sedoheptulose-7-phosphate isomerase
+ gmha (phosphoheptose isomerase)"
+ /protein_id="CAB5247819.1"
+ /translation="MCTARTAEEIFVETIAVKTRILNDRVLLEAARAIGDRLIAGYRA
+ GARVFMCGNGGSAADAQHFAAELTGHLIFDRPPLGAEALHANSSHLTAVANDYDYDTV
+ FARALEGSARPGDTLFAISTSGNSMSVLRAAKTARELGVTVVAMTGESGGQLAEFADF
+ LINVPSRDTGRIQESHIVFIHAISEHVEHALFAPRQ"
+ gene 137979..138551
+ /gene="gmhb"
+ /locus_tag="BQ2027_MB0118"
+ CDS 137979..138551
+ /gene="gmhb"
+ /locus_tag="BQ2027_MB0118"
+ /note="Mb0118, -, len: 190 aa. Equivalent to Rv0114, len:
+ 190 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 190 aa overlap). Possible dehydratase
+ (EC 4.-.-.-), similar to several hypothetical proteins and
+ to HIS7_ECOLI|P06987 imidazoleglycerol-phosphate
+ dehydratase (355 aa), FASTA scores: opt: 250, E():
+ 3.6e-11, (34.0 % identity in 141 aa overlap). Mb0118 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible d-alpha,beta-d-heptose-1,7-biphosphate
+ phosphatase gmhb (d-glycero-d-manno-heptose 7-phosphate
+ kinase)"
+ /protein_id="CAB5247820.1"
+ /translation="MVAERAGHQWCLFLDRDGVINRQVVGDYVRNWRQFEWLPGAARA
+ LKKLRAWAPYIVVVTNQQGVGAGLMSAVDVMVIHRHLQMQLASDGVLIDGFQVCPHHR
+ SQRCGCRKPRPGLVLDWLRRHPDSEPLLSIVVGDSLSDLELAHNVAAAAGACASVQIG
+ GASSGGVADASFDSLWEFAVAVGHARGERG"
+ gene 138702..139619
+ /gene="hdda"
+ /locus_tag="BQ2027_MB0119"
+ CDS 138702..139619
+ /gene="hdda"
+ /locus_tag="BQ2027_MB0119"
+ /note="Mb0119, -, len: 305 aa. Equivalent to Rv0115, len:
+ 386 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.5% identity in 275 aa overlap). Possible sugar kinase
+ (EC 2.-.-.-), similar to several hypothetical proteins and
+ sugar kinases e.g. AAK27850.1|AF324836_3
+ D-glycero-D-manno-heptose 7-phosphate kinase from
+ Aneurinibacillus thermoaerophilus (341 aa);
+ AAK80995.1|AE007802_11 Sugar kinase from Clostridium
+ acetobutylicum (364 aa). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a single base insertion (*-c) leads
+ to shorter product with a different COOH part compared to
+ its homolog in Mycobacterium tuberculosis strain H37Rv."
+ /codon_start=1
+ /transl_table=11
+ /product="possible d-alpha-d-heptose-7-phosphate kinase
+ hdda"
+ /protein_id="CAB5247821.1"
+ /translation="MRSPFARRTATEPARPRSTIWRLSKKTLPLHVAVYRRVIAEFNG
+ GTPFPLQLATQVDAPPGSGLGSSSALVVAMLLTTCALIGSSPGPYELARLAWEIERVD
+ LGMAGGWQDHYAAAFGGFNFMESRPNGEVVVNPLRIRREVIAELEASLLLYFGGVSRL
+ SSEVIADQQRNVVERDADALAATHSICAEALEMKDLLVVGDIPGFADSLLRGWQAKKR
+ TSTRISNPAIEHAYQVAQSSGMVAGKVSGAGGGGFLMMIVDPRRRIEVARSLERECGG
+ SVAPCLFTKGGAVTWHIPESTAPRKAWSC"
+ gene complement(140307..141062)
+ /gene="ldta"
+ /locus_tag="BQ2027_MB0120C"
+ CDS complement(140307..141062)
+ /gene="ldta"
+ /locus_tag="BQ2027_MB0120C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0120c, -, len: 251 aa. Equivalent to Rv0116c,
+ len: 251 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 251 aa overlap). Possible conserved
+ membrane protein, showing similarity to several
+ hypothetical mycobacterial proteins e.g. Rv1433 from
+ Mycobacterium tuberculosis (271 aa); and
+ Q49706|B1496_F2_81|U00013 from Mycobacterium leprae (271
+ aa); to the C-terminal regions of others like Rv0192 from
+ Mycobacterium tuberculosis (366 aa), FASTA scores: opt:
+ 451, E(): 1.7e-21, (46.7% identity in 270 aa overlap); and
+ Rv0192|Z97050|MTCI28_32 from Mycobacterium tuberculosis
+ cosmid (366 aa), FASTA scores: opt: 699, E(): 0, (45.7%
+ identity in 221 aa overlap). TBparse score is 0.932.
+ Protein product from Mb0120c detected using SWATH mass
+ spectrometry. Mb0120c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable l,d-transpeptidase ldta"
+ /protein_id="CAB5247822.1"
+ /translation="MRRVVRYLSVVVAITLMLTAESVSIATAAVPPLQPIPGVASVSP
+ ANGAVVGVAHPVVVTFTTPVTDRRAVERSIRISTPHNTTGHFEWVASNVVRWVPHRYW
+ PPHTRVSVGVQELTEGFETGDALIGVASISAHTFTVSRNGEVLRTMPASLGKPSRPTP
+ IGSFHAMSKERTVVMDSRTIGIPLNSSDGYLLTAHYAVRVTWSGVYVHSAPWSVNSQG
+ YANVSHGCINLSPDNAAWYFDAVTVGDPIEVVG"
+ gene 141240..142184
+ /gene="oxyS"
+ /locus_tag="BQ2027_MB0121"
+ CDS 141240..142184
+ /gene="oxyS"
+ /locus_tag="BQ2027_MB0121"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0121, oxyS, len: 314 aa. Equivalent to Rv0117,
+ len: 314 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 314 aa overlap). OxyS, oxidative
+ stress response protein regulatory protein, LysR family
+ (see citation below). Similar to many transcription
+ regulators and OxyR, the oxidative stress response protein
+ of many bacteria. Contains LysR family signature at
+ N-terminus. Also contains helix-turn-helix motif at aa
+ 16-37 (Score 1543, +4.44 SD). BELONGS TO THE LYSR FAMILY
+ OF TRANSCRIPTIONAL REGULATORS. OXYR IS REQUIRED FOR THE
+ INDUCTION OF A REGULON OF HYDROGEN PEROXIDE INDUCIBLE
+ GENES SUCH AS CATALASE, GLUTATHIONE-REDUCTASE, ETC.
+ Protein product from Mb0121 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0121 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="OXIDATIVE STRESS RESPONSE REGULATORY PROTEIN
+ OXYS"
+ /protein_id="CAB5247823.1"
+ /translation="MLFRQLEYFVAVAQERHFARAAEKCYVSQPALSSAIAKLERELN
+ VTLINRGHSFEGLTREGERLVVWAKRILAEHAAFKAEVDAVRSGITGTLRLGTVPTAS
+ TTASLVLSAFCSAHPLAKVQVCSRLAATELYRRLREFELDAVIVHPETQDSDDVDLVP
+ LYEEQYVLLSPADMLPPGTSTLVWRDAAQLPLALLTADMRDRQVIDAAFADHAVSAIP
+ QVETDSVASLFAQVATGNWASIVPHTWLWAMPMSGPTGGEIRAVELVDPVLKAQIALA
+ TNALGPGSPVARALITCAQALALNEFFDTQLRGITRRR"
+ gene complement(142168..143916)
+ /gene="oxcA"
+ /locus_tag="BQ2027_MB0122C"
+ CDS complement(142168..143916)
+ /gene="oxcA"
+ /locus_tag="BQ2027_MB0122C"
+ /note="Mb0122c, oxcA, len: 582 aa. Equivalent to Rv0118c,
+ len: 582 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 582 aa overlap). Probable oxcA,
+ oxalyl-CoA decarboxylase (EC 4.1.1.8), highly similar to
+ many e.g.
+ P78093|OXC_ECOLI|7449483|B65011|YFDU|B2373|Z3637|ECS325
+ PROBABLE OXALYL-CoA DECARBOXYLASE from Escherichia coli
+ (564 aa); M77128|OXAOXA_1 oxalyl-CoA decarboxylase from
+ Oxalobacter formigenes (568 aa), FASTA scores: opt: 2124,
+ E():0, (55.6% identity in 568 aa overlap). Also similar to
+ mycobacterial IlvB proteins e.g. MLCB1788.46c unknown
+ TPP-requiring enzyme from Mycobacterium leprae (548 aa);
+ and AL0086|MLCB1788_19 from Mycobacterium leprae (548 aa),
+ FASTA scores: opt: 831, E(): 0, (33.9% identity in 567 aa
+ overlap). Protein product from Mb0122c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXALYL-COA DECARBOXYLASE OXCA"
+ /protein_id="CAB5247824.1"
+ /translation="MTTRSASPCTVLTDGCHLVVDALKANDVDTIYGVVGIPITDLAR
+ AAQASGIRYIGFRHEASAGNAAAAAGFLTARPGVCLTTSGPGFLNGLPALANATTNCF
+ PMIQISGSSSRPMVDLQRGDYQDLDQLNAARPFVKAAYRIGQVQDIGRGVARAIRTAT
+ SGRPGGVYLDIPGDVLGQAVEASAASGAIWRPVDPAPRLLPAPEAIDRALDVLAQAQR
+ PLLVLGKGAAYAQADNVIREFVEHTGIPFLPMSMAKGLLPDSHPQSAAAARSLAMARA
+ DVVLLVGARLNWLLGNGESPQWSADAKFIQVDIEASEFDSNRPIVAPLTGDIGSVMSA
+ LLEAAADRSSVASAAWTGELADRKARNSAKMRRRLADDHHPMRFYNALGAIRSVLQRN
+ PDVYVVNEGANALDLARNIIDMHLPRHRLDSGTWGVMGIGMGYAIAAAVETGRPVVAI
+ EGDSAFGFSGMEFETICRYRLPVTVVILNNGGVYRGDEATIFRSAAPVWRHDPAPTVL
+ NAHARHELIAEAFGGKGYHVSTPTELESALTDALASNGPSLIDCELDPADGVESGHLA
+ KLNTTSAATPAISGDG"
+ gene 144089..145666
+ /gene="fadD7"
+ /locus_tag="BQ2027_MB0123"
+ CDS 144089..145666
+ /gene="fadD7"
+ /locus_tag="BQ2027_MB0123"
+ /note="Mb0123, fadD7, len: 525 aa. Equivalent to Rv0119,
+ len: 525 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 525 aa overlap). Probable fadD7,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), similar to
+ 4-coumarate:CoA ligase of many organisms e.g.
+ U39405|PTU39405_1 4-coumarate:CoA ligase from Pinus
+ taedaxylem (537 aa), FASTA scores: opt: 483, E(): 8.3e-22,
+ (28.2% identity in 440 aa overlap). Contains PS00455
+ Putative AMP-binding domain signature. TBscore is 0.896.
+ Protein product from Mb0123 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY-ACID-COA LIGASE FADD7
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="CAB5247825.1"
+ /translation="MASDFGPRIADLVEVAATRLPEAPALVVTADRIAISHRDLARLV
+ DELAGQLTRSGLLPGDRVALRMGSNAEFVVALLAASRADLVVVPLDPALPITEQRVRS
+ QAAGARVVLIDADGPHDRAEPTTRWWPLTVNVGGDSGPSGGTLSVHLDAATEPNPATS
+ TPEGLRPDDAMIMFTGGTTGLPKMVPWTHANIASSVRAIITGYRLSPRDATVAVMPLY
+ HGHGLIASLLATLASGGAVSLPARGRFSAHTFWDDIKAVGATWYTAVPTIHQILLERS
+ ATEPSGRKPAALRFIRSCSAPLTAQAALALQTEFAAPVVCAFGMTEATHQVTTTQIEG
+ IDQTETPVVSTGLVGRSTGAQIRIVGSDGLPLPAGAVGEIWLRGTTVVRGYLGDPTIT
+ AANFTDGWLRTGDLGSLSAAGDLSIRGRIKELINRGGEKISPERVEGVLASHPNVMEA
+ AVFGVPHQLYGEAVAAVIVPRESAPPTREELVQFCRERLAAFEIPASFQEASGLPHTA
+ KGSLDRRAVAERFGHSV"
+ gene complement(145667..147460)
+ /gene="fusA2b"
+ /locus_tag="BQ2027_MB0124C"
+ CDS complement(145667..147460)
+ /gene="fusA2b"
+ /locus_tag="BQ2027_MB0124C"
+ /standard_name="fus2"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0124c, fusA2b, len: 597 aa. Equivalent to 3' end
+ of Rv0120c, len: 714 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 597 aa overlap). Probable
+ fusA2 (alternate gene name: fus2), elongation factor G,
+ highly similar to others e.g. EFG_ECOLI|P02996 elongation
+ factor G (ef-g) from Escherichia coli (703 aa), FASTA
+ scores: opt: 1049, E(): 0, (32.5% identity in 717 aa
+ overlap). Also similar to fusA1|MTCY210.01 from
+ Mycobacterium tuberculosis FASTA score: (39.1% identity in
+ 299 aa overlap); and P30767|EFG_MYCLE ELONGATION FACTOR G
+ (EF-G) from Mycobacterium leprae (701 aa), FASTA score:
+ (31.7% identity in 710 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ GTP-BINDING ELONGATION FACTOR FAMILY, EF-G/EF-2 SUBFAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, fusA2 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a 2bp to 1bp
+ substitution (gc-t), splits fusA2 into 2 parts, fusA2a and
+ fusA2b. Protein product from Mb0124c detected using SWATH
+ mass spectrometry. Mb0124c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ELONGATION FACTOR G FUSA2B [SECOND
+ PART] (EF-G)"
+ /protein_id="CAB5247826.1"
+ /translation="MIAANEGVDEPTKSLWQECSQVGMPRAVVITKLDHARANYREAL
+ TAAQDAFGDKVLPLYLPSGDGLIGLLSQALYEYADGKRTTRTPAESDTERIEEARGAL
+ IEGIIEESEDESLMERYLGGETIDESVLIQDLEKAVARGSFFPVIPVCSSTGVGTLEL
+ LEVATRGFPSPMEHPLPEVFTPQGVPHAELACDNDAPLLAEVVKTTSDPYVGRVSLVR
+ VFSGTIRPDTTVHVSGHFSSFFGGGTSNTHPDHDEDERIGVLSFPLGKQQRPAAAVVA
+ GDICAIGKLSRAETGDTLSDKAEPLVLKPWTMPEPLLPIAIAAHAKTDEDKLSVGLGR
+ LAAEDPTLRIEQNQETHQVVLWCMGEAHAGVVLDTLANRYGVSVDTIELRVPLRETFA
+ GNAKGHGRHIKQSGGHGQYGVCDIEVEPLPEGSGFEFLDKVVGGAVPRQFIPSVEKGV
+ RAQMDKGVHAGYPVVDIRVTLLDGKAHSVDSSDFAFQMAGALALREAAAATKVILLEP
+ IDEISVLVPDDFVGAVLGDLSSRRGRVLGTETAGHDRTVIKAEVPQVELTRYAIDLRS
+ LAHGAASFTRSFARYEPMPESAAARVKAGAG"
+ gene complement(147457..147810)
+ /gene="fusA2a"
+ /locus_tag="BQ2027_MB0125C"
+ CDS complement(147457..147810)
+ /gene="fusA2a"
+ /locus_tag="BQ2027_MB0125C"
+ /standard_name="fus2"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0125c, fusA2a, len: 117 aa. Equivalent to 5' end
+ of Rv0120c, len: 714 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (98.1% identity in 108 aa overlap). Probable
+ fusA2 (alternate gene name: fus2), elongation factor G,
+ highly similar to others e.g. EFG_ECOLI|P02996 elongation
+ factor G (ef-g) from Escherichia coli (703 aa), FASTA
+ scores: opt: 1049, E(): 0, (32.5% identity in 717 aa
+ overlap). Also similar to fusA1|MTCY210.01 from
+ Mycobacterium tuberculosis FASTA score: (39.1% identity in
+ 299 aa overlap); and P30767|EFG_MYCLE ELONGATION FACTOR G
+ (EF-G) from Mycobacterium leprae (701 aa), FASTA score:
+ (31.7% identity in 710 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ GTP-BINDING ELONGATION FACTOR FAMILY, EF-G/EF-2 SUBFAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, fusA2 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to the
+ substitution of a single base (gc-t), splits fusA2 into 2
+ parts, fusA2a and fusA2b. Protein product from Mb0125c
+ detected using shotgun mass spectrometry. Mb0125c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ELONGATION FACTOR G FUSA2A [FIRST PART]
+ (EF-G)"
+ /protein_id="CAB5247827.1"
+ /translation="MADRVNASQGAAAAPTANGPGGVRNVVLVGPSGGGKTTLIEALL
+ VAAKVLSRPGSVTEGTTVCDFDEAEIRQQRSVGLAVASLAYDGIKVNLVDTPGYADFV
+ GELWPGCGPPIAHCS"
+ gene complement(147946..148380)
+ /locus_tag="BQ2027_MB0126C"
+ CDS complement(147946..148380)
+ /locus_tag="BQ2027_MB0126C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0126c, -, len: 144 aa. Equivalent to Rv0121c,
+ len: 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 144 aa overlap). Conserved
+ hypothetical protein, showing some similarity with others
+ proteins from Mycobacterium tuberculosis e.g. Rv1155,
+ Rv1875, Rv2074, etc. Protein product from Mb0126c detected
+ using SWATH mass spectrometry. Mb0126c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Pyridoxamine 5-phosphate oxidase"
+ /protein_id="CAB5247828.1"
+ /translation="MGEFDPKLRFAQSPVARLATSTPDGTPHLVPVVFALGARRPAEA
+ TGADVIYTAVDAKRKTTQRLRRLANLEHNPRASVLVDSYADDWTQLWWVRADGVAAIH
+ RDGEVMRAAYRLLRAKYAQYQSVPLNGPVIAIAVQRWASWHA"
+ gene 148529..148897
+ /locus_tag="BQ2027_MB0127"
+ CDS 148529..148897
+ /locus_tag="BQ2027_MB0127"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0127, -, len: 122 aa. Equivalent to Rv0122, len:
+ 122 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 122 aa overlap). Hypothetical unknown
+ protein. Mb0127 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247829.1"
+ /translation="MAGSVSAAAGIGWVGLNVTETNRDQCYRVERTTVDALTHPEYRV
+ HTRGVQRVRVTRNARKHRVSKHRIVAAMRHCGVPVIQEDGSLYYQGRDTSGRLTEVVA
+ VEADDGDLIITHAMPKEWKR"
+ gene 148894..149262
+ /locus_tag="BQ2027_MB0128"
+ CDS 148894..149262
+ /locus_tag="BQ2027_MB0128"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0128, -, len: 122 aa. Equivalent to Rv0123, len:
+ 122 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 122 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0128 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="CAB5247830.1"
+ /translation="MTKKPRNPADYVIGDDVEVSDVDLKQEEVYVDGERLTDERVEQM
+ ASESLRLAREREANLIPGGKSLSGGSAHSPAVQVVVSKATHAKLKELARSRKMSVSKL
+ LRPVLDEFVQRETGRILPRR"
+ gene 149571..151187
+ /gene="PE_PGRS2"
+ /locus_tag="BQ2027_MB0129"
+ CDS 149571..151187
+ /gene="PE_PGRS2"
+ /locus_tag="BQ2027_MB0129"
+ /note="Mb0129, PE_PGRS2, len: 538 aa. Similar to Rv0124,
+ len: 487 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (87.4% identity in 547 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family, PGRS subfamily of
+ gly-rich proteins, highly similar to many e.g.
+ Y0DP_MYCTU|Q50615 from Mycobacterium tuberculosis (498
+ aa), FASTA scores: opt: 1730, E(): 0, (60.7% identity in
+ 504 aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 180 bp insertion leads to a longer
+ product in the 3' direction compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (538 aa versus 487
+ aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs2"
+ /protein_id="CAB5247831.1"
+ /translation="MSFVSVAPEIVVAAATDLAGIGSAISAANAAAAAPTTAVLAAGA
+ DEVSAAIAALFSGHAQAYQALSAQAAAFHQQFVQTLAGGAGAYAAAEAQVEQQLLAAI
+ NAPTQALLGRPLIGNGADGAPGTGQAGGAGGILYGNGGNGGSGAAGQAGGAGGPAGLI
+ GHGGSGGAGGHGGWLWGNGGVGGSGGAGVGAGVAGGHGGAGGAAGLWGAGGGGGNGGN
+ GADANIVSGGDGGLGGAGGGGGWLYGDGGAGGHGGQGAIGLGGGAGGDGGQGGAGRGL
+ WGTGGAGGHGGQGGGTGGPPLPGQAGMGAAGGAGGLIGNGGAGGDGGVGASGGVAGVG
+ GAGGNAMLIGHGGAGGAGGDSSFANGAAGGAGGAGGHLFGNGGSGGHGGAVTAGNTGI
+ GGAGGVGGDARLIGHGGAGGAGGDRAGALVGRDGGPGGNGGAGGQLYGNGGDGGPGGQ
+ GGQAFGANNIGGTGGAGGNGGPAILSGNGGNGGAGGAGGAGGAGGGAGGVGGAGGAPG
+ TGGTLQAAVSGLVTALFGAPGQPGDTGQPG"
+ gene 151339..152406
+ /gene="pepA"
+ /locus_tag="BQ2027_MB0130"
+ CDS 151339..152406
+ /gene="pepA"
+ /locus_tag="BQ2027_MB0130"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0130, pepA, len: 355 aa. Equivalent to Rv0125,
+ len: 355 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 355 aa overlap). Probable pepA, serine
+ protease (EC 3.4.21.-), highly similar to other proteases
+ e.g. HHOB_ECOLI|P31137 protease hhob precursor (355 aa),
+ FASTA scores: opt: 400, E(): 3.8e-14, (32.4% identity in
+ 346 aa overlap). Also similar to Q50320 34 KDA protein
+ precursor from Mycobacterium tuberculosis (361 aa), FASTA
+ scores: opt: 1689, E(): 0, (70.7% identity in 362 aa
+ overlap). Contains PS00135 Serine proteases, trypsin
+ family, serine active site. Has a possible signal sequence
+ at the N-terminus. Protein product from Mb0130 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0130 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable serine protease pepa (serine
+ proteinase) (mtb32a)"
+ /protein_id="CAB5247832.1"
+ /translation="MSNSRRRSLRWSWLLSVLAAVGLGLATAPAQAAPPALSQDRFAD
+ FPALPLDPSAMVAQVGPQVVNINTKLGYNNAVGAGTGIVIDPNGVVLTNNHVIAGATD
+ INAFSVGSGQTYGVDVVGYDRTQDVAVLQLRGAGGLPSAAIGGGVAVGEPVVAMGNSG
+ GQGGTPRAVPGRVVALGQTVQASDSLTGAEETLNGLIQFDAAIQPGDSGGPVVNGLGQ
+ VVGMNTAASDNFQLSQGGQGFAIPIGQAMAIAGQIRSGGGSPTVHIGPTAFLGLGVVD
+ NNGNGARVQRVVGSAPAASLGISTGDVITAVDGAPINSATAMADALNGHHPGDVISVT
+ WQTKSGGTRTGNVTLAEGPPA"
+ gene 152515..154320
+ /gene="treS"
+ /locus_tag="BQ2027_MB0131"
+ CDS 152515..154320
+ /gene="treS"
+ /locus_tag="BQ2027_MB0131"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0131, treS, len: 601 aa. Equivalent to Rv0126,
+ len: 601 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 601 aa overlap). treS, trehalose
+ synthase (EC 5.4.99.-) (see citation below), highly
+ similar to others e.g. CAA04601.2|AJ001205 putative
+ trehalose synthase from Streptomyces coelicolor (566 aa);
+ S71450|1536814|BAA11303.1|D78198 trehalose synthase
+ maltose-specific from Pimelobacter sp. strain R48 (573
+ aa). Also similar to MAL1_DROME|P07191 possible maltase
+ precursor (508 aa), FASTA scores: opt: 807, E(): 0, (33.7%
+ identity in 504 aa overlap); and similar to proteins
+ associated with amino-acid transport e.g. Q64319 rat
+ protein which stimulates transport of cystine and dibasic
+ and neutral amino acids (683 aa), FASTA scores: opt: 839,
+ E(): 0, (32.0% identity in 531 aa overlap). Also similar
+ to several other Mycobacterium tuberculosis proteins e.g.
+ Rv2471 FASTA score: (31.7% identity in 164 aa overlap).
+ Protein product from Mb0131 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0131 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="TREHALOSE SYNTHASE TRES"
+ /protein_id="CAB5247833.1"
+ /translation="MNEAEHSVEHPPVQGSHVEGGVVEHPDAKDFGSAAALPADPTWF
+ KHAVFYEVLVRAFFDASADGSGDLRGLIDRLDYLQWLGIDCIWLPPFYDSPLRDGGYD
+ IRDFYKVLPEFGTVDDFVALVDAAHRRGIRIITDLVMNHTSESHPWFQESRRDPDGPY
+ GDYYVWSDTSERYTDARIIFVDTEESNWSFDPVRRQFYWHRFFSHQPDLNYDNPAVQE
+ AMIDVIRFWLGLGIDGFRLDAVPYLFEREGTNCENLPETHAFLKRVRKVVDDEFPGRV
+ LLAEANQWPGDVVEYFGDPNTGGDECHMAFHFPLMPRIFMAVRRESRFPISEIIAQTP
+ PIPDMAQWGIFLRNHDELTLEMVTDEERDYMYAEYAKDPRMKANVGIRRRLAPLLDND
+ RNQIELFTALLLSLPGSPVLYYGDEIGMGDVIWLGDRDGVRIPMQWTPDRNAGFSTAN
+ PGRLYLPPSQDPVYGYQAVNVEAQRDTSTSLLNFTRTMLAVRRRHPAFAVGAFQELGG
+ SNPSVLAYVRQVAGDDGDTVLCVNNLSRFPQPIELDLQQWTNYTPVELTGHVEFPRIG
+ QVPYLLTLPGHGFYWFQLTTHEVGAPPTCGGERRL"
+ gene 154423..155790
+ /gene="mak"
+ /locus_tag="BQ2027_MB0132"
+ CDS 154423..155790
+ /gene="mak"
+ /locus_tag="BQ2027_MB0132"
+ /note="Mb0132, -, len: 455 aa. Equivalent to Rv0127, len:
+ 455 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 455 aa overlap). Conserved hypothetical
+ protein, highly similar to various proteins e.g.
+ AJ0012|SCJ001205_4 hypothetical protein from Streptomyces
+ coelicolor A3(2) (464 aa), FASTA scores: opt: 412, E():
+ 1.1e-19, (40.6% identity in 485 aa overlap);
+ AJ0012|SCJ001206_5 hypothetical protein from Streptomyces
+ coelicolor A3(2) (453 aa), FASTA scores: opt: 403, E():
+ 4.3 e-19, (36.5% identity in 455 aa overlap). Protein
+ product from Mb0132 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0132 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="maltokinase mak"
+ /protein_id="CAB5247834.1"
+ /translation="MTRSDTLATKLPWSDWLPRQRWYAGRNRELATVKPGVVVALRHN
+ LDLVLVDVTYTDGATERYQVLVGWDFEPASEYGTKAAIGVADDRTGFDALYDVAGPQF
+ LLSLIVSSAVCGTSTGEVTFTREPDVELPFAAQPRVCDAEQSNTSVIFDRRAILKVFR
+ RVSSGINPDIELNRVLTRAGNPHVARLLGAYQFGRPNRSPTDALAYALGMVTEYEANA
+ AEGWAMATASVRDLFAEGDLYAHEVGGDFAGESYRLGEAVASVHATLADSLGTAQATF
+ PVDRMLARLSSTVAVVPELREYAPTIEQQFQKLAAEAITVQRVHGDLHLGQVLRTPES
+ WLLIDFEGEPGQPLDERRAPDSPLRDVAGVLRSFEYAAYGPLVDQATDKQLAARAREW
+ VERNRAAFCDGYAVASGIDPRDSALLLGAYELDKAVYETGYETRHRPGWLPIPLRSIA
+ RLTAS"
+ gene 155858..156637
+ /locus_tag="BQ2027_MB0133"
+ CDS 155858..156637
+ /locus_tag="BQ2027_MB0133"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0133, -, len: 259 aa. Equivalent to Rv0128, len:
+ 259 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 259 aa overlap). Probable conserved
+ transmembrane protein, with some similarity to Rv3064c and
+ other bacterial proteins e.g.
+ AAK85977.1|AE007957|AGR_C_254p from Agrobacterium
+ tumefaciens (206 aa). Mb0133 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247835.1"
+ /translation="MQREIYDGEARLSWVLAALAGILGATAFTHSAGYFVTFMTGNSQ
+ RAVLGLFGDDAWMSVTASLLILFFVAGVVIASVCRRHFWAAHPHGPTVLTTFSLIFAA
+ GVDIMLGGWHESMLDFVPILFVVFGIGALNTSFVKDGEVSVPLSYVTGTLVKMGQGIE
+ RHLAGGKVEDWLGYFLLHASFVLGAAAGGAISMVVTGPQMLAVAAVVCAATTGYTYLH
+ ADRRGLVNQKRPQPGKRLFRALRRGELDSGTSTPATNYGSS"
+ gene complement(156769..157791)
+ /gene="fbpC"
+ /locus_tag="BQ2027_MB0134C"
+ CDS complement(156769..157791)
+ /gene="fbpC"
+ /locus_tag="BQ2027_MB0134C"
+ /standard_name="mpt45; 85C; fbpC2"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0134c, fbpC, len: 340 aa. Equivalent to Rv0129c,
+ len: 340 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 340 aa overlap). fbpC (alternate gene
+ names: mpt45, 85C, fbpC2), secreted antigen 85c
+ (fibronectin-binding protein C) (mycolyl transferase 85C)
+ (EC 2.3.1.-) (see citations below), also highly similar to
+ other Mycobacterial antigen precursors e.g.
+ A85C_MYCLE|Q05862 antigen 85-c precursor (85c) from
+ Mycobacterium leprae (333 aa), FASTA scores: opt: 1937,
+ E(): 0, (81.4% identity in 333 aa overlap); etc. Protein
+ product from Mb0134c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0134c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="SECRETED ANTIGEN 85-C FBPC (85C) (ANTIGEN 85
+ COMPLEX C) (AG58C) (MYCOLYL TRANSFERASE 85C)
+ (FIBRONECTIN-BINDING PROTEIN C)"
+ /protein_id="CAB5247836.1"
+ /translation="MTFFEQVRRLRSAATTLPRRLAIAAMGAVLVYGLVGTFGGPATA
+ GAFSRPGLPVEYLQVPSASMGRDIKVQFQGGGPHAVYLLDGLRAQDDYNGWDINTPAF
+ EEYYQSGLSVIMPVGGQSSFYTDWYQPSQSNGQNYTYKWETFLTREMPAWLQANKGVS
+ PTGNAAVGLSMSGGSALILAAYYPQQFPYAASLSGFLNPSEGWWPTLIGLAMNDSGGY
+ NANSMWGPSSDPAWKRNDPMVQIPRLVANNTRIWVYCGNGTPSDLGGDNIPAKFLEGL
+ TLRTNQTFRDTYAADGGRNGVFNFPPNGTHSWPYWNEQLVAMKADIQHVLNGATPPAA
+ PAAPAA"
+ gene 158038..158493
+ /gene="htdz"
+ /locus_tag="BQ2027_MB0135"
+ CDS 158038..158493
+ /gene="htdz"
+ /locus_tag="BQ2027_MB0135"
+ /note="Mb0135, -, len: 151 aa. Equivalent to Rv0130, len:
+ 151 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 151 aa overlap). Conserved
+ hypothetical protein, most similar to AL096811|SCI30A_19
+ from Streptomyces coelicolor (153 aa), FASTA scores: opt:
+ 639, E(): 0, (60.8% identity in 148 aa overlap). Also
+ similar to NODN_RHILV|P08634 nodulation protein from
+ Rhizobium leguminosarum bv. viciae plasmid pRL1JI (161
+ aa), FASTA scores: opt: 406, E(): 1e-21, (43.9% identity
+ in 148 aa overlap; and to O30041 MONOAMINE OXIDASE
+ REGULATORY PROTEIN (146 aa), FASTA scores: opt: 219, E():
+ 1.1e-08, (30.8% identity in 133 aa overlap). Protein
+ product from Mb0135 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0135 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable 3-hydroxyl-thioester dehydratase"
+ /protein_id="CAB5247837.1"
+ /translation="MRTFESVADLAAAAGEKVGQSDWVTITQEEVNLFADATGDHQWI
+ HVDPERAAAGPFGTTIAHGFMTLALLPRLQHQMYTVKGVKLAINYGLNKVRFPAPVPV
+ GSRVRATSSLVGVEDLGNGTVQATVSTTVEVEGSAKPACVAESIVRYVA"
+ gene complement(158506..159849)
+ /gene="fadE1"
+ /locus_tag="BQ2027_MB0136C"
+ CDS complement(158506..159849)
+ /gene="fadE1"
+ /locus_tag="BQ2027_MB0136C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0136c, fadE1, len: 447 aa. Equivalent to Rv0131c,
+ len: 447 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 447 aa overlap). Probable fadE1,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), similar to many e.g.
+ ACDS_HUMAN|P16219 acyl-CoA dehydrogenase short-chain
+ specific precursor (412 aa), FASTA scores: opt: 522, E():
+ 1.4e-23, (30.1% identity in 425 aa overlap). Also highly
+ similar to MTCI5_28 from Mycobacterium tuberculosis.
+ Protein product from Mb0136c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0136c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-CoA DEHYDROGENASE FADE1"
+ /protein_id="CAB5247838.1"
+ /translation="MPVRRRAGERLPTVWDFETDPQYQSKLDWVEKFMAEELEPLDLV
+ ALDPYDKKNADTMAILRPLQRQVKDQGLWAAHLRPELGGQGFGQVKLALLNEIIGRSR
+ WAPSAFGCQAPDSGNAEILALFGTDEQKARYLRPLLDGEITSCYSMTEPQGGSDPGLF
+ VTAATRDAAGNGDWIINGEKWFSTNAKHASFFIVMAVTKPEARTYEKMSLFIVPADTP
+ GIEIVRNVGVGAESTRHASHGYIRYHDVRVPADHVLGGEGQAFMIAQTRLGGGRIHHA
+ MRTIALARRAFDMMCERALSRQTRHGRLADLQMTQEKIADSWIQIEQFRLLVLRTAWL
+ IDKHHDYQKVRRDIAAVKVAMPQVLHDVVQRAMHLHGALGVSDEMPFVKMMLAAESLG
+ IADGATELHKMTVARRTLREYQPVTTLFPSQHIPTRRAHAEAWLAQRLEHAIAEF"
+ gene complement(159891..160973)
+ /gene="fgd2"
+ /locus_tag="BQ2027_MB0137C"
+ CDS complement(159891..160973)
+ /gene="fgd2"
+ /locus_tag="BQ2027_MB0137C"
+ /note="Mb0137c, fgd2, len: 360 aa. Equivalent to Rv0132c,
+ len: 360 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 360 aa overlap). Putative fgd2,
+ F420-dependent glucose-6-phosphate dehydrogenase (EC
+ 1.-.-.-), highly similar to many from Mycobacteria e.g.
+ AAD38167|g5031431 from Mycobacterium chelonae. Also
+ similar to MJ1534|Q58929 N5,N10-METHYLENE
+ TETRAHYDROMETHANOPTERIN REDUCTASE from METHANOCOCCUS
+ JANNASCHII (342 aa), FASTA scores: opt: 285, E(): 7.9e-11,
+ (28.4% identity in 292 aa overlap). And also similar to
+ Rv0953c, Rv0791c, etc from Mycobacterium tuberculosis.
+ Contains PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Mb0137c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative f420-dependent glucose-6-phosphate
+ dehydrogenase fgd2"
+ /protein_id="CAB5247839.1"
+ /translation="MTGISRRTFGLAAGFGAIGAGGLGGGCSTRSGPTPTPEPASRGV
+ GVVLSHEQFRTDRLVAHAQAAEQAGFRYVWASDHLQPWQDNEGHSMFPWLTLALVGNS
+ TSSILFGTGVTCPIYRYHPATVAQAFASLAILNPGRVFLGLGTGKRLNEQAATDTFGN
+ YRERHDRLIEAIVLIRQLWSGERISFTGHYFRTDELKLYDTPAMPPPIFVAASGPQSA
+ TLAGRYGDGWIAQARDINDAKLLAAFAAGAQAAGRDPTTLGKRAELFAVVGDDKAAAR
+ AADLWRFTAGAVDQPNPVEIQRAAESNPIEKVLANWAVGTDPGVHIGAVQAVLDAGAV
+ PFLHFPQDDPITAIDFYRTNVLPELR"
+ gene 161060..161665
+ /locus_tag="BQ2027_MB0138"
+ CDS 161060..161665
+ /locus_tag="BQ2027_MB0138"
+ /note="Mb0138, -, len: 201 aa. Equivalent to Rv0133, len:
+ 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 201 aa overlap). Putative
+ acetyltransferase (EC 2.3.1.-), highly similar to others
+ e.g. PUAC_STRLP|P13249 puromycyn N-acetyltransferase (199
+ aa), FASTA scores: opt: 341, E(): 1.8e-16, (33.3% identity
+ in 201 aa overlap). Protein product from Mb0138 detected
+ using SWATH mass spectrometry. Mb0138 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="gcn5-related n-acetyltransferase"
+ /protein_id="CAB5247840.1"
+ /translation="MTPQARPARRADVRELSRTMARAFYDDPFMSWLLSNDNARTARL
+ TRLFATIVRHQHLAGGGVEVARGAAGIGGAALWDPPDRWRESRRQQLAMTPGFLRVFG
+ FRTAKARAALDVMMRVHPEEPHWYLAAIGSDPTVRGQGFGQVLMRSRLDRCDAEHCPA
+ YLESTKPENVPYYQRFGFRVTREIALPDAGPPLWAMWREPR"
+ gene 161962..162345
+ /locus_tag="BQ2027_MB0139-1"
+ /pseudo
+ CDS 161962..162345
+ /locus_tag="BQ2027_MB0139-1"
+ /note="Mb0139-1, -, len: 128 aa. Pseudogene part1 of
+ Rv0134 / ephF Protein product from Mb0139-1 detected using
+ SWATH mass spectrometry. Mb0139-1 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene 162345..162452
+ /locus_tag="BQ2027_MB0139-2"
+ /pseudo
+ CDS 162345..162452
+ /locus_tag="BQ2027_MB0139-2"
+ /note="Mb0139-2, -, len: 36 aa. Pseudogene part2 of Rv0134
+ / ephF,Mb0139-2 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene 162454..162693
+ /locus_tag="BQ2027_MB0139-3"
+ /pseudo
+ CDS 162454..162693
+ /locus_tag="BQ2027_MB0139-3"
+ /note="Mb0139-3, -, len: 80 aa. Pseudogene part3 of Rv0134
+ / ephF,Mb0139-3 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene 162696..162863
+ /locus_tag="BQ2027_MB0139-4"
+ /pseudo
+ CDS 162696..162863
+ /locus_tag="BQ2027_MB0139-4"
+ /note="Mb0139-4, -, len: 55 aa. Pseudogene part4 of Rv0134
+ / ephF. Mb0139-4 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene complement(162834..163439)
+ /locus_tag="BQ2027_MB0140C"
+ CDS complement(162834..163439)
+ /locus_tag="BQ2027_MB0140C"
+ /note="Mb0140c, -, len: 201 aa. Equivalent to Rv0135c,
+ len: 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 201 aa overlap). Possible
+ transcriptional regulator, weakly similar to others e.g.
+ P32398|YHGD_BACSU HYPOTHETICAL TRANSCRIPTIONAL REGULATOR
+ from Bacillus subtilis (191 aa), FASTA scores: opt: 145,
+ E(): 0.0012, (21.0% identity in 162 aa overlap). Protein
+ product from Mb0140c detected using SWATH mass
+ spectrometry. Mb0140c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5247845.1"
+ /translation="MTAVAAGALVVETDSFRLRLLDGLVASIGERGYRATTVSDIVRH
+ ARTSKRTFYDRFTSKEQCFLELLLADNETLGNSIRAAVDPNADWHDQIRQAVEAYVTH
+ IESRPAVTLSWIREFPSLGAAAYPVQRRGMEQLTSLLIELSASPGFRRANLPPLNVPL
+ AVILLGGLRELTALTVEDGQPIRNIVEPAVDASIALLGPRS"
+ gene 163556..164881
+ /gene="cyp138"
+ /locus_tag="BQ2027_MB0141"
+ CDS 163556..164881
+ /gene="cyp138"
+ /locus_tag="BQ2027_MB0141"
+ /note="Mb0141, cyp138, len: 441 aa. Equivalent to Rv0136,
+ len: 441 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 441 aa overlap). Probable cyp138,
+ cytochrome P450 138 (EC 1.14.-.-), similar to others e.g.
+ SLR0574|Q59990 from SYNECHOCYSTIS SP. (444 aa), FASTA
+ scores: opt: 315, E(): 1e-13, (25.7% identity in 416 aa
+ overlap); etc. Also similar to MTV039_6 from Mycobacterium
+ tuberculosis (472 aa), FASTA score: (38.2% identity in 442
+ aa overlap). Contains PS00017 ATP/GTP-binding site motif A
+ (P-loop); and PS00086 Cytochrome P450 cysteine heme-iron
+ ligand signature. BELONGS TO THE CYTOCHROME P450 FAMILY.
+ Protein product from Mb0141 detected using SWATH mass
+ spectrometry. Mb0141 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CYTOCHROME P450 138 CYP138"
+ /protein_id="CAB5247846.1"
+ /translation="MSEVVTAAPAPPVVRLPPAVRGPKLFQGLAFVVSRRRLLGRFVR
+ RYGKAFTANILMYGRVVVVADPQLARQVFTSSPEELGNIQPNLSRMFGSGSVFALDGD
+ DHRRRRRLLAPPFHGKSMKNYETIIEEETLRETANWPQGQAFATLPSMMHITLNAILR
+ AIFGAGGSELDELRRLIPPWVTLGSRLAALPKPKRDYGRLSPWGRLAEWRRQYDTVID
+ KLIEAERADPNFADRTDVLALMLRSTYDDGSIMSRKDIGDELLTLLAAGHETTAATLG
+ WAFERLSRHPDVLAALVEEVDNGGHELRQAAILEVQRARTVIDFAARRVNPPVYQLGE
+ WVIPRGYSIIINIAQIHGDPDVFPQPDRFDPQRYIGSKPSPFAWIPFGGGTRRCVGAA
+ FANMEMDVVLRTVLRHFTLETTTAAGERSHGRGVAFTPKDGGRVVMRRR"
+ gene complement(164902..165450)
+ /gene="msrA"
+ /locus_tag="BQ2027_MB0142C"
+ CDS complement(164902..165450)
+ /gene="msrA"
+ /locus_tag="BQ2027_MB0142C"
+ /note="Mb0142c, msrA, len: 182 aa. Equivalent to Rv0137c,
+ len: 182 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 182 aa overlap). Probable msrA,
+ peptide methionine sulfoxide reductase (EC 1.8.4.6),
+ equivalent to CAC32179.1|AL583926 putative peptide
+ methionine sulfoxide from Mycobacterium leprae (177 aa).
+ Highly similar to others e.g. CAC18703.1|AL451182 putative
+ peptide methionine sulfoxide reductase from Streptomyces
+ coelicolor (172 aa); PMSR_SCHPO|Q09859 putative peptide
+ methionine sulfoxide reductase from Streptomyces (187 aa),
+ FASTA scores: opt: 468, E(): 9.9e-26, (45.6% identity in
+ 158 aa overlap); etc. BELONGS TO THE MSRA FAMILY. Protein
+ product from Mb0142c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0142c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PEPTIDE METHIONINE SULFOXIDE REDUCTASE
+ MSRA (PROTEIN-METHIONINE-S-OXIDE REDUCTASE) (PEPTIDE
+ MET(O) REDUCTASE)"
+ /protein_id="CAB5247847.1"
+ /translation="MTSNQKAILAGGCFWGLQDLIRNQPGVVSTRVGYSGGNIPNATY
+ RNHGTHAEAVEIIFDPTVTDYRTLLEFFFQIHDPTTKDRQGNDRGTSYRSAIFYFDEQ
+ QKRIALDTIADVEASGLWPGKVVTEVSPAGDFWEAEPEHQDYLQRYPNGYTCHFVRPG
+ WRLPRRTAESALRASLSPELGT"
+ gene 165513..166016
+ /locus_tag="BQ2027_MB0143"
+ CDS 165513..166016
+ /locus_tag="BQ2027_MB0143"
+ /note="Mb0143, -, len: 167 aa. Equivalent to Rv0138, len:
+ 167 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 167 aa overlap). Conserved hypothetical
+ protein, showing weak similarity to Q10827|YT10_MYCTU
+ HYPOTHETICAL 17.0 KDA PROTEIN from Mycobacterium
+ tuberculosis (147 aa), FASTA scores: opt: 131, E(): 0.047,
+ (31.15% identity in 106 aa overlap). Mb0143 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247848.1"
+ /translation="MSASEFSRAELAAAFEKFEKTVARAAATRDWDCWVQHYTPDVEY
+ IEHAAGIMRGRQRVRAWIQETMTTFPGSHMVAFPSLWSVIDESTGRIICELGNPMLDP
+ GDGSVISATNISIITYAGNGQWCRQEDIYNPLRFLRAAMKWCRKAQELGTLDEDAARW
+ MRRHGGP"
+ gene 166017..167039
+ /locus_tag="BQ2027_MB0144"
+ CDS 166017..167039
+ /locus_tag="BQ2027_MB0144"
+ /note="Mb0144, -, len: 340 aa. Equivalent to Rv0139, len:
+ 340 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 340 aa overlap). Putative
+ oxidoreductase (EC 1.-.-.-), similar to others e.g.
+ O34285|HPNA HPNA PROTEIN from Zymomonas mobilis (337 aa),
+ FASTA scores: opt: 507, E (): 5.8e-27, (31.1% identity in
+ 328 aa overlap); TRE_STRGR|P29782 dtdp-glucose
+ 4,6-dehydratase (328 aa), FASTA scores: opt: 254, E():
+ 2.6e-10, (29.0% identity in 307 aa overlap). Protein
+ product from Mb0144 detected using SWATH mass
+ spectrometry. Mb0144 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible oxidoreductase"
+ /protein_id="CAB5247849.1"
+ /translation="MNAPKLVIGANGFLGSHVTRQLVADCAPQKGEVRAMVRPAANTR
+ SIDDLPLTRFHGDVFDTATVAEAMAGCDDVYYCVVDTRAWLRDPSPLFRTNVAGLRNV
+ LDVATDASLRRFVFTSSYATVGRRRGHVATEEDRVDTRKVTPYVRSRVAAEDLVLQYA
+ HDAGLPAVAMCVSTTYGGGDWGRTPHGAFIAGAVFGRLPFTMRGIRLEAVGVDDAARA
+ LILAAERGHNGERYLISERMMPLQEVVRIAADEAGVPPPRWSISVPVLYALGALGSLR
+ ARLTGKDTELSLASVRMMRSEADVDHGKAVRELGWQPRPVEESIREAARFWAAMRTVG
+ KDPAAS"
+ gene 167100..167480
+ /locus_tag="BQ2027_MB0145"
+ CDS 167100..167480
+ /locus_tag="BQ2027_MB0145"
+ /note="Mb0145, -, len: 126 aa. Equivalent to Rv0140, len:
+ 126 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 126 aa overlap). Conserved
+ hypothetical protein, similar to others e.g.
+ P74567|D90916_48 HYPOTHETICAL 20.8 KDP ROTEIN from
+ Synechocystis sp. (180 aa), FASTA scores: opt: 229, E():
+ 4.7e-10, (36.1% identity in 108 aa overlap). Also similar
+ to Rv1056 and Rv1670 from Mycobacterium tuberculosis.
+ Protein product from Mb0145 detected using SWATH mass
+ spectrometry. Mb0145 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="COGs COG2343"
+ /protein_id="CAB5247850.1"
+ /translation="MSNRIVLEPSADHPITIEPTNRRVQVRVNGEVVADTAAALCLQE
+ ASYPAVQYIPLADVVQDRLIRTETSTYCPFKGEASYYSVTTDAGDIVDDVMWTYENPY
+ PAVAAIAGHVACYPDKAEISIFPG"
+ gene complement(167461..167871)
+ /locus_tag="BQ2027_MB0146C"
+ CDS complement(167461..167871)
+ /locus_tag="BQ2027_MB0146C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0146c, -, len: 136 aa. Equivalent to Rv0141c,
+ len: 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 136 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0146c detected using SWATH
+ mass spectrometry. Mb0146c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Ketosteroid isomerase-related protein"
+ /protein_id="CAB5247851.1"
+ /translation="MTPFDDPQAELAWMFLQSLCEGGDLDEGFALLSNDFTYWSIVTR
+ TELDKKTFRRAVERRKQVFEVNIELIRCVNEGETVVVEGHCDGVSADRTRYDSPFVCI
+ FETRDGMIISLREYSDTQSLAEVYPVACATPGRC"
+ gene 167901..168827
+ /locus_tag="BQ2027_MB0147"
+ CDS 167901..168827
+ /locus_tag="BQ2027_MB0147"
+ /note="Mb0147, -, len: 308 aa. Equivalent to Rv0142, len:
+ 308 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 308 aa overlap). Conserved
+ hypothetical protein, similar, except in N-terminus, to
+ AB88922.1|AL353862 hypothetical protein SCE34.20 from
+ Streptomyces coelicolor (326 aa). Mb0147 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="3-methyladenine DNA glycosylase/8-oxoguanine DNA
+ glycosylase"
+ /protein_id="CAB5247852.1"
+ /translation="MRSIDVVVEAVVTFAGAAGFAHTLAPLRRGQQDPCFRVPGDGTI
+ WRTSLLPTGPVTARISRAGRDAARCVAWGSGAEEFVDMAPAMLGAADDASDFVPLHPA
+ VAAAHRRLPNLRLGRTGQVLEALIPAVIEQRVPGADAFRSWRLLVSKYGTQAPGPAPP
+ GMRVPPSAEVWRHIPSWEFHRANVDPGRARAVVGCAQRAASLERLVSLPAARAAEALT
+ SLPGVGVWTAAETTQRVFGDADAVSVGDYHIPKMIGWTLVGRPVDDAGMLELLEPMRP
+ HRHRVVRLLEASGLAREPRRGPRLPVQNIRAL"
+ gene complement(168894..170372)
+ /locus_tag="BQ2027_MB0148C"
+ CDS complement(168894..170372)
+ /locus_tag="BQ2027_MB0148C"
+ /note="Mb0148c, -, len: 492 aa. Equivalent to Rv0143c,
+ len: 492 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 492 aa overlap). Probable conserved
+ transmembrane protein, CIC family possibly involved in
+ transport of chloride, similar to others and hypothetical
+ proteins e.g. O28857 PUTATIVE CHLORIDE CHANNEL from
+ Archaeoglobus fulgidus (589 aa), FASTA scores: opt: 966,
+ E(): 0, (37.7% identity in 453 aa overlap);
+ YADQ_ECOLI|P37019 hypothetical 46.0 kd protein (436 aa),
+ FASTA scores: opt: 452, E(): 2.4e-20, (28.0% identity in
+ 460 aa overlap). Protein product from Mb0148c detected
+ using SWATH mass spectrometry. Mb0148c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247853.1"
+ /translation="MAPGDWSVFAWHAANLPTMPEAEDIGNEAAGGRLGVSIRSAGYL
+ RKWFLLGITIGVIAGLGAVVFYLALKYTSEFLLGYLADYQIPTPVGEGGHRGSTGFAR
+ PWAIPLVTTGGAVLSALIVAKLAPEATGHGTDEAIESVHGDPRAIRGRAVLVKMVASA
+ LTIGSGGSGGREGPTAQISAGFCSLLTRRLNLSNEDGRTAVALGIGAGIGAIFAAPLG
+ GAALGASIPYRDDFDYRNLLPGFIASGTAYAVLGAFLGFDPLFGYIDAEYRFEKAWPL
+ LWFVVIGLIAAAVGYLYARVFHASVAITRRLPGGPVLKPAIGGLLVGLLGLPIPQILS
+ SGYGWAQLAADRGTLLSIPLWIVIVLPIAKILATSLSIGTGGSGGLFGPGIVIGAFVG
+ AAIWRLGELTELPGVPHEPGIFVVVAMMACFGSVSRAPLAVMIMVAEMTGSFSVVPGA
+ IIAVGIAALLLSRTNVTIYETQRLNRQTAEAERGGSDRPTTA"
+ gene 170474..171316
+ /locus_tag="BQ2027_MB0149"
+ CDS 170474..171316
+ /locus_tag="BQ2027_MB0149"
+ /note="Mb0149, -, len: 280 aa. Equivalent to Rv0144, len:
+ 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 280 aa overlap). Probable
+ transcriptional regulator, possibly tetR family. Has
+ region similar to others e.g.
+ Q59431|UIDR_ECOLI|GUSR|B1618|Z2623|ECS2326 UID OPERON
+ REPRESSOR (GUS OPERON) from Escherichia coli strains K12
+ and O157:H7 (196 aa), FASTA scores: opt: 214, E():
+ 1.1e-06, (26.0% identity in 196 aa overlap). Contains
+ probable helix-turn helix motif from aa 109-130 (Score
+ 1463, +4.17 SD). COULD BELONG TO THE TETR/ACRR FAMILY OF
+ TRANSCRIPTIONAL REGULATORS. Protein product from Mb0149
+ detected using shotgun mass spectrometry. Mb0149 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY TETR-FAMILY)"
+ /protein_id="CAB5247854.1"
+ /translation="MPHSWTPTSVMTPPLVVAAFRPVGHYRLATDRAGGPCSPPATGA
+ KLTSSVASRPTVGTKPQWWHTLVMSMSLTAGRGPGRPPAAKADETRKRILHAARQVFS
+ ERGYDGATFQEIAVRADLTRPAINHYFANKRVLYQEVVEQTHELVIVAGIERARREPT
+ LMGRLAVVVDFAMEADAQYPASTAFLATTVLESQRHPELSRTENDAVRATREFLVWAV
+ NDAIERGELAADVDVSSLAETLLVVLCGVGFYIGFVGSYQRMATITDSFQQLLAGTLW
+ RPPT"
+ gene 171405..172358
+ /locus_tag="BQ2027_MB0150"
+ CDS 171405..172358
+ /locus_tag="BQ2027_MB0150"
+ /note="Mb0150, -, len: 317 aa. Equivalent to Rv0145, len:
+ 317 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 317 aa overlap). Conserved
+ hypothetical protein, highly similar to many e.g.
+ CAC32172.1|AL583926 conserved hypothetical protein from
+ Mycobacterium leprae (310 aa); and several Mycobacterium
+ tuberculosis proteins e.g. Rv0726c, Rv0731c, etc. Protein
+ product from Mb0150 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0150 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible s-adenosylmethionine-dependent
+ methyltransferase"
+ /protein_id="CAB5247855.1"
+ /translation="MTELDDVSSLPSSRRTAGDTWAITESVGATALGVAAARAVETAA
+ TNPLIRDEFAKVLVSSAGTAWARLADADLAWLDGDQLGRRVHRVACDYQAVRTHFFDE
+ YFGAAVDAGVRQVVILAAGLDARAYRLNWPAGTVVYEIDQPSVLEYKAGILQSHGAVP
+ TARRHAVAVDLRDDWPAALIAAGFDGTQPTAWLAEGLLPYLPGDAADRLFDMVTALSA
+ PGSQVAVEAFTMNTKGNTQRWNRMRERLGLDIDVQALTYHEPDRSDAAQWLATHGWQV
+ HSVSNREEMARLGRAIPQDLVDETVRTTLLRGRLVTPAQPA"
+ gene 172401..173333
+ /locus_tag="BQ2027_MB0151"
+ CDS 172401..173333
+ /locus_tag="BQ2027_MB0151"
+ /note="Mb0151, -, len: 310 aa. Equivalent to Rv0146, len:
+ 310 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 310 aa overlap). Conserved
+ hypothetical protein, highly similar to others e.g.
+ AC30975.1|AL583924 conserved hypothetical protein from
+ Mycobacterium leprae (304 aa); and several Mycobacterium
+ tuberculosis proteins e.g. Rv0726c, Rv0731c, etc. Protein
+ product from Mb0151 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0151 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible s-adenosylmethionine-dependent
+ methyltransferase"
+ /protein_id="CAB5247856.1"
+ /translation="MRTHDDTWDIKTSVGATAVMVAAARAVETDRPDPLIRDPYARLL
+ VTNAGAGAIWEAMLDPTLVAKAAAIDAETAAIVAYLRSYQAVRTNFFDTYFASAVAAG
+ IRQVVILASGLDSRAYRLDWPAGTIVYEIDQPKVLSYKSTTLAENGVTPSAGRREVPA
+ DLRQDWPAALRDAGFDPTARTAWLAEGLLMYLPAEAQDRLFTQVGAVSVAGSRIAAET
+ APVHGEERRAEMRARFKKVADVLGIEQTIDVQELVYHDQDRASVADWLTDHGWRARSQ
+ RAPDEMRRVGRWVEGVPMADDPTAFAEFVTAERL"
+ gene 173428..174948
+ /locus_tag="BQ2027_MB0152"
+ CDS 173428..174948
+ /locus_tag="BQ2027_MB0152"
+ /note="Mb0152, -, len: 506 aa. Equivalent to Rv0147, len:
+ 506 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 506 aa overlap). Probable aldehyde
+ dehydrogenase (NAD+) dependant (EC 1.2.1.-), similar to
+ others e.g. DHAP_RAT|P11883 aldehyde dehydrogenase
+ (dimeric NADP-preferring) (452 aa), FASTA scores: opt:
+ 1291, E(): 0, (43.9% identity in 453 aa overlap). Also
+ similar to several Mycobacterium tuberculosis aledehyde
+ dehydrogenases e.g. Rv0768, Rv2858c, etc. Contains PS00687
+ aldehyde dehydrogenases glutamic acid active site, and
+ PS00070 aldehyde dehydrogenases cysteine active site.
+ BELONGS TO THE ALDEHYDE DEHYDROGENASES FAMILY. Protein
+ product from Mb0152 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0152 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable aldehyde dehydrogenase (nad+)
+ dependent"
+ /protein_id="CAB5247857.1"
+ /translation="MSDRVKAVAPPDGRTMMTTESVARKTQKSETEAPREPAPVSDEK
+ QTDVAKTVARLRKTFASGRTRSVEWRKQQLRALQKLMDENEDAIAAALAEDLDRNPFE
+ AYLADIATTSAEAKYAAKRVRRWMRRRYLLLEVPQLPGRGWVEYEPYGTVLIIGAWNY
+ PFYLTLGPAVGAIAAGNAVVLKPSEIAAASAHLMTELVYRYLDTEAIAVVQGDGAVSQ
+ ELIAQGFDRVMFTGGTEIGRKVYEGAAPHLTPVTLELGGKSPVIVAADADVDVAAKRI
+ AWIKLLNAGQTCVAPDYVLADATVRDELVSKITAALTKFRSGAPQGMRIVNQRQFDRL
+ SGYLAAAKTDAAADGGGVVVGGDCDASNLRIQPTVVVDPDPDGPLMSNEIFGPILPVV
+ TVKSLDDAIRFVNSRPKPLSAYLFTKSRAVRERVIREVPAGGMMVNHLAFQVSTAKLP
+ FGGVGASGMGAYHGRWGFEEFSHRKSVLTKPTRPDLSSFIYPPYTERAIKVARRLF"
+ gene 175023..175883
+ /locus_tag="BQ2027_MB0153"
+ CDS 175023..175883
+ /locus_tag="BQ2027_MB0153"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0153, -, len: 286 aa. Equivalent to Rv0148, len:
+ 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 286 aa overlap). Probable short-chain
+ dehydrogenase (EC 1.-.-.-), similar to others, in
+ particular Estradiol 17 beta-dehydrogenases (EC 1.1.1.62),
+ e.g. DHB4_MOUSE|P51660 estradiol 17 beta-dehydrogenase 4
+ (735 aa), FASTA scores: opt: 952, E(): 0, (52.5% identity
+ in 276 aa overlap). Contains PS00061 Short-chain alcohol
+ dehydrogenase family signature. BELONGS TO THE SHORT-CHAIN
+ DEHYDROGENASES/REDUCTASES (SDR) FAMILY. Protein product
+ from Mb0153 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0153 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SHORT-CHAIN TYPE
+ DEHYDROGENASE/REDUCTASE"
+ /protein_id="CAB5247858.1"
+ /translation="MPGVQDRVIVVTGAGGGLGREYALTLAGEGASVVVNDLGGARDG
+ TGAGSAMADEVVAEIRDKGGRAVANYDSVATEDGAANIIKTALDEFGAVHGVVSNAGI
+ LRDGTFHKMSFENWDAVLKVHLYGGYHVLRAAWPHFREQSYGRVVVATSTSGLFGNFG
+ QTNYGAAKLGLVGLINTLALEGAKYNIHANALAPIAATRMTQDILPPEVLEKLTPEFV
+ APVVAYLCTEECADNASVYVVGGGKVQRVALFGNDGANFDKPPSVQDVAARWAEITDL
+ SGAKIAGFKL"
+ gene 175890..176858
+ /locus_tag="BQ2027_MB0154"
+ CDS 175890..176858
+ /locus_tag="BQ2027_MB0154"
+ /note="Mb0154, -, len: 322 aa. Equivalent to Rv0149, len:
+ 322 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 322 aa overlap). Putative quinone
+ oxidoreductase (EC 1.6.5.-), similar to others
+ oxidoreductases e.g. Q08257 quinone oxidoreductase (EC
+ 1.6.5.5) (329 aa), FASTA scores: opt: 397, E(): 3.2e-18,
+ (28.4% identity in 328 aa overlap); SCHCOADH_4 from
+ Streptomyces coelicolor. Also similar to many proteins
+ from Mycobacterium tuberculosis. Contains PS01162 Quinone
+ oxidoreductase / zeta-crystallin signature. BELONG TO THE
+ ZINC-CONTAINING ALCOHOL DEHYDROGENASE FAMILY, QUINONE
+ OXIDOREDUCTASE SUBFAMILY. Protein product from Mb0154
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0154 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible quinone oxidoreductase (nadph:quinone
+ oxidoreductase) (zeta-crystallin)"
+ /protein_id="CAB5247859.1"
+ /translation="MKACVVKELSGPSGMVYTDIDEVSGDGGKVVIDVRAAGVCFPDL
+ LLTKGEYQLKLTPPFVPGMETAGVVRSAPSDAGFHVGERVSAFGVLGGYAEQIAVPVA
+ NVVRSPVELDDAGAVSLLVNYNTMYFALARRAALRPGDTVLVLGAAGGVGTAAVQIAK
+ AMQAGKVIAMVHREGAIDYVASLGADVVLPLTEGWAQQVRDHTYGQGVDIVVDPIGGP
+ TFDDALGVLAIDGKLLLIGFAAGAVPTLKVNRLLVRNISVVGVGWGEYLNAVPGSAAL
+ FAWGLNQLVFLGLRPPPPQRYPLSEAQAALQSLDDGGVLGKVVLEP"
+ gene complement(176855..177142)
+ /locus_tag="BQ2027_MB0155C"
+ CDS complement(176855..177142)
+ /locus_tag="BQ2027_MB0155C"
+ /note="Mb0155c, -, len: 95 aa. Equivalent to Rv0150c, len:
+ 95 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 95 aa overlap). Conserved hypothetical
+ protein, showing some similarity with C-terminus of
+ O53949|Rv1800|MTV049.22 PPE-FAMILY PROTEIN from
+ Mycobacterium tuberculosis (655 aa), FASTA score: (36.5%
+ identity in 104 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247860.1"
+ /translation="MLTLPDDRAPTGLPDPGIEALAHTKIASTISTVVADGYAVVLST
+ ADIANSLLANAIGYPIAASVALVTPAAGANSSCWPADPSQHHRIAESRACA"
+ gene complement(177733..179499)
+ /gene="PE1"
+ /locus_tag="BQ2027_MB0156C"
+ CDS complement(177733..179499)
+ /gene="PE1"
+ /locus_tag="BQ2027_MB0156C"
+ /note="Mb0156c, PE1, len: 588 aa. Equivalent to Rv0151c,
+ len: 588 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 588 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family, with N-terminal
+ region similar to others e.g. MTV032_2 PE_PGRS family from
+ Mycobacterium tuberculosis (468 aa), FASTA scores: opt:
+ 1125, E(): 0, (46.3% identity in 456 aa overlap);
+ MTCY493_24 from M. tuberculosis FASTA score: (42.5%
+ identity in 558 aa overlap). Also similar to upstream ORF
+ MTCI5.26c FASTA score: (54.7% identity in 464 aa overlap).
+ Also shows similarity to C-terminal part of some PPE
+ family proteins e.g. MTV049_21 from Mycobacterium
+ tuberculosis FASTA score: (41.5% identity in 591 aa
+ overlap). Mb0156c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe1"
+ /protein_id="CAB5247861.1"
+ /translation="MAPFGFTPKARHNRGVALRSTYRLDRWVMGPVDKEGWGLSYVFA
+ QPSVLAAAATDLAGIGSAINQATAAVAAPTTGLAAAAADEVSTALATLFGAYGQQFQA
+ ISAQVAAFHNEFTQRLAAAANAFVNAEATNTSALVQEATAGLFKPTSPPVLPPMFNQN
+ TAIIMGGTGSPIPTPSYVNAITTLFIDPVVSNPVVKALVTPEELYPITGVKSLPFQTS
+ VQLGLQILDGAIWEQINAGNHVTVFGYSQSAVIASLEMQHLISLGPNAPSPSQLNFIL
+ IGNEMNPNGGILARIPGLNVTTLGLPFYGATPDNPYPTTTYTLEYDGFADFPRYPLNV
+ LSDINAVFGILTVHTTYADLTPAQIASATQLPTQGTTSNTYYIIETEHLPLLAPLRAI
+ PVIGPPLAALVEPNLEVIVNLGYGDPRFGYSTSPANVPTPFGLFPDVPASVVADALVA
+ GTQQGVNDFMVELPAALNTLPQTPMPAFPPYVPTLLPPPPPPQPATLINIADTFASVV
+ STGYSILLPTADLGLAFVTILPAYDLTLFVNQLAAGNLRAAIELPLAATIGLAALGGM
+ IEFIAIVVTLADITQQLQSFSI"
+ gene complement(179509..181086)
+ /gene="PE2"
+ /locus_tag="BQ2027_MB0157C"
+ CDS complement(179509..181086)
+ /gene="PE2"
+ /locus_tag="BQ2027_MB0157C"
+ /note="Mb0157c, PE2, len: 525 aa. Equivalent to Rv0152c,
+ len: 525 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 525 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family, similar to ORF
+ downstream Z92770|MTCI5_25 (588 aa), FASTA scores: opt:
+ 1492, E(): 0, (54.7% identity in 464 aa overlap); and to
+ many other PE family type members. Mb0157c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe2"
+ /protein_id="CAB5247862.1"
+ /translation="MRCRPPSRNRSAHTARNTRPCSLKSRRFTVRFHQTLAAAANSYA
+ DAEAAIASTRQNQLAVPAAAPTPAAAAMIPPFPANLTTLFFGPTGIPLPPPSMLTPPI
+ RCRSVRRALQAVFTPEELYPLTGVRSLVLNTSVEEGLTILHDAIMVELATTGNAVTVF
+ GWSQSAIIASLEMQRFTAMGGAAPSASDLNFVLVGNEMNPNGGMLARFPDLTLPTLDL
+ TFYGATPSDTIYPTAIYTLEYDGFADFSRYPLNFISDLNAVAGITFVHTKYLDLTPAQ
+ VEGATKLPTSPGYTGVTDYYIIRTENRPLLQPLRAVPVIGDPLADLIQPNLKVIVNLG
+ YGDPNYGYSTSYADVRTPFGLWPNVPPQVIADALAAGTQEGILDFTADLQALSAQPLT
+ LPQIQLPQPADLVAAVAAAPTPAEVVNTLARIISTNYAVLLPTVDIALALVTTLPLYT
+ TQLFVRQLAAGNLINAIGYPLAATVGLGTIDSGRRGIAHPPRGGLGHRSKHRGPRHLT
+ DSRRHRRPPTTVYRPRQ"
+ gene complement(181345..182175)
+ /gene="ptbB"
+ /locus_tag="BQ2027_MB0158C"
+ CDS complement(181345..182175)
+ /gene="ptbB"
+ /locus_tag="BQ2027_MB0158C"
+ /standard_name="MPtpB"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0158c, ptbB, len: 276 aa. Equivalent to Rv0153c,
+ len: 276 aa, from Mycobacterium tuberculosis strain H27Rv,
+ (99.6% identity in 276 aa overlap). ptbB (alternate gene
+ name: MPtpB), protein-tyrosine-phosphatase (see citation
+ below) (EC 3.1.3.48), showing some similarity to several
+ protein-tyrosine phosphatases, polyketide synthase and
+ aminotransferase e.g. Q05918|IPHP_NOSCO|IPH
+ PROTEIN-TYROSINE-PHOSPHATASE PRECURSOR from Nostoc commune
+ (EC 3.1.3.48) (294 aa), FASTA scores: opt: 150, E():
+ 0.0096, (26.8% identity in 269 aa overlap); etc. Supposed
+ a secreted protein. Protein product from Mb0158c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0158c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PHOSPHOTYROSINE PROTEIN PHOSPHATASE PTPB
+ (PROTEIN-TYROSINE-PHOSPHATASE) (PTPase)"
+ /protein_id="CAB5247863.1"
+ /translation="MAVRELPGAWNFRDVADTATALRPGRLFRSSELSRLDDAGRATL
+ RRLGITDVADLRSSREVARRGPGRVPDGIDVHLLPFPDLADDDADDSAPHETAFKRLL
+ TNGGSNGESGESSQSINDAATRYMTDEYRQFPTRNGAQRALHRVVTLLAAGRPVLTHC
+ FAGKDRTGFVVALVLEAVGLDRDVIVADYLRSNDSVPQLRARISEMIQQRFDTELAPE
+ VVTFTKARLSDGVLGVRAEYLAAARQTIDETYGSLGGYLRDAGISQATVNRMRGVLLG
+ "
+ gene complement(182177..183388)
+ /gene="fadE2"
+ /locus_tag="BQ2027_MB0159C"
+ CDS complement(182177..183388)
+ /gene="fadE2"
+ /locus_tag="BQ2027_MB0159C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0159c, fadE2, len: 403 aa. Equivalent to Rv0154c,
+ len: 403 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 403 aa overlap). Probable fadE2,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), similar to many e.g.
+ C-terminal region of O01590 ACYL-CoA DEHYDROGENASE (974
+ aa), FASTA scores: opt: 1150, E(): 0, (50.0% identity in
+ 402 aa overlap); ACDS_MEGEL|Q06319 acyl-CoA dehydrogenase
+ (short-chain) (383 aa), FASTA score: (35.0% identity in
+ 306 aa overlap). COULD BELONG TO THE ACYL-COA
+ DEHYDROGENASES FAMILY. Protein product from Mb0159c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0159c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-CoA DEHYDROGENASE FADE2"
+ /protein_id="CAB5247864.1"
+ /translation="MSAKAIDYRTRLSDFMTEHVFGAEADYDDYRRAAGPADHTAPPI
+ IEELKTKAKDRGLWNLFLSAESGLTNLEYAPLAEMTGWSMEIAPEALNCAAPDTGNME
+ ILHMFGTEQQRAQWLRPLLDGKIRSAFSMTEPAVASSDARNIETTISRDGADYVINGR
+ KWWTSGAADPRCKILIVMGRTNPDAAAHQQQSMVLVPIDTPGVTIVRSTPVFGWQDRH
+ GHCEIDYHNVRVPATNLLGEEGSGFAIAQARLGPGRIHHCMRALGAAERALALMVNRV
+ RNRVAFGRPLAEQGVVQQAIAQSRNEIDQARLLCEKAAWTIDQHGNKEARHLVAMIKA
+ VAPRVACDVIDRAIQVHGAAGVSDDTPLARLYGWHRAMRIFDGPDEVHLRSIARAELS
+ REKSTFAAAVT"
+ gene 183812..184912
+ /gene="pntAa"
+ /locus_tag="BQ2027_MB0160"
+ CDS 183812..184912
+ /gene="pntAa"
+ /locus_tag="BQ2027_MB0160"
+ /standard_name="pntAA"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0160, pntAa, len: 366 aa. Equivalent to Rv0155,
+ len: 366 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 366 aa overlap). Probable pntAa, first
+ part of NAD(P) transhydrogenase subunit alpha (EC
+ 1.6.1.2), similar to N-terminus of others e.g.
+ PNTA_ECOLI|P07001|P76888|B1603 NAD (P) transhydrogenase
+ subunit alpha from Escherichia coli strain K12 (510 aa),
+ FASTA scores: opt: 921, E(): 0, (42.1% identity in 361 aa
+ overlap); PROTON-TRANSLOCATING NICOTINAMIDE NUCLEOTIDE
+ TRANSHYDROGENASE SUBUNIT PNTAA (EC 1.6.1.1). Protein
+ product from Mb0160 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0160 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NAD(P) TRANSHYDROGENASE (SUBUNIT ALPHA)
+ PNTAa [FIRST PART; CATALYTIC PART] (PYRIDINE NUCLEOTIDE
+ TRANSHYDROGENASE SUBUNIT ALPHA) (NICOTINAMIDE NUCLEOTIDE
+ TRANSHYDROGENASE SUBUNIT ALPHA)"
+ /protein_id="CAB5247865.1"
+ /translation="MTDPQTQSTRVGVVAESGPDERRVALVPKAVASLVNRGVAVVVE
+ AGAGERALLPDELYTAVGASIGDAWAADVVVKVAPPTAAEVGRLRGGQTLIGFLAPRN
+ ADNSIGALTQAGVQAFALEAIPRISRAQVMDALSSQANVSGYKAVLLAASESTRFFPM
+ LTTAAGTVKPATVLVLGVGVAGLQALATAKRLGARTTGYDVRPEVADQVRSVGAQWLD
+ LGISASGEGGYARELTDDERAQQQKALEEAISGFDVVITTALVPGRPAPTLVTAAAVE
+ AMKPGSVVVDLAGETGGNCELTEPGRTVVKHDVTIAAPLNLPATMPEHASELYSKNIT
+ ALLDLLIKDGRLAPDFDDEVIAQSCVTRGKDS"
+ gene 184913..185245
+ /gene="pntAb"
+ /locus_tag="BQ2027_MB0161"
+ CDS 184913..185245
+ /gene="pntAb"
+ /locus_tag="BQ2027_MB0161"
+ /standard_name="pntAB"
+ /note="Mb0161, pntAb, len: 110 aa. Equivalent to Rv0156,
+ len: 110 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.1% identity in 110 aa overlap). Probable pntAb, second
+ part of NAD(P) transhydrogenase subunit alpha, integral
+ membrane protein, similar to C-terminus of others e.g.
+ Q59764 NICOTINAMIDE NUCLEOTIDE TRANSHYDROGENASE SUBUNIT
+ PNTAB (139 aa), FASTA scores: opt: 247, E(): 1.9e-11,
+ (45.5% identity in 88 aa overlap). Protein product from
+ Mb0161 detected using shotgun mass spectrometry. Mb0161
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NAD(P) TRANSHYDROGENASE (SUBUNIT ALPHA)
+ PNTAb [SECOND PART; INTEGRAL MEMBRANE PROTEIN] (PYRIDINE
+ NUCLEOTIDE TRANSHYDROGENASE SUBUNIT ALPHA) (NICOTINAMIDE
+ NUCLEOTIDE TRANSHYDROGENASE SUBUNIT ALPHA)"
+ /protein_id="CAB5247866.1"
+ /translation="MCNELLENLAILVLSGFVGFAVISKVPNTLHTPLMSGTNAIHGI
+ VVLGALVVFGEIEHPSLVLQVILFVAVVFGTLNVIGGFIVTDRMLGMFKAKKPAVPAK
+ PDRDEALR"
+ gene 185242..186669
+ /gene="pntB"
+ /locus_tag="BQ2027_MB0162"
+ CDS 185242..186669
+ /gene="pntB"
+ /locus_tag="BQ2027_MB0162"
+ /note="Mb0162, pntB, len: 475 aa. Equivalent to Rv0157,
+ len: 475 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 475 aa overlap). Probable pntB,
+ pyridine nucleotide transhydrogenase (nicotinamide
+ nucleotide transhydrogenase) subunit beta (EC 1.6.1.1),
+ integral membrane protein, similar to others e.g. Q59763
+ PROTON-TRANSLOCATING NICOTINAMIDE NUCLEOTIDE
+ TRANSHYDROGENASE SUBUNIT BETA from HODOSPIRILLUM RUBRUM
+ (464 aa), FASTA scores: opt: 1344, E(): 0, (46.4% identity
+ in 472 aa overlap);
+ P07002|PNTB_ECOLI|P76890|PNTB|B1602|Z2597|ECS2308 NAD(P)
+ TRANSHYDROGENASE SUBUNIT BETA from Escherichia coli
+ strains K12 and O157:H7 (462 aa). Protein product from
+ Mb0162 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0162 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NAD(P) TRANSHYDROGENASE (SUBUNIT BETA)
+ PNTB [INTEGRAL MEMBRANE PROTEIN] (PYRIDINE NUCLEOTIDE
+ TRANSHYDROGENASE SUBUNIT BETA) (NICOTINAMIDE NUCLEOTIDE
+ TRANSHYDROGENASE SUBUNIT BETA)"
+ /protein_id="CAB5247867.1"
+ /translation="MNLHYLVEILYIISFSLFIYGLMGLTGPKTAVRGNLIAAAGMTI
+ AVAATLVMIRHTSQWPLIIAGLVVGVVLGVPPARLTKMTAMPQLVAFFNGVGGGTVAL
+ IALSEFIDTTGFSAFQHGESPTVHIVVASLFAAIIGSISFWGSIVAFGKLQEIISGRP
+ IGLGKAQQPINLLLLAVAVAAAVVIGLHAHPGSGGVALWWMIGLLVAAGVLGLMVVLP
+ IGGADMPVVISMLNAMTGLSAAAAGLALNNTAMIVAGMIVGASGSILTNLMAKAMNRS
+ IPAIVAGGFGGGGVAPSGGGDDKHVKATSAADAAIQMAYANQVIVVPGYGLAVAQAQH
+ AVKDLATLLEDRGVPVKYAIHPVAGRMPGHMNVLLAEAEVDYDAMKDMDDINDEFART
+ DVTIVIGANDVTNPAARNETSSPIYGMPILNVDKSRSVIVLKRSMNSGFAGIDNPLFY
+ ADGTTMLFGDAKKSVTEVSEELKAL"
+ gene complement(186685..186813)
+ /locus_tag="BQ2027_MB0162A"
+ CDS complement(186685..186813)
+ /locus_tag="BQ2027_MB0162A"
+ /note="Mb0162A, len: 42 aa. Equivalent to Rv0157A len: 42
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 42 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Conserved protein,
+ showing similarity to C-terminal part (aa 186-220) of
+ O53976|Rv1975|MTV051.13 conserved hypothetical protein
+ from Mycobacterium tuberculosis (221 aa), FASTA scores:
+ opt: 173, E(): 3e-06, (62.5% identity in 40 aa overlap).
+ Mb0162A found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Conserved protein"
+ /protein_id="CAB5247868.1"
+ /translation="MMDPSPDYDVSDEIEFFFRYLTWGLRGVETGDGYPPPAYPPV"
+ gene 186975..187619
+ /locus_tag="BQ2027_MB0163"
+ CDS 186975..187619
+ /locus_tag="BQ2027_MB0163"
+ /note="Mb0163, -, len: 214 aa. Equivalent to Rv0158, len:
+ 214 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 214 aa overlap). Probable
+ transcriptional regulator, possibly TetR family, showing
+ weak similarity to various transcriptional activators and
+ repressors e.g. P32398|YIXD_BACSU|YHGD HYPOTHETICAL
+ TRANSCRIPTIONAL REGULATORY PROTEIN from Bacillus subtilis
+ (191 aa), FASTA scores: opt:172, E(): 2.4e-05, (23.0%
+ identity in 191 aa overlap). Contains helix-turn-helix
+ motif at aa 32-53 (Score 1296, +3.60 SD). COULD BELONG TO
+ THE TETR/ACRR FAMILY OF TRANSCRIPTIONAL REGULATORS.
+ Protein product from Mb0163 detected using SWATH mass
+ spectrometry. Mb0163 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY TETR-FAMILY)"
+ /protein_id="CAB5247869.1"
+ /translation="MPSDTSPNGLSRREELLAVATKLFAARGYHGTRMDDVADVIGLN
+ KATVYHYYASKSLILFDIYRQAAEGTLAAVHDDPSWTAREALYQYTVRLLTAIASNPE
+ RAAVYFQEQPYITEWFTSEQVAEVREKEQQVYEHVHGLIDRGIASGEFYECDSHVVAL
+ GYIGMTLGSYRWLRPSGRRTAKEIAAEFSTALLRGLIRDESIRNQSPLGTRKET"
+ gene complement(187623..189029)
+ /gene="PE3"
+ /locus_tag="BQ2027_MB0164C"
+ CDS complement(187623..189029)
+ /gene="PE3"
+ /locus_tag="BQ2027_MB0164C"
+ /note="Mb0164c, PE3, len: 468 aa. Equivalent to Rv0159c,
+ len: 468 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 468 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family, similar to many
+ other PE proteins e.g. O06828 from Mycobacterium
+ tuberculosis (528 aa), FASTA scores: opt: 1163, E(): 0,
+ (45.8% identity in 467 aa overlap). Also highly similar to
+ upstream MTV032_3, and to MTCI5_25, MTCI5_26, MTV049_ 21,
+ MTCY1A10_26, etc. Mb0164c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe3"
+ /protein_id="CAB5247870.1"
+ /translation="MSYVIAAPEMLATAAADVDGIGSAIRAASASAAGPTTGLLAAAA
+ DEVSSAAAALFSEYARECQEVLKQAAAFHGEFTRALAAAGAAYAQAEASNTAAMSGTA
+ GSSGALGSVGMLSGNPLTALMMGGTGEPILSDRVLAIIDSAYIRPIFGPNNPVAQYTP
+ EQWWPFIGNLSLDQSIAQGVTLLNNGINAELQNGHDVVVFGYSQSAAVATNEIRALMA
+ LPPGQAPDPSRLAFTLIGNINNPNGGVLERYVGLYLTFLDMSFNGATPPDSPYQTYMY
+ TGQYDGYAHNPQYPLNILSDLNAFMGIRWVHNAYPFTAAEVANAVPLPTSPGYTGNTH
+ YYMFLTQDLPLLQPIRAIPFVGTPIAELIQPDLRVLVDLGYGYGYADVPTPASLFAPI
+ NPIAVASALATGTVQGPQAALVSIGLLPQSALPNTYPYLPSANPGLMFNFGQSSVTEL
+ SVLSGALGSVARLIPPIA"
+ gene complement(189121..190629)
+ /gene="PE4"
+ /locus_tag="BQ2027_MB0165C"
+ CDS complement(189121..190629)
+ /gene="PE4"
+ /locus_tag="BQ2027_MB0165C"
+ /note="Mb0165c, PE4, len: 502 aa. Equivalent to Rv0160c,
+ len: 502 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 502 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family, similar to many
+ other PE proteins e.g. Z92770|MTCI5_26c from M.
+ tuberculosis (525 aa), FASTA scores: opt: 816, E(): 0,
+ (41.4% identity in 367 aa overlap); C-terminal region of
+ O06801|RV1768|MTCY28.34 from Mycobacterium tuberculosis
+ (618 aa), FASTA scores: opt: 417, E(): 6.7e-18, (53.5%
+ identity in 142 aa overlap). Also highly similar to
+ downstream ORF MTV032_2. Mb0165c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe4"
+ /protein_id="CAB5247871.1"
+ /translation="MSHLVTAPDMLATAAAHVDEIASTLRAANAAAAGPTCNLLAAAG
+ DEVSAATAALFSAYGREYQAVVKQAAAFHSEFTRTLEAAGNAYAHAEAANAARVSHAL
+ DTINAPIRTLLGRTPLSPNGSSGAGGLPAIAQLAAESPITALIMGGTNNPLPDPEYVT
+ DINKAFIQTLFPGAVSQGLFTPEQFWPVTPDLGNLTFNQSVTEGVALLNTTVNNQLAL
+ DNKVVAFGYSQSATIINNYINSLMAMGSPNPDDISFVMIGSGNNPVGGLLARFPGFYI
+ PFLDVPFNGATPANSPYPTHIYTAQYDGIAHAPQFPLRILSDINAFMGYFYVHNTYPE
+ LMATQVDNAVPLPTSPGYTGNTQYYMFLTQDLPLLQPIRDIPYAGPPIADLFQPQLRV
+ LVDLGYADYGPGGNYADIPTPAGLFSIPNPFAVTYYLIKGSLQAPYGAIVEIGVEAGL
+ IGPEWFPDSYPWVPSINPGLNFYFGQPQVTLLSLMSGGLGNILHLIPPPVFT"
+ gene 190797..192146
+ /locus_tag="BQ2027_MB0166"
+ CDS 190797..192146
+ /locus_tag="BQ2027_MB0166"
+ /note="Mb0166, -, len: 449 aa. Equivalent to Rv0161, len
+ 449 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 449 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), similar to hypothetical
+ proteins and various oxidoreductases e.g.
+ AIP2_YEAST|P46681 actin interacting protein 2 (530 aa),
+ FASTA scores: opt: 356, E (): 0, (33.3% identity in 357 aa
+ overlap); DLD1_YEAST|P32891 d-lactate dehydrogenase
+ (cytochrome) (587 aa), FASTA scores: opt: 311, E():
+ 2.5e-20, (27.9% identity in 366 aa overlap). Also similar
+ to other Mycobacteria proteins e.g. MTCY339.30c from M.
+ tuberculosis FASTA score: (29.4% identity in 357 aa
+ overlap); MLCL622.30c from Mycobacterium tuberculosis (449
+ aa). Protein product from Mb0166 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="possible oxidoreductase"
+ /protein_id="CAB5247872.1"
+ /translation="MLTSLVSAVGSHHVTTDPDVLAGRSVDHTGRYRGRASALVRPGS
+ AEEVAEVLRVCRDAGAYVTVQGGRTSLVAGTVPEHDDVLLSTERLCVVSDVDTVERRI
+ EIGAGVTLAAVQHAASTAGLVFGVDLSARDTATVGGMASTNAGGLRTVRYGNMGEQVV
+ GLDVALPDGTVLRRHSRVRRDNTGYDLPALFVGAEGTLGVITALDLRLHPTPSHRVTA
+ VCGFAELAALVDAGRMFRDVEGIAALELIDGRAAALTREHLGVRPPVEADWLLLVELA
+ ADHDQTDRLADLLGGARMCGEPAVGVDAAAQQRLWRTRESLAEVLGVYGPPLKFDVSL
+ PLSAISGFARDAVALVHRHVPDSPEALPLLFGHIGEGNLHLNVLRCPPDREPALYAKM
+ MGLIAECGGNVSSEHGVGSRKRAYLGMSRQANDVAAMRRVKAALDPTGYLNAAVLFD"
+ gene complement(192174..193325)
+ /gene="adhE1"
+ /locus_tag="BQ2027_MB0167C"
+ CDS complement(192174..193325)
+ /gene="adhE1"
+ /locus_tag="BQ2027_MB0167C"
+ /note="Mb0167c, adhE1, len: 383 aa. Equivalent to Rv0162c,
+ len: 383 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 383 aa overlap). Probable adhE1,
+ zinc-type alcohol dehydrogenase (EC 1.1.1.1), similar to
+ others e.g. ADH_MACMU|P28469 alcohol dehydrogenase alpha
+ chain (374 aa), FASTA scores: opt: 619, E(): 0, (34.7%
+ identity in 363 aa overlap). Also similar to other alcohol
+ dehydrogenases from Mycobacterium tuberculosis e.g.
+ MTCY369.06c FASTA score: (34.0% identity in 365 aa
+ overlap), MTV022_9 FASTA score: (35.0% identity in 371 aa
+ overlap). Contains PS00059 Zinc-contain ingalcohol
+ dehydrogenases signature. BELONGS TO THE ZINC-CONTAINING
+ ALCOHOL DEHYDROGENASE FAMILY, CLASS-I SUBFAMILY. COFACTOR:
+ ZINC. Protein product from Mb0167c detected using SWATH
+ mass spectrometry. Mb0167c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable zinc-type alcohol dehydrogenase (e
+ subunit) adhe1"
+ /protein_id="CAB5247873.1"
+ /translation="MPAVQPWLYSNMPAIRGAVLDQIGVPRPYWRSKPISVVELHLDP
+ PDRGEVLVRIEAAGVCHSDLSVVDGTRVRPVPILLGHEAAGIVEQVGDGVDGVAVGQR
+ VVLVFLPRCGQCAACATDGRTPCEPGSAANKAGTLLGGGIRLSRGGRPVYHHLGVSGF
+ ATHVVVNRASVVPVPHEVPPTVAALLGCAVLTGGGAVLNVGDPQPGQSVAVVGLGGVG
+ MAAVLTALTYTDVRVVAVDQLPEKLSAAKALGAHEIYTPQQATAGGVKAAVVVEAVGH
+ PAALHTAIGLTAPGGRTITVGLPPPDVRISLSPLDFVTEGRSLIGSYLGSAVPSHDIP
+ RFVSLWQSGRLPVESLVTSTIRLDDINEAMDHLADGIAVRQLISFTGDL"
+ gene 193307..193762
+ /locus_tag="BQ2027_MB0168"
+ CDS 193307..193762
+ /locus_tag="BQ2027_MB0168"
+ /note="Mb0168, -, len: 151 aa. Equivalent to Rv0163, len:
+ 151 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 151 aa overlap). Conserved
+ hypothetical protein, similar to others e.g. Q44017
+ HYPOTHETICAL 16.6 KDA PROTEIN IN GBD 5'REGION (ORF6)from
+ Alcaligenes eutrophus (145 aa), FASTA scores: opt: 155,
+ E(): 0.0002, (26.6% identity in 139 aa overlap). Also weak
+ similary with MTV008.31c|Rv2475c|B70867 from Mycobacterium
+ tuberculosis (138 aa). Mb0168 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Propionyl-CoA thioesterase activity"
+ /protein_id="CAB5247874.1"
+ /translation="MAALPAPEKLLRSDFPVLWPVGTRWADNDMFGHLNNAVYYQLFD
+ TAINAWINTSTGVDPLAMPVLGIVAESGCRYFSELRFPESLMVGLAVTRLGRSSVTYR
+ LGVFKEPDDAGVITALGHWVHVYVDRTSRRPVPIPEAIRSLLSTACVSG"
+ gene 193816..194301
+ /gene="TB18.5"
+ /locus_tag="BQ2027_MB0169"
+ CDS 193816..194301
+ /gene="TB18.5"
+ /locus_tag="BQ2027_MB0169"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0169, TB18.5, len: 161 aa. Equivalent to Rv0164,
+ len: 161 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 161 aa overlap). TB18.5, conserved
+ hypothetical protein, equivalent to CAB08818.1|Z95398
+ HYPOTHETICAL PROTEIN from Mycobacterium leprae (156 aa)
+ FASTA scores: opt: 762, E(): 0, (76.3% identity in 152 aa
+ overlap). Some similarity to Rv2185c, Rv0854, Rv0857 from
+ Mycobacterium tuberculosis. Alternative start codon has
+ been suggested. 3' part corrected since first submission
+ (-24 aa). Protein product from Mb0169 detected using
+ shotgun mass spectrometry. Mb0169 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Cyclase/dehydrase family protein"
+ /protein_id="CAB5247875.1"
+ /translation="MTAISCSPRPRYASRMPVLSKTVEVTADAASIMAIVADIERYPE
+ WNEGVKGAWVLARYDDGRPSQVRLDTAVQGIEGTYIHAVYYPGENQIQTVMQQGELFA
+ KQEQLFSVVATGAASLLTVDMDVQVTMPVPEPMVKMLLNNVLEHLAENLKQRAEQLAA
+ S"
+ gene complement(194315..195007)
+ /gene="mce1r"
+ /locus_tag="BQ2027_MB0170C"
+ CDS complement(194315..195007)
+ /gene="mce1r"
+ /locus_tag="BQ2027_MB0170C"
+ /note="Mb0170c, len: 230 aa. Equivalent to Rv0165c len:
+ 223 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (81.2% identity in 218 aa overlap). Probable
+ mce1R,transcriptional regulator, GntR family (See Casali
+ et al.,2006), showing some similarity to several e.g.
+ NTRA_CHELE|P54988 nta operon transcriptional regulator
+ (231 aa), FASTA scores: opt: 154, E(): 0.00058, (32.0%
+ identity in 125 aa overlap); P46833|GNTR_BACLI gluconate
+ operon transcriptional repressor from Bacillus
+ licheniformis (243 aa); GNTR_BACSU gluconate operon
+ repressor from Bacillus subtilis (243 aa). Also similar to
+ Rv0043c from Mycobacterium tuberculosis. Seems to belong
+ to the GntR family of transcriptional regulators. Start
+ changed since first submission (-41 aa).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0165c exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a 2 bp
+ insertion (*-cc) leads to a product with a different COOH
+ terminus. Mb0170c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable transcriptional regulatory protein
+ Mce1R (probably GntR-family)"
+ /protein_id="CAB5247876.1"
+ /translation="MNAPLSAKPRSQLPLRRAQLSDEVAGHLRAAIMSGALRSGTFIR
+ LDETAAELGVSVTPVREALLKLRGEGMVGLEPHRGHVVLPLTRQDIDDIFWLQATIAQ
+ ELATSATAHITDVEIDELDRINNALAGAIGSGDAKTIASIEFAFHRVFNKASRRIKLA
+ WFLLNAARYMPAQVFAADPRWGADAVNSHRQLIAALRRRDTAAVIEHTVWQFTDGARR
+ LTEALAETEVFG"
+ gene 195185..196849
+ /gene="fadD5"
+ /locus_tag="BQ2027_MB0172"
+ CDS 195185..196849
+ /gene="fadD5"
+ /locus_tag="BQ2027_MB0172"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0172, fadD5, len: 554 aa. Equivalent to Rv0166,
+ len: 554 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 554 aa overlap). Probable fadD5,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), similar to many eg
+ LCFA_ECOLI|P29212 long-chain-fatty-acid--CoA ligase (561
+ aa), FASTA scores: opt: 612, E(): 0, (29.4% identity in
+ 534 aa overlap). Also similar to many other fatty-acid-CoA
+ ligases from Mycobacterium tuberculosis e.g. MTCY07A7.11c
+ FASTA score: (35.3% identity in 487 aa overlap),
+ MTV013_10, MTY25D10_30, etc. Contains PS00455 putative
+ AMP-binding domain signature. Protein product from Mb0172
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0172 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY-ACID-CoA LIGASE FADD5
+ (FATTY-ACID-CoA SYNTHETASE) (FATTY-ACID-CoA SYNTHASE)"
+ /protein_id="CAB5247877.1"
+ /translation="MTAQLASHLTRALTLAQQQPYLARRQNWVNQLERHAMMQPDAPA
+ LRFVGNTMTWADLRRRVAALAGALSGRGVGFGDRVMILMLNRTEFVESVLAANMIGAI
+ AVPLNFRLTPTEIAVLVEDCAAHVMLTEAALAPVAIGVRNIQPLLSVIVVAGGSSQDS
+ VFGYEDLLNEAGDVHEPVDIPNDSPALIMYTAGTTGRPKGAVLTHANLTGQAMTALYT
+ SGANINSDVGFVGVPLFHIAGIGNMLTGLLLGLPTVIYPLGAFDPGQLLDVLEAEKVT
+ GIFLVPAQWQAVCTEQQARPRDLRLRVLSWGAAPAPDALLRQMSATFPETQILAAFGQ
+ TEMSPVTCMLLGEDAIAKRGSVGRVIPTVAARVVDQNMNDVPVGEVGEIVYRAPTLMS
+ CYWNNPEATAEAFAGGWFHSGDLVRMDSDGYVWVVDRKKDMIISGGENIYCAELENVL
+ ASHPDIAEVAVIGRADEKWGEVPIAVAAVTNDDLRIEDLGEFLTDRLARYKHPKALEI
+ VDALPRNPAGKVLKTELRLRYGACVNVERRSASAGFTERRENRQKL"
+ gene 197053..197850
+ /gene="yrbE1A"
+ /locus_tag="BQ2027_MB0173"
+ CDS 197053..197850
+ /gene="yrbE1A"
+ /locus_tag="BQ2027_MB0173"
+ /note="Mb0173, yrbE1A, len: 265 aa. Equivalent to Rv0167,
+ len: 265 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 265 aa overlap). yrbE1A, hypothetical
+ unknown integral membrane protein, part of mce1 operon and
+ member of YrbE family (see citations below for more
+ information), highly similar to Mycobacterium tuberculosis
+ proteins O07791|Rv0587|MTCY19H5.35|yrbE2A (265 aa);
+ O53965|Rv1964|MTV051.02|yrbE3A (265 aa); etc. Also highly
+ similar or similar to conserved hypothetical integral
+ membrane proteins of yrbEA type, e.g.
+ NP_302654.1|NC_002677 conserved membrane protein from
+ Mycobacterium leprae (267 aa); P45030|YRBE_HAEIN|HI1086
+ hypothetical protein from Haemophilus influenzae (261 aa),
+ FASTA scores: opt: 328, E(): 1.8e-15, (26.6% identity in
+ 244 aa overlap); etc. Protein product from Mb0173 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0173 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved integral membrane protein yrbe1a"
+ /protein_id="CAB5247878.1"
+ /translation="MTTSTTLGGYVRDQLQTPLTLVGGFFRMCVLTGKALFRWPFQWR
+ EFILQCWFIMRVGFLPTIMVSIPLTVLLIFTLNILLAQFGAADISGSGAAIGAVTQLG
+ PLTTVLVVAGAGSTAICADLGARTIREEIDAMEVLGIDPIHRLVVPRVLASMLVATLL
+ NGLVITVGLVGGFLFGVYLQNVSGGAYLATLTLITGLPEVVIATIKAATFGLIAGLVG
+ CYRGLTVRGGSKGLGTAVNETVVLCVIALFAVNVILTTIGVRFGTGR"
+ gene 197852..198721
+ /gene="yrbE1B"
+ /locus_tag="BQ2027_MB0174"
+ CDS 197852..198721
+ /gene="yrbE1B"
+ /locus_tag="BQ2027_MB0174"
+ /note="Mb0174, yrbE1B, len: 289 aa. Equivalent to Rv0168,
+ len: 289 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 289 aa overlap). yrbE1B, hypothetical
+ unknown integral membrane protein, part of mce1 operon and
+ member of YrbE family (see citations below for more
+ information), highly similar to Mycobacterium tuberculosis
+ proteins O07790|Rv0588|MTCY19H5.34|yrbE2B (295 aa);
+ O53966|Rv1965|MTV051.03|yrbE3B (271 aa); etc. Also highly
+ similar to conserved hypothetical integral membrane
+ proteins of the yrbEB type, e.g. NP_302655.1|NC_002677
+ conserved membrane protein from Mycobacterium leprae (289
+ aa); P45030|YRBE_HAEIN|HI1086 hypothetical protein from
+ Haemophilus influenzae (261 aa), FASTA scores: opt: 223,
+ E(): 7.6e-07, (23.7% identity in 257 aa overlap); etc.
+ Mb0174 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved integral membrane protein yrbe1b"
+ /protein_id="CAB5247879.1"
+ /translation="MSTAAVLRARFPRAVANLRQYGGAAARGLDEAGQLTWFALTSIG
+ QIAHALRYYRKETLRLIAQIGMGTGAMAVVGGTVAIVGFVTLSGSSLVAIQGFASLGN
+ IGVEAFTGFFAALINVRIAGPVVTGVALAATVGAGATAELGAMRISEEIDALEVMGIK
+ SISFLASTRIMAGLVVIIPLYALAMIMSFLSPQITTTVLYGQSNGTYEHYFQTFLRPD
+ DVFWSFLEALIITAIVMVSHCYYGYAAGGGPVGVGEAVGRSMRFSLVSVQVVVLFAAL
+ ALYGVDPNFNLTV"
+ gene 198726..200090
+ /gene="mce1A"
+ /locus_tag="BQ2027_MB0175"
+ CDS 198726..200090
+ /gene="mce1A"
+ /locus_tag="BQ2027_MB0175"
+ /standard_name="mce1"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0175, mce1A, len: 454 aa. Equivalent to Rv0169,
+ len: 454 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 454 aa overlap). mce1A; belongs to
+ 24-membered Mycobacterium tuberculosis Mce protein family
+ (see citations below for more information), highly similar
+ to Mycobacterium tuberculosis proteins
+ O07789|MCE2|Rv0589|MTCY19H5.33c|mce2A (404 aa);
+ O53967|MCE3|Rv1966|MTV051.04|mce3A (425 aa); etc. Also
+ highly similar to others e.g.
+ AAD52105.1|AF113402_1|AF113402 mycobacterial cell entry
+ protein from Mycobacterium bovis BCG (454 aa);
+ NP_302656.1|NC_002677 putative cell invasion protein from
+ Mycobacterium leprae (441 aa); AAA92845.1|U26018 mce gene
+ product from Mycobacterium avium (88 aa) (similarity on
+ C-terminus); CAC12798.1|AL445327 putative secreted protein
+ from Streptomyces coelicolor (418 aa); etc. Note that
+ equivalent, but longer 22 aa, to P72013|CAA50257.1|X70901
+ Mcep protein from Mycobacterium tuberculosis (432 aa).
+ Contains a very hydrophobic region around residues 20-35.
+ Note that previously known as mce1. Protein product from
+ Mb0175 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0175 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MCE-FAMILY PROTEIN MCE1A"
+ /protein_id="CAB5247880.1"
+ /translation="MTTPGKLNKARVPPYKTAGLGLVLVFALVVALVYLQFRGEFTPK
+ TQLTMLSARAGLVMDPGSKVTYNGVEIGRVDTISEVTRDGESAAKFILDVDPRYIHLI
+ PANVNADIKATTVFGGKYVSLTTPKNPTKRRITPKDVIDVRSVTTEINTLFQTLTSIA
+ EKVDPVKLNLTLSAAAEALTGLGDKFGESIVNANTVLDDLNSRMPQSRHDIQQLAALG
+ DVYADAAPDLFDFLDSSVTTARTINAQQAELDSALLAAAGFGNTTADVFDRGGPYLQR
+ GVADLVPTATLLDTYSPELFCTIRNFYDADPLAKAAAGGGNGYSLRTNSEILSGIGIS
+ LLSPLALATNGAAIGIGLVAGLIASPLAVAANLAGALPGIVGGAPNPYTYPENLPRVN
+ ARGGPGGAPGCWQPITRDLWPAPYLVMDTGASLAPYNHMEVGSPYAVEYVWGRQVGDN
+ TINP"
+ gene 200087..201127
+ /gene="mce1B"
+ /locus_tag="BQ2027_MB0176"
+ CDS 200087..201127
+ /gene="mce1B"
+ /locus_tag="BQ2027_MB0176"
+ /standard_name="mceD"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0176, mce1B, len: 346 aa. Equivalent to Rv0170,
+ len: 346 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 346 aa overlap). mce1B (alternate gene
+ name: mceD); belongs to 24-membered Mycobacterium
+ tuberculosis Mce protein family (see citations below for
+ more information), highly similar to Mycobacterium
+ tuberculosis proteins O07788|Rv0590|MTCY19H5.32c|mce2B
+ (275 aa); O53968|Rv1967|MTV051.05|mce3B (342 aa); etc.
+ Also highly similar to others e.g. NP_302657.1|NC_002677
+ putative secreted protein from Mycobacterium leprae (346
+ aa); CAC12797.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (354 aa); etc. Contains
+ hydrophobic region in N-terminal 30 residues. In
+ Escherichia coli, N-terminal part is functional and
+ directs export of a leaderless beta-lactamase into the
+ periplasm (see seventh citation). Protein product from
+ Mb0176 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0176 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MCE-FAMILY PROTEIN MCE1B"
+ /protein_id="CAB5247881.1"
+ /translation="MKITGTVVKLGIVSVVLLFFTVMIIVIFGQMRFDRTNGYTAEFS
+ NVSGLRQGQFVRASGVEIGKVKALHLVDGGRRVRVEFNIDRSVPLYQSTTAQIRYSDL
+ IGNRYVELKRGEGKGANDLLPPGGLIPLSRTSPALDLDALIGGFKPVFRALDPAKVNN
+ IANALITVFQGQGGTINDTLDQTAQLTSQIAERDQAIGEVVKNLNIVLDTTVKHRKEF
+ DETVNNLENLITGLRNHSDQLAGGLAHISNGAGTVADLLAENRTLVRKAVSYLDAIQQ
+ PVIDQRVELDDLLHKTPTALTALGRANGTYGDFQNFYLCDLQIKWNGFQAGGPVRTVK
+ LFSQPTGRCTPQ"
+ gene 201124..202671
+ /gene="mce1C"
+ /locus_tag="BQ2027_MB0177"
+ CDS 201124..202671
+ /gene="mce1C"
+ /locus_tag="BQ2027_MB0177"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0177, mce1C, len: 515 aa. Equivalent to Rv0171,
+ len: 515 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 515 aa overlap). mce1C; belongs to
+ 24-membered Mycobacterium tuberculosis Mce protein family
+ (see citations below for more information), highly similar
+ to Mycobacterium tuberculosis proteins
+ O07787|Rv0591|MTCY19H5.31|mce2C (481 aa);
+ O53969|Rv1968|MTV051.06|mce3C (410 aa); etc. Also highly
+ similar to others e.g. NP_302658.1|NC_002677 putative
+ secreted protein from Mycobacterium leprae (519 aa);
+ CAC12796.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (351 aa); etc. Weakly similar to
+ downstream ORF Rv0172|MTCI28.12|mce1D (530 aa), FASTA
+ score: (24.6% identity in 552 aa overlap). Contains
+ possible signal sequence and highly proline-rich
+ C-terminus. Protein product from Mb0177 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0177 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MCE-FAMILY PROTEIN MCE1C"
+ /protein_id="CAB5247882.1"
+ /translation="MRTLEPPNRMRIGLMGIVVALLVVAVGQSFTSVPMLFAKPSYYG
+ QFTDSGGLHKGDRVRIAGLGVGTVEGLKIDGDHIVVKFSIGTNTIGTESRLAIRTDTI
+ LGRKVLEIEPRGAQALPPGGVLPVGQSTTPYQIYDAFFDVTKAASGWDIETVKRSLNV
+ LSETVDQTYPHLSAALDGVAKFSDTIGKRDEQITHLLAQANQVASILGDRSDQVDRLL
+ VNAKTLIAAFNERGRAVDALLGNISAFSAQVQNLINDNPNLNHVLEQLRILTDLLVDR
+ KEDLAETLTILGRFSASFGETFASGPYFKVLLANLVPGQILQPFVDAAFKKRGISPED
+ FWRSAGLPAYRWPDPNGTRFPNGAPPPPPPVLEGTPEHPGPAVPPGSPCSYTPPADGL
+ PRPWDPLPCANLTQGPFGGPDFPAPLDVATSPPNPDGPPPAPGLPIAGRPGEVPPNVP
+ GTPVPIPQEAPPGARTLPLGPAPGPAPPPAAPGPPAPPGPGPQLPAPFINPGGTGGSG
+ VTGGSEN"
+ gene 202668..204260
+ /gene="mce1D"
+ /locus_tag="BQ2027_MB0178"
+ CDS 202668..204260
+ /gene="mce1D"
+ /locus_tag="BQ2027_MB0178"
+ /note="Mb0178, mce1D, len: 530 aa. Equivalent to Rv0172,
+ len: 530 aa, fromMycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 530 aa overlap). mce1D; belongs to
+ 24-membered Mycobacterium tuberculosis Mce protein family
+ (see citations below for more information), highly similar
+ to Mycobacterium tuberculosis proteins
+ O07786|Rv0592|MTCY19H5.30c|mce2D (508 aa);
+ O53970|Rv1969|MTV051.07|mce3D (423 aa); etc. Also highly
+ similar to others e.g. NP_302659.1|NC_002677 putative
+ secreted protein from Mycobacterium leprae (531 aa);
+ CAC12795.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (337 aa); etc. Hydrophobic region
+ at N-terminus. Protein product from Mb0178 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0178 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MCE-FAMILY PROTEIN MCE1D"
+ /protein_id="CAB5247883.1"
+ /translation="MSTIFDIRNLRLPQLSRASVVIGSLVVVLALAAGIVGVRLYQKL
+ TNNTVVAYFTQANALYVGDKVQIMGLPVGSIDKIEPAGDKMKVTFHYQNKYKVPANAS
+ AVILNPTLVASRNIQLEPPYRGGPVLADNAVIPVERTQVPTEWDELRDSVSHIIDELG
+ PTPEQPKGPFGEVIEAFADGLAGKGKQINTTLNSLSQALNALNEGRGDFFAVVRSLAL
+ FVNALHQDDQQFVALNKNLAEFTDRLTHSDADLSNAIQQFDSLLAVARPFFAKNREVL
+ THDVNNLATVTTTLLQPDPLDGLETVLHIFPTLAANINQLYHPTHGGVVSLSAFTNFA
+ NPMEFICSSIQAGSRLGYQESAELCAQYLAPVLDAIKFNYFPFGLNVASTASTLPKEI
+ AYSEPRLQPPNGYKDTTVPGIWVPDTPLSHRNTQPGWVVAPGMQGVQVGPITQGLLTP
+ ESLAELMGGPDIAPPSSGLQTPPGPPNAYDEYPVLPPIGLQAPQVPIPPPPPGPDVIP
+ GPVPPTPAPVGAPLPAEAGGGQ"
+ gene 204257..205429
+ /gene="lprK"
+ /locus_tag="BQ2027_MB0179"
+ CDS 204257..205429
+ /gene="lprK"
+ /locus_tag="BQ2027_MB0179"
+ /standard_name="mce1E"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0179, lprK, len: 390 aa. Equivalent to Rv0173,
+ len: 390 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 390 aa overlap). Possible lprK
+ (alternate gene name: mce1E), lipoprotein which belongs to
+ 24-membered Mycobacterium tuberculosis Mce protein family
+ (see citations below for more information), highly similar
+ to Mycobacterium tuberculosis proteins
+ O07785|LPRL|Rv0593|MTCY19H5.29|mce2E (402 aa);
+ O53971|LPRM|Rv1970|MTV051.08|mce3E (377 aa); etc. Also
+ highly similar to others e.g. NP_302660.1|NC_002677
+ putative lipoprotein from Mycobacterium leprae (392 aa);
+ CAC12794.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (413 aa); etc. Contains PS00013
+ prokaryotic membrane lipoprotein lipid attachment site.
+ Protein product from Mb0179 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0179 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MCE-FAMILY LIPOPROTEIN LPRK (MCE-FAMILY
+ LIPOPROTEIN MCE1E)"
+ /protein_id="CAB5247884.1"
+ /translation="MMSVLARMRVMRHRAWQGLVLLVLALLLSSCGWRGISNVAIPGG
+ PGTGPGSYTIYVQMPDTLAINGNSRVMVADVWVGSIRAIKLKNWVATLTLSLKKDVTL
+ PKNATAKIGQTSLLGSQHVELAAPPDPSPVPLKDGDTIPLKRSSAYPTTEQTLASIAT
+ LLRGGGLVNLEGIQQEINAIVTGRADQIRAFLGKLDTFTDELNQQRDDITRAIDSTNR
+ LLAYVGGRSEVLNRVLTDLPPLIKHFADKQELLINASDAVGRLSQSADQYLSAARGDL
+ HQDLQALQCPLKELRRAAPYLVGALKLILTQPFDVDTVPQLVRGDYMNLSLTLDLTYS
+ AIDNAFLTGTGFSGALRALEQSFGRDPETMIPDIRYTPNPNDAPGGPLVERGNRQC"
+ gene 205423..206970
+ /gene="mce1F"
+ /locus_tag="BQ2027_MB0180"
+ CDS 205423..206970
+ /gene="mce1F"
+ /locus_tag="BQ2027_MB0180"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0180, mce1F, len: 515 aa. Equivalent to Rv0174,
+ len: 515 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 515 aa overlap). mce1F; belongs to
+ 24-membered Mycobacterium tuberculosis Mce protein family
+ (see citations below for more information), similar to
+ Mycobacterium tuberculosis proteins
+ O07784|Rv0594|MTCY19H5.28c|mce2F (516 aa);
+ O53972|Rv1971|MTV051.09|mce3F (437 aa); etc. Also highly
+ similar to others e.g. NP_302661.1|NC_002677 putative
+ secreted protein from Mycobacterium leprae (516 aa);
+ AAF74993.1|AF143400_1|AF143400|996A027a protein from
+ Mycobacterium avium (80 aa) (similarity on C-terminus);
+ CAC12793.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (433 aa); etc. Has hydrophobic
+ stretch, possibly a signal peptide at the N-terminus.
+ Protein product from Mb0180 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0180 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MCE-FAMILY PROTEIN MCE1F"
+ /protein_id="CAB5247885.1"
+ /translation="MLTRFIRRQLILFAIVSVVAIVVLGWYYLRIPSLVGIGQYTLKA
+ DLPASGGLYPTANVTYRGITIGKVTAVEPTDQGARVTMSIASNYKIPVDASANVHSVS
+ AVGEQYIDLVSTGAPGKYFSSGQTITKGTVPSEIGPALDNSNRGLAALPTEKIGLLLD
+ ETAQAVGGLGPALQRLVDSTQAIVGDFKTNIGDVNDIIENSGPILDSQVNTGDQIERW
+ ARKLNNLAAQTATRDQNVRSILSQAAPTADEVNAVFSGVRDSLPQTLANLEVVFDMLK
+ RYHAGVEQLLVFLPQGAAIAQTVLTPTPGAAQLPLAPAINYPPPCLTGFLPASEWRSP
+ ADTSPRPLPSGTYCKIPQDAQLQVRGARNIPCVDVPGKRAATPKECRSKDPYVPLGTN
+ PWFGDPNQILTCPAPGARCDQPVKPGLVIPAPSINTGLNPAPADQVQGTPPPVSDPLQ
+ RPGSGTVQCNGQQPNPCVYTPTSGPSAVYSPASGELVGPDGVKYAVANSSTTGDDGWK
+ EMLAPAS"
+ gene 207006..207647
+ /locus_tag="BQ2027_MB0181"
+ CDS 207006..207647
+ /locus_tag="BQ2027_MB0181"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0181, -, len: 213 aa. Equivalent to Rv0175, len:
+ 213 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 213 aa overlap). Probable conserved
+ Mce-associated membrane protein, equivalent, but longer in
+ N-terminus, to CAC32127.1|AL583926 possible membrane
+ protein from Mycobacterium leprae (182 aa). Also similar
+ to mce-associated proteins from Mycobacterium tuberculosis
+ e.g. Rv1363c, Rv0177, Rv1973, etc. Contains two 12 residue
+ direct repeats at N-terminus. Protein product from Mb0181
+ detected using shotgun mass spectrometry. Mb0181 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MCE ASSOCIATED MEMBRANE
+ PROTEIN"
+ /protein_id="CAB5247886.1"
+ /translation="MKAADSAESDAGADQTGPQVKAADSAESDAGELGEDACPEQALV
+ ERRPSRLRRGWLVGIAATLLALAGGLGAAGYFALRSHQESQSIAREDLAAIEAAKDCV
+ AATQAPDAGAMSASMQKIIECGTGDFGAQASLYTSMLVEAYQAASVHVQVTDMRAAVE
+ RNNNDGSVDVLVALRVKVSNTDSDAHEVGYRLRVRMALDEGRYKIAKLDQVTK"
+ gene 207644..208612
+ /locus_tag="BQ2027_MB0182"
+ CDS 207644..208612
+ /locus_tag="BQ2027_MB0182"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0182, -, len: 322 aa. Equivalent to Rv0176, len:
+ 322 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 322 aa overlap). Probable conserved
+ Mce-associated transmembrane protein. Contains short
+ region of similarity to PRA_MYCLE|P41484 proline-rich
+ antigen (36 kDa antigen) from Mycobacterium leprae (249
+ aa) (outside the proline-rich region), FASTA scores: opt:
+ 165, E(): 2.9e-05, (40.0% identity in 65 aa overlap). Also
+ similar to mce-associated proteins from Mycobacterium
+ tuberculosis e.g. Rv1363c, Rv0177, Rv3493c, etc. Protein
+ product from Mb0182 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0182 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MCE ASSOCIATED TRANSMEMBRANE
+ PROTEIN"
+ /protein_id="CAB5247887.1"
+ /translation="MTVVVEKTPTTLPQATPNGAAPWHVRAGAFAIDVLPGLAVAATM
+ ALTALTVPPGSAWRWLCACLLGLTILLLAVNRLLLPTITGWSLGRALTGIRVVRRDGS
+ AIGPWRLLVRDLAHLVDTLSLFVGWLWPLWDSRRRTFADLLLRTEVRRVEPVQRPAVI
+ RRLTAAVALAAAGACASATAVGAAVVYVNEWQTDHTRAQLATRGPKLVVDVLSYDPET
+ VQRDFERARSLATDRYRPQLSIQQDSVRESGPVRNQYWVTDSAVLSATPAQATMLLFM
+ QGERGTPPNQRYISATVRAIFQKSRGQWRLDDLAVVMKPRQPTGEK"
+ gene 208609..209163
+ /locus_tag="BQ2027_MB0183"
+ CDS 208609..209163
+ /locus_tag="BQ2027_MB0183"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0183, -, len: 184 aa. Equivalent to Rv0177, len:
+ 184 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 184 aa overlap). Probable conserved
+ Mce-associated protein, equivalent to CAC32129.1|AL583926
+ conserved membrane protein from Mycobacterium leprae (184
+ aa). Also similar to mce-associated proteins from
+ Mycobacterium tuberculosis e.g. Rv1363c, Rv1973, Rv3493c,
+ etc. Protein product from Mb0183 detected using shotgun
+ mass spectrometry. Mb0183 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MCE ASSOCIATED PROTEIN"
+ /protein_id="CAB5247888.1"
+ /translation="MSPRRKFEPGEGALLAPQSIEPSRRWGLPLALTASAVVMAAAIS
+ ACALMRISHESHQRAAHKDIVMLSDVRSFMTMFTSPDPFHANEYAERVLSHATGDFAK
+ QYHERANDILIRISGVEPTTGTVLDAGVQRWNEDGSANVLVVTQITSKSADGKRVVSN
+ ANRWLVTAKQEGNEWKISSLLPVI"
+ gene 209130..209864
+ /locus_tag="BQ2027_MB0184"
+ CDS 209130..209864
+ /locus_tag="BQ2027_MB0184"
+ /note="Mb0184, -, len: 244 aa. Equivalent to Rv0178, len:
+ 244 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 244 aa overlap). Probable conserved
+ Mce-associated membrane protein, highly similar in
+ C-terminus to CAC32130.1|AL583926 putative secreted
+ protein from Mycobacterium leprae (184 aa). Also similar
+ to mce-associated proteins from Mycobacterium tuberculosis
+ e.g. Rv1363c, Rv0177, Rv1973, etc. Note that there is a 10
+ aa overlap with the upstream ORF. Protein product from
+ Mb0184 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0184 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MCE ASSOCIATED MEMBRANE
+ PROTEIN"
+ /protein_id="CAB5247889.1"
+ /translation="MEDQQSASGDLTQKSVANGESTDTASAATEGHRGEIDAAGEPDE
+ RGAAVADSQADEDDSAATAARGGKTRARRSRGRRLAITVGVAAALFVGSAAFAGATVE
+ PYLSERAVVATKLMVARTAANAITTLWTYTPENMDTLADRAANYLSGDFAAQYRRFVD
+ QIAAANKQAKITNDTEVTGAAVESLSGRDAVAIVYTNTTTTSPVTKNIPALKYLSYRL
+ FMKRYDARWLVTRMTTITSLDLTPQV"
+ gene complement(209895..211004)
+ /gene="lprO"
+ /locus_tag="BQ2027_MB0185C"
+ CDS complement(209895..211004)
+ /gene="lprO"
+ /locus_tag="BQ2027_MB0185C"
+ /note="Mb0185c, lprO, len: 369 aa. Equivalent to Rv0179c,
+ len: 369 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 369 aa overlap). Possible lprO,
+ lipoprotein (visibly not conserved). Contains possible
+ N-terminal signal sequence and PS00013 Prokaryotic
+ membrane lipoprotein lipid attachment site. Protein
+ product from Mb0185c detected using SWATH mass
+ spectrometry. Mb0185c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible lipoprotein lpro"
+ /protein_id="CAB5247890.1"
+ /translation="MWIRAERVAVLTPTASLRRLTACYAALAVCAALACTTGQPAARA
+ ADGREMLAQAIATTRGSYLVYNFGGGHPMPLLNAGGHWYEMNNGGHLMIIKNASQRLS
+ PHLLVDTHTGDQARCEHNPGAHTGEGLWQASEIYPPLKAWQRMGRPTIAVNANFFDVR
+ GQKGGSWRSTGCSSPLGAYVDNTRGQGRANQAVTGTVAYAGKQGLSGGNELWSSLTTM
+ ILPVGGAPYVLRPKSRQDYDLATPVIEDLLNKNARFVAVAGIGLLSPGNTGQLHDGGP
+ SAARTALAYAKQKDEMYIFQGGNYTPDNIQDLFRGLGSDTAILLDGGGSSAIVLRRDT
+ GGMWAGAGSPKGSCDTRQVLCDSHERALPSWLAFN"
+ gene complement(211084..212442)
+ /gene="Mb0186c"
+ /locus_tag="BQ2027_MB0186C"
+ CDS complement(211084..212442)
+ /gene="Mb0186c"
+ /locus_tag="BQ2027_MB0186C"
+ /note="Mb0186c -, len: 452 aa. Equivalent to Rv0180c, len:
+ 452 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 452 aa overlap). Probable conserved
+ transmembrane protein, equivalent to CAC32132.1|AL583926
+ probable conserved membrane protein from Mycobacterium
+ leprae (465 aa). Shows some similarity with others
+ membrane proteins e.g. AL096849|SCI11_29 from Streptomyces
+ coelicolor (354 aa), FASTA scores: opt: 190, E(): 0.00067,
+ (25.9% identity in 409 aa overlap). Protein product from
+ Mb0186c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247891.1"
+ /translation="MSQAQPRPAAPNPKRNVKAIRTVRFWMAPIATTLALMSALAALY
+ LGGILNPMTNLRHFPIALVNEDAGPAGQQIVDGLVSGLDKNKFDIRVVSPDEARRLLD
+ TAAVYGSALIPPTFSSQLRDFGASAVTPTRTDRPAITISTNPRAGTLAASIAGQTLTR
+ ALTVVNGKVGERLTAEVAAQTGGVALAGAAAAGLASPIDVKSTAYNPLPNGTGNGLSA
+ FYYALLLLLAGFTGSIVVSTLVDSMLGYVPAEFGPVYRFAEQVNISRFRTLLVKWAVM
+ VVLALLTSGVYLAIAHGLGMPIPLGWQVWLYGVFAIIAVGVTSSSLIAVLGSMGLLVS
+ MLIFVILGLPSAGATVPLEAVPAFFRWLAQFEPMHQVFLGVRSLLYLNGNADAGLSQA
+ LTMTSIGLIIGLLLGGFITHLYDRSSFHRIPGAVEMAIAVEHQAQYQARQSARESSSE
+ QP"
+ gene complement(212469..213203)
+ /locus_tag="BQ2027_MB0187C"
+ CDS complement(212469..213203)
+ /locus_tag="BQ2027_MB0187C"
+ /note="Mb0187c, -, len: 244 aa. Equivalent to Rv0181c,
+ len: 244 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 244 aa overlap). Conserved
+ hypothetical protein, highly similar to other hypothetical
+ proteins e.g. YHHW_ECOLI|P46852 hypothetical 26.3 kd
+ protein from Escherichia coli (231 aa), FASTA scores: opt:
+ 479, E(): 1.2e-29, (37.3% identity in 233 aa overlap);
+ P73623|SLL1773 HYPOTHETICAL 25.7 KD PROTEIN from
+ Synechocystis sp. strain PCC 6803 (232 aa), FASTA score:
+ (39.1% identity in 233 aa overlap). Protein product from
+ Mb0187c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0187c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Pirin"
+ /protein_id="CAB5247892.1"
+ /translation="MTATVEIRRAADRAVTTTSWLKSRHSFSFGDHYDPDNTHHGLLL
+ VNNDDQMEPASGFDPHPHRDMEIVTWVLRGALRHQDSAGNSGVIYPGLAQRMSAGTGI
+ LHSEMNDSATEPVHFVQMWVIPDATGITASYQQQEIDDELLRAGLVTIASGIPGQDAA
+ LTLHNSSASLHGARLRPGATVSLPCAPFLHLFVAYGRLTLEGGGELADGDAVRFTDAD
+ ARGLTANEPSEVLIWEMHAKLGDSAT"
+ gene complement(213220..214332)
+ /gene="sigG"
+ /locus_tag="BQ2027_MB0188C"
+ CDS complement(213220..214332)
+ /gene="sigG"
+ /locus_tag="BQ2027_MB0188C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0188c, sigG, len: 370 aa. Equivalent to Rv0182c,
+ len: 370 aa (start site uncertain; first of several
+ possibles was chosen, but note that this overlaps the
+ upstream ORF), from Mycobacterium tuberculosis strain
+ H37Rv, (100.0% identity in 370 aa overlap). Probable sigG,
+ alternative RNA polymerase sigma subunit (see citations
+ below), similar to many e.g. Q45585|SIGW_BACSU RNA
+ POLYMERASE SIGMA FACTOR from Bacillus subtilis (187 aa).
+ Also similar to nine other ECF sigma factors from
+ Mycobacterium tuberculosis e.g. Rv1221, Rv0735, etc.
+ Contains PS01063 Sigma-70 factors ECF subfamily signature
+ and probable helix-turn helix motif from aa 205-226 (Score
+ 1181, +3.21 SD). BELONGS TO THE SIGMA-70 FACTOR FAMILY,
+ ECF SUBFAMILY. Protein product from Mb0188c detected using
+ SWATH mass spectrometry. Mb0188c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ALTERNATIVE RNA POLYMERASE SIGMA FACTOR
+ SIGG (RNA POLYMERASE ECF TYPE SIGMA FACTOR)"
+ /protein_id="CAB5247893.1"
+ /translation="MRTSPMPAKFRSVRVVVITGSVTAAPVRVSETLRRLIDVSVLAE
+ NSGREPADERRGDFSAHTEPYRRELLAHCYRMTGSLHDAEDLVQETLLRAWKAYEGFA
+ GKSSLRTWLHRIATNTCLTALEGRRRRPLPTGLGRPSADPSGELVERREVSWLEPLPD
+ VTDDPADPSTIVGNRESVRLAFVAALQHLSPRQRAVLLLRDVLQWKSAEVADAIGTST
+ VAVNSLLQRARSQLQTVRPSAADRLSAPDSPEAQDLLARYIAAFEAYDIDRLVELFTA
+ EAIWEMPPYTGWYQGAQAIVTLIHQQCPAYSPGDMRLISLIANGQPAAAMYMRAGDVH
+ LPFQLHVLDMAADRVSHVVAFLDTTLFPKFGLPDSL"
+ gene 214280..215119
+ /locus_tag="BQ2027_MB0189"
+ CDS 214280..215119
+ /locus_tag="BQ2027_MB0189"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0189, -, len: 279 aa. Equivalent to Rv0183, len:
+ 279 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 279 aa overlap). Possible
+ lysophospholipase (EC 3.1.-.-), similar to several
+ (especially eukaryotic enzymes, weaker with Escherichia
+ coli), e.g. U67963|HSU67963_1 Human lysophospholipase
+ homolog from Homo sapiens (313 aa), FASTA scores: opt:
+ 569, E(): 2.6e-29, (37.1% identity in 259 aa overlap);
+ P07000|PLDB_ECOLI LYSOPHOSPHOLIPASE L2 from Escherichia
+ coli (165 aa), FASTA scores: opt: 219, E(): 0.00012. Start
+ changed based on similarity to AE001997_8 from Deinococcus
+ radiodurans (282 aa), FASTA scores: opt: 510, E():
+ 1.4e-25, (34.8% identity in 282 aa overlap). Also shows
+ some similarity to epoxide hydrolases from Mycobacterium
+ tuberculosis e.g. Rv1938 FASTA score: (30.7% identity in
+ 114 aa overlap); and
+ O07214|YR15_MYCTU|Rv2715|MT2788|MTCY05A6.36 (341 aa). Note
+ that the putative product of this CDS corresponds to spot
+ 3_329 identified in culture supernatant by proteomics at
+ the Max-Planck-Institut fuer Infektionsbiologie (see
+ citations below). Protein product from Mb0189 detected
+ using shotgun mass spectrometry. Mb0189 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE LYSOPHOSPHOLIPASE"
+ /protein_id="CAB5247894.1"
+ /translation="MTTTRTERNFAGIGDVRIVYDVWTPDTAPQAVVVLAHGLGEHAR
+ RYDHVAQRLGAAGLVTYALDHRGHGRSGGKRVLVRDISEYTADFDTLVGIATREYPGC
+ KRIVLGHSMGGGIVFAYGVERPDNYDLMVLSAPAVAAQDLVSPVVAVAAKLLGVVVPG
+ LPVQELDFTAISRDPEVVQAYNTDPLVHHGRVPAGIGRALLQVGETMPRRAPALTAPL
+ LVLHGTDDRLIPIEGSRRLVECVGSADVQLKEYPGLYHEVFNEPERNQVLDDVVAWLT
+ ERL"
+ gene 215161..215910
+ /locus_tag="BQ2027_MB0190"
+ CDS 215161..215910
+ /locus_tag="BQ2027_MB0190"
+ /note="Mb0190, -, len: 249 aa. Equivalent to Rv0184, len:
+ 249 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 249 aa overlap). Conserved
+ hypothetical protein, equivalent to CAC32136.1|AL583926
+ conserved hypothetical protein from Mycobacterium lepra
+ (249 aa); and C-terminus highly similar to
+ CAB08793.1|Z95398 conserved hypothetical protein from
+ Mycobacterium leprae (145 aa), FASTA scores: E(): 0, (75.2
+ identity in 145 aa overlap). Also similar to
+ 049841|SCE9_39|T36358 hypothetical protein from
+ Streptomyces coelicolor (418 aa), FASTA scores: opt: 231,
+ E(): 8.1e-08, (30.4% identity in 270 aa overlap). Protein
+ product from Mb0190 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0190 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247895.1"
+ /translation="MTNDKMLARIAALLRQAEGTDNPHEADAFMSTAQRLATAASIDL
+ AVARSHAGNRSPAQAPTQRTITIGAAGTRGLRTYVQLFVLIAAANDVRCDVASNSTFV
+ YAYGFAEDIDTSHALYASLVVQMVRASDAYLASGAHRPTPTITARLNFQLAFGARVGQ
+ RLADAREQTRQEATKDRDRPPGTAIALRDKDIELHEYYRRSSKARGAWRASRATAGYS
+ SAARRAGDRAGRQARLGNNPELPGARAALGR"
+ gene 215907..216416
+ /locus_tag="BQ2027_MB0191"
+ CDS 215907..216416
+ /locus_tag="BQ2027_MB0191"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0191, -, len: 169 aa. Equivalent to Rv0185, len:
+ 169 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 169 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ CAB08794.1|Z95398|MLCL622_2 from Mycobacterium leprae (168
+ aa), FASTA scores: opt: 861, E(): 0, (76.4% identity in
+ 165 aa overlap). Contains PS00142 Neutral zinc
+ metallopeptidases, zinc-binding region signature. Protein
+ product from Mb0191 detected using SWATH mass
+ spectrometry. Mb0191 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247896.1"
+ /translation="MIGADVPRDSQRARVYAAEAFVRTLFDRVTAHGSPTVEFFGTQL
+ TLPPEGRFGSVASVQRYVDDVLALPAVGQNWPTVSPVRVRARRAATAAHYENHGGTGT
+ IAVPDRHTAGWAMRELVVLHEVAHHLCQVPPPHGPEFVATVCTLTELVMGPEVGHVFR
+ VVYAQEGVR"
+ gene 216461..218536
+ /gene="bglS"
+ /locus_tag="BQ2027_MB0192"
+ CDS 216461..218536
+ /gene="bglS"
+ /locus_tag="BQ2027_MB0192"
+ /note="Mb0192, bglS, len: 691 aa. Equivalent to Rv0186,
+ len: 691 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 691 aa overlap). Probable bglS,
+ beta-glucosidase (EC 3.2.1.21), highly similar to many
+ e.g. BGLS_AGRTU|P27034 beta-glucosidase from Agrobacterium
+ tumefaciens (818 aa), FASTA scores: opt: 643, E(): 0,
+ (32.5% identity in 842 aa overlap). SEEMS TO BELONG TO
+ FAMILY 3 OF GLYCOSYL HYDROLASES. Protein product from
+ Mb0192 detected using SWATH mass spectrometry. Mb0192
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BETA-GLUCOSIDASE BGLS (GENTIOBIASE)
+ (CELLOBIASE) (BETA-D-GLUCOSIDE GLUCOHYDROLASE)"
+ /protein_id="CAB5247897.1"
+ /translation="MTDDERFSLLVGLTGASDLWPVRDERIPQGVPMCAGYVPGIPRL
+ GVPALLMSDAGLGVTNPGYRPGDTATALPAGLALAASFNPVLARSSGKAIGREARSRG
+ FNVQLAGAINLARDPRNGRNFEYLSEDPLLSATMAAESIIGIQQQGVIATTKHFSLNC
+ NETNRHWLDAVIDPDAHRESDLLAFEIVIERSQPGAVMAAYNKVNGDYAAGNDHLLND
+ VLKGAWGYRGWVMSDWGGTPSWECALAGLDQECGAQIDAVLWQSEAFTDRLRAAYADG
+ NLPKGRLSDMVRRILRSMFAVGIDRWKPAPAPDMNAHNEIAAQMARQGIVLLQNRGLL
+ PLAPESAGRIAVIGGYAHLGVPAGYGSSAVTPPGGYAGVIPIGGSGLAAGLRNLYLLP
+ SSPLSELRKRLPNAQFEFDPGINPAEAVLAARRADIAIVFAIRAEGEGFDSADLSLPW
+ GQDALIAAVASANANTVVVLETGNPVTMPWRDSVNAIMQAWYPGQAGGQAVAEIVTGQ
+ VNPSGRLPITFPVDLGQTPRSQPRELGAPWGTSTTIHYTEGADVGYRWFASTNQTPMF
+ AFGHGLSYTSFEYRDLVVTGGHTVHASFSVTNTGDRSGADVPQLYMIAAPGESRLRLL
+ GFERVELEPGQTRRVRIEADPRLLARYDGEARSWRIEPGGYTVAVGASAVALKLAAKV
+ KLAGRGFGR"
+ gene complement(218582..218743)
+ /gene="mymT"
+ /locus_tag="BQ2027_MB0192A"
+ CDS complement(218582..218743)
+ /gene="mymT"
+ /locus_tag="BQ2027_MB0192A"
+ /note="Mb0192A, len: 53 aa. Equivalent to Rv0186A len: 53
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 53 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). MymT,
+ metallothionein,equivalent to MAV_4993|A0QMH5 hypothetical
+ protein from Mycobacterium avium (strain 104) (51 aa), and
+ MAP_3626c|Q73TU2 hypothetical protein from Mycobacterium
+ avium subsp. paratuberculosis (51 aa), FASTA scores: opt:
+ 312, E(): 4.6e-17, (81.2% identity in 48 aa overlap).
+ Protein product from Mb0192A detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0192A found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Metallothionein, MymT"
+ /protein_id="CAB5247898.1"
+ /translation="MRVIRMTNYEAGTLLTCSHEGCGCRVRIEVPCHCAGAGDAYRCT
+ CGDELAPVK"
+ gene 218897..219559
+ /locus_tag="BQ2027_MB0193"
+ CDS 218897..219559
+ /locus_tag="BQ2027_MB0193"
+ /note="Mb0193, -, len: 220 aa. Equivalent to Rv0187, len:
+ 220 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 220 aa overlap). Probable
+ O-methyltransferase (EC 2.1.1.-), similar to many e.g.
+ AB93458.1|AL357591 putative O-methyltransferase from
+ Streptomyces coelicolor (223 aa); MDMC_STRMY|Q00719
+ O-methyltransferase from Streptomyces mycarofaciens (221
+ aa), FASTA scores: opt: 327, E(): 2.4e-17, (35.9% identity
+ in 192 aa overlap). Also similar to Rv1703c, Rv1220c from
+ Mycobacterium tuberculosis. Protein product from Mb0193
+ detected using shotgun mass spectrometry. Mb0193 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE O-METHYLTRANSFERASE"
+ /protein_id="CAB5247899.1"
+ /translation="MGMDQQPNPPDVDAFLDSTLVGDDPALAAALAASDAAELPRIAV
+ SAQQGKFLCLLAGAIQARRVLEIGTLGGFSTIWLARGAGPQGRVVTLEYQPKHAEVAR
+ VNLQRAGVADRVEVVVGPALDTLPTLAGGPFDLVFIDADKENNVAYIQWAIRLARRGA
+ VIVVDNVIRGGGILAESDDADAVAARRTLQMMGEHPGLDATAIQTVGRKGWDGFALAL
+ VR"
+ gene 219678..220109
+ /locus_tag="BQ2027_MB0194"
+ CDS 219678..220109
+ /locus_tag="BQ2027_MB0194"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0194, -, len: 143 aa. Equivalent to Rv0188, len:
+ 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 143 aa overlap). Probable conserved
+ transmembrane protein, similar to
+ T35347|4835334|CAB42956.1|AL049863|SC5H1_31 probable
+ membrane protein from Streptomyces coelicolor (147 aa),
+ FASTA scores: opt: 326, E(): 6.5e-15, (36.2% identity in
+ 141 aa overlap); N-terminus of P80185|MTRC_METTH
+ TETRAHYDROMETHANOPTERIN S-METHYLTRANSFERASE SUBUNIT C (EC
+ 2.1.1.86) from Methanobacterium thermoautotrophicum strain
+ Marburg/DSM 2133 (266 aa), FASTA scores: opt: 125, E():
+ 0.033, (31.6% identity in 98 aa overlap). Also similar to
+ Rv3635 from Mycobacterium tuberculosis. Protein product
+ from Mb0194 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0194 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247900.1"
+ /translation="MSTVHSSIDQHPDLLALRASFDRAAESTIAHFTFGLALLAGLYV
+ AASPWIVGFSATRGLPTCDLIVGIAVAYLAYGFASALDRTHGMTWTLPVLGVWVIFSP
+ WVLPGVAVTAGMMWSHIIAGAVVAVLGFYFGMRTRAAANQG"
+ gene complement(220188..221915)
+ /gene="ilvD"
+ /locus_tag="BQ2027_MB0195C"
+ CDS complement(220188..221915)
+ /gene="ilvD"
+ /locus_tag="BQ2027_MB0195C"
+ /note="Mb0195c, ilvD, len: 575 aa. Equivalent to Rv0189c,
+ len: 575 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 575 aa overlap). Probable ilvD,
+ dihydroxy-acid dehydratase (EC 4.2.1.9), similar to many
+ e.g. ILVD_LACLA|Q02139 dihydroxy-acid dehydratase (dad)
+ from Lactococcus lactis (subsp. lactis) (Streptococcus
+ lactis) (570 aa), FASTA scores: opt: 1605, E(): 0, (46.0%
+ identity in 561 aa overlap). Also similar to
+ ML2608|MLCL622.06c|O06069|ILVD_MYCLE DIHYDROXY-ACID
+ DEHYDRATASE from Mycobacterium leprae (564 aa). Contains
+ PS00886 Dihydroxy-acid and 6-phosphogluconate dehydratases
+ signature 1. BELONGS TO THE ILVD / EDD FAMILY. COFACTOR:
+ BINDS 1 4FE-4S CLUSTER (POTENTIAL). Protein product from
+ Mb0195c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0195c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DIHYDROXY-ACID DEHYDRATASE ILVD (DAD)"
+ /protein_id="CAB5247901.1"
+ /translation="MPQTTDEAASVSTVADIKPRSRDVTDGLEKAAARGMLRAVGMDD
+ EDFAKPQIGVASSWNEITPCNLSLDRLANAVKEGVFSAGGYPLEFGTISVSDGISMGH
+ EGMHFSLVSREVIADSVEVVMQAERLDGSVLLAGCDKSLPGMLMAAARLDLAAVFLYA
+ GSILPGRAKLSDGSERDVTIIDAFEAVGACSRGLMSRADVDAIERAICPGEGACGGMY
+ TANTMASAAEALGMSLPGSAAPPATDRRRDGFARRSGQAVVELLRRGITARDILTKEA
+ FENAIAVVMAFGGSTNAVLHLLAIAHEANVALSLQDFSRIGSGVPHLADVKPFGRHVM
+ SDVDHIGGVPVVMKALLDAGLLHGDCLTVTGHTMAENLAAITPPDPDGKVLRALANPI
+ HPSGGITILHGSLAPEGAVVKTAGFDSDVFEGTARVFDGERAALDALEDGTITVGDAV
+ VIRYEGPKGGPGMREMLAITGAIKGAGLGKDVLLLTDGRFSGGTTGLCVGHIAPEAVD
+ GGPIALLRNGDRIRLDVAGRVLDVLADPAEFASRQQDFSPPPPRYTTGVLSKYVKLVS
+ SAAVGAVCG"
+ gene 222063..222353
+ /gene="ricR"
+ /locus_tag="BQ2027_MB0196"
+ CDS 222063..222353
+ /gene="ricR"
+ /locus_tag="BQ2027_MB0196"
+ /note="Mb0196, -, len: 96 aa. Equivalent to Rv0190, len:
+ 96 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 96 aa overlap). Conserved hypothetical
+ protein, highly similar to several hypothetical proteins
+ e.g. SYCSLRA_35|Q55554|SLL0176 hypothetical 18.9 KD
+ protein from Synechocystis (167 aa), FASTA scores: opt:
+ 237, E(): 5.8e-16, (39.4% identity in 94 aa overlap). Also
+ highly similar to Z95398|MLCL622_7|O06070 from
+ Mycobacterium leprae (135 aa), FASTA score: (82.6%
+ identity in 92 aa overlap). Also similar to hypothetical
+ proteins from Mycobacterium tuberculosis e.g. Rv0967,
+ Rv0030, Rv1766 (42.5% identity in 80 aa overlap). Protein
+ product from Mb0196 detected using shotgun mass
+ spectrometry. Mb0196 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Metal-sensitive transcriptional repressor"
+ /protein_id="CAB5247902.1"
+ /translation="MTAAHGYTQQKDNYAKRLRRVEGQVRGIARMIEEDKYCIDVLTQ
+ ISAVTSALRSVALNLLDEHLSHCVTRAVAEGGPGADGKLAEASAAIARLVRS"
+ gene 222481..223722
+ /locus_tag="BQ2027_MB0197"
+ CDS 222481..223722
+ /locus_tag="BQ2027_MB0197"
+ /note="Mb0197, -, len: 413 aa. Equivalent to Rv0191, len:
+ 413 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 413 aa overlap). Probable conserved
+ integral membrane protein, member of major facilitator
+ superfamily (MFS) possibly involved in transport of drug,
+ similar to several hypothetical proteins e.g.
+ YDEA_ECOLI|P31122 hypothetical 42.5 kd protein from
+ Escherichia coli (396 aa), FASTA scores: opt: 475, E():
+ 4.2e-33, (29.7% identity in 381 aa overlap); and to
+ several chloramphenicol resistance proteins e.g.
+ CMLR_STRLI|P31141 chloramphenicol resistance protein from
+ stremtomyces lividans (392 aa), FASTA scores: opt: 394,
+ E(): 6.7e-12, (28.2% identity in 383 aa overlap). Also
+ similar to SVU09991_1 from Mycobacterium tuberculosis.
+ Protein product from Mb0197 detected using SWATH mass
+ spectrometry. Mb0197 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5247903.1"
+ /translation="MTAPTGTSATTTRPWTPRIATQLSVLACAAFIYVTAEILPVGAL
+ SAIARNLRVSVVLVGTLLSWYALVAAVTTVPLVRWTAHWPRRRALVVSLVCLTVSQLV
+ SALAPNFAVLAAGRVLCAVTHGLLWAVIAPIATRLVPPSHAGRATTSIYIGTSLALVV
+ GSPLTAAMSLMWGWRLAAVCVTGAAAAVALAARLALPEMVLRADQLEHVGRRARHHRN
+ PRLVKVSVLTMIAVTGHFVSYTYIVVIIRDVVGVRGPNLAWLLAAYGVAGLVSVPLVA
+ RPLDRWPKGAVIVGMTGLTAAFTLLTALAFGERHTAATALLGTGAIVLWGALATAVSP
+ MLQSAAMRSGGDDPDGASGLYVTAFQIGIMAGALLGGLLYERSLAMMLTASAGLMGVA
+ LFGMTVSQHLFENPTLSPGDG"
+ gene 223799..224857
+ /locus_tag="BQ2027_MB0198"
+ CDS 223799..224857
+ /locus_tag="BQ2027_MB0198"
+ /note="Mb0198, -, len: 352 aa. Equivalent to Rv0192 and
+ Rv0192A, len: 366 aa and 100 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (96.5% identity in 318 aa
+ overlap and 91.1% identity in 56 aa overlap). Conserved
+ hypothetical protein. Has Gly- Arg-rich region followed by
+ highly Pro-rich repetitive region near N-terminus. Similar
+ in C-terminus to other hypothetical proteins e.g.
+ Q49706|B1496_F2_81|U00013 from Mycobacterium leprae (271
+ aa), FASTA scores: opt: 375, E(): 3.2e-24, (36.1% identity
+ in 255 aa overlap); YV09_MYCTU|Q11149|cY20G9.09
+ hypothetical 47.9 kd protein from Mycobacterium
+ tuberculosis (451 aa), FASTA scores: opt: 330, E():
+ 3.2e-13, (35.1% identity in 271 aa overlap). Also similar
+ to Rv0116c, Rv1433, Rv2518c, Rv0483 from Mycobacterium
+ tuberculosis. Probable N-terminal part of Rv0192, which is
+ member of family P5.17 with Rv0116c, Rv1433, Rv2518c,
+ Rv0483. These are all predicted to be exported/membrane
+ proteins. Rv0192A has typical N-terminal signal peptide
+ which is functional and was identified by PhoA fusion
+ screens: O52054 PGB14T-O1 PRECURSOR (FRAGMENT 45 AA) (see
+ citation below). Since Rv0192 misses a signal peptide this
+ suggests that there is a frameshift in the region of the
+ overlap with Rv0192 but none found on reinspection of
+ sequence. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0192 and Rv0192A exist as 2
+ genes with an overlap region. In Mycobacterium bovis, a
+ single base insertion (*-g) leads to a single product.
+ Protein product from Mb0198 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0198 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="L,D-transpeptidase"
+ /protein_id="CAB5247904.1"
+ /translation="MSRWKQGWTRGSLFAALNIAAVVAVLMLGAGVAVADPDAAPGDP
+ GGPGGPGGTAGPVDPPAVDLLAPPPDPLALPPALDPLAPPPPDPLAPPPPDPLAVPVA
+ AGPVAGQDPTPFVGPPPFRPPTFNPVDGAMVGVAKPIVINFAVPIADRAMAESAIHIS
+ SIPPVPGKFYWMSPTQVRWRPFEFWPANTAVNIDAAGTKSSFRTGDSLVATADDATHQ
+ MTITRNGVVQKTFPMSMGMVSGGHQTPNGTYYVLEKFATVVMDSSTYGVPVNSAQGYK
+ LTVSDAVRIDNSGNFVHSAPWSVADQGKRNVTHGCINLSPANAKWFYDNFGSGDPVVV
+ KNSVGTYNKNDGAQDWQI"
+ gene complement(224917..226764)
+ /locus_tag="BQ2027_MB0199C"
+ CDS complement(224917..226764)
+ /locus_tag="BQ2027_MB0199C"
+ /note="Mb0199c, -, len: 615 aa. Equivalent to Rv0193c,
+ len: 615 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 615 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247905.1"
+ /translation="MIQISRDMSSLGQTATTQALPDNSDGIQLTKFAADDILPLEYAP
+ PIGPELVSQDQLPAAWAYKRFRDLDDKESYRRKLLQELTDALAAQGSEAAEIATAALR
+ DLIDQMAEQGAVVLADIVESDDFLELVKRYDELMAREGSRSFIHRFLDLRRSPGMLTD
+ PAVNGALVHPLMIALISYAVGGPIRMIDARGKDAEPLSVLAQDNMLHIDNTPFNDEYK
+ ILITWRRGTAQGPAGQNFTFLPGTHKLARTCFVNEDGVPWSSENASIFTTPDSIRKVF
+ DAQRQLGGQDHPTVIEVTDSERPLSSVFAAGSLVHHRFRTASGSARSCIILVFHRVAD
+ NPGRMVSDVEDSSDVSLSELLTRGVPDESYQQRFIATLCAAADEIAELLLKWKKTPQR
+ PVSLPLQTKQIDGARFEEWISAATEAPEVREIRNRELTIPYGEVLSAEEFFDLIWRLM
+ RFDKHGPLDLILYHDNREEPRKWARNLIREMSADRLYERLLGWLADIQQPRPADCLRP
+ LQIHALISEVLKTLPLDEDQDPPADWHFDLLGMSHAEAARSVKHLLEDVAEALLRCED
+ MAAYLSTSLFAFWAVDAAYSLDGRRNLVVKDCARRLLRHYTMLSLTCFQ"
+ gene 227071..230655
+ /locus_tag="BQ2027_MB0200"
+ CDS 227071..230655
+ /locus_tag="BQ2027_MB0200"
+ /note="Mb0200, -, len: 1194 aa. Equivalent to Rv0194, len:
+ 1194 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 1194 aa overlap). Probable
+ drugs-transport transmembrane protein ATP binding protein
+ ABC transporter (see citation below), highly similar to
+ many e.g. U62129|STU62129_2|T30293 ABC transport protein
+ homolog from Salmonella typhi (1218 aa), FASTA scores:
+ opt: 1116, E(): 0, (36.3% identity in 1209 aa overlap);
+ CAB66302.1|AL136519 ABC transporter protein ATP-binding
+ component from Streptomyces coelicolor (1243 aa); I84547
+ mdl protein from Escherichia coli (1143 aa); etc. Also
+ similar to MTCY50_9 and MTCY50_10 from Mycobacterium
+ tuberculosis, FASTA score: (33.8% identity in 574 aa
+ overlap). Contains two PS00017 ATP/GTP-binding site motif
+ A (P-loop) and one PS00211 ABC transporters family
+ signature. BELONGS TO THE ATP-BINDING TRANSPORT PROTEIN
+ FAMILY (ABC TRANSPORTERS). Alternative start possible at
+ 1823 but no RBS. Protein product from Mb0200 detected
+ using shotgun mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transmembrane multidrug efflux pump"
+ /protein_id="CAB5247906.1"
+ /translation="MRTNCWWRLSGYVMRHRRDLLLGFGAALAGTVIAVLVPLVTKRV
+ IDDAVAADHRPLAPWAVVLVAAAGATYLLTYVRRYYGGRIAHLVQHDLRMDAFQALLR
+ WDGRQQDRWSSGQLIVRTTNDLQLVQALLFDVPNVLRHVLTLLLGVAVMTWLSVPLAL
+ LAVLLVPVIGLIAHRSRRLLAAATHCAQEHKAAVTGVVDAAVCGIRVVKAFGQEERET
+ VKLVMASRALYAAQLRVARLNAHFGPLLQTLPALGQMAVFALGGWMAAQGSITVGTFV
+ AFWACLTLLARPACDLAGMLTIAQQARAGAVRVLELIDSRPTLVDGTKPLSLEARLSL
+ EFQRVSFGYVADRPVLREISLSVRAGETLAVVGAPGSGKSTLASLATRCYDVTQGAVR
+ IGGQDVRELTLDSLRSAIGLVPEDAVLFSGTIGANIAYGRPDATPEQIATAARAAHIE
+ EFVNTLPDGYQTAVGARGLTLSGGQRQRIALARALLHQPRLLIMDDPTSAVDAVIECG
+ IQEVLREAIADRTAVIFTRRRSMLTLADRVAVLDSGRLLDVGTPDEVWERCPRYRELL
+ SPAPDLADDLVVAERSPVCRPVAGLGTKAAQHTNVHNPGPHDHPPGPDPLRRLLREFR
+ GPLALSLLLVAVQTCAGLLPPLLIRHGIDVGIRRHVLSALWWAALAGTATVVIRWVVQ
+ WGSAMVAGYTGEQVLFRLRSVVFAHAQRLGLDAFEDDGDAQIVTAVTADVEAIVAFLR
+ TGLVVAVISVVTLVGILVALLAIRARLVLLIFTTMPVLALATWQFRRASNWTYRRARH
+ RLGTVTATLREYAAGLRIAQAFRAEYRGLQSYFAHSDDYRRLGVRGQRLLALYYPFVA
+ LLCSLATTLVLLDGAREVRAGVISVGALVTYLLYIELLYTPIGELAQMFDDYQRAAVA
+ AGRIRSLLSTRTPSSPAARPVGTLRGEVVFDAVHYSYRTREVPALAGINLRIPAGQTV
+ VFVGSTGSGKSTLIKLVARFYDPTHGTVRVDGCDLREFDVDGYRNRLGIVTQEQYVFA
+ GTVRDAIAYGRPDATDAQVERAAREVGAHPMITALDNGYLHQVTAGGRNLSAGQLQLL
+ ALARARLVDPDILLLDEATVALDPATEAVVQRATLTLAARRTTLIVAHGLAIAEHADR
+ IVVLEHGTVVEDGAHTELLAAGGHYSRLWAAHTRLCSPEITQLQCIDA"
+ gene 231093..231728
+ /locus_tag="BQ2027_MB0201"
+ CDS 231093..231728
+ /locus_tag="BQ2027_MB0201"
+ /note="Mb0201, -, len: 211 aa. Equivalent to Rv0195, len:
+ 211 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 211 aa overlap). Putative
+ two-component response regulator, luxR family, similar to
+ many e.g. U00008|ECOHU49_15 regulatory protein narP from
+ Escherichia coli strain K12 (225 aa), FASTA scores: opt:
+ 232, E(): 7.3e-09, (29.2% identity in 219 aa overlap).
+ Start chosen by similarity. Contains probable
+ helix-turn-helix motif at aa 166-187 (Score 1164, +3.15
+ SD)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible two component transcriptional
+ regulatory protein (probably luxr-family)"
+ /protein_id="CAB5247907.1"
+ /translation="MAPVNVISVAVVASDPLTRDGALARLSSHRELDVRAWQAGCETS
+ VLLVLATTITAPLLCQIEDVQKDGPSHAPKLVVVADEFSAEQVFRMIKLGLTGLLYRS
+ QSTFDCIVETIRLSAEGRLRLPERVQRYLVGRIKSTPTAEPDTPCAAALAEREVAVLR
+ LLADGLSTHQVAVQLNYCERTIKNIVHDIVTRLKLRNRTHAVAHALRAGLI"
+ gene 231841..232425
+ /locus_tag="BQ2027_MB0202"
+ CDS 231841..232425
+ /locus_tag="BQ2027_MB0202"
+ /note="Mb0202, -, len: 194 aa. Equivalent to Rv0196, len:
+ 194 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 194 aa overlap). Putative
+ transcriptional regulatory protein, similar to two
+ Bacillus subtilis regulators: P42105|YXAF_BACSU
+ HYPOTHETICAL 21.0 KD PROTEIN (191 aa), FASTA scores: opt:
+ 323, E(): 2.1e-15, (30.9% identity in 181 aa overlap); and
+ Z99105|BSUB0002_9 negative regulator of the lincomycin
+ operon (188 aa), FASTA scores: opt: 255, E(): 1e-10, (25.9
+ identity in 185 aa overlap). Protein product from Mb0202
+ detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="possible transcriptional regulatory protein"
+ /protein_id="CAB5247908.1"
+ /translation="MQGPRERMVVSAALLIRERGAHATAISDVLQHSGAPRGSAYHYF
+ PGGRTQLLCEAVDYAGEHVAAMINEAEGGLELLDALIDKYRQQLLSTDFRAGCPIAAV
+ SVEAGDEQDRERMAPVIARAAAVFDRWSDLTAQRFIADGIPPDRAHELAVLATSTLEG
+ AILLARVRRDLTPLDLVHRQLRNLLLAELPERSR"
+ gene 232425..234671
+ /locus_tag="BQ2027_MB0203"
+ CDS 232425..234671
+ /locus_tag="BQ2027_MB0203"
+ /note="Mb0203, -, len: 748 aa. Equivalent to Rv0197, len:
+ 762 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 748 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), similar to others e.g.
+ 9948789|AAG06102.1|AE004699_7|B83307 probable
+ molybdopterin oxidoreductase from Pseudomonas aeruginosa
+ strain PAO1 (769 aa); 5441785|CAB46809.1|AL096811|T36812
+ probable dehydrogenase from Streptomyces coelicolor (747
+ aa), FASTA scores: opt: 617, E(): 9.8e-30, (29.9% identity
+ in 762 aa overlap); BAB04334.1|AP001509 assimilatory
+ nitrate reductase (catalytic subunit) from Bacillus
+ halodurans (743 aa); etc. REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium bovis, a single base transversion (t-g)
+ introduces a stop codon that leads to a shorter product
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv (748 aa versus 762 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="CAB5247909.1"
+ /translation="MTSSDWLPTACILCECNCGIVVQVDDRRLARIRGDKAHPGSAGY
+ TCNKALRLDHYQNNRARLSSPMRRRADGTYEEIDWDTAIVEIAEGFKQIRDTHGGDKI
+ FYYGGGGQGNHLGGAYSGAFLKALGSRYRSNALAQEKTGEAWVDFQLYGGHTRGEFEN
+ AEVSVFVGKNPWMSQSFPRARVVLNEIAKDPGRSMIVIDPVVTDTAKMADFHLRVQPG
+ CDAWCLAALAAVLVQENLCNEAFLAAHVHGVDTVRAALQEVPVADYAQRCGVDEELLR
+ AAARRIGTAASVSVFEDLGIQQAPNSTVCSYLNKLLWILTGNFAKKGGQHLHSSFAPL
+ FSQVSGRTPVTGAPIIAGLIPGNVVPEEILTEHPDRFRAMIVESGNPAHSLADSAACR
+ AAFQALELMVVVDVAMTETARLAHYVLPAASQFEKPEATFFNFEFPRNGFQLRRPLFP
+ PLPGTLPEPEIWARLVRALGVVDEADLRPLREAAAQGRQAYTEAFLAAAATNPTVAKL
+ TAYVLYETLGPTLPDGLAGAAALWGLAQKTAMAYPDAVRRAGHADGNALFDAILERPS
+ GVTFTVHNYEDDFALISHPDHKIALEIPEMLAEIRSLTQTPSRLTTPQLPIVLSVGER
+ RAYTANDIFRDPSWRKRDANGALRVSVEDAQALGLADGCLARITTAAGSAEATVEVTE
+ TMLAGHAALPNGFGLDYTGDDGRTVVAGVAPNALTSTRWRDPYAGTPWHKHVPAAIRR
+ ADAESPIW"
+ gene complement(234712..236703)
+ /gene="zmp1"
+ /locus_tag="BQ2027_MB0204C"
+ CDS complement(234712..236703)
+ /gene="zmp1"
+ /locus_tag="BQ2027_MB0204C"
+ /note="Mb0204c, -, len: 663 aa. Equivalent to Rv0198c,
+ len: 663 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 663 aa overlap). Probable zinc
+ metalloprotease (EC 3.4.24.-), equivalent to
+ Z95398|MLCL622.12c from Mycobacterium leprae (667 aa),
+ FASTA scores: opt: 3710, E(): 0, (80.8 % identity in 667
+ aa overlap). Also similar to many other metalloproteases
+ e.g. members of the eukaryotic neprilysin family:
+ P08473|NEP_HUMAN NEPRILYSIN (EC 3.4.24.11) (749 aa), FASTA
+ scores: opt: 872, E(): 0, (31.1% identity in 692 aa
+ overlap); Q07744|PEPO_LACLA NEUTRAL ENDOPEPTIDASE from
+ Lactococcus lactis (626 aa), FASTA scores: opt: 862, E():
+ 0, (30.0% identity in 654 aa overlap). Contains PS00142
+ Neutral zinc metallopeptidases, zinc-binding region
+ signature. BELONGS TO PEPTIDASE FAMILY M13 (ZINC
+ METALLOPROTEASE); ALSO KNOWN AS THE NEPRILYSIN SUBFAMILY.
+ Protein product from Mb0204c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0204c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable zinc metalloprotease zmp1"
+ /protein_id="CAB5247910.1"
+ /translation="MTLAIPSGIDLSHIDADARPQDDLFGHVNGRWLAEHEIPADRAT
+ DGAFRSLFDRAETQVRDLIIQASQAGAAVGTDAQRIGDLYASFLDEEAVERAGVQPLH
+ DELATIDSAADATELAAALGTLQRAGVGGGIGVYVDTDSKDSTRYLVHFTQSGIGLPD
+ ESYYRDEQHAAVLAAYPGHIARMFGLVYGGESRDHAKTADRIVALETKLADAHWDVVK
+ RRDADLGYNLRTFAQLQTEGAGFDWVSWVTALGSAPDAMTELVVRQPDYLVTFASLWA
+ SVNVEDWKCWARWRLIRARAPWLTRALVAEDFEFYGRTLTGAQQLRDRWKRGVSLVEN
+ LMGDAVGKLYVQRHFPPDAKSRIDTLVDNLQEAYRISISELDWMTPQTRQRALAKLNK
+ FTAKVGYPIKWRDYSKLAIDRDDLYGNVQRGYAVNHDRELAKLFGPVDRDEWFMTPQT
+ VNAYYNPGMNEIVFPAAILQPPFFDPQADEAANYGGIGAVIGHEIGHGFDDQGAKYDG
+ DGNLVDWWTDDDRTEFAARTKALIEQYHAYTPRDLVDHPGPPHVQGAFTIGENIGDLG
+ GLSIALLAYQLSLNGNPAPVIDGLTGMQRVFFGWAQIWRTKSRAAEAIRRLAVDPHSP
+ PEFRCNGVVRNVDAFYQAFDVTEDDALFLDPQRRVRIWN"
+ gene 236746..237405
+ /locus_tag="BQ2027_MB0205"
+ CDS 236746..237405
+ /locus_tag="BQ2027_MB0205"
+ /note="Mb0205, -, len: 219 aa. Equivalent to Rv0199, len:
+ 219 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 219 aa overlap). Probable conserved
+ membrane protein, equivalent to Z95398|MLCL622.13 from
+ Mycobacterium leprae (224 aa), FASTA scores: opt: 920,
+ E(): 0, (67.7% identity in 220 aa overlap). Also some
+ similarity to Mce-associated membrane proteins from
+ Mycobacterium tuberculosis e.g. Rv0178, Rv0175, etc.
+ Protein product from Mb0205 detected using shotgun mass
+ spectrometry. Mb0205 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5247911.1"
+ /translation="MPDGEQSQPPAQEDAEDDSRPDAAEAAAAEPKSSAGPMFSTYGI
+ ASTLLGVLSVAAVVLGAMIWSAHRDDSGERTYLTRVMLTAAEWTAVLINMNADNIDAS
+ LQRLHDGTVGQLNTDFDAVVQPYRQVVEKLRTHSSGRIEAVAIDTVHRELDTQSGAAR
+ PVVTTKLPPFATRTDSVLLVATSVSENAGAKPQTVHWNLRLDVSDVDGKLMISRLESI
+ R"
+ gene 237402..238091
+ /locus_tag="BQ2027_MB0206"
+ CDS 237402..238091
+ /locus_tag="BQ2027_MB0206"
+ /note="Mb0206, -, len: 229 aa. Equivalent to Rv0200, len:
+ 229 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 229 aa overlap). Possible conserved
+ transmembrane protein, equivalent to Z95398|MLCL622.14
+ from Mycobacterium leprae (229 aa), FASTA scores: opt:
+ 1147, E(): 0, (74.7% identity in 229 aa overlap). Also
+ some similarity to Rv1973 from Mycobacterium tuberculosis
+ (160 aa); and Rv1362c|Z75555|MTCY02B10_26 (220 aa), FASTA
+ scores: opt: 134, E(): 0.063, (25.8% identity in 159 aa
+ overlap). Protein product from Mb0206 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0206 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247912.1"
+ /translation="MRNAWRLVVFDVLAPLATIAALAAIGVLLGWPLWWVSTCSVLVL
+ LVVEGVAINFWLLRRDSVTVGTDDDAPGLRLAVVFLCAAAISAAVVTGYLRWTTPDRD
+ FNRDSREVVHLATGMAETVASFSPSAPAAAVDRAAAMMVPEHAGGFKEQYAKSSADLA
+ RRGVTAQAATLAAGVEAIGPSAASVAVILRVSQSIPGQPTSQAARALRVTLTKRGSGW
+ LVLDVTPINAR"
+ gene complement(238088..238591)
+ /locus_tag="BQ2027_MB0207C"
+ CDS complement(238088..238591)
+ /locus_tag="BQ2027_MB0207C"
+ /note="Mb0207c, -, len: 167 aa. Equivalent to Rv0201c,
+ len: 167 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 167 aa overlap). Conserved
+ hypothetical protein, equivalent to Z95398|MLCL622.15c
+ from Mycobacterium leprae (170 aa), FASTA scores: opt:
+ 646, E(): 0, (63.9% identity in 158 aa overlap). Protein
+ product from Mb0207c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0207c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5247913.1"
+ /translation="MTLAAEPHPAPPQQPTVAWSEPDVDRRVEFWPTVAIRSALESGD
+ IATWQRIAAALKRDPYGRTARQVEEVLEGIPATGIANAFWEVLDRARTHLDANERAEV
+ ARQVGLLLDRSGLQRQEFASRIGVTAQDLTAYLDGIVSPSASLMIRMRRLSDRFVRAK
+ SVRAADS"
+ gene complement(238588..241488)
+ /gene="mmpL11"
+ /locus_tag="BQ2027_MB0208C"
+ CDS complement(238588..241488)
+ /gene="mmpL11"
+ /locus_tag="BQ2027_MB0208C"
+ /note="Mb0208c, mmpL11, len: 966 aa. Equivalent to
+ Rv0202c, len: 966 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 966 aa overlap).
+ Probable mmpL11, conserved transmembrane transport protein
+ (see citation below), equivalent to Z95398|MLCL622.16c
+ from Mycobacterium leprae (1014 aa), FASTA scores: opt:
+ 4076, E(): 0, (72.8% identity in 1017 aa overlap). Member
+ of RND superfamily, similar to several putative transport
+ proteins e.g. P96687 from Bacillus subtilis (724 aa),
+ FASTA scores: opt: 594, E(): 9.1e-29, (26.9% identity in
+ 717 aa overlap); etc. BELONGS TO THE MMPL FAMILY. Protein
+ product from Mb0208c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0208c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL11"
+ /protein_id="CAB5247914.1"
+ /translation="MMRLSRNLRRCRWLVFTGWLLALVPAVYLAMTQSGNLTGGGFEV
+ AGSQSLLVHDQLDAHYPDRGAPALALVAAPRPDASYQDIDNAVALLRQIASELPGVTE
+ APNPTQRPPQPDRPYVVSLRLDARNAGTSDVAKKLRDRIGVKGDQSGQTANGKVRLYV
+ IGQGALSAAAAANTKHDIANAERWNLPIILMVLVAVFGSLAAAAIPLALAVCTVVITM
+ GLVFVLSMHTTMSVFVTSTVSMFGIALAVDYSLFILMRYREELRCGRRPPDAVDAAMA
+ TSGLAVVLSGMTVIASLTGIYLINTPALRSMATGAILAVAVAMLTSATLTPAVLATFA
+ RAAAKRSALVHWSRRPASTQSWFWSRWVGWVMRRPWITALAASTVLLVMAAPATLMVL
+ GNSLLRQFDSSHEIRTGAAAAAQALGPGALGPVQVLVRFDAGGASAPEHSQTIAAIRH
+ RIAQAPNVVSVAPPRFADDNGSALLSAVLSVDPEDLGARDTITWMRTQLPRVAGAAQV
+ DVGGPTALIKDFDDRVSATQPLVLVFVAVIAFLMLLISIRSVFLAFKGVLMTLLSVAA
+ AYGSLVMVFQWGWARGLGFPALHSIDSTVPPLVLAMTFGLSMDYEIFLLTRIRERFLQ
+ TGQTRDAVAYGVRTSARTITSAALIMIAVFCGFAFAGMPLVAEIGVACAVAIAVDATV
+ VRLVLVPALMAMFDRWNWWLPRWLAHILPSVDFDRPLPKVDLGDVVVIPDDFAAAIPP
+ SADVRMVLKSAAKLKRLAPDAICVTDPLAFTGCGCDGKALDQVQLAYRNGIARAISWG
+ QRPVHPVTVWRKRLAVALDALQTTTWECGGVQTHRAGPGYRRRSPVETTNVALPTGDR
+ LQIPTGAETLRFKGYLIMSRNSSHDYADFADLVDTMAPETAAAVLAGMDRYYSCQAPG
+ RQWMATQLVGRLADPQPSDLGDQSPGADAQAKWEEVRRRCLSVAVAMLEEAR"
+ gene 241710..242120
+ /locus_tag="BQ2027_MB0209"
+ CDS 241710..242120
+ /locus_tag="BQ2027_MB0209"
+ /note="Mb0209, -, len: 136 aa. Equivalent to Rv0203, len:
+ 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 136 aa overlap). Possible exported
+ protein (has hydrophobic stretch near N-terminus). Some
+ similarity to part of U02459|LDU02459_1 hypothetical
+ protein from Leishmania donovani (741 aa), FASTA score:
+ opt: 111, E(): 9.1, (30.0% identity in 90 aa overlap).
+ Protein product from Mb0209 detected using SWATH mass
+ spectrometry. Mb0209 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE EXPORTED PROTEIN"
+ /protein_id="CAB5247915.1"
+ /translation="MKTGTATTRRRLLAVLIALALPGAAVALLAEPSATGASDPCAAS
+ EVARTVGSVAKSMGDYLDSHPETNQVMTAVLQQQVGPGSVASLKAHFEANPKVASDLH
+ ALSQPLTDLSTRCSLPISGLQAIGLMQAVQGARR"
+ gene complement(242172..243455)
+ /locus_tag="BQ2027_MB0210C"
+ CDS complement(242172..243455)
+ /locus_tag="BQ2027_MB0210C"
+ /note="Mb0210c, -, len: 427 aa. Equivalent to Rv0204c,
+ len: 412 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 412 aa overlap). Probable conserved
+ transmembrane protein, equivalent, but has C-terminal
+ extension, to Z95398|MLCL622.17c from Mycobacterium leprae
+ (367 aa), FASTA scores: opt: 2002, E(): 0, (82.4% identity
+ in 374 aa overlap). Some similarity to Rv0585c from
+ Mycobacterium tuberculosis. REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium bovis, the presence of a more likely
+ start codon leads to a longer product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (427 a
+ versus 412 aa). Mb0210c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247916.1"
+ /translation="MYRDYGATCTVTLKHVSHDAPARNLRQRVGALPRTRVGAPPAEG
+ VPPRGKYWWLRWAVLAIVAIVLAIEVALGWDQLAKAWVSLYRAKWWWLLAAVAAAGAS
+ MHSFAQIQRTLLKSAGVHVKQWRSEAAFYAANSLSTTLPGGPVLSATFLLRQQRIWGA
+ STVVASWQLVMSGVLQAVGLALLGLGGAFFLGAKNNPFSLLFTLGGFVTLLLLAQAVA
+ SRPELIEGIGRRVLSWANSVRGRPADAGLPKWRETLMQLESVSLGRRDLGVAFGWSLF
+ NWIADVACLGFAAYAAGDHASVGGLAVAYAAARAVGTIPLMPGGLLVVEAVLVPGLVS
+ SGMPLPSAISAMLIYRLISWLLIAAIGWVVFFFMFRTESTADSDNDRDPPTDPNLRLV
+ IQPQGTPCDDPVETTPQGPAPTPDLRPEGGETPPR"
+ gene 243580..244683
+ /locus_tag="BQ2027_MB0211"
+ CDS 243580..244683
+ /locus_tag="BQ2027_MB0211"
+ /note="Mb0211, -, len: 367 aa. Equivalent to Rv0205, len:
+ 367 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 367 aa overlap). Possible conserved
+ transmembrane protein, similar to hypothetical proteins
+ from many bacteria e.g. AL0209|SC4H8_6 from Streptomyces
+ coelicolor (402 aa), FASTA scores: opt: 436, E(): 1.7e-21,
+ (27.2% identity in 349 aa overlap); Z99117|BSUB0014_221
+ from Bacillus subtilis (353 aa), FASTA scores: opt: 394,
+ E(): 8.6e-19, (28.7% identity in 324 aa overlap). Protein
+ product from Mb0211 detected using SWATH mass
+ spectrometry. Mb0211 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247917.1"
+ /translation="MSASLDDASVAPLVRKTAAWAWRFLVILAAMVALLWVLNKFEVI
+ VVPVLLALMLSALLVPPVDWLDSRGLPRAVAVTLVLLSGFAVLGGILTFVVSQFIAGL
+ PHLVTEVERSIDSARRWLIEGPAHLRGEQIDNAGNAAIEALRNNQAKLTSGALSTAAT
+ ITELVTAAVLVLFTLIFFLYGGRSIWQYVTKAFPASVRDRVRAAGRAGYASLIGYARA
+ TFLVALTDAAGVGAGLAVMGVPLALPLASLVFFGAFIPLIGAVVAGFLAVVVALLAKG
+ IGYALITVGLLIAVNQLEAHLLQPLVMGRAVSIHPLAVVLAIAAGGVLAGVVGALLAV
+ PTAAFFNNAVQVLLGGNPFADVADVSSDHLTEV"
+ gene complement(244680..247514)
+ /gene="mmpL3"
+ /locus_tag="BQ2027_MB0212C"
+ CDS complement(244680..247514)
+ /gene="mmpL3"
+ /locus_tag="BQ2027_MB0212C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0212c, mmpL3, len: 944 aa. Equivalent to Rv0206c,
+ len: 944 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 944 aa overlap). Possible mmpL3,
+ conserved transmembrane transport protein (see first
+ citation below), equivalent to Z95398|MLCL622.18c from
+ Mycobacterium leprae (955 aa), FASTA scores: opt: 806,
+ E(): 1.8e-21, (57.2% identity in 243 aa overlap). Member
+ of RND superfamily, similar to others. BELONGS TO THE MMPL
+ FAMILY. TBparse score is 0.928. Protein product from
+ Mb0212c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0212c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL3"
+ /protein_id="CAB5247918.1"
+ /translation="MFAWWGRTVYRYRFIVIGVMVALCLGGGVFGLSLGKHVTQSGFY
+ DDGSQSVQASVLGDQVYGRDRSGHIVAIFQAPAGKTVDDPAWSKKVVDELNRFQQDHP
+ DQVLGWAGYLRASQATGMATADKKYTFVSIPLKGDDDDTILNNYKAIAPDLQRLDGGT
+ VKLAGLQPVAEALTGTIATDQRRMEVLALPLVAVVLFFVFGGVIAAGLPVMVGGLCIA
+ GALGIMRFLAIFGPVHYFAQPVVSLIGLGIAIDYGLFIVSRFREEIAEGYDTETAVRR
+ TVITAGRTVTFSAVLIVASAIGLLLFPQGFLKSLTYATIASVMLSAILSITVLPACLG
+ ILGKHVDALGVRTLFRVPFLANWKISAAYLNWLADRLQRTKTREEVEAGIWGKLVNRV
+ MKRPVLFAAPIVIIMILLIIPVGKLSLGGISEKYLPPTNSVRQAQEEFDKLFPGYRTN
+ PLTLVIQTSNHQPVTEAQIADIRSKAMAIGGFIEPDNDPANMWQERAYAVGASKDPSV
+ RVLQNGLINPADASKKLTELRAITPPKGITVLVGGTPALELDSIHGLFAKMPLMVVIL
+ LTTTIVLMFLAFGSVVLPIKATLMSALTLGSTMGILTWIFVDGHFSKWLNFTPTPLTA
+ PVIGLIIALVFGLSTDYEVFLVSRMVEARERGMSTQEAIRIGTAATGRIITAAALIVA
+ VVAGAFVFSDLVMMKYLAFGLMAALLLDATVVRMFLVPSVMKLLGDDCWWAPRWARRL
+ QTRIGLGEIHLPDERKRPVSNGRPARPPVTAGLVAARAAGDPRPPHDPTHPLAESPRP
+ ARSSPASSPELTPALEATAAPAAPSGASTTRMQIGSSTEPPTTRLAAAGRSVQSPAST
+ PPPTPTPPSAPSAGQTRAMPLAANRSTDAAGDPAEPTAALPIIRSDGDDSEAATEQLN
+ ARGTSDKTRQRRRGGGALSAQDLLRREGRL"
+ gene complement(247580..248308)
+ /locus_tag="BQ2027_MB0213C"
+ CDS complement(247580..248308)
+ /locus_tag="BQ2027_MB0213C"
+ /note="Mb0213c, -, len: 242 aa. Equivalent to Rv0207c,
+ len: 242 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 242 aa overlap). Conserved
+ hypothetical protein, equivalent to Z95398|MLCL622_19 from
+ Mycobacterium leprae (261 aa), FASTA scores: E(): 0, (60.8
+ identity in 199 aa overlap). Protein product from Mb0213c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0213c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247919.1"
+ /translation="MSLTEDVTSQTSESLARHSVLAEDLSQDGLTSLGAPGARVLLVW
+ DAPNLDMGLGSILGRRPTALERPRFDALGRWLLARTAEIVAGRPGISTEPEATVFTNI
+ APGSAEVVRPWVDALRNVGFAVFAKPKVDEDSDVDRDMLAHIDERYREGLAALVVASA
+ DGQAFRQPLEAVARSGTPVQVLGFREHASWALASDTLEFVDLEDIAGVFREPLPRIGL
+ DSLPEQGAWLQPFRPLSSLLTSRV"
+ gene complement(248311..249102)
+ /locus_tag="BQ2027_MB0214C"
+ CDS complement(248311..249102)
+ /locus_tag="BQ2027_MB0214C"
+ /note="Mb0214c, -, len: 263 aa. Equivalent to Rv0208c,
+ len: 263 aa, from Mycobacterium tuberculosis strain H37Rv
+ (100.0% identity in 263 aa overlap). Hypothetical
+ methyltransferase (EC 2.1.1.-), equivalent to
+ Z95398|MLCL622_20 from Mycobacterium leprae (279 aa),
+ FASTA score: (64.2% identity in 246 aa overlaps). Also
+ similar to others e.g.
+ 10178368|CAC08407.1|AL392177|Q9F305|MT04_STRCO|SCD17A.03c
+ HYPOTHETICAL METHLYTRANSFERASE from Streptomyces
+ coelicolor (271 aa). Could start at aa 7. Protein product
+ from Mb0214c detected using SWATH mass spectrometry.
+ Mb0214c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL METHLYTRANSFERASE (METHYLASE)"
+ /protein_id="CAB5247920.1"
+ /translation="MVHHGQMHAQPGVGLRPDTPVASGQLPSTSIRSRRSGISKAQRE
+ TWERLWPELGLLALPQSPRGTPVDTRAWFGRDAPVVLEIGSGSGTSTLAMAKAEPHVD
+ VIAVDVYRRGLAQLLCAIDKVGSDGINIRLILGNAVDVLQHLIAPDSLCGVRVFFPDP
+ WPKARHHKRRLLQPATMALIADRLVPSGVLHAATDHPGYAEHIAAAGDAEPRLVRVDP
+ DTELLPISVVRPATKYERKAQLGGGAVIELLWKKHGCSERDLKIR"
+ gene 249234..250319
+ /locus_tag="BQ2027_MB0215"
+ CDS 249234..250319
+ /locus_tag="BQ2027_MB0215"
+ /note="Mb0215, -, len: 361 aa. Equivalent to Rv0209, len:
+ 361 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 361 aa overlap). Hypothetical unknown
+ protein. Mb0215 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247921.1"
+ /translation="MRGQGHQIFVDELARFATSSADQRVVAIAQRAAEPLRVAVRGRP
+ GVGCRTVARALQGAGSSSGMTVTPQARAADSDVDLVVYVTVEVVKPEDREAIAATRRP
+ VVAVLNKADLAGPLSGAGPIVMAQARCAQFSTLLGVPMESMIGLLAVAALDDLDDTLR
+ AALRALAAHPDGFDALDRAVAGFLAAALPVPTEVRLRLLDTLDLFGIALGMAAFRPGR
+ PSRTPAQLRTLLRRVSGVDAVIDKVTAAGSEVRYRRLLDAVAELEALAAQAKEIGGPI
+ GEFLRDDDTVLARMAAAVDVALAVGLDVGPLDDPAAHLPRAVRWHRYSLDNGDMHRTC
+ GADIARGSLRLWSLAGGMPLHRYRKSS"
+ gene 250316..251794
+ /locus_tag="BQ2027_MB0216"
+ CDS 250316..251794
+ /locus_tag="BQ2027_MB0216"
+ /note="Mb0216, -, len: 492 aa. Equivalent to Rv0210, len:
+ 492 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 492 aa overlap). Hypothetical unknown
+ protein. Possibly membrane protein; has hydrophobic
+ stretches around aa 333 - 381. Protein product from Mb0216
+ detected using SWATH mass spectrometry. Mb0216 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247922.1"
+ /translation="MIRAASDDPAGVDELVAAIAPGLAGLGLPVINRREVVLVTGPWL
+ AGVSGVRAALAERLPQRRFVETAELGPGDAPVAVVFVVSAATALTESDCVLLDTAAEH
+ TDAVVAVVSKIDVHRGWRDVLTSNRDRLAARASRYARVPWVGAAAAPELGEPYLDDLV
+ AAIQKQLADPAVARRNMLRAWESRLLMVARRFDGDAQSAGRRARVDALRQQRRTVLRQ
+ GRQSKSEHTIALRAQIQHARVKLSYFARNRCSLLRVELQEHVAGLSRKDIARFAAYTR
+ GRVQEVVAEVGEGAVAHLADVAQLLGVPVQPPVLENLPAVLPTVVAPPLTSRRLEIRL
+ TTLLGAGFGLGIALTLSRLVAGLTPGLAASGMVAGVAIGLAVTAWVVNARALLHDRVV
+ VDRWTGEVTASLRSVVEQLVATRVVAVETLLSTAISERDDAENARVADQVSIIDGELR
+ EHAVAAARAAALRDREMPAVRAALEAVRAELGEPGTPTTGLF"
+ gene 251978..253798
+ /gene="pckA"
+ /locus_tag="BQ2027_MB0217"
+ CDS 251978..253798
+ /gene="pckA"
+ /locus_tag="BQ2027_MB0217"
+ /standard_name="pckG; pck1"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0217, pckA, len: 606 aa. Equivalent to Rv0211,
+ len: 606 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 606 aa overlap). Probable pckA
+ (alternate gene names: pckG and pck1), phosphoenolpyruvate
+ carboxykinase [GTP] (EC 4.1.1.32), equivalent to
+ Z95398|MLCL622_21 PROBABLE PHOSPHOENOLPYRUVATE
+ CARBOXYKINASE from Mycobacterium leprae (609 aa), FASTA
+ score: (86.1% identity in 605 aa overlap). Also highly
+ similar to others e.g. PPCK_NEOFR|P22130
+ phosphoenolpyruvate carboxykinase [GTP] (608 aa), FASTA
+ scores: opt: 2287, E(): 0, (55.9% identity in 598 aa
+ overlap). Contains PS00505 Phosphoenolpyruvate
+ carboxykinase (GTP) signature. BELONGS TO THE
+ PHOSPHOENOLPYRUVATE CARBOXYKINASE [GTP] FAMILY. Protein
+ product from Mb0217 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0217 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable iron-regulated phosphoenolpyruvate
+ carboxykinase [gtp] pcka (phosphoenolpyruvate carboxylase)
+ (pepck)(pep carboxykinase)"
+ /protein_id="CAB5247923.1"
+ /translation="MTSATIPGLDTAPTNHQGLLSWVEEVAELTQPDRVVFTDGSEEE
+ FQRLCDQLVEAGTFIRLNPEKHKNSYLALSDPSDVARVESRTYICSAKEIDAGPTNNW
+ MDPGEMRSIMKDLYRGCMRGRTMYVVPFCMGPLGAEDPKLGVEITDSEYVVVSMRTMT
+ RMGKAALEKMGDDGFFVKALHSVGAPLEPGQKDVAWPCSETKYITHFPETREIWSYGS
+ GYGGNALLGKKCYSLRIASAMAHDEGWLAEHMLILKLISPENKAYYFAAAFPSACGKT
+ NLAMLQPTIPGWRAETLGDDIAWMRFGKDGRLYAVNPEFGFFGVAPGTNWKSNPNAMR
+ TIAAGNTVFTNVALTDDGDVWWEGLEGDPQHLIDWKGNDWYFRETETNAAHPNSRYCT
+ PMSQCPILAPEWDDPQGVPISGILFGGRRKTTVPLVTEARDWQHGVFIGATLGSEQTA
+ AAEGKVGNVRRDPMAMLPFLGYNVGDYFQHWINLGKHADESKLPKVFFVNWFRRGDDG
+ RFLWPGFGENSRVLKWIVDRIEHKAGGATTPIGTVPAVEDLDLDGLDVDAADVAAALA
+ VDADEWRQELPLIEEWLQFVGEKLPTGVKDEFDALKERLG"
+ gene complement(253865..254836)
+ /gene="nadR"
+ /locus_tag="BQ2027_MB0218C"
+ CDS complement(253865..254836)
+ /gene="nadR"
+ /locus_tag="BQ2027_MB0218C"
+ /note="Mb0218c, nadR, len: 323 aa. Equivalent to Rv0212c,
+ len: 323 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 323 aa overlap). Possible nadR
+ (alternate gene name: nadI), transcriptional regulator,
+ similar to others e.g. NADR_ECOLI|P27278 transcriptional
+ regulator from Escherichia coli (410 aa), FASTA scores:
+ opt: 377, E (): 1e-17, (31.1% identity in 347 aa overlap).
+ Contains PS00017 ATP/GTP-binding site motif A (P-loop).
+ Protein product from Mb0218c detected using SWATH mass
+ spectrometry. Mb0218c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN NADR
+ (PROBABLY ASNC-FAMILY)"
+ /protein_id="CAB5247924.1"
+ /translation="MTHGMVLGKFMPPHAGHVYLCEFARRWVDELTIVVGSTAAEPIP
+ GAQRVAWMRELFPFDRVVHLANENPQRPWEHPDFWDIWKASLQGVLATRPDFVFGAEP
+ YNADFAQVLGARFVAVDHGRTVVPVTATDIRADPLGHWQHIPRCVRPAFVKRVSIIGP
+ ESTGKTTLAQAVAEKLRTKWVPERAKMLRELNGGSLIGLEWAEIVRGQIASEEALARD
+ ADRVLICDTDPLATTVWAEFLAGGCPQELRDLARRPYDLTLLTTPDVPWDADDGRCVP
+ GARGTFFARCEQALRAAGRSFVVITGGWEERLSVSLRAVEELVRARR"
+ gene complement(254833..256146)
+ /locus_tag="BQ2027_MB0219C"
+ CDS complement(254833..256146)
+ /locus_tag="BQ2027_MB0219C"
+ /note="Mb0219c, -, len: 437 aa. Equivalent to Rv0213c,
+ len: 437 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 437 aa overlap). Possible
+ methyltransferase (EC 2.1.1.-), weakly similar to others
+ methyltransferases e.g. AF127374_30|LINA from Streptomyces
+ lavendulae (611 aa), FASTA scores: opt: 400, E(): 8.1e-19,
+ (27.3% identity in 388 aa overlap); Q50258 fortimicin kl1
+ methyltransferase (553 aa), FASTA scores: opt: 267, E():
+ 1.2e-13, (29.3% identity in 351 aa overlap). Mb0219c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE METHYLTRANSFERASE (METHYLASE)"
+ /protein_id="CAB5247925.1"
+ /translation="MSIKAYAKTQGIAVTSVNGLVAGHGSVQETWLAMQSAAALSGTP
+ RLVGFSCIDTFPEVLWLAQRARQAWDGVRIVIGNAMATLNYERILRQHDCFDYVVVGD
+ GEVAFTKLALALANDAAVDDVPGLARRSEQGQILRTPSSLVDLDELPRPARDELPTVL
+ ADGFAASVFSTRGCPYRCTFCGTGAMSAMLGKDSYRAKSVDAVVDEIDYLVSDYDVNF
+ LSITDDLFISKHPGSQQRAADFANAVLRRGISVNFMVDIRLDSVVDLDLFKHLHRAGL
+ RRVFIGVETGSYEQLRAYRKQILTRGQDAADTINALQQLGIDVIPGTIMFHPTVQPDE
+ LRETVRLLRATKYTVGFKFMSRIVPYPGTPLYQAYSDAGYLTAKWPLGQWEFVDPEAS
+ RVYADVVAKVAPDVGISFDEAEAYFLSRLDEWENVIAGRIAEATS"
+ gene 256260..257873
+ /gene="fadD4"
+ /locus_tag="BQ2027_MB0220"
+ CDS 256260..257873
+ /gene="fadD4"
+ /locus_tag="BQ2027_MB0220"
+ /note="Mb0220, fadD4, len: 537 aa. Equivalent to Rv0214,
+ len: 537 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 537 aa overlap). Probable fadD4,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), similar to many
+ e.g. 4CL_PINTA|P41636 4-coumarate--coa ligase (EC
+ 6.2.1.12) (537 aa), FASTA scores: opt: 622, E(): 1e-31,
+ (30.0% identity in 514 aa overlap). Also similar to others
+ from Mycobacterium tuberculosis e.g. MTCY6A4.14 FASTA
+ score: (30.7% identity in 501 aa overlap); MTCY493_27,
+ MTCY07A7_11, MTCI28_6. Contains PS00455 putative
+ AMP-binding domain signature. Protein product from Mb0220
+ detected using SWATH mass spectrometry. Mb0220 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY-ACID-COA LIGASE FADD4
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="CAB5247926.1"
+ /translation="MPRGELYKRFRLVMGGIAPCGSGRRAATYPRRMQIRPYIAADKP
+ AVILYPSGTVISFDELEARANRLAHWFRQAGLREDDVVAILMENNEHVHAVMWAARRS
+ GLYYVPINTHLTASEAAYIVDNSGAKAIVGSAALRETCHGLAEHLPGGLPDLLMLAGG
+ GLVGWMTYPECVADQPDTPIEDEREGDLLQYSSGTTGRPKGIKRELPHVSPDAAPGMM
+ PALLDFWMDADSVYLSPAPMYHTAPSVWTMSALAAGVTTVVMEKFDAEGALDAIQRYR
+ VTHAQFVPAMFVRMLKLPEAVRNSYDMSSLRRVIHAAAPCPVQIKEQMIHWWGPIIDE
+ YYASSEASGSTLITAEDWLTHPGSVGKPIQGGVHIVGADGSELPPNQPGEIYFEGGYP
+ FEYLNDPAKTAASRNKHGWVTVGDVGYLDDDGYLFLTGRRHHMIISGGVNIYPQEAEN
+ LLVAHPKVLDAAVFGVPDDEMGQRVMAAVQTVDSADANDQFAGELLAWLRDRLSHFKC
+ PRSIAFEPQLPRTDTGKLYKSGLVEKYSV"
+ gene complement(257915..259081)
+ /gene="fadE3"
+ /locus_tag="BQ2027_MB0221C"
+ CDS complement(257915..259081)
+ /gene="fadE3"
+ /locus_tag="BQ2027_MB0221C"
+ /note="Mb0221c, fadE3, len: 388 aa. Equivalent to Rv0215c,
+ len: 357 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 356 aa overlap). Probable fadE3,
+ acyl-dehydrogenase (EC 1.3.99.-), similar to many e.g.
+ ACDB_BACSU|P45857 acyl-CoA dehydrogenase from B. subtilis
+ (EC 1.3.99.-) (379 aa), FASTA scores: opt: 812, E(): 0,
+ (39.5% identity in 354 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 29 bp insertion leads to a longer product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (388 aa
+ versus 357 aa). Protein product from Mb0221c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0221c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE3"
+ /protein_id="CAB5247927.1"
+ /translation="MRNELNDDEAMLVATVRAFIDRDVKPTVREVEHANSYPEAWIEQ
+ MKHIGIYGLAIDEQYGGSPVSMPCYVQVTQELARGWMSLAGAMGGHTVVAKLLTLFGT
+ EEQRRTYLPPMASGELRATMALTEPGGGSDLQNMSTTALADGPEGSAGLLINGCKTWI
+ SNARRSGLFAVLCKTDPNATPRHQGMSIVLVEPGPGLTVSRDLPKLGYKGVESCELSF
+ DNLRVPVSAILGGAMGQGFSQMMKGLETGRIQVAARALGVATAALEDSLAYAQQRESF
+ GRPIWQHQAVGNYLADMATKLTAARQLTRYAAERYDSGQRCDMEAGMAKLFASEVAME
+ IALNAVRIHGGYGYSTEYDVERYFRDAPLMILGEGTNEIQRNVIAGQLVARGGI"
+ gene 259138..260151
+ /locus_tag="BQ2027_MB0222"
+ CDS 259138..260151
+ /locus_tag="BQ2027_MB0222"
+ /note="Mb0222, -, len: 337 aa. Equivalent to Rv0216, len:
+ 337 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 337 aa overlap). Conserved
+ hypothetical protein, equivalent to Z95398|MLCL622_22 from
+ Mycobacterium leprae (339 aa), FASTA scores: E(): 0, (73.7
+ identity in 338 aa overlap). Protein product from Mb0222
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0222 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="double hotdog hydratase"
+ /protein_id="CAB5247928.1"
+ /translation="MASGYGGIRVGGPYFDDLSKGQVFDWAPGVTLSLGLAAAHQSIV
+ GNRLRLALDSDLCAAVTGMPGPLAHPGLVCDVAIGQSTLATQRVKANLFYRGLRFHRF
+ PAVGDTLYTRTEVVGLRANSPKPGRAPTGLAGLRMTTIDRTDRLVLDFYRCAMLPASP
+ DWKPGAVPGDDLSRIGADAPAPAADPTAHWDGAVFRKRVPGPHFDAGIAGAVLHSTAD
+ LVSGAPELARLTLNIAATHHDWRVSGRRLVYGGHTIGLALAQATRLLPNLATVLDWES
+ CDHTAPVHEGDTLYSELHIESAQAHADGGVLGLRSLVYAVSDSASEPDRQVLDWRFSA
+ LQF"
+ gene complement(260148..261056)
+ /gene="lipW"
+ /locus_tag="BQ2027_MB0223C"
+ CDS complement(260148..261056)
+ /gene="lipW"
+ /locus_tag="BQ2027_MB0223C"
+ /note="Mb0223c, lipW, len: 302 aa. Equivalent to Rv0217c,
+ len: 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 302 aa overlap). Possible esterase (EC
+ 3.1.1.-), showing similarity with others e.g.
+ EST_ACICA|P18773 esterase (303 aa), FASTA scores: opt:
+ 320, E(): 3.2e-13, (29.2% identity in 274 aa overlap).
+ Protein product from Mb0223c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0223c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ESTERASE LIPW"
+ /protein_id="CAB5247929.1"
+ /translation="MSGNEVHPDLRRIAVVTPRQLVGPRTLPVMRALIVVAGLRMSRT
+ PPDIEVLTLESGVGVRLYRPAGSNEPAPALLWIHAGGYVMGTAQQDDRLCLRFSSRLG
+ ITVASVDYRLAPENPYPAALGDCYSALTWLASLPAVDPARVAIGGASAGGGLAAALAL
+ LARDRGGITPAFQLLVYPMLDDRTSIAPANPHYRLWNGRANRFGWRAYLGDADARVAV
+ PGRRDDLGGLAPAWIGVGTHDLLHDEDLAYAERLTAAGVPCQVEVVEGAFHGFDRVAP
+ NVGVSQRFFTSQCNSLRAALALSNRT"
+ gene 261149..262477
+ /locus_tag="BQ2027_MB0224"
+ CDS 261149..262477
+ /locus_tag="BQ2027_MB0224"
+ /note="Mb0224, -, len: 442 aa. Equivalent to Rv0218, len:
+ 442 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 442 aa overlap). Probable conserved
+ transmembrane protein, some similarity with sulfite
+ oxidases (EC 1.8.3.1) e.g. SUOX_HUMAN|P51687 sulfite
+ oxidase precursor (488 aa), FASTA scores: opt: 153, E():
+ 0.0087, (28.6% identity in 161 aa overlap); and with some
+ nitrate reductases (EC 1.6.6.3) e.g. NIA_FUSOX|P39863
+ nitrate reductase (NADPH) (905 aa), FASTA scores: opt:
+ 143, E(): 0.06, (29.3% identity in 92 aa overlap). Also
+ similar to BSUB0017_86 from Mycobacterium tuberculosis.
+ Mb0224 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247930.1"
+ /translation="MSDPARGAEAEDAYGFPAGLWRWLQRHPPPALHRLTRFRSPLRG
+ PWLTSVFGLVLLVALPFVIITGLLSYIAYAPQLGQAIPGDVGWLRLPAFTWPTRPSWL
+ YRLTQGLHVGLGLVIIPVVLAKLWSVIPRLFVWPPARSIAQVLERLSVLMLVGGILFQ
+ IVTGVLNIQYDYIFGFSFYTGHYFGAWVFIAGFLLHIVVKIPHMVTGLRSIPMREVLG
+ TNVADTRAQPCDPDGLVSVNPGEATLSRRGALGLVGAGVLLIGVLTVGQTLGGFTRKA
+ ALLLPRGRVVSPGDFPVNKTAAAAGITAEAIGPDWRLVLRGGPAEVVLDRATLAGLPQ
+ RTARLPLACVEGWSAVRTWSGVPLAELALLAGVPAARSARVTSLQRGGAFGEAKLAAN
+ QIADPDALLALRVDGADLSLNHGYPARIIVPALPGVHNTKWVAGIEFHKR"
+ gene 262479..263027
+ /locus_tag="BQ2027_MB0225"
+ CDS 262479..263027
+ /locus_tag="BQ2027_MB0225"
+ /note="Mb0225, -, len: 182 aa. Equivalent to Rv0219, len:
+ 182 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 182 aa overlap). Probable conserved
+ transmembrane protein, showing similarity with
+ CAB76992.1|AL159178 putative lipoprotein from Streptomyces
+ coelicolor (163 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247931.1"
+ /translation="MFDIATRFKNSYGSGPLHLLAMVSGFALLGYIVATARPSALWNQ
+ ATWWQSIAVWFVAAVVAHDLLLYPLYALADRILARLVGRRDVSAPRRRPELPVRNYIR
+ IPALAAGLTLLVFLPGIIRQGAPTYLDATGQTQEPFLGRWLLLTAVAFGISAAAYAIR
+ LVVAHVRRRRAGCSRVDAIDEE"
+ gene 263037..264248
+ /gene="lipC"
+ /locus_tag="BQ2027_MB0226"
+ CDS 263037..264248
+ /gene="lipC"
+ /locus_tag="BQ2027_MB0226"
+ /note="Mb0226, lipC, len: 403 aa. Equivalent to Rv0220,
+ len: 403 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 403 aa overlap). Probable esterase (EC
+ 3.1.1.-), similar to others proteins and esterases from
+ various organisms and Mycobacterium tuberculosis e.g.
+ Q50681 (431 aa), FASTA scores: opt: 841, E(): 0, (38.2%
+ identity in 408 aa overlap); Rv1426c, Rv1399c, etc.
+ Contains PS00122 Carboxylesterases type-B serine active
+ site. Protein product from Mb0226 detected using SWATH
+ mass spectrometry. Mb0226 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ESTERASE LIPC"
+ /protein_id="CAB5247932.1"
+ /translation="MNQRRAAGSTGVAYIRWLLRARPADYMLALSVAGGSLPVVGKHL
+ KPLGGVTAIGVWGARHASDFLSATAKDLLTPGINEVRRRDRASTQEVSVAALRGIVSP
+ DDLAVEWPAPERTPPVCGALRHRRYVHRRRVLYGDDPAQLLDVWRRKDMPTKPAPVLI
+ FVPGGAWVHGSRAIQGYAVLSRLAAQGWVCLSIDYRVAPHHRWPRHILDVKTAIAWAR
+ ANVDKFGGDRNFIAVAGCSAGGHLSALAGLTANDPQYQAELPEGSDTSVDAVVGIYGR
+ YDWEDRSTPERARFVDFLERVVVQRTIDRHPEVFRDASPIQRVTRNAPPFLVIHGSRD
+ CVIPVEQARSFVERLRAVSRSQVGYLELPGAGHGFDLLDGARTGPTAHAIALFLNQVH
+ RSRAQFAKEVI"
+ gene 264292..265065
+ /locus_tag="BQ2027_MB0227"
+ CDS 264292..265065
+ /locus_tag="BQ2027_MB0227"
+ /note="Mb0227, -, len: 257 aa. Equivalent to 5' end of
+ Rv0221, len: 469 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (98.3% identity in 234 aa overlap).
+ Conserved hypothetical protein, similar to others proteins
+ from Mycobacterium tuberculosis e.g.
+ Q50680|Rv2285|MT2343|MTCY339.25c hypothetical 47.7 kDa
+ protein (445 aa), FASTA scores: opt: 455, E(): 8.1e-23,
+ (26.7% identity in 461 aa overlap); Rv3740c, Rv3734c, etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 1902 bp deletion leads to a shorter product with a
+ different COOH part, compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (257 aa versus 469
+ aa). It also leads to the deletion of the next protein,
+ echA1 (Rv0222). Protein product from Mb0227 detected using
+ SWATH mass spectrometry. Mb0227 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible triacylglycerol synthase
+ (diacylglycerol acyltransferase)"
+ /protein_id="CAB5247933.1"
+ /translation="MKRLSGWDAVLLYSETPNVHMHTLKVAVIELDSDRQEFGVDAFR
+ EVIAGRLHKLEPLGYQLVDVPLKFHHPMWREHCQVDLNYHIRPWRLRAPGGRRELDEA
+ VGEIASTPLNRDHPLWEMYFVEGLANHRIAVVAKIHHALADGVASANMMARGMDLLPG
+ PEVGRYVPDPAPTKRQLLSAAFIDHLRHLGRIPATIRYTTQGLGRVRRSSRKLSPALT
+ MPFTPPPTFMNRIKKPLSKPSGRPPPHTNRAPSSMPLAM"
+ gene complement(264931..266088)
+ /locus_tag="BQ2027_MB0228C"
+ CDS complement(264931..266088)
+ /locus_tag="BQ2027_MB0228C"
+ /note="Mb0228c, -, len: 385 aa. Equivalent to Rv0223c,
+ len: 487 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (95.3% identity in 364 aa overlap). Probable aldehyde
+ dehydrogenase (EC 1.2.1.-), similar to others e.g.
+ A75608|6460525|AAF12231.1|AE001862_57 aldehyde
+ dehydrogenase from Deinococcus radiodurans strain R1 (495
+ aa); Q47943 L-sorbosone dehydrogenase NAD(P) dependent
+ from Gluconobacter oxydans (498 aa), FASTA scores: opt:
+ 1157, E (): 0, (42.1% identity in 482 aa overlap); etc.
+ Also similar to Rv0768, Rv2858c, etc from Mycobacterium
+ tuberculosis. Contains PS00687 Aldehyde dehydrogenases
+ glutamic acid active site; and PS00070 Aldehyde
+ dehydrogenases cysteine active site. BELONGS TO THE
+ ALDEHYDE DEHYDROGENASES FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base insertion (*-c) leads to a shorter product,
+ with a different COOH part compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (385 aa versus 487
+ aa). Protein product from Mb0228c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0228c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ALDEHYDE DEHYDROGENASE"
+ /protein_id="CAB5247934.1"
+ /translation="MSDSATEYDKLFIGGKWTKPSTSDVIEVRCPATGEYVGKVPMAA
+ AADVDAAVAAARAAFDNGPWPSTPPHERAAVIAAAVKMLAERKDLFTKLLAAETGQPP
+ TIIETMHWMGSMGAMNYFAGAADKVTWTETRTGSYGQSIVSRESVGVVGAIVAWNVPL
+ FLAVNKIAPALLAGCTIVLKPAAETPLTANALAEVFAEVGLPEGVLSVVPGGIETGQA
+ LTSNPDIDMFTFTGSSAVGREVGRRAAEMLKPCTLELGGKSAAIILEDVDLAAAIPMM
+ VFSGVMNAGQGCVNQTRILAPRSRYDEIVAAVTNFVTALPVGPPSDPAAQIGPLISEK
+ QRTRVEALHRQGHRGGRSVGVRRRPSRGLGQRLLYPIHERRWRGKWHGQCG"
+ gene complement(266187..266951)
+ /locus_tag="BQ2027_MB0229C"
+ CDS complement(266187..266951)
+ /locus_tag="BQ2027_MB0229C"
+ /note="Mb0229c, -, len: 254 aa. Equivalent to Rv0224c,
+ len: 254 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 254 aa overlap). Possible
+ methyltransferase (EC 2.1.1.-), showing weak similarity
+ with other methyltransferases e.g. P74388
+ STEROL-C-METHYLTRANSFERASE (318 aa), FASTA scores: opt:
+ 190, E(): 3.6e-05, (33.3% identity in 114 aa overlap).
+ Equivalent to AL022486|MLCB1883_1 from Mycobacterium
+ leprae (269 aa), FASTA scores: opt: 1456, E(): 0, (82.9%
+ identity in 252 aa overlap). Also some similarity with
+ MTCY21B4.22c from Mycobacterium tuberculosis FASTA score:
+ (30.1% identity in 136 aa overlap). Mb0229c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE METHYLTRANSFERASE (METHYLASE)"
+ /protein_id="CAB5247935.1"
+ /translation="MAVTDVFARRATLRRSLRLLADFRYEQRDPARFYRTLAADTAAM
+ IGDLWLATHSEPPVGRTLLDVGGGPGYFATAFSDAGVGYIGVEPDPDEMHAAGPAFTG
+ RPGMFVRASGMALPLADDSVDICLSSNVAEHVPRPWQLGTEMLRVTKPGGLVVLSYTV
+ WLGPFGGHEMGLSHYLGGARAAARYVRKHGHPAKNNYGSSLFAVSAAEGLRWAAGTGA
+ ALAVFPRYHPRWAWWLTSVPVLREFLVSNLVLVLTP"
+ gene 266987..268141
+ /locus_tag="BQ2027_MB0230"
+ CDS 266987..268141
+ /locus_tag="BQ2027_MB0230"
+ /note="Mb0230, -, len: 384 aa. Equivalent to Rv0225, len:
+ 384 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 384 aa overlap). Possible conserved
+ protein involved in LPS biosynthesis, similar to O26275
+ LPS BIOSYNTHESIS RFBU RELATED PROTEIN (382 aa), FASTA
+ scores: opt: 426, E(): 1.2e-20, (28.2% identity in 394 aa
+ overlap). Some similarity with Rv3032 from Mycobacterium
+ tuberculosis FASTA score: (31.6% identity in 228 aa
+ overlap). Protein product from Mb0230 detected using SWATH
+ mass spectrometry. Mb0230 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Glycosyltransferase"
+ /protein_id="CAB5247936.1"
+ /translation="MSALRSVLLLCWRDIGHPQGGGSEAYLQRIGAQLAASGIAVTLR
+ TARYPGAPRHELVDGVRISRAGGRYSVYLWALLAMAAARCGLGPLRRVRPDVVVDTQN
+ GWPFVARLLYGRRSLVLVHHCHREQWPVAGRMMGRLGWYVESMLSPRLHRRNQYVTVS
+ LPSARDLIALGVDSERIAVVRNGLDEAPSPTLSGPRAPTPRVVVLSRLVPHKQIEDAL
+ AAVAELQPRIPGLHLDIVGGGWWRQRLVDHVHRLDIADAVTFHGHVDDVTKHHVLQSS
+ WVHLLPSRKEGWGLAVIEAAQHGVPTIGYRSSGGLADSIVDGVTGILVDDRAELVAWL
+ EQLLSDSVLRDQLGAKAQARSGEFSWRQSAEALRSVLEAVQASRFVSGVV"
+ gene complement(268158..269888)
+ /locus_tag="BQ2027_MB0231C"
+ CDS complement(268158..269888)
+ /locus_tag="BQ2027_MB0231C"
+ /note="Mb0231c, -, len: 576 aa. Equivalent to Rv0226c,
+ len: 576 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 576 aa overlap). Probable conserved
+ transmembrane protein, equivalent, except in N-terminal
+ part, to AC32114.1|AL583926 conserved membrane protein
+ from Mycobacterium leprae (600 aa), FASTA scores: opt:
+ 2086, E(): 0, (70.3% identity in 579 aa overlap). Also
+ similar to AL021411|SC7H1_20 from Streptomyces coelicolor
+ (483 aa), FASTA scores: opt: 180, E(): 0.00028, (26.5
+ identity in 388 aa overlap). Protein product from Mb0231c
+ detected using SWATH mass spectrometry. Mb0231c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247937.1"
+ /translation="MRWFRPGYALVLVLLLAAPLLRPGYLLLRDAVSTPRSYVSANAL
+ GLTSAPRATPQDFAVALASHLVDGGVVVKALLLLGLWLAGWGAARLVATALPAAGAAG
+ QFVAITLAIWNPYVAERLLQGHWSLLVGYGCLPWVATAMLTMRTTVGAGWFGLFGLAF
+ WVALAGLTPSGLLLAATVAVVCVAMPGAGRPRWQCGVAALGSALVGALPWLTASALGS
+ SLTSHTAANQLGVTAFAPRAEPGLGTLGSLASLGGIWNGEAVPSSRTTLFAVASAVVL
+ LAMVAIGLPTVARRPVAVPLLTLAAVSVMVPAVLATGPGLHALRVVVDAAPGLGVLRD
+ GQKWVALAVPGYTLSGAGTVLTLRRWLRPATAAVVCCLALVLTLPDLAWGVWGKVAPV
+ HYPSGWAAVAAAINADPRTVAVLPAGTMRRFSWSGSAPVLDPLPRWVRADVLTTGDLV
+ ISGVTVPGEDAHARAVQELLLTGPHPSTLAAAGVGWLVVESDSAGDMGAAARTLGRLA
+ AAHRDDELALYRVGGQTSGASSARLKATMLAHWAWLSMLLVGGAGAAGYWVRRHLHHC
+ EDTPASRAQD"
+ gene complement(269898..271163)
+ /locus_tag="BQ2027_MB0232C"
+ CDS complement(269898..271163)
+ /locus_tag="BQ2027_MB0232C"
+ /note="Mb0232c, -, len: 421 aa. Equivalent to Rv0227c,
+ len: 421 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 421 aa overlap). Possible conserved
+ membrane protein, equivalent to AL022486|MLCB1883_4 from
+ Mycobacterium leprae (448 aa), FASTA scores: opt: 2148,
+ E(): 0, (76.6% identity in 423 aa overlap). Protein
+ product from Mb0232c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0232c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5247938.1"
+ /translation="MLRFAACGAIGLGAALLIAALLLSTYTTRRIAEIPLDIDATLIS
+ DGTGTALDSASLATEHIVVNQDVPLVSQQQVTVESPANADVVTLQVGSSLRRTDKQKD
+ SGLLLAIVDTVTLNRKTAMAVSDDTHTGGAVQKPRGLNDENPPTAIPLRHDGLSYRFP
+ FHTEKKTYPYFDPIAQKAFDANYEGEEDVNGLTTYRFTQNVGYTPEGKLVAPLKYPSL
+ YAGDEDGKVTTSAAMWGLPGDPNEQITMTRYYAAQRTFWVDPVSGTIVKETERANHYF
+ ARDPLKPEVTFADYQVTSTEETVESQVNAARDERDRLALWSRVLPITFTAAGLVALVG
+ GGLFASFSLRTEGALMAASGDRDDHDYRRGGFEEPVPGAEAETEKLPTQRPDFPREPN
+ GSDPPRLGSAQPPPPPDAGHPDPGPPERR"
+ gene 271379..272602
+ /locus_tag="BQ2027_MB0233"
+ CDS 271379..272602
+ /locus_tag="BQ2027_MB0233"
+ /note="Mb0233, -, len: 407 aa. Equivalent to Rv0228, len:
+ 407 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 407 aa overlap). Probable integral
+ membrane acyltransferase (EC 2.3.1.-), equivalent to
+ 3063875|CAA18555.1|AL022486|T44870 ACYLTRANSFERASE from
+ Mycobacterium leprae (384 aa), FASTA scores: opt: 2004,
+ E(): 0, (79.3% identity in 381 aa overlap). Also similar
+ to others e.g. Q11064 PROBABLE ACYLTRANSFERASE CY50.28C
+ (383 aa), FASTA scores: opt: 372, E(): 2.6e-16, (35.9%
+ identity in 359 aa overlap); Q00718|MDMB_STRMY
+ ACYLTRANSFERASE. Very similar to Rv0111, Rv1254, etc from
+ Mycobacterium tuberculosis. Mb0233 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INTEGRAL MEMBRANE ACYLTRANSFERASE"
+ /protein_id="CAB5247939.1"
+ /translation="MGPADESGAPIRPQTPHRHTVLVTNGQVVGGTRGFLPAVEGMRA
+ CAAVGVVVTHVAFQTGHSSGVGGRLFGRFDLAVAVFFAVSGFLLWRGHAAAARDLRSH
+ PRTGPYLRSRVARIMPAYVVAVVVILSLLPDADHASLTVWLANLTLTQIYVPLTLTGG
+ LTQMWSLSVEVAFYAALPVLALLGRRIPVGARVPAIAALAALSWAWGWLPLDAGSGIN
+ PLTWPPAFFSWFAAGMLLAEWAYSPVGLPHRWARRRVAMAVTALLGYLVAASPLAGPE
+ GLVPGTAAQFAVKTAMGSLVAFALVAPLVLDRPDTSHRLLGSPAMVTLGRWSYGLFIW
+ HLAALAMVFPVIGAFPFTGRMPTVLVLTLIFGFAIAAVSYALVESPCREALRRWERRN
+ EPISVGELQADAIAP"
+ gene complement(272630..273310)
+ /locus_tag="BQ2027_MB0234C"
+ CDS complement(272630..273310)
+ /locus_tag="BQ2027_MB0234C"
+ /note="Mb0234c, -, len: 226 aa. Equivalent to Rv0229c,
+ len: 226 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 226 aa overlap). Possible conserved
+ membrane protein, similar to several proteins from
+ Mycobacterium tuberculosis. Other possible start sites and
+ could be shorter as C-terminal region has some similarity
+ with Rv2757c|D70880 from Mycobacterium tuberculosis (138
+ aa), FASTA scores: E(): 1e-15, (45.3% identity in 137 aa
+ overlap), and Rv0301, Rv2546, etc. Also some similarity
+ with Q48177 virulence associated protein C (132 aa), FASTA
+ scores: opt: 101, E(): 0.6, (24.3% identity in 136 aa
+ overlap). Contains PS00626 Regulator of chromosome
+ condensation (RCC1) signature 2. Protein product from
+ Mb0234c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0234c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible conserved membrane protein with pin
+ domain"
+ /protein_id="CAB5247940.1"
+ /translation="MRQPRRANAMGLALCIYIGSLLIYTPIHGETSRRHRRAGFKHGS
+ YRIGHDDDQRHRQRGPAASHVSASSTRRRRSRHAGRRTARGPRRSMALKYLLDTSVIK
+ RLSRPAVRRAVEPLAEAGAVARTQITDLEVGYSARNETEWQRLMVALSAFDLIESTAS
+ HHRRALGIQRLLAARSQRGRKIPDLLIAAAGEEHGLVVLHYDADFDLIAAVTGQPCQW
+ IVPAGTID"
+ gene complement(273307..274287)
+ /gene="php"
+ /locus_tag="BQ2027_MB0235C"
+ CDS complement(273307..274287)
+ /gene="php"
+ /locus_tag="BQ2027_MB0235C"
+ /note="Mb0235c, php, len: 326 aa. Equivalent to Rv0230c,
+ len: 326 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 326 aa overlap). Probable php,
+ phosphotriesterase (EC 3.1.8.1), similar to others e.g.
+ AAK42653.1|AE006849 putative aryldialkylphosphatase
+ (phosphotriesterase) (paraoxonase) from Sulfolobus
+ solfataricus (314 aa); PHP_ECOLI|P45548 PHOSPHOTRIESTERASE
+ HOMOLOGY PROTEIN from Escherichia coli (292 aa), FASTA
+ scores: opt: 408, E(): 7.1e-20, (31.1% identity in 305 aa
+ overlap); OPD_FLASP|P16648 parathion hydrolase precursor
+ (365 aa), FASTA scores: opt: 319, E(): 5.1e-14, (34.5%
+ identity in 333 aa overlap); etc. BELONGS TO THE
+ PHOSPHOTRIESTERASE FAMILY. COFACTOR: CONTAINS 2 MOLES OF
+ ZINC PER SUBUNIT. Protein product from Mb0235c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0235c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHOTRIESTERASE PHP (PARATHION
+ HYDROLASE) (PTE) (ARYLDIALKYLPHOSPHATASE) (PARAOXONASE)
+ (A-ESTERASE) (ARYLTRIPHOSPHATASE) (PARAOXON HYDROLASE)"
+ /protein_id="CAB5247941.1"
+ /translation="MPELNTARGPIDTADLGVTLMHEHVFIMTTEIAQNYPEAWGDED
+ KRVAGAIARLGELKARGVDTIVDLTVIGLGRYIPRIARVAAATELNIVVATGLYTYND
+ VPFYFHYLGPGAQLDGPEIMTDMFVRDIEHGIADTGIKAGILKCATDEPGLTPGVERV
+ LRAVAQAHKRTGAPISTHTHAGLRRGLDQQRIFAEEGVELSRVVIGHCGDSTDVGYLE
+ ELIAAGSYLGMDRFGVDVISPFQDRVNIVARMCERGHADKMVLSHDACCYFDALPEEL
+ VPVAMPNWHYLHIHNDVIPALKQHGVTDEQLHTMLVDNPRRIFERQGGYQ"
+ gene 274382..276088
+ /gene="fadE4"
+ /locus_tag="BQ2027_MB0236"
+ CDS 274382..276088
+ /gene="fadE4"
+ /locus_tag="BQ2027_MB0236"
+ /note="Mb0236, fadE4, len: 568 aa. Equivalent to Rv0231,
+ len: 568 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 568 aa overlap). Probable fadE4,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), similar to many e.g.
+ O29752 ACYL-COA DEHYDROGENASE (ACD-3) from Archaeoglobus
+ fulgidus (576 aa), FASTA scores: opt: 1788, E(): 0, (51.0%
+ identity in 577 aa overlap); ACDB_BACSU|P45857 acyl-coa
+ dehydrogenase from Bacillus subtilis (379 aa), FASTA
+ scores: opt: 232, E(): 2.2e- 08, (21.6% identity in 291 aa
+ overlap). Protein product from Mb0236 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0236 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE4"
+ /protein_id="CAB5247942.1"
+ /translation="MLLNPNHLTRKYPDRRSGEIMAATVDFFESRGKARLKHDDHERI
+ WYSDFLDFVGRERIFASLLTPASYGADDCRWDTYRISEFAEIMGFYGLSYWYPFQVTA
+ LGLGPIWMSANEDAKRKAAAGLEAGEVFAFGLSEQTHGADVYQTDMILTPSDGGWTAN
+ GEKYYIGNANVARMVSTFGKIAGTPESQEYVFFVADSQHERYDLIKNVVNSQNYVANY
+ ALRDYPVTEADILHRGAEAFHAALNTVNVCKYNLGWGAIGMCTHALYESVTHAANRHL
+ YGTVVTDFSHVRRLLTDAYVRLIAMKLVASRASDYMRSASAADRRYLLYSPLTKAKVT
+ SEGERVITALWDVIAAKGVEKDTFFETVAREIGLLPRLEGTVHINIGLLGKFMPNYLF
+ APDSTLPVIPRRDDAADDAFLFAQGPTGGLGKVRFHDWRASFDTCAHLPNVALLREQV
+ DVFAELLASATPDAAQQKDIDFAFGVGQLFANVPYAQLILEEARLSGVDEALIDEIFG
+ VLVRDFNTHAVELHGRSATTAEQARFAMRMVRRPVHDPARYDQIWKDHVLALNGAYQM
+ AP"
+ gene 276223..276912
+ /locus_tag="BQ2027_MB0237"
+ CDS 276223..276912
+ /locus_tag="BQ2027_MB0237"
+ /note="Mb0237, -, len: 229 aa. Equivalent to Rv0232, len:
+ 229 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 229 aa overlap). Probable
+ transcriptional regulatory protein, tetR/AcrR family,
+ similar to others e.g. YIXD_BACSU|P32398 hypothetical
+ transcriptional regulator (191 aa), FASTA scores: opt:
+ 149, E(): 0.0014, (21.5% identity in 158 aa overlap). Also
+ similar to MTV030_11 from Mycobacterium tuberculosis.
+ Contains PS01081 Bacterial regulatory proteins, tetR
+ family signature, and probable helix-turn helix motif from
+ aa 33-54 (Score 1142, +3.08 SD). BELONGS TO THE TETR/ACRR
+ FAMILY OF TRANSCRIPTIONAL REGULATORS. Mb0237 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY TETR/ACRR-FAMILY)"
+ /protein_id="CAB5247943.1"
+ /translation="MPTVTWARVDPARRAAVVEAAEAEFGAHGFSRGSLNVIARRAGV
+ AKGSLFQYFADKRDLYAFIADIASQRVRSYMEDLIRELDPNRPFFEFLTDLLDGWVAY
+ FAEHPRERALHAAATLEVDTDARISVRSVLHRHYLDVLRPLVRDAHARGDLRADSDTG
+ ALMSLLLLIFPHLALAPYMRGLDPILGLDEPTPEQPALAVRRLVAVLAAAFDAQHPAT
+ NSAQTRSEEIT"
+ gene 276909..277853
+ /gene="nrdB"
+ /locus_tag="BQ2027_MB0238"
+ CDS 276909..277853
+ /gene="nrdB"
+ /locus_tag="BQ2027_MB0238"
+ /note="Mb0238, nrdB, len: 314 aa. Equivalent to Rv0233,
+ len: 314 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 314 aa overlap). Probable nrdB
+ (alternate gene name: rnrS) ribonucleoside-diphosphate
+ reductase, beta chain (EC 1.17.4.1), similar to others
+ e.g. RIR2_SCHPO|P36603 ribonucleoside-diphosphate
+ reductase (391 aa), FASTA scores: opt: 168, E(): 0.00018,
+ (26.1% identity in 199 aa overlap); etc. BELONGS TO THE
+ RIBONUCLEOSIDE DIPHOSPHATE REDUCTASE SMALL CHAIN FAMILY.
+ COFACTOR: BINDS 2 IRON IONS. Protein product from Mb0238
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0238 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ribonucleoside-diphosphate reductase (beta
+ chain) nrdb (ribonucleotide reductase small chain)"
+ /protein_id="CAB5247944.1"
+ /translation="MTRTRSGSLAAGGLNWASLPLKLFAGGNAKFWDPADIDFTRDRA
+ DWEKLSDDERDYATRLCTQFIAGEEAVTEDIQPFMSAMRAEGRLADEMYLTQFAFEEA
+ KHTQVFRMWLDAVGISEDLHRYLDDLPAYRQIFYAELPECLNALSADPSPAAQVRASV
+ TYNHIVEGMLALTGYYAWHKICVERAILPGMQELVRRIGDDERRHMAWGTFTCRRHVA
+ ADDANWTVFETRMNELIPLALRLIEEGFALYGDQPPFDLSKDDFLQYSTDKGMRRFGT
+ ISNARGRPVAEIDVDYSPAQLEDTFADEDRRTLAAASA"
+ gene complement(277929..279464)
+ /gene="gabD1"
+ /locus_tag="BQ2027_MB0239C"
+ CDS complement(277929..279464)
+ /gene="gabD1"
+ /locus_tag="BQ2027_MB0239C"
+ /standard_name="gabD2"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0239c, gabD1, len: 511 aa. Equivalent to Rv0234c,
+ len: 511 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 511 aa overlap). Probable gabD1,
+ succinate-semialdehyde dehydrogenase [NADP+] dependent (EC
+ 1.2.1.16), equivalent to AL022486|MLCB1883_6 PROBABLE
+ ALDEHYDE DEHYDROGENASE from Mycobacterium leprae (457 aa),
+ FASTA scores: opt: 2617, E(): 0, (85.7% identity in 455 aa
+ overlap). Also highly similar to Q55585|GABD|SLR0370
+ PROBABLE SUCCINATE-SEMIALDEHYDE DEHYDROGENASE from
+ Synechocystis sp. strain PCC 6803 (454 aa), FASTA scores:
+ opt: 1676, E(): 0, (55.8% identity in 455 aa overlap); and
+ similar to others e.g. GABD_ECOLI|P25526
+ succinate-semialdehyde dehydrogenase from Escherichia coli
+ (482 aa), FASTA scores: opt: 929, E(): 0, (36.5% identity
+ in 452 aa overlap); etc. Note that similar to other
+ cytosolic aldehyde dehydrogenases with EC number: 1.2.1.3.
+ Also similar to Rv0768|aldA semialdehyde dehydrogenase
+ from Mycobacterium tuberculosis (489 aa); and
+ gabD2|Rv1731|MTCY04C12.16 POSSIBLE SUCCINATE-SEMIALDEHYDE
+ DEHYDROGENASE [NADP+] DEPENDANT from Mycobacterium
+ tuberculosis (518 aa). Contains PS00070 aldehyde
+ dehydrogenases cysteine active site. BELONGS TO THE
+ ALDEHYDE DEHYDROGENASES FAMILY. Could start at different
+ site by homology. Note that previously known as gabD2.
+ Protein product from Mb0239c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0239c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="succinate-semialdehyde dehydrogenase [nadp+]
+ dependent (ssdh) gabd1"
+ /protein_id="CAB5247945.1"
+ /translation="MRSVTCSATLVLPVIEPTPADRRPRHLLLGSAGHVSGRLDTGRF
+ VQTHPAKDVSVPIATINPATGETVKTFTAATDDEVDAAIARAHRRFADYRQTSFAQRA
+ RWANATADLLEAEADQAAAMMTLEMGKTLAAAKAEALKCAKGFRYYAENAEALLADEP
+ ADAAKVGASAAYGRYQPLGVILAVMPWNFPLWQAVRFAAPALMAGNVGLLKHASNVPQ
+ CALYLADVIARGGFPDGCFQTLLVSSGAVEAILRDPRVAAATLTGSEPAGQSVGAIAG
+ NEIKPTVLELGGSDPFIVMPSADLDAAVSTAVTGRVQNNGQSCIAAKRFIVHADIYDD
+ FVDKFVARMAALRVGDPTDPDTDVGPLATEQGRNEVAKQVEDAAAAGAVIRCGGKRLD
+ RPGWFYPPTVITDISKDMALYTEEVFGPVASVFRAANIDEAVEIANATTFGLGSNAWT
+ RDETEQRRFIDDIVAGQVFINGMTVSYPELPFGGVKRSGYGRELSAHGIREFCNIKTV
+ WIA"
+ gene complement(279490..280938)
+ /locus_tag="BQ2027_MB0240C"
+ CDS complement(279490..280938)
+ /locus_tag="BQ2027_MB0240C"
+ /note="Mb0240c, -, len: 482 aa. Equivalent to Rv0235c,
+ len: 482 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 482 aa overlap). Possible conserved
+ transmembrane protein, highly similar to
+ AL133278|CAB61913.1|SCM11_2 putative integral membrane
+ protein from Streptomyces coelicolor (470 aa), FASTA
+ scores: opt: 2116, E(): 0, (61.8% identity in 474 aa
+ overlap); and similar to hypothetical proteins from other
+ organisms e.g. Q13392|384D8_7 hypothetical protein (579
+ aa), FASTA scores: opt: 355, E(): 6.9e-17, (28.5% identity
+ in 569 aa overlap). Mb0240c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5247946.1"
+ /translation="MGWFSAPEYWLGRLALERGTAIIYLIAFVAAAQQFRPLIGEHGM
+ LPVPRYLAGQSFWRTPSIFHFRYSDRVFAGVCWLGAVLSAAVVAGAASFVPLWATMLI
+ WLTLWVLYLSIVNVGQAWYSFGWESLLLETGFLMIFLGNERTAPPILTLLLARWLLFR
+ VEFGAGLIKMRGDSCWRSLTCLYYHHETQPMPGPLSWFFHHLPKPLHRIEVAGNHFAQ
+ LVVPFGLFTPQPAASIAAAIIVVTQLWLVASGNFSWLNWLTILLACSAIDTSSAAALL
+ PMPAQPALSAPPQWFAGLVVVFTAAVLLLSYWPARNLLSSHQRMNMSFNPFHLVNTYG
+ AFGSICRTRREVVIEGTDESPITEQTVWKAYEFKGKPGDPRRLPRQWAPYHLRLDWLM
+ WFAAISPGYALPWMTPFLNRLLRNDPATLKLLRHNPFPQSPPRYVRAQLYQYRFTTVA
+ ELRRDRAWWHRTLIGRYVPPMSLRKVASPPAD"
+ gene complement(280973..285175)
+ /gene="aftd"
+ /locus_tag="BQ2027_MB0241C"
+ CDS complement(280973..285175)
+ /gene="aftd"
+ /locus_tag="BQ2027_MB0241C"
+ /note="Mb0241c, -, len: 1400 aa. Equivalent to Rv0236c,
+ len: 1400 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.8% identity in 1400 aa overlap). Probable
+ conserved transmembrane protein, equivalent to
+ AL022486|CAC32102.1|MLCB1883_7 possible integral membrane
+ protein from Mycobacterium leprae (1440 aa), FASTA scores:
+ opt: 7491, E(): 0, (78.8% identity in 1397 aa overlap).
+ Mb0241c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible arabinofuranosyltransferase aftd"
+ /protein_id="CAB5247947.1"
+ /translation="MAPLSRKWLPVVGAVALALTFAQSPGQVSPDTKLDLTANPLRFL
+ ARATNLWNSDLPFGQAQNQAYGYLFPHGTFFVIGHLLGVPGWVTQRLWWAVLLTVGFW
+ GLLRVAEALGVGGPSSRVVGAVAFALSPRVLTTLGSISSETLPMMLAPWVLLPTILAL
+ RGTSGRSVRALAAQAGLAVALMGAVNAIATLAGCLPAVIWWACHRPNRLWWRYTAWWL
+ LAMALATLWWVMALTQLHGVSPPFLDFIESSGVTTQWSSLVEVLRGTDSWTPFVAPNA
+ TAGAPLVTGSAAILGTCLVAAAGLAGLTSPAMPARGRLVTMLLVGVVLLAVGHRGGLA
+ SPVAHPVQAFLDAAGTPLRNVHKVGPVIRLPLVLGLAQLLSRVPLPGSAPRPAWLRAF
+ AHPERDKRVAVAVVALTALVVSTSLAWTGRVAPPGTFGALPQYWQEAADWLRTHHAAT
+ PTPGRVLVVPGAPFATQVWGTSHDEPLQVLGDGPWGVRDSIPLTPPQTIRALDSVQRL
+ FAAGRPSAGLADTLARQGISYVLVRNDLDPETSRSARPILLHRSIAGSPGLAKLAEFG
+ APVGPDPLAGFVNDSGLRPRYPAIEIYRVSAPANPGAPYFAATDQLARVDGGPEVLLR
+ LDERRRLQGQPPLGPVLMTADARAAGLPVPQVAVTDTPVARETDYGRVDHHSSAIRAP
+ GDARHTYNRVPDYPVPGAEPVVGGWTGGRITVSSSSADATAMPDVAPASAPAAAVDGD
+ PATAWVSNALQAAVGQWLQVDFDRPVTNAVVTLTPSATAVGAQVRRILIETVNGSTTL
+ RFDEAGKPLTAALPYGETPWVRFTAAATDDGSAGVQFGITDLAITQYDASGFAHPVQL
+ RHTVLVPGPPPGSAIAGWDLGSELLGRPGCAPGPDGVRCAASMALAPEEPANLSRTLT
+ VPRPVSVTPMVWVRPRQGPKLADLIAAPSTTRASGDSDLVDILGSAYAAADGDPATAW
+ TAPQRVVQHKTPPTLTLALPRPTVVTGLRLAASRSMLPAHPTVVAINLGDGPQVRQLQ
+ VGELTTLWLHPRVTDTVSVSLLDWDDVIDRNALGFDQLKPPGLAEVVVLGAGGAPIAP
+ ADAARNRARALTVDCDHGPVVAVAGRFVHTSIRTTVGALLDGEPVAALPCEREPIALP
+ AGQQELLISPGAAFVVDGAQLSTPGAGLSSATVTSAETGAWGPTHREVRVPESATSRV
+ LVVPESINSGWVARTSTGARLTPIAVNGWQQAWVVPAGNPGTITLTFAPNSLYRASLA
+ IGLALLPLLALLAFWRTGRRQLADRPTPPWRPGAWAAAGVLAAGAVIASIAGVMVMGT
+ ALGVRYALRRRERLRDRVTVGLAAGGLILAGAALSRHPWRSVDGYAGNWASVQLLALI
+ SVSVVAASVVATSESRGQDRMQ"
+ gene complement(285222..285395)
+ /locus_tag="BQ2027_MB0242C"
+ CDS complement(285222..285395)
+ /locus_tag="BQ2027_MB0242C"
+ /note="Mb0242c, -, len: 57 aa. Equivalent to Rv0236A, len:
+ 57 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 57 aa overlap). Small secreted
+ protein. Protein product from Mb0242c detected using SWATH
+ mass spectrometry. Mb0242c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SMALL SECRETED PROTEIN"
+ /protein_id="CAB5247948.1"
+ /translation="MNRIVAPAAASVVVGLLLGAAAIFGVTLMVQQDKKPPLPGGDPS
+ SSVLNRVEYGNRS"
+ gene 285510..286676
+ /gene="lpqI"
+ /locus_tag="BQ2027_MB0243"
+ CDS 285510..286676
+ /gene="lpqI"
+ /locus_tag="BQ2027_MB0243"
+ /note="Mb0243, lpqI, len: 388 aa. Equivalent to Rv0237,
+ len: 388 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 388 aa overlap). Probable lpQI,
+ conserved lipoprotein, equivalent to
+ AL022486|MLCB1883_8|T44873 probable secreted hydrolase
+ from Mycobacterium leprae (387 aa), FASTA scores: opt:
+ 1831, E(): 0, (73.3% identity in 390 aa overlap). Also
+ similar to other lipoproteins and various hydrolases e.g.
+ P40406|2126897|YBBD_BACSU|I39839 HYPOTHETICAL 70.6 KDA
+ LIPOPROTEIN from Bacillus subtilis (642 aa);
+ P48823|HEXA_ALTSO BETA-HEXOSAMINIDASE A PRECURSOR from
+ ALTEROMONAS SP. (598 aa), FASTA scores: opt: 415, E():
+ 5.8e-17, (31.2% identity in 343 aa overlap);
+ PCC6803|P74340 BETA-GLUCOSIDASE from Synechocystis sp.
+ (538 aa), FASTA scores: opt: 414, E(): 6.1e-17, (30.6
+ identity in 320 aa overlap). Contains signal sequence and
+ appropriately positioned PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site. Protein product from
+ Mb0243 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0243 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN LPQI"
+ /protein_id="CAB5247949.1"
+ /translation="MAFPRTLAILAAAAALVVACSHGGTPTGSSTTSGASPATPVAVP
+ VPRSCAEPAGIPALLSPRDKLAQLLVVGVRDAADAQAVVTNYHVGGILIGSDTDLTIF
+ DGALAEIVAGGGPLPLAVSVDEEGGRLSRLRSLIGGTGPSARELAQTRTVQQVRDLAR
+ DRGRQMRKLGITIDFAPVVDVTDAPDDTVIGDRSFGSDPATVTAYAGAYAQGLRDAGV
+ LPVLKHFPGHGRGSGDSHNGGVTTPPLDDLVGDDLVPYRTLVTQAPVGVMVGHLQVPG
+ LTGSEPASLSKAAVNLLRTGTGYGAPPFDGPVFSDDLSGMAAISDRFGVSEAVLRTLQ
+ AGADIALWVTTKEVPAVLDRLEQALRAGELPMSAVDRSVVRVATMKGPNPGCGR"
+ gene 286752..287366
+ /locus_tag="BQ2027_MB0244"
+ CDS 286752..287366
+ /locus_tag="BQ2027_MB0244"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0244, -, len: 204 aa. Equivalent to Rv0238, len:
+ 204 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 204 aa overlap). Possible
+ transcriptional regulatory protein, TetR family,
+ equivalent to AL022486|MLCB1883_9|T44874 probable
+ transcription regulator from Mycobacterium leprae (208
+ aa), FASTA scores: opt: 1029, E(): 0, (80.9% identity in
+ 199 aa overlap). Also similar to others e.g.
+ CAB77290.1|AL160312 putative tetR-family regulatory
+ protein from Streptomyces coelicolor (240 aa). Also
+ similar to Mycobacterium tuberculosis proteins
+ Z95120|Rv3208 (228 aa), FASTA scores: opt: 266, E():
+ 8.3e-12, (28.1% identity in 196 aa overlap); and Rv1019
+ (197 aa). Protein product from Mb0244 detected using SWATH
+ mass spectrometry. Mb0244 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY TETR-FAMILY)"
+ /protein_id="CAB5247950.1"
+ /translation="MAGGTKRLPRAVREQQMLDAAVQMFSVNGYHETSMDAIAAEAQI
+ SKPMLYLYYGSKEDLFGACLNREMSRFIDALRSSINFDQSPKDLLRNTIVSFLRYIDA
+ NRASWIVMYTQATSSQAFAHTVREGREQIVQLVAELVRAGTRGPLTDAEIEMMAVALV
+ GAGEAVATRLGIGDTDVDEAAEMMINLFWLGLKGAPVDRLETGH"
+ gene 287428..287661
+ /gene="vapb24"
+ /locus_tag="BQ2027_MB0245"
+ CDS 287428..287661
+ /gene="vapb24"
+ /locus_tag="BQ2027_MB0245"
+ /note="Mb0245, -, len: 77 aa. Equivalent to Rv0239, len:
+ 77 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 77 aa overlap). Conserved hypothetical
+ protein, weakly similar to Rv1839c|Z83859|MTCY359_34 from
+ Mycobacterium tuberculosis (87 aa), FASTA scores: opt: 88,
+ E(): 5, (40.0% identity in 45 aa overlap). Mb0245 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb24"
+ /protein_id="CAB5247951.1"
+ /translation="MIRTQVQLPDELYRDAKRVAHEHEMTLAEVVRRGLEHMVRIYPR
+ RDAASDTWQPPTPRRLGPFRASEETWRELANEA"
+ gene 287669..288106
+ /gene="vapc24"
+ /locus_tag="BQ2027_MB0246"
+ CDS 287669..288106
+ /gene="vapc24"
+ /locus_tag="BQ2027_MB0246"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0246, -, len: 145 aa. Equivalent to Rv0240, len:
+ 145 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 145 aa overlap). Conserved hypothetical
+ protein, weak similarity with Rv3697c from Mycobacterium
+ tuberculosis (145 aa), FASTA scores: opt: 145, E():
+ 7.6e-05, (28.0% identity in 143 aa overlap). Mb0246 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc24. contains pin domain."
+ /protein_id="CAB5247952.1"
+ /translation="MLSIDTNILLYAQNRDCPEHDAAAAFLVECSGRADVAVCELVLM
+ ELYQLLRNPTVVTRPLEGPEAAEVCQTFRRNRRWALLENAPVMNEVWVLAATPRIARR
+ RLFDARLALTLRHHGVDEFATRNINGFTDFGFSRVWDPITSDG"
+ gene complement(288136..288978)
+ /gene="htdx"
+ /locus_tag="BQ2027_MB0247C"
+ CDS complement(288136..288978)
+ /gene="htdx"
+ /locus_tag="BQ2027_MB0247C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0247c, -, len: 280 aa. Equivalent to Rv0241c,
+ len: 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 280 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ MLCB1883.17c|T44876063881|CAA18566.1|AL022486 hypothetical
+ protein from Mycobacterium leprae (280 aa), FASTA scores:
+ opt: 1564, E(): 0, (81.8% identity in 280 aa overlap); and
+ CAC32097.1|AL583926 conserved hypothetical protein from
+ Mycobacterium leprae (300 aa). Also similar to proteins
+ from other organisms e.g. CAB77291.1|AL160312 putative
+ dehydratase from Streptomyces coelicolor (291 aa); part of
+ BAA92930.1|AB032743 fatty acid synthetase beta subunit
+ from Pichia angusta (2060 aa). Protein product from
+ Mb0247c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0247c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable 3-hydroxyacyl-thioester dehydratase
+ htdx"
+ /protein_id="CAB5247953.1"
+ /translation="MTQPSGLKNLLRAAAGALPVVPRTDQLPNRTVTVEELPIDPANV
+ AAYAAVTGLRYGNQVPLTYPFALTFPSVMSLVTGFDFPFAAMGAIHTENHITQYRPIA
+ VTDAVGVRVRAENLREHRRGLLVDLVTNVSVGNDVAWHQVTTFLHQQRTSLSGEPKPP
+ PQKKPKLPPPAAVLRITPAKIRRYAAVGGDHNPIHTNPIAAKLFGFPTVIAHGMFTAA
+ AVLANIEARFPDAVRYSVRFAKPVLLPATAGLYVAEGDGGWDLTLRNMAKGYPHLTAT
+ VRGL"
+ gene complement(288989..290353)
+ /gene="fabG4"
+ /locus_tag="BQ2027_MB0248C"
+ CDS complement(288989..290353)
+ /gene="fabG4"
+ /locus_tag="BQ2027_MB0248C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0248c, fabG4, len: 454 aa. Equivalent to Rv0242c,
+ len: 454 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 454 aa overlap). Probable fabG4,
+ 3-oxoacyl-[acyl-carrier protein] reductase (EC 1.1.1.100),
+ equivalent to
+ 3063883|CAA18568.1|AL022486|MLCB1883_13|T44878
+ 3-oxoacyl-[acyl-carrier protein] reductase homolog from
+ Mycobacterium leprae (454 aa), FASTA scores: opt: 2486,
+ E(): 0, (84.8% identity in 454 aa overlap). C-terminal
+ part highly similar to many FabG proteins e.g.
+ U39441|VHU3944 1_2 from Vibrio harveyi (244 aa), FASTA
+ scores: opt: 562, E(): 3.4e-28, (40.2% identity in 241 aa
+ overlap); U91631|PAU91631_3 from Pseudomonas aeruginosa
+ (247 aa), FASTA scores: opt: 584, E(): 1.5e-29, (44.4%
+ identity in 241 aa overlap). Has N-terminal extension of
+ ~200 aa and C-terminal part contains PS00061 Short-chain
+ dehydrogenases/reductases family signature. BELONGS TO THE
+ SHORT-CHAIN DEHYDROGENASES/REDUCTASES (SDR) FAMILY.
+ Protein product from Mb0248c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0248c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 3-OXOACYL-[ACYL-CARRIER PROTEIN]
+ REDUCTASE FABG4 (3-KETOACYL-ACYL CARRIER PROTEIN
+ REDUCTASE)"
+ /protein_id="CAB5247954.1"
+ /translation="MAPKRSSDLFSQVVNSGPGSFLARQLGVPQPETLRRYRAGEPPL
+ TGSLLIGGAGRVVEPLRAALEKDYDLVGNNLGGRWADSFGGLVFDATGITEPAGLKGL
+ HEFFTPVLRNLGRCGRVVVVGGTPEAAASTNERIAQRALEGFTRSLGKELRRGATTAL
+ VYLSPDAKPAATGLESTMRFLLSAKSAYVDGQVFSVGADDSTPPADWEKPLDGKVAIV
+ TGAARGIGATIAEVFARDGAHVVAIDVESAAENLAETASKVGGTALWLDVTADDAVDK
+ ISEHLRDHHGGKADILVNNAGITRDKLLANMDDARWDAVLAVNLLAPLRLTEGLVGNG
+ SIGEGGRVIGLSSIAGIAGNRGQTNYATTKAGMIGITQALAPGLAAKGITINAVAPGF
+ IETQMTAAIPLATREVGRRLNSLLQGGQPVDVAEAIAYFASPASNAVTGNVIRVCGQA
+ MIGA"
+ gene 290495..291817
+ /gene="fadA2"
+ /locus_tag="BQ2027_MB0249"
+ CDS 290495..291817
+ /gene="fadA2"
+ /locus_tag="BQ2027_MB0249"
+ /note="Mb0249, fadA2, len: 440 aa. Equivalent to Rv0243,
+ len: 440 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 440 aa overlap). Probable fadA2,
+ acetyl-CoA acyltransferase (3-acyl-CoA thiolase) (EC
+ 2.3.1.16), equivalent, but shorter 17 aa, to
+ AL022486|MLCB1883_14T44879 acetyltransferase from
+ Mycobacterium leprae (457 aa), FASTA scores: opt: 250 7,
+ E(): 0, (87.6% identity in 435 aa overlap). Also highly
+ similar to many e.g. G83046|PA478 probable acyl-CoA
+ thiolase from Pseudomonas aeruginosa (425 aa);
+ AB77293.1|AL160312 putative ketoacyl CoA thiolase from
+ Streptomyces coelicolor (428 aa);
+ P76503|7449731|YFCY_ECOLI|D65007|B2342 PROBABLE
+ 3-KETOACYL-COA THIOLASE (ACETYL-COA ACYLTRANSFERASE)
+ (BETA-KETOTHIOLASE) from Escherichia coli strain K-12 (436
+ aa), FASTA scores: opt: 914, E(): 0, (38.2% identity in
+ 434 aa overlap); P55084|ECHB_HUMAN MITOCHONDRIAL
+ TRIFUNCTONAL ENZYME (474 aa), FASTA scores: opt: 881, E():
+ 0, (37.7 identity in 451 aa overlap). Contains PS00099
+ Thiolases active site. BELONGS TO THE THIOLASE FAMILY.
+ Protein product from Mb0249 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0249 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACETYL-COA ACYLTRANSFERASE FADA2
+ (3-KETOACYL-COA THIOLASE) (BETA-KETOTHIOLASE)"
+ /protein_id="CAB5247955.1"
+ /translation="MAPAAKNTSQTRRRVAVLGGNRIPFARSDGAYADASNQDMFTAA
+ LSGLVDRFGLAGERLDMVVGGAVLKHSRDFNLMRECVLGSELSPYTPAFDLQQACGTG
+ LQAAIAAADGIAAGRYEVAAAGGVDTTSDPPIGLGDDLRRTLLKLRRSRSNVQRLKLV
+ GTLPASLGVEIPANSEPRTGLSMGEHAAVTAKQMGIKRVDQDELAAASHRNMADAYDR
+ GFFDDLVSPFLGLYRDDNLRPNSSVEKLATLRPVFGVKAGDATMTAGNSTPLTDGASV
+ ALLASEQWAEAHSLAPLAYLVDAETAAVDYVNGNDGLLMAPTYAVPRLLARNGLSLQD
+ FDFYEIHEAFASVVLAHLAAWESEEYCKRRLGLDAALGSIDRSKLNVNGSSLAAGHPF
+ AATGGRILAQTAKQLAEKKAAKKGGGPLRGLISICAAGGQGVAAILEA"
+ gene complement(292123..293958)
+ /gene="fadE5"
+ /locus_tag="BQ2027_MB0250C"
+ CDS complement(292123..293958)
+ /gene="fadE5"
+ /locus_tag="BQ2027_MB0250C"
+ /note="Mb0250c, fadE5, len: 611 aa. Equivalent to Rv0244c,
+ len: 611 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 611 aa overlap). Probable fadE5,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), equivalent to
+ AL022486|MLCB1883_15 from Mycobacterium leprae (611 aa),
+ FASTA scores: opt: 3598, E(): 0, (89.4% identity in 611 aa
+ overlap). Also highly similar to AL0211|MTV007.14 from
+ Mycobacterium tuberculosis (609 aa), FASTA scores: opt:
+ 2576, E(): 0, (64.6% identity in 611 aa overlap); and to
+ various other bacterial proteins described as putative
+ acyl-CoA dehydrogenases e.g. AE0010|AE001025_6 from
+ Archaeoglobus fulgidus (387 aa), FASTA scores: opt: 229,
+ E(): 6.8e-08, (29.8% identity in 409 aa overlap); etc.
+ Protein product from Mb0250c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0250c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE5"
+ /protein_id="CAB5247956.1"
+ /translation="MSHYRSNVRDQVFNLFEVLGVDKALGHGEFSDVDVDTARDMLAE
+ VSRLAEGPVAESFVEGDRNPPVFDPKTHSVMLPESFKKSVNAMLEAGWDKVGIDEALG
+ GMPMPKAVVWALHEHILGANPAVWMYAGGAGFAQILYHLGTEEQKKWAVLAAERGWGS
+ TMVLTEPDAGSDVGAARTKAVQQADGSWHIDGVKRFITSGDSGDLFENIFHLVLARPE
+ GAGPGTKGLSLYFVPKFLFDVETGEPGERNGVFVTNVEHKMGLKVSATCELAFGQHGV
+ PAKGWLVGEVHNGIAQMFEVIEQARMMVGTKAIATLSTGYLNALQYAKSRVQGADLTQ
+ MTDKTAPRVTITHHPDVRRSLMTQKAYAEGLRALYLYTATFQDAAVAEVVHGVDAKLA
+ VRVNDLMLPVVKGVGSEQAYAKLTESLQTLGGSGFLQDYPIEQYIRDAKIDSLYEGTT
+ AIQAQDFFFRKIVRDKGVALAHVSGQIQAFVDSGAGNGRLKTERALLAKALTDVQGMA
+ AALTGYLMAAQQDVTSLYKVGLGSVRFLMSVGDLIIGWLLQRQAAVAVAALDAGATGD
+ ERSFYEGKVAVASFFAKNFLPLLTSTREVIETLDNDIMELDEAAF"
+ gene 294330..294818
+ /locus_tag="BQ2027_MB0251"
+ CDS 294330..294818
+ /locus_tag="BQ2027_MB0251"
+ /note="Mb0251, -, len: 162 aa. Equivalent to Rv0245, len:
+ 162 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 162 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), equivalent to
+ AL022486|MLCB1883_17|T44882 probable oxidoreductase from
+ Mycobacterium leprae (162 aa), FASTA scores: opt: 860,
+ E(): 0, (83.4% identity in 157 aa overlap). Also similar
+ to several hypothetical proteins and various
+ oxidoreductases e.g. AAK24246.1|AE005898 NADH:riboflavin
+ 5'-phosphate oxidoreductase from Caulobacter crescentus
+ (174 aa); Q02058|DIM6_STRCO|CAA45048.1 ACTINORHODIN
+ POLYKETIDE DIMERASE from STREPTOMYCES COELICOLOR (177 aa),
+ FASTA scores: opt: 308, E(): 3. 2e-15, (37.8% identity in
+ 143 aa overlap). Also similar to
+ Z84498|Rv1939|MTCY09F9.25c from Mycobacterium tuberculosis
+ (171 aa), FASTA scores: opt: 517, E(): 3.5e-30, (49.4%
+ identity in 158 aa overlap). Protein product from Mb0251
+ detected using SWATH mass spectrometry. Mb0251 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible oxidoreductase"
+ /protein_id="CAB5247957.1"
+ /translation="MNSTNNLTPSSLREAFGHFPTGVVAIAAEVDGVRQGLAASTFVP
+ VSLEPPLVSFCVQNTSTTWPKLTGVPMLGISVLGEAHDAAVRTLAAKTGDRFAGLETV
+ SNDAGAVFIKGTSVWLESAIEQLVPAGDHTIVVLRVNQVKVDPNVAPIVFHRSVLRRL
+ GV"
+ gene 295134..296444
+ /locus_tag="BQ2027_MB0252"
+ CDS 295134..296444
+ /locus_tag="BQ2027_MB0252"
+ /note="Mb0252, -, len: 436 aa. Equivalent to Rv0246, len:
+ 436 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 436 aa overlap). Probable conserved
+ integral membrane protein, similar to
+ Rv2209|1237062|CAA94252.1|Z70283|Q10398|YM09_MYCTU from
+ Mycobacterium tuberculosis (512 aa), FASTA scores: opt:
+ 712, E(): 0, (33.2% identity in 422 aa overlap). Mb0252
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5247958.1"
+ /translation="MAKTSHRVSSADGMSKRILRLIIAQSGFYSAALQLGNVSIVLPF
+ VVAELDAELWIAALIFPAFTAGGAIGNVVAPPAVAAVPRRHRLFIIVSCLAVLAGVNA
+ LCATIGKGSVAGILLVVNVTLIGVVSVISFVAFADLVAAMPSGTARARILLTEVGVGA
+ ALTAVVAATLSFVPDQHPLSRNIHLLWTAAVAMAISAAICRALPHRIVPRVHAAPGLH
+ KLVYVGWTAIRTNGWYRRYLLVQVLFGSVVLGSSFHSIRVAAVPGDQPDEVVAVVLFV
+ CVGLLGGIALWNRVRERFGLVGLFVGSALVSIAAAVLSIAFDLAGAWPNVVAIGLVIA
+ LVSIANQSVFTAGQLWIARDAEPGLRTSLISFGQLVINAGLVGMGLALGLIAQDHDAV
+ WPVMIVLLLNLTAAYSATRFAPAKSVDVRGLPQVSRTSRPKTGG"
+ gene complement(296441..297187)
+ /locus_tag="BQ2027_MB0253C"
+ CDS complement(296441..297187)
+ /locus_tag="BQ2027_MB0253C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0253c, -, len: 248 aa. Equivalent to Rv0247c,
+ len: 248 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 248 aa overlap). Probable succinate
+ dehydrogenase, iron-sulfur subunit (EC 1.3.99.1), highly
+ similar to CAC44313.1|AL596043 putative succinate
+ dehydrogenase iron-sulfur subunit from Streptomyces
+ coelicolor (259 aa); and similar to iron-sulphur protein
+ subunits of fumarate reductase or succinate dehydrogenases
+ from many bacteria e.g. NP_147618.1|7521083|B72691
+ fumarate reductase iron-sulfur protein from Aeropyrum
+ pernix (305 aa); NP_069516.1|2649932|AAB90556.1|AE001057
+ succinate dehydrogenase iron-sulfur subunit B (sdhB) from
+ Archaeoglobus fulgidus (236 aa); etc. Also similar to
+ Q10761|FRDB_MYCTU|7431693|F70762 FUMARATE REDUCTASE
+ IRON-SULFUR PROTEIN from Mycobacterium tuberculosis (247
+ aa), FASTA scores: opt: 358, E():1e-16, (31.3% identity in
+ 214 aa overlap). Contains PS00197 2Fe-2S ferredoxins,
+ iron-sulfur binding region signature. NOTE THAT SUCCINATE
+ DEHYDROGENASE FORMS GENERALLY PART OF AN ENZYME COMPLEX
+ CONTAINING FOUR SUBUNITS: A FLAVOPROTEIN (Rv0248c ?), AN
+ IRON-SULFUR (Rv0247c ?), AND TWO HYDROPHOBIC ANCHOR
+ PROTEINS (Rv0249c ?). Protein product from Mb0253c
+ detected using shotgun mass spectrometry. Mb0253c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUCCINATE DEHYDROGENASE [IRON-SULFUR
+ SUBUNIT] (SUCCINIC DEHYDROGENASE)"
+ /protein_id="CAB5247959.1"
+ /translation="MTYSASMRVWRGDESCGELREFTVEVNEGEVVLDVILRLQQTQT
+ PDLAVRWNCKAGKCGSCSAEINGKPRLMCMTRMSTFDEDEIVTVTPMRTFPVIRDLVT
+ DVSFNYQKAREIPSFAPPKELQPSEYRMAQVDVARSQEFRKCIECFLCQNVCHVVRDH
+ EENKDAFAGPRFLMRIAELEMHPLDTRDRRSQAQEEHGLGYCNITKCCTEVCPENIKI
+ TDNALIPMKERVADRKYDPVVWLGSKLFRR"
+ gene complement(297188..299128)
+ /locus_tag="BQ2027_MB0254C"
+ CDS complement(297188..299128)
+ /locus_tag="BQ2027_MB0254C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0254c, -, len: 646 aa. Equivalent to Rv0248c,
+ len: 646 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 646 aa overlap). Probable succinate
+ dehydrogenase, flavoprotein subunit (EC 1.3.99.1), highly
+ similar to flavoprotein subunit of various succinate
+ dehydrogenases e.g. M88696|RIRSDHA_1 flavoprotein from
+ Rickettsia prowazekii (596 aa), FASTA scores: opt: 651,
+ E(): 0, (34.6 % identity in 598 aa overlap). Also similar
+ to truncated U00022_17 flavoprotein from Mycobacterium
+ leprae (401 aa), FASTA scores: opt: 677, E(): 0, (39.0%
+ identity in 423 aa overlap). NOTE THAT SUCCINATE
+ DEHYDROGENASE FORMS GENERALLY PART OF AN ENZYME COMPLEX
+ CONTAINING FOUR SUBUNITS: A FLAVOPROTEIN (Rv0248c ?), AN
+ IRON-SULFUR (Rv0247c ?), AND TWO HYDROPHOBIC ANCHOR
+ PROTEINS (Rv0249c ?). Protein product from Mb0254c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0254c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUCCINATE DEHYDROGENASE [IRON-SULFUR
+ SUBUNIT] (SUCCINIC DEHYDROGENASE)"
+ /protein_id="CAB5247960.1"
+ /translation="MVEVERHSYDVVVIGAGGAGLRAVIEARERGLKVAVVCKSLFGK
+ AHTVMAEGGCAAAMGNANPKDNWKTHFGDTMRGGKFLNNWRMAELHAKEAPDRVWELE
+ TYGALFDRTDDGRISQRNFGGHTYPRLAHVGDRTGLELIRTLQQKVVSLQQEDHAELG
+ DYEARIKVFAECTITELLKDQGAIAGAFGYWRESGRFIVFEAPAVVLATGGIGKSFKV
+ TSNSWEYTGDGHALALRAGATLINMEFVQFHPTGMVWPPSVKGILVTEGVRGDGGVLK
+ NSENSRFMFDYIPPVFKGQYAETEEEADQWLKDNDSARRTPDLLPRDEVARAINSEVK
+ AGRGTPHGGVYLDIASRLTPAEIKRRLPSMYHQFKELAEVDITTQAMEVGPTCHYVMG
+ GVEVDADTGAATVPGLFAAGECAGGMHGSNRLGGNSLSDLLVFGRRAGLGAADYVRAL
+ SSRPAVSAEAIDAAAQQALSPFEGPKDGSAPENPYALHMDLQYVMNDLVGIIRNADEI
+ SRALTLLAELWSRYHNVLVEGHRQYNPGWNLSIDLRNMLLVSECVARAALQRTESRGG
+ HTRDDHPGMDPNWRRILLVCRATETMGTGGSGSGDSNCHINVTQQLQTPMRPDLLELF
+ EISELEKYYTDEELAEHPGRRG"
+ gene complement(299159..299980)
+ /locus_tag="BQ2027_MB0255C"
+ CDS complement(299159..299980)
+ /locus_tag="BQ2027_MB0255C"
+ /note="Mb0255c, -, len: 273 aa. Equivalent to Rv0249c,
+ len: 273 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 273 aa overlap). Probable succinate
+ dehydrogenase, membrane-anchor subunit for succinate
+ dehydrogenase encoded by Rv0247c and Rv0248c. Highly
+ similar to AC44315.1|AL596043 putative integral membrane
+ protein from Streptomyces coelicolor (278 aa). NOTE THAT
+ SUCCINATE DEHYDROGENASE FORMS GENERALLY PART OF AN ENZYME
+ COMPLEX CONTAINING FOUR SUBUNITS: A FLAVOPROTEIN (Rv0248c
+ ?), AN IRON-SULFUR (Rv0247c ?), AND TWO HYDROPHOBIC ANCHOR
+ PROTEINS (Rv0249c ?). Protein product from Mb0255c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0255c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable succinate dehydrogenase [membrane
+ anchor subunit] (succinic dehydrogenase)"
+ /protein_id="CAB5247961.1"
+ /translation="MSAPTANRPAIGVFTPTRAQIPERTLRTDLWWLPPLLTNLGLLA
+ FICYATTRAFWGSQYWVEKYHYLTPFYSPCVSASCQPGASHLGVWFGHFPGWIPLGAM
+ VLPFLLGFRLTCYYYRKAYYRSVWQSPTSCAVPEPRAHYTGETRLPLIVQNTHRYFFY
+ IAVVVSLINTYDAIAAFHSPSGFGFGLGNVILTINVVLLWAYTISCHSCRHATGGRLK
+ HFSKHPVRYWIWTQVSKLNTRHMQFAWITLGTLALTDFYIMLVASGSITDLRFIG"
+ gene complement(300060..300353)
+ /locus_tag="BQ2027_MB0256C"
+ CDS complement(300060..300353)
+ /locus_tag="BQ2027_MB0256C"
+ /note="Mb0256c, -, len: 97 aa. Equivalent to Rv0250c, len:
+ 97 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 97 aa overlap). Conserved hypothetical
+ protein, equivalent to
+ MLCB1883.27c|T44883|3063888|CAA18576.1|AL022486
+ hypothetical protein from Mycobacterium leprae (98 aa),
+ FASTA scores: opt: 478, E(): 4.4e-28, (72.6% identity in
+ 95 aa overlap). Also similar to C-terminus of
+ AC44316.1|AL596043|SCBAC31E11.05c hypothetical protein
+ from Streptomyces coelicolor (146 aa). Protein product
+ from Mb0256c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0256c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5247962.1"
+ /translation="MSTTAELAELHDLVGGLRRCVTALKARFGDNPATRRIVIDADRI
+ LTDIELLDTDVSELDLERAAVPQPSEKIAIPDTEYDREFWRDVDDEGVGGHRY"
+ gene complement(300498..300977)
+ /gene="hsp"
+ /locus_tag="BQ2027_MB0257C"
+ CDS complement(300498..300977)
+ /gene="hsp"
+ /locus_tag="BQ2027_MB0257C"
+ /standard_name="hsp 20; hrpA; acr2"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0257c, hsp, len: 159 aa. Equivalent to Rv0251c,
+ len: 159 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 159 aa overlap). hsp (alternate gene
+ name: hsp20, hrpA, acr2), heat-stress-induced
+ ribosome-binding protein A (see citations below). Highly
+ similar to AAD39038.1|AF072875_1|AF072875 putative HSP20
+ from Mycobacterium smegmatis (145 aa), FASTA scores: opt:
+ 479, E(): 2.3e-24, (59.9% identity in 157 aa overlap); and
+ similar to many bacterial and eukaryotic hsp proteins e.g.
+ P12811|HS2C_CHLRE CHLOROPLAST HEAT SHOCK 22KD PROTEIN from
+ CHLAMYDOMONAS REINHARDTII (157 aa), FASTA scores: opt:
+ 184, E(): 1.2e-05, (32.4% identity in 142 aa overlap).
+ Also similar to PCC6803 Spore protein sp21 from
+ Synechocystis sp. (146 aa), FASTA scores: opt: 213, E():
+ 1.2e-07, (30.3 identity in 145 aa overlap). Also similar
+ to P30223|14KD_MYCTU 14 KDA ANTIGEN (16 KDA ANTIGEN) 19K
+ major membrane protein (HSP 16.3) from Mycobacterium
+ tuberculosis (144 aa). BELONG TO THE SMALL HEAT SHOCK
+ PROTEIN (HSP20) FAMILY. Protein product from Mb0257c
+ detected using shotgun mass spectrometry. Mb0257c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HEAT SHOCK PROTEIN HSP (HEAT-STRESS-INDUCED
+ RIBOSOME-BINDING PROTEIN A)"
+ /protein_id="CAB5247963.1"
+ /translation="MNNLALWSRPVWDVEPWDRWLRDFFGPAATTDWYRPVAGDFTPA
+ AEIVKDGDDAVVRLELPGIDVDKDVNVELDPGQPVSRLVIRGEHRDEHTQDAGDKDGR
+ TLREIRYGSFRRSFRLPAHVTSEAIAASYDAGVLTVRVAGAYKAPAETQAQRIAITK"
+ gene 301191..303752
+ /gene="nirB"
+ /locus_tag="BQ2027_MB0258"
+ CDS 301191..303752
+ /gene="nirB"
+ /locus_tag="BQ2027_MB0258"
+ /note="Mb0258, nirB, len: 853 aa. Equivalent to Rv0252,
+ len: 853 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 853 aa overlap). Probable nirB
+ (alternate gene name: nasB), nitrite reductase [NAD(P)H]
+ large subunit (EC 1.6.6.4), flavoprotein containing
+ siroheme and a 2FE-2S iron-sulfur centre. Highly similar
+ to many others bacterial enzymes e.g. P08201|NIRB_ECOLI
+ NITRITE REDUCTASE (NAD(P)H) LARGE SUBUNIT from Escherichia
+ coli strain K12 (847 aa), FASTA scores: opt: 2775, E(): 0,
+ (49.8% identity in 840 aa overlap); Q06458|NIRB_KLEPN
+ NITRITE REDUCTASE (NAD(P)H) LARGE SUBUNIT (957 aa), FASTA
+ scores: opt: 2902, E(): 0, (54.2% identity in 827 aa
+ overlap). Contains PS00365 Nitrite and sulfite reductases
+ iron-sulfur/siroheme-binding site. HOMODIMER WHICH
+ ASSOCIATES WITH NIRD|Rv0253. COFACTORS: FAD; Iron;
+ Siroheme. Mb0258 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NITRITE REDUCTASE [NAD(P)H] LARGE
+ SUBUNIT [FAD FLAVOPROTEIN] NIRB"
+ /protein_id="CAB5247964.1"
+ /translation="MPTAGSSRAPAAAREIVVVGHGMVGHRLVEAVRARDADGSLRIT
+ VLAEEGDAAYDRVGLTSYTESWDRALLALPGNDYAGDQRVRLLLNTRVTQIDRATKSV
+ VTAAGQRHRYDTLVLATGSYAFVPPVPGHDLPACHVYRTFDDLDAIRAGAQRTLDGGH
+ TDGGVVIGGGLLGLEAANALRQFGLQTHVVEMMPRLMAQQIDEAGGALLARMIADLGI
+ AVHVGTGTESIESVKHSDGSVWARVRLSDGEVIDAGVVIFAAGIRPRDELARAAGLAI
+ GDRGGVLTDLSCRTSDPDIYAVGEVAAIDGRCYGLVGPGYTSAEVVADRLLDGSAEFP
+ EADLSTKLKLLGVDVASFGDAMGATENCLEVVINDAVKRTYAKLVLSDDATTLLGGVL
+ VGDASSYGVLRPMVGAELPGDPLALIAPAGSGAGAGALGVGALPDSAQICSCNNVTKG
+ ELKCAIADGCGDVPALKSCTAAGTSCGSCVPLLKQLLEAEGVEQSKALCEHFSQSRAE
+ LFEIITATEVRTFSGLLDRFGRGKGCDICKPVVASILASTGSDHILDGEQASLQDSND
+ HFLANIQKNGSYSVVPRVPGGDIKPEHLILIGQIAQDFGLYTKITGGQRIDLFGARVD
+ QLPLIWQRLVDGGMESGHAYGKAVRTVKSCVGSDWCRYGQQDSVQLAIDLELRYRGLR
+ APHKIKLGVSGCARECAEARGKDVGVIATEKGWNLYVAGNGGMTPKHAQLLASDLDKE
+ TLIRYIDRFLIYYIRTADRLQRTAPWVESLGLDHVREVVCEDSLGLAEEFEAAMQRHV
+ ANYKCEWKGVLEDPDKLSRFVSFVNAPDAVDSTVTFTERAGRKVPVSIGIPRVRS"
+ gene 303778..304134
+ /gene="nirD"
+ /locus_tag="BQ2027_MB0259"
+ CDS 303778..304134
+ /gene="nirD"
+ /locus_tag="BQ2027_MB0259"
+ /note="Mb0259, nirD, len: 118 aa. Equivalent to Rv0253,
+ len: 118 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 118 aa overlap). Probable nirD,
+ nitrite reductase [NAD(P)H] small subunit (EC 1.6.6.4),
+ similar to others e.g.
+ P23675|NIRD_ECOLI|B3366|Z4727|ECS4217 from Escherichia
+ coli strains K12 and O157:H7 (108 aa), FASTA scores: opt:
+ 271, E():1.7e-12, (41.9% identity in 105 aa overlap).
+ ASSOCIATES WITH NIRB|Rv0252."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NITRITE REDUCTASE [NAD(P)H] SMALL
+ SUBUNIT NIRD"
+ /protein_id="CAB5247965.1"
+ /translation="MTLLNDIQVWTTACAYDHLIPGRGVGVLLDDGSQVALFRLDDGS
+ VHAVGNVDPFSGAAVMSRGIVGDRGGRAMVQSPILKQAFALDDGSCLDDPRVSVPVYP
+ ARVTPEGRIQVARVAV"
+ gene complement(304150..304674)
+ /gene="cobU"
+ /locus_tag="BQ2027_MB0260C"
+ CDS complement(304150..304674)
+ /gene="cobU"
+ /locus_tag="BQ2027_MB0260C"
+ /note="Mb0260c, cobU, len: 174 aa. Equivalent to Rv0254c,
+ len: 174 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 174 aa overlap). Probable cobU,
+ cobalamin biosynthesis protein including a cobinamide
+ kinase (EC 2.-.-.-) and cobinamide phosphate
+ guanylyltransferase (EC 2.-.-.-). Highly similar to many
+ e.g. Q05599|COBU_SALTY COBINAMIDE KINASE / COBINAMIDE
+ PHOSPHATE GUANYLYLTRANSFERASE from Salmonella typhimurium
+ (181 aa), FASTA scores: opt: 308, E(): 1.1e-14, (38.7%
+ identity in 181 aa overlap);
+ P46886|COBU_ECOLI|B1993|Z3153|ECS2788 Bifunctional
+ cobalamin biosynthesis protein cobU from Escherichia coli
+ strains K12 and O157:H7 (181 aa); part of
+ AL096872|SC5F7_10 from Streptomyces coelicolor (397 aa),
+ FASTA scores: opt: 445, E(): 3.6e-23, (46.0% identity in
+ 176 aa overlap); etc. Contains PS00017 ATP/GTP-binding
+ site motif A (P-loop). Protein product from Mb0260c
+ detected using SWATH mass spectrometry. Mb0260c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable bifunctional cobalamin biosynthesis
+ protein cobu: cobinamide kinase + cobinamide phosphate
+ guanylyltransferase"
+ /protein_id="CAB5247966.1"
+ /translation="MRILVTGGVRSGKSTHAEALLGDAADVVYVAPGRPAAGSDPDWD
+ ARVALHRARRPPTWLTVETADVATALSEARSPVLVDCLGTWLTAIMDGEALWSAATAD
+ VYAVLEARLDGLCAALTGLPTAIVVTNEVGLGVVPSHSSGVLFRDLLGTINRRVAAVC
+ DEVHLVIAGRVLKL"
+ gene complement(304699..306183)
+ /gene="cobQ1"
+ /locus_tag="BQ2027_MB0261C"
+ CDS complement(304699..306183)
+ /gene="cobQ1"
+ /locus_tag="BQ2027_MB0261C"
+ /note="Mb0261c, cobQ1, len: 494 aa. Equivalent to Rv0255c,
+ len: 494 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 494 aa overlap). Probable cobQ1,
+ cobyric acid synthase, similar to many e.g.
+ Z46611|RCBLUGNS_8 COBYRIC ACID SYNTHASE from R.capsulatus
+ (483 aa), FASTA scores: opt: 1239, E(): 0, (47.1% identity
+ in 493 aa overlap); P29932|COBQ_PSEDE COBYRIC ACID
+ SYNTHASE from Pseudomonas denitrificans (484 aa), FASTA
+ scores: opt: 1168, E():0, (44.9% identity in 490 aa
+ overlap); etc. BELONGS TO THE COBB/COBQ FAMILY, COBQ
+ SUBFAMILY. Note that previously known as cobQ. Protein
+ product from Mb0261c detected using SWATH mass
+ spectrometry. Mb0261c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable cobyric acid synthase cobq1"
+ /protein_id="CAB5247967.1"
+ /translation="MSGLLVAGTTSDAGKSAVTAGLCRALARRGVRVAPFKAQNMSNN
+ SMVCRGPDGTGVEIGRAQWVQALAARTTPEAAMNPVLLKPASDHRSHVVLMGKPWGEV
+ ASSSWCAGRRALAEAACRAFDALAARYDVVVAEGAGSPAEINLRAGDYVNMGLARHAG
+ LPTIVVGDIDRGGVFAAFLGTVALLAAEDQALVAGFVVNKFRGDSDLLAPGLRDLERV
+ TGRRVYGTLPWHPDLWLDSEDALDLQGRRAAGTGARRVAVVRLPRISNFTDVDALGLE
+ PDLDVVFASDPRALDDADLIVLPGTRATIADLAWLRARDLDRALLVHVAAGKPLLGIC
+ GGFQMLGRVIRDPYGIEGPGGQVTEVEGLGLLDVETAFSPHKVLRLPRGEGLGVPASG
+ YEIHHGRITRGDTAEEFLGGARDGPVFGTMWHGSLEGDALREAFLRETLGLAPSGSCF
+ LAARERRLDLLGDLVERHLDVDALLNLARHGCPPTLPFLAPGAP"
+ gene complement(306202..307872)
+ /gene="PPE2"
+ /locus_tag="BQ2027_MB0262C"
+ CDS complement(306202..307872)
+ /gene="PPE2"
+ /locus_tag="BQ2027_MB0262C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0262c, PPE2, len: 556 aa. Equivalent to Rv0256c,
+ len: 556 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 556 aa overlap). Member of the M.
+ tuberculosis PPE family, similar to many e.g. Rv0280,
+ Rv0286, etc. Equivalent to Z98756|MLCB2492.30 from
+ Mycobacterium leprae (572 aa), FASTA scores: opt: 1837,
+ E(): 0, (62.9% identity in 461 aa overlap). Mb0262c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe2"
+ /protein_id="CAB5247968.1"
+ /translation="MTAPIWMASPPEVHSALLSSGPGPGPLLVSAEGWHSLSIAYAET
+ ADELAALLAAVQAGTWDGPTAAVYVAAHTPYLAWLVQASANSAAMATRQETAATAYGT
+ ALAAMPTLAELGANHALHGVLMATNFFGINTIPIALNESDYARMWIQAATTMASYQAV
+ STAAVAAAPQTTPAPQIVKANAPTAASDEPNQVQEWLQWLQKIGYTDFYNNVIQPFIN
+ WLTNLPFLQAMFSGFDPWLPSLGNPLTFLSPANIAFALGYPMDIGSYVAFLSQTFAFI
+ GADLAAAFASGNPATIAFTLMFTTVEAIGTIITDTIALVKTLLEQTLALLPAALPLLA
+ APLAPLTLAPASAAGGFAGLSGLAGLVGIPPSAPPVIPPVAAIAPSIPTPTPTPAPAP
+ APTAVTAPTPPPGPPPPPVTAPPPVTGAGIQSFGYLVGDLNSAAQARKAVGTGVRKKT
+ PEPDSAEAPAAAAAPEEQVQPQRRRRPKIKQLGRGYEYLDLDPETGHDPTGSPQGAGT
+ LGFAGTTHKASPGQVAGLITLPNDAFGGSPRTPMMPGTWDTDSATRVE"
+ gene 308180..308398
+ /locus_tag="BQ2027_MB0263"
+ CDS 308180..308398
+ /locus_tag="BQ2027_MB0263"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0263, -, len: 72 aa. Equivalent to Rv0257, len:
+ 124 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 72 aa overlap). Hypothetical protein,
+ orthologue of ML1828A conserved hypothetical protein from
+ Mycobacterium leprae. Replaced Rv0257c (older annotation).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base transition (c-t) leads to a truncated product
+ in the 5' direction compared to Mycobacterium tuberculosis
+ strain H37Rv (72 aa versus 124 aa). Mb0263 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247969.1"
+ /translation="MQSVDLHVERHLPSRGRSHRTVATVTCVTALGDIRSAQLSATGA
+ WPAVLFPSWSWLCGIGGGVDLQKPSCRA"
+ gene complement(308619..309074)
+ /locus_tag="BQ2027_MB0264C"
+ CDS complement(308619..309074)
+ /locus_tag="BQ2027_MB0264C"
+ /note="Mb0264c, -, len: 151 aa. Equivalent to Rv0258c,
+ len: 151 aa (alternative start possible), from
+ Mycobacterium tuberculosis strain H37Rv, (100.0% identity
+ in 151 aa overlap). Conserved hypothetical protein,
+ showing some similarity to Rv1685c|MTCI125_6 from
+ Mycobacterium tuberculosis (207 aa), FASTA scores: E():
+ 9.3e-07, (32.1% identity in 140 aa overlap). Also some
+ similarity with AL049819|SCE7_13|T36295 probable
+ transcription regulator from Streptomyces coelicolor (204
+ aa), FASTA scores: opt: 158, E(): 0.00052, (27.0% identity
+ in 111 aa overlap). Protein product from Mb0264c detected
+ using SWATH mass spectrometry. Mb0264c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247970.1"
+ /translation="MARSQEPSRGLLDPVAKMLRLPFGTPDFIEKIVTGSVNQVGRRT
+ LYVLITTWDAAGGGPFAASAIATTGLAKTAEIVQSMFIGPVFNPLLKMLGADKIAIRA
+ SLCAAQLVGLGIMRYGVRSEPLHSMSVEMLVDAIGPTMQRYLVGDIGRG"
+ gene complement(309099..309842)
+ /locus_tag="BQ2027_MB0265C"
+ CDS complement(309099..309842)
+ /locus_tag="BQ2027_MB0265C"
+ /EC_number="4.99.1.4"
+ /note="Mb0265c, -, len: 247 aa. Equivalent to Rv0259c,
+ len: 247 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 247 aa overlap). Conserved hypothetical
+ protein, showing some similarity to
+ Rv2393|Z81368|MTCY253_28 from Mycobacterium tuberculosis
+ (281 aa), FASTA scores: E(): 9.5e-16, (33.6 % identity in
+ 235 aa overlap). Also some similarity with
+ CAC33938.1|AL589708 putative secreted protein from
+ Streptomyces coelicolor (248 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="Sirohydrochlorin ferrochelatase SirB (EC"
+ /protein_id="CAB5247971.1"
+ /translation="MNLILTAHGTRRPSGVAMIADIAAQVSALVDRTVQVAFVDVLGP
+ SPSEVLSALSCRPAIVVPAFLSRGYHVRTDLPAHVAASAHPHVTVTPALGPCREIAQI
+ VTQQLVESGWRPGDSVILAAAGASDRRARADLHTTRTLVSELTGSWVDMGFAGTGGPD
+ VRTAVQRARDRAEANRGARRVVVASFLLAEGLFQERLRASGADVVTRPLGTHPGLAQL
+ VANRFRSAVARQQRLHRWHGTPTPVTLDL"
+ gene complement(309839..310984)
+ /locus_tag="BQ2027_MB0266C"
+ CDS complement(309839..310984)
+ /locus_tag="BQ2027_MB0266C"
+ /note="Mb0266c, -, len: 381 aa. Equivalent to Rv0260c,
+ len: 381 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 381 aa overlap). Possible
+ two-component response regulator, highly similar to
+ CAB72204.1|AL138851 putative transcriptional regulator
+ from Streptomyces coelicolor (395 aa); and similar to
+ O34394|D69851|YJJA conserved hypothetical protein from
+ Bacillus subtilis (270 aa), FASTA scores: opt: 312, E():
+ 7.4e-14, (25.8% identity in 267 aa overlap). Also some
+ similarity to regulatory proteins at C-terminal region
+ e.g. CUTR_STRLI|Q03756 transcriptional regulatory protein
+ (217 aa), FASTA scores: opt: 138, E(): 0.02, (30.6%
+ identity in 111 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible transcriptional regulatory protein"
+ /protein_id="CAB5247972.1"
+ /translation="MAQAHSAPLTGYRIAVTSARRAEELCALLRRQGAEVCSAPAIKM
+ IALPDDDELQNNTEALIADPPDILVAHTGIGFRGWLAAAEGWGLANELLESLSSARII
+ SRGPKATGALRAAGLREEWSPDSESSHEVLEYLLESGVSRTRIAVQLHGAADSWDPFP
+ EFLGGLRFAGAQVVPIRVYRWKPAPLGGVFDHLVTGIARRQFDAVTFTSAPAAAAVLE
+ RSRELDIEDQLLAALRTDVHAMCVGPVTSRPLIRKGVPTSAPERMRLGALARHIAEEL
+ PLLGSCTFKAAGHVIEIRGTSVLVDDSVKPLSPSGMAILRALVHRPGGVVSRGDLLRV
+ LPGDGSDTHAVDTAVLRLRTALGDKNIVATVVKRGYRLAVDSRHDDV"
+ gene complement(311084..312493)
+ /gene="narK3"
+ /locus_tag="BQ2027_MB0267C"
+ CDS complement(311084..312493)
+ /gene="narK3"
+ /locus_tag="BQ2027_MB0267C"
+ /note="Mb0267c, narK3, len: 469 aa. Equivalent to Rv0261c,
+ len: 469 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 469 aa overlap). Probable nirK3,
+ nitrite extrusion protein, integral membrane protein
+ possibly member of major facilitator superfamily (MFS),
+ equivalent to AAB41700.1|U72744 nitrite extrusion protein
+ from Mycobacterium fortuitum (471 aa); and
+ 2342627|CAB11406.1|Z98741|T44908 nitrite extrusion protein
+ homolog from Mycobacterium leprae (517 aa; longer in
+ N-terminus). Also similar to other nitrite extrusion
+ proteins e.g. NARK_ECOLI|P10903|B1223 nitrite extrusion
+ protein 1 from Escherichia coli strain K12 (463 aa), FASTA
+ scores: opt: 755, E(): 0, (35.0% identity in 466 aa
+ overlap). BELONGS TO THE NARK/NASA FAMILY OF
+ TRANSPORTERS."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INTEGRAL MEMBRANE NITRITE EXTRUSION
+ PROTEIN NARK3 (NITRITE FACILITATOR)"
+ /protein_id="CAB5247973.1"
+ /translation="MGRSHQISDWDPEDSVAWEAGNKFIARRNLIWSVAAEHVGFSVW
+ SLWSVMVLFMPTSVYGFSAGDKFLLGATATLVGACLRFPYTFATAKFGGRNWTIFSAL
+ VLLIPTVGSILLLANPGLPLWPYLVCGALAGLGGGNFAASMTNINAFFPQRLKGAALA
+ LNAGGGNLGVPMVQLVGLLVIATAGDREPYWVCAIYLVLLAVAGLGAALYMDNLTEYR
+ IELNTMRAVVSEPHTWVISLLYIGTFGSFIGFSFAFGQVLQINFIASGQSTAQASLHA
+ AQIAFLGPLLGSLSRIYGGKLADRIGGGRVTLAAFCAMLLATGILISASTFGDHLAGP
+ MPTATMVGYVIGFTALFILSGIGNGSVYKMIPSIFEARSHSLQISEAERRQWSRSMSG
+ ALIGLAGAVGALGGVGVNLALRESYLTSGTATSAFWAFGVFYLVASVLTWAIYVRRGL
+ KSAGELVPATTAPAGLAYV"
+ gene complement(312634..313179)
+ /gene="aac"
+ /locus_tag="BQ2027_MB0268C"
+ CDS complement(312634..313179)
+ /gene="aac"
+ /locus_tag="BQ2027_MB0268C"
+ /standard_name="aac(2')-IC"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0268c, aac, len: 181 aa. Equivalent to Rv0262c,
+ len: 181 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 181 aa overlap). aac, aminoglycoside
+ 2'-N-acetyltransferase (aac(2')-IC) (EC 2.3.1.-) (see
+ citation below), highly similar to NP_302635.1|NC_002677
+ aminoglycoside 2'-N-acetyltransferase from Mycobacterium
+ leprae (182 aa); Q49157|AAC2_MYCFO|AAC aminoglycoside
+ 2'-N-acetyltransferase from Mycobacterium fortuitum (195
+ aa), FASTA scores: opt: 884, E(): 0, (69.1% identity in
+ 181 aa overlap); and P94968|AAC2_MYCSM|AAC aminoglycoside
+ 2'-N-acetyltransferase from Mycobacterium smegmatis (210
+ aa) (see also citation below). Also similar to
+ Q52424|AAC2_PROST AMINOGLYCOSIDE 2'-N-ACETYLTRANSFERASE
+ from Providencia stuartii (178 aa). BELONGS TO THE
+ AAC(2')-I FAMILY OF ACETYLTRANSFERASES. Note that
+ previously known as aac(2')-IC. Protein product from
+ Mb0268c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0268c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="AMINOGLYCOSIDE 2'-N-ACETYLTRANSFERASE AAC
+ (AAC(2')-IC)"
+ /protein_id="CAB5247974.1"
+ /translation="MHTQVHTARLVHTADLDSETRQDIRQMVTGAFAGDFTETDWEHT
+ LGGMHALIWHHGAIIAHAAVIQRRLIYRGNALRCGYVEGVAVRADWRGQRLVSALLDA
+ VEQVMRGAYQLGALSSSARARRLYASRGWLPWHGPTSVLAPTGPVRTPDDDGTVFVLP
+ IDISLDTSAELMCDWRAGDVW"
+ gene complement(313189..314091)
+ /locus_tag="BQ2027_MB0269C"
+ CDS complement(313189..314091)
+ /locus_tag="BQ2027_MB0269C"
+ /EC_number="3.5.1.54"
+ /note="Mb0269c, -, len: 300 aa. Equivalent to Rv0263c,
+ len: 300 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 300 aa overlap). Conserved
+ hypothetical protein, equivalent to NP_302634.1|NC_002677
+ conserved hypothetical protein from Mycobacterium leprae
+ (305 aa). Also similar to others e.g. AL121596|SC51A_21
+ hypothetical protein from Streptomyces coelicolor (285
+ aa), FASTA scores: opt: 714, E(): 0, (45.3% identity in
+ 289 aa overlap); NP_233164.1|NC_002506 conserved
+ hypothetical protein from Vibrio cholerae (309 aa);
+ NP_406216.1|NC_003143 conserved hypothetical protein from
+ Yersinia pestis (316 aa); YH30_HAEIN|P44298|hi1730
+ hypothetical protein from Haemophilus influenzae (309 aa),
+ FASTA scores: opt: 430, E(): 3e-20, (29.6% identity in 284
+ aa overlap); etc. Also similar to carboxylases eg
+ NP_415240.1|NC_000913|P75745|YBGK_ECOLI putative
+ carboxylase from Escherichia coli strain K12 (310 aa),
+ FASTA score: (34.6% identity in 286 aa overlap);
+ NP_459698.1|NC_003197 putative carboxylase from Salmonella
+ typhimurium (310 aa); and to middle part of
+ NP_420636.1|NC_002696 urea amidolyase-related protein from
+ Caulobacter crescentus (1207 aa). Protein product from
+ Mb0269c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0269c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Allophanate hydrolase 2 subunit 2 (EC"
+ /protein_id="CAB5247975.1"
+ /translation="MTTLEILRSGPLALVEDLGRAGLAHLGVGRSGAADRRSHTLANR
+ LVANPDDWATVEVTFGGFSARVRGGDVDIAVTGADTDPTVNGIMVGTNSIHHVRDGQV
+ ISLGTPRAGLRTYLAVRGGVCVEPVLGSRSYDVMSAIGPSPLRAGDVLPVGEHTDDYP
+ ELDQAPVAAIEEHLVELRVVPGPRDDWLVDPDALVHTIWMASNRSDRVGMRLQGRPLQ
+ HRWPDRQLPGEGVTRGAIQVPPNGLPVILGPDHPITGSYPVVGVITDEDIDKVAQIRP
+ GQYVRLHWARPRSRLPGQGVTQAW"
+ gene complement(314108..314740)
+ /locus_tag="BQ2027_MB0270C"
+ CDS complement(314108..314740)
+ /locus_tag="BQ2027_MB0270C"
+ /EC_number="3.5.1.54"
+ /note="Mb0270c, -, len: 210 aa. Equivalent to Rv0264c,
+ len: 210 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 210 aa overlap). Conserved
+ hypothetical protein, equivalent to CAC32080.1|AL583926
+ conserved hypothetical protein from Mycobacterium leprae
+ (222 aa). Also similar to others hypothetical proteins
+ e.g. AL121596|SC51A_20 from Streptomyces coelicolor (252
+ aa), FASTA scores: opt: 420, E(): 2.7e-20, (41.7% identity
+ in 204 aa overlap); P75744|YBGJ_ECOLI HYPOTHETICAL 23.9 KD
+ PROTEIN from Escherichia coli (218 aa), FASTA scores: E():
+ 2.1e-14, (35.7% identity in 182 aa overlap);
+ YH31_HAEIN|P44299|hi173 hypothetical protein from
+ Haemophilus influenzae (213 aa), FASTA scores: opt: 252,
+ E(): 8.3e-10, (31.1% identity in 183 aa overlap). Protein
+ product from Mb0270c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0270c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Allophanate hydrolase 2 subunit 1 (EC"
+ /protein_id="CAB5247976.1"
+ /translation="MDAALACTVLDYGDHALMLQCDSTADAMAWTDALRAAALPGVVD
+ IVAASRTVLVKLDAPRYQGVTRQRLRRLRVTPEAVAAADHRCDLVIDVVYDGPDLAEV
+ ARCTGLTTAAVINAHTATGWRAGFSGSAPGFAYLIDGDPSLRVPRRPERRTSMPPGSV
+ ALADGFSAIYPSQAPSDWQIIGHTDAVLWDVDRPQPALLTPGMWVQFRAA"
+ gene complement(314836..315828)
+ /locus_tag="BQ2027_MB0271C"
+ CDS complement(314836..315828)
+ /locus_tag="BQ2027_MB0271C"
+ /note="Mb0271c, -, len: 330 aa. Equivalent to Rv0265c,
+ len: 330 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 330 aa overlap). Probable
+ iron-transport lipoprotein, most similar to
+ T36412|5763945|CAB53324.1|AL109974 probable
+ iron-siderophore binding lipoprotein from Streptomyces
+ coelicolor (350 aa); and (N-terminus may be incorrect) to
+ T14166|3560508|AAC82551.1|AF027770 fxuD protein from
+ Mycobacterium smegmatis (420 aa), FASTA scores: opt: 385,
+ E(): 1.5e-16, (32.3% identity in 232 aa overlap). Also
+ similar to AAB97475.1|U02617 DtxR/iron regulated
+ lipoprotein precursor from Corynebacterium diphtheriae
+ (355 aa); FECB_ECOLI|P15028 iron(III) dicitrate-binding
+ periplasmic protein (300 aa), FASTA scores: opt: 191, E():
+ 2.3e-05, (26.5% identity in 196 aa overlap). Contains
+ PS00013 Prokaryotic membrane lipoprotein lipid attachment
+ site. Note that previously known as fecB2. Protein product
+ from Mb0271c detected using shotgun mass spectrometry.
+ Mb0271c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PERIPLASMIC IRON-TRANSPORT LIPOPROTEIN"
+ /protein_id="CAB5247977.1"
+ /translation="MRQGCSRRGFLQVAEAAAATGLFAGCSSPKPPPGTPGGAAVTIT
+ HLFGQTVIKEPPKRVVSAGYTEQDDLLAVDVVPIAVTDWFGDQPFAVWPWAAPKLGGA
+ RPAVLNLDNGIQIDRIAALKPDLIVAINAGVDADTYQQLSAIAPTVAQSGGDAFFEPW
+ KDQARSIGQAVFAADRMRSLIEAVDQKFAAVAQRHPRWRGKKALLLQGRLWQGNVVAT
+ LAGWRTDFLNDMGLVIADSIKPFAVDQRGVIPRDHIKAVLDAADVLIWMTESPEDEKA
+ LLADPEIAASQATAQRRHIFTSKEQAGAIAFSSVLSYPVVAEQLPPQISQILGA"
+ gene complement(315850..319479)
+ /gene="oplA"
+ /locus_tag="BQ2027_MB0272C"
+ CDS complement(315850..319479)
+ /gene="oplA"
+ /locus_tag="BQ2027_MB0272C"
+ /note="Mb0272c, oplA, len: 1209 aa. Equivalent to Rv0266c,
+ len: 1209 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100.0% identity in 1209 aa overlap). Probable
+ oplA, 5-oxoprolinase (EC 3.5.2.9), highly similar to
+ others or to hypothetical proteins e.g.
+ AAK24340.1|AE005906 hydantoinase/oxoprolinase from
+ Caulobacter crescentus (1196 aa);
+ NP_103129.1|14022305|BAB48915.1|AP002997 5-oxoprolinase
+ from Mesorhizobium loti (1210 aa); CAC48426.1|AL603642
+ CONSERVED HYPOTHETICAL PROTEIN from Sinorhizobium meliloti
+ (1205 aa); S77037|slr0697|1006579|BAA10729.1|D6400
+ HYPOTHETICAL PROTEIN from Synechocystis sp. strain PCC
+ 6803 (1252 aa), FASTA scores: opt: 2016, E(): 0, (51.4%
+ identity in 1247 aa overlap);
+ P97608|OPLA_RAT|T42756|11278797 5-OXOPROLINASE
+ (5-OXO-L-PROLINASE) (PYROGLUTAMASE) (5-OPASE) from Rattus
+ norvegicus (1288 aa); etc. BELONGS TO THE OXOPROLINASE
+ FAMILY. Protein product from Mb0272c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0272c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 5-OXOPROLINASE OPLA (5-OXO-L-PROLINASE)
+ (PYROGLUTAMASE) (5-OPASE)"
+ /protein_id="CAB5247978.1"
+ /translation="MVGAGWHFWVDRGGTFTDVVARRPDGRLLTHKLLSDNPARYRDA
+ AVAGIRALLANGEAGTRVDAVRMGTTVATNALLERTGERTLLVITRGFGDALRIAYQN
+ RPRIFDRRIVLPEMLYERVVEVDERVTADGRVLRAPDLEALGEKMRQAHADGIRAVAV
+ VCLHSYLYPGHEREIGTLAQRIGFAQISLSSEVSPLMKLVPRGDTTVVDAYLSPVLRR
+ YINQVADQMRGVRLMFMQSNGGLAQAGHFRGKDAILSGPAGGIVGMVRMSALAGFDHV
+ IGFDMGGTSTDVSHYAGEYERVFTTQVAGVRLRAPMLDIHTVAAGGGSILHFDGSRYR
+ VGPDSAGADPGPACYRGGGPLCVTDANVMLGRIQPTHFPSVFGPSGDQPLDAGTVRRG
+ FTDLAADIAARTGDDRSPEQVAEGYLRIAVANMANAVKKISVQKGHDVTRYALTTFGG
+ AGGQHACAVADALGIRTVLIPPMAGVLSALGIGLADTTAMREQSVEIPLGPAAPQRLA
+ SVAESLERAARAELLDEGVPGERIRVVRRVHLRYEGTDTAIPVQLAEIETMATAFESS
+ HRALYTFLLDRPLIAEAISVEATGLTDQPDLSQLGDQANDTTGSSETVRIYSNGLWRD
+ APLRRREAMRPGDVLTGPAIIAEANATTVVDDGWQATMTETGHLLAQRVVTPPRPDAA
+ TRAGFEAGFEADPVLLEIFNNLFMSIAEQMGFRLEATAQSVNIRERLDFSCALFDPDG
+ NLVANAPHIPVHLGSMGTTVKEVIRRRLSGMKPGDVYAVNDPYHGGTHLPDITVITPV
+ FNTGGEDVLFFVASRGHHAEIGGITPGSMPADSREIHEEGVLFDNWLLAENGRFREAE
+ TRRLLTEAPFGSRNPDTNLADLRAQIAANQKGVDEVGKMIDHFGRDVVAAYMRHVQDN
+ AEEAVRRVIDRLDNGAYRYRMDSGATIAVRITVDRAARSATIDFTGTSAQLDTNFNAP
+ TSVVNAAVLYVFRTLVADDIPLNDGCLRPLRIVVPEGSMLAPTHPAAVVAGNVETSQA
+ ITGALFAALGVQAEGSGTMNNVTFGNERHQYYETVGSGSGAGDGYHGASVVQTHMTNS
+ RLTDPEVLEWRYPVLLREFAVRQGSGGAGRWRGGDGAVRRLEFTEPMTVSTLSGHRRV
+ RPYGMAGGSPGELGRNRVERADGSTVELAGCGSTHVEPGDTLVIETPGGGGYGPASTS
+ ARRRR"
+ gene 319656..321047
+ /gene="narU"
+ /locus_tag="BQ2027_MB0273"
+ CDS 319656..321047
+ /gene="narU"
+ /locus_tag="BQ2027_MB0273"
+ /note="Mb0273, narU, len: 463 aa. Equivalent to Rv0267,
+ len: 463 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 463 aa overlap). Probable narU,
+ nitrite extrusion protein, integral membrane protein
+ possibly member of major facilitator superfamily (MFS),
+ similar to other nitrite extrusion proteins e.g.
+ NARU_ECOLI|P37758 nitrite extrusion protein 2 from
+ Escherichia coli (462 aa), FASTA scores: opt: 630, E():
+ 4.4e-33, (38.9% identity in 463 aa overlap); and
+ NARK_ECOLI|P10903|B1223 nitrite extrusion protein 1 from
+ Escherichia coli strain K12 (463 aa), FASTA scores: opt:
+ 607, E(): 1.3e-31, (42.0% identity in 457 aa overlap).
+ Also similar to Rv0261c, Rv2329c, Rv1737c, and to
+ MLCB22_25 from Mycobacterium leprae (517 aa), FASTA score:
+ (35.1 identity in 459 aa overlap). BELONGS TO THE
+ NARK/NASA FAMILY OF TRANSPORTERS. Protein product from
+ Mb0273 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="probable integral membrane nitrite extrusion
+ protein naru (nitrite facilitator)"
+ /protein_id="CAB5247979.1"
+ /translation="MALTTAPAIDYALPRQQDEGDHWIDDWRPEDPVFWETIGRPIAR
+ RNLIFSIFAEHVGFSVWMLWSIVVVQMTAAAPGHPAASGWALSASQALCLVAVPSGVG
+ AFLRLPYTFAIPIFGGRNWTTVSAALLVIPCLLLAWAVSHPSLPFAVLVVIAATAGFG
+ GGNFASSMANISFFYPEKDKGWALGLNAAGGNIGVAVVQKIIPPIVVAGSGVALSRAG
+ LFFVPLAVAAAVCAFLFMNNLTEAKADVKPVWQSLRHADTWIMSLLYIGTFGSFIGYS
+ AAFPTLLKTVFGRGDIALGWAFLGAGIGSLVRPLGGKLADRIGGARITAASFVMLAAG
+ AAAALWSVQSVNLPVFFVSFMFLFVATGIGNGSSYRMISRIFQVKGEVAGGDPETMVN
+ MRRQAAGALGIISSIGAFGGFVVPLAYAWSKVHFGNIEPALHFYVAFFLALLVVTWYC
+ YLRRTTPMGQVGV"
+ gene complement(321089..321598)
+ /locus_tag="BQ2027_MB0274C"
+ CDS complement(321089..321598)
+ /locus_tag="BQ2027_MB0274C"
+ /note="Mb0274c, -, len: 169 aa. Equivalent to Rv0268c,
+ len: 169 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 169 aa overlap). Hypothetical unknown
+ protein. Mb0274c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Antitoxin of toxin-antitoxin stability system"
+ /protein_id="CAB5247980.1"
+ /translation="MGTRSKSRTRQLKQSNGCTATTSGASDRRRRARRRTAPAWLRED
+ EWLRHHLPHPPRQLSRCLHRRRRSACHHRYSRRTPKGGLPMTSSLVPISEARAHLSRL
+ VRESADDDVVLMNHGRPAAILISAERYESLMEELEDLRDRLSVHEREHVTMPLDKLGA
+ ELGVDIGRV"
+ gene complement(321663..322856)
+ /locus_tag="BQ2027_MB0275C"
+ CDS complement(321663..322856)
+ /locus_tag="BQ2027_MB0275C"
+ /EC_number="6.5.1.1"
+ /note="Mb0275c, -, len: 397 aa. Equivalent to Rv0269c,
+ len: 397 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 397 aa overlap). Conserved
+ hypothetical protein, highly similar to AL079355|SC4C6_19
+ hypothetical protein from Streptomyces coelicolor (341
+ aa), FASTA scores: opt: 1019, E(): 0, (46.5% identity in
+ 344 aa overlap), and similar to other proteins e.g.
+ CAC49016.1|AL603644 putative ATP-dependent DNA ligase
+ protein from Sinorhizobium meliloti (636 aa); O34398 YKOU
+ PROTEIN from Bacillus subtilis (611 aa), FASTA score:
+ (27.2% identity in 283 aa overlap). Also similar to
+ proteins from Mycobacterium tuberculosis e.g. Rv3062,
+ Rv3731 (both DNA ligases), and Rv0938, Rv3730c. Protein
+ product from Mb0275c detected using SWATH mass
+ spectrometry. Mb0275c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ATP-dependent DNA ligase (EC"
+ /protein_id="CAB5247981.1"
+ /translation="MSRMAAPVSLDVHGRQVIVTHPGRVVFPAHNDRKGYTKFDLVRY
+ YLAVAEGAMRGVAGRPMILKRFVKGISAEAVFQKRAPANRPDWVDVAELHYASGRSAA
+ EAVIHDAAGLAWVINLGCVDLNPHPVLAGDLDHPDELRVDLDPMPGVAWQRVVEVALV
+ VREVLEDYGLTAWPKTSGSRGFHVYARIAPCWSFPQVRLAAQTVAREVERRLPDAATS
+ RWWKEEREGVFVDFNQNAKDRTVASAYSVRATPDARVSTPLHWEEVPGCDPAVFTMAT
+ VPSRLADIGDPWAGMDDAVGRLDRLLMLAEELGPPQKAQSAKPLIEIARAKTRAEAMA
+ ALDIWRDRYPGAAALLRPADVLVDGMRGPSSIWYRIRINLQHVPADQRPPQEELIADY
+ SPWPR"
+ gene 322892..324574
+ /gene="fadD2"
+ /locus_tag="BQ2027_MB0276"
+ CDS 322892..324574
+ /gene="fadD2"
+ /locus_tag="BQ2027_MB0276"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0276, fadD2, len: 560 aa. Equivalent to Rv0270,
+ len: 560 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 560 aa overlap). Probable fadD2,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), similar to many
+ e.g. LCFA_ECOLI|P29212 long-chain-fatty-acid--CoA ligase
+ from Escherichia coli (561 aa), FASTA scores: opt: 544,
+ E(): 2.9e-26, (27.7% identity in 535 aa overlap). Also
+ similar to others from Mycobacterium tuberculosis e.g.
+ MTCY493_2, MTCY8D5_9, MTCY6G11_8, etc. Contains PS00455
+ Putative AMP-binding domain signature. Protein product
+ from Mb0276 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0276 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY-ACID-COA LIGASE FADD2
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="CAB5247982.1"
+ /translation="MPNLTDLPGQAVSKLQKSIGQYVARGTAELHYLRKIIESGAIGL
+ EPPLNYAALAADIRKWGEVGMLPSHNARRAPNRAAVIDEEGTLTFSELDEAAHAVANG
+ LLAKGVRAGDGVAILARNHRWFVIANYGAARVGARIILLNSEFSGPQIKEVSDREGAK
+ VIIYDDEYTKAVSLAQPPLGKLRALGVNPDDDKPSGSSDETLAELIAHSSTAPAPKAS
+ RRASIIILTSGTTGTPKGANRNTPPTLAPIGGILSHVPFKAGEVTLLPSPMFHALGYM
+ HAALAMFLGSTLVLRRRFKPALVLEDIEKHKATSMVVVPVMLSRILDQLEKTEPKPDL
+ SSLKIVFVSGSQLGAELATRALGDLGPVIYNMYGSTEVAFATIAGPKDLQFNPSTVGP
+ VVKGVTVKILDENGNEVPQGAVGRIFVGNAFPFEGYTGGGGKQIIDGLLSSGDVGYFD
+ ERGLLYVSGRDDEMIVSGGENVFPAEVEDLISGHPDVVEAAAIGVDDKEFGARLRAFV
+ VKKPGADLDEDTIKQYVRDHLARYKVPREVIFLDELPRNPTGKVLKRELRKL"
+ gene complement(324591..326786)
+ /gene="fadE6"
+ /locus_tag="BQ2027_MB0277C"
+ CDS complement(324591..326786)
+ /gene="fadE6"
+ /locus_tag="BQ2027_MB0277C"
+ /note="Mb0277c, fadE6, len: 731 aa. Equivalent to Rv0271c,
+ len: 731 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 731 aa overlap). Probable fadE6,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), with C-terminal half
+ similar to many e.g. ACDS_HUMAN|P16219 acyl-CoA
+ dehydrogenase (short-chain) from Homo sapiens (412 aa),
+ FASTA scores: opt: 339, E(): 1.3e-13, (28.1% identity in
+ 288 aa overlap). Protein product from Mb0277c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0277c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE6"
+ /protein_id="CAB5247983.1"
+ /translation="MSIAITPEHYELADSVRSLVARVAPSEVLHAALESPVENPPPYW
+ QAAAEQGLQGVHLAESVGGQGFGILELAVVLAEFGYGAVPGPFVPSAIASALIAAHDP
+ QAKVLAELATGAAIAAYALDSGLTATRHGDVLVIRGEVRAVPAAAQASVLVLPVAIES
+ RDEWVVLRNDQLEIEAVKSLDPLRPIAHVRANAVDVSDDALLSNLTMTTAHALMSTLL
+ SAEAVGVARWATDTASAYAKIREQFGRPIGQFQAIKHKCAEMIADTERATAAVWDAAR
+ ALDDAGESSSDVEFAAAVAATLAPATAQRCTQDCIQVHGGIGFTWEHDTNVYYRRALM
+ LAACFGRGSEYPQRVVDTATTAGMRPVDIDLDPSTEKLRAQIRAEVAALKAMPREPRT
+ VAIAEGGWVLPYLPKPWGRAASPVEQIIIAQEFTAGRVKRPQIAIATWIVPSIVAFGT
+ DNQKQRLLPPTFRGDIFWCQLFSEPGAGSDLASLATKATRVDGGWRITGQKIWTTGAQ
+ YSQWGALLARTDPSAPKHNGITYFLLDMKSEGVQVKPLRELTGKEFFNTVYLDDVFVP
+ DELVLGEVNRGWEVSRNTLTAERVSIGGSDSTFLPTLGEFVDFVRDYRFEGQFDQVAR
+ HRAGQLIAEGHATKLLNLRSTLLTLAGGDPMAPAAISKLLSMRTGQGYAEFAVSSFGT
+ DAVIGDTERLPGKWGEYLLASRATTIYGGTSEVQLNIIAERLLGLPRDP"
+ gene complement(326900..328033)
+ /locus_tag="BQ2027_MB0278C"
+ CDS complement(326900..328033)
+ /locus_tag="BQ2027_MB0278C"
+ /note="Mb0278c, -, len: 377 aa. Equivalent to Rv0272c,
+ len: 377 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 377 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0278c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0278c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="CAB5247984.1"
+ /translation="MTGRAATPGVIREFVGLPSRTAGRAAAGGHPCQGLYHHSVGRKP
+ KVALIAAHYQIDFSEHYLAEYMAIRGIGFLGWNTRFRGFESSFLLDHALVDIGVGVRW
+ LREVQGVETVVLLGNSGGGSLMAAYQSQAVDPNVTPLDGMRPAAGVTELPAADAYVAA
+ AAHLGRPDVLTAWMDAAVIDENDPVATDPELDLFDERNGPPYSPEFISRYRSAQVKRN
+ HTITDWAESELKRVRAAGFSDRPFSVMRTWADPRMVDPSIEPTKRRPNQCYAGTPVKA
+ NRSAHGIAAACTLRGWLGMWSLRVAQTRAAPHLARITCPALVLNAEADTGIFPSDAQQ
+ IYDGLASSDKTQVSIDTDHYFTTPGARSEQADTIAKWIAKRWR"
+ gene complement(328030..328650)
+ /locus_tag="BQ2027_MB0279C"
+ CDS complement(328030..328650)
+ /locus_tag="BQ2027_MB0279C"
+ /note="Mb0279c, -, len: 206 aa. Equivalent to Rv0273c,
+ len: 206 aa (start uncertain), from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 206 aa
+ overlap). Possible transcriptional regulator, showing some
+ similarity to hypothetical regulators from Mycobacterium
+ tuberculosis e.g. P96222|Rv3855|MTCY01A6.13c (216 aa);
+ O08377|Rv1534|MTCY07A7A.03 (225 aa), FASTA scores: opt:
+ 123, E(): 3.2e-06, (28.5% identity in 172 aa overlap).
+ Mb0279c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5247985.1"
+ /translation="MPDFPTQRGRRTQAAIDAAARTVVVRNGILATTVADITAEAGRS
+ AASFYNYYDSKEAMVRQWALRFRDDANQRALSVIRHGLSDRERAYEAAAAHWYTYRNR
+ LAEAISVSQLAMVSDDFAQYWSEICQIPISFITETVKRAQAHGYCVGDDPQLMAEAIV
+ AMFNQFCYLQLSGKRSRRGQPDDQACIQTLANIYYRAIYSKEDSSN"
+ gene 328747..329328
+ /locus_tag="BQ2027_MB0280"
+ CDS 328747..329328
+ /locus_tag="BQ2027_MB0280"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0280, -, len: 193 aa. Equivalent to Rv0274, len:
+ 193 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 193 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ AAK25058.1|AE005973 conserved hypothetical protein from
+ Caulobacter crescentus (174 aa). Shows also some
+ similarity to others hypothetical proteins e.g.
+ AJ002571|BSAJ2571_7 from Bacillus subtilis (316 aa), FASTA
+ scores: opt: 138, E(): 0.033, (27.1% identity in 133 aa
+ overlap). Previous hits with Q56415|M85195
+ FOSFOMYCIN-RESISTANCE PROTEIN from SERRATIA MARCESCENS
+ (141 aa), FASTA scores: opt: 82, E(): 1.1e -08, (29.1%
+ identity in 151 aa overlap). Contains PS00082 Extradiol
+ ring-cleavage dioxygenases signature near C-terminus.
+ TBparse score is 0.914. Protein product from Mb0280
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0280 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Glyoxalase family protein"
+ /protein_id="CAB5247986.1"
+ /translation="MIKPHNTNTEFELGGINHVALVCSDMARTVDFYSNILGMPLIKA
+ LDLPGGQGQHFFFDAGNGDCVAFFWFADAPDRVPGLSSPVAIPGIGDITSAVSTMNHL
+ AFHVPAERFDAYRQRLKDKGVRVGPVLNHDDSETQVSAVVHPGVYVRSFYFQDPDGIT
+ LEFACWTKEFTTSDAQAVPKTAADRRPPVAADR"
+ gene complement(329258..329983)
+ /locus_tag="BQ2027_MB0281C"
+ CDS complement(329258..329983)
+ /locus_tag="BQ2027_MB0281C"
+ /note="Mb0281c, -, len: 241 aa. Equivalent to Rv0275c,
+ len: 241 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 241 aa overlap). Putative
+ transcriptional regulator, showing some similarity with
+ Rv0825c from Mycobacterium tuberculosis (213 aa), FASTA
+ scores: opt: 230, E(): 2.7e-07, (32.6% identity in 190 aa
+ overlap). Belongs to Mycobacterium tuberculosis regulatory
+ protein family with many TetR orthologues. Protein product
+ from Mb0281c detected using SWATH mass spectrometry.
+ Mb0281c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY TETR-FAMILY)"
+ /protein_id="CAB5247987.1"
+ /translation="MTRSDRPYRGVEAAERLATRRRQLLSAGLDLLGSDQHDIAELTI
+ RTICRRAGLSVRYFYESFTDKDEFVGRVFDWVVAELVATTQAAVTAVPAREQTRAGMA
+ NIVRTITADARVGRLLFSTQLANAVITRKRAESSALFAMLSGQHAVDTLHAPANDHVK
+ AVAHFAVGGVGQTISAWLAGDVRLDPDQLVDQLAALLDELTDPNLSRPRVAATAAKSG
+ ANDPQPPEVAGQPPSSARPARRS"
+ gene 330073..330993
+ /locus_tag="BQ2027_MB0282"
+ CDS 330073..330993
+ /locus_tag="BQ2027_MB0282"
+ /note="Mb0282, -, len: 306 aa. Equivalent to Rv0276, len:
+ 306 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 306 aa overlap). Conserved
+ hypothetical protein, similar to Rv2237|Z70692|MTCY427.18
+ from Mycobacterium tuberculosis (296 aa), FASTA scores:
+ opt: 874, E(): 0, (49.6% identity in 282 aa overlap).
+ Protein product from Mb0282 detected using SWATH mass
+ spectrometry. Mb0282 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5247988.1"
+ /translation="MAISLVAHQPIPHVERPMADPPRLQLARRRRSAAGPGGNEDSLM
+ GVALLAGPANVIMELAMPGVGYGVLESRVESGRLDRHPIKRARTTFTYVAVAVAGSDD
+ QKAAFRRAVNKVHAQVYSTPESPVSYHAFDPELQLWVAACLYKGGVDVYRTFVGEMDD
+ EEADHHYRAGMAMGTTLQVPPQMWPPDRAAFDRYWRQSLDRVHIDDVVRDYLYPIVAL
+ RIRGIALPGPLRRLSEGIALLITTGFLPQRFRDEMRLPWDATKQRRFDALMAVLRTVN
+ RLMPRFVREFPFNLMLWDLDRRMRRGRPLV"
+ gene complement(331033..331461)
+ /gene="vapc25"
+ /locus_tag="BQ2027_MB0283C"
+ CDS complement(331033..331461)
+ /gene="vapc25"
+ /locus_tag="BQ2027_MB0283C"
+ /note="Mb0283c, -, len: 142 aa. Equivalent to Rv0277c,
+ len: 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 142 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ Rv0749|H70824|2911023|CAA17516.1|AL021958 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (142
+ aa); and similar to several other hypothetical
+ Mycobacterium tuberculosis proteins: Rv0277c, Rv2530c,
+ etc. Mb0283c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc25. contains pin domain."
+ /protein_id="CAB5247989.1"
+ /translation="MFLIDVNVLLAAHRGDHPNHRTVRPWFDRLLAADDPFTVPNLVW
+ ASFLRLTTNRRIFEIPSPRADAFAFVEAVNAQPHHLPTSPGPRHLVLLRKLCDEADAS
+ GDLIPDAVLGAIAVEHHCAVVSLDRDFARFASVRHIRPPI"
+ gene complement(331762..332004)
+ /gene="PE_PGRS3b"
+ /locus_tag="BQ2027_MB0284C"
+ /pseudo
+ CDS complement(331762..332004)
+ /gene="PE_PGRS3b"
+ /locus_tag="BQ2027_MB0284C"
+ /note="Mb0284c, PE_PGRS3b, len: 80 aa. Equivalent to 3'
+ end of Rv0278c, len: 957 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 79 aa
+ overlap). Member of the Mycobacterium tuberculosis PE
+ family, PGRS subfamily of gly-rich proteins, similar to
+ many e.g. Z95890|MTCY28_25|Rv1759c from Mycobacterium
+ tuberculosis (914 aa), FASTA scores: opt: 3849, E():
+ 0,(67.8% identity in 903 aa overlap). Contains PS00583
+ pfkB family of carbohydrate kinases signature 1.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PE_PGRS3 exists as a single
+ gene. In Mycobacterium bovis, a 2780 bp insertion leads to
+ an extra copy of PE_PGRS3. Also, a frameshift due to
+ single base deletion (t-*), splits this extra copy of
+ PE_PGRS3 into 2 parts, PE_PGRS3a and PE_PGRS3b.;PE-PGRS
+ FAMILY PROTEIN [SECOND PART]"
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene complement(331827..334433)
+ /gene="PE_PGRS3a"
+ /locus_tag="BQ2027_MB0285C"
+ CDS complement(331827..334433)
+ /gene="PE_PGRS3a"
+ /locus_tag="BQ2027_MB0285C"
+ /note="Mb0285c, PE_PGRS3a, len: 868 aa. Similar to 5' end
+ of Rv0278c, len: 957 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (80.7% identity in 888 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, similar to many e.g.
+ Z95890|MTCY28_25|Rv1759c from Mycobacterium tuberculosis
+ (914 aa), FASTA scores: opt: 3849, E(): 0, (67.8% identity
+ in 903 aa overlap). Contains PS00583 pfkB family of
+ carbohydrate kinases signature 1.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PE_PGRS3 exists as a single
+ gene. In Mycobacterium bovis, a 2780 bp insertion leads to
+ an extra copy of PE_PGRS3. Also, a frameshift due to
+ single base deletion (t-*), splits this extra copy of
+ PE_PGRS3 into 2 parts, PE_PGRS3a and PE_PGRS3b. Mb0285c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PE-PGRS FAMILY PROTEIN [FIRST PART]"
+ /protein_id="CAB5247991.1"
+ /translation="MSFVIAAPEVIAAAATDLASLESSIAAANAAAAANTTALLAAGA
+ DEVSTAVAALFGAHGQAYQALSAQAQAFHAQFTQALTSGGGAYAAAEAAATSPLLAPI
+ NEFFLANTGRPLIGNGANGAPGTGADGAPGGWLIGNGGAGGSGAANNAVGGTGGTGGA
+ GGASGLLGSGGAGGAGGVATNTGGIGGAGGTGGNAVLFGAGGAGGASTNTTGGAGGAG
+ GDGGNAGLLFGAAGVGGAGGFALATTASGGAGGAGGAGGMFTDGGVGGVGGKGGFGGA
+ GGAGGNGGLFGAGGTGGAGGTIGAGVAGMGGAGGAGGAGGLFGAGGTGGSGGGGATTG
+ GDGGAGGAGGFGRTTGGIGGTGGNAGLLNGSGGAGGAGGAAITGPGGTGGAGGIPGLI
+ GNGGNGGDGGASVTGTGGNGGAGGNGVQIGNGGNGGSGGTGAAAGKAGLGGLGGQLIG
+ LDGSNAPVSTSVHTLQQAALNVVNEPFQTLTGRPLIGNGANGTPGTGAAGGAGGWLFG
+ NGGNGGHGATNTAATATGGAGGAGGILFGTGGNGGTGGIATGAGGIGGAGGAGGVSLL
+ IGSGGTGGNGGNSIGVAGIGGAGGRGGDAGLLFGAAGTGGHGAAGGVPAGVGGAGGNG
+ GLFANGGAGGAGGFNAAGGNGGNGGLFGTGGTGGAGTNFGAGGNGGNGGLFGAGGTGG
+ AAGSGGSGITTGGGGHGGNAGLLSLGASGGAGGSGGASSLAGGAGGTGGNGALLFGFG
+ GAGGAGGHGGAALTSIQQGGAGGAGGNGGLLFGSAGAGGAGGSGANALGAGTGGTGGD
+ GGHAGVFGNGGDGGAGGFGAGTGGSGGVGGNAVLIGNGGNGGNAGKAGATPGAGGTGG
+ LLLGENGLNGLP"
+ gene complement(334697..337330)
+ /gene="PE_PGRS3"
+ /locus_tag="BQ2027_MB0286C"
+ CDS complement(334697..337330)
+ /gene="PE_PGRS3"
+ /locus_tag="BQ2027_MB0286C"
+ /note="Mb0286c, PE_PGRS3, len: 877 aa. Equivalent to
+ Rv0278c, len: 957 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (). Member of the Mycobacterium tuberculosis
+ PE family, PGRS subfamily of gly-rich proteins, similar to
+ many e.g. Z95890|MTCY28_25|Rv1759c from Mycobacterium
+ tuberculosis (914 aa), FASTA scores: opt: 3849, E(): 0,
+ (67.8% identity in 903 aa overlap). Contains PS00583 pfkB
+ family of carbohydrate kinases signature 1.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, 2
+ deletions, one of 18 bp and the other of 66 bp, and part
+ of a 2780 bp insertion, leads to a shorter product with a
+ different 3' end compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (877 aa versus 957 aa). Mb0286c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PE-PGRS FAMILY PROTEIN"
+ /protein_id="CAB5247992.1"
+ /translation="MSFVIAAPEVIAAAATDLASLGSSISAANAAAAANTTALMAAGA
+ DEVSTAIAALFGAHGQAYQALSAQAQAFHAQFVQALTSGGGAYAAAEAAAVSPLLDPI
+ NEFFLANTGRPLIGNGANGAPGTGANGGDGGWLIGNGGAGGSGAAGVNGGAGGNGGAG
+ GLIGNGGAGGAGGVASSGIGGSGGAGGNAMLFGAGGAGGAGGGVVALTGGAGGFTNGS
+ ALGGAGGAGGAGGLFATGGVGGSGGAGSSGGAGGAGGAGGLFGAGGTGGHGGFADSSF
+ GGVGGAGGAGGLFGAGGEGGSGGHSLVAGGDGGAGGNAGMLALGAAGGAGGIGGDGGT
+ LTAGGIGGAGGAGGNAGLLFGSGGSGGAGGFGFADGGQGGPGGNAGTVFGSGGAGGNG
+ GVGQGFAGGIGGAGGTPGLIGNGGNGGNGGASAVTGGNGGIGGTGVLIGNGGNGGSGG
+ IGAGKAGVGGVSGLLLGLDGFNAPASTSPLHTLQQNVLNVVNEPFQTLTGRPLIGNGA
+ NGTPGTGADGGAGGWLFGNGGNGGSGATGTNGGDGGDGGAGGIFFGTGGTGGAGGVGT
+ TGTGGDGGAGGAAFLVGSGGNGGSGGAGLTAGGDGGDGGNAGSFFGAAGTGGAGASTK
+ AGGTGGTGGNGGLFANGGAGGSGGLGGDAGTGGAGGNGGLFGAGGTGGAGGSLGPGAG
+ GAGGNGGLFGAGGTGGSGGHGTPAAVPGGAGGAGGNAGLFSLGASGGAGGSGGSSLTD
+ SGGIGGVGGAGGLLFGYGGAGGAGGYSNIGAGGAGGAGGNAGMLSGSGGSGGTGGASG
+ AAKGGVGGNGGTAGVFGNGGDGGAGGFGAGTGGNGGVGGNAVLIGNGGNGGNGGKAGG
+ TPGAGGTSGLLIGENGLNGLP"
+ gene complement(337580..340075)
+ /gene="PE_PGRS4"
+ /locus_tag="BQ2027_MB0287C"
+ CDS complement(337580..340075)
+ /gene="PE_PGRS4"
+ /locus_tag="BQ2027_MB0287C"
+ /note="Mb0287c, PE_PGRS4, len: 831 aa. Equivalent to
+ Rv0279c, len: 837 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (97.4% identity in 837 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, similar to many e.g.
+ Z95890|MTCY28_25|Rv0278c from Mycobacterium tuberculosis
+ (914 aa), FASTA scores: opt: 2677, E(): 0, (64.5% identity
+ in 926 aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, 2 deletions each of 9 bp (ccgccggcg-*
+ and cccgccggc-*), leads to a shorter product compared to
+ its homolog in Mycobacterium tuberculosis strain H37Rv
+ (831 aa versus 837 aa). Protein product from Mb0287c
+ detected using shotgun mass spectrometry. Mb0287c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs4"
+ /protein_id="CAB5247993.1"
+ /translation="MSFVIAAPEVIAAAATDLASLESSIAAANAAAAANTTALLAAGA
+ DEVSTAVAALFGAHGQAYQALSAQAQAFHAQFVQALTSGGGAYAAAEAAATSPLLAPI
+ NEFFLANTGRPLIGNGANGAPGTGADGAPGGWLIGNGGAGGSGAAGVNGGAGGNGGAG
+ GLIGNGGAGGAGGRASTGTGGAGGAAGMLFGAAGVGGPGGFAAAFGATGGAGGAGGNG
+ GLFADGGVGGAGGATDAGTGGAGGSGGNGGLFGAGGTGGPGGFGIFGGGAGGDGGSGG
+ LFGAGGTGGSGGTSIINVGGNGGAGGDAGMLSLGAAGGAGGSGGSSPDGGGGAGGIGG
+ DGGTLFGSGGAGGVGGLGFDAGGAGGAGGKAGLLSGAGGAGGAGGGSFAGAGGTGGAG
+ GAPGLVGNAGNGGNGGASANGAGAAGGAGGSGVLIGNGGNGGSGGTGAPAGTAGAGGL
+ GGQLLGRDGFNAPASTPLHTLQQQILNAINEPTQALTGRPLIGNGANGTPGTGADGGA
+ GGWLFGNGGNGGHGATGADGGDGGSGGAGGILSGIGGTGGSGGIGTTGQGGTGGTGGA
+ ALLIGSGGTGGSGGFGLDTGGAGGRGGDAGLFLGAAGTGGQAALSQNFIGAGGTAGAG
+ GTGGLFANGGAGGFGANGGTGGNGLLFGAGGTGGAGTLGADGGAGGHGGLFGAGGTGG
+ AGGSSGGTFGGNGGSGGNAGLLALGASGGAGGSGGSALNVGGTGGVGGNGGSGGSLFG
+ FGGAGGTGGSSGIGSSGGTGGDGGTAGVFGNGGDGGAGGFGTGAGGTGGTGGNAVLIG
+ NGGNGGNGGKAGGTPGAGGTSGLIIGENGLNGL"
+ gene 340366..341976
+ /gene="PPE3"
+ /locus_tag="BQ2027_MB0288"
+ CDS 340366..341976
+ /gene="PPE3"
+ /locus_tag="BQ2027_MB0288"
+ /note="Mb0288, PPE3, len: 536 aa. Equivalent to Rv0280,
+ len: 536 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 536 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family, similar to others
+ e.g. Z80108|MTCY21B4_4|Rv0453 from Mycobacterium
+ tuberculosis (539 aa), FASTA scores: opt: 1131, E(): 0,
+ (51.7% identity in 540 aa overlap). Protein product from
+ Mb0288 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0288 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe3"
+ /protein_id="CAB5247994.1"
+ /translation="MTLWMASPPEVHSALLSSGPGPGSVLSAAGVWSSLSAEYAAVAD
+ ELIGLLGAVQTGAWQGPSAAAYVAAHAPYLAWLMRASETSAEAAARHETVAAAYTTAV
+ AAMPTLVELAANHTLHGVLVATNFFGINTIPIALNEADYARMWTQAASTMATYQAVAE
+ AAVASAPQTTPAPPILAAEAADDDHDHDHDHGGEPTPLDYLVAEILRIISGGRLIWDP
+ AEGTMNGIPFEDYTDAAQPIWWVVRAIEFSKDFETFVQELFVNPVEAFQFYFELLLFD
+ YPTHIVQIVEALSQSPQLLAVALGSVISNLGAVTGFAGLSGLAGMQPAAIPALAPVAA
+ APPTLPAVAMAPTMAAPGAAVASAAAPASAPAASTVASATPAPPPAPGAAGFGYPYAI
+ APPGIGFGSGMSASASAQRKAPQPDSAAAAAAAAAVRDQARARRRRRVTRRGYGDEFM
+ DMNIDVDPDWGPPPGEDPVTSTVASDRGAGHLGFAGTARREAVADAAGMTTLAGDDFG
+ DGPTTPMVPGSWDPDRDAPGSAEPGDRG"
+ gene 342000..342908
+ /locus_tag="BQ2027_MB0289"
+ CDS 342000..342908
+ /locus_tag="BQ2027_MB0289"
+ /note="Mb0289, -, len: 302 aa. Equivalent to Rv0281, len:
+ 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 302 aa overlap). Conserved
+ hypothetical protein; member of Mycobacterium tuberculosis
+ protein family that includes Rv0726c, Rv0731c, Rv3399,
+ Rv1729c, etc. MTCY31_23 (325 aa), FASTA scores: opt: 1386,
+ E(): 0, (69. 1% identity in 301 aa overlap). Contains
+ possible N-terminal signal sequence. Protein product from
+ Mb0289 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0289 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible s-adenosylmethionine-dependent
+ methyltransferase"
+ /protein_id="CAB5247995.1"
+ /translation="MRTEGDSWDITTSVGSTALFVATARALEAQKSDPLVVDPYAEAF
+ CRAVGGSWADVLDGKLPDHKLKSTDFGEHFVNFQGARTKYFDEYFRRAAAAGARQVVI
+ LAAGLDSRAYRLPWPDGTTVFELDRPQVLDFKREVLASHGAQPRALRREIAVDLRDDW
+ PQALRDSGFDAAAPSAWIAEGLLIYLPATAQERLFTGIDALAGRRSHVAVEDGAPMGP
+ DEYAAKVEEERAAIAEGAEEHPFFQLVYNERCAPAAEWFGERGWTAVATLLNDYLEAV
+ GRPVPGPESEAGPMFARNTLVSAARV"
+ gene 343132..345027
+ /gene="ecca3"
+ /locus_tag="BQ2027_MB0290"
+ CDS 343132..345027
+ /gene="ecca3"
+ /locus_tag="BQ2027_MB0290"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0290, -, len: 631 aa. Equivalent to Rv0282, len:
+ 631 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 631 aa overlap). Conserved hypothetical
+ protein, similar to Y14967|MLCB628.18c hypothetical
+ protein from Mycobacterium leprae (573 aa), FASTA scores:
+ opt: 916, E(): 0, (38.7% identity in 568 aa overlap). Also
+ similar to Mycobacterium tuberculosis proteins e.g.
+ Z94121|MTY15F10.26 (619 aa), FASTA scores: opt: 743, E():
+ 0, (29.9% identity in 612 aa overlap). Member of CFXQ,
+ CBXP family - 9 members in Mycobacterium tuberculosis.
+ Contains PS00017 ATP/GTP-binding site motif A (P-loop).
+ Protein product from Mb0290 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0290 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component ecca3. esx-3 type vii
+ secretion system protein."
+ /protein_id="CAB5247996.1"
+ /translation="MAGVGAGDSGGVERDDIGMVAASPVASRVNGKVDADVVGRFATC
+ CRALGIAVYQRKRPPDLAAARSGFAALTRVAHDQCDAWTGLAAAGDQSIGVLEAASRT
+ ATTAGVLQRQVELADNALGFLYDTGLYLRFRATGPDDFHLAYAAALASTGGPEEFAKA
+ NHVVSGITERRAGWRAARWLAVVINYRAERWSDVVKLLTPMVNDPDLDEAFSHAAKIT
+ LGTALARLGMFAPALSYLEEPDGPVAVAAVDGALAKALVLRAHVDEESASEVLQDLYA
+ AHPENEQVEQALSDTSFGIVTTTAGRIEARTDPWDPATEPGAEDFVDPAAHERKAALL
+ HEAELQLAEFIGLDEVKRQVSRLKSSVAMELVRKQRGLTVAQRTHHLVFAGPPGTGKT
+ TIARVVAKIYCGLGLLKRENIREVHRADLIGQHIGETEAKTNAIIDSALDGVLFLDEA
+ YALVATGAKNDFGLVAIDTLLARMENDRDRLVVIIAGYRADLDKFLDTNEGLRSRFTR
+ NIDFPSYTSHELVEIAHKMAEQRDSVFEQSALHDLEALFAKLAAESTPDTNGISRRSL
+ DIAGNGRFVRNIVERSEEEREFRLDHSEHAGSGEFSDEELMTITADDVGRSVEPLLRG
+ LGLSVRA"
+ gene 345024..346640
+ /gene="eccb3"
+ /locus_tag="BQ2027_MB0291"
+ CDS 345024..346640
+ /gene="eccb3"
+ /locus_tag="BQ2027_MB0291"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0291, -, len: 538 aa. Equivalent to Rv0283, len:
+ 538 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 538 aa overlap). Possible conserved
+ membrane protein, similar to several hypothetical
+ mycobacterial proteins e.g. Z94121|MTY15F10_16|Rv3895c
+ from Mycobacterium tuberculosis (495 aa), FASTA scores:
+ opt: 698, E(): 0, (37.6% identity in 492 aa overlap);
+ Rv1782; Rv3450c; Rv3869; and Y14967|MLCB628_16|MLCB628.17c
+ from Mycobacterium leprae (481 aa), FASTA scores: opt:
+ 672, E(): 1.5e-31, (37.2% identity in 506 aa overlap).
+ Contains PS00017 ATP/GTP-binding site motif A (P-loop).
+ Protein product from Mb0291 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0291 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component eccb3. esx-3 type vii
+ secretion system protein. possible membrane protein."
+ /protein_id="CAB5247997.1"
+ /translation="MTNQQHDHDFDHDRRSFASRTPVNNNPDKVVYRRGFVTRHQVTG
+ WRFVMRRIAAGIALHDTRMLVDPLRTQSRAVLMGVLIVITGLIGSFVFSLIRPNGQAG
+ SNAVLADRSTAALYVRVGEQLHPVLNLTSARLIVGRPVSPTTVKSTELDQFPRGNLIG
+ IPGAPERMVQNTSTDANWTVCDGLNAPSRGGADGVGVTVIAGPLEDTGARAAALGPGQ
+ AVLVDSGAGTWLLWDGKRSPIDLADHAVTSGLGLGADVPAPRIIASGLFNAIPEAPPL
+ TAPIIPDAGNPASFGVPAPIGAVVSSYALKDSGKTISDTVQYYAVLPDGLQQISPVLA
+ AILRNNNSYGLQQPPRLGADEVAKLPVSRVLDTRRYPSEPVSLVDVTRDPVTCAYWSK
+ PVGAATSSLTLLAGSALPVPDAVHTVELVGAGNGGVATRVALAAGTGYFTQTVGGGPD
+ APGAGSLFWVSDTGVRYGIDNEPQGVAGGGKAVEALGLNPPPVPIPWSVLSLFVPGPT
+ LSRADALLAHDTLVPDSRPARPVSAEGGYR"
+ gene 346637..350629
+ /gene="eccc3"
+ /locus_tag="BQ2027_MB0292"
+ CDS 346637..350629
+ /gene="eccc3"
+ /locus_tag="BQ2027_MB0292"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0292, -, len: 1330 aa. Equivalent to Rv0284, len:
+ 1330 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 1330 aa overlap). Possible conserved
+ membrane protein, similar to products of two adjacent
+ Mycobacterium leprae genes, MLCB628.16c (744 aa) and
+ MLCB628.15c (597 aa); and throughout its length to several
+ large Mycobacterium tuberculosis proteins: Rv3447c,
+ Rv3870, Rv1784, etc. Y14967|MLCB628_ 15 (744 aa), FASTA
+ scores: opt: 942, E(): 0, (33.8% identity in 730 aa
+ overlap); Y14967|MLCB628_14 (597 aa), FASTA scores: opt:
+ 613, E(): 3.1e-30, (31.7% identity in 615 aa overlap);
+ Z94121|MTY15F10_17 (1396 aa), FASTA scores: opt: 652, E():
+ 2.2e-32, (35.4% identity in 1321 aa overlap);
+ Z95389|MTCY77_19 (1236 aa), FASTA scores: opt 652, E():
+ 2.2e-32, (35.4% identity in 1321 aa overlap). Contains
+ three PS00017 ATP/GTP-binding site motif A (P-loop).
+ Protein product from Mb0292 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0292 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component eccc3. esx-3 type vii
+ secretion system protein. possible membrane protein."
+ /protein_id="CAB5247998.1"
+ /translation="MSRLIFEARRRLAPPSSHQGTIIIEAPPELPRVIPPSLLRRALP
+ YLIGILIVGMIVALVATGMRVISPQTLFFPFVLLLAATALYRGNDKKMRTEEVDAERA
+ DYLRYLSVVRDNIRAQAAEQRASALWSHPDPTALASVPGSRRQWERDPHDPDFLVLRA
+ GRHTVPLATTLRVNDTADEIDLEPVSHSALRSLLDTQRSIGDVPTGIDLTKVSRITVL
+ GERAQVRAVLRAWIAQAVTWHDPTVLGVALAARDLEGRDWNWLKWLPHVDIPGRLDAL
+ GPARNLSTDPDELIALLGPVLADRPAFTGQPTDALRHLLIVVDDPDYDLGASPLAVGR
+ AGVTVVHCSASAPHREQYSDPEKPILRVAHGAIERWQTGGWQPYIDAADQFSADEAAH
+ LARRLSRWDSNPTHAGLRSAATRGASFTTLLGIEDASRLDVPALWAPRRRDEELRVPI
+ GVTGTGEPLMFDLKDEAEGGMGPHGLMIGMTGSGKSQTLMSILLSLLTTHSAERLIVI
+ YADFKGEAGADSFRDFPQVVAVISNMAEKKSLADRFADTLRGEVARREMLLREAGRKV
+ QGSAFNSVLEYENAIAAGHSLPPIPTLFVVADEFTLMLADHPEYAELFDYVARKGRSF
+ RIHILFASQTLDVGKIKDIDKNTAYRIGLKVASPSVSRQIIGVEDAYHIESGKEHKGV
+ GFLVPAPGATPIRFRSTYVDGIYEPPQTAKAVVVQSVPEPKLFTAAAVEPDPGTVIAD
+ TDEQEPADPPRKLIATIGEQLARYGPRAPQLWLPPLDETIPLSAALARAGVGPRQWRW
+ PLGEIDRPFEMRRDPLVFDARSSAGNMVIHGGPKSGKSTALQTFILSAASLHSPHEVS
+ FYCLDYGGGQLRALQDLAHVGSVASALEPERIRRTFGELEQLLLSRQQREVFRDRGAN
+ GSTPDDGFGEVFLVIDNLYGFGRDNTDQFNTRNPLLARVTELVNVGLAYGIHVIITTP
+ SWLEVPLAMRDGLGLRLELRLHDARDSNVRVVGALRRPADAVPHDQPGRGLTMAAEHF
+ LFAAPELDAQTNPVAAINARYPGMAAPPVRLLPTNLAPHAVGELYRGPDQLVIGQREE
+ DLAPVILDLAANPLLMVFGDARSGKTTLLRHIIRTVREHSTADRVAFTVLDRRLHLVD
+ EPLFPDNEYTANIDRIIPAMLGLANLIEARRPPAGMSAAELSRWTFAGHTHYLIIDDV
+ DQVPDSPAMTGPYIGQRPWTPLIGLLAQAGDLGLRVIVTGRATGSAHLLMTSPLLRRF
+ NDLQATTLMLAGNPADSGKIRGERFARLPAGRAILLTDSDSPTYVQLINPLVDAAAVS
+ GETQQKGSQS"
+ gene 350626..350934
+ /gene="PE5"
+ /locus_tag="BQ2027_MB0293"
+ CDS 350626..350934
+ /gene="PE5"
+ /locus_tag="BQ2027_MB0293"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0293, PE5, len: 102 aa. Equivalent to Rv0285,
+ len: 102 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 102 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family (see first citation
+ below), similar to others e.g. AL0212|MTV012_37 from
+ Mycobacterium tuberculosis (105 aa), FASTA scores: opt:
+ 497, E(): 2.6e-24, (80.4% identity in 102 aa overlap);
+ Z80108|MTCY21B4.03 from Mycobacterium tuberculosis (102
+ aa), FASTA scores: opt: 413, E(): 3.7e-19, (66.7% identity
+ in 102 aa overlap); etc. Mb0293 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe5"
+ /protein_id="CAB5247999.1"
+ /translation="MTLRVVPEGLAAASAAVEALTARLAAAHASAAPVITAVVPPAAD
+ PVSLQTAAGFSAQGVEHAVVTAEGVEELGRAGVGVGESGASYLAGDAAAAATYGVVGG
+ "
+ gene 350937..352478
+ /gene="PPE4"
+ /locus_tag="BQ2027_MB0294"
+ CDS 350937..352478
+ /gene="PPE4"
+ /locus_tag="BQ2027_MB0294"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0294, PPE4, len: 513 aa. Equivalent to Rv0286,
+ len: 513 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 513 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family, similar to others
+ e.g. AL0212|MTV012_32 from Mycobacterium tuberculosis (434
+ aa), FASTA scores: opt: 958, E(): 0, (43.5% identity in
+ 522 aa overlap). Protein product from Mb0294 detected
+ using SWATH mass spectrometry. Mb0294 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe4"
+ /protein_id="CAB5248000.1"
+ /translation="MAAPIWMASPPEVHSALLSNGPGPGSLVAAATAWSQLSAEYAST
+ AAELSGLLGAVPGWAWQGPSAEWYVAAHLPYVAWLTQASADAAGAAAQHEAAAAAYTT
+ ALAAMPTLAELAANHVIHTVLVATNFFGINTIPITLNEADYVRMWLQAAAVMGLYQAA
+ SGAALASAPRTVPAPTVMNPGGGAASTVGAVNPWQWLLALLQQLWNAYTGFYGWMLQL
+ IWQFLQDPIGNSIKIIIAFLTNPIQALITYGPLLFALGYQIFFNLVGWPTWGMILSSP
+ FLLPAGLGLGLAAIAFLPIVLAPAVIPPASTPLAAAAVAAGSVWPAVSMAVTGAGTAG
+ AATPAAGAAPSAGAAPAPAAPATASFAYAVGGSGDWGPSLGPTVGGRGGIKAPAATVP
+ AAAAAAATRGQSRARRRRRSELRDYGDEFLDMDSDSGFGPSTGDHGAQASERGAGTLG
+ FAGTATKERRVRAVGLTALAGDEFGNGPRMPMVPGTWEQGSNEPEAPDGSGRGGGDGL
+ PHDSK"
+ gene 352527..352820
+ /gene="esxG"
+ /locus_tag="BQ2027_MB0295"
+ CDS 352527..352820
+ /gene="esxG"
+ /locus_tag="BQ2027_MB0295"
+ /standard_name="TB9.8"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0295, esxG, len: 97 aa. Equivalent to Rv0287,
+ len: 97 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 97 aa overlap). esxG, conserved
+ hypothetical protein. PE-family related protein; distant
+ member of the Mycobacterium tuberculosis PE family,
+ similar to Rv3020c|AL0212|MTV012.34 (97 aa), FASTA scores:
+ opt: 564, E(): 0, (91.8% identity in 97 aa overlap).
+ Contains probable helix-turn-helix motif at aa 14-35
+ (Score 144, +4.11 SD). SEEMS TO BELONG TO THE ESAT6 FAMILY
+ (see third citation below). Protein product from Mb0295
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0295 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ESAT-6-like protein EsxG"
+ /protein_id="CAB5248001.1"
+ /translation="MSLLDAHIPQLVASQSAFAAKAGLMRHTIGQAEQAAMSAQAFHQ
+ GESSAAFQAAHARFVAAAAKVNTLLDVAQANLGEAAGTYVAADAAAASTYTGF"
+ gene 352850..353140
+ /gene="esxH"
+ /locus_tag="BQ2027_MB0296"
+ CDS 352850..353140
+ /gene="esxH"
+ /locus_tag="BQ2027_MB0296"
+ /standard_name="cfp7; TB10.4"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0296, esxH, len: 96 aa. Equivalent to Rv0288,
+ len: 96 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 96 aa overlap). esxH (alternate gene
+ name: TB10.4), low molecular weight protein antigen 7 (10
+ kDa antigen) (CFP-7) (Protein TB10.4) (see citations
+ below), ala-rich protein; member of mycobacterial protein
+ family containing ESAT-6, very similar to MTV012_33 from
+ Mycobacterium tuberculosis (96 aa), FASTA scores: opt:
+ 566, E(): 0, (84.4% identity in 96 aa overlap).
+ Alternative start codon possible position 351878 (see
+ second citation). BELONG TO THE ESAT6 FAMILY (see first,
+ sixth and seventh citations below). Protein product from
+ Mb0296 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0296 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="low molecular weight protein antigen 7 esxh (10
+ kda antigen) (cfp-7) (protein tb10.4)"
+ /protein_id="CAB5248002.1"
+ /translation="MSQIMYNYPAMLGHAGDMAGYAGTLQSLGAEIAVEQAALQSAWQ
+ GDTGITYQAWQAQWNQAMEDLVRAYHAMSSTHEANTMAMMARDTAEAAKWGG"
+ gene 353151..354038
+ /gene="espg3"
+ /locus_tag="BQ2027_MB0297"
+ CDS 353151..354038
+ /gene="espg3"
+ /locus_tag="BQ2027_MB0297"
+ /note="Mb0297, -, len: 295 aa. Equivalent to Rv0289, len:
+ 295 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 295 aa overlap). Conserved
+ hypothetical protein, equivalent to CAC32061.1|AL583926
+ possible DNA-binding protein from Mycobacterium leprae
+ (289 aa); and showing some similarity to
+ Rv3866|G70656|CAB06238.1|Z94121|MTCY15F10.23 from
+ Mycobacterium tuberculosis (276 aa), FASTA scores: opt:
+ 149, E(): 0.0035, (27.7% identity in 289 aa overlap).
+ Protein product from Mb0297 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0297 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx-3 secretion-associated protein espg3"
+ /protein_id="CAB5248003.1"
+ /translation="MDATPNAVELTVDNAWFIAETIGAGTFPWVLAITMPYSDAAQRG
+ AFVDRQRDELTRMGLLSPQGVINPAVADWIKVVCFPDRWLDLRYVGPASADGACELLR
+ GIVALRTGTGKTSNKTGNGVVALRNAQLVTFTAMDIDDPRALVPILGVGLAHRPPARF
+ DEFSLPTRVGARADERLRSGVPLGEVVDYLGIPASARPVVESVFSGPRSYVEIVAGCN
+ RDGRHTTTEVGLSIVDTSAGRVLVSPSRAFDGEWVSTFSPGTPFAIAVAIQTLTACLP
+ DGQWFPGQRVSRDFSTQSS"
+ gene 354085..355503
+ /gene="eccd3"
+ /locus_tag="BQ2027_MB0298"
+ CDS 354085..355503
+ /gene="eccd3"
+ /locus_tag="BQ2027_MB0298"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0298, -, len: 472 aa. Equivalent to Rv0290, len:
+ 472 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 472 aa overlap). Probable conserved
+ transmembrane protein, similar to several others in
+ mycobacteria e.g. Z95389|MTCY77_20|Rv3887c from
+ Mycobacterium tuberculosis (467 aa), FASTA scores: opt:
+ 429, E(): 5.1e-19, (28. 6% identity in 479 aa overlap);
+ Rv3877; Rv1795; Rv3448; and Y14967|MLCB628_9|MLCB628.10c
+ from Mycobacterium leprae (480 aa), FASTA scores: opt:
+ 269, E(): 3.1e-09, (26.0% identity in 503 aa overlap).
+ TBparse score is 0.892. Protein product from Mb0298
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0298 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component eccd3. esx-3 type vii
+ secretion system protein. probable transmembrane protein."
+ /protein_id="CAB5248004.1"
+ /translation="MSGTVMQIVRVAILADSRLTEMALPAELPLREILPAVQRLVVPS
+ AQNGDGGQADSGAAVQLSLAPVGGQPFSLDASLDTVGVVDGDLLVLQPVPAGPAAPGI
+ VEDIADAAMIFSTSRLKPWGIAHIQRGALAAVIAVALLATGLTVTYRVATGVLAGLLA
+ VAGIAVASALAGLLITIRSPRSGIALSIAALVPIGAALALAVPGKFGPAQVLLGAAGV
+ AAWSLIALMIPSAERERVVAFFTAAAVVGASVALAAGAQLLWQLPLLSIGCGLIVAAL
+ LVTIQAAQLSALWARFPLPVIPAPGDPTPSAPPLRLLEDLPRRVRVSDAHQSGFIAAA
+ VLLSVLGSVAIAVRPEALSVVGWYLVAATAAAATLRARVWDSAACKAWLLAQPYLVAG
+ VLLVFYTTTGRYVAAFGAVLVLAVLMLAWVVVALNPGIASPESYSLPLRRLLGLVAAG
+ LDVSLIPVMAYLVGLFAWVLNR"
+ gene 355500..356885
+ /gene="mycp3"
+ /locus_tag="BQ2027_MB0299"
+ CDS 355500..356885
+ /gene="mycp3"
+ /locus_tag="BQ2027_MB0299"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0299, -, len: 461 aa. Equivalent to Rv0291, len:
+ 461 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 461 aa overlap). Probable protease
+ precursor (EC 3.4.-.-), similar to several others in
+ mycobacteria e.g. Z94121|MTY15F10_28|Rv1796 from
+ Mycobacterium tuberculosis (446 aa), FASTA scores: opt:
+ 1168, E(): 0, (44.6% identity in 453 aa overlap); Rv3886c;
+ Rv3883c; Rv3449; and Y14967|MLCB628_4|MLCB628.04 from
+ Mycobacterium leprae (446 aa), FASTA scores: opt: 1159,
+ E(): 0, (43.5 identity in 446 aa overlap). Has signal
+ sequence and hydrophobic stretch at C-terminus, followed
+ by short positively charged segment, that could act as
+ membrane anchor. Shows similarity to several members of
+ the subtilase family and contains PS00137 Serine
+ proteases, subtilase family, histidine active site
+ signature. Protein product from Mb0299 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0299 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable membrane-anchored mycosin mycp3 (serine
+ protease) (subtilisin-like protease) (subtilase-like)
+ (mycosin-3)"
+ /protein_id="CAB5248005.1"
+ /translation="MIRAAFACLAATVVVAGWWTPPAWAIGPPVVDAAAQPPSGDPGP
+ VAPMEQRGACSVSGVIPGTDPGVPTPSQTMLNLPAAWQFSRGEGQLVAIIDTGVQPGP
+ RLPNVDAGGDFVESTDGLTDCDGHGTLVAGIVAGQPGNDGFSGVAPAARLLSIRAMST
+ KFSPRTSGGDPQLAQATLDVAVLAGAIVHAADLGAKVINVSTITCLPADRMVDQAALG
+ AAIRYAAVDKDAVIVAAAGNTGASGSVSASCDSNPLTDLSRPDDPRNWAGVTSVSIPS
+ WWQPYVLSVASLTSAGQPSKFSMPGPWVGIAAPGENIASVSNSGDGALANGLPDAHQK
+ LVALSGTSYAAGYVSGVAALVRSRYPGLNATEVVRRLTATAHRGARESSNIVGAGNLD
+ AVAALTWQLPAEPGGGAAPAKPVADPPVPAPKDTTPRNVAFAGAAALSVLVGLTAATV
+ AIARRRREPTE"
+ gene 356882..357877
+ /gene="ecce3"
+ /locus_tag="BQ2027_MB0300"
+ CDS 356882..357877
+ /gene="ecce3"
+ /locus_tag="BQ2027_MB0300"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0300, -, len: 331 aa. Equivalent to Rv0292, len:
+ 331 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 331 aa overlap). Probable conserved
+ transmembrane protein (has two hydrophobic segments at
+ N-terminal end), equivalent to CAC32058.1|AL583926
+ conserved membrane protein from Mycobacterium leprae (339
+ aa). Protein product from Mb0300 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0300
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component ecce3. esx-3 type vii
+ secretion system protein. probable transmembrane protein."
+ /protein_id="CAB5248006.1"
+ /translation="MNPIPSWPGRGRVTLVLLAVVPVALAYPWQSTRDYVLLGVAAAV
+ VIGLFGFWRGLYFTTIARRGLAILRRRRRIAEPATCTRTTVLVWVGPPASDTNVLPLT
+ LIARYLDRYGIRADTIRITSRVTASGDCRTWVGLTVVADDNLAALQARSARIPLQETA
+ QVAARRLADHLREIGWEAGTAAPDEIPALVAADSRETWRGMRHTDSDYVAAYRVSADA
+ ELPDTLPAIRSRPAQETWIALEIAYAAGSSTRYTVAAACALRTDWRPGGTAPVAGLLP
+ QHGNHVPALTALDPRSTRRLDGHTDAPADLLTRLHWPTPTAGAHRAPLTNAVSRT"
+ gene complement(357864..359066)
+ /locus_tag="BQ2027_MB0301C"
+ CDS complement(357864..359066)
+ /locus_tag="BQ2027_MB0301C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0301c, -, len: 400 aa. Equivalent to Rv0293c,
+ len: 400 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 400 aa overlap). Conserved
+ hypothetical protein, similar in C-terminal part to
+ Rv2627c|B70573|MTCY01A10.05|CAB08637.1|Z95387 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (413
+ aa), FASTA scores: opt: 394, E(): 2.1e-17, (31.1% identity
+ in 299 aa overlap). TBparse score is 0.922. Protein
+ product from Mb0301c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0301c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248007.1"
+ /translation="MSGTFTADAIGPPVPIPDVPGADAGAEGLPSRSVLSARQRILVE
+ SSAIADVALRTAVASVLSATVTPAVVANALRHVNEGSERSNLNFYAELAAAHDPAKSF
+ PAPTELPKVTSRPASPLTEWVARGTVDNIAFASGFRAINPTMRQRWSALTANNIVHAQ
+ HWRHRDGPRPTLCVIHGFMGSSYLLNGLFFSLPWYYRSGYDVLLYTLPFHGQRAEKFS
+ PFSGFGYFTSGLSGFAEAMAQAVYDFRSIVDYLRHIGVDRIALTGISLGGYTSALLAS
+ VESRLEAVIPNCPVVMPAKLFDEWFPANKLVKLGLRLTNISRDELIAGLAYHGPLNYR
+ PLLPKDRRMIITGLGDRMAPPEHAVTLWKQWDRCALHWFPGSHLLHVSQLDYLRRMTV
+ FLQGLMFD"
+ gene 359173..359958
+ /gene="tam"
+ /locus_tag="BQ2027_MB0302"
+ CDS 359173..359958
+ /gene="tam"
+ /locus_tag="BQ2027_MB0302"
+ /note="Mb0302, tam, len: 261 aa. Equivalent to Rv0294,
+ len: 261 aa, from Mycobacterium tuberculosis strain H37Rv
+ (100.0% identity in 261 aa overlap). Probable tam,
+ trans-aconitate methyltransferase (EC 2.1.1.-), similar to
+ others e.g. P76145|TAM_ECOLI|7465793|B64906|B1519
+ TRANS-ACONITATE METHYLTRANSFERASE from Escherichia coli
+ strain K12 (252 aa), FASTA scores: opt: 649, E(): 0, (39.3
+ identity in 252 aa overlap). BELONGS TO THE
+ METHYLTRANSFERASE SUPERFAMILY. Protein product from Mb0302
+ detected using SWATH mass spectrometry. Mb0302 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANS-ACONITATE METHYLTRANSFERASE TAM"
+ /protein_id="CAB5248008.1"
+ /translation="MWDPDVYLAFSGHRNRPFYELVSRVGLERARRVVDLGCGPGHLT
+ RYLARRWPGAVIEALDSSPEMVAAAAERGIDATTGDLRDWKPKPDTDVVVSNAALHWV
+ PEHSDLLVRWVDELAPGSWIAVQIPGNFETPSHAAVRALARREPYAKLMRDIPFRVGA
+ VVQSPAYYAELLMDTGCKVDVWETTYLHQLTGEHPVLDWITGSALVPVRERLSDESWQ
+ QFRQELIPLLNDAYPPRADGSTIFPFRRLFMVAEVGGARRSGG"
+ gene complement(359947..360750)
+ /gene="stf0"
+ /locus_tag="BQ2027_MB0303C"
+ CDS complement(359947..360750)
+ /gene="stf0"
+ /locus_tag="BQ2027_MB0303C"
+ /note="Mb0303c, -, len: 267 aa. Equivalent to Rv0295c,
+ len: 267 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 267 aa overlap). Conserved
+ hypothetical protein, showing weak similarity with
+ CAC46877.1|AL591790 CONSERVED HYPOTHETICAL PROTEIN from
+ Sinorhizobium meliloti (213 aa); and
+ NP_104818.1|14023999|BAB50604.1|AP00300 Protein with weak
+ similarity to NodH from Mesorhizobium loti (257 aa).
+ Protein product from Mb0303c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0303c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Sulfotransferase"
+ /protein_id="CAB5248009.1"
+ /translation="MSRAVRPYLVLATQRSGSTLLVESLRATGCAGEPQEFFQYLPST
+ GMAPQPREWFAGVDDDTILQLLDPLDPGTPDTATPVAWREHVRTSGRTPNGVWGGKLM
+ WNQTALLQQRAAQLPDRSGDGLRAAIRDVIGNEPVFVHVHRPDVVSQAVSFWRAVQTQ
+ VWRGHPDPKRDSQAVYHAGAIAHIIRNLRDQENGWRAWFAEEGIDPIDIAYPVLWRNL
+ TAIVASVLDAIGQDPKLAPAPMLERQANQRSDEWVDRYRAEAPRLGLPT"
+ gene complement(360760..362157)
+ /locus_tag="BQ2027_MB0304C"
+ CDS complement(360760..362157)
+ /locus_tag="BQ2027_MB0304C"
+ /note="Mb0304c, -, len: 465 aa. Equivalent to Rv0296c,
+ len: 465 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 465 aa overlap). Probable sulfatase,
+ possibly an aryl-/steryl-sulfatase (EC 3.1.6.-) or a
+ sulfamidase (sulfohydrolase) (sulphamidase) (EC 3.10.1.-).
+ Similar to various hydrolases e.g.
+ AAG41945.1|AF304053_1|AF304053 heparan N-sulfatase from
+ Mus musculus (502 aa);
+ NP_061292.1|6851181|AAF29460.1|AF153827_1|AF153827
+ N-sulfoglucosamine sulfohydrolase (sulfamidase)
+ (sulphamidase) from Mus musculus (502 aa);
+ AAG17206.1|AF217203_1|AF217203 heparan sulfate sulfamidase
+ from Canis familiaris (507 aa); P08842|STS_HUMAN|1360652
+ STERYL-SULFATASE PRECURSOR (EC 3.1.6.2) (STEROID
+ SULFATASE) (STERYL-SULFATE SULFOHYDROLASE) (ARYLSULFATASE
+ C) (ASC) from Homo sapiens (583 aa); ARSB_FELCA|P33727
+ arylsulfatase B precursor (EC 3.1.6.1) (535 aa), FASTA
+ scores: opt: 231, E(): 1.7e-08, (30.3% identity in 261 aa
+ overlap). Also similarity with 4 others sulfatases in
+ Mycobacterium tuberculosis. Contains sulfatases signature
+ 1 (PS00523). Note that previously known as atsG. Protein
+ product from Mb0304c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0304c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SULFATASE"
+ /protein_id="CAB5248010.1"
+ /translation="MTSERATGQRENLLIVHWHDLGRYLGVYHHPDVYSPRLDRLAAE
+ GILFTRAHATAPLCTPSRGSLFTGRYPQSNGLVGLAHHGWEYRTGVQTLPQLLSESGW
+ YSALFGMQHETSYPKRLGFDEFDVSNSYCEYVVAKAQDWLHNRVPALDGQRFLLTAGF
+ FETHRPYPHERYRPADSAAVELPDYLPDTPEVRQDVAEFYGSIATADEAVGRLLDTLA
+ DTGLDASTWVVFVTDHGPAFPRAKSTLYDAGTGIALIIRPPTRRAMAPRVYDELFSGV
+ DLVPTLLDLLRLEVPADVEGVSHAPALLAPDTENAAVRDHVYTAKTYHDSFDPIRAIR
+ TKEYSYIENYAPRPLLDLPWDIQESPAGMAVAPLVKAPRPQRELYDLRADPTETNNLL
+ AGDDSTQGVAAIAADLAVRLHDWRQRTADVIPSDFAGSRIAERYTETYLRIHRKTPTG
+ RSAIAADRGIDEHCS"
+ gene 362336..364156
+ /gene="PE_PGRS5"
+ /locus_tag="BQ2027_MB0305"
+ CDS 362336..364156
+ /gene="PE_PGRS5"
+ /locus_tag="BQ2027_MB0305"
+ /note="Mb0305, PE_PGRS5, len: 606 aa. Equivalent to
+ Rv0297, len: 591 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (97.5% identity in 606 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to others
+ e.g. Y03A_MYCTU|Q10637 from Mycobacterium tuberculosis
+ (603 aa), FASTA scores: opt: 1884, E(): 0, (53.7% identity
+ in 635 aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 45 bp in-frame insertion leads to a
+ longer product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (606 aa versus 591 aa). Mb0305
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs5"
+ /protein_id="CAB5248011.1"
+ /translation="MSFVIAQPEMIAAAAGELASIRSAINAANAAAAAQTTGVMSAAA
+ DEVSTAVAALFSSHAQAYQAASAQAAAFHAQVVRTLTVDAGAYASAEAANAGPNMLAA
+ VNAPAQALLGRPLIGNGANGAPGTGQAGGDGGLLFGNGGNGGSGAPGQAGGAGGAAGF
+ FGNGGNGGDGGAGANGGAGGTAGWFFGFGGNGGAGGIGVAGINGGLGGAGGDGGNAGF
+ FGNGGNGGMGGAGAAGVNAVNPGLATPVTPAANGGNGLNLVGVPGTAGGGADGANGSA
+ IGQAGGAGGDGGNASTSGGIGIAQTGGAGGAGGAGGDGAPGGNGGNGGSVEHTGATGS
+ SASGGNGATGGNGGVGAPGGAGGNGGHVSGGSVNTAGAGGKGGNGGTGGAGGPGGHGG
+ SVLSGPVGDSGNGGAGGDGGAGVSATDIAGTGGRGGNGGHGGLWIGNGGDGGAGGVGG
+ VGGAGAAGAIGGHGGDGGSVNTPIGGSEAGDGGKGGLGGDGGDGAAGGDGGAGGDGGG
+ RGIFGQFGAGGAGGAGGVGGAGGAGGTGGGGGNGGAIFNAGTPGAAGTGGDGGVGGTG
+ AAGGKGGAGGSGGVNGATGADGAKGLDGATGGKGNNGNPG"
+ gene 364299..364526
+ /locus_tag="BQ2027_MB0306"
+ CDS 364299..364526
+ /locus_tag="BQ2027_MB0306"
+ /note="Mb0306, -, len: 75 aa. Equivalent to Rv0298, len:
+ 75 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 75 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0306 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0306 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Programmed cell death antitoxin YdcD"
+ /protein_id="CAB5248012.1"
+ /translation="MTKEKISVTVDAAVLAAIDADARAAGLNRSEMIEQALRNEHLRV
+ ALRDYTAKTVPALDIDAYAQRVYQANRAAGS"
+ gene 364523..364825
+ /locus_tag="BQ2027_MB0307"
+ CDS 364523..364825
+ /locus_tag="BQ2027_MB0307"
+ /note="Mb0307, -, len: 100 aa. Equivalent to Rv0299, len:
+ 100 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 100 aa overlap). Hypothetical unknown
+ protein. Equivalent to AAK44536.1 from Mycobacterium
+ tuberculosis strain CDC1551 (49 aa) but longer 51 aa.
+ Protein product from Mb0307 detected using SWATH mass
+ spectrometry. Mb0307 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Programmed cell death toxin YdcE"
+ /protein_id="CAB5248013.1"
+ /translation="MIAPGDIAPRRDNEHELYVAVLSNALHRAADTGRVITCPFIPGR
+ VPEDLLAMVVAVEQPNGTLLPELVQWLHVAALGAPLGNAGVAALREAASVVTALLC"
+ gene 364873..365094
+ /gene="vapb2"
+ /locus_tag="BQ2027_MB0308"
+ CDS 364873..365094
+ /gene="vapb2"
+ /locus_tag="BQ2027_MB0308"
+ /note="Mb0308, -, len: 73 aa. Equivalent to Rv0300, len:
+ 73 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 73 aa overlap). Conserved hypothetical
+ protein, similar to
+ Rv1721c|MTCY04C12.06c|Z81360|MTCY4C12_4 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (75
+ aa), FASTA scores: opt: 84, E(): 8.3, (39.5% identity in
+ 38 aa overlap). Protein product from Mb0308 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0308 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb2"
+ /protein_id="CAB5248014.1"
+ /translation="MSDVLIRDIPDDVLASLDAIAARLGLSRTEYIRRRLAQDAQTAR
+ VTVTAADLRRLRGAVAGLGDPELMRQAWR"
+ gene 365091..365516
+ /gene="vapc2"
+ /locus_tag="BQ2027_MB0309"
+ CDS 365091..365516
+ /gene="vapc2"
+ /locus_tag="BQ2027_MB0309"
+ /note="Mb0309, -, len: 141 aa. Equivalent to Rv0301, len:
+ 141 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 141 aa overlap). Conserved
+ hypothetical protein, similar to other hypothetical M.
+ tuberculosis proteins e.g. Rv2757c, Rv0229c, Rv2546, etc.
+ Protein product from Mb0309 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0309 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc2"
+ /protein_id="CAB5248015.1"
+ /translation="MTDQRWLIDKSALVRLTDSPDMEIWSNRIERGLVHITGVTRLEV
+ GFSAECGEIARREFREPPLSAMPVEYLTPRIEDRALEVQTLLADRGHHRGPSIPDLLI
+ AATAELSGLTVLHVDKDFDAIAALTGQKTERLTHRPPSA"
+ gene 365652..366284
+ /locus_tag="BQ2027_MB0310"
+ CDS 365652..366284
+ /locus_tag="BQ2027_MB0310"
+ /note="Mb0310, -, len: 210 aa. Equivalent to Rv0302, len:
+ 210 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 210 aa overlap). Probable transcription
+ regulatory protein, TetR family, with its N-terminus
+ similar to N-terminus of several repressors and regulatory
+ proteins of TetR/AcrR family e.g. ACRR_ECOLI|P34000
+ potential acraB operon repressor from Escherichia coli
+ (215 aa), FASTA scores: opt: 172, E(): 3.1e-05, (22.7%
+ identity in 194 aa overlap). Also similar in N-terminus to
+ N-terminus of MTCY07A7.24 hypothetical regulator from
+ Mycobacterium tuberculosis FASTA score: (38.7% identity in
+ 62 aa overlap). Contains probable helix-turn helix motif
+ from aa 35-56 (Score 1728, +5.07 SD). Mb0310 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY TETR/ACRR-FAMILY)"
+ /protein_id="CAB5248016.1"
+ /translation="MGVPAKKKQQQGERSRESILDATERLMATKGYAATSISDIRDAC
+ GLAPSSIYWHFGSKEGVLAAMMERGAQRFFAAIPTWDEAHGPVEQRSERQLTELVSLQ
+ SQHPDFLRLFYLLSMERSQDPVVAAVVRRVRNTAIARFRDSITHLLPSDIPPGKADLV
+ VAELTAFAVALSDGVYFAGHLEPDTTDVERMYRRLRQALEALIPVLLEET"
+ gene 366281..367189
+ /locus_tag="BQ2027_MB0311"
+ CDS 366281..367189
+ /locus_tag="BQ2027_MB0311"
+ /note="Mb0311, -, len: 302 aa. Equivalent to Rv0303, len:
+ 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 302 aa overlap). Possible
+ dehydrogenase/reductase (EC 1.-.-.-), similar to various
+ NADPH dehydrogenases and other NADPH oxidoreductases e.g.
+ O48741|PORC_ARATH|7488284|T00897 PROTOCHLOROPHYLLIDE
+ REDUCTASE C CHLOROPLAST PRECURSOR (EC 1.3.1.33)
+ (NADPH-PROTOCHLOROPHYLLIDE OXIDOREDUCTASE C) from
+ Arabidopsis thaliana (401 aa); Q42850 NADPH DEHYDROGENASE
+ (EC 1.6.99. 1) (395 aa), FASTA scores: opt: 347, E():
+ 3.8e-16, (35.4% identity in 319 aa overlap). Protein
+ product from Mb0311 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0311 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEHYDROGENASE/REDUCTASE"
+ /protein_id="CAB5248017.1"
+ /translation="MNTGTAVITGASSGLGLQCARALLRRDASWHVVLAVRDPARGRA
+ AMEELGEPNRCSVLEVDLASVRSVRSFVETVRTTPLPPIRALVCNAGLQVVSGIAFTD
+ DGVEMTFGVNHLGHFALVTGILDWLARPARIVVVSSGTHDPSKHTGMPDPRYTCAADL
+ AHPPTDQNTPAEGRRRYTTSKLCNVLFTYELDRRLDHGEQGVMVNAFDPGLMPGSGLA
+ RDYPPILRLAYRLLSPMLRVLPFVHSTRVSGEHLAALAVDPRFAGVTGQYFAGAKAIR
+ SSAESYDRAKALDLWETSERLLAQVT"
+ gene complement(367197..370640)
+ /gene="PPE5"
+ /locus_tag="BQ2027_MB0312C"
+ CDS complement(367197..370640)
+ /gene="PPE5"
+ /locus_tag="BQ2027_MB0312C"
+ /note="Mb0312c, PPE5, len: 1147 aa. Equivalent to 3' end
+ of Rv0304c, len: 2204 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.9% identity in 1147 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family (PPE, MPTR),
+ similar to others e.g. Z95324|MTY13E10_16 from M.
+ tuberculosis (1443 aa), FASTA scores: E(): 0, (50.6%
+ identity in 1403 aa overlap); Y04H_MYCTU|Q10778 from M.
+ tuberculosis (734 aa), FASTA scores: opt: 989, E(): 0,
+ (42.3% identity in 522 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PPE5 and PPE6 exist as separate
+ genes. In Mycobacterium bovis, a frameshift due to a
+ single base deletion (g-*) leads to a shorter CDS
+ (Mb0312c) equivalent to the 3' end of Rv0304c/PPE5."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe5"
+ /protein_id="CAB5248018.1"
+ /translation="MFNSGDGNIGFFNSGTGNFGIGNTGTGNFGIGNSGSTSTGLFNS
+ GDGNTGGFNPGNFNTGNFNTGSFNTGGFNAGNTNTGHFNTGNYNTGIANTGDVSTGAF
+ ISGNYSNGILWRGDYQGLIGYSYALTIPEIPAHLDVNIPIDIPITGSFTDLVVDNFTI
+ PIIGFESFAFSFHIHTEPDIGPIIVPSFVLSVPTFAIAVGGPTTAINISATAGLGPIT
+ IPIIDIPAAPGIGNSTTSPSSGFFNTGAGTASGFGNVGGNTSGLWNLASAASGVSGLL
+ NVGALGSGVANVGNTISGIYNTSPLDLGTPAFGSGLANIAGLLQGGAGTTILDLAGLG
+ NLNVGLANLGGSNFGIGNTGIFNVGFANVGNHNIGLANLGNYSVGFANSGNYHIGIAN
+ TGSANIGFANTGSGNIGIGLTGTGQIGFGSFNSGSHNIGLFNSGDGNVGFFNSGTGNV
+ GIGNTGTANFGIANSGSFNTGLGNTGSTNTSLFNPGNVNTGVGNTGSINTGSFNTGST
+ NTGSFNLGDHNTGSFNSGDYNTGYFNAGDYNTGVANTGNVNTGAFISGNYSNGFFWRG
+ DYQGLIGLSTTITIPEIPYRYDLSVPIDIPITGTVVATTPNSFTIPGFQIRVLLGPAA
+ VLVNEMIGPITIDVNQVIAIDSPIQQTISMVGTGGFGPIPIGISIGGTPGFGNSTTGP
+ SSGFFHTGAGHVSGFGNFGAGNMSGFGNFGAGNSGFFNAGGLGNSGLLNFGALQSGLA
+ NLGNTISGVYNTSTLDLATPAFGSGIANIGANLAGLFLDNTGNLTLNFGVANQGGLNA
+ GIGNLGSVNIGFVNTGDSNLGIGNLGDLNFGGVNIGGNNIGIANTGIFDIGLANLGSY
+ NIGLANLGDDNLGFGNAGSYNIGFANFGSDNLGFANTGSYNIGFANTGNNNIGVGLTG
+ NGQIGIGSLNSGSNNIGLFNSGSGNIGFFNSGTGNVGIFNAGTGNFGLANSGGFNTGI
+ GNAGSTNTGVFNPGDLNTGSFNPGSFNTGGFNPGSGNTGYLNTGDYNTGVANTGDVDT
+ GAFITGSYSNGFLVSGDYQGLIGLPLLGIPVTPGYFNLTGGPSSGFFNSGAGSVSGFV
+ NSGAGLSGYLNTGALGSGVANVGNTISGWLNASALDLATPGFLSGIGNFGTNLAGFFR
+ G"
+ gene complement(370784..376741)
+ /gene="PPE6"
+ /locus_tag="BQ2027_MB0313C"
+ CDS complement(370784..376741)
+ /gene="PPE6"
+ /locus_tag="BQ2027_MB0313C"
+ /note="Mb0313c, PPE6, len: 1985 aa. Equivalent to 5' end
+ of Rv0305c, len: 963 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 809 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family (PPE, MPTR),
+ similar to others e.g. Y04H_MYCTU|Q10778 from M.
+ tuberculosis (734 aa), FASTA scores: opt: 1340, E(): 0,
+ (40.9% identity in 815 aa overlap); Z95324|MTY13E10_16
+ from Mycobacterium tuberculosis (1443 aa), FASTA scores:
+ E(): 0, (50.6% identity in 1403 aa overlap);
+ Y04H_MYCTU|Q10778 from Mycobacterium tuberculosis (734
+ aa), FASTA scores: opt: 989, E(): 0, (42.3% identity in
+ 522 aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, PPE5 and PPE6
+ exist as separate genes. In Mycobacterium bovis, a single
+ base deletion (t-*) resulting in the absence of a stop
+ codon leads to a longer product. The second part of this
+ CDS shares homology with the 5' end of Rv0304c/PPE5.
+ Mb0313c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe6"
+ /protein_id="CAB5248019.1"
+ /translation="MDFVVSAPEVNSLRMYLGAGSGPMLAAAAAWDGLADELAVAASW
+ FGSVTSGLADAAWRGPAAVAMARAVAPYLGWLISATAQAEQAAAQARVAVATFEAARA
+ ATVHPAIVAANRAVLVSLVSSNLLGFNAPAIAATEAAYERMWAQDVAAMVGYHAGASA
+ AVSALMPFTQQLKKLAGLSERLTSAAAAAAGPPSAAGFNLGLANVGANNVGNGNVGVF
+ NVGFGNLGSYNLGFANLGSDNLGLANLGGHNIGFANTGSNNVGFGNTGSNNVGIGLTG
+ NGQIGFGSFNSGSHNIGLFNSGSGNVGLFNSGTGNFGIGNSGTGNFGLGNTGSTNTGW
+ FNTGDVNTGGFNPGSYNTGNFNTGNYNTGSFNAGNYNTGYFNTGDYNTGVANTGNVNT
+ GAFIAGNYSNGVLWRGDYQGLIGADIALEIPAIPINAQLFSMPIHQVMVMPGSVMTIP
+ GMRLPFTSIVPFVVYYGPVELPQSTLTLPTVTITVGGPTTTIDGNLTGMVGGVSIPLI
+ KIPAAPGFGNSTTSPSSGFFNAGAGTASGFGNFGGGASGFWNLASATSGLSGFGNVGA
+ LGSGVANVGNTISGLYNTSTSNLATPAFNSGLLHHSVGTMTLNFGLANVGGNNVGGAN
+ AGIFNVGLANLGDYNIGFGNLGGDNLGFAHAGSYNIGFANTGSNNLGFANTGDNNIGF
+ ANIGSNNIGIGLTGSGQIGFGSLNSGSHNIGLFNSGDGNIGLFNSGSGNFGIGNAGTG
+ NWGIGNSGAGNFGIGNAGSTNTGLFNSGDLNTGSLNPGSYNTGSVNTGSVNTGGFNAG
+ NYNTGYFNTGDYNTGMANTGNINTGAFISGNHSNGLLWRGDNQGLIDLAIGVDIPEIP
+ IVSVDVNIPIHIPITASFTDIVYSGLDLPPNTAVTVIFFGPVDIDPFTVPVIRITGPT
+ PVVMVGGPTTAINIGATVGVDAINIPIIHIPATPGFGNSTGGLSSGFFNSGAGSASGF
+ GNFGGAASGFMNLVSTTSGMSGFLNVGALGSGVANVGNTISGIYNVGTSDLSTPAVNS
+ GLANIGTNIAGLLRDGAGTAAINLGLANHGNLNVGFASLGGFNFGGATIGHNNVGIGN
+ TGIFDVGLANLGSYNIGFGNLGDDNLGFGNFGSYNIGFGNVGNDNLGFANAGGGNIGF
+ ANTGSNNVGFGNTGSNNVGIGLTGNGQIGFGSFNSGSGNIGLFNSGSNNIGFFNSGSG
+ NFGIANSGSFNTGIGNTGNTNTGLFNSGDVNTGAFNPGSFNTGSFNTGSFNTGGFNPG
+ NTNTGYLNIGNYNTGIANTGDVDTGAFITGNYSNGLFLSGDYQGLVGLNLVIDMPLPI
+ SLGVNIPIDIPITASAGNITLMGVTIPPTGDIVLSSIAGQRAHFGPITIPNITVVGPT
+ TTVAIGGPNTAITITGGGAIRIPLISIPAAPGFGNSTTNPSSGFFNTGAGGASGFGNF
+ GGANSGFWNLASATSGASGLLNVGALGSGLANVGTTVSGFYNTSTSDLATPAFNSGLA
+ NISTSIAGLLRDSTGTMVLNLGLANHGTLNVGIANLGDYNIGFANLGSANFGSANIGG
+ NNIGGANTGIFDIGLANLGSYNIGFGNFGDDNLGFGNLGSYNVGFGNLGNDNLGFANT
+ GSNNIGFANTGSNNIGIGLTGDGQIGFGSLNSGSGNIGLFNSGSGNIGFFNSGNGNVG
+ IGNTGTANFGLGNTGSTNTGFFNSGDVNTGIGNTGSFNTGSFNPGDSNTGDFNPGSYN
+ TGLGNTGDVDTGAFISGSYSNGFLWSGNYQGLIGLHAALAIPEIALTFGVDIPIHIPI
+ NIDAGVVTLQGFSIVAAENNIDFTPIIIPTINITLPTAAITVGGPTTSIGITASAGIG
+ SITIPIIDIPATSGFGNSTTSPSSGFFNSGAGSASGFLNVVAGASGISGYLNVGALGS
+ GVTNVGHTVSGFYNASALDLVTPAFASGLMRDGMGTMTLNLGLANLGSNNAGFGNTGI
+ FDVGVANLGNYNIGFGNFGDDNLALPT"
+ gene 376944..377615
+ /locus_tag="BQ2027_MB0314"
+ CDS 376944..377615
+ /locus_tag="BQ2027_MB0314"
+ /note="Mb0314, -, len: 223 aa. Equivalent to Rv0306, len:
+ 223 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 223 aa overlap). Putative
+ oxidoreductase (EC 1.-.-.-), highly similar to
+ H83485|9947208|AAG04663.1|AE004557_4|AE004557 conserved
+ hypothetical protein from Pseudomonas aeruginosa strain
+ PAO1 (218 aa); and to other putative oxidoreductases e.g.
+ middle part of CAB76073.1|AL157953 putative nitroreductase
+ from Streptomyces coelicolor (1212 aa); Q52685|BLUB
+ protein involved in cobalamin (vitamin B12) synthesis from
+ Rhodobacter capsulatus (206 aa), FASTA scores: opt: 318,
+ E(): 2e-15, (35.6% identity in 191 aa overlap). Mb0314
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE OXIDOREDUCTASE"
+ /protein_id="CAB5248020.1"
+ /translation="MFSAPERRAVYRVIAERRDMRRFVPGGVVSEDVLARLLHAAHAA
+ PSVGLMQPWRFIRITDETLKRRIHALVDDERLLTAEALGAREEEFLALKVEGILDCAE
+ LLVVALCDRRGSYIFGRRTLPQMDLASVSCAIQNLWLAARSEGLGMGWVSLFDPQRLA
+ ALLAMPADAEPVAILCLGPVPEFPDRPALELDGWAYARPLAEFVSENRWSYPSALATD
+ HHHGE"
+ gene complement(377603..378085)
+ /locus_tag="BQ2027_MB0315C"
+ CDS complement(377603..378085)
+ /locus_tag="BQ2027_MB0315C"
+ /note="Mb0315c, -, len: 160 aa. Equivalent to Rv0307c,
+ len: 160 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 160 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0315c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0315c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="CAB5248021.1"
+ /translation="MAVIVRKWFGLGRLPADLRCQVEAEGLIYLAEYVAVTRRFTGVI
+ PGLRASHSIASYVGALAFTEQRVLGTLSMVPKLAGRVVDARWDGPQAGAATAEISPTG
+ LQLDLDVADVDPKFSGQLALHFKATIGEDVLSRLPRRSLAFDVPAEYVNLAVGVTYSP
+ "
+ gene 378143..378859
+ /locus_tag="BQ2027_MB0316"
+ CDS 378143..378859
+ /locus_tag="BQ2027_MB0316"
+ /note="Mb0316, -, len: 238 aa. Equivalent to Rv0308, len:
+ 238 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 238 aa overlap). Probable conserved
+ integral membrane protein, with C-terminus highly similar
+ to C-terminus of other integral membrane proteins or
+ phosphatases e.g.
+ AAK25788.1|AF336822_1|13430250|AAK25789.1|AF336823_1
+ putative phosphatase from Streptococcus pyogenes (201 aa);
+ Q06074 HYPOTHETICAL 24.9 KD PROTEIN (216 aa), FASTA
+ scores: opt: 209, E(): 2e-07, (27.9% identity in 140 aa
+ overlap). Could be a phosphatase. Protein product from
+ Mb0316 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0316 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5248022.1"
+ /translation="MTRPQALLAVSLAFVATAVYAVMWVGHSQDWGWLHSFDWSLLNA
+ AHDIGIKNPAWVRFWDGVSLILGPVVLRPLGLLAAMVALAKRKIRIALLLLACLPLNA
+ IMTIAAKSVAHRPRPATALVSAHSTSFPSGHALEATASVLALLTVLLPMLHSRFTRHI
+ AITVGALCVLTVGVARVALNVHHPTDVVAGWALGYLYFLVCLCVFRPPSIFGAQRASH
+ ALSPPVEVSRQPEPEVDTAR"
+ gene 378961..379617
+ /locus_tag="BQ2027_MB0317"
+ CDS 378961..379617
+ /locus_tag="BQ2027_MB0317"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0317, -, len: 218 aa. Equivalent to Rv0309, len:
+ 218 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 218 aa overlap). Possible conserved
+ exported protein (has putative N-terminal signal
+ sequence), equivalent to AC32053.1|AL583926 putative
+ secreted protein from Mycobacterium leprae (218 aa). Also
+ similar to others e.g. AB76092.1|AL157956 putative
+ secreted protein from Streptomyces coelicolor (238 aa).
+ Protein product from Mb0317 detected using SWATH mass
+ spectrometry. Mb0317 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED EXPORTED PROTEIN"
+ /protein_id="CAB5248023.1"
+ /translation="MSRLLALLCAAVCTGCVAVVLAPVSLAVVNPWFANSVGNATQVV
+ SVVGTGGSTAKMDVYQRTAAGWQPLKTGITTHIGSAGMAPEAKSGYPATPMGVYSLDS
+ AFGTAPNPGGGLPYTQVGPNHWWSGDDNSPTFNSMQVCQKSQCPFSTADSENLQIPQY
+ KHSVVMGVNKAKVPGKGSAFFFHTTDGGPTAGCVAIDDATLVQIIRWLRPGAVIAIAK
+ "
+ gene complement(379687..380178)
+ /locus_tag="BQ2027_MB0318C"
+ CDS complement(379687..380178)
+ /locus_tag="BQ2027_MB0318C"
+ /EC_number="4.2.1.106"
+ /note="Mb0318c, -, len: 163 aa. Equivalent to Rv0310c,
+ len: 163 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 163 aa overlap). Conserved
+ hypothetical protein, similar to some bile acid
+ dehydratases e.g.
+ P19412|BAIE_EUBSP|98749|D37844|1381566|AAC45413.1|U57489
+ BILE ACID-INDUCIBLE OPERON PROTEIN E from Eubacterium sp
+ (166 aa), FASTA scores: opt: 302, E(): 1e-11, (38.8%
+ identity in 134 aa overlap); AAF22847.1|AF210152_4 bile
+ acid 7a-dehydratase from Clostridium sp. (168 aa). Protein
+ product from Mb0318c detected using shotgun mass
+ spectrometry. Mb0318c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Bile acid 7-alpha dehydratase BaiE (EC"
+ /protein_id="CAB5248024.1"
+ /translation="MCCNGVVTPGDPADIAAIKQLKYRYLRALDTKHWDDFTDTLAED
+ VTGDYGSSVGTELHFTNRADLVDYLRQALGPGVITEHRVTHPEITVTGDTATGIWYLQ
+ DRVIVAEFNFMLIGAAFYHDQYRRTTDGWRISATGYDRTYEATMSLAGLNFNIRPGRA
+ LAD"
+ gene 380202..381431
+ /locus_tag="BQ2027_MB0319"
+ CDS 380202..381431
+ /locus_tag="BQ2027_MB0319"
+ /note="Mb0319, -, len: 409 aa. Equivalent to Rv0311, len:
+ 409 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 409 aa overlap). Hypothetical unknown
+ protein. Contains PS00881 Protein splicing signature.
+ Protein product from Mb0319 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0319 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="CAB5248025.1"
+ /translation="MSQSRYAGLSRSELAVLLPELLLIGQLIDRSGMAWCIQAFGRQE
+ MLQIAIEEWAGASPIYTKRMQKALNFEGDDVPTIFKGLQLDIGAPPQFMDFRFTLHDR
+ WHGEFHLDHCGALLDVEPMGDDYVVGMCHTIEDPTFDATAIATNPRAQVRPIHRPPRK
+ PADRHPHCAWTVIIDESYPEAEGIPALDAVRETKAATWELDNVDASDDGLVDYSGPLV
+ SDLDFGAFSHSALVRMADEVCLQMHLLNLSFAIAVRKRAKADAQLAISVNTRQLIGVA
+ GLGAERIHRAMALPGGIEGALGVLELHPLLNPAGYVLAETSPDRLVVHNSPAHADGAW
+ ISLCTPASVQPLQAIATAVDPHLKVRISGTDTDWTAELIEADAPASELPEVLVAKVSR
+ GSVFQFEPRRSLPLTVK"
+ gene 381586..383448
+ /locus_tag="BQ2027_MB0320"
+ CDS 381586..383448
+ /locus_tag="BQ2027_MB0320"
+ /note="Mb0320, -, len: 620 aa. Equivalent to Rv0312, len:
+ 620 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 620 aa overlap). Conserved hypothetical
+ protein with highly Pro-, Thr-rich C-terminus. Similar to
+ Pro-,Thr-rich region in Rv2264c|AL021925|MTV022_14 from
+ Mycobacterium tuberculosis (592 aa), FASTA scores: opt:
+ 1075, E(): 0, (38.9% identity in 627 aa overlap). Also
+ some similarity with Rv0350|dnaK from Mycobacterium
+ tuberculosis. Possibly membrane protein; has hydrophobic
+ stetch in its middle part. Protein product from Mb0320
+ detected using SWATH mass spectrometry. Mb0320 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG00821990: molecular chaperone"
+ /protein_id="CAB5248026.1"
+ /translation="MYDPLGLSIGTTNLVAAGNGGPPVTRRAVLTLYPHCAPKIGVPS
+ QNPNLIEPGALMSGFVERIGDAVALVSPDGSVHDPDLLLVEALDAMVLTAGADASSSE
+ IAIAVPAHWKPGAVHALRNGLRTHVGFVRSGMAPRLVSDAIAALTAVNSELGLPHGGV
+ VGLLDFGGSATYVTLVETKSDSRTSDFQPVSATARYQDFSGSQIDQALLLRVIDQFGY
+ GDDVDPASTAAVGQLGQLREQCRAAKERLSTDVATELFAELAGCSSSIEMTREQLEDL
+ IQDPLTGFIYAFDDMLARHNASWADLAAVVTVGGGANIPLVTQRLSFHTRRPVLTASQ
+ PGCAAAMGALLLANRGGERDSRTRTSIGLATAAAAGTSVIELPAGDVMVIDHEALTDR
+ ELAWSQTDFPSEAPARFEGDSYNEGGPCWSMRLNAVEPPKGPAWRRIRVSQLLIGVSA
+ VVAMTAIGGVALTLTAIERRPSPLPTPIVPGLAPMPPGSVVPSSRAPTPPPPPSTVAP
+ LPSAAPAPTTVAPAPPPPTQVVTTTTAPPVTTTPRPSPTTTTTTAPPSTTTTTELPVT
+ TTSTIPTIPTTTTTVKMTTEWLHVPFLPVPIPVPIPQNPGAGEPQNPFGSLGSG"
+ gene 383520..383906
+ /locus_tag="BQ2027_MB0321"
+ CDS 383520..383906
+ /locus_tag="BQ2027_MB0321"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0321, -, len: 128 aa. Equivalent to Rv0313, len:
+ 128 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 128 aa overlap). Conserved
+ hypothetical protein, equivalent only to
+ CAC32049.1|AL583926 conserved hypothetical protein from
+ Mycobacterium leprae (130 aa). TBparse score is 0.877.
+ Protein product from Mb0321 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0321 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248027.1"
+ /translation="MGDYGPFGFDPDEFDRVIREGSEGLRDAFERIGRFLSSSGAGTG
+ WSAIFEDLSRRSRPAPETAGEAGDGVWAIYTVDADGGARVEQVYATELDALRANKDNT
+ DPKRKVRFLPYGIAVSVLDDPVDEAQ"
+ gene complement(383909..384571)
+ /locus_tag="BQ2027_MB0322C"
+ CDS complement(383909..384571)
+ /locus_tag="BQ2027_MB0322C"
+ /note="Mb0322c, -, len: 220 aa. Equivalent to Rv0314c,
+ len: 220 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 220 aa overlap). Possible conserved
+ membrane protein, with hydrophobic stretch from residues
+ ~75-100. Similar in C-terminal part to Mycobacterium
+ tuberculosis proteins Rv0679c and Rv0680c. Mb0322c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5248028.1"
+ /translation="MIVVWEHLCMNPEDDPEARIRELERPLADVARASELGGSQSGGY
+ TYPPGPPPPPYSYGGPFGGPSPRSSSGNRAWWILAAVVVVGVLVLVGGIAAFSAQRLS
+ QGNFVVLSPTPSVSRAVPTPTAQPATTLPPAGASLSVSGVNVNRTIACNDSIVSVSGM
+ SNTVVITGHCTSLTVSGMRNSVTADSVDTIEAAGFNNEVTYHSGSPKISNAGGSNSVQ
+ QG"
+ gene 384632..385516
+ /locus_tag="BQ2027_MB0323"
+ CDS 384632..385516
+ /locus_tag="BQ2027_MB0323"
+ /note="Mb0323, -, len: 294 aa. Equivalent to Rv0315, len:
+ 294 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 294 aa overlap). Possible
+ beta-1,3-glucanase precursor (EC 3.2.1.-) (has hydrophobic
+ stretch in its N-terminal part), similar to others e.g.
+ Q51333|AAC44371.1 BETA-1,3-GLUCANASE II A from Oerskovia
+ xanthineolytica (306 aa), FASTA scores: opt: 76, E():
+ 3e-14, (34.1% identity in 302 aa overlap); and
+ AAC38290.1|AF052745 beta-1,3-glucanase II from Oerskovia
+ xanthineolytica (435 aa). Contains glycosyl hydrolases
+ family 16 active site signature (PS01034). Protein product
+ from Mb0323 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0323 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE BETA-1,3-GLUCANASE PRECURSOR"
+ /protein_id="CAB5248029.1"
+ /translation="MLMPEMDRRRMMMMAGFGALAAALPAPTAWADPSRPAAPAGPTP
+ APAAPAAATGGLLFHDEFDGPAGSVPDPSKWQVSNHRTPIKNPVGFDRPQFFGQYRDS
+ RQNVFLDGNSNLVLRATREGNRYFGGLVHGLWRGGIGTTWEARIKFNCLAPGMWPAWW
+ LSNDDPGRSGEIDLIEWYGNGTWPSGTTVHANPDGTAFETCPIGVDGGWHNWRVTWNP
+ SGMYFWLDYADGIEPYFSVPATGIEDLNEPIREWPFNDPGYTVFPVLNLAVGGSGGGD
+ PATGSYPQEMLVDWVRVF"
+ gene 385565..386179
+ /locus_tag="BQ2027_MB0324"
+ CDS 385565..386179
+ /locus_tag="BQ2027_MB0324"
+ /note="Mb0324, -, len: 204 aa. Equivalent to Rv0316, len:
+ 204 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 204 aa overlap). Possible
+ muconolactone isomerase (EC 5.3.3.-), showing weak
+ similarity with some muconolactone isomerases e.g.
+ O33947|CTC1_ACILW MUCONOLACTONE DELTA-ISOMERASE 1 (MIASE
+ 1)(96 aa), FASTA scores: opt: 179, E(): 3.9e-05, (32.6%
+ identity in 92 aa overlap). Protein product from Mb0324
+ detected using SWATH mass spectrometry. Mb0324 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MUCONOLACTONE ISOMERASE"
+ /protein_id="CAB5248030.1"
+ /translation="MEFLVTMTTRVPDSMPADAVERVRAREAARSRELAAQGKLLRLW
+ RPPLRPGEWRTLGLFAADDNGELEQLLASMPPRSWRTDDVTPLGAHPNDPVGQGITIA
+ PGKGPEFLIATTIMVPPGTPAQVVDDTVAREARRAPELAGRGHLVRLWALPDGPDGQR
+ TLGLWRARDPGELMAILESLPLAGWMTIETTPLSPHPDDPIRMP"
+ gene complement(386203..386973)
+ /gene="glpQ2"
+ /locus_tag="BQ2027_MB0325C"
+ CDS complement(386203..386973)
+ /gene="glpQ2"
+ /locus_tag="BQ2027_MB0325C"
+ /note="Mb0325c, glpQ2, len: 256 aa. Equivalent to Rv0317c,
+ len: 256 aa (start uncertain, chosen by homology), from
+ Mycobacterium tuberculosis strain H37Rv, (100.0% identity
+ in 256 aa overlap). Possible glpQ2, glycerophosphoryl
+ diester phosphodiesterase (EC 3.1.4.46), similar to others
+ e.g. E75317|6459876|AAF11631.1|AE002044_4
+ glycerophosphoryl diester phosphodiesterase from
+ Deinococcus radiodurans (285 aa); P10908|UGPQ_ECOLI from
+ Escherichia coli (247 aa), FASTA scores: opt: 220, E():
+ 5.2e-07, (28.0% identity in 250 aa overlap). Also similar
+ to MTCY01A6.27 from Mycobacterium tuberculosis FASTA
+ score: (27.5% identity in 247 aa overlap). Protein product
+ from Mb0325c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0325c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible glycerophosphoryl diester
+ phosphodiesterase glpq2 (glycerophosphodiester
+ phosphodiesterase)"
+ /protein_id="CAB5248031.1"
+ /translation="MEFLRHGGRIAMAHRGFTSFRLPMNSMGAFQEAAKLGFRYIETD
+ VRATRDGVAVILHDRRLAPGVGLSGAVDRLDWRDVRKAQLGAGQSIPTLEDLLTALPD
+ MRVNIDIKAASAIEPTVNVIERCNAHNRVLIGSFSERRRRRALRLLTKRVASSAGTGA
+ LLAWLTARPLGSRAYAWRMMRDIDCVQLPSRLGGVPVITPARVRGFHAAGRQVHAWTV
+ DEPDVMHTLLDMDVDGIITDRADLLRDVLIARGEWDGA"
+ gene complement(387234..387304)
+ /locus_tag="BQ2027_GLYU"
+ tRNA complement(387234..387304)
+ /locus_tag="BQ2027_GLYU"
+ /product="tRNA-Gly"
+ /note="glyU, len: 71 nt. Equivalent to glyU, len: 71 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 71 nt overlap). tRNA-Gly, anticodon ccc."
+ gene complement(387335..388129)
+ /locus_tag="BQ2027_MB0326C"
+ CDS complement(387335..388129)
+ /locus_tag="BQ2027_MB0326C"
+ /note="Mb0326c, -, len: 264 aa. Equivalent to Rv0318c,
+ len: 264 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 264 aa overlap). Probable conserved
+ integral membrane protein, with some similarity to
+ C-terminus of GUFA_MYXXA|Q06916 (254 aa), FASTA scores:
+ opt: 157, E (): 0.0032, (28.3% identity in 198 aa
+ overlap). Also similar to O26573 CONSERVED PROTEIN from
+ Methanobacterium thermoauto (259 aa), FASTA scores: opt:
+ 173, E(): 5.2e-05, (32.7% identity in 214 aa overlap).
+ Mb0326c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5248032.1"
+ /translation="MSLAVTMFKRARAEIFDRNREVGISNVTTAASLVTFPVLAGILG
+ GVVPSVRTPSAAMVSGVQHFAAGIVMAAVAGEVLPDLRSRGPLWLIVVGFSAGVAVLV
+ ALRRFDGHGEHQDGDDVGELPVGFLTVVAVDLFIDGLLVATGATVSSRTAIIITIALT
+ VEVLFLGLAVALRLAGSGMPRIRAAATTSALSLVIAVGGVSGAVALGRAGNTVLTLVL
+ AFAAAALLWLVVEELLVEAHETPERPWMAVMFFAGFLILYGLGVME"
+ gene 388178..388846
+ /gene="pcp"
+ /locus_tag="BQ2027_MB0327"
+ CDS 388178..388846
+ /gene="pcp"
+ /locus_tag="BQ2027_MB0327"
+ /note="Mb0327, pcp, len: 222 aa. Equivalent to Rv0319,
+ len: 222 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 222 aa overlap). Probable pcp,
+ pyrrolidone-carboxylate peptidase (EC 3.4.19.3), highly
+ similar to others e.g. PCP_PSEFL|P42673
+ pyrrolidone-carboxylate peptidase from Pseudomonas
+ fluorescens (213 aa), FASTA scores: opt: 478, E():
+ 7.5e-25, (40.2% identity in 219 aa overlap). BELONGS TO
+ PEPTIDASE FAMILY C15 (THIOL PROTEASE). Protein product
+ from Mb0327 detected using SWATH mass spectrometry. Mb0327
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PYRROLIDONE-CARBOXYLATE PEPTIDASE PCP
+ (5-OXOPROLYL-PEPTIDASE) (PYROGLUTAMYL-PEPTIDASE I) (PGP-I)
+ (PYRASE)"
+ /protein_id="CAB5248033.1"
+ /translation="MSKVLVTGFGPYGVTPVNPAQLTAEELDGRTIAGATVISRIVPN
+ TFFESIAAAQQAIAEIEPALVIMLGEYPGRSMITVERLAQNVNDCGRYGLADCAGRVL
+ VGEPTDPAGPVAYHATVPVRAMVLAMRKAGVPADVSDAAGTFVCNHLMYGVLHHLAQK
+ GLPVRAGWIHLPCLPSVAALDHNLGVPSMSVQTAVAGVTAGIEAAIRQSADIREPIPS
+ RLQI"
+ gene 388918..389580
+ /locus_tag="BQ2027_MB0328"
+ CDS 388918..389580
+ /locus_tag="BQ2027_MB0328"
+ /note="Mb0328, -, len: 220 aa. Equivalent to Rv0320, len:
+ 220 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 220 aa overlap). Possible conserved
+ exported protein, similar to some hypothetical proteins
+ and to the middle part of a peptidase:
+ NP_066789.1|10657900|AAG21739.1|AF116907 putative
+ peptidase from Rhodococcus equi (546 aa). Also similar to
+ Rv1728c|MTCY04C12.13c from Mycobacterium tuberculosis (256
+ aa), FASTA scores: opt: 497, E(): 1.2e-26, (41.8% identity
+ in 225 aa overlap). Mb0328 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED EXPORTED PROTEIN"
+ /protein_id="CAB5248034.1"
+ /translation="MGRHELARDRRKSSAVLAAVLAPAAVFFATGGDVSTLAARADAN
+ PVLGDDAPCCVQIVPVAPLAFSSQISGGEIGTGLAASQFASASRWRIVSRYLPVGVAP
+ EQGLQVKTVLTARSISAAFPEIREIGGVRPDALRWHPNGLALDVMVPNPGTAEGIALG
+ NEIVAFVLKNATRFGMQDVIWRGAYYTPNGARTTGAGHYDHIHITTVGGGYPTGEELY
+ IR"
+ gene 389612..390184
+ /gene="dcd"
+ /locus_tag="BQ2027_MB0329"
+ CDS 389612..390184
+ /gene="dcd"
+ /locus_tag="BQ2027_MB0329"
+ /note="Mb0329, dcd, len: 190 aa. Equivalent to Rv0321,
+ len: 190 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 190 aa overlap). Probable dcd
+ (alterrnate gene names: dus or paxA), deoxycytidine
+ triphosphate deaminase (EC 3.5.4.13), equivalent to
+ CAC32024.1|AL583925 probable deoxycytidine triphosphate
+ deaminase from Mycobacterium leprae (190 aa). Also highly
+ similar to others e.g.
+ Q9X8W0|DCD_STRCO|7480599|T36613|SCH35.46 DEOXYCYTIDINE
+ TRIPHOSPHATE DEAMINASE from Streptomyces coelicolor (191
+ aa); DCD_ECOLI|P28248|DUS|PAXA|B2065 DEOXYCYTIDINE
+ TRIPHOSPHATE DEAMINASE from Escherichia coli strain K12
+ (193 aa), FASTA scores: opt: 408, E(): 2.7e-21, (43.1%
+ identity in 188 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE DCTP
+ DEAMINASE FAMILY. Protein product from Mb0329 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0329 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEOXYCYTIDINE TRIPHOSPHATE DEAMINASE
+ DCD (DCTP DEAMINASE)"
+ /protein_id="CAB5248035.1"
+ /translation="MLLSDRDLRAEISSGRLGIDPFDDTLVQPSSIDVRLDCLFRVFN
+ NTRYTHIDPAKQQDELTSLVQPVDGEPFVLHPGEFVLGSTLELFTLPDNLAGRLEGKS
+ SLGRLGLLTHSTAGFIDPGFSGHITLELSNVANLPITLWPGMKIGQLCMLRLTSPSEH
+ PYGSSRAGSKYQGQRGPTPSRSCQNFIRST"
+ gene 390290..391621
+ /gene="udgA"
+ /locus_tag="BQ2027_MB0330"
+ CDS 390290..391621
+ /gene="udgA"
+ /locus_tag="BQ2027_MB0330"
+ /note="Mb0330, udgA, len: 443 aa. Equivalent to Rv0322,
+ len: 443 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 443 aa overlap). Probable udg
+ (alternate gene name: rkpK), UDP-glucose 6-dehydrogenase
+ (EC 1.1.1.22), highly similar to others e.g.
+ CAC44517.1|AL596138 putative UDP-glucose 6-dehydrogenase
+ from Streptomyces coelicolor (447 aa); Q56812 UDP-GLUCOSE
+ DEHYDROGENASE from Xanthomonas campestris (445 aa), FASTA
+ scores: opt: 713, E(): 0, (41.9% identity in 351 aa
+ overlap); etc. Also similar to several GDP-mannose
+ 6-dehydrogenase. Contains PS00017 ATP/GTP-binding site
+ motif A (P-loop). BELONGS TO THE UDP-GLUCOSE/GDP-MANNOSE
+ DEHYDROGENASES FAMILY. Mb0330 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE UDP-GLUCOSE 6-DEHYDROGENASE UDGA
+ (UDP-GLC DEHYDROGENASE) (UDP-GLCDH) (UDPGDH)"
+ /protein_id="CAB5248036.1"
+ /translation="MRCSVFGTGYLGATHAVGMAQLGHEVVGVDIDPGKVAKLAGGDI
+ PFYEPGLRKLLTDNLAAGRLRFTTDYDMAADFADVHFLGVGTPQKIGEYGADLRHVHA
+ VIDALVPRLVRASILVGKSTVPVGTAAELGHRAGALAPRGVDVEIAWNPEFLREGFAV
+ HDTLNPDRIVLGVQDDSTRAEVAVRELYAPLLAAGVPFLVTDLQTAELVKVSANAFLA
+ TKISFINAISEVCEAAGADVSQLADALGYDPRIGRQCLNAGLGFGGGCLPKDIRAFMA
+ RAGELGADQALTFLREVDSINMRRRTKMVELATTACGGSLLGANIAVLGAAFKPESDD
+ VRDSPALNVAGQLQLNGATVHVYDPKALDNAHRLFPTLNYAVSVAEACERADAVLVLT
+ EWREFIDLEPADLANRVRARVIVDGRNCLDVTRWRRAGWRVFRLGVPRLGH"
+ gene complement(391610..392281)
+ /locus_tag="BQ2027_MB0331C"
+ CDS complement(391610..392281)
+ /locus_tag="BQ2027_MB0331C"
+ /note="Mb0331c, -, len: 223 aa. Equivalent to Rv0323c,
+ len: 223 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 223 aa overlap). Conserved hypothetical
+ protein, similar to others e.g. YPJG_BACSU|P42981
+ hypothetical 24.8 kd protein from Bacillus subtilis (224
+ aa), FASTA scores: opt: 182, E(): 1.3e-05, (27.5% identity
+ in 211 aa overlap). Also some similarity to MLU15183_8
+ from Mycobacterium tuberculosis FASTA score: (32.0%
+ identity in 147 aa overlap). Mb0331c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Mycothiol conjugate amidase Mca (Mycothiol
+ S-conjugate amidase)"
+ /protein_id="CAB5248037.1"
+ /translation="MNSCNRLPCAHEVLAVFAHPDDESFGLGAVLGDFTAQGTRLRGL
+ CFTHGEASTLGRTDRNLGEVRREELAAAAQVLGVDHVQLLAYPDNGLAQIPLNELTQR
+ VVDALAGADLLLVFDDNGVTGHPDHRRATEAALAAASTPGIPVLAWALPQPIADRLNA
+ EFSASFGGRGHGHLDIMIEVDRSRQLAAIGCHFTQSADNPVLWRRLELLGDREYLRWL
+ RRSVP"
+ gene 392382..393062
+ /locus_tag="BQ2027_MB0332"
+ CDS 392382..393062
+ /locus_tag="BQ2027_MB0332"
+ /note="Mb0332, -, len: 226 aa. Equivalent to Rv0324, len:
+ 226 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 226 aa overlap). Possible
+ transcriptional regulator, arsR family, with its
+ N-terminus similar to the N-terminus of other DNA-binding
+ proteins e.g. P30346|MERR_STRLI probable mercury
+ resistance operon from Streptomyces lividans (125 aa),
+ FASTA scores: opt: 154, E(): 0.002, (32.2% identity in 90
+ aa overlap)), and its C-terminal part similar to
+ hypothetical bacterial proteins e.g. P54510|YQHL_BACSU
+ hypothetical 14.6 kd protein from Bacillus subtilis (126
+ aa), FASTA scores: opt: 159, E(): 0.00097, (35.5% identity
+ in 76 aa overlap)). Most similar to AJ005575|SPE005575_2
+ ORF1 required for antibiotic production from Streptomyces
+ peucetius (226 aa), FASTA scores: opt: 816, E(): 0, (60.7%
+ identity in 211 aa overlap). Also similar in C-terminus to
+ MTCY164.26 molybdopterin biosynthesis moeb protein from
+ Mycobacterium tuberculosis FASTA score: (36.8% identity in
+ 114 aa overlap). Protein product from Mb0332 detected
+ using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY ARSR-FAMILY)"
+ /protein_id="CAB5248038.1"
+ /translation="MAGQSDRKAALLDQVARVGKALANGRRLQILDLLAQGERAVEAI
+ ATATGMNLTTASANLQALKSGGLVEARREGTRQYYRIAGEDVARLFALVQVVADEHLA
+ DVAVAAADVLGSPEDAITRAELLRRREAGEVTLVDVRPHEEYQAGHIPGAINIPIAEL
+ ADRLAELAGDRDIVAYCRGAYCVMAPDAVRIARDAGREVKRLDDGMLEWRLAGLPVDE
+ GAPVGHGD"
+ gene 393069..393758
+ /locus_tag="BQ2027_MB0333"
+ CDS 393069..393758
+ /locus_tag="BQ2027_MB0333"
+ /EC_number="2.1.1.63"
+ /note="Mb0333, -, len: 229 aa. Equivalent to Rv0325 and
+ Rv0326, len: 74 aa and 151 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 74 aa
+ overlap and 100.0% identity in 151 aa overlap).
+ Hypothetical unknown protein.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0325 and Rv0326 exist as 2
+ genes. In Mycobacterium bovis, the absence of a stop codon
+ between Rv0325 and Rv0326 due to a single base transition
+ (t-c) leads to single product. Mb0333 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Methylated-DNA--protein-cysteine
+ methyltransferase (EC"
+ /protein_id="CAB5248039.1"
+ /translation="MGPKGSLRLVKRQPELLVAQHEHWQDTYRAHPVLYGTRPSEPGV
+ YAAEVFNADGVQRVLELAAGHGRDTLYFAGQGFTVVATDFSDVAVAQLRRSAQARGVS
+ ARVQPIVHDLRQPLPVKTGSIDGAFAHMALCMALSTSEIHAVVAEVGRVLRPGGKFIY
+ TVRHTGDAHYGAGQAHGDDIFECAGFAVHFFRRELVARLATGWVLEEVHDFEEGELPR
+ RLWRVTVTKPA"
+ gene complement(393726..395075)
+ /gene="cyp135A1"
+ /locus_tag="BQ2027_MB0334C"
+ CDS complement(393726..395075)
+ /gene="cyp135A1"
+ /locus_tag="BQ2027_MB0334C"
+ /note="Mb0334c, cyp135A1, len: 449 aa. Equivalent to
+ Rv0327c, len: 449 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 449 aa overlap). Possible
+ cyp135A1, cytochrome P450 (EC 1.14.-.-), similar to
+ cytochrome P-450 monoxygenases and other cytochrome P-450
+ related enzymes e.g. FQ12609 PUTATIVE P450 MONOOXYGENASE
+ (EC 1.14.14.1) (506 aa), FASTA scores: opt: 276, E() :
+ 1.7e-11, (27.9% identity in 433 aa overlap). Also similar
+ to other Mycobacterium tuberculosis proteins e.g.
+ MTV039.06|Rv0568 PUTATIVE CYTOCHROME P450 (472 aa);
+ MTCI5.10 cytochrome p450 FASTA score: (30.4% identity in
+ 434 aa overlap). Contains cytochrome P450 cysteine
+ heme-iron ligand signature (PS00086). BELONGS TO THE
+ CYTOCHROME P450 FAMILY. Alternative start possible at
+ 33706 but no RBS."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CYTOCHROME P450 135A1 CYP135A1"
+ /protein_id="CAB5248040.1"
+ /translation="MASTLTTGLPPGPRLPRYLQSVLYLRFREWFLPAMHRKYGDVFS
+ LRVPPYADNLVVYTRPEHIKEIFAADPRSLHAGEGNHILGFVMGEHSVLMTDEAEYAR
+ MRSLLMPAFTRAALRGYRDMIASVAREHITRWRPHATINSLDHMNALTLDIILRVVFG
+ VTDPKVKAELTSRLQQIINIHPAILAGVPYPSLKRMNPWKRFFHNQTKIDEILYREIA
+ SRRIDSDLTARTDVLSRLLQTKDTPTKPLTDAELRDQLITLLLAGHETTAAALSWTLW
+ ELAHAPEIQSQVVWAAVGGDDGFLEAVLKEGMRRHTVIASTARKVTAPAEIGGWRLPA
+ GTVVNTSILLAHASEVSHPKPTEFRPSRFLDGSVAPNTWLPFGGGVRRCLGFGFALTE
+ GAVILQEIFRRFTITAAGPSKGETPLVRNITTVPKHGAHLRLIPQRRLGGLGDSDPP"
+ gene 395141..395743
+ /locus_tag="BQ2027_MB0335"
+ CDS 395141..395743
+ /locus_tag="BQ2027_MB0335"
+ /note="Mb0335, -, len: 200 aa. Equivalent to Rv0328, len:
+ 200 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 200 aa overlap). Possible
+ transcription regulator, tetR/acrR family, similar in part
+ to various hypothetical transcriptional regulators e.g.
+ T36696|4726006|CAB41735.1|AL049731 probable regulatory
+ protein from Streptomyces coelicolor (197 aa). Also some
+ similarity with YX44_MYCTU|Q10829 hypothetical
+ transcriptional regulator from Mycobacterium tuberculosis
+ (195 aa), FASTA scores: opt: 154, E(): 0.00061, (26.7%
+ identity in 202 aa overlap). Contains probable helix-turn
+ helix motif from aa 27-48 (Score 1408, +3.98 SD). SEEMS TO
+ BELONG TO THE TETR/ACRR FAMILY OF TRANSCRIPTIONAL
+ REGULATORS. Protein product from Mb0335 detected using
+ SWATH mass spectrometry. Mb0335 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY TETR/ACRR-FAMILY)"
+ /protein_id="CAB5248041.1"
+ /translation="MQQQRTNRDKLLDGALACLRERGYGNTSSRDIARAAGVNIASIN
+ YHFGSKDALLDDALGRCFSTWNQRVQEAFDHSRAAGPAGQILAVLEATVDSFEQIRPA
+ VYACVESYAPALRSEALRERLAAGYADVRQHSVDLAGAALAGTDIAPPENLSTIVSVL
+ MAVIDGLMIQWIADPSATPRSTEVIRALASIGAVVTSQLR"
+ gene complement(395724..396350)
+ /locus_tag="BQ2027_MB0336C"
+ CDS complement(395724..396350)
+ /locus_tag="BQ2027_MB0336C"
+ /note="Mb0336c, -, len: 208 aa. Equivalent to Rv0329c,
+ len: 208 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 208 aa overlap). Conserved hypothetical
+ protein, showing some similarity with others hypothetical
+ proteins and methyltransferases e.g. MitM|AF127374_14
+ methyltransferase from Streptomyces lavendulae (283 aa),
+ FASTA scores: opt: 242, E(): 1.8e-08, (37.2% identity in
+ 145 aa overlap); Q48938 from Methanosarcina barkeri (262
+ aa), FASTA scores: opt: 194, E(): 3.6e-06, (31.1% identity
+ in 119 aa overlap). Protein product from Mb0336c detected
+ using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="SAM-dependent methyltransferase"
+ /protein_id="CAB5248042.1"
+ /translation="MRLTHPARRYLSSQAARPTGAFGRLLGRIWRAETADVNRIAVEL
+ LAPGPGERVCEIGFGPGRTLGLLAAAGAQVSGVEVSTTMIAIAAHHNAKAIAAGLISL
+ YHGDGVTLPVADHSLDKVLGVHNFYFSPDPRASLCDIARALRPGGRLVLTSISDDQPL
+ AARFDPAIYRVPPTLDTAAWLGAAGFIDVGIKRSADHPATVWFTATAT"
+ gene complement(396377..397117)
+ /locus_tag="BQ2027_MB0337C"
+ CDS complement(396377..397117)
+ /locus_tag="BQ2027_MB0337C"
+ /note="Mb0337c, -, len: 246 aa. Equivalent to Rv0330c,
+ len: 246 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 246 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, AcrR family"
+ /protein_id="CAB5248043.1"
+ /translation="MARSIPADRFSAIVAASARVFIAHGYQRTQVQDVADALALAKGT
+ LYGYAQGKAALFAAAVRYGDAQEALPLASELPVAAPVAGEIAAVVSARLAGEVTDMRL
+ THALRATLPPGATTGDARAELAGIVTDLYSRLARHRIALKLVDRCAPELPDLAEVWFG
+ TGRNAQVDAVQAYLVHRERAGLLILPGPAPMVARTIVELCALWAVHLHFDPSPEPWSI
+ VQPGVIDDDAIAATLAEFVVRATTASSD"
+ gene 397231..398397
+ /locus_tag="BQ2027_MB0338"
+ CDS 397231..398397
+ /locus_tag="BQ2027_MB0338"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0338, -, len: 388 aa. Equivalent to Rv0331, len:
+ 388 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 388 aa overlap). Possible
+ dehydrogenase/reductase (EC 1.-.-.-), similar to various
+ dehydrogenases/reductases e.g.
+ NP_103779.1|14022957|BAB49565.1|AP002999 flavoprotein
+ reductase from Mesorhizobium loti (377 aa); NP_147681.1
+ predicted NAD(FAD)-dependent dehydrogenase from Aeropyrum
+ pernix (381 aa); DHSU_CHRVI|Q06530 sulfide dehydrogenase
+ (431 aa), FASTA scores: opt: 347, E(): 6.8e-15, (25.6%
+ identity in 348 aa overlap). TBparse score is 0.906.
+ Protein product from Mb0338 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0338 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE DEHYDROGENASE/REDUCTASE"
+ /protein_id="CAB5248044.1"
+ /translation="MSKTVLILGAGVGGLTTADTLRQLLPPEDRIILVDRSFDGTLGL
+ SLLWVLRGWRRPDDVRVRPTAASLPGVEMVTATVAHIDIAAQVVHTDNSVIGYDALVI
+ ALGAALNTDAVPGLSDALDADVAGQFYTLDGAAELRAKVEALEHGRIAVAIAGVPFKC
+ PAAPFEAAFLIAAQLGDRYATGTVQIDTFTPDPLPMPVAGPEVGEALVSMLKDHGVGF
+ HPRKALARVDEAARTMHFGDGTSEPFDLLAVVPPHVPSAAARSAGLSESGWIPVDPRT
+ LSTSADNVWAIGDATVLTLPNGKPLPKAAVFAEAQAAVVAHGVARHLGYDVAERHFTG
+ TGACYVETGDHQAAKGDGDFFAPSAPSVTLYPPSREFHEEKVAQELAWLTRWKT"
+ gene 398472..399257
+ /locus_tag="BQ2027_MB0339"
+ CDS 398472..399257
+ /locus_tag="BQ2027_MB0339"
+ /note="Mb0339, -, len: 261 aa. Equivalent to Rv0332, len:
+ 261 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 261 aa overlap). Conserved hypothetical
+ protein, similar to several conserved hypothetical
+ proteins from Streptomyces coelicolor e.g.
+ SC6A9.18c|AL031035|SC6A9_18|T35449 hypothetical protein
+ (266 aa), FASTA scores: opt: 508, E(): 5.7e-27, (36.7%
+ identity in 251 aa overlap). Protein product from Mb0339
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0339 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248045.1"
+ /translation="MRKPASSLAKVDYSSAYLEQTHAFGELIRNVDQSTPVPTCPGWS
+ LGQLFRHVGRGDRWAAQIVRDRLDHFLDPRSVEGGKPPPDPDDAISWLYGGARLLVDA
+ VEQTGVETPVWTFLGPRPAGWWVRRRLHEVAVHRADVAITVGGEFTLEPNVAADGISE
+ FLERIAVQAGSGGTPLPLEDDDTLHLHATDPGLLEAGGWTVRRDERGVTWSHRHGKGA
+ VALRGGATELLLAMVRRLSVADTGIELLGDAGVWQKWLDRTPL"
+ gene 399284..399658
+ /locus_tag="BQ2027_MB0340"
+ CDS 399284..399658
+ /locus_tag="BQ2027_MB0340"
+ /note="Mb0340, -, len: 124 aa. Equivalent to Rv0333, len:
+ 124 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 124 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0340 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0340 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="CAB5248046.1"
+ /translation="MTTSEIATVLAWHDALNAADIETLVALSTDDIDIGDAHGAVQGH
+ DALRGWASSLTTTAELGRMYVHHGVVVVEQKITSGEDPGIARTGAAAFRVVQDHVASV
+ FRHEDLASALAATELTEDDLVD"
+ gene 399688..400554
+ /gene="rmlA"
+ /locus_tag="BQ2027_MB0341"
+ CDS 399688..400554
+ /gene="rmlA"
+ /locus_tag="BQ2027_MB0341"
+ /note="Mb0341, rmlA, len: 288 aa. Equivalent to Rv0334,
+ len: 288 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 288 aa overlap). Probable rmlA
+ (alternate gene name: rfbA), glucose-1-phosphate
+ thymidylyl-transferase (EC 2.7.7.24), equivalent to
+ CAC32020.1|AL583925 glucose-1-phosphate
+ thymidyltransferase from Mycobacterium leprae (288 aa).
+ Also highly similar to others e.g. AAG29804.1|AF235050
+ glucose-1-phosphate thymidylyltransferase from
+ Streptomyces rishiriensis (296 aa); RBA1_ECOLI|P37744
+ glucose-1-phosphate thymidylyltransferase from Escherichia
+ coli strain K12 (293 aa), FASTA scores: opt: 1199, E(): 0,
+ (62.0% identity in 284 aa overlap). BELONGS TO THE
+ GLUCOSE-1-PHOSPHATE THYMIDYLYLTRANSFERASE FAMILY. Protein
+ product from Mb0341 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0341 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="alpha-d-glucose-1-phosphate
+ thymidylyltransferase rmla (dtdp-glucose synthase)
+ (dtdp-glucose pyrophosphorylase)"
+ /protein_id="CAB5248047.1"
+ /translation="MRGIILAGGSGTRLYPITMGISKQLLPVYDKPMIYYPLTTLMMA
+ GIRDIQLITTPHDAPGFHRLLGDGAHLGVNISYATQDQPDGLAQAFVIGANHIGADSV
+ ALVLGDNIFYGPGLGTSLKRFQSISGGAIFAYWVANPSAYGVVEFGAEGMALSLEEKP
+ VTPKSNYAVPGLYFYDNDVIEIARGLKKSARGEYEITEVNQVYLNQGRLAVEVLARGT
+ AWLDTGTFDSLLDAADFVRTLERRQGLKVSIPEEVAWRMGWIDDEQLVQRARALVKSG
+ YGNYLLELLERN"
+ gene complement(400565..401080)
+ /gene="PE6"
+ /locus_tag="BQ2027_MB0342C"
+ CDS complement(400565..401080)
+ /gene="PE6"
+ /locus_tag="BQ2027_MB0342C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0342c, PE6, len: 171 aa. Equivalent to Rv0335c,
+ len: 171 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 171 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family (see first citation
+ below); contains short region of similarity to part of the
+ unique N-terminus of the Mycobacterium tuberculosis PGRS
+ family of Glycine-rich proteins e.g. Y03A_MYCTU|Q10637
+ hypothetical glycine-rich 49.6 kd protein (603 aa), FASTA
+ scores: opt: 219, E(): 1.1e-08, (51.5% identity in 66 aa
+ overlap). Mb0342c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe6"
+ /protein_id="CAB5248048.1"
+ /translation="MRSMGFLHRACRAPSSLPAPLMARPGRSVLARPAATPPGPLCAT
+ TRPRPPQGNQPPASRISNFPPKRHKTRVLAAAEDEVSAAVAALISAHGRRHHSLNNQA
+ AAFHGQFAQNLNVGAGSCASAETTADAPTQALLGPADRQRRQRRAVRQWLVRWAAHPG
+ RATRGFHNHRQ"
+ gene 401222..402733
+ /locus_tag="BQ2027_MB0343"
+ CDS 401222..402733
+ /locus_tag="BQ2027_MB0343"
+ /note="Mb0343, -, len: 503 aa. Equivalent to Rv0336, len:
+ 503 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 503 aa overlap). Part of Mycobacterium
+ tuberculosis 13E12 repeat family; almost identical to
+ Rv0515|MTCY20G10.05 hypothetical protein from M.
+ tuberculosis FASTA scores: (99.8% identity in 503 aa
+ overlap), possibly due to a recent gene duplication. Also
+ similar to other Mycobacterium tuberculosis hypothetical
+ proteins e.g. Rv1148c, Rv1945, etc. Mb0343 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED 13E12 REPEAT FAMILY PROTEIN"
+ /protein_id="CAB5248049.1"
+ /translation="MPSPEAIAHFDERFECHAPRTTRVSAAFIDRICSATRAENRAAA
+ AQLVALGELFAYRWSRCGGREEWVMDTMAAVAAEVAAALRISQGLAASRLRYARAMRE
+ RLPKTAEVFSAGDIGYLMFATIVYRTDLIVDPDVLAAVDAQLAANVARWPSMTKARLA
+ GQVDKIVARADADAVRRRKEYQAQRQFWVGESQDGVCQIGGSLLAVDAHALDARLSAL
+ AGTVCEHDPRSREQRRADALGALAGGADRLGCGCGRADCAAGKRPAAPPVVIHLIAEA
+ ATINGTGSAPASQMNADGLITAELVAELAKTATLVPLVHPGDAPPEPGYAPSKALADF
+ VRCRDLTCRWPGCDEPATNCDLDHTIPYAAGGPTHASNLKCYCRTHHLVKTFWGWRDQ
+ QLPDGTLILTSPSGHTYVSTPGSALLFPSLCHFSGGIPAPEADPPYDHCDQRTAMMPK
+ RRRTRAQDRAYRIATERRQNHAARQRAQVLTQTAAATDTHGPPPDHNDDPPPF"
+ gene complement(402903..404192)
+ /gene="aspC"
+ /locus_tag="BQ2027_MB0344C"
+ CDS complement(402903..404192)
+ /gene="aspC"
+ /locus_tag="BQ2027_MB0344C"
+ /note="Mb0344c, aspC, len: 429 aa. Equivalent to Rv0337c,
+ len: 429 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 429 aa overlap). Probable aspC,
+ aspartate aminotransferase (transaminase A) (EC 2.6.1.1),
+ equivalent to CAC32019.1|AL583925 probable aspartate
+ aminotransferase from Mycobacterium leprae (437 aa). Also
+ highly similar to many e.g. Q48143|U32823 aspartate
+ aminotransferase (404 aa), FASTA scores: opt: 1646, E():
+ 0, (57.2% identity in 404 aa overlap). Also some
+ similarity to Rv3565|MTCY06G11.12 from Mycobacterium
+ tuberculosis FASTA score: (27.2% identity in 383 aa
+ overlap). BELONGS TO CLASS-I OF
+ PYRIDOXAL-PHOSPHATE-DEPENDENT AMINOTRANSFERASES. COFACTOR:
+ PYRIDOXAL PHOSPHATE. Protein product from Mb0344c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0344c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ASPARTATE AMINOTRANSFERASE ASPC
+ (TRANSAMINASE A) (ASPAT)"
+ /protein_id="CAB5248050.1"
+ /translation="MDNDGTIVDVTTHQLPWHTASHQRQRAFAQSAKLQDVLYEIRGP
+ VHQHAARLEAEGHRILKLNIGNPAPFGFEAPDVIMRDIIQALPYAQGYSDSQGILSAR
+ RAVVTRYELVPGFPRFDVDDVYLGNGVSELITMTLQALLDNGDQVLIPSPDYPLWTAS
+ TSLAGGTPVHYLCDETQGWQPDIADLESKITERTKALVVINPNNPTGAVYSCEILTQM
+ VDLARKHQLLLLADEIYDKILYDDAKHISLASIAPDMLCLTFNGLSKAYRVAGYRAGW
+ LAITGPKEHASSFIEGIGLLANMRLCPNVPAQHAIQVALGGHQSIEDLVLPGGRLLEQ
+ RDIAWTKLNEIPGVSCVKPAGALYAFPRLDPEVYDIDDDEQLVLDLLLSEKILVTQGT
+ GFNWPAPDHLRLVTLPWSRDLAAAIERLGNFLVSYRQ"
+ gene complement(404223..406871)
+ /locus_tag="BQ2027_MB0345C"
+ CDS complement(404223..406871)
+ /locus_tag="BQ2027_MB0345C"
+ /note="Mb0345c, -, len: 882 aa. Equivalent to Rv0338c,
+ len: 882 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 882 aa overlap). Probable
+ iron-sulphur-binding reductase (EC 1.-.-.-), possibly
+ membrane-bound, equivalent to CAC32018.1|AL583925 probable
+ iron-sulphur-binding reductase from Mycobacterium leprae
+ (880 aa). Also highly similar to others e.g.
+ T36608|5019323|CAB44376.1|AL078610 probable
+ iron-sulfur-binding reductase from Streptomyces coelicolor
+ (760 aa), FASTA scores: opt: 1658, E(): 0, (49.9% identity
+ in 772 aa overlap); BAB07521.1|AP001520
+ iron-sulphur-binding reductase from Bacillus halodurans
+ (700 aa). Contains PS00070 Aldehyde dehydrogenases
+ cysteine active site and two of PS00198 4Fe-4S
+ ferredoxins, iron-sulfur binding region signature. First
+ of several possible start sites chosen. Protein product
+ from Mb0345c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0345c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable iron-sulfur-binding reductase"
+ /protein_id="CAB5248051.1"
+ /translation="MTTQTLIRLILGMSMTAVVGVFALRRVWWLYKLVMSGQPASGRT
+ DNLGTRIWTQISEVLGQRRLLKWSIPGLAHFFTMWGFFILLTVYIEAYGLLFEERFHI
+ PVIGRWDALGFLQDFFATAVFLGITTFAIIRILRNPREIGRSSRFYGSHNGGAWLVLL
+ MIFNVIWTYVLVRGSAVNNGTLPYGNGAFLSQLFGAILRPLGQPANEIIETTALLLHI
+ GVMLAFLILVLHSKHLHIFLAPINVTFKRLPDGLGPLLPLEADGKPIDFENPSEDAVF
+ GRGKIEDFTWKGMLDFATCTECGRCQSQCPAWNTGKPLSPKLVIMDLRDHWMAKAPYI
+ LGQKDASAGGEAGHQEHHHVPESGFGRVPGHGPEQATRPLVGTEEQGGVIDPDVLWSC
+ VTCGACVEQCPVDIEHVDHIVDMRRYQVMMESEFPSELSVLFKNLETKGNPWGQNASD
+ RTNWIDEVDFDVPVYGQDVDSFDGYEYLFWVGCAGAYDDKAKKTTKAVAELLAVAGVK
+ YLVLGAGETCNGDSARRSGNEFLFQQLAQQAVETLDGLFEGVETVDRKIVVTCPHCFN
+ TIGKEYRQLGANYTVLHHTQLLNRLVRDKRLVPVTPVSQDITYHDPCYLGRHNKVYEA
+ PRELIGAAGASLTEMPRHADRSFCCGAGGARMWMEEHIGKRINHERVDEALATDATAI
+ ATACPFCRVMVTDGVNDRQEEAGRSGVEVLDVAQVLLGSLDHDKAQLPAKGTAAKQAQ
+ ERAPKAAPKAAAPVTPVEAPAEAPQAPAPAAPAAPVKGLGMAAGAKRPGAKKAAPTPA
+ APAAPAAPVKGLGIAAGAKRPGAKKTPPPAPGLAEPAAQPQPEAKPQPEPAAPPKPQT
+ DGDPAAPAAPVKGLGIARGARPPGKR"
+ gene complement(406980..409478)
+ /locus_tag="BQ2027_MB0346C"
+ CDS complement(406980..409478)
+ /locus_tag="BQ2027_MB0346C"
+ /note="Mb0346c, -, len: 832 aa. Equivalent to Rv0339c,
+ len: 832 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 832 aa overlap). Possible
+ transcriptional regulator, showing very weak similarity
+ with parts of others. Contains PS00017 ATP/GTP-binding
+ site motif A (P-loop); and probable helix-turn helix motif
+ from aa 778-799 (Score 1041, +2.73 SD). Protein product
+ from Mb0346c detected using SWATH mass spectrometry.
+ Mb0346c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5248052.1"
+ /translation="MQHRGCKNRGQAYDASVTDSLTEVPPAARRALLELANAPTVPVK
+ VLITGGIGTGKTTVLAAARDTLRRSGLTVLACPPPDGEPPETALVIDDAQLLTDTELL
+ RLTERVADSRLTVVAAAEAREHHRALRALTMALERDRPRISLGPLPVAEHLRDCTAGL
+ PFLIHAVSARAQAPAQAAKVALIERLRRLDEPTLDTLLMMSLTHELGVSDVAAALGIS
+ VTDARGLVDRAHASGLIESSHTAAFLQSVHDAIAQIVGNAHHHEVETSLLRSQLDISP
+ VSAELALRLAEHGLRDERLADILTRYAADTRDASVRCARLYRAAVHAGAKGLTVRLAD
+ ALARTGDCTAAATLADDLLSSPDATERAAAVRVAASVAVHDGNTGHAAELFGWLGPHP
+ DTMVSSAATIVFAANGDLATARATLRLKDAGPPTMAARCARNLAEGLLLTMDQPYPVA
+ MAKLGQAIATEQSLSQVIPDSPAALVTLAAIHAGDPVRARSVIGRAVRAGADPLFQRR
+ HLLLSGWIKMQEGQLPSASADVAAASAGTHLHRRDALWAAALQTAISRRTGDIGALQQ
+ HWYAAMEALAEYSLDLFALLPLGELWVAAARMRQVDQLQHTLDQALTLLDSLGNPALW
+ SNSLHWAGVHAGILANSPESVAPHGQALGAMVAHSTLAQALSDAGRTWLRVLAENVDA
+ DEVTAAARSLSHVGLTSDATRLAGQAALQTSDARVSGAMLQLARDLKLGNDFGEPPSG
+ AGDTEPASGTPPAPRQPPAGSPLSDREREVAELLLLGMPYRDIGARLFISAKTVEHHV
+ ARIRQRLGAGSRSEMLSMLRAMLAPESLTADERR"
+ gene 409664..410203
+ /locus_tag="BQ2027_MB0347"
+ CDS 409664..410203
+ /locus_tag="BQ2027_MB0347"
+ /note="Mb0347, -, len: 179 aa. Equivalent to Rv0340, len:
+ 179 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 179 aa overlap). Conserved
+ hypothetical protein; MEME-MAST analysis shows similarity
+ to product of downstream gene, Rv0341|iniB. Mb0347 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248053.1"
+ /translation="MANSLLDFVISLVRDPEAAARYAANPERSIAEAHLTDVTRADVN
+ SLIPVVSDSLSMSEPIGAAGGAHAGDRGNVWASGAATAALDAFAPHADAGVVQQHGAV
+ GSVLNQPTPPGPGVTPTDPRPFRAGPHETSALLTSAEIPDTTSEDGGLPTDHPAVWNH
+ PVVDPHTVEPDHHGYDIHG"
+ gene 410392..411831
+ /gene="iniB"
+ /locus_tag="BQ2027_MB0348"
+ CDS 410392..411831
+ /gene="iniB"
+ /locus_tag="BQ2027_MB0348"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0348, iniB, len: 479 aa. Equivalent to Rv0341,
+ len: 479 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 479 aa overlap). iniB,
+ isoniazid-inducible gene, (see citations below). Protein
+ very Gly-, Ala-rich, similar to cell wall proteins e.g.
+ P27483|GRP_ARATH GLYCINE-RICH CELL WALL STRUCTURAL PROTEIN
+ from A.thaliana (338 aa), FASTA scores: opt: 532, E():
+ 5.2e-13, (39.3% identity in 321 aa overlap). MEME-MAST
+ analysis shows similarity to product of upstream gene,
+ Rv0340. Protein product from Mb0348 detected using shotgun
+ mass spectrometry. Mb0348 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ISONIAZID INDUCTIBLE GENE PROTEIN INIB"
+ /protein_id="CAB5248054.1"
+ /translation="MTSLIDYILSLFRSEDAARSFVAAPGRAMTSAGLIDIAPHQISS
+ VAANVVPGLNLGAGDPMSGLRQAVAARHGFAQDVANVGFAGDAGAGVASVITTDVGAG
+ LASGLGAGFLGQGGLALAASSGGFGGQVGLAAQVGLGFTAVIEAEVGAQVGAGLGIGT
+ GLGAQAGMGFGGGVGLGLGGQAGGVIGGSAAGAIGAGVGGRLGGNGQIGVAGQGAVGA
+ GVGAGVGGQAGIASQIGVSAGGGLGGVGNVSGLTGVSSNAVLASNASGQAGLIASEGA
+ ALNGAAMPHLSGPLAGVGVGGQAGAAGGAGLGFGAVGHPTPQPAALGAAGVVAKTEAA
+ AGVVGGVGGATAAGVGGAHGDILGHEGAALGSVDTVNAGVTPVEHGLVLPSGPLIHGG
+ TGGYGGMNPPVTDAPAPQVPARAQPMTTAAEHTPAVTQPQHTPVEPPVHDKPPSHSVF
+ DVGHEPPVTHTPPAPIELPSYGLFGLPGF"
+ gene 411868..413790
+ /gene="iniA"
+ /locus_tag="BQ2027_MB0349"
+ CDS 411868..413790
+ /gene="iniA"
+ /locus_tag="BQ2027_MB0349"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0349, iniA, len: 640 aa. Equivalent to Rv0342,
+ len: 640 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 640 aa overlap). iniA,
+ isoniazid-inducible gene, (see citations below). Shows
+ slight similarity to some hypothetical bacterial proteins
+ e.g. P40983|YOR6_THER hypothetical protein (402 aa), FASTA
+ scores: opt: 242, E(): 1.4e-07, (22.3% identity in 349 aa
+ overlap). Also some similarity to downstream ORF
+ Rv0343|iniC. Possible transmembrane stretch around residue
+ 490. Alternative translational start at 410824. Contains a
+ phosphopantetheine attachment site motif suggestive of an
+ acyl carrier protein. Note that the iniA gene is also
+ induced by the antibiotic ethambutol, an agent that
+ inhibits cell wall biosynthesis by a mechanism that is
+ distinct from isoniazid. Protein product from Mb0349
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0349 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ISONIAZID INDUCTIBLE GENE PROTEIN INIA"
+ /protein_id="CAB5248055.1"
+ /translation="MVPAGLCAYRDLRRKRARKWGDTVTQPDDPRRVGVIVELIDHTI
+ AIAKLNERGDLVQRLTRARQRITDPQVRVVIAGLLKQGKSQLLSSLLNLPAARVGDDE
+ ATVVITVVSYSAQPSARLVLAAGPDGTTAAVDIPVDDISTDVRRAPHAGGREVLRVEV
+ GAPSPLLRGGLAFIDTPGVGGLGQPHLSATLGLLPEADAVLVVSDTSQEFTEPEMWFV
+ RQAHQICPVGAVVATKTDLYPRWREIVNANAAHLQRARVPMPIIAVSSLLRSHAVTLN
+ DKELNEESNFPAIVKFLSEQVLSRATERVRAGVLGEIRSATEQLAVSLGSELSVVNDP
+ NLRDRLASDLERRKREAQQAVQQTALWQQVLGDGFNDLTADVDHDLRTRFRTVTEDAE
+ RQIDSCDPTAHWAEIGNDVENAIATAVGDNFVWAYQRSEALADDVARSFADAGLDSVL
+ SAELSPHVMGTDFGRLKALGRMESKPLRRGQKMIIGMRGSYGGVVMIGMLSSVVGLGL
+ FNPLSVGAGLILGRMAYKEDKQNRLLRVRSEAKANVRRFVDDISFVVSKQSRDRLKMI
+ QRLLRDHYREIAEEITRSLTESLQATIAAAQVAETERDNRIRELQRQLGILSQVNDNL
+ AGLEPTLTPRASLGRA"
+ gene 413787..415268
+ /gene="iniC"
+ /locus_tag="BQ2027_MB0350"
+ CDS 413787..415268
+ /gene="iniC"
+ /locus_tag="BQ2027_MB0350"
+ /note="Mb0350, iniC, len: 493 aa. Equivalent to Rv0343,
+ len: 493 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 493 aa overlap). iniC,
+ isoniazid-inducible gene, (see citations below). Shows
+ slight similarity to P40983|YOR6_THER8 hypothetical
+ protein (402 aa), FASTA scores: opt: 196, E(): 2.6e-05,
+ (25.9% identity in 228 aa overlap). Also some similarity
+ to upstream ORF Rv0342|iniA. Contains (PS00017)
+ ATP/GTP-binding site motif A (P-loop). Note that the iniA
+ gene is also induced by the antibiotic ethambutol, an
+ agent that inhibits cell wall biosynthesis by a mechanism
+ that is distinct from isoniazid. Protein product from
+ Mb0350 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0350 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ISONIAZID INDUCTIBLE GENE PROTEIN INIC"
+ /protein_id="CAB5248056.1"
+ /translation="MSTSDRVRAILHATIQAYRGAPAYRQRGDVFCQLDRIGARLAEP
+ LRIALAGTLKAGKSTLVNALVGDDIAPTDATEATRIVTWFRHGPTPRVTANHRGGRRA
+ NVPITRRGGLSFDLRRINPAELIDLEVEWPAEELIDATIVDTPGTSSLACDASERTLR
+ LLVPADGVPRVDAVVFLLRTLNAADVALLKQIGGLVGGSVGALGIIGVASRADEIGAG
+ RIDAMLSANDVAKRFTRELNQMGICQAVVPVSGLLALTARTLRQTEFIALRKLAGAER
+ TELNRALLSVDRFVRRDSPLPVDAGIRAQLLERFGMFGIRMSIAVLAAGVTDSTGLAA
+ ELLERSGLVALRNVIDQQFAQRSDMLKAHTALVSLRRFVQTHPVPATPYVIADIDPLL
+ ADTHAFEELRMLSLLPSRATTLNDDEIASLRRIIGGSGTSAAARLGLDPANSREAPRA
+ ALAAAQHWRRRAAHPLNDPFTTRACRAAVRSAEAMVAEFSARR"
+ gene complement(415411..415971)
+ /gene="lpqJ"
+ /locus_tag="BQ2027_MB0351C"
+ CDS complement(415411..415971)
+ /gene="lpqJ"
+ /locus_tag="BQ2027_MB0351C"
+ /note="Mb0351c, lpqJ, len: 186 aa. Equivalent to Rv0344c,
+ len: 186 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 186 aa overlap). Probable lipoprotein,
+ without homology. Has an appropriately positioned
+ prokaryotic lipoprotein signature (PS00013). Protein
+ product from Mb0351c detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPOPROTEIN LPQJ"
+ /protein_id="CAB5248057.1"
+ /translation="MRLSLIARGMAALLAATALVAGCNTTIDGRPVASPGSGPTEPTF
+ PTPRPTTAPPGTTAPTLPTTPVSPTAPAGAIPLPPDSNGYVFIETKSGMTRCQINRDS
+ VGCEAPFTNSPLRDGEHANGIHITAGGSVQWVLGNLGAIPTVSIDYRTYEAQGWTIDA
+ TTDGTRFTNNRTGHGMFVSIEKVDTF"
+ gene 416217..416489
+ /locus_tag="BQ2027_MB0353"
+ CDS 416217..416489
+ /locus_tag="BQ2027_MB0353"
+ /note="Mb0353, -, len: 90 aa. Equivalent to 3' end of
+ Rv0345, len: 136 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 90 aa overlap).
+ Conserved hypothetical protein, similar to other
+ hypothetical proteins e.g. AL13282 4|SCAH10_9 hypothetical
+ protein from Streptomyces coelicolor (207 aa), FASTA
+ scores: opt: 188, E(): 1.5e-05, (41.0% identity in 117 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a frameshift due to a single base deletion (a-*)
+ leads to a shorter product with a different NH2 part
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv. Mb0353 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248058.1"
+ /translation="MVLGAVEVSAPAGVTAITAPDWQQGLSASVRAGLAQADREHADY
+ AVLHVIDTPDVNAKVVARVLGRALVSRSGLAGRGRIPAHSARRRGC"
+ gene complement(416531..417994)
+ /gene="ansP2"
+ /locus_tag="BQ2027_MB0354C"
+ CDS complement(416531..417994)
+ /gene="ansP2"
+ /locus_tag="BQ2027_MB0354C"
+ /standard_name="aroP2"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0354c, ansP2, len: 487 aa. Equivalent to Rv0346c,
+ len: 487 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 487 aa overlap). Possible ansP2,
+ L-asparagine permease, integral membrane protein belonging
+ to family containing many amino acid permeases, highly
+ similar to G467030|B2126_F2_85|NP_301937.1|NC_002677
+ probable L-asparagine permease from Mycobacterium leprae
+ (498 aa); and NP_301938.1|NC_002677 probable L-asparagine
+ permease from Mycobacterium leprae (505 aa). Also highly
+ similar to others e.g. P77610|ANSP_ECOLI L-ASPARAGINE
+ PERMEASE from Escherichia coli strain K-12 (499 aa). Also
+ highly similar to ANSP1|Rv2127|MT2186|MTCY261_22|O33261
+ PROBABLE L-ASPARAGINE PERMEASE from Mycobacterium
+ tuberculosis (489 aa), FASTA score: (72.1% identity in 473
+ aa overlap). And shows some similarity to MTCY3G12.14 from
+ Mycobacterium tuberculosis. BELONGS TO THE AMINO ACID
+ PERMEASE FAMILY (APC FAMILY). Note that previously known
+ as aroP2. Protein product from Mb0354c detected using
+ SWATH mass spectrometry. Mb0354c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE L-ASPARAGINE PERMEASE ANSP2
+ (L-ASPARAGINE TRANSPORT PROTEIN)"
+ /protein_id="CAB5248059.1"
+ /translation="MPPLDITDERLTREDTGYHKGLHSRQLQMIALGGAIGTGLFLGA
+ GGRLASAGPGLFLVYGICGIFVFLILRALGELVLHRPSSGSFVSYAREFYGEKVAFVA
+ GWMYFLNWAMTGIVDTTAIAHYCHYWRAFQPIPQWTLALIALLVVLSMNLISVRLFGE
+ LEFWASLIKVIALVTFLIVGTVFLAGRYKIDGQETGVSLWSSHGGIVPTGLLPIVLVT
+ SGVVFAYAAIELVGIAAGETAEPAKIMPRAINSVVLRIACFYVGSTVLLALLLPYTAY
+ KEHVSPFVTFFSKIGIDAAGSVMNLVVLTAALSSLNAGLYSTGRILRSMAINGSGPRF
+ TAPMSKTGVPYGGILLTAGIGLLGIILNAIKPSQAFEIVLHIAATGVIAAWATIVACQ
+ LRLHRMANAGQLQRPKFRMPLSPFSGYLTLAFLAGVLILMYFDEQHGPWMIAATVIGV
+ PALIGGWYLVRNRVTAVAHHAIDHTKSVAVVHSADPI"
+ gene 418333..419319
+ /locus_tag="BQ2027_MB0355"
+ CDS 418333..419319
+ /locus_tag="BQ2027_MB0355"
+ /note="Mb0355, -, len: 328 aa. Equivalent to Rv0347, len:
+ 328 aa (alternative start possible), from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 328 aa
+ overlap). Probable conserved membrane protein, similar to
+ Rv0831c|AL022004|MTV043_23 from Mycobacterium tuberculosis
+ (271 aa), FASTA scores: E(): 9.6e-21, (33.1% identity in
+ 266 aa overlap). Protein product from Mb0355 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0355 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5248060.1"
+ /translation="MPGARELTLRVERGALFRRRWAASAASSARAAIRRDPRRCALGT
+ RPRWVSFLVIVLVIMNVVTAHPKYPNDPLALVLIELRHPRTEPPVPSAISILKEELAR
+ WTPILEQEEVRQVNLETGEHTAHSQKKLVARDRRTAITFRPDAMTLEVTDYPGWEEFR
+ SIVHAMVTARQDVAPVDGCIRIGLRYINEIRASLAEPSGWAYWVAESLLGPGTQLADL
+ KLTTTAQRHVIQCEGPEPGDSLTLRYAGARGAVIQSTPFLQRLKEPPAEGDFFLIDID
+ SAWSDPCKGIPALDAHLVDEVAERLHTPIGPLFESLITSELRTKVLQQPGQE"
+ gene 419322..419975
+ /locus_tag="BQ2027_MB0356"
+ CDS 419322..419975
+ /locus_tag="BQ2027_MB0356"
+ /note="Mb0356, -, len: 217 aa. Equivalent to Rv0348, len:
+ 217 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 217 aa overlap). Possible
+ transcriptional regulator, showing some similarity to
+ O53334|RV3188|MTV014.32 CONSERVED HYPOTHETICAL PROTEIN
+ from Mycobacterium tuberculosis (115 aa), FASTA score:
+ (30.0% identity in 100 aa overlap). Contains probable
+ helix-turn helix motif from aa 89-110 (Score 1407, +3.98
+ SD). Protein product from Mb0356 detected using shotgun
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5248061.1"
+ /translation="MTISFSSSNLRDDATSGNGDYRLDKLPETTPSTSVFDRADVTYR
+ QFTELHGQARDTRREAHVVELESKTGERARCAPMHALEQLADYGFAWRDIARVVGVSV
+ PAITKWRKGAGVTGENRLKIARLLALIDMLSDRFIGEPASWLEMPIQAGVGITRMDLL
+ ERGRYDLVLALASTHTGDGTVEYVLNETDKDWRETVVDNAFESYTAEDGVISIRPKR"
+ gene 419978..420637
+ /locus_tag="BQ2027_MB0357"
+ CDS 419978..420637
+ /locus_tag="BQ2027_MB0357"
+ /note="Mb0357, -, len: 219 aa. Equivalent to Rv0349, len:
+ 219 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 219 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0357 detected using SWATH
+ mass spectrometry. Mb0357 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248062.1"
+ /translation="MPELETPDDPESIYLARLEDVGEHRPTFTGDIYRLGDGRMVMIL
+ QHPCALRHGVDLHPRLLVAPVRPDSLRSNWARAPFGTMPLPKLIDGQDHSADFINLEL
+ IDSPTLPTCERIAVLSQSGVNLVMQRWVYHSTRLAVPTHTYSDSTVGPFDEADLIEEW
+ VTDRVDDGADPQAAEHECASWLDERISGRTRRALLSDRQHASSIRREARSHRKSVKLA
+ D"
+ gene 420864..422741
+ /gene="dnaK"
+ /locus_tag="BQ2027_MB0358"
+ CDS 420864..422741
+ /gene="dnaK"
+ /locus_tag="BQ2027_MB0358"
+ /standard_name="hsp70"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0358, dnaK, len: 625 aa. Equivalent to Rv0350,
+ len: 625 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 625 aa overlap). Probable DnaK
+ (alternate gene name: hsp70), 70 kDa heat shock protein
+ (see citations below), equivalent to
+ AAA25362.1|M95576|1924344A|738248 heat shock protein 70
+ from Mycobacterium leprae (621 aa); and DNAK_MYCPA|Q00488
+ (623 aa), FASTA scores: opt: 3678, E(): 0, (92.3% identity
+ in 625 aa overlap). Also highly similar to others e.g.
+ Q05558|DNAK_STRCO|453231|CAA54606.1|X77458 CHAPERONE
+ PROTEIN DNAK from Streptomyces coelicolor (618 aa). Has
+ probably an ATPase activity (EC 3.6.1.-). Note that this
+ sequence differs from DNAK_MYCTU|P32723 (609 aa), due to a
+ frameshift near the N-terminus. BELONGS TO THE HEAT SHOCK
+ PROTEIN 70 FAMILY. Protein product from Mb0358 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0358 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CHAPERONE PROTEIN DNAK (HEAT SHOCK
+ PROTEIN 70) (HEAT SHOCK 70 KDA PROTEIN) (HSP70)"
+ /protein_id="CAB5248063.1"
+ /translation="MARAVGIDLGTTNSVVSVLEGGDPVVVANSEGSRTTPSIVAFAR
+ NGEVLVGQPAKNQAVTNVDRTVRSVKRHMGSDWSIEIDGKKYTAPEISARILMKLKRD
+ AEAYLGEDITDAVITTPAYFNDAQRQATKDAGQIAGLNVLRIVNEPTAAALAYGLDKG
+ EKEQRILVFDLGGGTFDVSLLEIGEGVVEVRATSGDNHLGGDDWDQRVVDWLVDKFKG
+ TSGIDLTKDKMAMQRLREAAEKAKIELSSSQSTSINLPYITVDADKNPLFLDEQLTRA
+ EFQRITQDLLDRTRKPFQSVIADTGISVSEIDHVVLVGGSTRMPAVTDLVKELTGGKE
+ PNKGVNPDEVVAVGAALQAGVLKGEVKDVLLLDVTPLSLGIETKGGVMTRLIERNTTI
+ PTKRSETFTTADDNQPSVQIQVYQGEREIAAHNKLLGSFELTGIPPAPRGIPQIEVTF
+ DIDANGIVHVTAKDKGTGKENTIRIQEGSGLSKEDIDRMIKDAEAHAEEDRKRREEAD
+ VRNQAETLVYQTEKFVKEQREAEGGSKVPEDTLNKVDAAVAEAKAALGGSDISAIKSA
+ MEKLGQESQALGQAIYEAAQAASQATGAAHPGGEPGGAHPGSADDVVDAEVVDDGREA
+ K"
+ gene 422738..423445
+ /gene="grpE"
+ /locus_tag="BQ2027_MB0359"
+ CDS 422738..423445
+ /gene="grpE"
+ /locus_tag="BQ2027_MB0359"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0359, grpE, len: 235 aa. Equivalent to Rv0351,
+ len: 235 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 235 aa overlap). Probable grpE protein
+ (HSP-70 COFACTOR), equivalent to CAC32012.1|AL583925 Hsp70
+ cofactor from Mycobacterium leprae (229 aa). Also highly
+ similar to others eg Q05562|GRPE_STRCO|2127521|PN0643 GRPE
+ PROTEIN from Streptomyces coelicolor (225 aa). Contains
+ grpE protein signature (PS01071). BELONGS TO THE GRPE
+ FAMILY. Protein product from Mb0359 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0359
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GRPE PROTEIN (HSP-70 COFACTOR)"
+ /protein_id="CAB5248064.1"
+ /translation="MTDGNQKPDGNSGEQVTVTDKRRIDPETGEVRHVPPGDMPGGTA
+ AADAAHTEDKVAELTADLQRVQADFANYRKRALRDQQAAADRAKASVVSQLLGVLDDL
+ ERARKHGDLESGPLKSVADKLDSALTGLGLVAFGAEGEDFDPVLHEAVQHEGDGGQGS
+ KPVIGTVMRQGYQLGEQVLRHALVGVVDTVVVDAAELESVDDGTAVADTAENDQADQG
+ NSADTLGEQAESEPSGS"
+ gene 423481..424668
+ /gene="dnaJ1"
+ /locus_tag="BQ2027_MB0360"
+ CDS 423481..424668
+ /gene="dnaJ1"
+ /locus_tag="BQ2027_MB0360"
+ /standard_name="dnaJ"
+ /note="Mb0360, dnaJ1, len: 395 aa. Equivalent to Rv0352,
+ len: 395 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 395 aa overlap). Probable DnaJ1,
+ chaperone protein, equivalent to AAA25363.1|M95576 DNA J
+ heatshock protein from Mycobacterium leprae (389 aa). Also
+ highly similar to others. Contains both DnaJ signatures
+ (PS00636, and PS00637). BELONGS TO THE DNAJ FAMILY.
+ COFACTOR: BINDS TWO ZINC IONS PER MONOMER. Note that
+ sequence differs from DNAJ_MYCTU|P07881 due to a
+ frameshift at the N-terminus. Note that previously known
+ as dnaJ. Protein product from Mb0360 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0360 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CHAPERONE PROTEIN DNAJ1"
+ /protein_id="CAB5248065.1"
+ /translation="MAQREWVEKDFYQELGVSSDASPEEIKRAYRKLARDLHPDANPG
+ NPAAGERFKAVSEAHNVLSDPAKRKEYDETRRLFAGGGFGGRRFDSGFGGGFGGFGVG
+ GDGAEFNLNDLFDAASRTGGTTIGDLFGGLFGRGGSARPSRPRRGNDLETETELDFVE
+ AAKGVAMPLRLTSPAPCTNCHGSGARPGTSPKVCPTCNGSGVINRNQGAFGFSEPCTD
+ CRGSGSIIEHPCEECKGTGVTTRTRTINVRIPPGVEDGQRIRLAGQGEAGLRGAPSGD
+ LYVTVHVRPDKIFGRDGDDLTVTVPVSFTELALGSTLSVPTLDGTVGVRVPKGTADGR
+ ILRVRGRGVPKRSGGSGDLLVTVKVAVPPNLAGAAQEALEAYAAAERSSGFNPRAGWA
+ GNR"
+ gene 424668..425048
+ /gene="hspR"
+ /locus_tag="BQ2027_MB0361"
+ CDS 424668..425048
+ /gene="hspR"
+ /locus_tag="BQ2027_MB0361"
+ /note="Mb0361, hspR, len: 126 aa. Equivalent to Rv0353,
+ len: 126 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 126 aa overlap). Probable hspR, heat
+ shock regulatory protein, merR family, highly similar to
+ others e.g. HspR|P40183 heat shock regulatory protein from
+ Streptomyces coelicolor (151 aa), FASTA scores: E():
+ 4.9e-22, (55.7% identity in 140 aa overlap), that binds to
+ three inverted repeats (IR1-IR3) in the promoter region of
+ the dnaK operon. Has possible coiled coil region in
+ C-terminal half. BELONGS TO THE MERR FAMILY OF
+ TRANSCRIPTIONAL REGULATORS. Mb0361 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable heat shock protein transcriptional
+ repressor hspr (merr family)"
+ /protein_id="CAB5248066.1"
+ /translation="MAKNPKDGESRTFLISVAAELAGMHAQTLRTYDRLGLVSPRRTS
+ GGGRRYSLHDVELLRQVQHLSQDEGVNLAGIKRIIELTSQVEALQSRLQEMAEELAVL
+ RANQRREVAVVPKSTALVVWKPRR"
+ gene complement(425173..435696)
+ /gene="PPE8"
+ /locus_tag="BQ2027_MB0362C"
+ CDS complement(425173..435696)
+ /gene="PPE8"
+ /locus_tag="BQ2027_MB0362C"
+ /note="Mb0362c, PPE8, len: 3507 aa. Equivalent to Rv0355c
+ and Rv0354c, len: 3300 aa and 141 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (99.8% identity in 3296 aa
+ overlap and 100.0% identity in 125 aa overlap). PPE8,
+ member of the Mycobacterium tuberculosis PPE family,
+ similar to others e.g. AL009198|MTV004_5 from M.
+ tuberculosis (3716 aa), FASTA scores: opt: 2906, E(): 0,
+ (40.9% identity in 3833 aa overlap); MTV004_3 FASTA
+ scores: (39.0% identity in 3531 aa overlap); etc. Gene
+ contains large number of clustered Major Polymorphic
+ Tandem Repeats (MPTR). Related to MTCY13E10.16c, E(): 0;
+ MTCY13E10.17c, E(): 0; MTCY48.17, E(): 0; MTCY98.0034c,
+ E(): 0; MTCY03C7.23 E(): 0; MTCY98.0031c, E(): 0;
+ MTCY31.06c, E(): 5.6e-17; MTCY359.33, E(): 2.3e-16. PPE7,
+ member of the Mycobacterium tuberculosis PPE family,
+ similar to others e.g. MTCY63_9 from Mycobacterium
+ tuberculosis (2411 aa), FASTA scores: E(): 3.6e-11, (47.6%
+ identity in 103 aa overlap). Possible continuation of ORF
+ upstream, but no sequence error apparent.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PPE7 and PPE8 exist as 2 genes.
+ In Mycobacterium bovis, a 2 bp insertion (*-ta) resulting
+ in the absence of a stop codon between the 2 genes, leads
+ to a single product. Mb0362c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe7"
+ /protein_id="CAB5248067.1"
+ /translation="MSFAVLPPEINSARLYVGAGLAPMLDAAAAWDGLADELGSAAAS
+ FSAVTAGLAGSSWLGAASTAMTGAAAPYLGWLSAAAAQAQQAATQTRLAAAAFEAALA
+ ATVHPAIISANRALFVSLVVSNLLGQNAPAIAATEAAYEQMWAQDVAAMFGYHAGASA
+ AVSALTPFGQALPTVAGGGALVSAAAAQVTTRVFRNLGLANVGEGNVGNGNVGNFNLG
+ SANIGNGNIGSGNIGSSNIGFGNVGPGLTAALNNIGFGNTGSNNIGFGNTGSNNIGFG
+ NTGDGNRGIGLTGSGLLGFGGLNSGTGNIGLFNSGTGNVGIGNSGTGNWGIGNSGNSY
+ NTGFGNSGDANTGFFNSGIANTGVGNAGNYNTGSYNPGNSNTGGFNMGQYNTGYLNSG
+ NYNTGLANSGNVNTGAFITGNFNNGFLWRGDHQGLIFGSPGFFNSTSAPSSGFFNSGA
+ GSASGFLNSGANNSGFFNSSSGAIGNSGLANAGVLVSGVINSGNTVSGLFNMSLVAIT
+ TPALISGFFNTGSNMSGFFGGPPVFNLGLANRGVVNILGNANIGNYNILGSGNVGDFN
+ ILGSGNLGSQNILGSGNVGSFNIGSGNIGVFNVGSGSLGNYNIGSGNLGIYNIGFGNV
+ GDYNVGFGNAGDFNQGFANTGNNNIGFANTGNNNIGIGLSGDNQQGFNIASGWNSGTG
+ NSGLFNSGTNNVGIFNAGTGNVGIANSGTGNWGIGNPGTDNTGILNAGSYNTGILNAG
+ DFNTGFYNTGSYNTGGFNVGNTNTGNFNVGDTNTGSYNPGDTNTGFFNPGNVNTGAFD
+ TGDFNNGFLVAGDNQGQIAIDLSVTTPFIPINEQMVIDVHNVMTFGGNMITVTEASTV
+ FPQTFYLSGLFFFGPVNLSASTLTVPTITLTIGGPTVTVPISIVGALESRTITFLKID
+ PAPGIGNSTTNPSSGFFNSGTGGTSGFQNVGGGSSGVWNSGLSSAIGNSGFQNLGSLQ
+ SGWANLGNSVSGFFNTSTVNLSTPANVSGLNNIGTNLSGVFRGPTGTIFNAGLANLGQ
+ LNIGSANLGDFNLGSGNVGSFNVFSGNQGSYNIGPANLGNYNIGFANLGNYNIGFGNA
+ GDFNQGFANTGNNNIGFANTGNNNIGIGLSGDNQQGFNFAGGWNSGTANIGLFNSGTN
+ NVGIGNSGTGNWGIGNSGSGNTGIGNTGSTNTGFFNTGIVNTGVANAGSYNTGWYNTG
+ DTNTGIANLGDFNTGFYNTGNFSTGFANQGDIATGAFITGDMGNGAFWRGDQQGLFSA
+ GYRVHVPEIPAHVTVEVPVNIPITASFTNTVYSGITLEQINFGFTIDIAGIPLLAGAI
+ SKAVLPPITGTGPAITVNIGDPGGSTAIRIPATASVGPFDVTFVNIAATTGFFNATTD
+ PSSGFFNGGPGTVSGIANIGANISGFQNVANSATSGFNNYGSLQSGLANLGDTVSGVF
+ NTGIGAPANVSGMFNIGSNLAGFFHDQATGMSMFNLGLGNIGQFNVGFSNVGDSNAGL
+ ANIGSFNLGSGNLGSFNVFGGNQGSYNIGPANLGNYNIGLGNLGSYNFGFGNAGDFNL
+ GFANTGNNNIGFANTGNNNIGIGLSGDNQQGFNFAGGWNSGSGNSGLFNSGTNNIGLF
+ NSGTGNIGIGNSGTGNWGIANTGDTNTGIFNTGDVNTGLLNAGNVNTGIFNTGHYNTG
+ SFNAGSFNTAGFNPGSYNTGYLNTGSYNTGLANSGDVNTGGFITGNYSNGFWWRGDYQ
+ GLAGISQTITVPDTAVPVKLHVPIFLDIPVTGTLGTFTVHGFRFPEITGDIFLIGIPF
+ NAATLDAFSFPNISIVLPNIGINLGSGPDPLIDIAGTGGLLPIKIPLIDIPAAPGFGN
+ STTTPSSGFFNAGTGTVSGVGNVGSNSSGFFDLTSGSSGISGVQNFGELISGGFNFGN
+ TVSGLVNASTLGLSMPANLSGGGNVGATVAGFVNNTQILNLGFGNVGSGNVGHGNIGD
+ SNVGLGNLGNANVGHGNIGSFNVFSGNRGSYNIGPANLGNYNIGLGNLGSYNFGFGNA
+ GDFNLGFANSGSNNIGFANTGNNNIGIGLSGHNQQGFGSWNSGTANTGLFNSGTNNIG
+ LFNSGTGNIGIGNSGIGNTGIGNPGVGNTGLGNSGTGNWGLWNPGTGNMGVANVGTYN
+ TGGYNVGSTNTGIANVGIANTGSYNTGSTNTGSFNDGDFNTGFYNTGDYNTGFYNTGD
+ VNTGAFIGGNFSNGAFWQSDHQGQWGAHYAITVPQIPLLNFSLNIPVNIPIHLDFGTL
+ AVNGFQIPAITLRALGVTHFSVGPIIVPRIAGTLPVIDINIGDPGGSSSIPITITSGA
+ GPVVIPLLDIPPAPGFGNSTTGPSSGFFNSGTGSSSGFGNVGANNSGFWNTAFAGIGN
+ SGLQNFGSLQSGWANLGNTVSGFYNTSAADFATPANLSGLSNVGADLTGVLRGPNGST
+ FNAGLANLGQFNVGSANLGSANLGSANLGNSNVGFGNIGNANIGGANIGDFNVGIANT
+ GPGLTAAVNNIGIGNTGNYNIGVGNTGNYNIGFGNTGNNNIGIGLSGDNQIGFGPLNA
+ GIANMGLFNLGDNNFGMANAGNFNQGIANTGNNNIGLFNTGNNNVGIGLTGDGLSGFS
+ SLNSGAGNTGFFNSGTANTGLFNSGTGNTGLFNSGTGNVGIGNMGTGGFGVGLSGDSQ
+ VGIGGTNSGSFNIGLFNSGTGNVGIGNSGTGNVGIGNTGTGNTGIGNSGNYNTGLLNA
+ GLVNTGIANPGNHNTGLFNIGTFNTGIANPGHYNTGSYNTGSYNTGMANAGDYGTGAF
+ ITGSMNNGLLWRADRQGLLAANYTITIERPAAFLNVDIPVNIPITGDITNVSIPAITF
+ PRIDASGSVDIGILSGTVLAPVGPITLHGGDASAPLDTPIEIDFGPSPAINLNIGKPD
+ GSTVINIVGGAGAGPISIPIIDLRPAPGFFNATTGPSSGFLNWGAGSASGLLNFGNNS
+ GLYNFATSSMGNSGFQNYGSLQSGWANLGNSISGIYNTGLGAPANVSGLLNIGTNLAG
+ WLQNGPTETTFSVGLANLGFWNLGSANIGNYNLGSANIGVYNLGSANIGDFNLGSANI
+ GDFNLGSANIGSSNIGFGNVGPGLTAAIGNIGFGNTGNGNIGIGNTGTGNIGFGNTGN
+ GNIGIGLTGDTMTGFGGWNSGTGNIGLFNSGTGNIGFGNSGTGNWGIGNSGDYNTGIG
+ NTGSTNSGFFNTGLVNTGIGNSGDYNTGLFNAGNTNTGSFNPGDYNTGGFNPGNYNTG
+ YFNPGNSNTGFANSGDVNTGAFNSGNYSNGFFWRGDYQGLGGFAYQSAVSEIPWSYDI
+ GSNIEIPIEGDINAITQDAFTIDEFEIPIKLRVSVCVIYIPFKGCVKHVSVTIPITTE
+ HLGPYEIDASTINPDQPIDTAFTQTLDFAGSGTVGAFPFGFGWQQSPGFFNSTTTPSS
+ GFFNSGAGGASGFLNDAAAAVSGLGNVFTETSGFFNAGGVGNSGFQNFGNLLSGWANL
+ GNTVSGFYNTSMLDLATQALISGFGNHGARLSGILNNGSGP"
+ gene complement(435847..436491)
+ /locus_tag="BQ2027_MB0363C"
+ CDS complement(435847..436491)
+ /locus_tag="BQ2027_MB0363C"
+ /note="Mb0363c, -, len: 214 aa. Equivalent to Rv0356c,
+ len: 214 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 214 aa overlap). Conserved
+ hypothetical protein, equivalent to AL023514|MLCB4_12
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium leprae
+ (218 aa), FASTA scores: opt: 1067, E(): 0, (73.4% identity
+ in 214 aa overlap). Protein product from Mb0363c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0363c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Thioesterase superfamily protein Rv0356c"
+ /protein_id="CAB5248068.1"
+ /translation="MTDASVHPDELDPEYHHHGGFPEYGPASPGAGFGQFVATMRRLQ
+ DLAVAADPGDAVWDEAAERAAALVELLSPFEADEGKAPAGRTPGLPGMGSLLLPPWTV
+ TRYGTDGVEMRGSFSRFHVGGNSAVHGGVLPLLFDHMFGMISHAAGRPISRTAFLHVD
+ YRRITPIDVPLIVRGRVTNTEGRKAFVCAELFDSDETLLAEGNGLMVRLLPGQP"
+ gene complement(436488..437786)
+ /gene="purA"
+ /locus_tag="BQ2027_MB0364C"
+ CDS complement(436488..437786)
+ /gene="purA"
+ /locus_tag="BQ2027_MB0364C"
+ /note="Mb0364c, purA, len: 432 aa. Equivalent to Rv0357c,
+ len: 432 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 432 aa overlap). Probable purA,
+ adenylosuccinate synthase (EC 6.3.4.4), equivalent to
+ AL023514|MLCB4_13 from ADENYLOSUCCINATE SYNTHETASE
+ Mycobacterium leprae (432 aa), FASTA scores: opt: 2555,
+ E(): 0, (87.9% identity in 431 aa overlap). Also highly
+ similar to many bacterial adenylosuccinates synthetases
+ e.g. P12283|PURA_ECOLI adenylosuccinates synthetase from
+ Escherichia coli (431 aa), FASTA scores: E(): 0, (51.1%
+ identity in 425 aa overlap); etc. BELONGS TO THE
+ ADENYLOSUCCINATE SYNTHETASE FAMILY. Protein product from
+ Mb0364c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0364c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ADENYLOSUCCINATE SYNTHETASE PURA
+ (IMP--ASPARTATE LIGASE) (ADSS) (AMPSASE)"
+ /protein_id="CAB5248069.1"
+ /translation="MPAIVLIGAQWGDEGKGKATDLLGGRVQWVVRYQGGNNAGHTVV
+ LPTGENFALHLIPSGVLTPGVTNVIGNGVVIDPGVLLNELRGLQDRGVDTAKLLISAD
+ AHLLMPYHIAIDKVTERYMGSKKIGTTGRGIGPCYQDKIARIGIRVADVLDPEQLTHK
+ VEAACEFKNQVLVKIYNRKALDPAQVVDALLEQAEGFKHRIADTRLLLNAALEAGETV
+ LLEGSQGTLLDVDHGTYPYVTSSNPTAGGAAVGSGIGPTRIGTVLGILKAYTTRVGSG
+ PFPTELFDEHGEYLSKTGREFGVTTGRRRRCGWFDAVIARYAARVNGITDYFLTKLDV
+ LSSLESVPVCVGYEIDGRRTRDMPMTQRDLCRAKPVYEELPGWWEDISGAREFDDLPA
+ KARDYVLRLEQLAGAPVSCIGVGPGREQTIVRRDVLQDRP"
+ gene 437877..438524
+ /locus_tag="BQ2027_MB0365"
+ CDS 437877..438524
+ /locus_tag="BQ2027_MB0365"
+ /note="Mb0365, -, len: 215 aa. Equivalent to Rv0358, len:
+ 215 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 215 aa overlap). Conserved
+ hypothetical protein, highly similar to AL023514|MLCB4_14
+ from Mycobacterium leprae (229 aa), FASTA scores: opt:
+ 852, E(): 0, (62.9% identity in 229 aa overlap). Protein
+ product from Mb0365 detected using SWATH mass
+ spectrometry. Mb0365 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248070.1"
+ /translation="MYTAENAPGVAVLLSGDADVPGPLTGLPTHQDNLDTVIGRYSRL
+ IVVGADADLGAVLTRLLRTDRLDVEVGYVPRRRSPATRAYRLPAGRRAARRARCGVAR
+ RVPLIRDETGSVIVGRAQWLPAEEQALIHGEAVVDDTVLFDGDVAGVCIEPTLTLPGL
+ RAAVDGAGKWRRWIGGRAAQLGTTGAAVLRDGVAAPRPVRRSTFYRNVEGWLLVR"
+ gene 438535..439314
+ /locus_tag="BQ2027_MB0366"
+ CDS 438535..439314
+ /locus_tag="BQ2027_MB0366"
+ /note="Mb0366, -, len: 259 aa. Equivalent to Rv0359, len:
+ 259 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 259 aa overlap). Probable conserved
+ integral membrane protein, highly similar to hypothetical
+ or other membrane proteins e.g. AL133220|SCC75A_6|T50569
+ probable membrane protein from Streptomyces coelicolor
+ (265 aa), FASTA scores: opt: 642, E(): 0, (43.1% identity
+ in 248 aa overlap); P70995 HYPOTHETICAL 24.7 KD PROTEIN
+ from Bacillus subtilis (219 aa), FASTA scores: E():
+ 1.5e-12, (31.3% identity in 192 aa overlap). Contains
+ neutral zinc metallopeptidases, zinc-binding region
+ signature (PS00142). Mb0366 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5248071.1"
+ /translation="MSETGQRESVRPSPIFLGLLGLTAVGGALAWLAGETVQPLAYAG
+ VFVMVIAGWLVSLCLHEFGHAFTAWRFGDHDVAVRGYLTLDPRRYSHPMLSLGLPMLF
+ IALGGIGLPGAAVYVHTWFMTTARRTLVSLAGPTVNLALAMLLLAATRLLFDPIHAVL
+ WAGVAFLAFLQLTALVLNLLPIPGLDGYAALEPHLRPETQRALAPAKQFALVFLLVLF
+ LAPTLNGWFFGVVYWLFDLSGVSHRLAAAGSVLTRFWSIWF"
+ gene complement(439319..439756)
+ /locus_tag="BQ2027_MB0367C"
+ CDS complement(439319..439756)
+ /locus_tag="BQ2027_MB0367C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0367c, -, len: 145 aa. Equivalent to Rv0360c,
+ len: 145 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 145 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ AL023514|MLCB4_16|CAA18948.1|AL023514|MLCB4.27c
+ hypothetical protein from Mycobacterium leprae (137 aa),
+ FASTA scores: opt: 793, E(): 0, (85.4% identity in 137 aa
+ overlap). And similar to AL049754|SCH10_25c|T36537
+ hypothetical protein from Streptomyces coelicolor (143
+ aa), FASTA scores: opt: 497, E(): 3.2e-27, (55.8% identity
+ in 138 aa overlap). Protein product from Mb0367c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0367c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248072.1"
+ /translation="MTKRTITPMTSMGDLLGPEPILLPGDSDAEAELLANESPSIVAA
+ AHPSASVAWAVLAEGALADDKTVTAYAYARTGYHRGLDQLRRHGWKGFGPVPYSHQPN
+ RGFLRCVAALARAAAAIGETDEYGRCLDLLDDCDPAARPALGL"
+ gene 439839..440666
+ /locus_tag="BQ2027_MB0368"
+ CDS 439839..440666
+ /locus_tag="BQ2027_MB0368"
+ /note="Mb0368, -, len: 275 aa. Equivalent to Rv0361, len:
+ 275 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 275 aa overlap). Probable conserved
+ membrane protein (has hydrophobic stretch from residues
+ 132-156), equivalent to
+ AL023514|MLCB4_17|AA18949.1|AL023514 putative membrane
+ protein from Mycobacterium leprae (292 aa), FASTA scores:
+ opt: 1044, E(): 0, (58.6% identity in 292 aa overlap).
+ Protein product from Mb0368 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0368 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5248073.1"
+ /translation="MSNAPEPDRSAGESGSEPAGERSADPGEERTESYPLVPHDAETE
+ TVVITTSDNDAAVTQPEAQRERRFTAPGFDAKETQVIVTAHEAATEVFQTNQAPTTPP
+ RMPTGMPPKTAVPQSIPPRTEATSVRQRTWGWALAVVVIVLALAAIAILGTVLLTRGK
+ HSKMSQEDQVRQAIQSLDIAIQTGDLTALRSLTCGSTRDGYVDYDERDWAETYRRVSA
+ AKQYPVIASIDQVVVNGAHAEANVTTFMAFDPQVRSTRSLDLQFRDDQWKICQSSSN"
+ gene 440888..442270
+ /gene="mgtE"
+ /locus_tag="BQ2027_MB0369"
+ CDS 440888..442270
+ /gene="mgtE"
+ /locus_tag="BQ2027_MB0369"
+ /note="Mb0369, mgtE, len: 460 aa. Equivalent to Rv0362,
+ len: 460 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 460 aa overlap). Possible mgtE,
+ magnesium (Mg2+) transport transmembrane protein;
+ C-terminal region is highly similar to MGTE|G780283
+ putative Mg2+ transporter from Providencia stuarti (314
+ aa), FASTA scores: E(): 0, (47.2% identity in 307 aa
+ overlap) (N-terminus extends approx. 150 aa further
+ upstream compared to P. stuarti ORF). Also similar in part
+ to others e.g. AAK20879.1|AF334760_1|AF334760 putative
+ Mg2+ transporter from Aeromonas hydrophila (455 aa);
+ NP_231292.1|NC_002505 magnesium transporter from Vibrio
+ cholerae (451 aa); NP_102305.1|NC_002678 Mg2+ transport
+ protein from Mesorhizobium loti (454 aa); etc. Also
+ similar to Rv1232c|MTV006.04c from Mycobacterium
+ tuberculosis (435 aa). Extended hydrophobic segment
+ spanning last 130 residues. BELONG TO THE MGTE FAMILY.
+ Mb0369 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE Mg2+ TRANSPORT TRANSMEMBRANE PROTEIN
+ MGTE"
+ /protein_id="CAB5248074.1"
+ /translation="MSIRPAENSTLDIRHVIGIGTPKAVDLWLDVVTELPDRARELGS
+ LSKAELGKLGPLLDGTNAVELFESIDDKLAAEALHAMDPSLAATFLEALDSDHAANIL
+ REFKEPKREALLTLLPLERAMVLRGLLSWPEDCAAAHMVPETLTVRPNMTVSQAVASV
+ RERASGLRSDARTTAYVYVTDADSHLLGVIAFRALVLANPEQRVRELMGDDLIVVSPL
+ TDKELAAQTIMGHNLMAVPVVDADNRLLGIIAEDEAIDIAEEEATEDAERQGGSAPLE
+ VPYLRASPWLLWRKRAVWLLVLFAAEAYTGSVLRAFSDEMEAVIALAFFIPLLIGTGG
+ NTGTQIATTLVRAMATGQVRFRDVPAVLAKELSTGVLVGLTMAAAAVVRAWTLGVGPQ
+ VTLTVALTVAAIVVWSSLVAAVLPPLLKKLRIDPAIVSGPMIATIVDGTGLLIYFLVA
+ HLTLTELHGL"
+ gene complement(442282..443316)
+ /gene="fba"
+ /locus_tag="BQ2027_MB0370C"
+ CDS complement(442282..443316)
+ /gene="fba"
+ /locus_tag="BQ2027_MB0370C"
+ /standard_name="fda"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0370c, fba, len: 344 aa. Equivalent to Rv0363c,
+ len: 344 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 344 aa overlap). Probable fba
+ (alternate gene name: fda), fructose bisphosphate aldolase
+ (EC 4.1.2.13), equivalent to
+ AL023514|MLCB4_18|O69600|ALF_MYCLE FRUCTOSE-BISPHOSPHATE
+ ALDOLASE from Mycobacterium leprae (345 aa), FASTA scores:
+ opt: 1995, E(): 0, (87.7% identity in 342 aa overlap).
+ Also highly similar to others. BELONGS TO CLASS II
+ FRUCTOSE-BISPHOSPHATE ALDOLASE FAMILY. COFACTOR: ZINC.
+ Protein product from Mb0370c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0370c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FRUCTOSE-BISPHOSPHATE ALDOLASE FBA"
+ /protein_id="CAB5248075.1"
+ /translation="MPIATPEVYAEMLGQAKQNSYAFPAINCTSSETVNAAIKGFADA
+ GSDGIIQFSTGGAEFGSGLGVKDMVTGAVALAEFTHVIAAKYPVNVALHTDHCPKDKL
+ DSYVRPLLAISAQRVSKGGNPLFQSHMWDGSAVPIDENLAIAQELLKAAAAAKIILEI
+ EIGVVGGEEDGVANEINEKLYTSPEDFEKTIEALGAGEHGKYLLAATFGNVHGVYKPG
+ NVKLRPDILAQGQQVAAAKLGLPADAKPFDFVFHGGSGSLKSEIEEALRYGVVKMNVD
+ TDTQYAFTRPIAGHMFTNYDGVLKVDGEVGVKKVYDPRSYLKKAEASMSQRVVQACND
+ LHCAGKSLTH"
+ gene 443412..444095
+ /locus_tag="BQ2027_MB0371"
+ CDS 443412..444095
+ /locus_tag="BQ2027_MB0371"
+ /note="Mb0371, -, len: 227 aa. Equivalent to Rv0364, len:
+ 227 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 227 aa overlap). Possible conserved
+ transmembrane protein, equivalent to
+ O69601|Y364_MYCLE|ML0287|CAA18951.1|AL023514|AL023514|MLCB
+ 4_19 HYPOTHETICAL 24.3 KDA PROTEIN from Mycobacterium
+ leprae (222 aa), FASTA scores: opt: 1027, E(): 0, (66.1%
+ identity in 227 aa overlap). Shows strong similarity to
+ DEDA_ECOLI|P09548 DedA PROTEIN protein from Escherichia
+ coli FASTA scores: E(): 1.3e-28, (39.5% identity in 195 aa
+ overlap). Similar also to Mycobacterium tuberculosis DedA
+ protein Rv2637|MTCY441.0. Mb0371 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248076.1"
+ /translation="MSTAVTAMPDILDPMYWLGANGVFGSAVLPGILIIVFIETGLLF
+ PLLPGESLLFTGGLLSASPAPPVTIGVLAPCVALVAVLGDQTAYFIGRRIGPALFKKE
+ DSRFFKKHYVTESHAFFEKYGKWTIILARFVPIARTFVPVIAGVSYMRYPVFLGFDIV
+ GGVAWGAGVTLAGYFLGSVPFVHMNFQLIILALVFVSLLPALVSAARVYRARRNAPQS
+ DPDPLVLPE"
+ gene complement(444084..445214)
+ /locus_tag="BQ2027_MB0372C"
+ CDS complement(444084..445214)
+ /locus_tag="BQ2027_MB0372C"
+ /note="Mb0372c, -, len: 376 aa. Equivalent to Rv0365c,
+ len: 376 aa (start uncertain), from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 376 aa
+ overlap). Conserved hypothetical protein, very similar to
+ G388212|CAA35191.1, a truncated ORF immediately upstream
+ of the Corynebacterium glutamicum fda gene encoding
+ fructose-1,6-biphosphate aldolase (304 aa), FASTA scores:
+ E(): 7.1e-19, (42.2% identity in 296 aa overlap). Protein
+ product from Mb0372c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0372c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="fructose-bisphosphate aldolase family protein"
+ /protein_id="CAB5248077.1"
+ /translation="MNLANRAASAETAVTQRHLRRLWALPGTQLAVVAWPSTRRDRLF
+ GSWHYWWQAHLLDCLVDAQLRDPQPQRRARINRQVRSHRVRNNFSWLNSYYDDMAWLA
+ LALERADRVAGVRRRRALPKLTNQFVEAWVPEDGGGIPWRKQDQFFNAPANGPAGLFL
+ ARYPDQYGKRLKRAEQMADWIDRTLIDPETHLVFDGIKAGSLVRAQYTYCQGVVLGLE
+ TELAVRTGPAARARHCARVHRLVAAVNEHMAPLGVLRGAGGGDGGLFAGITARYLALV
+ ATTLPGDSADDAAARDTARAIVLASAQSAWDYRQTVDGLPVFGAFWDREAELPTAGGE
+ QARSVRGAVHSSAIAERDLSVQLSGWMLMEAAHSAAAVSSLG"
+ gene complement(445239..445832)
+ /locus_tag="BQ2027_MB0373C"
+ CDS complement(445239..445832)
+ /locus_tag="BQ2027_MB0373C"
+ /note="Mb0373c, -, len: 197 aa. Equivalent to Rv0366c,
+ len: 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 197 aa overlap). Conserved
+ hypothetical protein, showing weak similarity to
+ HI1395|P44173|YD95_HAEIN HYPOTHETICAL PROTEIN from
+ Haemophilus influenzae (140 aa), FASTA scores: opt: 152,
+ E(): 0.0015, (27.0% identity in 126 aa overlap). Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop) and PS00850
+ Glycine radical signature. Mb0373c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted kinase"
+ /protein_id="CAB5248078.1"
+ /translation="MKRLDLVAGPNGAGKSTFVALTLAPLLPGIVFVNADEIAKQRWP
+ DDPTSHAYQAAQVAADTRARLIDLGRPFIAETVFSHPSKLELIRTARTAGYTVVLHVL
+ VIPEGLAVERVRHRVAAGGHDVPETKIRERHRRLAELVAQAITLADGATVYDNSRLAG
+ PRIVAQFSGGGIIGRACWPSWTPPPLMSRWSNRPETA"
+ gene complement(445861..446250)
+ /locus_tag="BQ2027_MB0374C"
+ CDS complement(445861..446250)
+ /locus_tag="BQ2027_MB0374C"
+ /note="Mb0374c, -, len: 129 aa. Equivalent to Rv0367c,
+ len: 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 129 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0374c detected using SWATH
+ mass spectrometry. Mb0374c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="signal transduction"
+ /protein_id="CAB5248079.1"
+ /translation="MPKAVDRVTRVAADLVDSAAAEGARQSRSAKQQLDHWARVGRAV
+ SNQHTASRRRVEAALAGHLPMTDLTLEEGVVFNAEISAAIEERLSRTNYGDVLAAQGI
+ TTVALNDAGDIVEHRPDGTSVVLAATP"
+ gene complement(446331..447542)
+ /locus_tag="BQ2027_MB0375C"
+ CDS complement(446331..447542)
+ /locus_tag="BQ2027_MB0375C"
+ /note="Mb0375c, -, len: 403 aa. Equivalent to Rv0368c,
+ len: 403 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 403 aa overlap). Conserved hypothetical
+ protein, showing some similarity to AJ224684|BJAJ4684_4
+ cooxS protein from Bradyrhizobium japonicum (422 aa),
+ FASTA scores: opt: 341, E(): 4.3e-13, (27.4% identity in
+ 387 aa overlap); Rv2425c|MTCY428_22 hypothetical protein
+ from Mycobacterium tuberculosis FASTA score: (30.7%
+ identity in 238 aa overlap). Contains PS00213 Lipocalin
+ signature."
+ /codon_start=1
+ /transl_table=11
+ /product="Carbon monoxide oxidation accessory protein
+ CoxE"
+ /protein_id="CAB5248080.1"
+ /translation="MATPALLPGVDLAAFAAALAARLRDAGIPVSASGQASLVQALQQ
+ LVPRTPAALYWGARLTLVSRVDELATFDAVFASLFGVFGSAEPDGANRPPPPIAGPRT
+ PVAGVGHRAKRRSCAAQAQNLPWDTRSLTMASAGQGGPSRTLPDVLPSRIVARADEPF
+ DQFDPDDLRLLGAWLEATMARWPRRRSMRFESSPHGKRIDLRATMNASRSTGWESVLL
+ ARIRPRRRPRRVLLLCDVSRSMQPYAAIYLHLMRAAVLRRAGGHPEVFAFSTSLTRLT
+ SVLSHRSAEMALHRANARVTDRYGGTFIGRSVAALLAPPHGNALRGAVVIIASDGWDS
+ DPPDVLVHALTRVRRRAELLVWLNPRAAHPEFQPRASSMAAALPYCDLFLPAHSLAGL
+ HQLLLALAGAR"
+ gene complement(447548..448063)
+ /locus_tag="BQ2027_MB0376C"
+ CDS complement(447548..448063)
+ /locus_tag="BQ2027_MB0376C"
+ /note="Mb0376c, -, len: 171 aa. Equivalent to Rv0369c,
+ len: 171 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 171 aa overlap). Possible membrane
+ protein oxidoreductase (EC 1.-.-.-), similar to ORF 4 of
+ the Pseudomonas thermocarboxydovorans protein of
+ cutA-cutB-cutC gene cluster: X77931|PTC2CUTAC_4 ORF4 from
+ Pseudomonas thermocarboxydovorans (171 aa), FASTA scores:
+ opt: 226, E(): 9.8e-08, (31.3% identity in 166 aa
+ overlap). Also similar to MTV036.05, MTV036.08, MTV036.09,
+ and MTV026.10. Mb0376c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE OXIDOREDUCTASE"
+ /protein_id="CAB5248081.1"
+ /translation="MPGAQLIGHEGDEYLGKVKVKVGPVTSEFSGKVHFVEQDRNQHR
+ AVFDAKGKEARGTGNAAATVAAQLHEVGERTRVTVDTDLKIVGKLAQFGSGMLQQVSE
+ KLLGQFVDSLEAELAAQSSESPQGTPPATEAAPIDLLQLADGGQLKKYGSALLAALTV
+ LLLIWVLRRRR"
+ gene complement(448164..449060)
+ /locus_tag="BQ2027_MB0377C"
+ CDS complement(448164..449060)
+ /locus_tag="BQ2027_MB0377C"
+ /note="Mb0377c, -, len: 298 aa. Equivalent to Rv0370c,
+ len: 298 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 298 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), similar to many hypothetical
+ proteins, but also similar to ORF4|X82447|OCCOXMSL4_4
+ Protein of coxMSL gene cluster from
+ Pseudomonas/Oligotropha carboxidovorans (295 aa), FASTA
+ scores: opt: 851, E(): 0, (48.2% identity in 282 aa
+ overlap); AJ224684|BJAJ4684_3 cooxS from Bradyrhizobium
+ japonicum (302 aa), FASTA scores: opt: 881, E(): 0, (47.6%
+ identity in 290 aa overlap). Also highly similar to
+ MTCY428_21 from Mycobacterium tuberculosis. Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop). Mb0377c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="CAB5248082.1"
+ /translation="MTFASPDDVIRRFDEQNYLLDTGTASAIYLAVTLGRPLLLEGEP
+ GVGKTTAAKTLAVVLDTTLIRLQCYEGLTANEALYDWNYQRQLLSIRLAEARGKGISD
+ ISEADLYTEAYLVDRPILRCVRHRGPTPPVLLIDEIDRADDEFEALLLEFLGESAVTV
+ PELGTFLAECPPIAVLTSNRSRDLHDALRRRCLYHWIDYPEPDRAAAIVRRTVPGATA
+ PLIENATQFVCTARDLDLDKPPGVAETIDWVAALVALGVADLTAADSSPALASLGALA
+ KTPDDRTQIRDAYQAFTECSHA"
+ gene complement(449057..449650)
+ /locus_tag="BQ2027_MB0378C"
+ CDS complement(449057..449650)
+ /locus_tag="BQ2027_MB0378C"
+ /EC_number="2.7.7.76"
+ /note="Mb0378c, -, len: 197 aa. Equivalent to Rv0371c,
+ len: 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 197 aa overlap). Conserved
+ hypothetical protein, similar to other hypothetical
+ proteins e.g. AL132824|SCAH10.09c|CAB60163.1|AL132824
+ hypothetical protein from Streptomyces coelicolor (207
+ aa), FASTA scores: opt: 247, E(): 4.5e-09, (32.3% identity
+ in 195 aa overlap). Also weak similarity with
+ YURE|D70017|Z99120|BSUB0017_134 hypothetical protein yurE
+ from Bacillus subtilis (197 aa), FASTA scores: opt: 217,
+ E(): 2.5e-08, (27.0% identity in 174 aa overlap). Mb0378c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Molybdenum cofactor cytidylyltransferase (EC"
+ /protein_id="CAB5248083.1"
+ /translation="MTATQITGVVLAAGRSNRLGTPKQLLPYRDTTVLGATLDVARQA
+ GFDQLILTLGGAASAVRAAMALDGTDVVVVEDVERGCAASLRVALARVHPRATGIVLM
+ LGDQPQVAPATLRRIIDVGPATEIMVCRYADGVGHPFWFSRTVFGELARLHGDKGVWK
+ LVHSGRHPVRELAVDGCVPLDVDTWDDYRRLLESVPS"
+ gene complement(449647..450402)
+ /locus_tag="BQ2027_MB0379C"
+ CDS complement(449647..450402)
+ /locus_tag="BQ2027_MB0379C"
+ /note="Mb0379c, -, len: 251 aa. Equivalent to Rv0372c,
+ len: 251 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 251 aa overlap). Conserved hypothetical
+ protein, showing some similarity with
+ CAB76248.1|X82447|COXF CoxF protein from
+ Pseudomonas/Oligotropha carboxidovorans (280 aa);
+ AJ224684|BJAJ4684_6 cooxS from Bradyrhizobium japonicum
+ (176 aa), FASTA scores: opt: 186, E(): 1.6e-05, (41.1%
+ identity in 95 aa overlap). Also similar to upstream ORF
+ Rv0376c from Mycobacterium tuberculosis (380 aa), FASTA
+ scores: E(): 6.8e-07, (31.0% identity in 277 aa overlap).
+ Mb0379c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Aerobic carbon monoxide dehydrogenase molybdenum
+ cofactor insertion protein CoxF"
+ /protein_id="CAB5248084.1"
+ /translation="MSISDRAAQLVAARTPFVRATVVRAQQPTSARPGDEAILLADGT
+ IEGFVGGHCAQNSVRKAAMGVLQAGESVLLRVLPDGDVHFPEAPGACVVVNPCLAGGS
+ LEIFLTPQLPAPLIQIYGETPIADALIELCGLLGYDARRDTDPADTDALPTAIVIASH
+ SGPEAEIIRTALDNGVGYVGLVASTVRGASILDSLDLSDAERARVHTPVGLAIGAKTP
+ AEIAVSIAAELIATLRGGGPRGRKALADENGGA"
+ gene complement(450421..452820)
+ /locus_tag="BQ2027_MB0380C"
+ CDS complement(450421..452820)
+ /locus_tag="BQ2027_MB0380C"
+ /note="Mb0380c, -, len: 799 aa. Equivalent to Rv0373c,
+ len: 799 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 799 aa overlap). Probable carbon
+ monoxide dehydrogenase, large chain (EC 1.2.99.2), highly
+ similar to others e.g. AAD00363.1| U80806|CUTL carbon
+ monoxide dehydrogenase large subunit CutL protein from
+ Hydrogenophaga pseudoflava (803 aa);
+ S49124|509391|CAA54902.1|X77931|1094915|2107180C|CUTA
+ carbon-monoxide dehydrogenase large chain (EC 1.2.99.2)
+ (cut operon) from Pseudomonas thermocarboxydovorans (842
+ aa); C56279|809566|CAA57829.1|X82447|OCCOXMSL4_3|COXL
+ carbon-monoxide dehydrogenase large chain (EC 1.2.99.2)
+ (cluster coxMSL) from Pseudomonas/Oligotropha
+ carboxydovorans (809 aa), FASTA scores: opt: 2484, E(): 0,
+ (56.0% identity in 804 aa overlap); etc. Protein product
+ from Mb0380c detected using SWATH mass spectrometry.
+ Mb0380c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CARBON MONOXYDE DEHYDROGENASE (LARGE
+ CHAIN)"
+ /protein_id="CAB5248085.1"
+ /translation="MTTIESRPPSPEDLADNAQQPCGHGRMMRKEDPRFIRGRGTYVD
+ DVALPGMLHLAILRSPYAHARIVRIDVTAAQAHPKVKAVVTGADLAAKGLAWMPTLAN
+ DVQAVLATDKTRFQGQEVASVVAEDRYSARDACELVDVDYEPRDPVVDARTALDPSAP
+ VIRTDLEGKSDNHIFDWETGDAAATEAVFAKADVVVQQEIVYPRVHPAPMETCGAVAD
+ LDPVTGKLTLWTTSQAPHAHRTLYALVAGLPEHKIRVISPDIGGGFGNKVPIYPGYVC
+ AIVASLLLDKPVKWMEDRSENLTSTGFARDYIMVGEIAANRDGKILAIRSNVLADHGA
+ FNAQAAPAKYPAGFFGVFTGSYDIEAAYCHMTAVYTNKAPGGVAYACSFRITEAVYFV
+ ERLVDCLAFELKMDPAELRLRNLLRPNQFPYQSKTGWVYDSGDYETTMRKAMNMIGYE
+ ALRAEQKQRRARGELMGIGMSFFTEAVGAGPRKDMDILGLGMADGCELRVHPTGKAVL
+ RLSVQTQGQGHETTFAQIVAEELGIAPDDIEVVHGDTDQTPFGLGTYGSRSTPVSGGA
+ AALVARKVRDKAKIIASGMLEVSVADLQWEKGKFHVKGDPSAAVTIADIAMRAHGAGD
+ LPEGIEGGLDAEVCYNPSNLTYPYGAYFCVVDIDPGTAVVKVRRFLAVDDCGTRINPM
+ IIEGQVHGGIVDGIGMALMEMIAFDEDGNCLGGSLMDYLIPTALEVPHLETGHTVTPS
+ PHHPIGAKGIGESATVGSPPAVVNAVVDALAPFGVRHADMPLTPSRVWEAMQGRATPP
+ I"
+ gene complement(452817..453296)
+ /locus_tag="BQ2027_MB0381C"
+ CDS complement(452817..453296)
+ /locus_tag="BQ2027_MB0381C"
+ /note="Mb0381c, -, len: 159 aa. Equivalent to Rv0374c,
+ len: 159 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 159 aa overlap). Probable carbon
+ monoxide dehydrogenase, small chain (EC 1.2.99.2), highly
+ similar to others e.g.
+ B56279|5822285|X82447|OCCOXMSL4_2|COXS carbon-monoxide
+ dehydrogenase small chain (EC 1.2.99.2) from
+ Pseudomonas/Oligotropha carboxydovorans (166 aa), FASTA
+ scores: opt: 662, E(): 0, (59.3% identity in 150 aa
+ overlap); CAA12063.1|AJ224684 putative carbon monoxide
+ dehydrogenase small subunit from Bradyrhizobium japonicum
+ (161 aa); S49123|509390|CAA54901.1|X77931|CUTC
+ carbon-monoxide dehydrogenase small chain (EC 1.2.99.2)
+ from Pseudomonas thermocarboxydovorans (163 aa); etc."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CARBON MONOXYDE DEHYDROGENASE (SMALL
+ CHAIN)"
+ /protein_id="CAB5248086.1"
+ /translation="MQVNMTVNGEPVTAEVEPRMLLVHFLRDQLRLTGTHWGCDTSNC
+ GTCVVEVDGVPVKSCTMLAVMASGHSIRTVEGLAGPDGQLDPVQEGFMRCHGLQCGFC
+ TPGMLITARALLDRNPDPDEQTIREAISGQICRCTGYTTIVRSIQWAAAHQTVKAQS"
+ gene complement(453311..454171)
+ /locus_tag="BQ2027_MB0382C"
+ CDS complement(453311..454171)
+ /locus_tag="BQ2027_MB0382C"
+ /note="Mb0382c, -, len: 286 aa. Equivalent to Rv0375c,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 286 aa overlap). Probable carbon
+ monoxide dehydrogenase, medium chain (EC 1.2.99.2),
+ similar to others e.g. AAD00361.1|U80806|CUTM carbon
+ monoxide dehydrogenase middle subunit from Hydrogenophaga
+ pseudoflava (287 aa); S49122|509389|CAA54900.1|X77931|CUTB
+ carbon-monoxide dehydrogenase medium chain (EC 1.2.99.2)
+ from Pseudomonas thermocarboxydovorans (287 aa);
+ A56279|809564|CAA57827.1|X82447|OCCOXMSL4_1|COXM|CODH
+ carbon-monoxide dehydrogenase medium chain (EC 1.2.99.2)
+ from Pseudomonas/Oligotropha carboxydovorans (288 aa),
+ FASTA scores: opt: 594, E(): 0, (37.5% identity in 277 aa
+ overlap); etc. Protein product from Mb0382c detected using
+ SWATH mass spectrometry. Mb0382c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CARBON MONOXYDE DEHYDROGENASE (MEDIUM
+ CHAIN)"
+ /protein_id="CAB5248087.1"
+ /translation="MDHAIGLLDRLGEGARVVAGGHSLLPMMKLRIANPEYLVDINDL
+ APELGYVVVGGINNPNLVRLGAMTRHREILDSDALAAVCPIFRDAERVIADPVVRNRG
+ TLGGSLCQADPAEDLSTVCTVLDAVCLAKGPSGEREIAIDDFLVGPYETALAHNEVLI
+ EVRIPLRHNTSSAYAKVERRVGDWAITAAGAAVTLDGQTILAARVGLTAVNPDPVALA
+ ELSAGLVGQPATEEVFAEAGRRAAQACTPVTDVRGTAEYKRHLAGELTVRTLRTAAGR
+ VLGAPAAPEA"
+ gene complement(454247..455389)
+ /locus_tag="BQ2027_MB0383C"
+ CDS complement(454247..455389)
+ /locus_tag="BQ2027_MB0383C"
+ /note="Mb0383c, -, len: 380 aa. Equivalent to Rv0376c,
+ len: 380 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 380 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ T35481|4008539|CAA22508.1|AL034492|SC6C5.10 hypothetical
+ protein from Streptomyces coelicolor (395 aa); and
+ AAK64260.1|AF373840_20 ORF377 hypothetical CoxI from
+ Arthrobacter nicotinovorans (377 aa). And similar to other
+ conserved hypothetical proteins e.g.
+ NP_101963.1|14021136|BAB47749.1|AP002994 hypothetical
+ protein from Mesorhizobium loti (245 aa). Note that
+ C-terminus shows similarity with C-termini of
+ CAB76248.1|X82447|COXF CoxF protein from
+ Pseudomonas/Oligotropha carboxidovorans (280 aa);
+ CAB76250.1|X82447|COXI CoxI protein from
+ Pseudomonas/Oligotropha carboxidovorans (330 aa); and
+ AJ224684|BJAJ4684_6 cooxS from Bradyrhizobium japonicum
+ (176 aa), FASTA scores: E(): 1.9e-17, (47.1% identity in
+ 138 aa overlap). Also some partial similarity with
+ AJ224684|BJAJ4684_5 cooxS from Bradyrhizobium japonicum
+ (107 aa), FASTA scores: opt: 321, E(): 4.2e-14, (53.3%
+ identity in 92 aa overlap); E1184330|Z99120|YURF YURF
+ PROTEIN from Bacillus subtilis (330 aa), FASTA scores:
+ opt: 170, E(): 2.9e- 16, (27.5% identity in 345 aa
+ overlap). Also similar to downstream ORF Rv0372c from
+ Mycobacterium tuberculosis (251 aa), FASTA scores: E():
+ 2.1e-06, (30.7% identity in 277 aa overlap). Protein
+ product from Mb0383c detected using SWATH mass
+ spectrometry. Mb0383c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Xanthine and CO dehydrogenases maturation
+ factor, XdhC/CoxF family"
+ /protein_id="CAB5248088.1"
+ /translation="MAIWAAGDTAGVATVVRTLRSAPRPPGAAMVVAPDGSVSGSVSG
+ GCVEGAVYELAAEVAQTGIPRLEHYGVSDDTAFAVGLTCGGIIDVFVEPVSRATFPEL
+ GELADDIGAQRPVAIATVIAHPDERRVGRRLVIRPDTKSPVTGSLGSARADAAVIDDA
+ RGLLAVGRSEILEYGPDGQRRGEGMEVFVSSHAPRPRMLVFGAIDFAAALARQGSFLG
+ YRVTVCDARAVFATPARFPTADDVVVAWPHRYLAAQAEAGGIDERTVICVLTHDPKFD
+ VPVLEVALRLGVGYVGAMGSRKTHDDRMDRLRAAGLTDAELSRLSSPIGLDLGARTPE
+ ETAVSIAADIIARRWGGGGRPLADIAGRIHHDAQVAGEFKDYLTRH"
+ gene 455438..456403
+ /locus_tag="BQ2027_MB0384"
+ CDS 455438..456403
+ /locus_tag="BQ2027_MB0384"
+ /note="Mb0384, -, len: 321 aa. Equivalent to Rv0377, len:
+ 321 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 321 aa overlap). Probable transcription
+ regulator, lysR family, showing similarity with many
+ hypothetical transcriptional regulators lysR homolog e.g.
+ P32484|YEIE_ECOLI|M89774 HYPOTHETICAL TRANSCRIPTIONAL
+ REGULATOR from Escherichia coli (293 aa), FASTA scores:
+ opt: 265, E(): 4.9e-11, (28.6% identity in 266 aa
+ overlap). Also similar to Rv2282c from Mycobacterium
+ tuberculosis. Contains PS00044 bacterial regulatory
+ protein lysR family signature. SEEMS TO BELONG TO THE LYSR
+ FAMILY OF TRANSCRIPTIONAL REGULATORS. Mb0384 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY LYSR-FAMILY)"
+ /protein_id="CAB5248089.1"
+ /translation="MTPAQLRAYSAVVRLGSVRAAAAELGLSDAGVSMHVAALRKELD
+ DPLFTRTGAGLAFTPGGLRLASRAVEILGLQQQTAIEVTEAAHGRRLLRIAASSAFAE
+ HAAPGLIELFSSRADDLSVELSVHPTSRFRELICSRAVDIAIGPASESSIGSDGSIFL
+ RPFLKYQIITVVAPNSPLAAGIPMPALLRHQQWMLGPSAGSVDGEIATMLRGLAIPES
+ QQRIFQSDAAALEEVMRVGGATLAIGFAVAKDLAAGRLVHVTGPGLDRAGEWCVATLA
+ PSARQPAVSELVGFISTPRCIQAMIRGSGVGVTRFRPKVHVTLWS"
+ gene 456654..456875
+ /locus_tag="BQ2027_MB0385"
+ CDS 456654..456875
+ /locus_tag="BQ2027_MB0385"
+ /note="Mb0385, -, len: 73 aa. Equivalent to Rv0378, len:
+ 73 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 73 aa overlap). Conserved hypothetical
+ gly-rich protein, showing some similarity to M.
+ tuberculosis PE_PGRS family; also similar to
+ MTCY06H11_16|Z85982 hypothetical glycine-rich 88.5 KD
+ protein (1011 aa), FASTA scores: opt: 237, E(): 0.0032,
+ (58.7% identity in 63 aa overlap); MTV043_25."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL GLYCINE RICH PROTEIN"
+ /protein_id="CAB5248090.1"
+ /translation="MSGRWEAGNADGNGGSAGLIGSGGAGGDGGSGGATGAGGEGGDA
+ GASGSINGNAGDPGNSGERGAVGKPGAPG"
+ gene 456994..457209
+ /gene="secE2"
+ /locus_tag="BQ2027_MB0386"
+ CDS 456994..457209
+ /gene="secE2"
+ /locus_tag="BQ2027_MB0386"
+ /note="Mb0386, secE2, len: 71 aa. Equivalent to Rv0379,
+ len: 71 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 71 aa overlap). Possible secE2,
+ protein transport protein, showing similarity with
+ P27340|S61G_SULSO|SECE PREPROTEIN TRANSLOCASE SECE SUBUNIT
+ (PROTEIN TRANSPORT PROTEIN SEC61 GAMMA SUBUNIT HOMOLOG)
+ from Sulfolobus acidocaldarius (65 aa), FASTA scores: opt:
+ 79, E(): 4.7. (30.3% identity in 66 aa overlap); and
+ hypothetical proteins e.g. Q9HPW4|VNG1446H HYPOTHETICAL
+ PROTEIN from Halobacterium sp. strain NRC-1 (77 aa);
+ Q9I794|PA0038 HYPOTHETICAL PROTEIN from Pseudomonas
+ aeruginosa (71 aa); etc. Also highly similar to
+ U85467|MTU85467_1 hypothetical Mycobacterium tuberculosis
+ protein from a patient isolate (116 aa), FASTA scores:
+ opt: 443, E(): 7.7e-29, (98.6% identity in 71 aa overlap).
+ Note that for Rv0379|MTV036.14, a translation initiation
+ region different to the one in U85467|MTU85467_1 was
+ chosen. COULD BE A PART OF THE PROKARYOTIC PROTEIN
+ TRANSLOCATION APPARATUS WHICH COMPRISE SECA|Rv3240c,
+ SECD|Rv2587c, SECE|Rv0638, SECF|Rv2586c, SECG|Rv1440 AND
+ SECY|Rv0732. Protein product from Mb0386 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0386 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PROTEIN TRANSPORT PROTEIN SECE2"
+ /protein_id="CAB5248091.1"
+ /translation="MSVYKVIDIIGTSPTSWEQAAAEAVQRARDSVDDIRVARVIEQD
+ MAVDSAGKITYRIKLEVSFKMRPAQPR"
+ gene complement(457285..457836)
+ /locus_tag="BQ2027_MB0387C"
+ CDS complement(457285..457836)
+ /locus_tag="BQ2027_MB0387C"
+ /note="Mb0387c, -, len: 183 aa. Equivalent to Rv0380c,
+ len: 183 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 183 aa overlap). Possible RNA
+ methyltransferase (EC 2.1.1.-), equivalent to
+ CAC32002.1|AL583925 possible RNA methyltransferase from
+ Mycobacterium leprae (182 aa). Also some similarity with
+ others methyltransferases e.g.
+ P19396|TRMH_ECOLI|78514|JV0043 TRNA
+ (GUANOSINE-2'-O-)-METHYLTRANSFERASE (TRNA
+ METHYLTRANSFERASE) from Escherichia coli (229 aa), FASTA
+ scores: opt: 227, E(): 1.4e-09, (28.9% identity in 166 aa
+ overlap). Also similar to Rv0881, Rv3579c, Rv1644 from
+ Mycobacterium tuberculosis. Protein product from Mb0387c
+ detected using SWATH mass spectrometry. Mb0387c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE RNA METHYLTRANSFERASE (RNA METHYLASE)"
+ /protein_id="CAB5248092.1"
+ /translation="MLLRDGDARNVVDAYRYWTREAIIADIDTRRHPLHVAIENFGHD
+ ANIGSVVRTANAFAVHTVHIVGRRRWNRRGAMVTDRYQRLCHHDSTTGLLEFAAGAGL
+ TVVAVDNVPGAARLEQTALPRECLLLFGQEGPGITDDARAGAAVTVSIAQFGSTRSIN
+ AGVAAGIAMHAWIRQHADLGRAW"
+ gene complement(457932..458840)
+ /locus_tag="BQ2027_MB0388C"
+ CDS complement(457932..458840)
+ /locus_tag="BQ2027_MB0388C"
+ /note="Mb0388c, -, len: 302 aa. Equivalent to Rv0381c,
+ len: 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 302 aa overlap). Hypothetical unknown
+ protein. Equivalent to AAK44616.1 from Mycobacterium
+ tuberculosis strain CDC1551 (254 aa) but longer 48 aa.
+ Mb0388c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248093.1"
+ /translation="MRILVAWATCGAVVLSGLTGCSGSSHSGRTYGAQSARTGESLAV
+ LGWNMSVSNLRWSGDYVLIDVDASPTDPHAPHAKPEDIRFGLYGALAHPMESAALGSC
+ GDAMAHVRDVVSPLSAPAGRLTGTVCLGPLKERSAVRGVYTYSPRDRIPGTAAAYPAA
+ FPVGMLPTNQNDAGLVVKTTSVSAWRADGMQLGKPQLGDPVAFTGNGYMLLGLEVDAV
+ PDRYRDDSAARGGPMMLLAAPTLPGRGLSPACATYGSSVLILPDALLDAVHISASLCT
+ QGEINEALLYATVATVGTHAALWTSR"
+ gene complement(458858..459397)
+ /gene="pyrE"
+ /locus_tag="BQ2027_MB0389C"
+ CDS complement(458858..459397)
+ /gene="pyrE"
+ /locus_tag="BQ2027_MB0389C"
+ /note="Mb0389c, pyrE, len: 179 aa. Equivalent to Rv0382c,
+ len: 179 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 179 aa overlap). Probable pyrE,
+ orotate phosphoribosyltransferase (EC 2.4.2.10),
+ equivalent to CAC32004.1|AL583925 probable
+ purine/pyrimidine phosphoribosyltransferase from
+ Mycobacterium leprae (179 aa). Also highly similar to many
+ others e.g. T36540|4753874|CAB42037.1|AL049754|SCH10.28c
+ probable orotate phosphoribosyltransferase from
+ Streptomyces coelicolor (182 aa);
+ H69115|2622996|AAB86326.1|AE000938_10|MTH1860 probable
+ orotate phosphoribosyltransferase from Methanobacterium
+ thermoautotrophicum (180 aa), FASTA scores: opt: 389, E():
+ 2.7e-20, (40.7% identity in 172 aa overlap);
+ O08359|PYRE_SULAC|2065444|CAA73352.1|Y12822 OROTATE
+ PHOSPHORIBOSYLTRANSFERASE from Sulfolobus acidocaldarius
+ (197 aa); etc. Note that also similar to other puridine
+ 5'-monophosphate synthases (umpA genes; UMP synthases),
+ generally in N-terminus that corresponds to orotate
+ phosphoribosyltransferase activity. Contains PS00589 PTS
+ HPR component serine phosphorylation site signature.
+ BELONGS TO THE PURINE/PYRIMIDINE PHOSPHORIBOSYLTRANSFERASE
+ FAMILY. Note that previously known as umpA. Protein
+ product from Mb0389c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0389c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OROTATE PHOSPHORIBOSYLTRANSFERASE PYRE
+ (OPRT) (OPRTASE)"
+ /protein_id="CAB5248094.1"
+ /translation="MAGPDRAELAELVRRLSVVHGRVTLSSGREADYYVDLRRATLHH
+ RASALIGRLMRELTADWDYSVVGGLTLGADPVATAIMHAPGRPIDAFVVRKSAKAHGM
+ QRLIEGSEVTGQRVLVVEDTSTTGNSALTAVHAVQDVGGEVVGVATVVDRATGAAEAI
+ EAEGLRYRSVLGLADLGLD"
+ gene complement(459478..460332)
+ /locus_tag="BQ2027_MB0390C"
+ CDS complement(459478..460332)
+ /locus_tag="BQ2027_MB0390C"
+ /note="Mb0390c, -, len: 284 aa. Equivalent to Rv0383c,
+ len: 284 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 284 aa overlap). Possible conserved
+ secreted protein, with hydrophobic stretch in N-terminus
+ and Pro-rich C-terminus. Equivalent to CAC32006.1|AL583925
+ possible secreted protein from Mycobacterium leprae (286
+ aa). Protein product from Mb0390c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0390c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED SECRETED PROTEIN"
+ /protein_id="CAB5248095.1"
+ /translation="MVPLWFTLSALCFVGAVVLLYVDIDRRRGRSRRRKSWARSHGFD
+ YERESTEILKRWTRGVMSTVGDVAAHNVVLGQIRGEAVYIFDLEEVATVIALHRKVGT
+ NVVVDLRLKGLKEPRESDIWLLGAIGPRMVYSTNLDAARRACDRRMVTFAHTAPDCAE
+ IMWNEQNWTLVSMPIASTRAQWDEGLRTVRQFNDLLRVLPPLPQEMPQQTGVGPRGAA
+ PGRPVAPGGPAELPPRRAQPDPATTVLPDPARRAPEPIRRDEGRSEGVRRPPPAGRNG
+ QQATNYQH"
+ gene complement(460473..463019)
+ /gene="clpB"
+ /locus_tag="BQ2027_MB0391C"
+ CDS complement(460473..463019)
+ /gene="clpB"
+ /locus_tag="BQ2027_MB0391C"
+ /standard_name="htpM"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0391c, clpB, len: 848 aa. Equivalent to Rv0384c,
+ len: 848 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 848 aa overlap). Probable clpB
+ (alternate gene name: htpM), endopeptidase ATP-binding
+ protein, chain B (EC 3.-.-.-), equivalent to
+ AC32007.1|AL583925 heat shock protein from Mycobacterium
+ leprae (848 aa). Also highly similar to others e.g.
+ P53532|CLPB_CORGL|1163118|AAB49540.1|U43536|CGU43536_1
+ CLPB PROTEIN (heat-inducible expression) from
+ Corynebacterium glutamicum (852 aa), FASTA scores: opt:
+ 4113, E(): 0, (74.5% identity in 846 aa overlap);
+ T36551|4753885|CAB42048.1|AL049754|clpB|SCOEDB|SCH10.39c
+ probable ATP-dependent proteinase ATP-binding chain from
+ Streptomyces coelicolor (853 aa);
+ P03815|CLPB_ECOLI|1788943|AAC75641.1|AE000345 CLPB PROTEIN
+ (HEAT SHOCK PROTEIN F84.1) from Escherichia coli strains
+ K12 and O157:H7 (857 aa); etc. Also similar to
+ Rv3596c|ClpC from Mycobacterium tuberculosis. Contains
+ PS00870 and PS00871 Chaperonins clpA/B signatures and two
+ PS000017 ATP/GTP-binding site motives A (P-loop). BELONGS
+ TO THE CLPA/CLPB FAMILY. Contains probable coiled-coil
+ domain from aa 411-503. Protein product from Mb0391c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0391c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ENDOPEPTIDASE ATP BINDING PROTEIN
+ (CHAIN B) CLPB (CLPB PROTEIN) (HEAT SHOCK PROTEIN F84.1)"
+ /protein_id="CAB5248096.1"
+ /translation="MDSFNPTTKTQAALTAALQAASTAGNPEIRPAHLLMALLTQNDG
+ IAAPLLEAVGVEPATVRAETQRLLDRLPQATGASTQPQLSRESLAAITTAQQLATELD
+ DEYVSTEHVMVGLATGDSDVAKLLTGHGASPQALREAFVKVRGSARVTSPEPEATYQA
+ LQKYSTDLTARAREGKLDPVIGRDNEIRRVVQVLSRRTKNNPVLIGEPGVGKTAIVEG
+ LAQRIVAGDVPESLRDKTIVALDLGSMVAGSKYRGEFEERLKAVLDDIKNSAGQIITF
+ IDELHTIVGAGATGEGAMDAGNMIKPMLARGELRLVGATTLDEYRKHIEKDAALERRF
+ QQVYVGEPSVEDTIGILRGLKDRYEVHHGVRITDSALVAAATLSDRYITARFLPDKAI
+ DLVDEAASRLRMEIDSRPVEIDEVERLVRRLEIEEMALSKEEDEASAERLAKLRSELA
+ DQKEKLAELTTRWQNEKNAIEIVRDLKEQLEALRGESERAERDGDLAKAAELRYGRIP
+ EVEKKLDAALPQAQAREQVMLKEEVGPDDIADVVSAWTGIPAGRLLEGETAKLLRMED
+ ELGKRVIGQKAAVTAVSDAVRRSRAGVSDPNRPTGAFMFLGPTGVGKTELAKALADFL
+ FDDERAMVRIDMSEYGEKHTVARLIGAPPGYVGYEAGGQLTEAVRRRPYTVVLFDEIE
+ KAHPDVFDVLLQVLDEGRLTDGHGRTVDFRNTILILTSNLGSGGSAEQVLAAVRATFK
+ PEFINRLDDVLIFEGLNPEELVRIVDIQLAQLGKRLAQRRLQLQVSLPAKRWLAQRGF
+ DPVYGARPLRRLVQQAIGDQLAKMLLAGQVHDGDTVPVNVSPDADSLILG"
+ gene 463152..464324
+ /locus_tag="BQ2027_MB0392"
+ CDS 463152..464324
+ /locus_tag="BQ2027_MB0392"
+ /note="Mb0392, -, len: 390 aa. Equivalent to Rv0385, len:
+ 390 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 390 aa overlap). Probable
+ monooxygenase (EC 1.-.-.-), similar to
+ T37003|5738846|CAB52917.1|AL109949 probable
+ flavohemoprotein from Streptomyces coelicolor (435 aa);
+ and similar in part (C-termini) to various monooxygenases
+ e.g. P19734|DMPP_PSESP|94993|F37831 PHENOL HYDROXYLASE P5
+ PROTEIN (PHENOL 2-MONOOXYGENASE P5 COMPONENT) (EC
+ 1.14.13.7) from Pseudomonas putida (353 aa), FASTA scores:
+ opt: 363, E(): 4.2e-16, (31.8% identity in 255 aa
+ overlap); S47292|2120861|pir|S70085 phenol 2-monooxygenase
+ (EC 1.14.13.7) chain mopP from Acinetobacter calcoaceticus
+ (350 aa); P21394|XYLA_PSEPU|94933|B37316 XYLENE
+ MONOOXYGENASE ELECTRON TRANSFER COMPONENT (EC 1.18.1.3)
+ [INCLUDES: FERREDOXIN; FERREDOXIN--NAD(+) REDUCTASE] from
+ Pseudomonas putida plasmid pWW0 (350 aa);
+ AAC38360.1|AF043544|NtnMA|ntnA reductase component of
+ 4-nitrotoluene monooxygenase from Pseudomonas sp. (328
+ aa); etc. Protein product from Mb0392 detected using SWATH
+ mass spectrometry. Mb0392 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MONOOXYGENASE"
+ /protein_id="CAB5248097.1"
+ /translation="MGLEDRDALRVLQNAFKLDDPELVRRFYAHWFALDASVRDLFPP
+ DMGAQRAAFGQALHWVYGELVAQRAEEPVAFLAQLGRDHRKYGVLPTQYDTLRRALYT
+ TLRDYLGHPSRGAWTDAVDEAAGQSLNLIIGVMSGAADADDAPAWWDGTVVEHIRVSR
+ DLAVARLQLDRPLHYYPGQYVNVHVPQCPRRWRYLSPAIPADPNGRIEFHVRVVPGGL
+ VSNAIVGETRPGDRWRLSGPHGAFRVDRDGGDVLMVAGSTGLAPLRALIIDLSRFAVN
+ PRVHLFFGARYACELYDLPTLWQIAAHNPWLSVSPVSEYNGDPAWAADYPDVSAPRGL
+ HVRQTGRLPDVVSRYGGWGDRQILICGGPAMVRATKAALIAKGAPPERIQHDPLSR"
+ gene 464428..467685
+ /locus_tag="BQ2027_MB0393"
+ CDS 464428..467685
+ /locus_tag="BQ2027_MB0393"
+ /note="Mb0393, -, len: 1085 aa. Equivalent to Rv0386, len:
+ 1085 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 1085 aa overlap). Probable regulatory
+ protein, LuxR/uhpA family, highly similar to
+ CAC30706.1|AL583923 possible transcriptional regulator
+ from Mycobacterium leprae (1106 aa). Also similar in part
+ to other regulatory proteins e.g. CAB95788.1|AL359949
+ putative multi-domain regulatory protein from Streptomyces
+ coelicolor (780 aa); N-terminus of CAB92369.1|AL356612
+ putative AfsR-like regulatory protein from Streptomyces
+ coelicolor (1114 aa); N-terminus of
+ NP_107139.1|14026327|BAB52925.1|AP003009 transcriptional
+ regulator from Mesorhizobium loti (952 aa);
+ AFSR_STRCO|P25941 regulatory protein afsr from
+ Streptomyces coelicolor (993 aa), FASTA scores: opt: 224,
+ E() : 1.1e-06, (26.1% identity in 867 aa overlap); etc.
+ Also similar to many putative Mycobacterium tuberculosis
+ regulatory proteins e.g. AL0212|MTV008_44 (1137 aa), FASTA
+ scores: opt: 3756, E(): 0, (56.7% identity in 1089 aa
+ overlap). Contains PS00017 ATP/GTP-binding site motif A
+ (P-loop), PS00622 Bacterial regulatory proteins, luxR
+ family signature and probable helix-turn-helix motif at aa
+ 1042-1063 (Score 1025, +2.68 S D). BELONGS TO THE
+ LUXR/UHPA FAMILY OF TRANSCRIPTIONAL REGULATORS. Protein
+ product from Mb0393 detected using SWATH mass
+ spectrometry. Mb0393 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY LUXR/UHPA-FAMILY)"
+ /protein_id="CAB5248098.1"
+ /translation="MSKLLPRGTVTLLLADVEGSTWLWETHPDDMGAAVARLDKAVSG
+ VIAAHDGVRPVEQGEGDSFVLAFACASDAVAAALDLQRARLAPIRLRIGVHTGEVALR
+ DEGNYAGPTINRTARLRDLAHGGQTVLSGVTESLVIDRLPDKAWLVDLGTHALRDLSR
+ PERVMQLCHPELRIDFPPLRVANDDVAHGLPVHLTRFVGRGAQITEVHRLVTDNRLVT
+ LTGAGGVGKTRLAAQLAAQIAGEFGRAWFVDLAPITDPDLVPVTVAGALGLHDQPGRS
+ TTDTVLRFLGGRPALVVLDNCEHLLDATAALVLALVKACRGVRLLATCREPLRVEGEV
+ SYRVPSLSLSDEAVEMFCYRAQRVRPDFRLTDDNSAAVTEICKRLDGLPLAIELAAAR
+ LRSMTLDEIIDGLRDRFALLTGGARTAAHRQQTLWASVDWSYTLLTEPERTLFRRLAV
+ FVGCFFVDDAQAVACSGDVQRYQVLDEITLLVDKSLVMADDNSGRTCYRLCETMRHYA
+ LEKLSEAGEVDAVFARHRDYYTALAARVDNPGPSDYSHCLDQAETEIDNLRAAFVWNR
+ ENSDTEGALALASSLLRVWMTRGRIQEGRAWFDSILADENARHLEVAAAVRARALADK
+ ALLDIFVDAAAGMEQAQQALVIAREVDEPALLSRALTACGLIAVAVARADAAASYFAE
+ AIDLARAVDDRWRLAQILTFQAVDAVVAGDPVAARPAAQEARELAAAIGDHSNALWCR
+ WCLGYAQLMRGELAAAAAQFGEVVDEAEASQEVLHKANSLQGLAFALAYQGELSAARA
+ AADAALEAAELGEYFAGMGYSALTTAALAAGDVQTAQHASEAAWRNLSLALPLSAAVQ
+ RAFNAQAALAGGDLSAARRWCDDAVQSMTGHHLAMALATRARIAVAEGKREEAERDAH
+ KALACAAESGAHLDLPDVLECLAGLASDAGTHHAAARLFGAAEAIRQQIGSVRFAIYR
+ SDYVQSVTALRDAMGEKDFAAAWAEGAALSIKETIAYAQRGHSWRKRPATGWESLTPT
+ EIDVVRLVGEGLANKDIATRLFVSPRTVQTHLTHVYTKLGFTSRLQLAQAAARRT"
+ gene complement(467689..469020)
+ /gene="PPE9"
+ /locus_tag="BQ2027_MB0394C"
+ CDS complement(467689..469020)
+ /gene="PPE9"
+ /locus_tag="BQ2027_MB0394C"
+ /note="Mb0394c, PPE9, len: 443 aa. Equivalent to Rv0388c
+ and Rv0387c, len: 180 aa and 244 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (95.1% identity in 164 aa
+ overlap and 100.0% identity in 244 aa overlap). Rv0388c:
+ Member of the Mycobacterium tuberculosis PPE family,
+ highly similar to others e.g. MTCY10G2_10|Z92539 from
+ Mycobacterium tuberculosis (391 aa), FASTA scores: opt:
+ 667, E(): 0, (58.3% identity in 180 aa overlap) but much
+ shorter. Rv0387c: conserved hypothetical protein, showing
+ some similarity to MTCI237.20c, and M17282|HUMEL20_1 Human
+ elastin gene, exon 1, Elastin (687 aa), FASTA scores: opt:
+ 193, E(): 0.35, (34.4% identity in 189 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0388c and Rv0387c exist as 2
+ separate genes. In Mycobacterium bovis, 3 different base
+ substitutions, the first of 14 bases, the second of 8
+ bases (tctacagt-gctacagg), and lastly of 28 bases, leads
+ to a longer single product. Mb0394c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein"
+ /protein_id="CAB5248099.1"
+ /translation="MDFGALPPEINSARIYSGPGSRPLMQAAAAWQRLANELTATAAS
+ YSSVISGLTGDDWLGPSALSMAAAAVPYVAWMRATAASAEQAAAQAVAAANAYESAYA
+ ATVPPTVIAANRRTMLSLVKTNVFGQNTPAIATSEAQYGAMWAQDIVAMEGYAGASAA
+ ASQLPPFTPPPATTSGAGSLSDAAATAAQAVVPAAAATDVSLLPTLQSFLPPPFDAIP
+ NPIEDLDVLVAAAVAVAAGSLGVSAAQLGEIYRHDVVDEAQKAPHCPAESDQTPAGAA
+ GDGDLPEVGGRVTSPPQPPVAALTGYSANIGGLSVPHSWNLPPAVRQVAAMFPGATPM
+ YMTGSSDGSYAGLAAAGLAGTGLAGLAARGGSAPTPAAAAPAGAGGAGPAATRPAAQQ
+ TPAVPAAAAGSAIPGLPPGLPPGVVANLAATLAAIPGATIIVVPPSPNANQ"
+ gene 469354..470613
+ /gene="purT"
+ /locus_tag="BQ2027_MB0395"
+ CDS 469354..470613
+ /gene="purT"
+ /locus_tag="BQ2027_MB0395"
+ /note="Mb0395, purT, len: 419 aa. Equivalent to Rv0389,
+ len: 419 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 419 aa overlap). Probable purT,
+ phosphoribosylglycinamide formyltransferase 2 (EC
+ 2.1.2.-), similar to others e.g. P33221|PURT_ECOLI|B1849
+ phosphoribosylglycinamide formyltransferase 2 from
+ Escherichia coli strain K-12 (391 aa), FASTA scores: opt:
+ 481, E(): 1.3e-22, (40.1% identity in 379 aa overlap);
+ etc. BELONGS TO THE PURK / PURT FAMILY. COFACTOR:
+ MAGNESIUM. Protein product from Mb0395 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0395 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHORIBOSYLGLYCINAMIDE
+ FORMYLTRANSFERASE 2 PURT (GART 2) (GAR TRANSFORMYLASE 2)
+ (5'-PHOSPHORIBOSYLGLYCINAMIDE TRANSFORMYLASE 2)
+ (FORMATE-DEPENDENT GAR TRANSFORMYLASE)"
+ /protein_id="CAB5248100.1"
+ /translation="MIDGWTEGQHEPTVRHERPAAPQDVRRVMLLGSAEPSRELAIAL
+ QGLGAEVIAVDGYVGAPAHRIADQSVVVTMTDAEELTAVIRRLQPDFLVTVTAAVSVD
+ ALDAVEQADGECTELVPNARAVRCTADREGLRRLAADQLGLPTAPFWFVGSLGELQAV
+ AVHAGFPLLVSPVAGVAGQGSSVVAGPNEVEPAWQRAAGHQVQPQTGGVSPRVCAESV
+ VEIEFLVTMIVVCSQGPNGPLIEFCAPIGHRDADAGELESWQPQKLSTAALDAAKSIA
+ ARIVKALGGRGVFGVELMINGDEVYFADVTVCPAGSAWVTVRSQRLSVFELQARATLG
+ LAVDTLMISPGAARVINPDHTAGRAAVGAAPPADALTGALGVPESDVVIFGRGLGVAL
+ ATAPEVAIARERAREVASRLNVPDSRE"
+ gene 470610..471032
+ /locus_tag="BQ2027_MB0396"
+ CDS 470610..471032
+ /locus_tag="BQ2027_MB0396"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0396, -, len: 140 aa. Equivalent to Rv0390, len:
+ 140 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 140 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ AL023514|MLCB4_11|CAA18942.1|AL023514 hypothetical protein
+ from Mycobacterium leprae (147 aa), FASTA scores: opt:
+ 778, E(): 0, (79.0% identity in 138 aa overlap). Also
+ similar to hypothetical proteins from several Rickettsia
+ species. Protein product from Mb0396 detected using
+ shotgun mass spectrometry. Mb0396 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Rhodanese-related sulfurtransferase"
+ /protein_id="CAB5248101.1"
+ /translation="MSYAGDITPLQAWEMLSDNPRAVLVDVRCEAEWRFVGVPDLSSL
+ GREVVYVEWATSDGTHNDNFLAELRDRIPADADQHERPVIFLCRSGNRSIGAAEVATE
+ AGITPAYNVLDGFEGHLDAEGHRGATGWRAVGLPWRQG"
+ gene 471029..472249
+ /gene="metZ"
+ /locus_tag="BQ2027_MB0397"
+ CDS 471029..472249
+ /gene="metZ"
+ /locus_tag="BQ2027_MB0397"
+ /note="Mb0397, metZ, len: 406 aa. Equivalent to Rv0391,
+ len: 406 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 406 aa overlap). Probable metZ,
+ O-succinylhomoserine sulfhydrylase (EC 4.2.99.-),
+ equivalent, but shorter 20 aa in N-terminus, to
+ AA18941.1|AL023514 O-succinylhomoserine sulfhydrylase from
+ Mycobacterium leprae (426 aa). Also highly similar to
+ others e.g. METZ_PSEAE|P55218 o-succinylhomoserine
+ sulfhydrylase from Pseudomonas aeruginosa (403 aa), FASTA
+ scores: opt: 1175, E(): 0, (47.2% identity in 392 aa
+ overlap); etc. BELONGS TO THE TRANS-SULFURATION ENZYMES
+ FAMILY. Could also be a cystathionine gamma-synthase (EC
+ 4.2.99.9). Protein product from Mb0397 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0397 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE O-SUCCINYLHOMOSERINE SULFHYDRYLASE METZ
+ (OSH SULFHYDRYLASE)"
+ /protein_id="CAB5248102.1"
+ /translation="MTDESSVRTPKALPDGVSQATVGVRGGMLRSGFEETAEAMYLTS
+ GYVYGSAAVAEKSFAGELDHYVYSRYGNPTVSVFEERLRLIEGAPAAFATASGMAAVF
+ TSLGALLGAGDRLVAARSLFGSCFVVCSEILPRWGVQTVFVDGDDLSQWERALSVPTQ
+ AVFFETPSNPMQSLVDIAAVTELAHAAGAKVVLDNVFATPLLQQGFPLGVDVVVYSGT
+ KHIDGQGRVLGGAILGDREYIDGPVQKLMRHTGPAMSAFNAWVLLKGLETLAIRVQHS
+ NASAQRIAEFLNGHPSVRWVRYPYLPSHPQYDLAKRQMSGGGTVVTFALDCPEDVAKQ
+ RAFEVLDKMRLIDISNNLGDAKSLVTHPATTTHRAMGPEGRAAIGLGDGVVRISVGLE
+ DTDDLIADIDRALS"
+ gene complement(472246..473658)
+ /gene="ndhA"
+ /locus_tag="BQ2027_MB0398C"
+ CDS complement(472246..473658)
+ /gene="ndhA"
+ /locus_tag="BQ2027_MB0398C"
+ /note="Mb0398c, ndhA, len: 470 aa. Equivalent to Rv0392c,
+ len: 470 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 470 aa overlap). Probable ndhA,
+ membrane NADH dehydrogenase (EC 1.6.99.3), equivalent to
+ many e.g. AF038423|AF038423_1 NADH dehydrogenase from
+ Mycobacterium smegmatis (457 aa), FASTA scores: opt: 1991,
+ E(): 0, (67.9% identity in 458 aa overlap); MLCB1788_3
+ NADH dehydrogenase from Mycobacterium leprae (466 aa),
+ FASTA score: (62.5% identity in 467 aa overlap). Also
+ similar to others from several organisms e.g.
+ P00393|DHNA_ECOLI|66211|581140|CAA23586.1|V00306 NADH
+ DEHYDROGENASE from Escherichia coli (434 aa); and
+ Rv0392c|ndhB from Mycobacterium tuberculosis. Has
+ hydrophobic stretch in C-terminus. BELONGS TO THE NADH
+ DEHYDROGENASE FAMILY. Protein product from Mb0398c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0398c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE NADH DEHYDROGENASE NDHA"
+ /protein_id="CAB5248103.1"
+ /translation="MTLSSGEPSAVGGRHRVVIIGSGFGGLNAAKALKRADVDITLIS
+ KTTTHLFQPLLYQVATGILSEGDIAPTTRLILRRQKNVRVLLGEVNAIDLKAQTVTSK
+ LMDMTTVTPYDSLIVAAGAQQSYFGNDEFATFAPGMKTIDDALELRGRILGAFEAAEV
+ STDHAERERRLTFVVVGAGPTGVEVAGQIVELAERTLAGAFRTITPSECRVILLDAAP
+ AVLPPMGPKLGLKAQRRLEKMDAEVQLNAMVTAVDYKGITIKEKDGGERRIECACKVW
+ AAGVAASPLGKMIAEGSDGTEIDRAGRVIVEPDLTVKGHPNVFVVGDLMFVPGVPGVA
+ QGAIQGARYATTVIKHMVKGNDDPANRKPFHYFNKGSMATISRHSAVAQVGKLEFAGY
+ FAWLAWLVLHLVYLVGYRNRIAALFAWGISFMGRARGQMAITSQMIYARLVMTLMEQQ
+ AQGALAAAEQAEHAEQEAAG"
+ gene 473800..475125
+ /locus_tag="BQ2027_MB0399"
+ CDS 473800..475125
+ /locus_tag="BQ2027_MB0399"
+ /note="Mb0399, -, len: 441. Equivalent to Rv0393, len: 441
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 441 aa overlap). Member of Mycobacterium
+ tuberculosis 13E12 repeat family of conserved proteins,
+ similar to many e.g. Rv1148c, Rv1945, Rv3467,
+ Rv0336|MTCY279_3 (503 aa), FASTA scores: E(): 0, (61.1%
+ identity in 347 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED 13E12 REPEAT FAMILY PROTEIN"
+ /protein_id="CAB5248104.1"
+ /translation="MAVGRCAIPRFDQAASGSAINGGQVHLSDGSTSPARQLPAPWPG
+ DAGAAAEGRAGVCCRGNRLPHVSDVGVSHRFDHRPAGVGAGGCRAGAAGAGLAVDDPG
+ QLAAAIDRIVAVADPDAVRQVRERARDREVSIWNSADGMGEVYAQLYATDAQALDARL
+ NALVATVCAGDPRSTDQRRADALGALAAGADRLACRCDNPDCAAEGRPVSAVVIHVVA
+ EQASVKGHGQAPAALLGGDGLIPAELVAELAKTAGLQPIPVPAGTEPGYRPSVKLAAF
+ VRARDLTCRAPGCDRPATQCDLDHTIAFADGGATHAANLKCLCRLHHLLATFCGWRAQ
+ QLPDGTVIWTLPGNQTYVTTPGSALLFPALCTPTGDPPAPEPARADRRGQRTAMMPRR
+ ASTRTQNRAHCIAAERHRNHQARRIAQAAVIATETHGPPPDPDDDPPPF"
+ gene complement(475141..475860)
+ /locus_tag="BQ2027_MB0400C"
+ CDS complement(475141..475860)
+ /locus_tag="BQ2027_MB0400C"
+ /note="Mb0400c, -, len: 239 aa. Equivalent to Rv0394c,
+ len: 239 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 239 aa overlap). Possible secreted
+ protein, sharing no homology with other proteins. Has
+ hydrophobic stretch at its N-terminus. Protein product
+ from Mb0400c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0400c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE SECRETED PROTEIN"
+ /protein_id="CAB5248105.1"
+ /translation="MTEPRPVFAVVISAGLSAIPMVGGPLQTVFDAIEERTRHRAETT
+ TREICESVGGADTVLSRIDKNPELEPLLSQAIEAATRTSMEAKRRLLAQAAAAALEDD
+ QKVEPASLIVATLSQLEPVHIHALVRLAKAAKSSPDQDEIQRREVMRAASKVEPVPVL
+ AALIQTGVAIATTTVWHGNGTGTPAEESGHILIHDVSDFGHRLLAYLRAADAGAELLI
+ LPSGGSAPTGDHPTPHPSTSR"
+ gene 475959..476363
+ /locus_tag="BQ2027_MB0401"
+ CDS 475959..476363
+ /locus_tag="BQ2027_MB0401"
+ /note="Mb0401, -, len: 134 aa. Equivalent to Rv0395, len:
+ 134 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 134 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248106.1"
+ /translation="MDWMPLGDYETFRHWSGKPRAWGPQESGWRAWFGGKIVDGLCEV
+ LDEHLAVRRRGVPAAIGCVPWLSSEAVAETLLALSAFCVVIDKGTSFPSRLRNPDKGF
+ PNVALLRLRDMAPSEHGSRCSSARGRLCLSMS"
+ gene 476369..476761
+ /locus_tag="BQ2027_MB0402"
+ CDS 476369..476761
+ /locus_tag="BQ2027_MB0402"
+ /note="Mb0402, -, len: 130 aa. Equivalent to Rv0396, len:
+ 130 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 130 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248107.1"
+ /translation="MRALGWLREDRKPLLNAKLLVLGHLALNVYDPDNGYGEEVLDFE
+ PRTVWWGSANWTVRAGSHLEVGFACDDPTLVEEATAFVADVIAFSEPIDTTCAGPEPN
+ LVQVEFDDAAMAEAMEEMAEPDDDGEDW"
+ gene 476835..477203
+ /locus_tag="BQ2027_MB0403"
+ CDS 476835..477203
+ /locus_tag="BQ2027_MB0403"
+ /note="Mb0403, -, len: 122 aa. Equivalent to Rv0397, len:
+ 122 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 122 aa overlap). Part of 13E12 repeat
+ family of conserved Mycobacterium tuberculosis proteins,
+ similar to downstream Rv0393|Z84725|MTCY4D9_5 CONSERVED
+ 13E12 REPEAT FAMILY PROTEIN (441 aa), FASTA scores: E():
+ 0, (87.7% identity in 122 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED 13E12 REPEAT FAMILY PROTEIN"
+ /protein_id="CAB5248108.1"
+ /translation="MLATFWGWRAQQLPDGTVIWTLPGDQTYVTTPGSALLFPALCTP
+ TGDPPRPDPARADRRGQRTAMMPRRASTRAQNRAHYIAAERHRNHQARRIAHVVTQTA
+ TTAPETNGPPPDPDDDPPPF"
+ gene 477413..477661
+ /locus_tag="BQ2027_MB0403A"
+ CDS 477413..477661
+ /locus_tag="BQ2027_MB0403A"
+ /note="Mb0403A, len: 82 aa. Equivalent to Rv0397A len: 82
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 82 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Conserved protein.
+ Protein product from Mb0403A detected using SWATH mass
+ spectrometry. Mb0403A found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Conserved protein"
+ /protein_id="CAB5248109.1"
+ /translation="MHALRLVGLAILTAIAPIAVLIGSSPAHADTDIGQPCSPEGAKL
+ WGNPGPIYCERTADGQLQWVSIPAWALCVAFCDRPGGP"
+ gene complement(477698..478339)
+ /locus_tag="BQ2027_MB0404C"
+ CDS complement(477698..478339)
+ /locus_tag="BQ2027_MB0404C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0404c, -, len: 213 aa. Equivalent to Rv0398c,
+ len: 213 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 213 aa overlap). Possible secreted
+ protein, sharing no homology with other proteins. Has
+ potential signal sequence with hydrophobic stretch from aa
+ 7-25. Protein product from Mb0404c detected using SWATH
+ mass spectrometry. Mb0404c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE SECRETED PROTEIN"
+ /protein_id="CAB5248110.1"
+ /translation="MGVIARVVGVAACGLSLAVLAAAPTAGAEPTGALPPMTSSGSGP
+ VIGDGDAALRQRISQQLFSFGDPTVQEVDGSDAAQFITAAAAVADRDVASVFLPLQRV
+ LGCQQNTAGSGAGFGARAYRRTDGQWGGAMLVVAKSTVSDVDALKACVKSGWRKATAG
+ TPTSMCNNGWTYPPFADTRRGEEGYFVLLAGTASDFCSAPNANYRTTASSWPG"
+ gene complement(478346..479575)
+ /gene="lpqK"
+ /locus_tag="BQ2027_MB0405C"
+ CDS complement(478346..479575)
+ /gene="lpqK"
+ /locus_tag="BQ2027_MB0405C"
+ /note="Mb0405c, lpqK, len: 409 aa. Equivalent to Rv0399c,
+ len: 409 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 409 aa overlap). Possible lpqK,
+ conserved lipoprotein, showing some similarity to
+ penicillin binding proteins and various peptidases e.g.
+ DAC_STRSQ|P15555 d-alanyl-d-alanine carboxypeptidase
+ protein (406 aa), FASTA scores: opt: 348, E(): 5.6e-16,
+ (29.2% identity in 301 aa overlap). Also similar to other
+ Mycobacterium tuberculosis PBPs and esterases. Has
+ possible N-terminal signal sequence and appropriately
+ positioned prokaryotic lipoprotein lipid attachment site
+ (PS00013). Mb0405c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED LIPOPROTEIN LPQK"
+ /protein_id="CAB5248111.1"
+ /translation="MPVLRRLGCSVLALGLLAGCAPPRTGPASSPTNNGAKADAVIRI
+ VRDFMTQAHLKAVLVRVTVAGKEVVTRAVGDSMTGVPATTAMHFRNGAVAISYVATLL
+ LKLVDEKKLRLDDKLSRWLPDFPHADRVTLGQLAQMTSGYPDYVLGNEAFDAELYANP
+ FRQWTTQELLDQISSRPLLYDPGTNWNYAHTNYLLLGLALEKAAGQDMPTLLQRKVLS
+ PLGLTATANSDTPAIPEPALHAFTSERRAALKIPAGVPFYEESTFWNPSWTITHGAIQ
+ TTTIYDMEATAVGIGSGRLLSADSYKKMVSTELRGKTRAQPGCPTCFEQNDGYSYGLG
+ IVISGHWLLQNPMFAGYAAVEAYLPSQRVAVAVAVTYAPEAFDDQGNYRNQADILFRK
+ IGAEVAPNDAPPMPPGR"
+ gene complement(479585..480772)
+ /gene="fadE7"
+ /locus_tag="BQ2027_MB0406C"
+ CDS complement(479585..480772)
+ /gene="fadE7"
+ /locus_tag="BQ2027_MB0406C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0406c, fadE7, len: 395 aa. Equivalent to Rv0400c,
+ len: 395 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 395 aa overlap). Probable fadE7,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), similar to many e.g.
+ CAC12923.1|AL445403 putative acyl CoA dehydrogenase from
+ Streptomyces coelicolor (397 aa); G624219 GLUTARYL-COA
+ DEHYDROGENASE PRECURSOR (438 aa), FASTA scores: opt: 1161,
+ E(): 0, (48.1% identity in 391 aa overlap); etc. Protein
+ product from Mb0406c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0406c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="acyl-coa dehydrogenase fade7"
+ /protein_id="CAB5248112.1"
+ /translation="MSTPTPPALDRDDPLGLDASLSSDEIAVRDTVRRFCAEHVTPHV
+ AAWFEDGDLPVARDLAKQFGELGLLGMQLHGHGCGGASAVHYGLACRELEAADSGIRS
+ LVSVQGSLAMFAIASFGSDEQKRQWLPGMATGDLLGCFGLTEPDVGSDPAAMKTRARR
+ DGPDWVITGGKMWITNGSVADVAIVWAATDDGIRGFIVPTDTPGFTANTIGHKLSLRA
+ SITSELVLDNVRLPADAMLPGATGLRAPLACLSEARYGIVWGAMGAARSAWQCALDYA
+ RQRTQFGRPIAGFQLTQAKLVDMAVELHKGQLLSLHLGRLKDRVGLRPDQVSFGKLNN
+ TREALKICRTARTILGGNGISLEYPVIRHMVNLESVLTYEGTPEMHQLVLGQAFTGLA
+ AFR"
+ gene 480808..481179
+ /locus_tag="BQ2027_MB0407"
+ CDS 480808..481179
+ /locus_tag="BQ2027_MB0407"
+ /note="Mb0407, -, len: 123 aa. Equivalent to Rv0401, len:
+ 123 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 123 aa overlap). Probable conserved
+ transmembrane protein, equivalent to AL023514|MLCB4_9
+ putative integral membrane protein from Mycobacterium
+ leprae (122 aa), FASTA scores: opt: 548, E(): 4.4e-32,
+ (66.9% identity in 121 aa overlap). Mb0407 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248113.1"
+ /translation="MRPRRALAGLAADVVAVLVFCAVGRRSHAEGLSVTGLAATAWPF
+ LTGTGIGWVLARGWRRPTALAPTGVIVWLCTIVVGMVLRKVSSAGVAASFVVVASAVT
+ AVLLLGWRAAVALMAPHRADG"
+ gene complement(481374..482477)
+ /gene="mmpL1b"
+ /locus_tag="BQ2027_MB0408C"
+ CDS complement(481374..482477)
+ /gene="mmpL1b"
+ /locus_tag="BQ2027_MB0408C"
+ /note="Mb0408c, mmpL1b, len: 367 aa. Equivalent to 3' end
+ of Rv0402c, len: 958 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 367 aa overlap).
+ Probable mmpL1, conserved transmembrane transport protein
+ (see citation below), member of RND superfamily, highly
+ similar to other Mycobacterial proteins e.g.
+ YV34_MYCTU|Q11171 hypothetical 106.2 kd membrane protein
+ from Mycobacterium tuberculosis (968 aa), FASTA scores:
+ opt: 3551, E(): 0, (55.4% identity in 933aa overlap);
+ YV34_MYCLE|P54881 hypothetical 105.2 kd protein from
+ Mycobacterium leprae (959 aa), FASTA scores: opt: 3615,
+ E(): 0, (55.5% identity in 941 aa overlap); etc. Highly
+ similar to many other mycobacterial MmpL proteins from
+ Mycobacterium tuberculosis and M. leprae e.g. Rv0450c,
+ Rv0676c, Rv0507, etc. BELONGS TO THE MMPL FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, mmpL1 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (c-*) splits mmpL1 into 2 parts, mmpL1a and
+ mmpL1b. Mb0408c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL1B [SECOND PART]"
+ /protein_id="CAB5248114.1"
+ /translation="MNSMDNVDKLTEDLANLTDDTERMDTTQRQLLAQLDPTIATMQT
+ VKDLAQTLTSAFSGLVTQMEDMTRNATVMGRTFDAANNDDSFYLPPEAFQNPDFQRGL
+ KLFLSPDGTCARFVITHRGDPASAEGISHIDPIMQAADEAVKGTPLQAASIYLAGTSS
+ TYKDIHEGTLYDVMIAVVASLCLIFIIMLGITRSVVASAVIVGTVALSLGSAFGLSVL
+ IWQHILHMPLHWLVLPMAIIVMLAVGSDYNLLLIARFQEEIGAGLKTGMIRAMAGTGR
+ VVTIAGLVFAFTMGSMVASDLRVVGQIGTTIMIGLLFDTLVVRSYMTPALATLLGRWF
+ WWPRRVDRLARQPQVLGPRRTTALSAERAALLQ"
+ gene complement(482474..484249)
+ /gene="mmpL1a"
+ /locus_tag="BQ2027_MB0409C"
+ CDS complement(482474..484249)
+ /gene="mmpL1a"
+ /locus_tag="BQ2027_MB0409C"
+ /note="Mb0409c, mmpL1a, len: 591 aa. Equivalent to 5' end
+ of Rv0402c, len: 958 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 568 aa overlap). Probable
+ mmpL1, conserved transmembrane transport protein (see
+ citation below), member of RND superfamily, highly similar
+ to other Mycobacterial proteins e.g. YV34_MYCTU|Q11171
+ hypothetical 106.2 kd membrane protein from Mycobacterium
+ tuberculosis (968 aa), FASTA scores: opt: 3551, E(): 0,
+ (55.4% identity in 933aa overlap); YV34_MYCLE|P54881
+ hypothetical 105.2 kd protein from Mycobacterium leprae
+ (959 aa), FASTA scores: opt: 3615, E(): 0, (55.5% identity
+ in 941 aa overlap); etc. Highly similar to many other
+ mycobacterial MmpL proteins from Mycobacterium
+ tuberculosis and M. leprae e.g. Rv0450c, Rv0676c, Rv0507,
+ etc. BELONGS TO THE MMPL FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, mmpL1 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (c-*) splits mmpL1 into 2 parts, mmpL1a and
+ mmpL1b. Mb0409c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL1A [FIRST PART]"
+ /protein_id="CAB5248115.1"
+ /translation="MRSQRLAGHLSAAARTIHALSLPIILFWVALTIVVNVVAPQLQS
+ VARTHSVALGPHDAPSLIAMKRIGKDFQQFDSDTTAMVLLEGQEKLGDEAHRFYDVLV
+ TKLSQDTTHVQHIENFWGDPLTAAGSQSADGKAAYVQLNLTGDQGGSQANESVAAVQR
+ IVDSVPPPPGIKAYVTGPGPLGADRVVYGDRSLHTITGISIAVIAIMLFIAYRSLSAA
+ LIMLLTVGLELLAVRGIISTFAVNDLMGLSTFTVNVLVALTIAASTDYIIFLVGRYQE
+ ARATGQNREAAYYTMFGGTAHVVLASGLTVAGAMYCLGFTRLPYFNTLASPCAIGLVT
+ VMLASLTLAPAIIAVASRFGLFDPKRATTKRRWRRIGTVVVRWPGPVLAATLLIALIG
+ LLALPKYQTNYNERYYIPSAAPSNIGYLASDRHFPQARMEPEVLMVEADHDLRNPTDM
+ PILDRIAKTVFHTPGIARVQSITRPLGAPIDHSSIPFQLGMQSTMTIENLQNLKDRVA
+ DLSTLTDQLQRMIDITQRTQELTRQLTDATHDMNAHTRQMRDNANELRDRIADFDDFW
+ RPSEVSRTGSATASTFPSAGRCAPC"
+ gene complement(484246..484674)
+ /gene="mmpS1"
+ /locus_tag="BQ2027_MB0410C"
+ CDS complement(484246..484674)
+ /gene="mmpS1"
+ /locus_tag="BQ2027_MB0410C"
+ /note="Mb0410c, mmpS1, len: 142 aa. Equivalent to Rv0403c,
+ len: 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 142 aa overlap). Probable mmpS1,
+ conserved membrane protein (see citation below), highly
+ similar to other Mycobacterial proteins e.g.
+ YV33_MYCLE|P54880 hypothetical 16.9 kd protein from
+ Mycobacterium leprae (154 aa), FASTA scores: opt: 458,
+ E(): 1.6e-26, (46.9% identity in 143 aa overlap);
+ YV33_MYCTU|Q11170 hypothetical 15 .9 kd protein from M.
+ tuberculosis (147 aa), FASTA scores: opt: 362, E():
+ 1.1e-19, (42.1% identity in 140 aa overlap); etc. Also
+ similar to other MmpS proteins from Mycobacterium
+ tuberculosis e.g. Rv0677c, Rv0451c, etc. BELONGS TO THE
+ MMPS FAMILY. Mb0410c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN MMPS1"
+ /protein_id="CAB5248116.1"
+ /translation="MFGVAKRFWIPMVIVIVVAVAAVTVSRLHSVFGSHQHAPDTGNL
+ DPIIAFYPKHVLYEVFGPPGTVASINYLDADAQPHEVVNAAVPWSFTIVTTLTAVVAN
+ VVARGDGASLGCRITVNEVIREERIVNAYHAHTSCLVKSA"
+ gene 484995..486752
+ /gene="fadD30"
+ /locus_tag="BQ2027_MB0411"
+ CDS 484995..486752
+ /gene="fadD30"
+ /locus_tag="BQ2027_MB0411"
+ /note="Mb0411, fadD30, len: 585 aa. Equivalent to Rv0404,
+ len: 585 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 585 aa overlap). Probable fadD30,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), similar to many
+ e.g. MBU75685_1|AAB52538.1|U75685 acyl-CoA synthase from
+ Mycobacterium bovis (582 aa); MASC_MYCLE|P54200 masc
+ protein from Mycobacterium leprae (372 aa), FASTA scores:
+ opt: 888, E(): 0, (44.2% identity in 342 aa overlap). Also
+ similar to Y06J_MYCTU|Q10976 hypothetical 67.9 kd protein
+ (626 aa), FASTA scores: opt: 1463, E(): 0, (42.4% identity
+ in 568 aa overlap). Protein product from Mb0411 detected
+ using SWATH mass spectrometry. Mb0411 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="fatty-acid-amp ligase fadd30 (fatty-acid-amp
+ synthetase) (fatty-acid-amp synthase)"
+ /protein_id="CAB5248117.1"
+ /translation="MSVISTLRDRATTTPSDEAFVFMDYDTKTGDQIDRMTWSQLYSR
+ VTAVSAYLISYGRHADRRRTAAISAPQGLDYVAGFLGALCAGWAPVPLPEPLGSLRDK
+ RTGLAVLDCAADVVLTTSQAETRVRATIATHGASVTTPVIALDTLDEPSGDNCDLDSQ
+ LSDWSSYLQYTSGSTANPRGVVLSMRNVTENVDQIIRNYFRHEGGAPRLPSSVVSWLP
+ LYHDMGLMVGLFIPLFVGCPVILTSPEAFIRKPARWMQLLAKHQAPFSAAPNFAFDLA
+ VAKTSEEDMAGLDLGHVNTIINGAEQVQPNTITKFLRRFRPYNLMPAAVKPSYGMAEA
+ VVYLATTKAGSPPTSTEFDADSLARGHAELSTFETERATRLIRYHSDDKEPLLRIVDP
+ DSNIELGPGRIGEIWIHGKNVSTGYHNADDALNRDKFQASIREASAGTPRSPWLRTGD
+ LGFIVGDEFYIVGRMKDLIIQDGVNHYPDDIETTVKEFTGGRVAAFSVSDDGVEHLVI
+ AAEVRTEHGPDKVTIMDFSTIKRLVVSALSKLHGLHVTDFLLVPPGALPKTTSGKISR
+ AACAKQYGANKLQRVATFP"
+ gene 486749..488131
+ /gene="pks6a"
+ /locus_tag="BQ2027_MB0412"
+ CDS 486749..488131
+ /gene="pks6a"
+ /locus_tag="BQ2027_MB0412"
+ /note="Mb0412, pks6a, len: 460 aa. Equivalent to 5' end of
+ Rv0405, len: 1402 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 456 aa overlap).
+ Probable pks6, membrane-bound polyketide synthase, highly
+ similar to others e.g. CAC29643.1|AL583917 putative
+ polyketide synthase from Mycobacterium leprae (2103 aa);
+ Y06K_MYCTU|Q10977 probable polyketide synthase (1876 aa),
+ FASTA scores: opt: 2303, E(): 0, (38.7% identity in 1232
+ aa overlap); etc. Contains PS00606 Beta-ketoacyl synthases
+ active site, 2 x PS00017 ATP/GTP-binding site motif A
+ (P-loop), and PS00012 Phosphopantetheine attachment site.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, pks6 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to single base
+ insertion (*-g) splits pks6 into 2 parts, pks6a and pks6b.
+ Mb0412 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE BOUND POLYKETIDE SYNTHASE
+ PKS6A [FIRST PART]"
+ /protein_id="CAB5248118.1"
+ /translation="MTDGSVTADKLQKWFREYLSTHIECHPNEVSLDVPIRDLGLKSI
+ DVLAIPGDLGDRFGFCIPDLAVWDNPSANDLIDSLLNQRSADSLRESHGHADRNTQGR
+ GSINEPVAVIGVGCRFPGDIDGPERLWDFLTEKKCAITAYPDRGFTNAGTFAESGGFL
+ KDVAGFDNRFFDIPPDEALRMDPQQRLLLEVSWEALEHAGIIPESLRLSRTGVFVGVS
+ STDYVRLVSASAQQKSTIWDNTGGSSSIIANRISYFLDIQGPSIVIDTACSSSLVAVH
+ LACRSLSTWDCDIALVGGTNVLISPEPWGGFREAGILSQTGCCHAFDKSADGMVRGEG
+ CGVIVLQRLSDARLEGRRILAILTGSAVNQDGKSNGIMAPNPSAQIGVLENACKSARV
+ DPLEIGYVEAHGTGTSLGDRIEAHALGMVFGRKRPGSGPLMIGSIKPNIGHLEGAAGI
+ AGLIKAGVDG"
+ gene 488118..490958
+ /gene="pks6b"
+ /locus_tag="BQ2027_MB0413"
+ CDS 488118..490958
+ /gene="pks6b"
+ /locus_tag="BQ2027_MB0413"
+ /note="Mb0413, pks6b, len: 946 aa. Equivalent to 3' end of
+ Rv0405, len: 1402 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.9% identity in 945 aa overlap). Probable
+ pks6, membrane-bound polyketide synthase, highly similar
+ to others e.g. CAC29643.1|AL583917 putative polyketide
+ synthase from Mycobacterium leprae (2103 aa);
+ Y06K_MYCTU|Q10977 probable polyketide synthase (1876 aa),
+ FASTA scores: opt: 2303, E(): 0, (38.7% identity in 1232
+ aa overlap); etc. Contains PS00606 Beta-ketoacyl synthases
+ active site, 2 x PS00017 ATP/GTP-binding site motif A
+ (P-loop), and PS00012 Phosphopantetheine attachment site.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, pks6 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to single base
+ insertion (*-g), splits pks6 into 2 parts, pks6a and
+ pks6b. Protein product from Mb0413 detected using SWATH
+ mass spectrometry. Mb0413 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE BOUND POLYKETIDE SYNTHASE
+ PKS6B [SECOND PART]"
+ /protein_id="CAB5248119.1"
+ /translation="MLMVERGSLLPSGGFTEPNPAIPFTELGLRVVDELQEWPVVAGR
+ PRRAGVSSFGFGGTNAHVIVEEAGSVGADTVSGRADVGGSGGGVVAWVISGKTASALA
+ AQAGRLGRYVRARPALDVVDVGYSLVSTRSVFDHRAVVVGQTRDELLAGLAGVVAGRP
+ EAGVVCGVGKPAGKTAFVFAGQGSQWLGMGSELYAAYPVFAEALDAVVDELDRHLRYP
+ LRDVIWGHDQDLLNTTEFAQPALFAVEVALYRLLMSWGVRPGLVLGHSVGELAAAHVA
+ GALCLPDAAMLVAARGRLMQALPAGGAMFAVQAREDEVAPMLGHDVSIAAVNGPASVV
+ ISGAHDAVSAIADRLRGQGRRVHRLAVSHAFHSALMEPMIAEFTAVAAELSVGLPTIP
+ VISNVTGQLVADDFASADYWARHIRAVVRFGDSVRSAHCAGASRFIEVGPGGGLTSLI
+ EASLADAQIVSVPTLRKDRPEPVSVMTAAAQGFVSGMGLDWASVFSGYRPKRVELPTY
+ AFQHQKFWLAPAPSVSDPTAAGQIGASDGGAELLASSGFAARLAGRSADEQLAAAIEV
+ VCEHAAAVLGRDGAAGLDAGQAFADSGFNSLSAVELRNRLTAVTAVTLPATAIFDHPT
+ PTELAQYLITQIDGHGSSAAAAANPAERIDALTDLFLQACDAGRDADGWKMVALASNT
+ RERMSSPVRNNVSKNVALLADGISDVVVICIPTLTVLSDQREYRDIANAMTGRHSVYS
+ LTLPGFDSSDALPQNADMIVETVSNAIIDVVGGSCRFVLSGYSSGGVLAYALCSHLSV
+ KHQRNPLGVALIDTYLPSQIANPSMNEGFSPNDTGKGLSREVIRVARMLNRLTATRLT
+ AAATYAAIFQAWEPGRSMAPVLNIVAKDRIATVENLREERINRWRTAAAEAAYSVAEV
+ PGDHFGVMSTSSEAIATEIHDWISGLVRGPHP"
+ gene complement(490906..491724)
+ /locus_tag="BQ2027_MB0414C"
+ CDS complement(490906..491724)
+ /locus_tag="BQ2027_MB0414C"
+ /note="Mb0414c, -, len: 272 aa. Equivalent to Rv0406c,
+ len: 272 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 272 aa overlap). Beta-lactamase-like
+ protein, equivalent to AAD38170.1|AF152397_1
+ beta-lactamase-like protein from Mycobacterium phlei (243
+ aa); AL023514|MLCB4_8 hypothetical protein from
+ Mycobacterium leprae (251 aa), FASTA scores: opt: 1284,
+ E(): 0, (74.9% identity in 243 aa overlap); and
+ AAD38164.1|AF152394_2 beta-lactamase-like protein from
+ Mycobacterium avium (247 aa), FASTA scores: opt: 1301,
+ E(): 0, (74.2% identity in 244 aa overlap); etc. Also
+ slight similarity to others beta-lactamases and
+ hypothetical proteins e.g. P52700|BLA1_XANMA|628530|S45349
+ METALLO-BETA-LACTAMASE L1 PRECURSOR (BETA-LACTAMASE, TYPE
+ II) (PENICILLINASE) from Xanthomonas maltophilia (290 aa),
+ FASTA scores: (34.4% identity in 96 aa overlap). Protein
+ product from Mb0414c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0414c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="BETA LACTAMASE LIKE PROTEIN"
+ /protein_id="CAB5248120.1"
+ /translation="MVATRGTRLAALALAPRLAGMAELVQITDKVHLARGHAVNWVLV
+ TDDTGVLLIDAGYPGDRAEVLASLNKLGYTPGDVRAIVLTHAHIDHLGSAIWFAREHS
+ TPVYCHAEEVGHAKREYRENASVFDVALRSWRPRVAVWGIHLLRRGGLTGDGIPTAQP
+ LTAEAAAGLPGQPMAIFTPGHTSGHCSYVVDGVLASGDALITGHPMLRHRGPQLLPAV
+ FSHSQQNSIRSLAALALLETNILAPGHGELWHGPIRKATDEALERAQKSNHVFR"
+ gene 491802..492812
+ /gene="fgd1"
+ /locus_tag="BQ2027_MB0415"
+ CDS 491802..492812
+ /gene="fgd1"
+ /locus_tag="BQ2027_MB0415"
+ /standard_name="fgd"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0415, fgd1, len: 336 aa. Equivalent to Rv0407,
+ len: 336 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 336 aa overlap). Probable fgd1,
+ F420-dependent glucose-6-phosphate dehydrogenase (EC
+ 1.-.-.-), equivalent to others from Mycobacteria e.g.
+ AAD38165.1|AF152394_3 from M. avium (336 aa), FASTA
+ scores: opt: 2082, E(): 0, (89.9% identity in 336 aa
+ overlap); AL023514|MLCB 4_7 from Mycobacterium leprae (336
+ aa), FASTA scores: opt: 2069, E(): 0, (89.0% identity in
+ 336 aa overlap). Also similar to other dehydrogenases e.g.
+ CAA77276.1|Y18730 F420-dependent alcohol dehydrogenase
+ from Methanofollis liminatans (330 aa). Also similar to
+ many proteins from Mycobacterium tuberculosis e.g.
+ Rv0953c, Rv0791c, etc. Note that previously known as fgd.
+ Protein product from Mb0415 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0415 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="f420-dependent glucose-6-phosphate dehydrogenase
+ fgd1"
+ /protein_id="CAB5248121.1"
+ /translation="MAELKLGYKASAEQFAPRELVELAVAAEAHGMDSATVSDHFQPW
+ RHQGGHAPFSLSWMTAVGERTNRLLLGTSVLTPTFRYNPAVIAQAFATMGCLYPNRVF
+ LGVGTGEALNEIATGYEGAWPEFKERFARLRESVGLMRQLWSGDRVDFDGDYYRLKGA
+ SIYDVPDGGVPVYIAAGGPAVAKYAGRAGDGFICTSGKGEELYTEKLMPAVREGAAAA
+ DRSVDGIDKMIEIKISYDPDPELALNNTRFWAPLSLTAEQKHSIDDPIEMEKAADALP
+ IEQIAKRWIVASDPDEAVEKVGQYVTWGLNHLVFHAPGHDQRRFLELFQSDLAPRLRR
+ LG"
+ gene 492805..494877
+ /gene="pta"
+ /locus_tag="BQ2027_MB0416"
+ CDS 492805..494877
+ /gene="pta"
+ /locus_tag="BQ2027_MB0416"
+ /note="Mb0416, pta, len: 690 aa. Equivalent to Rv0408,
+ len: 690 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 690 aa overlap). Probable pta,
+ phosphate acetyltransferase (EC 2.3.1.8), highly similar
+ to others e.g. PTA_ECOLI|P39184|11279789|JX0357|B2297
+ phosphate acetyltransferase from Escherichia coli strain
+ K12 (713 aa), FASTA scores: opt: 1303, E(): 0, (38.0%
+ identity in 718 aa overlap); etc. BELONGS TO THE PHOSPHATE
+ ACETYLTRANSFERASE AND BUTYRYLTRANSFERASE FAMILY. Protein
+ product from Mb0416 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0416 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHATE ACETYLTRANSFERASE PTA
+ (PHOSPHOTRANSACETYLASE)"
+ /protein_id="CAB5248122.1"
+ /translation="MADSSAIYLAAPESQTGKSTIALGLLHRLTAMVAKVGVFRPITR
+ LSAERDYILELLLAHTSAGLPYERCVGVTYQQLHADRDDAIAEIVDSYHAMADECDAV
+ VVVGSDYTDVTSPTELSVNARIAVNLGAPVLLTVRAKDRTPDQVASVVEVCLAELDTQ
+ RAHTAAVVANRCELSAIPAVTDALRRFTPPSYVVPEEPLLSAPTVAELTQAVNGAVVS
+ GDVALREREVMGVLAAGMTADHVLERLTDGMAVITPGDRSDVVLAVASAHAAEGFPSL
+ SCIVLNGGFQLHPAIAALVSGLRLRLPVIATALGTYDTASAAASARGLVTATSQRKID
+ TALELMDRHVDVAGLLAQLTIPIPTVTTPQMFTYRLLQQARSDLMRIVLPEGDDDRIL
+ KSAGRLLQRGIVDLTILGDEAKVRLRAAELGVDLDGATVIEPCASELHDQFADQYAQL
+ RKAKGITVEHAREIMNDATYFGTMLVHNCHADGMVSGAAHTTAHTVRPALEIIKTVPG
+ ISTVSSIFLMCLPDRVLAYGDCAIIPNPTVEQLADIAICSARTAAQFGIEPRVAMLSY
+ STGDSGKGADVDKVRAATELVRAREPQLPVEGPIQYDAAVEPSVAATKLRDSPVAGRA
+ TVLIFPDLNTGNNTYKAVQRSAGAIAIGPVLQGLRKPVNDLSRGALVDDIVNTVAITA
+ IQAQGVHE"
+ gene 494870..496027
+ /gene="ackA"
+ /locus_tag="BQ2027_MB0417"
+ CDS 494870..496027
+ /gene="ackA"
+ /locus_tag="BQ2027_MB0417"
+ /note="Mb0417, ackA, len: 385 aa. Equivalent to Rv0409,
+ len: 385 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 385 aa overlap). Probable ackA,
+ acetate kinase (EC 2.7.2.1), highly similar to others e.g.
+ ACKA_BACSU|P37877 acetate kinase from Bacillus subtilis
+ (395 aa), FASTA scores: opt: 974, E(): 0, (43.5% identity
+ in 393 aa overlap); etc. Contains PS01075 Acetate and
+ butyrate kinases family signature 1, PS00758 ArgE / dapE /
+ ACY1/ CPG2 / yscS family signature 1. BELONGS TO THE
+ ACETOKINASE FAMILY. Protein product from Mb0417 detected
+ using SWATH mass spectrometry. Mb0417 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACETATE KINASE ACKA (ACETOKINASE)"
+ /protein_id="CAB5248123.1"
+ /translation="MSSTVLVINSGSSSLKFQLVEPVAGMSRAAGIVERIGERSSPVA
+ DHAQALHRAFKMLAEDGIDLQTCGLVAVGHRVVHGGTEFHQPTLLDDTVIGKLEELSA
+ LAPLHNPPAVLGIKVARRLLANVAHVAVFDTAFFHDLPPAAATYAIDRDVADRWHIRR
+ YGFHGTSHQYVSERAAAFLGRPLDGLNQIVLHLGNGASASAIARGRPVETSMGLTPLE
+ GLVMGTRSGDLDPGVISYLWRTARMGVEDIESMLNHRSGMLGLAGERDFRRLRLVIET
+ GDRSAQLAYEVFIHRLRKYLGAYLAVLGHTDVVSFTAGIGENDAAVRRDALAGLQGLG
+ IALDQDRNLGPGHGARRISSDDSPIAVLVVPTNEELAIARDCLRVLGGRRA"
+ gene complement(496081..498333)
+ /gene="pknG"
+ /locus_tag="BQ2027_MB0418C"
+ CDS complement(496081..498333)
+ /gene="pknG"
+ /locus_tag="BQ2027_MB0418C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0418c, pknG, len: 750 aa. Equivalent to Rv0410c,
+ len: 750 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 750 aa overlap). pknG,
+ serine/threonine-protein kinase (EC 2.7.1.-) (see
+ citations below), equivalent to
+ PKNG_MYCLE|P57993|13092623|CAC29812.1|AL583918 PROBABLE
+ SERINE/THREONINE-PROTEIN KINASE from Mycobacterium leprae
+ (767 aa). Also similar to others e.g. AB76890.1|AL159139
+ putative serine/threonine protein kinase from Streptomyces
+ coelicolor (774 aa); etc. Contains PS00108
+ Serine/Threonine protein kinases active-site signature.
+ Contains Hank's kinase subdomain. BELONGS TO THE SER/THR
+ FAMILY OF PROTEIN KINASES. Protein product from Mb0418c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0418c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SERINE/THREONINE-PROTEIN KINASE PKNG (PROTEIN
+ KINASE G) (STPK G)"
+ /protein_id="CAB5248124.1"
+ /translation="MAKASETERSGPGTQPADAQTATSATVRPLSTQAVFRPDFGDED
+ NFPHPTLGPDTEPQDRMATTSRVRPPVRRLGGGLVEIPRAPDIDPLEALMTNPVVPES
+ KRFCWNCGRPVGRSDSETKGASEGWCPYCGSPYSFLPQLNPGDIVAGQYEVKGCIAHG
+ GLGWIYLALDRNVNGRPVVLKGLVHSGDAEAQAMAMAERQFLAEVVHPSIVQIFNFVE
+ HTDRHGDPVGYIVMEYVGGQSLKRSKGQKLPVAEAIAYLLEILPALSYLHSIGLVYND
+ LKPENIMLTEEQLKLIDLGAVSRINSFGYLYGTPGFQAPEIVRTGPTVATDIYTVGRT
+ LAALTLDLPTRNGRYVDGLPEDDPVLKTYDSYGRLLRRAIDPDPRQRFTTAEEMSAQL
+ TGVLREVVAQDTGVPRPGLSTIFSPSRSTFGVDLLVAHTDVYLDGQVHAEKLTANEIV
+ TALSVPLVDPTDVAASVLQATVLSQPVQTLDSLRAARHGALDADGVDFSESVELPLME
+ VRALLDLGDVAKATRKLDDLAERVGWRWRLVWYRAVAELLTGDYDSATKHFTEVLDTF
+ PGELAPKLALAATAELAGNTDEHKFYQTVWSTNDGVISAAFGLARARSAEGDRVGAVR
+ TLDEVPPTSRHFTTARLTSAVTLLSGRSTSEVTEEQIRDAARRVEALPPTEPRVLQIR
+ ALVLGGALDWLKDNKASTNHILGFPFTSHGLRLGVEASLRSLARVAPTQRHRYTLVDM
+ ANKVRPTSTF"
+ gene complement(498333..499319)
+ /gene="glnH"
+ /locus_tag="BQ2027_MB0419C"
+ CDS complement(498333..499319)
+ /gene="glnH"
+ /locus_tag="BQ2027_MB0419C"
+ /note="Mb0419c, glnH, len: 328 aa. Equivalent to Rv0411c,
+ len: 328 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 328 aa overlap). Probable glnH,
+ glutamine-binding protein, membrane-bound lipoprotein (see
+ citation below), equivalent to
+ AL035159|MLCB1450_15|T44736|4154051|CAA22704.1
+ glutamine-binding protein homolog from Mycobacterium
+ leprae (325 aa), FASTA scores: opt: 1747, E(): 0, (79.3%
+ identity in 328 aa overlap). Also similar to others e.g.
+ GLNH_BACST|P27676 glutamine-binding protein precursor from
+ Bacillus stearothermophilus (262 aa), FASTA scores: opt:
+ 493, E(): 7.5e-22, (37.8% identity in 193 aa overlap);
+ etc. Contains PS00013 Prokaryotic membrane lipoprotein
+ lipid attachment site, PS01039 Bacterial extracellular
+ solute-binding proteins, family 3 signature. BELONGS TO
+ THE BACTERIAL EXTRACELLULAR SOLUTE-BINDING PROTEIN FAMILY
+ 3. Presumed attached to the membrane by a lipid anchor.
+ Protein product from Mb0419c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0419c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUTAMINE-BINDING LIPOPROTEIN GLNH
+ (GLNBP)"
+ /protein_id="CAB5248125.1"
+ /translation="MTRRALLARAAAPLAPLALAMVLASCGHSETLGVEATPTLPLPT
+ PVGMEIMPPQPPLPPDSSSQDCDPTASLRPFATKAEADAAVADIRARGRLIVGLDIGS
+ NLFSFRDPITGEITGFDVDIAGEVARDIFGVPSHVEYRILSAAERVTALQKSQVDIVV
+ KTMSITCERRKLVNFSTVYLDANQRILAPRDSPITKVSDLSGKRVCVARGTTSLRRIR
+ EIAPPPVIVSVVNWADCLVALQQREIDAVSTDDTILAGLVEEDPYLHIVGPDMADQPY
+ GVGINLDNTGLVRFVNGTLERIRNDGTWNTLYRKWLTVLGPAPAPPTPRYVD"
+ gene complement(499319..500638)
+ /locus_tag="BQ2027_MB0420C"
+ CDS complement(499319..500638)
+ /locus_tag="BQ2027_MB0420C"
+ /note="Mb0420c, -, len: 439 aa. Equivalent to Rv0412c,
+ len: 439 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 439 aa overlap). Possible conserved
+ membrane protein, equivalent to
+ AL035159|MLCB1450_16|T44737 probable membrane protein from
+ Mycobacterium leprae (403 aa), FASTA scores: opt: 2027,
+ E(): 0, (80.4% identity in 403 aa overlap). Also some
+ similarity with CAB71201.1|AL138538 putative secreted
+ protein from Streptomyces coelicolor (429 aa). Protein
+ product from Mb0420c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0420c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5248126.1"
+ /translation="MTVELAHPSTEPLGSRSPAEPAHPRRWFISTTPGRIMTIGIVLA
+ ALGVASAFATSTTIEHRQQVLTAVLDHTEPLSFAAGRLYTTLSVADAAAATAFIAQAE
+ PGGVRLRYEQAITDASVAVTRASSGLTDESLVQLLGRINAELAVYTGLVEIARANNRA
+ GNPVGSSYLSEASGLMQSTILPDAQRLYQATSARVDRETTASTQIPAPVILVVATTVV
+ FGAFAHRWLARRTRRRINPGLVVGALGILVMVVWVGTALTISTTASRSAKDTAAESLK
+ TITNLAITAQQARADETLSLIRRGDEEVRKQAFYQRIDAMQRQLNDYMARRHAVDKPD
+ LQGADQLLVRWRQANDRINSYISVGNYRAATQVALGKGEDDATPAFDKLDEALTKAMG
+ QSRTQLRHDILNAHRGLAGAQVGGVVLSLGAAIAVALGLWPRLKEYR"
+ gene 500732..501385
+ /gene="mutT3"
+ /locus_tag="BQ2027_MB0421"
+ CDS 500732..501385
+ /gene="mutT3"
+ /locus_tag="BQ2027_MB0421"
+ /note="Mb0421, mutT3, len: 217 aa. Equivalent to Rv0413,
+ len: 217 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 217 aa overlap). Possible mutT3,
+ mutator protein (EC 3.6.1.-), showing some similarity with
+ e.g. MUTT_PROVU|P32090 mutator mutt protein from Proteus
+ vulgaris (112 aa), FASTA scores: opt: 151, E(): 0.0008,
+ (40.7% identity in 59 aa overlap). SEEMS TO BELONG TO THE
+ NUDIX HYDROLASE FAMILY. Protein product from Mb0421
+ detected using SWATH mass spectrometry. Mb0421 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MUTATOR PROTEIN MUTT3
+ (7,8-DIHYDRO-8-OXOGUANINE-TRIPHOSPHATASE) (8-OXO-DGTPASE)
+ (DGTP PYROPHOSPHOHYDROLASE)"
+ /protein_id="CAB5248127.1"
+ /translation="MPSCPPAYSEQVRGDGDGWVVSDSGVAYWGRYGAAGLLLRAPRP
+ DGTPAVLLQHRALWSHQGGTWGLPGGARDSHETPEQTAVRESSEEAGLSAERLEVRAT
+ VVTAEVCGVDDTHWTYTTVVADAGELLDTVPNRESAELRWVAENEVADLPLHPGFAAS
+ WQRLRTAPATVPLARCDERRQRLPRTIQIEAGVFLWCTPGDADQAPSPLGRRISSLL"
+ gene complement(501369..502037)
+ /gene="thiE"
+ /locus_tag="BQ2027_MB0422C"
+ CDS complement(501369..502037)
+ /gene="thiE"
+ /locus_tag="BQ2027_MB0422C"
+ /note="Mb0422c, thiE, len: 222 aa. Equivalent to Rv0414c,
+ len: 222 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 222 aa overlap). Probable thiE,
+ thiamin phosphate pyrophosphorylase (EC 2.5.1.3),
+ equivalent to Q9ZBL5|AL035159|MLCB1450_17 PROBABLE
+ THIAMINE-PHOSPHATE PYROPHOSPHORYLASE from Mycobacterium
+ leprae (235 aa), FASTA scores: opt: 1095, E(): 0, (78.0%
+ identity in 223 aa overlap). Also similar to others e.g.
+ T34974|5689976|CAB52013.1|AL109663 probable thiamin
+ phosphate pyrophosphorylase from Streptomyces coelicolor
+ (223 aa); THIE_ECOLI|P30137 thie protein from Escherichia
+ coli strain K12 (211 aa), FASTA scores: opt: 275, E():
+ 7.8e-12, (37.8% identity in 196 aa overlap); etc. BELONGS
+ TO THE TMP-PPASE FAMILY. Protein product from Mb0422c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0422c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="thiamine-phosphate pyrophosphorylase thie (tmp
+ pyrophosphorylase) (tmp-ppase) (thiamine-phosphate
+ synthase)"
+ /protein_id="CAB5248128.1"
+ /translation="MHESRLASARLYLCTDARRERGDLAQFAEAALAGGVDIIQLRDK
+ GSPGELRFGPLQARDELAACEILADAAHRYGALFAVNDRADIARAAGADVLHLGQRDL
+ PVNVARQILAPDTLIGRSTHDPDQVAAAAAGDADYFCVGPCWPTPTKPGRAAPGLGLV
+ RVAAELGGDDKPWFAIGGINAQRLPAVLDAGARRIVVVRAITSADDPRAAAEQLRSAL
+ TAAN"
+ gene 502167..503189
+ /gene="thiO"
+ /locus_tag="BQ2027_MB0423"
+ CDS 502167..503189
+ /gene="thiO"
+ /locus_tag="BQ2027_MB0423"
+ /note="Mb0423, thiO, len: 340 aa. Equivalent to Rv0415,
+ len: 340 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 340 aa overlap). Possible thiO,
+ thiamine biosynthesis oxidoreductase (EC 1.-.-.-),
+ equivalent to
+ T44739|4154054|CAA22708.1|AL035159|MLCB1450.24
+ hypothetical protein from Mycobacterium leprae (340 aa),
+ FASTA scores: opt: 1867, E(): 0, (82.0% identity in 338 aa
+ overlap). Shows some similarity to other thiO proteins
+ e.g. THIO_RHIET|O34292 Putative thiamine biosynthesis
+ oxidoreductase from Rhizobium etli plasmid pb (327 aa)
+ (see citation below); AAG31046.1|AF264948_8|THIO putative
+ amino acid oxidase flavoprotein ThiO from Erwinia
+ amylovora (349 aa);
+ NP_106392.1|14025578|BAB52178.1|AP003007|THIO THIAMINE
+ BIOSYNTHESIS OXIDOREDUCTASE THIO from Mesorhizobium loti
+ (333 aa); etc. Protein product from Mb0423 detected using
+ SWATH mass spectrometry. Mb0423 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE THIAMINE BIOSYNTHESIS OXIDOREDUCTASE
+ THIO"
+ /protein_id="CAB5248129.1"
+ /translation="MASDLHTGSLAVIGGGVIGLSVARRAAQAGWPVRVHRSDERGAS
+ WVAGGMLAPHSEGWPGEERLLRLGLQSLRLWREGSFLDGLGPQLVTAHESLVVAVDRA
+ DVADLRTVADWLSAQGHPVIWESAARDVEPLLAQGIRHGFRAPTELAVDNRALLDVLC
+ RDCERLGVRWSSQVSSLSDVDAHTVVIANGIDAPALWPGLPIRPVKGEVLRLRWRPGC
+ MPLPQRVIRARVRGRQVYLVPRSDGVVVGATQYEHGRDTAPVVSGVRDLLDDACTVLP
+ ALGEYELAECEAGLRPMTPDNLPLVQRLDSRTLVAAGHGRSGFLLAPWTAEQIVSELV
+ SVGAAS"
+ gene 503186..503392
+ /gene="thiS"
+ /locus_tag="BQ2027_MB0424"
+ CDS 503186..503392
+ /gene="thiS"
+ /locus_tag="BQ2027_MB0424"
+ /note="Mb0424, thiS, len: 68 aa. Equivalent to Rv0416,
+ len: 68 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 68 aa overlap). Possible thiS protein,
+ equivalent to
+ T44740|4154055|CAA22709.1|AL035159|MLCB1450.25
+ hypothetical protein from Mycobacterium leprae (74 aa),
+ FASTA scores: opt: 303, E(): 2e-18, (71.6% identity in 74
+ aa overlap). Shows weak similarity with
+ O32583|THIS_ECOLI|THIG1|B3991.1 THIS PROTEIN from
+ Escherichia coli strain K12 (66 aa), FASTA scores: opt:
+ 103, E(): 0.052, (30.9% identity in 68 aa overlap). Mb0424
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PROTEIN THIS"
+ /protein_id="CAB5248130.1"
+ /translation="MIVVVNEQQVEVDEQTTIAALLDSLGFGDRGIAVALNFSVLPRS
+ DWATKICELRKPVRLEVVTAVQGG"
+ gene 503385..504143
+ /gene="thiG"
+ /locus_tag="BQ2027_MB0425"
+ CDS 503385..504143
+ /gene="thiG"
+ /locus_tag="BQ2027_MB0425"
+ /note="Mb0425, thiG, len: 252 aa. Equivalent to Rv0417,
+ len: 252 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 252 aa overlap). Probable thiG, thiamin
+ biosynthesis protein, equivalent to
+ AL035159|MLCB1450_20|T44741|THIG probable thiamin
+ biosynthesis protein from Mycobacterium leprae (261 aa),
+ FASTA scores: opt: 1380, E(): 0, (86.8% identity in 250 aa
+ overlap). Also highly similar to others e.g.
+ SCOEDB|SC6E10.03|T35490|THIG probable thiazole
+ biosynthesis protein from Streptomyces coelicolor (264
+ aa); F82761|9105679|AAF83593.1|AE003919_4|XF0783|THIG
+ thiamin biosynthesis protein thiG from Xylella fastidiosa
+ (275 aa);
+ P30139|THIG_ECOLI|7448315|B65206|409790|AAC43089.1|U00006
+ THIG PROTEIN thiamin biosynthesis protein from Escherichia
+ coli strain K-12 (281 aa); etc. BELONGS TO THE THIG
+ FAMILY. Protein product from Mb0425 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0425
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE THIAMIN BIOSYNTHESIS PROTEIN THIG
+ (THIAZOLE BIOSYNTHESIS PROTEIN)"
+ /protein_id="CAB5248131.1"
+ /translation="MAESKLVIGDRSFASRLIMGTGGATNLAVLEQALIASGTELTTV
+ AIRRVDADGGTGLLDLLNRLGITPLPNTAGCRSAAEAVLTAQLAREALNTNWVKLEVI
+ ADERTLWPDAVELVRAAEQLVDDGFVVLPYTTDDPVLARRLEDTGCAAVMPLGSPIGT
+ GLGIANPHNIEMIVAGARVPVVLDAGIGTASDAALAMELGCDAVLLASAVTRAADPPA
+ MAAAMAAAVTAGYLARCAGRIPKRFWAQASSPAR"
+ gene 504515..506017
+ /gene="lpqL"
+ /locus_tag="BQ2027_MB0426"
+ CDS 504515..506017
+ /gene="lpqL"
+ /locus_tag="BQ2027_MB0426"
+ /note="Mb0426, lpqL, len: 500 aa. Equivalent to Rv0418,
+ len: 500 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 500 aa overlap). Probable lpqL,
+ lipoprotein aminopeptidase (EC 3.4.11.-), similar to
+ others e.g.
+ B83278|9949035|AAG06327.1|AE004720_3|AE004720|PA2939
+ probable aminopeptidase from Pseudomonas aeruginosa (536
+ aa); P80561|APX_STRGR|SGAP|S66427 aminopeptidase (EC
+ 3.4.11.-) from Streptomyces griseus (284 aa) (homology
+ only with C-terminus of Rv0418);
+ P37302|APE3_YEAST|1077010|A54134 aminopeptidase Y (EC
+ 3.4.11.-) from Saccharomyces cerevisiae (537 aa); etc.
+ Contains PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Protein product from Mb0426 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0426 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPOPROTEIN AMINOPEPTIDASE LPQL"
+ /protein_id="CAB5248132.1"
+ /translation="MVNKSRMMPAVLAVAVVVAFLTTGCIRWSTQSRPVVNGPAAAEF
+ AVALRNRVSTDAMMAHLSKLQDIANANDGTRAVGTPGYQASVDYVVNTLRNSGFDVQT
+ PEFSARVFKAEKGVVTLGGNTVEARALEYSLGTPPDGVTGPLVAAPADDSPGCSPSDY
+ DRLPVSGAVVLVDRGVCPFAQKEDAAAQRGAVALIIADNIDEQAMGGTLGANTDVKIP
+ VVSVTKSVGFQLRGQSGPTTVKLTASTQSFKARNVIAQTKTGSSANVVMAGAHLDSVP
+ EGPGINDNGSGVAAVLETAVQLGNSPHVSNAVRFAFWGAEEFGLIGSRNYVESLDIDA
+ LKGIALYLNFDMLASPNPGYFTYDGDQSLPLDARGQPVVPEGSAGIERTFVAYLKMAG
+ KTAQDTSFDGRSDYDGFTLAGIPSGGLFSGAEVKKSAEQAELWGGTADEPFDPNYHQK
+ TDTLDHIDRTALGINGAGVAYAVGLYAQDLGGPNGVPVMADRTRHLIAKP"
+ gene 506105..507601
+ /gene="lpqM"
+ /locus_tag="BQ2027_MB0427"
+ CDS 506105..507601
+ /gene="lpqM"
+ /locus_tag="BQ2027_MB0427"
+ /note="Mb0427, lpqM, len: 498 aa. Equivalent to Rv0419,
+ len: 498 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 498 aa overlap). Possible lpqM,
+ lipoprotein peptidase (EC 3.4.-.-); has potential
+ N-terminal signal peptide and contains PS00013 Prokaryotic
+ membrane lipoprotein lipid attachment site, PS00142
+ Neutral zinc metallopeptidases, zinc-binding region
+ signature. Protein product from Mb0427 detected using
+ SWATH mass spectrometry. Mb0427 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE LIPOPROTEIN PEPTIDASE LPQM"
+ /protein_id="CAB5248133.1"
+ /translation="MHGRGRYRPLVRCVRPRRVAASVRTPIACLAAVVVIAGCTTVVD
+ GRALSILNDPFRVGGLPATNGPSGARPDAPAASGTVINTNNGAIDKLSLLSVNDIEDY
+ WMAVYSESLKGTFRPVGKLVSYDSNDPSSPIVCHIDTYQLVNAFFSSRCNLIAWDRGV
+ FMAVAQEYFGDMSVNGVLAHEFGHALQVMANLVTRKDPTIVREQQADCFAGVYLWWVA
+ EGKSTRFTLSTADGLDHVLAGIITTRDPVMEADAENDDEHGSALDRVSAFQLGFINGT
+ PACAAIDEDEVERRRGDLPTTLRVDASGNPETGEVGINEETLSTLMELMGKIFSPKNP
+ PTLSYQPAGCPDAKPSPPAAYCPATNTIVVDLPALARMGKVASAAEHSLPQGDDTSLS
+ IVMSRYALAVQHERGLPMQSPWTALRTACLTGVAHRKMAVPIDLPSGQQLVLTAGDLD
+ EAVSGLLTNRMVASDADGVSVPAGFTRIAAFRAGVGGDMDACYARYPG"
+ gene complement(507580..507990)
+ /locus_tag="BQ2027_MB0428C"
+ CDS complement(507580..507990)
+ /locus_tag="BQ2027_MB0428C"
+ /note="Mb0428c, -, len: 136 aa. Equivalent to Rv0420c,
+ len: 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 136 aa overlap). Possible transmembrane
+ protein; has potential transmembrane domains aa 53-99 and
+ aa 100-122. Mb0428c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248134.1"
+ /translation="MRLHDASAAAPESRMHIARHEEAVNRRQMFIGITGLLLAVIGLM
+ ALWFPVYLDQYDAYGIKVTCGSGWRSNLTQALYADGNDNTQALVTRCDTALLVRRAWA
+ IPSVALGWLLVTGFLVMWVHNDQHQGQSYPGYRA"
+ gene complement(508151..508780)
+ /locus_tag="BQ2027_MB0429C"
+ CDS complement(508151..508780)
+ /locus_tag="BQ2027_MB0429C"
+ /note="Mb0429c, -, len: 209 aa. Equivalent to Rv0421c,
+ len: 209 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 209 aa overlap). Conserved
+ hypothetical protein, showing similarity with
+ NP_103507.1|14022684|BAB49293.1|AP002998 hypothetical
+ protein from Mesorhizobium loti (214 aa). Protein product
+ from Mb0429c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0429c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted hydrolase of the alpha/beta-hydrolase
+ fold"
+ /protein_id="CAB5248135.1"
+ /translation="MNLDQIAGVAHQPAGPPHGVVVLTHGAGGSRESTLLQQVCAEWT
+ RRGWLAVRYNLPYRRRRPTGPPSGSGSGDRAGIVEAIQLCRGLAEGPLIAGGHSYGGR
+ QTSMVVAAGQAPVDVLTLFSYPVHPPGKPERVRTEHLPGIAVPTVFTHGTADPFGTLA
+ QVRSAAAMVSAPTEVVEITGARHDLGSKTLDVARLAVDAALRLSAGQIA"
+ gene complement(508777..509574)
+ /gene="thiD"
+ /locus_tag="BQ2027_MB0430C"
+ CDS complement(508777..509574)
+ /gene="thiD"
+ /locus_tag="BQ2027_MB0430C"
+ /note="Mb0430c, thiD, len: 265 aa. Equivalent to Rv0422c,
+ len: 265 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 265 aa overlap). Probable thiD,
+ phosphomethylpyrimidine kinase (EC 2.7.4.7), equivalent to
+ AL035159|MLCB1450_21 PHOSPHOMETHYLPYRIMIDINE KINASE from
+ Mycobacterium leprae (279 aa), FASTA scores: opt: 1386,
+ E(): 0, (77.8% identity in 266 aa overlap). Also highly
+ similar to others e.g. HIU32725_3|P44697|THID_HAEIN
+ PHOSPHOMETHYLPYRIMIDINE KINASE from Haemophilus influenzae
+ (269 aa), FASTA scores: opt: 605, E(): 0, (42.1% identity
+ in 259 aa overlap). BELONGS TO THE THID FAMILY. Protein
+ product from Mb0430c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0430c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHOMETHYLPYRIMIDINE KINASE THID
+ (HMP-PHOSPHATE KINASE) (HMP-P KINASE)"
+ /protein_id="CAB5248136.1"
+ /translation="MTPPRVLSIAGSDSGGGAGIQADMRTMALLGVHACVAVTAVTVQ
+ NTLGVKDIHEVPNDVVAGQIEAVVTDIGVQAAKTGMLASSRIVATVAATWRRLELSVP
+ LVVDPVCASMHGDPLLAPSALDSLRGQLFPLATLLTPNLDEARLLVDIEVVDAESQRA
+ AAKALHALGPQWVLVKGGHLRSSDGSCDLLYDGVSCYQFDAQRLPTGDDHGGGDTLAT
+ AIAAALAHGFTVPDAVDFGKRWVTECLRAAYPLGRGHGPVSPLFRLS"
+ gene complement(509601..511244)
+ /gene="thiC"
+ /locus_tag="BQ2027_MB0431C"
+ CDS complement(509601..511244)
+ /gene="thiC"
+ /locus_tag="BQ2027_MB0431C"
+ /note="Mb0431c, thiC, len: 547 aa. Equivalent to Rv0423c,
+ len: 547 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 547 aa overlap). Probable thiC,
+ thiamin biosynthesis protein, equivalent to
+ Q9ZBL0|THIC_MYCLE|11279601|T44743|AL035159|MLCB1450_22
+ THIAMINE BIOSYNTHESIS PROTEIN from Mycobacterium leprae
+ (547 aa), FASTA scores: opt: 3283, E(): 0, (90.1% identity
+ in 547 aa overlap). Also highly similar to others e.g.
+ P45740|THIC_BACSU THIAMIN BIOSYNTHESIS PROTEIN from
+ Bacillus subtilis (590 aa), FASTA scores: opt: 2295, E():
+ 0, (65.2% identity in 580 aa overlap); P30136|THIC_ECOLI
+ THIC PROTEIN from Escherichia coli strain K12 (631 aa),
+ FASTA scores: opt: 2141, E(): 0, (62.1% identity in 568 aa
+ overlap); etc. BELONGS TO THE THIC FAMILY. Protein product
+ from Mb0431c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0431c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE THIAMINE BIOSYNTHESIS PROTEIN THIC"
+ /protein_id="CAB5248137.1"
+ /translation="MTITVEPSVTTGPIAGSAKAYREIEAPGSGATLQVPFRRVHLST
+ GDHFDLYDTSGPYTDTDTVIDLTAGLPHRPGVVRDRGTQLQRARAGEITAEMAFIAAR
+ EDMSAELVRDEVARGRAVIPANHHHPESEPMIIGKAFAVKVNANIGNSAVTSSIAEEV
+ DKMVWATRWGADTIMDLSTGKNIHETREWILRNSPVPVGTVPIYQALEKVKGDPTELT
+ WEIYRDTVIEQCEQGVDYMTVHAGVLLRYVPLTAKRVTGIVSRGGSIMAAWCLAHHRE
+ SFLYTNFEELCDIFARYDVTFSLGDGLRPGSIADANDAAQFAELRTLGELTKIAKAHG
+ AQVMIEGPGHIPMHKIVENVRLEEELCEEAPFYTLGPLATDIAPAYDHITSAIGAAII
+ AQAGTAMLCYVTPKEHLGLPDRKDVKDGVIAYKIAAHAADLAKGHPRAQERDDALSTA
+ RFEFRWNDQFALSLDPDTAREFHDETLPAEPAKTAHFCSMCGPKFCSMRITQDVREYA
+ AEHGLETEADIEAVLAAGMAEKSREFAEHGNRVYLPITQ"
+ gene complement(511396..511671)
+ /locus_tag="BQ2027_MB0432C"
+ CDS complement(511396..511671)
+ /locus_tag="BQ2027_MB0432C"
+ /note="Mb0432c, -, len: 91 aa. Equivalent to Rv0424c, len:
+ 91 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 91 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0432c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0432c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248138.1"
+ /translation="MAEKNTRRATSQREAVAKIREAETIVMNLPICGQVKIPRPEHLA
+ YYGGLAALAALELIDWPVALVIATGHILANNHHNRVLEELGEAMEEA"
+ gene complement(511721..516340)
+ /gene="ctpH"
+ /locus_tag="BQ2027_MB0433C"
+ CDS complement(511721..516340)
+ /gene="ctpH"
+ /locus_tag="BQ2027_MB0433C"
+ /note="Mb0433c, ctpH, len: 1539 aa. Equivalent to Rv0425c,
+ len: 1539 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 1539 aa overlap). Possible ctpH,
+ metal cation-transporting P-type ATPase (transmembrane
+ protein) (EC 3.6.1.-), showing some similarity with
+ CAA17934.1|AL022118|13093871|CAC32203.1|AL583926 putative
+ cation-transporting ATPase from Mycobacterium leprae (1609
+ aa). Also similar to others ATPases e.g. AE000873_1
+ CATION-TRANSPORTING P-ATPASE from Methanobacterium
+ thermoautotrop (844 aa), FASTA score: (30.5% identity in
+ 827 aa overlap); AB69720.1|AL137166 putative transport
+ ATPase from Streptomyces coelicolor (1472 aa); etc.
+ C-terminal region similar to other ATPases from
+ Mycobacterium tuberculosis e.g. Y05Q_MYCTU|Q10900 putative
+ cation-transporting ATPase C (855 aa), FASTA scores: opt:
+ 770, E(): 5.3e-32, (44.9% identity in 820 aa overlap).
+ Protein product from Mb0433c detected using SWATH mass
+ spectrometry. Mb0433c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE METAL CATION TRANSPORTING P-TYPE ATPASE
+ CTPH"
+ /protein_id="CAB5248139.1"
+ /translation="MPVRAVATGFRATATLTGASITAATAVSATLAKTGVGTGMKVAI
+ IPLRAGAKALSGELSRETLGRNCWRGERRAWIEVRGLRSGGDDELGRVVLNAIQAHPG
+ VGSASLNYPLSRVVVAIDDPDTSLRELCRIVDDAEKAERHRHPDQAADQLAQSPGSLP
+ GDGVLLAVRAVTVAATAAGLGLALGGRALRWPRFPLVIEAAVAAVDHQPLLRRLLEDR
+ IGTAATATVLELAMAAAHTVTLSPAALSVDLTIQALKAAECRAGARAWRRHEPQLALH
+ ADEPADQPQSLWPRPARSTQPVQRSVARFALIQALSAVLVGAGTRDADMAATATLVAT
+ PKASRTTPEAFAAALGQGLADQHAVLPLRPESLRRLDRVDAIVIDPRVLCTDDLRVAR
+ IRGCGADELSTAWNRAQLVLTESGLRPGWHRVPGVSASGSDSAVEALFRPMHDRLASA
+ VVAEAHRTGADLVSVDVDALGELRPVFDDIRPLDDGASGSLDEALARAVAELRQAGRT
+ VAVLSSVGKQALSAADVALGVLPPPGAGAPPWYADVLLPDLGAAWRVLHAIPAARAAR
+ QRGNEISGGASALGALLMLPGVRGLGPGPVTTGAAAGLLSGYLLARKVVDAQAPRPAP
+ AHEWHAMSVEQVRKALPSPDEQAPAKAPPSPYPARALAGGLHTAKRGAQITQAPLNAL
+ WQLTKAVRAELSDPLTPMLALGAMASAVLGSPVDAVMVGSVLTGNSILAASQRLRAES
+ RLNRLLAQQIPPARKVLAGADDQPRYIEVRAEELRPGDIIEVRTHEVVPADARVIEEV
+ DVEVDESALTGESLSVTKQVEPTPGVDLIERRCMLYAGTTVVSGTAVAVVTAVGPDTQ
+ ERRAAELVSGDLSSVGLQHQLSRLTNQAWPVSMTGGALVTGLGLLRRRGLRQAVASGI
+ AVTVAAVPEGMPLVATLAQQASARRLSHFGALVRIPRSVEALGRVDMVCFDKTGTLSE
+ NRLRVAQVRPVAGHSREEVLRCAAHAAPASNGPQVHATDVAIVQAAAAAAASGTDGAE
+ PGAAEPAAHLPFRSGRSFSASVSGTELTVKGAPEVVLAACEGIGSSMDDAVAELAANG
+ LRVIAVAHRQLTAQQAQSVVDDPDEIARLCRDELSLVGFLGLSDTPRAQAAALLADLH
+ EHDLDIRLITGDHPITAAAIAEELGMQVSPEQVISGAEWDALSRKDQERAVAERVIFA
+ RMTPENKVQIVQTLEHSGRVCAMVGDGSNDAAAIRAATVGIGVVAHGSDPARVAADLV
+ LVDGRIESLLPAILEGRQLWQRVQAAVSVLLGGNAGEVAFAIIGSAITGTSPLNTRQL
+ LLVNMLTDALPAAALAVSKPSDPVTPATRGPDQRELWRAVGIRGATTAAAATVAWVMA
+ GFTGLPRRASTVALVALVAAQLGQTLVDSHAWLVVLTALGSLAALATLISIPVVSQLL
+ GCTPLDPLGWAQATAAATAATVAVAVLNRVLTGRDKSGQPNPQPPETDALSRDASPGA
+ PPGPRRRRRATARRKAPVKAPSATRQTTKPKGPPAHRSSSTYPRR"
+ gene complement(516392..516835)
+ /locus_tag="BQ2027_MB0434C"
+ CDS complement(516392..516835)
+ /locus_tag="BQ2027_MB0434C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0434c, -, len: 147 aa. Equivalent to Rv0426c,
+ len: 147 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 147 aa overlap). Possible
+ transmembrane protein; has potential transmembrane domains
+ aa 19-41, and aa 61-83. Protein product from Mb0434c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0434c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248140.1"
+ /translation="MSVVGGTVRTVGRTVSGAATATTAAAGAVGGAAVSGIVGGVTGA
+ AKGIQKGLSSGSKSTAAAALAIGAIGVAGLVDWPILLAVGGGALLLRKLNRTPEVAAP
+ PVKAKLAPVPDKPAAAKEAPAKASKTTARKTSGRRAGTAELRSTN"
+ gene complement(517036..517911)
+ /gene="xthA"
+ /locus_tag="BQ2027_MB0435C"
+ CDS complement(517036..517911)
+ /gene="xthA"
+ /locus_tag="BQ2027_MB0435C"
+ /note="Mb0435c, xthA, len: 291 aa. Equivalent to Rv0427c,
+ len: 291 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 291 aa overlap). Probable xthA
+ (alternate gene name: xth), exodeoxyribonuclease III
+ protein (EC 3.1.11.2), similar to others e.g.
+ EX3_ECOLI|P09030 exodeoxyribonuclease III from Escherichia
+ Coli strain K12 (268 aa), FASTA scores: opt: 360, E():
+ 1.2e-17, (29.3% identity in 270 aa overlap); etc. BELONGS
+ TO THE AP/EXOA FAMILY OF DNA REPAIR ENZYMES. Protein
+ product from Mb0435c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0435c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EXODEOXYRIBONUCLEASE III PROTEIN XTHA
+ (EXONUCLEASE III) (EXO III) (AP ENDONUCLEASE VI)"
+ /protein_id="CAB5248141.1"
+ /translation="MPDGTIDGGHPQRPASPRLRSPLLRLATWNVNSIRTRLDRVLDW
+ LGRADVDVLAMQETKCPDGQFPALPLFELGYDVAHVGFDQWNGVAIASRVGLDDVRVG
+ FDGQPSWSGKPEVAATTEARALGATCGGIRVWSLYVPNGRALDDPHYTYKLDWLAALR
+ DTAEGWLRDDPAAPIALMGDWNIAPTDDDVWSTEFFAGCTHVSEPERKAFNAIVDAQF
+ TDVVRPFTPGPGVYTYWDYTQLRFPKKQGMRIDFILGSPALAARVMDAQIVREERKGK
+ APSDHAPVLVDLHAG"
+ gene complement(517914..518822)
+ /locus_tag="BQ2027_MB0436C"
+ CDS complement(517914..518822)
+ /locus_tag="BQ2027_MB0436C"
+ /note="Mb0436c, -, len: 302 aa. Equivalent to Rv0428c,
+ len: 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 302 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0436c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0436c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="gcn5-related n-acetyltransferase"
+ /protein_id="CAB5248142.1"
+ /translation="MVSWPGLGTRVTVRYRRPAGSMPPLTDAVGRLLAVDPTVRVQTK
+ TGTIVEFSPVDVVALRVLTDAPVRTAAIRALEHAAAAAWPGVERTWLDGWLLRAGHGA
+ VLAANSAVPLDISAHTNTITEISAWYASRDLQPWLAVPDRLLPLPAGLAGERREQVLV
+ RDVSTGEPDRSVTLLDHPDDTWLRLYHQRLPLDMATPVIDGELAFGSYLGVAVARAAV
+ TDAPDGTRWVGLSAMRAADEQSATGSAGRQLWEALLGWGAGRGATRGYVRVHDTATSV
+ LAESLGFRLHHHCRYLPAQSVGWDTF"
+ gene complement(518822..519415)
+ /gene="def"
+ /locus_tag="BQ2027_MB0437C"
+ CDS complement(518822..519415)
+ /gene="def"
+ /locus_tag="BQ2027_MB0437C"
+ /note="Mb0437c, def, len: 197 aa. Equivalent to Rv0429c,
+ len: 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 197 aa overlap). Probable def,
+ polypeptide deformylase (EC 3.5.1.31), equivalent to
+ CAC30884.1|AL583923 polypeptide deformylase from
+ Mycobacterium leprae (197 aa). Also similar to others e.g.
+ DEF_ECOLI|P27251|95874|S23107 polypeptide deformylase from
+ Escherichia coli (169 aa), FASTA scores: opt: 179, E():
+ 1.8e-05, (34.6% identity in 162 aa overlap); etc. BELONGS
+ TO THE POLYPEPTIDE DEFORMYLASE FAMILY. COFACTOR: BINDS 1
+ ZINC ION. Protein product from Mb0437c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0437c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE POLYPEPTIDE DEFORMYLASE DEF (PDF)
+ (FORMYLMETHIONINE DEFORMYLASE)"
+ /protein_id="CAB5248143.1"
+ /translation="MTVVPIRIVGDPVLHTATTPVTVAADGSLPADLAQLIATMYDTM
+ DAANGVGLAANQIGCSLRLFVYDCAADRAMTARRRGVVINPVLETSEIPETMPDPDTD
+ DEGCLSVPGESFPTGRAKWARVTGLDADGSPVSIEGTGLFARMLQHETGHLDGFLYLD
+ RLIGRYARNAKRAVKSHGWGVPGLSWLPGEDPDPFGH"
+ gene 519752..520060
+ /locus_tag="BQ2027_MB0438"
+ CDS 519752..520060
+ /locus_tag="BQ2027_MB0438"
+ /note="Mb0438, -, len: 102 aa. Equivalent to Rv0430, len:
+ 102 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 102 aa overlap). Conserved
+ hypothetical protein, equivalent to AC30882.1|AL583923
+ conserved hypothetical protein from Mycobacterium leprae
+ (102 aa). Also highly similar to
+ CAB93047.1|SCD95A.20|AL357432 hypothetical protein from
+ Streptomyces coelicolor (84 aa). Protein product from
+ Mb0438 detected using SWATH mass spectrometry. Mb0438
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="tuberculin secretion"
+ /protein_id="CAB5248144.1"
+ /translation="MDSAMARAIRSGDDAEVADGLTRREHDILAFERQWWKFAGVKEE
+ AIKELFSMSATRYYQVLNALVDRPEALAADPMLVKRLRRLRASRQKARAARRLGFEVT
+ "
+ gene 520092..520586
+ /locus_tag="BQ2027_MB0439"
+ CDS 520092..520586
+ /locus_tag="BQ2027_MB0439"
+ /note="Mb0439, -, len: 164 aa. Equivalent to Rv0431, len:
+ 164 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.8% identity in 164 aa overlap). Putative tuberculin
+ related peptide; almost identical to D00815|MSGAT103_1
+ AT103 from Mycobacterium tuberculosis (172 aa), FASTA
+ score: (99.4% identity in 163 aa overlap). Highly similar
+ to to CAC30881.1|AL583923 tuberculin related peptide
+ (AT103) from Mycobacterium leprae (167 aa). Some
+ similarity to G550415|HRPC (282 aa), FASTA scores: opt:
+ 120, E(): 0.36, (33.3% identity in 111 aa overlap).
+ Potential transmembrane domain at aa 19-37. Protein
+ product from Mb0439 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0439 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE TUBERCULIN RELATED PEPTIDE"
+ /protein_id="CAB5248145.1"
+ /translation="MLVTVGSMNERVPDSSGLPLRAMVMVLLFLGVVFLLLGWQALGS
+ SPNSEDDSSAISTMTTTTAAPTSTSVKPAAPRAEVRVYNISGAEGAAARTADRLKAAG
+ FTVTDVGNLSLPDVAATTVYYTEVEGERATADAVGRTLGAAVELRLPELSDQPPGVIV
+ VVTG"
+ gene 520619..521341
+ /gene="sodC"
+ /locus_tag="BQ2027_MB0440"
+ CDS 520619..521341
+ /gene="sodC"
+ /locus_tag="BQ2027_MB0440"
+ /note="Mb0440, sodC, len: 240 aa. Equivalent to Rv0432,
+ len: 240 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 240 aa overlap). Probable sodC,
+ periplasmic superoxide dismutase [Cu-Zn] (EC 1.15.1.1),
+ equivalent to CAC30880.1|AL583923 superoxide dismutase
+ precursor (Cu-Zn) from Mycobacterium leprae (240 aa); and
+ AAK20038.1|AF326234_1 copper zinc superoxide dismutase
+ from Mycobacterium avium subsp. paratuberculosis (226 aa).
+ Also similar to others e.g. SODC_PHOLE|P00446 superoxide
+ dismutase precursor (cu-zn) from Photobacterium leiognathi
+ (173 aa), FASTA scores: opt: 214, E(): 5.2 e-06, (36.5%
+ identity in 181 aa overlap). Contains PS00013 Prokaryotic
+ membrane lipoprotein lipid attachment site. BELONGS TO THE
+ CU-ZN SUPEROXIDE DISMUTASE FAMILY. Possibly localized in
+ periplasm, membrane-bound. Protein product from Mb0440
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0440 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="periplasmic superoxide dismutase [cu-zn] sodc"
+ /protein_id="CAB5248146.1"
+ /translation="MPKPADHRNHAAVSTSVLSALFLGAGAALLSACSSPQHASTVPG
+ TTPSIWTGSPAPSGLSGHDEESPGAQSLTSTLTAPDGTKVATAKFEFANGYATVTIAT
+ TGVGKLTPGFHGLHIHQVGKCEPNSVAPTGGAPGNFLSAGGHYHVPGHTGTPASGDLA
+ SLQVRGDGSAMLVTTTDAFTMDDLLSGAKTAIIIHAGADNFANIPPERYVQVNGTPGP
+ DETTLTTGDAGKRVACGVIGSG"
+ gene 521343..522473
+ /locus_tag="BQ2027_MB0441"
+ CDS 521343..522473
+ /locus_tag="BQ2027_MB0441"
+ /note="Mb0441, -, len: 376 aa. Equivalent to Rv0433, len:
+ 376 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 376 aa overlap). Conserved
+ hypothetical protein, similar to other hypothetical
+ proteins e.g. P77213|YBDK_ECOLI hypothetical 41.7 KD
+ protein from Escherichia coli strain K12 (372 aa), FASTA
+ scores: opt: 555, E(): 2e-30, (28.2% identity in 365 aa
+ overlap). Protein product from Mb0441 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0441 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Carboxylate-amine ligase"
+ /protein_id="CAB5248147.1"
+ /translation="MPARRSAARIDFAGSPRPTLGVEWEFALVDSQTRDLSNEATAVI
+ AEIGENPRVHKELLRNTVEIVSGICECTAEAMQDLRDTLGPARQIVRDRGMELFCAGT
+ HPFARWSAQKLTDAPRYAELIKRTQWWGRQMLIWGVHVHVGIRSAHKVMPIMTSLLNY
+ YPHLLALSASSPWWGGEDTGYASNRAMMFQQLPTAGLPFHFQRWAEFEGFVYDQKKTG
+ IIDHMDEIRWDIRPSPHLGTLEVRICDGVSNLRELGALVALTHCLIVDLDRRLDAGET
+ LPTMPPWHVQENKWRAARYGLDAVIILDADSNERLVTDDLADVLTRLEPVAKSLNCAD
+ ELAAVSDIYRDGASYQRQLRVAQQHDGDLRAVVDALVAELVI"
+ gene 522533..523186
+ /locus_tag="BQ2027_MB0442"
+ CDS 522533..523186
+ /locus_tag="BQ2027_MB0442"
+ /note="Mb0442, -, len: 217 aa. Equivalent to Rv0434, len:
+ 217 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 217 aa overlap). Conserved hypothetical
+ protein, similar to AE002052_2 from Deinococcus
+ radiodurans (213 aa), FASTA scores: opt: 258, E(): 4e-10,
+ (31.9% identity in 213 aa overlap); SYCSLRB_122|Q55701
+ hypothetical 24.5 kDa protein from Synechocystis (214 aa),
+ FASTA scores: opt: 156, E(): 0.00041, (28.4% identity in
+ 204 aa overlap); MXABSGA_1|LON2_MYXXA|P36774 ATP-dependent
+ protease la 2 from Myxococcus xanthus (826 aa), FASTA
+ scores: opt: 160, E(): 0.00068, (28.4% identity in 197 aa
+ overlap); etc. Protein product from Mb0442 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0442 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248148.1"
+ /translation="MADFAPVELAMFPLESAPLPDEDLPLHIFEPRYAALVRDCMDTA
+ DPRFGVVLISRGREVGGGDTRCDVGTLARITECADAGSGRYMLRCRVGERIRVCDWLP
+ DDPYPRAKVRFWPDQPGHPVTAAQLLEVEDRVVALFERIAAARGVRLPAREVVLGYPV
+ VDPADTGQRLYALACRVPMGPADRYAVLAAPSAADRLVRLGDALDSVAAMVEFELST"
+ gene complement(523366..525552)
+ /locus_tag="BQ2027_MB0443C"
+ CDS complement(523366..525552)
+ /locus_tag="BQ2027_MB0443C"
+ /note="Mb0443c, -, len: 728 aa. Equivalent to Rv0435c,
+ len: 728 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 728 aa overlap). Putative conserved
+ ATPase (EC 3.6.1.-), similar to others e.g.
+ SAV_SULAC|Q07590 sav protein involved in cell division
+ from sulfolobus acidocaldarius (780 aa), FASTA scores:
+ opt: 897, E(): 0, (34.5% identity in 693 aa overlap);
+ NP_148637.1|7435761|B72479 transitional endoplasmic
+ reticulum ATPase from Aeropyrum pernix (699 aa); etc. Also
+ similar to Rv3610c and Rv2115c from Mycobacterium
+ tuberculosis. Contains PS00017 ATP/GTP-binding site motif
+ A (P-loop), and PS00674 AAA-protein family signature.
+ Protein product from Mb0443c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0443c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE CONSERVED ATPASE"
+ /protein_id="CAB5248149.1"
+ /translation="MTHPDPARQLTLTARLNTSAVDSRRGVVRLHPNAIAALGIREWD
+ AVSLTGSRTTAAVAGLAAADTAVGTVLLDDVTLSNAGLREGTEVIVSPVTVYGARSVT
+ LSGSTLATQSVPPVTLRQALLGKVMTVGDAVSLLPRDLGPGTSTSAASRALAAAVGIS
+ WTSELLTVTGVDPDGPVSVQPNSLVTWGAGVPAAMGTSTAGQVSISSPEIQIEELKGA
+ QPQAAKLTEWLKLALDEPHLLQTLGAGTNLGVLVSGPAGVGKATLVRAVCDGRRLVTL
+ DGPEIGALAAGDRVKAVASAVQAVRHEGGVLLITDADALLPAAAEPVASLILSELRTA
+ VATAGVVLIATSARPDQLDARLRSPELCDRELGLPLPDAATRKSLLEALLNPVPTGDL
+ NLDEIASRTPGFVVADLAALVREAALRAASRASADGRPPMLHQDDLLGALTVIRPLSR
+ SASDEVTVGDVTLDDVGDMAAAKQALTEAVLWPLQHPDTFARLGVEPPRGVLLYGPPG
+ CGKTFVVRALASTGQLSVHAVKGSELMDKWVGSSEKAVRELFRRARDSAPSLVFLDEL
+ DALAPRRGQSFDSGVSDRVVAALLTELDGIDPLRDVVMLGATNRPDLIDPALLRPGRL
+ ERLVFVEPPDAAARREILRTAGKSIPLSSDVDLDEVAAGLDGYSAADCVALLREAALT
+ AMRRSIDAANVTAADLATARETVRASLDPLQVASLRKFGTKGDLRS"
+ gene complement(525549..526409)
+ /gene="pssA"
+ /locus_tag="BQ2027_MB0444C"
+ CDS complement(525549..526409)
+ /gene="pssA"
+ /locus_tag="BQ2027_MB0444C"
+ /note="Mb0444c, pssA, len: 286 aa. Equivalent to Rv0436c,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 286 aa overlap). Probable pssA, PS
+ synthase (CDP-diacylglycerol--serine
+ O-phosphatidyltransferase) (EC 2.7.8.8) (see citation
+ below), integral membrane protein, equivalent to
+ AL035159|MLCB1450_9|T44730 from Mycobacterium leprae (300
+ aa), FASTA scores: opt: 1506, E(): 0, (77.9% identity in
+ 285 aa overlap). Also highly similar to others e.g.
+ NP_108059.1|14027250|BAB54204.1|AP003012
+ phosphatidylserine synthase from Mesorhizobium loti (248
+ aa); PSS_BACSU|P39823 cdp-diacylglycerol--serine
+ o-phosphatidyltransferase from Bacillus subtilis (177 aa),
+ FASTA scores: opt: 277, E(): 9.9e-12, (33.3% identity in
+ 183 aa overlap); etc. Contains PS00379 CDP-alcohol
+ phosphatidyltransferases signature. BELONGS TO THE
+ CDP-ALCOHOL PHOSPHATIDYLTRANSFERASE CLASS-I FAMILY.
+ Protein product from Mb0444c detected using SWATH mass
+ spectrometry. Mb0444c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CDP-DIACYLGLYCEROL--SERINE
+ O-PHOSPHATIDYLTRANSFERASE PSSA (PS SYNTHASE)
+ (PHOSPHATIDYLSERINE SYNTHASE)"
+ /protein_id="CAB5248150.1"
+ /translation="MIGKPRGRRGVNLQILPSAMTVLSICAGLTAIKFALEHQPKAAM
+ ALIAAAAILDGLDGRVARILDAQSRMGAEIDSLADAVNFGVTPALVLYVSMLSKWPVG
+ WVVVLLYAVCVVLRLARYNALQDDGTQPAYAHEFFVGMPAPAGAVSMIGLLALKMQFG
+ EGWWTSVWFLSFWVTGTSILLVSGIPMKKMHAVSVPPNYAAALLAVLAICAAAAVLAP
+ YLLIWVIIIAYMCHIPFAVRSQRWLAQHPEVWDDKPKQRRAVRRASRRAHPYRPSMAR
+ LGLRKPGRRL"
+ gene complement(526406..527101)
+ /gene="psd"
+ /locus_tag="BQ2027_MB0445C"
+ CDS complement(526406..527101)
+ /gene="psd"
+ /locus_tag="BQ2027_MB0445C"
+ /note="Mb0445c, psd, len: 231 aa. Equivalent to Rv0437c,
+ len: 231 aa (start uncertain), from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 231 aa
+ overlap). Possible psd, phosphatidylserine decarboxylase
+ (EC 4.1.1.65), equivalent to CAC29819.1|AL583918 conserved
+ hypothetical protein from Mycobacterium leprae (243 aa);
+ and highly similar to
+ MLCB1450.11|T44729|4154044|CAA22695.1|AL035159
+ hypothetical protein from Mycobacterium leprae (202 aa),
+ FASTA score: (74.6% identity in 197 aa overlap). Also
+ similar to other phosphatidylserine decarboxylases e.g.
+ NP_108058.1|14027249|BAB54203.1|AP003012
+ phosphatidylserine decarboxylase from Mesorhizobium loti
+ (232 aa); AAK86872|g15156090|AGR_C_1963 phosphatidylserine
+ decarboxylase from Agrobacterium tumefaciens (244 aa);
+ AAG12422.1|AY005137|Psd phosphatidylserine decarboxylase
+ from Chlorobium tepidum (216 aa); etc. Protein product
+ from Mb0445c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0445c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PHOSPHATIDYLSERINE DECARBOXYLASE PSD
+ (PS DECARBOXYLASE)"
+ /protein_id="CAB5248151.1"
+ /translation="MARRPRPDGPQHLLALVRSAVPPVHPAGRPFIAAGLAIAAVGHR
+ YRWLRGTGLLAAAACAGFFRHPQRVPPTRPAAIVAPADGVICAIDSAAPPAELSMGDT
+ PLPRVSIFLSILDAHVQRAPVSGEVIAVQHRPGRFGSADLPEASDDNERTSVRIRMPN
+ GAEVVAVQIAGLVARRIVCDAHVGDKLAIGDTYGLIRFGSRLDTYLPAGAEPIVNVGQ
+ RAVAGETVLAECR"
+ gene complement(527162..528379)
+ /gene="moeA2"
+ /locus_tag="BQ2027_MB0446C"
+ CDS complement(527162..528379)
+ /gene="moeA2"
+ /locus_tag="BQ2027_MB0446C"
+ /note="Mb0446c, moeA2, len: 405 aa. Equivalent to Rv0438c,
+ len: 405 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 405 aa overlap). Probable moeA2,
+ molybdenum cofactor biosynthesis protein, highly similar
+ to many e.g. Y10817|ANY10817_2 from A. nicotinovorans (429
+ aa), FASTA scores: opt: 786, E(): 0, (39.2% identity in
+ 398 aa overlap); etc. Also similar to
+ MOEA1|Rv0994|MTCI237.08|O05577 PROBABLE MOLYBDOPTERIN
+ BIOSYNTHESIS PROTEIN from Mycobacterium tuberculosis (426
+ aa), FASTA scores: opt: 667, E(): 2e-32, (36.5% identity
+ in 425 aa overlap). Note that previously known as moeA3.
+ Protein product from Mb0446c detected using SWATH mass
+ spectrometry. Mb0446c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MOLYBDOPTERIN BIOSYNTHESIS PROTEIN
+ MOEA2"
+ /protein_id="CAB5248152.1"
+ /translation="MRSVQEHQRVVAEMIRACRPITVPLTQAQGLVLGGDVVAPLSLP
+ VFDNSAMDGYAVRAEDTSGATPQNPVMLPVAEDIPAGRADMLTLQPVTAHRIMTGAPV
+ PTGATAIVPVEATDGGVDSVAIRQQATPGKHIRRSGEDVAAGTTVLHNGQIVTPAVLG
+ LAAALGLAELPVLPRQRVLVISTGSELASPGTPLQPGQIYESNSIMLAAAVRDAGAAV
+ VATATAGDDVAQFGAILDRYAVDADLIITSGGVSAGAYEVVKDAFGSADYRGGDHGVE
+ FVKVAMQPGMPQGVGRVAGTPIVTLPGNPVSALVSFEVFIRPPLRMAMGLPDPYRPHR
+ SAVLTASLTSPRGKRQFRRAILDHQAGTVISYGPPASHHLRWLASANGLLDIPEDVVE
+ VAAGTQLQVWDLT"
+ gene complement(528398..529333)
+ /locus_tag="BQ2027_MB0447C"
+ CDS complement(528398..529333)
+ /locus_tag="BQ2027_MB0447C"
+ /note="Mb0447c, -, len: 311 aa. Equivalent to Rv0439c,
+ len: 311 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 311 aa overlap). Probable
+ dehydrogenase/reductase (EC 1.-.-.-), equivalent to
+ AL035159|MLCB1450_6|T44727 probable oxidoreductase from
+ Mycobacterium leprae (304 aa), FASTA scores: opt: 1360,
+ E(): 0, (69.2% identity in 302 aa overlap). Also highly
+ similar to various oxidoreductases, generally
+ dehydrogenases/reductases e.g.
+ PA5031|C83017|9951320|AAG08416.1|AE004916_5|AE004916
+ probable short chain dehydrogenase from Pseudomonas
+ aeruginosa (309 aa); Q03326|OXIR_STRAT PROBABLE
+ OXIDOREDUCTASE from Streptomyces antibioticus (298 aa),
+ FASTA scores: opt: 400, E(): 1.2e-18, (34.6% identity in
+ 298 aa overlap); etc. Protein product from Mb0447c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0447c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable dehydrogenase/reductase"
+ /protein_id="CAB5248153.1"
+ /translation="MTANDNKTRKWSAADVPDQSGRVVVVTGANTGIGYHTAAVFADR
+ GAHVVLAVRNLEKGNAARARIMAARPGAHVTLQQLDLCSLDSVRAAADALRTAYPRID
+ VLINNAGVMWTPKQVTKDGFELQFGTNHLGHFALTGLVLDHMLPVPGSRVVTVSSQGH
+ RIHAAIHFDDLQWERRYNRVAAYGQAKLANLLFTYELQRRLGEAGKSTIAVAAHPGGS
+ NTELTRNLPRLIRPVATVLGPLLFQSPEMGALPTLRAATDPTTQGGQYYGPDGFGEQR
+ GHPKVVQSSAQSHDKDLQRRLWTVSEELTGVSFGV"
+ gene 529627..531249
+ /gene="groEL2"
+ /locus_tag="BQ2027_MB0448"
+ CDS 529627..531249
+ /gene="groEL2"
+ /locus_tag="BQ2027_MB0448"
+ /standard_name="groL2; groEL-2; hsp65; hsp60"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0448, groEL2, len: 540 aa. Equivalent to Rv0440,
+ len: 540 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 540 aa overlap). groEL2 (alternate
+ gene names: groL2, groEL-2, hsp65, hsp60), 60 kDa
+ chaperonin 2 (see first citation below). PURIFIED 65 kDa
+ ANTIGEN CAN ELICIT A STRONG DELAYED-TYPE HYPERSENSITIVITY
+ REACTION IN EXPERIMENTAL ANIMALS INFECTED WITH M.
+ TUBERCULOSIS. THIS PROTEIN IS ONE OF THE MAJOR
+ IMMUNOREACTIVE PROTEINS OF THE MYCOBACTERIA. THIS ANTIGEN
+ CONTAINS EPITOPES THAT ARE COMMON TO VARIOUS SPECIES OF
+ MYCOBACTERIA. Contains PS00296 Chaperonins cpn60
+ signature. BELONGS TO THE CHAPERONIN (HSP60) FAMILY.
+ Protein product from Mb0448 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0448 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="60 KDA CHAPERONIN 2 GROEL2 (PROTEIN CPN60-2)
+ (GROEL PROTEIN 2) (65 KDA ANTIGEN) (HEAT SHOCK PROTEIN 65)
+ (CELL WALL PROTEIN A) (ANTIGEN A)"
+ /protein_id="CAB5248154.1"
+ /translation="MAKTIAYDEEARRGLERGLNALADAVKVTLGPKGRNVVLEKKWG
+ APTITNDGVSIAKEIELEDPYEKIGAELVKEVAKKTDDVAGDGTTTATVLAQALVREG
+ LRNVAAGANPLGLKRGIEKAVEKVTETLLKGAKEVETKEQIAATAAISAGDQSIGDLI
+ AEAMDKVGNEGVITVEESNTFGLQLELTEGMRFDKGYISGYFVTDPERQEAVLEDPYI
+ LLVSSKVSTVKDLLPLLEKVIGAGKPLLIIAEDVEGEALSTLVVNKIRGTFKSVAVKA
+ PGFGDRRKAMLQDMAILTGGQVISEEVGLTLENADLSLLGKARKVVVTKDETTIVEGA
+ GDTDAIAGRVAQIRQEIENSDSDYDREKLQERLAKLAGGVAVIKAGAATEVELKERKH
+ RIEDAVRNAKAAVEEGIVAGGGVTLLQAAPTLDELKLEGDEATGANIVKVALEAPLKQ
+ IAFNSGLEPGVVAEKVRNLPAGHGLNAQTGVYEDLLAAGVADPVKVTRSALQNAASIA
+ GLFLTTEAVVADKPEKEKASVPGGGDMGGMDF"
+ gene complement(531315..531743)
+ /locus_tag="BQ2027_MB0449C"
+ CDS complement(531315..531743)
+ /locus_tag="BQ2027_MB0449C"
+ /note="Mb0449c, -, len: 142 aa. Equivalent to Rv0441c,
+ len: 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 142 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0449c detected using SWATH
+ mass spectrometry. Mb0449c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FMN binding protein"
+ /protein_id="CAB5248155.1"
+ /translation="MGAKKVDLKRLAAALPDYPFAYLITVDDGHRVHTVAVEPVLREL
+ PDGPDGPRAVVDVGLIGGRTRQNLAHRSEVTLLWPPSDPSGYSLIVDGRAQASDAGPD
+ DDTARCGVVPIRALLHRDAAPDSPTAAKGCLHDCVVFSVP"
+ gene complement(531770..533209)
+ /gene="PPE10"
+ /locus_tag="BQ2027_MB0450C"
+ CDS complement(531770..533209)
+ /gene="PPE10"
+ /locus_tag="BQ2027_MB0450C"
+ /note="Mb0450c, PPE10, len: 479 aa. Equivalent to Rv0442c,
+ len: 487 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 479 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family, nearly identical to
+ hypothetical protein from Mycobacterium tuberculosis
+ (strain Erdman) and to AN5S46909_1 protein fragment from
+ Mycobacterium bovis (302 aa); P42611|YHS6_MYCTU
+ HYPOTHETICAL 50.6 KD PROTEIN (517 aa), FASTA scores: opt:
+ 3144, E(): 0, (98.4 identity in 492 aa overlap); and
+ S46909|S46909_1 (302 aa), FASTA scores: opt: 1897, E(): 0,
+ (98.0% identity in 302 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis,
+ truncation at the 5' start due to a single base transition
+ (g-a), leads to a shorter product compared to its homolog
+ in Mycobacterium tuberculosis strain H37Rv (479 aa versus
+ 487 aa). Mb0450c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe10"
+ /protein_id="CAB5248156.1"
+ /translation="MPPEINSALMFAGPGSGPLIAAATAWGELAEELLASIASLGSVT
+ SELTSGAWLGPSAAAMMAVATQYLAWLSTAAAQAEQAAAQAMAIATAFEAALAATVQP
+ AVVAANRGLMQLLAATNWFGQNAPALMDVEAAYEQMWALDVAAMAGYHFDASAAVAQL
+ APWQQVLRNLGIDIGKNGQINLGFGNTGSGNIGNNNIGNNNIGSGNTGTGNIGSGNTG
+ SGNLGLGNLGDGNIGFGNTGSGNIGFGITGDHQMGFGGFNSGSGNIGFGNSGTGNVGL
+ FNSGSGNIGIGNSGSLNSGIGTSGTINAGLGSAGSLNTSFWNAGMQNAALGSAAGSEA
+ ALVSSAGYATGGMSTAALSSGILASALGSTGGLQHGLANVLNSGLTNTPVAAPASAPV
+ GGLDSGNPNPGSGSAAAGSGANPGLRSPGTSYPSFVNSGSNDSGLRNTAVREPSTPGS
+ GIPKSNFYPSPDRESAYASPRIGQPVGSE"
+ gene 533415..533930
+ /locus_tag="BQ2027_MB0451"
+ CDS 533415..533930
+ /locus_tag="BQ2027_MB0451"
+ /note="Mb0451, -, len: 171 aa. Equivalent to Rv0443, len:
+ 171 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 171 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ AL049863|SC5H1_23|T35339 hypothetical protein from
+ Streptomyces coelicolor (171 aa), FASTA scores: opt: 561,
+ E(): 2.3e-32, (49.7% identity in 165 aa overlap); and
+ CAC42482.1|AJ318385 hypothetical protein from
+ Amycolatopsis mediterranei (163 aa). Protein product from
+ Mb0451 detected using shotgun mass spectrometry. Mb0451
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="link to FMN-binding protein"
+ /protein_id="CAB5248157.1"
+ /translation="MASTDAAAQELLRDAFTRLIEHVDELTDGLTDQLACYRPTPSAN
+ SIAWLLWHSARVQDIQVAHVAGVEEVWTRDGWVDRFGLDLPRHDTGYGHRPEDVAKVR
+ APADLLSGYYHAVHKLTLEYIAGMTADELSRVVDTSWNPPVTVSARLVSIVDDCAQHL
+ GQAAYLRGIAR"
+ gene complement(534110..534808)
+ /gene="rska"
+ /locus_tag="BQ2027_MB0452C"
+ CDS complement(534110..534808)
+ /gene="rska"
+ /locus_tag="BQ2027_MB0452C"
+ /note="Mb0452c, -, len: 232 aa. Equivalent to Rv0444c,
+ len: 232 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.1% identity in 232 aa overlap). Conserved hypothetical
+ protein; C-terminus similar to P12752|Y24K_STRGR
+ HYPOTHETICAL 24.7 KD PROTEIN from Streptomyces griseus
+ (238 aa), FASTA scores: opt: 207, E(): 2.2e-05, (32.9%
+ identity in 158 aa overlap). Protein product from Mb0452c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0452c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="anti-sigma factor rska (regulator of sigma k)"
+ /protein_id="CAB5248158.1"
+ /translation="MTEHTDFELLELATPYALNAVSDDERADIDRRVAAAPSPVAAAF
+ NDEVRAVRETMAVVSAATTAEPPAHLRTAILDATKPEVRRQSRWRTAAFASAAAIAVG
+ LGAFDLGVLTRPSPPPTVAEQVLTAPDVRTVSRPLGAGTATVVFSRDRNTGLLVMNNV
+ APPSRGTVYQMWLLGGAKGPRSAETMGTAAVTPSTTATLTDLGASTALAFTVEPGTGS
+ PQPTGTILAELPLG"
+ gene complement(534852..535415)
+ /gene="sigK"
+ /locus_tag="BQ2027_MB0453C"
+ CDS complement(534852..535415)
+ /gene="sigK"
+ /locus_tag="BQ2027_MB0453C"
+ /note="Mb0453c, sigK, len: 187 aa. Equivalent to Rv0445c,
+ len: 187 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 187 aa overlap). Probable sigK,
+ alternative RNA polymerase sigma factor (see citation
+ below), highly similar to others e.g.
+ 5531433|CAB50938.1|AL096849|T36745 probable RNA polymerase
+ sigma factor from Streptomyces coelicolor (185 aa);
+ NP_105607.1|14024791|BAB51393.1|AP003005 RNA polymerase
+ sigma factor from Mesorhizobium loti (179 aa);
+ 1654108|AAB17906.1|U11283|A58883 probable transcription
+ initiation factor sigma E from Rhodobacter phaeroides (168
+ aa), FASTA scores: opt: 299, E(): 2e-14, (32.7% identity
+ in 168 aa overlap); Q45585|SIGW_BACSU RNA POLYMERASE SIGMA
+ FACTOR SIGW from Bacillus subtilis (187 aa), FASTA scores:
+ opt: 213, E(): 2.9e-08, (26.8% identity in 179 aa
+ overlap); etc. Protein product from Mb0453c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0453c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="alternative rna polymerase sigma factor sigk"
+ /protein_id="CAB5248159.1"
+ /translation="MTGPPRLSSDLDALLRRVAGHDQAAFAEFYDHTKSRVYGLVMRV
+ LRDTGYSEETTQEIYLEVWRNASEFDSAKGSALAWLLTMAHRRAVDRVRCEQAGNQRE
+ VRYGAANVDPASDVVADLAIAGDERRRVTECLKALTDTQRQCIELAYYGGLTYVEVSR
+ RLAANLSTIKSRMRDALRSLRNCLDVS"
+ gene complement(535464..536234)
+ /locus_tag="BQ2027_MB0454C"
+ CDS complement(535464..536234)
+ /locus_tag="BQ2027_MB0454C"
+ /note="Mb0454c, -, len: 256 aa. Equivalent to Rv0446c,
+ len: 256 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 256 aa overlap). Possible conserved
+ transmembrane protein, similar at N-terminus to
+ U1740AF|U15183|MLU15183_40 from Mycobacterium leprae (117
+ aa), FASTA scores: opt: 175, E(): 2.5e-05, (62.5% identity
+ in 40 aa overlap); and at C-terminus to AL021529|SC10A5_3
+ from Streptomyces coelicolor (226 aa), FASTA scores: opt:
+ 207, E(): 9.8e-07, (34.2% identity in 114 aa overlap).
+ Also similar to others hypothetical proteins e.g.
+ AAK04680.1|AE006291_14|AE006291) HYPOTHETICAL PROTEIN from
+ Lactococcus lactis subsp. lactis (257 aa). Protein product
+ from Mb0454c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0454c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248160.1"
+ /translation="MVTSVSALAVAVVHSVAFAIGRRIGRYNVVDVVWGLGFVAVAVA
+ AATLGHGDPVRRWLLLALVSTWGLRLSWHMYRKTAGQGEDPRYADLLRGATPVQALRK
+ VFGLQGLLTLFVSFPLQLSAVTGPTPKPLLAVGGVGLAVWLVGITFEAVGDWQLWVFK
+ SDPANRGVIMDRGLWAWTRHPNYFGDACVWWGLWLITINDWAPLATVGSPLLMTYLLV
+ DVSGARLTERYLKGRPGFAEYQRRTAYFVPRPPRSARR"
+ gene complement(536243..537526)
+ /gene="ufaA1"
+ /locus_tag="BQ2027_MB0455C"
+ CDS complement(536243..537526)
+ /gene="ufaA1"
+ /locus_tag="BQ2027_MB0455C"
+ /note="Mb0455c, ufaA1, len: 427 aa. Equivalent to Rv0447c,
+ len: 427 aa (start uncertain), from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 427 aa
+ overlap). Probable ufaA1,
+ cyclopropane-fatty-acyl-phospholipid synthase (EC
+ 2.1.1.79), similar to others e.g.
+ NP_102178.1|14021351|BAB47964.1|AP002994
+ cyclopropane-fatty-acyl-phospholipid synthase from
+ Mesorhizobium loti (378 aa);
+ B82240|9655593|AAF94281.1|AE004192
+ cyclopropane-fatty-acyl-phospholipid synthase from Vibrio
+ cholerae (432 aa); P30010|CFA_ECOLI
+ CYCLOPROPANE-FATTY-ACYL-PHOSPHOLIPID SYNTHASE from
+ Escherichia coli strain K-12 (382 aa); X55704|PPLPD_3
+ LPD-3 from P.putida (394 aa), FASTA scores: opt: 556, E():
+ 2.8e-30, (33.3% identity in 387 aa overlap);
+ AE0005|HPAE000557_9 from Helicobacter pylori (389 aa),
+ FASTA scores: opt: 539, E(): 3.9e-29, (34.3% identity in
+ 382 aa overlap). Protein product from Mb0455c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0455c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable cyclopropane-fatty-acyl-phospholipid
+ synthase ufaa1 (cyclopropane fatty acid synthase) (cfa
+ synthase)"
+ /protein_id="CAB5248161.1"
+ /translation="MTVETSQTPSAAIDSDRWPAVAKVPRGPLAAASAAIANRLLRRT
+ ATHLPLRLVYSDGTATGAADPRAPSLFIHRPDALARRIGRHGLIGFGESYMAGEWSSK
+ ELTRVLTVLAGSVDELVPRSLHWLRPITPTFRPSWPDHSRDQARRNIAVHYDLSNDLF
+ AAFLDETMTYSCAMFTDLLAQPTPAWTELAAAQRRKIDRLLDVAGVQQGSHVLEIGTG
+ WGELCIRAAARGAHIRSVTLSVEQQRLARQRVAAAGFGHRVEIDLCDYRDVDGQYDSV
+ VSVEMIEAVGYRSWPRYFAALEQLVRPGGPVAIQAITMPHHRMLATRHTQTWIQKYIF
+ PGGLLPSTQAIIDITGQHTGLRIVDAASLRPHYAETLRLWRERFMQRRDGLAHLGFDE
+ VFARMWELYLAYSEAGFRSGYLDVYQWTLIREGPP"
+ gene complement(537523..538188)
+ /locus_tag="BQ2027_MB0456C"
+ CDS complement(537523..538188)
+ /locus_tag="BQ2027_MB0456C"
+ /note="Mb0456c, -, len: 221 aa. Equivalent to Rv0448c,
+ len: 221 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 221 aa overlap). Conserved
+ hypothetical protein, similar to other hypothetical
+ proteins e.g. Z74841|BOD5A2_1 from B. oleracea (283 aa),
+ FASTA scores: opt: 257, E(): 1.4e-10, (32.0% identity in
+ 197 aa overlap); etc. Some similarity to
+ U15183|MLU15183_38 from Mycobacterium leprae (82 aa),
+ FASTA scores: opt: 134, E(): 0.014, (71.0% identity in 31
+ aa overlap). Protein product from Mb0456c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0456c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248162.1"
+ /translation="MHHSFAYRSYSWYVDVDNLPQLPWWLRPFARFHADDHFADPFSC
+ PPHSSLRDRLDAFFAARGLAVPDGRITALLQARVLGYVFNPLSIFWCHDRDGQLRHVI
+ AEVHNTYGGRHAYLLPPADLPVVTAKNFYVSPFHQLAGYYLIRAPRPDRELDVTVTLH
+ RDRRQVCPEFTATLRGQRRPATTRQIAMMQIISPLAPMVVAARIRIQGIRLWLRRVPV
+ VPR"
+ gene complement(538248..539567)
+ /locus_tag="BQ2027_MB0457C"
+ CDS complement(538248..539567)
+ /locus_tag="BQ2027_MB0457C"
+ /note="Mb0457c, -, len: 439 aa. Equivalent to Rv0449c,
+ len: 439 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 439 aa overlap). Conserved
+ hypothetical protein, some similarity with several
+ hypothetical proteins and various enzymes e.g.
+ AAK24569.1|AE005927 amine oxidase, flavin-containing from
+ Caulobacter crescentus (454 aa); BAB02771.1|AB023036
+ mycolic acid methyl transferase-like protein from
+ Arabidopsis thaliana (842 aa); BAB01742.1|AP000374 protein
+ which contains similarity to cyclopropane fatty acid
+ synthase from Arabidopsis thaliana (793 aa); etc. Has
+ hydrophobic stretch at N-terminus. Protein product from
+ Mb0457c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0457c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Amine oxidase, flavin-containing"
+ /protein_id="CAB5248163.1"
+ /translation="MQQSLRRSVAVVGSGVAGLTAAYILSGRDRVTLYEADGRLGGHA
+ HTHYLDNGGGPRGTDVVGVDSAFLVHNDRTYPTLCRLFAELGVATQESEMSMSVRADD
+ IGLEYAGALGARGLFACRQSLRPRYLCMLAEILRFHRAAARLLREETDNAEDKPETLE
+ AFLSRHHFSQYFVDYFITPLVAAVWSCGGADALRYPARYLFVFLDHHGMLSVFGSPTW
+ RTVTGGSANYVQAIAAQLDEVSTRTPVHSLRRLPDGVLVGAGDGPSRRFDAAVVAVHP
+ DQALLLLDEPTPAERAVLGAIAYSTNSAQLHTDESVLPRHHRARASWNYLVTPGQHQV
+ VVSYDISRLMRLDGGRRYLVTLGGHDRVDPSSVIAEMTYSHPLYTPESVAAQRLLPTL
+ GDNRVVFAGAYHGWGFHEDGAASGLRAARRLGADWPAAIPQEAMVAC"
+ gene complement(539607..542510)
+ /gene="mmpL4"
+ /locus_tag="BQ2027_MB0458C"
+ CDS complement(539607..542510)
+ /gene="mmpL4"
+ /locus_tag="BQ2027_MB0458C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0458c, mmpL4, len: 967 aa. Equivalent to Rv0450c,
+ len: 967 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 967 aa overlap). Probable mmpL4,
+ conserved transmembrane transport protein (see citations
+ below), member of RND superfamily, equivalent to
+ U1740V|P54881|YV34_MYCLE HYPOTHETICAL 105.2 kDa PROTEIN
+ from Mycobacterium leprae (959 aa), FASTA scores: opt:
+ 5051, E(): 0, (78.4% identity in 962 aa overlap). Also
+ highly similar to other proteins from Mycobacterium
+ tuberculosis e.g. Z83860|MTCY98.08 (962 aa), FASTA scores:
+ opt: 3917, E(): 0, (61.3% identity in 950 aa overlap),
+ MTCY20G9.34, etc. Contains PS00211 ABC transporters family
+ signature. BELONGS TO THE MMPL FAMILY. TBparse score is
+ 0.948. Protein product from Mb0458c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0458c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL4"
+ /protein_id="CAB5248164.1"
+ /translation="MSTKFANDSNTNARPEKPFIARMIHAFAVPIILGWLAVCVVVTV
+ FVPSLEAVGQERSVSLSPKDAPSFEAMGRIGMVFKEGDSDSFAMVIIEGNQPLGDAAH
+ KYYDGLVAQLRADKKHVQSVQDLWGDPLTAAGVQSNDGKAAYVQLSLAGNQGTPLANE
+ SVEAVRSIVESTPAPPGIKAYVTGPSALAADMHHSGDRSMARITMVTVAVIFIMLLLV
+ YRSIITVVLLLITVGVELTAARGVVAVLGHSGAIGLTTFAVSLLTSLAIAAGTDYGIF
+ IIGRYQEARQAGEDKEAAYYTMYRGTAHVILGSGLTITGATFCLSFARMPYFQTLGIP
+ CAVGMLVAVAVALTLGPAVLHVGSRFGLFDPKRLLKVRGWRRVGTVVVRWPLPVLVAT
+ CAIALVGLLALPGYKTSYNDRDYLPDFIPANQGYAAADRHFSQARMKPEILMIESDHD
+ MRNPADFLVLDKLAKGIFRVPGISRVQAITRPEGTTMDHTSIPFQISMQNAGQLQTIK
+ YQRDRANDMLKQADEMATTIAVLTRMHSLMAEMASTTHRMVGDTEEMKEITEELRDHV
+ ADFDDFWRPIRSYFYWEKHCYGIPICWSFRSIFDALDGIDKLSEQIGVLLGDLREMDR
+ LMPQMVAQIPPQIEAMENMRTMILTMHSTMTGIFDQMLEMSDNATAMGKAFDAAKNDD
+ SFYLPPEVFKNKDFQRAMKSFLSSDGHAARFIILHRGDPQSPEGIKSIDAIRTAAEES
+ LKGTPLEDAKIYLAGTAAVFHDISEGAQWDLLIAAISSLCLIFIIMLIITRAFIAAAV
+ IVGTVALSLGASFGLSVLLWQHILAIHLHWLVLAMSVIVLLAVGSDYNLLLVSRFKQE
+ IGAGLKTGIIRSMGGTGKVVTNAGLVFAVTMASMAVSDLRVIGQVGTTIGLGLLFDTL
+ IVRSFMTPSIAALLGRWFWWPLRVRSRPARTPTVPSETQPAGRPLAMSSDRLG"
+ gene complement(542507..542929)
+ /gene="mmpS4"
+ /locus_tag="BQ2027_MB0459C"
+ CDS complement(542507..542929)
+ /gene="mmpS4"
+ /locus_tag="BQ2027_MB0459C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0459c, mmpS4, len: 140 aa. Equivalent to Rv0451c,
+ len: 140 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 140 aa overlap). Probable mmpS4,
+ conserved membrane protein (see citations below),
+ equivalent to U1740W|P54880|YV33_MYCLE HYPOTHETICAL 16.9
+ kDa PROTEIN from Mycobacterium leprae (154 aa), FASTA
+ scores: opt: 727, E(): 0, (75.9% identity in 137 aa
+ overlap). Also similar to other Mycobacterial proteins
+ e.g. Z84725|MTCY04D9.16c from Mycobacterium tuberculosis
+ (142 aa), FASTA scores: opt: 451, E(): 3.2e-24, (50.0%
+ identity in 138 aa overlap); etc. BELONGS TO THE MMPS
+ FAMILY. TBparse score is 0.953. Protein product from
+ Mb0459c detected using SWATH mass spectrometry. Mb0459c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN MMPS4"
+ /protein_id="CAB5248165.1"
+ /translation="MLMRTWIPLVILVVVIVGGFTVHRIRGFFGSENRPSYSDTNLEN
+ SKPFNPKHLTYEIFGPPGTVADISYFDVNSEPQRVDGAVLPWSLHITTNDAAVMGNIV
+ AQGNSDSIGCRITVDGKVRAERVSNEVNAYTYCLVKSA"
+ gene 543161..543871
+ /locus_tag="BQ2027_MB0460"
+ CDS 543161..543871
+ /locus_tag="BQ2027_MB0460"
+ /note="Mb0460, -, len: 236 aa. Equivalent to Rv0452, len:
+ 236 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 236 aa overlap). Possible
+ transcriptional regulator, similar to several putative
+ TetR-family transcriptional regulators from Streptomyces
+ coelicolor. Also similar in N-terminus to
+ U1740Y|U15183|MLU15183_33 from Mycobacterium leprae (67
+ aa), FASTA score: (76.1% identity in 67 aa overlap).
+ Contains probable helix-turn-helix motif at aa 44-65
+ (Score 1727, +5.07 SD). Protein product from Mb0460
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0460 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5248166.1"
+ /translation="MRYPLAVAQLGFQRARTEENKRQRAAALVEAARSLALETGVASV
+ TLTAVAGRAGIHYSAVRRYFTSHKEVLLHLAAEGWARWSGTVCEQLGEPGPMSAPRVA
+ EALANGLAADPLFCDLLANLHLHLEQEVDVDRVIEVKRTSIAAVIALVDAIESALPAL
+ GRSGAFDILLAAYSLAATLWQIANPPERLTDAYAEEPELLPPEWNLDFAAALTRLLTA
+ TLLGLLAGSPCECRSPTR"
+ gene 544193..545749
+ /gene="PPE11"
+ /locus_tag="BQ2027_MB0461"
+ CDS 544193..545749
+ /gene="PPE11"
+ /locus_tag="BQ2027_MB0461"
+ /note="Mb0461, PPE11, len: 518 aa. Equivalent to Rv0453,
+ len: 518 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 518 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family, similar to many
+ e.g. AL0212|MTV012_32 from Mycobacterium tuberculosis (434
+ aa), FASTA scores: opt: 882, E(): 7e-31, (41.8% identity
+ in 514 aa overlap). Mb0461 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe11"
+ /protein_id="CAB5248167.1"
+ /translation="MTSALIWMASPPEVHSALLSSGPGPGPVLAAATGWSSLGREYAA
+ VAEELGALLAAVQAGVWQGPSAESFAAACLPYLSWLTQASADCAAAAARLEAVTAAYA
+ AALVAMPTLAELAANHATHGAMVATNFFGINTIPIAVNEADYVRMWLQAATTMATYQA
+ VADSAVRSIPDSVPPPRILKSNAQSQHSSSNNSGGADPVDDFIAEILKIITGGRVIWD
+ PEAGTVNGLPYDAYTNPGTLMWWIARSLELLQDFQEFAKLLFTNPVKAFQFLVDLILF
+ DWPTHMLQLATWLAENPQLLVAALTPAISGLGAVSGLAGLTGLVPQPPVVPAPAPDAV
+ VPTVLPLAGTATPTTAPASAPAAGAAPGPPAGTATATSASVPTSAGGFPPYLVGSGPG
+ IDFDAGTPAGSRRAQPAADNVTAVAAAQVSARHQARRRRRAAAKERGNADEFVDMDSG
+ PAIPPSGERDAWASNSGVGGLGFAGTASNETVAAPAGLTTLADDEFQCGPRMPMLPGA
+ WDLGTWDRGD"
+ gene 545854..546204
+ /locus_tag="BQ2027_MB0462"
+ CDS 545854..546204
+ /locus_tag="BQ2027_MB0462"
+ /note="Mb0462, -, len: 116 aa. Equivalent to Rv0454, len:
+ 116 aa (start uncertain), from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 116 aa overlap).
+ Conserved hypothetical protein, showing similarity with
+ AAA63007.1|U15183 hypothetical protein from Mycobacterium
+ leprae (115 aa), FASTA scores: opt: 151, E(): 0.0019,
+ (31.5% identity in 89 aa overlap). Mb0462 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248168.1"
+ /translation="MKQDFGLDVPQAGNAQNFDGVPEWVQVGVVTFVYRMQMHHVTRP
+ VGAPGSGLAGDSTPVQGRQRVWDLVAGRLTHAPRSSVQAMRPTMFTSAPQRHGIPARG
+ RWWLGYQERSRAWP"
+ gene complement(546394..546840)
+ /locus_tag="BQ2027_MB0463C"
+ CDS complement(546394..546840)
+ /locus_tag="BQ2027_MB0463C"
+ /note="Mb0463c, -, len: 148 aa. Equivalent to Rv0455c,
+ len: 148 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 148 aa overlap). Conserved
+ hypothetical protein, equivalent to CAC31896.1|AL583925
+ possible secreted protein from Mycobacterium leprae (153
+ aa). Has hydrophobic stretch at N-terminus. Protein
+ product from Mb0463c detected using shotgun mass
+ spectrometry. Mb0463c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative membrane protein"
+ /protein_id="CAB5248169.1"
+ /translation="MSRLSSILRAGAAFLVLGIAAATFPQSAAADSTEDFPIPRRMIA
+ TTCDAEQYLAAVRDTSPVYYQRYMIDFNNHANLQQATINKAHWFFSLSPAERRDYSEH
+ FYNGDPLTFAWVNHMKIFFNNKGVVAKGTEVCNGYPAGDMSVWNWA"
+ gene complement(546908..547822)
+ /gene="echA2"
+ /locus_tag="BQ2027_MB0464C"
+ CDS complement(546908..547822)
+ /gene="echA2"
+ /locus_tag="BQ2027_MB0464C"
+ /note="Mb0464c, echA2, len: 304 aa. Equivalent to Rv0456c,
+ len 304 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 304 aa overlap). Probable echA2,
+ enoyl-CoA hydratase (EC 4.2.1.17), similar to other
+ enoyl-coA hydratases e.g. Q13011 PEROXISOMAL ENOYL-COA
+ HYDRATASE-LIKE PROTEIN (328 aa), FASTA scores: opt: 209,
+ E(): 5.3e-07, (31.7% identity in 142 aa overlap). Also
+ similar to several other proteins from Mycobacterium
+ tuberculosis e.g. MTCY09F9.29 FASTA score: (32.9% identity
+ in 146 aa overlap); and MTI376.01c. Protein product from
+ Mb0464c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0464c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ENOYL-COA HYDRATASE ECHA2 (ENOYL HYDRASE)
+ (UNSATURATED ACYL-COA HYDRATASE) (CROTONASE)"
+ /protein_id="CAB5248170.1"
+ /translation="MPTPDFQTLLYTTAGPVATITLNRPEQLNTIVPPMPDEIEAAIG
+ LAERDQDIKVIVLRGAGRAFSGGYDFGGGFQHWGDAMMTDGRWDPGKDFAMVTARETG
+ PTQKFMAIWRASKPVIAQVHGWCVGGASDYALCADIVIASEDAVIGTPYSRMWGAYLT
+ GMWLYRLSLAKVKWHSLTGRPLTGVQAAEAELINEAVPFERLEARVAEIATELARIPL
+ SQLQAQKLIVNQAYENMGLASTQLLGGILDGLMRNTPDALEFIRTAQTQGVRAAVERR
+ DGPFGDYSQAPPELRPDPTHVITPDGSM"
+ gene complement(548095..548376)
+ /gene="mazf1"
+ /locus_tag="BQ2027_MB0465C"
+ CDS complement(548095..548376)
+ /gene="mazf1"
+ /locus_tag="BQ2027_MB0465C"
+ /note="Mb0465c, -, len: 93 aa. Equivalent to Rv0456A, len:
+ 93 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 93 aa overlap). Conserved hypothetical
+ protein; N-terminus highly similar to N-terminal part of
+ P71650|Rv2801c|MT2869|MTCY16B7.42 CONSERVED HYPOTHETICAL
+ PROTEIN from Mycobacterium tuberculosis (118 aa), FASTA
+ scores: opt: 303, E(): 1e-14, (60.44% identity in 91 aa
+ overlap). Also some similarity in part with other
+ hypothetical proteins e.g. Q9PHH8|XFA0027 Plasmid
+ maintenance protein from Xylella fastidiosa (108 aa),
+ FASTA scores: opt: 169, E(): 3.9e-05, (50.820% identity in
+ 61 aa overlap). Mb0465c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin mazf1"
+ /protein_id="CAB5248171.1"
+ /translation="MLRGEIWQVDLDPARGSAANMRRPAVIVSNDRANAAAIRLDRGV
+ VPVVPVTSNTEKVPIPGVVAGSERWPGRRFEGAGPAGWIRRCATSPLPS"
+ gene complement(548363..548488)
+ /gene="mazE1"
+ /locus_tag="BQ2027_MB0466A"
+ CDS complement(548363..548488)
+ /gene="mazE1"
+ /locus_tag="BQ2027_MB0466A"
+ /note="Mb0466A, len: 41 aa. Equivalent to Rv0456B len: 57
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 40 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Possible mazE1,
+ antitoxin, part of toxin-antitoxin (TA) operon with
+ Rv0456A (See Pandey and Gerdes, 2005; Zhu et al., 2006).
+ Mb0466A found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible antitoxin MazE1"
+ /protein_id="CAB5248172.1"
+ /translation="MRHEAKRELVYRGRRSIGRMPREWACRRSRRFAANGVDAAR"
+ gene complement(548605..550635)
+ /locus_tag="BQ2027_MB0466C"
+ CDS complement(548605..550635)
+ /locus_tag="BQ2027_MB0466C"
+ /note="Mb0466c, -, len: 676 aa. Equivalent to Rv0457c,
+ len: 673 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 673 aa overlap). Probable peptidase
+ (EC 3.4.-.-), similar to many e.g.
+ NP_102851.1|14022026|BAB48637.1 probable endopeptidase
+ from Mesorhizobium loti (687 aa); Y4NA_RHISN|P55577
+ probable peptidase (EC 3.4.21.-) (726 aa), FASTA scores:
+ opt: 1126, E(): 0, (40.9% identity in 491 aa overlap).
+ Also similar to Mycobacterium tuberculosis protein
+ MTCY369.26 FASTA score: (33.8% identity in 299 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a possible RBS upstream leads to an earlier start
+ resulting in a slightly longer product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (676 aa
+ versus 673 aa). Protein product from Mb0466c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0466c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PEPTIDASE"
+ /protein_id="CAB5248173.1"
+ /translation="MASMTFEPAPDGADPYLWLEDVTGAEALDWVRARNKPTTAAFCD
+ AEFERMRVEALEVLDTDARIPYVNRRGNYLYNFWRDAANPRGLWRRTTLDSYRTDSPG
+ WDVLIDVDELGRADDQKWVWGGAGVIEPDYTRALIGLSPGGSDASIVREFDMLTREFV
+ EDGFQLPPAKSQITWEDPDTVLLGTDFGGDSLTTSGYPRVIKRWRRGKPLADAETIFE
+ GAGTDVRVNASADRTPGFERTLLGRALDFWNEEVYELRGSELIRIEAPTDASVSIHRD
+ WLLIELRTDWTVATTRYTAGSLLAAEYDEFLAGSAELQVVFEPDEHTALYQYAWTRDR
+ LLIVTLADVASRVEIATPGSWRREPLSGIPAATNTVIVSADSHGDEFFLDSSGFDTPS
+ RLMRGTDDGRLAEIKSAPAFFDAENMAVTQYFATSDDGTSIPYFVVRRTDADNPGPTL
+ LNGYGGFETSRTPTYDGVLGRLWLARGGTYALANIRGGGEYGPGWHTQAMREGRDKVA
+ QDFAAVATDLVTRGITTAEQLGARGGSNGGLLMGIMLTGYPEKFGALVCDVPLLDMKR
+ YHLLLAGASWMAEYGDPDNPDDWKFISEYSPYQNISANRKYPPVLMTTSTRDDRVHPG
+ HARKMTAALQAAGHPVWYYENIEGGHAGAADNAQIAFKSALSFAFLWRMLAG"
+ gene 550694..552217
+ /locus_tag="BQ2027_MB0467"
+ CDS 550694..552217
+ /locus_tag="BQ2027_MB0467"
+ /note="Mb0467, -, len: 507 aa. Equivalent to Rv0458, len:
+ 507 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 507 aa overlap). Probable aldehyde
+ dehydrogenase (EC 1.2.1.3), highly similar to many,
+ closest to P46369|THCA_RHOER EPTC-INDUCIBLE ALDEHYDE
+ DEHYDROGENASE from Rhodococcus erythropolis (506 aa),
+ FASTA scores: opt: 2767, E(): 0, (79.7% identity in 507 aa
+ overlap); AAC13641.1|AF029733 chloroacetaldehyde
+ dehydrogenase from Xanthobacter autotrophicus (505 aa),
+ FASTA scores: opt: 2563, E(): 0, (75.4% identity in 492 aa
+ overlap); Q9RJZ6|DHAL_STRCO PROBABLE ALDEHYDE
+ DEHYDROGENASE from Streptomyces coelicolor (507 aa). Also
+ similar to other semialdehyde dehydrogenases in M.
+ tuberculosis e.g. Rv0768, Rv2858c. BELONGS TO THE ALDEHYDE
+ DEHYDROGENASES FAMILY. Protein product from Mb0467
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0467 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ALDEHYDE DEHYDROGENASE"
+ /protein_id="CAB5248174.1"
+ /translation="MTVFSRPGSAGALMSYESRYQNFIGGQWVAPVHGRYFENPTPVT
+ GQPFCEVPRSDAADIDKALDAAHAAAPGWGKTAPAERAAILNMIADRIDKNAAALAVA
+ EVWDNGKPVREALAADIPLAVDHFRYFAAAIRAQEGALSQIDEDTVAYHFHEPLGVVG
+ QIIPWNFPILMAAWKLAPALAAGNTAVLKPAEQTPASVLYLMSLIGDLLPPGVVNVVN
+ GFGAEAGKPLASSDRIAKVAFTGETTTGRLIMQYASHNLIPVTLELGGKSPNIFFADV
+ LAAHDDFCDKALEGFTMFALNQGEVCTCPSRSLIQADIYDEFLELAAIRTKAVRQGDP
+ LDTETMLGSQASNDQLEKVLSYIEIGKQEGAVIIAGGERAELGGDLSGGYYMQPTIFT
+ GTNNMRIFKEEIFGPVVAVTSFTDYDDAIGIANDTLYGLGAGVWSRDGNTAYRAGRDI
+ QAGRVWVNCYHLYPAHAAFGGYKQSGIGREGHQMMLQHYQHTKNLLVSYSDKALGFF"
+ gene 552217..552708
+ /locus_tag="BQ2027_MB0468"
+ CDS 552217..552708
+ /locus_tag="BQ2027_MB0468"
+ /note="Mb0468, -, len: 163 aa. Equivalent to Rv0459, len:
+ 163 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 163 aa overlap). Conserved
+ hypothetical protein, highly similar to other hypothetical
+ proteins. Note that highly similar to products of
+ unidentified orfs in Xanthobacter autotrophicus,
+ AF029733_2 (139 aa), and Rhodococcus erythropolis, REREUTP
+ BC_1 (186 aa). Like MTV038.03, these ORF's are linked to
+ aldehyde dehydrogenase genes. FASTA scores:
+ AF0297|AF029733_2 (139 aa), opt: 439, E(): 6.2e-24, (50.0%
+ identity in 126 aa overlap); and L24492|REREUTPBC_1 (186
+ aa), opt: 347, E(): 2.1e-17, (52.7% identity in 169 aa
+ overlap). N-terminus also highly similar to
+ AAA63041.1|U15183 ethanolamine permease (eutP) match from
+ Mycobacterium leprae (53 aa). Protein product from Mb0468
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0468 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="related to oxidoreductase activity"
+ /protein_id="CAB5248175.1"
+ /translation="MNAPAGVLITAEAAALLAGLQDRHGPVMFHQSGGCCDGSAPMCY
+ PRADFLVGDRDILLGVLDVGEDGVPVWISGPQYQAWKHTQLIIDVVPGRGGGFSLEAP
+ EGVRFLSRGRVFSDAEKAMREAAPVITGAAYECGERPLVRGLVVDLDDPDATPGVCRA
+ SRR"
+ gene 552768..553007
+ /locus_tag="BQ2027_MB0469"
+ CDS 552768..553007
+ /locus_tag="BQ2027_MB0469"
+ /note="Mb0469, -, len: 79 aa. Equivalent to Rv0460, len:
+ 79 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 79 aa overlap). Conserved hydrophobic
+ protein, highly similar AAA63024.1|U15183 hypothetical
+ protein from Mycobacterium leprae (56 aa), FASTA scores:
+ opt: 197, E(): 3.7e-09, (63.8% identity in 47 aa overlap).
+ Mb0469 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYDROPHOBIC PROTEIN"
+ /protein_id="CAB5248176.1"
+ /translation="MLVGNAIGLLAGVACSVLVHARIRPDIVIAMVVGIPSAIGLLVI
+ LFSGRRWVTMLGAFILALAPGWFGVLVAIQVASSG"
+ gene 553045..553569
+ /locus_tag="BQ2027_MB0470"
+ CDS 553045..553569
+ /locus_tag="BQ2027_MB0470"
+ /note="Mb0470, -, len: 174 aa. Equivalent to Rv0461, len:
+ 174 aa (start uncertain), from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 174 aa overlap).
+ Probable transmembrane protein. Protein product from
+ Mb0470 detected using SWATH mass spectrometry. Mb0470
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248177.1"
+ /translation="MPDFDTGAHSQRFLSLAGQQDRAGKSWPGSTPKPQEDPVGVAPS
+ ASVEVLGSEPAATLAHSVTVPGRYTYLKWWKFVLVVLGVWIGAGEVGLSLFYWWYHTL
+ DKTAAVFVVLVYVVACTVGGLILALVPGRPLITALSLGVMSGPFASVAAAAPLYGYYY
+ CERMSHCLVGVIPY"
+ gene 553633..555027
+ /gene="lpd"
+ /locus_tag="BQ2027_MB0471"
+ CDS 553633..555027
+ /gene="lpd"
+ /locus_tag="BQ2027_MB0471"
+ /standard_name="TB49.2"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0471, lpd, len: 464 aa. Equivalent to Rv0462,
+ len: 464 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 464 aa overlap). lpd (alternate gene
+ name: TB49.2), dihydrolipoamide dehydrogenase (EC 1.8.1.4)
+ (see first citation below), equivalent to
+ AAA63016.1|U15183 lipoamide dehydrogenase from
+ Mycobacterium leprae (467 aa), FASTA scores: opt: 2583,
+ E(): 0, (83.1% identity in 467 aa overlap). Also similar
+ to to many e.g. P50970|DLDH_ZYMMO|X82291|ZMLPD_1
+ DIHYDROLIPOAMIDE DEHYDROGENASE from Z.mobilis (466 aa),
+ FASTA scores: opt: 1198, E(): 0, (42.4 % identity in 465
+ aa overlap); etc. BELONG TO THE PYRIDINE
+ NUCLEOTIDE-DISULFIDE OXIDOREDUCTASES CLASS-I. Protein
+ product from Mb0471 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0471 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="dihydrolipoamide dehydrogenase lpdc (lipoamide
+ reductase (nadh)) (lipoyl dehydrogenase) (dihydrolipoyl
+ dehydrogenase) (diaphorase)"
+ /protein_id="CAB5248178.1"
+ /translation="MTHYDVVVLGAGPGGYVAAIRAAQLGLSTAIVEPKYWGGVCLNV
+ GCIPSKALLRNAELVHIFTKDAKAFGISGEVTFDYGIAYDRSRKVAEGRVAGVHFLMK
+ KNKITEIHGYGTFADANTLLVDLNDGGTESVTFDNAIIATGSSTRLVPGTSLSANVVT
+ YEEQILSRELPKSIIIAGAGAIGMEFGYVLKNYGVDVTIVEFLPRALPNEDADVSKEI
+ EKQFKKLGVTILTATKVESIADGGSQVTVTVTKDGVAQELKAEKVLQAIGFAPNVEGY
+ GLDKAGVALTDRKAIGVDDYMRTNVGHIYAIGDVNGLLQLAHVAEAQGVVAAETIAGA
+ ETLTLGDHRMLPRATFCQPNVASFGLTEQQARNEGYDVVVAKFPFTANAKAHGVGDPS
+ GFVKLVADAKHGELLGGHLVGHDVAELLPELTLAQRWDLTASELARNVHTHPTMSEAL
+ QECFHGLVGHMINF"
+ gene 555035..555328
+ /locus_tag="BQ2027_MB0472"
+ CDS 555035..555328
+ /locus_tag="BQ2027_MB0472"
+ /note="Mb0472, -, len: 97 aa. Equivalent to Rv0463, len:
+ 97 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 97 aa overlap). Probable conserved
+ transmembrane protein, highly similar to AAA63017.1|U15183
+ hypothetical protein from Mycobacterium leprae (101 aa),
+ FASTA scores: opt: 364, E(): 4e-21, (57.9% identity in 95
+ aa overlap). Mb0472 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5248179.1"
+ /translation="MTRRASTDTPQIIMGAIGGVVTGYILWLAAISVGDGLTTVSQWS
+ RVVLLLSVLVAVCGAAGGLRLRSRGKLAWSAFAFSLPIPPVVLTVAVLADIYL"
+ gene complement(555332..555904)
+ /locus_tag="BQ2027_MB0473C"
+ CDS complement(555332..555904)
+ /locus_tag="BQ2027_MB0473C"
+ /note="Mb0473c, -, len: 190 aa. Equivalent to Rv0464c,
+ len: 190 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 190 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ CAC31982.1|AL583925 conserved hypothetical protein from
+ Mycobacterium leprae (188 aa). Also some similarity with
+ Rv1531|AL022000|MTV045_5|D70820 hypothetical protein from
+ Mycobacterium tuberculosis (188 aa), FASTA scores: E():
+ 9.6e-10, (30.9% identity in 175 aa overlap). Protein
+ product from Mb0473c detected using shotgun mass
+ spectrometry. Mb0473c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248180.1"
+ /translation="MTGQNGQVARISPGKFRQLGPVNWLVAKLAARAVGAPQMHLFTT
+ LGYRQYLFWTFAIYTGRLLHGRLPGVDTELVILRVAHLRSCEYELQHHRRMARRRGLD
+ ANTQATIFAWPDVPDGDGPRKVLSARQQALLQATDELIKDRTITAGTWERLATHLDPR
+ LLIEFCLLATQYDAIAATITALAIPPDNPQ"
+ gene complement(555901..557325)
+ /locus_tag="BQ2027_MB0474C"
+ CDS complement(555901..557325)
+ /locus_tag="BQ2027_MB0474C"
+ /note="Mb0474c, -, len: 474 aa. Equivalent to Rv0465c,
+ len: 474 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 474 aa overlap). Probable
+ transcriptional regulator, highly similar to
+ AC44331.1|AL596102 putative DNA-binding protein from
+ Streptomyces coelicolor (489 aa); and similar to several
+ hypothetical proteins and others transcriptional
+ regulators. Some similarity in N-terminal region (1-100
+ aa) with repressors e.g. P06153|RPC_BPPH1 IMMUNITY
+ REPRESSOR PROTEIN (144 aa), FASTA scores: opt: 130, E():
+ 0.084,(27.0% identity in 100 aa overlap). Very similar to
+ Rv1129c|Z95585|MTCY22G8.18c from Mycobacterium
+ tuberculosis (486 aa), FASTA scores: opt: 1475, E(): 0,
+ (47.4% identity in 468 aa overlap). Contains probable
+ helix-turn-helix motif at aa 19-40 (1827, +5.41 SD).
+ Protein product from Mb0474c detected using SWATH mass
+ spectrometry. Mb0474c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5248181.1"
+ /translation="MSKTYVGSRVRQLRNERGFSQAALAQMLEISPSYLDQIEHDVRP
+ LTVAVLLRITEVFGVDATFFASQDDTRLVAELREVTLDRDLDIAIDPHEVAEMVSAHP
+ GLARAVVNLHRRYRITTAQLAAATEERFSDGSGRGSITMPHEEVRDYFYQRQNYLHAL
+ DTAAEDLTAQMRMHHGDLARELTRRLTEVHGVRINKRIDLGDTVLHRYDPATNTLEIS
+ SHLSPGQQVFKMAAELAYLEFGDLIDAMVTDGKFTSAESRTLARLGLANYFAAATVLP
+ YRQFHDVAENFRYDVERLSAFYSVSYETIAHRLSTLQRPSMRGVPFTFVQVDRAGNMS
+ KRQSATGFHFSSSGGTCPLWNVYETFANPGKILVQIAQMPDGRNYLWVARTVELRAAR
+ YGQPGKTFAIGLGCELRHAHRLVYSEGLDLSGDPNTAATPIGAGCRVCERDNCPQRAF
+ PALGRALDLDEHRSTVSPYLVKQL"
+ gene 557477..558271
+ /locus_tag="BQ2027_MB0475"
+ CDS 557477..558271
+ /locus_tag="BQ2027_MB0475"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0475, -, len: 264 aa. Equivalent to Rv0466, len:
+ 264 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 264 aa overlap). Conserved
+ hypothetical protein, equivalent to CAC31980.1|AL583925
+ conserved hypothetical protein from Mycobacterium leprae
+ (264 aa). Similar to Rv2001|Z74025|MTCY39.17c HYPOTHETICAL
+ 28.7 KDA PROTEIN from Mycobacterium tuberculosis (250 aa),
+ FASTA scores: opt: 592, E(): 0, (38.0% identity in 263 aa
+ overlap). Some similarity to several THIOESTERASES e.g.
+ Q42561|ATACPTE17_1 ACYL-(ACYL CARRIER PROTEIN) THIOESTER
+ from A. thaliana (362 aa), FASTA scores: E(): 0.0092,
+ (24.4% identity in 197 aa overlap). Protein product from
+ Mb0475 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0475 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Acyl-ACP thioesterase"
+ /protein_id="CAB5248182.1"
+ /translation="MSLDKKLMPVPDGHPDVFDREWPLRVGDIDRAGRLRLDAACRHI
+ QDIGQDQLREMGFEETHPLWIVRRTMVDLIRPIEFGDMLRCRRWCSGTSNRWCEMRVR
+ VDGRKGGLIESEAFWIHVNRETEMPARIADDFLAGLHRTTSVDRLRWKGYLKPGSRDD
+ ASEIHEFPVRVTDIDLFDHMNNAVYWSVIEDYLASHAELLRGPLRVTIEHEAPVALGD
+ KLEIISHVHPAGSTEIFGPGLVDRAVTTLTYVVGDEPKAVASLFNL"
+ gene 558546..559832
+ /gene="icl"
+ /locus_tag="BQ2027_MB0476"
+ CDS 558546..559832
+ /gene="icl"
+ /locus_tag="BQ2027_MB0476"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0476, icl, len: 428 aa. Equivalent to Rv0467,
+ len: 428 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 428 aa overlap). icl (previously known
+ as aceA), isocitrate lyase (EC 4.1.3.1) (see citations
+ below), highly similar to many, closest to
+ Z29367|RFISCILY_1 from R. fascians (429 aa), FASTA scores:
+ opt: 2359, E(): 0, (80.7% identity in 429 aa overlap).
+ BELONGS TO THE ISOCITRATE LYASE FAMILY. Protein product
+ from Mb0476 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0476 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ISOCITRATE LYASE ICL (ISOCITRASE)
+ (ISOCITRATASE)"
+ /protein_id="CAB5248183.1"
+ /translation="MSVVGTPKSAEQIQQEWDTNPRWKDVTRTYSAEDVVALQGSVVE
+ EHTLARRGAEVLWEQLHDLEWVNALGALTGNMAVQQVRAGLKAIYLSGWQVAGDANLS
+ GHTYPDQSLYPANSVPQVVRRINNALQRADQIAKIEGDTSVENWLAPIVADGEAGFGG
+ ALNVYELQKALIAAGVAGSHWEDQLASEKKCGHLGGKVLIPTQQHIRTLTSARLAADV
+ ADVPTVVIARTDAEAATLITSDVDERDQPFITGERTREGFYRTKNGIEPCIARAKAYA
+ PFADLIWMETGTPDLEAARQFSEAVKAEYPDQMLAYNCSPSFNWKKHLDDATIAKFQK
+ ELAAMGFKFQFITLAGFHALNYSMFDLAYGYAQNQMSAYVELQEREFAAEERGYTATK
+ HQREVGAGYFDRIATTVDPNSSTTALTGSTEEGQFH"
+ gene 559914..560774
+ /gene="fadB2"
+ /locus_tag="BQ2027_MB0477"
+ CDS 559914..560774
+ /gene="fadB2"
+ /locus_tag="BQ2027_MB0477"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0477, fadB2, len: 286 aa. Equivalent to Rv0468,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 286 aa overlap). Probable fadB2,
+ 3-hydroxybutyryl-CoA dehydrogenase (EC 1.1.1.157),
+ equivalent to CAC31978.1|AL583925 3-hydroxyacyl-CoA
+ dehydrogenase from Mycobacterium leprae (287 aa). Also
+ similar to many 3-hydroxybutyryl-CoA dehydrogenases e.g.
+ U32229|BJU32229_1 beta-hydroxybutyryl coenzyme A
+ dehydrogenase from Bradyrhizobium japonicum (293 aa),
+ FASTA scores: opt: 771, E(): 0, (45.7% identity in 282 aa
+ overlap). BELONGS TO THE 3-HYDROXYACYL-COA DEHYDROGENASE
+ FAMILY. Protein product from Mb0477 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0477
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="3-hydroxybutyryl-coa dehydrogenase fadb2
+ (beta-hydroxybutyryl-coa dehydrogenase) (bhbd)"
+ /protein_id="CAB5248184.1"
+ /translation="MSDAIQRVGVVGAGQMGSGIAEVSARAGVEVTVFEPAEALITAG
+ RNRIVKSLERAVSAGKVTERERDRALGLLTFTTDLNDLSDRQLVIEAVVEDEAVKSEI
+ FAELDRVVTDPDAVLASNTSSIPIMKVAAATKQPQRVLGLHFFNPVPVLPLVELVRTL
+ VTDEAAAARTEEFASTVLGKQVVRCSDRSGFVVNALLVPYLLSAIRMVEAGFATVEDV
+ DKAVVAGLSHPMGPLRLSDLVGLDTLKLIADKMFEEFKEPHYGPPPLLLRMVEAGQLG
+ KKSGRGFYTY"
+ gene 560907..561767
+ /gene="umaA1"
+ /locus_tag="BQ2027_MB0478"
+ CDS 560907..561767
+ /gene="umaA1"
+ /locus_tag="BQ2027_MB0478"
+ /note="Mb0478, umaA1, len: 286 aa. Equivalent to Rv0469,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 286 aa overlap). Possible umaA1,
+ mycolic acid synthase (EC 2.-.-.-), highly similar to
+ CAC30854.1|AL583923 methyl mycolic acid synthase 1 from
+ Mycobacterium leprae (286 aa); and CAC31976.1|AL583925
+ Mycolic acid synthase from Mycobacterium leprae (295 aa),
+ FASTA scores: opt: 1402, E(): 0, (69.6% identity in 286 aa
+ overlap). Also very similar to mycobacterial
+ methyltransferases e.g. U77466|CmaD|MBU77466_1 (286 aa);
+ MTCY20H10.26c|Z92772|MTY20H10_27 (296 aa); highly similar
+ to CFA1_MYCTU|Q11195|U66108|MTU66108_1
+ cyclopropane-fatty-acyl-phospholipid synthase 1 (287 aa),
+ FASTA scores: opt: 1360, E(): 0, (67.8% identity in 286 aa
+ overlap) (see citation below); and very similar also to
+ methoxy mycolic acid synthase 1 from Mycobacterium
+ tuberculosis e.g. MTU66108_1 (286 aa). Protein product
+ from Mb0478 detected using shotgun mass spectrometry.
+ Mb0478 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible mycolic acid synthase umaa"
+ /protein_id="CAB5248185.1"
+ /translation="MTELRPFYEESQSIYDVSDEFFSLFLDPTMAYTCAYFEREDMTL
+ EEAQNAKFDLALDKLHLEPGMTLLDIGCGWGGGLQRAIENYDVNVIGITLSRNQFEYS
+ KAKLAKIPTERSVQVRLQGWDEFTDKVDRIVSIGAFEAFKMERYAAFFERSYDILPDD
+ GRMLLHTILTYTQKQMHEMGVKVTMSDVRFMKFIGEEIFPGGQLPAQEDIFKFAQAAD
+ FSVEKVQLLQQHYARTLNIWAANLEANKDRAIALQSEEIYNKYMHYLTGCEHFFRKGI
+ SNVGQFTLTK"
+ gene complement(561867..562730)
+ /gene="pcaA"
+ /locus_tag="BQ2027_MB0479C"
+ CDS complement(561867..562730)
+ /gene="pcaA"
+ /locus_tag="BQ2027_MB0479C"
+ /note="Mb0479c, pcaA, len: 287 aa. Equivalent to Rv0470c,
+ len: 287 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 287 aa overlap). pcaA (previously
+ known as umaA2), mycolic acid synthase (cyclopropane
+ synthase) (EC 2.-.-.-) (see citations below), equivalent
+ to CAC31976.1|AL583925 Mycolic acid synthase from
+ Mycobacterium leprae (295 aa); and highly similar to
+ S72886|B2168_F3_130|467038|AAA17222.1|U00018 hypothetical
+ protein from Mycobacterium leprae (308 aa);
+ Q11195|CFA1_MYCTU CYCLOPROPANE-FATTY-ACYL-PHOSPHOLIPID
+ SYNTHASE 1 (CYCLOPROPANE MYCOLIC ACID SYNTHASE 1) (287 aa)
+ (see second citation below); U27357|MTU27357_1
+ cyclopropane mycolic acid synthase from Mycobacterium
+ tuberculosis (287 aa), FASTA scores: opt: 1415, E(): 0,
+ (72.8% identity in 287 aa overlap); and related enzymes
+ e.g. MTCY20H10.25c|Z92772|MTY20H10_26 (287 aa), FASTA
+ scores: opt: 1387, E(): 0, (72.5% identity in 287 aa
+ overlap). Protein product from Mb0479c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0479c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MYCOLIC ACID SYNTHASE PCAA (CYCLOPROPANE
+ SYNTHASE)"
+ /protein_id="CAB5248186.1"
+ /translation="MSVQLTPHFGNVQAHYDLSDDFFRLFLDPTQTYSCAYFERDDMT
+ LQEAQIAKIDLALGKLNLEPGMTLLDIGCGWGATMRRAIEKYDVNVVGLTLSENQAGH
+ VQKMFDQMDTPRSRRVLLEGWEKFDEPVDRIVSIGAFEHFGHQRYHHFFEVTHRTLPA
+ DGKMLLHTIVRPTFKEGREKGLTLTHELVHFTKFILAEIFPGGWLPSIPTVHEYAEKV
+ GFRVTAVQSLQLHYARTLDMWATALEANKDQAIAIQSQTVYDRYMKYLTGCAKLFRQG
+ YTDVDQFTLEK"
+ gene complement(562873..563313)
+ /locus_tag="BQ2027_MB0480C"
+ CDS complement(562873..563313)
+ /locus_tag="BQ2027_MB0480C"
+ /note="Mb0480c, -, len: 146 aa. Equivalent to Rv0470A,
+ len: 146 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 146 aa overlap). Hypothetical unknown
+ protein. GC plot suggests CDS for Cys-rich protein, could
+ possibly be continuation of Rv0471c but no frameshift
+ found to allow this. Sequence same in Mycobacterium bovis
+ and CDC1551. Weak hits to Cys-rich region (aa 258-314) of
+ D63395|D63395_1 mRNA for NOTCH4 from Homo sapiens (1095
+ aa), FASTA scores: opt: 132, E(): 1.1, (39.35% identity in
+ 61 aa overlap). Mb0480c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248187.1"
+ /translation="MGAGGWEVVLASLPYGLLCTTVLMGKHIDKIGYDEPLGIRTLPV
+ LLGETCARTVTLAMMVGFYLLIAVNVMLAAMPWPRCWSPGRCPGWRKCGPISCDGGPS
+ SRHRRFRCGRCGMPRWPGCTCVRPVRCWLWAWRSVPGGAPGDFR"
+ gene complement(563244..563732)
+ /locus_tag="BQ2027_MB0481C"
+ CDS complement(563244..563732)
+ /locus_tag="BQ2027_MB0481C"
+ /note="Mb0481c, -, len: 162 aa. Equivalent to Rv0471c,
+ len: 162 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 162 aa overlap). Hypothetical unknown
+ protein. Mb0481c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248188.1"
+ /translation="MPDAGAGSRLRSWAYALRTTNPPADGPTDTVTRWLVVTRAAVLP
+ MTLVSGLVAGLLAIGEPGLDWRWLVLWWESHAPHIANNLMNDLYDTDVGTDSATYARA
+ RYAQHPAATGANRAAYTTPRRTTSCGSPERALEPTTPRWARAVGRSCWRRSPTGCCAP
+ RC"
+ gene complement(563742..564446)
+ /locus_tag="BQ2027_MB0482C"
+ CDS complement(563742..564446)
+ /locus_tag="BQ2027_MB0482C"
+ /note="Mb0482c, -, len: 234 aa. Equivalent to Rv0472c,
+ len: 234 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 234 aa overlap). Probable regulatory
+ protein, possibly tetR family, equivalent to
+ CAC31974.1|AL583925 possible TetR-family transcriptional
+ regulator from Mycobacterium leprae (233 aa). Also similar
+ to CAC01492.1|AL391017 putative transcriptional regulatory
+ protein from Streptomyces coelicolor (218 aa); and
+ CAC01371.1|AL390975 putative tetR-family transcriptional
+ regulator from Streptomyces coelicolor (228 aa). Also
+ similar to AL0212|MTV012_65 from Mycobacterium
+ tuberculosis (246 aa), FASTA scores: opt: 327, E():
+ 1.8e-15, (31.0% identity in 232 aa overlap); and
+ Z95120|MTCY07D11.18c (228 aa), FASTA scores: opt: 190,
+ E(): 4.4e-06, (23.1% identity in 186 aa overlap). Contains
+ probable helix-turn-helix doimain at aa 45-66 (Score 1429,
+ +4.05 SD). Protein product from Mb0482c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0482c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY TETR-FAMILY)"
+ /protein_id="CAB5248189.1"
+ /translation="MAERIPAVTVKTDGRKRRWHQHKVERRNELVDGTIEAIRRHGRF
+ LSMDEIAAEIGVSKTVLYRYFVDKNDLTTAVMMRFTQTTLIPNMIAALSADMDGFELT
+ REIIRVYVETVAAQPEPYRFVMANSSASKSKVIADSERIIARMLAVMLRRRMQEAGMD
+ TGGVEPWAYLIVGGVQLATHSWMSDPRMSSDELIDYLTMLSWSALCGIVEAGGSLEKF
+ REQPHPSPIVPAWGQV"
+ gene 564583..565953
+ /locus_tag="BQ2027_MB0483"
+ CDS 564583..565953
+ /locus_tag="BQ2027_MB0483"
+ /note="Mb0483, -, len: 456 aa. Equivalent to Rv0473, len:
+ 456 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 456 aa overlap). Possible conserved
+ transmembrane protein, showing some similarity to
+ hypothetical proteins e.g.
+ NP_102800.1|14021975|BAB48586.1|AP002996 hypothetical
+ protein from Mesorhizobium loti (431 aa);
+ P39385|YJIN_ECOLI|YJIN|B4336 HYPOTHETICAL 48.2 KD PROTEIN
+ (POTENTIAL INTEGRAL MEMBRANE PROTEIN) from Escherichia
+ coli strain K12 (426 aa), FASTA scores: opt: 396, E():
+ 9.8e-19, (31.8 % identity in 424 aa overlap); etc. Protein
+ product from Mb0483 detected using SWATH mass
+ spectrometry. Mb0483 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248190.1"
+ /translation="MVAHRAEVSGSPPPRLNLSTQPTVARRVRASFAESFAAADPEAD
+ AARRMALRRMKVVAVGFLVGATGVFLACRWAQADGADHAWLGYLGAAAEAGMVGALAD
+ WFAVTALFKHPLGIPIPHTAIIKRKKDQLGEGLGTFVRENFLSPPVVETKLRDAQIPS
+ RLGKWLSEATHAQRVAAETATVLRVLVELLRDEDIQQVIDRMIVRRIAEPQWGPPAGR
+ VLATLLAENRQEAFIQLLADRAFQWSLNAGVVIQRVVERDSPSWSPRFIDHLVGDRIH
+ RELMEFTDKVRRNPDHELRRSATRFLFDFADDLQHDPATVARADAIKEELMARDEIAT
+ AAAAAWKTLKRLVLEGVDDPSSALRTRITDAVIRIGESLRDDADLRDKVDSWTVRAAQ
+ HLVSEYGVEITAIITETIERWDAEEASRRIELHVGRDLQFIRINGTVVGAMAGLAIYA
+ IAQLLF"
+ gene 566040..566462
+ /locus_tag="BQ2027_MB0484"
+ CDS 566040..566462
+ /locus_tag="BQ2027_MB0484"
+ /note="Mb0484, -, len: 140 aa. Equivalent to Rv0474, len:
+ 140 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 140 aa overlap). Probable
+ transcriptional regulator, highly similar to others e.g.
+ CAC04034.1|AL391406 putative DNA-binding protein from
+ Streptomyces coelicolor (141 aa); N-terminus of
+ NP_104173.1|14023352|BAB49959.1|AP003000 transcriptional
+ regulator from Mesorhizobium loti (219 aa); N-terminus of
+ A83618|PA0225 probable transcription regulator from
+ Pseudomonas aeruginosa (179 aa); SINR_BACSU|P06533 sinr
+ protein from Bacillus subtilis (111 aa), FASTA scores:
+ opt: 147, E(): 8.9e-06, (30.6% identity in 111 aa
+ overlap). Also similar to other hypothetical proteins e.g.
+ X66407|RRPHAS_1|ORF1 from Rhodococcus ruber (171 aa),
+ FASTA scores: opt: 280, E(): 4.8e-12, (43.6% identity in
+ 117 aa overlap). Also similar to Rv2745c from
+ Mycobacterium tuberculosis. Contains probable
+ helix-turn-helix domain at aa 35-56 (Score 1709, +5.01
+ SD). Protein product from Mb0484 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0484
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5248191.1"
+ /translation="MSSEEKLAAKVSTKASDVASDIGSFIRSQRETAHVSMRQLAERS
+ GVSNPYLSQVERGLRKPSADVLSQIAKALRVSAEVLYVRAGILEPSETSQVRDAIITD
+ TAITERQKQILLDIYASFTHQNEATREECPSDPTPTDD"
+ gene 566816..567415
+ /gene="hbhA"
+ /locus_tag="BQ2027_MB0485"
+ CDS 566816..567415
+ /gene="hbhA"
+ /locus_tag="BQ2027_MB0485"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0485, hbhA, len: 199 aa. Equivalent to Rv0475,
+ len: 199 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 199 aa overlap). hbhA, heparin-binding
+ hemagglutinin (see citations below), equivalent to
+ CAC31971.1|AL583925 possible hemagglutinin from
+ Mycobacterium leprae (188 aa). Contains possible
+ N-terminal signal sequence and K-A-rich region at
+ C-terminus: SUBCELLULAR LOCATION: SURFACE ASSOCIATED.
+ Protein product from Mb0485 detected using shotgun mass
+ spectrometry. Mb0485 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="iron-regulated heparin binding hemagglutinin
+ hbha (adhesin)"
+ /protein_id="CAB5248192.1"
+ /translation="MAENSNIDDIKAPLLAALGAADLALATVNELITNLRERAEETRT
+ DTRSRVEESRARLTKLQEDLPEQLTELREKFTAEELRKAAEGYLEAATSRYNELVERG
+ EAALERLRSQQSFEEVSARAEGYVDQAVELTQEALGTVASQTRAVGERAAKLVGIELP
+ KKAAPAKKAAPAKKAAPAKKAAAKKAPAKKAAAKKVTQK"
+ gene 567527..567790
+ /locus_tag="BQ2027_MB0486"
+ CDS 567527..567790
+ /locus_tag="BQ2027_MB0486"
+ /note="Mb0486, -, len: 87 aa. Equivalent to Rv0476, len:
+ 87 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 87 aa overlap). Possible conserved
+ transmembrane protein, equivalent to CAC31970.1|AL583925
+ conserved membrane protein from Mycobacterium leprae (95
+ aa). Also highly similar to CAC04036.1|AL391406 putative
+ membrane protein from Streptomyces coelicolor (113 aa).
+ Contains PS00606 Beta-ketoacyl synthases active site.
+ Protein product from Mb0486 detected using SWATH mass
+ spectrometry. Mb0486 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248193.1"
+ /translation="MLVLLVAVLVTAVYAFVHAALQRPDAYTAADKLTKPVWLVILGA
+ AVALASILYPVLGVLGMAMSACASGVYLVDVRPKLLEIQGKSR"
+ gene 567795..568241
+ /locus_tag="BQ2027_MB0487"
+ CDS 567795..568241
+ /locus_tag="BQ2027_MB0487"
+ /note="Mb0487, -, len: 148 aa. Equivalent to Rv0477, len:
+ 148 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 148 aa overlap). Possible conserved
+ secreted protein, equivalent to CAC31969.1|AL583925
+ hypothetical protein from Mycobacterium leprae (123 aa).
+ Also similar to G83406|PA1914 conserved hypothetical
+ protein from Pseudomonas aeruginosa (408 aa). Contains
+ possible N-terminal signal sequence. Mb0487 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED SECRETED PROTEIN"
+ /protein_id="CAB5248194.1"
+ /translation="MKALVAVSAVAVVALLGVSSAQADPEADPGAGEANYGGPPSSPR
+ LVDHTEWAQWGSLPSLRVYPSQVGRTASRRLGMAAADAAWAEVLALSPEADTAGMRAQ
+ FICHWQYAEIRQPGKPSWNLEPWRPVVDDSEMLASGCNPGSPEESF"
+ gene 568241..568915
+ /gene="deoC"
+ /locus_tag="BQ2027_MB0488"
+ CDS 568241..568915
+ /gene="deoC"
+ /locus_tag="BQ2027_MB0488"
+ /note="Mb0488, deoC, len: 224 aa. Equivalent to Rv0478,
+ len: 224 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 224 aa overlap). Probable deoC,
+ deoxyribose-phosphate aldolase (EC 4.1.2.4), equivalent to
+ Q9CB45|DEOC_MYCLE DEOXYRIBOSE-PHOSPHATE ALDOLASE from M.
+ leprae (226 aa). Also highly similar to others e.g.
+ DEOC_BACSU|P39121 from Bacillus subtilis (214 aa), FASTA
+ scores: opt: 543, E(): 1.4e-26, (45.9% identity in 209 aa
+ overlap); etc. BELONGS TO THE DEOC/FBAB FAMILY OF
+ ALDOLASES, DEOC SUBFAMILY. Protein product from Mb0488
+ detected using SWATH mass spectrometry. Mb0488 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEOXYRIBOSE-PHOSPHATE ALDOLASE DEOC
+ (PHOSPHODEOXYRIBOALDOLASE) (DEOXYRIBOALDOLASE)"
+ /protein_id="CAB5248195.1"
+ /translation="MLGQPTRAQLAALVDHTLLKPETTRADVAALVAEAAELGVYAVC
+ VSPSMVPVAVQAGGVRVAAVTGFPSGKHVSSVKAHEAAAALASGASEIDMVIDIGAAL
+ CGDIDAVRSDIEAVRAAAAGAVLKVIVESAVLLGQSNAHTLVDACRAAEDAGADFVKT
+ STGCHPAGGATVRAVELMAETVGPRLGVKASGGIRTAADAVAMLNAGATRLGLSGTRA
+ VLDGLS"
+ gene complement(568940..569986)
+ /locus_tag="BQ2027_MB0489C"
+ CDS complement(568940..569986)
+ /locus_tag="BQ2027_MB0489C"
+ /note="Mb0489c, -, len: 348 aa. Equivalent to Rv0479c,
+ len: 348 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 348 aa overlap). Probable conserved
+ membrane protein, equivalent to CAC31967.1|AL583925
+ possible secreted protein from Mycobacterium leprae (254
+ aa); and C-terminus highly similar to
+ AAF74996.1|AF143402_1|AF143402 putative multicopper
+ oxidase from Mycobacterium avium (149 aa). Contains
+ hydrophobic domain in centre of protein. Protein product
+ from Mb0489c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0489c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5248196.1"
+ /translation="MTNPQGPPNDPSPWARPGDQGPLARPPASSEASTGRLRPGEPAG
+ HIQEPVSPPTQPEQQPQTEHLAASHAHTRRSGRQAAHQAWDPTGLLAAQEEEPAAVKT
+ KRRARRDPLTVFLVLIIVFSLVLAGLIGGELYARHVANSKVAQAVACVVKDQATASFG
+ VAPLLLWQVATRHFTNISVETAGNQIRDAKGMQIKLTIQNVRLKNTPNSRGTIGALDA
+ TITWSSEGIKESVQNAIPILGAFVTSSVVTHPADGTVELKGLLNNITAKPIVAGKGLE
+ LQIINFNTLGFSLPKETVQSTLNEFTSSLTKNYPLGIHADSVQVTSTGVVSRFSTRDA
+ AIPTGIQNPCFSHI"
+ gene complement(569983..570918)
+ /locus_tag="BQ2027_MB0490C"
+ CDS complement(569983..570918)
+ /locus_tag="BQ2027_MB0490C"
+ /note="Mb0490c, -, len: 311 aa. Equivalent to Rv0480c,
+ len: 340 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 311 aa overlap). Conserved
+ hypothetical protein, equivalent, but longer 60 aa in
+ N-terminus, to CAC31966.1|AL583925 putative hydrolase from
+ Mycobacterium leprae (271 aa). Also similar to several
+ hypothetical proteins and hydrolases e.g. AL096822|SCGD3_8
+ probable hydrolase from Streptomyces coelicolor (264 aa),
+ FASTA scores: opt: 368, E(): 6.1e-15, (34.2% identity in
+ 272 aa overlap); and YAUB_SCHPO|Q10166 hypothetical 35.7
+ kd protein c26a3.11 from S. pombe (322 aa), FASTA scores:
+ opt: 338, E():1.4e-13, (30.3% identity in 277 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 56 bp deletion results in a different NH2 part and leads
+ to a shorter product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (329 aa versus 340
+ aa). Protein product from Mb0490c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0490c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible amidohydrolase"
+ /protein_id="CAB5248197.1"
+ /translation="MRRARRRAQAGLPGSCARRCGALVAGPRLARMRIALAQIRSGTD
+ PAANLQLVGKYAGEAATAGAQLVVFPEATMCRLGVPLRQVAEPVDGPWANGVRRIATE
+ AGITVIAGMFTPTGDGRVTNTLIAAGPGTPNQPDAHYHKIHLYDAFGFTESRTVAPGR
+ EPVVVVVDGVRVGLTVCYDIRFPALYTELARRGAQLIAVCASWGSGPGKLEQWTLLAR
+ ARALDSMSYVAAAGQADPGDARTGVGASSAAPTGVGGSLVASPLGEVVVSAGTQPQLL
+ VADIDVDNVAAARDRIAVLRNQTDFVQIDKAQSRG"
+ gene complement(570951..571475)
+ /locus_tag="BQ2027_MB0491C"
+ CDS complement(570951..571475)
+ /locus_tag="BQ2027_MB0491C"
+ /note="Mb0491c, -, len: 174 aa. Equivalent to Rv0481c,
+ len: 174 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 174 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0491c detected using SWATH
+ mass spectrometry. Mb0491c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248198.1"
+ /translation="MPRSFDMSADYEGSVEEVHRAFYEADYWKARLAETPVDVATLES
+ IRVGGDSGDDGTIEVVTLQMVRSHNLPGLVTQLHRGDLSVRREETWGPVKEGIATASI
+ AGSIVDAPVNLWGTAVLSPIPESGGSRMTLQVTIQVRIPFIGGKLERLIGTQLSQLVT
+ IEQRFTTLWITNNV"
+ gene 571502..572611
+ /gene="murB"
+ /locus_tag="BQ2027_MB0492"
+ CDS 571502..572611
+ /gene="murB"
+ /locus_tag="BQ2027_MB0492"
+ /note="Mb0492, murB, len: 369 aa. Equivalent to Rv0482,
+ len: 369 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 369 aa overlap). Probable murB,
+ UDP-N-acetylenolpyruvoylglucosamine reductase (EC
+ 1.1.1.158), equivalent to CAC31964.1|AL583925
+ UDP-N-acetylenolpyruvoylglucosamine reductase from
+ Mycobacterium leprae (367 aa). Also highly similar to
+ others e.g. MURB_ECOLI|P08373
+ UDP-N-acetylenolpyruvoylglucosamine reductase from
+ Escherichia coli (342 aa), FASTA scores: opt: 292, E():
+ 6.3e-12, (33.5% identity in 355 aa overlap); etc. BELONGS
+ TO THE MURB FAMILY. COFACTOR: FAD. Protein product from
+ Mb0492 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE UDP-N-ACETYLENOLPYRUVOYLGLUCOSAMINE
+ REDUCTASE MURB (UDP-N-ACETYLMURAMATE DEHYDROGENASE)"
+ /protein_id="CAB5248199.1"
+ /translation="MKRSGVGSLFAGAHIAEAVPLAPLTTLRVGPIARRVITCTSAEQ
+ VVAALRHLDSAAKTGADRPLVFAGGSNLVIAENLTDLTVVRLANSGITIDGNLVRAEA
+ GAVFDDVVVRAIEQGLGGLECLSGIPGSAGATPVQNVGAYGAEVSDTITRVRLLDRCT
+ GEVRWVSARDLRFGYRTSVLKHADGLAVPTVVLEVEFALDPSGRSAPLRYGELIAALN
+ ATSGERADPQAVREAVLALRARKGMVLDPTDHDTWSVGSFFTNPVVTQDVYERLAGDA
+ ATRKDGPVPHYPAPDGVKLAAGWLVERAGFGKGYPDAGAAPCRLSTKHALALTNRGGA
+ TAEDVVTLARAVRDGVHDVFGITLKPEPVLIGCML"
+ gene 572673..574028
+ /gene="lprQ"
+ /locus_tag="BQ2027_MB0493"
+ CDS 572673..574028
+ /gene="lprQ"
+ /locus_tag="BQ2027_MB0493"
+ /note="Mb0493, lprQ, len: 451 aa. Equivalent to Rv0483,
+ len: 451 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 451 aa overlap). Probable lprQ,
+ conserved lipoprotein, equivalent to
+ CAC31963.1|AL583925|ML2446 possible lipoprotein from
+ Mycobacterium leprae (441 aa); appears longer than ML2446,
+ so start may be further downstream. Shows also similarity
+ with MLCL383_24|O07707 HYPOTHETICAL 43.6 KD PROTEIN from
+ Mycobacterium leprae; and to Q49706|B1496_F2_81 (271 aa).
+ Similar to others lipoproteins from other organisms. Also
+ similar to several Mycobacterium tuberculosis hypothetical
+ proteins e.g. Rv0116c, Rv0192, Rv1433, Rv2518c. Contains
+ potential N-terminal signal sequence and appropriately
+ positioned PS00013 prokaryotic membrane lipoprotein lipid
+ attachment site. Protein product from Mb0493 detected
+ using SWATH mass spectrometry. Mb0493 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN LPRQ"
+ /protein_id="CAB5248200.1"
+ /translation="MVIRVLFRPVSLIPVNNSSTPQSQGPISRRLALTALGFGVLAPN
+ VLVACAGKVTKLAEKRPPPAPRLTFRPADSAADVVPIAPISVEVGDGWFQRVALTNSA
+ GKVVAGAYSRDRTIYTITEPLGYDTTYTWSGSAVGHDGKAVPVAGKFTTVAPVKTINA
+ GFQLADGQTVGIAAPVIIQFDSPISDKAAVERALTVTTDPPVEGGWAWLPDEAQGARV
+ HWRPREYYPAGTTVDVDAKLYGLPFGDGAYGAQDMSLHFQIGRRQVVKAEVSSHRIQV
+ VTDAGVIMDFPCSYGEADLARNVTRNGIHVVTEKYSDFYMSNPAAGYSHIHERWAVRI
+ SNNGEFIHANPMSAGAQGNSNVTNGCINLSTENAEQYYRSAVYGDPVEVTGSSIQLSY
+ ADGDIWDWAVDWDTWVSMSALPPPAAKPAATQIPVTAPVTPSDAPTPSGTPTTTNGPG
+ G"
+ gene complement(574009..574764)
+ /locus_tag="BQ2027_MB0494C"
+ CDS complement(574009..574764)
+ /locus_tag="BQ2027_MB0494C"
+ /note="Mb0494c, -, len: 251 aa. Equivalent to Rv0484c,
+ len: 251 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 251 aa overlap). Probable short-chain
+ oxidoreductase (EC 1.-.-.-), highly similar to others e.g.
+ T36118|4678912|CAB41284.1|AL049707 probable oxidoreductase
+ from Streptomyces coelicolor (260 aa);
+ YDFG_HAEIN|P45200|HI1430 hypothetical oxidoreductase (SDR
+ family) from Haemophilus influenzae (252 aa), FASTA
+ scores: opt: 496, E(): 7.9e-25, (35.0 % identity in 243 aa
+ overlap); etc. BELONGS TO THE SHORT-CHAIN
+ DEHYDROGENASES/REDUCTASES (SDR) FAMILY. STRONG SIMILARITY,
+ TO BACTERIAL YDFG HOMOLOGS. Protein product from Mb0494c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0494c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable short-chain type oxidoreductase"
+ /protein_id="CAB5248201.1"
+ /translation="MTTIGTRKRVAVVTGASSGIGEATARTLAAQGFHVVAVARRADR
+ ITALANQIGGTAIVADVTDDAAVEALARALSRVDVLVNNAGGAKGLQFVADADLEHWR
+ WMWDTNVLGTLRVTRALLPKLIDSGDGLIVTVTSIAALEVYDGGAGYTAAKHAQGALH
+ RTLRGELLGKPVRLTEIAPGAVETEFSLVRFDGDQQRADAVYAGMTPLVAADVAEVIG
+ FVATRPSHVNLDQIVIRPRDQASASRRATHPVR"
+ gene 574947..576263
+ /locus_tag="BQ2027_MB0495"
+ CDS 574947..576263
+ /locus_tag="BQ2027_MB0495"
+ /note="Mb0495, -, len: 438 aa. Equivalent to Rv0485, len:
+ 438 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 438 aa overlap). Possible
+ transcriptional repressor, member of the NAGC/XYLR
+ repressor FAMILY; similar to several e.g.
+ D87820_3|O32446|D82254 NAGC N-acetylglucosamine repressor
+ from Vibrio cholerae (404 aa), FASTA scores: opt: 378,
+ E(): 1.2e-17, (26.9% identity in 350 aa overlap);
+ NAGC_ECOLI|P15301 N-acetylglucosamine repressor from
+ Escherichia coli (406 aa), FASTA scores: opt: 305, E():
+ 1.8e-12, (21.8% identity in 357 aa overlap); etc. Protein
+ product from Mb0495 detected using SWATH mass
+ spectrometry. Mb0495 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="CAB5248202.1"
+ /translation="MYSTNRTSQSLSRKPGRKHQLRSHRYVMPPSLHLSDSAAASVFR
+ AVRLRGPVGRDVIAGSTSLSIATVNRQVIALLEAGLLRERADLAVSGAIGRPRVPVEV
+ NHEPFVTLGIHIGARTTSIVATDLFGRTLDTVETPTPRNAAGAALTSLADSADRYLQR
+ WRRRRALWVGVTLGGAVDSATGHVDHPRLGWRQAPVGPVLADALGLPVSVASHVDAMA
+ GAELMLGMRRFAPSSSTSLYVYARETVGYALMIGGRVHCPASGPGTIAPLPVHSEMLG
+ GTGQLESTVSDEAVLAAARRLRIIPGIASRTRTGGSATAITDLLRVARAGNQQAKELL
+ AERARVLGGAVALLRDLLNPDEVVVGGQAFTEYPEAMEQVEAAFTAGSVLAPRDIRVT
+ VFGNRVQEAGAGIVSLSGLYADPLGALRRSGALDARLQDTAPEALA"
+ gene 576311..577753
+ /gene="msha"
+ /locus_tag="BQ2027_MB0496"
+ CDS 576311..577753
+ /gene="msha"
+ /locus_tag="BQ2027_MB0496"
+ /note="Mb0496, -, len: 480 aa. Equivalent to Rv0486, len:
+ 480 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 480 aa overlap). Mannosyltransferase
+ (EC 2.4.1.-) (see citations below), highly similar to
+ P54138|Y486_MYCLE|ML2443 possible glycosyl transferase
+ from Mycobacterium leprae (428 aa); and
+ S72892|B2168_C2_201 probable hexosyltransferase (EC
+ 2.4.1.-) from Mycobacterium leprae (409 aa), FASTA scores:
+ opt: 2375, E(): 0, (86.4% identity in 413 aa overlap).
+ Also highly similar to CAC04040.1|AL391406 putative
+ transferase from Streptomyces coelicolor (496 aa); and
+ similar to various transferases e.g. NP_437172.1|NC_003078
+ putative membrane-anchored glycosyltransferase protein
+ from Sinorhizobium meliloti (416 aa); O26550|U67601_1 LPS
+ BIOSYNTHESIS RELATED PROTEIN from Methanococcus jannaschii
+ (411 aa), FASTA score: (25.3% identity in 387 aa overlap);
+ etc. Also similar to CAC87824.1|AJ316594 putative
+ sucrose-phosphate synthase from Nostoc punctiforme (422
+ aa). Contains PS00039 DEAD-box subfamily ATP-dependent
+ helicases signature. Protein product from Mb0496 detected
+ using SWATH mass spectrometry. Mb0496 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="glycosyltransferase msha"
+ /protein_id="CAB5248203.1"
+ /translation="MAGVRHDDGSGLIAQRRPVRGEGATRSRGPSGPSNRNVSAADDP
+ RRVALLAVHTSPLAQPGTGDAGGMNVYMLQSALHLARRGIEVEIFTRATASADPPVVR
+ VAPGVLVRNVVAGPFEGLDKYDLPTQLCAFAAGVLRAEAVHEPGYYDIVHSHYWLSGQ
+ VGWLARDRWAVPLVHTAHTLAAVKNAALADGDGPEPPLRTVGEQQVVDEADRLIVNTD
+ DEARQVISLHGADPARIDVVHPGVDLDVFRPGDRRAARAALGLPVDERVVAFVGRIQP
+ LKAPDIVLRAAAKLPGVRIIVAGGPSGSGLASPDGLVRLADELGISARVTFLPPQSHT
+ DLATLFRAADLVAVPSYSESFGLVAVEAQACGTPVVAAAVGGLPVAVRDGITGTLVSG
+ HEVGQWADAIDHLLRLCAGPRGRVMSRAAARHAATFSWENTTDALLASYRRAIGEYNA
+ ERQRRGGEVISDLVAVGKPRHWTPRRGVGA"
+ gene 577750..578301
+ /locus_tag="BQ2027_MB0497"
+ CDS 577750..578301
+ /locus_tag="BQ2027_MB0497"
+ /note="Mb0497, -, len: 183 aa. Equivalent to Rv0487, len:
+ 183 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 183 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ P54139|Y487_MYCLE|U00018_38|ML2442 HYPOTHETICAL 20.8 KDA
+ PROTEIN from Mycobacterium leprae (184 aa), FASTA scores:
+ opt: 760, E(): 2.4 e-34, (73.0% identity in 159 aa
+ overlap). Also highly similar to CAC04041.1|AL391406
+ conserved hypothetical protein from Streptomyces
+ coelicolor (168 aa). Protein product from Mb0497 detected
+ using SWATH mass spectrometry. Mb0497 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248204.1"
+ /translation="MTSSLPTVQRVIQNALEVSQLKYSQHPRPGGAPPALIVELPGER
+ KLKINTILSVGEHSVRVEAFVCRKPDENREDVYRFLLRRNRRLYGVAYTLDNVGDIYL
+ VGQMALSAVDADEVDRVLGQVLEVVDSDFNALLELGFRSSIQREWQWRLSRGESLQNL
+ QAFAHLRPTTMQSAQRDEKELGG"
+ gene 578685..579290
+ /locus_tag="BQ2027_MB0498"
+ CDS 578685..579290
+ /locus_tag="BQ2027_MB0498"
+ /note="Mb0498, -, len: 201 aa. Equivalent to Rv0488, len:
+ 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 201 aa overlap). Probable conserved
+ integral membrane protein, LysE family possibly involved
+ in transport of Lysine, similar to others and conserved
+ hypothetical proteins e.g. AB93746.1|AL357613 putative
+ membrane transport protein from Streptomyces coelicolor
+ (204 aa); D83100|PA4365 probable transporter from
+ Pseudomonas aeruginosa (200 aa); YGGA_ECOLI|P11667
+ hypothetical 21.7 kd protein from Escherichia coli (197
+ aa), FASTA scores: opt: 382, E(): 1.1e-19, (39.1% identity
+ in 179 aa overlap); CGLYSEG_2 C|P94633 LYSINE EXPORTER
+ PROTEIN (236 aa), FASTA scores: E(): 2.3e-07, (33.3%
+ identity in 219 aa overlap). Also similar to Rv1986 from
+ Mycobacterium tuberculosis. Mb0498 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5248205.1"
+ /translation="MMTLKVAIGPQNAFVLRQGIRREYVLVIVALCGIADGALIAAGV
+ GGFAALIHAHPNMTLVARFGGAAFLIGYALLAARNAWRPSGLVPSESGPAALIGVVQM
+ CLVVTFLNPHVYLDTVVLIGALANEESDLRWFFGAGAWAASVVWFAVLGFSAGRLQPF
+ FATPAAWRILDALVAVTMIGVAVVVLVTSPSVPTANVALII"
+ gene 579447..580196
+ /gene="gpm1"
+ /locus_tag="BQ2027_MB0499"
+ CDS 579447..580196
+ /gene="gpm1"
+ /locus_tag="BQ2027_MB0499"
+ /note="Mb0499, gpm1, len: 249 aa. Equivalent to Rv0489,
+ len: 249 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 249 aa overlap). Probable gpm1,
+ phosphoglycerate mutase 1 (EC 5.4.2.1), equivalent to
+ P53531|PMGY_MYCLE PHOSPHOGLYCERATE MUTASE from
+ Mycobacterium leprae (247 aa). Also highly similar to
+ others e.g. PMG1_ECOLI|P31217 (249 aa), FASTA scores: opt:
+ 805, E(): 0, (51.4% identity in 245 aa overlap); etc.
+ Contains PS00175 Phosphoglycerate mutase family
+ phosphohistidine signature, and PS00017 ATP/GTP-binding
+ site motif A (P-loop). BELONGS TO THE PHOSPHOGLYCERATE
+ MUTASE FAMILY. Note that previously known as gpm. Protein
+ product from Mb0499 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0499 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHOGLYCERATE MUTASE 1 GPM1
+ (PHOSPHOGLYCEROMUTASE) (PGAM) (BPG-DEPENDENT PGAM)"
+ /protein_id="CAB5248206.1"
+ /translation="MANTGSLVLLRHGESDWNALNLFTGWVDVGLTDKGQAEAVRSGE
+ LIAEHDLLPDVLYTSLLRRAITTAHLALDSADRLWIPVRRSWRLNERHYGALQGLDKA
+ ETKARYGEEQFMAWRRSYDTPPPPIERGSQFSQDADPRYADIGGGPLTECLADVVARF
+ LPYFTDVIVGDLRVGKTVLIVAHGNSLRALVKHLDQMSDDEIVGLNIPTGIPLRYDLD
+ SAMRPLVRGGTYLDPEAAAAGAAAVAGQGRG"
+ gene 580370..581602
+ /gene="senX3"
+ /locus_tag="BQ2027_MB0500"
+ CDS 580370..581602
+ /gene="senX3"
+ /locus_tag="BQ2027_MB0500"
+ /note="Mb0500, senX3, len: 410 aa. Equivalent to Rv0490,
+ len: 410 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 410 aa overlap). Putative senX3,
+ two-component sensor histidine kinase (EC 2.7.3.-),
+ transmembrane protein (see citations below), equivalent to
+ O07129|SEX3_MYCBO SENSOR-LIKE HISTIDINE KINASE SENX3 from
+ Mycobacterium bovis BCG (410 aa), FASTA scores: E(): 0,
+ (99.5% identity in 410 aa overlap); and highly similar to
+ P54883|SEX3_MYCLE|SENX3 SENSOR-LIKE HISTIDINE KINASE from
+ Mycobacterium leprae (443 aa), FASTA score: (83.8%
+ identity in 408 aa overlap). Also highly similar, except
+ in N-terminus, to CAC31957.1|AL583925 probable
+ two-component system sensor histidine kinase from
+ Mycobacterium leprae (441 aa). Also highly similar to
+ sensor kinase proteins from other organisms e.g.
+ CAB77323.1|AL160331 putative sensor kinase protein from
+ Streptomyces coelicolor (426 aa). Protein product from
+ Mb0500 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0500 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE TWO COMPONENT SENSOR HISTIDINE KINASE
+ SENX3"
+ /protein_id="CAB5248207.1"
+ /translation="MTVFSALLLAGVLSALALAVGGAVGMRLTSRVVEQRQRVATEWS
+ GITVSQMLQCIVTLMPLGAAVVDTHRDVVYLNERAKELGLVRDRQLDDQAWRAARQAL
+ GGEDVEFDLSPRKRSATGRSGLSVHGHARLLSEEDRRFAVVFVHDQSDYARMEAARRD
+ FVANVSHELKTPVGAMALLAEALLASADDSETVRRFAEKVLIEANRLGDMVAELIELS
+ RLQGAERLPNMTDVDVDTIVSEAISRHKVAADNADIEVRTDAPSNLRVLGDQTLLVTA
+ LANLVSNAIAYSPRGSLVSISRRRRGANIEIAVTDRGIGIAPEDQERVFERFFRGDKA
+ RSRATGGSGLGLAIVKHVAANHDGTIRVWSKPGTGSTFTLALPALIEAYHDDERPEQA
+ REPELRSNRSQREEELSR"
+ gene 581960..582643
+ /gene="regX3"
+ /locus_tag="BQ2027_MB0501"
+ CDS 581960..582643
+ /gene="regX3"
+ /locus_tag="BQ2027_MB0501"
+ /note="Mb0501, regX3, len: 227 aa. Equivalent to Rv0491,
+ len: 227 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 227 aa overlap). regX3, response
+ regulator protein (sensory transduction protein) (see
+ citations below), equivalent to O07130|RGX3_MYCBO|REGX3
+ SENSORY TRANSDUCTION PROTEIN from Mycobacterium bovis BCG
+ (227 aa); AAG09797.1|AF258346_2|AF258346|REGX3 response
+ regulator from Mycobacterium smegmatis (228 aa);
+ equivalent to P54884|RGX3_MYCLE|REGX3 SENSORY TRANSDUCTION
+ PROTEIN from Mycobacterium leprae (198 aa), FASTA scores :
+ E(): 0, (95.4% identity in 197 aa overlap). Also highly
+ similar to other response regulators e.g.
+ AAG43239.1|AF123314_2 |AF123314 putative response
+ regulator from Corynebacterium glutamicum (232 aa).
+ Protein product from Mb0501 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0501 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="TWO COMPONENT SENSORY TRANSDUCTION PROTEIN REGX3
+ (TRANSCRIPTIONAL REGULATORY PROTEIN) (PROBABLY
+ LUXR-FAMILY)"
+ /protein_id="CAB5248208.1"
+ /translation="MTSVLIVEDEESLADPLAFLLRKEGFEATVVTDGPAALAEFDRA
+ GADIVLLDLMLPGMSGTDVCKQLRARSSVPVIMVTARDSEIDKVVGLELGADDYVTKP
+ YSARELIARIRAVLRRGGDDDSEMSDGVLESGPVRMDVERHVVSVNGDTITLPLKEFD
+ LLEYLMRNSGRVLTRGQLIDRVWGADYVGDTKTLDVHVKRLRSKIEADPANPVHLVTV
+ RGLGYKLEG"
+ gene complement(582640..584529)
+ /locus_tag="BQ2027_MB0502C"
+ CDS complement(582640..584529)
+ /locus_tag="BQ2027_MB0502C"
+ /note="Mb0502c, -, len: 629 aa. Equivalent to Rv0492c,
+ len: 629 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 629 aa overlap). Probable
+ oxidoreductase GMC type (EC 1.-.-.-), similar to others
+ except in N-terminus e.g. P55582|AE000087_5|Y4NJ_RHISN
+ HYPOTHETICAL GMC-TYPE OXIDOREDUCTASE from Rhizobium sp.
+ (505 aa), FASTA scores: opt: 873, E():0, (34.3% identity
+ in 502 aa overlap); YTH2_RHOER|P46371 HYPOTHETICAL 53.0 kd
+ GMC-TYPE OXIDOREDUCTASE from Rhodococcus erythropolis (493
+ aa), FASTA score: (25.7% identity in 521 aa overlap);
+ YTH2_RHOSO|P46371 hypothetical 53.0 kd gmc-type
+ oxidoreductase from Rhodococcus erythropolis (493 aa),
+ FASTA score: (25.7% identity in 521 aa overlap);
+ NP_085596.1|NC_002679 probable oxidoreductase from
+ Mesorhizobium loti (507 aa); NP_285451.1|NC_001264 GMC
+ oxidoreductase from Deinococcus radiodurans (722 aa);
+ NP_249055.1|NC_002516 probable oxidoreductase from
+ Pseudomonas aeruginosa (531 aa); etc. Contains PS00198
+ 4Fe-4S ferredoxins, iron-sulfur binding region signature,
+ and PS00624 GMC oxidoreductases signature 2. BELONGS TO
+ THE GMC OXIDOREDUCTASES FAMILY. COFACTOR: FAD (BY
+ SIMILARITY). Note that start changed since first
+ submission (previously 684 aa). Protein product from
+ Mb0502c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0502c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE GMC-TYPE"
+ /protein_id="CAB5248209.1"
+ /translation="MSRLADRAKSYPLASFGAALLPPELGGPLPAQFVQRVDRYVTRL
+ PATSRFAVRAGLASLAAASYLTTGRSLPRLHPDERARVLHRIAALSPEVAAAVEGLKA
+ IVLLANGADTYAHELLARAQEHDAARPDAELTVILSADSPSVTRADAVVVGSGAGGAM
+ VARTLARAGLDVVVLEEGRRWTVEEFRSTHPVDRYAGLYRGAGATVALGRPAVVLPMG
+ RAVGGTTVVNSGTCFRPSLAVQRRWRDEFGLGLADPDQLGRRLDDAEQTLRVAPVPLE
+ IMGRNGRLLLQAAKSLGWRAAPIPRNAPGCRGCCQCAIGCPSNAKFGVHLNALPQACA
+ AGARIISWARVERILHRAGRAYGVRARRPDGTTLDVLADAVVVAAGATETPGLLRRSG
+ LGGHPRLGHNLALHPATMLAGLFDDDVFAWRGVLQSAAVHEFHESDGVLIEATSTPPG
+ MGSMVFPGYGAELLRWLDRAPQIATFGAMVADRGVGTVRSVRGETVVRYDIAPGEIAK
+ LRVALQAIGRLFFAAGAVEVLTGIPGAPPMRSLPELQDVLRRANPRSLHLAAFHPTGT
+ AAAGADEQLCPVDATGRLRGVEGVWVADASILPSCPEVNPQLSIMAMALAVADQTVAK
+ VVGVR"
+ gene complement(584526..584855)
+ /locus_tag="BQ2027_MB0503C"
+ CDS complement(584526..584855)
+ /locus_tag="BQ2027_MB0503C"
+ /note="Mb0503c, -, len: 109 aa. Equivalent to Rv0492A,
+ len: 109 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 109 aa overlap). Hypothetical unknown
+ protein. GC plot suggests CDS. Mb0503c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248210.1"
+ /translation="MSFLLDPPLLFVCGVLIERRLPVDRRDAAEAAALGVFFGASFGL
+ YHNVPGLGMLWRPFRAQNGRDFMWNSGVFSVDVARAEWPLHAMAAAIFATYPFFIKLG
+ RRLGRRI"
+ gene complement(584852..585841)
+ /locus_tag="BQ2027_MB0504C"
+ CDS complement(584852..585841)
+ /locus_tag="BQ2027_MB0504C"
+ /note="Mb0504c, -, len: 329 aa. Equivalent to Rv0493c,
+ len: 329 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 329 aa overlap). Conserved hypothetical
+ protein, showing some similarity to U00018_33|B2168_F2_93
+ from Mycobacterium leprae (167 aa), FASTA scores: opt:
+ 166, E(): 0.00077, (35.9% identity in 131 aa overlap).
+ Protein product from Mb0504c detected using SWATH mass
+ spectrometry. Mb0504c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248211.1"
+ /translation="MGESTTQPAGGAAVDDETRSAALPRWRGAAGRLEVWYATLSDPL
+ TRTGLWVHCETVAPTTGGPYAHGWVTWFPPDAPPGTERFGPQPAQPAAGPAWFDIAGV
+ RMAPAELTGRTRSLAWELSWKDTAAPLWTFPRVAWERELLPGAQVVIAPTAVFAGSLA
+ VGETTHRVDSWRGGVAHIYGHGNAKRWGWIHADLGDGDVLEVVTAVSHKPGLRRLAPL
+ AFVRFRIDGKDWPASPLPSLRMRTTLGVRHWQLEGRIGGREALIRVDQPPERCVSLGY
+ TDPDGAKAVCTNTEQADIHIELGGRHWSVLGTGHAEVGLRGTAAPAIKEGTPA"
+ gene 585846..586574
+ /locus_tag="BQ2027_MB0505"
+ CDS 585846..586574
+ /locus_tag="BQ2027_MB0505"
+ /note="Mb0505, -, len: 242 aa. Equivalent to Rv0494, len:
+ 242 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 242 aa overlap). Probable
+ transcriptional regulator, GntR family, with C-terminal
+ part highly similar to S72893|B2168_C2_205 hypothetical
+ protein from Mycobacterium leprae (105 aa). Also similar
+ to other transcription regulators e.g. PDHR_ECOLI|P06957
+ pyruvate dehydrogenase complex repressor PDHR or GENA from
+ Escherichia coli (254 aa), FASTA scores: opt: 284, E():
+ 1.2e-11, (32.6% identity in 224 aa overlap); etc. Contains
+ PS00043 Bacterial regulatory proteins, gntR family
+ signature, and probable helix-turn helix motif from aa
+ 50-71 (Score 1229, +3.37 SD)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY GNTR-FAMILY)"
+ /protein_id="CAB5248212.1"
+ /translation="MVEPMNQSSVFQPPDRQRVDERIATTIADAILDGVFPPGSTLPP
+ ERDLAERLGVNRTSLRQGLARLQQMGLIEVRHGSGSVVRDPEGLTHPAVVEALVRKLG
+ PDFLVELLEIRAALGPLIGRLAAARSTPEDAEALCAALEVVQQADTAAARQAADLAYF
+ RVLIHSTRNRALGLLYRWVEHAFGGREHALTGAYDDADPVLTDLRAINGAVLAGDPAA
+ AAATVEAYLNASALRMVKSYRDRA"
+ gene complement(586575..587465)
+ /locus_tag="BQ2027_MB0506C"
+ CDS complement(586575..587465)
+ /locus_tag="BQ2027_MB0506C"
+ /note="Mb0506c, -, len: 296 aa. Equivalent to Rv0495c,
+ len: 296 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 296 aa overlap). Conserved
+ hypothetical protein, highly similar to S72915|B2168_F1_37
+ hypothetical protein from Mycobacterium leprae (323 aa),
+ FASTA scores: opt: 1615, E(): 0, (82.7% identity in 271 aa
+ overlap); and
+ P54579|Y495_MYCLE|ML243|13094009|CAC31952.1|AL583925
+ conserved hypothetical protein from Mycobacterium leprae
+ (277 aa). Also highly similar to Q9X8H2|Y716_STRCO|SCE7.16
+ HYPOTHETICAL PROTEIN from Streptomyces coelicolor (271
+ aa). Protein product from Mb0506c detected using SWATH
+ mass spectrometry. Mb0506c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248213.1"
+ /translation="MWRPAQGARWHVPAVLGYGGIPRRASWSNVESVANSRRRPVHPG
+ QEVELDFAREWVEFYDPDNPEHLIAADLTWLLSRWACVFGTPACQGTVAGRPNDGCCS
+ HGAFLSDDDDRTRLADAVHKLTDDDWQFRAKGLRRKGYLELDEHDGQPQHRTRKHKGA
+ CIFLNRPGFAGGAGCALHSKALKLGVPPLTMKPDVCWQLPIRRSQEWVTRPDGTEILK
+ TTLTEYDRRGWGSGGADLHWYCTGDPAAHVGTKQVWQSLADELTELLGEKAYGELAAM
+ CKRRSQLGLIAVHPATRAAQ"
+ gene 587545..588531
+ /gene="ppx1"
+ /locus_tag="BQ2027_MB0507"
+ CDS 587545..588531
+ /gene="ppx1"
+ /locus_tag="BQ2027_MB0507"
+ /EC_number="3.6.1.11"
+ /note="Mb0507, -, len: 328 aa. Equivalent to Rv0496, len:
+ 328 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 328 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ S72894|467046|AAA17230.1|U00018 exopolyphosphatase (EC
+ 3.6.1.11) ppx from Mycobacterium leprae (406 aa), FASTA
+ scores: opt: 1902, E(): 0, (86.6% identity in 343 aa
+ overlap); and
+ P54882|Y496_MYCLE|ML2434|13094008|CAC31951.1|AL583925
+ HYPOTHETICAL 36.2 KDA PROTEIN from Mycobacterium leprae
+ (339 aa). Also highly similar to hypothetical proteins and
+ exopolyphosphatases e.g. Q9X8H1|Y715_STRCO|SCE7.15c
+ HYPOTHETICAL PROTEIN from Streptomyces coelicolor (309
+ aa). C-terminal region similar to CGU31224_1|Q46054
+ protein similar to ppx gene product of Mycobacterium
+ leprae from Cornybacterium glutamicum (140 aa), FASTA
+ scores: opt: 615, E(): 2.7e-33, (70.9% identity in 134 aa
+ overlap). Protein product from Mb0507 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0507 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Exopolyphosphatase (EC"
+ /protein_id="CAB5248214.1"
+ /translation="MVDAHRGGHPTPMSSTKATLRLAEATDSSGKITKRGADKLISTI
+ DEFAKIAISSGCAELMAFATSAVRDAENSEDVLSRVRKETGVELQALRGEDESRLTFL
+ AVRRWYGWSAGRILNLDIGGGSLEVSSGVDEEPEIALSLPLGAGRLTREWLPDDPPGR
+ RRVAMLRDWLDAELAEPSVTVLEAGSPDLAVATSKTFRSLARLTGAAPSMAGPRVKRT
+ LTANGLRQLIAFISRMTAVDRAELEGVSADRAPQIVAGALVAEASMRALSIEAVEICP
+ WALREGLILRKLDSEADGTALIESSSVHTSVRAVGGQPADRNAANRSRGSKP"
+ gene 588528..589460
+ /locus_tag="BQ2027_MB0508"
+ CDS 588528..589460
+ /locus_tag="BQ2027_MB0508"
+ /note="Mb0508, -, len: 310 aa. Equivalent to Rv0497, len:
+ 310 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 310 aa overlap). Probable conserved
+ transmembrane protein, equivalent (but shorter in
+ C-terminus) to P54580|Y497_MYCLE|ML2433 HYPOTHETICAL 37.9
+ KDA PROTEIN from Mycobacterium leprae (355 aa). N-terminus
+ highly similar to S72922|B2168_C1_166|467074 hypothetical
+ protein from Mycobacterium leprae (118 aa), FASTA scores:
+ opt: 350, E(): 1.4e-12, (57.9% identity in 114 aa
+ overlap); and hydrophobic C-terminus, highly similar to
+ S72895|B2168_C2_209|467047 hypothetical protein from
+ Mycobacterium leprae (241 aa), FASTA scores: opt: 473,
+ E(): 8e-19, (53.9% identity in 241 aa). Protein product
+ from Mb0508 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0508 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248215.1"
+ /translation="MTGPHPETESSGNRQISVAELLARQGVTGAPARRRRRRRGDSDA
+ ITVAELTGEIPIIRDDHHHAGPDAHASQSPAANGRVQVGEAAPQSPAEPVAEQVAEEP
+ TRTVYWSQPEPRWPKSPPQDRRESGPELSEYPRPLRHTHSDRAPAGPPSGAEHMSPDP
+ VEHYPDLWVDVLDTEVGEAEAETEVREAQPGRGERHAAAAAAGTDVEGDGAAEARVAR
+ RALDVVPTLWRGALVVLQSILAVAFGAGLFIAFDQLWRWNSIVALVLSVMVILGLVVS
+ VRAVRKTEDIASTLIAVAVGALITLGPLALLQSG"
+ gene 589476..590318
+ /locus_tag="BQ2027_MB0509"
+ CDS 589476..590318
+ /locus_tag="BQ2027_MB0509"
+ /note="Mb0509, -, len: 280 aa. Equivalent to Rv0498, len:
+ 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 280 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ P54581|Y498_MYCLE|ML2432 HYPOTHETICAL 30.5 KDA PROTEIN
+ from Mycobacterium leprae (280 aa); and
+ S72896|B2168_C2_210 hypothetical protein from
+ Mycobacterium leprae (244 aa), FASTA scores: opt: 1486,
+ E():0, (89.3% identity in 244 aa overlap). Also similar to
+ Q9X8H0|Y714_STRCO|SCE7.14c HYPOTHETICAL PROTEIN from
+ Streptomyces coelicolor. Protein product from Mb0509
+ detected using SWATH mass spectrometry. Mb0509 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="AP endonuclease, family protein 2"
+ /protein_id="CAB5248216.1"
+ /translation="MRPAIKVGLSTASVYPLRAEAAFEYADRLGYDGVELMVWGESVS
+ QDIDAVRKLSRRYRVPVLSVHAPCLLISQRVWGANPILKLDRSVRAAEQLGAQTVVVH
+ PPFRWQRRYAEGFSDQVAALEAASTVMVAVENMFPFRADRFFGAGQSRERMRKRGGGP
+ GPAISAFAPSYDPLDGNHAHYTLDLSHTATAGTDSLDMARRMGPGLVHLHLCDGSGLP
+ ADEHLVPGRGTQPTAEVCQMLAGSGFVGHVVLEVSTSSARSANERESMLAESLQFART
+ HLLR"
+ gene 590334..591209
+ /locus_tag="BQ2027_MB0510"
+ CDS 590334..591209
+ /locus_tag="BQ2027_MB0510"
+ /note="Mb0510, -, len: 291 aa. Equivalent to Rv0499, len:
+ 291 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 291 aa overlap). Conserved
+ hypothetical protein, showing some similarity to
+ AL031184|SC2A11_16|T34762 hypothetical protein from
+ Streptomyces coelicolor (340 aa), FASTA scores: opt: 240,
+ E(): 1.8e-07, (28.9% identity in 270 aa overlap). Protein
+ product from Mb0510 detected using SWATH mass
+ spectrometry. Mb0510 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="TesB-like acyl-CoA thioesterase 3"
+ /protein_id="CAB5248217.1"
+ /translation="MNALFTTAMALRPLDSDPGNPACRVFEGELNEHWTIGPKVHGGA
+ MVALCANAARTAYGAAGQQPMRQPVAVSASFLWAPDPGTMRLVTSIRKRGRRISVADV
+ ELTQGGRTAVHAVVTLGEPEHFLPGVDGSGGASGTAPLLSANPVVELMAPEPPEGVVP
+ IGPGHQLAGLVHLGEGCDVRPVLSTLRSATDGRPPVIQLWARPRGVAPDALFALLCGD
+ LSAPVTFAVDRTGWAPTVALTAYLRALPADGWLRVLCTCVEIGQDWFDEDHIVVDRLG
+ RIVVQTRQLAMVPAQ"
+ gene 591234..592121
+ /gene="proC"
+ /locus_tag="BQ2027_MB0511"
+ CDS 591234..592121
+ /gene="proC"
+ /locus_tag="BQ2027_MB0511"
+ /note="Mb0511, proC, len: 295 aa. Equivalent to Rv0500,
+ len: 295 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 295 aa overlap). Probable proC,
+ Pyrroline-5-carboxylate reductase (EC 1.5.1.2) (see
+ citation below), equivalent to P46725|PROC_MYCLE
+ PYRROLINE-5-CARBOXYLATE REDUCTASE from Mycobacterium
+ leprae (294 aa), FASTA scores: opt: 1473, E(): 0, (82.4%
+ identity in 295 aa overlap). Also similar to others e.g.
+ P46540|PROC_CORGL PYRROLINE-5-CARBOXYLATE REDUCTASE from
+ Corynebacterium glutamicum (270 aa);
+ T36286|4803683|CAB42663.1|AL049819 pyrroline-5-carboxylate
+ reductase from Streptomyces coelicolor (284 aa); etc.
+ BELONGS TO THE PYRROLINE-5-CARBOXYLATE REDUCTASE FAMILY.
+ Protein product from Mb0511 detected using shotgun mass
+ spectrometry. Mb0511 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PYRROLINE-5-CARBOXYLATE REDUCTASE PROC
+ (P5CR) (P5C REDUCTASE)"
+ /protein_id="CAB5248218.1"
+ /translation="MLFGMARIAIIGGGSIGEALLSGLLRAGRQVKDLVVAERMPDRA
+ NYLAQTYSVLVTSAADAVENATFVVVAVKPADVEPVIADLANATAAAENDSAEQVFVT
+ VVAGITIAYFESKLPAGTPVVRAMPNAAALVGAGVTALAKGRFVTPQQLEEVSALFDA
+ VGGVLTVPESQLDAVTAVSGSGPAYFFLLVEALVDAGVGVGLSRQVATDLAAQTMAGS
+ AAMLLERMDQDQGGANGELMGLRVDLTASRLRAAVTSPGGTTAAALRELERGGFRMAV
+ DAAVQAAKSRSEQLRITPE"
+ gene 592262..592498
+ /locus_tag="BQ2027_MB0512"
+ CDS 592262..592498
+ /locus_tag="BQ2027_MB0512"
+ /note="Mb0512, -, len: 78 aa. Equivalent to Rv0500A, len:
+ 78 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 78 aa overlap). Conserved hypothetical
+ protein, similar to proteins from Mycobacterium leprae and
+ Streptomyces coelicolor e.g. U00018_25 from Mycobacterium
+ leprae cosmid B2168 (86 aa), FASTA scores: opt: 428, E():
+ 1.3e-27, (82.6% identity in 86 aa overlap);
+ AL079345|SCE68_26 from Streptomyces coelicolor cosmid E6
+ (70 aa), FASTA scores: opt: 252, E(): 1.2 e-13, (72.2
+ identity in 54 aa overlap). Protein product from Mb0512
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0512 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Excisionase-like protein SCO3328"
+ /protein_id="CAB5248219.1"
+ /translation="MTSTNGPSARDTGFVEGQQAKTQLLTVAEVAALMRVSKMTVYRL
+ VHNGELPAVRVGRSFRVHAKAVHDMLETSYFDAG"
+ gene 592626..592727
+ /locus_tag="BQ2027_MB0512A"
+ CDS 592626..592727
+ /locus_tag="BQ2027_MB0512A"
+ /note="Mb0512A, len: 33 aa. Equivalent to Rv0500B len: 33
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 33 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Conserved hypothetical
+ protein. Basic protein 18 of the 33 aa are Arg or Lys,
+ with strong similarity to AL079345|SCE68_25 protein from
+ Streptomyces coelicolor cosmid E6 (32 aa), FASTA scores:
+ opt: 176, E(): 1e-06, (93.1% identity in 29 aa overlap).
+ Same gene arrangement in both actinomycetes. Mb0512A found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="30S small ribosomal subunit"
+ /protein_id="CAB5248220.1"
+ /translation="MGSVIKKRRKRMSKKKHRKLLRRTRVQRRKLGK"
+ gene 592805..593935
+ /gene="galE2"
+ /locus_tag="BQ2027_MB0513"
+ CDS 592805..593935
+ /gene="galE2"
+ /locus_tag="BQ2027_MB0513"
+ /note="Mb0513, galE2, len: 376 aa. Equivalent to Rv0501,
+ len: 376 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 376 aa overlap). Possible galE2,
+ UDP-glucose 4-epimerase (EC 5.1.3.2), highly similar
+ (except in N-terminus) to CAC31944.1|AL583925 possible
+ glucose epimerase/dehydratase from Mycobacterium leprae
+ (364 aa). N-terminus highly similar to
+ S72923|B2168_C1_174|467075|AAA17259.1|U00018 hypothetical
+ protein from Mycobacterium leprae (180 aa), FASTA scores:
+ opt: 934, E(): 0, (89.6% identity in 164 aa overlap); and
+ C-terminus highly similar to
+ S72898|467050|AAA17234.1|U00018 hypothetical protein from
+ Mycobacterium leprae (168 aa), FASTA scores: opt: 928,
+ E(): 0, (82.7% identity in 168 aa overlap). Also highly
+ similar to T36274|5123671|CAB45360.1|AL079345 probable
+ epimerase from Streptomyces coelicolor (353 aa); and
+ similar in part to other epimerases e.g. GALE_ECOLI|P09147
+ UDP-glucose 4-epimerase from Escherichia coli (338 aa),
+ FASTA scores: opt: 241, E(): 6.7e-09, (28.2% identity in
+ 294 aa overlap); etc. BELONGS TO THE SUGAR EPIMERASE
+ FAMILY. COFACTOR: NAD. Note that previously known as
+ galE1. Protein product from Mb0513 detected using SWATH
+ mass spectrometry. Mb0513 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE UDP-GLUCOSE 4-EPIMERASE GALE2
+ (GALACTOWALDENASE) (UDP-GALACTOSE 4-EPIMERASE) (URIDINE
+ DIPHOSPHATE GALACTOSE 4-EPIMERASE) (URIDINE
+ DIPHOSPHO-GALACTOSE 4-EPIMERASE)"
+ /protein_id="CAB5248221.1"
+ /translation="MSSSNGRGGAGGVGGSSEHPQYPKVVLVTGACRFLGGYLTARLA
+ QNPLINRVIAVDAIAPSKDMLRRMGRAEFVRADIRNPFIAKVIRNGEVDTVVHAAAAS
+ YAPRSGGSAALKELNVMGAMQLFAACQKAPSVRRVVLKSTSEVYGSSPHDPVMFTEDS
+ SSRRPFSQGFPKDSLDIEGYVRALGRRRPDIAVTILRLANMIGPAMDTTLSRYLAGPL
+ VPTIFGRDARLQLLHEQDALGALERAAMAGKAGTFNIGADGILMLSQAIRRAGRIPVP
+ VPGFGVWALDSLRRANHYTELNREQFAYLSYGRVMDTTRMRVELGYQPKWTTVEAFDD
+ YFRGRGLTPIIDPHRVRSWEGRAVGLAQRWGSRNPIPWSGLR"
+ gene 593942..595018
+ /locus_tag="BQ2027_MB0514"
+ CDS 593942..595018
+ /locus_tag="BQ2027_MB0514"
+ /note="Mb0514, -, len: 358 aa. Equivalent to Rv0502, len:
+ 358 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 358 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ P54878|Y502_MYCLE|ML2427 HYPOTHETICAL 40.5 KDA PROTEIN
+ from Mycobacterium leprae (367 aa), FASTA scores: opt:
+ 2042, E(): 0, (84.1% identity in 365 aa overlap). Also
+ similar to T36273|SCE68.23c hypothetical protein from
+ Streptomyces coelicolor (355 aa). C-terminal similar to
+ AL021529|SC10A5_4|T34572 hypothetical protein from
+ Streptomyces coelicolor (295 aa), FASTA score: (57.8%
+ identity in 263 aa overlap); and to hypothetical proteins
+ from Mycobacterium tuberculosis Rv1920|G70808 (287 aa);
+ and Rv1428c|G70914 (275 aa). Protein product from Mb0514
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0514 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Phospholipid/glycerol acyltransferase"
+ /protein_id="CAB5248222.1"
+ /translation="MGNVAGETRANVIPLHTNRSRVAARRRAGQRAESRQHPSLLSDP
+ NDRASAEQIAAVVREIDEHRRAAGATTSSTEATPNDLAQLVAAVAGFLRQRLTGDYSV
+ DEFGFDPHFNSAIVRPLLRFFFKSWFRVEVSGVENIPRDGAALVVANHAGVLPFDGLM
+ LSVAVHDEHPAHRDLRLLAADMVFDLPVIGEAARKAGHTMACTTDAHRLLASGELTAV
+ FPEGYKGLGKRFEDRYRLQRFGRGGFVSAALRTKAPIVPCSIIGSEEIYPMLTDVKLL
+ ARLFGLPYFPITPLFPLAGPVGLVPLPSKWRIAFGEPICTADYASTDADDPMVTFELT
+ DQVRETIQQTLYRLLAGRRNIFFG"
+ gene complement(595022..595930)
+ /gene="cmaA2"
+ /locus_tag="BQ2027_MB0515C"
+ CDS complement(595022..595930)
+ /gene="cmaA2"
+ /locus_tag="BQ2027_MB0515C"
+ /note="Mb0515c, cmaA2, len: 302 aa. Equivalent to Rv0503c,
+ len: 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 302 aa overlap). cmaA2 (alternate gene
+ name: cma2), cyclopropane-fatty-acyl-phospholipid synthase
+ 2 (mycolic acid trans-cyclopropane synthetase) (EC
+ 2.1.1.79) (see citations below). Note that this protein
+ has 302 aa and not 322 aa: we have chosen a different
+ initiation codon on the basis of homology). Equivalent to
+ S72886|B2168_F3_130 hypothetical protein from
+ Mycobacterium leprae (308 aa), FASTA score: (78.9%
+ identity in 303 aa overlap); and highly similar to other
+ proteins from Mycobacterium leprae. Also similar to other
+ proteins from Mycobacterium tuberculosis and Mycobacterium
+ bovis BCG e.g. MTV038_14|UMAA2|Rv0470c|MTV038.14 PUTATIVE
+ MYCOLIC ACID SYNTHESIS/MODIFICATION PROTEIN (287 aa)
+ (57.2% identity in 297 aa overlap). Protein product from
+ Mb0515c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0515c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CYCLOPROPANE-FATTY-ACYL-PHOSPHOLIPID SYNTHASE 2
+ CMAA2 (CYCLOPROPANE FATTY ACID SYNTHASE) (CFA SYNTHASE)
+ (CYCLOPROPANE MYCOLIC ACID SYNTHASE 2) (MYCOLIC ACID
+ TRANS-CYCLOPROPANE SYNTHETASE)"
+ /protein_id="CAB5248223.1"
+ /translation="MTSQGDTTSGTQLKPPVEAVRSHYDKSNEFFKLWLDPSMTYSCA
+ YFERPDMTLEEAQYAKRKLALDKLNLEPGMTLLDIGCGWGSTMRHAVAEYDVNVIGLT
+ LSENQYAHDKAMFDEVDSPRRKEVRIQGWEEFDEPVDRIVSLGAFEHFADGAGDAGFE
+ RYDTFFKKFYNLTPDDGRMLLHTITIPDKEEAQELGLTSPMSLLRFIKFILTEIFPGG
+ RLPRISQVDYYSSNAGWKVERYHRIGANYVPTLNAWADALQAHKDEAIALKGQETYDI
+ YMHYLRGCSDLFRDKYTDVCQFTLVK"
+ gene complement(595953..596453)
+ /locus_tag="BQ2027_MB0516C"
+ CDS complement(595953..596453)
+ /locus_tag="BQ2027_MB0516C"
+ /note="Mb0516c, -, len: 166 aa. Equivalent to Rv0504c,
+ len: 166 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 166 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ P54879|Y504_MYCLE|ML2425 HYPOTHETICAL 18.7 KDA PROTEIN
+ from Mycobacterium leprae (166 aa), FASTA scores: opt:
+ 884, E(): 0, (83.1% identity in 166 aa overlap); and
+ highly similar to other proteins from Mycobacterium
+ leprae. Also highly similar to
+ CAB77410.1|AL160431|SCD82.07 hypothetical protein from
+ Streptomyces coelicolor (150 aa). Also similar to M.
+ tuberculosis hypothetical proteins Rv0635|H70612 (158 aa);
+ and Rv0637|B70613 (166 aa). Protein product from Mb0516c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0516c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="UPF0336 protein"
+ /protein_id="CAB5248224.1"
+ /translation="MTVPEEAQTLIGKHYRAPDHFLVGREKIREFAVAVKDDHPTHYS
+ EPDAAAAGYPALVAPLTFLAIAGRRVQLEIFTKFNIPINIARVFHRDQKFRFHRPILA
+ NDKLYFDTYLDSVIESHGTVLAEIRSEVTDAEGKPVVTSVVTMLGEAAHHEADADATV
+ AAIASI"
+ gene complement(596615..597736)
+ /gene="serB1"
+ /locus_tag="BQ2027_MB0517C"
+ CDS complement(596615..597736)
+ /gene="serB1"
+ /locus_tag="BQ2027_MB0517C"
+ /note="Mb0517c, serB1, len: 373 aa. Equivalent to Rv0505c,
+ len: 373 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 373 aa overlap). Possible serB1,
+ phosphoserine phosphatase (EC 3.1.3.3), equivalent (but
+ longer ~70 aa in N-terminus) to S72914|serB phosphoserine
+ phosphatase from Mycobacterium leprae (300 aa), FASTA
+ scores: opt: 1570, E(): 0, (83.0% identity in 306 aa
+ overlap). C-terminus highly similar to CAB55344.1|AJ010584
+ phosphoserine phosphatase from Streptomyces coelicolor
+ (266 aa). Low similarity to SERB_ECOLI|P06862
+ phosphoserine phosphatase from Escherichia coli strains
+ K12 and O157:H7 (322 aa), FASTA scores: opt: 148, E():
+ 0.043, (24.0% identity in 150 aa overlap). C-terminus is
+ also similar to O33611|AB004855_1|IMD_STRCN PROTEIN
+ INVOLVED IN INHIBITION OF MORPHOLOGICAL DIFFERENTIATION
+ from Streptomyces cyaneus (277 aa), FASTA score: (37.7%
+ identity in 252 aa overlap). SEEMS TO BELONG TO THE SERB
+ FAMILY. Note that previously known as serB. Protein
+ product from Mb0517c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0517c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PHOSPHOSERINE PHOSPHATASE SERB1 (PSP)
+ (O-PHOSPHOSERINE PHOSPHOHYDROLASE) (PSPASE)"
+ /protein_id="CAB5248225.1"
+ /translation="MGLTCWPRTAAGRVHDESRCGLANFDTALGLQINPRQPRAPPRI
+ CRIGLITAAASATGQAPRLGVMMVSSHLGSPDQAGHVDLASPADPPPPDASASHSPVD
+ MPAPVAAAGSDRQPPIDLTAAAFFDVDNTLVQGSSAVHFGRGLAARHYFTYRDVLGFL
+ YAQAKFQLLGKENSNDVAAGRRKALAFIEGRSVAELVALGEEIYDEIIADKIWDGTRE
+ LTQMHLDAGQQVWLITATPYELAATIARRLGLTGALGTVAESVDGIFTGRLVGEILHG
+ TGKAHAVRSLAIREGLNLKRCTAYSDSYNDVPMLSLVGTAVAINPDARLRSLARERGW
+ EIRDFRIARKAARIGVPSALALGAAGGALAALASRRQSR"
+ gene 597910..598353
+ /gene="mmpS2"
+ /locus_tag="BQ2027_MB0518"
+ CDS 597910..598353
+ /gene="mmpS2"
+ /locus_tag="BQ2027_MB0518"
+ /note="Mb0518, mmpS2, len: 147 aa. Equivalent to Rv0506,
+ len: 147 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 147 aa overlap). Probable mmpS2,
+ conserved membrane protein (see citation below), highly
+ similar to other Mycobacterial proteins e.g. C-terminus of
+ AAD44232.1|AF143772_38|AF143772|TmtpA from M. avium (221
+ aa); P54880|MMS4_MYCLE|MMPS4 PUTATIVE MEMBRANE PROTEIN
+ from Mycobacterium leprae (154 aa), FASTA scores: opt:
+ 392, E(): 1.3e-20, (43.7% identity in 151 aa overlap); and
+ the PUTATIVE MEMBRANE PROTEINS from Mycobacterium
+ tuberculosis MTV040_5, MTCY4D9_16, MTV037_15. BELONGS TO
+ THE MMPS FAMILY. Mb0518 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN MMPS2"
+ /protein_id="CAB5248226.1"
+ /translation="MRMISVSGAVKRMWLLLAIVVVAVVGGLGIYRLHSIFGVHEQPT
+ VMVKPDFDVPLFNPKRVTYEVFGPAKTAKIAYLDPDARVHRLDSVSLPWSVTVETTLP
+ AVSVNLMAQSNADVISCRIIVNGAVKDERSETSPRALTSCQVSSG"
+ gene 598350..601256
+ /gene="mmpL2"
+ /locus_tag="BQ2027_MB0519"
+ CDS 598350..601256
+ /gene="mmpL2"
+ /locus_tag="BQ2027_MB0519"
+ /note="Mb0519, mmpL2, len: 968 aa. Equivalent to Rv0507,
+ len: 968 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 968 aa overlap). Probable mmpL2,
+ conserved transmembrane transport protein (see citation
+ below), member of RND superfamily, highly similar to other
+ Mycobacterial proteins e.g. YV34_MYCLE from Mycobacterium
+ leprae (959 aa), FASTA scores: opt: 3699, E(): 0, (58.3%
+ identity in 940 aa overlap); and the Mycobacterium
+ tuberculosis proteins MTV037_14, MTV040_4, MTCY98_8,
+ MTCY4D9_15, MTCY48_8, MTCY19G5_6, MTV005_19, etc. Also
+ similar to STMACTII_3|SC10A5_9 from Streptomyces
+ coelicolor; and BSUB0|004_12 from Bacillus subtilis.
+ C-terminal half similar to Q50086|U1740AB from
+ Mycobacterium leprae (386 aa), FASTA scores: opt: 1526,
+ E(): 0, (61.5% identity in 371 aa overlap). BELONGS TO THE
+ MMPL FAMILY. Mb0519 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL2"
+ /protein_id="CAB5248227.1"
+ /translation="MSERHAALTSLPPILPRLIRRFAVVIVLLWLGFTAFVNLAVPQL
+ EVVGKAHSVSMSPSDAASIQAIKRVGQVFGEFDSDNAVTIVLEGDQPLGGDAHRFYSD
+ LMRKLSADTRHVAHIQHFWGDPLTAAGSQSADDRAAYVVVYLVGNNETEAYDSVHAVR
+ HMVDTTPPPHGVKAYVTGPAALNADQAEAGDKSIAKVTAITSMVIAAMLLVIYRSVIT
+ AVLVLIMVGIDLGAIRGFIALLADHNIFSLSTFATNLLVLMAIAASTDYAIFMLGRYH
+ ESRYAGEDRETAFYTMFHGTAHVILGSGLTIAGAMYCLSFARLPYFETLGAPIAIGML
+ VAVLAALTLGPAVLTVGSFFKLFDPKRRMNTRRWRRVGTAIVRWPGPVLAATCLVASI
+ GLLALPSYRTTYDLRKFMPASMPSNVGDAAAGRHFSRARLNPEVLLIETDHDMRNPVD
+ MLVLDKVAKNIYHSPGIEQVKAITRPLGTTIKHTSIPFIISMQGVNSSEQMEFMKDRI
+ YDILVQVAAMNTSIETMHRMYALMGEVIDNTVDMDHLTHDMSDITATLRDHLADFEDF
+ FRPIRSYFYWEKHCFDVPLCWSIRSIFDMFDSVDQLSEKLEYLVKDMDILITLLPQMR
+ AQMPPMISAMTTMRDMMLIWHGTLGAFYKQQERNNKDPGAMGRVFDAAQIDDSFYLPQ
+ SAFENPDFKRGLKMFLSPDGKAARFVIALEGDPATPEGICRVEPIKREAREAIKGTPL
+ QGAAIYLGGTAATFKDIREGARYDLLIAGVAAISLILIIMMIITRSVVAAVVIVGTVV
+ LSMGASFGLSVLVWQDILGIELYWMVLAMSVILLLAVGSDYNLLLISRLKEEIGAGLN
+ TGIIRAMAGTGGVVTAAGMVFAVTMSLFVFSDLRIIGQIGTTIGLGLLFDTLVVRSFM
+ TPSIAALLGRWFWWPLRVRPRPASQMLRPFAPRRLVRALLLPSGQHPSATGAHE"
+ gene 601249..601542
+ /locus_tag="BQ2027_MB0520"
+ CDS 601249..601542
+ /locus_tag="BQ2027_MB0520"
+ /note="Mb0520, -, len: 97 aa. Equivalent to Rv0508, len:
+ 97 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 97 aa overlap). Conserved hypothetical
+ protein, showing similarity with
+ T36269|5123666|CAB45355.1|AL079345 probable redoxin from
+ Streptomyces coelicolor (101 aa), FASTA scores: opt: 160,
+ E(): 3.4e-05, (33.3% identity in 75 aa overlap); and
+ E81943|NMA0966 probable thioredoxin from Neisseria
+ meningitidis group A strain Z2491 (77 aa). Protein product
+ from Mb0520 detected using SWATH mass spectrometry. Mb0520
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Glutaredoxin-like domain-containing protein
+ PA3033"
+ /protein_id="CAB5248228.1"
+ /translation="MSRPQVELLTRAGCAICVRVAEQLAELSSELGFDMMTIDVDVAA
+ STGNPGLRAEFGDRLPVVLLDGREHSYWEVDEHRLRADIARSTFGSPPDKRLP"
+ gene 601592..602998
+ /gene="hemA"
+ /locus_tag="BQ2027_MB0521"
+ CDS 601592..602998
+ /gene="hemA"
+ /locus_tag="BQ2027_MB0521"
+ /note="Mb0521, hemA, len: 468 aa. Equivalent to Rv0509,
+ len: 468 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 468 aa overlap). Probable hemA,
+ glutamyl-tRNA reductase (EC 1.2.1.-), equivalent to
+ HEM1_MYCLE|P46724 GLUTAMYL-TRNA REDUCTASE from
+ Mycobacterium leprae (467 aa), FASTA scores: opt: 2377,
+ E(): 0, (82.3% identity in 463 aa overlap). Also highly
+ similar (sometimes in part) to others e.g.
+ Q9WX15|HEM1_STRCO GLUTAMYL-TRNA REDUCTASE from
+ Streptomyces coelicolor (581 aa); P16618|HEM1_BACSU|HEMA
+ GLUTAMYL-TRNA REDUCTASE from Bacillus subtilis (455 aa);
+ etc. Contains PS00747 Glutamyl-tRNA reductase signature.
+ BELONGS TO THE GLUTAMYL-TRNA REDUCTASE FAMILY. Protein
+ product from Mb0521 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0521 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable glutamyl-trna reductase hema (glutr)"
+ /protein_id="CAB5248229.1"
+ /translation="MSVLLFGVSHRSAPVVVLEQLSIDESDQVKIIDRVLASPLVTEA
+ MVLSTCNRVEVYAVVDAFHGGLSVIGQVLAEHSGMSMGELTKYAYVRYSEAAVEHLFA
+ VASGLDSAVIGEQQVLGQVRRAYAVAESNRTVGRVLHELAQRALSVGKRVHSETAIDA
+ AGASVVSVALGMAERKLGSLAGTTAVVIGAGAMGALSAVHLTRAGVGHIQVLNRSLSR
+ AQRLARRIRESGVPAEALALDRLANVLADADVVVSCTGAVRPVVSLADVHHALAAARR
+ DEATRPLVICDLGMPRDVDPAVARLPCVWVVDVDSVQHEPSAHAAAADVEAARHIVAA
+ EVASYLVGQRMAEVTPTVTALRQRAAEVVEAELLRLDNRLPGLQSVQREEVARTVRRV
+ VDKLLHAPTVRIKQLASAPGGDSYAEALRELFELDQTAVDAVATAGELPVVPSGFDAE
+ SRRGGGDMQSSPKRSPSN"
+ gene 603008..603937
+ /gene="hemC"
+ /locus_tag="BQ2027_MB0523"
+ CDS 603008..603937
+ /gene="hemC"
+ /locus_tag="BQ2027_MB0523"
+ /note="Mb0523, hemC, len: 309 aa. Equivalent to Rv0510,
+ len: 309 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 309 aa overlap). Probable hemC,
+ hydroxymethylbilane synthase (porphobilinogen deaminase)
+ (EC 4.3.1.8), equivalent to HEM3B|Q49808|HEM3_MYCLE
+ PORPHOBILINOGEN DEAMINASE from Mycobacterium leprae (315
+ aa), FASTA scores: opt: 889, E(): 0, (88.1% identity in
+ 159 aa overlap). Also highly similar to others e.g.
+ Q9WX16|HE31_STRCO PROBABLE PORPHOBILINOGEN DEAMINASE from
+ Streptomyces coelicolor (319 aa); Q9L6Q2|HEM3_SALTY
+ PORPHOBILINOGEN DEAMINASE from Salmonella typhimurium (313
+ aa); etc. BELONGS TO THE HMBS FAMILY. COFACTOR: COVALENTLY
+ BINDS A DIPYRROMETHANE COFACTOR TO WHICH THE
+ PORPHOBILINOGEN SUBUNITS ARE ADDED. Protein product from
+ Mb0523 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0523 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PORPHOBILINOGEN DEAMINASE HEMC (PBG)
+ (HYDROXYMETHYLBILANE SYNTHASE) (HMBS)
+ (PRE-UROPORPHYRINOGEN SYNTHASE)"
+ /protein_id="CAB5248230.1"
+ /translation="MIRIGTRGSLLATTQAATVRDALIAGGHSAELVTISTEGDRSMA
+ PIASLGVGVFTTALREAMEAGLVDAAVHSYKDLPTAADPRFTVAAIPPRNDPRDAVVA
+ RDGLTLGELPVGSLVGTSSPRRAAQLRALGLGLEIRPLRGNLDTRLNKVSSGDLDAIV
+ VARAGLARLGRLDDVTETLEPVQMLPAPAQGALAVECRAGDSRLVAVLAELDDADTRA
+ AVTAERALLADLEAGCSAPVGAIAEVVESIDEDGRVFEELSLRGCVAALDGSDVIRAS
+ GIGSCGRARELGLSVAAELFELGARELMWGVRH"
+ gene 603970..605667
+ /gene="hemD"
+ /locus_tag="BQ2027_MB0524"
+ CDS 603970..605667
+ /gene="hemD"
+ /locus_tag="BQ2027_MB0524"
+ /note="Mb0524, hemD, len: 565 aa. Equivalent to Rv0511,
+ len: 565 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 565 aa overlap). Probable hemD
+ (alternate gene name: cysG), uroporphyrin-III
+ C-methyltransferase (EC 2.1.1.107), highly similar to
+ others e.g. CAC31936.1|AL583925 possible uroporphyrin-III
+ C-methyltransferase from Mycobacterium leprae (563 aa);
+ and S72909|CYSG from Mycobacterium leprae (472 aa), FASTA
+ scores: opt: 1946, E(): 0, (83.3% identity in 472 aa
+ overlap); T36265|5123662|CAB45351.1|AL079345 probable
+ uroporphyrin-III C-methyltransferase from Streptomyces
+ coelicolor (565 aa); and similar to others e.g.
+ AAK00606.1|AF221100_3|AF221100 from Selenomonas
+ ruminantium subsp. ruminantium (505 aa); etc. Also similar
+ to Rv2071c and Rv2847c from Mycobacterium tuberculosis.
+ Note that previously known as cysG. Protein product from
+ Mb0524 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0524 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE UROPORPHYRIN-III C-METHYLTRANSFERASE
+ HEMD (UROPORPHYRINOGEN III METHYLASE) (UROGEN III
+ METHYLASE) (SUMT) (UROGEN III METHYLASE) (UROM)"
+ /protein_id="CAB5248231.1"
+ /translation="MTRGRKPRPGRIVFVGSGPGDPGLLTTRAAAVLANAALVFTDPD
+ VPEPVVALIGTDLPPVSGPAPAEPVAGNGDAAGGGSAQEHGRAASAVVSGGPDIRPAL
+ GDPADVAKTLTAEARSGVDVVRLVAGDPLTVDAVISEVNAVARTHLHIEIVPGLAASS
+ AVPTYAGLPLGSSHTVADVRIDPENTDWDALAAAPGPLILQATASHLAESARSLIDHQ
+ LAESTPCVVTAHGTTCQQRSVETTLQGLTDPAVLGATDPACSANGRDSQAGPLIVTIG
+ KTVTSRAKLNWWESRALYGWTVLVPRTKDQAGEMSERLTSYGALPVEVPTIAVEPPRS
+ PAQMERAVKGLVDGRFQWIVFTSTNAVRAVWEKFGEFGLDARAFSGVKIACVGESTAD
+ RVRAFGISPELVPSGEQSSLGLLDDFPPYDSVFDPVNRVLLPRADIATETLAEGLRER
+ GWEIEDVTAYRTVRAAPPPATTREMIKTGGFDAVCFTSSSTVRNLVGIAGKPHARTII
+ ACIGPKTAETAAEFGLRVDVQPDTAAIGPLVDALAEHAARLRAEGALPPPRKKSRRR"
+ gene 605753..606742
+ /gene="hemB"
+ /locus_tag="BQ2027_MB0525"
+ CDS 605753..606742
+ /gene="hemB"
+ /locus_tag="BQ2027_MB0525"
+ /note="Mb0525, hemB, len: 329 aa. Equivalent to Rv0512,
+ len: 329 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 329 aa overlap). Probable hemB,
+ delta-aminolevulinic acid dehydratase (EC 4.2.1.24),
+ equivalent to 46723|HEM2_MYCLE DELTA-AMINOLEVULINIC ACID
+ DEHYDRATASE from Mycobacterium leprae (329 aa). Also
+ highly similar to many e.g. P54919|HEM2_STRCO from
+ Streptomyces coelicolor (330 aa); HEM2_ECOLI|P15002 from
+ Escherichia coli (323 aa), FASTA scores: opt: 942, E(): 0,
+ (47.6% identity in 317 aa overlap); etc. Contains PS00169
+ Delta-aminolevulinic acid dehydratase active site. BELONGS
+ TO THE ALADH FAMILY. COFACTOR: ZINC. Protein product from
+ Mb0525 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0525 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DELTA-AMINOLEVULINIC ACID DEHYDRATASE
+ HEMB (PORPHOBILINOGEN SYNTHASE) (ALAD) (ALADH)"
+ /protein_id="CAB5248232.1"
+ /translation="MSMSSYPRQRPRRLRSTVAMRRLVAQTSLEPRHLVLPMFVADGI
+ DEPRPITSMPGVVQHTRDSLRRAAAAAVAAGVGGLMLFGVPRDQDKDGVGSAGIDPDG
+ ILNVALRDLAKDLGEATVLMADTCLDEFTDHGHCGVLDDRGRVDNDATVARYVELAVA
+ QAESGAHVVGPSGMMDGQVAAIRDGLDAAGYIDVVILAYAAKFASAFYGPFREAVSSS
+ LSGDRRTYQQEPGNAAEALREIELDLDGGADIVMVKPAMGYLDVVAAAADVSPVPVAA
+ YQVSGEYAMIRAAAANNWIDERAAVLESLTGIRRAGADIVLTYWAVDAAGWLT"
+ gene 606755..607303
+ /locus_tag="BQ2027_MB0526"
+ CDS 606755..607303
+ /locus_tag="BQ2027_MB0526"
+ /note="Mb0526, -, len: 182 aa. Equivalent to Rv0513, len:
+ 182 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 182 aa overlap). Possible conserved
+ transmembrane protein, with its N-terminus highly similar
+ to S72925|B2168_C1_182 hypothetical protein from
+ Mycobacterium leprae (103 aa), FASTA scores: opt: 217,
+ E(): 8.2e-14, (45.3 % identity in 106 aa overlap). Protein
+ product from Mb0526 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0526 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248233.1"
+ /translation="MTPTGDTKPKLLFYEPGASWYWVLTGPLAAVSVLLLEISSGAGV
+ GLITPAIFLVMVSAFVALQVKAARIHTSVELTHDALRQGTETIRLAEIVKIYPEADGR
+ ETSGEEPAKWQSARTLGELVGVPRGRVGIGLKLTGGRTAQAWARRHQQLRAALTPLVQ
+ ERLGPVDSDVADVNGDDAGPAR"
+ gene 607300..607599
+ /locus_tag="BQ2027_MB0527"
+ CDS 607300..607599
+ /locus_tag="BQ2027_MB0527"
+ /note="Mb0527, -, len: 99 aa. Equivalent to Rv0514, len:
+ 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 99 aa overlap). Possible transmembrane
+ protein. Mb0527 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248234.1"
+ /translation="MIARYRAGAELFLACAALAGSAASWSRTRSTVAVAPVIDGQPVT
+ LSVVYHPQPLVLTLLLATIAGVLSVVGTARLRRARAGLNAHPDGLNQRPPGGWCH"
+ gene 607702..609213
+ /locus_tag="BQ2027_MB0528"
+ CDS 607702..609213
+ /locus_tag="BQ2027_MB0528"
+ /note="Mb0528, -, len: 503 aa. Equivalent to Rv0515, len:
+ 503 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 503 aa overlap). Part of M.
+ tuberculosis 13E12 repeat family. Almost identical to
+ Rv0336 (99.8% identity in 503 aa overlap), possibly due to
+ a recent gene duplication. Also similar to other M.
+ tuberculosis hypothetical 13E12 repeat proteins e.g.
+ Rv1148c, Rv1945, etc. Mb0528 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED 13E12 REPEAT FAMILY PROTEIN"
+ /protein_id="CAB5248235.1"
+ /translation="MPSPEAIAHFDERFECHAPRTTRVSAAFIDRICSATRAENRAAA
+ AQLVALGELFAYRWSRCGGREEWVMDTMAAVAAEVAAALRISQGLAASRLRYARAMRE
+ RLPKTAEVFSAGDIGYLMFATIVYRTDLIVDPDVLAAVDAQLAANVARWPSMTKARLA
+ GQVDKIVARADADAVRRRKEYQAQRQFWVGESQDGVCQIGGSLLAVDAHALDARLSAL
+ AGTVCEHDPRSREQRRADALGALAGGADRLGCGCGRADCAAGKRPAAPPVVIHLIAEA
+ ATINGTGSAPASQMNADGLITAELVAELAKTATLVPLVHPGDAPPEPGYAPSKALADF
+ VRCRDLTCRWPGCDEPATNCDLDHTIPYAAGGPTHASNLKCYCRTHHLVKTFWGWRDQ
+ QLPDGTLILTSPSGHTYVSTPGSALLFPSLCHFSGGIPAPEADPPYDHCDQRTAMMPK
+ RRRTRAQDRAYRIATERRQNHAARQRAQVLTQTAAATDTHGPPPDHNDDPPPF"
+ gene complement(609210..609686)
+ /locus_tag="BQ2027_MB0529C"
+ CDS complement(609210..609686)
+ /locus_tag="BQ2027_MB0529C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0529c, -, len: 158 aa. Equivalent to Rv0516c,
+ len: 158 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 158 aa overlap). Conserved
+ hypothetical protein, showing some similarity to
+ Rv1365c|MTCY02B10_29 from Mycobacterium tuberculosis (128
+ aa), FASTA scores: E(): 0.0012, (27.4% identity in 124 aa
+ overlap). Protein product from Mb0529c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0529c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible anti-anti-sigma factor"
+ /protein_id="CAB5248236.1"
+ /translation="MTTTIPTSKSACSVTTRPGNAAVDYGGAQIRAYLHHLATVVTIR
+ GEIDAANVEQISEHVRRFSLGTNPMVLDLSELSHFSGAGISLLCILDEDCRAAGVQWA
+ LVASPAVVEQLGGRCDQGEHESMFPMARSVHKALHDLADAIDRRRQLVLPLISRSA"
+ gene 609897..611207
+ /locus_tag="BQ2027_MB0530"
+ CDS 609897..611207
+ /locus_tag="BQ2027_MB0530"
+ /note="Mb0530, -, len: 436 aa. Equivalent to Rv0517, len:
+ 436 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 436 aa overlap). Possible
+ acyltransferase (EC 2.3.1.-), integral membrane protein,
+ equivalent (but longer 26 aa in N-terminus) to
+ AAK44761.1|AE006954 putative acyltransferase from
+ Mycobacterium tuberculosis strain CDC1551 (410 aa). Also
+ similar to many acyltransferases e.g. MDMB_STRMY|Q00718
+ from Streptomyces mycarofaciens (387 aa), FASTA scores:
+ opt: 200, E(): 1.1e-08, (28.2% identity in 394 aa
+ overlap). And similar to Rv0111, Rv0228, Rv1254, Rv1565c
+ from Mycobacterium tuberculosis. Mb0530 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE ACYLTRANSFERASE"
+ /protein_id="CAB5248237.1"
+ /translation="MAGGMDQPPGQPRRRTRQQSSDGKNGVRAAEITGEIRALTGLRI
+ VAAVWVVLFHFRPMLGDASPGFRDALAPVLDCGAQGVDLFFILSGFVLTWNYLDRMGR
+ SWSVRANLHFLWLRLARVWPVYLVTLHLAAVWVIFTLHVGHVPSPEAGQLTAISYVRQ
+ ILLVQLWFQPYFDGSSWDGPAWSISAEWLAYLLFGLLILVIFRMKHATRARGLMWLAF
+ AASLPPVVLLLASGQFYTPWSWLPRIVTQFAAGALACAAVRRLRPTDRARRIAGYLSV
+ LVGVAIVGILYLLHAHPLAGVEDSGGVVDVLFVPLVISLAIGVGSLPALLSTRLMVFG
+ GQISFCLYMVHELVHTAWGWAVQQYELALQDQPWKWNVVGLLAIALGAAILLYHFVEE
+ PDRRWMRRMVDVKAASARSEPGEPVGSTRYQIDDALEGVSARAV"
+ gene 611339..612034
+ /locus_tag="BQ2027_MB0531"
+ CDS 611339..612034
+ /locus_tag="BQ2027_MB0531"
+ /note="Mb0531, -, len: 231 aa. Equivalent to Rv0518, len:
+ 231 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 231 aa overlap). Possible exported
+ protein; has hydrophobic N-terminus. Mb0531 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE EXPORTED PROTEIN"
+ /protein_id="CAB5248238.1"
+ /translation="MSRPGTYVIGLTLLVGLVVGNPGCPRSYRPLTLDYRLNPVAVIG
+ DSYTTGTDEGGLGSKSWTARTWQMLAARGVRIAADVAAEGRAGYGVPGDHGNVFEDLT
+ ARAVQPDDALVVFFGSRNDQGMDPEDPEMLAEKVRDTFDLARHRAPSASLLVIAPPWP
+ TADVPGPMLRIRDVLGAQARAAGAVFVDPIADHWFVDRPELIGADGVHPNDAGHEYLA
+ DKIAPLISMELVG"
+ gene complement(612322..613224)
+ /locus_tag="BQ2027_MB0532C"
+ CDS complement(612322..613224)
+ /locus_tag="BQ2027_MB0532C"
+ /note="Mb0532c, -, len: 300 aa. Equivalent to Rv0519c,
+ len: 300 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 300 aa overlap). Possible conserved
+ membrane protein, with hydrophobic region near N-terminus.
+ Could be a lipase (EC 3.1.-.-). Similar to
+ Rv0774c|MTCY369.19c|A70708 from Mycobacterium tuberculosis
+ (312 aa), FASTA scores: opt: 1092, E(): 0, (57.9% identity
+ in 299 aa overlap). Contains PS00120 Lipases, serine
+ active site. Mb0532c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5248239.1"
+ /translation="MLRRGCAGNTDRRGIMTPMADLTRRALLRWGAGAGAGAAGVWAF
+ GALVDPLEPQAAPAPFEPPTAGSSLPTRISGSFISAARGGIKTNWVISMPPGQSGQLR
+ PVIALHGKDGNAGMMLDLGVEQGLARLVKEGKPAFAVVGVDGGNTYWHRRSSGGDSGA
+ MVLDELLPMLTSMGMDTSRVGFLGWSMGGYGALLLGARLGPARTAGICAISPALFTSF
+ TGSTPGAFDSYDDYVQHSVLGLPALNSIPLRVDCGTSDRFYFATRQFVNQLHQPPAGS
+ FSPGGHDASYWREQLPGELAWMAS"
+ gene 613405..613755
+ /locus_tag="BQ2027_MB0533"
+ CDS 613405..613755
+ /locus_tag="BQ2027_MB0533"
+ /note="Mb0533, -, len: 116 aa. Equivalent to Rv0520, len:
+ 116 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 116 aa overlap). Possible fragment of
+ methyltransferase (possibly first part) (EC 2.1.1.-),
+ highly similar to part of several methyltransferases e.g.
+ Q43445|U43683
+ S-ADENOSYL-L-METHIONINE:DELTA24-STEROL-C-METHYLTRANSFERASE
+ from Glycine max (Soybean)(367 aa), FASTA scores: opt:
+ 190, E(): 2.3e-12, (39.2% identity in 74 aa overlap). Also
+ some similarity to MTCY19G5_5 from Mycobacterium
+ tuberculosis. Possibly continues as Rv0521 but we can find
+ no frameshift to account for this. Mb0533 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE METHYLTRANSFERASE/METHYLASE (FRAGMENT)"
+ /protein_id="CAB5248240.1"
+ /translation="MGGCSITCLNISEVPNETNRKKNRQAGLDRSIRVIHGSFDDIPE
+ PDSGYDVVWSQDAILHAPDRRKVLEEAFRVLRPGGELIFTDPMQADDVPDGVLQPVYD
+ RLNLRDLGSMRFYA"
+ gene 613748..614053
+ /locus_tag="BQ2027_MB0534"
+ CDS 613748..614053
+ /locus_tag="BQ2027_MB0534"
+ /note="Mb0534, -, len: 101 aa. Equivalent to Rv0521, len:
+ 101 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 101 aa overlap). Possible fragment of
+ methyltransferase (possibly second part) (EC 2.1.1.-),
+ highly similar to C-terminus of several methyltransferases
+ e.g. AAF87203.1|AF216282 sarcosine-dimethylglycine
+ methyltransferase from Halorhodospira halochloris (279
+ aa). Possibly continuation of Rv0520 but we can find no
+ frameshift to account for this."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE METHYLTRANSFERASE/METHYLASE (FRAGMENT)"
+ /protein_id="CAB5248241.1"
+ /translation="MREAAQALGFEVLDQRDLVRNLRTHYSRVFEELEARRLELEGKS
+ SQEYLDKMRVGLKNWVEAADNGHSRVGHPTFPRTRLTPICQLPTAAIDSTAGRRRYR"
+ gene 614188..615492
+ /gene="gabP"
+ /locus_tag="BQ2027_MB0535"
+ CDS 614188..615492
+ /gene="gabP"
+ /locus_tag="BQ2027_MB0535"
+ /note="Mb0535, gabP, len: 434 aa. Equivalent to Rv0522,
+ len: 434 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 434 aa overlap). Probable gabP, GABA
+ permease (gamma-aminobutyrate permease), integral membrane
+ protein, highly similar to others e.g. GABP_ECOLI|P25527
+ gaba permease from Escherichia coli (466 aa), FASTA
+ scores: opt: 1218, E(): 0, (44.3% identity in 424 aa
+ overlap); etc. Also similar to other Mycobacterium
+ tuberculosis permeases e.g. MTCY13E10.06c FASTA score:
+ (34.4% identity in 407 aa overlap). Contains PS00218 Amino
+ acid permeases signature. Overlaps and extends
+ Rv0523c|MTCY25D10.01 from overlapping cosmid. BELONGS TO
+ THE AMINO ACID PERMEASE FAMILY (APC FAMILY). Mb0535 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GABA PERMEASE GABP (4-AMINO BUTYRATE
+ TRANSPORT CARRIER) (GAMA-AMINOBUTYRATE PERMEASE)"
+ /protein_id="CAB5248242.1"
+ /translation="MIAIGGVIGAGLFVGSGVVIRATGPAAFLTYALCGALIVLVMRM
+ LGEMAAANPSTGAFADYAAKALGGWAGFSVGWLYWYFWVIVVGFEAVAGGKVLTYWID
+ APLWLASLCLMMMMTATNLVSVSSFGEFEFWFAGVKVATIVGFLVLGTAFAFGLLPGH
+ GMDFSNLSAHGGFFPDGVGAVFAAIVVAIFSMTGTEVVTIAAAEAPDPQRAVQRAMST
+ VVARIVIFFVGSVFLLTVILPWNSLELGASPYVAALRHMGIGGADQIMNAVVLTAVLS
+ CLNSGLYTASRMLFVLAARQEAPAQLVKVNRRGVPTFAIMGSSVVGFLCVIMAWVSPA
+ TVFVFLLNSSGAVILFVYLLIALSQIVLRRQTSGQNLGVRMWLFPGLSIVTVTGIVAV
+ LARMAFDYAARSQLWLSLLSWAVVVGCYLVTTLVRRPLNRPW"
+ gene complement(615476..615871)
+ /locus_tag="BQ2027_MB0536C"
+ CDS complement(615476..615871)
+ /locus_tag="BQ2027_MB0536C"
+ /note="Mb0536c, -, len: 131 aa. Equivalent to Rv0523c,
+ len: 131 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 131 aa overlap). Conserved
+ hypothetical protein, showing some similarity to M.
+ tuberculosis proteins Rv1598c|MTCY336.06; and
+ Rv1871c|MTCY336_06|O06592 (136 aa), FASTA scores: opt:
+ 197, E(): 5e-08, (38.4% identity in 99 aa overlap).
+ Protein product from Mb0536c detected using shotgun mass
+ spectrometry. Mb0536c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248243.1"
+ /translation="MQLPQWLARFNRYVTNPIQRLWAGWLPAFAILEHVGRRSGKPYR
+ TPLNVFSADVDGRAGVAILLTYGPNRDWLKNITAAGGGRMRRYGKTFGVANPRRLTKA
+ EAAPYVSSRWRPVFARLPFDEAVLLTKAD"
+ gene 615985..617373
+ /gene="hemL"
+ /locus_tag="BQ2027_MB0537"
+ CDS 615985..617373
+ /gene="hemL"
+ /locus_tag="BQ2027_MB0537"
+ /note="Mb0537, hemL, len: 462 aa. Equivalent to Rv0524,
+ len: 462 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 462 aa overlap). Probable hemL,
+ glutamate-1-semialdehyde 2,1-aminomutase (EC 5.4.3.8),
+ equivalent to P46716|GSA_MYCLE GLUTAMATE-1-SEMIALDEHYDE
+ 2,1-AMINOMUTASE from Mycobacterium leprae (446 aa), FASTA
+ scores: opt: 1532, E(): 0, (82.6% identity in 460 aa
+ overlap). Also highly similar to others e.g.
+ Q9F2S0|GSA_STRCO from Streptomyces coelicolor (438 aa);
+ Q06774|GSA_PROFR from Propionibacterium freudenreichii
+ (441 aa); etc. Contains PS00600 Aminotransferases
+ class-III pyridoxal-phosphate attachment site. BELONGS TO
+ CLASS-III OF PYRIDOXAL-PHOSPHATE-DEPENDENT
+ AMINOTRANSFERASES. COFACTOR: PYRIDOXAL PHOSPHATE. Protein
+ product from Mb0537 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0537 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUTAMATE-1-SEMIALDEHYDE
+ 2,1-AMINOMUTASE HEML (GSA) (GLUTAMATE-1-SEMIALDEHYDE
+ AMINOTRANSFERASE) (GSA-AT)"
+ /protein_id="CAB5248244.1"
+ /translation="MGSTEQATSRVRGAARTSAQLFEAACSVIPGGVNSPVRAFTAVG
+ GTPRFITEAHGCWLIDADGNRYVDLVCSWGPMILGHAHPAVVEAVAKAAARGLSFGAP
+ TPAETQLAGEIIGRVAPVERIRLVNSGTEATMSAVRLARGFTGRAKIVKFSGCYHGHV
+ DALLADAGSGVATLGLCDDPQRPASPRSQSSRGLPSSPGVTGAAAADTIVLPYNDIDA
+ VQQTFARFGEQIAAVITEASPGNMGVVPPGPGFNAALRAITAEHGALLILDEVMTGFR
+ VSRSGWYGIDPVPADLFAFGKVMSGGMPAAAFGGRAEVMQRLAPLGPVYQAGTLSGNP
+ VAVAAGLATLRAADDAVYTALDANADRLAGLLSEALTDAVVPHQISRAGNMLSVFFGE
+ TPVTDFASARASQTWRYPAFFHAMLDAGVYPPCSAFEAWFVSAALDDAAFGRIANALP
+ AAARAAAQERPA"
+ gene 617373..617981
+ /locus_tag="BQ2027_MB0538"
+ CDS 617373..617981
+ /locus_tag="BQ2027_MB0538"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0538, -, len: 202 aa. Equivalent to Rv0525, len:
+ 202 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 202 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ Q49821|B2168_C3_276|S72912 hypothetical protein from
+ Mycobacterium leprae (202 aa), FASTA scores: opt: 1151,
+ E(): 0, (82.5% identity in 200 aa overlap). Also highly
+ similar to CAC08377.1|AL392176 putative phosphoglycerate
+ mutase from Streptomyces coelicolor (233 aa); and similar
+ to SLL0395|Q55734 hypothetical 23.8 kDa protein from
+ SYNECHOCYSTIS SP. (212 aa), FASTA scores: opt: 207, E():
+ 5.1e-07, (28.2% identity in 195 aa overlap). Also some
+ similarity to Rv2228c|Y019_MYCTU|Q10512|cy427.09
+ hypothetical 39.2 kd protein from Mycobacterium
+ tuberculosis (364 aa), FASTA scores: opt: 236, E():
+ 1.1e-08, (34.3% identity in 198 aa overlap). Protein
+ product from Mb0538 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0538 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Hypothetical, related to broad specificity
+ phosphatases COG0406"
+ /protein_id="CAB5248245.1"
+ /translation="MPEETQVHVVRHGEVHNPTGILYGRLPGFHLSATGAAQAAAVAD
+ ALADRDIVAVIASPLQRAQETAAPIAARHDLAVETDPDLIESANFFEGRRVGPGDGAW
+ RDPRVWWQLRNPFTPSWGEPYVDIAARMTTAVDKARVRGAGHEVVCVSHQLPVWTLRL
+ YLTGKRLWHDPRRRDCALASVTSLIYDGDRLVDVVYSQPAAL"
+ gene 617996..618646
+ /locus_tag="BQ2027_MB0539"
+ CDS 617996..618646
+ /locus_tag="BQ2027_MB0539"
+ /note="Mb0539, -, len: 216 aa. Equivalent to Rv0526, len:
+ 216 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 216 aa overlap). Possible thioredoxin
+ protein (thiol-disulfide interchange protein) (EC
+ 1.-.-.-), equivalent to Q49816|U2168C|S72901 hypothetical
+ protein from Mycobacterium leprae (216 aa), FASTA scores:
+ opt: 1144, E(): 0, (78.5% identity in 214 aa overlap).
+ C-terminus shows some similarity to C-terminus of
+ thioredoxins e.g. RESA_BACSU|P35160 resa protein from
+ Bacillus subtilis (181 aa), FASTA scores: opt: 200, E():
+ 7.4e-06, (24.2% identity in 132 aa overlap); etc. Also
+ similar to Mycobacterium tuberculosis thioredoxin-like
+ proteins Rv1470, Rv1471, Rv1677, etc. Contains PS00194
+ Thioredoxin family active site. SEEMS TO BELONG TO THE
+ THIOREDOXIN FAMILY. Protein product from Mb0539 detected
+ using SWATH mass spectrometry. Mb0539 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE THIOREDOXIN PROTEIN (THIOL-DISULFIDE
+ INTERCHANGE PROTEIN)"
+ /protein_id="CAB5248246.1"
+ /translation="MQSRATRRSGALTMRRLVIAAAVSALLLTGCSGRDAVAQGGTFE
+ FVSPGGKTDIFYDPPASRGRPGPLSGPELADPARSVSLDDFPGQVVVVNVWGQWCGPC
+ RAEVSQLQRVYDATRGAGVSFLGIDVRDNNRQAPQDFINDRHVTYPSIYDPAMRTLIA
+ FGGKYPTSVIPSTLVLDRQHRVAAVFLRELLAADLQPVVERVAEEEPSGRAPVGAQ"
+ gene 618643..619422
+ /gene="ccdA"
+ /locus_tag="BQ2027_MB0540"
+ CDS 618643..619422
+ /gene="ccdA"
+ /locus_tag="BQ2027_MB0540"
+ /note="Mb0540, ccdA, len: 259 aa. Equivalent to Rv0527,
+ len: 259 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 259 aa overlap). Possible ccdA,
+ cytochrome C-type biogenesis protein, integral membrane
+ protein, equivalent to Q49810|B2168_C1_192|S72890
+ hypothetical protein from Mycobacterium leprae (262 aa),
+ FASTA scores: opt: 1341, E(): 0, (79.0% identity in 262 aa
+ overlap). Also highly similar to others e.g. CAC08380.1
+ (253 aa); CCDA_BACSU|P45706 cytochrome C-type biogenesis
+ protein from Bacillus subtilis (235 aa), FASTA scores:
+ opt: 307, E(): 7.4e-13, (30.4% identity in 237 aa
+ overlap); etc. SEEMS TO BELONG TO THE DSBD SUBFAMILY. Note
+ that previously known as ccsA. Mb0540 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CYTOCHROME C-TYPE BIOGENESIS PROTEIN
+ CCDA"
+ /protein_id="CAB5248247.1"
+ /translation="MTGFTEIAAVGPLLVAVGVCLLAGLVSFASPCVVPLVPGYLSYL
+ AAVVGVDEQLPAGVVKPPVAARWRVAGSAALFVAGFTTVFVLGTVAVLGMTTTLITNQ
+ LLLQRVGGVLIVVMGLVFVGFIGALQRQARFTPRQLTSVAGAPVLGAVFALGWTPCLG
+ PTLTGVITVASATEGASVARGIVLVIAYCLGLGIPFVLLAFGSAWAVAGLGWLRRHTR
+ AIQIFGGALLIAVGAALVTGVWNDVVSWLRDAFVSDVRLPI"
+ gene 619455..621044
+ /locus_tag="BQ2027_MB0541"
+ CDS 619455..621044
+ /locus_tag="BQ2027_MB0541"
+ /note="Mb0541, -, len: 529 aa. Equivalent to Rv0528, len:
+ 529 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 529 aa overlap). Probable conserved
+ transmembrane protein, equivalent (shorter 14 aa in
+ N-terminus) to CAC31926.1|AL583925 conserved membrane
+ protein from Mycobacterium leprae (542 aa). Also highly
+ similar to Q49817|B2168_C2_237|S72902 hypothetical protein
+ from Mycobacterium leprae (364 aa), FASTA scores: opt:
+ 1846, E(): 0, (81.1% identity in 338 aa overlap); and
+ Q49811|B2168_C1_194|S72891 hypothetical protein from
+ Mycobacterium leprae (106 aa), FASTA scores: opt: 506,
+ E(): 3.8e-26, (73.6% identity in 106 aa overlap). Also
+ highly similar to CAC08381.1|AL392176 putative integral
+ membrane protein from Streptomyces coelicolor (574 aa).
+ Protein product from Mb0541 detected using SWATH mass
+ spectrometry. Mb0541 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248248.1"
+ /translation="MWRSLTSMGTALVLLFLLALAAIPGALLPQRGLNAAKVDDYLAA
+ HPLIGPWLDELQAFDVFSSFWFTAIYVLLFVSLVGCLAPRTIEHARSLRATPVAAPRN
+ LARLPKHAHARLAGEPAALAATITGRLRGWRSITRQQGDSVEVSAEKGYLREFGNLVF
+ HFALLGLLVAVAVGKLFGYEGNVIVIADGGPGFCSASPAAFDSFRAGNTVDGTSLHPI
+ CVRVNNFQAHYLPSGQATSFAADIDYQADPATADLIANSWRPYRLQVNHPLRVGGDRV
+ YLQGHGYAPTFTVTFPDGQTRTSTVQWRPDNPQTLLSAGVVRIDPPAGSYPNPDERRK
+ HQIAIQGLLAPTEQLDGTLLSSRFPALNAPAVAIDIYRGDTGLDSGRPQSLFTLDHRL
+ IEQGRLVKEKRVNLRAGQQVRIDQGPAAGTVVRFDGAVPFVNLQVSHDPGQSWVLVFA
+ ITMMAGLLVSLLVRRRRVWARITPTTAGTVNVELGGLTRTDNSGWGAEFERLTGRLLA
+ GFEARSPDMAEAAAGTGRDVD"
+ gene 621041..622015
+ /gene="ccsA"
+ /locus_tag="BQ2027_MB0542"
+ CDS 621041..622015
+ /gene="ccsA"
+ /locus_tag="BQ2027_MB0542"
+ /note="Mb0542, ccsA, len: 324 aa. Equivalent to Rv0529,
+ len: 324 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 324 aa overlap). Possible ccsA,
+ cytochrome C-type biogenesis protein, integral membrane
+ protein, equivalent to NP_302558.1|NC_002677|B2168_C3_281
+ possible cytochrome C biogenesis protein from
+ Mycobacterium leprae (327 aa), FASTA scores: opt: 1779,
+ E(): 0, (82.9% identity in 327 aa overlap). Also highly
+ similar to others e.g. CAC08382.1|AL392176 putative
+ cytochrome biogenesis related protein from Streptomyces
+ coelicolor (380 aa); CCSA_CHLRE|P48269 probable cytochrome
+ c biogenesis protein from Chlamydomonas reinhardtii (353
+ aa), FASTA scores: opt: 449, E(): 1.3e-23, (34.4% identity
+ in 247 aa overlap); etc. BELONGS TO THE
+ CCMF/CYCK/CCL1/NRFE/CCSA FAMILY. Note that previously
+ known as ccsB. Protein product from Mb0542 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0542 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CYTOCHROME C-TYPE BIOGENESIS PROTEIN
+ CCSA"
+ /protein_id="CAB5248249.1"
+ /translation="MNTLHVNVGLARYSDWAFTSAVVALVVALLLLAFEFAQVRGRGL
+ APLAVPAGSVATDSATPGIVADQRHRPFDERVGRGGLAVAYLGIGLLLACVVLRGLAT
+ QRVPWGNMYEFINLTCLSGLIAGAVVLRRARYRPLWVFLLVPVLILLTVSGRWLYANA
+ APVMPALQSYWLPIHVSVVSLGSGVFLVAGVASILFLVRTSRLGEPTGEGALAGMVRR
+ LPDAQTLDGIAYRTTIFAFPVFGFGVIFGAIWAEEAWGRYWGWDPKETVSFVAWVVYA
+ AYLHARSTAGWRDRKAAWINVAGFVAMVFNLFFVNLVTVGLHSYAGVG"
+ gene 622057..623274
+ /locus_tag="BQ2027_MB0543"
+ CDS 622057..623274
+ /locus_tag="BQ2027_MB0543"
+ /note="Mb0543, -, len: 405 aa. Equivalent to Rv0530, len:
+ 405 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 405 aa overlap). Conserved
+ hypothetical protein, similar in part to other
+ hypothetical proteins e.g. AL031231|SC3C3_3|CAA20252.1
+ from Streptomyces coelicolor (1083 aa), FASTA scores: opt:
+ 870, E(): 0, (39.5% identity in 443 aa overlap); etc. Also
+ similar to Mycobacterium tuberculosis proteins e.g.
+ Rv3868, Rv0282, Rv1798, etc. Protein product from Mb0543
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0543 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ATPases involved in chromosome partitioning"
+ /protein_id="CAB5248250.1"
+ /translation="MLVTEHPRTGVGAPDSGNGGTDHPTVQLPPVPSVGAPPAAAGGE
+ TPTRSVAGFRTQRLDPTAYGAYYSGPDEGPASPAERPPYRLEPVPHTPYPELATTTLL
+ RPVKPPPSEGWRRLLYLLSGRLINAGEGPRAAHLNDLVAQVNRPLRGCYRIAVLSLKG
+ GVGKTTITATLGATFADLRGDRVVAVDANPDRGTLSQKVPLETPATVRHLLRDADGIE
+ RYSDVRGYTSKGPSGLEVLASDSDPASSDAFSADDYTRTLDILERFYGLVLTDCGTGL
+ LHSAMSAVLPRSDVLVVVSSGSIDGARSAAATLDWLQAHGHDDQVRNSIAVVNAVRPR
+ AGKVDVGKVVEHFSRRCRAVRVVPFDPHLEEGAEIALDRLRRETREALTELAAVVAAG
+ FPGDPRRCKPSFT"
+ gene complement(623271..623432)
+ /locus_tag="BQ2027_MB0543A"
+ CDS complement(623271..623432)
+ /locus_tag="BQ2027_MB0543A"
+ /note="Mb0543A, len: 53 aa. Equivalent to Rv0530A len: 53
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 53 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Conserved protein.
+ Mb0543A found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Conserved protein"
+ /protein_id="CAB5248251.1"
+ /translation="MLYLLLVLILATLIYLGWRAARAQMNRPKTRVIGPDDDPEFLRR
+ LGHGDNNRS"
+ gene 623479..623796
+ /locus_tag="BQ2027_MB0544"
+ CDS 623479..623796
+ /locus_tag="BQ2027_MB0544"
+ /note="Mb0544, -, len: 105 aa. Equivalent to Rv0531, len:
+ 105 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 105 aa overlap). Possible conserved
+ membrane protein, highly similar to
+ Y13803|MLB1306_1|CAA74131.1 hypothetical protein from
+ Mycobacterium leprae (86 aa), FASTA scores: E(): 2.1e-24,
+ (74.4% identity in 86 aa overlap); and
+ NP_302557.1|NC_002677 putative membrane protein from
+ Mycobacterium leprae (111 aa). Protein product from Mb0544
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0544 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5248252.1"
+ /translation="MSEAPNDKTTRGVVDILVYATARLLLVVAVSAAIFGVARLIGLT
+ EFPVVVATLFGLIIAMPLGIWVFSPLRRRATAALAVAGERRRAERERLRARLRGESLP
+ EEQ"
+ gene 623943..625688
+ /gene="PE_PGRS6a"
+ /locus_tag="BQ2027_MB0545"
+ CDS 623943..625688
+ /gene="PE_PGRS6a"
+ /locus_tag="BQ2027_MB0545"
+ /note="Mb0545, PE_PGRS6a, len: 581 aa. Equivalent to 5'
+ end of Rv0532, len: 594 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (92.7% identity in 564 aa
+ overlap). Member of the Mycobacterium tuberculosis PE
+ family, PGRS subfamily of gly-rich proteins, similar to
+ others e.g. Y0DP_MYCTU|Q50615 from Mycobacterium
+ tuberculosis (498 aa), FASTA scores: opt: 1703, E(): 0,
+ (58.2% identity in 536 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PE_PGRS6 exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a single
+ base insertion (*-t) splits PE_PGRS6 into 2 parts,
+ PE_PGRS6a and PE_PGRS6b, resulting in PE_PGRS6a having a
+ different COOH part. There is also a 84 bp and a 9 bp
+ (*-cggggccgg) insertion in PE_PGRS6a."
+ /codon_start=1
+ /transl_table=11
+ /product="PE-PGRS FAMILY PROTEIN [FIRST PART]"
+ /protein_id="CAB5248253.1"
+ /translation="MSNLLVTPELVAAAAADLAGIGSAIGAANAAAGAPTMALLAAGA
+ DEVSAAVAAVFSSYAQQYQALSAAAAAFHDQFVRALAAGAGAYAGAEAANVEQQLLNA
+ INAPTLALLGRPLIGNGADGAAGTGQAGGAGGLLYGNGGNGGSGAAGQAGGAGGAAGL
+ IGHGGTGGVGGTGAAGGAGGTGGWLFGNGGAGGTGGAVTGVSTTGGPGGHGGDAGLYG
+ FGGAGGAGGFGQSGAAGGAGGAGGAGGWLYGDGGDGGAGGNGGNESGTGVSGVGGVGG
+ AGGAGGLLFGNGGDGGVGGDGGDGSSTQDSGGDGGAGGAGGAGGWLLGNGGAGGAGGA
+ ASIKVATGGLGGDGGDAGLFGFGGDGGWGGRGVDARFGAAGGAAGAGGAGGWLYGDGG
+ AGGVGGVGGAVFSLSSGDGGAGGAGGGGGWLFGNGGDGGAGGGGGGRFGSGSGAGGDG
+ AVGGAGGAGAWFGNGGAGGVGGGGGRGTTAIGGDGGAGGAGGAGGWLYGDGGAGGAGG
+ GGGRGGTGNDGGDGGDGGRGGDAQLLGNGGDGGAGGAGGPAGFGASPGAGAAGGGGGA
+ GGSLFGSPGTTGPHG"
+ gene 625594..625821
+ /gene="PE_PGRS6b"
+ /locus_tag="BQ2027_MB0546"
+ CDS 625594..625821
+ /gene="PE_PGRS6b"
+ /locus_tag="BQ2027_MB0546"
+ /note="Mb0546, PE_PGRS6b, len: 75 aa. Equivalent to 3' end
+ of Rv0532, len: 594 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 75 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, similar to others e.g.
+ Y0DP_MYCTU|Q50615 from Mycobacterium tuberculosis (498
+ aa), FASTA scores: opt: 1703, E(): 0, (58.2% identity in
+ 536 aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, PE_PGRS6 exists
+ as a single gene. In Mycobacterium bovis, a frameshift due
+ to a single base insertion (*-t) splits PE_PGRS6 into 2
+ parts, PE_PGRS6a and PE_PGRS6b."
+ /codon_start=1
+ /transl_table=11
+ /product="PE-PGRS FAMILY PROTEIN [SECOND PART]"
+ /protein_id="CAB5248254.1"
+ /translation="MALPPGPARPAGAAVPAVRCSAAPARPARTADPWLAPIFARSTL
+ RHSHHLGGIAQTGAVADQQGQIAGLGRAGRQ"
+ gene complement(625717..626724)
+ /gene="fabH"
+ /locus_tag="BQ2027_MB0547C"
+ CDS complement(625717..626724)
+ /gene="fabH"
+ /locus_tag="BQ2027_MB0547C"
+ /standard_name="mtFabH"
+ /note="Mb0547c, fabH, len: 335 aa. Equivalent to Rv0533c,
+ len: 335 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 335 aa overlap). fabH (alternate gene
+ name: mtFabH), 3-oxoacyl-[acyl-carrier protein] synthase
+ III (EC 2.3.1.41) (see citations below), highly similar to
+ others e.g. Q54206|FABH from STREPTOMYCES GLAUCESCENS (333
+ aa), FASTA scores: opt: 1109, E(): 0, (51.4% identity in
+ 333 aa overlap); FABH_ECOLI|P24249
+ 3-oxoacyl-[acyl-carrier-protein] synthase III (317 aa),
+ FASTA scores: opt: 666, E(): 0, (37.1% identity in 318 aa
+ overlap); etc. BELONGS TO THE FABH FAMILY. Note that
+ previously known as fabH. Protein product from Mb0547c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0547c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="3-OXOACYL-[ACYL-CARRIER-PROTEIN] SYNTHASE III
+ FABH (BETA-KETOACYL-ACP SYNTHASE III) (KAS III)"
+ /protein_id="CAB5248255.1"
+ /translation="MTEIATTSGARSVGLLSVGAYRPERVVTNDEICQHIDSSDEWIY
+ TRTGIKTRRFAADDESAASMATEACRRALSNAGLSAADIDGVIVTTNTHFLQTPPAAP
+ MVAASLGAKGILGFDLSAGCAGFGYALGAAADMIRGGGAATMLVVGTEKLSPTIDMYD
+ RGNCFIFADGAAAVVVGETPFQGIGPTVAGSDGEQADAIRQDIDWITFAQNPSGPRPF
+ VRLEGPAVFRWAAFKMGDVGRRAMDAAGVRPDQIDVFVPHQANSRINELLVKNLQLRP
+ DAVVANDIEHTGNTSAASIPLAMAELLTTGAAKPGDLALLIGYGAGLSYAAQVVRMPK
+ G"
+ gene complement(626806..627684)
+ /gene="menA"
+ /locus_tag="BQ2027_MB0548C"
+ CDS complement(626806..627684)
+ /gene="menA"
+ /locus_tag="BQ2027_MB0548C"
+ /note="Mb0548c, menA, len: 292 aa. Equivalent to Rv0534c,
+ len: 292 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 292 aa overlap). Probable menA,
+ 1,4-dihydroxy-2-naphthoate octaprenyltransferase (EC
+ 2.5.1.-), integral membrane protein, equivalent to
+ Y13803|MLB1306_2|NP_302556.1 probable
+ 4-dihydroxy-2-naphthoate octaprenyltransferase from
+ Mycobacterium leprae (294 aa), FASTA scores: opt: 1509,
+ E(): 0, (80.2% identity in 288 aa overlap). Also highly
+ similar to others e.g. MENA_ECOLI|P32166|B3930 from
+ Escherichia coli (308 aa), FASTA scores: opt: 495, E():
+ 2.9e-25, (36.3 identity in 289 aa overlap); etc. BELONGS
+ TO THE MENA FAMILY. Mb0548c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="1,4-DIHYDROXY-2-NAPHTHOATE OCTAPRENYLTRANSFERASE
+ MENA (DHNA-OCTAPRENYLTRANSFERASE)"
+ /protein_id="CAB5248256.1"
+ /translation="MASFAQWVSGARPRTLPNAIAPVVAGTGAAAWLHAAVWWKALLA
+ LAVAVALVIGVNYANDYSDGIRGTDDDRVGPVRLVGSRLATPRSVLTAAMTSLALGAL
+ AGLVLALLSAPWLIAVGAICIAGAWLYTGGSKPYGYAGFGELAVFVFFGPVAVLGTQY
+ TQALRVDWVGLAQAVATGALSCSVLVANNLRDIPTDARADKITLAVRLGDARTRMLYQ
+ GLLAVAGVLTFVLMLATPWCVVGLVAAPLALRAAGPVRSGRGGRELIPVLRDTGLAML
+ VWALAVAGALAFGQLS"
+ gene 627701..628495
+ /gene="pnp"
+ /locus_tag="BQ2027_MB0549"
+ CDS 627701..628495
+ /gene="pnp"
+ /locus_tag="BQ2027_MB0549"
+ /note="Mb0549, pnp, len: 264 aa. Equivalent to Rv0535,
+ len: 264 aa, from Mycobacterium tuberculosis strain H37R,
+ (100.0% identity in 264 aa overlap). Probable pnp,
+ 5'-methylthioadenosine phosphorylase (EC 2.4.2.28), highly
+ similar to others e.g. CAB90972.1|AL355832 putative
+ methylthioadenosine phosphorylase from Streptomyces
+ coelicolor (280 aa); etc. Also similar to Rv3307|deoD
+ PROBABLE PURINE NUCLEOSIDE PHOSPHORYLASE (EC 2.4.2.1) from
+ Mycobacterium tuberculosis (268 aa). BELONGS TO THE
+ PNP/MTAP FAMILY 2 OF PHOSPHORYLASES. Gene name could be
+ inappropriate. Protein product from Mb0549 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0549 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 5'-METHYLTHIOADENOSINE PHOSPHORYLASE
+ PNP (MTA PHOSPHORYLASE)"
+ /protein_id="CAB5248257.1"
+ /translation="MHNNGRMLGVIGGSGFYTFFGSDTRTVNSDTPYGQPSAPITIGT
+ IGVHDVAFLPRHGAHHQYSAHAVPYRANMWALRALGVRRVFGPCAVGSLDPELEPGAV
+ VVPDQLVDRTSGRADTYFDFGGVHAAFADPYCPTLRAAVTGLPGVVDGGTMVVIQGPR
+ FSTRAESQWFAAAGCNLVNMTGYPEAVLARELELCYAAIALVTDVDAGVAAGDGVKAA
+ DVFAAFGENIELLKRLVRAAIDRVADERTCTHCQHHAGVPLPFELP"
+ gene 628492..629532
+ /gene="galE3"
+ /locus_tag="BQ2027_MB0550"
+ CDS 628492..629532
+ /gene="galE3"
+ /locus_tag="BQ2027_MB0550"
+ /note="Mb0550, galE3, len: 346 aa. Equivalent to Rv0536,
+ len: 346 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 346 aa overlap). Possible galE3,
+ UDP-glucose 4-epimerase (EC 5.1.3.2), highly similar to
+ CAB76986.1|AL159178 putative epimerase from Streptomyces
+ coelicolor (334 aa); and similar to other epimerases e.g.
+ NP_436775.1|NC_003078 putative NDP-glucose
+ dehydrataseepimerase protein from Sinorhizobium meliloti
+ (368 aa); AF143772|AF143772_7 GepiA from Mycobacterium
+ avium strain 2151 (353 aa), FASTA scores: opt: 577, E():
+ 3.9e-29, (36.6% identity in 352 aa overlap);
+ GALE_METJA|Q57664 putative UDP-glucose 4-epimerase (305
+ aa), FASTA scores: opt: 300, E(): 1.6e-12, (30.9% identity
+ in 343 aa overlap); etc. Also similar to Mycobacterium
+ tuberculosis proteins e.g. Rv3634c, Rv3784, etc. SEEMS TO
+ BELONG TO THE SUGAR EPIMERASE FAMILY. Note that previously
+ known as galE2. Protein product from Mb0550 detected using
+ SWATH mass spectrometry. Mb0550 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE UDP-GLUCOSE 4-EPIMERASE GALE3
+ (GALACTOWALDENASE) (UDP-GALACTOSE 4-EPIMERASE) (URIDINE
+ DIPHOSPHATE GALACTOSE 4-EPIMERASE) (URIDINE
+ DIPHOSPHO-GALACTOSE 4-EPIMERASE)"
+ /protein_id="CAB5248258.1"
+ /translation="MRVLLTGAAGFIGSRVDAALRAAGHDVVGVDALLPAAHGPNPVL
+ PPGCQRVDVRDASALAPLLAGVDLVCHQAAMVGAGVNAADAPAYGGHNDFATTVLLAQ
+ MFAAGVRRLVLASSMVVYGQGRYDCPQHGPVDPLPRRRADLDNGVFEHRCPGCGEPVI
+ WQLVDEDAPLRPRSLYAASKTAQEHYALAWSEASGGSVVALRYHNVYGPGMPRDTPYS
+ GVAAIFRSAVEKGKPPKVFEDGGQMRDFVHVDDVAAANLAAVHLGEADRDGFTAVNVC
+ SGRPISILQVATAICDARGGSMSPAITGHYRSGDVRHIVADPARAARVLGFRAAVDPG
+ EGLREFAFAPLR"
+ gene complement(629542..630975)
+ /locus_tag="BQ2027_MB0551C"
+ CDS complement(629542..630975)
+ /locus_tag="BQ2027_MB0551C"
+ /note="Mb0551c, -, len: 477 aa. Equivalent to Rv0537c,
+ len: 477 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 477 aa overlap). Probable integral
+ membrane protein, showing weak similarity to
+ YDNK_STRCO|P40180 hypothetical 41.2 kd protein from
+ Streptomyces coelicolor (411 aa), FASTA scores: opt: 122,
+ E(): 0.85, (28.2% identity in 373 aa overlap). Protein
+ product from Mb0551c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0551c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5248259.1"
+ /translation="MGLSSDDTRRREVVRDLAAGALLIGALFFPWNLYFGFRIPDSSK
+ TVFGLLLAVTSLSLASLAVTFAGRRSQLRLGLNVPYLLLVLAFVVFDAIQTIRLGGTV
+ HVPGGVGPGGWLGITGALLSAQPALTGATTDEGSHSRWLRATQFLGYASMLGAALSTG
+ FNLSWRVRYALEPAAGASGFGKQNLAVIDTAVVYGVVALAAVLVASRWLLRPTAAEAL
+ STVALGGSTLIAGSIVWSLPIGREIDAFHGIAQNTSTAGVGYEGYLVWAAAAAMCAPL
+ TLFRSPNAPPIDKTVWRAASRNGLLLIAVWCLGSVAMRLTDLVVAVLLNYPFSRYDSM
+ ALAAFDLATAVLAIWLRFNMATEALPARLISSLCGLLCTFTVSRVIVGVVLAPRFQAS
+ SGGSAHPVYGNDLAQQITSTFDVVLCGLALSILAAAIVIGRLRQLPQPPHTPALSRPA
+ GSPRIFRSAGSTHPVRPKIYRPPDHSS"
+ gene 631284..632930
+ /locus_tag="BQ2027_MB0552"
+ CDS 631284..632930
+ /locus_tag="BQ2027_MB0552"
+ /note="Mb0552, -, len: 548 aa. Equivalent to Rv0538, len:
+ 548 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 548 aa overlap). Possible conserved
+ membrane protein. Middle region highly similar to
+ AAB63811.1|AF009829|MBE4863a|O32850 unknown protein from
+ Mycobacterium bovis (295 aa) possible transmembrane
+ protein with a repetitive proline, threonine-rich region
+ at C-terminus. Protein product from Mb0552 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0552 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="CAB5248260.1"
+ /translation="MDVALGVAVTDRVARLALVDSAAPGTVIDQFVLDVAEHPVEVLT
+ ETVVGTDRSLAGENHRLVATRLCWPDQAKADELQHALQDSGVHDVAVISEAQAATALV
+ GAAHAGSAVLLVGDETATLSVVGDPDAPPTMVAVAPVAGADATSTVDTLMARLGDQAL
+ APGDVFLVGRSAEHTTVLADQLRAASTMRVQTPDDPTFALARGAAMAAGAATMAHPAL
+ VADATTSLPPAEAGQSGSEGEQLAYSQASDYELLPVDEYEEHDEYGAAADRSAPLSRR
+ SLLIGNAVVAFAVIGFASLAVAVAVTIRPTAASKPVEGHQNAQPGKFMPLLPTQQQAP
+ VPPPPPDDPTAGFQGGTIPAVQNVVPRPGTSPGVGGTPASPAPEAPAVPGVVPAPVPI
+ PVPIIIPPFPGWQPGMPTIPTAPPTTPVTTSATTPPTTPPTTPVTTPPTTPPTTPVTT
+ PPTTPPTTPVTTPPTTVAPTTVAPTTVAPTTVAPTTVAPATATPTTVAPQPTQQPTQQ
+ PTQQMPTQQQTVAPQTVAPAPQPPSGGRNGSGGGDLFGGF"
+ gene 632987..633619
+ /locus_tag="BQ2027_MB0553"
+ CDS 632987..633619
+ /locus_tag="BQ2027_MB0553"
+ /note="Mb0553, -, len: 210 aa. Equivalent to Rv0539, len:
+ 210 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 210 aa overlap). Probable
+ dolichol-P-sugar synthase (EC 2.4.1.-), highly similar to
+ CAB76989.1|AL159178 putative glycosyltransferase from
+ Streptomyces coelicolor (242 aa), and similar to various
+ dolichol-P-sugar synthetases and sugar transferases e.g.
+ NP_126257.1|NC_000868 DOLICHYL-PHOSPHATE MANNOSE SYNTHASE
+ RELATED PROTEIN from Pyrococcus abyssi (211 aa);
+ N-terminus of NP_127133.1|NC_000868 DOLICHOL-P-GLUCOSE
+ SYNTHETASE from Pyrococcus abyssi (378 aa); N-terminus of
+ NP_068880.1|NC_000917 putative dolichol-P-glucose
+ synthetase from Archaeoglobus fulgidus (369 aa), FASTA
+ scores: E(): 2.4e-13, (32. 1% identity in 193 aa overlap);
+ Q26732 DOLICHYL-PHOSPHATE-MANNOSE SYNTHASE PRECURSOR from
+ TRYPANOSOMA BRUCEI (267 aa), FASTA scores: opt: 179, E():
+ 0.0011, (30.7% identity in 205 aa overlap); etc. Also
+ similar to Rv2051c|MTY25D10_18 from Mycobacterium
+ tuberculosis. Contains S00017 ATP/GTP-binding site motif A
+ (P-loop). Protein product from Mb0553 detected using SWATH
+ mass spectrometry. Mb0553 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DOLICHYL-PHOSPHATE SUGAR SYNTHASE
+ (DOLICHOL-PHOSPHATE SUGAR SYNTHETASE) (DOLICHOL-PHOSPHATE
+ SUGAR TRANSFERASE) (SUGAR PHOSPHORYLDOLICHOL SYNTHASE)"
+ /protein_id="CAB5248261.1"
+ /translation="MLPCLNEEESLPAVLAAIPAGYRALVVDNNSTDDTATVAARHGA
+ QVVVEPRPGYGSAVHAGVLAATTPIVAVIDADGSMDAGDLPKLVAELDKGADLVTGRR
+ RPVAGLHWPWVARVGTVVMSWRLRTRHRLPVHDIAPMRVARREALLDLGVVDRRSGYP
+ LELLVRAAAAGWRVVELDVSYGPRTGGKSKVSGSLRGSIIAILDFWKVIS"
+ gene 633616..634278
+ /locus_tag="BQ2027_MB0554"
+ CDS 633616..634278
+ /locus_tag="BQ2027_MB0554"
+ /note="Mb0554, -, len: 220 aa. Equivalent to Rv0540, len:
+ 220 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 220 aa overlap). Conserved
+ hypothetical protein, similar to hypothetical proteins
+ from Streptomyces coelicolor: CAB76990.1|AL159178 (213
+ aa); N-terminus of BAA84086.1|AB032065 (446 aa); and
+ CAB61872.1|AL133252|SCE46_21 (210 aa), FASTA scores: opt:
+ 267, E(): 5.3e-10, (32.7% identity in 202 aa overlap).
+ Also some similarity with D90913_63|PCC6803 from Synecho
+ cystis sp (211 aa), FASTA scores: opt: 189, E(): 4.7e-06,
+ (25.3 identity in 194 aa overlap). Protein product from
+ Mb0554 detected using shotgun mass spectrometry. Mb0554
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="cell wall biogenesis"
+ /protein_id="CAB5248262.1"
+ /translation="MSCLPVSVLVVAKAPEPGRVKTRLAAAIGDKVAADIAAAALLDT
+ LDAVAAAPVTARAVALTGDLDSAADSAEIRRRLKSFTVFRQRGDAFADRLANAHVDAA
+ DGYPVLQIGMDTPQVTAELLADCARLLLQIPAVLGLAFDGGWWVLGIRTPTAAECLRA
+ VPMSQPDTGELTLKALRDNGIDVTLVQRLGDFDIVDDIALVRDCCAPGSRFAQATRAA
+ GL"
+ gene complement(634299..635648)
+ /locus_tag="BQ2027_MB0555C"
+ CDS complement(634299..635648)
+ /locus_tag="BQ2027_MB0555C"
+ /note="Mb0555c, -, len: 449 aa. Equivalent to Rv0541c,
+ len: 449 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 449 aa overlap). Probable conserved
+ integral membrane protein, highly similar (except first 40
+ residues) to CAB76994.1|AL159178 putative integral
+ membrane protein from Streptomyces coelicolor (456 aa).
+ Also some similarity to Q13724|GCS1_HUMAN
+ MANNOSYL-OLIGOSACCHARIDE GLUCOSIDASE (834 aa), FASTA
+ scores: opt: 150, E(): 0.013, (27.1% identity in 339 aa
+ overlap). Contains PS00041 Bacterial regulatory proteins,
+ araC family signature. Mb0555c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5248263.1"
+ /translation="MRIGRREGLAVAIGFVLVGAAFVLPRLNLGIKPRSDIGLERFAT
+ RAGAAPIFGYWDAHVGWGTAPAVLTAVAVVAWGPVVAHRLPWRVLTLSTWATAAAWAF
+ SLAMIDGWQRGFAGRLTTRDEYLWQVPGIADIPATLRTFTSRILDFQPNSWVTHVSGH
+ PPGALLTFVWLDRIGLRGGGWAGLVCLLVGSSAAAAVLIAVRVLASEQMARRTAPFVA
+ VAPTAIWVAVSADGYFAGVAAWGIALLAVAVHGATRFPALVAAGAGLLLGWGVFLNYG
+ LVLIVLPGMAVLAAADWRPVLRALGPAVLAALVVAVSFAVAGFSWFDGYTLVQQRYWQ
+ GIAKDRPFGYWSWANLACVVCAIGLGSVAGLSRVFDRAAISRRSGCHLLLLAVLAAIA
+ LADLSMLSKAETERIWLPFTIWLTAAPALLPPRSHRLWLAVNAAGALLLNSIIFTNW"
+ gene complement(635660..636748)
+ /gene="menE"
+ /locus_tag="BQ2027_MB0556C"
+ CDS complement(635660..636748)
+ /gene="menE"
+ /locus_tag="BQ2027_MB0556C"
+ /note="Mb0556c, menE, len: 362 aa. Equivalent to Rv0542c,
+ len: 362 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 362 aa overlap). Possible menE,
+ O-succinylbenzoic acid-CoA ligase (EC 6.2.1.26), highly
+ similar to Q50170|AAA63145.1|U15187|XCLB 4-Coumarate--CoA
+ ligase from Mycobacterium leprae (352 aa), FASTA scores:
+ opt: 1815, E(): 0, (78.9% identity in 351 aa overlap).
+ Also similar to N-terminus of acid-CoA ligases e.g.
+ NP_471116.1|NC_003212 O-succinylbenzoic acid-CoA ligase
+ from Listeria innocua (469 aa); NP_390957.1|NC_000964
+ O-succinylbenzoic acid-CoA ligase from Bacillus subtilis
+ (486 aa); MENE_HAEIN|P44565 O-succinylbenzoic acid-CoA
+ ligase from Haemophilus influenzae (452 aa), FASTA scores:
+ opt: 307, E(): 4.6e-12, (25.4% identity in 339 aa
+ overlap); etc. Also some similarity with fadD proteins
+ from Mycobacterium tuberculosis. Contains PS00455 Putative
+ AMP-binding domain signature. BELONGS TO THE ATP-DEPENDENT
+ AMP-BINDING ENZYME FAMILY. Protein product from Mb0556c
+ detected using SWATH mass spectrometry. Mb0556c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE O-SUCCINYLBENZOIC ACID--COA LIGASE MENE
+ (OSB-COA SYNTHETASE) (O-SUCCINYLBENZOATE-COA SYNTHASE)"
+ /protein_id="CAB5248264.1"
+ /translation="MLGGSDPALVAVPTQHESLLGALRVGEQIDDDVALVVTTSGTTG
+ PPKGAMLTAAALTASASAAHDRLGGPGSWLLAVPPYHIAGLAVLVRSVIAGSVPVELN
+ VSAGFDVTELPNAIKRLGSGRRYTSLVAAQLAKALTDPAATAALAELDAVLIGGGPAP
+ RPILDAAAAAGITVVRTYGMSETSGGCVYDGVPLDGVRLRVLAGGRIAIGGATLAKGY
+ RNPVSPDPFAEPGWFHTDDLGALESGDSGVLTVLGRADEAISTGGFTVLPQPVEAALG
+ THPAVRDCAVFGLADDRLGQRVVAAIVVGDGCPPPTLEALRAHVARTLDVTAAPRELH
+ VVNVLPRRGIGKVDRAALVRRFAGEADQ"
+ gene complement(636817..637119)
+ /locus_tag="BQ2027_MB0557C"
+ CDS complement(636817..637119)
+ /locus_tag="BQ2027_MB0557C"
+ /note="Mb0557c, -, len: 100 aa. Equivalent to Rv0543c,
+ len: 100 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 100 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ Q50171|MLU15187_32|NP_302469.1|NC_002677 conserved
+ hypothetical protein from Mycobacterium leprae (100 aa),
+ FASTA scores: opt: 493, E(): 6.1e-30, (73.5% identity in
+ 98 aa overlap). Some similarity to Rv3046c|NP_217562.1
+ from Mycobacterium tuberculosis. Protein product from
+ Mb0557c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0557c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248265.1"
+ /translation="MNRFLTSIVAWLRAGYPEGIPPTDSFAVLALLCRRLSHDEVKAV
+ ANELMRLGDFDQIDIGVVITHFTDELPSPEDVERVRARLAAQGWPLDDVRDREEHA"
+ gene complement(637179..637457)
+ /locus_tag="BQ2027_MB0558C"
+ CDS complement(637179..637457)
+ /locus_tag="BQ2027_MB0558C"
+ /note="Mb0558c, -, len: 92 aa. Equivalent to Rv0544c, len:
+ 92 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 92 aa overlap). Possible conserved
+ transmembrane protein, equivalent to NP_302470.1|NC_002677
+ possible membrane protein from Mycobacterium leprae (96
+ aa); and shows some similarity to MLU15187_33|Q50172|U296V
+ from Mycobacterium leprae (36 aa), FASTA scores: opt: 151,
+ E(): 2.1e-05, (71.4% identity in 35 aa overlap). Also some
+ similarity with VATL_NEPNO|Q26250 vacuolar ATP synthase 16
+ kd proteolipid from Nephrops norvegicus (159 aa), FASTA
+ scores: opt: 80, E(): 11, (26.1% identity in 88 aa
+ overlap). Protein product from Mb0558c detected using
+ SWATH mass spectrometry. Mb0558c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248266.1"
+ /translation="MSAWFNYTATLKILIFSLLAGALLPGLFAVGVRLQAAGDGADAT
+ ARRRPLLVAVSWAIFALVLAVVIIGVLYIARDFIAHHTGWAFLGATPK"
+ gene complement(637454..638707)
+ /gene="pitA"
+ /locus_tag="BQ2027_MB0559C"
+ CDS complement(637454..638707)
+ /gene="pitA"
+ /locus_tag="BQ2027_MB0559C"
+ /note="Mb0559c, pitA, len: 417 aa. Equivalent to Rv0545c,
+ len: 417 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 417 aa overlap). Probable pitA,
+ low-affinity inorganic phosphate transporter, integral
+ membrane protein, equivalent to Q50173|NP_302471.1 pitA
+ from Mycobacterium leprae (414 aa), FASTA scores: opt:
+ 2035, E(): 0, (76.3% identity in 418 aa overlap). Also
+ highly similar to others e.g. CAB59461.1|AL132644 putative
+ low-affinity phosphate transport protein from Streptomyces
+ coelicolor (423 aa); PITA_ECOLI|P37308 low-affinity
+ inorganic phosphate transporter from Escherichia coli (499
+ aa), FASTA scores: opt: 304, E(): 6.9e-10, (32.5 %
+ identity in 234 aa overlap); etc. BELONGS TO THE PHO-4
+ FAMILY OF TRANSPORTERS, PIT SUBFAMILY. Mb0559c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LOW-AFFINITY INORGANIC PHOSPHATE
+ TRANSPORTER INTEGRAL MEMBRANE PROTEIN PITA"
+ /protein_id="CAB5248267.1"
+ /translation="MNLQLFLLLIVVVTALAFDFTNGFHDTGNAMATSIASGALAPRV
+ AVALSAVLNLIGAFLSTAVAATIAKGLIDANLVTLELVFAGLVGGIVWNLLTWLLGIP
+ SSSSHALIGGIVGATIAAVGLRGVIWSGVVSKVIVPAVVAALLATLVGAVGTWLVYRT
+ TRGVAEKRTERGFRRGQIGSASLVSLAHGTNDAQKTMGVIFLALMSYGAVSTTASVPP
+ LWVIVSCAVAMAAGTYLGGWRIIRTLGKGLVEIKPPQGMAAESSSAAVILLSAHFGYA
+ LSTTQVATGSVLGSGVGKPGAEVRWGVAGRMVVAWLVTLPLAGLVGAFTYGLVHFIGG
+ YPGAILGFALLWLTATAIWLRSRRAPIDHTNVNADWEGNLTAGLEAGAQPLADQRPPV
+ PAPPAPTPPPNHRAPQFGVTTRNAP"
+ gene complement(638827..639213)
+ /locus_tag="BQ2027_MB0560C"
+ CDS complement(638827..639213)
+ /locus_tag="BQ2027_MB0560C"
+ /note="Mb0560c, -, len: 128 aa. Equivalent to Rv0546c,
+ len: 128 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 128 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ AAA63111.1|U15187|Q50174|U296X hypothetical protein from
+ Mycobacterium leprae (144 aa), FASTA scores: opt: 748,
+ E(): 0, (84.2% identity in 133 aa overlap). Also highly
+ similar to CAB95979.1|AL360034 conserved hypothetical
+ protein from Streptomyces coelicolor (130 aa); and similar
+ to AE000854_8|O26852 S-D-LACTOYLGLUTATHIONE METHYLGLYOXAL
+ LYASE from Methanobacterium thermoautotropto (116 aa),
+ FASTA scores: opt: 155, E(): 0.00019, (30.6% identity in
+ 108 aa overlap); YAER_ECOLI hypothetical 14.7 kd protein
+ from Escherichia coli (129 aa), FASTA scores: opt: 104,
+ E(): 0.42, (28.7% identity in 115 aa overlap). Also
+ similar to Rv2068c from Mycobacterium tuberculosis.
+ Protein product from Mb0560c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0560c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Lactoylglutathione lyase and related lyases"
+ /protein_id="CAB5248268.1"
+ /translation="MEILASRMLLRPADYQRSLSFYRDQIGLAIAREYGAGTVFFAGQ
+ SLLELAGYGEPDHSRGPFPGALWLQVRDLEATQTELVSRGVSIAREPRREPWGLHEMH
+ VTDPDGITLIFVEVPEGHPLRTDTRA"
+ gene complement(639276..640160)
+ /locus_tag="BQ2027_MB0561C"
+ CDS complement(639276..640160)
+ /locus_tag="BQ2027_MB0561C"
+ /note="Mb0561c, -, len: 294 aa. Equivalent to Rv0547c,
+ len: 294 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 294 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), similar to various
+ oxidoreductases e.g. fatty acyl-CoA reductase from
+ Acinetobacter calcoaceticus (295 aa);
+ NP_280196.1|NC_002607 3-oxoacyl-[acyl-carrier-protein]
+ reductase from Halobacterium sp. NRC-1 (255 aa);
+ NP_349214.1|NC_003030 Short-chain alcohol dehydrogenase
+ family protein from Clostridium acetobutylicum (255 aa);
+ etc. Also similar to several proteins from Mycobacterium
+ tuberculosis e.g. Y04M_MYCTU|Q10783 putative
+ oxidoreductase (341 aa), FASTA scores: opt: 644, E(): 0,
+ (46.1% identity in 258 aa overlap). Protein product from
+ Mb0561c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0561c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="CAB5248269.1"
+ /translation="MSKRPLRWLTEQITLAGMRPPISPQLLINRPAMQPVDLTGKRIL
+ LTGASSGIGAAATKQFGLHRAVVVAVARRKDLLDAVADRITGDGGTAMSLPCDLSDME
+ AIDALVEDVEKRIGGIDILINNAGRSIRRPLAESLERWHDVERTMVLNYYAPLRLIRG
+ LAPGMLERGDGHIINVATWGVLSEASPLFSVYNASKAALSAVSRIIETEWGSQGVHST
+ TLYYPLVATPMIAPTKAYDGLPALTAAEAAEWMVTAARTRPVRIAPRVAVAVNALDSI
+ GPRWVNALMQRRNEQLNP"
+ gene complement(640256..641200)
+ /gene="menB"
+ /locus_tag="BQ2027_MB0562C"
+ CDS complement(640256..641200)
+ /gene="menB"
+ /locus_tag="BQ2027_MB0562C"
+ /note="Mb0562c, menB, len: 314 aa. Equivalent to Rv0548c,
+ len: 314 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 314 aa overlap). Probable menB,
+ naphthoate synthase (dihydroxynaphthonic acid synthase)
+ (EC 4.1.3.36), equivalent to NP_302473.1|NC_002677
+ naphthoate synthase from Mycobacterium leprae (300 aa).
+ Also similar to others e.g. MENB_ECOLI|P27290 naphthoate
+ synthase from Escherichia coli (285 aa), FASTA scores:
+ opt: 599, E(): 9.3e-33, (48.1 identity in 285 aa overlap);
+ etc. BELONGS TO THE ENOYL-COA HYDRATASE/ISOMERASE FAMILY.
+ Protein product from Mb0562c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0562c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="naphthoate synthase menb (dihydroxynaphthoic
+ acid synthetase) (dhna synthetase)"
+ /protein_id="CAB5248270.1"
+ /translation="MVAPAGEQGRSSTALSDNPFDAKAWRLVDGFDDLTDITYHRHVD
+ DATVRVAFNRPEVRNAFRPHTVDELYRVLDHARMSPDVGVVLLTGNGPSPKDGGWAFC
+ SGGDQRIRGRSGYQYASGDTADTVDVARAGRLHILEVQRLIRFMPKVVICLVNGWAAG
+ GGHSLHVVCDLTLASREYARFKQTDADVGSFDGGYGSAYLARQVGQKFAREIFFLGRT
+ YTAEQMHQMGAVNAVAEHAELETVGLQWAAEINAKSPQAQRMLKFAFNLLDDGLVGQQ
+ LFAGEATRLAYMTDEAVEGRDAFLQKRPPDWSPFPRYF"
+ gene complement(641472..641579)
+ /gene="vapc3"
+ /locus_tag="BQ2027_MB0563C"
+ CDS complement(641472..641579)
+ /gene="vapc3"
+ /locus_tag="BQ2027_MB0563C"
+ /note="Mb0563c, -, len: 45 aa. Similar to 3' end of
+ Rv0549c, len: 137 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 45 aa overlap).
+ Conserved hypothetical protein, similar to Rv0960, Rv0065,
+ and Rv1720c from Mycobacterium tuberculosis.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0549c exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a single
+ base deletion (t-*), splits Rv0549c into 2 parts, Mb0563c
+ and Mb0564c. Protein product from Mb0563c detected using
+ SWATH mass spectrometry. Mb0563c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN [SECOND PART]"
+ /protein_id="CAB5248271.1"
+ /translation="MTDALYVELAETAGLVLLTTDERLARAWPSAHAIG"
+ gene complement(641576..641884)
+ /gene="vapc3"
+ /locus_tag="BQ2027_MB0564C"
+ CDS complement(641576..641884)
+ /gene="vapc3"
+ /locus_tag="BQ2027_MB0564C"
+ /note="Mb0564c, -, len: 102 aa. Similar to 5' end of
+ Rv0549c, len: 137 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 92 aa overlap).
+ Conserved hypothetical protein, similar to Rv0960, Rv0065,
+ and Rv1720c from Mycobacterium tuberculosis.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0549c exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a single
+ base deletion (t-*), splits Rv0549c into 2 parts, Mb0563c
+ and Mb0564c. Mb0564c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN [FIRST PART]"
+ /protein_id="CAB5248272.1"
+ /translation="MRASPTSPPEQVVVDASAMVDLLARTSDRCSAVRARLARTAMHA
+ PAHFDAEVLSALGRMQRAGALTVAYVDAALEELRQVPVTRHGLSSLLAERGRAATPSA
+ "
+ gene complement(641881..642147)
+ /gene="vapb3"
+ /locus_tag="BQ2027_MB0565C"
+ CDS complement(641881..642147)
+ /gene="vapb3"
+ /locus_tag="BQ2027_MB0565C"
+ /note="Mb0565c, -, len: 88 aa. Equivalent to Rv0550c, len:
+ 88 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 88 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0565c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0565c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb3"
+ /protein_id="CAB5248273.1"
+ /translation="MLSRRTKTIVVCTLVCMARLNVYVPDELAERARARGLNVSALTQ
+ AAISAELENSATDAWLEGLEPRSTGARHDDVLGAIDAARDEFEA"
+ gene complement(642339..644054)
+ /gene="fadD8"
+ /locus_tag="BQ2027_MB0566C"
+ CDS complement(642339..644054)
+ /gene="fadD8"
+ /locus_tag="BQ2027_MB0566C"
+ /note="Mb0566c, fadD8, len: 571 aa. Equivalent to Rv0551c,
+ len: 571 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 571 aa overlap). Probable fadD8,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), similar to many
+ e.g. LCFA_ECOLI|P29212 long-chain-fatty-acid--CoA ligase
+ (561 aa), FASTA scores: opt: 585, E(): 9.5e-30, (28.7%
+ identity in 536 aa overlap); etc. Contains PS00455
+ Putative AMP-binding domain signature. Note other possible
+ start sites exist downstream of this start. Protein
+ product from Mb0566c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0566c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY-ACID-COA LIGASE FADD8
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="CAB5248274.1"
+ /translation="MSTAGDDAVGVPPACGGRSDAVGVPQLARESGAMRDQDCSGELL
+ RSPTHNGHLLVGALKRHQNKPVLFLGDTRLTGGQLADRISQYIQAFEALGAGTGVAVG
+ LLSLNRPEVLMIIGAGQARGYRRTALHPLGSLADHAYVLNDAGISSLIIDPNPMFVER
+ ALALLEQVDSLQQILTIGPVPDALKHVAVDLSAEAAKYQPQPLVAADLPPDQVIGLTY
+ TGGTTGKPKGVIGTAQSIATMTSIQLAEWEWPANPRFLMCTPLSHAGAAFFTPTVIKG
+ GEMIVLAKFDPAEVLRIIEEQRITATMLVPSMLYALLDHPDSHTRDLSSLETVYYGAS
+ AINPVRLAEAIRRFGPIFAQYYGQSEAPMVITYLAKGDHDEKRLTSCGRPTLFARVAL
+ LDEHGKPVKQGEVGEICVSGPLLAGGYWNLPDETSRTFKDGWLHTGDLAREDSDGFYY
+ IVDRVKDMIVTGGFNVFPREVEDVVAEHPAVAQVCVVGAPDEKWGEAVTAVVVLRSNA
+ ARDEPAIEAMTAEIQAAVKQRKGSVQAPKRVVVVDSLPLTGLGKPDKKAVRARFWEGA
+ GRAVG"
+ gene 644132..645736
+ /locus_tag="BQ2027_MB0567"
+ CDS 644132..645736
+ /locus_tag="BQ2027_MB0567"
+ /note="Mb0567, -, len: 534 aa. Equivalent to Rv0552, len:
+ 534 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 534 aa overlap). Conserved
+ hypothetical protein, similar to others from several
+ organisms. Also shows some similarity with regulatory
+ proteins e.g. AEPA_ERWCA|Q06555 exoenzymes regulatory
+ protein aepA [Precursor] from Erwinia carotovora (465 aa),
+ FASTA scores: opt: 278, E(): 7.6e-11, (23.0% identity in
+ 408 aa overlap). Also similar to Z99119|BSUB0016_28 from
+ Bacillus subtilis (529 aa), FASTA scores: opt: 436, E():
+ 8.3e-20, (23.8% identity in 547 aa overlap). C-terminus is
+ similar to MLRRNOPR_1 HYPOTHETICAL 17.7 KD PROTEIN from
+ Mycobacterium leprae (154 aa), FASTA score: (43.1%
+ identity in 160 aa overlap). Protein product from Mb0567
+ detected using SWATH mass spectrometry. Mb0567 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Exoenzymes regulatory protein AepA precursor"
+ /protein_id="CAB5248275.1"
+ /translation="MADADLVMTGTVLTVDDARPTAEAIAVADGRVIAVGDRSEVAGL
+ VGANTRVIDLGAGCVMPGFVEAHGHPLLEAVVLSDRFVDIRPVTMRDADDVVAAIRGE
+ VARRGPAGAYLVGWDPLLQSGLGEPTLTWLDSLAPNGPLVIIHNSGHKAYFNSHAAWL
+ NGLTRDTADPKGAKYGRDGNGELDGTAEEIGAILPLLAGVADPSNFGAMLRAECARLN
+ RAGLTTCSEMAFDPGYRPMVEAVRAELTVRLCTYEISNARMCTDATPGQGDDMLRQVG
+ IKIWVDGSPWVGNIDLTFPYLDTPATRAIGVPPGSRGCANYTREQLAEIVGAYFPRGW
+ QIACHVHGDGGVDTILDVYEEALRRNPRDDHRLRLEHVGAIRPDQLRRAAELGVTCSI
+ FVDQIHYWGDVIVDDLFGAQRGSRWMPAGSAVAAGMRISLHNDPPVTPEEPLRNISVA
+ ATRVAPSGRVLAPEERLTVEQAIRAQTIDAAWQLFAEDAIGSLQVGKYADMVVLSADP
+ RTVPPEQIADLAVRATFLAGRQVYRR"
+ gene 645733..646713
+ /gene="menC"
+ /locus_tag="BQ2027_MB0568"
+ CDS 645733..646713
+ /gene="menC"
+ /locus_tag="BQ2027_MB0568"
+ /note="Mb0568, menC, len: 326 aa. Equivalent to Rv0553,
+ len: 326 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 326 aa overlap). Probable menC,
+ muconate cycloisomerase (EC 5.5.1.1), equivalent to
+ NP_302476.1|NC_002677 putative isomerase/racemase from
+ Mycobacterium leprae (334 aa). Also similar to other
+ muconate cycloisomerases e.g. TCBD_PSESP|P27099
+ chloromuconate cycloisomerase (370 aa), FASTA scores: opt:
+ 249, E(): 7.8e-09, (32.7% identity in 199 aa overlap).
+ Also similar to O-succinylbenzoate-CoA synthases. BELONGS
+ TO THE MANDELATE RACEMASE / MUCONATE LACTONIZING ENZYME
+ FAMILY. Protein product from Mb0568 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0568
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MUCONATE CYCLOISOMERASE MENC
+ (CIS,CIS-MUCONATE LACTONIZING ENZYME) (MLE)"
+ /protein_id="CAB5248276.1"
+ /translation="MIPVLPPLEALLDRLYVVALPMRVRFRGITTREVALIEGPAGWG
+ EFGAFVEYQSAQACAWLASAIETAYCAPPPVRRDRVPINATVPAVAAAQVGEVLARFP
+ GARTAKVKVAEPGQSLADDIERVNAVRELVPMVRVDANGGWGVAEAVAAAAALTADGP
+ LEYLEQPCATVAELAELRRRVDVPIAADESIRKAEDPLAVVRAQAADIAVLKVAPLGG
+ ISALLDIAARIAVPVVVSSALDSAVGIAAGLTAAAALPELDHACGLGTGGLFEEDVAE
+ PAAPVDGFLAVARTTPDPARLQALGAPPQRRQWWIDRVKACYSLLVPSFG"
+ gene 646710..647498
+ /gene="bpoC"
+ /locus_tag="BQ2027_MB0569"
+ CDS 646710..647498
+ /gene="bpoC"
+ /locus_tag="BQ2027_MB0569"
+ /note="Mb0569, bpoC, len: 262 aa. Equivalent to Rv0554,
+ len: 262 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 262 aa overlap). Possible bpoC,
+ peroxidase (non-haem peroxidase) (EC 1.11.1.-), equivalent
+ to NP_302477.1|NC_002677 putative hydrolase from
+ Mycobacterium leprae (265 aa). Also highly similar or
+ similar to various hydrolases and peroxidases e.g.
+ CAB38877.1|AL035707|T36181 probable hydrolase from
+ Streptomyces coelicolor (272 aa); CAC48368.1|Y16952
+ putative hydrolase from Amycolatopsis mediterranei (284
+ aa); P29715|BPA2_STRAU non-haem bromoperoxidase bpo-a2
+ (bromide peroxidase) (EC 1.11.1.-) from Streptomyces
+ aureofaciens (277 aa), FASTA scores: opt: 325, E():
+ 2.3e-15, (29.5% identity in 268 aa overlap);
+ O31168|PRXC_STRAU|CPO|CPOT non-heme chloroperoxidase
+ (chloride peroxidase) (EC 1.11.1.10) from Streptomyces
+ aureofaciens (278 aa); etc. Also similar to M.
+ tuberculosis non-heme haloperoxidases and epoxide
+ hydrolases e.g. Rv1938, Rv3617, etc. Protein product from
+ Mb0569 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0569 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PEROXIDASE BPOC (NON-HAEM PEROXIDASE)"
+ /protein_id="CAB5248277.1"
+ /translation="MINLAYDDNGTGDPVVFIAGRGGAGRTWHPHQVPAFLAAGYRCI
+ TFDNRGIGATENAEGFTTQTMVADTAALIETLDIAPARVVGVSMGAFIAQELMVVAPE
+ LVSSAVLMATRGRLDRARQFFNKAEAELYDSGVQLPPTYDARARLLENFSRKTLNDDV
+ AVGDWIAMFSMWPIKSTPGLRCQLDCAPQTNRLPAYRNIAAPVLVIGFADDVVTPPYL
+ GREVADALPNGRYLQIPDAGHLGFFERPEAVNTAMLKFFASVKA"
+ gene 647541..649205
+ /gene="menD"
+ /locus_tag="BQ2027_MB0570"
+ CDS 647541..649205
+ /gene="menD"
+ /locus_tag="BQ2027_MB0570"
+ /note="Mb0570, menD, len: 554 aa. Equivalent to Rv0555,
+ len: 554 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 554 aa overlap). Probable menD,
+ menaquinone biosynthesis protein, including
+ 2-succinyl-6-hydroxy-2,4-cyclohexadiene-1-carboxylate
+ synthase (EC 4.1.3.-) and 2-oxoglutarate decarboxylase (EC
+ 4.1.1.71) activities. Equivalent to NP_302478.1|NC_002677
+ putative
+ 2-succinyl-6-hydroxy-2,4-cyclohexadiene-1-carboxylate
+ synthase / 2-oxoglutarate decarboxylase from Mycobacterium
+ leprae (556 aa). Also similar to others e.g.
+ MEND_BACSU|P23970
+ 2-succinyl-6-hydroxy-2,4-cyclohexadiene-1-carboxylate
+ synthase from Bacillus subtilis (548 aa), FASTA scores:
+ opt: 488, E(): 2.3e-21, (34.3% identity in 545 aa
+ overlap); etc. COFACTOR: THIAMINE PYROPHOSPHATE. Protein
+ product from Mb0570 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0570 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BIFUNCTIONAL MENAQUINONE BIOSYNTHESIS
+ PROTEIN MEND :
+ 2-SUCCINYL-6-HYDROXY-2,4-CYCLOHEXADIENE-1-CARBOXYLATE
+ SYNTHASE (SHCHC SYNTHASE) + 2-OXOGLUTARATE DECARBOXYLASE
+ (ALPHA-KETOGLUTARATE DECARBOXYLASE) (KDC)"
+ /protein_id="CAB5248278.1"
+ /translation="MNPSTTQARVVVDELIRGGVRDVVLCPGSRNAPLAFALQDADRS
+ GRIRLHVRIDERTAGYLAIGLAIGAGAPVCVAMTSGTAVANLGPAVVEANYARVPLIV
+ LSANRPYELLGTGANQTMEQLGYFGTQVRASISLGLAEDAPERTSALNATWRSATCRV
+ LAAATGARTANAGPVHFDIPLREPLVPDPEPLGAVTPPGRPAGKPWTYTPPVTFDQPL
+ DIDLSVDTVVISGHGAGVHPNLAALPTVAEPTAPRSGDNPLHPLALPLLRPQQVIMLG
+ RPTLHRPVSVLLADAEVPVFALTTGPRWPDVSGNSQATGTRAVTTGAPRPAWLDRCAA
+ MNRHAIAAVREQLAAHPLTTGLHVAAAVSHALRPGDQLVLGASNPVRDVALAGLDTRG
+ IRVRSNRGVAGIDGTVSTAIGAALAYEGAHERTGSPDSPPRTIALIGDLTFVHDSSGL
+ LIGPTEPIPRSLTIVVSNDNGGGIFELLEQGDPRFSDVSSRIFGTPHDVDVGALCRAY
+ HVESRQIEVDELGPTLDQPGAGMRVLEVKADRSSLRQLHAAIKAAL"
+ gene 649202..649717
+ /locus_tag="BQ2027_MB0571"
+ CDS 649202..649717
+ /locus_tag="BQ2027_MB0571"
+ /note="Mb0571, -, len: 171 aa. Equivalent to Rv0556, len:
+ 171 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 171 aa overlap). Probable conserved
+ transmembrane protein, equivalent to NP_302479.1|NC_002677
+ putative membrane protein from Mycobacterium leprae (175
+ aa). Protein product from Mb0571 detected using SWATH mass
+ spectrometry. Mb0571 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="CAB5248279.1"
+ /translation="MISPKPLLHILIHGRSDELPDTRGRIVLRWLRIAVLIVTGLVTL
+ QSVLLVAGAWRNDIAIQRNMGVAQAEVLSAGPRRSTIEFVTPDRITYRPQLGVLYPSE
+ LSTGMRIYVEYNKRDPNLVRVQHRNAGLAIIPAGSIAVVAWLIAAAALVVLAVLDKRL
+ ERRENSASATG"
+ gene 649779..650915
+ /gene="mgta"
+ /locus_tag="BQ2027_MB0572"
+ CDS 649779..650915
+ /gene="mgta"
+ /locus_tag="BQ2027_MB0572"
+ /note="Mb0572, pimB, len: 378 aa. Equivalent to Rv0557,
+ len: 378 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 378 aa overlap). pimB (alternate gene
+ name: mtfB), mannosyltransferase (EC 2.4.1.-) (see
+ citation below), similar to other various transferases
+ e.g. NP_243554.1|NC_002570
+ alpha-D-mannose-alpha(1-6)phosphatidyl myo-inositol
+ monomannoside transferase from Bacillus halodurans (381
+ aa); NP_249533.1|NC_002516 probable glycosyl transferase
+ from Pseudomonas aeruginosa (406 aa);
+ NP_419573.1|NC_002696 glycosyl transferase, group 1 family
+ protein, from Caulobacter crescentus (455 aa); etc. Also
+ similar to Q55598 hypothetical 44.9 kDa protein from
+ SYNECHOCYSTIS SP (409 aa), FASTA scores: opt: 703, E(): 0,
+ (33.9% identity in 378 aa overlap); GPI3_YEAST|P32363
+ n-acetylglucosaminyl-phosphatidylinositol biosynthetic
+ protein (452 aa), FASTA scores: opt: 230, E(): 1.1e-07,
+ (23.5% identity in 328 aa overlap). Mb0572 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="mannosyltransferase mgta"
+ /protein_id="CAB5248280.1"
+ /translation="MCGVRVAIVAESFLPQVNGVSNSVVKVLEHLRRTGHEALVIAPD
+ TPPGEDRAERLHDGVRVHRVPSRMFPKVTTLPLGVPTFRMLRALRGFDPDVVHLASPA
+ LLGYGGLHAARRLGVPTVAVYQTDVPGFASSYGIPMTARAAWAWFRHLHRLADRTLAP
+ STATMESLIAQGIPRVHRWARGVDVQRFAPSARNEVLRRRWSPDGKPIVGFVGRLAPE
+ KHVDRLTGLAASGAVRLVIVGDGIDRARLQSAMPTAVFTGARYGKELAEAYASMDVFV
+ HSGEHETFCQVVQEALASGLPVIAPDAGGPRDLITPHRTGLLLPVGEFEHRLPDAVAH
+ LVHERQRYALAARRSVLGRSWPVVCDELLGHYEAVRGRRTTQAA"
+ gene 650932..651636
+ /gene="menH"
+ /locus_tag="BQ2027_MB0573"
+ CDS 650932..651636
+ /gene="menH"
+ /locus_tag="BQ2027_MB0573"
+ /note="Mb0573, menH, len: 234 aa. Equivalent to Rv0558,
+ len: 234 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 234 aa overlap). Probable menH
+ (alternate gene name: menG), ubiquinone/menaquinone
+ biosynthesis methlytransferase
+ (2-heptaprenyl-1,4-naphthoquinone methyltransferase) (EC
+ 2.1.1.-), equivalent to NP_302480.1|NC_002677 putative
+ ubiquinone/menaquinone biosynthesis methyltransferase from
+ Mycobacterium leprae (238 aa). Also highly similar to
+ others e.g. CAB44537.1|AL078618|T34630 from Streptomyces
+ coelicolor (231 aa); UBIE_ECOLI|P27851 from Escherichia
+ coli strain K12 (251 aa), FASTA scores: opt: 421, E():
+ 1.2e-21, (43.2% identity in 227 aa overlap);
+ GRC2_BACSU|P31113 from Bacillus subtilis (233 aa), FASTA
+ scores: opt: 345, E(): 1.4e-16, (34.6% identity in 231 aa
+ overlap); etc. BELONGS TO THE UBIE FAMILY. Note that
+ previously known as ubiE. Protein product from Mb0573
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0573 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE UBIQUINONE/MENAQUINONE BIOSYNTHESIS
+ METHYLTRANSFERASE MENH (2-heptaprenyl-1,4-naphthoquinone
+ methyltransferase)"
+ /protein_id="CAB5248281.1"
+ /translation="MSRAALDKDPRDVASMFDGVARKYDLTNTVLSLGQDRYWRRATR
+ SALRIGPGQKVLDLAAGTAVSTVELTKSGAWCVAADFSVGMLAAGAARKVPKVAGDAT
+ RLPFGDDVFDAVTISFGLRNVANQQAALREMARVTRPGGRLLVCEFSTPTNALFATAY
+ KEYLMRALPRVARAVSSNPEAYEYLAESIRAWPDQAVLAHQISRAGWSGVRWRNLTGG
+ IVALHAGYKPGKQTPQ"
+ gene complement(651650..651988)
+ /locus_tag="BQ2027_MB0574C"
+ CDS complement(651650..651988)
+ /locus_tag="BQ2027_MB0574C"
+ /note="Mb0574c, -, len: 112 aa. Equivalent to Rv0559c,
+ len: 112 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 112 aa overlap). Possible conserved
+ secreted protein, similar to NP_302481.1|NC_002677
+ putative secreted protein from Mycobacterium leprae (112
+ aa). Also similar to Y08B_MYCTU|Q11048 hypothetical 11.6
+ kd protein FASTA scores: opt: 111, E(): 011, (25.4%
+ identity in 114 aa overlap). Contains possible N-terminal
+ signal sequence. Protein product from Mb0574c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0574c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED SECRETED PROTEIN"
+ /protein_id="CAB5248282.1"
+ /translation="MKGTKLAVVVGMTVAAVSLAAPAQADDYDAPFNNTIHRFGIYGP
+ QDYNAWLAKISCERLSRGVDGDAYKSATFLQRNLPRGTTQGQAFQFLGAAIDHYCPEH
+ VGVLQRAGTR"
+ gene complement(652022..652747)
+ /locus_tag="BQ2027_MB0575C"
+ CDS complement(652022..652747)
+ /locus_tag="BQ2027_MB0575C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0575c, -, len: 241 aa. Equivalent to Rv0560c,
+ len: 241 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 241 aa overlap). Possible benzoquinone
+ methyltransferase (EC 2.1.1.-) (see citation below),
+ similar to other hypothetical proteins and
+ methyltransferases e.g. Q54300 METHYLTRANSFERASE (211 aa),
+ FASTA scores: opt: 203, E(): 4.8e-07, (30.9% identity in
+ 136 aa overlap). Similar to Rv3699, Rv1377c, Rv2675c, etc
+ from Mycobacterium tuberculosis. Rv0560c can be induced by
+ salicylate and para-amino-salicylate (PAS). Protein
+ product from Mb0575c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0575c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE BENZOQUINONE METHYLTRANSFERASE
+ (METHYLASE)"
+ /protein_id="CAB5248283.1"
+ /translation="MSTVLTYIRAVDIYEHMTESLDLEFESAYRGESVAFGEGVRPPW
+ SIGEPQPELAALIVQGKFRGDVLDVGCGEAAISLALAERGHTTVGLDLSPAAVELARH
+ EAAKRGLANASFEVADASSFTGYDGRFDTIVDSTLFHSMPVESREGYLQSIVRAAAPG
+ ASYFVLVFDRAAIPEGPINAVTEDELRAAVSKYWIIDEIKPARLYARFPAGFAGMPAL
+ LDIREEPNGLQSIGGWLLSAHLG"
+ gene complement(652772..653998)
+ /locus_tag="BQ2027_MB0576C"
+ CDS complement(652772..653998)
+ /locus_tag="BQ2027_MB0576C"
+ /note="Mb0576c, -, len: 408 aa. Equivalent to Rv0561c,
+ len: 408 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 408 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), highly similar (except in
+ first 30 aa) to NP_302482.1|NC_002677 putative FAD-linked
+ oxidoreductase from Mycobacterium leprae (408 aa). Also
+ similar to T34627 probable electron transfer
+ oxidoreductase from Streptomyces coelicolor (430 aa); and
+ some bacteriochlorophyll synthases e.g.
+ NP_069300.1|NC_000917 bacteriochlorophyll synthase from
+ Archaeoglobus fulgidus (410 aa); Q55087 GERANYLGERANYL
+ HYDROGENASE (407 aa), FASTA scores: opt: 208, E():
+ 1.7e-06, (26.9% identity in 327 aa overlap). Protein
+ product from Mb0576c detected using SWATH mass
+ spectrometry. Mb0576c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="CAB5248284.1"
+ /translation="MSVDDSADVVVVGAGPAGSAAAAWAARAGRDVLVIDTATFPRDK
+ PCGDGLTPRAVAELHQLGLGKWLADHIRHRGLRMSGFGGEVEVDWPGPSFPSYGSAVA
+ RLELDDRIRKVAEDTGARMLLGAKAVAVHHDSSRRVVSLTLADGTEVGCRQLIVADGA
+ RSPLGRKLGRRWHRETVYGVAVRGYLSTAYSDDPWLTSHLELRSPDGAVLPGYGWIFP
+ LGNGEVNIGVGALSTSRRPADLALRPLISYYTDLRRDEWGFTGQPRAVSSALLPMGGA
+ VSGVAGSNWMLIGDAAACVNPLNGEGIDYGLETGRLAAELLDSRDLARLWPSLLADRY
+ GRGFSVARRLALLLTFPRFLPTTGPITMRSTALMNIAVRVMSNLVTDDDRDWVARVWR
+ GGGQLSRLVDRRPPFS"
+ gene 654014..655021
+ /gene="grcC1"
+ /locus_tag="BQ2027_MB0577"
+ CDS 654014..655021
+ /gene="grcC1"
+ /locus_tag="BQ2027_MB0577"
+ /note="Mb0577, grcC1, len: 335 aa. Equivalent to Rv0562,
+ len: 335 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 335 aa overlap). Probable grcC1,
+ polyprenyl diphosphate synthetase (EC 2.5.1.-), equivalent
+ to NP_302483.1|NC_002677 polyprenyl diphosphate synthase
+ component from Mycobacterium leprae (330 aa). Also similar
+ to others (generally hepta (EC 2.5.1.30) or hexaprenyl)
+ e.g. GRC3_BACSU|P31114 probable heptaprenyl diphosphate
+ syntetase (348aa), FASTA scores: opt: 599, E(): 4e-31,
+ (33.2% identity in 307 aa overlap); etc. Also highly
+ similar to Mycobacterium tuberculosis proteins
+ Rv0989c|grcC2|NP_215504.1|MTCI237.03c PROBABLE
+ POLYPRENYL-DIPHOSPHATE SYNTHASE (325 aa); Rv3383c,
+ Rv3398c, etc. Contains PS00444 Polyprenyl synthetases
+ signature 2. BELONGS TO THE FPP/GGPP SYNTHETASES FAMILY.
+ Protein product from Mb0577 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0577 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE POLYPRENYL-DIPHOSPHATE SYNTHASE GRCC1
+ (POLYPRENYL PYROPHOSPHATE SYNTHETASE)"
+ /protein_id="CAB5248285.1"
+ /translation="MRTPATVVAGVDLGDAVFAAAVRAGVARVEQLMDTELRQADEVM
+ SDSLLHLFNAGGKRFRPLFTVLSAQIGPQPDAAAVTVAGAVIEMIHLATLYHDDVMDE
+ AQVRRGAPSANAQWGNNVAILAGDYLLATASRLVARLGPEAVRIIADTFAQLVTGQMR
+ ETRGTSENVDSIEQYLKVVQEKTGSLIGAAGRLGGMFSGATDEQVERLSRLGGVVGTA
+ FQIADDIIDIDSESDESGKLPGTDVREGVHTLPMLYALRESGPDCARLRALLNGPVDD
+ DAEVREALTLLRASPGMARAKDVLAQYAAQARHELALLPDVPGRRALAALVDYTVSRH
+ G"
+ gene 655122..655982
+ /gene="htpX"
+ /locus_tag="BQ2027_MB0578"
+ CDS 655122..655982
+ /gene="htpX"
+ /locus_tag="BQ2027_MB0578"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0578, htpX, len: 286 aa. Equivalent to Rv0563,
+ len: 286 aa (alternative start at position 654006), from
+ Mycobacterium tuberculosis strain H37Rv, (100.0% identity
+ in 286 aa overlap). Probable htpX, protease heat shock
+ protein X (EC 3.4.24.-) (transmembrane protein),
+ equivalent to NP_302484.1|NC_002677 putative peptidase
+ from Mycobacterium leprae (287 aa). Also highly similar to
+ others e.g. CAC08262.1|AL392146 putative peptidase from
+ Streptomyces coelicolor (287 aa); NP_387431.1|NC_003047
+ PUTATIVE PROTEASE TRANSMEMBRANE PROTEIN from Sinorhizobium
+ meliloti (319 aa); NP_105051.1|NC_002678 heat shock
+ protein (htpX) from Mesorhizobium loti (336 aa);
+ NP_248692.1|NC_000909|U67608|MJU67608_8 heat shock protein
+ HtpX, possibly protease (htpX) from Methanococcus
+ jannaschii (284 aa), FASTA scores: opt: 660, E(): 0, (46.5
+ identity in 245 aa overlap). Continuation of MTCY25D10.42.
+ TBparse score is 0.887. BELONGS TO PEPTIDASE FAMILY M48
+ (ZINC METALLOPROTEASE). COFACTOR: Zinc. Protein product
+ from Mb0578 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0578 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PROTEASE TRANSMEMBRANE PROTEIN HEAT
+ SHOCK PROTEIN HTPX"
+ /protein_id="CAB5248286.1"
+ /translation="MTWHPHANRLKTFLLLVGMSALIVAVGALFGRTALMLAALFAVG
+ MNVYVYFNSDKLALRAMHAQPVSELQAPAMYRIVRELATSAHQPMPRLYISDTAAPNA
+ FATGRNPRNAAVCCTTGILRILNERELRAVLGHELSHVYNRDILISCVAGALAAVITA
+ LANMAMWAGMFGGNRDNANPFALLLVALLGPIAATVIRMAVSRSREYQADESGAVLTG
+ DPLALASALRKISGGVQAAPLPPEPQLASQAHLMIANPFRAGERIGSLFSTHPPIEDR
+ IRRLEAMARG"
+ gene complement(656167..657192)
+ /gene="gpdA1"
+ /locus_tag="BQ2027_MB0579C"
+ CDS complement(656167..657192)
+ /gene="gpdA1"
+ /locus_tag="BQ2027_MB0579C"
+ /note="Mb0579c, gpdA1, len: 341 aa. Equivalent to Rv0564c,
+ len: 341 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 341 aa overlap). Possible
+ gpdA1(alternate gene names: gpsA, glyC),
+ glycerol-3-phosphate dehydrogenase [NAD(P)+] dependant (EC
+ 1.1.1.94), similar to many other glycerol-3-phosphate
+ dehydrogenases e.g. P46919|GPDA_BACSU from Bacillus
+ subtilis (345 aa), FASTA scores: opt: 731, E(): 0, (37.3%
+ identity in 332 aa overlap); etc. Also similar to
+ Rv2982c|gpdA2|MTCY349.05|Z83018|MTCY349_5 from
+ Mycobacterium tuberculosis (334 aa), FASTA scores: opt:
+ 740, E(): 0, (40.4% identity in 322 aa overlap). Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop). BELONGS TO
+ THE NAD-DEPENDENT GLYCEROL-3-PHOSPHATE DEHYDROGENASE
+ FAMILY. Protein product from Mb0579c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0579c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLYCEROL-3-PHOSPHATE DEHYDROGENASE
+ [NAD(P)+] GPDA1 (NAD(P)H-DEPENDENT GLYCEROL-3-PHOSPHATE
+ DEHYDROGENASE) (NAD(P)H-DEPENDENT
+ DIHYDROXYACETONE-PHOSPHATE REDUCTASE)"
+ /protein_id="CAB5248287.1"
+ /translation="MAANKREPKVVVLGGGSWGTTVASICARRGPTLQWVRSAVTAQD
+ INDNHRNSRYLGNDVVLSDTLRATTDFTEAANCADVVVMGVPSHGFRGVLVELSKELR
+ PWVPVVSLVKGLEQGTNMRMSQIIEEVLPGHPAGILAGPNIAREVAEGYAAAAVLAMP
+ DQHLATRLSAMFRTRRFRVYTTDDVVGVETAGALKNVFAIAVGMGYSLGIGENTRALV
+ IARALREMTKLGVAMGGKSETFPGLAGLGDLIVTCTSQRSRNRHVGEQLGAGKPIDEI
+ IASMSQVAEGVKAAGVVMEFANEFGLNMPIAREVDAVINHGSTVEQAYRGLIAEVPGH
+ EVHGSGF"
+ gene complement(657253..658713)
+ /locus_tag="BQ2027_MB0580C"
+ CDS complement(657253..658713)
+ /locus_tag="BQ2027_MB0580C"
+ /note="Mb0580c, -, len: 486 aa. Equivalent to Rv0565c,
+ len: 486 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 486 aa overlap). Probable monoxygenase
+ (EC 1.14.-.-), highly similar to NP_301173.1|NC_002677
+ putative monooxygenase from Mycobacterium leprae (494 aa).
+ Also highly similar to others e.g. NP_421371.1|NC_002696
+ monooxygenase (flavin-binding family) from Caulobacter
+ crescentus (498 aa); C-terminus of NP_051574.1|NC_000958
+ arylesterase/monoxygenase from Deinococcus radiodurans
+ (833 aa); P12015|CYMO_ACISP CYCLOHEXANONE MONOOXYGENASE
+ (EC 1.14.13.22) from Acinetobacter sp. (542 aa), FASTA
+ scores: opt: 354, E(): 2.1e-16, (23.7% identity in 435 aa
+ overlap); etc. Also similar to other putative
+ monoxygenases from Mycobacterium tuberculosis e.g. Rv3854c
+ (489 aa), MTCY01A6.14 (489 aa), MTV013_4 (495 aa),
+ MTCY31.20 (495 aa). Protein product from Mb0580c detected
+ using SWATH mass spectrometry. Mb0580c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MONOOXYGENASE"
+ /protein_id="CAB5248288.1"
+ /translation="MSVTPNAGCVDVVIVGAGISGLGAAYRIIERNPQLTYTILERRA
+ RIGGTWDLFRYPGVRSDSSIFTLSFPYEPWTREEGIADGAHIREYLTDMAHKYGIDRH
+ IEFNSYVRAADWDSSTDTWTVTFEQNGVHKHYRSRFVFFGSGYYNYDEGYTPDFGGIE
+ KFGGAVVHPQHWPEDLDYTGKKIVVIGSGATAVTLIPSLTDRAEKVTMLQRSPTYLIS
+ ASKYSTFAAVVRKALPPKTSHLIVRMYNALLEAVFWFLSRKTPVFVKWLLRRTAIKNL
+ PEGYDIETHFTPRYNPWDQRLCLIPDADLYNAITSGRAEVVTDHIDHFDATGIALKSG
+ GHLDADIIVTATGLQLQALGGAAISLDGVEIDPRDRFVYKAHMLEDVPNLFWCVGYTN
+ ASWTLRADMTARATAKLLAHMAAHGHTRAAPHLGDEPMDEKPSWDIQAGYVKRAPYAL
+ PKSGTKRPWNVRQNYLADAIDYRFDRIEEAMVFGAA"
+ gene complement(658791..659282)
+ /locus_tag="BQ2027_MB0581C"
+ CDS complement(658791..659282)
+ /locus_tag="BQ2027_MB0581C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0581c, -, len: 163 aa. Equivalent to Rv0566c,
+ len: 163 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 163 aa overlap). Conserved
+ hypothetical protein, similar to others e.g.
+ P77482|YAJQ_ECOLI HYPOTHETICAL 19.0 KDa PROTEIN from
+ Escherichia coli (169 aa), FASTA scores: opt: 422, E():
+ 5.4e-20, (44.1 identity in 161 aa overlap); etc. Protein
+ product from Mb0581c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0581c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="UPF0234 protein Yitk"
+ /protein_id="CAB5248289.1"
+ /translation="MADSSFDIVSKVDRQEVDNALNQAAKELATRFDFRGTDTKIAWK
+ GDEAVELTSSTEERVKAAVDVFKEKLIRRDISLKAFEAGEPQASGKTYKVTGALKQGI
+ SSENAKKITKLIRDAGPKNVKTQIQGDEVRVTSKKRDDLQAVIAMLKKADLDVALQFV
+ NYR"
+ gene 659352..659432
+ /locus_tag="BQ2027_TYRT"
+ tRNA 659352..659432
+ /locus_tag="BQ2027_TYRT"
+ /product="tRNA-Tyr"
+ /note="tyrT, len: 81 nt. Equivalent to tyrT, len: 81 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 81 nt overlap). tRNA-Tyr, anticodon gta,
+ length = 81"
+ gene 659564..660583
+ /locus_tag="BQ2027_MB0582"
+ CDS 659564..660583
+ /locus_tag="BQ2027_MB0582"
+ /note="Mb0582, -, len: 339 aa. Equivalent to Rv0567, len:
+ 339 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 339 aa overlap). Probable
+ methyltransferase (EC 2.1.1.-), similar to several e.g.
+ P39896|TCMO_STRGA TETRACENOMYCIN POLYKETIDE SYNTHESIS
+ 8-O-METHYLTRANSFERASE from Streptomyces glaucescens (339
+ aa), FASTA scores: opt: 685, E(): 0, (35.8% identity in
+ 335 aa overlap); P10950|HIOM_BOVIN HYDROXYINDOLE
+ O-METHYLTRANSFERASE (EC 2.1.1.4) from Bos taurus (345 aa),
+ FASTA scores: opt: 509, E(): 3.4e-27, (30.7% identity in
+ 332 aa overlap) etc. Protein product from Mb0582 detected
+ using SWATH mass spectrometry. Mb0582 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METHYLTRANSFERASE/METHYLASE"
+ /protein_id="CAB5248290.1"
+ /translation="MELSPDRIMAIGGGYGPSKVLLTAVGLGLFTELGDEAMTAEAIA
+ DRLGLLKRPAIDFLDALVSLDLLARDGDGPGSHYRNTPETAHFLDEARPTYAGGLLKI
+ WNERNYRFWADLTEALKTGKAQSEVKQTGRPFFEALYADPRRLEAFMAAMDAASRRNI
+ ELLAKRFPFERYRRLCDVGCADGLLSRIVAAAHPHLQCVSLDLPAVTEIARRKLTAEG
+ LGERVQACAGDFLADPLPAADVITMGQILHDWNLDRKQQLVAKAYEALSKEGAFIVIE
+ TLIDDARRENTTGLMMSLNMLIEFGDAFDYSAADFRGWCGEAGFRSFEVIPLAGGSSA
+ AVAYK"
+ gene 660693..662111
+ /gene="cyp135B1"
+ /locus_tag="BQ2027_MB0583"
+ CDS 660693..662111
+ /gene="cyp135B1"
+ /locus_tag="BQ2027_MB0583"
+ /note="Mb0583, cyp135B1, len: 472 aa. Equivalent to
+ Rv0568, len: 472 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 472 aa overlap).
+ Possible cyp135B1, cytochrome P450 (EC 1.14.-.-), similar
+ to putative cytochrome P-450 monoxygenases and other
+ cytochrome P-450 related enzymes e.g. P29980|CPXN_ANASP
+ PROBABLE CYTOCHROME P450 from Anabaena sp. strain PCC 7120
+ (459 aa), FASTA scores: opt: 525, E(): 7.2e-27, (31.9%
+ identity in 417 aa overlap); etc. Also similar to others
+ from Mycobacterium tuberculosis e.g.
+ Rv0327c|NP_214841.1|NC_000962|CYP135A1|MT0342|MTCY63.32c
+ PUTATIVE CYTOCHROME P450 (449 aa), FASTA scores: opt:
+ 1080, E(): 0, (40.5% identity in 444 aa overlap);
+ Rv3685c|NP_218202.1|NC_000962 PUTATIVE CYTOCHROME P450
+ (476 aa); Rv0136|NP_214650.1|NC_000962 PUTATIVE CYTOCHROME
+ P450 (441 aa); etc. Contains cytochrome P450 cysteine
+ heme-iron ligand signature (PS00086). Protein product from
+ Mb0583 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0583 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CYTOCHROME P450 135B1 CYP135B1"
+ /protein_id="CAB5248291.1"
+ /translation="MSGTSSMGLPPGPRLSGSVQAVLMLRHGLRFLTACQRRYGSVFT
+ LHVAGFGHMVYLSDPAAIKTVFAGNPSVFHAGEANSMLAGLLGDSSLLLIDDDVHRDR
+ RRLMSPPFHRDAVARQAGPIAEIAAANIAGWPMAKAFAVAPKMSEITLEVILRTVIGA
+ SDPVRLAALRKVMPRLLNVGPWATLALANPSLLNNRLWSRLRRRIEEADALLYAEIAD
+ RRADPDLAARTDTLAMLVRAADEDGRTMTERELRDQLITLLVAGHDTTATGLSWALER
+ LTRHPVTLAKAVQAADASAAGDPAGDEYLDAVAKETLRIRPVVYDVGRVLTEAVEVAG
+ YRLPAGVMVVPAIGLVHASAQLYPDPERFDPDRMVGATLSPTTWLPFGGGNRRCLGAT
+ FAMVEMRVVLREILRRVELSTTTTSGERPKLKHVIMVPHRGARIRVRATRDVSATSQA
+ TAQGAGCPAARGGGPSRAVGSQ"
+ gene 662246..662512
+ /locus_tag="BQ2027_MB0584"
+ CDS 662246..662512
+ /locus_tag="BQ2027_MB0584"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0584, -, len: 88 aa. Equivalent to Rv0569, len:
+ 88 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 88 aa overlap). Conserved hypothetical
+ protein. C-terminus highly similar to
+ AAA63065.1|U15184|MLU15184_10 hypothetical protein from
+ Mycobacterium leprae (53 aa), FASTA scores: opt: 140, E():
+ 0.0046, (64.7% identity in 34 aa overlap). Also similar to
+ T36824|SCI35.11 hypothetical protein from Streptomyces
+ coelicolor (64 aa); and N-terminus of T36956 probable
+ DNA-binding protein from Streptomyces coelicolor (323 aa).
+ Also highly similar to
+ Rv2302|MTCY339.07c|NP_216818.1|NC_000962 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (80
+ aa), FASTA scores: opt: 300, E(): 1.4e-13, (61.8% identity
+ in 76 aa overlap). Protein product from Mb0584 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0584 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248292.1"
+ /translation="MKAKVGDWLVIKGATIDQPDHRGLIIEVRSSDGSPPYVVRWLET
+ DHVATVIPGPDAVVVTAEEQNAADERAQHRFGAVQSAILHARGT"
+ gene 662538..664670
+ /gene="nrdZ"
+ /locus_tag="BQ2027_MB0585"
+ CDS 662538..664670
+ /gene="nrdZ"
+ /locus_tag="BQ2027_MB0585"
+ /note="Mb0585, nrdZ, len: 710 aa. Equivalent to 5' end of
+ Rv0570, len: 692 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 631 aa overlap).
+ Probable nrdZ, ribonucleoside-diphosphate reductase, large
+ subunit (EC 1.17.4.-), highly similar to others e.g.
+ NP_070492.1|NC_000917|NRD|AE000988_11 ribonucleotide
+ reductase from Archaeoglobus fulgidus (752 aa), FASTA
+ scores: opt: 2001, E(): 0, (52.5% identity in 562 aa
+ overlap) (N-terminus shorter); U73619|TAU73619_1|T37459
+ ribonucleotide reductase from Thermoplasma acidophilum
+ (857 aa), FASTA scores: opt: 1678, E(): 0, (43.7% identity
+ in 723 aa overlap); etc. BELONGS TO THE RIBONUCLEOSIDE
+ DIPHOSPHATE REDUCTASE LARGE CHAIN FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ frameshift due to a single base deletion (c-*) leads to a
+ product with a different COOH part compared to its homolog
+ in Mycobacterium tuberculosis strain H37Rv. Protein
+ product from Mb0585 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0585 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RIBONUCLEOSIDE-DIPHOSPHATE REDUCTASE
+ (LARGE SUBUNIT) NRDZ (RIBONUCLEOTIDE REDUCTASE)"
+ /protein_id="CAB5248293.1"
+ /translation="MGVSWPAKVRRRDGTLVPFDIARIEAAVTRAAREVACDDPDMPG
+ TVAKAVADALGRGIAPVEDIQDCVEARLGEAGLDDVARVYIIYRQRRAELRTAKALLG
+ VRDELKLSLAAVTVLRERYLLHDEQGRPAESTGELMDRSARCVAAAEDQYEPGSSRRW
+ AERFATLLRNLEFLPNSPTLMNSGTDLGLLAGCFVLPIEDSLQSIFATLGQAAELQRA
+ GGGTGYAFSHLRPAGDRVASTGGTASGPVSFLRLYDSAAGVVSMGGRRRGACMAVLDV
+ SHPDICDFVTAKAESPSELPHFNLSVGVTDAFLRAVERNGLHRLVNPRTGKIVARMPA
+ AELFDAICKAAHAGGDPGLVFLDTINRANPVPGRGRIEATNPCGEVPLLPYESCNLGS
+ INLARMLADGRVDWDRLEEVAGVAVRFLDDVIDVSRYPFPELGEAARATRKIGLGVMG
+ LAELLAALGIPYDSEEAVRLATRLMRRIQQAAHTASRRLAEERGAFPAFTDSRFARSG
+ PRRNAQVTSVAPTGTISLIAGTTAGIEPMFAIAFTRAIVGRHLLEVNPCFDRLARDRG
+ FYRDELIAEIAQRGGVRGYPRLPAEVRAAFPTAAEIAPQWHLRMQAAVQRHVEAAVSK
+ TVNLPATGRSMTSAPSMWPPGRQRSRASRCIATAAGKDRYCPTPRRNRYWRRLTRSSA
+ AAVRAAPASSDGGSHGASRRRIAQNQRF"
+ gene complement(664729..666060)
+ /locus_tag="BQ2027_MB0586C"
+ CDS complement(664729..666060)
+ /locus_tag="BQ2027_MB0586C"
+ /note="Mb0586c, -, len: 443 aa. Equivalent to Rv0571c,
+ len: 443 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 443 aa overlap). Conserved
+ hypothetical protein, highly similar to the products of
+ two adjacent orfs in Mycobacterium leprae:
+ AAA63059.1|U15184|U650S|Q50111 hypothetical protein (258
+ aa), FASTA scores: opt: 1071, E(): 0, (72.5% identity in
+ 233 aa overlap); and AAA63058.1|U15184|U650T hypothetical
+ protein (86 aa), FASTA scores: opt: 192, E(): 6.4e-06,
+ (70.8% identity in 48 aa overlap). Also similar to others
+ e.g. NP_107072.1|NC_002678 hypothetical protein from
+ Mesorhizobium loti (235 aa); NP_213031.1|NC_000918
+ hypothetical protein from Aquifex aeolicus (175 aa); etc.
+ And similar to part of hypothetical proteins from
+ Mycobacterium tuberculosis e.g. C-terminus of
+ Rv2143|MTCY270.25c|Z95388|NP_216659.1|NC_000962 (352 aa),
+ FASTA scores: opt: 592, E(): 7e-32, (49.3% identity in 205
+ aa overlap); N-terminus of Rv2030c|NP_216546.1|NC_000962
+ (681 aa). Protein product from Mb0586c detected using
+ SWATH mass spectrometry. Mb0586c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Phosphoribosyl transferase domain protein"
+ /protein_id="CAB5248294.1"
+ /translation="MKLFDDRGDAGRQLAQRLAQLSGKAVVVLGLPRGGVPVAFEVAK
+ SLQAPLDVLVVRKLGVPFQPELAFGAIGEDGVRVLNDDVVRGTHLDAAAMDAVERKQL
+ IELQRRAERFRRGRDRIPLTGRIAVIVDDGIATGATAKAACQVARAHGADKVVLAVPI
+ GPDDIVARFAGYADEVVCLATPALFFAVGQGYRNFTQTSDDEVVAFLDRAHRDFAEAG
+ AIDAAADPPLRDEEVQVVAGPVPVAGHLTVPEKPRGIVVFAHGSGSSRHSIRNRYVAE
+ VLTGAGFATLLFDLLTPEEERNRANVFDIELLASRLIDVTGWLATQPDTASLPVGYFG
+ ASTGAGAALVAAADPRVNVRAVVSRGGRPDLAGDSLGSVVAPTLLIVGGRDQVVLELN
+ QRAQAVIPGKCQLTVVPGATHLFEEPGTLEQVAKLACDWFIDHLCGPGPSG"
+ gene complement(666284..666625)
+ /locus_tag="BQ2027_MB0587C"
+ CDS complement(666284..666625)
+ /locus_tag="BQ2027_MB0587C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0587c, -, len: 113 aa. Equivalent to Rv0572c,
+ len: 113 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.1% identity in 113 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248295.1"
+ /translation="MGEHAIKRHMRQRKPTKHPLAQKRGARILVLTDDPRRSVLIVPG
+ CHLDSMRREKNAYYFQDGNALVGMVVSGGTVEYDADDRTYVVQLTDGRHTTESSFEHS
+ SPSRSPQSDDL"
+ gene complement(666676..666843)
+ /locus_tag="BQ2027_MB0587CA"
+ CDS complement(666676..666843)
+ /locus_tag="BQ2027_MB0587CA"
+ /note="unnamed protein product; unnamed protein product;
+ Mb0587cA, len: 55 aa. No equivalent in M. tuberculosis
+ H37Rv. Identified by de novo proteomics of Mycobacterium
+ bovis AF2122/97 under exponential conditions"
+ /codon_start=1
+ /transl_table=11
+ /protein_id="CAB5248296.1"
+ /translation="MAADPQCTRCKQTIEPGWLYITAHRRGQAGIVDDGAVLIHVPGE
+ CPHPGEHVPRS"
+ gene complement(667093..668484)
+ /gene="pncb2"
+ /locus_tag="BQ2027_MB0588C"
+ CDS complement(667093..668484)
+ /gene="pncb2"
+ /locus_tag="BQ2027_MB0588C"
+ /note="Mb0588c, -, len: 463 aa. Equivalent to Rv0573c,
+ len: 463 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 463 aa overlap). Conserved
+ hypothetical protein, similar to other conserved
+ hypothetical proteins and some nicotinate
+ phosphoribosyltransferases e.g. NP_213718.1|NC_000918
+ hypothetical protein from Aquifex aeolicus (426 aa);
+ AL109962|T36953|SCJ1.20 conserved hypothetical protein
+ from Streptomyces coelicolor (438 aa), FASTA scores: opt:
+ 1089, E(): 0, (49.4% identity in 385 aa overlap);
+ P_391053.1|Z99120|BSUB0017_57|NC_000964 protein similar to
+ nicotinate phosphoribosyltransferase from Bacillus
+ subtilis (490 aa), FASTA scores: opt: 955, E():0, (43.5%
+ identity in 356 aa overlap); etc. Also similar to
+ Q10641|Y03F_MYCTU|MTCY130.15c|Rv1330c CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (509
+ aa), FASTA scores: opt: 761, E(): 0, (38.4% identity in
+ 437 aa overlap). Protein product from Mb0588c detected
+ using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="nicotinic acid phosphoribosyltransferase pncb2"
+ /protein_id="CAB5248297.1"
+ /translation="MAIRQHVGALFTDLYEVTMAQAYWAERMSGTAVFEIFFRKLPPG
+ RSYIMAAGLADVVEFLEAFRFDEQDLRYLRGLGQFSDEFLRWLAGVRFTGDVWAAPEG
+ TVIFPNEPAVQLIAPIIEAQLVETFVLNQIHLQSVLASKAARVVAAARGRPVVDFGAR
+ RAHGTDAACKVARTSYLAGAAGTSNLLAARQYGIPTFGTMAHSFVQAFDSEVAAFEAF
+ ARLYPATMLLVDTYDTLRGVDHVIELAKRLGNRFDVRAVRLDSGDLDELSKATRARLD
+ TAGLEQVEIFASSGLDENRIAALLAARCPIDGFGVGTQLVVAQDAPALDMAYKLVAYD
+ GSGRTKFSSGKVIYPGRKQVFRKLEHGVFCGDTLGEHGENLPGDPLLVPIMTNGRRIR
+ QHAPTLDGARDWARQQIDALPPELRSLEDTGYSYPVAVSDRIVGELARLRHADTAEAH
+ PGSNVVGAKAKRP"
+ gene complement(668494..669636)
+ /locus_tag="BQ2027_MB0589C"
+ CDS complement(668494..669636)
+ /locus_tag="BQ2027_MB0589C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0589c, -, len: 380 aa. Equivalent to Rv0574c,
+ len: 380 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 380 aa overlap). Conserved hypothetical
+ protein, showing similarity with other hypothetical
+ proteins and polyglutamate synthases (encapsulation
+ proteins) e.g. AAK64444.1|AF377339_5|AF377339
+ polyglutamate synthase CapA from Myxococcus xanthus (405
+ aa); M24150|BACCAPABC_3|CapA polyglutamate synthase
+ (encapsulation protein) from B.anthracis (411 aa), FASTA
+ scores: opt: 261, E(): 4.3e-10, (25.8% identity in 287 aa
+ overlap); etc. Mb0589c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Capsule biosynthesis protein CapA"
+ /protein_id="CAB5248298.1"
+ /translation="MAGKPDVVTVLLGGDVMLGRGVDQILPHPGKPQLRERYMRDATG
+ YVRLAERVNGRIPLPVDWRWPWGEALAVLENTATDVCLINLETTITADGEFADRKPVC
+ YRMHPDNVPALTALRPHVCALANNHILDFGYQGLTDTVAALAGAGIQSVGAGADLLAA
+ RRSALVTVGHERRVIVGSVAAESSGVPESWAARRDRPGVWLIRDPAQRDVADDVAAQV
+ LADKRPGDIAIVSMHWGSNWGYATAPGDVAFAHRLIDAGIDMVHGHSSHHPRPIEIYR
+ GKPILYGCGDVVDDYEGIGGHESFRSELRLLYLTVTDPASGNLISLQMLPLRVSRMRL
+ QRASQTDTEWLRNTIERISRRFGIRVVTRPDNLLEVVPAANLTSKE"
+ gene complement(669852..670988)
+ /locus_tag="BQ2027_MB0590C"
+ CDS complement(669852..670988)
+ /locus_tag="BQ2027_MB0590C"
+ /note="Mb0590c, -, len: 378 aa. Equivalent to 5' end of
+ Rv0575c, len: 388 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 346 aa overlap).
+ Possible oxidoreductase (EC 1.-.-.-), similar to many
+ diverse oxidoreductases and monooxygenases e.g.
+ AL109974|SCF34_5|T36404 probable monooxygenase from
+ Streptomyces coelicolor (407 aa), FASTA scores: opt: 786,
+ E(): 0, (38.7% identity in 398 aa overlap);
+ P96555|AB000564 SALICYLATE HYDROXYLASE from SPHINGOMONAS
+ (395 aa), FASTA scores: opt: 267, E():5e-11, (26.4%
+ identity in 390 aa overlap). Also similar to
+ Rv1260|Z77137|MTCY50.22C from Mycobacterium tuberculosis
+ (372 aa), FASTA scores: opt: 762, E(): 0, (40.9% identity
+ in 345 aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-c) leads to a shorter product with a
+ different COOH part compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="CAB5248299.1"
+ /translation="MKVAISGAGVAGAALAHWLQRTGHTPTVIERAPKFRTGGYMIDF
+ WGVGYQVAKRMGITDQIAAAGYHMEHVRSVGPTGKVKADLGVDVFRRMVGDDFTSLPR
+ GDLAAAIYTTIEDQVETIFDDSIATIDEHRDGVRLTFERTAPRDFDLVIGADGLHSNV
+ RRLVFGPERDFEHYLGCKVAACVVDGYRPRDERSYVLYNTVDRQLARFALRGDRTMFL
+ FVFRAEHDNPGVAPKDELRDQFGDVGWESRDILAALDDVEDLYFDVVSQIRMDRWSRG
+ RVLLIGDAAGCISLLGGEGTGLAITEAYVLAGELARAGGDHRRAFDAYEKRLRPFIEG
+ KQASAAKFIWFFRHPNPIRPVVSQRCDAHDELRPAGDAVRRQRA"
+ gene 671091..672395
+ /locus_tag="BQ2027_MB0591"
+ CDS 671091..672395
+ /locus_tag="BQ2027_MB0591"
+ /note="Mb0591, -, len: 434 aa. Equivalent to Rv0576, len:
+ 434 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 434 aa overlap). Probable
+ transcriptional regulator, ArsR family. N-terminus highly
+ similar to others e.g. NP_102487.1|NC_002678
+ transcriptional regulator from Mesorhizobium loti (104
+ aa); NP_242952.1|NC_002570 transcriptional regulator (ArsR
+ family) from Bacillus halodurans (109 aa); etc. C-terminal
+ region (~240-434) shows similarity with D67028_1 from
+ Rhodococcus rhodochrous (112 aa); and Rv0738 from
+ Mycobacterium tuberculosis (182 aa). N-terminus also
+ highly similar to Rv2034 from Mycobacterium tuberculosis
+ (107 aa). Contains helix-turn-helix motif at aa 23-43
+ (Score 1628, +4.73 SD). Protein product from Mb0591
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0591 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY ARSR-FAMILY)"
+ /protein_id="CAB5248300.1"
+ /translation="MLEVAAEPTRRRLLQLLAPGERTVTQLASQFTVTRSAISQHLGM
+ LAEAGLVTARKQGRERYYRLDERGVLRLRALMESFWSDELDRLVADAAHYPPSQGDCA
+ MPFEKAVVVPLDPTSTFALITQPDRLRRWMAVAARIELRTGGAYRWTVTPGHSAAGTV
+ IDVDPGKRVVFTWGWEDHGDPPPGGSTVTITLTPVDGGTEVRLVHDGLTAQQAARHAK
+ GWNHFLDRLVVAGQHGDAGPDEWAAAPDPLDELSCAEATLAVLQHVLRGIGASDLTRQ
+ TPCTEYDVSQLADHLLRSLAIIGAAAGAQLAPRDVDAPLETQVADAAQAVMEAWRRRG
+ LAGTVELNSNQVPATVPVGILCLEFLVHAWDFAIATGSQVIASEPVSEYVLAVAGKVI
+ TPATRNSAGFAAPAAVGSFAPVLDRLIAFTGRQPTAGHVSAT"
+ gene 672409..673194
+ /gene="cfp32"
+ /locus_tag="BQ2027_MB0592"
+ CDS 672409..673194
+ /gene="cfp32"
+ /locus_tag="BQ2027_MB0592"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0592, TB27.3, len: 261 aa. Equivalent to Rv0577,
+ len: 261 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 261 aa overlap). TB27.3, conserved
+ hypothetical protein. Corresponds to O53774|CF30_MYCTU 27
+ KD ANTIGEN CFP30B from Mycobacterium tuberculosis culture
+ filtrate (260 aa), FASTA scores: opt: 1781, E(): 0,
+ (100.0% identity in 260 aa overlap). Also similar to
+ several hypothetical proteins and hydroxylases from
+ Steptomyces sp. e.g. T35032 probable hydroxylase from
+ Streptomyces coelicolor (263 aa); Q55078 orfA gene product
+ from Streptomyces sp. (275 aa), FASTA scores: E(): 1.5e-1
+ 9, (38.6% identity in 264 aa overlap); D89734_1|P95754 DNA
+ for SgaA SGAA PROTEIN from Streptomyces griseus; and
+ SC9B10_20 from Streptomyces coelicolor (267 aa), FASTA
+ score: (38.9 identity in 252 aa overlap). Also similar to
+ Rv0911|MTCY21C12.05 from Mycobacterium tuberculosis (257
+ aa), FASTA scores: E(): 1.1e-20, (32.0% identity in 259 aa
+ overlap). Protein product from Mb0592 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0592 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="27 kDa antigen Cfp30B"
+ /protein_id="CAB5248301.1"
+ /translation="MPKRSEYRQGTPNWVDLQTTDQSAAKKFYTSLFGWGYDDNPVPG
+ GGGVYSMATLNGEAVAAIAPMPPGAPEGMPPIWNTYIAVDDVDAVVDKVVPGGGQVMM
+ PAFDIGDAGRMSFITDPTGAAVGLWQANRHIGATLVNETGTLIWNELLTDKPDLALAF
+ YEAVVGLTHSSMEIAAGQNYRVLKAGDAEVGGCMEPPMPGVPNHWHVYFAVDDADATA
+ AKAAAAGGQVIAEPADIPSVGRFAVLSDPQGAIFSVLKPAPQQ"
+ gene complement(673239..677159)
+ /gene="PE_PGRS7"
+ /locus_tag="BQ2027_MB0593C"
+ CDS complement(673239..677159)
+ /gene="PE_PGRS7"
+ /locus_tag="BQ2027_MB0593C"
+ /note="Mb0593c, PE_PGRS7, len: 1306 aa. Equivalent to
+ Rv0578c, len: 1306 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.9% identity in 1306 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to many
+ other PGRS proteins e.g. MTCY493.04|Z95844 from M.
+ tuberculosis (1329 aa), FASTA scores: opt: 3994, E(): 0,
+ (54.6% identity in 1375 aa overlap). Contains two PS00583
+ pfkB family of carbohydrate kinases signatures possibly
+ fortuitously. Mb0593c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs7"
+ /protein_id="CAB5248302.1"
+ /translation="MSFVIATPEMLTTAATDLAKIGSTITAANTAAAAVAKVLPASAD
+ EVSVAVAALFGTHAQEYQTVSAQVATFHDRFVQTLSAAASSYVAAEAVNVEQSLLAAV
+ NAPTQALFGRPLIGNGADGSPGTGQAGGPGGILYGNGGNGGSGAPGQRGGAGGAAGLI
+ GNGGNGGAGGVGTTGGAGGHGGAGGWLYGNGGAGGFGGAGAVGGNGGAGGTAGLFGVG
+ GAGGAGGNGIAGVTGTSASTPGGSGTAGGAGGIGGNGGAGGAGGVLMGNGGNGGAGGE
+ GGPGGAGGAGASGAHATNLGADGQAGGNGGNGGAGGTGGVGGPGGGHGLLGLGGSHGA
+ GGAGGSGGDGGAPGDGGNGATGTWGHNLGAGGTGGNGGNPGAGGAGGAGGASVGGSAH
+ GANGAPGTTSTSGGNGGDGGKGADAISSGQTGANGGRGGDGGQVGNGGAGGAGGRGGA
+ GGLGFGSEAPGRPGGAGGTGGAGGNGGTQAGDGGTGGAGGAGGDGGSGGAGSIGFNAS
+ APGAAGSPGGNGGNGGPGGAGGEGGAGGLALAASGQNGSQGAGGDGGAGGNGGTPGNG
+ GHGAAGALGVNGGVGGAGGHGGDPGVGGAGGQGGSGSTPGANGAPGNTPTSGGNGGNG
+ GRGADATGFGQTGASGGRGGDGGLVGNGGAGGAGGNGSKGLPGLGRLGNPGLDGGTGG
+ NGGAGGSGGAWAGNGGTGGAGGTGGVGGTGGSGSDGVNGSSAGADGHPGGTGGVGGTG
+ GKGGDGGDGGAAPNGVAGSQGPGGAGGDGGTGGVGGNGGRGIDGADGATAGARGQDGG
+ AGGAGGKGGRGGTGGPGGAGPAGTTGSQGAGGNGGSGGTGGDPGDGGNGANGSVFTNN
+ GIGGNGGNGGNAGPSGAGGSGGAGSTFGATGSSSSIHVNGGNGGNGGNGDHALSGNGA
+ AGGNGGNGGNGSLRGSGGAGGHGGNGGNASRGMGGDGGTGGAGGNAGQIGNGGAGGNG
+ GDGGTGSDGNPGAITGSGGRGGDGGVGGQGGSVAGDGADGGRGGAGGTGGTGLRGTTG
+ ATGATGTFDAGADGHGGNGGTGGVGGTGGAGGGGGNGGAGGKALSPTGNNGSQGAGGD
+ GGAGGTGGTGGTGGDGGRGAHGTLFSSLAGTGGTGGNGGTGGTGGTGGAGGAGGTGST
+ LGATGATGAAGRAGNGGVGGSGGLGSAFGPGGTGGMGGAGGTSTVSAGGDGGRGGFGG
+ DGLDASSGGNGGDGGHGGDGFRTAGAGGRGGDGGKGADPGGLFPIPGAGGKGGTGGTG
+ GTAHLGPLAIIGQSGQPGQFGSPGADGRGGAGGAGGGGGAGGSF"
+ gene 677481..678239
+ /locus_tag="BQ2027_MB0594"
+ CDS 677481..678239
+ /locus_tag="BQ2027_MB0594"
+ /note="Mb0594, -, len: 252 aa. Equivalent to Rv0579, len:
+ 252 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 252 aa overlap). Conserved
+ hypothetical protein, showing some similarity to others
+ e.g. AE001747_4 hypothetical protein from Thermotoga
+ maritima (247 aa), FASTA scores: opt: 612, E(): 0, (39.6%
+ identity in 235 aa overlap); AE001004_2 hypothetical
+ protein from Archaeoglobus fulgidus (159 aa), FASTA
+ scores: opt: 196, E(): 1e-06, (28.3% identity in 159 aa
+ overlap); etc. Mb0594 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="CAB5248303.1"
+ /translation="MVGYVDVRAYAELNEFVELQARGLTVRRPFRSHQTVKDVLEAMG
+ IPHTEVDLILVNGDPADFSYRPVAGDRIAAYPMFEALDIGSTARLRPAPLRNPRFVVD
+ VNLGQLARLLRLLGFDTRWSSAADDPTLADISLGEQRILLTRDRGLLKRRAITHGLFV
+ HSQHPEEQALEVLRRLDLNGRLAPLSRCLRCNGELAAVSKDEVIGQLEPLTRRYYESF
+ SRCFGCGRIYWPGSHHARLVRLVERLRDQLTTST"
+ gene complement(678368..678859)
+ /locus_tag="BQ2027_MB0595C"
+ CDS complement(678368..678859)
+ /locus_tag="BQ2027_MB0595C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0595c, -, len: 163 aa. Equivalent to Rv0580c,
+ len: 163 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 163 aa overlap). Conserved
+ hypothetical protein, equivalent to AAA90989.1|U20446|MK35
+ lipoprotein precursor from Mycobacterium kansasii (225
+ aa). TBparse score is 0.910. Protein product from Mb0595c
+ detected using shotgun mass spectrometry. Mb0595c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="CAB5248304.1"
+ /translation="MTDQSYAVDIAHPPAALLRLVNPILRSLLHTPLAGPLRTQLMVV
+ SFTGRKTGRHFSIPLSAHVIDNDLYALTEAGWKHNFSDGAAAQVVYDGKTTAMRGELI
+ RDRAVVSELFLRAAQAYGVKRGQRMLGLSFRDRRIPTLEEFAEAVDRLKLVAIRLTPA
+ DNS"
+ gene 678953..679168
+ /gene="vapb26"
+ /locus_tag="BQ2027_MB0596"
+ CDS 678953..679168
+ /gene="vapb26"
+ /locus_tag="BQ2027_MB0596"
+ /note="Mb0596, -, len: 71 aa. Equivalent to Rv0581, len:
+ 71 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 71 aa overlap). Conserved hypothetical
+ protein, showing weak similarity to several Mycobacterium
+ tuberculosis proteins including
+ P95003|Z83863|Rv2550c|MTCY159_6 CONSERVED HYPOTHETICAL
+ PROTEIN (81 aa), FASTA scores: opt: 93, E(): 3.2, (25.7%
+ identity in 70 aa overlap); Rv2871; Rv1241; etc. Also
+ shows weak similarity to X05648|SGSPH_1 from Streptomyces
+ glaucescens (77 aa), FASTA scores: opt: 92, E(): 3.6,
+ (35.4% identity in 65 aa overlap). Protein product from
+ Mb0596 detected using SWATH mass spectrometry. Mb0596
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb26"
+ /protein_id="CAB5248305.1"
+ /translation="MDKTTVYLPDELKAAVKRAARQRGVSEAQVIRESIRAAVGGAKP
+ PPRGGLYAGSEPIARRVDELLAGFGER"
+ gene 679165..679572
+ /gene="vapc26"
+ /locus_tag="BQ2027_MB0597"
+ CDS 679165..679572
+ /gene="vapc26"
+ /locus_tag="BQ2027_MB0597"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0597, -, len: 135 aa. Equivalent to Rv0582, len:
+ 135 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 135 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0597 detected using SWATH
+ mass spectrometry. Mb0597 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc26. contains pin domain."
+ /protein_id="CAB5248306.1"
+ /translation="MIIDTSALLAYFDAAEPDHAAVSECIDSSADALVVSPYVVAELD
+ YLVATRVGVDAELAVLRELAGGAWELANCGAAEIEQAARIVTKYQDQRIGIADAANVV
+ LADRYRTRTILTLDRRHFSALRPIGGGRFTVIP"
+ gene complement(679632..680318)
+ /gene="lpqN"
+ /locus_tag="BQ2027_MB0598C"
+ CDS complement(679632..680318)
+ /gene="lpqN"
+ /locus_tag="BQ2027_MB0598C"
+ /note="Mb0598c, lpqN, len: 228 aa. Equivalent to Rv0583c,
+ len: 228 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 228 aa overlap). Probable lpqN,
+ conserved lipoprotein, equivalent to
+ AAA90989.1|U20446|MK35|U20446|MKU20446_1 lipoprotein
+ precursor from Mycobacterium kansasii (225 aa), FASTA
+ scores: opt: 945, E(): 0, (62.7% identity in 228 aa
+ overlap); and similar to others from Mycobacteria e.g.
+ Rv0040c and Rv1016c from Mycobacterium tuberculosis.
+ Contains N-terminal signal sequence and appropriately
+ positioned PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Protein product from Mb0598c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0598c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN LPQN"
+ /protein_id="CAB5248307.1"
+ /translation="MKHFTAAVATVALSLALAGCSFNIKTDSAPTTSPTTTSPTTSTT
+ TTSATTSAQAAGPNYTIADYIRDNHIQETPVHHGDPGSPTIDLPVPDDWRLLPESSRA
+ PYGGIVYTQPADPNDPPTIVAILSKLTGDIDPAKVLQFAPGELKNLPGFQGSGDGSAA
+ TLGGFSAWQLGGSYSKNGKLRTVAQKTVVIPSQGAVFVLQLNADALDDETMTLMDAAN
+ VIDEQTTITP"
+ gene 680472..683105
+ /locus_tag="BQ2027_MB0599"
+ CDS 680472..683105
+ /locus_tag="BQ2027_MB0599"
+ /note="Mb0599, -, len: 877 aa. Equivalent to Rv0584, len:
+ 877 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 877 aa overlap). Possible conserved
+ exported protein, similar to other hypothetical proteins
+ which are not necessarily secreted e.g.
+ CAB61925.1|AL133278 putative secreted protein from
+ Streptomyces coelicolor (772 aa);
+ AAD51075.1|AF175722_1|AF175722 immunoreactive 89kD antigen
+ PG87 from Porphyromonas gingivalis (781 aa), FASTA scores:
+ opt: 637, E(): 2.1e-30, (29.1% identity in 794 aa
+ overlap); etc. Contains PS00699 Nitrogenases component 1
+ alpha and beta subunits signature 1. Has potential
+ N-terminal signal peptide. Mb0599 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED EXPORTED PROTEIN"
+ /protein_id="CAB5248308.1"
+ /translation="MRARRLRRALAALLAVAGLFVPFIVGVPTAYDGEPVFVAIPVEH
+ VNTLIGTGTGAAIVGEINNFPGASVPFGMVQYSPDTVDNYAGYDYGNPHSTGFSMTHA
+ SVGCPAFGDISMLPTTTPLGSQPWSAWEEIAHDDTEVGVPGYYTVRFPGTGVIAELTA
+ TTRTGVGRFRYPRNGWPALFHVRSGASLAGNYAATLQIEDNTTITGSATSGGFCGKKN
+ LYTVYFAMKFSQPFSSYGTWDGYAVYPGSHSMNSSYSGGYVGFPAGSVLEVRTALSYV
+ SVDGARANLDAEGGASFDDIRAATSSEWNAALSRIAVAGRGPGDVDTFYTCLYRSLLH
+ PNTFNDVDGRYIGFDGVIHSVASGHTHYANFSDWDTYRSLAPLQGLLFPQRASDMIQS
+ LVTDAEQSGAYPRWALANSATGMMSGDSVVPLIVNLYAFGARDFDLKSALHYMVNAAT
+ QGGVGLDGFLERPGIAAYLRLGYGPQTAEFRANGRIAGASVTLEWSVDDFAISRFADS
+ LGDTATAAVFQNRSQYWQNLFNPTTGYISPRSAAGFFPDGPGFVAYPSGFGQDGYDEG
+ NAEQYLWWVPHNVAGLVTALGGRTAVVKRLDRFTKKLNVGPNEPYLWAGNEPGFGVPW
+ LYNYIGQPWKTQRTVDRVRGLFGPTPGGAPGNDDLGALSSWYVWAALGLYPSTPGTTI
+ LTVNTPLFDRAVIALPTGKSIQITAPGASGRNRLKYIDGLTIDRQPSNQTFLPESIVR
+ TGGDLTFSLAGTPNKVWGTAASAAPPSFGAGSSAVTVNIARPIIGIVPGATGTVTVDA
+ QRMIDGVDDYTVTPTSYVVGIAAEPLSGQFDDDGAVSASVAITVARSVPSGYYPIYVT
+ TSAGDSARTLIVLVVVAEAVE"
+ gene complement(683128..685515)
+ /locus_tag="BQ2027_MB0600C"
+ CDS complement(683128..685515)
+ /locus_tag="BQ2027_MB0600C"
+ /note="Mb0600c, -, len: 795 aa. Equivalent to Rv0585c,
+ len: 795 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 795 aa overlap). Probable conserved
+ integral membrane protein. C-terminus similar to
+ CAB88984.1|AL353864 putative integral membrane protein
+ from Streptomyces coelicolor (299 aa); and C-terminal
+ region of CAC01311.1|AL390968 putative integral membrane
+ protein from Streptomyces coelicolor (925 aa). Also some
+ similarity with Rv0204 from Mycobacterium tuberculosis.
+ Protein product from Mb0600c detected using SWATH mass
+ spectrometry. Mb0600c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="CAB5248309.1"
+ /translation="MRVDGRDIGVSGNLLQPLTRRTNDIIRAVLAAIYLVAVITSSLI
+ TRPQWVALEKSISEIVGVLSPSQSDLVYLGYGLAILALPFVILIGLIVSRQWKLLGAY
+ AAAGLMAVLPLSISSSRIAAPRWHFDLSDRLATLLAQFLDDPRWIAILAAVLTVSGPW
+ LPARWRHWWWALLLAFVPIHLVVSAIVPARSLLGLAVGWLVGALVVLVVGTPALEVPL
+ DGAIRALAKRGFAVSGLAVVRPAGPGPLVLSAACEQPNAGACSEALIELYGPHQSGGG
+ ALRQLWLKLTLRGTETAPLQASMRRAVEHRALMAIAFGDLGMANTTVIAVSPLDRGWT
+ LYAHRPARGIGISECTKTTPTAHVWEALRTLHDQQISHGDLCSAEITVDNGAVLFGGF
+ GEAEYGATDAQLQSDLAQLLVTTSALYDAEAAVTAAIDTFGKQAILAASRRLTKSAVP
+ KRIRESITDPNAVIASTRAEVMRQTGADQIKAETITRFSRGQLIQLVLIGALVYVAYP
+ FISTVPTFFSQLRTANWWWALLGLAVSALTYVGAAAALWACADGLVGFWKLSIMQVAN
+ TFAATTTPAGVGGLALSTRFLQKGGLTAVRATAAVALQQSVQVIVHLVLLILFSALAG
+ TSTDLSHFVPNATVLYLIAGVALGIVGTFLFVPKLRRWLATAVRPKLREVTNDLIALA
+ REPKRLALIVLGCAGTTLGAALALWASIEAFGGGTTFVTVTVVTMVGGTLASAAPTPG
+ GVGAVEAALIGGLAAFGVPAALGVPSVLLYRLLTCWLPVFAGWQVMHWLTRHEMI"
+ gene 685653..686375
+ /gene="mce2r"
+ /locus_tag="BQ2027_MB0601"
+ CDS 685653..686375
+ /gene="mce2r"
+ /locus_tag="BQ2027_MB0601"
+ /note="Mb0601, -, len: 240 aa. Equivalent to Rv0586, len:
+ 240 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 240 aa overlap). Probable
+ transcriptional regulator, GntR family, similar to many
+ e.g. P33233|LLDR_ECOLI putative L-lactate dehydrogenase
+ operon regulatory protein from Escherichia coli (258 aa),
+ FASTA scores: opt: 225, E(): 9.3e-08, (26.7% identity in
+ 232 aa overlap); etc. Also similar to other M.
+ tuberculosis transcriptional regulators GntR proteins e.g.
+ Rv3060c, Rv0792c, etc. Contains PS00043 Bacterial
+ regulatory proteins, gntR family signature and probable
+ helix-turn helix motif from aa 35-56 (Score 1531, +4.40
+ SD). Protein product from Mb0601 detected using SWATH mass
+ spectrometry. Mb0601 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transcriptional regulatory protein
+ mce2r (gntr-family)"
+ /protein_id="CAB5248310.1"
+ /translation="MALQPVTRRSVPEEVFEQIATDVLTGEMPPGEALPSERRLAELL
+ GVSRPAVREALKRLSAAGLVEVRQGDVTTVRDFRRHAGLDLLPRLLFRNGELDISVVR
+ SILEARLRNFPKVAELAAERNEPELAELLQDSLRALDTEEDPIVWQRHTLDFWDHVVD
+ SAGSIVDRLMYNAFRAAYEPTLAALTTTMTAAAKRPSDYRKLADAICSGDPTGAKKAA
+ QDLLELANTSLMAVLVSQASRQ"
+ gene 686372..687169
+ /gene="yrbE2A"
+ /locus_tag="BQ2027_MB0602"
+ CDS 686372..687169
+ /gene="yrbE2A"
+ /locus_tag="BQ2027_MB0602"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0602, yrbE2A, len: 265 aa. Equivalent to Rv0587,
+ len: 265 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 265 aa overlap). yrbE2A, hypothetical
+ unknown integral membrane protein, part of mce2 operon and
+ member of YrbE family (see citations below for more
+ information), highly similar to Mycobacterium tuberculosis
+ proteins O07412|Rv0167|MTCI28.07|yrbE1A (265 aa);
+ O53965|Rv1964|MTV051.02|yrbE3A (265 aa); etc. Also highly
+ similar to conserved hypothetical integral membrane
+ proteins of the yrbEA type, e.g. P45392|YRBE_ECOLI
+ hypothetical 27.9 kDa protein from Escherichia coli (260
+ aa), FASTA scores: opt: 287, E(): 6.1e-12, (21.5% identity
+ in 256 aa overlap); P45030|YRBE_HAEIN|HI1086 hypothetical
+ protein from Haemophilus influenzae (261 aa), FASTA
+ scores: opt: 311, E(): 1.8e-83, (24.2% identity in 265 aa
+ overlap); NP_302654.1|NC_002677 conserved membrane protein
+ from Mycobacterium leprae (267 aa); etc. Mb0602 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL INTEGRAL MEMBRANE PROTEIN
+ YRBE2A"
+ /protein_id="CAB5248311.1"
+ /translation="MTTHAVIITYLRDQTQPAVDAIGGFYRTCVLTGKALVRRPFHWR
+ EAIEQGWFITSVSLLPTLAVSIPLTVLIIFTLNILLAEFGAADISGAGAALGAVTQLG
+ PLTTVLVIAGAGATAICADLGARTIREEIDAMEVLGIDPIHRLVVPRVVAATIVAALL
+ NGAVITIGLVGGFVFSVFIQHVSAGAYVGTLTLVTGLPEVIISVVKSATFGLIAGLVG
+ CYRGLTTKGGPKGVGTAVNETLVLCVIALFATNVVLTTIGVRFGTGH"
+ gene 687171..688058
+ /gene="yrbE2B"
+ /locus_tag="BQ2027_MB0603"
+ CDS 687171..688058
+ /gene="yrbE2B"
+ /locus_tag="BQ2027_MB0603"
+ /note="Mb0603, yrbE2B, len: 295 aa. Equivalent to Rv0588,
+ len: 295 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 295 aa overlap). yrbE2B, hypothetical
+ unknown integral membrane protein, part of mce2 operon and
+ member of YrbE family (see citations below for more
+ information), highly similar to Mycobacterium tuberculosis
+ proteins O07413|Rv0168|MTCI28.08|yrbE1B (289 aa);
+ O53966|Rv1965|MTV051.03|yrbE3B (271 aa); etc. Also highly
+ similar to conserved hypothetical integral membrane
+ proteins of the yrbEB type, e.g. P45392|YRBE_ECOLI
+ hypothetical 27.9 kd protein from Escherichia coli (260
+ aa), FASTA scores: opt: 232, E(): 8.4e-08, (22.1 %
+ identity in 267 aa overlap); P45030|YRBE_HAEIN|HI1086
+ hypothetical protei from Haemophilus influenzae (261 aa),
+ FASTA scores: opt: 234, E(): 6.3e-08, (24.2% identity in
+ 215 aa overlap); NP_302655.1|NC_002677 conserved membrane
+ protein from Mycobacterium leprae (289 aa); etc. Mb0603
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL INTEGRAL MEMBRANE PROTEIN
+ YRBE2B"
+ /protein_id="CAB5248312.1"
+ /translation="MVESSTASAAAVLRARYPRTAASLDRYGGGTARRLERTGTFARF
+ TRISVVQIGWALRRYRRETLRLVAEIGMGTGAMAVVGGTVAIIGFVTLSGGSLIAIQG
+ FASLGNIGVEAFTGFFAALANTRVAAPIVSGVALAATVGAGATAQLGAMRISEEIDAL
+ EVMGIKSISFLVSTRILGGLVVIMPLYALALDMAFTSGQVVTTVFYGQSNGTYEHYFR
+ TFLRPEDVGWSVVEVVIIAVVVMITHCYYGYTASGGPVGVGQAVGRSMRFSLVSVVVV
+ VLLAELALYGVDPNFNLTV"
+ gene 688064..689278
+ /gene="mce2A"
+ /locus_tag="BQ2027_MB0604"
+ CDS 688064..689278
+ /gene="mce2A"
+ /locus_tag="BQ2027_MB0604"
+ /note="Mb0604, mce2A, len: 404 aa. Equivalent to Rv0589,
+ len: 404 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 404 aa overlap). mce2A; belongs to
+ 24-membered Mycobacterium tuberculosis Mce protein family
+ (see citations below for more information), highly similar
+ to Mycobacterium tuberculosis proteins
+ P72013|MCE1|Rv0169|MTCI28.09|mce1A (454 aa);
+ O53967|MCE3|Rv1966|MTV051.04|mce3A (425 aa); etc. Also
+ highly similar to others e.g.
+ AAD52105.1|AF113402_1|AF113402 mycobacterial cell entry
+ protein from Mycobacterium bovis BCG (454 aa);
+ NP_302656.1|NC_002677 putative cell invasion protein from
+ Mycobacterium leprae (441 aa); CAC12798.1|AL445327
+ putative secreted protein from Streptomyces coelicolor
+ (418 aa); etc. Also highly similar, but longer 21 aa, to
+ P72013|CAA50257.1|X70901|MTCI28.08 Mcep protein from
+ Mycobacterium tuberculosis (432 aa), FASTA scores: opt:
+ 1324, E(): 0, (62.6% identity in 436 aa overlap). Contains
+ a possible N-terminal signal or anchor sequence. Note that
+ previously known as mce2. Mb0604 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MCE-FAMILY PROTEIN MCE2A"
+ /protein_id="CAB5248313.1"
+ /translation="MPTLVTRKNRRAWLYVEGVVLLLVGALVLVLVYKQFRGEFTPKT
+ ELTMVASRAGLVMEAGSKVTYNGVEIGRVGSISEIERDGRPAAKLVLDVNPRYISLIP
+ VNVVADIEAATLFGNKYVALSAPKIPQQQRISSHDVIDVGSVTTEFNTLFETITSIAE
+ KVDPIELNATLSAVAQAPDGLGGKFGESIVNGNQILAQLNPRLPQLGYDVRRLADLGE
+ VYVDASPDLWSFLQNALTTARTLTSQQRDLDAALLAATGAGNTGEDVFARGGPYLARA
+ AADLVPTATLLDTYSPELFCMIRNFHDAAPKVADAVGGNGYSLAAAGTILGAPNPYVY
+ PDNLPRVNAHGGPGGRPGCWQTITRELWPAPYLVMDTGASLAPYNHVELGQPMFTEYV
+ WGRQYGENTINP"
+ gene 689275..690306
+ /gene="mce2B"
+ /locus_tag="BQ2027_MB0605"
+ CDS 689275..690306
+ /gene="mce2B"
+ /locus_tag="BQ2027_MB0605"
+ /note="Mb0605, mce2B, len: 343 aa. Equivalent to Rv0590
+ and Rv0590A, len: 275 aa and 84 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 255 aa
+ overlap and 100.0% identity in 84 aa overlap). mce2B:
+ belongs to 24-membered Mycobacterium tuberculosis Mce
+ protein family (see citations below for more information),
+ highly similar to Mycobacterium tuberculosis proteins
+ O07414|Rv0170|MTCI28.10|mce1B (346 aa);
+ O53968|Rv1967|MTV051.05|mce3B (342 aa); etc. Also highly
+ similar to others e.g. NP_302657.1|NC_002677 putative
+ secreted protein from Mycobacterium leprae (346 aa);
+ P45391|YRBD_ECOLI hypothetical 19.6 kd protein from
+ Escherichia coli (183 aa), FASTA scores: opt: 160, E():
+ 0.00099, (28.3% identity in 166 aa overlap);
+ P45029|YRBD_HAEIN|HI1085 hypothetical protein from
+ Haemophilus influenzae (167 aa), FASTA scores: opt: 135,
+ E():0.035, (25.9% identity in 143 aa overlap); etc.
+ Contains possible N-terminal signal or anchor sequence.
+ Rv0590A: probable continuation of mce2B|Rv0590. Can find
+ no frameshift to account for this. Possible nucleotide G
+ missing at 688793 as there are 5 in Mycobacterium bovis
+ but only 4 in CDC1551. Strong similarity to C-terminus of
+ other Mce proteins e.g. AL583926|AL583926_38 from
+ Mycobacterium leprae strain TN (346 aa), FASTA scores:
+ E(): 1.2e-20, (67.85% identity in 84 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, mce2B and Rv0590A are 2 genes,
+ most likely to be linked. In Mycobacterium bovis, an
+ in-frame insertion of a single base (*-g) leads to a
+ single product. Mb0605 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="mce-family related protein"
+ /protein_id="CAB5248314.1"
+ /translation="MKTTGTTIKLGIVWLVLSVFTVMIIVVFGQVRFHHTTGYSAVFT
+ HVSGLRAGQFVRAAGVEVGKVAKVTLIDGDKQVLVDFTVDRSLSLDQATTASIRYLNL
+ IGDRYLELGRGHSGQRLAPGATIPLEHTHPALDLDALLGGFRPLFQTLDPDKVNSIAS
+ SIITVFQGQGATINDILDQTASLTATLADRDHAIGEVVNNLNTVLATTVKHQTEFDRT
+ VDKLEVLITGLKNRADPLAAAAAHISSAAGTLADLLGADRPLLHSSFGHLEGIQQPLI
+ DELAELDHVLGKLPDAYRIIGRAGGIYGDFFNFYLCDISLKVNGLQPGGPVRTVKLFG
+ QPTGRCTPQ"
+ gene 690303..691748
+ /gene="mce2C"
+ /locus_tag="BQ2027_MB0606"
+ CDS 690303..691748
+ /gene="mce2C"
+ /locus_tag="BQ2027_MB0606"
+ /note="Mb0606, mce2C, len: 481 aa. Equivalent to Rv0591,
+ len: 481 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 481 aa overlap). mce2C; belongs to
+ 24-membered Mycobacterium tuberculosis Mce protein family
+ (see citations below for more information), highly similar
+ to Mycobacterium tuberculosis proteins
+ O07415|R0171|MTCI28.11|mce1C (515 aa);
+ O53969|Rv1968|MTV051.06|mce3C (410 aa); etc. Also highly
+ similar to others e.g. NP_302658.1|NC_002677 putative
+ secreted protein from Mycobacterium leprae (519 aa);
+ CAC12796.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (351 aa); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop), and may contain
+ N-terminal signal or anchor sequence. Has highly Pro-rich
+ C-terminus. Mb0606 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MCE-FAMILY PROTEIN MCE2C"
+ /protein_id="CAB5248315.1"
+ /translation="MRTLTEFNRGRVGMMGAVVTVLVVGVAQSFTSVPMLFATPTYYA
+ QFADMGGINTGDKVEIAGVNVGLVRSLAIRGNRVLIGFSLPGKTIGMQSRAAIRTDTI
+ LGRKNLEIEPRGSEPLKPNGFLPLAQTTTPYQIYDAFVDVTKAATGWDIDAVKRSLNV
+ LSETFDQTAPHLSAALEGVKAFSDTVGRRGEQIEQLLANANRIARVLGDRSEQVNGLL
+ VNAKTLLAAFKQRSQALRILLTNVSEASAQVSGLITDNPNLNHVLAQLRTVSEELVKR
+ KNELADVAVLLGRYTAALTEAVGSGPFFKAMVVNLLPYQILQPWVDAAFKKRGIDPEN
+ FWRSAGLPEFRWPDPNGTRFPNGAPPAAPPVREGTPKHPGPAVPPGTPCSYTPAAGAL
+ PRPDNPLPCAGATVGPFGGPDFPAPLDVQPSPPNPDGPPPTPGILSAGRPGEPAPAVP
+ GIPMPLPPNAPPGARTQPLEPFPDGTGGSNQ"
+ gene 691745..693181
+ /gene="mce2Da"
+ /locus_tag="BQ2027_MB0607"
+ CDS 691745..693181
+ /gene="mce2Da"
+ /locus_tag="BQ2027_MB0607"
+ /note="Mb0607, mce2Da, len: 478 aa. Equivalent to 5' end
+ of Rv0592, len: 508 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.2% identity in 471 aa overlap). mce2D;
+ belongs to 24-membered Mycobacterium tuberculosis Mce
+ protein family (see citations below for more information),
+ highly similar to Mycobacterium tuberculosis proteins
+ O07416|Rv0172|MTCI28.12|mce1D (530 aa);
+ O53970|Rv1969|MTV051.07|mce3D (423 aa); etc. Also highly
+ similar to others e.g. NP_302659.1|NC_002677 putative
+ secreted protein from Mycobacterium leprae (531 aa);
+ CAC12795.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (337 aa); etc. Has highly Pro-rich
+ C-terminus and may contain N-terminal signal or anchor
+ sequence. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, mce2D exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-c) splits mce2D into 2 parts, mce2Da and
+ mce2Db. Mb0607 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="MCE-FAMILY PROTEIN MCE2DA [FIRST PART]"
+ /protein_id="CAB5248316.1"
+ /translation="MSTIFDIRSLRLPKLSAKVVVVGGLVVVLAVVAAAAGARLYRKL
+ TTTTVVAYFSEALALYPGDKVQIMGVRVGSIDKIEPAGDKMRVTLHYSNKYQVPATAT
+ ASILNPSLVASRTIQLSPPYTGGPVLQDGAVIPIERTQVPVEWDQLRDSINGILRQLG
+ PTERQPKGPFGDLIESAADNLAGKGRQLNETLNSLSQALTALNEGRGDFVAITRSLAL
+ FVSALYQNDQQFVALNENLAEFTDWFTKSDHDLADTVERIDDVLGTVRKFVSDNRSVL
+ AADVNNLADATTTLVQPEPRDGLETALHVLPTYASNFNNLYYPLHSSLVGQFVFPNFA
+ NPIQLICSAIQAGSRLGYQESAELCAQYLAPVLDALKFNYLPFGSNPFSSAATLPKEV
+ AYSEERLRPPPGYKDTTVPGIFSRDTPFSHGNHEPGWVVAPGMQGMQVQPFTANMLTP
+ ESLAELLGGPDIAPPAAGNQLARTAECV"
+ gene 693129..693272
+ /gene="mce2Db"
+ /locus_tag="BQ2027_MB0608"
+ /pseudo
+ CDS 693129..693272
+ /gene="mce2Db"
+ /locus_tag="BQ2027_MB0608"
+ /note="Mb0608, mce2Db, len: 47 aa. Equivalent to 3' end of
+ Rv0592, len: 508 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (95.7% identity in 47 aa overlap). mce2D;
+ belongs to 24-membered Mycobacterium tuberculosis Mce
+ protein family (see citations below for more
+ information),highly similar to Mycobacterium tuberculosis
+ proteins O07416|Rv0172|MTCI28.12|mce1D (530 aa);
+ O53970|Rv1969|MTV051.07|mce3D (423 aa); etc. Also highly
+ similar to others e.g. NP_302659.1|NC_002677 putative
+ secreted protein from Mycobacterium leprae (531 aa);
+ CAC12795.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (337 aa); etc. Has highly Pro-rich
+ C-terminus and may contain N-terminal signal or anchor
+ sequence. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, mce2D exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-c) splits mce2D into 2 parts, mce2Da and
+ mce2Db.;MCE-FAMILY PROTEIN MCE2DB [SECOND PART]"
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene 693269..693835
+ /gene="lprL"
+ /locus_tag="BQ2027_MB0609"
+ CDS 693269..693835
+ /gene="lprL"
+ /locus_tag="BQ2027_MB0609"
+ /note="Mb0609, lprL, len: 188 aa. Equivalent to 5' end of
+ Rv0593, len: 402 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 188 aa overlap).
+ Possible lprL (alternate gene name: mce2E), lipoprotein
+ which belongs to 24-membered Mycobacterium tuberculosis
+ Mce protein family (see citations below for more
+ information), highly similar to Mycobacterium tuberculosis
+ proteins O07417|LPRK|Rv0173|MTCI28.13|mce1E (390 aa);
+ O53971|LPRM|Rv1970|MTV051.08|mce3E (377 aa); etc. Also
+ highly similar to others e.g. NP_302660.1|NC_002677
+ putative lipoprotein from Mycobacterium leprae (392 aa);
+ CAC12794.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (413 aa); etc. Contains possible
+ signal sequence and PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base transition (c-t) introducing a stop codon,
+ leads to the formation of a truncated product compared to
+ its homolog in Mycobacterium tuberculosis strain H37Rv
+ (188 aa versus 402 aa). Mb0609 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MCE-FAMILY LIPOPROTEIN LPRL (MCE-FAMILY
+ LIPOPROTEIN MCE2E)"
+ /protein_id="CAB5248318.1"
+ /translation="MRCGVSAGSANGKPNRWTLRCGVSAGHRGSVFLLAVLLAPVVLT
+ SCTWRGIANVPLPVGRGMGPDRMTIYVQMPDTLALNTNSRVRVADVWVGTVRDISLRN
+ WIATLTLELEPTVRLPANATAKIGQTSLLGTQHVELAAPPIPSPQPLKSGDTIGLKNS
+ SAYPTVERTLASVALILTGGGIVNLDVI"
+ gene 694482..696032
+ /gene="mce2F"
+ /locus_tag="BQ2027_MB0610"
+ CDS 694482..696032
+ /gene="mce2F"
+ /locus_tag="BQ2027_MB0610"
+ /note="Mb0610, mce2F, len: 516 aa. Equivalent to Rv0594,
+ len: 516 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 516 aa overlap). mce2F; belongs to
+ 24-membered Mycobacterium tuberculosis Mce protein family
+ (see citations below for more information), similar to
+ Mycobacterium tuberculosis proteins
+ O07418|Rv0174|MTCI28.14|mce1F (515 aa);
+ O53972|Rv1971|MTV051.09|mce3F (437 aa); etc. Also highly
+ similar to others e.g. NP_302661.1|NC_002677 putative
+ secreted protein from Mycobacterium leprae (516 aa);
+ AAF74993.1|AF143400_1|AF143400|996A027a protein from
+ Mycobacterium avium (80 aa) (similarity on C-terminus);
+ CAC12793.1|AL445327 putative secreted protein from
+ Streptomyces coelicolor (433 aa); etc. Contains possible
+ N-terminal signal or anchor sequence. Mb0610 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MCE-FAMILY PROTEIN MCE2F"
+ /protein_id="CAB5248319.1"
+ /translation="MLTRAIKTQLVLLTVLAVIAVVVLGWYFLRIPSLVGIGRYTLYA
+ ELPRSGGLYRTANVTYRGITIGKVTGVEPTERGARATMSIDNGYQIPTDASANVHSVS
+ AVGEQFVDLVSTRTSGPYLRHGQTITTTTVPSQIGPALDAANRGLAVLPKDRVASVLH
+ EASEAVGGLGSSLNRLIEATQAIAHDVRGSLEDIDDIIERSAPIIDSQVNSGNEIARW
+ AANLNTLAAQTAQTDPAVRSILANAAPTADQVNATFSDVRESLPQTLANLEVVIDMLK
+ RYHNGVEQALVFLPQSGAIAQSVTTEFPGQAGLGVGGLALNQPPPCLTGFLPASEWRS
+ PADTSTAPLPKGTYCRIPMDASNVVRGARNNPCVDVPGKRAATPRECRSNEAYVPGGT
+ NPWYGDPNQMLSCPAPAARCDQPVKPGQVIPAPSVNNGINPLPADQLPGTPPPVNDPL
+ QRPGSGTVQCNGQQPNPCVYTPSTFPTTIYDVQSGKVVAPDGVVYSVEASTHAGADGW
+ KVMLAPTG"
+ gene complement(696084..696476)
+ /gene="vapc4"
+ /locus_tag="BQ2027_MB0611C"
+ CDS complement(696084..696476)
+ /gene="vapc4"
+ /locus_tag="BQ2027_MB0611C"
+ /note="Mb0611c, -, len: 130 aa. Equivalent to Rv0595c,
+ len: 130 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 130 aa overlap). Conserved
+ hypothetical protein, similar to other conserved
+ hypothetical proteins e.g. Rv0627 (135 aa) and Rv0665 (112
+ aa) from Mycobacterium tuberculosis; and STBB_PSESM|Q52562
+ plasmid stability protein from Pseudomonas syringae (139
+ aa), FASTA scores: opt: 131, E(): 0.0035, (35.2% identity
+ in 88 aa overlap). Protein product from Mb0611c detected
+ using SWATH mass spectrometry. Mb0611c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc4"
+ /protein_id="CAB5248320.1"
+ /translation="MNVRRALADTSVFIGIEATRFDPDRFAGYEWGVSVVTLGELRLG
+ VLQASGPEAAARRLSTYQLAQRFEPLGIDEAVSEAWALLVSKLRAAKLRVPINDSWIA
+ ATAVAHGIAILTQDNDYAAMPDVEVITI"
+ gene complement(696473..696730)
+ /gene="vapb4"
+ /locus_tag="BQ2027_MB0612C"
+ CDS complement(696473..696730)
+ /gene="vapb4"
+ /locus_tag="BQ2027_MB0612C"
+ /note="Mb0612c, -, len: 85 aa. Equivalent to Rv0596c, len:
+ 85 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 85 aa overlap). Conserved hypothetical
+ protein, highly similar in part to other Mycobacterium
+ tuberculosis hypothetical proteins e.g. Rv0626, Rv3181c,
+ Rv3385c, Rv3407, etc."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb4"
+ /protein_id="CAB5248321.1"
+ /translation="MSATIPARDLRNHTAEVLRRVAAGEEIEVLKDNRPVARIVPLKR
+ RRQWLPAAEVIGELVRLGPDTTNLGEELRETLTQTTDDVRW"
+ gene complement(696913..698148)
+ /locus_tag="BQ2027_MB0613C"
+ CDS complement(696913..698148)
+ /locus_tag="BQ2027_MB0613C"
+ /note="Mb0613c, -, len: 411 aa. Equivalent to Rv0597c,
+ len: 411 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 411 aa overlap). Conserved
+ hypothetical protein, highly similar to Rv3179 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (429
+ aa). Also similar to AAF76191.1|AF271296_1|AF271296
+ putative ATP/GTP binding protein from Mycobacterium
+ smegmatis (428 aa); Rv2008c|YW09_MYCTU|Q10849 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (441
+ aa), FASTA scores: opt: 270, E(): 3.6e-11, (30.5% identity
+ in 416 aa overlap) (N-terminus longer). Also similar to
+ other hypothetical proteins e.g. NP_085874.1|NC_002679
+ hypothetical protein from Mesorhizobium loti (435 aa)
+ (N-terminus longer). Contains PS00017 ATP/GTP-binding site
+ motif A (P-loop). Protein product from Mb0613c detected
+ using SWATH mass spectrometry. Mb0613c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ATPase"
+ /protein_id="CAB5248322.1"
+ /translation="MGVVERAIAPSVLAALADTPVVVVNGARQVGKTTLVARLDYPGS
+ SEVVSLDDVANRDAARDDPRAFVSRPVDTLVIDEAQLEPGLFRAIKAEVDRDRRPGRF
+ LLTGSARLLSAPDMADALVGRVEIIELWPFSQGERAGIADGFVDALFTAPRELIHGSD
+ MRRADLVDRIATGGFPDIVARSPSRRRAWFDNYLTTATQSVIREISPIERLAEMPRVL
+ RLCAARTGAELNVSALANDLSIPARTTAGYLALLEAAFLIHRVPAWSTNLSRKVIRRP
+ KLVVSDSGLACHLLGVTGATLDRPGRPLGPLLETFVANEIRKQLTWSTERPSLWHFRD
+ RGGAEVDLVLEHPDGRVCGIEVKATSTPRAEDLRGLRYLAERLDDRFQFGVLLTAAPE
+ ATPFGPTLAALPVSTLWAG"
+ gene complement(698399..698812)
+ /gene="vapc27"
+ /locus_tag="BQ2027_MB0614C"
+ CDS complement(698399..698812)
+ /gene="vapc27"
+ /locus_tag="BQ2027_MB0614C"
+ /note="Mb0614c, -, len: 137 aa. Equivalent to Rv0598c,
+ len: 137 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 137 aa overlap). Conserved
+ hypothetical protein; similar to Rv2596|Y0B5_MYCTU|Q50625
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium
+ tuberculosis (134 aa), FASTA scores: opt: 254, E():
+ 8.2e-12, (41.5% identity in 130 aa overlap). Protein
+ product from Mb0614c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0614c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc27. contains pin domain."
+ /protein_id="CAB5248323.1"
+ /translation="MKPPLAVDTSVAIPLLVRTHTAHAAVVAWWAHREAALCGHALAE
+ TYSVLTRLPRDLRLAPMDAARLLTERFAAPLLLSSRTTEHLPRVLAQFEITGGAVYDA
+ LVALAAAEHRAELATRDARAKDTYEKIGVHVVVAA"
+ gene complement(698809..699045)
+ /gene="vapb27"
+ /locus_tag="BQ2027_MB0615C"
+ CDS complement(698809..699045)
+ /gene="vapb27"
+ /locus_tag="BQ2027_MB0615C"
+ /note="Mb0615c, -, len: 78 aa. Equivalent to Rv0599c, len:
+ 78 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 78 aa overlap). Conserved hypothetical
+ protein, similar to Rv2595|Y0B6_MYCTU|Q50626 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (81
+ aa), FASTA scores: opt: 160, E(): 6.2e-07, (35.8% identity
+ in 81 aa overlap). N-terminus shows stong similarity with
+ N-terminus of NP_104908.1|NC_002678 hypothetical protein
+ from Mesorhizobium loti (89 aa). Protein product from
+ Mb0615c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0615c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb27"
+ /protein_id="CAB5248324.1"
+ /translation="MKAVVDAAGRIVVPKPLREALGLQPGSTVEISRYGAGLHLIPTG
+ RTARLEEENGVLVATGETTIDDEVVFGLIDSGRK"
+ gene complement(699149..699655)
+ /locus_tag="BQ2027_MB0616C"
+ CDS complement(699149..699655)
+ /locus_tag="BQ2027_MB0616C"
+ /note="Mb0616c, -, len: 168 aa. Equivalent to Rv0600c,
+ len: 168 aa (probable partial CDS), from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 168 aa
+ overlap). Probable two-component sensor kinase (second
+ part) (EC 2.7.3.-), similar to part (C-termini) of many
+ others e.g. Q04943|AFQ2_STRCO sensor protein afsq2 from
+ Streptomyces coelicolor (535 aa), FASTA scores: opt: 347,
+ E(): 1.9e-12, (33.0% identity in 206 aa overlap); etc.
+ Note that sequence was checked and no errors were
+ detected, which would allow this and the upstream ORF to
+ be joined."
+ /codon_start=1
+ /transl_table=11
+ /product="two component sensor kinase [second part]"
+ /protein_id="CAB5248325.1"
+ /translation="MPITPLLHESVARFAATGADITTRAEPDLFVSIDPDHLRRILTA
+ VLDNAITHGDGEIAVTAHARDGAVDIGVRDHGPGFADHFLPVAFDRFTRADTARGGRG
+ SGLGLAIVAALTTTHGGHANATNHPDGGAELRITLPTPRPPFHEELPRITSSDTKDPN
+ REHDTSDQ"
+ gene complement(699769..700239)
+ /locus_tag="BQ2027_MB0617C"
+ CDS complement(699769..700239)
+ /locus_tag="BQ2027_MB0617C"
+ /note="Mb0617c, -, len: 156 aa. Equivalent to Rv0601c,
+ len: 156 aa (probable partial CDS), from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 156 aa
+ overlap). Probable two-component sensor kinase (first
+ part) (EC 2.7.3.-), similar to part (N-termini) of others
+ e.g. Q0375|CUTS_STRLI cuts protein from streptomyces
+ lividans (414 aa), FASTA scores: opt: 230, E(): 3.1e-08,
+ (39.1% identity in 115 aa overlap). Note that the sequence
+ was checked and no errors were detected that would allow
+ this and the downstream ORF to be joined."
+ /codon_start=1
+ /transl_table=11
+ /product="two component sensor kinase [first part]"
+ /protein_id="CAB5248326.1"
+ /translation="MALVLAAAGAVTVVQFRDAAHEADPDGALRGLTDDITADLVREL
+ VTILPIVLVIAAVAAYLLSRAALRPVDRIRAAAQTLTTTPHPDTDAPLPVPPTDDEIA
+ WLATTLNTMLTRLQRALAHEQQFVADASHELRTPLALLTTELELRCAGPDPPTS"
+ gene complement(700283..701044)
+ /gene="tcrA"
+ /locus_tag="BQ2027_MB0618C"
+ CDS complement(700283..701044)
+ /gene="tcrA"
+ /locus_tag="BQ2027_MB0618C"
+ /note="Mb0618c, tcrA, len: 253 aa. Equivalent to Rv0602c,
+ len: 253 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 253 aa overlap). Probable tcrA,
+ two-component DNA-binding response regulator, highly
+ similar to others e.g. NP_107959.1|NC_002678 two-component
+ response regulator from Mesorhizobium loti (239 aa); etc.
+ Also similar to many other Mycobacterium tuberculosis
+ two-component regulators e.g. Q50806|MTCY10G2.16|Rv1033c
+ RESPONSE REGULATOR HOMOLOG TRCR (TCRV) (257 aa), FASTA
+ score: (47.4 identity in 232 aa overlap); etc."
+ /codon_start=1
+ /transl_table=11
+ /product="two component dna binding transcriptional
+ regulatory protein tcra"
+ /protein_id="CAB5248327.1"
+ /translation="MADETTMRAGRGPGRACGRVSGVRILVIEDEPKMTALLARALTE
+ EGHTVDTVADGRHAVAAVDGGDYDAVVLDVMLPGIDGFEVCARLRRQRVWTPVLMLTA
+ RGAVTDRIAGLDGGADDYLTKPFNLDELFARLRALSRRGPIPRPPTLEAGDLRLDPSE
+ HRVWRADTEIRLSHKEFTLLEALIRRPGIVHTRAQLLERCWDAAYEARSNIVDVYIRY
+ LRDKIDRPFGVTSLETIRGAGYRLRKDGGRHALPR"
+ gene 701101..701412
+ /locus_tag="BQ2027_MB0619"
+ CDS 701101..701412
+ /locus_tag="BQ2027_MB0619"
+ /note="Mb0619, -, len: 103 aa. Equivalent to Rv0603, len:
+ 103 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.1% identity in 103 aa overlap). Possible exported
+ protein with hydrophobic stretch at aa 7-29."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE EXPORTED PROTEIN"
+ /protein_id="CAB5248328.1"
+ /translation="MNRIVQFGVSAVAAAAIGIGAGSGIAAAFDGEDEVTGPDADRAR
+ AAAVQAVPGGTAGEVETETGEGAAAYGVLVTRADGTRVEVHLDRDFRVLDTKPADGDG
+ G"
+ gene 701484..702434
+ /gene="lpqO"
+ /locus_tag="BQ2027_MB0620"
+ CDS 701484..702434
+ /gene="lpqO"
+ /locus_tag="BQ2027_MB0620"
+ /note="Mb0620, lpqO, len: 316 aa. Equivalent to Rv0604,
+ len: 316 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 316 aa overlap). Probable lpqO,
+ conserved lipoprotein, highly similar to Rv2999|lppY
+ PUTATIVE LIPOPROTEIN from Mycobacterium tuberculosis (321
+ aa), FASTA scores: opt: 1153, E(): 0, (53.2% identity in
+ 312 aa overlap). Contains probable N-terminal signal
+ sequence and PS00013 Prokaryotic membrane lipoprotein
+ lipid attachment site. Protein product from Mb0620
+ detected using SWATH mass spectrometry. Mb0620 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN LPQO"
+ /protein_id="CAB5248329.1"
+ /translation="MIRRRGARMAALLAAAALALTACAGSDDKGEPDDGGDRGASLAT
+ TSDADWKPVADILGRTGKLNDGSVYKIGFARSDLSVQTKGVTVAPALSLGSWVAFART
+ PDGQTMLMGDLVVTEDELASVTDAVQAGGLQQTALHKHLLEQSPPIWWTHIAGHGDAA
+ DLARAVRSALDATDTPPPAPATSGQTSLDLDTAAIDEALGRSGTIAGGVYKFFIARRD
+ PVTMSGMLIPPSMGLATALNFQPTGNGRAAINGDFVMTAAEVQDVVQALRGGGIDIVA
+ IHNHGFDEQPRLFYMHFWAENDAVALARTLRAAVDATAAR"
+ gene 702629..704012
+ /locus_tag="BQ2027_IS1536"
+ mobile_element 702629..704012
+ /locus_tag="BQ2027_IS1536"
+ /note="IS1536, len: 1384 nt. Equivalent to IS1536, len:
+ 1384 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(100.0% identity in 1384 nt overlap). Partial copy
+ of IS_1536"
+ /mobile_element_type="insertion sequence:IS1536"
+ gene 702651..703259
+ /locus_tag="BQ2027_MB0621"
+ CDS 702651..703259
+ /locus_tag="BQ2027_MB0621"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0621, -, len: 202 aa. Equivalent to Rv0605, len:
+ 202 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 202 aa overlap). Possible resolvase
+ for IS_Y349 element, similar to several Mycobacterial
+ hypothetical proteins and weakly similar to Q52563
+ resolvase from Pseudomonas syringae (210 aa), FASTA
+ scores: opt: 99, E(): 3.1, (35.7% identity in 98 aa
+ overlap). Contains PS00397 Site-specific recombinases
+ active site and probable helix-turn helix motif from aa
+ 9-30 (Score 1815, +5.37 SD). Protein product from Mb0621
+ detected using SWATH mass spectrometry. Mb0621 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE RESOLVASE"
+ /protein_id="SIT99217.1"
+ /db_xref="GOA:A0A1R3XVY1"
+ /db_xref="InterPro:IPR006118"
+ /db_xref="InterPro:IPR006119"
+ /db_xref="InterPro:IPR036162"
+ /db_xref="InterPro:IPR041718"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVY1"
+ /translation="MACCRNRGMNLAAWAERNGVARVTAYRWFHAGLLPVPARKVGRL
+ ILVDELASEAGAQPKTAVYARVSSADQKSDLDRQVARVTSWATAEQIPVDKVVTEVGS
+ VLNGHRRKFPAVLRDLSVTRIVVEHRDRFCRFGSEYVHAALAAQGRELVVVDSAEVDD
+ DLVWDMTEILTSMCARLYGKRAAQNRAKRAVAAAAVDDHEAA"
+ gene 703261..704004
+ /locus_tag="BQ2027_MB0622"
+ CDS 703261..704004
+ /locus_tag="BQ2027_MB0622"
+ /note="Mb0622, -, len: 247 aa. Equivalent to Rv0606, len:
+ 247 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 247 aa overlap). Possible truncated
+ transposase for IS_1536 element, highly similar to
+ N-terminus of other transposases from Mycobacterium
+ tuberculosis e.g.
+ YX16_MYCTU|Q10809|Rv2885c|MT2953|MTCY274.16c PUTATIVE
+ TRANSPOSASE from Mycobacterium tuberculosis (460 aa),
+ FASTA scores: opt: 1368, E(): 0, (83.5% identity in 237 aa
+ overlap); Rv2978c, Rv0922, Rv3827c, etc. Also similar to
+ N-terminus of MTV002_57|Rv2792 RESOLVASE from M.
+ tuberculosis (193 aa), FASTA score: (87.4% identity in 238
+ aa overlap). Mb0622 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible transposase (fragment)"
+ /protein_id="SIT99218.1"
+ /db_xref="InterPro:IPR021027"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVV9"
+ /translation="MPRLEIPNGWCVQAFRFTLDPTAEQAHALARHFGARRKAYNWTV
+ AQLKADIQAWRATGAQTAKPSLRVLRKRWNTVKDEVCVNAETGTVWWPECSKEAYADG
+ IAGAVDAYWNWQQRRAGKRDGKRMGFPRFKKKGRDADRVSFTTGAMRVEPDRRHLTLP
+ VIGCVRTHENTRRIERLIAKDRARVLAITVRRNGTRLDASVRVLVQRPQQPNVELPES
+ RIGVDVGVRRLATVATADGACCPVLVPDG"
+ gene 704058..704444
+ /locus_tag="BQ2027_MB0623"
+ CDS 704058..704444
+ /locus_tag="BQ2027_MB0623"
+ /note="Mb0623, -, len: 128 aa. Equivalent to Rv0607, len:
+ 128 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 128 aa overlap). Hypothetical unknown
+ protein. Mb0623 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99219.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVV1"
+ /translation="MGAWQTADTMGIFQALPDVWGGWRTECWEDRFEEQLIRCNGALR
+ LPELDLAAGMDSAREWLRDRIFQRFSDSPAGQILKLSELLADVGPGLVVSDDAVTNGG
+ ARPNNEEWARFVAACDLVRGAHAESA"
+ gene 704489..704734
+ /gene="vapb28"
+ /locus_tag="BQ2027_MB0624"
+ CDS 704489..704734
+ /gene="vapb28"
+ /locus_tag="BQ2027_MB0624"
+ /note="Mb0624, -, len: 81 aa. Equivalent to Rv0608, len:
+ 81 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 81 aa overlap). Conserved hypothetical
+ protein, similar to several other Mycobacterium
+ tuberculosis hypothetical short proteins e.g.
+ Rv0623|P96913|MTCY20H10.04 (84 aa), FASTA scores: opt:
+ 159, E(): 1.2e-09, (43.0% identity in 86 aa overlap);
+ Rv2760c (89 aa); Rv1740 (70 aa), etc. Mb0624 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb28"
+ /protein_id="SIT99220.1"
+ /db_xref="InterPro:IPR011660"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVU9"
+ /translation="MALNIKDPSVHQAVKQIAKITGESQARAVATAVNERLARLRSDD
+ LAARLLAIGHKTASRMSPEAKRLDHDALLYDERGLPA"
+ gene 704731..705132
+ /gene="vapc28"
+ /locus_tag="BQ2027_MB0625"
+ CDS 704731..705132
+ /gene="vapc28"
+ /locus_tag="BQ2027_MB0625"
+ /note="Mb0625, -, len: 133 aa. Equivalent to Rv0609, len:
+ 133 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 133 aa overlap). Conserved
+ hypothetical protein, similar to several Mycobacterium
+ tuberculosis hypothetical proteins e.g.
+ YW37_MYCTU|Q10874|Rv1982c|MT2034|MTCY39.37 CONSERVED
+ HYPOTHETICAL PROTEIN (139 aa), FASTA scores: opt: 262,
+ E(): 8.1e-12, (39.1% identity in 128 aa overlap);
+ MTCY20H10.05|Rv0624|MT0652|MTCY20H10.05 CONSERVED
+ HYPOTHETICAL PROTEIN (131 aa), FASTA score: (42.9%
+ identity in 126 aa overlap), Rv0565c, Rv3854c, etc. Mb0625
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc28. contains pin domain."
+ /protein_id="SIT99221.1"
+ /db_xref="GOA:P67239"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/Swiss-Prot:P67239"
+ /translation="MIVDTSAIIAILRDEDDAAAYADALANADVRRLSAASYLECGIV
+ LDSQRDPVISRALDELIEEAEFVVEPVTERQARLARAAYADFGRGSGHPAGLNFGDCL
+ SYALAIDRREPLLWKGNDFGHTGVQRALDRR"
+ gene 705129..705302
+ /locus_tag="BQ2027_MB0626"
+ CDS 705129..705302
+ /locus_tag="BQ2027_MB0626"
+ /note="Mb0626, -, len: 75 aa. Equivalent to Rv0609A, len:
+ 75 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 75 aa overlap). Conserved hypothetical
+ protein, highly similar to part of upstream ORF
+ Rv0612|MTCY19H5.09c CONSERVED HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (201 aa), FASTA scores: opt:
+ 154, E(): 1.8e-05, (74.3% identity in 35 aa overlap).
+ Mb0626 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99222.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY04"
+ /translation="MIDVSLARRCEAHGYDYFRSDDPVAAAGFVVSAVWSCGRGPGNA
+ TGSGRLPKPLRHS"
+ gene complement(705720..705917)
+ /locus_tag="BQ2027_MB0626CA"
+ CDS complement(705720..705917)
+ /locus_tag="BQ2027_MB0626CA"
+ /note="unnamed protein product; unnamed protein product;
+ Mb0626cA, len: 65 aa. No equivalent in M. tuberculosis
+ H37Rv. Identified by de novo proteomics of Mycobacterium
+ bovis AF2122/97 under exponential conditions,Mb0626cA
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing"
+ /codon_start=1
+ /transl_table=11
+ /protein_id="SIT99223.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWW3"
+ /translation="MTDEKCVRCGGDQLVEGAVVWNAPLRFKREGAGHFNRGTQVNAV
+ ACETCGHIDLYLESRARGSTK"
+ gene complement(705997..707154)
+ /locus_tag="BQ2027_MB0627C"
+ CDS complement(705997..707154)
+ /locus_tag="BQ2027_MB0627C"
+ /note="Mb0627c, -, len: 385 aa. Equivalent to Rv0610c,
+ len: 385 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 385 aa overlap). Hypothetical unknown
+ protein. Mb0627c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99224.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVZ8"
+ /translation="MDDELRGLLARYARGELSADDARRAILRYPKWRVAEIDGELETV
+ ALDDGTPMLIAESSASDGREYSGLELVRDIAPLVGGLSFDPDEPWGSAFRPGALPELQ
+ SWARTVELEDAVAKPGPGQRDLLYEGPWWVAVSPGTGRPAVHRADGLDVITIMTAPDA
+ AATFRRTERHRGLDVVRLGPALWGDLAKRSDFDGVRLNPLRPLAQLWPPHVPAMLVAG
+ CDPRPNAEPLPARTVAEIHLWLDQHGARQEKRELSNRATPVGEVTVARAWWNYDRREI
+ AFTRVAPASDTEGLGSVPSRILCAGKLRQSIQSKLAGLPRLTWRADAWHRQRAALAVG
+ WALELEKLVCGERVPFAALRTPEGAHLWHLEPQAFTARAIRKLRDRAASFR"
+ gene complement(707206..707589)
+ /locus_tag="BQ2027_MB0628C"
+ CDS complement(707206..707589)
+ /locus_tag="BQ2027_MB0628C"
+ /note="Mb0628c, -, len: 127 aa. Equivalent to Rv0611c,
+ len: 127 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 127 aa overlap). Hypothetical unknown
+ protein. Note that first start has been taken although
+ this overlaps slightly with the upstream ORF. Mb0628c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99225.1"
+ /db_xref="InterPro:IPR032568"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWB7"
+ /translation="MPDRPQHPTASRQSSMVSWNHGAAGWLHCVQCGSATNPTACLDW
+ LPPIHARSGPMYAEHDVVVLTRDVPDKSLIAGDVGAVVGRYAAGGYEVDFTAANGCTV
+ AVVTLAGDDIRPRRRREIPHVREVA"
+ gene 707569..708174
+ /locus_tag="BQ2027_MB0629"
+ CDS 707569..708174
+ /locus_tag="BQ2027_MB0629"
+ /note="Mb0629, -, len: 201 aa. Equivalent to Rv0612, len:
+ 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 201 aa overlap). Conserved
+ hypothetical protein, highly similar, but in part, to
+ downstream ORF Rv0609A CONSERVED HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (75 aa); and showing weak
+ similarity with other hypothetical proteins from
+ Mycobacterium tuberculosis. Note that first start has been
+ taken although this overlaps slightly with the upstream
+ ORF. Mb0629 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99226.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVV6"
+ /translation="MLGPIRQPRLTVRPGRLPGMIAGVAAKRMNREQFFRAASGLDED
+ RLRKALWNLYWRGTANMRERIEAELASAGRARPARKIKPPADPDIVGWEVDEFVSLAR
+ SGAYLGGDRRVSPRERSRWRFTFKRLAAEAQDALRAEDAEPAASALEQLIDLAREADG
+ YDYFRSDDPVAAAGFVVSDVAAAGHPHFREFAAEIGAAIPP"
+ gene complement(708193..710760)
+ /locus_tag="BQ2027_MB0630C"
+ CDS complement(708193..710760)
+ /locus_tag="BQ2027_MB0630C"
+ /note="Mb0630c, -, len: 855 aa. Equivalent to Rv0613c,
+ len: 855 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 855 aa overlap). Hypothetical unknown
+ protein. Contains a very short region with strong
+ similarity to several preprotein translocases e.g.
+ P47847|SECA_LISMO preprotein translocase seca subunit (836
+ aa), FASTA scores: opt: 138, E(): 0.18, (38.6% identity in
+ 70 aa overlap, and 72.7% identity in 22 aa overlap).
+ Protein product from Mb0630c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0630c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIT99227.1"
+ /db_xref="InterPro:IPR004027"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVZ0"
+ /translation="MAEAFDATQAVARILAEHGPLSEDDIARRLLDSGVADPDAVLRA
+ LRLETEWPARQLVDDRWVWLPTLLAGRVFTHRLGADEAVHDMLGVTPDLDPITTLCEH
+ EEYGRLADGSAARIVLAGYDEELLERRGIPDEAIDPGGALLLEPGTLATLGAAAGDLV
+ GVRLTAAGLVLERIGTAGADTSVGARLAELVDPDEPAFFPAAVWTACVDDPAAFTEPV
+ APLREILDQHGLTHEDDWLAPGGFNFDAWRFENRCELLAFRHDLDPNDAVALYTLIKL
+ HETMSLLLEATDPDELPRDVLATAAETATETGSDSLVDLLGDIGAALADPLLAELLVA
+ ETVGTDSGGAAALGLLTEMLEPKVPRAARVAVRWLRAVALDRIGDVEAAERELLAAES
+ MDTEWPLPLLDLARIASDRGDAERGLALLRRAGTEPDHPLVRLLERHRAQPRRDLGRN
+ EACWCGSGRKYKKCHLGREALPLAERVDWLYAKASQHALSGDWTGLLAEVSYERFRYA
+ DSDDEDALAAALADPLVLDAVLFEGGAFAEFLEVRGSLLPDDERLLAEQWLLVERSVF
+ EVEHVQPGEGVIVRDVRTGDTHEVHERAASRQLRAGQLICARPVPAGDTMVFFGGIEP
+ VALHERAVLIELLDDEPDPVTLVAQLSRRFAPPTLVNTEGDSLAICEASVRVDDPAGI
+ QGALDGVYDRVDGEEPPRWIEHVTNDGMLRVRATLVLDGDTLRVETNSEPRMDRVLAT
+ LTRLDPAMTVLDDDRRPLRNTREAAALAEQMPVTGAGAPDPDSPELAAALEEFIRDYE
+ TSWLDQPIPALDGHTPRQAADDPTRRADLIKLLDTFPAGAGARGGMDADRLRTALGL"
+ gene 710601..711593
+ /locus_tag="BQ2027_MB0631"
+ CDS 710601..711593
+ /locus_tag="BQ2027_MB0631"
+ /note="Mb0631, -, len: 330 aa. Equivalent to Rv0614, len:
+ 330 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 330 aa overlap). Conserved
+ hypothetical protein, similar in part to Mycobacterium
+ tuberculosis hypothetical proteins e.g.
+ YY16_MYCTU|Q10685|Rv2077c|MT2137|MTCY49.16c CONSERVED
+ HYPOTHETICAL PROTEIN (323 aa), FASTA scores: opt: 200,
+ E(): 0.00016, (28.3% identity in 269 aa overlap);
+ MTCY9F9_15 FASTA score: (40.3% identity in 144 aa
+ overlap), Rv1949c, Rv2542, etc. Several start sites are
+ possible; first start has been chosen. Note that this ORF
+ overlaps with the upstream ORF."
+ /codon_start=1
+ /transl_table=11
+ /product="putative membrane protein"
+ /protein_id="SIT99228.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVW8"
+ /translation="MPAIPFQGEARAGRRPGRPRRCPAGVVRCRPRSMGHVRPGFSPR
+ LGSHRTLRPRWPPYAAASRGLTSGTSRWGWPRLGFGVVTAPTRWTLADGRELLFFSLP
+ GPRTSGTAAERVARHAQAQTFAGDIRQRAIQLVVSEQEVASKITAATAGIATTTFPET
+ PSIDDTIIGNDNRDTGVRLVDVKQDGGTSPPPPFAPWDTPDGTPPPGTGLSPTLQQMI
+ LGGDPANLTGQGLADNVQRFVQSLPANDPNTAWLRGQVADLQAHVADIEYARTHCSTN
+ DWIDRTAQFASGAIVFSIGVLTAETGAGVVAAAAGGVGAATAGVSLLQCLVGSK"
+ gene 711590..711832
+ /locus_tag="BQ2027_MB0632"
+ CDS 711590..711832
+ /locus_tag="BQ2027_MB0632"
+ /note="Mb0632, -, len: 80 aa. Equivalent to Rv0615, len:
+ 80 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 80 aa overlap). Probable integral
+ membrane protein. Mb0632 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99229.1"
+ /db_xref="GOA:A0A1R3XVW0"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVW0"
+ /translation="MMDVLAAGIAAGALTLAAWGAWRPHYRAASYLVAGAVELALIGL
+ LVVTGQTLMAISVAFLVALGGPLVVVNHRRAERSRG"
+ gene complement(711829..712095)
+ /locus_tag="BQ2027_MB0633C"
+ CDS complement(711829..712095)
+ /locus_tag="BQ2027_MB0633C"
+ /note="Mb0633c, -, len: 88 aa. Equivalent to Rv0616c, len:
+ 88 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 88 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99230.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVW1"
+ /translation="MRIPGNRQCLLVQVLRQVDGSAHRLILTSLHRDARADAHRYSNG
+ TDHAGRAADEPAETAHEPCWVAARGLASQASRAMSATYRPSSFI"
+ gene 712027..712254
+ /gene="vapB29"
+ /locus_tag="BQ2027_MB0633A"
+ CDS 712027..712254
+ /gene="vapB29"
+ /locus_tag="BQ2027_MB0633A"
+ /note="Mb0633A, len: 75 aa. Equivalent to Rv0616A len: 75
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 75 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Possible vapB29,
+ antitoxin,part of toxin-antitoxin (TA) operon with Rv0617,
+ see Arcus et al. 2005. Similar to many others in M.
+ tuberculosis e.g. Rv2530A (74 aa) 35.9% identity in 78 aa
+ overlap,Mb0633A found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible antitoxin VapB29"
+ /protein_id="SIT99231.1"
+ /db_xref="GOA:A0A1R3XVV4"
+ /db_xref="InterPro:IPR010985"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVV4"
+ /translation="MRTTIDLPQDLHKQALAIARDTHRTLSETVADLMRRGLAANRPT
+ ALSSDPRTGLPLVSVGTVVTSEDVRSLEDEQ"
+ gene 712251..712652
+ /gene="vapc29"
+ /locus_tag="BQ2027_MB0634"
+ CDS 712251..712652
+ /gene="vapc29"
+ /locus_tag="BQ2027_MB0634"
+ /note="Mb0634, -, len: 133 aa. Equivalent to Rv0617, len:
+ 133 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 133 aa overlap). Conserved
+ hypothetical protein, similar to Mycobacterium
+ tuberculosis hypothetical proteins e.g. Rv2494, Rv3320c,
+ Rv0749, Rv0277c, Rv2530c, etc. Protein product from Mb0634
+ detected using SWATH mass spectrometry. Mb0634 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc29. contains pin domain."
+ /protein_id="SIT99232.1"
+ /db_xref="GOA:A0A1R3XY12"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR006226"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY12"
+ /translation="MTVLLDANVLIALVVAEHVHHDAAADWLMASDTGFATCPMTQGS
+ LVRFLVRSGQSAAAARDVVSAVQCTSRHEFWPDALSFAGVEVAGVVGHRQVTDAYLAQ
+ LARSHDGQLATLDSGLAHLHGDVAVLIPTTT"
+ gene 712781..713965
+ /gene="galT"
+ /locus_tag="BQ2027_MB0635"
+ CDS 712781..713965
+ /gene="galT"
+ /locus_tag="BQ2027_MB0635"
+ /note="Mb0635, galT, len: 394 aa. Equivalent to Rv0618 and
+ Rv0619, len: 231 aa (probable partial CDS) and 181 aa
+ (probable partial CDS), from Mycobacterium tuberculosis
+ strain H37Rv, (99.5% identity in 219 aa overlap and 99.4%
+ identity in 174 aa overlap). Rv0618: Probable galT', first
+ part of galactose-1-phosphate uridylyltransferase (EC
+ 2.7.7.10), highly similar to N-terminal half of other galT
+ proteins e.g. P13212|GAL7_STRLI galactose-1-phosphate
+ uridylyltransferase from Streptomyces lividans (354 aa),
+ FASTA scores: opt: 296, E(): 1.4e-11, (50.8% identity in
+ 177 aa overlap); etc. Also highly similar to N-terminal
+ half of some UDP glucose--hexose-1-phosphate
+ uridylyltransferases (EC 2.7.7.12). N-terminal 28 aa
+ similar to MTCY20H11.08|Rv0627|MTCY20H11.08 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (135
+ aa), FASTA score: (71.4% identity in 28 aa overlap).
+ BELONGS TO THE GALACTOSE-1-PHOSPHATE URIDYLYLTRANSFERASE
+ >FAMILY 1. Rv0619: Probable 'galT, second part of
+ galactose-1-phosphate uridylyltransferase (EC 2.7.7.10),
+ highly similar to C-terminal half of other galT proteins
+ e.g. P13212|GAL7_STRLI galactose-1-phosphate
+ uridylyltransferase from Streptomyces lividans (354 aa),
+ FASTA scores: opt: 416, E(): 5.2e-22, (43.0% identity in
+ 186 aa overlap), etc. BELONGS TO THE GALACTOSE-1-PHOSPHATE
+ URIDYLYLTRANSFERASE FAMILY 1. Cosmid sequence is correct
+ but there may be a frameshift mutation in this region
+ which would allow the two ORFS to be joined.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, galT is split into 2 parts,
+ galT' and 'galT. In Mycobacterium bovis, an in-frame
+ insertion of a single base (*-a) leads to a single
+ product. Protein product from Mb0635 detected using SWATH
+ mass spectrometry. Mb0635 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable galactose-1-phosphate
+ uridylyltransferase galtb [second part]"
+ /protein_id="SIT99233.1"
+ /db_xref="GOA:A0A1R3XWX5"
+ /db_xref="InterPro:IPR001937"
+ /db_xref="InterPro:IPR005849"
+ /db_xref="InterPro:IPR005850"
+ /db_xref="InterPro:IPR019779"
+ /db_xref="InterPro:IPR036265"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWX5"
+ /translation="MSATPPPGGLDASVFIANERGRQLDEALPVGFCVVTAPTRWTLA
+ DGRDLLFFSLPGHVPAPVSDRRPLPERDPAPSRLRFDRATGQWVIVAAQRQDRTYKPP
+ AARCPLCPGPTGLSSEVPAPDYDVVVFENRFPSLAGAGIAPIGAPDGDGFVSAPGHGR
+ CEVICFSADHTGSFAGLDPAHAGLVVHAWRHRTAELTALPGVAQVFCFENRGEEIGVT
+ LTHPHGQIYAYPYLTPRTAAMLRQARRHRKRHGDNLFASLLAREVADGSRIVVRGELF
+ TAFVPFAARWPVEVHIYPNRLVRNLTELNDGELDEFARIYLDVLQRFDRMYSSPLPYM
+ SALHQFSEVQRDGYFHVELMSIRRSATKLKYLAAAESAMDAFIADVIPESVAARLREL
+ GP"
+ gene 713962..715053
+ /gene="galK"
+ /locus_tag="BQ2027_MB0636"
+ CDS 713962..715053
+ /gene="galK"
+ /locus_tag="BQ2027_MB0636"
+ /note="Mb0636, galK, len: 363 aa. Equivalent to Rv0620,
+ len: 363 aa, from Mycobacterium tuberculosis strain H37RV,
+ (99.7% identity in 362 aa overlap). Probable galK,
+ galactokinase (EC 2.7.1.6), similar to others e.g.
+ P13227|GAL1_STRLI GALACTOKINASE from Streptomyces lividans
+ (397 aa); P06976|GAL1_ECOLI galactokinase from Escherichia
+ coli (381 aa), FASTA scores: opt: 669, E(): 0, (35.9%
+ identity in 365 aa overlap); etc. Contains PS00106
+ Galactokinase signature and PS00560 Serine
+ carboxypeptidases, histidine active site. BELONGS TO THE
+ GHMP KINASE FAMILY. GALK SUBFAMILY. Protein product from
+ Mb0636 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GALACTOKINASE GALK (GALACTOSE KINASE)"
+ /protein_id="SIT99234.1"
+ /db_xref="GOA:Q7U1L7"
+ /db_xref="InterPro:IPR000705"
+ /db_xref="InterPro:IPR006204"
+ /db_xref="InterPro:IPR006206"
+ /db_xref="InterPro:IPR013750"
+ /db_xref="InterPro:IPR014721"
+ /db_xref="InterPro:IPR019539"
+ /db_xref="InterPro:IPR019741"
+ /db_xref="InterPro:IPR020568"
+ /db_xref="InterPro:IPR022963"
+ /db_xref="InterPro:IPR036554"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1L7"
+ /translation="MTVSYGAPGRVNLIGEHTDYNLGFALPIALPRRTVVTFTPEHTG
+ AITARSDRADGSARIPLDTTPGQVTGWAAYAAGAIWALRGAGHPVPGGAMSITSDVEI
+ GSGLSSSAALIGAVLGAVGAATGTRIDRLERARLAQRAENDYVGAPTGLLDHLAALFG
+ APKTALLIDFRDITVRPVAFDPDACDVVLLLMDSRARHRHAGGEYALRRASCERAAAD
+ LGVSSLRAVQDRGLAALGAIADPIDARRARHVLTENQRVLDFAAALADSDFTAAGQLL
+ TASHESMREDFAITTERIDLIAESAVRAGALGARMTGGGFGGAVIALVPADRARDVAD
+ TVRRAAVTAGYDEPAVSRTYAAPGAAECC"
+ gene 715448..716605
+ /locus_tag="BQ2027_MB0637"
+ CDS 715448..716605
+ /locus_tag="BQ2027_MB0637"
+ /note="Mb0637, -, len: 385 aa. Equivalent to Rv0621, len:
+ 354 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 354 aa overlap). Possible membrane
+ protein; contains potential membrane spanning regions.
+ Also contains PS00017 ATP/GTP-binding site motif A
+ (P-loop). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a single base transition (a-g) leads to a longer
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (385 aa versus 354 aa). Mb0637
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIT99235.1"
+ /db_xref="GOA:A0A1R3XWC6"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWC6"
+ /translation="MAGDRGADPGPANVTPGADDHAQHASPTVLCPQGHVNAWDYRFC
+ ERCGSPIGVVPWPSEESGTRQTAPARSFVPLVVLAATLLVVAVVVTAVGYAVTRPARN
+ DREEPSSARGAATTGVPFAQAEAASCPDDPVLEAESIDLTSDGLAVSAAFMSACAGGD
+ VESNSALEVTVADGRRDVAAGSFDFSADPLRIEPGVPARRTLVFPPGMYWRTPDMLSG
+ APALAATRKGRSDRSAARGGSARTTMVAAASAAPAYGSINAVAGAVLVELRDSDFPYV
+ RVGIANRWVPQVSSKRVGLVAAGKTWTSADILRDHLALRQRFGGARLVWSGHWTTFSG
+ PDFWVTVVGPAQPTAAEANRWCDSNGFGADDCFAKFISTLVGAKGTTVYRK"
+ gene 716616..717563
+ /locus_tag="BQ2027_MB0638"
+ CDS 716616..717563
+ /locus_tag="BQ2027_MB0638"
+ /note="Mb0638, -, len: 315 aa. Equivalent to Rv0622, len:
+ 315 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 315 aa overlap). Possible membrane
+ protein; contains potential membrane spanning region.
+ Shows weak similarity with Mycobacterium tuberculosis
+ hypothetical proteins Rv1804c, Rv1810, etc."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIT99236.1"
+ /db_xref="GOA:A0A1R3XVW5"
+ /db_xref="InterPro:IPR007969"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVW5"
+ /translation="MSFCVYCGAELADPTRCGACGAYKIGSTWHRTTTPTVGAATTAT
+ GWRPDPTGRHEGRYFVAGQPTDLVREGDAEAVDPLGQQQLDQSGAVGVSPSAVSGWVR
+ SGHRRLWWALAGVVAFLGLVGAGVVGTLFLNRDRESIDDKYLAALRRSGLTGEFNSDA
+ NAIARGKQVCRQLQDGGEQQGMPVDQVAVQYYCPQFSDGFHILETITVTGSFTLKDES
+ PNVYAPAITVSGSGCSGSAGYADIDRGTQVTVKNGQGDILATAFLQAGQGGRFLCTFP
+ FSFEITEGEDRYVVSVSRRGEMSYSFADLKANGLSLVLG"
+ gene 717656..717910
+ /gene="vapb30"
+ /locus_tag="BQ2027_MB0639"
+ CDS 717656..717910
+ /gene="vapb30"
+ /locus_tag="BQ2027_MB0639"
+ /note="Mb0639, -, len: 84 aa. Equivalent to Rv0623, len:
+ 84 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 84 aa overlap). Conserved hypothetical
+ protein, highly similar to NP_384911.1|NC_003047 CONSERVED
+ HYPOTHETICAL PROTEIN from Sinorhizobium meliloti (84 aa).
+ Also similar to several Mycobacterium tuberculosis
+ hypothetical proteins e.g
+ MTCY28_2|Rv1740|MTCY28.02|MTCY04C12.25 CONSERVED
+ HYPOTHETICAL PROTEIN (70 aa), FASTA score: (73.5% identity
+ in 68 aa overlap); MTCY4C12_25|Rv0608|MTCY19H5.14c
+ CONSERVED HYPOTHETICAL PROTEIN (81 aa), FASTA score: (73.5
+ identity in 68 aa overlap); etc. Mb0639 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb30"
+ /protein_id="SIT99237.1"
+ /db_xref="InterPro:IPR011660"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW02"
+ /translation="MALSIKHPEADRLARALAARTGETLTEAVVTALRERLARETGRA
+ RVVPLRDELAAIRHRCAALPVVDNRSAEAILGYDERGLPA"
+ gene 717910..718305
+ /gene="vapc30"
+ /locus_tag="BQ2027_MB0640"
+ CDS 717910..718305
+ /gene="vapc30"
+ /locus_tag="BQ2027_MB0640"
+ /note="Mb0640, -, len: 131 aa. Equivalent to Rv0624, len:
+ 131 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 131 aa overlap). Conserved
+ hypothetical protein, highly similar to Mycobacterium
+ tuberculosis hypothetical proteins e.g. Rv1741, Rv0609,
+ Rv2759c,Rv0565c, Rv3854c, Rv3083, etc. Mb0640 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc30. contains pin domain."
+ /protein_id="SIT99238.1"
+ /db_xref="GOA:P67241"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/Swiss-Prot:P67241"
+ /translation="MVIDTSALVAMLSDEPDAERFEAAVEADHIRLMSTASYLETALV
+ IEARFGEPGGRELDLWLHRAAVDLVAVHADQADAARAAYRTYGKGRHRAGLNYGDCFS
+ YGLAKISGQPLLFKGEDFQHTDIATVALP"
+ gene complement(718399..719139)
+ /locus_tag="BQ2027_MB0641C"
+ CDS complement(718399..719139)
+ /locus_tag="BQ2027_MB0641C"
+ /note="Mb0641c, -, len: 246 aa. Equivalent to Rv0625c,
+ len: 246 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 246 aa overlap). Probable conserved
+ transmembrane protein, showing similarity with others e.g.
+ CAB61866.1|AL133252 putative integral membrane protein
+ from Streptomyces coelicolor (249 aa). Also similar to
+ Rv1491c|MTCY277_13 from Mycobacterium tuberculosis.
+ Contains potential membrane spanning regions. Mb0641c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99239.1"
+ /db_xref="GOA:P67116"
+ /db_xref="InterPro:IPR015414"
+ /db_xref="InterPro:IPR032816"
+ /db_xref="UniProtKB/Swiss-Prot:P67116"
+ /translation="MSTHNDSAPTSRRRHIVRLVVFAGFLVGMFYLVAATDVIDVAAV
+ RGAVSATGPAAPLTYVVVSAVLGALFVPGPILAASSGLLFGPLVGVFVTLGATVGTAV
+ VASLVGRRAGRASARALLGGERADRTDALIERCGLWAVVGQRFVPGISDAFASYAFGT
+ FGVPLWQMAVGAFIGSAPRAFAYTALGAAIGDRSPLLASCAIAVWCVTAIIGAFAARH
+ GYRQWRAHARGDGADGGVEDPDREVGAR"
+ gene 719271..719531
+ /gene="vapb5"
+ /locus_tag="BQ2027_MB0642"
+ CDS 719271..719531
+ /gene="vapb5"
+ /locus_tag="BQ2027_MB0642"
+ /note="Mb0642, -, len: 86 aa. Equivalent to Rv0626, len:
+ 86 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 86 aa overlap). Conserved hypothetical
+ protein, similar to Mycobacterium tuberculosis
+ hypothetical proteins e.g. Rv0596c, Rv3385c,
+ Rv3407,Rv3181c, etc. Mb0642 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb5"
+ /protein_id="SIT99240.1"
+ /db_xref="InterPro:IPR006442"
+ /db_xref="InterPro:IPR036165"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVW9"
+ /translation="MSEVASRELRNDTAGVLRRVRAGEDVTITVSGRPVAVLTPVRPR
+ RRRWLSKTEFLSRLRGAQADPGLRNDLAVLAGDTTEDLGPIR"
+ gene 719528..719935
+ /gene="vapc5"
+ /locus_tag="BQ2027_MB0643"
+ CDS 719528..719935
+ /gene="vapc5"
+ /locus_tag="BQ2027_MB0643"
+ /note="Mb0643, -, len: 135 aa. Equivalent to Rv0627, len:
+ 135 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 135 aa overlap). Conserved
+ hypothetical protein, similar to Mycobacterium
+ tuberculosis hypothetical proteins Rv0595c and Rv0665.
+ Protein product from Mb0643 detected using SWATH mass
+ spectrometry. Mb0643 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc5"
+ /protein_id="SIT99241.1"
+ /db_xref="GOA:A0A1R3XVX8"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVX8"
+ /translation="MSTTPAAGVLDTSVFIATESGRQLDEALIPDRVATTVVTLAELR
+ VGVLAAATTDIRAQRLATLESVADMETLPVDDDAARMWARLRIHLAESGRRVRINDLW
+ IAAVAASRALPVITQDDDFAALDGAASVEIIRV"
+ gene complement(720007..721158)
+ /locus_tag="BQ2027_MB0644C"
+ CDS complement(720007..721158)
+ /locus_tag="BQ2027_MB0644C"
+ /note="Mb0644c, -, len: 383 aa. Equivalent to Rv0628c,
+ len: 383 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 383 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ Rv0874c|YZ02_MYCTU|Q10536 CONSERVED HYPOTHETICAL PROTEIN
+ from Mycobacterium tuberculosis (386 aa), FASTA scores:
+ opt: 2082, E(): 0, (81.5% identity in 383 aa overlap).
+ Also some similarity to P72543|SPU62616_1 HYPOTHETICAL
+ PROTEIN from Synechococcus, FASTA scores: E(): 2.8e-28,
+ (36.6 identity in 265 aa overlap). Mb0644c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99242.1"
+ /db_xref="GOA:P64730"
+ /db_xref="InterPro:IPR013702"
+ /db_xref="InterPro:IPR016741"
+ /db_xref="InterPro:IPR019494"
+ /db_xref="UniProtKB/Swiss-Prot:P64730"
+ /translation="MRIGVGVSTAPDVRRAAAEAAAHAREELAGGTPALAVLLGSRSH
+ TDQAVDLLAAVQASVEPAALIGCVAQGIVAGRHELENEPAVAVWLASGPPAETFHLDF
+ VRTGSGALITGYRFDRTAHDLHLLLPDPYSFPSNLLIEHLNTDLPGTTVVGGVVSGGR
+ RRGDTRLFRDRDVLTSGLVGVRLPGAHSVSVVSQGCRPIGEPYIVTGADGAVITELGG
+ RPPLHRLREIVLGMAPDEQELVSRGLQIGIVVDEHLAVPGQGDFLIRGLLGADPTTGA
+ IGIGEVVEVGATVQFQVRDAAAADKDLRLAVERAAAELPGPPVGGLLFTCNGRGRRMF
+ GVTDHDASTIEDLLGGIPLAGFFAAGEIGPVAGHNALHGFTASMALFVD"
+ gene complement(721251..722978)
+ /gene="recD"
+ /locus_tag="BQ2027_MB0645C"
+ CDS complement(721251..722978)
+ /gene="recD"
+ /locus_tag="BQ2027_MB0645C"
+ /note="Mb0645c, recD, len: 575 aa. Equivalent to Rv0629c,
+ len: 575 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 575 aa overlap). Probable recD,
+ exonuclease V, alpha chain (exodeoxyribonuclease V, alpha
+ chain) (EC 3.1.11.5), highly similar to other exonucleases
+ e.g. AF157643_3|AAD46809.1|recD Escherichia coli RecD
+ protein homolog from Mycobacterium smegmatis (554 aa);
+ P04993|EX5A_ECOLI|B2819 exodeoxyribonuclease v 67kd
+ polypeptide (EC 3.1.11.5) (EXONUCLEASE V ALPHA CHAIN) from
+ Escherichia coli strain K12 (608 aa), FASTA scores: opt:
+ 512, E(): 1.9e-24, (36.9% identity in 582 aa overlap);
+ etc. Contains PS00017 ATP/GTP-binding site motif A
+ (P-loop). CONSIST OF THREE SUBUNITS; RECB|Rv0630c,
+ RECC|Rv0631c AND RECD. Protein product from Mb0645c
+ detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EXONUCLEASE V (ALPHA CHAIN) RECD
+ (EXODEOXYRIBONUCLEASE V ALPHA CHAIN) (EXODEOXYRIBONUCLEASE
+ V POLYPEPTIDE)"
+ /protein_id="SIT99243.1"
+ /db_xref="GOA:A0A1R3XWY4"
+ /db_xref="InterPro:IPR006344"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR027785"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWY4"
+ /translation="MKLTDVDFAVEASGMVRAFNQAGVLDVSDVHVAQRLCALAGESD
+ ERVALAVAVAVRALRAGSVCVDLLSIARVAGHDDLPWPDPADWLAAVRASPLLADPPV
+ LHLYDDRLLYLDRYWREEEQVCADLLALLTSRRPAGVPDLRRLFPTGFDEQRRAAEIA
+ LSQGVTVLTGGPGTGKTTTVARLLALVAEQAELAGEPRPRIALAAPTGKAAARLAEAV
+ RREMAKLDATDRARLGDLHAVTLHRLLGAKPGARFRQDRQNRLPHNVIVVDETSMVSL
+ TLMARLAEAVRPGARLILVGDADQLASVEAGAVLADLVDGFSVRDDALVAQLRTSHRF
+ GKVIGTLAEAIRAGDGDAVLGLLRSGEERIEFVDDEDPAPRLRAVLVPHALRLREAAL
+ LGASDVALATLDEHRLLCAHRDGPTGVLHWNRRVQAWLAEETGQPPWTPWYAGRPLLV
+ TANDYGLRVYNGDTGVVLAGPTGLRAVISGASGPLDVATGRLGDVETMHAMTIHKSQG
+ SQVDEVTVLMPQEDSRLLTRELLYTAVARAKRKVRVVGSEASVRAAIARRAVRASGLR
+ MRLQSTGCG"
+ gene complement(722975..723562)
+ /gene="recBb"
+ /locus_tag="BQ2027_MB0646C"
+ CDS complement(722975..723562)
+ /gene="recBb"
+ /locus_tag="BQ2027_MB0646C"
+ /note="Mb0646c, recBb, len: 234 aa. Equivalent to 3' end
+ of Rv0630c, len: 1094 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 234 aa overlap).
+ Probable recB, exonuclease V, beta chain
+ (exodeoxyribonuclease V, beta chain) (EC 3.1.11.5), highly
+ similar to other exonucleases e.g.
+ AF157643_2|recB|AAD46808.1 Escherichia coli RecB protein
+ homolog from Mycobacterium smegmatis (1083 aa);
+ P08394|EX5B_ECOLI|RORA|B2820 exodeoxyribonuclease v 135 kd
+ polypeptide (EC 3.1.11.5) (EXONUCLEASE V BETA CHAIN) from
+ Escherichia coli strain K12 (1180 aa), FASTA scores: opt:
+ 289, E(): 4.3e-11, (29.5 identity in 1059 aa overlap);
+ etc. Contains PS00017 ATP/GTP-binding site motif A
+ (P-loop). BELONGS TO THE HELICASE FAMILY, UVRD SUBFAMILY.
+ CONSIST OF THREE SUBUNITS; RECB, RECC|Rv0631c AND
+ RECD|Rv0629c. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, recB exists as a
+ single gene. In Mycobacterium bovis, a frameshift due to a
+ single base deletion (g-*) splits recB into 2 parts, recBa
+ and recBb. Protein product from Mb0646c detected using
+ SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EXONUCLEASE V (BETA CHAIN) RECBB
+ [SECOND PART] (EXODEOXYRIBONUCLEASE V BETA
+ CHAIN)(EXODEOXYRIBONUCLEASE V POLYPEPTIDE)"
+ /protein_id="SIT99244.1"
+ /db_xref="GOA:A0A1R3XW18"
+ /db_xref="InterPro:IPR000212"
+ /db_xref="InterPro:IPR004586"
+ /db_xref="InterPro:IPR011335"
+ /db_xref="InterPro:IPR011604"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW18"
+ /translation="MRQIGVRDRLRELDFEMPLAGGDLRGRSPDVSLADVGELLASHL
+ PGDDPLSPYADRLGSAGLGDQPLRGYLAGSIDVVLRLPGQRYLVVDYKTNHLGDTAAD
+ YGFERLTEAMLHSDYPLQALLYVVVLHRFLRWRQRDYAPARHLGGVLYLFVRGMCGAA
+ TPVTAGHPAGVFTWNPPTALVVALSDLLDRGRLQS"
+ gene complement(723565..726258)
+ /gene="recBa"
+ /locus_tag="BQ2027_MB0647C"
+ CDS complement(723565..726258)
+ /gene="recBa"
+ /locus_tag="BQ2027_MB0647C"
+ /note="Mb0647c, recBa, len: 897 aa. Equivalent to 5' end
+ of Rv0630c, len: 1094 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.2% identity in 868 aa overlap). Probable
+ recB, exonuclease V, beta chain (exodeoxyribonuclease V,
+ beta chain) (EC 3.1.11.5), highly similar to other
+ exonucleases e.g. AF157643_2|recB|AAD46808.1 Escherichia
+ coli RecB protein homolog from Mycobacterium smegmatis
+ (1083 aa); P08394|EX5B_ECOLI|RORA|B2820
+ exodeoxyribonuclease v 135 kd polypeptide (EC 3.1.11.5)
+ (EXONUCLEASE V BETA CHAIN) from Escherichia coli strain
+ K12 (1180 aa), FASTA scores: opt: 289, E(): 4.3e-11, (29.5
+ identity in 1059 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ HELICASE FAMILY, UVRD SUBFAMILY. CONSIST OF THREE
+ SUBUNITS; RECB, RECC|Rv0631c AND RECD|Rv0629c.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, recB exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (g-*) splits recB into 2 parts, recBa and recBb."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EXONUCLEASE V (BETA CHAIN) RECBA [FIRST
+ PART] (EXODEOXYRIBONUCLEASE V BETA
+ CHAIN)(EXODEOXYRIBONUCLEASE V POLYPEPTIDE)"
+ /protein_id="SIT99245.1"
+ /db_xref="GOA:A0A1R3XWD4"
+ /db_xref="InterPro:IPR000212"
+ /db_xref="InterPro:IPR004586"
+ /db_xref="InterPro:IPR011335"
+ /db_xref="InterPro:IPR011604"
+ /db_xref="InterPro:IPR014016"
+ /db_xref="InterPro:IPR014017"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR034739"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWD4"
+ /translation="MDRFELLGPLPREGTTTVLEASAGTGKTFALAGLVTRYLAETAA
+ TLDEMLLITFNRAASRELRERVRGQIVEALGALQGDAPPSGELVEHLLRGSDAERAQK
+ RSRLRDALANFDAATIATTHEFCGSVLKSLGVAGDNAADVELKESLTDLVTEIVDDRY
+ LANFGRQETDPELTYAEALALALAVVDDPCAQLRPPDPEPGSKAAVRLRFAAEVLEEL
+ ERRKGRLRAQGFNDLLIRLATALEAADSPARDRMRERWRIVLVDEFQDTDPMQWRVLE
+ RAFSRHSALILIGDPKQAIYGFRGGDIHTYLKAAGTADARYTLGVNWRSDRALVESLQ
+ TVLRDATLGHADIVVRGTDAHHAGHRLASAPRPAPFRLRVVKRHTLGYDGTAHVPIEA
+ LRRHIPDDLAADVAALLASGATFAGRPVVAADIAVIVEHHKDARACRNALAEAGIPAI
+ YTGDTDVFASQAAKDWLCLLEAFDAPQRSGLVRAAACTMFFGETAESLAAEGDALTDR
+ VAGTLREWADHARHRGVAAVFQAAQLAGMGRRVLSQRGGERDLTDLAHIAQLLHEAAH
+ RERLGLPGLRDWLRRQAKAGAGPPEHNRRLDSDAAAVQIMTVFVAKGLQFPIVYLPFA
+ FNRNVRSDDILLYHDDGTRCLYIGGKDGGAQRRTVEGLNRVEAAHDNLRLTYVALTRA
+ QSQVVAWWAPTFDEVNGGLSRLLRGRRPGQSQVPDRCTPRVTDEQAWAVFAQWEAAGG
+ PSVEESVIGARSSLEKPVPVPGFEVRHFHRRIDTTWRRTSYSDLVRGSEAVTVTSEPA
+ AGGRADEVEIAVFAAPGSGADLTSPLAALPSGASFGSLVHAVLETADPAAPDLAAELE
+ AQVPGTRRGGPWTSTTRSWLPNWPERCCRCTTRRWDPPPPH"
+ gene complement(726258..729551)
+ /gene="recC"
+ /locus_tag="BQ2027_MB0648C"
+ CDS complement(726258..729551)
+ /gene="recC"
+ /locus_tag="BQ2027_MB0648C"
+ /note="Mb0648c, recC, len: 1097 aa. Equivalent to Rv0631c,
+ len: 1097 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.8% identity in 1097 aa overlap). Probable recC,
+ exonuclease V, gamma chain (exodeoxyribonuclease V, gamma
+ chain) (EC 3.1.11.5), highly similar to other exonucleases
+ e.g. AF157643_1|RecC|AAD46807.1 Escherichia coli RecC
+ protein homolog from Mycobacterium smegmatis (1085 aa);
+ P07648|EX5C_ECOLI|B2822 exodeoxyribonuclease v 125 kd
+ polypeptide (EC 3.1.11.5) (EXONUCLEASE V GAMMA CHAIN) from
+ Escherichia coli strain K12 (1122 aa), FASTA scores: opt:
+ 954, E(): 0, (29.2% identity in 1109 aa overlap); etc.
+ CONSIST OF THREE SUBUNITS; RECB|Rv0630c, RECC AND
+ RECD|Rv0629c. Protein product from Mb0648c detected using
+ SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EXONUCLEASE V (GAMMA CHAIN) RECC
+ (EXODEOXYRIBONUCLEASE V GAMMA CHAIN)(EXODEOXYRIBONUCLEASE
+ V POLYPEPTIDE)"
+ /protein_id="SIT99246.1"
+ /db_xref="GOA:A0A1R3XVX6"
+ /db_xref="InterPro:IPR006697"
+ /db_xref="InterPro:IPR011335"
+ /db_xref="InterPro:IPR013986"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR041500"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVX6"
+ /translation="MALHLHRAERTDLLADGLGALLADPQPDPFAQELVLVAARGVER
+ WLSQRLSLVLGCGPGRADGVCAGIAFRNPQSLIAEITGTLDDDPWSPEALAWPLLAVI
+ DASLDEPWCRTLASHLGHFATTDAEAELRRGRRYSVARRLAGLFASYARQRPGLLAAW
+ LDGDLGELPGDLAWQPPLWRALVTTVGADPPHVRHDKTIARLRDGPADLPARLSLFGH
+ TRLACTDVQLLDALAVHHDLHLWLPHPSDELWRALAGFQGADGLLPRRQDTSRRAAQH
+ PLLETLGRDVRELQRALPAARATDEFLGATTKPDTLLGWLQADIAGNAPRPAERSLSD
+ ADRSVQVHACHGPARQIDVLREVLLGLLEDDPTLQPRDIVVMCPDIDTYAPLIVAGFG
+ LGEVAGDCHPAHRLRVRLADRALTQTNPLLSVAAELLTIAETRATASQLLNLAQAAPV
+ RAKFGFADDDLDTITTWVRESNIRWGFDPTHRRRYGLDTVVHNTWRFGLDRILTGVAM
+ SEDSQAWLDTALPLDDVGSNRVELAGRLAEFVERLHHVVGGLSGARPLVAWLDALATG
+ IDLLTACNDGWQRAQVQREFADVLARAGSRAAPLLRLPDVRALLDAQLAGRPTRANFR
+ TGTLTVCTMVPMRSVPHRVVCLVGLDDGVFPRLSHPDGDDVLAREPMTGERDIRSEDR
+ QLLLDAIGAATQTLVITYTGADERTGQPRPPAVPLAELLDALDQTTSAPVRERILVTH
+ PLQPFDRKNVTPGALLGAKPFTFDPAALAAAQAAAGKRCPPTAFISGRLPAPPAADVT
+ LADLLDFFKDPVKGFFRALDYTLPWDVDTVEDSIPVQVDALAEWTVGERMLRDMLRGL
+ HLDDAAHSEWRRGTLPPGRLGVRRAKEIRNRARDLAAAALAHRDGHGQAHDVDVDLGD
+ GRRLSGTVTPVFGGRTVSVTYSKLAPKHVLPAWIGLVTLAAQEPGREWSALCIGRSKT
+ RNHIARRLFVPPPDPVAVLRELVLLYDAGRREPLPLPLKTSCAWAQARRDGQDPYPPA
+ RECWQTNRFRPGDDDAPAHVRAWGPRAPFEVLLGKPRAGEEVAGEETRLGALAARLWL
+ PLLAAEGSV"
+ gene complement(729828..730523)
+ /gene="echA3"
+ /locus_tag="BQ2027_MB0649C"
+ CDS complement(729828..730523)
+ /gene="echA3"
+ /locus_tag="BQ2027_MB0649C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0649c, echA3, len: 231 aa. Equivalent to Rv0632c,
+ len: 231 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 231 aa overlap). Probable echA3,
+ enoyl-CoA hydratase (EC 4.2.1.17), almost identical to the
+ MTU88877_1 enoyl-coA hydratase of Mycobacterium
+ tuberculosis field isolate NTI64719, FASTA score: (92.4%
+ identity in 184 aa overlap). Also similar to others e.g.
+ P24162|ECHH_RHOCA enoyl-CoA hydratase from Rhodobacter
+ capsulatus (Rhodopseudomonas capsulata) (257 aa), FASTA
+ scores: opt: 206, E(): 6.3e-07, (31.5% identity in 232 aa
+ overlap); etc. Protein product from Mb0649c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0649c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ENOYL-COA HYDRATASE ECHA3 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-COA HYDRATASE) (CROTONASE)"
+ /protein_id="SIT99247.1"
+ /db_xref="GOA:A0A1R3XW12"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW12"
+ /translation="MSDPVSYTRKDSIAVISMDDGKVNALGPAMQQALNAAIDNADRD
+ DVGALVITGNGRVFSGGFDLKILTSGEVQPAIDMLRGGFELAYRLLSYPKPVVMACTG
+ HAIAMGAFLLSCGDHRVAAHAYNIQANEVAIGMTIPYAALEIMKLRLTRSAYQQATGL
+ AKTFFGETALAAGFIDEIALPEVVVSRAEEAAREFAGLNQHAHAATKLRSRADALTAI
+ RAGIDGIAAEFGL"
+ gene complement(730572..731402)
+ /locus_tag="BQ2027_MB0650C"
+ CDS complement(730572..731402)
+ /locus_tag="BQ2027_MB0650C"
+ /note="Mb0650c, -, len: 276 aa. Equivalent to Rv0633c,
+ len: 279 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.9% identity in 279 aa overlap). Possible exported
+ protein; has hydrophobic stretch at aa 23-41.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a 9
+ bp deletion (cgggtgcgc-*) leads to shorter product
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv (276 aa versus 279 aa). Protein product from
+ Mb0650c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0650c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE EXPORTED PROTEIN"
+ /protein_id="SIT99248.1"
+ /db_xref="GOA:A0A1R3XVY6"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVY6"
+ /translation="MVDSMGWVLSSWHEVTGVDSGTWLAWAALGLGVVALVVTKRQIQ
+ RNRRLAAEQTRPYVAMFMEPHVADWHVIELVVRNFGRTAAYDVRFSFPNPPTVAQYEN
+ AANGYADVVELRLPQELPMLAPGQEWRMVWDSALDRAEIGRGIESRFPGTVTYYDRPE
+ QPRRWRFWRRGRRPLETKVVLDWDALPPVARIELMTTHDLAKREKQKLELLRSLLTYF
+ HYASKETRPDVFRSEIDRINRAAAETQDRWRARQVEVPTEVSQRSEGQGPQPTRIPAG
+ "
+ gene complement(731556..732269)
+ /locus_tag="BQ2027_MB0651C"
+ CDS complement(731556..732269)
+ /locus_tag="BQ2027_MB0651C"
+ /note="Mb0651c, -, len: 237 aa. Equivalent to Rv0634c,
+ len: 237 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 237 aa overlap). Possible glyoxalase
+ II (EC 3.1.2.6), equivalent to NP_302290.1|NC_002677
+ putative glyoxylase II from Mycobacterium leprae (238 aa);
+ and similar to U00011_3|Y0BK_MYCLE|Q49649 hypothetical
+ 23.9 kd protein from Mycobacterium leprae (218 aa), FASTA
+ scores: opt: 281, E(): 3.9e-12, (31.8% identity in 201 aa
+ overlap). Also similar to other glyoxalases and
+ metallo-beta-lactamase family proteins e.g.
+ NP_386770.1|NC_003047 PUTATIVE HYDROXYACYLGLUTATHIONE
+ HYDROLASE from Sinorhizobium meliloti (256 aa); etc. Also
+ similar to other putative glyoxylases from Mycobacterium
+ tuberculosis e.g. Rv1637c. BELONGS TO THE GLYOXALASE II
+ FAMILY. COFACTOR: BINDS TWO ZINC IONS. Protein product
+ from Mb0651c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0651c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE GLYOXALASE II (HYDROXYACYLGLUTATHIONE
+ HYDROLASE) (GLX II)"
+ /protein_id="SIT99249.1"
+ /db_xref="GOA:A0A1R3XVX3"
+ /db_xref="InterPro:IPR001279"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVX3"
+ /translation="MSKDRLYFRQLLSGRDFAVGDMFATQMRNFAYLIGDRTTGDCVV
+ VDPAYAAGDLLDALESDDMQLSGVLVTHHHPDHVGGSMMGFQLPGLAELLERASVPVH
+ VNTHEALWVSRVTGIPVGDLITHEHGDKVSVGDIDIELLHTPGHTPGSQCFLLDGRLV
+ AGDTLFLEGCGRTDFPGGDSDEMYRSLRQLAELPGDPTVFPGHWYSAEPSASLSEVKR
+ SNYVYRPASLDQWRMLMGG"
+ gene 732349..732600
+ /locus_tag="BQ2027_MB0652"
+ CDS 732349..732600
+ /locus_tag="BQ2027_MB0652"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0652, -, len: 83 aa. Equivalent to Rv0634A, len:
+ 83 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 83 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0652 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0652 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcription regulator of the Arc/MetJ class"
+ /protein_id="SIT99250.1"
+ /db_xref="InterPro:IPR019239"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVX5"
+ /translation="MGSDCGCGGYLWSMLKRVEIEVDDDLIQKVIRRYRVKGAREAVN
+ LALRTLLGEADTAEHGHDDEYDEFSDPNAWVPRRSRDTG"
+ gene 732730..732802
+ /locus_tag="BQ2027_THRT"
+ tRNA 732730..732802
+ /locus_tag="BQ2027_THRT"
+ /product="tRNA-Thr"
+ /note="thrT, len: 73 nt. Equivalent to thrT, len: 73 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 73 nt overlap). tRNA-Thr, anticodon ggt."
+ gene 732839..732912
+ /locus_tag="BQ2027_METT"
+ tRNA 732839..732912
+ /locus_tag="BQ2027_METT"
+ /product="tRNA-Met"
+ /note="metT, len: 74 nt. Equivalent to metT, len: 74 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 74 nt overlap). tRNA-Met, anticodon cat."
+ gene 732948..733115
+ /gene="rpmG2"
+ /locus_tag="BQ2027_MB0653"
+ CDS 732948..733115
+ /gene="rpmG2"
+ /locus_tag="BQ2027_MB0653"
+ /note="Mb0653, rpmG2, len: 55 aa. Equivalent to Rv0634B,
+ len: 55 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 55 aa overlap). Probable rpmG2, 50S
+ ribosomal protein L33. Note that Mycobacterium
+ tuberculosis has a second rpmG gene:
+ P96925|R33H_MYCTU|Rv2057c|MTCY63A.03|rpmG1 PUTATIVE 50S
+ RIBOSOMAL PROTEIN L33 (55 aa), FASTA scores: opt: 391,
+ E(): 2.9e-25, (100.0% identity in 55 aa overlap). BELONGS
+ TO THE L33P FAMILY OF RIBOSOMAL PROTEINS. Protein product
+ from Mb0653 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0653 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l33 rpmg2"
+ /protein_id="SIT99251.1"
+ /db_xref="GOA:P0A5W3"
+ /db_xref="InterPro:IPR001705"
+ /db_xref="InterPro:IPR011332"
+ /db_xref="InterPro:IPR018264"
+ /db_xref="InterPro:IPR038584"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5W3"
+ /translation="MASSTDVRPKITLACEVCKHRNYITKKNRRNDPDRLELKKFCPN
+ CGKHQAHRETR"
+ gene 733166..733642
+ /gene="hadA"
+ /locus_tag="BQ2027_MB0654"
+ CDS 733166..733642
+ /gene="hadA"
+ /locus_tag="BQ2027_MB0654"
+ /note="Mb0654, -, len: 158 aa. Equivalent to Rv0635, len:
+ 158 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 158 aa overlap). Conserved
+ hypothetical protein, equivalent to NP_302287.1|NC_002677
+ conserved hypothetical protein from Mycobacterium leprae
+ (159 aa); and highly similar to YV31_MYCLE|P54879
+ conserved hypothetical protein from Mycobacterium leprae
+ (166 aa), FASTA scores: opt: 387, E(): 5.9e-21, (43.4%
+ identity in 145 aa overlap). Also similar
+ CAB77410.1|AL160431|SCD82.07 hypothetical protein from
+ Streptomyces coelicolor (150 aa). And highly similar to
+ two hypothetical proteins from Mycobacterium tuberculosis:
+ Rv0504c|YV31_MYCTU|Q11168 (166 aa), FASTA scores: opt:
+ 405, E(): 3.2e-22, (45.0% identity in 140 aa overlap); and
+ Rv0637|MTY20H10_19 (2 ORFs downstream) (166 aa), FASTA
+ score: (48.7% identity in 150 aa overlap). Protein product
+ from Mb0654 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0654 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="(3r)-hydroxyacyl-acp dehydratase subunit hada"
+ /protein_id="SIT99252.1"
+ /db_xref="InterPro:IPR016709"
+ /db_xref="InterPro:IPR029069"
+ /db_xref="InterPro:IPR039569"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1K4"
+ /translation="MALSADIVGMHYRYPDHYEVEREKIREYAVAVQNDDAWYFEEDG
+ AAELGYKGLLAPLTFICVFGYKAQAAFFKHANIATAEAQIVQVDQVLKFEKPIVAGDK
+ LYCDVYVDSVREAHGTQIIVTKNIVTNEEGDLVQETYTTLAGRAGEDGEGFSDGAA"
+ gene 733629..734057
+ /gene="hadB"
+ /locus_tag="BQ2027_MB0655"
+ CDS 733629..734057
+ /gene="hadB"
+ /locus_tag="BQ2027_MB0655"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0655, -, len: 142 aa. Equivalent to Rv0636, len:
+ 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 142 aa overlap). Conserved hypothetical
+ protein, equivalent to NP_302286.1|NC_002677 conserved
+ hypothetical protein from Mycobacterium leprae (142 aa).
+ Also highly similar to CAB77411.1|AL160431|SCD82.08
+ hypothetical protein from Streptomyces coelicolor (142
+ aa); and similar to others e.g. U28943|CELE04F6_3 from
+ Caenorhabditis elegans (cosmid E04) (298 aa), FASTA
+ scores: opt: 167, E(): 0.00064, (31.6 identity in 117 aa
+ overlap). Protein product from Mb0655 detected using
+ shotgun mass spectrometry. Mb0655 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="(3r)-hydroxyacyl-acp dehydratase subunit hadb"
+ /protein_id="SIT99253.1"
+ /db_xref="InterPro:IPR002539"
+ /db_xref="InterPro:IPR029069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWZ3"
+ /translation="MALREFSSVKVGDQLPEKTYPLTRQDLVNYAGVSGDLNPIHWDD
+ EIAKVVGLDAAIAHGMLTMGIGGGYVTSWVGDPGAVTEYNVRFTAVVPVPNDGKGAEL
+ VFNGRVKSVDPESKSVTIALTATTGGKKIFGRAIASAKLA"
+ gene 734061..734561
+ /gene="hadC"
+ /locus_tag="BQ2027_MB0656"
+ CDS 734061..734561
+ /gene="hadC"
+ /locus_tag="BQ2027_MB0656"
+ /note="Mb0656, -, len: 166 aa. Equivalent to Rv0637, len:
+ 166 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 166 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ NP_302285.1|NC_002677|YV31_MYCLE|P54879 conserved
+ hypothetical protein from Mycobacterium leprae (166 aa),
+ FASTA scores: opt: 352, E(): 4e-19, (39.2% identity in 148
+ aa overlap); and highly similar to others from
+ Mycobacterium leprae e.g. NP_302287.1|NC_002677 conserved
+ hypothetical protein (159 aa). Also highly similar to
+ CAB77410.1|AL160431|SCD82.07 hypothetical protein from
+ Streptomyces coelicolor (150 aa);
+ Rv0635|NP_215149.1|NC_000962|MTY20H10_17 conserved
+ hypothetical protein (two ORFs upstream) from
+ Mycobacterium tuberculosis (158 aa), FASTA score: (49.3%
+ identity in 150 aa overlap); and
+ Rv0504c|NP_215018.1|NC_000962|YV31_MYCTU|Q11168
+ hypothetical protein from Mycobacterium tuberculosis (166
+ aa), FASTA scores: opt: 380, E(): 3.8e-21, (43.1% identity
+ in 137 aa overlap). Protein product from Mb0656 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0656 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="(3r)-hydroxyacyl-acp dehydratase subunit hadc"
+ /protein_id="SIT99254.1"
+ /db_xref="InterPro:IPR016709"
+ /db_xref="InterPro:IPR029069"
+ /db_xref="InterPro:IPR039569"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1K2"
+ /translation="MALKTDIRGMIWRYPDYFIVGREQCREFARAVKCDHPAFFSEEA
+ AADLGYDALVAPLTFVTILAKYVQLDFFRHVDVGMETMQIVQVDQRFVFHKPVLAGDK
+ LWARMDIHSVDERFGADIVVTRNLCTNDDGELVMEAYTTLMGQQGDGSARLKWDKESG
+ QVIRTA"
+ gene 734760..734832
+ /locus_tag="BQ2027_TRPT"
+ tRNA 734760..734832
+ /locus_tag="BQ2027_TRPT"
+ /product="tRNA-Trp"
+ /note="trpT, len: 73 nt. Equivalent to trpT, len: 73 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 73 nt overlap). tRNA-Trp, anticodon cca."
+ gene 734973..735458
+ /gene="secE1"
+ /locus_tag="BQ2027_MB0657"
+ CDS 734973..735458
+ /gene="secE1"
+ /locus_tag="BQ2027_MB0657"
+ /note="Mb0657, secE1, len: 161 aa. Equivalent to Rv0638,
+ len: 161 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 161 aa overlap). Probable secE1,
+ preprotein translocase (tail-anchored membrane protein),
+ highly similar at C-terminal half to others e.g.
+ P36690|SECE_STRGR PREPROTEIN TRANSLOCASE SECE SUBUNIT from
+ Streptomyces griseus (86 aa), FASTA scores: opt: 220, E():
+ 4.6e-06, (35.4% identity in 96 aa overlap);
+ P16920|SECE_ECOLI preprotein translocase sece subunit from
+ Escherichia coli strains K12 and O157:H7 (127 aa), FASTA
+ scores: opt: 122, E(): 0.34, (37.0% identity in 54 aa
+ overlap); etc. Contains PS01067 Protein secE/sec61-gamma
+ signature. BELONGS TO THE SECE/SEC61-GAMMA FAMILY. PART OF
+ THE PROKARYOTIC PROTEIN TRANSLOCATION APPARATUS WHICH
+ COMPRISE SECA|Rv3240c, SECD|Rv2587c, SECE, SECF|Rv2586c,
+ SECG|Rv1440 AND SECY|Rv0732. Note that previously known as
+ secE. Protein product from Mb0657 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0657
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PREPROTEIN TRANSLOCASE SECE1"
+ /protein_id="SIT99255.1"
+ /db_xref="GOA:P0A5Z1"
+ /db_xref="InterPro:IPR001901"
+ /db_xref="InterPro:IPR005807"
+ /db_xref="InterPro:IPR038379"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Z1"
+ /translation="MSDEGDVADEAVADGAENADSRGSGGRTALVTKPVVRPQRPTGK
+ RSRSRAAGADADVDVEEPSTAASEATGVAKDDSTTKAVSKAARAKKASKPKARSVNPI
+ AFVYNYLKQVVAEMRKVIWPNRKQMLTYTSVVLAFLAFMVALVAGADLGLTKLVMLVF
+ G"
+ gene 735490..736206
+ /gene="nusG"
+ /locus_tag="BQ2027_MB0658"
+ CDS 735490..736206
+ /gene="nusG"
+ /locus_tag="BQ2027_MB0658"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0658, nusG, len: 238 aa. Equivalent to Rv0639,
+ len: 238 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 238 aa overlap). Probable nusG,
+ transcription antitermination protein, equivalent to
+ NP_302283.1|NC_002677 transcription antitermination
+ protein nusG from Mycobacterium leprae (228 aa). Also
+ highly similar to others e.g. P36260|NUSG_STRGR from
+ Streptomyces griseus (294 aa), FASTA scores: opt: 845,
+ E(): 0, (55.4% identity in 233 aa overlap); etc. Note that
+ shorter at the N-terminus than other nusG. Contains
+ PS01014 Transcription termination factor nusG signature.
+ BELONGS TO THE NUSG FAMILY. Protein product from Mb0658
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0658 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTION ANTITERMINATION PROTEIN
+ NUSG"
+ /protein_id="SIT99256.1"
+ /db_xref="GOA:P65590"
+ /db_xref="InterPro:IPR001062"
+ /db_xref="InterPro:IPR006645"
+ /db_xref="InterPro:IPR008991"
+ /db_xref="InterPro:IPR014722"
+ /db_xref="InterPro:IPR015869"
+ /db_xref="InterPro:IPR036735"
+ /db_xref="UniProtKB/Swiss-Prot:P65590"
+ /translation="MTTFDGDTSAGEAVDLTEANAFQDAAAPAEEVDPAAALKAELRS
+ KPGDWYVVHSYAGYENKVKANLETRVQNLDVGDYIFQVEVPTEEVTEIKNGQRKQVNR
+ KVLPGYILVRMDLTDDSWAAVRNTPGVTGFVGATSRPSALALDDVVKFLLPRGSTRKA
+ AKGAASTAAAAEAGGLERPVVEVDYEVGESVTVMDGPFATLPATISEVNAEQQKLKVL
+ VSIFGRETPVELTFGQVSKI"
+ gene 736258..736686
+ /gene="rplK"
+ /locus_tag="BQ2027_MB0659"
+ CDS 736258..736686
+ /gene="rplK"
+ /locus_tag="BQ2027_MB0659"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0659, rplK, len: 142 aa. Equivalent to Rv0640,
+ len: 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 142 aa overlap). Probable rplK, 50S
+ ribosomal protein L11, equivalent to NP_302282.1|NC_002677
+ 50S ribosomal protein L11 from Mycobacterium leprae (142
+ aa). Also highly similar to others e.g.
+ P48954|RL11_STRCO|SCD82.19 50s ribosomal protein L11 from
+ Streptomyces coelicolor (144 aa), FASTA scores: opt: 763,
+ E(): 0, (84.6% identity in 143 aa overlap); etc. Contains
+ PS00359 Ribosomal protein L11 signature. BELONGS TO THE
+ L11P FAMILY OF RIBOSOMAL PROTEINS. Protein product from
+ Mb0659 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0659 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l11 rplk"
+ /protein_id="SIT99257.1"
+ /db_xref="GOA:P66057"
+ /db_xref="InterPro:IPR000911"
+ /db_xref="InterPro:IPR006519"
+ /db_xref="InterPro:IPR020783"
+ /db_xref="InterPro:IPR020784"
+ /db_xref="InterPro:IPR020785"
+ /db_xref="InterPro:IPR036769"
+ /db_xref="InterPro:IPR036796"
+ /db_xref="UniProtKB/Swiss-Prot:P66057"
+ /translation="MAPKKKVAGLIKLQIVAGQANPAPPVGPALGQHGVNIMEFCKAY
+ NAATENQRGNVIPVEITVYEDRSFTFTLKTPPAAKLLLKAAGVAKGSAEPHKTKVAKV
+ TWDQVREIAETKKTDLNANDVDAAAKIIAGTARSMGITVE"
+ gene 736753..737460
+ /gene="rplA"
+ /locus_tag="BQ2027_MB0660"
+ CDS 736753..737460
+ /gene="rplA"
+ /locus_tag="BQ2027_MB0660"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0660, rplA, len: 235 aa. Equivalent to Rv0641,
+ len: 235 aa, from Mycobacterium tuberculosis strain H37Rv
+ (99.6% identity in 235 aa overlap). Probable rplA, 50S
+ ribosomal protein L1, equivalent to NP_302281.1|NC_002677
+ 50S ribosomal protein L1 from Mycobacterium leprae (235
+ aa). Also highly similar to others e.g. P3625|RL1_STRGR
+ 50s ribosomal protein L1 from Streptomyces griseus (240
+ aa), FASTA scores: opt: 1081, E(): 0, (72.2% identity in
+ 230 aa overlap); etc. BELONGS TO THE L1P FAMILY OF
+ RIBOSOMAL PROTEINS. Protein product from Mb0660 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0660 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l1 rpla"
+ /protein_id="SIT99258.1"
+ /db_xref="GOA:P59790"
+ /db_xref="InterPro:IPR002143"
+ /db_xref="InterPro:IPR005878"
+ /db_xref="InterPro:IPR016095"
+ /db_xref="InterPro:IPR023673"
+ /db_xref="InterPro:IPR023674"
+ /db_xref="InterPro:IPR028364"
+ /db_xref="UniProtKB/Swiss-Prot:P59790"
+ /translation="MSKTSKAYRAAAAKVDRTNLYTPLQAAKLAKETSSTKQDATVEV
+ AIRLGVDPRKADQMVRGTVNLPHGTGKTARVAVFAVGEKADAAVAAGADVVGSDDLIE
+ RIQGGWLEFDAAIAAPDQMAKVGRIARVLGPRGLMPNPKTGTVTADVAKAVADIKGGK
+ INFRVDKQANLHFVIGKASFDEKLLAENYGAAIDEVLRLKPSSSKGRYLKKITVSTTT
+ GPGIPVDPSITRNFAGE"
+ gene complement(737534..738439)
+ /gene="mmaA4"
+ /locus_tag="BQ2027_MB0661C"
+ CDS complement(737534..738439)
+ /gene="mmaA4"
+ /locus_tag="BQ2027_MB0661C"
+ /note="Mb0661c, mmaA4, len: 301 aa. Equivalent to Rv0642c,
+ len: 301 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 301 aa overlap). mmaA4, methoxy mycolic
+ acid synthase 4 (methyltransferase) (EC 2.1.1.-) (see
+ citations below). Equivalent to AAC44876|AAC44876.1|cmaA
+ methyl transferase (mycolic acid modification protein)
+ from Mycobacterium bovis BCG strain Pasteur (298 aa);
+ NP_302280.1|NC_002677 methyl mycolic acid synthase 4 from
+ Mycobacterium leprae (298 aa); and highly similar to
+ others from Mycobacteria e.g. downstream ORF
+ P72027|mmaA3|Rv0643c|MTCY20H10.24c PUTATIVE METHOXY
+ MYCOLIC ACID SYNTHASE 3 from Mycobacterium tuberculosis
+ (293 aa). Protein product from Mb0661c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0661c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="METHOXY MYCOLIC ACID SYNTHASE 4 MMAA4 (METHYL
+ MYCOLIC ACID SYNTHASE 4) (MMA4) (HYDROXY MYCOLIC ACID
+ SYNTHASE)"
+ /protein_id="SIT99259.1"
+ /db_xref="GOA:Q7U1K1"
+ /db_xref="InterPro:IPR003333"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1K1"
+ /translation="MTRMAEKPISPTKTRTRFEDIQAHYDVSDDFFALFQDPTRTYSC
+ AYFEPPELTLEEAQYAKVDLNLDKLDLKPGMTLLDIGCGWGTTMRRAVERLDVNVIGL
+ TLSKNQHARCEQVLASIDTNRSRQVLLQGWEDFAEPVDRIVSIEAFEHFGHENYDDFF
+ KRCFNIMPADGRMTVQSSVSYHPYEMAARGKKLSFETARFIKFIVTEIFPGGRLPSTE
+ MMVEHGEKAGFTVPEPLSLRPHYIKTLRIWGDTLQSNKDKAIEVTSEEVYNRYMKYLR
+ GCEHYFTDEMLDCSLVTYLKPGAAA"
+ gene complement(738504..739385)
+ /gene="mmaA3"
+ /locus_tag="BQ2027_MB0662C"
+ CDS complement(738504..739385)
+ /gene="mmaA3"
+ /locus_tag="BQ2027_MB0662C"
+ /note="Mb0662c, mmaA3, len: 293 aa. Equivalent to Rv0643c,
+ len: 293 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 293 aa overlap). mmaA3, methoxy
+ mycolic acid synthase 3 (methyltransferase) (EC 2.1.1.-)
+ (see citations below). Equivalent to
+ AAC44875|AAC44875.1|cmaB methyl transferase (mycolic acid
+ modification protein) from Mycobacterium bovis BCG strain
+ Pasteur (289 aa); and highly similar to others from
+ Mycobacteria e.g. upstream ORF
+ P72028|mmaA4|Rv0642c|MTCY20H10.23c PUTATIVE METHOXY
+ MYCOLIC ACID SYNTHASE 4 from Mycobacterium tuberculosis
+ (301 aa). Protein product from Mb0662c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0662c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="METHOXY MYCOLIC ACID SYNTHASE 3 MMAA3 (METHYL
+ MYCOLIC ACID SYNTHASE 3) (MMA3) (HYDROXY MYCOLIC ACID
+ SYNTHASE)"
+ /protein_id="SIT99260.1"
+ /db_xref="GOA:Q7U1K0"
+ /db_xref="InterPro:IPR003333"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1K0"
+ /translation="MSDNSTGTTKSRSNVDDVQAHYDLSDAFFALFQDPTRTYSCAYF
+ ERDDMTLHEAQVAKLDLTLGKLGLEPGMTLLDVGCGWGSVMKRAVERYDVNVVGLTLS
+ KNQHAYCQQVLDKVDTNRSHRVLLSDWANFSEPVDRIVTIEAIEHFGFERYDDFFKFA
+ YNAMPADGVMLLHSITGLHVKQVIERGIPLTMEMAKFIRFIVTDIFPGGRLPTIETIE
+ EHVTKAGFTITDIQSLQPHFARTLDLWAEALQAHKDEAIEIQSAEVYERYMKYLTGCA
+ KAFRMGYIDCNQFTLAK"
+ gene complement(739533..740396)
+ /gene="mmaA2"
+ /locus_tag="BQ2027_MB0663C"
+ CDS complement(739533..740396)
+ /gene="mmaA2"
+ /locus_tag="BQ2027_MB0663C"
+ /note="Mb0663c, mmaA2, len: 287 aa. Equivalent to Rv0644c,
+ len: 287 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 287 aa overlap). mmaA2, methoxy mycolic
+ acid synthase 2 (methyltransferase) (EC 2.1.1.-) (see
+ citations below). Equivalent to AAC44874|AAC44874.1|cmaC
+ methyl transferase (mycolic acid modification protein)
+ from Mycobacterium bovis BCG strain Pasteur (287 aa); and
+ highly similar to others from Mycobacteria e.g. upstream
+ ORF P72028|mmaA4|Rv0642c|MTCY20H10.23c PUTATIVE METHOXY
+ MYCOLIC ACID SYNTHASE 4 from Mycobacterium tuberculosis
+ (301 aa). Note that alternative start is at position
+ 739247. Protein product from Mb0663c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0663c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="METHOXY MYCOLIC ACID SYNTHASE 2 MMAA2 (METHYL
+ MYCOLIC ACID SYNTHASE 2) (MMA2) (HYDROXY MYCOLIC ACID
+ SYNTHASE)"
+ /protein_id="SIT99261.1"
+ /db_xref="GOA:Q7U1J9"
+ /db_xref="InterPro:IPR003333"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1J9"
+ /translation="MVNDLTPHFEDVQAHYDLSDDFFRLFLDPTQTYSCAHFEREDMT
+ LEEAQIAKIDLALGKLGLQPGMTLLDIGCGWGATMRRAIAQYDVNVVGLTLSKNQAAH
+ VQKSFDEMDTPLDRRVLLAGWEQFNEPVDRIVSIGAFEHFGHDRHADFFARAHKILPP
+ DGVLLLHTITGLTRQQMVDHGLPLTLWLARFLKFIATEIFPGGQPPTIEMVEEQSAKT
+ GFTLTRRQSLQPHYARTLDLWAEALQEHKSEAIAIQSEEVYERYMKYLTGCAKLFRVG
+ YIDVNQFTLAK"
+ gene complement(740563..741423)
+ /gene="mmaA1"
+ /locus_tag="BQ2027_MB0664C"
+ CDS complement(740563..741423)
+ /gene="mmaA1"
+ /locus_tag="BQ2027_MB0664C"
+ /note="Mb0664c, mmaA1, len: 286 aa. Equivalent to Rv0645c,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 286 aa overlap). mmaA1, methoxy
+ mycolic acid synthase 1 (methyltransferase) (EC 2.1.1.-)
+ (see citations below). Equivalent to NP_302279.1|NC_002677
+ methyl mycolic acid synthase 1 from Mycobacterium leprae
+ (286 aa); and highly similar to others from Mycobacteria
+ e.g. upstream ORF P72028|mmaA4|Rv0642c|MTCY20H10.23c
+ PUTATIVE METHOXY MYCOLIC ACID SYNTHASE 4 from
+ Mycobacterium tuberculosis (301 aa). Protein product from
+ Mb0664c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0664c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="METHOXY MYCOLIC ACID SYNTHASE 1 MMAA1 (METHYL
+ MYCOLIC ACID SYNTHASE 1) (MMA1) (HYDROXY MYCOLIC ACID
+ SYNTHASE)"
+ /protein_id="SIT99262.1"
+ /db_xref="GOA:P0A5Q1"
+ /db_xref="InterPro:IPR003333"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Q1"
+ /translation="MAKLRPYYEESQSAYDISDDFFALFLDPTWVYTCAYFERDDMTL
+ EEAQLAKVDLALDKLNLEPGMTLLDVGCGWGGALVRAVEKYDVNVIGLTLSRNHYERS
+ KDRLAAIGTQRRAEARLQGWEEFEENVDRIVSFEAFDAFKKERYLTFFERSYDILPDD
+ GRMLLHSLFTYDRRWLHEQGIALTMSDLRFLKFLRESIFPGGELPSEPDIVDNAQAAG
+ FTIEHVQLLQQHYARTLDAWAANLQAARERAIAVQSEEVYNNFMHYLTGCAERFRRGL
+ INVAQFTMTK"
+ gene complement(741470..742375)
+ /gene="lipG"
+ /locus_tag="BQ2027_MB0665C"
+ CDS complement(741470..742375)
+ /gene="lipG"
+ /locus_tag="BQ2027_MB0665C"
+ /note="Mb0665c, lipG, len: 301 aa. Equivalent to Rv0646c,
+ len: 301 aa. from Mtycobacterium tuberculosis strain
+ H37Rv, (100.0% identity in 301 aa overlap). Probable lipG,
+ lipase/esterase (EC 3.1.-.-), equivalent to
+ NP_302278.1|NC_002677 probable hydrolase from
+ Mycobacterium leprae (304 aa). Also highly similar to
+ various hydrolases, especially lipases e.g.
+ AA61351.1|X88895 carboxyl esterase from Acinetobacter
+ calcoaceticus (312 aa), FASTA scores: opt: 867, E(): 0,
+ (50.2% identity in 279 aa overlap); etc. Also similar to
+ transferases e.g. P77026 MACROLIDE 2'-PHOSPHOTRANSFERASE
+ II from Escherichia coli (279 aa), FASTA scores: E():
+ 1.3e-14, (32.5% identity in 286 aa overlap). Similar to M.
+ tuberculosis non-heme bromoperoxidases and epoxide
+ hydrolases. Protein product from Mb0665c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0665c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPASE/ESTERASE LIPG"
+ /protein_id="SIT99263.1"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX04"
+ /translation="MDIRSGTAVSGDVKLYYEDMGDLDHPPVLLIMGLGAQMLLWRTD
+ FCARLVAKGLRVIRYDNRDVGLSTKTERHRPGQPLATRLVRSWLGLPSQAAYTLEDMA
+ ADAAALLDHLDVKHAHVVGASMGGMIAQIFAARFAQRTKTLAVIFSSNNHRFLPPPAP
+ RALLALLTGPPPDSPRDVIVDNAVRVSKIIGSPAYPIPEDQVRAEAAESYDRNFHPWG
+ IAQQFSAILGSGSLLRYDRRIVAPTVVIHGRADKLMRPFGGRAVARAINGARLVLIDG
+ MGHDLPRQLWDRVIGELTRNFSEAG"
+ gene complement(742387..743853)
+ /locus_tag="BQ2027_MB0666C"
+ CDS complement(742387..743853)
+ /locus_tag="BQ2027_MB0666C"
+ /note="Mb0666c, -, len: 488 aa. Equivalent to Rv0647c,
+ len: 488 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 488 aa overlap). Conserved hypothetical
+ protein, equivalent to NP_302277.1|NC_002677 conserved
+ hypothetical protein from Mycobacterium leprae (448 aa).
+ Also showing similarity to a variety of hypothetical
+ ABC1-LIKE proteins or conserved hypothetical proteins e.g.
+ D90908_28|P73627 ABC1-LIKE PROTEIN from Synechocystis (585
+ aa), FASTA scores: E(): 1.8e-31, (29.1% identity in 474 aa
+ overlap); Q55884 HYPOTHETICAL6 5.0 KD PROTEIN (567 aa),
+ FASTA scores: opt: 583, E(): 5.7e-30, (28.1% identity in
+ 416 aa overlap); etc. Also similar to Rv3197 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis.
+ Protein product from Mb0666c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0666c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted unusual protein kinase"
+ /protein_id="SIT99264.1"
+ /db_xref="GOA:A0A1R3XW38"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR004147"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW38"
+ /translation="MRAEIGPDFRPHYTFGDAYPASERAHVNWELSAPVWHTAQMGST
+ THREVAKLDRVPLPVEAARVAATGWQVTRTAVRFIGRLPRKGPWQQKVIKELPQTFAD
+ LGPTYVKFGQIIASSPGAFGESLSREFRGLLDRVPPAKTDEVHKLFVEELGDEPARLF
+ ASFEEEPFASASIAQVHYATLRSGEEVVVKIQRPGIRRRVAADLQILKRFAQTVELAK
+ LGRRLSAQDVVADFADNLAEELDFRLEAQSMEAWVSHLHASPLGKNIRVPQVHWDFTT
+ ERVLTMERVHGIRIDNTAAIRKAGFDGVELVKALLFSVFEGGLRHGLFHGDLHAGNLY
+ VDEAGRIVFFDFGIMGRIDPRTRWLLRELVYALLVKKDHAAAGKIVVLMGAVGTMKPE
+ TQAAKDLERFATPLTMQSLGDMSYADIGRQLSALADAYDVKLPRELVLIGKQFLYVER
+ YMKLLAPRWQMMSDPQLTGYFANFMVEVSREHQSDIEV"
+ gene 744488..748135
+ /locus_tag="BQ2027_MB0667"
+ CDS 744488..748135
+ /locus_tag="BQ2027_MB0667"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0667, -, len: 1215 aa. Equivalent to Rv0648, len:
+ 1215 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 1215 aa overlap). Alpha-mannosidase (EC
+ 3.2.1.-) (see citation below), showing some similarity to
+ hypothetical proteins and various sugar hydrolases e.g.
+ SYCSLRA_6|Q55528 HYPOTHETICAL 1 20.4 KD PROTEIN from
+ Synechocystis (1042 aa), FASTA scores: opt: 260, E():
+ 3.6e-08, (23.4% identity in 602 aa overlap); etc. Contains
+ PS00659 Glycosyl hydrolases family 5 signature. Mb0667
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ALPHA-MANNOSIDASE"
+ /protein_id="SIT99265.1"
+ /db_xref="GOA:A0A1R3XWE5"
+ /db_xref="InterPro:IPR000602"
+ /db_xref="InterPro:IPR011013"
+ /db_xref="InterPro:IPR011330"
+ /db_xref="InterPro:IPR011682"
+ /db_xref="InterPro:IPR015341"
+ /db_xref="InterPro:IPR018905"
+ /db_xref="InterPro:IPR027291"
+ /db_xref="InterPro:IPR028995"
+ /db_xref="InterPro:IPR037094"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWE5"
+ /translation="MMGGTYNEPNTNLTSPETTIRNLVHGIGFQRDVLGAEPATAWQL
+ DVFGHDPQFPGLAADAGLTSSSWARGPHHQWGPAQGGVDRMQFCSEFEWIAPSGRGLL
+ THYMPAHYSAGWSMDSSTSLADAEAATYALFDQLKKVALTRNVLLPVGTDYTPPNKWV
+ TAIHRDWGARYTWPRFVCALPKEFFAAVRAELAKRGWVPLPQTRDMNPIYTGKDVSYI
+ DTKQANRAAENAVLEAERFAVFAALLTGAEYPQAALAKAWVQLAYGAHHDAITGSESD
+ QVYLDLLTGWRDAWELGRAARDNSLRLLSGAVAASHDRVVVWNPLTQRRTDIVTARVD
+ PPLQAGVRVFDPDGAEVAALVEHDGRSVTWLACDVPSLGWRVYRLVPADEAPGWELVP
+ GTDIANEHYRLAVDPERGGALSSLVQDGRQLIAAGRVANELALYEEYPSHPTQGEGPW
+ HLLPTGPVVCSSACPAQVQAYRGPLGQRLVVRGRIGTLLRYTQTLTLWDGVDRVDCRT
+ SIDEFTGEDRLLRLRWPCPVPGAMPISEVGDAVVGRGFALLHEGPESVDTAQHPWTLD
+ NPAYGWFGLSSAVRVRAGDGVRAVSVAEVVSPTETVSGPMARDLMVALVRAGVTATCS
+ GADKPRYGHLDVDSNLPDARIALGGPDRNTFTKAVLAEAAPAYTAELQRQLAKTGTAR
+ VWVPAANPLARAWLPGADLRAPCALPVLVIDGRDEKHLRAAVASLADDLADAEIVVHQ
+ RAAPQMEPFEDRTVALLNRGVPSFAVDSEGTLHTALMRSCTGWPSGVWIDQPRRTAPD
+ GSNFQLQHWTHHFDYALVCGGGDWRRAGIPARSAQFSHPLLAVAPRRPQGELPAVGSL
+ LHVEPADSVQLGALKAAGNRLAAGSARPVQPAAVALRLVQTTGADTPVTIGCELGKVG
+ ALRPADLLETPLAMARARKSSIDLHGYQVATVLARLDVAADMANVLAADDVALAPHAE
+ TAQPQYARYWLHNRGPAPLGGLPAVAHLHPRRVRGQPGDDVVLRLTAASDCTDSVLGG
+ VVDVVCPLGWPATPARLPFTLGAGAHLQADIALSIPAGAPPGPYPVRAQLRVVDTAVP
+ AAWRQVVEDVCVVTVGADSDLEELVYLVDGPADIELAAGDRARLAVTIGSRAHAELAL
+ DAHSISPWGTWEWIGPPALGAVLPARGMAKLAFDVTPPAWLEPGQWWALVRVGCAGQL
+ VYSPAVKVSVT"
+ gene 748132..748806
+ /gene="fabD2"
+ /locus_tag="BQ2027_MB0668"
+ CDS 748132..748806
+ /gene="fabD2"
+ /locus_tag="BQ2027_MB0668"
+ /note="Mb0668, fabD2, len: 224 aa. Equivalent to Rv0649,
+ len: 224 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 224 aa overlap). Possible fabD2,
+ malonyl CoA-acyl carrier protein transacylase (EC
+ 2.3.1.39), similar to MTFABD|FABD_MYCTU|Q10501|Rv2243
+ malonyl CoA-acyl carrier protein transacylase from
+ Mycobacterium tuberculosis (302 aa), FASTA scores: opt:
+ 133, E(): 0.074, (31.3% identity in 147 aa overlap).
+ Mb0668 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible malonyl coa-acyl carrier protein
+ transacylase fabd2 (mct)"
+ /protein_id="SIT99266.1"
+ /db_xref="InterPro:IPR027304"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVZ5"
+ /translation="MSGRSRLPGSSSRRDAARIVAERVVATVAGVAVAVDEVDAAEAR
+ LRDGPRAAALPASGTSEGRQLRRWLTQLIVTERVVAAEAAARGLTAAGAPAEADLLPD
+ ATARLEIGSVAAAVLADPLARALFAAVTARVAVTDDAVADYHARNPLRFAAPCPGQHG
+ WRAPAAAAPPLDQVRRAITEHLLGAARRRAFRVWLDARRNALVVLAPGYEHPGDPRQP
+ DNTRRH"
+ gene 748806..749714
+ /locus_tag="BQ2027_MB0669"
+ CDS 748806..749714
+ /locus_tag="BQ2027_MB0669"
+ /note="Mb0669, -, len: 302 aa. Equivalent to Rv0650, len:
+ 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 302 aa overlap). Possible sugar
+ kinase, highly similar to others e.g. CAB95296.1|AL359779
+ putative sugar kinase from Streptomyces coelicolor (317
+ aa); NP_406512.1|NC_003143 putative sugar kinase from
+ Yersinia pestis (290 aa); NP_229269.1|NC_000853
+ glucokinase from Thermotoga maritima (317 aa);
+ etc.Contains PS01125 ROK family signature. BELONGS TO THE
+ ROK (NAGC/XYLR) FAMILY. Protein product from Mb0669
+ detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE SUGAR KINASE"
+ /protein_id="SIT99267.1"
+ /db_xref="GOA:A0A1R3XW29"
+ /db_xref="InterPro:IPR000600"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW29"
+ /translation="MLTLCLDIGGTKIAAGLADPAGTLVHTAQRPTPAYGGAEQVWAA
+ VAEMIADALGVAGGAVGGVGIASAGPIDLHSGRVSPINIGSWGGFPLRDRVAAAVPGV
+ PVRLGGDGVCMALGEHWLGAGRGARFLLGLVVSTGVGGGLVLDGAPCLGRTGNAGHVG
+ HVVVDPDGSPCPCGGRGCVETIASGPSLARWARANGWSAPPGAGAKELAEAAGAGDPV
+ ALRAFRRGAAALAAMIASVGAVCDLDLAVIGGGVAKSGRLLFEPLRAALADHARLDFL
+ AGLRVVPAELGGAAGLVGAARLAAIA"
+ gene 750045..750581
+ /gene="rplJ"
+ /locus_tag="BQ2027_MB0670"
+ CDS 750045..750581
+ /gene="rplJ"
+ /locus_tag="BQ2027_MB0670"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0670, rplJ, len: 178 aa. Equivalent to Rv0651,
+ len: 178 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 178 aa overlap). Probable rplJ, 50S
+ ribosomal protein L10, equivalent to NP_302276.1|NC_002677
+ 50S ribosomal protein L10 from Mycobacterium leprae (177
+ aa). Also highly similar to others e.g. P36257|RL10_STRGR
+ 50s ribosomal protein L10 from Streptomyces griseus (185
+ aa), FASTA scores: opt: 633, E(): 0, (59.0 % identity in
+ 173 aa overlap); etc. BELONGS TO THE L10P FAMILY OF
+ RIBOSOMAL PROTEINS. Protein product from Mb0670 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0670 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l10 rplj"
+ /protein_id="SIT99268.1"
+ /db_xref="GOA:P66045"
+ /db_xref="InterPro:IPR001790"
+ /db_xref="InterPro:IPR002363"
+ /db_xref="InterPro:IPR022973"
+ /db_xref="UniProtKB/Swiss-Prot:P66045"
+ /translation="MARADKATAVADIAAQFKESTATLITEYRGLTVANLAELRRSLT
+ GSATYAVAKNTLIKRAASEAGIEGLDELFVGPTAIAFVTGEPVDAAKAIKTFAKEHKA
+ LVIKGGYMDGHPLTVAEVERIADLESREVLLAKLAGAMKGNLAKAAGLFNAPASQLAR
+ LAAALQEKKACPGPDSAE"
+ gene 750618..751010
+ /gene="rplL"
+ /locus_tag="BQ2027_MB0671"
+ CDS 750618..751010
+ /gene="rplL"
+ /locus_tag="BQ2027_MB0671"
+ /standard_name="L7|L12"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0671, rplL, len: 130 aa. Equivalent to Rv0652,
+ len: 130 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 130 aa overlap). Probable rplL
+ (alternate gene name: L7|L12), 50S ribosomal protein
+ L7/L12, equivalent to NP_302275.1|NC_002677 50S ribosomal
+ protein L7/L12 from Mycobacterium leprae (130 aa); and
+ P37381|RL7_MYCBO 50s ribosomal protein L7/L12 from
+ Mycobacterium bovis (130 aa). Also highly similar to
+ others e.g. P02396|RL7_STRGR 50S RIBOSOMAL PROTEIN L7/L12
+ from Streptomyces griseus (127 aa); etc. BELONGS TO THE
+ L12P FAMILY OF RIBOSOMAL PROTEINS. Protein product from
+ Mb0671 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0671 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l7/l12 rpll (sa1)"
+ /protein_id="SIT99269.1"
+ /db_xref="GOA:P0A5V3"
+ /db_xref="InterPro:IPR000206"
+ /db_xref="InterPro:IPR008932"
+ /db_xref="InterPro:IPR013823"
+ /db_xref="InterPro:IPR014719"
+ /db_xref="InterPro:IPR036235"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5V3"
+ /translation="MAKLSTDELLDAFKEMTLLELSDFVKKFEETFEVTAAAPVAVAA
+ AGAAPAGAAVEAAEEQSEFDVILEAAGDKKIGVIKVVREIVSGLGLKEAKDLVDGAPK
+ PLLEKVAKEAADEAKAKLEAAGATVTVK"
+ gene complement(751003..751698)
+ /locus_tag="BQ2027_MB0672C"
+ CDS complement(751003..751698)
+ /locus_tag="BQ2027_MB0672C"
+ /note="Mb0672c, -, len: 231 aa. Equivalent to Rv0653c,
+ len: 231 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 231 aa overlap). Possible
+ transcriptional regulator, TetR family, similar in
+ N-terminus to others e.g. CAC03642.1|AL391338 putative
+ TetR-family transcriptional regulator from Streptomyces
+ coelicolor (190 aa); Q51597 CAM REPRESSOR from Pseudomonas
+ putida (186 aa), FASTA scores: opt: 150, E(): 0.00085,
+ (27.8% identity in 97 aa overlap); etc. Also some
+ similarity to Mycobacterium tuberculosis hypothetical
+ transcriptional regulators Rv0681 and Rv1816. Contains
+ probable helix-turn helix motif from aa 27-48 (Score 1156,
+ +3.12 SD)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY TETR-FAMILY)"
+ /protein_id="SIT99270.1"
+ /db_xref="GOA:A0A1R3XVZ4"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR025996"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XVZ4"
+ /translation="MTSQTGVRDELLHAGVRLLDDHGPDALQTRKVAAAAGTSTMAVY
+ THFGGMRGLIAAIAEEGLRQFDVALTVPQTADPVADLLAIGTAYRRYAIERPHMYRLM
+ FGSTSAHGINVPARDVLTLKVAEIEHQHPSFAHVVRAVHRCLLAGRFATALGADDDTA
+ IVATAAQFWSQIHGFVMLELAGFYGDRGAAVEPVLAAMTVNLLVALGDSPERAQCSLR
+ AEQTQKNTLGRAT"
+ gene 751769..753274
+ /locus_tag="BQ2027_MB0673"
+ CDS 751769..753274
+ /locus_tag="BQ2027_MB0673"
+ /note="Mb0673, -, len: 501 aa. Equivalent to Rv0654, len:
+ 501 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 501 aa overlap). Probable dioxygenase
+ (EC 1.-.-.-), highly similar to others eg
+ AAK06796.1|AF324838_15|AF324838|SimC5 putative dioxygenase
+ (involved in tetraene formation) from Streptomyces
+ antibioticus (456 aa); CAB56138.1| AL117669 putative
+ dioxygenase from Streptomyces coelicolor (503 aa); T51734
+ neoxanthin cleavage enzyme (9-cis-epoxy-carotenoid
+ dioxygenase) from Arabidopsis thaliana (538 aa); Q53353
+ LIGNOSTILBENE-ALPHA,BETA-DIOXYGENASE from Pseudomonas
+ paucimobilis (Sphingomonas paucimobilis), FASTA scores:
+ opt: 280, E(): 2.3e-11, (28.5% identity in 523 aa
+ overlap); etc. Also some similarity with
+ Rv0913c|MTCY21C12.07c POSSIBLE DIOXYGENASE from
+ Mycobacterium tuberculosis (501 aa), FASTA score: (29.5%
+ identity in 522 aa overlap). Protein product from Mb0673
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0673 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DIOXYGENASE"
+ /protein_id="SIT99271.1"
+ /db_xref="GOA:A0A1R3XW04"
+ /db_xref="InterPro:IPR004294"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW04"
+ /translation="MTTAQAAESQNPYLEGFLAPVSTEVTATDLPVTGRIPEHLDGRY
+ LRNGPNPVAEVDPATYHWFTGDAMVHGVALRDGKARWYRNRWVRTPAVCAALGEPISA
+ RPHPRTGIIEGGPNTNVLTHAGRTLALVEAGVVNYELTDELDTVGPCDFDGTLHGGYT
+ AHPQRDPHTGELHAVSYSFARGHRVQYSVIGTDGHARRTVDIEVAGSPMMHSFSLTDN
+ YVVIYDLPVTFDPMQVVPASVPRWLQRPARLVIQSVLGRVRIPDPIAALGNRMQGHSD
+ RLPYAWNPSYPARVGVMPREGGNEDVRWFDIEPCYVYHPLNAYSECRNGAEVLVLDVV
+ RYSRMFDRDRRGPGGDSRPSLDRWTINLATGAVTAECRDDRAQEFPRINETLVGGPHR
+ FAYTVGIEGGFLVGAGAALSTPLYKQDCVTGSSTVASLDPDLLIGEMVFVPNPSARAE
+ DDGILMGYGWHRGRDEGQLLLLDAQTLESIATVHLPQRVPMGFHGNWAPTT"
+ gene 753286..754365
+ /gene="mkl"
+ /locus_tag="BQ2027_MB0674"
+ CDS 753286..754365
+ /gene="mkl"
+ /locus_tag="BQ2027_MB0674"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0674, mkl, len: 359 aa. Equivalent to Rv0655,
+ len: 359 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 359 aa overlap). Possible mkl,
+ ribonucleotide-transport ATP-binding protein ABC
+ transporter (see first citation below), equivalent to
+ P30769|MKL_MYCLE|ML1892 POSSIBLE RIBONUCLEOTIDE TRANSPORT
+ ATP-BINDING PROTEIN from Mycobacterium leprae (347 aa),
+ FASTA scores: opt: 2021, E(): 0, (92.2% identity in 335 aa
+ overlap). Also highly similar to many e.g.
+ AB92896.1|AL356992 putative ABC-transporter ATP-binding
+ protein from Streptomyces coelicolor (343 aa);
+ NP_253146.1|NC_002516 probable ATP-binding component of
+ ABC transporter from Pseudomonas aeruginosa (269 aa);
+ P45393|YRBF_ECOLI hypothetical ABC transporter ATP-binding
+ protein from Escherichia coli (269 aa), FASTA scores: opt:
+ 644, E(): 3.4e-33, (38.5% identity in 244 aa overlap);
+ etc. Also similar to many other Mycobacterium tuberculosis
+ ABC transporters e.g. P71747|CYSA|Rv2397c|MTCY253.24 (351
+ aa), FASTA score: (33.6% identity in 241 aa overlap).
+ Contains PS00017 ATP/GTP-binding site motif A (P-loop),
+ PS00211 ABC transporters family signature. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Protein product from Mb0674 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0674 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE RIBONUCLEOTIDE-TRANSPORT ATP-BINDING
+ PROTEIN ABC TRANSPORTER MKL"
+ /protein_id="SIT99272.1"
+ /db_xref="GOA:P63358"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR030296"
+ /db_xref="UniProtKB/Swiss-Prot:P63358"
+ /translation="MRYSDSYHTTGRWQPRASTEGFPMGVSIEVNGLTKSFGSSRIWE
+ DVTLTIPAGEVSVLLGPSGTGKSVFLKSLIGLLRPERGSIIIDGTDIIECSAKELYEI
+ RTLFGVLFQDGALFGSMNLYDNTAFPLREHTKKKESEIRDIVMEKLALVGLGGDEKKF
+ PGEISGGMRKRAGLARALVLDPQIILCDEPDSGLDPVRTAYLSQLIMDINAQIDATIL
+ IVTHNINIARTVPDNMGMLFRKHLVMFGPREVLLTSDEPVVRQFLNGRRIGPIGMSEE
+ KDEATMAEEQALLDAGHHAGGVEEIEGVPPQISATPGMPERKAVARRQARVREMLHTL
+ PKKAQAAILDDLEGTHKYAVHEIGQ"
+ gene complement(754753..755136)
+ /gene="vapc6"
+ /locus_tag="BQ2027_MB0675C"
+ CDS complement(754753..755136)
+ /gene="vapc6"
+ /locus_tag="BQ2027_MB0675C"
+ /note="Mb0675c, -, len: 127 aa. Equivalent to Rv0656c,
+ len: 127 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 127 aa overlap). Conserved
+ hypothetical protein, showing similarity with proteins
+ from Mycobacterium tuberculosis e.g. Rv2757c, Rv2546, etc.
+ Mb0675c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc6"
+ /protein_id="SIT99273.1"
+ /db_xref="GOA:A0A1R3XX14"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX14"
+ /translation="MAAATTTGTHRGLELRAAQRAVGSCEPQRAEFCRSARNADEFDQ
+ MSRMFGDVYPDVPVPKSVWRWIDSAQHRLARAGAVGALSVVDLLICDTAAARGLVVLH
+ DDADYELAERHLPDIRVRRVVSADD"
+ gene complement(755231..755386)
+ /gene="vapb6"
+ /locus_tag="BQ2027_MB0676C"
+ CDS complement(755231..755386)
+ /gene="vapb6"
+ /locus_tag="BQ2027_MB0676C"
+ /note="Mb0676c, -, len: 51 aa. Equivalent to Rv0657c, len:
+ 51 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 51 aa overlap). Conserved hypothetical
+ protein, showing similarity with hypothetical proteins
+ from Mycobacterium tuberculosis e.g.
+ Rv2009|MT2064.1|MTCY39.08c|YW08_MYCTU|Q10848 (80 aa),
+ FASTA scores: opt: 107, E(): 0.0038, (45.8% identity in 48
+ aa overlap), Rv2871, Rv1560, etc. Also some similarity
+ with AL020958|SC4H8_7 from Streptomyces coelicolor (66
+ aa), FASTA score: (41.0% identity in 39 aa overlap).
+ Mb0676c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb6"
+ /protein_id="SIT99274.1"
+ /db_xref="InterPro:IPR019239"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW48"
+ /translation="MSVTQIDLDDEALADVMRIAAVHTKKEAVNLAMRDYVERFRRIE
+ ALARSRE"
+ gene complement(755462..756178)
+ /locus_tag="BQ2027_MB0677C"
+ CDS complement(755462..756178)
+ /locus_tag="BQ2027_MB0677C"
+ /note="Mb0677c, -, len: 238 aa. Equivalent to Rv0658c,
+ len: 238 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 238 aa overlap). Probable conserved
+ integral membrane protein, similar to P33774|YPRB_ECOLI
+ hypothetical 24.3 kd protein from Escherichia coli (217
+ aa), FASTA scores: opt: 174, E(): 5.3e-05, (25.6% identity
+ in 223 aa overlap). Also similar to Rv1863c and Rv0804
+ from Mycobacterium tuberculosis. Mb0677c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99275.1"
+ /db_xref="GOA:A0A1R3XWF5"
+ /db_xref="InterPro:IPR003675"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWF5"
+ /translation="MEAGRADTVAPSHRWGLGAFLVVELVFLVASTSLAVVLTGHGPV
+ SAGVLALALAAPTVVAAGLAILITRLRGNGPRTDLRLRWSWRGLRLGLMFGFGGMLVT
+ IPASLVYTAIVGPEANSAVVRIFGGVRASWPWALVVFLVVVFVAPLCEEIIYRGLLWG
+ AVDRRWGRWAALVVTTVVFALAHLEFARAPLLVVVAIPIALARFYSGGLLASIVTHQV
+ TNLLPGIVLLLGLTGAISLP"
+ gene complement(756454..756762)
+ /gene="mazf2"
+ /locus_tag="BQ2027_MB0678C"
+ CDS complement(756454..756762)
+ /gene="mazf2"
+ /locus_tag="BQ2027_MB0678C"
+ /note="Mb0678c, -, len: 102 aa. Equivalent to Rv0659c,
+ len: 102 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 102 aa overlap). Conserved
+ hypothetical protein, weakly similar to other
+ Mycobacterium tuberculosis hypothetical proteins e.g.
+ Rv1942c, Rv1495, etc. Mb0678c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="toxin mazf2"
+ /protein_id="SIT99276.1"
+ /db_xref="GOA:A0A1R3XW06"
+ /db_xref="InterPro:IPR003477"
+ /db_xref="InterPro:IPR011067"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW06"
+ /translation="MRRGELWFAATPGGDRPVLVLTRDPVADRIGAVVVVALTRTRRG
+ LVSELELTAVENRVPSDCVVNFDNIHTLPRTAFRRRITRLSPARLHEACQTLRASTGC
+ "
+ gene complement(756749..756994)
+ /gene="maze2"
+ /locus_tag="BQ2027_MB0679C"
+ CDS complement(756749..756994)
+ /gene="maze2"
+ /locus_tag="BQ2027_MB0679C"
+ /note="Mb0679c, -, len: 81 aa. Equivalent to Rv0660c, len:
+ 81 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 81 aa overlap). Conserved hypothetical
+ protein, showing some similarity to AF016485_130 from
+ Halobacterium sp (100 aa), FASTA scores: (32.4% identity
+ in 74 aa overlap). Mb0679c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin maze2"
+ /protein_id="SIT99277.1"
+ /db_xref="GOA:A0A1R3XW41"
+ /db_xref="InterPro:IPR002145"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW41"
+ /translation="MLSFRADDHDVDLADAWARRLHIGRSELLRDALRRHLAALAADQ
+ DVQAYTERPLTDDENALAEIADWGPAEDWADWADAAR"
+ gene complement(757104..757541)
+ /gene="vapc7"
+ /locus_tag="BQ2027_MB0680C"
+ CDS complement(757104..757541)
+ /gene="vapc7"
+ /locus_tag="BQ2027_MB0680C"
+ /note="Mb0680c, -, len: 145 aa. Equivalent to Rv0661c,
+ len: 145 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 145 aa overlap). Conserved
+ hypothetical protein, similar to Mycobacterium
+ tuberculosis hypothetical proteins e.g.
+ Rv2863|MTV003.09|MTV003_7 (126 aa), FASTA scores: E():
+ 0.00087, (30.4% identity in 125 aa overlap),
+ Rv0749|MTV041.23 (163 aa); Rv0277c, Rv2530c, etc."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc7"
+ /protein_id="SIT99278.1"
+ /db_xref="GOA:A0A1R3XW16"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW16"
+ /translation="MIVLDTTVLVYAKGAEHPLRDPCRDLVAAIADERIAATTTAEVI
+ QEFVHVRARRRDRSDAAALGRVTMPNCSRRYSPSIEATSKRGLTLFETTPGLEACDAV
+ LAAVAASAGATALVSADPAFADLSDVVHVIPDAAGMVSLLGDR"
+ gene complement(757538..757906)
+ /gene="vapb7"
+ /locus_tag="BQ2027_MB0681C"
+ CDS complement(757538..757906)
+ /gene="vapb7"
+ /locus_tag="BQ2027_MB0681C"
+ /note="Mb0681c, -, len: 122 aa. Equivalent to Rv0662c,
+ len: 122 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 122 aa overlap). Conserved
+ hypothetical protein, showing weak similarity with other
+ hypothetical proteins from Mycobacterium tuberculosis e.g.
+ Rv2871, Rv1241, Rv2550c, etc."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb7"
+ /protein_id="SIT99279.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW11"
+ /translation="MFLPNTRAYRRYNRSVWAVRGSTRPQWQPPPKFQHAKCMSMRLA
+ HRLQILLDDECHRRITAVARERGVPVATVVREAIDRGLVSPAGRRKSAGRRLLDAADM
+ SVPEPRELKQELEALRARRG"
+ gene 757906..760269
+ /gene="atsD"
+ /locus_tag="BQ2027_MB0682"
+ CDS 757906..760269
+ /gene="atsD"
+ /locus_tag="BQ2027_MB0682"
+ /note="Mb0682, atsD, len: 787 aa. Equivalent to Rv0663,
+ len: 787 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 787 aa overlap). Possible atsD,
+ arylsulfatase (EC 3.1.6.1), similar to others e.g.
+ P5169|ARS_PSEAE arylsulfatase from Pseudomonas aeruginosa
+ (532 aa), FASTA scores: opt: 653, E(): 0, (33.1% identity
+ in 544 aa overlap); etc. Also similar to
+ P95059|MTCY210.30|ATSA|Rv0711|MTCY210.30 from
+ Mycobacterium tuberculosis (787 aa), FASTA score: (38.9%
+ identity in 769 aa overlap); and other arylsulfatases from
+ Mycobacterium tuberculosis e.g. Rv3299c|ATSB (970 aa),
+ Rv0711, etc. Contains PS00523 Sulfatases signature 1.
+ BELONGS TO THE SULFATASE FAMILY. Protein product from
+ Mb0682 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0682 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ARYLSULFATASE ATSD (ARYL-SULFATE
+ SULPHOHYDROLASE) (ARYLSULPHATASE)"
+ /protein_id="SIT99280.1"
+ /db_xref="GOA:A0A1R3XW05"
+ /db_xref="InterPro:IPR000917"
+ /db_xref="InterPro:IPR013320"
+ /db_xref="InterPro:IPR017850"
+ /db_xref="InterPro:IPR024607"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW05"
+ /translation="MPQPRTHLPIPSAARTGLITYDAKDPDSTYPPIEQLRPPAGAPN
+ VLLILLDDVGFGASSAFGGPCRTSTAELLAGNGLRYNRFHTTALCSPTRQALLTGRNH
+ HSAGMGGITEIATGAPGYSSVLPNTMSPIARTLKLNGYNTAQFGKCHEVPVWQTSPVG
+ PFDAWPSGGGGFEYFYGFIGGEANQWYPSLYEGTTPVEVNRTPEEGYHFMADMTDKAL
+ GWIGQQKALAPDRPFFVYFAPGATHAPHHVPREWADKYRGRFDVGWDALREETFARQK
+ ELGVIPADCQLTARHAEIPAWDDMPEDLKPVLCRQMEVYAGFLEYTDHHVGRLVDGLQ
+ RLGVLDDTLVFYIIGDNGASAEGTINGTYNEMLNFNGLADIETPRFMTDRLDKFGGPE
+ SYNHYSVGWAHAMDTPYQWTKQVASHWGGTRNGTIVHWPNGIAAKGEMRWQFHHVIDV
+ APTILEAAGLPEPLFVNGVQQHPIEGVSMAYSFDDAQAPDRHETQYFEMFGNRGIYHK
+ GWTAVTKHKTPWILVGEQTVAFDDDVWELYDTTKDWSQAKDLAKEMPEKLHELQRLWL
+ IEATRYNVLPLDDDTASRINPDLAGRPVLIRGNTQVLFSNMGRLSENCVLNLKNKSHT
+ VTAEVEVPETGAEGVIVAQGASIGGWSLYANDGKLKYCYNLGGIKHFYAESADPLPAG
+ AHQVRMEFAYAGGGLGKGGEVTLYVDGQQVGEGHVEATLAIVFSADDGCDVGMDSGSP
+ VSPDYAPGSNAFNGRIKGVQLAIAEAAAAAGHLVDPEHAIRIALARQ"
+ gene 760301..760573
+ /gene="vapb8"
+ /locus_tag="BQ2027_MB0683"
+ CDS 760301..760573
+ /gene="vapb8"
+ /locus_tag="BQ2027_MB0683"
+ /note="Mb0683, -, len: 90 aa. Equivalent to Rv0664, len:
+ 90 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 90 aa overlap). Hypothetical unknown
+ protein. Mb0683 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb8"
+ /protein_id="SIT99281.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW14"
+ /translation="MEKSRCHAVAHGGGCAGSAKSHKSGGRCGQGRGAGDSHGTRGAG
+ RRYRAASAPHPLAVGAHLRDELAKRSADPRLTDELNDLAGHTLDDL"
+ gene 760570..760908
+ /gene="vapc8"
+ /locus_tag="BQ2027_MB0684"
+ CDS 760570..760908
+ /gene="vapc8"
+ /locus_tag="BQ2027_MB0684"
+ /note="Mb0684, -, len: 112 aa. Equivalent to Rv0665, len:
+ 112 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 112 aa overlap). Conserved
+ hypothetical protein, similar to Rv0627 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (135
+ aa), and showing similarity with Rv0595c. Mb0684 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc8"
+ /protein_id="SIT99282.1"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY60"
+ /translation="MTEGEVGVGLLDTSVFIARESGGAIADLPERVALSVMTIGELQL
+ GLLNAGDSATRSRRADTLALARTADQIPVSEAVMISLARLVADCRAAGVRRSVKLTDA
+ LIAATAEIKV"
+ gene 760905..761078
+ /locus_tag="BQ2027_MB0685"
+ CDS 760905..761078
+ /locus_tag="BQ2027_MB0685"
+ /note="Mb0685, -, len: 57 aa. Equivalent to Rv0666, len:
+ 57 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 57 aa overlap). Possible membrane
+ protein; has hydrophobic stretch at aa 29-47. Mb0685 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIT99283.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX24"
+ /translation="MTPRTDEGAAAPCLMPDVTMPVKRGDARGALGVGPALFVVSVSS
+ SLVRARSCRCTAD"
+ gene 761576..765094
+ /gene="rpoB"
+ /locus_tag="BQ2027_MB0686"
+ CDS 761576..765094
+ /gene="rpoB"
+ /locus_tag="BQ2027_MB0686"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0686, rpoB, len: 1172 aa. Equivalent to Rv0667,
+ len: 1172 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100.0% identity in 1172 aa overlap). rpoB,
+ DNA-directed RNA polymerase, beta chain (EC 2.7.7.6) (see
+ first and third citations below), equivalent to
+ P30760|RPOB_MYCLE|ML1891 DNA-directed RNA polymerase beta
+ chain from Mycobacterium leprae (1178 aa). Also highly
+ similar to others e.g. AAF60349.1|AF242549_1|AF242549
+ DNA-dependent RNA polymerase beta subunit from
+ Amycolatopsis mediterranei (1167 aa); CAB77428.1|AL160431
+ DNA-directed RNA polymerase beta chain from Streptomyces
+ coelicolor (1161 aa); etc. Start site chosen on basis of
+ RBS but alternative start exists at position 14359.
+ BELONGS TO THE RNA POLYMERASE BETA CHAIN FAMILY. Protein
+ product from Mb0686 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0686 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA-DIRECTED RNA POLYMERASE (BETA CHAIN) RPOB
+ (TRANSCRIPTASE BETA CHAIN) (RNA POLYMERASE BETA SUBUNIT)"
+ /protein_id="SIT99284.1"
+ /db_xref="GOA:P0A681"
+ /db_xref="InterPro:IPR007120"
+ /db_xref="InterPro:IPR007121"
+ /db_xref="InterPro:IPR007641"
+ /db_xref="InterPro:IPR007642"
+ /db_xref="InterPro:IPR007644"
+ /db_xref="InterPro:IPR007645"
+ /db_xref="InterPro:IPR010243"
+ /db_xref="InterPro:IPR014724"
+ /db_xref="InterPro:IPR015712"
+ /db_xref="InterPro:IPR019462"
+ /db_xref="InterPro:IPR037033"
+ /db_xref="InterPro:IPR037034"
+ /db_xref="InterPro:IPR042107"
+ /db_xref="UniProtKB/Swiss-Prot:P0A681"
+ /translation="MADSRQSKTAASPSPSRPQSSSNNSVPGAPNRVSFAKLREPLEV
+ PGLLDVQTDSFEWLIGSPRWRESAAERGDVNPVGGLEEVLYELSPIEDFSGSMSLSFS
+ DPRFDDVKAPVDECKDKDMTYAAPLFVTAEFINNNTGEIKSQTVFMGDFPMMTEKGTF
+ IINGTERVVVSQLVRSPGVYFDETIDKSTDKTLHSVKVIPSRGAWLEFDVDKRDTVGV
+ RIDRKRRQPVTVLLKALGWTSEQIVERFGFSEIMRSTLEKDNTVGTDEALLDIYRKLR
+ PGEPPTKESAQTLLENLFFKEKRYDLARVGRYKVNKKLGLHVGEPITSSTLTEEDVVA
+ TIEYLVRLHEGQTTMTVPGGVEVPVETDDIDHFGNRRLRTVGELIQNQIRVGMSRMER
+ VVRERMTTQDVEAITPQTLINIRPVVAAIKEFFGTSQLSQFMDQNNPLSGLTHKRRLS
+ ALGPGGLSRERAGLEVRDVHPSHYGRMCPIETPEGPNIGLIGSLSVYARVNPFGFIET
+ PYRKVVDGVVSDEIVYLTADEEDRHVVAQANSPIDADGRFVEPRVLVRRKAGEVEYVP
+ SSEVDYMDVSPRQMVSVATAMIPFLEHDDANRALMGANMQRQAVPLVRSEAPLVGTGM
+ ELRAAIDAGDVVVAEESGVIEEVSADYITVMHDNGTRRTYRMRKFARSNHGTCANQCP
+ IVDAGDRVEAGQVIADGPCTDDGEMALGKNLLVAIMPWEGHNYEDAIILSNRLVEEDV
+ LTSIHIEEHEIDARDTKLGAEEITRDIPNISDEVLADLDERGIVRIGAEVRDGDILVG
+ KVTPKGETELTPEERLLRAIFGEKAREVRDTSLKVPHGESGKVIGIRVFSREDEDELP
+ AGVNELVRVYVAQKRKISDGDKLAGRHGNKGVIGKILPVEDMPFLADGTPVDIILNTH
+ GVPRRMNIGQILETHLGWCAHSGWKVDAAKGVPDWAARLPDELLEAQPNAIVSTPVFD
+ GAQEAELQGLLSCTLPNRDGDVLVDADGKAMLFDGRSGEPFPYPVTVGYMYIMKLHHL
+ VDDKIHARSTGPYSMITQQPLGGKAQFGGQRFGEMECWAMQAYGAAYTLQELLTIKSD
+ DTVGRVKVYEAIVKGENIPEPGIPESFKVLLKELQSLCLNVEVLSSDGAAIELREGED
+ EDLERAAANLGINLSRNESASVEDLA"
+ gene 765139..769089
+ /gene="rpoC"
+ /locus_tag="BQ2027_MB0687"
+ CDS 765139..769089
+ /gene="rpoC"
+ /locus_tag="BQ2027_MB0687"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0687, rpoC, len: 1316 aa. Equivalent to Rv0668,
+ len: 1316 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100.0% identity in 1316 aa overlap). rpoC,
+ DNA-directed RNA polymerase, beta' chain (EC 2.7.7.6) (see
+ first citation below), equivalent to
+ P30761|RPOC_MYCLE|ML1890|S31146 DNA-directed RNA
+ polymerase (EC 2.7.7.6) beta' chain from Mycobacterium
+ leprae (1316 aa), FASTA scores: opt: 8295, E(): 0, (95.6%
+ identity in 1316 aa overlap). Also highly similar to
+ others e.g. CAB77429.1|AL160431 DNA-directed RNA
+ polymerase beta' chain (fragment) from Streptomyces
+ coelicolor (1059 aa); P37871|RPOC_BACSU from Bacillus
+ subtilis (1199 aa), FASTA scores: opt: 2367, E(): 0, (52.9
+ identity in 1317 aa overlap); etc. BELONGS TO THE RNA
+ POLYMERASE BETA' CHAIN FAMILY. Protein product from Mb0687
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0687 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA-DIRECTED RNA POLYMERASE (BETA' CHAIN) RPOC
+ (TRANSCRIPTASE BETA' CHAIN) (RNA POLYMERASE BETA'
+ SUBUNIT)."
+ /protein_id="SIT99285.1"
+ /db_xref="GOA:P0A675"
+ /db_xref="InterPro:IPR000722"
+ /db_xref="InterPro:IPR006592"
+ /db_xref="InterPro:IPR007066"
+ /db_xref="InterPro:IPR007080"
+ /db_xref="InterPro:IPR007081"
+ /db_xref="InterPro:IPR007083"
+ /db_xref="InterPro:IPR012754"
+ /db_xref="InterPro:IPR038120"
+ /db_xref="InterPro:IPR042102"
+ /db_xref="UniProtKB/Swiss-Prot:P0A675"
+ /translation="MLDVNFFDELRIGLATAEDIRQWSYGEVKKPETINYRTLKPEKD
+ GLFCEKIFGPTRDWECYCGKYKRVRFKGIICERCGVEVTRAKVRRERMGHIELAAPVT
+ HIWYFKGVPSRLGYLLDLAPKDLEKIIYFAAYVITSVDEEMRHNELSTLEAEMAVERK
+ AVEDQRDGELEARAQKLEADLAELEAEGAKADARRKVRDGGEREMRQIRDRAQRELDR
+ LEDIWSTFTKLAPKQLIVDENLYRELVDRYGEYFTGAMGAESIQKLIENFDIDAEAES
+ LRDVIRNGKGQKKLRALKRLKVVAAFQQSGNSPMGMVLDAVPVIPPELRPMVQLDGGR
+ FATSDLNDLYRRVINRNNRLKRLIDLGAPEIIVNNEKRMLQESVDALFDNGRRGRPVT
+ GPGNRPLKSLSDLLKGKQGRFRQNLLGKRVDYSGRSVIVVGPQLKLHQCGLPKLMALE
+ LFKPFVMKRLVDLNHAQNIKSAKRMVERQRPQVWDVLEEVIAEHPVLLNRAPTLHRLG
+ IQAFEPMLVEGKAIQLHPLVCEAFNADFDGDQMAVHLPLSAEAQAEARILMLSSNNIL
+ SPASGRPLAMPRLDMVTGLYYLTTEVPGDTGEYQPASGDHPETGVYSSPAEAIMAADR
+ GVLSVRAKIKVRLTQLRPPVEIEAELFGHSGWQPGDAWMAETTLGRVMFNELLPLGYP
+ FVNKQMHKKVQAAIINDLAERYPMIVVAQTVDKLKDAGFYWATRSGVTVSMADVLVPP
+ RKKEILDHYEERADKVEKQFQRGALNHDERNEALVEIWKEATDEVGQALREHYPDDNP
+ IITIVDSGATGNFTQTRTLAGMKGLVTNPKGEFIPRPVKSSFREGLTVLEYFINTHGA
+ RKGLADTALRTADSGYLTRRLVDVSQDVIVREHDCQTERGIVVELAERAPDGTLIRDP
+ YIETSAYARTLGTDAVDEAGNVIVERGQDLGDPEIDALLAAGITQVKVRSVLTCATST
+ GVCATCYGRSMATGKLVDIGEAVGIVAAQSIGEPGTQLTMRTFHQGGVGEDITGGLPR
+ VQELFEARVPRGKAPIADVTGRVRLEDGERFYKITIVPDDGGEEVVYDKISKRQRLRV
+ FKHEDGSERVLSDGDHVEVGQQLMEGSADPHEVLRVQGPREVQIHLVREVQEVYRAQG
+ VSIHDKHIEVIVRQMLRRVTIIDSGSTEFLPGSLIDRAEFEAENRRVVAEGGEPAAGR
+ PVLMGITKASLATDSWLSAASFQETTRVLTDAAINCRSDKLNGLKENVIIGKLIPAGT
+ GINRYRNIAVQPTEEARAAAYTIPSYEDQYYSPDFGAATGAAVPLDDYGYSDYR"
+ gene complement(769453..771366)
+ /locus_tag="BQ2027_MB0688C"
+ CDS complement(769453..771366)
+ /locus_tag="BQ2027_MB0688C"
+ /note="Mb0688c, -, len: 637 aa. Equivalent to Rv0669c,
+ len: 637 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 637 aa overlap). Possible hydrolase (EC
+ 3.-.-.-), highly similar to various hydrolases (N-terminus
+ shorter) e.g. BAA88409.1|AB028646 alkaline ceramidase from
+ Pseudomonas aeruginosa (670 aa,) FASTA scores: opt: 1490,
+ E(): 0, (41.2% identity in 651 aa overlap);
+ NP_063946.1|NM_019893 mitochondrial ceramidase from Homo
+ sapiens (761 aa); P_446098.1|NM_053646 N-acylsphingosine
+ amidohydrolase 2 from Rattus norvegicus (761 aa);
+ BAB09641.1|AB016885 neutral ceramidase from Arabidopsis
+ thaliana (705 aa); etc. Contains PS00017 ATP/GTP-binding
+ site motif A (P-loop). Protein product from Mb0688c
+ detected using SWATH mass spectrometry. Mb0688c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE HYDROLASE"
+ /protein_id="SIT99286.1"
+ /db_xref="GOA:A0A1R3XW15"
+ /db_xref="InterPro:IPR006823"
+ /db_xref="InterPro:IPR031329"
+ /db_xref="InterPro:IPR031331"
+ /db_xref="InterPro:IPR038445"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW15"
+ /translation="MLSVGRGIADITGEAADCGMLGYGKSDQRTAGIHQRLRSRAFVF
+ RDDSQDGDARLLLIVAELPLPMQNVNEEVLRRLADLYGDTYSEQNTLITATHTHAGPG
+ GYCGYLLYNLTTSGFRPATFAAIVDGIVESVEHAHADVAPAEVPLSHGELYGASINRS
+ PSAFDRNPPADKAFFPKRVDPHTTLVRIDRGEATVGVIHFFATHGTSMTNRNHLISGD
+ NKGFAAYHWERTVGGADYLAGQPDFIAAFAQTNPGDMSPNVDGPLSPEAPPDREFDNT
+ RRTGLCQFEDAFTQLSGATPIGAGIDARFTYVDLGSVLVRGEYTPDGEERRTGRPMFG
+ AGAMAGTDEGPGFHGFRQGRNPFWDRLSRAMYRLARPTAAAQAPKGIVMPARLPNRIH
+ PFVQEIVPVQLVRIGRLYLIGIPGEPTIVAGLRLRRMVASIVGADLADVLCVGYTNAY
+ IHYVTTPEEYLEQRYEGGSTLFGRWELCALMQTVAELAEAMRDGRPVTLGRRPRPTRE
+ LSWVRGAPADAGSFGAVIAEPSATYRPGQAVEAVFVSALPNNDLRRGGTYLEVVRREG
+ ASWVRIADDGDWATSFRWQRQGRAGSHVSIRWDVPGDTTPGQYRIVHHGTARDRNGML
+ TAFSATTREFTVV"
+ gene 771561..772319
+ /gene="end"
+ /locus_tag="BQ2027_MB0689"
+ CDS 771561..772319
+ /gene="end"
+ /locus_tag="BQ2027_MB0689"
+ /note="Mb0689, end, len: 252 aa. Equivalent to Rv0670,
+ len: 252 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 252 aa overlap). Probable end
+ (alternate gene name: nfo), endonuclease IV (apurinase)
+ (EC 3.1.21.2), equivalent to END_MYCLE|P30770|NFO|ML1889
+ probable endonuclease IV (apurinase) from Mycobacterium
+ leprae (252 aa), FASTA scores: opt: 1463, E(): 0, (85.6%
+ identity in 250 aa overlap). Also similar to others e.g.
+ Q9S2N2|END4_STRCO|NFO|SC6E10.05 PROBABLE ENDONUCLEASE IV
+ from Streptomyces coelicolor (294 aa); etc. Contains
+ PS00729 AP endonucleases family 2 signatures 1 and 2
+ (PS00729, and PS00730). BELONGS TO THE AP ENDONUCLEASES
+ FAMILY 2. COFACTOR: BINDS 3 ZINC IONS. Protein product
+ from Mb0689 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0689 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ENDONUCLEASE IV END
+ (ENDODEOXYRIBONUCLEASE IV) (APURINASE)"
+ /protein_id="SIT99287.1"
+ /db_xref="GOA:P63536"
+ /db_xref="InterPro:IPR001719"
+ /db_xref="InterPro:IPR013022"
+ /db_xref="InterPro:IPR018246"
+ /db_xref="InterPro:IPR036237"
+ /db_xref="UniProtKB/Swiss-Prot:P63536"
+ /translation="MLIGSHVSPTDPLAAAEAEGADVVQIFLGNPQSWKAPKPRDDAA
+ ALKAATLPIYVHAPYLINLASANNRVRIPSRKILQETCAAAADIGAAAVIVHGGHVAD
+ DNDIDKGFQRWRKALDRLETEVPVYLENTAGGDHAMARRFDTIARLWDVIGDTGIGFC
+ LDTCHTWAAGEALTDAVDRIKAITGRIDLVHCNDSRDEAGSGRDRHANLGSGQIDPDL
+ LVAAVKAAGAPVICETADQGRKDDIAFLRERTGS"
+ gene 772351..773193
+ /gene="lpqP"
+ /locus_tag="BQ2027_MB0690"
+ CDS 772351..773193
+ /gene="lpqP"
+ /locus_tag="BQ2027_MB0690"
+ /note="Mb0690, lpqP, len: 280 aa. Equivalent to Rv0671,
+ len: 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 280 aa overlap). Possible lpqP,
+ conserved lipoprotein, similar to
+ U00012|B1308_F2_43|Q49658 from Mycobacterium leprae (302
+ aa), FASTA scores: opt: 449, E(): 2.4e-22, (37.6% identity
+ in 242 aa overlap). Also highly similar to
+ lpqC|Rv3298c|MTCY71.38c PUTATIVE LIPOPROTEIN from
+ Mycobacterium tuberculosis (304 aa). Also similar to a
+ large variety of proteins including various esterases and
+ poly(3-hydroxyalkanoate) depolymerases, e.g.
+ NP_249234.1|NC_002516 hypothetical protein from
+ Pseudomonas aeruginosa (322 aa); C-terminus of
+ AAD45376.1|AF164516_1|AF164516 cinnamoyl ester hydrolase
+ EstA from Piromyces equi (536 aa); part of
+ P52090|PHA1_PSELE POLY(3-HYDROXYALKANOATE) DEPOLYMERASE C
+ PRECURSOR from Pseudomonas lemoignei (414 aa);
+ CAC10310.1|AL442629 putative secreted protein from
+ Streptomyces coelicolor (348 aa); etc. Has a 17 aa signal
+ sequence and contains appropriately positioned (PS00013)
+ Prokaryotic membrane lipoprotein lipid attachment site.
+ Mb0690 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED LIPOPROTEIN LPQP"
+ /protein_id="SIT99288.1"
+ /db_xref="GOA:A0A1R3XW27"
+ /db_xref="InterPro:IPR010126"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW27"
+ /translation="MLRRVAILLAAVLAFAGCSGGTRLAAGFGNGNSVHTLDVDGAGR
+ SYRLYKPVGLPSSAPLVVMLHGGFGSAKQAERSYGWDELADSEKFLVAYPDGYHRAWN
+ ANGGGCCGRPAREGVDDIGFVRAVVADIANNVSIDPARVYVTGMSNGAIMSYTLACNT
+ SIFAAIGVVSGTQLDPCQSPRPVSVIHIHGTADPLVRYHGGPGAGFARIDGPPVPDLN
+ AFWREVNRCGALDTTTEGPVTTSGATCADNRRVVLLTVDDAGHRWPSFATQTLWRFFA
+ AHFR"
+ gene 773253..774881
+ /gene="fadE8"
+ /locus_tag="BQ2027_MB0691"
+ CDS 773253..774881
+ /gene="fadE8"
+ /locus_tag="BQ2027_MB0691"
+ /note="Mb0691, fadE8, len: 542 aa. Equivalent to Rv0672,
+ len: 542 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 542 aa overlap). Probable fadE8,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), highly similar to
+ many e.g. CAC33951.1|AL589708 putative acyl-CoA
+ dehydrogenase from Streptomyces coelicolor (557 aa);
+ P33224|AIDB_ECOLI|B4187 aidb protein (ACYL-COA
+ DEHYDROGENASES FAMILY) from Escherichia coli strain K12
+ (546 aa), FASTA scores: opt: 1369, E(): 0, (44.1% identity
+ in 524 aa overlap); etc. Also similar to several other M.
+ tuberculosis proteins e.g. Rv0154cRv0154c|MTCI5.28c FASTA
+ score: (26.3% identity in 342 aa overlap); etc. Contains
+ acyl-CoA dehydrogenases signature 2 (PS00073). BELONG TO
+ THE ACYL-COA DEHYDROGENASES FAMILY. Protein product from
+ Mb0691 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0691 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE8"
+ /protein_id="SIT99289.1"
+ /db_xref="GOA:A0A1R3XW22"
+ /db_xref="InterPro:IPR006089"
+ /db_xref="InterPro:IPR006091"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR041504"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW22"
+ /translation="MSDTHVVTNQVPPLENYNPASSPVLIEALIQEGGQWGLDEVNEV
+ GAISASCQAQRWGELADRNRPILHTHDAYGYRVDEVEYDPAYHELMRTAITHGMHAAP
+ WADDRPGAHVVRAAKTSVWTVEPGHICPISMTYAVVPALRYNSELAAVYEPLLTSREY
+ DPELKPATTKAGITAGMSMTEKQGGSDVRAGTTQATPNADGSYSLTGHKWFTSAPMCD
+ IFLVLAQAPDGLSCFLLPRVLPDGTRNRMFLQRLKDKLGNHANASSEVEYDGAVAWLV
+ GEEGRGVPTIIEMVNLTRLDCALGSATSMRTGLTRAVHHAQHRKAFGAYLIDQPLMRN
+ VLADLAVEAEAATIVAMRMAGATDNAVRGNETEALLRRIGLAAAKYWVCKRSTAHAAE
+ ALECLGGNGYVEDSGMPRLYREAPLMGIWEGSGNVSALDTLRAMATRPACVEVLFDEL
+ ARSAGQDPRLDGHVERLRPQLGDLDTIGYRARKIAEDICLALQGSLLVRHGHPAVAEA
+ FLATRLGGQWGGAYGTMPAGLDLAPILERALVKG"
+ gene 774892..775830
+ /gene="echA4"
+ /locus_tag="BQ2027_MB0692"
+ CDS 774892..775830
+ /gene="echA4"
+ /locus_tag="BQ2027_MB0692"
+ /note="Mb0692, echA4, len: 312 aa. Equivalent to Rv0673,
+ len: 312 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 312 aa overlap). Possible echA4,
+ enoyl-CoA hydratase (EC 4.2.1.17), showing similarity with
+ others e.g. NP_419216.1|NC_002696 enoyl-CoA
+ hydratase/isomerase family protein from Caulobacter
+ crescentus (256 aa); Q52995|ECHH_RHIME PROBABLE ENOYL-COA
+ HYDRATASE from Sinorhizobium meliloti (257 aa), FASTA
+ scores: opt: 210, E(): 1.2e-06, (27.9% identity in 280 aa
+ overlap); etc. Also similar to other enoyl-CoA hydratases
+ from Mycobacterium tuberculosis e.g.
+ P95279|MTCY09F9.29|ECHA13|Rv1935c|MTCY09F9.29 ENOYL-COA
+ HYDRATASE (318 aa), FASTA score: (27.1% identity in 280 aa
+ overlap); etc. Contains PS00017 ATP/GTP-binding site motif
+ A (P-loop). Protein product from Mb0692 detected using
+ SWATH mass spectrometry. Mb0692 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ENOYL-COA HYDRATASE ECHA4 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-COA HYDRATASE) (CROTONASE)"
+ /protein_id="SIT99290.1"
+ /db_xref="GOA:A0A1R3XW17"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW17"
+ /translation="MTHAIRPVDFDNLKTMTYEVTGRIARITFNRPEKGNAIIADTPL
+ ELSALVERADLDPGVHVILVSGRGEGFCAGFDLSAYAEGSSSTGGGGAYQGTVLDGKT
+ QAVNHLPNQPWDPMIDYQMMSRFVRGFASLMHADKPTVVKIHGYCVAGGTDIALHADQ
+ VIAAADAKIGYPPTRVWGVPAAGLWAHRLGDQRAKRLLFTGDCITGAQAAEWGLAVEA
+ PEPADLDERTERLVARIAALPVNQLIMVKLALNSALLQQGVATSRMVSTVFDGAARHT
+ PEGHAFVADAVEHGFRDAVRRRDEPFGDYGRQASRV"
+ gene 775833..776555
+ /locus_tag="BQ2027_MB0693"
+ CDS 775833..776555
+ /locus_tag="BQ2027_MB0693"
+ /note="Mb0693, -, len: 240 aa. Equivalent to Rv0674, len:
+ 240 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 240 aa overlap). Conserved
+ hypothetical protein, highly similar to AC13063.1|AL445503
+ conserved hypothetical protein from Streptomyces
+ coelicolor (268 aa); and similar to NP_438100.1|NC_003078
+ putative regulator of phenylacetic acid degradation ArsR
+ family protein from Sinorhizobium meliloti (306 aa) and
+ other proteins e.g. AB011837|AB011837_13 hypothetical
+ protein from Bacillus halodurans (298 aa), FASTA scores:
+ opt: 148, E(): 0.0081, (25.1% identity in 235 aa overlap);
+ etc. Mb0693 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, PaaX family"
+ /protein_id="SIT99291.1"
+ /db_xref="InterPro:IPR012906"
+ /db_xref="InterPro:IPR013225"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW25"
+ /translation="MPAMTARSVVLSVLLGAHPAWATASELIQLTADFGIKETTLRVA
+ LTRMVGAGDLVRSADGYRLSDRLLARQRRQDEAMRPRTRAWHGNWHMLIVTSIGTDAR
+ TRAALRTCMHHKRFGELREGVWMRPDNLDLDLESDVAARVRMLTARDEAPADLAGQLW
+ DLSGWTEAGHRLLGDMAAATDMPGRFVVAAAMVRHLLTDPMLPAELLPADWPGAGLRA
+ AYHDFATAMAKRRDATQLLEVT"
+ gene 776552..777343
+ /gene="echA5"
+ /locus_tag="BQ2027_MB0694"
+ CDS 776552..777343
+ /gene="echA5"
+ /locus_tag="BQ2027_MB0694"
+ /note="Mb0694, echA5, len: 263 aa. Equivalent to Rv0675,
+ len: 263 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 263 aa overlap). Probable echA5,
+ enoyl-CoA hydratase (EC 4.2.1.17), similar to several e.g.
+ NP_252116.1|NC_002516 probable enoyl
+ CoA-hydratase/isomerase from Pseudomonas aeruginosa (256
+ aa); Q20376 PROTEIN SIMILAR TO ENOYL-COA HYDRATASE from
+ Caenorhabditis elegans (258 aa), FASTA scores: opt: 697,
+ E(): 0, (47.3% identity in 245 aa overlap); etc. Also
+ similar to others from Mycobacterium tuberculosis e.g.
+ Z92669|MTCY8D5_17 (262 aa), FASTA scores: opt: 493, E():
+ 3.6e-25, (39.1% identity in 243 aa overlap); etc. Protein
+ product from Mb0694 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0694 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ENOYL-COA HYDRATASE ECHA5 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-COA HYDRATASE) (CROTONASE)"
+ /protein_id="SIT99292.1"
+ /db_xref="GOA:A0A1R3XY72"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR018376"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY72"
+ /translation="MSDLVRVERKGRVTTVILNRPASRNAVNGPTAAALCAAFEQFDR
+ DDAASVAVLWGAGGTFCAGADLKAFGTPEANSVHRTGPGPMGPSRMMLSKPVIAAVSG
+ YAVAGGLELALWCDLRVAEEDAVFGVFCRRWGVPLIDGGTVRLPRLIGHSRAMDMILT
+ GRGVPADEALAMGLANRVVPKGQARQAAEELAAQLAALPQQCLRSDRLSALHQWGLPE
+ SAALDLEFASIARVAGEALEGARRFAAGAGRHGAPAPRAEQGDTL"
+ gene complement(777355..780249)
+ /gene="mmpL5"
+ /locus_tag="BQ2027_MB0695C"
+ CDS complement(777355..780249)
+ /gene="mmpL5"
+ /locus_tag="BQ2027_MB0695C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0695c, mmpL5, len: 964 aa. Equivalent to Rv0676c,
+ len: 964 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 964 aa overlap). Probable mmpL5,
+ conserved transmembrane transport protein (see first
+ citation below), member of RND superfamily, highly similar
+ to other Mycobacterial proteins e.g. MTV037_14, MTCY98_8,
+ MTCY20G9_34, MTCY4D9_15, MTCY48_8, MTCY19G5_6, MTV005_19,
+ etc. Also similar to other Mycobacterial mmpl proteins
+ e.g. P54881|MML4_MYCLE PUTATIVE MEMBRANE PROTEIN MMPL4
+ from Mycobacterium leprae (959 aa), FASTA scores: opt:
+ 3991, E(): 0, (62.8% identity in 933 aa overlap); etc.
+ BELONGS TO THE MMPL FAMILY. TBparse score is 0.884.
+ Protein product from Mb0695c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0695c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL5"
+ /protein_id="SIT99293.1"
+ /db_xref="GOA:A0A1R3XX34"
+ /db_xref="InterPro:IPR004707"
+ /db_xref="InterPro:IPR004869"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX34"
+ /translation="MIVQRTAAPTGSVPPDRHAARPFIPRMIRTFAVPIILGWLVTIA
+ VLNVTVPQLETVGQIQAVSMSPDAAPSMISMKHIGKVFEEGDSDSAAMIVLEGQRPLG
+ DAAHAFYDQMIGRLQADTTHVQSLQDFWGDPLTATGAQSSDGKAAYVQVKLAGNQGES
+ LANESVEAVKTIVERLAPPPGVKVYVTGSAALVADQQQAGDRSLQVIEAVTFTVIIVM
+ LLLVYRSIITSAIMLTMVVLGLLATRGGVAFLGFHRIIGLSTFATNLLVVLAIAAATD
+ YAIFLIGRYQEARGLGQDRESAYYTMFGGTAHVVLGSGLTIAGATFCLSFTRLPYFQT
+ LGVPLAIGMVIVVAAALTLGPAIIAVTSRFGKLLEPKRMARVRGWRKVGAAIVRWPGP
+ ILVGAVALALVGLLTLPGYRTNYNDRNYLPADLPANEGYAAAERHFSQARMNPEVLMV
+ ESDHDMRNSADFLVINKIAKAIFAVEGISRVQAITRPDGKPIEHTSIPFLISMQGTSQ
+ KLTEKYNQDLTARMLEQVNDIQSNIDQMERMHSLTQQMADVTHEMVIQMTGMVVDVEE
+ LRNHIADFDDFFRPIRSYFYWEKHCYDIPVCWSLRSVFDTLDGIDVMTEDINNLLPLM
+ QRLDTLMPQLTAMMPEMIQTMKSMKAQMLSMHSTQEGLQDQMAAMQEDSAAMGEAFDA
+ SRNDDSFYLPPEVFDNPDFQRGLEQFLSPDGHAVRFIISHEGDPMSQAGIARIAKIKT
+ AAKEAIKGTPLEGSAIYLGGTAAMFKDLSDGNTYDLMIAGISALCLIFIIMLIITRSV
+ VAAAVIVGTVVLSLGASFGLSVLIWQHILGIELHWLVLAMAVIILLAVGADYNLLLVA
+ RLKEEIHAGINTGIIRAMGGSGSVVTAAGLVFAFTMMSFAVSELTVMAQVGTTIGMGL
+ LFDTLIVRSFMTPSIAALLGKWFWWPQVVRQRPVPQPWPSPASARTFALV"
+ gene complement(780246..780674)
+ /gene="mmpS5"
+ /locus_tag="BQ2027_MB0696C"
+ CDS complement(780246..780674)
+ /gene="mmpS5"
+ /locus_tag="BQ2027_MB0696C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0696c, mmpS5, len: 142 aa. Equivalent to Rv0677c,
+ len: 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 142 aa overlap). Possible mmpS5,
+ conserved membrane protein (see first citation below),
+ highly similar to other Mycobacterial proteins e.g.
+ P54880|MMS4_MYCLE PUTATIVE MEMBRANE PROTEIN from
+ Mycobacterium leprae (154 aa), FASTA scores: opt: 443,
+ E(): 1.4e-23, (47.1% identity in 155 aa overlap); etc.
+ Also similar to others from Mycobacterium tuberculosis.
+ BELONGS TO THE MMPS FAMILY. TBparse score is 0.901.
+ Protein product from Mb0696c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0696c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN MMPS5"
+ /protein_id="SIT99294.1"
+ /db_xref="GOA:P65381"
+ /db_xref="InterPro:IPR008693"
+ /db_xref="InterPro:IPR038468"
+ /db_xref="UniProtKB/Swiss-Prot:P65381"
+ /translation="MIGTLKRAWIPLLILVVVAIAGFTVQRIRTFFGSEGILVTPKVF
+ ADDPEPFDPKVVEYEVSGSGSYVNINYLDLDAKPQRIDGAALPWSLTLKTTAPSAAPN
+ ILAQGDGTSITCRITVDGEVKDERTATGVDALTYCFVKSA"
+ gene 780759..781256
+ /gene="mmpR5"
+ /locus_tag="BQ2027_MB0697"
+ CDS 780759..781256
+ /gene="mmpR5"
+ /locus_tag="BQ2027_MB0697"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0697, -, len: 165 aa. Equivalent to Rv0678, len:
+ 165 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 165 aa overlap). Conserved
+ hypothetical protein, showing weak similarity with
+ AL049754|SCH10_10 hypothetical protein from Streptomyces
+ coelicolor (152 aa), FASTA scores: opt: 149, E(): 0.0018,
+ (22.9% identity in 140 aa overlap). TBparse score is
+ 0.910. Protein product from Mb0697 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0697
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="MarR family transcriptional regulator associated
+ with MmpL5/MmpS5 efflux system"
+ /protein_id="SIT99295.1"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWH5"
+ /translation="MSVNDGVDQMGAEPDIMEFVEQMGGYFESRSLTRLAGRLLGWLL
+ VCDPERQSSEELATALAASSGGISTNARMLIQFGFIERLAVAGDRRTYFRLRPNAFAA
+ GERERIRAMAELQDLADVGLRALGDAPPQRSRRLREMRDLLAYMENVVSDALGRYSQR
+ TGEDD"
+ gene complement(781312..781809)
+ /locus_tag="BQ2027_MB0698C"
+ CDS complement(781312..781809)
+ /locus_tag="BQ2027_MB0698C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0698c, -, len: 165 aa. Equivalent to Rv0679c,
+ len: 165 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 165 aa overlap). Conserved
+ hypothetical Thr-rich protein, similar in part to
+ neighboring ORF Rv0680c (124 aa), FASTA score: (35.1%
+ identity in 131 aa overlap); and Rv0314c (220 aa).
+ Contains probable N-terminal signal sequence. TBparse
+ score is 0.894. Protein product from Mb0698c detected
+ using SWATH mass spectrometry. Mb0698c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved threonine rich protein"
+ /protein_id="SIT99296.1"
+ /db_xref="InterPro:IPR021417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW26"
+ /translation="MVEKPLRADRATHSRLATFALALAAAALPLAGCSSTANPPAATT
+ TPATATTTTATSGPTAAPTVTTGESTTASIQIGDMLTYGSIGTTATLDCADGKSLNVA
+ GSDNTLTVNGTCETVTVGGANNKIAFDRIDERLVVVGLDNTVTYKNGDPTIDNLGAGN
+ RINKE"
+ gene complement(781811..782185)
+ /locus_tag="BQ2027_MB0699C"
+ CDS complement(781811..782185)
+ /locus_tag="BQ2027_MB0699C"
+ /note="Mb0699c, -, len: 124 aa. Equivalent to Rv0680c,
+ len: 124 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 124 aa overlap). Possible conserved
+ transmembrane protein, showing similarity with C-terminal
+ part of Rv0314c|Z96800|MTCY63.19c conserved hypothetical
+ protein from Mycobacterium tuberculosis (220 aa), FASTA
+ scores: opt: 175, E(): 2.2e-05, (31.4% identity in 102 aa
+ overlap). Also some similarity to upstream ORF
+ Rv0679c|MTV040.07c CONSERVED HYPOTHETICAL THREONINE RICH
+ PROTEIN (124 aa), FASTA score: (35.1% identity in 131 aa
+ overlap). Contains probable N-terminal signal sequence.
+ Mb0699c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99297.1"
+ /db_xref="GOA:A0A1R3XW62"
+ /db_xref="InterPro:IPR021417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW62"
+ /translation="MKWNTVAASLAAGVITIAVALAAPPPAAHAKNGDTHVTGQGIER
+ TLDCNESTLLVNGTQNIVTALGTCWAVTVMGSSNTVVADTIINDITVYGWDETVFFRN
+ GDPFIWDRGRELGMVNRLQRVG"
+ gene 782490..783080
+ /locus_tag="BQ2027_MB0700"
+ CDS 782490..783080
+ /locus_tag="BQ2027_MB0700"
+ /note="Mb0700, -, len: 196 aa. Equivalent to Rv0681, len:
+ 196 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 196 aa overlap). Probable
+ transcription regulator, TetR family, similar to others
+ and especially many tetracycline repressors e.g. T34657
+ probable transcription regulator from Streptomyces
+ coelicolor (189 aa);
+ AF0278|AF027868_40|NP_389788.1|NC_000964 yobS regulator
+ from Bacillus subtilis (191 aa), FASTA scores: opt: 213,
+ E(): 1.6e-07, (28.8% identity in 153 aa overlap);
+ P09164|TER4_ECOLI TETRACYCLINE REPRESSOR PROTEIN from
+ Escherichia coli (217 aa), FASTA scores: opt: 145, E():
+ 0.0068, (39.0% identity in 59 aa overlap); etc. Contains
+ helix-turn-helix motif at aa 28-49 (Score 1020, +2.66 SD).
+ Protein product from Mb0700 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0700 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY TETR-FAMILY)"
+ /protein_id="SIT99298.1"
+ /db_xref="GOA:A0A1R3XW36"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR025996"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW36"
+ /translation="MARPAKLSRESIVEGALTFLDREGWDSLTINALATQLGTKGPSL
+ YNHVDSLEDLRRAVRIRVIDDIITMLNRVGAGRARDDAVLVMAGAYRSYAHHHPGRYS
+ AFTRMPLGGDDPEYTAATRGAAAPVIAVLSSYGLDGEQAFYAALEFWSALHGFVLLEM
+ TGVMDDIDTDAVFTDMVLRLAAGMERRTTHGGTAST"
+ gene 783329..783703
+ /gene="rpsL"
+ /locus_tag="BQ2027_MB0701"
+ CDS 783329..783703
+ /gene="rpsL"
+ /locus_tag="BQ2027_MB0701"
+ /note="Mb0701, rpsL, len: 124 aa. Equivalent to Rv0682,
+ len: 124 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 124 aa overlap). Probable rpsL, 30S
+ ribosomal protein S12 (see citations below), equivalent to
+ others from Mycobacteria e.g. P41195|RS12_MYCSM 30S
+ RIBOSOMAL PROTEIN S12 from Mycobacterium smegmatis (124
+ aa); P51999|RS12_MYCAV 30S RIBOSOMAL PROTEIN S12 from
+ Mycobacterium avium (124 aa); etc. Also highly similar to
+ others from other organisms e.g. P97222|RS12_STRCO 30S
+ RIBOSOMAL PROTEIN S12 from Streptomyces roseosporus,
+ lividans and coelicolor (123 aa); etc. Contains PS00055
+ Ribosomal protein S12 signature. BELONGS TO THE S12P
+ FAMILY OF RIBOSOMAL PROTEINS. Protein product from Mb0701
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0701 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s12 rpsl"
+ /protein_id="SIT99299.1"
+ /db_xref="GOA:Q53538"
+ /db_xref="InterPro:IPR005679"
+ /db_xref="InterPro:IPR006032"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="UniProtKB/Swiss-Prot:Q53538"
+ /translation="MPTIQQLVRKGRRDKISKVKTAALKGSPQRRGVCTRVYTTTPKK
+ PNSALRKVARVKLTSQVEVTAYIPGEGHNLQEHSMVLVRGGRVKDLPGVRYKIIRGSL
+ DTQGVKNRKQARSRYGAKKEKG"
+ gene 783703..784173
+ /gene="rpsG"
+ /locus_tag="BQ2027_MB0702"
+ CDS 783703..784173
+ /gene="rpsG"
+ /locus_tag="BQ2027_MB0702"
+ /note="Mb0702, rpsG, len: 156 aa. Equivalent to Rv0683,
+ len: 156 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 156 aa overlap). Probable rpsG, 30S
+ ribosomal protein S7 (see citation below), equivalent to
+ others from Mycobacteria e.g. P41193|RS7_MYCSM 30S
+ RIBOSOMAL PROTEIN S7 from Mycobacterium smegmatis (156
+ aa), FASTA scores: opt: 986, E(): 0, (96.2% identity in
+ 156 aa overlap); Q53539|RS7_MYCBO 30S RIBOSOMAL PROTEIN S7
+ from Mycobacterium bovis (156 aa); etc. Also highly
+ similar to others e.g. Q9L0K4|RS7_STRCO 30S RIBOSOMAL
+ PROTEIN S7 from Streptomyces coelicolor (156 aa); etc.
+ Contains PS00052 Ribosomal protein S7 signature. BELONGS
+ TO THE S7P FAMILY OF RIBOSOMAL PROTEINS. Protein product
+ from Mb0702 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0702 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s7 rpsg"
+ /protein_id="SIT99300.1"
+ /db_xref="GOA:Q53539"
+ /db_xref="InterPro:IPR000235"
+ /db_xref="InterPro:IPR005717"
+ /db_xref="InterPro:IPR020606"
+ /db_xref="InterPro:IPR023798"
+ /db_xref="InterPro:IPR036823"
+ /db_xref="UniProtKB/Swiss-Prot:Q53539"
+ /translation="MPRKGPAPKRPLVNDPVYGSQLVTQLVNKVLLKGKKSLAERIVY
+ GALEQARDKTGTDPVITLKRALDNVKPALEVRSRRVGGATYQVPVEVRPDRSTTLALR
+ WLVGYSRQRREKTMIERLANEILDASNGLGASVKRREDTHKMAEANRAFAHYRW"
+ gene 784254..786359
+ /gene="fusA1"
+ /locus_tag="BQ2027_MB0703"
+ CDS 784254..786359
+ /gene="fusA1"
+ /locus_tag="BQ2027_MB0703"
+ /standard_name="fusA"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0703, fusA1, len: 701 aa. Equivalent to Rv0684,
+ len: 701 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 701 aa overlap). Probable fusA1,
+ elongation factor G, equivalent to P30767|EFG_MYCLE|S31150
+ translation elongation factor EF-G from Mycobacterium
+ leprae (701 aa), FASTA scores: opt: 2521, E(): 0, (88.2%
+ identity in 432 aa overlap). Also highly similar to others
+ e.g. CAB81852.1|AL161691 elongation factor G from
+ Streptomyces coelicolor (708 aa); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop) and PS00301
+ GTP-binding elongation factors signature. BELONGS TO THE
+ GTP-BINDING ELONGATION FACTOR FAMILY, EF-G/EF-2 SUBFAMILY.
+ Note that previously known as fusA. Protein product from
+ Mb0703 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0703 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ELONGATION FACTOR G FUSA1 (EF-G)"
+ /protein_id="SIT99301.1"
+ /db_xref="GOA:P0A557"
+ /db_xref="InterPro:IPR000640"
+ /db_xref="InterPro:IPR000795"
+ /db_xref="InterPro:IPR004161"
+ /db_xref="InterPro:IPR004540"
+ /db_xref="InterPro:IPR005225"
+ /db_xref="InterPro:IPR005517"
+ /db_xref="InterPro:IPR009000"
+ /db_xref="InterPro:IPR009022"
+ /db_xref="InterPro:IPR014721"
+ /db_xref="InterPro:IPR020568"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR031157"
+ /db_xref="InterPro:IPR035647"
+ /db_xref="InterPro:IPR035649"
+ /db_xref="InterPro:IPR041095"
+ /db_xref="UniProtKB/Swiss-Prot:P0A557"
+ /translation="MAQKDVLTDLSRVRNFGIMAHIDAGKTTTTERILYYTGINYKIG
+ EVHDGAATMDWMEQEQERGITITSAATTTFWKDNQLNIIDTPGHVDFTVEVERNLRVL
+ DGAVAVFDGKEGVEPQSEQVWRQADKYDVPRICFVNKMDKIGADFYFSVRTMGERLGA
+ NAVPIQLPVGAEADFEGVVDLVEMNAKVWRGETKLGETYDTVEIPADLAEQAEEYRTK
+ LLEVVAESDEHLLEKYLGGEELTVDEIKGAIRKLTIASEIYPVLCGSAFKNKGVQPML
+ DAVVDYLPSPLDVPPAIGHAPAKEDEEVVRKATTDEPFAALAFKIATHPFFGKLTYIR
+ VYSGTVESGSQVINATKGKKERLGKLFQMHSNKENPVDRASAGHIYAVIGLKDTTTGD
+ TLSDPNQQIVLESMTFPDPVIEVAIEPKTKSDQEKLSLSIQKLAEEDPTFKVHLDSET
+ GQTVIGGMGELHLDILVDRMRREFKVEANVGKPQVAYKETIKRLVQNVEYTHKKQTGG
+ SGQFAKVIINLEPFTGEEGATYEFESKVTGGRIPREYIPSVDAGAQDAMQYGVLAGYP
+ LVNLKVTLLDGAYHEVDSSEMAFKIAGSQVLKKAAALAQPVILEPIMAVEVTTPEDYM
+ GDVIGDLNSRRGQIQAMEERAGARVVRAHVPLSEMFGYVGDLRSKTQGRANYSMVFDS
+ YSEVPANVSKEIIAKATGE"
+ gene 786590..787780
+ /gene="tuf"
+ /locus_tag="BQ2027_MB0704"
+ CDS 786590..787780
+ /gene="tuf"
+ /locus_tag="BQ2027_MB0704"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0704, tuf, len: 396 aa. Equivalent to Rv0685,
+ len: 396 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 396 aa overlap). Probable tuf,
+ elongation factor EF-Tu, equivalent to JC2262 translation
+ elongation factor Tu from Mycobacterium leprae (396 aa).
+ Also highly similar to others e.g. P42439|EFTU_CORGL
+ ELONGATION FACTOR TU (EF-TU) from Corynebacterium
+ glutamicum (396 aa); etc. Contains PS00017 ATP/GTP-binding
+ site motif A, and PS00301 GTP-binding elongation factors
+ signature. BELONGS TO THE GTP-BINDING ELONGATION FACTOR
+ FAMILY, EF-TU/EF-1A SUBFAMILY. Protein product from Mb0704
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0704 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable iron-regulated elongation factor tu tuf
+ (ef-tu)"
+ /protein_id="SIT99302.1"
+ /db_xref="GOA:P0A559"
+ /db_xref="InterPro:IPR000795"
+ /db_xref="InterPro:IPR004160"
+ /db_xref="InterPro:IPR004161"
+ /db_xref="InterPro:IPR004541"
+ /db_xref="InterPro:IPR005225"
+ /db_xref="InterPro:IPR009000"
+ /db_xref="InterPro:IPR009001"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR031157"
+ /db_xref="InterPro:IPR033720"
+ /db_xref="InterPro:IPR041709"
+ /db_xref="UniProtKB/Swiss-Prot:P0A559"
+ /translation="MAKAKFQRTKPHVNIGTIGHVDHGKTTLTAAITKVLHDKFPDLN
+ ETKAFDQIDNAPEERQRGITINIAHVEYQTDKRHYAHVDAPGHADYIKNMITGAAQMD
+ GAILVVAATDGPMPQTREHVLLARQVGVPYILVALNKADAVDDEELLELVEMEVRELL
+ AAQEFDEDAPVVRVSALKALEGDAKWVASVEELMNAVDESIPDPVRETDKPFLMPVED
+ VFTITGRGTVVTGRVERGVINVNEEVEIVGIRPSTTKTTVTGVEMFRKLLDQGQAGDN
+ VGLLLRGVKREDVERGQVVTKPGTTTPHTEFEGQVYILSKDEGGRHTPFFNNYRPQFY
+ FRTTDVTGVVTLPEGTEMVMPGDNTNISVKLIQPVAMDEGLRFAIREGGRTVGAGRVT
+ KIIK"
+ gene 787918..788715
+ /locus_tag="BQ2027_MB0705"
+ CDS 787918..788715
+ /locus_tag="BQ2027_MB0705"
+ /note="Mb0705, -, len: 265 aa. Equivalent to Rv0686, len:
+ 265 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 265 aa overlap). Probable membrane
+ protein, with hydrophobic N-terminus. Protein product from
+ Mb0705 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0705 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE PROTEIN"
+ /protein_id="SIT99303.1"
+ /db_xref="GOA:A0A1R3XX44"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX44"
+ /translation="MLARYIKMQLLVLLCGGLVGPIFLVVYFTLGLGSLMSWMFYVGL
+ IITVADVLVALALTNYGAKTAAKTAALERSGVLALAQSTGLSETGTRINDQPLVKVHL
+ HISGPGITPFDTEDRVIASVTRLGNLTARKLVVLVNPATQQYLIDWERSALVNGLVPA
+ QFTVAEDNKTYDLSGQTGPLMEILQILKANNVPLNRMVDIRSNPALRQQVQAVVRRAA
+ ERQAPAAEPASQGSIAERLAELESLRASGAVNAAEYESKRAQIISEI"
+ gene 788868..789695
+ /locus_tag="BQ2027_MB0706"
+ CDS 788868..789695
+ /locus_tag="BQ2027_MB0706"
+ /note="Mb0706, -, len: 275 aa. Equivalent to Rv0687, len:
+ 275 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 275 aa overlap). Probable short-chain
+ dehydrogenase/reductase (EC 1.-.-.-), highly similar to
+ various dehydrogenases (generally SDR family) e.g.
+ U17129|RSU17129_7 short-chain dehydrogenase from
+ Rhodococcus erythropolis (275 aa), FASTA scores: opt:
+ 1112, E(): 0, (61.2% identity in 268 aa overlap);
+ MMU34072_2 steroid dehydrogenase from Musmus culus (260
+ aa), FASTA scores: opt: 390, E(): 2.2e-17, (34.1% identity
+ in 267 aa overlap); etc. Also similar to
+ MTV002_16|O33292|Rv2750 DEHYDROGENASE from Mycobacterium
+ tuberculosis (272 aa). Contains PS00061 Short-chain
+ alcohol dehydrogenase family signature. Protein product
+ from Mb0706 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0706 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable short-chain type
+ dehydrogenase/reductase"
+ /protein_id="SIT99304.1"
+ /db_xref="GOA:A0A1R3XW77"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR023985"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW77"
+ /translation="MSARGGSLHGRVAFVTGAARAQGRSHAVRLAREGADIVALDICA
+ PVSGSVTYPPATSEDLGETVRAVEAEGRKVLAREVDIRDDAELRRLVADGVEQFGRLD
+ IVVANAGVLGWGRLWELTDEQWETVIGVNLTGTWRTLRATVPAMIDAGNGGSIVVVSS
+ SAGLKATPGNGHYAASKHALVALTNTLAIELGEFGIRVNSIHPYSVDTPMIEPEAMIQ
+ TFAKHPGYVHSFPPMPLQPKGFMTPDEISDVVVWLAGDGSGALSGNQIPVDKGALKY"
+ gene 789709..790929
+ /locus_tag="BQ2027_MB0707"
+ CDS 789709..790929
+ /locus_tag="BQ2027_MB0707"
+ /note="Mb0707, -, len: 406 aa. Equivalent to Rv0688, len:
+ 406 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 406 aa overlap). Putative ferredoxin
+ reductase (EC 1.-.-.-), highly similar to others e.g.
+ BAB55881.1|AB054975 ferredoxin reductase from Terrabacter
+ sp. DBF63 (410 aa); CAC04223.1|AL391515 putative
+ ferredoxin reductase from Streptomyces coelicolor (420
+ aa); PPU24215_8|Q51973 P-CUMATE DIOXYGENASE FERREDOXIN
+ REDUCTASE SUBUNIT from Pseudomonas putida (402 aa), FASTA
+ scores: opt: 738, E(): 0, (38.8% identity in 330 aa
+ overlap); etc. Also similar to Rv0253 and Rv1869c from
+ Mycobacterium tuberculosis. COULD BELONG TO THE BACTERIAL
+ TYPE FERREDOXIN FAMILY. Protein product from Mb0707
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0707 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE FERREDOXIN REDUCTASE"
+ /protein_id="SIT99305.1"
+ /db_xref="GOA:A0A1R3XWI4"
+ /db_xref="InterPro:IPR016156"
+ /db_xref="InterPro:IPR023753"
+ /db_xref="InterPro:IPR028202"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWI4"
+ /translation="MNAHVTSREGVNEFDDGIVIVGGGLAAARTAEQLRRAGYSGRLT
+ IVSDEVHLPYDRPPLSKEVLRSEVDDVALKPREFYDEKDIALRLGSAAVSLDTGEQTV
+ TLADGTVLGYDELVIATGLVPRRIPSLPDLDGIRVLRSFDESMALRKHASAARHAVVV
+ GAGFIGCEVAASLRGLGVDVVLVEPQPAPLASVLGEQIGQLVTRLHRDEGVDVRTGVT
+ VAEVRGKGHVDAVVLTDGTELPADLVVVGIGSTPATEWLEGSGVEVDNGVICDKAGRT
+ SAPNVWALGDVASWRDPMGHQARVEHWSNVADQARVVVPAMLGTDVPTGVVVPYFWSD
+ QYDVKIQCLGEPHATDVVHLVEDDGRKFLAYYERDGVLVGVVGGGMAGKVMKVRGKIA
+ AGAPIAEVLDQTQA"
+ gene complement(790926..791180)
+ /locus_tag="BQ2027_MB0708C"
+ CDS complement(790926..791180)
+ /locus_tag="BQ2027_MB0708C"
+ /note="Mb0708c, -, len: 84 aa. Equivalent to Rv0689c, len:
+ 84 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 84 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99306.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW37"
+ /translation="MLGWTVKPGRVADGWQAPGVHLMARCSGPQPASERRADMDGGDI
+ DAAVARVRAAGALAEPSRQPDDMSAECADDQGARCHLGQL"
+ gene complement(791793..792842)
+ /locus_tag="BQ2027_MB0709C"
+ CDS complement(791793..792842)
+ /locus_tag="BQ2027_MB0709C"
+ /note="Mb0709c, -, len: 349 aa. Equivalent to Rv0690c,
+ len: 349 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 349 aa overlap). Conserved
+ hypothetical protein, showing similarity with
+ NP_386956.1|NC_003047 CONSERVED HYPOTHETICAL PROTEIN from
+ Sinorhizobium meliloti (358 aa); NP_356573.1|NC_003063
+ AGR_L_1570p from Agrobacterium tumefaciens (346 aa);
+ NP_421938.1|NC_002696 conserved hypothetical protein from
+ Caulobacter crescentus (370 aa). Protein product from
+ Mb0709c detected using SWATH mass spectrometry. Mb0709c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99307.1"
+ /db_xref="InterPro:IPR011200"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW72"
+ /translation="MTGTEHLVHTLRSQGRVCTSSGSPMYRELLELVAADVESGGVFA
+ SILADQKGAPEGQAVPLRLLGGLHRMVLDGRAPVLRRWYPSTGGTWQAEAAWPDIVRT
+ ATDQPESLRAALDRPPQTNEVGRSAALIGGLLIACLQFDLPIRLFEIGSSAGLNLRPD
+ RYRYRYLGGEWGLADSPVRIDNAWLGELPPTATVRIVERHGYDIAPIDVTSPDGELNA
+ LSYIWPDQTDRLERLRGAIAVARNIPADLHRQAAHAAVAGMTLTDDALTVLWHSITWQ
+ YLPADERAAIRAGIDALAAQADAHCPFVHLTLEPAHQRPGAQIKYLVRMRSWPGGHAR
+ VLGECHPHGPPVTWQ"
+ gene complement(792839..793435)
+ /locus_tag="BQ2027_MB0710C"
+ CDS complement(792839..793435)
+ /locus_tag="BQ2027_MB0710C"
+ /note="Mb0710c, -, len: 198 aa. Equivalent to Rv0691c,
+ len: 198 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 198 aa overlap). Rv0691c,
+ (MTCY210.08c), len: 198 aa. Probable transcriptional
+ regulator, highly similar to AAC77476.1|U17129 unknown
+ protein from Rhodococcus erythropolis (185 aa); and
+ showing similarity with putative regulatory proteins eg
+ STMTCREP_1|TCMR_STRGA|P39885 tetracenomycin c
+ transcriptional repressor from Streptomyces glaucescens
+ (226 aa), FASTA scores: opt: 178, E(): 8.5e-06, (27.9%
+ identity in 201 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop) and probable
+ helix-turn helix motifs from aa 34-55 (Score 1100, +2.93
+ SD) and 151-172 (Score 1124, +3.02 SD). Mb0710c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99308.1"
+ /db_xref="GOA:A0A1R3XW46"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR023851"
+ /db_xref="InterPro:IPR041347"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW46"
+ /translation="MPHESRVGRRRSTTPHHISDVAIELFAAHGFTDVSVDDIARAAG
+ IARRTLFRYYASKNAIPWGDFSTHLAQLQGLLDNIDSRIQLRDALRAALLAFNTFDES
+ ETIRHRKRMRVILQTPELQAYSMTMYAGWREVIAKFVARRSGGKTTDFMPQTVAWTML
+ GVALSAYEHWLRDESVSLTEALGAAFDVVGAGLDRLNQ"
+ gene 793427..793615
+ /locus_tag="BQ2027_MB0710A"
+ CDS 793427..793615
+ /locus_tag="BQ2027_MB0710A"
+ /note="Mb0710A, len: 62 aa. Equivalent to Rv0691A len: 62
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 62 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Mycofactocin precursor
+ protein. Mb0710A found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Mycofactocin precursor protein"
+ /protein_id="SIT99309.1"
+ /db_xref="InterPro:IPR023988"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW42"
+ /translation="MRHHIRPSISALDAILCPDRRIAVETCWRKAIQMDYETDTDTEL
+ VTETLVEEVSIDGMCGVY"
+ gene 793600..793929
+ /gene="mftB"
+ /locus_tag="BQ2027_MB0711"
+ CDS 793600..793929
+ /gene="mftB"
+ /locus_tag="BQ2027_MB0711"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0711, -, len: 109 aa. Equivalent to Rv0692, len:
+ 109 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 109 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ U17129|RSU17129_3|AAC77477.1 unknown protein from
+ Rhodococcus erythropolis (95 aa), FASTA scores: opt: 393,
+ E(): 8.8e-22, (68.2% identity in 88 aa overlap). Mb0711
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Mycofactocin binding protein MftB"
+ /protein_id="SIT99310.1"
+ /db_xref="InterPro:IPR023850"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW34"
+ /translation="MWGLLTVPAPAQARRADSSEFDPDRGWRLHPQVAVRPEPFGALL
+ YHFGTRKLSFLKNRTILAVVQTLADYPDIRSACRGAGVDDCDQDPYLHALSVLAGSNM
+ LVPRQTT"
+ gene 793926..795101
+ /gene="pqqE"
+ /locus_tag="BQ2027_MB0712"
+ CDS 793926..795101
+ /gene="pqqE"
+ /locus_tag="BQ2027_MB0712"
+ /note="Mb0712, pqqE, len: 391 aa. Equivalent to Rv0693,
+ len: 391 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 391 aa overlap). Probable pqqE
+ (alternate gene name: pqqIII), coenzyme PQQ synthesis
+ protein E, similar to others AE001109_9|O30258|PQQE
+ COENZYME PQQ SYNTHESIS PROTEIN from Archaeoglobus fulgidus
+ (375 aa), FASTA scores: E(): 1.6e-16, (28.1% identity in
+ 377 aa overlap); PQQE_ACICA|P07782 coenzyme pqq synthesis
+ protein e from Acinetobacter calcoaceticus (384 aa), FASTA
+ scores: opt: 302, E(): 1.8e-12, (23.9% identity in 377 aa
+ overlap); etc. Also similar to C-terminus of heme
+ biosynthesis proteins e.g. O28270|AF2009 HEME BIOSYNTHESIS
+ PROTEIN (NIRJ-2) from Archaeoglobus fulgidus (468 aa).
+ Note that also highly similar to
+ U17129|RSU17129_4|AAC77478.1 unknown protein from
+ Rhodococcus erythropolis (405 aa), FASTA scores: opt:
+ 1997, E(): 0, (73.3% identity in 390 aa overlap). COULD
+ BELONG TO THE MOAA / NIFB / PQQE FAMILY. Mb0712 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE COENZYME PQQ SYNTHESIS PROTEIN E PQQE
+ (COENZYME PQQ SYNTHESIS PROTEIN III)"
+ /protein_id="SIT99311.1"
+ /db_xref="GOA:A0A1R3XW47"
+ /db_xref="InterPro:IPR006638"
+ /db_xref="InterPro:IPR007197"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR017200"
+ /db_xref="InterPro:IPR023885"
+ /db_xref="InterPro:IPR023913"
+ /db_xref="InterPro:IPR034391"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW47"
+ /translation="MTSPVPRLIEQFERGLDAPICLTWELTYACNLACVHCLSSSGKR
+ DPGELSTRQCKDIIDELERMQVFYVNIGGGEPTVRPDFWELVDYATAHHVGVKFSTNG
+ VRITPEVATRLAATDYVDVQISLDGATAEVNDAIRGTGSFDMAVRALQNLAAAGFAGV
+ KISVVITRRNVAQLDEFATLASRYGATLRITRLRPSGRGTDVWADLHPTADQQVQLYD
+ WLVSKGERVLTGDSFFHLAPLGQSGALAGLNMCGAGRVVCLIDPVGDVYACPFAIHDH
+ FLAGNVLSDGGFQNVWKNSSLFRELREPQSAGACGSCGHYDSCRGGCMAAKFFTGLPL
+ DGPDPECVQGHSEPALARERHLPRPRADHSRGRRVSKPVPLTLSMRPPKRPCNESPV"
+ gene 795104..796294
+ /gene="lldD1"
+ /locus_tag="BQ2027_MB0713"
+ CDS 795104..796294
+ /gene="lldD1"
+ /locus_tag="BQ2027_MB0713"
+ /note="Mb0713, lldD1, len: 396 aa. Equivalent to Rv0694,
+ len: 396 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 396 aa overlap). Possible lldD1,
+ L-lactate dehydrogenase (cytochrome) (EC 1.1.2.3), similar
+ to NP_302368.1|NC_002677 L-lactate dehydrogenase from
+ Mycobacterium leprae (414 aa). Also similar to others e.g.
+ NP_384560.1|NC_003047 PUTATIVE L-LACTATE DEHYDROGENASE
+ (CYTOCHROME) PROTEIN from Sinorhizobium meliloti (403 aa);
+ NP_251072.1|NC_002516 L-lactate dehydrogenase from
+ Pseudomonas aeruginosa (383 aa); P33232|LLDD_ECOLI
+ L-lactate dehydrogenase (cytochrome) from Escherichia coli
+ strain K12 (396 aa), FASTA scores: opt: 697, E(): 0, (34.5
+ identity in 380 aa overlap); etc; and also similar to
+ other oxidoreductases. Note that also highly similar to
+ RSU17129_5|AAC77479.1|U17129 unknown protein from
+ Rhodococcus erythropolis (392 aa), FASTA scores: opt:
+ 2006, E(): 0, (74.1% identity in 386 aa overlap). Also
+ similar to lldD2|Rv1872c|MTCY180.46|MTCY359.01 POSSIBLE
+ L-LACTATE DEHYDROGENASE (CYTOCHROME) from Mycobacterium
+ tuberculosis (414 aa). BELONGS TO THE FMN-DEPENDENT
+ ALPHA-HYDROXY ACID DEHYDROGENASES FAMILY. Protein product
+ from Mb0713 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0713 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE L-LACTATE DEHYDROGENASE (CYTOCHROME)
+ LLDD1"
+ /protein_id="SIT99312.1"
+ /db_xref="GOA:A0A1R3XY91"
+ /db_xref="InterPro:IPR000262"
+ /db_xref="InterPro:IPR012133"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR023989"
+ /db_xref="InterPro:IPR037396"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY91"
+ /translation="MAEAWFETVAIAQQRAKRRLPKSVYSSLIAASEKGITVADNVAA
+ FSELGFAPHVIGATDKRDLSTTVMGQEVSLPVIISPTGVQAVDPGGEVAVARAAAARG
+ TVMGLSSFASKPIEEVIAANPKTFFQVYWQGGRDALAERVERARQAGAVGLVVTTDWT
+ FSHGRDWGSPKIPEEMNLKTILRLSPEAITRPRWLWKFAKTLRPPDLRVPNQGRRGEP
+ GPPFFAAYGEWMATPPPTWEDIGWLRELWGGPFMLKGVMRVDDAKRAVDAGVSAISVS
+ NHGGNNLDGTPASIRALPAVSAAVGDQVEVLLDGGIRRGSDVVKAVALGARAVMIGRA
+ YLWGLAANGQAGVENVLDILRGGIDSALMGLGHASVHDLSPADILVPTGFIRDLGVPS
+ RRDV"
+ gene 796484..797239
+ /gene="mftE"
+ /locus_tag="BQ2027_MB0714"
+ CDS 796484..797239
+ /gene="mftE"
+ /locus_tag="BQ2027_MB0714"
+ /note="Mb0714, -, len: 251 aa. Equivalent to Rv0695, len:
+ 251 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 251 aa overlap). Conserved
+ hypothetical protein, similar to many creatinine
+ amidohydrolases or hypothetical proteins e.g.
+ NP_443048.1|NC_000911 creatinine amidohydrolase from
+ Synechococcus sp. PCC 6803 (273 aa); NP_466169.1|NC_003210
+ protein similar to creatinine amidohydrolase from Listeria
+ monocytogenes (249 aa); T35153|SC5A7.04c hypothetical
+ protein from Streptomyces coelicolor (273 aa); etc. Note
+ that highly similar to RSU17129_10|AAC77474.1|U17129
+ unknown protein from Rhodococcus erythropolis (230 aa),
+ FASTA scores: opt: 693, E(): 0, (55.7% identity in 237 aa
+ overlap). Mb0714 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Cyclic amid hydrolase in mycofactocin cluster"
+ /protein_id="SIT99313.1"
+ /db_xref="InterPro:IPR003785"
+ /db_xref="InterPro:IPR023871"
+ /db_xref="InterPro:IPR024087"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX53"
+ /translation="MNSSYHRRVPVVGELGSATSSQLPSTSPSIVIPLGSTEQHGPHL
+ PLDTDTRIATAVARTVTARLHAEDLPIAQEEWLMAPAIAYGASGEHQRFAGTISIGTE
+ ALTMLLVEYGRSAACWARRLVFVNGHGGNVGALTRAVGLLRAEGRDAGWCPCTCPGGD
+ PHAGHTETSVLLHLSPADVRTERWRAGNRAPLPVLLPSMRRGGVAAVSETGVLGDPTT
+ ATAAEGRRIFAAMVDDCVRRVARWMPQPDGMLT"
+ gene 797288..798700
+ /locus_tag="BQ2027_MB0715"
+ CDS 797288..798700
+ /locus_tag="BQ2027_MB0715"
+ /note="Mb0715, -, len: 470 aa. Equivalent to Rv0696, len:
+ 470 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 470 aa overlap). Probable membrane
+ sugar transferase (EC 2.-.-.-), similar (except in
+ N-terminus) to NP_069157.1|NC_000917 glycosyl transferase
+ from Archaeoglobus fulgidus (324 aa);
+ NP_279985.1|NC_002607 rhamnosyl transferase from
+ Halobacterium sp. NRC-1 (299 aa); NP_059113.1|NM_017417
+ polypeptide N-acetylgalactosaminyltransferase 8 from (637
+ aa). Note that also highly similar to P46370|YTH1_RHOER
+ HYPOTHETICAL 55.3 KDA PROTEIN from Rhodococcus
+ erythropolis (513 aa), FASTA scores: opt: 1514, E(): 0,
+ (51.8% identity in 469 aa overlap). Protein product from
+ Mb0715 detected using SWATH mass spectrometry. Mb0715
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE SUGAR TRANSFERASE"
+ /protein_id="SIT99314.1"
+ /db_xref="GOA:A0A1R3XW90"
+ /db_xref="InterPro:IPR001173"
+ /db_xref="InterPro:IPR023981"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW90"
+ /translation="MTATRLPDGFAVQVDRRVRVLGDGSALLGGSPTRLLRLAPAARG
+ LLCDGRLKVRDEVSAELARILLDATVAHPRPPSGPSHRDVTVVIPVRNNASGLRRLVT
+ SLRGLRVIVVDDGSACPVESDDFVGAHCDIEVLHHPHSKGPAAARNTGLAACTTDFVA
+ FLDSDVTPRRGWLESLLGHFCDPTVALVAPRIVSLVEGENPVARYEALHSSLDLGQRE
+ APVLPHSTVSYVPSAAIVCRSSAIRDVGGFDETMHSGEDVDLCWRLIEAGARLRYEPI
+ ALVAHDHRTQLRDWIARKAFYGGSAAPLAVRHPDKTAPLVISGGALMAWILMSIGTGL
+ GRLASLVIAVLTGRRIARAMRCAETSFLDVLAVATRGLWAAALQLASAICRHYWPLAL
+ LAAILSRRCRRVVLIAAVVDGVVDWLRRREGADDDAEPIGPLTYLVLKRVDDLAYGAG
+ LWYGVVRERNIGALKPQIRT"
+ gene 798702..800141
+ /locus_tag="BQ2027_MB0716"
+ CDS 798702..800141
+ /locus_tag="BQ2027_MB0716"
+ /note="Mb0716, -, len: 479 aa. Equivalent to Rv0697, len:
+ 479 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 479 aa overlap). Probable
+ dehydrogenase (EC 1.-.-.-), highly similar to
+ P30772|YTUR_MYCLE HYPOTHETICAL 24 KD PROTEIN from
+ Mycobacterium leprae (220 aa), FASTA scores: opt: 557,
+ E(): 1.7e-28, (46.2% identity in 223 aa overlap). Also
+ highly similar to P46371|YTH2_RHOER HYPOTHETICAL 53.0 KDA
+ GMC-TYPE OXIDOREDUCTASE from Rhodococcus erythropolis (493
+ aa); and similar to many dehydrogenases e.g.
+ NP_250814.1|NC_002516 probable dehydrogenase from
+ Pseudomonas aeruginosa (545 aa); BAA13145.1|D86622 FAD
+ dependent L-sorbose dehydrogenase from Gluconobacter
+ oxydans (531 aa); etc. Also similar to Rv1279 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis.
+ Protein product from Mb0716 detected using SWATH mass
+ spectrometry. Mb0716 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEHYDROGENASE"
+ /protein_id="SIT99315.1"
+ /db_xref="GOA:A0A1R3XWJ3"
+ /db_xref="InterPro:IPR000172"
+ /db_xref="InterPro:IPR007867"
+ /db_xref="InterPro:IPR012132"
+ /db_xref="InterPro:IPR023978"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWJ3"
+ /translation="MTAAVRHSDVLVVGAGSAGSVVAERLSMDSSCVVTVLEAGPGLA
+ DPGLLAQTANGLQLPIGAGSPLVERYRTRLTDRPVRHLPIVRGATVGGSGAINGGYFC
+ RGLPSDFDRASIPGWAWSDVLEHFRAIETDLDFETPVHGRSGPIPVRRTHEMTGITES
+ FMAAAEDAGFAWIADLNDVGPEMPSGVGAVPLNIVNGVRTSSAVGYLMPALGRPNLTL
+ LARTRAVRLRFSATTAVGVDAIGPGGPVSLSADRIVLCAGAIQSAHLLMLSGVGEEEV
+ LRSAGVKVLMALPVGMGCSDHPEWVMPTNWAVAVDRPVLEVLLSTHDGIEIRPYTGGF
+ VAMTGDGTAGHRDWPHIGVALMQPRARGRITLVSSDPQIPVRIEHRYDSEPADVAALR
+ QGSALAHELCGAATRIGPAVWATSQHLCGSAPMGTDDDPRAVVDPRCRVRGIENLWVI
+ DGSVLPSITSRGPHATIVMLGHRAAEFVQ"
+ gene 800602..800931
+ /locus_tag="BQ2027_MB0717"
+ CDS 800602..800931
+ /locus_tag="BQ2027_MB0717"
+ /note="Mb0717, -, len: 109 aa. Equivalent to 5' end of
+ Rv0698, len: 203 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (98.1% identity in 106 aa overlap).
+ Conserved hypothetical protein, highly similar to
+ C-terminus of Rv3639c|MTY15C10.12 CONSERVED HYPOTHETICAL
+ PROTEIN from Mycobacterium tuberculosis (188 aa), FASTA
+ scores: E(): 2.1e-07, (54.8% identity in 73 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0698 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (c-*) splits Rv0698 into 2 parts, Mb0717 and
+ Mb0718. Mb0717 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN [FIRST PART]"
+ /protein_id="SIT99316.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW44"
+ /translation="MGRRGNRRVHVDRVRLTGTERELRAENQSPPIFRPQNTLGDGAN
+ GLPLAVCTTTAHTCHTSHTHPSRWTPNPVPATKGVPAGLVQATFIIENLDPGNNDTPT
+ PLHPNCD"
+ gene 800979..801212
+ /locus_tag="BQ2027_MB0718"
+ CDS 800979..801212
+ /locus_tag="BQ2027_MB0718"
+ /note="Mb0718, -, len: 77 aa. Equivalent to 3' end of
+ Rv0698, len: 203 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 77 aa overlap).
+ Conserved hypothetical protein, highly similar to
+ C-terminus of Rv3639c|MTY15C10.12 CONSERVED HYPOTHETICAL
+ PROTEIN from Mycobacterium tuberculosis (188 aa), FASTA
+ scores: E(): 2.1e-07, (54.8% identity in 73 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0698 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (c-*) splits Rv0698 into 2 parts, Mb0717 and
+ Mb0718. Mb0718 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN [SECOND PART]"
+ /protein_id="SIT99317.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW82"
+ /translation="MLRRKDTSRRCVQADDVRCVQLVQDPRRGRVELGGYRAELTVGR
+ RAAVNCQRPQYGADGWPVRLGCGVGGAARGDQR"
+ gene 801397..801618
+ /locus_tag="BQ2027_MB0719"
+ CDS 801397..801618
+ /locus_tag="BQ2027_MB0719"
+ /note="Mb0719, -, len: 73 aa. Equivalent to Rv0699, len:
+ 73 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 73 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99318.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW55"
+ /translation="MGDRRVDLLAAKDSEIRRSMGAVPVGAGSSQVATSWASDRCIRC
+ RAAILSADCANLARANSRGGLAVGGSAVS"
+ gene 802255..802560
+ /gene="rpsJ"
+ /locus_tag="BQ2027_MB0720"
+ CDS 802255..802560
+ /gene="rpsJ"
+ /locus_tag="BQ2027_MB0720"
+ /standard_name="nusE"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0720, rpsJ, len: 101 aa. Equivalent to Rv0700,
+ len: 101 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 101 aa overlap). rpsJ (alternate gene
+ name: nusE), 30S ribosomal protein S10 (see first citation
+ below), equivalent to RS10_MYCLE P307653 30S ribosomal
+ protein S10 from Mycobacterium leprae (101 aa), FASTA
+ scores: opt: 645, E(): 0, (97.0% identity in 101 aa
+ overlap). Also highly similar to others e.g.
+ CAB82069.1|AL161803 30S ribosomal protein S10 from
+ Streptomyces coelicolor (102 aa); etc. Contains PS00361
+ Ribosomal protein S10 signature. BELONGS TO THE S10P
+ FAMILY OF RIBOSOMAL PROTEINS. Protein product from Mb0720
+ detected using shotgun mass spectrometry. Mb0720 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30S RIBOSOMAL PROTEIN S10 RPSJ (TRANSCRIPTION
+ ANTITERMINATION FACTOR NUSE)"
+ /protein_id="SIT99319.1"
+ /db_xref="GOA:P0A5X1"
+ /db_xref="InterPro:IPR001848"
+ /db_xref="InterPro:IPR018268"
+ /db_xref="InterPro:IPR027486"
+ /db_xref="InterPro:IPR036838"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5X1"
+ /translation="MAGQKIRIRLKAYDHEAIDASARKIVETVVRTGASVVGPVPLPT
+ EKNVYCVIRSPHKYKDSREHFEMRTHKRLIDIIDPTPKTVDALMRIDLPASVDVNIQ"
+ gene 802577..803230
+ /gene="rplC"
+ /locus_tag="BQ2027_MB0721"
+ CDS 802577..803230
+ /gene="rplC"
+ /locus_tag="BQ2027_MB0721"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0721, rplC, len: 217 aa. Equivalent to Rv0701,
+ len: 217 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 217 aa overlap). Probable rplC, 50S
+ ribosomal protein L3, equivalent to O06044|RL3_MYCBO 50S
+ RIBOSOMAL PROTEIN L3 from Mycobacterium bovis BCG (217
+ aa); and P30762|RL3_MYCLE 50S RIBOSOMAL PROTEIN L3 from
+ Mycobacterium leprae (217 aa). Also highly similar to
+ others e.g. CAB82070.1|AL161803 50S ribosomal protein L3
+ from Streptomyces coelicolor (214 aa); P52860|RL3_THETH
+ ribosomal protein l3 from Thermus aquaticus (206 aa),
+ FASTA scores: opt: 717, E(): 0, (55.2% identity in 210 aa
+ overlap); etc. Contains PS00474 Ribosomal protein L3
+ signature. BELONGS TO THE L3P FAMILY OF RIBOSOMAL
+ PROTEINS. Protein product from Mb0721 detected using
+ shotgun mass spectrometry. Mb0721 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l3 rplc"
+ /protein_id="SIT99320.1"
+ /db_xref="GOA:P60441"
+ /db_xref="InterPro:IPR000597"
+ /db_xref="InterPro:IPR009000"
+ /db_xref="InterPro:IPR019926"
+ /db_xref="InterPro:IPR019927"
+ /db_xref="UniProtKB/Swiss-Prot:P60441"
+ /translation="MARKGILGTKLGMTQVFDESNRVVPVTVVKAGPNVVTRIRTPER
+ DGYSAVQLAYGEISPRKVNKPLTGQYTAAGVNPRRYLAELRLDDSDAATEYQVGQELT
+ AEIFADGSYVDVTGTSKGKGFAGTMKRHGFRGQGASHGAQAVHRRPGSIGGCATPARV
+ FKGTRMAGRMGNDRVTVLNLLVHKVDAENGVLLIKGAVPGRTGGLVMVRSAIKRGEK"
+ gene 803230..803901
+ /gene="rplD"
+ /locus_tag="BQ2027_MB0722"
+ CDS 803230..803901
+ /gene="rplD"
+ /locus_tag="BQ2027_MB0722"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0722, rplD, len: 223 aa. Equivalent to Rv0702,
+ len: 223 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 223 aa overlap). Probable rplD, 50S
+ ribosomal protein L4, equivalent to O06045|RL4_MYCBO 50S
+ RIBOSOMAL PROTEIN L4 from Mycobacterium bovis BCG (223
+ aa); O06114|RL4_MYCSM 50S RIBOSOMAL PROTEIN L4 from
+ Mycobacterium smegmatis (215 aa); and MLCB2492_3 50S
+ ribosomal protein L4 from Mycobacterium leprae (230 aa).
+ Also highly similar to others e.g. CAB82071.1|AL161803 50S
+ ribosomal protein L4 from Streptomyces coelicolor (219
+ aa); P28601|RL4_BACST 50s ribosomal protein L4 from
+ Bacillus stearothermophilus (207 aa), FASTA scores: opt:
+ 522, E(): 3.5e-26, (42.4% identity in 198 aa overlap);
+ etc. BELONGS TO THE L4P FAMILY OF RIBOSOMAL PROTEINS.
+ Protein product from Mb0722 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0722 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l4 rpld"
+ /protein_id="SIT99321.1"
+ /db_xref="GOA:P60728"
+ /db_xref="InterPro:IPR002136"
+ /db_xref="InterPro:IPR013005"
+ /db_xref="InterPro:IPR023574"
+ /db_xref="UniProtKB/Swiss-Prot:P60728"
+ /translation="MAAQEQKTLKIDVKTPAGKVDGAIELPAELFDVPANIALMHQVV
+ TAQRAAARQGTHSTKTRGEVSGGGRKPYRQKGTGRARQGSTRAPQFTGGGVVHGPKPR
+ DYSQRTPKKMIAAALRGALSDRARNGRIHAITELVEGQNPSTKSARAFLASLTERKQV
+ LVVIGRSDEAGAKSVRNLPGVHILAPDQLNTYDVLRADDVVFSVEALNAYIAANTTTS
+ EEVSA"
+ gene 803901..804203
+ /gene="rplW"
+ /locus_tag="BQ2027_MB0723"
+ CDS 803901..804203
+ /gene="rplW"
+ /locus_tag="BQ2027_MB0723"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0723, rplW, len: 100 aa. Equivalent to Rv0703,
+ len: 100 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 100 aa overlap). Probable rplW, 50S
+ ribosomal protein L23, equivalent to O06046|RL23_MYCBO 50S
+ RIBOSOMAL PROTEIN L23 from Mycobacterium bovis BCG (100
+ aa); and MLCB2492_4 50S RIBOSOMAL PROTEIN L23 from
+ Mycobacterium leprae (100 aa). Also highly similar to
+ others e.g. CAB82072.1|AL161803 50S ribosomal protein L23
+ from Streptomyces coelicolor (139 aa) (N-terminus longer);
+ P04454|RL23_BACST 50s ribosomal protein L23 from Bacillus
+ stearothermophilus (95 aa), FASTA scores: opt: 275, E():
+ 1.4e-13, (50.5% identity in 95 aa overlap); etc. Contains
+ PS00050 Ribosomal protein L23 signature. BELONGS TO THE
+ L23P FAMILY OF RIBOSOMAL PROTEINS. Protein product from
+ Mb0723 detected using shotgun mass spectrometry. Mb0723
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l23 rplw"
+ /protein_id="SIT99322.1"
+ /db_xref="GOA:O06046"
+ /db_xref="InterPro:IPR001014"
+ /db_xref="InterPro:IPR012677"
+ /db_xref="InterPro:IPR012678"
+ /db_xref="InterPro:IPR013025"
+ /db_xref="UniProtKB/Swiss-Prot:O06046"
+ /translation="MATLADPRDIILAPVISEKSYGLLDDNVYTFLVRPDSNKTQIKI
+ AVEKIFAVKVASVNTANRQGKRKRTRTGYGKRKSTKRAIVTLAPGSRPIDLFGAPA"
+ gene 804350..805192
+ /gene="rplB"
+ /locus_tag="BQ2027_MB0724"
+ CDS 804350..805192
+ /gene="rplB"
+ /locus_tag="BQ2027_MB0724"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0724, rplB, len: 280 aa. Equivalent to Rv0704,
+ len: 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 280 aa overlap). Probable rplB, 50S
+ ribosomal protein L2, equivalent to O06047|RL2_MYCBO 50S
+ RIBOSOMAL PROTEIN L2 from Mycobacterium bovis BCG (280
+ aa); and MLCB2492_5M 50S RIBOSOMAL PROTEIN L2 from
+ Mycobacterium leprae (280 aa). Also highly similar to
+ others e.g. CAB82073.1|AL161803 50S ribosomal protein L2
+ from Streptomyces coelicolor (278 aa); P42919|RL2_BACSU
+ 50s ribosomal protein l2 (bl2) from Bacillus subtilis (276
+ aa), FASTA scores: opt: 1179, E(): 0, (61.1% identity in
+ 275 aa overlap); etc. Contains PS00467 Ribosomal protein
+ L2 signature. BELONGS TO THE L2P FAMILY OF RIBOSOMAL
+ PROTEINS. Protein product from Mb0724 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0724 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l2 rplb"
+ /protein_id="SIT99323.1"
+ /db_xref="GOA:O06047"
+ /db_xref="InterPro:IPR002171"
+ /db_xref="InterPro:IPR005880"
+ /db_xref="InterPro:IPR008991"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR014722"
+ /db_xref="InterPro:IPR014726"
+ /db_xref="InterPro:IPR022666"
+ /db_xref="InterPro:IPR022669"
+ /db_xref="InterPro:IPR022671"
+ /db_xref="UniProtKB/Swiss-Prot:O06047"
+ /translation="MAIRKYKPTTPGRRGASVSDFAEITRSTPEKSLVRPLHGRGGRN
+ AHGRITTRHKGGGHKRAYRMIDFRRNDKDGVNAKVAHIEYDPNRTARIALLHYLDGEK
+ RYIIAPNGLSQGDVVESGANADIKPGNNLPLRNIPAGTLIHAVELRPGGGAKLARSAG
+ SSIQLLGKEASYASLRMPSGEIRRVDVRCRATVGEVGNAEQANINWGKAGRMRWKGKR
+ PSVRGVVMNPVDHPHGGGEGKTSGGRHPVSPWGKPEGRTRNANKSSNKFIVRRRRTGK
+ KHSR"
+ gene 805233..805514
+ /gene="rpsS"
+ /locus_tag="BQ2027_MB0725"
+ CDS 805233..805514
+ /gene="rpsS"
+ /locus_tag="BQ2027_MB0725"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0725, rpsS, len: 93 aa. Equivalent to Rv0705,
+ len: 93 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 93 aa overlap). Probable rpsS, 30S
+ ribosomal protein S19, equivalent to S36895 ribosomal
+ protein S19 from Mycobacterium bovis (93 aa), FASTA
+ scores: opt: 623, E(): 0, (98.9% identity in 93 aa
+ overlap); and NP_302261.1|NC_002677 30S ribosomal protein
+ S19 from Mycobacterium leprae (93 aa). Also highly similar
+ to others e.g. CAB82074.1|AL161803 30S ribosomal protein
+ S19 from Streptomyces coelicolor (93 aa); etc. Contains
+ PS00323 Ribosomal protein S19 signature. BELONGS TO THE
+ S19P FAMILY OF RIBOSOMAL PROTEINS. Protein product from
+ Mb0725 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0725 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s19 rpss"
+ /protein_id="SIT99324.1"
+ /db_xref="GOA:P0A5X5"
+ /db_xref="InterPro:IPR002222"
+ /db_xref="InterPro:IPR005732"
+ /db_xref="InterPro:IPR020934"
+ /db_xref="InterPro:IPR023575"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5X5"
+ /translation="MPRSLKKGPFVDEHLLKKVDVQNEKNTKQVIKTWSRRSTIIPDF
+ IGHTFAVHDGRKHVPVFVTESMVGHKLGEFAPTRTFKGHIKDDRKSKRR"
+ gene 805511..806104
+ /gene="rplV"
+ /locus_tag="BQ2027_MB0726"
+ CDS 805511..806104
+ /gene="rplV"
+ /locus_tag="BQ2027_MB0726"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0726, rplV, len: 197 aa. Equivalent to Rv0706,
+ len: 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 197 aa overlap). Probable rplV, 50S
+ ribosomal protein L22, equivalent to O06115|RL22_MYCSM 50S
+ RIBOSOMAL PROTEIN L22 from Mycobacterium smegmatis (153
+ aa); MBS10OPER_7 50S RIBOSOMAL PROTEIN L22 from
+ Mycobacterium bovis BCG; and MLCB2492_7 50S ribosomal
+ protein L22 from Mycobacterium leprae (175 aa). Also
+ highly similar to others e.g. CAB82075.1|AL161803 50S
+ ribosomal protein L22 from Streptomyces coelicolor (125
+ aa); P42060|RL22_BACSU 50s ribosomal protein L22 from
+ Bacillus subtilis (113 aa), FASTA scores: opt: 368, E():
+ 2.4e-13, (52.8% identity in 108 aa overlap); etc. Contains
+ PS00464 Ribosomal protein L22 signature, and contains
+ repetitive sequence at C-terminus. BELONGS TO THE L22P
+ FAMILY OF RIBOSOMAL PROTEINS. Protein product from Mb0726
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0726 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l22 rplv"
+ /protein_id="SIT99325.1"
+ /db_xref="GOA:P61180"
+ /db_xref="InterPro:IPR001063"
+ /db_xref="InterPro:IPR005727"
+ /db_xref="InterPro:IPR018260"
+ /db_xref="InterPro:IPR036394"
+ /db_xref="UniProtKB/Swiss-Prot:P61180"
+ /translation="MTAATKATEYPSAVAKARFVRVSPRKARRVIDLVRGRSVSDALD
+ ILRWAPQAASGPVAKVIASAAANAQNNGGLDPATLVVATVYADQGPTAKRIRPRAQGR
+ AFRIRRRTSHITVVVESRPAKDQRSAKSSRARRTEASKAASKVGATAPAKKAAAKAPA
+ KKAPASSGVKKTPAKKAPAKKAPAKASETSAAKGGSD"
+ gene 806104..806928
+ /gene="rpsC"
+ /locus_tag="BQ2027_MB0727"
+ CDS 806104..806928
+ /gene="rpsC"
+ /locus_tag="BQ2027_MB0727"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0727, rpsC, len: 274 aa. Equivalent to Rv0707,
+ len: 274 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 274 aa overlap). Probable rpsC, 30S
+ ribosomal protein S3, equivalent to
+ O06048|RS3_MYCBO|MBS10OPER_8 30S RIBOSOMAL PROTEIN S3 from
+ Mycobacterium bovis BCG (274 aa); and MLCB2492_8 30S
+ RIBOSOMAL PROTEIN S3 from Mycobacterium leprae (281 aa).
+ Also highly similar to others e.g. CAB82076.1|AL161803 30S
+ ribosomal protein S3 from Streptomyces coelicolor (277
+ aa); P21465|RS3_BACSU 30s ribosomal protein s3 (bs3) (bs2)
+ from Bacillus subtilis (217 aa), FASTA scores: opt: 794,
+ E(): 0, (52.8% identity in 212 aa overlap); etc. BELONGS
+ TO THE S3P FAMILY OF RIBOSOMAL PROTEINS. Protein product
+ from Mb0727 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0727 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s3 rpsc"
+ /protein_id="SIT99326.1"
+ /db_xref="GOA:P0A5X7"
+ /db_xref="InterPro:IPR001351"
+ /db_xref="InterPro:IPR004044"
+ /db_xref="InterPro:IPR004087"
+ /db_xref="InterPro:IPR005704"
+ /db_xref="InterPro:IPR009019"
+ /db_xref="InterPro:IPR015946"
+ /db_xref="InterPro:IPR018280"
+ /db_xref="InterPro:IPR036419"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5X7"
+ /translation="MGQKINPHGFRLGITTDWKSRWYADKQYAEYVKEDVAIRRLLSS
+ GLERAGIADVEIERTRDRVRVDIHTARPGIVIGRRGTEADRIRADLEKLTGKQVQLNI
+ LEVKNPESQAQLVAQGVAEQLSNRVAFRRAMRKAIQSAMRQPNVKGIRVQCSGRLGGA
+ EMSRSEFYREGRVPLHTLRADIDYGLYEAKTTFGRIGVKVWIYKGDIVGGKRELAAAA
+ PAGADRPRRERPSGTRPRRSGASGTTATGTDAGRAAGGEEAAPDAAAPVEAQSTES"
+ gene 806932..807348
+ /gene="rplP"
+ /locus_tag="BQ2027_MB0728"
+ CDS 806932..807348
+ /gene="rplP"
+ /locus_tag="BQ2027_MB0728"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0728, rplP, len: 138 aa. Equivalent to Rv0708,
+ len: 138 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 138 aa overlap). Probable rplP, 50S
+ ribosomal protein L16, equivalent to
+ O06049|RL16_MYCBO|MBS10OPER_9 50S RIBOSOMAL PROTEIN L16
+ from Mycobacterium bovis BCG (138 aa); and MLCB2492_9 50S
+ RIBOSOMAL PROTEIN L16 from Mycobacterium leprae (138 aa).
+ Also highly similar to others e.g. CAB82077.1|AL161803 50S
+ ribosomal protein L16 from Streptomyces coelicolor (139
+ aa); P14577|RL16_BACSU 50s ribosomal protein l16 from
+ Bacillus subtilis (144 aa), FASTA scores: opt: 600, E():
+ 0, (63.2% identity in 136 aa overlap); etc. Contains
+ PS00701 Ribosomal protein L16 signature 2. BELONGS TO THE
+ L16P FAMILY OF RIBOSOMAL PROTEINS. Protein product from
+ Mb0728 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0728 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l16 rplp"
+ /protein_id="SIT99327.1"
+ /db_xref="GOA:O06049"
+ /db_xref="InterPro:IPR000114"
+ /db_xref="InterPro:IPR016180"
+ /db_xref="InterPro:IPR020798"
+ /db_xref="InterPro:IPR036920"
+ /db_xref="UniProtKB/Swiss-Prot:O06049"
+ /translation="MLIPRKVKHRKQHHPRQRGIASGGTTVNFGDYGIQALEHAYVTN
+ RQIESARIAINRHIKRGGKVWINIFPDRPLTKKPAETRMGSGKGSPEWWVANVKPGRV
+ LFELSYPNEGVARAALTRAIHKLPIKARIITREEQF"
+ gene 807348..807581
+ /gene="rpmC"
+ /locus_tag="BQ2027_MB0729"
+ CDS 807348..807581
+ /gene="rpmC"
+ /locus_tag="BQ2027_MB0729"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0729, rpmC, len: 77 aa. Equivalent to Rv0709,
+ len: 77 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 77 aa overlap). Probable rpmC, 50S
+ ribosomal protein L29, equivalent to
+ O06050|RL29_MYCBO|MBS10OPER_10 50S RIBOSOMAL PROTEIN L29
+ from Mycobacterium bovis BCG (75 aa); and
+ O32989|RL29_MYCLE|MLCB2492_10 50S RIBOSOMAL PROTEIN L29
+ from Mycobacterium leprae (80 aa). Also highly similar to
+ others e.g. Q9L0D2|RL29_STRCO 50S RIBOSOMAL PROTEIN L29
+ from Streptomyces coelicolor (74 aa); P12873|RL29_BACSU
+ 50s ribosomal protein l29 from Bacillus subtilis (66 aa),
+ FASTA scores: opt: 225, E(): 8.3e-11, (58.6% identity in
+ 58 aa overlap); etc. BELONGS TO THE L29P FAMILY OF
+ RIBOSOMAL PROTEINS. Protein product from Mb0729 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0729 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l29 rpmc"
+ /protein_id="SIT99328.1"
+ /db_xref="GOA:O06050"
+ /db_xref="InterPro:IPR001854"
+ /db_xref="InterPro:IPR018254"
+ /db_xref="InterPro:IPR036049"
+ /db_xref="UniProtKB/Swiss-Prot:O06050"
+ /translation="MAVGVSPGELRELTDEELAERLRESKEELFNLRFQMATGQLNNN
+ RRLRTVRQEIARIYTVLRERELGLATGPDGKES"
+ gene 807578..807988
+ /gene="rpsQ"
+ /locus_tag="BQ2027_MB0730"
+ CDS 807578..807988
+ /gene="rpsQ"
+ /locus_tag="BQ2027_MB0730"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0730, rpsQ, len: 136 aa. Equivalent to Rv0710,
+ len: 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 136 aa overlap). Probable rpsQ, 30S
+ ribosomal protein S17, equivalent to O06051|RS17_MYCBO
+ 30S|MBS10OPER_11 30S RIBOSOMAL PROTEIN S17 from
+ Mycobacterium bovis BCG (136 aa); and MLCB2492_11 30S
+ RIBOSOMAL PROTEIN S17 from Mycobacterium leprae (126 aa).
+ Also highly similar to others e.g. CAB82079.1|AL161803 30S
+ ribosomal protein S17 from Streptomyces coelicolor (95
+ aa); P12874|RS17_BACSU 30s ribosomal protein s17 (bs 16)
+ from Bacillus subtilis (86 aa), FASTA scores: opt: 305,
+ E(): 1.6e-11, (60.5% identity in 81 aa overlap); etc.
+ Contains PS00056 Ribosomal protein S17 signature. BELONGS
+ TO THE S17P FAMILY OF RIBOSOMAL PROTEINS. Protein product
+ from Mb0730 detected using shotgun mass spectrometry.
+ Mb0730 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s17 rpsq"
+ /protein_id="SIT99329.1"
+ /db_xref="GOA:O06051"
+ /db_xref="InterPro:IPR000266"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR019979"
+ /db_xref="InterPro:IPR019984"
+ /db_xref="UniProtKB/Swiss-Prot:O06051"
+ /translation="MMAEAKTGAKAAPRVAKAAKAAPKKAAPNDAEAIGAANAANVKG
+ PKHTPRTPKPRGRRKTRIGYVVSDKMQKTIVVELEDRMRHPLYGKIIRTTKKVKAHDE
+ DSVAGIGDRVSLMETRPLSATKRWRLVEILEKAK"
+ gene 808157..808603
+ /gene="atsAa"
+ /locus_tag="BQ2027_MB0731"
+ CDS 808157..808603
+ /gene="atsAa"
+ /locus_tag="BQ2027_MB0731"
+ /note="Mb0731, atsAa, len: 148 aa. Equivalent to 5' end of
+ Rv0711, len: 787 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 148 aa overlap).
+ Possible atsA, arylsulfatase (EC 3.1.6.1), similar to
+ others e.g. P51691|ARS_PSEAE arylsulfatase from
+ Pseudomonas aeruginosa (532 aa), FASTA scores: opt: 439,
+ E(): 2.9e-21, (30.8% identity in 552 aa overlap); etc.
+ Also similar to other hypothetical arylsulfatases from
+ Mycobacterium tuberculosis e.g. Rv3299c, Rv0663, etc.
+ Contains PS00523 Sulfatases signature 1, and PS00149
+ Sulfatases signature 2. BELONGS TO THE SULFATASE FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, atsA exists as a single gene.
+ In Mycobacterium bovis, a single base transversion (g-t),
+ introducing a stop codon, splits atsA into 2 parts, atsAa
+ and atsAb. Mb0731 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ARYLSULFATASE ATSAa [FIRST PART]
+ (ARYL-SULFATE SULPHOHYDROLASE) (ARYLSULPHATASE)"
+ /protein_id="SIT99330.1"
+ /db_xref="GOA:A0A1R3XW61"
+ /db_xref="InterPro:IPR000917"
+ /db_xref="InterPro:IPR017850"
+ /db_xref="InterPro:IPR024607"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW61"
+ /translation="MAPEATEAFNGTIELDIRDSEPDWGPYAAPVAPEHSPNILYLVW
+ DDVGIATWDCFGGLVEMPAMTRVAERGVRLSQFHTTALCSPTRASLLTGRNATTVGMA
+ TIEEFTDGFPNCNGRIPADTALLPEVLAEHGYNTYCVGKWHLTPLE"
+ gene 808610..810520
+ /gene="atsAb"
+ /locus_tag="BQ2027_MB0732"
+ CDS 808610..810520
+ /gene="atsAb"
+ /locus_tag="BQ2027_MB0732"
+ /note="Mb0732, atsAb, len: 636 aa. Equivalent to 3' end of
+ Rv0711, len: 787 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 636 aa overlap).
+ Possible atsA, arylsulfatase (EC 3.1.6.1), similar to
+ others e.g. P51691|ARS_PSEAE arylsulfatase from
+ Pseudomonas aeruginosa (532 aa), FASTA scores: opt: 439,
+ E(): 2.9e-21, (30.8% identity in 552 aa overlap); etc.
+ Also similar to other hypothetical arylsulfatases from
+ Mycobacterium tuberculosis e.g. Rv3299c, Rv0663, etc.
+ Contains PS00523 Sulfatases signature 1, and PS00149
+ Sulfatases signature 2. BELONGS TO THE SULFATASE FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, atsA exists as a single gene.
+ In Mycobacterium bovis, a single base transversion (g-t),
+ introducing a stop codon, splits atsA into 2 parts, atsAa
+ and atsAb. Protein product from Mb0732 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0732 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ARYLSULFATASE ATSAb [SECOND PART]
+ (ARYL-SULFATE SULPHOHYDROLASE) (ARYLSULPHATASE)"
+ /protein_id="SIT99331.1"
+ /db_xref="GOA:A0A1R3XW65"
+ /db_xref="InterPro:IPR000917"
+ /db_xref="InterPro:IPR017850"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW65"
+ /translation="MASTKRHWPTSRGFERFYGFLGGETDQWYPDLVYDNHPVSPPGT
+ PEGGYHLSKDIADKTIEFIRDAKVIAPDKPWFSYVCPGAGHAPHHVFKEWADRYAGRF
+ DMGYERYREIVLERQKALGIVPPDTELSPINPYLDVPGPNGETWPLQDTVRPWDSLSD
+ EEKKLFCRMAEVFAGFLSYTDAQIGRILDYLEESGQLDNTIIVVISDNGASGEGGPNG
+ SVNEGKFFNGYIDTVAESMKLFDHLGGPQTYNHYPIGWAMAFNTPYKLFKRYASHEGG
+ IADPAIISWPNGIAAHGEIRDNYVNVSDITPTVYDLLGMTPPGTVKGIPQKPMDGVSF
+ IAALADPAADTGKTTQFYTMLGTRGIWHEGWFANTIHAATPAGWSNFNADRWELFHIA
+ ADRSQCHDLAAEHPDKLEELKALWFSEAAKYNGLPLADLNLLETMTRSRPYLVSERAS
+ YVYYPDCADVGIGAAVEIRGRSFAVLADVTIDTTGAEGVLFKHGGAHGGHVLFVRDGR
+ LHYVYNFLGERQQLVSSSGPVPSGRHLLGVRYLRTGTVPNSHTPVGDLELFFDENLVG
+ ALTNVLTHPGTFGLAGAAISVGRNGGSAVSSHYEAPFAFTGGTITQVTVDVSGRPFED
+ VESDLALAFSRD"
+ gene 810568..811467
+ /locus_tag="BQ2027_MB0733"
+ CDS 810568..811467
+ /locus_tag="BQ2027_MB0733"
+ /note="Mb0733, -, len: 299 aa. Equivalent to Rv0712, len:
+ 299 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 299 aa overlap). Conserved
+ hypothetical protein, similar to others e.g.
+ NP_106128.1|NC_002678 hypothetical protein from
+ Mesorhizobium loti (372 aa); D90901_33|P72841 HYPOTHETICAL
+ 48.1 KD PROTEIN from Synechocystis sp (410 aa), FASTA
+ scores: E(): 1.1e-07, (28.8% identity in 299 aa overlap);
+ etc. Slight similarity to carboxykinases. Similar to
+ C-terminal part of Rv3703c CONSERVED HYPOTHETICAL PROTEIN
+ from Mycobacterium tuberculosis (425 aa). Protein product
+ from Mb0733 detected using SWATH mass spectrometry. Mb0733
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Sulfatase modifying factor 1 precursor
+ (C-alpha-formyglycine- generating enzyme 1)"
+ /protein_id="SIT99332.1"
+ /db_xref="InterPro:IPR005532"
+ /db_xref="InterPro:IPR016187"
+ /db_xref="InterPro:IPR042095"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYB4"
+ /translation="MLTELVDLPGGSFRMGSTRFYPEEAPIHTVTVRAFAVERHPVTN
+ AQFAEFVSATGYVTVAEQPLDPGLYPGVDAADLCPGAMVFCPTAGPVDLRDWRQWWDW
+ VPGACWRHPFGRDSDIADRAGHPVVQVAYPDAVAYARWAGRRLPTEAEWEYAARGGTT
+ ATYAWGDQEKPGGMLMANTWQGRFPYRNDGALGWVGTSPVGRFPANGFGLLDMIGNVW
+ EWTTTEFYPHHRIDPPSTACCAPVKLATAADPTISQTLKGGSHLCAPEYCHRYRPAAR
+ SPQSQDTATTHIGFRCVADPVSG"
+ gene 811768..812709
+ /locus_tag="BQ2027_MB0734"
+ CDS 811768..812709
+ /locus_tag="BQ2027_MB0734"
+ /note="Mb0734, -, len: 313 aa. Equivalent to Rv0713, len:
+ 313 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 313 aa overlap). Probable conserved
+ transmembrane protein, similar to Rv3435c|MTCY77_7|O06252
+ from Mycobacterium tuberculosis (284 aa), FASTA scores:
+ opt: 557, E(): 2.1e-29, (35.8% identity in 282 aa
+ overlap); MLCB2492_12|O32991 HYPOTHETICAL 10.7 KD PROTEIN
+ from Mycobacterium leprae (95 aa). Protein product from
+ Mb0734 detected using SWATH mass spectrometry. Mb0734
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99333.1"
+ /db_xref="GOA:A0A1R3XX72"
+ /db_xref="InterPro:IPR027948"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX72"
+ /translation="MAGSDPPTGGPASQAGSDAGASPEHKHMSRRKHLVLDVCIILGV
+ LIAYVFSLLGYDWLAHTPGPLPQPDVGTTDDTVVLIRFEELHTVANRLDVKVLVLPDD
+ SMIDHRLQVLTTDTSVRLYPENELGDLQYPVGKLPAQVATTIEAHGNPGAWPFDTYTT
+ DTVQADVLVGAGDNRQYVPARVEVTGSLEGWDISAVRVGESSQTSDRPDNVIITLKRA
+ KGPLVFDLGICLVLITLPTLALFVAIQMITGRRKFQPPFGTWYAAMLFAVVPLRTILP
+ GSPPAGAWIDRAVVIWVLIALAAAMVVYIVAWYRESD"
+ gene 813195..813563
+ /gene="rplN"
+ /locus_tag="BQ2027_MB0735"
+ CDS 813195..813563
+ /gene="rplN"
+ /locus_tag="BQ2027_MB0735"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0735, rplN, len: 122 aa. Equivalent to Rv0714,
+ len: 122 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 122 aa overlap). Probable rplN, 50S
+ ribosomal protein L14, equivalent to
+ O32993|MLCB2492_14|ML1849|RL14_MYCLE 50S RIBOSOMAL PROTEIN
+ L14 from Mycobacterium leprae (122 aa). Also highly
+ similar to others e.g. CAB82080.1|AL161803 50S ribosomal
+ protein L14 from Streptomyces coelicolor (122 aa);
+ P33100|RL14_MICLU 50s ribosomal protein L14 from
+ Micrococcus luteus (122 aa), FASTA scores: opt: 674, E():
+ 0, (85.2% identity in 122 aa overlap); etc. Contains
+ PS00049 Ribosomal protein L14 signature. BELONGS TO THE
+ L14P FAMILY OF RIBOSOMAL PROTEINS. Protein product from
+ Mb0735 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0735 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l14 rpln"
+ /protein_id="SIT99334.1"
+ /db_xref="GOA:P66070"
+ /db_xref="InterPro:IPR000218"
+ /db_xref="InterPro:IPR005745"
+ /db_xref="InterPro:IPR019972"
+ /db_xref="InterPro:IPR036853"
+ /db_xref="UniProtKB/Swiss-Prot:P66070"
+ /translation="MIQQESRLKVADNTGAKEILCIRVLGGSSRRYAGIGDVIVATVK
+ DAIPGGNVKRGDVVKAVVVRTVKERRRPDGSYIKFDENAAVIIKPDNDPRGTRIFGPV
+ GRELREKRFMKIISLAPEVL"
+ gene 813564..813881
+ /gene="rplX"
+ /locus_tag="BQ2027_MB0736"
+ CDS 813564..813881
+ /gene="rplX"
+ /locus_tag="BQ2027_MB0736"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0736, rplX, len: 105 aa. Equivalent to Rv0715,
+ len: 105 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 105 aa overlap). Probable rplX, 50S
+ ribosomal protein L24, equivalent to O32994|MLCB2492_15
+ 50S RIBOSOMAL PROTEIN L24 from Mycobacterium leprae (105
+ aa). Also highly similar to others e.g.
+ CAB82081.1|AL161803 50S ribosomal protein L24 from
+ Streptomyces coelicolor (107 aa); P12876|RL24_BACSU 50s
+ ribosomal protein L24 (bl23) from Bacillus subtilis (103
+ aa), FASTA scores: opt: 363, E(): 1.8e-18, (56.7% identity
+ in 104 aa overlap); etc. Contains PS01108 Ribosomal
+ protein L24 signature. BELONGS TO THE L24P FAMILY OF
+ RIBOSOMAL PROTEINS. Protein product from Mb0736 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0736 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l24 rplx"
+ /protein_id="SIT99335.1"
+ /db_xref="GOA:P60628"
+ /db_xref="InterPro:IPR003256"
+ /db_xref="InterPro:IPR005824"
+ /db_xref="InterPro:IPR005825"
+ /db_xref="InterPro:IPR008991"
+ /db_xref="InterPro:IPR014722"
+ /db_xref="InterPro:IPR041988"
+ /db_xref="UniProtKB/Swiss-Prot:P60628"
+ /translation="MKVHKGDTVLVISGKDKGAKGKVLQAYPDRNRVLVEGVNRIKKH
+ TAISTTQRGARSGGIVTQEAPIHVSNVMVVDSDGKPTRIGYRVDEETGKRVRISKRNG
+ KDI"
+ gene 813881..814444
+ /gene="rplE"
+ /locus_tag="BQ2027_MB0737"
+ CDS 813881..814444
+ /gene="rplE"
+ /locus_tag="BQ2027_MB0737"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0737, rplE, len: 187 aa. Equivalent to Rv0716,
+ len: 187 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 187 aa overlap). Probable rplE, 50S
+ ribosomal protein L5, equivalent to MLCB2492_16 50S
+ RIBOSOMAL PROTEIN L5 from Mycobacterium leprae (187 aa).
+ Also highly similar to others e.g. CAB82082.1|AL161803 50S
+ ribosomal protein L5 from Streptomyces coelicolor (185
+ aa); P33098|RL5_MICLU 50S RIBOSOMAL PROTEIN L5 from
+ Micrococcus luteus (191 aa), FASTA scores: opt: 930, E():
+ 0, (73.8% identity in 183 aa overlap); etc. BELONGS TO THE
+ L5P FAMILY OF RIBOSOMAL PROTEINS. Protein product from
+ Mb0737 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0737 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l5 rple"
+ /protein_id="SIT99336.1"
+ /db_xref="GOA:P62402"
+ /db_xref="InterPro:IPR002132"
+ /db_xref="InterPro:IPR020930"
+ /db_xref="InterPro:IPR022803"
+ /db_xref="InterPro:IPR031309"
+ /db_xref="InterPro:IPR031310"
+ /db_xref="UniProtKB/Swiss-Prot:P62402"
+ /translation="MTTAQKVQPRLKERYRSEIRDALRKQFGYGNVMQIPTVTKVVVN
+ MGVGEAARDAKLINGAVNDLALITGQKPEVRRARKSIAQFKLREGMPVGVRVTLRGDR
+ MWEFLDRLTSIALPRIRDFRGLSPKQFDGVGNYTFGLAEQAVFHEVDVDKIDRVRGMD
+ INVVTSAATDDEGRALLRALGFPFKEN"
+ gene 814449..814634
+ /gene="rpsN1"
+ /locus_tag="BQ2027_MB0738"
+ CDS 814449..814634
+ /gene="rpsN1"
+ /locus_tag="BQ2027_MB0738"
+ /note="Mb0738, rpsN1, len: 61 aa. Equivalent to Rv0717,
+ len: 61 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 61 aa overlap). Probable rpsN1, 30S
+ ribosomal protein S14, equivalent to MLCB2492_17|O32996
+ RIBOSOMAL PROTEIN S14 from Mycobacterium leprae (61 aa).
+ Also highly similar to others e.g. CAB82083.1|AL161803 30S
+ ribosomal protein S14 from Streptomyces coelicolor (61
+ aa); P24320|RS14_THETH 30s ribosomal protein S14 from
+ Thermus aquaticus (subsp. thermophilus) (60 aa), FASTA
+ scores: opt: 316, E(): 2e-19,(70.0% identity in 60 aa
+ overlap); etc. Contains PS00527 Ribosomal protein S14
+ signature. BELONGS TO THE S14P FAMILY OF RIBOSOMAL
+ PROTEINS. Note that previously known as rpsN. Protein
+ product from Mb0738 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0738 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s14 rpsn1"
+ /protein_id="SIT99337.1"
+ /db_xref="GOA:P0A5X3"
+ /db_xref="InterPro:IPR001209"
+ /db_xref="InterPro:IPR018271"
+ /db_xref="InterPro:IPR023053"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5X3"
+ /translation="MAKKALVNKAAGKPRFAVRAYTRCSKCGRPRAVYRKFGLCRICL
+ REMAHAGELPGVQKSSW"
+ gene 814798..815196
+ /gene="rpsH"
+ /locus_tag="BQ2027_MB0739"
+ CDS 814798..815196
+ /gene="rpsH"
+ /locus_tag="BQ2027_MB0739"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0739, rpsH, len: 132 aa. Equivalent to Rv0718,
+ len: 132 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 132 aa overlap). Probable rpsH, 30S
+ ribosomal protein S8, equivalent to O32997|MLCB2492_18 30S
+ RIBOSOMAL PROTEIN S8 from Mycobacterium leprae (132 aa).
+ Also highly similar to others e.g. CAB82084.1|AL161803 30S
+ ribosomal protein S8 from Streptomyces coelicolor (132
+ aa); P33106|RS8_MICLU 30s ribosomal protein S8 from
+ Micrococcus luteus (132 aa), FASTA scores: opt: 669, E():
+ 0, (77.3% identity in 132 aa overlap); etc. Contains
+ PS00053 Ribosomal protein S8 signature. BELONGS TO THE S8P
+ FAMILY OF RIBOSOMAL PROTEINS. Protein product from Mb0739
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0739 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s8 rpsh"
+ /protein_id="SIT99338.1"
+ /db_xref="GOA:P66626"
+ /db_xref="InterPro:IPR000630"
+ /db_xref="InterPro:IPR035987"
+ /db_xref="UniProtKB/Swiss-Prot:P66626"
+ /translation="MTMTDPIADFLTRLRNANSAYHDEVSLPHSKLKANIAQILKNEG
+ YISDFRTEDARVGKSLVIQLKYGPSRERSIAGLRRVSKPGLRVYAKSTNLPRVLGGLG
+ VAIISTSSGLLTDRQAARQGVGGEVLAYVW"
+ gene 815220..815759
+ /gene="rplF"
+ /locus_tag="BQ2027_MB0740"
+ CDS 815220..815759
+ /gene="rplF"
+ /locus_tag="BQ2027_MB0740"
+ /note="Mb0740, rplF, len: 179 aa. Equivalent to Rv0719,
+ len: 179 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 179 aa overlap). Probable rplF, 50S
+ ribosomal protein L6, equivalent to O32998|MLCB2492_19 50S
+ RIBOSOMAL PROTEIN L6 from Mycobacterium leprae (179 aa).
+ Also highly similar to others e.g.
+ P46786|RL6_STRCO|CAB82085.1|AL161803|SCD31.42 50S
+ ribosomal protein L6 from Streptomyces coelicolor (179
+ aa), FASTA scores: opt: 872, E(): 0, (70.4% identity in
+ 179 aa overlap); etc. Contains PS00525 Ribosomal protein
+ L6 signature 1. BELONGS TO THE L6P FAMILY OF RIBOSOMAL
+ PROTEINS. Protein product from Mb0740 detected using
+ shotgun mass spectrometry. Mb0740 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l6 rplf"
+ /protein_id="SIT99339.1"
+ /db_xref="GOA:P66312"
+ /db_xref="InterPro:IPR000702"
+ /db_xref="InterPro:IPR002358"
+ /db_xref="InterPro:IPR019906"
+ /db_xref="InterPro:IPR020040"
+ /db_xref="InterPro:IPR036789"
+ /db_xref="UniProtKB/Swiss-Prot:P66312"
+ /translation="MSRIGKQPIPVPAGVDVTIEGQSISVKGPKGTLGLTVAEPIKVA
+ RNDDGAIVVTRPDDERRNRSLHGLSRTLVSNLVTGVTQGYTTKMEIFGVGYRVQLKGS
+ NLEFALGYSHPVVIEAPEGITFAVQAPTKFTVSGIDKQKVGQIAANIRRLRRPDPYKG
+ KGVRYEGEQIRRKVGKTGK"
+ gene 815762..816130
+ /gene="rplR"
+ /locus_tag="BQ2027_MB0741"
+ CDS 815762..816130
+ /gene="rplR"
+ /locus_tag="BQ2027_MB0741"
+ /note="Mb0741, rplR, len: 122 aa. Equivalent to Rv0720,
+ len: 122 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 122 aa overlap). Probable rplR, 50S
+ ribosomal protein L18, equivalent to
+ O32999|MLCB2492_20|RL18_MYCLE 50S RIBOSOMAL PROTEIN L18
+ from Mycobacterium leprae (122 aa). Also highly similar to
+ others e.g. CAB82086.1|AL161803 50S ribosomal protein L18
+ from Streptomyces coelicolor (127 aa); P33102|RL18_MICLU
+ 50s ribosomal protein L18 from Micrococcus luteus (119
+ aa), FASTA scores: opt: 447, E(): 8.7e-24, (60.4% identity
+ in 111 aa overlap); etc. BELONGS TO THE L18P FAMILY OF
+ RIBOSOMAL PROTEINS. Protein product from Mb0741 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0741 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l18 rplr"
+ /protein_id="SIT99340.1"
+ /db_xref="GOA:P66077"
+ /db_xref="InterPro:IPR004389"
+ /db_xref="InterPro:IPR005484"
+ /db_xref="UniProtKB/Swiss-Prot:P66077"
+ /translation="MAQSVSATRRISRLRRHTRLRKKLSGTAERPRLVVHRSARHIHV
+ QLVNDLNGTTVAAASSIEADVRGVPGDKKARSVRVGQLIAERAKAAGIDTVVFDRGGY
+ TYGGRIAALADAARENGLSF"
+ gene 816150..816812
+ /gene="rpsE"
+ /locus_tag="BQ2027_MB0742"
+ CDS 816150..816812
+ /gene="rpsE"
+ /locus_tag="BQ2027_MB0742"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0742, rpsE, len: 220 aa. Equivalent to Rv0721,
+ len: 220 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 220 aa overlap). Probable rpsE, 30S
+ ribosomal protein S5, equivalent to MLCB2492_21 RIBOSOMAL
+ PROTEIN S5 from Mycobacterium leprae (217 aa). Also highly
+ similar to others e.g. P46790|RS5_STRCO 30s ribosomal
+ protein S5 from Streptomyces coelicolor (167 aa), FASTA
+ scores: opt: 889, E(): 0, (82.1% identity in 162 aa
+ overlap); etc. Note N-terminus is extented compared to
+ other rpsE genes. Contains PS00585 Ribosomal protein S5
+ signature, PTS HPr component phosphorylation sites
+ signature. BELONGS TO THE S5P FAMILY OF RIBOSOMAL
+ PROTEINS. Protein product from Mb0742 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0742 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s5 rpse"
+ /protein_id="SIT99341.1"
+ /db_xref="GOA:P66575"
+ /db_xref="InterPro:IPR000851"
+ /db_xref="InterPro:IPR005324"
+ /db_xref="InterPro:IPR005712"
+ /db_xref="InterPro:IPR013810"
+ /db_xref="InterPro:IPR014721"
+ /db_xref="InterPro:IPR018192"
+ /db_xref="InterPro:IPR020568"
+ /db_xref="UniProtKB/Swiss-Prot:P66575"
+ /translation="MAEQPAGQAGTTDNRDARGDREGRRRDSGRGSRERDGEKSNYLE
+ RVVAINRVSKVVKGGRRFSFTALVIVGDGNGMVGVGYGKAKEVPAAIAKGVEEARKSF
+ FRVPLIGGTITHPVQGEAAAGVVLLRPASPGTGVIAGGAARAVLECAGVHDILAKSLG
+ SDNAINVVHATVAALKLLQRPEEVAARRGLPIEDVAPAGMLKARRKSEALAASVLPDR
+ TI"
+ gene 816815..817012
+ /gene="rpmD"
+ /locus_tag="BQ2027_MB0743"
+ CDS 816815..817012
+ /gene="rpmD"
+ /locus_tag="BQ2027_MB0743"
+ /note="Mb0743, rpmD, len: 65 aa. Equivalent to Rv0722,
+ len: 65 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 65 aa overlap). Probable rpmD, 50S
+ ribosomal protein L30, equivalent to O33001 RIBOSOMAL
+ PROTEIN L30 from Mycobacterium leprae (71 aa). Also highly
+ similar to others e.g. P46789|RL30_STRCO 50S RIBOSOMAL
+ PROTEIN L30 from Streptomyces coelicolor (60 aa);
+ P02430|RL30_ECOLI 50S ribosomal protein L30 from
+ Escherichia coli (58 aa), FASTA scores: opt: 168, E():
+ 1.5e-13, (53.7% identity in 54 aa overlap); etc. BELONGS
+ TO THE L30P FAMILY OF RIBOSOMAL PROTEINS. Protein product
+ from Mb0743 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0743 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l30 rpmd"
+ /protein_id="SIT99342.1"
+ /db_xref="GOA:P66182"
+ /db_xref="InterPro:IPR005996"
+ /db_xref="InterPro:IPR016082"
+ /db_xref="InterPro:IPR018038"
+ /db_xref="InterPro:IPR036919"
+ /db_xref="UniProtKB/Swiss-Prot:P66182"
+ /translation="MSQLKITQVRSTIGARWKQRESLRTLGLRRIRHSVIREDNAATR
+ GLIAVVRHLVEVEPAQTGGKT"
+ gene 817012..817452
+ /gene="rplO"
+ /locus_tag="BQ2027_MB0744"
+ CDS 817012..817452
+ /gene="rplO"
+ /locus_tag="BQ2027_MB0744"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0744, rplO, len: 146 aa. Equivalent to Rv0723,
+ len: 146 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 146 aa overlap). Probable rplO, 50S
+ ribosomal protein L15, equivalent to MLCB2492_23|O33002
+ 50S RIBOSOMAL PROTEIN L15 from Mycobacterium leprae (146
+ aa). Also highly similar to others e.g.
+ P46787|RL15_STRCO|SCD31.46 50S RIBOSOMAL PROTEIN L15 from
+ Streptomyces coelicolor (151 aa); P19946|RL15_BACSU 50s
+ ribosomal protein L15 from Bacillus subtilis (146 aa),
+ FASTA scores: opt: 419, E(): 6.5e-20, (51.0% identity in
+ 145 aa overlap); etc. Contains PS00017 ATP/GTP-binding
+ site motif A (P-loop), and PS00475 Ribosomal protein L15
+ signature. BELONGS TO THE L15P FAMILY OF RIBOSOMAL
+ PROTEINS. Protein product from Mb0744 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0744 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l15 rplo"
+ /protein_id="SIT99343.1"
+ /db_xref="GOA:Q7U1E9"
+ /db_xref="InterPro:IPR001196"
+ /db_xref="InterPro:IPR005749"
+ /db_xref="InterPro:IPR021131"
+ /db_xref="InterPro:IPR030878"
+ /db_xref="InterPro:IPR036227"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1E9"
+ /translation="MTLKLHDLRPARGSKTARTRVGRGDGSKGKTAGRGTKGTRARKQ
+ VPVTFEGGQMPIHMRLPKLKGFRNRFRTEYEIVNVGDINRLFPQGGAVGVDDLVAKGA
+ VRKNALVKVLGDGKLTAKVDVSAHKFSGSARAKITAAGGSATEL"
+ gene 817485..819356
+ /gene="sppA"
+ /locus_tag="BQ2027_MB0745"
+ CDS 817485..819356
+ /gene="sppA"
+ /locus_tag="BQ2027_MB0745"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0745, sppA, len: 623 aa. Equivalent to Rv0724,
+ len: 623 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 623 aa overlap). Possible sppA,
+ protease IV (endopeptidase IV) (EC 3.4.21.-), equivalent
+ (but longer 23 aa) to MLCB2492_24|O33003 ENDOPEPTIDASE IV
+ from Mycobacterium leprae (602 aa). Also similar to others
+ e.g. NP_419743.1|NC_002696 signal peptide peptidase SppA
+ from Caulobacter crescentus (594 aa);
+ P08395|SPPA_ECOLI|B1766 protease IV (endopeptidase) from
+ Escherichia coli strain K-12 (618 aa), FASTA scores: opt:
+ 582, E(): 8.9e-27, (34.1% identity in 525 aa overlap);
+ etc. BELONGS TO PEPTIDASE FAMILY S49. Protein product from
+ Mb0745 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0745 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PROTEASE IV SPPA (ENDOPEPTIDASE IV)
+ (SIGNAL PEPTIDE PEPTIDASE)"
+ /protein_id="SIT99344.1"
+ /db_xref="GOA:A0A1R3XWB3"
+ /db_xref="InterPro:IPR002142"
+ /db_xref="InterPro:IPR004634"
+ /db_xref="InterPro:IPR004635"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWB3"
+ /translation="MPIFGGFCVCSRALGGRWVRWVNMVAFLPSIPVVEDLRALVGRV
+ DTARHHGVPNGCVLEFNLRSVPPETTGFDPLTVLTGGGRPMALRDAVAAIHRAAEDPR
+ VAGLIARVQLPPSPAGAVQELREAIAAFSAVKPSLAWAETYPGTLSYYLASAFGEVWM
+ QPSGSVGLVGFATNATFLRDALHKAGIEAQFVARGEYKSAANLFTEDGFTDAHREAVT
+ RMLDSLQDQVWQAVAKSRNIGVDALDELADRAPLLRDDAVTCGLIDRIGFRDQAYARM
+ AELVGVEKGSPESSGSQTSPDEKPPRMYLARYASSARPRLTPPVPSIPGRRSKPTIAV
+ VTLEGPIVNGRGGPQFLPLGPSSAGGDTIAAALREVAADDSVSAIVLRVDSPGGSVTA
+ SETIWREVARARDRGKPVVASMGAVAASGGYYVSMGADAIVANPGTITGSIGVITGKL
+ VVRDLKDRLGVGSDAVRTNANADAWSIDAPFTPDQQAHREAEADLFYSDFVERVAEGR
+ KMTTDAVDVVARGRVWTGADALDRGLVDELGGLRTAVRRAKVLAGLDEDTEVRIVSYP
+ GSSLWDMVRPRPSSRPAAASLPDAMGALLARSIVGIVEQVEQTLSGASVLWLGESRL"
+ gene complement(819361..820266)
+ /locus_tag="BQ2027_MB0746C"
+ CDS complement(819361..820266)
+ /locus_tag="BQ2027_MB0746C"
+ /note="Mb0746c, -, len: 301 aa. Equivalent to Rv0725c,
+ len: 301 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 301 aa overlap). Conserved
+ hypothetical protein, similar to hypothetical proteins
+ from Mycobacterium tuberculosis e.g. Rv0726c, Rv0731c,
+ Rv3399, etc, e.g. Y893_MYCTU|Q10552|Rv0893C hypothetical
+ 36.1 kd protein cy31.21c (325 aa), FASTA scores: opt: 600,
+ E(): 3.9e-32, (43.8% identity in 219 aa overlap). Mb0746c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="O-methyltransferase"
+ /protein_id="SIT99345.1"
+ /db_xref="GOA:Q7U1E7"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR011610"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1E7"
+ /translation="MPRAHDDNWDLASSVGATATMVAAGRALATKDPRGLINDPFAEP
+ LVRAVGLDFFTKLIDGELDIATTGNLSPGRAQAMIDGIAVRTKYFDDYFRTATDGGVR
+ QVVILAAGLDARAYRLPWPAGTVVYEIDQPQVIDFKTTTLAGIGAKPTAIRRTVYIDL
+ RADWPAALQAAGLDSTAPTAWLAEGMLIYLPPDPRTGCSTTAPNSVLRAARSLPNLSR
+ ALWISTQAGYEKWRIRFASTAWTSTWRRWCIPANAATSSTTCAPRAGTLRAQCGPTYS
+ GAMVCPFPPHTTTIRSAKSSSSAVV"
+ gene complement(820359..821462)
+ /locus_tag="BQ2027_MB0747C"
+ CDS complement(820359..821462)
+ /locus_tag="BQ2027_MB0747C"
+ /note="Mb0747c, -, len: 367 aa. Equivalent to Rv0726c,
+ len: 367 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 367 aa overlap). Conserved
+ hypothetical protein, highly similar to other conserved
+ hypothetical proteins from Mycobacterium tuberculosis e.g.
+ Q10552|Y893_MYCTU|Rv0893c|MT0917|MTCY31.21c (325 aa),
+ FASTA scores: opt: 646, E(): 0, (38.3% identity in 329 aa
+ overlap); Rv0731c|MTV041.05c (318 aa), Rv3399, etc. Also
+ similar to proteins from Mycobacterium leprae and other
+ organisms e.g. T35930 hypothetical protein SC9B5.10 from
+ Streptomyces coelicolor (303 aa). Protein product from
+ Mb0747c detected using SWATH mass spectrometry. Mb0747c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible s-adenosylmethionine-dependent
+ methyltransferase"
+ /protein_id="SIT99346.1"
+ /db_xref="GOA:Q7U1E6"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR011610"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1E6"
+ /translation="MTYTGSIRCEGDTWDLASSVGATATMVAAARAMATRAANPLIND
+ QFAEPLVRAVGVDVLTRLASGELTASDIDDPERPNASMVRMAEHHAVRTKFFDEFFMD
+ ATRAGIRQVVILASGLDSRAYRLAWPAQTVVYEIDQPQVMEFKTRTLAELGATPTADR
+ RVVTADLRADWPTALGAAGFDPTQPTAWSAEGLLRYLPPEAQDRLLDNVTALSVPDSR
+ FATESIRNFKPHHEERMRERMTILANRWRAYGFDLDMNELVYFGDRNEPASYLSDNGW
+ LLTEIKSQDLLTANGFQPFEDEEVPLPDFFYVSARLQRKHRQYPAHRKPAPSWRHTAC
+ PVNELSKSAAYTMTRSDAHQASTTAPPPPGLTG"
+ gene complement(821665..822321)
+ /gene="fucA"
+ /locus_tag="BQ2027_MB0748C"
+ CDS complement(821665..822321)
+ /gene="fucA"
+ /locus_tag="BQ2027_MB0748C"
+ /note="Mb0748c, fucA, len: 218 aa. Equivalent to Rv0727c,
+ len: 218 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 218 aa overlap). Possible fucA,
+ L-fuculose-1-phosphate aldolase (EC 4.1.2.17), similar to
+ many e.g. NP_386339.1|NC_003047 PUTATIVE L-FUCULOSE
+ PHOSPHATE ALDOLASE PROTEIN from Sinorhizobium meliloti
+ (222 aa); P11550|FUCA_ECOLI L-FUCULOSE PHOSPHATE ALDOLASE
+ from Escherichia strain K12 (215 aa), FASTA scores: opt:
+ 372, E(): 4.1e-19, (34.6% identity in 185 aa overlap);
+ etc. BELONGS TO THE ALDOLASE CLASS II FAMILY, ARAD/FUCA
+ SUBFAMILY. COFACTOR: BINDS ONE ZINC ION PER MOLECULE.
+ Protein product from Mb0748c detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE L-FUCULOSE PHOSPHATE ALDOLASE FUCA
+ (L-FUCULOSE-1-PHOSPHATE ALDOLASE)"
+ /protein_id="SIT99347.1"
+ /db_xref="InterPro:IPR001303"
+ /db_xref="InterPro:IPR036409"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWB0"
+ /translation="MNFVDDPESAVLAAAKDMLRRGLVEGTAGNISARRSDGNVVITP
+ SSVDYAEMLLHDLVLVDAGGAVLHAKDGRSPSTELNLHLACYRAFDDIGSVIHSHPVW
+ ATMFAVAHEPIPACIDEFAIYCGGDVRCTEYAASGTPEVGRNAVRALEGRAAALIANH
+ GLVAVGPRPDQVLRVTALVERTAQIVWGARALGGPVPIPEDVCRNFTGVYGYLRANPL
+ "
+ gene complement(822318..823298)
+ /gene="serA2"
+ /locus_tag="BQ2027_MB0749C"
+ CDS complement(822318..823298)
+ /gene="serA2"
+ /locus_tag="BQ2027_MB0749C"
+ /note="Mb0749c, serA2, len: 326 aa. Equivalent to Rv0728c,
+ len: 326 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 326 aa overlap). Possible serA2,
+ D-3-phosphoglycerate dehydrogenase (EC 1.1.1.95), similar
+ to others e.g. AF0278|AF027868_5|YoaD D-3-phosphoglycerate
+ dehydrogenase from Bacillus subtilis (344 aa), FASTA
+ scores: opt: 594, E(): 3.1e-31, (35.9% identity in 309 aa
+ overlap); etc. Also similar to Rv2996c|MTV012.10|SERA1
+ D-3-phosphoglycerate dehydrogenase from Mycobacterium
+ tuberculosis (528 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE D-3-PHOSPHOGLYCERATE DEHYDROGENASE
+ SERA2 (PHOSPHOGLYCERATE DEHYDROGENASE) (PGDH)"
+ /protein_id="SIT99348.1"
+ /db_xref="GOA:A0A1R3XW91"
+ /db_xref="InterPro:IPR006139"
+ /db_xref="InterPro:IPR006140"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW91"
+ /translation="MTPRPRALVTAPLRGPGFAQLRRLADVVYDPWIDQRPLRIYSAE
+ QLADRITAVAADVLVVESDSVGGPVFERGLRVVAATRGDPSNVDIPGATAAGIPVLHT
+ PARNADAVAEMTVALLLAVARHLIPADADVRSGNIFRDGTIPYQRFRGAEIAGLTAGL
+ VGLGAVGRAVRWRLSGLGLRVIAHDPYRDDAGHSLDELLAEADIVSMHAAVTDDTIGM
+ IGAQQFAAMRDGAVFLNTARSQLHDTDALVDALRGGKLAAAGLDHFTGEWLPTDHPLV
+ SMPNVVLTPHIGGATWNTEARQARMVADDLGALLSGNRPAHVVNPEVLGS"
+ gene 823329..824675
+ /gene="xylB"
+ /locus_tag="BQ2027_MB0750"
+ CDS 823329..824675
+ /gene="xylB"
+ /locus_tag="BQ2027_MB0750"
+ /note="Mb0750, xylB, len: 448 aa. Equivalent to Rv0729,
+ len: 448 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 448 aa overlap). Possible xylB,
+ D-xylulose-kinase (xylulokinase) (EC 2.7.1.17). C-terminus
+ highly similar to AAD09880.1|U77912 unknown protein from
+ Mycobacterium bovis (102 aa); and N-terminus highly
+ similar to T45387|Z98756|MLCB2492_25 hypothetical protein
+ from Mycobacterium leprae (110 aa), FASTA scores: opt:
+ 427, E(): 1.1e-19, (60.9% identity in 110 aa overlap).
+ Also similar to xylA/xylB genes from various bacterial
+ species e.g. AAC26499.1|AF045245 D-xylulose-kinase from
+ Klebsiella pneumoniae (487 aa); NP_418021.1|NC_000913
+ xylulokinase from Escherichia coli strain K12 (484 aa),
+ FASTA scores: opt: 260, E(): 7.5e-09, (25.9% identity in
+ 478 aa overlap); etc. Also similar to Rv3696c|glpK
+ PROBABLE GLYCEROL KINASE (EC 2.7.1.30) from Mycobacterium
+ tuberculosis (517 aa). BELONGS TO THE FUCOKINASE /
+ GLUCONOKINASE / GLYCEROKINASE / XYLULOKINASE FAMILY.
+ Protein product from Mb0750 detected using SWATH mass
+ spectrometry. Mb0750 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE D-XYLULOSE KINASE XYLB (XYLULOKINASE)
+ (XYLULOSE KINASE)"
+ /protein_id="SIT99349.1"
+ /db_xref="GOA:A0A1R3XW81"
+ /db_xref="InterPro:IPR000577"
+ /db_xref="InterPro:IPR018484"
+ /db_xref="InterPro:IPR018485"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW81"
+ /translation="MSRDDVTIGIDIGTTAVKAVAADDNGRVTARVRIGHQLAVPAPD
+ RLEHDADEAWRRGPLAALDRLVGPDTRALAVAAMVPSLTAVDPAGRPITPGLLYGDAR
+ GRVPNASVARAQSVPSVGETAEFLRWTAGQAPDASGYWPAPAVANYALSGEAVIDYAT
+ AVTTLPLFDGTGWNATACADCGVTVDRMPRVETFGVGVGQVRGTGAVLAVGAVDALCE
+ QIVAGADRDGDVLVLCGATLIVWTTISAARQVPGLWTIPHTAPGKSQIGGASNAGGLF
+ LNWVDRVIGPGDPALADPRRVPVWLPYIRGERTPFHEPDRRAVLDGVDLSQDAASVRR
+ AAYEASGFVVRQLIELSGAPVARIVAAGGGTRIQPWMQAIADATGRPVEVSRVAEGAA
+ LGAAFLGRLAAGLESSIADAARWASTDRIVEPSADWAGPTKERYRRFLALSGSKLA"
+ gene 824688..825416
+ /locus_tag="BQ2027_MB0751"
+ CDS 824688..825416
+ /locus_tag="BQ2027_MB0751"
+ /note="Mb0751, -, len: 242 aa. Equivalent to Rv0730, len:
+ 242 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 242 aa overlap). Conserved
+ hypothetical protein, only equivalent to
+ Z98756|MLCB2492_26 HYPOTHETICAL PROTEIN from Mycobacterium
+ leprae (227 aa), FASTA scores: opt: 1180, E(): 0, (83.5%
+ identity in 218 aa overlap). Protein product from Mb0751
+ detected using shotgun mass spectrometry. Mb0751 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="gcn5-related n-acetyltransferase"
+ /protein_id="SIT99350.1"
+ /db_xref="GOA:A0A1R3XW83"
+ /db_xref="InterPro:IPR000182"
+ /db_xref="InterPro:IPR013757"
+ /db_xref="InterPro:IPR013760"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW83"
+ /translation="MHGARTGVSFYAYAMTDHDQTAARREIADALLAALERRHEVADA
+ IVEAANKAAAVEAIVNLLGTSHLAAEAVMSMSFDQLTQDARTKIIAELDDLNKQLSFT
+ VKERPASSGEGLELRPFSPDEDRDIFARRTEEMGAAGDGSGGPAGSVDDEIRAAQKRV
+ DDEEAAWFVAVDSGVKVGMVFGELVHGEVDVRIWIHPDHRKKGYGTAALRKSRSEMAW
+ AFPAVPMVARAPAAQPAQPGSAGR"
+ gene complement(825505..826461)
+ /locus_tag="BQ2027_MB0752C"
+ CDS complement(825505..826461)
+ /locus_tag="BQ2027_MB0752C"
+ /note="Mb0752c, -, len: 318 aa. Equivalent to Rv0731c,
+ len: 318 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 318 aa overlap). Conserved
+ hypothetical protein, highly similar to other conserved
+ hypothetical proteins from Mycobacterium tuberculosis e.g.
+ Rv0726c|MTCY210.45c (367 aa), FASTA score: (60.9% identity
+ in 317 aa overlap); Rv3399, Rv1729c, etc. Protein product
+ from Mb0752c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="possible s-adenosylmethionine-dependent
+ methyltransferase"
+ /protein_id="SIT99351.1"
+ /db_xref="GOA:O53795"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR011610"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:O53795"
+ /translation="MTQTGSARFEGDSWDLASSVGLTATMVAAARAVAGRAPGALVND
+ QFAEPLVRAVGVDFFVRMASGELDPDELAEDEANGLRRFADAMAIRTHYFDNFFLDAT
+ RAGIRQAVILASGLDSRAYRLRWPAGTIVFEVDQPQVIDFKTTTLAGLGAAPTTDRRT
+ VAVDLRDDWPTALQKAGFDNAQRTAWIAEGLLGYLSAEAQDRLLDQITAQSVPGSQFA
+ TEVLRDINRLNEEELRGRMRRLAERFRRHGLDLDMSGLVYFGDRTDARTYLADHGWRT
+ ASASTTDLLAEHGLPPIDGDDAPFGEVIYVSAELKQKHQDTR"
+ gene 826622..827947
+ /gene="secY"
+ /locus_tag="BQ2027_MB0753"
+ CDS 826622..827947
+ /gene="secY"
+ /locus_tag="BQ2027_MB0753"
+ /note="Mb0753, secY, len: 441 aa. Equivalent to Rv0732,
+ len: 441 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 441 aa overlap). Probable SecY,
+ preprotein translocase (integral membrane protein),
+ equivalent to NP_302243.1|NC_002677 SecY subunit of
+ preprotein translocase from Mycobacterium leprae (438 aa);
+ AAC04389.1|AF047021 preprotein translocase subunit from
+ Mycobacterium smegmatis (438 aa); and U77912|MBU77912_1
+ preprotein translocase subunit from Mycobacterium bovis
+ (441 aa), FASTA scores: opt: 2802, E(): 0, (99.8% identity
+ in 441 aa overlap). Also highly similar to others e.g.
+ P46785|SECY_STRCO PREPROTEIN TRANSLOCASE SECY SUBUNIT from
+ Streptomyces coelicolor (437 aa); etc. Contains PS00755
+ and PS00756 protein secY signatures 1 and 2. BELONGS TO
+ THE SECE/SEC61-ALPHA FAMILY. PART OF THE PROKARYOTIC
+ PROTEIN TRANSLOCATION APPARATUS WHICH COMPRISE
+ SECA|Rv3240c, SECD|Rv2587c, SECE|Rv0638, SECF|Rv2586c,
+ SECG|Rv1440 AND SECY. Protein product from Mb0753 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0753 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PREPROTEIN TRANSLOCASE SECY"
+ /protein_id="SIT99352.1"
+ /db_xref="GOA:P0A5Z3"
+ /db_xref="InterPro:IPR002208"
+ /db_xref="InterPro:IPR023201"
+ /db_xref="InterPro:IPR026593"
+ /db_xref="InterPro:IPR030659"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Z3"
+ /translation="MLSAFISSLRTVDLRRKILFTLGIVILYRVGAALPSPGVNFPNV
+ QQCIKEASAGEAGQIYSLINLFSGGALLKLTVFAVGVMPYITASIIVQLLTVVIPRFE
+ ELRKEGQAGQSKMTQYTRYLAIALAILQATSIVALAANGGLLQGCSLDIIADQSIFTL
+ VVIVLVMTGGAALVMWMGELITERGIGNGMSLLIFVGIAARIPAEGQSILESRGGVVF
+ TAVCAAALIIIVGVVFVEQGQRRIPVQYAKRMVGRRMYGGTSTYLPLKVNQAGVIPVI
+ FASSLIYIPHLITQLIRSGSGVVGNSWWDKFVGTYLSDPSNLVYIGIYFGLIIFFTYF
+ YVSITFNPDERADEMKKFGGFIPGIRPGRPTADYLRYVLSRITLPGSIYLGVIAVLPN
+ LFLQIGAGGTVQNLPFGGTAVLIMIGVGLDTVKQIESQLMQRNYEGFLK"
+ gene 827944..828489
+ /gene="adk"
+ /locus_tag="BQ2027_MB0754"
+ CDS 827944..828489
+ /gene="adk"
+ /locus_tag="BQ2027_MB0754"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0754, adk, len: 181 aa. Equivalent to Rv0733,
+ len: 181 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 181 aa overlap). Probable adk,
+ adenylate kinase (ATP-AMP transphosphorylase) (EC
+ 2.7.4.3), equivalent to Z98756|MLCB24 92_28 probable
+ adenylate kinase from Mycobacterium leprae (181 aa), FASTA
+ scores: opt: 978, E(): 0, (83.6% identity in 177 aa
+ overlap); and AAF86323.1|AF271342 putative adenylate
+ kinase from Mycobacterium marinum (124 aa) (N-terminus
+ shorter). Also highly similar to others e.g.
+ P43414|KAD_STRCO ADENYLATE KINASE from Streptomyces
+ coelicolor (217 aa), FASTA score: (43.0% identity in 186
+ aa overlap); etc. Contains PS00113 Adenylate kinase
+ signature. BELONGS TO THE ADENYLATE KINASE FAMILY. Protein
+ product from Mb0754 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0754 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="adenylate kinase adk (atp-amp
+ transphosphorylase)"
+ /protein_id="SIT99353.1"
+ /db_xref="GOA:P69439"
+ /db_xref="InterPro:IPR000850"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR033690"
+ /db_xref="UniProtKB/Swiss-Prot:P69439"
+ /translation="MRVLLLGPPGAGKGTQAVKLAEKLGIPQISTGELFRRNIEEGTK
+ LGVEAKRYLDAGDLVPSDLTNELVDDRLNNPDAANGFILDGYPRSVEQAKALHEMLER
+ RGTDIDAVLEFRVSEEVLLERLKGRGRADDTDDVILNRMKVYRDETAPLLEYYRDQLK
+ TVDAVGTMDEVFARALRALGK"
+ gene 828492..829292
+ /gene="mapA"
+ /locus_tag="BQ2027_MB0755"
+ CDS 828492..829292
+ /gene="mapA"
+ /locus_tag="BQ2027_MB0755"
+ /note="Mb0755, mapA, len: 266 aa. Equivalent to Rv0734,
+ len: 266 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 266 aa overlap). Probable mapA,
+ methionine aminopeptidase (map) (EC 3.4.11.18), equivalent
+ to Z98756|MLCB2492_29 probable methionine aminopeptidase
+ from Mycobacterium leprae (266 aa), FASTA scores: opt:
+ 1717, E(): 0, (83.4% identity in 265 aa overlap). Also
+ highly similar to many e.g. T35553 methionine
+ aminopeptidase from Streptomyces coelicolor (278 aa); etc.
+ Also similar to Rv2861c|MAPB PROBABLE METHIONINE
+ AMINOPEPTIDASE from Mycobacterium tuberculosis (285 aa).
+ BELONGS TO PEPTIDASE FAMILY M24A; ALSO KNOWN AS THE MAP
+ FAMILY 1. COFACTOR: COBALT; BINDS 2 IONS PER SUBUNIT.
+ Protein product from Mb0755 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0755 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="methionine aminopeptidase mapa (map) (peptidase
+ m) (metap)"
+ /protein_id="SIT99354.1"
+ /db_xref="GOA:A0A1R3XWC1"
+ /db_xref="InterPro:IPR000994"
+ /db_xref="InterPro:IPR001714"
+ /db_xref="InterPro:IPR002467"
+ /db_xref="InterPro:IPR036005"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWC1"
+ /translation="MRPLARLRGRRVVPQRSAGELDAMAAAGAVVAAALRAIRAAAAP
+ GTSSLSLDEIAESVIRESGATPSFLGYHGYPASICASINDRVVHGIPSTAEVLAPGDL
+ VSIDCGAVLDGWHGDAAITFGVGALSDADEALSEATRESLQAGIAAMVVGNRLTDVAH
+ AIETGTRAAELRYGRSFGIVAGYGGHGIGRQMHMDPFLPNEGAPGRGPLLAAGSVLAI
+ EPMLTLGTTKTVVLDDKWTVTTADGSRAAHWEHTVAVTDDGPRILTLG"
+ gene 829365..829898
+ /gene="sigL"
+ /locus_tag="BQ2027_MB0756"
+ CDS 829365..829898
+ /gene="sigL"
+ /locus_tag="BQ2027_MB0756"
+ /note="Mb0756, sigL, len: 177 aa. Equivalent to Rv0735,
+ len: 177 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 177 aa overlap). Probable sigL,
+ alternative RNA polymerase sigma factor (rpoE) (see
+ citation below), highly similar to many proteins of the
+ extracytoplasmatic function (ECF) subfamily e.g.
+ CAB72200.1|AL138851 putative RNA polymerase sigma factor
+ from Streptomyces coelicolor (194 aa); Q06909|CARQ_MYXXA
+ RNA POLYMERASE SIGMA FACTOR CARQ from Myxococcus xanthus
+ (174 aa), FASTA scores: opt: 251, E(): 9.6e-11, (32.9%
+ identity in 161 aa overlap); etc. Also similar to
+ MTCI61_4, MTU87242_1, and MLU15180_30 from Mycobacterium
+ tuberculosis. Contains PS01063 Sigma-70 factors ECF
+ subfamily signature and probable helix-turn helix motif
+ from aa 139-160 (Score 1134, +3.05 SD). BELONGS TO THE
+ SIGMA-70 FACTOR FAMILY, ECF SUBFAMILY. Mb0756 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ALTERNATIVE RNA POLYMERASE SIGMA FACTOR
+ SIGL"
+ /protein_id="SIT99355.1"
+ /db_xref="GOA:A0A1R3XWN4"
+ /db_xref="InterPro:IPR000838"
+ /db_xref="InterPro:IPR007627"
+ /db_xref="InterPro:IPR007630"
+ /db_xref="InterPro:IPR013324"
+ /db_xref="InterPro:IPR013325"
+ /db_xref="InterPro:IPR014284"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039425"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWN4"
+ /translation="MARVSGAAAAEAALMRALYDEHAAVLWRYALRLTGDAAQAEDVV
+ QETLLRAWQHPEVIGDTARPARAWLFTVARNMIIDERRSARFRNVVGSTDQSGTPEQS
+ TPDEVNAALDRLLIADALAQLSAEHRAVIQRSYYRGWSTAQIATDLGIAEGTVKSRLH
+ YAVRALRLTLQELGVTR"
+ gene 829962..830714
+ /gene="rsla"
+ /locus_tag="BQ2027_MB0757"
+ CDS 829962..830714
+ /gene="rsla"
+ /locus_tag="BQ2027_MB0757"
+ /note="Mb0757, -, len: 250 aa. Equivalent to Rv0736, len:
+ 250 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 250 aa overlap). Probable conserved
+ membrane protein, showing weak similarity with
+ AL133469|SCM10_32 putative membrane protein from
+ Streptomyces coelicolor (216 aa), FASTA scores: opt: 180,
+ E(): 0.00018, (34.3% identity in 216 aa overlap). Mb0757
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="anti-sigma factor rsla"
+ /protein_id="SIT99356.1"
+ /db_xref="GOA:A0A1R3XW87"
+ /db_xref="InterPro:IPR027383"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW87"
+ /translation="MTMPLRGLGPPDDTGVREVSTGDDHHYAMWDAAYVLGALSAADR
+ REFEAHLAGCPECRGAVTELCGVPALLSQLDRDEVAAISESAPTVVASGLSPELLPSL
+ LAAVHRRRRRTRLITWVASSAAAAVLAIGVLVGVQGHSAAPQRAAVSALPMAQVGTQL
+ LASTVSISGEPWGTFINLRCVCLAPPYASHDTLAMVVVGRDGSQTRLATWLAEPGHTA
+ TPAGSISTPVDQIAAVQVVAADTGQVLLQRSL"
+ gene 831029..831526
+ /locus_tag="BQ2027_MB0758"
+ CDS 831029..831526
+ /locus_tag="BQ2027_MB0758"
+ /note="Mb0758, -, len: 165 aa. Equivalent to Rv0737, len:
+ 165 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 165 aa overlap). Possible
+ transcriptional regulator, similar to others e.g.
+ BAB69161.1|AB070937 regulator protein from Streptomyces
+ avermitilis (169 aa); NP_419731.1|NC_002696
+ transcriptional regulator MarR family from Caulobacter
+ crescentus (148 aa) (homology only at C-terminus); etc.
+ Also shows weak similarity to AB0014|AB001488_14
+ hypothetical protein from Bacillus subtilis (164 aa),
+ FASTA scores: opt: 163, E(): 9.3e-05, (32.8% identity in
+ 116 aa overlap), which is similar to slyY gene of S.
+ typhimurium required for survival in macrophage. Contains
+ possible helix-turn helix motif from aa 73-94 (Score 1138,
+ +3.06 SD). Protein product from Mb0758 detected using
+ SWATH mass spectrometry. Mb0758 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99357.1"
+ /db_xref="GOA:A0A1R3XWB9"
+ /db_xref="InterPro:IPR000835"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWB9"
+ /translation="MASDNRDPIAAARANWERSGWGDVSLGMVAVTSVMRAHQILLAR
+ VETALRPYDLSFSRFELLRLLAFSRIGALPITKASDRLQVHVTSVTHAIRRLEADGLV
+ RRVPHPTDGRTTLVQITELGRSTVEDATVTLNEQVFANVGMGAEESQALVSAVETLRR
+ NAGDF"
+ gene 831884..832432
+ /locus_tag="BQ2027_MB0759"
+ CDS 831884..832432
+ /locus_tag="BQ2027_MB0759"
+ /note="Mb0759, -, len: 182 aa. Equivalent to Rv0738, len:
+ 182 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 182 aa overlap). Conserved
+ hypothetical protein, showing weak similarity with
+ hypothetical proteins from Mycobacterium tuberculosis:
+ Rv1727|MTCY04C12.12 (189 aa); MTY13D12_7|Z80343
+ hypothetical protein from Mycobacterium tuberculosis (194
+ aa), FASTA scores: opt: 172, E(): 0.0004, (24.2% identity
+ in 178 aa overlap); and C-terminus of Rv0576. Protein
+ product from Mb0759 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0759 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99358.1"
+ /db_xref="GOA:A0A1R3XW99"
+ /db_xref="InterPro:IPR017517"
+ /db_xref="InterPro:IPR017520"
+ /db_xref="InterPro:IPR024344"
+ /db_xref="InterPro:IPR034660"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW99"
+ /translation="MDPLMAHQRAQDAFAALLANVRADQLGGPTPCSEWTINDLIEHV
+ VGGNEQVGRWAASPIEPPARPDGLVAAHQAAAAVAHEIFAAPGGMSATFKLPLGEVPG
+ QVFIGLRTTDVLTHAWDLAAATGQSTDLDPELAVERLAAARALVGPQFRGPGKPFADE
+ KPCPRERPPADQLAAFLGRTVR"
+ gene 832637..833485
+ /locus_tag="BQ2027_MB0760"
+ CDS 832637..833485
+ /locus_tag="BQ2027_MB0760"
+ /note="Mb0760, -, len: 282 aa. Equivalent to Rv0739, len:
+ 268 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 263 aa overlap). Conserved hypothetical
+ protein, showing some similarity to Mycobacterium
+ tuberculosis proteins Rv0026 (448 aa), FASTA score: (37.6%
+ identity in 101 aa overlap)and Rv0025 (120 aa), FASTA
+ score: (32.4% identity in 142 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a 2
+ bp insertion (*-cg) leads to a longer product compared to
+ its homolog in Mycobacterium tuberculosis strain H37Rv
+ (282 aa versus 268 aa). Mb0760 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99359.1"
+ /db_xref="InterPro:IPR019710"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW88"
+ /translation="MSDYSLGVPDETGLGADAARAREVALTQHIGVSAETDRAVVPKL
+ RQAYDSLVCGRRRLGAIGAEIENAVAHQRALGLDTPAGARNFSRFLATKAHDITRVLA
+ ATAAESQAGAARLRSLASSYQAVGFGPKPQEPPPDPVPFPPYQPKVWAACRARGQDPD
+ KVVRTFHHAPMSARFRSLPAGDSVLYCGNDKYGLLHIQAKHGRQWHDIADARWPSAGN
+ WRYLADYAIGATLAYPERVEYNQDNDTFAVYRRVSLPDGRYVFTTRVIISARDGKIIT
+ AFPQTT"
+ gene 833600..834127
+ /locus_tag="BQ2027_MB0761"
+ CDS 833600..834127
+ /locus_tag="BQ2027_MB0761"
+ /note="Mb0761, -, len: 175 aa. Equivalent to Rv0740, len:
+ 175 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 175 aa overlap). Conserved
+ hypothetical protein; C-terminus (possibly part of
+ truncated IS1557) shows nearly perfect identity to
+ Rv0750|MTV041_24 (81 aa), FASTA score: (92.6% identity in
+ 81 aa overlap). Also shows weak similarity to MTV007_5
+ hypothetical protein from Mycobacterium tuberculosis (313
+ aa), FASTA score: (34.5% identity in 110 aa overlap); and
+ MLCL536_27 hypothetical protein from Mycobacterium leprae
+ (315 aa), FASTA score: (34.5% identity in 84 aa overlap).
+ Protein product from Mb0761 detected using SWATH mass
+ spectrometry. Mb0761 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99360.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW86"
+ /translation="MLPKNTRPTSETAEEFWDNSLWCSWGDRETGYTRTVTVSICQVA
+ DGEREAEGVRDMMRLECPAGLDLRTPNPEAYEITGQRPGEFVFVLGYLGHVRAIVGNC
+ YIEIMPMGTRVELSKLADVALDIGRSVGCSAYENDFTLPDIPTQWRNQPLGWYTQGLA
+ PYLPGLSDPKDAAEG"
+ gene 834176..834692
+ /locus_tag="BQ2027_IS1557'-1"
+ mobile_element 834176..834692
+ /locus_tag="BQ2027_IS1557'-1"
+ /note="IS1557'-1, len: 517 nt. Equivalent to IS1557', len:
+ 517 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(100.0% identity in 517 nt overlap). Region similar
+ to IS1557 region on MTCY373- (IS1557- 1st copy)."
+ /mobile_element_type="insertion sequence:IS1557"
+ gene 834358..834672
+ /locus_tag="BQ2027_MB0762"
+ CDS 834358..834672
+ /locus_tag="BQ2027_MB0762"
+ /note="Mb0762, -, len: 104 aa. Equivalent to Rv0741, len:
+ 104 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 104 aa overlap). Probable truncated
+ transposase for IS1557, showing similarity to transposases
+ and IS elements e.g. U63997|EFU63997_1 insertion sequence
+ from Enterococcus faecium (424 aa), FASTA score: (31.0%
+ identity in 87 aa overlap). Very high similarity with the
+ C-terminal part of Z73419|MTCY373_3 2 IS1557 from
+ Mycobacterium tuberculosis (444 aa), FASTA score: (86.5%
+ identity in 104 aa overlap). Mb0762 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transposase (fragment)"
+ /protein_id="SIT99361.1"
+ /db_xref="InterPro:IPR002560"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW94"
+ /translation="MFSVKGEEGKQALDRWISWARRCRIPVFVELAGGIVRHRQAIDA
+ ALDHGLWQGLIESTNTKIRLLTRIAFGFRSPEALIALAMLALGGRRPALPGRTKHPRI
+ SQ"
+ gene 834814..835332
+ /gene="PE_PGRS8"
+ /locus_tag="BQ2027_MB0763"
+ CDS 834814..835332
+ /gene="PE_PGRS8"
+ /locus_tag="BQ2027_MB0763"
+ /note="Mb0763, PE_PGRS8, len: 172 aa. Equivalent to
+ Rv0742, len: 172 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 172 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, similar to many M.
+ tuberculosis PGRS-type proteins e.g. Z78020|MTCY1A11_25
+ (498 aa), FASTA scores: opt: 766, E(): 6.1e-25, (73.6%
+ identity in 178 aa overlap). Similarity suggests ORF
+ starts with ATA start codon. Mb0763 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs8"
+ /protein_id="SIT99362.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYE7"
+ /translation="MIAAPEAIAAAATDLASIGSTIGAANAAAAANTTAVLAAGADQV
+ SVAIAAAFGAHGQAYQALSAQAATFHIQFVQALTAGAGSYAAAEAASAASITSPLLDA
+ INAPFLAALGRPLIGNGADGAPGTGAAGGAGGLLFGNGGAGGSGAPGGAGGLLFGNGG
+ AGGPGASGGALG"
+ gene complement(835710..836267)
+ /locus_tag="BQ2027_MB0764C"
+ CDS complement(835710..836267)
+ /locus_tag="BQ2027_MB0764C"
+ /note="Mb0764c, -, len: 185 aa. Equivalent to Rv0743c,
+ len: 185 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 185 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0764c detected using SWATH
+ mass spectrometry. Mb0764c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99363.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXA2"
+ /translation="MTRQQLAHLLRRACAVVGDVDVLVLGSQSILGSFDENELPPQAT
+ ASQEADIAFVNDPARDKADHVDVAIGEMSDFHRSNGVYAEGVHIDTAILPNGWRDRLV
+ SWTVESSRPAKPRFLEPHDLAVAKLAAGREKDKAFVAALIRSGLLDVGVIQARVLLLP
+ EETDPRIGQRIAAWLNYYGAGNHSS"
+ gene complement(836264..836770)
+ /locus_tag="BQ2027_MB0765C"
+ CDS complement(836264..836770)
+ /locus_tag="BQ2027_MB0765C"
+ /note="Mb0765c, -, len: 168 aa. Equivalent to Rv0744c,
+ len: 168 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 168 aa overlap). Possible
+ transcriptional regulator, showing weak similarity with
+ O86661|SC4A2.05 PUTATIVE TWO-COMPONENT SENSOR from
+ Streptomyces coelicolor (436 aa), FASTA scores: opt: 117,
+ E(): 0.88, (37.25% identity in 94 aa overlap); and some
+ putative excisionases or transposases. Also weakly similar
+ to P71902|YN10_MYCTU|Rv2310|MT2372|MTCY3G12.24c CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (114
+ aa); and Q11144|Y477_MYCTU|Rv0477|MT0495|MTCY20G9.03
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium
+ tuberculosis (148 aa). Equivalent to AAK45006 from
+ Mycobacterium tuberculosis strain CDC1551 (179 aa) but
+ shorter 11 aa. Contains probable helix-turn helix motif
+ from aa 5-26 (Score 1350, +3.78 SD). Mb0765c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99364.1"
+ /db_xref="GOA:A0A1R3XWC8"
+ /db_xref="InterPro:IPR009061"
+ /db_xref="InterPro:IPR010093"
+ /db_xref="InterPro:IPR041657"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWC8"
+ /translation="METLLKTSEAAQILGVSRQHVVNMCDRGEMVCVHVGSHRRVPSS
+ EVERVTSRRLTREEERSLWLHRALLSPLLTEPDTVVSAARENLRRWSGMHRRDGMAGW
+ YFTKWQRVLNDGLDAVMHVLTSPSEDAREMRQNSPFAGILPEATRVAVLRSFKDHWDR
+ EHERAMTE"
+ gene 836978..837505
+ /locus_tag="BQ2027_MB0766"
+ CDS 836978..837505
+ /locus_tag="BQ2027_MB0766"
+ /note="Mb0766, -, len: 175 aa. Equivalent to Rv0745, len:
+ 175 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 175 aa overlap). Conserved
+ hypothetical protein; shows high similarity to a 50 aa
+ region of Rv3649|Z95436|MTY15C10_3 CONSERVED HYPOTHETICAL
+ PROTEIN, similar to ATP-dependent helicases, from
+ Mycobacterium tuberculosis (771 aa), FASTA scores: opt:
+ 225, E(): 7e-06, (70.0% identity in 50 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99365.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWP4"
+ /translation="MGPPHRSRPPLPSPGPTCQVLPTTAVIHTVTAEALGRIGIDAPR
+ IPGSLDVAAHAAIGLLPLVAGCDRRHRRPVRGARAGRAAQVSLCMTAIRVEPVSSNAV
+ CTGPAAQVGDQSRSPQRDYAHQALQPDVPRRRARRHRPRRCSAKTGSSSSTMRCTCHQ
+ NQCLWSSGVSWALAR"
+ gene 837525..839918
+ /gene="PE_PGRS9"
+ /locus_tag="BQ2027_MB0767"
+ CDS 837525..839918
+ /gene="PE_PGRS9"
+ /locus_tag="BQ2027_MB0767"
+ /note="Mb0767, PE_PGRS9, len: 797 aa. Equivalent to
+ Rv0746, len: 783 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (89.7% identity in 829 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to part of
+ MTCY28.25c|Rv1759c|Z95890 antigen wag22 from M.
+ tuberculosis (914 aa), FASTA scores: opt: 2429, E(): 0,
+ (56.9% identity in 873 aa overlap). Also similar to other
+ PE-PGRS FAMILY PROTEINS e.g. AL0212|MTV008_46 FASTA score:
+ (48.8% identity in 887 aa overlap); etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, two
+ 48 bp deletions, and a 138 bp insertion leads to a longer
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (797 aa versus 783 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs9"
+ /protein_id="SIT99366.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW92"
+ /translation="MSFVLAMPEVLGSAATDLAALGSVLGAADAAAAATTTGIVAAVQ
+ DEVSAAIAALFSAHGRAYQVASAQAAAVHAQFVEALSAGAGAYASAEAAGAAVLANPA
+ QSVQQDLLAAVNAQSVALTGRPLIGNGANGAPGTGANGAPGGWLLGNGGAGGSAAAGS
+ GLPGGAGGAAGLFGTGGAGGAGGSSTVGDGGAGGAGGSGGWLLGTGGVGGVGGLGAGA
+ GGAGGVGGAGGLLGAGGHGGAGGLGAVTGGVGGAGGAGGLLAGLLAGPGGAGGTGGRG
+ FLNDGGVGGAGGNAGLLFGAGGTGGSGGAGLGGDGGAGGAGGNAGVLFGNAGSGGTGG
+ FGDTDGGAGGAGGDAGWLGSGGVGGAGGFGETGDGGVGGAGGKAGLLIGNGGAGGAGV
+ LIGNGGNAGIGGTGPTAGDTGAGGISGLLLGADGFNAPASASPLHTLKQQALAAINAP
+ TQTLTGRPLIGNGTPGAVGSGATGAPGGWLLGDGGAGGSGAAGSGAPGGAGGAAGLWG
+ TGGAGGAGGWLLGDGGAGGIGGASTVLGGTGGGGGVGGLWGAGGAGGAGGTGLVGGDG
+ GAGGAGGTGGLLAGLIGAGGGHGGTGGLNTNGDGGVGGAGGNAGMLAGPGGAGGAGGD
+ GENLDTGGDGGAGGSAGLLFGSGGAGGAGGFGFLGGDGGAGGNAGLLLSSGGAGGFGG
+ FGTAGGVGGAGGNAGWLGFGGAGGIGGIGGNANGGAGGNGGTGGQLWGSGGAGGEGGA
+ ALSVGDTGGAGGVGGSAGLIGTGGNGGNGGTGANAGSPGTGGAGGLLLGQNGLNGLP"
+ gene 840317..843046
+ /gene="PE_PGRS10"
+ /locus_tag="BQ2027_MB0768"
+ CDS 840317..843046
+ /gene="PE_PGRS10"
+ /locus_tag="BQ2027_MB0768"
+ /note="Mb0768, PE_PGRS10, len: 909 aa. Equivalent to
+ Rv0747, len: 801 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (86.6% identity in 912 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to part of
+ MTCY28.25c|Rv1759c|Z95890 antigen wag22 from M.
+ tuberculosis (914 aa), FASTA scores: opt: 2772, E(): 0,
+ (60.9% identity in 941 aa overlap). Also similar to other
+ PE-PGRS FAMILY PROTEINS e.g. Z95844|MTCY493_2 FASTA score:
+ (50.2% identity in 815 aa overlap). Contains PS00012
+ Phosphopantetheine attachment site.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis,
+ insertions of 168 bp and 105 bp, a 11 bp for 71 bp
+ substitution, and a 9 bp deletion (cggcaacgg-*), leads to
+ a longer product compared to the homolog in Mycobacterium
+ tuberculosis strain H37Rv (909 aa versus 801 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs10"
+ /protein_id="SIT99367.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWC7"
+ /translation="MSWVMVSPELVVAAAADLAGIGSAISSANAAAAVNTTGLLTAGA
+ DEVSTAIAALFGAQGQAYQAASAQAAAFYAQFVQALSAGGGAYAAAEAAAVSPLLAPI
+ NAQFVAATGRPLIGNGANGAPGTGANGGPGGWLIGNGGAGGSGAPGAGAGGNGGAGGL
+ FGSGGAGGAGGNAFGAGEVGGAGGAGGNAMLFGAGGAGGAGGAGGNAGMLFGAAGVGG
+ VGGFSNGGATGGAGGAGGAGGLFTTGGVGGAGGAGGDGGDGGAGGLFGAGGTGGAGGF
+ GTAVLAGTGGAGGPGGAGGLFGAGGEGGSGGSGNLTGGAGGAGGNAGTLATGDGGAGG
+ TGGASRSGGFGGAGGAGGDAGMFFGSGGSGGAGGAGGSGGFGLPSGGKGGAGGDAGML
+ FGSGGSGGAGGISRSVGDGAAGGAGGAPGLIGNGGNGGNGGASTGGGDGGPGGAGGTG
+ VLIGNGGSGGTGATLGKAGIGGTGGVLLGLDGFTAPASTSPLHTLQQDVINMVNDPFQ
+ TLTGRPLIGNGANGTPGTGADGGAGGWLFGNGGNGGQGTIGGVNGGAGGAGGAGGILF
+ GTGGTGGSGGPGATGLGGIGGAGGAALLFGSGGAGGSGGAGAVGGNGGAGGNAGALLG
+ AAGAGGAGGAGAVGGNGGAGGNGGLFANGGAGGPGGFGSPAGAGGIGGAGGNGGLFGA
+ GGTGGAGGGSTLAGGAGGAGGNGGLFGAGGTGGAGSHSTAAGVSGGAGGAGGDAGLLS
+ LGASGGAGGSGGSSLTAAGVVGGIGGAGGLLFGSGGAGGSGGFSNSGNGGAGGAGGDA
+ GLLVGSGGAGGAGASATGAATGGDGGAGGKSGAFGLGGDGGAGGATGLSGAFHIGGKG
+ GVGGSAVLIGNGGNGGNGGNSGNAGKSGGAPGPSGAGGAGGLLLGENGLNGLM"
+ gene 843137..843394
+ /gene="vapb31"
+ /locus_tag="BQ2027_MB0769"
+ CDS 843137..843394
+ /gene="vapb31"
+ /locus_tag="BQ2027_MB0769"
+ /note="Mb0769, -, len: 85 aa. Equivalent to Rv0748, len:
+ 85 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 85 aa overlap). Conserved hypothetical
+ protein, N-terminus similar to N-terminal region of
+ NP_436939.1|NC_003078 HYPOTHETICAL PROTEIN from
+ Sinorhizobium meliloti (75 aa). Also similar to
+ Mycobacterium tuberculosis proteins Rv2871 CONSERVED
+ HYPOTHETICAL PROTEIN (75 aa); Rv1241, Rv2132, Rv3321c,
+ etc. Protein product from Mb0769 detected using SWATH mass
+ spectrometry. Mb0769 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb31"
+ /protein_id="SIT99368.1"
+ /db_xref="GOA:A0A1R3XWA8"
+ /db_xref="InterPro:IPR002145"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWA8"
+ /translation="MRTTVSISDEILAAAKRRARERGQSLGAVIEDALRREFAAAHVG
+ GARPTVPVFDGGTGPRRGIDLTSNRALSEVLDEGLELNSRK"
+ gene 843418..843846
+ /gene="vapc31"
+ /locus_tag="BQ2027_MB0770"
+ CDS 843418..843846
+ /gene="vapc31"
+ /locus_tag="BQ2027_MB0770"
+ /note="Mb0770, -, len: 142 aa. Equivalent to Rv0749, len:
+ 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 142 aa overlap). Conserved
+ hypothetical protein, similar to other hypothetical
+ proteins from Mycobacterium tuberculosis e.g. Rv0749,
+ Rv0277c, Rv2530c, etc. Mb0770 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc31. contains pin domain."
+ /protein_id="SIT99369.1"
+ /db_xref="GOA:A0A1R3XWA0"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR006226"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWA0"
+ /translation="MFLLDANVLLAAHRGDHPNHRTVRPWFDRLLAADDPFTVPNLVW
+ ASFLRLATNRRIFEIPSPRAEAFAFVEAVTAQPHHLPTNPGPRHLMLLRKLCDEADAS
+ GDLIPDAVLAAIAVGHHCAVVSLDRDFARFASVRHIRPPL"
+ gene complement(843927..844064)
+ /locus_tag="BQ2027_MB0771C"
+ CDS complement(843927..844064)
+ /locus_tag="BQ2027_MB0771C"
+ /note="Mb0771c, -, len: 45 aa. Equivalent to Rv0749A, len:
+ 45 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 45 aa overlap). Conserved hypothetical
+ protein (probably gene fragment), similar to part (aa
+ 250-292) of Rv2807|Z81331_12 from Mycobacterium
+ tuberculosis (384 aa), FASTA scores: opt: 238, E():
+ 1.9e-13, (79.07% identity in 43 aa overlap). Mb0771c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein involved in DNA integration"
+ /protein_id="SIT99370.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWA1"
+ /translation="MVRKHAFHWRYDSTEELELLNQLWQLVSLRLNFFTPTKKALGFR
+ P"
+ gene 844223..844468
+ /locus_tag="BQ2027_MB0772"
+ CDS 844223..844468
+ /locus_tag="BQ2027_MB0772"
+ /note="Mb0772, -, len: 81 aa. Equivalent to Rv0750, len:
+ 81 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 81 aa overlap). Conserved hypothetical
+ protein, showing almost perfect overlap with C-terminus of
+ Rv0740|MTV041_14 CONSERVED HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (175 aa), FASTA scores: (93.8%
+ identity in 81 aa overlap). Possible duplication. Mb0772
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99371.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW98"
+ /translation="MRAIVGDCVIHIMPMGTGVELSKLADLALDIGRSVGCSAYENDF
+ TLPDIPTQWRNQPLGWYTQGLAPYLPGLSDPKDAAEG"
+ gene complement(844537..845421)
+ /gene="mmsB"
+ /locus_tag="BQ2027_MB0773C"
+ CDS complement(844537..845421)
+ /gene="mmsB"
+ /locus_tag="BQ2027_MB0773C"
+ /note="Mb0773c, mmsB, len: 294 aa. Equivalent to Rv0751c,
+ len: 294 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 294 aa overlap). Probable mmsB,
+ 3-hydroxyisobutyrate dehydrogenase (EC 1.1.1.31), highly
+ similar to others e.g. NP_102847.1|NC_002678
+ 3-hydroxyisobutyrate dehydrogenase from Mesorhizobium loti
+ (294 aa); NP_420167.1|NC_002696 3-hydroxyisobutyrate
+ dehydrogenase from Caulobacter crescentus (298 aa); A32867
+ 3-hydroxyisobutyrate dehydrogenase from Rattus norvegicus
+ (346 aa); etc. Also similar to methylmalonate semialdehyde
+ dehydrogenases e.g. M84911|PSE MMSRAB_3 methylmalonate
+ semialdehyde dehydrogenase from Pseudomonas aeruginosa
+ (298 aa), FASTA scores: opt: 786, E(): 0, (45.8% identity
+ in 297 aa overlap). Also similar to 6-phosphogluconate
+ dehydrogenases from Mycobacterium tuberculosis e.g. Rv1122
+ and Rv1844c. Contains PS00895 3-hydroxyisobutyrate
+ dehydrogenase signature. BELONGS TO THE
+ 3-HYDROXYISOBUTYRATE DEHYDROGENASE FAMILY. Protein product
+ from Mb0773c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0773c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 3-HYDROXYISOBUTYRATE DEHYDROGENASE MMSB
+ (HIBADH)"
+ /protein_id="SIT99372.1"
+ /db_xref="GOA:P63936"
+ /db_xref="InterPro:IPR002204"
+ /db_xref="InterPro:IPR006115"
+ /db_xref="InterPro:IPR008927"
+ /db_xref="InterPro:IPR011548"
+ /db_xref="InterPro:IPR013328"
+ /db_xref="InterPro:IPR015815"
+ /db_xref="InterPro:IPR029154"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P63936"
+ /translation="MTTIAFLGLGNMGAPMSANLVGAGHVVRGFDPAPTAASGAAAHG
+ VAVFRSAPEAVAEADVVITMLPTGEVVRRCYTDVLAAARPATLFIDSSTISVTDAREV
+ HALAESHGMLQLDAPVSGGVKGAAAATLAFMVGGDESTLRRARPVLEPMAGKIIHCGA
+ AGAGQAAKVCNNMVLAVQQIAIAEAFVLAEKLGLSAQSLFDVITGATGNCWAVHTNCP
+ VPGPVPTSPANNDFKPGFSTALMNKDLGLAMDAVAATGATAPLGSHAADIYAKFAADH
+ ADLDFSAVIHTLRARADA"
+ gene complement(845432..846604)
+ /gene="fadE9"
+ /locus_tag="BQ2027_MB0774C"
+ CDS complement(845432..846604)
+ /gene="fadE9"
+ /locus_tag="BQ2027_MB0774C"
+ /note="Mb0774c, fadE9, len: 390 aa. Equivalent to Rv0752c,
+ len: 390 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 390 aa overlap). Probable fadE9,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), highly similar to
+ many e.g. NP_437985.1|NC_003078 putative acyl-CoA
+ dehydrogenase protein from Sinorhizobium meliloti (380
+ aa); Z99123|BSUB0020_14 from Bacillus subtilis (379 aa),
+ FASTA scores: opt: 853, E(): 0, (39.8% identity in 384 aa
+ overlap); etc. Contains PS00072 Acyl-CoA dehydrogenases
+ signature 1, and PS00073 Acyl-Co Adehydrogenases signature
+ 2. BELONGS TO THE ACYL-COA DEHYDROGENASES FAMILY. Protein
+ product from Mb0774c detected using SWATH mass
+ spectrometry. Mb0774c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE9"
+ /protein_id="SIT99373.1"
+ /db_xref="GOA:A0A1R3XXB2"
+ /db_xref="InterPro:IPR006089"
+ /db_xref="InterPro:IPR006091"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR013786"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR037069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXB2"
+ /translation="MFVLNDDERVIVETAAAFAGKRLAPHALEWDAAKHFPVDVLREA
+ AELGMAAIYCRDDVGGSGLRRLDGARIFEQLAIADPVTAAFLSIHNMCAWMIDSFGTD
+ EQRKDWIPRLATMGVIASYCLTEPGAGSDAGALSTRAVRHGSGKGGDYVLDGVKQFIS
+ GAAASDVYVVMARTGAEGPRGVSAFVVEKGTPGLSFGAPEAKMGWHAQPTAQVVLDGV
+ RVPAEAMLGGADGEGAGFGIAMSGLNGGRLNIAACSLGGAQAAFDKAGAYVRDRQAFG
+ GSLLDEPTVRFTLADMATGLQTSRMLLWRAASALDDDDADKVELCAMAKRYVTDTCFE
+ VADQALQLHGGYGYLREYGLEKIVRDLRVHRILEGTNEIMRLVIGRAEAARFRATV"
+ gene complement(846611..848143)
+ /gene="mmsA"
+ /locus_tag="BQ2027_MB0775C"
+ CDS complement(846611..848143)
+ /gene="mmsA"
+ /locus_tag="BQ2027_MB0775C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0775c, mmsA, len: 510 aa. Equivalent to Rv0753c,
+ len: 510 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 510 aa overlap). Probable mmsA,
+ methylmalonic acid semialdehyde dehydrogenase (EC
+ 1.2.1.27), highly similar to others e.g.
+ NP_420115.1|NC_002696 putative methylmalonate-semialdehyde
+ dehydrogenase from Caulobacter crescentus (499 aa);
+ L48550|STMMSDA_1|CAB75315.1|AL139164 methylmalonic acid
+ semialdehyde dehydrogenase from Streptomyces coelicolor
+ (500 aa), FASTA score: (51.6% identity in 498 aa overlap);
+ M84911|PSEMMSRAB_2|NP_252260.1|NC_002516
+ methylmalonate-semialdehyde dehydrogenase from Pseudomonas
+ aeruginosa (497 aa), FASTA scores: opt: 1127, E(): 0,
+ (47.9% identity in 507 aa overlap); etc. Note that also
+ highly similar to malonic semialdehyde oxidative
+ decarboxylases e.g. NP_104968.1|NC_002678 malonic
+ semialdehyde oxidative decarboxylase from Mesorhizobium
+ loti (498 aa); NP_384832.1|NC_003047 PUTATIVE MALONIC
+ SEMIALDEHYDE OXIDATIVE DECARBOXYLASE PROTEIN from
+ Sinorhizobium meliloti (498 aa); etc. Contains PS00070
+ Aldehyde dehydrogenases cysteine active site. BELONGS TO
+ THE ALDEHYDE DEHYDROGENASES FAMILY. Protein product from
+ Mb0775c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0775c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METHYLMALONATE-SEMIALDEHYDE
+ DEHYDROGENASE MMSA (METHYLMALONIC ACID SEMIALDEHYDE
+ DEHYDROGENASE) (MMSDH)"
+ /protein_id="SIT99374.1"
+ /db_xref="GOA:A0A1R3XWE3"
+ /db_xref="InterPro:IPR010061"
+ /db_xref="InterPro:IPR015590"
+ /db_xref="InterPro:IPR016160"
+ /db_xref="InterPro:IPR016161"
+ /db_xref="InterPro:IPR016162"
+ /db_xref="InterPro:IPR016163"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWE3"
+ /translation="MTTQISHFIDGQRTAGQSTRSADVFDPNTGQIQAKVPMAGKSDI
+ DAAVASAVEAQKGWAAWNPQRRARVLMRFIELVNDTIDELAELLSREHGKTLADARGD
+ VQRGIEVIEFCLGIPHLLKGEYTEGAGPGIDVYSLRQPLGVVAGITPFNFPAMIPLWK
+ AGPALACGNAFVLKPSERDPSVPVRLAELFIEAGLPAGVFQVVHGDKEAVDAILHHPD
+ IKAVGFVGSSDIAQYIYAGAAATGKRAQCFGGAKNHMIVMPDADLDQAVDALIGAGYG
+ SAGERCMAISVAVPVGDQTAERLRARLIERINNLRVGHSLDPKADYGPLVTGAALARV
+ RDYIGQGVAAGAELVVDGRDRASDDLTFGLPEGDANLEGGFFIGPTLFDHVAAHMSIY
+ TDEIFGPVLCMVRARDYEEALRLPSEHEYGNGVAIFTRDGDAARDFVSRGQVGMVGVN
+ VPIPVPVAYHTFGGWKRSGFGDLNQHGPAAIQFYTKVKTVTSRWPSGIKDGAEFVIPT
+ MS"
+ gene 848349..850103
+ /gene="PE_PGRS11"
+ /locus_tag="BQ2027_MB0776"
+ CDS 848349..850103
+ /gene="PE_PGRS11"
+ /locus_tag="BQ2027_MB0776"
+ /note="Mb0776, PE_PGRS11, len: 584 aa. Equivalent to
+ Rv0754, len: 584 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 584 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, similar to others e.g.
+ AL0212|MTV008_46 from Mycobacterium tuberculosis (1660
+ aa), FASTA score: (48.7% identity in 345 aa overlap);
+ Z80225|MTCY441_4 from Mycobacterium tuberculosis (778 aa),
+ FASTA score: (41.6% identity in 442 aa overlap); etc.
+ Mb0776 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs11"
+ /protein_id="SIT99375.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="InterPro:IPR013078"
+ /db_xref="InterPro:IPR029033"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWQ3"
+ /translation="MSFVIVARDALAAAAADLAQIGSAVNAGNLAAANPTTAVAAAAA
+ DEVSAALAALFGAHAREYQAAAAQAAAYHEQFVHRLSAAATSYAVTEVTIATSLRGAL
+ GSAPASVSDGFQAFVYGPIHATGQQWINSPVGEALAPIVNAPTNVLLGRDLIGNGVTG
+ TAAAPNGGPGGLLFGDGGAGYTGGNGGSAGLIGNGGTGGAGFAGGVGGMGGTGGWLMG
+ NGGMGGAGGVGGNGGAGGQALLFGNGGLGGAGGAGGVDGAIGRGGWFIGTGGMATIGG
+ GGNGQSIVIDFVRHGQTPGNAAMLIDTAVPGPGLTALGQQQAQAIANALAAKGPYAGI
+ FDSQLIRTQQTAAPLANLLGMAPQVLPGLNEIHAGIFEDLPQISPAGLLYLVGPIAWT
+ LGFPIVPMLAPGSTDVNGIVFNRAFTGAVQTIYDASLANPVVAADGNITSVAYSSAFT
+ IGVGTMMNVDNPHPLLLLTHPVPNTGAVVVQGNPEGGWTLVSWDGIPVGPASLPTALF
+ VDVRELITAPQYAAYDIWESLFTGDPAAVINAVRDGADEVGAAVVQFPHAVADDVIDA
+ TGHPYLSGLPIGLPSLIP"
+ gene complement(850293..852230)
+ /gene="PPE12"
+ /locus_tag="BQ2027_MB0777C"
+ CDS complement(850293..852230)
+ /gene="PPE12"
+ /locus_tag="BQ2027_MB0777C"
+ /note="Mb0777c, PPE12, len: 645 aa. Equivalent to Rv0755c,
+ len: 645 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 645 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family, highly similar to
+ others e.g. Z82098|MTCY3C7_23 from Mycobacterium
+ tuberculosis (582 aa), FASTA scores: (56.1% identity in
+ 636 aa overlap); Z92774|MTCY6G11_5 from Mycobacterium
+ tuberculosis (552 aa), FASTA scores: (55.8% identity in
+ 590 aa overlap); etc. Mb0777c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe12"
+ /protein_id="SIT99376.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR002989"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XW96"
+ /translation="MVGFAWLPPETNSLRMYLGAGSRPLLAAAGAWDGLAEELHAAAS
+ SFGSVTSELAGGAWQGPASAAMANAAGPYASWLTAAGAQAELAARQARAAAGAFEEAL
+ AGVVHPAVVQANRVRTWLLAVSNVFGQNAPAIAAMESTYEQMWAQDVAVMAGYHAASS
+ AAAAQLASWQPALPNINLGVGNIGNLNVGNGNTGDYNLGNGNLGNANFGGGNGSAFHG
+ QISSFNVGSGNIGNFNLGSGNGNVGIGPSSFNVGSGNIGNANVGGGNSGDNNFGFGNF
+ GNANIGIGNAGPNMSSPAVPTPGNGNVGIGNGGNGNFGGGNTGNANIGLGNVGDGNVG
+ FGNSGSYNFGFGNTGNNNIGIGLTGSNQIGFGGLNSGSGNIGFGNSGTGNIGFFNSGS
+ GNFGVGNSGVTNTGVANSGNINTGFGNSGFINTGFGNALSVNTGFGNSGQANTGIGNA
+ GDFNTGNFNGGIINTGSFNSGAFNSGSFNGGDANSGFLNSGLTNTGFANSGNINTGGF
+ NAGNLNTGFGNTTDGLGENSGFGNAGSGNSGFNNSGKGNSGAQNVGNLQISGFANSGQ
+ SVTGYNNSVSVTSGFGNKGTGLFSGFMSGFGNTGFLQSGFGNLEANPDNNSATSGFGN
+ SGKQDSGGFNSIDFVSGFFHR"
+ gene complement(852532..852717)
+ /locus_tag="BQ2027_MB0778C"
+ CDS complement(852532..852717)
+ /locus_tag="BQ2027_MB0778C"
+ /note="Mb0778c, -, len: 61 aa. Equivalent to Rv0755A, len:
+ 61 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 61 aa overlap). Putative transposase
+ (possibly gene fragment), similar to C-terminal part of
+ Q9EZM2|ISMav2|AF286339_1 putative transposase from
+ Mycobacterium paratuberculosis (395 aa), FASTA scores:
+ opt: 284, E(): 5e-13, (83.02% identity in 53 aa overlap);
+ and to SCJ11.25c|Q9RI80 possible noncomposite transposon
+ transposase from Streptomyces coelicolor (283 aa). Mb0778c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE TRANSPOSASE (FRAGMENT)"
+ /protein_id="SIT99377.1"
+ /db_xref="GOA:A0A1R3XWD0"
+ /db_xref="InterPro:IPR010921"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWD0"
+ /translation="MKELSVAEQRYQAVLAVISDGLSISQVAEKVGVSRQTLHTWLAR
+ YEAEGLDGLRIGTGTAL"
+ gene complement(852826..852897)
+ /locus_tag="BQ2027_THRV"
+ tRNA complement(852826..852897)
+ /locus_tag="BQ2027_THRV"
+ /product="tRNA-Thr"
+ /note="thrV, len: 72 nt. Equivalent to thrV, len: 72 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 72 nt overlap). tRNA-Thr, anticodon tgt."
+ gene complement(852931..853656)
+ /locus_tag="BQ2027_MB0779C"
+ CDS complement(852931..853656)
+ /locus_tag="BQ2027_MB0779C"
+ /note="Mb0779c, -, len: 241 aa. Equivalent to Rv0756c,
+ len: 241 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 241 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0779c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0779c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIT99378.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWB4"
+ /translation="MNLGQTLVGIATWPARAGLAAADTGLNMAGAAVDMAKQALGDAG
+ GASGSTSMANMLGIDDTIARANRLARLLDDDMPLGRAIAPNGPMDRMLRPGGVVDLLT
+ QPGGLLDRLTAEGGAMQRALQPGGLADQLLAEDGLIERVLSEDGLADRLLAEGGLIDK
+ ITAKDGPLEQLADVADTLARLTPGMEALEPAIATLQDAVIALTMVVNPLSSIAERIPL
+ PGRRPARRSSSRSVRSQRVVDSE"
+ gene 853798..854541
+ /gene="phoP"
+ /locus_tag="BQ2027_MB0780"
+ CDS 853798..854541
+ /gene="phoP"
+ /locus_tag="BQ2027_MB0780"
+ /note="Mb0780, phoP, len: 247 aa. Equivalent to Rv0757,
+ len: 247 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 247 aa overlap). Possible phoP, two
+ component system response phosphate regulon
+ transcriptional regulator, highly similar to various
+ transcriptional regulators e.g. CAC32360.1|AL583945
+ putative two component system response regulator from
+ Streptomyces coelicolor (271 aa); T45446 probable
+ two-component response regulator from Mycobacterium leprae
+ (253 aa); and similar to phoP proteins e.g.
+ P13792|PHOP_BACSU alkaline phosphatase synthesis
+ transcription regulatory protein from Bacillus subtilis
+ (240 aa), FASTA scores: opt: 594, E(): 2.3e-33, (41.0%
+ identity in 234 aa overlap); etc. Also highly similar to
+ Rv3765c from Mycobacterium tuberculosis (234 aa), Rv1033c
+ (257 aa), RV0903c|MTCY31.31c|Q10531 (236 aa), FASTA score:
+ (45.4% identity in 229 aa overlap); MTCY10G2_16 and
+ MTU88959_1. Protein product from Mb0780 detected using
+ shotgun mass spectrometry. Mb0780 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TWO COMPONENT SYSTEM RESPONSE
+ TRANSCRIPTIONAL POSITIVE REGULATOR PHOP"
+ /protein_id="SIT99379.1"
+ /db_xref="GOA:A0A1R3XWA9"
+ /db_xref="InterPro:IPR001789"
+ /db_xref="InterPro:IPR001867"
+ /db_xref="InterPro:IPR011006"
+ /db_xref="InterPro:IPR016032"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039420"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWA9"
+ /translation="MRKGVDLVTAGTPGENTTPEARVLVVDDEANIVELLSVSLKFQG
+ FEVYTATNGAQALDRARETRPDAVILDVMMPGMDGFGVLRRLRADGIDAPALFLTARD
+ SLQDKIAGLTLGGDDYVTKPFSLEEVVARLRVILRRAGKGNKEPRNVRLTFADIELDE
+ ETHEVWKAGQPVSLSPTEFTLLRYFVINAGTVLSKPKILDHVWRYDFGGDVNVVESYV
+ SYLRRKIDTGEKRLLHTLRGVGYVLREPR"
+ gene 854586..856043
+ /gene="phoR"
+ /locus_tag="BQ2027_MB0781"
+ CDS 854586..856043
+ /gene="phoR"
+ /locus_tag="BQ2027_MB0781"
+ /note="Mb0781, phoR, len: 485 aa. Equivalent to Rv0758,
+ len: 485 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 485 aa overlap). Possible phoR, two
+ component system response phosphate sensor kinase
+ membrane-associated (EC 2.7.-.-), highly similar to
+ various sensor kinases e.g. CAC32361.1|AL583945 putative
+ two component system histidine kinase from Streptomyces
+ coelicolor (524 aa); NP_349365.1|NC_003030
+ Membrane-associated sensory histidine kinase with HAMP
+ domain from Clostridium acetobutylicum (482 aa); and
+ similar to phoP proteins e.g. NP_372216.1|NC_002758
+ alkaline phosphatase synthesis sensor protein from
+ Staphylococcus aureus (554 aa); P23545|PHOR_BACSU alkaline
+ phosphatase synthesis sensor from Bacillus subtilis (579
+ aa), FASTA scores: opt: 515, E(): 1.9e-25, (40.0% identity
+ in 230 aa overlap); etc. Also similar to proteins from
+ Mycobacterium tuberculosis e.g. MTCY20G9.16 FASTA scores:
+ (34.5% identity in 264 aa overlap), MTU88959_2 (509 aa),
+ MTCY10G2_17, etc. Protein product from Mb0781 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0781 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TWO COMPONENT SYSTEM RESPONSE SENSOR
+ KINASE MEMBRANE ASSOCIATED PHOR"
+ /protein_id="SIT99380.1"
+ /db_xref="GOA:A0A1R3XWC2"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR003660"
+ /db_xref="InterPro:IPR003661"
+ /db_xref="InterPro:IPR004358"
+ /db_xref="InterPro:IPR005467"
+ /db_xref="InterPro:IPR036097"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWC2"
+ /translation="MARHLRGRLPLRVRLVAATLILVATGLVASGIAVTSMLQHRLTS
+ RIDRVLLEEAQIWAQITLPLAPDPYPIHNPDRPPSRFYVRVISPDGQSYTALNDNTAI
+ PAVPANNDVGRHPTTLPSIGGSKTLWRAVSVRASDGYLTTVAIDLADVRSTVRSLVLL
+ QVGIGSAVLVVLGVAGYAVVRRSLRPLAEFEQTAAAIGAGQLDRRVPQWHPRTEVGRL
+ SLALNGMLAQIQRAVASAESSAEKARDSEDRMRQFITDASHELRTPLTTIRGFAELYR
+ QGAARDVGMLLSRIESEASRMGLLVDDLLLLARLDAHRPLELCRVDLLALASDAAHDA
+ RAMDPKRRITLEVLDGPGTPEVLGDESRLRQVLRNLVANAIQHTPESADVTVRVGTEG
+ DDAILEVADDGPGMSQEDALRVFERFYRADSSRARASGGTGLGLSIVDSLVAAHGGAV
+ TVTTALGEGCCFRVSLPRVSDVDQLSLTPVVPGPP"
+ gene complement(856015..856347)
+ /locus_tag="BQ2027_MB0782C"
+ CDS complement(856015..856347)
+ /locus_tag="BQ2027_MB0782C"
+ /note="Mb0782c, -, len: 110 aa. Equivalent to Rv0759c,
+ len: 110 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 110 aa overlap). Conserved
+ hypothetical protein, highly similar (but shorter 45 aa in
+ N-terminus) to P49774|YHIT_MYCLE|ML2237|MLCB5.04c|U296A
+ HYPOTHETICAL HIT-LIKE PROTEIN from Mycobacterium leprae
+ (155 aa), FASTA scores: opt: 766, E(): 0, (78.7% identity
+ in 150 aa overlap). Also highly similar (but N-terminus
+ always shorter) to HIT-like proteins and protein kinase
+ inhibitors e.g. AAF72728.1|AF265258_1|AF265258 HIT-like
+ protein from Rhodococcus sp. (141 aa);
+ NP_212513.1|NC_001318 protein kinase C1 inhibitor (pkcI)
+ from Borrelia burgdorferi (149 aa);
+ P94252|YHIT_BORBU|BB0379 HYPOTHETICAL HIT-LIKE PROTEIN
+ from Borrelia burgdorferi (139 aa); NP_110768.1|NC_002689
+ HIT (histidine triad) family protein from Thermoplasma
+ volcanium (158 aa); P16436|IPK1_BOVIN protein kinase C
+ inhibitor 1 (pkci-1) from Bos taurus (Bovine) (125 aa),
+ FASTA scores: opt: 195, E(): 5.2e-08, (33.3% identity in
+ 111 aa overlap); etc. Also shows similarity with
+ Rv2613c|MTCY01A10.20A CONSERVED HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (195 aa) and Rv1262c|MTCY50.20
+ HYPOTHETICAL HIT-LIKE PROTEIN (144 aa). Protein product
+ from Mb0782c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0782c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HIT family protein"
+ /protein_id="SIT99381.1"
+ /db_xref="GOA:P0A5B6"
+ /db_xref="InterPro:IPR001310"
+ /db_xref="InterPro:IPR011146"
+ /db_xref="InterPro:IPR019808"
+ /db_xref="InterPro:IPR036265"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5B6"
+ /translation="MAFLTIEPMTQGHTLVVPRAEIDHWQNVDPALFGRVMSVSQLIG
+ KAVCRAFSTQRAGMIIAGLEVPHLHIHVFPTRSLSDFGFANVDRNPSPGSLDEAQAKI
+ RAALAQLA"
+ gene complement(856456..856875)
+ /locus_tag="BQ2027_MB0783C"
+ CDS complement(856456..856875)
+ /locus_tag="BQ2027_MB0783C"
+ /note="Mb0783c, -, len: 139 aa. Equivalent to Rv0760c,
+ len: 139 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 139 aa overlap). Conserved
+ hypothetical protein, similar to N-terminal part of
+ Rv2042c CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium
+ tuberculosis (265 aa), FASTA scores: opt: 150, E():
+ 4.1e-05, (28.7% identity in 136 aa overlap). Protein
+ product from Mb0783c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0783c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Nuclear transport factor 2"
+ /protein_id="SIT99382.1"
+ /db_xref="InterPro:IPR002075"
+ /db_xref="InterPro:IPR032710"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYG6"
+ /translation="MTQTTQSPALIASQSSWRCVQAHDREGWLALMADDVVIEDPIGK
+ SVTNPDGSGIKGKEAVGAFFDTHIAANRLTVTCEETFPSSSPDEIAHILVLHSEFDGG
+ FTSEVRGVFTYRVNKAGLITNMRGYWNLDMMTFGNQE"
+ gene complement(856888..858015)
+ /gene="adhB"
+ /locus_tag="BQ2027_MB0784C"
+ CDS complement(856888..858015)
+ /gene="adhB"
+ /locus_tag="BQ2027_MB0784C"
+ /note="Mb0784c, adhB, len: 375 aa. Equivalent to Rv0761c,
+ len: 375 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 375 aa overlap). Possible adhB,
+ zinc-containing alcohol dehydrogenase NAD-dependant (EC
+ 1.1.1.1), similar to others e.g. AAC15839.1|AF060871_4
+ hypothetical alcohol dehydrogenase from Rhodococcus
+ rhodochrous (370 aa), FASTA scores: opt: 1234, E(): 0,
+ (46.8% identity in 370 aa overlap); P80468|ADH2_STRCA
+ ALCOHOL DEHYDROGENASE II from Struthio camelus (Ostrich)
+ (379 aa); Q03505|ADH1_RABIT alcohol dehydrogenase alpha
+ chain from Oryctolagus cuniculus (Rabbit) (374 aa), FASTA
+ scores: opt: 872, E(): 0, (39.1% identity in 379 aa
+ overlap); etc. Also similar to adhD alcohol dehydrogenase
+ from Mycobacterium tuberculosis (368 aa). Contains PS00059
+ Zinc-containing alcohol dehydrogenases signature. BELONGS
+ TO THE ZINC-CONTAINING ALCOHOL DEHYDROGENASE FAMILY.
+ Protein product from Mb0784c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0784c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible zinc-containing alcohol dehydrogenase
+ nad dependent adhb"
+ /protein_id="SIT99383.1"
+ /db_xref="GOA:Q7U1B9"
+ /db_xref="InterPro:IPR002328"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013149"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR020843"
+ /db_xref="InterPro:IPR023921"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U1B9"
+ /translation="MKTKGALIWEFNQPWSVEEIEIGDPRKDEVKIQMEAAGMCRSDH
+ HLVTGDIPMAGFPVLGGHEGAGIVTEVGPGVDDFAPGDHVVLAFIPSCGKCPSCQAGM
+ RNLCDLGAGLLAGESVTDGSFRIQARGQNVYPMTLLGTFSPYMVVHRSSVVKIDPSVP
+ FEVACLVGCGVTTGYGSAVRTADVRPGDDVAIVGLGGVGMAALQGAVSAGARYVFAVE
+ PVEWKRDQALKFGATHVYPDINAALMGIAEVTYGLMAQKVIITVGKLDGADVDSYLTI
+ TAKGGTCVLTAIGSLVDTQVTLNLAMLTLLQKNIQGTIFGGGNPHYDIPKLLSMYKAG
+ KLNLDDMVTTAYKLEQINDGYQDMLNGKNIRGVIRYTDDDR"
+ gene complement(858114..858659)
+ /locus_tag="BQ2027_MB0785C"
+ CDS complement(858114..858659)
+ /locus_tag="BQ2027_MB0785C"
+ /note="Mb0785c, -, len: 181 aa. Equivalent to Rv0762c,
+ len: 181 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 181 aa overlap). Conserved
+ hypothetical protein, showing weak similarity to
+ D90907_77|P73575 HYPOTHETICAL 31.3KD PROTEIN from
+ Synechocystis sp, FASTA scores: E(): 0.0012, (30.4%
+ identity in 92 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). Mb0785c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="intracellular transport"
+ /protein_id="SIT99384.1"
+ /db_xref="InterPro:IPR032710"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWE9"
+ /translation="MAGYPRDELEDVVHRWLQANRTAERRGDWTLLADFYTDDATYGW
+ NVGPNEDVMCVGIDEIRDIALGQEMDGLQGWRYPYQRVVIDEKQGEVVGFWKQVATDA
+ NGAEQEVYGIGGSWFRYAGGGKWNWQRDFFDFGHVSALYLELIKAGKLSPGMQKRIER
+ AVSGNKVPGYYPLGKTPVPLW"
+ gene complement(858662..858868)
+ /locus_tag="BQ2027_MB0786C"
+ CDS complement(858662..858868)
+ /locus_tag="BQ2027_MB0786C"
+ /note="Mb0786c, -, len: 68 aa. Equivalent to Rv0763c, len:
+ 68 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 68 aa overlap). Possible ferredoxin,
+ similar to others and related proteins e.g.
+ P18324|FER1_STRGO|SUAB ferredoxin 1 (fd-1) from
+ Streptomyces griseolus (68 aa);
+ AAK31349.1|AF350429_2|AF350429 putative ferredoxin from
+ Nocardioides sp (63 aa); AAK16536.1|AF331043_16|AF331043
+ phthalate dioxygenase ferredoxin subunit from Arthrobacter
+ keyseri (64 aa); etc. Probably involved in electron
+ transport for cytochrome P-450 system e.g. downstream ORF
+ Rv0764c|MTCY369.09c PROBABLE CYTOCHROME P450 51 from
+ Mycobacterium tuberculosis (451 aa), FASTA scores: opt:
+ 137, E(): 0.00013, (36.4% identity in 66 aa overlap). Also
+ similar to putative ferredoxins Rv3503c and Rv1786 from
+ Mycobacterium tuberculosis. COULD BELONG TO THE BACTERIAL
+ TYPE FERREDOXIN FAMILY."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE FERREDOXIN"
+ /protein_id="SIT99385.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWR1"
+ /translation="MGYRVEADRDLCQGHAMCELEAPEYFRVPKRGQVEILDPEPPEE
+ ARGVIKHAVWACPTQALSIRETGE"
+ gene complement(858871..860226)
+ /gene="cyp51"
+ /locus_tag="BQ2027_MB0787C"
+ CDS complement(858871..860226)
+ /gene="cyp51"
+ /locus_tag="BQ2027_MB0787C"
+ /note="Mb0787c, cyp51, len: 451 aa. Equivalent to Rv0764c,
+ len: 451 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 451 aa overlap). cyp51, cytochrome
+ P450 51 (sterol 14-alpha demethylase) (EC 1.14.14.-),
+ similar to others e.g. Q16850|CP51_HUMAN CYTOCHROME P450
+ 51 (CYPL1) (P450L1) (STEROL 14-ALPHA DEMETHYLASE)
+ (LANOSTEROL 14-ALPHA DEMETHYLASE) from Homo sapiens (509
+ aa), FASTA scores: opt: 848, E(): 0, (33.9% identity in
+ 439 aa overlap); NP_172633.1|NC_003070 putative
+ obtusifoliol 14-alpha demethylase from Arabidopsis
+ thaliana (488 aa); P93596|CP51_WHEAT CYTOCHROME P450 51
+ (CYPL1) (P450-L1A1) (OBTUSIFOLIOL 14-ALPHA DEMETHYLASE)
+ from Triticum aestivum (453 aa); etc. Also similar to many
+ other Mycobacterium tuberculosis cytochromes P450 e.g.
+ Rv1394c, FASTA score: (22.5% identity in 444 aa overlap).
+ Contains PS00086 Cytochrome P450 cysteine heme-iron ligand
+ signature. BELONGS TO THE CYTOCHROME P450 FAMILY. Protein
+ product from Mb0787c detected using SWATH mass
+ spectrometry. Mb0787c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CYTOCHROME P450 51 CYP51 (CYPL1) (P450-L1A1)
+ (STEROL 14-ALPHA DEMETHYLASE) (LANOSTEROL 14-ALPHA
+ DEMETHYLASE) (P450-14DM)"
+ /protein_id="SIT99386.1"
+ /db_xref="GOA:P0A513"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002403"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/Swiss-Prot:P0A513"
+ /translation="MSAVALPRVSGGHDEHGHLEEFRTDPIGLMQRVRDECGDVGTFQ
+ LAGKQVVLLSGSHANEFFFRAGDDDLDQAKAYPFMTPIFGEGVVFDASPERRKEMLHN
+ AALRGEQMKGHAATIEDQVRRMIADWGEAGEIDLLDFFAELTIYTSSACLIGKKFRDQ
+ LDGRFAKLYHELERGTDPLAYVDPYLPIESFRRRDEARNGLVALVADIMNGRIANPPT
+ DKSDRDMLDVLIAVKAETGTPRFSADEITGMFISMMFAGHHTSSGTASWTLIELMRHR
+ DAYAAVIDELDELYGDGRSVSFHALRQIPQLENVLKETLRLHPPLIILMRVAKGEFEV
+ QGHRIHEGDLVAASPAISNRIPEDFPDPHDFVPARYEQPRQEDLLNRWTWIPFGAGRH
+ RCVGAAFAIMQIKAIFSVLLREYEFEMAQPPESYRNDHSKMVVQLAQPACVRYRRRTG
+ V"
+ gene complement(860226..861053)
+ /locus_tag="BQ2027_MB0788C"
+ CDS complement(860226..861053)
+ /locus_tag="BQ2027_MB0788C"
+ /note="Mb0788c, -, len: 275 aa. Equivalent to Rv0765c,
+ len: 275 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 275 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), similar others e.g.
+ P39071|DHBA_BACSU 2,3-dihydro-2,3-dihydroxybenzoate
+ dehydrogenase from Bacillus subtilis (261 aa), FASTA
+ scores: opt: 385, E(): 1.8e-17, (30.6% identity in 252 aa
+ overlap); AAF81239.1|AF263012 putative beta-ketoacyl
+ reductase from Streptomyces griseus (274 aa);
+ NP_436514.1|NC_003037 putative oxidoreductase from
+ Sinorhizobium meliloti (240 aa); etc. Also similar to
+ several other oxidoreductases from Mycobacterium
+ tuberculosis e.g. Rv1544|MTCY48.21, FASTA score: (32.6%
+ identity in 267 aa overlap); etc. Contains PS00061
+ Short-chain alcohol dehydrogenase family signature.
+ Protein product from Mb0788c detected using SWATH mass
+ spectrometry. Mb0788c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="SIT99387.1"
+ /db_xref="GOA:A0A1R3XWE2"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWE2"
+ /translation="MPRFEPHPARRTTVVAGASSGIGAATATELAGRGFPVALGARRM
+ DKLAELVDKIRADGGEAVAFPLDVTDPESVKSFVAQTVEALGEVELLVSSAGDMLPGQ
+ LHEVSTEAFAEQVQIHLVGANRLATAVLPAMVARRRGDLIFVGSDVGLRQRPHMGAYG
+ AAKAGLAAMVTNLQMELEGTGVRASIVHPGPTLTGMGWQLSAEQVGPMLADWAKWGQA
+ RHNYFLRPSDLARAIAFVAETPRGCVVVNMEIQPEAPLRDAPAHRQKLVLGEEGMPG"
+ gene complement(861053..862261)
+ /gene="cyp123"
+ /locus_tag="BQ2027_MB0789C"
+ CDS complement(861053..862261)
+ /gene="cyp123"
+ /locus_tag="BQ2027_MB0789C"
+ /note="Mb0789c, cyp123, len: 402 aa. Equivalent to
+ Rv0766c, len: 402 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 402 aa overlap).
+ Probable cyp123, cytochrome P-450 (EC 1.14.-.-), similar
+ to others e.g. P33271|CPXK_SACER cytochrome P-450 107B1
+ from Saccharopolyspora erythraea (405 aa), FASTA scores:
+ opt: 770, E(): 0, (36.9% identity in 406 aa overlap);
+ T36526 probable cytochrome P450 hydroxylase from
+ Streptomyces coelicolor (411 aa); P27632|CPXM_BACSU
+ CYTOCHROME P450 109 from Bacillus subtilis (405 aa); etc.
+ Also similar to several other cytochromes P-450 from
+ Mycobacterium tuberculosis e.g. Rv1256c|MTCY50.26 (405
+ aa), FASTA score: (35.2% identity in 389 aa overlap); etc.
+ Contains PS00086 Cytochrome P450 cysteine heme-iron ligand
+ signature. BELONGS TO THE CYTOCHROME P450 FAMILY. Protein
+ product from Mb0789c detected using SWATH mass
+ spectrometry. Mb0789c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CYTOCHROME P450 123 CYP123"
+ /protein_id="SIT99388.1"
+ /db_xref="GOA:P63708"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002397"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/Swiss-Prot:P63708"
+ /translation="MTVRVGDPELVLDPYDYDFHEDPYPYYRRLRDEAPLYRNEERNF
+ WAVSRHHDVLQGFRDSTALSNAYGVSLDPSSRTSEAYRVMSMLAMDDPAHLRMRTLVS
+ KGFTPRRIRELEPQVLELARIHLDSALQTESFDFVAEFAGKLPMDVISELIGVPDTDR
+ ARIRALADAVLHREDGVADVPPPAMAASIELMRYYADLIAEFRRRPANNLTSALLAAE
+ LDGDRLSDQEIMAFLFLMVIAGNETTTKLLANAVYWAAHHPGQLARVFADHSRIPMWV
+ EETLRYDTSSQILARTVAHDLTLYDTTIPEGEVLLLLPGSANRDDRVFDDPDDYRIGR
+ EIGCKLVSFGSGAHFCLGAHLARMEARVALGALLRRIRNYEVDDDNVVRVHSSNVRGF
+ AHLPISVQAR"
+ gene complement(862258..862899)
+ /locus_tag="BQ2027_MB0790C"
+ CDS complement(862258..862899)
+ /locus_tag="BQ2027_MB0790C"
+ /note="Mb0790c, -, len: 213 aa. Equivalent to Rv0767c,
+ len: 213 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 213 aa overlap). Conserved
+ hypothetical protein, showing weak similarity with
+ AL133220|SCC75A_26 HYPOTHETICAL PROTEIN from Streptomyces
+ coelicolor (215 aa), FASTA scores: opt: 152, E(): 0.0048,
+ (28.4% identity in 204 aa overlap). Protein product from
+ Mb0790c detected using SWATH mass spectrometry. Mb0790c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, AcrR family"
+ /protein_id="SIT99389.1"
+ /db_xref="GOA:P67433"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR023772"
+ /db_xref="UniProtKB/Swiss-Prot:P67433"
+ /translation="MSSDVLVTTPAQRQTEPHAEAVSRNRRQQATFRKVLAAAMATLR
+ EKSYADLTVRLVAARAKVAPATAYTYFSSKNHLIAEVYLDLVRQVPCVTDVNVPMPIR
+ VTSSLRHLALVVADEPEIGAACTAALLDGGADPAVRAVRDRIGAEIHRRITSAIGPGA
+ DPGTVFALEMAFFGALVQAGSGTFTYHEIADRLGYVVGLILAGANEPSTGGSE"
+ gene 863101..864570
+ /gene="aldA"
+ /locus_tag="BQ2027_MB0791"
+ CDS 863101..864570
+ /gene="aldA"
+ /locus_tag="BQ2027_MB0791"
+ /note="Mb0791, aldA, len: 489 aa. Equivalent to Rv0768,
+ len: 489 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 489 aa overlap). Probable aldA,
+ NAD-dependent aldehyde dehydrogenase (EC 1.2.1.-), highly
+ similar to others e.g. AAL14238.1|AY052630 6-oxolauric
+ acid dehydrogenase from Rhodococcus ruber (474 aa);
+ NP_285450.1|NC_001264 aldehyde dehydrogenase from
+ Deinococcus radiodurans (495 aa); NP_241405.1|NC_002570
+ NADP-dependent aldehyde dehydrogenase from Bacillus
+ halodurans (498 aa); P42757|DHAB_ATRHO betaine-aldehyde
+ dehydrogenase precursor from Atriplex hortensis (Mountain
+ spinach) (502 aa), FASTA scores: opt: 1001, E(): 0, (35.6%
+ identity in 486 aa overlap); etc. Also highly similar to
+ Rv0223c ALDEHYDE DEHYDROGENASE from Mycobacterium
+ tuberculosis (487 aa). Contains PS00687 Aldehyde
+ dehydrogenases glutamic acid active site. BELONGS TO THE
+ ALDEHYDE DEHYDROGENASES FAMILY. Protein product from
+ Mb0791 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0791 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable aldehyde dehydrogenase nad dependent
+ alda (aldehyde dehydrogenase [nad+])"
+ /protein_id="SIT99390.1"
+ /db_xref="GOA:A0A1R3XWD8"
+ /db_xref="InterPro:IPR015590"
+ /db_xref="InterPro:IPR016161"
+ /db_xref="InterPro:IPR016162"
+ /db_xref="InterPro:IPR016163"
+ /db_xref="InterPro:IPR026460"
+ /db_xref="InterPro:IPR029510"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWD8"
+ /translation="MALWGDGISALLIDGKLSDGRAGTFPTVNPATEEVLGVAADADA
+ EDMGRAIEAARRAFDSTDWSRNTELRVRCVRQLRDAMQQHVEELRELTISEVGAPRML
+ TASAQLEGPVGDLSFAADTAESYPWKQDLGEASPLGIATRRTLAREAVGVVGAITPWN
+ FPHQINLAKLGPALAAGNTVVLKPAPDTPWCAAALGEIIVEHTDFPPGVVNIVTSSSH
+ ALGALLAKDPRVDMISFTGSTATGRAVMADAAATIKKVFLELGGKSAFVVLDDADLAA
+ ASAVSAFSACMHAGQGCAITTRLVVPRARYEEAVAIAAATMSSIRPGDPNDPGTVCGP
+ LISARQRDRVQGYLDLAVAEGGRFACGGARPADREVGFYIEPTVIAGLTNDARVAREE
+ IFGPVLTVIAHDGDDDAVRIANDSPYGLSGTVYGADPQRAARIASRLRVGTVNVNGGV
+ WYCADAPFGGYKQSGIGREMGLLGFEEYLEAKLIATAAN"
+ gene 864601..865347
+ /locus_tag="BQ2027_MB0792"
+ CDS 864601..865347
+ /locus_tag="BQ2027_MB0792"
+ /note="Mb0792, -, len: 248 aa. Equivalent to Rv0769, len:
+ 248 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 248 aa overlap). Probable
+ dehydrogenase/reductase (EC 1.-.-.-), similar to others,
+ especially short-chain type dehydrogenases/reductases and
+ 3-oxoacyl-(acyl-carrier protein) reductases e.g.
+ NP_106890.1|NC_002678 PROBABLE SHORT-CHAIN TYPE
+ DEHYDROGENASE/REDUCTASE from Mesorhizobium loti (374 aa);
+ NP_243357.1|NC_002570 3-oxoacyl-(acyl-carrier protein)
+ reductase from Bacillus halodurans (246 aa);
+ P28643|FABG_CUPLA 3-OXOACYL-[ACYL-CARRIER PROTEIN]
+ REDUCTASE from Cuphea lanceolata (320 aa);
+ P25529|HDHA_ECOLI 7-alpha-hydroxysteroid dehydrogenase
+ from Escherichia coli (255 aa), FASTA scores: opt: 536,
+ E(): 6.5e-27, (37.7% identity in 247 aa overlap); etc.
+ Also similar to others from Mycobacterium tuberculosis
+ e.g. MTCY02B10.14, FASTA score: (33.7% identity in 249 aa
+ overlap); etc. Protein product from Mb0792 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0792 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEHYDROGENASE/REDUCTASE"
+ /protein_id="SIT99391.1"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWC3"
+ /translation="MFDSKVAIVTGAAQGIGQAYAQALAREGASVVVADINADGAAAV
+ AKQIVADGGTVIHVPVDVSDEDSAKAMVDRAVGAFGGIDYLVNNAAIYGGMKLDLLLT
+ VPLDYYKKFMSVNHDGVLVCTRAVYKHMAKRGGGAIVNQSSTAAWLYSNFYGLAKVGV
+ NGLTQQLARELGGMKIRINAIAPGPIDTEATRTVTPAELVKNMVQTIPLSRMGTPEDL
+ VGMCLFLLSDSASWITGQIFNVDGGQIIRS"
+ gene 865445..866332
+ /locus_tag="BQ2027_MB0793"
+ CDS 865445..866332
+ /locus_tag="BQ2027_MB0793"
+ /note="Mb0793, -, len: 295 aa. Equivalent to Rv0770, len:
+ 295 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 295 aa overlap). Probable
+ dehydrogenase/reductase, 3-hydroxyisobutyrate
+ dehydrogenase family (EC 1.1.1.-), possibly
+ 3-hydroxyisobutyrate dehydrogenase (EC 1.1.1.31) or
+ 2-hydroxy-3-oxopropionate reductase (EC 1.1.1.60), similar
+ to others e.g. P23523|GARR_ECOLI 2-HYDROXY-3-OXOPROPIONATE
+ REDUCTASE (TARTRONATE SEMIALDEHYDE REDUCTASE) (TSAR) from
+ Escherichia coli strain K12 (294 aa), FASTA scores: opt:
+ 469, E(): 6.7e-22, (34.4% identity in 282 aa overlap);
+ P28811|MMSB_PSEAE 3-hydroxyisobutyrate dehydrogenase
+ (HIBADH) from Pseudomonas aeruginosa (298 aa), FASTA
+ scores: opt: 439, E(): 4.3e-20, (34.9% identity in 269 aa
+ overlap); etc. Also similar to others from Mycobacterium
+ tuberculosis e.g. Rv1122 and Rv1844c. SEEMS TO BELONG TO
+ THE 3-HYDROXYISOBUTYRATE DEHYDROGENASE FAMILY. Mb0793
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEHYDROGENASE/REDUCTASE"
+ /protein_id="SIT99392.1"
+ /db_xref="GOA:A0A1R3XYH6"
+ /db_xref="InterPro:IPR002204"
+ /db_xref="InterPro:IPR006115"
+ /db_xref="InterPro:IPR008927"
+ /db_xref="InterPro:IPR013328"
+ /db_xref="InterPro:IPR015815"
+ /db_xref="InterPro:IPR029154"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYH6"
+ /translation="MTAHPETPRLGYIGLGNQGAPMAKRLLDWPGGLTVFDVRVEAMA
+ PFVEGGATAAASVSDVAEADIISITVFDDAQVSSVITADNGLATHAKPGTIVAIHSTI
+ ADTTAVDLAEKLKPQGIHIVDAPGSGGAAAAAKGELAVMVGADDEAFQRIKEPFSRWA
+ SLLIHAGEPGAGTRMKLARNMLTFVSYAAAAEAQRLAEACGLDLVALGKVVRHSDSFT
+ GGAGAIMFRNTTAPMEPADPLRPLLEHTRGLGEKDLSLALALGEVVSVDLPLAQLALQ
+ RLAAGLGVPHPDTEPAKET"
+ gene 866329..866763
+ /locus_tag="BQ2027_MB0794"
+ CDS 866329..866763
+ /locus_tag="BQ2027_MB0794"
+ /note="Mb0794, -, len: 144 aa. Equivalent to Rv0771, len:
+ 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 144 aa overlap). Possible
+ 4-carboxymuconolactone decarboxylase (EC 4.1.1.44),
+ showing similarity with other carboxymuconolactone
+ decarboxylases e.g. AAD39557.1|AF031417 PcaC-like protein
+ from Pseudomonas putida (130 aa); P20370|DC4C_ACICA
+ 4-CARBOXYMUCONOLACTONE DECARBOXYLASE (CMD) from
+ Acinetobacter sp. ADP1 (134 aa), FASTA scores: opt: 174,
+ E(): 0.00075, (31.4% identity in 121 aa overlap);
+ C-terminus of NP_421214.1|NC_002696 3-oxoadipate
+ enol-lactone hydrolase/4-carboxymuconolactone
+ decarboxylase from Caulobacter crescentus (393 aa);
+ C-terminus of T47115 probable 4-carboxymuconolactone
+ decarboxylase / 3-oxoadipate enol-lactone hydrolase from
+ Streptomyces sp (373 aa); NP_407104.1|NC_003143 putative
+ gamma carboxymuconolactone decarboxylase from Yersinia
+ pestis (131 aa); etc. Protein product from Mb0794 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0794 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE 4-CARBOXYMUCONOLACTONE DECARBOXYLASE
+ (CMD)"
+ /protein_id="SIT99393.1"
+ /db_xref="GOA:A0A1R3XXC9"
+ /db_xref="InterPro:IPR003779"
+ /db_xref="InterPro:IPR029032"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXC9"
+ /translation="MMDELRRTGLDKMNEVYAWDMPDMPGEFFALTVDHLFGRIWTRP
+ GLSMRDRRMAVIAVLTAQGQSDLLEVQVNAVLHNDELTIDELRELAVFITHYVGFPLG
+ SRLNSAIERVAAKRKQAAENGSLPDTKANVAEVLAKESGKSS"
+ gene 866775..868043
+ /gene="purD"
+ /locus_tag="BQ2027_MB0795"
+ CDS 866775..868043
+ /gene="purD"
+ /locus_tag="BQ2027_MB0795"
+ /note="Mb0795, purD, len: 422 aa. Equivalent to Rv0772,
+ len: 422 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 422 aa overlap). Probable purD,
+ phosphoribosylamine--glycine ligase (EC 6.3.4.13),
+ equivalent to Q50144|PURD|PUR2_MYCLE|ML2235|MLCB5.08
+ PHOSPHORIBOSYLAMINE--GLYCINE LIGASE from Mycobacterium
+ leprae (422 aa), FASTA scores: opt: 2272, E(): 0, (81.8%
+ identity in 422 aa overlap). Also highly similar to others
+ e.g. CAB56348.1|AL118514 phosphoribosylamine-glycine
+ ligase from Streptomyces coelicolor (416 aa);
+ P1564|PUR2_ECOLI phosphoribosylamine--glycine ligase from
+ Escherichia coli (429 aa), FASTA scores: opt: 1039, E():
+ 0, (42.7% identity in 431 aa overlap); etc. BELONGS TO THE
+ GARS FAMILY. Protein product from Mb0795 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0795 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHORIBOSYLAMINE--GLYCINE LIGASE
+ PURD (GARS) (GLYCINAMIDE RIBONUCLEOTIDE SYNTHETASE)
+ (PHOSPHORIBOSYLGLYCINAMIDE SYNTHETASE)
+ (5'-PHOSPHORIBOSYLGLYCINAMIDE SYNTHETASE)"
+ /protein_id="SIT99394.1"
+ /db_xref="GOA:P65894"
+ /db_xref="InterPro:IPR000115"
+ /db_xref="InterPro:IPR011054"
+ /db_xref="InterPro:IPR011761"
+ /db_xref="InterPro:IPR013815"
+ /db_xref="InterPro:IPR016185"
+ /db_xref="InterPro:IPR020559"
+ /db_xref="InterPro:IPR020560"
+ /db_xref="InterPro:IPR020561"
+ /db_xref="InterPro:IPR020562"
+ /db_xref="InterPro:IPR037123"
+ /db_xref="UniProtKB/Swiss-Prot:P65894"
+ /translation="MRVLVIGSGAREHALLLALGKDPQVSGLIVAPGNAGTARIAEQH
+ DVDITSAEAVVALAREVGADMVVIGPEVPLVLGVADAVRAAGIVCFGPGKDAARIEGS
+ KAFAKDVMAAAGVRTANSEIVDSPAHLDAALDRFGPPAGDPAWVVKDDRLAAGKGVVV
+ TADRDVARAHGAALLEAGHPVLLESYLDGPEVSLFCVVDRTVVVPLLPAQDFKRVGED
+ DTGLNTGGMGAYAPLPWLPDNIYREVVSRIVEPVAAELVRRGSSFCGLLYVGLAITAR
+ GPAVVEFNCRFGDPETQAVLALLESPLGQLLHAAATGKLADFGELRWRDGVAVTVVLA
+ AENYPGRPRVGDVVVGSEAEGVLHAGTTRRDDGAIVSSGGRVLSVVGTGADLSAARAH
+ AYEILSSIRLPGGHFRSDIGLRAAEGKISV"
+ gene complement(868040..869578)
+ /gene="ggtA"
+ /locus_tag="BQ2027_MB0796C"
+ CDS complement(868040..869578)
+ /gene="ggtA"
+ /locus_tag="BQ2027_MB0796C"
+ /note="Mb0796c, ggtA, len: 512 aa. Equivalent to Rv0773c,
+ len: 512 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 512 aa overlap). Probable ggtA,
+ bifunctional acylase including cephalosporin acylase (EC
+ 3.5.1.-), and gamma-glutamyl transpeptidase (EC 2.3.2.2);
+ highly similar to others e.g. NP_295247.1|NC_001263
+ cephalosporin acylase from Deinococcus radiodurans (535
+ aa); NP_248854.1|NC_002516 probable
+ gamma-glutamyltranspeptidase from Pseudomonas aeruginosa
+ (538 aa); P15557|PAC1_PSES3 ACYLASE ACY 1 [INCLUDES:
+ CEPHALOSPORIN ACYLASE (GL-7ACA ACYLASE);
+ GAMMA-GLUTAMYLTRANSPEPTIDASE (GGT)] from Pseudomonas sp.
+ strain SE83 (558 aa), FASTA scores: opt: 784, E(): 0,
+ (34.2% identity in 526 aa overlap);
+ NP_391491.1|NC_000964|Z93767|BSZ93767_6|O0521 protein
+ similar to gamma-glutamyltransferase from Bacillus
+ subtilis (525 aa), FASTA scores: opt: 1169, E(): 0, (40.1%
+ identity in 516 aa overlap); etc. Also similar to
+ Rv2394|ggtB from Mycobacterium tuberculosis. Member of
+ GL-7ACA ACYLASES AND TO GGT group. Protein product from
+ Mb0796c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0796c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BIFUNCTIONAL ACYLASE GGTA:
+ CEPHALOSPORIN ACYLASE (GL-7ACA ACYLASE) +
+ GAMMA-GLUTAMYLTRANSPEPTIDASE (GGT)"
+ /protein_id="SIT99395.1"
+ /db_xref="GOA:A0A1R3XWS1"
+ /db_xref="InterPro:IPR000101"
+ /db_xref="InterPro:IPR029055"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWS1"
+ /translation="MPILATNVVCTSQPLAAQAGLRMLADGGNAVDAAVATAITLTVV
+ EPVSNGIGSDAFSIVWDGQKLHGLNASGRSPSAWTPEYFGGNAVPVLGWNSVTVPGAV
+ SAWVELHARFGRLPFETLFEPAISYGRNGFLVSPTVAAQWAAQVPLFASQPGFADAFM
+ PGGRAPKPGELFTFPDHAATLEKIAATNGEEFYRGELAAKLEAHSAANGGVMRADDLA
+ AHRVDWVDTITGTYRGYTIHQIPPNGQGIVALIALGILEHFDMSSWSVDSAESVHVQI
+ EALKLAFADAQACVADIDYMPVHPKRLLDKEYLRQRATLIDPKRAMPAATGIPRGGTV
+ YLAAADAAGMMVSMIQSNYLGFGSGVVVPGTGISLHNRGSDFTVVPRHPNRVGPRKRP
+ YHTIIPGFVTRDGAPVMSFGVMGGMMQPQGHVQVLVRIADYGQNPQAACDGPRFRWVN
+ GMRVSFENGFPDSTLDELRQRGHDLVAVADYSQFGSCQAIWRLDDGYLAASDPRRDGQ
+ AAAC"
+ gene complement(869629..870540)
+ /locus_tag="BQ2027_MB0797C"
+ CDS complement(869629..870540)
+ /locus_tag="BQ2027_MB0797C"
+ /note="Mb0797c, -, len: 303 aa. Equivalent to Rv0774c,
+ len: 303 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 303 aa overlap). Possible conserved
+ exported protein with hydrophobic region near N-terminus,
+ highly similar, except in N-terminus, to
+ Rv0519c|Z97831|MTY20G10.09c|O33364 HYPOTHETICAL PROTEIN
+ from Mycobacterium tuberculosis (300 aa), FASTA scores:
+ opt: 1092, E(): 0, (57.9% identity in 299 aa overlap).
+ Contains PS00061 Short-chain alcohol dehydrogenase family
+ signature, and PS00120 Lipases, serine active site. So
+ could be a lipase (EC 3.1.-.-). Protein product from
+ Mb0797c detected using SWATH mass spectrometry. Mb0797c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED EXPORTED PROTEIN"
+ /protein_id="SIT99396.1"
+ /db_xref="InterPro:IPR000801"
+ /db_xref="InterPro:IPR006311"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWD7"
+ /translation="MMARMPELSRRAVLGLGAGTVLGATSAYAIDMLLQPRTSHAAPA
+ AAIGTNVPLAPTPALDPAPPAQAAPTMSTGSFVSAARAGKMTNWAIARPPGQTQALRP
+ VIALHGLGGSASAVMDGGVEQGLAQAVNAGLPPFAVVSVAGGSSYWHQRASGEDAGAM
+ VLNELIPLLDTQRLDTSRVAFLGWSMGGYGALLLGSRLGPARTAAICAVSPALWLSAG
+ AVAPGSFDGPDDWSANSVFGLPALGSIPIRVDCGNSDPFYAATKQFVAQLPHPPAGGF
+ SPGGHNGGFWSAQLPAELTWFAPLLTG"
+ gene 870596..871219
+ /locus_tag="BQ2027_MB0798"
+ CDS 870596..871219
+ /locus_tag="BQ2027_MB0798"
+ /note="Mb0798, -, len: 207 aa. Equivalent to Rv0775, len:
+ 207 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 207 aa overlap). Conserved
+ hypothetical protein, showing some similarity to other
+ proteins e.g. ECAE000186_11|MG1655 HYPOTHETICAL PROTEIN
+ from Escherichia coli strain K-12 (178 aa), FASTA scores:
+ E(): 6.4e-05, (27.2% identity in 147 aa overlap);
+ P41037|BIH_ECOLI hypothetical transcriptional regulator
+ from Escherichia coli (103 aa), FASTA scores: opt: 138,
+ E(): 0.003, (30.9% identity in 97 aa overlap); etc.
+ Protein product from Mb0798 detected using SWATH mass
+ spectrometry. Mb0798 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, AcrR family"
+ /protein_id="SIT99397.1"
+ /db_xref="GOA:A0A1R3XWE8"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR041583"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWE8"
+ /translation="MGVTAAVTPKGERRRYALVSAAAELLGEGGFEAVRHRAVARRAG
+ LPLASTTYYFSSLDDLIARAVEHIGMIEVAQLRARVSALSRRRRGPETTAVVLVDLLV
+ GEMSSPGLAEQLISRYERHIACTRLPDLRESMRRSLRQRAEAVAEAIERSGRSAQIEL
+ VCTLICAVDGSVVSALVEGRDPRAAALATVVDLIDVLAPVDQRPVPF"
+ gene complement(871173..871952)
+ /locus_tag="BQ2027_MB0799C"
+ CDS complement(871173..871952)
+ /locus_tag="BQ2027_MB0799C"
+ /note="Mb0799c, -, len: 259 aa. Equivalent to Rv0776c,
+ len: 259 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 259 aa overlap). Conserved
+ hypothetical protein, similar (except first 50 aa) to
+ P72737|D90900_57 hypothetical protein from Synechocystis
+ sp. strain PCC 6803 (261 aa), FASTA scores: opt: 337, E():
+ 1.7e-15, (30.5% identity in 266 aa overlap). Mb0799c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99398.1"
+ /db_xref="InterPro:IPR007362"
+ /db_xref="InterPro:IPR008306"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWD9"
+ /translation="MYFVGVDLAWAGRNPTGVAAVDADGCLVGVGAARDDASVLAALR
+ PYVVGDCLVAFDAPLVVANRTGQRPAEAALNRDFRQFEAGAYPANTEKPEFADVPRAA
+ RLARQLALDMDPLSSATRRAIEVYPHPATVALFRLPRALKYKAKPGRSVDLLKSELLR
+ LMDGVEGLAQAGVRMQVAGQPDWVSLRRQVTVAQRKSDLRAAEDPIDAVVCAYVALYA
+ QRRPADVTIYGDFTTGYIVTPSLPTDFRTAPDAGRRARARR"
+ gene 872197..873615
+ /gene="purB"
+ /locus_tag="BQ2027_MB0800"
+ CDS 872197..873615
+ /gene="purB"
+ /locus_tag="BQ2027_MB0800"
+ /note="Mb0800, purB, len: 472 aa. Equivalent to Rv0777,
+ len: 472 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 472 aa overlap). Probable purB,
+ adenylosuccinate lyase (EC 4.3.2.2), equivalent (but
+ shorter 15 aa) to MLCB5.13|Z95151|g2076607|PURB
+ ADENYLOSUCCINATE LYASE from Mycobacterium leprae (487 aa),
+ FASTA scores: opt: 2640, E(): 0, (86.7% identity in 472 aa
+ overlap). More similar to eukaryotic adenylosuccinate
+ lyases than to prokaryotic adenylosuccinate lyases e.g.
+ P54822|PUR8_MOUSE ADENYLOSUCCINATE LYASE from Mus musculus
+ (484 aa), FASTA scores: opt: 762, E(): 0, (32.4% identity
+ in 445 aa overlap); CAB99134.1|AL390188 putative
+ adenylosuccino lyase (fragment) from Streptomyces
+ coelicolor (362 aa); etc. Contains PS00163 Fumarate lyases
+ signature. BELONGS TO THE LYASE 1 FAMILY, ADENYLOSSUCINATE
+ LYASE SUBFAMILY. Protein product from Mb0800 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0800 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ADENYLOSUCCINATE LYASE PURB
+ (ADENYLOSUCCINASE) (ASL) (ASASE)"
+ /protein_id="SIT99399.1"
+ /db_xref="GOA:A0A1R3XWE6"
+ /db_xref="InterPro:IPR000362"
+ /db_xref="InterPro:IPR004769"
+ /db_xref="InterPro:IPR008948"
+ /db_xref="InterPro:IPR019468"
+ /db_xref="InterPro:IPR020557"
+ /db_xref="InterPro:IPR022761"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWE6"
+ /translation="MSIPNVLATRYASAEMVAIWSPEAKVVSERRLWLAVLRAQAELG
+ VAVADSVLADYERVVDDVDLASISARERVLRHDVKARIEEFNALAGHEHVHKGMTSRD
+ LTENVEQLQIRRSLEVIFAHGVAAVARLAERAVSYRDLIMAGRSHNVAAQATTLGKRF
+ ASAAQEMMIALRRLRELIDRYPLRGIKGPMGTGQDMLDLLGGDRAALADLERRVADFL
+ GFATVFNSVGQVYPRSLDHDVVSALVQLGAGPSSLAHTIRLMAGHELATEGFAPGQVG
+ SSAMPHKMNTRSCERVNGLQVVLRGYASMVAELAGAQWNEGDVFCSVVRRVALPDSFF
+ AVDGQIETFLTVLDEFGAYPAVIGRELDRYLPFLATTKVLMAAVRAGMGRESAHRLIS
+ EHAVATALAMREHGAEPDLLDRLAADPRLPLGRDALEAALADKKAFAGAAGDQVDDVV
+ AMVDALVSRYPDAAKYTPGAIL"
+ gene 873620..874864
+ /gene="cyp126"
+ /locus_tag="BQ2027_MB0801"
+ CDS 873620..874864
+ /gene="cyp126"
+ /locus_tag="BQ2027_MB0801"
+ /note="Mb0801, cyp126, len: 414 aa. Equivalent to Rv0778,
+ len: 414 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 414 aa overlap). Possible cyp126,
+ cytochrome P-450 (EC 1.14.-.-), similar to other
+ cytochromes and related proteins e.g.
+ AAG29781.1|AF235050_4|AF235050 cytochrome P-450 from
+ Streptomyces rishiriensis (407 aa); Q59723|PSECYTOCHR_1
+ cytochrome p-450 linalool 8-monooxygenase (EC 1.14.99.28)
+ (lin C) from Pseudomonas incognita (406 aa), FASTA scores:
+ opt: 769, E(): 0, (37.0% identity in 411 aa overlap); etc.
+ Also similar to others from Mycobacterium tuberculosis
+ e.g. Rv0766c, Rv2266, Rv3545c, etc. Contains PS00086
+ Cytochrome P450 cysteine heme-iron ligand signature.
+ Protein product from Mb0801 detected using SWATH mass
+ spectrometry. Mb0801 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CYTOCHROME P450 126 CYP126"
+ /protein_id="SIT99400.1"
+ /db_xref="GOA:P63712"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002397"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/Swiss-Prot:P63712"
+ /translation="MTTAAGLSGIDLTDLDNFADGFPHHLFAIHRREAPVYWHRPTEH
+ TPDGEGFWSVATYAETLEVLRDPVTYSSVTGGQRRFGGTVLQDLPVAGQVLNMMDDPR
+ HTRIRRLVSSGLTPRMIRRVEDDLRRRARGLLDGVEPGAPFDFVVEIAAELPMQMICI
+ LLGVPETDRHWLFEAVEPGFDFRGSRRATMPRLNVEDAGSRLYTYALELIAGKRAEPA
+ DDMLSVVANATIDDPDAPALSDAELYLFFHLLFSAGAETTRNSIAGGLLALAENPDQL
+ QTLRSDFELLPTAIEEIVRWTSPSPSKRRTASRAVSLGGQPIEAGQKVVVWEGSANRD
+ PSVFDRADEFDITRKPNPHLGFGQGVHYCLGANLARLELRVLFEELLSRFGSVRVVEP
+ AEWTRSNRHTGIRHLVVELRGG"
+ gene complement(874861..875481)
+ /locus_tag="BQ2027_MB0802C"
+ CDS complement(874861..875481)
+ /locus_tag="BQ2027_MB0802C"
+ /note="Mb0802c, -, len: 206 aa. Equivalent to Rv0779c,
+ len: 206 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 206 aa overlap). Possible conserved
+ transmembrane protein, equivalent to Z95151|MLCB5_14
+ O05747 conserved hypothetical protein from Mycobacterium
+ leprae (206 aa), FASTA scores: opt: 902, E(): 0, (67.2%
+ identity in 204 aa overlap). Protein product from Mb0802c
+ detected using SWATH mass spectrometry. Mb0802c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99401.1"
+ /db_xref="GOA:A0A1R3XWD3"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWD3"
+ /translation="MRSRFLPYATTPGRLLAQLISDITVAVWTTLWMLVGLAVHDAIS
+ IIGEAGRQIEIGSHGIAGNLAAAGQDAQRIPVVGDALSNPITAASQAALDIAGAGHNL
+ DTTAGWLAVVLALAVAATPILAVAMPWLFLRLRFCRRKWTVTTLAATPAGRQLLALRA
+ LANRPPGKLAAVSTDPVGAWRREDPATMRALAALELRAAGIPLRGD"
+ gene 875532..876425
+ /gene="purC"
+ /locus_tag="BQ2027_MB0803"
+ CDS 875532..876425
+ /gene="purC"
+ /locus_tag="BQ2027_MB0803"
+ /note="Mb0803, purC, len: 297 aa. Equivalent to Rv0780,
+ len: 297 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 297 aa overlap). purC,
+ phosphoribosylaminoimidazole- succinocarboxamide synthase
+ (EC 6.3.2.6) (see citations below), equivalent to
+ MTU34957_1|PURC
+ phosphoribosylaminoimidazole-succinocarboxamide synthase
+ from Mycobacterium leprae (297 aa), FASTA scores: opt:
+ 1986, E(): 0, (99.3% identity in 297 aa overlap). Also
+ similar to others e.g. CAB56351.1|AL118514
+ phosphoribosylaminoimidazole-succinocarboxamide synthase
+ from Streptomyces coelicolor (299 aa); etc. Contains
+ PS01058 SAICAR synthetase signature 2. BELONGS TO THE
+ SAICAR SYNTHETASE FAMILY. Protein product from Mb0803
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0803 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PHOSPHORIBOSYLAMINOIMIDAZOLE-SUCCINOCARBOXAMIDE
+ SYNTHASE PURC (SAICAR SYNTHETASE)"
+ /protein_id="SIT99402.1"
+ /db_xref="GOA:P0A5T5"
+ /db_xref="InterPro:IPR001636"
+ /db_xref="InterPro:IPR018236"
+ /db_xref="InterPro:IPR028923"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5T5"
+ /translation="MRPALSDYQHVASGKVREIYRVDDEHLLLVASDRISAYDYVLDS
+ TIPDKGRVLTAMSAFFFGLVDAPNHLAGPPDDPRIPDEVLGRALVVRRLEMLPVECVA
+ RGYLTGSGLLDYQATGKVCGIALPPGLVEASRFATPLFTPATKAALGDHDENISFDRV
+ VEMVGALRANQLRDRTLQTYVQAADHALTRGIIIADTKFEFGIDRHGNLLLADEIFTP
+ DSSRYWPADDYRAGVVQTSFDKQFVRSWLTGSESGWDRGSDRPPPPLPEHIVEATRAR
+ YINAYERISELKFDDWIGPGA"
+ gene 876422..878581
+ /gene="ptrB"
+ /locus_tag="BQ2027_MB0804"
+ CDS 876422..878581
+ /gene="ptrB"
+ /locus_tag="BQ2027_MB0804"
+ /note="Mb0804, ptrB, len: 719 aa. Equivalent to Rv0781 and
+ Rv0782, len: 236 aa and 552 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (97.6% identity in 206 aa
+ overlap and 100.0% identity in 517 aa overlap). Probable
+ ptrB, protease II (EC 3.4.21.83), equivalent to
+ NP_302455.1|NC_002677 protease II from Mycobacterium
+ leprae (724 aa). Also highly similar to C-termini of many
+ proteases II e.g. P24555|PTRB_ECOLI|TLP|B1845 protease II
+ from Escherichia coli strains K12 and HB101 (707 aa),
+ FASTA scores: opt: 204, E(): 7.4e-07, (29.6% identity in
+ 230 aa overlap); etc. Also highly similar to N-termini of
+ many proteases II e.g. P24555|PTRB_ECOLI|TLP|B1845
+ protease II from Escherichia coli strains K12 and HB101
+ (707 aa), FASTA scores: opt: 1251, E(): 0, (42.7% identity
+ in 489 aa overlap); etc. ORFs Rv0782 and Rv0781 appear to
+ be a frameshifted homologues of protease II, but we can
+ find no error in the cosmid sequence to account for this.
+ BELONGS TO PEPTIDASE FAMILY S9A; ALSO KNOWN AS THE PROLYL
+ OLIGOPEPTIDASE FAMILY. Note that previously known as
+ ptrBb. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, ptrB is split into 2 genes,
+ ptrBa and ptrBb, due to a frameshift. In Mycobacterium
+ bovis, a 2 bp insertion (*-gc) leads to a single product.
+ Protein product from Mb0804 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0804 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable protease ii ptrbb [second part]
+ (oligopeptidase b)"
+ /protein_id="SIT99403.1"
+ /db_xref="GOA:A0A1R3XXD9"
+ /db_xref="InterPro:IPR001375"
+ /db_xref="InterPro:IPR002470"
+ /db_xref="InterPro:IPR023302"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXD9"
+ /translation="MMHRTALPSPPVAKRVQTRREHHGDVFVDPYEWLRDKDSPEVIA
+ YLEAENDYTERTTAHLEPLRQKIFHEIKARTKETDLSVPTRRGNWWYYARTFEGKQYG
+ VHCRCPVTDPDDWNPPEFDERTEIPGEQLLLDENVEADGHDFFALGAASVSLDDNLLA
+ YSVDVVGDERYTLRFKDLRTGEQYPDEIAGIGAGVTWAADNRTVYYTTVDAAWRPDTV
+ WRYRLGSGESSERVYHEADDRFWLAVGRTRSNAYLLIAAGSSITSEVRYAHAADPTAQ
+ FSVVLPRRDGVEYSVEHAVIAGQDRFLILHNDGAVNFTLVEAPVEDPARQRTLIAHRD
+ DVRLDAVDALAGHLVVSYRREALPRVQLWPIGPDGNYGEPEEISFDSELMSAGLGPNP
+ NWDSPKLRVGAGSFVTPVRIYDIDLVTGERTLLKEQPVLGGYRREDYVERRDWAYGDD
+ GTRIPVSIVHRADIEFPAPALIYGYGAYEICEDPRFSIARLSLLDRGMVFVVAHVRGG
+ GEMGRLWYENGKLLDKKNTFTDFIAVARHLVDTGLTSQQQLVALGGSAGGLLMGAVAN
+ MAPDLFAGILAQVPFVDPLTTILDPSLPLTVTEWDEWGNPLNDSDVYAYVKSYSPYEN
+ VTAQKYPAILAMTSLNDTRVYYVEPAKWVAALRHAKTDGNSVLLKTQMHAGHGGISGR
+ YERWKETAFQYGWLLATADSDRYGGGQGNDLDGAAPA"
+ gene complement(879009..880631)
+ /gene="emrB"
+ /locus_tag="BQ2027_MB0805C"
+ CDS complement(879009..880631)
+ /gene="emrB"
+ /locus_tag="BQ2027_MB0805C"
+ /note="Mb0805c, emrB, len: 540 aa. Equivalent to Rv0783c,
+ len: 540 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 540 aa overlap). Possible emrB,
+ integral membrane drug efflux protein, member of major
+ facilitator superfamily (MFS), equivalent to
+ AAL16083.1|AF421382_1|AF421382 EmrB efflux protein from
+ Mycobacterium avium (538 aa). Also similar to other
+ membrane proteins e.g. CAB61606.1|AL133210 putative export
+ protein from Streptomyces coelicolor (496 aa);
+ NP_108371.1|NC_002678 efflux pump protein FarB from
+ Mesorhizobium loti (511 aa); P44927|EMRB_HAEINHI0897|
+ multidrug resistance protein b homologue from Haemophilus
+ influenzae (510 aa), FASTA scores: opt: 706, E(): 1.3e-36,
+ (30.4% identity in 408 aa overlap); etc. Also similar to
+ Rv2333c|MTCY3G12.01 from Mycobacterium tuberculosis (537
+ aa), FASTA score: (28.2% identity in 408 aa overlap); and
+ Rv1410c|MTCY21B4.27c from Mycobacterium tuberculosis (518
+ aa), FASTA score: (26.8% identity in 496 aa overlap).
+ BELONGS TO THE MAJOR FACILITATOR FAMILY; ALSO KNOWN AS THE
+ DRUG RESISTANCE TRANSLOCASE FAMILY. Mb0805c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MULTIDRUG RESISTANCE INTEGRAL MEMBRANE
+ EFFLUX PROTEIN EMRB"
+ /protein_id="SIT99404.1"
+ /db_xref="GOA:A0A1R3XWG7"
+ /db_xref="InterPro:IPR001411"
+ /db_xref="InterPro:IPR004638"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWG7"
+ /translation="MLGNAMVEACPAEGDAPVPITPAGRPRSGQRSYPDRLDVGLLRT
+ AGVCVLASVMAHVDVTVVSVAQRTFVADFGSTQAVVAWTMTGYMLALATVIPTAGWAA
+ DRFGTRRLFMGSVLAFTLGSLLCAVAPNILLLIIFRVVQGFGGGMLTPVSFAILAREA
+ GPKRLGRVMAVVGIPMLLGPVGGPILGGWLIGAYGWRWIFLVNLPVGLSALVLAAIVF
+ PRDRPAASENFDYMGLLLLSPGLATFLFGVSSSPARGTMADRHVLIPAITGLALIAAF
+ VAHSWYRTEHPLIDMRLFQNRAVAQANMTMTVLSLGLFGSFLLLPSYLQQVLHQSPMQ
+ SGVHIIPQGLGAMLAMPIAGAMMDRRGPAKIVLVGIMLIAAGLGTFAFGVARQADYLP
+ ILPTGLAIMGMGMGCSMMPLSGAAVQTLAPHQIARGSTLISVNQQVGGSIGTALMSVL
+ LTYQFNHSEIIATAKKVALTPESGAGRGAAVDPSSLPRQTNFAAQLLHDLSHAYAVVF
+ VIATALVVSTLIPAAFLPKQQASHRRAPLLSA"
+ gene 880829..881515
+ /locus_tag="BQ2027_MB0806"
+ CDS 880829..881515
+ /locus_tag="BQ2027_MB0806"
+ /note="Mb0806, -, len: 228 aa. Equivalent to Rv0784, len:
+ 228 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 228 aa overlap). Conserved
+ hypothetical protein, with some similarity to
+ MLCB5_20|O05752 hypothetical protein from Mycobacterium
+ leprae (193 aa), FASTA scores: opt: 141, E(): 0.0022,
+ (36.0% identity in 114 aa overlap). Also similar to
+ N-terminus of NP_253002.1|NC_002516 conserved hypothetical
+ protein from Pseudomonas aeruginosa (253 aa). Mb0806 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted deacetylase"
+ /protein_id="SIT99405.1"
+ /db_xref="GOA:A0A1R3XWT5"
+ /db_xref="InterPro:IPR011330"
+ /db_xref="InterPro:IPR018763"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWT5"
+ /translation="MSVSGIGESTLADVDAFCAEMDARSVPVSLLVAPRMRDDYRLDR
+ DPRTVDWLTGRRAAGDALVLHGYDEAATKRRRGEFAMLRAHEANLRLMAADRVLEHLG
+ LRTRLFAAPGWLVSPGVRTALPANGFRLLADLHGITDLVRLTTVRARVLGIGEGFLAE
+ PWWCRMVVMSAERIARRGGVVRIAVAARHLRKSGPLQAMLDAVDLAMLQGCTPMVYRW
+ RADAAVLDAA"
+ gene 881531..882106
+ /locus_tag="BQ2027_MB0807"
+ CDS 881531..882106
+ /locus_tag="BQ2027_MB0807"
+ /note="Mb0807, -, len: 191 aa. Equivalent to 5' end of
+ Rv0785, len: 566 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (97.1% identity in 140 aa overlap).
+ Conserved hypothetical protein, highly similar to other
+ conserved hypothetical proteins e.g. NP_105777.1|
+ NC_002678 hypothetical protein from Mesorhizobium loti
+ (552 aa); SC5F8.14|CAB93742.1|AL357613 conserved
+ hypothetical protein from Streptomyces coelicolor (557
+ aa); AE001863|AE001863_31 from Deinococcus radiodurans
+ (554 aa), FASTA scores: opt: 2243, E(): 0, (61.1% identity
+ in 550 aa overlap); YEF7_YEAST|P32614 hypothetical 50.8 kd
+ protein (470 aa), FASTA scores: opt: 169, E(): 0.0014,
+ (23.8% identity in 542 aa overlap); etc. Also similar to
+ Rv1817|MTCY1A11.26c from Mycobacterium tuberculosis (487
+ aa), FASTA score: (26.7% identity in 587 aa overlap). And
+ shows similarity with other dehydrogenases.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0785 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (t-*), splits Mb0807 into 2 parts, Mb0807 and
+ Mb0808. Mb0807 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN [FIRST PART]"
+ /protein_id="SIT99406.1"
+ /db_xref="GOA:A0A1R3XWF0"
+ /db_xref="InterPro:IPR003953"
+ /db_xref="InterPro:IPR014614"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWF0"
+ /translation="MALTCTDMSDAVAGSDAEGLTADAIVVGAGLAGLVAACELADRG
+ LRVLILDQENRANVGGQAFWSFGGLFLVNSPEQRRLGIRDSHELALQDWLGTAAFDRP
+ EDYWPEQWAHAYVDFAAGEKRSWLRARGLKIFRWWAGPSVVVTTRRGTATRCPVSTSP
+ GVLGRLWSTYSCVSCVIAPRCALRTATRSTN"
+ gene 882124..883230
+ /locus_tag="BQ2027_MB0808"
+ CDS 882124..883230
+ /locus_tag="BQ2027_MB0808"
+ /note="Mb0808, -, len: 368 aa. Equivalent to 3' end of
+ Rv0785, len: 566 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.7% identity in 368 aa overlap).
+ Conserved hypothetical protein, highly similar to other
+ conserved hypothetical proteins e.g. NP_105777.1|
+ NC_002678 hypothetical protein from Mesorhizobium loti
+ (552 aa); SC5F8.14|CAB93742.1|AL357613 conserved
+ hypothetical protein from Streptomyces coelicolor (557
+ aa); AE001863|AE001863_31 from Deinococcus radiodurans
+ (554 aa), FASTA scores: opt: 2243, E(): 0, (61.1% identity
+ in 550 aa overlap); YEF7_YEAST|P32614 hypothetical 50.8 kd
+ protein (470 aa), FASTA scores: opt: 169, E(): 0.0014,
+ (23.8% identity in 542 aa overlap); etc. Also similar to
+ Rv1817|MTCY1A11.26c from Mycobacterium tuberculosis (487
+ aa), FASTA score: (26.7% identity in 587 aa overlap). And
+ shows similarity with other dehydrogenases.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0785 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (t-*), splits Mb0807 into 2 parts, Mb0807 and
+ Mb0808. Protein product from Mb0808 detected using SWATH
+ mass spectrometry. Mb0808 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN [SECOND PART]"
+ /protein_id="SIT99407.1"
+ /db_xref="GOA:A0A1R3XWF6"
+ /db_xref="InterPro:IPR003953"
+ /db_xref="InterPro:IPR014614"
+ /db_xref="InterPro:IPR027477"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWF6"
+ /translation="MTGVRGTVLEPSDEPRGAPSSRKSVGKFEFRASAVIVASGGIGG
+ NHELVRKNWPRRMGRIPKQLLSGVPAHVDGRMIGIAQKAGAAVINPDRMWHYTEGITN
+ YDPIWPRHGIRIIPGPSSLWLDAAGKRLPVPLFPGFDTLGTLEYITKSGHDYTWFVLN
+ AKIIEKEFALSGQEQNPDLTGRRLGQLLRSRAHAGPPGPVQAFIDRGVDFVHANSLRE
+ LVAAMNELPDVVPLDYETVAAAVTARDREVVNKYSKDGQITAIRAARRYRGDRFGRVV
+ APHRLTDPKAGPLIAVKLHILTRKTLGGIETDLDARVLKADGTPLAGLYAAGEVAGFG
+ GGGVHGYRALEGTFLGGCIFSGRAAGRGAAEDIR"
+ gene complement(883265..883654)
+ /locus_tag="BQ2027_MB0809C"
+ CDS complement(883265..883654)
+ /locus_tag="BQ2027_MB0809C"
+ /note="Mb0809c, -, len: 129 aa. Equivalent to Rv0786c,
+ len: 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 129 aa overlap). Conserved
+ hypothetical protein, similar to three other hypothetical
+ proteins from Streptomyces coelicolor e.g.
+ SC7H1.08c|T35703 hypothetical protein (202 aa), FASTA
+ scores: opt: 241, E(): 5.1e-10, (41.0% identity in 105 aa
+ overlap); SC3A7.08|T29426 (211 aa). Protein product from
+ Mb0809c detected using SWATH mass spectrometry. Mb0809c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted Zn-dependent hydrolases of the
+ beta-lactamase fold"
+ /protein_id="SIT99408.1"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWF3"
+ /translation="MHVGDELPLAELTVRAVGGCHAVIHPEIPVIENISYLVGDSKHR
+ ARLMHPGDALFVPGEQVDVLATPAAAPWMKISEAVDYLRAVAPARAVPIHQAIVAPDA
+ RGIYYGRLTEMTTTDFQVLPEESAVTF"
+ gene 883649..884608
+ /locus_tag="BQ2027_MB0810"
+ CDS 883649..884608
+ /locus_tag="BQ2027_MB0810"
+ /note="Mb0810, -, len: 319 aa. Equivalent to Rv0787, len:
+ 319 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 319 aa overlap). Hypothetical unknown
+ protein, equivalent to AAK45053.1 from Mycobacterium
+ tuberculosis strain CDC1551 (242 aa) but longer 77 aa."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIT99409.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWF9"
+ /translation="MHRPPWLAQLRRRLRIGVQLGSRVVLEQGRQPRDVYVIGVLVGD
+ QDRGQTGDSLEAVRESTGIEEQAGLTELSEEAGMAEMRELHVYDCALMGAFPMRLILA
+ TMLVAGRLLATLMAAPSAQAEPETCPPICDQIPATAWISTHAVPLNSQYRWPAMAGAA
+ VAVTRATPRFGFEQVCATPAFPHDSRDWAVAGRVTVVHPDGQWQLQAQVLHWRGDTAR
+ GGQIAASVFGTAVAALRACQLGAPLQSPSVTDDEPTRMAAVISGPVIMHTYLVAHVSS
+ STISELTLWSSGPPQVPWPTVADSAVLDALTAPLCEAYIGSCP"
+ gene 884714..884953
+ /gene="purS"
+ /locus_tag="BQ2027_MB0811"
+ CDS 884714..884953
+ /gene="purS"
+ /locus_tag="BQ2027_MB0811"
+ /EC_number="6.3.5.3"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0811, -, len: 79 aa. Equivalent to Rv0787A, len:
+ 79 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 78 aa overlap). Conserved hypothetical
+ protein, equivalent to MLCB5.24 HYPOTHETICAL PROTEIN from
+ Mycobacterium leprae (79 aa), FASTA scores: opt: 434,
+ (84.8% identity in 79 aa overlap). Also similar to
+ P12049|YEXA_BACSU HYPOTHETICAL 9.7 KD PROTEIN from
+ Bacillus subtilis (84 aa), FASTA scores: opt: 172, E():
+ 4e-06, (44.4% identity in 72 aa overlap). BELONGS TO THE
+ UPF0062 FAMILY. Protein product from Mb0811 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0811 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Phosphoribosylformylglycinamidine synthase, PurS
+ subunit (EC"
+ /protein_id="SIT99410.1"
+ /db_xref="GOA:A0A1R3XWG2"
+ /db_xref="InterPro:IPR003850"
+ /db_xref="InterPro:IPR036604"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWG2"
+ /translation="MARVVVHVMPKAEILDPQGQAIVGALGRLGHLGISDVRQGKRFE
+ LEVDDTVDDTTLAEIAESLLANTVIEDWTISRDPQ"
+ gene 884950..885624
+ /gene="purQ"
+ /locus_tag="BQ2027_MB0812"
+ CDS 884950..885624
+ /gene="purQ"
+ /locus_tag="BQ2027_MB0812"
+ /note="Mb0812, purQ, len: 224 aa. Equivalent to Rv0788,
+ len: 224 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 224 aa overlap). Probable purQ,
+ phosphoribosylformylglycinamidine synthase I (EC 6.3.5.3),
+ equivalent to MLCB5_24|Z95151|O05756|PURQ
+ PHOSPHORIBOSYLFORMYLGLYCINAMIDINE SYNTHASE I from
+ Mycobacterium leprae (224 aa), FASTA scores: opt: 1341,
+ E(): 0, (88.7% identity in 222 aa overlap). Also highly
+ similar to others e.g. P12041|PURQ_BACSU
+ PHOSPHORIBOSYLFORMYLGLYCINAMIDINE SYNTHASE I from Bacillus
+ subtilis (227 aa), FASTA scores: opt: 691, E(): 8.6e-39,
+ (47.7% identity in 214 aa overlap); etc. Contains PS00442
+ Glutamine amidotransferases class-I active site. BELONGS
+ TO TYPE-1 GLUTAMINE AMIDOTRANSFERASES. Protein product
+ from Mb0812 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0812 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHORIBOSYLFORMYLGLYCINAMIDINE
+ SYNTHASE I PURG (FGAM SYNTHASE I)"
+ /protein_id="SIT99411.1"
+ /db_xref="GOA:P65903"
+ /db_xref="InterPro:IPR010075"
+ /db_xref="InterPro:IPR017926"
+ /db_xref="InterPro:IPR029062"
+ /db_xref="UniProtKB/Swiss-Prot:P65903"
+ /translation="MTARIGVVTFPGTLDDVDAARAARQVGAEVVSLWHADADLKGVD
+ AVVVPGGFSYGDYLRAGAIARFAPVMDEVVAAADRGMPVLGICNGFQVLCEAGLLPGA
+ LTRNVGLHFICRDVWLRVASTSTAWTSRFEPDADLLVPLKSGEGRYVAPEKVLDELEG
+ EGRVVFRYHDNVNGSLRDIAGICSANGRVVGLMPHPEHAIEALTGPSDDGLGLFYSAL
+ DAVLTG"
+ gene complement(885641..886240)
+ /locus_tag="BQ2027_MB0813C"
+ CDS complement(885641..886240)
+ /locus_tag="BQ2027_MB0813C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0813c, -, len: 199 aa. Equivalent to Rv0789c,
+ len: 199 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 199 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0813c detected using
+ shotgun mass spectrometry. Mb0813c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99412.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ2"
+ /translation="MSRRAIHSGRAAPRRSGNSHLVLRNRVPSSKDSPRRRPHHEFMT
+ ESIGEPLSTNLIERYLRARGRRYFRGHHDAEFFFVANAHLRLHVHLEISPAYRDVFTI
+ RVSPAYFFPATDHTRLAEIVNAWNLQNHEVTAIVHGSSDPHRIGVAAERSLIRDRIRF
+ DDFATFVDNAVSAATELFGQLTAAGLPPTATPPLLRDAG"
+ gene complement(886262..886990)
+ /locus_tag="BQ2027_MB0814C"
+ CDS complement(886262..886990)
+ /locus_tag="BQ2027_MB0814C"
+ /note="Mb0814c, -, len: 242 aa. Equivalent to Rv0790c,
+ len: 242 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 242 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb0814c detected using SWATH
+ mass spectrometry. Mb0814c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transglutaminase-like enzymes, putative cysteine
+ proteases"
+ /protein_id="SIT99413.1"
+ /db_xref="InterPro:IPR002931"
+ /db_xref="InterPro:IPR038765"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXE8"
+ /translation="MTLANNGTGMDHFLTPTEYLDAGHPLVRTTAATLIRDAVSDTER
+ VRRIYYYVRDVPYDVLASFRYLAQGHHRASDVIGHGVAFCMGKASSFVALCRAAGVPA
+ RIAFQTIDAPDKEFLSPQVRALWGGRTGRPFPWHSLGEAYLGRRWVKLDATIDAPTAA
+ RLGKPYRQEFDGATPIPTVEGTILRENGSYADYPSAVAQWYERIAQSVLKALQSTEVH
+ ALVAADEELWTGPPVELADATHRL"
+ gene complement(886987..888030)
+ /locus_tag="BQ2027_MB0815C"
+ CDS complement(886987..888030)
+ /locus_tag="BQ2027_MB0815C"
+ /note="Mb0815c, -, len: 347 aa. Equivalent to Rv0791c,
+ len: 347 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 347 aa overlap). Conserved
+ hypothetical protein, similar (except in N-terminus) to
+ others e.g. CAC44585.1|AL596162 conserved hypothetical
+ protein from Streptomyces coelicolor (307 aa);
+ NP_252643.1|NC_002516 hypothetical protein from
+ Pseudomonas aeruginosa (364 aa); etc. Also some similarity
+ with oxidoreductases e.g. AAK38097.1|AF323606_3|AF323606
+ putative F420-dependent dehydrogenase from Rhodococcus
+ erythropolis (295 aa); etc. And also similar in part to
+ other proteins from Mycobacterium tuberculosis e.g.
+ Rv1855c|MTCY359.18|Z83859 (307 aa), FASTA scores: opt:
+ 366, E(): 4e-16, (35.0% identity in 226 aa overlap);
+ Rv3079c|MTCY22D7.02|Z83866 CONSERVED HYPOTHETICAL PROTEIN
+ (275 aa), FASTA scores: opt: 342, E(): 1.2e-14, (31.6%
+ identity in 234 aa overlap); Rv0044c POSSIBLE
+ OXIDOREDUCTASE (264 aa). Protein product from Mb0815c
+ detected using SWATH mass spectrometry. Mb0815c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Coenzyme F420-dependent N5,N10-methylene
+ tetrahydromethanopterin reductase and related
+ flavin-dependent oxidoreductases"
+ /protein_id="SIT99414.1"
+ /db_xref="GOA:A0A1R3XWI0"
+ /db_xref="InterPro:IPR011251"
+ /db_xref="InterPro:IPR019921"
+ /db_xref="InterPro:IPR036661"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWI0"
+ /translation="MNAKDDPHFGLMLAATVNGLAVGSYREMVVVSQTAEEYGFDSVW
+ LCDHFLTISPGEYAKVAGIAADTGSATGTETGGAGQCAPSRSLPLLECWTALAALSRD
+ TTKLRLGTSVLCNSYRHPSVLAKMAATLDVISQGRLDLGLGAGWFRRESQAYGIPFPP
+ VGDRVSALAESLQVIKAVWTEPNPTYAGRFYTLDGATCDPPPVQRPHPPLWIGGEGDR
+ VQRIAAKHAQGLNVRWWSPQQVTQRRGFLTQASEAAGRDPDTLRLSVTLLLAPTQSGE
+ EEVRIREEFASIPEPGLIVGTPDRCVERIREYQDRGVGHFLFTIPHVVKSDYLHIIGS
+ DIIPRVKTEVTIP"
+ gene complement(888027..888836)
+ /locus_tag="BQ2027_MB0816C"
+ CDS complement(888027..888836)
+ /locus_tag="BQ2027_MB0816C"
+ /note="Mb0816c, -, len: 269 aa. Equivalent to Rv0792c,
+ len: 269 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 269 aa overlap). Probable
+ transcriptional regulator, GntR-family, similar to many
+ others of GntR family e.g. BSUB0018_189|Z99121 from
+ Bacillus subtilis (243 aa), FASTA scores: opt: 367, E():
+ 1.5e-17, (32.1% identity in 246 aa overlap);
+ P31453|YIDP_ECOLI from Escherichia coli (238 aa), FASTA
+ scores: opt: 236, E(): 8.8e-09, (26.4% identity in 235 aa
+ overlap); etc. Protein product from Mb0816c detected using
+ SWATH mass spectrometry. Mb0816c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY GNTR-FAMILY)"
+ /protein_id="SIT99415.1"
+ /db_xref="GOA:A0A1R3XWU6"
+ /db_xref="InterPro:IPR000524"
+ /db_xref="InterPro:IPR011663"
+ /db_xref="InterPro:IPR028978"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWU6"
+ /translation="MTSVKLDLDAADLRISRGSVPASTQLAEALKAQIIQQRLPRGGR
+ LPSERELIDRSGLSRVTVRAAVGMLQRQGWLVRRQGLGTFVADPVEQELSCGVRTITE
+ VLLSCGVTPQVDVLSHQTGPAPQRISETLGLVEVLCIRRRIRTGDQPLALVTAYLPPG
+ VGPAVEPLLSGSADTETTYAMWERRLGVRIAQATHEIHAAGASPDVADALGLAVGSPV
+ LVVDRTSYTNDGKPLEVVVFHHRPERYQFSVTLPRTLPGSGAGIIEKRDFA"
+ gene 888909..889214
+ /locus_tag="BQ2027_MB0817"
+ CDS 888909..889214
+ /locus_tag="BQ2027_MB0817"
+ /note="Mb0817, -, len: 101 aa. Equivalent to Rv0793, len:
+ 101 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 101 aa overlap). Conserved
+ hypothetical protein, similar to others e.g.
+ NP_250888.1|NC_002516 hypothetical protein from
+ Pseudomonas aeruginosa (114 aa); AE 001908|AE001908_7
+ hypothetical protein from Deinococcus radiodurans (101
+ aa), FASTA scores: opt: 215, E(): 3.1e-09, (40.4% identity
+ in 99 aa overlap);
+ NP_440966.1|NC_000911|D90908|PCC6803|D90908_2 unknown
+ protein from Synechocystis sp. strain PCC 6803 (147 aa),
+ FASTA scores: opt: 194, E(): 4.5e-08, (31.1% identity in
+ 90 aa overlap); etc. Also similar to
+ Rv2749|MTV002.14|AL0089|MTV002_15 CONSERVED HYPOTHETICAL
+ PROTEIN from Mycobacterium tuberculosis (104 aa), FASTA
+ scores: opt: 143, E(): 0.00026, (26.9% identity in 93 aa
+ overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible monooxygenase"
+ /protein_id="SIT99416.1"
+ /db_xref="GOA:A0A1R3XWG1"
+ /db_xref="InterPro:IPR007138"
+ /db_xref="InterPro:IPR011008"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWG1"
+ /translation="MTSPVAVIARFMPRPDARSALRALLDAMITPTRAEDGCRSYDLY
+ ESADGGELVLFERYRSRIALDEHRGSPHYLNYRAQVGELLTRPVAVTVLAPLDEASA"
+ gene complement(889327..889923)
+ /locus_tag="BQ2027_MB0818C"
+ CDS complement(889327..889923)
+ /locus_tag="BQ2027_MB0818C"
+ /note="Mb0818c, -, len: 198 aa. Equivalent to 3' end of
+ Rv0794c, len: 499 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 203 aa overlap).
+ Probable oxidoreductase (EC 1.-.-.-), possibly
+ dihydrolipoamide dehydrogenase (EC 1.8.1.4) or mercuric
+ reductase (EC 1.16.1.1). Highly similar to
+ CAB62675.1|AL133422 probable oxidoreductase from
+ Streptomyces coelicolor (477 aa); and similar to various
+ oxidoreductases e.g. P08663|MERA_STAAU MERCURIC REDUCTASE
+ (HG(II) REDUCTASE) (EC 1.16.1.1) from Staphylococcus
+ aureus (547 aa); AAK70920.1|AC087551_19|AC087551 putative
+ lipoamide dehydrogenase from Oryza sativa (563 aa);
+ NP_437349.1|NC_003078 putative FAD-dependent pyridine
+ nucleotide-disulphide oxidoreductase, similar to mercuric
+ reductases protein from Sinorhizobium meliloti (473 aa);
+ Q04829|DLDH_HALVO DIHYDROLIPOAMIDE DEHYDROGENASE (EC
+ 1.8.1.4) from Haloferax volcanii (475 aa);
+ P08332|MERA_SHIFL MERCURIC REDUCTASE (EC 1.16.1.1) (564
+ aa), FASTA scores: opt: 522, E(): 3.7e-26, (31.7% identity
+ in 467 aa overlap);
+ P72740|DLDH_SYNY3|Q53395|LPDA|PDHD|SLR1096
+ DIHYDROLIPOAMIDE DEHYDROGENASE (EC 1.8.1.4) from
+ Synechocystis sp. strain PCC 6803 (474 aa), FASTA scores:
+ opt: 602, E(): 2.3e-31, (31.0% identity in 493 aa
+ overlap); etc. Note that previously known as lpdB.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0794c exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a single
+ base deletion (a-*) splits Mb0818c into 2 parts, Mb0818
+ and Mb0819. Protein product from Mb0818c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0818c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE [SECOND PART]"
+ /protein_id="SIT99417.1"
+ /db_xref="GOA:A0A1R3XWG6"
+ /db_xref="InterPro:IPR004099"
+ /db_xref="InterPro:IPR016156"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWG6"
+ /translation="MTPGSWLDVDDTCRVRAVDDGWLYAAGDVNHRALLTHQGKYQAR
+ IAGTAIGARAAGRPLDTTSWGMHATTADHHAVPQAFFTDPEAAAVGLTADQAAQAGHR
+ IKAIDVEIGDVVMGAKLFADGYTGRARMVVDVDRGHLLGVTMVGPGAAELLHSATVAV
+ AGQVPIDRLWHAVPCFPTISELWLRLLESYRDSFYLLV"
+ gene complement(889926..890825)
+ /locus_tag="BQ2027_MB0819C"
+ CDS complement(889926..890825)
+ /locus_tag="BQ2027_MB0819C"
+ /note="Mb0819c, -, len: 299 aa. Equivalent to 5' end of
+ Rv0794c, len: 499 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 263 aa overlap).
+ Probable oxidoreductase (EC 1.-.-.-), possibly
+ dihydrolipoamide dehydrogenase (EC 1.8.1.4) or mercuric
+ reductase (EC 1.16.1.1). Highly similar to
+ CAB62675.1|AL133422 probable oxidoreductase from
+ Streptomyces coelicolor (477 aa); and similar to various
+ oxidoreductases e.g. P08663|MERA_STAAU MERCURIC REDUCTASE
+ (HG(II) REDUCTASE) (EC 1.16.1.1) from Staphylococcus
+ aureus (547 aa); AAK70920.1|AC087551_19|AC087551 putative
+ lipoamide dehydrogenase from Oryza sativa (563 aa);
+ NP_437349.1|NC_003078 putative FAD-dependent pyridine
+ nucleotide-disulphide oxidoreductase, similar to mercuric
+ reductases protein from Sinorhizobium meliloti (473 aa);
+ Q04829|DLDH_HALVO DIHYDROLIPOAMIDE DEHYDROGENASE (EC
+ 1.8.1.4) from Haloferax volcanii (475 aa);
+ P08332|MERA_SHIFL MERCURIC REDUCTASE (EC 1.16.1.1) (564
+ aa), FASTA scores: opt: 522, E(): 3.7e-26, (31.7% identity
+ in 467 aa overlap);
+ P72740|DLDH_SYNY3|Q53395|LPDA|PDHD|SLR1096
+ DIHYDROLIPOAMIDE DEHYDROGENASE (EC 1.8.1.4) from
+ Synechocystis sp. strain PCC 6803 (474 aa), FASTA scores:
+ opt: 602, E(): 2.3e-31, (31.0% identity in 493 aa
+ overlap); etc. Note that previously known as lpdB.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0794c exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a single
+ base deletion (a-*) splits Mb0818c into 2 parts, Mb0818a
+ and Mb0818b. Mb0819c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE [FIRST PART]"
+ /protein_id="SIT99418.1"
+ /db_xref="GOA:A0A1R3XWG0"
+ /db_xref="InterPro:IPR023753"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWG0"
+ /translation="MTAAQQDQAPMATPGCREGETYDVVVLGAGPVGQNVADRARAGG
+ LRVAVVERELVGGECSYWACVPSKALLRPVIAISDARRVDGAREAVDGSINTAGVFGR
+ RNRYVAHWDDTGQADWVSGIGATLIRGDGRLDGPRRVVVTKSSGESVALTARHAVVIC
+ TGSRPALPDLPGITEARPWTNRQATDNSTVPDRLAIVGAGGVGVEMATAWQGLGASVT
+ LLARGSGLLPRMEPFVGELIGRGLADAGVDVRVGVSVRALGRPNPLAQWSSSWTTVPS
+ CGSTRYSSPPAEHREPTTSAWRQ"
+ gene 891218..892312
+ /locus_tag="BQ2027_MB0820"
+ CDS 891218..892312
+ /locus_tag="BQ2027_MB0820"
+ /note="Mb0820, -, len: 364 aa. Equivalent to Rv0797, len
+ 364 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 364 aa overlap). Putative transposase
+ for IS1547; almost identical to (but 20 aa shorter than)
+ Y13470|MTY13470_2 from Mycobacterium tuberculosis (383
+ aa). Also similar to other transposases e.g. MAIS1110A
+ _1|Q48909 transposase from M. avium (464 aa), FASTA
+ scores: opt: 226, E(): 2.4e-08, (30.7% identity in 199 aa
+ overlap). Also slight similarity to Rv2014|MTCY39.03c from
+ Mycobacterium tuberculosis (222 aa), FASTA score: (24.8%
+ identity in 141 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE TRANSPOSASE FOR INSERTION SEQUENCE
+ ELEMENT IS1547"
+ /protein_id="SIT99419.1"
+ /db_xref="GOA:A0A1R3XWH1"
+ /db_xref="InterPro:IPR002525"
+ /db_xref="InterPro:IPR003346"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWH1"
+ /translation="MVVVGTDAHKYSHTFVATDEVGRQLGEKTVKATTAGHATAIMWA
+ REQFGLELIWGIEDCRNMSARLERDLLAAGQQVVRVPTKLMAQTRKSARSRGKSDPID
+ ALAVARAVLRETDLPLATHDETSRELKLLTDRRDVLVAQRTSAINRLRWLVHELDPER
+ APAARSLDAAKHQQALRTWLDTQPGLVAELARAELTDIIRLTGEINTLAQRISARVHQ
+ VAPALLEIPGCAELTAAKIVGEAAGVTRFKSEAAFACHAAVAPIPVWSGNTAGQMRLS
+ RSGNRQLNAALHRIALTQIRMTDSRGQAYYQRLQDAGKTKRAALRCLKRRLARTVFQA
+ LRTVHQPSSEHTQPAAACHRSYCSRSCLSG"
+ gene 891218..892309
+ /locus_tag="BQ2027_IS1547-1"
+ mobile_element 891218..892309
+ /locus_tag="BQ2027_IS1547-1"
+ /note="IS1547-1, len: 1092 nt. Equivalent to IS1547, len:
+ 1092 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(99.7% identity in 1092 nt overlap)."
+ /mobile_element_type="insertion sequence:IS1547"
+ gene complement(892302..893099)
+ /gene="cfp29"
+ /locus_tag="BQ2027_MB0821C"
+ CDS complement(892302..893099)
+ /gene="cfp29"
+ /locus_tag="BQ2027_MB0821C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0821c, cfp29, len: 265 aa. Equivalent to Rv0798c,
+ len: 265 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 265 aa overlap). cfp29, 29 kDa antigen
+ (see citations below). Highly similar to
+ Q45296|BLLINM18P_1|CAA63787.1|X93588 linocin M18 from
+ Brevibacterium linens (266 aa), FASTA scores: (58.5%
+ identity in 265 aa overlap). Also shows similarity with
+ NP_228594.1|NC_000853 bacteriocin from Thermotoga maritima
+ (262 aa). Protein product from Mb0821c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0821c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="29 KDa ANTIGEN CFP29"
+ /protein_id="SIT99420.1"
+ /db_xref="GOA:A0A1R3XWH2"
+ /db_xref="InterPro:IPR007544"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWH2"
+ /translation="MNNLYRDLAPVTEAAWAEIELEAARTFKRHIAGRRVVDVSDPGG
+ PVTAAVSTGRLIDVKAPTNGVIAHLRASKPLVRLRVPFTLSRNEIDDVERGSKDSDWE
+ PVKEAAKKLAFVEDRTIFEGYSAASIEGIRSASSNPALTLPEDPREIPDVISQALSEL
+ RLAGVDGPYSVLLSADVYTKVSETSDHGYPIREHLNRLVDGDIIWAPAIDGAFVLTTR
+ GGDFDLQLGTDVAIGYASHDTDTVRLYLQETLTFLCYTAEASVALSH"
+ gene complement(893096..894103)
+ /locus_tag="BQ2027_MB0822C"
+ CDS complement(893096..894103)
+ /locus_tag="BQ2027_MB0822C"
+ /note="Mb0822c, -, len: 335 aa. Equivalent to Rv0799c,
+ len: 335 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 335 aa overlap). Conserved
+ hypothetical protein, similar to Q50021|U2266C from
+ Mycobacterium leprae (146 aa), FASTA scores: opt: 147,
+ E(): 0.0016, (33.3% identity in 117 aa overlap);
+ Q50020|U2266B from Mycobacterium leprae (27 aa), FASTA
+ scores: opt: 94, E(): 1.3, (56.5% identity in 23 aa
+ overlap). Also highly similar to others e.g.
+ CAC01593.1|AL391041 conserved hypothetical protein from
+ Streptomyces coelicolor (316 aa); AF088897|AF088897_9
+ hypothetical protein from Zymomonas mobilis (322 aa),
+ FASTA scores: opt: 1132, E(): 0, (56.1% identity in 303 aa
+ overlap); P76536|ECAE000330_8 hypothetical protein from
+ Escherichia coli strain K-12 (308 aa), FASTA scores: E():
+ 2.2e-30, (37.4% identity in 297 aa overlap); etc. Also
+ similar to some tyrA proteins. Protein product from
+ Mb0822c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0822c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted dye-decolorizing peroxidase (DyP),
+ encapsulated subgroup"
+ /protein_id="SIT99421.1"
+ /db_xref="GOA:A0A1R3XWG4"
+ /db_xref="InterPro:IPR006314"
+ /db_xref="InterPro:IPR011008"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWG4"
+ /translation="MAVPAVSPQPILAPLTPAAIFLVATIGADGEATVHDALSKISGL
+ VRAIGFRDPTKHLSVVVSIGSDAWDRLFAGPRPTELHPFVELTGPRHTAPATPGDLLF
+ HIRAETMDVCFELAGRILKSMGDAVTVVDEVHGFRFFDNRDLLGFVDGTENPSGPIAI
+ KATTIGDEDRNFAGSCYVHVQKYVHDMASWESLSVTEQERVIGRTKLDDIELDDNAKP
+ ANSHVALNVITDDDGTERKIVRHNMPFGEVGKGEYGTYFIGYSRTPTVTEQMLRNMFL
+ GDPAGNTDRVLDFSTAVTGGLFFSPTIDFLDHPPPLPQAATPTLAAGSLSIGSLKGSP
+ R"
+ gene 894148..895449
+ /gene="pepC"
+ /locus_tag="BQ2027_MB0823"
+ CDS 894148..895449
+ /gene="pepC"
+ /locus_tag="BQ2027_MB0823"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0823, pepC, len: 433 aa. Equivalent to Rv0800,
+ len: 433 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 433 aa overlap). Probable pepC,
+ aminopeptidase I (EC 3.4.11.-), highly similar (but
+ shorter 17 aa) to Q50022|PEPX AMINOPEPTIDASE from
+ Mycobacterium leprae (443 aa), FASTA scores: opt: 2237,
+ E(): 0, (78.3% identity in 433 aa overlap). Also highly
+ similar to others from Eukaryotes and bacteria, e.g.
+ T36482 probable aminopeptidase from Streptomyces
+ coelicolor (432 aa), P14904|AMPL_YEAST vacuolar
+ aminopeptidase I precursor from Saccharomyces cerevisiae
+ (514 aa), FASTA scores: opt: 425, E(): 4.8e-21, (31.0%
+ identity in 445 aa overlap); etc. Also similar to
+ hypothetical proteins e.g. P38821|YHR3_YEAST hypothetical
+ 54.2 kd protein from Saccharomyces cerevisiae (490 aa),
+ FASTA scores: opt: 429, E(): 2.5e-21, (34.8% identity in
+ 443 aa overlap); etc. Protein product from Mb0823 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0823 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE AMINOPEPTIDASE PEPC"
+ /protein_id="SIT99422.1"
+ /db_xref="GOA:P59951"
+ /db_xref="InterPro:IPR001948"
+ /db_xref="InterPro:IPR022984"
+ /db_xref="InterPro:IPR023358"
+ /db_xref="UniProtKB/Swiss-Prot:P59951"
+ /translation="MAATAHGLCEFIDASPSPFHVCATVAGRLLGAGYRELREADRWP
+ DKPGRYFTVRAGSLVAWNAEQSGHTQVPFRIVGAHTDSPNLRVKQHPDRLVAGWHVVA
+ LQPYGGVWLHSWLDRDLGISGRLSVRDGTGVSHRLVRIDDPILRVPQLAIHLAEDRKS
+ LTLDPQRHINAVWGVGERVESFVGYVAQRAGVAAADVLAADLMTHDLTPSALIGASVN
+ GTASLLSAPRLDNQASCYAGMEALLAVDVDSASSGFVPVLAIFDHEEVGSASGHGAQS
+ DLLSSVLERIVLAAGGTREDFLRRLTTSMLASADMAHATHPNYPDRHEPSHPIEVNAG
+ PVLKVHPNLRYATDGRTAAAFALACQRAGVPMQRYEHRADLPCGSTIGPLAAARTGIP
+ TVDVGAAQLAMHSARELMGAHDVAAYSAALQAFLSAELSEA"
+ gene 895461..895808
+ /locus_tag="BQ2027_MB0824"
+ CDS 895461..895808
+ /locus_tag="BQ2027_MB0824"
+ /note="Mb0824, -, len: 115 aa. Equivalent to Rv0801, len:
+ 115 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 115 aa overlap). Conserved
+ hypothetical protein, similar to many hypothetical
+ proteins from Streptomyces sp. e.g.
+ SCD840A.20|AB81865.1|AL161691 hypothetical protein from
+ Streptomyces coelicolor (145 aa); AF072709|AF072709_8 from
+ Streptomyces lividans (131 aa), FASTA scores: opt: 120,
+ E(): 0.2, (26.3% identity in 118 aa overlap); etc. Protein
+ product from Mb0824 detected using shotgun mass
+ spectrometry. Mb0824 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Glyoxalase family protein"
+ /protein_id="SIT99423.1"
+ /db_xref="InterPro:IPR029068"
+ /db_xref="InterPro:IPR037523"
+ /db_xref="InterPro:IPR041581"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXF9"
+ /translation="MALKVEMVTFDCSDPAKLAGWWAEQFDGTTRELLPGEFVVVART
+ DGPRLGFQKVPDPAPGKNRVHLDFTTKDLDAEVLRLVAAGASEVGRHQVGESFRWVVL
+ ADPEGNAFCVAGQ"
+ gene complement(895802..896458)
+ /locus_tag="BQ2027_MB0825C"
+ CDS complement(895802..896458)
+ /locus_tag="BQ2027_MB0825C"
+ /note="Mb0825c, -, len: 218 aa. Equivalent to Rv0802c,
+ len: 218 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 218 aa overlap). Conserved
+ hypothetical protein, showing partial similarity with many
+ acetyltransferases and hypothetical proteins e.g.
+ P96579|BSUB0003_68 PROBABLE ACETYLTRANSFERASE from
+ Bacillus subtilis (183 aa), FASTA scores: E(): 0.0044,
+ (26.4% identity in 110 aa overlap). Protein product from
+ Mb0825c detected using SWATH mass spectrometry. Mb0825c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible succinyltransferase in the gcn5-related
+ n-acetyltransferase family"
+ /protein_id="SIT99424.1"
+ /db_xref="GOA:A0A1R3XWJ0"
+ /db_xref="InterPro:IPR000182"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWJ0"
+ /translation="MSRHWPLFDLRITTPRLQLQLPTEELCDQLIDTILEGVHDPDRM
+ PFSVPWTRASREDLPFNTLSHLWQQLAGFKRDDWSLPLAVLVDGRAVGVQALSSKDFP
+ ITRQVDSGSWLGLRYQGHGYGTEMRAAVLYFAFAELEAQVATSRSFVDNPASIAVSRR
+ NGYRDNGLDRVAREGAMAEALLFRLTRDDWQRHRTVEVRVDGFDRCRPLFGPLEPPRY
+ "
+ gene 896650..898914
+ /gene="purL"
+ /locus_tag="BQ2027_MB0826"
+ CDS 896650..898914
+ /gene="purL"
+ /locus_tag="BQ2027_MB0826"
+ /note="Mb0826, purL, len: 754 aa. Equivalent to Rv0803,
+ len: 754 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 754 aa overlap). purL,
+ phosphoribosylformylglycinamidine synthase II (EC 6.3.5.3)
+ (see citations below), equivalent to NP_302451.1|NC_002677
+ phosphoribosylformylglycinamidine synthase II from
+ Mycobacterium leprae (754 aa). Also highly similar to
+ others e.g. Q9RKK5|PURL_STRCO from Streptomyces coelicolor
+ (752 aa); P12042|PURL_BACSU from Bacillus subtilis (742
+ aa), FASTA score: (44.7% identity in 716 aa); etc. Start
+ was chosen by similarity. BELONGS TO THE FGAMS FAMILY.
+ Protein product from Mb0826 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0826 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PHOSPHORIBOSYLFORMYLGLYCINAMIDINE SYNTHASE II
+ PURL (FGAM SYNTHASE II)"
+ /protein_id="SIT99425.1"
+ /db_xref="GOA:P0A5T9"
+ /db_xref="InterPro:IPR010074"
+ /db_xref="InterPro:IPR010918"
+ /db_xref="InterPro:IPR016188"
+ /db_xref="InterPro:IPR036676"
+ /db_xref="InterPro:IPR036921"
+ /db_xref="InterPro:IPR041609"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5T9"
+ /translation="MLDTVEHAATTPDQPQPYGELGLKDDEYRRIRQILGRRPTDTEL
+ AMYSVMWSEHCSYKSSKVHLRYFGETTSDEMRAAMLAGIGENAGVVDIGDGWAVTFKV
+ ESHNHPSYVEPYQGAATGVGGIVRDIMAMGARPVAVMDQLRFGAADAPDTRRVLDGVV
+ RGIGGYGNSLGLPNIGGETVFDPCYAGNPLVNALCVGVLRQEDLHLAFASGAGNKIIL
+ FGARTGLDGIGGVSVLASDTFDAEGSRKKLPSVQVGDPFMEKVLIECCLELYAGGLVI
+ GIQDLGGAGLSCATSELASAGDGGMTIQLDSVPLRAKEMTPAEVLCSESQERMCAVVS
+ PKNVDAFLAVCRKWEVLATVIGEVTDGDRLQITWHGETVVDVPPRTVAHEGPVYQRPV
+ ARPDTQDALNADRSAKLSRPVTGDELRATLLALLGSPHLCSRAFITEQYDRYVRGNTV
+ LAEHADGGMLRIDESTGRGIAVSTDASGRYTLLDPYAGAQLALAEAYRNVAVTGATPV
+ AVTNCLNFGSPEDPGVMWQFTQAVRGLADGCADLGIPVTGGNVSFYNQTGSAAILPTP
+ VVGVLGVIDDVRRRIPTGLGAEPGETLMLLGDTRDEFDGSVWAQVTADHLGGLPPVVD
+ LAREKLLAAVLSSASRDGLVSAAHDLSEGGLAQAIVESALAGETGCRIVLPEGADPFV
+ LLFSESAGRVLVAVPRTEESRFRGMCEARGLPAVRIGVVDQGSDAVEVQGLFAVSLAE
+ LRATSEAVLPRYFG"
+ gene 898911..899540
+ /locus_tag="BQ2027_MB0827"
+ CDS 898911..899540
+ /locus_tag="BQ2027_MB0827"
+ /note="Mb0827, -, len: 209 aa. Equivalent to Rv0804, len:
+ 209 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 209 aa overlap). Conserved
+ hypothetical protein, showing similarity with C-terminus
+ of Rv1863c|MTCY359.10 CONSERVED HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (256 aa), FASTA scores: opt:
+ 199, E(): 1.2e-05, (33.2% identity in 220 aa overlap); and
+ Rv0658c. Contains PS01151 Fimbrial biogenesis outer
+ membrane usher protein signature. Mb0827 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Integral membrane protein"
+ /protein_id="SIT99426.1"
+ /db_xref="GOA:A0A1R3XWG8"
+ /db_xref="InterPro:IPR003675"
+ /db_xref="InterPro:IPR015837"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWG8"
+ /translation="MSRLRALSLAAGLVGWSLVSPRLPAPWRIPLQAGLGSVLVLVTR
+ ATMGLWPPRLWAGLRLGWAAGAAAATAIAATTPVPMVRLSMSARELPASVPVWLVWHI
+ PGGTVWAEEAAFRGALATIGARAFGRSGGRILQAGAFGLSHIADARATGEPLVLTVLA
+ TGIAGWMFGWLADRSGSLAAPLLTHLAINEAGAVAAVLVQRRSGISTRL"
+ gene 899661..900617
+ /locus_tag="BQ2027_MB0828"
+ CDS 899661..900617
+ /locus_tag="BQ2027_MB0828"
+ /note="Mb0828, -, len: 318 aa. Equivalent to Rv0805, len:
+ 318 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 318 aa overlap). Conserved
+ hypothetical protein, equivalent to Q50024 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium leprae (317 aa),
+ FASTA scores: opt: 1713, E(): 0, (82.5% identity in 315 aa
+ overlap). Also shows similarity with hypothetical proteins
+ and icc proteins e.g. SC9B1.22c|T35867 hypothetical
+ protein from Streptomyces coelicolor (305 aa);
+ P36650|ICC_ECOLI icc protein from Escherichia coli (275
+ aa), FASTA scores: opt: 310, E(): 8.9e-14, (31.3% identity
+ in 214 aa overlap); etc. Mb0828 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="class iii cyclic nucleotide phosphodiesterase
+ (cnmp pde)"
+ /protein_id="SIT99427.1"
+ /db_xref="GOA:A0A1R3XWH6"
+ /db_xref="InterPro:IPR004843"
+ /db_xref="InterPro:IPR026575"
+ /db_xref="InterPro:IPR029052"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWH6"
+ /translation="MHRLRAAEHPRPDYVLLHISDTHLIGGDRRLYGAVDADDRLGEL
+ LEQLNQSGLRPDAIVFTGDLADKGEPAAYRKLRGLVEPFAAQLGAELVWVMGNHDDRA
+ ELRKFLLDEAPSMAPLDRVCMIDGLRIIVLDTSVPGHHHGEIRASQLGWLAEELATPA
+ PDGTILALHHPPIPSVLDMAVTVELRDQAALGRVLRGTDVRAILAGHLHYSTNATFVG
+ IPVSVASATCYTQDLTVAAGGTRGRDGAQGCNLVHVYPDTVVHSVIPLGGGETVGTFV
+ SPGQARRKIAESGIFIEPSRRDSLFKHPPMVLTSSAPRSPVD"
+ gene complement(900562..902160)
+ /gene="cpsY"
+ /locus_tag="BQ2027_MB0829C"
+ CDS complement(900562..902160)
+ /gene="cpsY"
+ /locus_tag="BQ2027_MB0829C"
+ /note="Mb0829c, cpsY, len: 532 aa. Equivalent to Rv0806c,
+ len: 532 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 532 aa overlap). Possible cpsY,
+ UDP-glucose-4-epimerase (EC 5.1.3.2), equivalent to
+ Q50025|CPSY probable UDP-glucose-4-epimerase from
+ Mycobacterium leprae (542 aa), FASTA scores: opt: 2964,
+ E(): 0, (82.3% identity in 530 aa overlap). Also similar
+ to AAC38286.1|AF019760|SACB CpsY homolog (involved in
+ meningococcal capsule biosynthesis) from Neisseria
+ meningitidis serogroup A (545 aa); Q51151 CAPSULE GENE
+ COMPLEX UPD-GLUCOSE-4-EPIMERASE (GALE) from Neisseria
+ meningitidis (373 aa), FASTA scores: opt: 496, E():
+ 9.5e-27, (29.3% identity in 358 aa overlap); C-terminus of
+ CAB75373.1|AL139298 putative transferase from Streptomyces
+ coelicolor (942 aa); and many hypothetical proteins from
+ Streptomyces coelicolor. SEEMS TO BELONG TO THE SUGAR
+ EPIMERASE FAMILY. Protein product from Mb0829c detected
+ using SWATH mass spectrometry. Mb0829c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE UDP-GLUCOSE-4-EPIMERASE CPSY
+ (GALACTOWALDENASE) (UDP-GALACTOSE-4-EPIMERASE) (URIDINE
+ DIPHOSPHATE GALACTOSE-4-EPIMERASE) (URIDINE
+ DIPHOSPHO-GALACTOSE-4-EPIMERASE)"
+ /protein_id="SIT99428.1"
+ /db_xref="GOA:Q7U184"
+ /db_xref="InterPro:IPR021520"
+ /db_xref="InterPro:IPR031356"
+ /db_xref="InterPro:IPR031357"
+ /db_xref="InterPro:IPR031358"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U184"
+ /translation="MPKISSRDGGRPAQRTVNPIIVTRRGKIARLESGLTPQEAQIED
+ LVFLRKVLNRADIPYLLIRNHKNRPVLAINIELRAGLERALAAACATEPMYAKTIDEP
+ GLSPVLVATDGLSQLVDPRVVRLYRRRIAPGGFRYGPAFGVELQFWVYEETVIRCPVE
+ NSLSRKVLPRNEITPTNVKLYGYKWPTLDGMFAPHASDVVFDIDMVFSWVDGSDPEFR
+ ARRMAQMSQYVVGEGDDAEARIRQIDELKYALRSVNMFAPWIRRIFIATDSTPPPWLA
+ EHPKITIVRAEDHFSDRSALPTYNSHAVESQLHHIPGLSEHFLYSNDDMFFGRPLKAS
+ MFFSPGGVTRFIEAKTRIGLGANNPARSGFENAARVNRQLLFDRFGQVITRHLEHTAV
+ PLRKSVLIEMEREFPEEFARTAASPFRSDTDISVTNSFYHYYALMTGRAVPQEKAKVL
+ YVDTTSYAGLRLLPKLRKHRGYDFFCLNDGSFPEVPAAQRAERVVSFLERYFPIPAPW
+ EKIAADVSRRDFAVPRTSAPSEGA"
+ gene 902465..902854
+ /locus_tag="BQ2027_MB0830"
+ CDS 902465..902854
+ /locus_tag="BQ2027_MB0830"
+ /note="Mb0830, -, len: 129 aa. Equivalent to Rv0807, len:
+ 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 129 aa overlap). Conserved
+ hypothetical protein, equivalent to O05761|MLCB5_31
+ HYPOTHETICAL 14.0 KD PROTEIN from Mycobacterium leprae
+ (131 aa), FASTA scores: E(): 0, (73.4% identity in 128 aa
+ overlap). Also highly similar to BAA89438.1|AB003158|ORF3
+ HYPOTHETICAL PROTEIN from Corynebacterium ammoniagenes
+ (132 aa); and C-terminus of SCD25.20|CAB56364.1|AL118514
+ hypothetical protein from Streptomyces coelicolor (202
+ aa). Protein product from Mb0830 detected using SWATH mass
+ spectrometry. Mb0830 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99429.1"
+ /db_xref="InterPro:IPR041629"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWH8"
+ /translation="MSARDRVDPAKTRQVVLALADWLRDETLPAPDTDVLAAAVRLTA
+ RTLAALAPGASVEVRIPPFAAVQCISGPRHTRGTPPNVVQTDPRTWLLVATGLSGVAQ
+ ARGSGALQLSGSRAGEIEAWLPLVDLG"
+ gene 902941..904524
+ /gene="purF"
+ /locus_tag="BQ2027_MB0831"
+ CDS 902941..904524
+ /gene="purF"
+ /locus_tag="BQ2027_MB0831"
+ /note="Mb0831, purF, len: 527 aa. Equivalent to Rv0808,
+ len: 527 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 527 aa overlap). Probable purF,
+ amidophosphoribosyltransferase (EC 2.4.2.14), equivalent
+ to MLCB5_32|Q50028|PURF from Mycobacterium leprae (556
+ aa), FASTA scores: (91.3% identity in 518 aa overlap); and
+ CAB96578.1|AJ278609 phosphoribosyl pyrophosphate
+ amidotransferase from Mycobacterium smegmatis (511 aa).
+ Also highly similar to others e.g. BAA89439.1|AB003158
+ amidophosphoribosyl transferase from Corynebacterium
+ ammoniagenes (490 aa); P00497|PUR1_BACSU
+ amidophosphoribosyltransferase precursor from Bacillus
+ subtilis (476 aa), FASTA scores: opt: 1412, E(): 0, (46.2%
+ identity in 470 aa overlap); etc. Contains PS00103
+ Purine/pyrimidine phosphoribosyl transferases signature.
+ BELONGS TO THE PURINE/PYRIMIDINE PHOSPHORIBOSYLTRANSFERASE
+ FAMILY. Protein product from Mb0831 detected using SWATH
+ mass spectrometry. Mb0831 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="amidophosphoribosyltransferase purf (glutamine
+ phosphoribosylpyrophosphate amidotransferase) (atase)
+ (gpatase)"
+ /protein_id="SIT99430.1"
+ /db_xref="GOA:P65830"
+ /db_xref="InterPro:IPR000836"
+ /db_xref="InterPro:IPR005854"
+ /db_xref="InterPro:IPR017932"
+ /db_xref="InterPro:IPR029055"
+ /db_xref="InterPro:IPR029057"
+ /db_xref="InterPro:IPR035584"
+ /db_xref="UniProtKB/Swiss-Prot:P65830"
+ /translation="MAVDSDYVTDRAAGSRQTVTGQQPEQDLNSPREECGVFGVWAPG
+ EDVAKLTYYGLYALQHRGQEAAGIAVADGSQVLVFKDLGLVSQVFDEQTLAAMQGHVA
+ IGHCRYSTTGDTTWENAQPVFRNTAAGTGVALGHNGNLVNAAALAARARDAGLIATRC
+ PAPATTDSDILGALLAHGAADSTLEQAALDLLPTVRGAFCLTFMDENTLYACRDPYGV
+ RPLSLGRLDRGWVVASETAALDIVGASFVRDIEPGELLAIDADGVRSTRFANPTPKGC
+ VFEYVYLARPDSTIAGRSVHAARVEIGRRLARECPVEADLVIGVPESGTPAAVGYAQE
+ SGVPYGQGLMKNAYVGRTFIQPSQTIRQLGIRLKLNPLKEVIRGKRLIVVDDSIVRGN
+ TQRALVRMLREAGAVELHVRIASPPVKWPCFYGIDFPSPAELIANAVENEDEMLEAVR
+ HAIGADTLGYISLRGMVAASEQPTSRLCTACFDGKYPIELPRETALGKNVIEHMLANA
+ ARGAALGELAADDEVPVGR"
+ gene 904555..905649
+ /gene="purM"
+ /locus_tag="BQ2027_MB0832"
+ CDS 904555..905649
+ /gene="purM"
+ /locus_tag="BQ2027_MB0832"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0832, purM, len: 364 aa. Equivalent to Rv0809,
+ len: 364 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 364 aa overlap). Probable purM,
+ 5'-phosphoribosyl-5-aminoimidazole synthetase (EC
+ 6.3.3.1), equivalent to NP_302446.1|NC_002677
+ 5'-phosphoribosyl-5-aminoimidazole synthase from
+ Mycobacterium leprae (364 aa). Also highly similar to many
+ e.g. P12043|PUR5_BACSU PHOSPHORIBOSYLFORMYLGLYCINAMIDINE
+ CYCLO-LIGASE from Bacillus subtilis (346 aa), FASTA
+ scores: opt: 1023, E(): 0, (46.5% identity in 331 aa
+ overlap); U68765|STU68765_2 from Salmonella typhimurium
+ (345 aa), FASTA scores: opt: 1014, E():0, (47.6% identity
+ in 330 aa overlap); etc. Protein product from Mb0832
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0832 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHORIBOSYLFORMYLGLYCINAMIDINE
+ CYCLO-LIGASE PURM (AIRS) (PHOSPHORIBOSYL-AMINOIMIDAZOLE
+ SYNTHETASE) (AIR SYNTHASE)"
+ /protein_id="SIT99431.1"
+ /db_xref="GOA:A0A1R3XWH4"
+ /db_xref="InterPro:IPR004733"
+ /db_xref="InterPro:IPR010918"
+ /db_xref="InterPro:IPR016188"
+ /db_xref="InterPro:IPR036676"
+ /db_xref="InterPro:IPR036921"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWH4"
+ /translation="MTDLAKGPGKDPGSRGITYASAGVDIEAGDRAIDLFKPLASKAT
+ RPEVRGGLGGFAGLFTLRGDYREPVLAASSDGVGTKLAIAQAMDKHDTVGLDLVAMVV
+ DDLVVCGAEPLFLLDYIAVGRIVPERLSAIVAGIADGCMRAGCALLGGETAEHPGLIE
+ PDHYDISATGVGVVEADNVLGPDRVKPGDVIIAMGSSGLHSNGYSLVRKVLLEIDRMN
+ LAGHVEEFGRTLGEELLEPTRIYAKDCLALAAETRVRTFCHVTGGGLAGNLQRVIPHG
+ LIAEVDRGTWTPAPVFTMIAQRGRVRRTEMEKTFNMGVGMIAVVAPEDTTRALAVLTA
+ RHLDCWVLGTVCKGGKQGPRAKLVGQHPRF"
+ gene complement(905735..905917)
+ /locus_tag="BQ2027_MB0833C"
+ CDS complement(905735..905917)
+ /locus_tag="BQ2027_MB0833C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0833c, -, len: 60 aa. Equivalent to Rv0810c, len:
+ 60 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 60 aa overlap). Conserved hypothetical
+ protein, with its N-terminus highly similar to
+ NP_302445.1|NC_002677 conserved hypothetical protein from
+ Mycobacterium leprae (62 aa); and AL118514|SCD25_24
+ hypothetical protein from Streptomyces coelicolor (84 aa),
+ FASTA scores: opt: 180, E(): 5.7e-07, (51.8% identity in
+ 56 aa overlap). TBparse score is 0.876. Protein product
+ from Mb0833c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0833c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99432.1"
+ /db_xref="InterPro:IPR021426"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYL1"
+ /translation="MGRGRAKAKQTKVARELKYSSPQTDFQRLQRELSGTGTDRLDGD
+ GPSDDDSWNDEDDWRR"
+ gene complement(906064..907170)
+ /locus_tag="BQ2027_MB0834C"
+ CDS complement(906064..907170)
+ /locus_tag="BQ2027_MB0834C"
+ /note="Mb0834c, -, len: 368 aa. Equivalent to Rv0811c,
+ len: 368 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 368 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ U2266F|U15182|MLU15182_13 HYPOTHETICAL PROTEIN from
+ Mycobacterium leprae (366 aa), FASTA scores: opt: 1870,
+ E(): 0, (77.4% identity in 367 aa overlap). Also highly
+ similar to BAA89441.1|AB003158|ORF4 HYPOTHETICAL PROTEIN
+ from Corynebacterium ammoniagenes (359 aa); and
+ CAB94085.1|AL358692 CONSERVED HYPOTHETICAL PROTEIN from
+ Streptomyces coelicolor (321 aa). Protein product from
+ Mb0834c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0834c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="tRNA-modifying protein YgfZ"
+ /protein_id="SIT99433.1"
+ /db_xref="GOA:A0A1R3XXG9"
+ /db_xref="InterPro:IPR006222"
+ /db_xref="InterPro:IPR017703"
+ /db_xref="InterPro:IPR027266"
+ /db_xref="InterPro:IPR028896"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXG9"
+ /translation="MAAVPAPDPGPDAGAIWHYGDPLGEQRAGQADAVLVDRSHRAVL
+ TLDGGDRQTWLHSISTQHVSDLPEGASTQNLSLDGQGRVEDHWIQTELGGTTYLDTEP
+ WRGEPLLAYLRKMVFWSMVTPRAADMAVLSLLGPRLAEERVLDALGLDVLPAEWLAVP
+ LAGGGIVRRMPDGLAGQIELDVVVKRGDRADWQRRLTQAGVRPAGIWAYEAHRVAHRV
+ PARRPRLGVDTDERTIPHEVGWIGGPGAGAVHLNKGCYRGQETVARVHNLGRPPRMLV
+ LLHLDESVQRPSTGDAVLAGGRTVGRLGTVVEHVELGPVALALLKRGLPGDTALVTGP
+ EAEVAAVIDVDSLPPADDVGAGRRAVERLRGGIR"
+ gene 907253..908122
+ /locus_tag="BQ2027_MB0835"
+ CDS 907253..908122
+ /locus_tag="BQ2027_MB0835"
+ /note="Mb0835, -, len: 289 aa. Equivalent to Rv0812, len:
+ 289 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 289 aa overlap). Probable amino acid
+ aminotransferase (EC 2.6.1.-), similar to other amino acid
+ aminotransferases, generelly CLASS-IV OF
+ PYRIDOXAL-PHOSPHATE-DEPENDENT AMINOTRANSFERASES, and
+ especially ILVE proteins and PABC proteins e.g.
+ B76065.1|AL157953 putative aminotransferase from
+ Streptomyces coelicolor (273 aa); NP_069766.1|NC_000917
+ branched-chain amino acid aminotransferase (ilvE) from
+ Archaeoglobus fulgidus (290 aa); P54692|DAAA_BACLI
+ D-ALANINE AMINOTRANSFERASE from Bacillus licheniformis
+ (283 aa); P28305|PABC_ECOLI 4-AMINO-4-DEOXYCHORISMATE
+ LYASE From Escherichia coli (269 aa), FASTA scores: opt:
+ 165, E(): 0.00064, (26.8% identity in 198 aa overlap);
+ etc. Note that previously known as pabC. Protein product
+ from Mb0835 detected using SWATH mass spectrometry. Mb0835
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE AMINO ACID AMINOTRANSFERASE"
+ /protein_id="SIT99434.1"
+ /db_xref="GOA:A0A1R3XWK1"
+ /db_xref="InterPro:IPR001544"
+ /db_xref="InterPro:IPR017824"
+ /db_xref="InterPro:IPR036038"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWK1"
+ /translation="MVVTLDGEILQPGMPLLHADDLAAVRGDGVFETLLVRDGRACLV
+ EAHLQRLTQSARLMDLPEPDLPRWRRAVEVATQRWVASTADEGALRLIYSRGREGGSA
+ PTAYVMVSPVPARVIGARRDGVSAITLDRGLPADGGDAMPWLMASAKTLSYAVNMAVL
+ RHAARQGAGDVIFVSTDGYVLEGPRSTVVIATDGDQGGGNPCLLTPPPWYPILRGTTQ
+ QALFEVARAKGYDCDYRALRVADLFDSQGIWLVSSMTLAARVHTLDGRRLPRTPIAEV
+ FAELVDAAIVSDR"
+ gene complement(908168..908848)
+ /locus_tag="BQ2027_MB0836C"
+ CDS complement(908168..908848)
+ /locus_tag="BQ2027_MB0836C"
+ /note="Mb0836c, -, len: 226 aa. Equivalent to Rv0813c,
+ len: 226 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 226 aa overlap). Conserved
+ hypothetical protein, highly similar to U15182|MLU15182_16
+ HYPOTHETICAL PROTEIN from Mycobacterium leprae (242 aa),
+ FASTA scores: opt: 1191, E(): 0, (78.3% identity in 226 aa
+ overlap); and NP_302442.1|NC_002677 CONSERVED HYPOTHETICAL
+ PROTEIN from Mycobacterium leprae (228 aa). Also similar
+ to AB94083.1|AL358692|SCD66.16 HYPOTHETICAL PROTEIN from
+ Streptomyces coelicolor (191 aa); and Rv2717c|MTCY05A6_37
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (164
+ aa), FASTA score: (30.4% identity in 171 aa overlap).
+ Protein product from Mb0836c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0836c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DUF1794"
+ /protein_id="SIT99435.1"
+ /db_xref="GOA:Q7U178"
+ /db_xref="InterPro:IPR012674"
+ /db_xref="InterPro:IPR014878"
+ /db_xref="InterPro:IPR022939"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U178"
+ /translation="MSSGAGSDATGAGGVHAAGSGDRAVAAAVERAKATAARNIPAFD
+ DLPVPADTANLREGADLNNALLALLPLVGVWRGEGEGRGPDGDYRFGQQIVVSHDGGD
+ YLNWESRSWRLTATGDYQEPGLREAGFWRFVADPYDPSESQAIELLLAHSAGYVELFY
+ GRPRTQSSWELVTDALARSRSGVLVGGAKRLYGIVEGGDLAYVEERVDADGGLVPHLS
+ ARLSRFVG"
+ gene complement(909011..909313)
+ /gene="sseC2"
+ /locus_tag="BQ2027_MB0837C"
+ CDS complement(909011..909313)
+ /gene="sseC2"
+ /locus_tag="BQ2027_MB0837C"
+ /note="Mb0837c, sseC2, len: 100 aa. Equivalent to Rv0814c,
+ len: 100 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 100 aa overlap). sseC2, conserved
+ hypothetical protein, highly similar to
+ AAA62972.1|U15182|MLU15182_17 hypothetical protein from
+ Mycobacterium leprae (143 aa), FASTA scores: opt: 545,
+ E(): 0, (84.0% identity in 100 aa overlap); and
+ NP_302441.1|NC_002677|Z95150|MTCY164_29 conserved
+ hypothetical protein from Mycobacterium leprae (100 aa),
+ FASTA scores: opt: 647, E(): 0, (100.0% identity in 100 aa
+ overlap). Also highly similar to M29612|SERCYSA_5
+ rhodanese-like protein from Saccharopolyspora erythraea
+ (101 aa), FASTA scores: opt: 345, E(): 1.2e-18, (57.1%
+ identity in 98 aa overlap); and similar at the C-terminus
+ to the C-terminus of CAB94069.1|AL358692 conserved
+ hypothetical protein from Streptomyces coelicolor (95 aa).
+ Identical second copy present as Rv3118|MTCY164.28|SSEC1
+ from Mycobacterium tuberculosis (100 aa) (100.0% identity
+ in 100 aa overlap). Protein product from Mb0837c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0837c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Sulfur metabolism protein SseC"
+ /protein_id="SIT99436.1"
+ /db_xref="InterPro:IPR008969"
+ /db_xref="InterPro:IPR010814"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWI1"
+ /translation="MCSGPKQGLTLPASVDLEKETVITGRVVDGDGQAVGGAFVRLLD
+ SSDEFTAEVVASATGDFRFFAAPGSWTLRALSAAGNGDAVVQPSGAGIHEVDVKIT"
+ gene complement(909315..910148)
+ /gene="cysA2"
+ /locus_tag="BQ2027_MB0838C"
+ CDS complement(909315..910148)
+ /gene="cysA2"
+ /locus_tag="BQ2027_MB0838C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0838c, cysA2, len: 277 aa. Equivalent to Rv0815c,
+ len: 277 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 277 aa overlap). Probable cysA2,
+ thiosulfate sulfurtransferase (EC 2.8.1.1), equivalent to
+ Q50036|CYSA|CYSA3|ML2198|THTR_MYCLE PUTATIVE
+ SULFURTRANSFERASE THIOSULFATE from Mycobacterium leprae
+ (277 aa). Also highly similar to other putative
+ thiosulfate sulfurtransferases e.g. P16385|THTR_SACER
+ PUTATIVE THIOSULFATE SULFURTRANSFERASE from
+ Saccharopolyspora erythraea (Streptomyces erythraeus) (281
+ aa); NP_293941.1|NC_001263 thiosulfate sulfurtransferase
+ from Deinococcus radiodurans (286 aa); etc. Identical
+ second copy present as
+ Rv3117|MTCY164.27|MT3199|O05793|cysA3 (277 aa) (100.0%
+ identity in 277 aa overlap). Contains PS00683 Rhodanese
+ C-terminal signature at C-terminus. BELONGS TO THE
+ RHODANESE FAMILY. Protein product from Mb0838c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0838c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE THIOSULFATE SULFURTRANSFERASE CYSA2
+ (RHODANESE-LIKE PROTEIN) (THIOSULFATE CYANIDE
+ TRANSSULFURASE) (THIOSULFATE THIOTRANSFERASE)"
+ /protein_id="SIT99437.1"
+ /db_xref="GOA:P59989"
+ /db_xref="InterPro:IPR001307"
+ /db_xref="InterPro:IPR001763"
+ /db_xref="InterPro:IPR036873"
+ /db_xref="UniProtKB/Swiss-Prot:P59989"
+ /translation="MARCDVLVSADWAESNLHAPKVVFVEVDEDTSAYDRDHIAGAIK
+ LDWRTDLQDPVKRDFVDAQQFSKLLSERGIANEDTVILYGGNNNWFAAYAYWYFKLYG
+ HEKVKLLDGGRKKWELDGRPLSSDPVSRPVTSYTASPPDNTIRAFRDEVLAAINVKNL
+ IDVRSPDEFSGKILAPAHLPQEQSQRPGHIPGAINVPWSRAANEDGTFKSDEELAKLY
+ ADAGLDNSKETIAYCRIGERSSHTWFVLRELLGHQNVKNYDGSWTEYGSLVGAPIELG
+ S"
+ gene complement(910441..910863)
+ /gene="thiX"
+ /locus_tag="BQ2027_MB0839C"
+ CDS complement(910441..910863)
+ /gene="thiX"
+ /locus_tag="BQ2027_MB0839C"
+ /note="Mb0839c, thiX, len: 140 aa. Equivalent to Rv0816c,
+ len: 140 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 140 aa overlap). Probable thiX,
+ thioredoxin (EC 1.-.-.-), equivalent to
+ ThiX|U15182|MLU15182_21 thioredoxin from Mycobacterium
+ leprae (172 aa), FASTA scores: opt: 556, E(): 8.8e-31,
+ (63.8% identity in 141 aa overlap); and similar to
+ AAL08576.1|AF418548_2|AF418548 thioredoxin from
+ Mycobacterium avium subsp. paratuberculosis (117 aa). Also
+ similar to other bacterial thioredoxins e.g.
+ CAB95303.1|AL359779 putative thioredoxin from Streptomyces
+ coelicolor (126 aa); P33791|THIO_STRAU|TRX|TRXA
+ THIOREDOXIN from Streptomyces aureofaciens (106 aa); etc.
+ And similar to
+ Rv3914|MT4033|MTV028.05|NP_218431.1|NC_000962|trxC
+ THIOREDOXIN (TRX) (MPT46) from Mycobacterium tuberculosis
+ (116 aa). Has hydrophobic stretch at N-terminus. SEEMS TO
+ BELONG TO THE THIOREDOXIN FAMILY."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE THIOREDOXIN THIX"
+ /protein_id="SIT99438.1"
+ /db_xref="GOA:A0A1R3XWH9"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWH9"
+ /translation="MTTMIVASVATGALATIARWLLTRRSVILREVGPETTPAAPART
+ AELGLSGAGPTVVHFRAPGCAPCDRVRRGVGDVCADLGDVAHIEVDLDSNPQAARRFS
+ VLSLPTTLIFDVDGRQRYRTSGVPKAADLRSALKPLLA"
+ gene complement(910860..911672)
+ /locus_tag="BQ2027_MB0840C"
+ CDS complement(910860..911672)
+ /locus_tag="BQ2027_MB0840C"
+ /note="Mb0840c, -, len: 270 aa. Equivalent to Rv0817c,
+ len: 270 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 270 aa overlap). Probable conserved
+ exported protein, with N-terminal signal sequence,
+ equivalent (but shorter 13 aa) to
+ U15182|MLU15182_22|U2266M probable exported protein from
+ Mycobacterium leprae (283 aa), FASTA scores: opt: 1287,
+ E(): 0, (73.0% identity in 270 aa overlap). Protein
+ product from Mb0840c detected using SWATH mass
+ spectrometry. Mb0840c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED EXPORTED PROTEIN"
+ /protein_id="SIT99439.1"
+ /db_xref="InterPro:IPR021373"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWI7"
+ /translation="MPMRKVLVGVTGAAIVVAVLIVGAVGADFGASIYAEYRLSTTVR
+ KAANLRSDPFVAILRFPFIPQAMREHYAELEIKAFAVEHAGSGTATLEATMHSIDLSY
+ ASWLIRPDAKLPVGELESRIIIDSMHLGRYLGISDLMVAAPRQESNDATGGTTESGIS
+ GSRGLVFSGTPISANFAHRVSVLVDLSVASDDRATLVITPTAVVTGPDTADQPVPDDK
+ RDAVLHAFASKLPNQKLPFGVVPNTVGARGSDVIIEGITRGVTISLDEFKQS"
+ gene 911802..912569
+ /locus_tag="BQ2027_MB0841"
+ CDS 911802..912569
+ /locus_tag="BQ2027_MB0841"
+ /note="Mb0841, -, len: 255 aa. Equivalent to Rv0818, len:
+ 255 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 255 aa overlap). Probable
+ transcriptional regulatory protein, highly similar to
+ Q05943|GLNR_STRCO|L03213|STMGLNR_1|SCD84.26c
+ TRANSCRIPTIONAL REGULATORY PROTEIN from Streptomyces
+ coelicolor (267 aa), FASTA scores: opt: 945, E(): 0, (61.5
+ identity in 239 aa overlap); and similar to others from
+ other organisms. Also similar to Rv2884|MTCY274.15|Z74024
+ from Mycobacterium tuberculosis (252 aa), FASTA scores:
+ opt: 662, E(): 0, (47.8% identity in 226 aa overlap).
+ Protein product from Mb0841 detected using shotgun mass
+ spectrometry. Mb0841 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99440.1"
+ /db_xref="GOA:A0A1R3XWJ5"
+ /db_xref="InterPro:IPR001867"
+ /db_xref="InterPro:IPR011006"
+ /db_xref="InterPro:IPR016032"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039420"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWJ5"
+ /translation="MLELLLLTSELYPDPVLPALSLLPHTVRTAPAEASSLLEAGNAD
+ AVLVDARNDLSSGRGLCRLLSSTGRSIPVLAVVSEGGLVAVSADWGLDEILLPSTGPA
+ EIDARLRLVVGRRGDLADQESLGKVSLGELVIDEGTYTARLRGRPLDLTYKEFELLKY
+ LAQHAGRVFTRAQLLHEVWGYDFFGGTRTVDVHVRRLRAKLGPEHEALIGTVRNVGYK
+ AVRPARGRPPAADPDDEDADPGRDGMQEPLVDPLRSQ"
+ gene 912566..913513
+ /gene="mshD"
+ /locus_tag="BQ2027_MB0842"
+ CDS 912566..913513
+ /gene="mshD"
+ /locus_tag="BQ2027_MB0842"
+ /note="Mb0842, -, len: 315 aa. Equivalent to Rv0819, len:
+ 315 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 315 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ U2266N|U15182|MLU15182_24 HYPOTHETICAL PROTEIN from
+ Mycobacterium leprae (312 aa), FASTA scores: opt: 1540,
+ E(): 0, (75.2% identity in 314 aa overlap). Also highly
+ similar to CAB88484.1|AL353816 putative acetyltransferase
+ from Streptomyces coelicolor (309 aa). Protein product
+ from Mb0842 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0842 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="gcn5-related n-acetyltransferase, mshd"
+ /protein_id="SIT99441.1"
+ /db_xref="GOA:Q7U173"
+ /db_xref="InterPro:IPR000182"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="InterPro:IPR017813"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U173"
+ /translation="MTALDWRSALTADEQRSVRALVTATTAVDGVAPVGEQVLRELGQ
+ QRTEHLLVAGSRPGGPIIGYLNLSPPRGAGGAMAELVVHPQSRRRGIGTAMARAALAK
+ TAGRNQFWAHGTLDPARATASALGLVGVRELIQMRRPLRDIPEPTIPDGVVIRTYAGT
+ SDDAELLRVNNAAFAGHPEQGGWTAVQLAERRGEAWFDPDGLILAFGDSPRERPGRLL
+ GFHWTKVHPDHPGLGEVYVLGVDPAAQRRGLGQMLTSIGIVSLARRLGGRKTLDPAVE
+ PAVLLYVESDNVAAVRTYQSLGFTTYSVDTAYALAGTDN"
+ gene 913556..914332
+ /gene="phoT"
+ /locus_tag="BQ2027_MB0843"
+ CDS 913556..914332
+ /gene="phoT"
+ /locus_tag="BQ2027_MB0843"
+ /note="Mb0843, phoT, len: 258 aa. Equivalent to Rv0820,
+ len: 258 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 258 aa overlap). Probable phoT,
+ phosphate-transport ATP-binding protein ABC transporter
+ (see citation below), equivalent to
+ PhoT|MLU15182_28|U15182 phosphate transport system ABC
+ transporter from Mycobacterium leprae (258 aa), FASTA
+ scores: opt: 1556, E(): 0, (91.5% identity in 258 aa
+ overlap). Also highly similar to others e.g.
+ CAB88472.1|AL353816 phosphate ABC transport system
+ ATP-binding protein from Streptomyces coelicolor (258 aa);
+ etc. Note that also highly similar to many PstB proteins
+ e.g. AAC15686.1|AF045938|PstB putative ABC transporter
+ nucleotide binding subunit from Mycobacterium smegmatis
+ (258 aa). Contains PS00211 ABC transporters family
+ signature and PS00017 ATP/GTP-binding site motif A
+ (P-loop). BELONGS TO THE ATP-BINDING TRANSPORT PROTEIN
+ FAMILY (ABC TRANSPORTERS). Protein product from Mb0843
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0843 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHATE-TRANSPORT ATP-BINDING PROTEIN
+ ABC TRANSPORTER PHOT"
+ /protein_id="SIT99442.1"
+ /db_xref="GOA:Q7U172"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR005670"
+ /db_xref="InterPro:IPR015850"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U172"
+ /translation="MAKRLDLTDVNIYYGSFHAVADVSLAILPRSVTALIGPSGCGKT
+ TVLRTLNRMHEVIPGARVEGAVLLDDQDIYAPGIDPVGVRRAIGMVFQRPNPFPAMSI
+ RNNVVAGLKLQGVRNRKVLDDTAESSLRGANLWDEVKDRLDKPGGGLSGGQQQRLCIA
+ RAIAVQPDVLLMDEPCSSLDPISTMAIEDLISELKQQYTIVIVTHNMQQAARVSDQTA
+ FFNLEAVGKPGRLVEIASTEKIFSNPNQKATEDYISGRFG"
+ gene complement(914388..915029)
+ /gene="phoY2"
+ /locus_tag="BQ2027_MB0844C"
+ CDS complement(914388..915029)
+ /gene="phoY2"
+ /locus_tag="BQ2027_MB0844C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0844c, phoY2, len: 213 aa. Equivalent to Rv0821c,
+ len: 213 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 213 aa overlap). Probable phoY2,
+ phosphate-transport system regulatory protein, highly
+ similar to PhoY|MLU15182_29|U15182 phosphate transport
+ system regulator from Mycobacterium leprae (222 aa), FASTA
+ scores: opt: 1268, E(): 0, (93.0% identity in 213 aa
+ overlap). Also similar to others e.g.
+ NP_384620.1|NC_003047 PROBABLE PHOSPHATE TRANSPORT SYSTEM
+ TRANSCRIPTIONAL REGULATOR PROTEIN from Sinorhizobium
+ meliloti (237 aa); etc. Also highly similar to
+ MTCI418A.03c|Z96070|PhoY1 PROBABLE PHOSPHATE TRANSPORT
+ SYSTEM TRANSCRIPTIONAL REGULATOR PROTEIN from
+ Mycobacterium tuberculosis (221 aa), FASTA scores: opt:
+ 937, E(): 0, (63.4% identity in 213 aa overlap). BELONGS
+ TO THE PHOU FAMILY. TBparse score is 0.910. Protein
+ product from Mb0844c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0844c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHATE-TRANSPORT SYSTEM
+ TRANSCRIPTIONAL REGULATORY PROTEIN PHOY2"
+ /protein_id="SIT99443.1"
+ /db_xref="GOA:P65721"
+ /db_xref="InterPro:IPR026022"
+ /db_xref="InterPro:IPR028366"
+ /db_xref="InterPro:IPR038078"
+ /db_xref="UniProtKB/Swiss-Prot:P65721"
+ /translation="MRTAYHEQLSELSERLGEMCGLAGIAMERATQALLQADLVLAEQ
+ VISDHEKIATLSARAEESAFVLLALQAPVAGDLRAIVSAIQMVADIDRMGALALHVAK
+ IARRRHPQHALPEEVNGYFAEMGRVAVELGNSAQEVVLSHDPEKAAQIREEDDAMDDL
+ HRHLFTVLMDREWKHGVAAAVDVTLLSRFYERFADHAVEVARRVIFQATGAFP"
+ gene complement(915087..917141)
+ /locus_tag="BQ2027_MB0845C"
+ CDS complement(915087..917141)
+ /locus_tag="BQ2027_MB0845C"
+ /note="Mb0845c, -, len: 684 aa. Equivalent to Rv0822c,
+ len: 684 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 684 aa overlap). Conserved hypothetical
+ protein, highly similar in the region between aa 370 - 580
+ to U2266O|U15182|MLU15182_30 HYPOTHETICAL PROTEIN from
+ Mycobacterium leprae (222 aa), FASTA scores: opt: 819,
+ E(): 0, (60.6% identity in 221 aa overlap). More extended
+ similarity to Rv3267|Z92771|MTCY71_7 from Mycobacterium
+ tuberculosis (498 aa), FASTA scores: opt: 434, E():
+ 2.2e-17, (26.6% identity in 541 aa overlap), and Rv3484.
+ Also similar to various proteins, preferiously putative
+ membrane proteins and membrane-bound regulatory proteins
+ e.g. CAC44512.1|AL596138 putative membrane protein from
+ Streptomyces coelicolor (524 aa); U56901|BSU56901_1
+ regulatory protein from Bacillus subtilis (391 aa), FASTA
+ scores: opt: 225, E(): 1.3e-05, (24.7% identity in 340 aa
+ overlap). Contains hydrophobic stretch (aa ~ 160-195) and
+ PS00041 Bacterial regulatory proteins, araC family
+ signature. Mb0845c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Cell envelope-associated transcriptional
+ attenuator LytR-CpsA-Psr, subfamily A1"
+ /protein_id="SIT99444.1"
+ /db_xref="InterPro:IPR004474"
+ /db_xref="InterPro:IPR027381"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWL2"
+ /translation="MSDGESAAPWARLSESAFPDGVDRWITVPPATWVAAQGPRDTQN
+ VGCHATGAVSVADLIARLGPAFPDLPTHRHVAPEPEPSGRGPKVPDDADDQQDTEAIA
+ IPAHSLEFLSELPDLRAANYPRADHARREPELPGKQLTGSARVRPLRIRRTSPAPAKP
+ APNSGRRPMVLAARSLAALFAALALALTGGAWQWSASKNSRLNMVSALDPHSGDIVNP
+ SGQHGDENFLLVGMDSRAGANANIGAGDAEDAGGARSDTVMLVNIPASRERVVAVSFP
+ RDLAITPIQCEAWNPETGKYGPIYDEKTGTMGPRLVYTETKLNSAFSFGGPKCLVKVI
+ QKLSGLSINRFIAIDFVGFARMVEALGGVEVCSTTPLRDYELGTVLEHAGRQVIDGPT
+ ALNYVRARQVTTESNGDYGRIKRQQLFLSSLLRSMISTDTLFNLSRLNNVVNMFIGNS
+ YVDNVKTKDLVELGRSLQHMAAGHVTFVTVPTGITDQNGDEPPRTSDMKALFTAIIDD
+ DPLPLENDHNAQRLGNTPSTPPTTTKKAPQAGLTNEIQHQQVTTTSPKEVTVQVSNST
+ GQAGLATTATDQLKRNGFNVMAPDDYPSSLLATTVFFSPGNEQAAATVAAVFGQSKIE
+ RVTGIGQLVQVVLGQDFSAVRAPLPSGSTVSVQISRNSSSPPTKLPEDLTVTNAADTT
+ CE"
+ gene complement(917307..918476)
+ /locus_tag="BQ2027_MB0846C"
+ CDS complement(917307..918476)
+ /locus_tag="BQ2027_MB0846C"
+ /note="Mb0846c, -, len: 389 aa. Equivalent to Rv0823c,
+ len: 389 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 389 aa overlap). Possible
+ transcriptional regulator (resembles nitrogen regulation
+ protein), equivalent (but longer 24 aa in N-terminus) to
+ MLU15182_31|U15182|NtrB NtrB protein from Mycobacterium
+ leprae (384 aa), FASTA scores: opt: 2070, E(): 0, (82.3%
+ identity in 384 aa overlap) (see citation below). Also
+ highly similar to CAB63312.1|AL133471|SCC82.03c
+ hypothetical protein from Streptomyces coelicolor (406
+ aa); and to many transcriptional regulators members of
+ UPF0034 FAMILY (NIFR3/SMM1) e.g. D26185|BAC180K_143
+ protein similar to transcriptional regulator (nitrogen
+ regulation protein) from Bacillus subtilis (333 aa), FASTA
+ scores: opt: 609, E(): 1.4e-32, (38.3% identity in 326 aa
+ overlap); NP_349795.1|NC_003030 NifR3 family enzyme from
+ Clostridium acetobutylicum (321 aa); etc. Contains PS01136
+ Uncharacterized protein family UPF0034 signature. Protein
+ product from Mb0846c detected using SWATH mass
+ spectrometry. Mb0846c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99445.1"
+ /db_xref="GOA:A0A1R3XWX6"
+ /db_xref="InterPro:IPR001269"
+ /db_xref="InterPro:IPR004652"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR018517"
+ /db_xref="InterPro:IPR024036"
+ /db_xref="InterPro:IPR035587"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWX6"
+ /translation="MSRRRAIQPSPALRIGPIELASPVVLAPMAGVTNVAFRALCRQL
+ EQSKVGTVSGLYVCEMVTARALIERHPVTMHMTTFSADESPRSLQLYTVDPDTTYAAA
+ RMIAGEGLADHIDMNFGCPVPKVTKRGCGAALPFKRRLFGQIVAAAVRATEGTDIPVT
+ VKFRIGIDDAHHTHLDAGRIAEAEGAAAVALHARTAAQRYSGTADWEQIARLKQHVRT
+ IPVLGNGDIYDAGDALAMMSTTGCDGVVIGRGCLGRPWLFAELSAAFTGSPAPTPPTL
+ GEVADIIRRHGTLLAAHFGEDKGMRDIRKHIAWYLHGFPAGSALRRALAMVKTLDELD
+ CLLDRLDGTVPFPDSATGARGRQGSPARVALPDGWLTDPDDCRVPEGADAMGSGG"
+ gene complement(918564..919580)
+ /gene="desA1"
+ /locus_tag="BQ2027_MB0847C"
+ CDS complement(918564..919580)
+ /gene="desA1"
+ /locus_tag="BQ2027_MB0847C"
+ /standard_name="des"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0847c, desA1, len: 338 aa. Equivalent to Rv0824c,
+ len: 338 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 338 aa overlap). Probable desA1
+ (alternate gene name: des), acyl-[acyl-carrier protein]
+ desaturase (stearoyl-ACP desaturase) (EC 1.14.19.2) (see
+ first citation below), equivalent to U15182|MLU15182_32
+ acyl-[ACP] desaturase from Mycobacterium leprae (338 aa),
+ FASTA scores: opt: 1880, E(): 0, (79.9% identity in 338 aa
+ overlap); and highly similar in part to fragment
+ CAB96061.1|AJ250019 Steroyl-ACP-desaturase from
+ Mycobacterium avium subsp. paratuberculosis (93 aa). Also
+ similar to other fatty acid desaturases e.g. T35035
+ probable acyl-[acyl-carrier protein] desaturase from
+ Streptomyces coelicolor (328 aa); Q40731|STAD_ORYSA
+ ACYL-[ACYL-CARRIER PROTEIN] DESATURASE PRECURSOR from
+ Oryza sativa (Rice) (390 aa); etc. Also highly similar to
+ desA2|Rv1094 from Mycobacterium tuberculosis (275 aa).
+ Contains PS00225 Crystallins beta and gamma 'Greek key'
+ motif signature. BELONGS TO THE FATTY ACID DESATURASE
+ FAMILY. COFACTOR: FERREDOXIN, FERREDOXIN NADPH REDUCTASE,
+ AND NADPH. Protein product from Mb0847c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0847c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-[ACYL-CARRIER PROTEIN] DESATURASE
+ DESA1 (ACYL-[ACP] DESATURASE) (STEAROYL-ACP DESATURASE)
+ (PROTEIN DES)"
+ /protein_id="SIT99446.1"
+ /db_xref="GOA:A0A1R3XWJ1"
+ /db_xref="InterPro:IPR005067"
+ /db_xref="InterPro:IPR009078"
+ /db_xref="InterPro:IPR012348"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWJ1"
+ /translation="MSAKLTDLQLLHELEPVVEKYLNRHLSMHKPWNPHDYIPWSDGK
+ NYYALGGQDWDPDQSKLSDVAQVAMVQNLVTEDNLPSYHREIAMNMGMDGAWGQWVNR
+ WTAEENRHGIALRDYLVVTRSVDPVELEKLRLEVVNRGFSPGQNHQGHYFAESLTDSV
+ LYVSFQELATRISHRNTGKACNDPVADQLMAKISADENLHMIFYRDVSEAAFDLVPNQ
+ AMKSLHLILSHFQMPGFQVPEFRRKAVVIAVGGVYDPRIHLDEVVMPVLKKWRIFERE
+ DFTGEGAKLRDELALVIKDLELACDKFEVSKQRQLDREARTGKKVSAHELHKTAGKLA
+ MSRR"
+ gene complement(919742..920383)
+ /locus_tag="BQ2027_MB0848C"
+ CDS complement(919742..920383)
+ /locus_tag="BQ2027_MB0848C"
+ /note="Mb0848c, -, len: 213 aa. Equivalent to Rv0825c,
+ len: 213 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 213 aa overlap). Conserved
+ hypothetical protein, highly similar, but in part (between
+ aa ~43-96) to fadD27|Rv0275c|MTV035.03 PUTATIVE
+ FATTY-ACID-COA LIGASE from Mycobacterium tuberculosis (241
+ aa), FASTA scores: E(): 7.3e-09, (32.6% identity in 190 aa
+ overlap). Also shows similarity with other proteins from
+ Mycobacterium tuberculosis e.g. Rv0078|AL0214|MTV030_22
+ (201 aa), FASTA scores: opt:118, E(): 0.32, (34.5%
+ identity in 113 aa overlap); etc. Protein product from
+ Mb0848c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0848c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, AcrR family"
+ /protein_id="SIT99447.1"
+ /db_xref="GOA:A0A1R3XWJ9"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWJ9"
+ /translation="MQTGQNRGRWSGVPLESRHALRRDNLVAAGVQLLGGAGGPALTV
+ RAVCRHAGLTERYFYESFADREHFVRAVYDDVCTRAMATLTSAQTPREAVEQFVELMV
+ DDPVRGRVLLLAPAVEPALTRSGAEWMPNFIELLQRKLSRIVDPVLQKLVATSLIGAL
+ TGLFTAYLNGRLGATRKQFIDYCVNMLLSTAATYAPHRERGESEHSIPAGPHN"
+ gene 920464..921519
+ /locus_tag="BQ2027_MB0849"
+ CDS 920464..921519
+ /locus_tag="BQ2027_MB0849"
+ /note="Mb0849, -, len: 351 aa. Equivalent to Rv0826, len:
+ 351 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 351 aa overlap). Conserved hypothetical
+ protein, similar to CAB94053.1|AL358672|SC7A12.06
+ hypothetical protein from Streptomyces coelicolor (300
+ aa); and NP_421372.1|NC_002696 hypothetical protein from
+ Caulobacter crescentus (299 aa). Also similar to other
+ proteins from Mycobacterium tuberculosis e.g.
+ Rv1645c|Z85982|MTCY06H11.09 (351 aa), FASTA scores: opt:
+ 1199, E(): 0, (57.5% identity in 299 aa overlap); Rv2237;
+ Rv0276; etc. Mb0849 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99448.1"
+ /db_xref="InterPro:IPR018713"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWI6"
+ /translation="MTQDTSATCPLTSTVQDSSPVAGQLGRPIGFRGLAGGCPVSPLG
+ YESPPLPLGPDSLTWRYFGDWRGMLQGPWAGSMQNMHPQLGAAVEDHSTFFRGRWPRL
+ LRSLYPIGGVVFDGDRAPVTGVQVRDYHITIKGVDGAGRRYHALNPDVFYWAHATFFV
+ GTLHVAERFCGGLTEAQRRQLFDEHVQWYRMYGMSMRPVPATWEEFQDYWDHMCRNVL
+ ENNFAARAVLDLTELPKPPFAQRVPDWLWAAPRKLLARFFVWLTVGLYDPPVRELMGY
+ RWLRRDEWLHRRFGDIVQLVFALVPFRFRKHPRARAGWDRATGRIPADAPLVQTPARN
+ LPPPDERDNPTHYCPKV"
+ gene complement(921571..921963)
+ /gene="kmtr"
+ /locus_tag="BQ2027_MB0850C"
+ CDS complement(921571..921963)
+ /gene="kmtr"
+ /locus_tag="BQ2027_MB0850C"
+ /note="Mb0850c, -, len: 130 aa. Equivalent to Rv0827c,
+ len: 130 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 130 aa overlap). Probable
+ transcriptional regulator, similar to many e.g.
+ CAC42856.1|AL592292 putative regulatory protein from
+ Streptomyces coelicolor (115 aa); NP_301626.1|NC_002677
+ putative ArsR-family transcriptional regulator from
+ Mycobacterium leprae (140 aa); BSUB0011_75|O31844|Z99114
+ YOZA PROTEIN from Bacillus subtilis (107 aa), FASTA
+ scores: opt: 208, E(): 3.2e-08, (35.5% identity in 93 aa
+ overlap); etc. Also similar to MTCY27.22c|Z95208 from
+ Mycobacterium tuberculosis (135 aa), FASTA scores: opt:
+ 201, E(): 1.2e-07, (35.7% identity in 98 aa overlap).
+ Contains probable helix-turn helix motif from aa 42-63
+ (Score 1300, +3.61 SD). Mb0850c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="metal sensor transcriptional regulator kmtr
+ (arsr-smtb family)"
+ /protein_id="SIT99449.1"
+ /db_xref="GOA:A0A1R3XWJ7"
+ /db_xref="InterPro:IPR001845"
+ /db_xref="InterPro:IPR011991"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWJ7"
+ /translation="MYADSGPDPLPDDQVCLVVEVFRMLADATRVQVLWSLADREMSV
+ NELAEQVGKPAPSVSQHLAKLRMARLVRTRRDGTTIFYRLENEHVRQLVIDAVFNAEH
+ AGPGIPRHHRAAGGLQSVAKASATKDVG"
+ gene complement(922021..922443)
+ /locus_tag="BQ2027_MB0851C"
+ CDS complement(922021..922443)
+ /locus_tag="BQ2027_MB0851C"
+ /note="Mb0851c, -, len: 140 aa. Equivalent to Rv0828c,
+ len: 140 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 140 aa overlap). Possible deaminase
+ (EC 3.5.-.-), with its N-terminus highly similar to middle
+ part of NP_302602.1|NC_002677 possible
+ cytidine/deoxycytidylate deaminase from Mycobacterium
+ leprae (171 aa). Also similar to other deaminases e.g.
+ CAC18715.2|AL451182 putative deaminase from Streptomyces
+ coelicolor (167 aa); NP_251189.1|NC_002516 probable
+ deaminase from Pseudomonas aeruginosa (151 aa);
+ NP_108387.1|NC_002678 nitrogen fixation protein gene from
+ Mesorhizobium loti (149 aa); etc. Also similar to many
+ conserved hypothetical proteins e.g. NP_389200.1|NC_000964
+ hypothetical protein from Bacillus subtilis (156 aa),
+ FASTA scores: E(): 1.3e-07, (38.9% identity in 95 aa
+ overlap); etc. And similar to Rv3752c possible deaminase
+ from Mycobacterium tuberculosis. Contains PS00903 Cytidine
+ and deoxycytidylate deaminases zinc-binding region
+ signature. BELONGS TO THE CYTIDINE AND DEOXYCYTIDYLATE
+ DEAMINASES FAMILY. Mb0851c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE DEAMINASE"
+ /protein_id="SIT99450.1"
+ /db_xref="GOA:A0A1R3XWK4"
+ /db_xref="InterPro:IPR002125"
+ /db_xref="InterPro:IPR016192"
+ /db_xref="InterPro:IPR016193"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWK4"
+ /translation="MPAGMAGFRRWAQTNDPTAHAESLAIRAACTKLGTEHLVGTTLN
+ VLAHPCPMCYGSLYYCSPDEVVFLTSRDAYEPHYVDDRRYFEPATFYDEFAKEWQDRR
+ LPMRQEHRPDIRAGAVDVYRFRQEPNGGERSAIAAPTG"
+ gene 922405..922695
+ /locus_tag="BQ2027_MB0852"
+ CDS 922405..922695
+ /locus_tag="BQ2027_MB0852"
+ /note="Mb0852, -, len: 96 aa. Equivalent to Rv0829, len:
+ 96 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 96 aa overlap). Possible transposase
+ for IS1605' (fragment), similar to C-terminal end of many
+ mycobacterial transposases and hypothetical proteins e.g.
+ Z74024|MTCY274_16 from Mycobacterium tuberculosis (460
+ aa), FASTA scores: opt: 668, E(): 6.2e-32, (98.9% identity
+ in 93 aa overlap); MTV002_57|O33333 TRANSPOSASE from
+ Mycobacterium tuberculosis; L07627|SERRY1_1 insertion
+ element IS1136 from Saccharopolyspora erythraea (90 aa),
+ FASTA score: (34.9% identity in 83 aa overlap). Mb0852
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible transposase (fragment)"
+ /protein_id="SIT99451.1"
+ /db_xref="InterPro:IPR010095"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWJ4"
+ /translation="MGPSSKTCHACRHVQDIGWDEKWQCDGCSITHQRDDNAAINLAR
+ YEEPPSVVGPVGAAVKRGADRKTGPGPAGGREARKGTGHPAGEQPRDGVLVA"
+ gene 922405..922692
+ /locus_tag="BQ2027_IS1605'"
+ mobile_element 922405..922692
+ /locus_tag="BQ2027_IS1605'"
+ /note="IS1605', len: 288 nt. Equivalent to IS1605', len:
+ 288 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(99.7% identity in 288 nt overlap)."
+ /mobile_element_type="insertion sequence:IS1605"
+ gene 922800..923705
+ /locus_tag="BQ2027_MB0853"
+ CDS 922800..923705
+ /locus_tag="BQ2027_MB0853"
+ /note="Mb0853, -, len: 301 aa. Equivalent to Rv0830, len:
+ 301 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 301 aa overlap). Conserved
+ hypothetical protein, member of Mycobacterium tuberculosis
+ protein family consisting of the proteins Rv0726c,
+ Rv0731c, Rv3399, Rv1729c|Z81360|MTCY4C12_14c (312 aa),
+ FASTA scores: opt: 1014, E(): 0, (54.1% identity in 292 aa
+ overlap); etc. Protein product from Mb0853 detected using
+ SWATH mass spectrometry. Mb0853 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible s-adenosylmethionine-dependent
+ methyltransferase"
+ /protein_id="SIT99452.1"
+ /db_xref="GOA:Q7U163"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR011610"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U163"
+ /translation="MVRADRDRWDLATSVGATATMVAAQRALAADPRYALIDDPYAAP
+ LVRAVGMDVYTRLVDWQIPVEGDSEFDPQRMATGMACRTRFFDQFFLDATHSGIGQFV
+ ILASGLDARAYRLAWPVGSIVYEVDMPEVIEFKTATLSDLGAEPATERRTVAVDLRDD
+ WATALQTAGFDPKVPAAWSAEGLLVYLPVEAQDALFDNITALSAPGSRLAFEFVPDTA
+ IFADERWRNYHNRMSELGFDIDLNELVYHGQRGHVLDYLTRDGWQTSALTVTQLYEAN
+ GFAYPDDELATAFADLTYSSATLMR"
+ gene complement(923724..924539)
+ /locus_tag="BQ2027_MB0854C"
+ CDS complement(923724..924539)
+ /locus_tag="BQ2027_MB0854C"
+ /note="Mb0854c, -, len: 271 aa. Equivalent to Rv0831c,
+ len: 271 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 271 aa overlap). Conserved
+ hypothetical protein, similar to Rv0347|MTY13E10_7|Z95324
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium
+ tuberculosis (328 aa), FASTA scores: opt: 426, E():
+ 2.6e-21, (33.6% identity in 262 aa overlap). Protein
+ product from Mb0854c detected using shotgun mass
+ spectrometry. Mb0854c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99453.1"
+ /db_xref="InterPro:IPR026349"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXI9"
+ /translation="MLPETNQDEVQPNAPVALVTVEIRHPTTDSLTESANRELKHLLI
+ NDLPIERQAQDVSWGMTAPGGAPTPVADRFVRYVNRDNTTAASLKNQAIVVETTAYRS
+ FEAFTDVVMRVVDARAQVSSIVGLERIGLRFVLEIRVPAGVDGRITWSNWIDEQLLGP
+ QRFTPGGLVLTEWQGAAVYRELQPGKSLIVRYGPGMGQALDPNYHLRRITPAQTGPFF
+ LLDIDSFWTPSGGSIPEYNRDALVSTFQDLYGPAQVVFQEMITSRLKDELLRQ"
+ gene complement(924627..924699)
+ /locus_tag="BQ2027_LYST"
+ tRNA complement(924627..924699)
+ /locus_tag="BQ2027_LYST"
+ /product="tRNA-Lys"
+ /note="lysT, len: 73 nt. Equivalent to lysT, len: 73 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 73 nt overlap). tRNA-Lys, anticodon ttt."
+ gene 924823..924896
+ /locus_tag="BQ2027_GLUT"
+ tRNA 924823..924896
+ /locus_tag="BQ2027_GLUT"
+ /product="tRNA-Glu"
+ /note="gluT, len: 74 nt. Equivalent to gluT, len: 74 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 74 nt overlap). tRNA-Glu, anticodon ttc."
+ gene 924934..925007
+ /locus_tag="BQ2027_ASPT"
+ tRNA 924934..925007
+ /locus_tag="BQ2027_ASPT"
+ /product="tRNA-Asp"
+ /note="aspT, len: 74 nt. Equivalent to aspT, len: 74 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 74 nt overlap). tRNA-Asp, anticodon gtc."
+ gene 925037..925110
+ /locus_tag="BQ2027_PHEU"
+ tRNA 925037..925110
+ /locus_tag="BQ2027_PHEU"
+ /product="tRNA-Phe"
+ /note="pheU, len: 74 nt. Equivalent to pheU, len: 74 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 74 nt overlap). tRNA-Phe, anticodon gaa."
+ gene 925781..926194
+ /gene="PE_PGRS12"
+ /locus_tag="BQ2027_MB0855"
+ CDS 925781..926194
+ /gene="PE_PGRS12"
+ /locus_tag="BQ2027_MB0855"
+ /note="Mb0855, PE_PGRS12, len: 137 aa. Equivalent to
+ Rv0832, len: 137 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 137 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, possibly PGRS
+ subfamily of gly-rich proteins, highly similar to many
+ others e.g. MTCY1A11.25c|Z78020 (498 aa), FASTA scores:
+ opt: 529, E(): 5.2e-22, (61.8% identity in 136 aa
+ overlap); etc. Appears to have incurred frameshift as next
+ ORF should be continuation; sequence has been checked but
+ no error found. Mb0855 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs12"
+ /protein_id="SIT99454.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWM1"
+ /translation="MSYVSVLPATLATAATEVARIGSALSLASAVAAAQTSAVQAAAA
+ DEVSAAIAALFSAHGRDFQALSARAAAFHHEFVQALAAGAGSYAVAEIAAASPLQSLI
+ DVFNAPIQAATGRPLIGNGANGQPGTGAPGGPAGG"
+ gene 926191..928512
+ /gene="PE_PGRS13"
+ /locus_tag="BQ2027_MB0856"
+ CDS 926191..928512
+ /gene="PE_PGRS13"
+ /locus_tag="BQ2027_MB0856"
+ /note="Mb0856, PE_PGRS13, len: 773 aa. Equivalent to
+ Rv0833, len: 749 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (). Member of the Mycobacterium tuberculosis
+ PE family, PGRS subfamily of gly-rich proteins, but
+ lacking N-terminal domain (present in preceding ORF),
+ possibly due to frameshift. Similar in part to many others
+ e.g. MTCY28_25|Z95890 (914 aa), FASTA scores: opt: 2726,
+ E(): 0, (60.1% identity in 773 aa overlap); etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 84 bp insertion leads to a longer product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (773 aa
+ versus 749 aa). Mb0856 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs13"
+ /protein_id="SIT99455.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWY6"
+ /translation="MIGNGGAGGSGAPGAIGGAGGPAGLIGVGGAGGAGGDSAVAGVI
+ GGAGGAGGAALLFGAGGAGGAGGSGGSGAAGGAGGAGGAGGLFASGGSGGFGGFASTG
+ TGGAGGTGGAGGLFASGGVGGTGGGAGSGGTGGVGGTGGAGGLFASGGAGGAGGSGGT
+ GGAGGTGGAGGLFGAGGAGGLGGQGNHTGGHGGAGGSAGLLALGDGGAGGAGGAATTG
+ TGGAGGAGGKAGLLFGSGGAGGSGGAAGTFGDTGNSGGAGGAGGKAGLLFGSGGAGGS
+ GGAGGFANGSTGGAGGAGGGAGLIGNGGNGGSGGTSVATGGAGNGGAGGAGGGAGLIG
+ NGGNGGSGGMGDAPGGTGVGGIGGLLLGLDGANAPASTNPLHTAQQQALAAVNAPIQA
+ VTGRPLIGNGANGAPGSGAPGGHGGWLFGGGGTGGSGVSGGAGGDGGAGGILFGAGGA
+ GGAGGAVTGTGATGGSGGAGGGALLFGAGGAGGAGGSSGIGGFAAGGAGGPGGAGGLF
+ NGGGAGGAGGSGVSGGAGGEGGAGGAGGLFAGGGIGGAGGFGGFRGGEGGAGGAGGLF
+ AGGGAGGAGGSGNNVGGAGGAGGVGGLFGAGGAGGSGGGGSVAGDGGAGGNAGLLAPG
+ LAGGAGGGGGQGFDTGGAGGPGGDAGLLVGSGGVGGAGGFGLTTGGPGAAGGDAGLLF
+ GSGGAGGAGGSGRTDLGGAGGAGGKAGLIGNGGNGGAGGAGGAGGPGGAAFGLGNGGN
+ GGNGGTGTSAGSPGAGGAGGSLIGAEGLPGLLP"
+ gene complement(928739..931234)
+ /gene="PE_PGRS14"
+ /locus_tag="BQ2027_MB0857C"
+ CDS complement(928739..931234)
+ /gene="PE_PGRS14"
+ /locus_tag="BQ2027_MB0857C"
+ /note="Mb0857c, PE_PGRS14, len: 831 aa. Equivalent to
+ Rv0834c, len: 882 aa, from Mycobacterium tuberculosis
+ strain H37Rv. Member of the Mycobacterium tuberculosis PE
+ family, PGRS subfamily of gly-rich proteins, highly
+ similar to many others e.g. MTCY493_4|Z95844 (1329 aa),
+ FASTA scores: opt: 2577, E(): 0, (52.0% identity in 950 aa
+ overlap); etc. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, deletions of 143 bp and 9 bp
+ (cgccgttgc-*), leads to a shorter product compared to the
+ homolog in Mycobacterium tuberculosis strain H37Rv (831 aa
+ versus 882 aa). Mb0857c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs14"
+ /protein_id="SIT99456.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWK0"
+ /translation="MSFVIAAPDLVAMATEDLAGIGASLTAANAAAAVPTSGLLAAAG
+ DEVSAAIAALFSSHGQQYQAMSAQAAAFHARFVQALAGAMGAYAAAEAANASPLQTLE
+ QGLLGAINAPAAALSGRPFIGNGTNGAPGTGEAGGPGGWLLGNGGNGGSGAPGQTGGA
+ GGAAGLLGHGGTGGAGGTGASGGKGGTGGWLWGSGGAGGAGGSGGGSGGAGGNALMFG
+ IGGNGGAGGAASGVGNGGVGGAGGAGGALVAIGGAGGAGGAATTGTGGAGGAGSNALG
+ LFLGLGGSGGQGGDSAMGSGGAGGAGGSGGAASPFGIDIGIGGAGGHGGAGTNGGAGG
+ AGGAGGSSGTVFALDLSWGGAGGNGGAATTGTGGAGGTGGFAVAPDFIGFGAAYGGAG
+ GLGGAATGAGGTGGTGGVGAGGFAALGVGVGGAGGAGGAATETGGIGGAGGLGVGLLG
+ GAGGAGGPGGAASAGSGGHGGTGGDALGLIGAGIGGVGGVGGAATDTGGNGGAGGSGT
+ GLLGGVGGAGGHGGGASVGTGGSGGAGGDGFGFVGAGGNGGNAGTGVGVNGANGGNGG
+ SATGALAAVGGAGAAGGDATSGTGGFGGAGGSARGLIFALGGAGAAGGDASTGVGGPG
+ GPGGTGTASSPFGIAIAIGGAGAQGGAGTSGATGGAGGDGVFEGIAVLGLGFGGAAGA
+ GGAATGDGATGGAGGFGGAGAGIANFLGFSVLHGGAGGAGGTATGTGGNGGAGGGGGL
+ SSPVILGIGIGGAGGNGGDALGLVGVGGNGGNAGTGFGANTGGNGGDTTIVVNGMLAP
+ STLGYGGNGVNGGAGGTGGKAGVFGAPGQNGLP"
+ gene 931702..932346
+ /gene="lpqQ"
+ /locus_tag="BQ2027_MB0858"
+ CDS 931702..932346
+ /gene="lpqQ"
+ /locus_tag="BQ2027_MB0858"
+ /note="Mb0858, lpqQ, len: 214 aa. Equivalent to Rv0835,
+ len: 214 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 214 aa overlap). Possible lpqQ,
+ lipoprotein. Contains PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site. Protein product from
+ Mb0858 detected using shotgun mass spectrometry. Mb0858
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE LIPOPROTEIN LPQQ"
+ /protein_id="SIT99457.1"
+ /db_xref="InterPro:IPR026954"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWK8"
+ /translation="MCCSTAAKSAVIVCCAAIATTACSFQATSTQPSTAPPTSRVDSL
+ IVSIEDVRRIANYEELAAHFQTDLREPPEADTNVPGPCRVVGSSDRTFGTDWSEFRSA
+ GYHGVTDDLRPGGPVMVETVSQAIALYPDPSTARGVFHRLESSLAECAGLHDPYFDFI
+ LGRPDASTVRIGAAGWSHVYRLKSSVFISVGVLGIEPAEPIANVILQTISDRIQ"
+ gene complement(932959..933681)
+ /locus_tag="BQ2027_MB0859C"
+ CDS complement(932959..933681)
+ /locus_tag="BQ2027_MB0859C"
+ /note="Mb0859c, -, len: 240 aa. Equivalent to Rv0836c,
+ len: 217 aa (start uncertain), from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 217 aa
+ overlap). Hypothetical unknown protein.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base transition (a-g) leads to a longer product
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv (240 aa versus 217 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99458.1"
+ /db_xref="InterPro:IPR014513"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWJ6"
+ /translation="MLVGAQCRDLLHWRFCRGVPPRATNDTDIAGTLNNWDHFEAIRA
+ TFRALGSTGHRFLIADRAVDALPFGEVESPTGTTRHPPGNQLMNVHGCTDAYLRADVL
+ PLPGGLTVHLPQPPNYAVLKLHAWLDRSADHDYKDGPDLALVVHWYAGDLDRLYAKPD
+ QWALRRHDFDLRTAAAALLGHDMRASVSAPEAAVLATRATQADHDLLAQHFAVGRPGW
+ PTTTASRRPLVEALLDQLTPGS"
+ gene complement(933752..934780)
+ /locus_tag="BQ2027_MB0860C"
+ CDS complement(933752..934780)
+ /locus_tag="BQ2027_MB0860C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0860c, -, len: 342 aa. Equivalent to Rv0837c,
+ len: 342 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 342 aa overlap). Hypothetical unknown
+ protein. TBparse score is 0.941."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99459.1"
+ /db_xref="InterPro:IPR016600"
+ /db_xref="InterPro:IPR019238"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWK7"
+ /translation="MDQIGADLAEAVERHLTEYGVRVLGGLSALNSAHPESLDLEIDA
+ HPLTITALYLPHLSATAALQAWDTAGAGSPLLVVGPRLHPSSAETLRARGLWYIDGAG
+ NAYLRHQGGLLIDVRGRRSAVSAQPGTLGDGLHSDGPRNPFTPKRAQVVCVLLDAPQL
+ VDAPLRAIAASAGVSVGMAKETMDTLRTTGFFEHLGSRRRLVRTDELLDLWAAAYPGG
+ LGRANKLLVASGDIHTWSAPDGLAVAVSGEQALPDEIRNPESLMLYVDTPAPGLPADL
+ LIHNRWHRDPHGSIVIRKLFWRNLPDEQPGLAPTALIYADLLASREPRQVEVAHLMRR
+ QDERLARL"
+ gene 935469..936245
+ /gene="lpqR"
+ /locus_tag="BQ2027_MB0861"
+ CDS 935469..936245
+ /gene="lpqR"
+ /locus_tag="BQ2027_MB0861"
+ /note="Mb0861, lpqR, len: 258 aa. Equivalent to Rv0838,
+ len: 256 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 258 aa overlap). Probable lpqR,
+ conserved lipoprotein. Similar (except in N-terminus) to
+ hypothetical proteins and D-alanyl-D-alanine dipeptidases
+ e.g. NP_416005.1|NC_000913 hypothetical protein from
+ Escherichia coli strain K12 (193 aa);
+ NP_421076.1|NC_002696 D-alanyl-D-alanine dipeptidase from
+ Caulobacter crescentus (212 aa); Q06241|VANX_ENTFC
+ D-ALANYL-D-ALANINE DIPEPTIDASE from Enterococcus faecium
+ (202 aa), FASTA scores: opt: 198, E(): 1.9e-05, (28.1%
+ identity in 199 aa overlap); etc. Contains signal sequence
+ and appropriately positioned PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 6bp insertion (*-cggccc) leads to a slightly longer
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (258 aa versus 256 aa). Mb0861
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN LPQR"
+ /protein_id="SIT99460.1"
+ /db_xref="GOA:A0A1R3XWL7"
+ /db_xref="InterPro:IPR000755"
+ /db_xref="InterPro:IPR009045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWL7"
+ /translation="MRLIGRLRLLMVGLVVICGACACDRVSAGRWSESPSATSWPVRP
+ VNTTTPSGPVPPVSEAARAAGLVDVRGVVPDAAIDLRYATANNFTGTQLYPPGARCLV
+ HESMAEGLAAAAAVLRPHGQVLVFWDCYRPHDVQVRMFDVVPNPAWVARPGKYAHSHE
+ AGRSVDVTFASAQRQCPSVRRSGELCLADMGTDFDDFSSRATAFATQGVSAEAQANRA
+ HLRAAMQAGGLTVYSGEWWHFDGPGPGAGVDRPILEVPVD"
+ gene 936332..937144
+ /locus_tag="BQ2027_MB0862"
+ CDS 936332..937144
+ /locus_tag="BQ2027_MB0862"
+ /note="Mb0862, -, len: 270 aa. Equivalent to Rv0839, len:
+ 270 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 270 aa overlap). Conserved
+ hypothetical protein, similar to various hypothetical
+ proteins or methyltransferases from yeast and bacteria
+ e.g. T34740|SC1E6.19c|AL033505|SC1E6_19 hypothetical
+ protein from Streptomyces coelicolor (273 aa), FASTA
+ scores: opt: 1102, E(): 0, (58.6% identity in 263 aa
+ overlap); T38024|Z98598|SPAC1B3.06c hypothetical protein
+ from Schizosaccharomyces pombe (278 aa), FASTA scores:
+ opt: 562, E(): 1.9e-3, (36.4% identity in 269 aa overlap);
+ JC6531 avermectin B 5-O-methyltransferase (EC 2.1.1.-)
+ from Streptomyces avermitilis (283 aa); etc. Also similar
+ to other Mycobacterium tuberculosis hypothetical proteins
+ that may be methyltransferases e.g. Rv1523, Rv2952,
+ Rv1405c, etc. Protein product from Mb0862 detected using
+ SWATH mass spectrometry. Mb0862 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SAM-dependent methyltransferase"
+ /protein_id="SIT99461.1"
+ /db_xref="InterPro:IPR025714"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWK5"
+ /translation="MNDKRRAIYTHGYHESVLRSHRRRTAENSAGYLLPYLVPGLSVL
+ DVGCGPGTITVDLAARVVPGSVTGVEPTDDALSLARAEAQLHRLSNISFTTSDVHKLD
+ FPDDAFDVVHAHQVLQHVADPVRALQEMRRVCTPGGIVAARDADYSGFIWFPKLPALD
+ RWLDLYERAARANGGEPDAGRRLLSWARAAGFDDVTPTASVWCFATASAREWWGLVWA
+ DRILQSDLAHQLVDSGLATAAQLEEISTAWREWAAAPDGWLAIPHGEILCRA"
+ gene complement(937212..938072)
+ /gene="pip"
+ /locus_tag="BQ2027_MB0863C"
+ CDS complement(937212..938072)
+ /gene="pip"
+ /locus_tag="BQ2027_MB0863C"
+ /note="Mb0863c, pip, len: 286 aa. Equivalent to Rv0840c,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 286 aa overlap). Possible pip, proline
+ iminopeptidase (EC 3.4.11.5), similar to many e.g.
+ P46541|PIP_BACCO PROLINE IMINOPEPTIDASE from BACILLUS
+ COAGULANS (288 aa), FASTA scores: opt: 657, E(): 0, (37.6%
+ identity in 282 aa overlap); NP_386922.1|NC_003047
+ PUTATIVE PROLINE IMINOPEPTIDASE PROTEIN from Sinorhizobium
+ meliloti (296 aa); etc. BELONGS TO PEPTIDASE FAMILY S33.
+ Protein product from Mb0863c detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PROLINE IMINOPEPTIDASE PIP (PROLYL
+ AMINOPEPTIDASE) (PAP)"
+ /protein_id="SIT99462.1"
+ /db_xref="GOA:A0A1R3XYP0"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR002410"
+ /db_xref="InterPro:IPR005945"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYP0"
+ /translation="MEGTIAVPGGRVWFQRIGGGPGRPLLVVHGGPGLPHNYLAPLRR
+ LSDEREVIFWDQLGCGNSACPSDVDLWTMNRSVAEMATVAEALALTRFHIFSHSWGGM
+ LAQQYVLDKAPDAVSLTIANSTASIPEFSASLVSLKSCLDVATRSAIDRHEAAGTTHS
+ AEYQAAIRTWNETYLCRTRPWPRELTEAFANMGTEIFETMFGPSDFRIVGNVRDWDVV
+ DRLADIAVPTLLVVGRFDECSPEHMREMQGRIAGSRLEFFESSSHMPFIEEPARFDRV
+ MREFLRLHDI"
+ gene 938348..938590
+ /locus_tag="BQ2027_MB0864"
+ CDS 938348..938590
+ /locus_tag="BQ2027_MB0864"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0864, -, len: 80 aa. Equivalent to Rv0841, len:
+ 80 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.8% identity in 80 aa overlap). Conserved transmembrane
+ protein, highly similar to C-terminus of next ORF
+ Rv0842|O53854 PUTATIVE MEMBRANE PROTEIN from Mycobacterium
+ tuberculosis (442 aa), FASTA scores: opt: 246, E():
+ 3.3e-10, (59.7% identity in 72 aa overlap). Replace
+ previous Rv0841c."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99463.1"
+ /db_xref="GOA:A0A1R3XXJ9"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXJ9"
+ /translation="MVAASIVHHSAAPANRGRYHGIWSMTPVFASVVVPIMASYGPIH
+ GAHLLAAVVVGSAGAALCLPLARALRRPTPSAMTTD"
+ gene 938867..940159
+ /locus_tag="BQ2027_MB0865"
+ CDS 938867..940159
+ /locus_tag="BQ2027_MB0865"
+ /note="Mb0865, -, len: 430 aa. Equivalent to Rv0842, len:
+ 430 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 430 aa overlap). Probable conserved
+ integral membrane protein, showing similarity with other
+ integral membrane proteins e.g. P28246|BCR_ECOLI
+ BICYCLOMYCIN RESISTANCE PROTEIN from EScherichia coli (396
+ aa), FASTA scores: opt: 216, E(): 5.4e-07, (23.7% identity
+ in 376 aa overlap); etc."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99464.1"
+ /db_xref="GOA:A0A1R3XWN0"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWN0"
+ /translation="MRYTGPERCSGDGQVRAAGDRYSTVIWLLGGNLLVRSAGFGYPF
+ LAYHVAGRGHGAGAVGAVVAAYGLGWAVGQLLCGWLVDRVGARVTLVSTMLVAAAVLV
+ LMAGLHTVPGLLVGAMIAGLVCDAPRPVLGAVIAELVADPQRRAQLDGWRYGWVLNIG
+ AAITGGVGGVVAGWLDTPVLYWINGIGCAIFAGLAGRCIPADVCRRTESGLRACTAMS
+ KVGYRQALSDKRLVLLAVSGLATLTTLMGFFAAVPMLMSASGLGVGAYGWVQLINALA
+ VVAVTPLLTPWLSKQLALGPRPDILAGAGVWVTLCMAAAGLARTTVGFSVAAAACSPG
+ EIAWFVVAAGIVHRIAPPAHGGRYHGIWSMAVAASSVAAPILAAFNLANGGRLVLAAT
+ TVTVGFFGAALCLPLARVLAAASCGPLSSKEPSRDSYQ"
+ gene 940143..941147
+ /locus_tag="BQ2027_MB0866"
+ CDS 940143..941147
+ /locus_tag="BQ2027_MB0866"
+ /note="Mb0866, -, len: 334 aa. Equivalent to Rv0843, len:
+ 334 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 334 aa overlap). Probable dehydrogenase
+ (EC 1.-.-.-), similar to various dehydrogenases e.g.
+ Q46142|Q46142 TPP-DEPENDENT ACETOIN DEHYDROGENASE (326
+ aa), FASTA scores: opt: 500, E(): 2.4e-26, (32.3% identity
+ in 300 aa overlap); P51267|ODPA_PORPU PYRUVATE
+ DEHYDROGENASE E1 COMPONENT from Porphyra purpurea (344
+ aa), FASTA scores: opt: 451, E(): 4.7e-23, (29.6% identity
+ in 311 aa overlap); etc. Also similar to Rv2497c|pdhA
+ pyruvate dehydrogenase E1 component from Mycobacterium
+ tuberculosis (367 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEHYDROGENASE"
+ /protein_id="SIT99465.1"
+ /db_xref="GOA:A0A1R3XWZ4"
+ /db_xref="InterPro:IPR001017"
+ /db_xref="InterPro:IPR017596"
+ /db_xref="InterPro:IPR029061"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWZ4"
+ /translation="MTRTSEGLAAFVVDQLEELYRRMWVLRLLDMALEQLRIEGLING
+ PLQGGFGQEAVSVGAAAALGEGDVIITTHRPHAQHVGTDAPLGPVIADMLGATAGDLE
+ GADEDAHIADPRAGLPAAIRVVKQSPLLAIGHAYALWLRDTGRVTLCVTQDCDVDADA
+ FNEAADLAAVWQLPVVILVENIRGALSVHLGRYTHEPRVYRRAVAYGMPGVSVDGNDV
+ EAVRDCVANAVVRARAGGGPTLVQAITYRTTDFSGSDRGGYRDLAGSEQFLDPLIFAR
+ RRLIAAGTTRGRLDEQERAACQQVADAVAFAKDRARPNGGGPISRPTSGWHQQPKTRF
+ "
+ gene complement(941211..941861)
+ /gene="narL"
+ /locus_tag="BQ2027_MB0867C"
+ CDS complement(941211..941861)
+ /gene="narL"
+ /locus_tag="BQ2027_MB0867C"
+ /note="Mb0867c, narL, len: 216 aa. Equivalent to Rv0844c,
+ len: 216 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 216 aa overlap). Possible narL,
+ nitrate/nitrite response regulator protein, similar to
+ many e.g. CAB44989.1|AJ131854 NarL protein from
+ Pseudomonas stutzeri (218 aa); CAA75536.1|Y15252
+ nitrate/nitrite regulatory protein from Pseudomonas
+ aeruginosa (216 aa); PCC6803|D64005|SYCSLRG_24 NarL
+ protein from Synechocystis sp. (209 aa), FASTA scores:
+ opt: 438, E(): 1.5e-23, (34.6% identity in 208 aa
+ overlap); etc. Also similar to unidentified regulator e.g.
+ CAB76009.1|AL157916 putative two-component system response
+ regulator from Streptomyces coelicolor (224 aa); etc.
+ Contains probable helix-turn helix motif from aa 170-191
+ (Score 1124, +3.02 SD). Protein product from Mb0867c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0867c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE NITRATE/NITRITE RESPONSE
+ TRANSCRIPTIONAL REGULATORY PROTEIN NARL"
+ /protein_id="SIT99466.1"
+ /db_xref="GOA:A0A1R3XWL1"
+ /db_xref="InterPro:IPR000792"
+ /db_xref="InterPro:IPR001789"
+ /db_xref="InterPro:IPR011006"
+ /db_xref="InterPro:IPR016032"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWL1"
+ /translation="MSNPQPEKVRVVVGDDHPLFREGVVRALSLSGSVNVVGEADDGA
+ AALELIKAHLPDVALLDYRMPGMDGAQVPAAVRSYELPTRVLLISAHDEPAIVYQALQ
+ QGAAGFLLKDSTRTEIVKAVLDCAKGRDVVAPSLVGGLAGEIRQRAAPVAPVLSARER
+ EVLNRIACGQSIPAIAAELYVAPSTVKTHVQRLYEKLGVSDRAAAVAEAMRQRLLD"
+ gene 941945..943222
+ /locus_tag="BQ2027_MB0868"
+ CDS 941945..943222
+ /locus_tag="BQ2027_MB0868"
+ /note="Mb0868, -, len: 425 aa. Equivalent to Rv0845, len:
+ 425 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 425 aa overlap). Possible two-component
+ sensor kinase (EC 2.7.-.-), with its C-terminus similar to
+ C-terminal part of others e.g. NP_294951.1|NC_001263
+ two-component sensor histidine kinase from Deinococcus
+ radiodurans (469 aa); CAC32293.1|AL583943 putative two
+ component system histidine kinase from Streptomyces
+ coelicolor (404 aa); NP_464546.1|NC_003210 protein similar
+ to two-component sensor histidine kinase from Listeria
+ monocytogenes (352 aa); BSUB0017_193|Z9912 two-component
+ sensor kinase from Bacillus subtilis (360 aa), FASTA
+ scores: opt: 275, E(): 1.6e-11, (30.3% identity in 234 aa
+ overlap); etc. Protein product from Mb0868 detected using
+ SWATH mass spectrometry. Mb0868 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TWO COMPONENT SENSOR KINASE"
+ /protein_id="SIT99467.1"
+ /db_xref="GOA:A0A1R3XWL8"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR005467"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWL8"
+ /translation="MPSYGNLGRLGGRHEYGVLVAMTSSAELDRVRWAHQLRSYRIAS
+ VLRIGVVGLMVAAMVVGTSRSEWPQQIVLIGVYAVAALWALLLAYSASRRFFALRRFR
+ SMGRLEPFAFTAVDVLILTGFQLLSTDGIYPLLIMILLPVLVGLDVSTRRAAVVLACT
+ LVGFAVAVLGDPVMLRAIGWPETIFRFALYAFLCATALMVVRIEERHTRSVAGLSALR
+ EELLAQTMTASEVLQRRIAEAIHDGPLQDVLAARQELIELDAVTPGDERVGRALAGLQ
+ SASERLRQATFELHPAVLEQVGLGPAVKQLAASTAQRSGIKISTDIDYPIRSGIDPIV
+ FGVVRELLSNVVRHSGATTASVRLGITDEKCVLDVADDGVGVTGDTMARRLGEGHIGL
+ ASHRARVDAAGGVLVFLATPRGTHVCVELPLKR"
+ gene complement(943435..944949)
+ /locus_tag="BQ2027_MB0869C"
+ CDS complement(943435..944949)
+ /locus_tag="BQ2027_MB0869C"
+ /note="Mb0869c, -, len: 504 aa. Equivalent to Rv0846c,
+ len: 504 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 504 aa overlap). Probable oxidase (EC
+ 1.-.-.-), showing similarity with several oxidases, mainly
+ L-ascorbate oxidases and copper resistance proteins A
+ (precursors) e.g. P24792|ASO_CUCMA L-ASCORBATE OXIDASE
+ PRECURSOR (ASCORBASE) (EC 1.10.3.3) from Cucurbita maxima
+ (Pumpkin) (Winter squash) (579 aa), FASTA scores: opt:
+ 423, E(): 5.8e-18, (28.4% identity in 493 aa overlap);
+ AF010496|AF010496_32 potential multicopper oxidase from
+ Rhodobacter capsulatus (491 aa), FASTA scores: opt: 490,
+ E(): 2.7e-22, (28.8% identity in 510 aa overlap);
+ 47452|PCOA_ECOLI COPPER RESISTANCE PROTEIN A PRECURSOR
+ (BELONGS TO THE FAMILY OF MULTICOPPER OXIDASES) from
+ Escherichia coli strain K12 (605 aa); etc. Contains
+ PS00080 Multicopper oxidases signature 2 at C-terminus.
+ SEEMS TO BELONG TO THE FAMILY OF MULTICOPPER OXIDASES.
+ Protein product from Mb0869c detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDASE"
+ /protein_id="SIT99468.1"
+ /db_xref="GOA:A0A1R3XWK6"
+ /db_xref="InterPro:IPR001117"
+ /db_xref="InterPro:IPR002355"
+ /db_xref="InterPro:IPR006311"
+ /db_xref="InterPro:IPR008972"
+ /db_xref="InterPro:IPR011706"
+ /db_xref="InterPro:IPR011707"
+ /db_xref="InterPro:IPR033138"
+ /db_xref="InterPro:IPR034279"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWK6"
+ /translation="MPELATSGNAFDKRRFSRRGFLGAGIASGFALAACASKPTASGA
+ AGMTAAIDAAEAARPHSGRTVTATLTPQPARIDLGGPIVSTLTYGNTIPGPLIRATVG
+ DEIVVSVTNRLGDPTSVHWHGIALRNDMDGTEPATANIGPGGDFTYRFSVPDPGTYWA
+ HPHVGLQGDHGLYLPVVVDDPTEPGHYDAEWIIILDDWTDGIGKSPQQLYGELTDPNK
+ PTMQNTTGMPEGEGVDSNLLGGDGGDIAYPYYLINGRIPVAATSFKAKPGQRIRIRII
+ NSAADTAFRIALAGHSMTVTHTDGYPVIPTEVDALLIGMAERYDVMVTAAGGVFPLVA
+ LAEGKNALARALLSTGAGSPPDPQFRPDELNWRVGTVEMFTAATTANLGRPEPTHDLP
+ VTLGGTMAKYDWTINGEPHSTTNPLHVRLGQRPTLMFDNTTMMYHPIHLHGHTFQMIK
+ ADGSPGARKDTVIVLPKQKMRAVLVADNPGVWVMHCHNNYHQVAGMATRLDYIL"
+ gene 945098..945490
+ /gene="lpqS"
+ /locus_tag="BQ2027_MB0870"
+ CDS 945098..945490
+ /gene="lpqS"
+ /locus_tag="BQ2027_MB0870"
+ /note="Mb0870, lpqS, len: 130 aa. Equivalent to Rv0847,
+ len: 130 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 130 aa overlap). Probable lpqS,
+ lipoprotein. Contains possible signal sequence and PS00013
+ Prokaryotic membrane lipoprotein lipid attachment site.
+ Mb0870 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPOPROTEIN LPQS"
+ /protein_id="SIT99469.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWL6"
+ /translation="MVWMRSAIVAVALGVTVAAVAAACWLPQLHRHVAHPNHPLTTSV
+ GSEFVINTDHGHLVDNSMPPCPERLATAVLPRSATPVLLPDVVAAAPGMTAALTDPVA
+ PAARGPPAAQGSVRTGQDLLTRFCLVRR"
+ gene 945693..946811
+ /gene="cysK2"
+ /locus_tag="BQ2027_MB0871"
+ CDS 945693..946811
+ /gene="cysK2"
+ /locus_tag="BQ2027_MB0871"
+ /note="Mb0871, cysK2, len: 372 aa. Equivalent to Rv0848,
+ len: 372 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 372 aa overlap). Possible cysK2,
+ cysteine synthase A (EC 4.2.99.8), but could be also a
+ cysteine synthase B (EC 4.2.99.8) cysM2-product, similar
+ to many e.g. NP_109408.1|NC_002682 cysteine synthase from
+ Mesorhizobium loti (357 aa); Q44004|CYSM_ALCEU CYSTEINE
+ SYNTHASE from Alcaligenes eutrophus strain CH34 (Ralstonia
+ eutropha) (339 aa), FASTA scores: opt: 511, E(): 1.7e-25,
+ (35.0% identity in 314 aa overlap); etc. BELONGS TO THE
+ CYSTEINE SYNTHASE/CYSTATHIONINE BETA-SYNTHASE FAMILY.
+ COFACTOR: PYRIDOXAL PHOSPHATE. Note that previously known
+ as cysM3. Protein product from Mb0871 detected using SWATH
+ mass spectrometry. Mb0871 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CYSTEINE SYNTHASE A CYSK2
+ (O-ACETYLSERINE SULFHYDRYLASE) (O-ACETYLSERINE
+ (THIOL)-LYASE) (CSASE)"
+ /protein_id="SIT99470.1"
+ /db_xref="GOA:A0A1R3XWM7"
+ /db_xref="InterPro:IPR001926"
+ /db_xref="InterPro:IPR036052"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWM7"
+ /translation="MRSRQTRDRYRLLPEGYQVTPGRNRHPGTMVGNTPVLWIPELSG
+ TSDPDRGFWAKLEGFNPGGMKDRPALYMVECARARGDIAPGAAIVESTSGTLGLGLAL
+ AGKVYRHPVTLVTDPGLEPIIARMLTAYGAGVDMGTQPHPVGGWQQARKDRVAQLMAE
+ YPGAWNPNQYGNPDNVGAYRSLALELVAQLGRIDVLVCSVGTGGHSAGVARVLREFNP
+ DMRLIGVDTIGSTIFGQPASNRLMRGLGSSIYPRNVDYRAFDEVHWVAPPEAVWACRS
+ LAATHYASGGWSVGAVALVAGWAARNLPADTTIAAVFPDGPQRYFDTIYNDAYCNEHE
+ LLGGQPPTEPDEIASPLDAVVTRWTRSTTVIDPTQVVS"
+ gene 946811..948070
+ /locus_tag="BQ2027_MB0872"
+ CDS 946811..948070
+ /locus_tag="BQ2027_MB0872"
+ /note="Mb0872, -, len: 419 aa. Equivalent to Rv0849, len:
+ 419 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 419 aa overlap). Probable conserved
+ integral membrane transport protein, possibly member of
+ major facilitator superfamily (MFS) involved in transport
+ of drug, showing similarity with others e.g. T35055
+ probable transport system permease protein from
+ Streptomyces coelicolor (436 aa); NP_295031.1|NC_001263
+ major facilitator family protein from Deinococcus
+ radiodurans (458 aa); NP_455659.1|NC_003198 putative
+ membrane transporter from Salmonella enterica subsp.
+ enterica serovar Typhi (402 aa); etc. Protein product from
+ Mb0872 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE TRANSPORT
+ PROTEIN"
+ /protein_id="SIT99471.1"
+ /db_xref="GOA:A0A1R3XWL5"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWL5"
+ /translation="MGARAIFRGFNRPSRVLMINQFGINIGFYMLMPYLADYLAGPLG
+ LAAWAVGLVMGVRNFSQQGMFFVGGTLADRFGYKPLIIAGCLIRTGGFALLVVAQSLP
+ SVLIAAAATGFAGALFNPAVRGYLAAEAGERKIEAFAMFNVFYQSGILLGPLVGLVLL
+ ALDFRITVLAAAGVFGLLTVAQLVALPQHRADSEREKTSILQDWRVVVRNRPFLTLAA
+ AMTGCYALSFQIYLALPMQASILMPRNQYLLIAAMFAVSGLVAVGGQLRITRWFAVRW
+ GAERSLVVGATILAASFIPVAVIPNGQRFGVAVAVMALVLSASLLAVASAALFPFEMR
+ AVVALSGDRLVATHYGFYSTIVGVGVLVGNLAIGSLMSAARRLNTDEIVWGGLILVGI
+ VAVAGLRRLDTFTSGSQNMTGRWAAPR"
+ gene 948066..948396
+ /locus_tag="BQ2027_IS1606'"
+ mobile_element 948066..948396
+ /locus_tag="BQ2027_IS1606'"
+ /note="IS1606', len: 331 nt. Equivalent to IS1606', len:
+ 331 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(100.0% identity in 331 nt overlap)."
+ /mobile_element_type="insertion sequence:IS1606"
+ gene 948067..948399
+ /locus_tag="BQ2027_MB0873"
+ CDS 948067..948399
+ /locus_tag="BQ2027_MB0873"
+ /note="Mb0873, -, len: 110 aa. Equivalent to Rv0850, len:
+ 110 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 110 aa overlap). Putative transposase
+ (fragment), similar in part to others e.g. Q45144|Q4514
+ TRANSPOSABLE ELEMENT IS31831 (436 aa), FASTA scores: opt:
+ 175, E(): 4.3e-05, (38.6% identity in 57 aa overlap);
+ etc."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE TRANSPOSASE (FRAGMENT)"
+ /protein_id="SIT99472.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYQ0"
+ /translation="MTRDPHSPDCGREGSYRDTITRPLTDLPVAGYPLVPRVASPRYR
+ CTTPQCGRAVFNQDLANVDQYLVVNQLAHQLIDGSSLIPDADKRWDARRHADMTHHLT
+ SSLKENQS"
+ gene complement(948396..949223)
+ /locus_tag="BQ2027_MB0874C"
+ CDS complement(948396..949223)
+ /locus_tag="BQ2027_MB0874C"
+ /note="Mb0874c, -, len: 275 aa. Equivalent to Rv0851c,
+ len: 275 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 275 aa overlap). Probable short-chain
+ dehydrogenase/reductase (EC 1.-.-.-), similar to many e.g.
+ Q01198|LIGD_PSEPA C ALPHA-DEHYDROGENASE (EC 1.1.1.-)(SDR
+ FAMILY) from Pseudomonas paucimobilis (Sphingomonas
+ paucimobilis) (305 aa); D11473|PSELIG_1 C
+ alpha-dehydrogenase from P. paucimobilis (305 aa), FASTA
+ scores: opt: 468, E(): 4.9e-23, (30.8% identity in 279 aa
+ overlap); NP_421969.1|NC_002696 short chain dehydrogenase
+ family protein from Caulobacter crescentus (278 aa); etc.
+ Contains PS00061 Short-chain dehydrogenases/reductases
+ family signature. BELONGS TO THE SHORT-CHAIN
+ DEHYDROGENASES/REDUCTASES (SDR) FAMILY. Mb0874c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable short-chain type
+ dehydrogenase/reductase"
+ /protein_id="SIT99473.1"
+ /db_xref="GOA:A0A1R3XXK9"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXK9"
+ /translation="MDGFPGRGAVITGGASGIGLATGTEFARRGARVVLGDVDKPGLR
+ QAVNHLRAEGFDVHGVMCDVRHREEVTHLADEAFRLLGHFDVVFSNAGIVVGGPIVEM
+ THDDWRWVIDVDLWGSIHTVEAFLPRLLEQGTGGHVVFTASFAGLVPNAGLGAYGVAK
+ YGVVGLAETLAREVTADGIGVSVLCPMVVETNLVANSERIRGAACAQSSTTGSPGPLP
+ LQDDNLGVDDIAQLTADAILANRLYVLPHAASRASIRRRFERIDRTFDEQAAEGWRH"
+ gene 949314..950150
+ /gene="fadD16"
+ /locus_tag="BQ2027_MB0875"
+ CDS 949314..950150
+ /gene="fadD16"
+ /locus_tag="BQ2027_MB0875"
+ /note="Mb0875, fadD16, len: 278 aa. Equivalent to Rv0852,
+ len: 278 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 278 aa overlap). Possible fadD16,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), similar in part to
+ various CoA ligases e.g. P18163|LCFB_RAT
+ LONG-CHAIN-FATTY-ACID--COA LIGASE from Rattus norvegicus
+ (Rat) (699 aa); D49366|LEP4CCOALA_1 4-coumarate:CoA ligase
+ from Lithospermum erythrorhizon (636 aa), FASTA scores:
+ opt: 134, E(): 0.15, (26.8% identity in 213 aa overlap);
+ orgp|L09229|HUMFACAL_1 long-chain acyl-coenzyme A from
+ homo sapiens (human) (699 aa), FASTA score: (50.0%
+ identity in 40 aa overlap); etc. Contains PS00626
+ Regulator of chromosome condensation (RCC1) signature 2.
+ Protein product from Mb0875 detected using SWATH mass
+ spectrometry. Mb0875 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE FATTY-ACID-COA LIGASE FADD16
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="SIT99474.1"
+ /db_xref="GOA:A0A1R3XWN9"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWN9"
+ /translation="MFTIGYSCASRGADSWLIRRCSVVQGCLDDPGATVEAIDDDGWP
+ HTGDPCSPNSAASGKYGERPASVSTGDIHSLVIASDYRVPDPGRVWPLLQRNKSALAD
+ IGAHHVLIYASTHDSGRVLVMIGVRSREPIVELLRSRVFFDWFDAMGVDDIPAVFAGE
+ IVDRFVAAPTTTQSTPRVPGVVVAAFASVNNVSNLTAEVRSAIARFTAAGIRKTWVFQ
+ AFDDAHEVLILQEFADEAGARQWIEHPDAAAEWMSGAGVGAYPPLFVGRFFDMMRIEA
+ LQ"
+ gene complement(950191..951873)
+ /gene="pdc"
+ /locus_tag="BQ2027_MB0876C"
+ CDS complement(950191..951873)
+ /gene="pdc"
+ /locus_tag="BQ2027_MB0876C"
+ /note="Mb0876c, pdc, len: 560 aa. Equivalent to Rv0853c,
+ len: 560 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 560 aa overlap). Probable pdc,
+ pyruvate or indole-pyruvate decarboxylase (EC 4.1.1.-),
+ equivalent to NP_302424.1|NC_002677 pyruvate (or
+ indolepyruvate) decarboxylase from Mycobacterium leprae
+ (569 aa). Also highly similar to others e.g.
+ AAB06571.1|L80006 indolepyruvate decarboxylase from
+ Pantoea agglomerans (550 aa); Q12629|DCPY_KLULA PYRUVATE
+ DECARBOXYLASE (EC 4.1.1.1) from Kluyveromyces marxianus
+ var. lactis (563 aa); P71323 INDOLEPYRUVATE DECARBOXYLASE
+ (EC 4.1.1.74) from Enterobacter herbicola (550 aa), FASTA
+ scores: opt: 1642, E(): 0, (48.1% identity in 547 aa
+ overlap); P23234|DCIP_ENTCL INDOLE-3-PYRUVATE
+ DECARBOXYLASE (INDOLEPYRUVATE DECARBOXYLASE) from
+ Enterobacter cloacae (552 aa), FASTA scores: opt: 1596,
+ E(): 0, (46.8% identity in 551 aa overlap); etc. Contains
+ PS00187 Thiamine pyrophosphate enzymes signature and
+ PS00017 ATP/GTP-binding site motif A (P-loop). COFACTOR:
+ THIAMINE PYROPHOSPHATE. Protein product from Mb0876c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0876c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PYRUVATE OR INDOLE-3-PYRUVATE
+ DECARBOXYLASE PDC"
+ /protein_id="SIT99475.1"
+ /db_xref="GOA:Q7U140"
+ /db_xref="InterPro:IPR000399"
+ /db_xref="InterPro:IPR011766"
+ /db_xref="InterPro:IPR012000"
+ /db_xref="InterPro:IPR012001"
+ /db_xref="InterPro:IPR012110"
+ /db_xref="InterPro:IPR029035"
+ /db_xref="InterPro:IPR029061"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U140"
+ /translation="MTPQKSDACSDPVYTVGDYLLDRLAELGVSEIFGVPGDYNLQFL
+ DHIVAHPTIRWVGSANELNAGYAADGYGRLRGMSAVVTTFGVGELSVTNAIAGSYAEH
+ VPVVHIVGGPTKDAQGTRRALHHSLGDGDFEHFLRISREITCAQANLMPATAGREIDR
+ VLSEVREQKRPGYILLSSDVARFPTEPPAAPLPRYPGGTSPRALSLFTKAAIELIADH
+ QLTVLADLLVHRLQAVKELEALLAADVVPHATLMWGKSLLDESSPNFLGIYAGAASAE
+ RVRAAIEGAPVLVTAGVVFTDMVSGFFSQRIDPARTIDIGQYQSSVADQVFAPLEMSA
+ ALQALATILTGRGISSPPVVPPPAEPPPAMPARDEPLTQQMVWDRVCSALTPGNVVLA
+ DQGTSFYGMADHRLPQGVTFIGQPLWGSIGYTLPAAVGAAVAHPDRRTVLLIGDGAAQ
+ LTVQELGTFSREGLSPVIVVVNNDGYTVERAIHGETAPYNDIVSWNWTELPSALGVTN
+ HLAFRAQTYGQLDDALTVAAARRDRMVLVEVVLPRLEIPRLLGQLVGSMAPQ"
+ gene 951938..952381
+ /locus_tag="BQ2027_MB0877"
+ CDS 951938..952381
+ /locus_tag="BQ2027_MB0877"
+ /note="Mb0877, -, len: 147 aa. Equivalent to Rv0854, len:
+ 147 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 147 aa overlap). Conserved
+ hypothetical protein, similar to several hypothetical
+ protein from Mycobacterium leprae e.g.
+ NP_301674.1|NC_002677 (144 aa);
+ NP_302683.1|NC_002677|Z95398|MLCL622.27c (156 aa), FASTA
+ scores: opt: 193, E(): 1.6e-06, (24.6% identity in 134 aa
+ overlap); NP_301218.1|NC_002677 (146 aa); MTCI28.04|Z97050
+ (184 aa), FASTA scores: opt: 171, E(): 5.8e-05, (21.5%
+ identity in 135 aa overlap). Also similar to
+ SC6G10.02c|T35511|AL049497|SC6G10_2 hypothetical protein
+ from Streptomyces coelicolor (144 aa), FASTA scores: opt:
+ 344, E(): 6.1e- 17, (37.6% identity in 141 aa overlap).
+ And similar to many proteins from Mycobacterium
+ tuberculosis e.g. downstreams ORFs Rv0856 and Rv0857, etc.
+ Protein product from Mb0877 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0877 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Cyclase/Dehydrase"
+ /protein_id="SIT99476.1"
+ /db_xref="InterPro:IPR019587"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWM3"
+ /translation="MAIKESRDIVIEASPEEILDVIADFEAMTEWSPAHQSVEILETG
+ DDGRPSKVKMKVKTAGITDEQVVAYSWTDRSVRWTLVSSTQQRSQDGKYELTPKGDNT
+ LVQFEITVDPQVPLPGFVLKRAIKGTIDTATEALRSQVLKVKKGQ"
+ gene 952387..953466
+ /gene="far"
+ /locus_tag="BQ2027_MB0878"
+ CDS 952387..953466
+ /gene="far"
+ /locus_tag="BQ2027_MB0878"
+ /note="Mb0878, far, len: 359 aa. Equivalent to Rv0855,
+ len: 359 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 359 aa overlap). Probable far, fatty
+ acid-CoA racemase (EC 5.1.-.-), highly similar to
+ CAB08122.1|Z94723 unknown protein from Mycobacterium
+ leprae (253 aa) (C-terminus shorter). Also similar to many
+ eukaryotic and bacteria racemases e.g. T35425 probable
+ fatty acid CoA racemase from Streptomyces coelicolor (387
+ aa); P70473|AMAC_RAT ALPHA-METHYLACYL-COA RACEMASE
+ (2-METHYLACYL-COA RACEMASE) (2-ARYLPROPIONYL-COA
+ EPIMERASE) (EC 5.1.99.4) from Rattus norvegicus (Rat) (382
+ aa); NP_103687.1|NC_002678 probable fatty acid Co-A
+ racemase from Mesorhizobium loti (389 aa); etc. Also
+ similar to proteins from Mycobacterium tuberculosis e.g.
+ Rv1143|MTCI65.10|MCR from Mycobacterium tuberculosis (360
+ aa), FASTA scores: opt: 1373, E(): 0, (56.8% identity in
+ 359 aa overlap), Rv1866|MTCY359.07 (C-terminal half) (778
+ aa), Rv3272 (360 aa). Protein product from Mb0878 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0878 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY-ACID-COA RACEMASE FAR"
+ /protein_id="SIT99477.1"
+ /db_xref="GOA:A0A1R3XWM8"
+ /db_xref="InterPro:IPR003673"
+ /db_xref="InterPro:IPR023606"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWM8"
+ /translation="MTTGGPLAGVKVIELGGIGPGPHAGMVLADLGADVVRVRRPGGL
+ TMPSEDRDLLHRGKRIVDLDVKTQPQAMLELAAKADVLLDCFRPGTCERLGIGPDDCA
+ SVNPRLIFARITGWGQDGPLASTAGHDINYLSQTGALAAFGYADRPPMPPLNLVADFG
+ GGSMLVLLGIVVALYERERSGVGQVVDAAMVDGVSVLAQMMWTMKGIGSLRDQRESFL
+ LDGGAPFYRCYETSDGKYMAVGAIEPQFFAALLSGLGLSAADVPTQLDVAGYPQMYDI
+ FAERFASRTRDEWTRVFAGTDACVTPVLAWSEAANNDHLKARSTVITAHGVQQAAPAP
+ RFSRTPAGPVRPPPAAATPIDEINW"
+ gene 953579..953983
+ /locus_tag="BQ2027_MB0879"
+ CDS 953579..953983
+ /locus_tag="BQ2027_MB0879"
+ /note="Mb0879, -, len: 134 aa. Equivalent to Rv0856, len:
+ 134 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 134 aa overlap). Conserved
+ hypothetical protein, showing weak similarity with
+ NP_301674.1| (NC_002677) conserved hypothetical protein
+ from Mycobacterium leprae (144 aa); and SC6G10.02c|T35511
+ hypothetical protein from Streptomyces coelicolor (144
+ aa). Also highly similar to other proteins from
+ Mycobacterium tuberculosis e.g. neighbouring ORF
+ downstream Rv0857 CONSERVED HYPOTHETICAL PROTEIN (126 aa),
+ FASTA scores: E(): 7.4e-27, (62.0% identity in 100 aa
+ overlap); neighbouring ORF Rv0854|MTV043_47 CONSERVED
+ HYPOTHETICAL PROTEIN (147 aa), FASTA scores: E(): 1.6e-15,
+ (36.6% identity in 123 aa overlap),
+ MTCI28.04|Z97050|MTCI28_4 (184 aa), FASTA scores: opt:
+ 127, E(): 0.036, (26.0% identity in 127 aa overlap); and
+ MLCL622.27c|Z95398 (156 aa), FASTA scores: opt: 123, E():
+ 0.06, (26.4% identity in 125 aa overlap). Protein product
+ from Mb0879 detected using SWATH mass spectrometry. Mb0879
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99478.1"
+ /db_xref="InterPro:IPR005031"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWL4"
+ /translation="MEALADVGVLASWSPLHKQVEVIDYYPDGRPHHVRATVKILGLV
+ DKEVLEYHWGPDWVCWDADQTFQQHGQHIEYTVKPEGVDRARVRFDITVEPAGPIPGF
+ IVKRASEHVLDAAAKGLQKLIAGAGDQGNAKS"
+ gene 954011..954484
+ /locus_tag="BQ2027_MB0880"
+ CDS 954011..954484
+ /locus_tag="BQ2027_MB0880"
+ /note="Mb0880, -, len: 157 aa. Equivalent to Rv0857, len:
+ 157 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 157 aa overlap). Conserved
+ hypothetical protein, showing weak similarity with
+ SC6G10.02|T35511 hypothetical protein from Streptomyces
+ coelicolor (144 aa). Also highly similar to other proteins
+ from Mycobacterium tuberculosis e.g. upstream ORF Rv0856
+ (134 aa), FASTA scores: E(): 9.6e-28, (61.6% identity in
+ 99 aa overlap); upstream ORF Rv0854 (147 aa), FASTA
+ scores: E(): 2.8e-18, (42.7% identity in 117 aa overlap);
+ MTCI28.04|Z97050 (184 aa), FASTA scores: opt: 122, E():
+ 0.031, (29.4% identity in 85 aa overlap); and
+ MLCL622.27c|Z95398 (156 aa), FASTA scores: opt: 114, E():
+ 0.1, (30.9% identity in 55 aa overlap). Protein product
+ from Mb0880 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0880 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="link to Polyketide_cyclase/dehydratase."
+ /protein_id="SIT99479.1"
+ /db_xref="InterPro:IPR019587"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWM9"
+ /translation="MIANLVAVAIRASREVVIEAPPEVIVEALADMDAVPSWSSVHKR
+ VEVVDTYSDGRPHHVKVTIKVAGIVDTELLEYHWGPDWVVWDAAKTAQQHGQHGEYNL
+ RREDNDKTRVRFTLTVEPSAPLPAFWVNIARKKILHAATEGLRKQVVGRRRFTSG"
+ gene complement(954481..955674)
+ /gene="dapc"
+ /locus_tag="BQ2027_MB0881C"
+ CDS complement(954481..955674)
+ /gene="dapc"
+ /locus_tag="BQ2027_MB0881C"
+ /note="Mb0881c, -, len: 397 aa. Equivalent to Rv0858c,
+ len: 397 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 397 aa overlap). Probable
+ aminotransferase (EC 2.6.1.-), highly similar to others
+ from Eukaryota and bacteria, especially aspartate
+ aminotransferases (transaminases) (EC 2.6.1.1), e.g.
+ NP_177890.1|NC_003070 putative aminotransferase from
+ Arabidopsis thaliana (440 aa); NP_419555.1|NC_002696
+ aminotransferase class I from Caulobacter crescentus (385
+ aa); NP_415133.1|NC_000913|AE0001|ECAE000165_8 putative
+ aminotransferase from Escherichia coli strain K12 (386
+ aa), FASTA scores: opt: 830, E(): 0, (38.0% identity in
+ 389 aa overlap); X99521|TAX99521_1 aspartate
+ aminotransferase from Thermus aquaticus (383 aa), FASTA
+ scores: opt: 702, E(): 0, (34.9% identity in 393 aa
+ overlap); etc. Also similar to other putative
+ aminotransferases from Mycobacterium tuberculosis e.g.
+ Rv2294, Rv3565, etc. Protein product from Mb0881c detected
+ using SWATH mass spectrometry. Mb0881c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable n-succinyldiaminopimelate
+ aminotransferase dapc (dap-at)"
+ /protein_id="SIT99480.1"
+ /db_xref="GOA:A0A1R3XWP0"
+ /db_xref="InterPro:IPR004839"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWP0"
+ /translation="MTVSRLRPYATTVFAEMSALATRIGAVNLGQGFPDEDGPPKMLQ
+ AAQDAIAGGVNQYPPGPGSAPLRRAIAAQRRRHFGVDYDPETEVLVTVGATEAIAAAV
+ LGLVEPGSEVLLIEPFYDSYSPVVAMAGAHRVTVPLVPDGRGFALDADALRRAVTPRT
+ RALIINSPHNPTGAVLSATELAAIAEIAVAANLVVITDEVYEHLVFDHARHLPLAGFD
+ GMAERTITISSAAKMFNCTGWKIGWACGPAELIAGVRAAKQYLSYVGGAPFQPAVALA
+ LDTEDAWVAALRNSLRARRDRLAAGLTEIGFAVHDSYGTYFLCADPRPLGYDDSTEFC
+ AALPEKVGVAAIPMSAFCDPAAGQASQQADVWNHLVRFTFCKRDDTLDEAIRRLSVLA
+ ERPAT"
+ gene 955831..957042
+ /gene="fadA"
+ /locus_tag="BQ2027_MB0882"
+ CDS 955831..957042
+ /gene="fadA"
+ /locus_tag="BQ2027_MB0882"
+ /note="Mb0882, fadA, len: 403 aa. Equivalent to Rv0859,
+ len: 403 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 403 aa overlap). Possible fadA,
+ acyl-CoA thiolase (EC 2.3.1.-), equivalent to
+ NP_302423.1|NC_002677 putative beta-ketoadipyl CoA
+ thiolase from Mycobacterium leprae (403 aa). Also highly
+ similar to acyl/acetyl-CoA thiolases and beta-ketoadipyl
+ CoA thiolases, e.g. T35428 probable acetyl CoA
+ acetyltransferase (thiolase) from Streptomyces coelicolor
+ (404 aa); NP_250427.1|NC_002516 probable acyl-CoA thiolase
+ from Pseudomonas aeruginosa (401 aa);
+ NP_106253.1|NC_002678 probable acyl-CoA thiolase from
+ Mesorhizobium loti (402 aa); NP_248919.1|NC_002516|PcaF
+ beta-ketoadipyl CoA thiolase PcaF from Pseudomonas
+ aeruginosa (401 aa); etc. Contains PS00098 Thiolases
+ acyl-enzyme intermediate signature, PS00737 Thiolases
+ signature 2 and PS00099 Thiolases active site. Protein
+ product from Mb0882 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0882 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ACYL-COA THIOLASE FADA"
+ /protein_id="SIT99481.1"
+ /db_xref="GOA:A0A1R3XWM6"
+ /db_xref="InterPro:IPR002155"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020610"
+ /db_xref="InterPro:IPR020613"
+ /db_xref="InterPro:IPR020615"
+ /db_xref="InterPro:IPR020616"
+ /db_xref="InterPro:IPR020617"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWM6"
+ /translation="MSEEAFIYEAIRTPRGKQKNGSLHEVKPLSLVVGLIDELRKRHP
+ DLDENLISDVILGCVSPVGDQGGDIARAAVLASGMPVTSGGVQLNRFCASGLEAVNTA
+ AQKVRSGWDDLVLAGGVESMSRVPMGSDGGAMGLDPATNYDVMFVPQGIGADLIATIE
+ GFSREDVDAYALRSQQKAAEAWSGGYFAKSVVPVRDQNGLLILDHDEHMRPDTTKEGL
+ AKLKPAFEGLAALGGFDDVALQKYHWVEKINHVHTGGNSSGIVDGAALVMIGSAAAGK
+ LQGLTPRARIVATATSGADPVIMLTGPTPATRKVLDRAGLTVDDIDLFELNEAFASVV
+ LKFQKDLNIPDEKLNVNGGAIAMGHPLGATGAMILGTMVDELERRNARRALITLCIGG
+ GMGVATIIERV"
+ gene 957047..959209
+ /gene="fadB"
+ /locus_tag="BQ2027_MB0883"
+ CDS 957047..959209
+ /gene="fadB"
+ /locus_tag="BQ2027_MB0883"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0883, fadB, len: 720 aa. Equivalent to Rv0860,
+ len: 720 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 720 aa overlap). Probable fadB, fatty
+ oxidation protein, equivalent to NP_302422.1|NC_002677
+ putative fatty oxidation complex alpha subunit from
+ Mycobacterium leprae (714 aa). Also highly similar to
+ others and various proteins involved in fatty acid
+ metabolism, e.g. T35429 probable fatty oxidation protein
+ from Streptomyces coelicolor (733 aa);
+ NP_250428.1|NC_002516 probable 3-hydroxyacyl-CoA
+ dehydrogenase from Pseudomonas aeruginosa (714 aa);
+ NP_418895.1|NC_002696 fatty oxidation complex alpha
+ subunit from Caulobacter crescentus (709 aa);
+ P40939|ECHA_HUMAN TRIFUNCTIONAL ENZYME ALPHA SUBUNIT
+ [INCLUDES: LONG-CHAIN ENOYL-COA HYDRATASE (EC 4.2.1.17);
+ LONG CHAIN 3-HYDROXYACYL-COA DEHYDROGENASE (EC 1.1.1.35)]
+ from Homo sapiens (763 aa), FASTA scores: opt: 1176, E():
+ 0, (32.4% identity in 722 aa overlap); P21177|FADB_ECOLI
+ FATTY OXIDATION COMPLEX ALPHA SUBUNIT [INCLUDES: ENOYL-COA
+ HYDRATASE (EC 4.2.1.17);
+ DELTA(3)-CIS-DELTA(2)-TRANS-ENOYL-COA ISOMERASE (EC
+ 5.3.3.8); 3-HYDROXYACYL-COA DEHYDROGENASE (EC 1.1.1.35);
+ 3-HYDROXYBUTYRYL-COA EPIMERASE (EC 5.1.2.3)] from
+ Escherichia coli strain K12 (729 aa), FASTA scores: opt:
+ 873, E(): 0, (33.6% identity in 693 aa overlap); etc.
+ Protein product from Mb0883 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0883 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY OXIDATION PROTEIN FADB"
+ /protein_id="SIT99482.1"
+ /db_xref="GOA:A0A1R3XYQ9"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR006108"
+ /db_xref="InterPro:IPR006176"
+ /db_xref="InterPro:IPR008927"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYQ9"
+ /translation="MPDNTIQWDKDADGIVTLTMDDPSGSTNVMNEAYIESMGKAVDR
+ LVAEKDSITGVVVASAKKTFFAGGDVKTMIQARPEDAGDVFNTVETIKRQLRTLETLG
+ KPVVAAINGAALGGGLEIALACHHRIAADVKGSQLGLPEVTLGLLPGGGGVTRTVRMF
+ GIQNAFVSVLAQGTRFKPAKAKEIGLVDELVATVEELVPAAKAWIKEELKANPDGAGV
+ QPWDKKGYKMPGGTPSSPGLAAILPSFPSNLRKQLKGAPMPAPRAILAAAVEGAQVDF
+ DTASRIESRYFASLVTGQVAKNMMQAFFFDLQAINAGGSRPEGIGKTPIKRIGVLGAG
+ MMGAGIAYVSAKAGYEVVLKDVSLEAAAKGKGYSEKLEAKALERGRTTQERSDALLAR
+ ITPTADAADFKGVDFVIEAVFENQELKHKVFGEIEDIVEPNAILGSNTSTLPITGLAT
+ GVKRQEDFIGIHFFSPVDKMPLVEIIKGEKTSDEALARVFDYTLAIGKTPIVVNDSRG
+ FFTSRVIGTFVNEALAMLGEGVEPASIEQAGSQAGYPAPPLQLSDELNLELMHKIAVA
+ TRKGVEDAGGTYQPHPAEAVVEKMIELGRSGRLKGAGFYEYADGKRSGLWPGLRETFK
+ SGSSQPPLQDMIDRMLFAEALETQKCLDEGVLTSTADANIGSIMGIGFPPWTGGSAQF
+ IVGYSGPAGTGKAAFVARTRELAAAYGDRFLPPESLLS"
+ gene complement(959277..960905)
+ /gene="ercc3"
+ /locus_tag="BQ2027_MB0884C"
+ CDS complement(959277..960905)
+ /gene="ercc3"
+ /locus_tag="BQ2027_MB0884C"
+ /note="Mb0884c, -, len: 542 aa. Equivalent to Rv0861c,
+ len: 542 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 542 aa overlap). Probable DNA helicase
+ (EC 3.6.1.-), equivalent to NP_302420.1|NC_002677 probable
+ DNA helicase from Mycobacterium leprae (549 aa). Also
+ highly similar to others (shorter than several eukaryotic
+ enzymes) e.g. NP_218820.1|NC_000919|AE001217|AE0 01217_6
+ putative DNA repair helicase from Treponema pallidum (606
+ aa), FASTA scores: opt: 1275, E(): 0, (47.5% identity in
+ 592 aa overlap); Q00578|RA25_YEAST DNA REPAIR HELICASE
+ from Saccharomyces cerevisiae (843 aa), FASTA scores: opt:
+ 777, E(): 0, (30.4% identity in 605 aa overlap);
+ P49135|XPB_MOUSE DNA-REPAIR PROTEIN COMPLEMENTING XP-B
+ CELLS from Mus musculus (Mouse) (783 aa), FASTA scores:
+ opt: 761, E(): 0, (36.3% identity in 375 aa overlap); etc.
+ SEEMS TO BELONG TO THE HELICASE FAMILY. Protein product
+ from Mb0884c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0884c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="dna helicase ercc3"
+ /protein_id="SIT99483.1"
+ /db_xref="GOA:A0A1R3XXL8"
+ /db_xref="InterPro:IPR001650"
+ /db_xref="InterPro:IPR006935"
+ /db_xref="InterPro:IPR014001"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR032438"
+ /db_xref="InterPro:IPR032830"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXL8"
+ /translation="MQSDKTVLLEVDHELAGAARAAIAPFAELERAPEHVHTYRITPL
+ ALWNARAAGHDAEQVVDALVSYSRYAVPQPLLVDIVDTMARYGRLQLVKNPAHGLTLV
+ SLDRAVLEEVLRNKKIAPMLGARIDDDTVVVHPSERGRVKQLLLKIGWPAEDLAGYVD
+ GEAHPISLHQEGWQLRDYQRLAADSFWAGGSGVVVLPCGAGKTLVGAAAMAKAGATTL
+ ILVTNIVAARQWKRELVARTSLTENEIGEFSGERKEIRPATISTYQMITRRTKGEYRH
+ LELFDSRDWGLIIYDEVHLLPAPVFRMTADLQSKRRLGLTATLIREDGREGDVFSLIG
+ PKRYDAPWKDIEAQGWIAPAECVEVRVTMTDSERMMYATAEPEERYRICSTVHTKIAV
+ VKSILAKHPDEQTLVIGAYLDQLDELGAELGAPVIQGSTRTSEREALFDAFRRGEVAT
+ LVVSKVANFSIDLPEAAVAVQVSGTFGSRQEEAQRLGRILRPKADGGGAIFYSVVARD
+ SLDAEYAAHRQRFLAEQGYGYIIRDADDLLGPAI"
+ gene complement(961043..963313)
+ /locus_tag="BQ2027_MB0885C"
+ CDS complement(961043..963313)
+ /locus_tag="BQ2027_MB0885C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0885c, -, len: 756 aa. Equivalent to Rv0862c,
+ len: 756 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 756 aa overlap). Conserved hypothetical
+ protein, equivalent to NP_302419.1|NC_002677 possible
+ DNA-binding protein from Mycobacterium leprae (753 aa);
+ and highly similar (except in C-terminus) to
+ MLCB57.01|Z99494|T45333 hypothetical protein from
+ Mycobacterium leprae (>577 aa, truncated), FASTA scores:
+ opt: 3047, E(): 0, (78.9% identity in 578 aa overlap).
+ Also similar in part to SCD12A.03c|AB93395.1|AL357524
+ hypothetical protein from Streptomyces coelicolor (867
+ aa). Protein product from Mb0885c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0885c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative DNA-binding protein"
+ /protein_id="SIT99484.1"
+ /db_xref="InterPro:IPR032830"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWQ0"
+ /translation="MTEHTPDIPLGSWLAALPDERLTQLLELRPDLAQPPPGSIAALA
+ ARAQARQSVKAATDELDFLRLAVFDALLVLQADTAPVPIVRLLAVIGDRAAQADVLGA
+ LADLKQRALAWGETAVRVATDAGTALPWHPGQVTLEGSSRSGDQLADLIAGLDPAQRD
+ VLDKLLQGSPVGRTRDAAPGAPSDRPVPRLLAMGLLRRIDAETVILPRHVGQVLRGEQ
+ PGPMELTAPDPVVSTTTPDDADAAAAGAVIDLLREVDVLLENLGATPVAELRSGGLGV
+ REFKRLAKATGIDEPRLGLILEIAAAAGLIASGMPDPEPPHSDGPFWAPTVAADRFAT
+ MSPAERWHLLASAWLDLPGRPALIGTRGPDAKPYGALSDSLFSTAAPLDRRLLLGMLA
+ ELPAGAGVDASRASATLIWRRPRWARRLQPAPIADLLTEGHALGLVGRGAISTPARAL
+ LDEALEPATAPAAAVGVMARALPKPIDHFLVQADLTVVVPGPLQRELADDLTTVATVE
+ SAGTAMVYRVSEQSIRHALDVGKSRDWLQEFFANRSKTPVPQGLTYLIDDVARRHGQL
+ RIGMAASFVRCEDPTLLAQVVAAPEADGLALRALAPTVAVSPAPISEVLVTLRGAGFA
+ PAAEDSTGAVVDVRTRGARVPTPQRRRPYRPPPRPNSEALKAVVAVLREVTAAPFANV
+ RVDPAVTMSLLQRAAKDQATLVISYLDAAGVATQRVVAPITLRGGQLVAFDSSSGRLR
+ DFAIHRITSVVSAHDR"
+ gene 963300..963581
+ /locus_tag="BQ2027_MB0886"
+ CDS 963300..963581
+ /locus_tag="BQ2027_MB0886"
+ /note="Mb0886, -, len: 93 aa. Equivalent to Rv0863, len:
+ 93 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 93 aa overlap). Conserved hypothetical
+ protein, highly similar to NP_302418.1|NC_002677 conserved
+ hypothetical protein from Mycobacterium leprae (74 aa).
+ Also weakly similar in part to U82598|ECU82598_135
+ HYPOTHETICAL PROTEIN from Escherichia coli, FASTA scores:
+ (32.4% identity in 71 aa overlap); and M74011|YEPYSCOP_8
+ HYPOTHETICAL PROTEIN from Yersinia enterocolitica (165
+ aa), FASTA scores: (38.6 identity in 57 aa overlap).
+ Protein product from Mb0886 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0886 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99485.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX11"
+ /translation="MCSVIADQRRPDQPCGVGGCKTCQNGFVADIAEGKARKTRYVDH
+ GWPTTDPDDHAVSELVTDRTGALSPFGELTFPVPSDDLPYIHPVTVINR"
+ gene 963665..964093
+ /gene="moaC2"
+ /locus_tag="BQ2027_MB0888"
+ CDS 963665..964093
+ /gene="moaC2"
+ /locus_tag="BQ2027_MB0888"
+ /note="Mb0888, moaC2, len: 142 aa. Similar to Rv0864, len:
+ 167 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 142 aa overlap). Probable moaC2,
+ molybdopterin cofactor biosynthesis protein, highly
+ similar to others e.g. CAB59676.1|AL132674 molybdenum
+ cofactor biosynthesis protein from Streptomyces coelicolor
+ (170 aa); NP_418834.1|NC_002696 molybdenum cofactor
+ biosynthesis protein C from Caulobacter crescentus (186
+ aa); Y10817|ANY10817_3|T44852 molybdopterin co-factor
+ synthesis protein moaC from Arthrobacter nicotinovorans
+ plasmid pAO1 (169 aa), FASTA scores: opt: 491, E():
+ 2.4e-29, (51.0% identity in 151 aa overlap); etc. Also
+ highly similar to O05788|MOAC1|Rv3111|MTCY164.21 PUTATIVE
+ MOLYBDENUM COFACTOR BIOSYNTHESIS PROTEIN C from
+ Mycobacterium tuberculosis (170 aa), FASTA scores: opt:
+ 491, E(): 2.4e-29, (54.9% identity in 153 aa overlap); and
+ O53376|Rv3324c|MOAC3|MTV016.24c PUTATIVE MOLYBDENUM
+ COFACTOR BIOSYNTHESIS PROTEIN C3 (177 aa).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ frameshift due to a single base deletion (g-*) leads to a
+ different NH2 part compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv. Protein product
+ from Mb0888 detected using SWATH mass spectrometry. Mb0888
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable molybdenum cofactor biosynthesis
+ protein c 2 moac2"
+ /protein_id="SIT99486.1"
+ /db_xref="GOA:P0A5K7"
+ /db_xref="InterPro:IPR002820"
+ /db_xref="InterPro:IPR023045"
+ /db_xref="InterPro:IPR036522"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5K7"
+ /translation="MVDITEKATTKRTAVAAGILRTSAQVVALISTGGLPKGDALATA
+ RVAGIMAAKRTSDLIPLCHQLALTGVDVDFTVGQLDIEITATVRSTDRTGVEMEALTA
+ VSVAALTLYDMIKAVDPGALIDDIRVLHKEGGRRGTWTRR"
+ gene 964090..964572
+ /gene="mog"
+ /locus_tag="BQ2027_MB0889"
+ CDS 964090..964572
+ /gene="mog"
+ /locus_tag="BQ2027_MB0889"
+ /note="Mb0889, mog, len: 160 aa. Equivalent to Rv0865,
+ len: 160 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 160 aa overlap). Probable mog,
+ molybdopterin biosynthesis MOG protein, highly similar or
+ similar to other molybdenum cofactor biosynthesis proteins
+ e.g. CAB59675.1|AL132674 molybdenum cofactor biosynthesis
+ protein from Streptomyces coelicolor (179 aa);
+ NP_301253.1|NC_002677 putative molybdenum cofactor
+ biosynthesis protein from Mycobacterium leprae (181 aa);
+ CAC39235.1|AJ312124 Mog protein from Eubacterium
+ acidaminophilum (162 aa); P44645|MOG_HAEIN|MOGA|HI0336
+ MOLYBDOPTERIN BIOSYNTHESIS MOG PROTEIN from Haemophilus
+ influenzae (197 aa), FASTA scores: opt: 306, E(): 9e-13,
+ (39.6% identity in 139 aa overlap); P28694|MOG_ECOLI
+ MOLYBDOPTERIN BIOSYNTHESIS MOG PROTEIN from Escherichia
+ coli (195 aa), FASTA scores: opt: 265, E(): 3.6e-10, (34.2
+ identity in 146 aa overlap); etc. Also highly similar to
+ Rv0984|MTV044.12|MOAB2 POSSIBLE
+ PTERIN-4-ALPHA-CARBINOLAMINE DEHYDRATASE from
+ Mycobacterium tuberculosis (181 aa). Protein product from
+ Mb0889 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0889 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable molybdopterin biosynthesis mog protein"
+ /protein_id="SIT99487.1"
+ /db_xref="InterPro:IPR001453"
+ /db_xref="InterPro:IPR036425"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWN7"
+ /translation="MSTRSARIVVVSSRAAAGVYTDDCGPIIAGWLEQHGFSSVQPQV
+ VADGNPVGEALHDAVNAGVDVIITSGGTGISPTDTTPEHTVAVLDYVIPGLADAIRRS
+ GLPKVPTSVLSRGVCGVAGRTLIINLPGSPGGVRDGLGVLADVLDHALEQIAGGDHPR
+ "
+ gene 964569..964994
+ /gene="moaE2"
+ /locus_tag="BQ2027_MB0890"
+ CDS 964569..964994
+ /gene="moaE2"
+ /locus_tag="BQ2027_MB0890"
+ /note="Mb0890, moaE2, len: 141 aa. Equivalent to Rv0866,
+ len: 141 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 141 aa overlap). Probable moaE2,
+ molybdopterin converting factor E (molybdopterin
+ converting factor (subunit 2)), similar to others e.g.
+ Y10817|ANY10817_4|T44853 molybdopterin biosynthesis
+ protein E chain from Arthrobacter nicotinovorans plasmid
+ pAO1 (155 aa), FASTA scores: opt: 460, E(): 3.5e-27, (49.3
+ identity in 146 aa overlap); CAC01331.1|AL390968 moaE-like
+ protein from Streptomyces coelicolor (152 aa);
+ NP_389313.1|NC_000964 molybdopterin converting factor
+ (subunit 2) from Bacillus subtilis (157 aa); etc. Also
+ highly similar to Rv3119|MOAE1|Z95150|MTCY164_30 PUTATIVE
+ MOLYBDENUM COFACTOR BIOSYNTHESIS PROTEIN E from
+ Mycobacterium tuberculosis (147 aa), FASTA scores: opt:
+ 321, E(): 5.9e-17, (40.9% identity in 132 aa overlap); and
+ O53375|GPHA|Rv3323c|MTV016.23c MOAD-MOAE FUSION PROTEIN
+ from Mycobacterium tuberculosis (221 aa). Protein product
+ from Mb0890 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0890 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable molybdenum cofactor biosynthesis
+ protein e2 moae2 (molybdopterin converting factor large
+ subunit) (molybdopterin [mpt] converting factor, subunit
+ 2)"
+ /protein_id="SIT99488.1"
+ /db_xref="GOA:A0A1R3XWM2"
+ /db_xref="InterPro:IPR003448"
+ /db_xref="InterPro:IPR036563"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWM2"
+ /translation="MTQVLRAALTDQPIFLAEHEELVSHRSAGAIVGFVGMIRDRDGG
+ RGVLRLEYSAHPSAAQVLADLVAEVAEESSGVRAVAASHRIGVLQVGEAALVAAVAAD
+ HRRAAFGTCAHLVETIKARLPVWKHQFFEDGTDEWVGSV"
+ gene complement(965012..965995)
+ /gene="rpfA"
+ /locus_tag="BQ2027_MB0891C"
+ CDS complement(965012..965995)
+ /gene="rpfA"
+ /locus_tag="BQ2027_MB0891C"
+ /note="Mb0891c, rpfA, len: 327 aa. Equivalent to Rv0867c,
+ len: 407 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (). Possible rpfA, resuscitation-promoting factor (see
+ citation below). N-terminus highly similar to N-terminal
+ part (1-125 aa) of Z99494|MLCB57_3|NP_302417.1|NC_002677
+ conserved hypothetical protein from Mycobacterium leprae
+ (174 aa), FASTA scores: opt: 785, E(): 1.8e-18, (63.0%
+ identity in 200 aa overlap); and highly similar to
+ C-terminus of NP_301299.1|NC_002677 conserved hypothetical
+ protein from Mycobacterium leprae (375 aa); and middle
+ part of NP_302360.1|NC_002677 conserved hypothetical
+ protein from Mycobacterium leprae (157 aa). N-terminus
+ also highly similar in part of three secreted proteins
+ from Streptomyces coelicolor e.g. CAC09538.1|AL442120
+ putative secreted protein (244 aa). Regions highly similar
+ to CAB76321.1|AL158060 putative membrane protein from
+ Streptomyces coelicolor (121 aa); and middle part of
+ CAB09664.1|Z96935 rpf from Micrococcus luteus (220 aa).
+ Also highly similar in part to four
+ resuscitation-promoting factors from Mycobacterium
+ tuberculosis: Rv2450 (172 aa), Rv1009 (362 aa), Rv1884c
+ (176 aa), and Rv2389c (154 aa). Contains a probable
+ secretory signal sequence in N-terminus.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 240 bp deletion leads to a shorter product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (327 aa
+ versus 407 aa). Mb0891c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE RESUSCITATION-PROMOTING FACTOR RPFA"
+ /protein_id="SIT99489.1"
+ /db_xref="InterPro:IPR010618"
+ /db_xref="InterPro:IPR023346"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWP1"
+ /translation="MSGRHRKPTTSNVSVAKIAFTGAVLGGGGIAMAAQATAATDGEW
+ DQVARCESGGNWSINTGNGYLGGLQFTQSTWAAHGGGEFAPSAQLASREQQIAVGERV
+ LATQGRGAWPVCGRGLSNATPREVLPASAAMDAPLDAAAVNGEPAPLAPPPADLAPPA
+ PADLAPPAPADLAPPVELAVNDLPAPLGEPLPAAPAELAPPADLAPASADLAPPAPAD
+ LAPPAPAELAPPAPADLAPPAAVNEQTAPGDQPATAPGGPVGLATDLELPEPDPQPAD
+ APPPGDVTEAPAETPQVSNIAYTKKLWQAIRAQDVCGNDALDSLAQPYVIG"
+ gene complement(966443..966721)
+ /gene="moaD2"
+ /locus_tag="BQ2027_MB0892C"
+ CDS complement(966443..966721)
+ /gene="moaD2"
+ /locus_tag="BQ2027_MB0892C"
+ /note="Mb0892c, moaD2, len: 92 aa. Equivalent to Rv0868c,
+ len: 92 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 92 aa overlap). Probable moaD2,
+ molybdenum cofactor biosynthesis protein (molybdopterin
+ converting factor (subunit 1)), similar to
+ CAB88494.1|AL353816 putative molybdopterin converting
+ factor from Streptomyces coelicolor (84 aa); and weakly
+ similar to others MoaD proteins e.g. Z99111|BSUB0008_103
+ from Bacillus subtilis (77 aa), FASTA scores: opt: 86,
+ E(): 2.8, (22.9% identity in 83 aa overlap); etc. Also
+ some similarity with Rv3112|MOAD1|MTCY164.22 PUTATIVE
+ MOLYBDENUM COFACTOR BIOSYNTHESIS PROTEIN D from
+ Mycobacterium tuberculosis (83 aa), FASTA scores: opt:
+ 113, E(): 0.024, (31.3% identity in 83 aa overlap).
+ Protein product from Mb0892c detected using SWATH mass
+ spectrometry. Mb0892c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable molybdenum cofactor biosynthesis
+ protein d 2 moad2 (molybdopterin converting factor small
+ subunit) (molybdopterin [mpt] converting factor, subunit
+ 1)"
+ /protein_id="SIT99490.1"
+ /db_xref="InterPro:IPR003749"
+ /db_xref="InterPro:IPR012675"
+ /db_xref="InterPro:IPR016155"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWP9"
+ /translation="MTQVSDESAGIQVTVRYFAAARAAAGAGSEKVTLRSGATVAELI
+ DGLSVRDVRLATVLSRCSYLRDGIVVRDDAVALSAGDTIDVLPPFAGG"
+ gene complement(966725..967807)
+ /gene="moaA2"
+ /locus_tag="BQ2027_MB0893C"
+ CDS complement(966725..967807)
+ /gene="moaA2"
+ /locus_tag="BQ2027_MB0893C"
+ /note="Mb0893c, moaA2, len: 360 aa. Equivalent to Rv0869c,
+ len: 360 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 360 aa overlap). Probable moaA2,
+ molybdenum cofactor biosynthesis protein, highly similar
+ to others e.g. CAB59437.1|AL132644|SCI8_6 molybdenum
+ cofactor biosynthesis protein A from Streptomyces
+ coelicolor (341 aa), FASTA scores: opt: 1336, E(): 0,
+ (61.7% identity in 332 aa overlap); S57490|X78980|ANMOAA_1
+ molybdopterin cofactor synthesis protein from Arthrobacter
+ nicotinovorans (fragment) (374 aa), FASTA scores: opt:
+ 1059, E(): 0, (49.9% identity in 369 aa overlap);
+ Q44118|MOAA_ARTNI PROBABLE MOLYBDOPTERIN COFACTOR
+ SYNTHESIS PROTEIN A from Arthrobacter nicotinovorans
+ plasmid pAO1 (355 aa); etc. Also similar to
+ Rv3109|MTCY164.19|Z95150|MOAA1 PUTATIVE MOLYBDENUM
+ COFACTOR BIOSYNTHESIS PROTEIN A from Mycobacterium
+ tuberculosis (359 aa), FASTA scores: opt: 657, E(): 0,
+ (36.6% identity in 309 aa overlap). BELONGS TO THE MOAA /
+ NIFB / PQQE FAMILY. Mb0893c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable molybdenum cofactor biosynthesis
+ protein a2 moaa2"
+ /protein_id="SIT99491.1"
+ /db_xref="GOA:P65385"
+ /db_xref="InterPro:IPR000385"
+ /db_xref="InterPro:IPR006638"
+ /db_xref="InterPro:IPR007197"
+ /db_xref="InterPro:IPR010505"
+ /db_xref="InterPro:IPR013483"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/Swiss-Prot:P65385"
+ /translation="MTLTALGMPALRSRTNGIADPRVVPTTGPLVDTFGRVANDLRVS
+ LTDRCNLRCSYCMPERGLRWLPGEQLLRPDELARLIHIAVTRLGVTSVRFTGGEPLLA
+ HHLDEVVAATARLRPRPEISLTTNGVGLARRAGALAEAGLDRVNVSLDSIDRAHFAAI
+ TRRDRLAHVLAGLAAAKAAGLTPVKVNAVLDPTTGREDVVDLLRFCLERGYQLRVIEQ
+ MPLDAGHSWRRNIALSADDVLAALRPHFRLRPDPAPRGSAPAELWLVDAGPNTPRGRF
+ GVIASVSHAFCSTCDRTRLTADGQIRSCLFSTEETDLRRLLRGGADDDAIEAAWRAAM
+ WSKPAGHGINAPDFIQPDRPMSAIGG"
+ gene complement(967804..968193)
+ /locus_tag="BQ2027_MB0894C"
+ CDS complement(967804..968193)
+ /locus_tag="BQ2027_MB0894C"
+ /note="Mb0894c, -, len: 129 aa. Equivalent to Rv0870c,
+ len: 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 129 aa overlap). Possible conserved
+ integral membrane protein, highly similar to other
+ membrane proteins: putative secreted proteins or
+ hypothetical proteins e.g. CAC08263.1| AL392146 putative
+ integral membrane protein from Streptomyces coelicolor
+ (138 aa); NP_233433.1|NC_002506 conserved hypothetical
+ protein from Vibrio cholerae (143 aa);
+ NP_455572.1|NC_003198 putative membrane protein from
+ Salmonella enterica subsp. enterica serovar Typhi (148
+ aa); P37065|YCCF_ECOLI HYPOTHETICAL 16.3 KD PROTEIN from
+ Escherichia coli (148 aa), FASTA scores: opt: 183, E():
+ 1.9e-06, (36.6% identity in 134 aa overlap); etc. Protein
+ product from Mb0894c detected using SWATH mass
+ spectrometry. Mb0894c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99492.1"
+ /db_xref="GOA:A0A1R3XYS0"
+ /db_xref="InterPro:IPR005185"
+ /db_xref="InterPro:IPR031308"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYS0"
+ /translation="MRLILNVIWLVFGGLWLALGYLLASLVCFLLIITIPFGFAALRI
+ ASYALWPFGRTIVEKPTAGTGALISNVIWVLLFGIWLALGHLVSAAAMAVTIIGIPLA
+ LANLKLIPVSLVPLGKDIVGVNSQVPT"
+ gene 968358..968765
+ /gene="cspB"
+ /locus_tag="BQ2027_MB0895"
+ CDS 968358..968765
+ /gene="cspB"
+ /locus_tag="BQ2027_MB0895"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0895, cspB, len: 135 aa. Equivalent to Rv0871,
+ len: 135 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 135 aa overlap). Probable cspB, cold
+ shock-like protein B, equivalent to
+ Z99494|MLCB57_7|MLCB57.11 probable cold shock protein from
+ Mycobacterium leprae (136 aa), FASTA scores: opt: 787,
+ E(): 0, (86.0% identity in 136 aa overlap). Also highly
+ similar (but often longer than) to others e.g.
+ CAB93399.1|AL357524 cold shock protein B from Streptomyces
+ coelicolor (127 aa); Q45099|CSPD_BACCE COLD SHOCK-LIKE
+ PROTEIN CSPD from Bacillus cereus (66 aa); Y101
+ 81|LLCSPB_1 cold shock protein from Lactococcus lactis (66
+ aa), FASTA scores: opt: 220, E(): 2.5e-07, (48.3% identity
+ in 60 aa overlap); etc. SEEMS TO BELONG TO THE COLD-SHOCK
+ DOMAIN (CSD) FAMILY. Protein product from Mb0895 detected
+ using shotgun mass spectrometry. Mb0895 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE COLD SHOCK-LIKE PROTEIN B CSPB"
+ /protein_id="SIT99493.1"
+ /db_xref="GOA:A0A1R3XXM9"
+ /db_xref="InterPro:IPR002059"
+ /db_xref="InterPro:IPR011129"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXM9"
+ /translation="MPTGKVKWYDPDKGFGFLSQEGGEDVYVRSSALPTGVEALKAGQ
+ RVEFGIASGRRGPQALSLRLIEPPPSLSRPRREPAAEHKHSPDELHGMVEDMITLLES
+ TVQPELRKGRYPDRKTARRVAEVVRAVAREFES"
+ gene complement(968884..970710)
+ /gene="PE_PGRS15"
+ /locus_tag="BQ2027_MB0896C"
+ CDS complement(968884..970710)
+ /gene="PE_PGRS15"
+ /locus_tag="BQ2027_MB0896C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0896c, PE_PGRS15, len: 608 aa. Equivalent to
+ Rv0872c, len: 606 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 606 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins (see first citation below),
+ similar to many e.g. MTCY24A1.04c|Z95207 (615 aa), FASTA
+ scores: opt: 2636, E(): 0, (64.6% identity in 619 aa
+ overlap); etc. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 3 bp in-frame deletion and a 9 bp
+ in-frame insertion leads to a lightly longer product
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv (608 aa versus 606 aa). Mb0896c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs15"
+ /protein_id="SIT99494.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWQ7"
+ /translation="MSYVLATPEMVAAAANNLAQIGSTLSAANAAALAPTTGVLAAGA
+ DEVSAAVASLFSGHAQAYQTLGTQAAAFHERFIQALSTAAGAYGSAEAANASPLQQAL
+ NVINAPTQTLLGRPLIGNGTNGAPGTGQAGGPGGLLYGNGGNGGSGGVGQAGGAGGSA
+ GLIGIGGTGGAGGAGAVGGVGGNGGWLYGNGGAGGLGGTGVAGVNGGMGAAGGAGGNA
+ YLFGSGGAGGQGGMGAAGADGVNPTPTGTADAGSTGTDQTLGGNAIGGNGGPGDAGDA
+ MTSGGAGGSGGNAVSTVNGDAVGGEGGKGGEGAYGGAGGAGGSAASIGNAAIGGNGGA
+ GGNAQAPGGVGGAGGEGGDAQVGTNSPSNAEAGNGGSGGNGFDSFASGGTGGAGGTGG
+ AGGRGGLLIGDGGAGGAGGVGGTGGSGAPGGGGAGGDGGAANTDSAGSSRKAFGGDGG
+ VGGDGASALGTGGEGGIGGQGGNGGAGGLLIGNGGAGGVGGTAGAGGTGGSGGAGGAG
+ GAGGGGTNSGPGAAFGGNGNTGGNGGNGGAPGALGGKGGSGGLIGRAGSDGGVGAGGA
+ GGAGGAGGTGGEGGTGGDGKTTDGNPGMGGSPGSAGQPGQPG"
+ gene 970971..972923
+ /gene="fadE10"
+ /locus_tag="BQ2027_MB0897"
+ CDS 970971..972923
+ /gene="fadE10"
+ /locus_tag="BQ2027_MB0897"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0897, fadE10, len: 650 aa. Equivalent to Rv0873,
+ len: 650 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 650 aa overlap). Probable fadE10,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), highly similar to
+ many e.g. CAB91129.1|AL355913 putative acyl CoA
+ dehydrogenase from Streptomyces coelicolor (658 aa);
+ P50544|ACDV_MOUSE ACYL-COA DEHYDROGENASE from Mus musculus
+ (656 aa); D30647|RATVLCAD_1 very-long-chain Acyl-CoA
+ dehydrogenase from Rattus norvegicus (655 aa), FASTA
+ scores: opt: 675, E(): 0, (33.9% identity in 380 aa
+ overlap); etc. Protein product from Mb0897 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0897 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE10"
+ /protein_id="SIT99495.1"
+ /db_xref="GOA:P63430"
+ /db_xref="InterPro:IPR006091"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR013786"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR037069"
+ /db_xref="UniProtKB/Swiss-Prot:P63430"
+ /translation="MAQQTQVTEEQARALAEESRESGWDKPSFAKELFLGRFPLGLIH
+ PFPKPSDAEEARTEAFLVKLREFLDTVDGSVIERAAQIPDEYVKGLAELGCFGLKIPS
+ EYGGLNMSQVAYNRVLMMVTTVHSSLGALLSAHQSIGVPEPLKLAGTAEQKRRFLPRC
+ AAGAISAFLLTEPDVGSDPARMASTATPIDDGQAYELEGVKLWTTNGVVADLLVVMAR
+ VPRSEGHRGGISAFVVEADSPGITVERRNKFMGLRGIENGVTRLHRVRVPKDNLIGRE
+ GDGLKIALTTLNAGRLSLPAIATGVAKQALKIAREWSVERVQWGKPVGQHEAVASKIS
+ FIAATNYALDAVVELSSQMADEGRNDIRIEAALAKLWSSEMACLVGDELLQIRGGRGY
+ ETAESLAARGERAVPVEQMVRDLRINRIFEGSSEIMRLLIAREAVDAHLTAAGDLANP
+ KADLRQKAAAAAGASGFYAKWLPKLVFGEGQLPTTYREFGALATHLRFVERSSRKLAR
+ NTFYGMARWQASLEKKQGFLGRIVDIGAELFAISAACVRAEAQRTADPVEGEQAYELA
+ EAFCQQATLRVEALFDALWSNTDSIDVRLANDVLEGRYTWLEQGILDQSEGTGPWIAS
+ WEPGPSTEANLARRFLTVSPSSEAKL"
+ gene complement(973012..974172)
+ /locus_tag="BQ2027_MB0898C"
+ CDS complement(973012..974172)
+ /locus_tag="BQ2027_MB0898C"
+ /note="Mb0898c, -, len: 386 aa. Equivalent to Rv0874c,
+ len: 386 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 386 aa overlap). Conserved
+ hypothetical protein, highly similar in part to SPU62616_1
+ hypothetical protein from Synechococcus sp. (280 aa),
+ FASTA scores: E(): 6.3e-26, (35.2% identity in 264 aa
+ overlap); SYCSLLLH_102 from Synechocystis sp. (447 aa),
+ FASTA scores: E(): 1.1e-18, (29.5% identity in 400 aa
+ overlap). Also highly similar to Rv0628c|MTCY20H10_9 from
+ Mycobacterium tuberculosis (383 aa), FASTA scores: E():0,
+ (81.5% identity in 383 aa overlap). Mb0898c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99496.1"
+ /db_xref="GOA:P0A5D4"
+ /db_xref="InterPro:IPR013702"
+ /db_xref="InterPro:IPR016741"
+ /db_xref="InterPro:IPR019494"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5D4"
+ /translation="MRIGVGVCTTPDARQAAVEAAGQARDELAGEAPSLAVLLGSRAH
+ TDRAADVLSAVLQMIDPPALVGCIAQAIVAGRHEIEDEPAVVVWLASGLAAETFQLDF
+ VRTGSGALITGYRFDRTARDLHLLLPDPYTFPSNLLIEHPNTDLPGTAVVGGVVSGGR
+ RRGDTRLFRDHDVLTSGVVGVRLPGMRGVPVVSQGCRPIGYPYIVTGADGILITELGG
+ RPPLQRLREIVEGLSPDERALVSHGLQIGIVVDEHLAAPGQGDFVIRGLLGADPSTGS
+ IEIDEVVQVGATMQFQVRDAAGADKDLRLTVERAAARLPGRAAGALLFTCNGRGRRMF
+ GVADHDASTIEELLGGIPLAGFFAAGEIGPIAGRNALHGFTASMALFVDDME"
+ gene complement(974272..974760)
+ /locus_tag="BQ2027_MB0899C"
+ CDS complement(974272..974760)
+ /locus_tag="BQ2027_MB0899C"
+ /note="Mb0899c, -, len: 162 aa. Equivalent to Rv0875c,
+ len: 162 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 162 aa overlap). Possible conserved
+ exported protein, equivalent to MLCB57_11|O33056 possible
+ exported protein from Mycobacterium leprae (162 aa), FASTA
+ scores: opt: 789, E(): 0, (71.4% identity in 161 aa
+ overlap). Protein product from Mb0899c detected using
+ SWATH mass spectrometry. Mb0899c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED EXPORTED PROTEIN"
+ /protein_id="SIT99497.1"
+ /db_xref="InterPro:IPR024495"
+ /db_xref="UniProtKB/Swiss-Prot:P64732"
+ /translation="MKRGVATLPVILVILLSVAAGAGAWLLVRGHGPQQPEISAYSHG
+ HLTRVGPYLYCNVVDLDDCQTPQAQGELPVSERYPVQLSVPEVISRAPWRLLQVYQDP
+ ANTTSTLFRPDTRLAVTIPTVDPQRGRLTGIVVQLLTLVVDHSGELRDVPHAEWSVRL
+ IF"
+ gene complement(974757..976403)
+ /locus_tag="BQ2027_MB0900C"
+ CDS complement(974757..976403)
+ /locus_tag="BQ2027_MB0900C"
+ /note="Mb0900c, -, len: 548 aa. Equivalent to Rv0876c,
+ len: 548 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 548 aa overlap). Possible conserved
+ transmembrane protein, equivalent to MLCB57_12|O33057
+ possible membrane protein from Mycobacterium leprae (579
+ aa), FASTA scores: opt: 2850, E(): 0, (81.0% identity in
+ 568 aa overlap). Also highly similar (except in
+ N-terminus) to CAB93403.1|AL357524 putative integral
+ membrane protein from Streptomyces coelicolor (463 aa).
+ Protein product from Mb0900c detected using SWATH mass
+ spectrometry. Mb0900c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99498.1"
+ /db_xref="GOA:A0A1R3XWN3"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWN3"
+ /translation="MAPTPGRRTRNGSVNGHPGMANYPPGDANYRRSRRPPPMPSANR
+ YLPPLGEQPEPERSRVPPRTTRAGERITVTRAAAMRSREMGSRMYLLVHRAATADGAD
+ KSGLTALTWPVMANFAVDSAMAVALANTLFFAAASGESKSRVALYLLITIAPFAVIAP
+ LIGPALDRLQHGRRVALALSFGLRTALAVVLIMNYDGATGSFPSWVLYPCALAMMVFS
+ KSFSVLRSAVTPRVMPPTIDLVRVNSRLTVFGLLGGTIAGGAIAAGVEFVCTHLFQLP
+ GALFVVVAITIAGASLSMRIPRWVEVTSGEVPATLSYHRDRGRLRRRWPEEVKNLGGT
+ LRQPLGRNIITSLWGNCTIKVMVGFLFLYPAFVAKAHEANGWVQLGMLGLIGAAAAVG
+ NFAGNFTSARLQLGRPAVLVVRCTVLVTVLAIAAAVAGSLAATAIATLITAGSSAIAK
+ ASLDASLQHDLPEESRASGFGRSESTLQLAWVLGGAVGVLVYTELWVGFTAVSALLIL
+ GLAQTIVSFRGDSLIPGLGGNRPVMAEQETTRRGAAVAPQ"
+ gene 976541..977329
+ /locus_tag="BQ2027_MB0901"
+ CDS 976541..977329
+ /locus_tag="BQ2027_MB0901"
+ /note="Mb0901, -, len: 262 aa. Equivalent to Rv0877, len:
+ 262 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 262 aa overlap). Conserved
+ hypothetical protein, equivalent to MLCB57_13|O33058
+ conserved hypothetical protein from Mycobacterium leprae
+ (269 aa), FASTA scores: E(): 0, (80.5% identity in 257 aa
+ overlap). Also highly similar (except in C-terminus) to
+ SCD12A.13|CAB93404.1|AL357524 hypothetical protein from
+ Streptomyces coelicolor (308 aa). Protein product from
+ Mb0901 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0901 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99499.1"
+ /db_xref="InterPro:IPR021391"
+ /db_xref="UniProtKB/Swiss-Prot:P64734"
+ /translation="MTGPTEESAVATVADWPEGLAAVLRGAADQARAAVVEFSGPEAV
+ GDYLGVSYEDGNAATHRFIAHLPGYQGWQWAVVVASYSGADHATISEVVLVPGPTALL
+ APDWVPWEQRVRPGDLSPGDLLAPAKDDPRLVPGYTASGDAQVDETAAEIGLGRRWVM
+ SAWGRAQSAQRWHDGDYGPGSAMARSTKRVCRDCGFFLPLAGSLGAMFGVCGNELSAD
+ GHVVDRQYGCGAHSDTTAPAGGSTPIYEPYDDGVLDIIEKPAES"
+ gene complement(977352..978668)
+ /gene="PPE13"
+ /locus_tag="BQ2027_MB0902C"
+ CDS complement(977352..978668)
+ /gene="PPE13"
+ /locus_tag="BQ2027_MB0902C"
+ /note="Mb0902c, PPE13, len: 438 aa. Equivalent to Rv0878c,
+ len: 443 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 438 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family, highly similar to
+ many e.g. P4261|YHS6_MYCTU (517 aa), FASTA scores: opt:
+ 1044, E(): 0, (47.4% identity in 397 aa overlap);
+ MTV014_3, MTCI65_2, MTCY98_24, MTCY3C7_23, MTCY48_17,
+ MTV004_5, MTV004_3, etc. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a single base deletion (a-*) leads to
+ a shorter product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (438 aa versus 443 aa). Mb0902c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe13"
+ /protein_id="SIT99500.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR002989"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWQ8"
+ /translation="MNFMVLPPEVNSARIYAGAGPAPMLAAAVAWDGLAAELGMAAAS
+ FSLLISGLTAGPGSAWQGPAAAAMAAAAAPYLSWLNAATARAEGAAAGAKAAAAVYEA
+ ARAATAHPALVAANRNQLLSLVLSNLFGQNLPAIAATEASYEQLWAQDVAAMVGYHGG
+ ASTVASQLTPWQQLLSVLPPVVTAAPAGAVGVPAALAIPALGVENIGVGNFLGIGNIG
+ NNNVGSGNTGDYNFGIGNIGNANLGNGNIGNANLGSGNAGFFNFGNGNDGNTNFGSGN
+ AGFLNIGSGNEGSGNLGFGNAGDDNTGWGNSGDTNTGGFNSGDLNTGIGSPVTQGVAN
+ SGFGNTGTGHSGFFNSGNSGSGFQNLGNGSSGFGNASDTSSGFQNAGTALTRASSTWA
+ DSPRAWPIRAPSRLQVWRTRATTARECSIRVIISRVSSTGAPPQKK"
+ gene complement(978946..979221)
+ /locus_tag="BQ2027_MB0903C"
+ CDS complement(978946..979221)
+ /locus_tag="BQ2027_MB0903C"
+ /note="Mb0903c, -, len: 91 aa. Equivalent to Rv0879c, len:
+ 91 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 91 aa overlap). Possible conserved
+ transmembrane protein, C-terminus highly similar to
+ C-terminal part of MLCB57_14|O33059 conserved hypothetical
+ protein from Mycobacterium leprae (91 aa), FASTA scores:
+ E(): 1.2e-25, (76.9% identity in 91 aa overlap). Mb0903c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99501.1"
+ /db_xref="GOA:P64736"
+ /db_xref="InterPro:IPR019681"
+ /db_xref="UniProtKB/Swiss-Prot:P64736"
+ /translation="MSVENSQIREPPPLPPVLLEVWPVIAVGALAWLVAAVAAFVVPG
+ LASWRPVTVAGLATGLLGTTIFVWQLAAARRGARGAQAGLETYLDPK"
+ gene 979399..979830
+ /locus_tag="BQ2027_MB0904"
+ CDS 979399..979830
+ /locus_tag="BQ2027_MB0904"
+ /note="Mb0904, -, len: 143 aa. Equivalent to Rv0880, len:
+ 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 143 aa overlap). Possible
+ transcriptional regulator, MarR family, equivalent to
+ MLCB57_15|O3306|NP_302411.1|NC_002677 putative MarR-family
+ protein from Mycobacterium leprae (143 aa), FASTA scores:
+ opt: 818, E(): 0, (89.5% identity in 143 aa overlap). Also
+ similar to many others e.g. CAB93410.1|AL357524 putative
+ marR-family protein from Streptomyces coelicolor (145 aa);
+ NP_251757.1|NC_002516 probable transcriptional regulator
+ from Pseudomonas aeruginosa (147 aa); etc. Also similar to
+ Rv2327 from Mycobacterium tuberculosis (163 aa). Protein
+ product from Mb0904 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0904 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY MARR-FAMILY)"
+ /protein_id="SIT99502.1"
+ /db_xref="GOA:P67746"
+ /db_xref="InterPro:IPR000835"
+ /db_xref="InterPro:IPR023187"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P67746"
+ /translation="MLDSDARLASDLSLAVMRLSRQLRFRNPSSPVSLSQLSALTTLA
+ NEGAMTPGALAIRERVRPPSMTRVIASLADMGFVDRAPHPIDGRQVLVSVSESGAELV
+ KAARRARQEWLAERLATLNRSERDILRSAADLMLALVDESP"
+ gene 979827..980693
+ /locus_tag="BQ2027_MB0905"
+ CDS 979827..980693
+ /locus_tag="BQ2027_MB0905"
+ /note="Mb0905, -, len: 288 aa. Equivalent to Rv0881, len:
+ 288 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 288 aa overlap). Possible rRNA
+ methyltransferase (EC 2.1.1.-), highly similar to others
+ and hypothetical proteins e.g. CAB76071.1|AL157953
+ putative rRNA methylase from Streptomyces coelicolor (272
+ aa); NP_421117.1|NC_002696 spoU rRNA methylase family
+ protein from Caulobacter crescentus (268 aa);
+ D90913_93|P74261 rRNA METHYLASE from Synechocystis sp.
+ (274 aa), FASTA scores: E(): 1.1e-13, (26.3% identity in
+ 278 aa overlap); P18644|TSNR_STRCN rRNA METHYLTRANSFERASE
+ (EC 2.1.1.66) from Streptomyces cyaneus (Streptomyces
+ curacoi) (269 aa), FASTA scores: E(): 3.7e-08, (23.9%
+ identity in 268 aa overlap); etc. Equivalent to AAK45146.1
+ from Mycobacterium tuberculosis strain CDC1551 (242 aa)
+ but longer 46 aa. Mb0905 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE RRNA METHYLTRANSFERASE (RRNA
+ METHYLASE)"
+ /protein_id="SIT99503.1"
+ /db_xref="GOA:P59968"
+ /db_xref="InterPro:IPR001537"
+ /db_xref="InterPro:IPR029026"
+ /db_xref="InterPro:IPR029028"
+ /db_xref="InterPro:IPR029064"
+ /db_xref="UniProtKB/Swiss-Prot:P59968"
+ /translation="MTEGRCAQHPDGLDVQDVCDPDDPRLDDFRDLNSIDRRPDLPTG
+ KALVIAEGVLVVQRMLASRFTPLALFGTDRRLAELKDDLAGVGAPYYRASADVMARVI
+ GFHLNRGVLAAARRVPEPSVAQVVAGARTVAVLEGVNDHENLGSIFRNAAGLSVDAVV
+ FGTGCADPLYRRAVRVSMGHALLVPYARAADWPTELMTLKESGFRLLAMTPHGNACKL
+ PEAIAAVSHERIALLVGAEGPGLTAAALRISDVRVRIPMSRGTDSLNVATAAALAFYE
+ RTRSGHHIGPGT"
+ gene 980690..980974
+ /locus_tag="BQ2027_MB0906"
+ CDS 980690..980974
+ /locus_tag="BQ2027_MB0906"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0906, -, len: 94 aa. Equivalent to Rv0882, len:
+ 94 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 94 aa overlap). Probable transmembrane
+ protein. Mb0906 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99504.1"
+ /db_xref="GOA:P64738"
+ /db_xref="InterPro:IPR024244"
+ /db_xref="UniProtKB/Swiss-Prot:P64738"
+ /translation="MNDQRDQAVPWATGLAVAGFVAAVIAVAVVVLSLGLIRVHPLLA
+ VGLNIVAVSGLAPTLWGWRRTPVLRWFVLGAAVGVAGAWLALLALTLGDG"
+ gene complement(980971..981732)
+ /locus_tag="BQ2027_MB0907C"
+ CDS complement(980971..981732)
+ /locus_tag="BQ2027_MB0907C"
+ /note="Mb0907c, -, len: 253 aa. Equivalent to Rv0883c,
+ len: 253 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 253 aa overlap). Conserved
+ hypothetical protein, equivalent to O3306|MLCB57_16
+ CONSERVED HYPOTHETICAL PROTEI from Mycobacterium leprae
+ (251 aa), FASTA scores: E(): 0, (79.4% identity in 253 aa
+ overlap). Also highly similar to N_terminus of
+ AL009204|SC9B10_22 HYPOTHETICAL PROTEIN from Streptomyces
+ coelicolor (352 aa), FASTA scores: E(): 6.1e-20, (35.0%
+ identity in 246 aa overlap). Protein product from Mb0907c
+ detected using SWATH mass spectrometry. Mb0907c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99505.1"
+ /db_xref="InterPro:IPR021421"
+ /db_xref="UniProtKB/Swiss-Prot:P64740"
+ /translation="MRELKVVGLDADGKNIICQGAIPSEQFKLPVDDRLRAALRDDSV
+ QPEQAQLDIEVTNVLSPKEIQARIRAGASVEQVAAASGSDIARIRRFAHPVLLERSRA
+ AELATAAHPVLADGPAVLTMQETVAAALVARGLNPDSLTWDAWRNEDSRWTVQLAWKA
+ GRSDNLAHFRFTPGAHGGTATAIDDTAHELINPTFNRPLRPLAPVAHLDFDEPEPAQP
+ TLTVPSAQPVSNRRGKPAIPAWEDVLLGVRSGGRR"
+ gene complement(981889..983019)
+ /gene="serC"
+ /locus_tag="BQ2027_MB0908C"
+ CDS complement(981889..983019)
+ /gene="serC"
+ /locus_tag="BQ2027_MB0908C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0908c, serC, len: 376 aa. Equivalent to Rv0884c,
+ len: 376 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 376 aa overlap). Possible serC,
+ phosphoserine aminotransferase (EC 2.6.1.52), equivalent
+ to MLCB57_17 putative phosphoserine aminotransferase from
+ Mycobacterium leprae (376 aa), FASTA scores: E(): 0, (87.5
+ identity in 376 aa overlap). Also highly similar to
+ CAC08322.1|AL392149 putative aminotransferase from
+ Streptomyces coelicolor (363 aa); and similar to other
+ phosphoserine aminotransferases e.g. NP_386837.1|NC_003047
+ PUTATIVE PHOSPHOSERINE AMINOTRANSFERASE PROTEIN from
+ Sinorhizobium meliloti (392 aa); P52878|SERC_METBA
+ PHOSPHOSERINE AMINOTRANSFERASE from Methanosarcina barkeri
+ (370 aa); P10658|SERC_RABIT|RABEPIP_1 PHOSPHOSERINE
+ AMINOTRANSFERASE from Rabbit (370 aa), FASTA scores: opt:
+ 271, E(): 3.5e-11, (24.5% identity in 368 aa overlap);
+ etc. BELONGS TO CLASS-V OF PYRIDOXAL-PHOSPHATE-DEPENDENT
+ AMINOTRANSFERASES. COFACTOR: PYRIDOXAL PHOSPHATE. Protein
+ product from Mb0908c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0908c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PHOSPHOSERINE AMINOTRANSFERASE SERC
+ (PSAT)"
+ /protein_id="SIT99506.1"
+ /db_xref="GOA:P63515"
+ /db_xref="InterPro:IPR000192"
+ /db_xref="InterPro:IPR006272"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="InterPro:IPR022278"
+ /db_xref="UniProtKB/Swiss-Prot:P63515"
+ /translation="MADQLTPHLEIPTAIKPRDGRFGSGPSKVRLEQLQTLTTTAAAL
+ FGTSHRQAPVKNLVGRVRSGLAELFSLPDGYEVILGNGGATAFWDAAAFGLIDKRSLH
+ LTYGEFSAKFASAVSKNPFVGEPIIITSDPGSAPEPQTDPSVDVIAWAHNETSTGVAV
+ AVRRPEGSDDALVVIDATSGAGGLPVDIAETDAYYFAPQKNFASDGGLWLAIMSPAAL
+ SRIEAIAATGRWVPDFLSLPIAVENSLKNQTYNTPAIATLALLAEQIDWLVGNGGLDW
+ AVKRTADSSQRLYSWAQERPYTTPFVTDPGLRSQVVGTIDFVDDVDAGTVAKILRANG
+ IVDTEPYRKLGRNQLRVAMFPAVEPDDVSALTECVDWVVERL"
+ gene 983227..984249
+ /locus_tag="BQ2027_MB0909"
+ CDS 983227..984249
+ /locus_tag="BQ2027_MB0909"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0909, -, len: 340 aa. Equivalent to Rv0885, len:
+ 340 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 340 aa overlap). Conserved
+ hypothetical protein, equivalent to O33063|MLCB57_18
+ possible transmembrane protein from Mycobacterium leprae
+ (341 aa), FASTA score: (83.9% identity in 341 aa overlap).
+ Also similar except in C-terminus to T35630 probable
+ membrane protein from Streptomyces coelicolor (312 aa).
+ Protein product from Mb0909 detected using SWATH mass
+ spectrometry. Mb0909 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative transmembrane protein"
+ /protein_id="SIT99507.1"
+ /db_xref="GOA:P0A5D6"
+ /db_xref="InterPro:IPR009078"
+ /db_xref="InterPro:IPR025859"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5D6"
+ /translation="MDRTRIVRRWRRNMDVADDAEYVEMLATLSEGSVRRNFNPYTDI
+ DWESPEFAVTDNDPRWILPATDPLGRHPWYQAQSRERQIEIGMWRQANVAKVGLHFES
+ ILIRGLMNYTFWMPNGSPEYRYCLHESVEECNHTMMFQEMVNRVGADVPGLPRRLRWV
+ SPLVPLVAGPLPVAFFIGVLAGEEPIDHTQKNVLREGKSLHPIMERVMSIHVAEEARH
+ ISFAHEYLRKRLPRLTRMQRFWISLYFPLTMRSLCNAIVVPPKAFWEEFDIPREVKKE
+ LFFGSPESRKWLCDMFADARMLAHDTGLMNPIARLVWRLCKIDGKPSRYRSEPQRQHL
+ AAAPAA"
+ gene 984268..985995
+ /gene="fprB"
+ /locus_tag="BQ2027_MB0910"
+ CDS 984268..985995
+ /gene="fprB"
+ /locus_tag="BQ2027_MB0910"
+ /note="Mb0910, fprB, len: 575 aa. Equivalent to Rv0886,
+ len: 575 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 575 aa overlap). Probable fprB,
+ ferredoxin/ferredoxin-NADP(+) reductase (NADPH:adrenodoxin
+ oxidoreductase) (EC 1.18.1.2), equivalent to
+ O3306|MLCB57_19 FERREDOXIN/FERREDOXIN--NADP REDUCTASE from
+ Mycobacterium leprae (555 aa), FASTA scores: E(): 0, (76.6
+ identity in 560 aa overlap). Also highly similar or
+ similar to others e.g. NP_294219.1|NC_001263 putative
+ ferredoxin/ferredoxin--NADP reductase from Deinococcus
+ radiodurans (479 aa) (N-terminus shorter);
+ P22570|ADRO_HUMAN NADPH:adrenodoxin oxidoreductase from
+ homo sapiens (497 aa), FASTA scores: opt: 624, E(): 3e-30,
+ (39.7% identity in 484 aa overlap); P08165|ADRO_BOVIN
+ NADPH:ADRENODOXIN OXIDOREDUCTASE from Bos taurus (492 aa);
+ etc. Also similar to others from Mycobacterium
+ tuberculosis e.g. Rv3106, Rv3858c, etc. Contains PS00198
+ 4Fe-4S ferredoxins, iron-sulfur binding region signature.
+ Mb0910 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NADPH:ADRENODOXIN OXIDOREDUCTASE FPRB
+ (ADRENODOXIN REDUCTASE) (AR) (FERREDOXIN-NADP(+)
+ REDUCTASE)"
+ /protein_id="SIT99508.1"
+ /db_xref="GOA:P65529"
+ /db_xref="InterPro:IPR017896"
+ /db_xref="InterPro:IPR017900"
+ /db_xref="InterPro:IPR021163"
+ /db_xref="InterPro:IPR023753"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/Swiss-Prot:P65529"
+ /translation="MPHVITQSCCNDASCVFACPVNCIHPTPDEPGFATSEMLYIDPV
+ ACVDCGACVTACPVSAIAPNTRLDFEQLPFVEINASYYPKRPAGVKLAPTSKLAPVTP
+ AAEVRVRRQPLTVAVVGSGPAAMYAADELLVQQGVQVNVFEKLPTPYGLVRSGVAPDH
+ QNTKRVTRLFDRIAGHRRFRFYLNVEIGKHLGHAELLAHHHAVLYAVGAPDDRRLTID
+ GMGLPGTGTATELVAWLNGHPDFNDLPVDLSHERVVIIGNGNVALDVARVLAADPHEL
+ AATDIADHALSALRNSAVREVVVAARRGPAHSAFTLPELIGLTAGADVVLDPGDHQRV
+ LDDLAIVADPLTRNKLEILSTLGDGSAPARRVGRPRIRLAYRLTPRRVLGQRRAGGVQ
+ FSVTGTDELRQLDAGLVLTSIGYRGKPIPDLPFDEQAALVPNDGGRVIDPGTGEPVPG
+ AYVAGWIKRGPTGFIGTNKSCSMQTVQALVADFNDGRLTDPVATPTALDQLVQARQPQ
+ AIGCAGWRAIDAAEIARGSADGRVRNKFTDVAEMLAAATSAPKEPLRRRVLARLRDLG
+ QPIVLTVPL"
+ gene complement(985978..986436)
+ /locus_tag="BQ2027_MB0911C"
+ CDS complement(985978..986436)
+ /locus_tag="BQ2027_MB0911C"
+ /note="Mb0911c, -, len: 152 aa. Equivalent to Rv0887c,
+ len: 152 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 152 aa overlap). Conserved
+ hypothetical protein, highly similar to others e.g.
+ NP_436346.1|NC_003037 Hypothetical protein from
+ Sinorhizobium meliloti (149 aa); AL132644|SCI8_26
+ HYPOTHETICAL PROTEIN from Streptomyces coelicolor (194
+ aa), FASTA scores: opt: 220, E(): 1.5e-07, (33.6% identity
+ in 131 aa overlap); etc. Also shows weak similarity with
+ transposases and related proteins. Protein product from
+ Mb0911c detected using SWATH mass spectrometry. Mb0911c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Glyoxalase/bleomycin resistance
+ protein/dioxygenase"
+ /protein_id="SIT99509.1"
+ /db_xref="InterPro:IPR029068"
+ /db_xref="InterPro:IPR037523"
+ /db_xref="InterPro:IPR041581"
+ /db_xref="UniProtKB/Swiss-Prot:P64742"
+ /translation="MAINVEPALSPHLVVDDAASAIDFYVKAFDAVELGRVPGPDGKL
+ IHAALRINGFTVMLNDDVPQMCGGKSMTPTSLGGTPVTIHLTVTDVDAKFQRALNAGA
+ TVVTALEDQLWGDRYGVVADPFGHHWSLGQPVREVNMDEIQAAMSSQGDG"
+ gene 987698..989170
+ /locus_tag="BQ2027_MB0912"
+ CDS 987698..989170
+ /locus_tag="BQ2027_MB0912"
+ /note="Mb0912, -, len: 490 aa. Equivalent to Rv0888, len:
+ 490 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 490 aa overlap). Probable exported
+ protein. Equivalent to AAK45157.1 from Mycobacterium
+ tuberculosis strain CDC1551 (507 aa) but shorter 17 aa.
+ Contains possible N-terminal signal sequence. Mb0912 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EXPORTED PROTEIN"
+ /protein_id="SIT99510.1"
+ /db_xref="GOA:P64744"
+ /db_xref="InterPro:IPR005135"
+ /db_xref="InterPro:IPR036691"
+ /db_xref="UniProtKB/Swiss-Prot:P64744"
+ /translation="MDYAKRIGQVGALAVVLGVGAAVTTHAIGSAAPTDPSSSSTDSP
+ VDACSPLGGSASSLAAIPGASVPQVGVRQVDPGSIPDDLLNALIDFLAAVRNGLVPII
+ ENRTPVANPQQVSVPEGGTVGPVRFDACDPDGNRMTFAVRERGAPGGPQHGIVTVDQR
+ TASFIYTADPGFVGTDTFSVNVSDDTSLHVHGLAGYLGPFHGHDDVATVTVFVGNTPT
+ DTISGDFSMLTYNIAGLPFPLSSAILPRFFYTKEIGKRLNAYYVANVQEDFAYHQFLI
+ KKSKMPSQTPPEPPTLLWPIGVPFSDGLNTLSEFKVQRLDRQTWYECTSDNCLTLKGF
+ TYSQMRLPGGDTVDVYNLHTNTGGGPTTNANLAQVANYIQQNSAGRAVIVTGDFNARY
+ SDDQSALLQFAQVNGLTDAWVQVEHGPTTPPFAPTCMVGNECELLDKIFYRSGQGVTL
+ QAVSYGNEAPKFFNSKGEPLSDHSPAVVGFHYVADNVAVR"
+ gene complement(989205..990326)
+ /gene="citA"
+ /locus_tag="BQ2027_MB0913C"
+ CDS complement(989205..990326)
+ /gene="citA"
+ /locus_tag="BQ2027_MB0913C"
+ /note="Mb0913c, citA, len: 373 aa. Equivalent to Rv0889c,
+ len: 373 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 373 aa overlap). Probable citA
+ (alternate gene name: gltA), citrate synthase 2 (EC
+ 4.1.3.7), highly similar to others e.g.
+ CAB95899.1|AL359988 putative citrate synthase from
+ Streptomyces coelicolor (387 aa); P39119|CISY_BACSU
+ citrate synthase II from Bacillus subtilis (366 aa), FASTA
+ scores: opt: 586, E(): 5.8e-30, (33.8% identity in 367 aa
+ overlap); etc. Also similar to Rv0896|MTCY31.24 from
+ Mycobacterium tuberculosis (29.2% identity in 274 aa
+ overlap) and Rv1131. Contains PS00480 Citrate synthase
+ signature. BELONGS TO THE CITRATE SYNTHASE FAMILY. Protein
+ product from Mb0913c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0913c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CITRATE SYNTHASE II CITA"
+ /protein_id="SIT99511.1"
+ /db_xref="GOA:P63778"
+ /db_xref="InterPro:IPR002020"
+ /db_xref="InterPro:IPR016142"
+ /db_xref="InterPro:IPR016143"
+ /db_xref="InterPro:IPR019810"
+ /db_xref="InterPro:IPR036969"
+ /db_xref="UniProtKB/Swiss-Prot:P63778"
+ /translation="MTVVPENFVPGLDGVVAFTTEIAEPDKDGGALRYRGVDIEDLVS
+ QRVTFGDVWALLVDGNFGSGLPPAEPFPLPIHSGDVRVDVQAGLAMLAPIWGYAPLLD
+ IDDATARQQLARASVMALSYVAQSARGIYQPAVPQRIIDECSTVTARFMTRWQGEPDP
+ RHIEAIDAYWVSAAEHGMNASTFTARVIASTGADVAAALSGAIGAMSGPLHGGAPARV
+ LPMLDEVERAGDARSVVKGILDRGEKLMGFGHRVYRAEDPRARVLRAAAERLGAPRYE
+ VAVAVEQAALSELRERRPDRAIETNVEFWAAVVLDFARVPANMMPAMFTCGRTAGWCA
+ HILEQKRLGKLVRPSAIYVGPGPRSPESVDGWERVLTTA"
+ gene complement(990413..993061)
+ /locus_tag="BQ2027_MB0914C"
+ CDS complement(990413..993061)
+ /locus_tag="BQ2027_MB0914C"
+ /note="Mb0914c, -, len: 882 aa. Equivalent to Rv0890c,
+ len: 882 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 882 aa overlap). Probable
+ transcriptional regulatory protein, LuxR family, highly
+ similar (but shorter 238 aa in N-terminus) to
+ NP_302202.1|NC_002677 possible transcriptional regulator
+ from Mycobacterium leprae (1106 aa). Also highly similar
+ (generally in part) to others e.g. T50568 probable
+ multi-domain regulatory protein from Streptomyces
+ coelicolor (1334 aa); P10957|NARL_ECOLI nitrate/nitrite
+ response regulator protein from Escherichia coli (216 aa),
+ FASTA scores: opt: 193, E(): 6e-06, (37.4% identity in 99
+ aa overlap); etc. Also highly similar to others from
+ Mycobacterium tuberculosis e.g. MTCY02B10_22, MTV008_44,
+ MTV036_21, and MTCY31_24. Contains PS00017 ATP/GTP-binding
+ site motif A (P-loop), PS00622 Bacterial regulatory
+ proteins, luxR family signature, and probable helix-turn
+ helix motif from aa 836 to 857 (Score 1559, +4.50 SD).
+ BELONGS TO THE LUXR/UHPA FAMILY OF TRANSCRIPTIONAL
+ REGULATORS. Protein product from Mb0914c detected using
+ SWATH mass spectrometry. Mb0914c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY LUXR-FAMILY)"
+ /protein_id="SIT99512.1"
+ /db_xref="GOA:P59969"
+ /db_xref="InterPro:IPR000792"
+ /db_xref="InterPro:IPR011990"
+ /db_xref="InterPro:IPR016032"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="UniProtKB/Swiss-Prot:P59969"
+ /translation="MRALLAQNRLVTLCGTGGVGKTRLAIQIASASELRDGLCFVDLA
+ PITESGIVAATAARAVGLPDQPGRSTMDSLRRFIGNRRMLMVLDNCEHLLDACAALVV
+ ELLGACPELTILATSREPIGMAGEITWRVPSMSITDEAVELFADRASRVQPGFTIANH
+ NAAAVGEICRRLDGIPLAIEFAAARVRSMSPLEIADGLDDCFRLLAGGVRGAVQRQQT
+ LRASIDWSHALLTETEQILFRRLAPFVGGFDLAAVRAVAAGSDLDPFSVLDQLTLLVD
+ KSLVVADDCQGRTRYRLLETVRRYALEKLGDSGEADVHARHRDYYTALAASLNTPADN
+ DHQRLVARAETEIDNLRAAFAWSRENGHITEALQLASSLQPIWFGRAHLREGLSWFNS
+ ILEDQRFHRLAVSTAVRARALADKAMLSTWLATSPVGATDIIAPAQQALAMAREVGDP
+ AALVRALTACGCSSGYNAEAAAPYFAEATDLARAIDDKWTLCQILYWRGVGTCISGDP
+ NALRAAAEECRDLADTIGDRFVSRHCSLWLSLAQMWAGNLTEALELSREITAEAEASN
+ DVPTKVLGLYTQAQVLAYCGASAAHAIAGACIAAATELGGVYQGIGYAAMTYAALAAG
+ DVTAALEASDAARPILRAQPDQVTMHQVLMAQLALAGGDAIAARQFANDAVDATNGWH
+ RMVALTIRARVATARGEPELARDDAHAALACGAELHIYQGMPDAMELLAGLAGEVGSH
+ SEGVRLLGAAAALRQQTRQVRFKIWDAGYQASVTALREAMGDEDFDRAWAEGAALSTD
+ EAIAYAQRGRGERKRPARGWGSLTPTERDVVRLVSEGLSNKDIAKRLFVSPRTVQTHL
+ THVYAKLGLASRVQLVDEAARRGSPS"
+ gene complement(993063..993920)
+ /locus_tag="BQ2027_MB0915C"
+ CDS complement(993063..993920)
+ /locus_tag="BQ2027_MB0915C"
+ /note="Mb0915c, -, len: 285 aa. Equivalent to Rv0891c,
+ len: 285 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 285 aa overlap). Possible
+ transcriptional regulator, highly similar in N-terminus to
+ NP_302202.1|NC_002677 possible transcriptional regulator
+ from Mycobacterium leprae (1106 aa). Also highly similar
+ to several Mycobacterium tuberculosis putative
+ transcriptional regulators e.g. Q1102|MTCY02B10_22
+ PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN (1159 aa),
+ FASTA scores: opt: 702, E(): 8.3e-40, (50.6% identity in
+ 247 aa overlap); MTV036_21; MTV008_44; MTCY02B10_23. Also
+ shows similarity with several adenylate cyclases and
+ hydrolases from other organisms. Mb0915c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99513.1"
+ /db_xref="GOA:P59970"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/Swiss-Prot:P59970"
+ /translation="MLFNAVHNSLPPNIDIDHAILRGEDHPPTCAKCVARGRISALGS
+ LDLRYHSLRCYAAPPDVGRCEFVPPRRRVLIANQGLDVSRLPPTGTVTLLLADVEEST
+ HLWQMCPEDMATAIAHLDHTVSEAITNHGGVQPVKRYEGDSFVAAFTRASDAAACALD
+ LQRTSLAPIRLRIGLHTGEVQLRDELYVGPTINRTARLRDLAHGGQVVLSAATGDLVT
+ GRLPADAWLVDLGRHPLRGLPRPEWVMQLCHPDIREKFPPLRTAKSSPTSILPAQFTT
+ FVGRRAQIS"
+ gene 994318..995805
+ /locus_tag="BQ2027_MB0916"
+ CDS 994318..995805
+ /locus_tag="BQ2027_MB0916"
+ /note="Mb0916, -, len: 495 aa. Equivalent to Rv0892, len:
+ 495 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 495 aa overlap). Probable
+ monooxygenase (EC 1.14.-.-), highly similar to others e.g.
+ NP_250787.1|NC_002516 probable flavin-binding
+ monooxygenase from Pseudomonas aeruginosa (491 aa);
+ CAB59668.1|AL132674 monooxygenase from Streptomyces
+ coelicolor (519 aa); P12015|CYMO_ACIS cyclohexanone
+ monooxygenase from Acinetobacter sp. (542 aa), FASTA
+ scores: opt: 489, E(): 6.8e-26, (30.3% identity in 492 aa
+ overlap); etc. Also highly similar to Rv0565c, Rv3854c,
+ Rv3083, etc from Mycobacterium tuberculosis. Has
+ hydrophobic stretch at N-terminus. Protein product from
+ Mb0916 detected using SWATH mass spectrometry. Mb0916
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MONOOXYGENASE"
+ /protein_id="SIT99514.1"
+ /db_xref="GOA:P64746"
+ /db_xref="InterPro:IPR020946"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/Swiss-Prot:P64746"
+ /translation="MTGRCPTVAVVGAGMSGMCVAITLLSAGITDVCIYEKADDVGGT
+ WRDNTYPGLTCDVPSRLYQYSFAKNPNWTQMFSRGGEIQDYLRGIAERYGLRHRIRFG
+ ATVVSARFDDGRWVLRTDSGTESTVDFLISATGVLHHPRIPPIAGLDDFRGTVFHSAR
+ WDHTVPLLGRRIAVIGTGSTGVQLVCGLAGVAGKVTMFQRTAQWVLPWPNPRYSKLAR
+ VFHRAFPCLGSLAYKAYSLSFETFAVALSNPGLHRKLVGAVCRASLRRVRDPRLRRAL
+ TPDYEPMCKRLVMSGGFYRAIQRDDVELVTAGIDHVEHRGIVTDDGVLHEVDVIVLAT
+ GFDSHAFFRPMQLTGRDGIRIDDVWQDGPHAHQTVAIPGFPNFFMMLGPHSPVGNFPL
+ TAVAESQAEHIVQWIKRWRHGEFDTMEPKSAATEAYNTVLRAAMPNTVWTTGCDSWYL
+ NKDGIPEVWPFAPAKHRAMLANLHPEEYDLRRYAAVRATSRPQSA"
+ gene complement(995783..996760)
+ /locus_tag="BQ2027_MB0917C"
+ CDS complement(995783..996760)
+ /locus_tag="BQ2027_MB0917C"
+ /note="Mb0917c, -, len: 325 aa. Equivalent to Rv0893c,
+ len: 325 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 325 aa overlap). Conserved
+ hypothetical protein, belongs in family with
+ P96823|Rv0146|MTCI5.20 CONSERVED HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (310 aa), FASTA scores: opt:
+ 784, E(): 0, (43.2% identity in 308 aa overlap); Rv0726c,
+ Rv0731c, Rv3399, etc. Also shows some similarity with
+ others e.g. SC9B5.10|T35930 hypothetical protein from
+ Streptomyces coelicolor (303 aa); BSUB0008_141|Q45500
+ HYPOTHETICAL 34.8 KD PROTEIN from Bacillus subtilis (304
+ aa), FASTA scores: E(): 0.00033, (26.8% identity in 168 aa
+ overlap); etc. Protein product from Mb0917c detected using
+ SWATH mass spectrometry. Mb0917c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible s-adenosylmethionine-dependent
+ methyltransferase"
+ /protein_id="SIT99515.1"
+ /db_xref="GOA:P64748"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR011610"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:P64748"
+ /translation="MRTEDDSWDVTTSVGSTGLLVAAARALETQKADPLAIDPYAEVF
+ CRAAGGEWADVLDGKLPDHYLTTGDFGEHFVNFQGARTRYFDEYFSRATAAGMKQVVI
+ LAAGLDSRAFRLQWPIGTTIFELDRPQVLDFKNAVLADYHIRPRAQRRSVAVDLRDEW
+ QIALCNNGFDANRPSAWIAEGLLVYLSAEAQQRLFIGIDTLASPGSHVAVEEATPLDP
+ CEFAAKLERERAANAQGDPRRFFQMVYNERWARATEWFDERGWRATATPLAEYLRRVG
+ RAVPEADTEAAPMVTAITFVSAVRTGLVADPARTSPSSTSIGFKRFEAD"
+ gene 996989..998170
+ /locus_tag="BQ2027_MB0918"
+ CDS 996989..998170
+ /locus_tag="BQ2027_MB0918"
+ /note="Mb0918, -, len: 393 aa. Equivalent to Rv0894, len:
+ 393 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 393 aa overlap). Possible regulatory
+ protein, LuxR family, highly similar in part to
+ NP_302202.1|NC_002677 possible transcriptional regulator
+ from Mycobacterium leprae (1106 aa). Also similar to
+ others e.g. CAB95788.1|AL359949 putative multi-domain
+ regulatory protein from Streptomyces coelicolor (780 aa);
+ NP_107293.1|NC_002678 transcriptional regulator from
+ Mesorhizobium loti (903 aa); etc. Also similar to other
+ regulatory proteins from Mycobacterium tuberculosis e.g.
+ Rv2488c|MTV008_44 (1137 aa), FASTA score: (53.2% identity
+ in 363 aa overlap); Rv1358|MTCY02B10_22 (1159 aa), FASTA
+ score: (52.3% identity in 365 aa overlap); etc. Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (POSSIBLY LUXR-FAMILY)"
+ /protein_id="SIT99516.1"
+ /db_xref="GOA:P64750"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P64750"
+ /translation="MPSRATVQEFSDSYPFCHNGFRPIMMPKIVSVQHSTRRHLTSFV
+ GRKAELNDVRRLLSDKRLVTLTGPDGMGKSRLALQIGAQIAHEFTYGRWDCDLATVTD
+ RDCVSISMLNALGLPVQPGLSAIDTLVGVINDARVLLVLDHCEHLLDACAAIIDSLLR
+ SCPRLTILTTSTEAIGLAGELTWRVPPLSLTNDAIELFVDRARRVRSDFAINADTAVT
+ VGEICRRLDGVPLAIELAAARTDTLSPVEILAGLNDRFRLVAGAAGNAVRPEQTLCAT
+ VQWSHALLSGPERALLHRLAVFAGGFDLDGAQAVGANDEDFEGYQTLGRFAELVDKAF
+ VVVENNRGRAGYRLLYSVRQYALEKLSESGEADAVLARYRKHLKQPNQVVRAGSGGVR
+ Y"
+ gene 998247..999764
+ /locus_tag="BQ2027_MB0919"
+ CDS 998247..999764
+ /locus_tag="BQ2027_MB0919"
+ /note="Mb0919, -, len: 505 aa. Equivalent to Rv0895, len:
+ 505 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 505 aa overlap). Conserved
+ hypothetical protein; member of family with: Rv3740c,
+ Rv3734c, Rv1425, Rv1760, etc. Shows some similarity with
+ NP_301898.1|NC_002677 conserved membrane protein from
+ Mycobacterium leprae (491 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible triacylglycerol synthase
+ (diacylglycerol acyltransferase)"
+ /protein_id="SIT99517.1"
+ /db_xref="GOA:P67205"
+ /db_xref="InterPro:IPR004255"
+ /db_xref="InterPro:IPR009721"
+ /db_xref="InterPro:IPR014292"
+ /db_xref="InterPro:IPR023213"
+ /db_xref="UniProtKB/Swiss-Prot:P67205"
+ /translation="MRQQQEADVVALGRKPGLLCVPERFRAMDLPMAAADALFLWAET
+ PTRPLHVGALAVLSQPDNGTGRYLRKVFSAAVARQQVAPWWRRRPHRSLTSLGQWSWR
+ TETEVDLDYHVRLSALPPRAGTAELWALVSELHAGMLDRSRPLWQVDLIEGLPGGRCA
+ VYVKVHHALADGVSVMRLLQRIVTADPHQRQMPTLWEVPAQASVAKHTAPRGSSRPLT
+ LAKGVLGQARGVPGMVRVVADTTWRAAQCRSGPLTLAAPHTPLNEPIAGARSVAGCSF
+ PIERLRQVAEHADATINDVVLAMCGGALRAYLISRGALPGAPLIAMVPVSLRDTAVID
+ VFGQGPGNKIGTLMCSLATHLASPVERLSAIRASMRDGKAAIAGRSRNQALAMSALGA
+ APLALAMALGRVPAPLRPPNVTISNVPGPQGALYWNGARLDALYLLSAPVDGAALNIT
+ CSGTNEQITFGLTGCRRAVPALSILTDQLAHELELLVGVSEAGPGTRLRRIAGRR"
+ gene 999937..1001232
+ /gene="gltA2"
+ /locus_tag="BQ2027_MB0920"
+ CDS 999937..1001232
+ /gene="gltA2"
+ /locus_tag="BQ2027_MB0920"
+ /note="Mb0920, gltA2, len: 431 aa. Equivalent to Rv0896,
+ len: 431 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8%% identity in 431 aa overlap). Probable gltA2,
+ citrate synthase 1 (EC 4.1.3.7), highly similar to
+ O33066|NP_302405.1|NC_002677 citrate synthase 1 from
+ Mycobacterium leprae (431 aa), FASTA scores: E(): 0, (91.0
+ identity in 431 aa overlap); and
+ AAF04133.1|AF191033_1|AF191033 citrate synthase from
+ Mycobacterium smegmatis (441 aa). Also highly similar to
+ others e.g. AAF14286.1|AF181118_1|AF181118 citrate
+ synthase from Streptomyces coelicolor (429 aa);
+ P42457|CISY_CORGL CITRATE SYNTHASE from Corynebacterium
+ glutamicum (437 aa), FASTA scores: opt: 1847, E(): 0,
+ (63.0% identity in 433 aa overlap); etc. Also similar to
+ two other Mycobacterium tuberculosis citrate synthases,
+ Rv0889|MTCY31.17c|citA (373 aa), FASTA score: (29.2%
+ identity in 274 aa overlap) and Rv1131|MTCY22G8.20|gltA1
+ (393 aa). Contains PS00480 Citrate synthase signature.
+ BELONGS TO THE CITRATE SYNTHASE FAMILY. Protein product
+ from Mb0920 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0920 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CITRATE SYNTHASE I GLTA2"
+ /protein_id="SIT99518.1"
+ /db_xref="GOA:A0A1R3XWQ4"
+ /db_xref="InterPro:IPR002020"
+ /db_xref="InterPro:IPR010953"
+ /db_xref="InterPro:IPR016142"
+ /db_xref="InterPro:IPR016143"
+ /db_xref="InterPro:IPR019810"
+ /db_xref="InterPro:IPR024176"
+ /db_xref="InterPro:IPR036969"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWQ4"
+ /translation="MADTDDTATLRYPGGEIDLQIVHATEGADGIALGPLLAKTGHTT
+ FDVGFANTAAAKSSITYIDGDAGILRYRGYPIDQLAEKSTFIEVCYLLIYGELPDTDQ
+ LAQFTGRIQRHTMLHEDLKRFFDGFPRNAHPMPVLSSVVNALSAYYQDALDPMDNGQV
+ ELSTIRLLAKLPTIAAYAYKKSVGQPFLYPDNSLTLVENFLRLTFGFPAEPYQADPEV
+ VRALDMLFILHADHEQNCSTSTVRLVGSSRANLFTSISGGINALWGPLHGGANQAVLE
+ MLEGIRDSGDDVSEFVRKVKNREAGVKLMGFGHRVYKNYDPRARIVKEQADKILAKLG
+ GDDSLLGIAKELEEAALTDDYFIERKLYPNVDFYTGLIYRALGFPTRMFTVLFALGRL
+ PGWIAHWREMHDEGDSKIGRPRQIYTGYAERDYVTIDAR"
+ gene complement(1001273..1002880)
+ /locus_tag="BQ2027_MB0921C"
+ CDS complement(1001273..1002880)
+ /locus_tag="BQ2027_MB0921C"
+ /note="Mb0921c, -, len: 535 aa. Equivalent to Rv0897c,
+ len: 535 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 535 aa overlap). Possible oxidoreductase
+ (EC 1.-.-.-), similar to various oxidoreductases from
+ diverse organisms e.g. CAB94055.1|AL358672 putative
+ oxidoreductase from Streptomyces coelicolor (540 aa);
+ NP_147877.1|NC_000854 phytoene dehydrogenase from
+ Aeropyrum pernix (549 aa); Q01671|CRTD_RHOSH
+ methoxyneurosporene dehydrogenase from Rhodobacter
+ sphaeroides (495 aa), FASTA scores: opt: 139, E():
+ 2.6e-06, (23.8% identity in 538 aa overlap); etc. Also
+ similar to Rv1432, Rv2997, and Rv3829c from Mycobacterium
+ tuberculosis. Protein product from Mb0921c detected using
+ SWATH mass spectrometry. Mb0921c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="SIT99519.1"
+ /db_xref="GOA:P64752"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/Swiss-Prot:P64752"
+ /translation="MSDHDRDFDVVVVGGGHNGLVAAAYLARAGLRVRLLERLAQTGG
+ AAVSIQAFDGVEVALSRYSYLVSLLPSRIVADLGAPVRLARRPFSSYTPAPATAGRSG
+ LLIGPTGEPRAAHLAAIGAAPDAHGFAAFYRRCRLVTARLWPTLIEPLRTREQARRDI
+ VEYGGHEAAAAWQAMVDEPIGHAIAGAVANDLLRGVIATDALIGTFARMHEPSLMQNI
+ CFLYHLVGGGTGVWHVPIGGMGSVTSALATAAARHGAEIVTGADVFALDPDGTVRYHS
+ DGSDGAEHLVRGRFVLVGVTPAVLASLLGEPVAALAPGAQVKVNMVVRRLPRLRDDSV
+ TPQQAFAGTFHVNETWSQLDAAYSQAASGRLPDPLPCEAYCHSLTDPSILSARLRDAG
+ AQTLTVFGLHTPHSVFGDTEGLAERLTAAVLASLNSVLAEPIQDVLWTDAQSKPCIET
+ TTTLDLQRTLGMTGGNIFHGALSWPFADNDDPLDTPARQWGVATDHERIMLCGSGARR
+ GGAVSGIGGHNAAMAVLACLASRRKSP"
+ gene complement(1002906..1003169)
+ /locus_tag="BQ2027_MB0922C"
+ CDS complement(1002906..1003169)
+ /locus_tag="BQ2027_MB0922C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0922c, -, len: 87 aa. Equivalent to Rv0898c, len:
+ 87 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 87 aa overlap). Conserved hypothetical
+ protein, highly similar to CAC01589.1|AL391041
+ hypothetical protein from Streptomyces coelicolor (87 aa).
+ Also shows some similarity to Rv0709|MTCY210.28|rpmC from
+ Mycobacterium tuberculosis (77 aa), FASTA score: (28.8%
+ identity in 73 aa overlap). Protein product from Mb0922c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0922c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99520.1"
+ /db_xref="InterPro:IPR020311"
+ /db_xref="UniProtKB/Swiss-Prot:P64754"
+ /translation="MGKGRKPTDSETLAHIRDLVAEEKALRAQLRHGGISESEEQQQL
+ RRIEIELDQCWDLLRQRRALRQTGGDPREAVVRPADQVEGYTG"
+ gene 1003277..1004257
+ /gene="ompA"
+ /locus_tag="BQ2027_MB0923"
+ CDS 1003277..1004257
+ /gene="ompA"
+ /locus_tag="BQ2027_MB0923"
+ /note="Mb0923, ompA, len: 326 aa. Equivalent to Rv0899,
+ len: 326 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 326 aa overlap). Probable ompA, outer
+ membrane protein A, C-terminal region similar to
+ C-terminus of many members of the OMPA family of outer
+ membrane proteins e.g. NP_458280.1|NC_003198 putative
+ outer membrane protein from Salmonella enterica subsp.
+ enterica serovar Typhi (220); NP_418008.1|NC_000913
+ putative outer membrane protein from Escherichia coli
+ strain K12 (219 aa), FASTA scores: opt: 296, E(): 2.2e-11,
+ (45.3% identity in 117 aa overlap); NP_231844.1|NC_002505
+ outer membrane protein OmpA from Vibrio cholerae (321 aa);
+ Q05146|OMPA_BORAV OUTER MEMBRANE PROTEIN A PRECURSOR from
+ Bordetella avium (194 aa); etc. A signal peptide sequence
+ probably exists at the N-terminus. Contains PS00044
+ Bacterial regulatory proteins, lysR family signature.
+ BELONGS TO THE OMPA FAMILY. Protein product from Mb0923
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0923 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="outer membrane protein a ompa"
+ /protein_id="SIT99521.1"
+ /db_xref="GOA:P65594"
+ /db_xref="InterPro:IPR006664"
+ /db_xref="InterPro:IPR006665"
+ /db_xref="InterPro:IPR006690"
+ /db_xref="InterPro:IPR007055"
+ /db_xref="InterPro:IPR036737"
+ /db_xref="UniProtKB/Swiss-Prot:P65594"
+ /translation="MASKAGLGQTPATTDARRTQKFYRGSPGRPWLIGAVVIPLLIAA
+ IGYGAFERPQSVTGPTGVLPTLTPTSTRGASALSLSLLSISRSGNTVTLIGDFPDEAA
+ KAALMTALNGLLAPGVNVIDQIHVDPVVRSLDFSSAEPVFTASVPIPDFGLKVERDTV
+ TLTGTAPSSEHKDAVKRAATSTWPDMKIVNNIEVTGQAPPGPPASGPCADLQSAINAV
+ TGGPIAFGNDGASLIPADYEILNRVADKLKACPDARVTINGYTDNTGSEGINIPLSAQ
+ RAKIVADYLVARGVAGDHIATVGLGSVNPIASNATPEGRAKNRRVEIVVN"
+ gene 1004270..1004422
+ /locus_tag="BQ2027_MB0924"
+ CDS 1004270..1004422
+ /locus_tag="BQ2027_MB0924"
+ /note="Mb0924, -, len: 50 aa. Equivalent to Rv0900, len:
+ 50 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 50 aa overlap). Possible membrane protein,
+ with hydrophobic domain from aa 4-26. Mb0924 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIT99522.1"
+ /db_xref="GOA:P64756"
+ /db_xref="UniProtKB/Swiss-Prot:P64756"
+ /translation="MDFVIQWSCYLLAFLGGSAVAWVVVTLSIKRASRDEGAAEAPSA
+ AETGAQ"
+ gene 1004422..1004949
+ /locus_tag="BQ2027_MB0925"
+ CDS 1004422..1004949
+ /locus_tag="BQ2027_MB0925"
+ /note="Mb0925, -, len: 175 aa. Equivalent to Rv0901, len:
+ 175 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 175 aa overlap). Possible conserved
+ exported or membrane protein, with hydrophobic N-terminus
+ at aa 7-25. Shows some similarity in C-terminus to
+ O33070|Z99494|MLCB57.59 HYPOTHETICAL PROTEIN from
+ Mycobacterium leprae (113 aa), FASTA scores: opt: 204,
+ E(): 3.2e-12, (44.9% identity in 78 aa overlap) Protein
+ product from Mb0925 detected using SWATH mass
+ spectrometry. Mb0925 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED EXPORTED OR MEMBRANE PROTEIN"
+ /protein_id="SIT99523.1"
+ /db_xref="GOA:P64758"
+ /db_xref="UniProtKB/Swiss-Prot:P64758"
+ /translation="MEHVHWWLAGLAFTLGMVLTSTLMVRPVEHQVLVKKSVRGSSAK
+ SKPPTARKPAVKSGTKREESPTAKTKVATESAAEQIPVAGEPAAEPIPVAGEPAARIP
+ VVPYAPYGPGSARAGADGSGPQGWLVKGRSDTRLYYTPEDPTYDPTVAQVWFQDEESA
+ ARAFFTPWRKSTRRT"
+ gene complement(1004966..1006306)
+ /gene="prrB"
+ /locus_tag="BQ2027_MB0926C"
+ CDS complement(1004966..1006306)
+ /gene="prrB"
+ /locus_tag="BQ2027_MB0926C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0926c, prrB, len: 446 aa. Equivalent to Rv0902c,
+ len: 446 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 446 aa overlap). prrB, two-component
+ sensor histidine kinase (EC 2.7.3.-) (see citations
+ below), transmembrane protein, equivalent to
+ MLCB57_26|NP_302403.1|NC_002677 sensor histidine kinase
+ from Mycobacterium leprae (446 aa); and similar at
+ C-termini to NP_301251.1|NC_002677 putative two-component
+ system sensor kinase from Mycobacterium leprae (519 aa).
+ C-terminus also similar to the C-termini of many
+ sensor-like histidine kinase proteins e.g.
+ P08336|CPXA_ECOLI|ECFB|SSD|EUP|B3911|Z5456|ECS4837 sensor
+ protein from Escherichia coli strain K12 (457 aa), FASTA
+ scores: opt: 364, E(): 1.7e-15, (27.1% identity in 398 aa
+ overlap); CAB89748.1|AL354616 putative two-component
+ histidine kinase from Streptomyces coelicolor (483 aa);
+ CAB82845.1|AJ277081 putative histidine kinase from
+ Amycolatopsis mediterranei (472 aa); etc. Also similar in
+ part to Mycobacterium tuberculosis proteins Rv3764c (475
+ aa); and Rv0982 (504 aa). Thought to be induced at
+ phagocytosis (see second citation below). Protein product
+ from Mb0926c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0926c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="TWO COMPONENT SENSOR HISTIDINE KINASE PRRB"
+ /protein_id="SIT99524.1"
+ /db_xref="GOA:P0A5Z9"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR003660"
+ /db_xref="InterPro:IPR003661"
+ /db_xref="InterPro:IPR004358"
+ /db_xref="InterPro:IPR005467"
+ /db_xref="InterPro:IPR036097"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Z9"
+ /translation="MNILSRIFARTPSLRTRVVVATAIGAAIPVLIVGTVVWVGITND
+ RKERLDRRLDEAAGFAIPFVPRGLDEIPRSPNDQDALITVRRGNVIKSNSDITLPKLQ
+ DDYADTYVRGVRYRVRTVEIPGPEPTSVAVGATYDATVAETNNLHRRVLLICTFAIGA
+ AAVFAWLLAAFAVRPFKQLAEQTRSIDAGDEAPRVEVHGASEAIEIAEAMRGMLQRIW
+ NEQNRTKEALASARDFAAVSSHELRTPLTAMRTNLEVLSTLDLPDDQRKEVLNDVIRT
+ QSRIEATLSALERLAQGELSTSDDHVPVDITDLLDRAAHDAARIYPDLDVSLVPSPTC
+ IIVGLPAGLRLAVDNAIANAVKHGGATLVQLSAVSSRAGVEIAIDDNGSGVPEGERQV
+ VFERFSRGSTASHSGSGLGLALVAQQAQLHGGTASLENSPLGGARLVLRLPGPS"
+ gene complement(1006317..1007027)
+ /gene="prrA"
+ /locus_tag="BQ2027_MB0927C"
+ CDS complement(1006317..1007027)
+ /gene="prrA"
+ /locus_tag="BQ2027_MB0927C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0927c, prrA, len: 236 aa. Equivalent to Rv0903c,
+ len: 236 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 236 aa overlap). prrA, two-component
+ response regulator (see citations below), equivalent to
+ Z99494|MLCB57_27|NP_302402.1|NC_002677 two-component
+ response regulator from Mycobacterium leprae (233 aa),
+ FASTA scores: opt: 1414, E(): 0, (95.7% identity in 233 aa
+ overlap); and similar to T45446 probable two-component
+ response regulator from Mycobacterium leprae (253 aa).
+ Also similar to many sensor-like histidine kinase proteins
+ e.g. CAB88489.1|AL353816 putative two-component systen
+ response regulator from Streptomyces coelicolor (248 aa);
+ AAG36759.1|AF119221_1 |AF119221 response regulator from
+ Corynebacterium glutamicum (232 aa); Q02540|COPR_PSESM
+ transcriptional activator protein COPR from Pseudomonas
+ syringae (pv. tomato) (227 aa), FASTA scores: opt: 600,
+ E(): 0, (44.4% identity in 225 aa overlap); etc. Also
+ similar to Rv0981 from Mycobacterium tuberculosis (230
+ aa), Rv3765c (234 aa), phoP (247 aa), etc. Thought to be
+ induced at phagocytosis (see second citation below).
+ Protein product from Mb0927c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0927c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="TWO COMPONENT RESPONSE TRANSCRIPTIONAL
+ REGULATORY PROTEIN PRRA"
+ /protein_id="SIT99525.1"
+ /db_xref="GOA:P0A5Z7"
+ /db_xref="InterPro:IPR001789"
+ /db_xref="InterPro:IPR001867"
+ /db_xref="InterPro:IPR011006"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039420"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Z7"
+ /translation="MGGMDTGVTSPRVLVVDDDSDVLASLERGLRLSGFEVATAVDGA
+ EALRSATENRPDAIVLDINMPVLDGVSVVTALRAMDNDVPVCVLSARSSVDDRVAGLE
+ AGADDYLVKPFVLAELVARVKALLRRRGSTATSSSETITVGPLEVDIPGRRARVNGVD
+ VDLTKREFDLLAVLAEHKTAVLSRAQLLELVWGYDFAADTNVVDVFIGYLRRKLEAGG
+ GPRLLHTVRGVGFVLRMQ"
+ gene complement(1007158..1008645)
+ /gene="accD3"
+ /locus_tag="BQ2027_MB0928C"
+ CDS complement(1007158..1008645)
+ /gene="accD3"
+ /locus_tag="BQ2027_MB0928C"
+ /note="Mb0928c, accD3, len: 495 aa. Equivalent to Rv0904c,
+ len: 495 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 495 aa overlap). Putative accD3,
+ acetyl-CoA carboxylase carboxyl transferase, beta subunit
+ (carboxyltransferase subunit of acetyl-CoA carboxylase)
+ (EC 6.4.1.2), highly similar in part to AAA63045.1|U15184
+ zinc finger protein from Mycobacterium leprae (201 aa).
+ Also highly similar to others e.g. CAC42827.1|Y17592
+ putative carboxyltransferase subunit of acetyl-CoA
+ carboxylase from Corynebacterium glutamicum (491 aa);
+ CAB86110.1|AL163003 putative acetyl CoA carboxylase (alpha
+ and beta subunits) from Streptomyces coelicolor (458 aa);
+ Q54776|ACCD_SYNP7 ACETYL-COENZYME A CARBOXYLASE CARBOXYL
+ TRANSFERASE SUBUNIT BETA from Synechococcus sp. (305 aa);
+ P12217|ACCD_MARPO ACETYL-COENZYME A CARBOXYLASE CARBOXYL
+ TRANSFERASE SUBUNIT BETA from Marchantia polymorpha (316
+ aa), FASTA scores: opt: 519, E():1.6e-24, (40.2% identity
+ in 219 aa overlap); etc. Also similar to Rv3280, Rv2502c,
+ etc from Mycobacterium tuberculosis. BELONGS TO THE
+ ACCD/PCCB FAMILY. Protein product from Mb0928c detected
+ using SWATH mass spectrometry. Mb0928c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE ACETYL-COENZYME A CARBOXYLASE CARBOXYL
+ TRANSFERASE (SUBUNIT BETA) ACCD3 (ACCASE BETA CHAIN)"
+ /protein_id="SIT99526.1"
+ /db_xref="GOA:P63406"
+ /db_xref="InterPro:IPR000438"
+ /db_xref="InterPro:IPR011762"
+ /db_xref="InterPro:IPR011763"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="InterPro:IPR034733"
+ /db_xref="UniProtKB/Swiss-Prot:P63406"
+ /translation="MSRITTDQLRHAVLDRGSFVSWDSEPLAVPVADSYARELAAARA
+ ATGADESVQTGEGRVFGRRVAVVACEFDFLGGSIGVAAAERITAAVERATAERLPLLA
+ SPSSGGTRMQEGTVAFLQMVKIAAAIQLHNQARLPYLVYLRHPTTGGVFASWGSLGHL
+ TVAEPGALIGFLGPRVYELLYGDPFPSGVQTAENLRRHGIIDGVVALDRLRPMLDRAL
+ TVLIDAPEPLPAPQTPAPVPDVPTWDSVVASRRPDRPGVRQLLRHGATDRVLLSGTDQ
+ GEAATTLLALARFGGQPTVVLGQQRAVGGGGSTVGPAALREARRGMALAAELCLPLVL
+ VIDAAGPALSAAAEQGGLAGQIAHCLAELVTLDTPTVSILLGQGSGGPALAMLPADRV
+ LAALHGWLAPLPPEGASAIVFRDTAHAAELAAAQGIRSADLLKSGIVDTIVPEYPDAA
+ DEPIEFALRLSNAIAAEVHALRKIPAPERLATRLQRYRRIGLPRD"
+ gene 1008672..1009403
+ /gene="echA6"
+ /locus_tag="BQ2027_MB0929"
+ CDS 1008672..1009403
+ /gene="echA6"
+ /locus_tag="BQ2027_MB0929"
+ /note="Mb0929, echA6, len: 243 aa. Equivalent to Rv0905,
+ len: 243 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 243 aa overlap). Possible echA6,
+ enoyl-CoA hydratase (EC 4.2.1.17), highly similar to
+ ML15184|U15184 enoyl-CoA hydratase from Mycobacterium
+ leprae (247 aa), FASTA score: (85.8% identity in 247 aa
+ overlap). Also similar to many e.g. NP_250320.1|NC_002516
+ probable enoyl-CoA hydratase/isomerase from Pseudomonas
+ aeruginosa (261 aa); NP_415911.1|NC_000913 putative enzyme
+ from Escherichia coli strain K12 (255 aa); P24162
+ ECHH_RHOCA|FADB1 enoyl-CoA hydratase homolog from
+ Rhodobacter capsulatus (Rhodopseudomonas capsulata) (257
+ aa), FASTA scores: opt: 404, E():7.8e-21, (37.3% identity
+ in 249 aa overlap); etc. Protein product from Mb0929
+ detected using shotgun mass spectrometry. Mb0929 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ENOYL-COA HYDRATASE ECHA6 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-COA HYDRATASE) (CROTONASE)"
+ /protein_id="SIT99527.1"
+ /db_xref="GOA:P64015"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR018376"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/Swiss-Prot:P64015"
+ /translation="MIGITQAEAVLTIELQRPERRNALNSQLVEELTQAIRKAGDGSA
+ RAIVLTGQGTAFCAGADLSGDAFAADYPDRLIELHKAMDASPMPVVGAINGPAIGAGL
+ QLAMQCDLRVVAPDAFFQFPTSKYGLALDNWSIRRLSSLVGHGRARAMLLSAEKLTAE
+ IALHTGMANRIGTLADAQAWAAEIARLAPLAIQHAKRVLNDDGAIEEAWPAHKELFDK
+ AWGSQDVIEAQVARMEKRPPKFQGA"
+ gene 1009409..1010527
+ /locus_tag="BQ2027_MB0930"
+ CDS 1009409..1010527
+ /locus_tag="BQ2027_MB0930"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0930, -, len: 372 aa. Equivalent to Rv0906, len:
+ 372 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 372 aa overlap). Conserved hypothetical
+ protein, highly similar to others e.g.
+ SC6A5.25|AL049485|T35416 hypothetical protein from
+ Streptomyces coelicolor (370 aa), FASTA scores: opt: 1125,
+ E(): 0, (51.3% identity in 335 aa overlap);
+ NP_242955.1|NC_002570|BH2089 conserved protein from
+ Bacillus halodurans (370 aa); etc. Also shows some
+ similarity to C-terminus of Q48412|ROMA_KLEPN Q48412 outer
+ membrane protein roma (fragment) from Klebsiella
+ pneumoniae (132 aa), FASTA scores: opt: 319, E(): 8.5e-14,
+ (46.2% identity in 104 aa overlap); NP_105215.1|NC_002678
+ hypothetical protein which contains similarity to outer
+ membrane protein romA from Enterobacter cloacae (350 aa);
+ etc. Protein product from Mb0930 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0930
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Outer membrane protein romA"
+ /protein_id="SIT99528.1"
+ /db_xref="GOA:P64760"
+ /db_xref="InterPro:IPR001279"
+ /db_xref="InterPro:IPR024884"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/Swiss-Prot:P64760"
+ /translation="MVRRALRLAAGTASLAAGTWLLRALHGTPAALGADAASIRAVSE
+ QSPNYRDGAFVNLDPASMFTLDREELRLIVWELVARHSASRPAAPIPLASPNIYRGDA
+ SRLAVSWFGHSTALLEIDGYRVLTDPVWSDRCSPSDVVGPQRLHPPPVQLAALPAVDA
+ VVISHDHYDHLDIDTVVALVGMQRAPFLVPLGVGAHLRSWGVPQDRIVELDWNQSAQV
+ DELTVVCVPARHFSGRFLSRNTTLWASWAFVGPNHRAYFGGDTGYTKSFTQIGADHGP
+ FDLTLLPIGAYNTAWPDIHMNPEEAVRAHLDVTDSGSGMLVPVHWGTFRLAPHPWGEP
+ VERLLAAAEPEHVTVAVPLPGQRVDPTGPMRLHPWWRL"
+ gene 1010650..1012200
+ /locus_tag="BQ2027_MB0931"
+ CDS 1010650..1012200
+ /locus_tag="BQ2027_MB0931"
+ /note="Mb0931, -, len: 516 aa. Equivalent to Rv0907, len:
+ 532 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 511 aa overlap). Conserved hypothetical
+ protein, possibly involved in cell wall biosynthesis:
+ similar to many beta-lactamases, penicillin-binding
+ proteins and hypothetical proteins e.g.
+ NP_298910.1|NC_002488 beta-lactamase from Xylella
+ fastidiosa (455 aa); Q06317|PBP4_NOCLA PENICILLIN-BINDING
+ PROTEIN 4 (PBP-4) (381 aa), FASTA scores: opt: 299, E():
+ 8.8e-05, (28.7% identity in 401 aa overlap); etc.
+ N-terminus highly similar to AAA63047.1|U15184
+ hypothetical protein from Mycobacterium leprae (58 aa).
+ Related to other putative esterases and penicillin binding
+ proteins in Mycobacterium tuberculosis e.g.
+ Rv1730c|MTCY04C12.15c (517 aa).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ frameshift due to a single base insertion (*-g) leads to a
+ shorter product with a different NH2 part compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv.
+ Protein product from Mb0931 detected using SWATH mass
+ spectrometry. Mb0931 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Beta-lactamase class C-like and penicillin
+ binding proteins (PBPs) superfamily / DUF3471 domain"
+ /protein_id="SIT99529.1"
+ /db_xref="InterPro:IPR001466"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="InterPro:IPR021860"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWT2"
+ /translation="MMLLTLTGCGSTHQALGPPSGLPDASPNERSAIQIPAGRIDDAV
+ AKVDGLVGELMQNTGIPGMAVAIVHGGKTLYAKGFGVRDVGKGGGPDNKVDADTVFQL
+ ASVSKSVGATVVAHAVTDNVVTWDTPVVSKLPWFALRDPYVTGQVTIADLYSHRSGLP
+ DHAGDLLEDLGYDRRQVLQRLKYLPLAPFRISYAYTNFGVTAAAEAVAAAAGQSWEDL
+ SDEVLYRPLGMGSTSSRFTDFLARPNHAVNHVKVADRWEARYQRDPDAQSPAGGVSSS
+ LNDMTHWLAMVLADGVYNGRRITSPEALLLVYTPQVISRHPVSPRARASFYGYGFNVG
+ VTSSGRTEYSHSGAFGLGAAANFVVLPSEDLAIIALTNAGPIGVPETLTAEFMDLVQY
+ GQVREDWAALYKKAFAPLNELAGSLVGKQSPANPAPSRPLNDYVGVYANDYWGPATVT
+ YHDGQLRLSLGPKNQTFDLTHWDGDTFTFTLSTENALPGSISKATFAGDTLNLEYYDA
+ DKLGTFTR"
+ gene 1012197..1014590
+ /gene="ctpE"
+ /locus_tag="BQ2027_MB0932"
+ CDS 1012197..1014590
+ /gene="ctpE"
+ /locus_tag="BQ2027_MB0932"
+ /note="Mb0932, ctpE, len: 797 aa. Equivalent to Rv0908,
+ len: 797 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 797 aa overlap). Probable ctpE, metal
+ cation-transporting ATPase P-type, transmembrane protein,
+ E1-E2 family, highly similar to many e.g.
+ AB93406.1|AL357524 putative integral membrane ATPase from
+ Streptomyces coelicolor (802 aa); NP_346063.1|NC_003028
+ cation-transporting ATPase (E1-E2 family) from
+ Streptococcus pneumoniae (778 aa); P37278|ATCL_SYNP7|PACL
+ cation-transporting atpase from Synechococcus sp. strain
+ PCC 7942 (Anacystis nidulans R2) (926 aa), FASTA scores:
+ opt: 257, E(): 4.8e-33, (27.7% identity in 905 aa
+ overlap); etc. Contains E1-E2 ATPases phosphorylation site
+ (PS00154). BELONGS TO THE CATION TRANSPORT ATPASES FAMILY
+ (E1-E2 ATPASES). Protein product from Mb0932 detected
+ using SWATH mass spectrometry. Mb0932 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METAL CATION TRANSPORTER ATPASE P-TYPE
+ CTPE"
+ /protein_id="SIT99530.1"
+ /db_xref="GOA:P0A505"
+ /db_xref="InterPro:IPR001757"
+ /db_xref="InterPro:IPR008250"
+ /db_xref="InterPro:IPR018303"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR023298"
+ /db_xref="InterPro:IPR023299"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="UniProtKB/Swiss-Prot:P0A505"
+ /translation="MTRSASATAGLTDAEVAQRVAEGKSNDIPERVTRTVGQIVRANV
+ FTRINAILGVLLLIVLATGSLINGMFGLLIIANSVIGMVQEIRAKQTLDKLAIIGQAK
+ PLVRRQSGTRTRSTNEVVLDDIIELGPGDQVVVDGEVVEEENLEIDESLLTGEADPIA
+ KDAGDTVMSGSFVVSGAGAYRATKVGSEAYAAKLAAEASKFTLVKSELRNGINRILQF
+ ITYLLVPAGLLTIYTQLFTTHVGWRESVLRMVGALVPMVPEGLVLMTSIAFAVGVVRL
+ GQRQCLVQELPAIEGLARVDVVCADKTGTLTESGMRVCEVEELDGAGRQESVADVLAA
+ LAAADARPNASMQAIAEAFHSPPGWVVAANAPFKSATKWSGVSFRDHGNWVIGAPDVL
+ LDPASVAARQAERIGAQGLRVLLLAAGSVAVDHAQAPGQVTPVALVVLEQKVRPDARE
+ TLDYFAVQNVSVKVISGDNAVSVGAVADRLGLHGEAMDARALPTGREELADTLDSYTS
+ FGRVRPDQKRAIVHALQSHGHTVAMTGDGVNDVLALKDADIGVAMGSGSPASRAVAQI
+ VLLNNRFATLPHVVGEGRRVIGNIERVANLFLTKTVYSVLLALLVGIECLIAIPLRRD
+ PLLFPFQPIHVTIAAWFTIGIPAFILSLAPNNERAYPGFVRRVMTSAVPFGLVIGVAT
+ FVTYLAAYQGRYASWQEQEQASTAALITLLMTALWVLAVIARPYQWWRLALVLASGLA
+ YVVIFSLPLAREKFLLDASNLATTSIALAVGVVGAATIEAMWWIRSRMLGVKPRVWR"
+ gene 1015147..1015326
+ /locus_tag="BQ2027_MB0933"
+ CDS 1015147..1015326
+ /locus_tag="BQ2027_MB0933"
+ /note="Mb0933, -, len: 59 aa. Equivalent to Rv0909, len:
+ 59 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.3% identity in 59 aa overlap). Conserved hypothetical
+ protein, equivalent to NP_302399.1|NC_002677 conserved
+ hypothetical protein from Mycobacterium leprae (56 aa).
+ Also some similarity with AL022268|SC4H2_10c HYPOTHETICAL
+ PROTEIN from Streptomyces coelicolor (97 aa), FASTA
+ scores: opt: 106, E(): 0.13, (43.2% identity in 37 aa
+ overlap). Protein product from Mb0933 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0933 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Antitoxin Rv0909"
+ /protein_id="SIT99531.1"
+ /db_xref="InterPro:IPR028037"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWT0"
+ /translation="MGILDKVKNLLSQNADKVETVINKAGEFVDEQTQGNYSDAIHKL
+ QDAASNVVGMSDQQS"
+ gene 1015332..1015766
+ /locus_tag="BQ2027_MB0934"
+ CDS 1015332..1015766
+ /locus_tag="BQ2027_MB0934"
+ /note="Mb0934, -, len: 144 aa. Equivalent to Rv0910, len:
+ 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 144 aa overlap). Conserved hypothetical
+ protein, equivalent to NP_302398.1|NC_002677 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium leprae (181 aa),
+ FASTA scores: opt: 820, E(): 0, (83.9% identity in 143 aa
+ overlap). Also similar to Rv1546|MTCY48.19c HYPOTHETICAL
+ PROTEIN from Mycobacterium tuberculosis (143 aa). Protein
+ product from Mb0934 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0934 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Toxin Rv0910"
+ /protein_id="SIT99532.1"
+ /db_xref="InterPro:IPR019587"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYW4"
+ /translation="MAKLSGSIDVPLPPEEAWMHASDLTRYREWLTIHKVWRSKLPEV
+ LEKGTVVESYVEVKGMPNRIKWTIVRYKPPEGMTLNGDGVGGVKVKLIAKVAPKEHGS
+ VVSFDVHLGGPALLGPIGMIVAAALRADIRESLQNFVTVFAG"
+ gene 1015864..1016637
+ /locus_tag="BQ2027_MB0935"
+ CDS 1015864..1016637
+ /locus_tag="BQ2027_MB0935"
+ /note="Mb0935, -, len: 257 aa. Equivalent to Rv0911, len:
+ 257 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 257 aa overlap). Conserved hypothetical
+ protein, showing similarity with hydroxylases and
+ hypothetical proteins e.g. T35325 probable hydroxylase
+ from Streptomyces coelicolor (265 aa); Q54242 hypothetical
+ protein from Streptomyces, FASTA scores: opt: 372, E():
+ 8.8e-18, (32.0% identity in 256 aa overlap);
+ AAD04716.1|U77891 doxorubicin biosynthesis enzyme DnrV
+ from Streptomyces peucetius (275 aa); AAA63051.1|U15184
+ hypothetical protein from Mycobacterium leprae (94 aa);
+ etc. Also similar to Rv0577 HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (261 aa). Protein product from
+ Mb0935 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0935 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative hydroxylase"
+ /protein_id="SIT99533.1"
+ /db_xref="InterPro:IPR029068"
+ /db_xref="InterPro:IPR037523"
+ /db_xref="InterPro:IPR041581"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXS1"
+ /translation="MPTRSSAPLGAPCWIDLTTSDVDRAQDFYGTVFGWAFESAGPDY
+ GGYINAAKGGHPVAGLMANRPEFQSPDGWATYFHTVDIGATVAKLAAAGGSSCLDPME
+ VPGKGFMSLAVDPSGAAFGLWQPLQHHGFEVIGEAGSPVWHQLTTRDYRSVIDFYRQV
+ FGWRTEQISDTDEFCYTTAWFDDQQLLGVMDGSSCLPEGVPSNWTIFFGAEDVDETLR
+ VICDNGGSVVRAAENTPYGRLAAAADPMGVVFNLSSLQA"
+ gene 1016702..1017151
+ /locus_tag="BQ2027_MB0936"
+ CDS 1016702..1017151
+ /locus_tag="BQ2027_MB0936"
+ /note="Mb0936, -, len: 149 aa. Equivalent to Rv0912, len:
+ 149 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 149 aa overlap). Probable conserved
+ transmembrane protein, equivalent to
+ Q50121|NP_302397.1|NC_002677 conserved hypothetical
+ protein from Mycobacterium leprae (144 aa), FASTA scores:
+ opt: 677, E(): 6.9e-38, (69.5% identity in 141 aa
+ overlap). Mb0936 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99534.1"
+ /db_xref="GOA:A0A1R3XWU7"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWU7"
+ /translation="MTRRLRPGWLVALSAAVIAASTWMPWLTTTVGGGGWVNAIGGTH
+ GSLELPHGFGPGQLIVLLSSTLLVVGAMAGRGLSVKLSSIAALVVSLLIVALTVWYYK
+ LNVNPPVSAEYGLYFGAAGGVCAVGCSLWAAVSAASPGRRRHREVVR"
+ gene complement(1017683..1019191)
+ /locus_tag="BQ2027_MB0937C"
+ CDS complement(1017683..1019191)
+ /locus_tag="BQ2027_MB0937C"
+ /note="Mb0937c, -, len: 502 aa. Equivalent to Rv0913c,
+ len: 502 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 502 aa overlap). Possible dioxygenase
+ (EC 1.-.-.-), showing similarity with others e.g.
+ AAK38744.1|AY029525 carotenoid 9,10-9',10' cleavage
+ dioxygenase from Phaseolus vulgaris (543 aa);
+ CAB56138.1|AL117669 putative dioxygenase from Streptomyces
+ coelicolor (503 aa); AAK06796.1|AF324838_15|AF324838
+ putative dioxygenase SimC5 from Streptomyces antibioticus
+ (456 aa); Q53353|S65040
+ LIGNOSTILBENE-ALPHA,BETA-DIOXYGENASE (EC 1.13.11.43) from
+ Pseudomonas paucimobilis (485 aa), FASTA scores: opt: 310,
+ E(): 3.4e-20, (28.9% identity in 495 aa overlap); etc.
+ Also some similarity with Rv0654|MTCI376.22 PROBABLE
+ DIOXYGENASE from Mycobacterium tuberculosis (501 aa).
+ Protein product from Mb0937c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0937c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE DIOXYGENASE"
+ /protein_id="SIT99535.1"
+ /db_xref="GOA:A0A1R3XX62"
+ /db_xref="InterPro:IPR004294"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX62"
+ /translation="MDITIVGKYLSTLPEDDDHPYRTGPWRPQTTEWDADDLTTVTGE
+ VPADLDGIYLRNTENPLHPAFATYHPFDGDGMIHVVGFRDGKAFYRNRFIRTDGFLAE
+ NEAGGPLWPGLAEPVQLAKREHGWGARGLMKDASSTDVIVHRGIALTSFYQCGDLYRI
+ DPYSANTLGKESWHGRFPFDWGVSAHPKVDNKTGELLFFNYSKQEPYMRYGVVDQNNE
+ LVHYVDVPLPGPRLLHDMAFTENYVILNDFPLFWDPRLLERDVHLPRFYPEIPSRFAV
+ VARRGNDIRWFEADPTFVLHFTNAYEQGDEIVLDGFYEGDPQPLDTGGTKWEKLFRFL
+ ALDRLQSRLHRWRLNMVTGAVHEEQLSESITEFGTINADYAASSYRYTYAATGKPSWF
+ LFDGLVKHDLLTGNHECYSFGDGVYGSETAMAPRVGSSAEDDGYLVTLTTDMNDDASY
+ CLVFDAARPGDGPICKLALPERISSGTHSAWVPGAELRRWDHAESPAAAVGL"
+ gene complement(1019193..1020431)
+ /locus_tag="BQ2027_MB0938C"
+ CDS complement(1019193..1020431)
+ /locus_tag="BQ2027_MB0938C"
+ /note="Mb0938c, -, len: 412 aa. Equivalent to Rv0914c,
+ len: 412 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 412 aa overlap). Possible lipid carrier
+ protein or keto acyl-CoA thiolase (EC 2.3.1.16), highly
+ similar to NP_421905.1|NC_002696 thiolase family protein
+ from Caulobacter crescentus (407 aa); and similar to
+ others e.g. NP_107896.1|NC_002678 3-ketoacyl-CoA thiolase
+ from Mesorhizobium loti (392 aa); NP_385796.1|NC_003047
+ PUTATIVE 3-KETOACYL-COA THIOLASE PROTEIN from
+ Sinorhizobium meliloti (389 aa); NP_275932.1|NC_000916
+ lipid-transfer protein (sterol or nonspecific) from
+ Methanothermobacter thermautotrophicus (383 aa);
+ AB55378.1|AL117263 possible 3-ketoacyl-CoA thiolase from
+ Leishmania major (441 aa), FASTA scores: opt: 547, E():
+ 3.1e-26, (31.0% identity in 435 aa overlap); etc. Also
+ similar to Rv2790c, Rv1627c, Rv0244, etc from
+ Mycobacterium tuberculosis. COULD BELONG TO THE THIOLASE
+ FAMILY. Protein product from Mb0938c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0938c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE LIPID CARRIER PROTEIN OR KETO ACYL-COA
+ THIOLASE"
+ /protein_id="SIT99536.1"
+ /db_xref="GOA:A0A1R3XWT3"
+ /db_xref="InterPro:IPR002155"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020616"
+ /db_xref="InterPro:IPR020617"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWT3"
+ /translation="MDDGVWILGGYQSDFARNLSKENRDFADLTREVVDGTLTAAKVD
+ AADLAAAGVVHVANAFGEMFARQGHLGAMPATVCDDLWDTPATRHEAACASGSVATLA
+ AMADLRSGAYRVALVVGLELEKTVPGDTAAEHLSAAAWTGHEGAEARYLWPSMFAQVA
+ DEYDRRYGLDDTHLRAIAQLNFANARRNPNAQTRGWTIPDPITDDDATNPLTEGRLRR
+ FDCSQMTDGGAGLVLVSDAYLRDHRDARPIGRIDGWGHRTVGLGLRQKLDRVAQGDSA
+ PYLLPHVRATVLDALRRARVTLDDLDGIEVHDCFTPSEYLAIDHIGLTGPGESWKAIE
+ NGEIEIGGRLPINPSGGLIGGGHPVGASGVRMLLDAAKQVSGIAGDYQVENAEAFGTL
+ NFGGSTATTVSFVVSTTRGS"
+ gene complement(1020524..1021795)
+ /gene="PPE14"
+ /locus_tag="BQ2027_MB0939C"
+ CDS complement(1020524..1021795)
+ /gene="PPE14"
+ /locus_tag="BQ2027_MB0939C"
+ /note="Mb0939c, PPE14, len: 423 aa. Equivalent to Rv0915c,
+ len: 423 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 423 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family, highly similar to
+ many e.g. Rv1807 from Mycobacterium tuberculosis (403 aa),
+ FASTA scores: opt: 966, E(): 4.4e-30, (45.7% identity in
+ 392 aa overlap); etc. Contains PS00626 Regulator of
+ chromosome condensation (RCC1) signature 2. Mb0939c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe14"
+ /protein_id="SIT99537.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWT8"
+ /translation="MDFGLLPPEVNSSRMYSGPGPESMLAAAAAWDGVAAELTSAAVS
+ YGSVVSTLIVEPWMGPAAAAMAAAATPYVGWLAATAALAKETATQARAAAEAFGTAFA
+ MTVPPSLVAANRSRLMSLVAANILGQNSAAIAATQAEYAEMWAQDAAVMYSYEGASAA
+ ASALPPFTPPVQGTGPAGPAAAAAATQAAGAGAVADAQATLAQLPPGILSDILSALAA
+ NADPLTSGLLGIASTLNPQVGSAQPIVIPTPIGELDVIALYIASIATGSIALAITNTA
+ RPWHIGLYGNAGGLGPTQGHPLSSATDEPEPHWGPFGGAAPVSAGVGHAALVGALSVP
+ HSWTTAAPEIQLAVQATPTFSSSAGADPTALNGMPAGLLSGMALASLAARGTTGGGGT
+ RSGTSTDGQEDGRKPPVVVIREQPPPGNPPR"
+ gene complement(1021810..1022109)
+ /gene="PE7"
+ /locus_tag="BQ2027_MB0940C"
+ CDS complement(1021810..1022109)
+ /gene="PE7"
+ /locus_tag="BQ2027_MB0940C"
+ /note="Mb0940c, PE7, len: 99 aa. Equivalent to Rv0916c,
+ len: 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 99 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family, similar to many e.g.
+ Rv1788 from Mycobacterium tuberculosis (99 aa), FASTA
+ scores: opt: 321, E(): 1.3e-11, (53.5% identity in 99 aa
+ overlap); etc. Mb0940c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe7"
+ /protein_id="SIT99538.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWS4"
+ /translation="MSFVTIQPVVLAAATGDLPTIGTAVSARNTAVCAPTTGVLPPAA
+ NDVSVLTAARFTAHTKHYRVVSKPAALVHGMFVALPAATADAYATTEAVNVVATG"
+ gene 1022553..1024334
+ /gene="betP"
+ /locus_tag="BQ2027_MB0941"
+ CDS 1022553..1024334
+ /gene="betP"
+ /locus_tag="BQ2027_MB0941"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0941, betP, len: 593 aa. Equivalent to Rv0917,
+ len: 593 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 593 aa overlap). Possible betP, glycine
+ betaine transporter, integral membrane protein, highly
+ similar to many transporters, mainly glycine betaine
+ transporters, e.g. P54582|BETP_CORGL glycine betaine
+ transporter from Corynebacterium glutamicum
+ (Brevibacterium flavum) (595 aa), FASTA scores: opt: 1367,
+ E(): 0, (42.7% identity in 504 aa overlap); T35264
+ probable BCCT family transporter from Streptomyces
+ coelicolor (578 aa); NP_243511.1|NC_002570 glycine betaine
+ transporter from Bacillus halodurans (504 aa);
+ NP_439848.1|NC_000907 high-affinity choline transport
+ protein (betT) from Haemophilus influenzae (669 aa); etc.
+ SEEMS TO BELONG TO THE BCCT (TC 2.33) FAMILY OF
+ TRANSPORTERS. Mb0941 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE GLYCINE BETAINE TRANSPORT INTEGRAL
+ MEMBRANE PROTEIN BETP"
+ /protein_id="SIT99539.1"
+ /db_xref="GOA:P63696"
+ /db_xref="InterPro:IPR000060"
+ /db_xref="InterPro:IPR018093"
+ /db_xref="UniProtKB/Swiss-Prot:P63696"
+ /translation="MSAKERGDQNAVVDALRSIQPAVFIPASVVIVAMIVVSVVYSSV
+ AENAFVRLNSAITGGVGWWYILVATGFVVFALYCGISRIGTIRLGRDDELPEFSFWAW
+ LAMLFSAGMGIGLVFYGVAEPLSHYLRPPRSRGVPALTDAAANQAMALTVFHWGLHAW
+ AIYVVVGLGMAYMTYRRGRPLSVRWLLEPVVGRGRVEGALGHAVDVIAIVGTLFGVAT
+ SLGFGITQIASGLEYLGWIRVDNWWMVGMIAAITATATASVVSGVSKGLKWLSNINMA
+ LAAALALFVLLLGPTLFLLQSWVQNLGGYVQSLPQFMLRTAPFSHDGWLGDWTIFYWG
+ WWISWAPFVGMFIARISRGRTIREFIGAVLLVPTVIASLWFTIFGDSALLRQRNNGDM
+ LVNGAVDTNTSLFRLLDGLPIGAITSVLAVLVIVFFFVTSSDSGSLVIDILSAGGELD
+ PPKLTRVYWAVLEGVAAAVLLLIGGAGSLTALRTAAIATALPFSIVMVVACYAMTKAF
+ HFDLAATPRLLHVTVPDVVAAGNRRRHDISATLSGLIAVRDVDSGTYIVHPDTGALTV
+ TAPPDPLDDHVFESDRHVTRRNTTSSR"
+ gene 1024677..1025153
+ /locus_tag="BQ2027_MB0942"
+ CDS 1024677..1025153
+ /locus_tag="BQ2027_MB0942"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0942, -, len: 158 aa. Equivalent to Rv0918, len:
+ 158 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 158 aa overlap). Conserved hypothetical
+ protein, similar in part to Q50116 hypothetical protein
+ from Mycobacterium leprae (44 aa), FASTA scores: opt: 132,
+ E(): 0.0055, (65.6% identity in 32 aa overlap). Also some
+ similarity in C-terminus with other hypothetical proteins
+ e.g. NP_289961.1|NC_002655 hypothetical protein from
+ Escherichia coli strain O157:H7 (94 aa); etc. Mb0942 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="link to N-acetyltransferase activity"
+ /protein_id="SIT99540.1"
+ /db_xref="GOA:A0A1R3XWU5"
+ /db_xref="InterPro:IPR010985"
+ /db_xref="InterPro:IPR014795"
+ /db_xref="InterPro:IPR016547"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWU5"
+ /translation="MHRAGAAVTANVWCRAGGIRMAPRPVIPVATQQRLRRQADRQSL
+ GGSGLPALNCTPIRHTIDVMATKPERKTERLAARLTPEQDALIRRAAEAEGTDLTNFT
+ VTAALAHARDVLADRRLFVLTDAAWTEFLAALDRPVSHKPRLEKLFAARSIFDTEG"
+ gene 1025150..1025650
+ /locus_tag="BQ2027_MB0943"
+ CDS 1025150..1025650
+ /locus_tag="BQ2027_MB0943"
+ /note="Mb0943, -, len: 166 aa. Equivalent to Rv0919, len:
+ 166 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 166 aa overlap). Conserved hypothetical
+ protein, some similarity to Q50115 hypothetical protein
+ from Mycobacterium leprae (90 aa), FASTA scores: opt: 243,
+ E(): 5.3e-11, (56.5% identity in 85 aa overlap). Mb0943
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="gcn5-related n-acetyltransferase"
+ /protein_id="SIT99541.1"
+ /db_xref="GOA:A0A1R3XWU2"
+ /db_xref="InterPro:IPR000182"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWU2"
+ /translation="MSGYSAPRRISDADDVTSFSSGEPSLDDYLRKRALANHVQGGSR
+ CFVTCRDGRVVGFYALASGSVAHADAPGRVRRNMPDPVPVILLSRLAVDRKEQGRGLG
+ SHLLRDAIGRCVQAADSIGLRAILVHALHDEARAFYVHFDFEISPTDPLHLMLLMKDA
+ RALIGD"
+ gene complement(1025781..1025853)
+ /locus_tag="BQ2027_ARGT"
+ tRNA complement(1025781..1025853)
+ /locus_tag="BQ2027_ARGT"
+ /product="tRNA-Arg"
+ /note="argT, len: 73 nt. Equivalent to argT, len: 73 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 73 nt overlap). tRNA-Arg, anticodon cct."
+ gene complement(1025924..1027359)
+ /locus_tag="BQ2027_IS1554"
+ mobile_element complement(1025924..1027359)
+ /locus_tag="BQ2027_IS1554"
+ /note="IS1554, len: 1436 nt. Equivalent to IS1554, len:
+ 1436 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(99.9% identity in 1436 nt overlap). Putative IS
+ element bounded by 15 bp inverted repeats."
+ /mobile_element_type="insertion sequence:IS1554"
+ repeat_region 1025924..1025938
+ /note="15 bp perfect inverted repeat, IRR,ATTCGGTGTAAGTGG,
+ flanking IS element IS1554."
+ /rpt_type=INVERTED
+ gene complement(1025963..1027282)
+ /locus_tag="BQ2027_MB0944C"
+ CDS complement(1025963..1027282)
+ /locus_tag="BQ2027_MB0944C"
+ /note="Mb0944c, -, len: 439 aa. Equivalent to Rv0920c,
+ len: 439 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 439 aa overlap). Probable transposase
+ for IS1554, highly similar to others e.g.
+ MTCY441.35|Q45111 transposase from Mycobacterium
+ tuberculosis (419 aa), FASTA scores: opt: 1113, E(): 0,
+ (43.9% identity in 378 aa overlap); etc. Contains
+ transposases mutator family signature (PS01007). Mb0944c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transposase"
+ /protein_id="SIT99542.1"
+ /db_xref="GOA:A0A1R3XYX4"
+ /db_xref="InterPro:IPR001207"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYX4"
+ /translation="MDAAQVIEPAHAGQDVDEAAVAARELSGAERALVGDLVRQARAE
+ GVALTGPDGLLKALTKTVLEAALQEEMTEHLGYDRHAAAGRGSGNSRNGSRNKKVITD
+ ACGQVEIAVPRDRNGTFEPVIVGKRKRRVTDVDRVVLSLYAKGLTTGEIAAHFADVYG
+ VSVSKDTISRITDRVIEEMQAWWSRPLEKVYAAVFIDAIMVKIRDGQVRNRPVYAAIG
+ VDLDGHKDILGMWAGEGDGESAKFWLAVLTELRNRGVKDIFFLVCDGLKGLPDSVSAA
+ FPLATVQTCIIHLIRNTFRYASRKYWDKISVDLKPIYTAASAAEARLRYEEFAEKWGK
+ PYPAITRLWDSAWEEFIPFLDYDVEIRRVPCSTNAIESLNARYRRAVRARGHFPNEQS
+ ALKTLYLVTRSLDPKGTGQTKWAVRWKPALNALAITFADRMPAAEER"
+ repeat_region complement(1027345..1027359)
+ /locus_tag="BQ2027_IS1554"
+ /note="15 bp perfect inverted repeat, IRL,ATTCGGTGTAAGTGG,
+ flanking IS element IS1554."
+ /rpt_type=INVERTED
+ gene 1027507..1029829
+ /locus_tag="BQ2027_IS1535"
+ mobile_element 1027507..1029829
+ /locus_tag="BQ2027_IS1535"
+ /note="IS1535, len: 2323 nt. Equivalent to IS1535, len:
+ 2300 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(100.0% identity in 2300 nt overlap). Putative IS
+ element bounded by 16 bp inverted repeats."
+ /mobile_element_type="insertion sequence:IS1535"
+ repeat_region 1027507..1027555
+ /locus_tag="BQ2027_IS1535"
+ /note="49 bp imperfect inverted repeat,
+ IRL,GGGTTCAGAGCTGTTGCGTGTTGAGTGTGTTTTAGTGTGCGTTAGTGTG,
+ flanking IS element IS1535."
+ /rpt_type=INVERTED
+ repeat_region 1027526..1027542
+ /locus_tag="BQ2027_IS1535"
+ /note="17 bp perfect inverted repeat,
+ IRL,GTTGAGTGTGTTTTAGT, flanking IS element IS1535."
+ /rpt_type=INVERTED
+ gene 1027570..1028151
+ /locus_tag="BQ2027_MB0945"
+ CDS 1027570..1028151
+ /locus_tag="BQ2027_MB0945"
+ /note="Mb0945, -, len: 193 aa. Equivalent to Rv0921, len:
+ 193 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 193 aa overlap). Possible resolvase for
+ IS1535, highly similar to many bacterial resolvases e.g.
+ MTCY274.17c|YX1C_MYCTU Q10831 from Mycobacterium
+ tuberculosis (295 aa), FASTA scores: opt: 537, E():
+ 5.7e-29, (51.8% identity in 166 aa overlap). Presents an
+ helix turn helix motif. Mb0945 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE RESOLVASE"
+ /protein_id="SIT99543.1"
+ /db_xref="GOA:A0A1R3XXT1"
+ /db_xref="InterPro:IPR006119"
+ /db_xref="InterPro:IPR036162"
+ /db_xref="InterPro:IPR041718"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXT1"
+ /translation="MNLADWAESVGVNRHTAYRWFREGTLPVPAERVGRLILVKTAAS
+ ASAAAAGVVLYARVSSHDRRSDLDRQVARLTAWATERDLGVGQVVCEVGSGLNGKRPK
+ LRRILSDPDARVIVVEHRDRLARFGVEHLEAALSAQGRRIVVADPGETTDDLVCDMIE
+ VLTGMCARLYGRRGARNRAMRAVTEAKREPGAG"
+ gene 1028151..1029803
+ /locus_tag="BQ2027_MB0946"
+ CDS 1028151..1029803
+ /locus_tag="BQ2027_MB0946"
+ /note="Mb0946, -, len: 550 aa. Equivalent to Rv0922, len:
+ 550 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 550 aa overlap). Possible transposase
+ for IS1535, similar to many e.g.
+ YX16_MYCTU|Q10809|MTCY274.16c from Mycobacterium
+ tuberculosis (460 aa), FASTA scores: opt 939, E(): 0,
+ (40.6% identity in 465 aa overlap); etc. Mb0946 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible transposase"
+ /protein_id="SIT99544.1"
+ /db_xref="InterPro:IPR001959"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWV7"
+ /translation="MIVRMRSCAQAAKVAEATGGVQLAGKPKPDGTPTFSRYVEIGVD
+ FEAHRPVVESVSVLFELYDGDANSYAATGGPGAQLPSGWMVTAAKFEVEWPADPQRAG
+ LVRSHFGARRKAFNWGLAQVKADLDAKAADPAHESVDWDLKSLRWAWNRAKDDVAPWW
+ AENSKECYSSGLADLAQGLANWKAGKNGTRKGRRVGFPRFKSGRRDPGRVRFTTGTMR
+ IEDDRRTITVPVIGPLRAKENTRRVQRHLVSGRAQILNMTLSQRWGRLFVAVCYALRT
+ PTTRSPLTQPTVRAGMDLGVRTLATVATLDTATGEQTIIEYPNPAPLKATLVARRRAG
+ RELSRRIPGSHGHRAVKAKLARLDRRCVHLRREAAHQLTTELAGTYGQVVIEDLDVAA
+ MKRSMRRRAFRRSVSDAAMGLVAPQLAYKTAKCSGVLTVADRWFASSQIHHGCTSPDG
+ TPCRLQGKGRIDKHLLCPVTGEVVDRDRNAALNLRDWPDNASRGPVGTTAPSAPGPTT
+ TVGTGHGADTGSSGAGGASVRPRPRRAGRGEAKTQTPQGDAA"
+ repeat_region complement(1029782..1029829)
+ /note="49 bp imperfect inverted repeat,
+ IRR,CCGTTGAGTGTGTTTTAGTTGCACTCTCATGCGGCGTCCCCTTTGCGGG,
+ flanking IS element IS1535."
+ /rpt_type=INVERTED
+ repeat_region complement(1029811..1029827)
+ /note="17 bp perfect inverted repeat,
+ IRR,GTTGAGTGTGTTTTAGT, flanking IS element IS1535."
+ /rpt_type=INVERTED
+ gene complement(1029979..1031043)
+ /locus_tag="BQ2027_MB0947C"
+ CDS complement(1029979..1031043)
+ /locus_tag="BQ2027_MB0947C"
+ /note="Mb0947c, -, len: 354 aa. Equivalent to Rv0923c,
+ len: 354 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 354 aa overlap). Conserved hypothetical
+ protein, showing similarity with C-terminal part of
+ AF034138|AF034138_7|yjoB HYPOTHETICAL PROTEIN from
+ Bacillus subtilis (200 aa), FASTA scores: opt: 193, E():
+ 4.2e-05, (32.3% identity in 167 aa overlap). Protein
+ product from Mb0947c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0947c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Phage-related replication protein"
+ /protein_id="SIT99545.1"
+ /db_xref="GOA:A0A1R3XX69"
+ /db_xref="InterPro:IPR008585"
+ /db_xref="InterPro:IPR013024"
+ /db_xref="InterPro:IPR017939"
+ /db_xref="InterPro:IPR036568"
+ /db_xref="InterPro:IPR038128"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX69"
+ /translation="MPDRRHPYFAYGSNLCAHQMASRCPDAGAPRPAVLSDHNWLINQ
+ RGVATVEPFAGNKVHGVLWQLSERDLVRLDSAEGVPVRYRRERLTVHTDDTALPAWVY
+ IDHRVMPGRPRPGYLPRVIDGARHHGLPQRWIDYLHRWDPARWPLPVLPSSRSGPAPQ
+ SLSELLSQPGVIETSQLRSRFGFLAIHGGGLEQVTDLIAERSAEAAGASVYLLRHPDN
+ YPHHLPSARFDPAESARLAEFLDHVDVAVSLHGYDRIGRSTQLLAGGRNRALAAHLAR
+ HIQLPGYRVVTDLAAIPEELRGLHPDNPVNRVRDGGTQLELSIRVRGLGPRSTLPGVG
+ GMSPVTATLVQGLVTAARSW"
+ gene complement(1031044..1033098)
+ /gene="mntH"
+ /locus_tag="BQ2027_MB0948C"
+ CDS complement(1031044..1033098)
+ /gene="mntH"
+ /locus_tag="BQ2027_MB0948C"
+ /standard_name="Nramp; Mramp"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0948c, mntH, len: 685 aa. Similar to Rv0924c
+ (mntH) and Rv0925c, len: 428 aa and 245 aa, from
+ Mycobacterium tuberculosis strain H37Rv, (100% identity in
+ 428 aa overlap and 93.2% identity in 237 aa overlap). mntH
+ (alternative gene name: Nramp, Mramp), H+-dependent
+ divalent cation-transport integral membrane protein (see
+ citations below), equivalent to O69443|MNTH_MYCBO PROBABLE
+ MANGANESE TRANSPORT PROTEIN MNTH (BRAMP) from
+ Mycobacterium bovis (415 aa); and NP_302396.1|NC_002677
+ probable manganese transport protein from Mycobacterium
+ leprae (426 aa). Also similar (but longer 51 aa in
+ N-terminus) to AAA63075.1|U15184 SMF2 protein from
+ Mycobacterium leprae (377 aa), FASTA scores: opt: 1780,
+ E(): 0, (74.5% identity in 376 aa overlap). Also similar
+ to many orthologues of the eukaryotic Nramp (natural
+ resistance-associated macrophage protein), also known as
+ mntH, e.g. NP_456951.1|NC_003198 manganese transport
+ protein MntH from Salmonella enterica subsp. enterica
+ serovar Typhi (413 aa); etc. BELONGS TO THE NRAMP FAMILY.
+ And Conserved hypothetical protein, similar to
+ AL132991|SCF55_19 HYPOTHETICAL PROTEIN from Streptomyces
+ coelicolor (197 aa), FASTA scores: opt: 459, E(): 1.2e-23,
+ (39.3% identity in 201 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv0924c and Rv0925c exist as 2
+ genes. In Mycobacterium bovis, a single base deletion
+ (t-*) leads to a single product. Protein product from
+ Mb0948c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0948c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99546.1"
+ /db_xref="GOA:O69443"
+ /db_xref="InterPro:IPR001046"
+ /db_xref="InterPro:IPR005025"
+ /db_xref="InterPro:IPR029039"
+ /db_xref="UniProtKB/Swiss-Prot:O69443"
+ /translation="MTTTSDQNAAAPPRFDGLRALFINATLKRSPELSHTDGLIERSS
+ GIMREHGVQVDTLRAVDHDIATGVWPDMTEHGWATDEWPALYRRVLDAHILVLCGPIW
+ LGDNSSVMKRVIERLYACSSLLNEDGQYAYYGRAGGCLITGNEDGVKHCAMNVLYSLQ
+ HLGYTIPPQADAGWIGEAGPGPSYLDPGSGGPENDFTNRNTTFMTFNLMHIAQMLRAP
+ AASRPTAINAPSGTPAAGRTSPTPTTDSQRRSRVARWLVAGEFRLLSHLCSRGSKVGE
+ LAQDTRTSLKTSWYLLGPAFVAAIAYVDPGNVAANVSSGAQFGYLLLWVIVAANVMAA
+ LVQYLSAKLGLVTGRSLPEAIGKRMGRPARLAYWAQAEIVAMATDVAEVIGGAIALRI
+ MFNLPLPIGGIITGVVSLLLLTIQDRRGQRLFERVITALLLVIAIGFTASFFVVTPPP
+ NAVLGGLAPRFQGTESVLLAAAIMGATVMPHAVYLHSGLARDRHGHPDPGPQRRRLLR
+ VTRWDVGLAMLIAGGVNAAMLLVAALNMRGRGDTASIEGAYHAVHDTLGATIAVLFAV
+ GLLASGLASSSVGAYAGAMIMQGLLHWSVPMLVRRLITLGPALAILTLGFDPTRTLVL
+ SQVVLSFGIPFAVLPLVKLTGSPAVMGGDTNHRATTWVGWVVAVMVSLLNVMLIYLTV
+ TG"
+ gene complement(1033175..1034251)
+ /locus_tag="BQ2027_MB0949C"
+ CDS complement(1033175..1034251)
+ /locus_tag="BQ2027_MB0949C"
+ /note="Mb0949c, -, len: 358 aa. Equivalent to Rv0926c,
+ len: 358 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 358 aa overlap). Conserved hypothetical
+ protein, similar to Rv1059 CONSERVED HYPOTHETICAL PROTEIN
+ from Mycobacterium tuberculosis (354 aa). Also shows some
+ similarity to AF170923|AF170923_3 dihydrodipicolinate
+ reductase from Mastigocladus laminosus (278 aa), FASTA
+ scores: opt: 170, E(): 0.00088, (25.7% identity in 276 aa
+ overlap). Protein product from Mb0949c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0949c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Oxidoreductase"
+ /protein_id="SIT99547.1"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWU8"
+ /translation="MAIPVVQLGTGNVGVHSLRALIADPEFELTGVWVSSDAKAGKDA
+ AELAGLADSTGVRASTDLNAVLATGPRCAVYNAMADNRLPEALEDYRRILAAGINIVG
+ SGPVFLQYPWQVIPDEIIKPLQDAARAGNSSLYVNGIDPGFANDLLPMALAGTCESIE
+ QIRCMEIVDYATYDSAVVMFDVMGFGKPMDQIPMLLQPGVLSLAWGSVVRQLAAGLGI
+ SLDGVEEMYVREPAPEAFNIASGHIPKGSAAALRFEVLGLVDGVPAVVLEHVTRLRAD
+ LCPEWPQPAQPGGSYRIEISGEPCYAMDICLSSRHGDHNHAGLVATAMRIVNAIPAVV
+ AAEPGIRTTLDLPLITGEGRYAAA"
+ gene complement(1034305..1035096)
+ /locus_tag="BQ2027_MB0950C"
+ CDS complement(1034305..1035096)
+ /locus_tag="BQ2027_MB0950C"
+ /note="Mb0950c, -, len: 263 aa. Equivalent to Rv0927c,
+ len: 263 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 263 aa overlap). Probable short-chain
+ dehydrogenase/reductase (EC 1.-.-.-), similar to various
+ dehydrogenases/reductases, notably 7-alpha-hydroxysteroid
+ dehydrogenases and glucose 1-dehydrogenases e.g.
+ P25529|HDHA_ECOLI 7-alpha-hydroxysteroid dehydrogenase
+ from Escherichia coli (255 aa), FASTA scores: opt: 551,
+ E(): 1e-26, (39.5% identity in 248 aa overlap);
+ NP_252778.1|NC_002516 probable short-chain dehydrogenase
+ from Pseudomonas aeruginosa (253 aa); AAC44307.1|U59433
+ 3-ketoacyl-acyl carrier protein reductase from Bacillus
+ subtilis (246 aa); etc. Also similar to other
+ dehydrogenases from Mycobacterium tuberculosis e.g.
+ MTCY09F9.36, E():1.4e-18; MTCY369.14, E():8e-17;
+ MTCY02B10.14, E():2.5e-14; MTCY09F9.23c, E():1.5e-13;
+ MTCY03C7.07, E():1.9e-13. Contains PS00061 Short-chain
+ dehydrogenases/reductases family signature, and PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ SHORT-CHAIN DEHYDROGENASES/REDUCTASES (SDR) FAMILY.
+ Protein product from Mb0950c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0950c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable short-chain type
+ dehydrogenase/reductase"
+ /protein_id="SIT99548.1"
+ /db_xref="GOA:A0A1R3XWT1"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWT1"
+ /translation="MILDMFRLDDKVAVITGGGRGLGAAIALAFAQAGADVLIASRTS
+ SELDAVAEQIRAAGRRAHTVAADLAHPEVTAQLAGQAVGAFGKLDIVVNNVGGTMPNT
+ LLSTSTKDLADAFAFNVGTAHALTVAAVPLMLEHSGGGSVINISSTMGRLAARGFAAY
+ GTAKAALAHYTRLAALDLCPRVRVNAIAPGSILTSALEVVAANDELRAPMEQATPLRR
+ LGDPVDIAAAAVYLASPAGSFLTGKTLEVDGGLTFPNLDLPIPDL"
+ gene 1035368..1036480
+ /gene="pstS3"
+ /locus_tag="BQ2027_MB0951"
+ CDS 1035368..1036480
+ /gene="pstS3"
+ /locus_tag="BQ2027_MB0951"
+ /standard_name="phoS2"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0951, pstS3, len: 370 aa. Equivalent to Rv0928,
+ len: 370 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 370 aa overlap). pstS3 (previously known
+ as phoS2), phosphate-binding lipoprotein component of
+ inorganic phosphate transport system (see citations
+ below), highly similar to others from Mycobacterium leprae
+ e.g. Q50099|PSTS3|PHOS1 phosphate-binding protein 3
+ precursor (328 aa), FASTA scores: opt: 1772, E(): 0,
+ (79.6% identity in 328 aa overlap); and highly similar to
+ others e.g. AAF74819.1|AF137360_1|AF137360 periplasmic
+ phosphate permease from Mycobacterium avium (369 aa). Also
+ highly similar to Rv0932c|MTCY08D9.07|pstS2
+ PHOSPHATE-BINDING PERIPLASMIC LIPOPROTEIN (370 aa); and
+ Rv0934|pstS1 PHOSPHATE-BINDING PERIPLASMIC LIPOPROTEIN
+ (374 aa) from Mycobacterium tuberculosis (Mycobacterium
+ tuberculosis seems to have three PstS-like proteins,
+ others being Rv0932c and Rv0934c). Contains lipoprotein
+ signature (PS00013) at N-terminus. BELONGS TO FAMILY OF
+ PHOSPHATE RECEPTORS FOR BACTERIAL ABC-TYPE LIPOPROTEIN
+ TRANSPORTERS. Protein product from Mb0951 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0951 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PERIPLASMIC PHOSPHATE-BINDING LIPOPROTEIN PSTS3
+ (PBP-3) (PSTS3) (PHOS1)"
+ /protein_id="SIT99549.1"
+ /db_xref="GOA:P0A5Y3"
+ /db_xref="InterPro:IPR005673"
+ /db_xref="InterPro:IPR024370"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Y3"
+ /translation="MKLNRFGAAVGVLAAGALVLSACGNDDNVTGGGATTGQASAKVD
+ CGGKKTLKASGSTAQANAMTRFVNVFEQACPGQTLNYTANGSGAGISEFNGNQTDFGG
+ SDVPLSKDEAAAAQRRCGSPAWNLPVVFGPIAVTYNLNSVSSLNLDGPTLAKIFNGSI
+ TQWNNPAIQALNRDFTLPGERIHVVFRSDESGTTDNFQRYLQAASNGAWGKGAGKSFQ
+ GGVGEGARGNDGTSAAAKNTPGSITYNEWSFAQAQHLTMANIVTSAGGDPVAITIDSV
+ GQTIAGATISGVGNDLVLDTDSFYRPKRPGSYPIVLATYEIVCSKYPDSQVGTAVKAF
+ LQSTIGAGQSGLGDNGYIPIPDEFKSRLSTAVNAIA"
+ gene 1036493..1037467
+ /gene="pstC2"
+ /locus_tag="BQ2027_MB0952"
+ CDS 1036493..1037467
+ /gene="pstC2"
+ /locus_tag="BQ2027_MB0952"
+ /note="Mb0952, pstC2, len: 324 aa. Equivalent to Rv0929,
+ len: 324 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 324 aa overlap). pstC2,
+ phosphate-transport integral membrane ABC transporter (see
+ citations below), highly similar to others e.g.
+ NP_302394.1|NC_002677 membrane-bound component of
+ phosphate transport from Mycobacterium leprae (319 aa);
+ CAB88474.1|AL353816 phosphate ABC transport system
+ permease protein from Streptomyces coelicolor (336 aa);
+ NP_290359.1| NC_002655 high-affinity phosphate-specific
+ transport system (cytoplasmic membrane component) from
+ Escherichia coli strain O157:H7 (319 aa); etc. Also
+ similar to Rv935|MTCY08D9.04c|PSTC1 PROBABLE TRANSMEMBRANE
+ ABC TRANSPORTER COMPONENT OF PHOSPHATE UPTAKE SYSTEM from
+ Mycobacterium tuberculosis (338 aa). Contains
+ binding-protein-dependent transport systems inner membrane
+ component signature (PS00402). Mb0952 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PHOSPHATE-TRANSPORT INTEGRAL MEMBRANE ABC
+ TRANSPORTER PSTC2"
+ /protein_id="SIT99550.1"
+ /db_xref="GOA:P0A631"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR011864"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/Swiss-Prot:P0A631"
+ /translation="MVTEPLTKPALVAVDMRPARRGERLFKLAASAAGSTIVIAILLI
+ AIFLLVRAVPSLRANHANFFTSTQFDTSDDEQLAFGVRDLFMVTALSSITALVLAVPV
+ AVGIAVFLTHYAPRRLSRPFGAMVDLLAAVPSIIFGLWGIFVLAPKLEPIARFLNRNL
+ GWLFLFKQGNVSLAGGGTIFTAGIVLSVMILPIVTSISREVFRQTPLIQIEAALALGA
+ TKWEVVRMTVLPYGRSGVVAASMLGLGRALGETVAVLVILRSAARPGTWSLFDGGYTF
+ ASKIASAASEFSEPLPTGAYISAGFALFVLTFLVNAAARAIAGGKVNG"
+ gene 1037464..1038378
+ /gene="pstA1"
+ /locus_tag="BQ2027_MB0953"
+ CDS 1037464..1038378
+ /gene="pstA1"
+ /locus_tag="BQ2027_MB0953"
+ /note="Mb0953, pstA1, len: 304 aa. Equivalent to Rv0930,
+ len: 304 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 304 aa overlap). Probable pstA1,
+ phosphate-transport integral membrane ABC transporter (see
+ citation below), highly similar to others e.g.
+ NP_302393.1|NC_002677 membrane-bound component of
+ phosphate transport from Mycobacterium leprae (304 aa);
+ CAB88473.1|AL353816 phosphate ABC transport system
+ permease protein from Streptomyces coelicolor (354 aa)
+ (N-terminus longer); NP_312689.1|NC_002695 phosphate
+ transport system permease protein PstA from Escherichia
+ coli strain O157:H7 (296 aa); etc. Also similar to
+ Rv0936|MTCY08D9.03c|PSTA2 PROBABLE TRANSMEMBRANE ABC
+ TRANSPORTER COMPONENT OF PHOSPHATE UPTAKE SYSTEM from
+ Mycobacterium tuberculosis (301 aa). Mb0953 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHATE-TRANSPORT INTEGRAL MEMBRANE
+ ABC TRANSPORTER PSTA1"
+ /protein_id="SIT99551.1"
+ /db_xref="GOA:A0A1R3XWV3"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR005672"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWV3"
+ /translation="MSPSTSIEALDQPVKPVVFRPLTLRRRIKNSVATTFFFTSFVVA
+ LIPLVWLLWVVIARGWFAVTRSGWWTHSLRGVLPEQFAGGVYHALYGTLVQAGVAAVL
+ AVPLGLMTAVYLVEYGTGRMSRVTTFTVDVLAGVPSIVAALFVFSLWIATLGFQQSAF
+ AVALALVLLMLPVVVRAGEEMLRLVPDELREASYALGVPKWKTIVRIVAPIAMPGIVS
+ GILLSIARVVGETAPVLVLVGYSHSINLDVFHGNMASLPLLIYTELTNPEHAGFLRVW
+ GAALTLIIVVATINLAAAMIRFVATRRR"
+ gene complement(1038385..1039494)
+ /gene="pknDb"
+ /locus_tag="BQ2027_MB0954C"
+ CDS complement(1038385..1039494)
+ /gene="pknDb"
+ /locus_tag="BQ2027_MB0954C"
+ /standard_name="mbk"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0954c, pknDb, len: 369 aa. Equivalent to 3' end
+ of Rv0931c, len: 664 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 369 aa overlap). pknD
+ (alternate gene name: mbk), transmembrane serine/threonine
+ protein kinase (EC 2.7.1.-) (see citations below),
+ equivalent to CAB62227.1|AJ250200 putative
+ serine/threonine protein kinase from Mycobacterium bovis
+ BCG (291 aa); and highly similar in N-terminus to
+ P54744|PKNB_MYCLE probable serine/threonine-specific
+ protein kinase (EC 2.7.1.-) from Mycobacterium leprae (622
+ aa). Also highly similar to others, particularly in
+ N-terminal half e.g. NP_243370.1|NC_002570
+ serine/threonine protein kinase from Bacillus halodurans
+ (664 aa); NP_268044.1|NC_002662 serine/threonine protein
+ kinase from Lactococcus lactis (627 aa); etc. Also highly
+ similar to other serine/threonine protein kinases from
+ Mycobacterium tuberculosis e.g. pknH (626 aa), FASTA
+ scores: opt: 1398, E: 0, (49.3% identity in 540 aa
+ overlap); pknE (566 aa); pknB (626 aa); Rv3524 (343 aa);
+ etc. Contains Hank's kinase subdomain. Contains two
+ transmembrane segments, which flank a highly repetitive
+ region, suggesting a receptor-like anchoring. BELONGS TO
+ THE SER/THR FAMILY OF PROTEIN KINASES. Experimental
+ studies show evidence of auto-phosphorylation on a serine
+ residue. Appears to be co-transcribed with Rv0932c|pstS2.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, pknD exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-t) splits pknD into 2 parts, pknDa and pknDb.
+ Protein product from Mb0954c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0954c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="TRANSMEMBRANE SERINE/THREONINE-PROTEIN KINASE D
+ PKNDb [SECOND PART](PROTEIN KINASE D) (STPK D)"
+ /protein_id="SIT99552.1"
+ /db_xref="GOA:A0A1R3XYY6"
+ /db_xref="InterPro:IPR001258"
+ /db_xref="InterPro:IPR011042"
+ /db_xref="InterPro:IPR013017"
+ /db_xref="InterPro:IPR035016"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYY6"
+ /translation="MLATPADTGLSQSESGIAGAGTGPPTPGAARWSPGDSATVAGPL
+ AADSRGGNWPSQTGHSPAVPNALQASLGHAVPPAGNKRKVWAVVGAAAIVLVAIVAAA
+ GYLVLRPSWSPTQASGQTVLPFTGIDFRLSPSGVAVDSAGNVYVTSEGMYGRVVKLAT
+ GSTGTTVLPFNGLYQPQGLAVDGAGTVYVTDFNNRVVTLAAGSNNQTVLPFDGLNYPE
+ GLAVDTQGAVYVADRGNNRVVKLAAGSKTQTVLPFTGLNDPDGVAVDNSGNVYVTDTD
+ NNRVVKLEAESNNQVVLPFTDITAPWGIAVDEAGTVYVTEHNTNQVVKLLAGSTTSTV
+ LPFTGLNTPLAVAVDSDRTVYVADRGNDRVVKLTS"
+ gene complement(1039505..1040380)
+ /gene="pknDa"
+ /locus_tag="BQ2027_MB0955C"
+ CDS complement(1039505..1040380)
+ /gene="pknDa"
+ /locus_tag="BQ2027_MB0955C"
+ /standard_name="mbk"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0955c, pknDa, len: 291 aa. Equivalent to 5' end
+ of Rv0931c, len: 664 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 276 aa overlap). pknD
+ (alternate gene name: mbk), transmembrane serine/threonine
+ protein kinase (EC 2.7.1.-) (see citations below),
+ equivalent to CAB62227.1|AJ250200 putative
+ serine/threonine protein kinase from Mycobacterium bovis
+ BCG (291 aa); and highly similar in N-terminus to
+ P54744|PKNB_MYCLE probable serine/threonine-specific
+ protein kinase (EC 2.7.1.-) from Mycobacterium leprae (622
+ aa). Also highly similar to others, particularly in
+ N-terminal half e.g. NP_243370.1|NC_002570
+ serine/threonine protein kinase from Bacillus halodurans
+ (664 aa); NP_268044.1|NC_002662 serine/threonine protein
+ kinase from Lactococcus lactis (627 aa); etc. Also highly
+ similar to other serine/threonine protein kinases from
+ Mycobacterium tuberculosis e.g. pknH (626 aa), FASTA
+ scores: opt: 1398, E: 0, (49.3% identity in 540 aa
+ overlap); pknE (566 aa); pknB (626 aa); Rv3524 (343 aa);
+ etc. Contains Hank's kinase subdomain. Contains two
+ transmembrane segments, which flank a highly repetitive
+ region, suggesting a receptor-like anchoring. BELONGS TO
+ THE SER/THR FAMILY OF PROTEIN KINASES. Experimental
+ studies show evidence of auto-phosphorylation on a serine
+ residue. Appears to be co-transcribed with Rv0932c|pstS2.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, pknD exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-t) splits pknD into 2 parts, pknDa and pknDb.
+ Mb0955c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="TRANSMEMBRANE SERINE/THREONINE-PROTEIN KINASE D
+ PKNDa [FIRST PART] (PROTEIN KINASE D) (STPK D)"
+ /protein_id="SIT99553.1"
+ /db_xref="GOA:A0A1R3XXU1"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR008271"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="InterPro:IPR017441"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXU1"
+ /translation="MSDAVPQVGSQFGPYQLLRLLGRGGMGEVYEAEDTRKHRVVALK
+ LISPQYSDNAVFRARMQREADTAGRLTEPHIVPIHDYGEINGQFFVEMRMIDGTSLRA
+ LLKQYGPLTPARAVAIVRQIAAALDAAHANGVTHRDVKPENILVTASDFAYLVDFGIA
+ RAASDPGLTQTGTAVGTYNYMAPERFTGDEVTYRADIYALACVLGECLTGAPPYRADS
+ VERLIAAHLMDPAPQPSQLRPGRVPPALDQVIAKGMAKNPAERFMSAGDLAIAAHDAL
+ NHIRATPGHDDSAAR"
+ gene complement(1040402..1041514)
+ /gene="pstS2"
+ /locus_tag="BQ2027_MB0956C"
+ CDS complement(1040402..1041514)
+ /gene="pstS2"
+ /locus_tag="BQ2027_MB0956C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0956c, pstS2, len: 370 aa. Equivalent to Rv0932c,
+ len: 370 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 370 aa overlap). pstS2,
+ phosphate-binding lipoprotein component of inorganic
+ phosphate transport system (see citations below), highly
+ similar to AAF74819.1|AF137360_1|AF137360 periplasmic
+ phosphate permease from Mycobacterium avium (369 aa);
+ Rv0928|MTCY21C12.22|pstS3 PHOSPHATE-BINDING PERIPLASMIC
+ LIPOPROTEIN from Mycobacterium tuberculosis (370 aa),
+ FASTA scores: opt: 1601, E(): 0, (64.5% identity in 372 aa
+ overlap); and Rv0934|MTCY08D9.05c|pstS1 PHOSPHATE-BINDING
+ PERIPLASMIC LIPOPROTEIN from Mycobacterium tuberculosis
+ (374 aa) (M. tuberculosis seems to have three PstS-like
+ proteins, others being Rv0928 and Rv0934c). Also highly
+ similar to MTCY08D9.05c|P15712|PAB_MYCTU PROTEIN ANTIGEN B
+ PRECURSOR from Mycobacterium tuberculosis (374 aa), FASTA
+ scores: opt: 460, E(): 2.7e-20, (31.2% identity in 375 aa
+ overlap). Contains prokaryotic membrane lipoprotein lipid
+ attachment site (PS00013) at N-terminus so the leader
+ peptide of 22 aa is probably removed. BELONGS TO FAMILY OF
+ PHOSPHATE RECEPTORS FOR BACTERIAL ABC-TYPE LIPOPROTEIN
+ TRANSPORTERS. Appears to be co-transcribed with
+ Rv0931c|pknD|mbk. Protein product from Mb0956c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0956c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PERIPLASMIC PHOSPHATE-BINDING LIPOPROTEIN PSTS2
+ (PBP-2) (PSTS2)"
+ /protein_id="SIT99554.1"
+ /db_xref="GOA:A0A1R3XWW7"
+ /db_xref="InterPro:IPR005673"
+ /db_xref="InterPro:IPR024370"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWW7"
+ /translation="MKFARSGAAVSLLAAGTLVLTACGGGTNSSSSGAGGTSGSVHCG
+ GKKELHSSGSTAQENAMEQFVYAYVRSCPGYTLDYNANGSGAGVTQFLNNETDFAGSD
+ VPLNPSTGQPDRAAERCGSPAWDLPTVFGPIAITYNIKGVSTLNLDGPTTAKIFNGTI
+ TVWNDPQIQALNSGTDLPPTPISVIFRSDKSGTSDNFQKYLDGASNGAWGKGASETFN
+ GGVGVGASGNNGTSALLQTTDGSITYNEWSFAVGKQLNMAQIITSAGPDPVAITTESV
+ GKTIAGAKIMGQGNDLVLDTSSFYRPTQPGSYPIVLATYEIVCSKYPDATTGTAVRAF
+ MQAAIGPGQEGLDQYGSIPLPKSFQAKLAAAVNAIS"
+ gene 1041730..1041945
+ /gene="pstBa"
+ /locus_tag="BQ2027_MB0957"
+ CDS 1041730..1041945
+ /gene="pstBa"
+ /locus_tag="BQ2027_MB0957"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0957, pstBa, len: 71 aa. Equivalent to the 5' end
+ of Rv0933, len: 276 aa, from Mycobacterium tuberculosis
+ strain H37Rv (98.4% identity in 64 aa overlap). pstB,
+ phosphate-transport ATP-binding protein ABC transporter
+ (see citations below), thermostable ATPase, highly similar
+ to others e.g. NP_348334.1|NC_003030 ATPase component of
+ ABC-type phosphate transport system from Clostridium
+ acetobutylicum (249 aa); NP_212352.1|NC_001318 phosphate
+ ABC transporter ATP-binding protein (pstB) from Borrelia
+ burgdorferi (260 aa); NP_390375.1|NC_000964 phosphate ABC
+ transporter (ATP-binding protein) from Bacillus subtilis
+ (269 aa), FASTA scores: opt: 762, E(): 0, (47.7% identity
+ in 243 aa overlap); etc. Also similar to other M.
+ tuberculosis ABC transporters e.g. MTCY253.24, E():
+ 2.5e-15 and MTCY359.14c, E(): 3.4e-15. Contains PS00211
+ ABC transporters family signature, and PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Magnesium or calcium seem to have no influence on the
+ functionality of this enzyme.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, pstB exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-t) splits pstB into 2 parts, pstBa and pstBb.
+ Mb0957 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PHOSPHATE-TRANSPORT PROTEIN ABC TRANSPORTER
+ PSTBa [FIRST PART]"
+ /protein_id="SIT99555.1"
+ /db_xref="GOA:Q7U0Z9"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR005670"
+ /db_xref="InterPro:IPR015850"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0Z9"
+ /translation="MACERLGGQSGAADVDAAAPAMAAVNLTLGFAGKTVLDQVSMGF
+ PARAVTSLMGPTGSGKTTFFAHPKPDE"
+ gene 1041977..1042561
+ /gene="pstBb"
+ /locus_tag="BQ2027_MB0958"
+ CDS 1041977..1042561
+ /gene="pstBb"
+ /locus_tag="BQ2027_MB0958"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0958, pstBb, len: 213 aa. Equivalent to the 3'
+ end of Rv0933, len: 276 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 213 aa
+ overlap). pstB, phosphate-transport ATP-binding protein
+ ABC transporter (see citations below), thermostable
+ ATPase, highly similar to others e.g.
+ NP_348334.1|NC_003030 ATPase component of ABC-type
+ phosphate transport system from Clostridium acetobutylicum
+ (249 aa); NP_212352.1|NC_001318 phosphate ABC transporter
+ ATP-binding protein (pstB) from Borrelia burgdorferi (260
+ aa); NP_390375.1|NC_000964 phosphate ABC transporter
+ (ATP-binding protein) from Bacillus subtilis (269 aa),
+ FASTA scores: opt: 762, E(): 0, (47.7% identity in 243 aa
+ overlap); etc. Also similar to other M. tuberculosis ABC
+ transporters e.g. MTCY253.24, E(): 2.5e-15 and
+ MTCY359.14c, E(): 3.4e-15. Contains PS00211 ABC
+ transporters family signature, and PS00017 ATP/GTP-binding
+ site motif A (P-loop). BELONGS TO THE ATP-BINDING
+ TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS). Magnesium or
+ calcium seem to have no influence on the functionality of
+ this enzyme. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, pstB exists as a
+ single gene. In Mycobacterium bovis, a frameshift due to a
+ single base insertion (*-t) splits pstB into 2 parts,
+ pstBa and pstBb. Protein product from Mb0958 detected
+ using SWATH mass spectrometry. Mb0958 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PHOSPHATE-TRANSPORT PROTEIN ABC TRANSPORTER
+ PSTBb [SECOND PART]"
+ /protein_id="SIT99556.1"
+ /db_xref="GOA:Q7U0Z9"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR005670"
+ /db_xref="InterPro:IPR015850"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0Z9"
+ /translation="MLLGGRSIFNYRDVLEFRRRVGMLFQRPNPFPMSIMDNVLAGVR
+ AHKLVPRKEFRGVAQARLTEVGLWDAVKDRLSDSPFRLSGGQQQLLCLARTLAVNPEV
+ LLLDEPTSALDPTTTEKIEEFIRSLADRLTVIIVTHNLAQAARISDRAALFFDGRLVE
+ EGPTEQLFSSPKHAETARYVAGLSGDVKDAKRGN"
+ gene 1042582..1043706
+ /gene="pstS1"
+ /locus_tag="BQ2027_MB0959"
+ CDS 1042582..1043706
+ /gene="pstS1"
+ /locus_tag="BQ2027_MB0959"
+ /standard_name="phoS1; phoS"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0959, pstS1, len: 374 aa. Equivalent to Rv0934,
+ len: 374 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 374 aa overlap). pstS1 (previously
+ known as phoS1 or phoS), phosphate-binding lipoprotein
+ component of inorganic phosphate transport system (see
+ first, fourth, fifth and sixth citations below), highly
+ similar to Rv0932c|MTCY08D9.07|pstS2 PHOSPHATE-BINDING
+ PERIPLASMIC LIPOPROTEIN from Mycobacterium tuberculosis
+ (370 aa), FASTA scores: opt: 460, E(): 5.9e-19, (31.2%
+ identity in 375 aa overlap); and Rv0928|MTCY21C12.22|pstS3
+ PHOSPHATE-BINDING PERIPLASMIC LIPOPROTEIN from
+ Mycobacterium tuberculosis (374 aa), FASTA scores: opt:
+ 435, E():1.1e-17, (30.0% identity in 380 aa overlap)
+ (Mycobacterium tuberculosis seems to have three PstS-like
+ proteins, others being Rv0932c and Rv0928c). Also highly
+ similar to MTCY08D9.05c|P15712|PAB_MYCTU PROTEIN ANTIGEN B
+ PRECURSOR from Mycobacterium tuberculosis (374 aa), FASTA
+ scores: opt: 2459, E(): 0, (100% identity in 374 aa
+ overlap). Contains a prokaryotic membrane lipoprotein
+ lipid attachment site (PS00013) at the N-terminus so the
+ 23 aa leader peptide sequence is probably removed. BELONGS
+ TO FAMILY OF PHOSPHATE RECEPTORS FOR BACTERIAL ABC-TYPE
+ LIPOPROTEIN TRANSPORTERS. Protein product from Mb0959
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0959 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PERIPLASMIC PHOSPHATE-BINDING LIPOPROTEIN PSTS1
+ (PBP-1) (PSTS1)"
+ /protein_id="SIT99557.1"
+ /db_xref="GOA:A0A1R3XWV8"
+ /db_xref="InterPro:IPR005673"
+ /db_xref="InterPro:IPR024370"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWV8"
+ /translation="MKIRLHTLLAVLTAAPLLLAAAGCGSKPPSGSPETGAGAGTVAT
+ TPASSPVTLAETGSTLLYPLFNLWGPAFHERYPNVTITAQGTGSGAGIAQAAAGTVNI
+ GASDAYLSEGDMAAHKGLMNIALAISAQQVNYNLPGVSEHLKLNGKVLAAMYQGTIKT
+ WDDPQIAALNPGVNLPGTAVVPLHRSDGSGDTFLFTQYLSKQDPEGWGKSPGFGTTVD
+ FPAVPGALGENGNGGMVTGCAETPGCVAYIGISFLDQASQRGLGEAQLGNSSGNFLLP
+ DAQSIQAAAAGFASKTPANQAISMIDGPAPDGYPIINYEYAIVNNRQKDAATAQTLQA
+ FLHWAITDGNKASFLDQAHFQPLPPAVVKLSDALIATISS"
+ gene 1043766..1044782
+ /gene="pstC1"
+ /locus_tag="BQ2027_MB0960"
+ CDS 1043766..1044782
+ /gene="pstC1"
+ /locus_tag="BQ2027_MB0960"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0960, pstC1, len: 338 aa. Equivalent to Rv0935,
+ len: 338 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 338 aa overlap). pstC1,
+ phosphate-transport integral membrane ABC transporter (see
+ citations below), highly similar to others e.g.
+ NP_104768.1|NC_002678|pstC phosphate ABC transporter
+ permease protein from Mesorhizobium loti (327 aa);
+ NP_245372.1|NC_002663|PstC PstC protein from Pasteurella
+ multocida (320 aa); P45191|PSTC_HAEIN PHOSPHATE TRANSPORT
+ SYSTEM PERMEASE from Haemophilus influenza (315 aa), FASTA
+ scores: opt: 667, E(): 0, (36.2% identity in 309 aa
+ overlap); etc. Also similar to Rv0929|MTCY21C12.23|PSTC2
+ PROBABLE TRANSMEMBRANE ABC TRANSPORTER COMPONENT OF
+ PHOSPHATE UPTAKE SYSTEM from Mycobacterium tuberculosis
+ (324 aa), FASTA scores: opt: 487, E(): 4.1e-21, (32.3%
+ identity in 303 aa overlap); and shows slight similarity
+ to MTCY08D9.03c|PSTA2|Rv0936 PROBABLE TRANSMEMBRANE ABC
+ TRANSPORTER COMPONENT OF PHOSPHATE UPTAKE SYSTEM from
+ Mycobacterium tuberculosis (301 aa). Contains
+ binding-protein-dependent transport systems inner membrane
+ comp signature (PS00402). Mb0960 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PHOSPHATE-TRANSPORT INTEGRAL MEMBRANE ABC
+ TRANSPORTER PSTC1"
+ /protein_id="SIT99558.1"
+ /db_xref="GOA:P0A629"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR011864"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/Swiss-Prot:P0A629"
+ /translation="MLARAGEVGRAGPAIRWLGGIGAVIPLLALVLVLVVLVIEAMGA
+ IRLNGLHFFTATEWNPGNTYGETVVTDGVAHPVGAYYGALPLIVGTLATSAIALIIAV
+ PVSVGAALVIVERLPKRLAEAVGIVLELLAGIPSVVVGLWGAMTFGPFIAHHIAPVIA
+ HNAPDVPVLNYLRGDPGNGEGMLVSGLVLAVMVVPIIATTTHDLFRQVPVLPREGAIA
+ LGMSNWECVRRVTLPWVSSGIVGAVVLGLGRALGETMAVAMVSGAVLGAMPANIYATM
+ TTIAATIVSQLDSAMTDSTNFAVKTLAEVGLVLMVITLLTNVAARGMVRRVSRTALPV
+ GRGI"
+ gene 1044784..1045689
+ /gene="pstA2"
+ /locus_tag="BQ2027_MB0961"
+ CDS 1044784..1045689
+ /gene="pstA2"
+ /locus_tag="BQ2027_MB0961"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0961, pstA2, len: 301 aa. Equivalent to Rv0936,
+ len: 301 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 301 aa overlap). pstA2,
+ phosphate-transport integral membrane ABC transporter (see
+ citations below), highly similar to others e.g.
+ NP_442269.1|NC_000911|PstA phosphate transport system
+ permease protein from Synechocystis sp. strain PCC 6803
+ (287 aa); NP_232473.1|NC_002506 phosphate ABC transporter
+ permease protein from Vibrio cholerae (289 aa);
+ P07654|PSTA_ECOLI PHOSPHATE TRANSPORT SYSTEM PERMEASE from
+ Escherichia coli (296 aa), FASTA scores: opt: 464, E():
+ 6.7e-24, (30.5% identity in 282 aa overlap); etc. Also
+ similar to O86345|MTCY21C12.24|PSTA1|Rv0930 PROBABLE
+ TRANSMEMBRANE ABC TRANSPORTER COMPONENT OF PHOSPHATE
+ UPTAKE SYSTEM from Mycobacterium tuberculosis (304 aa),
+ FASTA scores: opt: 369, E(): 6.1e-15, (32.7% identity in
+ 248 aa overlap). Contains binding-protein-dependent
+ transport systems inner membrane comp signature (PS00402).
+ Protein product from Mb0961 detected using SWATH mass
+ spectrometry. Mb0961 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PHOSPHATE-TRANSPORT INTEGRAL MEMBRANE ABC
+ TRANSPORTER PSTA2"
+ /protein_id="SIT99559.1"
+ /db_xref="GOA:P0A627"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR005672"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/Swiss-Prot:P0A627"
+ /translation="MGESAESGSRQLPAMSPPRRSVAYRRKIVDALWWAACVCCLAVV
+ ITPTLWMLIGVVSRAVPVFHWSVLVQDSQGNGGGLRNAIIGTAVLAIGVILVGGTVSV
+ LTGIYLSEFATGKTRSILRGAYEVLSGIPSIVLGYVGYLALVVYFDWGFSLAAGVLVL
+ SVMSIPYIAKATESALAQVPTSYREAAEALGLPAGWALRKIVLKTAMPGIVTGMLVAL
+ ALAIGETAPLLYTAGWSNSPPTGQLTDSPVGYLTYPIWTFYNQPSKSAQDLSYDAALL
+ LIVFLLLLIFIGRLINWLSRRRWDV"
+ gene complement(1045666..1046487)
+ /gene="mku"
+ /locus_tag="BQ2027_MB0962C"
+ CDS complement(1045666..1046487)
+ /gene="mku"
+ /locus_tag="BQ2027_MB0962C"
+ /note="Mb0962c, -, len: 273 aa. Equivalent to Rv0937c,
+ len: 273 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 273 aa overlap). Conserved hypothetical
+ protein, highly similar to others e.g.
+ SC6G9.24c|T35620|AL079356 hypothetical protein from
+ Streptomyces coelicolor (365 aa), FASTA scores: opt: 648,
+ E(): 0, (36.5% identity in 274 aa overlap);
+ Z99110|BSUB0007_223|NP_389224.1|NC_000964 hypothetical
+ proteins from Bacillus subtilis (311 aa), FASTA scores:
+ opt: 623, E(): 1.1e-31, (33.9% identity in 274 aa
+ overlap); O28548|AE000984|AF1726|NP_070554.1|NC_000917
+ conserved hypothetical protein from Archaeoglobus fulgidus
+ (286 aa), FASTA scores: opt: 583, E(): 0, (36.6% identity
+ in 262 aa overlap); etc. Protein product from Mb0962c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0962c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="dna end-binding protein, mku"
+ /protein_id="SIT99560.1"
+ /db_xref="GOA:A0A1R3XWW4"
+ /db_xref="InterPro:IPR006164"
+ /db_xref="InterPro:IPR009187"
+ /db_xref="InterPro:IPR016194"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWW4"
+ /translation="MRAIWTGSIAFGLVNVPVKVYSATADHDIRFHQVHAKDNGRIRY
+ KRVCEACGEVVDYRDLARAYESGDGQMVAITDDDIASLPEERSREIEVLEFVPAADVD
+ PMMFDRSYFLEPDSKSSKSYVLLAKTLAETDRMAIVHFTLRNKTRLAALRVKDFGKRE
+ VMMVHTLLWPDEIRDPDFPVLDQKVEIKPAELKMAGQVVDSMADDFNPDRYHDTYQEQ
+ LQELIDTKLEGGQAFTAEDQPRLLDEPEDVSDLLAKLEASVKARSKANSNVPTPP"
+ gene 1046603..1048882
+ /gene="ligd"
+ /locus_tag="BQ2027_MB0963"
+ CDS 1046603..1048882
+ /gene="ligd"
+ /locus_tag="BQ2027_MB0963"
+ /note="Mb0963, -, len: 759 aa. Equivalent to Rv0938, len:
+ 759 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 759 aa overlap). Possible ATP-dependent
+ DNA ligase (EC 6.5.1.1), with its C-terminus similar to
+ N-terminal parts of many ATP-dependent DNA ligases e.g.
+ NP_250828.1|NC_002516 probable ATP-dependent DNA ligase
+ from Pseudomonas aeruginosa (840 aa);
+ NP_105436.1|NC_002678 ATP-dependent DNA ligase from
+ Mesorhizobium loti (829 aa); CAB92891.1|AL356932 probable
+ ATP-dependent DNA ligase from Streptomyces coelicolor (326
+ aa); etc. The N-terminal half shows similarity with
+ hypothetical proteins from Mycobacterium tuberculosis
+ Rv0269c and Rv3730c; and the C-terminal half with the DNA
+ ligases Rv3731 and Rv3062. Protein product from Mb0963
+ detected using SWATH mass spectrometry. Mb0963 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="atp dependent dna ligase ligd (atp dependent
+ polydeoxyribonucleotide synthase) (thermostable dna
+ ligase) (atp dependent polynucleotide ligase) (sealase)
+ (dna repair enzyme) (dna joinase)"
+ /protein_id="SIT99561.1"
+ /db_xref="GOA:P59971"
+ /db_xref="InterPro:IPR012309"
+ /db_xref="InterPro:IPR012310"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR014144"
+ /db_xref="InterPro:IPR014145"
+ /db_xref="InterPro:IPR014146"
+ /db_xref="InterPro:IPR033649"
+ /db_xref="UniProtKB/Swiss-Prot:P59971"
+ /translation="MGSASEQRVTLTNADKVLYPATGTTKSDIFDYYAGVAEVMLGHI
+ AGRPATRKRWPNGVDQPAFFEKQLALSAPPWLSRATVAHRSGTTTYPIIDSATGLAWI
+ AQQAALEVHVPQWRFVAEPGSGELNPGPATRLVFDLDPGEGVMMAQLAEVARAVRDLL
+ ADIGLVTFPVTSGSKGLHLYTPLDEPVSSRGATVLAKRVAQRLEQAMPALVTSTMTKS
+ LRAGKVFVDWSQNSGSKTTIAPYSLRGRTHPTVAAPRTWAELDDPALRQLSYDEVLTR
+ IARDGDLLERLDADAPVADRLTRYRRMRDASKTPEPIPTAKPVTGDGNTFVIQEHHAR
+ RPHYDFRLERDGVLVSWAVPKNLPDNTSVNHLAIHTEDHPLEYATFEGAIPSGEYGAG
+ KVIIWDSGTYDTEKFHDDPHTGEVIVNLHGGRISGRYALIRTNGDRWLAHRLKNQKDQ
+ KVFEFDNLAPMLATHGTVAGLKASQWAFEGKWDGYRLLVEADHGAVRLRSRSGRDVTA
+ EYPQLRALAEDLADHHVVLDGEAVVLDSSGVPSFSQMQNRGRDTRVEFWAFDLLYLDG
+ RALLGTRYQDRRKLLETLANATSLTVPELLPGDGAQAFACSRKHGWEGVIAKRRDSRY
+ QPGRRCASWVKDKHWNTQEVVIGGWRAGEGGRSSGVGSLLMGIPGPGGLQFAGRVGTG
+ LSERELANLKEMLAPLHTDESPFDVPLPARDAKGITYVKPALVAEVRYSEWTPEGRLR
+ QSSWRGLRPDKKPSEVVRE"
+ gene 1048879..1050813
+ /locus_tag="BQ2027_MB0964"
+ CDS 1048879..1050813
+ /locus_tag="BQ2027_MB0964"
+ /note="Mb0964, -, len: 644 aa. Equivalent to Rv0939, len:
+ 644 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 644 aa overlap). Possible bifunctional
+ enzyme, including 2-hydroxyhepta-2,4-diene-1,7-dioate
+ isomerase activity (EC 5.3.3.-), and cyclase/dehydrase
+ activity (EC undetermined). N-terminal part similar to
+ many isomerases e.g. NP_343861.1|NC_002754
+ 2-hydroxyhepta-2,4-diene-1,7-dioate isomerase (hpcE-1)
+ from Sulfolobus solfataricus (318 aa);
+ NP_068932.1|NC_000917 2-hydroxyhepta-2,4-diene-1,7-dioate
+ isomerase (hpcE-1) from Archaeoglobus fulgidus (324 aa),
+ FASTA scores: opt: 400, E(): 5.8e-15, (33.9% identity in
+ 289 aa overlap); etc. And C-terminal part highly similar
+ to many cyclases/dehydrases e.g. AAK61721.1|AY033994
+ cyclase-like protein from Streptomyces aureofaciens (305
+ aa); CAC44204.1|AL593842 cyclase from Streptomyces
+ coelicolor (297 aa), FASTA scores: opt: 375, E(): 2.7e-26,
+ (35.6% identity in 284 aa overlap); NP_343860.1|NC_002754
+ putative Cyclase/dehydrase from Sulfolobus solfataricus
+ (308 aa); etc. Also similar to Rv2993c HYPOTHETICAL
+ PROTEIN from Mycobacterium tuberculosis. Protein product
+ from Mb0964 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0964 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE BIFUNCTIONAL ENZYME:
+ 2-HYDROXYHEPTA-2,4-DIENE-1,7-DIOATE ISOMERASE (HHDD
+ ISOMERASE) + CYCLASE/DEHYDRASE"
+ /protein_id="SIT99562.1"
+ /db_xref="GOA:A0A1R3XYZ6"
+ /db_xref="InterPro:IPR001279"
+ /db_xref="InterPro:IPR011234"
+ /db_xref="InterPro:IPR036663"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYZ6"
+ /translation="MKWVTYRSDHGERTGVLSGDAIYAMPPDVSLLDLVGRGADGLRT
+ AGERAVRSPAAVVALDEVTLAAPIPRPPSIRDSLCFLDHMRNCQEAMGGGRVLMDTWY
+ RIPAFYFACPSTVLGPYDDAPTAPGSAWQDFELEIAAVIGTSGKDLTVEQAERSIIGY
+ TIFNDWSARDLQMLEGQLRIGQAKGKDSGITLGPYLVTPDELEPYCRGGKLSLRVIAL
+ VNGTVIGSGSTAQMDWSFGEVIAYASRGVTLTPGDVFGSGTVPTCTLVEHLRPPESFP
+ GWLHDGDVVTLQVEGLGETRQTVRTSGTPFPLALRPNPDAEPDRRGVNPAPTRVPFTR
+ GLHEVADRVWAWTLPDGGYGFSNAGLVAGDGASLLVDTLFDLALTREMLAAMKPVTER
+ APITDALITHSNGDHTHGTQLLDRSVRIIAAKGTSEEIEHGPAPEMLARIQTADLGPV
+ ATRYLRDRFGHFDFSGIKLRNADLTFDRDLAIELGGRRVDLLNLGPAHTTADSVVHVA
+ DAGVLFAGDLLFIGCTPIVWAGPIANWVAACDAMIALDAPTVVPGHGPVTGPDGIRAV
+ RGYLAHIAEQAEAAYRKGLSLPEAVETIDLGEYASWLDSERVVVNVYQRYRELDPDTP
+ RQDLLALLVMQAEWAARHCT"
+ gene complement(1051060..1051926)
+ /locus_tag="BQ2027_MB0965C"
+ CDS complement(1051060..1051926)
+ /locus_tag="BQ2027_MB0965C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0965c, -, len: 288 aa. Equivalent to Rv0940c,
+ len: 288 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 288 aa overlap). Possible oxidoreductase
+ (EC 1.-.-.-), similar to hypothetical proteins and
+ oxidoreductases e.g. AAK38097.1|AF323606_3|AF323606
+ putative F420-dependent dehydrogenase from Rhodococcus
+ erythropolis (295 aa); AAG52987.1|AF040570|Rif17 putative
+ alkanal monooxygenase from Amycolatopsis mediterranei (356
+ aa); etc. Also similar to putative oxidoreductases from
+ Mycobacterium tuberculosis such as
+ Rv0953c|P71557|YT21_MYCTU (282 aa), FASTA scores: opt:
+ 311, E(): 3.7e-08, (31.0% identity in 248 aa overlap),
+ Rv3079c (275 aa), Rv0791c (347 aa), etc. Protein product
+ from Mb0965c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0965c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="SIT99563.1"
+ /db_xref="GOA:P64762"
+ /db_xref="InterPro:IPR011251"
+ /db_xref="InterPro:IPR019921"
+ /db_xref="InterPro:IPR036661"
+ /db_xref="UniProtKB/Swiss-Prot:P64762"
+ /translation="MRFSYAEAMTDFTFYIPLAKAAEAAGYSSMTIPDSIAYPFESDS
+ KYPYTPDGNREFMDGKPFIETFVLTAALGAVTTRLRFNFFVLKLPIRPPALVAKQAGS
+ LAALIGNRVGLGVGTSPWPEDYELMGVPFAKRGKRIDECIEIVRGLTTGDYFEFHGEF
+ YDIPKTKMTPAPTQPIPILVGGHADAALRRAARADGWMHGGGDPDELDRLIARVKRLR
+ EEAGKTSPFEIHVISLDGFTVDGVKRLEDKGVTDVIVGFRVPYTMGPDTEPLQTKIRN
+ LEMFAENVIAKV"
+ gene complement(1052011..1052784)
+ /locus_tag="BQ2027_MB0966C"
+ CDS complement(1052011..1052784)
+ /locus_tag="BQ2027_MB0966C"
+ /note="Mb0966c, -, len: 257 aa. Equivalent to Rv0941c,
+ len: 257 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 257 aa overlap). Conserved hypothetical
+ protein, showing some similarity with parts of several
+ hypothetical proteins from Streptomyces coelicolor e.g.
+ AL035161|SC9C7_20 (860 aa), FASTA scores: opt: 197, E():
+ 2.6e-05, (34.2% identity in 114 aa overlap). Protein
+ product from Mb0966c detected using SWATH mass
+ spectrometry. Mb0966c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein serine/threonine kinase"
+ /protein_id="SIT99564.1"
+ /db_xref="InterPro:IPR002645"
+ /db_xref="InterPro:IPR036513"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWX7"
+ /translation="MVAVSTAAKSPTALAIAVRTQDSVVILTADGALDSSSSALLRDS
+ LTRATLEQPSAVIVNVTELQVAEESAWSVFISARWQADFRADVPVLLVCGHRAGRAAV
+ TRTGVARFMPVYPTEKAASKAIGRLARRNFKRSDAQLPANLNSLRESRQLVREWLTQW
+ SRPGLIPVALVVVNVFVENVLKHTGSDPVMRIESDGPTATIAVSDGSSAPAVRLASPP
+ KGIDVSGLAIVAALSRAWGSSPTSSGKTVWAIIGPENQL"
+ gene 1052827..1053105
+ /locus_tag="BQ2027_MB0967"
+ CDS 1052827..1053105
+ /locus_tag="BQ2027_MB0967"
+ /note="Mb0967, -, len: 92 aa. Equivalent to Rv0942, len:
+ 92 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 92 aa overlap). Hypothetical unknown protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99565.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64764"
+ /translation="MGRSATIAMVPKRRDAMNRHSGPILSSGFIASSSNSCPANSLRM
+ PSALAAETLSFDDRAVRRSTHHPGGGYPQKHAINLQSGLCPAYANASR"
+ gene complement(1053163..1054203)
+ /locus_tag="BQ2027_MB0968C"
+ CDS complement(1053163..1054203)
+ /locus_tag="BQ2027_MB0968C"
+ /note="Mb0968c, -, len: 346 aa. Equivalent to Rv0943c,
+ len: 346 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 346 aa overlap). Possible monooxygenase
+ (EC 1.-.-.-), similar in part to others e.g.
+ NP_250229.1|NC_002516 probable flavin-containing
+ monooxygenase from Pseudomonas aeruginosa (527 aa);
+ AAC36351.1|AF090329 cyclohexanone monooxygenase homolog
+ from Pseudomonas fluorescens (437 aa); CAB59668.1|AL132674
+ monooxygenase from Streptomyces coelicolor (519 aa); etc.
+ Also similar to putative monooxygenases from Mycobacterium
+ tuberculosis e.g. Rv1393c|P71662|CY21B4.10C (492 aa).
+ FASTA scores: opt: 129, E(): 8.5e-21, (27.5% identity in
+ 236 aa overlap); Rv0892 (495 aa); Rv3049c (524 aa); etc."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MONOOXYGENASE"
+ /protein_id="SIT99566.1"
+ /db_xref="InterPro:IPR032371"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/Swiss-Prot:P64766"
+ /translation="MAGVSEAERRGHRKLVRFQARRAIGPIRPTSAAWDRDFDPAGKR
+ IAVVGTDAAAAHYISRLSESAASVTVFTQAPRRVVTGVPLWTTRAKRWLRRRTGAEHP
+ AVAWATAAIDALTSSGIRTSDGVEHPVDAIIYGTGFAIADQVGDQTLVGAGGVTIRQA
+ WDDGMEPYLGVAVHGFPNYFFITGPDTAAQARCVVECMKLMERTASRRIEVRRSSQQV
+ FNERAQLKPAQPHRQTGGLEAFDLSSAATEDDQTYDGAATLTLAGARFRVRVRLTGHL
+ DPIDGNYHWQGTVFDSLPETSLTHARAATLTIGGRSAPARITEQTPWGTHSVAGVGPP
+ PYARSGPASATT"
+ gene 1054232..1054708
+ /locus_tag="BQ2027_MB0969"
+ CDS 1054232..1054708
+ /locus_tag="BQ2027_MB0969"
+ /note="Mb0969, -, len: 158 aa. Equivalent to Rv0944, len:
+ 158 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 158 aa overlap). Possible
+ formamidopyrimidine-DNA glycosylase (EC 3.2.2.23), similar
+ to C-terminus of formamidopyrimidine-DNA glycosylases e.g.
+ CAB63194.1|AL133469 putative formamidopyrimidine-DNA
+ glycosylase from Streptomyces coelicolor (287 aa);
+ FPG_LACLA|NP_266509.1|NC_002662 formamidopyrimidine-DNA
+ glycosylase (EC 3.2.2.23) from Lactococcus lactis subsp.
+ lactis (273 aa), FASTA scores: opt: 246, E(): 2.4e-09,
+ (28.9% identity in 142 aa overlap);
+ O50606|FPG_THETH|MUTM|FPG FORMAMIDOPYRIMIDINE-DNA
+ GLYCOSYLASE from Thermus thermophilus (267 aa); etc. Also
+ similar to C-termini of endonucleases or DNA glycosylases
+ of Mycobacterium tuberculosis e.g. Rv3297, Rv2464c,
+ Rv2924c. MAY BE BELONG TO THE FPG FAMILY. Mb0969 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE FORMAMIDOPYRIMIDINE-DNA GLYCOSYLASE
+ (FAPY-DNA GLYCOSYLASE)"
+ /protein_id="SIT99567.1"
+ /db_xref="GOA:A0A1R3XWW9"
+ /db_xref="InterPro:IPR000214"
+ /db_xref="InterPro:IPR010663"
+ /db_xref="InterPro:IPR010979"
+ /db_xref="InterPro:IPR015886"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWW9"
+ /translation="MAGTPQPRALGPDALDVSTDDLAGLLAGNTGRIKTVITDQKVIA
+ GIGNAYSDEILHVAKISPFATAGKLSGAQLTCLHEAMASVLSDAVRRSVGQGAAMLKG
+ EKRSGLRVHARTGLPCPVCGDTVREVSFADKSFQYCPTCQTGGKALADRRMSRLLK"
+ gene 1054714..1055475
+ /locus_tag="BQ2027_MB0970"
+ CDS 1054714..1055475
+ /locus_tag="BQ2027_MB0970"
+ /note="Mb0970, -, len: 253 aa. Equivalent to Rv0945, len:
+ 253 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 253 aa overlap). Probable short-chain
+ dehydrogenase/reductase (EC 1.-.-.-), similar to various
+ dehydrogenases/reductases e.g. NP_346338.1|NC_003028
+ oxidoreductase (short chain dehydrogenase/reductase
+ family) from Streptococcus pneumoniae (253 aa);
+ AAB70845.1|AF019986|PksB from Dictyostelium discoideum
+ (260 aa); AAF86624.1|U87786 clavaldehyde dehydrogenase
+ from Streptomyces clavuligerus (247 aa); P37440|UCPA_ECOLI
+ oxidoreductase from Escherichia coli (285 aa), FASTA
+ scores: opt: 275, E(): 1.1e-12, (33.8% identity in 201 aa
+ overlap); etc. Contains PS00061 Short-chain
+ dehydrogenases/reductases family signature. BELONGS TO THE
+ SHORT-CHAIN DEHYDROGENASES/REDUCTASES (SDR) FAMILY.
+ Protein product from Mb0970 detected using SWATH mass
+ spectrometry. Mb0970 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable short-chain type
+ dehydrogenase/reductase"
+ /protein_id="SIT99568.1"
+ /db_xref="GOA:A0A1R3XWU9"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWU9"
+ /translation="MLTGVTRQKILITGASSGLGAGMARSFAAQGRDLALCARRTDRL
+ TELKAELSQRYPDIKIAVAELDVNDHERVPKVFAELSDEIGGIDRVIVNAGIGKGARL
+ GSGKLWANKATIETNLVAALVQIETALDMFNQRGSGHLVLISSVLGVKGVPGVKAAYA
+ ASKAGVRSLGESLRAEYAQGPIRVTVLEPGYIESEMTAKSASTMLMVDNATGVKALVA
+ AIEREPGRAAVPWWPWAPLVRLMWVLPPRLTRRFA"
+ gene complement(1055491..1057152)
+ /gene="pgi"
+ /locus_tag="BQ2027_MB0971C"
+ CDS complement(1055491..1057152)
+ /gene="pgi"
+ /locus_tag="BQ2027_MB0971C"
+ /note="Mb0971c, pgi, len: 553 aa. Equivalent to Rv0946c,
+ len: 553 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 553 aa overlap). Probable pgi,
+ glucose-6-phosphate isomerase (EC 5.3.1.9), equivalent to
+ NP_301236.1|NC_002677 glucose-6-phosphate isomerase from
+ Mycobacterium leprae (554 aa); and P96803|G6PI_MYCSM
+ GLUCOSE-6-PHOSPHATE ISOMERASE from Mycobacterium smegmatis
+ (442 aa). Also highly similar to others e.g. T36015
+ glucose-6-phosphate isomerase from Streptomyces coelicolor
+ (551 aa); P11537|G6PI_ECOLI|GPI glucose-6-phosphate
+ isomerase from Escherichia coli strains K12 and O157:H7
+ (549 aa), FASTA scores: opt: 1779, E(): 0, (51.4% identity
+ in 554 aa overlap); etc. Contains PS00765 Phosphoglucose
+ isomerase signature 1, and PS00174 Phosphoglucose
+ isomerase signature 2. BELONGS TO THE GPI FAMILY. Protein
+ product from Mb0971c detected using shotgun mass
+ spectrometry. Mb0971c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUCOSE-6-PHOSPHATE ISOMERASE PGI (GPI)
+ (PHOSPHOGLUCOSE ISOMERASE) (PHOSPHOHEXOSE ISOMERASE)
+ (PHI)"
+ /protein_id="SIT99569.1"
+ /db_xref="GOA:P64193"
+ /db_xref="InterPro:IPR001672"
+ /db_xref="InterPro:IPR018189"
+ /db_xref="InterPro:IPR023096"
+ /db_xref="InterPro:IPR035476"
+ /db_xref="InterPro:IPR035482"
+ /db_xref="UniProtKB/Swiss-Prot:P64193"
+ /translation="MTSAPIPDITATPAWDALRRHHDQIGNTHLRQFFADDPGRGREL
+ TVSVGDLYIDYSKHRVTRETLALLIDLARTAHLEERRDQMFAGVHINTSEDRAVLHTA
+ LRLPRDAELVVDGQDVVTDVHAVLDAMGAFTDRLRSGEWTGATGKRISTVVNIGIGGS
+ DLGPVMVYQALRHYADAGISARFVSNVDPADLIATLADLDPATTLFIVASKTFSTLET
+ LTNATAARRWLTDALGDAAVSRHFVAVSTNKRLVDDFGINTDNMFGFWDWVGGRYSVD
+ SAIGLSLMTVIGRDAFADFLAGFHIIDRHFATAPLESNAPVLLGLIGLWYSNFFGAQS
+ RTVLPYSNDLSRFPAYLQQLTMESNGKSTRADGSPVSADTGEIFWGEPGTNGQHAFYQ
+ LLHQGTRLVPADFIGFAQPLDDLPTAEGTGSMHDLLMSNFFAQTQVLAFGKTAEEIAA
+ DGTPAHVVAHKVMPGNRPSTSILASRLTPSVLGQLIALYEHQVFTEGVVWGIDSFDQW
+ GVELGKTQAKALLPVITGAGSPPPQSDSSTDGLVRRYRTERGRAG"
+ gene complement(1057767..1057997)
+ /locus_tag="BQ2027_MB0972C"
+ CDS complement(1057767..1057997)
+ /locus_tag="BQ2027_MB0972C"
+ /note="Mb0972c, -, len: 76 aa. Equivalent to Rv0947c, len:
+ 76 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 76 aa overlap). Probable mycolyl transferase
+ pseudogene (EC 2.-.-.-), similar to part of
+ P31953|A85C_MYCTU|fbpC2 antigen 85-c precursor (85c)
+ (FIBRONECTIN-BINDING PROTEIN C) from Mycobacterium
+ tuberculosis (340 aa), FASTA scores: opt: 213, E(): 2e-08,
+ (69.6% identity in 46 aa overlap). Mb0972c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable mycolyl transferase, pseudogene"
+ /protein_id="SIT99570.1"
+ /translation="MGGSFDRAARARRQLDNLVNVVAAGSTHRLMVPSRSMHRLIKVE
+ FQGGGPHAWYLSDGILARDDYNGRDIHLPVFG"
+ gene complement(1058113..1058430)
+ /locus_tag="BQ2027_MB0973C"
+ CDS complement(1058113..1058430)
+ /locus_tag="BQ2027_MB0973C"
+ /note="Mb0973c, -, len: 105 aa. Equivalent to Rv0948c,
+ len: 105 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 105 aa overlap). Conserved hypothetical
+ protein, equivalent to NP_301237.1|NC_002677 conserved
+ hypothetical protein from Mycobacterium leprae (105 aa).
+ Also similar (except in N-terminus) to
+ SCD63.16c|CAB82023.1|AL161755 hypothetical protein from
+ Streptomyces coelicolor (110 aa); and to N-terminus of two
+ chorismate mutase/prephenate dehydratase. Protein product
+ from Mb0973c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0973c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="chorismate mutase"
+ /protein_id="SIT99571.1"
+ /db_xref="GOA:P64768"
+ /db_xref="InterPro:IPR002701"
+ /db_xref="InterPro:IPR010958"
+ /db_xref="InterPro:IPR036263"
+ /db_xref="InterPro:IPR036979"
+ /db_xref="UniProtKB/Swiss-Prot:P64768"
+ /translation="MRPEPPHHENAELAAMNLEMLESQPVPEIDTLREEIDRLDAEIL
+ ALVKRRAEVSKAIGKARMASGGTRLVHSREMKVIERYSELGPDGKDLAILLLRLGRGR
+ LGH"
+ gene 1058727..1061042
+ /gene="uvrD1"
+ /locus_tag="BQ2027_MB0974"
+ CDS 1058727..1061042
+ /gene="uvrD1"
+ /locus_tag="BQ2027_MB0974"
+ /note="Mb0974, uvrD1, len: 771 aa. Equivalent to Rv0949,
+ len: 771 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 771 aa overlap). Probable uvrD1, ATP
+ dependent DNA helicase (EC 3.6.1.-), equivalent to
+ P_301239.1|NC_002677 putative ATP-dependent DNA helicase
+ from Mycobacterium leprae (778 aa). Also highly similar to
+ others e.g. CAB92660.1|AL356832 from Streptomyces
+ coelicolor (831 aa) (N-terminus longer); P56255|PCRA_BACST
+ from Bacillus stearothermophilus (724 aa);
+ Q10213|YAY5_SCHPO from Schizosaccharomyces pombe (Fission
+ yeast) (887 aa), FASTA scores: opt: 927, E(): 0, (33.5%
+ identity in 659 aa overlap); etc. Also similar to several
+ other UvrD-like proteins in Mycobacterium tuberculosis
+ e.g. Rv3201c, Rv3198c, Rv3202c. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE UVRD
+ SUBFAMILY OF HELICASES. Note that previously known as
+ uvrD. Protein product from Mb0974 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0974
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable atp-dependent dna helicase ii uvrd1"
+ /protein_id="SIT99572.1"
+ /db_xref="GOA:P0A5A4"
+ /db_xref="InterPro:IPR000212"
+ /db_xref="InterPro:IPR005751"
+ /db_xref="InterPro:IPR013986"
+ /db_xref="InterPro:IPR014016"
+ /db_xref="InterPro:IPR014017"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR034739"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5A4"
+ /translation="MSVHATDAKPPGPSPADQLLDGLNPQQRQAVVHEGSPLLIVAGA
+ GSGKTAVLTRRIAYLMAARGVGVGQILAITFTNKAAAEMRERVVGLVGEKARYMWVST
+ FHSTCVRILRNQAALIEGLNSNFSIYDADDSRRLLQMVGRDLGLDIKRYSPRLLANAI
+ SNLKNELIDPHQALAGLTEDSDDLARAVASVYDEYQRRLRAANALDFDDLIGETVAVL
+ QAFPQIAQYYRRRFRHVLVDEYQDTNHAQYVLVRELVGRDSNDGIPPGELCVVGDADQ
+ SIYAFRGATIRNIEDFERDYPDTRTILLEQNYRSTQNILSAANSVIARNAGRREKRLW
+ TDAGAGELIVGYVADNEHDEARFVAEEIDALAEGSEITYNDVAVFYRTNNSSRSLEEV
+ LIRAGIPYKVVGGVRFYERKEIRDIVAYLRVLDNPGDAVSLRRILNTPRRGIGDRAEA
+ CVAVYAENTGVGFGDALVAAAQGKVPMLNTRAEKAIAGFVEMFDELRGRLDDDLGELV
+ EAVLERTGYRRELEASTDPQELARLDNLNELVSVAHEFSTDRENAAALGPDDEDVPDT
+ GVLADFLERVSLVADADEIPEHGAGVVTLMTLHTAKGLEFPVVFVTGWEDGMFPHMRA
+ LDNPTELSEERRLAYVGITRARQRLYVSRAIVRSSWGQPMLNPESRFLREIPQELIDW
+ RRTAPKPSFSAPVSGAGRFGSARPSPTRSGASRRPLLVLQVGDRVTHDKYGLGRVEEV
+ SGVGESAMSLIDFGSSGRVKLMHNHAPVTKL"
+ gene complement(1061123..1062121)
+ /locus_tag="BQ2027_MB0975C"
+ CDS complement(1061123..1062121)
+ /locus_tag="BQ2027_MB0975C"
+ /note="Mb0975c, -, len: 332 aa. Equivalent to Rv0950c,
+ len: 332 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 332 aa overlap). Conserved hypothetical
+ protein, highly similar to AL035500|MLCL373.02c|T45433
+ hypothetical protein from Mycobacterium leprae (343 aa),
+ FASTA scores: opt: 1500, E(): 0, (71.0% identity in 331 aa
+ overlap). C-terminus highly similar to part of various
+ proteins e.g. C-terminal part of
+ NP_441943.1|NC_000911|NlpD lipoprotein from Synechocystis
+ sp (715 aa); N-terminal part of NP_066789.1|NC_002576
+ putative peptidase from Rhodococcus equi (546 aa);
+ C-terminal part of NP_212396.1|NC_001318 conserved
+ hypothetical protein from Borrelia burgdorferi (417 aa);
+ C-terminal part of P33648|NLPD_ECOLI|nlpd lipoprotein from
+ Escherichia coli (379 aa), FASTA scores: opt: 276, E():
+ 2e-10, (29.9% identity in 234 aa overlap); etc. Mb0975c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Phage peptidoglycan binding endopeptidase"
+ /protein_id="SIT99573.1"
+ /db_xref="InterPro:IPR011055"
+ /db_xref="InterPro:IPR016047"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXW1"
+ /translation="MAAIRTPRDRWPHHHRNEVTEIIPLDGFLDGLALYDELDFAELD
+ DLDLGDDCVFDYEAQLLAAPELDDLDDADDLAPEWLVAPTVVLTPEVTPVSRRVGQHR
+ KQPIGAARGRLLISAMAAGAAAAAAHTAIQQSETPRTETVLTAHASALNEGSGSNPPR
+ GVQVIAAQPAASAAVHNAEFARGVAFAEERAEREARLQRPLYVMPTKGIFTSSFGYRW
+ GVLHAGIDLANAIGTPIYAVSDGVVIDAGPTAGYGMWVKLLHADGTVTLYGHVNTTLV
+ SVGERVMAGDQIATMGSRGFSTGPHLHFEVLLGGTERVDPVPWLAKRGLSVGNYTG"
+ gene 1062431..1063594
+ /gene="sucC"
+ /locus_tag="BQ2027_MB0976"
+ CDS 1062431..1063594
+ /gene="sucC"
+ /locus_tag="BQ2027_MB0976"
+ /note="Mb0976, sucC, len: 387 aa. Equivalent to Rv0951,
+ len: 387 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 387 aa overlap). Probable sucC,
+ succinyl-Coa synthetase, beta chain (EC 6.2.1.5),
+ equivalent to AL035500|MLCL373_3|NP_301241.1|NC_002677
+ succinyl-CoA synthase [beta] chain from Mycobacterium
+ leprae (393 aa), FASTA score: (86.7% identity in 391 aa
+ overlap). Also highly similar to others e.g.
+ AB92671.1|AL356832 succinyl-CoA synthetase beta chain from
+ Streptomyces coelicolor (394 aa); P25126|SUCC_THEFL
+ SUCCINYL-COA SYNTHETASE BETA CHAIN from Thermus aquaticus
+ (378 aa); P07460|SUCC_ECOLI succinyl-CoA synthetase beta
+ chain from Escherichia coli (388 aa), FASTA scores: opt:
+ 933, E(): 0, (41.0% identity in 390 aa overlap); etc.
+ Protein product from Mb0976 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0976 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUCCINYL-COA SYNTHETASE (BETA CHAIN)
+ SUCC (SCS-BETA)"
+ /protein_id="SIT99574.1"
+ /db_xref="GOA:Q7U0Z1"
+ /db_xref="InterPro:IPR005809"
+ /db_xref="InterPro:IPR005811"
+ /db_xref="InterPro:IPR011761"
+ /db_xref="InterPro:IPR013650"
+ /db_xref="InterPro:IPR013815"
+ /db_xref="InterPro:IPR016102"
+ /db_xref="InterPro:IPR017866"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0Z1"
+ /translation="MDLFEYQAKELFAKHNVPSTPGRVTDTAEGAKAIATEIGRPVMV
+ KAQVKIGGRGKAGGVKYAATPQDAYEHAKNILGLDIKGHIVKKLLVAEASDIAEEYYL
+ SFLLDRANRTYLAMCSVEGGMEIEEVAATKPERLAKVPVNAVKGVDLDFARSIAEQGH
+ LPAEVLDTAAVTIAKLWELFVAEDATLVEVNPLVRTPDHKILALDAKITLDGNADFRQ
+ PGHAEFEDRAATDPLELKAKEHDLNYVKLDGQVGIIGNGAGLAMSTLDVVAYAGEKHG
+ GVKPANFLDIGGGASAEVMAAGLDVVLGDQQVKSVFVNVFGGITSCDAVATGIVKALG
+ MLGDEANKPLVVRLDGNNVEEGRRILTEANHPLVTLVATMDEAADKAAELASA"
+ gene 1063607..1064518
+ /gene="sucD"
+ /locus_tag="BQ2027_MB0977"
+ CDS 1063607..1064518
+ /gene="sucD"
+ /locus_tag="BQ2027_MB0977"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0977, sucD, len: 303 aa. Equivalent to Rv0952,
+ len: 303 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 303 aa overlap). Probable sucD,
+ succinyl-CoA synthetase, alpha chain (EC 6.2.1.5),
+ equivalent to AL035500|MLCL373_4|NP_301242.1|NC_002677
+ succinyl-CoA synthase [alpha] chain from Mycobacterium
+ leprae (300 aa), FASTA score: (86.3% identity in 300 aa
+ overlap). Also highly similar to others e.g.
+ CAB92672.1|AL356832 from Streptomyces coelicolor (294 aa);
+ P53591|SUCD_COXBU from Escherichia coli (288 aa), FASTA
+ scores: opt: 855, E(): 0, (53.8% identity in 286 aa
+ overlap); etc. Contains PS00399 ATP-citrate lyase and
+ succinyl-CoA ligases active site, and PS00017
+ ATP/GTP-binding site motif A (P-loop). Protein product
+ from Mb0977 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0977 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUCCINYL-COA SYNTHETASE (ALPHA CHAIN)
+ SUCD (SCS-ALPHA)"
+ /protein_id="SIT99575.1"
+ /db_xref="GOA:Q7U0Z0"
+ /db_xref="InterPro:IPR003781"
+ /db_xref="InterPro:IPR005810"
+ /db_xref="InterPro:IPR005811"
+ /db_xref="InterPro:IPR016102"
+ /db_xref="InterPro:IPR017440"
+ /db_xref="InterPro:IPR033847"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0Z0"
+ /translation="MTHMSIFLSRDNKVIVQGITGSEATVHTARMLRAGTQIVGGVNA
+ RKAGTTVTHEDKGGRLIKLPVFGSVAEAMEKTGADVSIIFVPPTFAKDAIIEAIDAEI
+ PLLVVITEGIPVQDTAYAWAYNLEAGHKTRIIGPNCPGIISPGQSLAGITPANITGPG
+ PIGLVSKSGTLTYQMMFELRDLGFSTAIGIGGDPVIGTTHIDAIEAFEKDPDTKLIVM
+ IGEIGGDAEERAADFIKTNVSKPVVGYVAGFTAPEGKTMGHAGAIVSGSSGTAAAKQE
+ ALEAAGVKVGKTPSATAALAREILLSL"
+ gene complement(1064581..1065429)
+ /locus_tag="BQ2027_MB0978C"
+ CDS complement(1064581..1065429)
+ /locus_tag="BQ2027_MB0978C"
+ /note="Mb0978c, -, len: 282 aa. Equivalent to Rv0953c,
+ len: 282 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 282 aa overlap). Possible oxidoreductase
+ (EC 1.-.-.-), equivalent to CAA48222.1|X68102 hypothetical
+ protein from Mycobacterium avium subsp. paratuberculosis
+ (166 aa). Similar to several hypothetical proteins and
+ oxidoreductases e.g. AAK38097.1|AF323606_3|AF323606
+ putative F420-dependent dehydrogenase from Rhodococcus
+ erythropolis (295 aa); NP_070025.1|NC_000917
+ N5,N10-methylenetetrahydromethanopterin reductase (mer-2)
+ from Archaeoglobus fulgidus (348 aa); etc. Also similar to
+ several hypothetical proteins and oxidoreductases from
+ Mycobacterium tuberculosis e.g.
+ Rv2161c|O06216|Z95388|MTCY270.07 (288 aa), FASTA scores:
+ opt: 633, E(): 0, (40.4% identity in 277 aa overlap),
+ Rv3079c (275 aa), Rv0791c (347 aa), etc. Contains PS00201
+ Flavodoxin signature. Protein product from Mb0978c
+ detected using SWATH mass spectrometry. Mb0978c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="SIT99576.1"
+ /db_xref="GOA:P64770"
+ /db_xref="InterPro:IPR011251"
+ /db_xref="InterPro:IPR019921"
+ /db_xref="InterPro:IPR036661"
+ /db_xref="UniProtKB/Swiss-Prot:P64770"
+ /translation="MHYGLVLFTSDRGITPAAAARLAESHGFRTFYVPEHTHIPVKRQ
+ AAHPTTGDASLPDDRYMRTLDPWVSLGAASAVTSRIRLATAVALPVEHDPITLAKSIA
+ TLDHLSHGRVSVGVGFGWNTDELVDHGVPPGRRRTMLREYLEAMRALWTQEEACYDGE
+ FVKFGPSWAWPKPVQPHIPVLVGAAGTEKNFKWIARSADGWITTPRDVDIDEPVKLLQ
+ DIWAAAGRDGLPQIVALDVKPVPDKLARWAELGVTEVLFGMPDRSADDAAAYVERLAA
+ KLACCV"
+ gene 1065594..1066505
+ /locus_tag="BQ2027_MB0979"
+ CDS 1065594..1066505
+ /locus_tag="BQ2027_MB0979"
+ /note="Mb0979, -, len: 303 aa. Equivalent to Rv0954, len:
+ 303 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 303 aa overlap). Probable conserved
+ transmembrane protein, highly similar to 34KD_MYCPA|Q04959
+ 34 kd antigenic protein from Mycobacterium
+ paratuberculosis (298 aa), FASTA scores: opt: 1023, E():
+ 7.2e-36, (59.3% identity in 305 aa overlap);
+ AAC69251.1|U82111 34 kDa antigen precursor from
+ Mycobacterium leprae (336 aa); and AL035500|MLCL373.06
+ hypothetical membrane protein from Mycobacterium leprae
+ (297 aa), FASTA score: (55.6% identity in 315 aa overlap).
+ Protein product from Mb0979 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb0979 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99577.1"
+ /db_xref="GOA:P65638"
+ /db_xref="InterPro:IPR035166"
+ /db_xref="UniProtKB/Swiss-Prot:P65638"
+ /translation="MTYSPGNPGYPQAQPAGSYGGVTPSFAHADEGASKLPMYLNIAV
+ AVLGLAAYFASFGPMFTLSTELGGGDGAVSGDTGLPVGVALLAALLAGVALVPKAKSH
+ VTVVAVLGVLGVFLMVSATFNKPSAYSTGWALWVVLAFIVFQAVAAVLALLVETGAIT
+ APAPRPKFDPYGQYGRYGQYGQYGVQPGGYYGQQGAQQAAGLQSPGPQQSPQPPGYGS
+ QYGGYSSSPSQSGSGYTAQPPAQPPAQSGSQQSHQGPSTPPTGFPSFSPPPPVSAGTG
+ SQAGSAPVNYSNPSGGEQSSSPGGAPV"
+ gene 1066545..1067912
+ /locus_tag="BQ2027_MB0980"
+ CDS 1066545..1067912
+ /locus_tag="BQ2027_MB0980"
+ /note="Mb0980, -, len: 455 aa. Equivalent to Rv0955, len:
+ 455 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 455 aa overlap). Probable conserved
+ integral membrane protein, highly similar to
+ AL035500|MLCL373_6 putative membrane protein from
+ Mycobacterium leprae (430 aa), FASTA score: (75.9%
+ identity in 419 aa overlap); and
+ AAL05878.1|AF411607_2|AF411607 unknown protein from
+ Mycobacterium avium subsp. paratuberculosis (409 aa).
+ Mb0980 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99578.1"
+ /db_xref="GOA:P64772"
+ /db_xref="UniProtKB/Swiss-Prot:P64772"
+ /translation="MNRVSASADDRAAGARPARDLVRVAFGPGVVALGIIAAVTLLQL
+ LIANSDMTGAWGAIASMWLGVHLVPISIGGRALGVMPLLPVLLMVWATARSTARATSP
+ QSSGLVVRWVVASALGGPLLMAAIALAVIHDASSVVTELQTPSALRAFTSVLVVHSVG
+ AATGVWSRVGRRALAATALPDWLHDSMRAAAAGVLALLGLSGVVTAGSLVVHWATMQE
+ LYGITDSIFGQFSLTVLSVLYAPNVIVGTSAIAVGSSAHIGFATFSSFAVLGGDIPAL
+ PILAAAPTPPLGPAWVALLIVGASSGVAVGQQCARRALPFVAAMAKLLVAAVAGALVM
+ AVLGYGGGGRLGNFGDVGVDEGALVLGVLFWFTFVGWVTVVIAGGISRRPKRLRPAPP
+ VELDADESSPPVDMFDGAASEQPPASVAEDVPPSHDDIANGLKAPTADDEALPLSDEP
+ PPRAD"
+ gene 1068028..1068675
+ /gene="purN"
+ /locus_tag="BQ2027_MB0981"
+ CDS 1068028..1068675
+ /gene="purN"
+ /locus_tag="BQ2027_MB0981"
+ /note="Mb0981, purN, len: 215 aa. Equivalent to Rv0956,
+ len: 215 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 215 aa overlap). Probable purN,
+ 5'-phosphoribosylglycinamide formyltransferase (EC
+ 2.1.2.2), equivalent to
+ AAF05726.1|AF191543_1|AF191543|PurN
+ phosphoribosylglycinamide formyltransferase from
+ Mycobacterium avium subsp. paratuberculosis (209 aa); and
+ AL035500|MLCL373_7 from Mycobacterium leprae (215 aa),
+ FASTA score: (79.4% identity in 214 aa overlap). Also
+ highly similar to others e.g. BAA89443.1|AB003159 from
+ Corynebacterium ammoniagenes (199 aa);
+ NP_241498.1|NC_002570 from Bacillus halodurans (188 aa);
+ P08179|PUR3_ECOLI|B2500 from Escherichia coli strain K12
+ (212 aa), FASTA scores: opt: 380, E(): 2.4e-18, (36.6%
+ identity in 183 aa overlap); C-terminus of
+ P16340|PUR2_DROPS TRIFUNCTIONAL PURINE BIOSYNTHETIC
+ PROTEIN ADENOSINE-3 from Drosophila pseudoobscura (Fruit
+ fly) (1364 aa); etc. Protein product from Mb0981 detected
+ using shotgun mass spectrometry. Mb0981 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 5'-PHOSPHORIBOSYLGLYCINAMIDE
+ FORMYLTRANSFERASE PURN (GART) (GAR TRANSFORMYLASE)
+ (5'-PHOSPHORIBOSYLGLYCINAMIDE TRANSFORMYLASE)"
+ /protein_id="SIT99579.1"
+ /db_xref="GOA:A0A1R3XWY5"
+ /db_xref="InterPro:IPR002376"
+ /db_xref="InterPro:IPR004607"
+ /db_xref="InterPro:IPR036477"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWY5"
+ /translation="MQEPLRVPPSAPARLVVLASGTGSLLRSLLDAAVGDYPARVVAV
+ GVDRECRAAEIAAEASVPVFTVRLADHPSRDAWDVAITAATAAHEPDLVVSAGFMRIL
+ GPQFLSRFYGRTLNTHPALLPAFPGTHGVADALAYGVKVTGATVHLVDAGTDTGPILA
+ QQPVPVLDGDDEETLHERIKVTERRLLVAAVAALATHGVTVVGRTATMGRKVTIG"
+ gene 1068672..1070243
+ /gene="purH"
+ /locus_tag="BQ2027_MB0982"
+ CDS 1068672..1070243
+ /gene="purH"
+ /locus_tag="BQ2027_MB0982"
+ /note="Mb0982, purH, len: 523 aa. Equivalent to Rv0957,
+ len: 523 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 523 aa overlap). Probable purH,
+ bifunctional purine biosynthesis protein including
+ 5'-phosphoribosyl-5-aminoimidazole-4-carboxamide
+ formyltransferase (EC 2.1.2.3) and inosine-monophosphate
+ (IMP) cyclohydrolase (EC 3.5.4.10), equivalent to
+ AL035500|MLCL373_8 putative
+ phosphoribosylaminoimidazolecarboxamide formyltransferase
+ from Mycobacterium leprae (527 aa), FASTA score: (88.1%
+ identity in 520 aa overlap); and
+ AF05727.1|AF191543_2|AF191543|PurH from Mycobacterium
+ avium subsp. paratuberculosis (527 aa). Also highly
+ similar to others e.g. CAB92677.1|AL356832 bifunctional
+ purine biosynthesis protein from Streptomyces coelicolor
+ (523 aa); NP_388534.1|NC_000964
+ phosphoribosylaminoimidazole carboxy formyl
+ formyltransferase + inosine-monophosphate cyclohydrolase
+ from Bacillus subtilis (512 aa); P15639|PUR9_ECOLI
+ phosphoribosylaminoimidazolecarboxamide formyltransferase
+ from Escherichia coli (529 aa), FASTA scores: opt: 1147,
+ E(): 0, (44.8% identity in 533 aa overlap); etc. BELONGS
+ TO THE PURH FAMILY. Protein product from Mb0982 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0982 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BIFUNCTIONAL PURINE BIOSYNTHESIS
+ PROTEIN PURH: PHOSPHORIBOSYLAMINOIMIDAZOLECARBOXAMIDE
+ FORMYLTRANSFERASE (AICAR TRANSFORMYLASE)
+ (5'-PHOSPHORIBOSYL-5-AMINOIMIDAZOLE-4-CARBOXAMIDE
+ FORMYLTRANSFERASE) + INOSINEMONOPHOSPHATE CYCLOHYDROLASE
+ (IMP CYCLOHYDROLASE) (INOSINICASE) (IMP SYNTHETASE)
+ (ATIC)"
+ /protein_id="SIT99580.1"
+ /db_xref="GOA:P67542"
+ /db_xref="InterPro:IPR002695"
+ /db_xref="InterPro:IPR011607"
+ /db_xref="InterPro:IPR016193"
+ /db_xref="InterPro:IPR024051"
+ /db_xref="InterPro:IPR036914"
+ /db_xref="UniProtKB/Swiss-Prot:P67542"
+ /translation="MSTDDGRRPIRRALISVYDKTGLVDLAQGLSAAGVEIISTGSTA
+ KTIADTGIPVTPVEQLTGFPEVLDGRVKTLHPRVHAGLLADLRKSEHAAALEQLGIEA
+ FELVVVNLYPFSQTVESGASVDDCVEQIDIGGPAMVRAAAKNHPSAAVVTDPLGYHGV
+ LAALRAGGFTLAERKRLASLAFQHIAEYDIAVASWMQQTLAPEHPVAAFPQWFGRSWR
+ RVAMLRYGENPHQQAALYGDPTAWPGLAQAEQLHGKDMSYNNFTDADAAWRAAFDHEQ
+ TCVAIIKHANPCGIAISSVSVADAHRKAHECDPLSAYGGVIAANTEVSVEMAEYVSTI
+ FTEVIVAPGYAPGALDVLARKKNIRVLVAAEPLAGGSELRPISGGLLIQQSDQLDAHG
+ DNPANWTLATGSPADPATLTDLVFAWRACRAVKSNAIVIAADGATVGVGMGQVNRVDA
+ ARLAVERGGERVRGAVAASDAFFPFPDGLETLAAAGVTAVVHPGGSVRDEEVTEAAAK
+ AGVTLYLTGARHFAH"
+ gene 1070350..1071729
+ /locus_tag="BQ2027_MB0983"
+ CDS 1070350..1071729
+ /locus_tag="BQ2027_MB0983"
+ /note="Mb0983, -, len: 459 aa. Equivalent to Rv0958, len:
+ 459 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 459 aa overlap). Possible magnesium
+ chelatase (EC 4.99.1.-), similar to others (especially in
+ N-terminal parts) e.g. NP_296313.1|NC_001263|AE002088_10
+ putative magnesium protoporphyrin chelatase from
+ Deinococcus radiodurans (487 aa), FASTA scores: opt: 1148,
+ E(): 0, (42.4% identity in 450 aa overlap);
+ Q44498|CHLI_ANAVA MAGNESIUM-CHELATASE SUBUNIT CHLI from
+ Anabaena variabilis (338 aa); T31460 probable magnesium
+ chelatase (EC 4.99.1.-) chain I bchI from Heliobacillus
+ mobilis (363 aa); etc. Contains PS00017 ATP/GTP-binding
+ site motif A (P-loop) Protein product from Mb0983 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0983 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MAGNESIUM CHELATASE"
+ /protein_id="SIT99581.1"
+ /db_xref="GOA:A0A1R3XWY0"
+ /db_xref="InterPro:IPR002078"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWY0"
+ /translation="MSPSNLPRTVGELRAAGHRERGVKQEIRENLLTALADGDNVWPG
+ ILGFDDTVIPQVERALIAGHDFVLLGERGQGKTRLLRALAGLLDEWTPVIAGAELGEH
+ PYTPITPESIRRAAQLGDDLPVAWKHRSERYTEKLATPDTSVADLVGDVDPIKVAEGR
+ SLGDPETIAYGLIPRAHRGIVAVNELPDLAERIQVSMLNVMEERDIQVRGYTLRLPLD
+ VLVVASANPEDYTNRGRIITPIKDRFGAEIRTHYPLELEAEMGVIVQEAHLSAQVPDY
+ LMQVLARFARYLRESRSIDQRSGVSARFAIAAAETVAAAARHRGAVLGETDPVARVVD
+ LGTVIDVLRGKLEFESGEEGREQAVLEHLLRRATADTASRVLGGIDVGSLVTAVEGGS
+ AVTTGERVSAKDVLAAVPGLPVVDRIARKLGAESEGERAAALELALEALYLAKRVDKV
+ CGEGQTVYG"
+ gene 1071722..1073740
+ /locus_tag="BQ2027_MB0984"
+ CDS 1071722..1073740
+ /locus_tag="BQ2027_MB0984"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0984, -, len: 672 aa. Equivalent to Rv0959, len:
+ 672 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 672 aa overlap). Conserved hypothetical
+ protein, similar to AE002069|AE002069_12 hypothetical
+ protein from Deinococcus radiodurans (403 aa), FASTA
+ scores: opt: 395, E(): 1.3e-15, (26.8% identity in 426 aa
+ overlap). Contains a single copy at the N-terminus of a
+ short repeat found three times in the M. tuberculosis ORF
+ O33341|MTV003.05c|AL008883. Protein product from Mb0984
+ detected using SWATH mass spectrometry. Mb0984 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG019045: long form Mg-chelase associated
+ protein with vWA domain"
+ /protein_id="SIT99582.1"
+ /db_xref="InterPro:IPR002035"
+ /db_xref="InterPro:IPR036465"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5D8"
+ /translation="MAKSDGDDPLRPASPRLRSSRRHSLRYSAYTGGPDPLAPPVDLR
+ DALEQIGQDVMAGASPRRALSELLRRGTRNLTGADRLAAEVNRRRRELLRRNNLDGTL
+ QEIKKLLDEAVLAERKELARALDDDARFAELQLDALPASPAKAVQELAEYRWRSGQAR
+ EKYEQIKDLLGRELLDQRFAGMKQALAGATDDDRRRVTEMLDDLNDLLDKHARGEDTQ
+ RDFDEFMTKHGEFFPENPRNVEELLDSLAKRAAAAQRFRNSLSQEQRDELDALAQQAF
+ GSPALMRALDRLDAHLQAARPGEDWTGSQQFSGDNPFGMGEGTQALADIAELEQLAEQ
+ LSQSYPGASMDDVDLDALARQLGDQAAVDARTLAELERALVNQGFLDRGSDGQWRLSP
+ KAMRRLGETALRDVAQQLSGRHGERDHRRAGAAGELTGATRPWQFGDTEPWHVARTLT
+ NAVLRQAAAVHDRIRITVEDVEVAETETRTQAAVALLVDTSFSMVMENRWLPMKRTAL
+ ALHHLVCTRFRSDALQIIAFGRYARTVTAAELTGLAGVYEQGTNLHHALALAGRHLRR
+ HAGAQPVVLVVTDGEPTAHLEDFDGDGTSVFFDYPPHPRTIAHTVRGFDDMARLGAQV
+ TIFRLGSDPGLARFIDQVARRVQGRVVVPDLDGLGAAVVGDYLRFRRR"
+ gene 1073794..1074015
+ /gene="vapB9"
+ /locus_tag="BQ2027_MB0984A"
+ CDS 1073794..1074015
+ /gene="vapB9"
+ /locus_tag="BQ2027_MB0984A"
+ /note="Mb0984A, len: 73 aa. Equivalent to Rv0959A len: 73
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 73 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Possible vapB9,
+ antitoxin, part of toxin-antitoxin (TA) operon with Rv0960
+ (See Arcus et al., 2005; Pandey and Gerdes, 2005). Weakly
+ similar to others in Mycobacterium tuberculosis e.g.
+ Rv1721c Protein product from Mb0984A detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0984A found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible antitoxin VapB9"
+ /protein_id="SIT99583.1"
+ /db_xref="GOA:A0A1R3XXX2"
+ /db_xref="InterPro:IPR010985"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXX2"
+ /translation="MKTLYLRNVPDDVVERLERLAELAKTSVSAVAVRELTEASRRAD
+ NPALLGDLPDIGIDTTELIGGIDAERAGR"
+ gene 1074012..1074395
+ /gene="vapc9"
+ /locus_tag="BQ2027_MB0985"
+ CDS 1074012..1074395
+ /gene="vapc9"
+ /locus_tag="BQ2027_MB0985"
+ /note="Mb0985, -, len: 127 aa. Equivalent to Rv0960, len:
+ 127 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 127 aa overlap). Conserved hypothetical
+ protein, similar to other Mycobacterium tuberculosis
+ hypothetical proteins e.g. Rv0065|MTV030.08 (133 aa),
+ FASTA scores: E(): 1.5e-14, (38.3% identity in 128 aa
+ overlap), Rv1720c (129 aa), and Rv0549c (137 aa). Protein
+ product from Mb0985 detected using SWATH mass
+ spectrometry. Mb0985 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc9"
+ /protein_id="SIT99584.1"
+ /db_xref="GOA:P64774"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/Swiss-Prot:P64774"
+ /translation="MIVVDASAALAALLNDGQARQLIAAERLHVPHLVDSEIASGLRR
+ LAQRDRLGAADGRRALQTWRRLAVTRYPVVGLFERIWEIRANLSAYDASYVALAEALN
+ CALVTADLRLSDTGQAQCPITVVPR"
+ gene 1074541..1074888
+ /locus_tag="BQ2027_MB0986"
+ CDS 1074541..1074888
+ /locus_tag="BQ2027_MB0986"
+ /note="Mb0986, -, len: 115 aa. Equivalent to Rv0961, len:
+ 115 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 115 aa overlap). Probable integral
+ membrane protein. Mb0986 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99585.1"
+ /db_xref="GOA:P64776"
+ /db_xref="UniProtKB/Swiss-Prot:P64776"
+ /translation="MRVPSQWMISSRVTVAWNIVGYLVYAALAFVGGFAVWFSLFFAM
+ ATDGCHDSACDASYHVFPAMVTMWIGVGAVLLLTLVVMVRNSSRGNVVIGWPFVGLLA
+ LGLVYVAADAVLH"
+ gene complement(1074907..1075581)
+ /gene="lprP"
+ /locus_tag="BQ2027_MB0987C"
+ CDS complement(1074907..1075581)
+ /gene="lprP"
+ /locus_tag="BQ2027_MB0987C"
+ /note="Mb0987c, lprP, len: 224 aa. Equivalent to Rv0962c,
+ len: 224 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 224 aa overlap). Possible lprP,
+ lipoprotein. Contains possible N-terminal signal sequence
+ and appropriately positioned PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE LIPOPROTEIN LPRP"
+ /protein_id="SIT99586.1"
+ /db_xref="GOA:P59987"
+ /db_xref="InterPro:IPR032018"
+ /db_xref="UniProtKB/Swiss-Prot:P59987"
+ /translation="MKRTSRSLTAALLGIAALLAGCIKPNTFDPYANPGRGELDRRQK
+ IVNGRPDLETVQQQLANLDATIRAMIAKYSPQTRFSTGVTVSHLTNGCNDPFTRTIGR
+ QEASELFFGRPAPTPQQWLQIVTELAPVFKAAGFRPNNSVPGDPPQPLGAPNYSQIRD
+ DGVTINLVNGDNRGPLGYSYNTGCHLPAAWRTAPPPLNMRPANDPDVHYPYLYGSPGG
+ RTRDAY"
+ gene complement(1075764..1076564)
+ /locus_tag="BQ2027_MB0988C"
+ CDS complement(1075764..1076564)
+ /locus_tag="BQ2027_MB0988C"
+ /note="Mb0988c, -, len: 266 aa. Equivalent to Rv0963c,
+ len: 266 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 266 aa overlap). Conserved hypothetical
+ protein, similar in part to other CONSERVED HYPOTHETICAL
+ PROTEINS from Mycobacterium tuberculosis e.g.
+ Rv2797c|MTCY16B7.46 (562 aa), FASTA scores: E(): 1.2e-23,
+ (39.0% identity in 254 aa overlap); Rv2542 (403 aa);
+ Rv2079 (656 aa). Also similar in part to AL133423|SC4A7_3
+ HYPOTHETICAL SECRETED PROTEIN from Streptomyces coelicolor
+ (406 aa), FASTA scores: opt: 231, E(): 6.8e-07, (31.4%
+ identity in 204 aa overlap); and SCH10.21c|T36533
+ hypothetical protein from Streptomyces coelicolor (329
+ aa). Mb0988c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99587.1"
+ /db_xref="InterPro:IPR010427"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/Swiss-Prot:P64778"
+ /translation="MLQRELTRLQNGWLSRDGVWHTDTDKLADLRALRDTLAAHPGTS
+ LILLDTASDPRKVLAAVGVGDVDNAERVGVTMGGLNTRVSSSVGDMVKEAGIQRAKAA
+ ELRERAGWPNYDAVASIAWLGYDAPDGLKDVMHDWSARDAAGPLNRFDKGLAATTNVS
+ DQHITAFGHSYGSLVTSLALQQGAPVSDVVLYGSPGTELTHASQLGVEPGHAFYMIGV
+ NDHVANTIPEFGAFGSAPQDVPGMTQLSVNTGLAPGPLLGDGQLHERA"
+ gene complement(1076663..1077145)
+ /locus_tag="BQ2027_MB0989C"
+ CDS complement(1076663..1077145)
+ /locus_tag="BQ2027_MB0989C"
+ /note="Mb0989c, -, len: 160 aa. Equivalent to Rv0964c,
+ len: 160 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 160 aa overlap). Hypothetical unknown
+ protein. Equivalent to AAK45241.1 from Mycobacterium
+ tuberculosis strain CDC1551 (138 aa) but longer 22 aa.
+ Mb0989c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99588.1"
+ /db_xref="UniProtKB/Swiss-Prot:P59978"
+ /translation="MGLLGFGGAAAEAAQVATHHTTVLLDHHAGACEAVARAAEKAAE
+ EVAAIKMRLQVIRDAAREHHLTIAYATGTALPPPDLSSYSPADQQAILNTAIRRASNV
+ CWPTPRPPMRIWPRRFDAPPGTCRASRSMPNSAMRHPQCRRCRRRTATLRRSSGGGIR
+ "
+ gene complement(1077245..1077664)
+ /locus_tag="BQ2027_MB0990C"
+ CDS complement(1077245..1077664)
+ /locus_tag="BQ2027_MB0990C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0990c, -, len: 139 aa. Equivalent to Rv0965c,
+ len: 139 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 139 aa overlap). Conserved hypothetical
+ protein, showing weak similarity with Rv2798c|MTCY16B7.45
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium
+ tuberculosis (108 aa), FASTA scores: E(): 5.6e-12, (38.9%
+ identity in 90 aa overlap). Equivalent to AAK45242.1 from
+ Mycobacterium tuberculosis strain CDC1551 (146 aa) but
+ shorter 7 aa. Mb0990c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99589.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWZ5"
+ /translation="MRVNRPQCARVPYSAESLVRVEASWYGRTLRAIPEVLSQVGYQQ
+ ADHGESLLTSHHCCLGAAEGARPGWVGSSAGALSGLLDSWAEASTAHAAHIGDHSYGM
+ HLAAVGFAEMEEHNAAALAAVYPTGGGSARCDGVDVS"
+ gene complement(1077700..1078302)
+ /locus_tag="BQ2027_MB0991C"
+ CDS complement(1077700..1078302)
+ /locus_tag="BQ2027_MB0991C"
+ /note="Mb0991c, -, len: 200 aa. Equivalent to Rv0966c,
+ len: 200 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 200 aa overlap). Conserved hypothetical
+ protein, equivalent to AL035500|MLCL373_12 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium leprae (200 aa),
+ FASTA scores: opt: 1080, E(): 0, (79.5% identity in 200 aa
+ overlap). Also highly similar to
+ SCE6.30c|CAB88834.1|AL353832 hypothetical protein from
+ Streptomyces coelicolor (277 aa). Some similarity to
+ Rv2862c|MTV007.08 CONSERVED HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (194 aa), FASTA scores: E():
+ 3.1e-06, (31.5% identity in 184 aa overlap). Equivalent to
+ AAK45243.1 from Mycobacterium tuberculosis strain CDC1551
+ (230 aa) but shorter 30 aa. Note that Rv0966c has been
+ shortened since first entry. Protein product from Mb0991c
+ detected using SWATH mass spectrometry. Mb0991c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99590.1"
+ /db_xref="InterPro:IPR012551"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWZ1"
+ /translation="MSNSAQRDARNSRDESARASDTDRIQIAQLLAYAAEQGRLQLTD
+ YEDRLARAYAATTYQELDRLRADLPGAAIGPRRGGECNPAPSTLLLALLGGFERRGRW
+ NVPKKLTTFTLWGSGVLDLRYADFTSTEVDIRAYSIMGAQTILLPPEVNVEIHGHRVM
+ GGFDRKVVGEGTRGAPTVRIRGFSLGGDVGIKRKPRKPRK"
+ gene 1078442..1078801
+ /gene="csor"
+ /locus_tag="BQ2027_MB0992"
+ CDS 1078442..1078801
+ /gene="csor"
+ /locus_tag="BQ2027_MB0992"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0992, -, len: 119 aa. Equivalent to Rv0967, len:
+ 119 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 119 aa overlap). Conserved hypothetical
+ protein, similar to hypothetical proteins from several
+ organisms e.g. AE002074|AE002074_11 from Deinococcus
+ radiodurans (102 aa), FASTA scores: opt: 233, E():
+ 8.6e-10, (47.0% identity in 83 aa overlap);
+ O32222|Z99121|YVGZ from Bacillus subtilis (101 aa), FASTA
+ scores: opt:228, E(): 3.2e-15, (38.0% identity in 92 aa
+ overlap); etc. Also similar to Mycobacterium tuberculosis
+ hypothetical proteins Rv0190, and Rv1766. Protein product
+ from Mb0992 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb0992 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="copper-sensitive operon repressor csor"
+ /protein_id="SIT99591.1"
+ /db_xref="GOA:Q7U0Y5"
+ /db_xref="InterPro:IPR003735"
+ /db_xref="InterPro:IPR038390"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0Y5"
+ /translation="MSKELTAKKRAALNRLKTVRGHLDGIVRMLESDAYCVDVMKQIS
+ AVQSSLERANRVMLHNHLETCFSTAVLDGHGQAAIEELIDAVKFTPALTGPHARLGGA
+ AVGESATEEPMPDASNM"
+ gene 1078858..1079154
+ /locus_tag="BQ2027_MB0993"
+ CDS 1078858..1079154
+ /locus_tag="BQ2027_MB0993"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0993, -, len: 98 aa. Equivalent to Rv0968, len:
+ 98 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 98 aa overlap). Conserved hypothetical
+ protein, similar to NP_301579.1|NC_002677 conserved
+ hypothetical protein from Mycobacterium leprae (92 aa).
+ Also highly similar to CONSERVED HYPOTHETICAL PROTEINS
+ from Mycobacterium tuberculosis e.g. Rv3269 (93 aa), FASTA
+ score: (51.1% identity in 94 aa overlap); and Rv1993c (90
+ aa). Protein product from Mb0993 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb0993
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99592.1"
+ /db_xref="InterPro:IPR009963"
+ /db_xref="UniProtKB/Swiss-Prot:P64780"
+ /translation="MVWHGFLAKAVPTVVTGAVGVAAYEALRKMVVKAPLRAATVSVA
+ AWGIRLAREAERKAGESAEQARLMFADVLAEASERAGEEVPPLAVAGSDDGHDH"
+ gene 1079210..1081522
+ /gene="ctpV"
+ /locus_tag="BQ2027_MB0994"
+ CDS 1079210..1081522
+ /gene="ctpV"
+ /locus_tag="BQ2027_MB0994"
+ /note="Mb0994, ctpV, len: 770 aa. Equivalent to Rv0969,
+ len: 770 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 770 aa overlap). Probable ctpV, metal
+ cation transporter P-type ATPase (transmembrane protein)
+ (EC 3.6.3.-), highly similar (except in N-terminus) to
+ others e.g. NP_391230.1|NC_000964 similar to heavy
+ metal-transporting ATPase from Bacillus subtilis (803 aa);
+ P37279|ATCS_SYNP7|PACS cation-transporting ATPase from
+ Synechococcus sp. strain PCC 7942 (Anacystis nidulans R2)
+ (747 aa), FASTA scores: opt: 1851, E(): 0, (52.1% identity
+ in 664 aa overlap); etc. Equivalent to AAK45246.1 from
+ Mycobacterium tuberculosis strain CDC1551 (792 aa) but
+ shorter 22 aa. Contains PS00154 E1-E2 ATPases
+ phosphorylation site. BELONGS TO THE CATION TRANSPORT
+ ATPASES FAMILY (E1-E2 ATPASES). Protein product from
+ Mb0994 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb0994 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METAL CATION TRANSPORTER P-TYPE ATPASE
+ CTPV"
+ /protein_id="SIT99593.1"
+ /db_xref="GOA:A0A1R3XXY2"
+ /db_xref="InterPro:IPR001757"
+ /db_xref="InterPro:IPR008250"
+ /db_xref="InterPro:IPR018303"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR023298"
+ /db_xref="InterPro:IPR023299"
+ /db_xref="InterPro:IPR027256"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXY2"
+ /translation="MRVCVTGFNVDAVRAVAIEETVSQVTGVHAVHAYPRTASVVIWY
+ SPELGDTAAVLSAITKAQHVPAELVPARAPHSAGVRGVGVVRKITGGIRRMLSRPPGV
+ DKPLKASRCGGRPRGPVRGSASWPGEQNRRERRTWLPRVWLALPLGLLALGSSMFFGA
+ YPWAGWLAFAATLPVQFVAGWPILRGAVQQARALTSNMDTLIALGTLTAFVYSTYQLF
+ AGGPLFFDTSALIIAFVVLGRHLEARATGKASEAISKLLELGAKEATLLVDGQELLVP
+ VDQVQVGDLVRVRPGEKIPVDGEVTDGRAAVDESMLTGESVPVEKTAGDRVAGATVNL
+ DGLLTVRATAVGADTALAQIVRLVEQAQGDKAPVQRLADRVSAVFVPAVIGVAVATFA
+ GWTLIAANPVAGMTAAVAVLIIACPCALGLATPTAIMVGTGRGAELGILVKGGEVLEA
+ SKKIDTVVFDKTGTLTRARMRVTDVIAGQRRQPNQVLRLAAAVESGSEHPIGAAIVAA
+ AHERGLAIPAANAFTAVAGHGVRAQVNGGPVVVGRRKLVDEQHLVLPDHLAAAAVEQE
+ ERGRTAVFVGQDGQVVGVLAVADTVKDDAADVVGRLHAMGLQVAMITGDNARTAAAIA
+ KQVGIEKVLAEVLPQDKVAEVRRLQDQGRVVAMVGDGVNDAPALVQADLGIAIGTGTD
+ VAIEASDITLMSGRLDGVVRAIELSRQTLRTIYQNLGWAFGYNTAAIPLAALGALNPV
+ VAGAAMGFSSVSVVTNSLRLRRFGRDGRTA"
+ gene 1081519..1082151
+ /locus_tag="BQ2027_MB0995"
+ CDS 1081519..1082151
+ /locus_tag="BQ2027_MB0995"
+ /note="Mb0995, -, len: 210 aa. Equivalent to Rv0970, len:
+ 210 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 210 aa overlap). Probable conserved
+ integral membrane protein, equivalent to
+ NP_302348.1|NC_002677 probable integral membrane protein
+ from Mycobacterium leprae (210 aa). Mb0995 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99594.1"
+ /db_xref="GOA:P64782"
+ /db_xref="InterPro:IPR033458"
+ /db_xref="UniProtKB/Swiss-Prot:P64782"
+ /translation="MIHDLMLRWVVTGLFVLTAAECGLAIIAKRRPWTLIVNHGLHFA
+ MAVAMAVMAWPWGARVPTTGPAVFFLLAAVWFGATAVVAVRGTATRGLYGYHGLMMLA
+ TAWMYAAMNPRLLPVRSCTEYATEPDGSMPAMDMTAMNMPPNSGSPIWFSAVNWIGTV
+ GFAVAAVFWACRFVMERRQEATQSRLPGSIGQAMMAAGMAMLFFAMLFPV"
+ gene complement(1082242..1083051)
+ /gene="echA7"
+ /locus_tag="BQ2027_MB0996C"
+ CDS complement(1082242..1083051)
+ /gene="echA7"
+ /locus_tag="BQ2027_MB0996C"
+ /note="Mb0996c, echA7, len: 269 aa. Equivalent to Rv0971c,
+ len: 269 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 269 aa overlap). Probable echA7,
+ enoyl-CoA hydratase (EC 4.2.1.17), similar to many e.g.
+ CAB95895.1|AL359988 putative enoyl CoA hydratase from
+ Streptomyces coelicolor (247 aa); P24162|ECHH_RHOCA
+ enoyl-CoA hydratase from Rhodobacter capsulatus (257 aa),
+ FASTA scores: opt: 369, E(): 2.6e-15, (33.7% identity in
+ 246 aa overlap); etc. Protein product from Mb0996c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb0996c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ENOYL-COA HYDRATASE ECHA7 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-COA HYDRATASE) (CROTONASE)"
+ /protein_id="SIT99595.1"
+ /db_xref="GOA:A0A1R3XXB6"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR014748"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXB6"
+ /translation="MDSPVDYAGPAACGGPFARLTLNSPHNRNALSSTLVSQLHQGLS
+ AAEADPAVRLVVLGHTGGTFCAGADLSEAGGGGGDPYRMAVARAREMTALLRAIVESP
+ LPVVGAINGHVRAGGFGLVGACDMVVAGPESTFALTEARIGVAPAIISLTLLPKLSPR
+ AAARYYLTGEKFGAREAADIGLITMAADDVDAAVAALVADVGRGSPQGLAASKALTTA
+ AVLEGFDRDAERLTEESARLFVSDEAREGMLAFLQKRPPRWVQPATMRAAD"
+ gene complement(1083051..1084217)
+ /gene="fadE12"
+ /locus_tag="BQ2027_MB0997C"
+ CDS complement(1083051..1084217)
+ /gene="fadE12"
+ /locus_tag="BQ2027_MB0997C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb0997c, fadE12, len: 388 aa. Equivalent to
+ Rv0972c, len: 388 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.7% identity in 388 aa overlap). Probable
+ fadE12, acyl-CoA dehydrogenase (EC 1.3.99.-), highly
+ similar to many e.g. CAB95893.1|AL359988 putative acyl CoA
+ dehydrogenase from Streptomyces coelicolor (382 aa);
+ P45857|ACDB_BACSU from Bacillus subtilis (379 aa), FASTA
+ scores: opt: 576, E(): 2.3e-26, (29.7% identity in 381 aa
+ overlap); etc. Protein product from Mb0997c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb0997c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="acyl-coa dehydrogenase fade12"
+ /protein_id="SIT99596.1"
+ /db_xref="GOA:Q7U0Y2"
+ /db_xref="InterPro:IPR006091"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR013786"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR037069"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0Y2"
+ /translation="MTDTSFIESEERQALRKAVASWVANYGHEYYLDKARKHEHTSEL
+ WAEAGKLGFLGVNLPEEYGGGGAGMYELSLVMEEMAAAGSALLLMVVSPAINGTIIAK
+ FGTDDQKKRWLPGIADGSLTMAFAITEPDAGSNSHKITTTARRDGSDWIIKGQKVFIS
+ GIDQAQAVLVVGRSEEAKTGKLRPALFVVPTDAPGFSYTPIEMELVSPERQFQVFLDD
+ VRLPADALVGAEDAAIAHLFAGLNPERIMGAASAVGMGRFALGRAVDYVKTRKVWSTP
+ IGAHQGLAHPLAQCHIEVELAKLMTQKAATLYDHGDDFGAAEAANMAKYAAAEASSRA
+ VDQAVQSMGGNGLTKEYGVAAMMTSARLARIAPISREMVLNFVAQTSLGLPRSY"
+ gene complement(1084214..1086217)
+ /gene="accA2"
+ /locus_tag="BQ2027_MB0998C"
+ CDS complement(1084214..1086217)
+ /gene="accA2"
+ /locus_tag="BQ2027_MB0998C"
+ /standard_name="bccA"
+ /note="Mb0998c, accA2, len: 667 aa. Equivalent to Rv0973c,
+ len: 667 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 667 aa overlap). Probable accA2
+ (alternate gene name: bccA), acetyl-/propionyl-coenzyme A
+ carboxylase (alpha subunit) [INCLUDES: BIOTIN CARBOXYLASE
+ (EC 6.3.4.14); BIOTIN CARBOXYL CARRIER PROTEIN (BCCP)],
+ highly similar to others e.g. CAB95892.1|AL359988 putative
+ acetyl/propionyl CoA carboxylase alpha subunit from
+ Streptomyces coelicolor (614 aa); NP_250702.1|NC_002516
+ probable acyl-CoA carboxylase alpha chain from Pseudomonas
+ aeruginosa (655 aa); NP_420971.1|NC_002696
+ acetyl/propionyl-CoA carboxylase alpha subunit from
+ Caulobacter crescentus (654 aa); NP_251581.1|NC_002516
+ probable biotin carboxylase/biotin carboxyl carrier
+ protein from Pseudomonas aeruginosa (661 aa); etc. Also
+ highly similar to others from Mycobacterium tuberculosis
+ e.g. Rv2501c|P46401|MTCY07A7.07c|BCCA_MYCTU|ACCA1 PROBABLE
+ ACETYL-/PROPIONYL-COENZYME A CARBOXYLASE ALPHA CHAIN
+ (ALPHA SUBUNIT) (654 aa), FASTA scores, opt: 250, E():
+ 4e-09, (28.6% identity in 182 aa overlap); and
+ Rv3285|MTCY71.25|ACCA3 (600 aa); Z83018|MTCY349_20 (1127
+ aa), FASTA scores: opt: 838, E(): 0, (40.2% identity in
+ 500 aa overlap). Contains PS00867 Carbamoyl-phosphate
+ synthase subdomain signature 2 and PS00188
+ Biotin-requiring enzymes attachment site. Protein product
+ from Mb0998c detected using SWATH mass spectrometry.
+ Mb0998c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACETYL-/PROPIONYL-COENZYME A
+ CARBOXYLASE ALPHA CHAIN (ALPHA SUBUNIT) ACCA2: BIOTIN
+ CARBOXYLASE + BIOTIN CARBOXYL CARRIER PROTEIN (BCCP)"
+ /protein_id="SIT99597.1"
+ /db_xref="GOA:A0A1R3XWZ8"
+ /db_xref="InterPro:IPR000089"
+ /db_xref="InterPro:IPR001882"
+ /db_xref="InterPro:IPR005479"
+ /db_xref="InterPro:IPR005481"
+ /db_xref="InterPro:IPR005482"
+ /db_xref="InterPro:IPR011053"
+ /db_xref="InterPro:IPR011054"
+ /db_xref="InterPro:IPR011761"
+ /db_xref="InterPro:IPR011764"
+ /db_xref="InterPro:IPR016185"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWZ8"
+ /translation="MGITRVLVANRGEIARRVFATCRRLGLGTVAVYTDPDAAAPHVA
+ EADARVRLPQTTDYLNAEAIIAAAQAAGADAVHPGYGFLSENAEFAAAVQEAGLTWVG
+ PPVDAVRAMGSKIESKKLMAAAGVPVLEELDPDAVTTAQLPVLVKASAGGGGRGMRVV
+ HELSALPAEVEAARREAQSAFGDPTVFCERYLPTGHHVEVQVMADTHGTVWAVGEREC
+ SFQRRHQKIIEEAPSPLVERVPGMRAKLFDAARLAASAIGYTGAGTVEFLADDSPGRE
+ GEFYFLEMNTRLQVEHPVTEETTGLDLVELQLMIADCGRLDTEPPPAQGYSIEARLYA
+ EDPAHGWQPQAGVMHTIEVPGVRAQFDSLGQRTGIRLDSGIVDGSTVSIHYDPMLAKV
+ VSYGATRRQAALVLADALVRARLHGLRTNRELLVNVLRHPAFLDGATDTGFFDTHGMA
+ ELSTPLADTATLRLSAIAAALADAEHNRASAGVFSSIPSGWRNLASGYQVKTYRDDAD
+ TEHRVEYRFTRTGLALPGDPVVQLVSADVDQVVLAQDGVAHGFTVARHGPDVYVDSAR
+ GPVHLVALSRFPEPSSAVEQGSLVAPMPGNVIRIGAEVGDTVTAGQPLIWLEAMKMEH
+ TIAAPADGVLTHVSVNTGQQVEVGAILARVEAPQNGPAEGDSP"
+ gene complement(1086223..1087812)
+ /gene="accD2"
+ /locus_tag="BQ2027_MB0999C"
+ CDS complement(1086223..1087812)
+ /gene="accD2"
+ /locus_tag="BQ2027_MB0999C"
+ /note="Mb0999c, accD2, len: 529 aa. Equivalent to Rv0974c,
+ len: 529 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 529 aa overlap). Probable accD2,
+ acetyl-/propionyl-CoA carboxylase (beta subunit) (EC
+ 6.4.1.-), highly similar to many e.g. CAB95891.1|AL35998
+ putative acetyl/propionyl CoA carboxylase beta subunit
+ from Streptomyces coelicolor (532 aa);
+ NP_250704.1|NC_002516 probable acyl-CoA
+ carboxyltransferase beta chain from Pseudomonas aeruginosa
+ (535 aa); BAB16296.1|AB039884 acetyl-CoA carboxylase
+ carboxyltransferase from Myxococcus xanthus (538 aa);
+ NP_420973.1|NC_002696 putative propionyl-CoA carboxylase
+ beta subunit from Caulobacter crescentus (530 aa); etc.
+ Also similar to other from Mycobacterium tuberculosis:
+ Rv2502c|ACCD1, Rv3799c|ACCD4, etc. COULD BELONG TO THE
+ ACCD/PCCB FAMILY. Protein product from Mb0999c detected
+ using SWATH mass spectrometry. Mb0999c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACETYL-/PROPIONYL-COA CARBOXYLASE (BETA
+ SUBUNIT) ACCD2"
+ /protein_id="SIT99598.1"
+ /db_xref="GOA:A0A1R3XWX8"
+ /db_xref="InterPro:IPR011762"
+ /db_xref="InterPro:IPR011763"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="InterPro:IPR034733"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWX8"
+ /translation="MLQSTLDPNASAYDEAAATMSGKLDEINAELAKALAGGGPKYVD
+ RHHARGKLTPRERIELLVDPDSPFLELSPLAAYGSNFQIGASLVTGIGAVCGVECMIV
+ ANDPTVKGGTSNPWTLRKILRANQIAFENRLPVISLVESGGADLPTQKEIFIPGGQMF
+ RDLTRLSAAGIPTIALVFGNSTAGGAYVPGMSDHVVMIKERSKVFLAGPPLVKMATGE
+ ESDDESLGGAEMHARISGLADYFALDELDAIRIGRRIVARLNWIKQGPAPAPVTEPLF
+ DAEELIGIVPPDLRIPFDPREVIARIVDGSEFDEFKPLYGSSLVTGWARLHGYPLGIL
+ ANARGVLFSEESQKATQFIQLANRADTPLLFLHNTTGYMVGKDYEEGGMIKHGSMMIN
+ AVSNSTVPHISLLIGASYGAGHYGMCGRAYDPRFLFAWPSAKSAVMGGAQLSGVLSIV
+ ARAAAEARGQQVDEAADAAMRAAVEGQIEAESLPLVLSGMLYDDGVIDPRDTRTVLGM
+ CLSAIANGPIKGTSNFGVFRM"
+ gene complement(1087853..1088962)
+ /gene="fadE13"
+ /locus_tag="BQ2027_MB1000C"
+ CDS complement(1087853..1088962)
+ /gene="fadE13"
+ /locus_tag="BQ2027_MB1000C"
+ /note="Mb1000c, fadE13, len: 369 aa. Equivalent to the 5'
+ end of Rv0975c, len: 382 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100% identity in 349 aa
+ overlap). Probable fadE13, acyl-CoA dehydrogenase (EC
+ 1.3.99.-), highly similar to many e.g. T35427 probable
+ acyl-CoA dehydrogenase from Streptomyces coelicolor (382
+ aa); M74096|HUMACADL_1 Human long chain acyl-CoA
+ dehydrogenase from Homo sapiens (430 aa), FASTA scores:
+ opt: 819, E(): 0, (37.0% identity in 376 aa overlap); etc.
+ Also similar to others from Mycobacterium tuberculosis
+ e.g. fadE20|Z98209|MTCY154_4 (386 aa), FASTA scores:
+ (40.3% identity in 375 aa overlap). Contains PS00073
+ Acyl-CoA dehydrogenases signature 2. BELONGS TO THE
+ ACYL-COA DEHYDROGENASES FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ frameshift due to a single base deletion (t-*) leads to a
+ shorter product with a different COOH part compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv.
+ Protein product from Mb1000c detected using SWATH mass
+ spectrometry. Mb1000c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE13"
+ /protein_id="SIT99599.1"
+ /db_xref="GOA:A0A1R3XX05"
+ /db_xref="InterPro:IPR006091"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR013786"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR037069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX05"
+ /translation="MNIWTTPERQQLRKTVRAFAEREILPHVDEWERIGELPRGLHRL
+ AGAAGLLGAGFPEAVGGGGGDGADPVIICEEMHQAGAPGGVYASLFTCGIAVPHMVAS
+ GDERLIATYVRPTLAGEKIGALAITEPGGGSDVGHLRTSAVRDGDHYVINGAKTYITS
+ GVRADYVVTAVRTGGPGAAGVSLLVVEKDTPGFEVTRKLDKMGWRSSDTAELCYTDVA
+ VPATNLVGAENSGFTQIARAFVSERIGLAAQAYSSAQRCLDLTAQWCRDRETFGRPLI
+ SRQSVQNTLAEMARRIDVARVYAHHVVERQLAGETDLIAQVCFAKNTAVQAGEWVANQ
+ AVQLFGGMGYMAESEANANTGTCESSVSEAAPPKY"
+ gene complement(1088959..1090641)
+ /locus_tag="BQ2027_MB1001C"
+ CDS complement(1088959..1090641)
+ /locus_tag="BQ2027_MB1001C"
+ /note="Mb1001c, -, len: 560 aa. Equivalent to Rv0976c,
+ len: 560 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 560 aa overlap). Conserved hypothetical
+ protein, highly similar to others e.g. CAB95890.1|AL359988
+ conserved hypothetical protein from Streptomyces
+ coelicolor (558 aa); P_251576.1|NC_002516 hypothetical
+ protein from Pseudomonas aeruginosa (600 aa); etc.
+ N-terminal part highly similar to AL035500|MLCL373_14
+ probable pseudogene from Mycobacterium leprae (163 aa),
+ FASTA score: (50.0% identity in 122 aa overlap). Protein
+ product from Mb1001c detected using SWATH mass
+ spectrometry. Mb1001c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Terpene utilization protein AtuA"
+ /protein_id="SIT99600.1"
+ /db_xref="InterPro:IPR010839"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX00"
+ /translation="MRIGNCSGFYGDRLSAMREMLTGGELDYLTGDYLAELTMLILGR
+ DRMKNPDRGYAKTFLAQLEDCLGLAHDRGVRIVTNAGGLNPAGLANAVRALAARLGIP
+ AQVAHVEGDDLQPRAAELGLGTPLTANAYLGAWGIVDCFERGADVVVTGRVTDASVVV
+ GAAAAHFGWGRTDYHRLAGAVVAGHVIECGVQATGGNYAFFTEIGDLTHAGFPLAEIA
+ ADGSSVITKHHGTGGLVSVDTITAQLLYEITGARYANPDVTARMDSVELSPDGPDRVR
+ ISGVIGEPPPPTYKVSLNSIGGFRNAMTFVLTGLDIDAKADLVRRQLEAALTVKPAEL
+ QWTLARTDHPDADTEETASALLTCVARDPDPANVGRQFSSAAVELALASYPGFTATAP
+ PGDGQVYGVFTPGYVDAGKVAHIAVHADGTRTEIPCATETLELAPAHPPALPDPLPAG
+ PTRRVPLGLIAGARSGDKGGSANVGVWVRTDEQWRWLAHTLTVELLKELLPETAGLVV
+ TRHVLPNLRALNFVIEAILGQGVAYQARFDPQAKGLGEWLRSRHVEIPETLL"
+ gene 1090840..1093611
+ /gene="PE_PGRS16"
+ /locus_tag="BQ2027_MB1002"
+ CDS 1090840..1093611
+ /gene="PE_PGRS16"
+ /locus_tag="BQ2027_MB1002"
+ /note="Mb1002, PE_PGRS16, len: 923 aa. Equivalent to
+ Rv0977, len: 923 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 923 aa overlap). Member of
+ the Mycobacterium tuberculosis PE family, PGRS subfamily
+ of gly-rich proteins, highly similar to other PGRS-type
+ sequences e.g. AL0091|MTV004_1 from Mycobacterium
+ tuberculosis (1125 aa), FASTA score: (45.4% identity in
+ 959 aa overlap); Z80225|MTCY441_4 from Mycobacterium
+ tuberculosis (778 aa), FASTA score: (51.5% identity in 750
+ aa overlap); etc. Mb1002 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs16"
+ /protein_id="SIT99601.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="InterPro:IPR021109"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWZ9"
+ /translation="MSFVVTAPPVLASAASDLGGIASMISEANAMAAVRTTALAPAAA
+ DEVSAAIAALFSSYARDYQTLSVQVTAFHVQFAQTLTNAGQLYAVVDVGNGVLLKTEQ
+ QVLGVINAPTQTLVGRPLIGDGTHGAPGTGQNGGAGGILWGNGGNGGSGAPGQPGGRG
+ GDAGLFGHGGHGGVGGPGIAGAAGTAGLPGGNGANGGSGGIGGAGGAGGNGGLLFGNG
+ GAGGQGGSGGLGGSGGTGGAGMAAGPAGGTGGIGGIGGIGGAGGVGGHGSALFGHGGI
+ NGDGGTGGMGGQGGAGGNGWAAEGITVGIGEQGGQGGDGGAGGAGGIGGSAGGIGGSQ
+ GAGGHGGDGGQGGAGGSGGVGGGGAGAGGDGGAGGIGGTGGNGSIGGAAGNGGNGGRG
+ GAGGMATAGSDGGNGGGGGNGGVGVGSAGGAGGTGGDGGAAGAGGAPGHGYFQQPAPQ
+ GLPIGTGGTGGEGGAGGAGGDGGQGDIGFDGGRGGDGGPGGGGGAGGDGSGTFNAQAN
+ NGGDGGAGGVGGAGGTGGTGGVGADGGRGGDSGRGGDGGNAGHGGAAQFSGRGAYGGE
+ GGSGGAGGNAGGAGTGGTAGSGGAGGFGGNGADGGNGGNGGNGGFGGINGTFGTNGAG
+ GTGGLGTLLGGHNGNIGLNGATGGIGSTTLTNATVPLQLVNTTEPVVFISLNGGQMVP
+ VLLDTGSTGLVMDSQFLTQNFGPVIGTGTAGYAGGLTYNYNTYSTTVDFGNGLLTLPT
+ SVNVVTSSSPGTLGNFLSRSGAVGVLGIGPNNGFPGTSSIVTAMPGLLNNGVLIDESA
+ GILQFGPNTLTGGITISGAPISTVAVQIDNGPLQQAPVMFDSGGINGTIPSALASLPS
+ GGFVPAGTTISVYTSDGQTLLYSYTTTATNTPFVTSGGVMNTGHVPFAQQPIYVSYSP
+ TAIGTTTFN"
+ gene complement(1093828..1094835)
+ /gene="PE_PGRS17"
+ /locus_tag="BQ2027_MB1003C"
+ CDS complement(1093828..1094835)
+ /gene="PE_PGRS17"
+ /locus_tag="BQ2027_MB1003C"
+ /note="Mb1003c, PE_PGRS17, len: 335 aa. Similar to
+ Rv0978c, len: 331 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (93.7% identity in 335 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to others
+ e.g. Z95387|MTCY1A10_19 from Mycobacterium tuberculosis
+ (461 aa), FASTA score: (73.6% identity in 277 aa overlap);
+ etc. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a 115 bp to 127 bp substitution leads to a slightly
+ longer product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (335 aa versus 331 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs17"
+ /protein_id="SIT99602.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="InterPro:IPR001258"
+ /db_xref="InterPro:IPR011964"
+ /db_xref="InterPro:IPR013017"
+ /db_xref="InterPro:IPR015943"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ35"
+ /translation="MSFVNVAPQLVSTAAADAARIGSAINTANTAAAATTQVLVAAQD
+ EVSTAIAALFGSHGQHYQAISAQVAAYQERFVLALSQAGSTYAVAEAASATPLQQIEQ
+ ALLGVINTPTEALVGRKLIGDGAHGAPGTGQAGGAGGILWGNGGNGGSGAPGQAGGAG
+ GAAGLIGNGGAGGTGGAVSLARAGTAGGAGRGPVGGIGGAGGVGGAGGAAGAVTTITH
+ ASFNDPHGVAVNPGGNVYVTNFGSGTVSVINPATNTVTGSPITIGNGPSGVAVSPVTG
+ LVFVTNFDSNTVSVIDPTTNTVTGSPITVGTAPTGVAVNPVTGEVYVTNFAGDTVSVI
+ S"
+ gene complement(1095149..1095343)
+ /locus_tag="BQ2027_MB1004C"
+ CDS complement(1095149..1095343)
+ /locus_tag="BQ2027_MB1004C"
+ /note="Mb1004c, -, len: 64 aa. Equivalent to Rv0979c, len:
+ 64 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 64 aa overlap). Hypothetical unknown protein.
+ Start codon changed since first submission (-44 aa)"
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99603.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXZ6"
+ /translation="MGFRTQVGAATIASTMTWRIPVEDGPAQFRAGVGPGRDRQFTVV
+ APMVVGLWDRNRRPGWQWPS"
+ gene 1095365..1095538
+ /gene="rpmF"
+ /locus_tag="BQ2027_MB1005"
+ CDS 1095365..1095538
+ /gene="rpmF"
+ /locus_tag="BQ2027_MB1005"
+ /note="Mb1005, rpmF, len: 57 aa. Equivalent to Rv0979A,
+ len: 57 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 57 aa overlap). Probable rpmF, 50S
+ ribosomal protein L32, similar to others e.g. rpmF|Q9RL50
+ PROBABLE 50S RIBOSOMAL PROTEIN from Streptomyces
+ coelicolor (56 aa), FASTA scores: E(): 5.1e-09, (63.45%
+ identity in 52 aa overlap); etc. BELONGS TO THE L32P
+ FAMILY OF RIBOSOMAL PROTEINS. Protein product from Mb1005
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1005 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l32 rpmf"
+ /protein_id="SIT99604.1"
+ /db_xref="GOA:P0A5V9"
+ /db_xref="InterPro:IPR002677"
+ /db_xref="InterPro:IPR011332"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5V9"
+ /translation="MAVPKRRKSRSNTRSRRSQWKAAKTELVGVTVAGHAHKVPRRLL
+ KAARLGLIDFDKR"
+ gene complement(1095557..1096930)
+ /gene="PE_PGRS18"
+ /locus_tag="BQ2027_MB1006C"
+ CDS complement(1095557..1096930)
+ /gene="PE_PGRS18"
+ /locus_tag="BQ2027_MB1006C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1006c, PE_PGRS18, len: 457 aa. Equivalent to
+ Rv0980c, len: 457 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.6% identity in 457 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to others
+ e.g. Z95387|MTCY1A10_19 from Mycobacterium tuberculosis
+ (461 aa), FASTA score: (66.7% identity in 405 aa overlap);
+ Z95844|MTCY493_2 from Mycobacterium tuberculosis (741 aa),
+ FASTA score: (53.0% identity in 394 aa overlap); etc."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs18"
+ /protein_id="SIT99605.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="InterPro:IPR001258"
+ /db_xref="InterPro:IPR011045"
+ /db_xref="InterPro:IPR011964"
+ /db_xref="InterPro:IPR013017"
+ /db_xref="InterPro:IPR015943"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXC5"
+ /translation="MSFVNVAPQLVSTAAADAARIGSAINTANTAAAATTQVLAAAQD
+ EVSTAIAALFGSHGQHYQAISAQVAAYQERFVLALSQASSTYAVAEAASATPLQNVLD
+ AINAPVQSLTGRPLIGDGANGIDGTGQAGGNGGWLWGNGGNGGSGAPGQAGGAGGAAG
+ LIGNGGAGGAGGQGLPFEAGANGGAGGAGGWLFGNGGAGGVGGAGGAGTTFGVAGGDG
+ GTGGVGGHGGLIGVGGHGGDGGTGGTGGAVSLARAGTAGGAGGGPAGGIGGTGGVGGA
+ GGAAGAVTTITHASFNDPHGVAVNPGGNIYVTNQGSNTVSVIDPVTNTVTGSITDGNG
+ PSGVAVSPVTGLVFVTNFDSNTVSVIDPNTNTVTGSIPVGTGAYGVAVNPGGNIYVTN
+ QFSNTVSVIDPATNTVTGSPIPVGLDPTGVAVNPVTGVVYVTNSLDDTVSVITGEPAR
+ SVCSAAI"
+ gene 1097295..1097987
+ /gene="mprA"
+ /locus_tag="BQ2027_MB1007"
+ CDS 1097295..1097987
+ /gene="mprA"
+ /locus_tag="BQ2027_MB1007"
+ /note="Mb1007, len: 228 aa. Equivalent to Rv0981 len: 228
+ aa, from Mycobacterium tuberculosis strain H37Rv, (99.6%
+ identity in 228 aa overlap). MprA,mycobacterial
+ persistence regulator, a two-component response regulator
+ whose expression is required for entrance into and
+ maintenance of persistent infection (see citation below),
+ equivalent to NP_301250.1|NC_002677 putative two-component
+ response regulator from Mycobacterium leprae (228 aa); and
+ highly similar to others from Mycobacterium leprae. Also
+ highly similar to others e.g.
+ AAG36759.1|AF119221_1|AF119221 response regulator from
+ Corynebacterium glutamicum (232 aa); CAB88489.1|AL353816
+ putative two-component system response regulator from
+ Streptomyces coelicolor (248 aa); BJY09666_1 two-component
+ response regulator (ragA, ragB and rpoH3) from B.japonicum
+ (226 aa), FASTA score: (43.8% identity in 224 aa overlap);
+ BSAJ2571_44 two-component response regulator from Bacillus
+ subtilis (228 aa), FASTA score: (46.4% identity in 224 aa
+ overlap); etc. Also highly similar to others from
+ Mycobacterium tuberculosis e.g. Rv1033c (257 aa); Rv0903c
+ (236 aa), FASTA score: (50.7 identity in 225 aa overlap);
+ etc. Contains PS00217 Sugar transport proteins signature
+ 2. Start changed since first submission (-2 aa). MprAB is
+ involved in the regulation of genes in response to
+ environmental stress (See He et al., 2006). Protein
+ product from Mb1007 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1007 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Mycobacterial persistence regulator MRPA (two
+ component response transcriptional regulatory protein)"
+ /protein_id="SIT99606.1"
+ /db_xref="GOA:Q7U0X4"
+ /db_xref="InterPro:IPR001789"
+ /db_xref="InterPro:IPR001867"
+ /db_xref="InterPro:IPR011006"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039420"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0X4"
+ /translation="MSVRILVVDDDRAVRESLRRSLSFNGYSVELAHDGVEALDMIAS
+ DRPDALVLDVMMPRLDGLEVCRQLRSTGDDLPILVLTARDSVSERVAGLDAGADDYLP
+ KPFALEELLARMRALLRRTKPEDAAESMAMRFSDLTLDPVTREVNRGQRRISLTRTEF
+ ALLEMLIANPRRVLTRSRILEEVWGFDFPTSGNALEVYVGYLRRKTEADGEPRLIHTV
+ RGVGYVLRETPP"
+ gene 1097987..1099501
+ /gene="mprB"
+ /locus_tag="BQ2027_MB1008"
+ CDS 1097987..1099501
+ /gene="mprB"
+ /locus_tag="BQ2027_MB1008"
+ /note="Mb1008, mprB, len: 504 aa. Equivalent to Rv0982,
+ len: 504 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 504 aa overlap). Probable mprB, two
+ component sensor kinase, transmembrane protein (EC
+ 2.7.3.-) (see citation below), equivalent to
+ AL035500|MLCL373_16|NP_301251.1|NC_002677 putative
+ two-component system sensor kinase from Mycobacterium
+ leprae (519 aa), FASTA score: (81.0% identity in 521 aa
+ overlap). Also highly similar to others (especially in
+ C-terminal part) e.g. AAG36760.1|AF119221_2|AF119221
+ sensor kinase from Corynebacterium glutamicum (455 aa);
+ CAB89748.1|AL354616 putative two-component histidine
+ kinase from Streptomyces coelicolor (481 aa);
+ X58793|SLCUTRS_2 sensor kinase from S.lividans (414 aa),
+ FASTA scores: opt: 451, E(): 4.2e-21, (36.0% identity in
+ 303 aa overlap); P30847|BAES_ECOLI SENSOR PROTEIN (EC
+ 2.7.3.-) from Escherichia coli (467 aa), FASTA scores:
+ opt: 412, E(): 1.3e-18, (30.4% identity in 336 aa
+ overlap); etc. Also similar in C-terminal region to
+ C-terminus of Rv0902c|Z73101|MTCY31_33 from Mycobacterium
+ tuberculosis (446 aa), FASTA scores: opt: 423, E():
+ 2.6e-19, (28.4 identity in 462 aa overlap). Protein
+ product from Mb1008 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1008 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="two component sensor kinase mprb"
+ /protein_id="SIT99607.1"
+ /db_xref="GOA:Q7U0X3"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR003660"
+ /db_xref="InterPro:IPR003661"
+ /db_xref="InterPro:IPR004358"
+ /db_xref="InterPro:IPR005467"
+ /db_xref="InterPro:IPR036097"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0X3"
+ /translation="MWWFRRRDRAPLRATSSLSLRWRVMLLAMSMVAMVVVLMSFAVY
+ AVISAALYSDIDNQLQSRAQLLIASGSLAADPGKAIEGTAYSDVNAMLVNPGQSIYTA
+ QQPGQTLPVGAAEKAVIRGELFMSRRTTADQRVLAIRLTNGSSLLISKSLKPTEAVMN
+ KLRWVLLIVGGIGVAVAAVAGGMVTRAGLRPVGRLTEAAERVARTDDLRPIPVFGSDE
+ LARLTEAFNLMLRALAESRERQARLVTDAGHELRTPLTSLRTNVELLMASMAPGAPRL
+ PKQEMVDLRADVLAQIEELSTLVGDLVDLSRGDAGEVVHEPVDMADVVDRSLERVRRR
+ RNDIHFDVEVIGWQVYGDTAGLSRMALNLMDNAAKWSPPGGHVGVRLSQLDASHAELV
+ VSDRGPGIPVQERRLVFERFYRSASARALPGSGLGLAIVKQVVLNHGGLLRIEDTDPG
+ GQPPGTSIYVLLPGRRMPIPQLPGATAGARSTDIENSRGSANVISVESQSTRAT"
+ gene 1099545..1100939
+ /gene="pepd"
+ /locus_tag="BQ2027_MB1009"
+ CDS 1099545..1100939
+ /gene="pepd"
+ /locus_tag="BQ2027_MB1009"
+ /note="Mb1009, -, len: 464 aa. Equivalent to Rv0983, len:
+ 464 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 464 aa overlap). Probable secreted or
+ membrane serine protease (EC 3.4.21.-), equivalent (but
+ longer 18 aa in N-terminus) to AL035500|MLCL373_17|T45448
+ probable serine proteinase (EC 3.4.21.-) from
+ Mycobacterium leprae (452 aa), FASTA score: (74.2%
+ identity in 466 aa overlap); and highly similar to others
+ from Mycobacterium leprae. Also highly similar (except in
+ N-terminus) to other proteases e.g. CAC01350.1|AL390975
+ putative protease from Streptomyces coelicolor (542 aa);
+ NP_440705.1|NC_000911|HtrA serine protease from
+ Synechocystis sp. (452 aa); NP_346646.1|NC_003028 serine
+ protease from Streptococcus pneumoniae (393 aa); etc. Also
+ similar in part to members of the htrA-antigen family e.g.
+ U87242|MTU87242_3|HtrA serine protease from M.
+ tuberculosis (542 aa), FASTA scores: opt: 846, E(): 2e-28,
+ (40.6% identity in 392 aa overlap); and similar to other
+ hypothetical serine proteases e.g. Rv0983, Rv0125, etc.
+ Protein product from Mb1009 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1009 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable serine protease pepd (serine
+ proteinase) (mtb32b)"
+ /protein_id="SIT99608.1"
+ /db_xref="GOA:A0A1R3XWZ0"
+ /db_xref="InterPro:IPR001478"
+ /db_xref="InterPro:IPR001940"
+ /db_xref="InterPro:IPR009003"
+ /db_xref="InterPro:IPR036034"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XWZ0"
+ /translation="MAKLARVVGLVQEEQPSDMTNHPRYSPPPQQPGTPGYAQGQQQT
+ YSQQFDWRYPPSPPPQPTQYRQPYEALGGTRPGLIPGVIPTMTPPPGMVRQRPRAGML
+ AIGAVTIAVVSAGIGGAAASLVGFNRAPAGPSGGPVAASAAPSIPAANMPPGSVEQVA
+ AKVVPSVVMLETDLGRQSEEGSGIILSAEGLILTNNHVIAAAAKPPLGSPPPKTTVTF
+ SDGRTAPFTVVGADPTSDIAVVRVQGVSGLTPISLGSSSDLRVGQPVLAIGSPLGLEG
+ TVTTGIVSALNRPVSTTGEAGNQNTVLDAIQTDAAINPGNSGGALVNMNAQLVGVNSA
+ IATLGADSADAQSGSIGLGFAIPVDQAKRIADELISTGKASHASLGVQVTNDKDTPGA
+ KIVEVVAGGAAANAGVPKGVVVTKVDDRPINSADALVAAVRSKAPGATVALTFQDPSG
+ GSRTVQVTLGKAEQ"
+ gene 1100939..1101484
+ /gene="moaB2"
+ /locus_tag="BQ2027_MB1010"
+ CDS 1100939..1101484
+ /gene="moaB2"
+ /locus_tag="BQ2027_MB1010"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1010, moaB2, len: 181 aa. Equivalent to Rv0984,
+ len: 181 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 181 aa overlap). Possible moaB2,
+ pterin-4-alpha-carbinolamine dehydratase (EC 4.2.1.96),
+ highly similar to NP_301253.1|NC_002677 putative
+ molybdenum cofactor biosynthesis protein from
+ Mycobacterium leprae (181 aa), FASTA score: (92.3%
+ identity in 181 aa overlap). Also similar to others e.g.
+ CAB59675.1|AL132674 molybdenum cofactor biosynthesis
+ protein from Streptomyces coelicolor (179 aa);
+ Q56208|MOCB_SYNP7 MOLYBDENUM COFACTOR BIOSYNTHESIS PROTEIN
+ CB from Synechococcus sp. (319 aa), FASTA score: (37.3%
+ identity in 142 aa overlap); C-terminus of
+ NP_197599.1|NC_003076 MOLYBDOPTERIN BIOSYNTHESIS CNX1
+ PROTEIN from Arabidopsis thaliana (670 aa); etc. Also
+ similar to Rv0865|MOG from Mycobacterium tuberculosis (160
+ aa); and other mog proteins e.g. CAC39235.1|AJ312124 Mog
+ protein from Eubacterium acidaminophilum (162 aa). COULD
+ BELONG TO THE PTERIN-4-ALPHA-CARBINOLAMINE DEHYDRATASE
+ FAMILY. Alternative start codon has been suggested in
+ position 1100508. Protein product from Mb1010 detected
+ using shotgun mass spectrometry. Mb1010 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PTERIN-4-ALPHA-CARBINOLAMINE
+ DEHYDRATASE MOAB2 (PHS) (4-ALPHA-HYDROXY-TETRAHYDROPTERIN
+ DEHYDRATASE) (PTERIN-4-A-CARBINOLAMINE DEHYDRATASE)
+ (PHENYLALANINE HYDROXYLASE-STIMULATING PROTEIN) (PHS)
+ (PTERIN CARBINOLAMINE DEHYDRATASE) (PCD)"
+ /protein_id="SIT99609.1"
+ /db_xref="InterPro:IPR001453"
+ /db_xref="InterPro:IPR036425"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX15"
+ /translation="MKVAAQCSKLGYTVAPMEQRAELVVGRALVVVVDDRTAHGDEDH
+ SGPLVTELLTEAGFVVDGVVAVSADEVEIRNALNTAVIGGVDLVVSVGGTGVTPRDVT
+ PEATRDILDREILGIAEAIRASGLSAGIVDAGLSRGLAGVSGSTLVVNLAGSRYAVRD
+ GMATLNPLAAQIIGQLSSLEI"
+ gene complement(1101504..1101959)
+ /gene="mscL"
+ /locus_tag="BQ2027_MB1011C"
+ CDS complement(1101504..1101959)
+ /gene="mscL"
+ /locus_tag="BQ2027_MB1011C"
+ /note="Mb1011c, mscL, len: 151 aa. Equivalent to Rv0985c,
+ len: 151 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 151 aa overlap). Possible mscL, large
+ conductance mechanosensitive ion channel (integral
+ membrane protein), equivalent to
+ AL035500|MLCL373_19|NP_301254.1|NC_002677 putative
+ mechanosensitive channel protein from Mycobacterium leprae
+ (154 aa), FASTA score: (71.0% identity in 155 aa overlap).
+ Also highly similar to others e.g. NP_268999.1|NC_002737
+ putative large conductance mechanosensitive channel from
+ Streptococcus pyogenes (120 aa); CAB90974.1|AL355832
+ putative mechanosensitive channel from Streptomyces
+ coelicolor (156 aa); Q9X722|MSCL_CLOHI LARGE-CONDUCTANCE
+ MECHANOSENSITIVE CHANNEL from Clostridium histolyticum
+ (133 aa); Z83337|BSZ83337_6 large conductance
+ mechanosensitive channel from Bacillus subtilis (130 aa),
+ FASTA scores: opt: 248, E(): 8.4e-10, (39.0% identity in
+ 136 aa overlap); U08371|ECU08371_1 large conductance
+ mechanosensitive channel from Escherichia coli strain K-12
+ (136 aa), FASTA score: (36.6% identity in 134 aa overlap);
+ etc. BELONGS TO THE MSCL FAMILY. Protein product from
+ Mb1011c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1011c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE LARGE-CONDUCTANCE ION MECHANOSENSITIVE
+ CHANNEL MSCL"
+ /protein_id="SIT99610.1"
+ /db_xref="GOA:P0A5K9"
+ /db_xref="InterPro:IPR001185"
+ /db_xref="InterPro:IPR019823"
+ /db_xref="InterPro:IPR036019"
+ /db_xref="InterPro:IPR037673"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5K9"
+ /translation="MLKGFKEFLARGNIVDLAVAVVIGTAFTALVTKFTDSIITPLIN
+ RIGVNAQSDVGILRIGIGGGQTIDLNVLLSAAINFFLIAFAVYFLVVLPYNTLRKKGE
+ VEQPGDTQVVLLTEIRDLLAQTNGDSPGRHGGRGTPSPTDGPRASTESQ"
+ gene 1102282..1103028
+ /locus_tag="BQ2027_MB1012"
+ CDS 1102282..1103028
+ /locus_tag="BQ2027_MB1012"
+ /note="Mb1012, -, len: 248 aa. Equivalent to Rv0986, len:
+ 248 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 248 aa overlap). Probable ATP-binding
+ protein ABC transporter supposed involved in transport of
+ adhesion component (see citation below), highly similar to
+ many ATP-binding proteins e.g. AE0010|AE001033_8 ABC
+ transporter ATP-binding protein from Archaeoglobus
+ fulgidus (228 aa), FASTA scores: opt: 669, E(): 0, (45.7%
+ identity in 219 aa overlap); CAB81857.1|AL161691 putative
+ ABC-transporter ATP-binding protein from Streptomyces
+ coelicolor (246 aa); X84019|ZMDNAGRP_4 glutamate uptake
+ regulatory protein (grp) from Z.mobilis (232 aa), FASTA
+ score: (44.4% identity in 225 aa overlap);
+ Z99111|BSUB0008_108 from Bacillus subtilis (230 aa), FASTA
+ score: (38.7% identity in 222 aa overlap); etc. Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop), and PS00211
+ ABC transporters family signature. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Protein product from Mb1012 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1012 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ADHESION COMPONENT TRANSPORT
+ ATP-BINDING PROTEIN ABC TRANSPORTER"
+ /protein_id="SIT99611.1"
+ /db_xref="GOA:A0A1R3XX09"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX09"
+ /translation="MNRQPIVQLSNLSWTFREGETRRQVLDHITFDFEPGEFVALLGQ
+ SGSGKSTLLNLISGIEKPTTGDVTINGFAITQKTERDRTLFRRDQIGIVFQFFNLIPT
+ LTVLENITLPQELAGVSQRKAAVVARDLLEKVGMADRERTFPDKLSGGEQQRVAISRA
+ LAHNPMLVLADEPTGNLDSDTGDKVLDVLLDLTRQAGKTLIMATHSPSMTQHADRVVN
+ LQGGRLIPALNRENQTDQPASTILLPTSYE"
+ gene 1103021..1104292
+ /locus_tag="BQ2027_MB1013"
+ CDS 1103021..1104292
+ /locus_tag="BQ2027_MB1013"
+ /note="Mb1013, -, len: 423 aa. Equivalent to 5' end of
+ Rv0987, len: 855 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 423 aa overlap). Probable
+ transmembrane protein ABC transporter supposed involved in
+ transport of adhesion component (see citation below),
+ whose N-terminus shows similarity with hypothetical
+ proteins, generally transmembrane proteins, e.g.
+ CAB96016.1|AL360055 putative ABC transport system integral
+ membrane protein from Streptomyces coelicolor (855 aa);
+ P44252|YCFU_HAEIN|HI1555 HYPOTHETICAL PROTEIN from
+ Haemophilus influenzae (393 aa), FASTA scores: opt: 265,
+ E(): 1.7e-09, (23.6% identity in 402 aa overlap); etc.
+ N-and C-termini respectively show similarity to O32735
+ ATTF PROTEIN (420 aa), FASTA scores: E(): 1e-09, (26.7%
+ identity in 430 aa overlap), and G2340078 ATTG PROTEIN
+ (359 aa), FASTA scores: E(): 2.7e-08, (27.8% identity in
+ 356 aa overlap). Contains PS00017 ATP/GTP-binding site
+ motif A (P-loop). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv0987 exists as
+ a single gene. In Mycobacterium bovis, a single base
+ transition (g-a) introduces a stop codon that splits
+ Rv0987 in two parts, Mb1013 and Mb1014. Mb1013 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ADHESION COMPONENT TRANSPORT
+ TRANSMEMBRANE PROTEIN ABC TRANSPORTER"
+ /protein_id="SIT99612.1"
+ /db_xref="GOA:A0A1R3XZ45"
+ /db_xref="InterPro:IPR003838"
+ /db_xref="InterPro:IPR025857"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ45"
+ /translation="MNDQAPVAYAPLWRTAWRRLRQRPFQYILLVLGIALGVAMIVAI
+ DVSSNSAQRAFDLSAAAITGKSTHRLVSGPAGVDQQLYVDLRRHGYDFSAPVIEGYVL
+ ARGLGNRAMQFMGTDPFAESAFRSPLWSNQNIAELGGFLTRPNGVVLSRQVAQKYGLA
+ VGDRIALQVKGAPTTVTLVGLLTPADEVSNQKLSDLIIADISTAQELFHMPGRLSHID
+ LIIKDEATATRIQQRLPAGVRMETSDTQRDTVKQMTDAFTVNLTALSLIALLVGIFLI
+ YNTVTFNVVQRRPFFAILRCLGVTREQLFWLIMTESLVAGLIGTGLGLLIGIWLGEGL
+ IGLVTQTINDFYFVINVRNVSVSAESLLKGLIIGIFAAMLATLPPAIEAMRTVPASTL
+ RRSSLESKITKLMPWLWVAWFGLGSFGVLML"
+ gene 1104293..1105588
+ /locus_tag="BQ2027_MB1014"
+ CDS 1104293..1105588
+ /locus_tag="BQ2027_MB1014"
+ /note="Mb1014, -, len: 431 aa. Equivalent to 3' end of
+ Rv0987, len: 855 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 431 aa overlap). Probable
+ transmembrane protein ABC transporter supposed involved in
+ transport of adhesion component (see citation below),
+ whose N-terminus shows similarity with hypothetical
+ proteins, generally transmembrane proteins, e.g.
+ CAB96016.1|AL360055 putative ABC transport system integral
+ membrane protein from Streptomyces coelicolor (855 aa);
+ P44252|YCFU_HAEIN|HI1555 HYPOTHETICAL PROTEIN from
+ Haemophilus influenzae (393 aa), FASTA scores: opt: 265,
+ E(): 1.7e-09, (23.6% identity in 402 aa overlap); etc.
+ N-and C-termini respectively show similarity to O32735
+ ATTF PROTEIN (420 aa), FASTA scores: E(): 1e-09, (26.7%
+ identity in 430 aa overlap), and G2340078 ATTG PROTEIN
+ (359 aa), FASTA scores: E(): 2.7e-08, (27.8% identity in
+ 356 aa overlap). Contains PS00017 ATP/GTP-binding site
+ motif A (P-loop). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv0987 exists as
+ a single gene. In Mycobacterium bovis, a single base
+ transition (g-a) introduces a stop codon that splits
+ Rv0987 into two parts, Mb1013 and Mb1014. Protein product
+ from Mb1014 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ADHESION COMPONENT TRANSPORT
+ TRANSMEMBRANE PROTEIN ABC TRANSPORTER"
+ /protein_id="SIT99613.1"
+ /db_xref="GOA:A0A1R3XY07"
+ /db_xref="InterPro:IPR003838"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY07"
+ /translation="MPGNNLVVAFVGLFSVLIALALIAPPLTRFVMLRLAPGLGRLLG
+ PIGRMAPRNIVRSLSRTSIAIAALMMAVSLMVGVSISVGSFRQTLANWLEVTLKSDVY
+ VSPPTLTSGRPSGNLPVDAVRNISKWPGVRDAVMARYSSVFAPDWGREVELMAVSGDI
+ SDGKRPYRWIDGNKDTLWPRFLAGKGVMLSEPMVSRQHLQMPPRPITLMTDSGPQTFP
+ VLAVFSDYTSDQGVILMDRASYRAHWQDDDVTTMFLFLASGANSGALIDQLQAAFAGR
+ EDIVIQSTHSVREASMVIFDRSFTITIALQLVATVVAFIGVLSALMSLELDRAHELGV
+ FRAIGMTTRQLWKLMFIETGLMGGMAGLMALPTGCILAWILVRIINVRSFGWTLQMHF
+ ESAHFLRALLVAVVAALAAGMYPAWRLGRMTIRTAIREE"
+ gene 1105595..1106755
+ /locus_tag="BQ2027_MB1015"
+ CDS 1105595..1106755
+ /locus_tag="BQ2027_MB1015"
+ /note="Mb1015, -, len: 386 aa. Equivalent to Rv0988, len:
+ 386 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 386 aa overlap). Possible conserved
+ exported protein, with potential N-terminal signal
+ sequence, similar (except in N-terminus) to O32737|L63540
+ ATTH PROTEIN from Agrobacterium tumefaciens (355 aa),
+ FASTA scores: opt: 651, E(): 5.7e-33, (33.4% identity in
+ 344 aa overlap); and NP_231265.1|NC_002505 conserved
+ hypothetical protein from Vibrio cholerae (372 aa).
+ Protein product from Mb1015 detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED EXPORTED PROTEIN"
+ /protein_id="SIT99614.1"
+ /db_xref="InterPro:IPR010791"
+ /db_xref="InterPro:IPR023374"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX28"
+ /translation="MRKAGLTGVVLVLTLTLVAFWWWQRPRTNAVAADSLVGVLVDEN
+ NAGYSLATVPGAIRFPRDLGPHYDYQTEWWYYTGNLETADGRLFGYQLTFFRRALAPP
+ GEGVAIADASSWRTTQVYMAHFAISDISNRGFDPAEKFSRQALGLAGASSEPYAVWLD
+ DWYARESNNNSVQLFARTQNTVLDLTLTQTLPPILQGNAGLSVKGAQPGNASNYYSLV
+ RQESRGTVSVNGDTFMVSGLSWKDHEYMTSALAPEDVGWDWFGLQFYNGTALMLFQIR
+ QADGSVTRFSSGTFVAGDGGVIPLESSDFRIKTTDRWTSDQSGATYPIAWEIEIERIG
+ LTLRGAALMANQELRLSRTYWEGAVALEGRYQGMPISGRGYVEMTGYVQRLS"
+ gene complement(1106884..1107861)
+ /gene="grcC2"
+ /locus_tag="BQ2027_MB1016C"
+ CDS complement(1106884..1107861)
+ /gene="grcC2"
+ /locus_tag="BQ2027_MB1016C"
+ /note="Mb1016c, grcC2, len: 325 aa. Equivalent to Rv0989c,
+ len: 325 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 325 aa overlap). Probable grcC2,
+ polyprenyl diphosphate synthetase (EC 2.5.1.-), highly
+ similar to NP_302483.1|NC_002677 polyprenyl diphosphate
+ synthase component from Mycobacterium leprae (330 aa).
+ Also similar to others (generally hepta (EC 2.5.1.30) or
+ hexaprenyl e.g. NP_471378.1|NC_003212 protein similar to
+ heptaprenyl diphosphate synthase component II (menaquinone
+ biosynthesis) from Listeria innocua (321 aa);
+ NP_371994.1|NC_002758 heptaprenyl diphosphate syntase
+ component II from Staphylococcus aureus subsp. aureus Mu50
+ (319 aa); P55785|HEP2_BACST heptaprenyl diphosphate
+ synthase component from Bacillus subtilis (323 aa), FASTA
+ scores: opt: 496, E(): 1.4e-24, (31.4% identity in 306 aa
+ overlap); etc. Also highly similar to Mycobacterium
+ tuberculosis proteins e.g.
+ Rv0562|grcC1|NP_215076.1|MTCY25D10.41 PROBABLE
+ POLYPRENYL-DIPHOSPHATE SYNTHASE (335 aa); Rv3383, Rv3398c,
+ Rv2173, etc. SEEMS TO BELONG TO THE FPP/GGPP SYNTHETASES
+ FAMILY. Protein product from Mb1016c detected using SWATH
+ mass spectrometry. Mb1016c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE POLYPRENYL-DIPHOSPHATE SYNTHASE GRCC2
+ (POLYPRENYL PYROPHOSPHATE SYNTHETASE)"
+ /protein_id="SIT99615.1"
+ /db_xref="GOA:A0A1R3XXD6"
+ /db_xref="InterPro:IPR000092"
+ /db_xref="InterPro:IPR008949"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXD6"
+ /translation="MIPAVSLGDPQFTANVHDGIARITELINSELSQADEVMRDTVAH
+ LVDAGGTPFRPLFTVLAAQLGSDPDGWEVTVAGAAIELMHLGTLCHDRVVDESDMSRK
+ TPSDNTRWTNNFAILAGDYRFATASQLASRLDPEAFAVVAEAFAELITGQMRATRGPA
+ SHIDTIEHYLRVVHEKTGSLIAASGQLGAALSGAAEEQIRRVARLGRMIGAAFEISRD
+ IIAISGDSATLSGADLGQAVHTLPMLYALREQTPDTSRLRELLAGPIHDDHVAEALTL
+ LRCSPGIGKAKNVVAAYAAQAREELPYLPDRQPRRALATLIDHAVSACD"
+ gene complement(1107922..1108578)
+ /locus_tag="BQ2027_MB1017C"
+ CDS complement(1107922..1108578)
+ /locus_tag="BQ2027_MB1017C"
+ /note="Mb1017c, -, len: 218 aa. Equivalent to Rv0990c,
+ len: 218 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 218 aa overlap). Hypothetical unknown
+ protein. Mb1017c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Heat shock protein 22.5 (Hsp22.5)"
+ /protein_id="SIT99616.1"
+ /db_xref="InterPro:IPR013974"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX16"
+ /translation="MAESSLNPSLVSRISAFLRPDWTRTVRARRFAAAGLVMLAGVAA
+ LRSNPEDDRAEVVVAAHDLRPGTALTPGDVRLEKRSATTLPDGSQADLDAVVGSTLAS
+ PTRRGEVLTDVRLLGSRLAESTAGPDARIVPLHLADSALVDLVRVGDVVDVLAAPVTD
+ SPAALRLLATDAIVVLVSAQQKAQAADSDRVVLVALPARLANTVAGAALGQTVTLTLH
+ "
+ gene complement(1108651..1108983)
+ /locus_tag="BQ2027_MB1018C"
+ CDS complement(1108651..1108983)
+ /locus_tag="BQ2027_MB1018C"
+ /note="Mb1018c, -, len: 110 aa. Equivalent to Rv0991c,
+ len: 110 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 110 aa overlap). Conserved hypothetical
+ ser-rich protein (especially in C-terminus), highly
+ similar to N-terminus of NP_301255.1|NC_002677 conserved
+ hypothetical protein (Ser-rich C-terminus) from
+ Mycobacterium leprae (99 aa). Also highly similar to
+ SCE22.04|AB90971.1|AL355832 hypothetical protein from
+ Streptomyces coelicolor (110 aa); and similar to others.
+ Protein product from Mb1018c detected using shotgun mass
+ spectrometry. Mb1018c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved serine rich protein"
+ /protein_id="SIT99617.1"
+ /db_xref="InterPro:IPR013429"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX18"
+ /translation="MPTYSYECTQCANRFDVVQAFTDDALTTCERCSGRLRKLFNAVG
+ VVFKGTGFYRTDSRESGKKSKSQTNGSSTSESTKSSGSSGSSGSSESKASGSTEKSTS
+ STTAAAAV"
+ gene complement(1109057..1109650)
+ /locus_tag="BQ2027_MB1019C"
+ CDS complement(1109057..1109650)
+ /locus_tag="BQ2027_MB1019C"
+ /EC_number="6.3.3.2"
+ /note="Mb1019c, -, len: 197 aa. Equivalent to Rv0992c,
+ len: 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 197 aa overlap). Conserved hypothetical
+ protein, equivalent to NP_301256.1|NC_002677 conserved
+ hypothetical protein from Mycobacterium leprae (197 aa).
+ Also similar, except in N-terminus, to other hypothetical
+ proteins and ligases e.g. SCE87.34|CAB59679.1|AL132674
+ hypothetical protein from Streptomyces coelicolor (204
+ aa); NP_461977.1|NC_003197 putative ligase from Salmonella
+ typhimurium (182 aa); P09160|YGFA_ECOLI HYPOTHETICAL 21.1
+ kDa PROTEIN from Escherichia coli (182 aa), FASTA scores:
+ opt: 191, E(): 1.1e-09, (29.5% identity in 146 aa
+ overlap); etc. Protein product from Mb1019c detected using
+ shotgun mass spectrometry. Mb1019c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="5-formyltetrahydrofolate cyclo-ligase (EC"
+ /protein_id="SIT99618.1"
+ /db_xref="GOA:A0A1R3XX02"
+ /db_xref="InterPro:IPR002698"
+ /db_xref="InterPro:IPR024185"
+ /db_xref="InterPro:IPR037171"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX02"
+ /translation="MAIASKSALRDQLLAARRRVADDVRAAEARMLRGHLERMVTSDS
+ TVCAYVPVGGEPGSIEMLDVLLRRAGRVLLPVARTAGGDLPLPLRWGEYRAGGLARAR
+ WGLLEPPEPWLPEAALAQASLVLVPALAVDRQGVRLGRGRGFYDRSLRCRDPHARLVA
+ VVRTVELVDVLPSEPHDVPMTHALTPERGLIALPCGE"
+ gene 1109751..1110671
+ /gene="galU"
+ /locus_tag="BQ2027_MB1020"
+ CDS 1109751..1110671
+ /gene="galU"
+ /locus_tag="BQ2027_MB1020"
+ /note="Mb1020, galU, len: 306 aa. Equivalent to Rv0993,
+ len: 306 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 306 aa overlap). Probable galU,
+ UTP--glucose-1-phosphate uridylyltransferase (EC 2.7.7.9),
+ equivalent to AL035500|MLCL373_22 putative
+ UTP-glucose-1-phosphate uridylyltransferase from
+ Mycobacterium leprae (306 aa), FASTA score: (89.7%
+ identity in 302 aa overlap). Also highly similar to others
+ e.g. AB59678.1|AL132674 UTP-glucose-1-phosphate
+ uridylyltransferase from Streptomyces coelicolor (303 aa);
+ NP_244519.1|NC_002570 UTP-glucose-1-phosphate
+ uridylyltransferase from Bacillus halodurans (297 aa);
+ P25520|GALU_ECOLI|B1236|Z2012|ECS17
+ UTP--glucose-1-phosphate uridylyltransferase from
+ Escherichia coli strains K12 and O157:H7 (301 aa), FASTA
+ scores: opt: 624, E(): 2.4e-33, (38.8% identity in 299 aa
+ overlap); etc. BELONGS TO THE PROKARYOTIC UDPGP FAMILY.
+ Protein product from Mb1020 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1020 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="utp--glucose-1-phosphate uridylyltransferase
+ galu (udp-glucose pyrophosphorylase) (udpgp)
+ (alpha-d-glucosyl-1-phosphate uridylyltransferase)
+ (uridine diphosphoglucose pyrophosphorylase)"
+ /protein_id="SIT99619.1"
+ /db_xref="GOA:A0A1R3XX25"
+ /db_xref="InterPro:IPR005771"
+ /db_xref="InterPro:IPR005835"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX25"
+ /translation="MSRPEVLTPFTAIVPAAGLGTRFLPATKTVPKELLPVVDTPGIE
+ LVAAEAAAAGAERLVIVTSEGKDGVVAHFVEDLVLEGTLEARGKIAMLAKVRRAPALI
+ KVESVVQAEPLGLGHAIGCVEPTLSPDEDAVAVLLPDDLVLPTGVLETMSKVRASRGG
+ TVLCAIEVAREEISAYGVFDVEPVPDGDYTDDPNVLKVRGMVEKPKAETAPSRYAAAG
+ RYVLDRAIFDALRRIDRGAGGEVQLTDAIALLIAEGHPVHVVVHQGSRHDLGNPGGYL
+ KAAVDFALDRDDYGPDLRRWLVARLGLTEQ"
+ gene 1110748..1112028
+ /gene="moeA1"
+ /locus_tag="BQ2027_MB1021"
+ CDS 1110748..1112028
+ /gene="moeA1"
+ /locus_tag="BQ2027_MB1021"
+ /note="Mb1021, moeA1, len: 426 aa. Equivalent to Rv0994,
+ len: 426 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 426 aa overlap). Probable moeA1,
+ molybdenum cofactor biosynthesis protein, equivalent to
+ AL035500|MLCL373_23 putative molybdopterin biosynthesis
+ protein from Mycobacterium leprae (424 aa), FASTA score:
+ (88.3% identity in 426 aa overlap). Also highly similar to
+ many e.g. CAB59677.1|AL132674 molybdopterin biosynthesis
+ protein from Streptomyces coelicolor (424 aa);
+ NP_385769.1|NC_003047 PROBABLE MOLYBDOPTERIN BIOSYNTHESIS
+ PROTEIN from Sinorhizobium meliloti (406 aa);
+ P12281|MOEA_ECOLI molybdopterin biosynthesis moea protein
+ from Escherichia coli (411 aa), FASTA scores: opt: 519,
+ E(): 1.3e-24, (32.3% identity in 402 aa overlap); etc.
+ Also similar to MOEA2|Rv0438c|MTV037.02c PROBABLE
+ MOLYBDOPTERIN BIOSYNTHESIS PROTEIN from Mycobacterium
+ tuberculosis (405 aa). Note that previously known as moeA.
+ Protein product from Mb1021 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1021 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MOLYBDOPTERIN BIOSYNTHESIS PROTEIN
+ MOEA1"
+ /protein_id="SIT99620.1"
+ /db_xref="GOA:A0A1R3XX20"
+ /db_xref="InterPro:IPR001453"
+ /db_xref="InterPro:IPR005110"
+ /db_xref="InterPro:IPR005111"
+ /db_xref="InterPro:IPR036135"
+ /db_xref="InterPro:IPR036425"
+ /db_xref="InterPro:IPR036688"
+ /db_xref="InterPro:IPR038987"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX20"
+ /translation="MRSVEEQQARISAAAVAPRPIRVAIAEAQGLMCAEEVVTERPMP
+ GFDQAAIDGYAVRSVDVAGVGDTGGVQVFADHGDLDGRDVLTLPVMGTIEAGARTLSR
+ LQPRQAVRVQTGAPLPTLADAVLPLRWTDGGMSRVRVLRGAPSGAYVRRAGDDVQPGD
+ VAVRAGTIIGAAQVGLLAAVGRERVLVHPRPRLSVMAVGGELVDISRTPGNGQVYDVN
+ SYALAAAGRDAGAEVNRVGIVSNDPTELGEIVEGQLNRAEVVVIAGGVGGAAAEAVRS
+ VLSELGEMEVVRVAMHPGSVQGFGQLGRDGVPTFLLPANPVSALVVFEVMVRPLIRLS
+ LGKRHPMRRIVSARTLSPITSVAGRKGYLRGQLMRDQDSGEYLVQALGGAPGASSHLL
+ ATLAEANCLVVVPTGAEQIRTGEIVDVAFLAQHG"
+ gene 1112091..1112702
+ /gene="rimJ"
+ /locus_tag="BQ2027_MB1022"
+ CDS 1112091..1112702
+ /gene="rimJ"
+ /locus_tag="BQ2027_MB1022"
+ /note="Mb1022, rimJ, len: 203 aa. Equivalent to Rv0995,
+ len: 203 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 203 aa overlap). Possible rimJ,
+ ribosomal-protein-alanine acetyltransferase (EC
+ 2.3.1.128), equivalent to AL035500|MLCL373_24 probable
+ acyltransferase from Mycobacterium leprae (218 aa), FASTA
+ scores: (86.0% identity in 200 aa overlap). Also similar
+ to others and many acyltransferases e.g.
+ BAB69252.1|AB070946 possible acyltransferase from
+ Streptomyces avermitilis (156 aa); NP_385025.1|NC_003047
+ PROBABLE RIBOSOMAL-PROTEIN-ALANINE ACETYLTRANSFERASE from
+ Sinorhizobium meliloti (203 aa);
+ P09454|RIMJ_ECOLI|B1066|Z1703|ECS1444
+ ribosomal-protein-alanine acetyltransferase from
+ Escherichia coli strains K12 and O157:H7 (194 aa), FASTA
+ scores: opt: 247, E(): 1.5e-10, (26.9% identity in 186 aa
+ overlap). SEEMS TO BELONG TO THE ACETYLTRANSFERASE FAMILY,
+ RIMJ SUBFAMILY. Protein product from Mb1022 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1022 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ribosomal-protein-alanine acetyltransferase rimj
+ (acetylating enzyme for n-terminal of ribosomal protein
+ s5)"
+ /protein_id="SIT99621.1"
+ /db_xref="GOA:A0A1R3XX19"
+ /db_xref="InterPro:IPR000182"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX19"
+ /translation="MAVGPLRVSAGVIRLRPVRMRDGVHWSRIRLADRAHLEPWEPSA
+ DGEWTVRHTVAAWPAVCSGLRSEARNGRMLPYVIELDGQFCGQLTIGNVTHGALRSAW
+ IGYWVPSAATGGGVATGALALGLDHCFGPVMLHRVEATVRPENAASRAVLAKVGFREE
+ GLLRRYLEVDRAWRDHLLMAITVEEVYGSVASTLVRAGHASWP"
+ gene 1112863..1113939
+ /locus_tag="BQ2027_MB1023"
+ CDS 1112863..1113939
+ /locus_tag="BQ2027_MB1023"
+ /note="Mb1023, -, len: 358 aa. Equivalent to Rv0996, len:
+ 358 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 358 aa overlap). Probable conserved
+ transmembrane protein, equivalent to AL035500|MLCL373_25
+ putative membrane protein from Mycobacterium leprae (342
+ aa), FASTA scores: (66.4% identity in 360 aa overlap).
+ Contains possible signal sequence and other hydrophobic
+ domains. Mb1023 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99622.1"
+ /db_xref="GOA:A0A1R3XZ60"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ60"
+ /translation="MPSIPQSLLWISLVVLWLFVLVPMLISKRDAVRRTSDVALATRV
+ LNGGAGARLLKRGGPAAGHRWGYLPPEGQGDDPDWKPEEDWRDDPVEGGFADVEHDID
+ EDQEADDARRRGAVVMKVAAPQTAGADEPDYLDVDVVEEDSEALPVGAGAAVGESADE
+ ADAEAADGVAGHADPEADPVEYEYEYEYVEDTCGLELEEDDQEAPPTVASGTSRRRRF
+ DTKTAAAVSARKYTFRKRALIVMAVILVGSAAAAFELTPVAWWICGSATGVTVLYLAY
+ LRRQTRIEEKVRRRRMQRIARARLGVQNTRDREYDVVPSRLRRPGAVVLEIDDEDPIF
+ THLESAAPIRNYGWPRDLPRAVGQ"
+ gene 1113956..1114028
+ /locus_tag="BQ2027_ALAV"
+ tRNA 1113956..1114028
+ /locus_tag="BQ2027_ALAV"
+ /product="tRNA-Ala"
+ /note="alaV, len: 73 nt. Equivalent to alaV, len: 73 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 73 nt overlap). tRNA-Ala, anticodon cgc."
+ gene 1114340..1114591
+ /locus_tag="BQ2027_MB1023A"
+ CDS 1114340..1114591
+ /locus_tag="BQ2027_MB1023A"
+ /note="unnamed protein product; unnamed protein product;
+ Mb1023A, len: 83 aa. No equivalent in M. tuberculosis
+ H37Rv. Identified by de novo proteomics of Mycobacterium
+ bovis AF2122/97 under exponential conditions,Mb1023A found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing"
+ /codon_start=1
+ /transl_table=11
+ /protein_id="SIT99623.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY17"
+ /translation="MSTKYYLQKVPVEAVQPGFSLAIPHDGDYRLFQVDCTQMCQRSG
+ QPVMIRLMSESVDGGQPWVLEYEAGTAVIRLLGVCQAAS"
+ gene 1114772..1115203
+ /locus_tag="BQ2027_MB1024"
+ CDS 1114772..1115203
+ /locus_tag="BQ2027_MB1024"
+ /note="Mb1024, -, len: 143 aa. Equivalent to Rv0997, len:
+ 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 143 aa overlap). Hypothetical unknown
+ protein, equivalent to AAK45276.1 from Mycobacterium
+ tuberculosis strain CDC1551 (87 aa) but longer 56 aa.
+ Mb1024 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99624.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX36"
+ /translation="MAGIAGVDRDPPGWPQHSHLLAGDPERFRHQLQRAETTNSIECF
+ VAEWHHAGVAADMTRPWPTVVQGGAGQRRRRDVEPDRKTPVRWMSGQRLSEITWPTTD
+ IEHSVGAAEVQRHRGAVPLGSGGDAAGKVEGGRTPQPFVQP"
+ gene 1115227..1116228
+ /locus_tag="BQ2027_MB1025"
+ CDS 1115227..1116228
+ /locus_tag="BQ2027_MB1025"
+ /EC_number="2.3.1.-"
+ /note="Mb1025, -, len: 333 aa. Equivalent to Rv0998, len:
+ 333 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 333 aa overlap). Conserved hypothetical
+ protein, possibly cyclic nucleotide-dependent protein
+ kinase (EC 2.7.-.-), highly similar to
+ NP_301261.1|NC_002677 conserved hypothetical protein from
+ Mycobacterium leprae (353 aa); and
+ AL035500|MLCL373.38|T45457 hypothetical protein from
+ Mycobacterium leprae (143 aa), FASTA score: (61.5%
+ identity in 143 aa overlap). Also similar to many
+ hypothetical proteins and cyclic-NMP-dependent protein
+ kinases (generally at C-terminus) e.g. N-terminus of
+ SC9B10.09|T35878 hypothetical protein from Streptomyces
+ coelicolor (1039 aa); P05987|KAPR_DICDI CAMP-DEPENDENT
+ PROTEIN KINASE REGULATORY CHAIN (EC 2.7.1.37) from
+ Dictyostelium discoideum (327 aa), FASTA scores: opt: 177,
+ E(): 0.00036, (32.0% identity in 122 aa overlap);
+ NP_104403.1|NC_002678 hypothetical protein (contains
+ similarity to cAMP-dependent protein kinase regulatory
+ subunit) from Mesorhizobium loti (151 aa); etc. Contains
+ PS00889 Cyclic nucleotide-binding domain signature 2.
+ Protein product from Mb1025 detected using SWATH mass
+ spectrometry. Mb1025 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein lysine acetyltransferase Pat (EC,
+ Mycobacterial type"
+ /protein_id="SIT99625.1"
+ /db_xref="GOA:A0A1R3XXE5"
+ /db_xref="InterPro:IPR000182"
+ /db_xref="InterPro:IPR000595"
+ /db_xref="InterPro:IPR014710"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="InterPro:IPR018488"
+ /db_xref="InterPro:IPR018490"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXE5"
+ /translation="MDGIAELTGARVEDLAGMDVFQGCPAEGLVSLAASVQPLRAAAG
+ QVLLRQGEPAVSFLLISSGSAEVSHVGDDGVAIIARALPGMIVGEIALLRDSPRSATV
+ TTIEPLTGWTGGRGAFATMVHIPGVGERLLRTARQRLAAFVSPIPVRLADGTQLMLRP
+ VLPGDRERTVHGHIQFSGETLYRRFMSARVPSPALMHYLSEVDYVDHFVWVVTDGSDP
+ VADARFVRDETDPTVAEIAFTVADAYQGRGIGSFLIGALSVAARVDGVERFAARMLSD
+ NVPMRTIMDRYGAVWQREDVGVITTMIDVPGPGELSLGREMVDQINRVARQVIEAVG"
+ gene 1116246..1117004
+ /locus_tag="BQ2027_MB1026"
+ CDS 1116246..1117004
+ /locus_tag="BQ2027_MB1026"
+ /note="Mb1026, -, len: 252 aa. Equivalent to Rv0999, len:
+ 252 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 252 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1026 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1026 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIT99626.1"
+ /db_xref="InterPro:IPR041313"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX26"
+ /translation="MRPPLAPQFAADLLVKTVSTLRSSGAALGRLTTMRKAVLAVGSV
+ CWLVGCSSGASSTTASTGDIAKVAEVKSGFGPEYTVTDVTPRAIDPGFFSARKLPDGL
+ SFDPANCAQVAAGPQLPTGLQGNMAAVSAEGNGNRFVVIAVETSQPLPAPSPGKDCSK
+ VTFSGTQLRGGIEVVDVPHIDGTQTLGVHRVLQAVVGGSARTGELYDYSARFGDYQVI
+ VIANPLVIPGRPVARVDTQRARDLLVQAVAAVRG"
+ gene complement(1117010..1117627)
+ /locus_tag="BQ2027_MB1027C"
+ CDS complement(1117010..1117627)
+ /locus_tag="BQ2027_MB1027C"
+ /note="Mb1027c, -, len: 205 aa. Equivalent to Rv1000c,
+ len: 205 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 205 aa overlap). Conserved hypothetical
+ protein, equivalent to ML0190|NP_301263.1|NC_002677
+ conserved hypothetical protein from Mycobacterium leprae
+ (205 aa). Also highly similar to
+ SC5F8.12c|CAB93740.1|AL357613 hypothetical protein from
+ Streptomyces coelicolor (210 aa), FASTA scores: E():
+ 2.1e-45, (56.8% identity);
+ 9106290|AAF84108.1|AE003963_5|NP_298588.1|NC_002488
+ protein described as DNA repair system specific for
+ alkylated DNA from Xylella fastidiosa (200 aa), FASTA
+ scores: E(): 3.4e-14, (38.55% identity); and similar in
+ C-terminus to other hypothetical proteins. Note that
+ replaces original Rv1000 predicted on other strand.
+ Mb1027c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Alkylated DNA repair protein AlkB"
+ /protein_id="SIT99627.1"
+ /db_xref="GOA:A0A1R3XX27"
+ /db_xref="InterPro:IPR005123"
+ /db_xref="InterPro:IPR027450"
+ /db_xref="InterPro:IPR032854"
+ /db_xref="InterPro:IPR037151"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX27"
+ /translation="MCDKLGGVAIAVQGALFEHNERRQLGDGAFIDIRSGWLTGGEEL
+ LDALLSTVPWRAERRQMYDRVVDVPRLVSFHDLTIEDPPHPQLARMRRRLNDIYGGEL
+ GEPFTTAGLCYYRDGSDSVAWHGDTIGRGSTEDTMVAIVSLGATRVFALRPRGRGPSL
+ RLPLAHGDLLVMGGSCQRTFEHAVPKTSAPTGPRVSIQFRPRDVR"
+ gene 1117664..1118872
+ /gene="arcA"
+ /locus_tag="BQ2027_MB1028"
+ CDS 1117664..1118872
+ /gene="arcA"
+ /locus_tag="BQ2027_MB1028"
+ /note="Mb1028, arcA, len: 402 aa. Equivalent to Rv1001,
+ len: 402 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 402 aa overlap). Probable arcA, arginine
+ deiminase (EC 3.5.3.6), similar to e.g. ARCA_PSEAE|P13981
+ arginine deiminase (417 aa), fasta scores: opt: 581, E():
+ 1.4e-31, (39.4% identity in 411 aa overlap); also similar
+ to SAGP_STRPY|P16962 streptococcal acid glycoprotein (410
+ aa), FASTA scores, opt: 823, E():0, (38.3% identity in 402
+ aa overlap). BELONGS TO THE ARGININE DEIMINASE FAMILY.
+ Protein product from Mb1028 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1028 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ARGININE DEIMINASE ARCA (ADI) (AD)
+ (ARGININE DIHYDROLASE)"
+ /protein_id="SIT99628.1"
+ /db_xref="GOA:P63552"
+ /db_xref="InterPro:IPR003876"
+ /db_xref="UniProtKB/Swiss-Prot:P63552"
+ /translation="MGVELGSNSEVGALRVVILHRPGAELRRLTPRNTDQLLFDGLPW
+ VSRAQDEHDEFAELLASRGAEVLLLSDLLTEALHHSGAARMQGIAAAVDAPRLGLPLA
+ QELSAYLRSLDPGRLAHVLTAGMTFNELPSDTRTDVSLVLRMHHGGDFVIEPLPNLVF
+ TRDSSIWIGPRVVIPSLALRARVREASLTDLIYAHHPRFTGVRRAYESRTAPVEGGDV
+ LLLAPGVVAVGVGERTTPAGAEALARSLFDDDLAHTVLAVPIAQQRAQMHLDTVCTMV
+ DTDTMVMYANVVDTLEAFTIQRTPDGVTIGDAAPFAEAAAKAMGIDKLRVIHTGMDPV
+ VAEREQWDDGNNTLALAPGVVVAYERNVQTNARLQDAGIEVLTIAGSELGTGRGGPRC
+ MSCPAARDPL"
+ gene complement(1118907..1120418)
+ /locus_tag="BQ2027_MB1029C"
+ CDS complement(1118907..1120418)
+ /locus_tag="BQ2027_MB1029C"
+ /note="Mb1029c, -, len: 503 aa. Equivalent to Rv1002c,
+ len: 503 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 503 aa overlap). Conserved membrane
+ protein. Similar to AL132674|SCE87.05 hypothetical protein
+ from Streptomyces coelicolor (591 aa), FASTA scores: opt:
+ 666, E(): 0, (39.0% identity in 546 aa overlap); weakly
+ similar to TSCC_PSEAM|P55019 thiazide-sensitive
+ sodium-chloride cotransporter from Pseudopleuronectes
+ americanus (1023 aa), FASTA scores: opt: 44, E(): 4.2e-06,
+ (22.4% identity in 326 aa overlap). Protein product from
+ Mb1029c detected using SWATH mass spectrometry. Mb1029c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIT99629.1"
+ /db_xref="GOA:A0A1R3XX38"
+ /db_xref="InterPro:IPR003342"
+ /db_xref="InterPro:IPR027005"
+ /db_xref="InterPro:IPR032421"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX38"
+ /translation="MVPVVSPGPLVPVADFGPLDRLRGWIVTGLITLLATVTRFLNLG
+ SLTDAGTPIFDEKHYAPQAWQVLNNHGVEDNPGYGLVVHPPVGKQLIAIGEAIFGYNG
+ FGWRFTGALLGVLLVALVVRIVRRISRSTLVGAIAGVLLICDGVSFVTARTALLDGFL
+ TFFVVAAFGALIVDRDQVRERMHIALLAGRSAATVWGPRVGVRWWRFGAGVLLGLACA
+ TKWSGVYFVLFFGAMALAFDVAARRQYQVQRPWLGTVRRDVLPSGYALGLIPFAVYLA
+ TYAPWFASETAIDRHAVGQAVGRNSVVPLPDAVRSLWHYTAKAFHFHAGLTNSAGNYH
+ PWESKPWTWPMSLRPVLYAIDQQDVAGCGAQSCVKAEMLVGTPAMWWLAVPVLAYAGW
+ RMFVRRDWRYAVVLVGYCAGWLPWFADIDRQMYFFYAATMAPFLVMGISLVLGDILYH
+ PGQGSERRTLGLIVVCCYVALVVTNFAWLYPVLTGLPISQQTWNLEIWLPSWR"
+ gene 1120501..1121358
+ /gene="rsmI"
+ /locus_tag="BQ2027_MB1030"
+ CDS 1120501..1121358
+ /gene="rsmI"
+ /locus_tag="BQ2027_MB1030"
+ /EC_number="2.1.1.198"
+ /note="Mb1030, -, len: 285 aa. Equivalent to Rv1003, len:
+ 285 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 285 aa overlap). Conserved hypothetical
+ protein, similar to others e.g. AL132674|SCE87.04
+ Streptomyces coelicolor (286 aa), FASTA scores: opt: 877,
+ E(): 0, (53.2% identity in 280 aa overlap); and
+ YRAL_ECOLI|P45528 hypothetical 31.3 kd protein (286 aa),
+ FASTA scores: opt: 561, E(): 4.4e-27, (36.9% identity in
+ 279 aa overlap). Protein product from Mb1030 detected
+ using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="16S rRNA (cytidine(1402)-2'-O)-methyltransferase
+ (EC"
+ /protein_id="SIT99630.1"
+ /db_xref="GOA:P0A641"
+ /db_xref="InterPro:IPR000878"
+ /db_xref="InterPro:IPR008189"
+ /db_xref="InterPro:IPR014776"
+ /db_xref="InterPro:IPR014777"
+ /db_xref="InterPro:IPR018063"
+ /db_xref="InterPro:IPR035996"
+ /db_xref="UniProtKB/Swiss-Prot:P0A641"
+ /translation="MSSGRLLLGATPLGQPSDASPRLAAALATADVVAAEDTRRVRKL
+ AKALDIRIGGRVVSLFDRVEALRVTALLDAINNGATVLVVSDAGTPVISDPGYRLVAA
+ CIDAGVSVTCLPGPSAVTTALVMSGLPAEKFCFEGFAPRKGAARRAWLAELAEERRTC
+ VFFESPRRLAACLNDAVEQLGGARPAAICRELTKVHEEVVRGSLDELAIWAAGGVLGE
+ ITVVVAGAAPHAELSSLIAQVEEFVAAGIRVKDACSEVAAAHPGVRTRQLYDAVLQSR
+ RETGGPAQP"
+ gene complement(1121368..1122627)
+ /locus_tag="BQ2027_MB1031C"
+ CDS complement(1121368..1122627)
+ /locus_tag="BQ2027_MB1031C"
+ /note="Mb1031c, -, len: 419 aa. Equivalent to Rv1004c,
+ len: 419 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 419 aa overlap). Probable membrane
+ protein. Contains repetitive sequences, which have
+ similarities with elastin, and possible N-terminal signal
+ sequence. Mb1031c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE PROTEIN"
+ /protein_id="SIT99631.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX29"
+ /translation="MSISCRVREGFVMRLAIVGTAAAAAIGGTLAVAPLTLSTPERVA
+ GGTCSAGQQCDRLAAVLMPDTATPSGPAAAEHAVPAPFEPVADTIAPGLVPRPGVPAA
+ AAVPRVGPPAVPGLPNIPGAAGPALPPPPALPNLAAPSVPGVGIPGIGIPGIGIPGIG
+ IPGVPDPITGVNTAAAVVNGVLGVGGTAAGVVTASAVAVTYLVLAVNALESSGILPTA
+ RGTASTVASLLLPGAQSAAAALPAVGLPALPGVTPASLLAMAAAAGLPGVGFPSLPGV
+ SPTDLMAMAAAAGLPTSLPGLAGMSPAELTALVAGGLPMLAAAGLPAGLAGVDPATLA
+ AALPALAAGGLPPGLPALPGVDPAALAAALPALAAGLPALPAGLPPLPAVPALPAPPP
+ LPGPPPLPALPSRLCTPGFGPIGVCIP"
+ gene complement(1122701..1124137)
+ /gene="pabB"
+ /locus_tag="BQ2027_MB1032C"
+ CDS complement(1122701..1124137)
+ /gene="pabB"
+ /locus_tag="BQ2027_MB1032C"
+ /note="Mb1032c, pabB, len: 478 aa. Similar to Rv1005c,
+ len: 458 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 458 aa overlap). Probable PabD,
+ para-aminobenzoate synthase component I (EC 4.1.3.-).
+ Similar to PABB_ECOLI|P05041 para-aminobenzoate synthase
+ component I from Escherichia coli (453 aa), FASTA scores:
+ opt: 589, E(): 1.8e-27, (40.7% identity in 268 aa
+ overlap). Similar to Mycobacterium tuberculosis Rv1609,
+ Rv3215, Rv2386c. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a single base transition (g-a) leads
+ to a longer product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (478 aa versus 458
+ aa). Mb1032c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable para-aminobenzoate synthase component I
+ PABD"
+ /protein_id="SIT99632.1"
+ /db_xref="GOA:A0A1R3XZ71"
+ /db_xref="InterPro:IPR005801"
+ /db_xref="InterPro:IPR005802"
+ /db_xref="InterPro:IPR015890"
+ /db_xref="InterPro:IPR019999"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ71"
+ /translation="MALAARTATPPGTETGAGHGSNLAWELSTRTKSPRSHLRCENPQ
+ FCQARTVRIDRLGDLGGAPAVLRAVGRATSRLDLPPPAALTGEWFGALAVIAPSVSIQ
+ PVSGDDVFSGPPGTGGPDATGAVGGGWVGYLSYPDAGADGRPHRIPEAAGGWTDCVLR
+ RDRDGQWWYESLSGAPIADWLASALATTRASVARPAPACRIDWEPADRAAHRDGVLAC
+ LEAIGAGEVYQACVCTQFAGTVTGSPLDFFIDGFGRTAPSRSAFVAGPWGAVASLSPE
+ LFLRRRGSVVTSSPIKGTLPLDAPPSALRASAKEVAENIMIVDLVRNDLGRVAVTGTV
+ TVPELLVVRPAPGVWHLVSTVSARVPLEEPMSALLDAAFPPASVTGTPKLRARQLISQ
+ WERYRRGIYCGTVGLASPVAGCELNVAIRTVEFDTAGNAVLGVGGGITADSDPDAEWA
+ ECLHKAAPIVGLPAATRTTPARLASKVR"
+ gene 1124193..1125896
+ /locus_tag="BQ2027_MB1033"
+ CDS 1124193..1125896
+ /locus_tag="BQ2027_MB1033"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1033, -, len: 567 aa. Equivalent to Rv1006, len:
+ 567 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 567 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1033 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1033 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIT99633.1"
+ /db_xref="InterPro:IPR017853"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY25"
+ /translation="MVLRSRKSTLGVVVCLALVLGGPLSGCSSSASHRGPLNAMGSPA
+ IPSTAQEIPNPLRGQYEDLMEPLFPQGNPAQQRYPPWPASYDASLRVSWRQLQPTDPR
+ TLPPDAPDDRKYDFSVIDNALTRLADRGMRLTLRVYAYSSCCKASYPDGTNIAIPDWE
+ RAIASTNTSYPGPATDPSTGVVQVVPNFNDSTYLNDFAQLLAALGRRYDGDERLSVFE
+ FSGYGDFSENHVAYLRDTLGAPGPGPDESVATLGYYSQFRDQNITTASIKQLIAANVS
+ AFPHTQLVTSPANPEIVRELFADEVTNKLAAPVGVRSDCLGVDAPLPAWAESSTSHYV
+ QTKDPVVAALRQRLATAPVITEWCELPTGSSPRAYYEKGLRDVIRYHVSMTSSVNFPD
+ QTATSPMDPALYLVWAQANAAAGYRYSVEAQPGSQALAGKVATISVTWTNYGAAAATE
+ KWVPGYRLVDSTGQVVRTLPAAVDLKTLVSDQRGDRSSDQPTPASVAETVRVDLSGLP
+ AGHYTLRAAIDWQQHKPNGSHVVNYPSMLLSRDGRDDSGFYPVATLDIPRDAQTAVNA
+ S"
+ gene complement(1125923..1127482)
+ /gene="metS"
+ /locus_tag="BQ2027_MB1034C"
+ CDS complement(1125923..1127482)
+ /gene="metS"
+ /locus_tag="BQ2027_MB1034C"
+ /note="Mb1034c, metS, len: 519 aa. Equivalent to Rv1007c,
+ len: 519 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 519 aa overlap). Probable metS (MetG),
+ methionyl-tRNA synthetase (EC 6.1.1.10), similar to many
+ e.g. SYM_BACSU|P37465 methionyl-tRNA synthetase from
+ Bacillus subtilus (664 aa), FASTA scores: opt: 1506, E():
+ 0, (44.9% identity in 492 aa overlap); similar to other M.
+ tuberculosis tRNA synthases e.g. Rv2448c, Rv1536, Rv0041.
+ Contains PS00178 Aminoacyl-transfer RNA synthetases
+ class-I signature. BELONGS TO CLASS-I AMINOACYL-TRNA
+ SYNTHETASE FAMILY. STRONG, TO CYSTEINYL-TRNA SYNTHETASE.
+ Protein product from Mb1034c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1034c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="methionyl-trna synthetase mets (metrs)
+ (methionine--trna ligase)"
+ /protein_id="SIT99634.1"
+ /db_xref="GOA:P59952"
+ /db_xref="InterPro:IPR001412"
+ /db_xref="InterPro:IPR009080"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="InterPro:IPR014758"
+ /db_xref="InterPro:IPR015413"
+ /db_xref="InterPro:IPR023457"
+ /db_xref="InterPro:IPR033911"
+ /db_xref="InterPro:IPR041872"
+ /db_xref="UniProtKB/Swiss-Prot:P59952"
+ /translation="MKPYYVTTAIAYPNAAPHVGHAYEYIATDAIARFKRLDGYDVRF
+ LTGTDEHGLKVAQAAAAAGVPTAALARRNSDVFQRMQEALNISFDRFIRTTDADHHEA
+ SKELWRRMSAAGDIYLDNYSGWYSVRDERFFVESETQLVDGTRLTVETGTPVTWTEEQ
+ TYFFRLSAYTDKLLAHYHANPDFIAPETRRNEVISFVSGGLDDLSISRTSFDWGVQVP
+ EHPDHVMYVWVDALTNYLTGAGFPDTDSELFRRYWPADLHMIGKDIIRFHAVYWPAFL
+ MSAGIELPRRIFAHGFLHNRGEKMSKSVGNIVDPVALAEALGVDQVRYFLLREVPFGQ
+ DGSYSDEAIVTRINTDLANELGNLAQRSLSMVAKNLDGRVPNPGEFADADAALLATAD
+ GLLERVRGHFDAQAMHLALEAIWLMLGDANKYFSVQQPWVLRKSESEADQARFRTTLY
+ VTCEVVRIAALLIQPVMPESAGKILDLLGQAPNQRSFAAVGVRLTPGTALPPPTGVFP
+ RYQPPQPPEGK"
+ gene 1127568..1128362
+ /gene="tatD"
+ /locus_tag="BQ2027_MB1035"
+ CDS 1127568..1128362
+ /gene="tatD"
+ /locus_tag="BQ2027_MB1035"
+ /note="Mb1035, tatD, len: 264 aa. Equivalent to Rv1008,
+ len: 264 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 264 aa overlap). Probable tatD
+ (alternate gene name: yjjV), deoxyribonuclease (EC
+ 3.1.21.-), component of twin arginine translocation
+ protein export system (see citation below for more
+ information). Similar to many members of the YBL055C/YJJV
+ family e.g. YCFH_ECOLI|P37346 Putative deoxyribonuclease
+ ycfH (EC 3.1.21.-) (265 aa), fasta scores: opt: 487, E():
+ 1.4e-24, (36.7% identity in 270 aa overlap). Also similar
+ to P37545|YABD_BACSU Putative deoxyribonuclease yabD (255
+ aa), FASTA scores: opt: 599, E(): 7.7e-33, (40.1% identity
+ in 262 aa overlap). Contains PS01137 Hypothetical
+ YBL055c/yjjV family signature 1, and PS01091 Hypothetical
+ YBL055c/yjjV family signature 3. Protein product from
+ Mb1035 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable deoxyribonuclease TatD (YjjV protein)"
+ /protein_id="SIT99635.1"
+ /db_xref="GOA:A0A1R3XXF5"
+ /db_xref="InterPro:IPR001130"
+ /db_xref="InterPro:IPR015991"
+ /db_xref="InterPro:IPR018228"
+ /db_xref="InterPro:IPR032466"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXF5"
+ /translation="MVDAHTHLDACGARDADTVRSLVERAAAAGVTAVVTVADDLESA
+ RWVTRAAEWDRRVYAAVALHPTRADALTDAARAELERLVAHPRVVAVGETGIDMYWPG
+ RLDGCAEPHVQREAFAWHIDLAKRTGKPLMIHNRQADRDVLDVLRAEGAPDTVILHCF
+ SSDAAMARTCVDAGWLLSLSGTVSFRNARELREAVPLMPVEQLLVETDAPYLTPHPHR
+ GLANEPYCLPYTVRALAELVNRRPEEVALITTSNARRAYGLGWMRQ"
+ gene 1128570..1129658
+ /gene="rpfB"
+ /locus_tag="BQ2027_MB1036"
+ CDS 1128570..1129658
+ /gene="rpfB"
+ /locus_tag="BQ2027_MB1036"
+ /note="Mb1036, rpfB, len: 362 aa. Equivalent to Rv1009,
+ len: 362 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 362 aa overlap). Probable rpfB,
+ resuscitation-promoting factor (see citation below),
+ similar to others from Mycobacterium tuberculosis:
+ Rv2450c|MTV008.06c|RPFE PROBABLE RESUSCITATION-PROMOTING
+ FACTOR (172 aa), FASTA scores: E(): 1.9e-19, (42.9%
+ identity in 147 aa overlap); Rv0867c|RPFA, Rv1884c|RPFC,
+ and Rv2389c|RPFD. Possible lipoprotein; contains PS00013
+ Prokaryotic membrane lipoprotein lipid attachment site.
+ Mb1036 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable resuscitation-promoting factor rpfB"
+ /protein_id="SIT99636.1"
+ /db_xref="InterPro:IPR007137"
+ /db_xref="InterPro:IPR010618"
+ /db_xref="InterPro:IPR011098"
+ /db_xref="InterPro:IPR023346"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX37"
+ /translation="MLRLVVGALLLVLAFAGGYAVAACKTVTLTVDGTAMRVTTMKSR
+ VIDIVEENGFSVDDRDDLYPAAGVQVHDADTIVLRRSRPLQISLDGHDAKQVWTTAST
+ VDEALAQLAMTDTAPAAASRASRVPLSGMALPVVSAKTVQLNDGGLVRTVHLPAPNVA
+ GLLSAAGVPLLQSDHVVPAATAPIVEGMQIQVTRNRIKKVTERLPLPPNARRVEDPEM
+ NMSREVVEDPGVPGTQDVTFAVAEVNGVETGRLPVANVVVTPAHEAVVRVGTKPGTEV
+ PPVIDESIWDAIAGCEAGGNWAINTGNGYYGGVQFDQGTWEANGGLRYAPRADLATRE
+ EQIAVAEVTRLRQGWGAWPVCAVRAGAR"
+ gene 1129631..1130584
+ /gene="ksgA"
+ /locus_tag="BQ2027_MB1037"
+ CDS 1129631..1130584
+ /gene="ksgA"
+ /locus_tag="BQ2027_MB1037"
+ /note="Mb1037, ksgA, len: 317 aa. Equivalent to Rv1010,
+ len: 317 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 317 aa overlap). Probable ksgA,
+ dimethyladenosine transferase (EC 2.1.1.-), similar to
+ many e.g. KSGA_BACSU|P37468 dimethyladenosine transferase
+ from Bacillus subtilus (292 aa), FASTA scores: opt: 524,
+ E(): 1.5e-28, (37.2% identity in 274 aa overlap); similar
+ to Mycobacterium tuberculosis hypothetical protein Rv1988.
+ Contains PS01131 Ribosomal RNA adenine dimethylases
+ signature. Protein product from Mb1037 detected using
+ SWATH mass spectrometry. Mb1037 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DIMETHYLADENOSINE TRANSFERASE KSGA
+ (S-adenosylmethionine-6-N', N'-adenosyl(rRNA)
+ dimethyltransferase) (16S rRNA dimethylase) (High level
+ kasugamycin resistance protein ksgA) (Kasugamycin
+ dimethyltransferase)"
+ /protein_id="SIT99637.1"
+ /db_xref="GOA:P66661"
+ /db_xref="InterPro:IPR001737"
+ /db_xref="InterPro:IPR011530"
+ /db_xref="InterPro:IPR020596"
+ /db_xref="InterPro:IPR020598"
+ /db_xref="InterPro:IPR023165"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:P66661"
+ /translation="MCCTSGCALTIRLLGRTEIRRLAKELDFRPRKSLGQNFVHDANT
+ VRRVVAASGVSRSDLVLEVGPGLGSLTLALLDRGATVTAVEIDPLLASRLQQTVAEHS
+ HSEVHRLTVVNRDVLALRREDLAAAPTAVVANLPYNVAVPALLHLLVEFPSIRVVTVM
+ VQAEVAERLAAEPGSKEYGVPSVKLRFFGRVRRCGMVSPTVFWPIPRVYSGLVRIDRY
+ ETSPWPTDDAFRRRVFELVDIAFAQRRKTSRNAFVQWAGSGSESANRLLAASIDPARR
+ GETLSIDDFVRLLRRSGGSDEATSTGRDARAPDISGHASAS"
+ gene 1130670..1131590
+ /gene="ispE"
+ /locus_tag="BQ2027_MB1038"
+ CDS 1130670..1131590
+ /gene="ispE"
+ /locus_tag="BQ2027_MB1038"
+ /note="Mb1038, ispE, len: 306 aa. Equivalent to Rv1011,
+ len: 306 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 306 aa overlap). Probable ispE,
+ 4-diphosphocytidyl-2-C-methyl-D-erythritol kinase (EC
+ 2.7.1.-), similar to others e.g. Q9K3R6|ISPE_STRCO
+ Streptomyces coelicolor (299 aa), FASTA scores: opt: 925,
+ E(): 2.7e-49, (54.5% identity in 297 overlap); etc.
+ BELONGS TO THE ISPE FAMILY. Protein product from Mb1038
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1038 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable
+ 4-diphosphocytidyl-2-C-methyl-D-erythritol kinase ISPE
+ (CMK) (4-(cytidine-5'-diphospho)-2-C-methyl-D-erythritol
+ kinase)"
+ /protein_id="SIT99638.1"
+ /db_xref="GOA:P65179"
+ /db_xref="InterPro:IPR004424"
+ /db_xref="InterPro:IPR006204"
+ /db_xref="InterPro:IPR013750"
+ /db_xref="InterPro:IPR014721"
+ /db_xref="InterPro:IPR020568"
+ /db_xref="InterPro:IPR036554"
+ /db_xref="UniProtKB/Swiss-Prot:P65179"
+ /translation="MPTGSVTVRVPGKVNLYLAVGDRREDGYHELTTVFHAVSLVDEV
+ TVRNADVLSLELVGEGADQLPTDERNLAWQAAELMAEHVGRAPDVSIMIDKSIPVAGG
+ MAGGSADAAAVLVAMNSLWELNVPRRDLRMLAARLGSDVPFALHGGTALGTGRGEELA
+ TVLSRNTFHWVLAFADSGLLTSAVYNELDRLREVGDPPRLGEPGPVLAALAAGDPDQL
+ APLLGNEMQAAAVSLDPALARALRAGVEAGALAGIVSGSGPTCAFLCTSASSAIDVGA
+ QLSGAGVCRTVRVATGPVPGARVVSAPTEV"
+ gene 1131587..1131901
+ /locus_tag="BQ2027_MB1040"
+ CDS 1131587..1131901
+ /locus_tag="BQ2027_MB1040"
+ /note="Mb1040, -, len: 104 aa. Equivalent to the 3' end of
+ Rv1012, len: 97 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (98.4% identity in 63 aa overlap). Hypothetical
+ unknown protein. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1012 exists as
+ a single gene. In Mycobacterium bovis, a frameshift due to
+ a single base insertion (*-g) leads to a different NH2
+ terminus. Mb1040 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99639.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX48"
+ /translation="MTEFLGACLGRPGVSARAEAGGSIGWRTSMPAVGPQASALAEVG
+ GAHQSQAQKPYHDATEPLGENLRYRPAHGDSCINGHRDNPSARESSQFTAGSTAKAVT
+ KL"
+ gene 1132105..1133739
+ /gene="pks16"
+ /locus_tag="BQ2027_MB1041"
+ CDS 1132105..1133739
+ /gene="pks16"
+ /locus_tag="BQ2027_MB1041"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1041, pks16, len: 544 aa. Equivalent to Rv1013,
+ len: 544 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 544 aa overlap). Putative pks16,
+ polyketide synthase, similar to many e.g. N-terminus of
+ Q50857|U24657 SAFRAMYCIN MX1 SYNTHETASE B (1770 aa), FASTA
+ scores: opt: 526, E(): 1.4e-25, (29.3% identity in 542 aa
+ overlap); etc. Contains PS00455 Putative AMP-binding
+ domain signature. BELONGS TO THE ATP-DEPENDENT AMP-BINDING
+ ENZYME FAMILY. Protein product from Mb1041 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1041 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE POLYKETIDE SYNTHASE PKS16"
+ /protein_id="SIT99640.1"
+ /db_xref="GOA:A0A1R3XX39"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR028154"
+ /db_xref="InterPro:IPR040097"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX39"
+ /translation="MSRFTEKMFHNARTATTGMVTGEPHMPVRHTWGEVHERARCIAG
+ GLAAAGVGLGDVVGVLAGFPVEIAPTAQALWMRGASLTMLHQPTPRTDLAVWAEDTMT
+ VIGMIEAKAVIVSEPFLVAIPILEQKGMQVLTVADLLASDPIGPIEVGEDDLALMQLT
+ SGSTGSPKAVQITHRNIYSNAEAMFVGAQYDVDKDVMVSWLPCFHDMGMVGFLTIPMF
+ FGAELVKVTPMDFLRDTLLWAKLIDKYQGTMTAAPNFAYALLAKRLRRQAKPGDFDLS
+ TLRFALSGAEPVEPADVEDLLDAGKPFGLRPSAILPAYGMAETTLAVSFSECNAGLVV
+ DEVDADLLAALRRAVPATKGNTRRLATLGPLLQDLEARIIDEQGDVMPARGVGVIELR
+ GESLTPGYLTMGGFIPAQDEHGWYDTGDLGYLTEEGHVVVCGRVKDVIIMAGRNIYPT
+ DIERAAGRVDGVRPGCAVAVRLDAGHSRESFAVAVESNAFEDPAEVRRIEHQVAHEVV
+ AEVDVRPRNVVVLGPGTIPKTPSGKLRRANSVTLVT"
+ gene complement(1133813..1134388)
+ /gene="pth"
+ /locus_tag="BQ2027_MB1042C"
+ CDS complement(1133813..1134388)
+ /gene="pth"
+ /locus_tag="BQ2027_MB1042C"
+ /note="Mb1042c, pth, len: 191 aa. Equivalent to Rv1014c,
+ len: 191 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 191 aa overlap). Probable pth,
+ peptidyl-tRNA hydrolase (EC 3.1.1.29), similar to
+ PTH_ECOLI|P23932 peptidy l-trna hydrolase from Escherichia
+ coli (194 aa), FASTA scores: opt: 472, E(): 2.3e-25,
+ (39.6% identity in 187 aa overlap). BELONGS TO THE PTH
+ FAMILY. Protein product from Mb1042c detected using SWATH
+ mass spectrometry. Mb1042c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PEPTIDYL-TRNA HYDROLASE PTH"
+ /protein_id="SIT99641.1"
+ /db_xref="GOA:P65866"
+ /db_xref="InterPro:IPR001328"
+ /db_xref="InterPro:IPR018171"
+ /db_xref="InterPro:IPR036416"
+ /db_xref="UniProtKB/Swiss-Prot:P65866"
+ /translation="MAEPLLVVGLGNPGANYARTRHNLGFVVADLLAARLGAKFKAHK
+ RSGAEVATGRSAGRSLVLAKPRCYMNESGRQIGPLAKFYSVAPANIIVIHDDLDLEFG
+ RIRLKIGGGEGGHNGLRSVVAALGTKDFQRVRIGIGRPPGRKDPAAFVLENFTPAERA
+ EVPTICEQAADATELLIEQGMEPAQNRVHAW"
+ gene complement(1134401..1135048)
+ /gene="rplY"
+ /locus_tag="BQ2027_MB1043C"
+ CDS complement(1134401..1135048)
+ /gene="rplY"
+ /locus_tag="BQ2027_MB1043C"
+ /note="Mb1043c, rplY, len: 215 aa. Equivalent to Rv1015c,
+ len: 215 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 215 aa overlap). Probable rplY, 50s
+ ribosomal protein L25, similar to RL25_ECOLI|P02426 50s
+ ribosomal protein L25 from Escherichia coli (94 aa), FASTA
+ scores: opt: 182, E(): 2.5e-05, (38.4% identity in 86 aa
+ overlap) and to CTC_BACSU|P14194 general stress protein
+ from Bacillus subtilis (203 aa), FASTA scores: opt: 260,
+ E(): 1.4e-09, (28.4% identity in 201 aa overlap). BELONGS
+ TO THE L25P FAMILY OF RIBOSOMAL PROTEINS. Protein product
+ from Mb1043c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1043c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l25 rply"
+ /protein_id="SIT99642.1"
+ /db_xref="GOA:P66122"
+ /db_xref="InterPro:IPR001021"
+ /db_xref="InterPro:IPR011035"
+ /db_xref="InterPro:IPR020056"
+ /db_xref="InterPro:IPR020057"
+ /db_xref="InterPro:IPR029751"
+ /db_xref="InterPro:IPR037121"
+ /db_xref="UniProtKB/Swiss-Prot:P66122"
+ /translation="MAKSASNQLRVTVRTETGKGASRRARRAGKIPAVLYGHGAEPQH
+ LELPGHDYAAVLRHSGTNAVLTLDIAGKEQLALTKALHIHPIRRTIQHADLLVVRRGE
+ KVVVEVSVVVEGQAGPDTLVTQETNSIEIEAEALSIPEQLTVSIEGAEPGTQLTAGQI
+ ALPAGVSLISDPDLLVVNVVKAPTAEELEGEVAGAEEAEEAAVEAGEAEAAGESE"
+ gene complement(1135182..1135940)
+ /gene="lpqT"
+ /locus_tag="BQ2027_MB1044C"
+ CDS complement(1135182..1135940)
+ /gene="lpqT"
+ /locus_tag="BQ2027_MB1044C"
+ /note="Mb1044c, lpqT, len: 252 aa. Equivalent to 5' end of
+ Rv1016c, len: 226 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (98.9% identity in 190 aa overlap). Probable
+ lpqT, conserved lipoprotein. Similar to several M.
+ tuberculosis hypothetical proteins e.g.
+ Rv0040c|Y0H3_MYCTU|P71697 Proline rich 28 kDA antigen (310
+ aa), FASTA scores: opt: 329, E(): 2e-17, (32.3% identity
+ in 229 aa overlap); Rv0583c. Contains PS00013 Prokaryotic
+ membrane lipoprotein lipid attachment site.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ frameshift due to a 5 bp deletion (cacgc-*) leads to a
+ longer product with a different COOH part compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv.
+ Protein product from Mb1044c detected using SWATH mass
+ spectrometry. Mb1044c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable conserved lipoprotein lpqt"
+ /protein_id="SIT99643.1"
+ /db_xref="GOA:Q7U0V0"
+ /db_xref="InterPro:IPR019674"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0V0"
+ /translation="MAGRRCPQDSVRPLAVAVAVATLAMSAVACGPKSPDFQSILSTS
+ PTTSAVSTTTEVPVPLWKYLESVGVTGEPVAPSSLTDLTVSIPTPPGWAPMKNPNITP
+ NTEMIAKGESYPTAMLMVFKLHRDFDIAEALKHGTADARLSTNFTELDSSTADFNGFP
+ SSMIQGSYDLHGRRLHTWNRIVFPTGAGQAALPGAAHHHESGQRGRQARFRHRGDHRR
+ IRRRGKVIVRTVGAQLSEQLTRIEFPQCSSHGLA"
+ gene complement(1135976..1136956)
+ /gene="prsA"
+ /locus_tag="BQ2027_MB1045C"
+ CDS complement(1135976..1136956)
+ /gene="prsA"
+ /locus_tag="BQ2027_MB1045C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1045c, prsA, len: 326 aa. Equivalent to Rv1017c,
+ len: 326 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 326 aa overlap). Probable prsA,
+ ribose-phosphate pyrophosphokinase (EC 2.7.6.1), highly
+ similar to others e.g. KPRS_ECOLI|P08330 ribose-phosphate
+ pyrophosphokinase from Escherichia coli (314 aa), FASTA
+ scores: opt: 826, E(): 0, (43.8% identity in 317 aa
+ overlap). Contains PS00103 Purine/pyrimidine
+ phosphoribosyl transferases signature; contains PS00144
+ Asparaginase / glutaminase active site signature 1.
+ BELONGS TO THE RIBOSE-PHOSPHATE PYROPHOSPHOKINASE FAMILY.
+ COFACTOR: BOTH INORGANIC PHOSPHATE AND MAGNESIUM ION ARE
+ REQUIRED FOR ENZYME STABILITY AND ACTIVITY (by
+ similarity). Protein product from Mb1045c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1045c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RIBOSE-PHOSPHATE PYROPHOSPHOKINASE PRSA
+ (Phosphoribosyl pyrophosphate synthetase) (PRPP
+ synthetase)"
+ /protein_id="SIT99644.1"
+ /db_xref="GOA:P65233"
+ /db_xref="InterPro:IPR000836"
+ /db_xref="InterPro:IPR000842"
+ /db_xref="InterPro:IPR005946"
+ /db_xref="InterPro:IPR029057"
+ /db_xref="InterPro:IPR029099"
+ /db_xref="InterPro:IPR037515"
+ /db_xref="UniProtKB/Swiss-Prot:P65233"
+ /translation="MSHDWTDNRKNLMLFAGRAHPELAEQVAKELDVHVTSQDAREFA
+ NGEIFVRFHESVRGCDAFVLQSCPAPVNRWLMEQLIMIDALKRGSAKRITAVMPFYPY
+ ARQDKKHRGREPISARLIADLLKTAGADRIVTVDLHTDQIQGFFDGPVDHMRGQNLLT
+ GYIRDNYPDGNMVVVSPDSGRVRIAEKWADALGGVPLAFIHKTRDPRVPNQVVSNRVV
+ GDVAGRTCVLIDDMIDTGGTIAGAVALLHNDGAGDVIIAATHGVLSDPAAQRLASCGA
+ REVIVTNTLPIGEDKRFPQLTVLSIAPLLASTIRAVFENGSVTGLFDGDA"
+ gene complement(1137048..1138535)
+ /gene="glmU"
+ /locus_tag="BQ2027_MB1046C"
+ CDS complement(1137048..1138535)
+ /gene="glmU"
+ /locus_tag="BQ2027_MB1046C"
+ /note="Mb1046c, glmU, len: 495 aa. Equivalent to Rv1018c,
+ len: 495 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 495 aa overlap). Probable glmU,
+ UDP-n-acetylglucosamine pyrophosphorylase (EC 2.7.7.23),
+ similar to GCAD_BACSU|P14192 UDP-n-acetylglucosamine
+ pyrophosphorylase (456 aa), FASTA scores: opt: 1150, E():
+ 0, (40.0% identity in 453 aa overlap). Similar to various
+ Mycobacterium tuberculosis sugar-phosphate transferases
+ e.g. Rv0334, Rv1213, Rv3264c, etc. Protein product from
+ Mb1046c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1046c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable UDP-N-acetylglucosamine
+ pyrophosphorylase glmU"
+ /protein_id="SIT99645.1"
+ /db_xref="GOA:Q7VF00"
+ /db_xref="InterPro:IPR001451"
+ /db_xref="InterPro:IPR005882"
+ /db_xref="InterPro:IPR011004"
+ /db_xref="InterPro:IPR025877"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="InterPro:IPR038009"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VF00"
+ /translation="MTFPGDTAVLVLAAGPGTRMRSDTPKVLHTLAGRSMLSHVLHAI
+ AKLAPQRLIVVLGHDHQRIAPLVGELADTLGRTIDVALQDRPLGTGHAVLCGLSALPD
+ DYAGNVVVTSGDTPLLDADTLADLIATHRAVSAAVTVLTTTLDDPFGYGRILRTQDHG
+ VMAIVEQTDATPSQREIREVNAGVYAFDIAALRSALSRLSSNNAQQELYLTDVIAILR
+ SDGQTVHASHVDDSALVAGVNNRVQLAQLASELNRRVVAAHQLAGVTVVDPATTWIDV
+ DVTIGRDTVIHPGTQLLGRTQIGGRCVVGPDTTLTDVAVGDGASVVRTHGSSSSIGDG
+ AAVGPFTYLRPGTALGADGKLGAFVEVKNSTIGTGTKVPHLTYVGDADIGEYSNIGAS
+ SVFVNYDGTSKRRTTVGSHVRTGSDTMFVAPVTIGDGAYTGAGTVVREDVPPGALAVS
+ AGPQRNIENWVQRKRPGSPAAQASKRASEMACQQPTQPPDADQTP"
+ gene complement(1138517..1138588)
+ /locus_tag="BQ2027_GLNT"
+ tRNA complement(1138517..1138588)
+ /locus_tag="BQ2027_GLNT"
+ /product="tRNA-Gln"
+ /note="glnT, len: 72 nt. Equivalent to glnT, len: 72 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 72 nt overlap). tRNA-Gln, anticodon ttg."
+ gene 1138790..1139383
+ /locus_tag="BQ2027_MB1047"
+ CDS 1138790..1139383
+ /locus_tag="BQ2027_MB1047"
+ /note="Mb1047, -, len: 197 aa. Equivalent to Rv1019, len:
+ 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 197 aa overlap). Probable
+ transcriptional regulator, similar to many memebers of the
+ tetR family e.g. MTCY7D11.18c (34.4% identity in 189 aa
+ overlap). Helix turn helix motif from aa 27-48 (+5.42 SD).
+ Protein product from Mb1047 detected using shotgun mass
+ spectrometry. Mb1047 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY TETR-FAMILY)"
+ /protein_id="SIT99646.1"
+ /db_xref="GOA:A0A1R3XX46"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR023772"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX46"
+ /translation="MTGTERRHQLIGIARSLFAERGYDGTSIEEIAQRANVSKPVVYE
+ HFGGKEGLYAVVVDREMSALLDGITSSLTNNRSRVRVERVALALLTYVEERTDGFRIM
+ IRDSPASISSGTYSSLLNDAVSQVSSILAGDFARRGLDPDLAPLYAQALVGSVSMTAQ
+ WWLDAREPKKEVVAAHLVNLVWNGLTHLEADPRLQDE"
+ gene 1139442..1143146
+ /gene="mfd"
+ /locus_tag="BQ2027_MB1048"
+ CDS 1139442..1143146
+ /gene="mfd"
+ /locus_tag="BQ2027_MB1048"
+ /note="Mb1048, mfd, len: 1234 aa. Equivalent to Rv1020,
+ len: 1234 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100% identity in 1234 aa overlap). Probable mfd,
+ transcription-repair coupling factor, similar to many e.g.
+ MFD_ECOLI|P30958 transcription-repair coupling factor from
+ Escherichia coli (1148 aa), FASTA scores: opt: 1900, E():
+ 0, (37.9% identity in 1107 aa overlap). Also similar to M.
+ tuberculosis Rv2973c and Rv1633. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). IN THE N-TERMINAL
+ SECTION; BELONGS TO THE UVRB FAMILY. IN THE C-TERMINAL
+ SECTION; BELONGS TO THE HELICASE FAMILY. RECG SUBFAMILY.
+ Protein product from Mb1048 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1048 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTION-REPAIR COUPLING FACTOR
+ MFD (TRCF)"
+ /protein_id="SIT99647.1"
+ /db_xref="GOA:P64327"
+ /db_xref="InterPro:IPR001650"
+ /db_xref="InterPro:IPR003711"
+ /db_xref="InterPro:IPR004576"
+ /db_xref="InterPro:IPR005118"
+ /db_xref="InterPro:IPR011545"
+ /db_xref="InterPro:IPR014001"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036101"
+ /db_xref="InterPro:IPR037235"
+ /db_xref="InterPro:IPR041471"
+ /db_xref="UniProtKB/Swiss-Prot:P64327"
+ /translation="MTAPGPACSDTPIAGLVELALSAPTFQQLMQRAGGRPDELTLIA
+ PASARLLVASALARQGPLLVVTATGREADDLAAELRGVFGDAVALLPSWETLPHERLS
+ PGVDTVGTRLMALRRLAHPDDAQLGPPLGVVVTSVRSLLQPMTPQLGMMEPLTLTVGD
+ ESPFDGVVARLVELAYTRVDMVGRRGEFAVRGGILDIFAPTAEHPVRVEFWGDEITEM
+ RMFSVADQRSIPEIDIHTLVAFACRELLLSEDVRARAAQLAARHPAAESTVTGSASDM
+ LAKLAEGIAVDGMEAVLPVLWSDGHALLTDQLPDGTPVLVCDPEKVRTRAADLIRTGR
+ EFLEASWSVAALGTAENQAPVDVEQLGGSGFVELDQVRAAAARTGHPWWTLSQLSDES
+ AIELDVRAAPSARGHQRDIDEIFAMLRAHIATGGYAALVAPGTGTAHRVVERLSESDT
+ PAGMLDPGQAPKPGVVGVLQGPLRDGVIIPGANLVVITETDLTGSRVSAAEGKRLAAK
+ RRNIVDPLALTAGDLVVHDQHGIGRFVEMVERTVGGARREYLVLEYASAKRGGGAKNT
+ DKLYVPMDSLDQLSRYVGGQAPALSRLGGSDWANTKTKARRAVREIAGELVSLYAKRQ
+ ASPGHAFSPDTPWQAELEDAFGFTETVDQLTAIEEVKADMEKPIPMDRVICGDVGYGK
+ TEIAVRAAFKAVQDGKQVAVLVPTTLLADQHLQTFGERMSGFPVTIKGLSRFTDAAES
+ RAVIDGLADGSVDIVIGTHRLLQTGVRWKDLGLVVVDEEQRFGVEHKEHIKSLRTHVD
+ VLTMSATPIPRTLEMSLAGIREMSTILTPPEERYPVLTYVGPHDDKQIAAALRRELLR
+ DGQAFYVHNRVSSIDAAAARVRELVPEARVVVAHGQMPEDLLETTVQRFWNREHDILV
+ CTTIVETGLDISNANTLIVERADTFGLSQLHQLRGRVGRSRERGYAYFLYPPQVPLTE
+ TAYDRLATIAQNNELGAGMAVALKDLEIRGAGNVLGIEQSGHVAGVGFDLYVRLVGEA
+ LETYRDAYRAAADGQTVRTAEEPKDVRIDLPVDAHLPPDYIASDRLRLEGYRRLAAAS
+ SDREVAAVVDELTDRYGALPEPARRLAAVARLRLLCRGSGITDVTAASAATVRLSPLT
+ LPDSAQVRLKRMYPGAHYRATTATVQVPIPRAGGLGAPRIRDVELVQMVADLITALAG
+ KPRQHIGITNPSPPGEDGRGRNTTIKERQP"
+ gene 1143146..1144123
+ /gene="mazG"
+ /locus_tag="BQ2027_MB1049"
+ CDS 1143146..1144123
+ /gene="mazG"
+ /locus_tag="BQ2027_MB1049"
+ /EC_number="3.6.1.8"
+ /note="Mb1049, -, len: 325 aa. Equivalent to Rv1021, len:
+ 325 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 325 aa overlap). Conserved hypothetical
+ protein, similar to YBL1_STRCI|P33653 hypothetical 26.1 kd
+ protein from Streptomyces cacaoi (242 aa), FASTA scores:
+ opt: 493, E(): 1.1e-23, (42.9% identity in 238 aa
+ overlap). Protein product from Mb1049 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1049 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Nucleoside triphosphate pyrophosphohydrolase
+ MazG (EC"
+ /protein_id="SIT99648.1"
+ /db_xref="InterPro:IPR004518"
+ /db_xref="InterPro:IPR011551"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX33"
+ /translation="MIVVLVDPRRPTLVPVEAIEFLRGEVQYTEEMPVAVPWSLPAAR
+ SAHAGNDAPVLLSSDPNHPAVITRLAAGARLISAPDSQRGERLVDAVAMMDKLRTAGP
+ WESEQTHDSLRRYLLEETYELLDAVRSGSVDQLREELGDLLLQVLFHARIAEDASQSP
+ FTIDDVADTLMRKLGNRAPGVLAGESISLEDQLAQWEAAKASEKARKSVADDVHTGQP
+ ALALAQKVIQRAQKAGLPAHLIPDEITSVSVSADVDAENTLRTAVLDFIDRLRCAERA
+ IAVARRGSNVAEQLDVTPLGVITEQEWLAHWPTAVNDSRGGSKKRKGMR"
+ gene 1144211..1144942
+ /gene="lpqU"
+ /locus_tag="BQ2027_MB1050"
+ CDS 1144211..1144942
+ /gene="lpqU"
+ /locus_tag="BQ2027_MB1050"
+ /note="Mb1050, lpqU, len: 243 aa. Equivalent to Rv1022,
+ len: 243 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 243 aa overlap). Probable lpqU
+ conserved lipoprotein. Similar to Mycobacterium
+ tuberculosis hypothetical protein Rv1230c|MTV006.02C,
+ FASTA scores: E(): 2.8e-18, (37.9% identity in 240 aa
+ overlap). Similar to AL133423|SC4A7.37 hypothetical
+ protein from Streptomyces coelicolor (421 aa), FASTA
+ scores: opt: 474, E(): 2.7e-21, (42.2% identity in 211 aa
+ overlap). Contains PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site. Protein product from
+ Mb1050 detected using SWATH mass spectrometry. Mb1050
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable conserved lipoprotein lpqu"
+ /protein_id="SIT99649.1"
+ /db_xref="InterPro:IPR023346"
+ /db_xref="InterPro:IPR031304"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX58"
+ /translation="MSPRRWLRAVAVIGATAMLLASSCTWQLSLFIPDGVPPPPGDPV
+ PPVDTHAGGRPADQLREWAEKRAAALGIPVIALEAYAYAARVAEVENPKCHLAWTTLA
+ GIGRVESHHGTYRGATIAPNGDVSPPIRGVRLDGTGGTLRIVDRDGGGLDGDAAVERA
+ MGPMQFISETWRLYGVAARNDGIANVDNIDDAALSAAGYLCWRGKDLATPRGWITALR
+ AYNNSVIYARAVRDWATAYAAGHPL"
+ gene 1145039..1146328
+ /gene="eno"
+ /locus_tag="BQ2027_MB1051"
+ CDS 1145039..1146328
+ /gene="eno"
+ /locus_tag="BQ2027_MB1051"
+ /note="Mb1051, eno, len: 429 aa. Equivalent to Rv1023,
+ len: 429 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 429 aa overlap). Probable eno, enolase
+ (EC 4.2.1.11), highly similar to others e.g.
+ ENO_ECOLI|P08324 enolase from Escherichia coli (431 aa),
+ FASTA scores: opt: 1487, E(): 0, (55.5% identity in 422 aa
+ overlap); etc. MAGNESIUM IS REQUIRED FOR CATALYSIS AND FOR
+ STABILIZING THE DIMER. BELONGS TO THE ENOLASE FAMILY.
+ Protein product from Mb1051 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1051 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ENOLASE ENO"
+ /protein_id="SIT99650.1"
+ /db_xref="GOA:Q7U0U6"
+ /db_xref="InterPro:IPR000941"
+ /db_xref="InterPro:IPR020809"
+ /db_xref="InterPro:IPR020810"
+ /db_xref="InterPro:IPR020811"
+ /db_xref="InterPro:IPR029017"
+ /db_xref="InterPro:IPR036849"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0U6"
+ /translation="MPIIEQVGAREILDSRGNPTVEVEVALIDGTFARAAVPSGASTG
+ EHEAVELRDGGDRYGGKGVQKAVQAVLDEIGPAVIGLNADDQRLVDQALVDLDGTPDK
+ SRLGGNAILGVSLAVAKAAADSAELPLFRYVGGPNAHILPVPMMNILNGGAHADTAVD
+ IQEFMVAPIGAPSFVEALRWGAEVYHALKSVLKKEGLSTGLGDEGGFAPDVAGTTAAL
+ DLISRAIESAGLRPGADVALALDAAATEFFTDGTGYVFEGTTRTADQMTEFYAGLLGA
+ YPLVSIEDPLSEDDWDGWAALTASIGDRVQIVGDDIFVTNPERLEEGIERGVANALLV
+ KVNQIGTLTETLDAVTLAHHGGYRTMISHRSGETEDTMIADLAVAIGSGQIKTGAPAR
+ SERVAKYNQLLRIEEALGDAARYAGDLAFPRFACETK"
+ gene 1146333..1147019
+ /locus_tag="BQ2027_MB1052"
+ CDS 1146333..1147019
+ /locus_tag="BQ2027_MB1052"
+ /note="Mb1052, -, len: 228 aa. Equivalent to Rv1024, len:
+ 228 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 228 aa overlap). Hypothetical unknown
+ protein, hydrophobic region from aa 83-101. Protein
+ product from Mb1052 detected using SWATH mass
+ spectrometry. Mb1052 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible conserved membrane protein"
+ /protein_id="SIT99651.1"
+ /db_xref="InterPro:IPR007060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX51"
+ /translation="MPEAKRPESKRRSPASRPGKAGDSVRGGRATKPSAKPSTPAPHA
+ SRKTTRTPHEHIVEPIKRAITESVEKRSEQRLGFTARRAAILAAVVCVLTLTIARPVR
+ TYFAQRAEMEQLAATEAMLRRQIADLEEQQVKLADPAYIAAQARERLGFVMPGDIPFQ
+ VQLPSTPLAPPQPGSDAATATNNEPWYTALWHTIADDPHLPPAAPPAPEPGRPGPLPP
+ ASPNPEQPGG"
+ gene 1147036..1147503
+ /locus_tag="BQ2027_MB1053"
+ CDS 1147036..1147503
+ /locus_tag="BQ2027_MB1053"
+ /note="Mb1053, -, len: 155 aa. Equivalent to Rv1025, len:
+ 155 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 155 aa overlap). Conserved hypothetical
+ protein, similar to AE001768|AE001768_4 hypothetical
+ protein from Thermotoga maritima (170 aa), FASTA scores:
+ opt: 254, E(): 9.5e-10, (35.7% identity in 143 aa
+ overlap). Protein product from Mb1053 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1053 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG004853: possible toxin to DivIC"
+ /protein_id="SIT99652.1"
+ /db_xref="InterPro:IPR007511"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ94"
+ /translation="MVTRQLGRAPRGVLAIAYRCPNGEPGVVKTAPRLPDGTPFPTLY
+ YLTHPVLTAAASRLETTGLMREMNRRLGQDAELAAAYRRAHESYLSERDALEPLGTTV
+ SAGGMPDRVKCLHVLIAHSLAKGPGLNPFGDEALALLAAEPRTAATLVAGQWR"
+ gene 1147494..1148453
+ /gene="ppx2"
+ /locus_tag="BQ2027_MB1054"
+ CDS 1147494..1148453
+ /gene="ppx2"
+ /locus_tag="BQ2027_MB1054"
+ /EC_number="3.6.1.11"
+ /note="Mb1054, -, len: 319 aa. Equivalent to Rv1026, len:
+ 319 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 319 aa overlap). Conserved hypothetical
+ protein. Equivalent to AL023514|MLCB4.02 hypothetical
+ protein from Mycobacterium leprae (317 aa) (77.9% identity
+ in 321 aa overlap). Similar to GPPA_ECOLI|P25552
+ guanosine-5'-triphosphate, 3'-diphosphate pyrophoshatase
+ from Escherichia coli (494 aa), FASTA scores: opt: 281,
+ E(): 3.2e-11, (30.6% identity in 291 aa overlap). Protein
+ product from Mb1054 detected using SWATH mass
+ spectrometry. Mb1054 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Exopolyphosphatase (EC"
+ /protein_id="SIT99653.1"
+ /db_xref="InterPro:IPR003695"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY40"
+ /translation="MALTRVAAIDCGTNSIRLLIADVGAGLARGELHDVHRETRIVRL
+ GQGVDATGRFAPEAIARTRTALTDYAELLTFHHAERVRMVATSAARDVVNRDVFFAMT
+ ADVLGAALPGSAAEVITGAEEAELSFRGAVGELGSAGAPFVVVDLGGGSTEIVLGEHE
+ VVASYSADIGCVRLTERCLHSDPPTLQEVSTARRLVRERLEPALRTVPLELARTWVGL
+ AGTMTTLSALAQSMTAYDAAAIHLSRVPGADLLEVCQRLIGMTRKQRAALAPMHPGRA
+ DVIGGGAIVVEELARELRERAGIDQLTVSEHDILDGIALSLAG"
+ gene complement(1148902..1149582)
+ /gene="kdpE"
+ /locus_tag="BQ2027_MB1055C"
+ CDS complement(1148902..1149582)
+ /gene="kdpE"
+ /locus_tag="BQ2027_MB1055C"
+ /note="Mb1055c, kdpE, len: 226 aa. Equivalent to Rv1027c,
+ len: 226 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 226 aa overlap). Probable KdpE,
+ transcriptional regulatory protein, similar to others e.g.
+ KDPE_ECOLI|P21866 kdp operon transcriptional regulatory
+ protein from Escherichia coli strain K12 (225 aa), FASTA
+ scores: opt: 691, E(): 0, (47.8% identity in 224 aa
+ overlap); AL021530|SC2E9.13 from Streptomyces coelicolor
+ (227 aa), FASTA scores: opt: 981, E(): 0, (66.4% identity
+ in 226 aa overlap); etc. Protein product from Mb1055c
+ detected using SWATH mass spectrometry. Mb1055c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ KDPE"
+ /protein_id="SIT99654.1"
+ /db_xref="GOA:A0A1R3XX67"
+ /db_xref="InterPro:IPR001789"
+ /db_xref="InterPro:IPR001867"
+ /db_xref="InterPro:IPR011006"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039420"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX67"
+ /translation="MTLVLVIDDEPQILRALRINLTVRGYQVITASTGAGALRAAAEH
+ PPDVVILDLGLPDMSGIDVLGGLRGWLTAPVIVLSARTDSSDKVQALDAGADDYVTKP
+ FGMDEFLARLRAAVRRNTAAAELEQPVIETDSFTVDLAGKKVIKDGAEVHLTPTEWGM
+ LEMLARNRGKLVGRGELLKEVWGPAYATETHYLRVYLAQLRRKLEDDPSHPKHLLTES
+ GMGYRFEA"
+ gene complement(1149579..1152161)
+ /gene="kdpD"
+ /locus_tag="BQ2027_MB1056C"
+ CDS complement(1149579..1152161)
+ /gene="kdpD"
+ /locus_tag="BQ2027_MB1056C"
+ /note="Mb1056c, kdpD, len: 860 aa. Equivalent to Rv1028c,
+ len: 860 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 860 aa overlap). Probable kdpD, sensor
+ protein (EC 2.7.3.-), similar to others e.g.
+ KDPD_ECOLI|P21865 sensor protein from Escherichia coli
+ strain K12 (894 aa), FASTA scores: opt: 1041, E(): 0,
+ (32.3% identity in 888 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). Protein product
+ from Mb1056c detected using SWATH mass spectrometry.
+ Mb1056c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SENSOR PROTEIN KDPD"
+ /protein_id="SIT99655.1"
+ /db_xref="GOA:A0A1R3XXH9"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR003661"
+ /db_xref="InterPro:IPR003852"
+ /db_xref="InterPro:IPR004358"
+ /db_xref="InterPro:IPR005467"
+ /db_xref="InterPro:IPR006016"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="InterPro:IPR025201"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036097"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="InterPro:IPR038318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXH9"
+ /translation="MTLLFADLCAIFTPYRWMIEHVTTKRGQLRIYLGAAPGVGKTYA
+ MLGEAHRRLERGTDVVAAVVETHGRNKTAKLLEGIEMIPPRYVEYRGARFPELDVEAV
+ LRRHPQVVLVDELAHTNTPGSKNPKRWQDVQEILDAGITVISTVNIQHLEGLNDVVEQ
+ ITGIEQKEKIPDEIVRAADQVELVDITPEALRRRLAHGNVYAAERVDAALSNYFRTGN
+ LTALREIALLWLADQVDAALEKYRADKKITATWEARERVVVAVTGGPESETLVRRASR
+ IASKSSAELMVVHVIRGDDLAGVSAPQLGRVRELATSLGATMHTVVGDDVPTALLDFA
+ REMNATQLVVGTSRRSRWARLFDEGIGARTVQESGGIDVHMVTHPAASRASGWSRVSP
+ RERHIASWLAALVVPSVICAITVAWLDRFMGIGGESALFFIGVLIVALLGGVAPAALS
+ ALLSGMLLNYFLTEPRYTWTIAEPDAAVTEFVLLAMAVAVAVLVDGAASRTREARRAS
+ QEAELLALFAGSVLRGADLATLLQRVRETYSQRAVTMLRVRQGASTGETVACVGTNPC
+ RDVDSADTAIEVGDDEFWMLMAGRKLAARDRRVLTAVATQAAGLVKQRELAEEAGQAE
+ AIARADELRRSLLSAVSHDLRTPLAAAKVAVSSLRTEDVAFSPEDTAELLATIEESID
+ QLTALVANLLDSSRLAAGVIRPQLRRAYLEEAVQRALVSIGKGATGFYRSGIDRVKVD
+ VGDAVAMADAGLLERVLANLIDNALRYAPDCVVRVNAGRVRERVLINVIDEGPGVPRG
+ TEEQLFAPFQRPGDHDNTTGVGLGMSVARGFVEAMGGTISATDTPGGGLTVVIDLAAP
+ EDRP"
+ gene 1152395..1152487
+ /gene="kdpF"
+ /locus_tag="BQ2027_MB1057"
+ CDS 1152395..1152487
+ /gene="kdpF"
+ /locus_tag="BQ2027_MB1057"
+ /note="Mb1057, kdpF, len: 30 aa. Equivalent to Rv1028A,
+ len: 30 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 30 aa overlap). Probable kdpF, membrane
+ protein, showing similarity with P36937|KDPF_ECOLI|B0698.1
+ PROTEIN KDPF from Escherichia coli strain K12 (see
+ citation below) (27% identity); and KdpF protein from
+ Streptomyces coelicolor (51% identity)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable membrane protein kdpF"
+ /protein_id="SIT99656.1"
+ /db_xref="GOA:A0A1R3XX55"
+ /db_xref="InterPro:IPR011726"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX55"
+ /translation="MTTVDNIVGLVIAVALMAFLFAALLFPEKF"
+ gene 1152487..1154202
+ /gene="kdpA"
+ /locus_tag="BQ2027_MB1058"
+ CDS 1152487..1154202
+ /gene="kdpA"
+ /locus_tag="BQ2027_MB1058"
+ /note="Mb1058, kdpA, len: 571 aa. Equivalent to Rv1029,
+ len: 571 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 571 aa overlap). Probable kdpA,
+ potassium-transporting ATPase A chain (transmembrane
+ protein) (EC 3.6.3.12), similar to others e.g.
+ ATKA_ECOLI|P03959|KDPA|B0698 potassium-transporting ATPase
+ A chain from Escherichia coli strain K12 (557 aa), FASTA
+ scores: opt: 1763, E(): 0, (50.4% identity in 569 aa
+ overlap); etc. BELONGS TO THE KDPA FAMILY."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Potassium-transporting ATPase A chain
+ KDPA (Potassium-translocating ATPase A chain) (ATP
+ phosphohydrolase [potassium-transporting] A chain)
+ (Potassium binding and translocating subunit A)"
+ /protein_id="SIT99657.1"
+ /db_xref="GOA:P65210"
+ /db_xref="InterPro:IPR004623"
+ /db_xref="UniProtKB/Swiss-Prot:P65210"
+ /translation="MSGTSWLQFAALIAVLLLTAPALGGYLAKIYGDEAKKPGDRVFG
+ PIERVIYQVCRVDPGSEQRWSTYALSVLAFSVMSFLLLYGIARFQGVLPFNPTDKPAV
+ TDHVAFNAAVSFMTNTNWQSYSGEATMSHFTQMTGLAVQNFVSASAGMCVLAALIRGL
+ ARKRASTLGNFWVDLARTVLRIMFPLSFVVAILLVSQGVIQNLHGFIVANTLEGAPQL
+ IPGGPVASQVAIKQLGTNGGGFFNVNSAHPFENYTPIGNFVENWAILIIPFALCFAFG
+ KMVHDRRQGWAVLAIMGIIWIGMSVAAMSFEAKGNPRLDALGVTQQTTVDQSGGNLEG
+ KEVRFGVGASGLWAASTTGTSNGSVNSMHDSYTPLGGMVPLAHMMLGEVSPGGTGVGL
+ NGLLVMAILAVFIAGLMVGRTPEYLGKKIQATEMKLVTLYILAMPIALLSFAAASVLI
+ SSALASRNNPGPHGLSEILYAYTSGANNNGSAFAGLTASTWSYDTTIGVAMLIGRFFL
+ IIPVLAIAGSLARKGTTPVTAATFPTHKPLFVGLVIGVVLIVGGLTFFPALALGPIVE
+ QLSTQ"
+ gene 1154199..1156328
+ /gene="kdpB"
+ /locus_tag="BQ2027_MB1059"
+ CDS 1154199..1156328
+ /gene="kdpB"
+ /locus_tag="BQ2027_MB1059"
+ /note="Mb1059, kdpB, len: 709 aa. Equivalent to Rv1030,
+ len: 709 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 709 aa overlap). Probable kdpB,
+ potassium-transporting P-type ATPase B chain
+ (transmembrane protein) (EC 3.6.3.12), similar to others
+ e.g. ATKB_ECOLI|P03960 potassium-transporting ATPase B
+ chain from Escherichia coli strain K12 (682 aa), FASTA
+ scores: opt: 1481, E(): 0, (63.4% identity in 686 aa
+ overlap); etc. Very similar to AL078610|SCH35.47
+ H+/K+-exchanging ATPase (EC 3.6.1.36) chain B from
+ Streptomyces coelicolor (707 aa), FASTA scores: opt: 2731,
+ E(): 0, (71.6% identity in 676 aa overlap). Contains
+ PS00154 E1-E2 ATPases phosphorylation site. Protein
+ product from Mb1059 detected using shotgun mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Potassium-transporting P-type ATPase B
+ chain KDPB (Potassium-translocating ATPase B chain) (ATP
+ phosphohydrolase [potassium-transporting] B chain)
+ (Potassium binding and translocating subunit B)"
+ /protein_id="SIT99658.1"
+ /db_xref="GOA:P63682"
+ /db_xref="InterPro:IPR001757"
+ /db_xref="InterPro:IPR006391"
+ /db_xref="InterPro:IPR008250"
+ /db_xref="InterPro:IPR018303"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR023298"
+ /db_xref="InterPro:IPR023299"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="UniProtKB/Swiss-Prot:P63682"
+ /translation="MMIARMETSATAAAATSAPRLRLAKRSLFDPMIVRSALPQSLRK
+ LAPRVQARNPVMLVVLVGAVITTLAFLRDLASSTAQENVFNGLVAAFLWFTVLFANFA
+ EAMAEGRGKAQAAALRKVRSETMANRRTAAGNIESVPSSRLDLDDVVEVSAGETIPSD
+ GEIIEGIASVDESAITGESAPVIRESGGDRSAVTGGTVVLSDRIVVRITAKQGQTFID
+ RMIALVEGAARQQTPNEIALNILLAGLTIIFLLAVVTLQPFAIYSGGGQRVVVLVALL
+ VCLIPTTIGALLSAIGIAGMDRLVQHNVLATSGRAVEAAGDVNTLLLDKTGTITLGNR
+ QATEFVPINGVSAEAVADAAQLSSLADETPEGRSIVVLAKDEFGLRARDEGVMSHARF
+ VPFTAETRMSGVDLAEVSGIRRIRKGAAAAVMKWVRDHGGHPTEEVGAIVDGISSGGG
+ TPLVVAEWTDNSSARAIGVVHLKDIVKVGIRERFDEMRRMSIRTVMITGDNPATAKAI
+ AQEAGVDDFLAEATPEDKLALIKREQQGGRLVAMTGDGTNDAPALAQADVGVAMNTGT
+ QAAREAGNMVDLDSDPTKLIEVVEIGKQLLITRGALTTFSIANDVAKYFAIIPAMFVG
+ LYPVLDKLNVMALHSPRSAILSAVIFNALVIVALIPLALRGVRFRAESASAMLRRNLL
+ IYGLGGLVVPFIGIKLVDLVIVALGVS"
+ gene 1156328..1156897
+ /gene="kdpC"
+ /locus_tag="BQ2027_MB1060"
+ CDS 1156328..1156897
+ /gene="kdpC"
+ /locus_tag="BQ2027_MB1060"
+ /note="Mb1060, kdpC, len: 189 aa. Equivalent to Rv1031,
+ len: 189 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 189 aa overlap). Probable kdpC,
+ potassium-transporting ATPase C chain (membrane protein)
+ (EC 3.6.3.12), similar to others e.g. ATKC_ECOLI|P03961
+ potassium-transporting ATPase C chain from Escherichia
+ coli strain K12 (190 aa), FASTA scores: opt: 475, E():
+ 3.1e-24, (45.7% identity in 186 aa overlap); etc. BELONGS
+ TO THE KDPC FAMILY. Mb1060 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Potassium-transporting ATPase C chain
+ KDPC (Potassium-translocating ATPase C chain) (ATP
+ phosphohydrolase [potassium-transporting] C chain)
+ (Potassium binding and translocating subunit C)"
+ /protein_id="SIT99659.1"
+ /db_xref="GOA:P65212"
+ /db_xref="InterPro:IPR003820"
+ /db_xref="UniProtKB/Swiss-Prot:P65212"
+ /translation="MRRQLLPALTMLLVFTVITGIVYPLAVTGVGQLFFGDQANGALL
+ ERDGQVIGSAHIGQQFTAAKYFHPRPSSAGDGYDAAASSGSNLGPTNEKLLAAVAERV
+ TAYRKENNLPADTLVPVDAVTGSGSGLDPAISVVNAKLQAPRVAQARNISIRQVERLI
+ EDHTDARGLGFLGERAVNVLRLNLALDRL"
+ gene complement(1156901..1158430)
+ /gene="trcS"
+ /locus_tag="BQ2027_MB1061C"
+ CDS complement(1156901..1158430)
+ /gene="trcS"
+ /locus_tag="BQ2027_MB1061C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1061c, trcS, len: 509 aa. Equivalent to Rv1032c,
+ len: 509 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 509 aa overlap). trcS, two component
+ sensor histidine kinase protein (EC 2.7.3.-) (see
+ citations below), similar to YV16_MYCLE|P54883 probable
+ sensor-like histidine kinase from Mycobacterium leprae
+ (443 aa), FASTA scores: opt: 392, E(): 3.8e-18, (31.7%
+ identity in 334 aa overlap). Note that in vitro
+ autophosphorylation of TrcS requires the presence of
+ Mn2+or Ca2+as a divalent cation cofactor and subsequent
+ transphosphorylation of TrcR is evident in the presence of
+ TrcS-phosphate and Ca2+. Protein product from Mb1061c
+ detected using shotgun mass spectrometry. Mb1061c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="TWO COMPONENT SENSOR HISTIDINE KINASE TRCS"
+ /protein_id="SIT99660.1"
+ /db_xref="GOA:A0A1R3XX59"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR003660"
+ /db_xref="InterPro:IPR003661"
+ /db_xref="InterPro:IPR004358"
+ /db_xref="InterPro:IPR005467"
+ /db_xref="InterPro:IPR036097"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX59"
+ /translation="MIPDRNTRSRKAPCWRPRSLRQQLLLGVLAVVTVVLVAVGVVSV
+ LSLSGYVTAMNDAELVESLHALNHSYTRYRDSAQTSTPTGNLPMSQAVLEFTGQTPGN
+ LIAVLHDGVVIGSAVFSEDGARPAPPDVIRAIEAQVWDGGPPRVESLGSLGAYQVDSS
+ AAGADRLFVGVSLSLANQIIARKKVTTVALVGAALVVTAALTVWVVGYALRPLRRVAA
+ TAAEVATMPLTDDDHQISVRVRPGDTDPDNEVGIVGHTLNRLLDNVDGALAHRVDSDL
+ RMRQFITDASHELRTPLAAIQGYAELTRQDSSDLPPTTEYALARIESEARRMTLLVDE
+ LLLLSRLSEGEDLETEDLDLTDLVINAVNDAAVAAPTHRWVKNLPDEPVWVNGDHARL
+ HQLVSNLLTNAWVHTQPGVTVTIGITCHRTGPNAPCVELSVTDDGPDIDPEILPHLFD
+ RFVRASKSRSNGSGHGLGLAIVSSIVKAHRGSVTAESGNGQTVFRVRLPMIEQQIATT
+ A"
+ gene complement(1158438..1159211)
+ /gene="trcR"
+ /locus_tag="BQ2027_MB1062C"
+ CDS complement(1158438..1159211)
+ /gene="trcR"
+ /locus_tag="BQ2027_MB1062C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1062c, trcR, len: 257 aa. Equivalent to Rv1033c,
+ len: 257 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 257 aa overlap). trcR, two-component
+ regulatory protein (see citations below), similar to
+ Q50825 TWO COMPONENT RESPONSE REGULATOR from Mycobacterium
+ tuberculosis (234 aa), FASTA scores: opt: 628, E(): 0,
+ (46.0% identity in 226 aa overlap). Note that in vitro
+ autophosphorylation of TrcS requires the presence of
+ Mn2+or Ca2+as a divalent cation cofactor and subsequent
+ transphosphorylation of TrcR is evident in the presence of
+ TrcS-phosphate and Ca2+. Protein product from Mb1062c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1062c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="TWO COMPONENT TRANSCRIPTIONAL REGULATOR TRCR"
+ /protein_id="SIT99661.1"
+ /db_xref="GOA:A0A1R3XX60"
+ /db_xref="InterPro:IPR001789"
+ /db_xref="InterPro:IPR001867"
+ /db_xref="InterPro:IPR011006"
+ /db_xref="InterPro:IPR016032"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039420"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX60"
+ /translation="MTTMSGYTRSQRPRQAILGQLPRIHRADGSPIRVLLVDDEPALT
+ NLVKMALHYEGWDVEVAHDGQEAIAKFDKVGPDVLVLDIMLPDVDGLEILRRVRESDV
+ YTPTLFLTARDSVMDRVTGLTSGADDYMTKPFSLEELVARLRGLLRRSSHLERPADEA
+ LRVGDLTLDGASREVTRDGTPISLSSTEFELLRFLMRNPRRALSRTEILDRVWNYDFA
+ GRTSIVDLYISYLRKKIDSDREPMIHTVRGIGYMLRPPE"
+ gene complement(1159393..1159782)
+ /locus_tag="BQ2027_MB1063C"
+ CDS complement(1159393..1159782)
+ /locus_tag="BQ2027_MB1063C"
+ /note="Mb1063c, -, len: 129 aa. Equivalent to Rv1034c,
+ len: 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 129 aa overlap). Probable IS1560
+ transposase fragment, similar to part of
+ Rv3387|E1202305|MTV004.45 (225 aa) (65.1% identity in 129
+ aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSPOSASE (FRAGMENT)"
+ /protein_id="SIT99662.1"
+ /db_xref="GOA:A0A1R3XZA0"
+ /db_xref="InterPro:IPR002559"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZA0"
+ /translation="MQQGNPPDAPQLAPAVAWVKKRAGRTPRTVTADRGYGEAAVDQQ
+ LTEVGVKNVLIPRKGKPSQDRRAEEHRKAFRRTIKWRTGCEGRISHLKRGYGWDRGRI
+ GGLEGTRTWVGHGVFAHNLVTISALPA"
+ gene complement(1159396..1160908)
+ /locus_tag="BQ2027_IS1560'-1"
+ mobile_element complement(1159396..1160908)
+ /locus_tag="BQ2027_IS1560'-1"
+ /note="IS1560'-1, len: 1513 nt. Equivalent to IS1560, len:
+ 1513 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(100.0% identity in 1513 nt overlap)."
+ /mobile_element_type="insertion sequence:IS1560"
+ gene complement(1159850..1160536)
+ /locus_tag="BQ2027_MB1064C"
+ CDS complement(1159850..1160536)
+ /locus_tag="BQ2027_MB1064C"
+ /note="Mb1064c, -, len: 228 aa. Equivalent to Rv1035c,
+ len: 228 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 228 aa overlap). Probable IS1560
+ transposase fragment, similar to parts of
+ Rv3387|E1202305|MTV004.45 (225 aa) (47.8% identity in 67
+ aa overlap) and Rv3386|E1202304|MTV004.44 (234 aa) (55.1%
+ identity in 127 aa overlap). Protein product from Mb1064c
+ detected using SWATH mass spectrometry. Mb1064c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSPOSASE (FRAGMENT)"
+ /protein_id="SIT99663.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY47"
+ /translation="MPHPTTLMKLTTRCGSAAIDGLNEALLAKAAEAKLLGTNRIRAD
+ TTVARANVSYPTDLGLLAKAMRRIAATGKRIQAAGGAVRTRVGDRSRAAGRRAHAVAA
+ KLRSRAELGRDEARAAVLRFTGELAELAQAAAQEAQQLLDNAKQAVLRAKAKAAALAA
+ RGERDAVAGRRCGGLVRAVNDLTELLNATRQIVAQTRQRVAGITSDGASRRVSLHDGD
+ ARPDHQGSAR"
+ gene complement(1160570..1160908)
+ /locus_tag="BQ2027_MB1065C"
+ CDS complement(1160570..1160908)
+ /locus_tag="BQ2027_MB1065C"
+ /note="Mb1065c, -, len: 112 aa. Equivalent to Rv1036c,
+ len: 112 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 112 aa overlap). Probable IS1560
+ transposase fragment, similar to part of
+ Rv3386|E1202304|MTV004.44 (234 aa) (82.8% identity in 87
+ aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE IS1560 TRANSPOSASE (FRAGMENT)"
+ /protein_id="SIT99664.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX81"
+ /translation="MIPGRMVLNWEDGLNALVAEGIEAIVFRTLGDQCWLWESLLPDE
+ VRRLPEELARVDALLDDPAFFAPFVPFFDPRRGRPSTPMEVYLQLMFVKFRYRLGYES
+ LCREVADSIT"
+ gene complement(1161019..1161303)
+ /gene="esxI"
+ /locus_tag="BQ2027_MB1066C"
+ CDS complement(1161019..1161303)
+ /gene="esxI"
+ /locus_tag="BQ2027_MB1066C"
+ /standard_name="ES6_1; Mtb9.9D"
+ /note="Mb1066c, esxI, len: 94 aa. Equivalent to Rv1037c,
+ len: 94 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.9% identity in 94 aa overlap). esxI, conserved
+ hypothetical protein, member of ESAT-6 family, highly
+ similar to many Mycobacterial hypothetical proteins e.g.
+ Q49946|ES6X_MYCLE|U1756D PUTATIVE ESAT-6 LIKE PROTEIN X
+ from Mycobacterium leprae (95 aa), FASTA scores: opt: 409,
+ E(): 6.3e-23, (64.15% identity in 92 aa overlap); Rv3619c,
+ Rv1198, Rv2346c, etc from Mycobacterium tuberculosis.
+ Strictly identical to
+ P96364|ES61_MYCTU|Rv3619c|MTCY15C10.33|MTCY07H7B.03|MT3721
+ PUTATIVE ESAT-6 LIKE PROTEIN 1 (94 aa). BELONGS TO THE
+ ESAT6 FAMILY. Mb1066c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative esat-6 like protein esxi (esat-6 like
+ protein 1)"
+ /protein_id="SIT99665.1"
+ /db_xref="GOA:P59802"
+ /db_xref="InterPro:IPR009416"
+ /db_xref="InterPro:IPR010310"
+ /db_xref="InterPro:IPR036689"
+ /db_xref="UniProtKB/Swiss-Prot:P59802"
+ /translation="MTINYQFGDVDAHGAMIRALAGSLEAEHQAIISDVLTASDFWGG
+ AGSAACQGFITQLGRNFQVIYEQANAHGQKVQAAGNNMAQTDSAVGSSWA"
+ gene complement(1161330..1161626)
+ /gene="esxJ"
+ /locus_tag="BQ2027_MB1067C"
+ CDS complement(1161330..1161626)
+ /gene="esxJ"
+ /locus_tag="BQ2027_MB1067C"
+ /standard_name="ES6_2,TB11.0,QILSS"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1067c, esxJ, len: 98 aa. Equivalent to Rv1038c,
+ len: 98 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 98 aa overlap). esxJ, putative ESAT-6
+ like protein 2, similar to Q49945|U1756C, Mycobacterium
+ leprae (100 aa), FASTA scores: opt: 375, E(): 7.7e-21,
+ (58.3% identity in 96 aa overlap), almost identical to
+ Rv1197, Rv1792, Rv2347c and Rv3620c. BELONGS TO THE ESAT6
+ FAMILY. Protein product from Mb1067c detected using
+ shotgun mass spectrometry. Mb1067c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esat-6 like protein esxj (esat-6 like protein
+ 2)"
+ /protein_id="SIT99666.1"
+ /db_xref="GOA:P0DOB0"
+ /db_xref="InterPro:IPR010310"
+ /db_xref="InterPro:IPR036689"
+ /db_xref="UniProtKB/Swiss-Prot:P0DOB0"
+ /translation="MASRFMTDPHAMRDMAGRFEVHAQTVEDEARRMWASAQNISGAG
+ WSGMAEATSLDTMTQMNQAFRNIVNMLHGVRDGLVRDANNYEQQEQASQQILSS"
+ gene complement(1161772..1162947)
+ /gene="PPE15"
+ /locus_tag="BQ2027_MB1068C"
+ CDS complement(1161772..1162947)
+ /gene="PPE15"
+ /locus_tag="BQ2027_MB1068C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1068c, PPE15, len: 391 aa. Equivalent to Rv1039c,
+ len: 391 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 391 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of glycine-rich
+ proteins, most similar to Rv2768c|AL008967|MTV002_33
+ Mycobacterium tuberculosis H37Rv (394 aa), FASTA scores:
+ opt: 1721, E(): 0, (70.4% identity in 398 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe15"
+ /protein_id="SIT99667.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX65"
+ /translation="MDFGALPPEINSARMYAGAGAGPMMAAGAAWNGLAAELGTTAAS
+ YESVITRLTTESWMGPASMAMVAAAQPYLAWLTYTAEAAAHAGSQAMASAAAYEAAYA
+ MTVPPEVVAANRALLAALVATNVLGINTPAIMATEALYAEMWAQDALAMYGYAAASGA
+ AGMLQPLSPPSQTTNPGGLAAQSAAVGSAAATAAVNQVSVADLISSLPNAVSGLASPV
+ TSVLDSTGLSGIIADIDALLATPFVANIINSAVNTAAWYVNAAIPTAIFLANALNSGA
+ PVAIAEGAIEAAEGAASAAAAGLADSVTPAGLGASLGEATLVGRLSVPAAWSTAAPAT
+ TAGATALEGSGWTVAAEEAGPVTGMMPGMASAAKGTGAYAGPRYGFKPTVMPKQVVV"
+ gene complement(1163024..1163851)
+ /gene="PE8"
+ /locus_tag="BQ2027_MB1069C"
+ CDS complement(1163024..1163851)
+ /gene="PE8"
+ /locus_tag="BQ2027_MB1069C"
+ /note="Mb1069c, PE8, len: 275 aa. Equivalent to Rv1040c,
+ len: 275 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 275 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family, most similar to
+ AL008967|MTV002_34 Mycobacterium tuberculosis H37Rv (275
+ aa), FASTA scores: opt: 1111, E(): 0, (68.6% identity in
+ 283 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe8"
+ /protein_id="SIT99668.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX54"
+ /translation="MSFLKTVPEELTAAAAQLGTIGAAMAAQNAAAAAPTTAIAPAAL
+ DEVSALQAALFTAYGTFYQQVSAEAQAMHDMFVNTLGISAGTYGVTESLNSSAAASPL
+ SGITGEASAIIQATTGLFPPELSGGIGNILNIGAGNWASATSTLIGLAGGGLLPAEEA
+ AEAASALGGEAALGELGALGAAEAALGEAGIAAGLGSASAIGMLSVPPAWAGQATLVS
+ TTSTLPGAGWTAAAPQAAAGTFIPGMPGVASAARNSAGFGAPRYGVKPIVMPKPATV"
+ gene complement(1165047..1166025)
+ /locus_tag="BQ2027_IS-LIKE-1"
+ mobile_element complement(1165047..1166025)
+ /locus_tag="BQ2027_IS-LIKE-1"
+ /note="IS-LIKE-1, len: 979 nt. Equivalent to IS-LIKE, len:
+ 978 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(99.8% identity in 979 nt overlap). Insertion
+ sequence,ISlike2, region identical to cos mid y348, blast
+ score: 4902 (+1) 9377 10354 EM_NEW:MTAD20 A d000020 M.
+ tuberculosis sequence from clone y348."
+ /mobile_element_type="insertion sequence:IS-LIKE"
+ gene complement(1165047..1165529)
+ /locus_tag="BQ2027_MB1070C"
+ CDS complement(1165047..1165529)
+ /locus_tag="BQ2027_MB1070C"
+ /note="Mb1070c, -, len: 160 aa. Equivalent to Rv1041c,
+ len: 287 aa, from Mycobacterium tuberculosis strain H37Rv.
+ Probable IS like-2 transposase. Similar to Q00430|X53945
+ insertion element IS869 hypothetical protein from
+ Agrobacterium tumefaciens (186 aa), Similar to Rv1150,
+ C-terminal part of transposase of putative Mycobacterium
+ tuberculosis IS like-1. Mb1070c and Mb1071c are
+ frameshifted with respect to Mycobacterium tuberculosis
+ Q50761 transposase, the 10G2 cosmid sequence appears to be
+ correct. Mb1070c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable is like-2 transposase"
+ /protein_id="SIT99669.1"
+ /db_xref="GOA:A0A1R3XX79"
+ /db_xref="InterPro:IPR002559"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX79"
+ /translation="MTTKIHALTDQREAPVRIRLTAGQAGDNPQLLPLLDDYRHASTE
+ YALGSTDFRLLADKAYSHPSTRAALRSKKIKHTIPERQDQIDRRKAKGSAGGRPPAFD
+ AALYGLRNTVERGFHRLKQWRGIATRYDKYALTYLGGVLLACAVIHARVGTPKLGDTP
+ "
+ gene complement(1165567..1165974)
+ /locus_tag="BQ2027_MB1071C"
+ CDS complement(1165567..1165974)
+ /locus_tag="BQ2027_MB1071C"
+ /note="Mb1071c, -, len: 135 aa. Equivalent to Rv1042c,
+ len: 135 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 135 aa overlap). Probable IS like-2
+ transposase, similar to Q50761 TRANSPOSASE from
+ Mycobacterium tuberculosis (308 aa), FASTA scores: opt:
+ 823, E(): 0, (99.1% identity in 117 aa overlap). Second
+ copy is Rv1149. Mb1071c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable is like-2 transposase"
+ /protein_id="SIT99670.1"
+ /db_xref="InterPro:IPR025161"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX71"
+ /translation="MTRVGVISDEFWAVVEPLMPSHEGKPGRRFSDHRLILEGIAWRF
+ RTGSPWRDLPAEFGPWQTVWKRHHRWSLDGTCDEVFAHVAAVFGVDAEVAEDIEKLLS
+ VDSTNVRAHQHSAGACSDTLATGGTVELQEIRR"
+ gene complement(1166257..1167282)
+ /locus_tag="BQ2027_MB1072C"
+ CDS complement(1166257..1167282)
+ /locus_tag="BQ2027_MB1072C"
+ /note="Mb1072c, -, len: 341 aa. Equivalent to Rv1043c,
+ len: 341 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 341 aa overlap). Conserved hypothetical
+ protein similar to AL096872|SC5F7.08 PUTATIVE
+ LIPOATE-PROTEIN LIGASE from Streptomyces coelicolor (362
+ aa), FASTA scores: opt: 206, E(): 1.4e-05, (30.3% identity
+ in 201 aa overlap). Weak similarity to P39668|YYXA_BACSU
+ HYPOTHETICAL PROTEASE from Bacillus subtitis (400 aa),
+ FASTA scores: opt: 159, E(): 0.013, (27.1% identity in 210
+ aa overlap). Protein product from Mb1072c detected using
+ SWATH mass spectrometry. Mb1072c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Trypsin-like serine proteases, typically
+ periplasmic, contain C-terminal PDZ domain"
+ /protein_id="SIT99671.1"
+ /db_xref="InterPro:IPR009003"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX73"
+ /translation="MCAHQFFGLVHNPVVAAAIGKPEPPPVDSDIGLPTTVPFEPWSV
+ ADFSRYLSTLGLPAAGDAVTLHRILSSMERAGLLLPLGWDPRLPVMGQKYISQGTISK
+ GQRGGNLWLSEVFGAELIIPSYNAVTVQLAGHDDAGNPVDSWGTGLVVDHNHVITNKH
+ VVTGLAGTSAGLSVYPSSNHAEAELVNFSGTAHPHPTLDVAVIKFEMPEGKYIPRLGG
+ MAFRDPDWADEVYVFGYPRVPMTAEMAITVQRGEVVNPAATTIPCRQKIFLYSAIARP
+ GNSGGPIVAQDGRVIGLVVEDSAEAPSTGTGPNAAPFYRGIPSSEVIRALDELDFGGI
+ VEMDTLP"
+ gene 1167529..1168152
+ /locus_tag="BQ2027_MB1073"
+ CDS 1167529..1168152
+ /locus_tag="BQ2027_MB1073"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1073, -, len: 207 aa. Equivalent to Rv1044, len:
+ 207 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 207 aa overlap). Conserved hypothetical
+ protein, similar to Mycobacterium tuberculosis
+ hypothetical protein MTCY06G11.02C|P96837 (289 aa), fasta
+ scores: E(): 8.9e-06, (30.7% identity in 150 aa overlap).
+ Some similarity to U36837|LLU36837_1 Lactococcus lactis
+ plasmid pNP40 (287 aa), FASTA scores: opt: 147, E ():
+ 0.0087, (29.7% identity in 91 aa overlap). Protein product
+ from Mb1073 detected using SWATH mass spectrometry. Mb1073
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted transcriptional regulator"
+ /protein_id="SIT99672.1"
+ /db_xref="InterPro:IPR025159"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZB5"
+ /translation="MCAKPYLIDTIAHMAIWDRLVEVAAEQHGYVTTRDARDIGVDPV
+ QLRLLAGRGRLERVGRGVYRVPVLPRGEHDDLAAAVSWTLGRGVISHESALALHALAD
+ VNPSRIHLTVPRNNHPRAAGGELYRVHRRDLQAAHVTSVDGIPVTTVARTIKDCVKTG
+ TDPYQLRAAIERAEAEGTLRRGSAAELRAALDETTAGLRARPKRASA"
+ gene 1168149..1169030
+ /locus_tag="BQ2027_MB1074"
+ CDS 1168149..1169030
+ /locus_tag="BQ2027_MB1074"
+ /note="Mb1074, -, len: 293 aa. Equivalent to Rv1045, len:
+ 293 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 293 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1074 detected using SWATH
+ mass spectrometry. Mb1074 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99673.1"
+ /db_xref="InterPro:IPR014942"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY56"
+ /translation="MTKPYSSPPTNLRSLRDRLTQVAERQGVVFGRLQRHVAMIVVAQ
+ FAATLTDDTGAPLLLVKGGSSLELRRGIPDSRTSKDFDTVARRDIELIHEQLADAGET
+ GGEGFTAIFTAPEEIDVPGMPVKPRRFTAKLSYRGRAFATVPIEVSSVEAGNADQFDT
+ LTSDALGLVGVPAAVAVPCMTIPWQIAQKLHAVTAVLEEPKVNDRAHDLVDLQLLEGL
+ LLDADLMPTRSACIAIFEARAQHPWPPRVATLPHWPLIYAGALEGLDHLELARTVDAA
+ AQAVQRFVARIDRATKR"
+ gene complement(1169112..1169705)
+ /locus_tag="BQ2027_MB1075C"
+ CDS complement(1169112..1169705)
+ /locus_tag="BQ2027_MB1075C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1075c, -, len: 197 aa. Equivalent to Rv1046c,
+ len: 174 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 174 aa overlap). Hypothetical unknown
+ protein. Start changed since first submission (-65 aa).
+ Mb1075c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99674.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX92"
+ /translation="MKVQARVGWNRRQLSAVGGRGQQLFANAPGHIPSTSHRRGTGDI
+ NRKIDESLAGAARPQANANYGATSDPPLTHQPKPGSPTQVGPRSPSPPGLRGLVKQLP
+ EVHQSSLHLDTVASLPSSRPSPHHTPLALRSRSGHFSPDEIRNRRSRKRSQSHMPPRT
+ PPRGRCLRAPESARLGRRSAAHRHSIARNARAIPFVV"
+ gene 1169747..1171209
+ /locus_tag="BQ2027_IS1081-1"
+ mobile_element 1169747..1171181
+ /locus_tag="BQ2027_IS1081-1"
+ /note="IS1081-1, len: 1435 nt. Equivalent to IS1081, len:
+ 1450 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(100.0% identity in 1435 nt overlap). Almost
+ identical to Mycobacterium bovis IS1081 (7157 (-1) 60 14
+ 94 EM_BA:MBBIS1081 X84741 Mycobacterium bovis BCG IS1081
+ DNA 4/96."
+ /mobile_element_type="insertion sequence:IS1081"
+ repeat_region 1169848..1169862
+ /locus_tag="BQ2027_IS1081-1"
+ /note="15 bp perfect inverted repeat, IRL,TCGCGTGATCCTTCG,
+ flanking IS element IS1081."
+ /rpt_type=INVERTED
+ gene 1169900..1171147
+ /locus_tag="BQ2027_MB1076"
+ CDS 1169900..1171147
+ /locus_tag="BQ2027_MB1076"
+ /note="Mb1076, -, len: 415 aa. Equivalent to Rv1047, len:
+ 415 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 415 aa overlap). IS1081 transposase,
+ most similar to TRA1_MYCBO|P35882 transposase for
+ insertion sequence element (415 aa), FASTA scores: opt:
+ 2675, E(): 0, (99.8% identity in 415 aa overlap). Contains
+ PS01007 Transposases, Mutator family, signature"
+ /codon_start=1
+ /transl_table=11
+ /product="probable transposase"
+ /protein_id="SIT99675.1"
+ /db_xref="GOA:P60231"
+ /db_xref="InterPro:IPR001207"
+ /db_xref="UniProtKB/Swiss-Prot:P60231"
+ /translation="MTSSHLIDTEQLLADQLAQASPDLLRGLLSTFIAALMGAEADAL
+ CGAGYRERSDERSNQRNGYRHRDFDTRAATIDVAIPKLRQGSYFPDWLLQRRKRAERA
+ LTSVVATCYLLGVSTRRMERLVETLGVTKLSKSQVSIMAKELDEAVEAFRTRPLDAGP
+ YTFLAADALVLKVREAGRVVGVHTLIATGVNAEGYREILGIQVTSAEDGAGWLAFFRD
+ LVARGLSGVALVTSDAHAGLVAAIGATLPAAAWQRCRTHYAANLMAATPKPSWPWVRT
+ LLHSIYDQPDAESVVAQYDRVLDALTDKLPAVAEHLDTARTDLLAFTAFPKQIWRQIW
+ SNNPQERLNREVRRRTDVVGIFPDRASIIRLVGAVLAEQHDEWIEGRRYLGLEVLTRA
+ RAALTSTEEPAKQQTTNTPALTT"
+ repeat_region complement(1171157..1171171)
+ /note="15 bp perfect inverted repeat, IRR,TCGCGTGATCCTTCG,
+ flanking IS element IS1081."
+ /rpt_type=INVERTED
+ gene complement(1171515..1172630)
+ /locus_tag="BQ2027_MB1077C"
+ CDS complement(1171515..1172630)
+ /locus_tag="BQ2027_MB1077C"
+ /note="Mb1077c, -, len: 371 aa. Equivalent to Rv1048c,
+ len: 371 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 371 aa overlap). Hypothetical unknown
+ protein. Mb1077c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99676.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX74"
+ /translation="MQASDRTWQSNFIRRWYFTETVEYRPLVKYDASMSWDERTVSAL
+ EGAFRSEVRARRVNGPHRDVIVSLDGAEFLVRWLTTGWPRQVAEALHATSRPDILAAP
+ TMSPGARKAAHDAGVGWVDESGAADIHYRNTSTGTTLVIETKGAPPAPLDARIGWRRA
+ TLAVCEALLANIAGPTVASVVEATGLSMGSSAQALKFLEKNGHLASATARGPKSARLI
+ VDRDALLDAYAEAADKLRSPISISTGVLWRDPTAGVVKAGQLWDAAGIEWAATSALSA
+ SLLAPMQTEIAPMEIYVPGRSWSDLRRAAMAAGLQEIAGGRLILRFFPTPACARLTEQ
+ NLQGFRSMLWPRVYADLRTAGVRGEDAAEHLREAMTK"
+ gene 1172863..1173309
+ /locus_tag="BQ2027_MB1078"
+ CDS 1172863..1173309
+ /locus_tag="BQ2027_MB1078"
+ /note="Mb1078, -, len: 148 aa. Equivalent to Rv1049, len:
+ 148 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 148 aa overlap). Probable
+ transcriptional repressor protein, similar to many e.g.
+ P74870 NEGATIVE REGULATOR OF EMR LOCUS EMR from Salmonella
+ typhimurium (149 aa), FASTA scores: opt: 146, E(): 0.0011,
+ (31.6% identity in 95 aa overlap). Contains probable
+ helix-turn -helix motif at aa 58-79 (Score 1495, +4.28
+ SD). Mb1078 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REPRESSOR PROTEIN"
+ /protein_id="SIT99677.1"
+ /db_xref="GOA:A0A1R3XX75"
+ /db_xref="InterPro:IPR000835"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX75"
+ /translation="MGKGAAFDECACYTTRRAARQLGQAYDRALRPSGLTNTQFSTLA
+ VISLSEGSAGIDLTMSELAARIGVERTTLTRNLEVMRRDGLVRVMAGADARCKRIELT
+ AKGRAALQKAVPLWRGVQAEVTASVGDWPRVRRDIANLGQAAEACR"
+ gene 1173357..1174262
+ /locus_tag="BQ2027_MB1079"
+ CDS 1173357..1174262
+ /locus_tag="BQ2027_MB1079"
+ /note="Mb1079, -, len: 301 aa. Equivalent to Rv1050, len:
+ 301 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 301 aa overlap). Probable oxidoreductase
+ (EC 1.-.-.-) similar to many e.g. Rv1543|MTCY48.22C|Q10783
+ PUTATIVE OXIDOREDUCTASE CY48.22C (341 aa), FASTA scores:
+ opt: 462, E(): 3e-22, (33.6% identity in 265 aa overlap).
+ Protein product from Mb1079 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="SIT99678.1"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX66"
+ /translation="MARQRFRDQVVLITGASSGIGEATAKAFAREGAVVALAARREGA
+ LRRVAREIEAAGGRAMVAPLDVSSSESVRAMVADVVGEFGRIDVVFNNAGVSLVGPVD
+ AETFLDDTREMLEIDYLGTVRVVREVLPIMKQQRSGRIMNMSSVVGRKAFARFAGYSS
+ AMHAIAGFSDALRQELRGSGIAVSVIHPALTQTPLLANVDPADMPPPFRSLTPIPVHW
+ VAAAVLDGVARRRARVVVPFQPRLLMVGDAFSPRYGDRVVRLLESKIFGRLIGSYRGS
+ VYRHQPTESAKAQAAQPERGYSSAR"
+ gene complement(1174421..1175176)
+ /locus_tag="BQ2027_MB1080C"
+ CDS complement(1174421..1175176)
+ /locus_tag="BQ2027_MB1080C"
+ /note="Mb1080c, -, len: 251 aa. Equivalent to Rv1051c,
+ len: 251 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 251 aa overlap). Conserved hypothetical
+ protein, similar to LLU36837|U36837.1 protein encoded by
+ Lactococcus lactis plasmid pNP40 (298 aa), FASTA scores:
+ opt: 194, E(): 3.5e-06, (30.3% identity in 155 aa
+ overlap). Contains possible helix-turn-helix motif at aa
+ 197-218 (Score 1097, +2.92 SD)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99679.1"
+ /db_xref="InterPro:IPR009061"
+ /db_xref="InterPro:IPR014942"
+ /db_xref="InterPro:IPR041657"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX93"
+ /translation="MRADVTAEHLTQVVRDIAVIDIDDGVAFNLDTSSVQEIRERADY
+ PGLRVRVAMSVGPWQGIAAWDVSTGEPIAPWPTRVTIDRILGEPITLLGYAPETIIAE
+ KGVTILERGITSTRWRDYVDIVQLDRRGIDDDELLRSARAVAQYRGATLEPVAPHLAG
+ YGAVAQAKWATEHGRCQHCWRHWKPAHVGRRNMDLLDAKQVSEMIGVPVGTLRHWRHS
+ DIGPASFTLGRRVVYRRDEVSRWISKRESATRR"
+ gene 1176199..1176588
+ /locus_tag="BQ2027_MB1081"
+ CDS 1176199..1176588
+ /locus_tag="BQ2027_MB1081"
+ /note="Mb1081, -, len: 129 aa. Equivalent to Rv1052, len:
+ 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 129 aa overlap). Hypothetical unknown
+ protein. Mb1081 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99680.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX76"
+ /translation="MDCCEERGVARHKGLSQVGTPGCPRWSQAVSCRCSAYREAAVTA
+ VQMPLTPGYGETPLPHDELAALLPEVVEVLDKPITRADVYDLEQGLQDQVFDLLMPTA
+ VEGSLSLDELLSDHFVRDLHARMFGPV"
+ gene complement(1176487..1176762)
+ /locus_tag="BQ2027_MB1082C"
+ CDS complement(1176487..1176762)
+ /locus_tag="BQ2027_MB1082C"
+ /note="Mb1082c, -, len: 91 aa. Equivalent to Rv1053c, len:
+ 91 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 91 aa overlap). Hypothetical unknown protein."
+ /codon_start=1
+ /transl_table=11
+ /product="Mobile element protein"
+ /protein_id="SIT99681.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX80"
+ /translation="MDSHKVCMNNNTQLPTGPIIGVHPAVRDGVERVAYLDGDLLRCN
+ TDVEFTSSPPPGPVLYRTKHTRVEIADEMVTEKLIKRQRAFNSRRHQ"
+ gene 1177404..1177718
+ /locus_tag="BQ2027_MB1083"
+ CDS 1177404..1177718
+ /locus_tag="BQ2027_MB1083"
+ /note="Mb1083, -, len: 104 aa. Equivalent to Rv1054, len:
+ 104 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 104 aa overlap). Probable integrase
+ (fragment), similar to Rv2309c|MTCY3G12_25|Z79702
+ hypothetical protein (shows similarity to integrases) from
+ Mycobacterium tuberculosis (151 aa), FASTA scores: opt:
+ 273, E(): 8.8e-13, (64.7% identity in 68 aa overlap); and
+ to L39071|MSGINT_1 integrase from Mycobacterium
+ paratuberculosis (191 aa), FASTA scores: opt: 105, E():
+ 0.9, (31.8% identity in 85 aaoverlap). This ORF continues
+ in another frame as Rv1055|MTV017.08 but no error can be
+ found to account for frameshift. Length extended since
+ first submission (+36 aa). Mb1083 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable integrase (fragment)"
+ /protein_id="SIT99682.1"
+ /db_xref="GOA:A0A1R3XZC2"
+ /db_xref="InterPro:IPR011010"
+ /db_xref="InterPro:IPR014417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZC2"
+ /translation="MTGKGIVESTTKTKRDRHVPVPEPVWRRLHAELPTDPNALVFPG
+ RKGGFLPLGEYRWAFDNAGDQVGIEGWYRTVWGTPRPRWRSAQALTSRSCNGSLDTQQ
+ RR"
+ gene 1177715..1177849
+ /locus_tag="BQ2027_MB1084"
+ CDS 1177715..1177849
+ /locus_tag="BQ2027_MB1084"
+ /note="Mb1084, -, len: 44 aa. Equivalent to Rv1055, len:
+ 44 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 44 aa overlap). Possible integrase
+ (fragment); first 49 aa similar to
+ Rv2309c|MTCY3G12_25|Z79702 hypothetical protein (shows
+ similarity to integrases) from Mycobacterium tuberculosis
+ (151 aa), FASTA scores: opt: 291, E(): 2.2e-16, (74.3%
+ identity in 70 aa overlap); and to L39071|MSGINT_1
+ integrase from Mycobacterium paratuberculosis (191 aa),
+ FASTA scores: opt: 146, E(): 8.3e-05, (52.1% identity in
+ 48 aa overlap); and to many other integrases or
+ transposases. Shortened since first submission (-34 aa).
+ Mb1084 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE INTEGRASE (FRAGMENT)"
+ /protein_id="SIT99683.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY66"
+ /translation="MTLDRHGHLLNDDLAVWPMRCAKSSRTLRYHCGMRRRNRVGLRA
+ "
+ gene 1177838..1177911
+ /locus_tag="BQ2027_LEUX"
+ tRNA 1177838..1177911
+ /locus_tag="BQ2027_LEUX"
+ /product="tRNA-Leu"
+ /note="leuX, len: 74 nt. Equivalent to leuX, len: 74 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 74 nt overlap). tRNA-Leu, anticodon taa."
+ gene 1178104..1178868
+ /locus_tag="BQ2027_MB1085"
+ CDS 1178104..1178868
+ /locus_tag="BQ2027_MB1085"
+ /note="Mb1085, -, len: 254 aa. Equivalent to Rv1056, len:
+ 254 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 254 aa overlap). Conserved hypothetical
+ protein, some similarity in C-terminal region of
+ Rv0140|MTCI5.14|Z92770 Mycobacterium tuberculosis (126
+ aa), FASTA scores: opt: 254, E(): 1.2e-10, (43.4% identity
+ in 106 aa overlap); and to Rv1670. C-terminal region is
+ similar to AL035569|SC8D9.02 hypothetical protein from
+ Streptomyces coelicolor (113 aa), FASTA scores: opt: 282,
+ E(): 4.5e-12, (48.0% identity in 100 aa overlap). Protein
+ product from Mb1085 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1085 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99684.1"
+ /db_xref="InterPro:IPR007361"
+ /db_xref="InterPro:IPR038694"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX99"
+ /translation="MSVDYPQMAATRGRIEPAPRRVRGYLGHVLVFDTSAARYVWEVP
+ YYPQYYIPLADVRMEFLRDENHPQRVQLGPSRLHSLVSAGQTHRSAARVFDVDGDSPV
+ AGTVRFNWDPLRWFEEDEPIYGHPRNPYQRADALRSHRHVRVELDGIVLADTRSPVLL
+ FETGIPTRYYIDPADIAFEHLEPTSTQTLCPYKGTTSGYWSVRVGDAVHRDLAWTYHY
+ PLPAVAPIAGLVAFYNEKVDLTVDGVALPRPHTQFS"
+ gene 1179872..1181053
+ /locus_tag="BQ2027_MB1086"
+ CDS 1179872..1181053
+ /locus_tag="BQ2027_MB1086"
+ /note="Mb1086, -, len: 393 aa. Equivalent to Rv1057, len:
+ 393 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 393 aa overlap). Conserved hypothetical
+ protein, some similarity to X84710|MMSAG_1 surface antigen
+ of Methanosarcina mazeii (491 aa), FASTA scores: opt: 363,
+ E():6.2e-15, (31.3% identity in 294 aa overlap). Mb1086
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99685.1"
+ /db_xref="InterPro:IPR011048"
+ /db_xref="InterPro:IPR015943"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXK8"
+ /translation="MSVMNGREVARESRDAQVFEFGTAPGSAVVKIPVQGGPIGGIAI
+ SRDGSLLVVTNNGTDTVSVVGTDTCRVTQTVTSVNEPFAIAMGNAEANRAYVSTVSSA
+ YDAIAVIDVATNTVLGTHPLALSVSDLTLSPDDKYLYVSRNGTRGADVAVLDTTTGAL
+ IDVVDVSQAPGTTTQCVRMSPDGSVLYVGANGPSGGLLVVITTRAQSDGGRIGSRSRS
+ RQKSSKPRGNQAAAGLRVVATIDIGSSVRDVALSPDGAIAYVASCGSDFGAVVDVIDT
+ RTHQITSSRAISEIGGLVTRVSVSGDADRAYLVSEDRVTVLCTRTHDVIGTIRTGQPS
+ CVVESPDGKYLYIADYSGTITRTAVASTIVSGTEQLALQRRGSMQWFSPELQQYAPAL
+ A"
+ gene 1181160..1182791
+ /gene="fadD14"
+ /locus_tag="BQ2027_MB1087"
+ CDS 1181160..1182791
+ /gene="fadD14"
+ /locus_tag="BQ2027_MB1087"
+ /note="Mb1087, fadD14, len: 543 aa. Equivalent to Rv1058,
+ len: 543 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 543 aa overlap). Probable fadD14,
+ medium-chain fatty-acid-CoA synthetase (EC 6.2.1.-),
+ highly similar to many e.g. CAC32346.1|AL583945 putative
+ fatty acid CoA ligase from Streptomyces coelicolor (558
+ aa); N-terminus of NP_419738.1|NC_002696
+ medium-chain-fatty-acid--CoA ligase from Caulobacter
+ crescentus (1006 aa); Q00594|ALKK_PSEOL
+ MEDIUM-CHAIN-FATTY-ACID--COA LIGASE (EC 6.2.1.-) from
+ Pseudomonas oleovorans (546 aa), FASTA scores: opt: 1468,
+ E(): 0, (41.1% identity in 538 aa overlap); etc. Contains
+ PS00455 Putative AMP-binding domain signature. BELONGS TO
+ THE ATP-DEPENDENT AMP-BINDING ENZYME FAMILY. Protein
+ product from Mb1087 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1087 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEDIUM CHAIN FATTY-ACID-COA LIGASE
+ FADD14 (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA
+ SYNTHASE)"
+ /protein_id="SIT99686.1"
+ /db_xref="GOA:A0A1R3XX85"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR025110"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX85"
+ /translation="MYGTMQDFPLTITAIMRHGCGVHGRRTVTTATGEGYRHSSYRDV
+ GQRAGQLANALRRLGVTGDQRVATFMWNNTEHLVTYFAVPSMGAVLHTLNIRLFPEQI
+ AYVTNEAEDRVILVDLSLARLLAPVLPKLDTVHTVIAVGEGDTTPLREAGKTVLRFAE
+ LIDAESPDFGWPQIDENSAAAMCYTSGTTGNPKGVVYSHRSSFLHTMAACTTNGIGVG
+ SSDKVLPIVPMFHANGWGLPYAALMAGADLVLPDRHLDARSLIHMVETLKPTLAGAVP
+ TIWNDVMHYLEKDPDHDMSSLRLVACGGSAVPESLMRTFEDKHDVQIRQLWGMTETSP
+ LATMAWPPPGTPDDQHWAFRITQGQPVCGVETRIVDDDGQVLPNDGNAVGEVEVRGPW
+ IAGSYYGGRDESKFDSGWLRTGDVGRIDEQGFITLTDRAKDVIKSGGEWISSVELENC
+ LIAHPDVLEAAVVGVPDERWQERPLAVVVVREGATVSAGDLRAFLADKVVRWWLPERW
+ AFVDEIPRTSVGKYDKKAIRSRYAEGAYQITEVHT"
+ gene 1182867..1183931
+ /locus_tag="BQ2027_MB1088"
+ CDS 1182867..1183931
+ /locus_tag="BQ2027_MB1088"
+ /note="Mb1088, -, len: 354 aa. Equivalent to Rv1059, len:
+ 354 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 354 aa overlap). Conserved hypothetical
+ protein, similar to Rv0926c|MTCY21C12.20c hypothetical
+ protein from Mycobacterium tuberculosis (358 aa), FASTA
+ scores: opt: 338, E(): 1.4e-14, (33.1% identity in 363 aa
+ overlap). Protein product from Mb1088 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1088 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Oxidoreductase"
+ /protein_id="SIT99687.1"
+ /db_xref="GOA:A0A1R3XX84"
+ /db_xref="InterPro:IPR000846"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX84"
+ /translation="MTMSLRVIQWATGSVGVAAIKGVLQHPELELVGCWVHSAAKSGK
+ DVGEIIGSPPLGVIATNSIDDVLALDADAVIYAPLLPSVDEVAALLRSGKNVVTPLGW
+ FYPSEKEAAPLEVAAQAGNATLHGAGIGPGAVTELFPLLLSVMSTGVTFVRSEEFSDL
+ RSYGAPDVLRYVMGFGGTPDSALTGPMQKILDGGFLQSVRLCVDRLGFAADPQIRTSQ
+ EVAVATAPIDSPIGVIEPGQVAGRRFHWEALVEDTVVVQIAVNWLMGSENLDPPWSFG
+ PAGERYEIEVRGSPDTCVTIKGWQPQTVAAGLKSNPGIVATAAHCVNAIPATCAAPAG
+ IQSFFDLPLITGRAAPGLAR"
+ gene 1183984..1184457
+ /locus_tag="BQ2027_MB1089"
+ CDS 1183984..1184457
+ /locus_tag="BQ2027_MB1089"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1089, -, len: 157 aa. Equivalent to Rv1060, len:
+ 157 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 157 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1089 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1089 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIT99688.1"
+ /db_xref="InterPro:IPR019587"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX78"
+ /translation="MAKSVVVEQSRAIPVQSEDAFGGTLAAALPVICSHWYGLIPPIK
+ EVRDQTGAWDSVGQARVITMVGGGRVREELTSVDPPRSFGYTLTDIKGPLAPLVALVE
+ GKWSFAPADTGTTVTWQWTIHPRSALAAPVLPVFARMWRGYARGVLEKLSALLVG"
+ gene 1184491..1185354
+ /locus_tag="BQ2027_MB1090"
+ CDS 1184491..1185354
+ /locus_tag="BQ2027_MB1090"
+ /note="Mb1090, -, len: 287 aa. Equivalent to Rv1061, len:
+ 287 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 287 aa overlap). Conserved hypothetical
+ protein, similar to hypothetical proteins from various
+ bacteria e.g. D64002|SYCSLRD_75 Synechocystis sp. PCC6803
+ (304 aa), FASTA scores: opt: 245, E(): 1.2e-09, (27.1%
+ identity in 258 aa overlap). Protein product from Mb1090
+ detected using SWATH mass spectrometry. Mb1090 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Glutamine amidotransferases class-II"
+ /protein_id="SIT99689.1"
+ /db_xref="InterPro:IPR017932"
+ /db_xref="InterPro:IPR026869"
+ /db_xref="InterPro:IPR029055"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXA0"
+ /translation="MCRLFGLHSGTDAVTATFWLLNASDSLAEQSRRNPDGTGLGVFD
+ EHHQPRLHKQPIAAWQDADFATEAHELTGTTFVAHVRYATTGSLDIRNTHPFLQDGRI
+ FAHNGVVEGLDVLDERLREVGADDLVLGQTDSERVFALITASIRARDGNESAGLIDAL
+ RWLAANVPIYAVNVLLSTATDVWALRYPESHELYILDRRGDGAPEFHLRSKRIRAHST
+ HLRERSSVVFATEPMDDNPRWRLLDAGELVHVDAALRVNRSLVLPDPPRHPIRREDLS
+ EPVLHAQHTSA"
+ gene 1185359..1186216
+ /locus_tag="BQ2027_MB1091"
+ CDS 1185359..1186216
+ /locus_tag="BQ2027_MB1091"
+ /note="Mb1091, -, len: 285 aa. Equivalent to Rv1062, len:
+ 285 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 285 aa overlap). Conserved hypothetical
+ protein, some similarity to AL079356|SC6G9_10 hypothetical
+ protein in Streptomyces coelicolor (289 aa), FASTA scores:
+ opt: 556, E(): 1.2e-27, (39.0% identity in 287 aa
+ overlap), and Z99111|BSUB0008_176 Bacillus subtilis (260
+ aa), FASTA scores: opt: 163, E(): 0.0013, (27.4% identity
+ in 179aa overlap) Protein product from Mb1091 detected
+ using SWATH mass spectrometry. Mb1091 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Phospholipase, patatin family protein"
+ /protein_id="SIT99690.1"
+ /db_xref="GOA:A0A1R3XX86"
+ /db_xref="InterPro:IPR002641"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX86"
+ /translation="MTTRRALVLAGGGLAGIAWETGVLRGIADESPAAARLLLDSDVL
+ VGTSAGATVAAQISSGCPLDTLYERQLAETSAEIDPGVDIDAITDLFLTAVTEPHIST
+ RRRLQRIGAVALAVDTVPESVRRQVIAQRLPSHDWPDRVLRVTAIDIATGELVVFHRE
+ SNVALVDAVAASCSVPGAWPPVTIAGRRYMDGGVASSVNLGVADDCDAAVVLVPAGAD
+ APSPFGGGAAAEIAAATGMVFAVFADDDSLAAFGPNPLDPLCRVNSAMAGRQQGRREA
+ QAVARLLGV"
+ gene complement(1186217..1187299)
+ /locus_tag="BQ2027_MB1092C"
+ CDS complement(1186217..1187299)
+ /locus_tag="BQ2027_MB1092C"
+ /note="Mb1092c, -, len: 360 aa. Equivalent to Rv1063c,
+ len: 360 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 360 aa overlap). Conserved hypothetical
+ protein, similar to P37053|YCHK_ECOLI hypothetical protein
+ from Escherichia coli (314 aa), FASTA scores: opt: 487,
+ E(): 7.2e-23, (32.7% identity in 321 aa overlap). Also
+ partially similar to Rv3239c|MTCY20B11.14c. BELONGS TO THE
+ UPF0028 (SWS) FAMILY. Protein product from Mb1092c
+ detected using SWATH mass spectrometry. Mb1092c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG00613342: Bacterial patatin-like
+ phospholipase domain containing protein"
+ /protein_id="SIT99691.1"
+ /db_xref="GOA:P67099"
+ /db_xref="InterPro:IPR001423"
+ /db_xref="InterPro:IPR002641"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="UniProtKB/Swiss-Prot:P67099"
+ /translation="MPAPAALRVRGSSSPRVALALGSGGARGYAHIGVIQALRERGYD
+ IVGIAGSSMGAVVGGVHAAGRLDEFAHWAKSLTQRTILRLLDPSISAAGILRAEKILD
+ AVRDIVGPVAIEQLPIPYTAVATDLLAGKSVWFQRGPLDAAIRASIAIPGVIAPHEVD
+ GRLLADGGILDPLPMAPIAGVNADLTIAVSLNGSEAGPARDAEPNVTAEWLNRMVRST
+ SALFDVSAARSLLDRPTARAVLSRFGAAAAESDSWSQAPEIEQRPAGPPADREEAADT
+ PGLPKMGSFEVMNRTIDIAQSALARHTLAGYPADLLIEVPRSTCRSLEFHRAVEVIAV
+ GRALATQALEAFEIDDDESAAATIEG"
+ gene complement(1187380..1187799)
+ /gene="lpqV"
+ /locus_tag="BQ2027_MB1093C"
+ CDS complement(1187380..1187799)
+ /gene="lpqV"
+ /locus_tag="BQ2027_MB1093C"
+ /note="Mb1093c, lpqV, len: 139 aa. Equivalent to Rv1064c,
+ len: 139 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 139 aa overlap). Putative lipoprotein
+ LpqV. Has N-terminal signal sequence and appropriately
+ positioned PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Mb1093c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible lipoprotein lpqv"
+ /protein_id="SIT99692.1"
+ /db_xref="GOA:P65311"
+ /db_xref="InterPro:IPR020377"
+ /db_xref="UniProtKB/Swiss-Prot:P65311"
+ /translation="MRPSRYAPLLCAMVLALAWLSAVAGCSRGGSSKAGRSSSVAGTL
+ PAGVVGVSPAGVTTRVDAPAESTEEEYYQACHAARLWMDAQPGSGESLIEPYLAVVQA
+ SPSGVAGSWHIRWAALTPARQAAVIVAARAAANAECG"
+ gene 1187911..1188477
+ /locus_tag="BQ2027_MB1094"
+ CDS 1187911..1188477
+ /locus_tag="BQ2027_MB1094"
+ /EC_number="1.13.11.20"
+ /note="Mb1094, -, len: 188 aa. Equivalent to Rv1065, len:
+ 188 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 188 aa overlap). Conserved hypothetical
+ protein, some similarity to AL0209|SC4H8_11 hypothetical
+ protein from Streptomyces coelicolor (182 aa), FASTA
+ scores: opt: 156, E(): 0.0011, (31.3% identity in 195 aa
+ overlap). Mb1094 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Cysteine dioxygenase (EC"
+ /protein_id="SIT99693.1"
+ /db_xref="GOA:A0A1R3XY76"
+ /db_xref="InterPro:IPR010300"
+ /db_xref="InterPro:IPR011051"
+ /db_xref="InterPro:IPR014710"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY76"
+ /translation="MVMPLVTPTTAVPSPGPTRLRVADLLRATDQAADDVLGGRCDHL
+ LPDGGVPQTQRWYTRIHGDEELDIWLISWVPGQPTELHDHGGSLGALTVLSGSLNEYR
+ WDGRRLRRRRLDAGDQAGFPLGWVHDVVWAPRPIGGPDAAGMAVAPTLSVHAYSPPLT
+ AMSYYEITERNTLRRQRTELTDQPEGSG"
+ gene 1188474..1188869
+ /locus_tag="BQ2027_MB1095"
+ CDS 1188474..1188869
+ /locus_tag="BQ2027_MB1095"
+ /note="Mb1095, -, len: 131 aa. Equivalent to Rv1066, len:
+ 131 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 131 aa overlap). Conserved hypothetical
+ protein, strong similarity to AL0209|SC4H8.10 hypothetical
+ protein from Streptomyces coelicolor (132 aa), FASTA
+ scores: opt: 429, E(): 5.2e-23, (57.1% identity in 119 aa
+ overlap). Protein product from Mb1095 detected using SWATH
+ mass spectrometry. Mb1095 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Rhodanese-related sulfurtransferase, 1 domain"
+ /protein_id="SIT99694.1"
+ /db_xref="InterPro:IPR001763"
+ /db_xref="InterPro:IPR036873"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXA5"
+ /translation="MSRIDRVLEAARRRYRRLAADQVPEAARRGAVLVDIRPQAQRAR
+ EGEVPGALVIERNVLEWRCDPTSDARLPQAVDDDVEWVILCSEGYTSSLAAASLLDLG
+ LHRATDVVGGYRALAAGGVLAELGGAVGG"
+ gene complement(1188897..1190912)
+ /gene="PE_PGRS19"
+ /locus_tag="BQ2027_MB1096C"
+ CDS complement(1188897..1190912)
+ /gene="PE_PGRS19"
+ /locus_tag="BQ2027_MB1096C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1096c, PE_PGRS19, len: 671 aa. Equivalent to
+ Rv1067c, len: 667 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (98.5% identity in 673 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins. Similar to
+ Rv3388|MTV004.46 from Mycobacterium tuberculosis (731 aa),
+ FASTA scores: opt: 2227, E(): 0, (55.6% identity in 710 aa
+ overlap). Contains PS00583 pfkB family of carbohydrate
+ kinases signature 1, probably fortuitous.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, 2
+ deletions each of 3 bp (ccg-* and cgc-*) and a 18 bp
+ insertion leads to a longer product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (671 aa
+ versus 667 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs19"
+ /protein_id="SIT99695.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXL9"
+ /translation="MSFVLVSPSQLMAAAADVAGIGSAISAANAAALAPTSVLAAAGA
+ DEVSAAVAALFSAHAGQYQQLGARAALFHEQFVQALTGAASAYASAEATNVEQQVLGL
+ INAPTQALWGRPLIGNGADGTAANPNGGAGGLLYGNGGNGFSQTTAGLTGGTGGSAGL
+ IGNGGNGGAGGAGANGGAGGNGGWLYGSGGNGGAGGAGPAGAIGAPGVAGGAGGAGGT
+ AGLFGNGGVGGVGGDGGQGGNGAGAGASGTKGGDAGAGGAGGAGGWIHGHGGAGGDGG
+ AGGAGGQASPGAPGPPSQPGGAGGAGGAGGRGGDGGSAGWLSGNGGDAGNGGGGGTAG
+ GAGNGGQFGGDGGTGGTGGTAGAGGNGGRGAVLFGHGGNAGHGGAGGNGAAAGAGGEH
+ VMATAGKGGTGGVGGDGGGGAGGGGGLLYGNGGAGGNGGAGGAGNSGGDGGTGLNAAL
+ GGNGGGGGVGGNAGAGGTGGSAGWLSGNGGAGGSGGSAGAGGAGGKGGDTPNGLAINP
+ GIGGNGGDTGNAGNGGNGGSAARLFGGGGAGGAGGTGSTAGSGGSGGTNPPTGLQAAG
+ GNGGSGHAGGHGGNGGGAGLLGGGTGGNGGGGGQGGLGAAAGGVDGNGGNGGNGGKGG
+ DAQLVGDGGNGGNGGKGGAGLIAGLDGAGGAGGTRGLIFGNAGTPGQ"
+ gene complement(1191245..1193536)
+ /gene="PE_PGRS20"
+ /locus_tag="BQ2027_MB1097C"
+ CDS complement(1191245..1193536)
+ /gene="PE_PGRS20"
+ /locus_tag="BQ2027_MB1097C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1097c, PE_PGRS20, len: 763 aa. Similar to
+ Rv1068c, len: 463 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (59.8% identity in 766 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins. Similar to
+ AL021897|MTV017_19 M. tuberculosis H37Rv (667 aa), FASTA
+ scores: opt: 1875, E(): 0, (55.0% identity in 667 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, insertions of 717 bp and 192 bp, and a 9 bp
+ (tccgctgcc-*) deletion, leads to a longer product compared
+ to the homolog in Mycobacterium tuberculosis strain H37Rv
+ (763 aa versus 463 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs20"
+ /protein_id="SIT99696.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX95"
+ /translation="MSYMIAVPDMLSSAAGDLASIGSSINASTRAAAAATTRLLPAAA
+ DEVSAHIAALFSGHGEGYQAIARQMAAFHDQFTLALTSSAGAYASAEATNVEQQVLGL
+ INAPTQALWGRPLIGNGADGTAANPNGGAGGLLYGNGGNGFSQTTAGLTGGTGGSAGL
+ IGNGGNGGAGGAGANGGAGGNGGWLYGSGGNGGAGGAGPAGAIGAPGVAGGAGGAGGS
+ AGLFGNGGAGGAGGAGGQGGAGIGGADGTKGGDAGAGGAGGAGGWIHGHGGVGGDGGT
+ GGQGGDGVQGEPGDTGAAGGAGGAGGRGGDGGSAGWLSGNGGDAGTGGGGGNAGAGGE
+ GGIFGGNGGNGGTGGTAGGGGNGGRGAALFGHGGNAGHGGAGGNGAAGGNGADTQLGI
+ SGKGGTGGGGGGAGAGGTGGDGGLLYGNGGAGGNGGNGGAAGKGGIGAPGLSTAQGGD
+ GGNGGSGGNAGNGGNGGRGSVLFGHGGNAGHGGAGGNGAVSGNGGSSITAVGGKGGTG
+ GGGGGGAGGTGGDAGLLYGNGGAGGTGGSGGAGARGGDGGAGSGTAQGGDGGAGGVGG
+ NAGNGGNGGSAGWLSGNGGTGGGGGTAGAGGQGGNGNSGIDPGNGGQGADTGNAGNGG
+ HGGSAAKLFGDGGAGGAGGMGSTGGTGGGGGFGGGTGGNGGNGHAGGAGGSGGTAGLL
+ GSGGTGGDGGNGGLGAGSGAKGNGGNGGDGGKGGDAQLIGNGGNGGNGGKGGTGLMPG
+ INGTGGAGGSRGQISGNPGTPGQ"
+ gene complement(1193898..1195661)
+ /locus_tag="BQ2027_MB1098C"
+ CDS complement(1193898..1195661)
+ /locus_tag="BQ2027_MB1098C"
+ /note="Mb1098c, -, len: 587 aa. Equivalent to Rv1069c,
+ len: 587 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 587 aa overlap). Conserved hypothetical
+ protein, hydrophobic regions in N-terminal domain. Similar
+ in part to O07136|B1306.04C B1306.04c protein from
+ Mycobacterium leprae (89 aa), FASTA scores: opt: 229, E():
+ 1.3e-07, (54.2% identity in 72 aa overlap). Protein
+ product from Mb1098c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1098c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted membrane protein (DUF2319)"
+ /protein_id="SIT99697.1"
+ /db_xref="GOA:A0A1R3XX94"
+ /db_xref="InterPro:IPR012037"
+ /db_xref="InterPro:IPR027787"
+ /db_xref="InterPro:IPR027788"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX94"
+ /translation="MTEPAAATTTNASDEPATGAEQAVDTAATPQTPEPQPIRSTWWI
+ RHYTFTGTAMGLVFVWFSMTPSLLPRGPLFQGLVSGICGAFGYGLGVFAVWLVRYMRS
+ HNSSPPPPRWAWPPLIAVGAVGMVGMAVQFHVWQDDVRDLMGVEHLRWYDYPLAAALS
+ LVVLFTLVEIGQFIRWLFRFLVGQVDRIAPFRVSAAIVVVLLVVLTITLLNGVVLKFA
+ MNSMNSTFAAVNNEMNPDSAPPKTPLRSGGPGSLVSWESLGHQGRIFVHSGPTIADLT
+ AFNGTPAVEPIRTYAGLNSADGIMATAELAARELARTGGLRRAVVAVATSTGTGWINE
+ AEASALEYMYNGDTAIVSMQYSFLPSWLSFLVDKENARHAGEALFEAVDKLIRQLPES
+ QRPKLVVFGESLGSFGGEAPFMNLNNILARTDGALFSGPTFNNTVWNSLTANRDAGSP
+ QWLPIYDDGRNVRFVARARDLQRPDAPWGRPRVVYLQHASDPIAWWTPRLLFREPDWL
+ REQRGYDVLPQTRWIPVVTFVQVSADMAVATHVPDGHGHRYVATVADGWAAVLSPPGW
+ TQQKTERLQPLLHANAKPFGS"
+ gene complement(1195658..1196431)
+ /gene="echA8"
+ /locus_tag="BQ2027_MB1099C"
+ CDS complement(1195658..1196431)
+ /gene="echA8"
+ /locus_tag="BQ2027_MB1099C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1099c, echA8, len: 257 aa. Equivalent to Rv1070c,
+ len: 257 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 257 aa overlap). Probable echA8,
+ enoyl-CoA hydratase (EC 4.2.1.17), equivalent to
+ O07137|B1306.05c putative enoyl-CoA hydratase/isomerase
+ from Mycobacterium leprae (257 aa), FASTA scores: opt:
+ 1417, E(): 0, (86.4% identity in 257 aa overlap). Also
+ highly similar to others e.g. NP_106219.1|NC_002678 enoyl
+ CoA hydratase from Mesorhizobium loti (257 aa);
+ L39265|RHMRPST_2 enoyl-CoA hydratase from Rhizobium
+ melilotii (257 aa), FASTA scores: opt: 1100, E(): 0,
+ (66.9% identity in 257 aa overlap);
+ AAK18173.1|AF290950_5|AF290950|FadB1x enoyl-CoA hydratase
+ from Pseudomonas putida (257 aa); etc. Contains PS00166
+ Enoyl-CoA hydratase/isomerase signature. BELONGS TO THE
+ ENOYL-CoA HYDRATASE/ISOMERASE FAMILY. TBparse score is
+ 0.881. Protein product from Mb1099c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1099c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ENOYL-CoA HYDRATASE ECHA8 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-CoA HYDRATASE) (CROTONASE)"
+ /protein_id="SIT99698.1"
+ /db_xref="GOA:P64017"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR014748"
+ /db_xref="InterPro:IPR018376"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/Swiss-Prot:P64017"
+ /translation="MTYETILVERDQRVGIITLNRPQALNALNSQVMNEVTSAATELD
+ DDPDIGAIIITGSAKAFAAGADIKEMADLTFADAFTADFFATWGKLAAVRTPTIAAVA
+ GYALGGGCELAMMCDVLIAADTAKFGQPEIKLGVLPGMGGSQRLTRAIGKAKAMDLIL
+ TGRTMDAAEAERSGLVSRVVPADDLLTEARATATTISQMSASAARMAKEAVNRAFESS
+ LSEGLLYERRLFHSAFATEDQSEGMAAFIEKRAPQFTHR"
+ gene complement(1196443..1197480)
+ /gene="echA9"
+ /locus_tag="BQ2027_MB1100C"
+ CDS complement(1196443..1197480)
+ /gene="echA9"
+ /locus_tag="BQ2027_MB1100C"
+ /note="Mb1100c, echA9, len: 345 aa. Equivalent to Rv1071c,
+ len: 345 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 345 aa overlap). Possible echA9,
+ enoyl-CoA hydratase (EC 4.2.1.17), equivalent to
+ Y13803|B1306.06c putative enoyl-CoA hydratase/isomerase
+ from Mycobacterium leprae (345 aa), FASTA scores: opt:
+ 1799, E(): 0, (77.7% identity in 345 aa overlap). Also
+ similar to many eukaryotic and prokaryotic enoyl-CoA
+ hydratases e.g. NP_437984.1|NC_003078 putative enoyl-CoA
+ hydratase protein from Sinorhizobium meliloti (356 aa);
+ NP_420165.1|NC_002696 enoyl-CoA hydratase/isomerase family
+ protein from Caulobacter crescentus (350 aa); Q19278
+ PROTEIN SIMILAR TO ENOYL-COA HYDRATASES from
+ Caenorhabditis elegans (386), FASTA scores: opt: 787, E():
+ 0, (38.5% identity in 348 aa overlap); etc. Protein
+ product from Mb1100c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1100c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ENOYL-COA HYDRATASE ECHA9 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-COA HYDRATASE) (CROTONASE)"
+ /protein_id="SIT99699.1"
+ /db_xref="GOA:A0A1R3XXA9"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="InterPro:IPR032259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXA9"
+ /translation="MTGESHEVLTNVEGGVGFVTLNRPKAINSLNQTMVDLLATVLMS
+ WEHEDAVHAVVLSGAGERGLCAGGDVVAVYHSARKDGVEARRFWRHEYLLNALIGRFA
+ KPYVALMDGIVMGGGVGVSAHANTRVVTDTSKVAMPEVGIGFIPDVGGVYLLSRAPGA
+ LGLHAALTGAPFSGADAIALGFADHFVPHGDLDAFTQKIVTGGVESALAAHAVEPPPS
+ TLAAQRDWIDECYAGDSVADIVAALRKQGGEPAVNASDLIASRSPIALSVTLQAVRRA
+ AKLDTLEDVLIQDYRVSSASLRSHDLVEGIRAQLIDKDRNPNWSPATLDAITAADIEA
+ YFEPVDDDLSF"
+ gene 1197667..1198503
+ /locus_tag="BQ2027_MB1101"
+ CDS 1197667..1198503
+ /locus_tag="BQ2027_MB1101"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1101, -, len: 278 aa. Equivalent to Rv1072, len:
+ 278 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 278 aa overlap). Probable conserved
+ transmembrane protein, equivalent to
+ O07139|B1306.07|Y13803 Protein B1306.07 from Mycobacterium
+ leprae (220 aa), FASTA scores: opt:1032, E(): 0, (75.0%
+ identity in 220 aa overlap); and at the C-terminal end to
+ Q50056|U1740D Mycobacterium leprae (96 aa), FASTA scores:
+ opt: 381, E(): 1.2e-18, (71.6% identity in 81 aa overlap).
+ Similar to Q54192|M80628|STMBLDA_1 TRANSFER RNA-LEU (BLDA)
+ GENE AND ORF from Streptomyces griseus (293 aa), FASTA
+ scores: opt:558, E(): 4.7e-30, (41.5% identity in 299 aa
+ overlap). TBparse score is 0.896. Protein product from
+ Mb1101 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1101 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99700.1"
+ /db_xref="GOA:A0A1R3XX96"
+ /db_xref="InterPro:IPR010539"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX96"
+ /translation="MRETSNPVFRSLPKQRGGYAQFGTGTAQQGFPADPYLAPYREAK
+ ATRPLTIDDVVTKTGLTLAMLAGTAVVSYFLVASNVALAMPLTLVGALGGLALVLVAT
+ FGRKQDNPAIVLSYAALEGLFLGAISFVLANFTVASANAGVLIGEAILGTMGVFFGML
+ VVYKTGAIRVTPKFTRMVVAALFGVLVLMLGNLVLAMFNVGGGEGLGLRSPGPLGIIF
+ SLVCIGIAAFSFLIDFDAADQMIRAGAPEKAAWGVALGLTVTLVWLYIEILRLLSYLQ
+ NE"
+ gene 1198619..1199470
+ /locus_tag="BQ2027_MB1102"
+ CDS 1198619..1199470
+ /locus_tag="BQ2027_MB1102"
+ /note="Mb1102, -, len: 283 aa. Equivalent to Rv1073, len:
+ 283 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 283 aa overlap). Conserved hypothetical
+ protein, similar to several hypothetical mycobacterial
+ proteins e.g. Rv1482c|Z79701|MTCY277.03 Mycobacterium
+ tuberculosis (339 aa), FASTA scores: opt: 810, E(): 0,
+ (47.4% identity in 272 aa overlap);
+ Rv3555c|Z92774|MTCY6G11_2 Mycobacterium tuberculosis (289
+ aa), FASTA scores: opt: 704, E(): 0, (44.4% identity in
+ 259 aa overlap); and Rv3517, etc., and GIR10|AF002133_10
+ M. avium strain GIR10 (346 aa), FASTA scores: opt: 802,
+ E(): 0, (48.1% identity in 270 aa overlap). Mb1102 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99701.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX98"
+ /translation="MGAQPFIGSEALAAGLISWHELGKYYTAIMPNVYLDKRLKPSLR
+ QRVIAAWLWSGRKGVIAGASASALHGAKWVDDHALVELIWRNARAPNGVRTKDELLLD
+ GEVQRLCGLTVTTVERTAFDLGRRPPLGQAITRLDALANATDFKINDVRELARKHPHT
+ RGLRQLDKALDLVDPGAQSPKETWLRLLLINAGFPRPSTQIPLLGVYGHPKYFLDMGW
+ EDIMLAVEYDGEQHRLSRDQFVKDVERLEYIRRAGWTHIRVLADHKGPDVVRRVRQAW
+ DTLTSRR"
+ gene complement(1199544..1200761)
+ /gene="fadA3"
+ /locus_tag="BQ2027_MB1103C"
+ CDS complement(1199544..1200761)
+ /gene="fadA3"
+ /locus_tag="BQ2027_MB1103C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1103c, fadA3, len: 405 aa. Equivalent to Rv1074c,
+ len: 405 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 405 aa overlap). Probable fadA3,
+ beta-ketoacyl CoA thiolase (EC 2.3.1.-), highly similar to
+ many involved in beta-oxidation e.g. CAB89028.1|AL353870
+ beta-ketoadipyl-CoA thiolase from Streptomyces coelicolor
+ (395 aa); P77525|PAAJ_ECOLI probable beta-ketoadipyl CoA
+ thiolase from Escherichia coli (401 aa), FASTA scores:
+ opt: 1034, E(): 5.4e-56, (43.5% identity in 416 aa
+ overlap) and X97452 acetyl-CoA acetyltransferase
+ (thiolase) from Escherichia coli (401 aa), FASTA scores:
+ opt: 1043, E(): 0, (43.4% identity in 415 aa overlap);
+ Q43935|CATF_ACICA beta-ketoadipyl CoA thiolase from
+ Acinetobacter calcoaceticus (401 aa), FASTA scores: opt:
+ 992, E(): 0, (41.5% identity in 415 aa overlap); etc.
+ Contains PS00737 Thiolases signature 2, and PS00445 FGGY
+ family of carbohydrate kinases signature 2, although this
+ is probably fortuitous. BELONGS TO THE THIOLASE FAMILY.
+ Protein product from Mb1103c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1103c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BETA-KETOACYL CoA THIOLASE FADA3"
+ /protein_id="SIT99702.1"
+ /db_xref="GOA:A0A1R3XZD9"
+ /db_xref="InterPro:IPR002155"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020613"
+ /db_xref="InterPro:IPR020616"
+ /db_xref="InterPro:IPR020617"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZD9"
+ /translation="MPEAVIVSTARSPIGRAMKGSLVGMRPDDLAVQMVRAALDKVPA
+ LNPHQIDDLMMGCGLPGGESGFNIARVVAVALGYDFLPGTTVNRYCSSSLQTTRMAFH
+ AIKAGEGDAFISAGVETVSRFAKGNSDSWPDTKNPLFDGAQERSAAAAAGADEWHDPR
+ TDQKLPDIYIAMGQTAENVAIMTGISREEQDRWGVRSQNRAEEAIKNGFFEREITPVT
+ LPDGTTVSTDDGPRPGTTYEKVSELKPAFRPNGTVTAGNACPLNDGAAAVVITSDTKA
+ KELGLTPLARIVSTGVSGLSPEIMGLGPIEASKKALERAGMAITDIDLVEINEAFAVQ
+ VLGSARELGIDEDKLNISGGAIALGHPFGMTGARITTTLLNNLQTYDKTFGLETMCVG
+ GGQGMAMVIERLA"
+ gene complement(1200814..1201758)
+ /locus_tag="BQ2027_MB1104C"
+ CDS complement(1200814..1201758)
+ /locus_tag="BQ2027_MB1104C"
+ /note="Mb1104c, -, len: 314 aa. Equivalent to Rv1075c,
+ len: 314 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 314 aa overlap). Possibly exported
+ protein, as it contains a N-terminal signal sequence,
+ hydrophobic domain from aa 7-25. Similar to
+ U15183|MLU15183_2 Mycobacterium leprae cosmid B1740 (106
+ aa), FASTA scores: opt: 207, E(): 1.6e-06, (42.6% identity
+ in 101 aa overlap). Also weak similarity to many
+ glyceraldehyde-3-phosphate dehydrogenases e.g.
+ Q41595|G3PC_TAXBA Taxus baccata (340 aa), FASTA scores:
+ opt: 147, E(): 0.027, (27.5% identity in 189 aa overlap).
+ Mb1104c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED EXPORTED PROTEIN"
+ /protein_id="SIT99703.1"
+ /db_xref="InterPro:IPR013830"
+ /db_xref="InterPro:IPR036514"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY90"
+ /translation="MPRRSTIALATAGALASTGTAYLGARNLLVGQATHARTVIPKSF
+ DAPPRADGVYTRGGGPVQRWRREVPFDVHLMIFGDSTATGYGCASAEEVPGVLIARGL
+ AEQTGKRIRLSTKAIVGATSKGVCGQVDAMFVVGPPPDAAVIMIGANDITALNGIGPS
+ AQRLADCVRRLRTRGAVVVVGTCPDLGVITAIPQPLRALAHTRGVRLARAQTAAVKAA
+ GGVPVPLGHLLAPKFRAMPELMFSADRYHPSAPAYALAADLLFLALRDALTEKLDIPI
+ HETPSRPGTATLEPGHTRHSMMSRLRRPRPARAVPTGG"
+ gene 1202155..1203048
+ /gene="lipU"
+ /locus_tag="BQ2027_MB1105"
+ CDS 1202155..1203048
+ /gene="lipU"
+ /locus_tag="BQ2027_MB1105"
+ /note="Mb1105, lipU, len: 297 aa. Equivalent to Rv1076,
+ len: 297 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 297 aa overlap). Putative lipU, lipase
+ (EC 3.1.-.-), very similar to several Mycobacterium
+ tuberculosis proteins e.g. Z95390|Rv3487c|MTCY13E12.41c
+ (277 aa), FASTA scores: opt: 1225, E(): 0, (76.0% identity
+ in 246 aa overlap); Rv1426c, etc. Also similar to
+ esterases and lipases of around 300 aa e.g. Q44087
+ ESTERASE PRECURSOR from Acinetobacter lwoffii esterase
+ (303), FASTA scores: opt: 427, E(): 1.9e-21, (32.5%
+ identity in 280 aa overlap). Equivalent to
+ AL035159|MLCB1450 _7 Mycobacterium leprae (335 aa), FASTA
+ scores: opt: 1588, E(): 0, (79.7% identity in 296 aa
+ overlap). Protein product from Mb1105 detected using SWATH
+ mass spectrometry. Mb1105 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible lipase lipu"
+ /protein_id="SIT99704.1"
+ /db_xref="GOA:A0A1R3XXB5"
+ /db_xref="InterPro:IPR013094"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="InterPro:IPR033140"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXB5"
+ /translation="MAVRPVLAVGSYLPHAPWPWGVIDQAARVLLPASTTVRAAVSLP
+ NASAQLVRASGVLPADGTRRAVLYLHGGAFLTCGANSHGRLVELLSKFADSPVLVVDY
+ RLIPKHSIGMALDDCHDGYRWLRLLGYEPEQIVLAGDSAGGYLALALAQRLQEVGEEP
+ AALVAISPLLQLAKEHKQAHPNIKTDAMFPARAFDALDALVASAAARNQVDGEPEELY
+ EPLEHITPGLPRTLIHVSGSEVLLHDAQLAAAKLAAAGVPAEVRVWPGQVHDFQVAAS
+ MLPEAIRSLRQIGEYIREATG"
+ gene 1203105..1204499
+ /gene="cbs"
+ /locus_tag="BQ2027_MB1106"
+ CDS 1203105..1204499
+ /gene="cbs"
+ /locus_tag="BQ2027_MB1106"
+ /standard_name="cysM2"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1106, cbs, len: 464 aa. Equivalent to Rv1077,
+ len: 464 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 464 aa overlap). Probable cbs
+ (previously cysM2), cystathionine beta-synthase (EC
+ 4.2.1.22), similar throughout its length to many
+ eukaryotic cystathionine beta-synthases e.g.
+ P32232|CBS_RAT CYSTATHIONINE BETA-SYNTHASE (560 aa), FASTA
+ scores: opt: 951, E(): 0, (40.2% identity in 450 aa
+ overlap); also similar in N-terminal domain (aa 1 - 330)
+ to Rv2334|MTCY98.03 CysK Mycobacterium tuberculosis (310
+ aa), FASTA scores: opt: 855, E(): 0, (46.8% identity in
+ 314 overlap); and other cysteine synthase proteins e.g.
+ Rv1336, Rv0848, etc. Contains PS00217 Sugar transport
+ proteins signature 2 probably spurious. BELONGS TO THE
+ CYSTEINE SYNTHASE/CYSTATHIONINE BETA-SYNTHASE FAMILY.
+ Protein product from Mb1106 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1106 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable cystathionine beta-synthase CBS (Serine
+ sulfhydrase) (Beta-thionase) (Hemoprotein H-450)"
+ /protein_id="SIT99705.1"
+ /db_xref="GOA:A0A1R3XXM8"
+ /db_xref="InterPro:IPR000644"
+ /db_xref="InterPro:IPR001926"
+ /db_xref="InterPro:IPR005857"
+ /db_xref="InterPro:IPR036052"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXM8"
+ /translation="MRIAQHISELIGGTPLVRLNSVVPDGAGTVAAKVEYLNPGGSSK
+ DRIAVKMIEAAEASGQLKPGGTIVEPTSGNTGVGLALVAQRRGYKCVFVCPDKVSEDK
+ RNVLIAYGAEVVVCPTAVPPHDPASYYSVSDRLVRDIDGAWKPDQYANPEGPASHYVT
+ TGPEIWADTEGKVTHFVAGIGTGGTITGAGRYLKEVSGGRVRIVGADPEGSVYSGGAG
+ RPYLVEGVGEDFWPAAYDPSVPDEIIAVSDSDSFDMTRRLAREEAMLVGGSCGMAVVA
+ ALKVAEEAGPDALIVVLLPDGGRGYMSKIFNDAWMSSYGFLRSRLDGSTEQSTVGDVL
+ RRKSGALPALVHTHPSETVRDAIGILREYGVSQMPVVGAEPPVMAGEVAGSVSERELL
+ SAVFEGRAKLADAVSAHMSPPLRMIGAGELVSAAGKALRDWDALMVVEEGKPVGVITR
+ YDLLGFLSEGAGRR"
+ gene 1204701..1205423
+ /gene="pra"
+ /locus_tag="BQ2027_MB1107"
+ CDS 1204701..1205423
+ /gene="pra"
+ /locus_tag="BQ2027_MB1107"
+ /note="Mb1107, pra, len: 240 aa. Equivalent to Rv1078,
+ len: 240 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 240 aa overlap). Probable pra,
+ Proline-rich antigen homolog, equivalent to
+ X65546|MLPRAG_1 proline rich antigen from Mycobacterium
+ leprae (249 aa), FASTA scores: opt: 1162, E(): 3.3e-30,
+ (64.8% identity in 253 aa overlap). Has potential
+ hydrophobic domains. Protein product from Mb1107 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1107 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Proline-rich antigen homolog pra"
+ /protein_id="SIT99706.1"
+ /db_xref="GOA:A0A1R3XXA6"
+ /db_xref="InterPro:IPR010432"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXA6"
+ /translation="MTEQPPPGGSYPPPPPPPGPSGGHEPPPAAPPGGSGYAPPPPPS
+ SGSGYPPPPPPPGGGAYPPPPPSAGGYAPPPPGPAIRTMPTESYTPWITRVLAAFIDW
+ APYVVLVGIGWVIMLVTQTSSCVTSISEYDVGQFCVSQPSMIGQLVQWLLSVGGLAYL
+ VWNYGYRQGTTGSSIGKSVLKFKVVSETTGQPIGFGMSVVRQLAHFIDAIICFVGFLF
+ PLWDAKRQTLADKIMTTVCVPI"
+ gene 1205455..1206621
+ /gene="metB"
+ /locus_tag="BQ2027_MB1108"
+ CDS 1205455..1206621
+ /gene="metB"
+ /locus_tag="BQ2027_MB1108"
+ /note="Mb1108, metB, len: 388 aa. Equivalent to Rv1079,
+ len: 388 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 388 aa overlap). Probable metB,
+ cystathionine gamma-synthase (EC 4.2.99.9) (see citation
+ below). P46807|METB_MYCLE CYSTATHIONINE GAMMA-SYNTHASE
+ from Mycobacterium leprae (EC 4.2.1.22) (388 aa), FASTA
+ scores: opt: 2220, E(): 0, (87.3% identity in 387 aa
+ overlap). Also similar to other Mycobacterium tuberculosis
+ enzymes involved in methionine synthesis e.g. Rv0391 and
+ Rv3340. Contains PS00868 Cys/Met metabolism enzymes
+ pyridoxal-phosphate attachment site. BELONGS TO THE
+ TRANS-SULFURATION ENZYMES FAMILY. Protein product from
+ Mb1108 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1108 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="cystathionine gamma-synthase metb (cgs)
+ (o-succinylhomoserine [thiol]-lyase)"
+ /protein_id="SIT99707.1"
+ /db_xref="GOA:P66876"
+ /db_xref="InterPro:IPR000277"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="UniProtKB/Swiss-Prot:P66876"
+ /translation="MSEDRTGHQGISGPATRAIHAGYRPDPATGAVNVPIYASSTFAQ
+ DGVGGLRGGFEYARTGNPTRAALEASLAAVEEGAFARAFSSGMAATDCALRAMLRPGD
+ HVVIPDDAYGGTFRLIDKVFTRWDVQYTPVRLADLDAVGAAITPRTRLIWVETPTNPL
+ LSIADITAIAELGTDRSAKVLVDNTFASPALQQPLRLGADVVLHSTTKYIGGHSDVVG
+ GALVTNDEELDEEFAFLQNGAGAVPGPFDAYLTMRGLKTLVLRMQRHSENACAVAEFL
+ ADHPSVSSVLYPGLPSHPGHEIAARQMRGFGGMVSVRMRAGRRAAQDLCAKTRVFILA
+ ESLGGVESLIEHPSAMTHASTAGSQLEVPDDLVRLSVGIEDIADLLGDLEQALG"
+ gene complement(1206692..1207186)
+ /gene="greA"
+ /locus_tag="BQ2027_MB1109C"
+ CDS complement(1206692..1207186)
+ /gene="greA"
+ /locus_tag="BQ2027_MB1109C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1109c, greA, len: 164 aa. Equivalent to Rv1080c,
+ len: 164 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 164 aa overlap). Probable greA,
+ transcription elongation factor G, closest to
+ P46808|GREA_MYCLE TRANSCRIPTION ELONGATION FACTOR G from
+ Mycobacterium leprae (202 aa), FASTA scores: opt: 1005,
+ E(): 0, (94.5% identity in 164 aa overlap); and similar to
+ many e.g. P21346|GREA_ECOLI from Escherichia coli (158
+ aa), FASTA scores: opt: 257, E(): 5.7e-10, (37.2% identity
+ in 148 aa overlap); etc. Contains two PS00829 and one
+ PS00830 Prokaryotic transcription elongation factors
+ signatures 1 and 2, respectively. BELONGS TO THE GREA/GREB
+ FAMILY. Protein product from Mb1109c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1109c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTION ELONGATION FACTOR GREA
+ (Transcript cleavage factor greA)"
+ /protein_id="SIT99708.1"
+ /db_xref="GOA:P64280"
+ /db_xref="InterPro:IPR001437"
+ /db_xref="InterPro:IPR006359"
+ /db_xref="InterPro:IPR018151"
+ /db_xref="InterPro:IPR022691"
+ /db_xref="InterPro:IPR023459"
+ /db_xref="InterPro:IPR028624"
+ /db_xref="InterPro:IPR036805"
+ /db_xref="InterPro:IPR036953"
+ /db_xref="UniProtKB/Swiss-Prot:P64280"
+ /translation="MTDTQVTWLTQESHDRLKAELDQLIANRPVIAAEINDRREEGDL
+ RENGGYHAAREEQGQQEARIRQLQDLLSNAKVGEAPKQSGVALPGSVVKVYYNGDKSD
+ SETFLIATRQEGVSDGKLEVYSPNSPLGGALIDAKVGETRSYTVPNGSTVSVTLVSAE
+ PYHS"
+ gene complement(1207372..1207806)
+ /locus_tag="BQ2027_MB1110C"
+ CDS complement(1207372..1207806)
+ /locus_tag="BQ2027_MB1110C"
+ /note="Mb1110c, -, len: 144 aa. Equivalent to Rv1081c,
+ len: 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 144 aa overlap). Probable conserved
+ membrane protein, with hydrophobic stretch from aa 26 -48,
+ highly similar to NP_302548.1|NC_002677 conserved membrane
+ protein from Mycobacterium leprae. Mb1110c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIT99709.1"
+ /db_xref="GOA:A0A1R3XXC1"
+ /db_xref="InterPro:IPR025443"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXC1"
+ /translation="MTHTPIPRPDARYGRPRLSRRARRRVAIALGVLVAAAGIVIAVI
+ GYQRISTSAVTGSLVGYRLVDDETASVTISVTRSDPSRPVACIVRVRATNGSETGRRE
+ LLVPPSEATTVQVTTTVKSSQPPVMADVYGCGTEVPSYLRLP"
+ gene 1207908..1208774
+ /gene="mca"
+ /locus_tag="BQ2027_MB1111"
+ CDS 1207908..1208774
+ /gene="mca"
+ /locus_tag="BQ2027_MB1111"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1111, mca, len: 288 aa. Equivalent to Rv1082,
+ len: 288 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 288 aa overlap). mca, mycothiol
+ conjugate amidase (see citation below), equivalent to
+ NP_302547.1|NC_002677 conserved hypothetical protein from
+ Mycobacterium leprae (290 aa), FASTA scores: opt: 1737,
+ E(): 0, (86.4% identity in 287 aa overlap); and similar to
+ Q54358|X79146 lmbE protein from Streptomyces lincolnensis
+ (270 aa). Also similar to Rv1170|MTV005.06|MSHB GlcNAc-Ins
+ deacetylase from Mycobacterium tuberculosis (303 aa),
+ FASTA scores: opt: 411, E(): 9.4e-20, (35.8% identity in
+ 299 aa overlap). Protein product from Mb1111 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1111 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Mycothiol conjugate amidase Mca (Mycothiol
+ S-conjugate amidase)"
+ /protein_id="SIT99710.1"
+ /db_xref="GOA:A0A1R3XXA8"
+ /db_xref="InterPro:IPR003737"
+ /db_xref="InterPro:IPR017811"
+ /db_xref="InterPro:IPR024078"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXA8"
+ /translation="MSELRLMAVHAHPDDESSKGAATLARYADEGHRVLVVTLTGGER
+ GEILNPAMDLPDVHGRIAEIRRDEMTKAAEILGVEHTWLGFVDSGLPKGDLPPPLPDD
+ CFARVPLEVSTEALVRVVREFRPHVMTTYDENGGYPHPDHIRCHQVSVAAYEAAGDFC
+ RFPDAGEPWTVSKLYYVHGFLRERMQMLQDEFARHGQRGPFEQWLAYWDPDHDFLTSR
+ VTTRVECSKYFSQRDDALRAHATQIDPNAEFFAAPLAWQERLWPTEEFELARSRIPAR
+ PPETELFAGIEP"
+ gene 1208771..1209037
+ /locus_tag="BQ2027_MB1112"
+ CDS 1208771..1209037
+ /locus_tag="BQ2027_MB1112"
+ /note="Mb1112, -, len: 88 aa. Equivalent to Rv1083, len:
+ 88 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 88 aa overlap). Conserved hypothetical
+ protein, similar to U15183|MLU15183_9 hypothetical protein
+ from Mycobacterium leprae (167 aa), FASTA scores: opt:
+ 332, E(): 1.2e-13, (58.4% identity in 101 aa overlap).
+ Hydrophobic domain aa 25-43. Mb1112 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99711.1"
+ /db_xref="GOA:A0A1R3XXB1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXB1"
+ /translation="MNQILLSVIAEGGPGNTGPDFGKASPVGLLVIVLLVIATLFLVR
+ SMNQQLKKVPKSFDRDHPELDQAADEGTDRDGPARPPGPPHESG"
+ gene 1209024..1211045
+ /locus_tag="BQ2027_MB1113"
+ CDS 1209024..1211045
+ /locus_tag="BQ2027_MB1113"
+ /note="Mb1113, -, len: 673 aa. Equivalent to Rv1084, len:
+ 673 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 673 aa overlap). Conserved hypothetical
+ protein, similar to P37512|YYAL_BACSU hypothetical protein
+ from Bacillus subtilis (689 aa), FASTA scores: opt: 1063,
+ E(): 0, (36.5% identity in 696 aa overlap);
+ AE0009|AE000983_10 Archaeoglobus fulgidus section 1 (642
+ aa), FASTA scores: opt: 1018, E(): 0, (37.2% identity in
+ 600 aa overlap). Also similar to AE001938|AE001938_9
+ Deinococcus radiodurans (690 aa), FASTA scores: opt: 1097,
+ E(): 0, (41.6% identity in 694 aa overlap). Protein
+ product from Mb1113 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1113 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99712.1"
+ /db_xref="GOA:A0A1R3XZF1"
+ /db_xref="InterPro:IPR004879"
+ /db_xref="InterPro:IPR008928"
+ /db_xref="InterPro:IPR012341"
+ /db_xref="InterPro:IPR024705"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZF1"
+ /translation="MSPANPSGTNTLALATSPYLRQHADNPVHWQQWTPQALAEAAAR
+ AVPILLSVGYAACHWCHVMAHESFDDDEVAAAMNAGFVCIKVDREERPDIDAVYMNAT
+ VALTGQGGWPMTCFLTPNGRPFFCGTYYPKAAFLQLLSAISETWRERRAEVEQASDHI
+ AAELRSMASGLPGGGPEVAPELCDDAVAGVLREQDTAHGGFGGAPKFPPSALLEALMR
+ HYERTRSPAALEAVARTGNAMARGGIYDQLGGGFARYSVDGAWVVPHFEKMLYDNALL
+ LRAYAHWARRTGDPLARRVAAQTARFLLDELGSKAPADMFTSSLDADADGREGSTYVW
+ TPVQLTEVLGGDDGRWAAEVFGVTEAGTFEHGTSVLQLPADPDDAARLDRVRAALLVA
+ RLARAQPARDDKVVTSWNGLAITALAEASVALDDPALAHAARRCATRLLDLHVVDGRL
+ RRASLGGVVGDSAAILEDHAMLATGLLALYQLTSEGAWLTAATGLLDTAVAHFGDPQR
+ PGRWFDTADDAERLMLRPSDPLDGATPSGASSIAEALLTAGHVVDGARAERYWQLAAD
+ TLRAHAVLLARAPRSAGHWLAVAEAVVRGPLQIAVACDLPRSSLLADARRLAPGGAIV
+ VGGAAGSSALLVGRDRVAGADAAYVCRGRVCDLPVTSAAELATALGVPG"
+ gene complement(1211144..1211872)
+ /locus_tag="BQ2027_MB1114C"
+ CDS complement(1211144..1211872)
+ /locus_tag="BQ2027_MB1114C"
+ /note="Mb1114c, -, len: 242 aa. Equivalent to Rv1085c,
+ len: 242 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 242 aa overlap). Possible hemolysin-like
+ protein, integral membrane protein, similar to many
+ hemolysins, and hypothetical proteins e.g.
+ U28375|ECU28375_49 Hypothetical protein from Escherichia
+ coli (219 aa), FASTA scores: opt: 308, E(): 7.5e-15,
+ (30.6% identity in 180 aa overlap); AE0011|HIAE001124_2
+ Hypothetical protein from Borrelia burgdorferi (233 aa),
+ FASTA scores: opt: 305, E(): 1.3e-14, (25.6% identity in
+ 203 aa overlap). Also weakly similar to HLY3_BACCE|P54176
+ haemolysin from Bacillus cereus (219 aa), FASTA scores:
+ opt: 247, E(): 8.7e-12, (27.5% identity in 171 aa
+ overlap). Also similar to AE002027|AE002027_8 probable
+ hemolysin from Deinococcus radiodurans (219 aa), FASTA
+ scores: opt: 354, E(): 1.8e-16, (31.1% identity in 219 aa
+ overlap). Mb1114c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE HEMOLYSIN-LIKE PROTEIN"
+ /protein_id="SIT99713.1"
+ /db_xref="GOA:P67158"
+ /db_xref="InterPro:IPR004254"
+ /db_xref="InterPro:IPR005744"
+ /db_xref="UniProtKB/Swiss-Prot:P67158"
+ /translation="MSGQADTATTAEARTPAHAAHHLVEGVARVLTKPRFRGWIHVYS
+ AGTAVLAGASLVAVSWAVGSAKAGLTTLAYTAATITMFTVSATYHRVNWKSATARNWM
+ KRADHSMIFVFIAGSYTPFALLALPAHDGRVVLSIVWGGAIAGILLKMCWPAAPRSVG
+ VPLYLLLGWVAVWYTATILHNAGVTALVLLFVGGALYSIGGILYAVRWPDPWPTTFGY
+ HEFFHACTAVAAICHYIAMWFVVF"
+ gene 1211983..1212771
+ /locus_tag="BQ2027_MB1115"
+ CDS 1211983..1212771
+ /locus_tag="BQ2027_MB1115"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1115, -, len: 262 aa. Equivalent to Rv1086, len:
+ 262 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 262 aa overlap). Short (C15) chain
+ Z-isoprenyl diphosphate synthase (EC 2.5.1.10) (see
+ citations below), equivalent to NP_302598.1|NC_002677
+ possible undecaprenyl pyrophosphate synthetase from
+ Mycobacterium leprae (262 aa), similar to many
+ hypothetical proteins and several potential members of the
+ upp synthase family e.g. NP_296167.1|NC_001263
+ undecaprenyl diphosphate synthase from Deinococcus
+ radiodurans (339 aa); P20182|YT14_STRFR Hypothetical
+ protein from Streptomyces fradiae (259 aa), FASTA scores:
+ opt: 840, E(): 0, (51.0% identity in 259 aa overlap); and
+ P38118|YARF_CORGL Hypothetical protein from
+ Corynebacterium glutamicicum (234 aa), FASTA scores: opt:
+ 729, E(): 0, (56.0% identity in 209 aa overlap); etc. Also
+ similar to Rv2361c|MTCY27.19 (296 aa) (35.6% identity in
+ 233 aa overlap). Contains PS01066 Uncharacterized protein
+ family UPF0015 signature. SEEMS TO BELONG TO THE UPP
+ SYNTHETASE FAMILY. Protein product from Mb1115 detected
+ using SWATH mass spectrometry. Mb1115 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SHORT (C15) CHAIN Z-ISOPRENYL DIPHOSPHATE
+ SYNTHASE (Z-FPP SYNTHASE) (Z-FARNESYL DIPHOSPHATE
+ SYNTHASE) (Z-FPP SYNTHETASE) (Z-FARNESYL DIPHOSPHATE
+ SYNTHETASE) (GERANYLTRANSTRANSFERASE) (FARNESYL
+ PYROPHOSPHATE SYNTHETASE)"
+ /protein_id="SIT99714.1"
+ /db_xref="GOA:Q7U0P8"
+ /db_xref="InterPro:IPR001441"
+ /db_xref="InterPro:IPR018520"
+ /db_xref="InterPro:IPR036424"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0P8"
+ /translation="MEIIPPRLKEPLYRLYELRLRQGLAASKSDLPRHIAVLCDGNRR
+ WARSAGYDDVSYGYRMGAAKIAEMLRWCHEAGIELATVYLLSTENLQRDPDELAALIE
+ IITDVVEEICAPANHWSVRTVGDLGLIGEEPARRLRGAVESTPEVASFHVNVAVGYGG
+ RREIVDAVRALLSKELANGATAEELVDAVTVEGISENLYTSGQPDPDLVIRTSGEQRL
+ SGFLLWQSAYSEMWFTEAHWPAFRHVDFLRALRDYSARHRRYGR"
+ gene 1212948..1215272
+ /gene="PE_PGRS21"
+ /locus_tag="BQ2027_MB1116"
+ CDS 1212948..1215272
+ /gene="PE_PGRS21"
+ /locus_tag="BQ2027_MB1116"
+ /note="Mb1116, PE_PGRS21, len: 774 aa. Similar to Rv1087,
+ len: 767 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (96.8% identity in 783 aa overlap). Member of the M.
+ tuberculosis PE family, PGRS subfamily of gly-rich
+ proteins. Similar to Rv1090|AL021897|MTV017_43
+ Mycobacterium tuberculosis H37Rv (853 aa), FASTA scores:
+ opt: 2819, E(): 0, (59.8% identity in 860 aa overlap).
+ Contains PS00583 pfkB family of carbohydrate kinases
+ signature 1 near C -terminus.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis,
+ insertions of 3 bp (*-gcg) and 45 bp, and deletions of 18
+ bp and 9 bp (ggtggggcc-*), lead to a longer product
+ compared to the homolog in Mycobacterium tuberculosis
+ strain H37Rv (774 aa versus 767 aa). Mb1116 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs21"
+ /protein_id="SIT99715.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXN8"
+ /translation="MSFVVVAPEVLAAAASDLAGIGSTLAQANAAALAPTTAVLAAGA
+ DEVSAAIASLFGAHGQAYQAVSAQMSAFHAQFMQALTGAGGAYAAAEAVNVSAAQSVE
+ QDLLAAINARFERIFGRPLIGDGANGGPGQDGGPGGLLYGNGGNGGTSTTVGMAGGNG
+ GAAGLIGNGGFGGGGGPGAAGGNGGAGGWLFGNGGAGGAGGLGVAPGVPGGAGGAGGA
+ GGVGGPAGLWGHGGAGGAGGAGVAGAGGFEGTIGAGGAGGVGGAGGVGGAGGAGGWLY
+ GDAGAGGDGGVGGAGGTGGLGNRGGAGGAGGAGGVGGAGGAAGLWGGGGAGGVGGTGG
+ GAGLGAQSVTFSSSLSGLSGGDGGAGGAGGAGGAGGTGGWLYGGGGAAGSGGDGGTGG
+ QGGAGGAGVFSLFGSGGGPGGNGGVGGVGGVGGAGGRAGLFGVGGLGGAGGDAGDSGE
+ GGFGGPGLAGGLFGNPGNGGVGGIGGDAAAGGAGGAGGNGGWLFGNGGAGGSGGDGGA
+ AGRGGAGNLGSAGGINAPAGNPGSGSVGIGGAGGAGGTAGLFGDGGAGGAGAAGGFGG
+ ISAATPSAGSEGAMGGAGGVGGNARLLGTGGAGGVGGGGGAGGDGGRGGVATPGGQGG
+ DAGDGGAGGAGGNGGGGASGAGGWLLGTGGAGGAGGNGGNGGKAGFSPGPTNFGLNGA
+ GGGGGVGGNGATGPWLFGDGGAGGGGGAGGIGGDGGPTPGSTGAGAAGGHGGDAQLIG
+ NGGHGGAGGTGVPNGSGGAGGLSGLLFGEPGANG"
+ gene 1215449..1215769
+ /locus_tag="BQ2027_MB1116A"
+ CDS 1215449..1215769
+ /locus_tag="BQ2027_MB1116A"
+ /EC_number="2.5.1.31"
+ /note="Mb1116A, -, len: 106 aa. Equivalent to Rv1087A,
+ len: 106 aa (fragment), from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 106 aa overlap).
+ Conserved hypothetical protein, highly similar to
+ C-terminus of near ORF
+ O53434|YA86_MYCTU|Rv1086|MT1118|MTV017.39 SHORT (C15)
+ CHAIN Z-ISOPRENYL DIPHOSPHATE SYNTHASE from Mycobacterium
+ tuberculosis (262 aa), FASTA scores: opt: 200, E():
+ 1.1e-06, (57.9% identity in 76 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="Undecaprenyl diphosphate synthase (EC"
+ /protein_id="SIT99716.1"
+ /db_xref="GOA:A0A1R3XXB7"
+ /db_xref="InterPro:IPR001441"
+ /db_xref="InterPro:IPR036424"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXB7"
+ /translation="MPCVGYGDRREFVDAVAVEAICENLNTSGQPDPDLVIRTSGEQR
+ LSGHRGPTGGVSRRRLLRALRDYSTPHASIPYVPPPYRSDGIHASRLAVESVFDALAG
+ RVEL"
+ gene 1215922..1216356
+ /gene="PE9"
+ /locus_tag="BQ2027_MB1117"
+ CDS 1215922..1216356
+ /gene="PE9"
+ /locus_tag="BQ2027_MB1117"
+ /note="Mb1117, PE9, len: 144 aa. Equivalent to Rv1088,
+ len: 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 144 aa overlap). Member of Mycobacterium
+ tuberculosis PE family, similar to many others e.g.
+ Z96071|MTCI418B_6 Mycobacterium tuberculosis cosmid (487
+ aa), FASTA scores: opt: 318, E(): 7.3e-14, (60.9% identity
+ in 87 aa overlap) - except it appears to be frameshifted
+ around codon 84. No error to account for frameshift could
+ be found."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe9"
+ /protein_id="SIT99717.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXB3"
+ /translation="MSYMIATPAALTAAATDIDGIGSAVSVANAAAVAATTGVLAAGG
+ DEVLAAIARLFNANAEEYHALSAQVAAFQTLFVRTLTGGCGVFRRRRGRQCVTAAEHR
+ AAGAGRRQRRRRSGDGQWRLRQQRHFGCGGQPEFRQHSEHRR"
+ gene 1216373..1216540
+ /gene="PE10"
+ /locus_tag="BQ2027_MB1118"
+ CDS 1216373..1216540
+ /gene="PE10"
+ /locus_tag="BQ2027_MB1118"
+ /note="Mb1118, PE10, len: 101 aa. Equivalent to Rv1089,
+ len: 120 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 101 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family of glycine-rich
+ proteins. Partial ORF that appears to be frameshifted,
+ continuation of Rv1088|MTV017.41. Sequence has been
+ checked and appears correct. Similar to Z95555|MTCY06F7_4
+ Mycobacterium tuberculosis cosmid (401 aa), FASTA scores:
+ opt: 126, E(): 2, (29.6% identity in 125 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe10"
+ /protein_id="SIT99718.1"
+ /db_xref="GOA:A0A1R3XXB4"
+ /db_xref="InterPro:IPR008965"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXB4"
+ /translation="MTTASATASSTGVDGGIAATYAVASQWDGGYVANYTITQFGRDF
+ DDRLAVAIHFA"
+ gene 1216926..1217030
+ /gene="celA2a"
+ /locus_tag="BQ2027_MB1119"
+ CDS 1216926..1217030
+ /gene="celA2a"
+ /locus_tag="BQ2027_MB1119"
+ /note="Mb1119, celA2a, len: 34 aa. Equivalent to Rv1089A,
+ len: 34 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 34 aa overlap). Probable celA2a, first
+ part of cellulase (endoglucanase) (EC 3.2.1.4), similar to
+ N-terminus of others."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CELLULASE CELA2A
+ (ENDO-1,4-BETA-GLUCANASE) (ENDOGLUCANASE) (CARBOXYMETHYL
+ CELLULASE)"
+ /protein_id="SIT99719.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXC8"
+ /translation="MNGAAPTNGAPLSYPSICEGVHWGHLVGGHQPAY"
+ gene 1217008..1217463
+ /gene="celA2b"
+ /locus_tag="BQ2027_MB1120"
+ CDS 1217008..1217463
+ /gene="celA2b"
+ /locus_tag="BQ2027_MB1120"
+ /note="Mb1120, celA2b, len: 151 aa. Equivalent to Rv1090,
+ len: 151 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 151 aa overlap). Probable celA2b, second
+ part of cellulase (endoglucanase) (EC 3.2.1.4), similar to
+ C-terminus of others e.g. O08468 cellulase CEL2 from
+ Streptomyces halstedi (377 aa), FASTA scores: opt: 554,
+ E(): 1.2e-30, (52.0% identity in 152 aa overlap); etc.
+ Gene appears to have been inactivated by frameshift
+ mutations but no errors could be found that would account
+ for this. Mb1120 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CELLULASE CELA2B
+ (ENDO-1,4-BETA-GLUCANASE) (ENDOGLUCANASE) (CARBOXYMETHYL
+ CELLULASE)"
+ /protein_id="SIT99720.1"
+ /db_xref="GOA:A0A1R3XXB8"
+ /db_xref="InterPro:IPR002594"
+ /db_xref="InterPro:IPR013319"
+ /db_xref="InterPro:IPR013320"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXB8"
+ /translation="MGTNLPTEVGQILSAPTSIDYNYPTTGVWDASYDICLDSTPKTT
+ GVNQQEIMIWFNHQGSIQPVGSPVGNTTIEGKNFVVWDGSNGMNNAMAYVATEPIEVW
+ SFDVMSFVDHTATMEPITDSWYLTSIRAGLEPWSDGVGLGVDSFSAKVN"
+ gene 1217878..1220430
+ /gene="PE_PGRS22"
+ /locus_tag="BQ2027_MB1121"
+ CDS 1217878..1220430
+ /gene="PE_PGRS22"
+ /locus_tag="BQ2027_MB1121"
+ /note="Mb1121, PE_PGRS22, len: 850 aa. Equivalent to
+ Rv1091, len: 853 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.6% identity in 853 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins. Similar to
+ Rv1087|AL021897|MTV017_39 Mycobacterium tuberculosis H37Rv
+ (767 aa), FASTA scores: opt: 2819, E(): 0, (60.0% identity
+ in 860 aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 9 bp deletion (ccggcggca-*) leads
+ to a shorter product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (850 aa versus 853
+ aa). Mb1121 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs22"
+ /protein_id="SIT99721.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXC0"
+ /translation="MSFVIAAPEALVAVASDLAGIGSALAEANAAALAPTTALLAAGA
+ DEVSAAIAALFGAHGQAYQTVSAQASAFHAQFVQALTGGGGAYAAAEAANVSAAQSTD
+ QRLLDLINGPTQALLGRPLIGDGANGGPGQDGGPGGLLYGNGGNGGTSTTAGVAGGNG
+ GAAGLIGNGGAGGGGGAGAAGGNGGAGGWLYGNGGAGGAGGTSVIPGVAGGNGGAGGS
+ AGLWGTGGAGGDGGNGRSGPVNVAGSAGGNGGAGGAAGLFGDAGAGGNGGKGGAGGAA
+ FSINFTAGDGGAGGAGGSGGHALLWGAGGAGGNGGSGGTGGAGGSTAGAGGNGGAGGG
+ GGTGGLLFGNGGAGGHGAAAGNGLAAGNGVSSSGGGGAGGTGGAGGDGGAGGAGGNAR
+ LWGVGGAGGAGGDGGAGGAGGKGGSGLSGNANGGAGGDSGRGGTGGAGGEGGAAGLLV
+ GTGGHGGDGGAGGAAVKGGDGGAAAGTGIAGAGGRGGAGGSGGSGGDGGGGAAGPAGW
+ LFGDGGAGGNGGAAAAGGAGGQAGGGGGNGGNGGNGGNGGNGGNGATGGWLYGNGGAG
+ GQGATAGAGGAGANGVSSTNGGGNGGIGGTGGSGGAGGNAGLLGVGGAGGHGASGGAG
+ DRGGAGGTGFISSDGGAGGDGGDGGNGGAGGTGGLLFGAGGNGGPGGSGGAADIGGNG
+ GAGNGGGTDGNGGNGGSGGGAGSGGDGGGAGGNGAWLFGNGGAGGGGGKGGNGAGGGL
+ GGGSFGLPGLNGSGGDGGDGGNGAPGGVLYGNGGAGGQGSSGGIGGPGATGGAGGKGG
+ DGGDAQLIGDGGNGGNGGAGGTGGTPGPGGPGGSGGLGGLLFGQTGTAGVSP"
+ gene complement(1220648..1221586)
+ /gene="coaA"
+ /locus_tag="BQ2027_MB1122C"
+ CDS complement(1220648..1221586)
+ /gene="coaA"
+ /locus_tag="BQ2027_MB1122C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1122c, coaA, len: 312 aa. Equivalent to Rv1092c,
+ len: 312 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 312 aa overlap). Probable coaA,
+ pantothenate kinase (EC 2.7.1.33), similar to many e.g.
+ P15044|COAA_ECOLI Escherichia coli (316 aa), FASTA scores
+ :opt: 1079, E(): 0, (52.7% identity in 311 aa overlap).
+ Equivalent to AL049491|MLCB1222_17 Mycobacterium leprae
+ (312 aa) (93.6% identity in 312 aa overlap). Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop). TBparse
+ score is 0.912. BELONGS TO THE PANTOTHENATE KINASE FAMILY.
+ Protein product from Mb1122c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1122c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable pantothenate kinase coaA (Pantothenic
+ acid kinase)"
+ /protein_id="SIT99722.1"
+ /db_xref="GOA:P63811"
+ /db_xref="InterPro:IPR004566"
+ /db_xref="InterPro:IPR006083"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P63811"
+ /translation="MSRLSEPSPYVEFDRRQWRALRMSTPLALTEEELVGLRGLGEQI
+ DLLEVEEVYLPLARLIHLQVAARQRLFAATAEFLGEPQQNPDRPVPFIIGVAGSVAVG
+ KSTTARVLQALLARWDHHPRVDLVTTDGFLYPNAELQRRNLMHRKGFPESYNRRALMR
+ FVTSVKSGSDYACAPVYSHLHYDIIPGAEQVVRHPDILILEGLNVLQTGPTLMVSDLF
+ DFSLYVDARIEDIEQWYVSRFLAMRTTAFADPESHFHHYAAFSDSQAVVAAREIWRTI
+ NRPNLVENILPTRPRATLVLRKDADHSINRLRLRKL"
+ gene 1221974..1223254
+ /gene="glyA1"
+ /locus_tag="BQ2027_MB1123"
+ CDS 1221974..1223254
+ /gene="glyA1"
+ /locus_tag="BQ2027_MB1123"
+ /standard_name="glyA"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1123, glyA1, len: 426 aa. Equivalent to Rv1093,
+ len: 426 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 426 aa overlap). Probable glyA1, serine
+ hydroxymethyltransferase 1 (EC 2.1.2.1), equivalent to
+ AL049491|MLCB1222_16 from Mycobacterium leprae (426 aa),
+ FASTA score: (89.9 % identity in 426 aa overlap). Also
+ similar to many e.g. P34895|GLYA_HYPME HYPHOMICROBIUM
+ METHYLOVORUM (434 aa), FASTA scores: opt: 1492, E(): 0,
+ (56.8% identity in 419 aa overlap); etc. BELONGS TO THE
+ SHMT FAMILY. Note that previously known as glyA. Protein
+ product from Mb1123 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1123 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="serine hydroxymethyltransferase 1 glya1"
+ /protein_id="SIT99723.1"
+ /db_xref="GOA:P59953"
+ /db_xref="InterPro:IPR001085"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="InterPro:IPR019798"
+ /db_xref="InterPro:IPR039429"
+ /db_xref="UniProtKB/Swiss-Prot:P59953"
+ /translation="MSAPLAEVDPDIAELLAKELGRQRDTLEMIASENFAPRAVLQAQ
+ GSVLTNKYAEGLPGRRYYGGCEHVDVVENLARDRAKALFGAEFANVQPHSGAQANAAV
+ LHALMSPGERLLGLDLANGGHLTHGMRLNFSGKLYENGFYGVDPATHLIDMDAVRATA
+ LEFRPKVIIAGWSAYPRVLDFAAFRSIADEVGAKLLVDMAHFAGLVAAGLHPSPVPHA
+ DVVSTTVHKTLGGGRSGLIVGKQQYAKAINSAVFPGQQGGPLMHVIAGKAVALKIAAT
+ PEFADRQRRTLSGARIIADRLMAPDVAKAGVSVVSGGTDVHLVLVDLRDSPLDGQAAE
+ DLLHEVGITVNRNAVPNDPRPPMVTSGLRIGTPALATRGFGDTEFTEVADIIATALAT
+ GSSVDVSALKDRATRLARAFPLYDGLEEWSLVGR"
+ gene 1223359..1224186
+ /gene="desA2"
+ /locus_tag="BQ2027_MB1124"
+ CDS 1223359..1224186
+ /gene="desA2"
+ /locus_tag="BQ2027_MB1124"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1124, desA2, len: 275 aa. Equivalent to Rv1094,
+ len: 275 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 275 aa overlap). Possible desA2,
+ acyl-[acyl-carrier protein] desaturase (stearoyl-ACP
+ desaturase) (EC 1.14.19.2), equivalent to
+ AL049491|MLCB1222_15 from Mycobacterium leprae (275 aa),
+ FASTA score: (78.1% identity in 274 aa overlap). Also
+ weakly similar to plant stearoyl-acyl carrier protein
+ desaturases, and very similar to U49839|MTV043.16C|Rv0824c
+ enzyme desA1 from Mycobacterium tuberculosis (338 aa),
+ FASTA scores: opt: 525, E(): 8.5e-30, (32.2% identity in
+ 270 aa overlap); and to U15182|MLU15182_32 acyl-carrier
+ protein desaturase precursor from Mycobacterium leprae
+ (338 aa), FASTA scores: opt: 506, E(): 1.9e-28, (34.1%
+ identity in 261 aa overlap). TBparse score is 0.894.
+ Protein product from Mb1124 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1124 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ACYL-[ACYL-CARRIER PROTEIN] DESATURASE
+ DESA2 (ACYL-[ACP] DESATURASE) (STEAROYL-ACP DESATURASE)"
+ /protein_id="SIT99724.1"
+ /db_xref="GOA:A0A1R3XXD5"
+ /db_xref="InterPro:IPR005067"
+ /db_xref="InterPro:IPR009078"
+ /db_xref="InterPro:IPR012348"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXD5"
+ /translation="MAQKPVADALTLELEPVVEANMTRHLDTEDIWFAHDYVPFDQGE
+ NFAFLGGRDWDPSQSTLPRTITDACEILLILKDNLAGHHRELVEHFILEDWWGRWLGR
+ WTAEEHLHAIALREYLVVTREVDPVANEDVRVQHVMKGYRAEKYTQVETLVYMAFYER
+ CGAVFCRNLAAQIEEPILAGLIDRIARDEVRHEEFFANLVTHCLDYTRDETIAAIAAR
+ AADLDVLGADIEAYRDKLQNVADAGIFGKPQLRQLISDRITAWGLAGEPSLKQFVTG"
+ gene 1224397..1225698
+ /gene="phoH2"
+ /locus_tag="BQ2027_MB1125"
+ CDS 1224397..1225698
+ /gene="phoH2"
+ /locus_tag="BQ2027_MB1125"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1125, phoH2, len: 433 aa. Equivalent to Rv1095,
+ len: 433 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 433 aa overlap). Probable phoH2,
+ phoH-like protein (phosphate starvation-induced protein),
+ probably ATP-binding protein. Equivalent to AL049491
+ MLCB1222_14 Mycobacterium leprae (433 aa) (92.8% identity
+ in 432 aa overlap). Similar to many proteins described as
+ PhoH-like e.g. Z97025|BSZ97025_12 Bacillus subtilis (442
+ aa), FASTA scores: opt: 605, E(): 0, (40.1% identity in
+ 444 aa overlap); or Mycobacterium tuberculosis
+ Rv2368c|O05830|PHOL_MYCTU Mycobacterium tuberculosis (352
+ aa), FASTA scores: opt: 390, E(): 4e-19, (31.5% identity
+ in 241 aa overlap). Contains PS00017 ATP/GTP-binding site
+ motif A (P-loop). BELONGS TO THE PHOH FAMILY. Protein
+ product from Mb1125 detected using SWATH mass
+ spectrometry. Mb1125 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOH-LIKE PROTEIN PHOH2 (PHOSPHATE
+ STARVATION-INDUCIBLE PROTEIN PSIH)"
+ /protein_id="SIT99725.1"
+ /db_xref="GOA:A0A1R3XXP8"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR003714"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXP8"
+ /translation="MTDTRTYVLDTSVLLSDPWACSRFAEHDVVVPLVVISELEAKRH
+ HHELGWFARQALRLFDDLRLEHGRLDQPIPVGTQGGTLHVELNHTDPAVLPAGFRTDS
+ NDSRILSCAANLAAEGKRVTLVSKDIPLRVKAAAVGLAADEYHAQDVVVSGWSGMHEL
+ ETASADIDALFADGEIDLVEARDLPCHTGIRLLGGGSHALGRVNAHKRVQLVRGDREA
+ FGLRGRSAEQRVALDLLLDESVGIVSLGGKAGTGKSALALCAGLEAVLERRTHRKVVV
+ FRPLYAVGGQELGYLPGSESEKMGPWAQAVFDTLEGLASPAVLEEVLSRGMLEVLPLT
+ HIRGRSLHDSFVIVDEAQSLERNVLLTVLSRLGTGSRVVLTHDIAQRDNLRVGRHDGV
+ AAVIEKLKGHPLFAHITLLRSERSPIAALVTEMLEEITGPR"
+ gene 1225785..1226660
+ /locus_tag="BQ2027_MB1126"
+ CDS 1225785..1226660
+ /locus_tag="BQ2027_MB1126"
+ /note="Mb1126, -, len: 291 aa. Equivalent to Rv1096, len:
+ 291 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 291 aa overlap). Possible glycosyl
+ hydrolase (EC 3.-.-.-), possibly a deacetylase or
+ esterase. Equivalent to AL049491|MLCB1222_13 Mycobacterium
+ leprae (291 aa) (81.3% identity in 289 aa overlap).
+ Similar at the C-terminus of enzymes involved in
+ carbohydrate degradation including Z99110|BSUB0007_92
+ endo-1,4-beta-xylanase homolog yjeA from Bacillus subtilis
+ (467 aa), FASTA scores: opt: 418, E(): 2.6e-17, (38.6%
+ identity in 184 aa overlap); M64552|STMXLNB_2 acetyl-xylan
+ esterase from Streptomyces lividans (335 aa), FASTA
+ scores: opt: 371, E(): 1.1e-14, (31.6% identity in 237 aa
+ overlap); NP_345933.1|NC_003028 peptidoglycan
+ N-acetylglucosamine deacetylase A from Streptococcus
+ pneumoniae (463 aa); etc. Has possible N-terminal signal
+ sequence with TMhelix at aa 13-31. Protein product from
+ Mb1126 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1126 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE GLYCOSYL HYDROLASE"
+ /protein_id="SIT99726.1"
+ /db_xref="GOA:A0A1R3XXC7"
+ /db_xref="InterPro:IPR002509"
+ /db_xref="InterPro:IPR011330"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXC7"
+ /translation="MPKRPDNQTWRYWRTVTGVVVAGAVLVVGGLSGRVTRAENLSCS
+ VIKCVALTFDDGPGPYTDRLLHILTDNDAKATFFLIGNKVAANPAGARRIADAGMEIG
+ SHTWEHPNMTTIPPEDIPGQFSRANDVIAAATGRTPTLYRPAGGLSNDAVRQAAAKVG
+ QAEILWDVIPFDWINDSNTAATRHMLMTQIKPGSVVLFHDTYSSTVDVVYQFIPVLKA
+ NGYRLVTVSELLGPRAPGSSYGSRENGPPVNELRDIPASEIPPLPNTSSPKPMSNFPI
+ TDIAGQNSGGPNNGA"
+ gene complement(1226663..1227544)
+ /locus_tag="BQ2027_MB1127C"
+ CDS complement(1226663..1227544)
+ /locus_tag="BQ2027_MB1127C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1127c, -, len: 293 aa. Equivalent to Rv1097c,
+ len: 293 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 293 aa overlap). Probable membrane
+ Gly-, Pro-rich protein, similar to Mycobacterium
+ tuberculosis Rv2507|MTCY07A7. 13|Z95556 (273 aa), FASTA
+ scores: opt: 219, E(): 0.023, (30.5% identity in 266 aa
+ overlap); and Rv2507. Contains potential membrane spanning
+ region (aa ~68-92). TBparse score is 0.912. Protein
+ product from Mb1127c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1127c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE GLYCINE AND PROLINE RICH
+ PROTEIN"
+ /protein_id="SIT99727.1"
+ /db_xref="GOA:A0A1R3XXC2"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXC2"
+ /translation="MTVPPAGPYGNYPYGPNTYGQDLYWGGQPQGGSYPPAYPPQQYP
+ PGWPAGPYPPGPPPPGPGSKTPWLILAGLAVLGVILLVVILVIGLRGDNKSTTATSPA
+ TSAPTSQPFSQQTATGCTPNVSGGVQPIGDSISAGKLSFPTSAAPGWSAFSDDQNPNL
+ IDAVGVGHEVAGADQWMMQAEVAITNFVTTMDVAAQASKLMQCVADGPGYAGSSPTLG
+ PTKTSSITVDGVRAARVDADITIADSSRNVKGDSVTIIAVDTKPVTVFLGATPIGDAT
+ SRATVERVIEALKVNKS"
+ gene complement(1227541..1228965)
+ /gene="fum"
+ /locus_tag="BQ2027_MB1128C"
+ CDS complement(1227541..1228965)
+ /gene="fum"
+ /locus_tag="BQ2027_MB1128C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1128c, fum, len: 474 aa. Equivalent to Rv1098c,
+ len: 474 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 474 aa overlap). Probable fum, fumarase
+ (EC 4.2.1.2). Equivalent to AL049491|MLCB1222_11
+ Mycobacterium leprae (474 aa) (89.5 % identity in 467 aa
+ overlap). Similar to many e.g. P14408|FUMH_RAT FUMARATE
+ HYDRATASE, MITOCHONDRIAL PRECURSOR from Rattus norvegicus
+ (507 aa), FASTA scores: opt: 1427, E(): 0, (52.3% identity
+ in 461 aa overlap); and P05042|FUMC_ECOLI Fumarate
+ hydratase class II from Escherichia coli (467 aa), FASTA
+ scores: opt: 1355, E(): 0, (50.2% identity in 444 aa
+ overlap). Contains PS00163 Fumarate lyases signature.
+ TBparse score is 0.886. Protein product from Mb1128c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1128c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FUMARASE FUM (Fumarate hydratase)"
+ /protein_id="SIT99728.1"
+ /db_xref="GOA:Q7U0N6"
+ /db_xref="InterPro:IPR000362"
+ /db_xref="InterPro:IPR005677"
+ /db_xref="InterPro:IPR008948"
+ /db_xref="InterPro:IPR018951"
+ /db_xref="InterPro:IPR020557"
+ /db_xref="InterPro:IPR022761"
+ /db_xref="InterPro:IPR024083"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0N6"
+ /translation="MAVDADSANYRIEHDTMGEVRVPAKALWRAQTQRAVENFPISGR
+ GLERTQIRALGLLKGACAQVNSDLGLLAPEKADAIIAAAAEIADGQHDDQFPIDVFQT
+ GSGTSSNMNTNEVIASIAAKGGVTLHPNDDVNMSQSSNDTFPTATHIAATEAAVAHLI
+ PALQQLHDALAAKALDWHTVVKSGRTHLMDAVPVTLGQEFSGYARQIEAGIERVRACL
+ PRLGELAIGGTAVGTGLNAPDDFGVRVVAVLVAQTGLSELRTAANSFEAQAARDGLVE
+ ASGALRTIAVSLTKIANDIRWMGSGPLTGLAEIQLPDLQPGSSIMPGKVNPVLPEAVT
+ QVAAQVIGNDAAIAWGGANGAFELNVYIPMMARNILESFKLLTNVSRLFAQRCIAGLT
+ ANVEHLRRLAESSPSIVTPLNSAIGYEEAAAVAKQALKERKTIRQTVIDRGLIGDRLS
+ IEDLDRRLDVLAMAKAEQLDSDRL"
+ gene complement(1228996..1230084)
+ /gene="glpx"
+ /locus_tag="BQ2027_MB1129C"
+ CDS complement(1228996..1230084)
+ /gene="glpx"
+ /locus_tag="BQ2027_MB1129C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1129c, -, len: 328 aa. Equivalent to Rv1099c,
+ len: 328 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 328 aa overlap). Conserved hypothetical
+ protein, highly similar to P44811|GLPX_HAEIN GLPX PROTEIN
+ HOMOLOG (believed to be involved in glycerol metabolism)
+ (333 aa), FASTA scores: opt: 763, E():0, (46.2% identity
+ in 327 aa overlap); and Q03224|YWJI_BACSU hypothetical
+ protein from Bacillus subtilis (321aa), FASTA scores: opt:
+ 1092, E(): 0, (52.1% identity in 313 aa overlap).
+ Equivalent to AL049491|MLCB1222_10 Mycobacterium leprae
+ (355 aa), (93.0% identity in 328 aa overlap). Protein
+ product from Mb1129c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1129c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="fructose 1,6-bisphosphatase glpx"
+ /protein_id="SIT99729.1"
+ /db_xref="GOA:Q7U0N5"
+ /db_xref="InterPro:IPR004464"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0N5"
+ /translation="MTAEGSGSSTAAVASHDPSHTRPSRREAPDRNLAMELVRVTEAG
+ AMAAGRWVGRGDKEGGDGAAVDAMRELVNSVSMRGVVVIGEGEKDHAPMLYNGEEVGN
+ GDGPECDFAVDPIDGTTLMSKGMTNAISVLAVADRGTMFDPSAVFYMNKIAVGPDAAH
+ VLDITAPISENIRAVAKVKDLSVRDMTVCILDRPRHAQLIHDVRATGARIRLITDGDV
+ AGAISACRPHSGTDLLAGIGGTPEGIIAAAAIRCMGGAIQAQLAPRDDAERRKALEAG
+ YDLNQVLTTEDLVSGENVFFCATGVTDGDLLKGVRYYPGGCTTHSIVMRSKSGTVRMI
+ EAYHRLSKLNEYSAIDFTGDSSAVYPLP"
+ gene 1230083..1230784
+ /locus_tag="BQ2027_MB1130"
+ CDS 1230083..1230784
+ /locus_tag="BQ2027_MB1130"
+ /note="Mb1130, -, len: 233 aa. Equivalent to Rv1100, len:
+ 233 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 233 aa overlap). Conserved hypothetical
+ protein, slightly similar to Rv1906c|MTCY180.12
+ hypothetical protein from Mycobacterium tuberculosis (156
+ aa), FASTA scores: opt: 122, E(): 6.9, (27.4% identity in
+ 135 aa overlap). Equivalent to AL049491|MLCB1222_9
+ Mycobacterium leprae (257 aa) (63.8% identity in 257 aa
+ overlap). Protein product from Mb1130 detected using
+ shotgun mass spectrometry. Mb1130 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99730.1"
+ /db_xref="GOA:A0A1R3XXC6"
+ /db_xref="InterPro:IPR025339"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXC6"
+ /translation="MVGDCPRSRTVRWSWDTGHVTAEPQPTPRPAKPRLLQDGRDMFW
+ SLAPLVVGCILLAGLVGMCSFQLGGTKRGPIPSYDAAQALRADAKTLGFPIRLPQLPG
+ GWTPNSGGRGGIENGRADPATGQRRNAATSIVGFISPTGRYLSLTQSNADEDKLVGSI
+ HPSMYPTGTVDVGGTRWVVYEGSDENGAVEPVWTTRLTGPGGATQLAITGAGSIDQFR
+ TLASATQSQPPLPAR"
+ gene complement(1230791..1231819)
+ /locus_tag="BQ2027_MB1131C"
+ CDS complement(1230791..1231819)
+ /locus_tag="BQ2027_MB1131C"
+ /note="Mb1131c, -, len: 342 aa. Equivalent to 3' end of
+ Rv1101c, len: 385 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.7% identity in 342 aa overlap).
+ Conserved membrane protein, shows some similarity to other
+ bacterial proteins e.g. P77406|PERM_ECOLI PUTATIVE
+ PERMEASE PERM from Escherichia coli (353 aa), FASTA
+ scores: opt: 287, E(): 8.8e-12, (24.9% identity in 349 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a frameshift due to a single base deletion (t-*)
+ leads to a shorter product with a different amino part
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv. Protein product from Mb1131c detected using
+ SWATH mass spectrometry. Mb1131c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIT99731.1"
+ /db_xref="GOA:A0A1R3XXD0"
+ /db_xref="InterPro:IPR002549"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXD0"
+ /translation="MFTPLFKWFTKRFNTGLSAACTLLSALAAVVVPVGALVGLAIVQ
+ IARMVDSVADWVRTTDLSTLGDKILQFVNGLFDRVPFLHITVTADALRKAMISVAQNV
+ GEWLLHFLRDAAGSLAGVITSAIIFVYVFVALLVNREKLRTLIGQLNPLGEDVTDLYL
+ QKMGSMVRGTVNGQFVIAACQGVAGAASIYIAGFHHGFFIFAIVLTALSIIPLGGGIV
+ TIPFGIGMIFYGNIAGGIFVLLWHLLVVTNIDNVLRPILVPRDARLNSALMLLSVFAG
+ ITMFGPWGIIIGPVLMILIVTTIDVYLAVYKGVELEQFDAPPVRRRWLPRRGPATSRN
+ APPPSTAE"
+ gene complement(1232059..1232370)
+ /gene="mazf3"
+ /locus_tag="BQ2027_MB1132C"
+ CDS complement(1232059..1232370)
+ /gene="mazf3"
+ /locus_tag="BQ2027_MB1132C"
+ /note="Mb1132c, -, len: 103 aa. Equivalent to Rv1102c,
+ len: 103 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 103 aa overlap). Conserved hypothetical
+ protein, similar to Mycobacterium tuberculosis
+ hypothetical protens e.g. Rv1942c|MTCY9F9_22 (109 aa),
+ FASTA scores: opt: 158, E(): 3.6e-05, (33.3% identity in
+ 93 aa overlap); Rv0659c|MTCI376_17 (102aa), opt: 140, E():
+ 0.00072, (40.6% identity in 69aa overlap); and Rv1495.
+ Mb1132c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="toxin mazf3"
+ /protein_id="SIT99732.1"
+ /db_xref="GOA:A0A1R3XZG6"
+ /db_xref="InterPro:IPR003477"
+ /db_xref="InterPro:IPR011067"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZG6"
+ /translation="MRPIHIAQLDKARPVLILTREVVRPHLTNVTVAPITTTVRGLAT
+ EVPVDAVNGLNQPSVVSCDNIQTIPVCDLGRQIGYLLASQEPALAEAIGNAFDLDWVV
+ A"
+ gene complement(1232370..1232690)
+ /gene="maze3"
+ /locus_tag="BQ2027_MB1133C"
+ CDS complement(1232370..1232690)
+ /gene="maze3"
+ /locus_tag="BQ2027_MB1133C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1133c, -, len: 106 aa. Equivalent to Rv1103c,
+ len: 106 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 106 aa overlap). Conserved hypothetical
+ protein, similar to part of Mycobacterium tuberculosis
+ hypothetical protein Rv2472|AL021246|MTV008_27
+ Mycobacterium tuberculosis (97 aa), FASTA score: opt: 135,
+ E(): 0.0091, (45.8% identity in 72 aa overlap). TBparse
+ score is 0.916. Protein product from Mb1133c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1133c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin maze3"
+ /protein_id="SIT99733.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYC0"
+ /translation="MYLPWGVVLAGGANGFGAGAYQTGTICEVSTQIAVRLPDEIVAF
+ IDDEVRGQHARSRAAVVLRALERERRRRLAERDAEILATNTSATGDLDTLAGHCARTA
+ LDID"
+ gene 1232700..1233389
+ /locus_tag="BQ2027_MB1134"
+ CDS 1232700..1233389
+ /locus_tag="BQ2027_MB1134"
+ /note="Mb1134, -, len: 229 aa. Equivalent to Rv1104, len:
+ 229 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 229 aa overlap). Possible
+ para-nitrobenzyl esterase (fragment; possibly first part)
+ (EC 3.1.1.-). Similar to the N-terminal domain of many
+ e.g. P37967|PNBA_BACSU Bacillus subtilis (489 aa), FASTA
+ scores: opt: 715, E(): 0, (53.4% identity in 191 aa
+ overlap). Gene may be inactivated as a frameshift is
+ required to obtain a product continuing in
+ MTV017.58|Rv1105. Mb1134 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PARA-NITROBENZYL ESTERASE (FRAGMENT)"
+ /protein_id="SIT99734.1"
+ /db_xref="InterPro:IPR002018"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXE4"
+ /translation="MVVDSCVAESRYGPVRGADDGRVKVWKGIRYAAPPLGDLRFRTP
+ EPPERWTEVADATTFGPACPQPAIPNMPLDLGASQSEDCWSLNIWAPADTEPGDGKPV
+ MVWLHGGAYILGSGSQPLYNGRRLAASGDVVVVTVNYRLGALGFLDLSSFNTSRRRFD
+ SNIGLRDVLAVLRWVADNIAVFGGDPEKVTLFGESARESSRPCSPPRRPRVCSRRRSP
+ RAHRRHRSTTR"
+ gene 1233710..1234225
+ /locus_tag="BQ2027_MB1135"
+ CDS 1233710..1234225
+ /locus_tag="BQ2027_MB1135"
+ /note="Mb1135, -, len: 171 aa. Equivalent to Rv1105, len:
+ 171 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 171 aa overlap). Possible
+ para-nitrobenzyl esterase (fragment; possibly second part)
+ (EC 3.1.1.-). Similar to C-terminal domain of many e.g.
+ P71048 PARA-NITROBENZYL ESTERASE from Bacillus subtilis
+ (489 aa), FASTA scores: opt: 248, E(): 2.7e-10, (32.3%
+ identity in 167 aa overlap). Gene may be inactivated as a
+ frameshift is required to obtain a product continuing from
+ MTV017.57|Rv1104. Start changed since first submission."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PARA-NITROBENZYL ESTERASE (FRAGMENT)"
+ /protein_id="SIT99735.1"
+ /db_xref="InterPro:IPR002018"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXQ8"
+ /translation="MFTQIAAEQPDLQVPTEEQIGSAYSRWRRKARSLSMATDVGFRM
+ PSVWLAEGHSGVAPVYLYRFDYSTPLLKLLLVRAAHATELPYVWGNLGGSQDPALKLG
+ DAKAAIAVSRRVRTRWINFATRGKPTGPDGEPDWPCYEEAHRACLIIGRRDAVVHDVD
+ AHIRATWGSKW"
+ gene complement(1234243..1235355)
+ /locus_tag="BQ2027_MB1136C"
+ CDS complement(1234243..1235355)
+ /locus_tag="BQ2027_MB1136C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1136c, -, len: 370 aa. Equivalent to Rv1106c,
+ len: 370 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 370 aa overlap). Probable cholesterol
+ dehydrogenase (EC 1.1.1.-). Equivalent to
+ AL049491|MLCB1222_7 Mycobacterium leprae (376 aa) (75.5%
+ identity in 375 aa overlap). Highly similar to Q03704
+ NAD(P)-dependent cholesterol dehydrogenase from Nocardia
+ sp. (364 aa), FASTA scores: opt: 1789, E(): 0, (74.5%
+ identity in 361 aa overlap). Also similar to
+ U32426|MCU32426_1 3-beta-hydroxy-Delta5-steroid
+ dehydrogenase from Molluscum contagiosum virus (354 aa),
+ FASTA scores: opt: 432, E(): 1.7e-22, (34.6% identity in
+ 347 aa overlap). Also similar to series of Mycobacterium
+ tuberculosis hypothetical proteins described as sugar
+ epimerases or dehydratases e.g. Rv3634c, Rv3784, Rv3464,
+ etc. Protein product from Mb1136c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1136c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="3-beta-hydroxysteroid dehydrogenase"
+ /protein_id="SIT99736.1"
+ /db_xref="GOA:A0A1R3XXD8"
+ /db_xref="InterPro:IPR002225"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXD8"
+ /translation="MLRRMGDASLTTELGRVLVTGGAGFVGANLVTTLLDRGHWVRSF
+ DRAPSLLPAHPQLEVLQGDITDADVCAAAVDGIDTIFHTAAIIELMGGASVTDEYRQR
+ SFAVNVGGTENLLHAGQRAGVQRFVYTSSNSVVMGGQNIAGGDETLPYTDRFNDLYTE
+ TKVVAERFVLAQNGVDGMLTCAIRPSGIWGNGDQTMFRKLFESVLKGHVKVLVGRKSA
+ RLDNSYVHNLIHGFILAAAHLVPDGTAPGQAYFINDAEPINMFEFARPVLEACGQRWP
+ KMRISGPAVRWVMTGWQRLHFRFGFPAPLLEPLAVERLYLDNYFSIAKARRDLGYEPL
+ FTTQQALTECLPYYVSLFEQMKNEARAEKTAATVKP"
+ gene complement(1235365..1235622)
+ /gene="xseB"
+ /locus_tag="BQ2027_MB1137C"
+ CDS complement(1235365..1235622)
+ /gene="xseB"
+ /locus_tag="BQ2027_MB1137C"
+ /note="Mb1137c, xseB, len: 85 aa. Equivalent to Rv1107c,
+ len: 85 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 85 aa overlap). Probable xseB,
+ exonuclease VII small subunit (EC 3.1.11.6). Equivalent to
+ AL049491|MLCB1222_6 Mycobacterium leprae (87 aa) (77.9%
+ identity in 68 aa overlap). Similar to P43914|EX7S_HAEIN
+ EXODEOXYRIBONUCLEASE SMALL SUBUNIT from H. influenzae (84
+ aa), FASTA scores: opt: 126, E(): 0.006, (37.3% identity
+ in 67 aa overlap); and P22938|EX7S_ECOLI
+ EXODEOXYRIBONUCLEASE SMALL SUBUNIT from Escherichia coli
+ (79 aa), FASTA scores: opt: 125, E(): 0.0067, (39.7%
+ identity in 58 aa overlap). BELONGS TO THE XSEB FAMILY.
+ Protein product from Mb1137c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1137c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable exodeoxyribonuclease VII (small
+ subunit) xseB (Exonuclease VII small subunit)"
+ /protein_id="SIT99737.1"
+ /db_xref="GOA:P67457"
+ /db_xref="InterPro:IPR003761"
+ /db_xref="InterPro:IPR037004"
+ /db_xref="UniProtKB/Swiss-Prot:P67457"
+ /translation="MVCDPNGDDTGRTHATVPVSQLGYEACRDELMEVVRLLEQGGLD
+ LDASLRLWERGEQLAKRCEEHLAGARQRVSDVLAGDEAQNG"
+ gene complement(1235612..1236859)
+ /gene="xseA"
+ /locus_tag="BQ2027_MB1138C"
+ CDS complement(1235612..1236859)
+ /gene="xseA"
+ /locus_tag="BQ2027_MB1138C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1138c, xseA, len: 415 aa. Equivalent to Rv1108c,
+ len: 415 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 415 aa overlap). Probable xseA,
+ exodeoxyribonuclease VII large subunit (EC 3.1.11.6) (see
+ first citation below). Equivalent to AL049491|MLCB1222_5
+ Mycobacterium leprae (428 aa) (81.5% identity in 411 aa
+ overlap). Similar to many e.g. P04994|EX7L_ECOLI
+ exodeoxyribonuclease large subunit from Escherichia coli
+ (456 aa), FASTA scores: opt: 581, E(): 1.6 e-30, (30.8%
+ identity in 425 aa overlap); also similar to the
+ exodeoxyribonuclease in Bacillus subtilis, H. influenzae
+ and H. pylori. TBparse score is 0.890. BELONGS TO THE XSEA
+ FAMILY. Protein product from Mb1138c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1138c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EXODEOXYRIBONUCLEASE VII (LARGE
+ SUBUNIT) XSEA (EXONUCLEASE VII LARGE SUBUNIT)"
+ /protein_id="SIT99738.1"
+ /db_xref="GOA:P67448"
+ /db_xref="InterPro:IPR003753"
+ /db_xref="InterPro:IPR020579"
+ /db_xref="InterPro:IPR025824"
+ /db_xref="UniProtKB/Swiss-Prot:P67448"
+ /translation="MTQNSAENPFPVRAVAIRVAGWIDKLGAVWVEGQLAQITMRPDA
+ KTVFMVLRDPAADMSLTVTCSRDLVLSAPVKLAEGVQVVVCGKPSFYTGRGTFSLRLS
+ EIRAVGIGELLARIDRLRRLLDAEGLFDPRLKRPIPYLPNMIGLITGRASAAERDVTT
+ VASARWPAARFAVRNVAVQGPNAVGQIVEALRELDRDPDVDVIVLARGGGSVEDLLPF
+ SDETLCRAIAACRTPVVSAVGHEPDNPLCDLVVDLRAATPTDAAKKVVPDTAAEQRLI
+ DDLRRRSAQALRNWVSREQRAVAQLRSRPVLADPMTMVSVRAEEVHRARSTLRRNLTL
+ MVAAETERIGHLAARLATLGPAATLARGYAIVQTVAQTGPEGGSEPQVLRSVHDAPEG
+ TKLRVRVADGALAAVSEGQTNGL"
+ gene complement(1236856..1237494)
+ /locus_tag="BQ2027_MB1139C"
+ CDS complement(1236856..1237494)
+ /locus_tag="BQ2027_MB1139C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1139c, -, len: 212 aa. Equivalent to Rv1109c,
+ len: 212 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 212 aa overlap). Conserved hypothetical
+ protein, N-terminal domain is hydrophobic, C-terminal half
+ is very rich in Arg. Equivalent to AL049491|MLCB1222_2
+ hypothetical protein from Mycobacterium leprae (379 aa)
+ (46.0% identity in 374 aa overlap). Start changed since
+ first submission. TBparse score is 0.934. Protein product
+ from Mb1139c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1139c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99739.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXE9"
+ /translation="MATAPYGVRLLVGAATVAVEETMKLPRTILMYPMTLASQAAHVV
+ MRFQQGLAELVIKGDNTLETLFPPKDEKPEWATFDEDLPDALEGTSIPLLGLSDASEA
+ KNDDRRSDGRFALYSVSDTPETTTASRSADRSTNPKTAKHPKSAAKPTVPTPAVAAEL
+ DYPALTLAQLRARLHTLDVPELEALLAYEQATKARAPFQTLLANRITRATAK"
+ gene 1237584..1238591
+ /gene="lytB2"
+ /locus_tag="BQ2027_MB1140"
+ CDS 1237584..1238591
+ /gene="lytB2"
+ /locus_tag="BQ2027_MB1140"
+ /note="Mb1140, lytB2, len: 335 aa. Equivalent to Rv1110,
+ len: 335 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 335 aa overlap). Probable lytB2,
+ LytB-related protein, equivalent to AL049491|MLCB1222_3
+ from Mycobacterium leprae (335 aa), FASTA score: (82.9%
+ identity in 333 aa overlap). Also similar to LytB proteins
+ from many bacteria (appears to have N-terminal extension)
+ e.g. P22565|LYTB_ECOLI|B0029|Z0034|ECS0032 LYTB PROTEIN
+ from Escherichia coli strains K12 and O157:H7 (316 aa),
+ FASTA scores: opt: 1041, E():0, (52.4% identity in 309 aa
+ overlap); etc. Also very similar to another LytB-related
+ protein from Mycobacterium tuberculosis:
+ LytB1|Rv3382c|MTV004.40c (329 aa), FASTA scores: opt: 975,
+ E(): 0, (51.3% identity in 312 aa overlap). BELONGS TO THE
+ LYTB FAMILY. Protein product from Mb1140 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1140 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LYTB-RELATED PROTEIN LYTB2"
+ /protein_id="SIT99740.1"
+ /db_xref="GOA:P0A5I1"
+ /db_xref="InterPro:IPR003451"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5I1"
+ /translation="MVPTVDMGIPGASVSSRSVADRPNRKRVLLAEPRGYCAGVDRAV
+ ETVERALQKHGPPVYVRHEIVHNRHVVDTLAKAGAVFVEETEQVPEGAIVVFSAHGVA
+ PTVHVSASERNLQVIDATCPLVTKVHNEARRFARDDYDILLIGHEGHEEVVGTAGEAP
+ DHVQLVDGVDAVDQVTVRDEDKVVWLSQTTLSVDETMEIVGRLRRRFPKLQDPPSDDI
+ CYATQNRQVAVKAMAPECELVIVVGSRNSSNSVRLVEVALGAGARAAHLVDWADDIDS
+ AWLDGVTTVGVTSGASVPEVLVRGVLERLAECGYDIVQPVTTANETLVFALPRELRSP
+ R"
+ gene complement(1238608..1239591)
+ /locus_tag="BQ2027_MB1141C"
+ CDS complement(1238608..1239591)
+ /locus_tag="BQ2027_MB1141C"
+ /note="Mb1141c, -, len: 327 aa. Equivalent to Rv1111c,
+ len: 327 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 327 aa overlap). Conserved hypothetical
+ protein, N-terminal domain is hydrophobic, C-terminal half
+ is very rich in Arg. Equivalent to AL049491|MLCB1222_2
+ hypothetical protein from Mycobacterium leprae (379 aa)
+ (46.0% identity in 374 aa overlap). Start changed since
+ first submission. Protein product from Mb1141c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1141c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Rhomboid family protein"
+ /protein_id="SIT99741.1"
+ /db_xref="GOA:A0A1R3XXE0"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXE0"
+ /translation="MSAQRARSAVQASHRSIHPHIPGVPWWAAILIAVTATAIGYAID
+ AGSGHKALTLVFTGCYIAGCVGAVLAVRQSDLFTALVQPPLILFCAVPGAYWLFHGGT
+ IGKFKDLLINCGYSLIERFPLMLGTAAGVLLIGLVRWYLGTALFDSIARKLSSLMTGD
+ SDDDGGRRSAQRPARTRSRHARPPSEDNREPIAERRSRRRPRPQNDPHPRRNAHERPA
+ PRSSRFDSYRSYQPSEPSGPAEPVNRYERRGARYQPYARYEPTYEPQRRRARPSEPTN
+ PTHHPISQVRYRGSATRDARRDNYREEQRFDRRDRSRAPRRPPAESWEYDV"
+ gene 1239654..1240727
+ /locus_tag="BQ2027_MB1142"
+ CDS 1239654..1240727
+ /locus_tag="BQ2027_MB1142"
+ /note="Mb1142, -, len: 357 aa. Equivalent to Rv1112, len:
+ 357 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 357 aa overlap). Probable GTP binding
+ protein, similar to YCHF_HAEIN|P44681 probable gtp-binding
+ protein (362 aa), FASTA scores: opt: 1189, E(): 0, (52.7%
+ identity in 357 aa overlap). Equivalent to
+ AL049491|MLCB1222_1 hypothetical protein from
+ Mycobacterium leprae (356 aa) (85.9% identity in 354 aa
+ overlap). Contains PS00017 ATP/GTP-binding site motif A
+ (P-loop). Protein product from Mb1142 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable GTP binding protein"
+ /protein_id="SIT99742.1"
+ /db_xref="GOA:A0A1R3XZH6"
+ /db_xref="InterPro:IPR004396"
+ /db_xref="InterPro:IPR006073"
+ /db_xref="InterPro:IPR012675"
+ /db_xref="InterPro:IPR012676"
+ /db_xref="InterPro:IPR013029"
+ /db_xref="InterPro:IPR023192"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR031167"
+ /db_xref="InterPro:IPR041706"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZH6"
+ /translation="MSLSLGIVGLPNVGKSTLFNALTRNNVVAANYPFATIEPNEGVV
+ SLPDPRLDKLAELFGSQRVVPAPVTFVDIAGLIKGASEGAGLGNKFLAHIRECDAICQ
+ VVRVFVDDDVTHVTGRVDPQSDIEVVETELILADLQTLERATGRLEKEARTNKARKPV
+ YDAALRAQQVLDAGKTLFAAGVDAAALRELNLLTTKPFLYVFNADEAVLTDPARVGEL
+ RALVAPADAVFLDAAIESELTELDDESAAELLESIGQSERGLDALARAGFHTLKLQTF
+ LTAGPKEARAWTIHQGDTAPKAAGVIHSDFEKGFIKAEIVSYDDLVAAGSMAAAKAAG
+ KVRIEGKDYVMADGDVVEFRFNV"
+ gene 1240815..1241012
+ /gene="vapb32"
+ /locus_tag="BQ2027_MB1143"
+ CDS 1240815..1241012
+ /gene="vapb32"
+ /locus_tag="BQ2027_MB1143"
+ /note="Mb1143, -, len: 65 aa. Equivalent to Rv1113, len:
+ 65 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 65 aa overlap). Conserved hypothetical
+ protein, similar to Mycobacterium tuberculosis
+ hypothetical protein Rv2758c|AL00896 7|MTV002.23 (88 aa)
+ FASTA scores: opt: 97, E(): 0.86, (33.3% identity in 69 aa
+ overlap). Part of family including Rv2871, Rv1241, Rv2132,
+ Rv3321c, etc. Protein product from Mb1143 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1143 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb32"
+ /protein_id="SIT99743.1"
+ /db_xref="InterPro:IPR019239"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYD1"
+ /translation="MRTTVTVDDALLAKAAELTGVKEKSTLLREGLQTLVRVESARRL
+ AALGGTDPQATAAPRRRTSPR"
+ gene 1241009..1241383
+ /gene="vapc32"
+ /locus_tag="BQ2027_MB1144"
+ CDS 1241009..1241383
+ /gene="vapc32"
+ /locus_tag="BQ2027_MB1144"
+ /note="Mb1144, -, len: 124 aa. Equivalent to Rv1114, len:
+ 124 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 124 aa overlap). Conserved hypothetical
+ protein, slight similarity to Mycobacterium tuberculosis
+ hypothetical proteins MTCY159.08c (33.0% identity in 115
+ aa overlap); Rv1561 and Rv2010. Protein product from
+ Mb1144 detected using shotgun mass spectrometry. Mb1144
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc32. contains pin domain."
+ /protein_id="SIT99744.1"
+ /db_xref="GOA:A0A1R3XXF6"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXF6"
+ /translation="MILVDTSVWIEHLRAADARLVELLGDDEAGCHPLVIEELALGSI
+ KQRDVVLDLLANLYQFPVVTHDEVLRLVGRRRLWGRGLGAVDANLLGSVALVGGARLW
+ TRDKRLKAACAESGVALAEEVS"
+ gene 1241586..1242284
+ /locus_tag="BQ2027_MB1145"
+ CDS 1241586..1242284
+ /locus_tag="BQ2027_MB1145"
+ /note="Mb1145, -, len: 232 aa. Equivalent to Rv1115, len:
+ 232 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 232 aa overlap). Possible exported
+ protein, contains possible N-terminal signal sequence.
+ Mb1145 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE EXPORTED PROTEIN"
+ /protein_id="SIT99745.1"
+ /db_xref="GOA:A0A1R3XXR8"
+ /db_xref="InterPro:IPR038765"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXR8"
+ /translation="MISTTRIDFLWILSVAFAPMIALATLLTLINQVVGTPYIPGGDS
+ PAGTDCSELASWVSNAATARPVFGDRFNTGNEEAALAARGFQQGTAPNALVIGWNGHH
+ TAVTLPDGTPVSSGEGGGVRVGGGGAYQPKFTHHMYLPMDVDAGEDQPPAPDEPVTAV
+ DDVEPEMPAPCPTQRPPVTPRHNLCNKLRTMPGALSAALAAAAPVWPAPISGCRGFST
+ SLLAKRNHPVIVGK"
+ gene 1242402..1242587
+ /locus_tag="BQ2027_MB1146"
+ CDS 1242402..1242587
+ /locus_tag="BQ2027_MB1146"
+ /note="Mb1146, -, len: 61 aa. Equivalent to Rv1116, len:
+ 61 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 61 aa overlap). Hypothetical unknown protein.
+ Mb1146 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99746.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXE7"
+ /translation="MCSRMADEPRLEAGAHPFEEGRDKAPELRATQMDHVRFTEGRRE
+ RNRDRLERSQQFRQPGR"
+ gene complement(1242514..1242789)
+ /locus_tag="BQ2027_MB1147C"
+ CDS complement(1242514..1242789)
+ /locus_tag="BQ2027_MB1147C"
+ /note="Mb1147c, -, len: 91 aa. Equivalent to Rv1116A, len:
+ 91 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 91 aa overlap). Conserved hypothetical protein
+ (possibly gene fragment), similar to C-terminal part of
+ Rv1646|Z85982_9 from Mycobacterium tuberculosis (310 aa),
+ FASTA scores: opt: 301, E(): 9.3e-13, (68.05% identity in
+ 72 aa overlap). Also overlaps gene on other strand,
+ Rv1116, at 3'-end. Mb1147c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PE family protein"
+ /protein_id="SIT99747.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXE2"
+ /translation="MGALGTVRGLQDSNTAFVGALHSGNLLGATGAVLQAPGNAVNGF
+ LFGQTSISQSIDVSPEYGYELVAVSDPVGGTAGSARAGHGYVHADLR"
+ gene 1243032..1243355
+ /locus_tag="BQ2027_MB1148"
+ CDS 1243032..1243355
+ /locus_tag="BQ2027_MB1148"
+ /note="Mb1148, -, len: 107 aa. Equivalent to Rv1117, len:
+ 107 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 107 aa overlap). Conserved hypothetical
+ protein, some similarity to P94425|D50453 hypothetical
+ protein from Bacillus subtilis (95 aa), fasta scores: opt:
+ 128, E(): 5.1e-06, (28.3% identity in 92 aa overlap); and
+ AL117322|SCF1.02 Streptomyces coelicolor (109 aa), FASTA
+ scores: opt: 437, E(): 1.6e-25, (57.5% identity in 106 aa
+ overlap). Protein product from Mb1148 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1148 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99748.1"
+ /db_xref="InterPro:IPR007138"
+ /db_xref="InterPro:IPR011008"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXE3"
+ /translation="MIFIVVKFETKPEWTERWPDLVASFTAATRAEEGNLWFEWSRSL
+ DDPAEYVLVESFRDGEAGGVHVNSDHFRQAMRELPKALASTPKIISQTIDATGWSAMG
+ EMTVG"
+ gene complement(1243370..1244230)
+ /locus_tag="BQ2027_MB1149C"
+ CDS complement(1243370..1244230)
+ /locus_tag="BQ2027_MB1149C"
+ /note="Mb1149c, -, len: 286 aa. Equivalent to Rv1118c,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 286 aa overlap). Conserved hypothetical
+ protein, similar to pseudogene ML0942 in Mycobacterium
+ leprae. Protein product from Mb1149c detected using
+ shotgun mass spectrometry. Mb1149c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99749.1"
+ /db_xref="InterPro:IPR038765"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXF8"
+ /translation="MQSGPHLVGRVGTSFPLIARHQGATRDDAGDTGQPDPLPHVAHP
+ DRLYPPMVHGVDPSTLALDRALNETRTGDLWLFRGRSRPDRAIQTLTNAPVNHVGMTV
+ AIDDLPPLIWHAELGDKLLDVWTGTNHRGVQLNDARQVVQQWAGRYRQRCWLRQLTPH
+ ANRDQEDKLLRVIARMNGTPFPTTARLTGRWLRGRLPTLNDWLRGIPVLDRKVREQTQ
+ RRKQQQRTMGLATAYCAETVAITYEEMGLLVTDKDAHWFDPGKFWSGDSLPLAPGYRL
+ GHEIAVDVGG"
+ gene complement(1244263..1244412)
+ /locus_tag="BQ2027_MB1150C"
+ CDS complement(1244263..1244412)
+ /locus_tag="BQ2027_MB1150C"
+ /EC_number="4.6.1.1"
+ /note="Mb1150c, -, len: 49 aa. Equivalent to Rv1119c, len:
+ 49 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 49 aa overlap). Hypothetical unknown protein."
+ /codon_start=1
+ /transl_table=11
+ /product="Adenylate cyclase (EC"
+ /protein_id="SIT99750.1"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXE6"
+ /translation="MTARVAGQAVGGQILVGEPVHDAVSDCADIRFGSYRLFSLDAAP
+ GPDLD"
+ gene complement(1244409..1244903)
+ /locus_tag="BQ2027_MB1151C"
+ CDS complement(1244409..1244903)
+ /locus_tag="BQ2027_MB1151C"
+ /EC_number="4.6.1.1"
+ /note="Mb1151c, -, len: 164 aa. Equivalent to Rv1120c,
+ len: 164 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 164 aa overlap). Conserved hypothetical
+ protein, some similarity at C-terminus to Mycobacterium
+ tuberculosis hypothetical proteins e.g. Rv1890c|MTCY180.28
+ (462 aa), FASTA scores: opt: 187, E(): 2.2e-05, (36.6%
+ identity in 93 aa overlap) and Rv2488c|YZ19_MYCTU|Q10551
+ (285 aa), FASTA scores: opt: 156, E(): 0.00074, (32.7%
+ identity in 107 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="Adenylate cyclase (EC"
+ /protein_id="SIT99751.1"
+ /db_xref="GOA:A0A1R3XXF0"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXF0"
+ /translation="MLSGGREAVKTVWQTANLVRKEGFGAAVRSSIEDPADWAEVERP
+ DLARVTPDARVVILFSDIEESTALDERIGDRTWVKLIGAHDKLVHELVRRWSGHMVTS
+ QGDGFMIAFARAEQAVRCGIDIQDALRNSAKRKRNQGIRVRIGTTWGARCGTVTICSA
+ ATSQ"
+ gene 1245106..1246506
+ /gene="zwf1"
+ /locus_tag="BQ2027_MB1152"
+ CDS 1245106..1246506
+ /gene="zwf1"
+ /locus_tag="BQ2027_MB1152"
+ /note="Mb1152, zwf1, len: 466 aa. Equivalent to Rv1121,
+ len: 466 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 466 aa overlap). Probable zwf1,
+ glucose-6-phosphate 1-dehydrogenase (EC 1.1.1.49), highly
+ similar to many e.g. G6PD_E COLI|P22992 Escherichia coli
+ (491 aa), FASTA scores: opt: 642, E(): 0, (35.8% identity
+ in 478 aa overlap). Mycobacterium tuberculosis has two
+ genes for ZWF, this one is highly divergent. BELONGS TO
+ THE GLUCOSE-6-PHOSPHATE DEHYDROGENASE FAMILY. Note that
+ previously known as zwf. Protein product from Mb1152
+ detected using SWATH mass spectrometry. Mb1152 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUCOSE-6-PHOSPHATE 1-DEHYDROGENASE
+ ZWF1 (G6PD)"
+ /protein_id="SIT99752.1"
+ /db_xref="GOA:P0A587"
+ /db_xref="InterPro:IPR001282"
+ /db_xref="InterPro:IPR019796"
+ /db_xref="InterPro:IPR022674"
+ /db_xref="InterPro:IPR022675"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P0A587"
+ /translation="MVDGGGGASDLLVIFGITGDLARKMTFRALYRLERHQLLDCPIL
+ GVASDDMSVGQLVKWARESIGRTEKIDDAVFDRLAGRLSYLHGDVTDSQLYDSLAELI
+ GSACRPLYYLEMPPALFAPIVENLANVRLLERARVAVEKPFGHDLASALELNARLRAV
+ LGEDQILRVDHFLGKQPVVELEYLRFANQALAELWDRNSISEIHITMAEDFGVEDRGK
+ FYDAVGALRDVVQNHLLQVLALVTMEPPVGSSADDLNDKKAEVFRAMAPLDPDRCVRG
+ QYLGYTEVAGVASDSATETYVALRTEIDNWRWAGVPIFVRAGKELPAKVTEVRLFLRR
+ VPALAFLPNRRPAEPNQIVLRIDPDPGMRLQISAHTDDSWRDIHLDSSFAVDLGEPIR
+ PYERLLYAGLVGDHQLFAREDSIEQTWRIVQPLLDNPGEIHRYDRGSWGPEAAQSLLR
+ GHRGWQSPWLPRGTDA"
+ gene 1246528..1247550
+ /gene="gnd2"
+ /locus_tag="BQ2027_MB1153"
+ CDS 1246528..1247550
+ /gene="gnd2"
+ /locus_tag="BQ2027_MB1153"
+ /note="Mb1153, gnd2, len: 340 aa. Equivalent to Rv1122,
+ len: 340 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 340 aa overlap). Probable gnd2,
+ 6-phosphogluconate dehydrogenase, decarboxylating (EC
+ 1.1.1.44), highly similar to Q53917 6-PHOSPHOGLUCONATE
+ DEHYDROGENASE from Streptomyces coelicolor (291 aa), fasta
+ scores: opt: 431, E(): 2.2e-20, (44.5% identity in 335 aa
+ overlap). Also similar to Rv1844c|MTCY359.29|gnd1 PROBABLE
+ 6-PHOSPHOGLUCONATE DEHYDROGENASE from Mycobacterium
+ tuberculosis (485 aa), FASTA score: (33.0% identity in 351
+ aa overlap). Note that Rv1844c|MTCY359.29|gnd1 is most
+ similar to gnd's from Gram negative organisms, while gnd2
+ is most similar to gnd's from Gram positive organisms.
+ BELONGS TO THE 6-PHOSPHOGLUCONATE DEHYDROGENASE FAMILY.
+ Protein product from Mb1153 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1153 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable 6-phosphogluconate
+ dehydrogenase,decarboxylating gnd2"
+ /protein_id="SIT99753.1"
+ /db_xref="GOA:A0A1R3XYE0"
+ /db_xref="InterPro:IPR004849"
+ /db_xref="InterPro:IPR006114"
+ /db_xref="InterPro:IPR006115"
+ /db_xref="InterPro:IPR006183"
+ /db_xref="InterPro:IPR008927"
+ /db_xref="InterPro:IPR013328"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYE0"
+ /translation="MQLGMIGLGRMGANIVRRLAKGGHDCVVYDHDPDAVKAMAGEDR
+ TTGVASLRELSQRLSAPRVVWVMVPAGNITTAVIEELANTLEAGDIVIDGGNTYYRDD
+ LRHEKLLFKKGIHLLDCGTSGGVWGRERGYCLMIGGDGDAFARAEPIFATVAPGVAAA
+ PRTPGRDGEVAPSEQGYLHCGPCGSGHFVKMVHNGIEYGMMASLAEGLNILRNADVGT
+ RVQHGDAETAPLPNPECYQYDFDIPEVAEVWRRGSVIGSWLLDLTAIALRESPDLAEF
+ SGRVSDSGEGRWTAIAAIDEGVPAPVLTTALQSRFASRDLDDFANKALSAMRKQFGGH
+ AEKPAN"
+ gene complement(1247543..1248451)
+ /gene="bpoB"
+ /locus_tag="BQ2027_MB1154C"
+ CDS complement(1247543..1248451)
+ /gene="bpoB"
+ /locus_tag="BQ2027_MB1154C"
+ /note="Mb1154c, bpoB, len: 302 aa. Equivalent to Rv1123c,
+ len: 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 302 aa overlap). Possible bpoB,
+ peroxidase (non-haem peroxidase) (EC 1.11.1.-), with some
+ similarity to a range of enzymes from several organisms
+ including: DEH1_MORSP|Q01398 haloacetate dehalogenase (EC
+ 3.8.1.3) from Moraxella sp. (294 aa), FASTA scores: opt:
+ 201, E(): 2.1e-06, (35.8% identity in 134 aa overlap); and
+ BPA1_STRAU|P33912 non-haem bromoperoxidase bpo-a1 (EC
+ 1.11.1.-) from Streptomyces aureofaciens (274 aa), FASTA
+ scores: opt: 187, E(): 1.6e-05, (23.1% identity in 281 aa
+ overlap). Similar to several other Mycobacterium
+ tuberculosis proteins, probable epoxide hydrolases and
+ non-heme bromoperoxidases e.g. Rv1938, Rv3617, Rv3473c,
+ Rv3171c, etc. Contains PS00216 Sugar transport proteins
+ signature 1. Protein product from Mb1154c detected using
+ SWATH mass spectrometry. Mb1154c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PEROXIDASE BPOB (NON-HAEM PEROXIDASE)"
+ /protein_id="SIT99754.1"
+ /db_xref="GOA:A0A1R3XXG7"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXG7"
+ /translation="MTIWRVPSKVTSGPVSAVSSSPQAVAFSGARGITLVADEWNRGA
+ AAADRPTILMLHGGGQNRFSWKNTGQILADEGHHVVALDTRGPGDSDRAPGADYAVET
+ PTTDVLHVVEAIGRRVVVVEASMGGLTGILVAERAGPQTVNGLVLVDVVPRYEKEGNA
+ RIRDFMLGNIDGFGSLEEAADAVAEYLPHRDKPRSPEGLKRNLRLRDGRWHWHWDPAM
+ MTAPGHDPQLRTENFERAAMGLTIPVLLIRGKLSDVVSSDGARDFLAKVPNAEFVELS
+ NAGRTAAGDDNDAFTDVVVDFVRRLS"
+ gene 1248526..1249476
+ /gene="ephC"
+ /locus_tag="BQ2027_MB1155"
+ CDS 1248526..1249476
+ /gene="ephC"
+ /locus_tag="BQ2027_MB1155"
+ /note="Mb1155, ephC, len: 316 aa. Equivalent to Rv1124,
+ len: 316 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 316 aa overlap). Probable ephC, epoxide
+ hydrolase (EC 3.3.2.3) (see citation below), similar to
+ Q42566 epoxide hydrolase from Arabidopsis thaliana (321
+ aa), FASTA scores: opt: 298, E(): 8.2e-13, (27.6% identity
+ in 333 aa overlap). Similar to other Mycobacterium
+ tuberculosis epoxide hydrolases and non-heme
+ bromoperoxidases e.g. Rv1938, Rv3617, Rv3670, Rv3473c,
+ etc. Protein product from Mb1155 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1155
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EPOXIDE HYDROLASE EPHC (EPOXIDE
+ HYDRATASE)"
+ /protein_id="SIT99755.1"
+ /db_xref="GOA:A0A1R3XXS8"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR000639"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXS8"
+ /translation="MRAGRGERESTWRTTMAEPHWIDVKGPNGDLKALTWGPAGAPVA
+ LCLHGFPDTAYGWRKVAPRLAESGWHVVAPFMRGYAPSSIPADGSYHVGALMHDALRV
+ RSAAGGTERDVIIGHDWGAIAATGLAAMPDSPFAKAVIMSVPPSAAFRPLGRVPERGR
+ LLRELPHQLLRSWYILYFQLPWLPERSASWVVPLLWRRWSPGYHAEEDLRHVDAAIGT
+ PEGRRAALGPYRATMRNTRAPADYADLNRLWTEAPKLPVLYLHGHDDGCATSAFTHWT
+ ARVLPAGSEVAVVEHAGHFLQLEQPDKIAELIVAFIGSPG"
+ gene 1249481..1250725
+ /locus_tag="BQ2027_MB1156"
+ CDS 1249481..1250725
+ /locus_tag="BQ2027_MB1156"
+ /note="Mb1156, -, len: 414 aa. Equivalent to Rv1125, len:
+ 414 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 414 aa overlap). Conserved hypothetical
+ protein. Similar to AL133278|SCM11.13 hypothetical protein
+ from Streptomyces coelicolor (446 aa), FASTA scores: opt:
+ 182, E(): 0.0005, (28.1% identity in 437 aa overlap).
+ Protein product from Mb1156 detected using SWATH mass
+ spectrometry. Mb1156 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99756.1"
+ /db_xref="GOA:A0A1R3XXF7"
+ /db_xref="InterPro:IPR009721"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXF7"
+ /translation="MAGHRMAAVDAQFYWMSAKVPNDQFLLYAFDGEPTDLERAVAQV
+ YRRARGCPGLGMRVQDRGALAYPQWVPTPVQRDQLVCHDLADRSWQGCLAAVVGLAGK
+ QLDMRRMPWRLHVFTPVHDVPGVSGLGTVAVMQFAHALGDGARASAMAAWLFGRPAAV
+ PEIARSRAGFLPWRAAHAARAHLRLVRDTNAGLVAPGVGSRPPLSTNARPEGVRAVRT
+ LLRRRSQLAGPTVTVTVLAAVSTGLLGLLGGDVDTLGAEVPMAKPGVPRSYNHFGNVV
+ VGLYPRLEPDERVRRIATDLANARRRFEHPAMLSADRAFAAVPAALLRWGVSQFDAEV
+ RPVRVAGNTVVSSVYRGAADLSFGDAPVVLTAGYPALSPAMGLTHGVHGIGDTVAISV
+ HAAESAVSDIDAYMRLLDAALQ"
+ gene complement(1250729..1251334)
+ /locus_tag="BQ2027_MB1157C"
+ CDS complement(1250729..1251334)
+ /locus_tag="BQ2027_MB1157C"
+ /note="Mb1157c, -, len: 201 aa. Equivalent to Rv1126c,
+ len: 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 201 aa overlap). Conserved hypothetical
+ protein, similar in N-terminus to O05567|MLCB33.17
+ hypothetical protein from Mycobacterium leprae (141 aa),
+ FASTA scores: opt: 332, E(): 1.4e-23, (58.4% identity in
+ 101 aa overlap). Protein product from Mb1157c detected
+ using shotgun mass spectrometry. Mb1157c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99757.1"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXF2"
+ /translation="MSELTVLQAVRLKGRVITTDLAQTLGEDLADVAATVDRLTAAGL
+ LVDATPLRISPSGRMRLDDLLAEERNRADSTVLAAAYRDFRSVNADFKRLVTDWQLKG
+ EKPNTHDDAEYDAAVLSRLDGVHRRVGPIIGTVAMQLPRLSRYPVKLRAALDKVKAGD
+ IAWLTRPLIDSYHTVWFELHEELIQAVGLTRDEAAKSGDAQ"
+ gene complement(1251331..1252803)
+ /gene="ppdK"
+ /locus_tag="BQ2027_MB1158C"
+ CDS complement(1251331..1252803)
+ /gene="ppdK"
+ /locus_tag="BQ2027_MB1158C"
+ /note="Mb1158c, ppdK, len: 490 aa. Equivalent to Rv1127c,
+ len: 490 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 490 aa overlap). Probable ppdK,
+ Pyruvate, phosphate dikinase (EC 2.7.9.1). Equivalent (but
+ shorter) to Z94723|MLCB33_16 ppdK from Mycobacterium
+ leprae (601 aa) (71.8% identity in 478 aa overlap). Highly
+ similar to N-terminus of PODK_CLOSY|P22983 pyruvate,
+ phosphate dikinase from Clostridium symbiosum (873 aa),
+ FASTA scores: opt: 786, E(): 0, (37.4% identity in 514 aa
+ overlap). Protein product from Mb1158c detected using
+ SWATH mass spectrometry. Mb1158c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PYRUVATE, PHOSPHATE DIKINASE PPDK"
+ /protein_id="SIT99758.1"
+ /db_xref="GOA:A0A1R3XXF3"
+ /db_xref="InterPro:IPR002192"
+ /db_xref="InterPro:IPR008279"
+ /db_xref="InterPro:IPR010121"
+ /db_xref="InterPro:IPR013815"
+ /db_xref="InterPro:IPR036637"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXF3"
+ /translation="MTRITRANGCPDGTLENAVVALDGGANYPREILGNKGHGIDMMR
+ RHHLPVPPAFCITTEVGVRYLAAPESTIAAIWDDVLDRMSWLETETSCTFGRGPNPLL
+ VSVRSGATQSMPGMMDTILDVGMTDAVERVLARPGAADFAHDTRRRFTSMYRRIVGSA
+ GPITDDPYAQLRASIEAVFASWNSPRAVAYRDHHGLDDQGGTAVVVQAMVFGNLTANS
+ GAGVLSSRNPITGANEPFGEWLPGGQGDDVVSGLVAVAPITALRDQQPAVYDQLMAAA
+ RSLERMAGDVQEIEFTVEDSQLWLLQTRGAERSAQAAVRLALQLHHEGLIDDTETLRR
+ VTPTHIETLLRPSLQPETRLAAPLLAKGLPACPGVVSGTAYTEVDEALDAADRGEPVI
+ LVRDHTRPEDVMGMLAAQGIVTEVGGAASHAAVVSRELGRVAVVGCGPGVAAALAGKE
+ ITVDGYEGEVRQGVLALSAWSESDTPELRELADIAQRISS"
+ gene complement(1253016..1254371)
+ /locus_tag="BQ2027_MB1159C"
+ CDS complement(1253016..1254371)
+ /locus_tag="BQ2027_MB1159C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1159c, -, len: 451 aa. Equivalent to Rv1128c,
+ len: 451 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 451 aa overlap). Conserved hypothetical
+ protein, in REP13E12 degenerate repeat, highly similar to
+ several Mycobacterium tuberculosis proteins in REP13E12
+ repeats e.g. Rv1148c, Rv1945, Rv3467, etc. Mb1159c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="13E12 repeat family protein"
+ /protein_id="SIT99759.1"
+ /db_xref="InterPro:IPR003615"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXG5"
+ /translation="MCSTREEITEAFASLATALSRVLGLTFDALTTPERLALLEHCET
+ ARRQLPSVEHTLINQIGEQSTEEELGGKLGLTLADRLRITRSEAKRRVAEAADLGQRR
+ ALTGEPLPPLLTATAKAQRHGLIGDGHVEVIRAFVHRLPSWVDLKTLEKAERDLAKQA
+ TQYRPDQLAKLAARIMDCLNPDGDYTDEDRARRRGLTLGKQDVDGMSRLSGYVTPELR
+ ATIEAVWAKLAAPGMCNPEQKAPCVNGAPSKEQARRDTRSCPQRNHDALNAGLRSLLT
+ SGNLGQHNGLPASIIVTTTLKDLEAAAGAGLTGGGTILPISDVIRLARHANHYLAIFD
+ RGKALALYHTKRLASPAQRIMLYAKDSGCSAPGCDVPGYYCEVHHVTPYAQCRNTDVN
+ DLTLGCGGHHPLAERGWTTRKNAHGDTEWLPPPHLDHGQPRVNTFHHPEKLLADDEGD
+ P"
+ repeat_region complement(1253016..1254371)
+ /locus_tag="BQ2027_MB1159C"
+ /note="REP-3, len: 1356 nt. Equivalent to REP, len: 1325
+ nt, from Mycobacterium tuberculosis strain H37RV, (99.9%
+ identity in 1325 nt overlap). REP22G8, member of REP13E12
+ family."
+ /rpt_family="REP"
+ gene complement(1254473..1255933)
+ /locus_tag="BQ2027_MB1160C"
+ CDS complement(1254473..1255933)
+ /locus_tag="BQ2027_MB1160C"
+ /note="Mb1160c, -, len: 486 aa. Equivalent to Rv1129c,
+ len: 486 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 486 aa overlap). Possible
+ transcriptional regulator protein, similar to
+ Rv0465c|MTV038.09c Mycobacterium tuberculosis (474 aa),
+ FASTA scores: E(): 0, (47.4% identity in 468 aa overlap).
+ Helix turn helix motif present from aa 32-53. Protein
+ product from Mb1160c detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATOR PROTEIN"
+ /protein_id="SIT99760.1"
+ /db_xref="GOA:A0A1R3XXF4"
+ /db_xref="InterPro:IPR001387"
+ /db_xref="InterPro:IPR010359"
+ /db_xref="InterPro:IPR010982"
+ /db_xref="InterPro:IPR018653"
+ /db_xref="InterPro:IPR026281"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXF4"
+ /translation="MTRSNVLPVARTYSRTFSGARLRRLRQERGLTQVALAKALDLST
+ SYVNQLENDQRPITVPVLLLLTERFDLSAQYFSSDSDARLVADLSDVFTDIGVEHAVS
+ GAQIEEFVARMPEVGHSLVAVHRRLRAATEELEGYRSRATAETELPPARPMPFEEVRD
+ FFYDRNNYIHDLDMAAERMFTESGMRTGGLDIQLAELMRDRFGISVVIDDNLPDTAKR
+ RYHPDTKVLRVAHWLMPGQRAFQIATQLALVGQSDLISSIVATDDQLSTEARGVARIG
+ LANYFAGAFLLPYREFHRAAEQLRYDIDLLGRRFGVGFETVCHRLSTLQRPRQRGIPF
+ IFVRTDKAGNISKRQSATAFHFSRVGGSCPLWVVHDAFAQPERIVRQVAQMPDGRSYF
+ WVAKTTAADGLGYLGPHKNFAVGLGCDLAHAHKLVYSTGVVLDDPSTEVPIGAGCKIC
+ NRTSCAQRAFPYLGGRVAVDENAGSSLPYSSTEQSV"
+ gene 1255954..1257534
+ /gene="prpD"
+ /locus_tag="BQ2027_MB1161"
+ CDS 1255954..1257534
+ /gene="prpD"
+ /locus_tag="BQ2027_MB1161"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1161, -, len: 526 aa. Equivalent to Rv1130, len:
+ 526 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 526 aa overlap). Conserved hypothetical
+ protein, some similarity to AP000063|AP000063_192
+ hypothetical protein from Aeropyrum pernix (479 aa), FASTA
+ scores: opt: 717, E(): 0, (34.3% identity in 443 a a
+ overlap), and to PRPD_ECOLI|P77243 prpd protein from
+ Escherichia coli (483aa), FASTA scores: opt: 234, E():
+ 3.3e-08, (27.0% identity in 429 aa overlap). Protein
+ product from Mb1161 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1161 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible methylcitrate dehydratase prpD"
+ /protein_id="SIT99761.1"
+ /db_xref="GOA:A0A1R3XXG0"
+ /db_xref="InterPro:IPR005656"
+ /db_xref="InterPro:IPR036148"
+ /db_xref="InterPro:IPR042183"
+ /db_xref="InterPro:IPR042188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXG0"
+ /translation="MPGQDTKVRLFRVFCWCPVLRMVRIMLMHAVRAWRSADDFPCTE
+ HMAYKIAQVAADPVDVDPEVADMVCNRIIDNAAVSAASMVRRPVTVARHQALAHPVRH
+ GAKVFGVEGSYSADWAAWANGVAARELDFHDTFLAADYSHPADNIPPLVAVAQQLGVC
+ GAELIRGLVTAYEIHIDLTRGICLHEHKIDHVAHLGPAVAAGIGTMLRLDQETIYHAI
+ GQALHLTTSTRQSRKGAISSWKAFAPAHAGKVGIEAVDRAMRGEGSPAPIWEGEDGVI
+ AWLLAGPEHTYRVPLPAPGEPKRAILDSYTKQHSAEYQSQAPIDLACRLRERIGDLDQ
+ IASIVLHTSHHTHVVIGTGSGDPQKFDPDASRETLDHSLPYIFAVALQDGCWHHERSY
+ APERARRSDTVALWHKISTVEDPEWTRRYHCADPAKKAFGARAEVTLHSGEVIVDELA
+ VADAHPLGTRPFERKQYVEKFTELADGVVEPVEQQRFLAVVESLADLESGAVGGLNVL
+ VDPRVLDKAPVIPPGIFR"
+ gene 1257531..1258712
+ /gene="prpc"
+ /locus_tag="BQ2027_MB1162"
+ CDS 1257531..1258712
+ /gene="prpc"
+ /locus_tag="BQ2027_MB1162"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1162, gltA1, len: 393 aa. Equivalent to Rv1131,
+ len: 393 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 393 aa overlap). Probable gltA1, citrate
+ synthase 1 (EC 4.1.3.7), highly similar to
+ CISY_MYCSM|P26491 citrate synthase from Mycobacterium
+ smegmatis (375 aa), FASTA scores: opt:1942, E(): 0, (80.0%
+ identity in 375 aa overlap). Also similar to two other M.
+ tuberculosis citrate synthases, Rv0896c|MTCY31.24|gltA2
+ (431 aa), FASTA score: (33.1% identity in 381 aa overlap)
+ and Rv0889|MTCY31.17c|citA (373 aa), FASTA score: (31.8%
+ identity in 371 aa overlap). Contains PS00480 Citrate
+ synthase signature. BELONGS TO THE CITRATE SYNTHASE
+ FAMILY. Protein product from Mb1162 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1162
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable methylcitrate synthase prpc"
+ /protein_id="SIT99762.1"
+ /db_xref="GOA:A0A1R3XZI5"
+ /db_xref="InterPro:IPR002020"
+ /db_xref="InterPro:IPR011278"
+ /db_xref="InterPro:IPR016142"
+ /db_xref="InterPro:IPR016143"
+ /db_xref="InterPro:IPR019810"
+ /db_xref="InterPro:IPR024176"
+ /db_xref="InterPro:IPR036969"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZI5"
+ /translation="MTGPLAAARSVAATKSMTAPTVDERPDIKKGLAGVVVDTTAISK
+ VVPQTNSLTYRGYPVQDLAARCSFEQVAFLLWRGELPTDAELALFSQRERASRRVDRS
+ MLSLLAKLPDNCHPMDVVRTAISYLGAEDPDEDDAAANRAKAMRMMAVLPTIVAIDMR
+ RRRGLPPIAPHSGLGYAQNFLHMCFGEVPETAVVSAFEQSMILYAEHGFNASTFAARV
+ VTSTQSDIYSAVTGAIGALKGRLHGGANEAVMHDMIEIGDPANAREWLRAKLARKEKI
+ MGFGHRVYRHGDSRVPTMKRALERVGTVRDGQRWLDIYQVLAAEMASATGILPNLDFP
+ TGPAYYLMGFDIASFTPIFVMSRITGWTAHIMEQATANALIRPLSAYCGHEQRVLPGT
+ F"
+ gene 1258724..1260454
+ /locus_tag="BQ2027_MB1163"
+ CDS 1258724..1260454
+ /locus_tag="BQ2027_MB1163"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1163, -, len: 576 aa. Equivalent to Rv1132, len:
+ 576 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 576 aa overlap). Conserved membrane
+ protein, similar to O06827|Rv1431|MTCY493.23C membrane
+ protein from Mycobacterium tuberculosis (589 aa), fasta
+ scores: opt: 1811, E(): 0, (48.2% identity in 585 aa
+ overlap). Protein product from Mb1163 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1163 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIT99763.1"
+ /db_xref="GOA:A0A1R3XYE9"
+ /db_xref="InterPro:IPR021941"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYE9"
+ /translation="MGFLQPRLPDIDLAEWSQGSRSQKIRPMAQHWAEVGFGTPVLLH
+ LFYVAKILLYVLVGWLIVLTTKGIDGFTDAAAWYAEPIVFEKVVLYTMLFEVIGLGCG
+ FGPLNNRFFPPMGSILYWMRFGTIRLPPWPDRVPWTRGTKRKPVDVALYALLVMMLLS
+ ALFTDGAGPIPELGTMVGLLPAWQIVLILLLLGVLGLRDKVIFLAARGEVYATLTVTF
+ LFGRLNGIDMIVAAKLVFLVIWIGAATSKLNRHFPFVISTMMSNNPLFRPRFIKRMFF
+ KKFPGDLRPGLLSRIVAHVSTVIEMCVPVVLFVAHGGWPTVVAATIMVCFHLGILTAI
+ PMGVPLEWNVFMIFGVLSLFVGHACLGLADVKNPVPLAILIAVVAGIVIAGNVFPRKI
+ SFLAAMRYYAGNWDTTLWCIKPSAEDKINRGIVAIASMPAAQLERFYGKDRAQIPMYL
+ GYAFRAMNSHGRALFTLAHRAMAGHDEDDYVITDGERVCSTAVGWNFGDGHLHNEQLI
+ AAMQQRCGFQPGEVRVVLLDAQPIHRQTQEYRLVDAATGEFERGYVRVADMVNRQPWD
+ DDVPVHVLPG"
+ gene complement(1260466..1262745)
+ /gene="metE"
+ /locus_tag="BQ2027_MB1164C"
+ CDS complement(1260466..1262745)
+ /gene="metE"
+ /locus_tag="BQ2027_MB1164C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1164c, metE, len: 759 aa. Equivalent to Rv1133c,
+ len: 759 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 759 aa overlap). Probable metE,
+ 5-methyltetrahydropteroyltriglutamate--homocysteine
+ methyltransferase (EC 2.1.1.14), highly similar to others
+ e.g. METE_ECOLI|P25665 Escherichia coli (752 aa), FASTA
+ scores: opt: 2251, E(): 0, (48.1% identity in 756 aa
+ overlap). Equivalent to Z94723|MLCB33_14 metE from M.
+ leprae (760 aa) (85.3% identity in 755 aa overlap).
+ BELONGS TO THE VITAMIN-B12 INDEPENDENT METHIONINE SYNTHASE
+ FAMILY. Protein product from Mb1164c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1164c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE
+ 5-METHYLTETRAHYDROPTEROYLTRIGLUTAMATE--HOMOCYSTEINE
+ METHYLTRANSFERASE METE (methionine synthase, vitamin-B12
+ independent isozyme)"
+ /protein_id="SIT99764.1"
+ /db_xref="GOA:P65341"
+ /db_xref="InterPro:IPR002629"
+ /db_xref="InterPro:IPR006276"
+ /db_xref="InterPro:IPR013215"
+ /db_xref="InterPro:IPR038071"
+ /db_xref="UniProtKB/Swiss-Prot:P65341"
+ /translation="MTQPVRRQPFTATITGSPRIGPRRELKRATEGYWAGRTSRSELE
+ AVAATLRRDTWSALAAAGLDSVPVNTFSYYDQMLDTAVLLGALPPRVSPVSDGLDRYF
+ AAARGTDQIAPLEMTKWFDTNYHYLVPEIGPSTTFTLHPGKVLAELKEALGQGIPARP
+ VIIGPITFLLLSKAVDGAGAPIERLEELVPVYSELLSLLADGGAQWVQFDEPALVTDL
+ SPDAPALAEAVYTALCSVSNRPAIYVATYFGDPGAALPALARTPVEAIGVDLVAGADT
+ SVAGVPELAGKTLVAGVVDGRNVWRTDLEAALGTLATLLGSAATVAVSTSCSTLHVPY
+ SLEPETDLDDALRSWLAFGAEKVREVVVLARALRDGHDAVADEIASSRAAIASRKRDP
+ RLHNGQIRARIEAIVASGAHRGNAAQRRASQDARLHLPPLPTTTIGSYPQTSAIRVAR
+ AALRAGEIDEAEYVRRMRQEITEVIALQERLGLDVLVHGEPERNDMVQYFAEQLAGFF
+ ATQNGWVQSYGSRCVRPPILYGDVSRPRAMTVEWITYAQSLTDKPVKGMLTGPVTILA
+ WSFVRDDQPLADTANQVALAIRDETVDLQSAGIAVIQVDEPALRELLPLRRADQAEYL
+ RWAVGAFRLATSGVSDATQIHTHLCYSEFGEVIGAIADLDADVTSIEAARSHMEVLDD
+ LNAIGFANGVGPGVYDIHSPRVPSAEEMADSLRAALRAVPAERLWVNPDCGLKTRNVD
+ EVTASLHNMVAAAREVRAG"
+ gene 1263321..1263557
+ /locus_tag="BQ2027_MB1165"
+ CDS 1263321..1263557
+ /locus_tag="BQ2027_MB1165"
+ /note="Mb1165, -, len: 78 aa. Equivalent to Rv1134, len:
+ 78 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 78 aa overlap). Hypothetical unknown protein.
+ Mb1165 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99765.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXT7"
+ /translation="MAAYQKFGQEHAAAIRGGAVLHPTATATTVRVTGARGGDVVTGD
+ GPYEAADLDEQGPFPMETVYLWEDGPNGTTRMTL"
+ gene complement(1263671..1265527)
+ /gene="PPE16"
+ /locus_tag="BQ2027_MB1166C"
+ CDS complement(1263671..1265527)
+ /gene="PPE16"
+ /locus_tag="BQ2027_MB1166C"
+ /note="Mb1166c, PPE16, len: 618 aa. Equivalent to Rv1135c,
+ len: 618 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 618 aa overlap). Member of the M.
+ tuberculosis PPE family of glycine-rich proteins. Similar
+ to Rv2356c (59.6% identity in 627 aa overlap); etc.
+ Mb1166c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe16"
+ /protein_id="SIT99766.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR002989"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXG8"
+ /translation="MSFLVLPPEVNSALMFAGAGSGPTLAAAAAWDGLAAELGQAANS
+ FSSATAALADTAWQGPAATAMAAAAAPYASWLSTAATRALSAAAQAKAAAAVYEAARA
+ ATVDPLLVAANRHQLVSLVLSNLFGQNAPAIAATEAAYEQLWAADVAAMVSYHSGASA
+ VAAQLAPWAQAVRALPNPTAPALASGPAALAIPALGIGNTGIGNIFSIGNIGDYNLGN
+ GNTGNANLGSGNTGQANLGSGNTGFFNFGSGNTANTNFGSGNLGNLNLGSGNDGNGNF
+ GLGNIGDGNRGSGNVGSFNFGTANAGSFNVGSANHGSPNVGFANLGNNNLGIANLGNN
+ NLGIANLGNNNIGIGLTGDNMIGIGALNSGIGNLGFGNSGNNNIGLFNSGNNNIGFFN
+ SGDSNFGFFNSGDTNTGFGNAGFTNTGFGNAGSGNFGFGNAGNNNFGFGNSGFENMGV
+ GNSGAYNTGSFNSGTLNTGDLNSGDFNTGWANSGDINTGGFHSGDLNTGFGSPVDQPV
+ MNSGFGNIGTGNSGFNNSGDANSGFQNTNTGAFFIGHSGLLNSGGGQHVGISNSGTGF
+ NTGLFNTGFNNTGIGNSATNAAFTTTSGVANSGDNSSGGFNAGNDQSGFFDG"
+ gene 1265713..1265955
+ /locus_tag="BQ2027_MB1167"
+ CDS 1265713..1265955
+ /locus_tag="BQ2027_MB1167"
+ /note="Mb1167, -, len: 80 aa. Equivalent to Rv1135A, len:
+ 80 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 80 aa overlap). Possible acetyl-CoA
+ acetyltransferase (EC 2.3.1.9) (possible gene fragment),
+ highly similar to other acetyl-CoA acetyltransferases e.g.
+ C-terminal part of
+ Rv3556c|Z92774|MTCY6G11_2|MTCY06G11.03|fadA6 ACETYL-COA
+ ACETYLTRANSFERASE from Mycobacterium tuberculosis (386
+ aa), FASTA scores: opt: 219, E(): 5.7e-09, (63.6% identity
+ in 55 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ACETYL-COA ACETYLTRANSFERASE
+ (ACETOACETYL-COA THIOLASE)"
+ /protein_id="SIT99767.1"
+ /db_xref="GOA:A0A1R3XXG1"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020617"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXG1"
+ /translation="MQLGNQNTMRFAGRPQRFRQSAYPLFNPNSAIALGHPFGGSGAR
+ LMTTVLHHMPDKGIRYGLQTMCEGRGQANATIVELL"
+ gene 1266005..1266346
+ /locus_tag="BQ2027_MB1168"
+ CDS 1266005..1266346
+ /locus_tag="BQ2027_MB1168"
+ /note="Mb1168, -, len: 113 aa. Equivalent to Rv1136, len:
+ 113 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 113 aa overlap). Probable enoyl-CoA
+ hydratase (possible gene fragment) (EC 5.-.-.-). Some
+ similarity to N-terminus of carnitine racemases and
+ enoyl-CoA hydratases (but much shorter) e.g. I41014
+ carnitine racemase from Escherichia coli (297 aa), FASTA
+ scores: opt: 258, E(): 2.5e-11, (44.5% identity in 110 aa
+ overlap); and Rv0222 putative enoyl-CoA hydratase from M.
+ tuberculosis (262 aa). Mb1168 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ENOYL-COA HYDRATASE"
+ /protein_id="SIT99768.1"
+ /db_xref="GOA:A0A1R3XXG3"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXG3"
+ /translation="MVITINRPEARNAVNGAVSIVVGDALEEAHDNPDVRAVVITGAG
+ DKSLCAGADLKAIARRENPYHPHHGEWGIAGYRHHFIDKPTSAAVSGTALDDGAEPAL
+ ASDLVVADEHT"
+ gene complement(1266486..1266854)
+ /locus_tag="BQ2027_MB1169C"
+ CDS complement(1266486..1266854)
+ /locus_tag="BQ2027_MB1169C"
+ /note="Mb1169c, -, len: 122 aa. Equivalent to Rv1137c,
+ len: 122 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 122 aa overlap). Hypothetical unknown
+ protein. Mb1169c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99769.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXH5"
+ /translation="MLSARCHIRHIGSPGKDARCAHLSATLRPGIGISPTNVGNATVL
+ ADGTPAKPIQGAETMQRARHTGSCFSANARGPAISSGNPSRAGCGVPSSTTTPSSTPQ
+ AIRLLACTDSDALTVTRTAR"
+ gene complement(1266871..1267887)
+ /locus_tag="BQ2027_MB1170C"
+ CDS complement(1266871..1267887)
+ /locus_tag="BQ2027_MB1170C"
+ /note="Mb1170c, -, len: 338 aa. Equivalent to Rv1138c,
+ len: 338 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 338 aa overlap). Possible oxidoreductase
+ (EC 1.-.-.-), similar to Q9EWQ8 PUTATIVE OXIDOREDUCTASE
+ from Streptomyces coelicolor (343 aa). Also similar to
+ many Mycobacterium tuberculosis hypothetical proteins e.g.
+ Rv1751|P72008|MTCY04C12.35 (412 aa), fasta scores: opt:
+ 89, E(): 4.5e-09, (24.6% identity in 358 aa overlap).
+ Mb1170c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible oxidoreductase"
+ /protein_id="SIT99770.1"
+ /db_xref="GOA:A0A1R3XXG4"
+ /db_xref="InterPro:IPR002938"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXG4"
+ /translation="MTSYDTDLLVVGGGPGGLATALHARARGLSVIVAEPRENPIDKA
+ CGEGLMPGGLAELTSLGVDPVGLPFHGIAYVGEHRRVQARFRTGPGRGVRRTTLHAAL
+ AARAKEQDTEWIRSRVATIQQDAHGVTAAGVRAKWLVAADGLHSAVRRAVGIKATAGT
+ PRRYGVRWHYRLPVWSDFVEVHWSRWGEAYVTPVEPDLVGVAILSRQRPELAWFPSLA
+ HHLQDASRGHARGCGPLRQVVSRRVAGRVLLVGDAAGYEDALTGEGISLAVKQAAAAV
+ SAIVDDTPASYEAAWHRITRDYRLVTRGLVLASTPRAARRAIVPLCALLPTAFRYGVN
+ ILAY"
+ gene complement(1267884..1268384)
+ /locus_tag="BQ2027_MB1171C"
+ CDS complement(1267884..1268384)
+ /locus_tag="BQ2027_MB1171C"
+ /note="Mb1171c, -, len: 166 aa. Equivalent to Rv1139c,
+ len: 166 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 166 aa overlap). Conserved hypothetical
+ membrane protein. Highly similar to P54158|YBPQ_BACSU
+ hypothetical Bacillus subtilis protein, YBPQ (168 aa),
+ FASTA scores: opt: 446, E(): 2.2e-26, (38.4% identity in
+ 164 aa overlap). Some similarity to Mycobacterium
+ tuberculosis hypothetical proteins, Rv0740, Rv0750.
+ Protein product from Mb1171c detected using SWATH mass
+ spectrometry. Mb1171c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL MEMBRANE PROTEIN"
+ /protein_id="SIT99771.1"
+ /db_xref="GOA:A0A1R3XXH0"
+ /db_xref="InterPro:IPR007269"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXH0"
+ /translation="MYYLLILAVVFERLAELVVAQRNARWSFAQGGKEFGRPHYVVMV
+ ILHTALLLGCVVEPWALHRPFIPWLGWPMLAVVVASQGLRWWCVKSLGKRWNTRVIVL
+ PHATLVRRGPYRWMRHPNYVAVVAEGFALPLVHTAWLTALVFTLANATLLTVRLRVEN
+ SVLGYI"
+ gene 1268746..1269594
+ /locus_tag="BQ2027_MB1172"
+ CDS 1268746..1269594
+ /locus_tag="BQ2027_MB1172"
+ /note="Mb1172, -, len: 282 aa. Equivalent to Rv1140, len:
+ 282 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 282 aa overlap). Probable integral
+ membrane protein. Weak similarity in C-terminus to
+ hypothetical Escherichia coli proteins YPRA and YPRB,
+ possibly membrane-bound e.g. YPRA_ECOLI HYPOTHETICAL 24.3
+ KD PROTEIN (URF 1) (217 aa), FASTA scores: opt: 166, E():
+ 0.00062, (31.0% identity in 158 aa overlap). Protein
+ product from Mb1172 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1172 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99772.1"
+ /db_xref="GOA:A0A1R3XZK2"
+ /db_xref="InterPro:IPR003675"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZK2"
+ /translation="MPRDYTAPRWAHAWAGEPRPARWHPANQPAHPDHSNRESPACMS
+ QSTTPYRSSVLAEFRRAITNVAVPHHEPPGIVRRRRVVVGVTLVIGAVMLGFSLRRTP
+ GESSFYWLTLALAAVWIAGALMSGPLHLGGICWRGRNQRPVITGTTVGLLLAGIFGVG
+ AMIVRAIPGAAEPIARVLQFAHQGTLLPILLITLINGIAEEMFFRGALYTALGRRYPV
+ TISTVLYVGATMASANLMLGFAAIFVGTVCALERRASGGVLAPILTHFVWGLIMVFAL
+ PPLFAV"
+ gene complement(1269602..1270408)
+ /gene="echA11"
+ /locus_tag="BQ2027_MB1173C"
+ CDS complement(1269602..1270408)
+ /gene="echA11"
+ /locus_tag="BQ2027_MB1173C"
+ /note="Mb1173c, echA11, len: 268 aa. Equivalent to
+ Rv1141c, len: 268 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 268 aa overlap). Probable
+ echA11, enoyl-CoA hydratase (EC 4.2.1.17), similar to
+ others e.g. P24162|ECHH_RHOCA PROBABLE ENOYL-COA HYDRATASE
+ from Rhodobacter capsulatus (257 aa); CAA66096.1|X97452
+ enoyl-CoA isomerase from Escherichia coli (262 aa), FASTA
+ scores: opt: 513, E(): 1e-25, (36.1% identity in 249 aa
+ overlap); etc. Also similarity with naphthoate synthases.
+ Also highly similar to downstream ORF
+ Rv1142c|MTCI65.09|echA10 PROBABLE ENOYL-COA HYDRATASE from
+ Mycobacterium tuberculosis (268 aa), FASTA scores: opt:
+ 1225, E(): 0, (72.3% identity in 267 aa overlap). Protein
+ product from Mb1173c detected using SWATH mass
+ spectrometry. Mb1173c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ENOYL-COA HYDRATASE ECHA11 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-COA HYDRATASE) (CROTONASE)"
+ /protein_id="SIT99773.1"
+ /db_xref="GOA:A0A1R3XYF7"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR014748"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYF7"
+ /translation="MPDSGIAALTPVTGLNVTLTDRVLSVRINRPSSLNSLTVPILTG
+ IADTLERAAADPVVKVVRLGGVGRGFSSGVSMSVDDVWGGGPPTAIVEEANRAVRAVA
+ ALPHPVVAVVQGPAVGVAVSLALACDFILASDSAFFMLANTKVALMPDGGASALVAAA
+ TGRIRAMRLALLAEQLPAREALAWGLISAVYPDSDFEAEVDKVISRLLAGPALAFAQA
+ KNAINAAALTELEPTFARELDGQEVLLRTHDFAEGAAAFLQRRTPNFTGS"
+ gene complement(1270551..1271357)
+ /gene="echA10"
+ /locus_tag="BQ2027_MB1174C"
+ CDS complement(1270551..1271357)
+ /gene="echA10"
+ /locus_tag="BQ2027_MB1174C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1174c, echA10, len: 268 aa. Equivalent to
+ Rv1142c, len: 268 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 268 aa overlap). Probable
+ echA10, enoyl-CoA hydratase (EC 4.2.1.17), similar to
+ others e.g. CAA66096.1|X97452 enoyl-CoA isomerase from
+ Escherichia coli (262 aa), FASTA scores: opt: 525, E():
+ 1.3e-26, (35.1% identity in 251 aa overlap);
+ NP_420658.1|NC_002696 enoyl-CoA hydratase/isomerase family
+ protein from Caulobacter crescentus (267 aa);
+ NP_438092.1|NC_003078 putative enoyl-CoA hydratase protein
+ from Sinorhizobium meliloti (263 aa); etc. Also similarity
+ with naphthoate synthases. Also highly similar to upstream
+ ORF Rv1141c|MTCI65.08c|echA11 PROBABLE ENOYL-CoA HYDRATASE
+ from Mycobacterium tuberculosis (268 aa), FASTA score:
+ opt: 1225, E(): 0, (72.3% identity in 267 aa overlap).
+ TBparse score is 0.891. Protein product from Mb1174c
+ detected using SWATH mass spectrometry. Mb1174c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ENOYL-CoA HYDRATASE ECHA10 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-CoA HYDRATASE) (CROTONASE)"
+ /protein_id="SIT99774.1"
+ /db_xref="GOA:A0A1R3XXI6"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR014748"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXI6"
+ /translation="MSNYRIDTRTIVPGLAVTLADGVLSVTIDRPESLNSLTKPVLAG
+ MADAIEGAATDPRVKVVRLGGAGRGFSSGGAISVDDVWASGPPTDTVAEANRTVRAIV
+ ALPQPVVAVVQGPTVGCGVSLALACDLVLASDNAFFMLAHTNVGLMPDGGASALVQAA
+ IGRIRAMHMALLPDRVPAAEALSWGLVSAVYPAADFDAEVDKLISRLLAGPALAIAKT
+ KNAINAATLTELAPTLLRELDGQALLLRTDDFAEGATAFQQRRTPMFTGR"
+ gene 1271461..1272543
+ /gene="mcr"
+ /locus_tag="BQ2027_MB1175"
+ CDS 1271461..1272543
+ /gene="mcr"
+ /locus_tag="BQ2027_MB1175"
+ /note="Mb1175, mcr, len: 360 aa. Equivalent to Rv1143,
+ len: 360 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 360 aa overlap). Probable mcr,
+ alpha-methylacyl-CoA racemase (EC 5.1.99.4). Strong
+ similarity to other alpha-methylacyl-CoA racemases and
+ also some similarity to L-carnitine dehydratase (EC
+ 4.2.1.89) e.g. U89905|g1552373 methylacyl-CoA racemase
+ alpha from Norway rat (361 aa), FASTA scores: opt: 1035,
+ E():0, (47.2% identity in 339 aa overlap). Equivalent to
+ (but longer than) Z94723|MLCB33_13 Mycobacterium leprae
+ (253 aa) (85.3% identity in 245 aa overlap). Also similar
+ to Mycobacterium tuberculosis putative racemases Rv0855,
+ Rv1866, Rv3272. Protein product from Mb1175 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1175 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ALPHA-METHYLACYL-COA RACEMASE MCR
+ (2-methylacyl-CoA racemase) (2-arylpropionyl-CoA
+ epimerase)"
+ /protein_id="SIT99775.1"
+ /db_xref="GOA:A0A1R3XXU6"
+ /db_xref="InterPro:IPR003673"
+ /db_xref="InterPro:IPR023606"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXU6"
+ /translation="MAGPLSGLRVVELAGIGPGPHAAMILGDLGADVVRIDRPSSVDG
+ ISRDAMLRNRRIVTADLKSDQGLELALKLIAKADVLIEGYRPGVTERLGLGPEECAKV
+ NDRLIYARMTGWGQTGPRSQQAGHDINYISLNGILHAIGRGDERPVPPLNLVGDFGGG
+ SMFLLVGILAALWERQSSGKGQVVDAAMVDGSSVLIQMMWAMRATGMWTDTRGANMLD
+ GGAPYYDTYECADGRYVAVGAIEPQFYAAMLAGLGLDAAELPPQNDRARWPELRALLT
+ EAFASHDRDHWGAVFANSDACVTPVLAFGEVHNEPHIIERNTFYEANGGWQPMPAPRF
+ SRTASSQPRPPAATIDIEAVLTDWDG"
+ gene 1272555..1273307
+ /locus_tag="BQ2027_MB1176"
+ CDS 1272555..1273307
+ /locus_tag="BQ2027_MB1176"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1176, -, len: 250 aa. Equivalent to Rv1144, len:
+ 250 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 250 aa overlap). Probable short-chain
+ dehydrogenase/reductase (EC 1.-.-.-), highly similar to
+ various dehydrogenases e.g. NP_104056.1|NC_002678
+ 3-hydroxyacyl-CoA dehydrogenase type II from Mesorhizobium
+ loti (253 aa); NP_251244.1|NC_002516 probable short-chain
+ dehydrogenase from Pseudomonas aeruginosa (255 aa);
+ AAK15008.1|AF233685_1|AF233685 short chain
+ L-3-hydroxyacyl-CoA dehydrogenase from Mus musculus (261
+ aa); HSU73514|g1778354|XH98G2 human short-chain alcohol
+ dehydrogenase from Homo sapiens (261 aa), FASTA scores:
+ opt: 875, E(): 0, (60.1% identity in 253 aa overlap); etc.
+ Contains PS00061 Short-chain dehydrogenases/reductases
+ family signature. BELONGS TO THE SHORT-CHAIN
+ DEHYDROGENASES/REDUCTASES (SDR) FAMILY. Protein product
+ from Mb1176 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1176 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SHORT-CHAIN TYPE
+ DEHYDROGENASE/REDUCTASE"
+ /protein_id="SIT99776.1"
+ /db_xref="GOA:A0A1R3XXH8"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXH8"
+ /translation="MKTKDAVAVVTGGASGLGLATTKRLLDAGAQVVVVDLRGDDVVG
+ GLGDRARFAQADVTDEAAVSNALELADSLGPVRVVVNCAGTGNAIRVLSRDGVFPLAA
+ FRKIVDINLVGTFNVLRLGAERIAKTEPIGEERGVIINTASVAAFDGQIGQAAYSASK
+ GGVVGMTLPIARDLASKLIRVVTIAPGLFDTPLLASLPAEAKASLGQQVPHPSRLGNP
+ DEYGALVLHIIENPMLNGEVIRLDGAIRMAPR"
+ gene 1273822..1276167
+ /gene="mmpL13"
+ /locus_tag="BQ2027_MB1177"
+ CDS 1273822..1276167
+ /gene="mmpL13"
+ /locus_tag="BQ2027_MB1177"
+ /note="Mb1177, mmpL13, len: 781 aa. Equivalent to Rv1145
+ and Rv1146, len: 303 aa and 470 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (97.9% identity in 284 aa
+ overlap and 100% identity in 470 aa overlap). Probable
+ mmpL13A, conserved transmembrane transport protein (see
+ citation below), member of RND superfamily, showing some
+ similarity to putative Mycobacterial and Streptomyces
+ membrane proteins e.g. MTCY987|g1781238 from Mycobacterium
+ tuberculosis (962 aa), FASTA scores: opt: 213, E():
+ 1.9e-06, (28.0% identity in 296 aa overlap); etc. Strong
+ similarity to U92075|MMU92075_5 hypothetical protein from
+ Mycobacterium marinum (256 aa), FASTA scores: opt: 957,
+ E(): 0, (57.6% identity in 257 aa overlap). Should
+ continue as mmpL13B|Rv1146, but frameshift required.
+ Sequence has been checked and is identical in M.
+ tuberculosis strain CDC1551, and Mycobacterium bovis
+ strain AF2122/97 ????. BELONGS TO THE MMPL FAMILY.
+ Probable mmpL13B, conserved transmembrane transport
+ protein (see citation below), member of RND superfamily,
+ showing some similarity to putative Mycobacterial and
+ Streptomyces membrane proteins e.g. Q53902|C40046
+ antibiotic transport-associated protein from Streptomyces
+ coelicolor (711 aa), FASTA scores: opt: 193, E(): 2.1e-05,
+ (28.9% identity in 394 aa overlap); etc. Could be in frame
+ with previous ORF mmpL13A|Rv1145, but no sequence error
+ apparent to account for this; sequence is identical in
+ Mycobacterium tuberculosis strain CDC1551. BELONGS TO THE
+ MMPL FAMILY. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1145 and Rv1146
+ exist as 2 genes. In Mycobacterium bovis, a single base
+ insertion (*-a) leads to a single product. Mb1177 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable conserved transmembrane transport
+ protein mmpl13b"
+ /protein_id="SIT99777.1"
+ /db_xref="GOA:A0A1R3XXH2"
+ /db_xref="InterPro:IPR000731"
+ /db_xref="InterPro:IPR004869"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXH2"
+ /translation="MLQRIARLAIAAPRRIIGFAVFVFIAAAVFGVPVADSLSPGGFQ
+ DPRSESARAIEVLTDKFGQSGQKMLIVVTAAAGADSPPAREVGTDIVEVLRRSPLVYN
+ VTSPWTVPPTAAADLLSTDGKSGLIVVNVKGGENDAQNHAQTLSDEVAHDRDGVTVRA
+ GGSAMEYAQINRQNKDDLLVMELIAIPLSFLVLIWVFGGLLAAGLPMAQAVLAVVGSM
+ AVLRLVTFATEVSTFALNLSTALGLALAIDYTLLIVSRYRDELAEGSDRDEALIRTMA
+ TSGRTVLFSAVTVALSMSATALFPMYFLKSFAYAGVATVAFVATASIVITPAAIVLLG
+ PRLDALDVRRLVRRLLGRPDPVHKPVKQLFWYRSSKFVMRRWLPVGTAVVALLVLLGL
+ PFLSVKWGFPDDRVLPRSASARQVGDILRDDFGHDPATQIPIVVPDARGLGPVELDSY
+ AAELSRVPDVSAVAAPTGTFVDGSWVGTPRGATGLAEGSAFLTVSSTAPLFSRASDIQ
+ LKRLHQVAGPAGRSVVMAGVAQVNRDSVDAVTDRLPMVLGLIAAITYVLLFLLTGSVV
+ LPAKALVCNVLSLTAAFGALVWIFQEGHFGALGTTPSGTLVANMPVLLFCIAFGLSMD
+ YEVFLVSRIREYWLESGAARPARRSVAEVHAANDESVALGVARTGRVITAAALVMSMS
+ FAALIAAHVSFMRMFGLGLTLAVAADATLVRMVVVPAFMHVTGRWNWWAPRPLAWLHE
+ RFGVSEAAEPVSRRRSHAGGLGKIAGRSDGQTIPASLTRNG"
+ gene 1276300..1276950
+ /locus_tag="BQ2027_MB1178"
+ CDS 1276300..1276950
+ /locus_tag="BQ2027_MB1178"
+ /note="Mb1178, -, len: 216 aa. Equivalent to Rv1147, len:
+ 216 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 216 aa overlap). Conserved hypothetical
+ protein, similar to many conserved hypothetical proteins,
+ and some similarity to several methyltransferases e.g.
+ Q05197|PMTA_RHOSH phosphatidylethanolamine
+ N-methyltransferase (EC 2.1.1.17) from R. sphaeroides (203
+ aa), FASTA scores: opt: 156, E(): 0.00073, (27.6% identity
+ in 156 aa overlap). Protein product from Mb1178 detected
+ using SWATH mass spectrometry. Mb1178 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SAM-dependent methyltransferase"
+ /protein_id="SIT99778.1"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXH3"
+ /translation="MTSGAAASASRVDHPLFARIWPVVAAHEAEAIRALRRENLAGLS
+ GRVLEVGAGVGTNFAYYPVAVEQVIAMEPEPRLAAKARIAAADAPVPIVVTDKTVEEF
+ RDTETFDAVVCSLVLCSVSDPGAVLAHLRSLLRRGGELRYLEHVASAGARGRVQRFVD
+ ATFWPRLAGNCHTHRHTERAILDAGFVVDSSRREWAFPAWVPLPVSELALGRAHRT"
+ gene complement(1277700..1279148)
+ /locus_tag="BQ2027_MB1179C"
+ CDS complement(1277700..1279148)
+ /locus_tag="BQ2027_MB1179C"
+ /note="Mb1179c, -, len: 482 aa. Equivalent to Rv1148c,
+ len: 482 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 482 aa overlap). Conserved hypothetical
+ ORF in REP13E12 degenerate repeat, nearly identical to
+ other hypothetical Mycobacterium tuberculosis proteins in
+ REP13E12 repeats, although similarity extends upstream
+ past proposed f-Met start. Very similar to other REP13E12
+ proteins e.g. Rv1945, Rv3467, Rv0094c, Rv1128c etc.
+ Mb1179c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="13E12 repeat family protein"
+ /protein_id="SIT99779.1"
+ /db_xref="InterPro:IPR003615"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5E0"
+ /translation="MSETFCLTDHSEPMTARFLSVVLRRIRGMRSDTREEISAALDAY
+ HASLSRVLDLKCDALTTPELLACLQRLEVERRRQGAAEHALINQLAGQACEEELGGTL
+ RTALANRLHITPGEASRRIAEAEDLGERRALTGEPLPAQLTATAAAQREGKIGREHIK
+ EIQAFFKELSAAVDLGIREAAEAQLAELATSRRPDHLHGLATQLMDWLHPDGNFSDQE
+ RARKRGITMGKQEFDGMSRISGLLTPELRATIEAVLAKLAAPGACNPDDQTPLVDDTP
+ DADAVRRDTRSQAQRNHDAFLAALRGLLASGELGQHKGLPVTIVVSTTLKELEAATGK
+ GVTGGGSRVPMSDLIRMASHANHYLALFDGAKPLALYHTKRLASPAQRIMLYAKDRGC
+ SRPGCDAPAYHSEVHHVTPWTTTHRTDINDLTLACGPDNRLVEKGWKTRKNAHGDTEW
+ LPPPHLDHGQPRINRYHHPAKILCEQDDDEPH"
+ repeat_region complement(1277700..1279148)
+ /locus_tag="BQ2027_MB1179C"
+ /note="REP-4, len: 1362 nt. Equivalent to REP, len: 1362
+ nt, from Mycobacterium tuberculosis strain H37Rv, (96.4%
+ identity in 1362 nt overlap). REP165, member of REP13E12
+ family."
+ /rpt_family="REP"
+ gene 1279215..1280220
+ /locus_tag="BQ2027_IS-LIKE-2"
+ mobile_element 1279215..1280192
+ /locus_tag="BQ2027_IS-LIKE-2"
+ /note="IS-LIKE-2, len: 978 nt. Equivalent to IS-LIKE, len:
+ 978 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(100.0% identity in 978 nt overlap). IS element
+ ISlike2."
+ /mobile_element_type="insertion sequence:IS-LIKE"
+ repeat_region 1279243..1279246
+ /locus_tag="BQ2027_IS-LIKE-2"
+ /note="4 bp direct repeat, CTAG, generated by IS element
+ on insertion. Proposed by Mariani et al. 1993. J. Gen.
+ Microbiol. 139:1767-1772. Note that as the motif is
+ palindromic it could be part of the inverted repeat
+ itself."
+ /rpt_type=DIRECT
+ repeat_region 1279247..1279263
+ /locus_tag="BQ2027_IS-LIKE-2"
+ /note="17 bp imperfect inverted repeat,
+ IRL,GGCGTGTCTCCCAAATT, flanking putative IS element.
+ Proposed by Mariani et al. 1993. J. Gen. Microbiol. 139:
+ 1767-1772."
+ /rpt_type=INVERTED
+ gene 1279293..1279700
+ /locus_tag="BQ2027_MB1180"
+ CDS 1279293..1279700
+ /locus_tag="BQ2027_MB1180"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1180, -, len: 135 aa. Equivalent to Rv1149, len:
+ 135 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 135 aa overlap). Possible transposase.
+ Identical to 117 aa N-terminal region of S21394|X65618
+ transposase of Mycobacterium tuberculosis (308 aa), FASTA
+ scores: opt: 823, E(): 0, (99.1% identity in 117 aa
+ overlap). Second copy is Rv1042c|MTCY10G2.07. TBparse
+ score is 0.926. Mb1180 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSPOSASE"
+ /protein_id="SIT99780.1"
+ /db_xref="InterPro:IPR025161"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXH4"
+ /translation="MTRVGVISDEFWAVVEPLMPSHEGKPGRRFSDHRLILEGIAWRF
+ RTGSPWRDLPAEFGPWQTVWKRHHRWSLDGTCDEVFAHVAAVFGVDAEVAEDIEKLLS
+ VDSTNVRAHQHSAGACSDTLATGGTVGLQEIRR"
+ gene 1279738..>1280217
+ /locus_tag="BQ2027_MB1181"
+ CDS 1279738..>1280217
+ /locus_tag="BQ2027_MB1181"
+ /note="Mb1181, -, len: 160 aa. Equivalent to Rv1150, len:
+ 183 aa, from Mycobacterium tuberculosis strain H37Rv.
+ Possible fragment of transposase (pseudogene). Identical
+ to C-terminal part of S21394 transposase of putative
+ Mycobacterium tuberculosis IS element (308 aa), FASTA
+ scores: opt: 959, E(): 0, (99.3% identity in 145 aa
+ overlap). The transposase described here may be made by a
+ -1 frame shifting mechanism during translation that fuses
+ Rv1149|MTCI65.16 and Rv1150|MTCI65.17. No evidence found
+ to account for discrepancy with previously published
+ sequence. Second copy is Rv1041c|MTCY10G2.08. TBparse
+ score is 0.914. Mb1181 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSPOSASE (FRAGMENT)"
+ /protein_id="SIT99781.1"
+ /db_xref="GOA:A0A1R3XX79"
+ /db_xref="InterPro:IPR002559"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XX79"
+ /translation="MTTKIHALTDQREAPVRIRLTAGQAGDNPQLLPLLDDYRHASTE
+ YALGSTDFRLLADKAYSHPSTRAALRSKKIKHTIPERQDQIDRRKAKGSAGGRPPAFD
+ AALYGLRNTVERGFHRLKQWRGIATRYDKYALTYLGGVLLACAVIHARVGTPKLGDTP
+ "
+ repeat_region complement(1280201..1280216)
+ /note="17 bp imperfect inverted repeat,
+ IRR,GGCGTGTCTCCCAATTT, flanking putative IS element.
+ Proposed by Mariani et al. 1993. J. Gen. Microbiol. 139:
+ 1767-1772."
+ /rpt_type=INVERTED
+ repeat_region 1280217..1280220
+ /locus_tag="BQ2027_IS-LIKE-2"
+ /note="4 bp direct repeat, CTAG, generated by IS element
+ on insertion. Proposed by Mariani et al. 1993. J. Gen.
+ Microbiol. 139 :1767-1772. Note that as motif palindromic
+ could be part of inverted repeat itself."
+ /rpt_type=DIRECT
+ gene complement(1280304..1281017)
+ /locus_tag="BQ2027_MB1182C"
+ CDS complement(1280304..1281017)
+ /locus_tag="BQ2027_MB1182C"
+ /note="Mb1182c, -, len: 237 aa. Equivalent to Rv1151c,
+ len: 237 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 237 aa overlap). Probable
+ transcriptional regulatory protein, similar to others
+ AE000776|AE000776_10 Aquifex aeolicus (239 aa), FASTA
+ scores: opt: 725, E(): 0, (46.4% identity in 237 aa
+ overlap); ECAE0002125|g1787358 Escherichia coli (279 aa),
+ FASTA scores: opt: 464, E(): 1.3e-23, (36.7% identity in
+ 240 aa overlap). Protein product from Mb1182c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1182c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="transcriptional regulatory protein"
+ /protein_id="SIT99782.1"
+ /db_xref="GOA:P66814"
+ /db_xref="InterPro:IPR003000"
+ /db_xref="InterPro:IPR026590"
+ /db_xref="InterPro:IPR026591"
+ /db_xref="InterPro:IPR027546"
+ /db_xref="InterPro:IPR029035"
+ /db_xref="UniProtKB/Swiss-Prot:P66814"
+ /translation="MRVAVLSGAGISAESGVPTFRDDKNGLWARFDPYELSSTQGWLR
+ NPERVWGWYLWRHYLVANVEPNDGHRAIAAWQDHAEVSVITQNVDDLHERAGSGAVHH
+ LHGSLFEFRCARCGVPYTDALPEMPEPAIEVEPPVCDCGGLIRPDIVWFGEPLPEEPW
+ RSAVEATGSADVMVVVGTSAIVYPAAGLPDLALARGTAVIEVNPEPTPLSGSATISIR
+ ESASQALPGLLERLPALLK"
+ gene 1281055..1281420
+ /locus_tag="BQ2027_MB1183"
+ CDS 1281055..1281420
+ /locus_tag="BQ2027_MB1183"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1183, -, len: 121 aa. Equivalent to Rv1152, len:
+ 121 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 121 aa overlap). Start uncertain.
+ Probable transcriptional regulatory protein, some
+ similarity to others e.g. YHCF_BACSU HYPOTHETICAL
+ TRANSCRIPTIONAL REGULATOR (121 aa), FASTA scores: opt:
+ 187, E(): 1.9e-06, (34.9% identity in 106 aa overlap).
+ TBparse score is 0.876. Helix turn helix motif from aa
+ 42-63 (+3.10 SD). Protein product from Mb1183 detected
+ using SWATH mass spectrometry. Mb1183 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99783.1"
+ /db_xref="GOA:A0A1R3XYG5"
+ /db_xref="InterPro:IPR000524"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYG5"
+ /translation="MELRDWLRVDVKAGKPLFDQLRTQVIDGVRAGALPPGTRLPTVR
+ DLAGQLGVAANTVARAYRELESAAIVETRGRFGTFISRFDPTDAAMAAAAKEYVGVAR
+ ALGLTKSDAMRYLTHVPDD"
+ gene complement(1281398..1282246)
+ /gene="omt"
+ /locus_tag="BQ2027_MB1184C"
+ CDS complement(1281398..1282246)
+ /gene="omt"
+ /locus_tag="BQ2027_MB1184C"
+ /note="Mb1184c, omt, len: 282 aa. Equivalent to Rv1153c,
+ len: 282 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 282 aa overlap). Probable omt,
+ O-methyltransferase (EC 2.1.1-), similar to
+ TCMP_STRGA|P39887 Tetracenomycin polyketide synthesis
+ O-methyltransferase tcmP (EC 2.1.1.-) from Streptomyces
+ glaucescens (270 aa), FASTA scores: opt: 368, E():
+ 1.7e-17, (31.3% identity in 233 aa overlap). Protein
+ product from Mb1184c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1184c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE O-METHYLTRANSFERASE OMT"
+ /protein_id="SIT99784.1"
+ /db_xref="GOA:A0A1R3XXJ6"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR016874"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXJ6"
+ /translation="MSAHKPAKQRVALTGVSETALLTLNARAAEARRRDTIIDDPMAV
+ ALVESIDFGFAKFGPTGQGFALRARAFDMAAQHYLDQHPAATVVALAEGLQTSFWRLD
+ VAIPGGQFRWLTVDLPPIVDLRTRLLPSSPRVSVCAQSALDYSWMDSVDPAGGVFITA
+ EGLLMYLQPEQALGLIAQCAQTFPGGQMLFDLPPRWFAGWSRLGLRTSLRYKVPRMPF
+ SMSVAQAADLVNKVPGVVAVRDLRVPPGRGLWVNMALSTVYRLPVFDPLRPCLTLLEF
+ SRPARG"
+ gene complement(1282243..1282884)
+ /locus_tag="BQ2027_MB1185C"
+ CDS complement(1282243..1282884)
+ /locus_tag="BQ2027_MB1185C"
+ /note="Mb1185c, -, len: 213 aa. Equivalent to Rv1154c,
+ len: 213 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 213 aa overlap). Hypothetical unknown
+ protein, start uncertain. Protein product from Mb1185c
+ detected using SWATH mass spectrometry. Mb1185c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99785.1"
+ /db_xref="InterPro:IPR012545"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXV6"
+ /translation="MEFPLITANSLSSKTWRAMPRAYVAVASFSGGLVQSGMAKFAAF
+ LRGVNVGGVNLKMAEVATALTDAGFCNVRTILASGNVLLESTCGAAEVREKTEATLRE
+ RFGYDAWALIYDVDTVRTIVAAYPFECELEGYQSYVTFVADAAILDELSALADTAGPD
+ ENISRGPDPLGVLYWQVPKGSTLDSTIGQTMGKKRYKSSTTTRNLRTLAKVLR"
+ gene 1282829..1283272
+ /locus_tag="BQ2027_MB1186"
+ CDS 1282829..1283272
+ /locus_tag="BQ2027_MB1186"
+ /note="Mb1186, -, len: 147 aa. Equivalent to Rv1155, len:
+ 147 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 147 aa overlap). Conserved hypothetical
+ protein. Similar to other hypothetical proteins e.g.
+ AL079356|SC6G9.20 Streptomyces coelicolor (144 aa), FASTA
+ scores: opt: 478, E(): 2.8e-26, (55.7% identity in 140 aa
+ overlap); and Mycobacterium tuberculosis proteins Rv1875,
+ Rv0121c, Rv2074. Protein product from Mb1186 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1186 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible pyridoxamine 5'-phosphate oxidase
+ (pnp/pmp oxidase) (pyridoxinephosphate oxidase) (pnpox)
+ (pyridoxine 5'-phosphate oxidase)"
+ /protein_id="SIT99786.1"
+ /db_xref="GOA:A0A1R3XXI7"
+ /db_xref="InterPro:IPR011576"
+ /db_xref="InterPro:IPR012349"
+ /db_xref="InterPro:IPR019920"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXI7"
+ /translation="MARQVFDDKLLAVISGNSIGVLATIKHDGRPQLSNVQYHFDPRK
+ LLIQVSIAEPRAKTRNLRRDPRASILVDADDGWSYAVAEGTAQLTPPAAAPDDDTVEA
+ LIALYRNIAGEHPDWDDYRQAMVTDRRVLLTLPISHVYGLPPGMR"
+ gene 1283430..1283618
+ /locus_tag="BQ2027_MB1186A"
+ CDS 1283430..1283618
+ /locus_tag="BQ2027_MB1186A"
+ /note="unnamed protein product; unnamed protein product;
+ Mb1186A, len: 62 aa. No equivalent in M. tuberculosis
+ H37Rv. Identified by de novo proteomics of Mycobacterium
+ bovis AF2122/97 under exponential conditions,Mb1186A found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing"
+ /codon_start=1
+ /transl_table=11
+ /protein_id="SIT99787.1"
+ /db_xref="InterPro:IPR035172"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXI2"
+ /translation="MGESKSPQESSSEGETKRKFREALDRKMAQSSSGSDHKDGGGKQ
+ SRAHGPVASRREFRRKSG"
+ gene 1283706..1284293
+ /locus_tag="BQ2027_MB1187"
+ CDS 1283706..1284293
+ /locus_tag="BQ2027_MB1187"
+ /note="Mb1187, -, len: 195 aa. Equivalent to Rv1156, len:
+ 195 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 195 aa overlap). Conserved hypothetical
+ protein, highly similar to CAC32318.1|AL583944 conserved
+ hypothetical protein from Streptomyces coelicolor (197
+ aa). Protein product from Mb1187 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1187
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Base excision DNA repair protein"
+ /protein_id="SIT99788.1"
+ /db_xref="GOA:A0A1R3XXI5"
+ /db_xref="InterPro:IPR003265"
+ /db_xref="InterPro:IPR011257"
+ /db_xref="InterPro:IPR017658"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXI5"
+ /translation="MPNLQLVQEPAADALLNANPFALLVGMLLDQQVPMETAFAGPKK
+ IADRMGSFDAGDIADYDPDKFVALCSERPAIHRFPGSMAKRIQALAQIIVDRYDGDAA
+ ALWTAGEPDGNELLRRLKGLPGFGEQKARIFLALLGKQYGVTPKGWQVAAGEFGQPGT
+ YLSVADIVDAGSLGQVRSHKRQRKAAAKAEGKAPT"
+ gene complement(1284456..1285571)
+ /locus_tag="BQ2027_MB1188C"
+ CDS complement(1284456..1285571)
+ /locus_tag="BQ2027_MB1188C"
+ /note="Mb1188c, -, len: 371 aa. Equivalent to Rv1157c,
+ len: 371 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 371 aa overlap). Conserved hypothetical
+ Ala-, Pro-rich protein, similar to other proline rich
+ proteins and extensins e.g. GBU04267|g451543 sea-island
+ cotton proline-rich protein of cotton fiber (214 aa),
+ FASTA scores: opt: 305, E(): 3.9e-05, (35.7% identity in
+ 182 aa overlap). Has hydrophobic stretch at N-terminus
+ suggestive of secretion signal. First start taken. Mb1188c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved ala-, pro-rich protein"
+ /protein_id="SIT99789.1"
+ /db_xref="GOA:A0A1R3XXJ5"
+ /db_xref="InterPro:IPR003882"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXJ5"
+ /translation="MRRLTNTEHRENTTVASTWSVCKGLAAVVITSAAAFALCPNAAA
+ DPATPQPNPTQQLPGLPALAQLSPIIQQAAMNPAQATQLLMAAASAFAGNPAVPTESK
+ NVASSVNQFVAEPTNPDSAALGVPAPHGVALPEAIPVPHVPPLGAEPGVQAHLPTGID
+ PSHAAGPAPAVAPTVTPPVAAPPASAPAPAPDAAQPVAVPGPPPAPPAPRAAAPAPAS
+ AAPAPAAAPAPASGFGADAPPTQDFMYPSIGPNCVADGSNSIATALSVAGPAKIPLPG
+ PGPGQTAYVFTAVGTPGPADVQRLPLNVTWVNLTTGKSGSATLRPRSDINPDGPTTLT
+ VIADTGSGSIMSTIFGQVTTKDRQCQFMPTIGSTVVP"
+ gene complement(1285579..1286262)
+ /locus_tag="BQ2027_MB1189C"
+ CDS complement(1285579..1286262)
+ /locus_tag="BQ2027_MB1189C"
+ /note="Mb1189c, -, len: 227 aa. Equivalent to Rv1158c,
+ len: 227 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 227 aa overlap). Conserved hypothetical
+ Ala-, Pro-rich protein, similar to other proline rich
+ proteins and extensins e.g. MMSAP62|g633250 house mouse
+ (485 aa), FASTA scores: opt: 367, E(): 1.2e-08, (36.3%
+ identity in 212 aa overlap). Has hydrophobic stretch at
+ N-terminus suggestive of secretion signal. Mb1189c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Conserved alanine and proline rich protein"
+ /protein_id="SIT99790.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXI3"
+ /translation="MPTIWTFVRAAAVLVGSSAALLTGGIAHADPAPAPAPAPNIPQQ
+ LISSAANAPQILQNLATALGATPPLSAPKVAEPAPAAPGITATFPGLTPAAPAAAAAP
+ ALTPSIPGVNAPIPGITPAAPALPVTAPAAAPTIPGVNAPIPGITAPAPAAAAVPASV
+ PGVPSAKVDLPQLPYLPLQVPQQLSLPADLPALASGVIPAAPIAPTPPAPGAPALPPG
+ PPSLLAALP"
+ gene 1286392..1287687
+ /gene="pime"
+ /locus_tag="BQ2027_MB1190"
+ CDS 1286392..1287687
+ /gene="pime"
+ /locus_tag="BQ2027_MB1190"
+ /note="Mb1190, -, len: 431 aa. Equivalent to Rv1159, len:
+ 431 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 431 aa overlap). Conserved transmembrane
+ protein, similar to others in Mycobacterium tuberculosis
+ e.g. Rv2181|MTCY21D4.13 (560 aa), FASTA scores: opt: 172;
+ E(): 0.00035, (25.0% identity in 332 aa overlap). Mb1190
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="mannosyltransferase pime"
+ /protein_id="SIT99791.1"
+ /db_xref="GOA:A0A1R3XXJ0"
+ /db_xref="InterPro:IPR018584"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXJ0"
+ /translation="MCRTLIDGPVRSAIAKVRQIDTTSSTPAAARRVTSPPARETRAA
+ VLLLVLSVGARLAWTYLAPNGANFVDLHVYVSGAASLDHPGTLYGYVYADQTPDFPLP
+ FTYPPFAAVVFYPLHLVPFGLIALLWQVVTMAALYGAVRISQRLMGGTAETGHFAAML
+ WTAIAIWIEPLRSTFDYGQINVLLMLAALWAVYTPRWWLSGLLVGVASGVKLTPAITA
+ VYLVGVRRLHAAAFSVVVFLATVGVSLLVVGDEARYYFTDLLGDAGRVGPIATSFNQS
+ WRGAISRILGHDAGFGPLVLAAIASTAVLAILAWRALDRSDRLGKLLVVELFGLLLSP
+ ISWTHHWVWLVPLMIWLIDGPARERPGARILGWGWLVLTIVGVPWLLSFAQPSIWQIG
+ RPWYLAWAGLVYVVATLATLGWIAASERYVRIRPRRMAN"
+ gene complement(1287684..1287968)
+ /locus_tag="BQ2027_MB1191C"
+ CDS complement(1287684..1287968)
+ /locus_tag="BQ2027_MB1191C"
+ /EC_number="4.2.1.96"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1191c, -, len: 94 aa. Equivalent to Rv1159A, len:
+ 94 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 94 aa overlap). Hypothetical unknown protein.
+ Protein product from Mb1191c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1191c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Pterin-4-alpha-carbinolamine dehydratase (EC"
+ /protein_id="SIT99792.1"
+ /db_xref="GOA:P0A5S3"
+ /db_xref="InterPro:IPR001533"
+ /db_xref="InterPro:IPR036428"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5S3"
+ /translation="MAVLTDEQVDAALHDLNGWQRAGGVLRRSIKFPTFMAGIDAVRR
+ VAERAEEVNHHPDIDIRWRTVTFALVTHAVGGITENDIAMAHDIDAMFGA"
+ gene 1287995..1288420
+ /gene="mutT2"
+ /locus_tag="BQ2027_MB1192"
+ CDS 1287995..1288420
+ /gene="mutT2"
+ /locus_tag="BQ2027_MB1192"
+ /note="Mb1192, mutT2, len: 141 aa. Equivalent to Rv1160,
+ len: 141 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 141 aa overlap). Probable mutT, mutator
+ protein or homolog (EC 3.6.1.-). More similar to
+ D908197|g1742860 MutT homolog from Escherichia coli (135
+ aa), FASTA scores: opt: 226, E():1.1e-08, (39.7% identity
+ in 116 aa overlap); than to MUTT_ECOLI|P08337 MUTATOR MUTT
+ PROTEIN from Escherichia coli (129 aa), FASTA scores: opt:
+ 180, E(): 1.2e-05, (27.1% identity in 129 aa overlap).
+ Contains PS00893 mutT domain signature. Protein product
+ from Mb1192 detected using SWATH mass spectrometry. Mb1192
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MUTATOR PROTEIN MUTT2
+ (7,8-dihydro-8-oxoguanine-triphosphatase) (8-OXO-DGTPASE)"
+ /protein_id="SIT99793.1"
+ /db_xref="GOA:A0A1R3XYH8"
+ /db_xref="InterPro:IPR000086"
+ /db_xref="InterPro:IPR015797"
+ /db_xref="InterPro:IPR020084"
+ /db_xref="InterPro:IPR020476"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYH8"
+ /translation="MLNQIVVAGAIVRGCTVLVAQRVRPPELAGRWELPGGKVAAGET
+ ERAALARELAEELGLEVADLAVGDRVGDDIALNGTTTLRAYRVHLLGGEPRARDHRAL
+ CWVTAAELHDVDWVPADRGWIADLARTLNGSAADVHRRC"
+ gene 1288728..1292426
+ /gene="narG"
+ /locus_tag="BQ2027_MB1193"
+ CDS 1288728..1292426
+ /gene="narG"
+ /locus_tag="BQ2027_MB1193"
+ /note="Mb1193, narG, len: 1232 aa. Equivalent to Rv1161,
+ len: 1232 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.8% identity in 1232 aa overlap). Probable narG,
+ respiratory nitrate reductase alpha chain (EC 1.7.99.4).
+ Similar to others e.g. NARG_BACSU NITRATEREDUCTASE ALPHA
+ CHAIN from Bacillus subtilis (1228 aa), FASTA scores: opt:
+ 4218, E(): 0, (50.3% identity in 1229 aa overlap); etc.
+ Also highly similar to N-terminal part of
+ Rv1736c|MTCY04C12.21c|NARX PROBABLE NITRATE REDUCTASE from
+ Mycobacterium tuberculosis (85.1% identity in 281 aa
+ overlap). Contains prokaryotic molybdopterin
+ oxidoreductase signatures 1 and 2 (PS00551, PS00490).
+ BELONGS TO THE PROKARYOTIC MOLYBDOPTERIN-CONTAINING
+ OXIDOREDUCTASE FAMILY. Protein product from Mb1193
+ detected using SWATH mass spectrometry. Mb1193 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="respiratory nitrate reductase (alpha chain)
+ narg"
+ /protein_id="SIT99794.1"
+ /db_xref="GOA:A0A1R3XXK6"
+ /db_xref="InterPro:IPR006468"
+ /db_xref="InterPro:IPR006655"
+ /db_xref="InterPro:IPR006656"
+ /db_xref="InterPro:IPR006657"
+ /db_xref="InterPro:IPR006963"
+ /db_xref="InterPro:IPR009010"
+ /db_xref="InterPro:IPR027467"
+ /db_xref="InterPro:IPR037943"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXK6"
+ /translation="MTVTPHVGGPLEELLERSGRFFTPGEFSADLRTVTRRGGREGDV
+ FYRDRWSHDKVVRSTHGVNCTGSCSWKIYVKDGIITWETQQTDYPSVGPDRPEYEPRG
+ CPRGASFSWYSYSPTRVRYPYARGVLVEMYREAKTRLGDPVLAWADIQADPERRRRYQ
+ QARGKGGLVRVSWAEASEMVAAAHVHTIKTYGPDRVAGFSPIPAMSMVSHAAGSRFVE
+ LIGGVMTSFYDWYADLPVASPQVFGDQTDVPESGDWWDASYLVMWGSNVPITRTPDAH
+ WMAEARYRGAKVVVVSPDYADNTKFADEWVRCAAGTDTALAMAMGHVILSECYVRNQV
+ PFFVDYVRRYTDLPFLIKLEKRGDLLVPGKFLTAADIGEESENAAFKPALLDELTNTV
+ VVPQGSLGFRFGEDGVGKWNLDLGSVVPALSVEMDKAVNGDRSAELVTLPSFDTIDGH
+ GETVSRGLPVRRAGKHLVCTVFDLMLAHYGVARAGLPGEWPTGYHDRTQQNTPAWQES
+ ITGVPAAQAIRFAKEFARNATESGGRSMIIMGGGICHWFHSDVMYRSVLALLMLTGSM
+ GRNGGGWAHYVGQEKVRPLTGWQTMAMATDWSRPPRQVPGASYWYAHTDQWRYDGYGA
+ DKLASPVGRGRFAGKHTMDLLTSATAMGWSPFYPQFDRSSLDVADEARAAGRDVGDYV
+ AEQLAQHKLKLSITDPDNPVNWPRVLTVWRANLIGSSGKGGEYFLRHLLGTDSNVQSD
+ PPTDGVHPRDVVWDSDIPEGKLDLIMSIDFRMTSTTLVSDVVLPAATWYEKSDLSSTD
+ MHPYVHSFSPAIDPPWETRSDFGAFAAIARAFSALAKRHLGTRTDVVLTALQHDTPDE
+ MAYPDGTERDWLATGEVPVPGRTMSKLTVVERDYTAIYDKWLTLGPLIDQFGMTTKGY
+ TVHPFREVSELAANFGVMNSGVAVGRPAITTAKRMADVILALSGTCNGRLAVEGFLEL
+ EKRTGQRLAHLAEGSEERRITYADTQARPVPVITSPEWSGSESGGRRYAPFTINIEHL
+ KPFHTLTGRMHFYLAHDWVEELGEQLPVYRPPLDMARLFNQPELGPTDDGLGLTVRYL
+ TPHSKWSFHSTYQDNLYMLSLSRGGPTMWMSPGDAAKINVRDNDWVEAVNANGIYVCR
+ AIVSHRMPEGVVFVYHVQERTVDTPRTETNGKRGGNHNALTRVRIKPSHLAGGYGQHA
+ FAFNYLGPTGNQRDEVTVVRRRSQEVRY"
+ gene 1292465..1294141
+ /gene="narH"
+ /locus_tag="BQ2027_MB1194"
+ CDS 1292465..1294141
+ /gene="narH"
+ /locus_tag="BQ2027_MB1194"
+ /note="Mb1194, narH, len: 558 aa. Equivalent to Rv1162,
+ len: 558 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 558 aa overlap). Probable narH,
+ respiratory nitrate reductase beta chain (EC 1.7.99.4).
+ Similar to others e.g. NARH_BACSU|P42176 NITRATE REDUCTASE
+ BETA CHAIN from Bacillus subtilis (487 aa), FASTA scores:
+ opt: 2049, E(): 0, (56.8% identity in 488 aa overlap);
+ etc. Contains PS00190 cytochrome c family heme-binding
+ site signature. Protein product from Mb1194 detected using
+ SWATH mass spectrometry. Mb1194 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RESPIRATORY NITRATE REDUCTASE (BETA
+ CHAIN) NARH"
+ /protein_id="SIT99795.1"
+ /db_xref="GOA:A0A1R3XXW6"
+ /db_xref="InterPro:IPR006547"
+ /db_xref="InterPro:IPR017896"
+ /db_xref="InterPro:IPR029263"
+ /db_xref="InterPro:IPR038262"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXW6"
+ /translation="MKVMAQMAMVMNLDKCIGCHTCSVTCKQAWTNRSGTEYVWFNNV
+ ETRPGVGYPRTYEDQERWRGGWVRDKKGRLRLRDGGRIHKLLRIFANPKLPTIGDYYE
+ PWTYDYENLTSAPAGDTFPTAAPRSLISGNPMKVSWGSNWDDNLAGSPEIVPNDPVLK
+ KVNQVNQEVKLKLEETFMFYLPRICEHCLNPSCVASCPSGAMYKRTEDGIVLVDQDRC
+ RGWRMCVSGCPYKKVYFNHKTGKAEKCTLCYPRIEVGLPTVCSETCVGRLRYLGLVLY
+ DVDQVLQAASVESDTDLYEAQRRILLDPHDPRVIAGARAEGIADEWIEAAQRSPVYAL
+ INTYRVALPLHPEYRTMPMVWYIPPLSPVVDAVSRDGHDGEDLGNLFGALDALRIPIA
+ YLAELFTAGDTEVVAGVLRRLAAMRCYMRDINLGRETQPHIPESVGMTEEQIYQMYRL
+ LAVAKYEERYVIPTSYAGELPAAAMTDDMGCSLSVDGGPGMYESGPFGQGSPTPVPIA
+ VESFHALQHAGSAATGGAGRSRVNLLNWDPNGAAAGLFPEPQPSKDVVQR"
+ gene 1294198..1294803
+ /gene="narJ"
+ /locus_tag="BQ2027_MB1195"
+ CDS 1294198..1294803
+ /gene="narJ"
+ /locus_tag="BQ2027_MB1195"
+ /note="Mb1195, narJ, len: 201 aa. Equivalent to Rv1163,
+ len: 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 201 aa overlap). Probable narJ,
+ respiratory nitrate reductase delta chain (EC 1.7.99.4).
+ Similar to others e.g. P42178|NARJ_BACSU NITRATE REDUCTASE
+ DELTA CHAIN from Bacillus subtilis (184 aa), FASTA scores:
+ opt: 254, E(): 1.9e-10, (31.8% identity in 179 aa
+ overlap); etc. Strong similarity to region from aa 260
+ -410 of Rv1736c|MTCY04C12.21c|NARX PROBABLE NITRATE
+ REDUCTASE from Mycobacterium tuberculosis (64.8% identity
+ in 159 aa overlap). Protein product from Mb1195 detected
+ using SWATH mass spectrometry. Mb1195 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RESPIRATORY NITRATE REDUCTASE (DELTA
+ CHAIN) NARJ"
+ /protein_id="SIT99796.1"
+ /db_xref="GOA:A0A1R3XXJ7"
+ /db_xref="InterPro:IPR003765"
+ /db_xref="InterPro:IPR020945"
+ /db_xref="InterPro:IPR036411"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXJ7"
+ /translation="MWQSASLLLAYPDDGLAERLHMVDALRAHQTGPAAALLGRTVAE
+ LRALAPMAAAAQYVETFDMRRRSTMYLTYWTAGDTRNRGREMLAFATAYRDAGVKPPR
+ TEAPDYLPVVLEFAATVDPEAGRRLLTEHRVPIDVLRGALADAKSPYEYTVAAICETL
+ PAATNQEVRRAQRLAQSGPPAEAVGLQPFTLTVPPKRAEGA"
+ gene 1294806..1295546
+ /gene="narI"
+ /locus_tag="BQ2027_MB1196"
+ CDS 1294806..1295546
+ /gene="narI"
+ /locus_tag="BQ2027_MB1196"
+ /note="Mb1196, narI, len: 246 aa. Equivalent to Rv1164,
+ len: 246 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 246 aa overlap). Probable narI,
+ respiratory nitrate reductase gamma chain (EC 1.7.99.4).
+ Similar to others e.g. NARI_BACSU|P42177 NITRATE REDUCTASE
+ GAMMA CHAIN from Bacillus subtilis (223 aa), FASTA scores:
+ opt: 652, E(): 0; (41.6% identity in 221 aa overlap); etc.
+ Highly similar to C-terminal part of
+ Rv1736c|MTCY04C12.21c|NARX PROBABLE NITRATE REDUCTASE
+ (GAMMA CHAIN) from Mycobacterium tuberculosis (68.6%
+ identity in 239 aa overlap). Mb1196 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RESPIRATORY NITRATE REDUCTASE (GAMMA
+ CHAIN) NARI"
+ /protein_id="SIT99797.1"
+ /db_xref="GOA:A0A1R3XXJ3"
+ /db_xref="InterPro:IPR003816"
+ /db_xref="InterPro:IPR023234"
+ /db_xref="InterPro:IPR036197"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXJ3"
+ /translation="MAVLDLVEIFWDAAPYVVVAIAVVGTWWRYRYDKFGWTTRSSQL
+ YESRLLSIGSPMFHFGSLLVIMGHVMGLFIPDSWTRAFGMSDHLYHLQALLLGAPAGF
+ ATLLGIGLLIYRRRIQTPVWLATTRNDKLMYLVLVCAIVAGLACTLMGATHEGDMHDY
+ RRSVSVWFRSIWMLAPRGDLMAQATLYYQVHVLIALALFVLWPFTRLVHAFSAPIAYL
+ FRPYIVYRSREVAAKHELIGSAPRRRGW"
+ gene 1295568..1297454
+ /gene="typA"
+ /locus_tag="BQ2027_MB1197"
+ CDS 1295568..1297454
+ /gene="typA"
+ /locus_tag="BQ2027_MB1197"
+ /note="Mb1197, typA, len: 628 aa. Equivalent to Rv1165,
+ len: 628 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 628 aa overlap). Possible typA
+ (alternate gene name: bipA), GTP-binding translation
+ elongation factor, similar to several e.g.
+ P32132|TYPA_ECOLI|BIPA|B387 Escherichia coli (591 aa);
+ YIHK_SYNY3|P72749 GTP-binding protein TYPA/BIPA homolog
+ from synechocystis sp. (597 aa), FASTA scores: E(): 0,
+ (46.9% identity in 610 aa overlap); and to elongation
+ factor EF-G from many organims e.g. EFG_MICLU|P09952
+ micrococcus luteus (701 aa), FASTA scores: E(): 3e-24,
+ (29.8% identity in 500 aa overlap). BELONGS TO THE
+ GTP-BINDING ELONGATION FACTOR FAMILY, TYPA SUBFAMILY.
+ Protein product from Mb1197 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1197 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE GTP-BINDING TRANSLATION ELONGATION
+ FACTOR TYPA (TYROSINE PHOSPHORYLATED PROTEIN A)
+ (GTP-BINDING PROTEIN)"
+ /protein_id="SIT99798.1"
+ /db_xref="GOA:A0A1R3XXJ4"
+ /db_xref="InterPro:IPR000640"
+ /db_xref="InterPro:IPR000795"
+ /db_xref="InterPro:IPR004161"
+ /db_xref="InterPro:IPR005225"
+ /db_xref="InterPro:IPR006298"
+ /db_xref="InterPro:IPR009000"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR035647"
+ /db_xref="InterPro:IPR035651"
+ /db_xref="InterPro:IPR042116"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXJ4"
+ /translation="MPFRNVAIVAHVDHGKTTLVDAMLRQSGALRERGELQERVMDTG
+ DLEREKGITILAKNTAVHRHHPDGTVTVINVIDTPGHADFGGEVERGLSMVDGVLLLV
+ DASEGPLPQTRFVLRKALAAHLPVILVVNKTDRPDARIAEVVDASHDLLLDVASDLDD
+ EAAAAAEHALGLPTLYASGRAGVASTTAPPDGQVPDGTNLDPLFEVLEKHVPPPKGEP
+ DAPLQALVTNLDASTFLGRLALIRIYNGRIRKGQQVAWIRQVDGQQTVTTAKITELLA
+ TEGVERKPTDAAVAGDIVAVAGLPEIMIGDTLAASANPVALPRITVDEPAISVTIGTN
+ TSPLAGKVGGHKLTARMVRSRLDAELVGNVSIRVVDIGAPDAWEVQGRGELALAVLVE
+ QMRREGFELTVGKPQVVTKTIDGTLHEPFESMTVDCPEEYIGAVTQLMAARKGRMVEM
+ ANHTTGWVRMDFVVPSRGLIGWRTDFLTETRGSGVGHAVFDGYRPWAGEIRARHTGSL
+ VSDRAGAITPFALLQLADRGQFFVEPGQQTYEGMVVGINPRPEDLDINVTREKKLTNM
+ RSSTADVIETLAKPLQLDLERAMELCAPDECVEVTPEIVRIRKVELAAAARARSRART
+ KARG"
+ gene 1297552..1299459
+ /gene="lpqW"
+ /locus_tag="BQ2027_MB1198"
+ CDS 1297552..1299459
+ /gene="lpqW"
+ /locus_tag="BQ2027_MB1198"
+ /note="Mb1198, lpqW, len: 635 aa. Equivalent to Rv1166,
+ len: 635 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 635 aa overlap). Probable Lipoprotein
+ LpqW, almost identical in part to G2384665|AF009358
+ Mycobacterium tuberculosis gene fragment ORFA2-898
+ (FRAGMENT) (59 aa) (93.9% identity in 49 aa overlap) (see
+ citation below). Also similar to Rv1280c and Rv2585c.
+ Contains possible N-terminal signal sequence and
+ appropriately positioned PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site. Protein product from
+ Mb1198 detected using SWATH mass spectrometry. Mb1198
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable conserved lipoprotein lpqw"
+ /protein_id="SIT99799.1"
+ /db_xref="InterPro:IPR000914"
+ /db_xref="InterPro:IPR039424"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXK3"
+ /translation="MGVPSPVRRVCVTVGALVALACMVLAGCTVSPPPAPQSTDTPRS
+ TPPPPRRPTQIIMGIDWIGPGFNPHLLSDLSPVNAAISALVLPSAFRPIPDPNTPTGS
+ RWEMDPTLLVSADVTNNHPFTVTYKIRPEAQWTDNAPIAADDFWYLWQQMVTQPGVVD
+ PAGYHLITSVQSLEGGKQAVVTFAQPYPAWRELFTDILPAHIVKDIPGGFASGLARAL
+ PVTGGQFRVENIDPQRDEILIARNDRYWGPPSKPGIILFRRAGAPAALADSVRNGDTQ
+ VAQVHGGSAAFAQLSAIPDVRTARIVTPRVMQFTLRANVPKLADTQVRKAILGLLDVD
+ LLAAVGAGTDNTVTLDQAQIRSPSDPGYVPTAPPAMSSAAALGLLEASGFQVDTNTSV
+ SPAPSVPDSTTTSVSTGPPEVIRGRISKDGEQLTLVIGVAANDPTSVAVANTAADQLR
+ DVGIAATVLALDPVTLYHDALNDNRVDAIVGWRQAGGNLATLLASRYGCPALQATTVP
+ AANAPTTAPSAPIGPTPSAAPDTATPPPTAPRRPSDPGALVKAPSNLTGICDRSIQSN
+ IDAALNGTKNINDVITAVEPRLWNMSTVLPILQDTTIVAAGPSVQNVSLSGAVPVGIV
+ GDAGQWVKTGQ"
+ gene complement(1299487..1300092)
+ /locus_tag="BQ2027_MB1199C"
+ CDS complement(1299487..1300092)
+ /locus_tag="BQ2027_MB1199C"
+ /note="Mb1199c, -, len: 201 aa. Equivalent to Rv1167c,
+ len: 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 201 aa overlap). Probable
+ transcriptional regulator, similar to several e.g.
+ D1022772|D85417 hemR from Propionibacterium freudenreichii
+ (243 aa), FASTA scores: opt: 268, E(): 5.4e-16, (35.9%
+ identity in 198 aa overlap) and AL022268|SC4H2.32
+ Streptomyces coelicolor (111 aa), FASTA scores: opt: 274,
+ E(): 5e-11, (55.1% identity in 89 aa overlap). Protein
+ product from Mb1199c detected using SWATH mass
+ spectrometry. Mb1199c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99800.1"
+ /db_xref="GOA:A0A1R3XXJ2"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR011075"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXJ2"
+ /translation="MTVSAPAKANPYRRRGEVLERALYDATLAELESAGYGGLTMEGI
+ AARAQTGKAALYRRWAGKRELVLAAVQYALPPVPEPRADRSARENLLAVFTANCEILA
+ GKTALPSMEIVSQLLHEPELRAIFINSVWAPRLRIVESILQAGVRSGEIDPATLTPMT
+ ARIGPALIHQHVLFTGSPPDREQLTRIIDAMILTTGERRES"
+ gene complement(1300164..1300661)
+ /gene="PPE17b"
+ /locus_tag="BQ2027_MB1200C"
+ CDS complement(1300164..1300661)
+ /gene="PPE17b"
+ /locus_tag="BQ2027_MB1200C"
+ /note="Mb1200c, PPE17b, len: 165 aa. Equivalent to 3' end
+ of Rv1168c, len: 346 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (). Member of the Mycobacterium tuberculosis
+ PPE family of glycine-rich proteins, similar to many e.g.
+ E332789|Z98268|MTCI125.27C (385 aa), FASTA scores: opt:
+ 504, E(): 0, (36.6% identity in 388 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PPE17 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-c) splits PPE17 into 2 parts, PPE17a and
+ PPE17b. Mb1200c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PPE FAMILY PROTEIN [SECOND PART]"
+ /protein_id="SIT99801.1"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXK0"
+ /translation="MIGSVSETVGSFAAPATKNLPSKLWTLLTKGTYPLTAARISSIP
+ VEYVLAFVEGSNMGQMMGNLAMRSLTPTLKGPLELLPNAVRPAVSATLGNADTIGGLS
+ VPPSWVADKSITPLAKAVPTSAPGGPSGTSWAQLGLASLAGGAVGAVAARTRSGVILR
+ SPAAG"
+ gene complement(1300663..1301205)
+ /gene="PPE17a"
+ /locus_tag="BQ2027_MB1201C"
+ CDS complement(1300663..1301205)
+ /gene="PPE17a"
+ /locus_tag="BQ2027_MB1201C"
+ /note="Mb1201c, PPE17a, len: 180 aa. Similar to 5' end of
+ Rv1168c, len: 346 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (97.1% identity in 174 aa overlap). Member
+ of the Mycobacterium tuberculosis PPE family of
+ glycine-rich proteins, similar to many e.g.
+ E332789|Z98268|MTCI125.27C (385 aa), FASTA scores: opt:
+ 504, E(): 0, (36.6% identity in 388 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PPE17 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-c) splits PPE17 into 2 parts, PPE17a and
+ PPE17b. Mb1201c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PPE FAMILY PROTEIN [FIRST PART]"
+ /protein_id="SIT99802.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZN0"
+ /translation="MDFTIFPPEFNSLNIQGSARPFLVAANAWKNLSNELSYAASRFE
+ SEINGLITSWRGPSSTIMAAAVAPFRAWIVTTASLAELVADHISVVAGAYEAAHAAHV
+ PLPVIETNRLTRLALATTNIFGIHTPAIFALDALYAQYWSQDGEAMNLYATMAAAAAR
+ LTPFSPPGADRQPGRAGQTL"
+ gene complement(1301223..1301525)
+ /gene="lipx"
+ /locus_tag="BQ2027_MB1202C"
+ CDS complement(1301223..1301525)
+ /gene="lipx"
+ /locus_tag="BQ2027_MB1202C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1202c, PE11, len: 100 aa. Equivalent to Rv1169c,
+ len: 100 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 100 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family of proteins (see
+ second citation below), e.g. O05297|Z93777|MTCI364.07 (99
+ aa), FASTA scores: opt: 209, E(): 1.6e-15, (37.4% identity
+ in 99 aa overlap). Also simlar to the N-terminus of
+ P77909|U76006 ESTERASE/LIPASE (EC 3.1.1.3) from
+ Mycobacterium tuberculosis (437 aa), FASTA scores: opt:
+ 193, E(): 4.4e-14, (37.2% identity in 94 aa overlap).
+ Contains a helix-turn-helix motif from aa 88-109 (+2.76
+ SD). Mb1202c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein. possible lipase lipx."
+ /protein_id="SIT99803.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYI5"
+ /translation="MSFVTTRPDSIGETAANLHEIGVTMSAHDDGVTPLITNVESPAH
+ DLVSIVTSMLFSMHGELYKAIARQAHVIHESFVQTLQTSKTSYWLTELANRAGTST"
+ gene 1301705..1302616
+ /gene="mshB"
+ /locus_tag="BQ2027_MB1203"
+ CDS 1301705..1302616
+ /gene="mshB"
+ /locus_tag="BQ2027_MB1203"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1203, mshB, len: 303 aa. Equivalent to Rv1170,
+ len: 303 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 303 aa overlap). mshB,
+ N-Acetyl-1-D-myo-Inosityl-2-Amino-2-Deoxy-alpha-D-
+ Glucopyra noside Deacetylase (GlcNAc-Ins deacetylase) (see
+ citation below), similar to Q54358|X79146 lmbE gene from
+ Streptomyces lincolnensis (270 aa), FASTA scores: opt:
+ 308, E(): 1.2e-15, (32.0% identity in 278 aa overlap).
+ Also similar to Rv1082|MCA Mycothiol conjugate amidase
+ from Mycobacterium tuberculosis (288 aa). Protein product
+ from Mb1203 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1203 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="N-Acetyl-1-D-myo-Inosityl-2-Amino-2-Deoxy-alpha-
+ D-Glucopyranoside Deacetylase mshB (GlcNAc-Ins
+ deacetylase)"
+ /protein_id="SIT99804.1"
+ /db_xref="GOA:Q7U0H2"
+ /db_xref="InterPro:IPR003737"
+ /db_xref="InterPro:IPR017810"
+ /db_xref="InterPro:IPR024078"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0H2"
+ /translation="MSETPRLLFVHAHPDDESLSNGATIAHYTSRGAQVHVVTCTLGE
+ EGEVIGDRWAQLTADHADQLGGYRIGELTAALRALGVSAPIYLGGAGRWRDSGMAGTD
+ QRSQRRFVDADPRQTVGALVAIIRELRPHVVVTYDPNGGYGHPDHVHTHTVTTAAVAA
+ AGVGSGTADHPGDPWTVPKFYWTVLGLSALISGARALVPDDLRPEWVLPRADEIAFGY
+ SDDGIDAVVEADEQARAAKVAALAAHATQVVVGPTGRAAALSNNLALPILADEHYVLA
+ GGSAGARDERGWETDLLAGLGFTASGT"
+ gene 1302708..1303148
+ /locus_tag="BQ2027_MB1204"
+ CDS 1302708..1303148
+ /locus_tag="BQ2027_MB1204"
+ /note="Mb1204, -, len: 146 aa. Equivalent to Rv1171, len:
+ 146 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 146 aa overlap). Conserved hypothetical
+ protein, possibly transmembrane protein. Start has been
+ changed since first submission. Mb1204 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative membrane protein"
+ /protein_id="SIT99805.1"
+ /db_xref="GOA:A0A1R3XXX5"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXX5"
+ /translation="MGHRVDTLSDRQRANLTTGATDRAIRLVVLALLTVDGVVSALAG
+ ALLMPWYIGSAPFPISALISGLVNAALVWAAARWTTSSRVAALPLWAWLLTVAAMSFG
+ GPGDDVILGGQGLLVYGALVFVVAGAVPPAWVLWRRRVQADGSG"
+ gene complement(1303156..1304082)
+ /gene="PE12"
+ /locus_tag="BQ2027_MB1205C"
+ CDS complement(1303156..1304082)
+ /gene="PE12"
+ /locus_tag="BQ2027_MB1205C"
+ /note="Mb1205c, PE12, len: 308 aa. Equivalent to Rv1172c,
+ len: 308 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 308 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family of proteins e.g.
+ P71748|Z81368|MTCY253.25C (361 aa), FASTA scores: opt:
+ 483, E(): 7.8e-22, (46.4% identity in 192 aa overlap).
+ Protein product from Mb1205c detected using shotgun mass
+ spectrometry. Mb1205c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe12"
+ /protein_id="SIT99806.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXK7"
+ /translation="MSFVFAAPEALAAAAADMAGIGSTLNAANVVAAVPTTGVLAAAA
+ DEVSTQVAALLSAHAQGYQQLSRQMMTAFHDQFVQALRASADAYATAEASAAQTMVNA
+ VNAPARALLGHPLISADASTGGGSNALSRVHSMFLGTGGSSALGGSAAANAAASGALQ
+ LQPTGGASGLSAVGALLPRAGAAAAAALPALAAESIGNAIKNLYNAVEPWVQYGFNLT
+ AWAVGWLPYIGILAPQINFFYYLGEPIVQAVLFNAIDFVDGTVTFSQALTNIETATAA
+ SINQFINTEINWIRGFLPPLPPISPPGFPSLP"
+ gene 1304332..1306902
+ /gene="fbiC"
+ /locus_tag="BQ2027_MB1206"
+ CDS 1304332..1306902
+ /gene="fbiC"
+ /locus_tag="BQ2027_MB1206"
+ /note="Mb1206, fbiC, len: 856 aa. Equivalent to Rv1173,
+ len: 856 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 856 aa overlap). Probable fbiC, F420
+ biosynthesis protein, equivalent to AAL91922|FBIC F420
+ biosynthesis protein fbiC from Mycobacterium bovis BCG
+ (856 aa) (see citation below). The N-terminus (aa 80-420)
+ is similar to Y446_METJA|Q57888 hypothetical protein
+ mj0446 from methanococcus jannaschii (361 aa), FASTA
+ scores: opt: 801, E(): 0, (41.2% identity in 337 aa
+ overlap); and the C-terminus region (aa 530-856) is
+ similar to e.g. YE31_METJA|Q58826 hypothetical protein
+ mj1431 from methanococcus jannaschii (359 aa), FASTA
+ scores: opt: 1089, E(): 0, (48.7% identity in 337 aa
+ overlap). Protein product from Mb1206 detected using SWATH
+ mass spectrometry. Mb1206 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE F420 BIOSYNTHESIS PROTEIN FBIC"
+ /protein_id="SIT99807.1"
+ /db_xref="GOA:Q7U0G9"
+ /db_xref="InterPro:IPR006638"
+ /db_xref="InterPro:IPR007197"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR019939"
+ /db_xref="InterPro:IPR019940"
+ /db_xref="InterPro:IPR020050"
+ /db_xref="InterPro:IPR034405"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0G9"
+ /translation="MPQPVGRKSTALPSPVVPPQANASALRRVLRRARDGVTLNVDEA
+ AIAMTARGDELADLCASAARVRDAGLVSAGRHGPSGRLAISYSRKVFIPVTRLCRDNC
+ HYCTFVTVPGKLRAQGSSTYMEPDEILDVARRGAEFGCKEALFTLGDRPEARWRQARE
+ WLGERGYDSTLSYVRAMAIRVLEQTGLLPHLNPGVMSWSEMSRLKPVAPSMGMMLETT
+ SRRLFETKGLAHYGSPDKDPAVRLRVLTDAGRLSIPFTTGLLVGIGETLSERADTLHA
+ IRKSHKEFGHIQEVIVQNFRAKEHTAMAAFPDAGIEDYLATVAVARLVLGPGMRIQAP
+ PNLVSGDECRALVGAGVDDWGGVSPLTPDHVNPERPWPALDELAAVTAEAGYDMVQRL
+ TAQPKYVQAGAAWIDPRVRGHVVALADPATGLARDVNPVGMPWQEPDDVASWGRVDLG
+ AAIDTQGRNTAVRSDLASAFGDWESIREQVHELAVRAPERIDTDVLAALRSAERAPAG
+ CTDGEYLALATADGPALEAVAALADSLRRDVVGDEVTFVVNRNINFTNICYTGCRFCA
+ FAQRKGDADAYSLSVGEVADRAWEAHVAGATEVCMQGGIDPELPVTGYADLVRAVKAR
+ VPSMHVHAFSPMEIANGVTKSGLSIREWLIGLREAGLDTIPGTAAEILDDEVRWVLTK
+ GKLPTSLWIEIVTTAHEVGLRSSSTMMYGHVDSPRHWVAHLNVLRDIQDRTGGFTEFV
+ PLPFVHQNSPLYLAGAARPGPSHRDNRAVHALARIMLHGRISHIQTSWVKLGVRRTQV
+ MLEGGANDLGGTLMEETISRMAGSEHGSAKTVAELVAIAEGIGRPARQRTTTYALLAA
+ "
+ gene complement(1306946..1307278)
+ /gene="tb8.4"
+ /locus_tag="BQ2027_MB1207C"
+ CDS complement(1306946..1307278)
+ /gene="tb8.4"
+ /locus_tag="BQ2027_MB1207C"
+ /note="Mb1207c, -, len: 110 aa. Equivalent to Rv1174c,
+ len: 110 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 110 aa overlap). Hypothetical unknown
+ protein. Mb1207c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="low molecular weight t-cell antigen tb8.4"
+ /protein_id="SIT99808.1"
+ /db_xref="GOA:A0A1R3XXK5"
+ /db_xref="InterPro:IPR016572"
+ /db_xref="InterPro:IPR032407"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXK5"
+ /translation="MRLSLTALSAGVGAVAMSLTVGAGVASADPVDAVINTTCNYGQV
+ VAALNATDPGAAAQFNASPVAQSYLRNFLAAPPPQRAAMAAQLQAVPGAAQYIGLVES
+ VAGSCNNY"
+ gene complement(1307479..1309503)
+ /gene="fadH"
+ /locus_tag="BQ2027_MB1208C"
+ CDS complement(1307479..1309503)
+ /gene="fadH"
+ /locus_tag="BQ2027_MB1208C"
+ /note="Mb1208c, fadH, len: 674 aa. Equivalent to Rv1175c,
+ len: 674 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 674 aa overlap). Probable fadH,
+ NADPH-dependent 2,4-dienoyl-CoA reductase (EC 1.3.1.34),
+ highly similar to others e.g. NP_251782.1|NC_002516
+ 2,4-dienoyl-CoA reductase FadH1 from Pseudomonas
+ aeruginosa (679 aa); CAC01564.1|AL391039 2,4-dienoyl-CoA
+ reductase [NADPH] from Streptomyces coelicolor (671 aa);
+ P42593|FADH_ECOLI 2,4-dienoyl-CoA reductase from
+ Escherichia coli (671 aa), FASTA scores: opt: 2344, E():
+ 0, (53.1% identity in 671 aa overlap); etc. Also similar
+ to Rv3359|MTV004.16 PUTATIVE OXIDOREDUCTASE from
+ Mycobacterium tuberculosis (396 aa). Protein product from
+ Mb1208c detected using SWATH mass spectrometry. Mb1208c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NADPH DEPENDENT 2,4-DIENOYL-COA
+ REDUCTASE FADH (2,4-dienoyl coenzyme A reductase)
+ (4-enoyl-CoA reductase)"
+ /protein_id="SIT99809.1"
+ /db_xref="GOA:A0A1R3XXL3"
+ /db_xref="InterPro:IPR001155"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR023753"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXL3"
+ /translation="MTNPYPNLLSPLDLGFTTLRNRVVMGSMHTGLEDRARHIDRLAD
+ YFAERARGGVGLIITGGYAPNRTGWLLPFASELVTSAQARRHRRINRAVHDSGAKILL
+ QILHAGRYAYHPLAVSASPIKAPITPFRPRALSARGVEATIADFARCAQLARDAGYDG
+ VEIMGSEGYLLNQFLAPRTNKRTDSWGGTPANRRRFPVEIIRRSRAAVGSDFIICYRL
+ SMADYVAEGQSWDEIVALATEVEGAGATIINSGFGWHEARVPTIVTSVPGGAFVDISS
+ AVAEHVTIPVVASNRINMPQAAERILAETQVRLISMARPMLSDPDWVLKAQSNRVDEI
+ NTCISCNQACLDHAFARKTVSCLLNPRAGRETQLVLSPTRRARSVAVVGAGPAGLATA
+ ANAAQRGHRVTLFEANDFIGGQFDMARRIPGKEEFSETIRYFSTILAKHGVEVRLGTR
+ VAAQELTGYDEVVLATGVAPRIPAIPGIDHPMVLTYAEAITGVRPVGRTVAVVGAGGI
+ GFDVTELLVTDSSPTLNLKEWKAEWGVADPREARGALTTPLPAPPAREVYLLQRTKGP
+ QGKRLGKTTGWVHRASLKAKGVHQLSGVNYEQINDDGLHISFGPKRRRPQLLAVDNVV
+ VCAGQEPVRDLESELRRHGINPHISGGAAVAAELDAKRAIKQGTELAARL"
+ gene complement(1309500..1310069)
+ /locus_tag="BQ2027_MB1209C"
+ CDS complement(1309500..1310069)
+ /locus_tag="BQ2027_MB1209C"
+ /note="Mb1209c, -, len: 189 aa. Equivalent to Rv1176c,
+ len: 189 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 189 aa overlap). Conserved hypothetical
+ protein, some similarity to P94443|D78508 hypothetical
+ protein from Bacillus subtilis (182 aa), FASTA scores:
+ opt: 219, E(): 1.7e-15, (25.1% identity in 183 aa
+ overlap). Similar to Mycobacterium tuberculosis
+ hypothetical protein Rv0047c. Mb1209c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, PadR family"
+ /protein_id="SIT99810.1"
+ /db_xref="InterPro:IPR005149"
+ /db_xref="InterPro:IPR018309"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXK1"
+ /translation="MALPHAILVSLCEQASSGYELARRFDRSIGYFWTATHQQIYRTL
+ RVMENNNWVRATTVLQHGRPDKKVYAISDSGRAELARWIAEPLSPTRPGRGSALTDSS
+ TRDIAVKLRGAGYGDVAALYTQVTALRAERVKSLDTYRGIEKRTFADPSALDGAALHQ
+ YLVLRGGIRAEESAIDWLDEVAEALQEKR"
+ gene 1310282..1310608
+ /gene="fdxC"
+ /locus_tag="BQ2027_MB1210"
+ CDS 1310282..1310608
+ /gene="fdxC"
+ /locus_tag="BQ2027_MB1210"
+ /note="Mb1210, fdxC, len: 108 aa. Equivalent to Rv1177,
+ len: 108 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 108 aa overlap). Probable fdxC,
+ ferredoxin (EC 1.-.-.-), equivalent to
+ NP_302047.1|NC_002677 ferredoxin from Mycobacterium leprae
+ (108 aa); P00215|FER_MYCSM FERREDOXIN from Mycobacterium
+ smegmatis (106 aa), FASTA scores: opt: 705, E(): 0, (87.7%
+ identity in 106 aa overlap). Also highly similar to many
+ e.g. JH0239 ferredoxin precursor from Saccharopolyspora
+ erythraea (105 aa); P24496|FER_SACER FERREDOXIN from
+ Saccharopolyspora erythraea (106 aa); etc. Contains
+ PS00198 4Fe-4S ferredoxins, iron-sulfur binding region
+ signature. BELONGS TO THE BACTERIAL TYPE FERREDOXIN
+ FAMILY. COFACTOR: BINDS 1 4FE-4S CLUSTER AND A 3FE-4S
+ CLUSTER. Protein product from Mb1210 detected using
+ shotgun mass spectrometry. Mb1210 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FERREDOXIN FDXC"
+ /protein_id="SIT99811.1"
+ /db_xref="GOA:A0A1R3XXL0"
+ /db_xref="InterPro:IPR000813"
+ /db_xref="InterPro:IPR017896"
+ /db_xref="InterPro:IPR017900"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXL0"
+ /translation="MTYTIAEPCVDIKDKACIEECPVDCIYEGARMLYIHPDECVDCG
+ ACEPVCPVEAIFYEDDVPEQWSHYTQINADFFAELGSPGGAAKVGMTENDPQAVKDLA
+ PQSEDA"
+ gene 1310641..1311729
+ /locus_tag="BQ2027_MB1211"
+ CDS 1310641..1311729
+ /locus_tag="BQ2027_MB1211"
+ /note="Mb1211, -, len: 362 aa. Equivalent to Rv1178, len:
+ 362 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 362 aa overlap). Probable
+ aminotransferase (EC 2.6.1.-), weak similarity to many
+ aspartate aminotransferases e.g. Q55679|D64000 SLL0006
+ aspartate aminotransferase from Synechocystis sp. (394
+ aa), FASTA scores: opt: 218, E(): 1.3e-25, (32.5% identity
+ in 379 aa overlap). Contains PS00105 Aminotransferases
+ class-I pyridoxal-phosphate attachment site. Also similar
+ to Mycobacterium tuberculosis aminotransferases Rv2294,
+ Rv0075, etc. Protein product from Mb1211 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1211 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE AMINOTRANSFERASE"
+ /protein_id="SIT99812.1"
+ /db_xref="GOA:A0A1R3XZP9"
+ /db_xref="InterPro:IPR004838"
+ /db_xref="InterPro:IPR004839"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="InterPro:IPR019880"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZP9"
+ /translation="MSASLPVFPWDTLADAKALAGAHPDGIVDLSVGTPVDPVAPLIQ
+ EALAAASAAPGYPATAGTARLRESVVAALARRYGITRLTEAAVLPVIGTKELIAWLPT
+ LLGLGGADLVVVPELAYPTYDVGARLAGTRVLRADALTQLGPQSPALLYLNSPSNPTG
+ RVLGVDHLRKVVEWARGRGVLVVSDECYLGLGWDAEPVSVLHPSVCDGDHTGLLAVHS
+ LSKSSSLAGYRAGFVVGDLEIVAELLAVRKHAGMMVPAPVQAAMVAALDDDAHERQQR
+ ERYAQRRAALLPALGSAGFAVDYSDAGLYLWATRGEPCRDSVAWLAQRGILVAPGDFY
+ GPGGAQHVRVALTATDERVAAAVGRLTC"
+ gene complement(1311757..1314576)
+ /locus_tag="BQ2027_MB1212C"
+ CDS complement(1311757..1314576)
+ /locus_tag="BQ2027_MB1212C"
+ /note="Mb1212c, -, len: 939 aa. Equivalent to Rv1179c,
+ len: 939 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 939 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1212c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1212c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA or RNA helicases of superfamily II"
+ /protein_id="SIT99813.1"
+ /db_xref="GOA:A0A1R3XYJ4"
+ /db_xref="InterPro:IPR006935"
+ /db_xref="InterPro:IPR014001"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ4"
+ /translation="MDPHRDLESRAFAGNWRVYQQQALDAFDADVAAGDNRAYLVLPP
+ GAGKTMIGLEAARRLGRRSLVLVPNTAVQAQWAAAWDNSFPSSDRSASKCGTERGLAS
+ AMNVLTYQSLAVIDAETDSTVRREVLRNRDQQALLDLLHPNGRAVIERAATLGPWTLV
+ LDECHHLLATWGALVSALASVLGAQTALIGLTATPATELTAWQHTLHDELFGTADFVI
+ PTPALVREGDLAPYQELVYLTQPTPEEQAWIGTHRARFADLMLALIDQKVGSMSLAAW
+ LHTRIVDRATREGNQIAWSTFERAEPDLACSGLRFAYDGLIPLPDGVRLREQHRIAPD
+ AQDWVNVLTDFSVGHLQQSADPRDAHALTAIKRVLPGLGYRLTSRGVRVATSPVDRLC
+ ALSESKIAATAHILDTEDAVLGARLRALVLCDFESMTGALPTSLKGAPVSEQSGSAQL
+ VAAMLAASDHRRRTPLHALLVTGQTFACPAAIEDDLIAFCAERGALVTAEPLDAHPSL
+ RVMRGTGGFTPRTWVALATEYFLAGRARVLVGTRSLLGEGWDCAAVNVNIDLTSATTQ
+ AAITQMRGRAIRNDPSDGHKVADNWSVCCIATEHPRGDADYLRLVRKHDGYYAATPQG
+ LIESGVTHCDPSLSPYGPPVTDTHAITARALQRVAERAQARSWWRIGEPYEGVDVATI
+ RVRSRQPLGVAAPRIPASALTPPVPGQFSPVRLARGAVAAVSVVGASTATAVASANLG
+ MLAGAGTAGAIVAAGVGLVATAAAAESRRLDHAPNALEQLAAVVADALYAAGGAQRGS
+ AALRLASDPEGWIRCQLDGVPTEQSLRFTAALDELLAPLAEPRYLIGRKILTPPARPV
+ ARRLFAVRAVVGLSLPGTVAWHAVPRWFARNKDRRQHLAQAWRKHIGPPRQLPADSPQ
+ GQAILDLFRGDNPLSVTTQLRTTWR"
+ gene 1315003..1321260
+ /gene="pks3"
+ /locus_tag="BQ2027_MB1213"
+ CDS 1315003..1321260
+ /gene="pks3"
+ /locus_tag="BQ2027_MB1213"
+ /note="Mb1213, pks3, len: 2085 aa. Equivalent to Rv1180
+ and Rv1181, len: 488 aa and 1582 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100% identity in 488 aa
+ overlap and 99.9% identity in 1582 aa overlap). Probable
+ polyketide beta-ketoacyl synthase (EC 2.3.1.-), similar to
+ the N-terminus of many polyketide synthases e.g.
+ MCAS_MYCBO|Q02251 mycocerosic acid synthase from
+ mycobacterium bovis (2110 aa), FASTA scores: opt: 2115,
+ E(): 0, (66.5% identity in 472 aa overlap). Also similar
+ to, and same length as P96284|Z83858|MTCY24G1.02 M.
+ tuberculosis (496 aa), FASTA scores: opt: 1424, E(): 0,
+ (50.9% identity in 444 aa overlap). Contains possible
+ signal sequence and PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site, also PS00606
+ Beta-ketoacyl synthases active site. BELONGS TO THE
+ BETA-KETOACYL-ACP SYNTHASES FAMILY. Probable polyketide
+ synthase, similar to many e.g. MCAS_MYCBO|Q02251
+ mycocerosic acid synthase from mycobacterium bovis (2110
+ aa), FASTA scores: opt: 3518, E(): 0, (59.7% identity in
+ 1614 aa overlap). Note that this similarity extends
+ upstream of the first initiation codon into the upstream
+ MTV005.16; however the stop codon at the end of MTV005.16
+ is present in at least 4 independent clones (BAC, cosmid
+ and pUC) from the genome. The two CDS's may represent
+ separate modules of the polyketide synthase.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1180 and Rv1181 exist as 2
+ genes. In Mycobacterium bovis, a single base transversion
+ (a-c) leads to a single product (similar to other
+ organisms). Protein product from Mb1213 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1213 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable polyketide beta-ketoacyl synthase pks4"
+ /protein_id="SIT99814.1"
+ /db_xref="GOA:A0A1R3XXM6"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013149"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR013968"
+ /db_xref="InterPro:IPR014030"
+ /db_xref="InterPro:IPR014031"
+ /db_xref="InterPro:IPR014043"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="InterPro:IPR016036"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR018201"
+ /db_xref="InterPro:IPR020801"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR020807"
+ /db_xref="InterPro:IPR020841"
+ /db_xref="InterPro:IPR020843"
+ /db_xref="InterPro:IPR032821"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="InterPro:IPR042104"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXM6"
+ /translation="MRTATATSVAVIGMACRLPGGIDSPQRLWEALLRGDDLVGEIPA
+ DRWDANVYYDPEPGVPGRSVSRWGAFLDDVGGFDCDFFGLTEREATAIDPQHRLLLEV
+ SWEAIEHAGVDPATLAESQTGVFVGLTHGDYELLSADCGAAEGPYGFTGTSNSFASGR
+ VAYTLGLHGPAVTVDTACSSGLTAVHQACRSLDDGESDLALAGGVVVTLEPRKSVSGS
+ LQGMLSPTGRCHAFDEAADGFVSGEGCVVLLLKRLPDAVRDGDRVLAIVRGTAANQDG
+ RTVNIAAPSAQAQIAVYQQALAAAGVEASTVGMVEAHGTGTPVGDPVEYASLAAVYGT
+ EGPCALTSVKTNFGHLQSASGPLGLMKTILALRHGVVPQNLHFCRLPDQLAEIDTELF
+ VPQANTSWPDNTGQPRRAAVSSYGMSGTNVHAILEQAPVSEPAASGPELTPEAGGLAL
+ FPVSATSAEQLHVTAARLADWVDQNGNAGSRVSMRDLGYTLSCRRAHRPVRTVVTASS
+ FDELSAALRDVAGDQIPYQPAVGHDDRGPVWVFSGQGSQWPGMGTELLVAEPVFAATV
+ AAMEPVIARESGFSVTEAMSAPQTVSGIDRVQPTIFAVQVALAAALKSYGVRPGAIIG
+ HSLGEAAAAVVAGALSLHDGLRVICRRSRLMSRIAGSGAMASVELPGQQVLSELAIRG
+ ISDVVLSVVASPTSTVVGGATQSIRDLVAAWEQQDVLAREVAVDVASHTPQVDPILDE
+ LLEVLAEVDPTAPEIPYYSATLWDPRERPSFTGEYWVENLRYTVRFAAAVQAALKDGY
+ RVFGELAPHPLLTYAVEQNAASLDMPIATLAAMRRGEQLPFGLRGFVADVHNAGAKVD
+ FSVQYPDGRLVDAPLPSWTHRTLMLSREDSHRSHTGAVQAVHPLLGAHVHLLEEPERH
+ VWQAGVGTGAHPWLGDHRIHNVAAFPGAAYCEMALAAARTTLGELSEVRDIKFEQTLL
+ LDEQTVVSSAATIAAPGILQFAVESHQEGEPARRASAMLHALEEMPQPPGYDTNALTA
+ AHESSMSGEELRKMFNSLGIQYGPAFSGLVAVHTARGAVTTVLAEVALPGAIRSQQSA
+ YASHPALLDACFQSVLVHPEVQKATVGGLMLPVGVRRLRNYHSTRSAHYCLARVTSSS
+ RAGECEADLDVFDQAGTVLLTVEGLRLAAGISEHERANRVFDERLLTIEWERGELPEV
+ PQIDAGSWLLLSASEADPLTAQLADALNAVGAQSTSVASASDVAQLRSLLGGRLTGVV
+ VVTGPPTGGLTQCGRDYVSQLVGIARELAELPGEPPRLFVVTRSAASVLPSDLANLEQ
+ AGLRGLMRVIDSEHPHLGATAIDVDNDETVAALVASQLQSGSQEDETAWRNGIWYTAR
+ LRPGPLRPAERRTAVVEYRRDGMRLQIRTPGDLESLEFVTFDRVAPGPGEIEVAVTAS
+ SVNFADVLVAFGRYPTFEGYRQQLGIDFAGVVTAVGPDVTEHRIGDHVGGMSANGCWS
+ TFVRCDARLAVTLPPELPVAAAAAVPTASATAWYALHDLARICSDDKVLIHSGTGGVG
+ QAAIAIARAAGCEIFATAGSAQRRQLLHDMGVEHVYDSRSTEFAEQIRGDTDGYGVDV
+ VLNSLPGAAQRAGIELLAFGGRFVEIGKRDIYGDTRLGLFPFRRNLSLYAVDLALLTH
+ SHPHTVRRLLKTVYQHTVEGTLPVPQTTHYPIHDAAVAIRLVGGAGHTGKVVLDVPRT
+ GEGVAVVPPEQVRTSRPDGAYLVTGGLGGLGLFLAGELAAAGCGRIVLNSRSTPSPHA
+ TRVIERLRAAGADIQVECGDIADAATAHRVVAVATASGLPVRGVLHAAAVVEDATLAN
+ VTDELIDRCWAPKVHGAWNIHRATAAQPLEWFCLFSSAAALVGSPGQGAYAAANSWLD
+ AFAHWRRAQGLPATSIAWGAWAEIGRATALAEGTGAAIAPAEGARAFQTLLRYGRAYS
+ GYAPIMGTPWLTAFAQRSRFAEAFHATGQNQPATGKFLAELGSLPREEWPRTVRRLVS
+ DQISLLLRRTIDPDRPLSDYGLDSLGNLELRTRIETETGIRVSPTKITTVRGLAEHVC
+ DELAAAQSAPV"
+ gene 1321313..1322731
+ /gene="papA3"
+ /locus_tag="BQ2027_MB1214"
+ CDS 1321313..1322731
+ /gene="papA3"
+ /locus_tag="BQ2027_MB1214"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1214, papA3, len: 472 aa. Equivalent to Rv1182,
+ len: 472 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 472 aa overlap). Probable papA3,
+ conserved polyketide synthase (PKS) associated protein,
+ similar to other Mycobacterial hypothetical proteins e.g.
+ Q49618|U00010 B1170_C1_180 from Mycobacterium leprae (471
+ aa), FASTA scores: opt: 2526, E(): 0, (75.6% identity in
+ 471 aa overlap). Similar to other Mycobacterium
+ tuberculosis hypothetical papA proteins; Rv3824c, Rv3820c,
+ Rv1528c. Protein product from Mb1214 detected using SWATH
+ mass spectrometry. Mb1214 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED POLYKETIDE SYNTHASE
+ ASSOCIATED PROTEIN PAPA3"
+ /protein_id="SIT99815.1"
+ /db_xref="InterPro:IPR001242"
+ /db_xref="InterPro:IPR023213"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXY4"
+ /translation="MLRVGPLTIGTLDDWAPSTGSTVSWRPSAVAHTKASQAPISDVP
+ VSYMQAQHIRGYCEQKAKGLDYSRLMVVSCQQPGQCDIRAANYVINAHLRRHDTYRSW
+ FQYNGNGQIIRRTIQDPADIEFVPVHHGELTLPQIREIVQNTPDPLQWGCFRFGIVQG
+ CDHFTFFASVDHVHVDAMIVGVTLMEFHLMYAALVGGHAPLELPPAGSYDDFCRRQHT
+ FSSTLTVESPQVRAWTKFAEGTNGSFPDFPLPLGDPSKPSDADIVTVMMLDEEQTAQF
+ ESVCTAAGARFIGGVLACCGLAEHELTGTTTYYGLTPRDTRRTPADAMTQGWFTGLIP
+ ITVPIAGSAFGDAARAAQTSFDSGVKLAEVPYDRVVELSSTLTMPRPNFPVVNFLDAG
+ AAPLSVLLTAELTGTNIGVYSDGRYSYQLSIYVIRVEQGTAVAVMFPDNPIARESVAR
+ YLATLKSVFQRVAESGQQQNVA"
+ gene 1322798..1325806
+ /gene="mmpL10"
+ /locus_tag="BQ2027_MB1215"
+ CDS 1322798..1325806
+ /gene="mmpL10"
+ /locus_tag="BQ2027_MB1215"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1215, mmpL10, len: 1002 aa. Equivalent to Rv1183,
+ len: 1002 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100% identity in 1002 aa overlap). Probable
+ mmpL10, conserved transmembrane transport protein (see
+ first citation below), member of RND superfamily, similar
+ to many Mycobacterial hypothetical membrane proteins e.g.
+ Q49619|U00010 from Mycobacterium leprae (1008 aa), FASTA
+ scores: opt: 4545, E(): 0, (70.6% identity in 978 aa
+ overlap); etc. BELONGS TO THE MMPL FAMILY. Mb1215 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL10"
+ /protein_id="SIT99816.1"
+ /db_xref="GOA:P65373"
+ /db_xref="InterPro:IPR004707"
+ /db_xref="InterPro:IPR004869"
+ /db_xref="UniProtKB/Swiss-Prot:P65373"
+ /translation="MVGCWVALALVLPMAVPSLAEMAQRHPVAVLPADAPSSVAVRQM
+ AEAFHESGSENILVVLLTDEKGLGAADENVYHTLVDRLRNDAKDVVMLQDFLTTPPLR
+ EVLGSKDGKAWILPIGLAGDLGTPKSYHAYTDVERIVKRTVAGTTLTANVTGPAATVA
+ DLTDAGARDRASIELAIAVMLLVILMVIYRNPVTMLLPLVTIGASLMTAQALVAGVSL
+ VGGLAVSNQAIVLLSAMIAGAGTDYAVFLISRYHEYVRLGEHPERAVQRAMMSVGKVI
+ AASAATVGITFLGMRFAKLGVFSTVGPALAIGIAVSFLAAVTLLPAILVLASPRGWVA
+ PRGERMATFWRRAGTRIVRRPKAYLGASLIGLVALASCASLAHFNYDDRKQLPPSDPS
+ SVGYAAMEHHFSVNQTIPEYLIIHSAHDLRTPRGLADLEQLAQRVSQIPGVAMVRGVT
+ RPNGETLEQARATYQAGQVGNRLGGASRMIDERTGDLNRLASGANLLADNLGDVRGQV
+ SRAVAGVRSLVDALAYIQNQFGGNKTFNEIDNAARLVSNIHALGDALQVNFDGIANSF
+ DWLDSVVAALDTSPVCDSNPMCGNARVQFHKLQTARDNGTLDKVVGLARQLQSTRSPQ
+ TVSAVVNDLGRSLNSVVRSLKSLGLDNPDAARARLISMQNGANDLASAGRQVADGVQM
+ LVDQTKNMGIGLNQASAFLMAMGNDASQPSMAGFNVPPQVLKSEEFKKVAQAFISPDG
+ HTVRYFIQTDLNPFSTAAMDQVNTIIDTAKGAQPNTSLADASISMSGYPVMLRDIRDY
+ YERDMRLIVAVTVVVVILILMALLRAIVAPLYLVGSVVISYMSAIGLGVVVFQVFLGQ
+ ELHWSVPGLAFVVLVAVGADYNMLLASRLRDESALGVRSSVIRTVRCTGGVITAAGLI
+ FAASMSGLLFSSIGTVVQGGFIIGVGILIDTFVVRTITVPAMATLLGRASWWPGHPWQ
+ RCAPEEGQMSARMSARTKTVFQAVADGSKR"
+ gene complement(1325810..1326889)
+ /locus_tag="BQ2027_MB1216C"
+ CDS complement(1325810..1326889)
+ /locus_tag="BQ2027_MB1216C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1216c, -, len: 359 aa. Equivalent to Rv1184c,
+ len: 359 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 359 aa overlap). Possible exported
+ protein with potential N-terminal signal sequence. Similar
+ to several Mycobacterial hypothetical proteins e.g.
+ Q49633|U00010) Protein B1170_F3_112 from M. leprae (391
+ aa), FASTA scores: opt: 1422, E(): 0, (62.7% identity in
+ 338 aa overlap). Also similar to Rv3822, Rv3539, Rv1430,
+ Rv0151c, etc. Protein product from Mb1216c detected using
+ SWATH mass spectrometry. Mb1216c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE EXPORTED PROTEIN"
+ /protein_id="SIT99817.1"
+ /db_xref="InterPro:IPR013228"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXL5"
+ /translation="MKRVIAGAFAVWLVGWAGGFGTAIAASEPAYPWAPGPPPSPSPV
+ GDASTAKVVYALGGARMPGIPWYEYTNQAGSQYFPNAKHDLIDYPAGAAFSWWPTMLL
+ PPGSHQDNMTVGVAVKDGTNSLDNAIHHGTDPAAAVGLSQGSLVLDQEQARLANDPTA
+ PAPDKLQFTTFGDPTGRHAFGASFLARIFPPGSHIPIPFIEYTMPQQVDSQYDTNHVV
+ TAYDGFSDFPDRPDNLLAVANAAIGAAIAHTPIGFTGPGDVPPQNIRTTVNSRGATTT
+ TYLVPVNHLPLTLPLRYLGMSDAEVDQIDSVLQPQIDAAYARNDNWFTRPVSVDPVRG
+ LDPLTAPGSIVEGARGLLGSPAFGG"
+ gene complement(1327054..1328790)
+ /gene="fadD21"
+ /locus_tag="BQ2027_MB1217C"
+ CDS complement(1327054..1328790)
+ /gene="fadD21"
+ /locus_tag="BQ2027_MB1217C"
+ /note="Mb1217c, fadD21, len: 578 aa. Equivalent to
+ Rv1185c, len: 578 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 578 aa overlap). Probable
+ fadD21, fatty-acid-CoA synthetase (EC 6.2.1.-), highly
+ similar to several from Mycobacteria e.g.
+ NP_301895.1|NC_002677 possible acyl-CoA synthase from
+ Mycobacterium leprae (579 aa); P71495|U75685 ACYL-COA
+ SYNTHASE from Mycobacterium bovis (582 aa), FASTA scores:
+ opt: 2388, E(): 0, (61.8% identity in 579 aa overlap);
+ etc. SEEMS TO BELONG TO THE ATP-DEPENDENT AMP-BINDING
+ ENZYME FAMILY. Protein product from Mb1217c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1217c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable fatty-acid-amp ligase fadd21
+ (fatty-acid-amp synthetase) (fatty-acid-amp synthase)"
+ /protein_id="SIT99818.1"
+ /db_xref="GOA:P63524"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR040097"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/Swiss-Prot:P63524"
+ /translation="MSDSSVLSLLRERAGLQPDDAAFTYIDYEQDWAGITETLTWSEV
+ FRRTRIVAHEVRRHCTTGDRAVILAPQGLAYIAAFLGSMQAGAIAVPLSVPQIGSHDE
+ RVSAVLADASPSVILTTSAVAEAVAEHIHRPNTNNVGPIIEIDSLDLTGNSPSFRVKD
+ LPSAAYLQYTSGSTRAPAGVMISHRNLQANFQQLMSNYFGDRNGVAPPDTTIVSWLPF
+ YHDMGLVLGIIAPILGGYRSELTSPLAFLQRPARWLHSLANGSPSWSAAPNFAFELAV
+ RKTTDADIEGLDLGNVLGITSGAERVHPNTLSRFCNRFAPYNFREDMIRPSYGLAEAT
+ LYVASRNSGDKPEVVYFEPDKLSTGSANRCEPKTGTPLLSYGMPTSPTVRIVDPDTCI
+ ECPAGTIGEIWVKGDNVAEGYWNKPDETRHTFGAMLVHPSAGTPDGSWLRTGDLGFLS
+ EDEMFIVGRMKDMLIVYGRNHYPEDIESTVQEITGGRVAAISVPVDHTEKLVTVIELK
+ LLGDSAGEAMDELDVIKNNVTAAISRSHGLNVADLVLVPPGSIPTTTSGKIRRAACVE
+ QYRLQQFTRLDG"
+ gene complement(1328967..1330583)
+ /locus_tag="BQ2027_MB1218C"
+ CDS complement(1328967..1330583)
+ /locus_tag="BQ2027_MB1218C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1218c, -, len: 538 aa. Equivalent to Rv1186c,
+ len: 538 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 538 aa overlap). Conserved hypothetical
+ protein, similar to AL117385|SC5G9.24 hypothetical protein
+ from Streptomyces coelicolor (555 aa), FASTA scores: opt:
+ 485, E(): 2.3e-23, (32.6% identity in 568 aa overlap).
+ Contains helix turn helix motif from aa 488-509 (+2.81
+ SD). Mb1218c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Regulator of polyketide synthase expression"
+ /protein_id="SIT99819.1"
+ /db_xref="InterPro:IPR025736"
+ /db_xref="InterPro:IPR042070"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXM3"
+ /translation="MRIAGVGLGQLLLALDATVVSLVDAPRGLDLPVASTALIDSDDV
+ RLGLAAAAGSADVFFLIGVTDDEAVRWVDDQARQRAPVAIFVKHPSDSVVAGAVRAGS
+ AVVAVEPRARWERLYHLVNHVLEHHGDRADPTDDSGTDLFGLAQSLADRIHGMISIED
+ AQSHVLAYSASNDEADELRRLSILGRAGPPEHLQWIGQWGIFDALRAGREVVRVAERP
+ ELGLRPRLAIGIHQPGVGALRPPVFAGTIWVQQGSQPLADDAEEMLRGAAVLAARIMS
+ RLATQPNTHALRVQQLLGLAELNATTAPVDVSTIARELGVAAEGNATLIGFDTAENRD
+ TAVRHVRLVDVMALSASAFRHDAQVAANGSRIYVLLPQTTTGRAVTSWVRGTISALRA
+ ELGVALRAAIAGPVAGLAEVNPARVEVDRVLESAERHPILGQVTSLAEARTTVLLDEI
+ VTLVGTDQRLVDPRIRDLGAQDPVLAQTLRAYLDAFGDIGAAARSLQVHPNTVRYRIR
+ RIEQLLSTSLGDPDVRLLFSLGLRAMERTA"
+ gene 1330668..1332299
+ /gene="rocA"
+ /locus_tag="BQ2027_MB1219"
+ CDS 1330668..1332299
+ /gene="rocA"
+ /locus_tag="BQ2027_MB1219"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1219, rocA, len: 543 aa. Equivalent to Rv1187,
+ len: 543 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 543 aa overlap). Probable rocA,
+ pyrroline-5-carboxylate dehydrogenase (EC 1.5.1.12),
+ similar to many e.g. PUT2_HUMAN|P30038 human
+ delta-1-pyrroline-5-carboxylate dehydrogenase (563 aa),
+ FASTA scores: opt: 1596, E():0, (46.0% identity in 531 aa
+ overlap). Also similar to other Mycobacterium tuberculosis
+ hypothetical dehydrogenases e.g. Rv0768, Rv2858c, etc.
+ Contains PS00687 Aldehyde dehydrogenases glutamic acid
+ active site and PS00070 Aldehyde dehydrogenases cysteine
+ active site. Protein product from Mb1219 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1219 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PYRROLINE-5-CARBOXYLATE DEHYDROGENASE
+ ROCA"
+ /protein_id="SIT99820.1"
+ /db_xref="GOA:A0A1R3XXL2"
+ /db_xref="InterPro:IPR005931"
+ /db_xref="InterPro:IPR015590"
+ /db_xref="InterPro:IPR016160"
+ /db_xref="InterPro:IPR016161"
+ /db_xref="InterPro:IPR016162"
+ /db_xref="InterPro:IPR016163"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXL2"
+ /translation="MDAITQVPVPANEPVHDYAPKSPERTRLRTELASLADHPIDLPH
+ VIGGRHRMGDGERIDVVQPHRHAARLGTLTNATHADAAAAVEAAMSAKSDWAALPFDE
+ RAAVFLRAADLLAGPWREKIAAATMLGQSKSVYQAEIDAVCELIDFWRFNVAFARQIL
+ EQQPISGPGEWNRIDYRPLDGFVYAITPFNFTSIAGNLPTAPALMGNTVIWKPSITQT
+ LAAYLTMQLLEAAGLPPGVINLVTGDGFAVSDVALADPRLAGIHFTGSTATFGHLWQW
+ VGTNIGRYHSYPRLVGETGGKDFVVAHASARPDVLRTALIRGAFDYQGQKCSAVSRAF
+ IAHSVWQRMGDELLAKAAELRYGDITDLSNYGGALIDQRAFVKNVDAIERAKGAAAVT
+ VAVGGEYDDSEGYFVRPTVLLSDDPTDESFVIEYFGPLLSVHVYPDERYEQILDVIDT
+ GSRYALTGAVIADDRQAVLTALDRLRFAAGNFYVNDKPTGAVVGRQPFGGARGSGTND
+ KAGSPLNLLRWTSARSIKETFVAATDHIYPHMAVD"
+ gene 1332299..1333288
+ /locus_tag="BQ2027_MB1220"
+ CDS 1332299..1333288
+ /locus_tag="BQ2027_MB1220"
+ /note="Mb1220, -, len: 329 aa. Equivalent to Rv1188, len:
+ 329 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 329 aa overlap). Possible putA, proline
+ dehydrogenase (EC 1.5.99.8), similar to part of
+ Q52711|X78346 proline dehydrogenase from Rhodobacter
+ capsulatus (1127 aa), FASTA scores: opt: 194, E():
+ 1.5e-07, (31.2% identity in 349 aa overlap). Also similar
+ to two Bacillus subtilis proline dehydrohenases
+ E1184363|Z99120 (302 aa), FASTA scores: opt: 509, E(): 0,
+ (37.1% identity in 313 aa overlap); and E1182272|Z99105
+ (303 aa), FASTA scores: opt: 513, E(): 0, (32.5% identity
+ in 311 aa overlap). Highly similar to AL035569|SC8D9.31
+ Streptomyces coelicolor (308 aa), FASTA scores: opt: 984,
+ E(): 0, (50.0% identity in 312 aa overlap). Protein
+ product from Mb1220 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1220 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PROLINE DEHYDROGENASE"
+ /protein_id="SIT99821.1"
+ /db_xref="GOA:A0A1R3XXM0"
+ /db_xref="InterPro:IPR002872"
+ /db_xref="InterPro:IPR008219"
+ /db_xref="InterPro:IPR015659"
+ /db_xref="InterPro:IPR029041"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXM0"
+ /translation="MAGWFAHTLRPAMLAAGRSDRLGRIVERSPLTRGVVRRFVPGDT
+ LDDVVDIVTALRDSGRYLSIDYLGENVTDADDAAAAVRAYLGLLDVLGRRGDIACDGV
+ RPLEVSLKLSALGQALDRDGQKIALDNARAICERAERVGAWVTVDAEDHTTTDSTLSI
+ SGDLRVDFPWLGTVVQAYLRRTLADCAELAAVGARVRLCKGAYDEPASVAYRDAAQVT
+ DSYLRCLRVLTAGRGYPMVATHDPVIIAAVPGITRESGRSQGDFEYQMLYGVRDDEQR
+ RLTGAGNHVRVYVPFGTRWYGYFLRRLAERPANLAFFLRALTDRRRARGCAER"
+ gene 1333370..1334242
+ /gene="sigI"
+ /locus_tag="BQ2027_MB1221"
+ CDS 1333370..1334242
+ /gene="sigI"
+ /locus_tag="BQ2027_MB1221"
+ /note="Mb1221, sigI, len: 290 aa. Equivalent to Rv1189,
+ len: 290 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 290 aa overlap). Possible sigI,
+ alternative RNA polymerase sigma factor (see citation
+ below), similar to several e.g. O05767|U87307
+ extracytoplasmic function alternative sigma factor (sigE)
+ from M. smegmatis (204 aa), FASTA scores: opt: 239, E():
+ 1.3e-09, (32.9% identity in 167 aa overlap). Mb1221 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ALTERNATIVE RNA POLYMERASE SIGMA FACTOR
+ SIGI"
+ /protein_id="SIT99822.1"
+ /db_xref="GOA:A0A1R3XZQ9"
+ /db_xref="InterPro:IPR007627"
+ /db_xref="InterPro:IPR013249"
+ /db_xref="InterPro:IPR013324"
+ /db_xref="InterPro:IPR013325"
+ /db_xref="InterPro:IPR014284"
+ /db_xref="InterPro:IPR032710"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZQ9"
+ /translation="MSQHDPVSAAWRAHRAYLVDLAFRMVGDIGVAEDMVQEAFSRLL
+ RAPVGDIDDERGWLIVVTSRLCLDHIKSASTRRERPQDIAAWHDGDASVSSVDPADRV
+ TLDDEVRLALLIMLERLGPAERVVFVLHEIFGLPYQQIATTIGSQASTCRQLAHRARR
+ KINESRIAASVEPAQHRVVTRAFIEACSNGDLDTLLEVLDPGVAGEIDARKGVVVVGA
+ DRVGPTILRHWSHPATVLVAQPVCGQPAVLAFVNRALAGVLALSIEAGKITKIHVLVQ
+ PSTLDPLRAELGGG"
+ gene 1334258..1335136
+ /locus_tag="BQ2027_MB1222"
+ CDS 1334258..1335136
+ /locus_tag="BQ2027_MB1222"
+ /note="Mb1222, -, len: 292 aa. Equivalent to Rv1190, len:
+ 292 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 292 aa overlap). Conserved hypothetical
+ protein, similar to Rv1833c|Y0DA_MYCTU|Q50600 hypothetical
+ 32.2 kd protein cy1a11.10 (286 aa), fasta scores: opt:
+ 331, E(): 1.4e-15, (29.0% identity in 272 aa overlap),
+ also YU14_MYCTU|Q50670 putative haloalkane dehalogenase
+ (300 aa), FASTA scores: opt: 239, E(): 2.2e-09, (29.9%
+ identity in 298 aa overlap). Protein product from Mb1222
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Hydrolase, alpha/beta fold family"
+ /protein_id="SIT99823.1"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYK6"
+ /translation="MTMKSLAALDRPSWLSSSAWPWQPYLLSHHQGGIAVTDIGDGPA
+ VLFVHVGSWSFVWRDVLLRLANDFRCVAIDAPGCGLSDRLSTPPTLAQAADAITSVID
+ ALQLRDLTLVAHDLGGPAGFLAAARRGDRVAALAAVNCFAWRPTGPLFRGMLAAMGSA
+ PVRELDAAINALARATSTRFGAGRHWSRADRAAFRAGIDAPARRAWHAYFRDARRAHA
+ LYTDVDAALRGGLADRPLLTIFGQFNDPLRFQPRWKELFPTARQLQVRRGNHFPMCDD
+ PDLVAGALTSFVQRST"
+ gene 1335209..1336123
+ /locus_tag="BQ2027_MB1223"
+ CDS 1335209..1336123
+ /locus_tag="BQ2027_MB1223"
+ /note="Mb1223, -, len: 304 aa. Equivalent to Rv1191, len:
+ 304 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 304 aa overlap). Conserved hypothetical
+ protein, similar to Q54528 RDMC from Streptomyces
+ purpurascens (298 aa), FASTA scores: opt: 196, E():
+ 1.5e-05, (27.5% identity in 269 aa overlap);
+ Rv0134|MTCI5.08 (300 aa), FASTA scores: opt: 197, E():
+ 6.6e-06, (26.4% identity in 299 aa overlap), some
+ similarity to PIP_NEIGO|P42786 proline iminopeptidase (EC
+ 3.4.11.5) (310 aa), FASTA scores: opt: 196, E(): 1.3e-05,
+ (32.2% identity in 152 aa overlap). Contains PS00044
+ Bacterial regulatory proteins, lysR family signature.
+ Protein product from Mb1223 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1223 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative hydrolase"
+ /protein_id="SIT99824.1"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXN6"
+ /translation="MAVAIARPKLEGNIAVGEDRRIGFAEFGAPQGRAVFWLHGTPGA
+ RRQIPTEARVYAEHHNIRLIGVDRPGIGASTPHQYETILAFADDLRTIADTLGIDKMA
+ VVGLSGGGPYTLACAAGLPDRVVAAGVLGGVAPTRGPDAISGGLMRLGSAVAPLLQVG
+ GTPLRLGASLLIRAARPVASPALDLYGLLSPRADRHLLARPEFKAMFLDDLLNGSRKQ
+ LAAPFADVIAFARDWGFRLDEVKVPVRWWHGDHDHIVPFSHGEHVVSRLPDAKLLHLP
+ GESHLAGLGRGEEILSTLMQIWDRDLRK"
+ gene 1336205..1337032
+ /locus_tag="BQ2027_MB1224"
+ CDS 1336205..1337032
+ /locus_tag="BQ2027_MB1224"
+ /note="Mb1224, -, len: 275 aa. Equivalent to Rv1192, len:
+ 275 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 275 aa overlap). Hypothetical unknown
+ protein, contains PS00120 lipases, serine active site.
+ Protein product from Mb1224 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1224 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIT99825.1"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXZ3"
+ /translation="MLLPVLEPADRPCDAPGWFLYLTDIPRAGVEYGQLLAVLPLQRM
+ LPAGDGHPVLVLPGLLAGDGSTWILRRILRRLGYAAYGWGLGRNIGPTAKAVSGMRDL
+ LDKLHSRYHTPVSLIGWSLGGIFARGLARDHPSAVRQVITLGSPFGMRDTCETRSAWS
+ FNRYAHLHTERHELPLEMESEPLPVPTTAIYSRCDGMVAWQTCMNSPSERAENIAVRS
+ SHIGYGHNPPVVWAIADRLAQPQGAWAPFRPPKVLSPLFPRPDTPAEAVSTPQTRPA"
+ gene 1337072..1338493
+ /gene="fadD36"
+ /locus_tag="BQ2027_MB1225"
+ CDS 1337072..1338493
+ /gene="fadD36"
+ /locus_tag="BQ2027_MB1225"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1225, fadD36, len: 473 aa. Equivalent to Rv1193,
+ len: 473 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 473 aa overlap). Probable fadD36,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), highly similar to
+ Q50017|U15181 4-coumarate-CoA ligase from Mycobacterium
+ leprae (476 aa), FASTA scores: opt: 2594, E(): 0, (81.3%
+ identity in 476 aa overlap). Also highly similar to others
+ e.g. CAB86109.1|AL163003 putative fatty acid synthase from
+ Streptomyces coelicolor (485 aa); LCFA_ECOLI|P29212
+ long-chain-fatty-acid--CoA ligase from Escherichia coli
+ (561 aa), FASTA scores: opt: 605, E(): 8.4e-30, (33.0%
+ identity in 364 aa overlap); etc. Contains PS00455
+ Putative AMP-binding domain signature. BELONGS TO THE
+ ATP-DEPENDENT AMP-BINDING ENZYME FAMILY. Protein product
+ from Mb1225 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1225 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY-ACID-COA LIGASE FADD36
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="SIT99826.1"
+ /db_xref="GOA:A0A1R3XXM7"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR025110"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXM7"
+ /translation="MLLASLNPAVVSAADIADAVRIDGDVLSRSDLVGAATSVAERVA
+ GAHRVAVLATPTASTVLAITGCLIAGVPVVPVPADVGVTERRHMLTDSGVQAWLGPLP
+ DDPAGLPHIPVRTHARSWHRYPEPSPGAIAMVVYTSGTTGPPKGVQLSRRAIAADLDA
+ LAEAWQWTAEDVLVHGLPLYHVHGLVLGLLGSLRFGNRFVHTGKPTPAGYAQACYEAH
+ GTLFFGVPTVWSRVAADQAAAGALKPARLLVSGSAALPVPVFDKLVQLTGHRPVERYG
+ ASESLITLSTRADGERRPGWVGLPLAGVQTRLVDDDGGEVPHDGETVGKLQVRGPTLF
+ DGYLNQPDATAAAFDADSWYRTGDVAVVDGSGMHRIVGRESVDLIKSGGYRVGAGEIE
+ TVLLGHPDVAEAAVVGVPDDDLGQRIVAYVVGSANVDADGLINFVAQQLSVHKRPREV
+ RIVDALPRNALGKVLKKQLLSEG"
+ gene complement(1338526..1339791)
+ /locus_tag="BQ2027_MB1226C"
+ CDS complement(1338526..1339791)
+ /locus_tag="BQ2027_MB1226C"
+ /note="Mb1226c, -, len: 421 aa. Equivalent to Rv1194c,
+ len: 421 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 421 aa overlap). Conserved hypothetical
+ protein, highly similar to Q50018 possible transcriptional
+ activator from Mycobacterium leprae (517 aa), FASTA
+ scores: opt: 1960, E(): 0, (69.8% identity in 421 aa
+ overlap). Also similar to Mycobacterium tuberculosis
+ Rv2370c|MTCY27.10, (62.0% identity in 421 aa overlap) and
+ Rv1453|MTCY493.01c. Protein product from Mb1226c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1226c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible regulatory protein Trx"
+ /protein_id="SIT99827.1"
+ /db_xref="InterPro:IPR025736"
+ /db_xref="InterPro:IPR041522"
+ /db_xref="InterPro:IPR042070"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXM4"
+ /translation="MAWQQPSPRIRELIREGARIALNPSPEWIEELDRATIAANPAIA
+ NDPVLAKVVQTANRANLVYWAAANLRDPGARVPANLGTEPLRMARDLVRRGLDTVAFN
+ IYRTGEHIGWRFWMGIAFELTSDPQELRELLDVSARSVNDFIEATLTGIAAQVQSEHD
+ ELTRSTHAERLEVVGLILDGAPISPERAEAKLGYPLSRAHTAAIIWSDELDGDHSYLD
+ RAADLFCHAVGSTRPLTVVAGAASRWAWVTDADGLDIDTVQAAVDNAPGARIAIGTTA
+ NGVEGFRRSHLEALITQRTLSRLRSTQRVAFFADVKMVALISQNPDAASEFITSTLGD
+ LESASPDLQTALLTFINEQCNASRAAKRLHTHRNTFLRRLESAQRLLPRPLDHTSVHV
+ AVALEALQWRGNKAHALSSPGRRSNSVPA"
+ gene 1340281..1340580
+ /gene="PE13"
+ /locus_tag="BQ2027_MB1227"
+ CDS 1340281..1340580
+ /gene="PE13"
+ /locus_tag="BQ2027_MB1227"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1227, PE13, len: 99 aa. Equivalent to Rv1195,
+ len: 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 99 aa overlap). Member of Mycobacterium
+ tuberculosis PE family (see first citation below), e.g.
+ Y0DP_MYCTU|Q50615 hypothetical glycine-rich 40.8 kd
+ protein (498 aa), FASTA scores: opt: 307, E(): 1.4e-12,
+ (56.3% identity in 96 aa overlap), similar to
+ MTCY21C12.10c (99 aa), FASTA scores: opt:295, E():
+ 1.9e-11, (51.5% identity in 97 aa overlap). Mb1227 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe13"
+ /protein_id="SIT99828.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXM5"
+ /translation="MSFVMAYPEMLAAAADTLQSIGATTVASNAAAAAPTTGVVPPAA
+ DEVSALTAAHFAAHAAMYQSVSARAAAIHDQFVATLASSASSYAATEVANAAAAS"
+ gene 1340627..1341799
+ /gene="PPE18"
+ /locus_tag="BQ2027_MB1228"
+ CDS 1340627..1341799
+ /gene="PPE18"
+ /locus_tag="BQ2027_MB1228"
+ /standard_name="mtb39a"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1228, PPE18, len: 390 aa. Equivalent to Rv1196,
+ len: 391 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 391 aa overlap). PPE18 (alternate gene
+ name: mtb39a). Member of the Mycobacterium tuberculosis
+ PPE family of glycine-rich proteins, highly similar to
+ others e.g. Y07P_MYCTU|Q11031 hypothetical 40.0 kDa
+ protein cy02b10.25c (396 aa), FASTA scores: opt: 2124,
+ E(): 0, (85.1% identity in 397 aa overlap). Note that
+ expression of Rv1196 was demonstrated in lysates by
+ immunodetection (see first citation below).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 14 bp to 11 bp substitution leads to a slightly shorter
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (390 aa versus 391 aa). Protein
+ product from Mb1228 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1228 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe18"
+ /protein_id="SIT99829.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXN5"
+ /translation="MVDFGALPPEINSARMYAGPGSASLVAAAQMWDSVASDLFSAAS
+ AFQSVVWGLTVGSWIGSSAGLMVAAASPYVAWMSVTAGQAELTAAQVRVAAAAYETAY
+ GLTVPPPVIAENRAELMILIATNLLGQNTPAIAVNEAEYGEMWAQDAAAMFGYAAATA
+ TATATLLPFEEAPEMTSAGGLLEQAAAVEEASDTAAANQLMNNVPQALQQLAQPTQGT
+ TPSSKLGGLWKTVSPHLSPISNMVSMANNHVSMTNSGVSMTNTLSSMLKGFAPAAAQA
+ VETAAQNGVRAMSSLGSSLGSSGLGGGVAANLGRAASVGSLSVPQAWAAANQAVTPAA
+ RALPLTSLTSAAERGPGQMLGGLPVGQMGARAGGGLSGVLRVPPRPYVMPHSPAAG"
+ gene 1341934..1342230
+ /gene="esxK"
+ /locus_tag="BQ2027_MB1229"
+ CDS 1341934..1342230
+ /gene="esxK"
+ /locus_tag="BQ2027_MB1229"
+ /standard_name="ES6_3; TB11.0; QILSS"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1229, esxK, len: 98 aa. Equivalent to Rv1197,
+ len: 98 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 98 aa overlap). esxK, putative ESAT-6
+ like protein 3. Member of M. tuberculosis hypothetical
+ QILSS protein family with Rv1038c, etc. Almost identical
+ to MTCY98.023c (98 aa) (99.0% identity in 98 aa overlap)
+ and MTCY10G2.11 (98 aa), FASTA scores: opt: 643, E(): 0,
+ (99.0% identity in 98 aa overlap); highly similar to
+ Q49945|U1756C from Mycobacterium leprae (100 aa), FASTA
+ scores: opt: 377, E(): 8e-21, (58.3% identity in 96 aa
+ overlap). BELONGS TO THE ESAT6 FAMILY. Mb1229 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esat-6 like protein esxk (esat-6 like protein
+ 3)"
+ /protein_id="SIT99830.1"
+ /db_xref="GOA:P0DOB1"
+ /db_xref="InterPro:IPR010310"
+ /db_xref="InterPro:IPR036689"
+ /db_xref="UniProtKB/Swiss-Prot:P0DOB1"
+ /translation="MASRFMTDPHAMRDMAGRFEVHAQTVEDEARRMWASAQNISGAG
+ WSGMAEATSLDTMTQMNQAFRNIVNMLHGVRDGLVRDANNYEQQEQASQQILSS"
+ gene 1342281..1342565
+ /gene="esxL"
+ /locus_tag="BQ2027_MB1230"
+ CDS 1342281..1342565
+ /gene="esxL"
+ /locus_tag="BQ2027_MB1230"
+ /standard_name="ES6_4; Mtb9.9C"
+ /note="Mb1230, esxL, len: 94 aa. Equivalent to Rv1198,
+ len: 94 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.9% identity in 94 aa overlap). esxL, putative ESAT-6
+ likeprotein 4. Member of the ESAT-6 family with Rv3619c,
+ Rv1037c, etc. Almost identical to MTCY10G2.12 (94 aa)
+ (97.9% identity in 94 aa overlap) and MTCY98.022c (94 aa)
+ (94.7% identity in 94 aa overlap). Highly similar to
+ Q49946|U1756D Mycobacterium leprae (95 aa), FASTA scores:
+ opt: 403, E(): 1.1e-22, (64.1% identity in 92 aa overlap).
+ Protein product from Mb1230 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1230 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative esat-6 like protein esxl (esat-6 like
+ protein 4)"
+ /protein_id="SIT99831.1"
+ /db_xref="GOA:P59804"
+ /db_xref="InterPro:IPR009416"
+ /db_xref="InterPro:IPR010310"
+ /db_xref="InterPro:IPR036689"
+ /db_xref="UniProtKB/Swiss-Prot:P59804"
+ /translation="MTINYQFGDVDDHGAMIRAQAGLLEAEHQAIIRDVLTASDFWGG
+ AGSAACQGFITQLGRNFQVIYEQANAHGQKVQAAGNNMAQTDSAVGSSWA"
+ repeat_region 1342563..1342570
+ /note="8 bp direct repeat, TGACACCA, flanking IS element
+ IS1081."
+ /rpt_type=DIRECT
+ gene complement(1342571..1344005)
+ /locus_tag="BQ2027_IS1081-2"
+ mobile_element complement(1342571..1344005)
+ /locus_tag="BQ2027_IS1081-2"
+ /note="IS1081-2, len: 1435 nt. Equivalent to IS1081, len:
+ 1450 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(99.9% identity in 1435 nt overlap). Almost
+ identical to IS1081"
+ /mobile_element_type="insertion sequence:IS1081"
+ repeat_region 1342609..1342623
+ /note="15 bp perfect inverted repeat, IRR,TCGCGTGATCCTTCG,
+ flanking IS element IS1081."
+ /rpt_type=INVERTED
+ gene complement(1342633..1343880)
+ /locus_tag="BQ2027_MB1231C"
+ CDS complement(1342633..1343880)
+ /locus_tag="BQ2027_MB1231C"
+ /note="Mb1231c, -, len: 415 aa. Equivalent to Rv1199c,
+ len: 415 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 415 aa overlap). Possible transposase
+ for IS1081, identical to TRA1_MYCBO|P35882 transposase for
+ insertion sequence element (415 aa); region identical to
+ MTCY441.35 (100.0% identity in 261 aa overlap); and almost
+ identical to MTCY10G2.02c (415 aa) (99.8% identity in 415
+ aa overlap). Contains PS01007 Transposases, Mutator
+ family, signature, PS00435 Peroxidases proximal
+ heme-ligand signature."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSPOSASE"
+ /protein_id="SIT99832.1"
+ /db_xref="GOA:P60231"
+ /db_xref="InterPro:IPR001207"
+ /db_xref="UniProtKB/Swiss-Prot:P60231"
+ /translation="MTSSHLIDTEQLLADQLAQASPDLLRGLLSTFIAALMGAEADAL
+ CGAGYRERSDERSNQRNGYRHRDFDTRAATIDVAIPKLRQGSYFPDWLLQRRKRAERA
+ LTSVVATCYLLGVSTRRMERLVETLGVTKLSKSQVSIMAKELDEAVEAFRTRPLDAGP
+ YTFLAADALVLKVREAGRVVGVHTLIATGVNAEGYREILGIQVTSAEDGAGWLAFFRD
+ LVARGLSGVALVTSDAHAGLVAAIGATLPAAAWQRCRTHYAANLMAATPKPSWPWVRT
+ LLHSIYDQPDAESVVAQYDRVLDALTDKLPAVAEHLDTARTDLLAFTAFPKQIWRQIW
+ SNNPQERLNREVRRRTDVVGIFPDRASIIRLVGAVLAEQHDEWIEGRRYLGLEVLTRA
+ RAALTSTEEPAKQQTTNTPALTT"
+ repeat_region complement(1343918..1343932)
+ /locus_tag="BQ2027_IS1081-2"
+ /note="15 bp perfect inverted repeat, IRL,TCGCGTGATCCTTCG,
+ flanking IS element IS1081."
+ /rpt_type=INVERTED
+ repeat_region 1344006..1344013
+ /note="8 bp direct repeat, TGACACCA, flanking IS element
+ IS1081."
+ /rpt_type=DIRECT
+ gene 1344217..1345494
+ /locus_tag="BQ2027_MB1232"
+ CDS 1344217..1345494
+ /locus_tag="BQ2027_MB1232"
+ /note="Mb1232, -, len: 425 aa. Equivalent to Rv1200, len:
+ 425 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 425 aa overlap). Probable conserved
+ integral membrane transport protein, possibly member of
+ major facilitator superfamily (MFS), similar to others
+ e.g. YHJE_ECOLI|P37643 hypothetical metabolite transport
+ protein from Escherichia coli (440 aa), FASTA scores: opt:
+ 1047, E(): 0, (39.1% identity in 427 aa overlap); etc.
+ Contains PS00217 Sugar transport proteins signature 2.
+ Protein product from Mb1232 detected using SWATH mass
+ spectrometry. Mb1232 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE TRANSPORT
+ PROTEIN"
+ /protein_id="SIT99833.1"
+ /db_xref="GOA:A0A1R3XYL7"
+ /db_xref="InterPro:IPR004736"
+ /db_xref="InterPro:IPR005828"
+ /db_xref="InterPro:IPR005829"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYL7"
+ /translation="MKRVALACLVGSAIEFYDFLIYGTAAALVFPTVFFPHLDPTVAA
+ VASMGTFAVAFLSRPFGAAVFGYFGDRLGRKKTLVATLLIMGLATVTVGLVPTTVAIG
+ AAAPLILTTMRLLQGFAVGGEWAGSALLSAEYAPASKRGWYGMFTVVGGGIALVLTSL
+ TFLGVNYTIGESSPTFMQWGWRIPFLVSAALIAVALYVRFNIDETPVFARERADEKTR
+ LGPAETPIAQVLRRQRREIVLAAGSAVCCFGFVYLASTYLASYAQTRLGYSRGSILFD
+ SVLGGLLCIVFTALSSALCDQLGRRRVLLAGWAVALPWSLLVMPLIDSGSPSLFAVAV
+ VGMYAIGGFGFGPTASFIPELFATSYRYTGSALAANLAGVAGGALPPVIAGALVATYG
+ SWAIGVMLAILALISLVCTYRLPETAGSALVSR"
+ gene complement(1345491..1346444)
+ /gene="dapd"
+ /locus_tag="BQ2027_MB1233C"
+ CDS complement(1345491..1346444)
+ /gene="dapd"
+ /locus_tag="BQ2027_MB1233C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1233c, -, len: 317 aa. Equivalent to Rv1201c,
+ len: 317 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 317 aa overlap). Probable transferase
+ (EC 2.-.-.-). Highly similar to Q49948|U1756F
+ Mycobacterium leprae (317 aa), FASTA scores: opt: 1776,
+ E(): 0, (84.9% identity in 317 aa overlap), also Q46064
+ ORF3 protein from CORYNEBACTERIUM GLUTAMICUM (316 aa),
+ FASTA scores: opt: 864, E(): 0, (44.1% identity in 311 aa
+ overlap). Protein product from Mb1233c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1233c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="tetrahydrodipicolinate n-succinyltransferase
+ dapd"
+ /protein_id="SIT99834.1"
+ /db_xref="GOA:Q7U0E7"
+ /db_xref="InterPro:IPR001451"
+ /db_xref="InterPro:IPR011004"
+ /db_xref="InterPro:IPR019875"
+ /db_xref="InterPro:IPR026586"
+ /db_xref="InterPro:IPR032784"
+ /db_xref="InterPro:IPR038361"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0E7"
+ /translation="MSTVTGAAGIGLATLAADGSVLDTWFPAPELTESGTSATSRLAV
+ SDVPVELAALIGRDDDRRTETIAVRTVIGSLDDVAADPYDAYLRLHLLSHRLVAPHGL
+ NAGGLFGVLTNVVWTNHGPCAIDGFEAVRARLRRRGPVTVYGVDKFPRMVDYVVPTGV
+ RIADADRVRLGAHLAPGTTVMHEGFVNYNAGTLGASMVEGRISAGVVVGDGSDVGGGA
+ SIMGTLSGGGTHVISIGKRCLLGANSGLGISLGDDCVVEAGLYVTAGTRVTMPDSNSV
+ KARELSGSSNLLFRRNSVSGAVEVLARDGQGIALNEDLHAN"
+ gene 1346535..1347599
+ /gene="dapE"
+ /locus_tag="BQ2027_MB1234"
+ CDS 1346535..1347599
+ /gene="dapE"
+ /locus_tag="BQ2027_MB1234"
+ /note="Mb1234, dapE, len: 354 aa. Equivalent to Rv1202,
+ len: 354 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 354 aa overlap). Probable dapE,
+ succinyl-diaminopimelate desuccinylase (EC 3.5.1.18),
+ similar to DAPE_CORGL|Q59284 succinyl-diaminopimelate
+ desuccinylase from Corynebacterium glutamicum (369 aa),
+ FASTA scores: opt: 1301, E(): 0, (55.7% identity in 359 aa
+ overlap), highly similar to Q49949|U1756G (400 aa), FASTA
+ scores: opt: 2045, E(): 0, (87.0% identity in 354 aa
+ overlap). Protein product from Mb1234 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1234 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUCCINYL-DIAMINOPIMELATE DESUCCINYLASE
+ DAPE"
+ /protein_id="SIT99835.1"
+ /db_xref="GOA:A0A1R3XXZ9"
+ /db_xref="InterPro:IPR001261"
+ /db_xref="InterPro:IPR002933"
+ /db_xref="InterPro:IPR010174"
+ /db_xref="InterPro:IPR011650"
+ /db_xref="InterPro:IPR036264"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXZ9"
+ /translation="MLDLRGDPIELTAALIDIPSESRKEARIADEVEAALRAQASGFE
+ IIRNGNAVLARTKLNRSSRVLLAGHLDTVPVAGNLPSRRENDQLHGCGAADMKSGDAV
+ FLHLAATLAEPTHDLTLVFYDCEEIDSAANGLGRIQRELPDWLSADVAILGEPTAGCI
+ EAGCQGTLRVVLSVTGTRAHSARSWLGDNAIHKLGAVLDRLAVYRARSVDIDGCTYRE
+ GLSAVRVAGGVAGNVIPDAASVTINYRFAPDRSVAAALQHVHDVFDGLDVQIEQTDAA
+ AGALPGLSEPAAKALVEAAGGQVRAKYGWTDVSRFAALGIPAVNYGPGDPNLAHCRDE
+ RVPVGNITAAVDLLRRYLGG"
+ gene complement(1347596..1348180)
+ /locus_tag="BQ2027_MB1235C"
+ CDS complement(1347596..1348180)
+ /locus_tag="BQ2027_MB1235C"
+ /note="Mb1235c, -, len: 194 aa. Equivalent to Rv1203c,
+ len: 194 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 194 aa overlap). Hypothetical unknown
+ protein. Mb1235c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="AAA-ATPase, domain of unknown function, and LuxR
+ DNA-binding domain"
+ /protein_id="SIT99836.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXN7"
+ /translation="MLLAYVLITKGEFGAAASMLEPAAATLERTGYSWGPLSLMLLAT
+ AIAQQGHIAESAKTLQRAEARHGTKSALFAPELGLARAWTRAAAQDMTGAIAAAREAA
+ RTAERAGQAAVALCAWHNAVRLGDIRAVDPVTRLAAEIDCTVGNILVKHARGLADGDA
+ AELTAVAEELAGIGMAAAAADATKAAARLGPQQR"
+ gene complement(1348211..1349899)
+ /locus_tag="BQ2027_MB1236C"
+ CDS complement(1348211..1349899)
+ /locus_tag="BQ2027_MB1236C"
+ /note="Mb1236c, -, len: 562 aa. Equivalent to Rv1204c,
+ len: 562 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 562 aa overlap). Conserved hypothetical
+ protein, some similarity to Q55103 CHO-ORF2 from
+ STREPTOMYCES SP. (642 aa), FASTA scores: opt: 215, E():
+ 3.6e-06, (26.4% identity in 576 aa overlap). Contains
+ PS00017 ATP/GTP-binding site motif A. Mb1236c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="AAA-ATPase, domain of unknown function, and LuxR
+ DNA-binding domain"
+ /protein_id="SIT99837.1"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXN3"
+ /translation="MRVWKHVEAAVDSPDRCGVVLVGPHGVGKTLLAQLAAEQVMSED
+ GRSGRARWVVGTAPGRAIPFGAFRHLISLPASGADIGRPAALLRAARSSLTGDAGDLL
+ LVVDDAHNLDPLSATLVYQLARAGAARLVVTVASEAEPPDAIAALWSDDLLTRVAIEP
+ LDRAQTAAFVESALDATLDVADADELFRRSLGNPLYLRHLIDGGGLEHVDGRWRCRDE
+ DRRPLSGVIDEYLCALPEPARAVVDYLAIAEPLARTDLVALVGGEQLDTLGQAEAAGA
+ VRVGPDSDTSEIFVGHPLYADRARAVLTAEHAHALRVSLVAQLAKHPSDHVSDQLRLS
+ SLAIDVPASATPAAVTDAATAAGQALRLGDVRLAERLARAALDRSDALAARLPLAYAL
+ GWQGRGREADAVLAAVNPAELTETELMAWAIPRAANRFWMLNEPERATAFLQTTRSRV
+ TEPTARSTLDALAATFAMNSGNLPRAITLATEVLSGPAADDMAVAWAASAAALSSARM
+ GRFGDVDRLAERASAAEHPGLLRFTVGLAQITSLLLAGDVAPAQELAKRFTDFA"
+ gene 1349994..1350557
+ /gene="log"
+ /locus_tag="BQ2027_MB1237"
+ CDS 1349994..1350557
+ /gene="log"
+ /locus_tag="BQ2027_MB1237"
+ /note="Mb1237, -, len: 187 aa. Equivalent to Rv1205, len:
+ 187 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 187 aa overlap). Conserved hypothetical
+ protein, similar to Q49952 cosmid B1756 from Mycobacterium
+ leprae (187 aa), FASTA scores: opt: 865, E(): 0, (72.4%
+ identity in 174 aa overlap), also similar to
+ FAS6_RHOFA|P46378 hypothetical 21.1 kd protein in
+ fasciation locus (ORF6) (198 aa), FASTA scores: opt: 368,
+ E(): 1.3e-17, (37.4% identity in 174 aa overlap). Some
+ similarity to YJL055W Hypothetical protein in BTN1-PEP8
+ intergenic region from Saccharomyces cerevisiae and P48636
+ HYPOTHETICAL protein in AZU 5'REGION from Pseudomonas
+ AERUGINOSA. Protein product from Mb1237 detected using
+ SWATH mass spectrometry. Mb1237 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Phosphoribohydrolase involved in Mycobacterial
+ cytokinins production, homolog of plant
+ cytokinin-activating enzyme LOG"
+ /protein_id="SIT99838.1"
+ /db_xref="GOA:A0A1R3XXN4"
+ /db_xref="InterPro:IPR005269"
+ /db_xref="InterPro:IPR031100"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXN4"
+ /translation="MSAKIDITGDWTVAVYCAASPTHAELLELAAEVGAAIAGRGWTL
+ VWGGGHVSAMGAVASAARACGGWTVGVIPKMLVYRELADHDADELIVTDTMWERKQIM
+ EDRSDAFIVLPGGVGTLDELFDAWTDGYLGTHDKPIVMVDPWGHFDGLRAWLNGLLDT
+ GYVSPTAMERLVVVDNVKDALRACAPS"
+ gene 1350607..1352400
+ /gene="fadD6"
+ /locus_tag="BQ2027_MB1238"
+ CDS 1350607..1352400
+ /gene="fadD6"
+ /locus_tag="BQ2027_MB1238"
+ /note="Mb1238, fadD6, len: 597 aa. Equivalent to Rv1206,
+ len: 597 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 597 aa overlap). Probable fadD6,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), highly similar to
+ several e.g. NP_251583.1|NC_002516 probable
+ very-long-chain acyl-CoA synthetase from Pseudomonas
+ aeruginosa (608 aa); Q60714 mouse fatty acid transport
+ protein fatp (646 aa), FASTA scores: opt:712, E(): 0,
+ (36.8% identity in 600 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop), and PS00455
+ Putative AMP-binding domain signature. BELONGS TO THE
+ ATP-DEPENDENT AMP-BINDING ENZYME FAMILY. Protein product
+ from Mb1238 detected using shotgun mass spectrometry.
+ Mb1238 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FATTY-ACID-COA LIGASE FADD6
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="SIT99839.1"
+ /db_xref="GOA:A0A1R3XXP6"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR025110"
+ /db_xref="InterPro:IPR030310"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXP6"
+ /translation="MSDYYGGAHTTVRLIDLATRMPRVLADTPVIVRGAMTGLLARPN
+ SKASIGTVFQDRAARYGDRVFLKFGDQQLTYRDANATANRYAAVLAARGVGPGDVVGI
+ MLRNSPSTVLAMLATVKCGAIAGMLNYHQRGEVLAHSLGLLDAKVLIAESDLVSAVAE
+ CGASRGRVAGDVLTVEDVERFATTAPATNPASASAVQAKDTAFYIFTSGTTGFPKASV
+ MTHHRWLRALAVFGGMGLRLKGSDTLYSCLPLYHNNALTVAVSSVINSGATLALGKSF
+ SASRFWDEVIANRATAFVYIGEICRYLLNQPAKPTDRAHQVRVICGNGLRPEIWDEFT
+ TRFGVARVCEFYAASEGNSAFINIFNVPRTAGVSPMPLAFVEYDLDTGDPLRDASGRV
+ RRVPDGEPGLLLSRVNRLQPFDGYTDPVASEKKLVRNAFRDGDCWFNTGDVMSPQGMG
+ HAAFVDRLGDTFRWKGENVATTQVEAALASDQTVEECTVYGVQIPRTGGRAGMAAITL
+ RAGAEFDGQALARTVYGHLPGYALPLFVRVVGSLAHTTTFKSRKVELRNQAYGADIED
+ PLYVLAGPDEGYVPYYAEYPEEVSLGRRPQG"
+ gene 1352466..1353422
+ /gene="folP2"
+ /locus_tag="BQ2027_MB1239"
+ CDS 1352466..1353422
+ /gene="folP2"
+ /locus_tag="BQ2027_MB1239"
+ /note="Mb1239, folP2, len: 318 aa. Equivalent to Rv1207,
+ len: 318 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 318 aa overlap). Probable folP2,
+ Dihydropteroate synthase 2 (EC 2.5.1.15), similar to many
+ e.g. DHPS_ECOLI|P26282 Escherichia coli (282 aa), FASTA
+ scores: opt: 480, E(): 1.9e-22, (34.4% identity in 270 aa
+ overlap). Contains PS00792 dihydropteroate synthase
+ signature 1, PS00793 dihydropteroate synthase signature 2.
+ Protein product from Mb1239 detected using SWATH mass
+ spectrometry. Mb1239 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="dihydropteroate synthase 2 folp2 (dhps 2)
+ (dihydropteroate pyrophosphorylase 2)"
+ /protein_id="SIT99840.1"
+ /db_xref="GOA:P64140"
+ /db_xref="InterPro:IPR000489"
+ /db_xref="InterPro:IPR006390"
+ /db_xref="InterPro:IPR011005"
+ /db_xref="UniProtKB/Swiss-Prot:P64140"
+ /translation="MRSTPPASAGRSTPPALAGHSTPPALAGHSTLCGRPVAGDRALI
+ MAIVNRTPDSFYDKGATFSDAAARDAVHRAVADGADVIDVGGVKAGPGERVDVDTEIT
+ RLVPFIEWLRGAYPDQLISVDTWRAQVAKAACAAGADLINDTWGGVDPAMPEVAAEFG
+ AGLVCAHTGGALPRTRPFRVSYGTTTRGVVDAVISQVTAAAERAVAAGVAREKVLIDP
+ AHDFGKNTFHGLLLLRHVADLVMTGWPVLMALSNKDVVGETLGVDLTERLEGTLAATA
+ LAAAAGARMFRVHEVAATRRVLEMVASIQGVRPPTRTVRGLA"
+ gene 1353419..1354393
+ /gene="gpgs"
+ /locus_tag="BQ2027_MB1240"
+ CDS 1353419..1354393
+ /gene="gpgs"
+ /locus_tag="BQ2027_MB1240"
+ /note="Mb1240, -, len: 324 aa. Equivalent to Rv1208, len:
+ 324 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 324 aa overlap). Conserved hypothetical
+ protein, similar to Q49955|U1756L Mycobacterium leprae
+ (318 aa), FASTA scores, opt: 1621, E(): 0, (80.5% identity
+ in 318 aa overlap). Protein product from Mb1240 detected
+ using SWATH mass spectrometry. Mb1240 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable glucosyl-3-phosphoglycerate synthase
+ gpgs"
+ /protein_id="SIT99841.1"
+ /db_xref="GOA:Q7U0E1"
+ /db_xref="InterPro:IPR001173"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="PDB:5JUD"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0E1"
+ /translation="MTASELVAGDLAGGRAPGALPLDTTWHRPGWTIGELEAAKAGRT
+ ISVVLPALNEEATIESVIDSISPLVDGLVDELIVLDSGSTDDTEIRAIASGARVVSRE
+ QALPEVPVRPGKGEALWRSLAATSGDIVVFIDSDLINPHPLFVPWLVGPLLTGEGIQL
+ VKSFYRRPLQVSDVTSGVCATGGGRVTELVARPLLAALRPELGCVLQPLSGEYAASRE
+ LLTSLPFAPGYGVEIGLLIDTFDRLGLDAIAQVNLGVRAHRNRPLDELGAMSRQVIAT
+ LLSRCGIPDSGVGLTQFLPGGPDDSDYTRHTWPVSLVDRPPMKVMRPR"
+ gene 1354432..1354800
+ /locus_tag="BQ2027_MB1241"
+ CDS 1354432..1354800
+ /locus_tag="BQ2027_MB1241"
+ /note="Mb1241, -, len: 122 aa. Equivalent to Rv1209, len:
+ 122 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 122 aa overlap). Conserved hypothetical
+ protein, containing a hydrophobic N-terminus. Similar to
+ Q49956|U1756M hypothetical protein from Mycobacterium
+ leprae (114 aa), FASTA scores: opt: 524, E(): 8.9e-29,
+ (78.6% identity in 112 aa overlap). Protein product from
+ Mb1241 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1241 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99842.1"
+ /db_xref="GOA:A0A1R3XZT7"
+ /db_xref="InterPro:IPR019933"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZT7"
+ /translation="MALVLVYLVVLVLVAIVLFAAASLLFGRGEQLPPLPRATTATTL
+ PAFGVTRADVDAVKFTQVLRGYKTSEVDWVLERLGRELEALRSQLGAIHASSEDAEAE
+ SDASNPSRGETVVHYRSDPA"
+ gene 1354797..1355411
+ /gene="tagA"
+ /locus_tag="BQ2027_MB1242"
+ CDS 1354797..1355411
+ /gene="tagA"
+ /locus_tag="BQ2027_MB1242"
+ /note="Mb1242, tagA, len: 204 aa. Equivalent to Rv1210,
+ len: 204 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 204 aa overlap). Probable tagA,
+ DNA-3-methyladenine glycosidase I (EC 3.2.2.20), similar
+ to several e.g. 3MG1_ECOLI|P05100 DNA-3-methyladenine
+ glycosidase I from Escherichia coli (187 aa), FASTA
+ scores: opt: 530, E(): 1.3e-27, (44.2% identity in 190 aa
+ overlap). Also similar to Q49957 Mycobacterium leprae
+ cosmid B1756 (192 aa), FASTA scores: opt: 1042, E(): 0,
+ (80.2% identity in 192 aa overlap). Protein product from
+ Mb1242 detected using SWATH mass spectrometry. Mb1242
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable dna-3-methyladenine glycosylase i taga
+ (tag i) (3-methyladenine-dna glycosylase i, constitutive)
+ (dna-3-methyladenine glycosidase i)"
+ /protein_id="SIT99843.1"
+ /db_xref="GOA:A0A1R3XYM7"
+ /db_xref="InterPro:IPR004597"
+ /db_xref="InterPro:IPR005019"
+ /db_xref="InterPro:IPR011257"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYM7"
+ /translation="MSGDGLVRCPWAEVRPGPDAQLYRDYHDNEWGRPLYGRVALFER
+ MSLEAFQSGLSWLIILRKRENFRRAFSGFDIDKIARYTDTDVRRLLADDGIVRNRAKI
+ EATIANARAAADLGSSEDLSELLWSFAPPPRPRPVDGSEIPSVSTESKAMSRELKRRG
+ FRFVGPTTAYALMQATGMVDDHIQACWVPTERPFDQPGCPMAAR"
+ gene 1355518..1355745
+ /locus_tag="BQ2027_MB1243"
+ CDS 1355518..1355745
+ /locus_tag="BQ2027_MB1243"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1243, -, len: 75 aa. Equivalent to Rv1211, len:
+ 75 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 75 aa overlap). Conserved hypothetical
+ protein, similar to Q49958|U1756N Mycobacterium leprae (75
+ aa), FASTA scores: opt: 460, E(): 0, (90.7% identity in 75
+ aa overlap). Protein product from Mb1243 detected using
+ shotgun mass spectrometry. Mb1243 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99844.1"
+ /db_xref="InterPro:IPR021465"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXQ4"
+ /translation="MLGADQARAGGPARIWREHSMAAMKPRTGDGPLEATKEGRGIVM
+ RVPLEGGGRLVVELTPDEAAALGDELKGVTS"
+ gene complement(1355773..1356936)
+ /gene="glga"
+ /locus_tag="BQ2027_MB1244C"
+ CDS complement(1355773..1356936)
+ /gene="glga"
+ /locus_tag="BQ2027_MB1244C"
+ /note="Mb1244c, -, len: 387 aa. Equivalent to Rv1212c,
+ len: 387 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 387 aa overlap). Putative glycosyl
+ transferase (EC 2.-.-.-), highly similar to
+ AJ243803|SCO243803_2 Putative glycosyl transferase from
+ Streptomyces coelicolor (387 aa), FASTA scores: opt: 1344,
+ E(): 0, (54.9% identity in 388 aa overlap). Also similar
+ to MJ1607 probable hexosyltransferase (EC 2.4.1.-) from
+ Methanococcus jannaschii (390 aa), FASTA scores: opt: 445,
+ E(): 7.8e-23, (27.9% identity in 401 aa overlap). The
+ region from aa 267-355 highly similar to Q49959 COSMID
+ B1756 from Mycobacterium leprae (91 aa), FASTA scores,
+ opt: 471, E(): 4.8e-25, (80.9% identity in 89 aa overlap).
+ Similar to Mycobacterium tuberculosis hypothetical
+ protein, Rv3032. Protein product from Mb1244c detected
+ using SWATH mass spectrometry. Mb1244c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative glycosyl transferase glga"
+ /protein_id="SIT99845.1"
+ /db_xref="GOA:A0A1R3XY10"
+ /db_xref="InterPro:IPR001296"
+ /db_xref="InterPro:IPR011875"
+ /db_xref="InterPro:IPR028098"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY10"
+ /translation="MRVAMLTREYPPEVYGGAGVHVTELVAYLRRLCAVDVHCMGAPR
+ PGAFAYRPDPRLGSANAALSTLSADLVMANAASAATVVHSHTWYTALAGHLAAILYDI
+ PHILTAHSLEPLRPWKKEQLGGGYQVSTWVEQTAVLAANAVIAVSSAMRNDMLRVYPS
+ LDPNLVHVIRNGIDTETWYPAGPARTGSVLAELGVDPNRPMAVFVGRITRQKGVVHLV
+ TAAHRFRSDVQLVLCAGAADTPEVADEVRVAVAELARNRTGVFWIQDRLTIGQLREIL
+ SAATVFVCPSVYEPLGIVNLEAMACATAVVASDVGGIPEVVADGITGSLVHYDADDAT
+ GYQARLAEAVNALVADPATAERYGHAGRQRCIQEFSWAYIAEQTLDIYRKVCA"
+ gene 1357111..1358325
+ /gene="glgC"
+ /locus_tag="BQ2027_MB1245"
+ CDS 1357111..1358325
+ /gene="glgC"
+ /locus_tag="BQ2027_MB1245"
+ /note="Mb1245, glgC, len: 404 aa. Equivalent to Rv1213,
+ len: 404 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 404 aa overlap). Probable glgC,
+ glucose-1-phosphate adenylyltransferase (EC 2.7.7.27),
+ similar to many e.g. GLGC_ECOLI|P00584 Escherichia coli
+ (430 aa), FASTA scores: opt: 1075, E(): 0, (40.3% identity
+ in 407 aa overlap); highly similar to Q49961 GLGC from
+ Mycobacterium leprae (419 aa), FASTA scores: opt: 2532,
+ E(): 0, (92.6% identity in 404 aa overlap). BELONGS TO THE
+ BACTERIAL AND PLANTS GLUCOSE-1-PHOSPHATE
+ ADENYLYLTRANSFERASE FAMILY. Protein product from Mb1245
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1245 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="glucose-1-phosphate adenylyltransferase glgc
+ (adp-glucose synthase) (adp-glucose pyrophosphorylase)"
+ /protein_id="SIT99846.1"
+ /db_xref="GOA:P64242"
+ /db_xref="InterPro:IPR005835"
+ /db_xref="InterPro:IPR005836"
+ /db_xref="InterPro:IPR011004"
+ /db_xref="InterPro:IPR011831"
+ /db_xref="InterPro:IPR023049"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="UniProtKB/Swiss-Prot:P64242"
+ /translation="MREVPHVLGIVLAGGEGKRLYPLTADRAKPAVPFGGAYRLIDFV
+ LSNLVNARYLRICVLTQYKSHSLDRHISQNWRLSGLAGEYITPVPAQQRLGPRWYTGS
+ ADAIYQSLNLIYDEDPDYIVVFGADHVYRMDPEQMVRFHIDSGAGATVAGIRVPRENA
+ TAFGCIDADDSGRIRSFVEKPLEPPGTPDDPDTTFVSMGNYIFTTKVLIDAIRADADD
+ DHSDHDMGGDIVPRLVADGMAAVYDFSDNEVPGATDRDRAYWRDVGTLDAFYDAHMDL
+ VSVHPVFNLYNKRWPIRGESENLAPAKFVNGGSAQESVVGAGSIISAASVRNSVLSSN
+ VVVDDGAIVEGSVIMPGTRVGRGAVVRHAILDKNVVVGPGEMVGVDLEKDRERFAISA
+ GGVVAVGKGVWI"
+ gene complement(1358521..1358895)
+ /gene="PE14"
+ /locus_tag="BQ2027_MB1246C"
+ CDS complement(1358521..1358895)
+ /gene="PE14"
+ /locus_tag="BQ2027_MB1246C"
+ /note="Mb1246c, PE14, len: 124 aa. Equivalent to 5' end of
+ Rv1214c, len: 110 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 68 aa overlap). Member of
+ Mycobacterium tuberculosis PE family, appears to be
+ frameshifted but sequence appears to be correct. The
+ 5'-end is atypical as first 9 aa appear to be missing.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PE14 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a 5 bp
+ deletion (cttgt-*) leads to a diffferent COOH terminus.
+ Mb1246c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe14"
+ /protein_id="SIT99847.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXP3"
+ /translation="MLASAATDLAGIGSALSAANAAAAAPTTAMLAACADEVSAVVAS
+ LFARHAQAYQALSLQATAFHQQFVPDRRWRGLCGCRSRQRCCGAERAARRAECDQRSH
+ PGTVRSVTAPMADRAKTAGPGG"
+ gene complement(1359029..1360714)
+ /locus_tag="BQ2027_MB1247C"
+ CDS complement(1359029..1360714)
+ /locus_tag="BQ2027_MB1247C"
+ /EC_number="3.1.1.-"
+ /note="Mb1247c, -, len: 561 aa. Equivalent to Rv1215c,
+ len: 561 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 561 aa overlap). Conserved hypothetical
+ protein, low similarity to Rv1835c|Y0D8_MYCTU|Q50598
+ hypothetical 69.9 kd protein cy1a11.08 (628 aa), FASTA
+ scores: opt: 257, E(): 1.3e-09, (34.1% identity in 185 aa
+ overlap). Protein product from Mb1247c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1247c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Cocaine esterase (EC"
+ /protein_id="SIT99848.1"
+ /db_xref="GOA:A0A1R3XXP5"
+ /db_xref="InterPro:IPR000383"
+ /db_xref="InterPro:IPR005674"
+ /db_xref="InterPro:IPR008979"
+ /db_xref="InterPro:IPR013736"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXP5"
+ /translation="MARNPSPALDRPWRRPGALRYALERVRGVAKPPITVTDPPADVV
+ IERDVEVPTRDGTLLRINVFRSAEGGARPVIASIHPYGKDALPRRRGNRWTFSPQYRM
+ LRQPKPLTFSALTGWEAPDPAWWTAQGFVVVNADSRGCGRSDGTGDLLSHQEAEDTYD
+ LVGWLADQSWSDGRVVMLGVSYLAISQYAVAALQPPALRAICPWEGFTDAYRDLAFPG
+ GIRESGFTRLWSRGVRRRTRQTYDMEQMQEAHPLRDDFWRSRVPDLSAIKVPMLVCGS
+ FSDNNLHSRGSIRAFTRSGCGHARLYTHRGGKWETFYSATALSEQLKFLRDALAGSSG
+ SRSVRLEVREDRDTITAVREETQWPLAGTRWRPMYLAGPGLLATEPPPTAGSIRFQTR
+ SRAAAFNWTIPEDIELTGPMAARLWVQLDGCDDANLFVGVEKWRDGQFVAFEGSYGWG
+ RDRVTTGWQRVSLRELDPELSQPWEPVPACARPRPVTAGEVVAVDVALGPSATLFRAG
+ EQLRLVVGGRWLSPRNPLTGQFPAAYPRPPRGRVTLHWGPRYDAHLLIPEVPG"
+ gene complement(1360742..1361416)
+ /locus_tag="BQ2027_MB1248C"
+ CDS complement(1360742..1361416)
+ /locus_tag="BQ2027_MB1248C"
+ /note="Mb1248c, -, len: 224 aa. Equivalent to Rv1216c,
+ len: 224 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 224 aa overlap). Probable conserved
+ integral membrane protein, C-terminal region similar to
+ Q49963|U1756P from Mycobacterium leprae (134 aa), FASTA
+ scores: opt: 311, E(): 3.3e-15, (52.2% identity in 113 aa
+ overlap). Protein product from Mb1248c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1248c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99849.1"
+ /db_xref="GOA:A0A1R3XXQ5"
+ /db_xref="InterPro:IPR007318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXQ5"
+ /translation="MHIGLKIFIWGVLGLVVFGALLFGPAGTFDYWQAWVFLAAFVST
+ TIGPTIYLARNDPAALQRRMRSGPLAEGRTIQKFIVIGAFLGFFAMMVLSACDHRYGW
+ SSVPAAVCVIGDVLVMTGLGIAMLVVIQNRYAASTVRVEAGQILASDGLYKIVRHPMY
+ AGNVVMMTGIPLALGSYWAMFILVPGTLVLVFRILDEEKLLTQELSGYREYRQLVRYR
+ LVPYVW"
+ gene complement(1361425..1363071)
+ /locus_tag="BQ2027_MB1249C"
+ CDS complement(1361425..1363071)
+ /locus_tag="BQ2027_MB1249C"
+ /note="Mb1249c, -, len: 548 aa. Equivalent to Rv1217c,
+ len: 548 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 548 aa overlap). Probable
+ tetronasin-transport integral membrane ABC transporter
+ (see citation below), similar to many e.g.
+ AL049754|SCH10_12 probable ABC-type transport system
+ membrane-spanning protein from Streptomyces coelicolor
+ (539 aa), FASTA scores: opt: 1309, E(): 0, (40.9% identity
+ in 550 aa overlap); Q54407|X73633 TnrB3 protein from
+ Streptomyces longisporoflavus (337 aa), FASTA scores: opt:
+ 692, E(): 0, (39.5% identity in 324 aa overlap); etc. Also
+ has regions similar to Mycobacterium leprae proteins
+ Q49964|U1756Q (109 aa), FASTA scores: opt: 431, E():
+ 3.1e-20, (64.8% identity in 105 aa overlap) and
+ Q49965|U1756R (82 aa), FASTA scores: opt:154, E(): 0.0028,
+ (61.0% identity in 41 aa overlap). Protein product from
+ Mb1249c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1249c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TETRONASIN-TRANSPORT INTEGRAL MEMBRANE
+ PROTEIN ABC TRANSPORTER"
+ /protein_id="SIT99850.1"
+ /db_xref="GOA:A0A1R3XXP2"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXP2"
+ /translation="MSSTVIDRARPAGHRAPHRGSGFTGTLGLLRLYLRRDRVSLPLW
+ VLLLSVPLATVYIASVETVYPDRSARAAAAAAIMASPAQRALYGPVYNDSLGAVGIWK
+ AGMFHTLIAVAVILTVIRHTRADEESGRAELIDSTVVGRYTNLTGALLLSFGASIATG
+ AIGALGLLATDVAPAGSVAFGVALAASGMVFTAVAAVAAQLSPSARFTRAVAFAVLGT
+ AFALRAIGDAGSGTLSWCSPLGWSLQVRPYAGERWWVLLLSLATAAVLTVLAYRLRAG
+ RDVGAGLIAERPGAGTAGPMLSEPFGLAWRLNRGSLLLWTVGLCLYGLVMGSVVHGIG
+ DQLGDNTAVRDIVTRMGGTGALEQAFLALAFTMIGMVAAAFAVSLTLRLHQEETGLRA
+ ETLLAGAVSRTHWLASHLAMALAGSAVATLISGVAAGLAYGMTVGDVGGKLPTVVGTA
+ AVQLPAVWLLSAVTVGLFGLAPRFTPVAWGVLVGFIALYLLGSLAGFPQMLLNLEPFA
+ HIPRVGGGDFTAVPLLWLLAIDAALITLGAMAFRRRDVRC"
+ gene complement(1363068..1364003)
+ /locus_tag="BQ2027_MB1250C"
+ CDS complement(1363068..1364003)
+ /locus_tag="BQ2027_MB1250C"
+ /note="Mb1250c, -, len: 311 aa. Equivalent to Rv1218c,
+ len: 311 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 311 aa overlap). Probable
+ tetronasin-transport ATP-binding protein ABC transporter
+ (see citation below), similar to many e.g.
+ Q54406|X73633|TNRB2 TNRB2 PROTEIN from Streptomyces
+ longisporoflavus (300 aa), FASTA scores: opt: 1133, E():
+ 0, (60.8% identity in 291 aa overlap); etc. Also similar
+ to others in Mycobacterium tuberculosis e.g. MTCY19H9.04
+ (30.0% identity in 297 aa overlap); etc. Contains PS00211
+ ABC transporters family signature and PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS)
+ Protein product from Mb1250c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1250c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TETRONASIN-TRANSPORT ATP-BINDING
+ PROTEIN ABC TRANSPORTER"
+ /protein_id="SIT99851.1"
+ /db_xref="GOA:A0A1R3XXQ1"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR025302"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXQ1"
+ /translation="MSADNHQVPIEIRGLTKHFGSVRALDGLDLTVREGEVHGFLGPN
+ GAGKSTTLRILLGLVKADGGSVRLLGGDPWTDAVDLHRHIAYVPGDVTLWPSLTGGET
+ IDLLARMRGGIDNARRAELIERFGLDPTKKARTYSKGNRQKVSLISALSSHATLLLLD
+ EPSSGLDPLMENVFQQCIGEARQRGVTVLLSSHILAETEALCEKVTIIRAGKTVESGS
+ LDALRHLSRTSIKAEMIGDPGDLSRIKGVEDISIEGTTVRAQVDSESLRELIQVLGHA
+ GVRSLVSQPPTLEELFLRHYSLGPEVAAEQQVATP"
+ gene complement(1363993..1364631)
+ /locus_tag="BQ2027_MB1251C"
+ CDS complement(1363993..1364631)
+ /locus_tag="BQ2027_MB1251C"
+ /note="Mb1251c, -, len: 212 aa. Equivalent to Rv1219c,
+ len: 212 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 212 aa overlap). Probable
+ transcriptional regulatory protein, some similarity in
+ N-terminus to YBIH_ECOLI|P41037 hypothetical
+ transcriptional regulator from Escherichia coli (103 aa),
+ FASTA scores: opt: 143, E(): 8.9e-06, (39.7% identity in
+ 63 aa overlap); Helix turn helix motif from aa 28-49.
+ Protein product from Mb1251c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1251c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99852.1"
+ /db_xref="GOA:A0A1R3XZU0"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="InterPro:IPR041484"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZU0"
+ /translation="MRSADLTAHARIREAAIEQFGRHGFGVGLRAIAEAAGVSAALVI
+ HHFGSKEGLRKACDDFVAEEIRSSKAAALKSNDPTTWLAQMAEIESYAPLMAYLVRSM
+ QSGGELAKMLWQKMIDNAEEYLDEGVRAGTVKPSRDPRARARFLAITGGGGFLLYLQM
+ HENPTDLRAALRDYAHDMVLPSLEVYTEGLLADRAMYEAFLAEAQQGEAHVG"
+ gene complement(1364773..1365420)
+ /locus_tag="BQ2027_MB1252C"
+ CDS complement(1364773..1365420)
+ /locus_tag="BQ2027_MB1252C"
+ /note="Mb1252c, -, len: 215 aa. Equivalent to Rv1220c,
+ len: 215 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 215 aa overlap). Possible
+ methyltransferase (EC 2.1.1.-), some similarity to
+ MDMC_STRMY|Q00719 o-methyltransferase from Streptomyces
+ mycarofaciens (221 aa), FASTA scores; opt: 289, E():
+ 1.3e-07, (30.0% identity in 203 aa overlap). Also similar
+ to Mycobacterium tuberculosis methyltransferases
+ Rv0187|MTCI28.26 (32.9% identity in 222 aa overlap) and
+ Rv1703c. Start site chosen by homology; other possible
+ start sites exist upstream. Protein product from Mb1252c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1252c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METHYLTRANSFERASE"
+ /protein_id="SIT99853.1"
+ /db_xref="GOA:Q7U0D0"
+ /db_xref="InterPro:IPR002935"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0D0"
+ /translation="MPGQPAPSRGESLWAHAEGSISEDVILAGARERATDIGAGAVTP
+ AVGALLCLLAKLSGGKAVAEVGTGAGVSGLWLLSGMRDDGVLTTIDIEPEHLRLARQA
+ FAEAGIGPSRTRLISGRAQEVLTRLADASYDLVFIDADPIDQPDYVAEGVRLLRSGGV
+ IVVHRAALGGRAGDPGARDAEVIAVREAARLIAEDERLTPALVPLGDGVLAAVRD"
+ gene 1365683..1366456
+ /gene="sigE"
+ /locus_tag="BQ2027_MB1253"
+ CDS 1365683..1366456
+ /gene="sigE"
+ /locus_tag="BQ2027_MB1253"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1253, sigE, len: 257 aa. Equivalent to Rv1221,
+ len: 257 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 257 aa overlap). sigE, alternative sigma
+ factor of extracytoplasmic function (ECF) family (see
+ citations below). Similar to many e.g. RPOE_HAEIN|P44790
+ RNA polymerase sigma-e factor from Haemophilus influenzae
+ (189 aa), FASTA scores: opt: 247, E(): 3.4e-06, (28.5%
+ identity in 186 aa overlap); etc. Also similar to
+ MTCY07D11.03 rpoE from Mycobacterium tuberculosis (35.2%
+ identity in 159 aa overlap). BELONGS TO THE SIGMA-70
+ FACTOR FAMILY, ECF SUBFAMILY. Note that in Mycobacterium
+ bovis BCG, the sigE gene is transcribed from two
+ promoters, P1 and P2, and that these promoters were
+ expressed at temperatures from 30-50 C. Protein product
+ from Mb1253 detected using SWATH mass spectrometry. Mb1253
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ALTERNATIVE RNA POLYMERASE SIGMA FACTOR SIGE"
+ /protein_id="SIT99854.1"
+ /db_xref="GOA:A0A1R3XXR2"
+ /db_xref="InterPro:IPR007627"
+ /db_xref="InterPro:IPR013249"
+ /db_xref="InterPro:IPR013324"
+ /db_xref="InterPro:IPR013325"
+ /db_xref="InterPro:IPR014284"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039425"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXR2"
+ /translation="MELLGGPRVGNTESQLCVADGDDLPTYCSANSEDLNITTITTLS
+ PTSMSHPQQVRDDQWVEPSDQLQGTAVFDATGDKATMPSWDELVRQHADRVYRLAYRL
+ SGNQHDAEDLTQETFIRVFRSVQNYQPGTFEGWLHRITTNLFLDMVRRRARIRMEALP
+ EDYDRVPADEPNPEQIYHDARLGPDLQAALASLPPEFRAAVVLCDIEGLSYEEIGATL
+ GVKLGTVRSRIHRGRQALRDYLAAHPEHGECAVHVNPVR"
+ gene 1366614..1367078
+ /gene="rsea"
+ /locus_tag="BQ2027_MB1254"
+ CDS 1366614..1367078
+ /gene="rsea"
+ /locus_tag="BQ2027_MB1254"
+ /note="Mb1254, -, len: 154 aa. Equivalent to Rv1222, len:
+ 154 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 154 aa overlap). Conserved hypothetical
+ protein. Identical to O06290|MTU87242 (but shorter due to
+ different start site chosen by proximity of RBS).
+ Equivalent to O05736|U87308|MAU87308_2 hypothetical
+ protein from Mycobacterium avium (133 aa), FASTA scores:
+ opt: 644, E(): 7e-32, (86.2% identity in 109 aa overlap).
+ Protein product from Mb1254 detected using SWATH mass
+ spectrometry. Mb1254 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="anti-sigma factor rsea"
+ /protein_id="SIT99855.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY24"
+ /translation="MADPGSVGHVFRRAFSWLPAQFASQSDAPVGAPRQFRSTEHLSI
+ EAIAAFVDGELRMNAHLRAAHHLSLCAQCAAEVDDQSRARAALRDSHPIRIPSTLLGL
+ LSEIPRCPPEGPSKGSSGGSSQGPPDGAAAGFGDRFADGDGGNRGRQSRVRR"
+ gene 1367147..1368733
+ /gene="htrA"
+ /locus_tag="BQ2027_MB1255"
+ CDS 1367147..1368733
+ /gene="htrA"
+ /locus_tag="BQ2027_MB1255"
+ /note="Mb1255, htrA, len: 528 aa. Equivalent to Rv1223,
+ len: 528 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 528 aa overlap). Probable htrA
+ (alternate gene name: degP), serine protease precursor (EC
+ 3.4.21.-), equivalent to
+ U15180|MLU15180_31|Q49972|ML1078|HTRA POSSIBLE SERINE
+ PROTEASE from Mycobacterium leprae (533 aa), FASTA scores:
+ opt: 2777, E(): 4.1e-141, (81.6% identity in 533 aa
+ overlap). Also similar to many others e.g.
+ HTRA_ECOLI|P09376 protease do precursor from Escherichia
+ coli (EC 3.4.21.-) (474 aa), FASTA scores: opt: 581, E():
+ 9.1e-27, (36.3% identity in 278 aa overlap); etc. Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop). Start
+ changed since first submission (-21 aa). Protein product
+ from Mb1255 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1255 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SERINE PROTEASE HTRA (DEGP PROTEIN)"
+ /protein_id="SIT99856.1"
+ /db_xref="GOA:A0A1R3XXQ7"
+ /db_xref="InterPro:IPR001478"
+ /db_xref="InterPro:IPR001940"
+ /db_xref="InterPro:IPR009003"
+ /db_xref="InterPro:IPR036034"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXQ7"
+ /translation="MDTRVDTDNAMPARFSAQIQNEDEVTSDQGNNGGPNGGGRLAPR
+ PVFRPPVDPASRQAFGRPSGVQGSFVAERVRPQKYQDQSDFTPNDQLADPVLQEAFGR
+ PFAGAESLQRHPIDAGALAAEKDGAGPDEPDDPWRDPAAAAALGTPALAAPAPHGALA
+ GSGKLGVRDVLFGGKVSYLALGILVAIALVIGGIGGVIGRKTAEVVDAFTTSKVTLST
+ TGNAQEPAGRFTKVAAAVADSVVTIESVSDQEGMQGSGVIVDGRGYIVTNNHVISEAA
+ NNPSQFKTTVVLNDGKEVPANLVGRDPKTDLAVLKVDNVDNLTVARLGDSSKVRVGDE
+ VLAVGAPLGLRSTVTQGIVSALHRPVPLSGEGSDTDTVIDAIQTDASINHGNSGGPLI
+ DMDAQVIGINTAGKSLSDSASGLGFAIPVNEMKLVANSLIKDGKIVHPTLGINTRSVS
+ NAIASGAQVANVKAGSPAQKGGILENDVIVKVGNRAVADSDEFVVAVRQLAIGQDAPI
+ EVVREGRHVTLTVKPDPDST"
+ gene 1368735..1369130
+ /gene="tatB"
+ /locus_tag="BQ2027_MB1256"
+ CDS 1368735..1369130
+ /gene="tatB"
+ /locus_tag="BQ2027_MB1256"
+ /note="Mb1256, tatB, len: 131 aa. Equivalent to Rv1224,
+ len: 131 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 131 aa overlap). Probable tatB,
+ component of twin-arginine translocation protein export
+ system (see citation below for more information). Possible
+ exported protein with hydrophobic stretch at N-terminus.
+ Highly similar to Q49973|U15180 hypothetical protein
+ U1756Y from Mycobacterium leprae (120 aa), FASTA scores:
+ opt: 601, E(): 0, (73.3% identity in 131 aa overlap).
+ Mb1256 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable protein TatB"
+ /protein_id="SIT99857.1"
+ /db_xref="GOA:Q7VEZ5"
+ /db_xref="InterPro:IPR003369"
+ /db_xref="InterPro:IPR018448"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEZ5"
+ /translation="MFANIGWGEMLVLVMVGLVVLGPERLPGAIRWAASALRQARDYL
+ SGVTSQLREDIGPEFDDLRGHLGELQKLRGMTPRAALTKHLLDGDDSLFTGDFDRPTP
+ KKPDAAGSAGPDATEQIGAGPIPFDSDAT"
+ gene complement(1369163..1369993)
+ /locus_tag="BQ2027_MB1257C"
+ CDS complement(1369163..1369993)
+ /locus_tag="BQ2027_MB1257C"
+ /note="Mb1257c, -, len: 276 aa. Equivalent to Rv1225c,
+ len: 276 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 276 aa overlap). Conserved hypothetical
+ protein, some similarity to other hypothetical proteins
+ e.g. AE001078|AE001078_2 Archaeoglobus fulgidus (265 aa),
+ FASTA scores: opt: 339, E(): 5.1e-15, (27.1% identity in
+ 262 aa overlap), and to NAGD_ECOLI|P15302 nagd protein
+ from Escherichia coli (250 aa), FASTA scores: opt: 167,
+ E(): 6.4e-12, (24.8% identity in 258 aa overlap). Also
+ weakly similar to Mycobacterium tuberculosis hypothetical
+ protein Rv3400|MTCY78.28c (29.1% identity in 251 aa
+ overlap). Protein product from Mb1257c detected using
+ SWATH mass spectrometry. Mb1257c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HAD-superfamily subfamily IIA hydrolase,
+ hypothetical 2"
+ /protein_id="SIT99858.1"
+ /db_xref="GOA:A0A1R3XXQ2"
+ /db_xref="InterPro:IPR006355"
+ /db_xref="InterPro:IPR006357"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXQ2"
+ /translation="MDVAHLMAAAVLFDIDGVLVLSWRAIPGAAETVRQLTHRGIACA
+ YLTNTTTRTRRQIAEALGAAGIPVAADDVITAGVLTAEYLHGAYPGARCFLVNNGDIT
+ EDLPGIDVVLSTEIGPEDCPEAPDVVVLGSAGPQFDHRTLSRVYGWMLDGVPVVAMHR
+ NMTWNTTDGLRIDTGMYLTGMEQACGKTATAIGKPAAEGFLAAADRVGVDPQQMVMIG
+ DDLHNDVLAAQAVGMTGVLVRTGKFRQQTLDRWLAGASATRPHHVIDSVAGLPPLLGC
+ "
+ gene complement(1370104..1371567)
+ /locus_tag="BQ2027_MB1258C"
+ CDS complement(1370104..1371567)
+ /locus_tag="BQ2027_MB1258C"
+ /note="Mb1258c, -, len: 487 aa. Equivalent to Rv1226c,
+ len: 487 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 487 aa overlap). Probable transmembrane
+ protein. Some similarity to AL049841|SCE9.01 Streptomyces
+ coelicolor (436 aa), FASTA scores: opt: 203, E(): 1.2e-05,
+ (29.8% identity in 346 aa overlap). Protein product from
+ Mb1258c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99859.1"
+ /db_xref="GOA:A0A1R3XXR6"
+ /db_xref="InterPro:IPR005182"
+ /db_xref="InterPro:IPR014529"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXR6"
+ /translation="MTDRPHDWHRLSPRMLLVHPVHEMLRQLPVLIGSVVLGSATGNP
+ VWPLAALGVTVVFGVLRWFFTTYRIDDENVSLRTGILSRRAVSVPRNRIRSVQTEARL
+ LHRLLGLTVLRVGTGQEARGEAAFELDAVDSARVPRLRALLLAESLAPVEPTGRVLAR
+ WQSSWLRYAPLSFSGLVMIGAVIGLGYQTGLAVRLPESGFARSAVDAAQRAGVVLVVA
+ VTVLLVVGVSALLAVLFSWLTYGNLLLRRGGSGQEGVLHLRHGLLRVREHTYDMRRLR
+ GATLREPLLVRLLRGARLDAVMTGVHGEGQSSMLLPPCPFETATAVLTDLIDNTDAAA
+ GPLRRHGPAAARRRWTRALLVPTLAGVALIAAAPILGVPGWAWTLWAVLTAGCAGLAV
+ DRVRSLGHRVADGWLVARAGSLQRRRDCIACTGIIGWTVRQTLFQRRAGVATLVAATA
+ AGRKGYQVLDVPAELAWSVAGAASPWVADSVWLRHGS"
+ gene complement(1371564..1372097)
+ /locus_tag="BQ2027_MB1259C"
+ CDS complement(1371564..1372097)
+ /locus_tag="BQ2027_MB1259C"
+ /note="Mb1259c, -, len: 177 aa. Equivalent to Rv1227c,
+ len: 177 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 177 aa overlap). Possible transmembrane
+ protein, similar to P96615 hypothetical protein ydbS from
+ Bacillus subtilis (159 aa), fasta scores: E(): 3.6e-07,
+ (30.1% identity in 163 aa overlap). Protein product from
+ Mb1259c detected using SWATH mass spectrometry. Mb1259c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99860.1"
+ /db_xref="GOA:A0A1R3XXQ6"
+ /db_xref="InterPro:IPR005182"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXQ6"
+ /translation="MDHARNVPSATGPQRNHLALAEPAHRPSSQAPVMWALSASLGWI
+ LPVIAQLVWWAVHPQPPWPHLAAAALTAVAMVVHIGVVPLWRYRVHRWEISPQAVFTR
+ TGWLVQERRITPISRVQTVDTYRGPMDRLFGLANVTVTTASSAGAVHIEALDTDVADR
+ VVAQLTDIAALRGEDAT"
+ gene 1372192..1372749
+ /gene="lpqX"
+ /locus_tag="BQ2027_MB1260"
+ CDS 1372192..1372749
+ /gene="lpqX"
+ /locus_tag="BQ2027_MB1260"
+ /note="Mb1260, lpqX, len: 185 aa. Equivalent to Rv1228,
+ len: 185 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 185 aa overlap). Probable lipoprotein
+ LpqX. Contains possible signal sequence and appropriately
+ positioned PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Protein product from Mb1260 detected
+ using SWATH mass spectrometry. Mb1260 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable lipoprotein lpqx"
+ /protein_id="SIT99861.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXR3"
+ /translation="MSRQWHWLAATLLLITTAACSRPGTEEPDCPTKITLPPGATPTT
+ TLDPRCIVRATTTGTADGDAASRWTGTVRIAGFYASICNAVWDGNVSLAGKDELTGKA
+ TLILVETSCPGKVVAGELVLKGNVGSDSLAITWAHPELPQRAFDLGAGQGTIRRSGDR
+ AEGTFNSDMGGGTEFFLTWSLTMRN"
+ gene complement(1373049..1374221)
+ /gene="mrp"
+ /locus_tag="BQ2027_MB1261C"
+ CDS complement(1373049..1374221)
+ /gene="mrp"
+ /locus_tag="BQ2027_MB1261C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1261c, mrp, len: 390 aa. Equivalent to Rv1229c,
+ len: 390 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 390 aa overlap). Probable Mrp protein,
+ similar to others e.g. MRP_ECOLI|P21590 mrp protein from
+ Escherichia coli (379 aa), FASTA scores: E(): 0, (34.1%
+ identity in 355 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A (P-loop); and PS01215 MRP
+ Prosite domain. BELONGS TO THE MRP/NBP35 FAMILY OF
+ ATP-BINDING PROTEINS. Protein product from Mb1261c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1261c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MRP-RELATED PROTEIN MRP"
+ /protein_id="SIT99862.1"
+ /db_xref="GOA:P65442"
+ /db_xref="InterPro:IPR000808"
+ /db_xref="InterPro:IPR002744"
+ /db_xref="InterPro:IPR019591"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR033756"
+ /db_xref="InterPro:IPR034904"
+ /db_xref="UniProtKB/Swiss-Prot:P65442"
+ /translation="MPSRLHSAVMSGTRDGDLNAAIRTALGKVIDPELRRPITELGMV
+ KSIDTGPDGSVHVEIYLTIAGCPKKSEITERVTRAVADVPGTSAVRVSLDVMSDEQRT
+ ELRKQLRGDTREPVIPFAQPDSLTRVYAVASGKGGVGKSTVTVNLAAAMAVRGLSIGV
+ LDADIHGHSIPRMMGTTDRPTQVESMILPPIAHQVKVISIAQFTQGNTPVVWRGPMLH
+ RALQQFLADVYWGDLDVLLLDLPPGTGDVAISVAQLIPNAELLVVTTPQLAAAEVAER
+ AGSIALQTRQRIVGVVENMSGLTLPDGTTMQVFGEGGGRLVAERLSRAVGADVPLLGQ
+ IPLDPALVAAGDSGVPLVLSSPDSAIGKELHSIADGLSTRRRGLAGMSLGLDPTRR"
+ gene complement(1374234..1375469)
+ /locus_tag="BQ2027_MB1262C"
+ CDS complement(1374234..1375469)
+ /locus_tag="BQ2027_MB1262C"
+ /note="Mb1262c, -, len: 411 aa. Equivalent to Rv1230c,
+ len: 411 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 411 aa overlap). Possible membrane
+ protein with two hydrophobic stretches near N-terminus.
+ Some similarity to Rv1022|MTCY10G2.27c|Z92539 probable
+ lpqU protein from Mycobacterium tuberculosis (243 aa),
+ FASTA score: opt: 408, E(): 1e-11, (43.6% identity in 172
+ aa overlap). Similar to AL133423|SC4A7.37 hypothetical
+ protein from Streptomyces coelicolor (421 aa), FASTA
+ score: opt: 679, E(): 5.1e-23, (36.4% identity in 398 aa
+ overlap). Mb1262c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIT99863.1"
+ /db_xref="GOA:A0A1R3XYP6"
+ /db_xref="InterPro:IPR001827"
+ /db_xref="InterPro:IPR023346"
+ /db_xref="InterPro:IPR031304"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYP6"
+ /translation="MHIGGRWGARPAVAAVRRGACRLTRAPAFGVAAIAPLVFASAVG
+ GAAPVFPGRTAPVHAVITPVAAVAASGIDLSGPVVIAMKRPPTSFRVAVATIPAPPPP
+ MIVNSPGALGIPAMALSAYRNAELKMAAAAPGCGVSWNLLAGIGRIESMHANGGATDA
+ RGTAIQPIYGPTLDGTLPGNEIIIQSSVGNRVTYARAMGPMQFLPGTWARYATDGDDD
+ GVADPQNLFDSTLAAARYLCSGGLNLRDPAQVMAALLRYNNSMPYAQNVLGWAAGYAT
+ GVFPVDLPPITGPPPPLGDAHLENPEGLGPGLPINVNGLTADGPMAHLPLIDLTPRQA
+ ALNPPPMFPWMAPDPSAPMPGCTLICIGSHGPPVGAPPFPPTAPPPPFLPAAPPPPDP
+ LAGPPGDAGLAPPAPAPAG"
+ gene complement(1375594..1376136)
+ /locus_tag="BQ2027_MB1263C"
+ CDS complement(1375594..1376136)
+ /locus_tag="BQ2027_MB1263C"
+ /note="Mb1263c, -, len: 180 aa. Equivalent to Rv1231c,
+ len: 180 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 180 aa overlap). Probable membrane
+ protein, similar to others e.g. AL390975 Streptomyces
+ coelicolor (198 aa). Protein product from Mb1263c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1263c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE PROTEIN"
+ /protein_id="SIT99864.1"
+ /db_xref="GOA:A0A1R3XXS0"
+ /db_xref="InterPro:IPR010406"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXS0"
+ /translation="MSKPFAPRRLYTPRTSRTLAPRLDPEAVGRTTESIARFFGTGRY
+ LLVQTLLVLTWIVLNLFAVGLRWDPYPFILLNLAFSTQASYAAPLILLAQNRQEKRDR
+ AVFEEDRRRAAQTKADTEYNARELAALRLAIGEVPTRDYLRHELDSLRALLAELQPTD
+ PDVAQPRVADEAEQHAKKSG"
+ gene complement(1376133..1377440)
+ /locus_tag="BQ2027_MB1264C"
+ CDS complement(1376133..1377440)
+ /locus_tag="BQ2027_MB1264C"
+ /note="Mb1264c, -, len: 435 aa. Equivalent to Rv1232c,
+ len: 435 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 435 aa overlap). Conserved hypothetical
+ protein, similar to other hypothetical proteins e.g.
+ AB013374|AB013374_2 Bacillus halodurans C-125 mamX (449
+ aa), FASTA scores: opt: 381, E(): 1e-16, (29.9% identity
+ in 251 aa overlap). Some similarity in N-terminus to
+ U15180|MLU1518033 hypothetical Mycobacterium leprae
+ protein u1756u (329 aa), FASTA scores: opt: 300, E():
+ 4.1e-12, (69.3% identity in 75 aa overlap). Protein
+ product from Mb1264c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1264c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Mg/Co/Ni transporter MgtE, CBS
+ domain-containing"
+ /protein_id="SIT99865.1"
+ /db_xref="GOA:A0A1R3XY33"
+ /db_xref="InterPro:IPR000644"
+ /db_xref="InterPro:IPR006668"
+ /db_xref="InterPro:IPR006669"
+ /db_xref="InterPro:IPR011033"
+ /db_xref="InterPro:IPR038076"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY33"
+ /translation="MGSVNRVYLARLSRMSVLGPLGESFGRVRDVVISISIVRQQPRV
+ LGLVVDLATRRKIFIPILRVAAIEPHAVTLSTGNVSLHRFEQRPGEALALGQVLDTLV
+ KVNDPALPELAGVDVVVTDLGVEQTRSRDWMVTRVAVRTQRRLRRRGPVHVVDWHNVA
+ GLTPSALAMPGQDVAQLLDQFEGWKAVDVADAIRGLPPKRRHEVFKALHDKRLADVLQ
+ ELPELDQAEVLSQLGTERAADVLEEMDPDDAADLLAVLNPTEAELLLTRMDPGDSGQV
+ RRLLTHSPDTAGGLMTSDPVVLTPDTSIAEALARVRDPDLTPALASMVFVARPPTATP
+ TGHYLGCVHLQRLLRDPPAELVGGVVDTDLLTLTPETPLAAVTRYFAAYNLVCGPVVD
+ DENHLLGAVTVDDLLDHLLPHDWRVDMPELDPSGAPDRPGGPR"
+ gene complement(1377502..1378098)
+ /locus_tag="BQ2027_MB1265C"
+ CDS complement(1377502..1378098)
+ /locus_tag="BQ2027_MB1265C"
+ /note="Mb1265c, -, len: 198 aa. Equivalent to Rv1233c,
+ len: 198 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 198 aa overlap). Conserved hypothetical
+ membrane protein, N-terminus is highly proline rich,
+ C-terminus has two hydrophobic stretches. Proline-rich
+ N-terminus has some similarity to CBPA_DICDI calcium
+ binding protein from Dictyostelium discoideum (467 aa),
+ FASTA scores: E(): 4.8e-06, (35.5% identity in 183 aa
+ overlap). Both sequences share multiple copies of a
+ Tyr-Pro-Pro motif. Mb1265c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL MEMBRANE PROTEIN"
+ /protein_id="SIT99866.1"
+ /db_xref="GOA:A0A1R3XXR7"
+ /db_xref="InterPro:IPR025241"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXR7"
+ /translation="MTAPSGSSGESAHDAAGGPPPVGERPPEQPIADAPWAPPASSPM
+ ADHPPPAYPPSGYPPAYQPGYPTDYPPPMPPGGYAPPGYPPPGTSSAGYGDIPYPPMP
+ PPYGGSPGGYYPEPGYLDGYGPSQPGMNTMALVSLISALVGVLCCIGSIVGIVFGAIA
+ INQIKQTREEGYGLAVAGIVIGIATLLVYMIAGIFAIP"
+ gene 1378248..1378775
+ /locus_tag="BQ2027_MB1266"
+ CDS 1378248..1378775
+ /locus_tag="BQ2027_MB1266"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1266, -, len: 175 aa. Equivalent to Rv1234, len:
+ 175 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 175 aa overlap). Possible transmembrane
+ protein with two TM helices. Protein product from Mb1266
+ detected using shotgun mass spectrometry. Mb1266 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSMEMBRANE PROTEIN"
+ /protein_id="SIT99867.1"
+ /db_xref="GOA:A0A1R3XXR1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXR1"
+ /translation="MTSPFQPRQVPGSTPAAAGAGRRGVPALPTPPKGWPVGSYPTYA
+ EAQRAVDYLSEQQFPVQQVTIVGVDLMQVERVTGRLTWPKVLGGGVLSGAWLGLFIGL
+ VLGFFSPNPWSALVTGLVAGVFFGLITSAVPYAMARGTRDFSSTMQLVAGRYDVLCDP
+ QNAEKARDLLARLAI"
+ gene 1378796..1380202
+ /gene="lpqY"
+ /locus_tag="BQ2027_MB1267"
+ CDS 1378796..1380202
+ /gene="lpqY"
+ /locus_tag="BQ2027_MB1267"
+ /note="Mb1267, lpqY, len: 468 aa. Equivalent to Rv1235,
+ len: 468 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 468 aa overlap). Probable lpqY,
+ sugar-binding lipoprotein component of sugar transport
+ system (see citation below), equivalent to MLU1518034
+ protein u1756v from Mycobacterium leprae (469 aa), FASTA
+ scores: opt: 2442, E(): 0, (77.4% identity in 470 aa
+ overlap). Also similar to P18815|MALE_ENTAE
+ MALTOSE-BINDING PERIPLASMIC PROTEIN from Enterobacter
+ aerogenes (396 aa), FASTA scores: opt: 193, E(): 2.3e-05,
+ (24.2% identity in 297 aa overlap). Contains PS00013
+ Prokaryotic membrane lipoprotein lipid attachment site.
+ Protein product from Mb1267 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1267 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUGAR-BINDING LIPOPROTEIN LPQY"
+ /protein_id="SIT99868.1"
+ /db_xref="InterPro:IPR006059"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXR4"
+ /translation="MVMSRGRIPRLGAAVLVALTTAAAACGADSQGLVVSFYTPATDG
+ ATFTAIAQRCNQQFGGRFTIAQVSLPRSPNEQRLQLARRLTGNDRTLDVMALDVVWTA
+ EFAEAGWALPLSDDPAGLAENDAVADTLPGPLATAGWNHKLYAAPVTTNTQLLWYRPD
+ LVNSPPTDWNAMIAEAARLHAAGEPSWIAVQANQGEGLVVWFNTLLVSAGGSVLSEDG
+ RHVTLTDTPAHRAATVSALQILKSVATTPGADPSITRTEEGSARLAFEQGKAALEVNW
+ PFVFASMLENAVKGGVPFLPLNRIPQLAGSINDIGTFTPSDEQFRIAYDASQQVFGFA
+ PYPAVAPGQPAKVTIGGLNLAVAKTTRHRAEAFEAVRCLRDQHNQRYVSLEGGLPAVR
+ ASLYSDPQFQAKYPMHAIIRQQLTDAAVRPATPVYQALSIRLAAVLSPITEIDPESTA
+ DELAAQAQKAIDGMGLLP"
+ gene 1380199..1381122
+ /gene="sugA"
+ /locus_tag="BQ2027_MB1268"
+ CDS 1380199..1381122
+ /gene="sugA"
+ /locus_tag="BQ2027_MB1268"
+ /note="Mb1268, sugA, len: 307 aa. Equivalent to Rv1236,
+ len: 307 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 307 aa overlap). Probable sugA,
+ sugar-transport integral membrane protein ABC transporter
+ (see citation below), equivalent to U15180|MLU1518035
+ protein malFM from Mycobacterium leprae (310 aa), FASTA
+ scores: opt: 1566, E(): 0, (81.8% identity in 292 aa
+ overlap). Also similar to numerous bacterial sugar
+ transport system components. Also similar to
+ Rv2316|MTCY3G12.18c from Mycobacterium tuberculosis (290
+ aa), FASTA scores: opt: 514, E(): 7.3e-27, (33.2% identity
+ in 283 aa overlap). Contains PS00402
+ Binding-protein-dependent transport systems inner membrane
+ comp signature. Protein product from Mb1268 detected using
+ SWATH mass spectrometry. Mb1268 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUGAR-TRANSPORT INTEGRAL MEMBRANE
+ PROTEIN ABC TRANSPORTER SUGA"
+ /protein_id="SIT99869.1"
+ /db_xref="GOA:A0A1R3XXS7"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXS7"
+ /translation="MTSVEQRTATAVFSRTGSRMAERRLAFMLVAPAAMLMVAVTAYP
+ IGYALWLSLQRNNLATPNDTAFIGLGNYHTILIDRYWWTALAVTLAITAVSVTIEFVL
+ GLALALVMHRTLIGKGLVRTAVLIPYGIVTVVASYSWYYAWTPGTGYLANLLPYDSAP
+ LTQQIPSLGIVVIAEVWKTTPFMSLLLLAGLALVPEDLLRAAQVDGASAWRRLTKVIL
+ PMIKPAIVVALLFRTLDAFRIFDNIYVLTGGSNNTGSVSILGYDNLFKGFNVGLGSAI
+ SVLIFGCVAVIAFIFIKLFGAAAPGGEPSGR"
+ gene 1381127..1381951
+ /gene="sugB"
+ /locus_tag="BQ2027_MB1269"
+ CDS 1381127..1381951
+ /gene="sugB"
+ /locus_tag="BQ2027_MB1269"
+ /note="Mb1269, sugB, len: 274 aa. Equivalent to Rv1237,
+ len: 274 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 274 aa overlap). Probable sugB,
+ sugar-transport integral membrane protein ABC transporter
+ (see citation below), equivalent to U15180|MLU1518036
+ protein MalGM from Mycobacterium leprae (296 aa), FASTA
+ scores: opt: 1571, E(): 0, (89.8% identity in 274 aa
+ overlap). Also similar to numerous bacterial sugar
+ transport protein. Related to Rv2834c|MTCY16B7.08 from
+ Mycobacterium tuberculosis (275 aa), FASTA scores: opt:
+ 370, E(): 2.4e-17, (26.8% identity in 269 aa overlap).
+ Protein product from Mb1269 detected using SWATH mass
+ spectrometry. Mb1269 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUGAR-TRANSPORT INTEGRAL MEMBRANE
+ PROTEIN ABC TRANSPORTER SUGB"
+ /protein_id="SIT99870.1"
+ /db_xref="GOA:A0A1R3XXR5"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXR5"
+ /translation="MGARRATYWAVLDTLVVGYALLPVLWIFSLSLKPTSTVKDGKLI
+ PSTVTFDNYRGIFRGDLFSSALINSIGIGLITTVIAVVLGAMAAYAVARLEFPGKRLL
+ IGAALLITMFPSISLVTPLFNIERAIGLFDTWPGLILPYITFALPLAIYTLSAFFREI
+ PWDLEKAAKMDGATPGQAFRKVIVPLAAPGLVTAAILVFIFAWNDLLLALSLTATKAA
+ ITAPVAIANFTGSSQFEEPTGSIAAGAIVITIPIIVFVLIFQRRIVAGLTSGAVKG"
+ gene 1381956..1383137
+ /gene="sugC"
+ /locus_tag="BQ2027_MB1270"
+ CDS 1381956..1383137
+ /gene="sugC"
+ /locus_tag="BQ2027_MB1270"
+ /note="Mb1270, sugC, len: 393 aa. Equivalent to Rv1238,
+ len: 393 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 393 aa overlap). Probable sugC,
+ sugar-transport ATP-binding protein ABC transporter (see
+ citation below). Highly similar to U15180 protein ugpC
+ from Mycobacterium leprae (392 aa), FASTA score: opt:
+ 2007, E(): 0, (79.9% identity in 389 aa overlap). Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop) and PS00211
+ ABC transporters family signature. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Protein product from Mb1270 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1270 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUGAR-TRANSPORT ATP-BINDING PROTEIN ABC
+ TRANSPORTER SUGC"
+ /protein_id="SIT99871.1"
+ /db_xref="GOA:A0A1R3XXS2"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR008995"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR040582"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXS2"
+ /translation="MAEIVLDHVNKSYPDGHTAVRDLNLTIADGEFLILVGPSGCGKT
+ TTLNMIAGLEDISSGELRIAGERVNEKAPKDRDIAMVFQSYALYPHMTVRQNIAFPLT
+ LAKMRKADIAQKVSETAKILDLTNLLDRKPSQLSGGQRQRVAMGRAIVRHPKAFLMDE
+ PLSNLDAKLRVQMRGEIAQLQRRLGTTTVYVTHDQTEAMTLGDRVVVMYGGIAQQIGT
+ PEELYERPANLFVAGFIGSPAMNFFPARLTAIGLTLPFGEVTLAPEVQGVIAAHPKPE
+ NVIVGVRPEHIQDAALIDAYQRIRALTFQVKVNLVESLGADKYLYFTTESPAVHSVQL
+ DELAEVEGESALHENQFVARVPAESKVAIGQSVELAFDTARLAVFDADSGANLTIPHR
+ A"
+ gene complement(1383214..1384314)
+ /gene="corA"
+ /locus_tag="BQ2027_MB1271C"
+ CDS complement(1383214..1384314)
+ /gene="corA"
+ /locus_tag="BQ2027_MB1271C"
+ /note="Mb1271c, corA, len: 366 aa. Equivalent to Rv1239c,
+ len: 366 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 366 aa overlap). Possible corA,
+ magnesium and cobalt transport transmembrane protein,
+ highly similar to U15180 corA protein from Mycobacterium
+ leprae (373 aa), FASTA scores: opt: 1985, E(): 0, (79.1%
+ identity in 369 aa overlap). Also similar to various CorA
+ proteins of Gram negative bacteria e.g.
+ P27841|CORA_ECOLI|B3816|Z5333|ECS4746 Magnesium and cobalt
+ transport protein from Escherichia coli strains K12 and
+ O157:H7 (316 aa), FASTA scores: opt: 236, E(): 8e-08,
+ (24.5% identity in 306 aa overlap); etc. SEEMS TO BELONG
+ TO THE MIT FAMILY. Protein product from Mb1271c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1271c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MAGNESIUM AND COBALT TRANSPORT
+ TRANSMEMBRANE PROTEIN CORA"
+ /protein_id="SIT99872.1"
+ /db_xref="GOA:A0A1R3XZW9"
+ /db_xref="InterPro:IPR002523"
+ /db_xref="InterPro:IPR004488"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZW9"
+ /translation="MFPGFDALPEVLRPVARPQPPNAHPVAQPPAQALVDCGVYVCGQ
+ RLPGKYTYAAALREVREIELTGQEAFVWIGLHEPDENQMQDVADVFGLHPLAVEDAVH
+ AHQRPKLERYDETLFLVLKTVNYVPHESVVLAREIVETGEIMIFVGKDFVVTVRHGEH
+ GGLSEVRKRMDADPEHLRLGPYAVMHAIADYVVDRYLEVTNLMETDIDSIEEVAFAPG
+ RKLDIEPIYLLKREVVELRRCVNPLSTAFQRMQTESKDLISKEVRRYLRDVADHQTEA
+ ADQIASYDDMLNSLVQAALARVGMQQNMDMRKISAWAGIIAVPTMIAGIYGMNFHFMP
+ ELDSRWGYPTVIGGMVLICLFLYHVFRNRNWL"
+ gene 1384485..1385474
+ /gene="mdh"
+ /locus_tag="BQ2027_MB1272"
+ CDS 1384485..1385474
+ /gene="mdh"
+ /locus_tag="BQ2027_MB1272"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1272, mdh, len: 329 aa. Equivalent to Rv1240,
+ len: 329 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 329 aa overlap). Probable mdh, Malate
+ dehydrogenase (EC 1.1.1.37). Most similar to
+ P50917|MDH_MYCLE MALATE DEHYDROGENASE from Mycobacterium
+ leprae (329 aa), FASTA scores: opt: 1887, E(): 0, (89.1%
+ identity in 329 aa overlap). Contains PS00068 Malate
+ dehydrogenase active site signature. BELONGS TO THE LDH
+ FAMILY. MDH SUBFAMILY. Protein product from Mb1272
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1272 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MALATE DEHYDROGENASE MDH"
+ /protein_id="SIT99873.1"
+ /db_xref="GOA:P0A5J7"
+ /db_xref="InterPro:IPR001236"
+ /db_xref="InterPro:IPR001252"
+ /db_xref="InterPro:IPR001557"
+ /db_xref="InterPro:IPR010945"
+ /db_xref="InterPro:IPR015955"
+ /db_xref="InterPro:IPR022383"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5J7"
+ /translation="MSASPLKVAVTGAAGQIGYSLLFRLASGSLLGPDRPIELRLLEI
+ EPALQALEGVVMELDDCAFPLLSGVEIGSDPQKIFDGVSLALLVGARPRGAGMERSDL
+ LEANGAIFTAQGKALNAVAADDVRVGVTGNPANTNALIAMTNAPDIPRERFSALTRLD
+ HNRAISQLAAKTGAAVTDIKKMTIWGNHSATQYPDLFHAEVAGKNAAEVVNDQAWIED
+ EFIPTVAKRGAAIIDARGASSAASAASATIDAARDWLLGTPADDWVSMAVVSDGSYGV
+ PEGLISSFPVTTKGGNWTIVSGLEIDEFSRGRIDKSTAELADERSAVTELGLI"
+ gene 1385550..1385810
+ /gene="vapb33"
+ /locus_tag="BQ2027_MB1273"
+ CDS 1385550..1385810
+ /gene="vapb33"
+ /locus_tag="BQ2027_MB1273"
+ /note="Mb1273, -, len: 86 aa. Equivalent to Rv1241, len:
+ 86 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 86 aa overlap). Conserved hypothetical
+ protein, member of family of 16 hypothetical M.
+ tuberculosis proteins including: Rv2871|Q10799|YS71_MYCTU
+ HYPOTHETICAL 13.2 KD PROTEIN CY2 (124 aa), FASTA scores:
+ opt: 172, E(): 9.5e-06, (37.2% identity in 86 aa overlap);
+ Rv2132, Rv3321c, etc. Protein product from Mb1273 detected
+ using SWATH mass spectrometry. Mb1273 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb33"
+ /protein_id="SIT99874.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXT0"
+ /translation="MRTTLTLDDDVVRLVEDAVHRERRPMKQVINDALRRALAPPVKR
+ QEQYRLEPHESAVRSGLDLAGFNKLADELEDEALLDATRRAR"
+ gene 1385807..1386238
+ /gene="vapc33"
+ /locus_tag="BQ2027_MB1274"
+ CDS 1385807..1386238
+ /gene="vapc33"
+ /locus_tag="BQ2027_MB1274"
+ /note="Mb1274, -, len: 143 aa. Equivalent to Rv1242, len:
+ 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 143 aa overlap). Conserved hypothetical
+ protein, member of family of 14 hypothetical M.
+ tuberculosis proteins including: Rv2872|Q10800|YS72_MYCTU
+ (147 aa), FASTA scores: opt: 226, E(): 2.7e-09, (32.1%
+ identity in 137 aa overlap); Rv0749, Rv0277c, Rv2530c,
+ etc. Protein product from Mb1274 detected using SWATH mass
+ spectrometry. Mb1274 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc33. contains pin domain."
+ /protein_id="SIT99875.1"
+ /db_xref="GOA:A0A1R3XY37"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR006226"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY37"
+ /translation="MIIPDINLLLYAVITGFPQHRRAHAWWQDTVNGHTRIGLTYPAL
+ FGFLRIATSARVLAAPLPTADAIAYVREWLSQPNVDLLTAGPRHLDIALGLLDKLGTA
+ SHLTTDVQLAAYGIEYDAEIHSSDTDFARFADLKWTDPLRE"
+ gene complement(1386261..1387949)
+ /gene="PE_PGRS23"
+ /locus_tag="BQ2027_MB1275C"
+ CDS complement(1386261..1387949)
+ /gene="PE_PGRS23"
+ /locus_tag="BQ2027_MB1275C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1275c, PE_PGRS23, len: 562 aa. Equivalent to
+ Rv1243c, len: 562 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 562 aa overlap). Member of
+ the Mycobacterium tuberculosis PE family, PGRS subfamily
+ of gly-rich proteins."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs23"
+ /protein_id="SIT99876.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXS6"
+ /translation="MEYLIAAQDVLVAAAADLEGIGSALAAANRAAEAPTTGLLAAGA
+ DEVSAAIASLFSGNAQAYQALSAQAAAFHQQFVRALSSAAGSYAAAEAANASPMQAVL
+ DVVNGPTQLLLGRPLIGDGANGGPGQNGGDGGLLYGNGGNGGSSSTPGQPGGRGGAAG
+ LIGNGGAGGAGGPGANGGAGGNGGWLYGNGGLGGNGGAATQIGGNGGNGGHGGNAGLW
+ GNGGAGGAGAAGAAGANGQNPVSHQVTHATDGADGTTGPDGNGTDAGSGSNAVNPGVG
+ GGAGGIGGDGTNLGQTDVSGGAGGDGGDGANFASGGAGGNGGAAQSGFGDAVGGNGGA
+ GGNGGAGGGGGLGGAGGSANVANAGNSIGGNGGAGGNGGIGAPGGAGGAGGNANQDNP
+ PGGNSTGGNGGAGGDGGVGASADVGGAGGFGGSGGRGGLLLGTGGAGGDGGVGGDGGI
+ GAQGGSGGNGGNGGIGADGMANQDGDGGDGGNGGDGGAGGAGGVGGNGGTGGAGGLFG
+ QSGSPGSGAAGGLGGAGGNGGAGGGGGTGFNPGAPGDPGTQGATGANGQHGLNG"
+ gene 1388129..1388989
+ /gene="lpqZ"
+ /locus_tag="BQ2027_MB1276"
+ CDS 1388129..1388989
+ /gene="lpqZ"
+ /locus_tag="BQ2027_MB1276"
+ /note="Mb1276, lpqZ, len: 286 aa. Equivalent to Rv1244,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 286 aa overlap). Probable lipoprotein
+ lpqZ, equivalent to U15180|MLU1518042 protein u1756x from
+ Mycobacterium leprae (228 aa), FASTA scores: opt: 1039,
+ E(): 0, (72.5% identity in 229 aa overlap). Similar to M.
+ tuberculosis hypothetical protein Rv3759c. Contains
+ PS00013 Prokaryotic membrane lipoprotein lipid attachment
+ site. Protein product from Mb1276 detected using SWATH
+ mass spectrometry. Mb1276 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable lipoprotein lpqz"
+ /protein_id="SIT99877.1"
+ /db_xref="GOA:A0A1R3XXS3"
+ /db_xref="InterPro:IPR007210"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXS3"
+ /translation="MRITRILALLLAVLLAVSGVAGCSADTGDRHPELVVGSTPDSEA
+ MLLAAIYVAALRSYGFAAHAETAADPVAKLDSGAFTVVPAFTGQMLQTLQPDASVRSD
+ AQVYRAIVSALPEGIAAGDYTTAAEDKPALVVTQSTAKAWGGGDLSELPSHCRGLLVG
+ RVAGAHTPAAVGPCRLPAPREFRNDATMFAALRAGQLVAAWTTTADPDIPADLIMLTD
+ GKPALIRAENIVPLYRRNALTERKLLAVNEVAGVLDTTALIGMRRQVAAGADPAAVAA
+ GWLAEHPLGR"
+ gene complement(1389070..1389900)
+ /locus_tag="BQ2027_MB1277C"
+ CDS complement(1389070..1389900)
+ /locus_tag="BQ2027_MB1277C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1277c, -, len: 276 aa. Equivalent to Rv1245c,
+ len: 276 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 276 aa overlap). Probable short-chain
+ dehydrogenase/reductase (EC 1.-.-.-), equivalent to
+ NP_301801.1|NC_002677 short chain alcohol dehydrogenase
+ from Mycobacterium leprae (277 aa). Also highly similar to
+ various dehydrogenases and oxidoreductases e.g.
+ NP_250228.1|NC_002516 probable short-chain dehydrogenase
+ from Pseudomonas aeruginosa (295 aa);
+ NP_421969.1|NC_002696 short chain dehydrogenase family
+ protein from Caulobacter crescentus (278 aa); etc. Also
+ highly similar to others from Mycobacterium tuberculosis
+ e.g. Rv3085|MTV013.06 PROBABLE SHORT-CHAIN TYPE
+ DEHYDROGENASE/REDUCTASE (276 aa), FASTA scores: opt: 368,
+ E(): 1.2e-16, (35.3% identity in 224 aa overlap);
+ Rv3057c|MTCY22D7.24 PUTATIVE SHORT CHAIN ALCOHOL
+ DEHYDROGENASE/REDUCTASE (287 aa), FASTA scores: opt: 471,
+ E(): 1.3e-21, (32.4% identity in 281 aa overlap); etc.
+ Contains PS00061 Short-chain dehydrogenases/reductases
+ family signature. BELONGS TO THE SHORT-CHAIN
+ DEHYDROGENASES/REDUCTASES (SDR) FAMILY. Protein product
+ from Mb1277c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1277c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SHORT-CHAIN TYPE
+ DEHYDROGENASE/REDUCTASE"
+ /protein_id="SIT99878.1"
+ /db_xref="GOA:A0A1R3XXS4"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXS4"
+ /translation="MEGFAGKVAVVTGAGSGIGQALAIELARSGAKVAISDVDTDGLA
+ DTEHRLKAISTPVKTDRLDVTEREAFLAYADAVNEHFGTVNQIYNNAGIAFTGDIEVS
+ QFKDIERVMDVDFWGVVNGTKAFLPHLIASGDGHVINISSVFGLFSAPGQAAYNSAKF
+ AVRGFTEALRQEMALAGHPVKVTTVHPGGVKTAIARNATAAEGLDQAELAETFDKRVA
+ HLSPQRAAQIILTGVAKNKARVLVGVDAKVLDLVVRLTGSGYQRIFPIITGRLIPRPR
+ "
+ gene complement(1389957..1390250)
+ /gene="relE"
+ /locus_tag="BQ2027_MB1278C"
+ CDS complement(1389957..1390250)
+ /gene="relE"
+ /locus_tag="BQ2027_MB1278C"
+ /note="Mb1278c, -, len: 97 aa. Equivalent to Rv1246c, len:
+ 97 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 97 aa overlap). Conserved hypothetical
+ protein, highly similar to Rv2866|MTV003.12 hypothetical
+ Mycobacterium tuberculosis protein (87 aa), FASTA scores:
+ opt: 290, E(): 3.9e-24, (54.1% identity in 85 aa overlap).
+ Protein product from Mb1278c detected using SWATH mass
+ spectrometry. Mb1278c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="toxin relE"
+ /protein_id="SIT99879.1"
+ /db_xref="InterPro:IPR007712"
+ /db_xref="InterPro:IPR035093"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXT8"
+ /translation="MSDDHPYHVAITATAARDLQRLPEKIAAACVEFVFGPLLNNPHR
+ LGKPLRNDLEGLHSARRGDYRVVYAIDDGHHRVEIIHIARRSASYRMNPCRPR"
+ gene complement(1390247..1390516)
+ /gene="relB"
+ /locus_tag="BQ2027_MB1279C"
+ CDS complement(1390247..1390516)
+ /gene="relB"
+ /locus_tag="BQ2027_MB1279C"
+ /note="Mb1279c, -, len: 89 aa. Equivalent to Rv1247c, len:
+ 89 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 89 aa overlap). Conserved hypothetical
+ protein, some similarity to hypothetical proteins
+ including Mycobacterium tuberculosis proteins
+ Rv2865|MTV003.11 (93 aa), FASTA scores: opt: 249, E():
+ 5.4e-13, (44.2% identity in 86 aa overlap);
+ Rv0268|Z86089|P95225 (169 aa) opt: 125, E(): 0.0089,
+ (41.8% identity in 55 aa overlap); etc. and
+ AE000293|ECAE0002933 from Escherichia coli (92 aa), FASTA
+ scores: opt: 127, E(): 0.0038, (29.3% identity in 82 aa
+ overlap). Protein product from Mb1279c detected using
+ SWATH mass spectrometry. Mb1279c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="antitoxin relb"
+ /protein_id="SIT99880.1"
+ /db_xref="InterPro:IPR006442"
+ /db_xref="InterPro:IPR036165"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXS5"
+ /translation="MAVVPLGEVRNRLSEYVAEVELTHERITITRHGHPAAVLISADD
+ LASIEETLEVLRTPGASEAIREGLADVAAGRFVSNDEIRNRYTAR"
+ gene complement(1390629..1394324)
+ /gene="sucA"
+ /locus_tag="BQ2027_MB1280C"
+ CDS complement(1390629..1394324)
+ /gene="sucA"
+ /locus_tag="BQ2027_MB1280C"
+ /note="Mb1280c, len: 1231 aa. Equivalent to Rv1248c len:
+ 1231 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 1231 aa overlap). Multifunctional
+ alpha-ketoglutarate metabolic enzyme, highly similar to
+ D84102 Corynebacterium glutamicum (1257 aa), FASTA scores:
+ opt: 4418, E(): 0, (59.4% identity in 1223 aa overlap).
+ Cofactor: thiamine diphosphate. Start changed since first
+ submission (+17 aa). Protein product from Mb1280c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1280c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Multifunctional alpha-ketoglutarate metabolic
+ enzyme"
+ /protein_id="SIT99881.1"
+ /db_xref="GOA:Q7U0A6"
+ /db_xref="InterPro:IPR001017"
+ /db_xref="InterPro:IPR001078"
+ /db_xref="InterPro:IPR005475"
+ /db_xref="InterPro:IPR011603"
+ /db_xref="InterPro:IPR023213"
+ /db_xref="InterPro:IPR029061"
+ /db_xref="InterPro:IPR031717"
+ /db_xref="InterPro:IPR032106"
+ /db_xref="InterPro:IPR042179"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U0A6"
+ /translation="MANISSPFGQNEWLVEAMYRKFRDDPSSVDPSWHEFLVDYSPEP
+ TSQPAAEPTRVTSPLVAERAAAAAPQAPPKPADTAAAGNGVVAALAAKTAVPPPAEGD
+ EVAVLRGAAAAVVKNMSASLEVPTATSVRAVPAKLLIDNRIVINNQLKRTRGGKISFT
+ HLLGYALVQAVKKFPNMNRHYTEVDGKPTAVTPAHTNLGLAIDLQGKDGKRSLVVAGI
+ KRCETMRFAQFVTAYEDIVRRARDGKLTTEDFAGVTISLTNPGTIGTVHSVPRLMPGQ
+ GAIIGVGAMEYPAEFQGASEERIAELGIGKLITLTSTYDHRIIQGAESGDFLRTIHEL
+ LLSDGFWDEVFRELSIPYLPVRWSTDNPDSIVDKNARVMNLIAAYRNRGHLMADTDPL
+ RLDKARFRSHPDLEVLTHGLTLWDLDRVFKVDGFAGAQYKKLRDVLGLLRDAYCRHIG
+ VEYAHILDPEQKEWLEQRVETKHVKPTVAQQKYILSKLNAAEAFETFLQTKYVGQKRF
+ SLEGAESVIPMMDAAIDQCAEHGLDEVVIGMPHRGRLNVLANIVGKPYSQIFTEFEGN
+ LNPSQAHGSGDVKYHLGATGLYLQMFGDNDIQVSLTANPSHLEAVDPVLEGLVRAKQD
+ LLDHGSIDSDGQRAFSVVPLMLHGDAAFAGQGVVAETLNLANLPGYRVGGTIHIIVNN
+ QIGFTTAPEYSRSSEYCTDVAKMIGAPIFHVNGDDPEACVWVARLAVDFRQRFKKDVV
+ IDMLCYRRRGHNEGDDPSMTNPYMYDVVDTKRGARKSYTEALIGRGDISMKEAEDALR
+ DYQGQLERVFNEVRELEKHGVQPSESVESDQMIPAGLATAVDKSLLARIGDAFLALPN
+ GFTAHPRVQPVLEKRREMAYEGKIDWAFGELLALGSLVAEGKLVRLSGQDSRRGTFSQ
+ RHSVLIDRHTGEEFTPLQLLATNSDGSPTGGKFLVYDSPLSEYAAVGFEYGYTVGNPD
+ AVVLWEAQFGDFVNGAQSIIDEFISSGEAKWGQLSNVVLLLPHGHEGQGPDHTSARIE
+ RFLQLWAEGSMTIAMPSTPSNYFHLLRRHALDGIQRPLIVFTPKSMLRHKAAVSEIKD
+ FTEIKFRSVLEEPTYEDGIGDRNKVSRILLTSGKLYYELAARKAKDNRNDLAIVRLEQ
+ LAPLPRRRLRETLDRYENVKEFFWVQEEPANQGAWPRFGLELPELLPDKLAGIKRISR
+ RAMSAPSSGSSKVHAVEQQEILDEAFG"
+ gene complement(1394466..1395254)
+ /locus_tag="BQ2027_MB1281C"
+ CDS complement(1394466..1395254)
+ /locus_tag="BQ2027_MB1281C"
+ /note="Mb1281c, -, len: 262 aa. Equivalent to Rv1249c,
+ len: 262 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 262 aa overlap). Possible membrane
+ protein. Start uncertain. Protein product from Mb1281c
+ detected using SWATH mass spectrometry. Mb1281c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIT99882.1"
+ /db_xref="GOA:A0A1R3XZY1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZY1"
+ /translation="MSARRIRSWKRFDNRSANAAEPDPQLAGTGGRPKVSTRALAQVI
+ ERSSRIQGPAAQAYVARLRRAHPGASPAKIVAKLEKRFLSVVTASGAAVGTAATLPGI
+ GTLAAWFAAAGEVVVFLEATALFVLALASVHAIPLDHRERRRALVLAVLVGDNTTAVA
+ DLLGPGRTSGGWVSETMASLPLPAISSLNSRMLKYVVKRFALKRGALMFGKLVPMGIG
+ AIIGAIGNRLVGKKLVRNARSAFGTPPARWPVTLHVLPTVRDAS"
+ gene 1395451..1397190
+ /locus_tag="BQ2027_MB1282"
+ CDS 1395451..1397190
+ /locus_tag="BQ2027_MB1282"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1282, -, len: 579 aa. Equivalent to Rv1250, len:
+ 579 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 579 aa overlap). Probable
+ drug-transport integral membrane protein, member of major
+ facilitator superfamily (MFS), highly similar to several
+ including P39886|TCMA_STRGA TETRACENOMYCIN C RESISTANCE
+ PROTEIN from Streptomyces glaucescens (538 aa), FASTA
+ scores: opt: 847, E(): 0, (32.9% identity in 517 aa
+ overlap); etc. Also similar to MTCY20B11.14c|Rv3239C from
+ Mycobacterium tuberculosis (1048 aa), FASTA scores: opt:
+ 629, E(): 6.7e-13, (31.9% identity in 423 aa overlap).
+ TBparse score is 0.921. Protein product from Mb1282
+ detected using SWATH mass spectrometry. Mb1282 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DRUG-TRANSPORT INTEGRAL MEMBRANE
+ PROTEIN"
+ /protein_id="SIT99883.1"
+ /db_xref="GOA:A0A1R3XYR8"
+ /db_xref="InterPro:IPR004638"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYR8"
+ /translation="MTTAIRRAAGSSYFRNPWPALWAMMVGFFMIMLDSTVVAIANPT
+ IMAQLRIGYATVVWVTSAYLLAYAVPMLVAGRLGDRFGPKNLYLIGLGVFTVASLGCG
+ LSSGAGMLIAARVVQGVGAGLLTPQTLSTITRIFPAHRRGVALGAWGTVASVASLVGP
+ LAGGALVDSMGWEWIFFVNVPVGVIGLILAAYLIPALPHHPHRFDWFGVGLSGAGMFL
+ IVFGLQQGQSANWQPWIWAVIVGGIGFMSLFVYWQARNAREPLIPLEVFNDRNFSLSN
+ LGIAIIAFAGTGMMLPVTFYAQAVCGLSPTHTAVLFAPTAIVGGVLAPFVGMIIDRSH
+ PLCVLGFGFSVLAIAMTWLLCEMAPGTPIWRLVLPFIALGVAGAFVWSPLTVTATRNL
+ RPHLAGASSGVFNAVRQLGAVLGSASMAAFMTSRIAAEMPGGVDALTGPAGQDATVLQ
+ LPEFVREPFAAAMSQSMLLPAFVALFGIVAALFLVDFTGAAVAKEPLPESDGDADDDD
+ YVEYILRREPEEDCDTQPLRASRPAAAAASRSGAGGPLAVSWSTSAQGMPPGPPGRRA
+ WQADTESTAPSAL"
+ gene complement(1397093..1400512)
+ /locus_tag="BQ2027_MB1283C"
+ CDS complement(1397093..1400512)
+ /locus_tag="BQ2027_MB1283C"
+ /note="Mb1283c, -, len: 1139 aa. Equivalent to Rv1251c,
+ len: 1139 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100% identity in 1139 aa overlap). Conserved
+ hypothetical protein, showing some similarity in
+ C-terminal region with other proteins from eukaryotes and
+ bacteria e.g. NP_142121.1 hypothetical protein from
+ Pyrococcus horikoshii (1188 aa); and some similarity to
+ GTP-binding proteins e.g. P23249|MV10_MOUSE PUTATIVE
+ GTP-BINDING PROTEIN (1004 aa), FASTA scores: opt: 228,
+ E(): 1.7e-06, (27.7% identity in 560 aa overlap). Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop). Mb1283c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Superfamily I DNA and RNA helicases and helicase
+ subunits"
+ /protein_id="SIT99884.1"
+ /db_xref="InterPro:IPR019993"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR038720"
+ /db_xref="InterPro:IPR041679"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXU0"
+ /translation="MFVTGDSIVYSASDLAAAARCQYALLREFDAKLGRGPAVAVDDE
+ LMARAAVLGSAHEGRRLDQLRHEFGDAVAIIGRPAYTPAGLAAAADATRRAIANHAPV
+ VYQAAMFDGRFVGFADFLIRDGHRYRVADTKLARSPTVTALLQLAAYADALVHSGVPV
+ AADAELELGDGTIVRYRVGELIPVYRSQRALLQRLLDGHYTAGTAVRWDDERVQACFR
+ CPQCTERLRASDDLLLVGGMRVRQRDKLLEAGITTIAELADHTAPVPGLTTNALGKLT
+ AQAKLQIRQRDTGAPQFEIVDPRPLTLLPEPNPGDLFFDFEGDPLWTADGKQWGLEYL
+ FGVLEAGRAGVFRPLWAHDRTAERQALTDFLAIVARRRRRHPNMHIYHYAPYEKTALL
+ RLVGRYGIGEDDVDDLLRNGVLVDLYPLVRKSIRVGTDSFSLKALEPLYLGTQPRSGD
+ VTTAADSINSYARYCELRAAGRIDEAATVLKEIEGYNHYDCRSTRALRDWLLMRAWEA
+ GVTPIGAQPVPDADPIDDGDSLASVLSKFTGDAAAGERTPEQTAVALLAAARGYHRRE
+ DKPFWWAHFDRLNYPVDEWSDSTDVFLASEASVTVDWHMPPRARKPQRRVRLTGELAR
+ GDLNGNVFALYEPPAPPGMTDNPDRRAAGPAAVVETDDPTVPTEVVIVERTGSDGNTF
+ QQLPFALAPGPPVPTTALRESIESTAAAVASGSPQLPSTALMDVLLRRPPRTRSGAAL
+ PRSSDPVTDIAAAALDLDSSYLAVHGPPGTGKTYTAARVIAELVTEHAWRIGVVAQSH
+ ATVENLLEGVISAGLDPGQVAKKPHDHTAGRWQSIDGSQYTEFIRDTAGCVIGGTAWD
+ FANGNRVPKASLDLLVIDEAGQFCLANTIAVAPAATNLLLLGDPQQLPQVSQGTHPEP
+ VDTSALSWLVDGQHTLPDERGYFLDRSYRMHPAVCAAVSALSYEGRLCSHTERTAVRR
+ LDGYPPGVHTRGVHHKGNSIESPEEAEAILAELRQLLGSPWTDEHGTRPLAASDVLVL
+ APYNAQVALVRRRLASAGLGGADGVRVGTVDKFQGGQAPVVFISMTASSADDVPRGIS
+ FLLNRNRLNVAVSRAQYAAVIVRSELLTQYLPATPDGLVDLGAFLGLTSTS"
+ gene complement(1400568..1401176)
+ /gene="lprE"
+ /locus_tag="BQ2027_MB1284C"
+ CDS complement(1400568..1401176)
+ /gene="lprE"
+ /locus_tag="BQ2027_MB1284C"
+ /note="Mb1284c, lprE, len: 202 aa. Equivalent to Rv1252c,
+ len: 202 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 202 aa overlap). Probable lipoprotein
+ lprE, some similarity to Mycobacterium tuberculosis
+ protein Rv3483c|MTCY13E12.36C (220 aa), FASTA scores: E():
+ 7e-05, (29.5% identity in 200 aa overlap). Contains
+ possible N-terminal signal sequence and appropriately
+ positioned prokaryotic lipoprotein lipid attachment site
+ (PS00013). Mb1284c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPOPROTEIN LPRE"
+ /protein_id="SIT99885.1"
+ /db_xref="GOA:P65313"
+ /db_xref="InterPro:IPR025971"
+ /db_xref="UniProtKB/Swiss-Prot:P65313"
+ /translation="MPGVWSPPCPTTPRVGVVAALVAATLTGCGSGDSTVAKTPEATP
+ SLSTAHPAPPSSEPSPPSATAAPPSNHSAAPVDPCAVNLASPTIAKVVSELPRDPRSE
+ QPWNPEPLAGNYNECAQLSAVVIKANTNAGNPTTRAVMFHLGKYIPQGVPDTYGFTGI
+ DTSQCTGDTVALTYASGIGLNNVVKFRWNGGGVELIGNTTGG"
+ gene 1401242..1402933
+ /gene="deaD"
+ /locus_tag="BQ2027_MB1285"
+ CDS 1401242..1402933
+ /gene="deaD"
+ /locus_tag="BQ2027_MB1285"
+ /note="Mb1285, deaD, len: 563 aa. Equivalent to Rv1253,
+ len: 563 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 563 aa overlap). Probable Dead,
+ Cold-shock DEAD-box protein A homolog, similar to many
+ e.g. DEAD_ECOLI|P23304 Escherichia coli (646 aa), FASTA
+ scores: opt: 1490, E(): 0, (46.7% identity in 578 aa
+ overlap); similar to Mycobacterium tuberculosis Rv3211.
+ Contains PS00017 ATP/GTP-binding site motif A, PS00039
+ DEAD-box subfamily ATP-dependent helicases signature.
+ BELONGS TO THE DEAD BOX FAMILY HELICASE. Protein product
+ from Mb1285 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1285 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE COLD-SHOCK DEAD-BOX PROTEIN A HOMOLOG
+ DEAD (ATP-dependent RNA helicase deaD homolog)"
+ /protein_id="SIT99886.1"
+ /db_xref="GOA:A0A1R3XXT6"
+ /db_xref="InterPro:IPR000629"
+ /db_xref="InterPro:IPR001650"
+ /db_xref="InterPro:IPR005580"
+ /db_xref="InterPro:IPR011545"
+ /db_xref="InterPro:IPR012677"
+ /db_xref="InterPro:IPR014001"
+ /db_xref="InterPro:IPR014014"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR028618"
+ /db_xref="InterPro:IPR034415"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXT6"
+ /translation="MAFPEYSPAASAATFADLQIHPRVLRAIGDVGYESPTAIQAATI
+ PALMAGSDVVGLAQTGTGKTAAFAIPMLSKIDITSKVPQALVLVPTRELALQVAEAFG
+ RYGAYLSQLNVLPIYGGSSYAVQLAGLRRGAQVVVGTPGRVIDHLERATLDLSRVDFL
+ VLDEADEMLTMGFADDVERILSETPEYKQVALFSATMPPAIRKLSAKYLHDPFEVTCK
+ AKTAVAENISQSYIQVARKMDALTRVLEVEPFEAMIVFVRTKQATEEIAEKLRARGFS
+ AAAISGDVPQAQRERTITALRDGDIDILVATDVAARGLDVERISHVLNYDIPHDTESY
+ VHRIGRTGRAGRSGAALIFVSPRELHLLKAIEKATRQTLTEAQLPTVEDVNTQRVAKF
+ ADSITNALGGPGIELFRRLVEEYEREHDVPMADIAAALAVQCRGGEAFLMAPDPPLSR
+ RNRDQRRDRPQRPKRRPDLTTYRVAVGKRHKIGPGAIVGAIANEGGLHRSDFGQIRIG
+ PDFSLVELPAKLPRATLKKLAQTRISGVLIDLRPYRPPDAARRHNGGKPRRKHVG"
+ gene 1402930..1404081
+ /locus_tag="BQ2027_MB1286"
+ CDS 1402930..1404081
+ /locus_tag="BQ2027_MB1286"
+ /note="Mb1286, -, len: 383 aa. Equivalent to Rv1254, len:
+ 383 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 383 aa overlap). Probable
+ Acyltransferase (EC 2.3.1.-), similar to G927228
+ midecamycin 4-0-propionyl transferase (fragment) (388 aa),
+ FASTA scores, opt: 305, E(): 5.6e-14, (28.4% identity in
+ 377 aa overlap). Also similar to other Mycobacterium
+ tuberculosis acyltransferases e.g. Rv0111, Rv0228, etc.
+ Contains PS00881 Protein splicing signature. Protein
+ product from Mb1286 detected using SWATH mass
+ spectrometry. Mb1286 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYLTRANSFERASE"
+ /protein_id="SIT99887.1"
+ /db_xref="GOA:A0A1R3XXT3"
+ /db_xref="InterPro:IPR002656"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXT3"
+ /translation="MTLPKERAAQGGLERIAHVDRVASLTGIRAVAALLVVGTHAAYT
+ TGKYTHGYWGLMSSRMEIGVPIFFVLSGFLLFRPWVKSAATGGPPPSLSRYAWHRVRR
+ IMPAYTVTVLLAYLVYHFRTAGPNPGHTWVGLFRNLTLTQIYTDGYLGAFLHQGLTQM
+ WSLAVEVAFYLALPALAYLLLVLVCRRRWQPRLLLATMAGLTMISPAWLILVHNTHWM
+ PDGARLWLPTYLAWFVGGMMLAVLAAMGVRCYAFVAIPLAVICYFIVSTPIAGAPTTS
+ PTALAEALVKTAFYAVIAVLAVAPLALGDQGWYAQLLASRPMVFLGEISYEIFLIHLV
+ TMEIAMVDVLGYRVYTSSMVNLCLVTLVLTIPLAWLLHRFTRVQGDRPS"
+ gene complement(1404050..1404349)
+ /locus_tag="BQ2027_MB1287C"
+ CDS complement(1404050..1404349)
+ /locus_tag="BQ2027_MB1287C"
+ /note="Mb1287c, -, len: 99 aa. Equivalent to 5' end of
+ Rv1257c and 3' end of Rv1255c, len: 455 aa and 202 aa,
+ from Mycobacterium tuberculosis strain H37Rv, (89.5%
+ identity in 57 aa overlap and 83.6% identity in 67 aa
+ overlap). Rv1257c: Probable oxidoreductase (EC 1.-.-.-),
+ similar to e.g. GLCD_ECOLI|P52075 glycolate oxidase
+ subunit glcd (499 aa), FASTA scores: E(): 0, (38.9%
+ identity in 458 aa overlap). Similar to Mycobacterium
+ tuberculosis oxidoreductases e.g. Rv3107c. Rv1255c:
+ Possible regulatory protein, similar to others e.g.
+ ACRR_ECOLI|P34000 potential acrab operon repressor from E.
+ coli (215 aa), FASTA scores: opt: 128, E(): 0.25, (42.1%
+ identity in 57 aa overlap). Helix turn helix motif present
+ at aa 36-57 (+5.48 SD). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 3007 bp deletion (RD13) leads to
+ the fusion of Rv1257c and Rv1255c, and the deletion of
+ Rv1256c, compared to Mycobacterium tuberculosis strain
+ H37Rv. Protein product from Mb1287c detected using SWATH
+ mass spectrometry. Mb1287c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transcriptional regulatory protein"
+ /protein_id="SIT99888.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXT4"
+ /translation="MNTDVLAGLMAELPEGMVVTDPAVTDGYRQDRAFDPSAGKPLAI
+ IRPRRARWVVRMLTSLLMFPGRDEADERAMIAEFVVPIVTPASAAARKAGHPGPE"
+ gene complement(1404346..1405605)
+ /locus_tag="BQ2027_MB1288C"
+ CDS complement(1404346..1405605)
+ /locus_tag="BQ2027_MB1288C"
+ /note="Mb1288c, -, len: 419 aa. Equivalent to Rv1258c,
+ len: 419 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 419 aa overlap). Probable conserved
+ integral membrane transport (efflux) protein, possibly
+ member of major facilitator superfamily (MFS), highly
+ similar to O32859|TAP PROTEIN multidrug-resistance efflux
+ pump from Mycobacterium fortuitum (409 aa), FASTA scores:
+ E(): 0, (68.4% identity in 408 aa overlap). Contains
+ PS00216 Sugar transport proteins signature 1. Mb1288c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE TRANSPORT
+ PROTEIN"
+ /protein_id="SIT99889.1"
+ /db_xref="GOA:P64784"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/Swiss-Prot:P64784"
+ /translation="MRNSNRGPAFLILFATLMAAAGDGVSIVAFPWLVLQREGSAGQA
+ SIVASATMLPLLFATLVAGTAVDYFGRRRVSMVADALSGAAVAGVPLVAWGYGGDAVN
+ VLVLAVLAALAAAFGPAGMTARDSMLPEAAARAGWSLDRINGAYEAILNLAFIVGPAI
+ GGLMIATVGGITTMWITATAFGLSILAIAALQLEGAGKPHHTSRPQGLVSGIAEGLRF
+ VWNLRVLRTLGMIDLTVTALYLPMESVLFPKYFTDHQQPVQLGWALMAIAGGGLVGAL
+ GYAVLAIRVPRRVTMSTAVLTLGLASMVIAFLPPLPVIMVLCAVVGLVYGPIQPIYNY
+ VIQTRAAQHLRGRVVGVMTSLAYAAGPLGLLLAGPLTDAAGLHATFLALALPIVCTGL
+ VAIRLPALRELDLAPQADIDRPVGSAQ"
+ gene 1405604..1406503
+ /gene="udgb"
+ /locus_tag="BQ2027_MB1289"
+ CDS 1405604..1406503
+ /gene="udgb"
+ /locus_tag="BQ2027_MB1289"
+ /note="Mb1289, -, len: 299 aa. Equivalent to Rv1259, len:
+ 299 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 299 aa overlap). Conserved hypothetical
+ protein. Similar to AL109732|SC7H2.04 hypothetical protein
+ from Streptomyces coelicolor (237 aa), FASTA scores: opt:
+ 870, E(): 0, (57.1% identity in 231 aa overlap). Protein
+ product from Mb1289 detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="probable uracil dna glycosylase, udgb"
+ /protein_id="SIT99890.1"
+ /db_xref="GOA:P64786"
+ /db_xref="InterPro:IPR005122"
+ /db_xref="InterPro:IPR036895"
+ /db_xref="UniProtKB/Swiss-Prot:P64786"
+ /translation="MNIAAESSAKPVWGPPNFCAAAARMQDVRVLMHPKTGRAFRSPV
+ EPGSGWPGDPATPQTPVAADAAQVSALAGGAGSICELNALISVCRACPRLVSWREEVA
+ VVKRRAFADQPYWGRPVPGWGSKRPRLLILGLAPAAHGANRTGRMFTGDRSGDQLYAA
+ LHRAGLVNSPVSVDAADGLRANRIRITAPVRCAPPGNSPTPAERLTCSPWLNAEWRLV
+ SDHIRAIVALGGFAWQVALRLAGASGTPKPRFGHGVVTELGAGVRLLGCYHPSQQNMF
+ TGRLTPTMLDDIFREAKKLAGIE"
+ gene 1406505..1407329
+ /locus_tag="BQ2027_MB1290"
+ CDS 1406505..1407329
+ /locus_tag="BQ2027_MB1290"
+ /note="Mb1290, -, len: 274 aa. Equivalent to 5' end of
+ Rv1260, len: 372 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.6% identity in 260 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), highly similar to
+ E1245747|AL021411 putative oxidoreductase SC7H1.18 from
+ Streptomyces coelicolor (397 aa), FASTA scores: E():
+ 1.4e-29, (45.9% identity in 355 aa overlap); also some
+ similarity to G912582 FAD binding protein homologue from
+ Pseudomonas aeruginosa (286 aa), FASTA scores: opt: 245,
+ E(): 2e-09, (27.5% identity in 251 aa overlap);
+ PCPB_FLASP|P42535 pentachlorophenol 4-monooxygenase (537
+ aa), FASTA scores: opt: 219, E(): 1.7e-07, (23.3% identity
+ in 360 aa overlap); TETX_BACFR|Q01911 tetracycline
+ resistance protein (388 aa), FASTA scores: opt: 183, E():
+ 3e-05, (22.8% identity in 373 aa overlap). Also similar to
+ Mycobacterium tuberculosis hypothetical proteins Rv0575c
+ and Rv1751. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1260 exists as
+ a single gene. In Mycobacterium bovis, a frameshift due to
+ a single base deletion (g-*) splits Rv1260 into 2 parts,
+ Mb1290 and Mb1291. Mb1290 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE [FIRST PART]"
+ /protein_id="SIT99891.1"
+ /db_xref="GOA:A0A1R3XXU2"
+ /db_xref="InterPro:IPR002938"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXU2"
+ /translation="MKTVVVSGASVAGTAAAYWLGRHGYSVTMVERHPGLRPGGQAID
+ VRGPALDVLERMGLLAAAQEHKTRIRGASFVDRDGNELFRDTESTPTGGPVNSPDIEL
+ LRDDLVELLYGATQPSVEYLFDDSISTLQDDGDSVRVTFERAAAREFDLVIGADGLHS
+ NVRRLVFGPEEQFVKRLGTHAAIFTVPNFLELDYWQTWHYGDSTMAGVYSARNNTEAR
+ AALAFMDTELRIDYRDTEAQFAELQRRMAEDGWVRAQLLHYIAAHRISISTKCRRS"
+ gene 1407329..1407622
+ /locus_tag="BQ2027_MB1291"
+ CDS 1407329..1407622
+ /locus_tag="BQ2027_MB1291"
+ /note="Mb1291, -, len: 102 aa. Equivalent to 3' end of
+ Rv1260, len: 372 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 102 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), highly similar to
+ E1245747|AL021411 putative oxidoreductase SC7H1.18 from
+ Streptomyces coelicolor (397 aa), FASTA scores: E():
+ 1.4e-29, (45.9% identity in 355 aa overlap); also some
+ similarity to G912582 FAD binding protein homologue from
+ Pseudomonas aeruginosa (286 aa), FASTA scores: opt: 245,
+ E(): 2e-09, (27.5% identity in 251 aa overlap);
+ PCPB_FLASP|P42535 pentachlorophenol 4-monooxygenase (537
+ aa), FASTA scores: opt: 219, E(): 1.7e-07, (23.3% identity
+ in 360 aa overlap); TETX_BACFR|Q01911 tetracycline
+ resistance protein (388 aa), FASTA scores: opt: 183, E():
+ 3e-05, (22.8% identity in 373 aa overlap). Also similar to
+ Mycobacterium tuberculosis hypothetical proteins Rv0575c
+ and Rv1751. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1260 exists as
+ a single gene. In Mycobacterium bovis, a frameshift due to
+ a single base deletion (g-*) splits Rv1260 into 2 parts,
+ Mb1290 and Mb1291. Protein product from Mb1291 detected
+ using SWATH mass spectrometry. Mb1291 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE [SECOND PART]"
+ /protein_id="SIT99892.1"
+ /db_xref="GOA:A0A1R3XZY9"
+ /db_xref="InterPro:IPR002938"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZY9"
+ /translation="MDRWSRGRVALVGDAGYCCSPLSGQGTSVALLGAYILAGELKAA
+ GDDYQLGFANYHAEFHGFVERNQWLVSDNIPGGAPIPQEEFERIVHSITIKDY"
+ gene complement(1407748..1408197)
+ /locus_tag="BQ2027_MB1292C"
+ CDS complement(1407748..1408197)
+ /locus_tag="BQ2027_MB1292C"
+ /note="Mb1292c, -, len: 149 aa. Equivalent to Rv1261c,
+ len: 149 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 149 aa overlap). Conserved hypothetical
+ protein, similar to Mycobacterium tuberculosis
+ hypothetical proteins e.g. Rv1558|MTCY48.07c (39.2%
+ identity in 125 aa overlap); Rv3547 and Rv3178. Protein
+ product from Mb1292c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1292c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="AclJ"
+ /protein_id="SIT99893.1"
+ /db_xref="GOA:P64788"
+ /db_xref="InterPro:IPR004378"
+ /db_xref="InterPro:IPR012349"
+ /db_xref="UniProtKB/Swiss-Prot:P64788"
+ /translation="MDISRWLERHVGVQLLRLHDAIYRGTNGRIGHRIPGAPPSLLLH
+ TTGAKTSQPRTTSLTYARDGDAYLIVASKGGDPRSPGWYHNLKANPDVEINVGPKRFG
+ VTAKPVQPHDPDYARLWQIVNENNANRYTNYQSRTSRPIPVVVLTRR"
+ gene complement(1408202..1408636)
+ /locus_tag="BQ2027_MB1293C"
+ CDS complement(1408202..1408636)
+ /locus_tag="BQ2027_MB1293C"
+ /note="Mb1293c, -, len: 144 aa. Equivalent to Rv1262c,
+ len: 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 144 aa overlap). Hypothetical HIT-like
+ protein, similar to Q04344|HIT_YEAST hit1 protein (orf u)
+ (144 aa), FASTA scores: opt: 306, E(): 3e-14, (35.9 %
+ identity in 142 aa overlap); also similar to
+ YHIT_MYCGE|P47378 hypothetical 15.6 kd protein (141 aa),
+ FASTA scores: opt: 250, E(): 1.6e-10, (35.5% identity in
+ 107 aa overlap); and YHIT_MYCLE|P49774 hypothetical 17.0
+ kd protein hit-like (155 aa), FASTA scores: opt: 196, E():
+ 7e-07, (30.6% identity in 144 aa overlap). Similar to
+ other proteins from Mycobacterium tuberculosis e.g.
+ Rv2613c, Rv0759c. Contains PS00892 HIT family signature.
+ BELONGS TO THE HIT FAMILY. Protein product from Mb1293c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1293c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL HIT-LIKE PROTEIN"
+ /protein_id="SIT99894.1"
+ /db_xref="GOA:A0A1R3XXU9"
+ /db_xref="InterPro:IPR001310"
+ /db_xref="InterPro:IPR011146"
+ /db_xref="InterPro:IPR019808"
+ /db_xref="InterPro:IPR036265"
+ /db_xref="InterPro:IPR039384"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXU9"
+ /translation="MPCVFCAIIAGEAPAIRIYEDGGYLAILDIRPFTRGHTLVLPKR
+ HTVDLTDTPPEALADMVAIGQRIARAARATKLADATHIAINDGRAAFQTVFHVHLHVL
+ PRRNGDKLSVAKGMMLRRDPDREATGRILREALAQQDAAAQD"
+ gene 1408695..1410083
+ /gene="amiB2"
+ /locus_tag="BQ2027_MB1294"
+ CDS 1408695..1410083
+ /gene="amiB2"
+ /locus_tag="BQ2027_MB1294"
+ /note="Mb1294, amiB2, len: 462 aa. Equivalent to Rv1263,
+ len: 462 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 462 aa overlap). Probable amiB2, amidase
+ (EC 3.5.1.4). Similar to G1001278 hypothetical 54.3 kDa
+ protein (506 aa), FASTA scores: opt: 767, E(): 7.6e-40,
+ (32.8% identity in 461 aa overlap), also similar to
+ G580673 rhodococcus enantiose lective amidase gene (462
+ aa), FASTA scores, opt: 668, E(): 7.4e-34, (33.5% identity
+ in 484 aa overlap); and to NYLA_PSES8|P13398
+ 6-aminohexanoate-cyclic-dimer hydrolase (492 aa), FASTA
+ scores opt: 543, E(): 3.1e-26, (33.5% identity in 493 aa
+ overlap). Also similar to MTCY274.19c (33.5% identity in
+ 427 aa overlap). Similar to other putative amidases in M.
+ tuberculosis e.g. Rv2363, Rv2888c, etc. Contains PS00017
+ ATP/GTP-binding site motif A. BELONGS TO THE AMIDASE
+ FAMILY. Protein product from Mb1294 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE AMIDASE AMIB2 (AMINOHYDROLASE)"
+ /protein_id="SIT99895.1"
+ /db_xref="GOA:P63493"
+ /db_xref="InterPro:IPR000120"
+ /db_xref="InterPro:IPR020556"
+ /db_xref="InterPro:IPR023631"
+ /db_xref="InterPro:IPR036928"
+ /db_xref="UniProtKB/Swiss-Prot:P63493"
+ /translation="MDPTDLAFAGAAAQARMLADGALTAPMLLEVYLQRIERLDSHLR
+ AYRVVQFDRARAEAEAAQQRLDAGERLPLLGVPIAIKDDVDIAGEVTTYGSAGHGPAA
+ TSDAEVVRRLRAAGAVIIGKTNVPELMIMPFTESLAFGATRNPWCLNRTPGGSSGGSA
+ AAVAAGLAPVALGSDGGGSIRIPCTWCGLFGLKPQRDRISLEPHDGAWQGLSVNGPIA
+ RSVMDAALLLDATTTVPGPEGEFVAAAARQPGRLRIALSTRVPTPLPVRCGKQELAAV
+ HQAGALLRDLGHDVVVRDPDYPASTYANYLPRFFRGISDDADAQAHPDRLEARTRAIA
+ RLGSFFSDRRMAALRAAEVVLSSRIQSIFDDVDVVVTPGAATGPSRIGAYQRRGAVST
+ LLLVVQRVPYFQVWNLTGQPAAVVPWDFDGDGLPMSVQLVGRPYDEATLLALAAQIES
+ ARPWAHRRPSVS"
+ gene 1410158..1411351
+ /locus_tag="BQ2027_MB1295"
+ CDS 1410158..1411351
+ /locus_tag="BQ2027_MB1295"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1295, -, len: 397 aa. Equivalent to Rv1264, len:
+ 397 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 397 aa overlap). Adenylate cyclase (EC
+ 4.6.1.1) (function proven experimentally: see first
+ citation below), showing some similarity to other
+ adenylate cyclases e.g. CYAA_BRELI|P27580 (403 aa), FASTA
+ scores, opt: 270, E(): 1.3e-10, (29.3% identity in 317 aa
+ overlap); etc. Similar to other putative cyclases in M.
+ tuberculosis e.g. Rv2212, Rv1647. BELONG TO THE ADENYLYL
+ CYCLASE CLASS-4/GUANYLYL CYCLASE FAMILY. The C terminus
+ seems to code for a catalytic domain belonging to a
+ subfamily of adenylyl cyclase isozymes (mostly found in
+ Gram-positive bacteria). The N terminus seems to be a
+ potential novel regulator of adenylyl cyclase activity
+ (autoinhibitory domain). Protein product from Mb1295
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1295 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ADENYLYL CYCLASE (ATP PYROPHOSPHATE-LYASE)
+ (ADENYLATE CYCLASE)"
+ /protein_id="SIT99896.1"
+ /db_xref="GOA:A0A1R3XXU7"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="InterPro:IPR032026"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXU7"
+ /translation="MTDHVREADDANIDDLLGDLGGTARAERAKLVEWLLEQGITPDE
+ IRATNPPLLLATRHLVGDDGTYVSAREISENYGVDLELLQRVQRAVGLARVDDPDAVV
+ HMRADGEAAARAQRFVELGLNPDQVVLVVRVLAEGLSHAAEAMRYTALEAIMRPGATE
+ LDIAKGSQALVSQIVPLLGPMIQDMLFMQLRHMMETEAVNAGECAAGKPLPGARQVTV
+ AFADLVGFTQLGEVVSAEELGHLAGRLAGLARDLTAPPVWFIKTIGDAVMLVCPDPAP
+ LLDTVLKLVEVVDTDNNFPRLRAGVASGMAVSRAGDWFGSPVNVASRVTGVARPGAVL
+ VADSVREALGDAPEADGFQWSFAGPRRLRGIRGDVRLFRVRRGATRTGSGGAAQDDDL
+ AGSSP"
+ gene 1411524..1412204
+ /locus_tag="BQ2027_MB1296"
+ CDS 1411524..1412204
+ /locus_tag="BQ2027_MB1296"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1296, -, len: 226 aa. Equivalent to Rv1265, len:
+ 226 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 226 aa overlap). Hypothetical unknown
+ protein (see citation below). Protein product from Mb1296
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1296 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIT99897.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64790"
+ /translation="MVLARPDAVFAPARNRCHVSLPVNAMSLKMKVCNHVIMRHHHMH
+ GRRYGRPGGWQQAQQPDASGAAEWFAGRLPEDWFDGDPTVIVDREEITVIGKLPGLES
+ PEEESAARASGRVSRFRDETRPERMTIADEAQNRYGRKVSWGVEVGGERILFTHIAVP
+ VMTRLKQPERQVLDTLVDAGVARSRSDALAWSVKLVGEHTEEWLAKLRTAMSAVDDLR
+ AQGPDLPA"
+ gene complement(1412224..1414014)
+ /gene="pknH1"
+ /locus_tag="BQ2027_MB1297C"
+ CDS complement(1412224..1414014)
+ /gene="pknH1"
+ /locus_tag="BQ2027_MB1297C"
+ /note="Mb1297c, PknH1, len: 596 aa. Protein product from
+ Mb1297c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1297c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /protein_id="SIT99898.1"
+ /db_xref="GOA:Q7U095"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR008271"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="InterPro:IPR017441"
+ /db_xref="InterPro:IPR026954"
+ /db_xref="InterPro:IPR038232"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U095"
+ /translation="MSDAQDSRVGSMFGPYHLKRLLGRGGMGEVYEAEHTVKEWTVAV
+ KLMTAEFSKDPVFRERMKREARIAGRLQEPHVVPIHDYGEVDGQMFLEMRLVEGTDLD
+ SVLKRFGPLTPPRAVAIITQIASALDAAHADGVMHRDVKPQNILITRDDFAYLVDFGI
+ ASATTDEKLTQLGTAVGTWKYMAPERFSNDEVTYRADIYALACVLHECLTGAPPYRAD
+ SAGTLVSSHLMGPIPQPSAIRPGIPKAFDAVVARGMAKKPEDRYASAGDLALAAHEAL
+ SDPDQDHAADILRRSQESTLPGTAAVTAQPPTMPTVTPPPIQAAPTGQPSWAPNSGPM
+ PASGPTPTPQYYQGGGWGAPPSGGPSPWAQTPRKTNPWPLVAGAAAVVLVLVLGAIGI
+ WIANRPKPVQPPQPVAEERLSALLLNSSEVNAVMGSSSMQPGKPITSMDSSPVTVSLP
+ DCQGALYTSQDPVYAGTGYTAINGLISSEPGDNYEHWVNQAVVAFPTADKARAFVQTS
+ ADKWKNCAGKTVTVTNKAKTYRWTFADVKGSPPTITVIDTQEGAEGWECQRAMSVANN
+ VVVDVNACGYQITNQAGQIAAKIVDKVNKE"
+ gene complement(1414258..1416654)
+ /gene="tbd2"
+ /locus_tag="BQ2027_MB1297CA"
+ CDS complement(1414258..1416654)
+ /gene="tbd2"
+ /locus_tag="BQ2027_MB1297CA"
+ /note="Mb1297cA, Tbd2, putative intergral membrane,
+ ATP-binding, ABC transporter. Part of RD900 first
+ identified in M. africanum GM041182 (Bentley et al. 2012,
+ PLoS Negl Top Dis.
+ http://www.ncbi.nlm.nih.gov/pubmed/22389744). 797/798
+ (99%) AA identity with MAF_12860. Misidentified in
+ original M. bovis AF2122/97 genome assembly. Mb1297cA
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /protein_id="SIT99899.1"
+ /db_xref="GOA:A0A1R3XXW0"
+ /db_xref="InterPro:IPR000253"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR008984"
+ /db_xref="InterPro:IPR013525"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXW0"
+ /translation="MTDTADMITPNAPRLELRAAGRTWHAVAGREWSIGRASEADIRL
+ DNPRVSRQHAVLEATPEGWVLVNLSTNGTFVDGQRVERLTVRQPITIFLGSASSGQRV
+ QLYPVAQSPTPTPASHPPAPPRPATPKPAQRQGETTVARPPTAFHAIDQLVVTIGRAP
+ ENTVVLNDLLVSRRHAILRRTGNRWELSDNASANGTYVNGHRISRAVIGPTDIVGIGH
+ QLLHLSADRLVEYVDTGDISYQASNLRVVTNKGRVLLADVSFVLPQRSLLAVVGPSGA
+ GKSTLLGALTGFRPAGNGTVRYDERDLYDNYAELRHRIGFVPQDDILHTPLTVRRALN
+ YAARLRFPQDVSVDERNQRIEEVLVELGLSTQADQRIDSLSGGQRKRTSVALELLTKP
+ SLLFLDEPTSGLDPGYEKSVMQTLRKLADDGRSVVVVTHNIAHLNMCDRLLILAPGGR
+ LAYFGPPQQALGYFNCTDFADLFTLLEHDTSTDWTGRFNASPLREALIGHPAMRPARP
+ AAARHARPVAQQSAFAQFAILCRRYLAVIAADRQYAVFLLVLPLLLSLFAHAVPGQAG
+ LSLAKAIELKSTQPSQLLVLLIIGGALMGCAASIREIVKERAIYRREHGIGLSRGAYL
+ ASKLVVLTALTSLQALILGFLGVALLPPPDQSVILPWPSVEVAVAVVAVTVVSMMIGL
+ LISAMIGNADRGMPLLVLVVMAQLVLCGGMFGVSGRPPLEQLSWLSPSRWAYAMAAAT
+ VDLNDLRRTAGGDQDPLWDYNVGSWLMAAGACAVQALVLVILIALQLKRIEPQRKARK
+ "
+ gene complement(1416665..1418431)
+ /gene="pknH2"
+ /locus_tag="BQ2027_MB1297CB"
+ CDS complement(1416665..1418431)
+ /gene="pknH2"
+ /locus_tag="BQ2027_MB1297CB"
+ /note="Mb1297cB, PknH2, putative membrane spanning
+ serine/threonine protein kinase, part of RD900 first
+ identified in M. africanum GM041182(Bentley et al. 2012,
+ PLoS Negl Top Dis.
+ http://www.ncbi.nlm.nih.gov/pubmed/22389744). 555/567
+ (96%) identity with MAF_12870"
+ /codon_start=1
+ /transl_table=11
+ /protein_id="SIT99900.1"
+ /db_xref="GOA:A0A1R3XXU5"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR008271"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="InterPro:IPR017441"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXU5"
+ /translation="MSAAAGWLGGSAMSDAQDSRVGSMFGPYHLKRLLGRGGMGEVYE
+ AEHTVKEWTVAVKLMTAEFSKDPVFRERMKREARIAGRLQEPHVVPIHDYGEVDGQMF
+ LEMRLVEGTDLDSVLKRFGPLTPPRAVAIITQIASALDAAHADGVMHRDVKPQNILIT
+ RDDFAYLVDFGIASATTDEKLTQLGTAVGTWKYMAPERFSNDEVTYRADSLRAGLRAA
+ RMLDRGPAVSRRHAGTLVSSHLMGPIPQPSAIRPGIPKAFDAVVARGMAKKPEDRYAS
+ AGDLALAAHEALSDPDQDHAADILRRSQESTLPGTAAVTAQPPTMPTVTPPPIQAAPT
+ GQPSWAPNSGPMPASGPTPTPQYYQGGGWGAPPSGGPSPWAQTPRKTNPWPFVAVAAA
+ VVLVLVLGAIGIWIANRPDDNPKRNIATSPGTPTTTATTSLPATTTPTTAPASDPQTR
+ LLSMLPSGYPTGTCKPTTPKPNSIWVNAVAMVDCGQNTNQGGPSRAIYGLFANPDKLK
+ QAFNDDIAAVELMNCPGEGPSPDGWHYNQTPDVTAGMIACGTYKNRPNVIWSNEAKLT
+ LSDVFGDPATIEDLHNWWAKYG"
+ gene complement(1418736..1419902)
+ /gene="embR"
+ /locus_tag="BQ2027_MB1298C"
+ CDS complement(1418736..1419902)
+ /gene="embR"
+ /locus_tag="BQ2027_MB1298C"
+ /note="Mb1298c, embR, len: 388 aa. Equivalent to Rv1267c,
+ len: 388 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 388 aa overlap). Probable embR,
+ regulatory protein (see citation below), similar to many
+ e.g. AFSR_STRCO|P25941 regulatory protein AfsR from
+ Streptomyces coelicolor (993 aa), FASTA scores: opt: 489,
+ E(): 1e-25, (33.5% identity in 361 aa overlap); etc.
+ BELONGS TO THE AFSR/DNRI/REDD FAMILY OF REGULATORS.
+ Protein product from Mb1298c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ EMBR"
+ /protein_id="SIT99901.1"
+ /db_xref="GOA:P66800"
+ /db_xref="InterPro:IPR000253"
+ /db_xref="InterPro:IPR001867"
+ /db_xref="InterPro:IPR005158"
+ /db_xref="InterPro:IPR008984"
+ /db_xref="InterPro:IPR011990"
+ /db_xref="InterPro:IPR016032"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="UniProtKB/Swiss-Prot:P66800"
+ /translation="MAGSATVEKRLDFGLLGPLQMTIDGTPVPSGTPKQRAVLAMLVI
+ NRNRPVGVDALITALWEEWPPSGARASIHSYVSNLRKLLGGAGIDPRVVLAAAPPGYR
+ LSIPDNTCDLGRFVAEKTAGVHAAAAGRFEQASRHLSAALREWRGPVLDDLRDFQFVE
+ PFATALVEDKVLAHTAKAEAEIACGRASAVIAELEALTFEHPYREPLWTQLITAYYLS
+ DRQSDALGAYRRVKTTLADDLGIDPGPTLRALNERILRQQPLDAKKSAKTTAAGTVTV
+ LDQRTMASGQQAVAYLHDIASGRGYPLQAAATRIGRLHDNDIVLDSANVSRHHAVIVD
+ TGTNYVINDLRSSNGVHVQHERIRSAVTLNDGDHIRICDHEFTFQISAGTHGGT"
+ gene complement(1420213..1420911)
+ /locus_tag="BQ2027_MB1299C"
+ CDS complement(1420213..1420911)
+ /locus_tag="BQ2027_MB1299C"
+ /note="Mb1299c, -, len: 232 aa. Equivalent to Rv1268c,
+ len: 232 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 232 aa overlap). Hypothetical unknown
+ protein, probably secreted protein : contains possible
+ signal peptide sequence (score 7.9 at residue 28)."
+ /codon_start=1
+ /transl_table=11
+ /product="Cysteine-Type endopeptidase"
+ /protein_id="SIT99902.1"
+ /db_xref="InterPro:IPR025660"
+ /db_xref="InterPro:IPR039564"
+ /db_xref="UniProtKB/Swiss-Prot:P64792"
+ /translation="MTTSKIATAFKTATFALAAGAVALGLASPADAAAGTMYGDPAAA
+ AKYWRQQTYDDCVLMSAADVIGQVTGREPSERAIIKVAQSTPSVVHPGSIYTKPADAE
+ HPNSGMGTSVADIPTLLAHYGVDAVITDEDHATATGVATGMAALEQYLGSGHAVIVSI
+ NAEMIWGQPVEETDSAGNPRSDHAVVVTGVDTENGIVHLNDSGTPTGRDEQIPMETFV
+ EAWATSHDFMAVTT"
+ gene complement(1421134..1421508)
+ /locus_tag="BQ2027_MB1300C"
+ CDS complement(1421134..1421508)
+ /locus_tag="BQ2027_MB1300C"
+ /note="Mb1300c, -, len: 124 aa. Equivalent to Rv1269c,
+ len: 124 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 124 aa overlap). Conserved probable
+ exported protein with putative N-terminal signal sequence.
+ Similar to Mycobacterium tuberculosis protein
+ Rv1813c|Y0DU_MYCTU|Q50620 hypothetical protein cy1a11.30
+ (137 aa), FASTA scores: E(): 9e-21, (41.6% identity in 137
+ aa overlap). Protein product from Mb1300c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1300c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED PROBABLE SECRETED PROTEIN"
+ /protein_id="SIT99903.1"
+ /db_xref="InterPro:IPR006311"
+ /db_xref="InterPro:IPR025240"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5E2"
+ /translation="MTTMITLRRRFAVAVAGVATAAATTVTLAPAPANAADVYGAIAY
+ SGNGSWGRSWDYPTRAAAEATAVKSCGYSDCKVLTSFTACGAVAANDRAYQGGVGPTL
+ AAAMKDALTKLGGGYIDTWACN"
+ gene complement(1421569..1422303)
+ /gene="lprA"
+ /locus_tag="BQ2027_MB1301C"
+ CDS complement(1421569..1422303)
+ /gene="lprA"
+ /locus_tag="BQ2027_MB1301C"
+ /note="Mb1301c, lprA, len: 244 aa. Equivalent to Rv1270c,
+ len: 244 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 244 aa overlap). Putative lipoprotein
+ lprA (Precursor). Similar to O32852|AJ000500 lipoprotein
+ from Mycobacterium bovis (236 aa), fasta scores: E():
+ 5.2e-23, (35.1% identity in 245 aa overlap). Similar to M.
+ tuberculosis lipoproteins: Rv1368, Rv1411c, Rv2945c.
+ Contains probable N-terminal signal sequence. Protein
+ product from Mb1301c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1301c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible lipoprotein lpra"
+ /protein_id="SIT99904.1"
+ /db_xref="GOA:Q7U094"
+ /db_xref="InterPro:IPR009830"
+ /db_xref="InterPro:IPR029046"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U094"
+ /translation="MKHPPCSVVAAATAILAVVLAIGGCSTEGDAGKASDTAATASNG
+ DAAMLLKQATDAMRKVTGMHVRLAVTGDVPNLRVTKLEGDISNTPQTVATGSATLLVG
+ NKSEDAKFVYVDGHLYSDLGQPGTYTDFGNGTSIYNVSVLLDPNKGLANLLANLKDAS
+ VAGSQQADGVATTKITGNSSADDIATLAGSRLTSEDVKTVPTTVWIASDGSSHLVQIQ
+ IAPTKDTSVTLTMSDWGKQVTATKPV"
+ gene complement(1422516..1422857)
+ /locus_tag="BQ2027_MB1302C"
+ CDS complement(1422516..1422857)
+ /locus_tag="BQ2027_MB1302C"
+ /note="Mb1302c, -, len: 113 aa. Equivalent to Rv1271c,
+ len: 113 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 113 aa overlap). Conserved hypothetical
+ exported protein with potential N-terminal signal
+ sequence. Similar to Mycobacterium tuberculosis
+ hypothetical proteins Rv1804c, Rv1810, Rv0622, etc.
+ Protein product from Mb1302c detected using SWATH mass
+ spectrometry. Mb1302c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL SECRETED PROTEIN"
+ /protein_id="SIT99905.1"
+ /db_xref="InterPro:IPR007969"
+ /db_xref="UniProtKB/Swiss-Prot:P64794"
+ /translation="MLSPLSPRIIAAFTTAVGAAAIGLAVATAGTAGANTKDEAFIAQ
+ MESIGVTFSSPQVATQQAQLVCKKLASGETGTEIAEEVLSQTNLTTKQAAYFVVDATK
+ AYCPQYASQLT"
+ gene complement(1422965..1424860)
+ /locus_tag="BQ2027_MB1303C"
+ CDS complement(1422965..1424860)
+ /locus_tag="BQ2027_MB1303C"
+ /note="Mb1303c, -, len: 631 aa. Equivalent to Rv1272c,
+ len: 631 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 631 aa overlap). Probable
+ drugs-transport transmembrane ATP-binding protein ABC
+ transporter (see citation below), similar to e.g.
+ Y015_MYCGE|P47261 hypothetical ABC transporter mg015m from
+ Mycoplasma genitalium (589 aa), FASTA scores: opt: 1054,
+ E(): 0, (34.3% identity in 522 aa overlap); etc. Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop); and PS00211
+ ABC transporters family signature. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS),
+ MSBA SUBFAMILY. Mb1303c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DRUGS-TRANSPORT TRANSMEMBRANE
+ ATP-BINDING PROTEIN ABC TRANSPORTER"
+ /protein_id="SIT99906.1"
+ /db_xref="GOA:P63398"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR011527"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036640"
+ /db_xref="InterPro:IPR039421"
+ /db_xref="UniProtKB/Swiss-Prot:P63398"
+ /translation="MTAPPGARPRAASPPPNMRSRDFWGSAARLVKRLAPQRRLSIAV
+ ITLGIAGTTIGVIVPRILGHATDLLFNGVIGRGLPGGITKAQAVASARARGDNTFADL
+ LSGMNVVPGQGVDFAAVERTLALALALYLAAALMIWAQARLLNLTVQKTMVRLRTDVE
+ DKVHRLPLSYFDGQQRGELLSRVTNDIDNLQSSLSMTISQLVTSILTMVAVLAMMVSI
+ SGLLALITLLTVPLSLLVTRAITRRSQPLFVAHWTSTGRLNAHLEETYSGFTVVKTFG
+ HQAAARERFHELNDDVYQAGFGAQFLSGLVQPATAFIGNLGYVAVAVAGGLQVATGQI
+ TLGSIQAFIQYIRQFNMPLSQLAGMYNALQSGVASAERVFDVLDEPEESPEPEPELPN
+ LTGRVEFEHVNFAYLPGTPVIRDLSLVAEPGSTVAIVGPTGAGKTTLVNLLMRFYEIG
+ SGRILIDGVDIASVSRQSLRSRIGMVLQDTWLYDGTIAENIAYGRPEATTDEIVEAAR
+ AAHVDRFVNTLPAGYQTRVSGDGGSISVGEKQLITIARAFLARPQLLILDEATSSVDT
+ RTELLIQRAMRELRRDRTSFIIAHRLSTIRDADHILVVQTGQIVERGNHAELLARRGV
+ YYQMTRA"
+ gene complement(1424857..1426605)
+ /locus_tag="BQ2027_MB1304C"
+ CDS complement(1424857..1426605)
+ /locus_tag="BQ2027_MB1304C"
+ /note="Mb1304c, -, len: 582 aa. Equivalent to Rv1273c,
+ len: 582 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 582 aa overlap). Probable drug-transport
+ transmembrane ATP-binding protein ABC transporter (see
+ citation below), similar to e.g. YWJA_BACSU|P45861
+ hypothetical abc transporter from Bacillus subtilis (575
+ aa), FASTA scores: opt: 810, E(): 0, (27.0% identity in
+ 578 aa overlap); etc. Contains PS00136 Serine proteases,
+ subtilase family, aspartic acid active site; 2 x PS00211
+ ABC transporters family signature; and PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS),
+ MSBA SUBFAMILY. Protein product from Mb1304c detected
+ using SWATH mass spectrometry. Mb1304c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DRUGS-TRANSPORT TRANSMEMBRANE
+ ATP-BINDING PROTEIN ABC TRANSPORTER"
+ /protein_id="SIT99907.1"
+ /db_xref="GOA:P0A4W5"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR011527"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036640"
+ /db_xref="InterPro:IPR039421"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4W5"
+ /translation="MLLALLRQHIRPYRRLVAMLMMLQLVSTLASLYLPTVNAAIVDD
+ GVAKGDTATIVRLGAVMLGVTGLQVLCAIGAVYLGSRTGAGFGRDLRSAMFEHIITFS
+ ERETARFGAPTLLTRSTNDVRQILFLVQMTATVLVTAPIMCVGGIIMAIHQEAALTWL
+ LLVSVPILAVANYWIISHMLPLFRRMQSLIDGINRVMRDQLSGVRVVRAFTREGYERD
+ KFAQANTALSNAALSAGNWQALMLPVTTLTINASSVALIWFGGLRIDSGQMQVGSLIA
+ FLSYFAQILMAVLMATMTLAVLPRASVCAERITEVLSTPAALGNPDNPKFPTDGVTGV
+ VRLAGATFTYPGADCPVLQDISLTARPGTTTAIVGSTGSGKSTLVSLICRLYDVTAGA
+ VLVDGIDVREYHTERLWSAIGLVPQRSYLFSGTVADNLRYGGGPDQVVTEQEMWEALR
+ VAAADGFVQTDGLQTRVAQGGVNFSGGQRQRLAIARAVIRRPAIYVFDDAFSALDVHT
+ DAKVHASLRQVSGDATIIVVTQRISNAAQADQVIVVDNGKIVGTGTHETLLADCPTYA
+ EFAASQSLSATVGGVG"
+ gene 1426752..1427309
+ /gene="lprB"
+ /locus_tag="BQ2027_MB1305"
+ CDS 1426752..1427309
+ /gene="lprB"
+ /locus_tag="BQ2027_MB1305"
+ /note="Mb1305, lprB, len: 185 aa. Equivalent to Rv1274,
+ len: 185 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 185 aa overlap). Possible lipoprotein
+ lprB, contains possible N-terminal signal sequence and
+ appropriately positioned prokaryotic lipoprotein lipid
+ attachment site (PS00013) . Some similarity to Rv1275.
+ Protein product from Mb1305 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1305 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible lipoprotein lprb"
+ /protein_id="SIT99908.1"
+ /db_xref="GOA:Q7U093"
+ /db_xref="InterPro:IPR024520"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U093"
+ /translation="MRRKVRRLTLAVSALVALFPAVAGCSDSGDNKPGATIPSTPANA
+ EGRHGPFFPQCGGVSDQTVTELTRVTGLVNTAKNSVGCQWLAGGGILGPHFSFSWYRG
+ SPIGRERKTEELSRASVEDINIDGHSGFIAIGNEPSLGDSLCEVGIQFSDDFIEWSVS
+ FSQKPFPPPCDIAKELTRQSIANSK"
+ gene 1427306..1427848
+ /gene="lprC"
+ /locus_tag="BQ2027_MB1306"
+ CDS 1427306..1427848
+ /gene="lprC"
+ /locus_tag="BQ2027_MB1306"
+ /note="Mb1306, lprC, len: 180 aa. Equivalent to Rv1275,
+ len: 180 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 180 aa overlap). Possible lipoprotein
+ lprC, contains possible N-terminal signal sequence and
+ appropriately positioned prokaryotic lipoprotein lipid
+ attachment site (PS00013). Some similarity to Rv1274.
+ Protein product from Mb1306 detected using shotgun mass
+ spectrometry. Mb1306 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible lipoprotein lprc"
+ /protein_id="SIT99909.1"
+ /db_xref="InterPro:IPR024520"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXW9"
+ /translation="MRRVLVGAAALITALLVLTGCTKSISGTAVKAGGAGVPRNNNSQ
+ ERYPNLLKECEVLTTDILAKTVGADPLDIQSTFVGAICRWQAANPAGLIDITRFWFEQ
+ GSLSNERKVAEGLKYQVETRAIQGVDSIVMRTGDPNGACGVASDAAGVVGWWVNPQAP
+ GIDACGQAIKLMELTLATNA"
+ gene complement(1427993..1428469)
+ /locus_tag="BQ2027_MB1307C"
+ CDS complement(1427993..1428469)
+ /locus_tag="BQ2027_MB1307C"
+ /note="Mb1307c, -, len: 158 aa. Equivalent to Rv1276c,
+ len: 158 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 158 aa overlap). Conserved hypothetical
+ protein, similar to AL096844|SCI28.03 hypothetical protein
+ from Streptomyces coelicolor (172 aa), FASTA scores: opt:
+ 385, E(): 3.3e-19, (43.5% identity in 161 aa overlap).
+ Some similarity to P76502|SIXA_ECOLI PHOSPHOHISTIDINE
+ PHOSPHATASE SIXA (161 aa), FASTA scores: opt: 146, E():
+ 0.0047, (31.9% identity in 116 aa overlap). BELONGS TO THE
+ SIXA FAMILY OF PHOSPHATASES. Protein product from Mb1307c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Phosphohistidine phosphatase SixA"
+ /protein_id="SIT99910.1"
+ /db_xref="InterPro:IPR013078"
+ /db_xref="InterPro:IPR029033"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXV5"
+ /translation="MRHAKSAYPDGIADHDRPLAPRGIREAGLAGGWLRANLPAVDAV
+ LCSTATRARQTLAHTGIDAPARYAERLYGAAPGTVIEEINRVGDNVTSLLVVGHEPTT
+ SALAIVLASISGTDAAVAERISEKFPTSGIAVLRVAGHWADVEPGCAALVGFHVPR"
+ gene 1428719..1429972
+ /locus_tag="BQ2027_MB1308"
+ CDS 1428719..1429972
+ /locus_tag="BQ2027_MB1308"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1308, -, len: 417 aa. Equivalent to Rv1277, len:
+ 417 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 417 aa overlap). Conserved hypothetical
+ protein, some similarity to 3914967|O68033|SBCD_RHOCA
+ EXONUCLEASE SBCD HOMOLOG from Rhodobacter capsulatus (405
+ aa). May be sbcD protein (see first citation below)
+ Protein product from Mb1308 detected using shotgun mass
+ spectrometry. Mb1308 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA double-strand break repair protein Mre11"
+ /protein_id="SIT99911.1"
+ /db_xref="GOA:A0A1R3XXW2"
+ /db_xref="InterPro:IPR004843"
+ /db_xref="InterPro:IPR014577"
+ /db_xref="InterPro:IPR029052"
+ /db_xref="InterPro:IPR041796"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXW2"
+ /translation="MSPRPGPAGRGPAPCRCADLHSLCVDSHALRRDGMRFLHTADWQ
+ LGMTRHFLAGDAQPRYSAARRDAVAGLKALAADVGAEFVVVAGDVFEHNQLAPQIVGQ
+ SLEAMRVIGLPVYLLPGNHDPLDASSVYTSTLFRAERPDNVVVLDRAGVHEVRPGVQI
+ VAAPWRSKAPTTDPVAEVLAGLPTDAAIRLLVAHGGVDALDPDHDKPSLIRLAALDDA
+ LTRQAIHYVALGDKHSLTQVGSSGRVWYSGAPEVTNFDDVEPDPGHVLVVDIDESDPR
+ HPVTVDARRIGRWRFVTLHHQVDTSRDIADLDLNLDLMTDKDRTVVRLALTGSLTVTD
+ RAALDTCLDKYARLFAWLGLWERHTDLAVIPVDAEFTDLGIGGFAAAAVDELVATARG
+ GDDESAVDAQAALALLLRLADRGAA"
+ gene 1429969..1432596
+ /locus_tag="BQ2027_MB1309"
+ CDS 1429969..1432596
+ /locus_tag="BQ2027_MB1309"
+ /note="Mb1309, -, len: 875 aa. Equivalent to Rv1278, len:
+ 875 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 875 aa overlap). Hypothetical unknown
+ protein, possible coiled-coil regions, contains PS00017
+ ATP/GTP-binding site motif A. Protein product from Mb1309
+ detected using SWATH mass spectrometry. Mb1309 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA double-strand break repair Rad50 ATPase"
+ /protein_id="SIT99912.1"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR041685"
+ /db_xref="UniProtKB/Swiss-Prot:P64796"
+ /translation="MKLHRLALTNYRGIAHRDVEFPDHGVVVVCGANEIGKSSMVEAL
+ DLLLEYKDRSTKKEVKQVKPTNADVGSEVIAEISSGPYRFVYRKRFHKRCETELTVLA
+ PRREQLTGDEAHERVRTMLAETVDTELWHAQRVLQAASTAAVDLSGCDALSRALDLAA
+ GDDAALSGTESLLIERIEAEYARYFTPTGRPTGEWSAAVSRLAAAEAAVADCAAAVAE
+ VDDGVRRHTELTEQVAELSQQLLAHQLRLEAARVAAEKIAAITDDAREAKLIATAAAA
+ TSGASTAAHAGRLGLLTEIDTRTAAVVAAEAKARQAADEQATARAEAEACDAALTEAT
+ QVLTAVRLRAESARRTLDQLADCEEADRLAARLARIDDIEGDRDRVCAELSAVTLTEE
+ LLSRIERAAAAVDRGGAQLASISAAVEFTAAVDIELGVGDQRVSLSAGQSWSVTATGP
+ TEVKVPGVLTARIVPGATALDFQAKYAAAQQELADALAAGEVADLAAARSADLCRREL
+ LSRRDQLTATLAGLCGDEQVDQLRSRLEQLCAGQPAELDLVSTDTATARAELDAVEAA
+ RIAAEKDCETRRQIAAGAARRLAETSTRATVLQNAAAAESAELGAAMTRLACERASVG
+ DDELAAKAEADLRVLQTAEQRVIDLADELAATAPDAVAAELAEAADAVELLRERHDEA
+ IRALHEVGVELSVFGTQGRKGKLDAAETEREHAASHHARVGRRARAARLLRSVMARHR
+ DTTRLRYVEPYRAELHRLGRPVFGPSFEVEVDTDLRIRSRTLDDRTVPYECLSGGAKE
+ QLGILARLAGAALVAKEDAVPVLIDDALGFTDPERLAKMGEVFDTIGADGQVIVLTCS
+ PTRYGGVKGAHRIDLDAIQ"
+ gene 1432617..1434203
+ /locus_tag="BQ2027_MB1310"
+ CDS 1432617..1434203
+ /locus_tag="BQ2027_MB1310"
+ /note="Mb1310, -, len: 528 aa. Equivalent to Rv1279, len:
+ 528 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 528 aa overlap). Probable dehydrogenase,
+ FAD flavoprotein GMC oxidoreductase (EC 1.1.-.-), similar
+ to several e.g. dBETA_ECOLI|P17444 choline dehydrogenase
+ from Escherichia coli (556 aa), FASTA scores, opt: 1047,
+ E(): 0, (37.7% identity in 541 aa overlap). Similar to
+ Rv0697 putative Mycobacterium tuberculosis GMC
+ oxidoreductase. Contains PS00623 GMC oxidoreductases
+ signature 1, and PS00624 GMC oxidoreductases signature 2.
+ BELONGS TO THE GMC OXIDOREDUCTASES FAMILY. Protein product
+ from Mb1310 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1310 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEHYDROGENASE FAD flavoprotein GMC
+ oxidoreductase"
+ /protein_id="SIT99913.1"
+ /db_xref="GOA:P64264"
+ /db_xref="InterPro:IPR000172"
+ /db_xref="InterPro:IPR007867"
+ /db_xref="InterPro:IPR012132"
+ /db_xref="InterPro:IPR027424"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/Swiss-Prot:P64264"
+ /translation="MDTQSDYVVVGTGSAGAVVASRLSTDPATTVVALEAGPRDKNRF
+ IGVPAAFSKLFRSEIDWDYLTEPQPELDGREIYWPRGKVLGGSSSMNAMMWVRGFASD
+ YDEWAARAGPRWSYADVLGYFRRIENVTAAWHFVSGDDSGVTGPLHISRQRSPRSVTA
+ AWLAAARECGFAAARPNSPRPEGFCETVVTQRRGARFSTADAYLKPAMRRKNLRVLTG
+ ATATRVVIDGDRAVGVEYQSDGQTRIVYARREVVLCAGAVNSPQLLMLSGIGDRDHLA
+ EHDIDTVYHAPEVGCNLLDHLVTVLGFDVEKDSLFAAEKPGQLISYLLRRRGMLTSNV
+ GEAYGFVRSRPELKLPDLELIFAPAPFYDEALVPPAGHGVVFGPILVAPQSRGQITLR
+ SADPHAKPVIEPRYLSDLGGVDRAAMMAGLRICARIAQARPLRDLLGSIARPRNSTEL
+ DEATLELALATCSHTLYHPMGTCRMGSDEASVVDPQLRVRGVDGLRVADASVMPSTVR
+ GHTHAPSVLIGEKAADLIRS"
+ gene complement(1434220..1435995)
+ /gene="oppA"
+ /locus_tag="BQ2027_MB1311C"
+ CDS complement(1434220..1435995)
+ /gene="oppA"
+ /locus_tag="BQ2027_MB1311C"
+ /note="Mb1311c, oppA, len: 591 aa. Equivalent to Rv1280c,
+ len: 591 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 591 aa overlap). Probable oppA,
+ oligopeptide-binding lipoprotein component of peptide
+ transport system (see citation below), sharing some
+ similarity to other periplasmic solute binding proteins
+ e.g. OPPA_SALTY|P06202 periplasmic oligopeptide-binding
+ protein from Salmonella typhimurium (542 aa), FASTA
+ scores: E(): 5.1e-05, (22.1% identity in 458 aa overlap);
+ etc. Also similar to Rv1166 and Rv2585c from Mycobacterium
+ tuberculosis. Has possible N-terminal signal sequence and
+ prokaryotic lipoprotein lipid attachment site (PS00013).
+ BELONGS TO THE BACTERIAL EXTRACELLULAR SOLUTE-BINDING
+ PROTEIN FAMILY 5. Protein product from Mb1311c detected
+ using SWATH mass spectrometry. Mb1311c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PERIPLASMIC OLIGOPEPTIDE-BINDING
+ LIPOPROTEIN OPPA"
+ /protein_id="SIT99914.1"
+ /db_xref="GOA:P66772"
+ /db_xref="InterPro:IPR000914"
+ /db_xref="InterPro:IPR030678"
+ /db_xref="InterPro:IPR039424"
+ /db_xref="UniProtKB/Swiss-Prot:P66772"
+ /translation="MADRGQRRGCAPGIASALRASFQGKSRPWTQTRYWAFALLTPLV
+ VAMVLTGCSASGTQLELAPTADRRAAVGTTSDINQQDPATLQDGGNLRLSLTDFPPNF
+ NILHIDGNNAEVAAMMKATLPRAFIIGPDGSTTVDTNYFTSIELTRTAPQVVTYTINP
+ EAVWSDGTPITWRDIASQIHAISGADKAFEIASSSGAERVASVTRGVDDRQAVVTFAK
+ PYAEWRGMFAGNGMLLPASMTATPEAFNKGQLDGPGPSAGPFVVSALDRTAQRIVLTR
+ NPRWWGARPRLDSITYLVLDDAARLPALQNNTIDATGVGTLDQLTIAARTKGISIRRA
+ PGPSWYHFTLNGAPGSILADKALRLAIAKGIDRYTIARVAQYGLTSDPVPLNNHVFVA
+ GQDGYQDNSGVVAYNPEQAKRELDALGWRRSGAFREKDGRQLVIRDLFYDAQSTRQFA
+ QIAQHTLAQIGVKLELQAKSGSGFFSDYVNVGAFDIAQFGWVGDAFPLSSLTQIYASD
+ GESNFGKIGSPQIDAAIERTLAELDPGKARALANQVDELIWAEGFSLPLTQSPGTVAV
+ RSTLANFGATGLADLDYTAIGFMRR"
+ gene complement(1435988..1437826)
+ /gene="oppD"
+ /locus_tag="BQ2027_MB1312C"
+ CDS complement(1435988..1437826)
+ /gene="oppD"
+ /locus_tag="BQ2027_MB1312C"
+ /note="Mb1312c, oppD, len: 612 aa. Equivalent to Rv1281c,
+ len: 612 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 612 aa overlap). Probable oppD,
+ oligopeptide-transport ATP-binding protein ABC transporter
+ (see citation below), similar to others e.g.
+ DPPD_BACSU|P26905 dipeptide transport ATP-binding protein
+ from Bacillus subtilis (335 aa), FASTA scores: opt: 983,
+ E(): 0, (48.6% identity in 319 aa overlap); etc. Contains
+ 2 x PS00017 ATP/GTP-binding site motif A (P-loop); 2 x
+ PS00211 ABC transporters family signature. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Protein product from Mb1312c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1312c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OLIGOPEPTIDE-TRANSPORT ATP-BINDING
+ PROTEIN ABC TRANSPORTER OPPD"
+ /protein_id="SIT99915.1"
+ /db_xref="GOA:P63396"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR013563"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P63396"
+ /translation="MSPLLEVTDLAVTFRTDGDPVTAVRGISYRVEPGEVVAMVGESG
+ SGKSAAAMAVVGLLPEYAQVRGSVRLQGTELLGLADNAMSRFRGKAIGTVFQDPMSAL
+ TPVYTVGDQIAEAIEVHQPRVGKKAARRRAVELLDLVGISQPQRRSRAFPHELSGGER
+ QRVVIAIAIANDPDLLICDEPTTALDVTVQAQILDVLKAARDVTGAGVLIITHDLGVV
+ AEFADRALVMYAGRVVESAGVNDLYRDRRMPYTVGLLGSVPRLDAAQGTRLVPIPGAP
+ PSLAGLAPGCPFAPRCPLVIDECLTAEPELLDVATDHRAACIRTELVTGRSAADIYRV
+ KTEARPAALGDASVVVRVRHLVKTYRLAKGVVLRRAIGEVRAVDGISLELRQGRTLGI
+ VGESGSGKSTTLHEILELAAPQSGSIEVLGTDVATLGTAERRSLRRDIQVVFQDPVAS
+ LDPRLPVFDLIAEPLQANGFGKNETHARVAELLDIVGLRHGDASRYPAEFSGGQKQRI
+ GIARALALQPKILALDEPVSALDVSIQAGIINLLLDLQEQFGLSYLFVSHDLSVVKHL
+ AHQVAVMLAGTVVEQGDSEEVFGNPKHEYTRRLLGAVPQPDPARRG"
+ gene complement(1437823..1438698)
+ /gene="oppC"
+ /locus_tag="BQ2027_MB1313C"
+ CDS complement(1437823..1438698)
+ /gene="oppC"
+ /locus_tag="BQ2027_MB1313C"
+ /note="Mb1313c, oppC, len: 291 aa. Equivalent to Rv1282c,
+ len: 291 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 291 aa overlap). Probable oppC,
+ oligopeptide-transport integral membrane protein ABC
+ transporter (see citation below), similar to other
+ integral membrane proteins e.g. OPPC_ECOLI|P77664
+ oligopeptide transport system permease from Escherichia
+ coli (302 aa), FASTA scores: E(): 4.6e-33, (40.7% identity
+ in 275 aa overlap); etc. Also similar to Rv3664c|DPPC
+ probable peptide-transport integral membrane protein from
+ Mycobacterium tuberculosis. Mb1313c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OLIGOPEPTIDE-TRANSPORT INTEGRAL
+ MEMBRANE PROTEIN ABC TRANSPORTER OPPC"
+ /protein_id="SIT99916.1"
+ /db_xref="GOA:P66965"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR025966"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/Swiss-Prot:P66965"
+ /translation="MTEFASRRTLVVRRFLRNRAAVASLAALLLLFVSAYALPPLLPY
+ SYDDLDFNALLQPPGTKHWLGTNALGQDLLAQTLRGMQKSMLIGVCVAVISTGIAATV
+ GAISGYFGGWRDRTLMWVVDLLLVVPSFILIAIVTPRTKNSANIMFLVLLLAGFGWMI
+ SSRMVRGMTMSLREREFIRAARYMGVSSRRIIVGHVVPNVASILIIDAALNVAAAILA
+ ETGLSFLGFGIQPPDVSLGTLIADGTASATAFPWVFLFPASILVLILVCANLTGDGLR
+ DALDPASRSLRRGVR"
+ gene complement(1438695..1439672)
+ /gene="oppB"
+ /locus_tag="BQ2027_MB1314C"
+ CDS complement(1438695..1439672)
+ /gene="oppB"
+ /locus_tag="BQ2027_MB1314C"
+ /note="Mb1314c, oppB, len: 325 aa. Equivalent to Rv1283c,
+ len: 325 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 325 aa overlap). Probable oppB,
+ oligopeptide-transport integral membrane protein ABC
+ transporter (see citation below), similar to other
+ integral membrane proteins e.g. DPPB_ECOLI|P37316
+ dipeptide transport system permease protein from
+ Escherichia coli (339 aa), FASTA scores: opt: 402, E():
+ 3.4e-20, (31.0% identity in 345 aa overlap); etc. Also
+ similar to Rv3665c|DppB probable peptide-transport
+ integral membrane protein from Mycobacterium tuberculosis.
+ Contains PS00402 Binding-protein-dependent transport
+ systems inner membrane comp signature. Protein product
+ from Mb1314c detected using SWATH mass spectrometry.
+ Mb1314c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OLIGOPEPTIDE-TRANSPORT INTEGRAL
+ MEMBRANE PROTEIN ABC TRANSPORTER OPPB"
+ /protein_id="SIT99917.1"
+ /db_xref="GOA:P66967"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/Swiss-Prot:P66967"
+ /translation="MTRYLARRLLNYLVLLALASFLTYCLTSLAFSPLESLMQRSPRP
+ PQAVIDAKAHDLGLDRPILARYANWVSHAVRGDFGTTITGQPVGTELGRRIGVSLRLL
+ VVGSVFGTVAGVVIGAWGAIRQYRLSDRVMTTLALLVLSTPTFVVANLLILGALRVNW
+ AVGIQLFDYTGETSPGVAGGVWDRLGDRLQHLILPSLTLALAAAAGFSRYQRNAMLDV
+ LGQDFIRTARAKGLTRRRALLKHGLRTALIPMATLFAYGVAGLVTGAVFVEKIFGWHG
+ MGEWMVRGISTQDTNIVAAITVFSGAVVLLAGLLSDVIYAALDPRVRVS"
+ gene 1439879..1440370
+ /gene="canA"
+ /locus_tag="BQ2027_MB1315"
+ CDS 1439879..1440370
+ /gene="canA"
+ /locus_tag="BQ2027_MB1315"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1315, -, len: 163 aa. Equivalent to Rv1284, len:
+ 163 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 163 aa overlap). Conserved hypothetical
+ protein, similar to AL109663|SC4A10.26 hypothetical
+ protein from Streptomyces coelicolor (167 aa), FASTA
+ scores: opt: 567, E(): 1.5e-32, (53.4% identity in 163 aa
+ overla); shows some similarity to hypothetical protein
+ from Methanobacterium thermoautotrophicum. Weak similarity
+ to carbonic anhydrases e.g. U51624|MTU516242|P17582
+ Methanothermobacter thermautotrophicus (171 aa), FASTA
+ score: opt: 305, E(): 1 .2e-14, (35.2% identity in 165 aa
+ overlap). Protein product from Mb1315 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1315 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="beta-carbonic anhydrase"
+ /protein_id="SIT99918.1"
+ /db_xref="GOA:P64798"
+ /db_xref="InterPro:IPR001765"
+ /db_xref="InterPro:IPR036874"
+ /db_xref="UniProtKB/Swiss-Prot:P64798"
+ /translation="MTVTDDYLANNVDYASGFKGPLPMPPSKHIAIVACMDARLDVYR
+ MLGIKEGEAHVIRNAGCVVTDDVIRSLAISQRLLGTREIILLHHTDCGMLTFTDDDFK
+ RAIQDETGIRPTWSPESYPDAVEDVRQSLRRIEVNPFVTKHTSLRGFVFDVATGKLNE
+ VTP"
+ gene 1440464..1441462
+ /gene="cysD"
+ /locus_tag="BQ2027_MB1316"
+ CDS 1440464..1441462
+ /gene="cysD"
+ /locus_tag="BQ2027_MB1316"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1316, cysD, len: 332 aa. Equivalent to Rv1285,
+ len: 332 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 332 aa overlap). Probable cysD, sulfate
+ adenylyltransferase subunit 2 (EC 2.7.7.4) (see first
+ citation below), homology suggests start site at aa 24 or
+ 28, similar to e.g. CYSD_ECOLI|P21156 sulfate adenylate
+ transferase subunit 2 from Escherichia coli (302 aa),
+ FASTA score: opt: 973, E():0, (52.5% identity in 303 aa
+ overlap). Also similar to Mycobacterium tuberculosis
+ Rv2392, 3'-phosphoadenylylsulfate reductase. BELONGS TO
+ THE PAPS REDUCTASE FAMILY. CYSD SUBFAMILY. Thought to be
+ differentially expressed within host cells (see third
+ citation below). Protein product from Mb1316 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1316 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SULFATE ADENYLYLTRANSFERASE SUBUNIT 2
+ CYSD"
+ /protein_id="SIT99919.1"
+ /db_xref="GOA:P65671"
+ /db_xref="InterPro:IPR002500"
+ /db_xref="InterPro:IPR011784"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="UniProtKB/Swiss-Prot:P65671"
+ /translation="MAITINMVNPTGFIRYEDVEQEAMTSDVTVGPAPGQYQLSHLRL
+ LEAEAIHVIREVAAEFERPVLLFSGGKDSIVMLHLALKAFRPGRLPFPVMHVDTGHNF
+ DEVIATRDELVAAAGVRLVVASVQDDIDAGRVVETIPSRNPIQTVTLLRAIRENQFDA
+ AFGGARRDEEKARAKERVFSFRDEFGQWDPKAQRPELWNLYNGRHHKGEHIRVFPLSN
+ WTEFDIWSYIGAEQVRLPSIYFAHRRKVFQRDGMLLAVHRHMQPRADEPVFEATVRFR
+ TVGDVTCTGCVESSASTVAEVIAETAVARLTERGATRADDRISEAGMEDRKRQGYF"
+ gene 1441462..1443306
+ /gene="cysN"
+ /locus_tag="BQ2027_MB1317"
+ CDS 1441462..1443306
+ /gene="cysN"
+ /locus_tag="BQ2027_MB1317"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1317, cysN, len: 614 aa. Equivalent to Rv1286,
+ len: 614 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 614 aa overlap). Probable cysN/cysC
+ bifunctional enzyme, sulfate adenylyltransferase subunit 1
+ (EC 2.7.7.4) and Adenylylsulfate kinase (EC 2.7.1.25) (see
+ first citation below), similar to CYSN_ECOLI|P23845
+ sulfate adenylate transferase subunit 1 from Escherichia
+ coli (475 aa), FASTA scores: opt: 1291, E():0, (50.2%
+ identity in 428 aa overlap). Contains 2 x PS00017
+ ATP/GTP-binding site motif A, PS00301 GTP-binding
+ elongation factors signature. Protein product from Mb1317
+ detected using shotgun mass spectrometry. Mb1317 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BIFUNCTIONAL ENZYME CYSN/CYSC: SULFATE
+ ADENYLTRANSFERASE (SUBUNIT 1) + ADENYLYLSULFATE KINASE"
+ /protein_id="SIT99920.1"
+ /db_xref="GOA:A0A1R3XXW4"
+ /db_xref="InterPro:IPR000795"
+ /db_xref="InterPro:IPR002891"
+ /db_xref="InterPro:IPR009000"
+ /db_xref="InterPro:IPR009001"
+ /db_xref="InterPro:IPR011779"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR031157"
+ /db_xref="InterPro:IPR041757"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXW4"
+ /translation="MTTLLRLATAGSVDDGKSTLIGRLLYDSKAVMEDQWASVEQTSK
+ DRGHDYTDLALVTDGLRAEREQGITIDVAYRYFATPKRKFIIADTPGHIQYTRNMVTG
+ ASTAQLVIVLVDARHGLLEQSRRHAFLASLLGIRHLVLAVNKMDLLGWDQEKFDAIRD
+ EFHAFAARLDVQDVTSIPISALHGDNVVTKSDQTPWYEGPSLLSHLEDVYIAGDRNMV
+ DVRFPVQYVIRPHTLEHQDHRSYAGTLASGVMRSGDEVVVLPIGKTTRITAIDGPNGP
+ VAEAFPPMAVSVRLADDIDISRGDMIARTHNQPRITQEFDATVCWMADNAVLEPGRDY
+ VVKHTTRTVRARIAGLDYRLDVNTLHRDKTATALKLNELGRVSLRTQVPLLLDEYTRN
+ ASTGSFILIDPDTNGTVAAGMVLRDVSARTPSPNTVRHRSLVTAQDRPPRGKTVWFTG
+ LSGSGKSSVAMLVERKLLEKGISAYVLDGDNLRHGLNADLGFSMADRAENLRRLSHVA
+ TLLADCGHLVLVPAISPLAEHRALARKVHADAGIDFFEVFCDTPLQDCERRDPKGLYA
+ KARAGEITHFTGIDSPYQRPKNPDLRLTPDRSIDEQAQEVIDLLESSS"
+ gene 1443360..1443845
+ /locus_tag="BQ2027_MB1318"
+ CDS 1443360..1443845
+ /locus_tag="BQ2027_MB1318"
+ /note="Mb1318, -, len: 161 aa. Equivalent to Rv1287, len:
+ 161 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 161 aa overlap). Conserved hypothetical
+ protein, similar to VJEB family of proteins e.g. FASTA
+ score: P44675|Y379_HAEIN HYPOTHETICAL PROTEIN HI0379 (150
+ aa), FASTA scores: opt: 213, E(): 2.5e-08, (30.0% identity
+ in 130 aa overlap) and YJEB_ECOLI|P21498 hypothetical 15.6
+ kd protein in pura-vacb (141 aa), opt: 167, E(): 9.5e-06,
+ (25.0% identity in 136 aa overlap). BELONGS TO THE UPF0074
+ (RFF2) FAMILY. Protein product from Mb1318 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1318 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted transcriptional regulator of sulfate
+ adenylyltransferase, Rrf2 family"
+ /protein_id="SIT99921.1"
+ /db_xref="GOA:P67160"
+ /db_xref="InterPro:IPR000944"
+ /db_xref="InterPro:IPR030489"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P67160"
+ /translation="MRMSAKAEYAVRAMVQLATAASGTVVKTDDLAAAQGIPPQFLVD
+ ILTNLRTDRLVRSHRGREGGYELARPGTEISIADVLRCIDGPLASVRDIGLGDLPYSG
+ PTTALTDVWRALRASMRSVLEETTLADVAGGALPEHVAQLADDYRAQESTRHGASRHG
+ D"
+ gene 1443903..1445120
+ /locus_tag="BQ2027_MB1319"
+ CDS 1443903..1445120
+ /locus_tag="BQ2027_MB1319"
+ /note="Mb1319, -, len: 405 aa. Similar to Rv1288, len: 456
+ aa, from Mycobacterium tuberculosis strain H37Rv, (98.3%
+ identity in 403 aa overlap). Conserved hypothetical
+ protein, some similarity to A85B_MYCTU|P31952 antigen 85-b
+ precursor (85b) (325 aa), FASTA scores: opt: 199, E():
+ 2.7e-06, (24.7% identity in 279 aa overlap). Also similar
+ to Q01377|CSP1_CORGL PS1 PROTEIN PRECURSOR (related to
+ antigen 85 complex) from Corynebacterium glutamicum (657
+ aa), FASTA scores: opt: 280, E(): 1.9e-10, (26.4% identity
+ in 352 aa overlap). SEEMS TO CONTAIN 3 LYSM REPEATS.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 153 bp deletion leads to a shorter product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (405 aa
+ versus 456 aa). Protein product from Mb1319 detected using
+ SWATH mass spectrometry. Mb1319 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative esterase"
+ /protein_id="SIT99922.1"
+ /db_xref="InterPro:IPR000801"
+ /db_xref="InterPro:IPR018392"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="InterPro:IPR036779"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y024"
+ /translation="MVSTHAVVAGETLSALALRFYGDAELYRLIAAASGIADPDVVNV
+ GQRLIMPDFTRYTVVAGDTLSALAARFYGDASLYPLIAAVNGIADPGVIDVGQVLVIF
+ IGRSDGFGLRIVDRNENDPRLWYYRFQTSAIGWNPGVNVLLPDDYRTSGRTYPVLYLF
+ HGGGTDQDFRTFDFLGIRDLTAGKPIIIVMPDGGHAGWYSNPVSSFVGPRNWETFHIA
+ QLLPWIEANFRTYAEYDGRAVAGFSMGGFGALKYAAKYYGHFASASSHSGPASLRRDF
+ GLVVHWANLSSAVLDLGGGTVYGAPLWDQARVSADNPVERIDSYRNKRIFLVAGTSPD
+ PANWFDSVNETQVLAGQREFRERLSNAGIPHESHEVPGGHVFRPDMFRLDLDGIVARL
+ RPASIGAAAERAD"
+ gene 1445169..1445801
+ /locus_tag="BQ2027_MB1320"
+ CDS 1445169..1445801
+ /locus_tag="BQ2027_MB1320"
+ /note="Mb1320, -, len: 210 aa. Equivalent to Rv1289, len:
+ 210 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 210 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1320 detected using
+ shotgun mass spectrometry. Mb1320 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIT99923.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64800"
+ /translation="MCVSVGESVAQSLQQWDRKLWDVAMLHACNAVDETGRKRYPTLG
+ VGTRFRTALRDSLDIYGVMATPGVDLEKTRFPVGVRSDLLPDKRPDIADVLYGIHRWL
+ HGHADESSVEFEVSPYVNASAALRIANDGKIQLPKSAILGLLAVAVFAPENKGEVIPP
+ DYQLSWYDHVFFISVWWGWQDHFREIVNVDRASLVALDFGDLWNGWTPVG"
+ gene complement(1445940..1447505)
+ /locus_tag="BQ2027_MB1321C"
+ CDS complement(1445940..1447505)
+ /locus_tag="BQ2027_MB1321C"
+ /note="Mb1321c, -, len: 521 aa. Equivalent to Rv1290c,
+ len: 521 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 521 aa overlap). Conserved hypothetical
+ protein, similar to AL031013|SC8A6.09 hypothetical protein
+ from Streptomyces coelicolor (443 aa), FASTA scores: opt:
+ 371, E(): 9.5e-17, (28.3% identity in 446 aa overlap).
+ Protein product from Mb1321c detected using SWATH mass
+ spectrometry. Mb1321c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted membrane protein"
+ /protein_id="SIT99924.1"
+ /db_xref="GOA:P0A5E4"
+ /db_xref="InterPro:IPR018723"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5E4"
+ /translation="MLQRSLGVNGRKLAMSARSAKRERKNASTAASKCYVVPPSARGW
+ VHAYSVTATSMLNRRKAILDYLQGAVWVLPTFGVAIGLGSGAVLSMIPVKSGTLIDKL
+ MFQGTPGDARGVLIVVSATMITTIGIVFSLTVLSLQIASSQFSVRLLRTFLRDVPNQV
+ VLAIFACTFAYSTGGLHTVGEHRDGGAFIPKVAVTGSLALAFVSIAALIYFLHHLMHS
+ IQIDTIMDKVRLRTLGLVDQLYPESDTADRQVETPPSPPADAVPLLAPHSGYLQTVDV
+ DDIAELAAASRYTALLVTFVGDYVTAGGLLGWCWRRGTAPGAPGSDFPQRCLRHVHIG
+ FERTLQQDIRFGLRQMVDIALRALSPALNDPYTAIQVVHHLSAVESVLASRALPDDVR
+ RDRAGELLFWLPYPSFATYLHVGCAQIRRYGSREPLVLTALLQLLSAVAQNCVDPSRR
+ VAVQTQIALVVRAAQREFADESDRAMVLGAAARATEVVERPGTLAPPPSTFGQVAAAQ
+ AAASTIRSADRDG"
+ gene 1447516..1447830
+ /locus_tag="BQ2027_MB1322"
+ CDS 1447516..1447830
+ /locus_tag="BQ2027_MB1322"
+ /note="Mb1322, -, len: 104 aa. Equivalent to Rv1290A, len:
+ 104 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 104 aa overlap). Hypothetical unknown
+ protein, equivalent to AAK45590 from Mycobacterium
+ tuberculosis strain CDC1551 (122 aa) but shorter 18 aa."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99925.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY94"
+ /translation="MLALHGLSEGVSGSGGSGGRWGAGEVLEGARIGVIADGVSCFPT
+ KADCRRIRGVPVFDGYTRMVARLMGSLAVLRSVSIPKGYRDFGFGSLRAVAPKNCPDV
+ SG"
+ gene complement(1447957..1448292)
+ /locus_tag="BQ2027_MB1323C"
+ CDS complement(1447957..1448292)
+ /locus_tag="BQ2027_MB1323C"
+ /note="Mb1323c, -, len: 111 aa. Equivalent to Rv1291c,
+ len: 111 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 111 aa overlap). Conserved hypothetical
+ secreted protein, similar to others in Mycobacterium
+ tuberculosis e.g. Rv1271c|Q11048|YC71_MYCTU HYPOTHETICAL
+ 11.6 KD PROTEIN (113 aa), FASTA score: opt: 246, E():
+ 1.7e-09, (40.0% identity in 110 aa overlap); Rv1804c,
+ Rv1810, Rv0622, etc."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL SECRETED PROTEIN"
+ /protein_id="SIT99926.1"
+ /db_xref="InterPro:IPR007969"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5E6"
+ /translation="MFTRRFAASMVGTTLTAATLGLAALGFAGTASASSTDEAFLAQL
+ QADGITPPSAARAIKDAHAVCDALDEGHSAKAVIKAVAKATGLSAKGAKTFAVDAASA
+ YCPQYVTSS"
+ gene complement(1448651..1448723)
+ /locus_tag="BQ2027_ARGV"
+ tRNA complement(1448651..1448723)
+ /locus_tag="BQ2027_ARGV"
+ /product="tRNA-Arg"
+ /note="argV, len: 73 nt. Equivalent to argV, len: 73 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 73 nt overlap). tRNA-Arg, anticodon ccg."
+ gene 1448837..1450489
+ /gene="argS"
+ /locus_tag="BQ2027_MB1324"
+ CDS 1448837..1450489
+ /gene="argS"
+ /locus_tag="BQ2027_MB1324"
+ /note="Mb1324, argS, len: 550 aa. Equivalent to Rv1292,
+ len: 550 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 550 aa overlap). Probable argS,
+ Arginyl-tRNA synthetase (EC 6.1.1.19), highly similar to
+ SYR_MYCLE|P45840 Mycobacterium leprae (550 aa), FASTA
+ scores: opt: 3115, E(): 0, (84.9% identity in 550 aa
+ overlap). Contains PS00178 Aminoacyl-transfer RNA
+ synthetases class-I signature. BELONGS TO CLASS-I
+ AMINOACYL-TRNA SYNTHETASE FAMILY. Protein product from
+ Mb1324 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1324 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ARGINYL-TRNA SYNTHETASE ARGS (ARGRS)
+ (Arginine--tRNA ligase)"
+ /protein_id="SIT99927.1"
+ /db_xref="GOA:P67570"
+ /db_xref="InterPro:IPR001278"
+ /db_xref="InterPro:IPR001412"
+ /db_xref="InterPro:IPR005148"
+ /db_xref="InterPro:IPR008909"
+ /db_xref="InterPro:IPR009080"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="InterPro:IPR035684"
+ /db_xref="InterPro:IPR036695"
+ /db_xref="UniProtKB/Swiss-Prot:P67570"
+ /translation="MTPADLAELLKATAAAVLAERGLDASALPQMVTVERPRIPEHGD
+ YASNLAMQLAKKVGTNPRELAGWLAEALTKVDGIASAEVAGPGFINMRLETAAQAKVV
+ TSVIDAGHSYGHSLLLAGRKVNLEFVSANPTGPIHIGGTRWAAVGDALGRLLTTQGAD
+ VVREYYFNDHGAQIDRFANSLIAAAKGEPTPQDGYAGSYITNIAEQVLQKAPDALSLP
+ DAELRETFRAIGVDLMFDHIKQSLHEFGTDFDVYTHEDSMHTGGRVENAIARLRETGN
+ IYEKDGATWLRTSAFGDDKDRVVIKSDGKPAYIAGDLAYYLDKRQRGFDLCIYMLGAD
+ HHGYIARLKAAAAAFGDDPATVEVLIGQMVNLVRDGQPVRMSKRAGTVLTLDDLVEAI
+ GVDAARYSLIRSSVDTAIDIDLALWSSASNENPVYYVQYAHARLSALARNAAELALIP
+ DTNHLELLNHDKEGTLLRTLGEFPRVLETAASLREPHRVCRYLEDLAGDYHRFYDSCR
+ VLPQGDEQPTDLHTARLALCQATRQVIANGLAIIGVTAPERM"
+ gene 1450486..1451829
+ /gene="lysA"
+ /locus_tag="BQ2027_MB1325"
+ CDS 1450486..1451829
+ /gene="lysA"
+ /locus_tag="BQ2027_MB1325"
+ /note="Mb1325, lysA, len: 447 aa. Equivalent to Rv1293,
+ len: 447 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 447 aa overlap). Probable lysA,
+ diaminopimelate decarboxylase (EC 4.1.1.20) (see citation
+ below), almost identical to DCDA_MYCTU|P31848. Contains
+ PS00878 Orn/DAP/Arg decarboxylases family 2 pyridoxal-P
+ attachment site, PS00879 Orn/DAP/Arg decarboxylases family
+ 2 signature 2. BELONGS TO FAMILY 2 OF ORNITHINE, DAP, AND
+ ARGININE DECARBOXYLASES. Protein product from Mb1325
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1325 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="diaminopimelate decarboxylase lysa (dap
+ decarboxylase)"
+ /protein_id="SIT99928.1"
+ /db_xref="GOA:P0A5M5"
+ /db_xref="InterPro:IPR000183"
+ /db_xref="InterPro:IPR002986"
+ /db_xref="InterPro:IPR009006"
+ /db_xref="InterPro:IPR022643"
+ /db_xref="InterPro:IPR022644"
+ /db_xref="InterPro:IPR022653"
+ /db_xref="InterPro:IPR022657"
+ /db_xref="InterPro:IPR029066"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5M5"
+ /translation="MNELLHLAPNVWPRNTTRDEVGVVCIAGIPLTQLAQEYGTPLFV
+ IDEDDFRSRCRETAAAFGSGANVHYAAKAFLCSEVARWISEEGLCLDVCTGGELAVAL
+ HASFPPERITLHGNNKSVSELTAAVKAGVGHIVVDSMTEIERLDAIAGEAGIVQDVLV
+ RLTVGVEAHTHEFISTAHEDQKFGLSVASGAAMAAVRRVFATDHLRLVGLHSHIGSQI
+ FDVDGFELAAHRVIGLLRDVVGEFGPEKTAQIATVDLGGGLGISYLPSDDPPPIAELA
+ AKLGTIVSDESTAVGLPTPKLVVEPGRAIAGPGTITLYEVGTVKDVDVSATAHRRYVS
+ VDGGMSDNIRTALYGAQYDVRLVSRVSDAPPVPARLVGKHCESGDIIVRDTWVPDDIR
+ PGDLVAVAATGAYCYSLSSRYNMVGRPAVVAVHAGNARLVLRRETVDDLLSLEVR"
+ gene 1451833..1453158
+ /gene="thrA"
+ /locus_tag="BQ2027_MB1326"
+ CDS 1451833..1453158
+ /gene="thrA"
+ /locus_tag="BQ2027_MB1326"
+ /note="Mb1326, thrA, len: 441 aa. Equivalent to Rv1294,
+ len: 441 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 441 aa overlap). Probable thrA (hom),
+ homoserine dehydrogenase (EC 1.1.1.3), highly similar to
+ DHOM_MYCLE|P46806 from Mycobacterium leprae (441 aa),
+ FASTA scores: opt: 2437, E():0, (89.5% identity in 438 aa
+ overlap). Contains PS00017 ATP/GTP-binding site motif A;
+ PS01042 Homoserine dehydrogenase signature. BELONGS TO THE
+ HOMOSERINE DEHYDROGENASE FAMILY. Protein product from
+ Mb1326 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1326 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE HOMOSERINE DEHYDROGENASE THRA"
+ /protein_id="SIT99929.1"
+ /db_xref="GOA:P63630"
+ /db_xref="InterPro:IPR001342"
+ /db_xref="InterPro:IPR002912"
+ /db_xref="InterPro:IPR005106"
+ /db_xref="InterPro:IPR016204"
+ /db_xref="InterPro:IPR019811"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P63630"
+ /translation="MPGDEKPVGVAVLGLGNVGSEVVRIIENSAEDLAARVGAPLVLR
+ GIGVRRVTTDRGVPIELLTDDIEELVAREDVDIVVEVMGPVEPSRKAILGALERGKSV
+ VTANKALLATSTGELAQAAESAHVDLYFEAAVAGAIPVIRPLTQSLAGDTVLRVAGIV
+ NGTTNYILSAMDSTGADYASALADASALGYAEADPTADVEGYDAAAKAAILASIAFHT
+ RVTADDVYREGITKVTPADFGSAHALGCTIKLLSICERITTDEGSQRVSARVYPALVP
+ LSHPLAAVNGAFNAVVVEAEAAGRLMFYGQGAGGAPTASAVTGDLVMAARNRVLGSRG
+ PRESKYAQLPVAPMGFIETRYYVSMNVADKPGVLSAVAAEFAKREVSIAEVRQEGVVD
+ EGGRRVGARIVVVTHLATDAALSETVDALDDLDVVQGVSSVIRLEGTGL"
+ gene 1453155..1454237
+ /gene="thrC"
+ /locus_tag="BQ2027_MB1327"
+ CDS 1453155..1454237
+ /gene="thrC"
+ /locus_tag="BQ2027_MB1327"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1327, thrC, len: 360 aa. Equivalent to Rv1295,
+ len: 360 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 360 aa overlap). Probable thrC,
+ threonine synthase (EC 4.2.3.1) (see first citation
+ below), highly similar to THRC_MYCLE|P45837 Mycobacterium
+ leprae (360 aa), FASTA scores: opt: 2202, E(): 0, (93.9%
+ identity in 359 aa overlap). Contains PS00165
+ Serine/threonine dehydratases pyridoxal-phosphate
+ attachment site. Protein product from Mb1327 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1327 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="threonine synthase thrc (ts)"
+ /protein_id="SIT99930.1"
+ /db_xref="GOA:P66903"
+ /db_xref="InterPro:IPR000634"
+ /db_xref="InterPro:IPR001926"
+ /db_xref="InterPro:IPR004450"
+ /db_xref="InterPro:IPR026260"
+ /db_xref="InterPro:IPR036052"
+ /db_xref="UniProtKB/Swiss-Prot:P66903"
+ /translation="MTVPPTATHQPWPGVIAAYRDRLPVGDDWTPVTLLEGGTPLIAA
+ TNLSKQTGCTIHLKVEGLNPTGSFKDRGMTMAVTDALAHGQRAVLCASTGNTSASAAA
+ YAARAGITCAVLIPQGKIAMGKLAQAVMHGAKIIQIDGNFDDCLELARKMAADFPTIS
+ LVNSVNPVRIEGQKTAAFEIVDVLGTAPDVHALPVGNAGNITAYWKGYTEYHQLGLID
+ KLPRMLGTQAAGAAPLVLGEPVSHPETIATAIRIGSPASWTSAVEAQQQSKGRFLAAS
+ DEEILAAYHLVARVEGVFVEPASAASIAGLLKAIDDGWVARGSTVVCTVTGNGLKDPD
+ TALKDMPSVSPVPVDPVAVVEKLGLA"
+ gene 1454455..1455405
+ /gene="thrB"
+ /locus_tag="BQ2027_MB1328"
+ CDS 1454455..1455405
+ /gene="thrB"
+ /locus_tag="BQ2027_MB1328"
+ /note="Mb1328, thrB, len: 316 aa. Equivalent to Rv1296,
+ len: 316 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 316 aa overlap). Probable thrB,
+ homoserine kinase (EC 2.7.1.39) (see citation below),
+ highly similar to KHSE_MYCLE|P45836 from Mycobacterium
+ leprae (314 aa), FASTA scores, opt: 1657, E(): 0, (82.0%
+ identity in 311 aa overlap). Contains PS00639 Eukaryotic
+ thiol (cysteine) proteases histidine active site, and
+ PS00627 GHMP kinases putative ATP-binding domain. Protein
+ product from Mb1328 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1328 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE HOMOSERINE KINASE THRB"
+ /protein_id="SIT99931.1"
+ /db_xref="GOA:P65225"
+ /db_xref="InterPro:IPR000870"
+ /db_xref="InterPro:IPR006203"
+ /db_xref="InterPro:IPR006204"
+ /db_xref="InterPro:IPR014721"
+ /db_xref="InterPro:IPR020568"
+ /db_xref="InterPro:IPR036554"
+ /db_xref="UniProtKB/Swiss-Prot:P65225"
+ /translation="MVTQALLPSGLVASAVVAASSANLGPGFDSVGLALSLYDEIIVE
+ TTDSGLTVTVDGEGGDQVPLGPEHLVVRAVQHGLQAAGVSAAGLAVRCRNAIPHSRGL
+ GSSAAAVVGGLAAVNGLVVQTDSSPSSDAELIQLASEFEGHPDNAAAAVLGGAVVSWT
+ DHSGDRPNYSAVSLRLHPDIRLFTAIPEQRSSTAETRVLLPAQVSHDDARFNVSRAAL
+ LVVALTERPDLLMAATEDLLHQPQRAAAMTASAEYLRLLRRHNVAAALSGAGPSLIAL
+ STDSELPTDAVEFGAAKGFAVTELTVGEAVRWSPTVRVPG"
+ gene 1455662..1457470
+ /gene="rho"
+ /locus_tag="BQ2027_MB1329"
+ CDS 1455662..1457470
+ /gene="rho"
+ /locus_tag="BQ2027_MB1329"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1329, rho, len: 602 aa. Equivalent to Rv1297,
+ len: 602 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 602 aa overlap). Probable rho,
+ transcription termination factor homolog, highly similar
+ to many e.g. RHO_MYCLE|P45835 Mycobacterium leprae (610
+ aa), FASTA scores: (81.5% identity in 612 aa overlap).
+ CONTAINS 1 RNA RECOGNITION MOTIF (RRM). Protein product
+ from Mb1329 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1329 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTION TERMINATION FACTOR RHO
+ HOMOLOG"
+ /protein_id="SIT99932.1"
+ /db_xref="GOA:P66029"
+ /db_xref="InterPro:IPR000194"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR004665"
+ /db_xref="InterPro:IPR011112"
+ /db_xref="InterPro:IPR011113"
+ /db_xref="InterPro:IPR011129"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036269"
+ /db_xref="InterPro:IPR041703"
+ /db_xref="UniProtKB/Swiss-Prot:P66029"
+ /translation="MTDTDLITAGESTDGKPSDAAATDPPDLNADEPAGSLATMVLPE
+ LRALANRAGVKGTSGMRKNELIAAIEEIRRQANGAPAVDRSAQEHDKGDRPPSSEAPA
+ TQGEQTPTEQIDSQSQQVRPERRSATREAGPSGSGERAGTAADDTDNRQGGQQDAKTE
+ ERGTDAGGDQGGDQQASGGQQARGDEDGEARQGRRGRRFRDRRRRGERSGDGAEAELR
+ EDDVVQPVAGILDVLDNYAFVRTSGYLPGPHDVYVSMNMVRKNGMRRGDAVTGAVRVP
+ KEGEQPNQRQKFNPLVRLDSINGGSVEDAKKRPEFGKLTPLYPNQRLRLETSTERLTT
+ RVIDLIMPIGKGQRALIVSPPKAGKTTILQDIANAITRNNPECHLMVVLVDERPEEVT
+ DMQRSVKGEVIASTFDRPPSDHTSVAELAIERAKRLVEQGKDVVVLLDSITRLGRAYN
+ NASPASGRILSGGVDSTALYPPKRFLGAARNIEEGGSLTIIATAMVETGSTGDTVIFE
+ EFKGTGNAELKLDRKIAERRVFPAVDVNPSGTRKDELLLSPDEFAIVHKLRRVLSGLD
+ SHQAIDLLMSQLRKTKNNYEFLVQVSKTTPGSMDSD"
+ gene 1457621..1457863
+ /gene="rpmE"
+ /locus_tag="BQ2027_MB1330"
+ CDS 1457621..1457863
+ /gene="rpmE"
+ /locus_tag="BQ2027_MB1330"
+ /note="Mb1330, rpmE, len: 80 aa. Equivalent to Rv1298,
+ len: 80 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 80 aa overlap). Probable rpmE, 50s
+ ribosomal protein L31, highly similar to many e.g.
+ RL31_MYCLE|P45834 50s ribosomal protein L31 from
+ Mycobacterium leprae (84 aa), FASTA scores: opt: 490, E():
+ 5.5e-28, (89.6% identity in 77 aa overlap). Contains
+ PS01143 Ribosomal protein L31 signature. BELONGS TO THE
+ L31P FAMILY OF RIBOSOMAL PROTEINS. Protein product from
+ Mb1330 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1330 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l31 rpme"
+ /protein_id="SIT99933.1"
+ /db_xref="GOA:P66188"
+ /db_xref="InterPro:IPR002150"
+ /db_xref="InterPro:IPR027491"
+ /db_xref="InterPro:IPR034704"
+ /db_xref="InterPro:IPR042105"
+ /db_xref="UniProtKB/Swiss-Prot:P66188"
+ /translation="MKSDIHPAYEETTVVCGCGNTFQTRSTKPGGRIVVEVCSQCHPF
+ YTGKQKILDSGGRVARFEKRYGKRKVGADKAVSTGK"
+ gene 1457953..1459026
+ /gene="prfA"
+ /locus_tag="BQ2027_MB1331"
+ CDS 1457953..1459026
+ /gene="prfA"
+ /locus_tag="BQ2027_MB1331"
+ /note="Mb1331, prfA, len: 357 aa. Equivalent to Rv1299,
+ len: 357 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 357 aa overlap). Probable prfA, peptide
+ chain release factor 1 (rf-1), highly similar to many e.g.
+ RF1_MYCLE|P45833 peptide chain release factor 1 (rf-1)
+ from Mycobacterium leprae (357 aa), FASTA scores: opt:
+ 2047, E(): 0, (89.3% identity in 356 aa overlap); also
+ similar to Mycobacterium tuberculosis Rv3105c, prfB
+ peptide chain release factor 2. Contains PS00745
+ Prokaryotic-type class I peptide chain release factors
+ signature. BELONGS TO THE PROKARYOTIC AND MITOCHONDRIAL
+ RELEASE FACTORS FAMILY. Protein product from Mb1331
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1331 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PEPTIDE CHAIN RELEASE FACTOR 1 PRFA
+ (RF-1)"
+ /protein_id="SIT99934.1"
+ /db_xref="GOA:P66017"
+ /db_xref="InterPro:IPR000352"
+ /db_xref="InterPro:IPR004373"
+ /db_xref="InterPro:IPR005139"
+ /db_xref="UniProtKB/Swiss-Prot:P66017"
+ /translation="MTQPVQTIDVLLAEHAELELALADPALHSNPAEARRVGRRFARL
+ APIVATHRKLTSARDDLETARELVASDESFAAEVAALEARVGELDAQLTDMLAPRDPH
+ DADDIVLEVKSGEGGEESALFAADLARMYIRYAERHGWAVTVLDETTSDLGGYKDATL
+ AIASKADTPDGVWSRMKFEGGVHRVQRVPVTESQGRVHTSAAGVLVYPEPEEVGQVQI
+ DESDLRIDVFRSSGKGGQGVNTTDSAVRITHLPTGIVVTCQNERSQLQNKTRALQVLA
+ ARLQAMAEEQALADASADRASQIRTVDRSERIRTYNFPENRITDHRIGYKSHNLDQVL
+ DGDLDALFDALSAADKQSRLRQS"
+ gene 1459023..1460000
+ /gene="hemK"
+ /locus_tag="BQ2027_MB1332"
+ CDS 1459023..1460000
+ /gene="hemK"
+ /locus_tag="BQ2027_MB1332"
+ /note="Mb1332, hemK, len: 325 aa. Equivalent to Rv1300,
+ len: 325 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 325 aa overlap). Probable hemK protein
+ homolog (EC 2.1.1.-), homology suggests translation may
+ start at aa 22, highly similar to many e.g.
+ HEMK_MYCLE|P45832 Mycobacterium leprae (288 aa), FASTA
+ scores: opt: 936, E(): 0, (76.7% identity in 189 aa
+ overlap). BELONGS TO THE HEMK FAMILY OF MODIFICATION
+ METHYLASES. Mb1332 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE HEMK PROTEIN HOMOLOG HEMK"
+ /protein_id="SIT99935.1"
+ /db_xref="GOA:A0A1R3XYA7"
+ /db_xref="InterPro:IPR002052"
+ /db_xref="InterPro:IPR004556"
+ /db_xref="InterPro:IPR019874"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="InterPro:IPR040758"
+ /db_xref="InterPro:IPR041698"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYA7"
+ /translation="MTSAPATMRWGNLPLAGESGTMTLRQAIDLAAALLAEAGVDSAR
+ CDAEQLAAHLAGTDRGRLPLFEPPGDEFFGRYRDIVTARARRVPLQHLIGTVSFGPVV
+ LHVGPGVFVPRPETEAILAWATAQSLPARPLIVDACTGSGALAVALAQHRANLGLKAR
+ IIGIDDSDCALDYARRNAAGTPVELVRADVTTPCLLPELDGQVDLMVSNPPYIPDAAV
+ LEPEVAQHDPHHALFGGPDGMTVISAVVGLAGRWLRPGGLFAVEHDDTTSSSTVDLVS
+ STKLFVDVQARKDLAGRPRFVTAMRWGHLPLAGENGAIDPRQRRCRAKR"
+ gene 1460016..1460669
+ /locus_tag="BQ2027_MB1333"
+ CDS 1460016..1460669
+ /locus_tag="BQ2027_MB1333"
+ /EC_number="2.7.7.87"
+ /note="Mb1333, -, len: 217 aa. Equivalent to Rv1301, len:
+ 217 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 217 aa overlap). Conserved hypothetical
+ protein, highly similar to YRFE_MYCLE|P45831 hypothetical
+ 22.7 kd protein in rfe-hemk intergenic region, (220 aa),
+ FASTA scores: opt: 1168, E(): 0, (82.8% identity in 215 aa
+ overlap). Contains PS01147 Hypothetical SUA5/yciO/yrdC
+ family signature. BELONGS TO THE SUA5/YRDC/YCIO/YWLC
+ FAMILY. Protein product from Mb1333 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1333
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Threonylcarbamoyl-AMP synthase (EC"
+ /protein_id="SIT99936.1"
+ /db_xref="GOA:A0A1R3XXY6"
+ /db_xref="InterPro:IPR006070"
+ /db_xref="InterPro:IPR017945"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXY6"
+ /translation="MTETFDCADPEQRSRGIVSAVGAIKAGQLVVMPTDTVYGIGADA
+ FDSSAVAALLSAKGRGRDMPVGVLVGSWHTIEGLVYSMPDGARELIRAFWPGALSLVV
+ VQAPSLQWDLGDAHGTVMLRMPLHPVAIELLREVGPMAVSSANISGHPPPVDAEQARS
+ QLGDHVAVYLDAGPSEQQAGSTIVDLTGATPRVLRQGPVSTERIAEVLGVDAASLFG"
+ gene 1460753..1461967
+ /gene="rfe"
+ /locus_tag="BQ2027_MB1334"
+ CDS 1460753..1461967
+ /gene="rfe"
+ /locus_tag="BQ2027_MB1334"
+ /note="Mb1334, rfe, len: 404 aa. Equivalent to Rv1302,
+ len: 404 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 404 aa overlap). Putative rfe,
+ undecaprenyl-phosphate
+ alpha-N-acetylglucosaminyltransferase (EC 2.4.1.-),
+ equivalent to RFE_MYCLE|P45830 Mycobacterium leprae (398
+ aa), FASTA scores, opt: 2285, E(): 0, (89.2% identity in
+ 398 aa overlap). Protein product from Mb1334 detected
+ using SWATH mass spectrometry. Mb1334 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable undecapaprenyl-phosphate
+ alpha-n-acetylglucosaminyltransferase rfe (udp-glcnac
+ transferase)"
+ /protein_id="SIT99937.1"
+ /db_xref="GOA:A0A1R3XXY8"
+ /db_xref="InterPro:IPR000715"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXY8"
+ /translation="MQYGLEVSSDVAGVAGGLLALSYRGAGVPLRELALVGLTAAIIT
+ YFATGPVRMLASRLGAVAYPRERDVHVTPTPRMGGLAMFLGIVGAVFLASQLPALTRG
+ FVYSTGMPAVLVAGAVIMGIGLIDDRWGLDALTKFAGQITAASVLVTMGVAWSVLYIP
+ VGGVGTIVLDQASSILLTLALTVSIVNAMNFVDGLDGLAAGLGLITALAICMFSVGLL
+ RDHGGDVLYYPPAVISVVLAGACLGFLPHNFHRAKIFMGDSGSMLIGLMLAAASTTAA
+ GPISQNAYGARDVFALLSPFLLVVAVMFVPMLDLLLAIVRRTRAGRSAFSPDKMHLHH
+ RLLQIGHSHRRVVLIIYLWVGIGAFGAASSIFFNPRDTAAVMLGAIVVAGVATLIPLL
+ RRGDDYYDPDLD"
+ gene 1462224..1462709
+ /locus_tag="BQ2027_MB1335"
+ CDS 1462224..1462709
+ /locus_tag="BQ2027_MB1335"
+ /note="Mb1335, -, len: 161 aa. Equivalent to Rv1303, len:
+ 161 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 161 aa overlap). Conserved hypothetical
+ transmembrane protein, highly similar to P53431|Y02N_MYCLE
+ hypothetical Mycobacterium leprae protein (153 aa), FASTA
+ score: opt: 636, E():0, (69.8% identity in 149 aa
+ overlap). Protein product from Mb1335 detected using SWATH
+ mass spectrometry. Mb1335 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ATP synthase protein I"
+ /protein_id="SIT99938.1"
+ /db_xref="GOA:P64802"
+ /db_xref="InterPro:IPR005598"
+ /db_xref="UniProtKB/Swiss-Prot:P64802"
+ /translation="MTTPAQDAPLVFPSVAFRPVRLFFINVGLAAVAMLVAGVFGHLT
+ VGMFLGLGLLLGLLNALLVRRSAESITAKEHPLKRSMALNSASRLAIITILGLIIAYI
+ FRPAGLGVVFGLAFFQVLLVATTALPVLKKLRTATEEPVATYSSNGQTGGSEGRSASD
+ D"
+ gene 1462702..1463454
+ /gene="atpB"
+ /locus_tag="BQ2027_MB1336"
+ CDS 1462702..1463454
+ /gene="atpB"
+ /locus_tag="BQ2027_MB1336"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1336, atpB, len: 250 aa. Equivalent to Rv1304,
+ len: 250 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 250 aa overlap). Probable atpB, ATP
+ synthase A chain (EC 3.6.3.14), highly similar to
+ ATP6_MYCLE|P45829 Mycobacterium leprae (251 aa), FASTA
+ scores: opt: 1382, E(): 0, (84.0% identity in 250 aa
+ overlap). Contains PS00449 ATP synthase A subunit
+ signature. SUBUNIT: F-TYPE ATPASES HAVE 2 COMPONENTS,
+ CF(1) - THE CATALYTIC CORE - AND CF(0) - THE MEMBRANE
+ PROTON CHANNEL. CF(1) HAS FIVE SUBUNITS: ALPHA(3),
+ BETA(3), GAMMA(1), DELTA(1), EPSILON(1). CF(0) HAS THREE
+ MAIN SUBUNITS: A, B AND C. BELONGS TO THE ATPASE A CHAIN
+ FAMILY. Protein product from Mb1336 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1336
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ATP SYNTHASE A CHAIN ATPB (PROTEIN 6)"
+ /protein_id="SIT99939.1"
+ /db_xref="GOA:P63655"
+ /db_xref="InterPro:IPR000568"
+ /db_xref="InterPro:IPR023011"
+ /db_xref="InterPro:IPR035908"
+ /db_xref="UniProtKB/Swiss-Prot:P63655"
+ /translation="MTETILAAQIEVGEHHTATWLGMTVNTDTVLSTAIAGLIVIALA
+ FYLRAKVTSTDVPGGVQLFFEAITIQMRNQVESAIGMRIAPFVLPLAVTIFVFILISN
+ WLAVLPVQYTDKHGHTTELLKSAAADINYVLALALFVFVCYHTAGIWRRGIVGHPIKL
+ LKGHVTLLAPINLVEEVAKPISLSLRLFGNIFAGGILVALIALFPPYIMWAPNAIWKA
+ FDLFVGAIQAFIFALLTILYFSQAMELEEEHH"
+ gene 1463503..1463748
+ /gene="atpE"
+ /locus_tag="BQ2027_MB1337"
+ CDS 1463503..1463748
+ /gene="atpE"
+ /locus_tag="BQ2027_MB1337"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1337, atpE, len: 81 aa. Equivalent to Rv1305,
+ len: 81 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 81 aa overlap). Probable atpE, ATP
+ synthase C chain (EC 3.6.3.14), highly similar to
+ P45828|ATPL_MYCLE Mycobacterium leprae (92.6% identity in
+ 81 aa overlap). Contains PS00605 ATP synthase C subunit
+ signature. SUBUNIT: F-TYPE ATPASES HAVE 2 COMPONENTS,
+ CF(1) - THE CATALYTIC CORE - AND CF(0) - THE MEMBRANE
+ PROTON CHANNEL. CF(1) HAS FIVE SUBUNITS: ALPHA(3),
+ BETA(3), GAMMA(1), DELTA(1), EPSILON(1). CF(0) HAS THREE
+ MAIN SUBUNITS: A, B AND C. BELONGS TO THE ATPASE C CHAIN
+ FAMILY. Protein product from Mb1337 detected using shotgun
+ mass spectrometry. Mb1337 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ATP SYNTHASE C CHAIN ATPE
+ (LIPID-BINDING PROTEIN) (DICYCLOHEXYLCARBODIIMIDE-BINDING
+ PROTEIN)"
+ /protein_id="SIT99940.1"
+ /db_xref="GOA:P63692"
+ /db_xref="InterPro:IPR000454"
+ /db_xref="InterPro:IPR002379"
+ /db_xref="InterPro:IPR005953"
+ /db_xref="InterPro:IPR020537"
+ /db_xref="InterPro:IPR035921"
+ /db_xref="InterPro:IPR038662"
+ /db_xref="UniProtKB/Swiss-Prot:P63692"
+ /translation="MDPTIAAGALIGGGLIMAGGAIGAGIGDGVAGNALISGVARQPE
+ AQGRLFTPFFITVGLVEAAYFINLAFMALFVFATPVK"
+ gene 1463779..1464294
+ /gene="atpF"
+ /locus_tag="BQ2027_MB1338"
+ CDS 1463779..1464294
+ /gene="atpF"
+ /locus_tag="BQ2027_MB1338"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1338, atpF, len: 171 aa. Equivalent to Rv1306,
+ len: 171 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 171 aa overlap). Probable atpF, ATP
+ synthase B chain (EC 3.6.3.14), highly similar to
+ ATPF_MYCLE P45827 (170 aa), FASTA scores, opt: 802, E():
+ 0, (79.5% identity in 171 aa overlap). SUBUNIT: F-TYPE
+ ATPASES HAVE 2 COMPONENTS, CF(1) - THE CATALYTIC CORE -AND
+ CF(0) -THE MEMBRANE PROTON CHANNEL. CF(1) HAS FIVE
+ SUBUNITS: ALPHA(3), BETA(3), GAMMA(1), DELTA(1),
+ EPSILON(1). CF(0) HAS THREE MAIN SUBUNITS: A, B AND C.
+ BELONGS TO THE ATPASE B CHAIN FAMILY. Protein product from
+ Mb1338 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1338 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ATP SYNTHASE B CHAIN ATPF"
+ /protein_id="SIT99941.1"
+ /db_xref="GOA:P63657"
+ /db_xref="InterPro:IPR002146"
+ /db_xref="InterPro:IPR028987"
+ /db_xref="UniProtKB/Swiss-Prot:P63657"
+ /translation="MGEVSAIVLAASQAAEEGGESSNFLIPNGTFFVVLAIFLVVLAV
+ IGTFVVPPILKVLRERDAMVAKTLADNKKSDEQFAAAQADYDEAMTEARVQASSLRDN
+ ARADGRKVIEDARVRAEQQVASTLQTAHEQLKRERDAVELDLRAHVGTMSATLASRIL
+ GVDLTASAATR"
+ gene 1464301..1465641
+ /gene="atpH"
+ /locus_tag="BQ2027_MB1339"
+ CDS 1464301..1465641
+ /gene="atpH"
+ /locus_tag="BQ2027_MB1339"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1339, atpH, len: 446 aa. Equivalent to Rv1307,
+ len: 446 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 446 aa overlap). Probable atpH, ATP
+ synthase delta chain (EC 3.6.3.14). This protein is much
+ longer than that of other bacterial delta chains, the
+ C-terminal region is homologous to delta chains while the
+ N-terminal region is similar to B/B' subunits e.g.
+ ATPD_STRLI|P50008 ATP synthase delta chain from
+ Streptomyces lividans (273 aa), FASTA scores: opt: 505,
+ E(): 5.4e-23, (35.0% identity in 277 aa overlap); and
+ ATPF_HAEIN|P43720 ATP synthase B chain (EC 3.6.1.34) from
+ Haemophilus influenzae (156 aa), FASTA scores: opt: 216,
+ E(): 1.2e-06, (26.1% identity in 153 aa overlap). SUBUNIT:
+ F-TYPE ATPASES HAVE 2 COMPONENTS, CF(1) - THE CATALYTIC
+ CORE - AND CF(0) - THE MEMBRANE PROTON CHANNEL. CF(1) HAS
+ FIVE SUBUNITS: ALPHA(3), BETA(3), GAMMA(1), DELTA(1),
+ EPSILON(1). CF(0) HAS THREE MAIN SUBUNITS: A, B AND C.
+ BELONGS TO THE ATPASE DELTA CHAIN FAMILY. Protein product
+ from Mb1339 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1339 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ATP SYNTHASE DELTA CHAIN ATPH"
+ /protein_id="SIT99942.1"
+ /db_xref="GOA:P0A501"
+ /db_xref="InterPro:IPR000711"
+ /db_xref="InterPro:IPR002146"
+ /db_xref="InterPro:IPR005864"
+ /db_xref="InterPro:IPR028987"
+ /db_xref="UniProtKB/Swiss-Prot:P0A501"
+ /translation="MSTFIGQLFGFAVIVYLVWRFIVPLVGRLMSARQDTVRQQLADA
+ AAAADRLAEASQAHTKALEDAKSEAHRVVEEARTDAERIAEQLEAQADVEAERIKMQG
+ ARQVDLIRAQLTRQLRLELGHESVRQARELVRNHVADQAQQSATVDRFLDQLDAMAPA
+ TADVDYPLLAKMRSASRRALTSLVDWFGTMAQDLDHQGLTTLAGELVSVARLLDREAV
+ VTRYLTVPAEDATPRIRLIERLVSGKVGAPTLEVLRTAVSKRWSANSDLIDAIEHVSR
+ QALLELAERAGQVDEVEDQLFRFSRILDVQPRLAILLGDCAVPAEGRVRLLRKVLERA
+ DSTVNPVVVALLSHTVELLRGQAVEEAVLFLAEVAVARRGEIVAQVGAAAELSDAQRT
+ RLTEVLSRIYGHPVTVQLHIDAALLGGLSIAVGDEVIDGTLSSRLAAAEARLPD"
+ gene 1465686..1467335
+ /gene="atpA"
+ /locus_tag="BQ2027_MB1340"
+ CDS 1465686..1467335
+ /gene="atpA"
+ /locus_tag="BQ2027_MB1340"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1340, atpA, len: 549 aa. Equivalent to Rv1308,
+ len: 549 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 549 aa overlap). Probable atpA, ATP
+ synthase alpha chain (EC 3.6.3.14), highly similar to
+ ATPA_MYCLE|P45825 from Mycobacterium leprae (558 aa),
+ FASTA scores: opt: 3233, E(): 0, (90.3% identity in 547 aa
+ overlap). Contains PS00017 ATP/GTP-binding site motif A,
+ PS00152 ATP synthase alpha and beta subunits signature.
+ SUBUNIT: F-TYPE ATPASES HAVE 2 COMPONENTS, CF(1) - THE
+ CATALYTIC CORE - AND CF(0) - THE MEMBRANE PROTON CHANNEL.
+ CF(1) HAS FIVE SUBUNITS: ALPHA(3), BETA(3), GAMMA(1),
+ DELTA(1), EPSILON(1). CF(0) HAS THREE MAIN SUBUNITS: A, B
+ AND C. BELONGS TO THE ATPASE ALPHA/BETA CHAINS FAMILY.
+ Protein product from Mb1340 detected using shotgun mass
+ spectrometry. Mb1340 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ATP SYNTHASE ALPHA CHAIN ATPA"
+ /protein_id="SIT99943.1"
+ /db_xref="GOA:P63674"
+ /db_xref="InterPro:IPR000194"
+ /db_xref="InterPro:IPR000793"
+ /db_xref="InterPro:IPR004100"
+ /db_xref="InterPro:IPR005294"
+ /db_xref="InterPro:IPR020003"
+ /db_xref="InterPro:IPR023366"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR033732"
+ /db_xref="InterPro:IPR036121"
+ /db_xref="InterPro:IPR038376"
+ /db_xref="UniProtKB/Swiss-Prot:P63674"
+ /translation="MAELTIPADDIQSAIEEYVSSFTADTSREEVGTVVDAGDGIAHV
+ EGLPSVMTQELLEFPGGILGVALNLDEHSVGAVILGDFENIEEGQQVKRTGEVLSVPV
+ GDGFLGRVVNPLGQPIDGRGDVDSDTRRALELQAPSVVHRQGVKEPLQTGIKAIDAMT
+ PIGRGQRQLIIGDRKTGKTAVCVDTILNQRQNWESGDPKKQVRCVYVAIGQKGTTIAA
+ VRRTLEEGGAMDYTTIVAAAASESAGFKWLAPYTGSAIAQHWMYEGKHVLIIFDDLTK
+ QAEAYRAISLLLRRPPGREAYPGDVFYLHSRLLERCAKLSDDLGGGSLTGLPIIETKA
+ NDISAYIPTNVISITDGQCFLETDLFNQGVRPAINVGVSVSRVGGAAQIKAMKEVAGS
+ LRLDLSQYRELEAFAAFASDLDAASKAQLERGARLVELLKQPQSQPMPVEEQVVSIFL
+ GTGGHLDSVPVEDVRRFETELLDHMRASEEEILTEIRDSQKLTEEAADKLTEVIKNFK
+ KGFAATGGGSVVPDEHVEALDEDKLAKEAVKVKKPAPKKKK"
+ gene 1467342..1468259
+ /gene="atpG"
+ /locus_tag="BQ2027_MB1341"
+ CDS 1467342..1468259
+ /gene="atpG"
+ /locus_tag="BQ2027_MB1341"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1341, atpG, len: 305 aa. Equivalent to Rv1309,
+ len: 305 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 305 aa overlap). Probable atpG, ATP
+ synthase gamma chain (EC 3.6.3.14), highly similar to
+ ATPG_MYCLE|P45824 ATP synthase gamma chain from
+ Mycobacterium leprae (298 aa), FASTA scores: opt: 1579,
+ E():0, (83.9% identity in 305 aa overlap). Contains
+ PS00153 ATP synthase gamma subunit signature. SUBUNIT:
+ F-TYPE ATPASES HAVE 2 COMPONENTS, CF(1) - THE CATALYTIC
+ CORE - AND CF(0) - THE MEMBRANE PROTON CHANNEL. CF(1) HAS
+ FIVE SUBUNITS: ALPHA(3), BETA(3), GAMMA(1), DELTA(1),
+ EPSILON(1). CF(0) HAS THREE MAIN SUBUNITS: A, B AND C.
+ BELONGS TO THE ATPASE GAMMA CHAIN FAMILY. Protein product
+ from Mb1341 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1341 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ATP SYNTHASE GAMMA CHAIN ATPG"
+ /protein_id="SIT99944.1"
+ /db_xref="GOA:P63672"
+ /db_xref="InterPro:IPR000131"
+ /db_xref="InterPro:IPR023632"
+ /db_xref="InterPro:IPR035968"
+ /db_xref="UniProtKB/Swiss-Prot:P63672"
+ /translation="MAATLRELRGRIRSAGSIKKITKAQELIATSRIARAQARLESAR
+ PYAFEITRMLTTLAAEAALDHPLLVERPEPKRAGVLVVSSDRGLCGAYNANIFRRSEE
+ LFSLLREAGKQPVLYVVGRKAQNYYSFRNWNITESWMGFSEQPTYENAAEIASTLVDA
+ FLLGTDNGEDQRSDSGEGVDELHIVYTEFKSMLSQSAEAHRIAPMVVEYVEEDIGPRT
+ LYSFEPDATMLFESLLPRYLTTRVYAALLESAASELASRQRAMKSATDNADDLIKALT
+ LMANRERQAQITQEISEIVGGANALAEAR"
+ gene 1468299..1469759
+ /gene="atpD"
+ /locus_tag="BQ2027_MB1342"
+ CDS 1468299..1469759
+ /gene="atpD"
+ /locus_tag="BQ2027_MB1342"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1342, atpD, len: 486 aa. Equivalent to Rv1310,
+ len: 486 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 486 aa overlap). Probable atpD, ATP
+ synthase beta chain (EC 3.6.3.14), highly similar to
+ ATPB_MYCLE|P45823 Mycobacterium leprae (485 aa), FASTA
+ score: opt: 2916, E(): 0, (92.6% identity in 484 aa
+ overlap). Contains PS00017 ATP/GTP-binding site motif A,
+ PS00152 ATP synthase alpha and beta subunits signature.
+ SUBUNIT: F-TYPE ATPASES HAVE 2 COMPONENTS, CF(1) - THE
+ CATALYTIC CORE - AND CF(0) - THE MEMBRANE PROTON CHANNEL.
+ CF(1) HAS FIVE SUBUNITS: ALPHA(3), BETA(3), GAMMA(1),
+ DELTA(1), EPSILON(1). CF(0) HAS THREE MAIN SUBUNITS: A, B
+ AND C. BELONGS TO THE ATPASE ALPHA/BETA CHAINS FAMILY.
+ Protein product from Mb1342 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1342 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ATP SYNTHASE BETA CHAIN ATPD"
+ /protein_id="SIT99945.1"
+ /db_xref="GOA:P63678"
+ /db_xref="InterPro:IPR000194"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR004100"
+ /db_xref="InterPro:IPR005722"
+ /db_xref="InterPro:IPR020003"
+ /db_xref="InterPro:IPR024034"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036121"
+ /db_xref="UniProtKB/Swiss-Prot:P63678"
+ /translation="MTTTAEKTDRPGKPGSSDTSGRVVRVTGPVVDVEFPRGSIPELF
+ NALHAEITFESLAKTLTLEVAQHLGDNLVRTISLQPTDGLVRGVEVIDTGRSISVPVG
+ EGVKGHVFNALGDCLDEPGYGEKFEHWSIHRKPPAFEELEPRTEMLETGLKVVDLLTP
+ YVRGGKIALFGGAGVGKTVLIQEMINRIARNFGGTSVFAGVGERTREGNDLWVELAEA
+ NVLKDTALVFGQMDEPPGTRMRVALSALTMAEWFRDEQGQDVLLFIDNIFRFTQAGSE
+ VSTLLGRMPSAVGYQPTLADEMGELQERITSTRGRSITSMQAVYVPADDYTDPAPATT
+ FAHLDATTELSRAVFSKGIFPAVDPLASSSTILDPSVVGDEHYRVAQEVIRILQRYKD
+ LQDIIAILGIDELSEEDKQLVNRARRIERFLSQNMMAAEQFTGQPGSTVPVKETIEAF
+ DRLCKGDFDHVPEQAFFLIGGLDDLAKKAESLGAKL"
+ gene 1469773..1470138
+ /gene="atpC"
+ /locus_tag="BQ2027_MB1343"
+ CDS 1469773..1470138
+ /gene="atpC"
+ /locus_tag="BQ2027_MB1343"
+ /note="Mb1343, atpC, len: 121 aa. Equivalent to Rv1311,
+ len: 121 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 121 aa overlap). Probable atpC, ATP
+ synthase epsilon chain (EC 3.6.3.14), highly similar to
+ ATPE_MYCLE|P45822 Mycobacterium leprae (124 aa), FASTA
+ scores: opt: 682, E(): 5.4e-40, (87.6% identity in 121 aa
+ overlap). SUBUNIT: F-TYPE ATPASES HAVE 2 COMPONENTS, CF(1)
+ - THE CATALYTIC CORE - AND CF(0) - THE MEMBRANE PROTON
+ CHANNEL. CF(1) HAS FIVE SUBUNITS: ALPHA(3), BETA(3),
+ GAMMA(1), DELTA(1), EPSILON(1). CF(0) HAS THREE MAIN
+ SUBUNITS: A, B AND C. BELONGS TO THE ATPASE EPSILON CHAIN
+ FAMILY. Protein product from Mb1343 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1343
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ATP SYNTHASE EPSILON CHAIN ATPC"
+ /protein_id="SIT99946.1"
+ /db_xref="GOA:P63663"
+ /db_xref="InterPro:IPR001469"
+ /db_xref="InterPro:IPR020546"
+ /db_xref="InterPro:IPR036771"
+ /db_xref="UniProtKB/Swiss-Prot:P63663"
+ /translation="MAELNVEIVAVDRNIWSGTAKFLFTRTTVGEIGILPRHIPLVAQ
+ LVDDAMVRVEREGEKDLRIAVDGGFLSVTEEGVSILAESAEFESEIDEAAAKQDSESD
+ DPRIAARGRARLRAVGAID"
+ gene 1470146..1470580
+ /locus_tag="BQ2027_MB1344"
+ CDS 1470146..1470580
+ /locus_tag="BQ2027_MB1344"
+ /note="Mb1344, -, len: 144 aa. Equivalent to Rv1312, len:
+ 147 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 142 aa overlap). Conserved hypothetical
+ secreted protein with potential N-terminal signal
+ sequence. Highly similar to P53432|Y02W_MYCLE hypothetical
+ Mycobacterium leprae protein (147 aa), FASTA score: opt:
+ 884, E(): 0, (88.4% identity in 147 aa overlap).
+ N-terminus hydrophobic. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 2 bp deletion (cg-*) at the 3' end
+ leads to a slightly shorter product compared to
+ Mycobacterium tuberculosis strain H37Rv (144 aa versus 147
+ aa). Protein product from Mb1344 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1344
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL SECRETED PROTEIN"
+ /protein_id="SIT99947.1"
+ /db_xref="GOA:A0A1R3XXZ8"
+ /db_xref="InterPro:IPR019675"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XXZ8"
+ /translation="MSVPMIGMVVLVVVLGLAVLALSYRLWKLRQGGTAGIMRDIPAV
+ GGHGWRHGVIRYRGGEAAFYRLSSLRLWPDRRLSRRGVEIISRRAPRGDEFDIMTDEI
+ VVVELCDSTQDRRVGYEIALDRGALTAFLSWLESRPSPRAPP"
+ gene complement(1470598..1472097)
+ /locus_tag="BQ2027_IS1557-2"
+ mobile_element complement(1470598..1472097)
+ /locus_tag="BQ2027_IS1557-2"
+ /note="IS1557-2, len: 1498 nt. Equivalent to IS1557, len:
+ 1509 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(99.4% identity in 785 nt overlap). IS1557-2nd
+ copy."
+ /mobile_element_type="insertion sequence:IS1557"
+ repeat_region 1470598..1470617
+ /note="20 bp imperfect inverted repeat,
+ IRR,AGCAGACGCAAAAGCCCCCA, flanking IS element IS1557."
+ /rpt_type=INVERTED
+ gene complement(1470627..1471310)
+ /locus_tag="BQ2027_MB1345C"
+ /pseudo
+ CDS complement(1470627..1471310)
+ /locus_tag="BQ2027_MB1345C"
+ /note="Mb1345c, -, len: 243 aa. Equivalent to 3' end of
+ Rv1313c, len: 444 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 243 aa overlap). Possible
+ IS1557 transposase, similar to several transposases e.g.
+ U57649|DBU57649 ORF1 from dibenzofuran-degrading bacterium
+ DPO360 (163 aa), FASTA scores: opt: 767, E(): 0, (67.3%
+ identity in 168 aa overlap); TNPA_BORPA|Q06126 transposase
+ for insertion sequence element IS1001 from Bordetella
+ parapertussis (406 aa), FASTA scores: opt: 254, E():
+ 3.3e-10, (24.9% identity in 402 aa overlap). Also similar
+ to putative Mycobacterium tuberculosis transposases,
+ Rv3798 and Rv0741. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1313c exists as
+ a single gene. In Mycobacterium bovis, a frameshift due to
+ a 12 bp to 1 bp substitution (cttgtcgtggcc-t) splits
+ Rv1313c into 2 parts, Mb1345c and Mb1346c.;POSSIBLE
+ TRANSPOSASE [SECOND PART]"
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene complement(1471333..1471950)
+ /locus_tag="BQ2027_MB1346C"
+ CDS complement(1471333..1471950)
+ /locus_tag="BQ2027_MB1346C"
+ /note="Mb1346c, -, len: 205 aa. Equivalent to 5' end of
+ Rv1313c, len: 444 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.5% identity in 195 aa overlap). Possible
+ IS1557 transposase, similar to several transposases e.g.
+ U57649|DBU57649 ORF1 from dibenzofuran-degrading bacterium
+ DPO360 (163 aa), FASTA scores: opt: 767, E(): 0, (67.3%
+ identity in 168 aa overlap); TNPA_BORPA|Q06126 transposase
+ for insertion sequence element IS1001 from Bordetella
+ parapertussis (406 aa), FASTA scores: opt: 254, E():
+ 3.3e-10, (24.9% identity in 402 aa overlap). Also similar
+ to putative Mycobacterium tuberculosis transposases,
+ Rv3798 and Rv0741. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1313c exists as
+ a single gene. In Mycobacterium bovis, a frameshift due to
+ a 12 bp to 1 bp substitution (cttgtcgtggcc-t) splits
+ Rv1313c into 2 parts, Mb1345c and Mb1346c. Mb1346c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSPOSASE [FIRST PART]"
+ /protein_id="SIT99949.1"
+ /db_xref="InterPro:IPR002560"
+ /db_xref="InterPro:IPR029261"
+ /db_xref="InterPro:IPR032877"
+ /db_xref="UniProtKB/TrEMBL:A0A0G2QBZ2"
+ /translation="MRNVRLFRALLGVDKRTVIEDIEFEEDDAGDGARVIARVRPRSA
+ VLRRCGRCGRKASWYDRGAGLRQWRSLDWGTVEVFLEAEAPRVNCPTHGPTVVAVPWA
+ RHHAGHTYAFDDTVAWLAVACSKTAVCELMRIAWRTVGAIVARVWADTEKRIDRFANL
+ RRIGIDEISYKRHHRYLTVVVDHDSGRLVWAAPSHPGLVLRCPGR"
+ repeat_region complement(1472078..1472097)
+ /locus_tag="BQ2027_IS1557-2"
+ /note="20 bp imperfect inverted repeat,
+ IRL,AGCAGACGCGAAAGCCCCCA, flanking IS element IS1557."
+ /rpt_type=INVERTED
+ gene complement(1472116..1472697)
+ /locus_tag="BQ2027_MB1347C"
+ CDS complement(1472116..1472697)
+ /locus_tag="BQ2027_MB1347C"
+ /EC_number="2.5.1.17"
+ /note="Mb1347c, -, len: 193 aa. Equivalent to Rv1314c,
+ len: 193 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 193 aa overlap). Conserved hypothetical
+ protein, highly similar to P53523|Y02Y_MYCLE hypothetical
+ Mycobacterium leprae protein (191 aa), FASTA score:
+ opt:1019, E(): 0, (81.2% identity in 191 aa overlap). Some
+ similarity with YDHW_CITFR|P45515 hypothetical 19.8 kd
+ protein in dhar-dhat intergenic region (176 aa), FASTA
+ scores: opt: 297, E(): 1.6e-13, (37.6% identity in 178 aa
+ overlap). Also similar to hypothetical protein
+ AE002007|AE002007_3 Deinococcus radiodurans (185 aa),
+ FASTA score: opt: 386, E(): 7.7e-19, (42.4% identity in
+ 172 aa overlap). Protein product from Mb1347c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1347c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ATP:Cob(I)alamin adenosyltransferase (EC"
+ /protein_id="SIT99950.1"
+ /db_xref="GOA:P64804"
+ /db_xref="InterPro:IPR016030"
+ /db_xref="InterPro:IPR029499"
+ /db_xref="InterPro:IPR036451"
+ /db_xref="UniProtKB/Swiss-Prot:P64804"
+ /translation="MAVHLTRIYTRTGDDGTTGLSDMSRVAKTDARLVAYADCDEANA
+ AIGAALALGHPDTQITDVLRQIQNDLFDAGADLSTPIVENPKHPPLRIAQSYIDRLEG
+ WCDAYNAGLPALKSFVLPGGSPLSALLHVARTVVRRAERSAWAAVDAHPEGVSVLPAK
+ YLNRLSDLLFILSRVANPDGDVLWRPGGDRTAS"
+ gene 1472766..1474022
+ /gene="murA"
+ /locus_tag="BQ2027_MB1348"
+ CDS 1472766..1474022
+ /gene="murA"
+ /locus_tag="BQ2027_MB1348"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1348, murA, len: 418 aa. Equivalent to Rv1315,
+ len: 418 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 418 aa overlap). Probable murA,
+ UDP-N-acetylglucosamine 1-carboxyvinyltransferase (EC
+ 2.5.1.7), highly similar to many e.g. MURA_MYCLE|P45821
+ (418 aa), FASTA scores: opt: 2495, E(): 0, (96.2% identity
+ in 396 aa overlap). BELONGS TO THE EPSP SYNTHASE FAMILY.
+ MURA SUBFAMILY. Protein product from Mb1348 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1348 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE UDP-N-ACETYLGLUCOSAMINE
+ 1-CARBOXYVINYLTRANSFERASE MURA"
+ /protein_id="SIT99951.1"
+ /db_xref="GOA:P0A5L3"
+ /db_xref="InterPro:IPR001986"
+ /db_xref="InterPro:IPR005750"
+ /db_xref="InterPro:IPR013792"
+ /db_xref="InterPro:IPR036968"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5L3"
+ /translation="MAERFVVTGGNRLSGEVAVGGAKNSVLKLMAATLLAEGTSTITN
+ CPDILDVPLMAEVLRGLGATVELDGDVARITAPDEPKYDADFAAVRQFRASVCVLGPL
+ VGRCKRARVALPGGDAIGSRPLDMHQAGLRQLGAHCNIEHGCVVARAETLRGAEIQLE
+ FPSVGATENILMAAVVAEGVTTIHNAAREPDVVDLCTMLNQMGAQVEGAGSPTMTITG
+ VPRLHPTEHRVIGDRIVAATWGIAAAMTRGDISVAGVDPAHLQLVLHKLHDAGATVTQ
+ TDASFRVTQYERPKAVNVATLPFPGFPTDLQPMAIALASIADGTSMITENVFEARFRF
+ VEEMIRLGADARTDGHHAVVRGLPQLSSAPVWCSDIRAGAGLVLAGLVADGDTEVHDV
+ FHIDRGYPLFVENLVSLGAEIERVCC"
+ gene 1474291..1475827
+ /gene="rrs"
+ /locus_tag="BQ2027_RRS"
+ rRNA 1474291..1475827
+ /gene="rrs"
+ /locus_tag="BQ2027_RRS"
+ /product="ribosomal RNA 16S"
+ /note="rrs, len: 1537 nt. Equivalent to rrs, len: 1537 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 1537 nt overlap). 16s rRNA gene."
+ gene 1476103..1479240
+ /gene="rrl"
+ /locus_tag="BQ2027_RRL"
+ rRNA 1476103..1479240
+ /gene="rrl"
+ /locus_tag="BQ2027_RRL"
+ /product="ribosomal RNA 23S"
+ /note="rrl, len: 3138 nt. Equivalent to rrl, len: 3138 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 3138 nt overlap). 23S rRNA gene (approximate
+ coordinates)."
+ gene 1479344..1479458
+ /gene="rrf"
+ /locus_tag="BQ2027_RRF"
+ rRNA 1479344..1479458
+ /gene="rrf"
+ /locus_tag="BQ2027_RRF"
+ /product="ribosomal RNA 5S"
+ /note="rrf, len: 115 nt. Equivalent to rrf, len: 115 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 115 nt overlap). 5S rRNA gene. Identical to
+ Em_ba:MT5SRR, D10035 M.tuberculosis 5S rRNA, len: 116 nt."
+ gene complement(1479578..1480075)
+ /gene="ogt"
+ /locus_tag="BQ2027_MB1349C"
+ CDS complement(1479578..1480075)
+ /gene="ogt"
+ /locus_tag="BQ2027_MB1349C"
+ /note="Mb1349c, ogt, len: 165 aa. Equivalent to Rv1316c,
+ len: 165 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 165 aa overlap). Probable ogt,
+ methylated-dna--protein-cysteine methytransferase (EC
+ 2.1.1.63), similar to many e.g. OGT_HAEIN|P44687
+ Haemophilus influenzae (190 aa), FASTA scores: opt: 405,
+ E(): 6.5e-20, (41.9% identity in 155 aa overlap). Contains
+ PS00374 Methylated-DNA--protein-cysteine methyltransferase
+ active site. Protein product from Mb1349c detected using
+ SWATH mass spectrometry. Mb1349c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="methylated-dna--protein-cysteine
+ methyltransferase ogt (6-o-methylguanine-dna
+ methyltransferase)
+ (o-6-methylguanine-dna-alkyltransferase)"
+ /protein_id="SIT99952.1"
+ /db_xref="GOA:P0A697"
+ /db_xref="InterPro:IPR001497"
+ /db_xref="InterPro:IPR008332"
+ /db_xref="InterPro:IPR014048"
+ /db_xref="InterPro:IPR023546"
+ /db_xref="InterPro:IPR036217"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036631"
+ /db_xref="UniProtKB/Swiss-Prot:P0A697"
+ /translation="MIHYRTIDSPIGPLTLAGHGSVLTNLRMLEQTYEPSRTHWTPDP
+ GAFSGAVDQLNAYFAGELTEFDVELDLRGTDFQQRVWKALLTIPYGETRSYGEIADQI
+ GAPGAARAVGLANGHNPIAIIVPCHRVIGASGKLTGYGGGINRKRALLELEKSRAPAD
+ LTLFD"
+ gene complement(1480072..1481322)
+ /gene="alkAb"
+ /locus_tag="BQ2027_MB1350C"
+ CDS complement(1480072..1481322)
+ /gene="alkAb"
+ /locus_tag="BQ2027_MB1350C"
+ /note="Mb1350c, alkAb, len: 416 aa. Equivalent to the 3'
+ end of Rv1317c, len: 496 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100% identity in 416 aa
+ overlap). Putative alkA (alternate gene name: ada),
+ regulatory protein (EC 2.1.1.63), similar to
+ 3MG2_ECOLI|P04395 dna-3-methyladenine glycosidase II from
+ Escherichia coli (282 aa), FASTA scores, opt: 437, E():
+ 8.6e-22, (32.8% identity in 293 aa overlap), also similar
+ to other ada proteins e.g. ADA_SALTY|P26189 Salmonella
+ typhimurium (352 aa), FASTA scores: E(): 5.3e-08, (35.9%
+ identity in 156 aa overlap). Contains PS00041 Bacterial
+ regulatory proteins, araC family signature.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, alkA exists as a single gene.
+ In Mycobacterium bovis, a single base transition (g-a)
+ introduces a premature stop codon that splits alkA into 2
+ parts, alkAa and alkAb. Mb1350c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE ADA REGULATORY PROTEIN ALKAb [SECOND
+ PART] (Regulatory protein of adaptative response) :
+ Methylated-DNA--protein-cysteine methyltransferase
+ (O-6-methylguanine-DNA alkyltransferase)"
+ /protein_id="SIT99953.1"
+ /db_xref="GOA:A0A1R3Y043"
+ /db_xref="InterPro:IPR003265"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR010316"
+ /db_xref="InterPro:IPR011257"
+ /db_xref="InterPro:IPR018060"
+ /db_xref="InterPro:IPR018062"
+ /db_xref="InterPro:IPR023170"
+ /db_xref="InterPro:IPR037046"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y043"
+ /translation="MRSDVVARAMRLIADGTVDRDGVSGLAAQLGYTIRQLERLLQAV
+ VGAGPLALARAQRMQTARVLIETTNLPFGDVAFAAGFSSIRQFNDTVRLACDGTPTAL
+ RARAAARFESATASAGTVSLRLPVRAPFAFEGVFGHLAATAVPGCEEVRDGAYRRTLR
+ LPWGNGIVSLTPAPDHVRCLLVLDDFRDLMTATARCRRLLDLDADPEAIVEALGADPD
+ LRAVVGKAPGQRIPRTVDEAEFAVRAVLAQQVSTKAASTHAGRLVAAYGRPVHDRHGA
+ LTHTFPSIEQLAEIDPGHLAVPKARQRTINALVASLADKSLVLDAGCDWQRARGQLLA
+ LPGVGPWTAEVIAMRGLGDPDAFPASDLGLRLAAKKLGLPAQRRALTVHSARWRPWRS
+ YATQHLWTTLEHPVNQWPPQEKIA"
+ gene complement(1481326..1481562)
+ /gene="alkAa"
+ /locus_tag="BQ2027_MB1351C"
+ CDS complement(1481326..1481562)
+ /gene="alkAa"
+ /locus_tag="BQ2027_MB1351C"
+ /note="Mb1351c, alkAa, len: 78 aa. Equivalent to the 5'
+ end of Rv1317c, len: 496 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (98.7% identity in 78 aa
+ overlap). Putative alkA (alternate gene name: ada),
+ regulatory protein (EC 2.1.1.63), similar to
+ 3MG2_ECOLI|P04395 dna-3-methyladenine glycosidase II from
+ Escherichia coli (282 aa), FASTA scores, opt: 437, E():
+ 8.6e-22, (32.8% identity in 293 aa overlap), also similar
+ to other ada proteins e.g. ADA_SALTY|P26189 Salmonella
+ typhimurium (352 aa), FASTA scores: E(): 5.3e-08, (35.9%
+ identity in 156 aa overlap). Contains PS00041 Bacterial
+ regulatory proteins, araC family signature.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, alkA exists as a single gene.
+ In Mycobacterium bovis, a single base transition (g-a)
+ introduces a premature stop codon that splits alkA into 2
+ parts, alkAa and alkAb. Mb1351c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE ADA REGULATORY PROTEIN ALKAa [FIRST
+ PART] (Regulatory protein of adaptative response) :
+ Methylated-DNA--protein-cysteine methyltransferase
+ (O-6-methylguanine-DNA alkyltransferase)"
+ /protein_id="SIT99954.1"
+ /db_xref="GOA:A0A1R3XYZ1"
+ /db_xref="InterPro:IPR004026"
+ /db_xref="InterPro:IPR035451"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYZ1"
+ /translation="MHDDFERCYRAVQSKDARFDGWFVVAVLTTGVYCRPSCPVRPPF
+ ARNVRFLPTAAAAQGEGFRACKRCRPDASPGSPE"
+ gene complement(1481643..1483268)
+ /locus_tag="BQ2027_MB1352C"
+ CDS complement(1481643..1483268)
+ /locus_tag="BQ2027_MB1352C"
+ /note="Mb1352c, -, len: 541 aa. Equivalent to Rv1318c,
+ len: 541 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 541 aa overlap). Possible adenylate
+ cyclase (EC 4.6.1.1). Some similarity at the c-terminus to
+ CYAA_RHIME|P19485 adenylate cyclase from Rhizobium
+ meliloti (193 aa), FASTA scores, opt: 270, E(): 2.5e-11,
+ (28.8% identity in 184 aa overlap); similar to other
+ mycbacterium tuberculosis putative adenylate cyclases e.g.
+ Rv1319c|MTCY130.04c (535 aa), FASTA scores: opt: 2505,
+ E(): 0, (71.0% identity in 534 aa overlap), also similar
+ to Rv1320c|MTCY130.05c (567 aa), FASTA scores, opt: 2423,
+ E(): 0, (68.7% identity in 534 aa overlap). N-terminus is
+ hydrophobic. BELONGS TO ADENYLYL CYCLASE CLASS-3 FAMILY.
+ Mb1352c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ADENYLATE CYCLASE (ATP
+ PYROPHOSPHATE-LYASE) (ADENYLYL CYCLASE)"
+ /protein_id="SIT99955.1"
+ /db_xref="GOA:P63528"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR003660"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/Swiss-Prot:P63528"
+ /translation="MSAKKSTAQRLGRVLETVTRQSGRLPETPAYGSWLLGRVSESQR
+ RRRVRIQVMLTALVVTANLLGIGVALLLVTIAIPEPSIVRDTPRWLTFGVVPGYVLLA
+ LALGSYALTRQTVQALRWAIEGRKPTREEERRTFLAPWRVAVGHLMFWGVGTALLTTL
+ YGLINNAFIPRFLFAVSFCGVLVATATYLHTEFALRPFAAQALEAGPPPRRLAPGILG
+ RTMVVWLLGSGVPVVGIALMAMFEMVLLNLTRMQFATGVLIISMVTLVFGFILMWILA
+ WLTATPVRVVRAALRRVERGELRTNLVVFDGTELGELQRGFNAMVAGLRERERVRDLF
+ GRHVGREVAAAAERERSKLGGEERHVAVVFIDIVGSTQLVTSRPPADVVKLLNKFFAI
+ VVDEVDRHHGLVNKFEGDASLTIFGAPNRLPCPEDKALAAARAIADRLVNEMPECQAG
+ IGVAAGQVIAGNVGARERFEYTVIGEPVNEAARLCELAKSRPGKLLASAQAVDAASEE
+ ERARWSLGRHVKLRGHDQPVRLAKPVGLTKPRR"
+ gene complement(1483338..1484945)
+ /locus_tag="BQ2027_MB1353C"
+ CDS complement(1483338..1484945)
+ /locus_tag="BQ2027_MB1353C"
+ /note="Mb1353c, -, len: 535 aa. Equivalent to Rv1319c,
+ len: 535 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 535 aa overlap). Possible adenylate
+ cyclase (EC 4.6.1.1). Some similarity at the C-terminus to
+ CYAA_RHIME|P19485 adenylate cyclase from Rhizobium
+ meliloti (193 aa), FASTA scores: opt: 254, E(): 2.4e-10,
+ (33.3% identity in 144 aa overlap); similar to other
+ mycbacterium tuberculosis putative adenylate cyclases e.g.
+ Rv1318c|MTCY130.03c (541 aa), FASTA scores: opt: 2505,
+ E(): 0, (71.0% identity in 534 aa overlap);
+ Rv1320c|MTCY130.05c (567 aa), FASTA scores: opt: 2354,
+ E(): 0, (66.3% identity in 534 aa overlap). N-terminus is
+ hydrophobic. BELONGS TO ADENYLYL CYCLASE CLASS-3 FAMILY.
+ Protein product from Mb1353c detected using SWATH mass
+ spectrometry. Mb1353c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ADENYLATE CYCLASE (ATP
+ PYROPHOSPHATE-LYASE) (ADENYLYL CYCLASE)"
+ /protein_id="SIT99956.1"
+ /db_xref="GOA:P0A4Y3"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR003660"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4Y3"
+ /translation="MPAKKTMAQRLGQALETMTRQCGQLPETPAYGSWLLGRVSESPS
+ RRWVRIKRIVTVYIMTANLTGIVVALLVVTFAFPVPSIYTDAPWWVTFGVAPAYATLA
+ LAIGTYWITTRIVRASIRWAIEERAPSQADGRNTLLLPFRVAAVHLILWDIGGALLAT
+ LYGLANRVFVTIILFSVTICGVLVATNCYLFTEFALRPVAAKALEAGRPPRRFAPGIM
+ GRTMTVWSLGSGVPVTGIATTALYVLLVHNLTETQLASAVLILSITTLIFGFLVMWIL
+ AWLTAAPVRVVRAALKRVEQGDLRGDLVVFDGTELGELQRGFNAMVNGLRERERVRDL
+ FGRHVGREVAAAAERERPQLGGEDRHAAVVFVDIVGSTQLVDNQPAAHVVKLLNRFFA
+ IVVNEVDRHHGLINKFAGDAALAIFGAPNRLDRPEDAALAAARAIADRLANEMPEVQA
+ GIGVAAGQIVAGNVGAKQRFEYTVVGKPVNQAARLCELAKSHPARLLASSDTLHAASE
+ TERAHWSLGETVTLRGHEQPTRLAVPT"
+ gene complement(1484958..1486661)
+ /locus_tag="BQ2027_MB1354C"
+ CDS complement(1484958..1486661)
+ /locus_tag="BQ2027_MB1354C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1354c, -, len: 567 aa. Equivalent to Rv1320c,
+ len: 567 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 567 aa overlap). Possible adenylate
+ cyclase (EC 4.6.1.1) (see second citation below). Some
+ similarity at the C-terminus to CYAA_RHIME|P19485
+ adenylate cyclase from Rhizobium meliloti (193 aa), FASTA
+ scores: opt: 277, E(): 2e-12, (34.0% identity in 156 aa
+ overlap); similar to other mycbacterium tuberculosis
+ putative adenylate cyclases e.g. Rv1318c|MTCY130.03c (541
+ aa), FASTA scores: opt: 2423, E(): 0, (68.7% identity in
+ 534 aa overlap); Rv1319c|MTCY130.04c (535 aa), FASTA
+ scores: opt: 2354, E(): 0, (66.3% identity in 534 aa
+ overlap). N-terminus is hydrophobic. BELONGS TO ADENYLYL
+ CYCLASE CLASS-3 FAMILY. Protein product from Mb1354c
+ detected using SWATH mass spectrometry. Mb1354c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ADENYLATE CYCLASE (ATP
+ PYROPHOSPHATE-LYASE) (ADENYLYL CYCLASE)"
+ /protein_id="SIT99957.1"
+ /db_xref="GOA:P59972"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR003660"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/Swiss-Prot:P59972"
+ /translation="MPSEKATTRHLPGAVETLSPRTGRRPETPAYGSWLLGRVSESPR
+ MRRVRIQGMLTVAILVTNVIGLIVGAMLLTVAFPKPSVILDAPHWVSFGIVPGYCVLA
+ FILGTYWLTRQTARALRWAIEERTPSHDEARSAFLVPLRVALAVLFLWGAAAALWTII
+ YGLANRLFIPRFLFSMGVIGVVAATSCYLLTEFALRPMAAQALEVGATPRSLVRGIVG
+ RTMLVWLLCSGVPNVGVALTAIFDDTFWELSNDQFMITVLILWAPLLIFGFILMWILA
+ WLTATPVRVVREALNRVEQGDLSGDLVVFDGTELGELQRGFNRMVEGLRERERVRDLF
+ GRHVGREVAAAAERERPKLGGEERHVAVVFVDIVGSTQLVTSRPAAEVVMLLNRFFTV
+ IVDEVNHHRGLVNKFQGDASLAVFGAPNRLSHPEDAALATARAIADRLASEMPECQAG
+ IGVAAGQVVAGNVGAHERFEYTVIGEPVNEAARLCELAKSYPSRLLASSQTLRGASEN
+ ECARWSLGETVTLRGHDQPIRLASPVQQLQMPAQSADIVGGALGDHQTHTIYRGAHPT
+ D"
+ gene 1486723..1487403
+ /gene="nucS"
+ /locus_tag="BQ2027_MB1355"
+ CDS 1486723..1487403
+ /gene="nucS"
+ /locus_tag="BQ2027_MB1355"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1355, -, len: 226 aa. Equivalent to Rv1321, len:
+ 226 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 226 aa overlap). Conserved hypothetical
+ protein. Equivalent to P53524|YD21_MYCLE hypothetical
+ protein from Mycobacterium leprae (201 aa), FASTA scores:
+ opt: 1144, E(): 0, (87.6% identity in 193 aa overlap).
+ Some similarity to hypothetical proteins from other
+ organisms e.g. Y225_METJA|Q57678 Methanococcus jannaschii
+ (263 aa), FASTA scores: E(): 6.5e-05, (25.0% identity in
+ 212 aa overlap). Protein product from Mb1355 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1355 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Endonuclease NucS"
+ /protein_id="SIT99958.1"
+ /db_xref="GOA:P59979"
+ /db_xref="InterPro:IPR002793"
+ /db_xref="InterPro:IPR011856"
+ /db_xref="UniProtKB/Swiss-Prot:P59979"
+ /translation="MSRVRLVIAQCTVDYIGRLTAHLPSARRLLLFKADGSVSVHADD
+ RAYKPLNWMSPPCWLTEESGGQAPVWVVENKAGEQLRITIEGIEHDSSHELGVDPGLV
+ KDGVEAHLQALLAEHIQLLGEGYTLVRREYMTAIGPVDLLCRDERGGSVAVEIKRRGE
+ IDGVEQLTRYLELLNRDSVLAPVKGVFAAQQIKPQARILATDRGIRCLTLDYDTMRGM
+ DSGEYRLF"
+ gene 1487426..1487722
+ /locus_tag="BQ2027_MB1356"
+ CDS 1487426..1487722
+ /locus_tag="BQ2027_MB1356"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1356, -, len: 98 aa. Equivalent to Rv1322, len:
+ 98 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 98 aa overlap). Conserved hypothetical
+ protein. Mb1356 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ATP/GTP-binding protein"
+ /protein_id="SIT99959.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64806"
+ /translation="MARRRKPLHRQRPEPPSWALRRVEAGPDGHEYEVRPVAAARAVK
+ TYRCPGCDHEIRSGTAHVVVWPTDLPQAGVDDRRHWHTPCWANRATRGPTRKWT"
+ gene complement(1487757..1488215)
+ /locus_tag="BQ2027_MB1357C"
+ CDS complement(1487757..1488215)
+ /locus_tag="BQ2027_MB1357C"
+ /EC_number="5.1.99.1"
+ /note="Mb1357c, -, len: 152 aa. Equivalent to Rv1322A,
+ len: 152 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 152 aa overlap). Conserved hypothetical
+ protein, similar to proteins from Mycobacterium leprae and
+ Streptomyces coelicolor e.g. AL583921_2|ML1157 from M.
+ leprae strain TN (155 aa), FASTA scores: opt: 771, E():
+ 5.1e-43, (75.3% identity in 154 aa overlap); and
+ AL137242_2 from S. coelicolor (146 aa), FASTA scores: opt:
+ 404, E(): 2e-19, (43.165% identity in 139 aa overlap).
+ Protein product from Mb1357c detected using shotgun mass
+ spectrometry. Mb1357c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Methylmalonyl-CoA epimerase (EC @
+ Ethylmalonyl-CoA epimerase"
+ /protein_id="SIT99960.1"
+ /db_xref="InterPro:IPR017515"
+ /db_xref="InterPro:IPR029068"
+ /db_xref="InterPro:IPR037523"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY23"
+ /translation="MMTTDQVHARHMLATSLVTGLDHVGIAVADLDVAIEWYHDHLGM
+ ILVHEEINDDQGIREALLAVPGSAAQIQLMAPLDESSVIAKFLDKRGPGIQQLACRVS
+ DLDAMCRRLRSQGVRLVYETARRGTANSRINFIHPKDAGGVLIELVEPAP"
+ gene 1488306..1489475
+ /gene="fadA4"
+ /locus_tag="BQ2027_MB1358"
+ CDS 1488306..1489475
+ /gene="fadA4"
+ /locus_tag="BQ2027_MB1358"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1358, fadA4, len: 389 aa. Equivalent to Rv1323,
+ len: 389 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 389 aa overlap). Probable fadA4,
+ acetyl-CoA acetyltransferase (EC 2.3.1.9), equivalent to
+ THIL_MYCLE|P46707 possible acetyl-CoA C-acetyltransferase
+ from Mycobacterium leprae (393 aa), FASTA scores: opt:
+ 2218, E(): 0, (87.0% identity in 392 aa overlap). Also
+ highly similar to others e.g. CAB70629.1|AL137242 probable
+ acetoacetyl-coA thiolase from Streptomyces coelicolor (401
+ aa); T51772 acetyl-CoA C-acetyltransferase (EC 2.3.1.9)
+ [validated] from Alcaligenes latus (392 aa); etc. Some
+ homologies indicate ATA start codon. Contains PS00098
+ Thiolases acyl-enzyme intermediate signature, PS00737
+ Thiolases signature 2, and PS00099 Thiolases active site.
+ BELONGS TO THE THIOLASE FAMILY. Protein product from
+ Mb1358 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1358 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACETYL-COA ACETYLTRANSFERASE FADA4
+ (ACETOACETYL-COA THIOLASE)"
+ /protein_id="SIT99961.1"
+ /db_xref="GOA:P66927"
+ /db_xref="InterPro:IPR002155"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020610"
+ /db_xref="InterPro:IPR020613"
+ /db_xref="InterPro:IPR020615"
+ /db_xref="InterPro:IPR020616"
+ /db_xref="InterPro:IPR020617"
+ /db_xref="UniProtKB/Swiss-Prot:P66927"
+ /translation="MIVAGARTPIGKLMGSLKDFSASELGAIAIKGALEKANVPASLV
+ EYVIMGQVLTAGAGQMPARQAAVAAGIGWDVPALTINKMCLSGIDAIALADQLIRARE
+ FDVVVAGGQESMTKAPHLLMNSRSGYKYGDVTVLDHMAYDGLHDVFTDQPMGALTEQR
+ NDVDMFTRSEQDEYAAASHQKAAAAWKDGVFADEVIPVNIPQRTGDPLQFTEDEGIRA
+ NTTAAALAGLKPAFRGDGTITAGSASQISDGAAAVVVMNQEKAQELGLTWLAEIGAHG
+ VVAGPDSTLQSQPANAINKALDREGISVDQLDVVEINEAFAAVALASIRELGLNPQIV
+ NVNGGAIAVGHPLGMSGTRITLHAALQLARRGSGVGVAALCGAGGQGDALILRAG"
+ gene 1489605..1490519
+ /locus_tag="BQ2027_MB1359"
+ CDS 1489605..1490519
+ /locus_tag="BQ2027_MB1359"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1359, -, len: 304 aa. Equivalent to Rv1324, len:
+ 304 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 304 aa overlap). Possible thioredoxin
+ (EC 1.-.-.-), similar to several e.g. U00014|Q49716 TRXA
+ from Mycobacterium leprae (255 aa), FASTA scores: opt:
+ 1014, E(): 0, (69.7% identity in 228 aa overlap);
+ THIO_RHOSH|P08058 TrxA from Rhodobacter sphaeroides (105
+ aa), FASTA scores: opt 196, E(): 1.9e-06, (33.0% identity
+ in 103 aa overlap). Contains PS00339 Aminoacyl-transfer
+ RNA synthetases class-II signature 2. Protein product from
+ Mb1359 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1359 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE THIOREDOXIN"
+ /protein_id="SIT99962.1"
+ /db_xref="GOA:P64808"
+ /db_xref="InterPro:IPR011990"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/Swiss-Prot:P64808"
+ /translation="MTRPRPPLGPAMAGAVDLSGIKQRAQQNAAASTDADRALSTPSG
+ VTEITEANFEDEVIVRSDEVPVVVLLWSPRSEVCVDLLDTLSGLAAAAKGKWSLASVN
+ VDVAPRVAQIFGVQAVPTVVALAAGQPISSFQGLQPADQLSRWVDSLLSATAGKLKGA
+ ASSEESTEVDPAVAQARQQLEDGDFVAARKSYQAILDANPGSVEAKAAIRQIEFLIRA
+ TAQRPDAVSVADSLSDDIDAAFAAADVQVLNQDVSAAFERLIALVRRTSGEERTRVRT
+ RLIELFELFDPADPEVVAGRRNLANALY"
+ gene complement(1490598..1492409)
+ /gene="PE_PGRS24"
+ /locus_tag="BQ2027_MB1360C"
+ CDS complement(1490598..1492409)
+ /gene="PE_PGRS24"
+ /locus_tag="BQ2027_MB1360C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1360c, PE_PGRS24, len: 603 aa. Equivalent to
+ Rv1325c, len: 603 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 603 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of ala-, gly-rich proteins, similar to many e.g.
+ YQ04_MYCTU|P71933 hypothetical 63.1 kd glycine-rich
+ protein (778 aa), FASTA scores: E(): 0, (52.3% identity in
+ 724 aa overlap). Mb1360c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs24"
+ /protein_id="SIT99963.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y056"
+ /translation="MSFVIAAPETLVRAASDLANIGSTLGAANAAALGPTTELLAAGA
+ DEVSAAIASLFAAHGQAYQAVSAQMSAFHAQFVQTFTAGAGAYASAEAAAAAPLEGLL
+ NIVNTPTQLLLGRPLIGNGANGAPGTGQAGGAGGLLYGNGGAGGSGAPGQAGGPGGAA
+ GLFGNGGAGGAGGDGPGNGAAGGAGGAGGLLFGSGGAGGPGGVGNTGTGGLGGDGGAA
+ GLFGAGGIGGAGGPGFNGGAGGAGGRSGLFEVLAAGGAGGTGGLSVNGGTGGTGGTGG
+ GGGLFSNGGAGGAGGFGVSGSAGGNGGTGGDGGIFTGNGGTGGAGGTGTGNQLVGGEG
+ GAGGAGGNAGILFGAGGIGGTGGTGLGAPDPGGTGGKGGVGGIGGAGALFGPGGAGGT
+ GGFGASSADQMAGGIGGSGGSGGAAKLIGDGGAGGTGGDSVRGAAGSGGTGGTGGLIG
+ DGGAGGAGGTGIEFGSVGGAGGAGGNAAGLSGAGGAGGAGGFGETAGDGGAGGNAGLL
+ NGDGGAGGAGGLGIAGDGGNGGKGGKAGMVGNGGDGGAGGASVVANGGVGGSGGNATL
+ IGNGGNGGNGGVGSAPGKGGAGGTAGLLGLNGSPGLS"
+ gene complement(1492561..1494756)
+ /gene="glgB"
+ /locus_tag="BQ2027_MB1361C"
+ CDS complement(1492561..1494756)
+ /gene="glgB"
+ /locus_tag="BQ2027_MB1361C"
+ /note="Mb1361c, glgB, len: 731 aa. Equivalent to Rv1326c,
+ len: 731 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 731 aa overlap). Probable glgB,
+ 1,4-alpha-glucan branching enzyme (EC 2.4.1.18), similar
+ to others e.g. GLGB_ECOLI|P07762 Escherichia coli (728
+ aa), FASTA scores: opt: 2330, E(): 0, (48.7% identity in
+ 719 aa overlap). Similar to other Mycobacterium
+ tuberculosis putative alpha-glucan branching enzymes
+ Rv1562c, Rv1563c. BELONGS TO FAMILY OF 13 GLYCOSYL
+ HYDROLASES, ALSO KNOWN AS THE ALPHA-AMYLASE FAMILY.
+ Protein product from Mb1361c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1361c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="1,4-alpha-glucan branching enzyme glgb (glycogen
+ branching enzyme)"
+ /protein_id="SIT99964.1"
+ /db_xref="GOA:P59816"
+ /db_xref="InterPro:IPR004193"
+ /db_xref="InterPro:IPR006047"
+ /db_xref="InterPro:IPR006048"
+ /db_xref="InterPro:IPR006407"
+ /db_xref="InterPro:IPR013780"
+ /db_xref="InterPro:IPR013783"
+ /db_xref="InterPro:IPR014756"
+ /db_xref="InterPro:IPR017853"
+ /db_xref="InterPro:IPR037439"
+ /db_xref="UniProtKB/Swiss-Prot:P59816"
+ /translation="MSRSEKLTGEHLAPEPAEMARLVAGTHHNPHGILGAHEYGDHTV
+ IRAFRPHAVEVVALVGKDRFSLQHLDSGLFAVALPFVDLIDYRLQVTYEGCEPHTVAD
+ AYRFLPTLGEVDLHLFAEGRHERLWEVLGAHPRSFTTADGVVSGVSFAVWAPNAKGVS
+ LIGEFNGWNGHEAPMRVLGPSGVWELFWPDFPCDGLYKFRVHGADGVVTDRADPFAFG
+ TEVPPQTASRVTSSDYTWGDDDWMAGRALRNPVNEAMSTYEVHLGSWRPGLSYRQLAR
+ ELTDYIVDQGFTHVELLPVAEHPFAGSWGYQVTSYYAPTSRFGTPDDFRALVDALHQA
+ GIGVIVDWVPAHFPKDAWALGRFDGTPLYEHSDPKRGEQLDWGTYVFDFGRPEVRNFL
+ VANALYWLQEFHIDGLRVDAVASMLYLDYSRPEGGWTPNVHGGRENLEAVQFLQEMNA
+ TAHKVAPGIVTIAEESTSWPGVTRPTNIGGLGFSMKWNMGWMHDTLDYVSRDPVYRSY
+ HHHEMTFSMLYAFSENYVLPLSHDEVVHGKGTLWGRMPGNNHVKAAGLRSLLAYQWAH
+ PGKQLLFMGQEFGQRAEWSEQRGLDWFQLDENGFSNGIQRLVRDINDIYRCHPALWSL
+ DTTPEGYSWIDANDSANNVLSFMRYGSDGSVLACVFNFAGAEHRDYRLGLPRAGRWRE
+ VLNTDATIYHGSGIGNLGGVDATDDPWHGRPASAVLVLPPTSALWLTPA"
+ gene complement(1494764..1496869)
+ /gene="glgE"
+ /locus_tag="BQ2027_MB1362C"
+ CDS complement(1494764..1496869)
+ /gene="glgE"
+ /locus_tag="BQ2027_MB1362C"
+ /note="Mb1362c, glgE, len: 701 aa. Equivalent to Rv1327c,
+ len: 701 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 701 aa overlap). Probable glgE,
+ glucanase, similar to AF172946|AF172946_2 putative
+ glucanase GlgE from Mycobacterium smegmatis (697 aa),
+ FASTA scores: opt: 3816, E(): 0, (78.5% identity in 692 aa
+ overlap). Similar to putative alpha-amylases e.g. Q9L1K2
+ Streptomyces coelicolor (675 aa), FASTA scores: opt: 2243,
+ E(): 7.4e-132, (54.2% identity in 684 aa overlap). Start
+ changed since original submission (-36) based on
+ similarity to GlgE of Mycobacterium smegmatis; previous
+ start at position 1494531. Protein product from Mb1362c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1362c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUCANASE GLGE"
+ /protein_id="SIT99965.1"
+ /db_xref="GOA:P63532"
+ /db_xref="InterPro:IPR006047"
+ /db_xref="InterPro:IPR013780"
+ /db_xref="InterPro:IPR013783"
+ /db_xref="InterPro:IPR017853"
+ /db_xref="InterPro:IPR021828"
+ /db_xref="InterPro:IPR026585"
+ /db_xref="UniProtKB/Swiss-Prot:P63532"
+ /translation="MSGRAIGTETEWWVPGRVEIDDVAPVVSCGVYPAKAVVGEVVPV
+ SAAVWREGHEAVAATLVVRYLGVRYPHLTDRPRARVLPTPSEPQQRVKPLLIPMTSGQ
+ EPFVFHGQFTPDRVGLWTFRVDGWGDPIHTWRHGLIAKLDAGQGETELSNDLLVGAVL
+ LERAATGVPRGLRDPLLAAAAALRTPGDPVTRTALALTPEIEELLADYPLRDLVTRGE
+ QFGVWVDRPLARFGAWYEMFPRSTGGWDDDGNPVHGTFATAAAELPRIAGMGFDVVYL
+ PPIHPIGKVHRKGRNNSPTAAPTDVGSPWAIGSDEGGHDTVHPSLGTIDDFDDFVSAA
+ RDLGMEVALDLALQCAPDHPWAREHRQWFTELPDGTIAYAENPPKKYQDIYPLNFDND
+ PEGLYDEVLRVVQHWVNHGVKFFRVDNPHTKPPNFWAWLIAQVKTVDPDVLFLSEAFT
+ PPARQYGLAKLGFTQSYSYFTWRTTKWELTEFGNQIAELADYRRPNLFVNTPDILHAV
+ LQHNGPGMFAIRAVLAATMSPAWGMYCGYELFEHRAVREGSEEYLDSEKYELRPRDFA
+ SALDQGRSLQPFITRLNIIRRLHPAFQQLRTIHFHHVDNDALLAYSKFDPATGDCVLV
+ VVTLNAFGPEEATLWLDMAALGMEDYDRFWVRDEITGEEYQWGQANYIRIDPARAVAH
+ IINMPAVPYESRNTLLRRR"
+ gene 1497008..1499599
+ /gene="glgP"
+ /locus_tag="BQ2027_MB1363"
+ CDS 1497008..1499599
+ /gene="glgP"
+ /locus_tag="BQ2027_MB1363"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1363, glgP, len: 863 aa. Equivalent to Rv1328,
+ len: 863 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 863 aa overlap). Probable glgP,
+ glycogen phosphorylase (EC 2.4.1.1), similar to many e.g.
+ PHSG_HAEIN|P45180 glycogen phosphorylase from Haemophilus
+ influenzae (821 aa), FASTA scores: E(): 6.9e-08, (25.6%
+ identity in 675 aa overlap). BELONGS TO THE GLYCOGEN
+ PHOSPHORYLASE FAMILY. Protein product from Mb1363 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1363 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLYCOGEN PHOSPHORYLASE GLGP"
+ /protein_id="SIT99966.1"
+ /db_xref="GOA:Q7U078"
+ /db_xref="InterPro:IPR000811"
+ /db_xref="InterPro:IPR011834"
+ /db_xref="InterPro:IPR024517"
+ /db_xref="InterPro:IPR035090"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U078"
+ /translation="MKALRRFTVRAHLPERLAALDQLSTNLRWSWDKPTQDLFAAIDP
+ ALWEQCGHDPVALLGAVNPARLDELALDAEFLGALDELAADLNDYLSRPLWYQEQQDA
+ GVAAQALPTGIAYFSLEFGVAEVLPNYSGGLGILAGDHLKSASDLGVPLIAVGLYYRS
+ GYFRQSLTADGWQHETYPSLDPQGLPLRLLTDANGDPVLVEVALGDNAVLRARIWVAQ
+ VGRVPLLLLDSDIPENEHDLRNVTDRLYGGDQEHRIKQEILAGIGGVRAIRAYTAVEK
+ LTPPEVFHMNEGHAGFLGIERIRELVTDAGLDFDTALTVVRSSTVFTTHTPVPAGIDR
+ FPLEMVQRYVNDQRGDGRSRLLPGLPADRIVALGAEDDPAKFNMAHMGLRLAQRANGV
+ SLLHGRVSRAMFNELWAGFDPDEVPIGSVTNGVHAPTWAAPQWLQLGRELAGSDSLRE
+ PVVWQRLHQVDPAHLWWIRSQLRSMLVEDVRARLRQSWLERGATDAELGWIATAFDPN
+ VLTVGFARRVPTYKRLTLMLRDPGRLEQLLLDEQRPIQLIVAGKSHPADDGGKALIQQ
+ VVRFADRPQFRHRIAFLPNYDMSMARLLYWGCDVWLNNPLRPLEACGTSGMKSALNGG
+ LNLSIRDGWWDEWYDGENGWEIPSADGVADENRRDDLEAGALYDLLAQAVAPKFYERD
+ ERGVPQRWVEMVRHTLQTLGPKVLASRMVRDYVEHYYAPAAQSFRRTAGAQFDAAREL
+ ADYRRRAEEAWPKIEIADVDSTGLPDTPLLGSQLTLTATVRLAGLRPNDVTVQGVLGR
+ VDSGDVLMDPVTVEMAHTGTGDGGYEIFSTTTPLPLAGPVGYTVRVLPRHPMLAASNE
+ LGLVTLA"
+ gene complement(1499639..1501633)
+ /gene="dinG"
+ /locus_tag="BQ2027_MB1364C"
+ CDS complement(1499639..1501633)
+ /gene="dinG"
+ /locus_tag="BQ2027_MB1364C"
+ /note="Mb1364c, dinG, len: 664 aa. Equivalent to Rv1329c,
+ len: 664 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 664 aa overlap). Probable dinG,
+ ATP-dependent helicase homolog, similar to several e.g.
+ DING_HAEIN|P44680 probable ATP-dependent helicase ding
+ from Haemophilus influenzae (640 aa), FASTA scores: opt:
+ 685, E(): 2.3e-38, (32.8% identity in 644 aa overlap).
+ Contains PS00017 ATP/GTP-binding site motif A. Protein
+ product from Mb1364c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1364c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable atp-dependent helicase ding"
+ /protein_id="SIT99967.1"
+ /db_xref="GOA:P64315"
+ /db_xref="InterPro:IPR006555"
+ /db_xref="InterPro:IPR014001"
+ /db_xref="InterPro:IPR014013"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P64315"
+ /translation="MSESVSMSVPELLAIAVAALGGTRRRGQQEMAAAVAHAFETGEH
+ LVVQAGTGTGKSLAYLVPAIIRALCDDAPVVVSTATIALQRQLVDRDLPQLVDSLTNA
+ LPRRPKFALLKGRRNYLCLNKIHNSVTASDHDDERPQEELFDPVAVTALGRDVQRLTA
+ WASTTVSGDRDDLKPGVGDRSWSQVSVSARECLGVARCPFGSECFSERARGAAGLADV
+ VVTNHALLAIDAVAESAVLPEHRLLVVDEAHELADRVTSVAAAELTSATLGMAARRIT
+ RLVDPKVTQRLQAASATFSSAIHDARPGRIDCLDDEMATYLSALRDAASAARSAIDTG
+ SDTTTASVRAEAGAVLTEISDTASRILASFAPAIPDRSDVVWLEHEDNHESARAVLRV
+ APLSVAELLATQVFARATTVLTSATLTIGGSFDAMATAWGLTADTPWRGLDVGSPFQH
+ AKSGILYVAAHLPPPGRDGSGSAEQLTEIAELITAAGGRTLGLFSSMRAARAATEAMR
+ ERLSTPVLCQGDDSTSTLVEKFTADAATSLFGTLSLWQGVDVPGPSLSLVLIDRIPFP
+ RPDDPLLSARQRAVAARGGNGFMTVAASHAALLLAQGSGRLLRRVTDRGVVAVLDSRM
+ ATARYGEFLRASLPPFWQTTNATQVRAALRRLARADAKAH"
+ gene complement(1501657..1503003)
+ /gene="pncB1"
+ /locus_tag="BQ2027_MB1365C"
+ CDS complement(1501657..1503003)
+ /gene="pncB1"
+ /locus_tag="BQ2027_MB1365C"
+ /note="Mb1365c, -, len: 448 aa. Equivalent to Rv1330c,
+ len: 448 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 448 aa overlap). Conserved hypothetical
+ protein, similar to others and also several nicotinate
+ phosphoribosyltransferases e.g. O32090 YUEK PROTEIN from
+ Bacillus subtilis (490 aa), FASTA scores: E(): 8.6e-22,
+ (37.9% identity in 369 aa overlap). Also similar to M.
+ tuberculosis Rv0573c|MTV039.11c (38.0% identity in 437 aa
+ overlap). Start changed since original submission based on
+ similarity; previous start at position 1500740 (-61 aa).
+ Protein product from Mb1365c detected using SWATH mass
+ spectrometry. Mb1365c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="nicotinic acid phosphoribosyltransferase pncB1"
+ /protein_id="SIT99968.1"
+ /db_xref="GOA:A0A1R3XY18"
+ /db_xref="InterPro:IPR002638"
+ /db_xref="InterPro:IPR006405"
+ /db_xref="InterPro:IPR007229"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR036068"
+ /db_xref="InterPro:IPR040727"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY18"
+ /translation="MGPPPAARRREGEPDNQDPAGLLTDKYELTMLAAALRDGSANRP
+ TTFEVFARRLPTGRRYGVVAGTGRLLEALPQFRFDADACELLAQFLDPATVRYLREFR
+ FRGDIDGYAEGELYFPGSPVLSVRGSFAECVLLETLVLSIFNHDTAIASAAARMVSAA
+ GGRPLIEMGSRRTHERAAVAAARAAYIAGFAASSNLAAQRRYGVPAHGTAAHAFTMLH
+ AQHGGPTELAERAAFRAQVEALGPGTTLLVDTYDVTTGVANAVAAAGAELGAIRIDSG
+ ELGVLARQAREQLDRLGATRTRIVVSGDLDEFSIAALRGEPVDSYGVGTSLVTGSGAP
+ TANMVYKLVEVDGVPVQKRSSYKKSPGGRKEALRRSRATGTITEELVHPAGRPPVIVE
+ PHRVLTLPLVRAGQPVADTSLAAARQLVASGLRSLPADGLKLAPGEPAIPTRTIPA"
+ gene 1503105..1503410
+ /gene="clpS"
+ /locus_tag="BQ2027_MB1366"
+ CDS 1503105..1503410
+ /gene="clpS"
+ /locus_tag="BQ2027_MB1366"
+ /note="Mb1366, -, len: 101 aa. Equivalent to Rv1331, len:
+ 101 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 101 aa overlap). Conserved hypothetical
+ protein, highly similar to U00014|ML014 B1549_C2_207 from
+ Mycobacterium leprae (94 aa), FASTA scores: opt: 573, E():
+ 2.9e-40, (90.3% identity in 93 aa overlap). Similar to
+ AL096852|SCE19A_16 hypothetical protein from Streptomyces
+ coelicolor (105 aa), FASTA scores: opt: 377, E(): 2.9e-22,
+ (60.0% identity in 105 aa overlap). Protein product from
+ Mb1366 detected using SWATH mass spectrometry. Mb1366
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ATP-dependent Clp protease adaptor protein ClpS"
+ /protein_id="SIT99969.1"
+ /db_xref="GOA:P67648"
+ /db_xref="InterPro:IPR003769"
+ /db_xref="InterPro:IPR014719"
+ /db_xref="InterPro:IPR022935"
+ /db_xref="UniProtKB/Swiss-Prot:P67648"
+ /translation="MAVVSAPAKPGTTWQRESAPVDVTDRAWVTIVWDDPVNLMSYVT
+ YVFQKLFGYSEPHATKLMLQVHNEGKAVVSAGSRESMEVDVSKLHAAGLWATMQQDR"
+ gene 1503370..1504026
+ /locus_tag="BQ2027_MB1367"
+ CDS 1503370..1504026
+ /locus_tag="BQ2027_MB1367"
+ /note="Mb1367, -, len: 218 aa. Equivalent to Rv1332, len:
+ 218 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 218 aa overlap). Possible regulatory
+ protein, high similarity to ML014|U00014 from
+ Mycobacterium leprae B1549_C3_236 (222 aa), FASTA scores:
+ opt: 1158, E(): 0, (75.6% identity in 221 aa overlap).
+ Helix turn helix motif fram aa 8-29 (+3.03 SD). Protein
+ product from Mb1367 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1367 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99970.1"
+ /db_xref="InterPro:IPR018561"
+ /db_xref="UniProtKB/Swiss-Prot:P64810"
+ /translation="MPPVCGRRCSRTGEIRGYSGSIVRRWKRVETRDGPRFRSSLAPH
+ EAALLKNLAGAMIGLLDDRDSSSPSDELEEITGIKTGHAQRPGDPTLRRLLPDFYRPD
+ DLDDDDPTAVDGSESFNAALRSLHEPEIIDAKRVAAQQLLDTVPDNGGRLELTESDAN
+ AWIAAVNDLRLALGVMLEIGPRGPERLPGNHPLAAHFNVYQWLTVLQEYLVLVLMGSR
+ "
+ gene 1504043..1505077
+ /locus_tag="BQ2027_MB1368"
+ CDS 1504043..1505077
+ /locus_tag="BQ2027_MB1368"
+ /note="Mb1368, -, len: 344 aa. Equivalent to Rv1333, len:
+ 344 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 344 aa overlap). Possible hydrolase (EC
+ 3.-.-.-), similar to Q57326|D26094 endo-type
+ 6-aminohexanoate oligomer hydrolase (355 aa), fasta
+ scores: E(): 1.4e-10, (31.9% identity in 339 aa overlap).
+ Equivalent to P53425|YD33_MYCLE HYPOTHETICAL 36.1 KD
+ PROTEIN B154 Mycobacterium leprae (362 aa), FASTA scores:
+ opt: 1735, E(): 0, (76.7% identity in 352 aa overlap).
+ Protein product from Mb1368 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1368 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE HYDROLASE"
+ /protein_id="SIT99971.1"
+ /db_xref="GOA:P64812"
+ /db_xref="InterPro:IPR005321"
+ /db_xref="InterPro:IPR016117"
+ /db_xref="UniProtKB/Swiss-Prot:P64812"
+ /translation="MNSITDVGGIRVGHYQRLDPDASLGAGWACGVTVVLPPPGTVGA
+ VDCRGGAPGTRETDLLDPANSVRFVDALLLAGGSAYGLAAADGVMRWLEEHRRGVAMD
+ SGVVPIVPGAVIFDLPVGGWNCRPTADFGYSACAAAGVDVAVGTVGVGVGARAGALKG
+ GVGTASATLQSGVTVGVLAVVNAAGNVVDPATGLPWMADLVGEFALRAPPAEQIAALA
+ QLSSPLGAFNTPFNTTIGVIACDAALSPAACRRIAIAAHDGLARTIRPAHTPLDGDTV
+ FALATGAVAVPPEAGVPAALSPETQLVTAVGAAAADCLARAVLAGVLNAQPVAGIPTY
+ RDMFPGAFGS"
+ gene 1505085..1505525
+ /gene="mec"
+ /locus_tag="BQ2027_MB1369"
+ CDS 1505085..1505525
+ /gene="mec"
+ /locus_tag="BQ2027_MB1369"
+ /note="Mb1369, -, len: 146 aa. Equivalent to Rv1334, len:
+ 146 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 146 aa overlap). Conserved hypothetical
+ protein, similar to AL096852|SCE19A_13 hypothetical
+ protein from Streptomyces coelicolor (140 aa), Fasta
+ scores: opt: 579, E(): 0, (65.0% identity in 140 aa
+ overlap); and Q54330|M29166 MEC+ from Streptomyces
+ kasugaensis (115 aa), FASTA scores; E(): 7.6e-33, (56.9%
+ identity in 109 aa overlap). Protein product from Mb1369
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1369 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible hydrolase"
+ /protein_id="SIT99972.1"
+ /db_xref="GOA:P64814"
+ /db_xref="InterPro:IPR000555"
+ /db_xref="InterPro:IPR028090"
+ /db_xref="InterPro:IPR037518"
+ /db_xref="UniProtKB/Swiss-Prot:P64814"
+ /translation="MLLRKGTVYVLVIRADLVNAMVAHARRDHPDEACGVLAGPEGSD
+ RPERHIPMTNAERSPTFYRLDSGEQLKVWRAMEDADEVPVVIYHSHTATEAYPSRTDV
+ KLATEPDAHYVLVSTRDPHRHELRSYRIVDGAVTEEPVNVVEQY"
+ gene 1505547..1505828
+ /gene="cysO"
+ /locus_tag="BQ2027_MB1370"
+ CDS 1505547..1505828
+ /gene="cysO"
+ /locus_tag="BQ2027_MB1370"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1370, -, len: 93 aa. Equivalent to Rv1335, len:
+ 93 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 93 aa overlap). 9.5 kDa culture filtrate
+ antigen cfp10A (see citation below). Similar to
+ hypothetical proteins from other organisms e.g.
+ P74060|D90911 Synechocystis (109 aa), FASTA scores: E():
+ 2.3e-20, (49.5% identity in 93 aa overlap). Protein
+ product from Mb1370 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1370 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="sulfur carrier protein cysO"
+ /protein_id="SIT99973.1"
+ /db_xref="GOA:P0A647"
+ /db_xref="InterPro:IPR003749"
+ /db_xref="InterPro:IPR012675"
+ /db_xref="InterPro:IPR016155"
+ /db_xref="UniProtKB/Swiss-Prot:P0A647"
+ /translation="MNVTVSIPTILRPHTGGQKSVSASGDTLGAVISDLEANYSGISE
+ RLMDPSSPGKLHRFVNIYVNDEDVRFSGGLATAIADGDSVTILPAVAGG"
+ gene 1505838..1506809
+ /gene="cysM"
+ /locus_tag="BQ2027_MB1371"
+ CDS 1505838..1506809
+ /gene="cysM"
+ /locus_tag="BQ2027_MB1371"
+ /note="Mb1371, cysM, len: 323 aa. Equivalent to Rv1336,
+ len: 323 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 323 aa overlap). Probable cysM, cysteine
+ synthase B (EC 4.2.99.8), similar to many e.g.
+ CYSM_ECOLI|P16703 Escherichia coli (303 aa), FASTA scores:
+ opt: 720, E(): 4.6e-40, (41.1% identity in 302 aa
+ overlap). Also similar to other Mycobacterium tuberculosis
+ cysteine synthase subunits e.g. Rv1077, Rv2334, Rv0848,
+ etc. Contains PS00901 Cysteine synthase/cystathionine
+ beta-synthase P-phosphate attachment site. BELONGS TO THE
+ CYSTEINE SYNTHASE/CYSTATHIONINE BETA-SYNTHASE FAMILY.
+ Protein product from Mb1371 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1371 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="cysteine synthase b cysm (csase b)
+ (o-phosphoserine sulfhydrylase b) (o-phosphoserine
+ (thiol)-lyase b)"
+ /protein_id="SIT99974.1"
+ /db_xref="GOA:P63874"
+ /db_xref="InterPro:IPR001216"
+ /db_xref="InterPro:IPR001926"
+ /db_xref="InterPro:IPR005856"
+ /db_xref="InterPro:IPR036052"
+ /db_xref="UniProtKB/Swiss-Prot:P63874"
+ /translation="MTRYDSLLQALGNTPLVGLQRLSPRWDDGRDGPHVRLWAKLEDR
+ NPTGSIKDRPAVRMIEQAEADGLLRPGATILEPTSGNTGISLAMAARLKGYRLICVMP
+ ENTSVERRQLLELYGAQIIFSAAEGGSNTAVATAKELAATNPSWVMLYQYGNPANTDS
+ HYCGTGPELLADLPEITHFVAGLGTTGTLMGTGRFLREHVANVKIVAAEPRYGEGVYA
+ LRNMDEGFVPELYDPEILTARYSVGAVDAVRRTRELVHTEGIFAGISTGAVLHAALGV
+ GAGALAAGERADIALVVADAGWKYLSTGAYAGSLDDAETALEGQLWA"
+ gene 1506800..1507522
+ /locus_tag="BQ2027_MB1372"
+ CDS 1506800..1507522
+ /locus_tag="BQ2027_MB1372"
+ /note="Mb1372, -, len: 240 aa. Equivalent to Rv1337, len:
+ 240 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 240 aa overlap). Probable integral
+ membrane protein. Highly similar to P53426 hypothetical
+ protein B1549_C3_240 from M.leprae (251); and
+ P74553|D90916 hypothetical protein from Synechocystis sp.
+ (198 aa), FASTA scores: E(): 2.3e-25, (43.6% identity in
+ 181 aa overlap). Mb1372 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIT99975.1"
+ /db_xref="GOA:P64816"
+ /db_xref="InterPro:IPR022764"
+ /db_xref="InterPro:IPR035952"
+ /db_xref="UniProtKB/Swiss-Prot:P64816"
+ /translation="MGMTPRRKRRGGAVQITRPTGRPRTPTTQTTKRPRWVVGGTTIL
+ TFVALLYLVELIDQLSGSRLDVNGIRPLKTDGLWGVIFAPLLHANWHHLMANTIPLLV
+ LGFLMTLAGLSRFVWATAIIWILGGLGTWLIGNVGSSCGPTDHIGASGLIFGWLAFLL
+ VFGLFVRKGWDIVIGLVVLFVYGGILLGAMPVLGQCGGVSWQGHLSGAVAGVVAAYLL
+ SAPERKARALKRAGARSGHPKL"
+ gene 1507519..1508334
+ /gene="murI"
+ /locus_tag="BQ2027_MB1373"
+ CDS 1507519..1508334
+ /gene="murI"
+ /locus_tag="BQ2027_MB1373"
+ /note="Mb1373, murI, len: 271 aa. Equivalent to Rv1338,
+ len: 271 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 271 aa overlap). Probable murI,
+ glutamate racemase (EC 5.1.1.3), highly similar to many
+ e.g. MURI_MYCLE|P46705 (272 aa), FASTA scores: opt: 1559,
+ E(): 0, (88.9% identity in 271 aa overlap). Contains
+ PS00924 Aspartate and glutamate racemases signature 2.
+ Protein product from Mb1373 detected using SWATH mass
+ spectrometry. Mb1373 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUTAMATE RACEMASE MURI"
+ /protein_id="SIT99976.1"
+ /db_xref="GOA:P63636"
+ /db_xref="InterPro:IPR001920"
+ /db_xref="InterPro:IPR004391"
+ /db_xref="InterPro:IPR015942"
+ /db_xref="InterPro:IPR018187"
+ /db_xref="InterPro:IPR033134"
+ /db_xref="UniProtKB/Swiss-Prot:P63636"
+ /translation="MNSPLAPVGVFDSGVGGLTVARAIIDQLPDEDIVYVGDTGNGPY
+ GPLTIPEIRAHALAIGDDLVGRGVKALVIACNSASSACLRDARERYQVPVVEVILPAV
+ RRAVAATRNGRIGVIGTRATITSHAYQDAFAAARDTEITAVACPRFVDFVERGVTSGR
+ QVLGLAQGYLEPLQRAEVDTLVLGCTHYPLLSGLIQLAMGENVTLVSSAEETAKEVVR
+ VLTEIDLLRPHDAPPATRIFEATGDPEAFTKLAARFLGPVLGGVQPVHPSRIH"
+ gene 1508361..1509182
+ /locus_tag="BQ2027_MB1374"
+ CDS 1508361..1509182
+ /locus_tag="BQ2027_MB1374"
+ /note="Mb1374, -, len: 273 aa. Equivalent to Rv1339, len:
+ 273 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 273 aa overlap). Conserved hypothetical
+ protein, highly similar to Y211_MYCLE|P50474 hypothetical
+ protein b1549_c2_211 from Mycobacterium leprae (284 aa),
+ FASTA scores: opt: 1672, E(): 0, (86.2% identity in 276 aa
+ overlap). Also similar to AL096852|SCE19A.08 hypothetical
+ protein from Streptomyces coelicolor (250 aa), FASTA
+ scores: opt: 630, E(): 0, (42.2% identity in 256 aa
+ overlap). Similar to Mycobacterium tuberculosis
+ hypothetical proteins Rv3796, Rv2407. Protein product from
+ Mb1374 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1374 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Metal-dependent hydrolases of the beta-lactamase
+ superfamily III"
+ /protein_id="SIT99977.1"
+ /db_xref="InterPro:IPR001279"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/Swiss-Prot:P66874"
+ /translation="MRRCIPHRCIGHGTVVSVRITVLGCSGSVVGPDSPASGYLLRAP
+ HTPPLVIDFGGGVLGALQRHADPASVHVLLSHLHADHCLDLPGLFVWRRYHPSRPSGK
+ ALLYGPSDTWSRLGAASSPYGGEIDDCSDIFDVHHWADSEPVTLGALTIVPRLVAHPT
+ ESFGLRITDPSGASLAYSGDTGICDQLVELARGVDVFLCEASWTHSPKHPPDLHLSGT
+ EAGMVAAQAGVRELLLTHIPPWTSREDVISEAKAEFDGPVHAVVCDETFEVRRAG"
+ gene 1509199..1509978
+ /gene="rphA"
+ /locus_tag="BQ2027_MB1375"
+ CDS 1509199..1509978
+ /gene="rphA"
+ /locus_tag="BQ2027_MB1375"
+ /note="Mb1375, rphA, len: 259 aa. Equivalent to Rv1340,
+ len: 259 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 259 aa overlap). Probable rphA,
+ Ribonuclease ph (EC 2.7.7.56), highly similar to others
+ e.g. RNPH_MYCLE|P37939 from Mycobacterium leprae (259 aa),
+ FASTA scores: opt: 1524, E(): 0, (88.8% identity in 259 aa
+ overlap). BELONGS TO THE RNASE PH FAMILY. Protein product
+ from Mb1375 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1375 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RIBONUCLEASE RPHA (RNase PH) (tRNA
+ nucleotidyltransferase)"
+ /protein_id="SIT99978.1"
+ /db_xref="GOA:Q7U076"
+ /db_xref="InterPro:IPR001247"
+ /db_xref="InterPro:IPR002381"
+ /db_xref="InterPro:IPR015847"
+ /db_xref="InterPro:IPR018336"
+ /db_xref="InterPro:IPR020568"
+ /db_xref="InterPro:IPR027408"
+ /db_xref="InterPro:IPR036345"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U076"
+ /translation="MSKREDGRLDHELRPVIITRGFTENPAGSVLIEFGHTKVLCTAS
+ VTEGVPRWRKATGLGWLTAEYAMLPSATHSRSDRESVRGRLSGRTQEISRLISRSLRA
+ CIDLAALGENTIAIDCDVLQADGGTRTAAITGAYVALADAVTYLSAAGKLSDPRPLSC
+ AIAAVSVGVVDGRIRVDLPYEEDSRAEVDMNVVATDTGTLVEIQGTGEGATFARSTLD
+ KLLDMALGACDTLFAAQRDALALPYPGVLPQGPPPPKAFGT"
+ gene 1510017..1510631
+ /locus_tag="BQ2027_MB1376"
+ CDS 1510017..1510631
+ /locus_tag="BQ2027_MB1376"
+ /EC_number="3.6.1.66"
+ /note="Mb1376, -, len: 204 aa. Equivalent to Rv1341, len:
+ 204 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 204 aa overlap). Conserved hypothetical
+ protein, equivalent to ML014|U00014 hypothetical protein
+ B1549_C2_213 from Mycobacterium leprae (285 aa), FASTA
+ scores: opt: 1073, E(): 0, (83.0% identity in 206 aa
+ overlap). Some similarity to P52061|YGGV_ECOLI
+ HYPOTHETICAL PROTEIN yggV (197 aa), FASTA scores: opt:
+ 521, E(): 7.9e-27, (46.0% identity in 200 aa overlap).
+ Protein product from Mb1376 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1376 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Nucleoside 5-triphosphatase RdgB (dHAPTP, dITP,
+ XTP-specific) (EC"
+ /protein_id="SIT99979.1"
+ /db_xref="GOA:P64308"
+ /db_xref="InterPro:IPR002637"
+ /db_xref="InterPro:IPR020922"
+ /db_xref="InterPro:IPR029001"
+ /db_xref="UniProtKB/Swiss-Prot:P64308"
+ /translation="MALVTKLLVASRNRKKLAELRRVLDGAGLSGLTLLSLGDVSPLP
+ ETPETGVTFEDNALAKARDAFSATGLASVADDSGLEVAALGGMPGVLSARWSGRYGDD
+ AANTALLLAQLCDVPDERRGAAFVSACALVSGSGEVVVRGEWPGTIAREPRGDGGFGY
+ DPVFVPYGDDRTAAQLSPAEKDAVSHRGRALALLLPALRSLATG"
+ gene complement(1510628..1510990)
+ /locus_tag="BQ2027_MB1377C"
+ CDS complement(1510628..1510990)
+ /locus_tag="BQ2027_MB1377C"
+ /note="Mb1377c, -, len: 120 aa. Equivalent to Rv1342c,
+ len: 120 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 120 aa overlap). Conserved membrane
+ protein. Highly similar to G466926|P54133 hypothetical
+ protein B1549_F2_59 from Mycobacterium leprae (119 aa),
+ FASTA scores, opt: 544, E(): 1.9e-29, (68.3 % identity in
+ 120 aa overlap). Protein product from Mb1377c detected
+ using SWATH mass spectrometry. Mb1377c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIT99980.1"
+ /db_xref="GOA:P0A5E8"
+ /db_xref="InterPro:IPR023845"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5E8"
+ /translation="MTAPETPAAQHAEPAIAVERIRTALLGYRIMAWTTGLWLIALCY
+ EIVVRYVVKVDNPPTWIGVVHGWVYFTYLLLTLNLAVKVRWPLGKTAGVLLAGTIPLL
+ GIVVEHFQTKEIKARFGL"
+ gene complement(1510987..1511367)
+ /gene="lprD"
+ /locus_tag="BQ2027_MB1378C"
+ CDS complement(1510987..1511367)
+ /gene="lprD"
+ /locus_tag="BQ2027_MB1378C"
+ /note="Mb1378c, lprD, len: 126 aa. Equivalent to Rv1343c,
+ len: 126 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 126 aa overlap). Probable lprD,
+ conserved lipoprotein, highly similar to G466928
+ Mycobacterium leprae protein B1549_F3_106 (126 aa), FASTA
+ scores, opt: 704, E(): 7.5e-36, (78.4 % identity in 125 aa
+ overlap). Has N-terminal signal sequence and appropriately
+ positioned prokaryotic lipoprotein attachment site.
+ Contains PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Mb1378c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN LPRD"
+ /protein_id="SIT99981.1"
+ /db_xref="GOA:A0A1R3XY27"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY27"
+ /translation="MSTTRRRRPALIALVIIATCGCLALGWWQWTRFQSTSGTFQNLG
+ YALQWPLFAWFCVYAYRNFVRYEETPPQPPTGGAAAAIPAGLLPERPKPAQQPPDDPV
+ LREYNAYLAELAKDDARKQNRTTA"
+ gene 1511412..1511732
+ /gene="mbtl"
+ /locus_tag="BQ2027_MB1379"
+ CDS 1511412..1511732
+ /gene="mbtl"
+ /locus_tag="BQ2027_MB1379"
+ /note="Mb1379, -, len: 106 aa. Equivalent to Rv1344, len:
+ 106 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 106 aa overlap). Possible acyl carrier
+ protein, similar to others e.g. ACP_RHIME|P19372 Rhizobium
+ meliloti (77 aa), FASTA scores: opt: 117, E(): 0.03,
+ (29.9% identity in 67 aa overlap) and ACP_SYNY3|P20804
+ acyl carrier protein (acp) from Synechocystis sp (77 aa),
+ FASTA scores: E(): 7.1e-05, (34.8% identity in 66 aa
+ overlap). Also similar to Rv2244 and Rv0033 from
+ Mycobacterium tuberculosis. Protein product from Mb1379
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1379 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="acyl carrier protein (acp) mbtl"
+ /protein_id="SIT99982.1"
+ /db_xref="GOA:P63453"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="UniProtKB/Swiss-Prot:P63453"
+ /translation="MWRYPLSTRLALPNTPGVASFAMTSSPSTVSTTLLSILRDDLNI
+ DLTRVTPDARLVDDVGLDSVAFAVGMVAIEERLGVALSEEELLTCDTVGELEAAIAAK
+ YRDE"
+ gene 1511725..1513290
+ /gene="mbtm"
+ /locus_tag="BQ2027_MB1380"
+ CDS 1511725..1513290
+ /gene="mbtm"
+ /locus_tag="BQ2027_MB1380"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1380, fadD33, len: 521 aa. Equivalent to Rv1345,
+ len: 521 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 521 aa overlap). Possible fadD33,
+ polyketide synthase, similar to N-terminus of T34918
+ polyketide synthase from Streptomyces coelicolor (2297
+ aa); and PKSJ_BACSU|P40806 putative polyketide
+ biosynthesis protein from Bacillus subtilis (557 aa),
+ FASTA scores: opt: 537, E(): 8.2e-27, (27.1% identity in
+ 468 aa overlap). Also similar to other proteins from
+ Mycobacterium tuberculosis eg
+ Rv1013|MTCI237.30|MTCY10G2.36c|pks16 PUTATIVE POLYKETIDE
+ SYNTHASE (544 aa); etc. Protein product from Mb1380
+ detected using SWATH mass spectrometry. Mb1380 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable fatty acyl-amp ligase mbtm"
+ /protein_id="SIT99983.1"
+ /db_xref="GOA:P0A4X9"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR040097"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4X9"
+ /translation="MSELAAVLTRSMQASAGDLMVLDRETSLWCRHPWPEVHGLAESV
+ AAWLLDHDRPAAVGLVGEPTVELVAAIQGAWLAGAAVSILPGPVRGANDQRWADATLT
+ RFLGIGVRTVLSQGSYLARLRSVDTAGVTIGDLSTAAHTNRSATPVASEGPAVLQGTA
+ GSTGAPRTAILSPGAVLSNLRGLNQRVGTDAATDVGCSWLPLYHDMGLAFVLSAALAG
+ APLWLAPTTAFTASPFRWLSWLSDSGATMTAAPNFAYNLIGKYARRVSEVDLGALRVT
+ LNGGEPVDCDGLTRFAEAMAPFGFDAGAVLPSYGLAESTCAVTVPVPGIGLLADRVID
+ GSGAHKHAVLGNPIPGMEVRISCGDQAAGNASREIGEIEIRGASMMAGYLGQQPIDPD
+ DWFATGDLGYLGAGGLVVCGRAKEVISIAGRNIFPTEVELVAAQVRGVREGAVVALGT
+ GDRSTRPGLVVAAEFRGPDEANARAELIQRVASECGIVPSDVVFVSPGSLPRTSSGKL
+ RRLAVRRSLEMAD"
+ gene 1513290..1514450
+ /gene="mbtn"
+ /locus_tag="BQ2027_MB1381"
+ CDS 1513290..1514450
+ /gene="mbtn"
+ /locus_tag="BQ2027_MB1381"
+ /note="Mb1381, fadE14, len: 386 aa. Equivalent to Rv1346,
+ len: 386 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 386 aa overlap). Possible fadE14,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), similar to many e.g.
+ NP_251579.1|NC_002516 probable acyl-CoA dehydrogenase from
+ Pseudomonas aeruginosa (386 aa);
+ NP_036951.1|NM_012819|ACDL_RAT|P15650 acyl Coenzyme A
+ dehydrogenase (long chain) from Rattus norvegicus (430
+ aa), FASTA scores: opt: 414, E(): 1.2e-18, (26.1% identity
+ in 376 aa overlap); etc. Protein product from Mb1381
+ detected using SWATH mass spectrometry. Mb1381 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="acyl-coa dehydrogenase mbtn"
+ /protein_id="SIT99984.1"
+ /db_xref="GOA:P63432"
+ /db_xref="InterPro:IPR006091"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR013786"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR037069"
+ /db_xref="UniProtKB/Swiss-Prot:P63432"
+ /translation="MTAGSDLDDFRGLLAKAFDERVVAWTAEAEAQERFPRQLIEHLG
+ VCGVFDAKWATDARPDVGKLVELAFALGQLASAGIGVGVSLHDSAIAILRRFGKSDYL
+ RDICDQAIRGAAVLCIGASEESGGSDLQIVETEIRSRDGGFEVRGVKKFVSLSPIADH
+ IMVVARSVDHDPTSRHGNVAVVAVPAAQVSVQTPYRKVGAGPLDTAAVCIDTWVPADA
+ LVARAGTGLAAISWGLAHERMSIAGQIAASCQRAIGITLARMMSRRQFGQTLFEHQAL
+ RLRMADLQARVDLLRYALHGIAEQGRLELRTAAAVKVTAARLGEEVISECMHIFGGAG
+ YLVDETTLGKWWRDMKLARVGGGTDEVLWELVAAGMTPDHDGYAAVVGASKA"
+ gene complement(1514417..1515049)
+ /gene="mbtk"
+ /locus_tag="BQ2027_MB1382C"
+ CDS complement(1514417..1515049)
+ /gene="mbtk"
+ /locus_tag="BQ2027_MB1382C"
+ /note="Mb1382c, -, len: 210 aa. Equivalent to Rv1347c,
+ len: 210 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 210 aa overlap). Conserved hypothetical
+ protein, some similarity to the C-terminus of
+ malonyl-coenzyme A carboxylases e.g. G545170
+ malonyl-coenzyme A carboxylase (417 aa), FASTA scores:
+ opt: 392, E(): 4.9 e-20, (35.6% identity in 174 aa
+ overlap). Protein product from Mb1382c detected using
+ SWATH mass spectrometry. Mb1382c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="lysine n-acetyltransferase mbtk"
+ /protein_id="SIT99985.1"
+ /db_xref="GOA:P64820"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="InterPro:IPR019432"
+ /db_xref="UniProtKB/Swiss-Prot:P64820"
+ /translation="MTKPTSAGQADDALVRLARERFDLPDQVRRLARPPVPSLEPPYG
+ LRVAQLTDAEMLAEWMNRPHLAAAWEYDWPASRWRQHLNAQLEGTYSLPLIGSWHGTD
+ GGYLELYWAAKDLISHYYDADPYDLGLHAAIADLSKVNRGFGPLLLPRIVASVFANEP
+ RCRRIMFDPDHRNTATRRLCEWAGCKFLGEHDTTNRRMALYALEAPTTAA"
+ gene 1515172..1515255
+ /locus_tag="BQ2027_LEUW"
+ tRNA 1515172..1515255
+ /locus_tag="BQ2027_LEUW"
+ /product="tRNA-Leu"
+ /note="leuW, len: 84 nt. Equivalent to leuW, len: 84 nt,
+ from Mycobacterium tuberculosis strain H37RV, (100.0%
+ identity in 84 nt overlap). tRNA-Leu, anticodon tag."
+ gene 1515491..1518070
+ /gene="irta"
+ /locus_tag="BQ2027_MB1383"
+ CDS 1515491..1518070
+ /gene="irta"
+ /locus_tag="BQ2027_MB1383"
+ /note="Mb1383, -, len: 859 aa. Equivalent to Rv1348, len:
+ 859 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 859 aa overlap). Probable
+ drugs-transport transmembrane protein ATP binding protein
+ ABC transporter (see citation below), similar to
+ HMT1_SCHPO|Q02592 heavy metal tolerance protein precursor
+ from Schizosaccharomyces pombe (830 aa), FASTA scores:
+ opt: 806, E(): 5.1e-39, (32.9% identity in 504 aa
+ overlap); etc. Also similar to MTCY02B10.13 from
+ Mycobacterium tuberculosis, FASTA score: (31.9% identity
+ in 576 aa overlap). Contains PS00017 ATP/GTP-binding site
+ motif A (P-loop), and PS00211 ABC transporters family
+ signature. BELONGS TO THE ATP-BINDING TRANSPORT PROTEIN
+ FAMILY (ABC TRANSPORTERS). Protein product from Mb1383
+ detected using SWATH mass spectrometry. Mb1383 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="iron-regulated transporter irta"
+ /protein_id="SIT99986.1"
+ /db_xref="GOA:P63392"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR007037"
+ /db_xref="InterPro:IPR011527"
+ /db_xref="InterPro:IPR013113"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR017927"
+ /db_xref="InterPro:IPR017938"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036640"
+ /db_xref="InterPro:IPR039261"
+ /db_xref="UniProtKB/Swiss-Prot:P63392"
+ /translation="MARGLQGVMLRSFGARDHTATVIETISIAPHFVRVRMVSPTLFQ
+ DAEAEPAAWLRFWFPDPNGSNTEFQRAYTISEADPAAGRFAVDVVLHDPAGPASSWAR
+ TVKPGATIAVMSLMGSSRFDVPEEQPAGYLLIGDSASIPGMNGIIETVPNDVPIEMYL
+ EQHDDNDTLIPLAKHPRLRVRWVMRRDEKSLAEAIENRDWSDWYAWATPEAAALKCVR
+ VRLRDEFGFPKSEIHAQAYWNAGRAMGTHRATEPAATEPEVGAAPQPESAVPAPARGS
+ WRAQAASRLLAPLKLPLVLSGVLAALVTLAQLAPFVLLVELSRLLVSGAGAHRLFTVG
+ FAAVGLLGTGALLAAALTLWLHVIDARFARALRLRLLSKLSRLPLGWFTSRGSGSIKK
+ LVTDDTLALHYLVTHAVPDAVAAVVAPVGVLVYLFVVDWRVALVLFGPVLVYLTITSS
+ LTIQSGPRIVQAQRWAEKMNGEAGSYLEGQPVIRVFGAASSSFRRRLDEYIGFLVAWQ
+ RPLAGKKTLMDLATRPATFLWLIAATGTLLVATHRMDPVNLLPFMFLGTTFGARLLGI
+ AYGLGGLRTGLLAARHLQVTLDETELAVREHPREPLDGEAPATVVFDHVTFGYRPGVP
+ VIQDVSLTLRPGTVTALVGPSGSGKSTLATLLARFHDVERGAIRVGGQDIRSLAADEL
+ YTRVGFVLQEAQLVHGTAAENIALAVPDAPAEQVQVAAREAQIHDRVLRLPDGYDTVL
+ GANSGLSGGERQRLTIARAILGDTPVLILDEATAFADPESEYLVQQALNRLTRDRTVL
+ VIAHRLHTITRADQIVVLDHGRIVERGTHEELLAAGGRYCRLWDTGQGSRVAVAAAQD
+ GTR"
+ gene 1518067..1519806
+ /gene="irtb"
+ /locus_tag="BQ2027_MB1384"
+ CDS 1518067..1519806
+ /gene="irtb"
+ /locus_tag="BQ2027_MB1384"
+ /note="Mb1384, -, len: 579 aa. Equivalent to Rv1349, len:
+ 579 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 579 aa overlap). Probable
+ drugs-transport transmembrane ATP binding protein ABC
+ transporter (see citation below), most similar to
+ YWJA_BACSU|P45861 hypothetical ABC transporter from
+ Bacillus subtilis (575 aa), FASTA scores: opt: 721, E():
+ 1.8e-35, (28.9% identity in 567 aa overlap); etc. Also
+ similar to MTCY02B10.12 from Mycobacterium tuberculosis,
+ FASTA score: (31.9% identity in 576 aa overlap). Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop), and PS00211
+ ABC transporters family signature. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Mb1384 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="iron-regulated transporter irtb"
+ /protein_id="SIT99987.1"
+ /db_xref="GOA:P63394"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR011527"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036640"
+ /db_xref="UniProtKB/Swiss-Prot:P63394"
+ /translation="MIRTWIALVPNDHRARLIGFALLAFCSVVARAVGTVLLVPLMAA
+ LFGEAPQRAWLWLGWLSAATVAGWVLDAVTARIGIELGFAVLNHTQHDVADRLPVVRL
+ DWFTAENTATARQAIAATGPELVGLVVNLVTPLTSAILLPAVIALALLPISWQLGVAA
+ LAGVPLLLGALWASAAFARRADTAADKANTALTERIIEFARTQQALRAARRVEPARSL
+ VGNALASQHTATMRLLGMQIPGQLLFSIASQLALIVLAGTTAALTITGTLTVPEAIAL
+ IVVMVRYLEPFTAVSELAPALESTRATLGRIGSVLTAPVMVAGSGTWRDGAVVPRIEF
+ DDVAFGYDGGSGPVLDGVSFCLQPGTTTAIVGPSGCGKSTILALIAGLHQPTRGRVLI
+ DGTDVATLDARAQQAVCSVVFQHPYLFHGTIRDNVFAADPGASDDQFAQAVRLARVDE
+ LIARLPDGANTIVGEAGSALSGGERQRVSIARALLKAAPVLLVDEATSALDAENEAAV
+ VDALAADPRSRTRVIVAHRLASIRHADRVLFVDDGRVVEDGSISELLTAGGRFSQFWR
+ QQHEAAEWQILAE"
+ gene 1519935..1520678
+ /gene="fabG2"
+ /locus_tag="BQ2027_MB1385"
+ CDS 1519935..1520678
+ /gene="fabG2"
+ /locus_tag="BQ2027_MB1385"
+ /note="Mb1385, fabG2, len: 247 aa. Equivalent to Rv1350,
+ len: 247 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 247 aa overlap). Probable fabG2,
+ 3-oxoacyl-[acyl-carrier protein] reductase (EC 1.1.1.100),
+ highly similar to many e.g. NP_350157.1|NC_003030
+ 3-ketoacyl-acyl carrier protein reductase from Clostridium
+ acetobutylicum (249 aa); NP_229523.1|NC_000853
+ 3-oxoacyl-(acyl carrier protein) reductase from Thermotoga
+ maritima (246 aa); AAC44307.1|U59433 3-ketoacyl-acyl
+ carrier protein reductase from Bacillus subtilis (246 aa);
+ etc. Contains PS00061 Short-chain
+ dehydrogenases/reductases family signature. BELONGS TO THE
+ SHORT-CHAIN DEHYDROGENASES/REDUCTASES (SDR) FAMILY.
+ Protein product from Mb1385 detected using SWATH mass
+ spectrometry. Mb1385 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable 3-oxoacyl-[acyl-carrier protein]
+ reductase fabg2 (3-ketoacyl-acyl carrier protein
+ reductase)"
+ /protein_id="SIT99988.1"
+ /db_xref="GOA:P66782"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P66782"
+ /translation="MASLLNARTAVITGGAQGLGLAIGQRFVAEGARVVLGDVNLEAT
+ EVAAKRLGGDDVALAVRCDVTQADDVDILIRTAVERFGGLDVMVNNAGITRDATMRTM
+ TEEQFDQVIAVHLKGTWNGTRLAAAIMRERKRGAIVNMSSVSGKVGMVGQTNYSAAKA
+ GIVGMTKAAAKELAHLGIRVNAIAPGLIRSAMTEAMPQRIWDQKLAEVPMGRAGEPSE
+ VASVAVFLASDLSSYMTGTVLDVTGGRFI"
+ gene 1520675..1521004
+ /locus_tag="BQ2027_MB1386"
+ CDS 1520675..1521004
+ /locus_tag="BQ2027_MB1386"
+ /note="Mb1386, -, len: 109 aa. Equivalent to Rv1351, len:
+ 109 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 109 aa overlap). Hypothetical unknown
+ protein. Mb1386 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99989.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64822"
+ /translation="MTPRSLPRYGNSSRRKSFPMHRPSNVATATRKKSSIGWVLLACS
+ VAGCKGIDTTEFILGRAGAFELAVRAAQHRHRYLTMVNVGRAPPRRCRTVCMAATDTP
+ RNIRLNG"
+ gene 1521207..1521578
+ /locus_tag="BQ2027_MB1387"
+ CDS 1521207..1521578
+ /locus_tag="BQ2027_MB1387"
+ /note="Mb1387, -, len: 123 aa. Equivalent to Rv1352, len:
+ 123 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 123 aa overlap). Conserved hypothetical
+ protein, some similarity to Rv1906c|MTCY180.12
+ hypothetical protein from Mycobacterium tuberculosis (156
+ aa), FASTA scores: E(): 4e-05, (36.2% identity in 116 aa
+ overlap). Protein product from Mb1387 detected using SWATH
+ mass spectrometry. Mb1387 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIT99990.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64824"
+ /translation="MARTLALRASAGLVAGMAMAAITLAPGARAETGEQFPGDGVFLV
+ GTDIAPGTYRTEGPSNPLILVFGRVSELSTCSWSTHSAPEVSNENIVDTNTSMGPMSV
+ VIPPTVAAFQTHNCKLWMRIS"
+ gene complement(1521644..1522429)
+ /locus_tag="BQ2027_MB1388C"
+ CDS complement(1521644..1522429)
+ /locus_tag="BQ2027_MB1388C"
+ /note="Mb1388c, -, len: 261 aa. Equivalent to Rv1353c,
+ len: 261 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 261 aa overlap). Probable
+ transcriptional regulatory protein, similar to
+ TER1_ECOLI|P03038 tetracycline repressor protein class A
+ from Escherichia coli (216 aa), FASTA scores, opt: 231,
+ E(): 1.6e-08, (31.3% identity in 211 aa overlap). Helix
+ turn helix motif present at aa 3859 (+3.59 SD). BELONGS TO
+ THE TETR/ACRR FAMILY OF TRANSCRIPTIONAL REGULATORS."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99991.1"
+ /db_xref="GOA:P67435"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR004111"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR023772"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/Swiss-Prot:P67435"
+ /translation="MQTTPGKRQRRQRGSINPEDIISGAFELAQQVSIDNLSMPLLGK
+ HLGVGVTSIYWYFRKKDDLLNAMTDRALSKYVFATPYIEAGDWRETLRNHARSMRKTF
+ ADNPVLCDLILIRAALSPKTARLGAQEMEKAIANLVTAGLSLEDAFDIYSAVSVHVRG
+ SVVLDRLSRKSQSAGSGPSAIEHPVAIDPATTPLLAHATGRGHRIGAPDETNFEYGLE
+ CILDHAGRLIEQSSKAAGEVAVRRPTATADAPTPGARAKAVAR"
+ gene complement(1522449..1524320)
+ /locus_tag="BQ2027_MB1389C"
+ CDS complement(1522449..1524320)
+ /locus_tag="BQ2027_MB1389C"
+ /note="Mb1389c, -, len: 623 aa. Equivalent to Rv1354c,
+ len: 623 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 623 aa overlap). Conserved hypothetical
+ protein, similar to many hypothetical proteins e.g. the
+ C-terminus of G1001455 Synechocystis sp. (1244 aa), FASTA
+ scores: opt: 933, E(): 0, (36.8% identity in 462 aa
+ overlap); also similar to Rv1357c|MTCY02B10.21c (34.0%
+ identity in 253 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="Sensory box/GGDEF family protein"
+ /protein_id="SIT99992.1"
+ /db_xref="InterPro:IPR000160"
+ /db_xref="InterPro:IPR001633"
+ /db_xref="InterPro:IPR003018"
+ /db_xref="InterPro:IPR029016"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="InterPro:IPR035919"
+ /db_xref="UniProtKB/Swiss-Prot:P64826"
+ /translation="MCNDTATPQLEELVTTVANQLMTVDAATSAEVSQRVLAYLVEQL
+ GVDVSFLRHNDRDRRATRLVAEWPPRLNIPDPDPLRLIYFADADPVFALCEHAKEPLV
+ FRPEPATEDYQRLIEEARGVPVTSAAAVPLVSGEITTGLLGFIKFGDRKWHEAELNAL
+ MTIATLFAQVQARVAAEARLRYLADHDDLTGLHNRRALLQHLDQRLAPGQPGPVAALF
+ LDLDRLKAINDYLGHAAGDQFIHVFAQRIGDALVGESLIARLGGDEFVLIPASPMSAD
+ AAQPLAERLRDQLKDHVAIGGEVLTRTVSIGVASGTPGQHTPSDLLRRADQAALAAKH
+ AGGDSVAIFTADMSVSGELRNDIELHLRRGIESDALRLVYLPEVDLRTGDIVGTEALV
+ RWQHPTRGLLAPGCFIPVAESINLAGELDRWVLRRACNEFSEWQSAGLGHDALLRINV
+ SAGQLVTGGFVDFVADTIGQHGLDASSVCLEITENVVVQDLHTARATLARLKEVGVHI
+ AIDDFGTGYSAISLLQTLPIDTLKIDKTFVRQLGTNTSDLVIVRGIMTLAEGFQLDVV
+ AEGVETEAAARILLDQRCYRAQGFLFSRPVPGEAMRHMLSARRLPPTCIPATDPALS"
+ gene complement(1524329..1526476)
+ /gene="moeY"
+ /locus_tag="BQ2027_MB1390C"
+ CDS complement(1524329..1526476)
+ /gene="moeY"
+ /locus_tag="BQ2027_MB1390C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1390c, moeY, len: 715 aa. Equivalent to Rv1355c,
+ len: 715 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 715 aa overlap). Possible moeY,
+ Molybdopterin biosynthesis protein, very weak similarity
+ to MOEB_ECOLI|P12282 molybdopterin biosynthesis moeb
+ protein (249 aa), FASTA scores, opt: 180, E(): 8.5e-05,
+ (29.3% identity in 174 aa overlap). Mb1390c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MOLYBDOPTERIN BIOSYNTHESIS PROTEIN
+ MOEY"
+ /protein_id="SIT99993.1"
+ /db_xref="GOA:A0A1R3Y090"
+ /db_xref="InterPro:IPR000415"
+ /db_xref="InterPro:IPR000594"
+ /db_xref="InterPro:IPR035985"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y090"
+ /translation="MTIPHEGGSTGILVLRDDDHDDVLVLDRLRSDPSIEFVDRFAEQ
+ LAGVRRLLPQPDPDLLEEAKRWAYYPWRRMVVAILGPRGFRAVRLDRNRHLITAEEQR
+ ALHALRVGVVGLSAGHAIAYTLAAEGACGTLRLADFDKIELSNLNRVPVGVFDIGLNK
+ AMIAARRIAELDPYLAVDLVTSGLSPESVDEFLDGLDVVIEECDSLDIKVILRQAACA
+ RGVPVLMATSDRGLVDVERYDVEPGRPIFHGLLGDIDADKLCGLTTKDKVPHVLNILD
+ CQELSARCAASMIEVDQTLWGWPQLAGDIWVGAATVAEAVRRIGLGEPLESGRVRVDV
+ SAALDRLDQPPMPSRGNGWLLESVPPTAPAEPQPTSEIVAQAAIRAPSGGNVQPWHVV
+ AKQHSLTIRLAPEHTSAMDIAFRGSAVAVGAAMFNARVAAAAHRVLGSVEFDESQPDS
+ PLQATMHFGRGDDPSLAALYRPMLLRTTNRHHGMPGHVHPATVELLTNTAAAEGARLQ
+ LLLSRNEIDRAATILAAADRIRYLTPRLHEEMMSELRWPGDPSLDAGIDVRSLELDSG
+ ELRVLDILRRSDVVARLAQWDCGTALEDNTNERVSASSALAIVYVDGATLTDFARGGS
+ AMQAVWIVAQQHGLAVQPMSPIFLYARGRHDLDQASPHFAAQLHRLQLDFRELVKPGK
+ EGHEVLIFRLFHAPPPSVCSRRRVRHAIPEPHR"
+ gene complement(1526473..1527264)
+ /locus_tag="BQ2027_MB1391C"
+ CDS complement(1526473..1527264)
+ /locus_tag="BQ2027_MB1391C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1391c, -, len: 263 aa. Equivalent to Rv1356c,
+ len: 263 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 263 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIT99994.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64828"
+ /translation="MLIAGYLTDWRIMTTAQLRPIAPQKLHFSENLSVWVSDAQCRLV
+ VSQPALDPTLWNTYLQGALRAYSKHGVECTLDLDAISDGSDTQLFFAAIDIGGDVVGG
+ ARVIGPLRSADDSHAVVEWAGNPGLSAVRKMINDRAPFGVVEVKSGWVNSDAQRSDAI
+ AAALARALPLSMSLLGVQFVMGTAAAHALDRWRSSGGVIAARIPAAAYPDERYRTKMI
+ WWDRRTLANHAEPKQLSRMLVESRKLLRDVEALSATTAATAGAEQ"
+ gene complement(1527737..1528660)
+ /locus_tag="BQ2027_MB1392C"
+ CDS complement(1527737..1528660)
+ /locus_tag="BQ2027_MB1392C"
+ /note="Mb1392c, -, len: 307 aa. Equivalent to Rv1357c,
+ len: 307 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 307 aa overlap). Conserved hypothetical
+ protein, similar to members of the YEGE/YHJK/YJCC family
+ e.g. Y4LL_RHISN|P55552 hypothetical protein Y4ll from
+ Rhizobium sp. (827 aa), FASTA scores: E(): 0, (37.7%
+ identity in 257 aa overlap), also similar to
+ Rv1354c|MTCY02B10.18c (34.0% identity in 253 aa overlap).
+ BELONGS TO THE YEGE/YHDA/YHJK/YJCC FAMILY."
+ /codon_start=1
+ /transl_table=11
+ /product="Sensory box/GGDEF family protein"
+ /protein_id="SIT99995.1"
+ /db_xref="GOA:P64830"
+ /db_xref="InterPro:IPR001633"
+ /db_xref="InterPro:IPR035919"
+ /db_xref="UniProtKB/Swiss-Prot:P64830"
+ /translation="MDRCCQRATAFACALRPTKLIDYEEMFRGAMQARAMVANPDQWA
+ DSDRDQVNTRHYLSTSMRVALDRGEFFLVYQPIIRLADNRIIGAEALLRWEHPTLGTL
+ LPGRFIDRAENNGLMVPLTAFVLEQACRHVRSWRDHSTDPQPFVSVNVSASTICDPGF
+ LVLVEGVLGETGLPAHALQLELAEDARLSRDEKAVTRLQELSALGVGIAIDDFGIGFS
+ SLAYLPRLPVDVVKLGGKFIECLDGDIQARLANEQITRAMIDLGDKLGITVTAKLVET
+ PSQAARLRAFGCKAAQGWHFAKALPVDFFRE"
+ gene 1529056..1532535
+ /locus_tag="BQ2027_MB1393"
+ CDS 1529056..1532535
+ /locus_tag="BQ2027_MB1393"
+ /note="Mb1393, -, len: 1159 aa. Equivalent to Rv1358, len:
+ 1159 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 1159 aa overlap). Probable
+ transcriptional regulatory protein, some similarity to
+ AFSR_STRCO|P25941 regulatory protein afsr from
+ Streptomyces coelicolor (993 aa), FASTA scores: opt: 210,
+ E(): 5.5e-06, (27.5% identity in 739 aa overlap). Similar
+ also to Rv0890C|MTCY31.18c (65.5% identity in 884 aa
+ overlap) and to Rv1359|MTCY02B10.23 (43.7% identity in 197
+ aa overlap). Contains PS00017 ATP/GTP-binding site motif
+ A, PS00622 Bacterial regulatory proteins, luxR family
+ signature. Helix turn helix motif present at aa 1116-1137,
+ (Score 1291, +3.59 SD)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99996.1"
+ /db_xref="GOA:A0A1R3XYI6"
+ /db_xref="InterPro:IPR000792"
+ /db_xref="InterPro:IPR011990"
+ /db_xref="InterPro:IPR016032"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYI6"
+ /translation="MFLSAPAFRVEPTRSRHSALRWARHRRFADVPRWQMLRSLQIAD
+ QIARTGHMPVRRLDLIWISARNAARRELDLGVAALVEAVTLLTADVEGSTRLSQTRLN
+ ELAADYPTLDQNISEAVAAHGGVTRPVDQEVGSGLVVAFLRAGDAIACALELQLSTLA
+ PMRPRVGVHTGDVRLRGDGTITGSAINESACLRDLAHEGQTLLSAATGDLVIDQLPAN
+ TWLTDVGKYPLRGLHRQERVIQLCHRDLRNEFPPLRMSVGNRSSLPAQFTTFVGRDAQ
+ INEVQEVLTNYRLVTLRGEGGVGKTRLAIQIAAASEFRDGLCFVDLAPIADPGMVSTT
+ AAHALGLIDRPGSSTFDTLSHAIGNCHMLMVLDNCEHVLDACAELVVELLGACPELSI
+ LATSRESIGVTGEVTWVVPSLSPANEAIQLFTERARLVQPNFEIVADNFAAVSEICRR
+ LDGMPLAIELAAARLRSLSPNEIANSLDDRFRLLTGGARSTVQRQQTLRASMDWSYAL
+ LTDTERILFRRLAVFVGGFDLTAASEVAAAGGDDFVERYSVLDQLTLLVDKSLVVAEE
+ SRGSTRYRLLETVRQYALEKLNESEEIDGVRARHRTHYATMAAGLNVPASTDYEQRLL
+ QAEAEIDNLRAAFTWSRGNGDIAAALQLASALQPLWSQGRMREGLAWLESILEREGDN
+ HLVPAGVWARALAEKVILKAWPATSPMGAPDIVAQAHHALALARDAGDCAVLARALVA
+ CGCGSGCDTEAAQPYFAEAIELARAINDEWTLSQIDYWQVVGIFISGQPIPLRAAAEQ
+ ARELADSIGNRFVSRQCRLFACLAQIWEGDANGALALSRDVTAEAEVANDVVTKVLGL
+ YVEAMALSYIGDSAARTIAGAALEAATELGGIYQDLGYGAITRAALAAGDVAAIEASE
+ ASWDLRNQHNVVTAHHELMAQAALVRGDVTTARRFADEAVLASTGWHLMMALIARARV
+ AIAQDELGKARDDAHAAVACGVGVQTYLAMPDALELLAGLAGEAGNHGQAVRLFGAAA
+ AQRQRTGEVRHKIWDAGYEAATAALRDAMGDEDFTAAWAEGAAAPLDEAIAYAQRGRG
+ ERKRPSNGWDALTPAEHKIVKLVTEGLVTKDIAARLFVSPRTVQTHLTHIYTKLDVTS
+ RVQLVQEAAQHST"
+ gene 1532617..1533369
+ /locus_tag="BQ2027_MB1394"
+ CDS 1532617..1533369
+ /locus_tag="BQ2027_MB1394"
+ /note="Mb1394, -, len: 250 aa. Equivalent to Rv1359, len:
+ 250 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 250 aa overlap). Probable
+ transcriptional regulatory protein, similar to
+ Rv0891c|MTCY31.19c, (48.5% identity in 204 aa overlap) and
+ to Rv1358|MTCY02B10.22 (43.7% identity in 197 aa
+ overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIT99997.1"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY50"
+ /translation="MFMALRAPMLERMNGLHTDDAPVNWLERRGGRLTSRRRVTLLHA
+ GVEHPMRLWGVQSEAITAAMVLSRKVSAIIAGHCGVRLVDQGVGDGFVAAFAHASDAV
+ ACALELHQAPLSPIVLRIGIHTGEAQLVDERIYAGATMNLAAELRDLAHGGQTVMSGA
+ TEDAVLGRLPMRAWLIGLRPMEGSPERHNFPQSQRIAQLCHPNLRNTFPPLRMRIADA
+ SGIPYVGRILVNVQVVPHWEGGCAAAGMVLAG"
+ gene 1533792..1534814
+ /locus_tag="BQ2027_MB1395"
+ CDS 1533792..1534814
+ /locus_tag="BQ2027_MB1395"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1395, -, len: 340 aa. Equivalent to Rv1360, len:
+ 340 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 340 aa overlap). Probable oxidoreductase
+ (EC 1.-.-.-). Similar to Q49598|G1002714 coenzyme
+ F420-dependent n5, n10-methylenetetrahydromethanopterin
+ reductase from Methanopyrus kandleri (349 aa), FASTA
+ scores: opt: 264, E(): 4.4e-11, (26.3% identity in 323 aa
+ overlap). Protein product from Mb1395 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1395 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="SIT99998.1"
+ /db_xref="GOA:P64832"
+ /db_xref="InterPro:IPR011251"
+ /db_xref="InterPro:IPR019919"
+ /db_xref="InterPro:IPR036661"
+ /db_xref="UniProtKB/Swiss-Prot:P64832"
+ /translation="MGGARRLKLDGSIPNQLARAADAAVALERNGFDGGWTAEASHDP
+ FLPLLLAAEHTSRLELGTNIAVAFARNPMIVANVGWDLQTYSKGRLILGLGTQIRPHI
+ EKRFSMPWGHPARRMREFVAALRAIWLAWQDGTKLCFEGEFYTHKIMTPMFTPEPQPY
+ PVPRVFIAAVGEAMTEMCGEVADGHLGHPMVSKRYLTEVSVPALLRGLARSGRDRSAF
+ EVSCEVMVATGADDAELAAACTATRKQIAFYGSTPAYRKVLEQHGWGDLHPELHRLSK
+ LGEWEAMGGLIDDEMLGAFAVVGPVDTIAGALRNRCEGVVDRVLPIFMAASQECINAA
+ LQDFRR"
+ gene complement(1534887..1536077)
+ /gene="PPE19"
+ /locus_tag="BQ2027_MB1396C"
+ CDS complement(1534887..1536077)
+ /gene="PPE19"
+ /locus_tag="BQ2027_MB1396C"
+ /standard_name="mtb39b"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1396c, PPE19, len: 396 aa. Similar to Rv1361c,
+ len: 396 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (92.9% identity in 396 aa overlap). PPE19 (alternate gene
+ name: mtb39b). Member of the Mycobacterium tuberculosis
+ PPE family of glycine-rich proteins, highly similar to
+ many e.g. Rv1196|MTCI364.08|PPE18, FASTA scores: E(): 0,
+ (84.9% identity in 397 aa overlap); MTCY274.23c (42.3%
+ identity in 416 aa overlap); etc. Contains PS00501 Signal
+ peptidases I serine active site. Note that expression of
+ Rv1361c was demonstrated in lysates by immunodetection
+ (see first citation below). REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium bovis, the PPE19 gene contains nine
+ substitutions compared to Mycobacterium tuberculosis
+ strain H37Rv. Mb1396c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe19"
+ /protein_id="SIT99999.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY45"
+ /translation="MVDFGALPPEINSARMYAGPGSASLVAAAQMWDSVASDLFSAAS
+ AFQSVVWGLTVGSWIGSSAGLMVAAASPYVAWMSVTAGQAELTAAQVRVAAAAYETAY
+ GLTVPPPVIAENRAELMILIATNLLGQNTPAIAVNEAEYGEMWAQDAAAMFGYAAATA
+ TATATLLPFEEAPEMTSAGGLLEQAAAVEEASDTAAANQLMNNVPQALQQLAQPTQGT
+ TPSSKLGGLWKTVSPHLSPISNIVSMLNNHVSMTNSGVSMTNTLHSMLKGFAPAAAQA
+ VETAAQNGVQAMSSLGSQLGSSLGSSGLGAGVAANLGRAASVGSLSVPPAWAAANQAV
+ TPAARALPLTSLTSAAQTAPGHMLGGLPLGQLTNSGGGFGGVSNALRMPPRAYVMPRV
+ PAAG"
+ gene complement(1536392..1537054)
+ /locus_tag="BQ2027_MB1397C"
+ CDS complement(1536392..1537054)
+ /locus_tag="BQ2027_MB1397C"
+ /note="Mb1397c, -, len: 220 aa. Equivalent to Rv1362c,
+ len: 220 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 220 aa overlap). Possible membrane
+ protein, similar to Mycobacterium tuberculosis
+ hypothetical proteins e.g. Rv1362c|MTCY02B10.27c (25.9%
+ identity in 216 aa overlap), Rv0177, Rv1973, Rv1972, etc.
+ Protein product from Mb1397c detected using SWATH mass
+ spectrometry. Mb1397c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIU00000.1"
+ /db_xref="GOA:A0A1R3XY64"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY64"
+ /translation="MTDDVRDVNTETTDATEVAEIDSAAGEAGDSATEAFDTDSATES
+ TAQKGQRHRDLWRMQVTLKPVPVILILLMLISGGATGWLYLEQYRPDQQTDSGAARAA
+ GAAASDGTIALLSYSPDTLDQDFATARSHLAGDFLSYYDQFTQQIVAPAAKQKSLKTT
+ AKVVRAAVSELHPDSAVVLVFVDQSTTSKDSPNPSMAASSVMVTLAKVDGNWLITKFT
+ PV"
+ gene complement(1537051..1537836)
+ /locus_tag="BQ2027_MB1398C"
+ CDS complement(1537051..1537836)
+ /locus_tag="BQ2027_MB1398C"
+ /note="Mb1398c, -, len: 261 aa. Equivalent to Rv1363c,
+ len: 261 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 261 aa overlap). Possible membrane
+ protein, similar to Mycobacterium tuberculosis
+ hypothetical proteins Rv1362c|MTCY02B10.26c (25.9%
+ identity in 216 aa overlap); Rv1972|MTV051.10 and Rv0177
+ etc. Protein product from Mb1398c detected using SWATH
+ mass spectrometry. Mb1398c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIU00001.1"
+ /db_xref="GOA:A0A1R3XY48"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY48"
+ /translation="MAETTEPPSDAGTSQADAMALAAEAEAAEAEALAAAARARARAA
+ RLKREALAMAPAEDENVPEEYADWEDAEDYDDYDDYEAADQEAARSASWRRRLRVRLP
+ RLSTIAMAAAVVIICGFTGLSGYIVWQHHEATERQQRAAAFAAGAKQGVINMNSLDFN
+ KAKEDVARVIDSSTGEFRDDFQQRAADFTKVVEQSKVVTEGTVNATAVESMNEHSAVV
+ LVAATSRVTNSAGAKDEPRAWRLKVTVTEEGGQYKMSKVEFVP"
+ gene complement(1538127..1540088)
+ /locus_tag="BQ2027_MB1399C"
+ CDS complement(1538127..1540088)
+ /locus_tag="BQ2027_MB1399C"
+ /note="Mb1399c, -, len: 653 aa. Equivalent to Rv1364c,
+ len: 653 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 653 aa overlap). Conserved hypothetical
+ protein, some similarity to RSBU_BACSU|P40399 sigma factor
+ sibg regulation protein from Bacillus subtilis (335 aa),
+ FASTA scores: opt: 224, E(): 2e-07, (25.8% identity in 244
+ aa overlap). Protein product from Mb1399c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1399c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible sigma factor regulatory protein"
+ /protein_id="SIU00002.1"
+ /db_xref="GOA:A0A1R3XY52"
+ /db_xref="InterPro:IPR000014"
+ /db_xref="InterPro:IPR000700"
+ /db_xref="InterPro:IPR001932"
+ /db_xref="InterPro:IPR002645"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR013656"
+ /db_xref="InterPro:IPR035965"
+ /db_xref="InterPro:IPR036457"
+ /db_xref="InterPro:IPR036513"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY52"
+ /translation="MAAEMDWDKTVGAAEDVRRIFEHIPAILVGLEGPDHRFVAVNAA
+ YRGFSPLLDTVGQPAREVYPELEGQQIYEMLDRVYQTGEPQSGSEWRLQTDYDGSGVE
+ ERYFDFVVTPRRRADGSIEGVQLIVDDVTSRVRARQAAEARVEELSERYRNVRDSATV
+ MQQALLAASVPVVPGADIAAEYLVAAEDTAAGGDWFDALALGDRLVLVVGDVVGHGVE
+ AAAVMSQLRTALRMQISTGYTVVEALEAVDRFHKQVPGSKSATMCVGSLDFTSGEFQY
+ CTAGHPPPLLVTADASARYVEPTGAGPLGSGTGFPVRSEVLNIGDAILFYTDGLIERP
+ GRPLEASTAEFADLAASIASGSGGFVLDAPARPIDRLCSDTLELLLRSTGYNDDVTLL
+ AMQRRAPTPPLHITLDATINAARTVRAQLREWLAEIGADHSDIADIVHAISEFVENAV
+ EHGYATDVSKGIVVEAALAGDGNVRASVIDRGQWKDHRDGARGRGRGLAMAEALVSEA
+ RIMHGAGGTTATLTHRLSRPARFVTDTMVRRAAFQQTIDSEFVSLVESGRIVVRGDVD
+ STTAATLDRQIAVESRSGIAPVTIDLSAVTHLGSAGVGALAAACDRARKQGTECVLVA
+ PPGSPAHHVLSLVQLPVVGADTEDIFAQE"
+ gene complement(1540227..1540613)
+ /gene="rsfA"
+ /locus_tag="BQ2027_MB1400C"
+ CDS complement(1540227..1540613)
+ /gene="rsfA"
+ /locus_tag="BQ2027_MB1400C"
+ /note="Mb1400c, -, len: 128 aa. Equivalent to Rv1365c,
+ len: 128 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 128 aa overlap). Conserved hypothetical
+ protein, similar to other Mycobacterium tuberculosis
+ proteins e.g. Rv2638|MTCY441.08 (148 aa), FASTA scores:
+ E(): 0, (53.6% identity in 125 aa overlap); Rv1904,
+ Rv3687c. Weak similarity to putative anti-anti-sigma
+ factors e.g. AF134889|AF134889_1 Streptomyces coelicolor
+ (113 aa), FASTA scores: opt: 137, E(): 0.004, (26.0%
+ identity in 100 aa overlap). Mb1400c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="anti-anti-sigma factor rsfA (anti-sigma factor
+ antagonist) (regulator of sigma f a)"
+ /protein_id="SIU00003.1"
+ /db_xref="GOA:A0A1R3Y099"
+ /db_xref="InterPro:IPR002645"
+ /db_xref="InterPro:IPR003658"
+ /db_xref="InterPro:IPR036513"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y099"
+ /translation="MNPTQAGSFTTPVSNALKATIQHHDSAVIIHARGEIDAANEHTW
+ QDLVTKAAAATTAPEPLVVNLNGLDFMGCCAVAVLAHKAERCRRRGVDVRLVSRDRAV
+ ARIIHACGYGDVLPVHPTTESALSAT"
+ gene 1540834..1541655
+ /locus_tag="BQ2027_MB1401"
+ CDS 1540834..1541655
+ /locus_tag="BQ2027_MB1401"
+ /EC_number="2.7.6.5"
+ /note="Mb1401, -, len: 273 aa. Equivalent to Rv1366, len:
+ 273 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 273 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1401 detected using SWATH
+ mass spectrometry. Mb1401 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="GTP pyrophosphokinase (EC"
+ /protein_id="SIU00004.1"
+ /db_xref="GOA:P64834"
+ /db_xref="InterPro:IPR007685"
+ /db_xref="UniProtKB/Swiss-Prot:P64834"
+ /translation="MVVALVGSAIVDLHSRPPWSNNAVRRLGVALRDGVDPPVDCPSY
+ AEVMLWHADLAAEVQDRIEGRSWSASELLVTSRAKSQDTLLAKLRRRPYLQLNTIQDI
+ AGVRIDADLLLGEQTRLAREIADHFGADQPAIHDLRDHPHAGYRAVHVWLRLPAGRVE
+ IQIRTILQSLWANFYELLADAYGRGIRYDERPEQLAAGVVPAQLQELVGVMQDASADL
+ AMHEAEWQHCAEIEYPGQRAMALGEASKNKATVLATTKFRLERAINEAESAGGGG"
+ gene 1541624..1541884
+ /locus_tag="BQ2027_MB1401A"
+ CDS 1541624..1541884
+ /locus_tag="BQ2027_MB1401A"
+ /note="Mb1401A, len: 86 aa. Equivalent to Rv1366A len: 86
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 86 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Conserved protein.
+ Protein product from Mb1401A detected using SWATH mass
+ spectrometry. Mb1401A found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Conserved protein"
+ /protein_id="SIU00005.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY61"
+ /translation="MRPSRQGEVGEVAGYVVEYNRRTHVRRITEFATPQEAMEHRLKL
+ EAERTDSNIEIVALVSKSLGTLKQTHSRYFTGEELNVGNGAR"
+ gene complement(1541956..1543089)
+ /locus_tag="BQ2027_MB1402C"
+ CDS complement(1541956..1543089)
+ /locus_tag="BQ2027_MB1402C"
+ /note="Mb1402c, -, len: 377 aa. Equivalent to Rv1367c,
+ len: 377 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 377 aa overlap). Conserved hypothetical
+ protein. Some similarity to penicillin binding proteins
+ e.g. PBPE_BACSU|P32959 penicillin-binding protein 4* (pbp
+ 4*) from Bacillus subtilis (451 aa), FASTA scores: E():
+ 6.9e-06, (23.6% identity in 373 aa overlap). Similar to
+ AL031107|SC5A7.06 hypothetical protein from Streptomyces
+ coelicolor (409 aa), FASTA scores: opt: 675, E(): 0,
+ (40.4% identity in 339 aa overlap). Protein product from
+ Mb1402c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1402c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Beta-lactamase class C-like and penicillin
+ binding proteins (PBPs) superfamily"
+ /protein_id="SIU00006.1"
+ /db_xref="InterPro:IPR001466"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ6"
+ /translation="MVWQREKLLQVNEIGYRDIDAGVPMQRDTLFRIASMTKPVTVAA
+ AMSLVDEGKLALRDPITRWAPELCKVAVLDDAAGPLDRTHPARRAILIEDLLTHTSGL
+ AYGFSVSGPISRAYQRLPFGQGPDVWLAALATLPLVHQPGDRVTYSHAIDVLGVIVSR
+ IEDAPLYQVIDERVLGPAGMTDTGFYVSADAQRRAATMYRLDEQDRLRHDVMGPPHVT
+ PPSFCNAGGGLWSTADDYLRFVRMLLGDGTVDGVRVLSPESVRLMRTDRLTDEQKRHS
+ FLGAPFWVGRGFGLNLSVVTDPAKSRPLFGPGGLGTFSWPGAYGTWWQADPSADLILL
+ YLIQHCPDLSVDAAAAVAGNPSLAKLRTAQPKFVRRTYRALGL"
+ gene 1543464..1544249
+ /gene="lprF"
+ /locus_tag="BQ2027_MB1403"
+ CDS 1543464..1544249
+ /gene="lprF"
+ /locus_tag="BQ2027_MB1403"
+ /note="Mb1403, lprF, len: 261 aa. Equivalent to Rv1368,
+ len: 261 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 261 aa overlap). Probable lipoprotein
+ lprF, similar to Mycobacterium tuberculosis hypothetical
+ lipoproteins e.g. Rv1270c|Y08C_MYCTU|Q11049 hypothetical
+ 26.4 kd protein cy50.12. (257 aa), FASTA scores: opt: 286,
+ E(): 5.3e-11, (26.3% identity in 270 aa overlap), also
+ Rv1411c|MTCY21B4.28c, (32.8% identity in 253 aa overlap)
+ and Rv2945c. Contains possible N-terminal signal sequence
+ and appropriately positioned prokaryotic lipoprotein lipid
+ attachment site (PS00013). BELONGS TO THE LPPX/LPRAFG
+ FAMILY OF LIPOPROTEINS. Protein product from Mb1403
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1403 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable conserved lipoprotein lprf"
+ /protein_id="SIU00007.1"
+ /db_xref="GOA:P65315"
+ /db_xref="InterPro:IPR009830"
+ /db_xref="InterPro:IPR029046"
+ /db_xref="PDB:4QA8"
+ /db_xref="UniProtKB/Swiss-Prot:P65315"
+ /translation="MNGLISQACGSHRPRRPSSLGAVAILIAATLFATVVAGCGKKPT
+ TASSPSPGSPSPEAQQILQDSSKATKGLHSVHVVVTVNNLSTLPFESVDADVTNQPQG
+ NGQAVGNAKVRMKPNTPVVATEFLVTNKTMYTKRGGDYVSVGPAEKIYDPGIILDKDR
+ GLGAVVGQVQNPTIQGRDAIDGLATVKVSGTIDAAVIDPIVPQLGKGGGRLPITLWIV
+ DTNASTPAPAANLVRMVIDKDQGNVDITLSNWGAPVTIPNPAG"
+ gene 1544445..1545398
+ /locus_tag="BQ2027_MB1404"
+ CDS 1544445..1545398
+ /locus_tag="BQ2027_MB1404"
+ /note="Mb1404 found to be expressed during exponential
+ growth in Sauton's minimal media by
+ RNA-sequencing.,Mb1404, -, len: 317 aa. Similar to 5' end
+ of Rv1371, len: 489 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (90.9% identity in 166 aa overlap). Probable
+ membrane protein. Weak similarity to delta 5 fatty acid
+ desaturases e.g. AB022097|AB022097_1 Dictyostelium
+ discoideum (467 aa), FASTA score: opt: 173, E(): 0.00052,
+ (22.4% identity in 438 aa overlap); and Homo sapiens.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1371 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-a) splits Rv1371 into 2 parts, Mb1404 and
+ Mb1405, with the latter being the more likely product."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00008.1"
+ /db_xref="InterPro:IPR001199"
+ /db_xref="InterPro:IPR036400"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY65"
+ /translation="MTNDLPDVRERDGGPRPAPPAGGPRLSDVWVYNGRAYDLSEWIS
+ KHPGGAFFIGRTKNRDITAIVKSYHRDPAIVERILQRRYALGRDATPRDIHPKHNAPA
+ FLFKDDFNSWRDTPKYRFDDPNDLLHRVKARLAEPALAARIKRMDTLYQRHRCSTGRG
+ LFRGSGCAVGGTELDAAVGLRDCDGSAAQFVGRVRSLRTAPRATRPQPGFQQCLRSQL
+ CGLVLSHRRRTHPAAPPVYPERGGHQEERVHDDDAATVVVSRSRTYDSQIWPHAQRHG
+ DPDRRRLQDHAQGRCRGILRKLACRASTLPWIGRGALASGE"
+ gene 1545400..1545915
+ /locus_tag="BQ2027_MB1405"
+ CDS 1545400..1545915
+ /locus_tag="BQ2027_MB1405"
+ /note="Mb1405, -, len: 331 aa. Equivalent to 3' end of
+ Rv1371, len: 489 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 331 aa overlap). Probable
+ membrane protein. Weak similarity to delta 5 fatty acid
+ desaturases e.g. AB022097|AB022097_1 Dictyostelium
+ discoideum (467 aa), FASTA score: opt: 173, E(): 0.00052,
+ (22.4% identity in 438 aa overlap); and Homo sapiens.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1371 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-a) splits Rv1371 into 2 parts, Mb1404 and
+ Mb1405, with the latter being the more likely product."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00009.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY54"
+ /translation="MVVFAIAGDFWPWALQFVATLWVSTFLVVASHEFEDDTQGGAVN
+ GEDWGIDQLEHANDLTVIGNRYVDCFLSAGLSSHRVHHVLPFQRSGFANIVTEDVLRE
+ EAAKFGVEWLPAKGFITDRLPRLCRKYLLTPSRQAKERHWGFVREHCSPAALKASASY
+ VVAGFVGIGSV"
+ gene 1545912..1547093
+ /gene="pks18"
+ /locus_tag="BQ2027_MB1406"
+ CDS 1545912..1547093
+ /gene="pks18"
+ /locus_tag="BQ2027_MB1406"
+ /EC_number="2.3.1.74"
+ /note="Mb1406, -, len: 393 aa. Equivalent to Rv1372, len:
+ 393 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 393 aa overlap). Conserved hypothetical
+ protein, similar to several chalcone synthases e.g.
+ CHS2_GERHY|P48391 chalcone synthase 2 from gerbra hybrid
+ (402 aa), FASTA scores: opt: 511, E(): 7e-26, (28.4%
+ identity in 380 aa overlap). Also similar to M.
+ tuberculosis hypothetical chalcone synthases, Rv1665,
+ Rv1660. Mb1406 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Naringenin-chalcone synthase (EC"
+ /protein_id="SIU00010.1"
+ /db_xref="GOA:Q7U064"
+ /db_xref="InterPro:IPR001099"
+ /db_xref="InterPro:IPR011141"
+ /db_xref="InterPro:IPR012328"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U064"
+ /translation="MNVSAESGAPRRAGQRHEVGLAQLPPAPPTTVAVIEGLATGTPR
+ RVVNQSDAADRVAELFLDPGQRERIPRVYQKSRITTRRMAVDPLDAKFDVFRREPATI
+ RDRMHLFYEHAVPLAVDVSKRALAGLPYRAAEIGLLVLATSTGFIAPGVDVAIVKELG
+ LSPSISRVVVNFMGCAAAMNALGTATNYVRAHPAMKALVVCIELCSVNAVFADDINDV
+ VIHSLFGDGCAALVIGASQVQEKLEPGKVVVRSSFSQLLDNTEDGIVLGVNHNGITCE
+ LSENLPGYIFSGVAPVVTEMLWDNGLQISDIDLWAIHPGGPKIIEQSVRSLGISAELA
+ AQSWDVLARFGNMLSVSLIFVLETMVQQAESAKAISTGVAFAFGPGVTVEGMLFDIIR
+ R"
+ gene 1547099..1547896
+ /locus_tag="BQ2027_MB1407"
+ CDS 1547099..1547896
+ /locus_tag="BQ2027_MB1407"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1407, -, len: 265 aa. Equivalent to the 5' end of
+ Rv1373, len: 326 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 154 aa overlap).
+ Glycolipid sulfotransferase (EC 2.8.2.-) (see citation
+ below); slight similarity to sulfotransferases e.g.
+ SUOE_CAVPO|P49887 estrogen sulfotransferase from Cavia
+ porcellus (Guinea pig) (EC 2.8.2.4) (296 aa), FASTA
+ scores, opt: 165, E():0.00054, (24.5% identity in 294 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1373 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-c) splits Rv1373 into 2 parts, Mb1407 and
+ Mb1408. Mb1407 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="GLYCOLIPID SULFOTRANSFERASE [FIRST PART]"
+ /protein_id="SIU00011.1"
+ /db_xref="GOA:A0A1R3XY57"
+ /db_xref="InterPro:IPR000863"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY57"
+ /translation="MNSEHPMTDRVVYRSLMADNLRWDALQLRDGDIIISAPSKSGLT
+ WTQRLVSLLVFDGPDLPGPLSTVSPWLDQTIRPIEEVVATLDAQQHRRFIKTHTPLDG
+ LVLDDRVSYICVGRDPRDAAVSMLYQSANMNEDRMRILHEAVVPFHERIAPPVCGTRS
+ CAQPDRGVPGLDGGAESASPWHRFHTSEGDRHSGQHPAPARHGMGPPSPTQRGLVSLR
+ RLPGGLGGRAAPAGKGPRYRRDPRSSPGPGAVRHAGCDALPRVRNRS"
+ gene 1547562..1548080
+ /locus_tag="BQ2027_MB1408"
+ /pseudo
+ CDS 1547562..1548080
+ /locus_tag="BQ2027_MB1408"
+ /EC_number="2.8.2.-"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1408, -, len: 172 aa. Equivalent to the 3' end of
+ Rv1373, len: 326 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.4% identity in 172 aa overlap).
+ Glycolipid sulfotransferase (EC 2.8.2.-) (see citation
+ below); slight similarity to sulfotransferases e.g.
+ SUOE_CAVPO|P49887 estrogen sulfotransferase from Cavia
+ porcellus (Guinea pig) (EC 2.8.2.4) (296 aa), FASTA
+ scores, opt: 165, E():0.00054, (24.5% identity in 294 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1373 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-c) splits Rv1373 into 2 parts, Mb1407 and
+ Mb1408.;GLYCOLIPID SULFOTRANSFERASE [SECOND PART]"
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene complement(1548160..1548618)
+ /locus_tag="BQ2027_MB1409C"
+ CDS complement(1548160..1548618)
+ /locus_tag="BQ2027_MB1409C"
+ /note="Mb1409c, -, len: 152 aa. Equivalent to Rv1374c,
+ len: 152 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 152 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00012.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY59"
+ /translation="MVTSVADENVASRIASWGTGPAPDPRLDYAHAHLKGRRGRSPAR
+ PNAPIGARSFAVGRKICRVERFTLLEHGFVGHALHRVPCAGLVALVMSACSLAVCREV
+ GNYAQRRVGRFAFFEQTFVRHALTPRCSRTDSKASYTQLNRICKFPPHWV"
+ gene 1548920..1550239
+ /locus_tag="BQ2027_MB1410"
+ CDS 1548920..1550239
+ /locus_tag="BQ2027_MB1410"
+ /note="Mb1410, -, len: 439 aa. Equivalent to Rv1375, len:
+ 439 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 439 aa overlap). Conserved hypothetical
+ protein, similar to hypothetical proteins from several
+ organisms e.g. Q52871|U39409 Rhizobium leguminosarum (420
+ aa), FASTA scores: E(): 2e-30, (34.4% identity in 378 aa
+ overlap). Mb1410 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="YcaO-like protein"
+ /protein_id="SIU00013.1"
+ /db_xref="InterPro:IPR003776"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0B5"
+ /translation="MTGRRLARFPAFRAGVAQDDDVGSTLSQGSTTGVLSGPNWSYWP
+ SRVLGSADPTTIAHRHGTHRITSPDETWLALQPFLAPAGITRVADVTWLDCLGIPTVQ
+ AVRPASLTLSVSQGKAASYRAAQVSAVMESLEGWHAENVTADLWSATARDLEADLTYD
+ PAQLRHRPGSLYHAGVKLDWMVATTLLTGRRTWVPWTAVLVNVATRDCWEPPMFEMDT
+ TGLASGNCYDEATLHALYEVMERHSVAAAVAGETMFEVPTDDVAGSDSAHLVEMIRDA
+ GDDVDLARIDVWDGYYCFAAELTSATLEVTFGGFGLHHDPNVALSPAITEAAQSRITA
+ ISGAREDLPSAIYHRFGRVHTYAKARKTSLRLNRARPTPWRVPDVDSLPELVASAATA
+ VANRSGTEPLAVVCDFADACVPVVKVLAPGLVLSSASPMRTPLQEAE"
+ gene 1550236..1551729
+ /locus_tag="BQ2027_MB1411"
+ CDS 1550236..1551729
+ /locus_tag="BQ2027_MB1411"
+ /note="Mb1411, -, len: 497 aa. Equivalent to Rv1376, len:
+ 497 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 497 aa overlap). Conserved hypothetical
+ protein, some similarity to hypothetical proteins from
+ several organisms e.g. Q52872|U39409 Rhizobium
+ leguminosarum (247 aa), FASTA scores: E(): 2.1e-12, (34.7%
+ identity in 219 aa overlap). Mb1411 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00014.1"
+ /db_xref="InterPro:IPR012924"
+ /db_xref="InterPro:IPR016845"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ59"
+ /translation="MTACGRIVVTAGPTISAADIRSVVPDAEVAPPIAFGQALSYDLR
+ SGDTLLIVDGLFFQQPSVRHKELLTLMADGVRVVGSSSMGALRAAELHPFGMEGYGWV
+ FESYRDGVLEADDEVGVVHGDADDGYPVFVDALVNMRHTLARAVATGVVCSELAERII
+ ETARATPFTMRTWARLLSEVGAPDQRGLAAQLRSLRVDVKHADALLALRQLGQRPRVE
+ PLRPGPPPTVWSRRWRQPWAPPTSVAASADHGESFVDVTDLEVLSFLSVSSVDYWAYR
+ PALQQVAAWYWTLKHPEQSGSVGERAARAVAEVASEGYGRALEFIAYRYALATGIIDE
+ TGFPEAVAAHWLTTEERHGLGNDPISISARVITRTLFVVRLLPAIDHFLDLLRKDSRL
+ PRWRAMAAHALCKRDDLARQKPHLNLGRPDPTQLKRLFGARWGTQVNRIELARRGLMT
+ EDAFYAAATPFAVAAVDDQLPRIEVGTLGPAPLSADVPERHFDFGSV"
+ gene complement(1551667..1552305)
+ /locus_tag="BQ2027_MB1412C"
+ CDS complement(1551667..1552305)
+ /locus_tag="BQ2027_MB1412C"
+ /note="Mb1412c, -, len: 212 aa. Equivalent to Rv1377c,
+ len: 212 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 212 aa overlap). Putative transferase
+ (EC 2.-.-.-), similar to YQEM_BACSU|P54458 hypothetical
+ 28.3 kd protein from Bacillus subtilis (247 aa), FASTA
+ scores: opt: 221, E(): 7.6e-08, (30.6% identity in 144 aa
+ overlap); some similarity to methyltransferases, also
+ similar to Mycobacterium tuberculosis hypothetical
+ proteins Rv0560c, Rv3699, and Rv2675c (~ 39.1% identity in
+ 197 aa overlap). Protein product from Mb1412c detected
+ using shotgun mass spectrometry. Mb1412c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE TRANSFERASE"
+ /protein_id="SIU00015.1"
+ /db_xref="GOA:A0A1R3XY67"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="InterPro:IPR041698"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY67"
+ /translation="MPGIDFDALYRGESPGEGLPPITTPPWDTKAPKDNVIGWHTGGW
+ VHGDVLDIGCGLGDNAIYLARNGYQVTGLDISPTALTTAKRRASDAGVDVKFAVGDAT
+ KLTGYTGAFDTVIDCGMFHCLDDDGKRSYAASVHRATRPGATLLLSCFSNAMPPDEEW
+ PRSTVSEQTLRDVLGGAGWDIESLEPATVRRELDGTEVEMAFWNVRAQRRGS"
+ gene complement(1552316..1553743)
+ /locus_tag="BQ2027_MB1413C"
+ CDS complement(1552316..1553743)
+ /locus_tag="BQ2027_MB1413C"
+ /note="Mb1413c, -, len: 475 aa. Equivalent to Rv1378c,
+ len: 475 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 475 aa overlap). Conserved hypothetical
+ protein, similar to other Mycobacterium tuberculosis
+ hypothetical proteins e.g. Rv3074|MTCY22D7.07C (424 aa),
+ FASTA scores: E(): 0, (73.0% identity in 429 aa overlap).
+ Mb1413c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED 13E12 REPEAT FAMILY PROTEIN"
+ /protein_id="SIU00016.1"
+ /db_xref="InterPro:IPR003615"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYK4"
+ /translation="MGNLDLLLHLSGRIVKGCRPLGSVALARCGPAVRWPWWPRPAIL
+ EHMFDLVSLAGVDSRDDEASLTARIAELERVKSAAAAGQARAAAALDKLRRCNEADAG
+ VPARRRGRGVASEVALARRDSPARGGRHLGFAKALVYEMPHTLAALEVGRLSEWRATL
+ IVRESACLDVEDRRALDAELCADMSALDGMGDARIAAAARAIAYRLDAQAVVERAARA
+ ETERTVTIRPAPDTMTWVTALLPVARGVSVYAALKRAADTTFDDRTRGQVMADTLVER
+ VTGQPAEAAQPVAVNLVLSDETLLAGDRAPAVVDGYGPIPAAVARNLVRDAVADTRSR
+ ATLRRLYRHPRSGALVAMESRARRFPKGLAAFIGLRDQRCRMPYCDAPIRHRDHAQPH
+ HRGGPTTATNGLGSCERCNYVKEAPGWRVSTDTDETGRHTAEFTTPTGMYYHCTAPPL
+ PGPLEIDVSQVEARIGVALTHLHAA"
+ gene 1553742..1554323
+ /gene="pyrR"
+ /locus_tag="BQ2027_MB1414"
+ CDS 1553742..1554323
+ /gene="pyrR"
+ /locus_tag="BQ2027_MB1414"
+ /note="Mb1414, pyrR, len: 193 aa. Equivalent to Rv1379,
+ len: 193 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 193 aa overlap). Probable pyrR,
+ pyrimidine operon regulatory protein, similar to
+ PYRR_BACCL|P41007 pyrimidine operon regulatory protein
+ from Bacillus caldolyticus (179 aa), FASTA scores: opt:
+ 544, E(): 1.1e-30, (54.2% identity in 179 aa overlap).
+ Protein product from Mb1414 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1414 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PYRIMIDINE OPERON REGULATORY PROTEIN
+ PYRR"
+ /protein_id="SIU00017.1"
+ /db_xref="GOA:P65942"
+ /db_xref="InterPro:IPR000836"
+ /db_xref="InterPro:IPR023050"
+ /db_xref="InterPro:IPR029057"
+ /db_xref="UniProtKB/Swiss-Prot:P65942"
+ /translation="MGAAGDAAIGRESRELMSAADVGRTISRIAHQIIEKTALDDPVG
+ PDAPRVVLLGIPTRGVTLANRLAGNITEYSGIHVGHGALDITLYRDDLMIKPPRPLAS
+ TSIPAGGIDDALVILVDDVLYSGRSVRSALDALRDVGRPRAVQLAVLVDRGHRELPLR
+ ADYVGKNVPTSRSESVHVRLREHDGRDGVVISR"
+ gene 1554320..1555279
+ /gene="pyrB"
+ /locus_tag="BQ2027_MB1415"
+ CDS 1554320..1555279
+ /gene="pyrB"
+ /locus_tag="BQ2027_MB1415"
+ /note="Mb1415, pyrB, len: 319 aa. Equivalent to Rv1380,
+ len: 319 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 319 aa overlap). Probable pyrB,
+ aspartate carbamoyltransferase (EC 2.1.3.2), similar to
+ many e.g. PYRB_BACCL|P41008 aspartate carbamoyltransferase
+ from Bacillus caldolyticus (308 aa), FASTA scores, opt:
+ 639, E(): 7.3e-36, (39.5% identity in 311 aa overlap).
+ Contains PS00097 Aspartate and ornithine
+ carbamoyltransferases signature. BELONGS TO THE
+ ATCASES/OTCASES FAMILY. Protein product from Mb1415
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1415 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ASPARTATE CARBAMOYLTRANSFERASE PYRB
+ (ATCase) (Aspartate transcarbamylase)"
+ /protein_id="SIU00018.1"
+ /db_xref="GOA:P65614"
+ /db_xref="InterPro:IPR002082"
+ /db_xref="InterPro:IPR006130"
+ /db_xref="InterPro:IPR006131"
+ /db_xref="InterPro:IPR006132"
+ /db_xref="InterPro:IPR036901"
+ /db_xref="UniProtKB/Swiss-Prot:P65614"
+ /translation="MTPRHLLTAADLSRDDATAILDDADRFAQALVGRDIKKLPTLRG
+ RTVVTMFYENSTRTRVSFEVAGKWMSADVINVSAAGSSVGKGESLRDTALTLRAAGAD
+ ALIIRHPASGAAHLLAQWTGAHNDGPAVINAGDGTHEHPTQALLDALTIRQRLGGIEG
+ RRIVIVGDILHSRVARSNVMLLDTLGAEVVLVAPPTLLPVGVTGWPATVSHDFDAELP
+ AADAVLMLRVQAERMNGGFFPSVREYSVRYGLTERRQAMLPGHAVVLHPGPMVRGMEI
+ TSSVADSSQSAVLQQVSNGVQVRMAVLFHVLVGAQDAGKEGAA"
+ gene 1555276..1556568
+ /gene="pyrC"
+ /locus_tag="BQ2027_MB1416"
+ CDS 1555276..1556568
+ /gene="pyrC"
+ /locus_tag="BQ2027_MB1416"
+ /note="Mb1416, pyrC, len: 430 aa. Equivalent to Rv1381,
+ len: 430 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 430 aa overlap). Probable pyrC,
+ dihydroorotase (EC 3.5.2.3), similar to many e.g.
+ PYRC_BACCL|P46538 (40.5% identity in 395 aa overlap).
+ Contains PS00483 Dihydroorotase signature 2. BELONGS TO
+ THE DHOASE FAMILY. SUBFAMILY 2. Protein product from
+ Mb1416 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1416 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DIHYDROOROTASE PYRC (DHOase)"
+ /protein_id="SIU00019.1"
+ /db_xref="GOA:Q7U057"
+ /db_xref="InterPro:IPR002195"
+ /db_xref="InterPro:IPR004722"
+ /db_xref="InterPro:IPR006680"
+ /db_xref="InterPro:IPR011059"
+ /db_xref="InterPro:IPR032466"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U057"
+ /translation="MSVLIRGVRPYGEGERVDVLVDDGQIAQIGPDLAIPDTADVIDA
+ TGHVLLPGFVDLHTHLREPGREYAEDIETGSAAAALGGYTAVFAMANTNPVADSPVVT
+ DHVWHRGQQVGLVDVHPVGAVTVGLAGAELTEMGMMNAGAAQVRMFSDDGVCVHDPLI
+ MRRALEYATGLGVLIAQHAEEPRLTVGAFAHEGPMAARLGLAGWPRAAEESIVARDAL
+ LARDAGARVHICHASAAGTVEILKWAKDQGISITAEVTPHHLLLDDARLASYDGVNRV
+ NPPLREASDAVALRQALADGIIDCVATDHAPHAEHEKCVEFAAARPGMLGLQTALSVV
+ VQTMVAPGLLSWRDIARVMSENPACIARLPDQGRPLEVGEPANLTVVDPDATWTVTGA
+ DLASRSANTPFESMSLPATVTATLLRGKVTARDGKIRA"
+ gene 1556565..1557062
+ /locus_tag="BQ2027_MB1417"
+ CDS 1556565..1557062
+ /locus_tag="BQ2027_MB1417"
+ /note="Mb1417, -, len: 165 aa. Equivalent to Rv1382, len:
+ 165 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 165 aa overlap). Possible exported or
+ membrane protein, hydrophobic domain at N-terminus.
+ Protein product from Mb1417 detected using SWATH mass
+ spectrometry. Mb1417 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EXPORT OR MEMBRANE PROTEIN"
+ /protein_id="SIU00020.1"
+ /db_xref="GOA:A0A1R3XY77"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY77"
+ /translation="MNSGTLAGSLIFAAVLVMLIAVLARLMMRGWRRRSERQAELLGD
+ LPDVPEHVSSATVTTRGLYVGATLSPAWNERVTVGDLGYRSKAVLTRYPSGIMVERAR
+ AQPIWIPTESIAAIRMERGVAGKVVAGIGILAIRWRLPSGTEIDVGFRADNRDEYQEW
+ LEEPV"
+ gene 1557059..1558189
+ /gene="carA"
+ /locus_tag="BQ2027_MB1418"
+ CDS 1557059..1558189
+ /gene="carA"
+ /locus_tag="BQ2027_MB1418"
+ /note="Mb1418, carA, len: 376 aa. Equivalent to Rv1383,
+ len: 376 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 376 aa overlap). Probable carA,
+ Carbamoyl-phosphate synthase small chain (EC 6.3.5.5),
+ similar to many e.g. CARA_ECOLI|P00907 carbamoyl-phosphate
+ synthase small chain from Escherichia coli (382 aa), FASTA
+ scores: opt: 796, E(): 0, (45.5% identity in 382 aa
+ overlap). Contains PS00442 Glutamine amidotransferases
+ class-I active site. THE GATASE DOMAIN BELONGS TO TYPE-1
+ GLUTAMINE AMIDOTRANSFERASES. SUBUNIT: COMPOSED OF TWO
+ CHAINS; THE SMALL (OR GLUTAMINE) CHAIN PROMOTES THE
+ HYDROLYSIS OF GLUTAMINE TO AMMONIA, WHICH IS USED BY THE
+ LARGE (OR AMMONIA) CHAIN TO SYNTHESIZE CARBAMOYL
+ PHOSPHATE. Protein product from Mb1418 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1418 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CARBAMOYL-PHOSPHATE SYNTHASE SMALL
+ CHAIN CARA (Carbamoyl-phosphate synthetase glutamine
+ chain)"
+ /protein_id="SIU00021.1"
+ /db_xref="GOA:Q7U055"
+ /db_xref="InterPro:IPR002474"
+ /db_xref="InterPro:IPR006274"
+ /db_xref="InterPro:IPR017926"
+ /db_xref="InterPro:IPR029062"
+ /db_xref="InterPro:IPR035686"
+ /db_xref="InterPro:IPR036480"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U055"
+ /translation="MSKAVLVLEDGRVFTGRPFGATGQALGEAVFSTGMSGYQETLTD
+ PSYHRQIVVATAPQIGNTGWNGEDSESRGERIWVAGYAVRDPSPRASNWRATGTLEDE
+ LIRQRIVGIAGIDTRGVVRHLRSRGSMKAGVFSDGALAEPADLIARVRAQQSMLGADL
+ AGEVSTAEPYVVEPDGPPGVSRFTVAALDLGIKTNTPRNFARRGIRCHVLPASTTFEQ
+ IAELNPHGVFLSNGPGDPATADHVVALTREVLGAGIPLFGICFGNQILGRALGLSTYK
+ MVFGHRGINIPVVDHATGRVAVTAQNHGFALQGEAGQSFATPFGPAVVSHTCANDGVV
+ EGVKLVDGRAFSVQYHPEAAAGPHDAEYLFDQFVELMAGEGR"
+ gene 1558189..1561536
+ /gene="carB"
+ /locus_tag="BQ2027_MB1419"
+ CDS 1558189..1561536
+ /gene="carB"
+ /locus_tag="BQ2027_MB1419"
+ /note="Mb1419, carB, len: 1115 aa. Equivalent to Rv1384,
+ len: 1115 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 1115 aa overlap). Probable carB,
+ Carbamoyl-phosphate synthase large chain (EC 6.3.5.5),
+ similar to many e.g. CARB_ECOLI|P00968 E. coli (1072 aa),
+ FASTA scores: E(): 0, (52.3% identity in 1118 aa overlap).
+ Contains two PS00867 Carbamoyl-phosphate synthase
+ subdomain signature 2 and PS00866
+ Carbamoyl-phosphatesynthase subdomain signature 1.
+ SUBUNIT: COMPOSED OF TWO CHAINS; THE SMALL (OR GLUTAMINE)
+ CHAIN PROMOTES THE HYDROLYSIS OF GLUTAMINE TO AMMONIA,
+ WHICH IS USED BY THE LARGE (OR AMMONIA) CHAIN TO
+ SYNTHESIZE CARBAMOYL PHOSPHATE. Protein product from
+ Mb1419 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1419 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CARBAMOYL-PHOSPHATE SYNTHASE LARGE
+ CHAIN CARB (Carbamoyl-phosphate synthetase ammonia chain)"
+ /protein_id="SIU00022.1"
+ /db_xref="GOA:Q7U054"
+ /db_xref="InterPro:IPR005479"
+ /db_xref="InterPro:IPR005480"
+ /db_xref="InterPro:IPR005483"
+ /db_xref="InterPro:IPR006275"
+ /db_xref="InterPro:IPR011607"
+ /db_xref="InterPro:IPR011761"
+ /db_xref="InterPro:IPR016185"
+ /db_xref="InterPro:IPR033937"
+ /db_xref="InterPro:IPR036897"
+ /db_xref="InterPro:IPR036914"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U054"
+ /translation="MPRRTDLHHVLVIGSGPIVIGQACEFDYSGTQACRVLRAEGLQV
+ SLVNSNPATIMTDPEFADHTYVEPITPAFVERVIAQQAERGNKIDALLATLGGQTALN
+ TAVALYESGVLEKYGVELIGADFDAIQRGEDRQRFKDIVAKAGGESARSRVCFTMAEV
+ RETVAELGLPVVVRPSFTMGGLGSGIAYSTDEVDRMAGAGLAASPSANVLIEESIYGW
+ KEFELELMRDGHDNVVVVCSIENVDPMGVHTGDSVTVAPAMTLTDREYQRMRDLGIAI
+ LREVGVDTGGCNIQFAVNPRDGRLIVIEMNPRVSRSSALASKATGFPIAKIAAKLAIG
+ YTLDEIVNDITGETPACFEPTLDYVVVKAPRFAFEKFPGADPTLTTTMKSVGEAMSLG
+ RNFVEALGKVMRSLETTRAGFWTAPDPDGGIEEALTRLRTPAEGRLYDIELALRLGAT
+ VERVAEASGVDPWFIAQINELVNLRNELVAAPVLNAELLRRAKHSGLSDHQIASLRPE
+ LAGEAGVRSLRVRLGIHPVYKTVDTCAAEFEAQTPYHYSSYELDPAAETEVAPQTERP
+ KVLILGSGPNRIGQGIEFDYSCVHAATTLSQAGFETVMVNCNPETVSTDYDTADRLYF
+ EPLTFEDVLEVYHAEMESGSGGPGVAGVIVQLGGQTPLGLAHRLADAGVPIVGTPPEA
+ IDLAEDRGAFGDLLSAAGLPAPKYGTATTFAQARRIAEEIGYPVLVRPSYVLGGRGME
+ IVYDEETLQGYITRATQLSPEHPVLVDRFLEDAVEIDVDALCDGAEVYIGGIMEHIEE
+ AGIHSGDSACALPPVTLGRSDIEKVRKATEAIAHGIGVVGLLNVQYALKDDVLYVLEA
+ NPRASRTVPFVSKATAVPLAKACARIMLGATIAQLRAEGLLAVTGDGAHAARNAPIAV
+ KEAVLPFHRFRRADGAAIDSLLGPEMKSTGEVMGIDRDFGSAFAKSQTAAYGSLPAQG
+ TVFVSVANRDKRSLVFPVKRLADLGFRVLATEGTAEMLRRNGIPCDDVRKHFEPAQPG
+ RPTMSAVDAIRAGEVNMVINTPYGNSGPRIDGYEIRSAAVAGNIPCITTVQGASAAVQ
+ GIEAGIRGDIGVRSLQELHRVIGGVER"
+ gene 1561533..1562357
+ /gene="pyrF"
+ /locus_tag="BQ2027_MB1420"
+ CDS 1561533..1562357
+ /gene="pyrF"
+ /locus_tag="BQ2027_MB1420"
+ /note="Mb1420, pyrF, len: 274 aa. Equivalent to Rv1385,
+ len: 274 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 274 aa overlap). Probable pyrF,
+ orotidine 5'-phosphate decarboxylase (EC 4.1.1.23),
+ identical to DCOP_MYCBO|P42610 Mycobacterium bovis (274
+ aa). Contains PS00156 Orotidine 5'-phosphate decarboxylase
+ active site. BELONGS TO THE OMP DECARBOXYLASE FAMILY.
+ Protein product from Mb1420 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1420 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OROTIDINE 5'-PHOSPHATE DECARBOXYLASE
+ PYRF (OMP decarboxylase) (OMPdecase)"
+ /protein_id="SIU00023.1"
+ /db_xref="GOA:P0A5M7"
+ /db_xref="InterPro:IPR001754"
+ /db_xref="InterPro:IPR011060"
+ /db_xref="InterPro:IPR011995"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR018089"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5M7"
+ /translation="MTGFGLRLAEAKARRGPLCLGIDPHPELLRGWDLATTADGLAAF
+ CDICVRAFADFAVVKPQVAFFESYGAAGFAVLERTIAELRAADVLVLADAKRGDIGAT
+ MSAYATAWVGDSPLAADAVTASPYLGFGSLRPLLEVAAAHGRGVFVLAATSNPEGAAV
+ QNAAADGRSVAQLVVDQVGAANEAAGPGPGSIGVVVGATAPQAPDLSAFTGPVLVPGV
+ GVQGGRPEALGGLGGAASSQLLPAVAREVLRAGPGVPELRAAGERMRDAVAYLAAV"
+ gene 1562552..1562860
+ /gene="PE15"
+ /locus_tag="BQ2027_MB1421"
+ CDS 1562552..1562860
+ /gene="PE15"
+ /locus_tag="BQ2027_MB1421"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1421, PE15, len: 102 aa. Equivalent to Rv1386,
+ len: 102 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 102 aa overlap). Member of Mycobacterium
+ tuberculosis PE family (see first citation below), similar
+ to many e.g. G913039 ORF 3' OF PGRS TANDEM REPEAT
+ (polymorphic GC-rich sequence) (100 aa), FASTA scores:
+ opt: 149, E(): 0.0013, (31.5% identity in 92 aa overlap);
+ also similar to Q49943|U1756A (99 aa) (34.7% identity in
+ 95 aa overlap) and G466937|U1620K (100 aa) (36.2% identity
+ in 69 aa overlap). Protein product from Mb1421 detected
+ using SWATH mass spectrometry. Mb1421 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe15"
+ /protein_id="SIU00024.1"
+ /db_xref="GOA:P0A683"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/Swiss-Prot:P0A683"
+ /translation="MTLRVVPESLAGASAAIEAVTARLAAAHAAAAPFIAAVIPPGSD
+ SVSVCNAVEFSVHGSQHVAMAAQGVEELGRSGVGVAESGASYAARDALAAASYLSGGL
+ "
+ gene 1562857..1564476
+ /gene="PPE20"
+ /locus_tag="BQ2027_MB1422"
+ CDS 1562857..1564476
+ /gene="PPE20"
+ /locus_tag="BQ2027_MB1422"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1422, PPE20, len: 539 aa. Equivalent to Rv1387,
+ len: 539 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 539 aa overlap). Member of
+ Mycobacterium tuberculosis PPE family of proteins, similar
+ to many e.g. Y05F_MYCTU|Q10892 hypothetical 46.9 kd
+ protein cy251.15 (463 aa), FASTA scores: E(): 4.2e-26,
+ (37.7% identity in 531 aa overlap); similar also to
+ MTCY274.23c (37.5% identity in 168 aa overlap). Contains
+ PS00343 Gram-positive cocci surface proteins 'anchoring'
+ hexapeptide. Protein product from Mb1422 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1422 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe20"
+ /protein_id="SIU00025.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY78"
+ /translation="MTEPWIAFPPEVHSAMLNYGAGVGPMLISATQNGELSAQYAEAA
+ SEVEELLGVVASEGWQGQAAEAFVAAYMPFLAWLIQASADCVEMAAQQHAVIEAYTAA
+ VELMPTQVELAANQIKLAVLVATNFFGINTIPIAINEAEYVEMWVRAATTMATYSTVS
+ RSALSAMPHTSPPPLILKSDELLPDTGEDSDEDGHNHGGHSHGGHARMIDNFFAEILR
+ GVSAGRIVWDPVNGTLNGLDYDDYVYPGHAIWWLARGLEFFQDGEQFGELLFTNPTGA
+ FQFLLYVVVVDLPTHIAQIATWLGQYPQLLSAALTGVIAHLGAITGLAGLSGLSAIPS
+ AAIPAVVPELTPVAAAPPMLAVAGVGPAVAAPGMLPASAPAPAAAAGATAAGPTPPAT
+ GFGGFPPYLVGGGGPGIGFGSGQSAHAKAAASDSAAAESAAQASARAQARAARRGRSA
+ AKARGHRDEFVTMDMGFDAAAPAPEHQPGARASDCGAGPIGFAGTVRKEAVVKAAGLT
+ TLAGDDFGGGPTMPMMPGTWTHDQGVFDEHR"
+ gene 1564782..1565354
+ /gene="mihF"
+ /locus_tag="BQ2027_MB1423"
+ CDS 1564782..1565354
+ /gene="mihF"
+ /locus_tag="BQ2027_MB1423"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1423, mihF, len: 190 aa. Equivalent to Rv1388,
+ len: 190 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 190 aa overlap). Putative mihF,
+ integration host factor. Almost identical to, but longer
+ than, P96802|U75344 Mycobacterium smegmatis integration
+ host factor (mIHF) for mycobacteriophage L5 (105 aa),
+ FASTA scores: E(): 0, (96.1% identity in 102 aa overlap).
+ Protein product from Mb1423 detected using shotgun mass
+ spectrometry. Mb1423 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE INTEGRATION HOST FACTOR MIHF"
+ /protein_id="SIU00026.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYL4"
+ /translation="MLGNTIHVPCQPCRHGHGAPSRGLRGRPADRWPVARATPTLHVC
+ PQNQGVGLDFVRKPEYGRLRWPAYPAGTNNDRLISMRDGGIVALPQLTDEQRAAALEK
+ AAAARRARAELKDRLKRGGTNLTQVLKDAESDEVLGKMKVSALLEALPKVGKVKAQEI
+ MTELEIAPTRRLRGLGDRQRKALLEKFGSA"
+ gene 1565489..1566115
+ /gene="gmk"
+ /locus_tag="BQ2027_MB1424"
+ CDS 1565489..1566115
+ /gene="gmk"
+ /locus_tag="BQ2027_MB1424"
+ /note="Mb1424, gmk, len: 208 aa. Equivalent to Rv1389,
+ len: 208 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 208 aa overlap). Probable gmk, guanylate
+ kinase (EC 2.7.4.8), similar to e.g. KGUA_ECOLI|P24234
+ guanylate kinase from Escherichia coli (207 aa), FASTA
+ scores: opt: 424, E(): 6.6e-20, (35.9% identity in 184 aa
+ overlap). Contains PS00017 ATP/GTP-binding site motif A
+ (P-loop), PS00856 Guanylate kinase signature. BELONGS TO
+ THE GUANYLATE KINASE FAMILY. Protein product from Mb1424
+ detected using SWATH mass spectrometry. Mb1424 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GUANYLATE KINASE GMK"
+ /protein_id="SIU00027.1"
+ /db_xref="GOA:P0A5I5"
+ /db_xref="InterPro:IPR008144"
+ /db_xref="InterPro:IPR008145"
+ /db_xref="InterPro:IPR017665"
+ /db_xref="InterPro:IPR020590"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5I5"
+ /translation="MSVGEGPDTKPTARGQPAAVGRVVVLSGPSAVGKSTVVRCLRER
+ IPNLHFSVSATTRAPRPGEVDGVDYHFIDPTRFQQLIDQGELLEWAEIHGGLHRSGTL
+ AQPVRAAAATGVPVLIEVDLAGARAIKKTMPEAVTVFLAPPSWQDLQARLIGRGTETA
+ DVIQRRLDTARIELAAQGDFDKVVVNRRLESACAELVSLLVGTAPGSP"
+ gene 1566181..1566513
+ /gene="rpoZ"
+ /locus_tag="BQ2027_MB1425"
+ CDS 1566181..1566513
+ /gene="rpoZ"
+ /locus_tag="BQ2027_MB1425"
+ /note="Mb1425, rpoZ, len: 110 aa. Equivalent to Rv1390,
+ len: 110 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 110 aa overlap). Probable rpoZ,
+ DNA-directed RNA polymerase omega chain (EC 2.7.7.6).
+ BELONGS TO THE RNA POLYMERASE OMEGA CHAIN FAMILY. Protein
+ product from Mb1425 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1425 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DNA-DIRECTED RNA POLYMERASE (OMEGA
+ CHAIN) RPOZ (TRANSCRIPTASE OMEGA CHAIN) (RNA POLYMERASE
+ OMEGA SUBUNIT)"
+ /protein_id="SIU00028.1"
+ /db_xref="GOA:P66722"
+ /db_xref="InterPro:IPR003716"
+ /db_xref="InterPro:IPR006110"
+ /db_xref="InterPro:IPR012293"
+ /db_xref="InterPro:IPR036161"
+ /db_xref="UniProtKB/Swiss-Prot:P66722"
+ /translation="MSISQSDASLAAVPAVDQFDPSSGASGGYDTPLGITNPPIDELL
+ DRVSSKYALVIYAAKRARQINDYYNQLGEGILEYVGPLVEPGLQEKPLSIALREIHAD
+ LLEHTEGE"
+ gene 1566529..1567785
+ /gene="dfp"
+ /locus_tag="BQ2027_MB1426"
+ CDS 1566529..1567785
+ /gene="dfp"
+ /locus_tag="BQ2027_MB1426"
+ /note="Mb1426, dfp, len: 418 aa. Equivalent to Rv1391,
+ len: 418 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 418 aa overlap). Probable dfp,
+ DNA/pantothenate metabolism flavoprotein homolog, similar
+ to many e.g. DFP_ECOLI|P24285 Escherichia coli (430 aa),
+ FASTA scores: opt: 763, E(): 0, (40.2% identity in 408 aa
+ overlap). Protein product from Mb1426 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1426 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DNA/PANTOTHENATE METABOLISM
+ FLAVOPROTEIN HOMOLOG DFP"
+ /protein_id="SIU00029.1"
+ /db_xref="GOA:P67734"
+ /db_xref="InterPro:IPR003382"
+ /db_xref="InterPro:IPR005252"
+ /db_xref="InterPro:IPR007085"
+ /db_xref="InterPro:IPR035929"
+ /db_xref="InterPro:IPR036551"
+ /db_xref="UniProtKB/Swiss-Prot:P67734"
+ /translation="MVDHKRIPKQVIVGVSGGIAAYKACTVVRQLTEASHRVRVIPTE
+ SALRFVGAATFEALSGEPVCTDVFADVPAVPHVHLGQQADLVVVAPATADLLARAAAG
+ RADDLLTATLLTARCPVLFAPAMHTEMWLHPATVDNVATLRRRGAVVLEPATGRLTGA
+ DSGAGRLPEAEEITTLAQLLLERHDALPYDLAGRKLLVTAGGTREPIDPVRFIGNRSS
+ GKQGYAVARVAAQRGADVTLIAGHTAGLVDPAGVEVVHVSSAQQLADAVSKHAPTADV
+ LVMAAAVADFRPAQVATAKIKKGVEGPPTIELLRNDDVLAGVVRARAHGQLPNMRAIV
+ GFAAETGDANGDVLFHARAKLRRKGCDLLVVNAVGEGRAFEVDSNDGWLLASDGTESA
+ LQHGSKTLMASRIVDAIVTFLAGCSS"
+ gene 1567913..1569124
+ /gene="metK"
+ /locus_tag="BQ2027_MB1427"
+ CDS 1567913..1569124
+ /gene="metK"
+ /locus_tag="BQ2027_MB1427"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1427, metK, len: 403 aa. Equivalent to Rv1392,
+ len: 403 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 403 aa overlap). Probable metK,
+ S-adenosylmethionine synthetase (EC 2.5.1.6), similar to
+ many e.g. METK_STAAU|P50307 Staphylococcus aureus (397
+ aa), FASTA scores: opt: 1484, E(): 0, (58.0% identity in
+ 400 aa overlap). Contains PS00376 S-adenosylmethionine
+ synthetase signature 1, PS00377 S-adenosylmethionine
+ synthetase signature 2. BELONGS TO THE ADOMET SYNTHETASE
+ FAMILY. Protein product from Mb1427 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1427
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE S-ADENOSYLMETHIONINE SYNTHETASE METK
+ (MAT) (AdoMet synthetase) (Methionine
+ adenosyltransferase)"
+ /protein_id="SIU00030.1"
+ /db_xref="GOA:Q7U051"
+ /db_xref="InterPro:IPR002133"
+ /db_xref="InterPro:IPR022628"
+ /db_xref="InterPro:IPR022629"
+ /db_xref="InterPro:IPR022630"
+ /db_xref="InterPro:IPR022631"
+ /db_xref="InterPro:IPR022636"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U051"
+ /translation="MSEKGRLFTSESVTEGHPDKICDAISDSVLDALLAADPRSRVAV
+ ETLVTTGQVHVVGEVATSAKEAFADITNTVRARILEIGYDSSDKGFDGATCGVNIGIG
+ AQSPDIAQGVDTAHEARVEGAADPLDSQGAGDQGLMFGYAINATPELMPLPIALAHRL
+ SRRLTEVRKNGVLPYLRPDGKTQVTIAYEDNVPVRLDTVVISTQHAADIDLEKTLDPD
+ IREKVLNTVLDDLAHETLDASTVRVLVNPTGKFVLGGPMGDAGLTGRKIIVDTYGGWA
+ RHGGGAFSGKDPSKVDRSAAYAMRWVAKNVVAAGLAERVEVQVAYAIGKAAPVGLFVE
+ TFGTETEDPVKIEKAIGEVFDLRPGAIIRDLNLLRPIYAPTAAYGHFGRTDVELPWEQ
+ LDKVDDLKRAI"
+ gene complement(1569197..1570675)
+ /locus_tag="BQ2027_MB1428C"
+ CDS complement(1569197..1570675)
+ /locus_tag="BQ2027_MB1428C"
+ /note="Mb1428c, -, len: 492 aa. Equivalent to Rv1393c,
+ len: 492 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 492 aa overlap). Probable monooxygenase
+ (EC 1.14.13.-), similar to others e.g. CYMO_ACISP|P12015
+ cyclohexanone monooxygenase (EC 1.14.13.22) from
+ Acinetobacter sp. (542 aa), FASTA scores: E(): 0, (33.0%
+ identity in 473 aa overlap); also to
+ Rv3083|MTCY31.20|E241788 hypothetical 55.0 kDa protein
+ from Mycobacterium tuberculosis (495 aa) (36.3% identity
+ in 490 aa overlap); and Rv0565c, Rv3854c, Rv3049c, Rv0892.
+ Protein product from Mb1428c detected using SWATH mass
+ spectrometry. Mb1428c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MONOXYGENASE"
+ /protein_id="SIU00031.1"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY79"
+ /translation="MMPDYHALIVGAGFSGIGAAIKLDRAGFSDYLVVEAGDGVGGTW
+ HWNTYPGIAVDIPSFSYQFSFEQSRHWSRTYAPGHELKAYAEHCVDKYGIRSRIRLNT
+ KVLAAEFDDEHSLWRVQTDPGGEITARFLISACGILTVPKLPDIDGVDSFEGVTMHTA
+ RWDHTQDLTGKRVGIIGTGASAVQVIPEMAPIVSHLTVFQRTPIWCFPKFDVPLPTAV
+ RWAMRIPGGKAVHRLLSQAFVEATFPIAAHYFAVFPLAKHMESAGRRYLRQQVHDPVV
+ REQLTPRYAVGCKRPGFHNTYLSTFNRDNVRLVTEPIDKITPTAVATTDGASHEIDVL
+ VLATGFKVLDTDSIPTYAVTGTGGASLSRFWDEHRLQAYEGVSVPGYPNFFTVFGPYG
+ YVGSSYFALIETQAHHIIRCLKRARRTGATRIEVTEEANARYFAEVMRRRHRQVFWQD
+ SCRLANSYYFDKNGDVPLRPTTTVEAYWRSRRFDLGDYRISS"
+ gene complement(1570672..1572057)
+ /gene="cyp132"
+ /locus_tag="BQ2027_MB1429C"
+ CDS complement(1570672..1572057)
+ /gene="cyp132"
+ /locus_tag="BQ2027_MB1429C"
+ /note="Mb1429c, cyp132, len: 461 aa. Equivalent to
+ Rv1394c, len: 461 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 461 aa overlap). Probable
+ cyp132, cytochrome P450 132 (EC 1.14.-.-). Some similarity
+ to others e.g. CP4B_HUMAN|P13584 human cytochrome p450
+ (511 aa), FASTA scores: opt: 486, E(): 7.4e-21, (28.6%
+ identity in 423 aa overlap); etc. Contains PS00086
+ Cytochrome P450 cysteine heme-iron ligand signature. MAY
+ BELONG TO THE CYTOCHROME P450 FAMILY. Mb1429c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CYTOCHROME P450 132 CYP132"
+ /protein_id="SIU00032.1"
+ /db_xref="GOA:P59954"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002401"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/Swiss-Prot:P59954"
+ /translation="MATATTQRPLKGPAKRMSTWTMTREAITIGFDAGDGFLGRLRGS
+ DITRFRCAGRRFVSISHPDYVDHVLHEARLKYVKSDEYGPIRATAGLNLLTDEGDSWA
+ RHRGALNSTFARRHLRGLVGLMIDPIADVTAALVPGAQFDMHQSMVETTLRVVANALF
+ SQDFGPLVQSMHDLATRGLRRAEKLERLGLWGLMPRTVYDTLIWCIYSGVHLPPPLRE
+ MQEITLTLDRAINSVIDRRLAEPTNSADLLNVLLSADGGIWPRQRVRDEALTFMLAGH
+ ETTANAMSWFWYLMALNPQARDHMLTELDDVLGMRRPTADDLGKLAWTTACLQESQRY
+ FSSVWIIAREAVDDDIIDGHRIRRGTTVVIPIHHIHHDPRWWPDPDRFDPGRFLRCPT
+ DRPRCAYLPFGGGRRICIGQSFALMEMVLMAAIMSQHFTFDLAPGYHVELEATLTLRP
+ KHGVHVIGRRR"
+ gene 1572135..1573169
+ /locus_tag="BQ2027_MB1430"
+ CDS 1572135..1573169
+ /locus_tag="BQ2027_MB1430"
+ /note="Mb1430, -, len: 344 aa. Equivalent to Rv1395, len:
+ 344 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 344 aa overlap). Probable
+ transcriptional regulatory protein, similar to many e.g.
+ URER_PROMI|Q02458 urease operon transcriptional activator
+ from Proteus mirabilis (293 aa), FASTA scores:
+ E():1.5e-08, (41.7% identity in 84 aa overlap);
+ YHIX_ECOLI|P37639 hypothetical transcriptional regulatory
+ protein from Escherichia coli (274 aa), FASTA scores: opt:
+ 238, E(): 3.5e-09, (27.3% identity in 249 aa overlap); and
+ G296916|X68281 POSSIBLE VIRULENCE-REGULATING protein from
+ Mycobacterium tuberculosis (339 aa), FASTA scores: opt:
+ 228, E(): 1.9e-08, (27.0% identity in 278 aa overlap).
+ Helix turn helix motif present, aa 261-282 (+4.68 SD).
+ BELONGS TO THE ARAC/XYLS FAMILY OF TRANSCRIPTIONAL
+ REGULATORS. 3' part corrected since first submission (-14
+ aa). Mb1430 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="transcriptional regulatory protein"
+ /protein_id="SIU00033.1"
+ /db_xref="GOA:P68912"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR018060"
+ /db_xref="InterPro:IPR020449"
+ /db_xref="InterPro:IPR032687"
+ /db_xref="UniProtKB/Swiss-Prot:P68912"
+ /translation="MGHLPPPAEVRHPVYATRVLCEVANERGVPTADVLAGTAIEPAD
+ LDDPDAVVGALDEITAVRRLLARLPDDAGIGIDVGSRFALTHFGLFGFAVMSCGTLRE
+ LLTIAMRYFALTTMHVDITLFETADDCLVELDASHLPADVRGFFIERDIAGIIATTTS
+ FALPLAAKYADQVSAELAVDAELLRPLLELVPVHDVAFGRAHNRVHFPRAMFDEPLPQ
+ ADRHTLEMCIAQCDVLMQRNERRRGITALVRSKLFRDSGLFPTFTDVAGELDMHPRTL
+ RRRLAEEGTSFRALLGEARSTVAVDLLRNVGLTVQQVSTRLGYTEVSTFSHAFKRWYG
+ VAPSEYSRRG"
+ gene complement(1573215..1574573)
+ /gene="PE_PGRS25"
+ /locus_tag="BQ2027_MB1431C"
+ CDS complement(1573215..1574573)
+ /gene="PE_PGRS25"
+ /locus_tag="BQ2027_MB1431C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1431c, PE_PGRS25, len: 452 aa. Similar to
+ Rv1396c, len: 576 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (78.1% identity in 576 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, strong similarity to many
+ e.g. glycine rich protein MTCY130.10C|E245019 (603 aa),
+ FASTA scores: opt: 1945, E(): 0, (57.5% identity in 619 aa
+ overlap). Contains PS00017 ATP/GTP-binding site motif A,
+ similar to other PGRS-type sequences.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 372 bp deletion leads to a shorter product with a
+ different COOH part compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (452 aa versus 576
+ aa). Mb1431c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs25"
+ /protein_id="SIU00034.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ81"
+ /translation="MSFLFAQPEMLGAAATDLASIGSAISTANAAAAAATTRVLAAGA
+ DEVSAAVAALFSGHAQTYQALSTQAAAFHQQIVQTLTSTAGAYASAEAANVEQQLLGA
+ INAPTMALLGRPLIGHGADGAPGTGQAGGAGGILYGNGGNGGSGATGQAGGAGGAAGL
+ IGHGGAGGLGGTGASGGAGGAGGWLWGNGGAGGNGGVGVAGDPGGVGGAGGAGGAAGL
+ WGSGGSGGTGGQGGVGGGKSGDGGTGGIGGAGGGGGWLHGDGGAGGHGGQGGTGVSSG
+ GNGGAGGTGGDGRGLSGSGGAGGHGGQTGVGGKVGENNFGGAGGAGGTGGLIGNGGAG
+ GTGGKGGDGFGVFGKGGAGGTGGRGGAAGLIGDAGTGGTGGKGGTAGEDGTGGNGGTG
+ GNGGAAVLIGNGGGGGAGGNGGAGNDGTPGNGGGGGVGGTGGTLFGQPGQPGPPGQPG
+ PA"
+ gene complement(1574828..1575229)
+ /gene="vapc10"
+ /locus_tag="BQ2027_MB1432C"
+ CDS complement(1574828..1575229)
+ /gene="vapc10"
+ /locus_tag="BQ2027_MB1432C"
+ /note="Mb1432c, -, len: 133 aa. Equivalent to Rv1397c,
+ len: 133 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 133 aa overlap). Conserved hypothetical
+ protein, similar to Mycobacterium tuberculosis protein
+ MTCY159.08C|Rv2548 (125 aa), FASTA scores: E(): 2.3e-14,
+ (42.4% identity in 125 aa overlap). Protein product from
+ Mb1432c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1432c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc10"
+ /protein_id="SIU00035.1"
+ /db_xref="GOA:A0A1R3XY88"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY88"
+ /translation="MILVDSDVLIAHLRGVVAARDWLVSARKDGPLAISVVSTAELIG
+ GMRTAERREVWRLLASFRVQPATEVIARRAGDMMRRYRRSHNRIGLGDYLIAATADVQ
+ GLQLATLNVWHFPMFEQLKPPFAVPGHRPRA"
+ gene complement(1575226..1575483)
+ /gene="vapb10"
+ /locus_tag="BQ2027_MB1433C"
+ CDS complement(1575226..1575483)
+ /gene="vapb10"
+ /locus_tag="BQ2027_MB1433C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1433c, -, len: 85 aa. Equivalent to Rv1398c, len:
+ 85 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 85 aa overlap). Conserved hypothetical
+ protein, similar to Mycobacterium tuberculosis proteins
+ Rv2547|MTCY159.09C (85 aa), FASTA scores: E(): 0.0035,
+ (37.1% identity in 62 aa overlap); Rv0581, Rv2871, Rv1241,
+ etc. Protein product from Mb1433c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1433c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb10"
+ /protein_id="SIU00036.1"
+ /db_xref="GOA:P64836"
+ /db_xref="InterPro:IPR002145"
+ /db_xref="InterPro:IPR010985"
+ /db_xref="InterPro:IPR013321"
+ /db_xref="UniProtKB/Swiss-Prot:P64836"
+ /translation="MKRTNIYLDEEQTASLDKLAAQEGVSRAELIRLLLNRALTTAGD
+ DLASDLQAINDSFGTLRHLDPPVRRSGGREQHLAQVWRATS"
+ gene complement(1575566..1576525)
+ /gene="nlhh"
+ /locus_tag="BQ2027_MB1434C"
+ CDS complement(1575566..1576525)
+ /gene="nlhh"
+ /locus_tag="BQ2027_MB1434C"
+ /note="Mb1434c, lipH, len: 319 aa. Equivalent to Rv1399c,
+ len: 319 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 319 aa overlap). Possible LipH, lipase
+ (EC 3.1.-.-), most similar to G695278 lipase like enzyme
+ from Ralstonia eutropha (364 aa), FASTA scores: opt: 648,
+ E(): 4.4e-34, (37.3% identity in 327 aa ov erlap), similar
+ to Mycobacterium tuberculosis hypothetical lipases e.g.
+ Rv2284, Rv2485c, Rv1426c, etc. Protein product from
+ Mb1434c detected using SWATH mass spectrometry. Mb1434c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable non lipolytic carboxylesterase nlhh"
+ /protein_id="SIU00037.1"
+ /db_xref="GOA:A0A1R3XY93"
+ /db_xref="InterPro:IPR013094"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY93"
+ /translation="MTEPTVARPDIDPVLKMLLDTFPVTFTAADGVEVARARLRQLKT
+ PPELLPELRIEERTVGYDGLTDIPVRVYWPPVVRDNLPVVVYYHGGGWSLGGLDTHDP
+ VARAHAVGAQAIVVSVDYRLAPEHPYPAGIDDSWAALRWVGENAAELGGDPSRIAVAG
+ DSAGGNISAVMAQLARDVGGPPLVFQLLWYPTTMADLSLPSFTENADAPILDRDVIDA
+ FLAWYVPGLDISDHTMLPTTLAPGNADLSGLPPAFIGTAEHDPLRDDGACYAELLTAA
+ GVSVELSNEPTMVHGYVNFALVVPAAAEATGRGLAALKRALHA"
+ gene complement(1576550..1577512)
+ /gene="lipI"
+ /locus_tag="BQ2027_MB1435C"
+ CDS complement(1576550..1577512)
+ /gene="lipI"
+ /locus_tag="BQ2027_MB1435C"
+ /note="Mb1435c, lipI, len: 320 aa. Equivalent to Rv1400c,
+ len: 320 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 320 aa overlap). Possible lipI, lipase
+ (EC 3.1.-.-), most similar to G695278 lipase like enzyme
+ (364 aa), FASTA sscores: opt: 611, E(): 3.5e-30, (36.6%
+ identity in 352 aa overlap); similar to Mycobacterium
+ tuberculosis hypothetical lipases e.g.
+ Rv1399c|MTCY21B4.16c (58.1% identical in 315 aa overlap);
+ Rv1426c, Rv2284, etc. Protein product from Mb1435c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1435c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPASE LIPH"
+ /protein_id="SIU00038.1"
+ /db_xref="GOA:A0A1R3XY96"
+ /db_xref="InterPro:IPR002168"
+ /db_xref="InterPro:IPR013094"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="InterPro:IPR033140"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY96"
+ /translation="MPSLDNTADEKPAIDPILLKVLDAVPFRLSIDDGIEAVRQRLRD
+ LPRQPVHPELRVVDLAIDGPAGPIGTRIYWPPTCPDQAEAPVVLYFHGGGFVMGDLDT
+ HDGTCRQHAVGADAIVVSVDYRLAPEHPYPAAIEDAWAATRWVAEHGRQVGADLGRIA
+ VAGDSAGGTIAAVIAQRARDMGGPPIVFQLLWYPSTLWDQSLPSLAENADAPILDVKA
+ IAAFSRWYAGEIDLHNPPAPMAPGRAENLADLPPAYIAVAGYDPLRDDGIRYGELLAA
+ AGVPVEVHNAQTLVHGYVGYAGVVPAATEATNRGLVALRVVLHG"
+ gene 1577646..1578248
+ /locus_tag="BQ2027_MB1436"
+ CDS 1577646..1578248
+ /locus_tag="BQ2027_MB1436"
+ /note="Mb1436, -, len: 200 aa. Equivalent to Rv1401, len:
+ 200 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 200 aa overlap). Possible membrane
+ protein. Mb1436 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIU00039.1"
+ /db_xref="GOA:P64838"
+ /db_xref="InterPro:IPR012506"
+ /db_xref="UniProtKB/Swiss-Prot:P64838"
+ /translation="MLQPAFKASMAVLLAAAAVAHPIGRERRWLVPALLLSATGDWLL
+ AIPWWTWAFVFGLGAFLLAHLCFIGALLPLARQAAPSRGRVAAVVAMCVASAGLLVWF
+ WPHLGKDNLTIPVTVYIVALSAMVCTALLARLPTIWTAVGAVCFAASDSMIGIGRFIL
+ GNEALAVPIWWSYAAAEILITAGFFFGREVPDNAAAPTDS"
+ gene 1578329..1580296
+ /gene="priA"
+ /locus_tag="BQ2027_MB1437"
+ CDS 1578329..1580296
+ /gene="priA"
+ /locus_tag="BQ2027_MB1437"
+ /note="Mb1437, priA, len: 655 aa. Equivalent to Rv1402,
+ len: 655 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 655 aa overlap). Putative priA,
+ primosomal protein N'. Similar to e.g. PRIA_ECOLI|P17888
+ primosomal protein N' (replication factor Y) (732 aa),
+ FASTA scores, opt: 386, E(): 1.3e-16, (27.6% identity in
+ 711 aa overlap). Compared to other bacterial priA, it has
+ a very divergent helicase domain. BELONGS TO THE HELICASE
+ FAMILY. PRIA SUBFAMILY. Protein product from Mb1437
+ detected using SWATH mass spectrometry. Mb1437 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE PRIMOSOMAL PROTEIN N' PRIA (Replication
+ factor Y)"
+ /protein_id="SIU00040.1"
+ /db_xref="GOA:P0A5A6"
+ /db_xref="InterPro:IPR005259"
+ /db_xref="InterPro:IPR041222"
+ /db_xref="InterPro:IPR042115"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5A6"
+ /translation="MLSVPHLDRDFDYLVPAEHSDDAQPGVRVRVRFHGRLVDGFVLE
+ RRSDSDHHGKLGWLDRVVSPEPVLTTEIRRLVDAVAARYAGTRQDVLRLAVPARHARV
+ EREITTAPGRPVVAPVDPSGWAAYGRGRQFLAALADSRAARAVWQALPGELWADRFAE
+ AAAQTVRAGRTVLAIVPDQRDLDTLWQAATALVDEHSVVALSAGLGPEARYRRWLAAL
+ RGSARLVIGTRSAVFAPLSELGLVMVWADADDSLAEPRAPYPHAREVAMLRAHQARCA
+ ALIGGYARTAEAHALVRSGWAHDVVAPRPEVRARSPRVVALDDSGYDDARDPAARTAR
+ LPSIALRAARSALQSGAPVLVQVPRRGYIPSLACGRCRAIARCRSCTGPLSLQGAGSP
+ GAVCRWCGRVDPTLRCVRCGSDVVRAVVVGARRTAEELGRAFPGTAVITSAGDTLVPQ
+ LDAGPALVVATPGAEPRAPGGYGAALLLDSWALLGRQDLRAAEDALWRWMTAAALVRP
+ RGAGGVVTVVAESSIPTVQSLIRWDPVGHAEAELAARTEVGLPPSVHIAALDGPAGTV
+ TALLEAARLPDPDRLQADLLGPVDLPPGVRRPAGIPADAPVIRMLLRVCREQGLELAA
+ SLRRGIGVLSARQTRQTRSLVRVQIDPLHIG"
+ gene complement(1580314..1581138)
+ /locus_tag="BQ2027_MB1438C"
+ CDS complement(1580314..1581138)
+ /locus_tag="BQ2027_MB1438C"
+ /note="Mb1438c, -, len: 274 aa. Equivalent to Rv1403c,
+ len: 274 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 274 aa overlap). Putative
+ methyltransferase (EC 2.1.1.-), similar to
+ PMTA_RHOSH|Q05197 phosphatidylethanolamine
+ m-methyltransferase (203 aa), FASTA scores: opt: 217, E():
+ 1.1e-07, (37.1% identity in 105 aa overlap); similar to
+ Rv1405c|MTCY21B4.22c (59.3% identity in 273 aa overlap)
+ and to Rv1523, Rv2952, etc."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE METHYLTRANSFERASE"
+ /protein_id="SIU00041.1"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="InterPro:IPR041698"
+ /db_xref="UniProtKB/Swiss-Prot:P64840"
+ /translation="MTVYTPTSERQAPATTHRQMWALGDYAAIAEELLAPLGPILVST
+ SGIRRGDRVLDVAAGSGNVSIPAAMAGAHVTASDLTPELLRRAQARAAAAGLELGWRE
+ ANAEALPFSAGEFDAVLSTIGVMFAPRHQRTADELARVCRRGGKISTLNWTPEGFYGK
+ LLSTIRPYRPTLPAGAPHEVWWGSEDYVSGLFRDHVSDIRTRRGSLTVDRFGCPDECR
+ DYFKNFYGPAINAYRSIADSPECVATLDAEITELCREYLCDGVMQWEYLIFTARKC"
+ gene 1581307..1581789
+ /locus_tag="BQ2027_MB1439"
+ CDS 1581307..1581789
+ /locus_tag="BQ2027_MB1439"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1439, -, len: 160 aa. Equivalent to Rv1404, len:
+ 160 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 160 aa overlap). Probable
+ transcriptional regulatory protein, some similarity to
+ MARR_ECOLI|P27245 multiple antibiotic resistance protein
+ from Escherichia coli (125 aa), FASTA scores: opt: 136,
+ E(): 0.004, (35.1% identity in 74 aa overlap). Protein
+ product from Mb1439 detected using shotgun mass
+ spectrometry. Mb1439 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00042.1"
+ /db_xref="GOA:A0A1R3XY87"
+ /db_xref="InterPro:IPR000835"
+ /db_xref="InterPro:IPR023187"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY87"
+ /translation="MMPTEYPATAEESVDVITDALLTASRLLVAISAHSIAQVDENIT
+ IPQFRTLVILSNHGPINLATLATLLGVQPSATGRMVDRLVGAELIDRLPHPTSRRELL
+ AALTKRGRDVVRQVTEHRRTEIARIVEQMAPAERHGLVRALTAFTEAGGEPDARYEIE
+ "
+ gene complement(1581861..1582685)
+ /locus_tag="BQ2027_MB1440C"
+ CDS complement(1581861..1582685)
+ /locus_tag="BQ2027_MB1440C"
+ /note="Mb1440c, -, len: 274 aa. Equivalent to Rv1405c,
+ len: 274 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 274 aa overlap). Putative
+ methyltransferase (EC 2.1.1.-), most similar to
+ PMTA_RHOSH|Q05197 phosphatidylethanolamine
+ m-methyltransferase (203 aa), FASTA scores: opt: 219, E():
+ 2.6e-07, (29.9% identity in 144 aa overlap); similar to
+ Rv1403c|MTCY21B4.20c (59.3% identity in 273 aa overlap),
+ Rv1523, Rv2952, etc. Protein product from Mb1440c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE METHYLTRANSFERASE"
+ /protein_id="SIU00043.1"
+ /db_xref="GOA:P64842"
+ /db_xref="InterPro:IPR013216"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:P64842"
+ /translation="MTIDTPAREDQTLAATHRAMWALGDYALMAEEVMAPLGPILVAA
+ AGIGPGVRVLDVAAGSGNISLPAAKTGATVISTDLTPELLQRSQARAAQQGLTLQYQE
+ ANAQALPFADDEFDTVISAIGVMFAPDHQAAADELVRVCRPGGTIGVISWTCEGFFGR
+ MLATIRPYRPSVSADLPPSALWGREAYVTGLLGDGVTGLKTARGLLEVKRFDTAQAVH
+ DYFKNNYGPTIEAYAHIGDNAVLAAELDRQLVELAAQYLSDGVMEWEYLLLTAEKR"
+ gene 1582882..1583820
+ /gene="fmt"
+ /locus_tag="BQ2027_MB1441"
+ CDS 1582882..1583820
+ /gene="fmt"
+ /locus_tag="BQ2027_MB1441"
+ /note="Mb1441, fmt, len: 312 aa. Equivalent to Rv1406,
+ len: 312 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 312 aa overlap). Probable fmt,
+ methionyl-tRNA formyltransferase (EC 2.1.2.9), similar to
+ many e.g. FMT_ECOLI|P23882 Escherichia coli (314 aa),
+ FASTA scores: opt: 616, E(): 6.7e-31, (39.3% identity in
+ 303 aa overlap). BELONGS TO THE FMT FAMILY. Protein
+ product from Mb1441 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1441 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METHIONYL-TRNA FORMYLTRANSFERASE FMT"
+ /protein_id="SIU00044.1"
+ /db_xref="GOA:P64135"
+ /db_xref="InterPro:IPR002376"
+ /db_xref="InterPro:IPR005793"
+ /db_xref="InterPro:IPR005794"
+ /db_xref="InterPro:IPR011034"
+ /db_xref="InterPro:IPR036477"
+ /db_xref="InterPro:IPR037022"
+ /db_xref="InterPro:IPR041711"
+ /db_xref="UniProtKB/Swiss-Prot:P64135"
+ /translation="MRLVFAGTPEPALASLRRLIESPSHDVIAVLTRPDAASGRRGKP
+ QPSPVAREAAERGIPVLRPSRPNSAEFVAELSDLAPECCAVVAYGALLGGPLLAVPPH
+ GWVNLHFSLLPAWRGAAPVQAAIAAGDTITGATTFQIEPSLDSGPIYGVVTEVIQPTD
+ TAGDLLKRLAVSGAALLSTTLDGIADQRLTPRPQPADGVSVAPKITVANARVRWDLPA
+ AVVERRIRAVTPNPGAWTLIGDLRVKLGPVHLDAAHRPSKPLPPGGIHVERTSVWIGT
+ GSEPVRLGQIQPPGKKLMNAADWARGARLDLAARAT"
+ gene 1583817..1585190
+ /gene="fmu"
+ /locus_tag="BQ2027_MB1442"
+ CDS 1583817..1585190
+ /gene="fmu"
+ /locus_tag="BQ2027_MB1442"
+ /note="Mb1442, fmu, len: 457 aa. Equivalent to Rv1407,
+ len: 457 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 457 aa overlap). Probable fmu protein,
+ similar to SUN_ECOLI|P36929 sun protein (fmu protein) from
+ Escherichia coli (429 aa), FASTA scores: E(): 2.5e-20,
+ (30.6% identity in 451 aa overlap). Protein product from
+ Mb1442 detected using SWATH mass spectrometry. Mb1442
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FMU PROTEIN (SUN PROTEIN)"
+ /protein_id="SIU00045.1"
+ /db_xref="GOA:A0A1R3XY95"
+ /db_xref="InterPro:IPR001678"
+ /db_xref="InterPro:IPR006027"
+ /db_xref="InterPro:IPR018314"
+ /db_xref="InterPro:IPR023267"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="InterPro:IPR035926"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XY95"
+ /translation="MTPRSRGPRRRPLDPARRAAFETLRAVSARDAYANLVLPALLAQ
+ RGIGGRDAAFATELTYGTCRARGLLDAVIGAAAERSPQAIDPVLLDLLRLGTYQLLRT
+ RVDAHAAVSTTVEQAGIEFDSARAGFVNGVLRTIAGRDERSWVGELAPDAQNDPIGHA
+ AFVHAHPRWIAQAFADALGAAVGELEAVLASDDERPAVHLAARPGVLTAGELARAVRG
+ TVGRYSPFAVYLPRGDPGRLAPVRDGQALVQDEGSQLVARALTLAPVDGDTGRWLDLC
+ AGPGGKTALLAGLGLQCAARVTAVEPSPHRADLVAQNTRGLPVELLRVDGRHTDLDPG
+ FDRVLVDAPCTGLGALRRRPEARWRRQPADVAALAKLQRELLSAAIALTRPGGVVLYA
+ TCSPHLAETVGAVADALRRHPVHALDTRPLFEPVLAGLGEGPHVQLWPHRHGTDAMFA
+ AALRRLT"
+ gene 1585215..1585913
+ /gene="rpe"
+ /locus_tag="BQ2027_MB1443"
+ CDS 1585215..1585913
+ /gene="rpe"
+ /locus_tag="BQ2027_MB1443"
+ /note="Mb1443, rpe, len: 232 aa. Equivalent to Rv1408,
+ len: 232 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 232 aa overlap). Probable rpe,
+ ribulose-phosphate 3-epimerase (EC 5.1.3.1), similar to
+ many e.g. CXEC_ALCEU|P40117 (241 aa), FASTA scores: opt:
+ 638, E(): 1.5e-34, (48.3% identity in 234 aa overlap); and
+ RPE_ECOLI|P32661 ribulose-phosphate 3-epimerase (225 aa),
+ FASTA scores: E(): 0, (46.2% identity in 221 aa overlap).
+ Contains PS01085 Ribulose-phosphate 3-epimerase family
+ signature 1. BELONGS TO THE RIBULOSE-PHOSPHATE 3-EPIMERASE
+ FAMILY. Protein product from Mb1443 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1443
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RIBULOSE-PHOSPHATE 3-EPIMERASE RPE
+ (PPE) (R5P3E) (Pentose-5-phosphate 3-epimerase)"
+ /protein_id="SIU00046.1"
+ /db_xref="GOA:P65761"
+ /db_xref="InterPro:IPR000056"
+ /db_xref="InterPro:IPR011060"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR026019"
+ /db_xref="UniProtKB/Swiss-Prot:P65761"
+ /translation="MSLMAGSTGGPLIAPSILAADFARLADEAAAVNGADWLHVDVMD
+ GHFVPNLTIGLPVVESLLAVTDIPMDCHLMIDNPDRWAPPYAEAGAYNVTFHAEATDN
+ PVGVARDIRAAGAKAGISVKPGTPLEPYLDILPHFDTLLVMSVEPGFGGQRFIPEVLS
+ KVRAVRKMVDAGELTILVEIDGGINDDTIEQAAEAGVDCFVAGSAVYGADDPAAAVAA
+ LRRQAGAASLHLSL"
+ gene 1585910..1586929
+ /gene="ribG"
+ /locus_tag="BQ2027_MB1444"
+ CDS 1585910..1586929
+ /gene="ribG"
+ /locus_tag="BQ2027_MB1444"
+ /note="Mb1444, ribG, len: 339 aa. Equivalent to Rv1409,
+ len: 339 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 339 aa overlap). Probable ribG
+ (alternate gene name: ribD), bifunctional riboflavin
+ biosynthesis protein, including
+ diaminohydroxyphosphoribosylaminopyrimidine deaminase and
+ 5-amino-6-(5-phosphoribosylamino) uracil reductase (EC
+ 3.5.4.26 and 1.1.1.193), similar to many e.g.
+ RIBD_ECOLI|P25539 riboflavin-specific deaminase from
+ Escherichia coli (367 aa), FASTA scores: E(): 0, (39.8%
+ identity in 364 aa overlap); etc. Contains PS00903
+ Cytidine and deoxycytidylate deaminases zinc-binding
+ region signature. IN THE N-TERMINAL SECTION; BELONGS TO
+ THE CYTIDINE AND DEOXYCYTIDYLATE DEAMINASES FAMILY. IN THE
+ C-TERMINAL SECTION; BELONGS TO THE HTP REDUCTASE FAMILY.
+ Protein product from Mb1444 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1444 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BIFUNCTIONAL riboflavin biosynthesis
+ protein RIBG : Diaminohydroxyphosphoribosylaminopyrimidine
+ deaminase (Riboflavin-specific deaminase) +
+ 5-amino-6-(5-phosphoribosylamino) uracil reductase (HTP
+ reductase)"
+ /protein_id="SIU00047.1"
+ /db_xref="GOA:A0A1R3XYA3"
+ /db_xref="InterPro:IPR002125"
+ /db_xref="InterPro:IPR002734"
+ /db_xref="InterPro:IPR004794"
+ /db_xref="InterPro:IPR016192"
+ /db_xref="InterPro:IPR016193"
+ /db_xref="InterPro:IPR024072"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYA3"
+ /translation="MNVEQVKSIDEAMGLAIEHSYQVKGTTYPNPPVGAVIVDPNGRI
+ VGAGGTEPAGGDHAEVVALRRAGGLATGAIVVVTMEPCNHYGKTPPCVNALIEARVGT
+ VVYAVADPNGIAGGGAGRLSAAGLQVRSGVLAEQVAAGPLREWLHKQRTGLPHVTWKY
+ ATSIDGRSAAADGSSQWISSEAARLDLHRRRAIADAILVGTGTVLADDPALTARLADG
+ SLAPQQPLRVVVGKRDIPPEARVLNDEARTMMIRTHEPMEVLRALSDRTDVLLEGGPT
+ LAGAFLRAGAINRILAYVAPILLGGPVTAVDDVGVSNITNALRWQFDSVEKVGPDLLL
+ SLVAR"
+ gene complement(1586926..1588482)
+ /locus_tag="BQ2027_MB1445C"
+ CDS complement(1586926..1588482)
+ /locus_tag="BQ2027_MB1445C"
+ /standard_name="P55"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1445c, -, len: 518 aa. Equivalent to Rv1410c,
+ len: 518 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 518 aa overlap).
+ Aminoglycoside/tetracycline-transport integral membrane
+ protein (see citation below), member of major facilitator
+ superfamily (MFS), similar to others e.g.
+ AC22_STRCO|P46105 probable actinorhodin transporter from
+ Streptomyces coelicolor (578 aa), FASTA scores: opt: 442,
+ E(): 4.9e-21, (28.5% identity in 466 aa overlap); etc.
+ Contains PS00216 Sugar transport proteins signature 1.
+ Could be termed P55. Note that the Rv1410c-Rv1411c operon
+ seems transcribed from two promoters in M. bovis BCG (see
+ second citation). Protein product from Mb1445c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1445c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="AMINOGLYCOSIDES/TETRACYCLINE-TRANSPORT INTEGRAL
+ MEMBRANE PROTEIN"
+ /protein_id="SIU00048.1"
+ /db_xref="GOA:Q7U042"
+ /db_xref="InterPro:IPR001411"
+ /db_xref="InterPro:IPR005829"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U042"
+ /translation="MRAGRRVAISAGSLAVLLGALDTYVVVTIMRDIMNSVGIPINQL
+ HRITWIVTMYLLGYIAAMPLLGRASDRFGRKLMLQVSLAGFIIGSVVTALAGHFGDFH
+ MLIAGRTIQGVASGALLPITLALGADLWSQRNRAGVLGGIGAAQELGSVLGPLYGIFI
+ VWLLHDWRDVFWINVPLTAIAMVMIHFSLPSHDRSTEPERVDLVGGLLLALALGLAVI
+ GLYNPNPDGKHVLPDYGAPLLVGALVAAVAFFGWERFARTRLIDPAGVHFRPFLSALG
+ ASVAAGAALMVTLVDVELFGQGVLQMDQAQAAGMLLWFLIALPIGAVTGGWIATRAGD
+ RAVAFAGLLIAAYGYWLISHWPVDLLADRHNILGLFTVPAMHTDLVVAGLGLGLVIGP
+ LSSATLRVVPSAQHGIASAAVVVARMTGMLIGVAALSAWGLYRFNQILAGLSAAIPPN
+ ASLLERAAAIGARYQQAFALMYGEIFTITAIVCVFGAVLGLLISGRKEHADEPEVQEQ
+ PTLAPQVEPL"
+ gene complement(1588488..1589198)
+ /gene="lprG"
+ /locus_tag="BQ2027_MB1446C"
+ CDS complement(1588488..1589198)
+ /gene="lprG"
+ /locus_tag="BQ2027_MB1446C"
+ /standard_name="P27"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1446c, lprG, len: 236 aa. Equivalent to Rv1411c,
+ len: 236 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 236 aa overlap). Probable lprG
+ (alternate gene name: P27), conserved lipoprotein, similar
+ to Mycobacterium tuberculosis hypothetical lipoproteins
+ e.g. Rv1270c|MTCY50.12 (35.1% identity in 245 aa overlap);
+ Rv1368, Rv2945c. Contains N-terminal signal sequence and
+ appropriately positioned prokaryotic lipoprotein lipid
+ attachment site (PS00013). Note that the Rv1410c-Rv1411c
+ operon seems transcribed from two promoters in M. bovis
+ BCG (see second citation). Protein product from Mb1446c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1446c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved lipoprotein lprg"
+ /protein_id="SIU00049.1"
+ /db_xref="GOA:P0A5I9"
+ /db_xref="InterPro:IPR009830"
+ /db_xref="InterPro:IPR029046"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5I9"
+ /translation="MRTPRRHCRRIAVLAAVSIAATVVAGCSSGSKPSGGPLPDAKPL
+ VEEATAQTKALKSAHMVLTVNGKIPGLSLKTLSGDLTTNPTAATGNVKLTLGGSDIDA
+ DFVVFDGILYATLTPNQWSDFGPAADIYDPAQVLNPDTGLANVLANFADAKAEGRDTI
+ NGQNTIRISGKVSAQAVNQIAPPFNATQPVPATVWIQETGDHQLAQAQLDRGSGNSVQ
+ MTLSKWGEKVQVTKPPVS"
+ gene 1589283..1589888
+ /gene="ribC"
+ /locus_tag="BQ2027_MB1447"
+ CDS 1589283..1589888
+ /gene="ribC"
+ /locus_tag="BQ2027_MB1447"
+ /note="Mb1447, ribC, len: 201 aa. Equivalent to Rv1412,
+ len: 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 201 aa overlap). Probable ribC (ribE),
+ Riboflavin synthase alpha chain (EC 2.5.1.9), strong
+ similarity to others e.g. RISA_ACTPL|P50854 (215 aa),
+ FASTA scores: opt: 586, E(): 1.8e-33, (50.8% identity in
+ 197 aa overlap). Contains 2 x PS00693 Riboflavin synthase
+ alpha chain family signature. Protein product from Mb1447
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1447 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RIBOFLAVIN SYNTHASE ALPHA CHAIN RIBC
+ (RIBE)"
+ /protein_id="SIU00050.1"
+ /db_xref="GOA:P65328"
+ /db_xref="InterPro:IPR001783"
+ /db_xref="InterPro:IPR017938"
+ /db_xref="InterPro:IPR023366"
+ /db_xref="InterPro:IPR026017"
+ /db_xref="UniProtKB/Swiss-Prot:P65328"
+ /translation="MFTGIVEERGEVTGREALVDAARLTIRGPMVTADAGHGDSIAVN
+ GVCLTVVDVLPDGQFTADVMAETLNRSNLGELRPGSRVNLERAAALGSRLGGHIVQGH
+ VDATGEIVARCPSEHWEVVRIEMPASVARYVVEKGSITVDGISLTVSGLGAEQRDWFE
+ VSLIPTTRELTTLGSAAVGTRVNLEVDVVAKYVERLMRSAG"
+ gene 1590102..1590617
+ /locus_tag="BQ2027_MB1448"
+ CDS 1590102..1590617
+ /locus_tag="BQ2027_MB1448"
+ /note="Mb1448, -, len: 171 aa. Equivalent to Rv1413, len:
+ 171 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 171 aa overlap). Conserved hypothetical
+ protein, similar to part of AB010956|AB010956_1
+ metal-activated pyridoxal enzyme from Arthrobacter sp.
+ (379 aa), FASTA scores: opt: 187, E(): 0.00026, (29.0%
+ identity in 162 aa overlap). Mb1448 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="METAL-ACTIVATED PYRIDOXAL ENZYME"
+ /protein_id="SIU00051.1"
+ /db_xref="InterPro:IPR001608"
+ /db_xref="InterPro:IPR029066"
+ /db_xref="UniProtKB/Swiss-Prot:P64844"
+ /translation="MATIGEVEVFVDHGADDVFITYPLWIGTRQADRLRQLADRARIA
+ VGAGTAEGASNTGARLADAAGAIDVLIEIDSGHHRSGVRAEQVLEVAHAVGEAGLHLV
+ GVFTFPGHSYAPGKPGEAGEQERRALNDAANALVAVGFPISCRSGGSTPTALLTAADG
+ ASETSRRLCAR"
+ gene 1590607..1591008
+ /locus_tag="BQ2027_MB1449"
+ CDS 1590607..1591008
+ /locus_tag="BQ2027_MB1449"
+ /note="Mb1449, -, len: 133 aa. Equivalent to Rv1414, len:
+ 133 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 133 aa overlap). Conserved hypothetical
+ protein, similar to C-terminal part of AB010956|AB010956_1
+ novel metal-activated pyridoxal enzyme from Arthrobacter
+ sp. (379 aa), FASTA scores: opt: 163, E(): 0.00063, (32.1%
+ identity in 112 aa overlap). Rv1413 is similar to
+ N-terminal part of same enzyme suggesting possible
+ frameshift. Sequence has been checked and no errors found,
+ it is identical in Mycobacterium tuberculosis CDC1551.
+ Mb1449 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted amino acid aldolase or racemase"
+ /protein_id="SIU00052.1"
+ /db_xref="InterPro:IPR026956"
+ /db_xref="InterPro:IPR042208"
+ /db_xref="UniProtKB/Swiss-Prot:P64846"
+ /translation="MLGDAQQLELGRCAPADIALTVAATVVSRQDCRSGLRRIVLDCG
+ SKILGSDRPAWATGFGRLIDHADARIAALSEHHATVVWPDDAPLPPVGTRLRVIPNHV
+ CLTTNLVDDVAVVRDATLIDRWKVAARGKNH"
+ gene 1591113..1592390
+ /gene="ribA2"
+ /locus_tag="BQ2027_MB1450"
+ CDS 1591113..1592390
+ /gene="ribA2"
+ /locus_tag="BQ2027_MB1450"
+ /note="Mb1450, ribA2, len: 425 aa. Equivalent to Rv1415,
+ len: 425 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 425 aa overlap). Probable ribA2,
+ Riboflavin biosynthesis protein (EC 3.5.4.25), similar to
+ many e.g. GCH2_BACSU|P17620 from Bacillus subtilis (398
+ aa), FASTA scores: opt: 1388, E(): 0, (55.4% identity in
+ 399 aa overlap). Also similar to second Mycobacterium
+ tuberculosis gtp cyclohydrolase Rv1940|ribA1 (353 aa). IN
+ THE N-TERMINAL SECTION; BELONGS TO THE DHBP SYNTHASE
+ FAMILY. IN THE C-TERMINAL SECTION; BELONGS TO THE GTP
+ CYCLOHYDROLASE II FAMILY. Protein product from Mb1450
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1450 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RIBOFLAVIN BIOSYNTHESIS PROTEIN RIBA2 :
+ GTP cyclohydrolase II + 3,4-dihydroxy-2-butanone
+ 4-phosphate synthase (DHBP synthase)"
+ /protein_id="SIU00053.1"
+ /db_xref="GOA:P0A5V1"
+ /db_xref="InterPro:IPR000422"
+ /db_xref="InterPro:IPR000926"
+ /db_xref="InterPro:IPR016299"
+ /db_xref="InterPro:IPR017945"
+ /db_xref="InterPro:IPR032677"
+ /db_xref="InterPro:IPR036144"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5V1"
+ /translation="MTRLDSVERAVADIAAGKAVIVIDDEDRENEGDLIFAAEKATPE
+ MVAFMVRYTSGYLCVPLDGAICDRLGLLPMYAVNQDKHGTAYTVTVDARNGIGTGISA
+ SDRATTMRLLADPTSVADDFTRPGHVVPLRAKDGGVLRRPGHTEAAVDLARMAGLQPA
+ GAICEIVSQKDEGSMAHTDELRVFADEHGLALITIADLIEWRRKHEKHIERVAEARIP
+ TRHGEFRAIGYTSIYEDVEHVALVRGEIAGPNADGDDVLVRVHSECLTGDVFGSRRCD
+ CGPQLDAALAMVAREGRGVVLYMRGHEGRGIGLMHKLQAYQLQDAGADTVDANLKLGL
+ PADARDYGIGAQILVDLGVRSMRLLTNNPAKRVGLDGYGLHIIERVPLPVRANAENIR
+ YLMTKRDKLGHDLAGLDDFHESVHLPGEFGGAL"
+ gene 1592405..1592869
+ /gene="ribH"
+ /locus_tag="BQ2027_MB1451"
+ CDS 1592405..1592869
+ /gene="ribH"
+ /locus_tag="BQ2027_MB1451"
+ /note="Mb1451, ribH, len: 154 aa. Equivalent to Rv1416,
+ len: 154 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 154 aa overlap). Probable ribH,
+ riboflavin synthase beta chain (EC 2.5.1.9), similar to
+ many e.g. RISB_ECOLI|P25540 Escherichia coli (156 aa),
+ FASTA scores: opt: 330, E(): 1.8e-15, (44.1% identity in
+ 145 aa overlap). Note alternative GTG start possible
+ overlapping the stop codon of Rv1415|MTCY21B4.33. BELONGS
+ TO THE DMRL SYNTHASE FAMILY. Protein product from Mb1451
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1451 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RIBOFLAVIN SYNTHASE BETA CHAIN RIBH
+ (6,7-dimethyl-8-ribityllumazine synthase) (DMRL synthase)
+ (Lumazine synthase)"
+ /protein_id="SIU00054.1"
+ /db_xref="GOA:P66035"
+ /db_xref="InterPro:IPR002180"
+ /db_xref="InterPro:IPR034964"
+ /db_xref="InterPro:IPR036467"
+ /db_xref="UniProtKB/Swiss-Prot:P66035"
+ /translation="MPDLPSLDASGVRLAIVASSWHGKICDALLDGARKVAAGCGLDD
+ PTVVRVLGAIEIPVVAQELARNHDAVVALGVVIRGQTPHFDYVCDAVTQGLTRVSLDS
+ STPIANGVLTTNTEEQALDRAGLPTSAEDKGAQATVAALATALTLRELRAHS"
+ gene 1592866..1593330
+ /locus_tag="BQ2027_MB1452"
+ CDS 1592866..1593330
+ /locus_tag="BQ2027_MB1452"
+ /note="Mb1452, -, len: 154 aa. Equivalent to Rv1417, len:
+ 154 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 154 aa overlap). Possible conserved
+ membrane protein, similar to others e.g. AL133213|SC6D7_2
+ Streptomyces coelicolor (156 aa), FASTA scores: opt: 212,
+ E(): 4.4e-07, (32.4% identity in 136 aa overlap). Protein
+ product from Mb1452 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1452 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00055.1"
+ /db_xref="GOA:P64848"
+ /db_xref="InterPro:IPR019692"
+ /db_xref="UniProtKB/Swiss-Prot:P64848"
+ /translation="MTAAPNDWDVVLRPHWTPLFAYAAAFLIAVAHVAGGLLLKVGSS
+ GVVFQTADQVAMGALGLVLAGAVLLFARPRLRVGSAGLSVRNLLGDRIVGWSEVIGVS
+ FPGGSRWARIDLADDEYIPVMAIQAVDKDRAVAAMDTVRSLLARYRPDLCAR"
+ gene 1593355..1594041
+ /gene="lprH"
+ /locus_tag="BQ2027_MB1453"
+ CDS 1593355..1594041
+ /gene="lprH"
+ /locus_tag="BQ2027_MB1453"
+ /note="Mb1453, lprH, len: 228 aa. Equivalent to Rv1418,
+ len: 228 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 228 aa overlap). Probable lprH,
+ lipoprotein. Contains N-terminal signal sequence and
+ appropriately positioned prokaryotic lipoprotein lipid
+ attachment site (PS00013). Mb1453 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPOPROTEIN LPRH"
+ /protein_id="SIU00056.1"
+ /db_xref="GOA:P65317"
+ /db_xref="UniProtKB/Swiss-Prot:P65317"
+ /translation="MACLGRPGCRGWAGASLVLVVVLALAACTESVAGRAMRATDRSS
+ GLPTSAKPARARDLLLQDGDRAPFGQVTQSRVGDSYFTSAVPPECSAALLFKGSPLRP
+ DGSSDHAEAAYNVTGPLPYAESVDVYTNVLNVHDVVWNGFRDVSHCRGDAVGVSRAGR
+ STPMRLRYFATLSDGVLVWTMSNPRWTCDYGLAVVPHAVLVLSACGFKPGFPMAEWAS
+ KRRAQLDSQV"
+ gene 1594221..1594694
+ /locus_tag="BQ2027_MB1454"
+ CDS 1594221..1594694
+ /locus_tag="BQ2027_MB1454"
+ /note="Mb1454, -, len: 157 aa. Equivalent to Rv1419, len:
+ 157 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 157 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1454 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1454 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00057.1"
+ /db_xref="GOA:P64850"
+ /db_xref="InterPro:IPR000772"
+ /db_xref="InterPro:IPR035992"
+ /db_xref="UniProtKB/Swiss-Prot:P64850"
+ /translation="MGELRLVGGVLRVLVVVGAVFDVAVLNAGAASADGPVQLKSRLG
+ DVCLDAPSGSWFSPLVINPCNGTDFQRWNLTDDRQVESVAFPGECVNIGNALWARLQP
+ CVNWISQHWTVQPDGLVKSDLDACLTVLGGPDPGTWVSTRWCDPNAPDQQWDSVP"
+ gene 1594758..1596698
+ /gene="uvrC"
+ /locus_tag="BQ2027_MB1455"
+ CDS 1594758..1596698
+ /gene="uvrC"
+ /locus_tag="BQ2027_MB1455"
+ /note="Mb1455, uvrC, len: 646 aa. Equivalent to Rv1420,
+ len: 646 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 646 aa overlap). Probable uvrC,
+ excinuclease ABC subunit C, similar to many e.g.
+ UVRC_PSEFL|P32966 Pseudomonas fluorescens (607 aa), fasta
+ scores: opt: 738, E(): 8.4e-39, (36.6% identity in 629 aa
+ overlap). BELONGS TO THE UVRC FAMILY. Protein product from
+ Mb1455 detected using SWATH mass spectrometry. Mb1455
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable excinuclease abc (subunit c-nuclease)
+ uvrc"
+ /protein_id="SIU00058.1"
+ /db_xref="GOA:P67427"
+ /db_xref="InterPro:IPR000305"
+ /db_xref="InterPro:IPR001162"
+ /db_xref="InterPro:IPR001943"
+ /db_xref="InterPro:IPR003583"
+ /db_xref="InterPro:IPR004791"
+ /db_xref="InterPro:IPR010994"
+ /db_xref="InterPro:IPR035901"
+ /db_xref="InterPro:IPR036876"
+ /db_xref="InterPro:IPR038476"
+ /db_xref="InterPro:IPR041663"
+ /db_xref="UniProtKB/Swiss-Prot:P67427"
+ /translation="MPDPATYRPAPGSIPVEPGVYRFRDQHGRVIYVGKAKSLRSRLT
+ SYFADVASLAPRTRQLVTTAAKVEWTVVGTEVEALQLEYTWIKEFDPRFNVRYRDDKS
+ YPVLAVTLGEEFPRLMVYRGPRRKGVRYFGPYSHAWAIRETLDLLTRVFPARTCSAGV
+ FKRHRQIDRPCLLGYIDKCSAPCIGRVDAAQHRQIVADFCDFLSGKTDRFARALEQQM
+ NAAAEQLDFERAARLRDDLSALKRAMEKQAVVLGDGTDADVVAFADDELEAAVQVFHV
+ RGGRVRGQRGWIVEKPGEPGDSGIQLVEQFLTQFYGDQAALDDAADESANPVPREVLV
+ PCLPSNAEELASWLSGLRGSRVVLRVPRRGDKRALAETVHRNAEDALQQHKLKRASDF
+ NARSAALQSIQDSLGLADAPLRIECVDVSHVQGTDVVGSLVVFEDGLPRKSDYRHFGI
+ REAAGQGRSDDVACIAEVTRRRFLRHLRDQSDPDLLSPERKSRRFAYPPNLYVVDGGA
+ PQVNAASAVIDELGVTDVAVIGLAKRLEEVWVPSEPDPIIMPRNSEGLYLLQRVRDEA
+ HRFAITYHRSKRSTRMTASALDSVPGLGEHRRKALVTHFGSIARLKEATVDEITAVPG
+ IGVATATAVHDALRPDSSGAAR"
+ gene 1596695..1597600
+ /locus_tag="BQ2027_MB1456"
+ CDS 1596695..1597600
+ /locus_tag="BQ2027_MB1456"
+ /note="Mb1456, -, len: 301 aa. Equivalent to Rv1421, len:
+ 301 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 301 aa overlap). Conserved hypothetical
+ protein, similar to many hypothetical proteins e.g.
+ YHBJ_ECOLI|P33995 hypothetical 32.5 kd protein from
+ Escherichia coli (284 aa), FASTA scores: opt: 648, E():
+ 6.3e-36, (38.7% identity in 282aa overlap). Protein
+ product from Mb1456 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1456 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="RNase adapter protein RapZ"
+ /protein_id="SIU00059.1"
+ /db_xref="GOA:P67107"
+ /db_xref="InterPro:IPR005337"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P67107"
+ /translation="MMNHARGVENRSEGGGIDVVLVTGLSGAGRGTAAKVLEDLGWYV
+ ADNLPPQLITRMVDFGLAAGSRITQLAVVMDVRSRGFTGDLDSVRNELATRAITPRVV
+ FMEASDDTLVRRYEQNRRSHPLQGEQTLAEGIAAERRMLAPVRATADLIIDTSTLSVG
+ GLRDSIERAFGGDGGATTSVTVESFGFKYGLPMDADMVMDVRFLPNPHWVDELRPLTG
+ QHPAVRDYVLHRPGAAEFLESYHRLLSLVVDGYRREGKRYMTIAIGCTGGKHRSVAIA
+ EALMGLLRSDQQLSVRALHRDLGRE"
+ gene 1597597..1598625
+ /locus_tag="BQ2027_MB1457"
+ CDS 1597597..1598625
+ /locus_tag="BQ2027_MB1457"
+ /note="Mb1457, -, len: 342 aa. Equivalent to Rv1422, len:
+ 342 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 342 aa overlap). Conserved hypothetical
+ protein, similar to many hypothetical proteins e.g.
+ YAMB_THETU|P38541 Thermoanaerobacterium thermosulfurigenes
+ (323 aa), FASTA scores: opt: 519, E(): 1.6e-25, (33.1%
+ identity in 320 aa overlap); and AF106003|AF106003_3
+ Streptomyces coelicolor (363 aa), FASTA scores: opt: 1047,
+ E(): 0, (54.5% identity in 308 aa overlap). Protein
+ product from Mb1457 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1457 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG002813: LPPG:FO 2-phospho-L-lactate
+ transferase like, CofD-like"
+ /protein_id="SIU00060.1"
+ /db_xref="GOA:A0A1R3XYB6"
+ /db_xref="InterPro:IPR002882"
+ /db_xref="InterPro:IPR010119"
+ /db_xref="InterPro:IPR038136"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYB6"
+ /translation="MTDGIVALGGGHGLYATLSAARRLTPYVTAVVTVADDGGSSGRL
+ RSELDVVPPGDLRMALAALASDSPHGRLWATILQHRFGGSGVLAGHPIGNLMLAGLSE
+ VLADPVAALDELGRILGVKGRVLPMCPVALQIEADVSGLEADPRMFRLIRGQVAIATT
+ PGKVRRVRLLPTDPPATRQAVDAIMAADLVVLGPGSWFTSVIPHVLVPGLAAALRATS
+ ARRALVLNLVAEPGETAGFSVERHLHVLAQHAPGFTVHDIIIDAERVPSEREREQLRR
+ TATMLQAEVHFADVARPGTPLHDPGKLAAVLDGVCARDVGASEPPVAATQEIPIDGGR
+ PRGDDAWR"
+ gene 1598622..1599599
+ /gene="whiA"
+ /locus_tag="BQ2027_MB1458"
+ CDS 1598622..1599599
+ /gene="whiA"
+ /locus_tag="BQ2027_MB1458"
+ /note="Mb1458, whiA, len: 325 aa. Equivalent to Rv1423,
+ len: 325 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 325 aa overlap). Putative whiA,
+ transcriptional regulator, probably equivalent to
+ AL035591|SCC54.10 whiA protein from Streptomyces
+ coelicolor (328 aa), FASTA scores: opt: 1505, E(): 0,
+ (70.4% identity in 324 aa overlap). Also some similarity
+ to O06975|YVCL hypothetical protein from Bacillus subtilis
+ (316 aa), FASTA scores: E(): 1.8e-0 8, (25.7% identity in
+ 304 aa overlap). Protein product from Mb1458 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1458 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ WHIA"
+ /protein_id="SIU00061.1"
+ /db_xref="GOA:Q7U040"
+ /db_xref="InterPro:IPR003802"
+ /db_xref="InterPro:IPR018478"
+ /db_xref="InterPro:IPR023054"
+ /db_xref="InterPro:IPR027434"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039518"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U040"
+ /translation="MTTDVKDELSRLVVKSVSARRAEVTSLLRFAGGLHIVGGRVVVE
+ AELDLGSIARRLRKEIFELYGYTAVVHVLSASGIRKSTRYVLRVANDGEALARQTGLL
+ DMRGRPVRGLPAQVVGGSIDDAEAAWRGAFLAHGSLTEPGRSSALEVSCPGPEAALAL
+ VGAARRLGVGAKAREVRGADRVVVRDGEAIGALLTRMGAQDTRLVWEERRLRREVRAT
+ ANRLANFDDANLRRSARAAVAAAARVERALEILGDTVPEHLASAGKLRVEHRQASLEE
+ LGRLADPPMTKDAVAGRIRRLLSMADRKAKVDGIPDTESVVTPDLLEDA"
+ gene complement(1599609..1600370)
+ /locus_tag="BQ2027_MB1459C"
+ CDS complement(1599609..1600370)
+ /locus_tag="BQ2027_MB1459C"
+ /note="Mb1459c, -, len: 253 aa. Equivalent to Rv1424c,
+ len: 253 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 253 aa overlap). Possible membrane
+ protein, contains PS00402 Binding-protein-dependent
+ transport systems inner membrane comp signature. Protein
+ product from Mb1459c detected using SWATH mass
+ spectrometry. Mb1459c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIU00062.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64852"
+ /translation="MTVVPGAPSRPASAVSRPSYRQCVQASAQTSARRYSFPSYRRPP
+ AEKLVFPVLLGILTLLLSACQTASASGYNEPRGYDRATLKLVFSMDLGMCLNRFTYDS
+ KLAPSRPQVVACDSREARIRNDGFHANAPSCMRIDYELITQNHRAYYCLKYLVRVGYC
+ YPAVTTPGKPPSVLLYAPSACDESLPSPRVATALVPGTRSANREFSRFVVTEIKSLGA
+ GGRCDSASVSLQPPEEIEGPAIPPASSQLVCVAPK"
+ gene 1600374..1601753
+ /locus_tag="BQ2027_MB1460"
+ CDS 1600374..1601753
+ /locus_tag="BQ2027_MB1460"
+ /note="Mb1460, -, len: 459 aa. Equivalent to Rv1425, len:
+ 459 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 459 aa overlap). Conserved hypothetical
+ protein, similar to many Mycobacterium tuberculosis
+ hypothetical proteins e.g. Rv3740c, Rv3734c, Rv1760, etc.
+ Protein product from Mb1460 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1460 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible triacylglycerol synthase
+ (diacylglycerol acyltransferase)"
+ /protein_id="SIU00063.1"
+ /db_xref="GOA:A0A1R3Y0E4"
+ /db_xref="InterPro:IPR004255"
+ /db_xref="InterPro:IPR009721"
+ /db_xref="InterPro:IPR014292"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0E4"
+ /translation="MKRLSSVDAAFWSAETAGWHMHVGALAICDPSDAPEYSFQRLRE
+ LIIERLPEIPQLRWRVTGAPLGLDRPWFVEDEELDIDFHIRRIGVPAPGGRRELEELV
+ GRLMSYKLDRSRPLWELWVIEGVEGGRIATLTKMHHAIVDGVSGAGLGEILLDITPEP
+ RPPQQETVGFVGFQIPGLERRAIGALINVGIMTPFRIVRLLEQTVRQQIAALGVAGKP
+ ARYFEAPKTRFNAPVSPHRRVTGTRVELARAKAVKDAFGVKLNDVVLALVAGAARQYL
+ QKRDELPAKPLIAQIPVSTRSEETKADVGNQVSSMTASLATHIEDPAKRLAAIHESTL
+ SAKEMAKALSAHQIMGLTETTPPGLLQLAARAYTASGLSHNLAPINLVVSNVPGPPFP
+ LYMAGARLDSLVPLGPPVMDVALNITCFSYQDYLDFGLVTTPEVANDIDEMADAIEPA
+ LAELERAAE"
+ gene complement(1601775..1603037)
+ /gene="lipO"
+ /locus_tag="BQ2027_MB1461C"
+ CDS complement(1601775..1603037)
+ /gene="lipO"
+ /locus_tag="BQ2027_MB1461C"
+ /note="Mb1461c, lipO, len: 420 aa. Equivalent to Rv1426c,
+ len: 420 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 420 aa overlap). Possible Lipo, esterase
+ (EC 3.1.-.-), similar to several Mycobacterium
+ tuberculosis hypothetical lipases and esterases e.g.
+ Rv1399c, Rv2284, etc. Also similar in central region to
+ AAAD_HUMAN|P22760 human arylacetamide deacetylase (398
+ aa), FASTA scores: opt:210, E(): 7.6e-07, (29.3% identity
+ in 191 aa overlap). Protein product from Mb1461c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1461c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ESTERASE LIPO"
+ /protein_id="SIU00064.1"
+ /db_xref="GOA:A0A1R3XZA8"
+ /db_xref="InterPro:IPR013094"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZA8"
+ /translation="MRFRRMARPRPLTRAAVELLNAANGLRPLSGSGYSTVLAFWLGW
+ PTSEVPGVYLGASVLDALRRGRRGDFGGLKGKAALALTAAAWVILAVIRYRGATTPGP
+ VLEAGLTEQLGPDYAKELATLPTEPMRSRGRNLPLRTAMARRRYVETTNVVCYGPYGR
+ ANLADIWRRRDLPRDAKAPVLVQVPGGAWVLGWRRPQAYPLMSHLAARGWVCVSLNYR
+ VSPRHTWPDHIVDVKRALAWVKENIAAYGGDPNFVAISGGSAGGHLCALAALTPNDPR
+ FQPGFEQVDTSVAAAVPVYGRYDWFTTDAPGRREFVGLLETFVVKRKFSTHRDIFVDA
+ SPIHHVRADAPPFFVLHGRHDSLIPVAEAHAFVEELRAVSKSPVAYADLPHAQHAFDV
+ FGSPRAHHTAEAVARFLSWVYATNPPAT"
+ gene complement(1603037..1604644)
+ /gene="fadD12"
+ /locus_tag="BQ2027_MB1462C"
+ CDS complement(1603037..1604644)
+ /gene="fadD12"
+ /locus_tag="BQ2027_MB1462C"
+ /note="Mb1462c, fadD12, len: 535 aa. Equivalent to
+ Rv1427c, len: 535 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 535 aa overlap). Possible
+ fadD12, long-chain-fatty-acid-CoA synthetase (EC 6.2.1.-),
+ similar to many e.g. NP_302632.1|NC_002677 acyl-CoA
+ synthase from Mycobacterium leprae (548 aa);
+ AAD01929.2|AF031419 putative long-chain-fatty-acid--CoA
+ ligase from Pseudomonas putida (565 aa);
+ NP_419782.1|NC_002696 putative long-chain-fatty-acid--CoA
+ ligase from Caulobacter crescentus (530 aa);
+ PC60_YEAST|P38137 yeast peroxisomal-coenzyme A synthetase
+ (543 aa), FASTA scores: opt: 507, E(): 2.9e-25, (30.4%
+ identity in 365 aa overlap). Also similar to many M.
+ tuberculosis proteins e.g. MTCY06A4.14 (44.8% identity in
+ 525 aa overlap). Contains PS00455 Putative AMP-binding
+ domain signature. BELONGS TO THE ATP-DEPENDENT AMP-BINDING
+ ENZYME FAMILY. Protein product from Mb1462c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1462c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE LONG-CHAIN-FATTY-ACID--COA LIGASE
+ FADD12 (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA
+ SYNTHASE)"
+ /protein_id="SIU00065.1"
+ /db_xref="GOA:A0A1R3XYB5"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR025110"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYB5"
+ /translation="MRIRQAFGLIATMRRAGLIAPLRPDRYLRIVAAMRREGMGFTAG
+ FAGAARRCPDRPGLIDELGTLTWRQLDERGNALAAALQALPAGPPRVVGIMCRNHRGF
+ VDALLAVNRIGAHILLLNTSFAGPALAEVVTREGVDTVVYDEEFSATVDRALAEKPQA
+ TRIVAWTDEDHDLTVEKLVAAHAGRRPEHTGSHGKVILLTSGTTGTPKGARHSGGGIG
+ TLKAILDRTPWRAEEVTVIVAPMFHAWGFSQLVLASSLACTIVTRRRFDPEATLDLID
+ RHHATGLVVVPVMFDRIMDLPAEIRNRYDGRSLRFAAASGSRMRPDVVIAFMDQFGDV
+ IYNNYNATEAGMIATATPADLRTAPDTAGRPAEGTEIRILDQQFTEVPTGEVGTIYVR
+ NDSQFDGYTSGAAKDFHAGFMSSGDVGYLDENGRLFVVGRDDEMIVSGGENIYPIEVE
+ KTLATHPDVAEAAVIGVDDQQYGQRLAAFVVLKPGVSATPETLKQHVRDNLANYKVPR
+ DIAVLDELPRGITGKILRTELQSRVGS"
+ gene complement(1604648..1605475)
+ /locus_tag="BQ2027_MB1463C"
+ CDS complement(1604648..1605475)
+ /locus_tag="BQ2027_MB1463C"
+ /note="Mb1463c, -, len: 275 aa. Equivalent to Rv1428c,
+ len: 275 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 275 aa overlap). Conserved hypothetical
+ protein, some similarity to hypothetical proteins from M.
+ tuberculosis e.g. Rv0502|YV29_MYCTU|Q11167 (358 aa), FASTA
+ scores: opt: 355, E(): 5e-16, (32.6% identity in 273 aa
+ overlap); and Rv1920. Protein product from Mb1463c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1463c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Lysophospholipid Acyltransferases (LPLATs) of
+ Glycerophospholipid Biosynthesis: MGAT-like"
+ /protein_id="SIU00066.1"
+ /db_xref="GOA:A0A1R3XYQ3"
+ /db_xref="InterPro:IPR002123"
+ /db_xref="InterPro:IPR016676"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYQ3"
+ /translation="MSETDSPGNGDDAGIGDIGKFDPGLTQRLISVLRPVLKTYHRSQ
+ VHGLDSFPPGGALVVANHSGGMFPMDVPVFSVDFYDKFGYDRPVYTLSHDILFMGLTG
+ DLFRRTGYIRATRENAAKALRSGGVVVVFPGGDYDAYRPTFAENVIDFNGRKGYVSTA
+ VEAGVPIVPAVSIGGQESQLYLSRGTWLARRLGLKRLLRSDILPISFGFPFGFSAAIP
+ PNLPLPAKIVMQVLDPINLTKQFGEDPDVDAVDEHVRSVMQQALNDLAAKRRFPILG"
+ gene 1605594..1606862
+ /locus_tag="BQ2027_MB1464"
+ CDS 1605594..1606862
+ /locus_tag="BQ2027_MB1464"
+ /note="Mb1464, -, len: 422 aa. Equivalent to Rv1429, len:
+ 422 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 422 aa overlap). Conserved hypothetical
+ protein, some similarity to transcriptional regulator
+ proteins e.g. CDAR_ECOLI|P37047 Carbohydrate diacid
+ regulator from Escherichia coli (391 aa), FASTA scores:
+ opt: 210, E(): 3e-06, (27.7% identity in 296 aa overlap).
+ Also similar to Mycobacterium tuberculosis hypothetical
+ proteins Rv2370c, Rv1194c, Rv1453, Rv2242, and Rv1186c.
+ Protein product from Mb1464 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1464 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible regulatory protein Trx"
+ /protein_id="SIU00067.1"
+ /db_xref="InterPro:IPR025736"
+ /db_xref="InterPro:IPR041522"
+ /db_xref="InterPro:IPR042070"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYC5"
+ /translation="MAEAGGGPISVIARHMQLIRDDFISELFDKMKAEIRGLDYDARM
+ ADLWRASITENFVTAVHYLDRDTPQSLVEAPAAALAYARAAAQRDIPLSGLVRAHRLG
+ HARFLEVAMQYVSLLEPADRVSTIIELVNRSARLVDLVADQLIVAYEHEHDRWLSRRS
+ GLQQQWVSELLADTPVDVPRAERALGYRLDGVHIAAVVWVDSAVPIGDVVAQFDQVRC
+ LLAGELGPELGPVANSLMVPTDEREARLWFSPAPTRAFAPSRIRAAFESAGIRARLAC
+ GRVGDGLRGFRASLKQAERVKALALAGGARPGGRVMFYDDVAPVALLADDLEELRRFV
+ TDVLGDLSVDDERNSWLRETLREFLLRNRSYVATADAMILHRNTIQYRVIQAMELCGQ
+ NLDDPDAAFRVQMALEVCRWMAPAVLRAKQ"
+ gene 1607102..1608688
+ /gene="PE16"
+ /locus_tag="BQ2027_MB1465"
+ CDS 1607102..1608688
+ /gene="PE16"
+ /locus_tag="BQ2027_MB1465"
+ /note="Mb1465, PE16, len: 528 aa. Equivalent to Rv1430,
+ len: 528 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 528 aa overlap). Member of the M.
+ tuberculosis PE family of proteins e.g. Y0D4_MYCTU|Q50594
+ (55.9% identity in 127 aa overlap). The C-terminus shows
+ similarity to Q49633|LEPB1170_F3_112 hypothetical
+ Mycobacterium leprae protein (391 aa), FASTA scores: opt:
+ 342, E(): 1.2e-13, (29.8% identity in 292 aa overlap).
+ Possible TMhelix aa 500-522. Mb1465 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe16"
+ /protein_id="SIU00068.1"
+ /db_xref="GOA:A0A1R3XYC9"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="InterPro:IPR013228"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYC9"
+ /translation="MSFVFAVPEMVAATASDLASLGAALSEATAAAAIPTTQVLAAAA
+ DEVSAAIAELFGAHGQEFQALSAQASAFHDRFVRALSAAAGWYVDAEAANAALVDTAA
+ TGASELGSGGRTALILGSTGTPRPPFDYMQQVYDRYIAPHYLGYAFSGLYTPAQFQPW
+ TGIPSLTYDQSVAEGAGYLHTAIMQQVAAGNDVVVLGFSQGASVATLEMRHLASLPAG
+ VAPSPDQLSFVLLGNPNNPNGGILARFPGLYLQSLGLTFNGATPDTDYATTIYTTQYD
+ GFADFPKYPLNILADVNALLGIYYSHSLYYGLTPEQVASGIVLPVSSPDTNTTYILLP
+ NEDLPLLQPLRGIVPEPLLDLIEPDLRAIIELGYDRTGYADVPTPAALFPVHIDPIAV
+ PPQIGAAIGGPLTALDGLLDTVINDQLNPVVTSGIYQAGAELSVAAAGYGAPAGVTNA
+ IFIGQQVLPILVEGPGALVTADTHYLVDAIQDLAAGDLSGFNQNLQLIPATNIALLVF
+ AAGIPAVAAVAILTGQDFPV"
+ gene 1608799..1610568
+ /locus_tag="BQ2027_MB1466"
+ CDS 1608799..1610568
+ /locus_tag="BQ2027_MB1466"
+ /note="Mb1466, -, len: 589 aa. Equivalent to Rv1431, len:
+ 589 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 589 aa overlap). Conserved membrane
+ protein, shows strong similarity to another M.
+ tuberculosis hypothetical protein Rv1132|MTCY22G8.21
+ (48.2% identity in 585 aa overlap). Protein product from
+ Mb1466 detected using SWATH mass spectrometry. Mb1466
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00069.1"
+ /db_xref="GOA:A0A1R3XYB1"
+ /db_xref="InterPro:IPR021941"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYB1"
+ /translation="MGFLKPDLPDVDHDTWLTQPRRTRLQVVTRDWVEHGFGTPYAVY
+ LLYLTKIAVYVAAGAAIISLTPGLGGLSRIGDWWTQPIVYQKVIVFTLLFEVLGFGCG
+ SGPLTGRFWPPIGGFLYWLRPNTIRLPAWPDKVPFTQGDTRTVVDVALYAIVLIGGVW
+ ALLSPGSPGPGGTPVTAAGDVGLINPVLVVPTIVALGVLGLRDKTIFLAARGEHYWLK
+ LFVFFFPFTDQIAAFKIIMLCLWWGAATSKLNHHFPYVVAVMTSNNALLRSRVFNPIK
+ HLLYRDHANDLRPSWLPKLMAHGGGTTAEFLVPGILVLVADGHPWRWFLIGFMVLFHL
+ NILSNLPMGVPLEWNVFFIFSLCYLFGHYGAITATDLRSPLLLAIVIAVVAVVIMGNL
+ LPEKISFLPAMRYYAGNWATSIWCFRGDAEATMETSVVKSSALVVNQLAKLYDGATAE
+ IMTDQVAAFRAMHTHGRALNGLLPRALDDEAHYRIREGEIVAGPLVGWNFGEGHLHNE
+ QLVAAVQRRCNFADGDLRVIILEGQPIHVQKQWYRIVDAKTGLFEAGYVTVEDMLSRQ
+ PWPEPGDEFPVHVTTQRGTPSKP"
+ gene 1610565..1611986
+ /locus_tag="BQ2027_MB1467"
+ CDS 1610565..1611986
+ /locus_tag="BQ2027_MB1467"
+ /note="Mb1467, -, len: 473 aa. Equivalent to Rv1432, len:
+ 473 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 473 aa overlap). Probable dehydrogenase
+ (EC 1.-.-.-), shows strong simlarity to P49_STRLI|P06108
+ p49 protein from Streptomyces lividans (469 aa), FASTA
+ scores: opt: 1362, E(): 0, (44.9% identity in 474 aa
+ overlap); and weak simlarity to other dehydrogenases.
+ Protein product from Mb1467 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1467 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEHYDROGENASE"
+ /protein_id="SIU00070.1"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYC4"
+ /translation="MTTAVVVGAGPNGLAAAIHLARHGVDVQVLEARDTIGGGARSGE
+ LTVPGVIHDHCSAFHPLGVGSPFWAAIDLQRYGLTWKWPDVDCAHPLDDGTAGVLYRS
+ IEATAAGLGPDGKRWQRAVGDLAAGFDELAEDLLRPVLNMPRHPIRLARFGPRAALPA
+ TAMARRFHTERARALFGGAAAHVYTRLDRPLTASLGLMILASGHRHGWPVARGGSGSI
+ TKALAAALDAYGGTVATGVTVTSRRDIPDADIVMLDLSPAAVLGIYGDVMPTRINRSY
+ RRYRAGSSAFKVDFAIEGDVGWTNPDCRRAGTVHLGGTFAEIADTERQRAQGTMVQRP
+ FVLVGQQYLADPSRSVGNINPIWAYAHVPFGYTGDATAAVIDQIERFAPGFRDRIVAT
+ VSTSTTELQTYNRNFIGGDIIGGANDRLQVIFRPRVAVDPYAIGVPGVYLCSQSAPPG
+ AGIHGLCGYHAAESALRWLRKRR"
+ gene 1612150..1612965
+ /locus_tag="BQ2027_MB1468"
+ CDS 1612150..1612965
+ /locus_tag="BQ2027_MB1468"
+ /note="Mb1468, -, len: 271 aa. Equivalent to Rv1433, len:
+ 271 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 271 aa overlap). Possible exported
+ protein with N-terminal signal sequence, highly similar to
+ Q49706 hypothetical protein from Mycobacterium leprae (271
+ aa), FASTA scores: opt: 1341, E(): 0, (68.3% identity in
+ 271 aa overlap). Also shows similarity to Mycobacterium
+ tuberculosis lipoprotein Rv2518c|MTV009.03c lppS (408 aa)
+ (40.0% identity in 230 aa overlap); and others e.g.
+ Rv0116c, Rv0192, Rv2518c, Rv0483. Mb1468 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED EXPORTED PROTEIN"
+ /protein_id="SIU00071.1"
+ /db_xref="GOA:A0A1R3XYB7"
+ /db_xref="InterPro:IPR005490"
+ /db_xref="InterPro:IPR038063"
+ /db_xref="InterPro:IPR041280"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYB7"
+ /translation="MRAVFGCAIAVVGIAGSVVAGPADIHLVAAKQSYGFAVASVLPT
+ RGQVVGVAHPVVVTFSAPITNPANRHAAERAVEVKSTPAMTGKFEWLDNDVVQWVPDR
+ FWPAHSTVELSVGSLSSDFKTGPAVVGVASISQHTFTVSIDGVEEGPPPPLPAPHHRV
+ HFGEDGVMPASMGRPEYPTPVGSYTVLSKERSVIMDSSSVGIPVDDPDGYRLSVDYAV
+ RITSRGLYVHSAPWALPALGLENVSHGCISLSREDAEWYYNAVDIGDPVIVQE"
+ gene 1612972..1613109
+ /locus_tag="BQ2027_MB1469"
+ CDS 1612972..1613109
+ /locus_tag="BQ2027_MB1469"
+ /note="Mb1469, -, len: 45 aa. Equivalent to Rv1434, len:
+ 45 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 45 aa overlap). Hypothetical unknown protein.
+ Mb1469 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00072.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYB2"
+ /translation="MRASPAERVDGAYAGAGPHTQSVLEEDQRQRAPAGAEAEGPGRT
+ G"
+ gene complement(1613058..1613687)
+ /locus_tag="BQ2027_MB1470C"
+ CDS complement(1613058..1613687)
+ /locus_tag="BQ2027_MB1470C"
+ /note="Mb1470c, -, len: 209 aa. Highly similar to Rv1435c,
+ len: 202 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (96.2% identity in 209 aa overlap). Probable conserved
+ Pro-, Gly-, Val-rich secreted protein (see citation below)
+ with a N-terminal signal sequence. Similar at C-terminus
+ to AF017099|AF017099_1 Mycobacterium tuberculosis pGB1 (87
+ aa), FASTA scores: opt: 550, E(): 2.3e-17, (97.7% identity
+ in 86 aa overlap). Shows some similarity to N-terminus of
+ CPN_DROME|Q02910 calphotin. drosophila melanogaster (865
+ aa), FASTA scores: opt: 266, E(): 2.5e-05, (37.2% identity
+ in 191 aa overlap). Contains at least five 7 aa imperfect
+ repeats. Also shows similarity to other Mycobacterium
+ tuberculosis proteins e.g. MTCI237.20c (34.7% identity in
+ 193 aa overlap), MTCI65.25c (36.9% identity in 160 aa
+ overlap) and MTCI65.24c (34.2% identity in 196 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, an in-frame insertion of 21 bp leads to a longer
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (209 aa versus 202 aa). Mb1470c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved Proline, Glycine, Valine-rich
+ secreted protein"
+ /protein_id="SIU00073.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0G3"
+ /translation="MTLMAIVNRFNIKVIAGAGLFAAAIALSPDAAADPLMTGGYACI
+ QGMAGDAPVAAGDPVAAGGPAATGACSAALTDMAGVPFVAPGPVPAAAPVPIGAPVPI
+ PGAPVPIPGAPVPIPGAPVPIPGGPVPIPGAPVPVPAVPAPVIPVGTPLIALGPVLAG
+ APGDGVVSAPIIGMSGVKDALTDPAPAGGPVPGQPVLPGPSASAPAGAR"
+ gene 1614044..1615063
+ /gene="gap"
+ /locus_tag="BQ2027_MB1471"
+ CDS 1614044..1615063
+ /gene="gap"
+ /locus_tag="BQ2027_MB1471"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1471, gap, len: 339 aa. Equivalent to Rv1436,
+ len: 339 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 339 aa overlap). Probable gap,
+ Glyceraldehyde 3-phosphate dehydrogenase (EC 1.2.1.12),
+ highly similar to many e.g. G3P_MYCLE|P46713 Mycobacterium
+ leprae (339 aa), FASTA scores: opt: 1933, E():0, (89.1%
+ identity in 339 aa overlap). Contains PS00071
+ Glyceraldehyde 3-phosphate dehydrogenase active site.
+ BELONGS TO THE GLYCERALDEHYDE 3-PHOSPHATE DEHYDROGENASE
+ FAMILY. Protein product from Mb1471 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1471
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLYCERALDEHYDE 3-PHOSPHATE
+ DEHYDROGENASE GAP (GAPDH)"
+ /protein_id="SIU00074.1"
+ /db_xref="GOA:P64179"
+ /db_xref="InterPro:IPR006424"
+ /db_xref="InterPro:IPR020828"
+ /db_xref="InterPro:IPR020829"
+ /db_xref="InterPro:IPR020830"
+ /db_xref="InterPro:IPR020831"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P64179"
+ /translation="MTVRVGINGFGRIGRNFYRALLAQQEQGTADVEVVAANDITDNS
+ TLAHLLKFDSILGRLPCDVGLEGDDTIVVGRAKIKALAVREGPAALPWGDLGVDVVVE
+ STGLFTNAAKAKGHLDAGAKKVIISAPATDEDITIVLGVNDDKYDGSQNIISNASCTT
+ NCLAPLAKVLDDEFGIVKGLMTTIHAYTQDQNLQDGPHKDLRRARAAALNIVPTSTGA
+ AKAIGLVMPQLKGKLDGYALRVPIPTGSVTDLTVDLSTRASVDEINAAFKAAAEGRLK
+ GILKYYDAPIVSSDIVTDPHSSIFDSGLTKVIDDQAKVVSWYDNEWGYSNRLVDLVTL
+ VGKSL"
+ gene 1615066..1616304
+ /gene="pgk"
+ /locus_tag="BQ2027_MB1472"
+ CDS 1615066..1616304
+ /gene="pgk"
+ /locus_tag="BQ2027_MB1472"
+ /note="Mb1472, pgk, len: 412 aa. Equivalent to Rv1437,
+ len: 412 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 412 aa overlap). Probable pgk,
+ Phosphoglycerate kinase (EC 2.7.2.3), highly similar to
+ many e.g. PGK_MYCLE|P46712 Mycobacterium leprae (416 aa),
+ FASTA scores: opt: 2153, E(): 0, (80.4% identity in 414 aa
+ overlap). Contains PS00111 Phosphoglycerate kinase
+ signature. BELONGS TO THE PHOSPHOGLYCERATE KINASE FAMILY.
+ Protein product from Mb1472 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1472 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHOGLYCERATE KINASE PGK"
+ /protein_id="SIU00075.1"
+ /db_xref="GOA:P65701"
+ /db_xref="InterPro:IPR001576"
+ /db_xref="InterPro:IPR015824"
+ /db_xref="InterPro:IPR015911"
+ /db_xref="InterPro:IPR036043"
+ /db_xref="UniProtKB/Swiss-Prot:P65701"
+ /translation="MSVANLKDLLAEGVSGRGVLVRSDLNVPLDEDGTITDAGRIIAS
+ APTLKALLDADAKVVVAAHLGRPKDGPDPTLSLAPVAVALGEQLGRHVQLAGDVVGAD
+ ALARAEGLTGGDILLLENIRFDKRETSKNDDDRRALAKQLVELVGTGGVFVSDGFGVV
+ HRKQASVYDIATLLPHYAGTLVADEMRVLEQLTSSTQRPYAVVLGGSKVSDKLGVIES
+ LATKADSIVIGGGMCFTFLAAQGFSVGTSLLEDDMIEVCRGLLETYHDVLRLPVDLVV
+ TEKFAADSPPQTVDVGAVPNGLMGLDIGPGSIKRFSTLLSNAGTIFWNGPMGVFEFPA
+ YAAGTRGVAEAIVAATGKGAFSVVGGGDSAAAVRAMNIPEGAFSHISTGGGASLEYLE
+ GKTLPGIEVLSREQPTGGVL"
+ gene 1616301..1617086
+ /gene="tpi"
+ /locus_tag="BQ2027_MB1473"
+ CDS 1616301..1617086
+ /gene="tpi"
+ /locus_tag="BQ2027_MB1473"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1473, tpi, len: 261 aa. Equivalent to Rv1438,
+ len: 261 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 261 aa overlap). Probable tpi (tpiA),
+ Triosephosphate isomerase (EC 5.3.1.1), highly similar to
+ many e.g. TPIS_MYCLE|P46711 Mycobacterium leprae (261 aa),
+ FASTA scores: opt: 1456, E(): 0, (83.9% identity in 261 aa
+ overlap). Contains PS00171 Triosephosphate isomerase
+ active site. BELONGS TO THE TRIOSEPHOSPHATE ISOMERASE
+ FAMILY. Protein product from Mb1473 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1473
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRIOSEPHOSPHATE ISOMERASE TPI (TIM)"
+ /protein_id="SIU00076.1"
+ /db_xref="GOA:P66941"
+ /db_xref="InterPro:IPR000652"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR020861"
+ /db_xref="InterPro:IPR022896"
+ /db_xref="InterPro:IPR035990"
+ /db_xref="UniProtKB/Swiss-Prot:P66941"
+ /translation="MSRKPLIAGNWKMNLNHYEAIALVQKIAFSLPDKYYDRVDVAVI
+ PPFTDLRSVQTLVDGDKLRLTYGAQDLSPHDSGAYTGDVSGAFLAKLGCSYVVVGHSE
+ RRTYHNEDDALVAAKAATALKHGLTPIVCIGEHLDVREAGNHVAHNIEQLRGSLAGLL
+ AEQIGSVVIAYEPVWAIGTGRVASAADAQEVCAAIRKELASLASPRIADTVRVLYGGS
+ VNAKNVGDIVAQDDVDGGLVGGASLDGEHFATLAAIAAGGPLP"
+ gene complement(1617698..1618123)
+ /locus_tag="BQ2027_MB1474C"
+ CDS complement(1617698..1618123)
+ /locus_tag="BQ2027_MB1474C"
+ /note="Mb1474c, -, len: 141 aa. Equivalent to Rv1439c,
+ len: 141 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 141 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1474c detected using SWATH
+ mass spectrometry. Mb1474c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00077.1"
+ /db_xref="InterPro:IPR032710"
+ /db_xref="InterPro:IPR037401"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYD4"
+ /translation="MQMSASNAFVEGFADFWKAPSPDRLTDHLHPDVVLVRPLSPPRH
+ GLGAAQREFTRILGLLPDLHGEVDRWSQAGDVVFIEFRLIARLGSEVVEWPVVDRFLL
+ RGDKAVERVSYFDSLPLLIKVVKHPSAWRGWLTTMRSRA"
+ gene 1618574..1618807
+ /gene="secG"
+ /locus_tag="BQ2027_MB1475"
+ CDS 1618574..1618807
+ /gene="secG"
+ /locus_tag="BQ2027_MB1475"
+ /note="Mb1475, secG, len: 77 aa. Equivalent to Rv1440,
+ len: 77 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 77 aa overlap). Probable protein-export
+ membrane protein secG, similar to many e.g.
+ P38388|SECG_MYCLE PROBABLE PROTEIN-EXPORT MEMBRANE (77
+ aa), FASTA scores: opt: 450, E(): 6.7e-24, (96.1% identity
+ in 77 aa overlap). Start changed since original submission
+ (-40 aa). PART OF THE PROKARYOTIC PROTEIN TRANSLOCATION
+ APPARATUS WHICH COMPRISE SECA|Rv3240c, SECD|Rv2587c,
+ SECE|Rv0638, SECF|Rv2586c, SECG AND SECY|Rv0732. Mb1475
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable protein-export membrane protein
+ (translocase subunit) secg"
+ /protein_id="SIU00078.1"
+ /db_xref="GOA:P66792"
+ /db_xref="InterPro:IPR004692"
+ /db_xref="UniProtKB/Swiss-Prot:P66792"
+ /translation="MELALQITLIVTSVLVVLLVLLHRAKGGGLSTLFGGGVQSSLSG
+ STVVEKNLDRLTLFVTGIWLVSIIGVALLIKYR"
+ gene complement(1618946..1620421)
+ /gene="PE_PGRS26"
+ /locus_tag="BQ2027_MB1476C"
+ CDS complement(1618946..1620421)
+ /gene="PE_PGRS26"
+ /locus_tag="BQ2027_MB1476C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1476c, PE_PGRS26, len: 491 aa. Equivalent to
+ Rv1441c, len: 491 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.6% identity in 491 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, similar to
+ Y0DP_MYCTU|Q50615 hypothetical glycine-rich 40.8 kd
+ protein (498 aa), fasta scores: opt: 1625, E(): 0, (55.2%
+ identity in 518 aa overlap). Mb1476c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs26"
+ /protein_id="SIU00079.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYC1"
+ /translation="MSNVMVVPGMLSAAAADVASIGAALSAANGAAAPTTAGVLAAGA
+ DEVSAAIASLFSGYARDYQALSAQMARFHQQFVQALTASVGSYAAAEAANASPLQALE
+ QQVLAAINAPTQTLLGRPLIGNGADGLPGQNGGAGGLLWGNGGNGGAGDAAHPNGGNG
+ GDAGMFGNGGAGGAGYSPAAGTGAAGGAGGAGGAGGWLSGNGGAGGNGGTGASGADGG
+ GGLPPVPASPGGNGGGGGAGGAAGMFGTGGAGGTGGDGGAGGAGDSPNSGANGARGGD
+ GGNGAAGGAGGRLFGNGGAGGNGGTAGQGGDGGTALGAGGIGGDGGTGGAGGTGGTAG
+ IGGSSAGAGGAGGDGGAGGNGGGSSMIGGKGGTGGNGGVGGTGGASALTIGNGSSAGA
+ GGAGGAGGTGGTGGYIESLDGKGQAGNGGNGGNGAAGGAGGGGTGAGGNGGAGGNGGD
+ GGPSQGGGNPGFGGDGGTGGPGGVGVPDGIGGANGAQGKHG"
+ gene 1620528..1622828
+ /gene="bisC"
+ /locus_tag="BQ2027_MB1477"
+ CDS 1620528..1622828
+ /gene="bisC"
+ /locus_tag="BQ2027_MB1477"
+ /note="Mb1477, bisC, len: 766 aa. Equivalent to Rv1442,
+ len: 766 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 766 aa overlap). Probable bisC, Biotin
+ sulfoxide reductase (EC 1.-.-.-), similar to
+ BISC_ECOLI|P20099 biotin sulfoxide reductase from
+ Escherichia coli (739 aa), FASTA scores: opt: 1271, E():0,
+ (40.2% identity in 744 aa overlap). Protein product from
+ Mb1477 detected using SWATH mass spectrometry. Mb1477
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BIOTIN SULFOXIDE REDUCTASE BISC (BDS
+ reductase) (BSO reductase)"
+ /protein_id="SIU00080.1"
+ /db_xref="GOA:A0A1R3XYD3"
+ /db_xref="InterPro:IPR006656"
+ /db_xref="InterPro:IPR006657"
+ /db_xref="InterPro:IPR006658"
+ /db_xref="InterPro:IPR009010"
+ /db_xref="InterPro:IPR041460"
+ /db_xref="InterPro:IPR041954"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYD3"
+ /translation="MQVYTSATHWGVFTARVHGGDIAAVAALASDTNPAPQLQNLPGA
+ VRHRSRIANPAVRRGWLQHGPGPSSARGAEEFVEVSWDELIELLASELRRTVDRYGNE
+ AIYGSSYGWASAGRFHHAQSQVHRFLNMLGGYTASRHSYSAGASEVIFPHIVGAALFE
+ ALAETTTWDVIVDHTALLVAFGGLPVKNTAVMPGGTTAHPDRDYVGRYRARGGRLVSV
+ SPLRDDIAAIAGPLDDRCRWLAPVPGTDVAIMLGLAYVLATESLADRAFLGRYCTGYE
+ RFERYLLGLDDGIPKTPEWAAALSGLAAGDLRDLARRMAEHRTLITTSLSLQRIEHGE
+ QTVWMAATLAAMLGQIGLPGGGFGHGYSSNGVGNPPLACGLPALPQGNNPVSTFIPVA
+ AISELLQRPGQRLAYNGRLLELPDIKCVYWAGGNPFHHHQNLPRLRRALSRVDTIVVH
+ EQYWTAMAKHADIVVPTTTSFERDDFAASKTNPTLIAMPAMVPPYANARDDYHTFSAL
+ AHRLGFGKQFTEGRSAREWLEHMYDKWSAELDFPVPSFAEFWRTGRLELPTRTGLTWL
+ ADFRADPAAHPLGTPSGRIEIFSDTVDAFALPDCAGHPTWYEPSEWLGGPRAARYPLH
+ LIANQPRTRLHSQLDHGGASMASKIRGREPIRIHPDDAAARELTDGDIVRVFNDRGAC
+ LAGVVIDDGLRPKVVQLSTGAWFDPADPRDPDSMCVHGNPNALSNDSGTSSLAHGSTG
+ QHVLVQIERFTGELPPVRAHEPPRLA"
+ gene complement(1622944..1623429)
+ /locus_tag="BQ2027_MB1478C"
+ CDS complement(1622944..1623429)
+ /locus_tag="BQ2027_MB1478C"
+ /note="Mb1478c, -, len: 161 aa. Equivalent to Rv1443c,
+ len: 161 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 161 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1478c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1478c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00081.1"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYC2"
+ /translation="MVGYAEPVLIERQSVVAAPAEQVWQRVVTPEGINDELRPWMTMS
+ VPRGAKGMTVDTVPIGAPIGRAWLRLFGVLPFDYDRLSIAELEPGRRFREDSTMLSMR
+ QWQHERTVTPEGDTKTIVRDRITFQTRAGLRFAAPLIAAGLRALFGHRHRRLQRHFAQ
+ G"
+ gene complement(1624043..1624453)
+ /locus_tag="BQ2027_MB1479C"
+ CDS complement(1624043..1624453)
+ /locus_tag="BQ2027_MB1479C"
+ /note="Mb1479c, -, len: 136 aa. Equivalent to Rv1444c,
+ len: 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 136 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1479c detected using
+ shotgun mass spectrometry. Mb1479c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00082.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYC3"
+ /translation="MTVMADRSGRPAPVRRRMKTLTQAALNADKTVEQVEDVLDGLGK
+ TMAELNSSLSQLNSTVERLEDGLDHLEGTLHSLDDLAKRLIVLVEPVEAIVDRIDYIV
+ SLGETVMSPLSVTEHAVRGVLDRLRNRTVHEPTN"
+ gene complement(1624470..1625213)
+ /gene="devB"
+ /locus_tag="BQ2027_MB1480C"
+ CDS complement(1624470..1625213)
+ /gene="devB"
+ /locus_tag="BQ2027_MB1480C"
+ /note="Mb1480c, devB, len: 247 aa. Equivalent to Rv1445c,
+ len: 247 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 247 aa overlap). Possible devB (PGL),
+ 6-phosphogluconolactonase (EC 3.1.1.31), belongs to a
+ different family to the upstream gene zwf2. Similar to
+ e.g. DEVB_ANASP|P46016 putative glucose-6-phosphate
+ 1-dehydrogenase (239 aa), FASTA scores: opt: 439, E():
+ 2.6e-20, (34.0% identity in 247 aa overlap). BELONGS TO
+ THE GLUCOSAMINE/GALACTOSAMINE-6-PHOSPHATE ISOMERASE
+ FAMILY. 6-PHOSPHOGLUCONOLACTONASE SUBFAMILY. Protein
+ product from Mb1480c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1480c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 6-PHOSPHOGLUCONOLACTONASE DEVB (6PGL)"
+ /protein_id="SIU00083.1"
+ /db_xref="GOA:P63339"
+ /db_xref="InterPro:IPR005900"
+ /db_xref="InterPro:IPR006148"
+ /db_xref="InterPro:IPR037171"
+ /db_xref="InterPro:IPR039104"
+ /db_xref="UniProtKB/Swiss-Prot:P63339"
+ /translation="MSSSIEIFPDSDILVAAAGKRLVGAIGAAVAARGQALIVLTGGG
+ NGIALLRYLSAQAQQIEWSKVHLFWGDERYVPEDDDERNLKQARRALLNHVDIPSNQV
+ HPMAASDGDFGGDLDAAALAYEQVLAASAAPGDPAPNFDVHLLGMGPEGHINSLFPHS
+ PAVLESTRMVVAVDDSPKPPPRRITLTLPAIQRSREVWLLVSGPGKADAVAAAIGGAD
+ PVSVPAAGAVGRQNTLWLLDRDAAAKLPS"
+ gene complement(1625210..1626121)
+ /gene="opcA"
+ /locus_tag="BQ2027_MB1481C"
+ CDS complement(1625210..1626121)
+ /gene="opcA"
+ /locus_tag="BQ2027_MB1481C"
+ /note="Mb1481c, opcA, len: 303 aa. Equivalent to Rv1446c,
+ len: 303 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 303 aa overlap). Putative opcA, OxPP
+ cycle protein. Highly similar to S72774 B1496_F1_30
+ protein from Mycobacterium leprae (265 aa), FASTA scores:
+ opt: 1056, E(): 0, (70.3% identity in 239 aa overlap).
+ Also similar to OPCA_NOSS2|P48971 putative oxppcycle
+ protein opca from Nostoc punctiforme (465 aa), fasta
+ scores: opt: 177, E(): 7.3e-05, (23.4% identity in 321 aa
+ overlap). AIDS IN G6PD ACTIVITY. Protein product from
+ Mb1481c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1481c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE OXPP CYCLE PROTEIN OPCA"
+ /protein_id="SIU00084.1"
+ /db_xref="InterPro:IPR004555"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZC7"
+ /translation="MIVDLPDTTTTAVNKKLDELREKIGAVAMGRVLTLIIAPDSEAM
+ LEESIEAANDASHEHPSRIIVTMRGDPYADRPRLDAQLRVGADAGAGEFVVLRLSGPL
+ AGHADSVVIPFLLPDIPVVAWWPDIAPAVPAQDALGKLAIRRITDATNAIDPLSAIKS
+ RLAGYGAGDTDLAWSRITYWRALLTSAVDQPPHEPIESALVSGLKTEPALDVLAGWLA
+ SRIEGPVRRAVGELKVELVRNSETIVLSRPQEGITATLTRTGKPDALVPLARRVTGEC
+ LAEDLRRLDPDEIYCAALEGIKKVQYR"
+ gene complement(1626174..1627718)
+ /gene="zwf2"
+ /locus_tag="BQ2027_MB1482C"
+ CDS complement(1626174..1627718)
+ /gene="zwf2"
+ /locus_tag="BQ2027_MB1482C"
+ /note="Mb1482c, zwf2, len: 514 aa. Equivalent to Rv1447c,
+ len: 514 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 514 aa overlap). Probable zwf2 (ZWF),
+ Glucose-6-phosphate 1-dehydrogenase (EC 1.1.1.49), highly
+ similar to many e.g. G6PD_SYNY3|P73411 Synechocystis sp.
+ (509 aa), FASTA scores: opt: 1578, E(): 0, (46.8% identity
+ in 509 aa overlap). Also similar to Mycobacterium
+ tuberculosis Rv1121, zwf glucose-6-phosphate
+ 1-dehydrogenase. Contains PS00069 Glucose-6-phosphate
+ dehydrogenase active site. M. tuberculosis has two genes
+ for ZWF. This one looks like a classical ZWF. BELONGS TO
+ THE GLUCOSE-6-PHOSPHATE DEHYDROGENASE FAMILY. Protein
+ product from Mb1482c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1482c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUCOSE-6-PHOSPHATE 1-DEHYDROGENASE
+ ZWF2 (G6PD)"
+ /protein_id="SIU00085.1"
+ /db_xref="GOA:P0A585"
+ /db_xref="InterPro:IPR001282"
+ /db_xref="InterPro:IPR019796"
+ /db_xref="InterPro:IPR022674"
+ /db_xref="InterPro:IPR022675"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P0A585"
+ /translation="MKPAHAAASWRNPLRDKRDKRLPRIAGPCGMVIFGVTGDLARKK
+ VMPAVYDLANRGLLPPTFSLVGFARRDWSTQDFGQVVYNAVQEHCRTPFRQQNWDRLA
+ EGFRFVPGTFDDDDAFAQLAETLEKLDAERGTGGNHAFYLAIPPKSFPVVCEQLHKSG
+ LARPQGDRWSRVVIEKPFGHDLASARELNKAVNAVFPEEAVFRIDHYLGKETVQNILA
+ LRFANQLFDPIWNAHYVDHVQITMAEDIGLGGRAGYYDGIGAARDVIQNHLMQLLALT
+ AMEEPVSFHPAALQAEKIKVLSATRLAEPLDQTTSRGQYAAGWQGGEKVVGLLDEEGF
+ AEDSTTETFAAITLEVDTRRWAGVPFYLRTGKRLGRRVTEIALVFRRAPHLPFDATMT
+ DELGTNAMVIRVQPDEGVTLRFGSKVPGTAMEVRDVNMDFSYGSAFAEDSPEAYERLI
+ LDVLLGEPSLFPVNAEVELAWEILDPALEHWAAHGTPDAYEAGTWGPESSLEMLRRTG
+ REWRRP"
+ gene complement(1627715..1628836)
+ /gene="tal"
+ /locus_tag="BQ2027_MB1483C"
+ CDS complement(1627715..1628836)
+ /gene="tal"
+ /locus_tag="BQ2027_MB1483C"
+ /note="Mb1483c, tal, len: 373 aa. Equivalent to Rv1448c,
+ len: 373 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 373 aa overlap). Probable tal,
+ Transaldolase (EC 2.2.1.2), highly similar to many e.g.
+ TAL_MYCLE|P55193 transaldolase from Mycobacterium leprae
+ (375 aa), FASTA scores: opt: 1891, E(): 0, (78.6% identity
+ in 370 aa overlap). BELONGS TO THE TRANSALDOLASE FAMILY.
+ Protein product from Mb1483c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1483c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSALDOLASE TAL"
+ /protein_id="SIU00086.1"
+ /db_xref="GOA:P59955"
+ /db_xref="InterPro:IPR001585"
+ /db_xref="InterPro:IPR004732"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR018225"
+ /db_xref="UniProtKB/Swiss-Prot:P59955"
+ /translation="MTAQNPNLAALSAAGVSVWLDDLSRDRLRSGNLQELIDTKSVVG
+ VTTNPSIFQKALSEGHTYDAQIAELAARGADVDATIRTVTTDDVRSACDVLVPQWEDS
+ DGVDGRVSIEVDPRLAHETEKTIQQAIELWKIVDRPNLFIKIPATKAGLPAISAVLAE
+ GISVNVTLIFSVQRYREVMDAYLTGMEKARQAGHSLSKIHSVASFFVSRVDTEIDKRL
+ DRIGSRQALELRGQAGVANARLAYAAYREVFEDSDRYRSLKVDGARVQRPLWASTGVK
+ NPDYSDTLYVTELVAPHTVNTMPEKTIDAVADHGVIQGDTVTGTASDAQAVFDQLGAI
+ GIDLTDVFAVLEEEGVRKFEASWNELLQETRAHLDTAAQ"
+ gene complement(1628853..1630955)
+ /gene="tkt"
+ /locus_tag="BQ2027_MB1484C"
+ CDS complement(1628853..1630955)
+ /gene="tkt"
+ /locus_tag="BQ2027_MB1484C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1484c, tkt, len: 700 aa. Equivalent to Rv1449c,
+ len: 700 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 700 aa overlap). Probable tkt,
+ Transketolase (EC 2.2.1.1). Highly similar to several e.g.
+ TKT_MYCLE|P46708 transketolase (tk) from Mycobacterium
+ leprae (699 aa), FASTA scores: opt: 4216, E(): 0, (89.1%
+ identity in 700 aa overlap). Start site chosen by
+ homology. Contains PS00801 Transketolase signature 1.
+ BELONGS TO THE TRANSKETOLASE FAMILY. Protein product from
+ Mb1484c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1484c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="transketolase tkt (tk)"
+ /protein_id="SIU00087.1"
+ /db_xref="GOA:P59956"
+ /db_xref="InterPro:IPR005474"
+ /db_xref="InterPro:IPR005475"
+ /db_xref="InterPro:IPR005478"
+ /db_xref="InterPro:IPR009014"
+ /db_xref="InterPro:IPR020826"
+ /db_xref="InterPro:IPR029061"
+ /db_xref="InterPro:IPR033247"
+ /db_xref="InterPro:IPR033248"
+ /db_xref="UniProtKB/Swiss-Prot:P59956"
+ /translation="MTTLEEISALTRPRHPDDWTEIDSAAVDTIRVLAADAVQKVGNG
+ HPGTAMSLAPLAYTLFQRTMRHDPSDTHWLGRDRFVLSAGHSSLTLYIQLYLGGFGLE
+ LSDIESLRTWGSKTPGHPEFRHTPGVEITTGPLGQGLASAVGMAMASRYERGLFDPDA
+ EPGASPFDHYIYVIASDGDIEEGVTSEASSLAAVQQLGNLIVFYDRNQISIEDDTNIA
+ LCEDTAARYRAYGWHVQEVEGGENVVGIEEAIANAQAVTDRPSFIALRTVIGYPAPNL
+ MDTGKAHGAALGDDEVAAVKKIVGFDPDKTFQVREDVLTHTRGLVARGKQAHERWQLE
+ FDAWARREPERKALLDRLLAQKLPDGWDADLPHWEPGSKALATRAASGAVLSALGPKL
+ PELWGGSADLAGSNNTTIKGADSFGPPSISTKEYTAHWYGRTLHFGVREHAMGAILSG
+ IVLHGPTRAYGGTFLQFSDYMRPAVRLAALMDIDTIYVWTHDSIGLGEDGPTHQPIEH
+ LSALRAIPRLSVVRPADANETAYAWRTILARRNGSGPVGLILTRQGVPVLDGTDAEGV
+ ARGGYVLSDAGGLQPGEEPDVILIATGSEVQLAVAAQTLLADNDILARVVSMPCLEWF
+ EAQPYEYRDAVLPPTVSARVAVEAGVAQCWHQLVGDTGEIVSIEHYGESADHKTLFRE
+ YGFTAEAVAAAAERALDN"
+ gene complement(1631394..1635620)
+ /gene="PE_PGRS27"
+ /locus_tag="BQ2027_MB1485C"
+ CDS complement(1631394..1635620)
+ /gene="PE_PGRS27"
+ /locus_tag="BQ2027_MB1485C"
+ /note="Mb1485c, PE_PGRS27, len: 1408 aa. Similar to
+ Rv1450c, len: 1329 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (92.1% identity in 1417 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, similar to
+ Y03A_MYCTU|Q10637 hypothetical glycine-rich 49.6 kd
+ protein (603 aa), fasta scores: opt: 2112, E(): 0, (56.5%
+ identity in 630 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis,
+ insertions of 27 bp, 207 bp and 27 bp, substitutions of 60
+ bp to 63 bp and 11 bp, and a 27 bp deletion, leads to a
+ longer product compared to the homolog in Mycobacterium
+ tuberculosis strain H37Rv (1408 aa versus 1329 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs27"
+ /protein_id="SIU00088.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYE8"
+ /translation="MSLVIVAPETVAAAALDVARIGSSIGVANSAAAGSTTSVLAAGA
+ DEVSAAIATLFGSHAREYQAISTQVAAFHDRFAQTLSAAVGSYVSAEATNAAPLATLE
+ HNVLNALNAPTQALLGRPLIGDGAAGAPGTGQAGGAGGILWGNGGAGGSGAPGQVGGA
+ GGAAGLFGTGGAGGAGGAGAAGGAGGSGGWLLGNGGVGGAGGQSLLGGATGGAGGNAG
+ LFGVGGTGGPGGPGGPGGPGGPGGPGGVGGTGGAGGLGGTLYGAGGHGGAGGPGPIGG
+ VGGHGGVGGAAGLLGVGGHGGAGGHGAAGIAGAAGKGGIFPDGSNGGAGGDAGDGGTG
+ GRGGWLAGAGGAGGDGGIGGTGGAGGAGFSRALIVAGDNGGDGGNGGMGGAGGAGGPG
+ GAGGLISLLGGQGAGGDGGDGGAGGVGGDRGAGANGNQAVNAGAGGAGGHGGDPGAGG
+ AGGTGGAGSTIGAHGAAGASPTSGGNGGAGGNGAHFSSGGKAGGNGGAGGAGGLVGNG
+ GAGGAGGNGAPGAPPSGGDPNGGGGGAGGAGGKGGDGGAQAGDGGAGGAGGKGGNGGN
+ GATGATGLNGLGAGADGTDGGKGGNGGAGGGGGAGGQGGKALAATHQDGSMGAGGAGG
+ NGGAGGMGGDGGNGAKGTFDNGGDGVGGNGGNGGSRGIGGAGGIGGAGSTAGADGARG
+ ATPTSGGNGGTGGNGANATVAGGAGGAGGKGGNGGLVGNGGAGGKGGDGMAGVAGSSP
+ TTAGESGTSGQNGGAGGAGGAGGRGGDFGGDGGTGGAGGNGADGGAGGNGANGANATT
+ PGAKGGDGGHGGPGAQGGNGGQGGPGGLAGNLFGQNGIQGVGGSGGKGGAGGLAGDGG
+ NGANGNFAFGDGNGGHGGNGGNPGAGGQGGSGGAGSTPGAKGAHGFTPTSGGDGGDGG
+ NGGHSQVVGGNGGDGGNGGNGGSAGTGGNGGRGGDGAFGGMSANATNPGENGPNGNPG
+ GNGGAGGAGGAGLNGGNGGAGGNGGLGGFGGNGAAGANGVAVGAPGQPGGAGGHGGAG
+ GNGGAGGNGGQGVVSDGAGGAGGAGGDGGAPGDGANGGNGQGAGAFAGGGGGRGGDGG
+ NAGNAGAGGPGGTGSTAGKAGPAGSILHDGGNGGHGGHGAASGGNGGPGGHGGNGGNG
+ GTGANGGNGGIGGTGGAGSTGAKGVLGTNEGDGGDGGRGGNGGRGGNGGQGLTGAGGN
+ GGTGGTPGNGGNGGNGASGDLVTSPGDGGGGGRGGDAGRGGDAGLGGSSGPGGTPGDW
+ GTGGTGGTGGTGGQGANGGLTGGRGGTGGNGGAGGTGGTGHNGSQPGMGGNGGAGGFG
+ GNGFAGVGGRGGMGGSGGTGGTGDAGPFGTGTGGTGGHGGQGGGGGFSILLGLGGLGG
+ LGSPGSIATGTAGGAGGGGGFGGLGGGEFV"
+ gene 1636022..1636948
+ /gene="ctaB"
+ /locus_tag="BQ2027_MB1486"
+ CDS 1636022..1636948
+ /gene="ctaB"
+ /locus_tag="BQ2027_MB1486"
+ /note="Mb1486, ctaB, len: 308 aa. Equivalent to Rv1451,
+ len: 308 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 308 aa overlap). Probable ctaB,
+ cytochrome C oxidase assembly factor, and integral
+ membrane protein. Highly similar to several Mycobacterium
+ leprae proteins e.g. Q49685 CYOE cytochrome O ubiquinol
+ oxidase assembly factor (300 aa), FASTA scores: opt: 1636,
+ E(): 0, (82.7% identity in 307 aa overlap);
+ NP_301495.1|NC_002677 putative protoheme IX
+ farnesyltransferase (321 aa); NP_301495.1|NC_002677
+ putative protoheme IX farnesyltransferase (321 aa). Mb1486
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CYTOCHROME C OXIDASE ASSEMBLY FACTOR
+ CTAB"
+ /protein_id="SIU00089.1"
+ /db_xref="GOA:Q7U021"
+ /db_xref="InterPro:IPR000537"
+ /db_xref="InterPro:IPR006369"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U021"
+ /translation="MNVRGRVAPRRVTGRAMSTLLAYLALTKPRVIELLLVTAIPAML
+ LADRGAIHPLLMLNTLVGGMMAATGANTLNCVADADIDKVMKRTARRPLAREAVPTRN
+ ALALGLTLTVISFFWLWCATNLLAGVLALVTVAFYVFVYTLWLKRRTSQNVVWGGAAG
+ CMPVMIGWSAITGTIAWPALAMFAIIFFWTPPHTWALAMRYKQDYQVAGVPMLPAVAT
+ ERQVTKQILIYTWLTVAATLVLALATSWLYGAVALVAGGWFLTMAHQLYAGVRAGEPV
+ RPLRLFLQSNNYLAVVFCALAVDSVIALPTLH"
+ gene complement(1636997..1639384)
+ /gene="PE_PGRS28"
+ /locus_tag="BQ2027_MB1487C"
+ CDS complement(1636997..1639384)
+ /gene="PE_PGRS28"
+ /locus_tag="BQ2027_MB1487C"
+ /note="Mb1487c, PE_PGRS28, len: 795 aa. Highly similar to
+ Rv1452c, len: 741 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (89.1% identity in 795 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, similar to
+ Y03A_MYCTU|Q10637 hypothetical glycine-rich 49.6 kd
+ protein (603 aa), fasta scores: opt: 2090, E(): 0, (56.3%
+ identity in 641 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis,
+ substitutions of 3 bp to 144 bp, 40 bp to 49 bp, 31 bp to
+ 31 bp, 4 bp to 4 bp (gggc-ttgg), 12 bp to 12 bp, 11 bp to
+ 11 bp, 60 bp to 63 bp, 13 bp to 13 bp and 2 bp to 2 bp
+ (tt-cc), and a 9 bp insertion (*-cccgccggc), leads to a
+ longer product compared to the homolog in Mycobacterium
+ tuberculosis strain H37Rv (795 aa versus 741 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs28"
+ /protein_id="SIU00090.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYE4"
+ /translation="MSLVIVAPETVAAAALDVARIGSSIGVANSAAAGSTTSVLAAGA
+ DEVSAAIATLFGSHAREYQAISTQVAAFHDRFAQTLSAAVGSYVSAEATNAAPLATLE
+ HNVLNALNAPTQALLGRPLIGDGAAGAPGTGQAGGAGGILWGNGGAGGSGAPGQVGGA
+ GGAAGLFGTGGAGGAGGAGAAGGAGGSGGWLLGNGGVGGAGGQSLLGGATGGAGGNAG
+ LFGVGGTGGPGGPGGPGGVGGTGGAGGLGGTLYGAGGHGGAGGPGPIGGVGGHGGVGG
+ AAGLLGVGGHGGAGGHGAAGIAGAAGKGGIFPDGSNGGAGGDAGDGGTGGRGGWLAGA
+ GGAGGDGGIGGTGGAGGAGFSRALIVAGDNGGDGGNGGMGGAGGAGGPGGAGGLISLL
+ GGQGAGGDGGDGGAGGVGGDRGAGANGNQAVNAGAGGAGGHGGDPGAGGAGGTGGAGS
+ TIGAHGAAGASPTSGGNGGAGGNGAHFSSGGKAGGNGGAGGAGGHGGLVGNGGAGGAG
+ GNGANGAAGTNASDSGAVGGKGNSGGNGGQGGAGGDGGTLAGNGGAGGTGGRGADGGL
+ GGSGAEGANATTAGERGQDGGKGGNGGVGGTGGNAVAPGANGGHGGNGGNPGFSGAGG
+ LGGLSGDGVTRAAQGATPDFADTGGKGGNGGNGANAVAPGGTGASGGAGGNAGAGGKG
+ GENIIGDGGGGGNGGAGGQGGDGTAGAGGDGGAGGKGGDGGDGGSDPTEGRGFGGLGG
+ AGGAGGKGGAGTLLGLTVFGDNGGAGVLGDSTDPDGSGGAGGAGGAGGAGGDPTI"
+ gene 1639536..1640801
+ /locus_tag="BQ2027_MB1488"
+ CDS 1639536..1640801
+ /locus_tag="BQ2027_MB1488"
+ /note="Mb1488, -, len: 421 aa. Equivalent to Rv1453, len:
+ 421 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 421 aa overlap). Possible
+ transcriptional activator, similar to Q50018 putative
+ transcriptional activator trx from Mycobacterium leprae
+ (517 aa), FASTA scores: opt: 1719, E(): 0, (54.0% identity
+ in 500 aa overlap). Also highly similar to Mycobacterium
+ tuberculosis proteins Rv2370c, Rv1194c, Rv2242, Rv1186c,
+ and to the further upstream ORF's Rv1429|MTCY493.25c
+ (28.1% identity in 335 aa overlap). Start changed since
+ first submission (-11 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL ACTIVATOR PROTEIN"
+ /protein_id="SIU00091.1"
+ /db_xref="InterPro:IPR025736"
+ /db_xref="InterPro:IPR041522"
+ /db_xref="InterPro:IPR042070"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYD2"
+ /translation="MALRETSPRIHELIREAARIALNPTQEWLDEFDRAILAANPSIA
+ ADPALATVVKRSNRAHLIHFAAANLRNPGAPVPANLGPEPLRMARDLVRVGLDALALD
+ IYRIGQNVAWRRWTDIAFGLTSDPDELHELLDVPFRTANEFVDTTLAGITTEMQLERD
+ KLTRDVPAERRKIVQLLIDGAPISREHAEARLGYPLDRSHTAAVIWGDQAQGDHSHLD
+ RVADAFGHAGGCPHPLVVVAGAATRWVWVKDAPGFDIDLIHEVLHDIPDARIAIGATA
+ PGIEGFRRSHRDALTTARMIIRLESPHRVAFFTDVEMVALLTENAEGADDFIQRTLGN
+ LESASPALKTTLLTFINQQCNASRAARLLFTHRNTLMNRLETAQRLLPRPLADTTIHV
+ AVALEAQQWREKQTSDPPAKKESNGTKMR"
+ gene complement(1640829..1641815)
+ /gene="qor"
+ /locus_tag="BQ2027_MB1489C"
+ CDS complement(1640829..1641815)
+ /gene="qor"
+ /locus_tag="BQ2027_MB1489C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1489c, qor, len: 328 aa. Equivalent to Rv1454c,
+ len: 328 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 328 aa overlap). Probable qor, quinone
+ oxidoreductase (EC 1.6.5.5), simiar to U87282|RCU87282_2
+ quinone oxidoreductase from Rhodobacter capsulatus (323
+ aa), FASTA scores: opt: 849, E(): 0, (44.7% identity in
+ 329 aa overlap). Also similar to MTCY180.06 Hypothetical
+ protein from Mycobacterium tuberculosis (334 aa), FASTA
+ scores: opt: 430, E(): 2e-14, (32.3% identity in 350 aa
+ overlap). Contains PS01162 Quinone oxidoreductase /
+ zeta-crystallin signature. Protein product from Mb1489c
+ detected using shotgun mass spectrometry. Mb1489c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE QUINONE REDUCTASE QOR (NADPH:quinone
+ reductase) (Zeta-crystallin homolog protein)"
+ /protein_id="SIU00092.1"
+ /db_xref="GOA:A0A1R3XYD6"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013149"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR020843"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYD6"
+ /translation="MHAIEVTETGGPGVLRHVDQPQPQPGHGELLIKAEAIGVNFIDT
+ YFRSGQYPRELPFVIGSEVCGTVEAVGPGVTAADTAISVGDRVVSASANGAYAEFCTA
+ PASLTAKVPDDVTSEVAASALLKGLTAHYLLKSVYPVKRGDTVLVHAGAGGVGLILTQ
+ WATHLGVRVITTVSTAEKAKLSKDAGADVVLDYPEDAWQFAGRVRELTGGTGVQAVYD
+ GVGATTFDASLASLAVRGTLALFGAASGPVPPVDPQRLNAAGSVYLTRPSLFHFTRTG
+ EEFSWRAAELFDAIGSEAITVAVGGRYPLADALRAHQDLEARKTVGSVVLLP"
+ gene 1641835..1642698
+ /locus_tag="BQ2027_MB1490"
+ CDS 1641835..1642698
+ /locus_tag="BQ2027_MB1490"
+ /note="Mb1490, -, len: 287 aa. Equivalent to Rv1455, len:
+ 287 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 287 aa overlap). Conserved hypothetical
+ protein, some similarity from aa 80-160 to
+ Z99125|MLCL536.35c hypothetical Mycobacterium leprae
+ protein (101 aa), FASTA scores: opt: 238, E(): 1.8e-08,
+ (51.3% identity in 78 aa overlap). Protein product from
+ Mb1490 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00093.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0I3"
+ /translation="MKLARPDVFHPRVVLAGWPQQPAGDGDDAGLVAALRHRGLHAGW
+ LSWDDPEIVHADLVILRATRDYPARLDEFLAWTTRVANLLNSRPVVAWNVERRYLRDL
+ MDRGVPTVPGEVYVPGEPVRLPRKGQVFVGPTIGTGTRRCSARFAAEFVAQLHAAGQA
+ VLVQPGGSGDETVLVFLGGEPSHAFTKQADTWRQTEPDFEIWDVGAAAVAGAAAQVGV
+ DPGELLYARAHITGGSRDPRLLELQLVDPSLGWQWLDPDIRNLAQRDFALCVQSALER
+ LGLGPFSHRRP"
+ gene complement(1642648..1643580)
+ /locus_tag="BQ2027_MB1491C"
+ CDS complement(1642648..1643580)
+ /locus_tag="BQ2027_MB1491C"
+ /note="Mb1491c, -, len: 310 aa. Equivalent to Rv1456c,
+ len: 310 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 310 aa overlap). Possible unidentified
+ antibiotic-transport integral membrane protein ABC
+ transporter (see citation below), equivalent to
+ Z99125|MLCL536.34 from Mycobacterium leprae (311 aa),
+ FASTA scores: opt: 1607, E(): 0, (83.3% identity in 300 aa
+ overlap). Mb1491c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE UNIDENTIFIED ANTIBIOTIC-TRANSPORT
+ INTEGRAL MEMBRANE ABC TRANSPORTER"
+ /protein_id="SIU00094.1"
+ /db_xref="GOA:A0A1R3XZD6"
+ /db_xref="InterPro:IPR003780"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZD6"
+ /translation="MPYDRAVSPSLRVQRVIAAIVILTQGGIAVTGAIVRVTASGLGC
+ PTWPQCFPGSFTPVVVAEVPRVHQAVEFGNRMVTFAVVIAAALAVLVVTRARRRTEVL
+ AYAWLMPVSTVVQAMIGGITVRTGLLWWTVAIHLLASMTMVWLAVLLYVKIGQPDDGV
+ VHELVVSPLRALTALSALNLAAVLVTGTLVTAAGPHAGDRSPSRTVPRLKVEITTLVH
+ MHSSLLVAYLALLIGLGFGLLAVGATRAILVRLAVLLALVATQAAVGTTQYFTGVPAA
+ LVAIHVAGAAAVTAATAALWASMGERAQPQPLQR"
+ gene complement(1643692..1644477)
+ /locus_tag="BQ2027_MB1492C"
+ CDS complement(1643692..1644477)
+ /locus_tag="BQ2027_MB1492C"
+ /note="Mb1492c, -, len: 261 aa. Equivalent to Rv1457c,
+ len: 261 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 261 aa overlap). Possible unidentified
+ antibiotic-transport integral membrane protein ABC
+ transporter (see citation below), equivalent to
+ Z99125|MLCL536.32 from Mycobacterium leprae (265 aa),
+ FASTA scores: opt: 1415, E(): 0, (83.1% identity in 260 aa
+ overlap). Mb1492c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE UNIDENTIFIED ANTIBIOTIC-TRANSPORT
+ INTEGRAL MEMBRANE ABC TRANSPORTER"
+ /protein_id="SIU00095.1"
+ /db_xref="GOA:A0A1R3XYE5"
+ /db_xref="InterPro:IPR000412"
+ /db_xref="InterPro:IPR004377"
+ /db_xref="InterPro:IPR013525"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYE5"
+ /translation="MTQTNRPAFPAGTFSPDPRPNAVPLMLAAQFSLELKLLLRNGEQ
+ LLLTMFIPITLLVGLTLLPMGSFGHNRAATFVPVIMALAVISTAFTGQAIAVAFDRRY
+ GALKRLGATPLPVWGIIAGKSLAVVAVVFLQAIILGAIGFALGWRPALTALTLGAGII
+ ALGTAGFAALGLLLGGTLRAEIVLAVANLMWFVFAGFGALTLESNVIPTAFKWVARVT
+ PSGALTEALSQAMTVSVDWFGIVVLAVWGALAALAALRWFRFT"
+ gene complement(1644474..1645415)
+ /locus_tag="BQ2027_MB1493C"
+ CDS complement(1644474..1645415)
+ /locus_tag="BQ2027_MB1493C"
+ /note="Mb1493c, -, len: 313 aa. Equivalent to Rv1458c,
+ len: 313 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 313 aa overlap). Possible unidentified
+ antibiotic-transport ATP-binding protein ABC transporter
+ (see citation below), equivalent to Z99125|MLCL536.31 from
+ Mycobacterium leprae (315 aa), FASTA scores: opt: 1812,
+ E(): 0, (88.0% identity in 308 aa overlap). Similar to
+ AF027770|AF027770_7 ABC-type transporter in FxbA region in
+ Mycobacterium smegmatis (284 aa), FASTA scores: opt: 1412,
+ E(): 0, (85.1% identity in 248 aa overlap). Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop) and PS00211
+ ABC transporters family signature. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Protein product from Mb1493c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1493c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE UNIDENTIFIED ANTIBIOTIC-TRANSPORT
+ ATP-BINDING PROTEIN ABC TRANSPORTER"
+ /protein_id="SIU00096.1"
+ /db_xref="GOA:A0A1R3XYT3"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYT3"
+ /translation="MNRAPDTPEVVLRLRGVCKRYGSITAVSNLDLDVHDAEVMALLG
+ PNGAGKTTTVEMCEGFVRPDAGSIEVLGLDPITDNARLRARIGVMLQGGGGYPAARAG
+ EMLDLVASYAANPLDPHWLLDTLGLTEAARTTYRRLSGGQQQRLALACALVGRPQLVF
+ LDEPTAGMDAHARVLVWELIDALRRDGVTVVLTTHHLKEAEELADRLVIIDHGVTVAA
+ GTPAELMRSGAKDQLRFTAPPRLDLSLLASALPEGYQATELTPGEYLVEGPVDPQVLA
+ TVTAWCAQIDVLATDMRVEQRSLEDVFLDLTGRKLRQ"
+ gene complement(1645518..1647293)
+ /locus_tag="BQ2027_MB1494C"
+ CDS complement(1645518..1647293)
+ /locus_tag="BQ2027_MB1494C"
+ /note="Mb1494c, -, len: 591 aa. Equivalent to Rv1459c,
+ len: 591 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 591 aa overlap). Possible conserved
+ integral membrane protein, equivalent to MLCL536.30|Z99125
+ hypothetical protein from Mycobacterium leprae (593 aa),
+ FASTA scores: opt: 1670, E(): 0, (78.6% identity in 585 aa
+ overlap). Also similar to Mycobacterium tuberculosis
+ protein Rv2174|MTV021.07 (33.1% identity in 523 aa
+ overlap). Protein product from Mb1494c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1494c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIU00097.1"
+ /db_xref="GOA:A0A1R3XYF9"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYF9"
+ /translation="MAARHHTLSWSIASLHGDEQAVGAPLTTTELTALARTRLFGATG
+ TVLMAIGALGAGARPVVQDPTFGVRLLNLPSRIQTVSLTMTTTGAVMMALAWLMLGRF
+ TLGRRRMSRGELDRTLLLWMLPLLIAPPMYSKDVYSYLAQSEIGRDGLDPYRVGPASG
+ LGLGHVFTLSVPSLWRETPAPYGPLFLWIGRGISSLTGENIVAAVLCHRLVVLIGVTL
+ IVWATPRLAQRCGVAEVSALWLGAANPLLIMHLVAGIHNEALMLGLMLTGVEFALRGL
+ DMANTPRPSPETWRLGPATIRASRRPELGASPRAGASRAVKPRPEWGPLAMLLAGSIL
+ ITLSSQVKLPSLLAMGFVTTVLAYRWGGNLRALLLAAAVMASLTLAIMAILGWASGLG
+ FGWINTLGTANVVRSWMSPPTLLALGTGHVGILLGLGDHTTAVLSLTRAIGVLIITVM
+ VCWLLLAVLRGRLHPIGGLGVALAVTVLLFPVVQPWYLLWAIIPLAAWATRPGFRVAA
+ ILATLIVGIFGPTANGDRFALFQIVDATAASAIIVILLIALTYTRLPWRPLAAEQVVT
+ AAESASKTPATRRPTAAPDAYADST"
+ gene 1647341..1648147
+ /locus_tag="BQ2027_MB1495"
+ CDS 1647341..1648147
+ /locus_tag="BQ2027_MB1495"
+ /note="Mb1495, -, len: 268 aa. Equivalent to Rv1460, len:
+ 268 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 268 aa overlap). Probable
+ transcriptional regulatory protein. Equivalent to
+ Z99125|MLCL536.29c hypothetical protein from Mycobacterium
+ leprae (254 aa), FASTA scores: opt: 1273, E(): 0, (79.6%
+ identity in 250 aa overlap). Possible helix-turn-helix
+ motif between aa 68 - 89. Start changed since original
+ submission. Protein product from Mb1495 detected using
+ SWATH mass spectrometry. Mb1495 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00098.1"
+ /db_xref="InterPro:IPR011991"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYF5"
+ /translation="MTSTTLPHRASLVDRSTEFCHTDVVKIPAVSTTVPAAVSDGHTR
+ RAIVRLLLESGSITAGEIGDRLGLSAAGVRRHLDALIEAGDAEASAAAPWQQVGRGRP
+ AKRYRLTAAGRAKLDHSYDDLASAAMRQLREIGGEEAVRTFARRRIDAILADVAPADG
+ PDDAALEAAAERIATALSKAGYVATTTRVGGPIHGVQICQHHCPVSHVAEEFPELCET
+ EQQAMAEVLGTHVQRLATIVNGDCACTTHVPLSPAPSPRPPATSTEGVSR"
+ gene 1648144..1650684
+ /locus_tag="BQ2027_MB1496"
+ CDS 1648144..1650684
+ /locus_tag="BQ2027_MB1496"
+ /note="Mb1496, -, len: 846 aa. Equivalent to Rv1461, len:
+ 846 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 846 aa overlap). Conserved hypothetical
+ protein. Equivalent of spliced protein from Mycobacterium
+ leprae MLCL536.28c len: 869. Residues 1-253 represent
+ N-extein, and 613-846 the C-extein. The intein present
+ from residues 254 - 612 is different in sequence and site
+ of the insertion from the one present in MLCL536.28c.
+ FASTA scores: Z99125|MLCL536_23 Mycobacterium leprae
+ cosmid L536 (869 aa), opt: 1498 E(): 0, (54.1% identity in
+ 917 aa overlap). The mature protein is similar to
+ Z99120|BSUB0017_150 hypothetical Bacillus subtilis protein
+ (465 aa), FASTA scores: opt:1053, E(): 0, (34.8% identity
+ in 821 aa overlap). The intein shows some similarity to
+ inteins from U67548|MJU67548_6 Methanococcus jannaschii
+ (895 aa), FASTA scores: opt: 181, E(): 0.00023, (25.2%
+ identity in 274 aa overlap). Protein product from Mb1496
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1496 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Iron-sulfur cluster assembly protein SufB"
+ /protein_id="SIU00099.1"
+ /db_xref="GOA:P67126"
+ /db_xref="InterPro:IPR000825"
+ /db_xref="InterPro:IPR003586"
+ /db_xref="InterPro:IPR003587"
+ /db_xref="InterPro:IPR004042"
+ /db_xref="InterPro:IPR006141"
+ /db_xref="InterPro:IPR006142"
+ /db_xref="InterPro:IPR010231"
+ /db_xref="InterPro:IPR027434"
+ /db_xref="InterPro:IPR030934"
+ /db_xref="InterPro:IPR036844"
+ /db_xref="InterPro:IPR037284"
+ /db_xref="UniProtKB/Swiss-Prot:P67126"
+ /translation="MTLTPEASKSVAQPPTQAPLTQEEAIASLGRYGYGWADSDVAGA
+ NAQRGLSEAVVRDISAKKNEPDWMLQSRLKALRIFDRKPIPKWGSNLDGIDFDNIKYF
+ VRSTEKQAASWDDLPEDIRNTYDRLGIPEAEKQRLVAGVAAQYESEVVYHQIREDLEA
+ QGVIFLDTDTGLREHPDIFKEYFGTVIPAGDNKFSALNTAVWSGGSFIYVPPGVHVDI
+ PLQAYFRINTENMGQFERTLIIADEGSYVHYVEGCLPAGELITTADGDLRPIESIRVG
+ DFVTGHDGRPHRVTAVQVRDLDGELFTFTPMSPANAFSVTAEHPLLAIPRDEVRVMRK
+ ERNGWKAEVNSTKLRSAEPRWIAAKDVAEGDFLIYPKPKPIPHRTVLPLEFARLAGYY
+ LAEGHACLTNGCESLIFSFHSDEFEYVEDVRQACKSLYEKSGSVLIEEHKHSARVTVY
+ TKAGYAAMRDNVGIGSSNKKLSDLLMRQDETFLRELVDAYVNGDGNVTRRNGAVWKRV
+ HTTSRLWAFQLQSILARLGHYATVELRRPGGPGVIMGRNVVRKDIYQVQWTEGGRGPK
+ QARDCGDYFAVPIKKRAVREAHEPVYNLDVENPDSYLAYGFAVHNCTAPIYKSDSLHS
+ AVVEIIVKPHARVRYTTIQNWSNNVYNLVTKRARAEAGATMEWIDGNIGSKVTMKYPA
+ VWMTGEHAKGEVLSVAFAGEDQHQDTGAKMLHLAPNTSSNIVSKSVARGGGRTSYRGL
+ VQVNKGAHGSRSSVKCDALLVDTVSRSDTYPYVDIREDDVTMGHEATVSKVSENQLFY
+ LMSRGLTEDEAMAMVVRGFVEPIAKELPMEYALELNRLIELQMEGAVG"
+ gene 1650681..1651874
+ /locus_tag="BQ2027_MB1497"
+ CDS 1650681..1651874
+ /locus_tag="BQ2027_MB1497"
+ /note="Mb1497, -, len: 397 aa. Equivalent to Rv1462, len:
+ 397 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 397 aa overlap). Conserved hypothetical
+ protein. Equivalent to MLCL536.27c|Z99125 hypothetical
+ protein from Mycobacterium leprae (392 aa), FASTA scores:
+ opt: 2059, E(): 0, (80.4% identity in 392 aa overlap).
+ Also similar to nearby Mycobacterium tuberculosis
+ hypothetical protein Rv1461. Protein product from Mb1497
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1497 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Iron-sulfur cluster assembly protein SufD"
+ /protein_id="SIU00100.1"
+ /db_xref="GOA:P59973"
+ /db_xref="InterPro:IPR000825"
+ /db_xref="InterPro:IPR011542"
+ /db_xref="InterPro:IPR037284"
+ /db_xref="UniProtKB/Swiss-Prot:P59973"
+ /translation="MTAPGLTAAVEGIAHNKGELFASFDVDAFEVPHGRDEIWRFTPL
+ RRLRGLHDGSARATGSATITVSERPGVYTQTVRRGDPRLGEGGVPTDRVAAQAFSSFN
+ SATLVTVERDTQVVEPVGITVTGPGEGAVAYGHLQVRIEELGEAVVVIDHRGGGTYAD
+ NVEFVVDDAARLTAVWIADWADDTVHLSAHHARIGKDAVLRHVTVMLGGDVVRMSAGV
+ RFCGAGGDAELLGLYFADDGQHLESRLLVDHAHPDCKSNVLYKGALQGDPASSLPDAH
+ TVWVGDVLIRAQATGTDTFEVNRNLVLTDGARADSVPNLEIETGEIVGAGHASATGRF
+ DDEQLFYLRSRGIPEAQARRLVVRGFFGEIIAKIAVPEVRERLTAAIEHELEITESTE
+ KTTVS"
+ gene 1651871..1652671
+ /locus_tag="BQ2027_MB1498"
+ CDS 1651871..1652671
+ /locus_tag="BQ2027_MB1498"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1498, -, len: 266 aa. Equivalent to Rv1463, len:
+ 266 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 266 aa overlap). Probable conserved
+ ATP-binding protein ABC transporter, equivalent to
+ Z99125|MLCL536.26c putative ABC transporter ATP-binding
+ protein from Mycobacterium leprae (260 aa), FASTA scores:
+ opt: 1444, E(): 0, (86.0% identity in 267 aa overlap).
+ Very similar to U38804|PPU38804_55 ATP-DEPENDENT
+ TRANSPORTER YCF16 from PORPHYRA PURPUREA chloroplast (251
+ aa), FASTA scores: opt: 822, E(): 0, (52.4% identity in
+ 248 aa overlap); and similar to others. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Protein product from Mb1498 detected using shotgun mass
+ spectrometry. Mb1498 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED ATP-BINDING PROTEIN ABC
+ TRANSPORTER"
+ /protein_id="SIU00101.1"
+ /db_xref="GOA:A0A1R3XYE2"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR010230"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYE2"
+ /translation="MTILEIKDLHVSVENPAEADHEIPILRGVDLTVKSGETHALMGP
+ NGSGKSTLSYAIAGHPKYHVTSGTITLDGADVLAMSIDERARAGLFLAMQYPVEVPGV
+ SMSNFLRSAATAIRGEPPKLRHWVKEVKAAMAALDIDPAFAERSVNEGFSGGEKKRHE
+ ILQLELLKPKIAILDETDSGLDVDALRVVSEGVNRYAESQHGGILLITHYTRILRYIH
+ PEYVHVFVGGRIVESGGSELADELDQNGYVRFSPASGRYPHQPAPTGA"
+ gene 1652673..1653926
+ /gene="csd"
+ /locus_tag="BQ2027_MB1499"
+ CDS 1652673..1653926
+ /gene="csd"
+ /locus_tag="BQ2027_MB1499"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1499, csd, len: 417 aa. Equivalent to Rv1464,
+ len: 417 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 417 aa overlap). Probable csd, cysteine
+ desulfurase (EC 4.4.1.-). Equivalent to Q49690|MLCL536.25C
+ cysteine desulfurase from Mycobacterium leprae (418 aa),
+ FASTA scores: opt: 2333, E(): 0, (85.4% identity in 417 aa
+ overlap); and similar to cysteine desulfurase from other
+ organisms. Also similar to M. tuberculosis proteins
+ Rv3025c|ISCS and Rv3778c. Contains PS00595
+ Aminotransferases class-V pyridoxal-phosphate attachment
+ site. BELONGS TO CLASS-V OF PYRIDOXAL-PHOSPHATE-DEPENDENT
+ AMINOTRANSFERASES. CSD SUBFAMILY. Protein product from
+ Mb1499 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1499 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CYSTEINE DESULFURASE CSD"
+ /protein_id="SIU00102.1"
+ /db_xref="GOA:P63517"
+ /db_xref="InterPro:IPR000192"
+ /db_xref="InterPro:IPR010970"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="InterPro:IPR020578"
+ /db_xref="UniProtKB/Swiss-Prot:P63517"
+ /translation="MTASVNSLDLAAIRADFPILKRIMRGGNPLAYLDSGATSQRPLQ
+ VLDAEREFLTASNGAVHRGAHQLMEEATDAYEQGRADIALFVGADTDELVFTKNATEA
+ LNLVSYVLGDSRFERAVGPGDVIVTTELEHHANLIPWQELARRTGATLRWYGVTDDGR
+ IDLDSLYLDDRVKVVAFTHHSNVTGVLTPVSELVSRAHQSGALTVLDACQSVPHQPVD
+ LHELGVDFAAFSGHKMLGPNGIGVLYGRRELLAQMPPFLTGGSMIETVTMEGATYAPA
+ PQRFEAGTPMTSQVVGLAAAARYLGAIGMAAVEAHERELVAAAIEGLSGIDGVRILGP
+ TSMRDRGSPVAFVVEGVHAHDVGQVLDDGGVAVRVGHHCALPLHRRFGLAATARASFA
+ VYNTADEVDRLVAGVRRSRHFFGRA"
+ gene 1653923..1654411
+ /locus_tag="BQ2027_MB1500"
+ CDS 1653923..1654411
+ /locus_tag="BQ2027_MB1500"
+ /note="Mb1500, -, len: 162 aa. Equivalent to Rv1465, len:
+ 162 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 162 aa overlap). Possible nitrogen
+ fixation related protein. Equivalent to Z99125|MLCL536.24c
+ nitrogen fixation protein NIFU from Mycobacterium leprae
+ (165 aa), FASTA scores: opt: 870, E(): 0, (81.8% identity
+ in 165 aa overlap). Also similar to
+ O32163|Z99120|NIFU_BACSU NifU-like protein from Bacillus
+ subtilis (147 aa), FASTA scores: opt: 354, E(): 4.1e-17,
+ (38.3% identity in 141 aa overlap) and to
+ AL096839|SCC22.02 hypothetical protein from Streptomyces
+ coelicolor (156 aa), FASTA scores: opt: 569, E(): 1.2e-31,
+ (56.3% identity in 158 aa overlap). Protein product from
+ Mb1500 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1500 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE NITROGEN FIXATION RELATED PROTEIN"
+ /protein_id="SIU00103.1"
+ /db_xref="GOA:A0A1R3Y0J3"
+ /db_xref="InterPro:IPR002871"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0J3"
+ /translation="MTLRLEQIYQDVILDHYKHPQHRGLREPFGAQVYHVNPICGDEV
+ TLRVALSEDGTRVTDVSYDGQGCSISQAATSVLTEQVIGQRVPRALNIVDAFTEMVSS
+ RGTVPGDEDVLGDGVAFAGVAKYPARVKCALLGWMAFKDALAQASEAFEEVTDERNQR
+ TG"
+ gene 1654386..1654733
+ /locus_tag="BQ2027_MB1501"
+ CDS 1654386..1654733
+ /locus_tag="BQ2027_MB1501"
+ /note="Mb1501, -, len: 115 aa. Equivalent to Rv1466, len:
+ 115 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 115 aa overlap). Conserved hypothetical
+ protein. Equivalent to Z99125|MLCL536.23c hypothetical
+ protein from Mycobacterium leprae (115 aa), FASTA scores:
+ opt: 648, E(): 0, (81.7% identity in 115 aa overlap).
+ Similar to ORF's downstream of sigma factors in
+ Streptococcus mutans and Streptococcus pneumoniae e.g.
+ O06451 ORF3 downstream of RpoD (SPDNAGCPO) (109 aa).
+ Alternative TTG start possible at 13757 then avoids
+ overlap with MTV007.12. Protein product from Mb1501
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1501 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PaaD-like protein (DUF59) involved in Fe-S
+ cluster assembly"
+ /protein_id="SIU00104.1"
+ /db_xref="InterPro:IPR002744"
+ /db_xref="InterPro:IPR034904"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZE4"
+ /translation="MSETSAPAEELLADVEEAMRDVVDPELGINVVDLGLVYGLDVQD
+ GDEGTVALIDMTLTSAACPLTDVIEDQSRSALVGSGLVDDIRINWVWNPPWGPDKITE
+ DGREQLRALGFTV"
+ gene complement(1654828..1656657)
+ /gene="fadE15"
+ /locus_tag="BQ2027_MB1502C"
+ CDS complement(1654828..1656657)
+ /gene="fadE15"
+ /locus_tag="BQ2027_MB1502C"
+ /note="Mb1502c, fadE15, len: 609 aa. Equivalent to
+ Rv1467c, len: 609 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 609 aa overlap). Probable
+ fadE15, acyl-CoA dehydrogenase (EC 1.3.99.-), highly
+ similar to NP_302639.1|NC_002677 acyl-CoA dehydrogenase
+ from Mycobacterium leprae (611 aa). Also highly similar to
+ many e.g. T36481 probable acyl-CoA dehydrogenase
+ (fragment) from Streptomyces coelicolor (491 aa) (has its
+ N-terminus very shorter); NP_384640.1|NC_003047 PUTATIVE
+ ACYL-COA DEHYDROGENASE PROTEIN from Sinorhizobium meliloti
+ (598 aa); ACDS_MEGEL|Q06319 acyl-CoA dehydrogenase
+ (short-chain specific) from Megasphaera elsdenii (383 aa),
+ FASTA scores: E(): 2e-12, (25.4% identity in 410 aa
+ overlap); etc. Also highly similar to
+ fadE5|Rv0244c|MTV034.10c ACYL-COA DEHYDROGENASE from M.
+ tuberculosis (611 aa); and similar to other proteins from
+ Mycobacterium tuberculosis. Protein product from Mb1502c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1502c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE15"
+ /protein_id="SIU00105.1"
+ /db_xref="GOA:A0A1R3XYF3"
+ /db_xref="InterPro:IPR006091"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR020953"
+ /db_xref="InterPro:IPR025878"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR037069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYF3"
+ /translation="MGHYIANVRDLEFNLLEVLDIGAVLGTGRYSDLDVDTVRTILAE
+ AARLAEGPIAESFGYADRNPPVFDPNTHSISVPDELAKTVQAIKEAGWWRLGLAEEIG
+ GMPAPPPLAWAVNEMIYCANPSACFFNLGPVLAQSLYIEGNDEQRRWAAEGVQRGWQA
+ TMVLTEPDAGSDVGAGRTKAFEQPDGTWHIEGVKRFISGGDVGNTAENIFHLVLARPE
+ GAGPGTKGLSLFYVPNYLFDPDTFELGARNGVYVTGLEHKMGLKSSPTCELTFGGADV
+ PAVGYLVGGVHNGIAQMFTVIEHARMTIGVKSAGTLSTGYLNALAFAKERVQGADLTQ
+ MTDKTAPRVTIMHHPDVRRSLMTQKAYAEGLRALYLYAAAHQDDAVAQRVSGADHDMA
+ HRVDDLLLPIVKGVGSERAYEILTESLQTLGGSGFLVDYPLEQYIRDAKIDSLYEGTT
+ AIQALDFFFRKIVRDHGKALQFVLAQVTHTVENIDPSLKPQAELLRTALDDITAMTGA
+ LTGYLMSAAQHSSDIYKVGLGSVRYLLAVGDLLIGWRLLVLAGVAHAALADGPSQNDE
+ AFYRGKIAVAAFFAKNMLPKLTGVRSVIENIDDDIMRVPEDAF"
+ gene complement(1656764..1657876)
+ /gene="PE_PGRS29"
+ /locus_tag="BQ2027_MB1503C"
+ CDS complement(1656764..1657876)
+ /gene="PE_PGRS29"
+ /locus_tag="BQ2027_MB1503C"
+ /note="Mb1503c, PE_PGRS29, len: 370 aa. Equivalent to
+ Rv1468c, len: 370 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 370 aa overlap). Member of
+ the Mycobacterium tuberculosis PE family, PGRS subfamily
+ of gly-rich proteins. Mb1503c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs29"
+ /protein_id="SIU00106.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYU6"
+ /translation="MSFVVANTEFVSGAAGNLARLGSMISAANSAAAAQTTAVAAAGA
+ DEVSAAVAALFGAHGQTYQVLSAQAAAFHSQFVQALSGGAQAYAAAEATNFGPLQPLF
+ DVINAPTLALLNRPLIGNGADGTAANPNGQAGGLLIGNGGNGFSPAAGPGGNGGAAGL
+ LGHGGNGGVGALGANGGAGGTGGWLFGNGGAGGNSGGGGGAGGIGGSAVLFGAGGAGG
+ ISPNGMGAGGSGGNGGLFFGNGGAGASSFLGGGGAGGRAFLFGDGGAGGAALSAGSAG
+ RGGDAGFFYGNGGAGGSGAGGASSAHGGAGGQAGLFGNGGEGGDGGALGGNGGNGGNA
+ QLIGNGGDGGDGGGAGAPGLGGRGGLLLGLPGANGT"
+ gene 1658118..1660091
+ /gene="ctpD"
+ /locus_tag="BQ2027_MB1504"
+ CDS 1658118..1660091
+ /gene="ctpD"
+ /locus_tag="BQ2027_MB1504"
+ /note="Mb1504, ctpD, len: 657 aa. Equivalent to Rv1469,
+ len: 657 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 657 aa overlap). Probable ctpD,
+ cation-transporting P-type ATPase D (transmembrane
+ protein) (EC 3.6.3.-), highly similar to others e.g.
+ T35947 probable cation-transporting ATPase from
+ Streptomyces coelicolor (638 aa); NP_442633.1|NC_000911
+ cation-transporting ATPase (E1-E2 ATPase) from
+ Synechocystis sp. strain PCC 6803 (642 aa), FASTA scores:
+ opt: 1438, E(): 0, (41.9% identity in 592 aa overlap);
+ NP_389268.1|NC_000964 protein similar to heavy
+ metal-transporting ATPase from Bacillus subtilis (637 aa);
+ etc. Also highly similar to others from Mycobacterium
+ tuberculosis e.g. Rv3743c|MTV025.091c|CTPJ (660 aa).
+ Contains PS00154 E1-E2 ATPases phosphorylation site.
+ BELONGS TO THE CATION TRANSPORT ATPASES FAMILY (E1-E2
+ ATPASES), SUBFAMILY IB. Mb1504 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CATION TRANSPORTER P-TYPE ATPASE D
+ CTPD"
+ /protein_id="SIU00107.1"
+ /db_xref="GOA:P63686"
+ /db_xref="InterPro:IPR001757"
+ /db_xref="InterPro:IPR008250"
+ /db_xref="InterPro:IPR018303"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR023298"
+ /db_xref="InterPro:IPR023299"
+ /db_xref="InterPro:IPR027256"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="UniProtKB/Swiss-Prot:P63686"
+ /translation="MTLTACEVTAAEAPFDRVSKTIPHPLSWGAALWSVVSVRWATVA
+ LLLFLAGLVAQLNGAPEAMWWTLYLACYLAGGWGSAWAGAQALRNKALDVDLLMIAAA
+ VGAVAIGQIFDGALLIVIFATSGALDDIATRHTAESVKGLLDLAPDQAVVVQGDGSER
+ VVAASELVVGDRVVVRPGDRIPADGAVLSGASDVDQRSITGESMPVAKARGDEVFAGT
+ VNGSGVLHLVVTRDPSQTVVARIVELVADASATKAKTQLFIEKIEQRYSLGMVAATLA
+ LIVIPLMFGADLRPVLLRAMTFMIVASPCAVVLATMPPLLSAIANAGRHGVLVKSAVV
+ VERLADTSIVALDKTGTLTRGIPRLASVAPLDPNVVDARRLLQLAAAAEQSSEHPLGR
+ AIVAEARRRGIAIPPAKDFRAVPGCGVHALVGNDFVEIASPQSYRGAPLAELAPLLSA
+ GATAAIVLLDGVAIGVLGLTDQLRPDAVESVAAMAALTAAPPVLLTGDNGRAAWRVAR
+ NAGITDVRAALLPEQKVEVVRNLQAGGHQVLLVGDGVNDAPAMAAARAAVAMGAGADL
+ TLQTADGVTIRDELHTIPTIIGLARQARRVVTVNLAIAATFIAVLVLWDLFGQLPLPL
+ GVVGHEGSTVLVALNGMRLLTNRSWRAAASAAR"
+ gene 1660135..1660509
+ /gene="trxA"
+ /locus_tag="BQ2027_MB1505"
+ CDS 1660135..1660509
+ /gene="trxA"
+ /locus_tag="BQ2027_MB1505"
+ /note="Mb1505, trxA, len: 124 aa. Equivalent to Rv1470,
+ len: 124 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 124 aa overlap). Probable trxA,
+ thioredoxin (EC 1.-.-.-), similar to many e.g.
+ P12243|THI1_SYNP7 THIOREDOXIN 1 from Synechococcus sp.
+ (106 aa), FASTA scores: opt: 201, E(): 9.2e-08, (35.4%
+ identity in 99 aa overlap); etc. Highly similar to
+ downstream ORF Rv1471|trxB1 probable thioredoxin from M.
+ tuberculosis (123 aa), FASTA scores: opt: 402, E(): 0,
+ (54.4% identity in 114 aa overlap). Warning: note that
+ Rv3914|MT4033|MTV028.05|trxC can be alternatively named
+ trxA. Protein product from Mb1505 detected using SWATH
+ mass spectrometry. Mb1505 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE THIOREDOXIN TRXA"
+ /protein_id="SIU00108.1"
+ /db_xref="GOA:A0A1R3XYG2"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYG2"
+ /translation="MTTRDLTAAYFQQTISANSNVLVYFWAPLCAPCDLFTPTYEASS
+ RKHFDVVHGKVNIETEKDLASIAGVKLLPTLMAFKKGKLVFKQAGIANPAIMDNLVQQ
+ LRAYTFKSPAGEGIGPGTKTSS"
+ gene 1660525..1660896
+ /gene="trxB1"
+ /locus_tag="BQ2027_MB1506"
+ CDS 1660525..1660896
+ /gene="trxB1"
+ /locus_tag="BQ2027_MB1506"
+ /standard_name="trxB"
+ /note="Mb1506, trxB1, len: 123 aa. Equivalent to Rv1471,
+ len: 123 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 123 aa overlap). Probable trxB1,
+ thioredoxin (EC 1.-.-.-), similar to many bacterial
+ thioredoxins e.g. P33636|THI2_ECOLI from Escherichia coli
+ (139 aa), FASTA scores: opt: 290, E(): 1.8e-13, (44.3%
+ identity in 97 aa overlap); etc. Highly similar to
+ Rv1470|TrxA probable thioredoxin from Mycobacterium
+ tuberculosis (124 aa), FASTA scores: opt: 402, E():
+ 1.2e-32, (54.4% identity in 114 aa overlap). Contains
+ PS00194 Thioredoxin family active site. BELONGS TO THE
+ THIOREDOXIN FAMILY. Note that previously known as trxB.
+ Protein product from Mb1506 detected using shotgun mass
+ spectrometry. Mb1506 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE THIOREDOXIN TRXB1"
+ /protein_id="SIU00109.1"
+ /db_xref="GOA:A0A1R3XYF1"
+ /db_xref="InterPro:IPR005746"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR017937"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYF1"
+ /translation="MTTRDLTAAQFNETIQSSDMVLVDYWASWCGPCRAFAPTFAESS
+ EKHPDVVHAKVDTEAERELAAAAQIRSIPTIMAFKNGKLLFNQAGALPPAALESLVQQ
+ LKAYEVEAGEATTQNGRAQQA"
+ gene 1660918..1661775
+ /gene="echA12"
+ /locus_tag="BQ2027_MB1507"
+ CDS 1660918..1661775
+ /gene="echA12"
+ /locus_tag="BQ2027_MB1507"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1507, echA12, len: 285 aa. Equivalent to Rv1472,
+ len: 285 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 285 aa overlap). Possible echA12,
+ enoyl-CoA hydratase (EC 4.2.1.17), highly similar to
+ P53526|ECHH_MYCLE|NP_301896.1|NC_002677 possible enoyl-CoA
+ hydratase/isomerase from Mycobacterium leprae (294 aa),
+ FASTA scores: opt: 1265, E(): 0, (72.0% identity in 271 aa
+ overlap). Also similar to others e.g. CAA66096.1|X97452
+ enoyl-CoA isomerase from Escherichia coli strain K12 (262
+ aa); CAC44593.1|AL596162 putative enoyl-CoA hydratase from
+ Streptomyces coelicolor (275 aa); etc. Also similar to
+ others from Mycobacterium tuberculosis e.g.
+ ECHA16|Rv2831|MTCY16B7.11c (249 aa), FASTA scores: opt:
+ 232, E(): 1.3e-15, (33.8% identity in 204 aa overlap);
+ etc. TBparse score is 0.916. Protein product from Mb1507
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1507 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ENOYL-CoA HYDRATASE ECHA12 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-CoA HYDRATASE) (CROTONASE)"
+ /protein_id="SIU00110.1"
+ /db_xref="GOA:Q7U004"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR014748"
+ /db_xref="InterPro:IPR018376"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/Swiss-Prot:Q7U004"
+ /translation="MPHRCAAQVVAGYRSTVSLVLVEHPRPEIAQITLNRPERMNSMA
+ FDVMVPLKEALAQVSYDNSVRVVVLTGAGRGFSSGADHKSAGVVPHVENLTRPTYALR
+ SMELLDDVILMLRRLHQPVIAAVNGPAIGGGLCLALAADIRVASSSAYFRAAGINNGL
+ TASELGLSYLLPRAIGSSRAFEIMLTGRDVSAEEAERIGLVSRQVPDEQLLDACYAIA
+ ARMAGFSRPGIELTKRTLWSGLDAASLEAHMQAEGLGQLFVRLLTANFEEAVAARAEQ
+ RAPVFTDDT"
+ gene 1661811..1663439
+ /locus_tag="BQ2027_MB1508"
+ CDS 1661811..1663439
+ /locus_tag="BQ2027_MB1508"
+ /note="Mb1508, -, len: 542 aa. Equivalent to Rv1473, len:
+ 542 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 542 aa overlap). Possible
+ macrolide-transport ATP-binding protein ABC transporter
+ (see citation below), possibly in EF-3 subfamily. Similar
+ to many ABC-transporters e.g. D90909_48|YHES_HAEIN from
+ Synechocystis sp. strain PCC6803 (574 aa), FASTA scores:
+ opt: 870, E(): 0, (33.3% identity in 525 aa overlap);
+ P44808|YHES_HAEIN from Haemophilus influenzae (638 aa),
+ FASTA scores: opt: 706, E(): 0, (33.7% identity in 517 aa
+ overlap); etc. Contains two PS00017 ATP/GTP-binding site
+ motif A (P-loop), and two PS00211 ABC transporter family
+ signatures. BELONGS TO THE ATP-BINDING TRANSPORT PROTEIN
+ FAMILY (ABC TRANSPORTERS). Protein product from Mb1508
+ detected using SWATH mass spectrometry. Mb1508 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MACROLIDE-TRANSPORT ATP-BINDING PROTEIN
+ ABC TRANSPORTER"
+ /protein_id="SIU00111.1"
+ /db_xref="GOA:A0A1R3XYF2"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR032781"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYF2"
+ /translation="MITATDLEVRAGARILLAPDGPDLRVQPGDRIGLVGRNGAGKTT
+ TLRILAGEVEPYAGSVTRAGEIGYLPQDPKVGDLDVLARDRVLSARGLDVLLTDLEKQ
+ QALMAEVADEDERDRAIRRYGQLEERFVALGGYGAESEAGRICASLGLPERVLTQRLR
+ TLSGGQRRRVELARILFAASESGAGNSTTLLLDEPTNHLDADSLGWLRDFLRLHTGGL
+ VVISHNVDLVADVVNKVWFLDAVRGQVDVYNMGWQRYVDARATDEQRRIRERANAERK
+ AAALRAQAAKLGAKATKAVAAQNMLRRADRMMAALDEERVADKVARIKFPTPAACGRT
+ PLVANGLGKTYGSLEVFTGVDLAIDRGSRVVILGLNGAGKTTLLRLLAGVEQPDTGVL
+ EPGYGLRIGYFAQEHDTLDNDATVWENVRHAAPDAGEQDLRGLLGAFMFTGPQLEQPA
+ GTLSGGEKTRLALAGLVASTANVLLLDEPTNNLDPASREQVLDALRSYRGAVVLVTHD
+ PGAAAALGPQRVVLLPDGTEDYWSDEYRDLIELA"
+ gene 1663536..1663727
+ /locus_tag="BQ2027_MB1509"
+ CDS 1663536..1663727
+ /locus_tag="BQ2027_MB1509"
+ /note="Mb1509, -, len: 63 aa. Equivalent to Rv1473A, len:
+ 63 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.4% identity in 63 aa overlap). Possible
+ transcriptional regulator, CDS predicted by GC plot.
+ Similar to SCI8.24c|AL132644_24 putative transcriptional
+ regulator from Streptomyces coelicolor (73 aa), FASTA
+ scores: opt: 210, E(): 1.5e-08, (56.15% identity in 57 aa
+ overlap). Protein product from Mb1509 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1509 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00112.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYF8"
+ /translation="MRKSKKTRDQLLRELRNAYEGGASIRNLAATTGRSYGSIHSMLR
+ ESGTTMRGRGGPNRRPRPR"
+ gene complement(1663796..1664359)
+ /locus_tag="BQ2027_MB1510C"
+ CDS complement(1663796..1664359)
+ /locus_tag="BQ2027_MB1510C"
+ /note="Mb1510c, -, len: 187 aa. Equivalent to Rv1474c,
+ len: 187 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 187 aa overlap). Probable transcription
+ regulator, equivalent to AF0021|AF002133_1 transcriptional
+ regulator from Mycobacterium avium strain GIR10 (82 aa),
+ FASTA scores: opt: 490, E(): 6.7e-26, (92.5% identity in
+ 80 aa overlap). Also similar to Q59431|UIDR_ECOLI UID
+ OPERON REPRESSOR (GUS OPERON) from Escherichia coli (196
+ aa), FASTA scores: opt: 192, E(): 5.8e-06, (28.5% identity
+ in 172 aa overlap). BELONGS TO THE TETR/ACRR FAMILY OF
+ TRANSCRIPTIONAL REGULATORS. Helix turn helix motif
+ predicted at aa 33-54 (+3.40 SD). Protein product from
+ Mb1510c detected using SWATH mass spectrometry. Mb1510c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00113.1"
+ /db_xref="GOA:A0A1R3Y0K1"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0K1"
+ /translation="MPKVSEDHLAARRRQILDGARRCFAEYGYDKATVRRLEQAIGMS
+ RGAIFHHFRDKDALFFALAREDTERMAAVASREGLIGVMRDMLAAPDQFDWLATRLEI
+ ARKLRNDPDFSRGWAERSAELAAATTDRLRRQKQANRVRDDVPSDVLRCYLDLVLDGL
+ LARLASGEDPQRLAAVLDLVENSVRRS"
+ gene complement(1664370..1667201)
+ /gene="acn"
+ /locus_tag="BQ2027_MB1511C"
+ CDS complement(1664370..1667201)
+ /gene="acn"
+ /locus_tag="BQ2027_MB1511C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1511c, acn, len: 943 aa. Equivalent to Rv1475c,
+ len: 943 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 943 aa overlap). Probable acn, aconitate
+ hydratase (EC 4.2.1.3), similar to many e.g.
+ P70920|ACON_BRAJA ACONITATE HYDRATASE from Bradyrhizobium
+ japonicum (906 aa), FASTA scores: opt:1912, E(): 0, (54.8%
+ identity in 958 aa overlap); closest to AF0021|AF002133_2
+ Mycobacterium avium strain GIR10 (961 aa), FASTA scores:
+ opt: 5072, E(): 0, (82.8% identity in 943 aa overlap).
+ NOTE ACONITASE HAS AN ACTIVE (4FE-4S) AND AN INACTIVE
+ (3FE-4S) FORMS. THE ACTIVE (4FE-4S) CLUSTER IS PART OF THE
+ CATALYTIC SITE THAT INTERCONVERTS CITRATE, CIS-ACONITASE,
+ AND ISOCITRATE. Protein product from Mb1511c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1511c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable iron-regulated aconitate hydratase acn
+ (citrate hydro-lyase) (aconitase)"
+ /protein_id="SIU00114.1"
+ /db_xref="GOA:A0A1R3XZG0"
+ /db_xref="InterPro:IPR000573"
+ /db_xref="InterPro:IPR001030"
+ /db_xref="InterPro:IPR006249"
+ /db_xref="InterPro:IPR015928"
+ /db_xref="InterPro:IPR018136"
+ /db_xref="InterPro:IPR036008"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZG0"
+ /translation="MTSKSVNSFGAHDTLKVGEKSYQIYRLDAVPNTAKLPYSLKVLA
+ ENLLRNEDGSNITKDHIEAIANWDPKAEPSIEIQYTPARVVMQDFTGVPCIVDLATMR
+ EAIADLGGNPDKVNPLAPADLVIDHSVIADLFGRADAFERNVEIEYQRNGERYQFLRW
+ GQGAFDDFKVVPPGTGIVHQVNIEYLASVVMTRDGVAYPDTCVGTDSHTTMVNGLGVL
+ GWGVGGIEAEAAMLGQPVSMLIPRVVGFRLTGEIQPGVTATDVVLTVTEMLRQHGVVG
+ KFVEFYGEGVAEVPLANRATLGNMSPEFGSTAAIFPIDEETIKYLRFTGRTPEQVALV
+ EAYAKAQGMWHDPKHEPEFSEYLELNLSDVVPSIAGPKRPQDRIALAQAKSTFREQIY
+ HYVGNGSPDSPHDPHSKLDEVVEETFPASDPGQLTFANDDVATDETVHSAAAHADGRV
+ SNPVRVKSDELGEFVLDHGAVVIAAITSCTNTSNPEVMLGAALLARNAVEKGLTSKPW
+ VKTTIAPGSQVVNDYYDRSGLWPYLEKLGFYLVGYGCTTCIGNSGPLPEEISKAVNDN
+ DLSVTAVLSGNRNFEGRINPDVKMNYLASPPLVIAYALAGTMDFDFQTQPLGQDKDGK
+ NVFLRDIWPSQQDVSDTIAAAINQEMFTRNYADVFKGDDRWRNLPTPSGNTFEWDPNS
+ TYVRKPPYFEGMTAKPEPVGNISGARVLALLGDSVTTDHISPAGAIKPGTPAARYLDE
+ HGVDRKDYNSFGSRRGNHEVMIRGTFANIRLRNQLLDDVSGGYTRDFTQPGGPQAFIY
+ DAAQNYAAQHIPLVVFGGKEYGSGSSRDWAAKGTLLLGVRAVIAESFERIHRSNLIGM
+ GVIPLQFPEGKSASSLGLDGTEVFDITGIDVLNDGKTPKTVCVQATKGDGATIEFDAV
+ VRIDTPGEADYYRNGGILQYVLRNILKSG"
+ gene 1667359..1667919
+ /locus_tag="BQ2027_MB1512"
+ CDS 1667359..1667919
+ /locus_tag="BQ2027_MB1512"
+ /note="Mb1512, -, len: 186 aa. Equivalent to Rv1476, len:
+ 186 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 186 aa overlap). Possible membrane
+ protein, TMhelix 138-60. Protein product from Mb1512
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1512 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MEMBRANE PROTEIN"
+ /protein_id="SIU00115.1"
+ /db_xref="GOA:A0A1R3XYG3"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYG3"
+ /translation="MTGPYFPQTIPFLPSYIPQDVDMTAVKAEVAALGVSAPPAATPG
+ LLEVVQHARDEGIDLKIVLLDHNPPNDTPLRDIATVVGADYSDATVLVLSPNYVGSYS
+ TQYPRVTLEAGEDHSKTGNPVQSAQNFVHELSTPEFPWSALTIVLLIGVLAAAVGARL
+ MQLRGRRSATSTDAAPGAGDDLNQGV"
+ gene 1668145..1669563
+ /gene="ripa"
+ /locus_tag="BQ2027_MB1513"
+ CDS 1668145..1669563
+ /gene="ripa"
+ /locus_tag="BQ2027_MB1513"
+ /note="Mb1513, -, len: 472 aa. Equivalent to Rv1477, len:
+ 472 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 472 aa overlap). Hypothetical Invasion
+ protein. Possibly exported protein with unusually long
+ signal sequence. The last 277 residues are nearly
+ identical to those of AF0060|AF006054_1 hypothetical
+ invasion protein INV1 from Mycobacterium tuberculosis (277
+ aa), FASTA scores: opt: 1833, E(): 0, (98.2% identity in
+ 277 aa overlap); also very similar to AF0021|AF002133_4
+ invasin 1 protein from Mycobacterium avium (273 aa), FASTA
+ scores: opt: 1452, E(): 0, (78.1% identity in 279 aa
+ overlap). Similar to Rv1566c|MTCY336.37|Z95586
+ Mycobacterium tuberculosis cosmid (230 aa), FASTA scores:
+ opt: 528, E(): 4.4e-20, (52.0% identity in 150 aa
+ overlap); and weakly similar to p60 proteins of Listeria
+ spp throughout its length e.g. M80351|LISIAPB_1 Listeria
+ monocytogenes iap-related protein (478 aa), FASTA scores:
+ opt: 251, E(): 8e-06, (24.4% identity in 487 aa overlap).
+ C-terminal domain highly similar to next ORF
+ Rv1478|MTV007.25. Mb1513 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="peptidoglycan hydrolase"
+ /protein_id="SIU00116.1"
+ /db_xref="GOA:A0A1R3XYV5"
+ /db_xref="InterPro:IPR000064"
+ /db_xref="InterPro:IPR038765"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYV5"
+ /translation="MRRNRRGSPARPAARFVRPAIPSALSVALLVCTPGLATADPQTD
+ TIAALIADVAKANQRLQDLSDEVQAEQESVNKAMVDVETARDNAAAAEDDLEVSQRAV
+ KDANAAIAAAQHRFDTFAAATYMNGPSVSYLSASSPDEIIATVTAAKTLSASSQAVMA
+ NLQRARTERVNTESAARLAKQKADKAAADAKASQDAAVAALTETRRKFDEQREEVQRL
+ AAERDAAQARLQAARLVAWSSEGGQGAPPFRMWDPGSGPAGGRAWDGLWDPTLPMIPS
+ ANIPGDPIAVVNQVLGISATSAQVTANMGRKFLEQLGILQPTDTGITNAPAGSAQGRI
+ PRVYGRQASEYVIRRGMSQIGVPYSWGGGNAAGPSKGIDSGAGTVGFDCSGLVLYSFA
+ GVGIKLPHYSGSQYNLGRKIPSSQMRRGDVIFYGPNGSQHVTIYLGNGQMLEAPDVGL
+ KVRVAPVRTAGMTPYVVRYIEY"
+ gene 1669574..1670299
+ /locus_tag="BQ2027_MB1514"
+ CDS 1669574..1670299
+ /locus_tag="BQ2027_MB1514"
+ /note="Mb1514, -, len: 241 aa. Equivalent to Rv1478, len:
+ 241 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 241 aa overlap). Hypothetical Invasion
+ protein. Possibly exported protein, nearly identical to
+ AF0060|AF006054_2 hypothetical invasion protein INV2 of M.
+ tuberculosis (240 aa), FASTA scores: opt: 1509, E(): 0,
+ (95.0% identity in 241 aa overlap); very similar to
+ AF0021|AF002133_5 hypothetical invasion protein INV2 from
+ Mycobacterium avium (244 aa), FASTA scores: opt: 1269,
+ E():0, (78.0% identity in 246 aa overlap). Also similar to
+ Mycobacterium tuberculosis protein MTCY336.37 and weakly
+ similar to C-terminal segment of p60 proteins of Listeria
+ spp.e.g. Q01836|P60_LISIN PROTEIN P60 PRECURSOR (481 aa),
+ FASTA scores: opt: 241, E():4e-07, (37.7% identity in 122
+ aa overlap). Highly similar to C-terminal domain of
+ preceeding ORF Rv1477|MTV007.24 (472 aa), FASTA scores:
+ opt: 864, E(): 0, (60.1% identity in 213 aa overlap).
+ Mb1514 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible invasion protein"
+ /protein_id="SIU00117.1"
+ /db_xref="InterPro:IPR000064"
+ /db_xref="InterPro:IPR038765"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYH7"
+ /translation="MRHTRFHPIKLAWITAVVAGLMVGVATPADAEPGQWDPTLPALV
+ SAGAPGDPLAVANASLQATAQATQTTLDLGRQFLGGLGINLGGPAASAPSAATTGASR
+ IPRANARQAVEYVIRRAGSQMGVPYSWGGGSLQGPSKGVDSGANTVGFDCSGLVRYAF
+ AGVGVLIPRFSGDQYNAGRHVPPAEAKRGDLIFYGPGGGQHVTLYLGNGQMLEASGSA
+ GKVTVSPVRKAGMTPFVTRIIEY"
+ gene 1670438..1671571
+ /gene="moxR1"
+ /locus_tag="BQ2027_MB1515"
+ CDS 1670438..1671571
+ /gene="moxR1"
+ /locus_tag="BQ2027_MB1515"
+ /standard_name="moxR"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1515, moxR1, len: 377 aa. Equivalent to Rv1479,
+ len: 377 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 377 aa overlap). Probable moxR1,
+ transcriptional regulatory protein, similar to
+ X96434|BBGIDBMOX_2 moxR regulator from Borrelia
+ burgdorferi (329 aa), FASTA scores: opt: 850, E():0,
+ (43.5% identity in 317 aa overlap); and P. denitrificans.
+ Highly similar to MoxR homologs of Mycobacterium
+ tuberculosis and M. avium (but these both differ at
+ C-terminus) e.g. Rv3692, Rv3164c, and AF0021|AF002133_6
+ Mycobacterium avium strain GIR10 (309 aa), FASTA scores:
+ opt: 1181, E(): 0, (83.7% identity in 227 aa overlap).
+ Also similar to O33173|AF006054 MoxR fragment from
+ Mycobacterium tuberculosis (211 aa), FASTA scores: opt:
+ 1305, E(): 0, (94.3% identity in 212 aa overlap). Note
+ that previously known as moxR. Protein product from Mb1515
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1515 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ MOXR1"
+ /protein_id="SIU00118.1"
+ /db_xref="GOA:A0A1R3XYH3"
+ /db_xref="InterPro:IPR011703"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR041628"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYH3"
+ /translation="MTSAGGFPAGAGGYQTPGGHSASPAHEAPPGGAEGLAAEVHTLE
+ RAIFEVKRIIVGQDQLVERMLVGLLSKGHVLLEGVPGVAKTLAVETFARVVGGTFSRI
+ QFTPDLVPTDIIGTRIYRQGREEFDTELGPVVANFLLADEINRAPAKVQSALLEVMQE
+ RHVSIGGRTFPMPSPFLVMATQNPIEHEGVYPLPEAQRDRFLFKINVGYPSPEEEREI
+ IYRMGVTPPQAKQILSTGDLLRLQEIAANNFVHHALVDYVVRVVFATRKPEQLGMNDV
+ KSWVAFGASPRASLGIIAAARSLALVRGRDYVIPQDVIEVIPDVLRHRLVLTYDALAD
+ EISPEIVINRVLQTVALPQVNAVPQQGHSVPPVMQAAAAASGR"
+ gene 1671568..1672521
+ /locus_tag="BQ2027_MB1516"
+ CDS 1671568..1672521
+ /locus_tag="BQ2027_MB1516"
+ /note="Mb1516, -, len: 317 aa. Equivalent to Rv1480, len:
+ 317 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 317 aa overlap). Conserved hypothetical
+ protein, last 110 aa residues correspond to first 110 aa
+ of YS01_MYCAV|O07394 hypothetical 18.7 KD Mycobacterium
+ avium protein MAV169 (169 aa), FASTA scores: opt: 642,
+ E(): 0, (84.2% identity in 114 aa overlap). Also similar
+ to Mycobacterium tuberculosis hypothetical proteins
+ Rv3163c and Rv3693. Protein product from Mb1516 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1516 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00119.1"
+ /db_xref="InterPro:IPR002881"
+ /db_xref="InterPro:IPR036465"
+ /db_xref="UniProtKB/Swiss-Prot:P64854"
+ /translation="MTESKAPAVVHPPSMLRGDIDDPKLAAALRTLELTVKQKLDGVL
+ HGDHLGLIPGPGSEPGESRLYQPGDDVRRMDWAVTARTTHPHVRQMIADRELETWLVV
+ DMSASLDFGTACCEKRDLAVAAAAAITFLNSGGGNRLGALIANGAAMTRVPARTGRQH
+ QHTMLRTIATMPQAPAGVRGDLAVAIDALRRPERRRGMAVIISDFLGPINWMRPLRAI
+ AARHEVLAIEVLDPRDVELPDVGDVVLQDAESGVVREFSIDPALRDDFARAAAAHRAD
+ VARTIRGCGAPLLSLRTDRDWLADIVRFVASRRRGALAGHQ"
+ gene 1672532..1673539
+ /locus_tag="BQ2027_MB1517"
+ CDS 1672532..1673539
+ /locus_tag="BQ2027_MB1517"
+ /note="Mb1517, -, len: 335 aa. Equivalent to Rv1481, len:
+ 335 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 335 aa overlap). Probable membrane
+ protein, highly similar to YS02_MYCAV|O07395 hypothetical
+ 36.1 kd protein mav335 from M. avium (335 aa), FASTA
+ scores: opt: 1904, E(): 0, (89.0% identity in 337 aa
+ overlap). Similar to AF116251|AF116251_1 BatA protein from
+ Bacteroides fragilis (327 aa), FASTA scores: opt: 317,
+ E(): 2e-12, (26.5% identity in 340 aa overlap). Protein
+ product from Mb1517 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1517 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE PROTEIN"
+ /protein_id="SIU00120.1"
+ /db_xref="GOA:P64856"
+ /db_xref="InterPro:IPR002035"
+ /db_xref="InterPro:IPR022933"
+ /db_xref="InterPro:IPR024163"
+ /db_xref="InterPro:IPR036465"
+ /db_xref="UniProtKB/Swiss-Prot:P64856"
+ /translation="MTLPLLGPMTLSGFAHSWFFLFLFVVAGLVALYILMQLARQRRM
+ LRFANMELLESVAPKRPSRWRHVPAILLVLSLLLFTIAMAGPTHDVRIPRNRAVVMLV
+ IDVSQSMRATDVEPSRMVAAQEAAKQFADELTPGINLGLIAYAGTATVLVSPTTNREA
+ TKNALDKLQFADRTATGEAIFTALQAIATVGAVIGGGDTPPPARIVLFSDGKETMPTN
+ PDNPKGAYTAARTAKDQGVPISTISFGTPYGFVEINDQRQPVPVDDETMKKVAQLSGG
+ NSYNAATLAELRAVYSSLQQQIGYETIKGDASVGWLRLGALALALAALAALLINRRLP
+ T"
+ gene complement(1673612..1674454)
+ /locus_tag="BQ2027_MB1518C"
+ CDS complement(1673612..1674454)
+ /locus_tag="BQ2027_MB1518C"
+ /note="Mb1518c, -, len: 280 aa. Equivalent to Rv1482c,
+ len: 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 280 aa overlap). Conserved hypothetical
+ protein, highly similar to O07396|AF002133 Mycobacterium
+ avium protein MAV346 (346 aa), FASTA scores: E(): 0,
+ (65.2% identity in 342 aa overlap); slight similarity to
+ GRPE_ECOLI|P09372 heat shock protein from E. coli (197
+ aa), FASTA scores: opt: 139, E(): 0.012, (28.3% identity
+ in 159 aa overlap). Similar to Mycobacterium tuberculosis
+ hypothetical proteins Rv3517, Rv3555c, Rv3714c, Rv1073,
+ etc. Start changed since first submission (-59 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00121.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYG0"
+ /translation="MTDPFLGSEALAAGVLTPYELRSRYVALHKDVYVPQGVELTAQL
+ RAKALWLRSRRRGVLAGYSASAFHGAKWIDADLPAAIIDTNRRRAPGLQVWEERIEPD
+ EICVIEGMRVTTPERTALDLTSRFPLDPAVAAVDALIQATDLKVADVEPLIERYRGRR
+ GMKAARAALDLVDGGAQSPKETWLRLLLIRAGFPRPQTQIAVRNEWGWAEAHLDMGWQ
+ DIKVAAEYDGDHHLTSRYHYRKDILRHEKVQHRYGWIVVRVVAEDHPADIIRRVGEAR
+ AFRA"
+ gene 1674595..1675338
+ /gene="fabG1"
+ /locus_tag="BQ2027_MB1519"
+ CDS 1674595..1675338
+ /gene="fabG1"
+ /locus_tag="BQ2027_MB1519"
+ /standard_name="mabA"
+ /note="Mb1519, fabG1, len: 247 aa. Equivalent to Rv1483,
+ len: 247 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 247 aa overlap). Probable fabG1
+ (alternate gene name: mabA), 3-oxoacyl-[acyl-carrier
+ protein] reductase (EC 1.1.1.100), equivalent to
+ O07399|FABG_MYCAV 3-OXOACYL-[ACYL-CARRIER PROTEIN]
+ REDUCTASE from Mycobacterium avium (255 aa);
+ P71534|FABG_MYCSM 3-OXOACYL-[ACYL-CARRIER PROTEIN]
+ REDUCTASE from Mycobacterium smegmatis (255 aa); and
+ NP_302228.1|NC_002677 3-oxoacyl-[ACP] reductase (aka MabA)
+ from Mycobacterium leprae (253 aa). Also highly similar to
+ many e.g. T36779 probable 3-oxacyl-(acyl-carrier-protein)
+ reductase from Streptomyces coelicolor (234 aa);
+ FABG_ECOLI|P25716|NP_415611.1|NC_000913
+ 3-oxoacyl-[acyl-carrier-protein] reductase from
+ Escherichia coli strain K12 (244 aa), FASTA scores: opt:
+ 664, E(): 6.8e-35, (44.4% identity in 241 aa overlap);
+ etc. Contains PS00061 Short-chain
+ dehydrogenases/reductases family signature. BELONGS TO THE
+ SHORT-CHAIN DEHYDROGENASES/REDUCTASES (SDR) FAMILY.
+ Protein product from Mb1519 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1519 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="3-oxoacyl-[acyl-carrier protein] reductase fabg1
+ (3-ketoacyl-acyl carrier protein reductase) (mycolic acid
+ biosynthesis a protein)"
+ /protein_id="SIU00122.1"
+ /db_xref="GOA:P0A5Y5"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Y5"
+ /translation="MTATATEGAKPPFVSRSVLVTGGNRGIGLAIAQRLAADGHKVAV
+ THRGSGAPKGLFGVECDVTDSDAVDRAFTAVEEHQGPVEVLVSNAGLSADAFLMRMTE
+ EKFEKVINANLTGAFRVAQRASRSMQRNKFGRMIFIGSVSGSWGIGNQANYAASKAGV
+ IGMARSIARELSKANVTANVVAPGYIDTDMTRALDERIQQGALQFIPAKRVGTPAEVA
+ GVVSFLASEDASYISGAVIPVDGGMGMGH"
+ gene 1675357..1676166
+ /gene="inhA"
+ /locus_tag="BQ2027_MB1520"
+ CDS 1675357..1676166
+ /gene="inhA"
+ /locus_tag="BQ2027_MB1520"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1520, inhA, len: 269 aa. Equivalent to Rv1484,
+ len: 269 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 269 aa overlap). inhA, NADH-dependent
+ enoyl-[acyl-carrier-protein] reductase (EC 1.3.1.9) (see
+ citations below). Identical to INHA_MYCTU|P46533
+ enoyl-[acyl-carrier-protein] reductase from Mycobacterium
+ tuberculosis and G1155270 Mycobacterium bovis enoyl acp
+ reductase. SOME SIMILARITY TO THE SHORT-CHAIN
+ DEHYDROGENASES/REDUCTASES (SDR) FAMILY. Protein product
+ from Mb1520 detected using shotgun mass spectrometry.
+ Mb1520 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="NADH-DEPENDENT ENOYL-[ACYL-CARRIER-PROTEIN]
+ REDUCTASE INHA (NADH-DEPENDENT ENOYL-ACP REDUCTASE)"
+ /protein_id="SIU00123.1"
+ /db_xref="GOA:P0A5Y7"
+ /db_xref="InterPro:IPR014358"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Y7"
+ /translation="MTGLLDGKRILVSGIITDSSIAFHIARVAQEQGAQLVLTGFDRL
+ RLIQRITDRLPAKAPLLELDVQNEEHLASLAGRVTEAIGAGNKLDGVVHSIGFMPQTG
+ MGINPFFDAPYADVSKGIHISAYSYASMAKALLPIMNPGGSIVGMDFDPSRAMPAYNW
+ MTVAKSALESVNRFVAREAGKYGVRSNLVAAGPIRTLAMSAIVGGALGEEAGAQIQLL
+ EEGWDQRAPIGWNMKDATPVAKTVCALLSDWLPATTGDIIYADGGAHTQLL"
+ gene 1676172..1677206
+ /gene="hemZ"
+ /locus_tag="BQ2027_MB1521"
+ CDS 1676172..1677206
+ /gene="hemZ"
+ /locus_tag="BQ2027_MB1521"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1521, hemZ, len: 344 aa. Equivalent to Rv1485,
+ len: 344 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 344 aa overlap). hemZ, ferrochelatase
+ (EC 4.99.1.1) (see citation below), similar to many e.g.
+ HEMZ_BACSU|P32396 ferrochelatase from Bacillus subtilus
+ (310 aa), FASTA scores: opt:490, E(): 2e-24, (30.2%
+ identity in 295 aa overlap); etc. BELONGS TO THE
+ FERROCHELATASE FAMILY. Protein product from Mb1521
+ detected using SWATH mass spectrometry. Mb1521 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FERROCHELATASE HEMZ (PROTOHEME FERRO-LYASE)
+ (HEME SYNTHETASE)"
+ /protein_id="SIU00124.1"
+ /db_xref="GOA:P0A577"
+ /db_xref="InterPro:IPR001015"
+ /db_xref="InterPro:IPR019772"
+ /db_xref="InterPro:IPR033644"
+ /db_xref="InterPro:IPR033659"
+ /db_xref="UniProtKB/Swiss-Prot:P0A577"
+ /translation="MQFDAVLLLSFGGPEGPEQVRPFLENVTRGRGVPAERLDAVAEH
+ YLHFGGVSPINGINRTLIAELEAQQELPVYFGNRNWEPYVEDAVTAMRDNGVRRAAVF
+ ATSAWSGYSSCTQYVEDIARARRAAGRDAPELVKLRPYFDHPLFVEMFADAITAAAAT
+ VRGDARLVFTAHSIPTAADRRCGPNLYSRQVAYATRLVAAAAGYCDFDLAWQSRSGPP
+ QVPWLEPDVTDQLTGLAGAGINAVIVCPIGFVADHIEVVWDLDHELRLQAEAAGIAYA
+ RASTPNADPRFARLARGLIDELRYGRIPARVSGPDPVPGCLSSINGQPCRPPHCVASV
+ SPARPSAGSP"
+ gene complement(1677172..1678038)
+ /locus_tag="BQ2027_MB1522C"
+ CDS complement(1677172..1678038)
+ /locus_tag="BQ2027_MB1522C"
+ /note="Mb1522c, -, len: 288 aa. Equivalent to Rv1486c,
+ len: 288 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 288 aa overlap). Conserved hypothetical
+ protein, highly similar to YS07_MYCAV|O07402 hypothetical
+ 33.5 kd protein mav321 from Mycobacterium avium (320 aa),
+ FASTA scores: opt: 1217, E(): 0, (71.1% identity in 315 aa
+ overlap). Weak similarity to AL079332|SCI5.07 hypothetical
+ protein from Streptomyces coelicolor (259 aa), FASTA
+ scores: opt: 131, E(): 0.29, (32.3% identity in 279 aa
+ overlap). Start changed since original submission. Protein
+ product from Mb1522c detected using SWATH mass
+ spectrometry. Mb1522c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00125.1"
+ /db_xref="UniProtKB/Swiss-Prot:P59980"
+ /translation="MWCPSVSLSIWANAWLAGKAAPDDVLDALSLWAPTQSVAAYDAV
+ AAGHTGLPWPDVHDAGTVSLLQTLRAAVGRRRLRGTINVVLPVPGDVRGLAAGTQFEH
+ DALAAGEAVIVANPEDPGSAVGLVPEFSYGDVDEAAQSEPLTPELCALSWMVYSLPGA
+ PVLEHYELGDAEYALRSAVRSAAEALSTIGLGSSDVANPRGLVEQLLESSRQHRVPDH
+ APSRALRVLENAAHVDAIIAVSAGLSRLPIGTQSLSDAQRATDALRPLTAVVRSARMS
+ AVTAILHSAWPD"
+ gene 1678096..1678530
+ /locus_tag="BQ2027_MB1523"
+ CDS 1678096..1678530
+ /locus_tag="BQ2027_MB1523"
+ /note="Mb1523, -, len: 144 aa. Equivalent to Rv1487, len:
+ 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 144 aa overlap). Conserved membrane
+ protein. Highly similar to O07404|AF002133 MAV145 from
+ Mycobacterium avium (145 aa), FASTA scores: opt: 667, E():
+ 0, (72.5% identity in 142 aa overlap). Also similar to
+ AL079332|SCI5.05 hypothetical protein from Streptomyces
+ coelicolor (143 aa), FASTA scores: opt: 344, E(): 1.3e-15,
+ (44.8% identity in 134 aa overlap). Protein product from
+ Mb1523 detected using SWATH mass spectrometry. Mb1523
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00126.1"
+ /db_xref="GOA:A0A1R3XYW5"
+ /db_xref="InterPro:IPR002810"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYW5"
+ /translation="MPVALIWLIAALVLVGAEALTGDMFLLMLGGGALAASVSSWLLA
+ WPMWADGAVFLLVSVLLLVLVRPAVRRRLTQTKGVQLGIEALEGKKAVVLGRVARDGG
+ QVKLDGQVWTARPLNDGDVFEPGDSVTVVQIDGATAVVFKDV"
+ gene 1678552..1679697
+ /locus_tag="BQ2027_MB1524"
+ CDS 1678552..1679697
+ /locus_tag="BQ2027_MB1524"
+ /note="Mb1524, -, len: 381 aa. Equivalent to Rv1488, len:
+ 381 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 381 aa overlap). Possible exported
+ conserved protein; contains possible N-terminal signal
+ sequence. Similar to YBBK_ECOLI|P77367 hypothetical
+ protein ybbK from Escherichia coli (305 aa), FASTA scores:
+ opt: 716, E(): 0, (37.1% identity in 307 aa overlap).
+ Similar to stomatin-like proteins e.g. AF065260|AF065260_1
+ Clostridium difficile (320 aa), FASTA scores: opt: 767,
+ E(): 0, (42.3% identity in 307 aa overlap). Protein
+ product from Mb1524 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1524 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein QmcA (possibly involved in integral
+ membrane quality control)"
+ /protein_id="SIU00127.1"
+ /db_xref="GOA:P63694"
+ /db_xref="InterPro:IPR001107"
+ /db_xref="InterPro:IPR001972"
+ /db_xref="InterPro:IPR018080"
+ /db_xref="InterPro:IPR036013"
+ /db_xref="UniProtKB/Swiss-Prot:P63694"
+ /translation="MQGAVAGLVFLAVLVIFAIIVVAKSVALIPQAEAAVIERLGRYS
+ RTVSGQLTLLVPFIDRVRARVDLRERVVSFPPQPVITEDNLTLNIDTVVYFQVTVPQA
+ AVYEISNYIVGVEQLTTTTLRNVVGGMTLEQTLTSRDQINAQLRGVLDEATGRWGLRV
+ ARVELRSIDPPPSIQASMEKQMKADREKRAMILTAEGTREAAIKQAEGQKQAQILAAE
+ GAKQAAILAAEADRQSRMLRAQGERAAAYLQAQGQAKAIEKTFAAIKAGRPTPEMLAY
+ QYLQTLPEMARGDANKVWVVPSDFNAALQGFTRLLGKPGEDGVFRFEPSPVEDQPKHA
+ ADGDDAEVAGWFSTDTDPSIARAVATAEAIARKPVEGSLGTPPRLTQ"
+ gene 1679707..1680063
+ /locus_tag="BQ2027_MB1525"
+ CDS 1679707..1680063
+ /locus_tag="BQ2027_MB1525"
+ /note="Mb1525, -, len: 118 aa. Equivalent to Rv1489, len:
+ 118 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 118 aa overlap). Conserved hypothetical
+ protein, similar to hypothetical proteins from
+ Mycobacterium avium subsp. paratuberculosis and
+ Streptomyces coelicolor e.g. AJ250017_1 insertion sequence
+ IS900, Locus 3, putative invasion protein from M.
+ paratuberculosis (138 aa), FASTA scores: opt: 120, E():
+ 0.26, (34.375% identity in 96 aa overlap);
+ SCD6.11c|AL353815_11 possible integral membrane protein
+ from Streptomyces coelicolor (136 aa), FASTA scores: opt:
+ 106, E(): 2.2, (35.9% identity in 103 aa overlap). ORF
+ predicted by GC plot. Replaces previous Rv1489c on other
+ strand. Protein product from Mb1525 detected using shotgun
+ mass spectrometry. Mb1525 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00128.1"
+ /db_xref="GOA:A0A1R3XYI2"
+ /db_xref="InterPro:IPR032808"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYI2"
+ /translation="MSGLTSPKTYAVLAALQAGDAVACAIPLPPIARLLDDLDVPVSV
+ RPVLPVVKAASAVGLLSVTRFPALARLTTAMLTLYFILAVGAHVRVRDRVVNAIPAAS
+ FLTLFALMTAKGPERT"
+ gene 1680097..1680327
+ /locus_tag="BQ2027_MB1526"
+ CDS 1680097..1680327
+ /locus_tag="BQ2027_MB1526"
+ /EC_number="5.4.99.2"
+ /note="Mb1526, -, len: 76 aa. Equivalent to Rv1489A, len:
+ 76 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 76 aa overlap). Conserved hypothetical
+ protein, similar to part of alpha subunit of many
+ methylmalonyl-CoA mutases (~750 aa). Size difference
+ suggests possible gene fragment although Mycobacterium
+ tuberculosis has intact methylmalonyl-CoA mutase gene.
+ P71774|MUTB_MYCTU PROBABLE METHYLMALONYL-COA MUTASE from
+ Mycobacterium tuberculosis (750 aa), FASTA scores: opt:
+ 258, E(): 3.2e-10, (73.35% identity in 60 aa overlap). ORF
+ predicted by GC plot. Mb1526 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Methylmalonyl-CoA mutase large subunit, MutB
+ (EC"
+ /protein_id="SIU00129.1"
+ /db_xref="GOA:A0A1R3XYH1"
+ /db_xref="InterPro:IPR006099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYH1"
+ /translation="MSVGEVEVLKVENSRVRAEQLAKLYELRSSRDRVRVDAALAELS
+ RAAAARGCAGTSGLGNNLMAPGPPHSLLGRDR"
+ gene 1680477..1681784
+ /locus_tag="BQ2027_MB1527"
+ CDS 1680477..1681784
+ /locus_tag="BQ2027_MB1527"
+ /note="Mb1527, -, len: 435 aa. Equivalent to Rv1490, len:
+ 435 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 435 aa overlap). Probable membrane
+ protein. Protein product from Mb1527 detected using SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE PROTEIN"
+ /protein_id="SIU00130.1"
+ /db_xref="GOA:P64858"
+ /db_xref="UniProtKB/Swiss-Prot:P64858"
+ /translation="MSQCFAVKGIGGADQATLGSAEILVKYAQLADKRARVYVLVSTW
+ LVVWGIWHVYFVEAVFPNAILWLHYYAASYEFGFVRRGLGGELIRMLTGDHFFAGAYT
+ VLWTSITVWLIALAVVVWLILSTGNRSERRIMLALLVPVLPFAFSYAIYNPHPELFGM
+ TALVAFSIFLTRAHTSRTRVILSTLYGLTMAVLALIHEAIPLEFALGAVLAIIVLSKN
+ ATGATRRICTALAIGPGTVSVLLLAVVGRRDIADQLCAHIPHGMVENPWAVATTPQRV
+ LDYIFGRVESHADYHDWVCEHVTPWFNLDWITSAKLVAVVGFRALFGAFLLGLLFFVA
+ TTSMIRYVSAVPVRTFFAELRGNLALPVLASALLVPLFITAVDWTRWWVMITLDVAIV
+ YILYAIDRPEIEQPPSRRNVQVFVCVVLVLAVIPTGSANNIGR"
+ gene complement(1682363..1683121)
+ /locus_tag="BQ2027_MB1528C"
+ CDS complement(1682363..1683121)
+ /locus_tag="BQ2027_MB1528C"
+ /note="Mb1528c, -, len: 252 aa. Equivalent to Rv1491c,
+ len: 252 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 252 aa overlap). Conserved membrane
+ protein. Similar to hypothetical proteins from many
+ organisms e.g. YDJZ_ECOLI|P76221 Escherichia coli (235
+ aa), FASTA scores: opt: 223, E():6.7e-07, (31.7% identity
+ in 145 aa overlap); AL133252|SCE46.15 Streptomyces
+ coelicolor (249 aa), FASTA scores: opt: 378, E(): 1.5e-17,
+ (39.1% identity in 169 aa overlap). Also similar to M.
+ tuberculosis hypothetical protein Rv0625c. Mb1528c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00131.1"
+ /db_xref="GOA:P67118"
+ /db_xref="InterPro:IPR015414"
+ /db_xref="InterPro:IPR032816"
+ /db_xref="UniProtKB/Swiss-Prot:P67118"
+ /translation="MTAPAICNTTETVHGIATSLGAVARQASLPRIVGTVVGITVLVV
+ VALLVPVPTAVELRDWAKSLGAWFPLAFLLVHTVVTVPPFPRTAFTLAAGLLFGSVVG
+ VFIAVVGSTASAVIAMLLVRATGWQLNSLVRRRAINRLDERLRERGWLAILSLRLIPV
+ VPFAAINYAAGASGVRILSFAWATLAGLLPGTAAVVILGDAFAGSGSPLLILVSVCTG
+ ALGLTGLVYEIRNYRRQHRRMPGYDDPVREPALI"
+ gene 1683312..1685159
+ /gene="mutA"
+ /locus_tag="BQ2027_MB1529"
+ CDS 1683312..1685159
+ /gene="mutA"
+ /locus_tag="BQ2027_MB1529"
+ /note="Mb1529, mutA, len: 615 aa. Equivalent to Rv1492,
+ len: 615 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 615 aa overlap). Probable mutA,
+ Methylmalonyl-coa mutase small-subunit (EC 5.4.99.2),
+ strong similarity to e.g. MUTA_STRCM|Q05064
+ methylmalonyl-coa mutase beta-subunit from Streptomyces
+ cinnamonensis (616 aa), FASTA scores: opt: 1512, E(): 0,
+ (45.9% identity in 628 aa overlap). Contains PS00213
+ Lipocalin signature, PS00544 Methylmalonyl-CoA mutase
+ signature. BELONGS TO THE METHYLMALONYL-COA MUTASE FAMILY.
+ Protein product from Mb1529 detected using shotgun mass
+ spectrometry. Mb1529 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METHYLMALONYL-COA MUTASE SMALL SUBUNIT
+ MUTA (MCM)"
+ /protein_id="SIU00132.1"
+ /db_xref="GOA:P65486"
+ /db_xref="InterPro:IPR004608"
+ /db_xref="InterPro:IPR006099"
+ /db_xref="InterPro:IPR016176"
+ /db_xref="InterPro:IPR036724"
+ /db_xref="UniProtKB/Swiss-Prot:P65486"
+ /translation="MSIDVPERADLEQVRGRWRNAVAGVLSKSNRTDSAQLGDHPERL
+ LDTQTADGFAIRALYTAFDELPEPPLPGQWPFVRGGDPLRDVHSGWKVAEAFPANGAT
+ ADTNAAVLAALGEGVSALLIRVGESGVAPDRLTALLSGVYLNLAPVILDAGADYRPAC
+ DVMLALVAQLDPGQRDTLSIDLGADPLTASLRDRPAPPIEEVVAVASRAAGERGLRAI
+ TVDGPAFHNLGATAATELAATVAAAVAYLRVLTESGLVVSDALRQISFRLAADDDQFM
+ TLAKMRALRQLWARVAEVVGDPGGGAAVVHAETSLPMMTQRDPWVNMLRCTLAAFGAG
+ VGGADTVLVHPFDVAIPGGFPGTAAGFARRIARNTQLLLLEESHVGRVLDPAGGSWFV
+ EELTDRLARRAWQRFQAIEARGGFVEAHDFLAGQIAECAARRADDIAHRRLAITGVNE
+ YPNLGEPALPPGDPTSPVRRYAAGFEALRDRSDHHLARTGARPRVLLLPLGPLAEHNI
+ RTTFATNLLASGGIEAIDPGTVDAGTVGNAVADAGSPSVAVICGTDARYRDEVADIVQ
+ AARAAGVSRVYLAGPEKALGDAAHRPDEFLTAKINVVQALSNLLTRLGA"
+ gene 1685160..1687412
+ /gene="mutB"
+ /locus_tag="BQ2027_MB1530"
+ CDS 1685160..1687412
+ /gene="mutB"
+ /locus_tag="BQ2027_MB1530"
+ /note="Mb1530, mutB, len: 750 aa. Equivalent to Rv1493,
+ len: 750 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 750 aa overlap). Probable mutB,
+ Methylmalonyl-coa mutase large-subunit (EC 5.4.99.2),
+ strong similarity to e.g. MUTB_STRCM|Q05065
+ methylmalonyl-coa mutase alpha-subunit from Streptomyces
+ cinnamonensis (733 aa), FASTA scores: opt: 3562, E(): 0,
+ (75.8% identity in 730 aa overlap). Contains PS00544
+ Methylmalonyl-CoA mutase signature. BELONGS TO THE
+ METHYLMALONYL-COA MUTASE FAMILY. Protein product from
+ Mb1530 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1530 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METHYLMALONYL-COA MUTASE LARGE SUBUNIT
+ MUTB (MCM)"
+ /protein_id="SIU00133.1"
+ /db_xref="GOA:P65488"
+ /db_xref="InterPro:IPR006098"
+ /db_xref="InterPro:IPR006099"
+ /db_xref="InterPro:IPR006158"
+ /db_xref="InterPro:IPR006159"
+ /db_xref="InterPro:IPR016176"
+ /db_xref="InterPro:IPR036724"
+ /db_xref="UniProtKB/Swiss-Prot:P65488"
+ /translation="MTTKTPVIGSFAGVPLHSERAAQSPTEAAVHTHVAAAAAAHGYT
+ PEQLVWHTPEGIDVTPVYIAADRAAAEAEGYPLHSFPGEPPFVRGPYPTMYVNQPWTI
+ RQYAGFSTAADSNAFYRRNLAAGQKGLSVAFDLATHRGYDSDHPRVQGDVGMAGVAID
+ SILDMRQLFDGIDLSTVSVSMTMNGAVLPILALYVVAAEEQGVAPEQLAGTIQNDILK
+ EFMVRNTYIYPPKPSMRIISDIFAYTSAKMPKFNSISISGYHIQEAGATADLELAYTL
+ ADGVDYIRAGLNAGLDIDSFAPRLSFFWGIGMNFFMEVAKLRAGRLLWSELVAQFAPK
+ SAKSLSLRTHSQTSGWSLTAQDVFNNVARTCIEAMAATQGHTQSLHTNALDEALALPT
+ DFSARIARNTQLVLQQESGTTRPIDPWGGSYYVEWLTHRLARRARAHIAEVAEHGGMA
+ QAISDGIPKLRIEEAAARTQARIDSGQQPVVGVNKYQVPEDHEIEVLKVENSRVRAEQ
+ LAKLQRLRAGRDEPAVRAALAELTRAAAEQGRAGADGLGNNLLALAIDAARAQATVGE
+ ISEALEKVYGRHRAEIRTISGVYRDEVGKAPNIAAATELVEKFAEADGRRPRILIAKM
+ GQDGHDRGQKVIATAFADIGFDVDVGSLFSTPEEVARQAADNDVHVIGVSSLAAGHLT
+ LVPALRDALAQVGRPDIMIVVGGVIPPGDFDELYAAGATAIFPPGTVIADAAIDLLHR
+ LAERLGYTLD"
+ gene 1687426..1687728
+ /gene="maze4"
+ /locus_tag="BQ2027_MB1531"
+ CDS 1687426..1687728
+ /gene="maze4"
+ /locus_tag="BQ2027_MB1531"
+ /note="Mb1531, -, len: 100 aa. Equivalent to Rv1494, len:
+ 100 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 100 aa overlap). Hypothetical unknown
+ protein. Mb1531 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin maze4"
+ /protein_id="SIU00134.1"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5F0"
+ /translation="MPFLVALSGIISGVRDHSMTVRLDQQTRQRLQDIVKGGYRSANA
+ AIVDAINKRWEALHDEQLDAAYAAAIHDNPAYPYESEAERSAARARRNARQQRSAQ"
+ gene 1687725..1688042
+ /gene="mazf4"
+ /locus_tag="BQ2027_MB1532"
+ CDS 1687725..1688042
+ /gene="mazf4"
+ /locus_tag="BQ2027_MB1532"
+ /note="Mb1532, -, len: 105 aa. Equivalent to Rv1495, len:
+ 105 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 105 aa overlap). Conserved hypothetical
+ protein, some similarity to Rv1942c|MTCY09F9.22
+ hypothetical protein from Mycobacterium tuberculosis (109
+ aa) (0.7% identity in 101 aa overlap) and Rv0659c,
+ Rv1102c. Protein product from Mb1532 detected using
+ shotgun mass spectrometry. Mb1532 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin mazf4"
+ /protein_id="SIU00135.1"
+ /db_xref="GOA:P64860"
+ /db_xref="InterPro:IPR003477"
+ /db_xref="InterPro:IPR011067"
+ /db_xref="UniProtKB/Swiss-Prot:P64860"
+ /translation="MNAPLRGQVYRCDLGYGAKPWLIVSNNARNRHTADVVAVRLTTT
+ RRTIPTWVAMGPSDPLTGYVNADNIETLGKDELGDYLGEVTPATMNKINTALATALGL
+ PWP"
+ gene 1688039..1689043
+ /locus_tag="BQ2027_MB1533"
+ CDS 1688039..1689043
+ /locus_tag="BQ2027_MB1533"
+ /note="Mb1533, -, len: 334 aa. Equivalent to Rv1496, len:
+ 334 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 334 aa overlap). Possible transport
+ system kinase (EC 2.7.-.-). Equivalent to
+ NP_302220.1|NC_002677 putative kinase from Mycobacterium
+ leprae (327 aa). Highly similar to several transport
+ system kinases and NTPase transporters e.g.
+ P27254|ARGK_ECOLI|B2918 LAO/AO transport system kinase (EC
+ 2.7.-.-) from Escherichia coli K12 (331 aa) (see citation
+ below); NP_311815.1|NC_002695 ATPase component of two
+ convergent arginine transporter from Escherichia coli
+ O157:H7 (331 aa); etc. Also similar to YPLE_CAUCR|P37895
+ hypothetical 34.6 kd protein in Caulobacter crescentus
+ (326 aa), FASTA scores, opt: 1125, E(): 0, (55.7% identity
+ in 316 aa overlap). Protein product from Mb1533 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1533 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible transport system kinase"
+ /protein_id="SIU00136.1"
+ /db_xref="GOA:P63578"
+ /db_xref="InterPro:IPR005129"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P63578"
+ /translation="MMAASHDDDTVDGLATAVRGGDRAALPRAITLVESTRPDHREQA
+ QQLLLRLLPDSGNAHRVGITGVPGVGKSTAIEALGMHLIERGHRVAVLAVDPSSTRTG
+ GSILGDKTRMARLAVHPNAYIRPSPTSGTLGGVTRATRETVVLLEAAGFDVILIETVG
+ VGQSEVAVANMVDTFVLLTLARTGDQLQGIKKGVLELADIVVVNKADGEHHKEARLAA
+ RELSAAIRLIYPREALWRPPVLTMSAVEGRGLAELWDTVERHRQVLTGAGEFDARRRD
+ QQVDWTWQLVRDAVLDRVWSNPTVRKVRSELERRVRAGELTPALAAQQILEIANLTDR
+ "
+ gene 1689096..1690385
+ /gene="lipL"
+ /locus_tag="BQ2027_MB1534"
+ CDS 1689096..1690385
+ /gene="lipL"
+ /locus_tag="BQ2027_MB1534"
+ /note="Mb1534, lipL, len: 429 aa. Equivalent to Rv1497,
+ len: 429 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 429 aa overlap). Probable LipL, esterase
+ (EC 3.1.-.-), very similar to Mycobacterium tuberculosis
+ hypothetical esterases and penicillin binding proteins
+ e.g. Rv1923, Rv2463, Rv3775, etc. Also similar to
+ G151214|M68491 esterase estA from Pseudomonas sp (389 aa),
+ FASTA scores: opt: 604, E(): 1e-31, (34.4% identity in 389
+ aa overlap). Protein product from Mb1534 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1534 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ESTERASE LIPL"
+ /protein_id="SIU00137.1"
+ /db_xref="InterPro:IPR001466"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ7"
+ /translation="MMVDTGVDHRAVSSHDGPDAGRRVFGAADPRFACVVRAFASMFP
+ GRRFGGGALAVYLDGQPVVDVWKGWADRAGWVPWSADSAPMVFSATKGMTATVIHRLA
+ DRGLIDYEAPVAEYWPAFGANGKATLTVRDVMRHQAGLSGLRGATQQDLLDHVVMEER
+ LAAAVPGRLLGKSAYHALTFGWLMSGLARAVTGKDMRLLFREELAEPLDTDGLHLGRP
+ PADAPTRVAEIIMPQDIAANAVLTCAMRRLAHRFSGGFRSMYFPGAIAAVQGEAPLLD
+ AEIPAANGVATARALARMYGAIANGGEIDGIRFLSRELVTGLTRNRRQVLPDRNLLVP
+ LNFHLGYHGMPIGNVMPGFGHVGLGGSIGWTDPETGVAFALVHNRLLSPLVMTDHAGF
+ VGIYHLIRQAAAQARKRGYQPVTPFGAPYSEPGAAAG"
+ gene complement(1690458..1691231)
+ /locus_tag="BQ2027_MB1535C"
+ CDS complement(1690458..1691231)
+ /locus_tag="BQ2027_MB1535C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1535c, -, len: 205 aa. Equivalent to Rv1498c,
+ len: 205 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 205 aa overlap). Probable
+ methyltransferase (EC 2.1.1.-). Similar to
+ G2792343|AF040571 METHYLTRANSFERASE from AMYCOLATOPSIS
+ MEDITERRANEI (272 aa), FASTA scores: E(): 5.1e-11, (32.3%
+ identity in 124 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A. Protein product from Mb1535c
+ detected using SWATH mass spectrometry. Mb1535c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METHYLTRANSFERASE"
+ /protein_id="SIU00138.1"
+ /db_xref="GOA:A0A1R3XYJ0"
+ /db_xref="InterPro:IPR013216"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ0"
+ /translation="MTRSKRGSADGGSAEALPPKSLRQFVGGAYKEVGAEFVGYLVDL
+ CGLQPDEAVLDVGCGSGRMALPLTGYLNSEGRYAGFDISQKAIAWCQEHITSAHPNFQ
+ FEVSDIYNSLYNPKGKYQSLDFRFPYPDASFDVVFLTSVFTHMFPPDVEHYLDEISRV
+ LKPGGRCLCTYFLLNDESLAHIAEGKSAHNFQHEGPGYRTIHKKRPEEAIGLPETFVR
+ DVYGKFGLAVHEPLHYGSWSGREPHLSFQDIVIATKTAS"
+ gene complement(1691289..1691480)
+ /locus_tag="BQ2027_MB1536C"
+ CDS complement(1691289..1691480)
+ /locus_tag="BQ2027_MB1536C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1536c, -, len: 63 aa. Equivalent to Rv1498A, len:
+ 70 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 63 aa overlap). Conserved hypothetical
+ protein, highly similar to other hypothetical proteins
+ e.g. from Streptomyces coelicolor, Sinorhizobium meliloti
+ and Pseudomonas aeruginosa. REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium bovis, a single base transition (a-g) at
+ the 5' start leads to a shorter product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (63 aa
+ versus 70 aa). Protein product from Mb1536c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1536c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Dodecin, a flavin storage/sequestration protein"
+ /protein_id="SIU00139.1"
+ /db_xref="InterPro:IPR009923"
+ /db_xref="InterPro:IPR025543"
+ /db_xref="InterPro:IPR036694"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYI0"
+ /translation="MIEIVGTSPDGVDAAIQGGLARAAQTMRALDWFEVQSIRGHLVD
+ GAVAHFQVTMKVGFRLEDS"
+ gene 1691562..1691960
+ /locus_tag="BQ2027_MB1537"
+ CDS 1691562..1691960
+ /locus_tag="BQ2027_MB1537"
+ /note="Mb1537, -, len: 132 aa. Equivalent to Rv1499, len:
+ 132 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 132 aa overlap). Hypothetical unknown
+ protein, was initially longer but has been shortened owing
+ to overlap with Rv1498A."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00140.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ5"
+ /translation="MPSGEPSTAGHFEHLPRGSFGRILSVLNAAADHHPRELLVVGIA
+ TFDQKRPAVGVDEHDPGGAATPAVVINYESRSSAGGTIGHSTTSQVACCLYQQPKRPA
+ LRPTKAAATTAATTWIERVQNRRGRHSALV"
+ gene 1692005..1693033
+ /locus_tag="BQ2027_MB1538"
+ CDS 1692005..1693033
+ /locus_tag="BQ2027_MB1538"
+ /note="Mb1538, -, len: 342 aa. Equivalent to Rv1500, len:
+ 342 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 342 aa overlap). Probable
+ glycosyltransferase (EC 2.-.-.-), hydrophobic domain near
+ C-terminus. Some similarity to putative
+ glycosyl-transferases from Bacillus subtilis e.g.
+ O34319|YKCC_BACSU (323 aa), opt: 490, E(): 6.1e-25,
+ (28.85% identity in 312 aa overlap) and to N-acetyl
+ glucosamine transferases. Also similar to G1001347
+ hypothetical 36.7 kDa protein (318 aa), FASTA scores: opt:
+ 523, E(): 7.2e-26, (30.6% identity in 307 aa overlap).
+ Protein product from Mb1538 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1538 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLYCOSYLTRANSFERASE"
+ /protein_id="SIU00141.1"
+ /db_xref="GOA:A0A1R3XYH5"
+ /db_xref="InterPro:IPR001173"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYH5"
+ /translation="MRLSIVTTMYMSEPYVLEFYRRARAAADKITPDVEIIFVDDGSP
+ DAALQQAVSLLDSDPCVRVIQLSRNFGHHKAMMTGLAHATGDLVFLIDSDLEEDPALL
+ EPFYEKLISTGADVVFGCHARRPGGWLRNFGPKIHYRASALLCDPPLHENTLTVRLMT
+ ADYVRSLVQHQERELSIAGLWQITGFYQVPMSVNKAWKGTTTYTFRRKVATLVDNVTS
+ FSNKPLVFIFYLGAAIFIISSSAAGYLIIDRIFFRALQAGWASVIVSIWMLGGVTIFC
+ IGLVGIYVSKVFIETKQRPYTIIRRIYGSDLTTREPSSLKTAFPAAHLSNGKRVTSEP
+ EGLATGNR"
+ gene 1693045..1693866
+ /locus_tag="BQ2027_MB1539"
+ CDS 1693045..1693866
+ /locus_tag="BQ2027_MB1539"
+ /note="Mb1539, -, len: 273 aa. Equivalent to Rv1501, len:
+ 273 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 273 aa overlap). Conserved hypothetical
+ protein, some similarity to O06374|Rv3633|MTCY15C10.19C
+ hypothetical protein from Mycobacterium tuberculosis,
+ FASTA scores: E(): 3.9e-10, (27.5% identity in 280 aa
+ overlap). Protein product from Mb1539 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1539 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein involved in biosynthesis of mitomycin
+ antibiotics/polyketide fumonisin"
+ /protein_id="SIU00142.1"
+ /db_xref="InterPro:IPR008775"
+ /db_xref="UniProtKB/Swiss-Prot:P67771"
+ /translation="MIPVKVENNTSLDQVQDALNCVGYAVVEDVLDEASLAATRDRMY
+ RVQERILTEIGKERLARAGELGVLRLMMKYDPHFFTFLEIPEVLSIVDRVLSETAILH
+ LQNGFILPSFPPFSTPDVFQNAFHQDFPRVLSGYIASVNIMFAIDPFTRDTGATLVVP
+ GSHQRIEKPDHTYLARNAVPVQCAAGSLFVFDSTLWHAAGRNTSGKDRLAINHQFTRS
+ FFKQQIDYVRALGDAVVLEQPARTQQLLGWYSRVVTNLDEYYQPPDKRLYRKGQG"
+ gene 1694079..1694429
+ /locus_tag="BQ2027_MB1540"
+ CDS 1694079..1694429
+ /locus_tag="BQ2027_MB1540"
+ /note="Mb1540, -, len: 116 aa. Equivalent to the 5' end of
+ Rv1502, len: 299 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (94.7% identity in 114 aa overlap).
+ Hypothetical unknown protein.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1502 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (t-*), splits Rv1502 into 2 parts, Mb1540 and
+ Mb1541. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1502 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (t-*), splits Rv1502 into 2 parts, Mb1540 and
+ Mb1541. Mb1540 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN [FIRST PART]"
+ /protein_id="SIU00143.1"
+ /db_xref="InterPro:IPR023296"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Q2"
+ /translation="MAWRKLGRIFAPSGELDWSRSHAALPVPEWIEGDIFRIYFSGRD
+ GQNRSSIGSVIVDLAVGGKILDIPAEPILRPGARGMFDDCGVSIGSIVRAGDTRLLYY
+ TGWNSLSPCPGKTP"
+ gene 1694432..1694977
+ /locus_tag="BQ2027_MB1541"
+ CDS 1694432..1694977
+ /locus_tag="BQ2027_MB1541"
+ /note="Mb1541, -, len: 189 aa. Equivalent to the 3' end of
+ Rv1502, len: 299 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.5% identity in 189 aa overlap).
+ Hypothetical unknown protein. Protein product from Mb1541
+ detected using SWATH mass spectrometry. Mb1541 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN [SECOND PART]"
+ /protein_id="SIU00144.1"
+ /db_xref="InterPro:IPR023296"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZI4"
+ /translation="MAISEAGAPFERWSTFPVVALDERDPFSLSYPWVIQDGGTYRMW
+ YGSNLGWGEGTDEIPHVIRYAQSRDGVHWEKQDRVHIDTSGSDNSAACRPCVVRDAGV
+ YRMWFCARGAKYRIYCATSEDGLTWRQLGKDEGIDVSPDSWDSDMIEYPCVFDHRGQR
+ FMLYSGDGYGRTGFGLAVLEN"
+ gene complement(1695150..1696298)
+ /locus_tag="BQ2027_MB1542C"
+ CDS complement(1695150..1696298)
+ /locus_tag="BQ2027_MB1542C"
+ /EC_number="2.6.1.59"
+ /note="Mb1542c, -, len: 382 aa. Equivalent to Rv1503c and
+ Rv1504c, len: 182 aa and 199 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (99.5% identity in 182 aa
+ overlap and 100% identity in 199 aa overlap). Conserved
+ hypothetical protein, similar to C-terminal region of
+ P27833|RFFA_ECOLI LIPOPOLYSACCHARIDE BIOSYNTHESIS PROTEIN
+ from Escherichia coli (376 aa), FASTA scores: opt: 565,
+ E(): 0, (49.4% identity in 170 aa overlap) and similar to
+ N-terminal region of P27833|RFFA_ECOLI LIPOPOLYSACCHARIDE
+ BIOSYNTHESIS PROTEIN from Escherichia coli (376 aa), FASTA
+ scores: opt: 863, E(): 0, (68.0% identity in 194 aa
+ overlap); Rv1503c and Rv1504c are both similar to
+ RFFA_ECOLI but are separated by a stop codon, sequence
+ appears to be correct so possible pseudogene.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1503c and Rv1504c exist as 2
+ genes. In Mycobacterium bovis, a single base transversion
+ (t-g) leads to a single product. Mb1542c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="dTDP-4-amino-4,6-dideoxygalactose transaminase
+ (EC"
+ /protein_id="SIU00145.1"
+ /db_xref="GOA:A0A1R3XYJ3"
+ /db_xref="InterPro:IPR000653"
+ /db_xref="InterPro:IPR012749"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ3"
+ /translation="MSDHKVPFNRPYMTGRELAYIAEAHSCGHLAGDGPFTRRSHAWL
+ EQQTGCRKALLTPSCTAALEMMALLLDIEEGDEVILPSYTFVSTANAFVLRGGVPVFV
+ DIRPDTLNIDETRIVDAITPRTKAIVPVHYAGVACEMDAIMKIATHHNLAVVEDAAQG
+ AMASYRGRALGSIGDLGALSFHETKNVISGEGGALLVNSEDFLLRAEILREKGTNRSR
+ FLRNEVDKYTWQDKGSSYLPSELVAAFLWAQFEEAERITRIRLDLWNRYHESFESLEQ
+ RGLLRRPIIPQGCSHNAHMYYVLLAPSADREEVLARLTSKGIGAVFHYVPLHDSPAGR
+ RYGRTNGNLTVTNDVASRLIRLPMWVGLQEVDQSRVVEALTRILTLRA"
+ gene complement(1696435..1697100)
+ /locus_tag="BQ2027_MB1543C"
+ CDS complement(1696435..1697100)
+ /locus_tag="BQ2027_MB1543C"
+ /note="Mb1543c, -, len: 221 aa. Equivalent to Rv1505c,
+ len: 221 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 221 aa overlap). Conserved hypothetical
+ protein, some similarity to hypothetical proteins and
+ glycosylases e.g. P71063|O08181 HYPOTHETICAL 22.5 KD
+ PROTEIN YVFD from Bacillus subtilis (216 aa), FASTA
+ scores: E(): 2.4e-08, (25.5% identity in 196 aa overlap).
+ Protein product from Mb1543c detected using shotgun mass
+ spectrometry. Mb1543c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative transferase"
+ /protein_id="SIU00146.1"
+ /db_xref="InterPro:IPR001451"
+ /db_xref="InterPro:IPR011004"
+ /db_xref="InterPro:IPR020019"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYY4"
+ /translation="MTKPLVIFGSGDIAQLAHYYFTRDSEYEVVAFTVDRDYASVSEF
+ CGLPLVAFDEVAQRFPPESHAMFVALAYAKLNGVRKEKYLAAKALGYELASYVSSHAT
+ VLNDGRIGENVFLLEDNTIQPFVSIGNNVTLWSGNHIGHHSTIHDHCFLASHIVVSGG
+ VVIEEQSFIGVNATLRDHITIGSRCVVGAGALLLGDADADGVYIGTKTERRPVPSTEL
+ RKI"
+ gene 1697293..1698057
+ /locus_tag="BQ2027_MB1544"
+ CDS 1697293..1698057
+ /locus_tag="BQ2027_MB1544"
+ /note="Mb1544, -, len: 254 aa. Equivalent to Rv1517, len:
+ 254 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 254 aa overlap). Conserved hypothetical
+ transmembrane protein, similar to G466802|LEPB1170_F2_64
+ from Mycobacterium leprae (230 aa), FASTA scores: opt:
+ 282, E(): 2.2e-11, (34.1% identity in 255 aa overlap).
+ Also similar to Mycobacterium tuberculosis
+ Rv3821|MTCY409.09c (237 aa) (36.3% identity in 256 aa
+ overlap); and Rv3481c. Mb1544 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00147.1"
+ /db_xref="GOA:A0A1R3XYK5"
+ /db_xref="InterPro:IPR021315"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYK5"
+ /translation="MWTMVLLLGLGMAIDPARLGLAVVMLSRRRPMLNLFAFWVGGMV
+ AGVGIALAVLVFMRDVALAAIQGVVSAANEFREAVGILAGGRLHIVIGVIMLLLAARM
+ VARARAQVGVPVGPVGVADGGMSALALAQRPPGLVARLEVRTQQMLQGDVVWPAFVVG
+ VASSAPPFESVVALTVIMASGAEIGTQFGAFVVFTLLVLAVIEIPLVAYLAIPQQTQQ
+ VMLRFQDWVRSNRRQISLTILIGVGFLFLYQGVTSL"
+ gene 1698066..1699025
+ /locus_tag="BQ2027_MB1545"
+ CDS 1698066..1699025
+ /locus_tag="BQ2027_MB1545"
+ /EC_number="2.4.1.-"
+ /note="Mb1545, -, len: 319 aa. Equivalent to Rv1518, len:
+ 319 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 319 aa overlap). Conserved hypothetical
+ protein, possibly a glycosyl transferase involved in
+ exopolysaccharide synthesis, similar to several
+ hypothetical proteins and glycosyl transferases from
+ diverse organisms e.g. P73996|D90911 from SYNECHO CYSTIS
+ sp. (309 aa), Fasta scores: opt: 300, E(): 1.8e-13, (29.5%
+ identity in 241 aa overlap). Mb1545 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Glycosyltransferase PglI (EC"
+ /protein_id="SIU00148.1"
+ /db_xref="InterPro:IPR001173"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYK2"
+ /translation="MVPGDASSVVSVNPAKPLISVCIPMYNNGATIERCLRSILEQEG
+ VEFEIVVVDDDSSDDCAAIAATMLRPGDRLLRNEPRLGLNRNHNKCLEVARGGLIQFV
+ HGDDRLLPGALQTLSRRFEDPSVGMAFAPRRVESDDIKWQQRYGRVHTRFRKLRDRNH
+ GPSLVLQMVLHGAKENWIGEPTAVMFRRQLALDAGGFRTDIYQLVDVDFWLRLMLRSA
+ VCFVPHELSVRRHTAATETTRVMATRRNVLDRQRILTWLIVDPLSPNRVRSAAALWWI
+ PAWLAMIVEVAVLGPQRRTHLKALAPAPFREFAHARRQLPLAD"
+ gene 1699155..1699424
+ /locus_tag="BQ2027_MB1546"
+ CDS 1699155..1699424
+ /locus_tag="BQ2027_MB1546"
+ /note="Mb1546, -, len: 89 aa. Equivalent to Rv1519, len:
+ 89 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 89 aa overlap). Conserved hypothetical
+ protein, high similarity to C-terminus of
+ Q50723|MTCY78.26|Rv3402c (412 aa) (58.1% identity in 74 aa
+ overlap). Mb1546 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00149.1"
+ /db_xref="GOA:P64862"
+ /db_xref="InterPro:IPR000653"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="UniProtKB/Swiss-Prot:P64862"
+ /translation="MRCGCLACDGVLCANGPGRPRRPALTCTAVATRTLHSLATNAEL
+ VESADLTVTEDICSRIVSLPVHDHMAIADVARVVAPFGEGLARGG"
+ gene 1699450..1700490
+ /locus_tag="BQ2027_MB1547"
+ CDS 1699450..1700490
+ /locus_tag="BQ2027_MB1547"
+ /note="Mb1547, -, len: 346 aa. Equivalent to Rv1520, len:
+ 346 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 346 aa overlap). Probable sugar
+ transferase (EC 2.-.-.-), similar to several e.g.
+ AB010970|AB010970_6 Streptococcus mutans
+ glycosyltransferase (465 aa), FASTA scores: opt: 381, E():
+ 1.2e-18, (31.7% identity in 240 aa overlap); O34234|Y07786
+ SUGAR TRANSFERASE from Vibrio cholerae (337 aa), FASTA
+ scores: opt: 214, E(): 8.4e-05, (25.9% identity in 212 aa
+ overlap). Also strongly similar to Mycobacterium
+ tuberculosis probable sugar transferase Rv1516c. Mb1547
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable sugar transferase"
+ /protein_id="SIU00150.1"
+ /db_xref="InterPro:IPR001173"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="UniProtKB/Swiss-Prot:P64864"
+ /translation="MSIVSISYNQEEYIREALDGFAAQRTEFPVEVIIADDASTDATP
+ RIIGEYAARYPQLFRPILRQTNIGVHANFKDVLSAARGEYLALCEGDDYWTDPLKLSK
+ QVKYLDRHPETTVCFHPVRVIYEDGAKDSEFPPLSWRRDLSVDALLARNFIQTNSVVY
+ RRQPSYDDIPANVMPIDWYLHVRHAVGGEIAMLPETMAVYRRHAHGIWHSAYTDRRKF
+ WETRGHGMAATLEAMLDLVHGHREREAIVGEVSAWVLREIGKTPGRQGRALLLKSIAD
+ HPRMTMLSLQHRWAQTPWRRFKRRLSTELSSLAALAYATRRRALEGRDGGYRETTSPP
+ TGRGRNVRGSHA"
+ gene 1700724..1702475
+ /gene="fadD25"
+ /locus_tag="BQ2027_MB1548"
+ CDS 1700724..1702475
+ /gene="fadD25"
+ /locus_tag="BQ2027_MB1548"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1548, fadD25, len: 583 aa. Equivalent to Rv1521,
+ len: 583 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 583 aa overlap). Probable fadD25,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), highly similar to
+ many e.g. P71495|U75685 ACYL-CoA SYNTHASE from
+ Mycobacterium bovis (582 aa), FASTA scores: opt: 2486,
+ E(): 0, (63.4% identity in 584 aa overlap);
+ NP_301232.1|NC_002677 acyl-CoA synthetase from
+ Mycobacterium leprae (579 aa); etc. Also highly similar to
+ others from Mycobacterium tuberculosis e.g. fadD24 (584
+ aa); fadD28 (580 aa); etc. Protein product from Mb1548
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1548 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable fatty-acid-amp ligase fadd25
+ (fatty-acid-amp synthetase) (fatty-acid-amp synthase)"
+ /protein_id="SIU00151.1"
+ /db_xref="GOA:A0A1R3XYJ1"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR040097"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ1"
+ /translation="MSVVESSLPGVLRERASFQPNDKALTFIDYERSWDGVEETLTWS
+ QLYRRTLNLAAQLREHGSTGDRALILAPQILDYVVSFIASLQAGIVAVPLSIPQGGAH
+ DERTVSVFADTAPAIVLTASSVVDNVVEYVQPQPGQNAPAVIEVDRLDLDARPSSGSR
+ SAAHGHPDILYLQYTSGSTRTPAGVMVSNKNLFANFEQIMTSYYGVYGKVAPPGSTVV
+ SWLPFYHDMGFVLGLILPILAGIPAVLTSPIGFLQRPARWIQMLASNTLAFTAAPNFA
+ FDLASRKTKDEDMEGLDLGGVHGILNGSERVQPVTLKRFIDRFAPFNLDPKAIRPSYG
+ MAEATVYVATRKAGQPPKIVQFDPQKLPDGQAERTESDGGTPLVSYGIVDTQLVRIVD
+ PDTGIERPAGTIGEIWVHGDNVAIGYWQKPEATERTFSATIVNPSEGTPAGPWLRTGD
+ SGFLSEGELFIMGRIKDLLIVYGRNHSPDDIEATIQTISPGRCAAIAVSEHGAEKLVA
+ IIELKKKDESDDEAAERLGFVKREVTSAISKSHGLSVADLVLVSPGSIPITTSGKIRR
+ AQCVELYRQDEFTRLDA"
+ gene complement(1702711..1706034)
+ /gene="mmpL12"
+ /locus_tag="BQ2027_MB1549C"
+ CDS complement(1702711..1706034)
+ /gene="mmpL12"
+ /locus_tag="BQ2027_MB1549C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1549c, mmpL12, len: 1107 aa. Equivalent to
+ Rv1522c, len: 1146 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.7% identity in 1107 aa overlap).
+ Probable mmpL12, conserved transmembrane transport protein
+ (see first citation below), member of RND superfamily.
+ Strong similarity to many Mycobacterial membrane proteins
+ e.g. Q49619|G466786 putative transport protein
+ B1170_C1_181 from Mycobacterium leprae (1008 aa), FASTA
+ scores: opt: 2418, E(): 0, (51.0% identity in 1006 aa
+ overlap); etc. Also highly similar to
+ MmpL8|MTCY48.08c|Rv3823c PROBABLE CONSERVED TRANSMEMBRANE
+ TRANSPORT PROTEIN from Mycobacterium tuberculosis, FASTA
+ score: (34.3% identity in 376 aa overlap); and some
+ similarity to MmpL10|MTCY20G9|Rv1183 PROBABLE CONSERVED
+ TRANSMEMBRANE TRANSPORT PROTEIN, FASTA score: (27.2%
+ identity in 1011 aa overlap). BELONGS TO THE MMPL FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base transversion (c-a) omitting a stop codon,
+ leads to a shorter product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (1107 aa versus
+ 1146 aa). Protein product from Mb1549c detected using
+ shotgun mass spectrometry. Mb1549c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL12"
+ /protein_id="SIU00152.1"
+ /db_xref="GOA:A0A1R3XYJ9"
+ /db_xref="InterPro:IPR000731"
+ /db_xref="InterPro:IPR004707"
+ /db_xref="InterPro:IPR004869"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ9"
+ /translation="MARHDEAKAGGLFDRIGNFVVRWPLIVIGCWIAVAAALTLLLPT
+ LQAQAAKREQAPLPPGAPSMVLQKEMSAAFQEKIETSALLLVLLTNENGLGPADEAVY
+ RKLIENLRADTQDKISVQDFLAVPEMKELLASKDNKAWNLPITFAGDAASPETQAAFK
+ RVAAIVKQTVAGTSLTVHLSGPIATVADLTELGEKDVRIIEIGAAVSVLIILILVYRN
+ LVTMLVPLATIGASVVTAQGTLSGLAEFGLAVNMQAIVFMSAVMIGAGTDYAVFLISR
+ YHDYVRHGEKSDMAVKKALMSIGKVITASAATVAVTFLAMVFTKLEVFSAVGPAIAVA
+ ITVSLLGAVTLLPAILTLTGRRGWIKPRRDLTSRMWRRSGVRIVRRPTIHLVGSLIVL
+ VALAGCTLLIRFNYDDLKTVPQHVESVKGYEAMNRHFPMNAMTPMVLFIKSPRDLRTP
+ GALADIEMMSREIAELPNIVMVRGLTRPNGEPLKETKVSFQAGEVGGKLDEATTLLEE
+ HGGELDQLTGGAHQLADALAQIRNEINGAVASSSGIVNTLQAMMDLMGGDKTIRQLEN
+ ASQYVGRMRALGDNLSGTVTDAEQIATWASPMVNALNSSPVCNSDPACRTSRAQLAAI
+ VQAQDDGLLRSIRALAVTLQQTQEYQTLARTVSTLDGQLKQVVSTLKAVDGLPTKLAQ
+ MQQGANALADGSAALAAGVQELVDQVKKMGSGLNEAADFLLGIKRDADKPSMAGFNIP
+ PQIFSRDEFKKGAQIFLSADGHAARYFVQSALNPATTEAMDQVNDILRVADSARPNTE
+ LEDATIGLAGVPTALRDIRDYYNSDMKFIVIATIVIVFLILVILLRALVAPIYLIGSV
+ LISYLSALGIGTLVFQLILGQEMHWSLPGLSFILLVAIGADYNMLLISRIRDESPHGI
+ RIGVIRTVGSTGGVITSAGLIFAASMFGLVGANINTMAQAGFTIGIGIVLDTFLVRTV
+ TVPALTTMIGRANWWPSELGRDPSTPPTKADRWLRRVKGHRRKAPIPAPKPPHTKVVR
+ NTNGHASKAATKSVPNGKPADLAEGNGEYLIDHLRRHSLPLFGYAAMPAYDVVDGVSK
+ PNGDGAHIGKEPVDHLLGH"
+ gene 1706075..1707118
+ /locus_tag="BQ2027_MB1550"
+ CDS 1706075..1707118
+ /locus_tag="BQ2027_MB1550"
+ /note="Mb1550, -, len: 347 aa. Equivalent to Rv1523, len:
+ 347 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 347 aa overlap). Probable
+ methyltransferase (EC 2.1.1.-), similar to G560513|U0002O
+ Mycobacterium leprae (270 aa), FASTA scores: opt: 965,
+ E(): 0, (60.3% identity in 247 aa overlap). Also similar
+ to many e.g. Q54303|X86780 METHYLTRANSFERASE RAPM from
+ Streptomyces hygroscopicus (317 aa), FASTA scores: opt:
+ 323, E(): 1e-15, (41.2% identity in 136 aa overlap). And
+ similar to Mycobacterium tuberculosis hypothetical
+ proteins Rv2952, Rv1405c, Rv1403c, Rv0839. Start
+ uncertain. Protein product from Mb1550 detected using
+ SWATH mass spectrometry. Mb1550 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable methyltransferase"
+ /protein_id="SIU00153.1"
+ /db_xref="GOA:A0A1R3Y0R2"
+ /db_xref="InterPro:IPR013216"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0R2"
+ /translation="MTITALTVTLPLLWRRLTTAGVKYADQGHFVGSAGVPAADAGGR
+ DAASEQIARWTQTCTVVLVCGHGPAKWAFRSWCTSRSCDTLPVALRYRLQSNPLVGKL
+ TTKYFLPLGTRQVGDHVVFFNFGYEEDPPMALPLSESDEPNRYCIQLYHQTASQVDLT
+ GKEVLEVSCGAGGGASYIARNLGPASYTGLDLNPASIDLCRAKHRLPGLQFVQGDAQN
+ LPFPDESFDAVVNVEASHQYPDFRGFLAEVARVLRPGGHFLYTDSRRNPVVAEWEAAL
+ ADAPLRTISQRDIGAQAKRGLDANTARSQEAIGRRAPVLLAGLTRCAVRVLDWDLRRG
+ GGFSYRIYLFAKD"
+ gene 1707148..1708392
+ /locus_tag="BQ2027_MB1551"
+ CDS 1707148..1708392
+ /locus_tag="BQ2027_MB1551"
+ /note="Mb1551, -, len: 414 aa. Equivalent to Rv1524, len:
+ 414 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 414 aa overlap). Probable
+ glycosyltransferase (EC 2.4.1.-), similar to many e.g.
+ P96559|U84349 GLYCOSYLTRANSFERASE GTFB from Amycolatopsis
+ orientalis (407 aa), FASTA scores: opt: 363, E(): 6.2e-23,
+ (28.8% identity in 430 aa overlap); also high similarity
+ to Rv1526c|MTCY19G5.02 Mycobacterium tuberculosis
+ hypothetical protein (58.7% identity in 416 aa overlap);
+ and AF143772|AF143772_15 glycosyltransferase gtfB from
+ Mycobacterium avium strain 215 (418 aa), FASTA scores:
+ opt: 1801, E(): 0, (65.2% identity in 417 aa overlap).
+ Protein product from Mb1551 detected using SWATH mass
+ spectrometry. Mb1551 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable glycosyltransferase"
+ /protein_id="SIU00154.1"
+ /db_xref="GOA:P64866"
+ /db_xref="InterPro:IPR004276"
+ /db_xref="UniProtKB/Swiss-Prot:P64866"
+ /translation="MKFVVASYGTRGDIEPCAAVGLELQRRGHDVCLAVPPNLIGFVE
+ TAGLSAVAYGSRDSQEQLDEQFLHNAWKLQNPIKLLREAMAPVTEGWAELSAMLTPVA
+ AGADLLLTGQIYQEVVANVAEHHGIPLAALHFYPVRANGEIAFPARLPAPLVRSTITA
+ IDWLYWRMTKGVEDAQRRELGLPKASTPAPRRMAVRGSLEIQAYDALCFPGLAAEWGG
+ RRPFVGALTMESATDADDEVASWIAADTPPIYFGFGSMPIGSLADRVAMISAACAELG
+ ERALICSGPSDATGIPQFDHVKVVRVVSHAAVFPTCRAVVHHGGAGTTAAGLRAGIPT
+ LILWVTSDQPIWAAQIKQLKVGRGRRFSSATKESLIADLRTILAPDYVTRAREIASRM
+ TKPAASVTATADLLEDAARRAR"
+ gene 1708439..1709224
+ /gene="wbbL2"
+ /locus_tag="BQ2027_MB1552"
+ CDS 1708439..1709224
+ /gene="wbbL2"
+ /locus_tag="BQ2027_MB1552"
+ /note="Mb1552, wbbL2, len: 261 aa. Equivalent to Rv1525,
+ len: 261 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 261 aa overlap). Possible wbbL2,
+ rhamnosyl transferase (EC 2.-.-.-), showing weak
+ similarity to several rhamnosyl transferases. Similar to
+ AF105060|AF105060_1 Riftia pachyptila endosymbiont (746
+ aa), FASTA scores: opt: 183, E(): 0.00013, (35.2% identity
+ in 105 aa overlap). Protein product from Mb1552 detected
+ using SWATH mass spectrometry. Mb1552 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE RHAMNOSYL TRANSFERASE WBBL2"
+ /protein_id="SIU00155.1"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="UniProtKB/Swiss-Prot:P64868"
+ /translation="MYAPLVSLMITVPVFGQHEYTHALVADLEREGADYLIVDNRGDY
+ PRIGTERVSTPGENLGWAGGSELGFRLAFAEGYSHAMTLNNDTRVSKGFVAALLDSRL
+ PADAGMVGPMFDVGFPFAVADEKPDAESYVPRARYRKVPAVEGTALVMSRDCWDAVGG
+ MDLSTFGRYGWGLDLDLALRARKSGYGLYTTEMAYINHFGRKTANTHFGGHRYHWGAS
+ AAMIRGLRRTHGWPAAMGILREMGMAHHRKWHKSFPLTCPASC"
+ gene complement(1709202..1710482)
+ /locus_tag="BQ2027_MB1553C"
+ CDS complement(1709202..1710482)
+ /locus_tag="BQ2027_MB1553C"
+ /note="Mb1553c, -, len: 426 aa. Equivalent to Rv1526c,
+ len: 426 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 426 aa overlap). Probable
+ glycosyltransferase (EC 2.4.1.-), highly similar to
+ G467196 Protein L518_C2_147 from Mycobacterium leprae (421
+ aa), FASTA scores, opt: 1497, E(): 0, (55.0% identity in
+ 424 aa overlap); similar to G452504 rhamnosyltransferase
+ (24.7% identity in 433 aa overlap); and P96565|U84350
+ GLYCOSYLTRANSFERASE GTFE from Amycolatopsis orientalis
+ (408 aa), E(): 3.4e-24, (28.4% identity in 429 aa
+ overlap), also high similarity to Rv1524|MTCY19G5.04c
+ (58.7 % identity in 416 aa overlap). Protein product from
+ Mb1553c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1553c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable glycosyltransferase"
+ /protein_id="SIU00156.1"
+ /db_xref="GOA:P64870"
+ /db_xref="InterPro:IPR004276"
+ /db_xref="UniProtKB/Swiss-Prot:P64870"
+ /translation="MKFVLAVHGTRGDVEPCAAVGVELRRRGHAVHMAVPPNLIEFVE
+ SAGLTGVAYGPDSDEQINTVAAFVRNLTRAQNPLNLARAVKELFVEGWAEMGTTLTTL
+ ADGADLVMTGQTYHGVAANVAEYYDIPAAALHHFPMQVNGQIAIPSIPTPATLVRATM
+ KVSWRLYAYVSKDADRAQRRELGLPPAPAPAVRRLAERGAPEIQAYDPVFFPGLAAEW
+ SDRRPFVGPLTMELHSEPNEELESWIAAGTPPIYFGFGSTPVQTPVQTLAMISDVCAQ
+ LGERALIYSPAANSTRIRHADHVKRVGLVNYSTILPKCRAVVHHGGAGTTAAGLRAGM
+ PTLILWDVADQPIWAGAVQRLKVGSAKRFTNITRGSLLKELRSILAPECAARAREIST
+ RMTRPTAAVTAAADLLEATARQTPGSTPSSSPGR"
+ gene complement(1710505..1716831)
+ /gene="pks5"
+ /locus_tag="BQ2027_MB1554C"
+ CDS complement(1710505..1716831)
+ /gene="pks5"
+ /locus_tag="BQ2027_MB1554C"
+ /note="Mb1554c, pks5, len: 2108 aa. Equivalent to Rv1527c,
+ len: 2108 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 2108 aa overlap). Probable pks5,
+ polyketide synthase, highly similar to many e.g.
+ MCAS_MYCBO|Q02251 mycocerosic acid synthase from
+ Mycobacterium bovis (2110 aa), FASTA scores: opt: 6270,
+ E(): 0, (63.6% identity in 2126 aa overlap). Protein
+ product from Mb1554c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1554c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable polyketide synthase pks5"
+ /protein_id="SIU00157.1"
+ /db_xref="GOA:A0A1R3XYL5"
+ /db_xref="InterPro:IPR001227"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013149"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR013968"
+ /db_xref="InterPro:IPR014030"
+ /db_xref="InterPro:IPR014031"
+ /db_xref="InterPro:IPR014043"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="InterPro:IPR016036"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR018201"
+ /db_xref="InterPro:IPR020801"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR020807"
+ /db_xref="InterPro:IPR020841"
+ /db_xref="InterPro:IPR020843"
+ /db_xref="InterPro:IPR032821"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="InterPro:IPR042104"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYL5"
+ /translation="MGKERTKTVDRTRVTPVAVIGMGCRLPGGIDSPDRLWEALLRGD
+ DLVTEIPADRWDIDEYYDPEPGVPGRTDCKWGAYLDNVGDFDPEFFGIGEKEAIAIDP
+ QHRLLLETSWEAMEHGGLTPNQMASRTGVFVGLVHTDYILVHADNQTFEGPYGNTGTN
+ ACFASGRVAYAMGLQGPAITVDTACSSGLTAIHLACRSLHDGESDIALAGGVYVMLEP
+ RRFASGSALGMLSATGRCHAFDVSADGFVSGEGCVMLALKRLPDALADGDRILAVIRG
+ TAANQDGHTVNIATPSRSAQVAAYREALDVAGVDPATVGMVEAHGPGTPVGDPIEYAS
+ LAEVYGNDGPCALASVKTNFGHTQSAAGALGLMKAVLALQHGVVPQNLHFTALPDKLA
+ AIETNLFVPQEITPWPGADQETPRRAAVSSYGMTGTNVHAIVEQAPVPAPESGAPGDT
+ PATPGIDGALLFALSASSQDALRQTAARLADWVDAQGPELAPADLAYTLARRRGHRPV
+ RTAVLAATTAELTEALREVATGETPYPPAVGQDDRGPVWVFSGQGSQWAGMGADLLAT
+ EPVFAATIAAIEPLIAAESGFSVTEAMTAPEVVTGIDRVQPTLFAMQVALAATMKSYG
+ VAPGAVIGHSLGESAAAVVAGALCLEDGVRVICRRSALMTRIAGAGAMASVELPAQQV
+ LSELMARGVNDAVVAVVASPQSTVIGGATQTVRDLVAAWEQRDVLAREVAVDVASHSP
+ QVDPILDELAEALAEISPLQPEIPYYSATSFDPREEPYCDAYYWVDNLRHTVRFAAAV
+ QAALEDGYRVFTELTPHPLLTHAVDQTARSLDMSAAALAGMRREQPLPHGLRALAGDL
+ YAAGAAVDFAVLYPTGRLINAPLPTWNHRRLLLDDTTRRIAHANTVAVHPLLGSHVRL
+ PEEPERHVWQGEVGTVTQPWLADHQIHGAAALPGAAYCEMALAAARAVLGEASEVRDI
+ RFEQMLLLDDETPIGVTATVEAPGVVPLTVETSHDGRYTRQLAAVLHVVREADDAPDQ
+ PPQKNIAELLASHPHKVDGAEVRQWLDKRGHRLGPAFAGLVDAYIAEGAGDTVLAEVN
+ LPGPLRSQVKAYGVHPVLLDACFQSVAAHPAVQGMADGGLLLPLGVRRLRSYGSARHA
+ RYCCTTVTACGVGVEADLDVLDEHGAVVLAVRGLQLGTGASQASERARVLGERLLSIE
+ WHERELPENSHAEPGAWLLISTCDATDLVAAQLTDALKVHDAQCTTMSWPQRADHAAQ
+ AARLRDQLGTGGFTGVFVLTAPQTGDPDAESPVRGGELVKHVVRIAREIPEITAQEPR
+ LYVLTHNAQAVLSGDRPNLEQGGMRGLLRVIGAEHPHLKASYVDVDEQTGAESVARQL
+ LAASGEDETAWRNDQWYTARLCPAPLRPEERQTTVVDHAEAGMRLQIRTPGDLQTLEF
+ AALDRVPPGPGEIEVAVTASSINFADVLVTFGRYQTLDGRQPQLGTDFAGVVSAVGPG
+ VSELKVGDRVGGMSPNGCWATFVTCDARLATRLPEGLTDAQAAAVTTASATAWYGLQD
+ LARIKAGDKVLIHSATGGVGQAAIAIARAAGAQIYATAGNEKRRDLLRDMGIEHVYDS
+ RSVEFAEQIRRDTAGYGVDIVLNSVTGAAQLAGLKLLALGGRFIEIGKRDIYSNTRLE
+ LLPFRRNLAFYGLDLGLMSVSHPAAVRELLSTVYRLTVEGVLPMPQSTHYPLAEAATA
+ IRVMGAAEHTGKLILDVPHAGRSSVVLPPEQARVFRSDGSYIITGGLGGLGLFLAEKM
+ ANAGAGRIVLSSRSQPSQKALETIELVRAIGSDVVVECGDIAQPDTADRLVTAATATG
+ LPLRGVLHAAAVVEDATLANITDELIERDWAPKAYGAWQLHRATADQPLDWFCSFSSA
+ AALVGSPGQGAYAAANSWLDTFTHWRRAQDLPATSIAWGAWGQIGRAIAFAEQTGDAI
+ APEEGAYAFETLLRHNRAYSGYAPVIGSPWLTAFAQHSPFAEKFQSLGQNRSGTSKFL
+ AELVDLPREEWPDRLRRLLSKQVGLILRRTIDTDRLLSEYGLDSLSSQELRARVEAET
+ GIRISATEINTTVRGLADLMCDKLAADRDAPAPA"
+ gene complement(1717375..1717872)
+ /gene="papA4"
+ /locus_tag="BQ2027_MB1555C"
+ CDS complement(1717375..1717872)
+ /gene="papA4"
+ /locus_tag="BQ2027_MB1555C"
+ /note="Mb1555c, papA4, len: 165 aa. Equivalent to Rv1528c,
+ len: 165 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 165 aa overlap). Probable papA4,
+ conserved polyketide synthase (PKS) associated protein;
+ shows some similarity to C-terminal part of hypothetical
+ proteins from Mycobacterium tuberculosis and Mycobacterium
+ leprae e.g. Z97188|MTCY409_10 Mycobacterium tuberculosis
+ cosmid (468) (37.9% identity in 66 aa overlap); or
+ U00010_11 Mycobacterium leprae cosmid B1170 (35.7%
+ identity in 84 aa overlap). Also similar to Mycobacterium
+ tuberculosis PKS-associated proteins Rv1182, Rv3824c,
+ Rv3820c. Mb1555c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED POLYKETIDE SYNTHASE
+ ASSOCIATED PROTEIN PAPA4"
+ /protein_id="SIU00158.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYL0"
+ /translation="MTQLPQPTWRWWQQRETEQVQSSHIDGEIVGALIPDLAVLHSED
+ ASRAAVGREKHRCSLDPLGGGFRSRRASMPAGALLLSAVIAIQLDRMNARVFGDGWIG
+ AQACMWVNKFHEESTVTALSPSSPIAQGSIARHPETMQSAYVRIAEGGSRDVAPAAQL
+ QRRRP"
+ gene 1717924..1719678
+ /gene="fadD24"
+ /locus_tag="BQ2027_MB1556"
+ CDS 1717924..1719678
+ /gene="fadD24"
+ /locus_tag="BQ2027_MB1556"
+ /note="Mb1556, fadD24, len: 584 aa. Equivalent to Rv1529,
+ len: 584 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 584 aa overlap). Probable fadD24,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), highly similar to
+ many e.g. MBU75685_1|AAB52538.1|U75685 acyl-CoA synthase
+ from Mycobacterium bovis (582 aa), FASTA score: (65.6%
+ identity in 582 aa overlap); and many other fatty-acid-CoA
+ synthetases from Mycobacteria e.g. fadD25|MTCY19G5_7 from
+ Mycobacterium tuberculosis (583 aa), FASTA score: (68.7%
+ identity in 584 aa overlap); fadD28|MTCY24G1_8 from
+ Mycobacterium tuberculosis (580 aa), FASTA score: (66.0%
+ identity in 582 aa overlap);
+ NP_301232.1|NC_002677|U00010_6 from Mycobacterium leprae
+ (372 aa), FASTA score: (57.6% identity in 342 aa overlap);
+ FADD23|Rv3826|MTCY409.04c from Mycobacterium tuberculosis
+ (584 aa), FASTA score: (63.2% identity in 584 aa overlap);
+ etc. Protein product from Mb1556 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1556
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable fatty-acid-amp ligase fadd24
+ (fatty-acid-amp synthetase) (fatty-acid-amp synthase)"
+ /protein_id="SIU00159.1"
+ /db_xref="GOA:A0A1R3XYJ8"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR040097"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYJ8"
+ /translation="MVASSIPTALRERASVHPNGAAITYIDYEQDWAGVAETLTWSQL
+ YRRMLNVAEPLRHVGATGDRAVILAPQGIEYVVGFLGALQAGRIAVPLPVPHAGAHDE
+ RTISVLSDTSPAVILTTSGAVDDVRECAQPQPGQSAPSIVELDLLDLDSRQRSRSPGA
+ RPTGRDTPETAYLQYTSGSTRTPAGVMVSNKNVFANFEQIVADFFAPEGGVVPPDLTV
+ VSWLPLYHDMGLLLGAIMPILAGVPTVLTSPVGFLQRPARWIQLLARNGRTISAGPNF
+ AFELAVRKTSDDDMDGLDLAGVHTILNGSERVHPATLKRFAERFGRFNFAAAALRPAY
+ GMAEATVYIATRNVNEPPEIVDFESEKLPAGQAIRCPSGSGTPLVSYGVPRSQLVRIV
+ DPDTCIECPQGSVGEIWVQGGNVASGYWHKPEESKRTFGARIVTPSAGTPEAPWLRTG
+ DSGFVSGGELFIIGRIKDLLIVYGRNHAPDDIEATIQEITSGRCAAIAVPDHGTEKLV
+ AIIELKKRGDSDEDVADRLRIVKRDVAAAIFDSHGLSVADLVLVSPGSIPITTSGKIR
+ RAQCVQLYRRREFTRLDA"
+ gene 1719795..1720898
+ /gene="adh"
+ /locus_tag="BQ2027_MB1557"
+ CDS 1719795..1720898
+ /gene="adh"
+ /locus_tag="BQ2027_MB1557"
+ /note="Mb1557, adh, len: 367 aa. Equivalent to Rv1530,
+ len: 367 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 367 aa overlap). Probable adh, alcohol
+ dehydrogenase (EC 1.1.1.1), zinc-dependent, similar to
+ many e.g. AE0009|AE000958_23 Archaeoglobus fulgidus
+ section 1 (402 aa), FASTA scores: opt: 423, E(): 1.8e-19,
+ (31.7% identity in 341 aa overlap). Contains PS00059
+ Zinc-containing alcohol dehydrogenases signature. Protein
+ product from Mb1557 detected using SWATH mass
+ spectrometry. Mb1557 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable alcohol dehydrogenase adh"
+ /protein_id="SIU00160.1"
+ /db_xref="GOA:A0A1R3XYL6"
+ /db_xref="InterPro:IPR002328"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013149"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYL6"
+ /translation="MSDGAVVRALVLEAPRRLVVRQYRLPRIGDDDALVRVEACGLCG
+ TDHEQYTGELAGGFAFVPGHETVGTIAAIGPRAEQRWGVSAGDRVAVEVFQSCRQCAN
+ CRGGEYRRCVRHGLADMYGFIPVDREPGLWGGYAEYQYLAPDSMVLRVAGDLSPEVAT
+ LFNPLGAGIRWGVTIPETKPGDVVAVLGPGIRGLCAAAAAKGAGAGFVMVTGLGPRDA
+ DRLALAAQFGADLAVDVAIDDPVAALTEQTGGLADVVVDVTAKAPAAFAQAIALARPA
+ GTVVVAGTRGVGSGAPGFSPDVVVFKELRVLGALGVDATAYRAALDLLVSGRYPFASL
+ PRRCVRLEGAEDLLATMAGERDGVPPIHGVLTP"
+ gene 1720895..1721461
+ /locus_tag="BQ2027_MB1558"
+ CDS 1720895..1721461
+ /locus_tag="BQ2027_MB1558"
+ /note="Mb1558, -, len: 188 aa. Equivalent to Rv1531, len:
+ 188 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 188 aa overlap). Conserved hypothetical
+ protein, similar to Rv0464c|MTV038.08c (190 aa), FASTA
+ scores: E(): 4.8e-10, (30.9% identity in 175 aa overlap).
+ Protein product from Mb1558 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1558 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00161.1"
+ /db_xref="GOA:A0A1R3XYK1"
+ /db_xref="InterPro:IPR003779"
+ /db_xref="InterPro:IPR029032"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYK1"
+ /translation="MTTSRVPLLPVDEAKAAADEAGVPDYMAELSIFQVLLNHPRLAR
+ TFNDLLATMLWHGTLDSRLRELVIMRIGWLTDCDYEWTQHWRVASGLGVSADDLLGVR
+ DWQGYNGFGPAEQAVLAATDDVVREGAVSAQSWSACERELHCDKVVLIELVTVISAWR
+ MVASILHSLEVPLEDGVSSWPPDGLSPR"
+ gene complement(1721538..1721972)
+ /locus_tag="BQ2027_MB1559C"
+ CDS complement(1721538..1721972)
+ /locus_tag="BQ2027_MB1559C"
+ /note="Mb1559c, -, len: 144 aa. Equivalent to Rv1532c,
+ len: 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 144 aa overlap). Conserved hypothetical
+ protein, similar to P20378|YPHR_HALHA Hypothetical 15.6 kd
+ protein from Halobacterium halobium (151 aa), FASTA
+ scores: opt: 152, E():4.5e-05, (30.1% identity in 103 aa
+ overlap). Protein product from Mb1559c detected using
+ SWATH mass spectrometry. Mb1559c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00162.1"
+ /db_xref="InterPro:IPR003736"
+ /db_xref="InterPro:IPR006683"
+ /db_xref="InterPro:IPR029069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYK8"
+ /translation="MSDPLTAQEQHKRRQAVRELMPRTPFIGGLGIVFERYEPDDVVI
+ RLPFRTDLTNDGTYFHGGVIASVMDTAGAAAAWSNHDFDRGTRAATVAMSIQYTGAAK
+ RCDLLCHARTARRRKELTFTEITATDPDGNIVAHAVQTYRIV"
+ gene 1722032..1723159
+ /locus_tag="BQ2027_MB1560"
+ CDS 1722032..1723159
+ /locus_tag="BQ2027_MB1560"
+ /note="Mb1560, -, len: 375 aa. Equivalent to Rv1533, len:
+ 375 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 375 aa overlap). Conserved hypothetical
+ protein. Similar to 2NPD_NEUCR|Q01284 2-nitropropane
+ dioxygenase precursor (378 aa), fasta scores: opt: 279,
+ E(): 9.1e-11, (31.3% identity in 256 aa overlap). Also
+ similar to Mycobacterium tuberculosis hypothetical
+ proteins Rv1894c, Rv0021c, Rv3553, Rv2781c. Protein
+ product from Mb1560 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1560 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative oxidoreductase, nitronate monooxygenase
+ family"
+ /protein_id="SIU00163.1"
+ /db_xref="GOA:A0A1R3Y0S2"
+ /db_xref="InterPro:IPR004136"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0S2"
+ /translation="MRTRVAELLGAEFPICAFSHCRDVVAAVSNAGGFGILGAVAHSP
+ KRLESELTWIEEHTGGKPYGVDVLLPPKYIGAEQGGIDAQQARELIPEGHRTFVDDLL
+ VRYGIPAVTDRQRSSSAGGLHISPKGYQPLLDVAFAHDIRLIASALGPPPPDLVERAH
+ NHDVLVAALAGTAQHARRHAAAGVDLIVAQGTEAGGHTGEVATMVLVPEVVDAVSPTP
+ VLAAGGIARGRQIAAALALGAEGVWCGSVWLTTEEAETPPVVKDKFLAATSSDTVRSR
+ SLTGKPARMLRTAWTDEWDRPDSPDPLGMPLQSALVSDPQLRINQAAGQPGAKARELA
+ TYFVGQVVGSLDRVRSARSVVLDMVEEFIDTVGQLQGLVQR"
+ gene 1723156..1723833
+ /locus_tag="BQ2027_MB1561"
+ CDS 1723156..1723833
+ /locus_tag="BQ2027_MB1561"
+ /note="Mb1561, -, len: 225 aa. Equivalent to Rv1534, len:
+ 225 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 225 aa overlap). Probable
+ transcriptional regulator, similar to YCDC_ECOLI|P75899
+ hypothetical transcriptional regulator from Escherichia
+ coli (212 aa), FASTA scores: opt: 166, E(): 9.8e-05,
+ (24.2% identity in 219 aa overlap). Contains PS01081
+ Bacterial regulatory proteins, tetR family signature and
+ helix turn helix motif (aa 41-62). Protein product from
+ Mb1561 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1561 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable transcriptional regulator"
+ /protein_id="SIU00164.1"
+ /db_xref="GOA:A0A1R3XZJ7"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR023772"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="InterPro:IPR041669"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZJ7"
+ /translation="MSRASARRRRAVSDEDKSQRRDEILAAAKIVFAHKGFHATTVAD
+ IAKQAGLAYGLIYWYFDSKDDLFHALMAGEEEALRAHVAAELARVGGSTEAPLRALLQ
+ AAVQATFEFFETDKATVKLLFRDAYALGGRFEEHLGGIYERFIDDIEAVVVAAQRRGE
+ VVEAPSRMAAYTLAALVGQLAHRRLNTDDNVTAAQVADFVVSLVLDGLRPRALAVGAR
+ GGRAART"
+ gene 1724398..1724634
+ /locus_tag="BQ2027_MB1562"
+ CDS 1724398..1724634
+ /locus_tag="BQ2027_MB1562"
+ /note="Mb1562, -, len: 78 aa. Equivalent to Rv1535, len:
+ 78 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 78 aa overlap). Hypothetical unknown protein.
+ Mb1562 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00165.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYL3"
+ /translation="MTAALHNDVVTVASAPKLRVVRDVPPAPASKKVARRLDAQPFGT
+ GGDPLVDGAARLLSIPLRHLYAALWRVGLLEVQA"
+ gene 1724941..1728066
+ /gene="ileS"
+ /locus_tag="BQ2027_MB1563"
+ CDS 1724941..1728066
+ /gene="ileS"
+ /locus_tag="BQ2027_MB1563"
+ /note="Mb1563, ileS, len: 1041 aa. Equivalent to Rv1536,
+ len: 1041 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 1041 aa overlap). ileS,
+ Isoleucyl-tRNA synthetase (EC 6.1.1.5), similar to several
+ e.g. SYIC_YEAST P09436 isoleucyl-tRNA synthetase (1072
+ aa), FASTA scores: opt: 1447, E(): 0, (37.8% identity in
+ 1072 aa overlap); contains PS00178 Aminoacyl-transfer RNA
+ synthetases class-I signature. BELONGS TO CLASS-I
+ AMINOACYL-TRNA SYNTHETASE FAMILY. Protein product from
+ Mb1563 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1563 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="isoleucyl-tRNA synthetase ileS"
+ /protein_id="SIU00166.1"
+ /db_xref="GOA:Q7VEZ0"
+ /db_xref="InterPro:IPR001412"
+ /db_xref="InterPro:IPR002300"
+ /db_xref="InterPro:IPR002301"
+ /db_xref="InterPro:IPR009008"
+ /db_xref="InterPro:IPR009080"
+ /db_xref="InterPro:IPR013155"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="InterPro:IPR023586"
+ /db_xref="InterPro:IPR033709"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEZ0"
+ /translation="MTDNAYPKLAGGAPDLPALELEVLDYWSRDDTFRASIARRDGAP
+ EYVFYDGPPFANGLPHYGHLLTGYVKDIVPRYRTMRGYKVERRFGWDTHGLPAELEVE
+ RQLGITDKSQIEAMGIAAFNDACRASVLRYTDEWQAYVTRQARWVDFDNDYKTLDLAY
+ MESVIWAFKQLWDKGLAYEGYRVLPYCWRDETPLSNHELRMDDDVYQSRQDPAVTVGF
+ KVVGGQPDNGLDGAYLLVWTTTPWTLPSNLAVAVSPDITYVQVQAGDRRFVLAEARLA
+ AYARELGEEPVVLGTYRGAELLGTRYLPPFAYFMDWPNAFQVLAGDFVTTDDGTGIVH
+ MAPAYGEDDMVVAEAVGIAPVTPVDSKGRFDVTVADYQGQHVFDANAQIVRDLKTQSG
+ PAAVNGPVLIRHETYEHPYPHCWRCRNPLIYRSVSSWFVRVTDFRDRMVELNQQITWY
+ PEHVKDGQFGKWLQGARDWSISRNRYWGTPIPVWKSDDPAYPRIDVYGSLDELERDFG
+ VRPANLHRPYIDELTRPNPDDPTGRSTMRRIPDVLDVWFDSGSMPYAQVHYPFENLDW
+ FQGHYPGDFIVEYIGQTRGWFYTLHVLATALFDRPAFKTCVAHGIVLGFDGQKMSKSL
+ RNYPDVTEVFDRDGSDAMRWFLMASPILRGGNLIVTEQGIRDGVRQVLLPLWNTYSFL
+ ALYAPKVGTWRVDSVHVLDRYILAKLAVLRDDLSESMEVYDIPGACEHLRQFTEALTN
+ WYVRRSRSRFWAEDADAIDTLHTVLEVTTRLAAPLLPLITEIIWRGLTRERSVHLTDW
+ PAPDLLPSDADLVAAMDQVRDVCSAASSLRKAKKLRVRLPLPKLIVAVENPQLLRPFV
+ DLIGDELNVKQVELTDAIDTYGRFELTVNARVAGPRLGKDVQAAIKAVKAGDGVINPD
+ GTLLAGPAVLTADEYNSRLVAADPESTAALPDGAGLVVLDGTVTAELEAEGWAKDRIR
+ ELQELRKSTGLDVSDRIRVVMSVPAEREDWARTHRDLIAGEILATDFEFADLADGVAI
+ GDGVRVSIEKT"
+ gene 1728278..1729669
+ /gene="dinX"
+ /locus_tag="BQ2027_MB1564"
+ CDS 1728278..1729669
+ /gene="dinX"
+ /locus_tag="BQ2027_MB1564"
+ /note="Mb1564, dinX, len: 463 aa. Equivalent to Rv1537,
+ len: 463 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 463 aa overlap). Probable dinX, DNA
+ polymerase IV. Similar to umuC, mucB, samb, and impb (uv
+ protection and mutation) e.g. IMPB_SALTY|P18642 impb
+ protein from Salmonella typhimurium (424 aa), FASTA
+ scores, opt: 386, E(): 1.7e-17, (27.5% identity in 415 aa
+ overlap). Also similar to Mycobacterium tuberculosis
+ Rv3056. Mb1564 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable dna polymerase iv dinx (pol iv 1) (dna
+ nucleotidyltransferase (dna-directed))"
+ /protein_id="SIU00167.1"
+ /db_xref="GOA:P63986"
+ /db_xref="InterPro:IPR001126"
+ /db_xref="InterPro:IPR017961"
+ /db_xref="InterPro:IPR022880"
+ /db_xref="InterPro:IPR024728"
+ /db_xref="InterPro:IPR036775"
+ /db_xref="UniProtKB/Swiss-Prot:P63986"
+ /translation="MLHLDMDAFFASVEQLTRPTLRGRPVLVGGLGGRGVVAGASYEA
+ RAYGARSAMPMHQARRLIGVTAVVLPPRGVVYGIASRRVFDTVRGLVPVVEQLSFDEA
+ FAEPPQLAGAVAEDVETFCERLRRRVRDETGLIASVGAGSGKQIAKIASGLAKPDGIR
+ VVRHAEEQALLSGLPVRRLWGIGPVAEEKLHRLGIETIGQLAALSDAEAANILGATIG
+ PALHRLARGIDDRPVVERAEAKQISAESTFAVDLTTMEQLHEAIDSIAEHAHQRLLRD
+ GRGARTITVKLKKSDMSTLTRSATMPYPTTDAGALFTVARRLLPDPLQIGPIRLLGVG
+ FSGLSDIRQESLFADSDLTQETAAAHYVETPGAVVPAAHDATMWRVGDDVAHPELGHG
+ WVQGAGHGVVTVRFETRGSGPGSARTFPVDTGDISNASPLDSLDWPDYIGQLSVEGSA
+ GASAPTVDDVGDR"
+ gene complement(1729634..1730614)
+ /gene="ansA"
+ /locus_tag="BQ2027_MB1565C"
+ CDS complement(1729634..1730614)
+ /gene="ansA"
+ /locus_tag="BQ2027_MB1565C"
+ /note="Mb1565c, ansA, len: 326 aa. Equivalent to Rv1538c,
+ len: 326 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 326 aa overlap). Probable ansA,
+ L-aparaginase, most similar to ASPG_BACLI|P30363
+ L-asparaginase (322 aa), FASTA scores: opt: 417, E():
+ 8.8e-19, (30.9% identity in 314 aa overlap). Contains
+ PS00917 Asparaginase / glutaminase active site signature
+ 2. Protein product from Mb1565c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1565c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable L-aparaginase ansA"
+ /protein_id="SIU00168.1"
+ /db_xref="GOA:P63628"
+ /db_xref="InterPro:IPR004550"
+ /db_xref="InterPro:IPR006034"
+ /db_xref="InterPro:IPR020827"
+ /db_xref="InterPro:IPR027473"
+ /db_xref="InterPro:IPR027474"
+ /db_xref="InterPro:IPR027475"
+ /db_xref="InterPro:IPR036152"
+ /db_xref="InterPro:IPR037152"
+ /db_xref="InterPro:IPR040919"
+ /db_xref="UniProtKB/Swiss-Prot:P63628"
+ /translation="MGANHVRNDPIMARLTVITTGGTISTTAGPDGVLRPTHCGATLI
+ AGLDMDSDIEVVDLMALDSSKLTPADWDRIGAAVQEAFRGGADGVVITHGTDTLEETA
+ LWLDLTYAGSRPVVLTGAMLSADAPGADGPANLRDALAVAADPAARDLGVLVSFGGRV
+ LQPLGLHKVANPDLCGFAGESLGFTSGGVRLTRTKTRPYLGDLGAAVAPRVDIVAVYP
+ GSDAVAMDACVAAGARAVVLEALGSGNAGAAVIEGVRRHCRDGSDPVVIAVSTRVAGA
+ RVGAGYGPGHDLVEAGAVMVPRLPPSQARVLLMAALAANSPVADVIDRWG"
+ gene 1730666..1731274
+ /gene="lspA"
+ /locus_tag="BQ2027_MB1566"
+ CDS 1730666..1731274
+ /gene="lspA"
+ /locus_tag="BQ2027_MB1566"
+ /note="Mb1566, lspA, len: 202 aa. Equivalent to Rv1539,
+ len: 202 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 202 aa overlap). Probable lspA,
+ lipoprotein signal peptidase (EC 3.4.23.36), similar to
+ several e.g. LSPA_PSEFL|P17942 (170 aa), FASTA scores:
+ opt: 299, E(): 2.6e-12, (38.3% identity in 167 aa
+ overlap). Mb1566 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable lipoprotein signal peptidase lspA"
+ /protein_id="SIU00169.1"
+ /db_xref="GOA:P65263"
+ /db_xref="InterPro:IPR001872"
+ /db_xref="UniProtKB/Swiss-Prot:P65263"
+ /translation="MPDEPTGSADPLTSTEEAGGAGEPNAPAPPRRLRMLLSVAVVVL
+ TLDIVTKVVAVQLLPPGQPVSIIGDTVTWTLVRNSGAAFSMATGYTWVLTLIATGVVV
+ GIFWMGRRLVSPWWALGLGMILGGAMGNLVDRFFRAPGPLRGHVVDFLSVGWWPVFNV
+ ADPSVVGGAILLVILSIFGFDFDTVGRRHADGDTVGRRKADG"
+ gene 1731267..1732193
+ /locus_tag="BQ2027_MB1567"
+ CDS 1731267..1732193
+ /locus_tag="BQ2027_MB1567"
+ /EC_number="5.4.99.23"
+ /note="Mb1567, -, len: 308 aa. Equivalent to Rv1540, len:
+ 308 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 308 aa overlap). Member of the
+ yabO/yceC/yfiI family of hypothetical proteins, similar to
+ P44445|YFII_HAEIN hypothetical protein HI0176 from
+ Haemophilus influenzae (324 aa), FASTA scores: opt: 437,
+ E(): 1.2e-22, (33.2% identity in 322 aa overlap).
+ Equivalent to AL049478|MLCL458_13 hypothetical protein
+ from Mycobacterium leprae (308 aa), (89.3% identity in 307
+ aa overlap). Contains PS01129 hypothetical yabO/yceC/yfiI
+ family signature. Protein product from Mb1567 detected
+ using SWATH mass spectrometry. Mb1567 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="LSU rRNA pseudouridine(1911/1915/1917) synthase
+ (EC"
+ /protein_id="SIU00170.1"
+ /db_xref="GOA:P0A5T3"
+ /db_xref="InterPro:IPR002942"
+ /db_xref="InterPro:IPR006145"
+ /db_xref="InterPro:IPR006224"
+ /db_xref="InterPro:IPR006225"
+ /db_xref="InterPro:IPR020103"
+ /db_xref="InterPro:IPR036986"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5T3"
+ /translation="MADRSMPVPDGLAGMRVDTGLARLLGLSRTAAAALAEEGAVELN
+ GVPAGKSDRLVSGALLQVRLPEAPAPLQNTPIDIEGMTILYSDDDIVAVDKPAAVAAH
+ ASVGWTGPTVLGGLAAAGYRITTSGVHERQGIVHRLDVGTSGVMVVAISERAYTVLKR
+ AFKYRTVDKRYHALVQGHPDPSSGTIDAPIGRHRGHEWKFAITKNGRHSLTHYDTLEA
+ FVAASLLDVHLETGRTHQIRVHFAALHHPCCGDLVYGADPKLAKRLGLDRQWLHARSL
+ AFAHPADGRRVEIVSPYPADLQHALKILRGEG"
+ gene complement(1732200..1732793)
+ /gene="lprI"
+ /locus_tag="BQ2027_MB1568C"
+ CDS complement(1732200..1732793)
+ /gene="lprI"
+ /locus_tag="BQ2027_MB1568C"
+ /note="Mb1568c, lprI, len: 197 aa. Equivalent to Rv1541c,
+ len: 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 197 aa overlap). Possible lipoprotein
+ lprI, contains appropriately positioned prokaryotic
+ membrane lipoprotein lipid attachment site (PS0013)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible lipoprotein lprI"
+ /protein_id="SIU00171.1"
+ /db_xref="GOA:P65319"
+ /db_xref="InterPro:IPR009739"
+ /db_xref="InterPro:IPR018660"
+ /db_xref="InterPro:IPR036328"
+ /db_xref="UniProtKB/Swiss-Prot:P65319"
+ /translation="MRWIGVLVTALVLSACAANPPANTTSPTAGQSLDCTKPATIVQQ
+ LVCHDRQLTSLDHRLSTAYQQALAHRRSAALEAAQSSWTMLRDACAQDTDPRTCVQEA
+ YQTRLVQLAIADPATATPPVLTYRCPTQDGPLTAQFYNQFDPKTAVLNWKGDQVIVFV
+ ELSGSGARYGRQGIEYWEHQGEVRLDFHGATFVCRTS"
+ gene complement(1732848..1733258)
+ /gene="glbN"
+ /locus_tag="BQ2027_MB1569C"
+ CDS complement(1732848..1733258)
+ /gene="glbN"
+ /locus_tag="BQ2027_MB1569C"
+ /note="Mb1569c, glbN, len: 136 aa. Equivalent to Rv1542c,
+ len: 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 136 aa overlap). Probable glbN,
+ hemoglobin. Belongs to the protozoan/cyanobacterial globin
+ family. Similar to myoglobins e.g. GLB_PARCA|P15160
+ myoglobin (hemoglobin) paramecium (116 aa), FASTA scores,
+ opt: 284, E(): 2.1e -13, (35.7% identity in 115 aa
+ overlap). Similar to Mycobacterium tuberculosis
+ hypothetical globin, Rv2470."
+ /codon_start=1
+ /transl_table=11
+ /product="hemoglobin glbn"
+ /protein_id="SIU00172.1"
+ /db_xref="GOA:P0A593"
+ /db_xref="InterPro:IPR001486"
+ /db_xref="InterPro:IPR009050"
+ /db_xref="InterPro:IPR012292"
+ /db_xref="InterPro:IPR016339"
+ /db_xref="InterPro:IPR019795"
+ /db_xref="UniProtKB/Swiss-Prot:P0A593"
+ /translation="MGLLSRLRKREPISIYDKIGGHEAIEVVVEDFYVRVLADDQLSA
+ FFSGTNMSRLKGKQVEFFAAALGGPEPYTGAPMKQVHQGRGITMHHFSLVAGHLADAL
+ TAAGVPSETITEILGVIAPLAVDVTSGESTTAPV"
+ gene 1733486..1734511
+ /locus_tag="BQ2027_MB1570"
+ CDS 1733486..1734511
+ /locus_tag="BQ2027_MB1570"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1570, -, len: 341 aa. Equivalent to Rv1543, len:
+ 341 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 341 aa overlap). Possible fatty-acyl CoA
+ reductase (EC 1.2.1.-), highly similar to P94129|U77680
+ FATTY ACYL-COA REDUCTASE ACR1 from Acinetobacter
+ calcoaceticus (295 aa), FASTA scores: opt: 899, E(): 0,
+ (48.5% identity in 293 aa overlap). Also highly similar to
+ acrA1|Rv3391|MTV004.49|NP_217908.1|NC_000962 fatty
+ acyl-CoA reductase from Mycobacterium tuberculosis (650
+ aa). Also highly similar to many oxidoreductases
+ short-chain family. Protein product from Mb1570 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1570 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE FATTY ACYL-COA REDUCTASE"
+ /protein_id="SIU00173.1"
+ /db_xref="GOA:P66780"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P66780"
+ /translation="MNLGDLTNFVEKPLAAVSNIVNTPNSAGRYRPFYLRNLLDAVQG
+ RNLNDAVKGKVVLITGGSSGIGAAAAKKIAEAGGTVVLVARTLENLENVANDIRAIRG
+ NGGTAHVYPCDLSDMDAIAVMADQVLGDLGGVDILINNAGRSIRRSLELSYDRIHDYQ
+ RTMQLNYLGAVQLILKFIPGMRERHFGHIVNVSSVGVQTRAPRFGAYIASKAALDSLC
+ DALQAETVHDNVRFTTVHMALVRTPMISPTTIYDKFPTLTPDQAAGVITDAIVHRPRR
+ ASSPFGQFAAVADAVNPAVMDRVRNRAFNMFGDSSAAKGSESQTDTSELDKRSETFVR
+ ATRGIHW"
+ gene 1734516..1735319
+ /locus_tag="BQ2027_MB1571"
+ CDS 1734516..1735319
+ /locus_tag="BQ2027_MB1571"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1571, -, len: 267 aa. Equivalent to Rv1544, len:
+ 267 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 267 aa overlap). Possible ketoacyl
+ reductase (EC 1.3.1.-), highly similar to
+ Z97179|MLCL383_26 putative oxidoreductase from
+ Mycobacterium leprae (268 aa), FASTA score: (43.0%
+ identity in 270 aa overlap). Also highly similar to others
+ e.g. T29125 ketoacyl reductase homolog from Streptomyces
+ coelicolor (276 aa); NP_470957.1|NC_003212 protein similar
+ to ketoacyl reductases from Listeria innocua (253 aa);
+ HETN_ANASP|P37694 ketoacyl reductase from Anabaena sp.
+ strain PCC 7120 (287 aa), FASTA scores: opt: 379, E():
+ 7.5e-18, (31.6% identity in 250 aa overlap); etc. And
+ highly similar to many oxidoreductases short-chain family.
+ Also highly similar to Rv2509 from Mycobacterium
+ tuberculosis (268 aa). Contains PS00061 Short-chain
+ alcohol dehydrogenase family signature. BELONGS TO THE
+ SHORT-CHAIN DEHYDROGENASES/REDUCTASES (SDR) FAMILY.
+ Protein product from Mb1571 detected using shotgun mass
+ spectrometry. Mb1571 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible ketoacyl reductase"
+ /protein_id="SIU00174.1"
+ /db_xref="GOA:A0A1R3XZJ9"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZJ9"
+ /translation="MSLPKPNNQTTVVITGASSGIGVELARGLAGRGFPLMLVARRRE
+ RLDELADQLRQEHCVGVEVLPLDLADTQARAQLADRLRSDAIAGLCNSAGFGTSGRFW
+ ELPFARESEEVVLNALALMELTHAALPGMVKRGAGAVLNIASIAGFQPIPYMAVYSAT
+ KAFVLTFSEAVQEELHGTGVSVTALCPGPVPTEWAEIASAERFSIPLAQVSPHDVAEA
+ AIAGMLSGKRTVVPGIVPKFVSTSGRFAPRSLLLPAIRIGNRLRGGPSR"
+ gene 1735341..1735568
+ /locus_tag="BQ2027_MB1572"
+ CDS 1735341..1735568
+ /locus_tag="BQ2027_MB1572"
+ /note="Mb1572, -, len: 75 aa. Equivalent to Rv1545, len:
+ 75 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 75 aa overlap). Hypothetical unknown protein.
+ Mb1572 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00175.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64872"
+ /translation="MPNGVLGLGNPSRLAALYGLQLAHESQCCQMHNLPSAARQVTVA
+ CREEVGITTILAGRDECGVCDKTAGLDGAAP"
+ gene 1735617..1736048
+ /locus_tag="BQ2027_MB1573"
+ CDS 1735617..1736048
+ /locus_tag="BQ2027_MB1573"
+ /note="Mb1573, -, len: 143 aa. Equivalent to Rv1546, len:
+ 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 143 aa overlap). Conserved hypothetical
+ protein, similar to O05902|Rv0910|MTCY21C12.04
+ Hypothetical protein from Mycobacterium tuberculosis (144
+ aa), FASTA scores: E(): 5e-30, (37.3% identity in 142 aa
+ overlap). Protein product from Mb1573 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1573 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00176.1"
+ /db_xref="InterPro:IPR019587"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/Swiss-Prot:P64874"
+ /translation="MASVELSADVPISPQDTWDHVSELSELGEWLVIHEGWRSELPDQ
+ LGEGVQIVGVARAMGMRNRVTWRVTKWDPPHEVAMTGSGKGGTKYGVTLTVRPTKGGS
+ ALGLRLELGGRALFGPLGSAAARAVKGDVEKSLKQFAELYG"
+ gene 1736116..1739670
+ /gene="dnaE1"
+ /locus_tag="BQ2027_MB1574"
+ CDS 1736116..1739670
+ /gene="dnaE1"
+ /locus_tag="BQ2027_MB1574"
+ /note="Mb1574, dnaE1, len: 1184 aa. Equivalent to Rv1547,
+ len: 1184 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100% identity in 1184 aa overlap). Probable dnaE1,
+ DNA polymerase III, alpha chain (EC 2.7.7.7), similar to
+ e.g. DP3A_ECOLI|P10443 dna polymerase III, alpha chain
+ (1160 aa), FASTA scores: opt: 1789, E(): 0, (36.5%
+ identity in 1193 aa overlap). Also similar to M.
+ tuberculosis, DnaE2|Rv3370c. Protein product from Mb1574
+ detected using SWATH mass spectrometry. Mb1574 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable dna polymerase iii (alpha chain) dnae1
+ (dna nucleotidyltransferase)"
+ /protein_id="SIU00177.1"
+ /db_xref="GOA:P63978"
+ /db_xref="InterPro:IPR003141"
+ /db_xref="InterPro:IPR004013"
+ /db_xref="InterPro:IPR004805"
+ /db_xref="InterPro:IPR011708"
+ /db_xref="InterPro:IPR016195"
+ /db_xref="InterPro:IPR029460"
+ /db_xref="InterPro:IPR040982"
+ /db_xref="InterPro:IPR041931"
+ /db_xref="UniProtKB/Swiss-Prot:P63978"
+ /translation="MSGSSAGSSFVHLHNHTEYSMLDGAAKITPMLAEVERLGMPAVG
+ MTDHGNMFGASEFYNSATKAGIKPIIGVEAYIAPGSRFDTRRILWGDPSQKADDVSGS
+ GSYTHLTMMAENATGLRNLFKLSSHASFEGQLSKWSRMDAELIAEHAEGIIITTGCPS
+ GEVQTRLRLGQDREALEAAAKWREIVGPDNYFLELMDHGLTIERRVRDGLLEIGRALN
+ IPPLATNDCHYVTRDAAHNHEALLCVQTGKTLSDPNRFKFDGDGYYLKSAAEMRQIWD
+ DEVPGACDSTLLIAERVQSYADVWTPRDRMPVFPVPDGHDQASWLRHEVDAGLRRRFP
+ AGPPDGYRERAAYEIDVICSKGFPSYFLIVADLISYARSAGIRVGPGRGSAAGSLVAY
+ ALGITDIDPIPHGLLFERFLNPERTSMPDIDIDFDDRRRGEMVRYAADKWGHDRVAQV
+ ITFGTIKTKAALKDSARIHYGQPGFAIADRITKALPPAIMAKDIPLSGITDPSHERYK
+ EAAEVRGLIETDPDVRTIYQTARGLEGLIRNAGVHACAVIMSSEPLTEAIPLWKRPQD
+ GAIITGWDYPACEAIGLLKMDFLGLRNLTIIGDAIDNVRANRGIDLDLESVPLDDKAT
+ YELLGRGDTLGVFQLDGGPMRDLLRRMQPTGFEDVVAVIALYRPGPMGMNAHNDYADR
+ KNNRQAIKPIHPELEEPLREILAETYGLIVYQEQIMRIAQKVASYSLARADILRKAMG
+ KKKREVLEKEFEGFSDGMQANGFSPAAIKALWDTILPFADYAFNKSHAAGYGMVSYWT
+ AYLKANYPAEYMAGLLTSVGDDKDKAAVYLADCRKLGITVLPPDVNESGLNFASVGQD
+ IRYGLGAVRNVGANVVGSLLQTRNDKGKFTDFSDYLNKIDISACNKKVTESLIKAGAF
+ DSLGHARKGLFLVHSDAVDSVLGTKKAEALGQFDLFGSNDDGTGTADPVFTIKVPDDE
+ WEDKHKLALEREMLGLYVSGHPLNGVAHLLAAQVDTAIPAILDGDVPNDAQVRVGGIL
+ ASVNRRVNKNGMPWASAQLEDLTGGIEVMFFPHTYSSYGADIVDDAVVLVNAKVAVRD
+ DRIALIANDLTVPDFSNAEVERPLAVSLPTRQCTFDKVSALKQVLARHPGTSQVHLRL
+ ISGDRITTLALDQSLRVTPSPALMGDLKELLGPGCLGS"
+ gene complement(1739719..1741755)
+ /gene="PPE21"
+ /locus_tag="BQ2027_MB1575C"
+ CDS complement(1739719..1741755)
+ /gene="PPE21"
+ /locus_tag="BQ2027_MB1575C"
+ /note="Mb1575c, PPE21, len: 678 aa. Equivalent to Rv1548c,
+ len: 678 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 678 aa overlap). Member of the M.
+ tuberculosis PPE family, similar to several e.g.
+ YHS6_MYCTU|P42611 hypothetical 50.6 kd protein in hsp65 3'
+ region (517 aa), FASTA scores: opt:1142, E(): 0, (40.6%
+ identity in 616 aa overlap); also similar to MTCY31.06c
+ (54.9% identity in 381 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe21"
+ /protein_id="SIU00178.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR002989"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYN6"
+ /translation="MNFSVLPPEINSALMFAGAGPGPMLAAASAWTGLAGDLGSAAAS
+ FSAVTSQLATGSWQGPASAAMTGAAASYARWLTTAAAQAEQAAGQAQAAVSAFEAALA
+ ATVHPGAVSANRGRLRSLVASNLLGQNAPAIAAVEAVYEQMWAADVAAMLGYHGEASA
+ VALSLTPFTPSPSAAATPGGAVIIAGFPFLDLGNVTIGGFNLASGNLGLGNLGSFNPG
+ SANTGSVNLGNANIGDLNLGSGNIGSYNLGGGNTGDLNPGSGNTGTLNWGSGNIGSYN
+ LGGGNLGSYNLGSGNTGDTNFGGGNTGNLNVGGGNTGNSNFGFGNTGNVNFGNGNTGD
+ TNFGSGNLGSGNIGFGNKGSHNIGFGNSGNNNIGFGLTGDNQIGFGALNSGSGNLGFG
+ NSGNGNIGFFNSGNNNIGMGNSGNGVGALSVEFGSSAERSSGFGNSGELSTGIGNSGQ
+ LSTGWFNSATTSTGWFNSGTTNTGWFNSGTTNTGIGNSGGNLVTGSMGLFNSGHTNTG
+ SFNAGSMNTGDFNSGNVNTGYFNSGNINTGFFNSGDLNTGLFNSVNQPVQNSGWLHTG
+ TNNSGYANAGTFNSGFDNNARDEHAEFVTGNSGLANVGNYNAGIINVGDHLSGFRNSV
+ PTITGTANISGFVNAGTSISGFFNFGSLMSGFANFDDEVSGYLNGDSRASGWIH"
+ gene 1741912..1743855
+ /gene="fadD11"
+ /locus_tag="BQ2027_MB1576"
+ CDS 1741912..1743855
+ /gene="fadD11"
+ /locus_tag="BQ2027_MB1576"
+ /note="Mb1576, fadD11, len: 647 aa. Equivalent to Rv1549
+ (fadD11') and Rv1550 (fadD11), len: 175 aa and 571 aa,
+ from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 167 aa overlap and 99.8% identity in 470 aa
+ overlap). Possible fadD11', fatty-acid-CoA synthetase (EC
+ 6.2.1.-), similar to the N-terminus of many fatty-acid CoA
+ synthetases e.g. NP_147860.1|NC_000854
+ long-chain-fatty-acid--CoA ligase from Aeropyrum pernix
+ (651 aa); P31685|4CL2_SOLTU 4-coumarate--CoA ligase 2 (EC
+ 6.2.1.12) from Solanum tuberosum (Potato) (545 aa), FASTA
+ scores: opt: 168, E(): 4.4e-06, (30.4% identity in 112 aa
+ overlap); etc. Possible frameshift with respect to next
+ ORF Rv1550|MTCY48.15c but we can find no sequence error to
+ account for this. Probable fadD11, fatty-acid-CoA
+ synthetase (EC 6.2.1.-), similar, except in N-terminus, to
+ many e.g. SC6A5.39|T35430 probable
+ long-chain-fatty-acid--CoA ligase (EC 6.2.1.3) from
+ Streptomyces coelicolor (612 aa); NP_301672.1|NC_002677
+ putative long-chain-fatty-acid-CoA ligase from
+ Mycobacterium leprae (600 aa); P44446|LCFH_HAEIN putative
+ long-chain-fatty-acid-CoA ligase from Haemophilus
+ influenzae (607 aa), FASTA scores: opt: 762, E(): 2.3e-38,
+ (34.4% identity in 436 aa overlap); etc. Contains PS00455
+ Putative AMP-binding domain signature. BELONGS TO THE
+ ATP-DEPENDENT AMP-BINDING ENZYME FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1549 and Rv1550 exist as 2
+ genes. In Mycobacterium bovis, a two single base
+ insertions (*-c and *-c) lead to a single product. Protein
+ product from Mb1576 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1576 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable fatty-acid-coa ligase fadd11
+ (fatty-acid-coa synthetase) (fatty-acid-coa synthase)"
+ /protein_id="SIU00179.1"
+ /db_xref="GOA:A0A1R3XYM2"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYM2"
+ /translation="MGRHGSRWSRPPCFRVLRLWTYAHRCDLGHTDPLSRRTEMTTTE
+ RPTTMCEAFQRTAVMDPDAVALRTPGGNQTMTWRDYAAQVRRVAAGLAGLGVRRGDTV
+ SLMMANRIEFYPLDVGAQHVGATSFSVYNTLPAEQLTYVFDNAGTKVVICEQQYVDRV
+ RASGVPIEHIVCVDGAPPGTLSLTDLYAAASGDFFDFESTWRAVQPEDIVTLIYTSGT
+ TGNPKGVEMTHANLLFEGYAIDEVLGIRFGDRVTSFLPSAHIADRMTGLYLQEMFGTQ
+ VTAVADARTIAAALPDVRPTVWGAVPRVWEKLKAGIEFTVARETDEMKRQALAWAMSV
+ AGKRANALLAGESMSDQLVAEWAKADESVLSKLRERLGFGELRWALSGAAPIPKETLA
+ FFAGIGIPIAEIWGMSELSCVATASHPRDGRLGTVGKLLPGLQGKIAEDGEYLVRGPL
+ VMKGYRKEPAKTAEAIDSDGWLHTGDVFDIDSDGYLRVVDRKKELIINAAGKNMSPAN
+ IENTILAACPMVGVMMAIGDGRTYNTALLVFDADSLGPYAAQRGLDASPAALAADPEV
+ IARIAAGVAEGNAKLSRVEQIKRFRILPTLWEPGGDEITLTMKLKRRRIAAKYSAEIE
+ ELYASELRPQVYEPAAVPSTQPA"
+ gene 1743869..1745734
+ /gene="plsB1"
+ /locus_tag="BQ2027_MB1577"
+ CDS 1743869..1745734
+ /gene="plsB1"
+ /locus_tag="BQ2027_MB1577"
+ /note="Mb1577, plsB1, len: 621 aa. Equivalent to Rv1551,
+ len: 621 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 621 aa overlap). Possible plsB1,
+ acyltransferase (EC 2.-.-.-), similar to PLSB_HAEIN|P44857
+ glycerol-3-phosphate acyltransferase from Haemophilus
+ influenzae (810 aa), FASTA scores: opt: 434, E(): 6.2e-22,
+ (27.6% identity in 395 aa overlap). Also similar to
+ Rv2482c|plsB2 Probable glycerol-3-phosphate
+ acyltransferase from M.tuberculosis (789 aa). Protein
+ product from Mb1577 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1577 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible acyltransferase plsB1"
+ /protein_id="SIU00180.1"
+ /db_xref="GOA:P65735"
+ /db_xref="InterPro:IPR002123"
+ /db_xref="InterPro:IPR022284"
+ /db_xref="InterPro:IPR028354"
+ /db_xref="InterPro:IPR041728"
+ /db_xref="UniProtKB/Swiss-Prot:P65735"
+ /translation="MTAREVGRIGLRKLLQRIGIVAESMTPLATDPVEVTQLLDARWY
+ DERLRALADELGRDPDSVRAEAAGYLREMAASLDERAVQAWRGFSRWLMRAYDVLVDE
+ DQITQLRKLDRKATLAFAFSHRSYLDGMLLPEAILANRLSPALTFGGANLNFFPMGAW
+ AKRTGAIFIRRQTKDIPVYRFVLRAYAAQLVQNHVNLTWSIEGGRTRTGKLRPPVFGI
+ LRYITDAVDEIDGPEVYLVPTSIVYDQLHEVEAMTTEAYGAVKRPEDLRFLVRLARQQ
+ GERLGRAYLDFGEPLPLRKRLQEMRADKSGTGSEIERIALDVEHRINRATPVTPTAVV
+ SLALLGADRSLSISEVLATVRPLASYIAARNWAVAGAADLTNRSTIRWTLHQMVASGV
+ VSVYDAGTEAVWGIGEDQHLVAAFYRNTAIHILVDRAVAELALLAAAETTTNGSVSPA
+ TVRDEALSLRDLLKFEFLFSGRAQFEKDLANEVLLIGSVVDTSKPAAAADVWRLLESA
+ DVLLAHLVLRPFLDAYHIVADRLAAHEDDSFDEEGFLAECLQVGKQWELQRNIASAES
+ RSMELFKTALRLARHRELVDGADATDIAKRRQQFADEIATATRRVNTIAELARRQ"
+ gene 1746105..1747856
+ /gene="frdA"
+ /locus_tag="BQ2027_MB1578"
+ CDS 1746105..1747856
+ /gene="frdA"
+ /locus_tag="BQ2027_MB1578"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1578, frdA, len: 583 aa. Equivalent to Rv1552,
+ len: 583 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 583 aa overlap). Probable frdA, fumarate
+ reductase, flavoprotein subunit (EC 1.3.99.1), highly
+ similar to others e.g. P00363|FRDA_ECOLI fumarate
+ reductase flavoprotein subunit from Escherichia coli
+ strain K12 (601 aa), FASTA scores: opt: 2102, E(): 0,
+ (54.7% identity in 585 aa overlap); NP_232284.1|NC_002505
+ fumarate reductase, flavoprotein subunit from Vibrio
+ cholerae (602 aa); frdA|NP_438995.1|NC_000907 fumarate
+ reductase, flavoprotein subunit from Haemophilus
+ influenzae (599 aa); etc. Contains PS00504 Fumarate
+ reductase / succinate dehydrogenase FAD-binding site. NOTE
+ THAT FUMARATE REDUCTASE FORMS PART OF AN ENZYME COMPLEX
+ CONTAINING FOUR SUBUNITS: A FLAVOPROTEIN (Rv1552|frdA), AN
+ IRON-SULFUR (Rv1553|frdB), AND TWO HYDROPHOBIC ANCHOR
+ PROTEINS (Rv1554|frdC and Rv1555|frdD). Protein product
+ from Mb1578 detected using SWATH mass spectrometry. Mb1578
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FUMARATE REDUCTASE [FLAVOPROTEIN
+ SUBUNIT] FRDA (FUMARATE DEHYDROGENASE) (FUMARIC
+ HYDROGENASE)"
+ /protein_id="SIU00181.1"
+ /db_xref="GOA:P64175"
+ /db_xref="InterPro:IPR003952"
+ /db_xref="InterPro:IPR003953"
+ /db_xref="InterPro:IPR005884"
+ /db_xref="InterPro:IPR014006"
+ /db_xref="InterPro:IPR015939"
+ /db_xref="InterPro:IPR027477"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="InterPro:IPR037099"
+ /db_xref="UniProtKB/Swiss-Prot:P64175"
+ /translation="MTAQHNIVVIGGGGAGLRAAIAIAETNPHLDVAIVSKVYPMRSH
+ TVSAEGGAAAVTGDDDSLDEHAHDTVSGGDWLCDQDAVEAFVAEAPKELVQLEHWGCP
+ WSRKPDGRVAVRPFGGMKKLRTWFAADKTGFHLLHTLFQRLLTYSDVMRYDEWFATTL
+ LVDDGRVCGLVAIELATGRIETILADAVILCTGGCGRVFPFTTNANIKTGDGMALAFR
+ AGAPLKDMEFVQYHPTGLPFTGILITEAARAEGGWLLNKDGYRYLQDYDLGKPTPEPR
+ LRSMELGPRDRLSQAFVHEHNKGRTVDTPYGPVVYLDLRHLGADLIDAKLPFVRELCR
+ DYQHIDPVVELVPVRPVVHYMMGGVHTDINGATTLPGLYAAGETACVSINGANRLGSN
+ SLPELLVFGARAGRAAADYAARHQKSDRGPSSAVRAQARTEALRLERELSRHGQGGER
+ IADIRADMQATLESAAGIYRDGPTLTKAVEEIRVLQERFATAGIDDHSRTFNTELTAL
+ LELSGMLDVALAIVESGLRREESRGAHQRTDFPNRDDEHFLAHTLVHRESDGTLRVGY
+ LPVTITRWPPGERVYGR"
+ gene 1747859..1748983
+ /gene="frdBC"
+ /locus_tag="BQ2027_MB1579"
+ CDS 1747859..1748983
+ /gene="frdBC"
+ /locus_tag="BQ2027_MB1579"
+ /note="Mb1579, frdBC, len: 374 aa. Equivalent to Rv1553
+ (frdB) and Rv1554 (frdC), len: 247 aa and len: 126 aa,
+ from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 247 aa overlap and 99.2% identity in 126 aa
+ overlap). Probable frdB, fumarate reductase, iron-sulfur
+ subunit (EC 1.3.99.1), highly similar to others e.g.
+ P00364|FRDB_ECOLI fumarate reductase iron-sulfur protein
+ from Escherichia coli strain K12 (243 aa), FASTA scores:
+ opt: 846, E(): 0, (50.0% identity in 242 aa overlap);
+ P20921|FRDB_PROVU FUMARATE REDUCTASE IRON-SULFUR PROTEIN
+ from Proteus vulgaris (245 aa); G64097 fumarate reductase
+ (EC 1.3.99.1) iron-sulfur protein from Haemophilus
+ influenzae (276 aa); etc. Contains PS00198 4Fe-4S
+ ferredoxins, iron-sulfur binding region signature. And
+ probable frdC, fumarate reductase, membrane-anchor subunit
+ (EC 1.3.99.1), highly similar to others e.g.
+ P03805|FRDC_ECOLI fumarate reductase 15 kDa hydrophobic
+ protein from Escherichia coli strain K12 (131 aa), FASTA
+ scores, opt: 268, E(): 3.9e-10, (31.1% identity in 122 aa
+ overlap); NP_458780.1|NC_003198 fumarate reductase complex
+ subunit C; membrane anchor polypeptide from Salmonella
+ enterica subsp. enterica serovar Typhi (131 aa);
+ P20923|FRDC_PROVU FUMARATE REDUCTASE 15 KD HYDROPHOBIC
+ PROTEIN from Proteus vulgaris (131 aa); etc. NOTE THAT
+ FUMARATE REDUCTASE FORMS PART OF AN ENZYME COMPLEX
+ CONTAINING FOUR SUBUNITS: A FLAVOPROTEIN (Rv1552|frdA), AN
+ IRON-SULFUR (Rv1553|frdB), AND TWO HYDROPHOBIC ANCHOR
+ PROTEINS (Rv1554|frdC and Rv1555|frdD).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1553 and Rv1554 exist as 2
+ genes. In Mycobacterium bovis, a 4 bp insertion (*-gggg)
+ leads to a single product. Mb1579 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable fumarate reductase [membrane anchor
+ subunit] frdc (fumarate dehydrogenase) (fumaric
+ hydrogenase)"
+ /protein_id="SIU00182.1"
+ /db_xref="GOA:A0A1R3XYM8"
+ /db_xref="InterPro:IPR003510"
+ /db_xref="InterPro:IPR004489"
+ /db_xref="InterPro:IPR009051"
+ /db_xref="InterPro:IPR012675"
+ /db_xref="InterPro:IPR017896"
+ /db_xref="InterPro:IPR017900"
+ /db_xref="InterPro:IPR025192"
+ /db_xref="InterPro:IPR034804"
+ /db_xref="InterPro:IPR036010"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYM8"
+ /translation="MMDRIVMEVSRYRPEIESAPTFQAYEVPLTREWAVLDGLTYIKD
+ HLDGTLSFRWSCRMGICGSSGMTINGDPKLACATFLADYLPGPVRVEPMRNFPVIRDL
+ VVDISDFMAKLPSVKPWLVRHDEPPVEDGEYRQTPAELDAFKQFSMCINCMLCYSACP
+ VYALDPDFLGPAAIALGQRYNLDSRDQGAADRRDVLAAADGAWACTLVGECSTACPKG
+ VDPAGAIQRYKLTAATHALKKLLFPWGGGRMSAYRQPVERYWWARRRSYLRFMLREIS
+ CIFVAWFVLYLVLVLRAVGAGGNSYQRFLDFSANPVVVVLNVVALSFLLLHAVTWFGS
+ APRAMVIQVRGRRVPARAVLAGHYAAWLVVSVIVAWMVLS"
+ gene 1748980..1749357
+ /gene="frdD"
+ /locus_tag="BQ2027_MB1580"
+ CDS 1748980..1749357
+ /gene="frdD"
+ /locus_tag="BQ2027_MB1580"
+ /note="Mb1580, frdD, len: 125 aa. Equivalent to Rv1555,
+ len: 125 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 125 aa overlap). Probable frdD, fumarate
+ reductase, membrane-anchor subunit (EC 1.3.99.1), similar
+ to others e.g. P03806|FRDD_ECOLI fumarate reductase 13 kDa
+ hydrophobic protein from Escherichia coli strain K12 (119
+ aa), FASTA scores: opt: 212, E(): 4.4e-08, (36.8% identity
+ in 106 aa overlap); etc. NOTE THAT FUMARATE REDUCTASE
+ FORMS PART OF AN ENZYME COMPLEX CONTAINING FOUR SUBUNITS:
+ A FLAVOPROTEIN (Rv1552|frdA), AN IRON-SULFUR
+ (Rv1553|frdB), AND TWO HYDROPHOBIC ANCHOR PROTEINS
+ (Rv1554|frdC and Rv1555|frdD). Protein product from Mb1580
+ detected using shotgun mass spectrometry. Mb1580 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FUMARATE REDUCTASE [MEMBRANE ANCHOR
+ SUBUNIT] FRDD (FUMARATE DEHYDROGENASE) (FUMARIC
+ HYDROGENASE)"
+ /protein_id="SIU00183.1"
+ /db_xref="GOA:P67644"
+ /db_xref="InterPro:IPR003418"
+ /db_xref="InterPro:IPR034804"
+ /db_xref="UniProtKB/Swiss-Prot:P67644"
+ /translation="MTPSTSDARSRRRSAEPFLWLLFSAGGMVTALVAPVLLLLFGLA
+ FPLGWLDAPDHGHLLAMVRNPITKLVVLVLVVLALFHAAHRFRFVLDHGLQLGRFDRV
+ IALWCYGMAVLGSATAGWMLLTM"
+ gene 1749425..1750033
+ /locus_tag="BQ2027_MB1581"
+ CDS 1749425..1750033
+ /locus_tag="BQ2027_MB1581"
+ /note="Mb1581, -, len: 202 aa. Equivalent to Rv1556, len:
+ 202 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 202 aa overlap). Possible regulatory
+ protein, similar to X86780|SHGCPIR2|g987088 orfY,
+ regulator of antibiotic transport complexes from
+ Streptomyces hygroscopicus (204 aa), FASTA score: opt:
+ 251, E(): 1.7e-10, (33.8% identity in 201 aa overlap) and
+ others. Protein product from Mb1581 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1581
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible regulatory protein"
+ /protein_id="SIU00184.1"
+ /db_xref="GOA:P67437"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR011075"
+ /db_xref="InterPro:IPR023772"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/Swiss-Prot:P67437"
+ /translation="MVGAVTQIADRPTDPSPWSPRETELLAVTLRLLQEHGYDRLTVD
+ AVAASARASKATVYRRWPSKAELVLAAFIEGIRQVAVPPNTGNLRDDLLRLGELICRE
+ VGQHASTIRAVLVEVSRNPALNDVLQHQFVDHRKALIQYILQQAVDRGEISSAAISDE
+ LWDLLPGYLIFRSIIPNRPPTQDTVQALVDDVILPSLTRSTG"
+ gene 1750172..1750618
+ /gene="mmpS6"
+ /locus_tag="BQ2027_MB1582"
+ CDS 1750172..1750618
+ /gene="mmpS6"
+ /locus_tag="BQ2027_MB1582"
+ /note="Mb1582, mmpS6, len: 148 aa. No equivalent in
+ Mycobacterium tuberculosis strain H37Rv. Probable mmpS6,
+ conserved membrane protein (see citations below), highly
+ similar to other Mycobacterial proteins e.g.
+ P54880|MMS4_MYCLE|ML2377|U1740W|MMPS4 Putative membrane
+ protein from Mycobacterium leprae (154 aa), FASTA scores:
+ opt: 521, E(): 4.7e-29, (53.06% identity in 147 aa
+ overlap);
+ P95212|MMPS1|MMS1_MYCTU|Rv0403c|MT0415|MTCY04D9.16c
+ PROBABLE CONSERVED MEMBRANE PROTEIN from Mycobacterium
+ tuberculosis (142 aa), FASTA scores: opt: 518, E():
+ 7.2e-29, (56.75% identity in 141 aa overlap);
+ O53736|MMS4_MYCTU|MMPS4|Rv0451c|MT0467|MTV037.15c PROBABLE
+ CONSERVED MEMBRANE PROTEIN from Mycobacterium tuberculosis
+ (140 aa), FASTA scores: opt: 498, E(): 1.8e-27, (52.85%
+ identity in 140 aa overlap); etc. BELONGS TO THE MMPS
+ FAMILY. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a 2153 bp insertion leads to a new protein with no
+ equivalent in Mycobacterium tuberculosis strain H37Rv.
+ Belongs to the TbD1 region. Mb1582 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN MMPS6"
+ /protein_id="SIU00185.1"
+ /db_xref="GOA:A0A1R3XYN3"
+ /db_xref="InterPro:IPR008693"
+ /db_xref="InterPro:IPR038468"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYN3"
+ /translation="MQGISVTGLVKRGWMVLVAVAVVAVAGFSVYRLHGIFGSHDTTS
+ TAGGVANDIKPFNPKQVTLEVFGAPGTVATINYLDVDATPRQVLDTTLPWSYTITTTL
+ PAVFANVVAQGDSNSIGCRITVNGVVKDERIVNEVRAYTFCLDKSS"
+ gene 1750615..1753518
+ /gene="mmpL6"
+ /locus_tag="BQ2027_MB1583"
+ CDS 1750615..1753518
+ /gene="mmpL6"
+ /locus_tag="BQ2027_MB1583"
+ /note="Mb1583, mmpL6, len: 967 aa. Equivalent to 3' end of
+ Rv1557, len: 397 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.5% identity in 384 aa overlap). Probable
+ mmpL6, conserved transmembrane transport protein (see
+ citations below). Member of RND superfamily, with strong
+ similarity to other members of large Mycobacterial
+ membrane protein family belonging to RND superfamily e.g.
+ Q11171|MML2_MYCTU|MMPL2|Rv0507|MT0528|MTCY20G9.34 PROBABLE
+ CONSERVED TRANSMEMBRANE TRANSPORT PROTEIN from
+ Mycobacterium tuberculosis (968 aa), FASTA scores: opt:
+ 4142, E(): 0, (64.4% identity in 947 aa overlap);
+ O53735|MML4_MYCTU|MMPL4|Rv0450c|MT0466|MTV037.14c PROBABLE
+ CONSERVED TRANSMEMBRANE TRANSPORT PROTEIN from
+ Mycobacterium tuberculosis (967 aa), FASTA scores: opt:
+ 4035, E(): 0, (61.5% identity in 948 aa overlap);
+ P54881|MML4_MYCLE|MMPL4|ML2378|U1740V Putative membrane
+ protein from Mycobacterium leprae (959 aa), FASTA scores:
+ opt: 3961, E(): 0, (60.95% identity in 945 aa overlap);
+ etc. BELONGS TO THE MMPL FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 2153 bp insertion leads to a longer product compared to
+ its homolog in Mycobacterium tuberculosis strain H37Rv.
+ Belongs to the TbD1 region. Mb1583 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL6"
+ /protein_id="SIU00186.1"
+ /db_xref="GOA:A0A1R3XZ18"
+ /db_xref="InterPro:IPR000731"
+ /db_xref="InterPro:IPR004707"
+ /db_xref="InterPro:IPR004869"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ18"
+ /translation="MSNHHRPRPWLPHTIRRLSLPILLFWVGVAAITNAAVPQLEVVG
+ EAHNVAQSSPDDPSLQAMKRIGKVFHEFDSDSAAMIVLEGDKPLGNDAHRFYDTLLRN
+ LSNDTKHVEHVQDFWGDPLTAAGSQSTDGKAAYVQVYLAGNQGEALSIESVDAVRDIV
+ AHTPPPAGVKAYVTGAAPLMADQFQVGSKGTAKVTGITLVVIAVMLLFVYRSVVTMVL
+ VLITVLIELAAARGIVAFLGNAGVIGLSTYSTNLLTLLVIAAGTDYAIFVLGRYHEAR
+ YAAQDRETAFYTMYRGTAHVVLGSGLTVAGAVYCLSFTRLPYFQSLGIPASIGVMIAL
+ AAALSLAPSVLILGSRFGCFEPKRRMRTRGWRRIGTAIVRWPGPILAVACAIAVVGLL
+ ALPGYKTSYDARYYMPATAPANIGYMAAERHFPQARLNPELLMIETDHDMRNPADMLI
+ LDRIAKAVFHLPGIGLVQAMTRPLGTPIDHSSIPFQISMQSVGQIQNLKYQRDRAADL
+ LKQAEELGKTIEILQRQYALQQELAAATHEQAESFHQTIATVKELRDRIANFDDFFRP
+ IRSYFYWEKHCYDIPSCWALRSVFDTIDGIDQLGEQLASVTVTLDKLAAIQPQLVALL
+ PDEIASQQINRELALANYATMSGIYAQTAALIENAAAMGQAFDAAKNDDSFYLPPEAF
+ DNPDFQRGLKLFLSADGKAARMIISHEGDPATPEGISHIDAIKQAAHEAVKGTPMAGA
+ GIYLAGTAATFKDIQDGATYDLLIAGIAALSLILLIMMIITRSLVAALVIVGTVALSL
+ GASFGLSVLVWQHLLGIQLYWIVLALAVILLLAVGSDYNLLLISRFKEEIGAGLNTGI
+ IRAMAGTGGVVTAAGLVFAATMSSFVFSDLRVLGQIGTTIGLGLLFDTLVVRAFMTPS
+ IAVLLGRWFWWPQRVRPRPASRMLRPYGPRPVVRELLLREGNDDPRTQVATHR"
+ gene 1753528..1753974
+ /locus_tag="BQ2027_MB1584"
+ CDS 1753528..1753974
+ /locus_tag="BQ2027_MB1584"
+ /EC_number="1.1.98.-"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1584, -, len: 148 aa. Equivalent to Rv1558, len:
+ 148 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 148 aa overlap). Conserved hypothetical
+ protein, similar to other Mycobacterial tuberculosis
+ proteins e.g. P71854|MTCY03C7.09c|Rv3547 (151 aa), FASTA
+ scores opt: 330, E(): 9.1e-17, (39.7% identity in 151 aa
+ overlap); also Q11057|Rv1261c (149 aa), and O53328|Rv3178
+ (119 aa). Similar also to AF072709|AF072709_5 Hypothetical
+ protein with a new amplifiable element AUD4 from
+ Streptomyces lividans (149 aa), FASTA scores: opt: 695,
+ E(): 0, (69.1% identity in 149 aa overlap). Protein
+ product from Mb1584 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1584 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="F420H(2)-dependent quinone reductase Rv1558
+ (Fqr) (EC"
+ /protein_id="SIU00187.1"
+ /db_xref="GOA:P64876"
+ /db_xref="InterPro:IPR004378"
+ /db_xref="InterPro:IPR012349"
+ /db_xref="UniProtKB/Swiss-Prot:P64876"
+ /translation="MPLSGEYAPSPLDWSREQADTYMKSGGTEGTQLQGKPVILLTTV
+ GAKTGKLRKTPLMRVEHDGQYAIVASLGGAPKNPVWYHNVVKNPRVELQDGTVTGDYD
+ AREVFGDEKAIWWQRAVAVWPDYASYQTKTDRQIPVFVLTPVRAGG"
+ gene 1754009..1755298
+ /gene="ilvA"
+ /locus_tag="BQ2027_MB1585"
+ CDS 1754009..1755298
+ /gene="ilvA"
+ /locus_tag="BQ2027_MB1585"
+ /note="Mb1585, ilvA, len: 429 aa. Equivalent to Rv1559,
+ len: 429 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 429 aa overlap). Probable ilvA,
+ threonine dehydratase (EC 4.3.1.19), biosynthetic protein,
+ similar to several e.g. THD1_CORGL|Q04513 threonine
+ dehydratase biosynthetic (436 aa), FASTA scores: opt:
+ 1694, E(): 0, (61.9% identity in 415 aa overlap). Contains
+ PS00165 Serine/threonine dehydratases pyridoxal-phosphate
+ attachment site. Protein product from Mb1585 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1585 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable threonine dehydratase ilvA"
+ /protein_id="SIU00188.1"
+ /db_xref="GOA:P66898"
+ /db_xref="InterPro:IPR000634"
+ /db_xref="InterPro:IPR001721"
+ /db_xref="InterPro:IPR001926"
+ /db_xref="InterPro:IPR011820"
+ /db_xref="InterPro:IPR036052"
+ /db_xref="InterPro:IPR038110"
+ /db_xref="UniProtKB/Swiss-Prot:P66898"
+ /translation="MSAELSQSPSSSPLFSLSGADIDRAAKRIAPVVTPTPLQPSDRL
+ SAITGATVYLKREDLQTVRSYKLRGAYNLLVQLSDEELAAGVVCSSAGNHAQGFAYAC
+ RCLGVHGRVYVPAKTPKQKRDRIRYHGGEFIDLIVGGSTYDLAAAAALEDVERTGATL
+ VPPFDDLRTIAGQGTIAVEVLGQLEDEPDLVVVPVGGGGCIAGITTYLAERTTNTAVL
+ GVEPAGAAAMMAALAAGEPVTLDHVDQFVDGAAVNRAGTLTYAALAAAGDMVSLTTVD
+ EGAVCTAMLDLYQNEGIIAEPAGALSVAGLLEADIEPGSTVVCLISGGNNDVSRYGEV
+ LERSLVHLGLKHYFLVDFPQEPGALRRFLDDVLGPNDDITLFEYVKRNNRETGEALVG
+ IELGSAADLDGLLARMRATDIHVEALEPGSPAYRYLL"
+ gene 1755336..1755554
+ /gene="vapb11"
+ /locus_tag="BQ2027_MB1586"
+ CDS 1755336..1755554
+ /gene="vapb11"
+ /locus_tag="BQ2027_MB1586"
+ /note="Mb1586, -, len: 72 aa. Equivalent to Rv1560, len:
+ 72 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 72 aa overlap). Conserved hypothetical
+ protein, part of a Mycobacterial tuberculosis family of
+ proteins e.g. Q10848|Rv2009|MTCY39.08c (80 aa), FASTA
+ score: (54.4% identity in 68 aa overlap);
+ Q10799|Rv2871|MTCY274.02 (85 aa); O50456|Rv1241|MTV006.13
+ (86 aa), O06243|Rv2132|MTCY270.36C (76 aa); etc. Mb1586
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb11"
+ /protein_id="SIU00189.1"
+ /db_xref="InterPro:IPR019239"
+ /db_xref="UniProtKB/Swiss-Prot:P64878"
+ /translation="MYRWCMSRTNIDIDDELAAEVMRRFGLTTKRAAVDLALRRLVGS
+ PLSREFLLGLEGVGWEGDLDDLRSDRPD"
+ gene 1755560..1755964
+ /gene="vapc11"
+ /locus_tag="BQ2027_MB1587"
+ CDS 1755560..1755964
+ /gene="vapc11"
+ /locus_tag="BQ2027_MB1587"
+ /note="Mb1587, -, len: 134 aa. Equivalent to Rv1561, len:
+ 134 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 134 aa overlap). Conserved hypothetical
+ protein, similar to others from Mycobacterium tuberculosis
+ e.g. Q10847|Rv2010|MTCY39.07c (132 aa), FASTA scores:
+ (37.0% identity in 127 aa overlap); and
+ O06566|Rv1114|MTCY22G8.03 (124 aa). Protein product from
+ Mb1587 detected using SWATH mass spectrometry. Mb1587
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc11"
+ /protein_id="SIU00190.1"
+ /db_xref="GOA:P64880"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/Swiss-Prot:P64880"
+ /translation="MILIDTSAWVEYFRATGSIAAVEVRRLLSEEAARIAMCEPIAME
+ ILSGALDDNTHTTLERLVNGLPSLNVDDAIDFRAAAGIYRAARRAGETVRSINDCLIA
+ ALAIRHGARIVHRDADFDVIARITNLQAASFR"
+ gene complement(1755981..1757723)
+ /gene="treZ"
+ /locus_tag="BQ2027_MB1588C"
+ CDS complement(1755981..1757723)
+ /gene="treZ"
+ /locus_tag="BQ2027_MB1588C"
+ /standard_name="glgZ"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1588c, treZ, len: 580 aa. Equivalent to Rv1562c,
+ len: 580 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 580 aa overlap). treZ (previously
+ called glgZ), Maltooligosyltrehalose trehalohydrolase,
+ confirmed biochemically (see citation below). Similar to
+ Q44316|D63343 TREZ MALTOOLIGOSYL TREHALOSE
+ TREHALOHYDROLASE from ARTHROBACTER SP (598 aa), FASTA
+ scores: opt: 2071, E(): 0, (52.2% identity in 582 aa
+ overlap); also similar to 1,4-alpha-glucan branching
+ enzymes e.g. GLGB_BACST|P30538 (639 aa), FASTA scores:
+ opt: 313, E(): 3.8e-13, (27.5% identity in 462 aa
+ overlap). Also similar to Mycobacterium tuberculosis
+ proteins Rv1326c|glgB, and Rv1563c treY (previously glgY).
+ Protein product from Mb1588c detected using SWATH mass
+ spectrometry. Mb1588c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Maltooligosyltrehalose trehalohydrolase TreZ"
+ /protein_id="SIU00191.1"
+ /db_xref="GOA:A0A1R3XYM9"
+ /db_xref="InterPro:IPR006047"
+ /db_xref="InterPro:IPR012768"
+ /db_xref="InterPro:IPR013783"
+ /db_xref="InterPro:IPR014756"
+ /db_xref="InterPro:IPR017853"
+ /db_xref="InterPro:IPR022567"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYM9"
+ /translation="MPEFRVWAPKPALVRLDVNGAVHAMTRSADGWWHTTVAAPADAR
+ YGYLLDDDPTVLPDPRSARQPDGVHARSQRWEPPGQFGAARTDTGWPGRSVEGAVIYE
+ LHIGTFTTAGTFDAAIEKLDYLVDLGIDFVELMPVNSFAGTRGWGYDGVLWYSVHEPY
+ GGPDGLVRFIDACHTRRLGVLIDAVFNHLGPSGNYLPRFGPYLSSASNPWGDGINIAG
+ ADSDEVRHYIIDCALRWMRDFHADGLRLDAVHALVDTTAVHVLEELANATRWLSGQLG
+ RPLSLIAETDRNDPRLITRPSHGGYGITAQWNDDIHHAIHTAVSGERQGYYADFGSLA
+ TLAYTLRNGYFHAGTYSSFRRRRHGRALDTSAIPATRLLAYTCTHDQVGNRALGDRPS
+ QYLTGGQLAIKAALTLGSPYTAMLFMGEEWGASSPFQFFCSHPEPELAHSTVAGRKEE
+ FAEHGWAADDIPDPQDPQTFQRCKLNWAEAGSGEHARLHRFYRDLIALRHNEADLADP
+ WLDHLMVDYDEQQRWVVMRRGQLMIACNLGAEPTCVPVSGELVLAWESPIIGDNSTEL
+ AAYSLAILRAAEPA"
+ gene complement(1757716..1758450)
+ /gene="treYb"
+ /locus_tag="BQ2027_MB1589C"
+ CDS complement(1757716..1758450)
+ /gene="treYb"
+ /locus_tag="BQ2027_MB1589C"
+ /standard_name="glgY"
+ /note="Mb1589c, treYb, len: 244 aa. Equivalent to the 3'
+ end of Rv1563c, len: 765 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100% identity in 244 aa
+ overlap). treY (previously called glgY), maltooligosyl
+ trehalose synthase, confirmed biochemically (see citation
+ below). Strong similarity to Q44315|63343 TREY
+ MALTOOLIGOSYL TREHALOSE SYNTHASE from ARTHROBACTER SP (775
+ aa), fasta scores: opt: 1953, E(): 0; (46.0% identity in
+ 789 aa overlap). Some similarity to alpha-amylases and to
+ MTCY48.03 (30.2% identity in 215 aa overlap). May catalyse
+ conversion of maltodextrins to maltooligosyl trehaloses.
+ Also similar to Mycobacterium tuberculosis glgB (Rv1326c),
+ treZ (Rv1562c). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1563c/treY
+ exists as a single gene. In Mycobacterium bovis, a large
+ deletion of 806 bp splits Rv1563c into two parts, treYa
+ and treYb. Protein product from Mb1589c detected using
+ SWATH mass spectrometry. Mb1589c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Maltooligosyltrehalose synthase TreYb [SECOND
+ PART]"
+ /protein_id="SIU00192.1"
+ /db_xref="InterPro:IPR017853"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYN8"
+ /translation="MTGQFLWQNVFGVWPVSGEVSAALRGRLHTYAEKAIREAAWHTS
+ WHNPNRAFEDDVHGWLDLVLDGPLASELTGLVAHLNSHAESDALAAKLLALTVPGVPD
+ VYQGSELWDDSLVDPDNRRPVDYGTRRVALKALQHPKIRVLAAALRLRRTHPESFLGG
+ AYHPVFAAGPAADHVVAFRRGDDILVAVTRWTVRLQQTGWDHTVLPLPDGSWTDALTG
+ FTASGHTPAVELFADLPVVLLVRDNA"
+ gene complement(1758455..1759207)
+ /gene="treYa"
+ /locus_tag="BQ2027_MB1590C"
+ CDS complement(1758455..1759207)
+ /gene="treYa"
+ /locus_tag="BQ2027_MB1590C"
+ /standard_name="glgY"
+ /note="Mb1590c, treYa, len: 250 aa. Equivalent to the 5'
+ end of Rv1563c, len: 765 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (97.4% identity in 191 aa
+ overlap). treY (previously called glgY), maltooligosyl
+ trehalose synthase, confirmed biochemically (see citation
+ below). Strong similarity to Q44315|63343 TREY
+ MALTOOLIGOSYL TREHALOSE SYNTHASE from ARTHROBACTER SP (775
+ aa), fasta scores: opt: 1953, E(): 0; (46.0% identity in
+ 789 aa overlap). Some similarity to alpha-amylases and to
+ MTCY48.03 (30.2% identity in 215 aa overlap). May catalyse
+ conversion of maltodextrins to maltooligosyl trehaloses.
+ Also similar to Mycobacterium tuberculosis glgB (Rv1326c),
+ treZ (Rv1562c). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1563c/treY
+ exists as a single gene. In Mycobacterium bovis, a large
+ deletion of 806 bp splits Rv1563c in two parts, treYa and
+ treYb. Mb1590c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Maltooligosyltrehalose synthase TreYa [FIRST
+ PART]"
+ /protein_id="SIU00193.1"
+ /db_xref="GOA:A0A1R3Y0U5"
+ /db_xref="InterPro:IPR006047"
+ /db_xref="InterPro:IPR017853"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0U5"
+ /translation="MAFPVISTYRVQMRGRSNGFGFTFADAENLLDYLDDLGVSHLYL
+ SPILTAVGGSTHGYDVTDPTTVSPELGGSDGLARLSAAARSRGMGLIVDIVPSHVGVG
+ KPEQNAWWWDVLKFGRSSAYAEFFDIDWELGDGRIILPLLGSDSDVANLRVDGDLLRL
+ GDLALPVAPGSGDGTGPAVHDRQHSVWCGRRGVSSPGRHPCSVVATVHDDTVHPRHQT
+ RRGRACPHRRAVPSAVAVGQVHRPRPSHCARP"
+ gene complement(1759211..1761376)
+ /gene="treX"
+ /locus_tag="BQ2027_MB1591C"
+ CDS complement(1759211..1761376)
+ /gene="treX"
+ /locus_tag="BQ2027_MB1591C"
+ /standard_name="glgX"
+ /note="Mb1591c, treX, len: 721 aa. Equivalent to Rv1564c,
+ len: 721 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 721 aa overlap). Probable treX
+ (previously called glgX), Maltooligosyltrehalose synthase.
+ Strong similarity to D83245|g1890053 treX, glycogen
+ debranching enzyme (glgX) from Sulfolobus acidocaldarius
+ (713 aa), FASTA score: opt: 2396, E(): 0, (48.4% identity
+ in 709 aa overlap); similar to GLGX_HAEIN|P45178 glycogen
+ operon protein glgx (659 aa), FASTA scores: opt: 1512,
+ E(): 0, (42.3% identity in 645 aa overlap). Protein
+ product from Mb1591c detected using SWATH mass
+ spectrometry. Mb1591c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable maltooligosyltrehalose synthase trex"
+ /protein_id="SIU00194.1"
+ /db_xref="GOA:P0A4Y5"
+ /db_xref="InterPro:IPR004193"
+ /db_xref="InterPro:IPR006047"
+ /db_xref="InterPro:IPR011837"
+ /db_xref="InterPro:IPR013780"
+ /db_xref="InterPro:IPR013783"
+ /db_xref="InterPro:IPR014756"
+ /db_xref="InterPro:IPR017853"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4Y5"
+ /translation="MSSNNAGESDGTGPALPTVWPGNAYPLGATYDGAGTNFSLFSEI
+ AEKVELCLIDEDGVESRIPLDEVDGYVWHAYLPNITPGQRYGFRVHGPFDPAAGHRCD
+ PSKLLLDPYGKSFHGDFTFGQALYSYDVNAVDPDSTPPMVDSLGHTMTSVVINPFFDW
+ AYDRSPRTPYHETVIYEAHVKGMTQTHPSIPPELRGTYAGLAHPVIIDHLNELNVTAV
+ ELMPVHQFLHDSRLLDLGLRNYWGYNTFGFFAPHHQYASTRQAGSAVAEFKTMVRSLH
+ EAGIEVILDVVYNHTAEGNHLGPTINFRGIDNTAYYRLMDHDLRFYKDFTGTGNSLNA
+ RHPHTLQLIMDSLRYWVIEMHVDGFRFDLASTLARELHDVDRLSAFFDLVQQDPVVSQ
+ VKLIAEPWDVGEGGYQVGNFPGLWTEWNGKYRDTVRDYWRGEPATLGEFASRLTGSSD
+ LYEATGRRPSASINFVTAHDGFTLNDLVSYNDKHNEANGENNRDGESYNRSWNCGVEG
+ PTDDPDILALRARQMRNMWATLMVSQGTPMIAHGDEIGRTQYGNNNVYCQDSELSWMD
+ WSLVDKNADLLAFARKATTLRKNHKVFRRRRFFEGEPIRSGDEVRDIAWLTPSGREMT
+ HEDWGRGFDRCVAVFLNGEAITAPDARGERVVDDSFLLCFNAHDHDVEFVMPHDGYAQ
+ QWTGELDTNDPVGDIDLTVTATDTFSVPARSLLVLRKTL"
+ gene complement(1761415..1763604)
+ /locus_tag="BQ2027_MB1592C"
+ CDS complement(1761415..1763604)
+ /locus_tag="BQ2027_MB1592C"
+ /note="Mb1592c, -, len: 729 aa. Equivalent to Rv1565c,
+ len: 729 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 729 aa overlap). Conserved hypothetical
+ membrane protein, some similarity to O05402 HYPOTHETICAL
+ 72.2 KD PROTEIN from Bacillus subtilis (634 aa), FASTA
+ results: opt: 384, E(): 4.8e-17, (29.1% identity in 378 aa
+ overlap); and to Y392_HAEIN|P43993 hypothetical protein
+ hi0392 from H. influenzae (245 aa), FASTA results: opt:
+ 265, E(): 5.5e-10, (28.3% identity in 247 aa overlap).
+ C-terminal half equivalent to AL049478|MLCL458_19 (274 aa)
+ (78.5% identity in 274 aa overlap). Also similar to M.
+ tuberculosis hypothetical proteins Rv0111, Rv0228, Rv1254,
+ Rv0517. N-terminal half hydrophobic. Protein product from
+ Mb1592c detected using SWATH mass spectrometry. Mb1592c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="O-antigen acetylase"
+ /protein_id="SIU00195.1"
+ /db_xref="GOA:A0A1R3XYP2"
+ /db_xref="InterPro:IPR002656"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYP2"
+ /translation="MLTLSPPRPPALTPEPALPPVTMGTRTTGFYRHDLDGLRGVAIA
+ LVAVFHVWFGRVSGGVDVFLALSGFFFGGKILRAALNPDLSLSPIAEVIRLIRRLLPA
+ LVVVLAGCALLTIAIQPQTRWEAFANQSLASLGYYQNWELASTVSNYLRAGEAVSPLQ
+ HIWSMSVQGQFYLAFLLLVAGCAYLLRRLFRGPRAPYLRTMFVVLLSTLTLASFIYAI
+ VAHHAYQATAYYNTFARAWELLAGALVGAVVPHVRWPMWLRTAVATAALAAILSCGAL
+ IDGVKEFPGPWALVPVGATMLMILAGANRQGHPGTRDRLPLPNRLLATAPLVALGAMA
+ YSWYLWHWPLLIFWLSYTGHRHANFVEGAAVLLVSGLLAYLTTRLVEDPLRYRAPAGV
+ RSPAAVPPIPWRLRLRRPTIVLGSVVALLGVALTATSFTWREHVIVQRAAGKELSGLS
+ SRDYPGARALIDHVRVPKLRMRPTVLEVRHDLPTSTKDGCISDFVNPAIINCTYGDVD
+ APRTIALAGGSHAEHWLTALDLLGRMHHFKVVTYLKMGCPLSTEEVPLIMGNNAPYPQ
+ CHQWVQAAMAKLVADHPDYVFTTSTRPWNIKPGDVMPATYVGIWQTFADNNIPVLAMR
+ DTPWLVKDGQPFIPADCLAKGGNPQSCGIARSKVLVDRNPTLDFVARFPLLKPLDMSD
+ AICRTDTCRAVEGNVLVYRDSHHLTPTYMRTMTSELGRQIAANTDWW"
+ gene complement(1763703..1764395)
+ /locus_tag="BQ2027_MB1593C"
+ CDS complement(1763703..1764395)
+ /locus_tag="BQ2027_MB1593C"
+ /note="Mb1593c, -, len: 230 aa. Equivalent to Rv1566c,
+ len: 230 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 230 aa overlap). Possible inv protein,
+ probably exported as has QQAPV repeats at C-terminus.
+ Similar to Q49634 inv protein from Mycobacterium leprae
+ (246 aa), FASTA scores: opt: 957, E(): 0, (70.0% identity
+ in 207 aa overlap); also to putative invasins 1,2 (O07390,
+ O07391) from M. avium. Slightly similar to C-terminus of
+ P60_LISMO|P21171 Listeria invasion-associated protein p60
+ precursor. Also similar to Mycobacterium tuberculosis p60
+ homologues Rv1477, Rv1478, Rv0024, Rv2190c. Protein
+ product from Mb1593c detected using SWATH mass
+ spectrometry. Mb1593c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible inv protein"
+ /protein_id="SIU00196.1"
+ /db_xref="InterPro:IPR000064"
+ /db_xref="InterPro:IPR038765"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ27"
+ /translation="MKRSMKSGSFAIGLAMMLAPMVAAPGLAAADPATRPVDYQQITD
+ VVIARGLSQRGVPFSWAGGGISGPTRGTGTGINTVGFDASGLIQYAYAGAGLKLPRSS
+ GQMYKVGQKVLPQQARKGDLIFYGPEGTQSVALYLGKGQMLEVGDVVQVSPVRTNGMT
+ PYLVRVLGTQPTPVQQAPVQPAPVQQAPVQQAPVQQAPVQQAPVQQAPVQQAPVQQAP
+ VQPPPFGTARSR"
+ gene complement(1764635..1764919)
+ /locus_tag="BQ2027_MB1594C"
+ CDS complement(1764635..1764919)
+ /locus_tag="BQ2027_MB1594C"
+ /note="Mb1594c, -, len: 94 aa. Equivalent to Rv1567c, len:
+ 94 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 94 aa overlap). Probable membrane protein.
+ Mb1594c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable hypothetical membrane protein"
+ /protein_id="SIU00197.1"
+ /db_xref="GOA:A0A1R3XYQ4"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYQ4"
+ /translation="MVTMTSWPSRLFAFTDNVCPPDACPLVPFGVNYYIYPVMWGGIG
+ AAIATAVIGPFVSMLKGWYMSFWPIISIAVITVTSIAGYAIAGFSERYWH"
+ gene 1765167..1766480
+ /gene="bioA"
+ /locus_tag="BQ2027_MB1595"
+ CDS 1765167..1766480
+ /gene="bioA"
+ /locus_tag="BQ2027_MB1595"
+ /note="Mb1595, bioA, len: 437 aa. Equivalent to Rv1568,
+ len: 437 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 437 aa overlap). Probable bioA,
+ adenosylmethionine-8-amino-7-oxononanoate aminotransferase
+ (EC 2.6.1.62). Highly similar to BIOA_MYCLE|P4548 from M.
+ leprae (436 aa), FASTA results: opt: 2534, E(): 0, (85.1%
+ identity in 436 aa overlap). Also similar to other M.
+ tuberculosis proteins e.g. MTCY227.12c (449 aa), FASTA
+ score: E(): 3.5e-16, (29.5% identity in 421 aa overlap).
+ Contains aminotransferases class-III pyridoxal-phosphate
+ attachment site (PS00600). BELONGS TO CLASS-III OF
+ PYRIDOXAL-PHOSPHATE-DEPENDENT AMINOTRANSFERASES. Protein
+ product from Mb1595 detected using SWATH mass
+ spectrometry. Mb1595 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="adenosylmethionine-8-amino-7-oxononanoate
+ aminotransferase bioa"
+ /protein_id="SIU00198.1"
+ /db_xref="GOA:P0A4X7"
+ /db_xref="InterPro:IPR005814"
+ /db_xref="InterPro:IPR005815"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="PDB:5KGS"
+ /db_xref="PDB:5KGT"
+ /db_xref="PDB:5TE2"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4X7"
+ /translation="MAAATGGLTPEQIIAVDGAHLWHPYSSIGREAVSPVVAVAAHGA
+ WLTLIRDGQPIEVLDAMSSWWTAIHGHGHPALDQALTTQLRVMNHVMFGGLTHEPAAR
+ LAKLLVDITPAGLDTVFFSDSGSVSVEVAAKMALQYWRGRGLPGKRRLMTWRGGYHGD
+ TFLAMSICDPHGGMHSLWTDVLAAQVFAPQVPRDYDPAYSAAFEAQLAQHAGELAAVV
+ VEPVVQGAGGMRFHDPRYLHDLRDICRRYEVLLIFDEIATGFGRTGALFAADHAGVSP
+ DIMCVGKALTGGYLSLAATLCTADVAHTISAGAAGALMHGPTFMANPLACAVSVASVE
+ LLLGQDWRTRITELAAGLTAGLDTARALPAVTDVRVCGAIGVIECDRPVDLAVATPAA
+ LDRGVWLRPFRNLVYAMPPYICTPAEITQITSAMVEVARLVGSLP"
+ gene 1766477..1767637
+ /gene="bioF1"
+ /locus_tag="BQ2027_MB1596"
+ CDS 1766477..1767637
+ /gene="bioF1"
+ /locus_tag="BQ2027_MB1596"
+ /note="Mb1596, bioF1, len: 386 aa. Equivalent to Rv1569,
+ len: 386 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 386 aa overlap). Probable bioF1,
+ 8-amino-7-oxononanoate synthase (EC 2.3.1.47), highly
+ similar to BIOF_MYCLE|P45487 from Mycobacterium leprae
+ (385 aa), FASTA results: opt: 1971, E(): 0, (80.1%
+ identity in 381 aa overlap). Also similar to
+ BIOF2|Rv0032|MTCY10H4.32 POSSIBLE 8-AMINO-7-OXONONANOATE
+ SYNTHASE from Mycobacterium tuberculosis (771 aa), FASTA
+ score: E(): 5.5e-29, (37.4% identity in 393 aa overlap).
+ Contains aminotransferases class-II pyridoxal-phosphate
+ attachment site (PS00599). BELONGS TO CLASS-II OF
+ PYRIDOXAL-PHOSPHATE-DEPENDENT AMINOTRANSFERASES. Protein
+ product from Mb1596 detected using SWATH mass
+ spectrometry. Mb1596 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 8-AMINO-7-OXONONANOATE SYNTHASE BIOF1
+ (AONS) (8-AMINO-7-KETOPELARGONATE SYNTHASE)
+ (7-KETO-8-AMINO-PELARGONIC ACID SYNTHETASE) (7-KAP
+ SYNTHETASE) (L-ALANINE--PIMELYL CoA LIGASE)"
+ /protein_id="SIU00199.1"
+ /db_xref="GOA:P0A4X5"
+ /db_xref="InterPro:IPR001917"
+ /db_xref="InterPro:IPR004839"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4X5"
+ /translation="MKAATQARIDDSPLAWLDAVQRQRHEAGLRRCLRPRPAVATELD
+ LASNDYLGLSRHPAVIDGGVQALRIWGAGATGSRLVTGDTKLHQQFEAELAEFVGAAA
+ GLLFSSGYTANLGAVVGLSGPGSLLVSDARSHASLVDACRLSRARVVVTPHRDVDAVD
+ AALRSRDEQRAVVVTDSVFSADGSLAPVRELLEVCRRHGALLLVDEAHGLGVRGGGRG
+ LLYELGLAGAPDVVMTTTLSKALGSQGGVVLGPTPVRAHLIDAARPFIFDTGLAPAAV
+ GAARAALRVLQAEPWRPQAVLNHAGELARMCGVAAVPDSAMVSVILGEPESAVAAAAA
+ CLDAGVKVGCFRPPTVPAGTSRLRLTARASLNAGELELARRVLTDVLAVARR"
+ gene 1767634..1768314
+ /gene="bioD"
+ /locus_tag="BQ2027_MB1597"
+ CDS 1767634..1768314
+ /gene="bioD"
+ /locus_tag="BQ2027_MB1597"
+ /note="Mb1597, bioD, len: 226 aa. Equivalent to Rv1570,
+ len: 226 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 226 aa overlap). Probable bioD,
+ dethiobiotin synthetase (EC 6.3.3.3). Similar to many e.g.
+ BIOD_MYCLE|P45486 from Mycobacterium leprae (223 aa),
+ FASTA results: opt: 1059, E(): 0, (74.8% identity in 222
+ aa overlap). BELONGS TO THE DETHIOBIOTIN SYNTHETASE
+ FAMILY. Protein product from Mb1597 detected using SWATH
+ mass spectrometry. Mb1597 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="dethiobiotin synthetase biod"
+ /protein_id="SIU00200.1"
+ /db_xref="GOA:O52587"
+ /db_xref="InterPro:IPR004472"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:O52587"
+ /translation="MTILVVTGTGTGVGKTVVCAALASAARQAGIDVAVCKPVQTGTA
+ RGDDDLAEVGRLAGVTQLAGLARYPQPMAPAAAAEHAGMALPARDQIVRLIADLDRPG
+ RLTLVEGAGGLLVELAEPGVTLRDVAVDVAAAALVVVTADLGTLNHTKLTLEALAAQQ
+ VSCAGLVIGSWPDPPGLVAASNRSALARIATVRAALPAGAASLDAGDFAAMSAAAFDR
+ NWVAGLVG"
+ gene 1768314..1768823
+ /locus_tag="BQ2027_MB1598"
+ CDS 1768314..1768823
+ /locus_tag="BQ2027_MB1598"
+ /note="Mb1598, -, len: 169 aa. Equivalent to Rv1571, len:
+ 169 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 169 aa overlap). Conserved hypothetical
+ protein, similar at N-terminal region to
+ Q49625|LEPB1170_C3_227 hypothetical protein from
+ Mycobacterium leprae (104 aa), FASTA results: opt: 473,
+ E(): 3.9e-24, (74.5% identity in 102 aa overlap).
+ Identical to O06619|AF041819|AF041819_6 Mycobacterium
+ bovis BCG (169 aa). Protein product from Mb1598 detected
+ using SWATH mass spectrometry. Mb1598 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00201.1"
+ /db_xref="InterPro:IPR009097"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYN9"
+ /translation="MVHSIELVFDSDTEAAIRRIWAGLAAAGIPSQAPASRPHVSLAV
+ AERIAPEVDEPLGAVARRLPLDCVIGAPVLFGRANVVFTRLVVPTSELLALHAEVHRL
+ CGPHLAPAPMANSLPGQWTAHVTLARRVGGHQLGRALRIAGRPSRIDGRFAGLRRWDG
+ NTRAEYLLG"
+ gene complement(1768969..1769073)
+ /locus_tag="BQ2027_MB1598A"
+ CDS complement(1768969..1769073)
+ /locus_tag="BQ2027_MB1598A"
+ /note="Mb1598A, -, len: 34 aa. Equivalent to Rv1572c
+ (MTCY336.31B), len: 34 aa, from Mycobacterium tuberculosis
+ strain H37Rv (100.0% identity in 34 aa overlap). Partial
+ ORF, part of REP13E12 repeat element; 3' end of Rv1613c
+ (Rv1587c) (MTCY336.17) after phage-like element (see
+ citation below). Similar to C-terminal ends of other
+ REP13E12 repeat elements e.g. Rv1148, Rv1945, Rv3467, etc.
+ Length extended since first submission (+7 aa). Mb1598A
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00202.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYP9"
+ /translation="MECSSAVHGQPRTNTFHHHEKLLRHNDEDNHDDP"
+ gene 1769089..1769499
+ /locus_tag="BQ2027_MB1599"
+ CDS 1769089..1769499
+ /locus_tag="BQ2027_MB1599"
+ /note="Mb1599, -, len: 136 aa. Equivalent to Rv1573, len:
+ 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 136 aa overlap). Probable phiRv1 phage
+ protein (see citation below). Mb1599 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRV1 phage protein"
+ /protein_id="SIU00203.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0V5"
+ /translation="MTTTPARFNHLVTVTDLETGDRAVCDRDQVAETIRAWFPDAPLE
+ VREALVRLQAALNRHEHTGELEAFLRISVEHADAAGGDECGPAILAGRSGPEQAAINR
+ QLGLAGDDEPDGDDTPPWSRMIGLGGGSPAEDER"
+ gene 1769705..1770016
+ /locus_tag="BQ2027_MB1600"
+ CDS 1769705..1770016
+ /locus_tag="BQ2027_MB1600"
+ /note="Mb1600, -, len: 103 aa. Equivalent to Rv1574, len:
+ 103 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 103 aa overlap). Probable phiRV1 phage
+ related protein (see citation below); some similarity to
+ Rv1575|MTCY441.17, E() 1.5e-06; and Rv2647|MTCY336.29c
+ phiRV2 phage protein, E(): 3.5e-05. Belongs to phage
+ phiRv1 proteins. Helix turn helix motif present at aa
+ 14-35 (+3.61 SD). Mb1600 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRV1 phage related protein"
+ /protein_id="SIU00204.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZM7"
+ /translation="MGYKPESERHSTKTDTAIGAALGISAGTYRRLKRIDNATHSDDK
+ EIRRFAEKQMAPLVAGSPSWNARKPRSANARVVASVHRSPMPALVPWNQSRLSATLTR
+ R"
+ gene 1770121..1770474
+ /locus_tag="BQ2027_MB1601"
+ CDS 1770121..1770474
+ /locus_tag="BQ2027_MB1601"
+ /note="Mb1601, -, len: 117 aa. Similar to Rv1575 and
+ Rv1575A, len: 117 aa and 65 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (66.9% identity in 124 aa
+ overlap). Probable phiRV1 phage protein (see citation
+ below). Similarity in N-terminal part to
+ Rv1574|MTCY336.30c (103 aa), FASTA score: E(): 0.00022,
+ (44.0% identity in 50 aa overlap); and Rv2647 phiRV2 phage
+ protein. Similarity suggests should continue as Rv1575A.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1575 and Rv1575A exist as 2
+ genes with an overlap region between them. In
+ Mycobacterium bovis, a single base deletion (c-*) and a
+ single base insertion (*-g) lead to a single product.
+ Mb1601 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRV1 phage protein"
+ /protein_id="SIU00205.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYQ2"
+ /translation="MAPLAAGSPSWNGRKPSSGNRKAATMAARLDILAWGPWAQARIG
+ ASFDENRHCYRRSPRHLRRHLPAAQTNRQRNPQRVGGVGGPAPLSRGRPRLALSYLRG
+ SLHLQNSKRVAHQHI"
+ gene complement(1770418..1771839)
+ /locus_tag="BQ2027_MB1602C"
+ CDS complement(1770418..1771839)
+ /locus_tag="BQ2027_MB1602C"
+ /note="Mb1602c, -, len: 473 aa. Equivalent to Rv1576c,
+ len: 473 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 473 aa overlap). Probable phiRV1 phage
+ protein (capsid subunit) (see citation below). Highly
+ similar to hypothetical Mycobacterium tuberculosis protein
+ Rv2650c|MTCY441.19 phiRV2 phage related protein, FASTA
+ scores: opt: 2782, E(): 0, (89.1% identity in 468 aa
+ overlap). Protein product from Mb1602c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1602c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRV1 phage protein"
+ /protein_id="SIU00206.1"
+ /db_xref="InterPro:IPR024455"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ36"
+ /translation="MTEFDDIKNLSLPETRDAAKQLLDSVAGDLTGEAAQRFQALTRH
+ AEELRAEQRRRGREAEEELRRYRAGELRVVPGAPTGGDDGDAPPGNSLRDTAFRTLDS
+ CVRDGLMSSRAAETAETLCRTGPPQSTSWAQRWLAATGSRDYLGAFVKRVSNPVAGHT
+ VWTDREAAAWREAAAVAAEQRAMGLVDTQGGFLIPAALDPAILLSGDGSTNPIRQVAR
+ VVQTTSEIWRGVTSEGAEARWYSEAQEVSDDSPALAQPAVPNYRGSCWIPFSIELEGD
+ AASFVGEIGKILADSVEQLQTAAFVNGSGNGEPTGFVSALTGTSDQVVVGAGSEAIVA
+ ADVYALQSALPPRFQASAAFAANLSTINTLRQAETSNGALKFPSLHDSPPMLAGKSVL
+ EVSHMDTVDSAVTATNHPLVLGDWKQFLIVDRVGSMVELVPHLFGPNRRPTGQRGFFA
+ WFRVGSDVLVRNAFRVLKVETTA"
+ gene complement(1771847..1772359)
+ /locus_tag="BQ2027_MB1603C"
+ CDS complement(1771847..1772359)
+ /locus_tag="BQ2027_MB1603C"
+ /note="Mb1603c, -, len: 170 aa. Equivalent to Rv1577c,
+ len: 170 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 170 aa overlap). Probable phiRv1 phage
+ protein (prohead protease) (see citation below). Highly
+ similar to hypothetical protein Rv2651c|MTCY441.20c phiRV2
+ prohead protease, FASTA scores: E(): 0, (89.3% identity in
+ 169 aa overlap). Some similarity to VP4_BPHK7|P49860
+ putative bacteriophage HK97 prohead protease (gp4) (225
+ aa), FASTA results: opt: 176, E(): 1.3e-05, (27.3%
+ identity in 165 aa overlap). Mb1603c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRv1 phage protein"
+ /protein_id="SIU00207.1"
+ /db_xref="InterPro:IPR006433"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYR4"
+ /translation="MAELRSGEGRTVHGTIVPYNEATTVRDFDGEFQEMFAPGAFRRS
+ IAERGHKLKLLVSHDARTRYPVGRAVELREEPHGLFGAFEIADTPDGDEALANVKAGV
+ VDSFSVGFRPIRDRREGDVLVRVEAALLEVSLTGVPAYSGAQIAGVRAESLTVVSRST
+ AEAWLSLLDW"
+ gene complement(1772533..1773003)
+ /locus_tag="BQ2027_MB1604C"
+ CDS complement(1772533..1773003)
+ /locus_tag="BQ2027_MB1604C"
+ /note="Mb1604c, -, len: 156 aa. Equivalent to Rv1578c,
+ len: 156 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 156 aa overlap). Probable phiRv1 phage
+ protein (terminase) (see citation below), highly similar
+ to Rv2652c|MTCY441.21c phiRV2 phage protein from M.
+ tuberculosis, FASTA scores: E(): 4.8e-22, (48.1% identity
+ in 156 aa overlap). Also similar to X65555|ARP3COS_1
+ hypothetical protein (cos site) - actinophage RP3 (210
+ aa), FASTA scores: opt: 373, E(): 6.5e-17, (50.0% identity
+ in 114 aa overlap). Contains MIP family signature
+ (PS00221). Protein product from Mb1604c detected using
+ SWATH mass spectrometry. Mb1604c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRv1 phage protein"
+ /protein_id="SIU00208.1"
+ /db_xref="InterPro:IPR006448"
+ /db_xref="InterPro:IPR022357"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYR7"
+ /translation="MPRPPKPARLKLVEGRSPGRDSGGRKVPESPKFIRQAPDAPDWL
+ DAEALAEWRRVAPTLERLDLLKPEDRALLSAYCETWSVYVAAVQRVRAEGLTITSPKS
+ GVVHRNPAVTVAETARMHLLRLASEFGLTPAAEQRLAVAPGDDGDGLNPFAPDR"
+ gene complement(1773084..1773398)
+ /locus_tag="BQ2027_MB1605C"
+ CDS complement(1773084..1773398)
+ /locus_tag="BQ2027_MB1605C"
+ /note="Mb1605c, -, len: 104 aa. Equivalent to Rv1579c,
+ len: 104 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 104 aa overlap). Probable phiRv1 phage
+ protein (see citation below). Protein product from Mb1605c
+ detected using shotgun mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRv1 phage protein"
+ /protein_id="SIU00209.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYR0"
+ /translation="MTPINRPLTNDERQLMHELAVQVVCSQTGCSPDAAVEALESFAK
+ DGTLILRGDTENAYLEAGGNVLVHADRDWLAFHASYPGNDPLRDARPIEQDDDQGAGS
+ PS"
+ gene complement(1773395..1773667)
+ /locus_tag="BQ2027_MB1606C"
+ CDS complement(1773395..1773667)
+ /locus_tag="BQ2027_MB1606C"
+ /note="Mb1606c, -, len: 90 aa. Equivalent to Rv1580c, len:
+ 90 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 90 aa overlap). Probable phiRv1 phage protein
+ (see citation below). Protein product from Mb1606c
+ detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRv1 phage protein"
+ /protein_id="SIU00210.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYR2"
+ /translation="MAETPDHAELRRRIADMAFNADVGMATCKRCGDAVPYIILPNLQ
+ TGEPVMGVADNKWKRANCPVDVGKPCPFLIAEGVADSTDDTIEVDQ"
+ gene complement(1773681..1774076)
+ /locus_tag="BQ2027_MB1607C"
+ CDS complement(1773681..1774076)
+ /locus_tag="BQ2027_MB1607C"
+ /note="Mb1607c, -, len: 131 aa. Equivalent to Rv1581c,
+ len: 131 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 131 aa overlap). Probable phiRv1 phage
+ protein (see citation below)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRv1 phage protein"
+ /protein_id="SIU00211.1"
+ /db_xref="InterPro:IPR036869"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYP8"
+ /translation="MTAVAITPASGGRHSVRFAYDSAIVSLIKSTIPAYARSWSAHTR
+ CWFIDADWTPLLAAELRYHGHTVTGPADPAQQQCTDWAKALFRAVGPQRTPAVYRALS
+ KVLHPDAPTGCPILQQQLNAARTALTNPA"
+ gene complement(1774272..1775687)
+ /locus_tag="BQ2027_MB1608C"
+ CDS complement(1774272..1775687)
+ /locus_tag="BQ2027_MB1608C"
+ /note="Mb1608c, -, len: 471 aa. Equivalent to Rv1582c,
+ len: 471 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 471 aa overlap). Probable phiRv1 phage
+ protein (see citation below). N-terminus is similar to
+ C-terminus of Q38030 ORF9 Bacteriophage phi-C31 (519 aa),
+ FASTA scores: opt: 331, E(): 6.5e-15, (28.5% identity in
+ 235 aa overlap); and C-terminus to whole of Q38031 ORF10
+ of Bacteriophage phi-C31 (202 aa), FASTA scores: opt: 353,
+ E(): 1e-16, (31.1% identity in 190 aa overlap). Also
+ similar to part of AB016282|AB016282_42 Bacteriophage
+ phi-105 (806 aa), FASTA scores: opt: 790, E(): 0, (32.7%
+ identity in 459 aa overlap). Similarity to other phage
+ proteins described as putative DNA-polymerase or
+ DNA-primase. Also slightly similar to MTCY441.24c, FASTA
+ scores: E(): 0.0055, (36.0% identity in 75 aa overlap).
+ Mb1608c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRv1 phage protein"
+ /protein_id="SIU00212.1"
+ /db_xref="InterPro:IPR006500"
+ /db_xref="InterPro:IPR014015"
+ /db_xref="InterPro:IPR014818"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYQ8"
+ /translation="MADIPYGTDYPDAPWIDRDGHVLIDDGGKPTQVHRGQARIAYRL
+ AERYQDKLLHVAGIGWHSWDGRRWAADDRGEAKRAVLAELRQALSDSLNDKELRADVR
+ KCESASGVAGVLDLAAALVPFAATLADLDSDPHLLNVANGTLDLHTLKLRPHAPADRI
+ TKICRGAYQSDTESPLWQAFLTRVLPDEGVRGFVQRLAGVGLLGTVREHVLAILIGVG
+ ANGKSVFDKAIRYALGDYACTAEPDLFMHRENAHPTGEMDLRGVRWVAVSESEKDRRL
+ AESTIKRLTGGDTIRARKMRQDFVEFTPSHTPLLITNHLPRVPGDDTAIWRRIRVVPF
+ EVVIPADEQDRELDARLQLEADSILSWAVAGWSDYQRIGLSQPDAVLAATSNYREDSD
+ TIKRFIDDECVTSSPVLKATTTHLFEAWQRWRVQEGVPEISRKAFGQSLDTHGYPVTD
+ KARDGRWRAGIAVRGADDFDD"
+ gene complement(1775687..1776085)
+ /locus_tag="BQ2027_MB1609C"
+ CDS complement(1775687..1776085)
+ /locus_tag="BQ2027_MB1609C"
+ /note="Mb1609c, -, len: 132 aa. Equivalent to Rv1583c,
+ len: 132 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 132 aa overlap). Probable phiRv1 phage
+ protein (see citation below), highly similar to
+ Rv2656c|MTCY441.25c phiRV2 phage protein (130 aa), FASTA
+ score: E(): 1.3e-33, (81.7% identity in 131 aa overlap).
+ Mb1609c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRv1 phage protein"
+ /protein_id="SIU00213.1"
+ /db_xref="InterPro:IPR024384"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0W3"
+ /translation="MTAGAGGSPPTRRCSATEDRAPATVATPSSADPTASRAVSWWSV
+ HEHVAPVLDAAGSWPMAGTPAWRQLDDADPRKWAAICDAARHWALRVETCQEAMAQAS
+ RDVSAAADWPGIAREIVRRRGVYIPRAGVA"
+ gene complement(1776082..1776303)
+ /locus_tag="BQ2027_MB1610C"
+ CDS complement(1776082..1776303)
+ /locus_tag="BQ2027_MB1610C"
+ /note="Mb1610c, -, len: 73 aa. Equivalent to Rv1584c, len:
+ 73 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 73 aa overlap). Possible phiRv1 phage protein
+ (putative excisionase) (see citation below). Mb1610c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible phiRv1 phage protein"
+ /protein_id="SIU00214.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZN2"
+ /translation="MSTIYHHRGRVAALSRSRASDDPEFIAAKTDLVAANIADYLIRT
+ LAAAPPLTDEQRTRLAELLRPVRRSGGAR"
+ gene complement(1776359..1776874)
+ /locus_tag="BQ2027_MB1611C"
+ CDS complement(1776359..1776874)
+ /locus_tag="BQ2027_MB1611C"
+ /note="Mb1611c, -, len: 171 aa. Equivalent to Rv1585c,
+ len: 171 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 171 aa overlap). Possible phage phiRv1
+ protein (see citation below). Protein product from Mb1611c
+ detected using SWATH mass spectrometry. Mb1611c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible phage phiRv1 protein"
+ /protein_id="SIU00215.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYR1"
+ /translation="MSRHHNIVIVCDHGRKGDGRIEHERCDLVAPIIWVDETQGWLPQ
+ APAVATLLDDDNQPRAVIGLPPNESRLRPEMRRDGWVRLHWEFACLRYGAAGVRTCEQ
+ RPVRVRNGDLQTLCENVPRLLTGLAGNPDYAPGFAVQSDAVVVAMWLWRTLCESDTPN
+ KLRATPTRGSC"
+ gene complement(1776871..1777935)
+ /locus_tag="BQ2027_MB1612C"
+ CDS complement(1776871..1777935)
+ /locus_tag="BQ2027_MB1612C"
+ /note="Mb1612c, -, len: 469 aa. Equivalent to Rv1586c,
+ len: 469 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 469 aa overlap). Probable phiRv1
+ integrase, possibly member of the serine family of
+ recombinases (see citation below), similar to several
+ bacteriophage integrases e.g. Q37839 ORF469 PROTEIN from
+ Bacteriophage R4 (469 aa), FASTA scores: opt: 623, E():
+ 1.6e-29, (31.1% identity in 482 aa overlap); and
+ Bacteriophage TP901-1. Protein product from Mb1612c
+ detected using SWATH mass spectrometry. Mb1612c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phiRv1 integrase"
+ /protein_id="SIU00216.1"
+ /db_xref="GOA:A0A1R3XZ46"
+ /db_xref="InterPro:IPR011109"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ46"
+ /translation="MATPQGRLVARLKGSVAAHETEHKKARQRRAARQKAERGHPNWS
+ KAFGYLPGPNGPEPDPRTAPLVKQAYADILAGASLGDVCRQWNDAGAFTITGRPWTTT
+ TLSKFLRKPRNAGLRAYKGARYGPVDRDAIVGKAQWSPLVDEATFWAAQAVLDAPGRA
+ PGRKSVRRHLLTGLAGCGKCGNHLAGSYRTDGQVVYVCKACHGVAILADNIEPILYHI
+ VAERLAMPDAVDLLRREIHDAAEAETIRLELETLYGELDRLAVERAEGLLTARQVKIS
+ TDIVNAKITKLQARQQDQERLRVFDGIPLGTPQVAGMIAELSPDRFRAVLDVLAEVVV
+ QPVGKSGRIFNPERVQVNWR"
+ gene complement(1777937..1778938)
+ /locus_tag="BQ2027_MB1613C"
+ CDS complement(1777937..1778938)
+ /locus_tag="BQ2027_MB1613C"
+ /note="Mb1613c, -, len: 333 aa. Equivalent to Rv1587c,
+ len: 217 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (97.2% identity in 217 aa overlap). Partial REP13E12
+ repeat protein (see citation below), nearly identical (but
+ has been interrupted by phiRv1 prophage) to
+ Q50655|MTCY251.13c HYPOTHETICAL 34.6 KD PROTEIN from M.
+ tuberculosis (317 aa), FASTA results: opt: 2020, E(): 0,
+ (98.0% identity in 302 aa overlap); Rv0094c|MTCY251.13c
+ (317 aa), FASTA results: E(): 0, (100.0% identity in 217
+ aa overlap). Codon usage suggests that translation may
+ involve frameshifting of Rv1588c mRNA in poly_C stretch
+ into reading frame of Rv1587c. 3' end found in Rv1572c.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv and Mycobacterium bovis, Rv1587
+ possibly exists as a pseudogene that has been disrupted
+ when the phage entered. Mb1613c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Partial REP13E12 repeat protein"
+ /protein_id="SIU00217.1"
+ /db_xref="InterPro:IPR003615"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYS5"
+ /translation="MLAKLAAPGATNPDDHTPVIDTTPDAAAIDRDTRSQAQRNHDGL
+ LAGLRALIASGELGQHNGLPVSIVVTTTLTDLQTGAGKGFTGGGTLLPMADVIRMTSH
+ AHHYSPASGRYPQAIFDHGTPLALYHTKRLASPAQRIMLFANDRGCTKPGCDAPAYHS
+ QAHHVTGWTSTGRTDITDLTLACDPDNRLAEKGWTTRKNTHGHTEWLPPPHLDHGQPW
+ TCEIHYTCACCCLPPNLRRPLRRTARRGPPTRGLPKAVRAAKMGARRVPRQRRQRINR
+ QAPPRLRADVGRHHRRQDRRRGGLGPGPAPSPSHRAGSLHVISRREAAGPGHRRRRR"
+ repeat_region complement(1778282..1779644)
+ /note="REP-5, len: 1363 nt. Equivalent to REP, len: 1298
+ nt, from Mycobacterium tuberculosis strain H37Rv, (96.6%
+ identity in 1363 nt overlap). REP336, member of REP13E12
+ family."
+ /rpt_family="REP"
+ gene complement(1778943..1779611)
+ /locus_tag="BQ2027_MB1614C"
+ CDS complement(1778943..1779611)
+ /locus_tag="BQ2027_MB1614C"
+ /note="Mb1614c, -, len: 222 aa. Equivalent to Rv1588c,
+ len: 222 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.2% identity in 222 aa overlap). Partial REP13E12
+ repeat protein (see citation below), nearly identical to
+ ORF's in other Rep13E12 repeats, including
+ Rv0095c|MTCY251.14c|Y05E_MYCTU|Q10891 hypothetical 15.4 kd
+ protein cy251.14 from Mycobacterium tuberculosis (136 aa),
+ FASTA results: opt: 613, E(): 9.9e-29, (86.5% identity in
+ 111 aa overlap). Mb1614c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Partial REP13E12 repeat protein"
+ /protein_id="SIU00218.1"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5F2"
+ /translation="MLANSREELVEVFDALDAELDRLDEVSFEVLTTPERLRSLERLE
+ CLVRRLPAVGHTLINQLDTQASEEELGGTLCCALANRLRITKPDAALRIADAADLGPR
+ RALTGEPLAPQLTATATAQRQGLIGEAHIKVIRALFRPPARRGGCVHPPGRRSRPGRQ
+ SRSISSRRAGPLRPAGHGLATPRRRPHRHRTRPQTRHHPEQPAIRRHVTAKWLPDPPS
+ AGHL"
+ gene 1780059..1781108
+ /gene="bioB"
+ /locus_tag="BQ2027_MB1615"
+ CDS 1780059..1781108
+ /gene="bioB"
+ /locus_tag="BQ2027_MB1615"
+ /note="Mb1615, bioB, len: 349 aa. Equivalent to Rv1589,
+ len: 349 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 349 aa overlap). bioB, biotin synthetase
+ (EC 2.8.1.-) O06601. Highly similar to BIOB_MYCLE|P46715
+ BioB from Mycobacterium leprae (345 aa), FASTA results:
+ opt: 1982, E(): 0, (86.5% identity in 349 aa overlap).
+ Protein product from Mb1615 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1615 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable biotin synthetase biob"
+ /protein_id="SIU00219.1"
+ /db_xref="GOA:P0A507"
+ /db_xref="InterPro:IPR002684"
+ /db_xref="InterPro:IPR006638"
+ /db_xref="InterPro:IPR007197"
+ /db_xref="InterPro:IPR010722"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR024177"
+ /db_xref="UniProtKB/Swiss-Prot:P0A507"
+ /translation="MTQAATRPTNDAGQDGGNNSDILVVARQQVLQRGEGLNQDQVLA
+ VLQLPDDRLEELLALAHEVRMRWCGPEVEVEGIISLKTGGCPEDCHFCSQSGLFASPV
+ RSAWLDIPSLVEAAKQTAKSGATEFCIVAAVRGPDERLMAQVAAGIEAIRNEVEINIA
+ CSLGMLTAEQVDQLAARGVHRYNHNLETARSFFANVVTTHTWEERWQTLSMVRDAGME
+ VCCGGILGMGETLQQRAEFAAELAELGPDEVPLNFLNPRPGTPFADLEVMPVGDALKA
+ VAAFRLALPRTMLRFAGGREITLGDLGAKRGILGGINAVIVGNYLTTLGRPAEADLEL
+ LDELQMPLKALNASL"
+ gene 1781109..1781348
+ /locus_tag="BQ2027_MB1616"
+ CDS 1781109..1781348
+ /locus_tag="BQ2027_MB1616"
+ /note="Mb1616, -, len: 79 aa. Equivalent to Rv1590, len:
+ 79 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 79 aa overlap). Conserved hypothetical
+ protein, similar to Q49616|LEPB1170_C1_162|YF90_MYCLE from
+ Mycobacterium leprae (80 aa), FASTA scores: opt: 368, E():
+ 1.7e-21, Smith-Waterman score: 368, (67.1% identity in 73
+ aa overlap). Protein product from Mb1616 detected using
+ SWATH mass spectrometry. Mb1616 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00220.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64882"
+ /translation="MVEIVAGKQRAPVAAGVYNVYTGELADTATPTAARMGLEPPRFC
+ AQCGRRMVVQVRPDGWWARCSRHGQVDSADLATQR"
+ gene 1781345..1782010
+ /locus_tag="BQ2027_MB1617"
+ CDS 1781345..1782010
+ /locus_tag="BQ2027_MB1617"
+ /note="Mb1617, -, len: 221 aa. Equivalent to Rv1591, len:
+ 221 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 221 aa overlap). Probable transmembrane
+ protein, similar to Q49626|LEPB1170_C3_229|YF91_MYCLE
+ Hypothetical Mycobacterium leprae protein (198 aa), FASTA
+ results: opt: 802, E(): 0, (63.8% identity in 188 aa
+ overlap). Protein product from Mb1617 detected using SWATH
+ mass spectrometry. Mb1617 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00221.1"
+ /db_xref="GOA:P0A5F4"
+ /db_xref="InterPro:IPR021213"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5F4"
+ /translation="MTEPPGFGGPSEPSGAPRTSRTRAVLFVMLGLSATGVLVGGLWA
+ WIAPPIHAVVAITRAGERVHEYLGSESQNFFIAPFMLLGLLSVLAVVASALMWQWREH
+ RGPQMVAGLSIGLTTAAAIAAGVGALVVRLRYGALDFDTVPLSRGDHALTYVTQAPPV
+ FFARRPLQIALTLMWPAGIASLVYALLAAGTARDDLGGYPAVDPSSNARTEALETPQA
+ PVS"
+ gene complement(1782175..1783515)
+ /locus_tag="BQ2027_MB1618C"
+ CDS complement(1782175..1783515)
+ /locus_tag="BQ2027_MB1618C"
+ /EC_number="3.1.1.3"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1618c, -, len: 446 aa. Equivalent to Rv1592c,
+ len: 446 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 446 aa overlap). Conserved hypothetical
+ protein, some similarity to Q49629|B1170_F1_46 from
+ Mycobacterium leprae (132 aa), FASTA results: opt: 332,
+ E(): 4.5e-14, (56.3% identity in 87 aa overlap). Nearly
+ identical to truncated Mycobacterium bovis BCG protein
+ (148 aa) AF041819|AF041819_11. Protein product from
+ Mb1618c detected using SWATH mass spectrometry. Mb1618c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Lipase 1 (EC"
+ /protein_id="SIU00222.1"
+ /db_xref="GOA:A0A1R3XYR5"
+ /db_xref="InterPro:IPR005152"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYR5"
+ /translation="MVEPGNLAGATGAEWIGRPPHEELQRKVRPLLPSDDPFYFPPAG
+ YQHAVPGTVLRSRDVELAFMGLIPQPVTATQLLYRTTNMYGNPEATVTTVIVPAELAP
+ GQTCPLLSYQCAIDAMSSRCFPSYALRRRAKALGSLTQMELLMISAALAEGWAVSVPD
+ HEGPKGLWGSPYEPGYRVLDGIRAALNSERVGLSPATPIGLWGYSGGGLASAWAAEAC
+ GEYAPDLDIVGAVLGSPVGDLGHTFRRLNGTLLAGLPALVVAALQHSYPGLARVIKEH
+ ANDEGRQLLEQLTEMTTVDAVIRMAGRDMGDFLDEPLEDILSTPEVSHVFGDTKLGSA
+ VPTPPVLIVQAVHDYLIDVSDIDALADSYTAGGANVTYHRDLFSEHVSLHPLSAPMTL
+ RWLTDRFAGKPLTDHRVRTTWPTIFNPMTYAGMARLAVIAAKVITGRKLSRRPL"
+ gene complement(1783772..1784482)
+ /locus_tag="BQ2027_MB1619C"
+ CDS complement(1783772..1784482)
+ /locus_tag="BQ2027_MB1619C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1619c, -, len: 236 aa. Equivalent to Rv1593c,
+ len: 236 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 236 aa overlap). Conserved hypothetical
+ protein, highly similar to Q49628|B1170_F1_44 from
+ Mycobacterium leprae (286 aa), FASTA scores: opt: 1304, E
+ (): 0, (85.4% identity in 233 aa overlap); similar to
+ several putative DNA hydrolases e.g. Q9S233|SCI51.07C from
+ Streptomyces coelicolor (239 aa), FASTA scores: opt: 415,
+ E(): 4.6e-20, (34.8% identity in 221 aa overlap); also
+ similar to P74291|SLR1690 hypothetical protein from
+ synechocystis (261 aa), FASTA scores: opt: 228, E():
+ 1.4e-17, (31.5% identity in 213 aa overlap). TBparse score
+ is 0.922 Protein product from Mb1619c detected using
+ shotgun mass spectrometry. Mb1619c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Nudix-related transcriptional regulator NrtR"
+ /protein_id="SIU00223.1"
+ /db_xref="GOA:A0A1R3Y0X0"
+ /db_xref="InterPro:IPR000086"
+ /db_xref="InterPro:IPR015797"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0X0"
+ /translation="MAHGSTAHEVLAVVFQVRGVGMSRGAAKPQLNVLLWQRAKEPQR
+ GAWSLPGGRLRNDEDMTSSVRRQLAEKVDLRELAHLEQLAVFSDPHRLPGIRMIASTY
+ LGVVPSPATPELPADTRWHPVSSLPPMAFDHGPMVTHARTRLIAKMSYTNIGFALAPK
+ EFALSTLRDIYGAALGYQVDATNLQRVLARRRVITQTGTIAQSGRSGGRPAALYRFTD
+ SQLRVTDEFAALRPPGQL"
+ gene 1784531..1785580
+ /gene="nadA"
+ /locus_tag="BQ2027_MB1620"
+ CDS 1784531..1785580
+ /gene="nadA"
+ /locus_tag="BQ2027_MB1620"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1620, nadA, len: 349 aa. Equivalent to Rv1594,
+ len: 349 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 349 aa overlap). Probable nadA,
+ quinolinate synthetase. Similar to many e.g. Q49622 NADA
+ from Mycobacterium leprae (368 aa), FASTA results: opt:
+ 1994, E(): 0, (84.4% identity in 352 aa overlap). Protein
+ product from Mb1620 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1620 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable quinolinate synthetase nadA"
+ /protein_id="SIU00224.1"
+ /db_xref="GOA:P65498"
+ /db_xref="InterPro:IPR003473"
+ /db_xref="InterPro:IPR023066"
+ /db_xref="InterPro:IPR036094"
+ /db_xref="UniProtKB/Swiss-Prot:P65498"
+ /translation="MTVLNRTDTLVDELTADITNTPLGYGGVDGDERWAAEIRRLAHL
+ RGATVLAHNYQLPAIQDVADHVGDSLALSRVAAEAPEDTIVFCGVHFMAETAKILSPH
+ KTVLIPDQRAGCSLADSITPDELRAWKDEHPGAVVVSYVNTTAAVKALTDICCTSSNA
+ VDVVASIDPDREVLFCPDQFLGAHVRRVTGRKNLHVWAGECHVHAGINGDELADQARA
+ HPDAELFVHPECGCATSALYLAGEGAFPAERVKILSTGGMLEAAHTTRARQVLVATEV
+ GMLHQLRRAAPEVDFRAVNDRASCKYMKMITPAALLRCLVEGADEVHVDPGIAASGRR
+ SVQRMIEIGHPGGGE"
+ gene 1785580..1787163
+ /gene="nadB"
+ /locus_tag="BQ2027_MB1621"
+ CDS 1785580..1787163
+ /gene="nadB"
+ /locus_tag="BQ2027_MB1621"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1621, nadB, len: 527 aa. Equivalent to Rv1595,
+ len: 527 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 527 aa overlap). Probable nadB,
+ L-aspartate oxidase (EC 1.4.3.16). Similar to many e.g.
+ Q49617 L-ASPARTATE OXIDASE (QUINOLINATE SYNTHETASE) from
+ Mycobacterium leprae (424 aa), FASTA results: opt: 2152,
+ E(): 0, (82.0% identity in 400 aa overlap). Also shows
+ some similarity to Rv1552 frdA from Mycobacterium
+ tuberculosis (583 aa), FASTA results: E(): 1e-10, (35.3%
+ identity in 566 aa overlap). HETERODIMER. THE QUINOLINATE
+ SYNTHETASE COMPLEX CONSISTS OF THE TWO ENZYMES QUINOLINATE
+ SYNTHETASE A AND B. TBparse score is 0.896. Protein
+ product from Mb1621 detected using SWATH mass
+ spectrometry. Mb1621 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable L-aspartate oxidase nadB"
+ /protein_id="SIU00225.1"
+ /db_xref="GOA:P65500"
+ /db_xref="InterPro:IPR003953"
+ /db_xref="InterPro:IPR005288"
+ /db_xref="InterPro:IPR015939"
+ /db_xref="InterPro:IPR027477"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="InterPro:IPR037099"
+ /db_xref="UniProtKB/Swiss-Prot:P65500"
+ /translation="MAGPAWRDAADVVVIGTGVAGLAAALAADRAGRSVVVLSKAAQT
+ HVTATHYAQGGIAVVLPDNDDSVDAHVADTLAAGAGLCDPDAVYSIVADGYRAVTDLV
+ GAGARLDESVPGRWALTREGGHSRRRIVHAGGDATGAEVQRALQDAAGMLDIRTGHVA
+ LRVLHDGTAVTGLLVVRPDGCGIISAPSVILATGGLGHLYSATTNPAGSTGDGIALGL
+ WAGVAVSDLEFIQFHPTMLFAGRAGGRRPLITEAIRGEGAILVDRQGNSITAGVHPMG
+ DLAPRDVVAAAIDARLKATGDPCVYLDARGIEGFASRFPTVTASCRAAGIDPVRQPIP
+ VVPGAHYSCGGIVTDVYGQTELLGLYAAGEVARTGLHGANRLASNSLLEGLVVGGRAG
+ KAAAAHAAAAGRSRATSSATWPEPISYTALDRGDLQRAMSRDASMYRAAAGLHRLCDS
+ LSGAQVRDVACRRDFEDVALTLVAQSVTAAALARTESRGCHHRAEYPCTVPEQARSIV
+ VRGADDANAVCVQALVAVC"
+ gene 1787163..1788020
+ /gene="nadC"
+ /locus_tag="BQ2027_MB1622"
+ CDS 1787163..1788020
+ /gene="nadC"
+ /locus_tag="BQ2027_MB1622"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1622, nadC, len: 285 aa. Equivalent to Rv1596,
+ len: 285 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 285 aa overlap). Probable nadC,
+ nicotinate-nucleotide pyrophosphatase (EC 2.4.2.19)
+ O06594. Similar to many e.g. ADC_MYCLE|P46714 from
+ Mycobacterium leprae (284 aa), FASTA results: opt: 1418,
+ E(): 0,(79.2% identity in 283 aa overlap). BELONGS TO THE
+ NADC/MODD FAMILY. Protein product from Mb1622 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1622 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable nicotinate-nucleotide pyrophosphatase
+ nadC"
+ /protein_id="SIU00226.1"
+ /db_xref="GOA:A0A1R3XZ55"
+ /db_xref="InterPro:IPR002638"
+ /db_xref="InterPro:IPR004393"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR022412"
+ /db_xref="InterPro:IPR027277"
+ /db_xref="InterPro:IPR036068"
+ /db_xref="InterPro:IPR037128"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ55"
+ /translation="MGLSDWELAAARAAIARGLDEDLRYGPDVTTLATVPASATTTAS
+ LVTREAGVVAGLDVALLTLDEVLGTNGYRVLDRVEDGARVPPGEALMTLEAQTRGLLT
+ AERTMLNLVGHLSGIATATAAWVDAVRGTKAKIRDTRKTLPGLRALQKYAVRTGGGVN
+ HRLGLGDAALIKDNHVAAAGSVVDALRAVRNAAPDLPCEVEVDSLEQLDAVLPEKPEL
+ ILLDNFAVWQTQTAVQRRDSRAPTVMLESSGGLSLQTAATYAETGVDYLAVGALTHSV
+ RVLDIGLDM"
+ gene 1788069..1788827
+ /locus_tag="BQ2027_MB1623"
+ CDS 1788069..1788827
+ /locus_tag="BQ2027_MB1623"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1623, -, len: 252 aa. Equivalent to Rv1597, len:
+ 252 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 252 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1623 detected using SWATH
+ mass spectrometry. Mb1623 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SAM-dependent methyltransferase"
+ /protein_id="SIU00227.1"
+ /db_xref="GOA:A0A1R3XYT4"
+ /db_xref="InterPro:IPR013216"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYT4"
+ /translation="MARTFEDLVAEAASASVGGWDFSWLDGRATEERPSWGYQRQLSQ
+ RLANATAALDLETGGGEVLAGAGNFPPTMVATEAWPPNAAMATRRLHPLGAVVVITGD
+ KPPLPFADAAFDLVTSRHPSTRWWTEIARVLRAGGSYFAQHVGPATLWDLREHFLGPR
+ EHNGADQYAQVVRTCITDAGLEIVDLQMERLRVEFFDVGAVIYFLRKVIWFLPDFTVE
+ GYHDRLRALHERIQAEGPFVTYSTRALIEARKPS"
+ gene complement(1788848..1789258)
+ /locus_tag="BQ2027_MB1624C"
+ CDS complement(1788848..1789258)
+ /locus_tag="BQ2027_MB1624C"
+ /note="Mb1624c, -, len: 136 aa. Equivalent to Rv1598c,
+ len: 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 136 aa overlap). Conserved hypothetical
+ protein, some similarity to O06389|Rv0523c|MTCY25D10.02
+ from Mycobacterium tuberculosis (131 aa), FASTA scores:
+ E(): 2.2e-09, (38.4% identity in 99 aa overlap); and
+ P95144|MTCY359.02|Rv1871c (129 aa). Protein product from
+ Mb1624c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1624c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00228.1"
+ /db_xref="GOA:A0A1R3XYT8"
+ /db_xref="InterPro:IPR004378"
+ /db_xref="InterPro:IPR012349"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYT8"
+ /translation="MSAKDHPNNAPGVPMVFPLWLERLQVKYINRALKPIARYLPGTA
+ TIEHRGRKSGKPYQTIVTAYRKDGVLAIALAHGKTDWVKNVLAAGEADVHFARGVVHV
+ INPRIVPAGSDGQGLPRMARLQLRRIGVFVGDIA"
+ gene 1789358..1790674
+ /gene="hisD"
+ /locus_tag="BQ2027_MB1625"
+ CDS 1789358..1790674
+ /gene="hisD"
+ /locus_tag="BQ2027_MB1625"
+ /note="Mb1625, hisD, len: 438 aa. Equivalent to Rv1599,
+ len: 438 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 438 aa overlap). Probable hisD,
+ histidinol dehydrogenase (EC 1.1.1.23) (see citation
+ below) O08396. Similar to many e.g. HISX_MYCSM|P28736 from
+ Mycobacterium smegmatis (445 aa), FASTA results: opt:
+ 2356, E(): 0, (83.1% identity in 437 aa overlap). Contains
+ histidinol dehydrogenase signature (PS00611). Protein
+ product from Mb1625 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1625 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable histidinol dehydrogenase HisD (HDH)"
+ /protein_id="SIU00229.1"
+ /db_xref="GOA:P63951"
+ /db_xref="InterPro:IPR001692"
+ /db_xref="InterPro:IPR012131"
+ /db_xref="InterPro:IPR016161"
+ /db_xref="InterPro:IPR022695"
+ /db_xref="UniProtKB/Swiss-Prot:P63951"
+ /translation="MLTRIDLRGAELTAAELRAALPRGGADVEAVLPTVRPIVAAVAE
+ RGAEAALDFGASFDGVRPHAIRVPDAALDAALAGLDCDVCEALQVMVERTRAVHSGQR
+ RTDVTTTLGPGATVTERWVPVERVGLYVPGGNAVYPSSVVMNVVPAQAAGVDSLVVAS
+ PPQAQWDGMPHPTILAAARLLGVDEVWAVGGAQAVALLAYGGTDTDGAALTPVDMITG
+ PGNIYVTAAKRLCRSRVGIDAEAGPTEIAILADHTADPVHVAADLISQAEHDELAASV
+ LVTPSEDLADATDAELAGQLQTTVHRERVTAALTGRQSAIVLVDDVDAAVLVVNAYAA
+ EHLEIQTADAPQVASRIRSAGAIFVGPWSPVSLGDYCAGSNHVLPTAGCARHSSGLSV
+ QTFLRGIHVVEYTEAALKDVSGHVITLATAEDLPAHGEAVRRRFER"
+ gene 1790671..1791813
+ /gene="hisC1"
+ /locus_tag="BQ2027_MB1626"
+ CDS 1790671..1791813
+ /gene="hisC1"
+ /locus_tag="BQ2027_MB1626"
+ /standard_name="hisC"
+ /note="Mb1626, hisC1, len: 380 aa. Equivalent to Rv1600,
+ len: 380 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 380 aa overlap). Probable hisC1,
+ histidinol-phosphate aminotransferase (EC 2.6.1.9) O06591.
+ Similar to many e.g. HIS8_STRCO|P16246 from Streptomyces
+ coelicolor (369 aa), FASTA results: opt: 1353, E(): 0,
+ (59.0% identity in 356 aa overlap). Some similarity to
+ other Mycobacterium tuberculosis aminotransferases e.g.
+ Rv3772|MTCY13D12.06, FASTA results: E(): 7.4e-25, (33.7%
+ identity in 365 aa overlap). Contains aminotransferases
+ class-II pyridoxal-phosphate attachment site (PS00599).
+ BELONGS TO CLASS-II OF PYRIDOXAL-PHOSPHATE-DEPENDENT
+ AMINOTRANSFERASES. Note that previously known as hisC.
+ Protein product from Mb1626 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1626 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable histidinol-phosphate aminotransferase
+ hisC1"
+ /protein_id="SIU00230.1"
+ /db_xref="GOA:P0A679"
+ /db_xref="InterPro:IPR001917"
+ /db_xref="InterPro:IPR004839"
+ /db_xref="InterPro:IPR005861"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="UniProtKB/Swiss-Prot:P0A679"
+ /translation="MTRSGHPVTLDDLPLRADLRGKAPYGAPQLAVPVRLNTNENPHP
+ PTRALVDDVVRSVREAAIDLHRYPDRDAVALRADLAGYLTAQTGIQLGVENIWAANGS
+ NEILQQLLQAFGGPGRSAIGFVPSYSMHPIISDGTHTEWIEASRANDFGLDVDVAVAA
+ VVDRKPDVVFIASPNNPSGQSVSLPDLCKLLDVAPGIAIVDEAYGEFSSQPSAVSLVE
+ EYPSKLVVTRTMSKAFAFAGGRLGYLIATPAVIDAMLLVRLPYHLSSVTQAAARAALR
+ HSDDTLSSVAALIAERERVTTSLNDMGFRVIPSDANFVLFGEFADAPAAWRRYLEAGI
+ LIRDVGIPGYLRATTGLAEENDAFLRASARIATDLVPVTRSPVGAP"
+ gene 1791810..1792442
+ /gene="hisB"
+ /locus_tag="BQ2027_MB1627"
+ CDS 1791810..1792442
+ /gene="hisB"
+ /locus_tag="BQ2027_MB1627"
+ /note="Mb1627, hisB, len: 210 aa. Equivalent to Rv1601,
+ len: 210 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 210 aa overlap). Probable hisB,
+ imidazole glycerol-phosphate dehydratase (EC 4.2.1.19).
+ Similar to many e.g. HIS7_STRCO|P16247 from Streptomyces
+ coelicolor (197 aa),FASTA results: opt: 763, E(): 0,
+ (57.4% identity in 202 aa overlap). BELONGS TO THE
+ IMIDAZOLEGLYCEROL-PHOSPHATE DEHYDRATASE FAMILY. Protein
+ product from Mb1627 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1627 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable imidazole glycerol-phosphate
+ dehydratase hisB"
+ /protein_id="SIU00231.1"
+ /db_xref="GOA:P64369"
+ /db_xref="InterPro:IPR000807"
+ /db_xref="InterPro:IPR020565"
+ /db_xref="InterPro:IPR020568"
+ /db_xref="InterPro:IPR038494"
+ /db_xref="UniProtKB/Swiss-Prot:P64369"
+ /translation="MTTTQTAKASRRARIERRTRESDIVIELDLDGTGQVAVDTGVPF
+ YDHMLTALGSHASFDLTVRATGDVEIEAHHTIEDTAIALGTALGQALGDKRGIRRFGD
+ AFIPMDETLAHAAVDLSGRPYCVHTGEPDHLQHTTIAGSSVPYHTVINRHVFESLAAN
+ ARIALHVRVLYGRDPHHITEAQYKAVARALRQAVEPDPRVSGVPSTKGAL"
+ gene 1792439..1793059
+ /gene="hisH"
+ /locus_tag="BQ2027_MB1628"
+ CDS 1792439..1793059
+ /gene="hisH"
+ /locus_tag="BQ2027_MB1628"
+ /note="Mb1628, hisH, len: 206 aa. Equivalent to Rv1602,
+ len: 206 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 206 aa overlap). Probable hisH,
+ amidotransferase (EC 2.4.2.-). Similar to many e.g.
+ HIS5_STRCO|P16249 from Streptomyces coelicolor (222 aa),
+ FASTA results: opt: 872, E():0, (61.0% identity in 210 aa
+ overlap). Contains glutamine amidotransferases class-I
+ active site (PS00442). BELONGS TO THE HISH FAMILY. Protein
+ product from Mb1628 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1628 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable amidotransferase hisH"
+ /protein_id="SIU00232.1"
+ /db_xref="GOA:P59957"
+ /db_xref="InterPro:IPR010139"
+ /db_xref="InterPro:IPR017926"
+ /db_xref="InterPro:IPR029062"
+ /db_xref="UniProtKB/Swiss-Prot:P59957"
+ /translation="MTAKSVVVLDYGSGNLRSAQRALQRVGAEVEVTADTDAAMTADG
+ LVVPGVGAFAACMAGLRKISGERIIAERVAAGRPVLGVCVGMQILFACGVEFGVQTPG
+ CGHWPGAVIRLEAPVIPHMGWNVVDSAAGSALFKGLDVDARFYFVHSYAAQRWEGSPD
+ ALLTWATYRAPFLAAVEDGALAATQFHPEKSGDAGAAVLSNWVDGL"
+ gene 1793069..1793806
+ /gene="hisA"
+ /locus_tag="BQ2027_MB1629"
+ CDS 1793069..1793806
+ /gene="hisA"
+ /locus_tag="BQ2027_MB1629"
+ /note="Mb1629, hisA, len: 245 aa. Equivalent to Rv1603,
+ len: 245 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 245 aa overlap). Probable hisA,
+ PHOSPHORIBOSYLFORMIMINO-5-AMINOIMIDAZOLE CARBOXAMIDE
+ RIBOTIDE ISOMERASE (EC 5.3.1.16), similar to many e.g.
+ HIS4_STRCO|P16250 phosphoribosylformimino-5-aminoimidaz
+ from Streptomyces coelicolor (240 aa), FASTA scores: opt:
+ 1081, E(): 0, (69.0% identity in 239 aa overlap). Protein
+ product from Mb1629 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1629 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE
+ PHOSPHORIBOSYLFORMIMINO-5-AMINOIMIDAZOLE CARBOXAMIDE
+ RIBOTIDE ISOMERASE HISA"
+ /protein_id="SIU00233.1"
+ /db_xref="GOA:P60579"
+ /db_xref="InterPro:IPR006062"
+ /db_xref="InterPro:IPR010188"
+ /db_xref="InterPro:IPR011060"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR023016"
+ /db_xref="UniProtKB/Swiss-Prot:P60579"
+ /translation="MMPLILLPAVDVVEGRAVRLVQGKAGSQTEYGSAVDAALGWQRD
+ GAEWIHLVDLDAAFGRGSNHELLAEVVGKLDVQVELSGGIRDDESLAAALATGCARVN
+ VGTAALENPQWCARVIGEHGDQVAVGLDVQIIDGEHRLRGRGWETDGGDLWDVLERLD
+ SEGCSRFVVTDITKDGTLGGPNLDLLAGVADRTDAPVIASGGVSSLDDLRAIATLTHR
+ GVEGAIVGKALYARRFTLPQALAAVRD"
+ gene 1793814..1794626
+ /gene="impA"
+ /locus_tag="BQ2027_MB1630"
+ CDS 1793814..1794626
+ /gene="impA"
+ /locus_tag="BQ2027_MB1630"
+ /note="Mb1630, impA, len: 270 aa. Equivalent to Rv1604,
+ len: 270 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.9% identity in 270 aa overlap). Probable impA,
+ inositol monophosphatase (EC 3.1.3.25), similar to many
+ e.g. AF0059|AF005905_2 inositol monophosphate phosphatase
+ from Mycobacterium smegmatis (276 aa), FASTA scores: opt:
+ 1241, E(): 0, (70.5% identity in 261 aa overlap). Also
+ similar to Mycobacterium tuberculosis proteins Rv3137 and
+ Rv2701c. Mb1630 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INOSITOL-MONOPHOSPHATASE IMPA (IMP)"
+ /protein_id="SIU00234.1"
+ /db_xref="GOA:A0A1R3XZP5"
+ /db_xref="InterPro:IPR000760"
+ /db_xref="InterPro:IPR020550"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZP5"
+ /translation="MHLDSLVAPLVEQASAILDAATALFLVGHRADSAVRKKGNDFAT
+ EVDLAIERQVVAALVAATGIEVHGEEFGGPAVDSRWVWVLDPIDGTINHAAGSPLAAI
+ LLGLLHDGVPVAGLTWMPFTDQRYTAVAGGPLIKNGVPQPPLADAELANVLVGVGTFS
+ ADSRGQFPGRYRLAVLEKLSRVSSRLRMHGSTGIDLVFVADGILGGAISFGGHVWDHA
+ AGVALVRAAGGVVTDLAGQPWTPASRSALAGPLRVHAQILEILGSIGEPEDY"
+ gene 1794628..1795431
+ /gene="hisF"
+ /locus_tag="BQ2027_MB1631"
+ CDS 1794628..1795431
+ /gene="hisF"
+ /locus_tag="BQ2027_MB1631"
+ /note="Mb1631, hisF, len: 267 aa. Equivalent to Rv1605,
+ len: 267 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 267 aa overlap). Probable hisF, cyclase
+ involved in histidine biosynthetic pathway, similar to
+ many e.g. AF0304|AF030405_1 Corynebacterium glutamicum
+ cyclase (257 aa), FASTA scores: opt: 1201, E(): 0, (71.9%
+ identity in 256 aa overlap). BELONGS TO THE HISA / HISF
+ FAMILY. Protein product from Mb1631 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1631
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable cyclase hisF"
+ /protein_id="SIU00235.1"
+ /db_xref="GOA:Q7VEW8"
+ /db_xref="InterPro:IPR004651"
+ /db_xref="InterPro:IPR006062"
+ /db_xref="InterPro:IPR011060"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEW8"
+ /translation="MYADRDLPGAGGLAVRVIPCLDVDDGRVVKGVNFENLRDAGDPV
+ ELAAVYDAEGADELTFLDVTASSSGRATMLEVVRRTAEQVFIPLTVGGGVRTVADVDS
+ LLRAGADKVAVNTAAIACLDLLADMARQFGSQCIVLSVDARTVPVGSAPTPSGWEVTT
+ HGGRRGTGMDAVQWAARGADLGVGEILLNSMDADGTKAGFDLALLRAVRAAVTVPVIA
+ SGGAGAVEHFAPAVAAGADAVLAASVFHFRELTIGQVKAALAAEGITVR"
+ gene 1795428..1795775
+ /gene="hisI"
+ /locus_tag="BQ2027_MB1632"
+ CDS 1795428..1795775
+ /gene="hisI"
+ /locus_tag="BQ2027_MB1632"
+ /note="Mb1632, hisI, len: 115 aa. Equivalent to Rv1606,
+ len: 115 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 115 aa overlap). Probable hisI,
+ phosphoribosyl-AMP 1,6 cyclohydrolase (EC 3.5.4.19),
+ similar to several e.g. X82010|RSHISI_2 HISI from
+ Rhodobacter sphaeroides (119 aa), FASTA scores: opt: 378,
+ E(): 2.8e-21, (52.3% identity in 109 aa overlap); etc.
+ Protein product from Mb1632 detected using SWATH mass
+ spectrometry. Mb1632 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable phosphoribosyl-AMP 1,6 cyclohydrolase
+ hisI"
+ /protein_id="SIU00236.1"
+ /db_xref="GOA:P0A5B4"
+ /db_xref="InterPro:IPR002496"
+ /db_xref="InterPro:IPR026660"
+ /db_xref="InterPro:IPR038019"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5B4"
+ /translation="MTLDPKIAARLKRNADGLVTAVVQERGSGDVLMVAWMNDEALAR
+ TLQTREATYYSRSRAEQWVKGATSGHTQHVHSVRLDCDGDAVLLTVDQVGGACHTGDH
+ SCFDAAVLLEPDD"
+ gene 1795956..1797038
+ /gene="chaA"
+ /locus_tag="BQ2027_MB1633"
+ CDS 1795956..1797038
+ /gene="chaA"
+ /locus_tag="BQ2027_MB1633"
+ /note="Mb1633, chaA, len: 360 aa. Equivalent to Rv1607,
+ len: 360 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 360 aa overlap). Probable chaA, ionic
+ transporter integral membrane protein, putative
+ calcium/proton antiporter, similar to many e.g.
+ P31801|CHAA_ECOLI CALCIUM/PROTON ANTIPORTER from
+ Escherichia coli (366 aa), FASTA scores: opt: 736, E(): 0,
+ (35.9% identity in 351 aa overlap). Equivalent to
+ Mycobacterium leprae AL049913|MLCB1610_21 (77.7% identity
+ in 364 aa overlap). SEEMS TO BELONG TO THE CaCA FAMILY.
+ Protein product from Mb1633 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1633 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable ionic transporter integral membrane
+ protein chaA"
+ /protein_id="SIU00237.1"
+ /db_xref="GOA:A0A1R3XYU2"
+ /db_xref="InterPro:IPR004837"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYU2"
+ /translation="MLKRVPWTVVLPSLAFVALVLTWGKQIGPVVGLLAAVLLAGAVL
+ AAVNHAEVVAARVGEPFGSLVLAVAVTTIEVALIVALMVSGGDDAATLARDTVFAAVM
+ ITTNGIAGLSLLLGSLRYGVTLFNPHGSGAALATVTTLATLSLVLPTFTTSQSGPELS
+ PGQLIFAGAASLGLYVLFLFTQTVRHRDFFLPVAQKGAVEDDSHADPPSTRAALLSLG
+ LLLVALVAVVGLAKVESPVIEEVVSAAGFPQSFVGVVIATLVLLPETLAAARAARQGR
+ LQTSLNLAYGSAMASIGLTIPTIALASLWLSGPLQLGLGAIQLVLLVLTVVVSVLTVV
+ PGRATRLQGEVHLVLLAAYLFLAVVP"
+ gene complement(1797073..1797537)
+ /gene="bcpB"
+ /locus_tag="BQ2027_MB1634C"
+ CDS complement(1797073..1797537)
+ /gene="bcpB"
+ /locus_tag="BQ2027_MB1634C"
+ /note="Mb1634c, bcpB, len: 154 aa. Equivalent to Rv1608c,
+ len: 154 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 154 aa overlap). Probable bcpB,
+ peroxidoxin or bacterioferritin comigratory protein,
+ similar to many, e.g. AE0003|ECAE000335_4 bacterioferritin
+ comigratory protein from Escherichia coli K-12 MG1655 (156
+ aa), FASTA scores: opt: 329, E(): 1.2e-16, (38.2% identity
+ in 152 aa overlap); Z97179|MLCL383_22 Mycobacterium leprae
+ cosmid L383 (161 aa) (40.2% identity in 132 aa overlap).
+ Also similar to Rv2428 AhpC, alkyl hydroperoxide reductase
+ from Mycobacterium tuberculosis; and other Mycobacterium
+ tuberculosis putative peroxidoxins Rv2521, Rv2238c,
+ Rv1932. Protein product from Mb1634c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1634c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable peroxidoxin bcpB"
+ /protein_id="SIU00238.1"
+ /db_xref="GOA:A0A1R3XYU8"
+ /db_xref="InterPro:IPR000866"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR024706"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYU8"
+ /translation="MKTGDTVADFELPDQTGTPRRLSVLLSDGPVVLFFYPAAMTPGC
+ TKEACHFRDLAKEFAEVRASRVGISTDPVRKQAKFAEVRRFDYPLLSDAQGTVAAQFG
+ VKRGLLGKLMPVKRTTFVIDTDRKVLDVISSEFSMDAHADKALATLRAIRSG"
+ gene 1797678..1799228
+ /gene="trpE"
+ /locus_tag="BQ2027_MB1635"
+ CDS 1797678..1799228
+ /gene="trpE"
+ /locus_tag="BQ2027_MB1635"
+ /note="Mb1635, trpE, len: 516 aa. Equivalent to Rv1609,
+ len: 516 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 516 aa overlap). Probable trpE,
+ anthranilate synthase component I (EC 4.1.3.27). FASTA
+ best: TRPE_CLOTM|P14953 anthranilate synthase component I
+ from Clostridium thermocellum (494 aa), E(): 0, (42.6%
+ identity in 498 aa overlap). Some similarity to
+ Rv2386c|MTCY253.35, E(): 6.3e-17; and
+ Rv3215|MTCY07D11.11c, E(): 5.7e-15. BELONGS TO THE
+ ANTHRANILATE SYNTHASE COMPONENT I FAMILY. Protein product
+ from Mb1635 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1635 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="anthranilate synthase component i trpe
+ (glutamine amidotransferase)"
+ /protein_id="SIU00239.1"
+ /db_xref="GOA:P67002"
+ /db_xref="InterPro:IPR005256"
+ /db_xref="InterPro:IPR005801"
+ /db_xref="InterPro:IPR006805"
+ /db_xref="InterPro:IPR015890"
+ /db_xref="InterPro:IPR019999"
+ /db_xref="UniProtKB/Swiss-Prot:P67002"
+ /translation="MHADLAATTSREDFRLLAAEHRVVPVTRKVLADSETPLSAYRKL
+ AANRPGTFLLESAENGRSWSRWSFIGAGAPTALTVREGQAVWLGAVPKDAPTGGDPLR
+ ALQVTLELLATADRQSEPGLPPLSGGMVGFFAYDMVRRLERLPERAVDDLCLPDMLLL
+ LATDVAAVDHHEGTITLIANAVNWNGTDERVDWAYDDAVARLDVMTAALGQPLPSTVA
+ TFSRPEPRHRAQRTVEEYGAIVEYLVDQIAAGEAFQVVPSQRFEMDTDVDPIDVYRIL
+ RVTNPSPYMYLLQVPNSDGAVDFSIVGSSPEALVTVHEGWATTHPIAGTRWRGRTDDE
+ DVLLEKELLADDKERAEHLMLVDLGRNDLGRVCTPGTVRVEDYSHIERYSHVMHLVST
+ VTGKLGEGRTALDAVTACFPAGTLSGAPKVRAMELIEEVEKTRRGLYGGVVGYLDFAG
+ NADFAIAIRTALMRNGTAYVQAGGGVVADSNGSYEYNEARNKARAVLNAIAAAETLAA
+ PGANRSGC"
+ gene 1799218..1799925
+ /locus_tag="BQ2027_MB1636"
+ CDS 1799218..1799925
+ /locus_tag="BQ2027_MB1636"
+ /note="Mb1636, -, len: 235 aa. Equivalent to Rv1610, len:
+ 235 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 235 aa overlap). Possible conserved
+ membrane protein. Equivalent to AL049913|MLCB1610_23
+ hypothetical protein from Mycobacterium leprae (264 aa),
+ FASTA score: (65.8% identity in 231 aa overlap). Protein
+ product from Mb1636 detected using SWATH mass
+ spectrometry. Mb1636 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00240.1"
+ /db_xref="GOA:A0A1R3XYU4"
+ /db_xref="InterPro:IPR011746"
+ /db_xref="InterPro:IPR019051"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYU4"
+ /translation="MAANAGSVRPNRRARPMIGIAQLLLVVAAGALWMAARLPWVVIG
+ SFDELGPPKEVTLTGASWSTALLPLALLMLAAAVAALAVRGWPLRALAVLLAAASFAV
+ GYLGISLWVVPDVAARGADLAHVPVVTLVGSARHYWGAVAAVLAAVCALLAAVFLMSS
+ AAIRGSAGEDMARYAAPRARRSIARRQHSNAAGRAAPQDDGPDMGPRMSERMIWEALD
+ EGRDPTDREQESDTEGR"
+ gene 1800015..1800833
+ /gene="trpC"
+ /locus_tag="BQ2027_MB1637"
+ CDS 1800015..1800833
+ /gene="trpC"
+ /locus_tag="BQ2027_MB1637"
+ /note="Mb1637, trpC, len: 272 aa. Equivalent to Rv1611,
+ len: 272 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 272 aa overlap). Probable trpC,
+ indole-3-glycerol phosphate synthase (EC 4.1.1.48).
+ Similar to Q55508|SLR0546 HYPOTHETICAL 33.0 KD PROTEIN
+ from SYNECHOCYSTIS SP (295 aa), FASTA score: opt: 26, E():
+ 7.6e-32, (44.2% identity in 265 aa overlap); also similar
+ to TRPC_AZOBR|P26938 indole-3-glycerol-phosphate
+ synthaseindole-3-glycerol-phosphate synthase from
+ Azospirillum brasilense (262 aa), FASTA score: opt: 596,
+ E(): 4.8e-30, (43.8% identity in 258 aa overlap).
+ Equivalent to AL0499 13|MLCB1610_24 from Mycobacterium
+ leprae (272 aa) (90.8% identity in 272 aa overlap).
+ Contains indole-3-glycerol phosphate synthase signature
+ (PS00614). BELONGS TO THE TRPC FAMILY. Protein product
+ from Mb1637 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1637 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable indole-3-glycerol phosphate synthase
+ trpC"
+ /protein_id="SIU00241.1"
+ /db_xref="GOA:P0A633"
+ /db_xref="InterPro:IPR001468"
+ /db_xref="InterPro:IPR011060"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR013798"
+ /db_xref="UniProtKB/Swiss-Prot:P0A633"
+ /translation="MSPATVLDSILEGVRADVAAREASVSLSEIKAAAAAAPPPLDVM
+ AALREPGIGVIAEVKRASPSAGALATIADPAKLAQAYQDGGARIVSVVTEQRRFQGSL
+ DDLDAVRASVSIPVLRKDFVVQPYQIHEARAHGADMLLLIVAALEQSVLVSMLDRTES
+ LGMTALVEVHTEQEADRALKAGAKVIGVNARDLMTLDVDRDCFARIAPGLPSSVIRIA
+ ESGVRGTADLLAYAGAGADAVLVGEGLVTSGDPRAAVADLVTAGTHPSCPKPAR"
+ gene 1800902..1802134
+ /gene="trpB"
+ /locus_tag="BQ2027_MB1638"
+ CDS 1800902..1802134
+ /gene="trpB"
+ /locus_tag="BQ2027_MB1638"
+ /note="Mb1638, trpB, len: 410 aa. Equivalent to Rv1612,
+ len: 410 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 410 aa overlap). Probable trpB,
+ tryptophan synthase beta chain (EC 4.2.1.20). Equivalent
+ to AL049913|MLCB1610_25 from Mycobacterium leprae (340 aa)
+ (88.5% identity in 331 aa overlap). Similar to others e.g.
+ TRPB_CAUCR|P12290 tryptophan synthase beta chain from
+ Caulobacter crescentus (406 aa), FASTA scores: opt: 1662,
+ E(): 0, (60.6% identity in 404 aa overlap). BELONGS TO THE
+ TRPB FAMILY. TETRAMER OF TWO ALPHA AND TWO BETA CHAINS.
+ Protein product from Mb1638 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1638 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="tryptophan synthase, beta subunit trpb"
+ /protein_id="SIU00242.1"
+ /db_xref="GOA:P66985"
+ /db_xref="InterPro:IPR001926"
+ /db_xref="InterPro:IPR006653"
+ /db_xref="InterPro:IPR006654"
+ /db_xref="InterPro:IPR023026"
+ /db_xref="InterPro:IPR036052"
+ /db_xref="UniProtKB/Swiss-Prot:P66985"
+ /translation="MSAAIAEPTSHDPDSGGHFGGPSGWGGRYVPEALMAVIEEVTAA
+ YQKERVSQDFLDDLDRLQANYAGRPSPLYEATRLSQHAGSARIFLKREDLNHTGSHKI
+ NNVLGQALLARRMGKTRVIAETGAGQHGVATATACALLGLDCVIYMGGIDTARQALNV
+ ARMRLLGAEVVAVQTGSKTLKDAINEAFRDWVANADNTYYCFGTAAGPHPFPTMVRDF
+ QRIIGMEARVQIQGQAGRLPDAVVACVGGGSNAIGIFHAFLDDPGVRLVGFEAAGDGV
+ ETGRHAATFTAGSPGAFHGSFSYLLQDEDGQTIESHSISAGLDYPGVGPEHAWLKEAG
+ RVDYRPITDSEAMDAFGLLCRMEGIIPAIESAHAVAGALKLGVELGRGAVIVVNLSGR
+ GDKDVETAAKWFGLLGND"
+ gene 1802134..1802946
+ /gene="trpA"
+ /locus_tag="BQ2027_MB1639"
+ CDS 1802134..1802946
+ /gene="trpA"
+ /locus_tag="BQ2027_MB1639"
+ /note="Mb1639, trpA, len: 270 aa. Equivalent to Rv1613,
+ len: 270 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 270 aa overlap). Probable trpA,
+ tryptophan synthase alpha chain (EC 4.2.1.20). FASTA best:
+ O68906|TRPA_MYCIT TRYPTOPHAN SYNTHASE ALPHA CHAIN from
+ Mycobacterium intracellulare (271 aa), opt: 1442, E(): 0,
+ (85.3% identity in 265 aa overlap). Protein product from
+ Mb1639 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1639 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable tryptophan synthase, alpha subunit
+ trpA"
+ /protein_id="SIU00243.1"
+ /db_xref="GOA:P66981"
+ /db_xref="InterPro:IPR002028"
+ /db_xref="InterPro:IPR011060"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR018204"
+ /db_xref="UniProtKB/Swiss-Prot:P66981"
+ /translation="MVAVEQSEASRLGPVFDSCRANNRAALIGYLPTGYPDVPASVAA
+ MTALVESGCDIIEVGVPYSDPGMDGPTIARATEAALRGGVRVRDTLAAVEAISIAGGR
+ AVVMTYWNPVLRYGVDAFARDLAAAGGLGLITPDLIPDEAQQWLAASEEHRLDRIFLV
+ APSSTPERLAATVEASRGFVYAASTMGVTGARDAVSQAAPELVGRVKAVSDIPVGVGL
+ GVRSRAQAAQIAQYADGVIVGSALVTALTEGLPRLRALTGELAAGVRLGMSA"
+ gene 1802946..1804352
+ /gene="lgt"
+ /locus_tag="BQ2027_MB1640"
+ CDS 1802946..1804352
+ /gene="lgt"
+ /locus_tag="BQ2027_MB1640"
+ /note="Mb1640, lgt, len: 468 aa. Equivalent to Rv1614,
+ len: 468 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 468 aa overlap). Possible lgt,
+ prolipoprotein diacylglyceryl transferases (EC 2.4.99.-),
+ similar to many prolipoprotein diacylglyceryl
+ transferases. FASTA scores: LGT_STAAU|P52282
+ prolipoprotein diacylglyceryl transferase from
+ Staphylococcus aureus subsp. (279 aa), opt: 289,
+ E():3.6e-09, (31.5% identity in 257 aa overlap);
+ AL096884|SC4G6_3 cosmid 4G6 from Streptomyces coelicolor
+ (343 aa), opt: 735, E(): 4e-32, (46.5% identity in 391 aa
+ overlap). Protein product from Mb1640 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1640 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible prolipoprotein diacylglyceryl
+ transferases Lgt"
+ /protein_id="SIU00244.1"
+ /db_xref="GOA:Q7VEW5"
+ /db_xref="InterPro:IPR001640"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEW5"
+ /translation="MRMLPSYIPSPPRGVWYLGPLPVRAYAVCVITGIIVALLIGDRR
+ LTARGGERGMTYDIALWAVPFGLIGGRLYHLATDWRTYFGDGGAGLAAALRIWDGGLG
+ IWGAVTLGVMGAWIGCRRCGIPLPVLLDAVAPGVVLAQAIGRLGNYFNQELYGRETTM
+ PWGLEIFYRRDPSGFDVPNSLDGVSTGQVAFVVQPTFLYELIWNVLVFVALIYIDRRF
+ IIGHGRLFGFYVAFYCAGRFCVELLRDDPATLIAGIRINSFTSTFVFIGAVVYIILAP
+ KGREAPGALRGSEYVVDEALEREPAELAAAAVASAASAVGPVGPGEPNQPDDVAEAVK
+ AEVAEVTDEVAAESVVQVADRDGESTPAVEETSEADIEREQPGDLAGQAPAAHQVDAE
+ AASAAPEEPAALASEAHDETEPEVPEKAAPIPDPAKPDELAVAGPGDDPAEPDGIRRQ
+ DDFSSRRRRWWRLRRRRQ"
+ gene 1805028..1805468
+ /locus_tag="BQ2027_MB1641"
+ CDS 1805028..1805468
+ /locus_tag="BQ2027_MB1641"
+ /note="Mb1641, -, len: 146 aa. Equivalent to Rv1615, len:
+ 146 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 146 aa overlap). Probable membrane
+ protein. Protein product from Mb1641 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1641 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable membrane protein"
+ /protein_id="SIU00245.1"
+ /db_xref="GOA:A0A1R3XYU1"
+ /db_xref="InterPro:IPR007829"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYU1"
+ /translation="MGLRPARVVRPARSGMLKGVTDPLQHGAFEPGWQSAPPGYPPPY
+ PQYPGPGSYFDPFAPYGRHPVTGQPFSDKSKTVAGLLQLLGLFGIAGIGRIYLGHTGL
+ GIAQLLVGWVTCGLGAVIWGVIDALLILTDKVGDPWGRPLRDGS"
+ gene 1805458..1805856
+ /locus_tag="BQ2027_MB1642"
+ CDS 1805458..1805856
+ /locus_tag="BQ2027_MB1642"
+ /note="Mb1642, -, len: 132 aa. Equivalent to Rv1616, len:
+ 132 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 132 aa overlap). Conserved membrane
+ protein, with some similarity to other hypothetical
+ proteins e.g. AL096884|SC4G6_9 from Streptomyces
+ coelicolor cosmid 4G6 (148 aa), FASTA scores: opt: 245,
+ E(): 1.7e-1 0, (36.7% identity in 128 aa overlap);
+ Q55401|SLL0543 HYPOTHETICAL 16.5 KD PROTEIN from
+ SYNECHOCYSTIS SP (148 aa), FASTA scores: opt: 225, E():
+ 6.5e-10, (35.9% identity in 117 aa overlap). Has cysteine
+ cluster and contains a rubredoxin signature (PS00202).
+ Mb1642 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00246.1"
+ /db_xref="GOA:A0A1R3XZ74"
+ /db_xref="InterPro:IPR021215"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ74"
+ /translation="MEASGRQRRYAAAGSVVLLAGALGYIGLVDPHNSNSLYPPCLFK
+ LLTGWNCPACGGLRMIHDLLHGELAASINDNVFLLVGVPVLASWVLLRRRHGDLALPI
+ PVMIAVAVAVIAWTVLRNLPGFPLVPTISG"
+ gene 1805964..1807382
+ /gene="pykA"
+ /locus_tag="BQ2027_MB1643"
+ CDS 1805964..1807382
+ /gene="pykA"
+ /locus_tag="BQ2027_MB1643"
+ /note="Mb1643, pykA, len: 472 aa. Equivalent to Rv1617,
+ len: 472 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 472 aa overlap). Probable pykA,
+ pyruvate kinase (EC 2.7.1.40). FASTA best: Q46078 PYRUVATE
+ KINASE from CORYNEBACTERIUM GLUTAMICUM (475 aa), opt:
+ 2221, E(): 0, (72.2% identity in 468 aa overlap). BELONGS
+ TO THE PYRUVATE KINASE FAMILY. Protein product from Mb1643
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1643 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable pyruvate kinase pykA"
+ /protein_id="SIU00247.1"
+ /db_xref="GOA:A0A1R3XYV1"
+ /db_xref="InterPro:IPR001697"
+ /db_xref="InterPro:IPR011037"
+ /db_xref="InterPro:IPR015793"
+ /db_xref="InterPro:IPR015795"
+ /db_xref="InterPro:IPR015806"
+ /db_xref="InterPro:IPR015813"
+ /db_xref="InterPro:IPR036918"
+ /db_xref="InterPro:IPR040442"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYV1"
+ /translation="MTRRGKIVCTLGPATQRDDLVRALVEAGMDVARMNFSHGDYDDH
+ KVAYERVRVASDATGRAVGVLADLQGPKIRLGRFASGATHWAEGETVRITVGACEGSH
+ DRVSTTYKRLAQDAVAGDRVLVDDGKVALVVDAVEGDDVVCTVVEGGPVSDNKGISLP
+ GMNVTAPALSEKDIEDLTFALNLGVDMVALSFVRSPADVELVHEVMDRIGRRVPVIAK
+ LDKPEAIDNLEAIVLAFDAVMVARGDLGVELPLEEVPLVQKRAIQMARENAKPVIVAT
+ QMLDSMIENSRPTRAEASDVANAVLDGADALMLSGETSVGKYPLAAVRTMSRIICAVE
+ ENSTAAPPLTHIPRTKRGVISYAARDIGERLDAKALVAFTQSGDTVRRLARLHTPLPL
+ LAFTAWPEVRSQLAMTWGTETFIVPKMQSTDGMIRQVDKSLLELARYKRGDLVVIVAG
+ APPGTVGSTNLIHVHRIGEDDV"
+ gene 1807390..1808292
+ /gene="tesB1"
+ /locus_tag="BQ2027_MB1644"
+ CDS 1807390..1808292
+ /gene="tesB1"
+ /locus_tag="BQ2027_MB1644"
+ /note="Mb1644, tesB1, len: 300 aa. Equivalent to Rv1618,
+ len: 300 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 300 aa overlap). Probable tesB1,
+ acyl-CoA thioesterase II (EC 3.1.2.-), similar to other
+ acyl-CoA thioesterases e.g. TESB_ECOLI|P23911 acyl-coa
+ thioesterase II from Escherichia coli (285 aa), FASTA
+ scores: opt: 495, E(): 2.9e-27, (32.5% identity in 283 aa
+ overlap); etc. Also similar to Rv2605c|tesB2 from M.
+ tuberculosis. Protein product from Mb1644 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1644 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable acyl-CoA thioesterase II tesB1"
+ /protein_id="SIU00248.1"
+ /db_xref="GOA:A0A1R3XYV7"
+ /db_xref="InterPro:IPR003703"
+ /db_xref="InterPro:IPR025652"
+ /db_xref="InterPro:IPR029069"
+ /db_xref="InterPro:IPR042171"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYV7"
+ /translation="MPDGKPMSDFDELLAVLDLNAVASDLFTGSHPSKNPLRTFGGQL
+ MAQSFVASSRTLTRHHLPPSAFSVHFINGGDTAKDIEFQVIRLRDERRFANRRVDAVQ
+ DGTLLSSAMVSYMAGGRGLEHALDPPQVAEPHTRPPIGELLRGYEETVPHFVNALQPI
+ EWRYANDPAWIMRDKGDRLAYNRVWVKALGEMPDDPVLHTATLLYSSDTTVLDSVITT
+ HGLSWGFDRIFAASANHSVWFHRQVNFDDWVLYSTSSPVAADSRGLGSGHFFDRSGKL
+ IATVVQEGVLKYFPATPDSAAGRS"
+ gene 1808350..1809804
+ /locus_tag="BQ2027_MB1645"
+ CDS 1808350..1809804
+ /locus_tag="BQ2027_MB1645"
+ /note="Mb1645, -, len: 484 aa. Equivalent to Rv1619, len:
+ 484 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 484 aa overlap). Conserved membrane
+ protein. Some similarity to N-terminus of
+ P94974|Rv1640c|MTCY06H11.04c PROBABLE LYSYL-TRNA
+ SYNTHETASE 2 (EC 6.1.1.6) from Mycobacterium tuberculosis
+ (1172 aa), FASTA scores: E(): 1.4e-16, (28.0% identity in
+ 410 aa overlap); and similar in part to O69916| SC3C8.03C
+ Putative intergral membrane protein from Streptomyces
+ coelicolor cosmid 3C8 (589 aa), FASTA scores: opt: 453
+ E(): 8.4e-22, (31.3% identity in 313 aa overlap). Mb1645
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00249.1"
+ /db_xref="GOA:A0A1R3XYU9"
+ /db_xref="InterPro:IPR024320"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYU9"
+ /translation="MVAAAGEPLNCQRANPEVTVKLPSADVVPRLRGRQRVVVHVDSR
+ TARCVGALALVCAACWLIALLAGDYRHAQWAVAGRLGWSLTVLAAVAFIARGIFLGRP
+ VTAMHATAAGLFLLAGLAAHVLVADLLGEILIAGSGWALMWPTSAHPRPEDLPRVWAL
+ INATRADSLAPFAMQAGKSHHFSAAGTAALAYRTRIGYAVVSGDPIGDEAQFPQLVAD
+ FAAMCHMHGWRIVVVGCSERRLGLWSDPMVVGQSLRPIPIGRDVVIDVSNFEMTGRRF
+ RNLRQAVKRTHNFGVTTEIVAEQQLDDQRQAELAEVLAASPSGARTDRGFCMNLDGVL
+ EGRYPGIQLIIARDASGRVQGFHRYATAGGGSDMSLDVPWRRRGAPNGIDERLSADMI
+ AAAKDAGVQRLSLAFAAFPDLFGANQLGRLQRVCRALIHILDPLIALESLYRYLRKFH
+ ALDERRYVLISMTQVFALALVLLSLEFVPRRRHL"
+ gene complement(1809738..1811468)
+ /gene="cydC"
+ /locus_tag="BQ2027_MB1646C"
+ CDS complement(1809738..1811468)
+ /gene="cydC"
+ /locus_tag="BQ2027_MB1646C"
+ /note="Mb1646c, cydC, len: 576 aa. Equivalent to Rv1620c,
+ len: 576 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 576 aa overlap). Probable cydC,
+ transmembrane ATP-binding protein ABC transporter involved
+ in transport of component linked with the assembly of
+ cytochrome (see citation below), similar to others e.g.
+ CYDC_ECOLI|P23886 transport ATP-binding protein from
+ Escherichia coli (573 aa), FASTA scores: opt: 631, E():
+ 1.6e-30, (28.5% identity in 569 aa overlap); C-terminal
+ part of AL034355|SCD78_14 from Streptomyces coelicolor
+ (1172 aa), FASTA scores: opt: 956, E(): 0, (38.8% identity
+ in 554 aa overlap); etc. Contains (PS00211) ABC
+ transporters family signature, and (PS00017)
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Mb1646c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 'COMPONENT LINKED WITH THE ASSEMBLY OF
+ CYTOCHROME' TRANSPORT TRANSMEMBRANE ATP-BINDING PROTEIN
+ ABC TRANSPORTER CYDC"
+ /protein_id="SIU00250.1"
+ /db_xref="GOA:A0A1R3XYV3"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR011527"
+ /db_xref="InterPro:IPR014223"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036640"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYV3"
+ /translation="MNRPSAVSRRQRDLLAASGLLGPRLPRILAAVALGVLSLGSALA
+ LAGVSAWLITRAWQMPPVLDLSVAVVAVRAFAISRGVLHYCERLATHDTALRAAGRAR
+ TLIYHRLAHGPAAAAVGLHSGDLAARVGADVDELANMLVRALVPIAVAAVLAVAATAV
+ VAAVSVPAAVVLAVCLLVAGVVAPWLAGRTAAAQEAIARQHRGMRDTSAMIALEHAPE
+ LRVAGALRNVIADSQRRQHAWADALDAAARTGAIAEAMPTAAIGASLLGAVVAGIGMA
+ PTVAPTTLAILMLLPLSAFEATVALPAAAVQLTRSRIAAARLLDLTGSNRVRETESTV
+ SARLPVGTGVLAADVCCGHQEAQSIRVTIDLPPGARLAVTGASGAGKTTLLMTLAGLL
+ PPVHGRVLLDGTNLSDFDEDELRSAVSFFAEDAHIFATTVRDNLLTARGDCPDDELIE
+ ALDRVGLCGWLAGLPEGLSTVLIGGAQAVSAGQRRRLLLARAVLSPARIVLLDEPVEH
+ LDAANADLLRDLLAPNSGIMSAMRTVVVATHHLPNDIQCAELSIATDQRCRRRGTNSS
+ DNNTNASAKT"
+ gene complement(1811465..1813048)
+ /gene="cydD"
+ /locus_tag="BQ2027_MB1647C"
+ CDS complement(1811465..1813048)
+ /gene="cydD"
+ /locus_tag="BQ2027_MB1647C"
+ /note="Mb1647c, cydD, len: 527 aa. Equivalent to Rv1621c,
+ len: 527 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 527 aa overlap). Probable cydD,
+ transmembrane ATP-binding protein ABC transporter involved
+ in transport of component linked with the assembly of
+ cytochrome (see citation below), similar to others e.g.
+ P94366|CYDC_BACSU TRANSPORT ATP-BINDING PROTEIN from
+ Bacillus subtilis (567 aa), FASTA scores: opt: 784, E():
+ 0, (30.1% identity in 535 aa overlap); N-terminal part of
+ AL034355|SCD78_14 from Streptomyces coelicolor (1172 aa),
+ FASTA scores: opt: 1295, E(): 0, (44.6% identity in 534 aa
+ overlap); etc. Also similar to Q11019|Y07D_MYCTU from
+ Mycobacterium tuberculosis (579 aa), FASTA scores: opt:
+ 530, E(): 6.9e-25, (29.1% identity in 530 aa overlap).
+ Contains (PS00211) ABC transporters family signature, and
+ (PS00017) ATP/GTP-binding site motif A (P-loop). BELONGS
+ TO THE ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC
+ TRANSPORTERS). Mb1647c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 'COMPONENT LINKED WITH THE ASSEMBLY OF
+ CYTOCHROME' TRANSPORT TRANSMEMBRANE ATP-BINDING PROTEIN
+ ABC TRANSPORTER CYDD"
+ /protein_id="SIU00251.1"
+ /db_xref="GOA:A0A1R3XYT5"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR011527"
+ /db_xref="InterPro:IPR014216"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036640"
+ /db_xref="InterPro:IPR039421"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYT5"
+ /translation="MACGVGISGCAIGSAIVLASIVAGVIDPANPGMAGLRRWLGPLS
+ ILLVLWGLRASIQWLQARLAQRGASAVIADLSGQVLTAVTARRPSQLAAQRDAAAVLI
+ TRGLDGLRPYFTGYLPTLLLAAILTPATVAVIGLYDLKSMAIVVITLPLIPIFMVLIG
+ LATTNPSAAALAAMTAVQARLLDLIAGIPTLRALGRASGPEQRIAELSADHRRSAMAT
+ LRIAFLSALVLELLATLGVALVAVGIGLRLVFGEMSLTAGLTVLLLAPEVYWPLRRVG
+ VQFHAAADGRTAADKAFALLGESPSPTPGRRTVTARGGVIRLERLSVRGRDGRAPYDL
+ TADIEPGRVTVLTGRNGAGKSTTLQAIAGLTAPSSGRITVAGVDVTNLAPAAWWRQLS
+ WLPQRPVLVPGTVRHNLVLLGPVDDLERACAAAGFDAVLDELPRGLDTVLGRGGVGLS
+ LGQRQRLGLARALGSPAAVLLLDEPTAHLDARTEQHVLGAIVERARAGATVLVVAHRQ
+ QVAAAGDRVVEVNSDGFRR"
+ gene complement(1813135..1814175)
+ /gene="cydB"
+ /locus_tag="BQ2027_MB1648C"
+ CDS complement(1813135..1814175)
+ /gene="cydB"
+ /locus_tag="BQ2027_MB1648C"
+ /note="Mb1648c, cydB, len: 346 aa. Equivalent to Rv1622c,
+ len: 346 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 346 aa overlap). Probable cydB,
+ cytochrome D ubiquinol oxidase subunit II (EC 1.10.3.-),
+ integral membrane protein, similar to others e.g.
+ P11027|CYDB_ECOLI CYTOCHROME D UBIQUINOL OXIDASE SUBUNIT
+ II from Escherichia coli strain K12 (379 aa), FASTA
+ scores: opt: 519, E(): 0, (32.3% identity in 372 aa
+ overlap); P94365|CYDB_BACSU CYTOCHROME D UBIQUINOL OXIDASE
+ SUBUNIT II from Bacillus subtilis (338 aa), FASTA scores:
+ opt: 824, E(): 0, (39.5% identity in 337 aa overlap); etc.
+ Protein product from Mb1648c detected using SWATH mass
+ spectrometry. Mb1648c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable integral membrane cytochrome D
+ ubiquinol oxidase (subunit II) cydB (Cytochrome BD-I
+ oxidase subunit II)"
+ /protein_id="SIU00252.1"
+ /db_xref="GOA:A0A1R3XYU5"
+ /db_xref="InterPro:IPR003317"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYU5"
+ /translation="MVLQELWFGVIAALFLGFFILEGFDFGVGMLMAPFAHVGMGDPE
+ THRRTALNTIGPVWDGNEVWLITAGAAIFAAFPGWYATVFSALYLPLLAILFGMILRA
+ VAIEWRGKIDDPKWRTGADFGIAAGSWLPALLWGVAFAILVRGLPVDANGHVALSIPD
+ VLNAYTLLGGLATAGLFSLYGAVFIALKTSGPIRDDAYRFAVWLSLPVAGLVAGFGLW
+ TQLAYGKDWTWLVLAVAGCAQAAATVLVWRRVSDGWAFMCTLIVVAAVVVLLFGALYP
+ NLVPSTLNPQWSLTIHNASSTPYTLKIMTWVTAFFAPLTVAYQTWTYWVFRQRISAER
+ IPPPTGLARRAP"
+ gene complement(1814205..1815662)
+ /gene="cydA"
+ /locus_tag="BQ2027_MB1649C"
+ CDS complement(1814205..1815662)
+ /gene="cydA"
+ /locus_tag="BQ2027_MB1649C"
+ /standard_name="appC"
+ /note="Mb1649c, cydA, len: 485 aa. Equivalent to Rv1623c,
+ len: 485 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 485 aa overlap). Probable cydA
+ (previously known as appC, but renamed cydA to conform
+ with Mycobacterium smegmatis nomenclature), cytochrome D
+ ubiquinol oxidase subunit I (EC 1.10.3.-), integral
+ membrane protein, similar to others e.g.
+ P26459|APPC_ECOLI|CYXA|CBDA|B0978 CYTOCHROME BD-II OXIDASE
+ SUBUNIT I from Escherichia coli strain K12 (514 aa), FASTA
+ scores: opt: 870, E(): 0, (35.9% identity in 485 aa
+ overlap); AL034355|SCD78_12 from Streptomyces coelicolor
+ (501 aa), FASTA scores: opt: 1099, E(): 0, (48.6% identity
+ in 510 aa overlap); etc. Protein product from Mb1649c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1649c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable integral membrane cytochrome D
+ ubiquinol oxidase (subunit I) cydA (Cytochrome BD-I
+ oxidase subunit I)"
+ /protein_id="SIU00253.1"
+ /db_xref="GOA:A0A1R3Y0Z3"
+ /db_xref="InterPro:IPR002585"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Z3"
+ /translation="MNVVDISRWQFGITTVYHFIFVPLTIGLAPLIAVMQTLWVVTDN
+ PAWYRLTKFFGKLFLINFAIGVATGIVQEFQFGMNWSEYSRFVGDVFGAPLAMEGLAA
+ FFFESTFIGLWIFGWNRLPRLVHLACIWIVAIAVNVSAFFIIAANSFMQHPVGAHYNP
+ TTGRAELSSIVVLLTNNTAQAAFTHTVSGALLTAGTFVAAVSAWWLVRSSTTHADSDT
+ QAMYRPATILGCWVALAATAGLLFTGDHQGKLMFQQQPMKMASAESLCDTQTDPNFSV
+ LTVGRQNNCDSLTRVIEVPYVLPFLAEGRISGVTLQGIRDLQQEYQQRFGPNDYRPNL
+ FVTYWSFRMMIGLMAIPVLFALIALWLTRGGQIPNQRWFSWLALLTMPAPFLANSAGW
+ VFTEMGRQPWVVVPNPTGDQLVRLTVKAGVSDHSATVVATSLLMFTLVYAVLAVIWCW
+ LLKRYIVEGPLEHDAEPAAHGAPRDDEVAPLSFAY"
+ gene complement(1815773..1816360)
+ /locus_tag="BQ2027_MB1650C"
+ CDS complement(1815773..1816360)
+ /locus_tag="BQ2027_MB1650C"
+ /note="Mb1650c, -, len: 195 aa. Equivalent to Rv1624c,
+ len: 195 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 195 aa overlap). Probable membrane
+ protein, first start taken. Some similarity to Rv3155
+ nuoK, NADH dehydrogenase chain K from Mycobacterium
+ tuberculosis. Also similar to AAK72093.1|AF196488
+ hypothetical protein from Mycobacterium smegmatis (205
+ aa). Identities = 117/195 (60%). Mb1650c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved membrane protein"
+ /protein_id="SIU00254.1"
+ /db_xref="GOA:A0A1R3XZR5"
+ /db_xref="InterPro:IPR005325"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZR5"
+ /translation="MCHTAPMEPSPVVSPLPRLLPHLWKSTLASGILSLILGVLVLAW
+ PGISILVAAMAFGVYLLITGVAQVAFAFSLHVSAGGRILLFISGAASLILAVLAFRHF
+ GDAVLLLAIWIGIGFIFRGVATTVSAISDPMLPGRGWSIFVGVISLIAGIVVMASPFE
+ SIWILALVVGIWLVVIGACEIASSFAIRKASQTLG"
+ gene complement(1816389..1817645)
+ /gene="cya"
+ /locus_tag="BQ2027_MB1651C"
+ CDS complement(1816389..1817645)
+ /gene="cya"
+ /locus_tag="BQ2027_MB1651C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1651c, cya, len: 418 aa. Equivalent to Rv1625c,
+ len: 418 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 418 aa overlap). cya, membrane-anchored
+ adenylyl cyclase (EC 4.6.1.1) (see citations below).
+ C-terminal half is similar to region in numerous
+ eukaryotic adenylate and guanylate cyclases. N-terminal
+ half hydrophobic. FASTA score: CYG2_RAT|P22717 guanylate
+ cyclase soluble, beta-2 chain (682 aa), FASTA scores: opt:
+ 552, E(): 2.7e-26, (40.3% identity in 226 aa overlap).
+ Some similarity to Rv2435c|MTCY428.11 from Mycobacterium
+ tuberculosis (730 aa), E(): 7e-19. Start changed since
+ first submission (+25 aa). BELONGS TO ADENYLYL CYCLASE
+ CLASS-4/GUANYLYL CYCLASE FAMILY. Protein product from
+ Mb1651c detected using SWATH mass spectrometry. Mb1651c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="MEMBRANE-ANCHORED ADENYLYL CYCLASE CYA (ATP
+ PYROPHOSPHATE-LYASE) (ADENYLATE CYCLASE)"
+ /protein_id="SIU00255.1"
+ /db_xref="GOA:P0A4Y1"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR018297"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4Y1"
+ /translation="MRTQARAPTQHYAESVARRQRVLTITAWLAVVVTGSFALMQLAT
+ GAGGWYIALINVFTAVTFAIVPLLHRFGGLVAPLTFIGTAYVAIFAIGWDVGTDAGAQ
+ FFFLVAAALVVLLVGIEHTALAVGLAAVAAGLVIALEFLVPPDTGLQPPWAMSVSFVL
+ TTVSACGVAVATVWFALRDTARAEAVMEAEHDRSEALLANMLPASIAERLKEPERNII
+ ADKYDEASVLFADIVGFTERASSTAPADLVRFLDRLYSAFDELVDQHGLEKIKVSGDS
+ YMVVSGVPRPRPDHTQALADFALDMTNVAAQLKDPRGNPVPLRVGLATGPVVAGVVGS
+ RRFFYDVWGDAVNVASRMESTDSVGQIQVPDEVYERLKDDFVLRERGHINVKGKGVMR
+ TWYLIGRKVAADPGEVRGAEPRTAGV"
+ gene complement(1817790..1817863)
+ /locus_tag="BQ2027_LEUV"
+ tRNA complement(1817790..1817863)
+ /locus_tag="BQ2027_LEUV"
+ /product="tRNA-Leu"
+ /note="leuV, len: 74 nt. Equivalent to leuV, len: 74 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 74 nt overlap). tRNA-Leu, anticodon caa."
+ gene 1817955..1818572
+ /locus_tag="BQ2027_MB1652"
+ CDS 1817955..1818572
+ /locus_tag="BQ2027_MB1652"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1652, -, len: 205 aa. Equivalent to Rv1626, len:
+ 205 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 205 aa overlap). Probable two-component
+ response system transcriptional regulator, similar to many
+ e.g. CHEY_BACSU|P24072 chemotaxis protein chey homolog
+ (119 aa), FASTA scores: opt: 283, E(): 1.6e-16, (43.0%
+ identity in 114 aa overlap). Also similar to
+ AL109732|SC7H2_27 hypothetical protein from Streptomyces
+ coelicolor (218 aa), opt: 880, E(): 0, (69.4% identity in
+ 196 aa overlap). Protein product from Mb1652 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1652 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable two-component system transcriptional
+ regulator"
+ /protein_id="SIU00256.1"
+ /db_xref="GOA:A0A1R3XZ84"
+ /db_xref="InterPro:IPR001789"
+ /db_xref="InterPro:IPR005561"
+ /db_xref="InterPro:IPR008327"
+ /db_xref="InterPro:IPR011006"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ84"
+ /translation="MTGPTTDADAAVPRRVLIAEDEALIRMDLAEMLREEGYEIVGEA
+ GDGQEAVELAELHKPDLVIMDVKMPRRDGIDAASEIASKRIAPIVVLTAFSQRDLVER
+ ARDAGAMAYLVKPFSISDLIPAIELAVSRFREITALEGEVATLSERLETRKLVERAKG
+ LLQTKHGMTEPDAFKWIQRAAMDRRTTMKRVAEVVLETLGTPKDT"
+ gene complement(1818640..1819848)
+ /locus_tag="BQ2027_MB1653C"
+ CDS complement(1818640..1819848)
+ /locus_tag="BQ2027_MB1653C"
+ /note="Mb1653c, -, len: 402 aa. Equivalent to Rv1627c,
+ len: 402 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 402 aa overlap). Probable nonspecific
+ lipid-transfer protein, similar to many lipid carrier
+ proteins e.g. Q51797 ACETYL CoA SYNTHASE from Pyrococcus
+ furiosus (388 aa), FASTA scores: opt: 400, E(): 3.2e-18,
+ (34.4% identity in 407 aa overlap); etc. Also some
+ similarity to Mycobacterium tuberculosis proteins Rv3523,
+ Rv3540c, Rv0244, Rv2790c, Rv1323, etc. Protein product
+ from Mb1653c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1653c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable nonspecific lipid-transfer protein"
+ /protein_id="SIU00257.1"
+ /db_xref="GOA:A0A1R3XYW1"
+ /db_xref="InterPro:IPR002155"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020616"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYW1"
+ /translation="MRMSAPEPVYILGAGMHPWGKWGNDFTEYGVVAARAALRDAGVD
+ WRHVQLVAGADTIRNGYPGFVAGATFAQKLGWTGVPVSSSYAACASGSQALQSARAQI
+ LAGFCDVALVIGADTTPKGFFAPVGGERKGDPDWQRFHLIGATNTVYFALLARRRMDL
+ YGATVEDFAQVKVKNSRHGLDNPNARYRKENSIDDVLASPVVSDPLRLLDICATSDGA
+ AALIVASKSFTEKHLGSVAGVPSVRAISTVTPKYPQHLPELPDIATDSTAAVPAPERV
+ FKDQILDAAYAEAGIGPEDLSLAEVYDLSTALELDWYEHLGLCPKGEAEALLRSGATT
+ LGGRVPVNPSGGLACFGEAIPAQAIAQVCELTWQLRGQATGRQVADAKVGVTANQGLF
+ GHGSSVIVAR"
+ gene complement(1819845..1820336)
+ /locus_tag="BQ2027_MB1654C"
+ CDS complement(1819845..1820336)
+ /locus_tag="BQ2027_MB1654C"
+ /note="Mb1654c, -, len: 163 aa. Equivalent to Rv1628c,
+ len: 163 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 163 aa overlap). Conserved hypothetical
+ protein, some similarity to others e.g. Q51796 ACAC
+ PROTEIN in Pyrococcus furiosus (136 aa), FASTA scores:
+ opt: 199, E(): 4.6e-06, (34.7% identity in 121 aa
+ overlap). Protein product from Mb1654c detected using
+ shotgun mass spectrometry. Mb1654c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted nucleic-acid-binding protein
+ containing a Zn-ribbon"
+ /protein_id="SIU00258.1"
+ /db_xref="InterPro:IPR002878"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR022002"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYW6"
+ /translation="MPEVTREEPAIDGWFTTDKAGNPHLLGGKCPQCGTYVFPPRADN
+ CPNPACGSDTLESVGLSTRGKLWSYTENRYAPPPPYPAPDPFEPFAVAAVELADEGLI
+ VLGKVVDGTLAADLKVGMEMELTTMPLFADDDGVQRIVYAWRIPSRAGDDAERSDAEE
+ RRR"
+ gene 1820440..1823154
+ /gene="polA"
+ /locus_tag="BQ2027_MB1655"
+ CDS 1820440..1823154
+ /gene="polA"
+ /locus_tag="BQ2027_MB1655"
+ /note="Mb1655, polA, len: 904 aa. Equivalent to Rv1629,
+ len: 904 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 904 aa overlap). polA, DNA polymerase I
+ (EC 2.7.7.7). Has DNA polymerase family A signature
+ (PS00447) at C-terminal end. FASTA best: DPO1_MYCTU|Q07700
+ DNA polymerase I from Mycobacterium tuberculosis (904 aa).
+ Some similarity to Rv2090|MTCY49.30 (393 aa), E():
+ 2.2e-18, (38.7% identity in 292 aa overlap). BELONGS TO
+ DNA POLYMERASE TYPE-A FAMILY. Protein product from Mb1655
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1655 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable dna polymerase i pola"
+ /protein_id="SIU00259.1"
+ /db_xref="GOA:P0A551"
+ /db_xref="InterPro:IPR001098"
+ /db_xref="InterPro:IPR002298"
+ /db_xref="InterPro:IPR002421"
+ /db_xref="InterPro:IPR002562"
+ /db_xref="InterPro:IPR008918"
+ /db_xref="InterPro:IPR012337"
+ /db_xref="InterPro:IPR018320"
+ /db_xref="InterPro:IPR019760"
+ /db_xref="InterPro:IPR020045"
+ /db_xref="InterPro:IPR020046"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="InterPro:IPR036279"
+ /db_xref="InterPro:IPR036397"
+ /db_xref="UniProtKB/Swiss-Prot:P0A551"
+ /translation="MVTTASAPSEDRAKPTLMLLDGNSLAFRAFYALPAENFKTRGGL
+ TTNAVYGFTAMLINLLRDEAPTHIAAAFDVSRQTFRLQRYPEYKANRSSTPDEFAGQI
+ DITKEVLGALGITVLSEPGFEADDLIATLATQAENEGYRVLVVTGDRDALQLVSDDVT
+ VLYPRKGVSELTRFTPEAVVEKYGLTPRQYPDFAALRGDPSDNLPGIPGVGEKTAAKW
+ IAEYGSLRSLVDNVDAVRGKVGDALRANLASVVRNRELTDLVRDVPLAQTPDTLRLQP
+ WDRDHIHRLFDDLEFRVLRDRLFDTLAAAGGPEVDEGFDVRGGALAPGTVRQWLAEHA
+ GDGRRAGLTVVGTHLPHGGDATAMAVAAADGEGAYLDTATLTPDDDAALAAWLADPAK
+ PKALHEAKAAVHDLAGRGWTLEGVTSDTALAAYLVRPGQRSFTLDDLSLRYLRRELRA
+ ETPQQQQLSLLDDDDTDAETIQTTILRARAVIDLADALDAELARIDSTALLGEMELPV
+ QRVLAKMESAGIAVDLPMLTELQSQFGDQIRDAAEAAYGVIGKQINLGSPKQLQVVLF
+ DELGMPKTKRTKTGYTTDADALQSLFDKTGHPFLQHLLAHRDVTRLKVTVDGLLQAVA
+ ADGRIHTTFNQTIAATGRLSSTEPNLQNIPIRTDAGRRIRDAFVVGDGYAELMTADYS
+ QIEMRIMAHLSGDEGLIEAFNTGEDLHSFVASRAFGVPIDEVTGELRRRVKAMSYGLA
+ YGLSAYGLSQQLKISTEEANEQMDAYFARFGGVRDYLRAVVERARKDGYTSTVLGRRR
+ YLPELDSSNRQVREAAERAALNAPIQGSAADIIKVAMIQVDKALNEAQLASRMLLQVH
+ DELLFEIAPGERERVEALVRDKMGGAYPLDVPLEVSVGYGRSWDAAAH"
+ gene 1823317..1824762
+ /gene="rpsA"
+ /locus_tag="BQ2027_MB1656"
+ CDS 1823317..1824762
+ /gene="rpsA"
+ /locus_tag="BQ2027_MB1656"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1656, rpsA, len: 481 aa. Equivalent to Rv1630,
+ len: 481 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 481 aa overlap). Probable rpsA,
+ ribosomal protein S1. FASTA best: RS1_MYCLE|P46836 30s
+ ribosomal protein S1 from Mycobacterium leprae (482 aa),
+ opt: 2655, E(): 0, (87.2% identity in 483 aa overlap).
+ Protein product from Mb1656 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1656 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s1 rpsa"
+ /protein_id="SIU00260.1"
+ /db_xref="GOA:A0A1R3XYW3"
+ /db_xref="InterPro:IPR003029"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR022967"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYW3"
+ /translation="MPSPTVTSPQVAVNDIGSSEDFLAAIDKTIKYFNDGDIVEGTIV
+ KVDRDEVLLDIGYKTEGVIPARELSIKHDVDPNEVVSVGDEVEALVLTKEDKEGRLIL
+ SKKRAQYERAWGTIEALKEKDEAVKGTVIEVVKGGLILDIGLRGFLPASLVEMRRVRD
+ LQPYIGKEIEAKIIELDKNRNNVVLSRRAWLEQTQSEVRSEFLNNLQKGTIRKGVVSS
+ IVNFGAFVDLGGVDGLVHVSELSWKHIDHPSEVVQVGDEVTVEVLDVDMDRERVSLSL
+ KATQEDPWRHFARTHAIGQIVPGKVTKLVPFGAFVRVEEGIEGLVHISELAERHVEVP
+ DQVVAVGDDAMVKVIDIDLERRRISLSLKQANEDYTEEFDPAKYGMADSYDEQGNYIF
+ PEGFDAETNEWLEGFEKQRAEWEARYAEAERRHKMHTAQMEKFAAAETAGRGADDQSS
+ ASSAPSEKTAGGSLASDAQLAALREKLAGSA"
+ gene 1824788..1826011
+ /gene="coaE"
+ /locus_tag="BQ2027_MB1657"
+ CDS 1824788..1826011
+ /gene="coaE"
+ /locus_tag="BQ2027_MB1657"
+ /note="Mb1657, coaE, len: 407 aa. Equivalent to Rv1631,
+ len: 407 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 407 aa overlap). Probable coaE,
+ dephospho-CoA kinase (EC 2.7.1.24), similar to many e.g.
+ Q50178|ML1383|COAE_MYCLE DEPHOSPHO-COA KINASE from
+ Mycobacterium leprae (410 aa), FASTA scores: E(): 0,
+ (77.5% identity in 409 aa overlap). Has ATP/GTP-binding
+ site motif A (P-loop, PS00017) at N-terminus. IN THE
+ N-TERMINAL SECTION; BELONGS TO THE COAE FAMILY. IN THE
+ C-TERMINAL SECTION; BELONGS TO THE UPF0157 (GRPB) FAMILY.
+ Protein product from Mb1657 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1657 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable dephospho-CoA kinase coaE
+ (dephosphocoenzyme A kinase)"
+ /protein_id="SIU00261.1"
+ /db_xref="GOA:P63827"
+ /db_xref="InterPro:IPR001977"
+ /db_xref="InterPro:IPR007344"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P63827"
+ /translation="MLRIGLTGGIGAGKSLLSTTFSQCGGIVVDGDVLAREVVQPGTE
+ GLASLVDAFGRDILLADGALDRQALAAKAFRDDESRGVLNGIVHPLVARRRSEIIAAV
+ SGDAVVVEDIPLLVESGMAPLFPLVVVVHADVELRVRRLVEQRGMAEADARARIAAQA
+ SDQQRRAVADVWLDNSGSPEDLVRRARDVWNTRVQPFAHNLAQRQIARAPARLVPADP
+ SWPDQARRIVNRLKIACGHKALRVDHIGSTAVSGFPDFLAKDVIDIQVTVESLDVADE
+ LAEPLLAAGYPRLEHITQDTEKTDARSTVGRYDHTDSAALWHKRVHASADPGRPTNVH
+ LRVHGWPNQQFALLFVDWLAANPGAREDYLTVKCDADRRADGELARYVTAKEPWFLDA
+ YQRAWEWADAVHWRP"
+ gene complement(1826162..1826605)
+ /locus_tag="BQ2027_MB1658C"
+ CDS complement(1826162..1826605)
+ /locus_tag="BQ2027_MB1658C"
+ /note="Mb1658c, -, len: 147 aa. Equivalent to Rv1632c,
+ len: 147 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 147 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1658c detected using SWATH
+ mass spectrometry. Mb1658c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00262.1"
+ /db_xref="InterPro:IPR007295"
+ /db_xref="InterPro:IPR014465"
+ /db_xref="InterPro:IPR035930"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYW0"
+ /translation="MRAVDEYTVHPWGLYLARPTPGRAQFHYLESWLLPSLGLRATVF
+ HFNPSHKRDHDYYLDVGEYTPGPSVWRSEDHYLDIEVRTGGGAELADVDELLDAVRHG
+ LLTPTVAEQAVRHAVDAVEGLARNGYDLTRWLATKGMELTWRSGS"
+ gene 1826850..1828946
+ /gene="uvrB"
+ /locus_tag="BQ2027_MB1659"
+ CDS 1826850..1828946
+ /gene="uvrB"
+ /locus_tag="BQ2027_MB1659"
+ /note="Mb1659, uvrB, len: 698 aa. Equivalent to Rv1633,
+ len: 698 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 698 aa overlap). uvrB, Excinuclease abc
+ subunit B, has ATP/GTP-binding site motif A (P-loop;
+ PS00017) near N-terminus. FASTA best: UVRB_MICLU|P10125
+ from Micrococcus luteus (709 aa), opt: 3268, E(): 0,
+ (71.3% identity in 704 aa overlap). Also similar to M.
+ tuberculosis Rv2973c (recG); and Rv1020 (mfd). BELONGS TO
+ THE UVRB FAMILY. Protein product from Mb1659 detected
+ using SWATH mass spectrometry. Mb1659 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable excinuclease abc (subunit b-helicase)
+ uvrb"
+ /protein_id="SIU00263.1"
+ /db_xref="GOA:P67423"
+ /db_xref="InterPro:IPR001650"
+ /db_xref="InterPro:IPR001943"
+ /db_xref="InterPro:IPR004807"
+ /db_xref="InterPro:IPR006935"
+ /db_xref="InterPro:IPR014001"
+ /db_xref="InterPro:IPR024759"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036876"
+ /db_xref="InterPro:IPR041471"
+ /db_xref="UniProtKB/Swiss-Prot:P67423"
+ /translation="MRAGGHFEVVSPHAPAGDQPAAIDELERRINAGERDVVLLGATG
+ TGKSATTAWLIERLQRPTLVMAPNKTLAAQLANELREMLPHNAVEYFVSYYDYYQPEA
+ YIAQTDTYIEKDSSINDDVERLRHSATSALLSRRDVVVVASVSCIYGLGTPQSYLDRS
+ VELKVGEEVPRDGLLRLLVDVQYTRNDMSFTRGSFRVRGDTVEIIPSYEELAVRIEFF
+ GDEIEALYYLHPLTGEVIRQVDSLRIFPATHYVAGPERMAHAVSAIEEELAERLAELE
+ SQGKLLEAQRLRMRTNYDIEMMRQVGFCSGIENYSRHIDGRGPGTPPATLLDYFPEDF
+ LLVIDESHVTVPQIGGMYEGDISRKRNLVEYGFRLPSACDNRPLTWEEFADRIGQTVY
+ LSATPGPYELSQTGGEFVEQVIRPTGLVDPKVVVKPTKGQIDDLIGEIRTRADADQRV
+ LVTTLTKKMAEDLTDYLLEMGIRVRYLHSEVDTLRRVELLRQLRLGDYDVLVGINLLR
+ EGLDLPEVSLVAILDADKEGFLRSSRSLIQTIGRAARNVSGEVHMYADKITDSMREAI
+ DETERRRAKQIAYNEANGIDPQPLRKKIADILDQVYREADDTAVVEVGGSGRNASRGR
+ RAQGEPGRAVSAGVFEGRDTSAMPRAELADLIKDLTAQMMAAARDLQFELAARFRDEI
+ ADLKRELRGMDAAGLK"
+ gene 1828943..1830358
+ /locus_tag="BQ2027_MB1660"
+ CDS 1828943..1830358
+ /locus_tag="BQ2027_MB1660"
+ /note="Mb1660, -, len: 471 aa. Equivalent to Rv1634, len:
+ 471 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 471 aa overlap). Possible drug efflux
+ membrane protein of major facilitator superfamily (MFS),
+ similar to many antibiotic resistance (efflux) proteins.
+ FASTA best: Q56175 TU22 DTDP-GLUCOSE DEHYDRTATASE (GRAE)
+ from Streptomyces violaceoruber (557 aa), opt: 415, E():
+ 1.7e-17, (26.7% identity in 446 aa overlap). Relatives in
+ Mycobacterium tuberculosis: MTCY369.27c, E(): 4.8e-12;
+ MTCY20B11.14c, E(): 2.9e-10. Mb1660 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible drug efflux membrane protein"
+ /protein_id="SIU00264.1"
+ /db_xref="GOA:A0A1R3XZR8"
+ /db_xref="InterPro:IPR001411"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZR8"
+ /translation="MTETASETGSWRELLSRYLGTSIVLAGGVALYATNEFLTISLLP
+ STIADIGGSRLYAWVTTLYLVGSVVAATTVNTMLLRVGARSSYLMGLAVFGLASLVCA
+ AAPSMQILVAGRTLQGIAGGLLAGLGYALINSTLPKSLWTRGSALVSAMWGVATLIGP
+ ATGGLFAQLGLWRWAFGVMTLLTALMAMLVPVALGAGRVGPGGETPVGSTHKVPVWSL
+ LLMGAAALAISVAALPNYLVQTAGLLAAAALLVAVFVVVDWRIHAAVLPPSVFGSGPL
+ KWIYLTMSVQMIAAMVDTYVPLFGQRLGHLTPVAAGFLGAALAVGWTVGEVASASLNS
+ ARVIGHVVAAAPLVMASGLALGAVTQRADAPVGIIALWALALLIIGTGIGIAWPHLTV
+ RAMDSVADPAESSAAAAAINVVQLISGAFGAGLAGVVVNTAKGGEVAAARGLYMAFTV
+ LAAAGVIASYQATHRDRRLPR"
+ gene complement(1830347..1832017)
+ /locus_tag="BQ2027_MB1661C"
+ CDS complement(1830347..1832017)
+ /locus_tag="BQ2027_MB1661C"
+ /note="Mb1661c, -, len: 556 aa. Equivalent to Rv1635c,
+ len: 556 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 556 aa overlap). Membrane protein
+ equivalent to CAC31770.1|AL583921 Mycobacterium leprae
+ membrane protein (527 aa), Identities = 332/527 (62%).
+ Mb1661c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable mannosyltransferase. probable conserved
+ transmembrane protein."
+ /protein_id="SIU00265.1"
+ /db_xref="GOA:A0A1R3XYV8"
+ /db_xref="InterPro:IPR038731"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYV8"
+ /translation="MHASRPGAPPHAGLPSRRTAGDQDHRADPKVTRIMSASTLEQPA
+ AAHVDELVARMRGRLLDPLAIAVLAAVISGAWASRPSLWFDEGATISASASRTLPELW
+ SLLGHIDAVHGLYYLLMHGWFAIFPPTELWSRLPSCLAIGAAAAGVVVFAKQFSGRTT
+ AVCAGAVFAILPRVTWAGIEARSSALSVAAAVWLTVLLVAAVRCNTQRRWLLYALVLM
+ LSILVSINLALLVPAYATMVPLLASGKSRKSPVIWWTVVTAAALGAMTPFILFAHGQV
+ WQVGWIAGLNRNIILDVIHRQYFDHSVPFAILAGLIVAAGIAAHLAGARGPGGDTHRL
+ VLVSAAWIVVPTAVVLIYSATVEPIYYPRYLILTAPAAAVILAVCVVTIARKPWLIAG
+ VVFLLAAAAFPNYFFTQRGPYAKEGWDYSQVADVISAHAKPGDCLLVDNTAGWRPGPI
+ RALLATRPAAFRSLIDVERGTYGPKVGTLWDGHVAVWLTTAKIDKCPTLWTIANRDKS
+ LPDHQVGEMLSPGTGFGRTPVYRFPSYLGFRIVERWQFHYSQVVKSTR"
+ gene 1832226..1832666
+ /gene="TB15.3"
+ /locus_tag="BQ2027_MB1662"
+ CDS 1832226..1832666
+ /gene="TB15.3"
+ /locus_tag="BQ2027_MB1662"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1662, TB15.3, len: 146 aa. Equivalent to Rv1636,
+ len: 146 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 146 aa overlap). TB15.3, conserved
+ hypothetical protein (see citations below), similar to
+ other hypothetical proteins from diverse organisms e.g.
+ Q57951|MJ0531|Y531_METJA from Methanococcus jannaschii
+ (170 aa), FASTA scores: opt: 188, E(): 6e-06, (32.2%
+ identity in 149 aa overlap); also P42297|YXIE_BACSU
+ hypothetical 15.9 kd protein in bglh-wapa intergenic
+ region precursor from Bacillus subtilis (148 aa), FASTA
+ scores: opt: 162, E(): 0.00025, (30.8% identity in 156 aa
+ overlap). Part of family of Mycobacterium tuberculosis
+ hypothetical proteins (but lacks C-terminal region)
+ including Rv2005c, Rv2623, Rv2026c, Rv1996, etc. Protein
+ product from Mb1662 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1662 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="iron-regulated universal stress protein family
+ protein tb15.3"
+ /protein_id="SIU00266.1"
+ /db_xref="InterPro:IPR006015"
+ /db_xref="InterPro:IPR006016"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ92"
+ /translation="MSAYKTVVVGTDGSDSSMRAVDRAAQIAGADAKLIIASAYLPQH
+ EDARAADILKDESYKVTGTAPIYEILHDAKERAHNAGAKNVEERPIVGAPVDALVNLA
+ DEEKADLLVVGNVGLSTIAGRLLGSVPANVSRRAKVDVLIVHTT"
+ gene complement(1832673..1833467)
+ /locus_tag="BQ2027_MB1663C"
+ CDS complement(1832673..1833467)
+ /locus_tag="BQ2027_MB1663C"
+ /note="Mb1663c, -, len: 264 aa. Equivalent to Rv1637c,
+ len: 264 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 264 aa overlap). Conserved hypothetical
+ protein, some similarity to others e.g. P05446|GLO2_RHOBL
+ PROBABLE HYDROXYACYLGLUTATHIONE HYDROLASE (EC 3.1.2.6)
+ (255 aa), FASTA scores: opt: 252, E(): 2e-09, (39.0%
+ identity in 146 aa overlap). Also similar to
+ Q9Z505|AL035591|SCC54.20 putative hydrolase from
+ Streptomyces coelicolor (218 aa), FASTA scores: opt: 732,
+ E(): 0, (52.3% identity in 220 aa overlap). Also similar
+ to Mycobacterium tuberculosis hypothetical proteins and
+ putative glyoxylases e.g. Rv0634c, Rv3677c, Rv2581c,
+ Rv2260. Protein product from Mb1663c detected using
+ shotgun mass spectrometry. Mb1663c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MBL-fold metallo-hydrolase superfamily"
+ /protein_id="SIU00267.1"
+ /db_xref="InterPro:IPR001279"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYW9"
+ /translation="MLCARTDNHQGTGNVVTSAHMTRANDDDAGAAGIGAVAHMTTVD
+ DNYTGHVERGKAARRFLPGATILKASVGPMDNNAYLVTCSATGETLLIDAANDAEVLI
+ DLVRRYAPKLALIVTSHQHFDHWQALQAVAAATGAPTAAHPIDADPLPVKPDRLLTHG
+ DSVRIGELTFDVIHLRGHTPGSIALALGGPVTGGVTQLFTGDCLFPGGVGKTWQPADF
+ TQLLDDVTTRVFDVYADSTVIYPGHGDDTELGAERPSLSEWRARGW"
+ gene 1833516..1836434
+ /gene="uvrA"
+ /locus_tag="BQ2027_MB1664"
+ CDS 1833516..1836434
+ /gene="uvrA"
+ /locus_tag="BQ2027_MB1664"
+ /note="Mb1664, uvrA, len: 972 aa. Equivalent to Rv1638,
+ len: 972 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 972 aa overlap). uvrA, Excinuclease ABC
+ subunit A, similar to many e.g. UVRA_ECOLI|P07671
+ excinuclease abc subunit a from Escherichia coli (940 aa),
+ FASTA scores: opt: 2573, E(): 0, (56.2% identity in 951 aa
+ overlap). Contains 2x PS00017 ATP/GTP-binding site motif
+ A, PS00211 ABC transporters family signature, PS00211 ABC
+ transporters family signature. CONSISTS OF THREE SUBUNITS;
+ UVRA, UVRB AND UVRC. BELONGS TO THE ABC TRANSPORTER
+ FAMILY. UVRA SUBFAMILY. Protein product from Mb1664
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1664 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable excinuclease abc (subunit a-dna-binding
+ atpase) uvra"
+ /protein_id="SIU00268.1"
+ /db_xref="GOA:P63381"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR004602"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR041102"
+ /db_xref="InterPro:IPR041552"
+ /db_xref="UniProtKB/Swiss-Prot:P63381"
+ /translation="MADRLIVKGAREHNLRSVDLDLPRDALIVFTGLSGSGKSSLAFD
+ TIFAEGQRRYVESLSAYARQFLGQMDKPDVDFIEGLSPAVSIDQKSTNRNPRSTVGTI
+ TEVYDYLRLLYARAGTPHCPTCGERVARQTPQQIVDQVLAMPEGTRFLVLAPVVRTRK
+ GEFADLFDKLNAQGYSRVRVDGVVHPLTDPPKLKKQEKHDIEVVVDRLTVKAAAKRRL
+ TDSVETALNLADGIVVLEFVDHELGAPHREQRFSEKLACPNGHALAVDDLEPRSFSFN
+ SPYGACPECSGLGIRKEVDPELVVPDPDRTLAQGAVAPWSNGHTAEYFTRMMAGLGEA
+ LGFDVDTPWRKLPAKARKAILEGADEQVHVRYRNRYGRTRSYYADFEGVLAFLQRKMS
+ QTESEQMKERYEGFMRDVPCPVCAGTRLKPEILAVTLAGESKGEHGAKSIAEVCELSI
+ ADCADFLNALTLGPREQAIAGQVLKEIRSRLGFLLDVGLEYLSLSRAAATLSGGEAQR
+ IRLATQIGSGLVGVLYVLDEPSIGLHQRDNRRLIETLTRLRDLGNTLIVVEHDEDTIE
+ HADWIVDIGPGAGEHGGRIVHSGPYDELLRNKDSITGAYLSGRESIEIPAIRRSVDPR
+ RQLTVVGAREHNLRGIDVSFPLGVLTSVTGVSGSGKSTLVNDILAAVLANRLNGARQV
+ PGRHTRVTGLDYLDKLVRVDQSPIGRTPRSNPATYTGVFDKIRTLFAATTEAKVRGYQ
+ PGRFSFNVKGGRCEACTGDGTIKIEMNFLPDVYVPCEVCQGARYNRETLEVHYKGKTV
+ SEVLDMSIEEAAEFFEPIAGVHRYLRTLVDVGLGYVRLGQPAPTLSGGEAQRVKLASE
+ LQKRSTGRTVYILDEPTTGLHFDDIRKLLNVINGLVDKGNTVIVIEHNLDVIKTSDWI
+ IDLGPEGGAGGGTVVAQGTPEDVAAVPASYTGKFLAEVVGGGASAATSRSNRRRNVSA
+ "
+ gene complement(1836491..1836748)
+ /locus_tag="BQ2027_MB1665C"
+ CDS complement(1836491..1836748)
+ /locus_tag="BQ2027_MB1665C"
+ /note="Mb1665c, -, len: 85 aa. Equivalent to Rv1638A, len:
+ 85 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 85 aa overlap). Conserved hypothetical
+ protein, similar to C-terminal part of P31511|35KD_MYCTU
+ 35kd immunogenic protein from Mycobacterium tuberculosis
+ (270 aa), FASTA scores: opt: 159, E(): 0.002, (50.90%
+ identity in 55 aa overlap); and to Mycobacterium leprae
+ ML0981 possible pseudogene, an orthologue of 35kd
+ immunogenic protein from M. tuberculosis. Size difference
+ suggests possible gene fragment. Protein product from
+ Mb1665c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1665c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Phage shock protein A (IM30), suppresses
+ sigma54-dependent transcription"
+ /protein_id="SIU00269.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYX0"
+ /translation="MPDEPTPPEATTPNSESDPRYDSAGVPTFESVREKIETRYGTAL
+ GATELDAESPQGRRLEDQYAQRQRAAAERLAQIRESMHTDE"
+ gene complement(1836764..1838233)
+ /locus_tag="BQ2027_MB1666C"
+ CDS complement(1836764..1838233)
+ /locus_tag="BQ2027_MB1666C"
+ /note="Mb1666c, -, len: 489 aa. Equivalent to Rv1639c,
+ len: 489 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 489 aa overlap). Conserved hypothetical
+ membrane protein. Some similarity to P35866|YLI2_CORGL
+ Hypothetical 45.7 kd protein from Corynebacterium
+ glutamicum (426 aa), FASTA scores: opt: 511, E(): 2.4e-23,
+ (28.9% identity in 370 aa overlap). Contains PS00904
+ protein phenyltransferases alpha subunit repeat signature.
+ Mb1666c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL MEMBRANE PROTEIN"
+ /protein_id="SIU00270.1"
+ /db_xref="GOA:A0A1R3XYX3"
+ /db_xref="InterPro:IPR000801"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYX3"
+ /translation="MAQNELVTASTPPAATQPLAVGHTSLMHGWVPLAVQVVTAVVLV
+ LAAGWRSRHWQRRWLPTAAAIGATLAWGTRWYVTGNGLANERPPSTLWIWVALTGAAA
+ TVLILGWRSARWWRRGASLLAVPLCLLSATLTLNLWVGYFPTVQTAWNQLTSGPLPDQ
+ ADQAAVAALAHSGVRPSHGTLLPVVIPSDASHFKHRGELVYLPPAWFDREHRSENPPP
+ PQLPTVMMIGGQFNTPADWARAGNAVKTLDDFAAAHSGNAPVVVFVDSGGAFNNDTEC
+ VNGRRGNAADHLTKDVVPYMVSKFGVSPEQTSWGIVGWSMGGTCAVDLTVMHPTLFSA
+ FVDIAGDFYPNAGNKTQTIVRLFGGNEDAWSAFDPTTVITRHGSYTGLSGWFAISSPG
+ PPSPDNAVADTTTMRLAGRDAAANPGNQAAAANALCALGRANGIYCAVVPQPGKHDWP
+ FADRVFAAALPWLAGQLATPGVPKIPLPGTTQQIAGTGR"
+ gene complement(1838292..1841810)
+ /gene="lysX"
+ /locus_tag="BQ2027_MB1667C"
+ CDS complement(1838292..1841810)
+ /gene="lysX"
+ /locus_tag="BQ2027_MB1667C"
+ /note="Mb1667c, lysX, len: 1172 aa. Equivalent to Rv1640c,
+ len: 1172 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 1172 aa overlap). Probable two
+ domain protein, possible lysyl-tRNA synthetase 2 (EC
+ 6.1.1.6). N-terminal part (bases 1850153 to 1852033) is
+ similar to AL023861|SC3C8_3 hypothetical membrane protein
+ from Streptomyces coelicolor (589 aa), Fasta scores: opt:
+ 1426, E(): 0, (44.6% identity in 585 aa overlap). The
+ C-terminal part is similar to SYK_CRILO|P37879 lysyl-tRNA
+ synthetases (EC 6.1.1.6) from Cricetulus longicaudatus
+ (Long-tailed hamster) (597 aa), Fasta scores, opt: 985,
+ E(): 0, (36.8% identity in 524 aa overlap). Contains
+ PS00179 Aminoacyl-transfer RNA synthetases class-II
+ signature 1, PS00339 Aminoacyl-transfer RNA synthetases
+ class-II signature 2. This may indicate a frame shift but
+ sequence has been checked and no error found. BELONGS TO
+ CLASS-II AMINOACYL-TRNA SYNTHETASE FAMILY. Protein product
+ from Mb1667c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1667c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="lysyl-trna synthetase 2 lysx"
+ /protein_id="SIU00271.1"
+ /db_xref="GOA:Q7VEV7"
+ /db_xref="InterPro:IPR002313"
+ /db_xref="InterPro:IPR004364"
+ /db_xref="InterPro:IPR004365"
+ /db_xref="InterPro:IPR006195"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR018149"
+ /db_xref="InterPro:IPR024320"
+ /db_xref="InterPro:IPR031553"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEV7"
+ /translation="MGLHLTVPGLRRDGRGVQSNSHDTSSKTTADISRCPQHTDAGLQ
+ RAATPGISRLLGISSRSVTLTKPRSATRGNSRYHWVPAAAGWTVGVIATLSLLASVSP
+ LIRWIIKVPREFINDYLFNFPDTNFAWSFVLALLAAALTARKRIAWLVLLANMVLAAV
+ VNAAEIAAGGNTAAESFGENLGFAVHVVAIVVLVLGYREFWAKVRRGALFRAAAVWLA
+ GAVVGIVASWGLVELFPGSLAPDERLGYAANRVVGFALADPDLFTGRPHVFLNAIFGL
+ FGAFALIGAAIVLFLSQRADNALTGEDESAIRGLLDLYGKDDSLGYFATRRDKSVVFA
+ SSGRACITYRVEVGVCLASGDPVGDHRAWPQAVDAWLRLCQTYGWAPGVMGASSQGAQ
+ TYREAGLTALELGDEAILRPADFKLSGPEMRGVRQAVTRARRAGLTVRIRRHRDIAED
+ EMAQTITRADSWRDTETERGFSMALGRLGDPADSDCLLVEAIDPHNQVLAMLSLVPWG
+ TTGVSLDLMRRSPQSPNGTIELMVSELALHAESLGITRISLNFAVFRAAFEQGAQLGA
+ GPVARLWRGLLVFFSRWWQLETLYRSNMKYQPEWVPRYACYEDARVIPRVGVASVIAE
+ GFLVLPFSRRNRVHTGHHPAVPERLAATGLLHHDGSAPDVSGLRQVGLTNGDGVERRL
+ PEQVRVRFDKLEKLRSSGIDAFPVGRPPSHTVAQALAADHQASVSVSGRIMRIRNYGG
+ VLFAQLRDWSGEMQVLLDNSRLDQGCAADFNAATDLGDLVEMTGHMGASKTGTPSLIV
+ SGWRLIGKCLRPLPNKWKGLLDPEARVRTRYLDLAVNAESRALITARSSVLRAVRETL
+ FAKGFVEVETPILQQLHGGATARPFVTHINTYSMDLFLRIAPELYLKRLCVGGVERVF
+ ELGRAFRNEGVDFSHNPEFTLLEAYQAHAGYLEWIDGCRELIQNAAQAANGAPIAMRP
+ RTDKGSDGTRHHLEPVDISGIWPVRTVHDAISEALGERIDADTGLTTLRKLCDAAGVP
+ YRTQWDAGAVVLELYEHLVECRTEQPTFYIDFPTSVSPLTRPHRSKRGVAERWDLVAW
+ GIELGTAYSELTDPVEQRRRLQEQSLLAAGGDPEAMELDEDFLQAMEYAMPPTGGLGM
+ GIDRVVMLITGRSIRETLPFPLAKPH"
+ gene 1842047..1842652
+ /gene="infC"
+ /locus_tag="BQ2027_MB1668"
+ CDS 1842047..1842652
+ /gene="infC"
+ /locus_tag="BQ2027_MB1668"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1668, infC, len: 201 aa. Equivalent to Rv1641,
+ len: 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 201 aa overlap). Probable infC,
+ initiation factor IF-3, similar to many e.g.
+ IF3_BACST|P03000 initiation factor IF-3 from Bacillus
+ stearothermophilus (171 aa), FASTA scores: opt: 560, E():
+ 1.9e-27, (50.6% identity in 166 aa overlap). Note that an
+ AUC initiation codon has been used, the Bacillus
+ (IF3_BACSU) and Escherichia coli (IF3_ECOLI) proteins use
+ an AUU initiation codon, and the Myxococcus xanthus
+ (DSG_MYXXA) homolog uses a AUC. BELONGS TO THE IF-3
+ FAMILY. Protein product from Mb1668 detected using shotgun
+ mass spectrometry. Mb1668 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INITIATION FACTOR IF-3 INFC"
+ /protein_id="SIU00272.1"
+ /db_xref="GOA:P65136"
+ /db_xref="InterPro:IPR001288"
+ /db_xref="InterPro:IPR019813"
+ /db_xref="InterPro:IPR019814"
+ /db_xref="InterPro:IPR019815"
+ /db_xref="InterPro:IPR036787"
+ /db_xref="InterPro:IPR036788"
+ /db_xref="UniProtKB/Swiss-Prot:P65136"
+ /translation="MSTETRVNERIRVPEVRLIGPGGEQVGIVRIEDALRVAADADLD
+ LVEVAPNARPPVCKIMDYGKYKYEAAQKARESRRNQQQTVVKEQKLRPKIDDHDYETK
+ KGHVVRFLEAGSKVKVTIMFRGREQSRPELGYRLLQRLGADVADYGFIETSAKQDGRN
+ MTMVLAPHRGAKTRARARHPGEPAGGPPPKPTAGDSKAAPN"
+ gene 1842702..1842896
+ /gene="rpmI"
+ /locus_tag="BQ2027_MB1669"
+ CDS 1842702..1842896
+ /gene="rpmI"
+ /locus_tag="BQ2027_MB1669"
+ /note="Mb1669, rpmI, len: 64 aa. Equivalent to Rv1642,
+ len: 64 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 64 aa overlap). rpmI, 50S ribosomal
+ protein L35, similar to several e.g. RL35_SYNY3|P48959
+ from Synechocystis sp. (67 aa), fasta scores: opt: 179,
+ E(): 2.7e-08, (51.6% identity in 64 aa overlap). BELONGS
+ TO THE L35P FAMILY OF RIBOSOMAL PROTEINS. Protein product
+ from Mb1669 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1669 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50S ribosomal protein L35 rpmI"
+ /protein_id="SIU00273.1"
+ /db_xref="GOA:P66272"
+ /db_xref="InterPro:IPR001706"
+ /db_xref="InterPro:IPR018265"
+ /db_xref="InterPro:IPR021137"
+ /db_xref="InterPro:IPR037229"
+ /db_xref="UniProtKB/Swiss-Prot:P66272"
+ /translation="MPKAKTHSGASKRFRRTGTGKIVRQKANRRHLLEHKPSTRTRRL
+ DGRTVVAANDTKRVTSLLNG"
+ gene 1842958..1843347
+ /gene="rplT"
+ /locus_tag="BQ2027_MB1670"
+ CDS 1842958..1843347
+ /gene="rplT"
+ /locus_tag="BQ2027_MB1670"
+ /note="Mb1670, rplT, len: 129 aa. Equivalent to Rv1643,
+ len: 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 129 aa overlap). rplT, 50S ribosomal
+ protein L20, similar to several e.g. RL20_ECOLI|P02421
+ from Escherichia coli (117 aa), FASTA scores: opt: 438,
+ E(): 5.8e-24, (60.3% identity in 116 aa overlap). Contains
+ PS00937 Ribosomal protein L20 signature. Protein product
+ from Mb1670 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1670 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50S ribosomal protein L20 rplT"
+ /protein_id="SIU00274.1"
+ /db_xref="GOA:P66106"
+ /db_xref="InterPro:IPR005813"
+ /db_xref="InterPro:IPR035566"
+ /db_xref="UniProtKB/Swiss-Prot:P66106"
+ /translation="MARVKRAVNAHKKRRSILKASRGYRGQRSRLYRKAKEQQLHSLN
+ YAYRDRRARKGEFRKLWIARINAAARLNDITYNRLIQGLKAAGVEVDRKNLADIAISD
+ PAAFTALVDVARAALPEDVNAPSGEAA"
+ gene 1843380..1844162
+ /gene="tsnR"
+ /locus_tag="BQ2027_MB1671"
+ CDS 1843380..1844162
+ /gene="tsnR"
+ /locus_tag="BQ2027_MB1671"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1671, tsnR, len: 260 aa. Equivalent to Rv1644,
+ len: 260 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 260 aa overlap). Possible tsnR, 23S
+ rRNA methyltransferase (EC 2.1.1.-), similar to several
+ e.g. TSNR_STRLU|P52393 from Streptomyces laurentii (270
+ aa), FASTA scores: opt: 276, E(): 3.6e-11, (27.6% identity
+ in 261 aa overlap). Also similar to M. tuberculosis
+ hypothetical proteins Rv0881, Rv3579c, and Rv0380c.
+ Protein product from Mb1671 detected using SWATH mass
+ spectrometry. Mb1671 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible 23S rRNA methyltransferase tsnR"
+ /protein_id="SIU00275.1"
+ /db_xref="GOA:A0A1R3XYX1"
+ /db_xref="InterPro:IPR001537"
+ /db_xref="InterPro:IPR013123"
+ /db_xref="InterPro:IPR029026"
+ /db_xref="InterPro:IPR029028"
+ /db_xref="InterPro:IPR029064"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYX1"
+ /translation="MLTERSARVATAVKLHRHVGRRRAGRFLAEGPNLVAAALARGLV
+ REVFVTEVAARRHELLLAAHEASVHLVTERAAKALSDTVTPAGLVAVCDLPATRLEDV
+ LAGSPQLIAVTVEIREPGNAGTVIRIADAMGAAAVILAGRSVDPYNGKCLRASTGSIF
+ AIPVVVAPDVGAAIADLRAAGLQVLATAVDGEMALDDADRLLAEPTAWLFGPEAHGLS
+ AEIAALADHRVHIPMSGGAESLNVAAAAAICLYESARALGRR"
+ gene complement(1844173..1845228)
+ /locus_tag="BQ2027_MB1672C"
+ CDS complement(1844173..1845228)
+ /locus_tag="BQ2027_MB1672C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1672c, -, len: 351 aa. Equivalent to Rv1645c,
+ len: 351 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 351 aa overlap). Conserved hypothetical
+ protein, similar to other Mycobacterium tuberculosis
+ hypothetical proteins e.g. O53837|Rv0826|MTV043.18 (351
+ aa), FASTA scores: (57.5% identity in 299 aa overlap);
+ Q10519|Rv2237|YM37_MYCTU (255 aa), O53682|Rv0276 (306 aa).
+ Mb1672c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00276.1"
+ /db_xref="InterPro:IPR018713"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZA1"
+ /translation="MTVASRTSADPLGPDSLTWKYFGDLRTGMMGVWIGAIQNMYPEL
+ GAGVEEHSILLREPLQRVARSVYPIMGVVYDGDRAAQTGQQIKGYHRTIKGVDAEGRR
+ YHALNPDTFYWAHATFFMLVIKVAEYFCGGLTEAEKHQLFEEHVRWYRMYGMSMRPVP
+ KSWEDFQDYWDRVCRDKLEINQATVDILQMRIPKPRFVLMPTPIWDQLFKPLIAGQRW
+ IAAGLFDPAVREKAGMHWTPGDEVLLRVFGKVVELAFLAVPDEIRLHPRALAAYRRAA
+ GRTRHDAPLVQAPGFMAPPRDRQGLPMHYFPPRSHRFTRSALDPAKALMERAGALVHS
+ TLSLAGVRPARGPSRAA"
+ gene 1845538..1846470
+ /gene="PE17"
+ /locus_tag="BQ2027_MB1673"
+ CDS 1845538..1846470
+ /gene="PE17"
+ /locus_tag="BQ2027_MB1673"
+ /note="Mb1673, PE17, len: 310 aa. Equivalent to Rv1646,
+ len: 310 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 310 aa overlap). Member of the M.
+ tuberculosis PE family of proteins, similar to many e.g.
+ YW36_MYCTU|Q10873 hypothetical 53.7 kd protein cy39.36c
+ (558 aa), FASTA scores, opt: 411, E(): 1.3e-15, (34.4%
+ identity in 320 aa overlap). Mb1673 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe17"
+ /protein_id="SIU00277.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYX8"
+ /translation="MSFLTVAPDMVTAAAGNLESVGSALNEAAAAAAPATVGLAAPAA
+ DRVSAVVAAMLGAYARDFQGISAQIAGFHNQFVGALRGGAAAYASAEAANVQQTVVNA
+ VNAPAQALLGHPLIGPETVGSSAAAVSFGFGPLLLAGSDPLLAVPFSYPASLPTPFGP
+ VTMTLNGSFDPLTQQVVFDSGSLTAPAPFVYGLGAVGPALTTMTALQNSGTAFSGAVQ
+ SGNLLGAAGALLQAPGNAVTGFLFGQTAISQSIPGPSNLGYESVGISVPVGGLLAPLQ
+ PVTVTLTPTSGMPTAIQLSGTQFGGLLPALLNGF"
+ gene 1846548..1847498
+ /locus_tag="BQ2027_MB1674"
+ CDS 1846548..1847498
+ /locus_tag="BQ2027_MB1674"
+ /note="Mb1674, -, len: 316 aa. Equivalent to Rv1647, len:
+ 316 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 316 aa overlap). Conserved hypothetical
+ protein, some similarity to other Mycobacterium
+ tuberculosis hypothetical proteins e.g.
+ Q11055|Rv1264|YC64_MYCTU Hypothetical 42.2 kd protein (397
+ aa), FASTA scores: opt: 197, E(): 9.4e-06, (27.1% identity
+ in 181 aa overlap) and Q10400|Rv2212|YM12_MYCTU (378 aa).
+ Protein product from Mb1674 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1674 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="adenylate cyclase (atp pyrophosphate-lyase)
+ (adenylyl cyclase)"
+ /protein_id="SIU00278.1"
+ /db_xref="GOA:A0A1R3XYY5"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYY5"
+ /translation="MPGSARTTYPCHVEVGPQDSESGAPDETATAMASPVPRQRSALR
+ WLRTVNRSPGLVSFIHRARRLLPGDPEFGDPLSTAGEGGPRAAARAADRLLRDRDAAS
+ REVGLSVLQVWQALTEAVSRRPANPEVTLVFTDLVGFSTWSLHAGDDATLTLLRQVAR
+ AVESPLLDAGGHIVKRLGDGIMAVFRNPTVALRAVLVAQDAVKSLEVQGYTPRMRIGI
+ HTGRPQRLAADWLGVDVNIAARVMERATKGGIMISQPTLDLIPQSELDALGVVARRVR
+ KPVFASKPTGIPPDLAIYRIKTVSESTAADNFDEMSPDAQ"
+ gene 1847505..1848311
+ /locus_tag="BQ2027_MB1675"
+ CDS 1847505..1848311
+ /locus_tag="BQ2027_MB1675"
+ /note="Mb1675, -, len: 268 aa. Equivalent to Rv1648, len:
+ 268 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 268 aa overlap). Probable transmembrane
+ protein, some similarity to Rv3434c|MTCY77.06C (237 aa),
+ FASTA scores: E(): 0.00039, (31.4% identity in 194 aa
+ overlap). Mb1675 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable transmembrane protein"
+ /protein_id="SIU00279.1"
+ /db_xref="GOA:A0A1R3XYY0"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYY0"
+ /translation="MIYRVACLLARIRFTVGYVAALASVSTTILMHGPQVHAQVIRHA
+ STNLHNLAHGHLGTLWNSAFVIDEGPLYFWLPCLACLLAVAELQLRSLRLTVAFVVGH
+ IGATLLVAAVLAGAIEIGWLPWSISRVSDVGMSYGALAALGALTAAIPGRWRPAWIGW
+ WVSLGLATATIGGGFTDAGHTVALLLGMLVTACFTRPARWTLGRCALLAVASGFCLVL
+ LAHSWWSLVSGSALGLLGALGAAGFARWTRARATSLPPGALAIPQPALSR"
+ gene 1848507..1849532
+ /gene="pheS"
+ /locus_tag="BQ2027_MB1676"
+ CDS 1848507..1849532
+ /gene="pheS"
+ /locus_tag="BQ2027_MB1676"
+ /note="Mb1676, pheS, len: 341 aa. Equivalent to Rv1649,
+ len: 341 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 341 aa overlap). pheS,
+ Phenylalanyl-tRNA synthetase alpha chain (EC 6.1.1.20),
+ similar to several e.g. SYFA_ECOLI|P08312 from Escherichia
+ coli (327 aa), FASTA scores: opt: 978, E(): 0, (46.5%
+ identity in 331 aa overlap). Homology suggests this start
+ site, but there is a potential rbs upstream of a gtg 30 bp
+ upstream; contains PS00179 Aminoacyl-transfer RNA
+ synthetases class-II signature 1. BELONGS TO CLASS-II
+ AMINOACYL-TRNA SYNTHETASE FAMILY. PHE-TRNA SYNTHETASE
+ ALPHA CHAIN SUBFAMILY 1. Protein product from Mb1676
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1676 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable phenylalanyl-trna synthetase, alpha
+ chain phes"
+ /protein_id="SIU00280.1"
+ /db_xref="GOA:Q7VEV4"
+ /db_xref="InterPro:IPR002319"
+ /db_xref="InterPro:IPR004188"
+ /db_xref="InterPro:IPR004529"
+ /db_xref="InterPro:IPR006195"
+ /db_xref="InterPro:IPR010978"
+ /db_xref="InterPro:IPR022911"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEV4"
+ /translation="MLSPEALTTAVDAAQQAIALADTLDVLARVKTEHLGDRSPLALA
+ RQALAVLPKEQRAEAGKRVNAARNAAQRSYDERLATLRAERDAAVLVAEGIDVTLPST
+ RVPAGARHPIIMLAEHVADTFIAMGWELAEGPEVETEQFNFDALNFPADHPARGEQDT
+ FYIAPEDSRQLLRTHTSPVQIRTLLARELPVYIISIGRTFRTDELDATHTPIFHQVEG
+ LAVDRGLSMAHLRGTLDAFARAEFGPSARTRIRPHFFPFTEPSAEVDVWFANKIGGAD
+ WVEWGGCGMVHPNVLRATGIDPDLYSGFAFGMGLERTLQFRNGIPDMRDMVEGDVRFS
+ LPFGVGA"
+ gene 1849532..1852027
+ /gene="pheT"
+ /locus_tag="BQ2027_MB1677"
+ CDS 1849532..1852027
+ /gene="pheT"
+ /locus_tag="BQ2027_MB1677"
+ /note="Mb1677, pheT, len: 831 aa. Equivalent to Rv1650,
+ len: 831 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 831 aa overlap). pheT,
+ Phenylalanyl-tRNA synthetase beta chain (EC 6.1.1.20),
+ similar to several e.g. SYFB_ECOLI|P07395 from Escherichia
+ coli (795 aa), FASTA scores: opt: 995, E(): 0, (31.8%
+ identity in 847 aa overlap). BELONGS TO THE
+ PHENYLALANYL-TRNA SYNTHETASE BETA CHAIN FAMILY - SUBFAMILY
+ 1. Protein product from Mb1677 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1677 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable phenylalanyl-trna synthetase, beta
+ chain phet"
+ /protein_id="SIU00281.1"
+ /db_xref="GOA:Q7VEV3"
+ /db_xref="InterPro:IPR002547"
+ /db_xref="InterPro:IPR004532"
+ /db_xref="InterPro:IPR005121"
+ /db_xref="InterPro:IPR005146"
+ /db_xref="InterPro:IPR005147"
+ /db_xref="InterPro:IPR009061"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR020825"
+ /db_xref="InterPro:IPR033714"
+ /db_xref="InterPro:IPR036690"
+ /db_xref="InterPro:IPR041616"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEV3"
+ /translation="MRLPYSWLREVVAVGASGWDVTPGELEQTLLRIGHEVEEVIPLG
+ PVDGPVTVGRVADIEELTGYKKPIRACAVDIGDRQYREIICGATNFAVGDLVVVALPG
+ ATLPGGFTISARKAYGRNSDGMICSAAELNLGADHSGILVLPPGAAEPGADGAGVLGL
+ DDVVFHLAITPDRGYCMSVRGLARELACAYDLDFVDPASNSRVPPLPIEGPVWPLTVQ
+ PETGVRRFALRPVIGIDPAAVSPWWLQRRLLLCGIRATCPAVDVTNYVMLELGHPMHA
+ HDRNRISGTLGVRFARSGETAVTLDGIERKLDTADVLIVDDAATAAIGGVMGAASTEV
+ RADSTDVLLEAAIWDPAAVSRTQRRLHLPSEAARRYERTVDPAISVAALDRCARLLAD
+ IAGGEVSPTLTDWRGDPPCDDWSPPPIRMGVDVPDRIAGVAYPQGTTARRLAQIGAVV
+ THDGDTLTVTPPSWRPDLRQPADLVEEVLRLEGLEVIPSVLPPAPAGRGLTAGQQRRR
+ TIGRSLALSGYVEILPTPFLPAGVFDLWGLEADDSRRMTTRVLNPLEADRPQLATTLL
+ PALLEALVRNVSRGLVDVALFAIAQVVQPTEQTRGVGLIPVDRRPTDDEIAMLDASLP
+ RQPQHVAAVLAGLREPRGPWGPGRPVEAADAFEAVRIIARASRVDVTLRPAQYLPWHP
+ GRCAQVFVGESSVGHAGQLHPAVIERSGLPKGTCAVELNLDAIPCSAPLPAPRVSPYP
+ AVFQDVSLVVAADIPAQAVADAVRAGAGDLLEDIALFDVFTGPQIGEHRKSLTFALRF
+ RAPDRTLTEDDASAARDAAVQSAAERVGAVLRG"
+ gene complement(1852121..1855177)
+ /gene="PE_PGRS30"
+ /locus_tag="BQ2027_MB1679C"
+ CDS complement(1852121..1855177)
+ /gene="PE_PGRS30"
+ /locus_tag="BQ2027_MB1679C"
+ /note="Mb1679c, PE_PGRS30, len: 1018 aa. Equivalent to
+ Rv1651c, len: 1011 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.2% identity in 1018 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, similar to many e.g.
+ Q10637|Y03A_MYCTU hypothetical glycine-rich 49.6 kd
+ protein (603 aa), FASTA scores: opt: 1757, E(): 0, (50.8%
+ identity in 714aa overlap). REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium bovis, an in-frame insertion of 21 bp
+ leads to a longer product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (1018 aa versus
+ 1011 aa). Mb1679c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs30"
+ /protein_id="SIU00282.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYX7"
+ /translation="MSFLLVEPDLVTAAAANLAGIRSALSEAAAAASTPTTALASAGA
+ DEVSAAVSRLFGAYGQQFQALNARAATFHAEFVSLLNGGAAAYTGAEAASVSSMQALL
+ DAVNAPTQTLLGRPLIGNGADGVAGTGSNAGGNGGPGGILYGNGGNGGAGGPDGGAGG
+ NGGAAGLIGNGGAGGAGGVGGAGGAGGAGGTGGLLYGNGGAGGNGGSAAAAGGAGGNA
+ LLFGNGGNGGSGASGGAAGHAGTIFGNGGNAGAGSGLAGADGGLFGNGGDGGSSTSKA
+ GGAGGNALFGNGGDGGSSTVAAGGAGGNTLVGNGGAGGAGGTSGLTGSGVAGGAGGSV
+ GLWGSGGAGGDGGAATSLLGVGMNAGAGGAGGNAGLLYGNGGAGGAGGNGGDTTVPLF
+ DSGVGGAGGAGGNASLFGNGGTGGVGGKGGTSSDLASATSGAGGAGGAGGVGGLLYGN
+ GGNGGAGGIGGAAINILANAGAGGAGGAAGSSFIGNGGNGGAGGAGGAAALFSSGVGG
+ AGGSGGTALLLGSGGAGGNGGTGGANSGSLFASPGGTGGAGGHGGAGGLIWGNGGAGG
+ NGGNGGTTADGALEGGTGGIGGTGGSAIAFGNGGQGGAGGTGGDHSGGNGIGGKGGAS
+ GNGGNAGQVFGDGGTGGTGGAGGAGSGTKAGGTGSDGGHGGNATLIGNGGDGGAGGAG
+ GAGSPAGAPGNGGTGGTGGVLFGQSGSSGPPGAAALAFPSLSSSVPILGPYEDLIANT
+ VANLASIGNTWLADPAPFLQQYLANQFGYGQLTLTALTDATRDFAIGLAGIPPSLQSA
+ LQALAAGDVSGAVTDVLGAVVKVFVSGVDASDLSNILLLGPVGDLFPILSIPGAMSQN
+ FTNVVMTVTDTTIAFSIDTTNLTGVMTFGLPLAMTLNAVGSPITTAIAFAESTTAFVS
+ AVQAGNLQAAAAALVGAPANVANGFLNGEARLPLALPTSATGGIPVTVEVPVGGILAP
+ LQPFQATAVIPVIGPVTVTLEGTPAGGIVPALVNYAPTQLAQAIAP"
+ gene 1855371..1856429
+ /gene="argC"
+ /locus_tag="BQ2027_MB1680"
+ CDS 1855371..1856429
+ /gene="argC"
+ /locus_tag="BQ2027_MB1680"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1680, argC, len: 352 aa. Equivalent to Rv1652,
+ len: 352 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 352 aa overlap). Probable argC,
+ N-acetyl-gamma-glutamyl-phosphate reductase (EC 1.2.1.38),
+ similar to many e.g. ARGC_STRCL|P54896 from Streptomyces
+ clavuligerus (340 aa), FASTA scores: opt: 1119, E(): 0,
+ (56.9% identity in 350 aa overlap); etc. BELONGS TO THE
+ NAGSA DEHYDROGENASE FAMILY. Protein product from Mb1680
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1680 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable n-acetyl-gamma-glutamyl-phoshate
+ reductase argc"
+ /protein_id="SIU00283.1"
+ /db_xref="GOA:P63563"
+ /db_xref="InterPro:IPR000534"
+ /db_xref="InterPro:IPR000706"
+ /db_xref="InterPro:IPR012280"
+ /db_xref="InterPro:IPR023013"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P63563"
+ /translation="MQNRQVANATKVAVAGASGYAGGEILRLLLGHPAYADGRLRIGA
+ LTAATSAGSTLGEHHPHLTPLAHRVVEPTEAAVLGGHDAVFLALPHGHSAVLAQQLSP
+ ETLIIDCGADFRLTDAAVWERFYGSSHAGSWPYGLPELPGARDQLRGTRRIAVPGCYP
+ TAALLALFPALAADLIEPAVTVVAVSGTSGAGRAATTDLLGAEVIGSARAYNIAGVHR
+ HTPEIAQGLRAVTDRDVSVSFTPVLIPASRGILATCTARTRSPLSQLRAAYEKAYHAE
+ PFIYLMPEGQLPRTGAVIGSNAAHIAVAVDEDAQTFVAIAAIDNLVKGTAGAAVQSMN
+ LALGWPETDGLSVVGVAP"
+ gene 1856426..1857640
+ /gene="argJ"
+ /locus_tag="BQ2027_MB1681"
+ CDS 1856426..1857640
+ /gene="argJ"
+ /locus_tag="BQ2027_MB1681"
+ /note="Mb1681, argJ, len: 404 aa. Equivalent to Rv1653,
+ len: 404 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 404 aa overlap). Probable argJ,
+ Glutamate n-acetyltransferase (EC 2.3.1.35), similar to
+ ARGJ_BACSU|P36843 from Bacillus subtilis (406 aa), fasta
+ scores: opt: 727, E(): 0, (36.3% identity in 410 a a
+ overlap). Protein product from Mb1681 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1681 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Glutamate n-acetyltransferase argJ"
+ /protein_id="SIU00284.1"
+ /db_xref="GOA:P63572"
+ /db_xref="InterPro:IPR002813"
+ /db_xref="InterPro:IPR016117"
+ /db_xref="InterPro:IPR042195"
+ /db_xref="UniProtKB/Swiss-Prot:P63572"
+ /translation="MTDLAGTTRLLRAQGVTAPAGFRAAGVAAGIKASGALDLALVFN
+ EGPDYAAAGVFTRNQVKAAPVLWTQQVLTTGRLRAVILNSGGANACTGPAGFADTHAT
+ AEAVAAALSDWGTETGAIEVAVCSTGLIGDRLPMDKLLAGVAHVVHEMHGGLVGGDEA
+ AHAIMTTDNVPKQVALHHHDNWTVGGMAKGAGMLAPSLATMLCVLTTDAAAEPAALER
+ ALRRAAAATFDRLDIDGSCSTNDTVLLLSSGASEIPPAQADLDEAVLRVCDDLCAQLQ
+ ADAEGVTKRVTVTVTGAATEDDALVAARQIARDSLVKTALFGSDPNWGRVLAAVGMAP
+ ITLDPDRISVSFNGAAVCVHGVGAPGAREVDLSDADIDITVDLGVGDGQARIRTTDLS
+ HAYVEENSAYSS"
+ gene 1857637..1858521
+ /gene="argB"
+ /locus_tag="BQ2027_MB1682"
+ CDS 1857637..1858521
+ /gene="argB"
+ /locus_tag="BQ2027_MB1682"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1682, argB, len: 294 aa. Equivalent to Rv1654,
+ len: 294 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 294 aa overlap). Probable argB,
+ Acetylglutamate kinase (EC 2.7.2.8), similar to
+ ARGB_CORGL|Q59281 (294 aa), FASTA scores: opt: 1209, E():
+ 0, (64.4% identity in 270 aa overlap). BELONGS TO THE
+ ACETYLGLUTAMATE KINASE FAMILY. Protein product from Mb1682
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1682 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Acetylglutamate kinase argB"
+ /protein_id="SIU00285.1"
+ /db_xref="GOA:P0A4Y7"
+ /db_xref="InterPro:IPR001048"
+ /db_xref="InterPro:IPR001057"
+ /db_xref="InterPro:IPR004662"
+ /db_xref="InterPro:IPR036393"
+ /db_xref="InterPro:IPR037528"
+ /db_xref="InterPro:IPR041727"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4Y7"
+ /translation="MSRIEALPTHIKAQVLAEALPWLKQLHGKVVVVKYGGNAMTDDT
+ LRRAFAADMAFLRNCGIHPVVVHGGGPQITAMLRRLGIEGDFKGGFRVTTPEVLDVAR
+ MVLFGQVGRELVNLINAHGPYAVGITGEDAQLFTAVRRSVTVDGVATDIGLVGDVDQV
+ NTAAMLDLVAAGRIPVVSTLAPDADGVVHNINADTAAAAVAEALGAEKLLMLTDIDGL
+ YTRWPDRDSLVSEIDTGTLAQLLPTLESGMVPKVEACLRAVIGGVPSAHIIDGRVTHC
+ VLVELFTDAGTGTKVVRG"
+ gene 1858518..1859720
+ /gene="argD"
+ /locus_tag="BQ2027_MB1683"
+ CDS 1858518..1859720
+ /gene="argD"
+ /locus_tag="BQ2027_MB1683"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1683, argD, len: 400 aa. Equivalent to Rv1655,
+ len: 400 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 400 aa overlap). Probable argD,
+ Acetylornithine aminotransferase (EC 2.6.1.11), similar to
+ ARGD_ECOLI|P18335 (406 aa), FASTA scores: opt: 958, E():
+ 0, (38.6% identity in 404 aa overlap), contains PS00600
+ Aminotransferases class-III pyridoxal-phosphate attachment
+ site. BELONGS TO CLASS-III OF
+ PYRIDOXAL-PHOSPHATE-DEPENDENT AMINOTRANSFERASES. Protein
+ product from Mb1683 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1683 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Acetylornithine aminotransferase argD"
+ /protein_id="SIU00286.1"
+ /db_xref="GOA:P63569"
+ /db_xref="InterPro:IPR004636"
+ /db_xref="InterPro:IPR005814"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="UniProtKB/Swiss-Prot:P63569"
+ /translation="MTGASTTTATMRQRWQAVMMNNYGTPPIALASGDGAVVTDVDGR
+ TYIDLLGGIAVNVLGHRHPAVIEAVTRQMSTLGHTSNLYATEPGIALAEELVALLGAD
+ QRTRVFFCNSGAEANEAAFKLSRLTGRTKLVAAHDAFHGRTMGSLALTGQPAKQTPFA
+ PLPGDVTHVGYGDVDALAAAVDDHTAAVFLEPIMGESGVVVPPAGYLAAARDITARRG
+ ALLVLDEVQTGMGRTGAFFAHQHDGITPDVVTLAKGLGGGLPIGACLAVGPAAELLTP
+ GLHGSTFGGNPVCAAAALAVLRVLASDGLVRRAEVLGKSLRHGIEALGHPLIDHVRGR
+ GLLLGIALTAPHAKDAEATARDAGYLVNAAAPDVIRLAPPLIIAEAQLDGFVAALPAI
+ LDRAVGAP"
+ gene 1859717..1860640
+ /gene="argF"
+ /locus_tag="BQ2027_MB1684"
+ CDS 1859717..1860640
+ /gene="argF"
+ /locus_tag="BQ2027_MB1684"
+ /note="Mb1684, argF, len: 307 aa. Equivalent to Rv1656,
+ len: 307 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 307 aa overlap). Probable argF,
+ ornithine carbamoyltransferase, anabolic (EC 2.1.3.3) (see
+ citation below), almost identical to OTCA_MYCBO|Q02095
+ ornithine carbamoyltransferase, anabolic from
+ Mycobacterium bovis (307 aa), FASTA scores: opt: 1980,
+ E(): 0, (99.0% identity in 307 aa overlap); contains
+ PS00097 Aspartate and ornithine carbamoyltransferases
+ signature. BELONGS TO THE ATCASES/OTCASES FAMILY. Protein
+ product from Mb1684 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1684 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Ornithine carbamoyltransferase,
+ anabolic ArgF"
+ /protein_id="SIU00287.1"
+ /db_xref="GOA:P0A5M9"
+ /db_xref="InterPro:IPR002292"
+ /db_xref="InterPro:IPR006130"
+ /db_xref="InterPro:IPR006131"
+ /db_xref="InterPro:IPR006132"
+ /db_xref="InterPro:IPR024904"
+ /db_xref="InterPro:IPR036901"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5M9"
+ /translation="MIRHFLRDDDLSPAEQAEVLELAAELKKDPVSRRPLQGPRGVAV
+ IFDKNSTRTRFSFELGIAQLGGHAVVVDSGSTQLGRDETLQDTAKVLSRYVDAIVWRT
+ FGQERLDAMASVATVPVINALSDEFHPCQVLADLQTIAERKGALRGLRLSYFGDGANN
+ MAHSLLLGGVTAGIHVTVAAPEGFLPDPSVRAAAERRAQDTGASVTVTADAHAAAAGA
+ DVLVTDTWTSMGQENDGLDRVKPFRPFQLNSRLLALADSDAIVLHCLPAHRGDEITDA
+ VMDGPASAVWDEAENRLHAQKALLVWLLERS"
+ gene 1860637..1861149
+ /gene="argR"
+ /locus_tag="BQ2027_MB1685"
+ CDS 1860637..1861149
+ /gene="argR"
+ /locus_tag="BQ2027_MB1685"
+ /standard_name="ahrC"
+ /note="Mb1685, argR, len: 170 aa. Equivalent to Rv1657,
+ len: 170 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 170 aa overlap). Probable argR, Arginine
+ repressor (alternate gene name: ahrC). Similar to
+ AHRC_BACSU|P17893 arginine hydroximate resistance protein
+ from Bacillus subtilis (149 aa), FASTA scores: opt: 283,
+ E(): 1.8e-11, (34.5% identity in 142 aa overlap); and
+ ARGR_ECOLI|P15282 arginine repressor from Escherichia coli
+ (156 aa), FASTA scores: opt: 194, E(): 6.4e-06, (30.8%
+ identity in 146 aa overlap). BELONGS TO THE ARGR FAMILY.
+ Protein product from Mb1685 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1685 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Arginine repressor argR (AHRC)"
+ /protein_id="SIU00288.1"
+ /db_xref="GOA:P0A4Y9"
+ /db_xref="InterPro:IPR001669"
+ /db_xref="InterPro:IPR020899"
+ /db_xref="InterPro:IPR020900"
+ /db_xref="InterPro:IPR036251"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4Y9"
+ /translation="MSRAKAAPVAGPEVAANRAGRQARIVAILSSAQVRSQNELAALL
+ AAEGIEVTQATLSRDLEELGAVKLRGADGGTGIYVVPEDGSPVRGVSGGTDRMARLLG
+ ELLVSTDDSGNLAVLRTPPGAAHYLASAIDRAALPQVVGTIAGDDTILVVAREPTTGA
+ QLAGMFENLR"
+ gene 1861158..1862354
+ /gene="argG"
+ /locus_tag="BQ2027_MB1686"
+ CDS 1861158..1862354
+ /gene="argG"
+ /locus_tag="BQ2027_MB1686"
+ /note="Mb1686, argG, len: 398 aa. Equivalent to Rv1658,
+ len: 398 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 398 aa overlap). Probable argG,
+ Argininosuccinate synthase (EC 6.3.4.5), similar to
+ ASSY_STRCL|P50986 argininosuccinate synthase from
+ Streptomyces clavuligerus (397 aa), FASTA scores: opt:
+ 1873, E(): 0, (67.8% identity in 397 aa overlap); contains
+ PS00564 Argininosuccinate synthase signature 1, PS00565
+ Argininosuccinate synthase signature 2. BELONGS TO THE
+ ARGININOSUCCINATE SYNTHASE FAMILY. Protein product from
+ Mb1686 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1686 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Argininosuccinate synthase argG"
+ /protein_id="SIU00289.1"
+ /db_xref="GOA:P63643"
+ /db_xref="InterPro:IPR001518"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="InterPro:IPR018223"
+ /db_xref="InterPro:IPR023434"
+ /db_xref="InterPro:IPR024074"
+ /db_xref="UniProtKB/Swiss-Prot:P63643"
+ /translation="MSERVILAYSGGLDTSVAISWIGKETGREVVAVAIDLGQGGEHM
+ DVIRQRALDCGAVEAVVVDARDEFAEGYCLPTVLNNALYMDRYPLVSAISRPLIVKHL
+ VAAAREHGGGIVAHGCTGKGNDQVRFEVGFASLAPDLEVLAPVRDYAWTREKAIAFAE
+ ENAIPINVTKRSPFSIDQNVWGRAVETGFLEHLWNAPTKDIYAYTEDPTINWGVPDEV
+ IVGFERGVPVSVDGKPVSMLAAIEELNRRAGAQGVGRLDVVEDRLVGIKSREIYEAPG
+ AMVLITAHTELEHVTLERELGRFKRQTDQRWAELVYDGLWYSPLKAALEAFVAKTQEH
+ VSGEVRLVLHGGHIAVNGRRSAESLYDFNLATYDEGDSFDQSAARGFVYVHGLSSKLA
+ ARRDLR"
+ gene 1862434..1863846
+ /gene="argH"
+ /locus_tag="BQ2027_MB1687"
+ CDS 1862434..1863846
+ /gene="argH"
+ /locus_tag="BQ2027_MB1687"
+ /note="Mb1687, argH, len: 470 aa. Equivalent to Rv1659,
+ len: 470 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 470 aa overlap). Probable argH,
+ argininosuccinate lyase (EC 4.3.2.1), similar to
+ ARLY_ECOLI|P11447 argininosuccinate lyase from Escherichia
+ coli (457 aa), FASTA scores: opt: 1091, E(): 0, (42.5%
+ identity in 461 aa overlap); contains PS00017
+ ATP/GTP-binding site motif A, PS00163 Fumarate lyases
+ signature. BELONGS TO THE LYASE 1 FAMILY.
+ ARGININOSUCCINATE LYASE SUBFAMILY. Protein product from
+ Mb1687 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1687 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Argininosuccinate lyase argH"
+ /protein_id="SIU00290.1"
+ /db_xref="GOA:P0A4Z1"
+ /db_xref="InterPro:IPR000362"
+ /db_xref="InterPro:IPR008948"
+ /db_xref="InterPro:IPR009049"
+ /db_xref="InterPro:IPR020557"
+ /db_xref="InterPro:IPR022761"
+ /db_xref="InterPro:IPR024083"
+ /db_xref="InterPro:IPR029419"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4Z1"
+ /translation="MSTNEGSLWGGRFAGGPSDALAALSKSTHFDWVLAPYDLTASRA
+ HTMVLFRAGLLTEEQRDGLLAGLDSLAQDVADGSFGPLVTDEDVHAALERGLIDRVGP
+ DLGGRLRAGRSRNDQVAALFRMWLRDAVRRVATGVLDVVGALAEQAAAHPSAIMPGKT
+ HLQSAQPILLAHHLLAHAHPLLRDLDRIVDFDKRAAVSPYGSGALAGSSLGLDPDAIA
+ ADLGFSAAADNSVDATAARDFAAEAAFVFAMIAVDLSRLAEDIIVWSSTEFGYVTLHD
+ SWSTGSSIMPQKKNPDIAELARGKSGRLIGNLAGLLATLKAQPLAYNRDLQEDKEPVF
+ DSVAQLELLLPAMAGLVASLTFNVQRMAELAPAGYTLATDLAEWLVRQGVPFRSAHEA
+ AGAAVRAAEQRGVGLQELTDDELAAISPELTPQVREVLTIEGSVSARDCRGGTAPGRV
+ AEQLNAIGEAAERLRRQLVR"
+ gene 1863955..1865016
+ /gene="pks10"
+ /locus_tag="BQ2027_MB1688"
+ CDS 1863955..1865016
+ /gene="pks10"
+ /locus_tag="BQ2027_MB1688"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1688, pks10, len: 353 aa. Equivalent to Rv1660,
+ len: 353 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 353 aa overlap). Possible pks10,
+ chalcone synthase (EC 2.3.1.74), similar to
+ BCSA_BACSU|P54157 putative chalcone synthase from B.
+ subtilis (365 aa), FASTA scores: opt: 701, E(): 0, (33.1%
+ identity in 362 aa overlap). Also similar to M.
+ tuberculosis Rv1665|pks11 polyketide synthase (chalcone
+ synthase); and Rv1372|pks18 polyketide synthase. Other
+ upstream initiation sites are possible but homology
+ suggests this start. Protein product from Mb1688 detected
+ using SWATH mass spectrometry. Mb1688 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="chalcone synthase pks10"
+ /protein_id="SIU00291.1"
+ /db_xref="GOA:Q7VEV2"
+ /db_xref="InterPro:IPR001099"
+ /db_xref="InterPro:IPR011141"
+ /db_xref="InterPro:IPR012328"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEV2"
+ /translation="MSVIAGVFGALPPYRYSQRELTDSFVSIPDFEGYEDIVRQLHAS
+ AKVNSRHLVLPLEKYPKLTDFGEANKIFIEKAVDLGVQALAGALDESGLRPEDLDVLI
+ TATVTGLAVPSLDARIAGRLGLRADVRRVPLFGLGCVAGAAGVARLHDYLRGAPDGVA
+ ALVSVELCSLTYPGYKPTLPGLVGSALFADGAAAVVAAGVKRAQDIGADGPDILDSRS
+ HLYPDSLRTMGYDVGSAGFELVLSRDLAAVVEQYLGNDVTTFLASHGLSTTDVGAWVT
+ HPGGPKIINAITETLDLSPQALELTWRSLGEIGNLSSASVLHVLRDTIAKPPPSGSPG
+ LMIAMGPGFCSELVLLRWH"
+ gene 1865099..1871479
+ /gene="pks7"
+ /locus_tag="BQ2027_MB1689"
+ CDS 1865099..1871479
+ /gene="pks7"
+ /locus_tag="BQ2027_MB1689"
+ /note="Mb1689, pks7, len: 2126 aa. Equivalent to Rv1661,
+ len: 2126 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 2126 aa overlap). Probable pks7,
+ polyketide synthase, similar to many e.g.
+ ERY2_SACER|Q03132 erythronolide synthase, modules 3 and 4
+ (3567 aa), FASTA scores: E(): 0, (48.8% identity in 2131
+ aa overlap); also similar to Mycobacterium tuberculosis
+ pks12. Contains PS00606 Beta-ketoacyl synthases active
+ site, PS00012 Phosphopantetheine attachment site. Protein
+ product from Mb1689 detected using SWATH mass
+ spectrometry. Mb1689 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable polyketide synthase pks7"
+ /protein_id="SIU00292.1"
+ /db_xref="GOA:A0A1R3XYY8"
+ /db_xref="InterPro:IPR001227"
+ /db_xref="InterPro:IPR006162"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR013968"
+ /db_xref="InterPro:IPR014030"
+ /db_xref="InterPro:IPR014031"
+ /db_xref="InterPro:IPR014043"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="InterPro:IPR016036"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR018201"
+ /db_xref="InterPro:IPR020801"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR020807"
+ /db_xref="InterPro:IPR020841"
+ /db_xref="InterPro:IPR020843"
+ /db_xref="InterPro:IPR032821"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="InterPro:IPR041314"
+ /db_xref="InterPro:IPR042104"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYY8"
+ /translation="MNSTPEDLVKALRRSLKQNERLKRENRDLLARTTEPVAVVGMGC
+ RYPGGVDSPETLWELVAHGRDAVSEFPADRGWDVAGLFDPDPDAVGKSYTRCGGFLTD
+ VAGFDAEFFGIAPSEALAMDPQQRLLLEVSWEALERAGIDPITLRGSQTGVFAGVFHG
+ SYGGQGRVPGDLERYGLRGSTLSVASGRVAYVLGLQGPAVSVDTACSSSLVALHLAVQ
+ SLRLGECDLALVGGVTVMATPAMFIEFSRQRALSADGRCKAYAGAADGTAFAEGAGVL
+ VLARLADARRLGHPVLALVRGSAVNQDGASNGLATPNGPAQQRVITAALASARLGVAD
+ VDVVEGHGTGTTLGDPIEAQAILATYGQRPADRPLWLGSIKSNIGHTSAAAGVAGVIK
+ MVQAMRHGVLPKTLHVDVPTPHVDWSAGAVSLLTEPRPWHVPGRPRRAGVSSFGISGT
+ NAHVILEEAPAVEPVGAAHGNDPVAVPWVLSARSAQALTNQARRLLAWVGADENVRPL
+ DVGWSLVNTRSLFDHRAVVVGADRTQLMEGLTGLAAGVPGADVVAGRAQTVGKTAFVF
+ PGQGAQWLGMGAQLCATAPVFAEHIHRCERALREHVEWSLLDVLRGAPGAPGLDRVDV
+ VQPALWAVMVSLAELWRSVGVVPDAVIGHSQGEIAAAYVAGALSLWDAAAVVALRSRL
+ LVRLGGAGGMVSLACGQPQAEKLASQWGDRLNIAAVNGVSSVVLAGETDAVTELMQRC
+ EAEGIRARRIDVDYASHSAQVDAIREELIAALRGIEPRTSTVAFFSTVTGELMDTAGV
+ NAEYWYRSIRQPVQFERAVRNAFDGGYRVFVESSPHPVLIAGIEETLVDCDRGATGEP
+ IVIPTLGRDDGGVGRFWLSAGQAHVAGVGVDWRAAFADLGGRRVELPTYAFARQRFWL
+ DGLGAVGGDLGGVGLVGAEHGLLAAVVQRPDSGGVVLTGRISVVAAPWLADHAVGPVV
+ LFPGTGFVELALRAGDEVGCSVLQELTLQAPLVLPADGVRVQVVVGGVEQSGTRNVWV
+ YSAAGQADSSPGWTLHAQGVLGVGSVQPAAELSVWPPVGARAMDVADGYQVLAARGYG
+ YGPAFRGLQALWRRGAEVFADVTLPEGVPIRGFGIHPAVLDAALHAWGIVEGEQQTML
+ PFSWQGVCLHASGAARVRVRLAPVGRGAVPVELADPQGLPVLSVRQLMVRPVSAAALS
+ RSTAGDRGLLEMIWTPVPLEGGDIGDDAVVWELPPHAGAQAGGDVLAAVYRGVHEVLE
+ VLQSWLASDATGLGVVVTRGAVGPVDDDVTDLAGAAVWGLVRSAQAEHPGRVVLVDTD
+ GSVAVEDAVGFGARSGEPQLVVRRGRVYAARLAPVAAGLTLPSASAGGWRLVAGGGGT
+ LADVVVAPVAPVELATGQVRVAVGAVGVNFRDVLVALGMYPGGGELGVDGAGVVVEVG
+ PGVTGLAVGDRVMGLLGLVGSEAVVDARLVTMVPAGWSLVEAAAVPVAFLTAFYGLSV
+ LAEVAAGQKVLVHAGTGGVGMAAVSLARYWGAEVFVTASRAKWDTLRAMGFDDIHISD
+ SRSLEFEEAFLRATEGSGVDVVLNSLAGEFTDASLRLLPSGGRFIELGKTDIRDGQTV
+ AERHRGVRYRAFDLVEAGPDRIAAMLSEVVGLLAAGVLARLPVKTFDARCAPAAYRFV
+ SQARHIGKVVLTIPDGPGGQSGLAGGTVVVTGGTGMAGSAVATHLVRRHGVANLVLVS
+ RSGEQADRAAEVAALLREGGAQVAVVSCDVADRDALAALLAGLDPRYPLKGVFHAAGV
+ LDDAVITGLTPDRVDTVLRAKVDGAWNLHELTEDMDLSAFVVFSSMAGIVGTPAQGNY
+ AAANAFLDGLVAYRRSRGLAGLSVAWGLWEQASAMTRHLGERDRARMTQAGLAPLTTE
+ QALGFLDTALQADRAVVVAARLDRAALAGAGAALPALFSQLAAGPTRRRIDAADTAVS
+ MSGLVSRLHALTPERRQRELTDLVISNAAAVLGRSSSVDINAHKAFQDLGFDSLTAVE
+ LRNRLKTATGLTLSPTLIFDYPTPATLAEHLDSRLVTASGSDQQSLSDRVDDITRELV
+ VLLDQPDLSANVKAHLRTRLQTMLTSLTTEDDDIAAATESQLFAILDEELGS"
+ gene 1871499..1876307
+ /gene="pks8"
+ /locus_tag="BQ2027_MB1690"
+ CDS 1871499..1876307
+ /gene="pks8"
+ /locus_tag="BQ2027_MB1690"
+ /note="Mb1690, pks8, len: 1602 aa. Equivalent to Rv1662,
+ len: 1602 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.7% identity in 1602 aa overlap). Probable pks8,
+ polyketide synthase, similar to many polyketide synthases
+ e.g. ERY2_SACER|Q03132 erythronolide synthase, modules 3
+ and 4 from Saccharopolyspora erythraea (Streptomyces
+ erythraeus) (3567 aa), FASTA scores: opt: 3319, E(): 0,
+ (45.8% identity in 1619 aa overlap). Also similar to other
+ Mycobacterium tuberculosis probable polyketide synthases
+ e.g. pks7 and pks12. Contains PS00606 Beta-ketoacyl
+ synthases active site and PS01162 Quinone
+ oxidoreductase/zeta-crystallin signature. Note that the
+ similarity extends into the downstream ORF Rv1663
+ (MTCY275.02), and this could be accounted for by a
+ frameshift, although the sequence has been checked and no
+ discrepancy was found."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable polyketide synthase pks8"
+ /protein_id="SIU00293.1"
+ /db_xref="GOA:A0A1R3Y136"
+ /db_xref="InterPro:IPR001227"
+ /db_xref="InterPro:IPR002364"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013149"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR014030"
+ /db_xref="InterPro:IPR014031"
+ /db_xref="InterPro:IPR014043"
+ /db_xref="InterPro:IPR015083"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="InterPro:IPR016036"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR018201"
+ /db_xref="InterPro:IPR020801"
+ /db_xref="InterPro:IPR020807"
+ /db_xref="InterPro:IPR020841"
+ /db_xref="InterPro:IPR020843"
+ /db_xref="InterPro:IPR032821"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="InterPro:IPR042104"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y136"
+ /translation="MSGTTTHVDYLKRLTADLRRTRRRLSDLEAKLSEPVAVVGMGCR
+ YPGGVDSPETLWELVAQGRDAVSDFPADRGWDVYGLFDPDPDACGKMYTRRGTFLEHA
+ GDFDAGFFGIGPSEALAMDPQQRLLLEVSWEALERTGIDPTKLRGSATGVFAGVIHAG
+ YGGQLSGELEGYGLTGSTLSVASGRVAYVLGLEGPAVSVDTACSSSLVALHLAVQSLR
+ SGECDLALAGGVTVMATPAAFVEFSRQRALARDGRCKVYAGAADGTAWSEGAGVLVVE
+ RLVDARRLGHPVLALVRGSAVNQDGASNGLTAPNGPSQQRVIRAALASARLRAVEVDV
+ VEGHGTGTMLGDPIEAQALLATYGQDRVEPLWLGSIKSNIGHTSAAAGVAGVIKMVQA
+ MRHGVMPKTLHVDVPTPHVDWSVGAVSLLTQPRAWSVHGRPRRAGVSSFGISGTNAHV
+ ILEQAPVVESVVPEVASPTAASAVPWVLSARSEQALAGQAQRLLAFVAANPDLDPIDV
+ GWSLVKTRAMFEHRAVVVGADRGALLAGLAALAAGESGAGVAVGRARSVGKTVFVFPG
+ QGAQWVGMGAQLYAELPLFALAFDAVAEELDRHLRLPLRNVLWEGDEALLTSTEFAQP
+ ALFAIEVALATLLQHWGISPDFLIGHSVGEIAAAHLAGVLSLTDAAGLVAARGRLMAE
+ LPAGGVMVVVAASEEEVLPVLVDGANLAAVNAPHSVVVSGCEAAVSDIADHFARRGRR
+ VHRLAVSHAFHSLLMEPMLAEFTRIAAGISVSKPRIPLVSNVTGQMAGAGYGDGQYWV
+ EHARRPVRFVEGVQLLNAVGATRFVEVGPGGGLTALVEQSLPLGEALSVAMMRREHPE
+ VSSVLGAVATLFTAGAQMDWPAVFGSPGRRIELPTYAFQRQRYWLPPTSAGSADISGV
+ GLLAARHGLLGAVVEQPDSDVVVLTGRLSVGEQRWLADHVIAGVVLLAGAAFVELALR
+ AADQVDCGVVEELTVVTPLVLPTVGGVQLQVVVGVGEMGQRPVSIYSRNAESDSGWVL
+ HARGVLGAKAVAPAADLSVWPPLGAAPVDVDGAYQRFAELGYEYGRAFQGLTAMWRRE
+ SELFADVAVPDDVDVTLSGFGIHPLVLDAALHAMGMVGEQAATMLPFSWQGVSLHAAG
+ ASRVRARIAPAGDGTVSVELADQAGLPVLSVQALVMRSVSSQLLSAAVAAADAAGRGL
+ LEVAWLPVELAHNDISADLVVWELESFQDGVGPVYSATHRVLVALQSWLAQERAGGLV
+ VLTQGSVGQDATNLAGAAVWGLVRSAQAEHPGRVMLVDSDGSMDVGDVIGCGEEQLMI
+ RNGTAYAARLAQLRPQPILQLPDTNSGWRLVAGGAGTLEDLTLASCPAKELAPGQVRI
+ EVRALGVNFRDVLVALGIYPGAAELGAEGAGVVTEVGPGVTGLAVGDPVMGLLGVAGS
+ EAVVDARLVVKLPNRWPLTDAAGVPVVFLTAYCALRVLAQVQPGESVLVHAAAGGVGM
+ AAVQLARLWGLEVFATASRGKWDTLHTMGCDNTHVADSRTLAFEETFWLTTEGRGVDV
+ VLNSLAGEFTDASLRLLPRGGRFIEMGKTEFGTPRSLPRTILGWPTGLST"
+ gene 1876307..1877815
+ /gene="pks17"
+ /locus_tag="BQ2027_MB1691"
+ CDS 1876307..1877815
+ /gene="pks17"
+ /locus_tag="BQ2027_MB1691"
+ /note="Mb1691, pks17, len: 502 aa. Equivalent to Rv1663,
+ len: 502 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 502 aa overlap). Probable pks17,
+ polyketide synthase, similar to other polyketide synthases
+ e g. ERY2_SACER|Q03132 erythronolide synthase, modules 3
+ and 4 (3567 aa) from Saccharopolyspora erythraea
+ (Streptomyces erythraeus), FASTA scores: opt: 1207, E():
+ 0, (43.9% identity in 531 aa overlap). Also similar to
+ other Mycobacterium tuberculosis probable polyketide
+ synthases e.g. pks7 and pks1. Note that the similarity
+ extends into the upstream ORF Rv1662 (MTCY275.01) and this
+ could be accounted for by a frameshift, although the
+ sequence has been checked and no discrepancy was found.
+ Contains PS00012 Phosphopantetheine attachment site.
+ Mb1691 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable polyketide synthase pks17"
+ /protein_id="SIU00294.1"
+ /db_xref="GOA:A0A1R3XZU8"
+ /db_xref="InterPro:IPR006162"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR013968"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZU8"
+ /translation="MEAGPQRIAQMLAELVELFKTEALHRLPVKSWDVRHAREAYRFL
+ SQARHVGKVVLTMPDAWAAGTVLITGGTGMAGSAVARHLVSRYGVRQVVLASRAGEHT
+ ESVAALVDELGSAGARVQVVSCDVADRDAVAGLVASQPDLTAVFHAAGVLDDAVITGL
+ TPERVDKVLRAKVDGAWNLHELTRHLDVSAFVLFSSMAGIVGAPGQANYAAANAFLDG
+ LAAYRRSRGLAALSVAWGLWEQASAMTEHLGERDRVRMSRVGLAPLPTNQAMGFLDAA
+ LLADRPVVVAARLDRAALAGAELPALFSQLVAGPIRRIIDGADEVSGSGLASRLHGLT
+ PEQRHRELTELVCSNAAIVLGHSGTEIDAHKAFQDLGFDSLTAVELRNRLKTATGLTL
+ PPTLIFDYPTAAELAEHLDIQLANAPAVTVDQPNPSTRFNEVTRELQALLDQPNWNPD
+ DKTRLIKRLQAILTDCTAPPASSGPSTTHDDEDITTATESQLFAILDDELGP"
+ gene 1877821..1880874
+ /gene="pks9"
+ /locus_tag="BQ2027_MB1692"
+ CDS 1877821..1880874
+ /gene="pks9"
+ /locus_tag="BQ2027_MB1692"
+ /note="Mb1692, pks9, len: 1017 aa. Equivalent to Rv1664,
+ len: 1017 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.8% identity in 1017 aa overlap). Probable pks9,
+ polyketide synthase, similar to OL56_STRAT|Q07017
+ oleandomycin polyketide synthase, modules 5 and 6 from
+ Streptomyces antibioticus (3519 aa), FASTA scores: opt:
+ 1767, E(): 0, (41.6% identity in 919 aa overlap). Similar
+ to other Mycobacterium tuberculosis probable polyketide
+ synthases e.g. pks6, pks8, etc. Contains PS00012
+ Phosphopantetheine attachment site. Mb1692 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable polyketide synthase pks9"
+ /protein_id="SIU00295.1"
+ /db_xref="GOA:A0A1R3XYZ5"
+ /db_xref="InterPro:IPR001227"
+ /db_xref="InterPro:IPR006162"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR014030"
+ /db_xref="InterPro:IPR014031"
+ /db_xref="InterPro:IPR014043"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="InterPro:IPR016036"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020801"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR020841"
+ /db_xref="InterPro:IPR032821"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYZ5"
+ /translation="MQPTGIAIIGLACRFPTVVSPGDLWDLLRDGREATGSIDNVADF
+ DADFFNLSPREASAMDPRQRLALELTWELLEDAFVVPETLRGQPIAVYLGAMNDDYAV
+ LTLAADRVDHHAFAGTSRAIIANRVSFAFGLRGPSVTIDSGQSSSLVAVHLACESVRT
+ GEAPLAIAGGVHLNLARETAMLEQEFGAVSPSGHTYAFDERADGYVPGDGGGLVLLKP
+ VQAALDDGDRIHAIIRGSAVGNAGHSATGLTVPSVAGQVDVIRRAMSGAGVDCHQVHY
+ VEAHGTGTKIGDPIEARALGEIFAARQRRPVSVGSVKTNIGHTGGAAGIAGLLKAVLA
+ IENAVIPPSLNYVGAPIDLDSLGLRVDTALTPWPVADEPRRAGVSSFGMGGTNAHVIL
+ EQGPTQSPEIVESVAAAGSNAPVAVPWVLAARSPQALTNQAGRLLAHLTADDGLTALD
+ VGWSLVSTRSVFDHRAVVVGADRGRLMAGLAGLAAGEPGAGVVVGRARSVGKTVFVFP
+ GQGSQWLGMGRQLYGRYSVFARAFDEVVAVLDGQLRLSVRQVMWGADAGLLESTEFAQ
+ PALFVVQVALAALLQDWGVLPDLVMGHSVGEIAAAYVAGALSLVDAARVVAARGRLMQ
+ ALPAGGVMVAVAASEDEVAPLLTEGVCIAAVNAPESVVISGEQAAVGVVVDRLVGLGR
+ RVRRLAVSHAFHSVLMDPMVEEFSKVLADVCVRAPRIGLVSNVTGQLAGAGYGSPAYW
+ VEHVRKPVRFFDGVGLAESLGARVFVEVGPGAGLEASVALLARDRPEVESVLAGVGRL
+ FAEGVAVDWSSVFAGLGGRRVELPTYGFARQRFWLGDNGELSVDQTGKDAGAIARLQS
+ LAPPELQRQLVELVCFHAAIVLGRKSSHDIDPECAFQDLGFDSMSGVELRNRLQMAIG
+ LPGLSLPRTLIFDYPTASALAECLGQLLGGQHESSDDESIWQLLKNIPIHQLRRTGLL
+ DKLLLLAGQPEESLAGRTVSDEVIDSLSPEALIGLALDEDENDIR"
+ gene 1881021..1882082
+ /gene="pks11"
+ /locus_tag="BQ2027_MB1693"
+ CDS 1881021..1882082
+ /gene="pks11"
+ /locus_tag="BQ2027_MB1693"
+ /note="Mb1693, pks11, len: 353 aa. Equivalent to Rv1665,
+ len: 353 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 353 aa overlap). Probable pks11,
+ chalcone synthase (EC 2.3.1.74), some similarity to
+ BCSA_BACSU|P54157 putative chalcone synthase from Bacillus
+ subtilis (365 aa), FASTA scores: opt: 615, E(): 6.2e-32,
+ (33.4% identity in 308 aa overlap); and to many plant
+ chalcone synthases e.g. CHS_VIGUN|P51089 chalcone synthase
+ (EC 2.3.1.74) (388 aa), FASTA scores: opt: 391, E():
+ 7.8e-18, (27.2% identity in 349 aa overlap). Highly
+ similar to upstream ORF Rv1660|MTCY06H11.25 pks10 (72.7%
+ identity in 308 aa overlap); and Rv1372 pks18. Protein
+ product from Mb1693 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1693 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="chalcone synthase pks11"
+ /protein_id="SIU00296.1"
+ /db_xref="GOA:Q7VEU7"
+ /db_xref="InterPro:IPR001099"
+ /db_xref="InterPro:IPR011141"
+ /db_xref="InterPro:IPR012328"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEU7"
+ /translation="MSVIAGVFGALPPHRYSQSEITDSFVEFPGLKEHEEIIRRLHAA
+ AKVNGRHLVLPLQQYPSLTDFGDANEIFIEKAVDLGVEALLGALDDANLRPSDIDMIA
+ TATVTGVAVPSLDARIAGRLGLRPDVRRMPLFGLGCVAGAAGVARLRDYLRGAPDDVA
+ VLVSVELCSLTYPAVKPTVSSLVGTALFGDGAAAVVAVGDRRAEQVRAGGPDILDSRS
+ SLYPDSLHIMGWDVGSHGLRLRLSPDLTNLIERYLANDVTTFLDAHRLTKDDIGAWVS
+ HPGGPKVIDAVATSLALPPEALELTWRSLGEIGNLSSASILHILRDTIEKRPPSGSAG
+ LMLAMGPGFCTELVLLRWR"
+ gene complement(1882065..1883357)
+ /gene="cyp139"
+ /locus_tag="BQ2027_MB1694C"
+ CDS complement(1882065..1883357)
+ /gene="cyp139"
+ /locus_tag="BQ2027_MB1694C"
+ /note="Mb1694c, cyp139, len: 430 aa. Equivalent to
+ Rv1666c, len: 430 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 430 aa overlap). Probable
+ cyp139, cytochrome P450 (EC 1.14.-.-), similar to many
+ e.g. U38537|APU38537_7 from Anabaena sp. (459 aa), FASTA
+ scores: opt: 516, E(): 1.7e-26, (25.8% identity in 418 aa
+ overlap). Contains PS00086 Cytochrome P450 cysteine
+ heme-iron ligand signature. BELONGS TO THE CYTOCHROME P450
+ FAMILY. Protein product from Mb1694c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1694c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable cytochrome P450 139 CYP139"
+ /protein_id="SIU00297.1"
+ /db_xref="GOA:P63720"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002403"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/Swiss-Prot:P63720"
+ /translation="MRYPLGEALLALYRWRGPLINAGVGGHGYTYLLGAEANRFVFAN
+ ADAFSWSQTFESLVPVDGPTALIVSDGADHRRRRSVVAPGLRHHHVQRYVATMVSNID
+ TVIDGWQPGQRLDIYQELRSAVRRSTAESLFGQRLAVHSDFLGEQLQPLLDLTRRPPQ
+ VMRLQQRVNSPGWRRAMAARKRIDDLIDAQIADARTAPRPDDHMLTTLISGCSEEGTT
+ LSDNEIRDSIVSLITAGYETTSGALAWAIYALLTVPGTWESAASEVARVLGGRVPAAD
+ DLSALTYLNGVVHETLRLYSPGVISARRVLRDLWFDGHRIRAGRLLIFSAYVTHRLPE
+ IWPEPTEFRPLRWDPNAADYRKPAPHEFIPFSGGLHRCIGAVMATTEMTVILARLVAR
+ AMLQLPAQRTHRIRAANFAALRPWPGLTVEIRKSAPAQ"
+ gene complement(1883372..1885147)
+ /locus_tag="BQ2027_MB1695C"
+ CDS complement(1883372..1885147)
+ /locus_tag="BQ2027_MB1695C"
+ /note="Mb1695c, -, len: 591 aa. Equivalent to Rv1668c and
+ Rv1667c, len: 372 aa and 217 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100% identity in 347 aa
+ overlap and 100% identity in 217 aa overlap).
+ Macrolide-transport ATP-binding protein ABC transporter
+ (see citation below), similar to many ATP-binding proteins
+ ABC transporter e.g. X80735|SEABCT_1|Q54072
+ Saccharopolyspora erythraea ertX gene (481 aa), FASTA
+ scores: opt: 938, E(): 0, (45.6% identity in 353 aa
+ overlap); etc. Similarity to other NBD components of ABC
+ transporters suggests that Rv1667c and Rv1668c should be
+ contiguous. However, sequence has been checked and no
+ error found, also same sequence in Mycobacterium
+ tuberculosis CSU93 and Mycobacterium bovis. Contains
+ PS00211 ABC transporters family signature and two times
+ PS00017 ATP/GTP-binding site motif A. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1668c and Rv1667c exist as 2
+ genes with a small overlap between them. In Mycobacterium
+ bovis, a 10 bp insertion (*-tcttgccgcg) leads to a single
+ product. Protein product from Mb1695c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1695c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable second part of macrolide-transport
+ atp-binding protein abc transporter"
+ /protein_id="SIU00298.1"
+ /db_xref="GOA:A0A1R3XZ10"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR006073"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ10"
+ /translation="MAHLLGAEAVHLAYPTQVVFEAVTLGVNDGARIGIVGRNGDGKS
+ SLLGLLTGQLRPDSGRVTRRSGLRVNALSQTDTLDPNRTVGWTLIGDQPEHQWAGNPR
+ IRDVVAGLVSDIAWDTPVSTLSGGQRRRVQLASLLVGEWDVIALDEPTNHLDIQGITW
+ LADHLRRRWARNTGGLLVVTHDRWFLDEVATTTWEVHDGIVEPFEGGYAAYVLQRVER
+ DRLTAAAEAKRQNLLRKELAWLRRGAPARTCKPKFRIEAANQLIADVPPPRNTVELAK
+ LAAARLGKDVVDLLGVSVSYQPSGGRPVLRDIEWRIGPGERIGIVGANGAGKSTLLGL
+ IAGTVQPGVGRVKRGKTVRLAVLDQHGDDLAPFADDRIADVLGRLRGGYQVEGREVTP
+ TQLLERLGFRRDQLSARVDDLSGGQRRRLQLMLTLLSEPNVLLLDEPTNDVDTEMLTA
+ TEDLLDSWAGTLIVVSHDRYLLERVTDQQYAILDDRLRHLPGGIDEYLQLAARVSAPA
+ PAERPAPPAMSGAQRRATEKELAAVDRQLARLADRVAAKHTELAEHDQSDHVGITRLT
+ QQLRVLQDHVAAMENRWLELSEMLE"
+ gene 1885530..1885892
+ /locus_tag="BQ2027_MB1696"
+ CDS 1885530..1885892
+ /locus_tag="BQ2027_MB1696"
+ /note="Mb1696, -, len: 120 aa. Equivalent to Rv1669, len:
+ 120 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 120 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00299.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ00"
+ /translation="MSRRPGYSNGRAGASRQAARGGSAGASSVAFSSQPNCGLTESVL
+ GHQVTGICLGTIHLDAMQWPWSSAYRLEPAVATTLIGISAWWANGSVKQYAGDLTDRV
+ ATMTVCRRTPAPRVHYRQ"
+ gene 1885925..1886272
+ /locus_tag="BQ2027_MB1697"
+ CDS 1885925..1886272
+ /locus_tag="BQ2027_MB1697"
+ /note="Mb1697, -, len: 115 aa. Equivalent to Rv1670, len:
+ 115 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 115 aa overlap). Conserved hypothetical
+ protein, highly similar to D90908|D90908_87 Hypothetical
+ protein of Synechocystis sp. PCC6803 complete (94 aa),
+ FASTA scores opt: 378, E(): 3.5e-2, (55.2% identity in 96
+ aa overlap); also shows some similarity to M.tuberculosis
+ hypothetical proteins e.g. C-terminal region of
+ O53404|Rv1056 (254 aa), and P96817|Rv0140 (126 aa). Mb1697
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00300.1"
+ /db_xref="InterPro:IPR007361"
+ /db_xref="InterPro:IPR038694"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ03"
+ /translation="MIRAVWNGTVLAEAPRTVRVEGNHYFPPESLHREHLIESPTTSI
+ CPWKGLAHYYNVVVDGPYGPVNPDAAWYYRRPSPLARRIKNHVAFWHGVTVEGESESR
+ HGLARRVVAWLGK"
+ gene 1886280..1886672
+ /locus_tag="BQ2027_MB1698"
+ CDS 1886280..1886672
+ /locus_tag="BQ2027_MB1698"
+ /note="Mb1698, -, len: 130 aa. Equivalent to Rv1671, len:
+ 130 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 130 aa overlap). Probable membrane
+ protein. Weak similarity to mercuric transport proteins.
+ Mb1698 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable membrane protein"
+ /protein_id="SIU00301.1"
+ /db_xref="GOA:A0A1R3XYY1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYY1"
+ /translation="MPTVGPADHAAGLDRRATPDQLPIWRIGIISGLVGMLCCVGPTI
+ LALVGIISAATAFAWANDLYDNYAWWFRVSGLAVLAILVWWALRHRNRCSVNAIRRLR
+ WRLMAVLAIAVGTYGVLSAVTTWFGTFV"
+ gene complement(1886681..1888012)
+ /locus_tag="BQ2027_MB1699C"
+ CDS complement(1886681..1888012)
+ /locus_tag="BQ2027_MB1699C"
+ /note="Mb1699c, -, len: 443 aa. Equivalent to Rv1672c,
+ len: 443 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 443 aa overlap). Probable conserved
+ integral membrane transport protein, major facilitator
+ superfamily, similar to several phthalate transporters or
+ tartrate transporters e.g. U25634|AVU25634_2 Agrobacterium
+ vitis plasmid pTrAB (433 aa), FASTA scores: opt: 914, E():
+ 0, (37.1% identity in 426 aa overlap); etc. Protein
+ product from Mb1699c detected using SWATH mass
+ spectrometry. Mb1699c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE TRANSPORT
+ PROTEIN"
+ /protein_id="SIU00302.1"
+ /db_xref="GOA:A0A1R3XYZ8"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYZ8"
+ /translation="MATIAASPTHNALGKAARRLLPLLFVLYVINFVDRANISVAALA
+ MNADLRLSATAYGTAAGVFFLGYVLFQVPANAALARFGAGRTLTAVVLAWGVCSAATA
+ LVTSAHTLYLARFALGVAEGGFFPGVIAYLTVWFPCAQRARAVATFLLAIPVANTVGL
+ PLSGLIVGHVHMAGLPGWRAMFVIEALPALLLAPLLRRLLPDNPQRASWLTPEERAEL
+ SARLTEDTPAPTGRSSGAGWDLVLFAVVYGGLYFALYALQFFLPQLVASLAHGTATLT
+ AATLAALPYGVAALAMLAWSHRSIDRSGAQAGHITLPTTAAGSAALGAALSPMSPIVT
+ LSWLTIAVAGILAAMPAFWSRCTAALAGPRVAVAIATVNAVASLASFAGPYATGHLKD
+ ATGTYHLALLTVAAVLAAAAACSLLLRHAGRTVCANDSEIMLHPSPATPFV"
+ gene complement(1888105..1889037)
+ /locus_tag="BQ2027_MB1700C"
+ CDS complement(1888105..1889037)
+ /locus_tag="BQ2027_MB1700C"
+ /note="Mb1700c, -, len: 310 aa. Equivalent to Rv1673c,
+ len: 310 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 310 aa overlap). Conserved hypothetical
+ protein, shows weak similarity to P44103|YA48_HAEIN
+ Hypothetical protein HI10 48 precursor (369 aa), FASTA
+ scores: E(): 8.3e-11, (26.1% identity in 330 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="Transglutaminase-like enzymes, putative cysteine
+ proteases"
+ /protein_id="SIU00303.1"
+ /db_xref="InterPro:IPR002931"
+ /db_xref="InterPro:IPR038765"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y145"
+ /translation="MTITDPAVSAHADATIGLFEITDHITIDSTQGAHTVEMWCPVIG
+ DGAFQRVLDVEVTSEDPYDLTREPEFGNLMLYSRLRLATAASWSIRYVVERRAIGHAP
+ DPARARPLATAQLFSRALIPEAHVDVDERTRTLAQDVVGPETNPLEQARRIYDYVTGA
+ MDYDATKQSFLGSTEHALTCSVGNCNDIHALFVSLCRSVDIPARFVLGQALELPQPGA
+ QDCEVCGYHCWAEFFVAGLGWLPADASCATKYGTHGLFANLQANHIAWSIGRDILLAP
+ PQRAGRSLFFAGPYAEIDGETHPAQRQIRFTAMT"
+ gene complement(1889065..1889721)
+ /locus_tag="BQ2027_MB1701C"
+ CDS complement(1889065..1889721)
+ /locus_tag="BQ2027_MB1701C"
+ /note="Mb1701c, -, len: 218 aa. Equivalent to Rv1674c,
+ len: 218 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 218 aa overlap). Probable
+ transcriptional regulatory protein. Highly similar to
+ AJ005575|SPE005575_2 Streptomyces peucetius (226 aa),
+ FASTA scores: opt: 662, E(): 0, (50.0% identity in 208 aa
+ overlap). Similar to Rv0324|Z96800|MTCY63.29 M.
+ tuberculosis cosmid (226 aa), FASTA scores: opt: 579, E():
+ 0, (45.3% identity in 214 aa overlap). N-terminus is
+ similar to transcriptional activators e.g.
+ MERR_STRLI|P30346 probable mercury resistance operon
+ regulator (125 aa), FASTA scores: opt: 183, E(): 1.9e-06,
+ (35.6% identity in 90 aa overlap). Contains PS00380
+ Rhodanese signature 1. Protein product from Mb1701c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00304.1"
+ /db_xref="GOA:A0A1R3XZU9"
+ /db_xref="InterPro:IPR001307"
+ /db_xref="InterPro:IPR001763"
+ /db_xref="InterPro:IPR001845"
+ /db_xref="InterPro:IPR011991"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="InterPro:IPR036873"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZU9"
+ /translation="MSGAKKLIFEQFALVGQALSSGHRLELLDLLVQGERSVDALARA
+ SGLTFANASQHLLQLRRAGLVTSRRDGKRVIYALSDPQVWDVVRAVRAVAERNLASVG
+ SLVRQYYTDRDSLEPISRDELQARVAAGSVLVLDVRPAMEYAAGHLPGAVSIPLDELA
+ ERLDELPSGIDIVACCRGPYCVYAYDALELLRPNGFSARRLDGGFSEWLAADLPVVRT
+ "
+ gene complement(1890046..1890780)
+ /gene="cmr"
+ /locus_tag="BQ2027_MB1702C"
+ CDS complement(1890046..1890780)
+ /gene="cmr"
+ /locus_tag="BQ2027_MB1702C"
+ /note="Mb1702c, -, len: 244 aa. Equivalent to Rv1675c,
+ len: 244 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 244 aa overlap). Probable
+ transcriptional regulatory protein, weak similarity to
+ D00496|LBATRP_7 trp operon from Lactobacillus casei (219
+ aa), FASTA scores: opt: 172, E(): 0.00011, (26.9% identity
+ in 186 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transcriptional regulatory protein cmr"
+ /protein_id="SIU00305.1"
+ /db_xref="GOA:A0A1R3XZ04"
+ /db_xref="InterPro:IPR000595"
+ /db_xref="InterPro:IPR012318"
+ /db_xref="InterPro:IPR014710"
+ /db_xref="InterPro:IPR018490"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ04"
+ /translation="MADRSVRPLRHLVHAVTGGQPPSEAQVRQAAWIARCVGRGGSAP
+ LHRDDVSALAETLQAKEFAPGAVVFHADQTADGVWIVRHGLIELAVGSRRRRAVVNIL
+ HPGDVDGDIPLLLEMPMVYTGRALTQATCLFLDRQAFERLLATHPAIARRWLSSVAQR
+ VSTAQIRLMGMLGRPLPAQVAQLLLDEAIDARIELAQRTLAAMLGAQRPSINKILKEF
+ ERDRLITVGYAVIEITDQHGLRARAQ"
+ gene 1890852..1891556
+ /locus_tag="BQ2027_MB1703"
+ CDS 1890852..1891556
+ /locus_tag="BQ2027_MB1703"
+ /note="Mb1703, -, len: 234 aa. Equivalent to Rv1676, len:
+ 234 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 234 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1703 detected using
+ shotgun mass spectrometry. Mb1703 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Peroxiredoxin"
+ /protein_id="SIU00306.1"
+ /db_xref="GOA:A0A1R3XZC9"
+ /db_xref="InterPro:IPR000866"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZC9"
+ /translation="MACPEWEISRSKRTRKPVLRPRHSVSTLTNRFLAEFCHRYGIGV
+ PTRLARGATVPTRRLQDINDQPVDVPAATGRTHLQFRRFAACPICHLHLRSFANRHQE
+ VADSGITEVVFFHSAADALRGYQSLLPFAVIADPDRVQYREFGVEKSLGAITHPRALW
+ AAVRGSAAMLHRNDPERAGVGFGDGTTHLGLPADFLLDADGTVAAVHYGRHADDQWSV
+ DQLIDINRSLGGKGTQ"
+ gene 1891553..1892101
+ /gene="dsbF"
+ /locus_tag="BQ2027_MB1704"
+ CDS 1891553..1892101
+ /gene="dsbF"
+ /locus_tag="BQ2027_MB1704"
+ /note="Mb1704, dsbF, len: 182 aa. Equivalent to Rv1677,
+ len: 182 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 182 aa overlap). Probable dsbF,
+ conserved lipoprotein possibly involved in thiol:disulfide
+ interchange. Highly similar to C-terminus of
+ Z74024|MTCY274.09 mpt53 soluble secreted antigen precursor
+ from Mycobacterium tuberculosis (173 aa), FASTA scores:
+ opt: 482, E(): 3.6e-23, (52.8% identity in 142 aa overlap)
+ . Also some similarity to P52237|TIPB_PSEFL
+ THIOL:DISULFIDE INTERCHANGE PROTEIN TIPB PRECURSOR from
+ Pseudomonas fluorescens (178 aa), FASTA scores: opt: 190,
+ E(): 4.4e-05, (28.5% identity in 151 aa overlap); and
+ P33926|DSBE_ECOLI THIOL:DISULFIDE INTERCHANGE PROTEIN from
+ Escherichia coli (185 aa), FASTA scores: opt: 194, E():
+ 2.6e-05, (29.1% identity in 175 aa overlap). Contains
+ PS00013 Prokaryotic membrane lipoprotein lipid attachment
+ site and PS00194 Thioredoxin family active site. Protein
+ product from Mb1704 detected using shotgun mass
+ spectrometry. Mb1704 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN DSBF"
+ /protein_id="SIU00307.1"
+ /db_xref="GOA:A0A1R3XZ07"
+ /db_xref="InterPro:IPR000866"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR017937"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ07"
+ /translation="MTHSRLIGALTVVAIIVTACGSQPKSQPAVAPTGDAAAATQVPA
+ GQTVPAQLQFSAKTLDGHDFHGESLLGKPAVLWFWAPWCPTCQGEAPVVGQVAASHPE
+ VTFVGVAGLDQVPAMQEFVNKYPVKTFTQLADTDGSVWANFGVTQQPAYAFVDPHGNV
+ DVVRGRMSQDELTRRVTALTSR"
+ gene 1892202..1893104
+ /locus_tag="BQ2027_MB1705"
+ CDS 1892202..1893104
+ /locus_tag="BQ2027_MB1705"
+ /note="Mb1705, -, len: 300 aa. Equivalent to Rv1678, len:
+ 300 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 300 aa overlap). Probable integral
+ membrane protein. Protein product from Mb1705 detected
+ using SWATH mass spectrometry. Mb1705 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable integral membrane protein"
+ /protein_id="SIU00308.1"
+ /db_xref="GOA:A0A1R3XZ23"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ23"
+ /translation="MARVRRGTELLLSPQSPPATGGLIVLTGLRLLAGLIWLYNVVWK
+ VPPDFGERGRRDLYHFTHLAVEHPVFTPFSWVIEHAVLPYFTAFGWGVLFAESALAVL
+ LLTGTAVRLAALIGIGQSVAIGLSVAESPGEWPWAYAMLLGIHVVLLFTCSTRYAAVD
+ AVRAAATGSAARTAAQRLLAGWGIVLGLIGLVAVWRGLGDDRPAYVGIRALEFSLGEY
+ NLRGALALIAIALAMLAAAKRGWRTVALVAAVVAVAAAAAIYLQVGRTAVWLGGTNTT
+ AAVFVCAAVVSLATEFRIGRVEGA"
+ gene 1893104..1894225
+ /gene="fadE16"
+ /locus_tag="BQ2027_MB1706"
+ CDS 1893104..1894225
+ /gene="fadE16"
+ /locus_tag="BQ2027_MB1706"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1706, fadE16, len: 373 aa. Equivalent to Rv1679,
+ len: 373 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 373 aa overlap). Possible fadE16,
+ acyl-CoA dehydrogenase (EC 1.3.99.-), similar to
+ acyl/butyryl-CoA dehydrogenases e.g. NP_244665.1|NC_002570
+ acyl-CoA dehydrogenase from Bacillus halodurans (380 aa);
+ NP_000008.1|NM_000017 acyl-Coenzyme A dehydrogenase from
+ Homo sapiens (412 aa); Z99113|BSUB0010_119 from Bacillus
+ subtilis (380 aa), FASTA scores: opt: 439, E(): 3.4e-20,
+ (29.6% identity in 287 aa overlap); etc. Weakly similar to
+ many dehydrogenases and to P31571|CAIA_ECOLI probable
+ carnitine operon oxidoreductase from Escherichia coli (380
+ aa), FASTA scores: opt: 109, E(): 0.0066, (28.6% identity
+ in 98 aa overlap). Protein product from Mb1706 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1706 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ACYL-COA DEHYDROGENASE FADE16"
+ /protein_id="SIU00309.1"
+ /db_xref="GOA:A0A1R3XZ09"
+ /db_xref="InterPro:IPR006091"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR013786"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR037069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ09"
+ /translation="MATPGVVQEVVSVAAEHAERVDTDCAFPAEAVDALRKTGLLGLV
+ LPREIGGMGSGPVEFTEVVAQLSAACGSTAMIYLMHMAAAVTVAASPPPGLPDLLADM
+ ASGKQLGTLAFSEPGSRSHFWAPVSTASADGDGIAVRADKSWVTSAGFADVYVVSVGS
+ ADGAAGDVDLYAVPADTPGLRVAGTFTGMGLRGNASAPMAVDIRIPDSYRLGEAGGGF
+ GIMMQTVLPWFNLGNAAVSLGLATAATGAAVKHVGTARLEHLGGSLAELPTIRAQIAR
+ MGTTLAAQKAYLEVAANSVSSPDDTTLTHVLGVKASVNDAALTITESAMRVCGGAAFS
+ KHLPIERAFRDARAGSVMAPTADALYDFYGRAVTGLPLF"
+ gene 1894234..1895058
+ /locus_tag="BQ2027_MB1707"
+ CDS 1894234..1895058
+ /locus_tag="BQ2027_MB1707"
+ /note="Mb1707, -, len: 274 aa. Equivalent to Rv1680, len:
+ 274 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 274 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1707 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1707 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ABC transporter, substrate-binding protein
+ (cluster 12, methionine/phosphonates)"
+ /protein_id="SIU00310.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ13"
+ /translation="MSTEPLVVGAVAYTPNVVPIWEGIRGYFQDSESPDTQMDFVLYS
+ NYARLVDSLIAGHIDIAWNTNLAYVRTVLQTGGRCTPLAQRDTDVDYTTVFVAHAGSD
+ LHGAKDIAGKRLALGSADSAHAAILPLYYLRRAGIAESDLQVIRFDTDIGKHGDTGRS
+ ELDAVDAVLAGEADVAAIGSSTWAAMGAAELMGESLTEVWRTDGYCHCMFTALDTLPA
+ ERYQPWLDRLLGMSWDDSEHRKILELEGLRRWVPPHLDGYKPLFEAVQEQGIDPRW"
+ gene 1895055..1896047
+ /gene="moeX"
+ /locus_tag="BQ2027_MB1708"
+ CDS 1895055..1896047
+ /gene="moeX"
+ /locus_tag="BQ2027_MB1708"
+ /note="Mb1708, moeX, len: 330 aa. Equivalent to Rv1681,
+ len: 330 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 330 aa overlap). Possible moeX,
+ Molybdopterin biosynthesis protein, has weak similarity to
+ MOAA_ECOLI|P30745 molybdenum cofactor biosynthesis protein
+ (329 aa), FASTA scores: opt: 162, E(): 0.00081, (27.7%
+ identity in 224 aa overlap) and to Rv3109|MTCY164.19 MoaA
+ from Mycobacterium tuberculosis (28.5% identity in 165 aa
+ overlap). Mb1708 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MOLYBDOPTERIN BIOSYNTHESIS PROTEIN
+ MOEX"
+ /protein_id="SIU00311.1"
+ /db_xref="GOA:A0A1R3XYY9"
+ /db_xref="InterPro:IPR007197"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYY9"
+ /translation="MIIELMRRVVGLAQGATAEVAVYGDRDRDLAERWCANTGNTLVR
+ ADVDQTGVGTLVVRRGHPPDPASVLGPDRLPGVRLWLYTNFHCNLCCDYCCVSSSPST
+ PHRELGAERIGRIVGEAARWGVRELFLTGGEPFLLPDIDTIIATCVKQLPTTVLTNGM
+ VFKGRGRRALESLPRGLALQISLDSATPELHDAHRGAGTWVKAVAGIRLALSLGFRVR
+ VAATVASPAPGELTAFHDFLDGLGIAPGDQLVRPIALEGAASQGVALTRESLVPEVTV
+ TADGVYWHPVAATDERALVTRTVEPLTPALDMVSRLFAEQWTRAAEEAALFPCA"
+ gene 1896208..1897125
+ /locus_tag="BQ2027_MB1709"
+ CDS 1896208..1897125
+ /locus_tag="BQ2027_MB1709"
+ /note="Mb1709, -, len: 305 aa. Equivalent to Rv1682, len:
+ 305 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 305 aa overlap). Probable coiled-coil
+ structural protein, weakly similar to many paramyosins,
+ kinesins and plectins e.g. MYSP_ONCVO|Q02171 paramyosin
+ from onchocerca volvulus (879 aa), fasta scores: opt: 180,
+ E():2.6e-08, (24.4% identity in 234 aa overlap). Also
+ similar to Mycobacterium tuberculosis hypothetical
+ coiled-coil proteins (wag31 antigen 84) Rv2145c and
+ Rv2927c. Mb1709 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable coiled-coil structural protein"
+ /protein_id="SIU00312.1"
+ /db_xref="InterPro:IPR007793"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ06"
+ /translation="MLPQRPNCTKLFRPRRGVSERYRVTTAHNGSAPRFQRTRSGYDP
+ VAVNHYIAELVLRQQAQHCEIETLKAEIASLKDENAALKDTSPSAQAVTDRMAKMLRL
+ AVDEVFQMQSEARAEAATLVSAARDEAEAVRTQKREMLADMNARQRALESEHADVMRR
+ AREEAEQLVAQATAEVERMRVIDARRREKAEQELDAEIIRLRTDAQFQIDDQLQATQQ
+ ECEKRLGEAKIEADRRLHVADEQIEHGLSEARRTLEEISQRRVGILEQLARIHAQLEN
+ IPALLESARHSETEPLQSINGAVAELRAI"
+ gene 1897343..1900342
+ /locus_tag="BQ2027_MB1710"
+ CDS 1897343..1900342
+ /locus_tag="BQ2027_MB1710"
+ /note="Mb1710, -, len: 999 aa. Equivalent to Rv1683, len:
+ 999 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 999 aa overlap). Possible long-chain
+ acyl-CoA synthase. Equivalent to Z95117|MLCB1351_21
+ possible long-chain acyl-CoA synthase from Mycobacterium
+ leprae (1002 aa) (85.6% identity in 1002 aa overlap).
+ Weakly similar to FATP_MOUSE|Q60714 long-chain fatty acid
+ transport protein (646 aa), fasta scores: opt: 331, E():
+ 5e-08, (24.8% identity in 630 aa overlap). Also similar to
+ O35488|AF033031 Mouse VERY-LONG-CHAIN ACYL-COA SYNTHETASE
+ (620 aa), fasta scores: opt: 435, E(): 2.2e-12, (24.8%
+ identity in 545 aa overlap). Weakly similar to M.
+ tuberculosis protein MTCI364.18 (27.4% identity in 583 aa
+ overlap) . Contains PS00120 Lipases, serine active site.
+ Protein product from Mb1710 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1710 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible bifunctional enzyme; long-chain
+ acyl-coa synthase and lipase."
+ /protein_id="SIU00313.1"
+ /db_xref="GOA:A0A1R3Y153"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y153"
+ /translation="MVDLNFSMVTRPIERLVATAQNGLEVLRLGGLETGSVPSPSQIV
+ ESVPMYKLRRYFPPDNRPGQPPVGPPVLMVHPMMMSADMWDVTREDGAVGILHASGLD
+ PWVIDFGSPDEVEGGMRRNLADHIVALSEAVDTVKDATGHDVHFVGYSQGGMFCYQAA
+ AYRRSKDIASVVAFGSPVDTLAALPMGIPANMGAAVADFMADHVFNRLDIPSWMARMG
+ FQMMDPLKTAKARVDFVRQLHDREALLPREQQRRFLESEGWIAWSGPAISELLKQFIA
+ HNRMMTGGFAISGQMVTLTDITCPILAFVGEVDDIGQPASVRGIRRAAPNSEVYECLI
+ RAGHFGLVVGSRAAQQSWPTVADWVRWISGDGTKPENIHLMADQPAEHTDSGVAFSSR
+ VAHGIGEVSEAALALARGAADAVVAANRSVRTLAVETVRTLPRLARLGQLNDHTRISL
+ GRIIDEQAHDAPKGEFLLFDGRVHTYEAVNRRINNVVRGLIAVGVRQGDRVGVLMETR
+ PSALVAIAALSRLGAVAVVMRPDTDLSASVRLGRVTEILTDPTNLDAARQLPGQVLVL
+ GGGESRDLDLPADALEQGQVIDMEKIDPDAVELPAWYRPNPGLARDLAFIAFSSADGD
+ LVAKQITNYRWAVSAFGTASTAALGRRDTVYCLTPLHHESALLVSLGGAVVGGTRIAL
+ SRGLRPDRFVAEVRQYGVTVVSYTWAMLRDVVDDPAFVLHGNHPVRLFIGSGMPTGLW
+ ERVVEAFAPAHVVEFFATTDGQAVLANVAGAKIGSKGRPLPGAGRVELGAYDAEHDLI
+ LENDRGFVQVAGVNQVGVLLAQSRGPIDPTASVKRGVFAPADTWISTDYLFWRDDDGD
+ YWLAGGRGSVVRTARGMVYTEPVTNALGLITGVDLAVTYGVLVRGRHVAVSAVTLLPG
+ ATITAADLTEAVASMPVGLGPDIVHVVPQLTLSGTYRPTVSALRANGIPKAGRQAWYF
+ NSGGNEYRRLTPAVRTELTGQHRRGNA"
+ gene 1900335..1900559
+ /locus_tag="BQ2027_MB1710A"
+ CDS 1900335..1900559
+ /locus_tag="BQ2027_MB1710A"
+ /note="Mb1710A, -, len: 74 aa. Equivalent to Rv1684, len:
+ 74 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 74 aa overlap). Conserved hypothetical
+ protein, similar to P75844|YCAR_ECOLI Protein YCAR from
+ Escherichia coli (60 aa), FASTA scores: opt: 108, E():
+ 0.00022, (39.0% identity in 59 aa overlap). Protein
+ product from Mb1710A detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1710A found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG002473: Protein YcaR in KDO2-Lipid A
+ biosynthesis cluster"
+ /protein_id="SIU00314.1"
+ /db_xref="InterPro:IPR005651"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZV4"
+ /translation="MLDEALLAILVCPADRGPLVLVEDGDIQVLYNPRLRRAYRIEDG
+ IPVLLVDEAREVDEDEHARLMARGRPAAPQ"
+ gene complement(1900525..1901148)
+ /locus_tag="BQ2027_MB1711C"
+ CDS complement(1900525..1901148)
+ /locus_tag="BQ2027_MB1711C"
+ /note="Mb1711c, -, len: 207 aa. Equivalent to Rv1685c,
+ len: 207 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 207 aa overlap). Conserved hypothetical
+ protein, some similarity to other Mycobacterium
+ tuberculosis hypothetical regulatory proteins e.g.
+ Q10774|Rv1556|YF56_MYCTU (202 aa), FASTA scores: opt: 111,
+ E(): 1.7e-05, (24.1% identity in 195 aa overlap); and
+ P95215|Rv0258c|MTCY06A4.02c (151 aa) FASTA scores: (32.9%
+ identity in 140 aa overlap); also similar to
+ Q9X8G9|SCE7.13C|AL049819 putative Streptomyces coelicolor
+ transcriptional regulator (204 aa), FASTA scores: opt:
+ 480, E(): 6.4e-25, (40.4% identity in 203 aa overlap).
+ Protein product from Mb1711c detected using shotgun mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, AcrR family"
+ /protein_id="SIU00315.1"
+ /db_xref="GOA:A0A1R3XZ14"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="InterPro:IPR041678"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ14"
+ /translation="MAAPDNSRRRPGRPAGSSDTRERILSSARELFAHNGIDRTSIRA
+ VAAKAGVDAALVHHYFGTKQQLFAAAIHIPIDPMVIIGPIREAPVEELGYKLPSLLLP
+ IWDSELGAGLIATLRSLISGSDVGLARSFLEEVVTVELGSRVDNPPGTGKIRTQFVAS
+ QLMGVVMARYIVRIEPFASLPAEQIVQTIAPNLQRYLTGELPDDLAP"
+ gene complement(1901150..1901830)
+ /locus_tag="BQ2027_MB1712C"
+ CDS complement(1901150..1901830)
+ /locus_tag="BQ2027_MB1712C"
+ /note="Mb1712c, -, len: 226 aa. Equivalent to Rv1686c,
+ len: 226 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 226 aa overlap). Probable conserved
+ integral membrane protein ABC transporter (see citation
+ below), similar to AL049819|SCE7.05 putative integral
+ membrane protein from Streptomyces coelicolor (266 aa),
+ FASTA sacores: opt: 661, E(): 0, (45.1% identity in 226 aa
+ overlap); and Q53627|U43537 MEMBRANE PROTEIN INVOLVED IN
+ MITHRAMYCIN RESISTANCE from STREPTOMYCES ARGILLACEUS (233
+ aa), FASTA scores: opt: 222, E(): 5.4e-10, (28.7% identity
+ in 216 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN ABC
+ TRANSPORTER"
+ /protein_id="SIU00316.1"
+ /db_xref="GOA:A0A1R3XZE1"
+ /db_xref="InterPro:IPR000412"
+ /db_xref="InterPro:IPR004377"
+ /db_xref="InterPro:IPR013525"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZE1"
+ /translation="MILLVPILIITLMYFMFENFPHRPGTPSGFNTACLVLLGLFPLF
+ VMFVITAITMQRERASGTLERILTTPLRRLDLLAGYGTAFSIAAAAQATLACIVAFWF
+ LGFDTAGSPVWVFAIAIVNAVLGVGLGLLCSAFARTEFQAVQFIPLVMVPQLLLAGII
+ VPRALMPTWLEWISNVMPASYALEALQQVGAHPELTGIAVRDVVVVLSFAVASLCLAA
+ VTLRRRTS"
+ gene complement(1901902..1902669)
+ /locus_tag="BQ2027_MB1713C"
+ CDS complement(1901902..1902669)
+ /locus_tag="BQ2027_MB1713C"
+ /note="Mb1713c, -, len: 255 aa. Equivalent to Rv1687c,
+ len: 255 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 255 aa overlap). Probable conserved
+ ATP-binding protein ABC transporter (see citation below),
+ similar to many ABC-type transporters e.g.
+ P55476|NODI_RHISN nodulation ATP-binding protein I from
+ Rhizobium sp. (343 aa), FASTA scores: opt: 479, E():
+ 3.7e-23, (34.6% identity in 243 aa overlap); etc. Also
+ similar to many other Mycobacterium tuberculosis ABC-type
+ transporters e.g. MTCY19H9.04 (34.5% identity in 238 aa
+ overlap). Contains PS00211 ABC transporters family
+ signature and PS00017 ATP/GTP-binding site motif A
+ (P-loop). BELONGS TO THE ATP-BINDING TRANSPORT PROTEIN
+ FAMILY (ABC TRANSPORTERS). Also contains PS00039 DEAD-box
+ subfamily ATP-dependent helicases signature, though this
+ may be spurious. Protein product from Mb1713c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED ATP-BINDING PROTEIN ABC
+ TRANSPORTER"
+ /protein_id="SIU00317.1"
+ /db_xref="GOA:A0A1R3XZ19"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ19"
+ /translation="MMISSSDELLRDGADPAVIIDQLRVIRGKRLALQDVSVRVACGT
+ ITGLLGPSGSGKTTLIRCIVGSQIIASGSVSVLGQPAGSAELRHRVGYMPQDPTIYND
+ LRVIDNIRYFAELCGVDRQAADEVIEAVDLRDHRTARCANLSGGQRARVSLACALVGR
+ PDLLVLDEPTIGLDPVLRVELWDRFTALARRGTTLLVSSHVMDEADRCGDLLLLRQGQ
+ LLAHTTPHRLRKETGCTSLEEAFLSIVRRTTTVPAAG"
+ gene 1902728..1903339
+ /gene="mpg"
+ /locus_tag="BQ2027_MB1714"
+ CDS 1902728..1903339
+ /gene="mpg"
+ /locus_tag="BQ2027_MB1714"
+ /note="Mb1714, -, len: 203 aa. Equivalent to Rv1688, len:
+ 203 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 203 aa overlap). Possible
+ 3-methyladenine DNA glycosylase (EC 3.2.2.-), similar to
+ several eukaryotic 3-methylpurine DNA glycosylases and
+ 3-methyladenine DNA glycosylases e.g. Q39147|X76169
+ 3-METHYLADENINE GLYCOSYLASE from Arabidobsis thaliana (254
+ aa), FASTA scores: opt: 297, E(): 8.3e-15, (31.8% identity
+ in 198 aa overlap) and P29372|3MG_HUMAN
+ dna-3-methyladenine glycosidase (298 aa), FASTA scores:
+ opt: 220, E(): 7.2e-05, (36.4% identity in 184 aa
+ overlap). BELONGS TO THE MPG FAMILY OF DNA GLYCOSYLASES.
+ Protein product from Mb1714 detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="possible 3-methyladenine dna glycosylase mpg"
+ /protein_id="SIU00318.1"
+ /db_xref="GOA:P65413"
+ /db_xref="InterPro:IPR003180"
+ /db_xref="InterPro:IPR011034"
+ /db_xref="InterPro:IPR036995"
+ /db_xref="UniProtKB/Swiss-Prot:P65413"
+ /translation="MNAEELAIDPVAAAHRLLGATIAGRGVRAMVVEVEAYGGVPDGP
+ WPDAAAHSYRGRNGRNDVMFGPPGRLYTYRSHGIHVCANVACGPDGTAAAVLLRAAAI
+ EDGAELATSRRGQTVRAVALARGPGNLCAALGITMADNGIDLFDPSSPVRLRLNDTHR
+ ARSGPRVGVSQAADRPWRLWLTGRPEVSAYRRSSRAPARGASD"
+ gene 1903351..1904625
+ /gene="tyrS"
+ /locus_tag="BQ2027_MB1715"
+ CDS 1903351..1904625
+ /gene="tyrS"
+ /locus_tag="BQ2027_MB1715"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1715, tyrS, len: 424 aa. Equivalent to Rv1689,
+ len: 424 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 424 aa overlap). Probable tyrS,
+ Tyrosyl-tRNA synthase (EC 6.1.1.1), highly similar to many
+ e.g. SYY_ECOLI|P00951 Escherichia coli (EC 6.1.1.1) (423
+ aa), FASTA scores: opt: 1271, E(): 0, (47.3% identity in
+ 419 aa overlap). Contains PS00178 Aminoacyl-transfer RNA
+ synthetases class-I signature. BELONGS TO CLASS-I
+ AMINOACYL-TRNA SYNTHETASE FAMILY. Protein product from
+ Mb1715 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1715 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Tyrosyl-tRNA synthase tyrS (TYRRS)"
+ /protein_id="SIU00319.1"
+ /db_xref="GOA:P67612"
+ /db_xref="InterPro:IPR001412"
+ /db_xref="InterPro:IPR002305"
+ /db_xref="InterPro:IPR002307"
+ /db_xref="InterPro:IPR002942"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="InterPro:IPR024088"
+ /db_xref="InterPro:IPR024107"
+ /db_xref="InterPro:IPR036986"
+ /db_xref="UniProtKB/Swiss-Prot:P67612"
+ /translation="MSGMILDELSWRGLIAQSTDLDTLAAEAQRGPMTVYAGFDPTAP
+ SLHAGHLVPLLTLRRFQRAGHRPIVLAGGATGMIGDPRDVGERSLNEADTVAEWTERI
+ RGQLERFVDFDDSPMGAIVENNLEWTGSLSAIEFLRDIGKHFSVNVMLARDTIRRRLA
+ GEGISYTEFSYLLLQANDYVELHRRHGCTLQIGGADQWGNIIAGVRLVRQKLGATVHA
+ LTVPLVTAADGTKFGKSTGGGSLWLDPQMTSPYAWYQYFVNTADADVIRYLRWFTFLS
+ ADELAELEQATAQRPQQRAAQRRLASELTVLVHGEAATAAVEHASRALFGRGELARLD
+ EATLAAALRETTVAELKPGSPDGIVDLLVASGLSASKGAARRTIHEGGVSVNNIRVDN
+ EEWVPQSSDFLHGRWLVLRRGKRSIAGVERIG"
+ gene 1905242..1905661
+ /gene="lprJ"
+ /locus_tag="BQ2027_MB1716"
+ CDS 1905242..1905661
+ /gene="lprJ"
+ /locus_tag="BQ2027_MB1716"
+ /note="Mb1716, lprJ, len: 139 aa. Equivalent to Rv1690,
+ len: 127 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 124 aa overlap). Probable lprJ,
+ lipoprotein, contains possible signal sequence and PS00013
+ Prokaryotic membrane lipoprotein lipid attachment site.
+ Weakly similar to other Mycobacterium tuberculosis
+ hypothetical proteins with conserved cysteines e.g.
+ Rv1804c, Rv1810, Rv3354, etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a 2
+ bp insertion (*-ac) at the 5' end, leads to a longer
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (139 aa versus 127 aa). Mb1716
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPOPROTEIN LPRJ"
+ /protein_id="SIU00320.1"
+ /db_xref="GOA:A0A1R3XZ22"
+ /db_xref="InterPro:IPR007969"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ22"
+ /translation="MTQVRQQREAGDDGTHTHDGTRTWRTGRQATTLLALLAGVFGGA
+ ASCAAPIQADMMGNAFLTALTNAGIAYDQPATTVALGRSVCPMVVAPGGTFESITSRM
+ AEINGMSRDMASTFTIVAIGTYCPAVIAPLMPNRLQA"
+ gene 1905700..1906452
+ /locus_tag="BQ2027_MB1717"
+ CDS 1905700..1906452
+ /locus_tag="BQ2027_MB1717"
+ /note="Mb1717, -, len: 250 aa. Equivalent to Rv1691, len:
+ 250 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 250 aa overlap). Conserved hypothetical
+ protein, similar to Q9S210|SCI51.30C|AL109848 Hypothetical
+ protein from Streptomyces coelicolor (210 aa), FASTA
+ score: opt: 556, E(): 6.4e-27, (50.6% identity in 180 aa
+ overlap). Protein product from Mb1717 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1717 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="TPR-repeat-containing protein"
+ /protein_id="SIU00321.1"
+ /db_xref="InterPro:IPR011990"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XYZ9"
+ /translation="MVDDRQGRRGGRRPRSAAADNRPAFRDGPAIPPGIHARQLAPEI
+ RRELSTLDRATADAVACHLVAAGELIDDDPEAALRHARAARVRASRIAAVREAVGIAA
+ YRCGDWAQALAELRAARRMGSKSPLLALIADCERGLGRPQRAIELARGSEAVELSGDA
+ ADELRIVAAGARADLGQLEQALTVLSTPQLDPGRTGSTAARLFYAYAEILLALGRGDE
+ ALQWFLRSAAADIDGVTDAEDRVDELGAREQK"
+ gene 1906449..1907510
+ /locus_tag="BQ2027_MB1718"
+ CDS 1906449..1907510
+ /locus_tag="BQ2027_MB1718"
+ /note="Mb1718, -, len: 353 aa. Equivalent to Rv1692, len:
+ 353 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 353 aa overlap). Probable phosphatase
+ (EC 3.1.-.-), some similarity to others e.g.
+ PNPP_SCHPO|Q00472 4-nitrophenylphosphatase (269 aa), FASTA
+ scores: opt: 214, E(): 1.3e-10, (29.5% identity in 241 aa
+ overlap); and to NAGD_ECOLI|P15302 nagd protein from
+ Escherichia coli (250 aa), FASTA scores: opt: 314, E():
+ 9.8e-08, (28.2% identity in 245 aa overlap). Also similar
+ to AL109848|SCI51.28 hypothetical protein from
+ Streptomyces coelicolor (343 aa), FASTA scores: opt: 768,
+ E(): 0, (44.8% identity in 315 aa overlap). Protein
+ product from Mb1718 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1718 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHATASE"
+ /protein_id="SIU00322.1"
+ /db_xref="InterPro:IPR006357"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="InterPro:IPR041065"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ15"
+ /translation="MKSIAQEHDCLLIDLDGTVFCGRQPTGGAVQSLSQVRSRKLFVT
+ NNASRSADEVAAHLCELGFTATGEDVVTSAQSAAHLLAGQLAPGARVLIVGTEALANE
+ VAAVGLRPVRRFEDRPDAVVQGLSMTTGWSDLAEAALAIRAGALWVAANVDPTLPTER
+ GLLPGNGSMVAALRTATGMDPRVAGKPAPALMTEAVARGDFRAALVVGDRLDTDIEGA
+ NAAGLPSLMVLTGVNSAWDAVYAEPVRRPTYIGHDLRSLHQDSKLLAVAPQPGWQIDV
+ GGGAVTVCANGDVDDLEFIDDGLSIVRAVASAVWEARAADLHQRPLRIEAGDERARAA
+ LQRWSLMRSDHPVTSVGTQ"
+ gene 1907507..1907683
+ /locus_tag="BQ2027_MB1719"
+ CDS 1907507..1907683
+ /locus_tag="BQ2027_MB1719"
+ /note="Mb1719, -, len: 58 aa. Equivalent to Rv1693, len:
+ 58 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 58 aa overlap). Conserved hypothetical
+ protein, shows some similarity to AL583921 hypothetical
+ protein from Mycobacterium leprae (61 aa). Probable
+ coiled-coil from aa 30 to 58. Protein product from Mb1719
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1719 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00323.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y163"
+ /translation="MTIDPDQIRAEIDALLASLPDPADAENGPSLAELEGIARRLSEA
+ HEVLLAALESAEKG"
+ gene 1907691..1908497
+ /gene="tlyA"
+ /locus_tag="BQ2027_MB1720"
+ CDS 1907691..1908497
+ /gene="tlyA"
+ /locus_tag="BQ2027_MB1720"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1720, tlyA, len: 268 aa. Equivalent to Rv1694,
+ len: 268 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 268 aa overlap). tlyA,
+ cytotoxin/haemolysin homologue (see citations below),
+ almost identical to NP_301968.1|NC_002677
+ cytotoxin/haemolysin homologue TlyA from Mycobacterium
+ leprae (269 aa). TlyA homologues were also identified by
+ PCR in M. avium, M. bovis BCG, but appeared absent in M.
+ smegmatis, M. vaccae, M. kansasii, M. chelonae and M.
+ phlei (see first citation below). Also highly similar to
+ CAB83047.1|AJ271681 putative haemolysin from Mycobacterium
+ ulcerans (281 aa); and similar to HLYA_TREHY|Q06803
+ pore-forming haemolysin/cytotoxin virulence determinant
+ from Treponema hyodysenteriae (240 aa), FASTA scores: opt:
+ 514, E():3e-30, (37.3% identity in 236 aa overlap). Mb1720
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="2'-o-methyltransferase tlya"
+ /protein_id="SIU00324.1"
+ /db_xref="GOA:A0A1R3XZV6"
+ /db_xref="InterPro:IPR002877"
+ /db_xref="InterPro:IPR002942"
+ /db_xref="InterPro:IPR004538"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="InterPro:IPR036986"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZV6"
+ /translation="MARRARVDAELVRRGLARSRQQAAELIGAGKVRIDGLPAVKPAT
+ AVSDTTALTVVTDSERAWVSRGAHKLVGALEAFAIAVAGRRCLDAGASTGGFTEVLLD
+ RGAAHVVAADVGYGQLAWSLRNDPRVVVLERTNARGLTPEAIGGRVDLVVADLSFISL
+ ATVLPALVGCASRDADIVPLVKPQFEVGKGQVGPGGVVHDPQLRARSVLAVARRAQEL
+ GWHSVGVKASPLPGPSGNVEYFLWLRTQTDRALSAKGLEDAVHRAISEGP"
+ gene 1908497..1909420
+ /gene="ppnK"
+ /locus_tag="BQ2027_MB1721"
+ CDS 1908497..1909420
+ /gene="ppnK"
+ /locus_tag="BQ2027_MB1721"
+ /note="Mb1721, ppnK, len: 307 aa. Equivalent to Rv1695,
+ len: 307 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 307 aa overlap). Probable ppnK,
+ inorganic polyphosphate/ATP-NAD kinase (EC 2.7.1.23),
+ equivalent to Q49897|MLC1351.13C|Z95117|PPNK_MYCLE
+ INORGANIC POLYPHOSPHATE/ATP-NAD KINASE from Mycobacterium
+ leprae (311 aa) (87.9% identity in 305 aa overlap). Also
+ similar to many e.g. P37768|PPNK_ECOLI PROBABLE INORGANIC
+ POLYPHOSPHATE/ATP-NAD KINASE (292 aa), FASTA scores: opt:
+ 384, E(): 1.7e-23, (33.5% identity in 233 aa overlap);
+ etc. BELONGS TO THE NAD KINASE FAMILY. Protein product
+ from Mb1721 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1721 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="inorganic polyphosphate/atp-nad kinase ppnk
+ (poly(p)/atp nad kinase)"
+ /protein_id="SIU00325.1"
+ /db_xref="GOA:P0A5S7"
+ /db_xref="InterPro:IPR002504"
+ /db_xref="InterPro:IPR016064"
+ /db_xref="InterPro:IPR017437"
+ /db_xref="InterPro:IPR017438"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5S7"
+ /translation="MTAHRSVLLVVHTGRDEATETARRVEKVLGDNKIALRVLSAEAV
+ DRGSLHLAPDDMRAMGVEIEVVDADQHAADGCELVLVLGGDGTFLRAAELARNASIPV
+ LGVNLGRIGFLAEAEAEAIDAVLEHVVAQDYRVEDRLTLDVVVRQGGRIVNRGWALNE
+ VSLEKGPRLGVLGVVVEIDGRPVSAFGCDGVLVSTPTGSTAYAFSAGGPVLWPDLEAI
+ LVVPNNAHALFGRPMVTSPEATIAIEIEADGHDALVFCDGRREMLIPAGSRLEVTRCV
+ TSVKWARLDSAPFTDRLVRKFRLPVTGWRGK"
+ gene 1909434..1911197
+ /gene="recN"
+ /locus_tag="BQ2027_MB1722"
+ CDS 1909434..1911197
+ /gene="recN"
+ /locus_tag="BQ2027_MB1722"
+ /note="Mb1722, recN, len: 587 aa. Equivalent to Rv1696,
+ len: 587 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 587 aa overlap). Probable recN, DNA
+ repair protein, similar to many e.g. RECN_ECOLI|P05824 dna
+ repair protein recN (553 aa), FASTA scores: opt: 508, E():
+ 1.9e-33, (31.5% identity in 587 aa overlap). Equivalent to
+ Z95117|MLCB1351_12 recN from Mycobacterium leprae (587
+ aa), FASTA scores: (76.1% identit y in 589 aa overlap).
+ Contains PS00017 ATP/GTP-binding site motif A (P-loop).
+ Protein product from Mb1722 detected using SWATH mass
+ spectrometry. Mb1722 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable DNA repair protein recN (Recombination
+ protein N)"
+ /protein_id="SIU00326.1"
+ /db_xref="GOA:P0A5U7"
+ /db_xref="InterPro:IPR003395"
+ /db_xref="InterPro:IPR004604"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5U7"
+ /translation="MLTELRIESLGAISVATAEFDRGFTVLTGETGTGKTMVVTGLHL
+ LGGARADATRVRSGADRAVVEGRFTTTDLDDATVAGLQAVLDSSGAERDEDGSVIALR
+ SISRDGPSRAYLGGRGVPAKSLSGFTNELLTLHGQNDQLRLMRPDEQRGALDRFAAAG
+ EAVQRYRKLRDAWLTARRDLVDRRNRARELAQEADRLKFALNEIDTVDPQPGEDVALV
+ ADIARLSELDTLREAATTARATLCGTPDADAFDRGAVDSLGRARAALQSSDDAALRGL
+ AEQVGEALTVVVDAVAELGAYLDELPADASALDAKLARQAQLRTLTRKYAADIDGVLR
+ WADEARARLAQLDVSEEGLAALERRTGELAHELGQAAVDLSTIRRKAAKRLAKEVSAE
+ LSALAMADAEFTIGVTTELADHGDPVALALASGELARAGADGVDAVEFGFVAHRGMTV
+ LPLAKSASGGELSRVMLSLEVVLATSRKQAAGTTMVFDEIDAGVGGWAAVQIGRRLAR
+ LARTHQVIVVTHLPQVAAYADVHLMVQRTGRDGASGVRRLTSEDRVAELARMLAGLGD
+ SDSGRAHARELLETAQNDELT"
+ gene 1911293..1912474
+ /locus_tag="BQ2027_MB1723"
+ CDS 1911293..1912474
+ /locus_tag="BQ2027_MB1723"
+ /note="Mb1723, -, len: 393 aa. Equivalent to Rv1697, len:
+ 393 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 393 aa overlap). Conserved hypothetical
+ protein, highly similar to Q49895|MLC1351.11C|U00021
+ Hypothetical protein of Mycobacterium leprae from cosmid
+ L247 (430 aa), FASTA scores: opt: 2345, E(): 0, (90.6%
+ identity in 393 aa overlap). Protein product from Mb1723
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1723 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG005773: conserved membrane protein ML1361"
+ /protein_id="SIU00327.1"
+ /db_xref="GOA:A0A1R3XZ32"
+ /db_xref="InterPro:IPR022215"
+ /db_xref="InterPro:IPR036759"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ32"
+ /translation="MRMSALLSRNTSRPGLIGIARVDRNIDRLLRRVCPGDIVVLDVL
+ DLDRITADALVEAEIAAVVNASSSVSGRYPNLGPEVLVTNGVTLIDETGPEIFKKVKD
+ GAKVRLYEGGVYAGDRRLIRGTERTDHDIADLMREAKSGLVAHLEAFAGNTIEFIRSE
+ SPLLIDGIGIPDVDVDLRRRHVVIVADEPSGPDDLKSLKPFIKEYQPVLVGVGTGADV
+ LRKAGYRPQLIVGDPDQISTEVLKCGAQVVLPADADGHAPGLERIQDLGVGAMTFPAA
+ GSATDLALLLADHHGAALLVTAGHAANIETFFDRTRVQSNPSTFLTRLRVGEKLVDAK
+ AVATLYRNHISGGAIALLALTMLIAIIVALWVSRTDGVVLHWIIDYWNRFSLWVQHLV
+ S"
+ gene 1912496..1913440
+ /gene="mctb"
+ /locus_tag="BQ2027_MB1724"
+ CDS 1912496..1913440
+ /gene="mctb"
+ /locus_tag="BQ2027_MB1724"
+ /note="Mb1724, -, len: 314 aa. Equivalent to Rv1698, len:
+ 314 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 314 aa overlap). Conserved hypothetical
+ protein, possibly exported protein with potential
+ N-terminal signal sequence. Equivalent to
+ Q49894|MLC1351.10C|Z95117 Hypothetical protein from
+ Mycobacterium leprae (317 aa), FASTA scores: (77.0%
+ identity in 317 aa overlap). Probable coiled-coil from aa
+ 31 to 67. Protein product from Mb1724 detected using SWATH
+ mass spectrometry. Mb1724 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="outer membrane protein mctb"
+ /protein_id="SIU00328.1"
+ /db_xref="GOA:P64884"
+ /db_xref="InterPro:IPR021522"
+ /db_xref="UniProtKB/Swiss-Prot:P64884"
+ /translation="MISLRQHAVSLAAVFLALAMGVVLGSGFFSDTLLSSLRSEKRDL
+ YTQIDRLTDQRDALREKLSAADNFDIQVGSRIVHDALVGKSVVIFRTPDAHDDDIAAV
+ SKIVGQAGGAVTATVSLTQEFVEANSAEKLRSVVNSSILPAGSQLSTKLVDQGSQAGD
+ LLGIALLSNADPAAPTVEQAQRDTVLAALRETGFITYQPRDRIGTANATVVVTGGALS
+ TDAGNQGVSVARFAAALAPRGSGTLLAGRDGSANRPAAVAVTRADADMAAEISTVDDI
+ DAEPGRITVILALHDLINGGHVGHYGTGHGAMSVTVSQ"
+ gene 1913580..1915340
+ /gene="pyrG"
+ /locus_tag="BQ2027_MB1725"
+ CDS 1913580..1915340
+ /gene="pyrG"
+ /locus_tag="BQ2027_MB1725"
+ /note="Mb1725, pyrG, len: 586 aa. Equivalent to Rv1699,
+ len: 586 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 586 aa overlap). pyrG, CTP synthase (EC
+ 6.3.4.2) highly similar to many e.g. PYRG_ECOLI|P08398 ctp
+ synthase from Escherichia coli (544 aa), FASTA scores:
+ opt: 1786, E():0, (51.8% identity in 548 aa overlap).
+ Contains PS00442 Glutamine amidotransferases class-I
+ active site. Protein product from Mb1725 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1725 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable ctp synthase pyrg"
+ /protein_id="SIU00329.1"
+ /db_xref="GOA:P0A5U3"
+ /db_xref="InterPro:IPR004468"
+ /db_xref="InterPro:IPR017456"
+ /db_xref="InterPro:IPR017926"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR029062"
+ /db_xref="InterPro:IPR033828"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5U3"
+ /translation="MRKHPQTATKHLFVSGGVASSLGKGLTASSLGQLLTARGLHVTM
+ QKLDPYLNVDPGTMNPFQHGEVFVTEDGAETDLDVGHYERFLDRNLPGSANVTTGQVY
+ STVIAKERRGEYLGDTVQVIPHITDEIKRRILAMAQPDADGNRPDVVITEIGGTVGDI
+ ESQPFLEAARQVRHYLGREDVFFLHVSLVPYLAPSGELKTKPTQHSVAALRSIGITPD
+ ALILRCDRDVPEALKNKIALMCDVDIDGVISTPDAPSIYDIPKVLHREELDAFVVRRL
+ NLPFRDVDWTEWDDLLRRVHEPHETVRIALVGKYVELSDAYLSVAEALRAGGFKHRAK
+ VEICWVASDGCETTSGAAAALGDVHGVLIPGGFGIRGIEGKIGAIAYARARGLPVLGL
+ CLGLQCIVIEAARSVGLTNANSAEFDPDTPDPVIATMPDQEEIVAGEADLGGTMRLGS
+ YPAVLEPDSVVAQAYQTTQVSERHRHRYEVNNAYRDKIAESGLRFSGTSPDGHLVEFV
+ EYPPDRHPFVVGTQAHPELKSRPTRPHPLFVAFVGAAIDYKAGELLPVEIPEIPEHTP
+ NGSSHRDGVGQPLPEPASRG"
+ gene 1915333..1915956
+ /locus_tag="BQ2027_MB1726"
+ CDS 1915333..1915956
+ /locus_tag="BQ2027_MB1726"
+ /note="Mb1726, -, len: 207 aa. Equivalent to Rv1700, len:
+ 207 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 207 aa overlap). Conserved hypothetical
+ protein, equivalent to Q49891|MLC1351.08C|Z95117
+ Hypothetical protein from Mycobacterium leprae (177 aa),
+ FASTA scores: (66.7% identity in 171 aa overlap); also
+ similar to Q9S225|SCI51.15C|AL109848 Hypothetical protein
+ from Streptomyces coelicolor (211 aa), FASTA scores: opt:
+ 508, E(): 1.2e-27, (43.1% identity in 197 aa overlap);
+ similar to P54570|ADPP_BACSU ADP-RIBOSE PYROPHOSPHATASE
+ (EC 3.6.1.13) (185 aa), FASTA scores: opt: 313, E():
+ 1.1e-06, (42.7% identity in 124 aa overlap). Protein
+ product from Mb1726 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1726 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="nudix hydrolase"
+ /protein_id="SIU00330.1"
+ /db_xref="GOA:A0A1R3XZ31"
+ /db_xref="InterPro:IPR000086"
+ /db_xref="InterPro:IPR015797"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ31"
+ /translation="MAEHDFETISSETLHTGAIFALRRDQVRMPGGGIVTREVVEHLG
+ AVAIVAMDDNGNIPMVYQYRHTYGRRLWELPAGLLDVAGEPPHLTAARELREEVGLQA
+ STWQVLVDLDTAPGFSDESVRVYLATGLREVGRPEAHHEEADMTMGWYPIAEAARRVL
+ RGEIVNSIAIAGVLAVHAVTTGFAQPRPLDTEWIDRPTAFATRRAER"
+ gene 1915953..1916888
+ /locus_tag="BQ2027_MB1727"
+ CDS 1915953..1916888
+ /locus_tag="BQ2027_MB1727"
+ /note="Mb1727, -, len: 311 aa. Equivalent to Rv1701, len:
+ 311 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 311 aa overlap). Probable
+ integrase/recombinase, similar to many e.g.
+ XERD_ECOLI|P21891 integrase/recombinase xerd (298 aa),
+ FASTA scores: opt: 583, E(): 0, (41.8% identity in 311 aa
+ overlap). Also similar to other Mycobacterium tuberculosis
+ integrase/recombinase proteins RV2894c|MTCY274.25c (43.1%
+ identity in 304 aa overlap); and Rv2646|MTCY441.16 phiRv2
+ integrase (31.1% identity in 161 aa overlap). Equivalent
+ to Z95117|MLCB1351_7 from Mycobacterium leprae (316 aa)
+ (85.4% identity in 316 aa overlap). Protein product from
+ Mb1727 detected using SWATH mass spectrometry. Mb1727
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INTEGRASE/RECOMBINASE"
+ /protein_id="SIU00331.1"
+ /db_xref="GOA:P67637"
+ /db_xref="InterPro:IPR002104"
+ /db_xref="InterPro:IPR004107"
+ /db_xref="InterPro:IPR010998"
+ /db_xref="InterPro:IPR011010"
+ /db_xref="InterPro:IPR011932"
+ /db_xref="InterPro:IPR013762"
+ /db_xref="InterPro:IPR023009"
+ /db_xref="UniProtKB/Swiss-Prot:P67637"
+ /translation="MKTLALQLQGYLDHLTIERGVAANTLSSYRRDLRRYSKHLEERG
+ ITDLAKVGEHDVSEFLVALRRGDPDSGTAALSAVSAARALIAVRGLHRFAAAEGLAEL
+ DVARAVRPPTPSRRLPKSLTIDEVLSLLEGAGGDKPSDGPLTLRNRAVLELLYSTGAR
+ ISEAVGLDLDDIDTHARSVLLRGKGGKQRLVPVGRPAVHALDAYLVRGRPDLARRGRG
+ TAAIFLNARGGRLSRQSAWQVLQDAAERAGITAGVSPHMLRHSFATHLLEGGADVRVV
+ QELLGHASVTTTQIYTLVTVHALREVWAGAHPRAR"
+ repeat_region complement(1916962..1918340)
+ /note="REP-6, len: 1379 nt. Equivalent to REP, len: 1362
+ nt, from Mycobacterium tuberculosis strain H37RV, (65.3%
+ identity in 1364 nt overlap). REPI125, member of REP13E12
+ family."
+ /rpt_family="REP"
+ gene complement(1916962..1918326)
+ /locus_tag="BQ2027_MB1728C"
+ CDS complement(1916962..1918326)
+ /locus_tag="BQ2027_MB1728C"
+ /note="Mb1728c, -, len: 454 aa. Equivalent to Rv1702c,
+ len: 454 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 454 aa overlap). Conserved hypothetical
+ ORF in REP13E12 degenerate repeat. Similar to other
+ hypothetical proteins inside REP13E12 elements (often in
+ two parts) e.g. Rv0094c|Q50655|MTCY251.13c (317 aa), FASTA
+ scores: opt: 1284, E(): 0, (59.7% identity in 315 aa
+ overlap); and Rv1128c, Rv1945, Rv1148c, etc. Mb1728c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="13E12 repeat family protein"
+ /protein_id="SIU00332.1"
+ /db_xref="InterPro:IPR003615"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/Swiss-Prot:P64886"
+ /translation="MYSSSREEAVAAFDNLDTALNRVLKVSPDDLTIPECLAMLQRCE
+ KIRRRLPAAEHPFINKLADQTDQTELGGKLPFALAERLHISRGEASRRIHEAADLGPR
+ RTLTGQPLPPLLTATAAAQRAGHLGPAHVQVIRCFLHQLPHHVDLPTREKAEAELATL
+ GGRFRPDQLHKLATKLADCLNPDGNYNDTDRARRRSIILGNQGPDGMSAISGYLTPEA
+ RATVDAVLAKLAAPGMANPADDTPCLAGTPSQAAIEADTRSAGQRHHDGLLAALRALL
+ CSGELGQHNGLPAAIIVSTSLTELQSRAGHALTGGGTLLPMSDVIRLASHANHYLRIF
+ DHGRELALYHTKRLASPGQRIVLYAKDRGCSFPNCDVPGYLTEVHHVTDFAQCQETDI
+ NELTQGCGPHHQLATTGGWITRKRKDGTTEWLPPAHLDHGQPRTNSYFHPEKLLHDSD
+ EDDP"
+ gene complement(1918881..1919471)
+ /locus_tag="BQ2027_MB1729C"
+ CDS complement(1918881..1919471)
+ /locus_tag="BQ2027_MB1729C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1729c, -, len: 196 aa. Equivalent to Rv1703c,
+ len: 196 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 196 aa overlap). Probable
+ catechol-o-methyltransferase (EC 2.1.1.6), most similar to
+ COMT_HUMAN|P21964 soluble form of mammalian catechol
+ o-methyltransferase (271 aa), FASTA scores: opt: 405, E():
+ 7 .8e-29, (38.9% identity in 190 aa overlap). Also similar
+ to Mycobacterium tuberculosis hypothetical
+ methyltransferases Rv0187, Rv1220c. Protein product from
+ Mb1729c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1729c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable catechol-o-methyltransferase"
+ /protein_id="SIU00333.1"
+ /db_xref="GOA:A0A1R3Y172"
+ /db_xref="InterPro:IPR002935"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y172"
+ /translation="MLATIDKFAYEKSMLINVGDEKGTLLDAAVRRADPALALELGTY
+ LGYGALRIARAAPEARVYSVELAEANASNARRIWAHAGVDDRVVCVVGTIGDGGRTLD
+ ALTEHGFATGTLDFVFLDHDKKAYLPDLQSILDRGWLHPGSIVVADNVRVPGAPKYRA
+ YMRRQQGMSWNTIEHKTHLEYQTLVPDLVLESEYLG"
+ gene complement(1919536..1921206)
+ /gene="cycA"
+ /locus_tag="BQ2027_MB1730C"
+ CDS complement(1919536..1921206)
+ /gene="cycA"
+ /locus_tag="BQ2027_MB1730C"
+ /note="Mb1730c, cycA, len: 556 aa. Equivalent to Rv1704c,
+ len: 556 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 556 aa overlap). Probable cycA,
+ D-serine/D-alanine/glycine transporter, highly similar to
+ P39312|CYCA_ECOLI d-serine/d-alanine/glycine transporter
+ from Escherichia coli (470 aa), FASTA scores: opt: 1906,
+ E(): 0, (59.3% identity in 459 aa overlap); etc. Also
+ similar to other Mycobacterium tuberculosis amino-acid
+ permeases e.g. Rv2127, Rv0346c, etc. Contains PS00218
+ amino acid permeases signature. BELONGS TO THE AMINO ACID
+ PERMEASE FAMILY (APC FAMILY). Protein product from Mb1730c
+ detected using SWATH mass spectrometry. Mb1730c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE D-SERINE/ALANINE/GLYCINE TRANSPORTER
+ PROTEIN CYCA"
+ /protein_id="SIU00334.1"
+ /db_xref="GOA:A0A1R3XZW7"
+ /db_xref="InterPro:IPR002293"
+ /db_xref="InterPro:IPR004840"
+ /db_xref="InterPro:IPR004841"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZW7"
+ /translation="MPDDIAAADPTDTQPHLRRDLANRHIQLIAIGGAIGTGLFMGSG
+ RTISLAGPAVMVVYGIIGFFVFFVLRAMGELLLSNLNYKSFVDFAADLLGPAAGFFVG
+ WSYWFAWVVTGIADLVAITGYARFWWPGLPIWVPALVTVALILAVNLFSVRHFGELEF
+ WFALIKVAAIVCLIAVGAILVATNFVSPHGVHATIENLWNDNGFFPTGFLGVVSGFQI
+ AFFAYIGVELVGTAAAETADPRRTLPRAINAVPLRVAVFYIGALLAILAVVPWRQFAS
+ GESPFVTMFSLAGLAAAASVVNFVVVTAAASSANSGFFSTGRMLFGLADEGHAPAAFH
+ QLNRGGVPAPALLLTAPLLLTSIPLLYAGRSVIGAFTLVTTVSSLLFMFVWAMIIISY
+ LVYRRRHPQRHTDSVYKMPGGVVMCWAVLVFFAFVIWTLTTETETATALAWFPLWFVL
+ LAVGWLVTQRRQSRRSFGFHCQVVGVRQQLGRGMARLAMKIHARPKLRSAVVVEPVSA
+ GEPGARRSAKSVRKLASDDSQSAHCPVAVVGLADGGRDPQYHHDGPDR"
+ gene complement(1921247..1922404)
+ /gene="PPE22"
+ /locus_tag="BQ2027_MB1731C"
+ CDS complement(1921247..1922404)
+ /gene="PPE22"
+ /locus_tag="BQ2027_MB1731C"
+ /note="Mb1731c, PPE22, len: 385 aa. Equivalent to Rv1705c,
+ len: 385 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 385 aa overlap). Member of the M.
+ tuberculosis PPE family of glycine-rich proteins, similar
+ to many e.g. YX23_MYCTU|Q10813 hypothetical 41.1 kd
+ protein cy274.2 3 (404 aa), fasta scores: opt: 819, E():
+ 0, (46.2% identity in 413 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe22"
+ /protein_id="SIU00335.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ34"
+ /translation="MDFGALPPEVNSGRMYCGPGSAPMVAAASAWNGLAAELSVAAVG
+ YERVITTLQTEEWLGPASTLMVEAVAPYVAWMRATAIQAEQAASQARAAAAAYETAFA
+ AIVPPPLIAANRARLTSLVTHNVFGQNTASIAATEAQYAEMWAQDAMAMYGYAGSSAT
+ ATKVTPFAPPPNTTSPSAAATQLSAVAKAAGTSAGAAQSAIAELIAHLPNTLLGLTSP
+ LSSALTAAATPGWLEWFINWYLPISQLFYNTVGLPYFAIGIGNSLITSWRALGWIGPE
+ AAEAAAAAPAAVGAAVGGTGPVSAGLGNAATIGKLSVPPNWAGASPSLAPTVGSASAP
+ LVSDIVEQPEAGAAGNLLGGMPLAGSGTGTGGAGPRYGFRVTVMSRPPFAG"
+ gene complement(1922444..1923628)
+ /gene="PPE23"
+ /locus_tag="BQ2027_MB1732C"
+ CDS complement(1922444..1923628)
+ /gene="PPE23"
+ /locus_tag="BQ2027_MB1732C"
+ /note="Mb1732c, PPE23, len: 394 aa. Equivalent to Rv1706c,
+ len: 394 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 394 aa overlap). Member of the M.
+ tuberculosis PPE family of glycine-rich proteins, similar
+ to many e.g. YX23_MYCTU|Q10813 hypothetical 41.1 kd
+ protein cy274.23 (404 aa), fasta scores: opt: 841, E():
+ 3.9e-31, (46.8% identity in 408 aa overlap). Mb1732c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe23"
+ /protein_id="SIU00336.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZG1"
+ /translation="MTLDVPVNQGHVPPGSVACCLVGVTAVADGIAGHSLSNFGALPP
+ EINSGRMYSGPGSGPLMAAAAAWDGLAAELSSAATGYGAAISELTNMRWWSGPASDSM
+ VAAVLPFVGWLSTTATLAEQAAMQARAAAAAFEAAFAMTVPPPAIAANRTLLMTLVDT
+ NWFGQNTPAIATTESQYAEMWAQDAAAMYGYASAAAPATVLTPFAPPPQTTNATGLVG
+ HATAVAALRGQHSWAAAIPWSDIQKYWMMFLGALATAEGFIYDSGGLTLNALQFVGGM
+ LWSTALAEAGAAEAAAGAGGAAGWSAWSQLGAGPVAASATLAAKIGPMSVPPGWSAPP
+ ATPQAQTVARSIPGIRSAAEAAETSVLLRGAPTPGRSRAAHMGRRYGRRLTVMADRPN
+ VG"
+ gene complement(1924232..1924399)
+ /locus_tag="BQ2027_MB1733C"
+ CDS complement(1924232..1924399)
+ /locus_tag="BQ2027_MB1733C"
+ /note="Mb1733c, -, len: 55 aa. Equivalent to Rv1706A, len:
+ 55 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 55 aa overlap). Conserved hypothetical
+ protein, similar to part of several probable export
+ proteins e.g. Rv0783c|Z80226_28 from Mycobacterium
+ tuberculosis (540 aa), FASTA scores: opt: 125, E(): 0.011,
+ (52.85% identity in 53 aa overlap). Size difference
+ suggests possible gene fragment."
+ /codon_start=1
+ /transl_table=11
+ /product="Permeases of the major facilitator superfamily"
+ /protein_id="SIU00337.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ39"
+ /translation="MGSLAAFKLGWLLSAMAPNVVLLTAFRVPQGLTMLTVFATGQAG
+ QHRCRTFHVTP"
+ gene 1924632..1926092
+ /locus_tag="BQ2027_MB1734"
+ CDS 1924632..1926092
+ /locus_tag="BQ2027_MB1734"
+ /note="Mb1734, -, len: 486 aa. Equivalent to Rv1707, len:
+ 486 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 486 aa overlap). Probable conserved
+ transmembrane protein, possibly involved in transport of
+ sulfate, similar to several hypothetical proteins
+ belonging to the sulfate permease family e.g.
+ P40877|YCHM_ECOLI hypothetical 58.4 kd protein in pth-prsa
+ intergenic region from Escherichia coli (550 aa), FASTA
+ scores: opt: 486, E(): 0, (33.1% identity in 492 aa
+ overlap). Also similar to many other Mycobacterium
+ tuberculosis membrane proteins eg. Rv3273, Rv1739c. SEEMS
+ TO BELONG TO THE SULP FAMILY. Protein product from Mb1734
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1734 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00338.1"
+ /db_xref="GOA:A0A1R3XZ51"
+ /db_xref="InterPro:IPR001902"
+ /db_xref="InterPro:IPR002645"
+ /db_xref="InterPro:IPR011547"
+ /db_xref="InterPro:IPR036513"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ51"
+ /translation="MLQRIARELLSGVAVAIVALPLAIAFGITATGTSQGALIGLYGA
+ IFAGFFAAVFGGTPGQVTGPTGPITVVATATIAEHGLEGAFFAFILAGVFQILFGACR
+ LGSLIRYVPHPVISGFMGGIAILIIMTQLDQVRSSSLLVLVTVVLLLASGRFIKAIPP
+ SLLVLVLVSSVLPLAAPWLRDLRAGPVSINRTVDYIGEIPQAMPSFDFPQVANSTMLQ
+ VLLSAVAIALLGSLDSLLTSLVMDNIRGTRHRSNKELIGQGIGNIAAGLFGGLAGAGA
+ TVRSVVNVRNGGQTALSAATHSVVLFVFVAGLGAVVQYIPLAVLSGILILVAVGMFDW
+ HAMRKAHVSPRGDVIVMFTTMIITVVVDLTIAVMVGIALSLLVHRLRSRQRKAKVTQD
+ DTGTYRIDGPLSFLSVDGVFGSLRDGREDVSLDLQHVTYLDTSGAQALLYFIDHSEKD
+ GVAVSIKRIPPRLESQLTALADNEQRDKLRTVLESA"
+ gene 1926110..1927066
+ /locus_tag="BQ2027_MB1735"
+ CDS 1926110..1927066
+ /locus_tag="BQ2027_MB1735"
+ /note="Mb1735, -, len: 318 aa. Equivalent to Rv1708, len:
+ 318 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 318 aa overlap). Putative initiation
+ inhibitor protein, a soj-related protein probably involved
+ in cell process, highly similar to many sporulation
+ initiation inhibitor proteins soj e.g. P37522|SOJ_BACSU
+ Soj protein from Bacillus subtilis (253 aa), FASTA scores:
+ opt: 745, E(): 0, (46.0% identity in 248 aa overlap), and
+ more weakly to various repA/para/incC proteins from
+ various organisms e.g. Y4CK_RHISN|P55393 putative
+ replication protein A from Rhizobium sp. (407 aa), FASTA
+ scores: opt: 205, E(): 4e-13, (29.0% identity in 252 aa
+ overlap). Also similar to Mycobacterium tuberculosis
+ hyothetical proteins Rv3213c and Rv3918c. Protein product
+ from Mb1735 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1735 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE INITIATION INHIBITOR PROTEIN"
+ /protein_id="SIU00339.1"
+ /db_xref="InterPro:IPR025669"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ37"
+ /translation="MPAGLPGQASVAVRLSCDVPPDARHHEPRPGMTDHPDTGNGIGL
+ TGRPPRAIPDPTPRSSHGPAKVIAMCNQKGGVGKTTSTINLGAALGEYGRRVLLVDMD
+ PQGALSAGLGVPHYELDKTIHNVLVEPRVSIDDVLIHSRVKNMDLVPSNIDLSAAEIQ
+ LVNEVGREQTLARALYPVLDRYDYVLIDCQPSLGLLTVNGLACTDGVIIPTECEFFSL
+ RGLALLTDTVDKVRDRLNPKLDISGILITRYDPRTVNSREVMARVVERFGDLVFDTVI
+ TRTVRFPETSVAGEPITTWAPKSAGALAYRALARELIDRFGM"
+ gene 1927063..1927899
+ /gene="scpa"
+ /locus_tag="BQ2027_MB1736"
+ CDS 1927063..1927899
+ /gene="scpa"
+ /locus_tag="BQ2027_MB1736"
+ /note="Mb1736, -, len: 278 aa. Equivalent to Rv1709, len:
+ 278 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 278 aa overlap). Conserved hypothetical
+ protein, similar to others e.g. P35154|YPUG_BACSU from
+ Bacillus subtilis (251 aa), FASTA scores: opt: 271, E():
+ 8.2e-10, (27.0% identity in 248 aa overlap);
+ Q9S230|SCI51.10C|AL109848 from Streptomyces coelicolor
+ (264 aa), FASTA scores: opt: 855, E(): 0, (56.8% identity
+ in 257 aa overlap). Equivalent to
+ Q49888|MLC1351.05C|Z95117 from Mycobacterium leprae (268
+ aa), FASTA scores: (78.9% identity in 251 aa overlap).
+ Protein product from Mb1736 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1736 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible segregation and condensation protein
+ scpa"
+ /protein_id="SIU00340.1"
+ /db_xref="GOA:A0A1R3XZ42"
+ /db_xref="InterPro:IPR003768"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ42"
+ /translation="MNGLQNSLANGGTAPENGYSAGFRVRLTNFEGPFDLLLQLIFAH
+ QLDVTEVALHQVTDDFIAYTKAIGARLELEETTAFLVIAATLLDLKAARLLPAGQVDD
+ EEDLALLEVRDLLFARLLQYRAFKHVAEMFAELEATALRSYPRAVSLEDGFVGLLPEV
+ MLGVDAHRFAEIAAIALTPRPAPTVATEHLHELMVSVPEQAEHLLAMLKARGSGQWAS
+ FSELVADCTAPIEIVGRFLALLELYRTRAVAFEQSEPLGALQVSWTGDDAERSDEKER
+ RL"
+ gene 1927896..1928591
+ /gene="scpb"
+ /locus_tag="BQ2027_MB1737"
+ CDS 1927896..1928591
+ /gene="scpb"
+ /locus_tag="BQ2027_MB1737"
+ /note="Mb1737, -, len: 231 aa. Equivalent to Rv1710, len:
+ 231 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 231 aa overlap). Conserved hypothetical
+ protein, similar to several hypothetical proteins e.g.
+ P35155|YPUH_BACSU from Bacillus subtilis (197 aa), FASTA
+ scores: opt: 339, E(): 1.3e-09, (36.0% identity in 186 aa
+ overlap); Q9S231|SCI51.09C|AL109848 from Streptomyces
+ coelicolor (223 aa), FASTA scores: opt: 626, E(): 0,
+ (51.0% identity in 192 aa overlap). Equivalent to
+ O05669|MLC1351.04C|Z95117 Hypothetical protein from
+ Mycobacterium leprae (231 aa), FASTA scores: (77.9%
+ identity in 231 aa overlap). Protein product from Mb1737
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1737 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible segregation and condensation protein
+ scpb"
+ /protein_id="SIU00341.1"
+ /db_xref="GOA:A0A1R3XZ21"
+ /db_xref="InterPro:IPR005234"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ21"
+ /translation="MTEHMPEHDPSYGIPDIAEPAELDADELKRVLEALLLVIDTPVT
+ ADALAAATEQPVYRVAAKLQLMADELTGRDSGIDLRHTSEGWRMYTRARFAPYVEKLL
+ LDGARTKLTRAALETLAVVAYRQPVTRARVSAVRGVNVDAVMRTLLARGLITEVGTDA
+ DTGAVTFATTELFLERLGLTSLSELPDIAPLLPDVDTIDDLSESLDSEPRFIKLTGEL
+ ASEQTLSFDVDRD"
+ gene 1928588..1929352
+ /locus_tag="BQ2027_MB1738"
+ CDS 1928588..1929352
+ /locus_tag="BQ2027_MB1738"
+ /EC_number="5.4.99.22"
+ /note="Mb1738, -, len: 254 aa. Equivalent to Rv1711, len:
+ 254 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 254 aa overlap). Conserved hypothetical
+ protein, highly similar to a large family of hypothetical
+ proteins e.g. P37765|YCIL_ECOLI from Escherichia coli (291
+ aa), FASTA scores: opt: 496, E(): 1.1e-29, (41.6% identity
+ in 250 aa overlap); 9S232|SCI51.08C|AL109848 PUTATIVE
+ PSEUDOURIDINE SYNTHASE from Streptomyces coelicolor (371
+ aa), FASTA scores: opt: 818, E(): 0, (53.1% identity in
+ 245 aa overlap). Equivalent to O05668|MLCB1351.03C|Z95117
+ Hypothetical protein from Mycobacterium leprae (256 aa),
+ (80.5% identity in 256 aa overlap). Contains PS01149
+ Hypothetical yciL/yejD/yjbC family signature. Protein
+ product from Mb1738 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1738 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="LSU rRNA pseudouridine(2605) synthase (EC"
+ /protein_id="SIU00342.1"
+ /db_xref="GOA:P65843"
+ /db_xref="InterPro:IPR000748"
+ /db_xref="InterPro:IPR002942"
+ /db_xref="InterPro:IPR006145"
+ /db_xref="InterPro:IPR018496"
+ /db_xref="InterPro:IPR020103"
+ /db_xref="InterPro:IPR036986"
+ /db_xref="InterPro:IPR042092"
+ /db_xref="UniProtKB/Swiss-Prot:P65843"
+ /translation="MMAEPEESREPRGIRLQKVLSQAGIASRRAAEKMIVDGRVEVDG
+ HVVTELGTRVDPQVAVVRVDGARVVLDDSLVYLALNKPRGMHSTMSDDRGRPCIGDLI
+ ERKVRGTKKLFHVGRLDADTEGLMLLTNDGELAHRLMHPSHEVPKTYLATVTGSVPRG
+ LGRTLRAGIELDDGPAFVDDFAVVDAIPGKTLVRVTLHEGRNRIVRRLLAAAGFPVEA
+ LVRTDIGAVSLGKQRPGSVRALRSNEIGQLYQAVGL"
+ gene 1929349..1930041
+ /gene="cmk"
+ /locus_tag="BQ2027_MB1739"
+ CDS 1929349..1930041
+ /gene="cmk"
+ /locus_tag="BQ2027_MB1739"
+ /note="Mb1739, cmk, len: 230 aa. Equivalent to Rv1712,
+ len: 230 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 230 aa overlap). Probable cmk,
+ cytidylate kinase (EC 2.7.4.14), highly similar to many
+ e.g. KCY_ECOLI|P23863 cytidylate kinase from Escherichia
+ coli (227 aa), FASTA scores: opt: 534, E (): 0, (40.3%
+ identity in 221 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). Equivalent to
+ Z95117|MLCB1351_2 from Mycobacterium leprae (223 aa)
+ (73.5% identity in 226 aa overlap). BELONGS TO THE
+ CYTIDYLATE KINASE FAMILY, SUBFAMILY 1. Protein product
+ from Mb1739 detected using SWATH mass spectrometry. Mb1739
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="cytidylate kinase cmk (cmp kinase) (cytidine
+ monophosphate kinase) (ck)"
+ /protein_id="SIU00343.1"
+ /db_xref="GOA:P63804"
+ /db_xref="InterPro:IPR003136"
+ /db_xref="InterPro:IPR011994"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P63804"
+ /translation="MSRLSAAVVAIDGPAGTGKSSVSRRLARELGARFLDTGAMYRIV
+ TLAVLRAGADPSDIAAVETIASTVQMSLGYDPDGDSCYLAGEDVSVEIRGDAVTRAVS
+ AVSSVPAVRTRLVELQRTMAEGPGSIVVEGRDIGTVVFPDAPVKIFLTASAETRARRR
+ NAQNVAAGLADDYDGVLADVRRRDHLDSTRAVSPLQAAGDAVIVDTSDMTEAEVVAHL
+ LELVTRRSEAVR"
+ gene 1930038..1931429
+ /gene="engA"
+ /locus_tag="BQ2027_MB1740"
+ CDS 1930038..1931429
+ /gene="engA"
+ /locus_tag="BQ2027_MB1740"
+ /note="Mb1740, engA, len: 463 aa. Equivalent to Rv1713,
+ len: 463 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 463 aa overlap). Probable engA,
+ GTP-binding protein. Equivalent to
+ Q49884|MLCB1351.01|U00021_5 PROBABLE GTP-BINDING PROTEIN
+ ENGA from Mycobacterium leprae (461 aa), (88.6% identity
+ in 463 aa overlap). And similar to many e.g.
+ P50743|ENGA_BACSU PROBABLE GTP-BINDING PROTEIN ENGA from
+ Bacillus subtilus (436 aa), FASTA scores: opt: 1077, E():
+ 0, (40.6% identity in 434 aa overlap). Contains two
+ PS00017 ATP/GTP-binding site motif A (P-loop). BELONGS TO
+ THE ERA/TRME FAMILY OF GTP-BINDING PROTEINS. ENGA
+ SUBFAMILY. Protein product from Mb1740 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1740 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GTP-BINDING PROTEIN ENGA"
+ /protein_id="SIU00344.1"
+ /db_xref="GOA:P64058"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR005225"
+ /db_xref="InterPro:IPR006073"
+ /db_xref="InterPro:IPR015946"
+ /db_xref="InterPro:IPR016484"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR031166"
+ /db_xref="InterPro:IPR032859"
+ /db_xref="UniProtKB/Swiss-Prot:P64058"
+ /translation="MTQDGTWVDESDWQLDDSEIAESGAAPVVAVVGRPNVGKSTLVN
+ RILGRREAVVQDIPGVTRDRVCYDALWTGRRFVVQDTGGWEPNAKGLQRLVAEQASVA
+ MRTADAVILVVDAGVGATAADEAAARILLRSGKPVFLAANKVDSEKGESDAAALWSLG
+ LGEPHAISAMHGRGVADLLDGVLAALPEVGESASASGGPRRVALVGKPNVGKSSLLNK
+ LAGDQRSVVHEAAGTTVDPVDSLIELGGDVWRFVDTAGLRRKVGQASGHEFYASVRTH
+ AAIDSAEVAIVLIDASQPLTEQDLRVISMVIEAGRALVLAYNKWDLVDEDRRELLQRE
+ IDRELVQVRWAQRVNISAKTGRAVHKLVPAMEDALASWDTRIATGPLNTWLTEVTAAT
+ PPPVRGGKQPRILFATQATARPPTFVLFTTGFLEAGYRRFLERRLRETFGFDGSPIRV
+ NVRVREKRAGKRR"
+ gene 1931603..1932415
+ /locus_tag="BQ2027_MB1741"
+ CDS 1931603..1932415
+ /locus_tag="BQ2027_MB1741"
+ /note="Mb1741, -, len: 270 aa. Equivalent to Rv1714, len:
+ 270 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 270 aa overlap). Probable oxidoreductase
+ (EC 1.-.-.-) similar to many e.g. AE0010|AE001021_4
+ Archaeoglobus fulgidus section 79 (281 aa), FASTA scores:
+ opt: 578, E(): 3.3e-31, (38.9% identity in 265 aa
+ overlap). Also similar to several other Mycobacterium
+ tuberculosis oxidoreductases e.g. Rv1544, etc. Mb1741
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable oxidoreductase"
+ /protein_id="SIU00345.1"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ44"
+ /translation="MEEMALAQQVPNLGLARFSVQDKSILITGATGSLGRVAARALAD
+ AGARLTLAGGNSAGLAELVNGAGIDDAAVVTCRPDSLADAQQMVEAALGRYGRLDGVL
+ VASGSNHVAPITEMAVEDFDAVMDANVRGAWLVCRAAGRVLLEQGQGGSVVLVSSVRG
+ GLGNAAGYSAYCPSKAGTDLLAKTLAAEWGGHGIRVNALAPTVFRSAVTEWMFTDDPK
+ GRATREAMLARIPLRRFAEPEDFVGALIYLLSDASSFYTGQVMYLDGGYTAC"
+ gene 1932189..1932363
+ /locus_tag="BQ2027_IS1540'-1"
+ mobile_element 1932189..1932363
+ /locus_tag="BQ2027_IS1540'-1"
+ /note="IS1540'-1, len: 175 nt. Equivalent to a region of
+ IS1540, len: 1163 nt, from Mycobacterium tuberculosis
+ strain H37Rv, (97.7% identity in 176 nt overlap)."
+ /mobile_element_type="insertion sequence:IS1540"
+ gene 1932409..1932972
+ /gene="fadB3a"
+ /locus_tag="BQ2027_MB1742"
+ CDS 1932409..1932972
+ /gene="fadB3a"
+ /locus_tag="BQ2027_MB1742"
+ /note="Mb1742, fadB3a, len: 187 aa. Equivalent to the 5'
+ end of Rv1715, len: 304 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100% identity in 187 aa
+ overlap). Probable fadB3, 3-hydroxybutyryl-CoA
+ dehydrogenase (EC 1.1.1.157), highly similar to many e.g.
+ NP_107236.1|NC_002678 3-hydroxybutyryl-CoA dehydrogenase
+ from Mesorhizobium loti (309 aa); NP_250319.1|NC_002516
+ probable 3-hydroxyacyl-CoA dehydrogenase from Pseudomonas
+ aeruginosa (509 aa); P45856|HBD_BACSU PROBABLE
+ 3-HYDROXYBUTYRYL-COA DEHYDROGENASE from Bacillus subtilis
+ (287 aa), FASTA scores: opt: 488, E(): 1.5e-24, (38.7%
+ identity in 279 aa overlap); etc. COULD BELONG TO THE
+ 3-HYDROXYACYL-COA DEHYDROGENASE FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1715/fadB3 exists as a single
+ gene. In Mycobacterium bovis, a single base transition
+ (g-a) splits fadB3 into 2 parts, fadB3a and fadB3b. Mb1742
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 3-HYDROXYBUTYRYL-COA DEHYDROGENASE
+ FADB3a [FIRST PART] (BETA-HYDROXYBUTYRYL-COA
+ DEHYDROGENASE) (BHBD)"
+ /protein_id="SIU00346.1"
+ /db_xref="GOA:A0A1R3XZG8"
+ /db_xref="InterPro:IPR006176"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZG8"
+ /translation="MLTSHGFSRAAVVGAGLMGRRIAGVLASAGLDVAITDTNAEILH
+ AAAVEAARVAGAGRGSVAAAADLAAAIPDADLVIEAVVENLAVKQELFERLATLAPDA
+ VLATNTSVLPIGAVTERVEDGSRVIGTHFWNPPDLIPVVEVVPSARTAPDTADRVVAL
+ LTQVGKLPVRVGRDVPGFIGNRLQHAL"
+ gene 1933030..1933323
+ /gene="fadB3b"
+ /locus_tag="BQ2027_MB1743"
+ CDS 1933030..1933323
+ /gene="fadB3b"
+ /locus_tag="BQ2027_MB1743"
+ /note="Mb1743, fadB3b, len: 97 aa. Equivalent to the 3'
+ end of Rv1715, len: 304 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100% identity in 97 aa
+ overlap). Probable fadB3, 3-hydroxybutyryl-CoA
+ dehydrogenase (EC 1.1.1.157), highly similar to many e.g.
+ NP_107236.1|NC_002678 3-hydroxybutyryl-CoA dehydrogenase
+ from Mesorhizobium loti (309 aa); NP_250319.1|NC_002516
+ probable 3-hydroxyacyl-CoA dehydrogenase from Pseudomonas
+ aeruginosa (509 aa); P45856|HBD_BACSU PROBABLE
+ 3-HYDROXYBUTYRYL-COA DEHYDROGENASE from Bacillus subtilis
+ (287 aa), FASTA scores: opt: 488, E(): 1.5e-24, (38.7%
+ identity in 279 aa overlap); etc. COULD BELONG TO THE
+ 3-HYDROXYACYL-COA DEHYDROGENASE FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1715/fadB3 exists as a single
+ gene. In Mycobacterium bovis, a single base transition
+ (g-a) splits fadB3 into 2 parts, fadB3a and fadB3b. Mb1743
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 3-HYDROXYBUTYRYL-COA DEHYDROGENASE
+ FADB3b [SECOND PART] (BETA-HYDROXYBUTYRYL-COA
+ DEHYDROGENASE) (BHBD)"
+ /protein_id="SIU00347.1"
+ /db_xref="GOA:A0A1R3XZ49"
+ /db_xref="InterPro:IPR006108"
+ /db_xref="InterPro:IPR008927"
+ /db_xref="InterPro:IPR013328"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ49"
+ /translation="MVRNTIGLRLATLGPLENADYIGLDLTLAIHDAVIPSLNHDPHP
+ SPLLRELVAAGQLGARTGHGFLDWPAGAREATTARLAQHIAAQLQANEKGRGT"
+ gene 1933326..1934156
+ /locus_tag="BQ2027_MB1744"
+ CDS 1933326..1934156
+ /locus_tag="BQ2027_MB1744"
+ /EC_number="3.5.1.9"
+ /note="Mb1744, -, len: 276 aa. Equivalent to Rv1716, len:
+ 276 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 276 aa overlap). Conserved hypothetical
+ protein, shows high similarity with
+ AF1200|O29068|AE001021_11A conserved protein of
+ Archaeoglobus fulgidus, gp fulgidus section 7 (278 aa),
+ FASTA scores: E(): 0, (61.8% identity in 251 a a overlap);
+ also weak similarity to several polyketide cyclases e.g.
+ O68500|AF048833|DPSY from Streptomyces peucetius (272 aa),
+ FASTA scores: opt: 194, E(): 1.7e-05, (29.6% identity in
+ 223 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="Kynurenine formamidase, bacterial (EC"
+ /protein_id="SIU00348.1"
+ /db_xref="GOA:A0A1R3XZ58"
+ /db_xref="InterPro:IPR007325"
+ /db_xref="InterPro:IPR037175"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ58"
+ /translation="MTFAWPLGAAESTLEFYDLSHPWGHGAPAWPYFEDVQIERLHGM
+ AKSRVLTQKITTVMHSGTHIDAPAHVVEGTPFLDEIPLSAFFGTGVVVSIPKGKWGMV
+ TAEDLQNATPDIRPGDIVVVNTGWHHKYADSAEYYAYSPGFDKKAGEWFAAKGVKAVG
+ TDTQALDHPLATAIAPHGPAEAQGGLLPWAVREYEAQTGRKVLDDFPDWEPCHRAILS
+ QGIYGFENVGGDLDKVTGKRVTFAAFPWRWVGGDGCIVRLVAIVDPTGSYRIETGKAA
+ "
+ gene 1934156..1934506
+ /locus_tag="BQ2027_MB1745"
+ CDS 1934156..1934506
+ /locus_tag="BQ2027_MB1745"
+ /note="Mb1745, -, len: 116 aa. Equivalent to Rv1717, len:
+ 116 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 116 aa overlap). Conserved hypothetical
+ protein, similar to O29060|AF1208|AE001021 Hypothetical
+ protein from Arecheoglobus fulgidus (114 aa), FASTA
+ scores: opt: 254, E(): 3.3e-09, (37.7% identity in 114 aa
+ overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="Cupin 2 barrel protein"
+ /protein_id="SIU00349.1"
+ /db_xref="InterPro:IPR011051"
+ /db_xref="InterPro:IPR013096"
+ /db_xref="InterPro:IPR014710"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ53"
+ /translation="MKLTRASQAPRYVAPAHHEVSTMRLQGREAGRTERFWVGLSVYR
+ PGGTAEPAPTREETVYVVLDGELVVTVDGAETVLGWLDSVHLAKGELRSIHNRTDRQA
+ LLLVTVAHPVAEVA"
+ gene 1934559..1935182
+ /locus_tag="BQ2027_MB1746"
+ CDS 1934559..1935182
+ /locus_tag="BQ2027_MB1746"
+ /note="Mb1746, -, len: 207 aa. Equivalent to the 5' end of
+ Rv1718, len: 272 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 193 aa overlap). Conserved
+ hypothetical protein, similar to O29058|AF1210|AE001021
+ Hypothetical protein from Archeoglobus (313 aa), FASTA
+ scores: opt: 301, E(): 8e-23, (31.6% identity in 301 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1718 exists as a single gene.
+ In Mycobacterium bovis, a single base deletion (c-*) leads
+ to a shorter product with a different COOH terminus."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00350.1"
+ /db_xref="GOA:A0A1R3XZ47"
+ /db_xref="InterPro:IPR008567"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ47"
+ /translation="MSIVITVAPTGPIATKADNPALPTSPEEIATAVEQAYHAGAAVA
+ HIHLRDENERPTADPNIARRAMDLIGERCPILIQLSTGVGLTVPFEQREQLVELRPRM
+ ATLNPCSMSFGAGEFRNPPQAVRRLAARMRELDIKPELEIYDTGHLEACLRLWAEDLL
+ AEPLQFSIVLGVRGGMAATADNLLTMVRRLPPGRSGKSSRSVRPTWN"
+ gene 1935390..1936169
+ /locus_tag="BQ2027_MB1748"
+ CDS 1935390..1936169
+ /locus_tag="BQ2027_MB1748"
+ /note="Mb1748, -, len: 259 aa. Equivalent to Rv1719, len:
+ 259 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 259 aa overlap). Probable
+ transcriptional regulatory protein, similar to
+ YIAJ_ECOLI|P37671 hypothetical transcriptional regulator
+ from Escherichia coli (282 aa), FASTA scores: opt: 353,
+ E(): 3.2e-15, (31.1% identity in 235 aa overlap). Similar
+ to Mycobacterium tuberculosis hypothetical IclR-family
+ transcriptional regulators Rv2989, Rv1773c.
+ Helix-turn-helix motif from aa 34-55 (+6.94 SD). Protein
+ product from Mb1748 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00351.1"
+ /db_xref="GOA:A0A1R3XZ29"
+ /db_xref="InterPro:IPR005471"
+ /db_xref="InterPro:IPR012318"
+ /db_xref="InterPro:IPR014757"
+ /db_xref="InterPro:IPR029016"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ29"
+ /translation="MSAEEQDTRSGGIQVIARAAELLRVLQAHPGGLSQAEIGERVGM
+ ARSTVSRILNALEDEGLVASRGARGPYRLGPEITRMATTVRLGVVTEMHPFLTELSRE
+ LDETVDLSILDGDRADVVDQVVPPQRLRAVSAVGESFPLYCCANGKALLAALPPERQA
+ RALPSRLAPLTANTITDRAALRDELNRIRVDGVAYDREEQTEGICAVGAVLRGVSVEL
+ VAVSVPVPAQRFYGREAELAGALLAWVSKVDAWFNGTEDRK"
+ gene 1936362..1936435
+ /locus_tag="BQ2027_PROT"
+ tRNA 1936362..1936435
+ /locus_tag="BQ2027_PROT"
+ /product="tRNA-Pro"
+ /note="proT, len: 74 nt. Equivalent to proT, len: 74 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 74 nt overlap). tRNA-Pro, anticodon ggg."
+ gene 1936598..1936772
+ /locus_tag="BQ2027_IS1540'-1"
+ gene complement(1936779..1937168)
+ /gene="vapc12"
+ /locus_tag="BQ2027_MB1749C"
+ CDS complement(1936779..1937168)
+ /gene="vapc12"
+ /locus_tag="BQ2027_MB1749C"
+ /note="Mb1749c, -, len: 129 aa. Equivalent to Rv1720c,
+ len: 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 129 aa overlap). Conserved hypothetical
+ protein, similar to other Mycobacterium tuberculosis
+ hypothetical proteins e.g. O53610|Rv0065|MTV030.08 (133
+ aa), FASTA scores: E(): 1.5e-10, (39.1% identity in 128 aa
+ overlap); P71550|Rv0960|MTCY10D7.14C (129 aa) and
+ O06415|Rv0549c|MTCY25D10.28C (137 aa). Mb1749c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc12"
+ /protein_id="SIU00352.1"
+ /db_xref="GOA:A0A1R3XZ41"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ41"
+ /translation="MIVLDASAAVELMLTTPAGAAVARRLRGETVHAPAHFDVEVIGA
+ IRQAVVRQLISDHEGLVVVVNFLSLPVRRWPLKPFTQRAYQLRSTHTVADGAYVALAE
+ GLGVPLITCDGRLAQSHGHNAEIELVA"
+ gene complement(1937165..1937392)
+ /gene="vapb12"
+ /locus_tag="BQ2027_MB1750C"
+ CDS complement(1937165..1937392)
+ /gene="vapb12"
+ /locus_tag="BQ2027_MB1750C"
+ /note="Mb1750c, -, len: 75 aa. Equivalent to Rv1721c, len:
+ 75 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 75 aa overlap). Conserved hypothetical
+ protein, similar to Rv0300|MTCY63.05|O07227 CONSERVED
+ HYPOTHETICAL PROTEIN from Mycobacterium tuberculosis (73
+ aa). Start changed since original submission. Protein
+ product from Mb1750c detected using SWATH mass
+ spectrometry. Mb1750c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb12"
+ /protein_id="SIU00353.1"
+ /db_xref="GOA:A0A1R3Y196"
+ /db_xref="InterPro:IPR010985"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y196"
+ /translation="MSAMVQIRNVPDELLHELKARAAAQRMSLSDFLLARLAEIAEEP
+ ALDDVLDRLAALPRRDLGASAAELVDEARSE"
+ gene 1937610..1939094
+ /locus_tag="BQ2027_MB1751"
+ CDS 1937610..1939094
+ /locus_tag="BQ2027_MB1751"
+ /note="Mb1751, -, len: 494 aa. Equivalent to Rv1722, len:
+ 494 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 494 aa overlap). Possible carboxylases.
+ Weak similarity to several e.g. ACCC_BACSU|P49787 biotin
+ carboxylase from Bacillus subtilis (448 aa), fasta scores:
+ opt: 171, E(): 0.00021, (22.8% identity in 237 aa
+ overlap). Protein product from Mb1751 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1751 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CARBOXYLASE"
+ /protein_id="SIU00354.1"
+ /db_xref="GOA:A0A1R3XZY7"
+ /db_xref="InterPro:IPR011761"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZY7"
+ /translation="MIVPAREPEPQPRRVLNGLSDVRAFFHNNTMPLYFISPTPFNLL
+ GIYRWIRNFFYLTYYDSFEGEHSRVFVPRRRDRRDFDGMGDVCNHLLRDPETLEFIKN
+ RGPGGKACFVMLDEETQALARQAGLEVMHPPAELRHRLESKIVMTRLADEAGVPSVPH
+ VIGRVSSYDELSALAHGAGLGDDLVVEAAYGNAGSATFFVRGLRDWDQCAGGIVGQPE
+ IKVMKRIRNVEVCIEATVTRHGTVIGPAMTSLVGYPELTPYRGAWCGNDVWRGALPPA
+ QTRAAREMVAKLGDVLSREGYRGYFEVDLLHDLDADELYLGEVNPRLSGASPMTNLTT
+ EAYADMPLFLFHLLEYMDVDYELDIEAINSRWERGYGEDEVWGQLIMSETSPDLELFT
+ ATPRTGMWRLNHDGRVSFARQGNDWATMLDESEAFYMRVAAPGDLRCEGAQLGVLVTR
+ GHLQTDDYQLTERGRRWIDGLKAQFASTPLTPAAPIVSRLVARA"
+ gene 1939091..1940338
+ /locus_tag="BQ2027_MB1752"
+ CDS 1939091..1940338
+ /locus_tag="BQ2027_MB1752"
+ /note="Mb1752, -, len: 415 aa. Equivalent to Rv1723, len:
+ 415 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 415 aa overlap). Possible hydrolase (EC
+ 3.-.-.-), similar to others e.g. NYLB_FLASP|P07061
+ 6-aminohexanoate-dimer hydrolase from Flavobacterium sp.
+ (392 aa), FASTA scores: opt: 717, E(): 0, (35.1% identity
+ in 396 aa overlap). Also similar to Mycobacterium
+ tuberculosis hypothetical esterases and penicillin binding
+ proteins e.g. Rv1923, Rv1497, Rv2463, etc."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE HYDROLASE"
+ /protein_id="SIU00355.1"
+ /db_xref="GOA:A0A1R3XZ54"
+ /db_xref="InterPro:IPR001466"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ54"
+ /translation="MSGGVPAGLALDNWLSSPYSHWAFQHVEDFMPTTVIARGTEPVV
+ TLPADNAPIADIGLTSTDGIATTVGAVMAATATDGWAVAHRGALVAEQYLDGLGPRTR
+ HLLFSVSKSLVAAVVGALHGAGAIELDAPVTAYVPALADCGYAGATVRHLLDMRSGVA
+ FSENYDDPAAEIHVREQVIGWAPKRGPDLPATLRDYLLTLRRKSAHGGPFEYRSCETD
+ VLGWICEAAAGQPMPELMSELLWSRIGAQCDATIALDVAGAAGTGIFDGGISACLTDM
+ IRFGSLYLRDGVSLAGQQVVPAAWIADTFDGGPDSRQAFAASPDDNPMPGGMYRNQVW
+ FPYPGSNVALCVGMCGQLIYVNRAAEVVAAKLSTQPHSHEPHMLDTLRAFDAVAHELS
+ GIRSSSTNDPQRPSPPAQEASPG"
+ gene complement(1940381..1940800)
+ /locus_tag="BQ2027_MB1753C"
+ CDS complement(1940381..1940800)
+ /locus_tag="BQ2027_MB1753C"
+ /note="Mb1753c, -, len: 139 aa. Equivalent to Rv1724c,
+ len: 139 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 139 aa overlap). Hypothetical unknown
+ protein. Mb1753c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00356.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZH9"
+ /translation="MVGNEENELQDLRNLRRPCFSRAEAPIGVYNGEQAIIVYDLRPV
+ PHWPKYWIQALAKHFQRQLKPSPKIDISLLDDRIRFSVFVSTDVSAKDLCKLDDAVYN
+ AVRNAGRAIENEQAALDHKLAEVRKRRMDTWDESYFR"
+ gene complement(1940790..1941500)
+ /locus_tag="BQ2027_MB1754C"
+ CDS complement(1940790..1941500)
+ /locus_tag="BQ2027_MB1754C"
+ /note="Mb1754c, -, len: 236 aa. Equivalent to Rv1725c,
+ len: 236 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 236 aa overlap). Conserved hypothetical
+ protein, similar to other hypothetical proteins from
+ diverse organisms e.g. P70885|U44893 ORF108 from
+ BUTYRIVIBRIO FIBRISOLVENS, (108 aa), FASTA scores: opt:
+ 223, E(): 2e-09, (39.1% identity in 92 aa overlap). Also
+ similar to Mycobacterium tuberculosis hypothetical
+ transcriptional regulator, O05774|Rv3095|YU95_MYCTU (158
+ aa). Protein product from Mb1754c detected using SWATH
+ mass spectrometry. Mb1754c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, HxlR family / Domain
+ of unknown function"
+ /protein_id="SIU00357.1"
+ /db_xref="InterPro:IPR002577"
+ /db_xref="InterPro:IPR011991"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="InterPro:IPR036527"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ57"
+ /translation="MQPYGQYCPVARAAELLGDRWTLLIVRELLFGPLRFTEIERGLP
+ GISRSVLAQRLRRLQHDRIIEAVPEHTGGGYRFTVAGEELRPVLQTLGDWVSRWLMAD
+ PTPAECDPELLTLWISRRVNTEALPGRRVVVEFRYHGERPLWAWLVLEPGDISVCLHD
+ PCLPVDLTVRGHPRDLYRVYSGRSTLAAEISAERIELDGLPAMRRAFPSWMAWSPFAP
+ AMRQAVVSVDQMPEAHGG"
+ gene 1941601..1942986
+ /locus_tag="BQ2027_MB1755"
+ CDS 1941601..1942986
+ /locus_tag="BQ2027_MB1755"
+ /note="Mb1755, -, len: 461 aa. Equivalent to Rv1726, len:
+ 461 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 461 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), similar to HDNO_ARTOX|P08159
+ 6-hydroxy-d-nicotine oxidase (458 aa), FASTA scores: opt:
+ 678, E(): 0, (29.5% identity in 465 aa overlap). Also
+ similar to Mycobacterium tuberculosis hypothetical
+ dehydrogenases e.g. Rv3107c, Rv1257c, etc."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="SIU00358.1"
+ /db_xref="GOA:A0A1R3XZ69"
+ /db_xref="InterPro:IPR006094"
+ /db_xref="InterPro:IPR012951"
+ /db_xref="InterPro:IPR016166"
+ /db_xref="InterPro:IPR016167"
+ /db_xref="InterPro:IPR016169"
+ /db_xref="InterPro:IPR036318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ69"
+ /translation="MTATLTKTLGSLDDFRGTLCVPGDPDYPRVRAIWNGQVAREPAL
+ IATCHDACDVRTVLRRPVDAGMVTAVRGGGHNVAGTALCDGGVVIDLSAMRAVSLDPA
+ TGRVRVQGGATLADLDHATVPFARVAPAGIVTTTGVGGLTLGGGVGWTTRRFGLSCDN
+ LVAVRLVTAAGDYLSVDDERDPELMWGLRGGGGNFGIVTEFEFATHPFGPVAVAGFVV
+ YRLDDGPAVLRGYRQFAAAAPEEVTTIVVLRHAPPAPWIPVDQRGKPVVMIGAVHTGS
+ IQTGIEALRPVKSLARPVADTVWPTPFLAHQAVLDASNPAGHRYYWKSDYLAELNDEA
+ IDLLVEQTAQLSSPDSLIGIFQLGGAAARGGERSCFPSRHARFMVNYATHWTEAREDD
+ LHRQWTRDAIEALAPYGLGTAYVNFTADDAPMHVETLYSTTEFSRLVTLKNRLDPDNV
+ FRNNHNIRPSA"
+ gene 1943019..1943588
+ /locus_tag="BQ2027_MB1756"
+ CDS 1943019..1943588
+ /locus_tag="BQ2027_MB1756"
+ /note="Mb1756, -, len: 189 aa. Equivalent to Rv1727, len:
+ 189 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 189 aa overlap). Similar to
+ Mycobacterium tuberculosis hypothetical proteins
+ P72040|Rv3773c|MTCY13D12.07C (194 aa), FASTA scores: opt:
+ 176, E(): 2.7e-08, (31.1% identity in 180 aa overlap); and
+ O53801|Rv0738 (182 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00359.1"
+ /db_xref="GOA:A0A1R3XZ63"
+ /db_xref="InterPro:IPR017517"
+ /db_xref="InterPro:IPR017520"
+ /db_xref="InterPro:IPR024344"
+ /db_xref="InterPro:IPR034660"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ63"
+ /translation="MDLYSNLVEAEQRLVALVSSIEADSYSSPTPCDRWDVRALLSHA
+ LASIDAFAAAVDGAPGPDMAQVFSGADIVGDDPLGATQRITRRSQAAWSTVRDLNAEL
+ STFIGVMPAGQALAIITFSTVVHGWDLAVATGQAGELPEHLAEAAQQVAAELVPVLRP
+ RGLFAHDVDLAGEATPTQRLVALTGRKPR"
+ gene complement(1943613..1944383)
+ /locus_tag="BQ2027_MB1757C"
+ CDS complement(1943613..1944383)
+ /locus_tag="BQ2027_MB1757C"
+ /note="Mb1757c, -, len: 256 aa. Equivalent to Rv1728c,
+ len: 256 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 256 aa overlap). Conserved hypothetical
+ protein, some similarity to O07246|Rv0320|MTCY63.25
+ possible exported protein from Mycobacterium tuberculosis
+ (220 aa), FASTA scores: E(): 1.3e-31, (42.3% identity in
+ 220 aa overlap). C-terminal region similar to
+ Q9ZX60|AF068845|AF068845_17 segment of gp17 of
+ Mycobacteriophage TM4 (1229 aa), FASTA scores: opt: 385,
+ E(): 4.3e-17, (44.6% identity in 139 aa overlap). Mb1757c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00360.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ56"
+ /translation="MSVNGLPGAHNAGLQPIDSKGCHTRRTRHTKVLFVSKGVLANGR
+ GRWLAIAASLVVSAAILYAQGAEHTCCRETPAAIPTGPDSAPANAPRIASPTEADLLA
+ ASAPVAAQQFQFALPAGVASEEGLQVKTIWVARAVSVLFPQITNIFGYRQDPLKWHPN
+ GLAIDVMIPNHHSDEGIQLGNQVAGLALANAKRWGVLHVIWRQGYYPGIGAPSWTADY
+ GSETLNHYDHVHIATDGGGYPTGRETYYVGSMSPTPPE"
+ gene complement(1944380..1945318)
+ /locus_tag="BQ2027_MB1758C"
+ CDS complement(1944380..1945318)
+ /locus_tag="BQ2027_MB1758C"
+ /note="Mb1758c, -, len: 312 aa. Equivalent to Rv1729c,
+ len: 312 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 312 aa overlap). Conserved hypothetical
+ protein, similar to many Mycobacterium tuberculosis
+ hypothetical proteins e.g. Q50726|Rv3399|YX99_MYCTU (348
+ aa), FASTA scores: opt: 1019, E(): 0, (55.7% identity in
+ 296 aa overlap); P95074|Rv0726c (367 aa), O53795|Rv0731c
+ (318 aa), and O53841|Rv0830 (301 aa), etc. Protein product
+ from Mb1758c detected using SWATH mass spectrometry.
+ Mb1758c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible s-adenosylmethionine-dependent
+ methyltransferase"
+ /protein_id="SIU00361.1"
+ /db_xref="GOA:Q7TZP5"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR011610"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZP5"
+ /translation="MARTDDDNWDLTSSVGVTATIVAVGRALATKDPRGLINDPFAEP
+ LVRAVGLDLFTKMMDGELDMSTIADVSPAVAQAMVYGNAVRTKYFDDYLLNATAGGIR
+ QVAILASGLDSRAYRLPWPTRTVVYEIDQPKVMEFKTTTLADLGAEPSAIRRAVPIDL
+ RADWPTALQAAGFDSAAPTAWLAEGLLIYLKPQTQDRLFDNITALSAPGSMVATEFVT
+ GIADFSAERARTISNPFRCHGVDVDLASLVYTGPRNHVLDYLAAKGWQPEGVSLAELF
+ RRSGLDVRAADDDTIFISGCLTDHSSISPPTAAGWR"
+ gene complement(1945498..1947051)
+ /locus_tag="BQ2027_MB1759C"
+ CDS complement(1945498..1947051)
+ /locus_tag="BQ2027_MB1759C"
+ /note="Mb1759c, -, len: 517 aa. Equivalent to Rv1730c,
+ len: 517 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 517 aa overlap). Possible
+ penicillin-binding protein, similar to others e.g.
+ PBP4_NOCLA|Q06317 penicillin-binding protein 4 (pbp-4)
+ from Nocardia lactamdurans (381 aa), FASTA scores: opt:
+ 643, E(): 3.8e-32, (33.8% identity in 370 aa overlap);
+ etc. Also similar to other Mycobacterium tuberculosis
+ hypothetical penicillin binding proteins and esterases
+ e.g. Rv1923, Rv1497, etc. Protein product from Mb1759c
+ detected using SWATH mass spectrometry. Mb1759c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE PENICILLIN-BINDING PROTEIN"
+ /protein_id="SIU00362.1"
+ /db_xref="InterPro:IPR001466"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ52"
+ /translation="MCPPIILSSATPTGTRCGTRHGRAVVTEYVRALDRLPHEIATAV
+ VETVNCADPGAAFDELDAKINAGMKAYAIPGVAVAVWAGGQEYVKGYGVTNVDHPMPV
+ DGDTVFRIGSTTKTFTGTVMMRLVERGKVDLDSPVRRYIPDFAVADESASATVTVRQL
+ LNHTAGWDGRNGQDFGRGDDAVALYVKAMTRLPQLTPPGTAFAYNNSGLVVAGRIIEL
+ VAGTTYESTVQRLLLDPLQLAHTRYFSDQIIGLNVAASHSVVDGKPIAVTDFWTFPRS
+ CNPTGGLMSTARDQLRYAQFHLGDGRAPNGEQILSRQSLKAMRSNPGAGGTLWVELTG
+ MGVTWMLRPSAENVTIVEHGGTWKGQRSGFVMVPDRNFAMTVLTNSDGGFHMINDLFA
+ SDWALQRFAGLSNLPATPQRLGAVDLAPYEGRYIAKQVAQNGDLETTVIDFRARDGQL
+ AGSMSTDDANPDGQNSANLGLAFYRPDYGLDLGPDNKPTGSRSNFVRGPDGNIAWFCS
+ QHGRLFRRQ"
+ gene 1947483..1949039
+ /gene="gabD2"
+ /locus_tag="BQ2027_MB1760"
+ CDS 1947483..1949039
+ /gene="gabD2"
+ /locus_tag="BQ2027_MB1760"
+ /standard_name="gabD1"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1760, gabD2, len: 518 aa. Equivalent to Rv1731,
+ len: 518 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 518 aa overlap). Possible gabD2,
+ succinate-semialdehyde dehydrogenase [NADP+] dependent (EC
+ 1.2.1.16), similar to others e.g. GABD_ECOLI|P25526
+ succinate-semialdehyde dehydrogenase from Escherichia coli
+ (482 aa), FASTA scores: opt: 870, E(): 0, (34.7% identity
+ in 449 aa overlap); etc. Also similar to
+ gabD1|Rv0234c|MTCY08D5.30c PROBABLE SUCCINATE-SEMIALDEHYDE
+ DEHYDROGENASE [NADP+] DEPENDANT from Mycobacterium
+ tuberculosis (511 aa); and other semialdehyde
+ dehydrogenases e.g. Rv0768|aldA (489 aa), Rv2858c|aldC
+ (455 aa), etc. Contains PS00216 Sugar transport proteins
+ signature 1, PS00687 Aldehyde dehydrogenases glutamic acid
+ active site. BELONGS TO THE ALDEHYDE DEHYDROGENASES
+ FAMILY. Note that previously known as gabD1. Protein
+ product from Mb1760 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1760 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible succinate-semialdehyde dehydrogenase
+ [nadp+] dependent (ssdh) gabd2"
+ /protein_id="SIU00363.1"
+ /db_xref="GOA:Q7TZP3"
+ /db_xref="InterPro:IPR015590"
+ /db_xref="InterPro:IPR016161"
+ /db_xref="InterPro:IPR016162"
+ /db_xref="InterPro:IPR016163"
+ /db_xref="InterPro:IPR029510"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZP3"
+ /translation="MPAPSAEVFDRLRNLAAIKDVAARPTRTIDEVFTGKPLTTIPVG
+ TAADVEAAFAEARAAQTDWAKRPVIERAAVIRRYRDLVIENREFLMDLLQAEAGKARW
+ AAQEEIVDLIANANYYARVCVDLLKPRKAQPLLPGIGKTTVCYQPKGVVGVISPWNYP
+ MTLTVSDSVPALVAGNAVVLKPDSQTPYCALACAELLYRAGLPRALYAIVPGPGSVVG
+ TAITDNCDYLMFTGSSATGSRLAEHAGRRLIGFSAELGGKNPMIVARGANLDKVAKAA
+ TRACFSNAGQLCISIERIYVEKDIAEEFTRKFGDAVRNMKLGTAYDFSVDMGSLISEA
+ QLKTVSGHVDDATAKGAKVIAGGKARPDIGPLFYEPTVLTNVAPEMECAANETFGPVV
+ SIYPVADVDEAVEKANDTDYGLNASVWAGSTAEGQRIAARLRSGTVNVDEGYAFAWGS
+ LSAPMGGMGLSGVGRRHGPEGLLKYTESQTIATARVFNLDPPFGIPATVWQKSLLPIV
+ RTVMKLPGRR"
+ gene complement(1949049..1949597)
+ /locus_tag="BQ2027_MB1761C"
+ CDS complement(1949049..1949597)
+ /locus_tag="BQ2027_MB1761C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1761c, -, len: 182 aa. Equivalent to Rv1732c,
+ len: 182 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 182 aa overlap). Conserved hypothetical
+ protein, highly similar to hypothetical proteins from
+ several organisms e.g. P73178|SLL1289|D90904 from
+ Synechocystis (194 aa), FASTA scores: opt: 663, E(): 0,
+ (53.1% identity in 179 aa overlap); etc. Protein product
+ from Mb1761c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1761c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Alkyl hydroperoxide reductase and/or
+ thiol-specific antioxidant family (AhpC/TSA) protein"
+ /protein_id="SIU00364.1"
+ /db_xref="GOA:A0A1R3XZZ8"
+ /db_xref="InterPro:IPR000866"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZZ8"
+ /translation="MAVESSMLALGTPAPSFTLPQPATGATVSLDELTGPALVVTFIC
+ NHCPYVQHVAAGLATLGRDLADQGVPMVGISSNDVVTYPQDGPDQMVAEARRHGWTFP
+ YLYDETQDVARAFSAACTPDTFVFDGQRRLVYRGQLDDSRPGNGRPVTAADVRAAVDA
+ LLAGRPVNPDQRPSIGCGIKWR"
+ gene complement(1949661..1950293)
+ /locus_tag="BQ2027_MB1762C"
+ CDS complement(1949661..1950293)
+ /locus_tag="BQ2027_MB1762C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1762c, -, len: 210 aa. Equivalent to Rv1733c,
+ len: 210 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 210 aa overlap). Probable conserved
+ transmembrane protein. Similar to AL109962|SCJ1_26
+ hypothetical protein from Streptomyces coelicolor (193
+ aa), FASTA scores: opt: 287, E(): 3.8e-11, (35.2% identity
+ in 182 aa overlap). Mb1762c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00365.1"
+ /db_xref="GOA:A0A1R3XZ65"
+ /db_xref="InterPro:IPR039708"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ65"
+ /translation="MIATTRDREGATMITFRLRLPCRTILRVFSRNPLVRGTDRLEAV
+ VMLLAVTVSLLTIPFAAAAGTAVHDSRSHVYAHQAQTRHPATATVIDHEGVIDSNTTA
+ TSAPPRTKITVPARWVVNGIERSGEVNAKPGTKSGDRVGIWVDSAGQLVDEPAPPARA
+ IADAALAALGLWLSVAAVAGALLALTRAILIRVRNASWQHDIDSLFCTQR"
+ gene complement(1950580..1950822)
+ /locus_tag="BQ2027_MB1763C"
+ CDS complement(1950580..1950822)
+ /locus_tag="BQ2027_MB1763C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1763c, -, len: 80 aa. Equivalent to Rv1734c, len:
+ 80 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.8% identity in 80 aa overlap). Conserved hypothetical
+ protein, similar to C-terminal region
+ Q9Z8N2|CP0452|AE001615 Dihydrolipoamide Acetyltransferase
+ from Chlamydia pneumoniae (429 aa), FASTA scores: opt:
+ 138, E(): 0.0012, (26.9% identity in 78 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="Pyruvate/2-oxoglutarate dehydrogenase complex,
+ dihydrolipoamide acyltransferase (E2) component, and
+ related enzymes"
+ /protein_id="SIU00366.1"
+ /db_xref="GOA:A0A1R3XZI3"
+ /db_xref="InterPro:IPR001078"
+ /db_xref="InterPro:IPR023213"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZI3"
+ /translation="MTNVGDQGVDAVFGVIYPPQVALVSFGKPAQRVCAVDGAIHVMT
+ TVLATLPADHGCSDDHRGALFFLSINELTRCAAVAG"
+ gene complement(1951097..1951594)
+ /locus_tag="BQ2027_MB1764C"
+ CDS complement(1951097..1951594)
+ /locus_tag="BQ2027_MB1764C"
+ /note="Mb1764c, -, len: 165 aa. Equivalent to Rv1735c,
+ len: 165 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 165 aa overlap). Hypothetical membrane
+ protein, similar to part of O58614|PH0884|AP000004
+ Hypothetical malic acid transport protein from Pyrococcus
+ horikoshii (330 aa), FASTA scores: opt: 167, E(): 0.0003,
+ (29.2% identity in 120 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL MEMBRANE PROTEIN"
+ /protein_id="SIU00367.1"
+ /db_xref="GOA:A0A1R3XZ67"
+ /db_xref="InterPro:IPR004695"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ67"
+ /translation="MGATAITVLAGAHIVEMADAPMAIVTSGLVAGASVVFWAFGPWL
+ IPPLVAASIWKHVVHRVPLRYEATLWSVVFPLGMYGVGAYRLGLAAHLPIVESIGEFE
+ GWVALAVWTITFVAMLHHLAATIGRSGRSSHAIGAADDTHAIICRPPRSFDHQVRAFR
+ RNQPM"
+ gene complement(1952034..1953992)
+ /gene="narX"
+ /locus_tag="BQ2027_MB1765C"
+ CDS complement(1952034..1953992)
+ /gene="narX"
+ /locus_tag="BQ2027_MB1765C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1765c, narX, len: 652 aa. Equivalent to Rv1736c,
+ len: 652 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 652 aa overlap). Probable narX, nitrate
+ reductase (EC 1.7.99.4). Contains three domains:
+ N-terminus (250 aa) is similar to e.g. N-terminus of
+ NARG_ECOLI|P09152 respiratory nitrate reductase 1 alpha
+ chain from Escherichia coli (1246 aa), FASTA scores: E():
+ 0, (58.6% identity in 251 aa overlap); and
+ Rv1161|MTCI65.28|NARG PROBABLE RESPIRATORY NITRATE
+ REDUCTASE (ALPHA CHAIN) from Mycobacterium tuberculosis
+ (1232 aa). Central region (260-410 aa) is similar to
+ Rv1163|O06561|NARJ PROBABLE RESPIRATORY NITRATE REDUCTASE
+ (DELTA CHAIN) from Mycobacterium tuberculosis (201 aa),
+ FASTA scores: E(): 0, (64.2% identity in 159 aa overlap).
+ C-terminus (420 aa-) is similar to Rv1164|O06562|NARI
+ PROBABLE RESPIRATORY NITRATE REDUCTASE (GAMMA CHAIN) from
+ M. tuberculosis (246 aa), FASTA scores: E(): 0, (68.6%
+ identity in 239 aa overlap). Contains PS00551 Prokaryotic
+ molybdopterin oxidoreductases signature 1. Mb1765c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable nitrate reductase NarX"
+ /protein_id="SIU00368.1"
+ /db_xref="GOA:A0A1R3XZ78"
+ /db_xref="InterPro:IPR003765"
+ /db_xref="InterPro:IPR003816"
+ /db_xref="InterPro:IPR006656"
+ /db_xref="InterPro:IPR006963"
+ /db_xref="InterPro:IPR020945"
+ /db_xref="InterPro:IPR023234"
+ /db_xref="InterPro:IPR027467"
+ /db_xref="InterPro:IPR036197"
+ /db_xref="InterPro:IPR036411"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ78"
+ /translation="MTVTPRTGSRIEELLARSGRFFIPGEISADLRTVTRRGGRDGDV
+ FYRDRWSHHKVVRSTHGVNCTGSCSWKIYVKDGIITWETQETDYPSVGPDRPEYEPRG
+ CPRGAAFSWYTYSPTRVRHPYARGVLVEMYREAKARLGDPVAAWADIQADPRRRRRYQ
+ RARGKGGLVRVSWAEATEMIAAAHVHTISTYGPDRVAGFSPIPAMSMVSHAAGSRFVE
+ LIGGVMTSFYDWYADLPVASPQVFGDQTDVPESGDWWDVVWQCASVLLTYPNSRQLGT
+ AEELLAHIDGPAADLLGRTVSELRRADPLTAATRYVDTFDLRGRATLYLTYWTAGDTR
+ NRGREMLAFAQTYRSTDVAPPRGETPDFLPVVLEFAATVDPEAGRRLLSGYRVPIAAL
+ CNALTEAALPYAHTVAAVCRTGDMMGELFWTVVPYVTMTIVAVGSWWRYRYDKFGWTT
+ RSSQLYESRLLRIASPMFHFGILVVIVGHGIGLVIPQSWTQAAGLSEGAYHVQAVVLG
+ SIAGITTLAGVTLLIYRRRTRGPVFMATTVNDKVMYLVLVAAIVAGLGATALGSGVVG
+ EAYNYRETVSVWFRSVWVLQPRGDLMAEAPLYYQIHVLIGLALFALWPFTRLVHAFSA
+ PIGYLFRPYIIYRSREELVLTRPRRRGW"
+ gene complement(1953989..1955176)
+ /gene="narK2"
+ /locus_tag="BQ2027_MB1766C"
+ CDS complement(1953989..1955176)
+ /gene="narK2"
+ /locus_tag="BQ2027_MB1766C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1766c, narK2, len: 395 aa. Equivalent to Rv1737c,
+ len: 395 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 395 aa overlap). Possible narK2,
+ nitrate/nitrite-transport integral membrane protein (see
+ first citation below), possibly member of major
+ facilitator superfamily (MFS), similar to
+ P46907|NARK_BACSU nitrite extrusion protein from Bacillus
+ subtilis (395 aa), FASTA scores: opt: 742, E(): 0, (33.6%
+ identity in 375 aa overlap); and to AL109989|SCJ12.23
+ hypothetical nitrate/nitrite transporter from Streptomyces
+ coelicolor (412 aa), FASTA scores: opt: 1181, E(): 0,
+ (49.4% identity in 389 aa overlap). Protein product from
+ Mb1766c detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE NITRATE/NITRITE TRANSPORTER NARK2"
+ /protein_id="SIU00369.1"
+ /db_xref="GOA:A0A1R3XZ73"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ73"
+ /translation="MRGQAANLVLATWISVVNFWAWNLIGPLSTSYARDMSLSSAEAS
+ LLVATPILVGALGRIVTGPLTDRFGGRAMLIAVTLASILPVLAVGVAATMGSYALLVF
+ FGLFLGVAGTIFAVGIPFANNWYQPARRGFSTGVFGMGMVGTALSAFFTPRFVRWFGL
+ FTTHAIVAAALASTAVVAMVVLRDAPYFRPNADPVLPRLKAAARLPVTWEMSFLYAIV
+ FGGFVAFSNYLPTYITTIYGFSTVDAGARTAGFALAAVLARPVGGWLSDRIAPRHVVL
+ ASLAGTALLAFAAALQPPPEVWSAATFITLAVCLGVGTGGVFAWVARRAPAASVGSVT
+ GIVAAAGGLGGYFPPLVMGATYDPVDNDYTVGLLLLVATALVACTYTALHAREPVSEE
+ ASR"
+ gene 1955463..1955747
+ /locus_tag="BQ2027_MB1767"
+ CDS 1955463..1955747
+ /locus_tag="BQ2027_MB1767"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1767, -, len: 94 aa. Equivalent to Rv1738, len:
+ 94 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 94 aa overlap). Conserved hypothetical
+ protein, similar to P71931|Rv2632c|YQ32_MYCTU Hypothetical
+ 10.1 kd protein from Mycobacterium tuberculosis (93 aa),
+ FASTA scores: opt: 319, E(): 2.6e-27, (53.9% identity in
+ 89 aa overlap). Protein product from Mb1767 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1767 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00370.1"
+ /db_xref="InterPro:IPR015057"
+ /db_xref="InterPro:IPR038070"
+ /db_xref="UniProtKB/Swiss-Prot:P64888"
+ /translation="MCGDQSDHVLQHWTVDISIDEHEGLTRAKARLRWREKELVGVGL
+ ARLNPADRNVPEIGDELSVARALSDLGKRMLKVSTHDIEAVTHQPARLLY"
+ gene complement(1955761..1957443)
+ /locus_tag="BQ2027_MB1768C"
+ CDS complement(1955761..1957443)
+ /locus_tag="BQ2027_MB1768C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1768c, -, len: 560 aa. Equivalent to Rv1739c,
+ len: 560 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 560 aa overlap). Probable
+ sulphate-transport transmembrane protein ABC transporter,
+ similar to several e.g. P53392|G607186 high affinity
+ sulphate transporter from Stylosanthes hamata (662 aa),
+ FASTA scores: opt: 382, E(): 1.6e-16, (28.0% identity in
+ 564 aa overlap); U59234.1|AAB88215.1 biotin carb. from
+ Synechococcus sp. PCC 7942 (574 aa), FASTA scores: opt:
+ 1838, E(): 0, (50.0% identity in 550 aa overlap); etc.
+ Contains PS00211 ABC transporters family signature.
+ BELONGS TO THE ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC
+ TRANSPORTERS), AND SEEMS TO BELONG TO THE SULP FAMILY.
+ Protein product from Mb1768c detected using SWATH mass
+ spectrometry. Mb1768c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SULPHATE-TRANSPORT TRANSMEMBRANE
+ PROTEIN ABC TRANSPORTER"
+ /protein_id="SIU00371.1"
+ /db_xref="GOA:A0A1R3XZ50"
+ /db_xref="InterPro:IPR001902"
+ /db_xref="InterPro:IPR002645"
+ /db_xref="InterPro:IPR011547"
+ /db_xref="InterPro:IPR036513"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ50"
+ /translation="MIPTMTSAGWAPGVVQFREYQRRWLRGDVLAGLTVAAYLIPQAM
+ AYATVAGLPPAAGLWASIAPLAIYALLGSSRQLSIGPESATALMTAAVLAPMAAGDLR
+ RYAVLAATLGLLVGLICLLAGTARLGFLASLLSRPVLVGYMAGIALVMISSQLGTITG
+ TSVEGNEFFSEVHSFATSVTRVHWPTFVLAMSVLALLTMLTRWAPRAPGPIIAVLAAT
+ MLVAVMSLDAKGIAIVGRIPSGLPTPGVPPVSVEDLRALIIPAAGIAIVTFTDGVLTA
+ RAFAARRGQEVNANAELRAVGACNIAAGLTHGFPVSSSSSRTALADVVGGRTQLYSLI
+ ALGLVVIVMVFASGLLAMFPIAALGALVVYAALRLIDLSEFRRLARFRRSELMLALAT
+ TAAVLGLGVFYGVLAAVALSILELLRRVAHPHDSVLGFVPGIAGMHDIDDYPQAKRVP
+ GLVVYRYDAPLCFANAEDFRRRALTVVDQDPGQVEWFVLNAESNVEVDLTALDALDQL
+ RTELLRRGIVFAMARVKQDLRESLRAASLLDKIGEDHIFMTLPTAVQAFRRR"
+ gene 1957511..1957723
+ /gene="vapb34"
+ /locus_tag="BQ2027_MB1769"
+ CDS 1957511..1957723
+ /gene="vapb34"
+ /locus_tag="BQ2027_MB1769"
+ /note="Mb1769, -, len: 70 aa. Equivalent to Rv1740, len:
+ 70 aa, from Mycobacterium tuberculosis strain H37Rv, (100%
+ identity in 70 aa overlap). Conserved hypothetical
+ protein, highly similar to other Mycobacterium
+ tuberculosis hypothetical proteins e.g.
+ P96913|Rv0623|MTCY20H10.04 (84 aa), (73.5% identity in 68
+ aa overlap); P71998|Rv1740 (70 aa), and O07770|Rv0608 (81
+ aa). Mb1769 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb34"
+ /protein_id="SIU00372.1"
+ /db_xref="InterPro:IPR011660"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ61"
+ /translation="MELAARMGETLTQAVVVAVREQLARRTGRTRSISLREELAAIGR
+ RCAALPVLDTRAADTILGYDERGLPA"
+ gene 1957723..1957971
+ /gene="vapc34"
+ /locus_tag="BQ2027_MB1770"
+ CDS 1957723..1957971
+ /gene="vapc34"
+ /locus_tag="BQ2027_MB1770"
+ /note="Mb1770, -, len: 82 aa. Equivalent to Rv1741, len:
+ 82 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.8% identity in 82 aa overlap). Conserved hypothetical
+ protein, very similar in N-terminus to other M.
+ tuberculosis hypothetical proteins e.g.
+ P96914|Rv0624|MTCY20H10.05 (131 aa), (80.4% identity in 56
+ aa overlap); P71999|Rv1741 (82 aa) and O07769|Rv0609 (133
+ aa). Mb1770 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc34. contains pin domain."
+ /protein_id="SIU00373.1"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1B6"
+ /translation="MVIDTSALVAMLNDEPEAQRFEIAVAADHVWLMSTASYPEMATV
+ IETRFGEPGGREPKVSGQPLLYTGDDFACIDIRAVLAG"
+ gene 1958052..1958717
+ /locus_tag="BQ2027_MB1771"
+ CDS 1958052..1958717
+ /locus_tag="BQ2027_MB1771"
+ /note="Mb1771, -, len: 221 aa. Equivalent to the 3' end of
+ Rv1742, len: 245 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 220 aa overlap).
+ Hypothetical unknown protein.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base insertion (*-c) leads to shorter product with
+ a different NH2 part compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv. Protein product
+ from Mb1771 detected using SWATH mass spectrometry. Mb1771
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00374.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y006"
+ /translation="MGRVRTGGLLLRTRVPGNRFADYRITVHVQQARTVLDPFPRDGY
+ RGVFESGQVRIESHDGAVISSRAHPRAAFFGRSGLRRNIRWDPLDSVYFAGYAMWNYL
+ TTPYLLTREGVAVEEGAPWQQEGETWRRLIVSFPPDIDTHSPRQTFYVDASGLLRRHD
+ YVPEVVGHWARAAHYCADPVDVDGFVFPTCRWVHPIGPGNRSLPFPTLVSILLTDIRV
+ ETD"
+ gene 1958811..1960511
+ /gene="pknE"
+ /locus_tag="BQ2027_MB1772"
+ CDS 1958811..1960511
+ /gene="pknE"
+ /locus_tag="BQ2027_MB1772"
+ /note="Mb1772, pknE, len: 566 aa. Equivalent to Rv1743,
+ len: 566 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 566 aa overlap). Probable pknE,
+ transmembrane serine/threonine protein kinase (EC 2.7.1.-)
+ (see citation below), similar to PKN1_MYXXA|P33973
+ serine/threonine-protein kinase pkn1 (693 aa), fasta
+ scores: opt: 542, E(): 1.1e-19, (35.8% identity in 302 aa
+ overlap). Also highly similar to K08G_MYCTU|Q11053
+ probable serine/threonine-protein kinase (626 aa) (59.8%
+ identity in 381 aa overlap). Contains PS00107 Protein
+ kinases ATP-binding region signature. Contains Hank's
+ kinase subdomain. BELONGS TO THE SER/THR FAMILY OF PROTEIN
+ KINASES. Protein product from Mb1772 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1772 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSMEMBRANE SERINE/THREONINE-PROTEIN
+ KINASE E PKNE (PROTEIN KINASE E) (STPK E)"
+ /protein_id="SIU00375.1"
+ /db_xref="GOA:Q7TZN3"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="InterPro:IPR012336"
+ /db_xref="InterPro:IPR017441"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZN3"
+ /translation="MDGTAESREGTQFGPYRLRRLVGRGGMGDVYEAEDTVRERIVAL
+ KLMSETLSSDPDFRTRMQREARTAGRLQEPHVVPIHDFGEIDGQLYVDMRLINGVDLA
+ AMLRRQGPLAPPRAVAIVRQIGSALDAAHAAGATHRDVKPENILVSADDFAYLVDFGI
+ ASATTDEKLTQLGNTVGTLYYMAPERFSESHATYRADIYALTCVLYECLTGSPPYQGD
+ QLSVMGAHINQAIPRPSTVRPGIPVAFDAVIARGMAKNPEDRYVTCGDLSAAAHAALA
+ TADQDRATDILRRSQVAKLPVPSTHPVSPGTRWPQPTPWAGGAPPWGPPSSPLPRSAR
+ QPWLWVGVAVAVVVALAGGLGIALAHPWRSSGPRTSAPPPPPPADAVELRVLNDGVFV
+ GSSVAPTTIDIFNEPICPPCGSFIRSYASDIDTAVADKQLAVRYHLLNFLDDQSHSKN
+ YSTRAVAASYCVAGQNDPKLYASFYSALFGSDFQPQENAASDRTDAELAHLAQTVGAE
+ PTAISCIKSGADLGTAQTKATNASETLAGFNASGTPFVWDGSMVVNYQDPSWLARLIG
+ "
+ gene complement(1960796..1961197)
+ /locus_tag="BQ2027_MB1773C"
+ CDS complement(1960796..1961197)
+ /locus_tag="BQ2027_MB1773C"
+ /note="Mb1773c, -, len: 133 aa. Equivalent to Rv1744c,
+ len: 133 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 133 aa overlap). Probable membrane
+ protein, contains four imperfect 10 aa repeats, some
+ similarity to Q25946 (MSA-2) (FRAGMENT) from Plasmodium
+ falciparum (205 aa), FASTA scores: opt: 145, E(): 0.048,
+ (52.4% identity in 63 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE PROTEIN"
+ /protein_id="SIU00376.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZJ4"
+ /translation="MVINRSIASIDSIAVAGSAATTGAVAVAGSVATAGSVAVAGSVA
+ TAGSVAIAGAAATAGSVGIIGSLLTVLCVAVRQCVACLACITCTRCVACIGCVRCTDC
+ VGCLWCVNCSGLRNVVGAQNLRVGNLGRVSN"
+ gene complement(1961268..1961798)
+ /gene="idi"
+ /locus_tag="BQ2027_MB1774C"
+ CDS complement(1961268..1961798)
+ /gene="idi"
+ /locus_tag="BQ2027_MB1774C"
+ /note="Mb1774c, idi, len: 176 aa. Equivalent to Rv1745c,
+ len: 203 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 176 aa overlap). Probable idi,
+ isopentenyl-diphosphate delta-isomerase (EC 5.3.3.2),
+ similar to Q46822|ORF_O182 from Escherichia coli (182 aa),
+ FASTA scores: opt: 465, E(): 4.7e-25, (46.9% identity in
+ 162 aa overlap), and to IPPI_SCHPO|Q10132
+ isopentenyl-diphosphate delta-isomerase from
+ Schizosaccharomyces pombe (227 aa), FASTA scores: opt:
+ 185, E(): 5.4e-06, (30.3% identity in 152 aa overlap).
+ BELONGS TO THE IPP ISOMERASE TYPE 1 FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis,
+ truncation at the 3' end due to a single base tranversion
+ (g-t), leads to a shorter product compared to its homolog
+ in Mycobacterium tuberculosis strain H37Rv (176 aa versus
+ 203 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable isopentenyl-diphosphate delta-isomerase
+ IDI (IPP isomerase) (Isopentenyl pyrophosphate isomerase)"
+ /protein_id="SIU00377.1"
+ /db_xref="GOA:Q7VEU0"
+ /db_xref="InterPro:IPR000086"
+ /db_xref="InterPro:IPR011876"
+ /db_xref="InterPro:IPR015797"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEU0"
+ /translation="MTRSYRPAPPIERVVLLNDRGDATGVADKATVHTGDTPLHLAFS
+ SYVSDLHDQLLITRRAATKRTWPAVWTNSCCGHPLPGESLPGAIRRRLAAELGLTPDR
+ VDLILPGFRYRAAMADGTVENEICPVYRVQVDQQPRPNSDEVDAIRWLSWEQFVRDVT
+ AGVIAPVSPWCRSQLG"
+ gene 1961945..1963375
+ /gene="pknF"
+ /locus_tag="BQ2027_MB1775"
+ CDS 1961945..1963375
+ /gene="pknF"
+ /locus_tag="BQ2027_MB1775"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1775, pknF, len: 476 aa. Equivalent to Rv1746,
+ len: 476 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 476 aa overlap). pknF, transmembrane
+ serine/threonine-protein kinase (EC 2.7.1.-) (see
+ citations below), highly similar to KY28_MYCTU|Q10697
+ probable serine/threonine-protein kinase from
+ Mycobacterium tuberculosis (589 aa), FASTA scores: opt:
+ 870, E(): 0, (41.6% identity in 406 aa overlap). Contains
+ PS00108 Serine/Threonine protein kinases active-site
+ signature. Contains Hank's kinase subdomain. BELONGS TO
+ THE SER/THR FAMILY OF PROTEIN KINASES. Experimental
+ studies show evidence of auto-phosphorylation. Start site
+ chosen by homology, may extend further upstream. Protein
+ product from Mb1775 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1775 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ANCHORED-MEMBRANE SERINE/THREONINE-PROTEIN
+ KINASE PKNF (PROTEIN KINASE F) (STPK F)"
+ /protein_id="SIU00378.1"
+ /db_xref="GOA:Q7TZN1"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR008271"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZN1"
+ /translation="MPLAEGSTFAGFTIVRQLGSGGMGEVYLARHPRLPRQDALKVLR
+ ADVSADGEYRARFNREADAAASLWHPHIVAVHDRGEFDGQLWIDMDFVDGTDTVSLLR
+ DRYPNGMPGPEVTEIITAVAEALDYAHERRLLHRDVKPANILIANPDSPDRRIMLADF
+ GIAGWVDDPSGLTATNMTVGTVSYAAPEQLMGNELDGRADQYALAATAFHLLTGSPPF
+ QHANPAVVISQHLSASPPAIGDRVPELTPLDPVFAKALAKQPKDRYQRCVDFARALGH
+ RLGGAGDPDDTRVSQPVAVAAPAKRSLLRTAVIVPAVLAMLLVMAVAVTVREFQRADD
+ ERAAQPARTRTTTSAGTTTSVAPASTTRPAPTTPTTTGAADTATASPTAAVVAIGALC
+ FPLGSTGTTKTGATAYCSTLQGTNTTIWSLTEDTVASPTVTATADPTEAPLPIEQESP
+ IRVCMQQTGQTRRECREEIRRSNGWP"
+ gene 1963437..1966034
+ /locus_tag="BQ2027_MB1776"
+ CDS 1963437..1966034
+ /locus_tag="BQ2027_MB1776"
+ /note="Mb1776, -, len: 865 aa. Equivalent to Rv1747, len:
+ 865 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 865 aa overlap). Probable conserved
+ transmembrane ATP-binding protein ABC transporter (see
+ citation below), similar to others e.g Q55956 ABC
+ transporter from Synechocystis sp. (790 aa), FASTA scores:
+ opt: 738, E(): 6.3e-26, (31.6% identity in 632 aa
+ overlap); etc. Also similar to other Mycobacterium
+ tuberculosis ABC-type transporters e.g.
+ Rv2397c|MTCY253.24, FASTA score: (35.2% identity in 213 aa
+ overlap). Contains PS00017 ATP/GTP-binding site motif A
+ (P-loop), and PS00211 ABC transporters family signature.
+ BELONGS TO THE ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC
+ TRANSPORTERS). Protein product from Mb1776 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1776 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE ATP-BINDING
+ PROTEIN ABC TRANSPORTER"
+ /protein_id="SIU00379.1"
+ /db_xref="GOA:A0A1R3XZ83"
+ /db_xref="InterPro:IPR000253"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR008984"
+ /db_xref="InterPro:IPR013525"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ83"
+ /translation="MPMSQPAAPPVLTVRYEGSERTFAAGHDVVVGRDLRADVRVAHP
+ LISRAHLLLRFDQGRWVAIDNGSLNGLYLNNRRVPVVDIYDAQRVHIGNPDGPALDFE
+ VGRHRGSAGRPPQTTSIRLPNLSAGAWPTDGPPQTGTLGSGQLQQLPPATTRIPAAPP
+ SGPQPRYPTGGQQLWPPSGPQRAPQIYRPPTAAPPPAGARGGTEAGNLATSMMKILRP
+ GRLTGELPPGAVRIGRANDNDIVIPEVLASRHHATLVPTPGGTEIRDNRSINGTFVNG
+ ARVDAALLHDGDVVTIGNIDLVFADGTLARREENLLETRVGGLDVRGVTWTIDGDKTL
+ LDGISLTARPGMLTAVIGPSGAGKSTLARLVAGYTHPTDGTVTFEGHNVHAEYASLRS
+ RIGMVPQDDVVHGQLTVKHALMYAAELRLPPDTTKDDRTQVVARVLEELEMSKHIDTR
+ VDKLSGGQRKRASVALELLTGPSLLILDEPTSGLDPALDRQVMTMLRQLADAGRVVLV
+ VTHSLTYLDVCDQVLLLAPGGKTAFCGPPTQIGPVMGTTNWADIFSTVADDPDAAKAR
+ YLARTGPTPPPPPVEQPAELGDPAHTSLFRQFSTIARRQLRLIVSDRGYFVFLALLPF
+ IMGALSMSVPGDVGFGFPNPMGDAPNEPGQILVLLNVGAVFMGTALTIRDLIGERAIF
+ RREQAVGLSTTAYLIAKVCVYTVLAVVQSAIVTVIVLVGKGGPTQGAVALSKPDLELF
+ VDVAVTCVASAMLGLALSAIAKSNEQIMPLLVVAVMSQLVFSGGMIPVTGRVPLDQMS
+ WVTPARWGFAASAATVDLIKLVPGPLTPKDSHWHHTASAWWFDMAMLVALSVIYVGFV
+ RWKIRLKAC"
+ gene 1966407..1967138
+ /locus_tag="BQ2027_MB1777"
+ CDS 1966407..1967138
+ /locus_tag="BQ2027_MB1777"
+ /note="Mb1777, -, len: 243 aa. Equivalent to Rv1748, len:
+ 243 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 243 aa overlap). Hypothetical unknown
+ protein. Possibly exported protein, hydrophobic domain, TM
+ helix aa 23-45. Protein product from Mb1777 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1777 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00380.1"
+ /db_xref="GOA:A0A1R3XZ76"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ76"
+ /translation="MPGGVCSGRPWGRPWWHPGLVGLLIRLAELLVVMLPLIGVLYVG
+ IKALSSFTRRLGEASGDLASDSPAMPRPTTVENDAARWRAITRAVEAHERTDARWLEY
+ ELDAAKLLDFPVMTDMRDPLTTAFHKAKLQADFHKPLRAEDLLDDPDAAGHYLDAVRD
+ YVTAFDTAEAEAMRRRRTGFSREEQQRLARAQSLLRVASDAGATAQERERAYRLARTE
+ LDGLIVLPDRTRAGIERGIAGELDD"
+ gene complement(1967135..1967692)
+ /locus_tag="BQ2027_MB1778C"
+ CDS complement(1967135..1967692)
+ /locus_tag="BQ2027_MB1778C"
+ /note="Mb1778c, -, len: 185 aa. Equivalent to Rv1749c,
+ len: 185 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 185 aa overlap). Possible integral
+ membrane protein, similar to O27914|AE000940 hypothetical
+ protein MTH1892 from Methanobacterium thermoautotrophicum
+ (168 aa), fasta scores: E(): 9.3e-16, (37.4% identity in
+ 123 aa overlap). Protein product from Mb1778c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1778c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIU00381.1"
+ /db_xref="GOA:A0A1R3XZ62"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ62"
+ /translation="MLRAVNEIRQHDGTLKLGKGVGMFTIVGVIVALIGAFVQSRRHR
+ HRPAADIHMLWWMVLIVGVVSIIGAGYHVFDGERTAELIGYTRGDGGFQWENAMGDLA
+ IGVVGLMAYRFRGHFWLATIVVLTIQYVGDAAGHIYYWVVENNTNPYNIGVPLWTDIL
+ LPIVMWALYAWSWHSNGDAVPKGQP"
+ gene complement(1967776..1969374)
+ /gene="fadD1"
+ /locus_tag="BQ2027_MB1779C"
+ CDS complement(1967776..1969374)
+ /gene="fadD1"
+ /locus_tag="BQ2027_MB1779C"
+ /note="Mb1779c, fadD1, len: 532 aa. Equivalent to Rv1750c,
+ len: 532 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 532 aa overlap). Possible fadD1,
+ fatty-acid-CoA synthetase (EC 6.2.1.-), similar in part to
+ others e.g. O35488|VLCS_MOUSE VERY-LONG-CHAIN ACYL-COA
+ SYNTHETASE from Mus musculus (620 aa);
+ NP_113924.1|NM_031736 solute carrier family 27 (fatty acid
+ transporter) member 2 from Rattus norvegicus (620 aa);
+ NP_459076.1|NC_003197 crotonobetaine/carnitine-CoA ligase
+ from Salmonella typhimurium (517 aa); CAIC_ECOLI|P31552
+ probable crotonobetaine/carnitine-coa ligase from
+ Escherichia coli (522 aa), FASTA scores: opt: 448, E():
+ 1.9e-21, (25.1% identity in 502 aa overlap); etc. Also
+ highly similar to fadD17|Rv3506|MTV023.13 PROBABLE
+ FATTY-ACID-COA LIGASE from Mycobacterium tuberculosis (502
+ aa); and similar to others from Mycobacterium tuberculosis
+ e.g. fadD6|MTCI364.18|Rv1206|O05307 PROBABLE
+ FATTY-ACID-COA LIGASE (597 aa), FASTA score: (28.3%
+ identity in 519 aa overlap); etc. Contains PS00455
+ Putative AMP-binding domain signature. BELONGS TO THE
+ ATP-DEPENDENT AMP-BINDING ENZYME FAMILY. Protein product
+ from Mb1779c detected using SWATH mass spectrometry.
+ Mb1779c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE FATTY-ACID-COA LIGASE FADD1
+ (FATTY-ACID-COA SYNTHETASE) (FATTY-ACID-COA SYNTHASE)"
+ /protein_id="SIU00382.1"
+ /db_xref="GOA:A0A1R3XZ72"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR025110"
+ /db_xref="InterPro:IPR030310"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ72"
+ /translation="MTDTIQSLLRQHVSDPTIAVKYGGLQWTWSQYLAESAARAAALI
+ TIADPQRPTHIGSLLGNTPEMLAQLAAAGLGGYVLCGLNTTRRGDALAADVRRADCQI
+ VVTDADHRALLDGLDLAGARILDTSTPRWAELVAGDGAFVPYREVDTMDPFMMIFTSG
+ TSGNPKAVPVSHLMATFAGRSLTERFGLTEQDTCYVSMPLFHSNAVVAGWAPAVVSGA
+ AIAPATFSATGFLDDVRRYHATYMNYVGKPLAYILATPERDDDADNPLRVAFGNEAND
+ KDIEEFSRRFGVQVEDGFGSTENAVIVIREPGTPPGSIGRGAHGVAVYNGETVTECAV
+ ARFDAHGALTNADEAIGELVNTTGSGFFTGYYNDPEANAERMRHGMYWSGDLAYRDSE
+ GWIYLAGRTADWMRVDGENLTAAPIERILLRYKAINRVAVYAVPDEYVGDQVMAALVL
+ RAGDTFDPDAFEAFLDAQPDLSTKARPRYIRIAADLPSTATHKVLKRQLIDEGTAVGK
+ ADTLWVREPRGSAYHHASGPAKAI"
+ gene 1969428..1970810
+ /locus_tag="BQ2027_MB1780"
+ CDS 1969428..1970810
+ /locus_tag="BQ2027_MB1780"
+ /note="Mb1780, -, len: 460 aa. Equivalent to Rv1751, len:
+ 460 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 460 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), possibly a monooxygenase or
+ hydroxylase, similar to MHPA_ECOLI|P77397
+ 3-(3-hydroxy-phenyl) propionate hydroxylase (554 aa),
+ FASTA scores: opt: 239, E(): 2e-08, (24.6% identity in 435
+ aa overlap); and AJ007932|SAR7932.13 oxygenase from
+ Streptomyces argillaceus (436 aa), FASTA scores: opt: 587,
+ E(): 8.6e-30, (32.3% identity in 359 aa overlap). Contains
+ PS00075 Dihydrofolate reductase signature. Also similar to
+ Mycobacterium tuberculosis hypothetical oxidoreductases
+ Rv1260 and Rv0575c. Protein product from Mb1780 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1780 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="SIU00383.1"
+ /db_xref="GOA:A0A1R3Y1C5"
+ /db_xref="InterPro:IPR002938"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1C5"
+ /translation="MIATMPSMARRSRHDNKITTPAVDCLTIERLDSPASGAPQVTPY
+ ARALMGETTTCAIIGGGPAGMVLGLLLARAGVQVTLLEKHGDFLRDFRGDTVHPTTMR
+ LLDELGLWERFAALPYSEVRTATLHSNGRAVTYIDFERLHQPYPYVAMVPQWDLLNLL
+ AEAAQAEPSFTLRMKTEVTGLLREGGKVTGVRYQGAEGPGELRAELTVACDGRWSIAR
+ HEAGLKAREFPVNFDVWWFKLPREGDAEFSFLPRFSPGKGLGVIPREGYFQIAYLGPK
+ GTDAQLRERGIEEFRRDVSELLPEATASVAALASTDEVKHLNVKVNRLRRWHIDGLLC
+ IGDAAHAMSPVAGVGINLAVQDAVAAATILAEPLREHRVSSRHLAAVRRRRAFPTAVT
+ QAVQRVLHRRLLGPLLQGRDPTPPAALLGLVERLPWLSAVPAYFVGVGVRPEHAPAFA
+ RRGPGNRKGP"
+ gene 1970937..1971386
+ /locus_tag="BQ2027_MB1781"
+ CDS 1970937..1971386
+ /locus_tag="BQ2027_MB1781"
+ /note="Mb1781, -, len: 149 aa. Equivalent to Rv1752, len:
+ 149 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 149 aa overlap). Conserved hypothetical
+ protein, similar to C-terminal half of
+ Q9TV68|AB021930|CAN2DD Dihydrodiol dehydrogenase (EC
+ 1.3.1.20) from Canis familiaris (335 aa), FASTA score,
+ opt: 168, E(): 0.00015, (31.3% identity in 112 aa
+ overlap). Mb1781 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00384.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y027"
+ /translation="MDAGCYAVHMAHTFGGATPEVVSAQAKLRDPAVDRAMTAELKFP
+ GGHTGGIRCSMRSSDLLNVSARVVGDRGELRVLNPVVPQLFHRLPPLACVSARRFRCR
+ SAARASGQDDAQGRGREHERDPRDLSGRRAPIAQPELNMVAASGSAA"
+ gene complement(1971421..1974576)
+ /gene="PPE24"
+ /locus_tag="BQ2027_MB1782C"
+ CDS complement(1971421..1974576)
+ /gene="PPE24"
+ /locus_tag="BQ2027_MB1782C"
+ /note="Mb1782c, PPE24, len: 1051 aa. Similar to Rv1753c,
+ len: 1053 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (90.7% identity in 1103 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of Gly-, Asn-rich
+ proteins, similar to many e.g. YF48_MYCTU|Q10778
+ hypothetical protein cy48.17 (678 aa), FASTA scores: opt:
+ 1360, E(): 0, (48.9% identity in 550 aa overlap). Note
+ that the Gly-, Asn-rich sequence is interrupted by six
+ near-perfect 26 aa repeats, a unique region, and another,
+ more degenerate region of five 25 aa repeats before
+ resuming at the C-terminus. The end of the first Gly-,
+ Asn-rich region and the start of the first set of repeats
+ shows some similarity to Q50577|AT10S from Mycobacterium
+ tuberculosis (170 aa) (40.2% identity in 189 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 150 bp insertion and a 156 bp deletion, leads to a shorter
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (1051 aa versus 1053 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe24"
+ /protein_id="SIU00385.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR002989"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ91"
+ /translation="MNFSVLPPEINSALIFAGAGPEPMAAAATAWDGLAMELASAAAS
+ FGSVTSGLVGGAWQGASSSAMAAAAAPYAAWLAAAAVQAEQTAAQAAAMIAEFEAVKT
+ AVVQPMLVAANRADLVSLVMSNLFGQNAPAIAAIEATYEQMWAADVSAMSAYHAGASA
+ IASALSPFSKPLQNLAGLPAWLASGAPAAAMTAAAGIPALAGGPTAINLGIANVGGGN
+ VGNANNGLANIGNANLGNYNFGSGNFGNSNIGSASLGNNNIGFGNLGSNNVGVGNLGN
+ LNTGFANTGLGNFGFGNTGNNNIGIGLTGNNQIGIGGLNSGTGNFGLFNSGSGNVGFF
+ NSGNGNFGIGNSGNFNTGGWNSGHGNTGFFNAGSFNTGMLDVGNANTGSLNTGSYNMG
+ DFNPGSSNTGTFNTGNANTGFLNAGNINTGVFNIGHMNNGLFNTGDMNNGVFYRGVGQ
+ GSLQFSITTPDLTLPPLQIPGISVPAFSLPAITLPSLTIPAATTPANITVGAFSLPGL
+ TLPSLNIPAATTPANITVGAFSLPGLTLPSLNIPAATTPANITVGAFSLPGLTLPSLN
+ IPAATTPANITVSGFQLPPLSIPSVAIPPVTVPPITVGAFNLPPLQIPEVTIPQLTIP
+ AGITIGGFSLPAIHTQPITVGQIGVGQFGLPSIGWDVFLSTPRITVPAFGIPFTLQFQ
+ TNVPALQPPGGGLSTFTNGALIFGEFDLPQLVVHPYTLTGPIVIGSFFLPAFNIPGID
+ VPAINVDGFTLPQITTPAITTPEFAIPPIGVGGFTLPQITTQEIITPELTINSIGVGG
+ FTLPQITTPPITTPPLTIDPINLTGFTLPQITTPPITTPPLTIDPINLTGFTLPQITT
+ PPITTPPLTIDPINLTGFTLPQITTPPITTPPLTIDPINLTGFTLPQITTPPITTPPL
+ TIEPIGVGGFTTPPLTVPGIHLPSTTIGAFAIPGGPGYFNSSTAPSSGFFNSGAGGNS
+ GFGNNGSGLSGWFNTNPAGLLGGSGYQNFGGLSSGFSNLGSGVSGFANRGILPFSVAS
+ VVSGFANIGTNLAGFFQGTTS"
+ gene complement(1974780..1976471)
+ /locus_tag="BQ2027_MB1783C"
+ CDS complement(1974780..1976471)
+ /locus_tag="BQ2027_MB1783C"
+ /note="Mb1783c, -, len: 563 aa. Equivalent to Rv1754c,
+ len: 563 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 563 aa overlap). Conserved hypothetical
+ protein, has proline-rich central region. Some similarity
+ in central region to other Mycobacterium tuberculosis
+ proline-rich proteins e.g. O06555|Rv1157c|MTCI65.24c (371
+ aa), (32.5% identity in 191 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). Protein product
+ from Mb1783c detected using SWATH mass spectrometry.
+ Mb1783c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00386.1"
+ /db_xref="GOA:A0A1R3XZK5"
+ /db_xref="InterPro:IPR025442"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZK5"
+ /translation="MYRYQVRVQQRRSEMNRWVATRSRRHTYQWITDHKSPRDHYRHI
+ SELRTSIATSSPGRCDMSPIPRIVSVSLAWAAAIGLMVPIGLAPPAMAAPCSGDAANA
+ PPPPSAIVTDPGATALGPVRPGHGPIPTGRKPRGANDRAPLPKLGPLISALLNPGARN
+ AAPLQQQALVPRANPGPNPAPNPPATGPQPPNATQLTPNPAPAPDPAPAAAPDPGATL
+ AGATTSLAEWVTGPDSPNKTLERFGISGTDLGIPWDNGDPANRQVLMIFGDTFGYCAV
+ DGHQWRYNTLFRSQDRDLGNGVHVTSGDASNRYSGSPVRQPGFSKQLINSIKWARDET
+ GIIPTAGIAVGKTQYVNFMSIRNWGRDGEWTTNYSGIAVSKDNGQTWGVFPGTIRASG
+ PDSGGKARFVPGNENFQMGAYLKSNDGYLYSFGTPPGRGGSAYLARVPQRFVPDLTKY
+ QYWNGDSNSWVPNKPDAATPVIPGPVGEMSVQYNTYLKQYLALYTNGMNDVVARTAPA
+ PQGPWSAEQMLVSSWQMPGGIYAPMMHPWSTGKDVYFNLSLWSAYNVMLMHTVLP"
+ gene complement(1976655..1978199)
+ /gene="plcD"
+ /locus_tag="BQ2027_MB1784C"
+ CDS complement(1976655..1978199)
+ /gene="plcD"
+ /locus_tag="BQ2027_MB1784C"
+ /note="Mb1784c, plcD, len: 514 aa. Equivalent to MT1799,
+ len: 514 aa, from Mycobacterium tuberculosis strain
+ CDC1551, (100% identity in 514 aa overlap). Probable plcD,
+ phospholipase C 4 (EC 3.1.4.3) (see citation below),
+ highly similar to other phospholipases e.g.
+ Q04001|PHLA_MYCTU|Rv2351c|PLCA|MTP40|MT2416|MTCY98.20c
+ PROBABLE MEMBRANE-ASSOCIATED PHOSPHOLIPASE C 1 PLCA from
+ Mycobacterium tuberculosis (512 aa), FASTA score: opt:
+ 2657, E(): 4.9e-156, (71.1% identity in 512 aa overlap);
+ P95246|PHLB_MYCTU|PLCB|MPCB|Rv2350c|MT2415|MTCY98.19c
+ PROBABLE MEMBRANE-ASSOCIATED PHOSPHOLIPASE C 2 PLCB from
+ Mycobacterium tuberculosis (512 aa), FASTA score: opt:
+ 2638, E(): 7.3e-155, (70.9% identity in 512 aa overlap);
+ etc. BELONGS TO THE BACTERIAL PHOSPHOLIPASE C FAMILY.
+ REMARK-M.bovis-M.tuberculosis: No equivalent in
+ Mycobacterium tuberculosis strain H37Rv. Belong to RvD2
+ region."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOSPHOLIPASE C 4 PLCD"
+ /protein_id="SIU00387.1"
+ /db_xref="GOA:P0A5R9"
+ /db_xref="InterPro:IPR006311"
+ /db_xref="InterPro:IPR007312"
+ /db_xref="InterPro:IPR017850"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5R9"
+ /translation="MSQSHIGGVSRREFLAKVAAGGAGALMSFAGPVIEKAYGAGPCS
+ GHLTDIEHFVFFMQENRSFDHYFGTLSGTDGFNTVSPLFQQKGWNPMTQALDATGVTM
+ PYRFDTTRGPFLDGACVNDPDHSWVAMHESWNGGVNDNWLPAQAKTRSAAHTPTVMGY
+ YTRQDIPIHYLLADAFTVCDRYFCSVLGPTLPNRLYWLSATIDPDGQNGGPELQSPTF
+ QPVRRFGWRIMPQNLSDAGVSWKVYRNKTLGPISSVLTYGSLVTSFKQSADPRSDLVR
+ FGVAPSYPASFAADVLANRLPRVSWVIPNVLESEHPAVPAAAGAFAIVNILRILLANP
+ AVWEKTALIVSYDENGGFFDHVVPATAPAGTPGEYVTVPDIDQVPGSGGIRGPIGLGF
+ RVPCFVISPYSRGPQMVHDTFDHTSQLRLLETRFGVPVPNLTAWRRSVTGDMTSTFNF
+ AVPPNSSWPNLDYPGLHALSTVPQCVPNAALGTINRGIPYRVPDPQIMPTQETTPTRG
+ IPSGPC"
+ gene complement(1978328..1979512)
+ /locus_tag="BQ2027_MB1785C"
+ CDS complement(1978328..1979512)
+ /locus_tag="BQ2027_MB1785C"
+ /note="Mb1785c, -, len: 394 aa. Similar to MT1800 (also
+ known as RVD2-ORF1), len: 381 aa, from Mycobacterium
+ tuberculosis strain CDC1551, (99.71% identity in 345 aa
+ overlap). Conserved hypothetical protein (see citation
+ below), showing similarity with glycosyl transferases,
+ sulfolipid sulfoquinovosyldiacylglycerol synthases, and
+ hypothetical proteins, e.g. Q9R6U1|SQDX SQDX PROTEIN
+ (required for biosynthesis of the sulfolipid
+ sulfoquinovosyldiacylglycerol) from Synechococcus sp.
+ strain PCC 7942 (Anacystis nidulans R2) (377 aa), FASTA
+ scores: opt: 348, E(): 6.7e-15, (30.40% identity in 296 aa
+ overlap); Q8YUR9|SQDX|ALR2265 SULFOLIPID
+ SULFOQUINOVOSYLDIACYLGLYCEROL BIOSYNTHESIS PROTEIN from
+ Anabaena sp. strain PCC 7120 (378 aa), FASTA scores: opt:
+ 336, E(): 4e-14, (27.832% identity in 309 aa overlap);
+ Q9AA50|CC0756 GLYCOSYL TRANSFERASE (GROUP 1 FAMILY
+ PROTEIN) from Caulobacter crescentus (455 aa), FASTA
+ scores: opt: 333, E(): 7.1e-14, (29.5% identity in 315 aa
+ overlap); etc. REMARK-M.bovis-M.tuberculosis: No
+ equivalent in Mycobacterium tuberculosis strain H37Rv.
+ Belongs to the RvD2 region."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00388.1"
+ /db_xref="InterPro:IPR001296"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ97"
+ /translation="MSLTAHDGRFCSRYACCSGRQLLWTSLGRTPHRGGPAGRGILRQ
+ RTRGVLIVPGARTERHLLRTGVVRITLPAKHIPYTGGYRAVMPGAVRTVLETLRPDTL
+ EVSDRLTLRSLGRWGREHGVTTVMISHERLDRFAGQLLPRRAAQKFADFANARTAANY
+ DTVVCTTGFAREEFDRIGATNTVTVPLGVDLKTFHPRRRCARVRQHWATPTQILLVHC
+ GRLSVEKHADRSIDALAALCDAGVDARLVIAGEGPLRARLERKATGLPIDFTGFISDR
+ HAVAGLLASADVALAPGPHETFGLAALESLACGTPAVVSRTSALTEIITADSGACADN
+ RPEAIAHAVRTIVSRPERHRRRCARRRAEIFTWQRAAASMLATLGAMAVSTRCGDTQD
+ TA"
+ gene 1979662..1980801
+ /locus_tag="BQ2027_MB1786"
+ CDS 1979662..1980801
+ /locus_tag="BQ2027_MB1786"
+ /note="Mb1786, -, len: 379 aa. Equivalent to MT1801, len:
+ 379 aa, from Mycobacterium tuberculosis strain CDC1551,
+ (99.75% identity in 379 aa overlap). See citations below.
+ Possible sulfite oxidase (EC 1.8.3.1), showing similarity
+ with others e.g. P51687|SUOX_HUMAN Sulfite oxidase,
+ mitochondrial precursor from Homo sapiens (488 aa), FASTA
+ scores: opt: 952, E(): 6.1e-52, (43.7% identity in 357 aa
+ overlap); Q07116|SUOX_RAT Sulfite oxidase, mitochondrial
+ precursor from Rattus norvegicus (488 aa), FASTA scores:
+ opt: 952, E(): 6.1e-52, (43.8% identity in 356 aa
+ overlap); Q9VWP4|CG7280 PROBABLE SULFITE OXIDASE PRECURSOR
+ from Drosophila melanogaster (Fruit fly) (573 aa), FASTA
+ scores: opt: 764, E(): 4e-40, (38.4% identity in 362 aa
+ overlap); etc. REMARK-M.bovis-M.tuberculosis: No
+ equivalent in Mycobacterium tuberculosis strain H37Rv.
+ Belong to RvD2 region."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE SULFITE OXIDASE"
+ /protein_id="SIU00389.1"
+ /db_xref="GOA:A0A1R3XZ93"
+ /db_xref="InterPro:IPR000572"
+ /db_xref="InterPro:IPR005066"
+ /db_xref="InterPro:IPR008335"
+ /db_xref="InterPro:IPR014756"
+ /db_xref="InterPro:IPR022407"
+ /db_xref="InterPro:IPR036374"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ93"
+ /translation="MTDRGENRTTIAMLETAGLWGKRADMIVRGCLPYNAEPPPAVLA
+ GSDITPINAFYVRNHGPVPDIAPQHWRLTVGGLVDNPLTVTYERLTTEFDQHCVVATL
+ ACAGNRRAELLRVRQIPGKEPWAHGAISTAQWCGVRLADILQAADVHIDEGLHVAFDA
+ PDVAEEARPIQPYGSSIPLSKALSPEVLLAWQMNSEPLPRAHGGPVRVVVPGFIGARS
+ VKWVTAITVQPGASQNYFQALDYRILPADADADIVGPGEGISLSSLALNCDILDPTDG
+ DDVPAGALTIRGYGMAGDGRSVERVDVSVDDGLTWQQADLHAAPSQWSWRPWSLTVDV
+ EPGPLGITARAWDDTGALQPESAVSLWNPRGYGNNAWARVALRVS"
+ gene 1981002..1983839
+ /gene="mmpL14"
+ /locus_tag="BQ2027_MB1787"
+ CDS 1981002..1983839
+ /gene="mmpL14"
+ /locus_tag="BQ2027_MB1787"
+ /note="Mb1787, mmpL14, len: 945 aa. Equivalent to MT1802
+ (also known as RVD2-ORF3), len: 945 aa, from Mycobacterium
+ tuberculosis strain CDC1551, (99.7% identity in 945 aa
+ overlap). Probable mmpL14, conserved transmembrane
+ transport protein (see citation below). Member of RND
+ superfamily, similar to several putative transport
+ proteins e.g.
+ O53784|MML5_MYCTU|MMPL5|Rv0676c|MT0705|MTV040.04c PROBABLE
+ CONSERVED TRANSMEMBRANE TRANSPORT PROTEIN from
+ Mycobacterium tuberculosis strain H37Rv (964 aa), FASTA
+ scores: opt: 1171, E(): 2.5e-61, (32.10% identity in 947
+ aa overlap);
+ P95211|MML1_MYCTU|MMPL1|Rv0402c|MT0412|MTCY04D9.15c
+ PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT PROTEIN from
+ Mycobacterium tuberculosis strain H37Rv (958 aa), FASTA
+ scores: opt: 1170, E(): 2.8e-61, (33.1% identity in 940 aa
+ overlap); etc. BELONGS TO THE MMPL FAMILY.
+ REMARK-M.bovis-M.tuberculosis: No equivalent in
+ Mycobacterium tuberculosis strain H37Rv. Belong to RvD2
+ region. Mb1787 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL14"
+ /protein_id="SIU00390.1"
+ /db_xref="GOA:A0A1R3XZ87"
+ /db_xref="InterPro:IPR004707"
+ /db_xref="InterPro:IPR004869"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ87"
+ /translation="MTAIGRLIHRYAIWIVGVWALAAIIGNNFAPPLEQVITAEDQPF
+ SPAGTATSRAVERSAAAFSQAPGDNIGYLVLERNGVLNDQDRAYYDALVVALRRDSRH
+ VIEVVDWWGTPAIAEVARSDDHHAVTAALRFGGMVGTSQAGESITAARSIVTQLHPPD
+ GLHVFVTGPGATIVDEFAAIDRQTQLITATTIVVLLILLLIVYRSAITATVPLLSVVV
+ SLAVAKPIVSVLVDRDFIGISLFSLGLSVAVVVGAGTGFAMFLIGRYHERRRQHIAPA
+ AALADAYRGVAPAIAGATFIVVTSLGAVGWLSLARIGMFATTGILCSIGVLAVGLAAL
+ TLTPALVALASRANLLKPPQHKRIQRQFRRLGTHVARWPAPILVASGVFVLIMMIALP
+ RVPIGWDEAAATPSAAESNRGYRAADRHFAPNQLLPTQVMIETDHDIRNPAGLTAIER
+ ITAAIMAIGGVRMVQSASHPNGMVSKQAALTASAGNLGDQLDEFSDQLTSRQATFTNL
+ EAAVRDVVSALDLVQAGIRQDGYGLGQVSLAVRLMQQAITKLQGSAGDVFDIFDPLRR
+ FVAAIPECRANPVCSVAQEVVQWANTVTESCAKLADAAGQLARGIADVASATSGVSGL
+ PNALDGIGGQLAQVRESAAGVQELLNNVGAAPLRELPDYLRELAAVSQSAPGVDLYAA
+ RRILTDPNMRAVLDYFVSPNGHATRLLVYGDGSEWGDDGAQRARAIVTAVAEETDEGT
+ LRPTAVELTGVGPATRDLQDLVGSDLTLLAVITLAVIFAIAALLLRSPLAGLVVVGTI
+ ATSYICALGASVVIWKHILGDNLHWSVLPIAFVLLISVGSAYNLLFALRIREESPAGP
+ RTSVIRAFAATGMVVTAAGIVFGTTMFALAASTSLSVAQIGVTVGMGLLLDALVIRGF
+ VLPALMVLLGRWLWWPRRSVSNRQVPEPSPA"
+ gene 1984160..1984816
+ /gene="cut1"
+ /locus_tag="BQ2027_MB1788"
+ CDS 1984160..1984816
+ /gene="cut1"
+ /locus_tag="BQ2027_MB1788"
+ /note="Mb1788, -, len: 218 aa. Similar to Rv1758, len: 174
+ aa, from Mycobacterium tuberculosis strain H37Rv, (98.25%
+ identity in 172 aa overlap). Probable cut1, serine
+ esterase, cutinase family (EC 3.1.1.-), similar to
+ Rv2301|CUT2_MYCTU|Q50664 probable cutinase cy339.08c
+ precursor from Mycobacterium tuberculosis (219 aa), FASTA
+ scores: opt: 369, E(): 1. 1e-16, (39.1% identity in 179 aa
+ overlap). Also similar to Mycobacterium tuberculosis
+ hypothetical cutinases Rv3452, Rv1984c, Rv3451 and Rv3724.
+ CDS has been interrupted by IS6110 insertion element and
+ 5'-end deleted. BELONGS TO THE CUTINASE FAMILY.
+ REMARK-M.bovis-M.tuberculosis: Belongs to the RvD2 region.
+ In Mycobacterium tuberculosis strain H37Rv, Rv1758 is
+ interrupted by IS6110 insertion element and the 5'-end is
+ deleted."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CUTINASE CUT1"
+ /protein_id="SIU00391.1"
+ /db_xref="GOA:A0A1R3XZ70"
+ /db_xref="InterPro:IPR000675"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ70"
+ /translation="MVTTWALLFAPVPAASADPPDPTVSDGACPDVEVVFARGTGEPP
+ GVGGIGEDFIDALRSKIGEKSMGVYGVDYPATTDFPTAMAGIYDAGTHVEQTAANCPQ
+ SKLVLGGFSQGAAVMGFVTAAAIPDGAPLDAPRPMPPEVADHVAAVTLFGMPSVAFMH
+ SIGAPPIVIGPLYAEKTIQLCAPGDPVCSSGGNWAAHNGYADDGMVEQAAVFAAGRLG
+ "
+ gene complement(1985083..1987545)
+ /gene="wag22b"
+ /locus_tag="BQ2027_MB1789C"
+ CDS complement(1985083..1987545)
+ /gene="wag22b"
+ /locus_tag="BQ2027_MB1789C"
+ /note="Mb1789c, wag22b, len: 820 aa. Equivalent to 3' end
+ of Rv1759c, len: 914 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 820 aa overlap). wag22,
+ antigen member of the Mycobacterium tuberculosis PE
+ family, PGRS subfamily of gly-rich proteins, highly
+ similar to others e.g. MT1367|Q10637 hypothetical
+ glycine-rich 49.6 kd protein from Mycobacterium
+ tuberculosis (603 aa), FASTA scores: opt: 2010, E(): 0,
+ (53.0% identity in 724 aa overlap); etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1759c exists as a single
+ gene. In Mycobacterium bovis, a single base deletion (c-*)
+ splits wag22 into 2 parts, wag22a and wag22b."
+ /codon_start=1
+ /transl_table=11
+ /product="PE-PGRS FAMILY PROTEIN WAG22B [SECOND PART]"
+ /protein_id="SIU00392.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/Swiss-Prot:P0A687"
+ /translation="MTPLLNSINAPVLAATGRPLIGNGANGAPGTGANGGDAGWLIGN
+ GGAGGSGAKGANGGAGGPGGAAGLFGNGGAGGAGGTATANNGIGGAGGAGGSAMLFGA
+ GGAGGAGGAATSLVGGIGGTGGTGGNAGMLAGAAGAGGAGGFSFSTAGGAGGAGGAGG
+ LFTTGGVGGAGGQGHTGGAGGAGGAGGLFGAGGMGGAGGFGDHGTLGTGGAGGDGGGG
+ GLFGAGGDGGAGGSGLTTGGAAGNGGNAGTLSLGAAGGAGGTGGAGGTVFGGGKGGAG
+ GAGGNAGMLFGSGGGGGTGGFGFAAGGQGGVGGSAGMLSGSGGSGGAGGSGGPAGTAA
+ GGAGGAGGAPGLIGNGGNGGNGGESGGTGGVGGAGGNAVLIGNGGEGGIGALAGKSGF
+ GGFGGLLLGADGYNAPESTSPWHNLQQDILSFINEPTEALTGRPLIGNGDSGTPGTGD
+ DGGAGGWLFGNGGNGGAGAAGTNGSAGGAGGAGGILFGTGGAGGAGGVGTAGAGGAGG
+ AGGSAFLIGSGGTGGVGGAATTTGGVGGAGGNAGLLIGAAGLGGCGGGAFTAGVTTGG
+ AGGTGGAAGLFANGGAGGAGGTGSTAGGAGGAGGAGGLYAHGGTGGPGGNGGSTGAGG
+ TGGAGGPGGLYGAGGSGGAGGHGGMAGGGGGVGGNAGSLTLNASGGAGGSGGSSLSGK
+ AGAGGAGGSAGLFYGSGGAGGNGGYSLNGTGGDGGTGGAGQITGLRSGFGGAGGAGGA
+ SDTGAGGNGGAGGKAGLYGNGGDGGAGGDGATSGKGGAGGNAVVIGNGGNGGNAGKAG
+ GTAGAGGAGGLVLGRDGQHGLT"
+ gene complement(1987542..1987826)
+ /gene="wag22a"
+ /locus_tag="BQ2027_MB1790C"
+ CDS complement(1987542..1987826)
+ /gene="wag22a"
+ /locus_tag="BQ2027_MB1790C"
+ /note="Mb1790c, wag22a, len: 94 aa. Equivalent to 5' end
+ of Rv1759c, len: 914 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100% identity in 84 aa overlap). wag22,
+ antigen member of the Mycobacterium tuberculosis PE
+ family, PGRS subfamily of gly-rich proteins, highly
+ similar to others e.g. MT1367|Q10637 hypothetical
+ glycine-rich 49.6 kd protein from Mycobacterium
+ tuberculosis (603 aa), FASTA scores: opt: 2010, E(): 0,
+ (53.0% identity in 724 aa overlap); etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1759c exists as a single
+ gene. In Mycobacterium bovis, a single base deletion (c-*)
+ splits wag22 into 2 parts, wag22a and wag22b. Mb1790c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PE-PGRS FAMILY PROTEIN WAG22A [FIRST PART]"
+ /protein_id="SIU00393.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/Swiss-Prot:P0A687"
+ /translation="MSFVIAVPETIAAAATDLADLGSTIAGANAAAAANTTSLLAAGA
+ DEISAAIAALFGAHGRAYQAASAEAAAFHGRFVQALTTGGAPMRPPRPPP"
+ gene 1988402..1989931
+ /locus_tag="BQ2027_MB1791"
+ CDS 1988402..1989931
+ /locus_tag="BQ2027_MB1791"
+ /note="Mb1791, -, len: 509 aa. Equivalent to the 5' end of
+ Rv1760, len: 502 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.5% identity in 442 aa overlap).
+ Conserved hypothetical protein, similar to several other
+ Mycobacterium tuberculosis hypothetical proteins e.g.
+ Q10554|Y895_MYCTU|MTCY31.23 (505 aa), FASTA scores: opt:
+ 692, E(): 0, (31.7% identity in 477 aa overlap). Member of
+ family with at least 15 other members e.g. Rv3740c,
+ Rv3734c, Rv1425, etc. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a frameshift due to a single base
+ deletion (c-*) leads to a longer product with a different
+ COOH part compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv. Mb1791 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible triacylglycerol synthase
+ (diacylglycerol acyltransferase)"
+ /protein_id="SIU00394.1"
+ /db_xref="GOA:A0A1R3Y029"
+ /db_xref="InterPro:IPR004255"
+ /db_xref="InterPro:IPR009721"
+ /db_xref="InterPro:IPR014292"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y029"
+ /translation="MPRGCAGARFACNACLNFLAGLGISEPISPGWAAMERLSGLDAF
+ FLYMETPSQPLNVCCVLELDTSTMPGGYTYGRFHAALEKYVKAAPEFRMKLADTELNL
+ DHPVWVDDDNFQIRHHLRRVAMPAPGGRRELAEICGYIAGLPLDRDRPLWEMWVIEGG
+ ARSDTVAVMLKVHHAVVDGVAGANLLSHLCSLQPDAPAPQPVRGTGGGNVLQIAASGL
+ VGFASRPVRLATVVPATVLTLVRTLLRAREGRTMAAPFSAPPTPFNGPLGRLRNIAYT
+ QLDMRDVKRVKDRFGVTINDVVVALCAGALRRFLLEHGVLPEAPLVATVPVSVHDKSD
+ RPGRNQATWMFCRVPSQISDPAQRIRTIAAGNTVAKDHAAAIGPTLLHDWIQFGGSTM
+ FGAAMRILPHISITHSPAYNLILSNVPGPQAQLYFLGCRMDSMFPLGPSLATRASTSP
+ SCPSTGNWVSALSPAPTCCRTCGAWQTGFPRRSKSCWSAVMTSRKAATTRTPESYVQN
+ R"
+ gene complement(1989919..1990302)
+ /locus_tag="BQ2027_MB1792C"
+ CDS complement(1989919..1990302)
+ /locus_tag="BQ2027_MB1792C"
+ /note="Mb1792c, -, len: 127 aa. Equivalent to Rv1761c,
+ len: 127 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 127 aa overlap). Possibly exported
+ protein with hydrophobic stretch or TMhelix at aa 15-37.
+ Protein product from Mb1792c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1792c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible exported protein"
+ /protein_id="SIU00395.1"
+ /db_xref="GOA:A0A1R3XZA7"
+ /db_xref="InterPro:IPR031816"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZA7"
+ /translation="MSDFDTERVSRAVAAALVGPGGVALVVKVFAGLPGVIHTPARRG
+ FFRSNPERIQIGDWRYEVAHDGRLLAAHMVNGIVIAEDALIAEAVGPHLARALGQIVS
+ RYGATVIPNINAAIEVLGTGTDYRF"
+ gene complement(1990302..1991090)
+ /locus_tag="BQ2027_MB1793C"
+ CDS complement(1990302..1991090)
+ /locus_tag="BQ2027_MB1793C"
+ /note="Mb1793c, -, len: 262 aa. Equivalent to Rv1762c,
+ len: 262 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 262 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1793c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1793c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00396.1"
+ /db_xref="InterPro:IPR002765"
+ /db_xref="InterPro:IPR035439"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZL4"
+ /translation="MQSSSLDPVASERLSHAEKSFTSDLSINEFALLHGAGFEPIELV
+ MGVSVYHVGFQFSGMRQQQELGVLTEATYRARWNAMARMQAEADALKADGIVGVRLNW
+ RHHGEGGEHLEFMAVGTAVRYTAKPGAFRRPNGQAFSSHLSGQDMVTLLRSGFAPVAF
+ VMGNCVFHIAVQGFMQTLRQIGRNMEMPQWTQGNYQARELAMSRMQSEAERDGATGVV
+ GVHFAISNYAWGVHTVEFYTAGTAVRRTGSGETITPSFVLPMDS"
+ gene complement(1992108..1993364)
+ /locus_tag="BQ2027_MB1794C"
+ CDS complement(1992108..1993364)
+ /locus_tag="BQ2027_MB1794C"
+ /note="Mb1794c, -, len: 418 aa. Equivalent to Rv1765c,
+ len: 365 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (97.8% identity in 364 aa overlap). Conserved hypothetical
+ protein, highly similar to O53461|Rv2015c|MTV018.02c
+ CONSERVED HYPOTHETICAL PROTEIN (418 aa), (97.8% identity
+ in 364 aa overlap). BLAST hits with non-IS part of
+ sequence submitted under MTU78639.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 121 bp to 848 bp substitution affects the COOH part of
+ Mb1794c leading to a longer product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (418 aa
+ versus 365 aa). Mb1794c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HNH endonuclease domain protein"
+ /protein_id="SIU00397.1"
+ /db_xref="GOA:A0A1R3XZ95"
+ /db_xref="InterPro:IPR002711"
+ /db_xref="InterPro:IPR003615"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ95"
+ /translation="MSSTATSGAAVVSPAERVEVLFEELAELAGQRNAIDGRIVEIVA
+ ELDRDGLWGVTGARSVAGLVAWKMGCSSGNAHTIATVARRLPEFPRCARGMREGRLSL
+ DQVGVIAGRAGEGSDAHYAQLAGVATVNQLRTALKLEPRPEPEPDFRPEPRPSITRSA
+ DEQFSCWRIKLPHVEAAKFDAALQSHLDALIAEYKRDHDNSDGVSDQRPPLPGNVEAF
+ LRLVEAGWDAEVARRPHGQHTTVVMHLDVQERAAGLHLGPLLSESERRYLLCDATFEA
+ WFERDGQVIGCGRTTRQINRRLRRALEHRDRTCVVPGCGATRGLHAHHIRHWQDGGAT
+ ELANLVLVCPYHHRAHHRGLITITGPADNLTVADSAGRPLSAGSLARASTKPPPAVAP
+ WPGPTGERADWWWYEPFQPQPPPISN"
+ gene complement(1993433..1994662)
+ /locus_tag="BQ2027_ISB9'"
+ mobile_element complement(1993433..1994662)
+ /locus_tag="BQ2027_ISB9'"
+ /note="ISB9', len: 1230 nt. Equivalent to ISB9', len: 1230
+ nt, from Mycobacterium tuberculosis strain H37Rv, (99.9%
+ identity in 1230 nt overlap). Sequence ISB9, nearly
+ identical to EM_BA:MTU78639. Note that this sequence shows
+ several differences to EM_BA: MTU78639, and the
+ transposase ORFs are extensively frameshi fted. Our
+ sequence has been checked and is thought to be correct;
+ the sequence in EM_BA:MTU78639 is from a different isolate
+ of Mycobacterium tuberculosis."
+ /mobile_element_type="insertion sequence:ISB9"
+ repeat_region 1993433..1993446
+ /note="14 bp imperfect inverted repeat,
+ IRR,ATCACCCCGCAAAG, flanking IS element ISB9'."
+ /rpt_type=INVERTED
+ gene complement(1993991..1994206)
+ /locus_tag="BQ2027_MB1795C"
+ CDS complement(1993991..1994206)
+ /locus_tag="BQ2027_MB1795C"
+ /note="Mb1795c, -, len: 71 aa. Equivalent to Rv1765A, len:
+ 71 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.6% identity in 71 aa overlap). Putative transposase
+ (fragment), similar to part of many transposase genes
+ including IS6110 e.g. P19774|TRA9_MYCTU PUTATIVE
+ TRANSPOSASE from Mycobacterium tuberculosis (278 aa),
+ FASTA scores: opt: 231, E(): 4.7e-11, (45.35% identity in
+ 75 aa overlap). Mb1795c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE TRANSPOSASE (FRAGMENT)"
+ /protein_id="SIU00398.1"
+ /db_xref="InterPro:IPR012337"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZA2"
+ /translation="MWVADITFVRTWQGFCYTAFVTDVCTRKIVVRAVSATMRTEDLP
+ VQVFNHAVWQSNSDLSELVHHSDPGSQ"
+ gene 1994586..1994855
+ /locus_tag="BQ2027_MB1795A"
+ CDS 1994586..1994855
+ /locus_tag="BQ2027_MB1795A"
+ /note="Mb1795A, -, len: 89 aa. Equivalent to Rv1766, len:
+ 89 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 89 aa overlap). Conserved hypothetical
+ protein, highly similar to P54431|YRKD_BACSU Hypothetical
+ 7.0 kDa protein in bltr-spoIIIC intergenic region from
+ Bacillus subtilis (63 aa), FASTA scores: opt: 151, E():
+ 1.5e-05, (53.3% identity in 45 aa overlap). Also similar
+ to Q9RD62|SCF56.04C|AL133424 Hypothetical protein from
+ Streptomyces coelicolor (92 aa), FASTA scores: opt: 239,
+ E(): 1.3e-11, (62.5% identity in 64 aa overlap). Also some
+ similarity to other Mycobacterium tuberculosis
+ hypothetical proteins e.g. O07434|Rv0190|MTCI28.29 (96
+ aa), (35.5% identity in 62 aa overlap); P71543|Rv0967 (119
+ aa), and P71600|Rv0030 (109 aa). Start changed since
+ original submission. Protein product from Mb1795A detected
+ using SWATH mass spectrometry. Mb1795A found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Metal-sensitive transcriptional repressor"
+ /protein_id="SIU00399.1"
+ /db_xref="GOA:A0A1R3XZA6"
+ /db_xref="InterPro:IPR003735"
+ /db_xref="InterPro:IPR038390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZA6"
+ /translation="MIGDQDSIAAVLNRLRRAQGQLAGVISMIEQGRDCRDVVTQLAA
+ VSRALDRAGFKIVAAGLKECVSGATASGAAPLSAAELEKLFLALA"
+ repeat_region complement(1994649..1994662)
+ /locus_tag="BQ2027_ISB9'"
+ /note="14 bp imperfect inverted repeat,
+ IRL,ATCACCCCGGCAAG, flanking IS element ISB9'."
+ /rpt_type=INVERTED
+ gene 1994923..1995282
+ /locus_tag="BQ2027_MB1796"
+ CDS 1994923..1995282
+ /locus_tag="BQ2027_MB1796"
+ /EC_number="4.1.1.44"
+ /note="Mb1796, -, len: 119 aa. Equivalent to Rv1767, len:
+ 119 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 119 aa overlap). Conserved
+ hypothetical protein, similar to Q57498|YA53_HAEIN
+ HYPOTHETICAL PROTEIN HI1053 from Haemophilus influenzae
+ (113 aa), FASTA scores: opt: 233, E(): 6.4e-10, (40.0%
+ identity in 90 aa overlap). Protein product from Mb1796
+ detected using SWATH mass spectrometry. Mb1796 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible carboxymuconolactone decarboxylase
+ family protein (EC"
+ /protein_id="SIU00400.1"
+ /db_xref="GOA:A0A1R3XZ98"
+ /db_xref="InterPro:IPR003779"
+ /db_xref="InterPro:IPR004675"
+ /db_xref="InterPro:IPR029032"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ98"
+ /translation="MSDQPRHHQVLDDLLPQHRALRHQIPQVYQRFVALGDAALTDGA
+ LSRKVKELVALAIAVVQGCDGCVASHAQAAVRAGATAQEAAEAIGVTILMHGGPATIH
+ GARAYAAFCEFADTTPS"
+ gene 1995463..1997337
+ /gene="PE_PGRS31"
+ /locus_tag="BQ2027_MB1797"
+ CDS 1995463..1997337
+ /gene="PE_PGRS31"
+ /locus_tag="BQ2027_MB1797"
+ /note="Mb1797, PE_PGRS31, len: 624 aa. Equivalent to
+ Rv1768, len: 618 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (98.88% identity in 624 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to Q50615
+ HYPOTHETICAL 40.8 KD PROTEIN (498 aa), FASTA scores: opt:
+ 1703, E(): 0, (57.4% identity in 566 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 18 bp insertion, leads to a longer product compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv (624 aa
+ versus 618 aa). Mb1797 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs31"
+ /protein_id="SIU00401.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ75"
+ /translation="MSYLVVVPELVAAAATDLANIGSSISAANAAAAAPTTALVAAGG
+ DEVSAAIAALFGAHARAYQALSAQAAMFHEQFVRALAAGGNSYAVAEAATAQSVQQDL
+ LNLINAPTQALLGRPLIGNGANGLPGTGQNGGDGGILYGNGGNGGSGGVNQAGGNGGN
+ AGLWGNGGSGGAGGNATTAGRNGFNGGAGGSGGLLWGNGGAGGAGGHGGPAPLVGGVG
+ TTGGAGGNGGGAGLFYGFGGAGGNGGMGGVAPSTGPSMGILPAGGVGGPGGSGGASAL
+ AFGSGGVGGAGGLGGPTDGTVQGVGGFGGQGGNGGQSGLLFGNAGAGGAGAAGGAGTG
+ DTESFGGHGGAGGDGGAVGLIGNGGGGGNGGAGGTGSPGAVVGGNGGVGGLGGAGSPG
+ GLLYGTGGAGGNGGPGGDGGTGATVGFAGSGGFGGAGGIAQLFGTGGMGGSGGGIGAG
+ TTTVVPPDVAPVGGTGGNGGRAGLLLGVGGMGGNGGATSVGGTLYAAGGNGGDGGLVW
+ GNGGTGGSGGAGGAGSVGNGGAGGNAALLFGNGGAGGAGGAGGIGAGGAGGFGAVLFG
+ NGGAGGSGAPGGIGAGGNGGNALLVGNGGNGGAGTGGAAGGAGGSGGLLFGQNGMPGP
+ "
+ gene 1997493..1998737
+ /locus_tag="BQ2027_MB1798"
+ CDS 1997493..1998737
+ /locus_tag="BQ2027_MB1798"
+ /EC_number="1.1.3.8"
+ /note="Mb1798, -, len: 414 aa. Equivalent to Rv1769, len:
+ 414 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 414 aa overlap). Conserved
+ hypothetical protein, similar to O88066|SCI35.31|AL031541
+ hypothetical protein from Streptomyces coelicolor (402
+ aa), FASTA scores: opt: 1341, E(): 0, (53.8% identity in
+ 398 aa overlap). Protein product from Mb1798 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1798 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="L-gulono-1,4-lactone oxidase (EC"
+ /protein_id="SIU00402.1"
+ /db_xref="InterPro:IPR001608"
+ /db_xref="InterPro:IPR029066"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ90"
+ /translation="MHEVAAREQRSDGPMRLDAQGRLQRYEEAFADYDAPFAFVDLDA
+ MWGNADQLLARAGDKPIRVASKSLRCRPLQREILDASERFDGLLTFTLTETLWLAGQG
+ FSNLLLAYPPTDRAALRALGELTAKDPDGAPIVMVDSVEHLDLIERTTDKPVRLCLDF
+ DAGYWRAGGRIKIGSKRSPLHTPEQARALAVEIARRPALTLAALMCYEAHIAGLGDNV
+ AGKRVHNAIIRRMQRMSFEELRERRARAVELVREVADIKIVNAGGTGDLQLVAQEPLI
+ TEATAGSGFYAPTLFDSYSTFTLQPAAMFALPVCRRPGAKTVTALGGGYLASGVGAKD
+ RMPTPYLPVGLKLNALEGTGEVQTPLSGDAARRLKLGDKVYFRHTKAGELCERFDHLH
+ LVRGAEVVDTVPTYRGEGRTFL"
+ gene 1998745..2000031
+ /locus_tag="BQ2027_MB1799"
+ CDS 1998745..2000031
+ /locus_tag="BQ2027_MB1799"
+ /note="Mb1799, -, len: 428 aa. Equivalent to Rv1770, len:
+ 428 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 428 aa overlap). Conserved
+ hypothetical protein, highly similar in N-terminus to
+ Q49882 Hypothetical protein from Mycobacterium leprae from
+ cosmid L247 (83 aa), FASTA scores: opt: 301, E(): 1e-12,
+ (56.5% identity in 85 aa overlap). Protein product from
+ Mb1799 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1799 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative aminopeptidase"
+ /protein_id="SIU00403.1"
+ /db_xref="InterPro:IPR007484"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1E3"
+ /translation="MDEAHPAHPADAGRPGGPIQGARRGAAMTPITALPTELAAMREV
+ VETLAPIERAAGEPGEHKAAEWIVERLRTAGAQDARIEEEQYLDGYPRLHLKLSVIGV
+ AAGVAGLLSRRLRIPAALAGVGAGLAIADDCANGPRIVRKRTETPRTTWNAVAEAGDP
+ AGQLTVVVCAHHDAAHSGKFFEAHIEEVMVELFPGIVERIDTQLPNWWGPILAPALAG
+ VGALRGSRPMMIAGTVGSALAAALFADIARSPVVPGANDNLSAVALLVALAERLRERP
+ VKGVRVLLVSLGAEETLQGGIYGFLARHKPELDRDRTYFLNFDTIGSPELIMLEGEGP
+ TVMEDYFYRPFRDLVIRAAERADAPLRRGIRSRNSTDAVLMSRAGYPTACFVSINRHK
+ SVANYHLMSDTPENLCYETVSHAVTVAESVIRELAR"
+ gene 2000028..2001314
+ /locus_tag="BQ2027_MB1800"
+ CDS 2000028..2001314
+ /locus_tag="BQ2027_MB1800"
+ /note="Mb1800, -, len: 428 aa. Equivalent to Rv1771, len:
+ 428 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 428 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), similar to e.g.
+ GGLO_RAT|P10867 l-gulonolactone oxidase (ec 1.1.3.8) (439
+ aa), FASTA scores: opt: 862, E(): 0, (34.1% identity in
+ 434 aa overlap). Also shows slight similarity to
+ Mycobacterium tuberculosis oxidoreductase
+ Rv1726|MTCY04C12.11 (22.9% identity in 441 aa overlap) and
+ others e.g. Rv3107c, Rv1257c, Rv2251, etc. Contains
+ PS00862 Oxygen oxidoreductases covalent FAD-binding site.
+ Protein product from Mb1800 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1800 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="l-gulono-1,4-lactone dehydrogenase"
+ /protein_id="SIU00404.1"
+ /db_xref="GOA:A0A1R3Y038"
+ /db_xref="InterPro:IPR006093"
+ /db_xref="InterPro:IPR006094"
+ /db_xref="InterPro:IPR007173"
+ /db_xref="InterPro:IPR010031"
+ /db_xref="InterPro:IPR016166"
+ /db_xref="InterPro:IPR016167"
+ /db_xref="InterPro:IPR016169"
+ /db_xref="InterPro:IPR016171"
+ /db_xref="InterPro:IPR036318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y038"
+ /translation="MSPIWSNWPGEQVCAPSAIVRPTSEAELADVIAQAAKRGERVRA
+ VGSGHSFTDIACTDGVMIDMTGLQRVLDVDQPTGLVTVEGGAKLRALGPQLAQRRLGL
+ ENQGDVDPQSITGATATATHGTGVRFQNLSARIVSLRLVTAGGEVLSLSEGDDYLAAR
+ VSLGALGVISQVTLQTVPLFTLHRHDQRRSLAQTLERLDEFVDGNDHFEFFVFPYADK
+ ALTRTMHRSDEQPKPTPGWQRMVGENFENGGLSLICQTGRRFPSVAPRLNRLMTNMMS
+ SSTVQDRAYKVFATQRKVRFTEMEYAIPRENGREALQRVIDLVRRRSLPIMFPIEVRF
+ SAPDDSFLSTAYGRDTCYIAVHQYAGMEFESYFRAVEEIMDDYAGRPHWGKRHYQTAA
+ TLRERYPQWDRFAAVRDRLDPDRVFLNDYTRRVLGP"
+ gene 2001503..2001814
+ /locus_tag="BQ2027_MB1801"
+ CDS 2001503..2001814
+ /locus_tag="BQ2027_MB1801"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1801, -, len: 103 aa. Equivalent to Rv1772, len:
+ 103 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 103 aa overlap). Hypothetical unknown
+ protein. Mb1801 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00405.1"
+ /db_xref="GOA:A0A1R3XZB7"
+ /db_xref="InterPro:IPR005561"
+ /db_xref="InterPro:IPR024189"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZB7"
+ /translation="MGSTGGSQPMTANRGPAAISSGSNSGRVLDTARGILIALRRCPA
+ ETAFDELHNAAQRHRLPVFEIAWALVHLAVEGSTPCRSFVDAQSAARREWGQLFAHAA
+ A"
+ gene complement(2001887..2002633)
+ /locus_tag="BQ2027_MB1802C"
+ CDS complement(2001887..2002633)
+ /locus_tag="BQ2027_MB1802C"
+ /note="Mb1802c, -, len: 248 aa. Equivalent to Rv1773c,
+ len: 248 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 248 aa overlap). Probable
+ transcriptional regulator belonging to IclR family,
+ similar to ICLR_ECOLI|P16528 acetate operon repressor from
+ Escherichia coli (274 aa), FASTA scores: opt: 261, E():
+ 3.3e-10, (26.9% identity in 249 aa overlap). Also similar
+ to Mycobacterium tuberculosis protein Rv1719|MTCY04C12.04
+ (40.2% identity in 244 aa overlap); and Rv2989. Start site
+ chosen by homology, but may extend further upstream.
+ Contains possible helix-turn-helix motif at aa 37-58
+ (+3.24 SD). Protein product from Mb1802c detected using
+ SWATH mass spectrometry. Mb1802c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00406.1"
+ /db_xref="GOA:A0A1R3XZM4"
+ /db_xref="InterPro:IPR005471"
+ /db_xref="InterPro:IPR014757"
+ /db_xref="InterPro:IPR029016"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZM4"
+ /translation="MPPTEGKSTTNRDEGIQVLRRAVAALDEIAAEPGHLRLVDLCER
+ LGLAKSTTRRLLVGLVEVGLVSVDSHGRFALGERLLGFGSVTGAHIAAAFRPTVERVA
+ RATDGETVDLSVLRGQRMWFVDQIESSYRLRAVSAVGLRFPLNGTANGKAALAALDDA
+ DAEAALCRLDPMVAEGLRREIVEIRRTGIAFDRNEHTPGISAAAIARRALGDNVIAIS
+ VPAPTARFLEKEQRIIAALRAAADSPDWTR"
+ gene 2002699..2004039
+ /locus_tag="BQ2027_MB1803"
+ CDS 2002699..2004039
+ /locus_tag="BQ2027_MB1803"
+ /note="Mb1803, -, len: 446 aa. Equivalent to Rv1774, len:
+ 446 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 446 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), similar to several e.g.
+ HDNO_ARTOX|P08159 6-hydroxy-d-nicotine oxidase (458 aa),
+ FASTA scores: opt: 417, E(): 6e-20, (28.4% identity in 462
+ aa overlap). Also some similarity to Mycobacterium
+ tuberculosis oxidoreductase MTCY04C12.11 (24.1% identity
+ in 444 aa overlap). Contains PS00862 Oxygen
+ oxidoreductases covalent FAD-binding site. Protein product
+ from Mb1803 detected using SWATH mass spectrometry. Mb1803
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="SIU00407.1"
+ /db_xref="GOA:A0A1R3XZA5"
+ /db_xref="InterPro:IPR006093"
+ /db_xref="InterPro:IPR006094"
+ /db_xref="InterPro:IPR016166"
+ /db_xref="InterPro:IPR016167"
+ /db_xref="InterPro:IPR016169"
+ /db_xref="InterPro:IPR036318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZA5"
+ /translation="MRALPAGRHFFRGSDGYEAARRGTVWHRRVPDRYPEVIVQAVSA
+ DDIVSAIRYATVNGHKVSVVSGGHSFAASHLRDGAVLLDVSRIDHASIDADKGRAVVG
+ PGKGGSVLMAELEAQGLFFPGGHCRGVCLGGYLLQGGYGWNSRIYGPACESVIGLDVI
+ TADGAQIHCDADNHADLYWAARGAGPGFFGVVTSFYLKLYPRPATCGTSVYVYPFDLA
+ DEVFTWARAVSAEVDPRVELQALASRGEPSMGIDVPVISLASPAFADSPEEAEQALAL
+ FGTCPVVEQALVKVPYMPTDLPAWYDVAMTHYLSDHHYAVDNMWTSASAEDLLPGIRS
+ ILDTLPPHPAHFLWLNWGPCPPRQDMAYSIEADIYLALYGSWKDPADEAKYADWARSH
+ MAAMSHLAVGIQLADENLGARPARFASDAAMAKLDRVRAEYDPDGLFNSWMGRI"
+ gene 2004039..2004857
+ /locus_tag="BQ2027_MB1804"
+ CDS 2004039..2004857
+ /locus_tag="BQ2027_MB1804"
+ /note="Mb1804, -, len: 272 aa. Equivalent to Rv1775, len:
+ 272 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 272 aa overlap). Conserved
+ hypothetical protein, similar to O28806|AF1466 CONSERVED
+ HYPOTHETICAL PROTEIN from Archaeoglobus fulgidus (255 aa),
+ FASTA scores: opt: 364, E(): 1e-17, (29.2% identity in 267
+ aa overlap). Protein product from Mb1804 detected using
+ SWATH mass spectrometry. Mb1804 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00408.1"
+ /db_xref="InterPro:IPR041526"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZB6"
+ /translation="MASDLYLGYRNDDADTPFGKFFKPEMAPLPQHVVVALQHGPQAG
+ MALLAFDDAASIVDEGYQQTENGYGILGDGSMQVSVRTDMPGVTPAMWAWWFGWHGSD
+ TRRYKLWHPRAHLSARWKDGDQDSGAGRRGAQRYVGRWSMISEYIGSTKLGAAIQFVE
+ PAAMGLPDDSDDTVSICARLGSADAPVDAGWFVHQVRSTPGGSEMRSRFWMGGPHIAV
+ RKAPEVASKAVRPIASKLIGVSESTARNLLVYCAQEMNHLAGFLADLWESFGDE"
+ gene complement(2004862..2005422)
+ /locus_tag="BQ2027_MB1805C"
+ CDS complement(2004862..2005422)
+ /locus_tag="BQ2027_MB1805C"
+ /note="Mb1805c, -, len: 186 aa. Equivalent to Rv1776c,
+ len: 186 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 186 aa overlap). Possible regulatory
+ protein, some similarity to Mycobacterium tuberculosis
+ Rv1255c|Q11063 hypothetical transcriptional regulator (202
+ aa), FASTA scores: opt: 270, E(): 9.7e-09, (28.3% identity
+ in 191 aa overlap) . Contains possible helix-turn-helix
+ motif at aa 37-58 (+3.49 SD). Mb1805c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00409.1"
+ /db_xref="GOA:A0A1R3XZB2"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZB2"
+ /translation="MPGNDWIVGGNRRTIAAERIYAAATDLITRYGLNALDIDKLARE
+ VHCSRATIYRRAGGKAQIRDVVLTRAAARIADGVRSDVETLRGRERVVAAILLSLQRI
+ RSDPLGKLMFGSIHGGAGELAWLTESPLLADFATELTGIAGGDPQGAKWVVRVVLSLM
+ YWPAENDEAERRLVEKYVAPAFAEQS"
+ gene 2005523..2006827
+ /gene="cyp144"
+ /locus_tag="BQ2027_MB1806"
+ CDS 2005523..2006827
+ /gene="cyp144"
+ /locus_tag="BQ2027_MB1806"
+ /note="Mb1806, cyp144, len: 434 aa. Equivalent to Rv1777,
+ len: 434 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 434 aa overlap). Probable cyp144,
+ cytochrome p450 (EC 1.14.-.-), similar to
+ CPXM_BACME|Q06069 cytochrome p450 (meg) (EC 1.14.99.-)
+ (410 aa), FASTA scores: opt: 435 E(): 2.3e-16, (28.8%
+ identity in 372 aa overlap). Also similar to several other
+ Mycobacterium tuberculosis p450 genes including Rv0766c,
+ Rv2266, etc. Contains PS00086 Cytochrome P450 cysteine
+ heme-iron ligand signature. BELONGS TO THE CYTOCHROME P450
+ FAMILY."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable cytochrome p450 144 CYP144"
+ /protein_id="SIU00410.1"
+ /db_xref="GOA:A0A1R3XZA3"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002397"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZA3"
+ /translation="MRRSPKGSPGAVLDLQRRVDQAVSADHAELMTIAKDANTFFGAE
+ SVQDPYPLYERMRAAGSVHRIANSDFYAVCGWDAVNEAIGRPEDFSSNLTATMTYTAE
+ GTAKPFEMDPLGGPTHVLATADDPAHAVHRKLVLRHLAAKRIRVMEQFTVQAADRLWV
+ DGMQDGCIEWMGAMANRLPMMVVAELIGLPDPDIAQLVKWGYAATQLLEGLVENDQLV
+ AAGVALMELSGYIFEQFDRAAADPRDNLLGELATACASGELDTLTAQVMMVTLFAAGG
+ ESTAALLGSAVWILATRPDIQQQVRANPELLGAFIEETLRYEPPFRGQYRHVRNATTL
+ DGTELPADSHLLLLWGAANRDPAQFEAPGEFRLDRAGGKGHISFGKGAHFCVGAALAR
+ LEARIVLRLLLDRTSVIEAADVGGWLPSILVRRIERLELAVQ"
+ gene complement(2006948..2007397)
+ /locus_tag="BQ2027_MB1807C"
+ CDS complement(2006948..2007397)
+ /locus_tag="BQ2027_MB1807C"
+ /note="Mb1807c, -, len: 149 aa. Equivalent to Rv1778c,
+ len: 149 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 149 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1807c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1807c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00411.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ85"
+ /translation="MRVSLFLSDAAQADAQSGKVHALGLGWRQCQRPTPPFALVLFLD
+ IDWDETNKQHQLKCQLLTADGDPVVVPGPHGPQRILFEAAAEAGRAPGAIHGTSVRMP
+ LTLNIPAGIPLEPGIYEWRVEVEGYERATAVEAFIVAGGGHPPASCG"
+ gene complement(2007553..2009346)
+ /locus_tag="BQ2027_MB1808C"
+ CDS complement(2007553..2009346)
+ /locus_tag="BQ2027_MB1808C"
+ /note="Mb1808c, -, len: 597 aa. Equivalent to Rv1779c,
+ len: 597 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 597 aa overlap). Possible integral
+ membrane protein. Protein product from Mb1808c detected
+ using SWATH mass spectrometry. Mb1808c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible integral membrane protein"
+ /protein_id="SIU00412.1"
+ /db_xref="GOA:A0A1R3XZA4"
+ /db_xref="InterPro:IPR025519"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZA4"
+ /translation="MCAHEYAEQRSAVSGIEGLLTWLGGGHWRELGERHERSTHAVAG
+ VIVAVGAALAGLLASLAVSEAAQGPISSPIGAASLALVLGLLVGAVTRGTASGPARGR
+ AGVTGRASVAVAVGFVVGELAALVMFSGAIDRRLDEQAMHSADATPAAVQASASLQQA
+ RNARTALDSAVERARGRLDDALVVARCEYHPTPACPQTRITGVPGRGPETRTANQLLA
+ DAQRELDNALAARDHQAPALDAKMAHDEQALAEVRQAVVADAGRGLGSRWVAMNDLTL
+ ASAGALTARMLAIAFFALLYLLPLILRLWRGDTTHDRHAAARAERERAELEADTAIAI
+ KRAEVRRAAEIMWAEHQLTQTRLAIEAQAEIDREQQRRRVVEALEGPVRASSERTLQP
+ VEDEVYLPIAAETEAASRTVAQLPAGAAHHRPGIAKNLPAQVQPEGAVEPREKRATPV
+ IRSIPDATKAAARWIRPLVPPFVARMLDNTTAPLRTARQVFEEVEEIAFSFKRTHKVT
+ VNAEGSDPNDQPPLESHSPAAPAESNPIASSDSARRSRLATNDDHPPLAQVPPRDLAS
+ LSVGSTGELTQREGPHELRSPDGPRQLPPPR"
+ gene 2009566..2010129
+ /locus_tag="BQ2027_MB1809"
+ CDS 2009566..2010129
+ /locus_tag="BQ2027_MB1809"
+ /note="Mb1809, -, len: 187 aa. Equivalent to Rv1780, len:
+ 187 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 187 aa overlap). Conserved
+ hypothetical protein, equivalent to Q49881|ML1380|U00021_2
+ cosmid L247 from Mycobacterium leprae (187 aa), FASTA
+ scores: opt: 1000, E(): 0, (82.4% identity in 187 aa
+ overlap). Protein product from Mb1809 detected using
+ shotgun mass spectrometry. Mb1809 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00413.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1F0"
+ /translation="MQNHDYVTYEEFGRRFFEVAVTPDRVAAAFADIAGSEFAMEPIS
+ QGPGGIAKVSANVKIREPRVTRKLGDLITFVIHIPLSIDLLLDLRLDKQRFMVAGDIA
+ LRATARAAEPLLLIVDVAKPRPSDITVNVSSKSIRGEVLRILAGVDGEIRRFIAQYVS
+ AEIDSPKSQAAQVINVAEQLDSTWSGP"
+ gene complement(2010169..2012343)
+ /gene="malQ"
+ /locus_tag="BQ2027_MB1810C"
+ CDS complement(2010169..2012343)
+ /gene="malQ"
+ /locus_tag="BQ2027_MB1810C"
+ /note="Mb1810c, malQ, len: 724 aa. Equivalent to Rv1781c,
+ len: 724 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 724 aa overlap). Probable malQ,
+ 4-ALPHA-GLUCANOTRANSFERASE (EC 2.4.1.25), similar to many,
+ e.g. P15977|MALQ_ECOLI 4-ALPHA-GLUCANOTRANSFERASE (694
+ aa), FASTA scores: opt: 964, E(): 0, (31.8% identity in
+ 694 aa overlap). BELONGS TO THE DISPROPORTIONATING ENZYME
+ FAMILY. Protein product from Mb1810c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1810c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 4-ALPHA-GLUCANOTRANSFERASE MALQ
+ (Amylomaltase) (Disproportionating enzyme) (D-enzyme)"
+ /protein_id="SIU00414.1"
+ /db_xref="GOA:P65337"
+ /db_xref="InterPro:IPR003385"
+ /db_xref="InterPro:IPR017853"
+ /db_xref="UniProtKB/Swiss-Prot:P65337"
+ /translation="MTELAPSLVELARRFGIATEYTDWTGRQVLVSEATLVAALAALG
+ VPAQTEQQRNDALAAQLRSYWARPLPATIVMRAGEQTQFRVHVTDGAPADVWLQLEDG
+ TTRAEVVQVDNFTPPFDLDGRWIGEASFVLPADLPLGYHRVNLRSGDSQASAAVVVTP
+ DWLGLPDKLAGRRAWGLAVQLYSVRSRQSWGIGDLTDLANLALWSASAHGAGYVLVNP
+ LHAATLPGPAGRSKPIEPSPYLPTSRRFVNPLYLRVEAIPELVDLPKRGRVQRLRTNV
+ QQHADQLDTIDRDSAWAAKRAALKLVHRVPRSAGRELAYAAFRTREGRALDDFATWCA
+ LAETYGDDWHRWPKSLRHPDASGVADFVDKHADAVDFHRWLQWQLDEQLASAQSQALR
+ AGMSLGIMADLAVGVHPNGADAWALQDVLAQGVTAGAPPDEFNQLGQDWSQPPWRPDR
+ LAEQEYRPFRALIQAALRHAGAVRIDHIIGLFRLWWIPDGAPPTQGTYVRYDHDAMIG
+ IVALEAHRAGAVVVGEDLGTVEPWVRDYLLLRGLLGTSILWFEQDRDCGPAGTPLPAE
+ RWREYCLSSVTTHDLPPTAGYLAGDQVRLRESLGLLTNPVEAELESARADRAAWMAEL
+ RRVGLLADGAEPDSEEAVLALYRYLGRTPSRLLAVALTDAVGDRRTQNQPGTTDEYPN
+ WRVPLTGPDGQPMLLEDIFTDRRAATLAEAVRAATTSPMSCW"
+ gene 2012607..2014127
+ /gene="eccb5"
+ /locus_tag="BQ2027_MB1811"
+ CDS 2012607..2014127
+ /gene="eccb5"
+ /locus_tag="BQ2027_MB1811"
+ /note="Mb1811, -, len: 506 aa. Equivalent to Rv1782, len:
+ 506 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 506 aa overlap). Probable conserved
+ membrane protein, similar to four other Mycobacterium
+ tuberculosis hypothetical membrane proteins e.g.
+ O05449|Rv3895c|MTCY15F10.17|Z94121 (495 aa), FASTA scores:
+ opt: 1106, E(): 0, (41.2% identity in 485 aa overlap);
+ Rv0283, Rv3450c, and Rv3869, all located near ESAT-6
+ family genes. Also similar to O33088|MLCB628.17C|Y14967
+ cosmid B628 from Mycobacterium leprae (481 aa), (32.7%
+ identity in 486 aa overlap); and equivalent to
+ Q9Z5I3|MLCB596.27|AL035472 hypothetical protein from
+ Mycobacterium leprae (506 aa) (82.6% identity in 506 aa
+ overlap). Has hydrophobic stretch from aa 54-76. Protein
+ product from Mb1811 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1811 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component eccb5. esx-5 type vii
+ secretion system protein. probable membrane protein."
+ /protein_id="SIU00415.1"
+ /db_xref="GOA:A0A1R3XZC8"
+ /db_xref="InterPro:IPR007795"
+ /db_xref="InterPro:IPR042485"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZC8"
+ /translation="MAEESRGQRGSGYGLGLSTRTQVTGYQFLARRTAMALTRWHVRM
+ EIEPGRRQTLAVVASVSAALVICLGALLWSFISPSGQLNESPIIADRDSGALYVRVGD
+ RLYPALNLASARLITGRPDNPHLVRSSQIATMPRGPLVGIPGAPSSFSPKSPPASSWL
+ VCDTVATSSSIGSLQGVTVTVIDGTPDLTGHRQILSGSDAVVLRYGGDAWVIREGRRS
+ RIEPTNRAVLLPLGLTPEQVSQARPMSRALFDALPVGPELLVPEVPNAGGPATFPGAP
+ GPIGTVIVTPQISGPQQYSLVLGDGVQTLPPLVAQILQNAGSAGNTKPLTVEPSTLAK
+ MPVVNRLDLSAYPDNPLEVVDIREHPSTCWWWERTAGENRARVRVVSGPTIPVAATEM
+ NKVVSLVKADTSGRQADQVYFGPDHANFVAVTGNNPGAQTSESLWWVTDAGARFGVED
+ SKEARDALGLTLTPSLAPWVALRLLPQGPTLSRADALVEHDTLPMDMTPAELVVPK"
+ gene 2014124..2018299
+ /gene="eccc5"
+ /locus_tag="BQ2027_MB1812"
+ CDS 2014124..2018299
+ /gene="eccc5"
+ /locus_tag="BQ2027_MB1812"
+ /note="Mb1812, -, len: 1391 aa. Similar to Rv1783 and
+ Rv1784, len: 435 aa and 932 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 435 aa
+ overlap and 99.9% identity in 932 aa overlap). Rv1783:
+ Probable conserved membrane protein. Member of family of
+ Mycobacterium tuberculosis hypothetical proteins including
+ O05450|Rv3894c|MTY15F10.18|Z94121 (1396 aa), FASTA scores:
+ opt: 542, E(): 1.5e-26, (31.4% identity in 440 aa
+ overlap); Rv3447c, Rv0284, Rv3870, Rv1784, and Rv3871, all
+ linked to ESAT-6 family gene. Similar to N-terminal part
+ of Rv3894c (1396 aa), Rv1784 is similar to remainder of
+ Rv3894c. Also similar to O33087|MLCB628.16C|Y14967
+ Hypothetical protein from Mycobacterium leprae (744 aa),
+ (30.0% identity in 437 aa overlap) and equivalent to
+ N-terminal part of Q9Z5I2|MLCB596.28|AL035472 hypothetical
+ protein from Mycobacterium leprae (1345 aa), (86.4%
+ identity in 397 aa overlap). Rv1784: Conserved
+ hypothetical protein, member of family of Mycobacterium
+ tuberculosis hypothetical proteins including Rv3447c,
+ Rv0284, Rv3870, Rv1783, Rv3871, Rv3894c, all linked to
+ ESAT-6 family genes. Probably ATP-binding membrane
+ proteins. Similar to C-terminal region of 006264|Rv3447c
+ (1236 aa), (36.2% identity in 930 aa overlap). Equivalent
+ to C-terminal region of Mycobacterium leprae hypothetical
+ protein Q9Z512|MLCB596.28|AL035472 (1345 aa), (87.8%
+ identity in 932 aa overlap); also similar to other
+ hypothetical proteins e.g. MLCB628.14 from Mycobacterium
+ leprae, (32.0% identity in 600 aa overlap); MLCB628.15
+ from Mycobacterium leprae, (35.0% identity in 280 aa
+ overlap); and O86653|SC3C3.20|AL031231 ATP/GTP binding
+ protein from Streptomyces coelicolor (1321 aa), FASTA
+ scores: opt: 618, E(): 4.6e-30, (34.3% identity in 937 aa
+ overlap). Contains two times PS00017 ATP/GTP-binding site
+ motif A (P-loop). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1783 and Rv1784
+ exist as 2 genes. In Mycobacterium bovis, a single base
+ transversion (a-t) leads to a single product. Protein
+ product from Mb1812 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1812 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component eccc5. esx-5 type vii
+ secretion system protein."
+ /protein_id="SIU00416.1"
+ /db_xref="GOA:A0A1R3XZN3"
+ /db_xref="InterPro:IPR002543"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR023836"
+ /db_xref="InterPro:IPR023837"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZN3"
+ /translation="MKRGFARPTPEKPPVIKPENIVLSTPLSIPPPEGKPWWLIVVGV
+ VVVGLLGGMVAMVFASGSHVFGGIGSIFPLFMMVGIMMMMFRGMGGGQQQMSRPKLDA
+ MRAQFMLMLDMLRETAQESADSMDANYRWFHPAPNTLAAAVGSPRMWERKPDGKDLNF
+ GVVRVGVGMTRPEVTWGEPQNMPTDIELEPVTGKALQEFGRYQSVVYNLPKMVSLLVE
+ PWYALVGEREQVLGLMRAIICQLAFSHGPDHVQMIVVSSDLDQWDWVKWLPHFGDSRR
+ HDAAGNARMVYTSVREFAAEQAELFAGRGSFTPRHASSSAQTPTPHTVIIADVDDPQW
+ EYVISAEGVDGVTFFDLTGSSMWTDIPERKLQFDKTGVIEALPRDRDTWMVIDDKAWF
+ FALTDQVSIAEAEEFAQKLAQWRLAEAYEEIGQRVAHIGARDILSYYGIDDPGNIDFD
+ SLWASRTDTMGRSRLRAPFGNRSDNGELLFLDMKSLDEGGDGPHGVMSGTTGSGKSTL
+ VRTVIESLMLSHPPEELQFVLADLKGGSAVKPFAGVPHVSRIITDLEEDQALMERFLD
+ ALWGEIARRKAICDSAGVDDAKEYNSVRARMRARGQDMAPLPMLVVVIDEFYEWFRIM
+ PTAVDVLDSIGRQGRAYWIHLMMASQTIESRAEKLMENMGYRLVLKARTAGAAQAAGV
+ PNAVNLPAQAGLGYFRKSLEDIIRFQAEFLWRDYFQPGVSIDGEEAPALVHSIDYIRP
+ QLFTNSFTPLEVSVGGPDIEPVVAQPNGEMLESDDIEGGEDEDEEGVRTPKVGTVIID
+ QLRKIKFEPYRLWQPPLTQPVAIDDLVNRFLGRPWHKEYGSACNLVFPIGIIDRPYKH
+ DQPPWTVDTSGPGANVLILGAGGSGKTTALQTLICSAALTHTPQQVQFYCLAYSSTAL
+ TTVSRIPHVGEVAGPTDPYGVRRTVAELLALVRERKRSFLECGIASMEMFRRRKFGGE
+ AGPVPDDGFGDVYLVIDNYRALAEENEVLIEQVNVIINQGPSFGVHVVVTADRESELR
+ PPVRSGFGSRIELRLAAVEDAKLVRSRFAKDVPVKPGRGMVAVNYVRLDSDPQAGLHT
+ LVARPALGSTPDNVFECDSVVAAVSRLTSAQAPPVRRLPARFGVEQVRELASRDTRQG
+ VGAGGIAWAISELDLAPVYLNFAENSHLMVTGRRECGRTTTLATIMSEIGRLYAPGAS
+ SAPPPAPGRPSAQVWLVDPRRQLLTALGSDYVERFAYNLDGVVAMMGELAAALAGREP
+ PPGLSAEELLSRSWWSGPEIFLIVDDIQQLPPGFDSPLHKAVPFVNRAADVGLHVIVT
+ RTFGGWSSAGSDPMLRALHQANAPLLVMDADPDEGFIRGKMKGGPLPRGRGLLMAEDT
+ GVFVQVAATEVRR"
+ gene complement(2018314..2019495)
+ /gene="cyp143"
+ /locus_tag="BQ2027_MB1813C"
+ CDS complement(2018314..2019495)
+ /gene="cyp143"
+ /locus_tag="BQ2027_MB1813C"
+ /note="Mb1813c, cyp143, len: 393 aa. Equivalent to
+ Rv1785c, len: 393 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 393 aa overlap).
+ Probable cyp143, cytochrome P450 (1.14.-.-), similar to
+ many e.g. AE0001|RZAE000101_4 Rhizobium sp. NGR234 (414
+ aa), FASTA scores: opt: 663, E(): 0, (32.4% identity in
+ 413 aa overlap). Contains PS00086 Cytochrome P450 cysteine
+ heme-iron ligand signature. BELONGS TO THE CYTOCHROME P450
+ FAMILY. Protein product from Mb1813c detected using SWATH
+ mass spectrometry. Mb1813c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CYTOCHROME P450 143 CYP143"
+ /protein_id="SIU00417.1"
+ /db_xref="GOA:P63724"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002397"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/Swiss-Prot:P63724"
+ /translation="MTTPGEDHAGSFYLPRLEYSTLPMAVDRGVGWKTLRDAGPVVFM
+ NGWYYLTRREDVLAALRNPKVFSSRKALQPPGNPLPVVPLAFDPPEHTRYRRILQPYF
+ SPAALSKALPSLRRHTVAMIDAIAGRGECEAMADLANLFPFQLFLVLYGLPLEDRDRL
+ IGWKDAVIAMSDRPHPTEADVAAARELLEYLTAMVAERRRNPGPDVLSQVQIGEDPLS
+ EIEVLGLSHLLILAGLDTVTAAVGFSLLELARRPQLRAMLRDNPKQIRVFIEEIVRLE
+ PSAPVAPRVTTEPVTVGGMTLPAGSPVRLCMAAVNRDGSDAMSTDELVMDGKVHRHWG
+ FGGGPHRCLGSHLARLELTLLVGEWLNQIPDFELAPDYAPEIRFPSKSFALKNLPLRW
+ S"
+ gene 2019695..2019898
+ /locus_tag="BQ2027_MB1814"
+ CDS 2019695..2019898
+ /locus_tag="BQ2027_MB1814"
+ /note="Mb1814, -, len: 67 aa. Equivalent to Rv1786, len:
+ 67 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 67 aa overlap). Probable ferredoxin
+ (EC 1.-.-.-), similar to others e.g. X63601|FERS_STRGR
+ FERREDOXIN from Streptomyces griseus (65 aa), FASTA
+ scores: opt: 140, E(): 0.001, (38.1% identity in 63 aa
+ overlap); T50943 probable ferredoxin DitA from Pseudomonas
+ abietaniphila (78 aa); BAA84714.1|AB017795 ferredoxin from
+ Nocardioides sp. (69 aa); etc. Also similar to
+ Rv0763c|MTCY369.08 from Mycobacterium tuberculosis (68
+ aa), FASTA score: (30.6% identity in 62 aa overlap); and
+ Rv0763c. Mb1814 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable ferredoxin"
+ /protein_id="SIU00418.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZC4"
+ /translation="MKVRLDPSRCVGHAQCYAVDPDLFPIDDSGNSILAEHEVRPEDM
+ QLTRDGVAACPEMALILEEDDAD"
+ gene 2020168..2021262
+ /gene="PPE25"
+ /locus_tag="BQ2027_MB1815"
+ CDS 2020168..2021262
+ /gene="PPE25"
+ /locus_tag="BQ2027_MB1815"
+ /note="Mb1815, PPE25, len: 364 aa. Equivalent to Rv1787,
+ len: 365 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 365 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of glycine-rich
+ proteins, similar to Z74024|MTCY274.24 Mycobacterium
+ tuberculosis cosmid (404 aa), FASTA scores: opt: 837, E():
+ 0, (52.0% identity in 406 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a 8
+ bp to 5 bp substitution (agcccggt-ccggg), leads to a
+ slightly shorter product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (364 aa versus 365
+ aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe25"
+ /protein_id="SIU00419.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZC3"
+ /translation="MDFGALPPEINSGRMYCGPGSGPMLAAAAAWDGVAVELGLAATG
+ YASVIAELTGAPWVGAASLSMVAAATPYVAWLSQAAARAEQAGMQAAAAAAAYEAAFV
+ MTVPPPVITANRVLVMTLIATNFFGQNSAAIAVAEAQYAEMWAQDAVAMYGYAAASAS
+ ASRLIPFAAPPKTTNSAGVVAQVAAVAAMPGLLQRLSSAASVSWSNPNDWWLVRLLGS
+ ITPTERTTIVRLLGQSYFATGMAQFFASIAQQLTFGPGGTTAGSGGAWYPTPQFAGLG
+ ASRAVSASLARANKIGALSVPPSWVKTTALTEPGAHAVSANPTVGSSHGPHGLLRGLP
+ LGSRITRRSGAFAHRYGFRHSVVARPPSAG"
+ gene 2021341..2021640
+ /gene="PE18"
+ /locus_tag="BQ2027_MB1816"
+ CDS 2021341..2021640
+ /gene="PE18"
+ /locus_tag="BQ2027_MB1816"
+ /note="Mb1816, PE18, len: 99 aa. Equivalent to Rv1788,
+ len: 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 99 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family of gly-, ala-rich
+ proteins, similar to Z93777|MTCI364.07 Mycobacterium
+ tuberculosis cosmid (99 aa), FASTA scores: opt: 414, E():
+ 3.6e-20, (72.4% identity in 98 aa overlap). Mb1816 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe18"
+ /protein_id="SIU00420.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZB3"
+ /translation="MSFVTTQPEALAAAAGSLQGIGSALNAQNAAAATPTTGVVPAAA
+ DEVSALTAAQFAAHAQIYQAVSAQAAAIHEMFVNTLQMSSGSYAATEAANAAAAG"
+ gene 2021654..2022835
+ /gene="PPE26"
+ /locus_tag="BQ2027_MB1817"
+ CDS 2021654..2022835
+ /gene="PPE26"
+ /locus_tag="BQ2027_MB1817"
+ /note="Mb1817, PPE26, len: 393 aa. Equivalent to Rv1789,
+ len: 393 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 393 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of glycine-rich
+ proteins, highly similar to others e.g.Z98268|MTCI125.26
+ Mycobacterium tuberculosis cosmid (385 aa), FASTA score:
+ opt: 1283, E(): 0, (62.7% identity in 408 aa overlap).
+ Mb1817 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe26"
+ /protein_id="SIU00421.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZ96"
+ /translation="MDFGALPPEVNSVRMYAGPGSAPMVAAASAWNGLAAELSSAATG
+ YETVITQLSSEGWLGPASAAMAEAVAPYVAWMSAAAAQAEQAATQARAAAAAFEAAFA
+ ATVPPPLIAANRASLMQLISTNVFGQNTSAIAAAEAQYGEMWAQDSAAMYAYAGSSAS
+ ASAVTPFSTPPQIANPTAQGTQAAAVATAAGTAQSTLTEMITGLPNALQSLTSPLLQS
+ SNGPLSWLWQILFGTPNFPTSISALLTDLQPYASFFYNTEGLPYFSIGMGNNFIQAAK
+ TLGLIGSAAPAAVAAAGDAAKGLPGLGGMLGGGPVAAGLGNAASVGKLSVPPVWSGPL
+ PGSVTPGAAPLPVSTVSAAPEAAPGSLLGGLPLAGAGGAGAGPRYGFRPTVMARPPFA
+ G"
+ gene 2023289..2024341
+ /gene="PPE27"
+ /locus_tag="BQ2027_MB1818"
+ CDS 2023289..2024341
+ /gene="PPE27"
+ /locus_tag="BQ2027_MB1818"
+ /note="Mb1818, PPE27, len: 350 aa. Equivalent to Rv1790,
+ len: 350 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 350 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of glycine-rich
+ protein, similar to Z74024|MTCY274.24 Mycobacterium
+ tuberculosis cosmid (404 aa), FASTA scores: opt: 849, E():
+ 0, (50.0% identity in 406 aa overlap). Mb1818 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe27"
+ /protein_id="SIU00422.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZB1"
+ /translation="MDFGALPPEINSGRMYCGPGSGPMLAAAAAWDGVAVELGLAATG
+ YASVIAELTGAPWVGAASLSMVAAATPYVAWLSQAAARAEQAGMQAAAAAAAYEAAFV
+ MTVPPPVITANRVLVMTLIATNFFGQNSAAIAVAEAQYAEMWAQDAVAMYGYAAASAS
+ ASRLIPFAAPPKTTNSAGVVAQAVASVSWSNPNDWWLVRLLGSITPTERTTIVRLLGQ
+ SYLATGMARFLTSIAQQLTFGPGGTTAGSGGAWYPTPQFAGLGAGPAVSASLARAEPV
+ GRLSVPPSWAVAAPAFAEKPEAGTPMSVIGEASSCGQGGLLRGIPLARAGRRTGAFAH
+ RYGFRHSVITRSPSAG"
+ gene 2024768..2025067
+ /gene="PE19"
+ /locus_tag="BQ2027_MB1819"
+ CDS 2024768..2025067
+ /gene="PE19"
+ /locus_tag="BQ2027_MB1819"
+ /note="Mb1819, PE19, len: 99 aa. Equivalent to Rv1791,
+ len: 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 99 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family, but no glycine rich
+ C-terminus, highly similar to Z93777|MTCI364.07
+ M.tuberculosis cosmid (99 aa) opt: 430 E(): 2.4e-21,
+ (75.5% identity in 98 aa overlap). Mb1819 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe19"
+ /protein_id="SIU00423.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1H4"
+ /translation="MSFVTTQPEALAAAAANLQGIGTTMNAQNAAAAAPTTGVVPAAA
+ DEVSALTAAQFAAHAQMYQTVSAQAAAIHEMFVNTLVASSGSYAATEAANAAAAG"
+ gene 2025211..2025507
+ /gene="esxM"
+ /locus_tag="BQ2027_MB1820"
+ CDS 2025211..2025507
+ /gene="esxM"
+ /locus_tag="BQ2027_MB1820"
+ /standard_name="TB11.0; QILSS"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1820, esxM, len: 98 aa. Equivalent to Rv1792,
+ len: 98 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.0% identity in 98 aa overlap). esxM, conserved
+ hypothetical protein, member of Mycobacterium tuberculosis
+ QILSS familyof proteins, genes linked to those of ESAT-6
+ family. Has in-frame stop codon at 18074, no error could
+ be found to account for this. Identical (apart from stop
+ codon) to P96363|Rv1038c|MTCY10G2.11 PUTATIVE ESAT-6 LIKE
+ PROTEIN 2 (98 aa), FASTA scores: opt: 389, E(): 5.8e-26,
+ (100.0% identity in 58 aa overlap). Also identical to
+ Rv1038c, Rv1197, and almost identical to Rv3620c and
+ Rv2347c. Similar protein present in Mycobacterium leprae
+ e.g. Q49946|MLCB1701.06C|AL049191 PUTATIVE ESAT-6 LIKE
+ PROTEIN X (95 aa), FASTA scores: opt: 343, E(): 1.6e-17,
+ (57.6% identity in 92 aa overlap). Mb1820 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esat-6 like protein esxm"
+ /protein_id="SIU00424.1"
+ /db_xref="InterPro:IPR010310"
+ /db_xref="InterPro:IPR036689"
+ /db_xref="UniProtKB/Swiss-Prot:P59805"
+ /translation="MASRFMTDPHAMRDMAGRFEVHAQTVEDEARRMWASAQNISGAG
+ WSGQAEATSLDTMTQMNQAFRNIVNMLHGVRDGLVRDANNYEQQEQASQQILSS"
+ gene 2025558..2025842
+ /gene="esxN"
+ /locus_tag="BQ2027_MB1821"
+ CDS 2025558..2025842
+ /gene="esxN"
+ /locus_tag="BQ2027_MB1821"
+ /standard_name="ES6_5; Mtb9.9A"
+ /note="Mb1821, esxN, len: 94 aa. Equivalent to Rv1793,
+ len: 94 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 94 aa overlap). esxN, putative ESAT-6
+ like protein, conserved hypothetical protein, almost
+ identical to several hypothetical mycobacterial proteins
+ of the ESAT-6-like family including
+ P95242|Rv2346c|MTCY98.15C|Z83860 PUTATIVE ESAT-6 LIKE
+ PROTEIN 6 (94 aa), FASTA scores: opt: 610, E(): 0, (97.9 %
+ identity in 94 aa overlap); Rv3619c, Rv1037c, and Rv1198,
+ etc. Also present in Mycobacterium leprae. Protein product
+ from Mb1821 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1821 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative esat-6 like protein esxn (esat-6 like
+ protein 5)"
+ /protein_id="SIU00425.1"
+ /db_xref="GOA:P0A571"
+ /db_xref="InterPro:IPR009416"
+ /db_xref="InterPro:IPR010310"
+ /db_xref="InterPro:IPR036689"
+ /db_xref="UniProtKB/Swiss-Prot:P0A571"
+ /translation="MTINYQFGDVDAHGAMIRAQAASLEAEHQAIVRDVLAAGDFWGG
+ AGSVACQEFITQLGRNFQVIYEQANAHGQKVQAAGNNMAQTDSAVGSSWA"
+ gene 2025930..2026832
+ /gene="espG5"
+ /locus_tag="BQ2027_MB1822"
+ CDS 2025930..2026832
+ /gene="espG5"
+ /locus_tag="BQ2027_MB1822"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1822, -, len: 300 aa. Equivalent to Rv1794, len:
+ 300 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 300 aa overlap). Conserved
+ hypothetical protein, slight similarity to Mycobacterium
+ tuberculosis O53694|Rv0289|MTV035.17, (295 aa), FASTA
+ scores: opt: 172, E(): 0.00083, (25.7% identity in 261 aa
+ overlap). Equivalent to Mycobacterium leprae hypothetical
+ protein Q9Z5I1|MLCB596.31|AL035472 (300 aa), (88.0%
+ identity in 300 aa overlap). Contains PS00211 ABC
+ transporters family signature. Protein product from Mb1822
+ detected using shotgun mass spectrometry. Mb1822 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ESX-5 secretion-associated protein EspG5"
+ /protein_id="SIU00426.1"
+ /db_xref="InterPro:IPR025734"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZP3"
+ /translation="MDQQSTRTDITVNVDGFWMLQALLDIRHVAPELRCRPYVSTDSN
+ DWLNEHPGMAVMREQGIVVNDAVNEQVAARMKVLAAPDLEVVALLSRGKLLYGVIDDE
+ NQPPGSRDIPDNEFRVVLARRGQHWVSAVRVGNDITVDDVTVSDSASIAALVMDGLES
+ IHHADPAAINAVNVPMEEMLEATKSWQESGFNVFSGGDLRRMGISAATVAALGQALSD
+ PAAEVAVYARQYRDDAKGPSASVLSLKDGSGGRIALYQQARTAGSGEAWLAICPATPQ
+ LVQVGVKTVLDTLPYGEWKTHSRV"
+ gene 2027104..2028615
+ /gene="eccd5"
+ /locus_tag="BQ2027_MB1823"
+ CDS 2027104..2028615
+ /gene="eccd5"
+ /locus_tag="BQ2027_MB1823"
+ /note="Mb1823, -, len: 503 aa. Equivalent to Rv1795, len:
+ 503 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 503 aa overlap). Conserved hypothetical
+ membrane protein, has a hydrophilic stretch from ~1-130
+ then very hydrophobic. Similar to several other
+ mycobacterial proteins, all linked to ESAT-6 family e.g.
+ Rv3887c|MTY15F10.24|Z94121 (509 aa), FASTA scores: opt:
+ 360, E(): 1.6e-15, (26.7% identity in 514 aa overlap);
+ Rv3448, and Rv0290. Protein product from Mb1823 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1823 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component eccd5. esx-5 type vii
+ secretion system protein. probable membrane protein."
+ /protein_id="SIU00427.1"
+ /db_xref="GOA:A0A1R3XZC1"
+ /db_xref="InterPro:IPR006707"
+ /db_xref="InterPro:IPR024962"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZC1"
+ /translation="MTAVADAPQADIEGVASPQAVVVGVMAGEGVQIGVLLDANAPVS
+ VMTDPLLKVVNSRLRELGEAPLEATGRGRWALCLVDGAPLRATQSLTEQDVYDGDRLW
+ IRFIADTERRSQVIEHISTAVASDLSKRFARIDPIVAVQVGASMVATGVVLATGVLGW
+ WRWHHNTWLTTIYTAVIGVLVLAVAMLLLMRAKTDADRRVADIMLMSAIMPVTVAAAA
+ APPGPVGSPQAVLGFGVLTVAAALALRFTGRRLGIYTAIVIIDALTMLAALARMVAAT
+ SAVTLLSSLLLICVVAYHAAPALSRRLAGIRLPVFPSATSRWVFEARPDLPTTVVVSG
+ GSAPVLEGPSSVRDVLLQAERARSFLSGLLTGLGVMVVVCMTSLCDPHTGQRWLPLIL
+ AGFTSGFLLLRGRSYVDRWQSITLAGTAVIIAAAVCVRYALELSSPLAVSIVAAILVL
+ LPAAGMAAAAHVPHTIYSPLFRKFVEWIEYLCLMPIFPLALWLMNVYAAIRYR"
+ gene 2028593..2030350
+ /gene="mycp5"
+ /locus_tag="BQ2027_MB1824"
+ CDS 2028593..2030350
+ /gene="mycp5"
+ /locus_tag="BQ2027_MB1824"
+ /note="Mb1824, -, len: 585 aa. Equivalent to Rv1796, len:
+ 585 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 585 aa overlap). Conserved
+ hypothetical Pro-rich protease. Member of family with four
+ other Mycobacterium tuberculosis hypothetical proteases
+ including Rv3886c|O05458|MTCY15F10.26|Z94121 (550 aa),
+ FASTA scores: opt: 1173, E(): 0, (47.9% identity in 578 aa
+ overlap); Rv0291, Rv3883c, and Rv3449. Genes all linked to
+ those of ESAT-6 family. Has possible N-terminal signal
+ peptide and hydrophobic anchor-like stretch at C-terminus.
+ Contains two serine protease, subtilase family active site
+ motifs: a aspartic acid active site motif (PS00136); and a
+ histidine active site motif (PS00137). Protein product
+ from Mb1824 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1824 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable proline rich membrane-anchored mycosin
+ mycp5 (serine protease) (subtilisin-like protease)
+ (subtilase-like) (mycosin-5)"
+ /protein_id="SIU00428.1"
+ /db_xref="GOA:A0A1R3XZD8"
+ /db_xref="InterPro:IPR000209"
+ /db_xref="InterPro:IPR015500"
+ /db_xref="InterPro:IPR023827"
+ /db_xref="InterPro:IPR023834"
+ /db_xref="InterPro:IPR036852"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZD8"
+ /translation="MQRFGTGSSRSWCGRAGTATIAAVLLASGALTGLPPAYAISPPT
+ IDPGALPPDGPPGPLAPMKQNAYCTEVGVLPGTDFQLQPKYMEMLNLNEAWQFGRGDG
+ VKVAVIDTGVTPHPRLPRLIPGGDYVMAGGDGLSDCDAHGTLVASMIAAVPANGAVPL
+ PSVPRRPVTIPTTETPPPPQTVTLSPVPPQTVTVIPAPPPEEGVPPGAPVPGPEPPPA
+ PGPQPPAVDRGGGTVTVPSYSGGRKIAPIDNPRNPHPSAPSPALGPPPDAFSGIAPGV
+ EIISIRQSSQAFGLKDPYTGDEDPQTAQKIDNVETMARAIVHAANMGASVINISDVMC
+ MSARNVIDQRALGAAVHYAAVDKDAVIVAAAGDGSKKDCKQNPIFDPLQPDDPRAWNA
+ VTTVVTPSWFHDYVLTVGAVDANGQPLSKMSIAGPWVSISAPGTDVVGLSPRDDGLIN
+ AIDGPDNSLLVPAGTSFSAAIVSGVAALVRAKFPELSAYQIINRLIHTARPPARGVDN
+ QVGYGVVDPVAALTWDVPKGPAEPPKQLSAPLVVPQPPAPRDMVPIWVAAGGLAGALL
+ IGGAVFGTATLMRRSRKQQ"
+ gene 2030347..2031567
+ /gene="ecce5"
+ /locus_tag="BQ2027_MB1825"
+ CDS 2030347..2031567
+ /gene="ecce5"
+ /locus_tag="BQ2027_MB1825"
+ /note="Mb1825, -, len: 406 aa. Equivalent to Rv1797, len:
+ 406 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 406 aa overlap). Conserved
+ hypothetical protein, some similarity to Mycobacterium
+ tuberculosis O05462|Rv3882c|MTCY15F10.30|Z94121 (462 aa),
+ FASTA scores: opt: 181, E(): 9.2e-05, (25.4% identity in
+ 283 aa overlap). Has hydrophobic stretch near N-terminus.
+ Protein product from Mb1825 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1825 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component ecce5. esx-5 type vii
+ secretion system protein. probable membrane protein."
+ /protein_id="SIU00429.1"
+ /db_xref="GOA:A0A1R3XZD1"
+ /db_xref="InterPro:IPR021368"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZD1"
+ /translation="MKAQRSFGLALSWPRVTAVFLVDVLILAVASHCPDSWQADHHVA
+ WWVGVGVAAVVTLLSVVSYHGITVISGLATWVRDWSADPGTTLGAGCTPAIDHQRRFG
+ RDTVGVREYNGRLVSVIEVTCGESGPSGRHWHRKSPVPMLPVVAVADGLRQFDIHLDG
+ IDIVSVLVRGGVDAAKASASLQEWEPQGWKSEERAGDRTVADRRRTWLVLRMNPQRNV
+ AAVACRDSLASTLVAATERLVQDLDGQSCAARPVTADELTEVDSAVLADLEPTWSRPG
+ WRHLKHFNGYATSFWVTPSDITSETLDELCLPDSPEVGTTVVTVRLTTRVGSPALSAW
+ VRYHSDTRLPKEVAAGLNRLTGRQLAAVRASLPAPTHRPLLVIPSRNLRDHDELVLPV
+ GQELEHATSSFVGQ"
+ gene 2031564..2033396
+ /gene="ecca5"
+ /locus_tag="BQ2027_MB1826"
+ CDS 2031564..2033396
+ /gene="ecca5"
+ /locus_tag="BQ2027_MB1826"
+ /note="Mb1826, -, len: 610 aa. Equivalent to Rv1798, len:
+ 610 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 610 aa overlap). Conserved
+ hypothetical protein, similar to several mycobacterial
+ proteins e.g. O05460|MTCY15F10.28|Rv3884c|Z94121 from M.
+ tuberculosis (619 aa), FASTA scores: opt: 669, E(): 0,
+ (31.0% identity in 549 aa overlap); and
+ O33089|MLCB628.18c|Y14967 from Mycobacterium leprae (573
+ aa), FASTA scores: opt: 723, E(): 0, (32.4% identity in
+ 568 aa overlap). Also very similar to Rv0282. May belong
+ to the CBXX/CFQX family as last ~320 aa domain very
+ similar to several family members. Contains
+ ATP/GTP-binding site motif A (P-loop; PS00017). Protein
+ product from Mb1826 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1826 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="esx conserved component ecca5. esx-5 type vii
+ secretion system protein."
+ /protein_id="SIU00430.1"
+ /db_xref="GOA:P63745"
+ /db_xref="InterPro:IPR000641"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR003959"
+ /db_xref="InterPro:IPR011990"
+ /db_xref="InterPro:IPR023835"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR041627"
+ /db_xref="UniProtKB/Swiss-Prot:P63745"
+ /translation="MTRPQAAAEDARNAMVAGLLASGISVNGLQPSHNPQVAAQMFTT
+ ATRLDPKMCDAWLARLLAGDQSIEVLAGAWAAVRTFGWETRRLGVTDLQFRPEVSDGL
+ FLRLAITSVDSLACAYAAVLAEAKRYQEAAELLDATDPRHPFDAELVSYVRGVLYFRT
+ KRWPDVLAQFPEATQWRHPELKAAGAAMATTALASLGVFEEAFRRAQEAIEGDRVPGA
+ ANIALYTQGMCLRHVGREEEAVELLRRVYSRDAKFTPAREALDNPNFRLILTDPETIE
+ ARTDPWDPDSAPTRAQTEAARHAEMAAKYLAEGDAELNAMLGMEQAKKEIKLIKSTTK
+ VNLARAKMGLPVPVTSRHTLLLGPPGTGKTSVARAFTKQLCGLTVLRKPLVVETSRTK
+ LLGRYMADAEKNTEEMLEGALGGAVFFDEMHTLHEKGYSQGDPYGNAIINTLLLYMEN
+ HRDELVVFGAGYAKAMEKMLEVNQGLRRRFSTVIEFFSYTPQELIALTQLMGRENEDV
+ ITEEESQVLLPSYTKFYMEQSYSEDGDLIRGIDLLGNAGFVRNVVEKARDHRSFRLDD
+ EDLDAVLASDLTEFSEDQLRRFKELTREDLAEGLRAAVAEKKTK"
+ gene 2034023..2034214
+ /gene="lppT"
+ /locus_tag="BQ2027_MB1827"
+ CDS 2034023..2034214
+ /gene="lppT"
+ /locus_tag="BQ2027_MB1827"
+ /note="Mb1827, lppT, len: 63 aa. Equivalent to Rv1799,
+ len: 63 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 63 aa overlap). Probable lppT
+ lipoprotein, has possible signal peptide and appropriately
+ positioned PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Mb1827 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPOPROTEIN LPPT"
+ /protein_id="SIU00431.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZB0"
+ /translation="MSVKSKNGRLAARVLVALAALFAMIALTGSACLAEGPPLGRNPQ
+ GAPAPVGGTVIVAPMHSGV"
+ gene 2034317..2036284
+ /gene="PPE28"
+ /locus_tag="BQ2027_MB1828"
+ CDS 2034317..2036284
+ /gene="PPE28"
+ /locus_tag="BQ2027_MB1828"
+ /note="Mb1828, PPE28, len: 655 aa. Equivalent to Rv1800,
+ len: 655 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 655 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of glycine-rich
+ proteins, C-terminal very similar to parts of PE proteins
+ e.g. Z92770|MTCI5.25|Rv0151c (588 aa), FASTA scores: opt:
+ 1269, E(): 0, (41.5% identity in 591 aa overlap). Mb1828
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe28"
+ /protein_id="SIU00432.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR013228"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZC0"
+ /translation="MLPNFAVLPPEVNSARVFAGAGSAPMLAAAAAWDDLASELHCAA
+ MSFGSVTSGLVVGWWQGSASAAMVDAAASYIGWLSTSAAHAEGAAGLARAAVSVFEEA
+ LAATVHPAMVAANRAQVASLVASNLFGQNAPAIAALESLYEWMWAQDAAAMAGYYVGA
+ SAVATQLASWLQRLQSIPGAASLDARLPSSAEAPMGVVRAVNSAIAANAAAAQTVGLV
+ MGGSGTPIPSARYVELANALYMSGSVPGVIAQALVTPQGLYPVVVIKNLTFDSSVAQG
+ AVILESAIRQQIAAGNNVTVFGYSQSATISSLVMANLAASADPPSPDELSFTLIGNPN
+ NPNGGVATRFPGISFPSLGVTATGATPHNLYPTKIYTIEYDGVADFPRYPLNFVSTLN
+ AIAGTYYVHSNYFILTPEQIDAAVPLTNTVGPTMTQYYIIRTENLPLLEPLRSVPIVG
+ NPLANLVQPNLKVIVNLGYGDPAYGYSTSPPNVATPFGLFPEVSPVVIADALAAGTQQ
+ GIGDFAYDVSHLELPLPADGSTMPSTAPGSGTPVPPLSIDSLIDDLQVANRNLANTIS
+ KVAATSYATVLPTADIANAALTIVPSYNIHLFLEGIQQALKGDPMGLVNAVGYPLAAD
+ VALFTAAGGLQLLIIISAGRTIANDISAIVP"
+ gene 2036865..2038136
+ /gene="PPE29"
+ /locus_tag="BQ2027_MB1829"
+ CDS 2036865..2038136
+ /gene="PPE29"
+ /locus_tag="BQ2027_MB1829"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1829, PPE29, len: 423 aa. Equivalent to Rv1801,
+ len: 423 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 423 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of glycine-rich
+ proteins, most similar to AL022021|MTV049.29|Rv1808 (409
+ aa), FASTA scores: opt: 1229, E(): 0, (55.2% identity in
+ 422 aa overlap). TBparse score is 0.927."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe29"
+ /protein_id="SIU00433.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1I6"
+ /translation="MDFGLLPPEINSGRMYTGPGPGPMLAAATAWDGLAVELHATAAG
+ YASELSALTGAWSGPSSTSMASAAAPYVAWMSATAVHAELAGAQARLAIAAYEAAFAA
+ TVPPPVIAANRAQLMVLIATNIFGQNTPAIMMTEAQYMEMWAQDAAAMYGYAGSSATA
+ SRMTAFTEPPQTTNHGQLGAQSSAVAQTAATAAGGNLQSAFPQLLSAVPRALQGLALP
+ TASQSASATPQWVTDLGNLSTFLGGAVTGPYTFPGVLPPSGVPYLLGIQSVLVTQNGQ
+ GVSALLGKIGGKPITGALAPLAEFALHTPILGSEGLGGGSVSAGIGRAGLVGKLSVPQ
+ GWTVAAPEIPSPAAALQATRLAAAPIAATDGAGALLGGMALSGLAGRAAAGSTGHPIG
+ SAAAPAVGAAAAAVEDLATEANIFVIPAMDD"
+ gene 2038248..2039639
+ /gene="PPE30"
+ /locus_tag="BQ2027_MB1830"
+ CDS 2038248..2039639
+ /gene="PPE30"
+ /locus_tag="BQ2027_MB1830"
+ /note="Mb1830, PPE30, len: 463 aa. Equivalent to Rv1802,
+ len: 463 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 463 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of glycine-rich
+ proteins, most similar to AL022021|MTV049.30|Rv1809 (468
+ aa), FASTA scores: opt: 1238, E(): 0, (51.0% identity in
+ 471 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe30"
+ /protein_id="SIU00434.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/Swiss-Prot:P0A693"
+ /translation="MDFGVLPPEINSGRMYAGPGSGPMLAAAAAWDGLATELQSTAAD
+ YGSVISVLTGVWSGQSSGTMAAAAAPYVAWMSATAALAREAAAQASAAAAAYEAAFAA
+ TVPPPVVAANRAELAVLAATNIFGQNTGAIAAAEARYAEMWAQDAAAMYGYAGSSSVA
+ TQVTPFAAPPPTTNAAGLATQGVAVAQAVGASAGNARSLVSEVLEFLATAGTNYNKTV
+ ASLMNAVTGVPYASSVYNSMLGLGFAESKMVLPANDTVISTIFGMVQFQKFFNPVTPF
+ NPDLIPKSALGAGLGLRSAISSGLGSTAPAISAGASQAGSVGGMSVPPSWAAATPAIR
+ TVAAVFSSTGLQAVPAAAISEGSLLSQMALASVAGGALGGAAARATGGFLGGGRVTAV
+ KKSLKDSDSPDKLRRVVAHMMEKPESVQHWHTDEDGLDDLLAELKKKPGIHAVHMAGG
+ NKAEIAPTISESG"
+ gene complement(2039787..2041409)
+ /gene="PE_PGRS32b"
+ /locus_tag="BQ2027_MB1831C"
+ CDS complement(2039787..2041409)
+ /gene="PE_PGRS32b"
+ /locus_tag="BQ2027_MB1831C"
+ /note="Mb1831c, PE_PGRS32b, len: 540 aa. Equivalent to 3'
+ end of Rv1803c, len: 639 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 540 aa
+ overlap). Member of the Mycobacterium tuberculosis PE
+ family, PGRS subfamily of gly-rich proteins. Most similar
+ to Rv1768|MTCY28.34|Z95890 (618 aa), FASTA scores: opt:
+ 1827, E(): 0, (53.5% identity in 664 aa overlap). Contains
+ two PS00583 pfkB family of carbohydrate kinases signatures
+ 1. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PE_PGRS32 exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a single
+ base transition (c-t) splits PE_PGRS32 into 2 parts,
+ PE_PGRS32a and PE_PGRS32b, with PE_PGRS32a being
+ truncated. Mb1831c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PE-PGRS FAMILY PROTEIN [SECOND PART]"
+ /protein_id="SIU00435.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZE5"
+ /translation="MQIVGQTALDAINSPVQTLTGRPLIGNGANGVAGTGQNGGDGGW
+ LYGNGGNGGSGGTGQNGGNGGSAGLWGSGGNGGQGGAGANGAAGQPGKAGGSGGNGGA
+ GGWIYGHGGHGGAGGNGGNATAPGGASAGFDGGAGGNGGSGGRGGLLFGNGGNGSVGG
+ MGGQGTNDTAGDSAGSGGLGGNGGNGAQGGWLIGNGGQGGDSGAGGGTDSTQTGVMNG
+ ASGGSAGIAGNGGDAGLVGNGGAGGNGGNGAAGSALGTTIFGGSGGVGGSGGDGGNGG
+ WLFGSGASGGNGGQGGDAGTNGFAGFGGSAGGGGWVGAVNFGPISVQGFGLFGHGGDG
+ GNGGDVGAGSLSIQFGASGGDGGQGGVLYGNGGNGGNAGSGGGTGFEGSAGQGGAAIL
+ IGNGGAGGNGATGGTGVGNIIQEAGGDGSDGGAGGSGGLLFGSGGAGGIGGAGGVGGS
+ GNDGGNGGDGGQGGASGLGIGNGGPGGSGGTGGAGGTGGSAGTGGAGGDGGNAALLIG
+ TGGDGGDGVPPAPGGQGGKGGLIGLPGQNGQP"
+ gene complement(2041443..2041706)
+ /gene="PE_PGRS32a"
+ /locus_tag="BQ2027_MB1832C"
+ CDS complement(2041443..2041706)
+ /gene="PE_PGRS32a"
+ /locus_tag="BQ2027_MB1832C"
+ /note="Mb1832c, PE_PGRS32a, len: 87 aa. Equivalent to 5'
+ end of Rv1803c, len: 639 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (100.0% identity in 87 aa
+ overlap). Member of the Mycobacterium tuberculosis PE
+ family, PGRS subfamily of gly-rich proteins. Most similar
+ to Rv1768|MTCY28.34|Z95890 (618 aa), FASTA scores: opt:
+ 1827, E(): 0, (53.5% identity in 664 aa overlap). Contains
+ two PS00583 pfkB family of carbohydrate kinases signatures
+ 1. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PE_PGRS32 exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a single
+ base transition (c-t) splits PE_PGRS32 into 2 parts,
+ PE_PGRS32a and PE_PGRS32b, with PE_PGRS32a being
+ truncated. Mb1832c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PE-PGRS FAMILY PROTEIN [FIRST PART]"
+ /protein_id="SIU00436.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZQ3"
+ /translation="MWTSQMIVAPAFVDAAAKDLATIGSAISRANAEALVPITALLPA
+ GADDVSAAIAALFATHGQAYQELSAHAVAFHEQFVQLMSAGAA"
+ gene complement(2041887..2042213)
+ /locus_tag="BQ2027_MB1833C"
+ CDS complement(2041887..2042213)
+ /locus_tag="BQ2027_MB1833C"
+ /note="Mb1833c, -, len: 108 aa. Equivalent to Rv1804c,
+ len: 108 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 108 aa overlap). Conserved
+ hypothetical protein, similar to several hypothetical
+ Mycobacterium tuberculosis proteins that may be exported
+ (hydrophobic stretch at N-terminus) e.g.
+ O07222|Rv1810|MTCY16F9.04C|Z96073 (118 aa), FASTA scores:
+ opt: 361, E(): 2.3e-19, (53.5% identity in 101 aa
+ overlap); Rv0622, Rv1690, and Rv3067, etc. Mb1833c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00437.1"
+ /db_xref="InterPro:IPR007969"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZD2"
+ /translation="MRVVSTLLSIPLMIGLAVPAHAGPSGDDAVFLASLERAGITYSH
+ PDQAIASGKAVCALVESGESGLQVVNELRTRNPGFSMDGCCKFAAISAHVYCPHQITK
+ TSVSAK"
+ gene complement(2042551..2042898)
+ /locus_tag="BQ2027_MB1834C"
+ CDS complement(2042551..2042898)
+ /locus_tag="BQ2027_MB1834C"
+ /note="Mb1834c, -, len: 115 aa. Equivalent to Rv1805c,
+ len: 115 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 115 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00438.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZF2"
+ /translation="MTASVVATSRERHSHKAAKQRACEITDFEPEGRFRVRKRRRGRI
+ GTKRSSISDTDYRRDSFRSHLLTAGAHGDADAQHKGMTAQQTTELGTPLVRALAPHGV
+ SGRSSRKPLGLNP"
+ gene 2042936..2043235
+ /gene="PE20"
+ /locus_tag="BQ2027_MB1835"
+ CDS 2042936..2043235
+ /gene="PE20"
+ /locus_tag="BQ2027_MB1835"
+ /note="Mb1835, PE20, len: 99 aa. Equivalent to Rv1806,
+ len: 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 99 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family of gly-, ala-rich
+ proteins, most similar to Rv1788|MTV049.10|AL022021 (99
+ aa), FASTA scores: opt: 334, E(): 4.7 e-15, (59.8%
+ identity in 97 aa overlap). Mb1835 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe20"
+ /protein_id="SIU00439.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZE2"
+ /translation="MAFVLVCPDALAIAAGQLRHVGSVIAARNAVAAPATAELAPAAA
+ DEVSALTATQFNFHAAMYQAVGAQAIAMNEAFVAMLGASADSYAATEAANIIAVS"
+ gene 2043250..2044461
+ /gene="PPE31"
+ /locus_tag="BQ2027_MB1836"
+ CDS 2043250..2044461
+ /gene="PPE31"
+ /locus_tag="BQ2027_MB1836"
+ /note="Mb1836, PPE31, len: 403 aa. Equivalent to Rv1807,
+ len: 399 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99% identity in 399 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of glycine-rich
+ proteins, most similar to Rv1789|MTV049.11|AL022021 (393
+ aa), FASTA scores: opt: 1169, E(): 0, (49.5% identity in
+ 399 aa overlap). Start site changed since original genome
+ assembly submission"
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe31"
+ /protein_id="SIU00440.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZE3"
+ /translation="MTAALDFATLPPEINSARMYSGAGSAPMLAAASAWHGLSAELRA
+ SALSYSSVLSTLTGEEWHGPASASMTAAAAPYVAWMSVTAVRAEQAGAQAEAAAAAYE
+ AAFAATVPPPVIEANRAQLMALIATNVLGQNAPAIAATEAQYAEMWSQDAMAMYGYAG
+ ASAAATQLTPFTEPVQTTNASGLAAQSAAIAHATGASAGAQQTTLSQLIAAIPSVLQG
+ LSSSTAATSASGPSGLLGILGSGSSWLDKLWALLDPNSNFWNTIASSGLFLPSNTIAP
+ FLGLLGGVAAADAAGDVLGEATSGGLGGALVAPLGSAGGLGGTVAAGLGNAATVGTLS
+ VPPSWTAAAPLASPLGSALGGTPMVAPPPAVAAGMPGMPFGTMGGQGFGRAVPQYGFR
+ PNFVARPPAAG"
+ gene 2044785..2046014
+ /gene="PPE32"
+ /locus_tag="BQ2027_MB1837"
+ CDS 2044785..2046014
+ /gene="PPE32"
+ /locus_tag="BQ2027_MB1837"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1837, PPE32, len: 409 aa. Equivalent to Rv1808,
+ len: 409 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.000% identity in 409 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family of glycine-rich
+ proteins, most similar to Rv1800|MTV049.22|AL022021 (655
+ aa), FASTA scores: opt: 1225, E(): 0, (55.1% identity in
+ 423 aa overlap). Contains PS00343 Gram-positive cocci
+ surface proteins 'anchoring' hexapeptide. TBparse score is
+ 0.919. Protein product from Mb1837 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1837
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe32"
+ /protein_id="SIU00441.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR022171"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZC6"
+ /translation="MDFGALPPEINSGRMYAGPGSGPLLAAAAAWDALAAELYSAAAS
+ YGSTIEGLTVAPWMGPSSITMAAAVAPYVAWISVTAGQAEQAGAQAKIAAGVYETAFA
+ ATVPPPVIEANRALLMSLVATNIFGQNTPAIAATEAHYAEMWAQDAAAMYGYAGSSAT
+ ASQLAPFSEPPQTTNPSATAAQSAVVAQAAGAAASSDITAQLSQLISLLPSTLQSLAT
+ TATATSASAGWDTVLQSITTILANLTGPYSIIGLGAIPGGWWLTFGQILGLAQNAPGV
+ AALLGPKAAAGALSPLAPLRGGYIADITPLGGGATGGIARAIYVGSLSVPQGWAEAAP
+ VMRAVASVLPGTGAAPALAAEAPGALFGEMALSSLAGRALAGTAVRSGAGAARVAGGS
+ VTEDVASTTTIIVIPAD"
+ gene 2046146..2046709
+ /gene="PPE33a"
+ /locus_tag="BQ2027_MB1838"
+ CDS 2046146..2046709
+ /gene="PPE33a"
+ /locus_tag="BQ2027_MB1838"
+ /note="Mb1838, PPE33a, len: 187 aa. Equivalent to 5' end
+ of Rv1809, len: 468 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 187 aa overlap). Member
+ of the Mycobacterium tuberculosis PPE family of
+ glycine-rich proteins, most similar to
+ RV1802AL022021|MTV049.23 (463 aa), FASTA scores: opt:
+ 1238, E(): 0, (51.2% identity in 471 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PPE33 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ transition (c-t) splits PPE33 into 2 parts, PPE33a and
+ PPE33b, with PPE33a being truncated. Mb1838 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PPE FAMILY PROTEIN [FIRST PART]"
+ /protein_id="SIU00442.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZD0"
+ /translation="MDFGLQPPEITSGEMYLGPGAGPMLAAAVAWDGLAAELQSMAAS
+ YASIVEGMASESWLGPSSAGMAAAAAPYVTWMSGTSAQAKAAADQARAAVVAYETAFA
+ AVVPPPQIAANRSQLISLVATNIFGQNTAAIAATEAEYGEMWAQDTMAMFGYASSSAT
+ ASRLTPFTAPPQTTNPSGLAGQAAATG"
+ gene 2046710..2047558
+ /gene="PPE33b"
+ /locus_tag="BQ2027_MB1839"
+ /pseudo
+ CDS 2046710..2047558
+ /gene="PPE33b"
+ /locus_tag="BQ2027_MB1839"
+ /note="Mb1839, PPE33b, len: 282 aa. Equivalent to 3' end
+ of Rv1809, len: 468 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (). Member of the Mycobacterium tuberculosis
+ PPE family of glycine-rich proteins, most similar to
+ RV1802AL022021|MTV049.23 (463 aa), FASTA scores: opt:
+ 1238, E(): 0, (51.2% identity in 471 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PPE33 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ transition (c-t), splits PPE33 into 2 parts, PPE33a and
+ PPE33b, with PPE33a being truncated. Mb1839 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing.;PPE FAMILY PROTEIN [SECOND PART]"
+ /pseudo
+ /codon_start=1
+ /transl_table=11
+ gene 2047797..2048153
+ /locus_tag="BQ2027_MB1840"
+ CDS 2047797..2048153
+ /locus_tag="BQ2027_MB1840"
+ /note="Mb1840, -, len: 118 aa. Equivalent to Rv1810, len:
+ 118 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 118 aa overlap). Conserved
+ hypothetical protein, similar to several hypothetical
+ Mycobacterium tuberculosis proteins that may be exported
+ (possible N-terminal signal sequence) e.g.
+ O53953|Rv1804c|MTV049.26c|AL022021 (108 aa), FASTA scores:
+ opt: 361, E(): 9.6e-17, (53.5% identity in 101 aa
+ overlap); Rv0622, and Rv1690, etc. Protein product from
+ Mb1840 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1840 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00444.1"
+ /db_xref="InterPro:IPR007969"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1J6"
+ /translation="MQLQRTMGQCRPMRMLVALLLSAATMIGLAAPGKADPTGDDAAF
+ LAALDQAGITYADPGHAITAAKAMCGLCANGVTGLQLVADLRDYNPGLTMDSAAKFAA
+ IASGAYCPEHLEHHPS"
+ gene 2048307..2049011
+ /gene="mgtC"
+ /locus_tag="BQ2027_MB1841"
+ CDS 2048307..2049011
+ /gene="mgtC"
+ /locus_tag="BQ2027_MB1841"
+ /note="Mb1841, -, len: 234 aa. Equivalent to Rv1811, len:
+ 234 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 234 aa overlap). Possible mgtC,
+ magnesium (Mg2+) transport P-type ATPase C (transmembrane
+ protein) (EC 3.6.3.1), highly similar to many e.g.
+ NP_442124.1|NC_000911 Mg2+ transport ATPase from
+ Synechocystis sp. strain PCC 6803 (234 aa);
+ NP_251248.1|NC_002516 probable transport protein from
+ Pseudomonas aeruginosa (230 aa); P22037|ATMC_SALTY|STM3764
+ magnesium transport ATPase protein C from Salmonella
+ typhimurium (231 aa), FASTA scores: opt: 545, E():
+ 4.1e-30, (42.3% identity in 220 aa overlap); N-terminus of
+ NP_213315.1|NC_000918 Mg(2+) transport ATPase from Aquifex
+ aeolicus (225 aa); etc. BELONGS TO THE MGTC / SAPB
+ FAMILY,Mb1841 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE Mg2+ TRANSPORT P-TYPE ATPASE C MGTC"
+ /protein_id="SIU00445.1"
+ /db_xref="GOA:A0A1R3Y076"
+ /db_xref="InterPro:IPR003416"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y076"
+ /translation="MQTLTVADFALRLAVGVGCGAIIGLERQWRARMAGLRTNALVAT
+ GATLFVLYAVATEDSSPTRVASYVVSGIGFLGGGVILREGFNVRGLNTAATLWCSAAV
+ GVLAASGHLVFTLIGTGTIVAVHLLGRPLGRLVDRDNAVEDEGLQPYQVRVICRPKAE
+ TYVRAHIVQRTSSNDITLRGIRTGPAGDDNITLTAHLLMVGHTPAKLERLVAELSLQP
+ GVYAVHWYAGEHAQAE"
+ gene complement(2049021..2050223)
+ /locus_tag="BQ2027_MB1842C"
+ CDS complement(2049021..2050223)
+ /locus_tag="BQ2027_MB1842C"
+ /note="Mb1842c, -, len: 400 aa. Equivalent to Rv1812c,
+ len: 400 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 400 aa overlap). Probable dehydrogenase
+ (EC 1.-.-.-), similar to other dehydrogenases/oxidases
+ e.g. AE001947|AE001947_10 NADH dehydrogenase II of
+ Deinococcus radiodurans (379 aa), FASTA scores: opt: 404,
+ E(): 3.4e-18, (26.4% identity in 363 aa overlap) and
+ DHNA_HAEIN|P44856 nadh dehydrogenase (EC 1.6.99.3) (444
+ aa), FASTA scores: opt: 200, E(): 8.5e-06, (23.3% identity
+ in 258 aa overlap). Also similar to Mycobacterium
+ tuberculosis hypothetical dehydrogenases Rv0392c, and
+ Rv1854c|MTCY359.19 ndh probable NADH dehydrogenase (31.5%
+ identity in 321 aa overlap). Protein product from Mb1842c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1842c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEHYDROGENASE"
+ /protein_id="SIU00446.1"
+ /db_xref="GOA:A0A1R3XZF5"
+ /db_xref="InterPro:IPR023753"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZF5"
+ /translation="MTRVVVIGSGFAGLWAALGAARRLDELAVPAGTVDVMVVSNKPF
+ HDIRVRNYEADLSACRIPLGDVLGPAGVAHVTAEVTAIDADGRRVTTSTGASYSYDRL
+ VLASGSHVVKPALPGLAEFGFDVDTYDGAVRLQQHLQGLAGGPLTSAAATVVVVGAGL
+ TGIETACELPGRLHALFARGDGVTPRVVLIDHNPFVGSDMGLSARPVIEQALLDNGVE
+ TRTGVSVAAVSPGGVTLSSGERLAAATVVWCAGMRASRLTEQLPVARDRLGRLQVDDY
+ LRVIGVPAMFAAGDVAAARMDDEHLSVMSCQHGRPMGRYAGCNVINDLFDQPLLALRI
+ PWYVTVLDLGSAGAVYTEGWERKVVSQGAPAKTTKQSINTRRIYPPLNGSRADLLAAA
+ APRVQPRP"
+ gene complement(2050545..2050976)
+ /locus_tag="BQ2027_MB1843C"
+ CDS complement(2050545..2050976)
+ /locus_tag="BQ2027_MB1843C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1843c, -, len: 143 aa. Equivalent to Rv1813c,
+ len: 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 143 aa overlap). Conserved
+ hypothetical protein. Possibly a exported protein with
+ potential N-terminal signal sequence. Similar to
+ Q11050|Rv1269c|MTCY50.13 hypothetical protein from
+ Mycobacterium tuberculosis (124 aa), (42.7% identity in
+ 143 aa overlap). Protein product from Mb1843c detected
+ using SWATH mass spectrometry. Mb1843c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative membrane protein"
+ /protein_id="SIU00447.1"
+ /db_xref="GOA:P64890"
+ /db_xref="InterPro:IPR025240"
+ /db_xref="UniProtKB/Swiss-Prot:P64890"
+ /translation="MITNLRRRTAMAAAGLGAALGLGILLVPTVDAHLANGSMSEVMM
+ SEIAGLPIPPIIHYGAIAYAPSGASGKAWHQRTPARAEQVALEKCGDKTCKVVSRFTR
+ CGAVAYNGSKYQGGTGLTRRAAEDDAVNRLEGGRIVNWACN"
+ gene 2051385..2052287
+ /gene="erg3"
+ /locus_tag="BQ2027_MB1844"
+ CDS 2051385..2052287
+ /gene="erg3"
+ /locus_tag="BQ2027_MB1844"
+ /note="Mb1844, erg3, len: 300 aa. Equivalent to Rv1814,
+ len: 300 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 300 aa overlap). erg3, transmembrane
+ C-5 sterol desaturase (EC 1.3.-.-) (see *), weak
+ similarity to several e.g. ERG3_YEAST|P32353 c-5 sterol
+ desaturase (365 aa), FASTA scores: opt: 154, E(): 0.0011,
+ (22.9% identity in 288 aa overlap). BELONGS TO THE STEROL
+ DESATURASE FAMILY. [* note work of Jackson, C.J., Lamb,
+ D.C., Kelly, D.E., Kelly, S.L., Characterization of a
+ sterol delta 5,6-desaturase homolog in Mycobacterium bovis
+ (BCG). Submitted (JUN-2000) to the EMBL/GenBank/DDBJ
+ databases]. Mb1844 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MEMBRANE-BOUND C-5 STEROL DESATURASE ERG3
+ (STEROL-C5-DESATURASE)"
+ /protein_id="SIU00448.1"
+ /db_xref="GOA:P68434"
+ /db_xref="InterPro:IPR006694"
+ /db_xref="UniProtKB/Swiss-Prot:P68434"
+ /translation="MRDPVLFAIPCFLLLLILEWTAARKLESIETAATGQPRPASGAY
+ LTRDSVASISMGLVSIATTAGWKSLALLGYAAIYAYLAPWQLSAHRWYTWVIAIVGVD
+ LLYYSYHRIAHRVRLIWATHQAHHSSEYFNFATALRQKWNNSGEILMWVPLPLMGLPP
+ WMVFCSWSLNLIYQFWVHTERIDRLPRWFEFVFNTPSHHRVHHGMDPVYLDKNYGGIL
+ IIWDRLFGSFQPELFRPHYGLTKRVDTFNIWKLQTREYVAIVRDWRSATRLRDRLGYV
+ FGPPGWEPRTIDKSNAAASLVTSR"
+ gene 2052392..2053057
+ /locus_tag="BQ2027_MB1845"
+ CDS 2052392..2053057
+ /locus_tag="BQ2027_MB1845"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1845, -, len: 221 aa. Equivalent to Rv1815, len:
+ 221 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 221 aa overlap). Conserved hypothetical
+ protein, similar to G473456 hypothetical protein from
+ Mycobacterium fortuitum (255 aa), FASTA scores: opt: 182,
+ E(): 3.2e-05, (29.6% identity in 230 aa overlap). Mb1845
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00449.1"
+ /db_xref="InterPro:IPR009003"
+ /db_xref="UniProtKB/Swiss-Prot:P59981"
+ /translation="MVRLVPRAFAATVALLAAGFSPATASADPVLVFPGMEIRQDNHV
+ CTLGYVDPALKIAFTAGHCRGGGAVTSRDYKVIGHLRAFRDNTPSGSTVATHELIADY
+ EAIVLADDVTASNILPSGRALESRPGVVLHPGQAVCHFGVSTGETCGTVESVNNGWFT
+ MSHGVLSEKGDSGGPVYLAPDGGPAQIVGIFNSVWGGFPAAVSWRSTSEQVHADLGVT
+ PLA"
+ gene 2053120..2053824
+ /locus_tag="BQ2027_MB1846"
+ CDS 2053120..2053824
+ /locus_tag="BQ2027_MB1846"
+ /note="Mb1846, -, len: 234 aa. Equivalent to Rv1816, len:
+ 234 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 234 aa overlap). Possible
+ transcriptional regulatory protein. MEME analysis suggests
+ similarity to putative Mycobacterium tuberculosis
+ transcriptional regulators, Rv0653c, Rv0681. Contains
+ helix-turn-helix motif at aa 38-59 (+4.30 SD). Protein
+ product from Mb1846 detected using SWATH mass
+ spectrometry. Mb1846 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00450.1"
+ /db_xref="GOA:P67439"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR025996"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/Swiss-Prot:P67439"
+ /translation="MCQTCRVGKRRDAREQIEAKIVELGRRQLLDHGAAGLSLRAIAR
+ NLGMVSSAVYRYVSSRDELLTLLLVDAYSDLADTVDRARDDTVADSWSDDVIAIARAV
+ RGWAVTNPARWALLYGSPVPGYHAPPDRTAGVATRVVGAFFDAIAAGIATGDIRLTDD
+ VAPQPMSSDFEKIRQEFGFPGDDRVVTKCFLLWAGVVGAISLEVFGQYGADMLTDPGV
+ VFDAQTRLLVAVLAEH"
+ gene 2054305..2054385
+ /locus_tag="BQ2027_MB1847"
+ CDS 2054305..2054385
+ /locus_tag="BQ2027_MB1847"
+ /note="Mb1847, -, len: 26 aa. Equivalent to Rv1816A, len:
+ 26 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 26 aa overlap). Conserved hypothetical
+ protein. Mb1847 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00451.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZE9"
+ /translation="MSRAGDDAVGVPPACGGRSDDEERRQ"
+ gene 2054459..2055922
+ /locus_tag="BQ2027_MB1848"
+ CDS 2054459..2055922
+ /locus_tag="BQ2027_MB1848"
+ /note="Mb1848, -, len: 487 aa. Equivalent to Rv1817, len:
+ 487 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 487 aa overlap). Possible
+ flavoprotein, similar to G746486 flavoprotein subunit of
+ fumarate reductase fad domain homologue (474 aa), FASTA
+ scores: opt: 223, E(): 5.7e-07, (24.1% identity in 489 aa
+ overlap); and AJ236923|SFR236923_3 soluble fumarate
+ reductase of Shewanella frigidimarina ifcA (588 aa), FASTA
+ scores: opt: 310, E(): 2.5e-11, (27.3% identity in 484 aa
+ overlap). Mb1848 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE FLAVOPROTEIN"
+ /protein_id="SIU00452.1"
+ /db_xref="InterPro:IPR003953"
+ /db_xref="InterPro:IPR027477"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZD7"
+ /translation="MSTDIPATVSAETVTSWSDDVDVTVIGFGIAGGCAAVSAAAAGA
+ RVLVLERAAAAGGTTALAGGHFYLGGGTTVQLATGHPDSPEEMYKYLVAVSREPDHDK
+ IRAYCDGSVEHFNWLEGLGFQFERSYFPGKAVIQPNTEGLMFTGNEKVWPFLELAVPA
+ PRGHKVPVPGDTGGAAMVIDLLLKRAASLGIQIRYETGATELIVDGTGKVTGVMWKRF
+ SETGAIKAKSVIIAAGGFVMNPDMVAKYTPKLAEKPFVLGNTYDDGLGIRLGVSAGGA
+ TQHMDQMFITAPPYPPSILLTGIIVNKLGQRFVAEDSYHSRTAGFIMEQPDSAAYLIV
+ DEAHLEHPKMPLVPLIDGWETVVEMEAALGIPPGNLAATLDRYNAYAARGADPDFHKQ
+ PEFLAAQDNGPWGAFDMSLGKAMYAGFTLGGLATSVDGQVLRDDGAVVAGLYAVGACA
+ SNIAQDGKGYASGTQLGEGSFFGRRAGAHAAARAQGM"
+ gene complement(2056042..2057547)
+ /gene="PE_PGRS33"
+ /locus_tag="BQ2027_MB1849C"
+ CDS complement(2056042..2057547)
+ /gene="PE_PGRS33"
+ /locus_tag="BQ2027_MB1849C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1849c, PE_PGRS33, len: 501 aa. Equivalent to
+ Rv1818c, len: 498 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.2% identity in 501 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins (see first citation),
+ similar to many. Contains 2 x PS00583 pfkB family of
+ carbohydrate kinases signature 1. Supposed localised to
+ the cell surface. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 9 bp insertion (*-gccgccggc), leads
+ to a longer product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (501 aa versus 498
+ aa). Mb1849c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs33"
+ /protein_id="SIU00453.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZD5"
+ /translation="MSFVVTIPEALAAVATDLAGIGSTIGTANAAAAVPTTTVLAAAA
+ DEVSAAMAALFSGHAQAYQALSAQAALFHEQFVRALTAGAGSYAAAEAASAAPLEGVL
+ DVINAPALALLGRPLIGNGANGAPGTGANGGDGGILIGNGGAGGSGAAGMPGGNGGAA
+ GLFGNGGAGGAGGNVASGTAGFGGAGGAGGLLYGAGGAGGAGGRAGGGVGGIGGAGGA
+ GGNGGLLFGAGGAGSVGGLAADAGDGGAGGDGGLFFGVGGAGGAGGTGTNVTGGAGGA
+ GGNGGLLFGAGGVGGVGGDGVAFLGTAPGGPGGAGGAGGLFGVGGAGGAGGIGLVGNG
+ GAGGSGGSALLWGDGGAGGAGGVGSTTGGAGGAGGNAGLLVGAGGAGGAGALGGGATG
+ VGGAGGNGGTAGLLFGAGGAGGAGGFGFGGAGGAGGLGGKAGLIGDGGDGGAGGNGTG
+ AKGGDGGAGGGAILVGNGGNGGNAGSGTPNGSAGTGGAGGLLGKNGMNGLP"
+ gene complement(2057682..2059601)
+ /gene="baca"
+ /locus_tag="BQ2027_MB1850C"
+ CDS complement(2057682..2059601)
+ /gene="baca"
+ /locus_tag="BQ2027_MB1850C"
+ /note="Mb1850c, -, len: 639 aa. Equivalent to Rv1819c,
+ len: 639 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 639 aa overlap). Probable
+ drugs-transport transmembrane ATP-binding protein ABC
+ transporter (see citation below), equivalent to
+ AL008609|MLCB1788.47 hypothetical ABC transporter from
+ Mycobacterium leprae (638 aa), (74.9% identity in 634 aa
+ overlap). Also similar to other transmembrane ATP-binding
+ proteins e.g. Q57335|Y036_HAEIN hypothetical ABC
+ transporter ATP-binding protein from Haemophilus
+ influenzae (592 aa), FASTA scores: opt: 1235, E():
+ 2.8e-61, (40.8% identity in 623 aa overlap); etc. Contains
+ PS00017 ATP/GTP-binding site motif A (P-loop), and PS00211
+ ABC transporters family signature. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Protein product from Mb1850c detected using SWATH mass
+ spectrometry. Mb1850c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable drug-transport transmembrane
+ atp-binding protein abc transporter baca"
+ /protein_id="SIU00454.1"
+ /db_xref="GOA:A0A1R3Y1K9"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR011527"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036640"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1K9"
+ /translation="MGPKLFKPSIDWSRAFPDSVYWVGKAWTISAICVLAILVLLRYL
+ TPWGRQFWRITRAYFVGPNSVRVWLMLGVLLLSVVLAVRLNVLFSYQGNDMYTALQKA
+ FEGIASGDGTVKRSGARGFWMSIGVFSVMAVLHVTRVMADIYLTQRFIIAWRVWLTHH
+ LTQDWLDGRAYYRDLFIDETIDNPDQRIQQDVDIFTAGAGGTPNAPSNGTASTLLFGA
+ VQSIISVISFTAILWNLSGTLNIFGVSIPRAMFWTVLVYVFVATVISFIIGRPLIWLS
+ FRNEKLNAAFRYALVRLRDAAEAVGFYRGERVEGTQLQRRFTPVIDNYRRYVRRSIAF
+ NGWNLSVSQTIVPLPWVIQAPRLFAGQIDFGDVGQTATSFGNIHDSLSFFRNNYDAFA
+ SFRAAIIRLHGLVDANEKGRALPAVLTRPSDDESVELNDIEVRTPAGDRLIDPLDVRL
+ DRGGSLVITGRSGAGKTTLLRSLAELWPYASGTLHRPGGENETMFLSQLPYVPLGTLR
+ DVVCYPNSAAAIPDATLRDTLTKVALAPLCDRLDEERDWAKVLSPGEQQRVAFARILL
+ TKPKAVFLDESTSALDTGLEFALYQLLRSELPDCIVVSVSHRPALERLHENQLELLGG
+ GQWRLAPVEAAPAEV"
+ gene 2059672..2061315
+ /gene="ilvG"
+ /locus_tag="BQ2027_MB1851"
+ CDS 2059672..2061315
+ /gene="ilvG"
+ /locus_tag="BQ2027_MB1851"
+ /note="Mb1851, ilvG, len: 547 aa. Equivalent to Rv1820,
+ len: 547 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 547 aa overlap). Probable ilvG,
+ acetolactate synthase (EC 4.1.3.18). Equivalent to
+ AL008609|MLCB1788.46c ilvG from Mycobacterium leprae (548
+ aa) (86.1% identity in 548 aa overlap). Similar to
+ ILVB_KLEPN|P27696 (559 aa), FASTA scores: opt: 660, E():
+ 2.9e-34, (29.1% identity in 549 aa overlap). Also similar
+ to other Mycobacterium tuberculosis Ilv proteins e.g.
+ Rv3003c (ilvB), etc. Contains PS00187 Thiamine
+ pyrophosphate enzymes signature. Protein product from
+ Mb1851 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1851 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Acetolactate synthase ilvG
+ (Acetohydroxy-acid synthase)(ALS)"
+ /protein_id="SIU00455.1"
+ /db_xref="GOA:P66947"
+ /db_xref="InterPro:IPR000399"
+ /db_xref="InterPro:IPR011766"
+ /db_xref="InterPro:IPR012000"
+ /db_xref="InterPro:IPR012001"
+ /db_xref="InterPro:IPR029035"
+ /db_xref="InterPro:IPR029061"
+ /db_xref="UniProtKB/Swiss-Prot:P66947"
+ /translation="MSTDTAPAQTMHAGRLIARRLKASGIDTVFTLSGGHLFSIYDGC
+ REEGIRLIDTRHEQTAAFAAEGWSKVTRVPGVAALTAGPGITNGMSAMAAAQQNQSPL
+ VVLGGRAPALRWGMGSLQEIDHVPFVAPVARFAATAQSAENAGLLVDQALQAAVSAPS
+ GVAFVDFPMDHAFSMSSDNGRPGALTELPAGPTPAGDALDRAAGLLSTAQRPVIMAGT
+ NVWWGHAEAALLRLVEERHIPVLMNGMARGVVPADHRLAFSRARSKALGEADVALIVG
+ VPMDFRLGFGGVFGSTTQLIVADRVEPAREHPRPVAAGLYGDLTATLSALAGSGGTDH
+ QGWIEELATAETMARDLEKAELVDDRIPLHPMRVYAELAALLERDALVVIDAGDFGSY
+ AGRMIDSYLPGCWLDSGPFGCLGSGPGYALAAKLARPQRQVVLLQGDGAFGFSGMEWD
+ TLVRHNVAVVSVIGNNGIWGLEKHPMEALYGYSVVAELRPGTRYDEVVRALGGHGELV
+ SVPAELRPALERAFASGLPAVVNVLTDPSVAYPRRSNLA"
+ gene 2061330..2063756
+ /gene="secA2"
+ /locus_tag="BQ2027_MB1852"
+ CDS 2061330..2063756
+ /gene="secA2"
+ /locus_tag="BQ2027_MB1852"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1852, secA2, len: 808 aa. Equivalent to Rv1821,
+ len: 808 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 808 aa overlap). Possible secA2,
+ preprotein translocase, component of secretion apparatus,
+ similar to several preprotein translocases e.g.
+ P28366|SECA_BACSU preprotein translocase secA subunit from
+ Bacillus subtilis (841 aa), FASTA scores: opt: 1424, E():
+ 0, (35.9% identity in 786 aa overlap). Equivalent to
+ AL008609|MLCB1788.45 Preprotein translocase SecA 2 from
+ Mycobacterium leprae (778 aa) (87.1% identity in 780 aa
+ overlap). Also similar to Rv3240c|MTCY20B11.15c secA
+ preprotein translocase from Mycobacterium tuberculosis
+ (949 aa). COULD BE PART OF THE PROKARYOTIC PROTEIN
+ TRANSLOCATION APPARATUS WHICH COMPRISE SECA|Rv3240c,
+ SECD|Rv2587c, SECE|Rv0638, SECF|Rv2586c, SECG|Rv1440 AND
+ SECY|Rv0732. Protein product from Mb1852 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1852 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible preprotein translocase atpase seca2"
+ /protein_id="SIU00456.1"
+ /db_xref="GOA:P66786"
+ /db_xref="InterPro:IPR000185"
+ /db_xref="InterPro:IPR011115"
+ /db_xref="InterPro:IPR011116"
+ /db_xref="InterPro:IPR011130"
+ /db_xref="InterPro:IPR014018"
+ /db_xref="InterPro:IPR020937"
+ /db_xref="InterPro:IPR026389"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036266"
+ /db_xref="InterPro:IPR036670"
+ /db_xref="UniProtKB/Swiss-Prot:P66786"
+ /translation="MNVHGCPRIAACRCTDTHPRGRPAFAYRWFVPKTTRAQPGRLSS
+ RFWRLLGASTEKNRSRSLADVTASAEYDKEAADLSDEKLRKAAGLLNLDDLAESADIP
+ QFLAIAREAAERRTGLRPFDVQLLGALRMLAGDVIEMATGEGKTLAGAIAAAGYALAG
+ RHVHVVTINDYLARRDAEWMGPLLDAMGLTVGWITADSTPDERRTAYDRDVTYASVNE
+ IGFDVLRDQLVTDVNDLVSPNPDVALIDEADSVLVDEALVPLVLAGTTHRETPRLEII
+ RLVAELVGDKDADEYFATDSDNRNVHLTEHGARKVEKALGGIDLYSEEHVGTTLTEVN
+ VALHAHVLLQRDVHYIVRDDAVHLINASRGRIAQLQRWPDGLQAAVEAKEGIETTETG
+ EVLDTITVQALINRYATVCGMTGTALAAGEQLRQFYQLGVSPIPPNKPNIREDEADRV
+ YITTAAKNDGIVEHITEVHQRGQPVLVGTRDVAESEELHERLVRRGVPAVVLNAKNDA
+ EEARVIAEAGKYGAVTVSTQMAGRGTDIRLGGSDEADHDRVAELGGLHVVGTGRHHTE
+ RLDNQLRGRAGRQGDPGSSVFFSSWEDDVVAANLDHNKLPMATDENGRIVSPRTGSLL
+ DHAQRVAEGRLLDVHANTWRYNQLIAQQRAIIVERRNTLLRTVTAREELAELAPKRYE
+ ELSDKVSEERLETICRQIMLYHLDRGWADHLAYLADIRESIHLRALGRQNPLDEFHRM
+ AVDAFASLAADAIEAAQQTFETANVLDHEPGLDLSKLARPTSTWTYMVNDNPLSDDTL
+ SALSLPGVFR"
+ gene 2063953..2064582
+ /gene="pgsA2"
+ /locus_tag="BQ2027_MB1853"
+ CDS 2063953..2064582
+ /gene="pgsA2"
+ /locus_tag="BQ2027_MB1853"
+ /note="Mb1853, pgsA2, len: 209 aa. Equivalent to Rv1822,
+ len: 209 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 209 aa overlap). Probable pgsA2,
+ CDP-diacylglycerol--glycerol-3-phosphate
+ 3-phosphatidyl-transferase (EC 2.7.8.5) (see citation
+ below), integral membrane protein, equivalent to
+ AL008609|MLCB1788_17 phosphatidyltransferase from
+ Mycobacterium leprae (206 aa), FASTA score: (76.6%
+ identity in 205 aa overlap). Also highly similar or
+ similar to others e.g. CAB88885.1|AL353861 putative
+ CDP-diacylglycerol--glycerol-3-phosphate
+ 3-phosphatidyl-transferase from Streptomyces coelicolor
+ (215 aa); AAC44003.1|U29587 phosphatidylglycerol phosphate
+ synthase from Rhodobacter sphaeroides (227 aa);
+ NP_405431.1|NC_003143
+ CDP-diacylglycerol--glycerol-3-phosphate
+ 3-phosphatidyltransferase from Yersinia pestis (182 aa);
+ P06978|PGSA_ECOLI CDP-diacylglycerol--glycerol-3-phosphate
+ 3-phosphatidyltransferase from Escherichia coli (181 aa),
+ FASTA scores: opt: 252, E(): 2.8e-09, (29.7% identity in
+ 175 aa overlap); etc. Also similar to
+ Rv2746c|PGSA3|MTV002.11c
+ CDP-DIACYLGLYCEROL--GLYCEROL-3-PHOSPHATE
+ 3-PHOSPHATIDYLTRANSFERASE (PGP SYNTHASE) from
+ Mycobacterium tuberculosis (209 aa). Contains PS00379
+ CDP-alcohol phosphatidyltransferases signature; and
+ PS00075 Dihydrofolate reductase signature. BELONGS TO THE
+ CDP-ALCOHOL PHOSPHATIDYLTRANSFERASE CLASS-I FAMILY.
+ Protein product from Mb1853 detected using SWATH mass
+ spectrometry. Mb1853 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE
+ CDP-DIACYLGLYCEROL--GLYCEROL-3-PHOSPHATE
+ 3-PHOSPHATIDYLTRANSFERASE PGSA2 (PGP SYNTHASE)
+ (PHOSPHATIDYLGLYCEROPHOSPHATE SYNTHASE)
+ (3-PHOSPHATIDYL-1'-GLYCEROL-3'PHOSPHATE SYNTHASE)"
+ /protein_id="SIU00457.1"
+ /db_xref="GOA:P63754"
+ /db_xref="InterPro:IPR000462"
+ /db_xref="InterPro:IPR004570"
+ /db_xref="UniProtKB/Swiss-Prot:P63754"
+ /translation="MEPVLTQNRVLTVPNMLSVIRLALIPAFVYVVLSAHANGWGVAI
+ LVFSGVSDWADGKIARLLNQSSRLGALLDPAVDRLYMVTVPIVFGLSGIVPWWFVLTL
+ LTRDALLAGTLPLLWSRGLSALPVTYVGKAATFGFMVGFPTILLGQCDPLWSHVLLAC
+ GWAFLIWGMYAYLWAFVLYAVQMTMVVRQMPKLKGRAHRPAAQNAGERG"
+ gene 2064575..2065498
+ /locus_tag="BQ2027_MB1854"
+ CDS 2064575..2065498
+ /locus_tag="BQ2027_MB1854"
+ /note="Mb1854, -, len: 307 aa. Equivalent to Rv1823, len:
+ 307 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 307 aa overlap). Conserved
+ hypothetical protein, similar to P71582|MTCY10H4.12|RV0012
+ hypothetical protein CY10H4.12 from Mycobacterium
+ tuberculosis (262 aa), FASTA scores: opt: 304, E():
+ 1.5e-12, (30.1% identity in 246 aa overlap). Protein
+ product from Mb1854 detected using SWATH mass
+ spectrometry. Mb1854 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="UPF0749 protein Rv1823"
+ /protein_id="SIU00458.1"
+ /db_xref="GOA:P64892"
+ /db_xref="InterPro:IPR010273"
+ /db_xref="UniProtKB/Swiss-Prot:P64892"
+ /translation="MAESDRLLGGYDPNAGYSAHAGAQPQRIPVPSLLRALLSEHLDA
+ GYAAVAAERERAAAPRCWQARAVSWMWQALAATLVAAVFAAAVAQARSVAPGVRAAQQ
+ LLVASVRSTQAAATTLAQRRSTLSAKVDDVRRIVLADDAEGQRLLARLDVLSLAAASA
+ PVVGPGLTVTVTDPGASPNLSDVSKQRVSGSQQIILDRDLQLVVNSLWESGAEAISID
+ GVRIGPNVTIRQAGGAILVDNNPTSSPYTILAVGPPHAMQDVFDRSAGLYRLRLLETS
+ YGVGVSVNVGDGLALPAGATRDVKFAKQIGP"
+ gene 2065527..2065892
+ /locus_tag="BQ2027_MB1855"
+ CDS 2065527..2065892
+ /locus_tag="BQ2027_MB1855"
+ /note="Mb1855, -, len: 121 aa. Equivalent to Rv1824, len:
+ 121 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 121 aa overlap). Conserved
+ hypothetical membrane protein similar to P28265|SBP_BACSU
+ sbp protein from Bacillus subtilis (121 aa), FASTA scores:
+ opt: 261, E(): 1.9e-12, (38.9% identity in 113 aa
+ overlap). Mb1855 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Small basic protein Sbp"
+ /protein_id="SIU00459.1"
+ /db_xref="GOA:P64894"
+ /db_xref="InterPro:IPR009709"
+ /db_xref="UniProtKB/Swiss-Prot:P64894"
+ /translation="MGSDTAWSPARMIGIAALAVGIVLGLVFHPGVPEVIQPYLPIAV
+ VAALDAVFGGLRAYLERIFDPKVFVVSFVFNVLVAALIVYVGDQLGVGTQLSTAIIVV
+ LGIRIFGNTAALRRRLFGA"
+ gene 2065909..2066787
+ /locus_tag="BQ2027_MB1856"
+ CDS 2065909..2066787
+ /locus_tag="BQ2027_MB1856"
+ /note="Mb1856, -, len: 292 aa. Equivalent to Rv1825, len:
+ 292 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 292 aa overlap). Conserved
+ hypothetical protein, weak similarity to Mycobacterium
+ tuberculosis hypothetical proteins
+ Q50610|MTCY1A11.20C|Rv1823|Z78020 (307 aa), FASTA scores:
+ opt: 182, E(): 0.00044, (29.9% identity in 204 aa
+ overlap); and Rv0012. Has a hydrophobic stretch, TMhelix
+ from aa 67 to 85 Protein product from Mb1856 detected
+ using SWATH mass spectrometry. Mb1856 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="UPF0749 protein Rv1825"
+ /protein_id="SIU00460.1"
+ /db_xref="GOA:P64896"
+ /db_xref="InterPro:IPR010273"
+ /db_xref="UniProtKB/Swiss-Prot:P64896"
+ /translation="MSENRPEPVAAETSAATTARHSQADAGAHDAVRRGRHELPADHP
+ RSKVGPLRRTRLTEILRGGRSRLVFGTLAILLCLVLGVAIVTQVRQTDSGDSLETARP
+ ADLLVLLDSLRQREATLNAEVIDLQNTLNALQASGNTDQAALESAQARLAALSILVGA
+ VGATGPGVMITIDDPGPGVAPEVMIDVINELRAAGAEAIQINDAHRSVRVGVDTWVVG
+ VPGSLTVDTKVLSPPYSILAIGDPPTLAAAMNIPGGAQDGVKRVGGRMVVQQADRVDV
+ TALRQPKQHQYAQPVK"
+ gene 2066825..2067229
+ /gene="gcvH"
+ /locus_tag="BQ2027_MB1857"
+ CDS 2066825..2067229
+ /gene="gcvH"
+ /locus_tag="BQ2027_MB1857"
+ /note="Mb1857, gcvH, len: 134 aa. Equivalent to Rv1826,
+ len: 134 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 134 aa overlap). Probable gcvH, glycine
+ cleavage system H protein, highly similar to
+ GCSH_ECOLI|P23884 glycine cleavage system H protein from
+ Escherichia coli (129 aa), FASTA scores: opt: 428, E():
+ 2.2e-22, (47.8% identity in 134 aa overlap). Equivalent to
+ MLCB1788.37c gcvH from Mycobacterium leprae (78.4%
+ identity in 134 aa overlap). Contains PS00189 2-oxo acid
+ dehydrogenases acyltransferase component lipoyl binding
+ site. BELONGS TO THE GCVH FAMILY. Protein product from
+ Mb1857 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1857 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLYCINE CLEAVAGE SYSTEM H PROTEIN GCVH"
+ /protein_id="SIU00461.1"
+ /db_xref="GOA:Q7TZG8"
+ /db_xref="InterPro:IPR000089"
+ /db_xref="InterPro:IPR002930"
+ /db_xref="InterPro:IPR003016"
+ /db_xref="InterPro:IPR011053"
+ /db_xref="InterPro:IPR017453"
+ /db_xref="InterPro:IPR033753"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZG8"
+ /translation="MSDIPSDLHYTAEHEWIRRSGDDTVRVGITDYAQSALGDVVFVQ
+ LPVIGTAVTAGETFGEVESTKSVSDLYAPISGKVSAVNSDLDGTPQLVNSDPYGAGWL
+ LDIQVDSSDVAALESALTTLLDAEAYRGTLTE"
+ gene 2067469..2067957
+ /gene="garA"
+ /locus_tag="BQ2027_MB1858"
+ CDS 2067469..2067957
+ /gene="garA"
+ /locus_tag="BQ2027_MB1858"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1858, cfp17, len: 162 aa. Equivalent to Rv1827,
+ len: 162 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 162 aa overlap). cfp17, conserved
+ hypothetical protein (see citation below), equivalent to
+ O32919|MLCB1788.36c hypothetical protein from
+ Mycobacterium leprae (162 aa), FASTA scores: opt: 888,
+ E(): 0, (87.0% identity in 161 aa overlap). Protein
+ product from Mb1858 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1858 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Glycogen accumulation regulator GarA"
+ /protein_id="SIU00462.1"
+ /db_xref="InterPro:IPR000253"
+ /db_xref="InterPro:IPR008984"
+ /db_xref="PDB:2KKL"
+ /db_xref="UniProtKB/Swiss-Prot:P64898"
+ /translation="MTDMNPDIEKDQTSDEVTVETTSVFRADFLSELDAPAQAGTESA
+ VSGVEGLPPGSALLVVKRGPNAGSRFLLDQAITSAGRHPDSDIFLDDVTVSRRHAEFR
+ LENNEFNVVDVGSLNGTYVNREPVDSAVLANGDEVQIGKFRLVFLTGPKQGEDDGSTG
+ GP"
+ gene 2067954..2068697
+ /locus_tag="BQ2027_MB1859"
+ CDS 2067954..2068697
+ /locus_tag="BQ2027_MB1859"
+ /note="Mb1859, -, len: 247 aa. Equivalent to Rv1828, len:
+ 247 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 247 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ O32918|MLCB1788.35c|AL008609 hypothetical protein from
+ Mycobacterium leprae (251 aa), FASTA scores: opt: 1397,
+ E(): 0, (87.6% identity in 251 aa overlap). Protein
+ product from Mb1859 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1859 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, MerR family"
+ /protein_id="SIU00463.1"
+ /db_xref="GOA:P67670"
+ /db_xref="InterPro:IPR000551"
+ /db_xref="InterPro:IPR009061"
+ /db_xref="UniProtKB/Swiss-Prot:P67670"
+ /translation="MSAPDSPALAGMSIGAVLDLLRPDFPDVTISKIRFLEAEGLVTP
+ RRASSGYRRFTAYDCARLRFILTAQRDHYLPLKVIRAQLDAQPDGELPPFGSPYVLPR
+ LVPVAGDSAGGVGSDTASVSLTGIRLSREDLLERSEVADELLTALLKAGVITTGPGGF
+ FDEHAVVILQCARALAEYGVEPRHLRAFRSAADRQSDLIAQIAGPLVKAGKAGARDRA
+ DDLAREVAALAITLHTSLIKSAVRDVLHR"
+ gene 2068816..2069310
+ /locus_tag="BQ2027_MB1860"
+ CDS 2068816..2069310
+ /locus_tag="BQ2027_MB1860"
+ /note="Mb1860, -, len: 164 aa. Equivalent to Rv1829, len:
+ 164 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 164 aa overlap). Conserved hypothetical
+ protein, equivalent to O32917|MLCB1788.34|AL008609
+ Hypothetical protein from Mycobacterium leprae (164 aa),
+ FASTA scores: opt: 1011, E(): 0, (95.1% identity in 164 aa
+ overlap). Also present in Aquifex aeolicus, etc. Protein
+ product from Mb1860 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1860 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00464.1"
+ /db_xref="GOA:A0A1R3Y1L8"
+ /db_xref="InterPro:IPR003729"
+ /db_xref="InterPro:IPR036104"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1L8"
+ /translation="MGEVRVVGIRVEQPQNQPVLLLREANGDRYLPIWIGQSEAAAIA
+ LEQQGVEPPRPLTHDLIRDLIAALGHSLKEVRIVDLQEGTFYADLIFDCNIKVSARPS
+ DSVAIALRVGVPIYVEEAVLAQAGLLIPDESDEEATTAVREDEVEKFKEFLDSVSPDD
+ FKAT"
+ gene 2069602..2070279
+ /locus_tag="BQ2027_MB1861"
+ CDS 2069602..2070279
+ /locus_tag="BQ2027_MB1861"
+ /note="Mb1861, -, len: 225 aa. Equivalent to Rv1830, len:
+ 225 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 225 aa overlap). Conserved
+ hypothetical protein, equivalent to Mycobacterium leprae
+ hypothetical protein MLCB1788.33c|AL008609|O32916 (231
+ aa), FASTA scores: opt: 1307, E(): 0, (89.6% identity in
+ 231 aa overlap). Protein product from Mb1861 detected
+ using SWATH mass spectrometry. Mb1861 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted transcriptional regulators"
+ /protein_id="SIU00465.1"
+ /db_xref="GOA:P67672"
+ /db_xref="InterPro:IPR000551"
+ /db_xref="InterPro:IPR009061"
+ /db_xref="UniProtKB/Swiss-Prot:P67672"
+ /translation="MTQLVTRARSARGSTLGEQPRQDQLDFADHTGTAGDGNDGAAAA
+ SGPVQPGLFPDDSVPDELVGYRGPSACQIAGITYRQLDYWARTSLVVPSIRSAAGSGS
+ QRLYSFKDILVLKIVKRLLDTGISLHNIRVAVDHLRQRGVQDLANITLFSDGTTVYEC
+ TSAEEVVDLLQGGQGVFGIAVSGAMRELTGVIADFHGERADGGESIAAPEDELASRRK
+ HRDRKIG"
+ gene 2070332..2070589
+ /locus_tag="BQ2027_MB1862"
+ CDS 2070332..2070589
+ /locus_tag="BQ2027_MB1862"
+ /note="Mb1862, -, len: 85 aa. Equivalent to Rv1831, len:
+ 85 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 85 aa overlap). Hypothetical unknown
+ protein. Mb1862 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00466.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64900"
+ /translation="MRLCVCSAVDWTTHRSSAGEFCGCQLRTPKEQYLSVNLSGTRTA
+ RDYDASGKRWRPLAVLTRRWGKAIHLTVDRVAESLRRLACR"
+ gene 2070638..2073463
+ /gene="gcvB"
+ /locus_tag="BQ2027_MB1863"
+ CDS 2070638..2073463
+ /gene="gcvB"
+ /locus_tag="BQ2027_MB1863"
+ /note="Mb1863, gcvB, len: 941 aa. Equivalent to Rv1832,
+ len: 941 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 941 aa overlap). Probable gcvB, glycine
+ dehydrogenase [decarboxylating] (EC 1.4.4.2), highly
+ similar to GCSP_ECOLI|P33195 glycine dehydrogenase
+ (decarboxylating) from Escherichia coli (957 aa), FASTA
+ scores: opt: 2194, E(): 0, (55.4% identity in 961 aa
+ overlap). THE GLYCINE CLEAVAGE SYSTEM IS COMPOSED OF FOUR
+ PROTEINS: P, T, L, AND H. Protein product from Mb1863
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1863 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable glycine dehydrogenase gcvB (Glycine
+ decarboxylase) (Glycine cleavage system P-protein)"
+ /protein_id="SIU00467.1"
+ /db_xref="GOA:Q7VET8"
+ /db_xref="InterPro:IPR003437"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="InterPro:IPR020581"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VET8"
+ /translation="MSDHSTFADRHIGLDSQAVATMLAVIGVDSLDDLAVKAVPAGIL
+ DTLTDTGAAPGLDSLPPAASEAEALAELRALADANTVAVSMIGQGYYDTHTPPVLLRN
+ IIENPAWYTAYTPYQPEISQGRLEALLNFQTLVTDLTGLEIANASMLDEGTAAAEAMT
+ LMHRAARGPVKRVVVDADVFTQTAAVLATRAKPLGIEIVTADLRAGLPDGEFFGAIAQ
+ LPGASGRITDWSALVQQAHDRGALVAVGADLLALTLIAPPGEIGADVAFGTTQRFGVP
+ MGFGGPHAGYLAVHAKHARQLPGRLVGVSVDSDGTPAYRLALQTREQHIRRDKATSNI
+ CTAQVLLAVLAAMYASYHGAGGLTAIARRVHAHAEAIAGALGDALVHDKYFDTVLARV
+ PGRADEVLARAKANGINLWRVDADHVSVACDEATTDTHVAVVLDAFGVAAAAPAHADI
+ ATRTSEFLTHPAFTQYRTETSMMRYLRALADKDIALDRSMIPLGSCTMKLNAAAEMES
+ ITWPEFGRQHPFAPASDTAGLRQLVADLQSWLVLITGYDAVSLQPNAGSQGEYAGLLA
+ IHEYHASRGEPHRDICLIPSSAHGTNAASAALAGMRVVVVDCHDNGDVDLDDLRAKVG
+ EHAERLSALMITYPSTHGVYEHDIAEICAAVHDAGGQVYVDGANLNALVGLARPGKFG
+ GDVSHLNLHKTFCIPHGGGGPGVGPVAVRAHLAPFLPGHPFAPELPKGYPVSSAPYGS
+ ASILPITWAYIRMMGAEGLRAASLTAITSANYIARRLDEYYPVLYTGENGMVAHECIL
+ DLRGITKLTGITVDDVAKRLADYGFHAPTMSFPVAGTLMVEPTESESLAEVDAFCEAM
+ IGIRAEIDKVGAGEWPVDDNPLRGAPHTAQCLLASDWDHPYTREQAAYPLGTAFRPKV
+ WPAVRRIDGAYGDRNLVCSCPPVEAFA"
+ gene complement(2073690..2074550)
+ /locus_tag="BQ2027_MB1864C"
+ CDS complement(2073690..2074550)
+ /locus_tag="BQ2027_MB1864C"
+ /note="Mb1864c, -, len: 286 aa. Equivalent to Rv1833c,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 286 aa overlap). Possible haloalkane
+ dehalogenase (EC 3.8.1.5). Similar to several haloalkane
+ dehalogenase e.g. CAB45532.1|AJ243259 from Mycobacterium
+ bovis (300 aa); also similar to LINB_PSEPA|P51698
+ 1,3,4,6-tetrachloro-1,4-cyclohexadien from Pseudomonas
+ paucimobilis (295 aa), FASTA scores: opt: 314, E():
+ 1.5e-13, (33.1% identity in 281 aa overlap). Protein
+ product from Mb1864c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1864c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible haloalkane dehalogenase"
+ /protein_id="SIU00468.1"
+ /db_xref="GOA:P64304"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR000639"
+ /db_xref="InterPro:IPR023489"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/Swiss-Prot:P64304"
+ /translation="MSIDFTPDPQLYPFESRWFDSSRGRIHYVDEGTGPPILLCHGNP
+ TWSFLYRDIIVALRDRFRCVAPDYLGFGLSERPSGFGYQIDEHARVIGEFVDHLGLDR
+ YLSMGQDWGGPISMAVAVERADRVRGVVLGNTWFWPADTLAMKAFSRVMSSPPVQYAI
+ LRRNFFVERLIPAGTEHRPSSAVMAHYRAVQPNAAARRGVAEMPKQILAARPLLARLA
+ REVPATLGTKPTLLIWGMKDVAFRPKTIIPRLSATFPDHVLVELPNAKHFIQEDAPDR
+ IAAAIIERFG"
+ gene 2074591..2075457
+ /gene="lipz"
+ /locus_tag="BQ2027_MB1865"
+ CDS 2074591..2075457
+ /gene="lipz"
+ /locus_tag="BQ2027_MB1865"
+ /note="Mb1865, -, len: 288 aa. Equivalent to Rv1834, len:
+ 288 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 288 aa overlap). Probable hydrolase (EC
+ 3.-.-.-), some similarity to haloalkane dehalogenases and
+ D16262 hypothetical 38.9 kd protein (335 aa), FASTA
+ scores: opt: 507, E(): 7.6e-28, (33.0% identity in 300 aa
+ overlap). Mb1865 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable hydrolase"
+ /protein_id="SIU00469.1"
+ /db_xref="GOA:A0A1R3XZJ0"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR000639"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZJ0"
+ /translation="MTSPSVREWRDGGRWLPTAVGKVFVRSGPGDTPTMLLLHGYPSS
+ SFDFRAVIPHLTGQAWVTMDFLGFGLSDKPRPHRYSLLEQAHLVETVVAHTVTGAVVV
+ LAHDMGTSVTTELLARDLDGRLPFDLRRAVLSNGSVILERASLRPIQKVLRSPLGPVA
+ ARLVSRGGFTRGFGRIFSPAHPLSAQEAQAQWELLCYNDGNRIPHLLISYLDERIRHA
+ QRWHGAVRDWPKPLGFVWGLDDPVATTNVLNGLRELRPSAAVVELPGLGHYPQAEAPK
+ AYAEAALSLLVD"
+ gene complement(2075462..2077348)
+ /locus_tag="BQ2027_MB1866C"
+ CDS complement(2075462..2077348)
+ /locus_tag="BQ2027_MB1866C"
+ /note="Mb1866c, -, len: 628 aa. Equivalent to Rv1835c,
+ len: 628 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 628 aa overlap). Conserved
+ hypothetical protein, some similarity to putative acylases
+ e.g. G216374 glutaryl 7-aca acylase precursor (634 aa)
+ FASTA scores, opt: 202, E(): 3.5e-06, (25.1% identity in
+ 669 aa overlap). Also similar to Mycobacterium
+ tuberculosis hypothetical proteins Rv2800 and Rv1215c.
+ Protein product from Mb1866c detected using SWATH mass
+ spectrometry. Mb1866c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted acyl esterases"
+ /protein_id="SIU00470.1"
+ /db_xref="GOA:P0A5F6"
+ /db_xref="InterPro:IPR000383"
+ /db_xref="InterPro:IPR005674"
+ /db_xref="InterPro:IPR008979"
+ /db_xref="InterPro:IPR013736"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5F6"
+ /translation="MTRRGGSDAAWYSAPDQRSAYPRYRGMRYSSCYVTMRDGVRIAI
+ DLYLPAGLTSAARLPAILHQTRYYRSLQLRWPLRMLLGGKPLQHIAADKRRRRRFVAS
+ GYAWVDVDVRGSGASFGARVCEWSSDEIRDGAEIVDWIVRQPWCNGTVAALGNSYDGT
+ SAELLLVNQHPAVRVIAPCFSLFDVYTDIAFPGGIHAAWFTDTWGRYNEALDRNALHE
+ VVGWWAKLPVTGMQPVQEDRDRSLRDGAIAAHRGNYDVHQIAGSLTFRDDVSASDPYR
+ GQPDARLEPIGTPIESGSINLISPHNYWRDVQASGAAIYSYSGWFDGGYAHAAIKRFL
+ TVSTPGSHLILGPWNHTGGWRVDPLRGLSRPDFDHDGELLRFIDHHVKGADTGIGSEP
+ PVHYFTMVENRWKSADTWPPPATTQSYYLSADRQLRPDAPDCDSGADEYVVDQTAGTG
+ ERSRWRSQVGIGGHVCYPDRKAQDAKLLTYTSAPLDHPLEVTGHVVVTLFITSTSSDG
+ TFFVYLEDVDPRGRVAYITEGQLRAIHRRLSDGPPPYRQVVPYRTFASGDAWPLVPGE
+ IARLTFDLLPTSYLFQPGHRIRIAIAGADASHFAILPGCAPTVRVYRSRMHASRIDLP
+ VIQP"
+ gene complement(2077364..2079397)
+ /locus_tag="BQ2027_MB1867C"
+ CDS complement(2077364..2079397)
+ /locus_tag="BQ2027_MB1867C"
+ /note="Mb1867c, -, len: 677 aa. Equivalent to Rv1836c,
+ len: 677 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 677 aa overlap). Conserved hypothetical
+ protein. Equivalent to MLCB1788.28|AL008609 hypothetical
+ protein from Mycobacterium leprae (710 aa), FASTA scores:
+ opt: 2938, E(): 0, (66.0% identity in 714 aa overlap).
+ Contains PS00036 bZIP transcription factors basic domain
+ signature. Protein product from Mb1867c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1867c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Von Willebrand factor (vWF) type A
+ domain-containing protein"
+ /protein_id="SIU00471.1"
+ /db_xref="GOA:A0A1R3XZG5"
+ /db_xref="InterPro:IPR002035"
+ /db_xref="InterPro:IPR036465"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZG5"
+ /translation="MGRHSKPDPEDSVDDLSDGHAAEQQHWEDISGSYDYPGVDQPDD
+ GPLSSEGHYSAVGGYSASGSEDYPDIPPRPDWEPTGAEPIAAAPPPLFRFGHRGPGDW
+ QAGHRSADGRRGVSIGVIVALVAVVVMVAGVILWCFFGDALSNRSHTAAARCVGGKDT
+ VAVIADPSIADQVKESADSYNASAGPVGDRCVAVAVTSAGSDAVINGFIGKWPTELGG
+ QPGLWIPSSSISAARLTGAAGSQAISDSRSLVISPVLLAVRPELQQALANQNWAALPG
+ LQTNPNSLSGLDLPAWGSLRLAMPSSGNGDAAYLAGEAVAAASAPAGAPATAGIGAVR
+ TLMGARPKLADDSLTAAMDTLLKPGDVATAPVHAVVTTEQQLFQRGQSLSDAENTLGS
+ WLPPGPAAVADYPTVLLSGAWLSQEQTSAASAFARYLHKPEQLAKLARAGFRVSDVKP
+ PSSPVTSFPALPSTLSVGDDSMRATLADTMVTASAGVAATIMLDQSMPNDEGGNSRLS
+ NVVAALENRIKAMPPSSVVGLWTFDGREGRTEVPAGPLADPVNGQPRPAALTAALGKQ
+ YSSGGGAVSFTTLRLIYQEMLANYHVGQANSVLVITAGPHTDQTLDGPGLQDFIRKSA
+ DPAKPIAVNIIDFGADPDRATWEAVAQLSGGSYQNLETSASPDLATAVNIFLS"
+ gene complement(2079517..2081742)
+ /gene="glcB"
+ /locus_tag="BQ2027_MB1868C"
+ CDS complement(2079517..2081742)
+ /gene="glcB"
+ /locus_tag="BQ2027_MB1868C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1868c, glcB, len: 741 aa. Equivalent to Rv1837c,
+ len: 741 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 741 aa overlap). Probable glcB, malate
+ synthase G (EC 4.1.3.2) (see citations below), highly
+ similar to MASY_CORGL|P42450 malate synthase (738 aa),
+ FASTA score: opt: 2961, E(): 0, (61.3% identity in 724 aa
+ overlap). BELONGS TO THE MALATE SYNTHASE G FAMILY. Protein
+ product from Mb1868c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1868c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="malate synthase g glcb"
+ /protein_id="SIU00472.1"
+ /db_xref="GOA:P0A5J5"
+ /db_xref="InterPro:IPR001465"
+ /db_xref="InterPro:IPR006253"
+ /db_xref="InterPro:IPR011076"
+ /db_xref="InterPro:IPR023310"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5J5"
+ /translation="MTDRVSVGNLRIARVLYDFVNNEALPGTDIDPDSFWAGVDKVVA
+ DLTPQNQALLNARDELQAQIDKWHRRRVIEPIDMDAYRQFLTEIGYLLPEPDDFTITT
+ SGVDAEITTTAGPQLVVPVLNARFALNAANARWGSLYDALYGTDVIPETDGAEKGPTY
+ NKVRGDKVIAYARKFLDDSVPLSSGSFGDATGFTVQDGQLVVALPDKSTGLANPGQFA
+ GYTGAAESPTSVLLINHGLHIEILIDPESQVGTTDRAGVKDVILESAITTIMDFEDSV
+ AAVDAADKVLGYRNWLGLNKGDLAAAVDKDGTAFLRVLNRDRNYTAPGGGQFTLPGRS
+ LMFVRNVGHLMTNDAIVDTDGSEVFEGIMDALFTGLIAIHGLKASDVNGPLINSRTGS
+ IYIVKPKMHGPAEVAFTCELFSRVEDVLGLPQNTMKIGIMDEERRTTVNLKACIKAAA
+ DRVVFINTGFLDRTGDEIHTSMEAGPMVRKGTMKSQPWILAYEDHNVDAGLAAGFSGR
+ AQVGKGMWTMTELMADMVETKIAQPRAGASTAWVPSPTAATLHALHYHQVDVAAVQQG
+ LAGKRRATIEQLLTIPLAKELAWAPDEIREEVDNNCQSILGYVVRWVDQGVGCSKVPD
+ IHDVALMEDRATLRISSQLLANWLRHGVITSADVRASLERMAPLVDRQNAGDVAYRPM
+ APNFDDSIAFLAAQELILSGAQQPNGYTEPILHRRRREFKARAAEKPAPSDRAGDDAA
+ R"
+ gene complement(2082018..2082413)
+ /gene="vapc13"
+ /locus_tag="BQ2027_MB1869C"
+ CDS complement(2082018..2082413)
+ /gene="vapc13"
+ /locus_tag="BQ2027_MB1869C"
+ /note="Mb1869c, -, len: 131 aa. Equivalent to Rv1838c,
+ len: 131 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 131 aa overlap). Conserved
+ hypothetical protein. Part of 14-membered Mycobacterium
+ tuberculosis protein family with Rv2863|MTV003.09|AL008883
+ (126 aa), FASTA scores: opt: 293, E(): 1.5e-14, (38.2%
+ identity in 123 aa overlap); Rv0749, Rv0277c, Rv2530c,
+ etc. Also similar to AJ248288|CNSPAX06_181 Pyrococcus
+ abyssi complete genome (136 aa), FASTA scores: opt: 197,
+ E(): 2.2e-07, (33. 1% identity in 133 aa overlap). Protein
+ product from Mb1869c detected using SWATH mass
+ spectrometry. Mb1869c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc13"
+ /protein_id="SIU00473.1"
+ /db_xref="GOA:P64902"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/Swiss-Prot:P64902"
+ /translation="MILVDSNIPMYLVGASHPHKLDAQRLLESALSGGERLVTDAEVL
+ QEICHRYVAIKRREAIQPAFDAIIGVVDEVLPIERTDVEHARDALLRYQTLSARDALH
+ IAVMAHHDITRLMSFDRGFDSYPGIKRLA"
+ gene complement(2082410..2082673)
+ /gene="vapb13"
+ /locus_tag="BQ2027_MB1870C"
+ CDS complement(2082410..2082673)
+ /gene="vapb13"
+ /locus_tag="BQ2027_MB1870C"
+ /note="Mb1870c, -, len: 87 aa. Equivalent to Rv1839c, len:
+ 87 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 87 aa overlap). Conserved hypothetical
+ protein. Some similarity to G217008 CHO-ORF1 (279 aa),
+ FASTA scores: opt: 86, E(): 13, (38.7% identity in 62 aa
+ overlap). Mb1870c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb13"
+ /protein_id="SIU00474.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1M5"
+ /translation="MSKRLQVLLDPDEWEELREIARRHRTTVSEWVRRTLREAREREP
+ RGDLDMKLRSVRAAARHEFPTADVEQMLEEIERGRGAEREGSR"
+ gene complement(2082732..2084132)
+ /gene="PE_PGRS34"
+ /locus_tag="BQ2027_MB1871C"
+ CDS complement(2082732..2084132)
+ /gene="PE_PGRS34"
+ /locus_tag="BQ2027_MB1871C"
+ /note="Mb1871c, PE_PGRS34, len: 466 aa. Similar to
+ Rv1840c, len: 515 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (90.485% identity in 515 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins. Similar to many e.g.
+ Y03A_MYCTU|Q10637 hypothetical glycine-rich 49.6 kd
+ protein (603 aa), FASTA scores: opt: 1693, E(): 0, (53.1%
+ identity in 612 aa overlap); etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, an
+ in-frame deletion of 147 bp leads to a longer protein
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv (466 aa versus 518 aa). Mb1871c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs34"
+ /protein_id="SIU00475.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0B4"
+ /translation="MSFVVAAPEVVVAAASDLAGIGSAIGAANAAAAVPTMGVLAAGA
+ DEVSAAVADLFGAHAQAYQALSAQAALFHEQFVHAMTAGAGAYAGAEAADAAALDVLN
+ GPFQALFGRPLIGDGANGAPGQPGGPGGLLYGNGGNGGNGGIGQPGGAGGDAGLIGNG
+ GNGGIGGPGATGLAGGAGGLGKAGFAGGAGGTGGTGGLLYGNGGNGGNVPSGAADGGA
+ GGDARLIGNGGDGGSVGAAPTGIGNGGNGGNGGWLYGDGGSGGSTLQGFSDGGTGGNA
+ GMFGDGGNGGFSFFDGNGGDGGTGGTLIGNGGDGGNSVQTDGFLRGHGGDGGNAVGLI
+ GNGGAGGAGSAGTGVFAPGGGSGGNGGNGALLVGNGGAGGSGGPTQIPSVAVPVTGAG
+ GTGGNGGTAGLIGNGGNGGAAGVSGDGTPGTGGNGGYAQLIGDGGDGGPGDSGGPGGS
+ GGTGGTLAGQNGSPGG"
+ gene complement(2084295..2085344)
+ /locus_tag="BQ2027_MB1872C"
+ CDS complement(2084295..2085344)
+ /locus_tag="BQ2027_MB1872C"
+ /note="Mb1872c, -, len: 349 aa. Equivalent to Rv1841c,
+ len: 345 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.9% identity in 349 aa overlap). Conserved hypothetical
+ membrane protein. Some similarity to O07585|YHDP_BACSU
+ HYPOTHETICAL 49.9 KD PROTEIN from Bacillus subtilis (444
+ aa), FASTA scores: opt: 620, E(): 0, (31.1% identity in
+ 350 aa overlap). Also similar to other Mycobacterium
+ tuberculosis proteins e.g. Rv1842c, Rv2366c.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 12 bp in-frame insertion leads to a longer product
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv (349 aa versus 345 aa). Protein product from
+ Mb1872c detected using SWATH mass spectrometry. Mb1872c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Magnesium and cobalt efflux protein CorC"
+ /protein_id="SIU00476.1"
+ /db_xref="GOA:A0A1R3XZI0"
+ /db_xref="InterPro:IPR000644"
+ /db_xref="InterPro:IPR002550"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZI0"
+ /translation="MDVLSAVLLALLLIGANAFFVGAEFALISARRDRLEALAEQGKA
+ TAVTVIRAGEQLPAMLTGAQLGVTVSSILLGRVGEPAVVKLLQLSFGLSGVPPALLHT
+ LSLAVALAIVVALHVLLGEMVPKNIALAGPERTAMLLVPPYLVYVRLARPFIAFYNNC
+ ANAILRLVGVQPKDELDIAVSTAELSEMIAESLSEGLLDHEEHTRLTRALRIRTRLVA
+ DVAVPLVNIRAVQVSAVGSGPTIGGVEQALAQTGYSRFPVVDRGGRFIGYLHIKDVLT
+ LGDNPQTVIDLAVVRPLPRVPQSLPLADALSRMRRINSHLALVTADNGSVVGMVALED
+ VVEDLVGTMRDGTHR"
+ gene complement(2085344..2086711)
+ /locus_tag="BQ2027_MB1873C"
+ CDS complement(2085344..2086711)
+ /locus_tag="BQ2027_MB1873C"
+ /note="Mb1873c, -, len: 455 aa. Equivalent to Rv1842c,
+ len: 455 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 455 aa overlap). Conserved hypothetical
+ membrane protein. Similar to Z99109|0O7589 Potential
+ integral membrane protein from Bacillus subtilis (461 aa),
+ FASTA scores: opt: 723, E(): 0, (31.2% identity in 449 aa
+ overlap). Similar to other Mycobacterium tuberculosis
+ putative integral membrane proteins e.g. Rv2366c, Rv1841c.
+ Protein product from Mb1873c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1873c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="UPF0053 protein Rv1842c/MT1890"
+ /protein_id="SIU00477.1"
+ /db_xref="GOA:A0A1R3XZW2"
+ /db_xref="InterPro:IPR000644"
+ /db_xref="InterPro:IPR002550"
+ /db_xref="InterPro:IPR005170"
+ /db_xref="InterPro:IPR016169"
+ /db_xref="InterPro:IPR036318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZW2"
+ /translation="MNLTDTVATILAILALTAGTGVFVAAEFSLTALDRSTVEANARG
+ GTSRDRFIQRAHHRLSFQLSGAQLGISITTLATGYLTEPLVAELPHPGLVAVGMSDRV
+ ADGLITFFALVIVTSLSMVFGELVPKYLAVARPLRTARSVVAGQVLFSLLLTPAIRLT
+ NGAANWIVRRLGIEPAEELRSARTPQELVSLVRSSARSGALDDATAWLMRRSLQFGAL
+ TAEELMTPRSKIVALQTDDTIADLVAAAAASGFSRFPVVEGDLDATVGIVHVKQVFEV
+ PPGDRAHTLLTTVAEPVAVVPSTLDGDAVMAQVRASALQTAMVVDEYGGTAGMVTLED
+ LIEEIVGDVRDEHDDATPDVVAAGNGWRVSGLLRIDEVASATGYRAPDGPYETIGGLV
+ LRELGHIPVAGETVELTALDQDGLPDDSMRWLATVIQMDGRRIDSLELIKMGGHADPG
+ SGRGR"
+ gene complement(2086885..2087679)
+ /gene="guaB1"
+ /locus_tag="BQ2027_MB1874C"
+ CDS complement(2086885..2087679)
+ /gene="guaB1"
+ /locus_tag="BQ2027_MB1874C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1874c, guaB1, len: 479 aa. Equivalent to Rv1843c,
+ len: 479 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 479 aa overlap). Probable guaB1,
+ inosine-5'-monophosphate dehydrogenase (EC 1.1.1.205).
+ Similar to others e.g. IMDH_BACSU|P21879 from Bacillus
+ subtilis (513 aa), FASTA score: opt: 904, E(): 0, (37.8%
+ identity in 471 aa overlap). Similar to other
+ Mycobacterium tuberculosis proteins e.g. guaB2, Rv3411c.
+ Protein product from Mb1874c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1874c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE INOSINE-5'-MONOPHOSPHATE DEHYDROGENASE
+ GUAB1(IMP DEHYDROGENASE) (IMPDH) (IMPD)"
+ /protein_id="SIU00478.1"
+ /db_xref="GOA:P65173"
+ /db_xref="InterPro:IPR000644"
+ /db_xref="InterPro:IPR001093"
+ /db_xref="InterPro:IPR005990"
+ /db_xref="InterPro:IPR005991"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/Swiss-Prot:P65173"
+ /translation="MRIGAAVGINGDVGAKARALAEAGVDVLVIDTAHGHQVKTLDAI
+ KAVSALDLGLPLAAGNVVSAEGTRDLLKAGANVVKVGVGPGAMCTTRMMTGVGRPQFS
+ AVLECASAARQLGGHIWADGGIRHPRDVALALAAGASNVMIGSWFAGTYESPGDLMRD
+ RDDQPYKESYGMASKRAVVARTGADNPFDRARKALFEEGISTSRMGLDPDRGGVEDLI
+ DHITSGVRSTCTYVGASNLAELHERAVVGVQSGAGFAEGHPLPAGW"
+ gene complement(2087690..2089747)
+ /gene="gnd1"
+ /locus_tag="BQ2027_MB1875C"
+ CDS complement(2087690..2089747)
+ /gene="gnd1"
+ /locus_tag="BQ2027_MB1875C"
+ /note="Mb1875c, gnd1, len: 705 aa. Similar to 5' end of
+ Rv1844c, len: 485 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.5% identity in 404 aa overlap). Probable
+ gnd1, 6-phosphogluconate dehydrogenase (EC 1.1.1.44).
+ Similar to others e.g. 6PGD_ECOLI|P00350 from Escherichia
+ coli (468 aa), FASTA scores: opt: 1661, E(): 0, (53.6%
+ identity in 466 aa overlap); etc. Also similar to
+ Rv1122|MTCY22G8.11|gnd2 PROBABLE 6-PHOSPHOGLUCONATE
+ DEHYDROGENASE, DECARBOXYLATING from Mycobacterium
+ tuberculosis (340 aa), FASTA score: (33.0% identity in 351
+ aa overlap). Note that Rv1844c is most similar to gnd's
+ from Gram negative organisms, while
+ Rv1122|MTCY22G8.11|gnd2 is most similar to gnd's from Gram
+ positive organisms. BELONGS TO THE 6-PHOSPHOGLUCONATE
+ DEHYDROGENASE FAMILY. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a single base insertion (c-*) leads
+ to a longer product with a different COOH part compared to
+ its homolog in Mycobacterium tuberculosis strain H37Rv
+ (705 aa versus 485 aa). Mb1875c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE 6-PHOSPHOGLUCONATE DEHYDROGENASE GND1"
+ /protein_id="SIU00479.1"
+ /db_xref="GOA:A0A1R3XZK7"
+ /db_xref="InterPro:IPR006113"
+ /db_xref="InterPro:IPR006114"
+ /db_xref="InterPro:IPR006115"
+ /db_xref="InterPro:IPR006183"
+ /db_xref="InterPro:IPR006184"
+ /db_xref="InterPro:IPR008927"
+ /db_xref="InterPro:IPR013328"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZK7"
+ /translation="MGSNIARNFARHGYTVAVHNRSVAKTDALLKEHSSDGKFVRSET
+ IPEFLAALEKPRRVLIMVKAGEATDAVINELADAMEPGDIIIDGGNALYTDTMRREKA
+ MRERGLHFVGAGISGGEEGALNGPSIMPGGPAESYQSLGPLLEEISAHVDGVPCCTHI
+ GPDGSGHFVKMVHNGIEYSDMQLIGEAYQLMRDGLGLTAPAIADVFTEWNNGDLDSYL
+ VEITAEVLRQTDAKTGKPLVDVIVDRAEQKGTGRWTVKSALDLGVPVTGIAEAVFARA
+ LSGSVGQRSAASGLASGKLGEQPADPATFTEDVRQALYASKIVAYAQGFNQIQAGSAE
+ FGWDITPGDLATIWRGGCIIRAKFLNHIKEAFDASPNLASLIVAPYFRAPSNRRSTVG
+ GVWCRRRPNWVSRPRDSRRPCRITTRCAPRGCPLHSPRPSATSSAHTPTAGSTNQASS
+ THYGVQTAPKYRCSGLELKGGKGVSDEISRRAPTRVRPDIQRRVHRSEPIRGRVALRR
+ RFVHRRRLGHHHSGSGRQYDRGSRAADGRDGRPPRWHRNPAAGSADPGGKADGGVRQK
+ PGPGARHPSDAGTRRFGVRRHGAHPQARTWRRGGHPRGSPDRIGARIVLPGRGSLHPG
+ ARYRRDGLCDRSSGNRATQDLRPAGARPGRRCGADRRRRHVGGSAKPHRGYPRRYLHP
+ GHR"
+ gene complement(2089837..2090787)
+ /gene="blar"
+ /locus_tag="BQ2027_MB1876C"
+ CDS complement(2089837..2090787)
+ /gene="blar"
+ /locus_tag="BQ2027_MB1876C"
+ /note="Mb1876c, -, len: 316 aa. Equivalent to Rv1845c,
+ len: 316 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 316 aa overlap). Conserved
+ hypothetical transmembrane protein. Equivalent to
+ MLCB1788.18|AL008609 Hypothetical protein from
+ Mycobacterium leprae (316 aa), FASTA scores: opt: 1762,
+ E(): 0, (87.6% identity in 314 aa overlap). Similar to
+ proteins in Streptomyces coelicolor e.g.
+ SC10A7.04|AL078618.1. Mb1876c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible sensor-transducer protein blar"
+ /protein_id="SIU00480.1"
+ /db_xref="GOA:A0A1R3XZH7"
+ /db_xref="InterPro:IPR001915"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZH7"
+ /translation="MSALAFTILAVLLAGPTPALLARATWPLRAPRAAMVLWQAIALA
+ AVLSSFSAGIAIASRLLMPGPDGRPTTSFVGAAGRLGWPLWAAYITVFALTVLVGARL
+ AVAVVRVATATRRRRAHHRMVVDLVGVGHNGALAQPCARARDLRVLDVAQPLAYCLPG
+ VRSRVVVSEGTLTALADAEVAAILTHERAHLRARHDLVLEAFTAVHAAFPRLVRSANA
+ LGAVQLLVELLADDAAVRAAGRTPLARALVACASGRAPSGALAVGGPSTVLRVRRLSG
+ RGNSAVLSAAAYLAAAAVLVVPTVALAVPWLTQLQRLFIA"
+ gene complement(2090802..2091218)
+ /gene="blai"
+ /locus_tag="BQ2027_MB1877C"
+ CDS complement(2090802..2091218)
+ /gene="blai"
+ /locus_tag="BQ2027_MB1877C"
+ /note="Mb1877c, -, len: 138 aa. Equivalent to Rv1846c,
+ len: 138 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 138 aa overlap). Possible
+ transcriptional regulatory protein. Equivalent to
+ MLCB1788.17|AL008609 hypothetical protein from
+ Mycobacterium leprae (142 aa), FASTA scores: opt: 736 E():
+ 0, (95.1% identity in 123 aa overlap). Also similar to
+ BLAI_BACLI|P06555 penicillinase repressor (128 aa), fasta
+ scores: opt: 114, E(): 0.12, (23.7% identity in 131 aa
+ overlap). Protein product from Mb1877c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1877c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="transcriptional repressor blai"
+ /protein_id="SIU00481.1"
+ /db_xref="GOA:A0A1R3XZH1"
+ /db_xref="InterPro:IPR005650"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZH1"
+ /translation="MAKLTRLGDLERAVMDHLWSRTEPQTVRQVHEALSARRDLAYTT
+ VMTVLQRLAKKNLVLQIRDDRAHRYAPVHGRDELVAGLMVDALAQAEYSGSRQAALVH
+ FVERVGADEADALRRALAELEAGHGNRPPAGAATET"
+ gene 2091496..2091918
+ /locus_tag="BQ2027_MB1878"
+ CDS 2091496..2091918
+ /locus_tag="BQ2027_MB1878"
+ /note="Mb1878, -, len: 140 aa. Equivalent to Rv1847, len:
+ 140 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 140 aa overlap=. Conserved hypothetical
+ protein, possible thioesterase, some similarity to YBDB
+ proteins of Escherichia coli and H. influenzae e.g.
+ P15050|YBDB_ECOLI HYPOTHETICAL 15.0 KD PROTEIN IN
+ ENTA-CSTA INTERGENIC REGION (137 aa), FASTA scores: opt:
+ 232, E(): 6.6e-10, (35.8% identity in 106 aa overlap);
+ C48956|G142208 thioesterase from Arthrobacter sp (151 aa),
+ FASTA score: opt: 254, E(): 1.7e-11, (33.3% identity in
+ 138 aa overlap). Also similar to AF064959|AF064959_1
+ hypothetical protein from Coxiella burnetii (148 aa),
+ FASTA score: opt: 264, E(): 9.3e- 12, (36.8% identity in
+ 117 aa overlap). Protein product from Mb1878 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1878 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative esterase"
+ /protein_id="SIU00482.1"
+ /db_xref="InterPro:IPR003736"
+ /db_xref="InterPro:IPR006683"
+ /db_xref="InterPro:IPR029069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZH4"
+ /translation="MQPSPDSPAPLNVTVPFDSELGLQFTELGPDGARAQLDVRPKLL
+ QLTGVVHGGVYCAMIESIASMAAFAWLNSHGEGGSVVGVNNNTDFLRSISSGMVYGTA
+ EPLHRGRRQQLWLVTITDDTDRVVARGQVRLQNLEARP"
+ gene 2091967..2092269
+ /gene="ureA"
+ /locus_tag="BQ2027_MB1879"
+ CDS 2091967..2092269
+ /gene="ureA"
+ /locus_tag="BQ2027_MB1879"
+ /note="Mb1879, ureA, len: 100 aa. Equivalent to Rv1848,
+ len: 100 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 100 aa overlap). ureA, urease gamma
+ subunit (EC 3.5.1.5). Similar to URE3_MYCTU|P50043 from
+ Mycobacterium tuberculosis (100 aa), FASTA scores: opt:
+ 630, E(): 1.3e-36, (99.0% identity in 100 aa overlap).
+ BELONGS TO THE UREASE GAMMA SUBUNIT FAMILY. Protein
+ product from Mb1879 detected using SWATH mass
+ spectrometry. Mb1879 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Urease gamma subunit ureA (Urea amidohydrolase)"
+ /protein_id="SIU00483.1"
+ /db_xref="GOA:P0A677"
+ /db_xref="InterPro:IPR002026"
+ /db_xref="InterPro:IPR012010"
+ /db_xref="InterPro:IPR036463"
+ /db_xref="UniProtKB/Swiss-Prot:P0A677"
+ /translation="MRLTPHEQERLLLSYAAELARRRRARGLRLNHPEAIAVIADHIL
+ EGARDGRTVAELMASGREVLGRDDVMEGVPEMLAEVQVEATFPDGTKLVTVHQPIA"
+ gene 2092266..2092580
+ /gene="ureB"
+ /locus_tag="BQ2027_MB1880"
+ CDS 2092266..2092580
+ /gene="ureB"
+ /locus_tag="BQ2027_MB1880"
+ /note="Mb1880, ureB, len: 104 aa. Equivalent to Rv1849,
+ len: 104 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 104 aa overlap). ureB, urease beta
+ subunit (EC 3.5.1.5). Identical to URE2_MYCTU|P50048
+ urease beta subunit from Mycobacterium tuberculosis (100
+ aa). BELONGS TO THE UREASE GAMMA SUBUNIT FAMILY. Mb1880
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="urease beta subunit ureb (urea amidohydrolase)"
+ /protein_id="SIU00484.1"
+ /db_xref="GOA:P0A663"
+ /db_xref="InterPro:IPR002019"
+ /db_xref="InterPro:IPR036461"
+ /db_xref="UniProtKB/Swiss-Prot:P0A663"
+ /translation="MIPGEIFYGSGDIEMNAAALSRLQMRIINAGDRPVQVGSHVHLP
+ QANRALSFDRATAHGYRLDIPAATAVRFEPGIPQIVGLVPLGGRREVPGLTLNPPGRL
+ DR"
+ gene 2092580..2094313
+ /gene="ureC"
+ /locus_tag="BQ2027_MB1881"
+ CDS 2092580..2094313
+ /gene="ureC"
+ /locus_tag="BQ2027_MB1881"
+ /note="Mb1881, ureC, len: 577 aa. Equivalent to Rv1850,
+ len: 577 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 577 aa overlap). ureC, urease alpha
+ subunit (EC 3.5.1.5). Similar to URE1_MYCTU|P50042 from M.
+ tuberculosis (577 aa), FASTA scores: opt: 3794, E(): 0,
+ (98.3% identity in 577 aa overlap). Contains PS00145
+ Urease active site motif. BELONGS TO THE UREASE FAMILY.
+ Protein product from Mb1881 detected using SWATH mass
+ spectrometry. Mb1881 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Urease alpha subunit ureC (Urea amidohydrolase)"
+ /protein_id="SIU00485.1"
+ /db_xref="GOA:P0A661"
+ /db_xref="InterPro:IPR005848"
+ /db_xref="InterPro:IPR006680"
+ /db_xref="InterPro:IPR011059"
+ /db_xref="InterPro:IPR011612"
+ /db_xref="InterPro:IPR017950"
+ /db_xref="InterPro:IPR017951"
+ /db_xref="InterPro:IPR029754"
+ /db_xref="InterPro:IPR032466"
+ /db_xref="UniProtKB/Swiss-Prot:P0A661"
+ /translation="MARLSRERYAQLYGPTTGDRIRLADTNLLVEVTEDRCGGPGLAG
+ DEAVFGGGKVLRESMGQGRASRADGAPDTVITGAVIIDYWGIIKADIGIRDGRIVGIG
+ KAGNPDIMTGVHRDLVVGPSTEIISGNRRIVTAGTVDCHVHLICPQIIVEALAAGTTT
+ IIGGGTGPAEGTKATTVTPGEWHLARMLESLDGWPVNFALLGKGNTVNPDALWEQLRG
+ GASGFKLHEDWGSTPAAIDTCLAVADVAGVQVALHSDTLNETGFVEDTIGAIAGRSIH
+ AYHTEGAGGGHAPDIITVAAQPNVLPSSTNPTRPHTVNTLDEHLDMLMVCHHLNPRIP
+ EDLAFAESRIRPSTIAAEDVLHDMGAISMIGSDSQAMGRVGEVVLRTWQTAHVMKARR
+ GALEGDPSGSQAADNNRVRRYIAKYTICPAIAHGMDHLIGSVEVGKLADLVLWEPAFF
+ GVRPHVVLKGGAIAWAAMGDANASIPTPQPVLPRPMFGAAAATAAATSVHFVAPQSID
+ ARLADRLAVNRGLAPVADVRAVGKTDLPLNDALPSIEVDPDTFTVRIDGQVWQPQPAA
+ ELPMTQRYFLF"
+ gene 2094313..2094948
+ /gene="ureF"
+ /locus_tag="BQ2027_MB1882"
+ CDS 2094313..2094948
+ /gene="ureF"
+ /locus_tag="BQ2027_MB1882"
+ /note="Mb1882, ureF, len: 211 aa. Equivalent to Rv1851,
+ len: 211 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 211 aa overlap). ureF, urease accessory
+ protein. Identical to UREF_MYCTU|P50050 from M.
+ tuberculosis. Mb1882 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Urease accessory protein uref"
+ /protein_id="SIU00486.1"
+ /db_xref="GOA:Q7VET6"
+ /db_xref="InterPro:IPR002639"
+ /db_xref="InterPro:IPR038277"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VET6"
+ /translation="MTSLAVLLTLADSRLPTGAHVHSGGIEEAIAAGLVTGLATLEAF
+ LKRRVRTHGLLTASIAAAVHRGELAVDDADRETDARTPAPAARHASRSQGRGLIRLAR
+ RVWPDSGWEELGPRPHLAVVAGRVGALSGLAPEHNALHLVYITMTGSAIAAQRLLALD
+ PAEVTVVTFQLSELCEQIAQEATAGLADLSDPLLDTLAQRHDERVRPLFVS"
+ gene 2094959..2095633
+ /gene="ureG"
+ /locus_tag="BQ2027_MB1883"
+ CDS 2094959..2095633
+ /gene="ureG"
+ /locus_tag="BQ2027_MB1883"
+ /note="Mb1883, ureG, len: 224 aa. Equivalent to Rv1852,
+ len: 224 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 224 aa overlap). ureG, urease
+ accessory protein. Identical to UREG_MYCTU|P50051 from M.
+ tuberculosis. Contains PS00017 ATP/GTP-binding site motif
+ A (P-loop). BELONGS TO THE UREG FAMILY. Protein product
+ from Mb1883 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1883 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Urease accessory protein ureG"
+ /protein_id="SIU00487.1"
+ /db_xref="GOA:P0A665"
+ /db_xref="InterPro:IPR003495"
+ /db_xref="InterPro:IPR004400"
+ /db_xref="InterPro:IPR012202"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P0A665"
+ /translation="MATHSHPHSHTVPARPRRVRKPGEPLRIGVGGPVGSGKTALVAA
+ LCRQLRGELSLAVLTNDIYTTEDADFLRTHAVLPDDRIAAVQTGGCPHTAIRDDITAN
+ LDAIDELMAAHDALDLILVESGGDNLTATFSSGLVDAQIFVIDVAGGDKVPRKGGPGV
+ TYSDLLVVNKTDLAALVGADLAVMARDADAVRDGRPTVLQSLTEDPAASDVVAWVRSQ
+ LAADGV"
+ gene 2095641..2096267
+ /gene="ureD"
+ /locus_tag="BQ2027_MB1884"
+ CDS 2095641..2096267
+ /gene="ureD"
+ /locus_tag="BQ2027_MB1884"
+ /note="Mb1884, ureD, len: 208 aa. Equivalent to Rv1853,
+ len: 208 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 208 aa overlap). ureD, probable urease
+ accessory protein. Similar to URED_YEREN|P42868 Urease
+ operon ureD protein from Yersinia enterocolitica (325 aa),
+ Fasta scores: opt: 114, E(): 0.37, (25.2% identity in 119
+ aa overlap). Mb1884 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable urease accessory protein ureD"
+ /protein_id="SIU00488.1"
+ /db_xref="GOA:A0A1R3XZI1"
+ /db_xref="InterPro:IPR002669"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZI1"
+ /translation="MVASPNRLPRIDCRGGVQARRTAPDTVHLVSAAATPLGGDTMRI
+ RVIVERGAQLRLRSAAATVALPGVDTLTSHAHWEIDVTGTLDVDLEPTVVAASARHLS
+ HATLRLHDDGRVRLRERVQIGRCNEREGFWSSSLQADRHGRPLLRHRVELGAGSLADD
+ VIAAPRATISELRYPATAFTDAIDARSTVLALAGGGTLSTWQADRLPG"
+ gene complement(2096270..2097661)
+ /gene="ndh"
+ /locus_tag="BQ2027_MB1885C"
+ CDS complement(2096270..2097661)
+ /gene="ndh"
+ /locus_tag="BQ2027_MB1885C"
+ /note="Mb1885c, ndh, len: 463 aa. Equivalent to Rv1854c,
+ len: 463 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 463 aa overlap). Probable ndh, NADH
+ dehydrogenase (EC 1.6.99.3) (see citations below), similar
+ to several e.g. S74826 NADH dehydrogenase from
+ Synechocystis sp. (445 aa), FASTA score: opt: 1228, E():
+ 0, (46.3% identity in 432 aa overlap). Highly similar to
+ Rv0392c|Z84725|g1817703 from Mycobacterium tuberculosis
+ (470 aa), FASTA scores: opt: 1911, E(): 0, (64.7% identity
+ in 459 aa overlap); and Rv1812c. Protein product from
+ Mb1885c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1885c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NADH DEHYDROGENASE NDH"
+ /protein_id="SIU00489.1"
+ /db_xref="GOA:A0A1R3XZL7"
+ /db_xref="InterPro:IPR023753"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZL7"
+ /translation="MSPQQEPTAQPPRRHRVVIIGSGFGGLNAAKKLKRADVDIKLIA
+ RTTHHLFQPLLYQVATGIISEGEIAPPTRVVLRKQRNVQVLLGNVTHIDLAGQCVVSE
+ LLGHTYQTPYDSLIVAAGAGQSYFGNDHFAEFAPGMKSIDDALELRGRILSAFEQAER
+ SSDPERRAKLLTFTVVGAGPTGVEMAGQIAELAEHTLKGAFRHIDSTKARVILLDAAP
+ AVLPPMGAKLGQRAAARLQKLGVEIQLGAMVTDVDRNGITVKDSDGTVRRIESACKVW
+ SAGVSASWLGRDLAEQSRVELDRAGRVQVLPDLSIPGYPNVFVVGDMAAVEGVPGVAQ
+ GAIQGAKYVASTIKAELAGANPAEREPFQYFDKGSMATVSRFSAVAKIGPVEFSGFIA
+ WLIWLVLHLAYLIGFKTKITTLLSWTVTFLSTRRGQLTITDQQAFARTRLEQLAELAA
+ EAQGSAASAKVAS"
+ gene complement(2097802..2098725)
+ /locus_tag="BQ2027_MB1886C"
+ CDS complement(2097802..2098725)
+ /locus_tag="BQ2027_MB1886C"
+ /note="Mb1886c, -, len: 307 aa. Equivalent to Rv1855c,
+ len: 307 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 307 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), possibly a monooxygenase.
+ Contains PS00217 Sugar transport proteins signature 2,
+ probably fortuitously. Similar to G487716 (78-11)
+ LINCOMYCIN PRODUCTION GENES (29.2% identity in 154 aa
+ overlap). Also similar to other Mycobacterium tuberculosis
+ proteins e.g. Rv0953c, Rv0791c, Rv0132c, Rv2951c, etc.
+ Protein product from Mb1886c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1886c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="SIU00490.1"
+ /db_xref="GOA:A0A1R3XZJ1"
+ /db_xref="InterPro:IPR011251"
+ /db_xref="InterPro:IPR019952"
+ /db_xref="InterPro:IPR036661"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZJ1"
+ /translation="MTIRLGLQIPNFSYGTGVEKLFPSVIAQAREAEAAGYDSLFVMD
+ HFYQLPMLGTPDQPMLEAYTALGALATATERLQLGALVTGNTYRSPTLLAKIITTLDV
+ VSAGRAILGIGAGWFELEHRQLGFEFGTFSDRFNRLEEALQILEPMVKGERPTFFGDW
+ YTTESAMAEPRYRDRIPILIGGGGEKKTFAIAARFADHLNIVAAVDELPRKMRALAAR
+ CDEAGRDRSTLQTSLLLTVMIDETLSPDAIPAEMSGRVVVGSPAQIADQIQAKVLDAG
+ VDGLIINLAPHGYLPGVITTAAEALRPLLGV"
+ gene complement(2098764..2099441)
+ /locus_tag="BQ2027_MB1887C"
+ CDS complement(2098764..2099441)
+ /locus_tag="BQ2027_MB1887C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1887c, -, len: 225 aa. Equivalent to Rv1856c,
+ len: 225 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 225 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-). Equivalent to
+ MLCB1788.11c|AL008609 OXIDOREDUCTASE from Mycobacterium
+ leprae (224 aa), FASTA scores: opt: 1211, E(): 0; (80.4%
+ identity in 224 aa overlap). Some similarity to
+ dehydrogenases of short-chain dehydrogenase/reductase
+ family and fatty-acyl CoA reductases e.g.
+ P16543|DHK2_STRVN GRANATICIN POLYKETIDE SYNTHASE P (249
+ aa), FASTA score: opt: 194, E(): 1.1e-05, (32.5% identity
+ in 237 aa overlap). Protein product from Mb1887c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1887c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE"
+ /protein_id="SIU00491.1"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZI6"
+ /translation="MAVEVLVTGGDTDLGRTMAEGFRNDGHKVTLVGARRGDLEVAAK
+ ELDVDAVVCDTTDPTSLTEARGLFPRHLDTIVNVPAPSWDAGDPRAYSVSDTANAWRN
+ ALDATVLSVVLTVQSVGDHLRSGGSIVSVVAENPPAGGAESAIKAALSNWIAGQAAVF
+ GTRGITINTVACGRSVQTGYEGLSHTPAPVAAEIARLALFLTTPAARHITGQTLHVSH
+ GALAHFG"
+ gene 2099603..2100388
+ /gene="modA"
+ /locus_tag="BQ2027_MB1888"
+ CDS 2099603..2100388
+ /gene="modA"
+ /locus_tag="BQ2027_MB1888"
+ /note="Mb1888, modA, len: 261 aa. Equivalent to Rv1857,
+ len: 261 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 261 aa overlap). Probable modA,
+ molybdate-binding protein attached to membrane by
+ lipid-modified N-terminal cysteine (contains PS00013
+ Prokaryotic membrane lipoprotein lipid attachment site),
+ component of molybdate transport system (see citation
+ below). Shows strong similarity to precursors of
+ periplasmic molybdate/sulphate binding proteins e.g.
+ O31229|Y10817|ANY108174 ModA from Arthrobacter
+ nicotinovorans (260 aa), FASTA score: opt: 725, E(): 0,
+ (47.8% identity in 249 aa overlap). Mb1888 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MOLYBDATE-BINDING LIPOPROTEIN MODA"
+ /protein_id="SIU00492.1"
+ /db_xref="GOA:P0A5Y1"
+ /db_xref="InterPro:IPR005950"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Y1"
+ /translation="MRWIGLSTGLVSAMLVAGLVACGSNSPASSPAGPTQGARSIVVF
+ AAASLQSAFTQIGEQFKAGNPGVNVNFAFAGSSELATQLTQGATADVFASADTAQMDS
+ VAKAGLLAGHPTNFATNTMVIVAAAGNPKKIRSFADLTRPGLNVVVCQPSVPCGSATR
+ RIEDATGIHLNPVSEELSVTDVLNKVITGQADAGLVYVSDALSVATKVTCVRFPEAAG
+ VVNVYAIAVLKRTSQPALARQFVAMVTAAAGRRILDQSGFAKP"
+ gene 2100391..2101185
+ /gene="modB"
+ /locus_tag="BQ2027_MB1889"
+ CDS 2100391..2101185
+ /gene="modB"
+ /locus_tag="BQ2027_MB1889"
+ /note="Mb1889, modB, len: 264 aa. Equivalent to Rv1858,
+ len: 264 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 264 aa overlap). Probable modB,
+ molybdenum-transport integral membrane protein ABC
+ transporter (see citation below), similar to others e.g.
+ Y10817|ANY108175 ModB from Arthrobacter (239 aa), FASTA
+ scores: opt: 937, E(): 0, (67.8% identity in 230 aa
+ overlap); etc. Similar to other Mycobacterium tuberculosis
+ transport proteins e.g. Rv2039c, Rv2316, etc. Mb1889 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable molybdenum-transport integral membrane
+ protein abc transporter modb"
+ /protein_id="SIU00493.1"
+ /db_xref="GOA:P0A625"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR006469"
+ /db_xref="InterPro:IPR011867"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/Swiss-Prot:P0A625"
+ /translation="MHPPTDLPRWVYLPAIAGIVFVAMPLVAIAIRVDWPRFWALITT
+ PSSQTALLLSVKTAAASTVLCVLLGVPMALVLARSRGRLVRSLRPLILLPLVLPPVVG
+ GIALLYAFGRLGLIGRYLEAAGISIAFSTAAVVLAQTFVSLPYLVISLEGAARTAGAD
+ YEVVAATLGARPGTVWWRVTLPLLLPGVVSGSVLAFARSLGEFGATLTFAGSRQGVTR
+ TLPLEIYLQRVTDPDAAVALSLLLVVVAALVVLGVGARTPIGTDTR"
+ gene 2101192..2102301
+ /gene="modC"
+ /locus_tag="BQ2027_MB1890"
+ CDS 2101192..2102301
+ /gene="modC"
+ /locus_tag="BQ2027_MB1890"
+ /note="Mb1890, modC, len: 369 aa. Equivalent to Rv1859,
+ len: 369 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 369 aa overlap). Probable modC,
+ molybdenum-transport ATP-binding protein ABC transporter
+ (see citation below), similar to others e.g.
+ Y10817|ANY108176 ModC from Arthrobacter (349 aa), FASTA
+ scores: opt: 895, E(): 0, (46.0% identity in 361 aa
+ overlap); etc. Shows similarity to other Mycobacterium
+ tuberculosis ABC-transporter proteins e.g. Rv0073, Rv1238,
+ Rv2564, etc. Contains both PS00017 ATP/GTP-binding site
+ motif A (P-loop) and PS00211 ABC transporters family
+ signatures involved in molybdate uptake. BELONGS TO THE
+ ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS).
+ Mb1890 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MOLYBDENUM-TRANSPORT ATP-BINDING
+ PROTEIN ABC TRANSPORTER MODC"
+ /protein_id="SIU00494.1"
+ /db_xref="GOA:A0A1R3Y1P5"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR005116"
+ /db_xref="InterPro:IPR008995"
+ /db_xref="InterPro:IPR015852"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1P5"
+ /translation="MSKLQLRAVVADRRLDVEFSVSAGEVLAVLGPNGAGKSTALHVI
+ AGLLRPDAGLVRLGDRVLTDTEAGVNVATHDRRVGLLLQDPLLFPHLSVAKNVAFGPQ
+ CRRGMFGSGRARTRASALRWLREVNAEQFADRKPRQLSGGQAQRVAIARALAAEPDVL
+ LLDEPLTGLDVAAAAGIRSVLRSVVARSGCAVVLTTHDLLDVFTLADRVLVLESGTIA
+ EIGPVADVLTAPRSRFGARIAGVNLVNGTIGPDGSLRTQSGAHWYGTPVQDLPTGHEA
+ IAVFPPTAVAVYPEPPHGSPRNIVGLTVAEVDTRGPMVLVRGHDQPGGAPGLAACITV
+ DAATELRVAPGSRVWFSVKAQEVALHPAPHQHASS"
+ gene 2102354..2103331
+ /gene="apa"
+ /locus_tag="BQ2027_MB1891"
+ CDS 2102354..2103331
+ /gene="apa"
+ /locus_tag="BQ2027_MB1891"
+ /standard_name="mpt32; modD"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1891, apa, len: 325 aa. Equivalent to Rv1860,
+ len: 325 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 325 aa overlap). apa (alternate gene
+ names: mpt32, modD), Ala-, Pro-rich 45/47 kDa secreted
+ protein, very similar to P46842|N43L_MYCLE from
+ Mycobacterium leprae (287 aa), FASTA scores: opt: 1166,
+ E(): 0, (66.4% identity in 298 aa overlap). Known to be
+ glycosylated fibronectin-binding protein (see some
+ citations). TBparse score is 0.924. Protein product from
+ Mb1891 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1891 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ALANINE AND PROLINE RICH SECRETED PROTEIN APA
+ (FIBRONECTIN ATTACHMENT PROTEIN) (Immunogenic protein
+ MPT32) (Antigen MPT-32) (45-kDa glycoprotein) (45/47 kDa
+ antigen)"
+ /protein_id="SIU00495.1"
+ /db_xref="GOA:O30620"
+ /db_xref="InterPro:IPR010801"
+ /db_xref="UniProtKB/Swiss-Prot:O30620"
+ /translation="MHQVDPNLTRRKGRLAALAIAAMASASLVTVAVPATANADPEPA
+ PPVPTTAASPPSTAAAPPAPATPVAPPPPAAANTPNAQPGDPNAAPPPADPNAPPPPV
+ IAPNAPQPVRIDNPVGGFSFALPAGWVESDAAHLDYGSALLSKTTGDPPFPGQPPPVA
+ NDTRIVLGRLDQKLYASAEATDSKAAARLGSDMGEFYMPYPGTRINQETVSLDANGVS
+ GSASYYEVKFSDPSKPNGQIWTGVIGSPAANAPDAGPPQRWFVVWLGTANNPVDKGAA
+ KALAESIRPLVAPPPAPAPAPAEPAPAPAPAGEVAPTPTTPTPQRTLPA"
+ gene 2103783..2104088
+ /locus_tag="BQ2027_MB1892"
+ CDS 2103783..2104088
+ /locus_tag="BQ2027_MB1892"
+ /note="Mb1892, -, len: 101 aa. Equivalent to Rv1861, len:
+ 101 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 101 aa overlap). Probable conserved
+ transmembrane protein, showing weak similarity to
+ AE002069|AE002069_10 hypothetical protein from Deinococcus
+ radiodurans (146 aa), FASTA scores: opt: 154, E(): 0.0027,
+ (30.8% identity in 104 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). Mb1892 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00496.1"
+ /db_xref="GOA:A0A1R3XZK0"
+ /db_xref="InterPro:IPR007341"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZK0"
+ /translation="MDITATTEFSAMNLDGKTGIGWLGYIVIGGIAGWLASKIVKGGG
+ SGILMNVVIGVVGAFGAGLVLNALGVDVNHGGYWFTFFVALGGAVVLLWIVGMVRKT"
+ gene 2104163..2105203
+ /gene="adhA"
+ /locus_tag="BQ2027_MB1893"
+ CDS 2104163..2105203
+ /gene="adhA"
+ /locus_tag="BQ2027_MB1893"
+ /note="Mb1893, adhA, len: 346 aa. Equivalent to Rv1862,
+ len: 346 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 346 aa overlap=. Probable adhA,
+ alcohol dehydrogenase (EC 1.1.1.1), similar to
+ ADH2_BACST|P42327 alcohol dehydrogenase (339 aa), FASTA
+ scores: opt: 630, E(): 2.4e-32 (34.4% identity in 320 aa
+ overlap). Contains PS00059 Zinc-containing alcohol
+ dehydrogenases signature. Protein product from Mb1893
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1893 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable alcohol dehydrogenase adhA"
+ /protein_id="SIU00497.1"
+ /db_xref="GOA:A0A1R3XZX7"
+ /db_xref="InterPro:IPR002328"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR014187"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZX7"
+ /translation="MVSPATTATMSAWQVRRPGPMDTGPLERVTTRVPRPAPSELLVA
+ VHACGVCRTDLHVTEGDLPVHRERVIPGHEVVGEVIEVGSAVGAAAGGEFDRGDRVGI
+ AWLRHTCGVCKYCRRGSENLCPQSRYTGWDADGGYAEFTTVPAAFAHHLPSGYSDSEL
+ APLLCAGIIGYRSLLRTELPPGGRLGLYGFGGSAHITAQVALAQGAEIHVMTRGARAR
+ KLALQLGAASAQDAADRPPVPLDAAILFAPVGDLVLPALEALDRGGILAIAGIHLTDI
+ PDLNYQQHLFQERQIRSVTSNTRADARAFFDFAAQHHIEVTTPEYPLGQADRALGDLS
+ AGRIAGAAVLLI"
+ gene complement(2105210..2105980)
+ /locus_tag="BQ2027_MB1894C"
+ CDS complement(2105210..2105980)
+ /locus_tag="BQ2027_MB1894C"
+ /note="Mb1894c, -, len: 256 aa. Equivalent to Rv1863c,
+ len: 256 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 256 aa overlap). Probable conserved
+ integral membrane protein, similar to
+ Rv0804|Z95618|MTCY7H7A.05 Hypothetical protein from
+ Mycobacterium tuberculosis (209 aa), FASTA scores: opt:
+ 199, E(): 1e-06, (33.2% identity in 220 aa overlap); and
+ Rv0658c. Mb1894c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIU00498.1"
+ /db_xref="GOA:A0A1R3XZJ3"
+ /db_xref="InterPro:IPR003675"
+ /db_xref="InterPro:IPR015837"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZJ3"
+ /translation="MSDHLTACAAVHPGPLVSHLSVMHRFRIYVDIAVVVLVLVLTNL
+ IAHFTTPWASIATVPAAAVGLVILVRSRGLGWAELGLSRQHWKSGLVYALAAVALVVA
+ VISVGVLLPITRPMFMNHHYATISGAVIASMVMIPLQTVIPEELAFRGVLHGALNRAW
+ GFRGVAVAGSVLFGLWHIATSLGLTSSNVGFTRLFGGGIIGLVAGVMLAVLATGVAGF
+ VFSWLRRRSGSLIAPIALHWSLNGMGALAAALVWHLST"
+ gene complement(2105973..2106728)
+ /locus_tag="BQ2027_MB1895C"
+ CDS complement(2105973..2106728)
+ /locus_tag="BQ2027_MB1895C"
+ /note="Mb1895c, -, len: 251 aa. Equivalent to Rv1864c,
+ len: 251 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 251 aa overlap). Conserved
+ hypothetical protein. Similar to other hypothetical
+ proteins e.g. AL031317|SC6G4.43 from Streptomyces
+ coelicolor cosmid 6G (233 aa), FASTA scores: opt: 716,
+ E(): 0, (54.4% identity in 215 aa overlap); also
+ P43976|YIIM_HAEIN hypothetical protein hi0278 (221 aa),
+ FASTA scores: opt: 223, E(): 3.8e-08, (29.5% identity in
+ 173 aa overlap). Protein product from Mb1895c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1895c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00499.1"
+ /db_xref="GOA:A0A1R3XZM6"
+ /db_xref="InterPro:IPR005302"
+ /db_xref="InterPro:IPR011037"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZM6"
+ /translation="MTVAPRRLAWTNARQSYPVRVAHVLSVNLARVRANPDPRAQSKL
+ TGIDKVAASEAVMVRAPGSMHAGVGSGLVGDTVGNPKLHGGDDQAVYAYAREDLDAWE
+ TQLHRTLHNGMFGENLTTSGVDVTYARIGERWRIGSDGLVLEVSAPRIPCRTFAAFLD
+ LRYWIKTFTRAAKPGAYLRVIAPGTVRAGDTITVDYRPEHNVTVGLVFRARTSESELL
+ PQLLAADALAAELKAYARERTPSPPPVDSADDV"
+ gene complement(2106725..2107585)
+ /locus_tag="BQ2027_MB1896C"
+ CDS complement(2106725..2107585)
+ /locus_tag="BQ2027_MB1896C"
+ /note="Mb1896c, -, len: 286 aa. Equivalent to Rv1865c,
+ len: 286 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 286 aa overlap). Probable short-chain
+ dehydrogenase (EC 1.-.-.-), highly similar to C-terminus
+ of NP_301650.1|NC_00267 putative oxidoreductase from
+ Mycobacterium leprae (596 aa). Also similar to various
+ dehydrogenases, generally belonging to short-chain family,
+ e.g. AAG02168.1|AF212041_24|AF212041
+ 3-oxoacyl-(acylcarrier protein) reductase from Zymomonas
+ mobilis (251 aa); P50198|LINX_PSEPA
+ 2,5-DICHLORO-2,5-CYCLOHEXADIENE-1,4-DIOL DEHYDROGENASE
+ from Sphingomonas paucimobilis (250 aa);
+ NP_105680.1|NC_002678 sorbitol dehydrogenase (also similar
+ to acetoin reductase) from Mesorhizobium loti (256 aa);
+ etc. And highly similar to C-terminus of
+ ephD|Rv2214c|MTCY190.25c from Mycobacterium tuberculosis
+ (592 aa); and many other oxidoreductases from
+ Mycobacterium tuberculosis e.g. Y00P_MYCTU|Q10402 putative
+ oxidoreductase (650 aa), FASTA scores: opt: 439, E():
+ 8.9e-20, (32.5% identity in 280 aa overlap). Contains
+ PS00061 Short-chain alcohol dehydrogenase family
+ signature. BELONGS TO THE SHORT-CHAIN
+ DEHYDROGENASES/REDUCTASES (SDR) FAMILY. Protein product
+ from Mb1896c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1896c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SHORT-CHAIN TYPE DEHYDROGENASE"
+ /protein_id="SIU00500.1"
+ /db_xref="GOA:A0A1R3XZJ8"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZJ8"
+ /translation="MPGRTSIGVKIRDKVQDKVIAITGGARGIGLATAAALHNLGAKV
+ AIGDIDEAMAKESGADLDLDMYGKLDVTDPDSFSGFLDAVERQLGPIDVLVNNAGIMP
+ VGRIVDEPDPVTRRILDINVYGVILGSKLAAQRMVPRGRGHVINVASLAGEIYAVGVA
+ TYCASKHAVVAFTDSARLEYRSAGVKFSMVLPSFVNTELIAGTGGIKGFKNAEPADIA
+ DAIVGLIVHPKPRVRVTKAAGSMIVAQRFMPRQVSEGLNRLLGGEHVFTDDVDMEKRR
+ TYEARARGEE"
+ gene 2107759..2110095
+ /locus_tag="BQ2027_MB1897"
+ CDS 2107759..2110095
+ /locus_tag="BQ2027_MB1897"
+ /note="Mb1897, -, len: 778 aa. Equivalent to Rv1866, len:
+ 778 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 778 aa overlap). Conserved hypothetical
+ protein, N-terminal region similar to fatty acyl-CoA
+ racemases e.g. Rv0855, Rv1143, and C-terminal region (from
+ aa 370) similar to L-carnitine dehydratases, racemases,
+ and Rv3272|MTCY71.12 Mycobacterium tuberculosis (394 aa),
+ FASTA score: opt: 472, E(): 2.1e-21, (29.9% identity in
+ 388 aa overlap). Also similar to P31572|CAIB_ECOLI
+ L-CARNITINE DEHYDRATASE (EC 4.2.1.89) (405 aa), FASTA
+ score: opt: 306, E(): 2.1e-11, (23.3% identity in 424 aa
+ overlap). Protein product from Mb1897 detected using SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="CaiB/BaiF family protein"
+ /protein_id="SIU00501.1"
+ /db_xref="GOA:A0A1R3XZJ5"
+ /db_xref="InterPro:IPR003673"
+ /db_xref="InterPro:IPR023606"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZJ5"
+ /translation="MVTRLLADLGADVLKVQPPGGSPGRHVRPTLAGTSIGFAMHNAN
+ KRSAVLNPLDESDRRRFLDLAASADIVVDCGLPGQAAAYGASCAELADRYRHLVALSI
+ TDFGAAGPRSSWRATDPVLYAMSGALSRSGPTAGTPVLPPDGIASATAAVQAAWAVLV
+ AYFNRLRCGTGDYIDFSRFDAVVMALDPPFGAHGQVAAGIRSTGRWRGRPKNQDAYPI
+ YPCRDGYVRFCVMAPRQWRGLRRWLGEPEDFQDPKYDVIGARLAAWPQISVLVAKLCA
+ EKTMKELVAAGQALGVPITAVLTPSRILASEHFQAVGAITDAELVPGVRTGVPTGYFV
+ VDGKRAGFRTPAPAAGQDEPRWLADPAPVPPPSGRVGGYPFEGLRILDLGIIVAGGEL
+ SRLFGDLGAEVIKVESADHPDGLRQTRVGDAMSESFAWTHRNHLALGLDLRNSEGKAI
+ FGRLVAESDAVFANFKPGTLTSLGFSYDVLHAFNPRIVLAGSSAFGNRGPWSTRMGYG
+ PLVRAATGVTRVWTSDEAQPDNSRHPFYDATTIFPDHVVGRVGALLALAALIHRDRTG
+ GGAHVHISQAEVVVNQLDTMFVAEAARATDVAEIHPDTSVHAVYPCAGDDEWCVISIR
+ SDDEWRRATSVFGQPELANDPRFGASRSRVANRSELVAAVSAWTSTRTPVQAAGALQA
+ AGVAAGPMNRPSDILEDPQLIERNLFRDMVHPLIARPLPAETGPAPFRHIPQAPQRPA
+ PLPGQDSVQICRKLLGMTADETERLINERVMFGPAVTA"
+ gene 2110383..2111867
+ /locus_tag="BQ2027_MB1898"
+ CDS 2110383..2111867
+ /locus_tag="BQ2027_MB1898"
+ /note="Mb1898, -, len: 494 aa. Equivalent to Rv1867, len:
+ 494 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 494 aa overlap). Conserved
+ hypothetical protein, some similarity to acetyl CoA
+ synthase and to lipid carriers. FASTA best: E155295 acetyl
+ CoA synthase (388 aa), opt: 213, E(): 4.5e-07, (23.2%
+ identity in 423 aa overlap). Protein product from Mb1898
+ detected using SWATH mass spectrometry. Mb1898 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Acetyl-CoA acetyltransferase"
+ /protein_id="SIU00502.1"
+ /db_xref="GOA:A0A1R3XZK6"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR040771"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZK6"
+ /translation="MPVDPRTPVLIGYGQVNHRGDIDAEKQSIEPVDLMAAAARKAAD
+ STVLEAVDSIRVVHMLSAHYRNPGQLLGERIKARTFTTGYSGVGGNMPQSLVNRACLD
+ IQRGRAGVVLLAGAETWRTRTGLRAKGSKLEWTVQDESVPLPDMAGDDVPMAGAAELR
+ INLDRPAYVYPIFEQALRIAYGESIENHRKRIGELWARFSAVAADNPHAWIRNPVTAD
+ EIWQPGPQNRMVSWPYTKLMNSNNMVDQGAALLLTSVERATRLRIPAERWVYPQAGTD
+ AHDTPAVADRHRLHRSTAIRIAGARALELAGLGLDDIEYVDLYSCFPSAVQVAAIELG
+ LDTDDPARPLTVTGGLTFAGGPWSNYVTHSIATMAELLAANPGRRGLITANGGYLTKH
+ SFGVYGTEPPSEFRWEDMQPAVDREPTGDGLVEWEGIGTVEAWTTPVNRDGQPEKAFL
+ AVRTPDGSRSLAVITDPASVQATVREDIAGVKVAVAPDGTATLR"
+ gene 2111966..2114065
+ /locus_tag="BQ2027_MB1899"
+ CDS 2111966..2114065
+ /locus_tag="BQ2027_MB1899"
+ /EC_number="2.7.9.2"
+ /note="Mb1899, -, len: 699 aa. Equivalent to Rv1868, len:
+ 699 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 699 aa overlap). Conserved
+ hypothetical protein, similar to products of three
+ consecutive ORFS in Mycobacterium leprae
+ MLCB2052.18|Z98604|B2052 (257 aa), FASTA scores: opt: 314,
+ E(): 9.9e-12, (35.2% identity in 213 aa overlap);
+ MLCB2052.17, and MLCB2052.16. Also similar to M.
+ tuberculosis hypothetical protein Rv2047c. Protein product
+ from Mb1899 detected using SWATH mass spectrometry. Mb1899
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Phosphoenolpyruvate synthase (EC"
+ /protein_id="SIU00503.1"
+ /db_xref="InterPro:IPR016040"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZJ6"
+ /translation="MQILVTDATGAVGRSVTRQLIAAGHTVSGIAQHPHDALDPRVDY
+ VCASLRNPVLQELAGEADAVIHLAPVDTSAPGGVGITGLAHVANAAARAGARLLFVSQ
+ AAGRPELYRQAETLVSTGWAPSLVIRIAPPVGRQLDWMVCRTVATLLRSKVSARPIRV
+ LHLDDLVRFLVLALNTDRNGVVDLATPDTTNVVTAWRLLRSVDPHLRTRRVRSWEQLI
+ PEVDIAAVQEDWNFEFGWQATEAIVDTGRGLVGRRLHPAGATNGSGQLALPVEAPPRS
+ VPSHGEPLGSAAPEGLEGEFDDRIDERFPVFSSASLAEALPGPLTPMTLDVQLSGLRA
+ AGRAMGRVLALGGVVADEWERRAIAVFGHRPYIGVSANIVAAAQLPGWDAQAVARRAL
+ GEQPQVTELLPFGRPQLAGGPLGSVAKVVVTARSLALLRHLRSDTHHYVAAADAEHLA
+ AGQLASLPDAGLEVRIRLLRDRIHQGWILTVLWVIDTGVTAATLEHTRAGSAVSGGGM
+ IMESGRIGAEIAPLAAVLRADPPLCALANDGNLASIRALSAPAAAAVDAVIARIGHRG
+ LGEAELANLTFADDPALLLKTAAEIAARPAGPAHPATLIQRLAAGTRSARELAHDTTI
+ RFTHELRMTLRELGSRRVAADVIDVVDDVFYLTCDELITTPADARLRIKRRRAERERL
+ QAQRPPDVIDHAWVPVE"
+ gene complement(2114079..2115314)
+ /locus_tag="BQ2027_MB1900C"
+ CDS complement(2114079..2115314)
+ /locus_tag="BQ2027_MB1900C"
+ /note="Mb1900c, -, len: 411 aa. Equivalent to Rv1869c,
+ len: 411 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 411 aa overlap). Probable reductase
+ (1.-.-.-). Similar to several reductases e.g.
+ CAC04223.1|AL391515 putative ferredoxin reductase from
+ Streptomyces coelicolor (420 aa); THCD_RHOSO|P43494
+ rhodocoxin reductase (426 aa), FASTA scores: opt: 904,
+ E(): 0, (40.8% identity in 370 aa overlap). Also similar
+ to Mycobacterium tuberculosis proteins Rv0688 (406 aa)
+ (39.9% identity in 391 aa overlap); and Rv0253 (nitrite
+ reductase subunit). Protein product from Mb1900c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1900c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable reductase"
+ /protein_id="SIU00504.1"
+ /db_xref="GOA:A0A1R3Y1Q6"
+ /db_xref="InterPro:IPR016156"
+ /db_xref="InterPro:IPR023753"
+ /db_xref="InterPro:IPR028202"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1Q6"
+ /translation="MASSTTFVIVGGGLAGAKAVEALRRSDFGGRIILFGDEEHLPYD
+ RPPLSKEFLAGKKSLSDFTIQTSDWYRDHDVDVRLGVRVSSLDRSAHTVELPDGAAVR
+ YDKLLLATGSAPRRPPIPGSDAAGVHYLRSYNDAVALNSVLVQGSSLAVVGAGWIGLE
+ VAASARQRGVDVTVVETAIQPLLAALGEAVGKVFADLHRDQGVDLRLQTQLEEITAAD
+ GKATGLKMRDGSTVAADAVLVAVGAKPNVELAQQAGLAMGEGGVLVDASLRTSDPDIY
+ AVGDIAAAEHPLLGTRVRTEHWANALKQPAVAAAGMLGRPGEYAELPYLFTDQYDLGM
+ EYVGHAPSCDRVVFRGNVAGREFLSFWLDGDSRVLAGMNVNVWDVVDDVKGLIRSGNP
+ VDVDRLVDPQWPLADLTTN"
+ gene complement(2115381..2116049)
+ /locus_tag="BQ2027_MB1901C"
+ CDS complement(2115381..2116049)
+ /locus_tag="BQ2027_MB1901C"
+ /note="Mb1901c, -, len: 222 aa. Equivalent to Rv1870c,
+ len: 211 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 211 aa overlap). Conserved
+ hypothetical protein. Some similarity to SC6F7.17c
+ hypothetical protein from Streptomyces coelicolor (216
+ aa). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a single base transversion (t-a) and a single base
+ transition (c-t) lead to a slightly longer product
+ compared to the homolog in Mycobacterium tuberculosis
+ strain H37Rv (222 aa versus 211 aa). Mb1901c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein involved in DNA repair"
+ /protein_id="SIU00505.1"
+ /db_xref="GOA:A0A1R3Y0D9"
+ /db_xref="InterPro:IPR011257"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0D9"
+ /translation="MPPRIAGMRLLVIKPEPLARRLLKLAGTTYAAEAGIRIRDKPMP
+ LFQLLVLCMLASKPIGAATAARAARELFCSGLRTPKAVLSAERQTMISAFGRAHYVRY
+ DESSATRLTAIAHRVRDEYSGDLRELAQRTRPDVSAAKRMLKTFNGIGDTGADIFLRE
+ VQDVWIWVRPYFDDRATAAAKQLGLPTDPKKLASVAPSSNALLAAALVRVALDDELRL
+ QVTG"
+ gene complement(2116114..2116503)
+ /locus_tag="BQ2027_MB1902C"
+ CDS complement(2116114..2116503)
+ /locus_tag="BQ2027_MB1902C"
+ /note="Mb1902c, -, len: 129 aa. Equivalent to Rv1871c,
+ len: 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 129 aa overlap). Conserved
+ hypothetical protein, similar to Mycobacterium
+ tuberculosis hypothetical proteins Q11057|Rv1261|MTCY50.21
+ (149 aa), FASTA score: opt: 125, E(): 0.019, (32.6%
+ identity in 89 aa overlap); Rv0523c, and Rv1598c. Protein
+ product from Mb1902c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1902c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA-repair"
+ /protein_id="SIU00506.1"
+ /db_xref="GOA:A0A1R3XZL5"
+ /db_xref="InterPro:IPR004378"
+ /db_xref="InterPro:IPR012349"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZL5"
+ /translation="MNAAMNLKREFVHRVQRFVVNPIGRQLPMTMLETIGRKTGQPRR
+ TAVGGRVVDNQFWMVSEHGEHSDYVYNIKANPAVRVRIGGRWRSGTAYLLPDDDPRQR
+ LRGLPRLNSAGVRAMGTDLLTIRVDLD"
+ gene complement(2116526..2117770)
+ /gene="lldD2"
+ /locus_tag="BQ2027_MB1903C"
+ CDS complement(2116526..2117770)
+ /gene="lldD2"
+ /locus_tag="BQ2027_MB1903C"
+ /note="Mb1903c, lldD2, len: 414 aa (start uncertain).
+ Equivalent to Rv1872c, len: 414 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (99.5% identity in 414 aa
+ overlap). Possible lldD2, L-lactate dehydrogenase
+ (cytochrome) (EC 1.1.2.3), similar to other lactate
+ dehydrogenases and other oxidases e.g. LLDD_ECOLI|P33232
+ l-lactate dehydrogenase (cytochrome) from Escherichia coli
+ strain K12 (396 aa), FASTA results: opt: 674, E():
+ 1.1e-37, (40.5% identity in 279 aa overlap); Q51135
+ LACTATE DEHYDROGENASE from Neisseria meningitidis (390
+ aa), FASTA results: opt: 309, E(): 4.1e-15, (42.5%
+ identity in 113 aa overlap); etc. Also shows similarity
+ with Rv0694|lldD1|MTCY210.11 POSSIBLE L-LACTATE
+ DEHYDROGENASE (CYTOCHROME) from Mycobacterium tuberculosis
+ (396 aa). Contains PS00557 FMN-dependent alpha-hydroxy
+ acid dehydrogenases active site. BELONGS TO THE
+ FMN-DEPENDENT ALPHA-HYDROXY ACID DEHYDROGENASES FAMILY.
+ Protein product from Mb1903c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1903c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE L-LACTATE DEHYDROGENASE (CYTOCHROME)
+ LLDD2"
+ /protein_id="SIU00507.1"
+ /db_xref="GOA:A0A1R3XZY8"
+ /db_xref="InterPro:IPR000262"
+ /db_xref="InterPro:IPR008259"
+ /db_xref="InterPro:IPR012133"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR037396"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZY8"
+ /translation="MAVNRRVPRVRDLAPLLQFNRPQFDTSKRRLGAALTIQDLRRIA
+ KRRTPRAAFDYADGAAEDELSIARARQGFRDIEFHPTILRDVTTVCAGWNVLGQPTVL
+ PFGIAPTGFTRLMHTEGEIAGARAAAAAGIPFSLSTLATCAIEDLVIAVPQGRKWFQL
+ YMWRDRDRSMALVRRAAAAGFDTMLVTVDVPVAGARLRDVRNGMSIPPALTLRTVLDA
+ MGHPRWWFDLLTTEPLAFASLDRWPGTVGEYLNTVFDPSLTFDDLAWIKSQWPGKLVV
+ KGIQTLDDARAVVDRGVDGIVLSNHGGRQLDRAPVPFHLLPHVARELGKHTEILVDTG
+ IMSGADIVAAIALGARCTLIGRAYLYGLMAGGEAGVNRAIEILQTGVIRTMRLLGVTC
+ LEELSPRHVTQLRRLGPIGAPT"
+ gene 2117793..2118230
+ /locus_tag="BQ2027_MB1904"
+ CDS 2117793..2118230
+ /locus_tag="BQ2027_MB1904"
+ /note="Mb1904, -, len: 145 aa. Equivalent to Rv1873, len:
+ 145 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 145 aa overlap). Conserved hypothetical
+ protein. Some similarity to AL591783 hypothetical protein
+ from Sinorhizobium meliloti. Mb1904 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="NTP pyrophosphohydrolases including oxidative
+ damage repair enzymes"
+ /protein_id="SIU00508.1"
+ /db_xref="InterPro:IPR014937"
+ /db_xref="InterPro:IPR036287"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZK4"
+ /translation="MKSASDPFDLKRFVYAQAPVYRSVVEELRAGRKRGHWMWFVFPQ
+ LRGLGSSPLAVRYGISSLEEAQAYLQHDLLGPRLHECTGLVNQVQGRSIEEIFGPPDN
+ LKLCSSMTLFARATDANQDFVALLAKYYGGGEDRRTVALLAVT"
+ gene 2118303..2118989
+ /locus_tag="BQ2027_MB1905"
+ CDS 2118303..2118989
+ /locus_tag="BQ2027_MB1905"
+ /note="Mb1905, -, len: 228 aa. Equivalent to Rv1874, len:
+ 228 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 228 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1905 detected using
+ shotgun mass spectrometry. Mb1905 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="link to sulfotransferase activity"
+ /protein_id="SIU00509.1"
+ /db_xref="InterPro:IPR009799"
+ /db_xref="InterPro:IPR011008"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZN4"
+ /translation="MLMRPEPDDDWCARQRAQVADALLGLGVAGLSINVRDSTVRDSL
+ MTLTTLYPPVAAVVSLWTQQCYGEQVAAALRLLAQECDELGAYLVTESVPLTFPSLVE
+ SGSRTPGLANIALLRRPDGLDQATWLTRWQRDHTQVAIEAQATFGYTQNWVVRALTPE
+ APGIAGIVEELFPVAATTDLKAFFGAADDNDLRNRISRMVASTSAFGANQNIDTVPTS
+ RYVFRTPFKD"
+ gene 2119000..2119443
+ /locus_tag="BQ2027_MB1906"
+ CDS 2119000..2119443
+ /locus_tag="BQ2027_MB1906"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1906, -, len: 147 aa. Equivalent to Rv1875, len:
+ 147 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 147 aa overlap). Conserved
+ hypothetical protein. Some similarity to Mycobacterium
+ tuberculosis hypothetical proteins e.g.
+ Rv1155|MTCI65.22|Z95584 (147 aa), FASTA scores: opt: 178,
+ E(): 7.4e-06, (26.9% identity in 130 aa overlap); Rv0121c
+ and Rv2074. Also similar to AL079356|SC6G9.21 hypothetical
+ protein from Streptomyces coelicolor (144 aa), FASTA
+ scores: opt: 239, E(): 3.1 e-09, (38.7% identity in 137 aa
+ overlap). Protein product from Mb1906 detected using
+ shotgun mass spectrometry. Mb1906 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable F420-dependent enzyme"
+ /protein_id="SIU00510.1"
+ /db_xref="GOA:A0A1R3XZL6"
+ /db_xref="InterPro:IPR011576"
+ /db_xref="InterPro:IPR012349"
+ /db_xref="InterPro:IPR019920"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZL6"
+ /translation="MTTLNEAAALAAAERGLAVVSTVRADGTVQASLVNVGLLPHPVS
+ GEPSLGFTTYGKVKLGNLRARPQLAVTFRNGWQWATVEGRAQLVGPDDPRPWLVDGER
+ LRLLLREVFTAAGGTHDDWDEYDRVMAQEQRAVVLITPTRIYSNG"
+ gene 2119959..2120438
+ /gene="bfrA"
+ /locus_tag="BQ2027_MB1907"
+ CDS 2119959..2120438
+ /gene="bfrA"
+ /locus_tag="BQ2027_MB1907"
+ /standard_name="bfr"
+ /note="Mb1907, bfrA, len: 159 aa. Equivalent to Rv1876,
+ len: 159 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 159 aa overlap). Probable bfrA,
+ bacterioferritin, similar to BFR_MYCLE|P43315
+ bacterioferritin (bfr) from Mycobacterium leprae (159 aa),
+ FASTA results: opt: 958, E(): 0, (90.6% identity in 159 aa
+ overlap). Also similar to Rv3841|MTCY01A6.28c|bfrB
+ POSSIBLE BACTERIOFERRITIN from Mycobacterium tuberculosis
+ (181 aa). BELONGS TO THE BACTERIOFERRITIN FAMILY. Protein
+ product from Mb1907 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1907 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE BACTERIOFERRITIN BFRA"
+ /protein_id="SIU00511.1"
+ /db_xref="GOA:P63698"
+ /db_xref="InterPro:IPR002024"
+ /db_xref="InterPro:IPR008331"
+ /db_xref="InterPro:IPR009040"
+ /db_xref="InterPro:IPR009078"
+ /db_xref="InterPro:IPR012347"
+ /db_xref="UniProtKB/Swiss-Prot:P63698"
+ /translation="MQGDPDVLRLLNEQLTSELTAINQYFLHSKMQDNWGFTELAAHT
+ RAESFDEMRHAEEITDRILLLDGLPNYQRIGSLRIGQTLREQFEADLAIEYDVLNRLK
+ PGIVMCREKQDTTSAVLLEKIVADEEEHIDYLETQLELMDKLGEELYSAQCVSRPPT"
+ gene 2120523..2122058
+ /locus_tag="BQ2027_MB1908"
+ CDS 2120523..2122058
+ /locus_tag="BQ2027_MB1908"
+ /note="Mb1908, -, len: 511 aa. Similar to 5' end of
+ Rv1877, len: 687 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (93.2% identity in 292 aa overlap). Probable
+ conserved integral membrane protein, part of major
+ facilitator superfamily (MFS), similar to many antibiotic
+ and drug efflux proteins. Similar to e.g. Q56175 TU22
+ DTDP-GLUCOSE DEHYDRTATASE from Streptomyces violaceoruber
+ (557 aa), FASTA scores: opt: 895, E(): 0, (34.7% identity
+ in 528 aa overlap). Also similar to Mycobacterium
+ tuberculosis relatives protein, include Rv3728, Rv3239c,
+ Rv2846c, etc. Contains PS00217 Sugar transport proteins
+ signature 2 (PS00217). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv1877 exists as
+ a single gene. In Mycobacterium bovis, a frameshift due to
+ a single base insertion (*-c), splits Rv1877 into 2 parts,
+ Mb1908 and Mb1909. Mb1908 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN
+ [FIRST PART]"
+ /protein_id="SIU00512.1"
+ /db_xref="GOA:A0A1R3XZL3"
+ /db_xref="InterPro:IPR001411"
+ /db_xref="InterPro:IPR001958"
+ /db_xref="InterPro:IPR005829"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZL3"
+ /translation="MAGPTAPTTAPTAIRAGGPLLSPVRRNIIFTALVFGVLVAATGQ
+ TIVVPALPTIVAELGSTVDQSWAVTSYLLGGTVVVVVAGKLGDLLGRNRVLLGSVVVF
+ VVGSVLCGLSQTMTMLAISRALQGVGAGAISVTAYALAAEVVPLRDRGRYQGVLGAVF
+ GVNTVTGPLLGGWLTDYLSWRWAFWINVPVSIAVLTVAATAVPALARPPKPVIDYLGI
+ LVIAVATTALIMATSWGGTTYAWGSATIVGLLIGAAVALGFFVWLEGRARCGHPAAQA
+ VWQPSICRVLRPVLRGRIRDAGCTDLRTDLSGVRGRRVGDRVRSAHVADGDRPADRLD
+ RDGCPGRPDGPLQDLPGRGDGADGGCVPADVADGRVDATAAAIAVPGRPRCRHRIVHA
+ GARSHRAEHVVFRRPRRRNIGCDLLPGGRRLVWYRNIRCVVRKLPGPKTRFRADVGRR
+ ACPGSAISGCLASAAPEHGRPDRAGICRVAHPGVPLRGLGHGGRFHPGAVAARGTAHR
+ HPR"
+ gene 2122087..2122587
+ /locus_tag="BQ2027_MB1909"
+ CDS 2122087..2122587
+ /locus_tag="BQ2027_MB1909"
+ /note="Mb1909, -, len: 404 aa. Equivalent to 3' end of
+ Rv1877, len: 687 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 404 aa overlap).
+ Probable conserved integral membrane protein, part of
+ major facilitator superfamily (MFS), similar to many
+ antibiotic and drug efflux proteins. Similar to e.g.
+ Q56175 TU22 DTDP-GLUCOSE DEHYDRTATASE from Streptomyces
+ violaceoruber (557 aa), FASTA scores: opt: 895, E(): 0,
+ (34.7% identity in 528 aa overlap). Also similar to
+ Mycobacterium tuberculosis relatives protein, include
+ Rv3728, Rv3239c, Rv2846c, etc. Contains PS00217 Sugar
+ transport proteins signature 2 (PS00217).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1877 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ insertion (*-c), splits Rv1877 into 2 parts, Mb1908 and
+ Mb1909. Mb1909 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN
+ [SECOND PART]"
+ /protein_id="SIU00513.1"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZK3"
+ /translation="MPRAESPEDVLEIAVRRMLPNGVRLRDIATQPGCGLGVAELWAL
+ LRIYQYQRLFEAVRLTDIGRHLHVPYQVFEPVFDRLVQTGYAARDGDILTLTPSGHRQ
+ VDSLAVLIRQWLLDHLAVAPGLKRQPDHQFEAALQHVTDAVLVQRDWYEDLGDLSESR
+ QLAATT"
+ gene 2122642..2123994
+ /gene="glnA3"
+ /locus_tag="BQ2027_MB1910"
+ CDS 2122642..2123994
+ /gene="glnA3"
+ /locus_tag="BQ2027_MB1910"
+ /note="Mb1910, glnA3, len: 450 aa. Equivalent to Rv1878,
+ len: 450 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 450 aa overlap). Probable glnA3,
+ glutamine synthetase class I (EC 6.3.1.2), similar to many
+ e.g. GLNA_BACCE|P19064 from Bacillus cereus (443 aa),
+ FASTA results: opt: 497, E(): 5.2e-23, (29.0% identity in
+ 331 aa overlap); etc. Also similar to C-terminus of
+ FLUG_EMENI|P38094 flug protein from emericella nidulans
+ (865 aa), FASTA scores: opt: 227, E (): 6.4e-13, (29.9%
+ identity in 394 aa overlap). Note that the downstream ORF
+ MTCY180.39c is similar to the N-terminus. Also similar to
+ three other potential glutamine synthases in M.
+ tuberculosis:
+ Q10378|GLN2_MYCTU|GLNA2|Rv2222c|MT2280|MTCY190.33c|MTCY427
+ .03c; Rv2860c|MTV003.06c|glnA4 and Rv2220|glnA1. BELONGS
+ TO THE GLUTAMINE SYNTHETASE FAMILY. Protein product from
+ Mb1910 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb1910 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUTAMINE SYNTHETASE GLNA3 (GLUTAMINE
+ SYNTHASE) (GS-I)"
+ /protein_id="SIU00514.1"
+ /db_xref="GOA:A0A1R3Y1R5"
+ /db_xref="InterPro:IPR008146"
+ /db_xref="InterPro:IPR014746"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1R5"
+ /translation="MTATPLAAAAIAQLEAEGVDTVIGTVVNPAGLTQAKTVPIRRTN
+ TFANPGLGASPVWHTFCIDQCSIAFTADISVVGDQRLRIDLSALRIIGDGLAWAPAGF
+ FEQDGTPVPACSRGTLSRIEAALADAGIDAVIGHEVEFLLVDADGQRLPSTLWAQYGV
+ AGVLEHEAFVRDVNAAATAAGIAIEQFHPEYGANQFEISLAPQPPVAAADQLVLTRLI
+ IGRTARRHGLRVSLSPAPFAGSIGSGAHQHFSLTMSEGMLFSGGTGAAGMTSAGEATV
+ AGVLRGLPDAQGILCGSIVSGLRMRPGNWAGIYACWGTENREAAVRFVKGGAGSAYGG
+ NVEVKVVDPSANPYLASAAILGLALDGMKTKAVLPSETTVDPTQLSDVDRDRAGILRL
+ AADQADAIAVLDSSKLLRCILGDPVVDAVVAVRQLEHERYGDLDPAQLADKFRMAWSV
+ "
+ gene 2123997..2125133
+ /locus_tag="BQ2027_MB1911"
+ CDS 2123997..2125133
+ /locus_tag="BQ2027_MB1911"
+ /note="Mb1911, -, len: 378 aa. Equivalent to Rv1879, len:
+ 378 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 378 aa overlap). Conserved
+ hypothetical protein, similar to SCC22.14c|AL096839
+ hypothetical protein from Streptomyces coelicolor (368
+ aa), FASTA results: opt: 772, E(): 0 (40.3% identity in
+ 372 aa overlap); and to N-terminal half of
+ nodulin/glutamate-ammonia ligase-like protein. Some
+ similarity to N-terminus of AL132958|ATT4D2_11 Arabidopsis
+ thaliana (845 aa), FASTA results: opt: 354, E(): 3.1e-16,
+ (29.2% identity in 383 aa overlap); and to
+ P38094|FLUG_EMENI Flug protein of Emericella nidulans (865
+ aa), FASTA results: opt: 306, E(): 6.2e-13, (26.5%
+ identity in 415 aa overlap). Note that the upstream ORF
+ Rv1878|MTCY18 0.40c is similar to the C-terminus. Mb1911
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Amidohydrolase"
+ /protein_id="SIU00515.1"
+ /db_xref="GOA:A0A1R3Y0F1"
+ /db_xref="InterPro:IPR006680"
+ /db_xref="InterPro:IPR032466"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0F1"
+ /translation="MADSAGSDLTRHTAEVPLIDQHVHGCWLTEGNRRRFENALNEAN
+ TEPLADFDSGFDSQLGFAVRNHCAPILGLPRHVDPQTYWDRRSQFSEAELARRFLQAA
+ GVTDWLVETGIGYDVSGMASVAGLGELSGSHAHEVVRLEQVAEQAVQASGDYASAFNE
+ ILRRRAATAVATKSILAYRGGFDGDLTEPPAAQVAEAAKRWRDRGGVRLQDRVLLRFG
+ LHQALRLGKPLQFHVGFGDRDADLHKANPLYLLDFLRQSGNTPIVLLHCYPYEREAGY
+ LAQAFNNVYLDGGLSVHYLGARSPAFIGRLLELAPFRKIVYSSDGFGPAELHFLGATL
+ WRSGIQRVLRGFVERDDWCETDALRVVDLIAHGTAARIYRLGDR"
+ gene complement(2125161..2126477)
+ /gene="cyp140"
+ /locus_tag="BQ2027_MB1912C"
+ CDS complement(2125161..2126477)
+ /gene="cyp140"
+ /locus_tag="BQ2027_MB1912C"
+ /note="Mb1912c, cyp140, len: 438 aa. Equivalent to
+ Rv1880c, len: 438 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 438 aa overlap).
+ Probable cyp140, cytochrome p450 (EC 1.14.-.-). Similar to
+ Q00441|CPXJ_SACER 6-deoxyerythronolide beta hydroxylase
+ (404 aa), FASTA scores: opt: 775, E(): 0, (44.2% identity
+ in 319 aa overlap); and other members of the cytochrome
+ P450 family. Related to Mycobacterium tuberculosis
+ proteins include: Rv0766c, Rv2266, Rv0778, etc. Contains
+ cytochrome P450 cysteine heme-iron ligand signature
+ (PS00086). BELONGS TO THE CYTOCHROME P450 FAMILY. Protein
+ product from Mb1912c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1912c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable cytochrome p450 140 CYP140"
+ /protein_id="SIU00516.1"
+ /db_xref="GOA:P63722"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002397"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/Swiss-Prot:P63722"
+ /translation="MKDKLHWLAMHGVIRGIAAIGIRRGDLQARLIADPAVATDPVPF
+ YDEVRSHGALVRNRANYLTVDHRLAHDLLRSDDFRVVSFGENLPPPLRWLERRTRGDQ
+ LHPLREPSLLAVEPPDHTRYRKTVSAVFTSRAVSALRDLVEQTAINLLDRFAEQPGIV
+ DVVGRYCSQLPIVVISEILGVPEHDRPRVLEFGELAAPSLDIGIPWRQYLRVQQGIRG
+ FDCWLEGHLQQLRHAPGDDLMSQLIQIAESGDNETQLDETELRAIAGLVLVAGFETTV
+ NLLGNGIRMLLDTPEHLATLRQHPELWPNTVEEILRLDSPVQLTARVACRDVEVAGVR
+ IKRGEVVVIYLAAANRDPAVFPDPHRFDIERPNAGRHLAFSTGRHFCLGAALARAEGE
+ VGLRTFFDRFPDVRAAGAGSRRDTRVLRGWSTLPVTLGPARSMVSP"
+ gene complement(2126527..2126949)
+ /gene="lppE"
+ /locus_tag="BQ2027_MB1913C"
+ CDS complement(2126527..2126949)
+ /gene="lppE"
+ /locus_tag="BQ2027_MB1913C"
+ /note="Mb1913c, lppE, len: 140 aa. Equivalent to Rv1881c,
+ len: 140 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 140 aa overlap=. Possible lppE,
+ lipoprotein, showing some similarity to L12238|MSG18S19K_1
+ 19K antigen from Mycobacterium intracellulare (162 aa),
+ FASTA scores: opt: 137, E(): 0.0069, (27.6% identity in
+ 156 aa overlap). Contains signal sequence and
+ appropriately positioned PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site. Protein product from
+ Mb1913c detected using SWATH mass spectrometry. Mb1913c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED LIPOPROTEIN LPPE"
+ /protein_id="SIU00517.1"
+ /db_xref="GOA:A0A1R3XZZ9"
+ /db_xref="InterPro:IPR008691"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZZ9"
+ /translation="MCNRLVTVTGVAMVVAAGLSACGQAQTVPRKAARLTIDGVTHTT
+ RPATCSQEHSYRTIDIRNHDSTVQAVVLLSGDRVIPQWVKIRNVDGFNGSFWHGGVGN
+ ARADRARNTYTVAGSAYGISSKKPNTVVSTDFNILAEC"
+ gene complement(2126990..2127823)
+ /locus_tag="BQ2027_MB1914C"
+ CDS complement(2126990..2127823)
+ /locus_tag="BQ2027_MB1914C"
+ /note="Mb1914c, -, len: 277 aa. Equivalent to Rv1882c,
+ len: 277 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 277 aa overlap). Probable short-chain
+ dehydrogenase/reductase (EC 1.-.-.-), similar to various
+ dehydrogenases/reductases, generally belonging to SDR
+ family, e.g. NP_250789.1|NC_002516 probable short-chain
+ dehydrogenase from Pseudomonas aeruginosa (251 aa);
+ NP_421760.1|NC_002696 short chain dehydrogenase family
+ protein from Caulobacter crescentus (270 aa);
+ NP_107167.1|NC_002678 oxidoreductase (short chain
+ dehydrogenase/reductase family) from Mesorhizobium loti
+ (253 aa); P50197|LINC_PSEPA
+ 2,5-dichloro-2,5-cyclohexadiene-1,4-diol dehydrogenase
+ from Pseudomonas paucimobilis (Sphingomonas paucimobilis)
+ (250 aa), FASTA scores: opt: 301, E(): 2.3e-12, (30.0%
+ identity in 223 aa overlap); etc. Also similar to proteins
+ from Mycobacterium tuberculosis e.g. Rv3057c, Rv1245, etc.
+ Contains possible helix-turn-helix motif at aa 246-267
+ (+4.32 SD). Contains PS00061 Short-chain alcohol
+ dehydrogenase family signature. BELONGS TO THE SHORT-CHAIN
+ DEHYDROGENASES/REDUCTASES (SDR) FAMILY. Protein product
+ from Mb1914c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1914c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SHORT-CHAIN TYPE
+ DEHYDROGENASE/REDUCTASE"
+ /protein_id="SIU00518.1"
+ /db_xref="GOA:A0A1R3XZL1"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZL1"
+ /translation="MKAIFITGAGSGMGREGATLFHANGWRVGAIDRNEDGLAALRVQ
+ LGAERLWARAVDVTDKAALEGALADFCAGNVGGGLDMMWNNAGIGEGGWFEDVPYEAA
+ VRVVDVNFKAVLTGAYAALPYLKKAPGSLMFSTSSSSGTYGMPRIAVYSATKHAVKGL
+ TEALSVEWQRHGVRVADVLPGLIDTAILTSTRQHSDEGPYTISAEQIRAAAPKKGMFR
+ LMPSSSVAEAAWRAYQHPTRLHWYVPRSIRWIDRLKGVSPEFVRRHIAKSLATLEPKR
+ K"
+ gene complement(2127851..2128327)
+ /locus_tag="BQ2027_MB1915C"
+ CDS complement(2127851..2128327)
+ /locus_tag="BQ2027_MB1915C"
+ /note="Mb1915c, -, len: 158 aa. Equivalent to Rv1883c,
+ len: 153 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (96.8% identity in 158 aa overlap). Conserved hypothetical
+ protein, some similarity to hypothetical proteins e.g.
+ Rv2778c|AL008967|MTV002.43 from Mycobacterium tuberculosis
+ (156 aa), FASTA score: opt: 212, E(): 3.1e-08, (34.4%
+ identity in 151 aa overlap). Also similar to
+ U75434|SAU75434_3 Nsh-OrfB from Streptomyces actuosus (173
+ aa), FASTA score: opt: 207, E(): 1.8e-07, (40.2% identity
+ in 102 aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 15 bp in-frame insertion leads to a
+ longer product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (158 aa versus 153 aa). Protein
+ product from Mb1915c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1915c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00519.1"
+ /db_xref="InterPro:IPR019587"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZN9"
+ /translation="MCLDQVMEGSATVHMAAPPDKIWTLIADVRNTGRFSPETFEAEW
+ LDGATGPALGARFRGHVRRNGIGPVYWTVCEVTACEPGREFGFAVLLGDRPVNNWHYR
+ LTPTADGTEVTESFRLPPSVLTTVYYRVFGGWLRQRRNIRDMTKTLQRIKDLVEAG"
+ gene complement(2128366..2128896)
+ /gene="rpfC"
+ /locus_tag="BQ2027_MB1916C"
+ CDS complement(2128366..2128896)
+ /gene="rpfC"
+ /locus_tag="BQ2027_MB1916C"
+ /note="Mb1916c, rpfC, len: 176 aa. Equivalent to Rv1884c,
+ len: 176 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 176 aa overlap). Probable rpfC,
+ resuscitation promoting factor (see citation below),
+ similar to Z96935|MLRPF_1 resusicitation-promoting factor
+ from Micrococcus luteus (220 aa), FASTA score: opt: 287,
+ E() : 3.3e-11, (40.0% identity in 120 aa overlap). Also
+ similar to others from Mycobacterium tuberculosis:
+ Rv2389c|MTCY253.32|RPFD PROBABLE RESUSCITATION-PROMOTING
+ FACTOR (154 aa), FASTA score: opt: 382, E(): 7.1e-17,
+ (55.4% identity in 101 aa overlap); Rv0867c|RPFA
+ (N-terminal part), Rv2450c|RPFE, and Rv1009|RPFB
+ (C-terminal part). Mb1916c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RESUSCITATION-PROMOTING FACTOR RPFC"
+ /protein_id="SIU00520.1"
+ /db_xref="InterPro:IPR010618"
+ /db_xref="InterPro:IPR023346"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZM2"
+ /translation="MHPLPADHGRSRCNRHPISPLSLIGNASATSGDMSSMTRIAKPL
+ IKSAMAAGLVTASMSLSTAVAHAGPSPNWDAVAQCESGGNWAANTGNGKYGGLQFKPA
+ TWAAFGGVGNPAAASREQQIAVANRVLAEQGLDAWPTCGAASGLPIALWSKPAQGIKQ
+ IINEIIWAGIQASIPR"
+ gene complement(2128908..2129507)
+ /locus_tag="BQ2027_MB1917C"
+ CDS complement(2128908..2129507)
+ /locus_tag="BQ2027_MB1917C"
+ /note="Mb1917c, -, len: 199 aa. Equivalent to Rv1885c,
+ len: 199 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 199 aa overlap). Conserved
+ hypothetical protein, some similarity to P42517|CHMU_ERWHE
+ MONOFUNCTIONAL CHORISMATE MUTASE (181 aa), FASTA score:
+ opt: 181, E(): 0.00017, (28.6% identity in 133 aa
+ overlap). Protein product from Mb1917c detected using
+ SWATH mass spectrometry. Mb1917c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="chorismate mutase"
+ /protein_id="SIU00521.1"
+ /db_xref="GOA:A0A1R3XZL2"
+ /db_xref="InterPro:IPR002701"
+ /db_xref="InterPro:IPR008240"
+ /db_xref="InterPro:IPR036263"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZL2"
+ /translation="MLTRPREIYLATAVSIGILLSLIAPLGPPLARADGTSQLAELVD
+ AAAERLEVADPVAAFKWRAQLPIEDSGRVEQQLAKLGEDARSQHIDPDYVTRVFDDQI
+ RATEAIEYSRFSDWKLNPASAPPEPPDLSASRSAIDSLNNRMLSQIWSHWSLLSAPSC
+ AAQLDRAKRDIVRSRHLDSLYQRALTTATQSYCQALPPA"
+ gene complement(2129525..2130502)
+ /gene="fbpB"
+ /locus_tag="BQ2027_MB1918C"
+ CDS complement(2129525..2130502)
+ /gene="fbpB"
+ /locus_tag="BQ2027_MB1918C"
+ /standard_name="mpt59; 85B"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1918c, fbpB, len: 325 aa. Equivalent to Rv1886c,
+ len: 325 aa, from Mycobacterium tuberculosis strain H37Rv
+ (100.0% identity in 325 aa overlap). fbpB (alternate gene
+ names: mpt59, 85B), precursor of the 85-B antigen
+ (fibronectin-binding protein B) (mycolyl transferase 85B)
+ (EC 2.3.1.-) (see citations below), highly similar to
+ other Mycobacterial antigen precursors e.g.
+ P12942|A85B_MYCBO ANTIGEN 85-B PRECURSOR from
+ Mycobacterium bovis (323 aa); P21160|A85B_MYCKA ANTIGEN
+ 85-B PRECURSOR from Mycobacterium kansasii (325 aa); etc.
+ Also highly similar to Mycobacterium tuberculosis antigen
+ precursors: Rv3804c|fbpA (338 aa), Rv0129c|fbpC2 (340 aa),
+ and Rv3803c|fbpC1 (299 aa). Protein product from Mb1918c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1918c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="secreted antigen 85-B fbpB (85B) (antigen 85
+ complex B) (Mycolyl transferase 85B) (Fibronectin-binding
+ protein B) (Extracellular alpha-antigen)"
+ /protein_id="SIU00522.1"
+ /db_xref="GOA:P0C2T2"
+ /db_xref="InterPro:IPR000801"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/Swiss-Prot:P0C2T2"
+ /translation="MTDVSRKIRAWGRRLMIGTAAAVVLPGLVGLAGGAATAGAFSRP
+ GLPVEYLQVPSPSMGRDIKVQFQSGGNNSPAVYLLDGLRAQDDYNGWDINTPAFEWYY
+ QSGLSIVMPVGGQSSFYSDWYSPACGKAGCQTYKWETFLTSELPQWLSANRAVKPTGS
+ AAIGLSMAGSSAMILAAYHPQQFIYAGSLSALLDPSQGMGPSLIGLAMGDAGGYKAAD
+ MWGPSSDPAWERNDPTQQIPKLVANNTRLWVYCGNGTPNELGGANIPAEFLENFVRSS
+ NLKFQDAYNAAGGHNAVFNFPPNGTHSWEYWGAQLNAMKGDLQSSLGAG"
+ gene 2130893..2132035
+ /locus_tag="BQ2027_MB1919"
+ CDS 2130893..2132035
+ /locus_tag="BQ2027_MB1919"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1919, -, len: 380 aa. Equivalent to Rv1887, len:
+ 380 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 380 aa overlap). Hypothetical unknown
+ protein; contains eukaryotic thiol (cysteine) proteases
+ histidine active site at N-terminus (PS00639) and Pro-rich
+ region near C-terminus. Protein product from Mb1919
+ detected using SWATH mass spectrometry. Mb1919 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative membrane protein"
+ /protein_id="SIU00523.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZK9"
+ /translation="MDTVLGLSITPTTLGWVLAEGHGADGAILDRNELELHSGRNAQA
+ IHTAEQLAAEVLLAHEVAAAGDHRLRVIGVTWNAEASAQAALLVESLTGAGFDNVVPV
+ RRLRAIETLAQAIAPVIGYEQIAVCVLEHESATVVMVDTHDGKTQIAVKHVCRGLSGL
+ TSWLTGMFGRDAWRPAGVVVVGSDSEVSEFSWQLERVLPVPVFAQTMAQVTVARGAAL
+ AAAQSTEFTDAQLVADSVSQPTVAPRRSRHYAGAAAALAAAAVTFVASLSLAVGIQLA
+ PHNDTGTAKHGAHKPTPRIAKAVAPAVPPPPTVTPPVPARAPRPAAQHEPPARVTSGE
+ ALTEPNPPEEQPNASAPQQDRNDSQPITRVLEHIPGAYGDSAPPAE"
+ gene complement(2132005..2132724)
+ /locus_tag="BQ2027_MB1920C"
+ CDS complement(2132005..2132724)
+ /locus_tag="BQ2027_MB1920C"
+ /note="Mb1920c, -, len: 239 aa. Similar to Rv1888c, len:
+ 186 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 186 aa overlap). Possible
+ transmembrane protein. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 10 bp insertion (*-tccgatcacc)
+ leads to a longer product with a different COOH part
+ compared to its homolog in Mycobacterium tuberculosis
+ H37Rv (239 aa versus 186 aa). Protein product from Mb1920c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1920c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00524.1"
+ /db_xref="GOA:A0A1R3Y1S2"
+ /db_xref="InterPro:IPR025498"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1S2"
+ /translation="MQPDAYPVRVRGDLDPALSRWQWLVKWFLAIPHYIVLFFLHVAA
+ VVVTVIAFFAILFTGRYPRTLFDFNVGVMRWRWRVAFYALSALGTDRYPPFSLQTKAE
+ YPADLEVDYPERLSRGLVLIKWWLLAIPHYLILAVFLSSGWRVFLIDPHDRVGIMWPS
+ LLVILLLVAVVALLFTGRYPIGLYNLVIGVNRWALRVRAYTTLMRDEYPPLRLDMGPR
+ EQVSQPATAASDYSAGGAESP"
+ gene complement(2133089..2133262)
+ /locus_tag="BQ2027_MB1921C"
+ CDS complement(2133089..2133262)
+ /locus_tag="BQ2027_MB1921C"
+ /note="Mb1921c, -, len: 57 aa. Equivalent to Rv1888A, len:
+ 57 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 57 aa overlap). Conserved hypothetical
+ protein. Possibly continuation of Rv1889c, part of large
+ family of Mycobacterium tuberculosis proteins with
+ conserved N-terminal domain of ~ 120 aa. Includes:
+ C-terminus of Rv0726c|P95074 CONSERVED HYPOTHETICAL
+ PROTEIN (367 aa), FASTA scores: opt: 295, E(): 3.1e-15,
+ (73.684% identity in 57 aa overlap); C-terminus of
+ Rv3399|Q50726|MTCY78.29c CONSERVED HYPOTHETICAL PROTEIN
+ (348 aa), FASTA scores: opt: 504, E(): 7.3e-29, (64.2%
+ identity in 120 aa overlap); C-terminus of Rv0731c; etc.
+ Mb1921c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="O-methyltransferase"
+ /protein_id="SIU00525.1"
+ /db_xref="GOA:A0A1R3Y0F9"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0F9"
+ /translation="MVPVDLRRDWPTPLRQAGFDPNQPSAWLAEGLLAFLPPDAQDRL
+ LDNITALSAPGSR"
+ gene complement(2133306..2133662)
+ /locus_tag="BQ2027_MB1922C"
+ CDS complement(2133306..2133662)
+ /locus_tag="BQ2027_MB1922C"
+ /note="Mb1922c, -, len: 118 aa. Equivalent to Rv1889c,
+ len: 118 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 118 aa overlap). Conserved
+ hypothetical protein. Part of large family of
+ Mycobacterium tuberculosis proteins with conserved
+ N-terminal domain of ~ 120 aa. Includes:
+ Rv3399|Q50726|MTCY78.29C hypothetical 38.1 kd protein (348
+ aa), FASTA results: opt: 504, E(): 7.3e-29, (64.2%
+ identity in 120 aa overlap); Rv0726c, Rv0731c, etc.
+ Mb1922c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="O-methyltransferase"
+ /protein_id="SIU00526.1"
+ /db_xref="GOA:A0A1R3XZN6"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZN6"
+ /translation="MPRTNNDAWDLATSVGATATMVAAARAVATRADNPLIDDPFAEP
+ LVRAVGIDFFTRWAAGNIKATDVDDPDGTWGLQRLADLLAARTRYFDAFFRDATSAGI
+ RQAVILASGLDARAYR"
+ gene complement(2133721..2134332)
+ /locus_tag="BQ2027_MB1923C"
+ CDS complement(2133721..2134332)
+ /locus_tag="BQ2027_MB1923C"
+ /note="Mb1923c, -, len: 203 aa. Equivalent to Rv1890c,
+ len: 203 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 203 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1923c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00527.1"
+ /db_xref="InterPro:IPR007372"
+ /db_xref="InterPro:IPR036761"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y011"
+ /translation="MAHKTRREGRAGRSSEYSRGVSDAVWTLDASDGELVLRTGVVGR
+ AARLGHRLTIAMTRWQALVNWSGTDPVAGELVAEVDSFEVMRGEGGVKGLSEPEKALV
+ RANALKTLNASRFPHIRFTTEAIAQTGNGYRLTGKLHIRGKSREHVIDLHTEDLGAAW
+ RISADTTVRQSNYGVKPYSLLMGSIRVADEVSVAFTAVRAKDD"
+ gene 2134386..2134793
+ /locus_tag="BQ2027_MB1924"
+ CDS 2134386..2134793
+ /locus_tag="BQ2027_MB1924"
+ /note="Mb1924, -, len: 135 aa. Equivalent to Rv1891, len:
+ 135 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 135 aa overlap). Conserved
+ hypothetical protein. Equivalent to MLCB561.09|AL049571
+ hypothetical protein from Mycobacterium leprae (134 aa),
+ FASTA scores: opt: 800, E(): 0, (79.7% identity in 133 aa
+ overlap). Mb1924 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="putative membrane protein"
+ /protein_id="SIU00528.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZL9"
+ /translation="MIRELVTTAAITGAAIGGAPVAGADPQRYDGDVPGMNYDASLGA
+ PCSSWERFIFGRGPSGQAEACHFPPPNQFPPAETGYWVISYPLYGVQQVGAPCPKPQA
+ AAQSPDGLPMLCLGARGWQPGWFTGAGFFPPEP"
+ gene 2134810..2135121
+ /locus_tag="BQ2027_MB1925"
+ CDS 2134810..2135121
+ /locus_tag="BQ2027_MB1925"
+ /note="Mb1925, -, len: 103 aa. Equivalent to Rv1892, len:
+ 103 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 103 aa overlap). Probable membrane
+ protein. Mb1925 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE PROTEIN"
+ /protein_id="SIU00529.1"
+ /db_xref="GOA:A0A1R3XZP7"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZP7"
+ /translation="MIMCEGRPTESPIPRWLRFVLTSDRAGSAWYIGAGFFFAPVLAV
+ LSPWPTITAVLWWIIGLAGLWLGLLGIAMAVGLARVLRSGAEIPEAYWRTLVDYRSAN
+ E"
+ gene 2135131..2135349
+ /locus_tag="BQ2027_MB1926"
+ CDS 2135131..2135349
+ /locus_tag="BQ2027_MB1926"
+ /note="Mb1926, -, len: 72 aa. Equivalent to Rv1893, len:
+ 72 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 72 aa overlap). Conserved hypothetical
+ protein. Equivalent to MLCB561.11|AL049571 hypothetical
+ protein from Mycobacterium leprae (74 aa), FASTA scores:
+ opt: 317, E(): 4.6e-15, (69.4% identity in 72 aa overlap).
+ Protein product from Mb1926 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1926 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00530.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZN1"
+ /translation="MSFNPKDAVDAVRDIAANAVEKASDIVENAGHIIRGDIAGGASG
+ IVKDSIDIATHAVDRTKEVFTGKTDDEG"
+ gene complement(2135384..2136514)
+ /locus_tag="BQ2027_MB1927C"
+ CDS complement(2135384..2136514)
+ /locus_tag="BQ2027_MB1927C"
+ /note="Mb1927c, -, len: 376 aa. Equivalent to Rv1894c,
+ len: 376 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 376 aa overlap). Conserved
+ hypothetical protein, weak similarity to some
+ oxidoreductases e.g. Q01284 2-NITROPROPANE DIOXYGENASE
+ PRECURSOR (378 aa), FASTA results: opt: 204, E(): 5.8e-06,
+ (34.3% identity in 140 aa overlap). Similar to
+ hypothetical Mycobacterium tuberculosis proteins e.g.
+ Rv3553|MTCY03C7.02c (355 aa), FASTA results: opt: 296,
+ E(): 1.6e-10, (32.9% identity in 167 aa overlap); Rv1533
+ (375 aa) (48.1% identity in 376 aa overlap); Rv0021c,
+ Rv2781c. Protein product from Mb1927c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1927c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative oxidoreductase, nitronate monooxygenase
+ family"
+ /protein_id="SIU00531.1"
+ /db_xref="GOA:A0A1R3XZM5"
+ /db_xref="InterPro:IPR004136"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZM5"
+ /translation="MHTAICDELGIEFPIFAFTHCRDVVVAVSKAGGFGVLGAVGFTP
+ EQLEIELNWIDEHIGDHPYGVDIVIPNKYEGMDSQLSADELAKTLRSMVPQEHLDFAR
+ KILADHGVPVEDADEDSLQLLGWTEATATPQVDAALKHPKMTMVANALGTPPADMIKH
+ IHDSGRKVAALCGSPSQARKHADAGVDIIIAQGGEAGGHCGEVGSIVLWPQVVKEVAP
+ VPVLAAGGIGSGQQIAAALALGTQGAWTGSQWLMVEEAANTAVQQAAYVKATSRDTVR
+ SRSFTGKPARMLRNDWTEAWEQPESPKPLGMPLQYMVSGMAVKATHKYPNETVDVAFN
+ PVGQVVGQFTKVEKTATVIERWVQEYLEATARLDALNAAASV"
+ gene 2137166..2137489
+ /locus_tag="BQ2027_MB1928"
+ CDS 2137166..2137489
+ /locus_tag="BQ2027_MB1928"
+ /note="Mb1928, -, len: 107 aa. Equivalent to 5' end of
+ Rv1895, len: 384 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 96 aa overlap). Possible
+ dehydrogenase (EC 1.1.-.-), similar to various sorbitol
+ and alcohol dehydrogenases, and to putative
+ glutathione-dependent aldehyde dehydrogenase e.g
+ DHSO_BACSU|Q06004 Sorbitol dehydrogenase (EC 1.1.1.14)
+ from Streptomyces coelicolor (352 aa), FASTA results: opt:
+ 506, E(): 7.2e-24, (30.6% identity in 350 aa overlap); and
+ AL109962|SCJ1.28 PUTATIVE ZINC-CONTAINING DEHYDROGENASE
+ from Streptomyces coelicolor (356 aa), FASTA results: opt:
+ 634, E(): 2.9e-30, (34.7% identity in 357 aa overlap).
+ Also similar to other Mycobacterium tuberculosis
+ dehydrogenases. Note that there is a substantial (134 bp)
+ overlap at the C-terminus with the C-terminus of the
+ downstream ORF, although both appear to be true coding
+ regions. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1895 exists as a single gene.
+ In Mycobacterium bovis, two frameshifts due to a single
+ base deletion (a-*) and a single base insertion (*-t),
+ consecutively, splits Rv1895 into 2 main parts, Mb1928 and
+ Mb1929. Mb1928 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE DEHYDROGENASE [FIRST PART]"
+ /protein_id="SIU00532.1"
+ /db_xref="GOA:A0A1R3XZP1"
+ /db_xref="InterPro:IPR002328"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZP1"
+ /translation="MRAVVIDGAGSVRVNTQPDPALPGPDGVVVAVTAAGICGSDLHF
+ YEGEYPFTEPVALGHEAVGTIVEAGPQVRTVGVGDLVMVSSVAGCGVCPGCEPMIQSC
+ ASPAR"
+ gene 2137486..2138190
+ /locus_tag="BQ2027_MB1929"
+ CDS 2137486..2138190
+ /locus_tag="BQ2027_MB1929"
+ /note="Mb1929, -, len: 234 aa. Equivalent to middle part
+ of Rv1895, len: 384 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (97.9% identity in 234 aa overlap). Possible
+ dehydrogenase (EC 1.1.-.-), similar to various sorbitol
+ and alcohol dehydrogenases, and to putative
+ glutathione-dependent aldehyde dehydrogenase e.g
+ DHSO_BACSU|Q06004 Sorbitol dehydrogenase (EC 1.1.1.14)
+ from Streptomyces coelicolor (352 aa), FASTA results: opt:
+ 506, E(): 7.2e-24, (30.6% identity in 350 aa overlap); and
+ AL109962|SCJ1.28 PUTATIVE ZINC-CONTAINING DEHYDROGENASE
+ from Streptomyces coelicolor (356 aa), FASTA results: opt:
+ 634, E(): 2.9e-30, (34.7% identity in 357 aa overlap).
+ Also similar to other Mycobacterium tuberculosis
+ dehydrogenases. ****Note that there is a substantial (134
+ bp) overlap at the C-terminus with the C-terminus of the
+ downstream ORF, although both appear to be true coding
+ regions. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv1895 exists as a single gene.
+ In Mycobacterium bovis, two frameshifts due to a single
+ base deletion (a-*) and a single base insertion (*-t),
+ consecutively, splits Rv1895 into 2 main parts, Mb1928 and
+ Mb1929."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE DEHYDROGENASE [SECOND PART]"
+ /protein_id="SIU00533.1"
+ /db_xref="GOA:A0A1R3XZM8"
+ /db_xref="InterPro:IPR013149"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZM8"
+ /translation="MIFGAGVLGGAQADLLAVPAADFQVLKIPEGITTEQALLLTDNL
+ ATGWAAAQRADISFGSAVAVIGLGAVGLCALRSAFIHGAATVFAVDRVKGRLQRAATW
+ GATPIPSPAAETILAATRGRGADSVIDAVGTDASMSDALNAVRPGGTVSVVGVHDLQP
+ FPLPALTCLLRSITLRMTMAPVQRTWPELIPLLQSGRLDVDGIFTTTLPLDEAAKGYA
+ TARARSGEELKVLLTP"
+ gene complement(2138180..2139091)
+ /locus_tag="BQ2027_MB1931C"
+ CDS complement(2138180..2139091)
+ /locus_tag="BQ2027_MB1931C"
+ /note="Mb1931c, -, len: 303 aa. Equivalent to Rv1896c,
+ len: 303 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 303 aa overlap). Conserved
+ hypothetical protein. Similar to several (14) hypothetical
+ Mycobacterium tuberculosis proteins e.g. Rv0145|MTCI5.19
+ (317 aa), FASTA results: opt: 720, E(): 0, (41.6% identity
+ in 308 aa overlap); Q10552|YZ21_MYCTU (325 aa), opt: 689,
+ E(): 0, (40.5% identity in 304 aa overlap); Rv0726c,
+ Rv0731c, Rv3399, etc. and to related proteins in other
+ actinomycetes. Note that there is a substantial (134 bp)
+ overlap at the C-terminus with the C-terminus of the
+ downstream ORF, although both appear to be true coding
+ regions. Protein product from Mb1931c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1931c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="O-methyltransferase"
+ /protein_id="SIU00534.1"
+ /db_xref="GOA:Q7TZC0"
+ /db_xref="InterPro:IPR007213"
+ /db_xref="InterPro:IPR011610"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZC0"
+ /translation="MTTPEYGSLRSDDDHWDIVSNVGYTALLVAGWRALHTTGPKPLV
+ QDEYAKHFITASADPYLEGLLANPRTSEDGTAFPRLYGVQTRFFDDFFNCADEAGIRQ
+ AVIVAAGLDCRAYRLDWQPGTTVFEIDVPKVLEFKARVLSERGAVPKAHRVAVPADLR
+ TDWPTPLTAAGFDPQRPSAWSVEGLLPYLTGDAQYALFARIDELCAPGSRVALGALGS
+ RLDHEQLAALETAHPGVNMSGDVNFSALTYDDKTDPVEWLVEHGWAVDPVRSTLELQV
+ GYGLTPPDVDVKIDSFMRSQYITAVRA"
+ gene complement(2139096..2139527)
+ /gene="dtd"
+ /locus_tag="BQ2027_MB1932C"
+ CDS complement(2139096..2139527)
+ /gene="dtd"
+ /locus_tag="BQ2027_MB1932C"
+ /EC_number="3.1.1.96"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1932c, -, len: 143 aa. Equivalent to Rv1897c,
+ len: 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 143 aa overlap). Conserved
+ hypothetical protein. Some similarity to D63706|Q54235
+ ORF2 from Streptomyces griseus (149 aa), FASTA results:
+ opt: 509, E(): 1.2e-28, (57.3% identity in 150 aa
+ overlap); and Q45303 ORF1 PROTEIN from Corynebacterium
+ glutamicum (144 aa), FASTA results: opt: 460, E():
+ 5.5e-23, (49.7% identity in 143 aa overlap). Mb1932c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="D-aminoacyl-tRNA deacylase (EC"
+ /protein_id="SIU00535.1"
+ /db_xref="GOA:P63996"
+ /db_xref="InterPro:IPR003732"
+ /db_xref="InterPro:IPR023509"
+ /db_xref="UniProtKB/Swiss-Prot:P63996"
+ /translation="MRVLVQRVSSAAVRVDGRVVGAIRPDGQGLVAFVGVTHGDDLDK
+ ARRLAEKLWNLRVLADEKSASDMHAPILVISQFTLYADTAKGRRPSWNAAAPGAVAQP
+ LIAAFAAALRQLGAHVEAGVFGAHMQVELVNDGPVTVMLEG"
+ gene 2139585..2139893
+ /locus_tag="BQ2027_MB1933"
+ CDS 2139585..2139893
+ /locus_tag="BQ2027_MB1933"
+ /note="Mb1933, -, len: 102 aa. Equivalent to Rv1898, len:
+ 102 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 102 aa overlap). Conserved
+ hypothetical protein, some similarity to other
+ hypothetical proteins e.g. Q58452 from METHANOCOCCUS
+ JANNASCH II (100 aa), FASTA results: opt: 152, E():
+ 9.1e-05, (31.5% identity in 92 aa overlap); and
+ AE000771|AE000771_2 from Aquifex aeolicus (157 aa), FASTA
+ results: opt: 246, E(): 3.2e-11, (39.0% identity in 100 aa
+ overlap). Protein product from Mb1933 detected using SWATH
+ mass spectrometry. Mb1933 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ExtraCellular Mutant; Ecm15p"
+ /protein_id="SIU00536.1"
+ /db_xref="InterPro:IPR002767"
+ /db_xref="InterPro:IPR029756"
+ /db_xref="UniProtKB/Swiss-Prot:P67120"
+ /translation="MSVLVAFSVTPLGVGEGVGEIVTEAIRVVRDSGLPNQTDAMFTV
+ IEGDTWAEVMAVVQRAVEAVAARAPRVSAVIKVDWRPGVTDAMTQKVATVERYLLRPE
+ "
+ gene complement(2139859..2140935)
+ /gene="lppD"
+ /locus_tag="BQ2027_MB1934C"
+ CDS complement(2139859..2140935)
+ /gene="lppD"
+ /locus_tag="BQ2027_MB1934C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1934c, lppD, len: 358 aa. Similar to Rv1899c,
+ len: 343 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (95.5% identity in 358 aa overlap). Possible lipoprotein;
+ contains appropriately localized lipoprotein lipid
+ attachment site (PS00013). Some similarity to C-terminal
+ part of AE000717|AE000717_4 hypothetical protein from
+ Aquifex aeolicus section 49 (165 aa), FASTA results: opt:
+ 372, E(): 2.3e-14, (43.5% identity in 147 aa overlap); and
+ Q44020 4-hydroxybutyrate dehydrogenase (173 aa), FASTA
+ results: opt: 272, E(): 4.7e-09, (35.8% identity in 165 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a 45 bp in-frame insertion leads to a longer
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (358 aa versus 343 aa). Protein
+ product from Mb1934c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1934c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE LIPOPROTEIN LPPD"
+ /protein_id="SIU00537.1"
+ /db_xref="InterPro:IPR002589"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZB9"
+ /translation="MSRAAGLPRLSWFAGLTWFAGGSTGAGCAAHPALAGLTAGARCP
+ AYAAISASTARPAATALPAVAASTARPAATAGTTPATGASGSARPTDAAGMADLARPG
+ VVATHAVRTLGTTGSRAIGLCPCQPLDCPRSPQATPNLGSMGRSLDGPQWRRARVRLC
+ GRWWRRSNTTRGASPRPPSTCRGDNVSMIELEVHQADVTKLELDAITNAANTRLRHAG
+ GVAAAIARAGGPELQRESTEKAPIGLGEAVETTAGDMPARYVIHAATMELGGPTSGEI
+ ITAATAATLRKADELGCRSLALVAFGTGVGGFPLDDAARLMVGAVRRHRPGSLQRVVF
+ AVHGDAAERAFSAAIQAGEDTARR"
+ gene complement(2140935..2142323)
+ /gene="lipJ"
+ /locus_tag="BQ2027_MB1935C"
+ CDS complement(2140935..2142323)
+ /gene="lipJ"
+ /locus_tag="BQ2027_MB1935C"
+ /note="Mb1935c, lipJ, len: 462 aa. Equivalent to Rv1900c,
+ len: 462 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 462 aa overlap). Probable lipJ, lignin
+ peroxidase, with some similarity to esterases, hydrolases
+ and hypothetical Mycobacterium tuberculosis proteins e.g.
+ Q43936 BETA-KETOADIPATE ENOL-LACTONE HYDROLASE from
+ Acinetobacter calcoaceticus (267 aa), FASTA results: opt:
+ 217, E(): 1.7e-07, (29.2% identity in 260 aa overlap).
+ Also similar to other Mycobacterium tuberculosis
+ hypothetical proteins e.g. Rv2212|Q10400|YM12_MYCTU (378
+ aa), FASTA results: opt: 216, E(): 6.7e-07, (27.7%
+ identity in 285 aa overlap). Protein product from Mb1935c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1935c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIGNIN PEROXIDASE LIPJ"
+ /protein_id="SIU00538.1"
+ /db_xref="GOA:A0A1R3XZM9"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZM9"
+ /translation="MAQAPHIHRTRYAKCGDMDIAYQVLGDGPTDLLVLPGPFVPIDS
+ IDDEPSLYRFHRRLASFSRVIRLDHRGVGLSSRLAAITTLGPKFWAQDAIAVMDAVGC
+ EQATIFAPSFHAMNGLVLAADYPERVRSLIVVNGSARPLWAPDYPVGAQVRRADPFLT
+ VALEPDAVEQGFDVLSIVAPTVAGDDVFRAWWDLAGNRAGPPSMARAVSKVIAEADVR
+ DVLGHIEAPTLILHRVGSTYIPVGHGRYLAEHIAGSRLVELPGTDTLYWVGDTGPMLD
+ EIEEFITGVRGGADAERMLATIMFTDIVGSTQHAAALGDDRWRDLLDNHDTIVCHEIQ
+ RFGGREVNTAGDGFVATFTSPSAAIACADDIVDAVAALGIEVRIGIHAGEVEVRDASH
+ GTDVAGVAVHIGARVCALAGPSEVLVSSTVRDIVAGSRHRFAERGEQELKGVPGRWRL
+ CVLMRDDATRTR"
+ gene 2142352..2143644
+ /gene="cinA"
+ /locus_tag="BQ2027_MB1936"
+ CDS 2142352..2143644
+ /gene="cinA"
+ /locus_tag="BQ2027_MB1936"
+ /note="Mb1936, cinA, len: 430 aa. Equivalent to Rv1901,
+ len: 430 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 430 aa overlap). Probable cinA-like
+ protein, strong similarity to competence damage proteins
+ CinA of Bacillus subtilis and S. pneumoniae. FASTA
+ results: Q55760 HYPOTHETICAL 44.7 KD PROTEIN (416 aa) opt:
+ 755, E(): 0, (36.0% identity in 433 aa overlap). Protein
+ product from Mb1936 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1936 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CINA-LIKE PROTEIN CINA"
+ /protein_id="SIU00539.1"
+ /db_xref="InterPro:IPR001453"
+ /db_xref="InterPro:IPR008135"
+ /db_xref="InterPro:IPR008136"
+ /db_xref="InterPro:IPR036425"
+ /db_xref="InterPro:IPR036653"
+ /db_xref="UniProtKB/Swiss-Prot:P63776"
+ /translation="MAVSARAGIVITGTEVLTGRVQDRNGPWIADRLLELGVELAHIT
+ ICGDRPADIEAQLRFMAEQGVDLIVTSGGLGPTADDMTVEVVARYCGRELVLDDELEN
+ RIANILKKLMGRNPAIEPANFDSIRAANRKQAMIPAGSQVIDPVGTAPGLVVPGRPAV
+ MVLPGPPRELQPIWSKAIQTAPVQDAIAGRTTYRQETIRIFGLPESSLADTLRDAEAA
+ IPGFDLVEITTCLRRGEIEMVTRFEPNAAQVYTQLARLLRDRHGHQVYSEDGASVDEL
+ VAKLLTGRRIATAESCTAGLLAARLTDRPGSSKYVAGAVVAYSNEAKAQLLGVDPALI
+ EAHGAVSEPVAQAMAAGALQGFGADTATAITGIAGPSGGTPEKPVGTVCFTVLLDDGR
+ TTTRTVRLPGNRSDIRERSTTVAMHLLRRTLSGIPGSP"
+ gene complement(2143696..2144964)
+ /gene="nanT"
+ /locus_tag="BQ2027_MB1937C"
+ CDS complement(2143696..2144964)
+ /gene="nanT"
+ /locus_tag="BQ2027_MB1937C"
+ /note="Mb1937c, nanT, len: 422 aa. Equivalent to Rv1902c,
+ len: 422 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 422 aa overlap). Probable nanT, sialic
+ acid-transport integral membrane protein, possibly member
+ of major facilitator superfamily (MFS), similar to others
+ e.g. Q48076 SIALIC ACID TRANSPORTER (407 aa), FASTA
+ results: opt: 443, E(): 5.4e-22, (26.7% identity in 389 aa
+ overlap); etc. Some similarity to MTCI364.12|O05301
+ conserved hypothetical protein from Mycobacterium
+ tuberculosis (425 aa), FASTA results: opt: 251, E():
+ 1.1e-09, (23.5% identity in 417 aa overlap). Contains
+ sugar transport proteins signature 2 (PS00217). Mb1937c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SIALIC ACID-TRANSPORT INTEGRAL MEMBRANE
+ PROTEIN NANT"
+ /protein_id="SIU00540.1"
+ /db_xref="GOA:A0A1R3XZN8"
+ /db_xref="InterPro:IPR004742"
+ /db_xref="InterPro:IPR005828"
+ /db_xref="InterPro:IPR005829"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZN8"
+ /translation="MAAPRLTGDQRNAFMASFLGWTMDAFDYFLVVLVYADIATTFHH
+ TKTDVAFLTTATLAMRPVGALLFGLWADRVGRRVPLMVDVSFYSVIGFLCAFAPNFTV
+ LVILRLLYGIGMGGEWGLGAALSMEKVPAERRGVFSGLLQEGYAFGYLLASVAALVVM
+ NWLGLSWRWLFGLSIIPALISLIIRYRVKESEVWEAAQDRMRLTKTRIRDVLGNPAIV
+ RRFVYLVLLMTAFNWMSHGTQDVYPTFLTATTDHGAGLSSLTARWIVVIYNIGAIIGG
+ LAFGTLSQRFSRRYTIVFCAALGLPIVPLFAYSRTAAMLCLGSFLMQVFVQGAWGVIP
+ AHLTEMSPDAIRGVYPGVTYQLGNLLAAFNLPIQERLAESHGYPFALAATIVPVLLVV
+ AVLTAIGKDATGIRFGTTETAFLVRHRNRH"
+ gene 2145054..2145458
+ /locus_tag="BQ2027_MB1938"
+ CDS 2145054..2145458
+ /locus_tag="BQ2027_MB1938"
+ /note="Mb1938, -, len: 134 aa. Equivalent to Rv1903, len:
+ 134 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 134 aa overlap). Probable conserved
+ membrane protein, similar to Q53868|YPT3_STRCO
+ hypothetical 15.9 kd protein from Streptomyces coelicolor
+ (148 aa) opt: 323, E(): 1.3e-16, (42.9% identity in 126 aa
+ overlap); and equivalent to AJ000521|MLCOSL672_3 from
+ Mycobacterium leprae (139 aa), FASTA results: opt: 680,
+ E(): 0, (80.6% identity in 129 aa overlap). Protein
+ product from Mb1938 detected using SWATH mass
+ spectrometry. Mb1938 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00541.1"
+ /db_xref="GOA:A0A1R3XZN5"
+ /db_xref="InterPro:IPR007165"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZN5"
+ /translation="MVPFLMRAAVTGFALWVVTLFVPGMRFAGGDTTLQRVAIIFVVA
+ VIFGLVNAFIKPIVQILSIPLYILTLGLFHVVVNASMLWLTAWITEHTTHWGLQIDHF
+ WWTAIWAAILLSIVSWILSLLARDFRRVTRAH"
+ gene 2145644..2146075
+ /locus_tag="BQ2027_MB1939"
+ CDS 2145644..2146075
+ /locus_tag="BQ2027_MB1939"
+ /note="Mb1939, -, len: 143 aa. Equivalent to Rv1904, len:
+ 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 143 aa overlap). Conserved hypothetical
+ protein, some similarity to other hypothetical
+ Mycobacterium tuberculosis proteins e.g.
+ Rv2638|MTCY441.08|P71937 (148 aa), FASTA results: opt:
+ 456, E(): 2.7e-23, (52.8% identity in 125 aa overlap);
+ Rv1365|Q11035 (128 aa), FASTA results: opt: 393, E():
+ 1.4e-19, (48.8% identity in 123 aa overlap); and Rv3687c.
+ Also weak similarity to Q9WVX8|RSBV_STRCO ANTI-SIGMA B
+ FACTOR ANTAGONIST from Streptomyces coelicolor (113 aa).
+ Protein product from Mb1939 detected using SWATH mass
+ spectrometry. Mb1939 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Anti-sigma B factor antagonist RsbV"
+ /protein_id="SIU00542.1"
+ /db_xref="GOA:A0A1R3XZQ1"
+ /db_xref="InterPro:IPR002645"
+ /db_xref="InterPro:IPR003658"
+ /db_xref="InterPro:IPR036513"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZQ1"
+ /translation="MRTVAIGPGAGPSSTRPSSQPSDLHSGLRAVTECTGSAVVVHVG
+ GDIDASNEVAWQRLVSKSAAIAIAPGPFVIDIRDLDFMGSCAYAVLAQESVRCRRRGV
+ NMRLVSNQPIVARTIAACGLRRLIPLYAMVETALAPPPSAH"
+ gene complement(2146123..2147085)
+ /gene="aao"
+ /locus_tag="BQ2027_MB1940C"
+ CDS complement(2146123..2147085)
+ /gene="aao"
+ /locus_tag="BQ2027_MB1940C"
+ /note="Mb1940c, aao, len: 320 aa. Equivalent to Rv1905c,
+ len: 320 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 320 aa overlap). Probable aao, D-amino
+ acid oxidase (EC 1.4.3.3), similar to many. Equivalent to
+ AJ000521|MLCOSL672.02|O33145 Mycobacterium leprae (320
+ aa), FASTA results: opt: 1541, E(): 0, (71.7% identity in
+ 315 aa overlap); also similar to OXDD_BOVIN|P31228
+ d-aspartate oxidase (EC 1.4.3.1) from bos taurus (338 aa),
+ FASTA results: opt: 461, E(): 1.1e-21, (31.8% identity in
+ 321 aa overlap). Protein product from Mb1940c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1940c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable d-amino acid oxidase aao"
+ /protein_id="SIU00543.1"
+ /db_xref="GOA:A0A1R3XZP0"
+ /db_xref="InterPro:IPR006076"
+ /db_xref="InterPro:IPR023209"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZP0"
+ /translation="MAIGEQQVIVIGAGVSGLTSAICLAEAGWPVRVWAAALPQQTTS
+ AVAGAVWGPRPKEPVAKVRGWIEQSLHVFRDLAKDPATGVRMTPALSVGDRIETGAMP
+ PGLELIPDVRPADPADVPGGFRAGFHATLPMIDMPQYLDCLTQRLAATGCEIETRPLR
+ SLAEAAEAAPIVINCAGLGARELAGDATVWPRFGQHVVLTNPGLEQLFIERTGGSEWI
+ CYFAHPQRVVCGGISIPGRWDTTPEPEITERILQRCRRIQPRLAEAAVIETITGLRPD
+ RPSVRVEAEPIGRALCIHNYGHGGDGVTLSWGCAREVVNLVGGG"
+ gene complement(2147115..2147585)
+ /locus_tag="BQ2027_MB1941C"
+ CDS complement(2147115..2147585)
+ /locus_tag="BQ2027_MB1941C"
+ /note="Mb1941c, -, len: 156 aa. Equivalent to Rv1906c,
+ len: 156 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 156 aa overlap). Conserved
+ hypothetical protein, possibly exported protein,
+ equivalent to Mycobacterium leprae AJ000521|MLCOSL672.01
+ (153 aa), FASTA scores: opt: 637, E(): 2.6e-28, (63.2%
+ identity in 155 aa overlap). Also similar to M.
+ tuberculosis hypothetical exported protein, Rv1352.
+ Protein product from Mb1941c detected using SWATH mass
+ spectrometry. Mb1941c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00544.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1T0"
+ /translation="MRLKPAPSPAAAFAVAGLILAGWAGSVGLAGADPEPAPTPKTAI
+ DSDGTYAVGIDIAPGTYSSAGPVGDGTCYWKRMGNPDGALIDNALSKKPQVVTIEPTD
+ KAFKTHGCQPWQNTGSEGAAPAGVPGPEAGAQLQNQLGILNGLLGPTGGRVPQP"
+ gene complement(2147925..2148572)
+ /locus_tag="BQ2027_MB1942C"
+ CDS complement(2147925..2148572)
+ /locus_tag="BQ2027_MB1942C"
+ /note="Mb1942c, -, len: 215 aa. Equivalent to Rv1907c,
+ len: 215 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 215 aa overlap). Hypothetical unknown
+ protein. Similar to Q50763 Ethyl methane sulphonate
+ resistance protein from Mycobacterium tuberculosis (168
+ aa), FASTA scores: opt: 638, E(): 0, (69.7% identity in
+ 152 aa overlap). Downstream of a cloned katG gene
+ (EMBL:MTKATG). Differences are due to frameshift errors in
+ the EMBL sequence and the use of an earlier start codon.
+ Mb1942c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00545.1"
+ /db_xref="InterPro:IPR025358"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0H4"
+ /translation="MIGPARRSTTTRRSTPRADRLAGCWCLPGAICQTPRAWWSQARR
+ DGDDETGMRRKGAEMCWMCDHPEATAEEYLDEVYGIMLMHGWAVQHVECERRPFAYTV
+ GLTRRGLPELVVTGLSPRRGQRLLNIAARRALVGDLLTPGMQTTLPAGPLVETVQVTH
+ PDAHLYCAIAIFGDKVTALQLVWADRRGRWPWAADFDEGRGTQPVLGMRATRRSA"
+ gene complement(2148579..2150801)
+ /gene="katG"
+ /locus_tag="BQ2027_MB1943C"
+ CDS complement(2148579..2150801)
+ /gene="katG"
+ /locus_tag="BQ2027_MB1943C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1943c, katG, len: 740 aa. Equivalent to Rv1908c,
+ len: 740 aa, from Mycobacterium tuberculosis strain H37Rv
+ (99.9% identity in 740 aa overlap). katG,
+ catalase-peroxidase-peroxynitritase T (EC 1.11.1.6) (see
+ citations below), HPI. FASTA results: Q57215
+ CATALASE-PEROXIDASE from Mycobacterium tuberculosis (740
+ aa) opt: 5081, E(): 0, (100% identity in 740 aa overlap).
+ Contains peroxidases active site signature (PS00436) and
+ ATP/GTP-binding site motif A (P-loop; PS00017). Cosmid
+ sequence was corrected to agree with a sequencing read
+ from the H37Rv genome. DELETIONS OR DEFECTS IN KATG GENE
+ CAUSE ISONIAZID (INH) RESISTANCE. BELONGS TO THE
+ PEROXIDASE FAMILY. BACTERIAL PEROXIDASE/CATALASE
+ SUBFAMILY. KATG TRANSCRIPTION SEEMS TO BE REGULATED BY
+ FURA|Rv1909c PRODUCT. The catalase-peroxidase activity is
+ associated with the amino-terminal domain but no definite
+ function has been assigned to the carboxy-terminal domain.
+ Protein product from Mb1943c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1943c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CATALASE-PEROXIDASE-PEROXYNITRITASE T KATG"
+ /protein_id="SIU00546.1"
+ /db_xref="GOA:P46817"
+ /db_xref="InterPro:IPR000763"
+ /db_xref="InterPro:IPR002016"
+ /db_xref="InterPro:IPR010255"
+ /db_xref="InterPro:IPR019793"
+ /db_xref="InterPro:IPR019794"
+ /db_xref="UniProtKB/Swiss-Prot:P46817"
+ /translation="MPEQHPPITETTTGAASNGCPVVGHMKYPVEGGGNQDWWPNRLN
+ LKVLHQNPAVADPMGAAFDYAAEVATIDVDALTRDIEEVMTTSQPWWPADYGHYGPLF
+ IRMAWHAAGTYRIHDGRGGAGGGMQRFAPLNSWPDNASLDKARRLLWPVKKKYGKKLS
+ WADLIVFAGNCALESMGFKTFGFGFGRVDQWEPDEVYWGKEATWLGDERYSGKRDLEN
+ PLAAVQMGLIYVNPEGPNGNPDPMAAAVDIRETFRRMAMNDVETAALIVGGHTFGKTH
+ GAGPADLVGPEPEAAPLEQMGLGWKSSYGTGTGKDAITSGIEVVWTNTPTKWDNSFLE
+ ILYGYEWELTKSPAGAWQYTAKDGAGAGTIPDPFGGPGRSPTMLATDLSLRVDPIYER
+ ITRRWLEHPEELADEFAKAWYKLIHRDMGPVARYLGPLVPKQTLLWQDPVPAVSHDLV
+ GEAEIASLKSQILASGLTVSQLVSTAWAAASSFRGSDKRGGANGGRIRLQPQVGWEVN
+ DPDGDLRKVIRTLEEIQESFNSAAPGNIKVSFADLVVLGGCAAIEKAAKAAGHNITVP
+ FTPGRTDASQEQTDVESFAVLEPKADGFRNYLGKGNPLPAEYMLLDKANLLTLSAPEM
+ TVLVGGLRVLGANYKRLPLGVFTEASESLTNDFFVNLLDMGITWEPSPADDGTYQGKD
+ GSGKVKWTGSRVDLVFGSNSELRALVEVYGADDAQPKFVQDFVAAWDKVMNLDRFDVR
+ "
+ gene complement(2150839..2151282)
+ /gene="furA"
+ /locus_tag="BQ2027_MB1944C"
+ CDS complement(2150839..2151282)
+ /gene="furA"
+ /locus_tag="BQ2027_MB1944C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1944c, len: 147 aa. Equivalent to Rv1909c len:
+ 147 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 147 aa overlap). FurA, Ferric uptake
+ regulation protein, similar to Q48835 legionella
+ pneumophila 130B (wadsworth) ferric uptake regulation (136
+ aa), FASTA results: opt: 230, E(): 2.5e-09, (32.3%
+ identity in 133 aa overlap). Also similar to Mycobacterium
+ tuberculosis zur zinc uptake regulatory protein, Rv2359.
+ Belongs to the fur family. Start changed since original
+ submission (-3 aa). Mb1944c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Ferric uptake regulation protein FurA (fur)"
+ /protein_id="SIU00547.1"
+ /db_xref="GOA:P0A583"
+ /db_xref="InterPro:IPR002481"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P0A583"
+ /translation="MSSIPDYAEQLRTADLRVTRPRVAVLEAVNAHPHADTETIFGAV
+ RFALPDVSRQAVYDVLHALTAAGLVRKIQPSGSVARYESRVGDNHHHIVCRSCGVIAD
+ VDCAVGEAPCLTASDHNGFLLDEAEVIYWGLCPDCSISDTSRSHP"
+ gene complement(2151396..2151989)
+ /locus_tag="BQ2027_MB1945C"
+ CDS complement(2151396..2151989)
+ /locus_tag="BQ2027_MB1945C"
+ /note="Mb1945c, -, len: 197 aa. Equivalent to Rv1910c,
+ len: 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.000% identity in 197 aa overlap). Possible exported
+ protein, very similar to upstream ORF MTCY180.07 (201 aa),
+ FASTA score: E(): 0, (64.0% identity in 200 aa overlap).
+ Also similar to Q9Z729|Y877_CHLPN PROTEIN CPN0877 from
+ Chlamydophila pneumoniae (150 aa). Protein product from
+ Mb1945c detected using SWATH mass spectrometry. Mb1945c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EXPORTED PROTEIN"
+ /protein_id="SIU00548.1"
+ /db_xref="InterPro:IPR005247"
+ /db_xref="InterPro:IPR008914"
+ /db_xref="InterPro:IPR036610"
+ /db_xref="UniProtKB/Swiss-Prot:P67223"
+ /translation="MAHAFHRFALAILGLALPVALVAYGGNGDSRKAAPLAPKAAALG
+ RSMPETPTGDVLTISSPAFADGAPIPEQYTCKGANIAPPLTWSAPFGGALVVDDPDAP
+ REPYVHWIVIGIAPGAGSTADGETPGGGISLPNSSGQPAYTGPCPPAGTGTHHYRFTL
+ YHLPAVPPLAGLAGTQAARVIAQAATMQARLIGTYEG"
+ gene complement(2152072..2152677)
+ /gene="lppC"
+ /locus_tag="BQ2027_MB1946C"
+ CDS complement(2152072..2152677)
+ /gene="lppC"
+ /locus_tag="BQ2027_MB1946C"
+ /note="Mb1946c, lppC, len: 201 aa. Equivalent to Rv1911c,
+ len: 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 201 aa overlap). Probable lipoprotein
+ lppC, contains appropriately positioned prokaryotic
+ membrane lipoprotein lipid attachment site (PS00013). Very
+ similar to downstream ORF MTCY180.08 (204 aa) (although
+ this lacks lipoprotein motif), FASTA score: opt: 831, E():
+ 0, (64.0% identity in 200 aa overlap). Also similar to
+ Q9Z729|Y877_CHLPN HYPOTHETICAL PROTEIN CPN0877 from
+ Chlamydia pneumoniae (strain CWL029) (150 aa). Protein
+ product from Mb1946c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1946c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPOPROTEIN LPPC"
+ /protein_id="SIU00549.1"
+ /db_xref="GOA:P67225"
+ /db_xref="InterPro:IPR005247"
+ /db_xref="InterPro:IPR008914"
+ /db_xref="InterPro:IPR036610"
+ /db_xref="UniProtKB/Swiss-Prot:P67225"
+ /translation="MTSTLHRTPLATAGLALVVALGGCGGGGGDSRETPPYVPKATTV
+ DATTPAPAAEPLTIASPMFADGAPIPVQFSCKGANVAPPLTWSSPAGAAELALVVDDP
+ DAVGGLYVHWIVTGIAPGSGSTADGQTPAGGHSVPNSGGRQGYFGPCPPAGTGTHHYR
+ FTLYHLPVALQLPPGATGVQAAQAIAQAASGQARLVGTFEG"
+ gene complement(2152777..2153781)
+ /gene="fadB5"
+ /locus_tag="BQ2027_MB1947C"
+ CDS complement(2152777..2153781)
+ /gene="fadB5"
+ /locus_tag="BQ2027_MB1947C"
+ /note="Mb1947c, fadB5, len: 334 aa. Equivalent to Rv1912c,
+ len: 334 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 334 aa overlap). Possible fadB5,
+ oxidoreductase (EC 1.-.-.-), similar to various
+ oxidoreductases: 3-hydroxyacyl-CoA dehydrogenase (EC
+ 1.1.1.35), quinone oxidoreductases (EC 1.6.5.5), and
+ polyketide synthases, e.g. NP_104067.1|NC_002678 probable
+ oxidoreductase from Mesorhizobium loti (308 aa);
+ NP_464140.1|NC_003210 protein similar to oxidoreductase
+ from Listeria monocytogenes (313 aa);
+ NP_193889.1|NC_003075 putative NADPH quinone
+ oxidoreductase from Arabidopsis thaliana (325 aa);
+ NP_001880.2|NM_001889 crystallin, zeta; quinone
+ oxidoreductase; NADPH:quinone reductase from Homo sapiens
+ (329 aa); part 2983 to 3197 of T17410 polyketide synthase
+ type I from Streptomyces venezuelae (3739 aa);
+ Q53927|SCBAC20F6.16 HYDROXYACYL-COA DEHYDROGENASE from
+ Streptomyces coelicolor (329 aa), FASTA scores: opt: 621,
+ E(): 2e-30, (39.5% identity in 349 aa overlap); etc. Also
+ similar to many hypothetical Mycobacterium tuberculosis
+ proteins including: MTCY24G1.09, MTCY13D12.11,
+ MTCY19H9.01, MTCY24G1.03, MTCY03A2.17c, etc. Contains
+ quinone oxidoreductase/zeta-crystallin signature
+ (PS01162). Protein product from Mb1947c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1947c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXIDOREDUCTASE FADB5"
+ /protein_id="SIU00550.1"
+ /db_xref="GOA:A0A1R3XZP6"
+ /db_xref="InterPro:IPR002364"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013149"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR020843"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZP6"
+ /translation="MRAVVITKHGDPSVLQVRQRPDPPPPGPGQLRVAVRAAGVNFAD
+ HLARVGLYPDAPKLPAVVGYEVAGTVEAVGDGVDPNRVGERVLAGTRFGGYCEIVNVA
+ ATDSVVLPDALSFEQGAAVPVNYATAWAALHGYGSLRAGERVLIHAAAGGVGIAAVQF
+ AKAAKAEVHGTASPQKHQKLAEFGVDRAIDYRRDGWWQGLGPYDVVLDALGGTSLRRS
+ YTLLRPGGRLVGYGISNMQHGEKRSMRRVAPHALSMLRGFNLMKQLEESKTVIGLNML
+ RLWDDRRTLEPWIAPLTKALNDGTILPIVHAIVPFAEAPEAHRILAARENVGKVVLVP
+ "
+ gene 2153881..2154633
+ /locus_tag="BQ2027_MB1948"
+ CDS 2153881..2154633
+ /locus_tag="BQ2027_MB1948"
+ /note="Mb1948, -, len: 250 aa. Equivalent to Rv1913, len:
+ 250 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 250 aa overlap). Conserved
+ hypothetical protein, slight similarity to dehydrase and
+ beta-lactamase precursors e.g. Q02057 DEHYDRASE from
+ Streptomyces coelicolor (297 aa), FASTA scores: opt: 184,
+ E(): 4.3e-05, (31.6% identity in 215 aa overlap). Protein
+ product from Mb1948 detected using SWATH mass
+ spectrometry. Mb1948 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MBL-fold metallo-hydrolase superfamily"
+ /protein_id="SIU00551.1"
+ /db_xref="InterPro:IPR001279"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZP2"
+ /translation="MHFDWERLTDSVHRCRLPFCDVTVGLVRGRTGILLVDTGTTLGE
+ ATAIAADVKQIAGCQVTHVVLTHKHFDHVLGSSVFDQAEVFCAPEVVEYLRSATDRLR
+ EDALSYGADTAEVDRAIAALKPPQHGIYDAAVDLGDRTVTITHPGSGHTTADLVVVAP
+ ATGHADGPTVVFTGDLVEESADPDIDADSDLAAWPATLDRVLAIGGPDASYVPGHGKV
+ VDAQFVRRQRAWLRTRASRQPRETPATLPCKR"
+ gene complement(2154611..2155018)
+ /locus_tag="BQ2027_MB1949C"
+ CDS complement(2154611..2155018)
+ /locus_tag="BQ2027_MB1949C"
+ /note="Mb1949c, -, len: 135 aa. Equivalent to Rv1914c,
+ len: 135 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 135 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1949c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1949c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00552.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZS2"
+ /translation="MVLSRTSTGRVILVPTQLRFDRWFLPLAVPLGLGPKNSELWVGA
+ GSLHVKMGWAFAADIPLTSITKAEATNARVYAAGVHFGFGRWLVNGSRKGLVALTIDP
+ PEQAKMWKKSMTVRELWVSVTDPDALVTACTAK"
+ gene 2155153..2157453
+ /gene="aceA"
+ /locus_tag="BQ2027_MB1950"
+ CDS 2155153..2157453
+ /gene="aceA"
+ /locus_tag="BQ2027_MB1950"
+ /note="Mb1950, aceA, len: 766 aa. Similar to Rv1915 and
+ Rv1916, len: 367 aa and 398 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (89.1% identity in 339 aa
+ overlap and 100.0% identity in 398 aa overlap). Probable
+ aceA, isocitrate lyase (EC 4.1.3.1). Contains PS00161
+ Isocitrate lyase signature. REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium tuberculosis strain H37Rv, aceAa and
+ aceAb exist as 2 genes. In Mycobacterium bovis, a single
+ base insertion (*-t) leads to a single product. Protein
+ product from Mb1950 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1950 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable isocitrate lyase aceab [second part]
+ (isocitrase) (isocitratase) (icl)"
+ /protein_id="SIU00553.1"
+ /db_xref="GOA:Q7TZA8"
+ /db_xref="InterPro:IPR006254"
+ /db_xref="InterPro:IPR015813"
+ /db_xref="InterPro:IPR018523"
+ /db_xref="InterPro:IPR039556"
+ /db_xref="InterPro:IPR040442"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZA8"
+ /translation="MAIAETDTEVHTPFEQDFEKDVAATQRYFDSSRFAGIIRLYTAR
+ QVVEQRGTIPVDHIVAREAAGAFYERLRELFAARKSITTFGPYSPGQAVSMKRMGIEA
+ IYLGGWATSAKGSSTEDPGPDLASYPLSQVPDDAAVLVRALLTADRNQHYLRLQMSER
+ QRAATPAYDFRPFIIADADTGHGGDPHVRNLIRRFVEVGVPGYHIEDQRPGTKKCGHQ
+ GGKVLVPSDEQIKRLNAARFQLDIMRVPGIIVARTDAEAANLIDSRADERDQPFLLGA
+ TKLDVPSYKSCFLAMVRRFYELGVKELNGHLLYALGDSEYAAAGGWLERQGIFGLVSD
+ AVNAWREDGQQSIDGIFDQVESRFVAAWEDDAGLMTYGEAVADVLEFGQSEGEPIGMA
+ PEEWRAFAARASLHAARAKAKELGADPPWDCELAKTPEGYYQIRGGIPYAIAKSLAAA
+ PFADILWMETKTADLADARQFAEAIHAEFPDQMLAYNLSPSFNWDTTGMTDEEMRRFP
+ EELGKMGFVFNFITYGGHQIDGVAAEEFATALRQDGMLALARLQRKMRLVESPYRTPQ
+ TLVGGPRSDAALAASSGRTATTKAMGKGSTQHQHLVQTEVPRKLLEEWLAMWSGHYQL
+ KDKLRVQLRPQRAGSEVLELGIHGESDDKLANVIFQPIQDRRGRTILLVRDQNTFGAE
+ LRQKRLMTLIHLWLVHRFKAQAVHYVTPTDDNLYQTSKMKSHGIFTEVNQEVGEIIVA
+ EVNHPRIAELLTPDRVALRKLITKEA"
+ gene complement(2157623..2163355)
+ /gene="PPE34"
+ /locus_tag="BQ2027_MB1951C"
+ CDS complement(2157623..2163355)
+ /gene="PPE34"
+ /locus_tag="BQ2027_MB1951C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1951c, PPE34, len: 1910 aa. Similar to Rv1917c,
+ len: 1459 aa, from Mycobacterium tuberculosis strain
+ H37Rv. Member of the Mycobacterium tuberculosis PPE family
+ of glycine-rich proteins, MPTR subfamily (see citation
+ below). Similar to MTCY28.16, MTCY13E10.17, MTCY63.10,
+ MTV004.05, MTCY98.24, MTCY6G11.05, etc. C-terminus is
+ identical to Q50471. Unknown Mycobacterium tuberculosis
+ protein (693 aa), FASTA results: opt: 2635, E(): 0, (99.7%
+ identity in 391 aa overlap). Start changed since original
+ submission (+23 aa). Thougth to be surface exposed,
+ cell-wall associated. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, deletions of 12 bp and 69 bp,
+ insertions of 483 bp and 375 bp, and a large substitution
+ of 52 bp to 628 bp, leads to a longer product compared to
+ the homolog in Mycobacterium tuberculosis strain H37Rv
+ (1910 aa versus 1459 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe34"
+ /protein_id="SIU00554.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR002989"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1U1"
+ /translation="MNFSTLPPEINSALIFGGAGSEPMSAAAVAWDQLAMELASAAAS
+ FNSVTSGLVGESWLGPSSAAMAAAVAPYLGWLAAAAAQAQRSATQAAALVAEFEAVRA
+ AMVQPALVAANRSDLVSLVFSNFFGQNAPAIAAIEAAYEQMWAIDVSVMSAYHAGASA
+ VASALTPFTAPPQNLTDLPAQLAAAPAAVVTAAITSSKGVLANLSLGLANSGFGQMGA
+ ANLGILNLGSLNPGGNNFGLGNVGSNNVGLGNTGNGNIGFGNTGNGNIGFGLTGDNQQ
+ GFGGWNSGTGNIGLFNSGTGNIGIGNTGTGNFGIGNSGTSYNTGIGNTGQANTGFFNA
+ GIANTGIGNTGNYNTGSFNLGSFNTGDFNTGSSNTGFFNPGNLNTGVGNTGNVNTGGF
+ NSGNYSNGFFWRGDYQGLIGFSGTLTIPAAGLDLNGLGSVGPITIPSITIPEIGLGIN
+ SSGALVGPINVPPITVPAIGLGVSSSGALVGPINVPPITVPAIGLGVSSSGALVGPIN
+ VPPITVPAIGLGVSSSGALVGPINVPPITVPAIGLGVSSSGALVGPINVPPITVPAIG
+ LGVSSSGALVGPINVPPITVPAIGLGVSSSGALVGPINVPPITVPAIGLGVSSSGALV
+ GPINVPPITVPAIGLGVSSSGALVGPINVPPITVPAIGLGVSSSGALVGPINVPPITL
+ NSIGLELSAFQVINVGSISIPASPLAIGLFGVNPTVGSIGPGSISIQLGTPEIPAIPP
+ FFPGFPPDYVTVSGQIGPITFLSGGYSLPAIPLGIDVGGGLGPFTVFPDGYSLPAIPL
+ GIDVGGGLGPFTVFPDGYSLPAIPLGIDVGGGLGPFTVFPDGYSLPAIPLGIDVGGGL
+ GPFTVFPDGYSLPAIPLGIDVGGGLGPFTVFPDGYSLPAIPLGIDVGGGLGPFTVFPD
+ GYSLPAIPLGIDVGGGLGPFTVFPDGYSLPAIPLGIDVGGGLGPFTVFPDGYSLPAIP
+ LGIDVGGAIGPLTTPPITIPAIPLGIDVSGSLGPINIPIEIAGTPGFGNSTTTPSSGF
+ FNSGTGGTSGFGNVGSGGSGFWNIAGNLGNSGFLNVGPLTSGILNFGNTVSGLYNTST
+ LGLATSAFHSGVGNTDSQLAGFMRNAAGGTLFNFGFANDGTLNLGNANLGDYNVGSGN
+ VGSYNFGSGNIGNGSFGFGNIGSNNFGFGNVGSNNLGFANTGPGLTEALHNIGFGNIG
+ GNNYGFANIGNGNIGFGNTGTGNIGIGLTGDNQVGFGALNSGSGNIGFFNSGNGNIGF
+ FNSGNGNVGIGNSGNYNTGLGNVGNANTGLFNTGNVNTGIGNAGSYNTGSYNAGDTNT
+ GDLNPGNANTGYLNLGDLNTGWGNIGDLNTGALISGSYSNGILWRGDYQGLIGYSDTL
+ SIPAIPLSVEVNGGIGPIVVPDITIPGIPLSLNALGGVGPIVVPDITIPGIPLSLNAL
+ GGVGPIVVPDITIPGIPLSLNALGGVGPIVVPDITIPGIPLSLNALGGVGPITVPGVP
+ ISRIPLTINIRIPVNITLNELPFNVAGIFTGYIGPIPLSTFVLGVTLAGGTLESGIQG
+ FSVNPFGLNIPLSGATNAVTIPGFAINPFGLNVPLSGGTSPVTIPGFAINPFGLDVPL
+ SGGTNAVTIPGFAINPFGLDVPLSGGTSPVTIPGFAINPFGLDVPLSGGTNAVTIPGF
+ AINPFGLDVPLSGGTNAVTIPGFAINPFGLDVPLSGGTSPVTIPGFAINPFDLNVPLS
+ GGTNAVTIPGFAINPFGLNVPLSGGTSPVTIPGFAINPFGLNVPLSGGTSPVTIPGFT
+ IPGSPLNLTANGGLGPINITSAPGFGNSTTTPSSGFFNSGDGSASGFGNVGPGISGLW
+ NQVPNALQGGVSGIYNVGQLASGVANLGNTVSGFNNTSTVGHLTAAFNSGVNNIGQML
+ LGFFSPGAGP"
+ gene complement(2163693..2164697)
+ /gene="PPE35b"
+ /locus_tag="BQ2027_MB1952C"
+ CDS complement(2163693..2164697)
+ /gene="PPE35b"
+ /locus_tag="BQ2027_MB1952C"
+ /note="Mb1952c, PPE35b, len: 334 aa. Equivalent to 3' end
+ of Rv1918c, len: 987 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.1% identity in 334 aa overlap). Member
+ of the Mycobacterium tuberculosis PPE family of
+ glycine-rich proteins. Similar to MTCY28.16|Z95890 M.
+ tuberculosis cosmid (1053 aa), FASTA scores: opt: 3404,
+ E(): 0, (65.6% identity in 1058 aa overlap). Also similar
+ to MTV004.05, MTY13E10.17, MTV014.03, MTCY3C7.23,
+ MTCY6G11.05, MTCY48.17, MTV004.03, MTCY31.07, MTCY4C12.36,
+ MTCY180.01, etc. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, PPE35 exists as a
+ single gene. In Mycobacterium bovis, a frameshift due to a
+ single base insertion (*-t) splits PPE35 into 2 parts,
+ PPE35a and PPE35b. Mb1952c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PPE FAMILY PROTEIN"
+ /protein_id="SIU00555.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0I4"
+ /translation="MVVFIPNNITALQTNMPGVFPQIGGFANTPPAFINTGTITVGGG
+ QINGVGFSIGAINVTPFTLPNVVIQPWSLGGISVDGFTLPEISTQEFTTPALTISPIG
+ VGALSLPDIITQQFTTPELTIDPITLGGFTLPQLSIPAITTPAFTIDPIALGGFTLPQ
+ IMTPEITTPPFAIDPIGLSGFTLPQVNIPEITTPEFTIQPVGLAAFTTPALTIARIHL
+ PSTTMGGFAIPAGPGYFNSSATPSSGFFNAGIGGNSGFGNSGSGLSGWFNTSPVGLLA
+ GSGYQNYGGLISGFSNLGSGISGFANTGTLPFAVTSLVSGLANIGNNLSGLFFQSTTP
+ "
+ gene complement(2164780..2166657)
+ /gene="PPE35a"
+ /locus_tag="BQ2027_MB1953C"
+ CDS complement(2164780..2166657)
+ /gene="PPE35a"
+ /locus_tag="BQ2027_MB1953C"
+ /note="Mb1953c, PPE35a, len: 625 aa. Equivalent to 5'end
+ of Rv1918c, len: 987 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 599 aa overlap). Member
+ of the Mycobacterium tuberculosis PPE family of
+ glycine-rich proteins. Similar to MTCY28.16|Z95890 M.
+ tuberculosis cosmid (1053 aa), FASTA scores: opt: 3404,
+ E(): 0, (65.6% identity in 1058 aa overlap). Also similar
+ to MTV004.05, MTY13E10.17, MTV014.03, MTCY3C7.23,
+ MTCY6G11.05, MTCY48.17, MTV004.03, MTCY31.07, MTCY4C12.36,
+ MTCY180.01, etc. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, PPE35 exists as a
+ single gene. In Mycobacterium bovis, a frameshift due to a
+ single base insertion (*-t) splits PPE35 into 2 parts,
+ PPE35a and PPE35b. Mb1953c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PPE FAMILY PROTEIN"
+ /protein_id="SIU00556.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR002989"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZR2"
+ /translation="MHYSVLPPEINSALIFAGAGSGPMLAAASAWDGLATELASAAVS
+ FGSVTAGLVGGSWQGRSSVAMAAAAAPYAGWLAAAATQAEQAATQAQVMVAEFEAVRL
+ AMVQPALVAANRSGLISLVISNLFGQNAPAIAAAEAAYEEMWALDVSAMAAYHSGASA
+ VAVALPAFALPLRLPAGLAAGPAAVVTALTTAVGMPTFAGRAIAASLGLANVGGGNLG
+ NANNGLGNIGNANLGNNNLGSGNFGSFNIGSANLGGNNIGIGNAGANNFGLANLGNLN
+ TGFANAGIGNFGIANTGNNNIGNGLTGNNQIGIGGLNSGNGNVGLFNAGSANIGFFNS
+ GNGNFGIGNSGNFSTGLFNPGHGNTGFLNAGSFNTGMFDVGNANTGSFNVGHYNFGAF
+ NPGPSNTGTFNTGGANTGWFNTGSINTGAFNIGDMNNGLFNTGDMNNGVFYRGVGQGS
+ LQFAITSPDLTLPSLEIPGISVPAFSLPAITLPSLTIPAVTTPANVTVGAFDLPGLTV
+ PSLTIPAAMTPANITVGAFDLPGLTVPSLTIPATTTPANITVGAFNLPQLSIPSVTVP
+ PITIPAGTALGAFNLPTLSIPSVTVPPITIPAGNHCRRIYATHDTHPVNKYTPNKYRR
+ L"
+ gene complement(2167106..2167570)
+ /locus_tag="BQ2027_MB1954C"
+ CDS complement(2167106..2167570)
+ /locus_tag="BQ2027_MB1954C"
+ /note="Mb1954c, -, len: 154 aa. Equivalent to Rv1919c,
+ len: 154 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 154 aa overlap). Conserved
+ hypothetical protein, shows weak similarity to several
+ major pollen antigens e.g. Z72431|BVGC25_1 MAJOR ALLERGEN
+ BET V 1 from Betula verrucosa (160 aa), FASTA scores: opt:
+ 133, E(): 0.012, (26.8% identity in 149 aa overlap). Also
+ shows some similarity to Rv2574|MTCY227.27C Hypothetical
+ protein from Mycobacterium tuberculosis (167 aa), (27.4%
+ identity in 124 aa overlap). Protein product from Mb1954c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb1954c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00557.1"
+ /db_xref="InterPro:IPR019587"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y050"
+ /translation="MSGRKFSFEVTKTSSAPAATLFRLVTDGGNWATWAKPIVAQSSW
+ ARRGDPAPGGIGAIRKLGMWPVFVQEETVEYEQDRRHVYKLVGARTPVQDYFGEVVLT
+ PNASGGTDLRWSGSFTEKVRGTGPVMRAALGGAVRFFAGQLVKAAEREAVRR"
+ gene 2167668..2168531
+ /locus_tag="BQ2027_MB1955"
+ CDS 2167668..2168531
+ /locus_tag="BQ2027_MB1955"
+ /note="Mb1955, -, len: 287 aa. Equivalent to Rv1920, len:
+ 287 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 287 aa overlap). Probable membrane
+ protein, similar to AL0215|SC10A5.04 putative membrane
+ protein from Streptomyces coelicolor cosmid 10A5 (295 aa),
+ FASTA scores: opt: 292, E(): 3.6e-13, (31.3% identity in
+ 243 aa overlap). Also weakly similar to several
+ Mycobacterial putative proteins with unknown function e.g.
+ Rv0502, Rv1428c, U00018_22 Mycobacterium leprae cosmid
+ B2168. Protein product from Mb1955 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb1955
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE MEMBRANE PROTEIN"
+ /protein_id="SIU00558.1"
+ /db_xref="GOA:A0A1R3XZR3"
+ /db_xref="InterPro:IPR002123"
+ /db_xref="InterPro:IPR016676"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZR3"
+ /translation="MFPRWPQQAHNHEVSRADTVSVPRAPTQAEVAAVLRIMTPLRKV
+ IKPKVYGIENVPTERALLVGNHNTLGLVDAPLLAAELWERGRIVRSLGDHAHFKIPGW
+ RDALTRTGVVEGTREITSELMRRGELVIVFPGGAREVNKRKNERYKLVWKNRLGFARL
+ AIQHGYPIVPFASVGAEHGIDIVLDNESPLLAPVQFLAEKLLGTKDGPALVRGVGLTP
+ VPRPERQYYWFGEPIDTTEFMGQQADDNAARRVRERAAAAIEHGIELMLAERAADPNR
+ SLVGRLLRSDA"
+ gene complement(2168569..2169840)
+ /gene="lppF"
+ /locus_tag="BQ2027_MB1956C"
+ CDS complement(2168569..2169840)
+ /gene="lppF"
+ /locus_tag="BQ2027_MB1956C"
+ /note="Mb1956c, lppF, len: 423 aa. Equivalent to Rv1921c,
+ len: 423 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 423 aa overlap). Probable lppF,
+ conserved lipoprotein, similar to G403173 lipoprotein
+ precursor (fragment) from Rhodococcus erythropolis (225
+ aa), fasta scores: opt: 364, E(): 9.2e-19, (41.9% identity
+ in 148 aa overlap). Contains PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN LPPF"
+ /protein_id="SIU00559.1"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZS0"
+ /translation="MVRLIPSLLAMATVLGGVIGCSAHQPPTPASGCRQLDAFLKWHH
+ GVREFLQSAIDANSRCTGTADGSARKVAIFDWDNTVVKNDIGYATNYYMLQHSLVLQP
+ ANQDWHAASRYLTDAAANALSVACGKVVPAGKPLPTGSNALCANEILSLLDGETTTGQ
+ PAFVGNNVRRLAGPYAWSNALSAGYTAEELAGFADQAKKQNLAADVGATQQVGTQQVD
+ GYIRVYPQMKDLIGTLQAHGIDTWVVSASPEPIVKVWAGEVGLDDQHVVGVRSVADQS
+ GKLTAHLVGCGGVRDGDDSVMTYLDGKRCWANQVIFGVTGPQAFNQLAADRRQVLAAG
+ DSNSDATFVGDATVVSLVINRNQDDLMCRAYDGLFTRGGKWAINPMFIDPLPQHAPYV
+ CGEAFINPDGSKQPVLRNDGTPIPDQVDSVF"
+ gene 2170112..2171227
+ /locus_tag="BQ2027_MB1957"
+ CDS 2170112..2171227
+ /locus_tag="BQ2027_MB1957"
+ /note="Mb1957, -, len: 371 aa. Equivalent to Rv1922, len:
+ 371 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 371 aa overlap). Probable conserved
+ lipoprotein, possibly peptidase (EC 3.4.-.-) similar to
+ many peptidases, e.g. P15555|DAC_STRSQ D-alanyl-D-alanine
+ carboxypeptidase from Streptomyces sp. (406 aa), FASTA
+ scores: opt: 382, E(): 3.1e-17, (28.0% identity in 379 aa
+ overlap). Also similar to Mycobacterium tuberculosis
+ hypothetical proteins Rv1497, Rv2463, Rv3775, etc.
+ Contains PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Protein product from Mb1957 detected
+ using SWATH mass spectrometry. Mb1957 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN"
+ /protein_id="SIU00560.1"
+ /db_xref="InterPro:IPR001466"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZQ7"
+ /translation="MDSTVTASIRRMLGLLAATLLLGGCTGQHTTRTAASTTYTPHIK
+ ASSQDVLDGAINADEPGCSAAVGVEGKVIWSGVRGIADLASGAKITTDTVFDIASVSK
+ QFTATAILLLVEAGKLTLDDPISQYVPELPDWAQTVTVEQLMHQTSGIPDYVALLAAR
+ GYQVSDRTIEAEARQALAAAPELQFKPGTRFDYSNSNYLLLGEIVHRASGQPLPEFLS
+ AEIFQPLGLAMVVDPVGKVPNKAVSYEKGTGGNRSEYRVGNPAWEQIGDGGIQTTPSQ
+ LARWADNYRTGSVGGLKLLEAQLAGAVETEPGGGDRYGAGIVSRADGTLDHAGAWAGF
+ VTAFHISSDRRTSVAISCNTDKPDPVAMADALGRLWM"
+ gene 2171218..2172558
+ /gene="lipD"
+ /locus_tag="BQ2027_MB1958"
+ CDS 2171218..2172558
+ /gene="lipD"
+ /locus_tag="BQ2027_MB1958"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1958, lipD, len: 446 aa. Equivalent to Rv1923,
+ len: 446 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 446 aa overlap). Probable lipD,
+ hydrolase lipase (EC 3.1.-.-), similar to esterases and
+ beta-lactamases e.g. G151214 esterase, (389 aa), fasta
+ scores: opt: 569, E(): 5.4e-29, (33.7% identity in 401 aa
+ overlap). Also similar to Mycobacterium tuberculosis
+ hypothetical proteins Rv1497, Rv2463, Rv3775, etc. Protein
+ product from Mb1958 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1958 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPASE LIPD"
+ /protein_id="SIU00561.1"
+ /db_xref="InterPro:IPR001466"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZP8"
+ /translation="MDVAGLPRLAAGTQAAIIHGMAQPPSLLTTDNGLPFGVQGACDS
+ RFTGVIRAFAGLYPGRKFGGGALSVYIDDRQVVDVWTGWSDRQGKVPWTADTGAMVFS
+ ATKGLAATVIHRLVDRGLLSYDAPVAEYWPEFGANGKSEVTVSDVLRHRSGLAHLKGV
+ DKDEVMDHLLMEQKLAAAPLNRQHGKLAYHAVTYGWLLSGLARAVTGKGMRELFREEL
+ ARPLNTDGIHLGRPPADSPTKAAQTLLPQAKVPTPLLDFIAPKVAGLSFSGLLGAVYF
+ PGILSLLQDDMPFLDGEVPAVNGVVTARALAKTYGALANDGVIDGTRLLSSQAVRGLT
+ GKSELWPDLNLGLPFTYHQGYQSSPVPGLLEGYGHIGLGGTIGWADPETGSAFGYVHN
+ RLLTLLLFDIGSFAGLAALLNSAVVAARRDDPLEVPHFGAPYSEPRHEQAASGA"
+ gene complement(2172595..2172975)
+ /locus_tag="BQ2027_MB1959C"
+ CDS complement(2172595..2172975)
+ /locus_tag="BQ2027_MB1959C"
+ /note="Mb1959c, -, len: 126 aa. Equivalent to Rv1924c,
+ len: 126 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 126 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1959c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1959c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00562.1"
+ /db_xref="GOA:A0A1R3XZT1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZT1"
+ /translation="MDPADVINPTSTRDAALARVLAYRQRVRARPLLIRATLAVVGGG
+ LFVVSLPMIVLLPELGIPALLVAFRLLAVEAQWAVRAYAWTDWRFTQLREWFHRQVLV
+ TRAAILVGLFLAAVALVWLLVYEF"
+ gene 2173132..2174994
+ /gene="fadD31"
+ /locus_tag="BQ2027_MB1960"
+ CDS 2173132..2174994
+ /gene="fadD31"
+ /locus_tag="BQ2027_MB1960"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1960, fadD31, len: 620 aa. Equivalent to Rv1925,
+ len: 620 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 620 aa overlap). Probable fadD31,
+ acyl-CoA synthetase (EC 6.2.1.-), highly similar to others
+ from Mycobacterium leprae e.g. NP_301198.1|NC_002677
+ putative acyl-CoA synthetase (635 aa);
+ NP_302537.1|NC_002677 probable acyl-CoA synthase (583 aa);
+ etc. Also highly similar to others from Mycobacterium
+ tuberculosis e.g. fadD32 (637 aa); fadD21 (578 aa); fadD29
+ (619 aa); fadD26|FD26_MYCTU|Q10976 (626 aa), FASTA scores:
+ opt: 945, E(): 0, (39.8% identity in 598 aa overlap); etc.
+ Also similar to N-terminus of G1171128 SAFRAMYCIN MX1
+ SYNTHETASE B from Myxococcus xanthus (1770 aa), FASTA
+ scores: opt: 845, E(): 0, (37.4% identity in 593 aa
+ overlap); N-terminus of T34918 polyketide synthase from
+ Streptomyces coelicolor (2297 aa); etc. Protein product
+ from Mb1960 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb1960 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA LIGASE FADD31 (ACYL-COA
+ SYNTHETASE) (ACYL-COA SYNTHASE)"
+ /protein_id="SIU00563.1"
+ /db_xref="GOA:A0A1R3XZQ8"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR040097"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZQ8"
+ /translation="MNDGSRQELRVRSGLLQIEDCLDADGGIALPAGTTLISLIERNI
+ KYVGDLVAYRYLDHARSAAGCALEVTWTQFGMRLAAIGAHVQRFAGPGDRVAILAPQG
+ IDYVCGFYAAIKAGTVAVPLFAPELPGHAERLDTALRDSEPAVILTTAAAKNAVEGFL
+ NNVPRLRKPTVLVIDQIPDREGELFVPVELDIDAVSHLQYTSGSTRPPVGVEITHRAV
+ GTNLVQMILSIDLLNRNTHGVSWLPLYHDMGLSMIGFPAVYGGHSTLMSPTAFVRRPL
+ RWIQALSEGSRTGRVVTAAPNFAYEWAAQRGLPAQGDDVDLSNVVLIIGSEPVSIDAV
+ TTFNKAFAPYGLPRTAFKPSYGIAEATLLVATIDHAAEPTVVYLDPEQLGAGHATRVA
+ PDAPNAVVHVSCGHVARSLWAVIVDPDTGPEAGAELPDGEIGEVWLQGDNVARGYWGR
+ PEETRMTFGARLQSPLAEGSHADGSAIDDTWLRTGDLGVYLDGELYITGRIADLLTID
+ GRNHYPQDIEATAAEASPMVRRGYITAFTVPASDGDDRNQRLVIIAERAAGTSRSDPR
+ PALDAIRAAVCNRHGLSVADLSFLPAGAIPRTTSGKLARQACRAQYLSGRLGVH"
+ gene complement(2175002..2175481)
+ /gene="mpt63"
+ /locus_tag="BQ2027_MB1961C"
+ CDS complement(2175002..2175481)
+ /gene="mpt63"
+ /locus_tag="BQ2027_MB1961C"
+ /standard_name="mpb63"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1961c, mpt63, len: 159 aa. Equivalent to Rv1926c,
+ len: 159 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 159 aa overlap). mpt63 (alternate gene
+ name: mpb63), immunogenic protein (see citations below),
+ identical to MPT63|MPB63 from Mycobacterium bovis (159
+ aa). Exported protein containing a N-terminal signal
+ sequence: see notes below about proteomics. Protein
+ product from Mb1961c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1961c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="immunogenic protein mpt63 (antigen mpt63/mpb63)
+ (16 kda immunoprotective extracellular protein)"
+ /protein_id="SIU00564.1"
+ /db_xref="GOA:P0A5Q3"
+ /db_xref="InterPro:IPR015250"
+ /db_xref="InterPro:IPR029050"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Q3"
+ /translation="MKLTTMIKTAVAVVAMAAIATFAAPVALAAYPITGKLGSELTMT
+ DTVGQVVLGWKVSDLKSSTAVIPGYPVAGQVWEATATVNAIRGSVTPAVSQFNARTAD
+ GINYRVLWQAAGPDTISGATIPQGEQSTGKIYFDVTGPSPTIVAMNNGMEDLLIWEP"
+ gene 2175718..2176491
+ /locus_tag="BQ2027_MB1962"
+ CDS 2175718..2176491
+ /locus_tag="BQ2027_MB1962"
+ /note="Mb1962, -, len: 257 aa. Equivalent to Rv1927, len:
+ 257 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 257 aa overlap). Conserved
+ hypothetical protein, similar to SCG11A.10c|AL133210
+ hypothetical protein from Streptomyces coelicolor (252
+ aa), FASTA scores: opt: 729, E(): 0, (48.3% identity in
+ 238 aa overlap). Slight similarity with P54543|YQJF_BACSU
+ hypothetical 23.9 kd protein from Bacillus subtilis (209
+ aa), FASTA scores, opt: 230, E(): 2.8e-08, (28.0% identity
+ in 164 aa overlap). Protein product from Mb1962 detected
+ using SWATH mass spectrometry. Mb1962 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00565.1"
+ /db_xref="InterPro:IPR018644"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0J4"
+ /translation="MTAIPGPSGAEPGESRALAGYPVTPPALPRPVIFDQRWTDLTFI
+ HWPVLPESVAGSYPPGTRPDVFADGMTYVGLVPFRMSSTKLGTALPIPYVGTFPETNV
+ RLYSIDNAGRHGVLFRSLETARLTVVPLTRIGLGIPYAWSRMRMMRSGKHITYHSVRR
+ WPRRGLRSLLTITIGDLVEPTPLEVWLTARWGAHTRKAGRTWWVPNEHKPWPLRAAEI
+ AELNDELIDASGVQPTGDRLRALFSPGVHARFGRPCVVQ"
+ gene complement(2176495..2177262)
+ /locus_tag="BQ2027_MB1963C"
+ CDS complement(2176495..2177262)
+ /locus_tag="BQ2027_MB1963C"
+ /note="Mb1963c, -, len: 255 aa. Equivalent to Rv1928c,
+ len: 255 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 255 aa overlap). Probable short-chain
+ dehydrogenase/reductase (EC 1.-.-.-), highly similar to
+ others e.g. NP_228109.1|NC_000853 oxidoreductase (short
+ chain dehydrogenase/reductase family) from Thermotoga
+ maritima (257 aa); T41116 short chain dehydrogenase from
+ Schizosaccharomyces pombe (261 aa); P87219|SOU1_CANAL
+ SORBITOL UTILIZATION PROTEIN (SDR FAMILY) from Candida
+ albicans (281 aa); P25529|HDHA_ECOLI
+ 7-alpha-hydroxysteroid dehydrogenase from Escherichia coli
+ (255 aa), FASTA scores: opt: 541, E(): 1.2e-27, (37.5%
+ identity in 251 aa overlap); etc. Also similar to many
+ mycobacterial tuberculosis proteins e.g. Rv1350, Rv0927c,
+ Rv2002, Rv0769, Rv2766c, etc. Contains PS00061 Short-chain
+ alcohol dehydrogenase family signature. BELONGS TO THE
+ SHORT-CHAIN DEHYDROGENASES/REDUCTASES (SDR) FAMILY.
+ Protein product from Mb1963c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1963c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SHORT-CHAIN TYPE
+ DEHYDROGENASE/REDUCTASE"
+ /protein_id="SIU00566.1"
+ /db_xref="GOA:A0A1R3XZS7"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZS7"
+ /translation="MSVLDLFDLHGKRALITGASTGIGKRVALAYVEAGAQVAIAARH
+ LDALEKLADEIGTSGGKVVPVCCDVSQHQQVTSMLDQVTAELGGIDIAVCNAGIITVT
+ PMLDMPLEEFQRLQNTNVTGVFLTAQAAAKAMVKQGQGGVIINTASMSGHIINVPQQV
+ SHYCASKAAVIHLTKAMAVELAPHKIRVNSVSPGYILTELVEPYTEYQPLWEPKIPLG
+ RLGRPEELAGLYLYLASEASSYMTGSDIVIDGGYTCP"
+ gene complement(2177307..2177951)
+ /locus_tag="BQ2027_MB1964C"
+ CDS complement(2177307..2177951)
+ /locus_tag="BQ2027_MB1964C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1964c, -, len: 214 aa. Equivalent to Rv1929c,
+ len: 214 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.533% identity in 214 aa overlap). Conserved
+ hypothetical protein, similar to SC4G6.14|AL096884
+ hypothetical protein from Streptomyces coelicolor (211
+ aa), FASTA scores: opt: 416, E(): 2.4e-22, (39.8% identity
+ in 206 aa overlap). Protein product from Mb1964c detected
+ using SWATH mass spectrometry. Mb1964c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00567.1"
+ /db_xref="InterPro:IPR017517"
+ /db_xref="InterPro:IPR017519"
+ /db_xref="InterPro:IPR034660"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y060"
+ /translation="MADVPLDAQERLELCDLLEELGPAVATLIEGWTAHDLAAHIVLR
+ ERDLVAGLCIVLPGPFQRFAERRRARLAQSKDFTWLVARIRSGPPMGFFRIGWVRTLA
+ NLNEFFVHHEDVRRASGRGPRSLTPEMDAALWRNVRRGSHFLSRRLHGCGLEIEWVGT
+ GKRVRVRSGEPTARLTGPPGELLLYVFGRRAVARVEVSGPLEAIAAVHRTHFGM"
+ gene complement(2177963..2178487)
+ /locus_tag="BQ2027_MB1965C"
+ CDS complement(2177963..2178487)
+ /locus_tag="BQ2027_MB1965C"
+ /note="Mb1965c, -, len: 174 aa. Equivalent to Rv1930c,
+ len: 174 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.000% identity in 174 aa overlap). Conserved
+ hypothetical protein, similar to SC5F2A.30|AL049587
+ hypothetical protein from Streptomyces coelicolor (211
+ aa), FASTA scores: opt: 307, E(): 2.8e-13, (54.8% identity
+ in 84 aa overlap). Some similarity to M. tuber culosis
+ hypothetical protein Rv0052|MTCY21D4.15 (43% identity in
+ 93 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative intracellular protease/amidase"
+ /protein_id="SIU00568.1"
+ /db_xref="InterPro:IPR029062"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZR9"
+ /translation="MTQIAFVAYPGVTALDVVGPYEVLRNLPHAQVRFVWLRGRRATS
+ HWLTLPALKAFGAIPVADERIVHQDNIVTSAGVSAGLDLALWLAGQLGGEARAKAIQL
+ AIEYDPQPPFDSGHMSKASPTTKAAATALLSKDSAKPANLTAATLLAWERALAAVQSR
+ RRKRQPVGAQARRP"
+ gene complement(2178505..2179284)
+ /locus_tag="BQ2027_MB1966C"
+ CDS complement(2178505..2179284)
+ /locus_tag="BQ2027_MB1966C"
+ /note="Mb1966c, -, len: 259 aa. Equivalent to Rv1931c,
+ len: 259 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 259 aa overlap). Probable
+ transcriptional regulatory protein. Similarity in
+ C-terminal half to transcriptional activators e.g. Q43970
+ ARAC-LIKE PROTEIN (227 aa), FASTA scores: opt: 238, E():
+ 7.1e-07, (42.4% identity in 92 aa overlap). Similar to
+ many probable transcription regulators in Streptomyces
+ e.g. AL049587|SC5F2A.29 Streptomyces coelicolor (325 aa),
+ FASTA scores: opt: 387, E(): 3.2e-16, (34.4% identity in
+ 259 aa overlap). Mb1966c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00569.1"
+ /db_xref="GOA:A0A1R3XZS8"
+ /db_xref="InterPro:IPR002818"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR018060"
+ /db_xref="InterPro:IPR029062"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZS8"
+ /translation="MVIVGFPGDPVDTVILPGGAGVDAARSEPALIDWVKAVSGTARR
+ VVTVCTGAFLAAEAGLLGRTPSDDALGLCRTFRPRISGRSGRCRPDLHAQFAEGVDRG
+ WSHRRHRPRAGTGRRRPRHRDCPDGCPLARPVSAPTRWADPVRGSGVDATRQTDLDPP
+ GAGGHRGRAGGAHRIGELAQRAAMSPRHFTRVFSDEVGEAPGRYVERIRTEAARRQLE
+ ETHDTVVAIAARCGFGTAETMRRSFIRRVGISPDQYRKAFA"
+ gene 2179417..2179914
+ /gene="tpx"
+ /locus_tag="BQ2027_MB1967"
+ CDS 2179417..2179914
+ /gene="tpx"
+ /locus_tag="BQ2027_MB1967"
+ /standard_name="cfp20"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1967, tpx, len: 165 aa. Equivalent to Rv1932,
+ len: 165 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 165 aa overlap). Probable tpx
+ (alternate gene name: cfp20), thiol peroxidase (EC
+ 1.11.1.-) similar to TPX_ECOLI|P37901 thiol peroxidase (EC
+ 1.11.1.-) (p20) from Escherichia coli (167 aa), fasta
+ scores: opt: 535, E(): 7.3e-25, (52.4% identity in 164 aa
+ overlap). There are four other related enzymes in M.
+ tuberculosis: Rv2428, Rv2521, Rv2238c, Rv1608c. Protein
+ product from Mb1967 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1967 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE THIOL PEROXIDASE TPX"
+ /protein_id="SIU00570.1"
+ /db_xref="GOA:P66953"
+ /db_xref="InterPro:IPR002065"
+ /db_xref="InterPro:IPR013740"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR018219"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/Swiss-Prot:P66953"
+ /translation="MAQITLRGNAINTVGELPAVGSPAPAFTLTGGDLGVISSDQFRG
+ KSVLLNIFPSVDTPVCATSVRTFDERAAASGATVLCVSKDLPFAQKRFCGAEGTENVM
+ PASAFRDSFGEDYGVTIADGPMAGLLARAIVVIGADGNVAYTELVPEIAQEPNYEAAL
+ AALGA"
+ gene complement(2179911..2181002)
+ /gene="fadE18"
+ /locus_tag="BQ2027_MB1968C"
+ CDS complement(2179911..2181002)
+ /gene="fadE18"
+ /locus_tag="BQ2027_MB1968C"
+ /note="Mb1968c, fadE18, len: 363 aa. Equivalent to
+ Rv1933c, len: 363 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 363 aa overlap).
+ Probable fadE18, acyl-CoA dehydrogenase (EC 1.3.99.-),
+ similar to many e.g. CAB61609.1|AL133210 putative acyl-CoA
+ dehydrogenase from Streptomyces coelicolor (362 aa);
+ NP_421282.1|NC_002696 acyl-CoA dehydrogenase family
+ protein from Caulobacter crescentus (344 aa);
+ ACDS_RAT|P15651 short-chain specific acyl-CoA
+ dehydrogenase from Rattus norvegicus (Rat) (412 aa), fasta
+ scores: opt: 239, E(): 2.1e-08, (28.4% identity in 331 aa
+ overlap); etc. Also similar to others from Mycobacterium
+ tuberculosis e.g. N-terminus of fadE22 (721 aa); fadE33
+ (318 aa); N-terminus of fadE34 (711 aa); etc. COULD BELONG
+ TO THE ACYL-COA DEHYDROGENASES FAMILY."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE18"
+ /protein_id="SIU00571.1"
+ /db_xref="GOA:A0A1R3XZR1"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR013786"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR037069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZR1"
+ /translation="MDFRYSTEQDDFRASLRGFLGRGAPVREMAAADGSDRRLWQRLC
+ TELELPALHVPPEHGGLGATLVETAIAFAELGRALTPIPFAATVFAIEAILRMGDDEQ
+ RKRLLAGLLTGARIGTIAVSGHDVASATTVRAVRRDGRPALTGECTPVLHGHVADLFV
+ VPAVADGSIVLHVVAADAPGVTVTPLPSFDITRPVATLRLAGSPAEPLTAGTPDDMER
+ VLDVARVLLAAEMLGGAEACLDLAVQYAGRRTQFDRPIGSFQAVKHACADMMIEIDAT
+ RATVMFAAMSAANGDELQTVAPLAKAQTAETFVLCAGSALQIHGAIAFTWEHDLHLYY
+ RRAKTTEALFGSSARNRALLAERAGLVKA"
+ gene complement(2181004..2182233)
+ /gene="fadE17"
+ /locus_tag="BQ2027_MB1969C"
+ CDS complement(2181004..2182233)
+ /gene="fadE17"
+ /locus_tag="BQ2027_MB1969C"
+ /note="Mb1969c, fadE17, len: 409 aa. Equivalent to
+ Rv1934c, len: 409 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 409 aa overlap).
+ Probable fadE17, acyl-CoA dehydrogenase (EC 1.3.99.-),
+ highly similar to ACD_MYCLE|P46703 acyl-CoA dehydrogenase
+ from Mycobacterium leprae (389 aa), FASTA scores: opt:
+ 414, E(): 2.6e-19, (28.3% identity in 407 aa overlap).
+ Also similar to many e.g. NP_249713.1|NC_002516 probable
+ acyl-CoA dehydrogenase from Pseudomonas aeruginosa (381
+ aa); NP_420614.1|NC_002696 acyl-CoA dehydrogenase family
+ protein from Caulobacter crescentus (355 aa);
+ CAB61610.1|AL133210 putative acyl-CoA dehydrogenase from
+ Streptomyces coelicolor (393 aa); etc. Also similar to
+ others from Mycobacterium tuberculosis e.g. fadE30 (385
+ aa); fadE31 (377 aa); C-terminus of fadE34 (711 aa); etc.
+ COULD BELONG TO THE ACYL-COA DEHYDROGENASES FAMILY."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ACYL-COA DEHYDROGENASE FADE17"
+ /protein_id="SIU00572.1"
+ /db_xref="GOA:A0A1R3XZU2"
+ /db_xref="InterPro:IPR006091"
+ /db_xref="InterPro:IPR009075"
+ /db_xref="InterPro:IPR009100"
+ /db_xref="InterPro:IPR013786"
+ /db_xref="InterPro:IPR036250"
+ /db_xref="InterPro:IPR037069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZU2"
+ /translation="MDVSYPPEAEAFRDRIREFVAEHLPPGWPGPGALPPHEREEFAR
+ HWRRALAGAGLVAVSWPTEYGGGGLSPMEQVVLAEEFARAGAPERAENDLLGIDLLGN
+ TLIALGSEAQKRHFLPRILSGEHRWCQGFSEPEAGSDLASVRTRGVLDGDEWVINGHK
+ IWTSAGTTANWIFLLARTDPSAAKHRGLSFLLVPMDQPGVVVRPIVNAAGHSSFSEVF
+ LTDARTSAGNVVGRVGDGWSTAMTLLGFERGSHIATAAIDFERDLQRLCELARDRGLH
+ TDPRVRDGLAWCYARVQIMRYRGYRDLTLALTGRPPGAEAAITKVIWSEYFRRYTDLA
+ VEILGLEALGPRGPGNGGARLVPEAGTPNSPACWMDELLYARAATIYAGSSQIQRNVI
+ GERLLGLPKEPRPEVLC"
+ gene complement(2182248..2183204)
+ /gene="echA13"
+ /locus_tag="BQ2027_MB1970C"
+ CDS complement(2182248..2183204)
+ /gene="echA13"
+ /locus_tag="BQ2027_MB1970C"
+ /note="Mb1970c, echA13, len: 318 aa. Equivalent to
+ Rv1935c, len: 318 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 318 aa overlap).
+ Possible echA13, enoyl-CoA hydratase (EC 4.2.1.17),
+ similar to others and various enzymes e.g.
+ CAC48381.1|Y16952 putative enoyl-CoA-isomerase from
+ Amycolatopsis mediterranei (269 aa);
+ AAK18173.1|AF290950_5|AF290950|FadB1x enoyl-CoA hydratase
+ from Pseudomonas putida (257 aa); AAF78820.1|AF042490
+ 4-chlorobenzoyl CoA dehalogenase from Arthrobacter sp. TM1
+ (276 aa); ECHM_RAT|P14604 enoyl-coa hydratase
+ mitochondrial precursor from Rattus norvegicus (Rat) (290
+ aa), FASTA scores: opt: 228, E(): 1.2e-08, (31.0% identity
+ in 258 aa overlap); etc."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE ENOYL-COA HYDRATASE ECHA13 (ENOYL
+ HYDRASE) (UNSATURATED ACYL-COA HYDRATASE) (CROTONASE)"
+ /protein_id="SIU00573.1"
+ /db_xref="GOA:A0A1R3XZR7"
+ /db_xref="InterPro:IPR001753"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZR7"
+ /translation="MFVGRVGPVDRRSDGERSRRPREFEYIRYETIDDGRIAAITLDR
+ PKQRNAQTRGMLVELGAAFELAEADDTVRVVILRAAGPAFSAGHDLGSADDIRERSPG
+ PDQHPSYRCNGATFGGVESRNRQEWHYYFENTKRWRNLRKITIAQVHGAVLSAGLMLA
+ WCCDLIVASEDTVFADVVGTRLGMCGVEYFGHPWEFGPRKTKELLLTGDCIGADEAHA
+ LGMVSKVFPADELATSTIEFARRIAKVPTMAALLIKESVNQTVDAMGFSAALDGCFKI
+ HQLNHAHWGEVTGGKLSYGTVEYGLEDWRAAPQIRPAIKQRP"
+ gene 2183429..2184538
+ /locus_tag="BQ2027_MB1971"
+ CDS 2183429..2184538
+ /locus_tag="BQ2027_MB1971"
+ /note="Mb1971, -, len: 369 aa. Equivalent to Rv1936, len:
+ 369 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 369 aa overlap). Possible
+ monooxygenase (EC 1.-.-.-), similar to LXA2_PHOLU|P23146
+ alkanal monooxygenase alpha chain (362 aa), FASTA scores:
+ opt: 196, E(): 6.3e-06, (22.3% identity in 373 aa
+ overlap). Also similar to many other Mycobacterium
+ tuberculosis hypothetical oxidoreductases and
+ monooxygenases e.g. Rv0953c, Rv0791c, Rv0132c, etc.
+ Protein product from Mb1971 detected using SWATH mass
+ spectrometry. Mb1971 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MONOOXYGENASE"
+ /protein_id="SIU00574.1"
+ /db_xref="GOA:A0A1R3Y1V8"
+ /db_xref="InterPro:IPR011251"
+ /db_xref="InterPro:IPR036661"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1V8"
+ /translation="MEIGIFLMPAHPPERTLYDATRWDLDVIELADQLGYVEAWVGEH
+ FTVPWEPICAPDLLLAQALLRTQQIKLAPGAHLLPYHHPVELAHRVAYFDHLAQGRFM
+ LGVGASGIPGDWALYDVDGKNGEHREMTREALEIMLRIWTEDEPWEHRGKYWNANGIA
+ PMFEGLMRRHIKPYQKPHPPIGVTGFSAGSETLKLAGERGYIPMSLDLNTEYVATHWD
+ AVEEGALRSGRTPDRRDWRLVREVLVAETDEQAFRYAVDGTMGRAMREYVLPTFRMFG
+ MTKFYKHNPSVPDDEVTPEYLAENTFVVGSVQTVVDKLEATYDQVGGFGHLLILGFDY
+ SDNPGPWKESLRLLAHEVMPRLNARLATKPATAVV"
+ gene 2184541..2187060
+ /locus_tag="BQ2027_MB1972"
+ CDS 2184541..2187060
+ /locus_tag="BQ2027_MB1972"
+ /note="Mb1972, -, len: 839 aa. Equivalent to Rv1937, len:
+ 839 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 839 aa overlap). Possible oxygenase
+ (EC 1.-.-.-), similar in N-terminus to N-terminal part
+ (approx. 350 aa) of dioxygenases (including
+ ring-hydroxylating dioxygenase electron transfer
+ components) and monooxygenases, e.g. AAC34815.1|AF071556
+ anthranilate dioxygenase reductase from Acinetobacter sp.
+ (343 aa); AAK52291.1|AY026914|AntC putative anthranilate
+ dioxygenase reductase from Pseudomonas putida (340 aa);
+ AAF63450.1|AF218267_7|AF218267 benzoate dioxygenase /
+ ferredoxin reductase from Pseudomonas putida (336 aa);
+ P23101|XYLZ_PSEPU toluate 1,2-dioxygenase electron
+ transfer component [INCLUDES: FERREDOXIN;
+ FERREDOXIN--NAD(+) REDUCTASE (EC 1.18.1.3)] from
+ Pseudomonas putida plasmid TOL pWW0 (336 aa), FASTA
+ scores: opt: 700, E(): 0, (34.3% identity in 335 aa
+ overlap); S23479 probable benzoate 1,2-dioxygenase (EC
+ 1.14.12.10) reductase component benC from Acinetobacter
+ calcoaceticus (338 aa); AAC45294.1|U81594 soluble methane
+ monooxygenase protein C from Methylocystis sp. (343 aa);
+ P22868|MEMC_METCA METHANE MONOOXYGENASE COMPONENT C from
+ Methylococcus capsulatus (348 aa); etc. Also similar in
+ part to Mycobacterium tuberculosis hypothetical electron
+ transfer proteins Rv3554, Rv3571, etc. Contains PS00197
+ 2Fe-2S ferredoxins, iron-sulfur binding region signature."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE OXYGENASE"
+ /protein_id="SIU00575.1"
+ /db_xref="GOA:A0A1R3Y0K2"
+ /db_xref="InterPro:IPR001041"
+ /db_xref="InterPro:IPR001433"
+ /db_xref="InterPro:IPR006058"
+ /db_xref="InterPro:IPR008333"
+ /db_xref="InterPro:IPR012675"
+ /db_xref="InterPro:IPR017927"
+ /db_xref="InterPro:IPR017938"
+ /db_xref="InterPro:IPR036010"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="InterPro:IPR039261"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0K2"
+ /translation="MAVRQVTVGYSDGTHKTMPVRCDQTVLDAAEEHGVAIVNECQSG
+ ICGTCVATCTAGRYQMGRTEGLSDVERAARKILTCQTFVTSDCRIELQYPVDDNAALL
+ VTGDGVVTAVELVSPSTAILRVDTSGMAGALRYRAGQFAQLQVPGTNVWRNYSYAHPA
+ DGRGECEFIIRLLPDGVMSNYLRDRAQPGDHIALRCSKGSFYLRPIVRPVILVAGGTG
+ LSAILAMAQSLDADVAHPVYLLYGVERTEDLCKLDELTELRRRVGRLEVHVVVARPDP
+ DWDGRTGLVTDLLDERMLASGDADVYLCGPVAMVDAARTWLDHNGFHRVGLYYEKFVA
+ SGAARRRTPARLDYAGVDIAEVCRRGRGTAVVIGGSIAGIAAAKMLSETFDRVIVLEK
+ DGPHRRREGRPGAAQGWHLHHLLTAGQIELERIFPGIVDDMVREGAFKVDMAAQYRIR
+ LGGTWKKPGTSDIEIVCAGRPLLEWCVRRRLDDEPRIDFRYESEVADLAFDRANNAIV
+ GVAVDNGDADGGDGLQVVPAEFVVDASGKNTRVPEFLERLGVGAPEAEQDIINCFYST
+ MQHRVPPERRWQDKVMVICYAYRPFEDTYAAQYYTDSSRTILSTSLVAYNCYSPPRTA
+ REFRAFADLMPSPVIGENIDGLEPASPIYNFRYPNMLRLRYEKKRNLPRALLAVGDAY
+ TSADPVSGLGMSLALKEVREMQALLAKYGAGHRDLPRRYYRAIAKMADTAWFVIREQN
+ LRFDWMKDVDKKRPFYFGVLTWYMDRVLELVHDDLDAYREFLAVVHLVKPPSALMRPR
+ IASRVLGKWARTRLSGQKTLIARNYENHPIPAEPADQLVNA"
+ gene 2187072..2188142
+ /gene="ephB"
+ /locus_tag="BQ2027_MB1973"
+ CDS 2187072..2188142
+ /gene="ephB"
+ /locus_tag="BQ2027_MB1973"
+ /note="Mb1973, ephB, len: 356 aa. Equivalent to Rv1938,
+ len: 356 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 356 aa overlap). Probable ephB,
+ epoxide hydrolase (EC 3.3.2.3) (see citation below),
+ similar to many e.g. G1109600 ATSEH (EC 3.3.2.3) (321 aa),
+ FASTA scores: opt: 442, E(): 1.2e-21 (33.1% identity in
+ 356 aa overlap); etc. Also similar to many other M.
+ tuberculosis hypothetical epoxide hydrolases e.g. Rv3617,
+ Rv3670, Rv0134, etc. Protein product from Mb1973 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE EPOXIDE HYDROLASE EPHB (EPOXIDE
+ HYDRATASE)"
+ /protein_id="SIU00576.1"
+ /db_xref="GOA:A0A1R3XZT6"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR000639"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZT6"
+ /translation="MSQVHRILNCRGTRIHAVADSPPDQQGPLVVLLHGFPESWYSWR
+ HQIPALAGAGYRVVAIDQRGYGRSSKYRVQKAYRIKELVGDVVGVLDSYGAEQAFVVG
+ HDWGAPVAWTFAWLHPDRCAGVVGISVPFAGRGVIGLPGSPFGERRPSDYHLELAGPG
+ RVWYQDYFAVQDGIITEIEEDLRGWLLGLTYTVSGEGMMAATKAAVDAGVDLESMDPI
+ DVIRAGPLCMAEGARLKDAFVYPETMPAWFTEADLDFYTGEFERSGFGGPLSFYHNID
+ NDWHDLADQQGKPLTPPALFIGGQYDVGTIWGAQAIERAHEVMPNYRGTHMIADVGHW
+ IQQEAPEETNRLLLDFLGGLRP"
+ gene 2188139..2188873
+ /locus_tag="BQ2027_MB1974"
+ CDS 2188139..2188873
+ /locus_tag="BQ2027_MB1974"
+ /note="Mb1974, -, len: 244 aa. Similar to Rv1939, len: 171
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 167 aa overlap). Probable oxidoreductase (EC
+ 1.-.-.-), similar to NP_302637.1|NC_002677 probable
+ oxidoreductase from Mycobacterium leprae (162 aa) Also
+ similar to NTAB_CHELE|P54990 nitrilotriacetate
+ monooxygenase component from Chelatobacter heintzii (322
+ aa), fasta scores: opt: 269, E(): 5.3e-11, (33.1% identity
+ in 151 aa overlap). And similar to Mycobacterium
+ tuberculosis probable monooxygenase components Rv0246,
+ Rv3567, and to a lesser extent, Rv3007c.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base deletion (t-*) leads to a longer product with
+ a different COOH part compared to its homolog in
+ Mycobacterium tuberculosis H37Rv (244 aa versus 171 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXIDOREDUCTASE"
+ /protein_id="SIU00577.1"
+ /db_xref="GOA:A0A1R3Y070"
+ /db_xref="InterPro:IPR002563"
+ /db_xref="InterPro:IPR012349"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y070"
+ /translation="MSCTFDMVPETVDHLDEVGLRRVFGCFPCGVIAVCAMVDDQPVG
+ MAASSFTSVSVDPPLVSICVQNCSTTWPKLRDRPRLGVSVLAEGHDAACMSLSRKEGN
+ RFAGVFWSELSSGGVVIAGAGAWLDCRPYAEIPAGDHLIALLEICAVRADPETPPLVF
+ HGSRFRRWSLDEDDRCAGTSCDHGDGGRSRRGPDRRPQWRWLSRLRRPGRDAAAGCLC
+ GPAHLGLFARRAAGRRMRATAPAAHV"
+ gene 2188650..2189711
+ /gene="ribA1"
+ /locus_tag="BQ2027_MB1975"
+ CDS 2188650..2189711
+ /gene="ribA1"
+ /locus_tag="BQ2027_MB1975"
+ /standard_name="ribA"
+ /note="Mb1975, ribA1, len: 353 aa. Equivalent to Rv1940,
+ len: 353 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 353 aa overlap). Probable ribA1,
+ Riboflavin biosynthesis protein (EC 3.5.4.25), similar to
+ GCH2_BACSU|P17620 gtp cyclohydrolase ii (EC 3.5.4.25) (398
+ aa), FASTA scores: opt: 682, E(): 0, (37.7% identity in
+ 363 aa overlap), also similar to Rv1415|MTCY21B4.33|ribA2
+ (428 aa) (45.4% identity in 368 aa overlap). Note that
+ previously known as ribA."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Riboflavin biosynthesis protein ribA1
+ (GTP cyclohydrolase II)"
+ /protein_id="SIU00578.1"
+ /db_xref="GOA:A0A1R3XZS4"
+ /db_xref="InterPro:IPR000422"
+ /db_xref="InterPro:IPR017945"
+ /db_xref="InterPro:IPR032677"
+ /db_xref="InterPro:IPR036144"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZS4"
+ /translation="MKTTDVRVRRAITAMAGGHAVVLTGDPNGDGYLVFAAQAATPRL
+ VAFAVRHTSGYLRVALPGAECERLHLPPMCDRDTTHCVSVDVRGTGTGISASDRAWTI
+ AALASATSVAADFQRPGHVVPVQAQADGVLGRRGPAEAAVDLARLAERRPAAALCEIV
+ SPDNPVQMAHHAESVEFAVEHGLAMVSIGELVAYRRRIEPQVVRFTAATLPTWAGASR
+ VIGFRDVYDLGEHLAVIVGAVGAGVPVPLHVHIECLTGDVFGSTACRCGEELNGALAR
+ MSAQGSGVVLYLRPPGPAQACGLFARGDAATDVMPETVTWILRDLGVYAIRLSDDVPG
+ FGLVMFGAIREASTLAAAG"
+ gene 2189708..2190478
+ /locus_tag="BQ2027_MB1976"
+ CDS 2189708..2190478
+ /locus_tag="BQ2027_MB1976"
+ /note="Mb1976, -, len: 256 aa. Equivalent to Rv1941, len:
+ 256 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 256 aa overlap). Probable short-chain
+ dehydrogenase/reductase (EC 1.-.-.-), similar to various
+ dehydrogenases/reductases, generally belonging to SDR
+ family, e.g. NP_299015.1|NC_002488
+ 2,5-dichloro-2,5-cyclohexadiene-1,4-diol dehydrogenase
+ from Xylella fastidiosa (255 aa); NP_250340.1|NC_002516
+ probable short-chain dehydrogenase from Pseudomonas
+ aeruginosa (253 aa); NP_106890.1|NC_002678 PROBABLE
+ SHORT-CHAIN TYPE DEHYDROGENASE/REDUCTASE from
+ Mesorhizobium loti (374 aa) (has its N-terminus longter);
+ P50197|LINC_PSEPA
+ 2,5-dichloro-2,5-cyclohexadiene-1,4-dehydrogenase from
+ Pseudomonas paucimobilis (Sphingomonas paucimobilis) (250
+ aa), FASTA scores: opt: 529, E(): 5.7e-25, (40.6% identity
+ in 251 aa overlap); etc. Contains PS00061 Short-chain
+ alcohol dehydrogenase family signature. BELONGS TO THE
+ SHORT-CHAIN DEHYDROGENASES/REDUCTASES (SDR) FAMILY. Mb1976
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SHORT-CHAIN TYPE
+ DEHYDROGENASE/REDUCTASE"
+ /protein_id="SIU00579.1"
+ /db_xref="GOA:A0A1R3XZV8"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZV8"
+ /translation="MNHPDLAGKVAIVTGAGAGIGLAVARRLADEGCHVLCADIDGDA
+ ADAAATKIGCGAAACRVDVSDEQQIIAMVDACVAAFGGVDKLVANAGVVHLASLIDTT
+ VEDFDRVIAINLRGAWLCTKHAAPRMIERGGGAIVNLSSLAGQVAVGGTGAYGMSKAG
+ IIQLSRITAAELRSSGIRSNTLLPAFVDTPMQQTAMAMFDGALGAGGARSMIARLQGR
+ MAAPEEMAGIVVFLLSDDASMITGTTQIADGGTIAALW"
+ gene complement(2190688..2191017)
+ /gene="mazf5"
+ /locus_tag="BQ2027_MB1977C"
+ CDS complement(2190688..2191017)
+ /gene="mazf5"
+ /locus_tag="BQ2027_MB1977C"
+ /note="Mb1977c, -, len: 109 aa. Equivalent to Rv1942c,
+ len: 109 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 109 aa overlap). Conserved
+ hypothetical protein, shows some similarity to
+ Q10867|MTCY39.28|Rv1991 hypothetical 12.3 kd protein (114
+ aa), FASTA scores: opt: 117, E(): 0.021, (24. 5% identity
+ in 110 aa overlap) also P33645|CHPA_ECOLI pemk-like
+ protein 1 (mazf protein) from Escherichia coli (111 aa),
+ FASTA scores: opt: 104, E(): 0.18, (29.1% identity in 110
+ aa overlap). Also similar to Mycobacterium tuberculosis
+ Rv0659c (102 aa) (32.7% identity in 101 aa overlap);
+ Rv1102c (33.3% identity in 93 aa overlap) and Rv1495.
+ Protein product from Mb1977c detected using SWATH mass
+ spectrometry. Mb1977c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin mazf5"
+ /protein_id="SIU00580.1"
+ /db_xref="GOA:A0A1R3XZS9"
+ /db_xref="InterPro:IPR003477"
+ /db_xref="InterPro:IPR011067"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZS9"
+ /translation="MTALPARGEVWWCEMAEIGRRPVVVLSRDAAIPRLRRALVAPCT
+ TTIRGLASEVVLEPGSDPIPRRSAVNLDSVESVSVAVLVNRLGRLADIRMRAICTALE
+ VAVDCSR"
+ gene complement(2191014..2191391)
+ /gene="maze5"
+ /locus_tag="BQ2027_MB1978C"
+ CDS complement(2191014..2191391)
+ /gene="maze5"
+ /locus_tag="BQ2027_MB1978C"
+ /note="Mb1978c, -, len: 125 aa. Equivalent to Rv1943c,
+ len: 125 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 125 aa overlap). Conserved
+ hypothetical protein, showing some similarity with
+ Rv1946c|MTCY09F9.18|lppG possible conserved lipoprotein
+ from Mycobacterium tuberculosis (150 aa), FASTA score:
+ (71.4% identity in 28 aa overlap). Protein product from
+ Mb1978c detected using SWATH mass spectrometry. Mb1978c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin maze5"
+ /protein_id="SIU00581.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZS3"
+ /translation="MKTARLQVTLRCAVDLINSSSDQCFARIEHVASDQADPRPGVWH
+ SSGMNRIRLSTTVDAALLTSARDMRAGITDAALIDEALAALLARHRSAEVDASYAAYD
+ KHPVDEPDEWGDLASWRRAAGDS"
+ gene complement(2191388..2191978)
+ /locus_tag="BQ2027_MB1979C"
+ CDS complement(2191388..2191978)
+ /locus_tag="BQ2027_MB1979C"
+ /note="Mb1979c, -, len: 196 aa. Equivalent to Rv1944c,
+ len: 196 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 196 aa overlap). Conserved
+ hypothetical protein, similar to C-terminal part of
+ SCE20.29|AL136058|CAB65585.1 hypothetical protein from
+ Streptomyces coelicolor (338 aa), BLASTP scores,
+ Identities = 37/131 (28%), Positives = 51/131 (38%).
+ Protein product from Mb1979c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb1979c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00582.1"
+ /db_xref="InterPro:IPR004027"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZV1"
+ /translation="MISDTEDFAHGDKAAPPRLRASYAACGGDAAGCWTMSDNGASRV
+ PPVDETPAAESAEPITAVSLAWLPAGDYERALDLWPDFAGSDLVTGPDGPVAHPLYCR
+ RMQQKLVEFAEAGFPGLAVAAIRVAPFAAWCAEQGQEPDSPEARAEYAAYLTAHGDHD
+ VMAWPPGRNQQCWCGSGHKYKKCCAAASFIDTEPAP"
+ gene 2192033..2193397
+ /locus_tag="BQ2027_MB1980"
+ CDS 2192033..2193397
+ /locus_tag="BQ2027_MB1980"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1980, -, len: 454 aa. Equivalent to Rv1945, len:
+ 454 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.780% identity in 454 aa overlap). Member of
+ Mycobacterium tuberculosis REP13E12 repeat family. Similar
+ to several others, best with Rv1148c|Z95584|MTCI65.15 (482
+ aa), FASTA score: opt: 2954, E(): 0, (97.1% identity in
+ 454 aa overlap). Contains possible helix-turn-helix motif
+ at aa 74-95 (+2.90 SD). Mb1980 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="13E12 repeat family protein"
+ /protein_id="SIU00583.1"
+ /db_xref="InterPro:IPR003615"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZS1"
+ /translation="MRSDTREEISAALDAYHASLSRVLDLKCDALTTPELLACLQRLE
+ VERRRQGAAEHALINQLAGQACEEELGGTLRTALANRLHITPGEASRRIAEAEDLGER
+ RALTGEPLPAQLTATAAAQREGKIGREHIKEIQAFFKELSAAVDLGIREAAEAQLAEL
+ ATSRRPDHLHGLATQLMDWLHPDGNFSDQERARKRGITMGKQEFDGMSRISGLLTPEL
+ RATIEAVLAKLAAPGACNPDDQTPLVDDTPDADAVRRDTRSQAQRHHDGLLAGLRGLL
+ ASGELGQHRGLPVTVVVSTTLKELEAATGKGVTGGGSRVPMSDLIRMASNAHHYLALF
+ DGAKPLALYHTKRLASPAQRIMLYAKDRGCSRPGCDAPAYHSEVHHVTPWTTTHRTDI
+ NDLTLACGPDNRLVEKGWKTRKNAKGDTEWLPPAHLDHGQPRINRYHHPEKILCEPDD
+ DEPH"
+ repeat_region 2192033..2193394
+ /locus_tag="BQ2027_MB1980"
+ /note="REP-7, len: 1362 nt. Equivalent to REP, len: 1362
+ nt, from Mycobacterium tuberculosis strain H37Rv, (99.9%
+ identity in 1362 nt overlap). REP09F9, member of the
+ REP13E12 family."
+ /rpt_family="REP"
+ gene complement(2193552..2194004)
+ /gene="lppG"
+ /locus_tag="BQ2027_MB1981C"
+ CDS complement(2193552..2194004)
+ /gene="lppG"
+ /locus_tag="BQ2027_MB1981C"
+ /note="Mb1981c, lppG, len: 150 aa. Equivalent to Rv1946c,
+ len: 150 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 150 aa overlap). Possible lppG,
+ conserved lipoprotein, showing some similarity to
+ Rv1943c|MTCY09F9.21 CONSERVED HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (125 aa), FASTA score: (71.4%
+ identity in 28 aa overlap). Contains PS00013 Prokaryotic
+ membrane lipoprotein lipid attachment site."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE LIPOPROTEIN"
+ /protein_id="SIU00584.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1W8"
+ /translation="MIRGSAVSGLLMPSVNGGTAGSVACVQCLFLPKVAVDLINLSGI
+ QCFARIEHVAHAQAHPFVVLVGKPAQHGARIGAVAGAILTGDVIVSHDGELYRTVTAL
+ RQNGPRPHASRRLHAPALCSARSRRGHLRPSCWLPPPRFAGRQSLVAR"
+ gene 2194068..2194469
+ /locus_tag="BQ2027_MB1982"
+ CDS 2194068..2194469
+ /locus_tag="BQ2027_MB1982"
+ /note="Mb1982, -, len: 133 aa. Equivalent to Rv1947, len:
+ 133 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 133 aa overlap). Hypothetical unknown
+ protein,Mb1982 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00585.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0K9"
+ /translation="MDRYNDQASGRALIEIRLCNERATPMPIPIGLWMFQTKLHVNAG
+ GADVFLPVCDVLEQDLAERDEEVRQLNLQYRNRLEYAIGRTCSAAWSVNGSRRPSAVW
+ TTWLPVAETPHTRARSVENALLSMDSRGGVT"
+ gene complement(2194758..2195108)
+ /locus_tag="BQ2027_MB1983C"
+ CDS complement(2194758..2195108)
+ /locus_tag="BQ2027_MB1983C"
+ /note="Mb1983c, -, len: 116 aa. Equivalent to Rv1948c,
+ len: 116 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.1% identity in 116 aa overlap). Hypothetical unknown
+ protein"
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00586.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZU5"
+ /translation="MTVFRIKPDNYFGDVVLAAADRDGLRIFQYAVRSAHESGQATFD
+ IDGVQQRIVRESGTADMELGSQTVVWRFDDTKLVEILDKLSPLIDGEGPGHQYIDDLN
+ SPAPTLMISVDEYA"
+ gene complement(2195119..2196021)
+ /locus_tag="BQ2027_MB1984C"
+ CDS complement(2195119..2196021)
+ /locus_tag="BQ2027_MB1984C"
+ /note="Mb1984c, -, len: 300 aa. Equivalent to Rv1949c,
+ len: 319 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 300 aa overlap). Conserved hypothetical
+ protein, partial ORF. Rv1949c and Rv1950c|MTCY09F9.14 are
+ similar but frameshifted with respect to
+ Rv2077c|MTCY49.16C|Q10685 hypothetical 33.3 kd protein
+ (323 aa), FASTA scores: opt: 459, E(): 2.8e-16, (54.8%
+ identity in 157 aa overlap). Cosmid sequence appears to be
+ correct, genomic sequence is also frameshifted in
+ Mycobacterium bovis strain AF2122/97. Similar to M.
+ tuberculosis hypothetical proteins: Rv2542, Rv2077c,
+ Rv2797c, Rv0963c, etc."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00587.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y079"
+ /translation="MRQASGLAREGAGTIGAAQRRVIYAVQDAHNAGFNVEEDLSVTD
+ TRTSRTFAEQAARQAQAQALAGDIRQRATQLIGVEHEVAAKIATATAPLNTVGFHEPP
+ IAPSLPTPVPHNEKPQIHAVDRSWKQDPPSPMPGDPKDMTAVQARAAWDAVNADIARY
+ NARCGRTFVLPNEQAAYDACIADKGSLLERQAAIRARLGELGVPVEGEPPPAPDPAGP
+ QPNEGLPPPGVSPPAESNLTVGPPSRPIQQARGGESLWDENGGEWRYFPGDNYRYPHW
+ DYNPHDSPTARWQNIPIGDLPTHK"
+ gene complement(2196042..2196233)
+ /locus_tag="BQ2027_MB1985C"
+ CDS complement(2196042..2196233)
+ /locus_tag="BQ2027_MB1985C"
+ /note="Mb1985c, -, len: 63 aa. Equivalent to Rv1950c, len:
+ 63 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 63 aa overlap). Conserved hypothetical
+ protein, partial ORF. Highly similar to N-terminus of
+ Rv2077c|MTCY49.16C|Q10685 hypothetical 33.3 kd protein
+ (323 aa), FASTA scores: opt: 280, E(): 1.2 e-16, (71.7%
+ identity in 53 aa overlap) but homology continues in
+ different frame ie MTCY09F9.15, cosmid sequence appears to
+ be correct, genomic sequence is also frameshifted in
+ Mycobacterium bovis strain AF2122/97. Mb1985c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00588.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZT4"
+ /translation="MLPTLSHIHAWDTEHLIEAAYYWTKVADQWEDVFLEMRNRSHFI
+ AWEGAGGDGCDSEPALTYR"
+ gene complement(2196234..2196530)
+ /locus_tag="BQ2027_MB1986C"
+ CDS complement(2196234..2196530)
+ /locus_tag="BQ2027_MB1986C"
+ /note="Mb1986c, -, len: 98 aa. Equivalent to Rv1951c, len:
+ 98 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 98 aa overlap). Conserved hypothetical
+ protein, similar to Mycobacterium tuberculosis
+ hypothetical protein Rv2541 (135 aa) (40.9% identity in 88
+ aa overlap). Mb1986c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00589.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZX0"
+ /translation="MKAGELRVNIQQVAATASQWSGRSTELSVLAPPPLGQPFQPTTA
+ AVGGAHAAVGLAVAAFTARTHATASAVEAAAAEYANNEAAAAAEMAAVPQTRLV"
+ gene 2196770..2196985
+ /gene="vapb14"
+ /locus_tag="BQ2027_MB1987"
+ CDS 2196770..2196985
+ /gene="vapb14"
+ /locus_tag="BQ2027_MB1987"
+ /note="Mb1987, -, len: 71 aa. Equivalent to Rv1952, len:
+ 71 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 71 aa overlap). Conserved hypothetical
+ protein. Some similarity to P55510|Y4JJ_RHISN PUTATIVE
+ PLASMID STABILITY PROTEIN (85 aa), FASTA scores: opt: 127,
+ E(): 0.00096, (42.5% identity in 73 aa overlap). Mb1987
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb14"
+ /protein_id="SIU00590.1"
+ /db_xref="GOA:A0A1R3XZT8"
+ /db_xref="InterPro:IPR010985"
+ /db_xref="InterPro:IPR013321"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZT8"
+ /translation="MIRNLPEGTKAALRVRAARHHHSVEAEARAILTAGLLGEEVPMP
+ VLLAADSGHDIDFEPERLGLIARTPQL"
+ gene 2196982..2197293
+ /gene="vapc14"
+ /locus_tag="BQ2027_MB1988"
+ CDS 2196982..2197293
+ /gene="vapc14"
+ /locus_tag="BQ2027_MB1988"
+ /note="Mb1988, -, len: 103 aa. Equivalent to Rv1953, len:
+ 103 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 103 aa overlap). Conserved
+ hypothetical protein. Some similarity to O33827 PLASMID
+ STABILITY-LIKE PROTEIN from Thiobacillus ferrooxidans (143
+ aa), FASTA scores: opt: 170, E(): 3.5e-06, (45.3% identity
+ in 75 aa overlap). Mb1988 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc14"
+ /protein_id="SIU00591.1"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZT3"
+ /translation="MTYVLDTNVVSALRVPGRHPAVAAWADSVQVAEQFVVAITLAEI
+ ERGVIAKERTDPTQSEHLRRWFDDKVLRIFVFARRGTNLIMQPLAGHIGYSLYSGISW
+ F"
+ gene complement(2197267..2197788)
+ /locus_tag="BQ2027_MB1989C"
+ CDS complement(2197267..2197788)
+ /locus_tag="BQ2027_MB1989C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1989c, -, len: 173 aa. Equivalent to Rv1954c,
+ len: 173 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 173 aa overlap). Hypothetical unknown
+ protein, end overlaps next ORF upstream, Rv1955
+ (MTCY09F9.09c)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00592.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZV7"
+ /translation="MAAGSGGGTVGLVLPRVASLSGLDGAPTVPEGSDKALMHLGDPP
+ RRCDTHPDGTSSAAAALVLRRIDVHPLLTGLGRGRQTVSLRNGHLVATANRAILSRRR
+ SRLTRGRSFTSHLITSCPRLDDHQHRHPTRCRAEHAGCTVATCIPNARDPAPGHQTPR
+ WGPFRLKPAYTRI"
+ gene 2197321..2197623
+ /locus_tag="BQ2027_MB1988A"
+ CDS 2197321..2197623
+ /locus_tag="BQ2027_MB1988A"
+ /note="Mb1988A, len: 100 aa. Equivalent to Rv1954A len:
+ 100 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 100 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Hypothetical unknown
+ protein. Protein product from Mb1988A detected using SWATH
+ mass spectrometry. Mb1988A found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Hypothetical protein"
+ /protein_id="SIU00593.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZT2"
+ /translation="MARGRVACIGDAGCDCTPGVFRATAGGMPVLVVIESGTGGDQMA
+ RKATSPGKPAPTSGQYRPVGGGNEVTVPKGHRLPPSPKPGQKWVNVDPTKNKSGRG"
+ gene 2197628..2198140
+ /gene="higb"
+ /locus_tag="BQ2027_MB1990"
+ CDS 2197628..2198140
+ /gene="higb"
+ /locus_tag="BQ2027_MB1990"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1990, -, len: 170 aa. Equivalent to Rv1955, len:
+ 170 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 170 aa overlap). Hypothetical unknown
+ protein, start overlaps another ORF, Rv1954c
+ (MTCY09F9.10). Mb1990 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin higb"
+ /protein_id="SIU00594.1"
+ /db_xref="InterPro:IPR009241"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1X7"
+ /translation="MPSGWVSHRLGGSPKCISALSLPSGTVGAPSKPDNDATRGRTRP
+ TVPPPDPAAMGTWKFFRASVDGRPVFKKEFDKLPDQARAALIVLMQRYLVGDLAAGSI
+ KPIRGDILELRWHEANNHFRVLFFRWGQHPVALTAFYKNQQKTPKTKIETALDRQKIW
+ KRAFGDTPPI"
+ gene 2198182..2198631
+ /gene="higa"
+ /locus_tag="BQ2027_MB1991"
+ CDS 2198182..2198631
+ /gene="higa"
+ /locus_tag="BQ2027_MB1991"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1991, -, len: 149 aa. Equivalent to Rv1956, len:
+ 149 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 149 aa overlap). Possible
+ transcriptional regulatory protein, contains probable
+ helix-turn-helix motif at aa 52-73 (+4.78 SD). Protein
+ product from Mb1991 detected using SWATH mass
+ spectrometry. Mb1991 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin higa"
+ /protein_id="SIU00595.1"
+ /db_xref="GOA:A0A1R3Y0L8"
+ /db_xref="InterPro:IPR001387"
+ /db_xref="InterPro:IPR010982"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0L8"
+ /translation="MSIDFPLGDDLAGYIAEAIAADPSFKGTLEDAEEARRLVDALIA
+ LRKHCQLSQVEVAKRMGVRQPTVSGFEKEPSDPKLSTLQRYARALDARLRLVLEVPTL
+ REVPTWHRLSSYRGSARDHQVRVGADKEILMQTNWARHISVRQVEVA"
+ gene 2198628..2199173
+ /gene="secBL"
+ /locus_tag="BQ2027_MB1992"
+ CDS 2198628..2199173
+ /gene="secBL"
+ /locus_tag="BQ2027_MB1992"
+ /note="Mb1992, -, len: 181 aa. Equivalent to Rv1957, len:
+ 181 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 181 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb1992 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb1992 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SecB-like chaperone"
+ /protein_id="SIU00596.1"
+ /db_xref="InterPro:IPR035958"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZV0"
+ /translation="MTDRTDADDLDLQRVGARLAARAQIRDIRLLRTQAAVHRAPKPA
+ QGLTYDLEFEPAVDADPATISAFVVRISCHLRIQNQAADDDVKEGDTKDETQDVATAD
+ FEFAALFDYHLQEGEDDPTEEELTAYAATTGRFALYPYIREYVYDLTGRLALPPLTLE
+ ILSRPMPVSPGAQWPATRGTP"
+ gene complement(2199062..2199676)
+ /locus_tag="BQ2027_MB1993C"
+ CDS complement(2199062..2199676)
+ /locus_tag="BQ2027_MB1993C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb1993c, -, len: 204 aa. Equivalent to Rv1958c,
+ len: 204 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 204 aa overlap). Hypothetical unknown
+ protein. Mb1993c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00597.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y088"
+ /translation="MIPTPSIGAVINAKISHRACRTFPRPTDIHPRRYLPRKHGGTNP
+ RRLSMNPGGMRIRCRRGDKSRKLLSRSQVQPLVGRPAKIPSPAANAPPSRARTASPVF
+ ENLELRAAAGLAFGFRLRPFGGTAADSPPVAAQDLDPCRWADSPALHLAVGVETMVVG
+ QLDSPSFGQGVPLVAGHWAPGETGIGRDNISRVNGGSARRPVRS"
+ gene complement(2199725..2200021)
+ /gene="pare1"
+ /locus_tag="BQ2027_MB1994C"
+ CDS complement(2199725..2200021)
+ /gene="pare1"
+ /locus_tag="BQ2027_MB1994C"
+ /note="Mb1994c, -, len: 98 aa. Equivalent to Rv1959c, len:
+ 98 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 98 aa overlap). Conserved hypothetical
+ protein, similar to other hypothetical plasmid proteins
+ e.g. AL117189|YPCD1.08 from Yersinia pestis (99 aa), FASTA
+ scores: opt: 162, E(): 7.3e-05, (33.0% identity in 91 aa
+ overlap); also some similarity to E145339 hypothetical
+ protein (103 aa), FASTA scores: opt: 142, E(): 0.0003,
+ (33.0% identity in 91 aa overlap). Protein product from
+ Mb1994c detected using SWATH mass spectrometry. Mb1994c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin pare1"
+ /protein_id="SIU00598.1"
+ /db_xref="InterPro:IPR007712"
+ /db_xref="InterPro:IPR028344"
+ /db_xref="InterPro:IPR035093"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZU3"
+ /translation="MSSRYLLSPAAQAHLEEIWDCTYDRWGVDQAEQYLRELQHAIDR
+ AAANPRIGRACDEIRPGYRKLSAGSHTLFYRVTGEGTIDVVRVLHQRMDVDRNL"
+ gene complement(2200018..2200269)
+ /gene="pard1"
+ /locus_tag="BQ2027_MB1995C"
+ CDS complement(2200018..2200269)
+ /gene="pard1"
+ /locus_tag="BQ2027_MB1995C"
+ /note="Mb1995c, -, len: 83 aa. Equivalent to Rv1960c, len:
+ 83 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 83 aa overlap). Conserved hypothetical
+ protein, similar to O85269|AF102990|AF102990_51
+ hypothetical protein of Yersinia enterocolitica (80 aa),
+ FASTA scores: opt: 149, E(): 0.00037, (42 .1% identity in
+ 57 aa overlap). Mb1995c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin pard1"
+ /protein_id="SIU00599.1"
+ /db_xref="GOA:P67299"
+ /db_xref="InterPro:IPR010985"
+ /db_xref="InterPro:IPR022789"
+ /db_xref="InterPro:IPR038296"
+ /db_xref="UniProtKB/Swiss-Prot:P67299"
+ /translation="MGKNTSFVLDEHYSAFIDGEIAAGRYRSASEVIRSALRLLEDRE
+ TQLRALREALEAGERSGSSTPFDFDGFLGRKRADASRGR"
+ gene 2200256..2200750
+ /locus_tag="BQ2027_MB1996"
+ CDS 2200256..2200750
+ /locus_tag="BQ2027_MB1996"
+ /note="Mb1996, -, len: 164 aa. Equivalent to Rv1961, len:
+ 164 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 164 aa overlap). Hypothetical unknown
+ protein. Mb1996 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Helicase, C-terminal"
+ /protein_id="SIU00600.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZW1"
+ /translation="MFLPTNAQYQLLVVGVSPWDTPSPSGRISWGSAWPHQARRAQTC
+ QRVRRHWMIDTTEAAYRLTYQPDGTSITVRENLVDILARELLGPIRGPQEVLPFSPRS
+ QYLVGHLAPVKLTGAALIDDNAVQARANAEALAEGGGVPAYAADETTPTPTTTPKTAH
+ PSRA"
+ gene complement(2200910..2201317)
+ /gene="vapc35"
+ /locus_tag="BQ2027_MB1997C"
+ CDS complement(2200910..2201317)
+ /gene="vapc35"
+ /locus_tag="BQ2027_MB1997C"
+ /note="Mb1997c, -, len: 135 aa. Equivalent to Rv1962c,
+ len: 135 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 135 aa overlap). Conserved
+ hypothetical protein, similar to Mycobacterium
+ tuberculosis hypothetical proteins Rv3408|MTCY78.20c (133
+ aa) (36.2% identity in 138 aa overlap); and Rv3384c (130
+ aa) (43.1% identity in 130 aa overlap) Protein product
+ from Mb1997c detected using SWATH mass spectrometry.
+ Mb1997c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc35. contains pin domain."
+ /protein_id="SIU00601.1"
+ /db_xref="GOA:A0A1R3XZT9"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZT9"
+ /translation="MIYLETSALVKLIRIEVESDALADWLDDRTELRWITSALTEVEL
+ SRAIRAVSPEGLPAVPSVLARLDRFEIDAVIRSTAAAYPNPALRSLDAIHLATAQTAG
+ SVAPLTALVTYDNRLKEAAEALSLAVVAPGQAR"
+ gene complement(2201321..2201593)
+ /gene="vapB35"
+ /locus_tag="BQ2027_MB1997A"
+ CDS complement(2201321..2201593)
+ /gene="vapB35"
+ /locus_tag="BQ2027_MB1997A"
+ /note="Mb1997A, len: 90 aa. Equivalent to Rv1962A len: 90
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 90 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Possible vapB35,
+ antitoxin,part of toxin-antitoxin (TA) operon with
+ Rv1962c, see Arcus et al. 2005. Similar to others in M.
+ tuberculosis e.g. Rv3385c, Rv3407, Rv0626,Mb1997A found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible antitoxin VapB35"
+ /protein_id="SIU00602.1"
+ /db_xref="InterPro:IPR036165"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZW6"
+ /translation="MNEVSIRTLNQETSKVLARVKRGEEINLTERGKVIARIIPASAG
+ PLDSLISTGSVQPARVHGPAPRPTIPMRGGLDSGTLLERMRAEERY"
+ gene complement(2201626..2202846)
+ /gene="mce3r"
+ /locus_tag="BQ2027_MB1998C"
+ CDS complement(2201626..2202846)
+ /gene="mce3r"
+ /locus_tag="BQ2027_MB1998C"
+ /note="Mb1998c, -, len: 406 aa. Equivalent to Rv1963c,
+ len: 406 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 406 aa overlap). Probable
+ transcriptional regulatory protein, similar to several
+ e.g. AL049485|SC6A5.30 Streptomyces coelicolor cosmid 6 A
+ (404 aa), FASTA scores: opt: 319, E(): 6.4e-13, (29.5%
+ identity in 373 aa overlap); and Z84498|MTCY9F9_1 (259
+ aa), FASTA scores: opt: 208, E(): 1.6e-07, (100.0%
+ identity in 32 aa overlap). Contains probable
+ helix-turn-helix at aa 36-57 (+4.23 SD). Protein product
+ from Mb1998c detected using SWATH mass spectrometry.
+ Mb1998c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transcriptional repressor (probably
+ tetr-family) mce3r"
+ /protein_id="SIU00603.1"
+ /db_xref="GOA:A0A1R3XZU1"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZU1"
+ /translation="MASVAQPVRRRPKDRKKQILDQAVGLFIERGFHSVKLEDIAEAA
+ GVTARALYRHYDNKQALLAEAIRTGQDQYQSARRLTEGETEPTPRPLNADLEDLIAAA
+ VASRALTVLWQREARYLNEDDRTAVRRRINAIVAGMRDSVLLEVPDLSPQHSELRAWA
+ VSSTLTSLGRHSLSLPGEELKKLLYQACMAAARTPPVCELPPLPAGDAARDEADVLFS
+ RYETLLAAGARLFRAQGYPAVNTSEIGKGAGIAGPGLYRSFSSKQAILDALIRRLDEW
+ RCLECIRALRANQQAAQRLRGLVQGHVRISLDAPDLVAVSVTELSHASVEVRDGYLRN
+ QGDREAVWIDLIGKLVPATSVAQGRLLVAAAISFIEDVARTWHLTRYAGVADEISGLA
+ LAILTSGAGNLLRA"
+ gene 2203745..2204149
+ /gene="yrbE3A"
+ /locus_tag="BQ2027_MB1999"
+ CDS 2203745..2204149
+ /gene="yrbE3A"
+ /locus_tag="BQ2027_MB1999"
+ /note="Mb1999, yrbE3A, len: 134 aa. Similar to 5' end of
+ Rv1964, len: 265 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 102 aa overlap). yrbE3A,
+ hypothetical unknown integral membrane protein, part of
+ mce3 operon and member of YrbE family (see citations below
+ for more information), highly similar to Mycobacterium
+ tuberculosis proteins O07412|Rv0167|MTCI28.07|yrbE1A (265
+ aa), O07791|Rv0587|MTCY19H5.35|yrbE2A (265 aa),
+ Rv3501c|MTV023.08c|yrbE4A (254 aa), etc. Also highly
+ similar to conserved hypothetical integral membrane
+ proteins of yrbEA type, e.g. AAD24544.1|AF116213|YrbE1A
+ from Mycobacterium leprae (112 aa); P45392|YRBE_ECOLI from
+ Escherichia coli (260 aa), FASTA scores: opt: 893, E(): 0,
+ (51.4% identity in 253 aa overlap); etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ large deletion of 12719 bp (RD7) leads to the loss of the
+ COOH part of yrbE3A, the entire mce3 operon and the
+ following genes up to Mb2000 compared to Mycobacterium
+ tuberculosis strain H37Rv. Mb1999 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL INTEGRAL MEMBRANE PROTEIN
+ YRBE3A"
+ /protein_id="SIU00604.1"
+ /db_xref="GOA:A0A1R3Y1Y6"
+ /db_xref="InterPro:IPR030802"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1Y6"
+ /translation="MVIVADKAAGRVADPVLRPVGALGDFFAMTLDTSVCMFKPPFAW
+ REYLLQCWFVARVSTLPGVLMTIPWAVISGFLFNVLLTDIGAADFSGTGCAIFTVNQS
+ RGTGSLERGRFIGPQDHRVAAALEVTAPLLRS"
+ gene 2204234..2205082
+ /locus_tag="BQ2027_MB2000"
+ CDS 2204234..2205082
+ /locus_tag="BQ2027_MB2000"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2000, -, len: 282 aa. Equivalent to Rv1978, len:
+ 282 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 282 aa overlap). Conserved hypothetical
+ protein, similar to several hypothetical proteins and
+ methyltransferases e.g. X86780|SHGCPIR.15
+ methyltransferase from S. hygroscopicus (211 aa), FASTA
+ scores: opt: 151, E(): 0.0072, (30.6% identity in 121 aa
+ overlap). Protein product from Mb2000 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2000 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SAM-dependent methyltransferases"
+ /protein_id="SIU00605.1"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="InterPro:IPR041698"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0M7"
+ /translation="MGEANIREQAIATMPRGGPDASWLDRRFQTDALEYLDRDDVPDE
+ VKQKIIGVLDRVGTLTNLHEKYARIALKLVSDIPNPRILELGAGHGKLSAKILELHPT
+ ATVTISDLDPTSVANIAAGELGTHPRARTQVIDATAIDGHGHSYDLAVFALAFHHLPP
+ TVACKAIAEATRVGKRFLIIDLKRQKPLSFTLSSVLLLPLHLLLLPWSSMRSSMHDGF
+ ISALRAYSPSALQTLARAADPGMQVEILPAPTRLFPPSLAVVFSRSSSAPTESSECSA
+ DRQPGE"
+ gene complement(2205045..2206490)
+ /locus_tag="BQ2027_MB2001C"
+ CDS complement(2205045..2206490)
+ /locus_tag="BQ2027_MB2001C"
+ /note="Mb2001c, -, len: 481 aa. Equivalent to Rv1979c,
+ len: 481 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 480 aa overlap). Possible permease, APC
+ family possibly involved in transport of amino acid,
+ showing some similarity to other permeases. Also similar
+ to MTCY39.19 from Mycobacterium tuberculosis (28.2%
+ identity in 277 aa overlap). Contains PS00599
+ Aminotransferases class-II pyridoxal-phosphate attachment
+ site. Mb2001c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED PERMEASE"
+ /protein_id="SIU00606.1"
+ /db_xref="GOA:Q7TZ67"
+ /db_xref="InterPro:IPR002293"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZ67"
+ /translation="MVGPRTRGYAIHKLGFCSVVMLGINSIIGAGIFLTPGEVIGLAG
+ PFAPMAYVLAGIFAGVVAIVFATAARYVRTNGASYAYTTAAFGRRIGIYVGVTHAITA
+ SIAWGVLASFFVSTLLRVAFPDKAWADAEQLFSVKTLTFLGFIGVLLAINLFGNRAIK
+ WANGTSTVGKAFALSAFIVGGLWIITTQHVNNYATAWSAYSATPYSLLGVAEIGKGTF
+ SSMALATIVALYAFTGFESIANAAEEMDAPDRNLPRAIPIAIFSVGAIYLLTLTVAML
+ LGSNKIAASGDTVKLAAAIGNATFRTIIVVGALISMFGINVAASFGAPRLWTALADSG
+ VLPTRLSRKNQYDVPMVSFAITASLALAFPLALRFDNLHLTGLAVIARFVQFIIVPIA
+ LIALARSQAVEHAAVRRNAFTDKVLPLVAIVVSVGLAVSYDYRCIFLVRGGPNYFSIA
+ LIVITFIVVPAMAYLHYYRIIRRVGDRPSTR"
+ gene complement(2206669..2207355)
+ /gene="mpt64"
+ /locus_tag="BQ2027_MB2002C"
+ CDS complement(2206669..2207355)
+ /gene="mpt64"
+ /locus_tag="BQ2027_MB2002C"
+ /standard_name="mpb64"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2002c, -, len: 228 aa. Equivalent to Rv1980c,
+ len: 228 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 228 aa overlap). mpt64 (alternate gene
+ name: mpb64), immunogenic protein (alternate gene name:
+ mpb64) (see citations below), identical to MPT64|MPB64
+ from Mycobacterium bovis (228 aa). Similar to
+ Rv3036c|MTV012.51c from Mycobacterium tuberculosis.
+ Exported protein containing a N-terminal signal sequence:
+ see notes below about proteomics. Protein product from
+ Mb2002c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2002c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="IMMUNOGENIC PROTEIN MPT64 (ANTIGEN MPT64/MPB64)"
+ /protein_id="SIU00607.1"
+ /db_xref="GOA:P0A5Q5"
+ /db_xref="InterPro:IPR021729"
+ /db_xref="InterPro:IPR037126"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5Q5"
+ /translation="MRIKIFMLVTAVVLLCCSGVATAAPKTYCEELKGTDTGQACQIQ
+ MSDPAYNINISLPSYYPDQKSLENYIAQTRDKFLSAATSSTPREAPYELNITSATYQS
+ AIPPRGTQAVVLKVYQNAGGTHPTTTYKAFDWDQAYRKPITYDTLWQADTDPLPVVFP
+ IVQGELSKQTGQQVSIAPNAGLDPVNYQNFAVTNDGVIFFFNPGELLPEAAGPTQVLV
+ PRSAIDSMLA"
+ gene complement(2207546..2208514)
+ /gene="nrdF1"
+ /locus_tag="BQ2027_MB2003C"
+ CDS complement(2207546..2208514)
+ /gene="nrdF1"
+ /locus_tag="BQ2027_MB2003C"
+ /standard_name="nrdF"
+ /note="Mb2003c, nrdF1, len: 322 aa. Equivalent to Rv1981c,
+ len: 322 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 322 aa overlap). nrdF1,
+ ribonucleoside-diphosphate reductase, beta chain (EC
+ 1.17.4.1) (see citation below), highly similar to others
+ e.g. RIR4_SALTY|P17424 ribonucleoside-diphosphate
+ reductase (319 aa), FASTA scores: opt: 1402, E(): 0,
+ (66.0% identity in 315 aa overlap); etc. Also similar to
+ Rv3048c|MTV012.63c from Mycobacterium tuberculosis.
+ Contains PS00368 Ribonucleotide reductase small subunit
+ signature. BELONGS TO THE RIBONUCLEOSIDE DIPHOSPHATE
+ REDUCTASE SMALL CHAIN FAMILY. COFACTOR: BINDS 2 IRON IONS
+ (BY SIMILARITY). Note that previously known as nrdF.
+ Protein product from Mb2003c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2003c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="RIBONUCLEOSIDE-DIPHOSPHATE REDUCTASE (BETA
+ CHAIN) NRDF1 (RIBONUCLEOTIDE REDUCTASE SMALL SUBUNIT) (R2F
+ PROTEIN)"
+ /protein_id="SIU00608.1"
+ /db_xref="GOA:A0A1R3XZV2"
+ /db_xref="InterPro:IPR000358"
+ /db_xref="InterPro:IPR009078"
+ /db_xref="InterPro:IPR012348"
+ /db_xref="InterPro:IPR026494"
+ /db_xref="InterPro:IPR030475"
+ /db_xref="InterPro:IPR033909"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZV2"
+ /translation="MTGKRVERVHAINWNRLLDAKDLQVWERLTGNFWLPEKIPLSND
+ LASWQTLSSTEQQTTIRVFTGLTLLDTAQATVGAVAMIDDAVTPHEEAVLTNMAFMES
+ VHAKSYSSIFSTLCSTKQIDDAFDWSEQNPYLQRKAQIIVDYYRGDDALKRKASSVML
+ ESFLFYSGFYLPMYWSSRGKLTNTADLIRLIIRDEAVHGYYIGYKCQRGLADLTDAER
+ ADHREYTCELLHTLYANEIDYAHDLYDELGWTDDVLPYMRYNANKALANLGYQPAFDR
+ DTCQVNPAVRAALDPGAGENHDFFSGSGSSYVMGTHQPTTDTDWDF"
+ gene complement(2208739..2209158)
+ /gene="vapc36"
+ /locus_tag="BQ2027_MB2004C"
+ CDS complement(2208739..2209158)
+ /gene="vapc36"
+ /locus_tag="BQ2027_MB2004C"
+ /note="Mb2004c, -, len: 139 aa. Equivalent to Rv1982c,
+ len: 139 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 139 aa overlap). Conserved
+ hypothetical protein. BELONGS TO THE UPF0110 FAMILY.
+ Similar to Rv0624|Z92772|MTY20H10.05 from Mycobacterium
+ tuberculosis (131 aa), FASTA scores: opt: 288, E():
+ 4.1e-14, (40.2% identity in 127 aa overlap); also similar
+ to Rv0624, Rv2759c, and Rv0609,Mb2004c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc36. contains pin domain."
+ /protein_id="SIU00609.1"
+ /db_xref="GOA:P0A653"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/Swiss-Prot:P0A653"
+ /translation="MIVDTSAVVALVQGERPHATLVAAALAGAHSPVMSAPTVAECLI
+ VLTARHGPVARTIFERLRSEIGLSVSSFTAEHAAATQRAFLRYGKGRHRAALNFGDCM
+ TYATAQLGHQPLLAVGNDFPQTDLEFRGVVGYWPGVA"
+ gene complement(2209167..2209427)
+ /gene="vapB36"
+ /locus_tag="BQ2027_MB2004A"
+ CDS complement(2209167..2209427)
+ /gene="vapB36"
+ /locus_tag="BQ2027_MB2004A"
+ /note="Mb2004A, len: 86 aa. Equivalent to Rv1982A len: 86
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 86 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Possible vapB36,
+ antitoxin,part of toxin-antitoxin (TA) operon with
+ Rv1982c, see Arcus et al. 2005. Similar to others in
+ Mycobacterium tuberculosis e.g. Rv0623, Rv2760c, Rv0608
+ Protein product from Mb2004A detected using SWATH mass
+ spectrometry. Mb2004A found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible antitoxin VapB36"
+ /protein_id="SIU00610.1"
+ /db_xref="InterPro:IPR011660"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZX5"
+ /translation="MALNIKDPEVDRLAAELADRLHTSKTAAIRHALSAQLAFLESRA
+ GDREAQLLDILRTEIWPLLADRSPITKLEREQILGYDPATGV"
+ gene 2209570..2211246
+ /gene="PE_PGRS35"
+ /locus_tag="BQ2027_MB2005"
+ CDS 2209570..2211246
+ /gene="PE_PGRS35"
+ /locus_tag="BQ2027_MB2005"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2005, PE_PGRS35, len: 558 aa. Equivalent to
+ Rv1983, len: 558 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 558 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins. Similar to other PE
+ proteins e.g. Rv0977, etc. Contains PS00141 Eukaryotic and
+ viral aspartyl proteases active site. Mb2005 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs35"
+ /protein_id="SIU00611.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="InterPro:IPR021109"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZU6"
+ /translation="MSFLVVVPEFLTSAAADVENIGSTLRAANAAAAASTTALAAAGA
+ DEVSAAVAALFARFGQEYQAVSAQASAFHQQFVQTLNSASGSYAAAEATIASQLQTAQ
+ HDLLGAVNAPTETLLGRPLIGDGAPGTATSPNGGAGGLLYGNGGNGYSATASGVGGGA
+ GGSAGLIGNGGAGGAGGPNAPGGAGGNGGWLLGNGGIGGPGGASSIPGMSGGAGGTGG
+ ATGLLGWGANGGAGGLGDGVGVDRGTGGAGGRGGLLYGGYGVSGPGGDGRTVPLEIIH
+ VTEPTVHANVNGGPTSTILVDTGSAGLVVSPEDVGGILGVLHMGLPTGLSISGYSGGL
+ YYIFATYTTTVDFGNGIVTAPTAVNVVLLSIPTSPFAISTYFSALLADPTTTPFEAYF
+ GAVGVDGVLGVGPNAVGPGPSIPTMALPGDLNQGVLIDAPAGELVFGPNPLPAPNVEV
+ VGSPITTLYVKIDGGTPIPVPSIIDSGGVTGTIPSYVIGSGTLPANTNIEVYTSPGGD
+ RLYAFNTNDYRPTVISSGLMNTGFLPFRFQPVYIDYSPSGIGTTVFDHPA"
+ gene complement(2211234..2211887)
+ /gene="cfp21"
+ /locus_tag="BQ2027_MB2006C"
+ CDS complement(2211234..2211887)
+ /gene="cfp21"
+ /locus_tag="BQ2027_MB2006C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2006c, cfp21, len: 217 aa. Equivalent to Rv1984c,
+ len: 217 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 217 aa overlap). cfp21, probable
+ cutinase precursor with N-terminal signal sequence (EC
+ 3.1.1.-), similar to P41744|CUTI_ALTBR cutinase precursor
+ from Alternaria brassicicola (209 aa), FASTA scores: opt:
+ 283, E(): 2.2e-11, (32.6% identity in 193 aa overlap).
+ Also similar to Mycobacterium tuberculosis proteins e.g.
+ Rv3452, Rv3451, Rv2301, Rv1758, Rv3724. BELONGS TO THE
+ CUTINASE FAMILY. Protein product from Mb2006c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2006c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CUTINASE PRECURSOR CFP21"
+ /protein_id="SIU00612.1"
+ /db_xref="GOA:P63880"
+ /db_xref="InterPro:IPR000675"
+ /db_xref="InterPro:IPR011150"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/Swiss-Prot:P63880"
+ /translation="MTPRSLVRIVGVVVATTLALVSAPAGGRAAHADPCSDIAVVFAR
+ GTHQASGLGDVGEAFVDSLTSQVGGRSIGVYAVNYPASDDYRASASNGSDDASAHIQR
+ TVASCPNTRIVLGGYSQGATVIDLSTSAMPPAVADHVAAVALFGEPSSGFSSMLWGGG
+ SLPTIGPLYSSKTINLCAPDDPICTGGGNIMAHVSYVQSGMTSQAATFAANRLDHAG"
+ gene complement(2212317..2213228)
+ /locus_tag="BQ2027_MB2007C"
+ CDS complement(2212317..2213228)
+ /locus_tag="BQ2027_MB2007C"
+ /note="Mb2007c, -, len: 303 aa. Equivalent to Rv1985c,
+ len: 303 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 303 aa overlap). Probable
+ transcriptional regulatory protein, LysR family member.
+ Similar to many regulatory proteins, especially
+ ICIA_ECOLI|P24194 chromosome initiation inhibitor from
+ Escherichia coli (297 aa), FASTA scores: opt: 520, E():
+ 1.1e-28, (35.8% identity in 285 aa overlap); and
+ P94632|LYSG_CORGL LYSINE EXPORT REGULATOR PROTEIN (290
+ aa), FASTA scores: opt: 705, E(): 0, (42.7% identity in
+ 288 aa overlap); etc. Contains PS00044 Bacterial
+ regulatory proteins, lysR family signature. Also contains
+ helix-turn-helix motif at aa 22-43,(+5.52 SD). BELONGS TO
+ THE LYSR FAMILY OF TRANSCRIPTIONAL REGULATORS. Protein
+ product from Mb2007c detected using SWATH mass
+ spectrometry. Mb2007c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY LYSR-FAMILY)"
+ /protein_id="SIU00613.1"
+ /db_xref="GOA:P67666"
+ /db_xref="InterPro:IPR000847"
+ /db_xref="InterPro:IPR005119"
+ /db_xref="InterPro:IPR017685"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P67666"
+ /translation="MVDPQLDGPQLAALAAVVELGSFDAAAERLHVTPSAVSQRIKSL
+ EQQVGQVLVVREKPCRATTAGIPLLRLAAQTALLESEALAEMGGNASLKRTRITIAVN
+ ADSMATWFSAVFDGLGDVLLDVRIEDQDHSARLLREGVAMGAVTTERNPVPGCRVHPL
+ GEMRYLPVASRPFVQRHLSDGFTAAAAAKAPSLAWNRDDGLQDMLVRKAFRRAITRPT
+ HFVPTTEGFTAAARAGLGWGMFPEKLAASPLADGSFVRVCDIHLDVPLYWQCWKLDSP
+ IIARITDTVRAAASGLYRGQQRRRRPG"
+ gene 2213337..2213936
+ /locus_tag="BQ2027_MB2008"
+ CDS 2213337..2213936
+ /locus_tag="BQ2027_MB2008"
+ /note="Mb2008, -, len: 199 aa. Equivalent to Rv1986, len:
+ 199 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 199 aa overlap). Probable conserved
+ integral membrane protein, LysE family possibly involved
+ in transport of Lysine, similar to P11667|YGGA_ECOLI
+ hypothetical 23.2 kd protein in sbm-fba intergenic region
+ (211 aa), FASTA scores: opt: 379, E(): 1.5e-19, (37.3%
+ identity in 185 aa overlap); and Q11154|Rv0488
+ HYPOTHETICAL 20.9 KD PROTEIN from Mycobacterium
+ tuberculosis (201 aa), FASTA scores: opt: 784, E(): 0,
+ (63.4% identity in 186 aa overlap). BELONGS TO THE
+ LYSE/YGGA FAMILY. Mb2008 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIU00614.1"
+ /db_xref="GOA:P64904"
+ /db_xref="InterPro:IPR001123"
+ /db_xref="InterPro:IPR004777"
+ /db_xref="UniProtKB/Swiss-Prot:P64904"
+ /translation="MNSPLVVGFLACFTLIAAIGAQNAFVLRQGIQREHVLPVVALCT
+ VSDIVLIAAGIAGFGALIGAHPRALNVVKFGGAAFLIGYGLLAARRAWRPVALIPSGA
+ TPVRLAEVLVTCAAFTFLNPHVYLDTVVLLGALANEHSDQRWLFGLGAVTASAVWFAT
+ LGFGAGRLRGLFTNPGSWRILDGLIAVMMVALGISLTVT"
+ gene 2214352..2214780
+ /locus_tag="BQ2027_MB2009"
+ CDS 2214352..2214780
+ /locus_tag="BQ2027_MB2009"
+ /note="Mb2009, -, len: 142 aa. Equivalent to Rv1987, len:
+ 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 142 aa overlap). Possible chitinase
+ (EC 3.2.1.14), similar to several e.g. P36909|CHIT_STRLI
+ chitinase c precursor (619 aa) FASTA scores, opt: 324,
+ E(): 1.2e-14, (39.5% identity in 129 aa overlap). Protein
+ product from Mb2009 detected using SWATH mass
+ spectrometry. Mb2009 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CHITINASE"
+ /protein_id="SIU00615.1"
+ /db_xref="GOA:P64906"
+ /db_xref="InterPro:IPR001919"
+ /db_xref="InterPro:IPR008965"
+ /db_xref="InterPro:IPR012291"
+ /db_xref="UniProtKB/Swiss-Prot:P64906"
+ /translation="MAGLNIYVRRWRTALHATVSALIVAILGLAITPVASAATARATL
+ SVTSTWQTGFIARFTITNSSTAPLTDWKLEFDLPAGESVLHTWNSTVARSGTHYVLSP
+ ANWNRIIAPGGSATGGLRGGLTGSYSPPSSCLLNGQYPCT"
+ gene 2215006..2215545
+ /gene="erm(37)"
+ /locus_tag="BQ2027_MB2010"
+ CDS 2215006..2215545
+ /gene="erm(37)"
+ /locus_tag="BQ2027_MB2010"
+ /note="Mb2010, -, len: 179 aa. Equivalent to Rv1988, len:
+ 179 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 179 aa overlap). Probable
+ methyltransferase (EC 2.1.1.-), similar to
+ ERME_SACER|P07287 rrna adenine n-6-methyltransferase (370
+ aa), FASTA scores: opt: 259, E(): 2e-11, (35.1% identity
+ in 171 aa overlap); contains PS00092 N-6 Adenine-specific
+ DNA methylases signature. Also similar to Mycobacterium
+ tuberculosis Rv1010 ksgA 16S rRNA dimethyltransferase.
+ Mb2010 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable 23s rrna methyltransferase erm(37)"
+ /protein_id="SIU00616.1"
+ /db_xref="GOA:A0A1R3XZX2"
+ /db_xref="InterPro:IPR001737"
+ /db_xref="InterPro:IPR020598"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZX2"
+ /translation="MSALGRSRRAWGWHRLHDEWAARVVSAAAVRPGELVFDIGAGEG
+ ALTAHLVRAGARVVAVELHPRRVGVLRERFPGITVVHADAASIRLPGRPFRVVANPPY
+ GISSRLLRTLLAPNSGLVAADLVLQRALVCKFASRNARRFTLTVGLMLPRRAFLPPPH
+ VDSAVLVVRRRKCGDWQGR"
+ gene complement(2216065..2216625)
+ /locus_tag="BQ2027_MB2011C"
+ CDS complement(2216065..2216625)
+ /locus_tag="BQ2027_MB2011C"
+ /note="Mb2011c, -, len: 186 aa. Equivalent to Rv1989c,
+ len: 186 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 186 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb2011c detected using SWATH
+ mass spectrometry. Mb2011c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00617.1"
+ /db_xref="GOA:P64908"
+ /db_xref="InterPro:IPR014914"
+ /db_xref="UniProtKB/Swiss-Prot:P64908"
+ /translation="MSDALDEGLVQRIDARGTIEWSETCYRYTGAHRDALSGEGARRF
+ GGRWNPPLLFPAIYLADSAQACMVEVERAAQAASTTAEKMLEAAYRLHTIDVTDLAVL
+ DLTTPQAREAVGLENDDIYGDDWSGCQAVGHAAWFLHMQGVLVPAAGGVGLVVTAYEQ
+ RTRPGQLQLRQSVDLTPALYQELRAT"
+ gene complement(2216622..2216963)
+ /locus_tag="BQ2027_MB2012C"
+ CDS complement(2216622..2216963)
+ /locus_tag="BQ2027_MB2012C"
+ /note="Mb2012c, -, len: 113 aa. Equivalent to Rv1990c,
+ len: 113 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 113 aa overlap). Probable
+ transcriptional regulatory protein, similar to
+ Mycobacterium tuberculosis Rv3188|AL021646|MTV014.32 (115
+ aa), FASTA scores: opt: 184, E(): 8.2e-07, (28.4% identity
+ in 109 aa overlap). Contains probable helix-turn-helix
+ motif at aa 20-44 (+4.22 SD). Protein product from Mb2012c
+ detected using SWATH mass spectrometry. Mb2012c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN"
+ /protein_id="SIU00618.1"
+ /db_xref="InterPro:IPR024467"
+ /db_xref="UniProtKB/Swiss-Prot:P64910"
+ /translation="MGVNVLASTVSGAIERLGLTYEEVGDIVDASPRSVARWTAGQVV
+ PQRLNKQRLIELAYVADALAEVLPRDQANVWMFSPNRLLEHRKPADLVRDGEYQRVLA
+ LIDAMAEGVFV"
+ gene complement(2217207..2217542)
+ /locus_tag="BQ2027_MB2013C"
+ CDS complement(2217207..2217542)
+ /locus_tag="BQ2027_MB2013C"
+ /note="Mb2013c, -, len: 111 aa. Equivalent to Rv1990A,
+ len: 111 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 111 aa overlap). Possible
+ dehydrogenase (fragment) (EC 1.-.-.-), similar to
+ N-terminal part of several dehydrogenases and hypothetical
+ proteins, e.g. Rv2750|MTV002.15|AL008967 from
+ Mycobacterium tuberculosis (272 aa), FASTA scores: opt:
+ 151, E(): 0.0045, (47.45% identity in 78 aa overlap), but
+ lacks C-terminal part. Maybe a pseudogene. Also similar to
+ U17129|RSU17129_7 putative short-chain alcohol
+ dehydrogenase from Rhodococcus erythropolis (275 aa),
+ FASTA scores: opt: 142, E(): 0.018, (54.15% identity in 48
+ aa overlap). Mb2013c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE DEHYDROGENASE (FRAGMENT)"
+ /protein_id="SIU00619.1"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y001"
+ /translation="MGRLEGKVAFITGVARGQGRSHAVRLADGQARALGKVDVEACGA
+ LVGEVEVWGRDVRDDRRVFVESPADEFGACRRVARQGIRVVGLPVSQRELVEPEAGCA
+ ARRSAAGSQ"
+ gene complement(2217631..2217975)
+ /gene="mazf6"
+ /locus_tag="BQ2027_MB2014C"
+ CDS complement(2217631..2217975)
+ /gene="mazf6"
+ /locus_tag="BQ2027_MB2014C"
+ /note="Mb2014c, -, len: 114 aa. Equivalent to Rv1991c,
+ len: 114 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 114 aa overlap). Conserved
+ hypothetical protein, showing some similarity to
+ P13976|PEMK_ECOLI pemk protein (133 aa), FASTA scores:
+ opt: 113, E(): 0.043, (29.2% identity in 113 aa overlap);
+ and P96622|YDCE PROTEIN from Bacillus subtilis (116 aa),
+ FASTA scores: opt: 227, E(): 6.9e-09, (37.4% identity in
+ 115 aa overlap). Also similar to Mycobacterium
+ tuberculosis Rv2801c, and Rv0659c. Mb2014c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="toxin mazf6"
+ /protein_id="SIU00620.1"
+ /db_xref="GOA:P64912"
+ /db_xref="InterPro:IPR003477"
+ /db_xref="InterPro:IPR011067"
+ /db_xref="UniProtKB/Swiss-Prot:P64912"
+ /translation="MVISRAEIYWADLGPPSGSQPAKRRPVLVIQSDPYNASRLATVI
+ AAVITSNTALAAMPGNVFLPATTTRLPRDSVVNVTAIVTLNKTDLTDRVGEVPASLMH
+ EVDRGLRRVLDL"
+ gene complement(2217969..2218217)
+ /gene="mazE6"
+ /locus_tag="BQ2027_MB2014A"
+ CDS complement(2217969..2218217)
+ /gene="mazE6"
+ /locus_tag="BQ2027_MB2014A"
+ /note="Mb2014A, len: 82 aa. Equivalent to Rv1991A len: 82
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 82 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). MazE6, antitoxin, part
+ of toxin-antitoxin (TA) operon with Rv1991c. Similar to
+ ChpI of L. interrogans, FASTA scores: opt: 134, E():
+ 0.024,29.762% identity (65.476% similar) in 84 aa overlap.
+ Note that Pandey and Gerdes, 2005 predicts a different
+ N-terminus, adding 10 amino acids. Mb2014A found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Antitoxin MazE6"
+ /protein_id="SIU00621.1"
+ /db_xref="GOA:P0CL58"
+ /db_xref="InterPro:IPR002145"
+ /db_xref="InterPro:IPR010985"
+ /db_xref="UniProtKB/Swiss-Prot:P0CL58"
+ /translation="MKTAISLPDETFDRVSRRASELGMSRSEFFTKAAQRYLHELDAQ
+ LLTGQIDRALESIHGTDEAEALAVANAYRVLETMDDEW"
+ gene complement(2218317..2220632)
+ /gene="ctpG"
+ /locus_tag="BQ2027_MB2015C"
+ CDS complement(2218317..2220632)
+ /gene="ctpG"
+ /locus_tag="BQ2027_MB2015C"
+ /note="Mb2015c, ctpG, len: 771 aa. Equivalent to Rv1992c,
+ len: 771 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 771 aa overlap). Probable ctpG, metal
+ cation-transporting P-type ATPase G (transmembrane
+ protein) (EC 3.6.3.-), similar to others, especially
+ cadmium-transporting ATPases (EC 3.6.3.3), e.g.
+ NP_244904.1|NC_002570 cadmium-transporting ATPase from
+ Bacillus halodurans (707 aa); P30336|CADA_BACFI PROBABLE
+ CADMIUM-TRANSPORTING ATPASE from Bacillus firmus (723 aa);
+ BAB47609.1|AB037671 cadmium resistance protein B from
+ Staphylococcus aureus (804 aa); 3121832|Q60048|CADA_LISMO
+ PROBABLE CADMIUM-TRANSPORTING ATPase from Listeria
+ monocytogenes (707 aa); etc. Also similar to others from
+ Mycobacterium tuberculosis e.g. Rv0969|MTCY10D7.05c|ctpV
+ PUTATIVE CATION TRANSPORTER P-TYPE ATPASE V (770 aa);
+ Rv1469; Rv0092; etc. Contains PS00435 Peroxidases proximal
+ heme-ligand signature and PS00154 E1-E2 ATPases
+ phosphorylation site. BELONGS TO THE CATION TRANSPORT
+ ATPASES FAMILY (E1-E2 ATPASES), SUBFAMILY IB. Protein
+ product from Mb2015c detected using SWATH mass
+ spectrometry. Mb2015c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METAL CATION TRANSPORTER P-TYPE ATPASE
+ G CTPG"
+ /protein_id="SIU00622.1"
+ /db_xref="GOA:P63690"
+ /db_xref="InterPro:IPR001757"
+ /db_xref="InterPro:IPR008250"
+ /db_xref="InterPro:IPR018303"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR023298"
+ /db_xref="InterPro:IPR023299"
+ /db_xref="InterPro:IPR027256"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="UniProtKB/Swiss-Prot:P63690"
+ /translation="MTTVVDAEVQLTVVSDAAGRMRVQATGFQFDAGRAVAIEDTVGK
+ VAGVQAVHAYPRTASIVIWYSRAICDTAAILSAIIDAETVPAAAVPAYASRSASNRKA
+ GVVQKIIDWSTRTLSGVRRDVAAQPSGETSDACCDGEDNEDREPEQLWQVAKLRRAAF
+ SGVLLTASLVAAWAYPLWPVVLGLKALALAVGASTFVPSSLKRLAEGRVGVGTLMTIA
+ ALGAVALGELGEAATLAFLFSISEGLEEYATARTRRGLRALLSLVPDQATVLREGTET
+ IVASTELHVGDQMIVKPGERLATDGIIRAGRTALDVSAITGESVPVEVGPGDEVFAGS
+ INGLGVLQVGVTATAANNSLARIVHIVEAEQVRKGASQRLADCIARPLVPSIMIAAAL
+ IAGTGSVLGNPLVWIERALVVLVAAAPCALAIAVPVTVVASIGAASRLGVLIKGGAAL
+ ETLGTIRAVALDKTGTLTANRPVVIDVATTNGATREEVLAVAAALEARSEHPLAVAVL
+ AATQATTAASDVQAVPGAGLIGRLDGRVVRLGRPGWLDAAELADHVACMQQAGATAVL
+ VERDQQLLGAIAVRDELRPEAAEVVAGLRTGGYQVTMLTGDNHATAAALAAQAGIEQV
+ HAELRPEDKAHLVAQLRARQPTAMVGDGVNDAPALAAADLGIAMGAMGTDVAIETADV
+ ALMGQDLRHLPQALDHARRSRQIMVQNVGLSLSIITVLMPLALFGILGLAAVVLVHEF
+ TEVIVIANGVRAGRIKPLAGPPKTPDRTIPG"
+ gene complement(2220629..2220901)
+ /locus_tag="BQ2027_MB2016C"
+ CDS complement(2220629..2220901)
+ /locus_tag="BQ2027_MB2016C"
+ /note="Mb2016c, -, len: 90 aa. Equivalent to Rv1993c, len:
+ 90 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 90 aa overlap). Conserved hypothetical
+ protein, very similar to Rv3269|Z92771|MTCY71.09
+ hypothetical protein from Mycobacterium tuberculosis (93
+ aa), FASTA results: opt: 309, E(): 3.2e-16, (63.3%
+ identity in 79 aa overlap). Also similar to Rv0968 (98 aa)
+ (51.1% identity in 94 aa overlap). Protein product from
+ Mb2016c detected using SWATH mass spectrometry. Mb2016c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00623.1"
+ /db_xref="InterPro:IPR009963"
+ /db_xref="UniProtKB/Swiss-Prot:P64914"
+ /translation="MVTHELLVKAAGAVLTGLVGVSAYETLRKALGTAPIRRASVTVM
+ EWGLRGTRRAEAAAESARLTVADVVAEARGRIGEEAPLPAGARVDE"
+ gene complement(2220954..2221310)
+ /gene="cmtr"
+ /locus_tag="BQ2027_MB2017C"
+ CDS complement(2220954..2221310)
+ /gene="cmtr"
+ /locus_tag="BQ2027_MB2017C"
+ /note="Mb2017c, -, len: 118 aa. Equivalent to Rv1994c,
+ len: 118 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.000% identity in 118 aa overlap). Probable
+ transcription regulator, similar to MERR_STRLI|P30346
+ probable mercury resistance operon repressor (125 aa),
+ FASTA scores: opt: 199, E(): 3e-08, (36.3% identity in 102
+ aa overlap). Contains probable helix-turn-helix motif at
+ aa 36-57 (+3.78 SD). Mb2017c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="metal sensor transcriptional regulator cmtr
+ (arsr-smtb family)"
+ /protein_id="SIU00624.1"
+ /db_xref="GOA:P67732"
+ /db_xref="InterPro:IPR001845"
+ /db_xref="InterPro:IPR011991"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P67732"
+ /translation="MLTCEMRESALARLGRALADPTRCRILVALLDGVCYPGQLAAHL
+ GLTRSNVSNHLSCLRGCGLVVATYEGRQVRYALADSHLARALGELVQVVLAVDTDQPC
+ VAERAASGEAVEMTGS"
+ gene 2221467..2222234
+ /locus_tag="BQ2027_MB2018"
+ CDS 2221467..2222234
+ /locus_tag="BQ2027_MB2018"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2018, -, len: 255 aa. Equivalent to Rv1995, len:
+ 255 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 255 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb2018 detected using SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Repair of Iron Centers di-iron protein"
+ /protein_id="SIU00625.1"
+ /db_xref="InterPro:IPR012312"
+ /db_xref="UniProtKB/Swiss-Prot:P64916"
+ /translation="MVASGAATKGVTVMKQTPPAAVGRRHLLEISASAAGVIALSACS
+ GSPPEPGKGRPDTTPEQEVPVTAPEDLMREHGVLKRILLIYREGIRRLQADDQSPAPA
+ LNESAQIIRRFIEDYHGQLEEQYVFPKLEQAGKLTDITSVLRTQHQRGRVLTDRVLAA
+ TTAAAAFDQPARDTLAQDMAAYIRMFEPHEAREDTVVFPALRDVMSAVEFRDMAETFE
+ DEEHRRFGEAGFQSVVDKVADIEKSLGIYDLSQFTPS"
+ gene 2222330..2223283
+ /locus_tag="BQ2027_MB2019"
+ CDS 2222330..2223283
+ /locus_tag="BQ2027_MB2019"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2019, -, len: 317 aa. Identical to Rv1996, len:
+ 317 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.000% identity in 317 aa overlap). Conserved
+ hypothetical protein. Similar to several Mycobacterium
+ tuberculosis hypothetical proteins e.g.
+ Rv2005c|Q10851|YK05_MYCTU (295 aa), FASTA scores: opt:
+ 775, E(): 0, (50.3% identity in 316 aa overlap); Rv2026c
+ (294 aa) (47.9% identity in 311 aa overlap); and Rv2623,
+ etc. Also similar to SCJ1.30c|AL109962 hypothetical
+ protein from Streptomyces coelicolor (328 aa). Protein
+ product from Mb2019 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2019 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="universal stress protein family protein"
+ /protein_id="SIU00626.1"
+ /db_xref="GOA:P0A5F8"
+ /db_xref="InterPro:IPR006015"
+ /db_xref="InterPro:IPR006016"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5F8"
+ /translation="MSAQQTNLGIVVGVDGSPCSHTAVEWAARDAQMRNVALRVVQVV
+ PPVITAPEGWAFEYSRFQEAQKREIVEHSYLVAQAHQIVEQAHKVALEASSSGRAAQI
+ TGEVLHGQIVPTLANISRQVAMVVLGYRGQGAVAGALLGSVSSSLVRHAHGPVAVIPE
+ EPRPARPPHAPVVVGIDGSPTSGLAAEIAFDEASRRGVDLVALHAWSDMGPLDFPRLN
+ WAPIEWRNLEDEQEKMLARRLSGWQDRYPDVVVHKVVVCDRPAPRLLELAQTAQLVVV
+ GSHGRGGFPGMHLGSVSRAVVNSGQAPVIVARIPQDPAVPA"
+ gene 2223485..2226202
+ /gene="ctpF"
+ /locus_tag="BQ2027_MB2020"
+ CDS 2223485..2226202
+ /gene="ctpF"
+ /locus_tag="BQ2027_MB2020"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2020, ctpF, len: 905 aa. Equivalent to Rv1997,
+ len: 905 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 905 aa overlap). Probable ctpF, metal
+ cation-transporting P-type ATPase F (transmembrane
+ protein) (EC 3.6.3.-), highly similar to others e.g.
+ NP_250120.1|NC_002516 probable cation-transporting P-type
+ ATPase from Pseudomonas aeruginosa (902 aa);
+ NP_441217.1|NC_000911 cation-transporting ATPase (E1-E2
+ ATPase) from Synechocystis sp. strain PCC 6803 (905 aa);
+ NP_404093.1|NC_003143 putative cation-transporting P-type
+ ATPase from Yersinia pestis (908 aa); P37367|ATA1_SYNY3
+ cation-transporting ATPase pma1 from Synechocystis sp.
+ (915 aa), FASTA scores: opt: 2392, E(): 0, (46.5% identity
+ in 852 aa overlap); etc. Contains PS00154 E1-E2 ATPases
+ phosphorylation site. BELONGS TO THE CATION TRANSPORT
+ ATPASES FAMILY (E1-E2 ATPASES), SUBFAMILY IB. Was
+ frame-shifted in original cosmid sequence. Protein product
+ from Mb2020 detected using SWATH mass spectrometry. Mb2020
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE METAL CATION TRANSPORTER P-TYPE ATPASE
+ A CTPF"
+ /protein_id="SIU00627.1"
+ /db_xref="GOA:P63688"
+ /db_xref="InterPro:IPR001757"
+ /db_xref="InterPro:IPR004014"
+ /db_xref="InterPro:IPR006068"
+ /db_xref="InterPro:IPR008250"
+ /db_xref="InterPro:IPR018303"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR023298"
+ /db_xref="InterPro:IPR023299"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="UniProtKB/Swiss-Prot:P63688"
+ /translation="MSASVSATTAHHGLPAHEVVLLLESDPYHGLSDGEAAQRLERFG
+ PNTLAVVTRASLLARILRQFHHPLIYVLLVAGTITAGLKEFVDAAVIFGVVVINAIVG
+ FIQESKAEAALQGLRSMVHTHAKVVREGHEHTMPSEELVPGDLVLLAAGDKVPADLRL
+ VRQTGLSVNESALTGESTPVHKDEVALPEGTPVADRRNIAYSGTLVTAGHGAGIVVAT
+ GAETELGEIHRLVGAAEVVATPLTAKLAWFSKFLTIAILGLAALTFGVGLLRRQDAVE
+ TFTAAIALAVGAIPEGLPTAVTITLAIGMARMAKRRAVIRRLPAVETLGSTTVICADK
+ TGTLTENQMTVQSIWTPHGEIRATGTGYAPDVLLCDTDDAPVPVNANAALRWSLLAGA
+ CSNDAALVRDGTRWQIVGDPTEGAMLVVAAKAGFNPERLATTLPQVAAIPFSSERQYM
+ ATLHRDGTDHVVLAKGAVERMLDLCGTEMGADGALRPLDRATVLRATEMLTSRGLRVL
+ ATGMGAGAGTPDDFDENVIPGSLALTGLQAMSDPPRAAAASAVAACHSAGIAVKMITG
+ DHAGTATAIATEVGLLDNTEPAAGSVLTGAELAALSADQYPEAVDTASVFARVSPEQK
+ LRLVQALQARGHVVAMTGDGVNDAPALRQANIGVAMGRGGTEVAKDAADMVLTDDDFA
+ TIEAAVEEGRGVFDNLTKFITWTLPTNLGEGLVILAAIAVGVALPILPTQILWINMTT
+ AIALGLMLAFEPKEAGIMTRPPRDPDQPLLTGWLVRRTLLVSTLLVASAWWLFAWELD
+ NGAGLHEARTAALNLFVVVEAFYLFSCRSLTRSAWRLGMFANRWIILGVSAQAIAQFA
+ ITYLPAMNMVFDTAPIDIGVWVRIFAVATAITIVVATDTLLPRIRAQPP"
+ gene complement(2226271..2227047)
+ /locus_tag="BQ2027_MB2021C"
+ CDS complement(2226271..2227047)
+ /locus_tag="BQ2027_MB2021C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2021c, -, len: 258 aa. Equivalent to Rv1998c,
+ len: 258 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 258 aa overlap). Conserved hypothetical
+ protein, showing some similarity with other hypothetical
+ proteins e.g. U82823|SEU82823.03 Saccharopolyspora
+ erythraea (266 aa), FASTA results: opt: 654, E(): 0,
+ (43.8% identity in 249 aa overlap); and AL034446|SC1A9.07
+ Streptomyces coelicolor (251 aa), FASTA scores: opt: 592,
+ E(): 1.5e-31, (43.4% identity in 251 aa overlap). Protein
+ product from Mb2021c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2021c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PEP phosphonomutase and related enzymes"
+ /protein_id="SIU00628.1"
+ /db_xref="GOA:A0A1R3XZW5"
+ /db_xref="InterPro:IPR015813"
+ /db_xref="InterPro:IPR039556"
+ /db_xref="InterPro:IPR040442"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZW5"
+ /translation="MSFHDLHHQGVPFVLPNAWDVPSALAYLAEGFTAIGTTSFGVSS
+ SGGHPDGHRATRGANIALAAALAPLQCYVSVDIEDGYSDEPDAIADYVAQLSTAGINI
+ EDSSAEKLIDPALAAAKIVAIKQRNPEVFVNARVDTYWLRQHADTTSTIQRALRYVDA
+ GADGVFVPLANDPDELAELTRNIPCPVNTLPVPGLTIADLGELGVARVSTGSVPYSAG
+ LYAAAHAARAVRDGEQLPRSVPYAELQARLVDYENRTSTT"
+ gene complement(2227142..2228464)
+ /locus_tag="BQ2027_MB2022C"
+ CDS complement(2227142..2228464)
+ /locus_tag="BQ2027_MB2022C"
+ /note="Mb2022c, -, len: 440 aa. Equivalent to Rv1999c,
+ len: 440 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 440 aa overlap). Probable conserved
+ integral membrane protein, possibly transporter of
+ cationic amino acid, similar to many transporters,
+ especially amino acid transporters, e.g.
+ CAC08265.1|AL392146 putative amino acid transporter from
+ Streptomyces coelicolor (414 aa); P39277|YJEH_ECOLI
+ hypothetical 44.8 kd protein from Escherichia coli (418
+ aa), FASTA scores, opt: 343, E(): 6.6e-15, (27.2% identity
+ in 408 aa overlap); etc. Also similar to Rv1979c from
+ Mycobacterium tuberculosis, FASTA score: (28.2% identity
+ in 277 aa overlap); Rv2127, Rv0346c, Rv0522, etc. SEEMS TO
+ BELONG TO THE APC FAMILY."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIU00629.1"
+ /db_xref="GOA:P63350"
+ /db_xref="InterPro:IPR002293"
+ /db_xref="UniProtKB/Swiss-Prot:P63350"
+ /translation="MRRPLDPRDIPDELRRRLGLLDAVVIGLGSMIGAGIFAALAPAA
+ YAAGSGLLLGLAVAAVVAYCNAISSARLAARYPASGGTYVYGRMRLGDFWGYLAGWGF
+ VVGKTASCAAMALTVGFYVWPAQAHAVAVAVVVALTAVNYAGIQKSAWLTRSIVAVVL
+ VVLTAVVVAAYGSGAADPARLDIGVDAHVWGMLQAAGLLFFAFAGYARIATLGEEVRD
+ PARTIPRAIPLALGITLAVYALVAVAVIAVLGPQRLARAAAPLSEAMRVAGVNWLIPV
+ VQIGAAVAALGSLLALILGVSRTTLAMARDRHLPRWLAAVHPRFKVPFRAELVVGAVV
+ AALAATADIRGAIGFSSFGVLVYYAIANASALTLGLDEGRPRRLIPLVGLIGCVVLAF
+ ALPLSSVAAGAAVLGVGVAAYGVRRIITRRARQTDSGDTQRSGHPSAT"
+ gene 2228535..2230148
+ /locus_tag="BQ2027_MB2023"
+ CDS 2228535..2230148
+ /locus_tag="BQ2027_MB2023"
+ /note="Mb2023, -, len: 537 aa. Equivalent to Rv2000, len:
+ 537 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 537 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb2023 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00630.1"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/Swiss-Prot:P64918"
+ /translation="MRPGFVGLGFGQWPVYVVRWPKLHLTPRQRKRVLHRRRLLTDRP
+ ISLSQIPIRTGGPMNDPWPRPTQGPAKTIETDYLVIGAGAMGMAFTDTLITESGARVV
+ MIDRACQPGGHWTTAYPFVRLHQPSAYYGVNSRALGNNTIDLVGWNQGLNELAPVGEI
+ CAYFDAVLQQQLLPTGRVDYFPMSEYLGDGRFRTLAGTEYVVTVNRRIVDATYLRAVV
+ PSMRPAPYSVAPGVDCVAPNELPKLGTRDRYVVVGAGKTGMDVCLWLLRNDVCPDKLT
+ WIMPRDSWLIDRATLQPGPTFVRQFRESYGATLEAIGAATSTDDLFDRLETAGTLLRI
+ DPSVRPSMYRCATVSHLELEQLRRIRDIVRMGHVQRIEPTTIVLDGGSVPATPTALYI
+ DCTADGAPQRPAKPVFDADHLTLQAVRGCQQVFSAAFIAHVEFAYEDDAVKNELCTPI
+ PHPDCDLDWMRLMHSDLGNFQRWLNDPDLTDWLSSARLNLLADLLPPLSHKPRVRERV
+ VSMFQKRLGTAGDQLAKLLDAATATTEQR"
+ gene 2230158..2230910
+ /locus_tag="BQ2027_MB2024"
+ CDS 2230158..2230910
+ /locus_tag="BQ2027_MB2024"
+ /note="Mb2024, -, len: 250 aa. Equivalent to Rv2001, len:
+ 250 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 250 aa overlap). Conserved hypothetical
+ protein. Similar to Mycobacterium tuberculosis Rv0466,
+ AL021933|MTV038_10 (264 aa), FASTA scores: opt: 592,
+ E():0, (38.0% identity in 263 aa overlap). Protein product
+ from Mb2024 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Acyl-ACP thioesterase"
+ /protein_id="SIU00631.1"
+ /db_xref="GOA:A0A1R3XZW3"
+ /db_xref="InterPro:IPR002864"
+ /db_xref="InterPro:IPR029069"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZW3"
+ /translation="MHHNRDVDLALVERPSSGYVYTTGWRLATTDIDEHQQLRLDGVA
+ RYIQEVGAEHLADAQLAEVHPHWIVLRTVIDVINPIELPSDITFHRWCAALSTRWCSM
+ RVQLQGSAGGHIETEGFWICVNKDTLTPSRLTDDCIARFGSTTENHRLKWRPWLTGPN
+ IDGTETPFPLRRTDIDPFEHVNNTIYWHGVHEILCQIPTLTAPYRAVLEYRSPIKSGE
+ PLTIRYEQHDDVVRMHFVVGDDVRAAALLRRL"
+ gene 2230986..2231768
+ /gene="fabG3"
+ /locus_tag="BQ2027_MB2025"
+ CDS 2230986..2231768
+ /gene="fabG3"
+ /locus_tag="BQ2027_MB2025"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2025, fabG3, len: 260 aa. Equivalent to Rv2002,
+ len: 260 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 260 aa overlap). Possible fabG3,
+ 20-beta-hydroxysteroid dehydrogenase (EC 1.1.1.53),
+ similar to e.g. 2BHD_STREX|P19992 20-beta-hydroxysteroid
+ dehydrogenase (255 aa), FASTA scores: opt: 718, E():
+ 2e-38, (49.8% identity in 243 aa overlap), and many
+ mycobacterial proteins. Contains PS00061 Short-chain
+ alcohol dehydrogenase family signature. BELONGS TO THE
+ SHORT-CHAIN DEHYDROGENASES/REDUCTASES (SDR) FAMILY.
+ Protein product from Mb2025 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2025 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE 20-BETA-HYDROXYSTEROID DEHYDROGENASE
+ FABG3 (Cortisone reductase) ((R)-20-hydroxysteroid
+ dehydrogenase)"
+ /protein_id="SIU00632.1"
+ /db_xref="GOA:P69166"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P69166"
+ /translation="MSGRLIGKVALVSGGARGMGASHVRAMVAEGAKVVFGDILDEEG
+ KAVAAELADAARYVHLDVTQPAQWTAAVDTAVTAFGGLHVLVNNAGILNIGTIEDYAL
+ TEWQRILDVNLTGVFLGIRAVVKPMKEAGRGSIINISSIEGLAGTVACHGYTATKFAV
+ RGLTKSTALELGPSGIRVNSIHPGLVKTPMTDWVPEDIFQTALGRAAEPVEVSNLVVY
+ LASDESSYSTGAEFVVDGGTVAGLAHNDFGAVEVSSQPEWVT"
+ gene complement(2231889..2232746)
+ /locus_tag="BQ2027_MB2026C"
+ CDS complement(2231889..2232746)
+ /locus_tag="BQ2027_MB2026C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2026c, -, len: 285 aa. Equivalent to Rv2003c,
+ len: 285 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 285 aa overlap). Conserved
+ hypothetical protein. Some similarity with Methanococcus
+ jannaschii 67555|U67555_3 (205 aa), FASTA scores: opt:
+ 357, E(): 3.2e-17, (33.8% identity in 204 aa overlap).
+ Protein product from Mb2026c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2026c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Methyltransferase type 11"
+ /protein_id="SIU00633.1"
+ /db_xref="GOA:P64920"
+ /db_xref="InterPro:IPR013216"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:P64920"
+ /translation="MVKRSRATRLSPSIWSGWESPQCRSIRARLLLPRGRSRPPNADC
+ CWNQLAVTPDTRMPASSAAGRDAAAYDAWYDSPTGRPILATEVAALRPLIEVFAQPRL
+ EIGVGTGRFADLLGVRFGLDPSRDALMFARRRGVLVANAVGEAVPFVSRHFGAVLMAF
+ TLCFVTDPAAIFRETRRLLADGGGLVIGFLPRGTPWADLYALRAARGQPGYRDARFYT
+ AAELEQLLADSGFRVIARRCTLHQPPGLARYDIEAAHDGIQAGAGFVAISAVDQAHEP
+ KDDHPLESE"
+ gene complement(2232804..2234300)
+ /locus_tag="BQ2027_MB2027C"
+ CDS complement(2232804..2234300)
+ /locus_tag="BQ2027_MB2027C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2027c, -, len: 498 aa. Equivalent to Rv2004c,
+ len: 498 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 498 aa overlap). Conserved
+ hypothetical protein similar to several e.g. >pir||T36945
+ hypothetical protein SCJ1.12 (508 aa) - Streptomyces
+ coelicolor >gi|5748625|emb|CAB53130.1| (AL109962).
+ Smith-Waterman score: 7e-94, Identities = 199/468 (42%).
+ Contains PS00017 ATP/GTP-binding site motif A. Protein
+ product from Mb2027c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2027c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Predicted kinase"
+ /protein_id="SIU00634.1"
+ /db_xref="GOA:P0A5G0"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5G0"
+ /translation="MDSPTNDGTCDAHPVTDEPFIDVRETHTAVVVLAGDRAFKAKKP
+ VVTDFCDFRTAEQRERACIREFELNSRLAAQSYLGIAHLSDPSGGHAEPVVVMRRYRD
+ KQRLASMVTAGLPVEGALDAIAEVLARFHQRAQRNRCIDTQGEVGAVARRWHENLAEL
+ RHHADKVVSGDVIRRIEHMVDEFVSGREVLFAGRIKEGCIVDGHADLLADDIFLVDGE
+ PALLDCLEFEDELRYLDRIDDAAFLAMDLEFLGRKDLGDYFLAGYAVRSGDTAPASLR
+ DFYIAYRAVVRAKVECVRFSQGKPEAAADAVRHLIIATQHLQHATVRLALVGGNPGTG
+ KSTLARGVAELVGAQVISTDDVRRRLRDCGVITGEPGVLDSGLYSRANVVAVYQEALR
+ KARLLLGSGHSVILDGTWGDPQMRACARRLAADTHSAIVEFRCSATVDVMADRIVARA
+ GGNSDATAEIAAALAARQADWDTGHRIDTAGPRERSVGQAYHIWRSAI"
+ gene complement(2234322..2235209)
+ /locus_tag="BQ2027_MB2028C"
+ CDS complement(2234322..2235209)
+ /locus_tag="BQ2027_MB2028C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2028c, -, len: 295 aa. Equivalent to Rv2005c,
+ len: 295 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 295 aa overlap). Conserved
+ hypothetical protein, similar to MTCY39.23c, (50.3%
+ identity in 316 aa overlap), C-terminus shows some
+ similarity with YXIE_BACSU P42297 hypothetical 15.9 kd
+ protein in bglh- (148 aa), FASTA scores, opt: 124, E():
+ 0.038, (28.5% identity in 144 aa overlap), also similar to
+ Rv2623 (294 aa), (52.7% identity in 296 aa overlap) and
+ other Mycobacterium tuberculosis hypothetical proteins
+ e.g. Rv1996, Rv2624c, Rv2028c, Rv3134c, Rv1636. Some,
+ possibly all, of these belong to universal stress protein
+ family. Protein product from Mb2028c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2028c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="universal stress protein family protein"
+ /protein_id="SIU00635.1"
+ /db_xref="GOA:P64922"
+ /db_xref="InterPro:IPR006015"
+ /db_xref="InterPro:IPR006016"
+ /db_xref="UniProtKB/Swiss-Prot:P64922"
+ /translation="MSKPRKQHGVVVGVDGSLESDAAACWGATDAAMRNIPLTVVHVV
+ NADVATWPPMPYPETWGVWQEDEGRQIVANAVKLAKEAVGADRKLSVKSELVFSTPVP
+ TMVEISNEAEMVVLGSSGRGALARGLLGSVSSSLVRRAGCPVAVIHSDDAVIPDPQHA
+ PVLVGIDGSPVSELATAVAFDEASRRGVELIAVHAWSDVEVVELPGLDFSAVQQEAEL
+ SLAERLAGWQERYPDVPVSRVVVCDRPARKLVQKSASAQLVVVGSHGRGGLTGMLLGS
+ VSNAVLHAARVPVIVARQS"
+ gene 2235328..2239311
+ /gene="otsB1"
+ /locus_tag="BQ2027_MB2029"
+ CDS 2235328..2239311
+ /gene="otsB1"
+ /locus_tag="BQ2027_MB2029"
+ /standard_name="otsB"
+ /note="Mb2029, otsB1, len: 1327 aa. Equivalent to Rv2006,
+ len: 1327 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.8% identity in 1327 aa overlap). Probable
+ otsB1, trehalose-6-phosphate phosphatase (EC 3.1.3.12)
+ (see citations below); strong similarity in central domain
+ to OTSB_ECOLI P31678 trehalose-phosphatase (266 aa) and M.
+ leprae TREHALOSE-PHOSPHATASE Q49734 (429 aa). Belongs to
+ Glycosyl hydrolases family 65
+ (http://www.expasy.ch/cgi-bin/lists?glycosid.txt). FASTA
+ scores, sp|Q49734|Q49734 PUTATIVE TREHALOSE-PHOSPHATASE
+ (429 aa) opt: 1283 E(): 0; 51.7% identity in 420 aa
+ overlap opt: 278, E(): 3.6e-11, (29.4% identity in 255 aa
+ overlap). Note that previously known as otsB. Protein
+ product from Mb2029 detected using SWATH mass
+ spectrometry. Mb2029 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TREHALOSE-6-PHOSPHATE PHOSPHATASE OTSB1
+ (TREHALOSE-PHOSPHATASE) (TPP)"
+ /protein_id="SIU00636.1"
+ /db_xref="GOA:A0A1R3XZZ3"
+ /db_xref="InterPro:IPR003337"
+ /db_xref="InterPro:IPR005194"
+ /db_xref="InterPro:IPR005195"
+ /db_xref="InterPro:IPR005196"
+ /db_xref="InterPro:IPR006379"
+ /db_xref="InterPro:IPR008928"
+ /db_xref="InterPro:IPR011013"
+ /db_xref="InterPro:IPR012341"
+ /db_xref="InterPro:IPR023198"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="InterPro:IPR037018"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZZ3"
+ /translation="MRCGIVVNVTGPPPTIDRRYHDAVIVGLDNVVDKATRVHAAAWT
+ KFLDDYLTRRPQRTGEDHCPLTHDDYRRFLAGKPDSVADFLAARGIRLPPGSPTDLTD
+ DTVYGLQNLERQTFLQLLNTGVPEGKSIASFARRLQVAGVRVAAHTSHRNYGHTLDAT
+ GLAEVFAVFVDGAVTAELGLPAEPNPAGLIETAKRLGANPGRCVVIDSCQTGLRAGRN
+ GGFALVIAVDAHGDAENLLSSGADAVVADLAAVTVGSGDAAISTIPDALQVYSQLKRL
+ LTGRRPAVFLDFDGTLSDIVERPEAATLVDGAAEALRALAAQCPVAVISGRDLADVRN
+ RVKVDGLWLAGSHGFELVAPDGSHHQNAAATAAIDGLAEAAAQLADALREIAGAVVEH
+ KRFAVAVHYRNVADDSVDNLIAAVRRLGHAAGLRVTTGRKVVELRPDIAWDKGKALDW
+ IGERLGPAEVGPDLRLPIYIGDDLTDEDAFDAVRFTGVGIVVRHNEHGDRRSAATFRL
+ ECPYTVCQFLSQLACDLQEAVQHDDPWTLVFHGYDPGQERLREALCAVGNGYLGSRGC
+ APESAESEAHYPGTYVAGVYNQLTDHIEGCTVDNESLVNLPNWLSLTFRIDGGAWFNV
+ DTVELLSYRQTFDLRRATLTRSLRFRDAGGRVTTMTQERFASMNRPNLVALQTRIESE
+ NWSGTVDFRSLVDGGVHNTLVDRYRQLSSQHLTTAEIEVLADSVLLRTQTSQSGIAIA
+ VAARSTLWRDGQRVDAQYRVARDTNRGGHDIQVTLSAGQSVTLEKVATIFTSRDAATL
+ TAAISAQRCLGEAGRYAELCQQHVRAWARLWERCAIDLTGNTEELRLVRLHLLHLLQT
+ ISPHTAELDAGVPARGLNGEAYRGHVFWDALFVAPVLSLRMPKVARSLLDYRYRRLPA
+ ARRAAHRAGHLGAMYPWQSGSDGSEVSQQLHLNPRSGRWTPDPSDRAHHVGLAVAYNA
+ WHYYQVTGDRQYLVDCGAELLVEIARFWVGLAKLDDSRGRYLIRGVIGPDEFHSGYPG
+ NEYDGIDNNAYTNVMAVWVILRAMEALDLLPLTDRRHLIEKLGLTTQERDQWDDVSRR
+ MFVPFHDGVISQFEGYSELAELDWDHYRHRYGNIQRLDRILEAEGDSVNNYQASKQAD
+ ALMLLYLLSSDELIGLLARLGYRFAPTQIPGTVDYYLARTSDGSTLSAVVHAWVLARA
+ NRSNAMEYFRQVLRSDIADVQGGTTQEGIHLAAMAGSIDLPQRCYSGLELRDDRLVLS
+ PQWPEALGPLEFPFVYRRHQLSLRISGRSATLTAESGDAEPIEVECRGHVQRLRCGHT
+ IEVGCSR"
+ gene 2239359..2240586
+ /locus_tag="BQ2027_IS1607"
+ mobile_element 2239359..2240586
+ /locus_tag="BQ2027_IS1607"
+ /note="IS1607, len: 1228 nt. Equivalent to IS1607, len:
+ 1228 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(99.8% identity in 1084 nt overlap)."
+ /mobile_element_type="insertion sequence:IS1607"
+ gene complement(2239410..2239754)
+ /gene="fdxA"
+ /locus_tag="BQ2027_MB2030C"
+ CDS complement(2239410..2239754)
+ /gene="fdxA"
+ /locus_tag="BQ2027_MB2030C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2030c, fdxA, len: 114 aa. Equivalent to Rv2007c,
+ len: 114 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 114 aa overlap). Probable fdxA,
+ ferredoxin, similar to e.g. FER_MYCSM P00215 ferredoxin,
+ Mycobacterium smegmatis (106 aa), FASTA scores, opt: 448,
+ E(): 1 .6e-21, (58.7% identity in 109 aa overlap), also
+ similar to Rv0886|MTCY31.14, (34.2% identity in 117 aa
+ overlap) and fdxC|Rv1177. Protein product from Mb2030c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2030c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ferredoxin fdxa"
+ /protein_id="SIU00637.1"
+ /db_xref="GOA:P64123"
+ /db_xref="InterPro:IPR000813"
+ /db_xref="InterPro:IPR017896"
+ /db_xref="UniProtKB/Swiss-Prot:P64123"
+ /translation="MTYVIGSECVDVMDKSCVQECPVDCIYEGARMLYINPDECVDCG
+ ACKPACRVEAIYWEGDLPDDQHQHLGDNAAFFHQVLPGRVAPLGSPGGAAAVGPIGVD
+ TPLVAAIPVECP"
+ gene complement(2239943..2241268)
+ /locus_tag="BQ2027_MB2031C"
+ CDS complement(2239943..2241268)
+ /locus_tag="BQ2027_MB2031C"
+ /note="Mb2031c, -, len: 441 aa. Equivalent to Rv2008c,
+ len: 441 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 441 aa overlap). Conserved
+ hypothetical protein. Contains PS00017 ATP/GTP-binding
+ site motif A, PS00501 Signal peptidases I serine active
+ site. Also contains helix-turn-helix motif at aa 258-279.
+ Similar to several conserved hypothetical proteins e.g.
+ NP_085874.1|14028123|dbj|BAB54715.1 hypothetical protein
+ from Mesorhizobium loti (435 aa). Smith-Waterman score:
+ 1e-74, Identities = 158/359 (44%) Protein product from
+ Mb2031c detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="ATPase, AAA family"
+ /protein_id="SIU00638.1"
+ /db_xref="GOA:P64924"
+ /db_xref="InterPro:IPR025420"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR041682"
+ /db_xref="UniProtKB/Swiss-Prot:P64924"
+ /translation="MDEIESLIGLRPTPLTWPVVIAGDFLGVWDPPPSLPGAANHEIS
+ APTARISCMLIERRDAAARLRRALHRAPVVLLTGPRQAGKTTLSRLVGKSAPECTFDA
+ ENPVDATRLADPMLALSGLSGLITIDEAQRIPDLFPVLRVLVDRPVMPARFLILGSAS
+ PDLVGLASESLAGRVELVELSGLTVRDVGSSAADRLWLRGGLPPSFTARSNEDSAAWR
+ DGYITTFLERDLAQLGVRIPAATMRRAWTMLAHYHGQLFSGAELARSLDVAQTTARRY
+ LDALTDALVVRQLTPWFANIGKRQRRSPKIYIRDTGLLHRLLGIDDRLALERNPKLGA
+ SWEGFVLEQLAALLAPNPLYYWRTQQDAELDLYVELSGRPYGFEIKRTSTPSISRSMR
+ SALVDLQLARLAIVYPGEHRFPLSDTVVAVPADQILTTGSVDELLALLK"
+ gene 2241356..2241598
+ /gene="vapb15"
+ /locus_tag="BQ2027_MB2032"
+ CDS 2241356..2241598
+ /gene="vapb15"
+ /locus_tag="BQ2027_MB2032"
+ /note="Mb2032, -, len: 80 aa. Equivalent to Rv2009, len:
+ 80 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.8% identity in 80 aa overlap). Conserved hypothetical
+ protein, very similar to Rv1560|MTCY48.05c (54.4% identity
+ in 68 aa overlap). Mb2032 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="antitoxin vapb15"
+ /protein_id="SIU00639.1"
+ /db_xref="InterPro:IPR019239"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y019"
+ /translation="MYSGVVSRTNIEIDDELVAAAQRMYRLDSKRSAVDLALRRLVGE
+ PLGRDEALALQGSGFDFSDDEIESFSDTDRKLADES"
+ gene 2241599..2241997
+ /gene="vapc15"
+ /locus_tag="BQ2027_MB2033"
+ CDS 2241599..2241997
+ /gene="vapc15"
+ /locus_tag="BQ2027_MB2033"
+ /note="Mb2033, -, len: 132 aa. Equivalent to Rv2010, len:
+ 132 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 132 aa overlap). Conserved
+ hypothetical protein, similar to Rv1561|MTCY48.04c, (38.1%
+ identity in 126 aa overlap) Protein product from Mb2033
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2033 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="toxin vapc15"
+ /protein_id="SIU00640.1"
+ /db_xref="GOA:P64926"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/Swiss-Prot:P64926"
+ /translation="MIVDTSVWIAYLSTSESLASRWLADRIAADSTVIVPEVVMMELL
+ IGKTDEDTAALRRRLLQRFAIEPLAPVRDAEDAAAIHRRCRRGGDTVRSLIDCQVAAM
+ ALRIGVAVAHRDRDYEAIRTHCGLRTEPLF"
+ gene complement(2242180..2242611)
+ /locus_tag="BQ2027_MB2034C"
+ CDS complement(2242180..2242611)
+ /locus_tag="BQ2027_MB2034C"
+ /note="Mb2034c, -, len: 143 aa. Equivalent to Rv2011c,
+ len: 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 143 aa overlap). Conserved
+ hypothetical protein, some similarity to putative
+ regulatory proteins e.g. putative marR-family regulatory
+ protein from Streptomyces coelicolor A3(2) (157 aa),
+ emb|CAB63189.1| (AL133469) 34% identity in 110 aa overlap.
+ Low similarity to PETP_RHOCA P31078 petp protein.
+ Rhodobacter capsulatus (166 aa), FASTA scores, opt: 101,
+ E(): 0 .36, (31.8% identity in 88 aa overlap)"
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, MarR family"
+ /protein_id="SIU00641.1"
+ /db_xref="GOA:P64928"
+ /db_xref="InterPro:IPR000835"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P64928"
+ /translation="MSDEIARLVADVFELAGLLRRSGEVVAAREGHTQARWQLLSVVS
+ DRALTVPQAARRLGVTRQGVQRVANDLVVCGLAELRHNPDHRTSPLLVLTENGRRVLQ
+ AITERAIVVNNRLADAVDPAALQATRDSLRRMIVALKAERP"
+ gene 2242652..2243146
+ /locus_tag="BQ2027_MB2035"
+ CDS 2242652..2243146
+ /locus_tag="BQ2027_MB2035"
+ /note="Mb2035, -, len: 164 aa. Equivalent to Rv2012, len:
+ 164 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 164 aa overlap). Conserved
+ hypothetical protein, similar to AAK04358.1|AE006263_5
+ hypothetical protein from Lactococcus lactis (137 aa),
+ (48% identity in 129 aa overlap). Protein product from
+ Mb2035 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Phage envelope protein"
+ /protein_id="SIU00642.1"
+ /db_xref="InterPro:IPR009833"
+ /db_xref="InterPro:IPR036696"
+ /db_xref="UniProtKB/Swiss-Prot:P64930"
+ /translation="MLSKSKRSCRRRETLRIGEKMSAPITNLQAAQRDAIMNRPAVNG
+ FPHLAETLRRAGVRTNTWWLPAMQSLYETDYGPVLDQGVPLIDGVAEVPAFDRTALVT
+ ALRADQAGQTSFREFAAAAWRAGVLRYVVDLENRTCTYFGLHDQTYMEHYAAVEPSGG
+ APTS"
+ gene 2243769..2244996
+ /locus_tag="BQ2027_IS1607"
+ gene 2243850..2244470
+ /locus_tag="BQ2027_MB2036"
+ CDS 2243850..2244470
+ /locus_tag="BQ2027_MB2036"
+ /note="Mb2036, -, len: 206 aa. Similar to Rv2013, len: 159
+ aa, from Mycobacterium tuberculosis strain H37Rv. Possible
+ transposase: shows similarity to N-terminal part of
+ transposase and insertion element hypothetical proteins eg
+ sp|Q53198|Y4UE_RHISN PUTATIVE TRANSPOSASE Y4UE (359 aa)
+ opt: 383, E(): 1.3e-18; 35.1% identity in 225 aa overlap;
+ sp|P 14707|YM3_STRCO MINI-CIRCLE HYPOTHETICAL 45.7 KD P
+ (414 aa) opt: 302, E(): 4.2e-13; 33.3% identity in 207 aa
+ overlap; and YI90_MYCPA P14322 insertion element is900
+ hypothetical protein (399 aa), FASTA scores, opt: 146,
+ E(): 0.0021, (26.9% identity in 145 aa overlap). Length
+ changed since first submission (no clear start apparent).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base transition (c-t) at the 5' start of Mb2036,
+ leads to a longer product with a different NH2 part
+ compared toits homolog in Mycobacterium tuberculosis
+ strain H37Rv (206 aa versus 159 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="transposase"
+ /protein_id="SIU00643.1"
+ /db_xref="GOA:A0A1R3XZY3"
+ /db_xref="InterPro:IPR002525"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZY3"
+ /translation="MSIVDARGREVRRATIEHNAAGLRELLELLSRAGAREVAIERPD
+ GPVVDTLLEAGITVVVISPNQLKNLRGRYGSAGNKDDRFDAFVLADTLRTDRSRLRPL
+ LPDTPATATLRRTCRPRKDLVAHRVALANQLRAHLRVVFPGVVGLFADLDSPISLAFL
+ TFLPRFDCQDRADWLSVKRLAGWLAAAGYCGRAPRPAHRCPARRHR"
+ gene 2244424..2245014
+ /locus_tag="BQ2027_MB2037"
+ CDS 2244424..2245014
+ /locus_tag="BQ2027_MB2037"
+ /note="Mb2037, -, len: 196 aa. Equivalent to Rv2014, len:
+ 196 aa, from Mycobacterium tuberculosis strain H37Rv, ().
+ Possible transposase, similar to insertion elements e.g.
+ sp|P14707|YM3_STRCO MINI-CIRCLE HYPOT HETICAL 45.7 KD P
+ (414 aa) opt: 249 z-score: 307.0 E(): 1.4e-09; 33.1%
+ identity in 169 aa overlap; and YI90_MYCPA P14322
+ insertion element is900 hypothetical protein (399 a a),
+ FASTA scores, opt: 242, z-score: 299.9, E(): 3.7e-10, (3
+ 2.5% identity in 163 aa overlap); possibly made by
+ frameshifting with respect to upstream ORF. Length changed
+ since first submission."
+ /codon_start=1
+ /transl_table=11
+ /product="transposase"
+ /protein_id="SIU00644.1"
+ /db_xref="GOA:A0A1R3Y237"
+ /db_xref="InterPro:IPR003346"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y237"
+ /translation="MLHDRLTGAPRGATGDEGAANAHITRAMVAALTSVATQIKTLDA
+ QIAEQLSLHADAHIFTSLPRSGTVRAARLLAEIGDCRARFPTPESLACLAGVAPSTRQ
+ SGKVKHVGFRWAADKQLRDAVCDFAGDSRRANLWAADRYNRAIARGHDHPHAVRILAR
+ AWLYAIWHCWQDGAAYHPANHRALQALLNQDQDRAA"
+ gene complement(2245142..2246398)
+ /locus_tag="BQ2027_MB2038C"
+ CDS complement(2245142..2246398)
+ /locus_tag="BQ2027_MB2038C"
+ /note="Mb2038c, -, len: 418 aa. Equivalent to Rv2015c,
+ len: 418 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 418 aa overlap). Conserved hypothetical
+ protein. Nearly identical to Mycobacterium tuberculosis
+ Rv1765c|MTCY28.31c, (378 aa), an ORF starting next to
+ ISB9, and ending in IS6110. Different N-terminus chosen
+ and C-terminus differs as that of Rv1765c has been
+ truncated by IS6110. Does NOT show similarities with
+ transposases. BLAST hits with non-IS part of MTU78639.
+ FASTA scores: Z95890|MTCY28_31 (378 aa) opt: 2417, E(): 0,
+ (97.8% identity in 364 aa overlap). Mb2038c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HNH endonuclease domain protein"
+ /protein_id="SIU00645.1"
+ /db_xref="GOA:A0A1R3Y0Q9"
+ /db_xref="InterPro:IPR002711"
+ /db_xref="InterPro:IPR003615"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Q9"
+ /translation="MSSTATSGAAVVSPAERVEVLFEELAELAGQRNAIDGRIVEIVA
+ ELDRDGLWGVTGARLVAGLVAWKMGCSSGNAHTIATVARRLPEFPRCARGMREGRLSL
+ DQVGVIAGRAGEGSDAHYAQLAGVATVNQLRTALKLEPRPEPEPDFRPEPRPSITRSA
+ DEQFSCWRIKLPHVEAAKFDAALQSHLDALIAEYKRDHDNSDGVSDQRPPLPGNVEAF
+ LRLVEAGWDAEVARRPHGQHTTVVMHLDVQERAAGLHLGPLLSESERRYLLCDATFEA
+ WFERDGQVIGCGRTTRQINRRLRRALEHRDRTCVVPGCGATRGLHAHHIRHWQDGGAT
+ ELANLVLVCPYHHRAHHRGLITITGPADNLTVADSAGRPLSAGSLARASTKPPPAVAP
+ WPGPTGERADWWWYEPFQPQPPPISN"
+ gene 2246752..2247327
+ /locus_tag="BQ2027_MB2039"
+ CDS 2246752..2247327
+ /locus_tag="BQ2027_MB2039"
+ /note="Mb2039, -, len: 191 aa. Equivalent to Rv2016, len:
+ 191 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 191 aa overlap). Hypothetical protein.
+ Protein product from Mb2039 detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00646.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y002"
+ /translation="MTELGDKFLAALVGTIRDTRFDIADMRNWRPGWFPTMHSRCLSN
+ LIHDRIWAHLVTLIASNPGTSIKDKGATREIVVGAHLRLRIKRHHAGDEISTYPTRTA
+ IEFWQQGSQPAFPGLEEVRIAVGYRWDPDTREIGAPLLSLRDGKDHVIWVVELDEPAA
+ GVKITWTPIEPTLPSIDFGDLGEDSGASGER"
+ gene 2247324..2248364
+ /locus_tag="BQ2027_MB2040"
+ CDS 2247324..2248364
+ /locus_tag="BQ2027_MB2040"
+ /note="Mb2040, -, len: 346 aa. Equivalent to Rv2017, len:
+ 346 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 346 aa overlap). Hypothetical
+ regulatory protein, shows similarity at N-terminal end to
+ several transcriptional regulators e.g. Bacillus subtilis
+ BSUB0012_44 (108 aa). Contains PS00142 Neutral zinc
+ metallopeptidases, zinc-binding region signature in
+ C-terminal half, may be fortuitous. FASTA scores:
+ Z99115|BSUB0012_44 Bacillus subtilis (108 aa) opt: 154,
+ E(): 0.0012; 35.5% identity in 62 aa overlap. Contains
+ probable helix-turn-helix motif at aa 18-39 (Score 2243,
+ +6.83 SD)"
+ /codon_start=1
+ /transl_table=11
+ /product="transcriptional regulatory protein"
+ /protein_id="SIU00647.1"
+ /db_xref="GOA:A0A1R3Y0C4"
+ /db_xref="InterPro:IPR001387"
+ /db_xref="InterPro:IPR010359"
+ /db_xref="InterPro:IPR010982"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0C4"
+ /translation="MNGLGDVLAVARKARGLTQIELAELVGLTQPAINRYESGDRDPD
+ QHIVAKLAEILGVTDDLLIHGNRFRGALAVDAHMRRHKTTKASAWRQLEARLNLLRVH
+ ASFLFEEVAINSEQHVPAFDPEFTAAEDAARLVRAQWRMPMGPVVNLTRWMEAAGCLV
+ FEEDFATQRIDGLSQWVDDYPVMLINANAAPDRKRLTLAHELGHLVLHSTNPTENMET
+ EATAFAAEFLMPESEIRPELRRLDLGKLLELKREWGVSMQALLERAYRMGLVSAEART
+ KLYKAMNARGWKTKEPGIESIVREKPSLPAHIGMTLRSRGFTDQQAAAIAGYANPADN
+ PFRPEGGRLHAI"
+ gene 2248606..2249325
+ /gene="vapB45"
+ /locus_tag="BQ2027_MB2041"
+ CDS 2248606..2249325
+ /gene="vapB45"
+ /locus_tag="BQ2027_MB2041"
+ /note="Mb2041, -, len: 239 aa. Equivalent to Rv2018, len:
+ 239 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 239 aa overlap). Conserved hypothetical
+ protein, similar to Rv2308|MTCY339.01c (238 aa). FASTA
+ scores: Z77163|MTCY339_1 Mycobacterium tuberculosis cosmid
+ (238 aa) opt: 142, E(): 0.029; (24.8% identity in 250 aa
+ overlap). Contains probable helix-turn-helix motif at aa
+ 215-236 (Score 1175, +3.19 SD). Protein product from
+ Mb2041 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2041 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative antitoxin VapB45"
+ /protein_id="SIU00648.1"
+ /db_xref="GOA:A0A1R3XZX8"
+ /db_xref="InterPro:IPR007367"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR017277"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZX8"
+ /translation="MAGDQELELRFDVPLYTLAEASRYLVVPRATLATWADGYERRPA
+ NAPAVQGQPIITALPHPTGSHARLPFVGIAEAYVLNAFRRAGVPMQRIRPSLDWLIKN
+ VGPHALASQDLCTGGAEVLWRFAERSGEGSPDDLVVRGLIVPRSGQYVFKEIVEHYLQ
+ QISFADDNLASMIRLPQYGDANVVLDPRRGYGQPVFDGSGVRVADVLGPLRAGATFQA
+ VADDYGVTPDQLRDALDAIAA"
+ gene 2249315..2249731
+ /gene="vapC45"
+ /locus_tag="BQ2027_MB2042"
+ CDS 2249315..2249731
+ /gene="vapC45"
+ /locus_tag="BQ2027_MB2042"
+ /EC_number="3.1.-.-"
+ /note="Mb2042, -, len: 138 aa. Equivalent to Rv2019, len:
+ 138 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 138 aa overlap). Hypothetical protein.
+ Protein product from Mb2042 detected using SWATH mass
+ spectrometry. Mb2042 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative ribonuclease VapC45 (RNase VapC45) (EC
+ (Toxin VapC45)"
+ /protein_id="SIU00649.1"
+ /db_xref="InterPro:IPR041375"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y032"
+ /translation="MQPDRNLLADLDHIFVDRSLGAVQVPQLLRDAGFRLTTMREHYG
+ ETQAQSVSDHKWIAMTAECGWIGFHKDANIRRNAVERRTVLDTGARLFCVPRADILAE
+ QVAARYIASLAAIARAARFPGPFIYTVHPSKIVRVL"
+ gene complement(2249747..2250046)
+ /locus_tag="BQ2027_MB2043C"
+ CDS complement(2249747..2250046)
+ /locus_tag="BQ2027_MB2043C"
+ /note="Mb2043c, -, len: 99 aa. Equivalent to Rv2020c, len:
+ 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 99 aa overlap). Conserved hypothetical
+ protein, nearly identical to C-terminal part of
+ hypothetical protein RvD1-Rv2024c' from Mycobacterium
+ bovis BCG (1606 aa) emb|CAB44655.1| (Y18605). Corresponds
+ to deletion region RvD1 so probably truncated protein.
+ Mb2043c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative helicase"
+ /protein_id="SIU00650.1"
+ /db_xref="InterPro:IPR041635"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y013"
+ /translation="MAPGMKWAAKTDHLAIVLLPRHHRRHSRRGRALPARSRSALGWI
+ IERYRVTTDKASGIVNDPNDWCDEHDDPTYIVDLIKKVTTVSVETMKIVDGLAGG"
+ gene complement(2250131..2250436)
+ /locus_tag="BQ2027_MB2044C"
+ CDS complement(2250131..2250436)
+ /locus_tag="BQ2027_MB2044C"
+ /note="Mb2044c, -, len: 101 aa. Equivalent to Rv2021c,
+ len: 101 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 101 aa overlap). Unknown, possible
+ regulatory protein similar to Mycobacterium tuberculosis
+ hypothetical protein Rv3183, MTV014.27 (EMBL; AL021646).
+ FASTA scores; TR:E12487 74 (109 aa) opt: 214 E(): 1.2e-09,
+ 43.0% identity in 107 aa overlap. Contains probable
+ helix-turn-helix at aa 45-66 (Score 1472, +4.20 SD)
+ Protein product from Mb2044c detected using SWATH mass
+ spectrometry. Mb2044c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="transcriptional regulatory protein"
+ /protein_id="SIU00651.1"
+ /db_xref="GOA:A0A1R3XZX6"
+ /db_xref="InterPro:IPR001387"
+ /db_xref="InterPro:IPR010982"
+ /db_xref="InterPro:IPR039554"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZX6"
+ /translation="MAMTLRDMDAVRPVNREAVDRHKARMRDEVRAFRLRELRAAQSL
+ TQVQVAALAHIRQSRVSSIENGDIGSAQVNTLRKYVSALGGELDITVRLGDETFTLA"
+ gene complement(2250445..2251050)
+ /gene="higB2"
+ /locus_tag="BQ2027_MB2045C"
+ CDS complement(2250445..2251050)
+ /gene="higB2"
+ /locus_tag="BQ2027_MB2045C"
+ /note="Mb2045c, -, len: 201 aa. Equivalent to Rv2022c,
+ len: 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 201 aa overlap). Conserved
+ hypothetical protein, similar to Mycobacterium
+ tuberculosis hypothetical protein Rv3182, MTV014.26
+ (EMBL:AL 021646). FASTA scores; TR:E1248773 (114 aa) opt:
+ 335, E(): 3e-22, 53.8% identity in 106 aa overlap and to
+ hypothetical proteins from Yersinia pestis (115 aa) e.g.
+ emb|CAB53172.1| (AL109969), 41% identity in 108 aa
+ overlap. Protein product from Mb2045c detected using
+ shotgun mass spectrometry. Mb2045c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Toxin HigB"
+ /protein_id="SIU00652.1"
+ /db_xref="InterPro:IPR009241"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y021"
+ /translation="MNVPWENAHGGALYCLIRGDEFSAWHRLLFQRPGCAESVLACRH
+ FLDGSPVARCSYPEEYHPCVISRIALLCDSVGWTADVERISAWLNGLDRETYELVFAA
+ IEVLEEEGPALGCPLVDTVRGSRHKNMKELRPGSQGRSEVRILFAFDPARQAIMLAAG
+ NKAGRWTQWYDEKIKAADEMFAEHLAQFEDTKPKRRKRKKG"
+ gene complement(2251075..2251434)
+ /locus_tag="BQ2027_MB2046C"
+ CDS complement(2251075..2251434)
+ /locus_tag="BQ2027_MB2046C"
+ /note="Mb2046c, -, len: 119 aa. Equivalent to Rv2023c,
+ len: 119 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 119 aa overlap). Hypothetical protein,
+ alternative upstream start possible. Mb2046c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00653.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZZ5"
+ /translation="MAARHARAGRWAAQPRPMLGSGAVRYEVGANIDATGFGGIAAVH
+ RLVTRLGLVTRLGLVERVDAHSRFSSSNLPKSSRRISGRVSLSGMSNSAAKVVASTSS
+ SPWGQPLSVGLRRRWRS"
+ gene complement(2251594..2252271)
+ /locus_tag="BQ2027_MB2047C"
+ CDS complement(2251594..2252271)
+ /locus_tag="BQ2027_MB2047C"
+ /note="Mb2047c, -, len: 225 aa. No equivalent in
+ Mycobacterium tuberculosis strain H37Rv, but equivalent to
+ MT2080, len: 225 aa, from Mycobacterium tuberculosis
+ strain CDC1551, (100.0% identity in 225 aa overlap).
+ Hypothetical unknown protein.
+ REMARK-M.bovis-M.tuberculosis: Belongs to the RvD1 region.
+ Absent in Mycobacterium tuberculosis strain H37Rv. Mb2047c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00654.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y244"
+ /translation="MVQRYPFRMVQRTPAMTSVAQLEHYLEEHLTKELAWLLRAATEW
+ HAQHCMNLGIDGYSMQVYALDSTVLHARTLFEFFTQNTSVGQNANYYNCTVYKVPLIG
+ SILYQFHWRRPIHSHMMHAQDRRPVTQLPTYDDHAQTKPLNEMPVDFAKEIVRLWRVF
+ VKDLNNHTNLQFRPIGATAQTALASEINAAKRVRTNDVTQRQIAVGKETSRLEPNFSI
+ PQIEWPA"
+ gene complement(2252666..2253562)
+ /locus_tag="BQ2027_MB2048C"
+ CDS complement(2252666..2253562)
+ /locus_tag="BQ2027_MB2048C"
+ /note="Mb2048c, -, len: 298 aa. No equivalent in
+ Mycobacterium tuberculosis strain H37Rv, but equivalent to
+ MT2081, len: 311 aa, from Mycobacterium tuberculosis
+ strain CDC1551, (99.66% identity in 298 aa overlap).
+ Hypothetical unknown protein.
+ REMARK-M.bovis-M.tuberculosis: Belongs to the RvD1 region.
+ Absent in Mycobacterium tuberculosis strain H37Rv. Mb2048c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00655.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0R8"
+ /translation="MTLIQTVTTDDLVIQVADRRLSRPDGSVFDDDYTKLVCWNTSFT
+ VGFTGLARIDPAQKKSTSEWLAETLCDYASFEDGVDALRYWASGQIGQLPTGKGWEDK
+ RLGIIIAGFDRRRIPLVAEISNFDPEAPIPANQNEFKCYRIRRAPGHSASFRITGAAL
+ TEKMYANILLRRVPRMLKQQDGITRAARLMVALQRRISEDNPGVGRHAMAVAIPRERT
+ MPAVLSNLDAPSLNTMNSNFCYFDDAGFNYKQLGPHMAGGGWAWADFVAEADPSNPDM
+ QKVGGRVLKCPQPPPQAESTGC"
+ gene complement(2253746..2258566)
+ /locus_tag="BQ2027_MB2049C"
+ CDS complement(2253746..2258566)
+ /locus_tag="BQ2027_MB2049C"
+ /note="Mb2049c, RvD1-Rv2024c, len: 1606 aa. Equivalent to
+ Rv2024c and similar to Rv2020c, len: 515 aa and 99 aa,
+ from Mycobacterium tuberculosis strain H37Rv, (99.2%
+ identity in 506 aa overlap and 67.0% identity in 97 aa
+ overlap). Rv2024c: Conserved hypothetical protein.
+ Identical to N-terminal part of much larger hypothetical
+ protein, RvD1-Rv2024c' (1606 aa), from Mycobacterium bovis
+ BCG: CAB44655.1|Y18605|13881753|AAK46361.1|AE007059 so
+ probably truncated. Part of RvD1 chromosomal deletion
+ region. Also similar to hypothetical protein from
+ Helicobacter pylori. FASTA scores: AE0005|HPAE000580_2
+ Helicobacter pylori (607 aa) opt: 64, E(): 0, (36.2%
+ identity in 464 aa overlap). Rv2020c: Conserved
+ hypothetical protein, nearly identical to C-terminal part
+ of hypothetical protein RvD1-Rv2024c' from Mycobacterium
+ bovis BCG (1606 aa) emb|CAB44655.1| (Y18605). Corresponds
+ to deletion region RvD1 so probably truncated protein.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, a large deletion region (RvD1)
+ exists in between Rv2023 and Rv2024. In Mycobacterium
+ bovis a 5000 bp insertion at this region results in
+ Mb2049c being a much larger product with a different COOH
+ part (1606 aa versus 515 aa). Protein product from Mb2049c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2049c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative helicase"
+ /protein_id="SIU00656.1"
+ /db_xref="GOA:A0A1R3Y012"
+ /db_xref="InterPro:IPR001650"
+ /db_xref="InterPro:IPR002052"
+ /db_xref="InterPro:IPR006935"
+ /db_xref="InterPro:IPR011335"
+ /db_xref="InterPro:IPR014001"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="InterPro:IPR039442"
+ /db_xref="InterPro:IPR041635"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y012"
+ /translation="MGSVHDVIEAFRKAPSNAERGTKFEQLMVRYFELDPTMAQQYDA
+ VWRWIDWPERRGRTDTGIDLVARERDTGNYTAIQCKFYEPTHTLAKGDIDSFFTASGK
+ TGFTNRVIISTTDRWGRNAEDALADQLVPVQRIGMAEIAESPIDWDIAWPAGDLQVNL
+ TPAKRHELRPHQQQAIDAVFRGFAVGNDRGKLIMACGTGKTFTALKIAERIAADNGGS
+ ARILLLVPSISLLSQTLREWTAQSELDVRAFAVCSDTKVSRSAEDYHVHDVPIPVTTD
+ ARVLLHEMAHRRCAQGLTVVFCTYQSLPTVAKAQRLGVDEFDLVMCDEAHRTTGVTLA
+ GDDESNVVRVHDGQYLKAARRLYMTATPRIFTESIKDRADQHSAELVSMDDELTFGPE
+ FHRLSFGEAVERGLLTDYKVMVLTVDQGVIAPRLQQELSGVSGELMLDDASKIVGCWN
+ GLAKRSGTGIVAGEPPMRRAVAFAKDIKTSKQVAELFPKVVEAYRELVDDGPGLACSV
+ RHVDGTFNALVRNEQLAWLKGVVAEDECRILSNARCLSEGVDVPALDAVLFLNPRNSI
+ VDVVQSVGRVMRKSPGKDYGYVILPVAVPEGVEPSAALADNKRFKVVWQVLNALRSHD
+ ERFDAMVNSIALNVKPTKTGEGSDKLLGGHIGPTSDEAGPAVAEQLAMFSLSQWQEAI
+ YARIVDKVGTRTYWEQWAADVADIAATLTTRIHALLGGADATAAAAFEQFLAGLRDNL
+ NDSITPDDAISMLSQHLITKPVFDALFAGHDFASHNPVSRAMQKMVDTVGGAGLEAET
+ ARLEGFYESVRRRAGEVTSAEGKQQVIAELYEKFFRIGFKKQAEALGIVYTPVEVVDF
+ IVRAADFVSRKHFGRGLTDEGVHILDGFAGTGTFITRLLQSDLITAADLTRKYSQELH
+ ANEIMLLAYYIAAVNIESTYHALAGKTADADAYEPFPGMALADTFQISEAGDSMDAIM
+ FPYNNARILRQLATPISVIIGNPPYSVGQSSANDLNANVKYPTLDGRIEQTYAKRSTA
+ QLKNSLYDSYIRAFRWATDRIGDNGVVGFVSNGGYIDGNTADGMRLSLADDYAAVYVY
+ NLRGNQRTAGELSRQEGGKVFGGGSRNTVAIFLGIKDPKHSGPCDVLYRDIGDYLSRE
+ EKLRIVGDGYLDTVEWQTVTPNLHGDWVNQRDDAFSAWPVIGDKKAALDVTRVFANYS
+ AGLKTSRDAWCYNFSRGALEANIGRTIDFYNSEVDRINEIRGRDAKTPPVDALITVDS
+ AKFSWDRINKRQVAQGIRIEFAPAGMRLGTYRPFTKEHAYLDPNQQLNNCTYQLPSMF
+ PTPEHGNVGYYVVGMGSDKPFSCLMLNAIPDLAFWGSSNGQFFPRWTYEKTEPRDGEL
+ DFESTTNAEVDDHGYRRVDNITGVILKLYRDTIGDQVTKDDIFYYVYGLLHDPAYRTK
+ YAADLKKMLPHIPTPETRERFDQLASAGRKLADLHVGYESVKPYPLDVQLKPGADPED
+ RETWRVEKMKWKSKQDHSTIIYNSRVTIAGIPDEAERYLLGSRSALGWIIDRYRVTTD
+ KASGIVNDPNDWCDEHANPTYIVDLIKKVTTVSVETMKIVDSIVALASAGSDST"
+ gene complement(2259075..2260073)
+ /locus_tag="BQ2027_MB2050C"
+ CDS complement(2259075..2260073)
+ /locus_tag="BQ2027_MB2050C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2050c, -, len: 332 aa. Equivalent to Rv2025c,
+ len: 332 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 332 aa overlap). Possible conserved
+ transmembrane protein, CDF family possibly involved in
+ transport of metal ions, similar to several hypothetical
+ bacterial proteins e. g. Methanobacterium
+ thermoautotrophicum AE000941_1 (298 aa; described as
+ cation efflux system protein) and Archaeoglob us fulgidus
+ AE001111_5 (384 aa). FASTA scores: AE000941_1 M
+ ethanobacterium thermoautotrophicum (298 aa) opt: 452 E():
+ 3.3e-24; 30.8% identity in 266 aa overlap and AE001111_5
+ Archaeoglobus fulgidus section 16 (384 aa) opt: 371 E():
+ 1.7e-18; 27.7% identity in 267 aa overlap. TBparse score
+ is 0.897 Protein product from Mb2050c detected using SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved membrane protein"
+ /protein_id="SIU00657.1"
+ /db_xref="GOA:A0A1R3Y0D1"
+ /db_xref="InterPro:IPR002524"
+ /db_xref="InterPro:IPR027469"
+ /db_xref="InterPro:IPR027470"
+ /db_xref="InterPro:IPR036837"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0D1"
+ /translation="MTHDHAHSRGVPAMIKEIFAPHSHDAADSVDDTLESTAAGIRTV
+ KISLLVLGLTALIQIVIVVMSGSVALAADTIHNFADALTAVPLWIAFALGAKPATRRY
+ TYGFGRVEDLAGSFVVAMITMSAIIAGYEAIARLIHPQQIEHVGWVALAGLVGFIGNE
+ WVALYRIRVGHRIGSAALIADGLHARTDGFTSLAVLCSAGGVALGFPLADPIVGLLIT
+ AAILAVLRTAARDVFRRLLDGVDPAMVDAAEQALAARPGVQAVRSVRMRWIGHRLHAD
+ AELDVDPALDLAQAHRIAHDAEHELTHTVPKLTTALIHAYPAEHGSSIPDRGRTVE"
+ gene complement(2260188..2261072)
+ /locus_tag="BQ2027_MB2051C"
+ CDS complement(2260188..2261072)
+ /locus_tag="BQ2027_MB2051C"
+ /note="Mb2051c, -, len: 294 aa. Equivalent to Rv2026c,
+ len: 294 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 294 aa overlap). Conserved
+ hypothetical protein, very similar to Mycobacterium
+ tuberculosis hypothetical proteins Rv2005c, Rv2623,
+ Rv1996, Rv2624c, Rv2028c, Rv3134c, Rv1636. Some, possibly
+ all, of these belong to universal stress protein family.
+ Protein product from Mb2051c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="universal stress protein family protein"
+ /protein_id="SIU00658.1"
+ /db_xref="InterPro:IPR006015"
+ /db_xref="InterPro:IPR006016"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZY6"
+ /translation="MSAATAKYGILVGVDGSAQSNAAVAWAAREAVMRQLPITLLHIV
+ APVVVGWPVGQLYANMTEWQKDNAQQVIEQAREALTNSLGESKPPQVHTELVFSNVVP
+ TLIDASQQAWLMVVGSQGMGALGRLLLGSISTALLHHARCPVAIIHSGNGATPDSDAP
+ VLVGIDGSPASEAATALAFDEASRRRVDLVALHAWTDLGMFPVLGMDWREREKREAEV
+ LAERLAGWQEQYPDVRVHRSLVCDKPARWLLEHSEQAQLVVVGSHGRGGFSGMLLGSV
+ SSAVAHSVRIPVIVVRPS"
+ gene complement(2261112..2262833)
+ /gene="dost"
+ /locus_tag="BQ2027_MB2052C"
+ CDS complement(2261112..2262833)
+ /gene="dost"
+ /locus_tag="BQ2027_MB2052C"
+ /note="Mb2052c, -, len: 573 aa. Equivalent to Rv2027c,
+ len: 573 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 573 aa overlap). Membrane protein
+ related to histidine kinase response regulators. Highly
+ similar to Mycobacterium tuberculosis protein Rv3132c,
+ MTCY03A2.2 6. FASTA scores: Z83867|MTCY3A2_26 (578 aa)
+ opt: 2330, E(): 0; 62.5% identity in 560 aa overlap.
+ Protein product from Mb2052c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2052c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="two component sensor histidine kinase dost"
+ /protein_id="SIU00659.1"
+ /db_xref="GOA:A0A1R3Y037"
+ /db_xref="InterPro:IPR003018"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR011712"
+ /db_xref="InterPro:IPR029016"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y037"
+ /translation="MTHPDRANVNPGSPPVRETLSQLRLRELLLEVQDRIEQIVEGRD
+ RLDGLIDAILAITSGLKLDATLRAIVHTAAELVDARYGALGVRGYDHRLVEFVYEGID
+ EETRHLIGSLPEGRGVLGALIEEPKPIRLDDISRHPASVGFPLHHPPMRTFLGVPVRI
+ RDEVFGNLYLTEKADGQPFSDDDEVLVQALAAAAGIAVDNARLFEESRTREAWIEATR
+ DIGTQMLAGADPAMVFRLIAEEALTLMAGAATLVAVPLDDEAPACEVDDLVIVEVAGE
+ ISPAVKQMTVAVSGTSIGGVFHDRTPRRFDRLDLAVDGPVEPGPALVLPLRAADTVAG
+ VLVALRSADEQPFSDKQLDMMAAFADQAALAWRLATAQRQMREVEILTDRDRIARDLH
+ DHVIQRLFAVGLTLQGAAPRARVPAVRESIYSSIDDLQEIIQEIRSAIFDLHAGPSRA
+ TGLRHRLDKVIDQLAIPALHTTVQYTGPLSVVDTVLANHAEAVLREAVSNAVRHANAT
+ SLAINVSVEDDVRVEVVDDGVGISGDITESGLRNLRQRADDAGGEFTVENMPTGGTLL
+ RWSAPLR"
+ gene complement(2262894..2263733)
+ /locus_tag="BQ2027_MB2053C"
+ CDS complement(2262894..2263733)
+ /locus_tag="BQ2027_MB2053C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2053c, -, len: 279 aa. Equivalent to Rv2028c,
+ len: 279 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 279 aa overlap). Conserved
+ hypothetical protein, highly similar to Mycobacterium
+ tuberculosis proteins Rv2005c, Rv2623, Rv1996, Rv2624c,
+ Rv3134c, Rv1636. Some, possibly all, of these belong to
+ universal stress protein family. Rv2624c|MTCY01A10.08 (272
+ aa) and Rv3134c|MTCY03A2.24 (268 aa). FASTA scores:
+ Z95387|MTCY1A10_8 (272 aa) opt: 563, E(): 2.5e-31, (36.8%
+ identity in 266 aa overlap) and Z83867|MTCY3A2_24 (268 aa)
+ opt: 562, E(): 2.9e-31, (40.7% identity in 273 aa
+ overlap). Protein product from Mb2053c detected using
+ SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="universal stress protein family protein"
+ /protein_id="SIU00660.1"
+ /db_xref="InterPro:IPR006015"
+ /db_xref="InterPro:IPR006016"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y020"
+ /translation="MNQSHKPPSIVVGIDGSKPAVQAALWAVDEAASRDIPLRLLYAI
+ EPDDPGYAAHGAAARKLAAAENAVRYAFTAVEAADRPVKVEVEITQERPVTSLIRASA
+ AAALVCVGAIGVHHFRPERVGSTAAALALSAQCPVAIVRPHRVPIGRDAAWIVVEADG
+ SSDIGVLLGAVMAEARLRDSPVRVVTCRQSGVGDTGDDVRASLDRWLARWQPRYPDVR
+ VQSAAVHGELLDYLAGLGRSVHMVVLSASDQEHVEQLVGAPGNAVLQEAGCTLLVVGQ
+ QYL"
+ gene complement(2263730..2264749)
+ /gene="pfkB"
+ /locus_tag="BQ2027_MB2054C"
+ CDS complement(2263730..2264749)
+ /gene="pfkB"
+ /locus_tag="BQ2027_MB2054C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2054c, pfkB, len: 339 aa. Equivalent to Rv2029c,
+ len: 339 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 339 aa overlap). Probable pfkB,
+ phosphofructokinase (EC 2.7.1.-), similar to others eg
+ P06999|K6P2_ECOLI 6-PHOSPHOFRUCTOKINASE I SOZYME 2 from E.
+ coli (309 aa), FASTA scores: opt: 705, E(): 0; (41.4%
+ identity in 304 aa overlap); and LACC_STRMU
+ phosphotagatosekinase (310 aa); etc. Contains PS00583 pfkB
+ family of carbohydrate kinases signature 1. Protein
+ product from Mb2054c detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="6-phosphofructokinase pfkb (phosphohexokinase)
+ (phosphofructokinase)"
+ /protein_id="SIU00661.1"
+ /db_xref="GOA:A0A1R3XZZ1"
+ /db_xref="InterPro:IPR002173"
+ /db_xref="InterPro:IPR011611"
+ /db_xref="InterPro:IPR017583"
+ /db_xref="InterPro:IPR029056"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZZ1"
+ /translation="MTEPAAWDEGKPRIITLTMNPALDITTSVDVVRPTEKMRCGAPR
+ YDPGGGGINVARIVHVLGGCSTALFPAGGSTGSLLMALLGDAGVPFRVIPIAASTRES
+ FTVNESRTAKQYRFVLPGPSLTVAEQEQCLDELRGAAASAAFVVASGSLPPGVAADYY
+ QRVADICRRSSTPLILDTSGGGLQHISSGVFLLKASVRELRECVGSELLTEPEQLAAA
+ HELIDRGRAEVVVVSLGSQGALLATRHASHRFSSIPMTAVSGVGAGDAMVAAITVGLS
+ RGWSLIKSVRLGNAAGAAMLLTPGTAACNRDDVERFFELAAEPTEVGQDQYVWHPIVN
+ PEASP"
+ gene complement(2264766..2265005)
+ /locus_tag="BQ2027_MB2055C"
+ CDS complement(2264766..2265005)
+ /locus_tag="BQ2027_MB2055C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2055c, -, len: 79 aa. Equivalent to 3' end of
+ Rv2030c, len: 681 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.000% identity in 79 aa overlap).
+ Conserved hypothetical protein that corresponds to
+ products of two adjacent ORF's described previously
+ MSGTUBDWN_4 (390 aa) and MSGTUBDWN_1 (385 aa). Also
+ similar to C-terminal two-thirds of Mycobacterium
+ tuberculosis protein Rv2143 (MTCY270.25c; 352 aa) and to
+ Rv0571c (443 aa) and Mycobacterium leprae protein U650s
+ MLU15184_16 (258 aa). FASTA scores: M93129|MSGTUBDWN_4
+ (390 aa) opt: 2530 E(): 0; 97.7% identity in 385 aa
+ overlap and M93129|MSGTUBDWN_1 (385 aa) opt: 1983 E(): 0;
+ 99.0% identity in 309 aa overlap. Z95388| MTCY270_25 (352
+ aa) opt: 882 E(): 0; 61.1 % identity in 226 aa overlap.
+ U15184|MLU15184_16 (258 aa) opt: 549 E(): 9.8e-29; 43.8%
+ identity in 219 aa overlap. REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium tuberculosis strain H37Rv, Rv2030c exists
+ as a single gene. In Mycobacterium bovis, a frameshift due
+ to a single base deletion (c-*) splits Rv2030c into 2
+ parts, Mb2055c and Mb2056c. Protein product from Mb2055c
+ detected using SWATH mass spectrometry. Mb2055c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN [SECOND PART]"
+ /protein_id="SIU00662.1"
+ /db_xref="GOA:A0A1R3Y033"
+ /db_xref="InterPro:IPR007815"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y033"
+ /translation="MSARLSRDAEAPLDVVRLGRAIGVVYLPATERQSHYLHVRPADQ
+ FDAMIHIDQTRALEPLEVTSRWIAGENPETYPTGL"
+ gene complement(2264990..2266810)
+ /locus_tag="BQ2027_MB2056C"
+ CDS complement(2264990..2266810)
+ /locus_tag="BQ2027_MB2056C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2056c, -, len: 606 aa. Equivalent to 5' end of
+ Rv2030c, len: 681 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 587 aa overlap).
+ Conserved hypothetical protein that corresponds to
+ products of two adjacent ORF's described previously
+ MSGTUBDWN_4 (390 aa) and MSGTUBDWN_1 (385 aa). Also
+ similar to C-terminal two-thirds of Mycobacterium
+ tuberculosis protein Rv2143 (MTCY270.25c; 352 aa) and to
+ Rv0571c (443 aa) and Mycobacterium leprae protein U650s
+ MLU15184_16 (258 aa). FASTA scores: M93129|MSGTUBDWN_4
+ (390 aa) opt: 2530 E(): 0; 97.7% identity in 385 aa
+ overlap and M93129|MSGTUBDWN_1 (385 aa) opt: 1983 E(): 0;
+ 99.0% identity in 309 aa overlap. Z95388| MTCY270_25 (352
+ aa) opt: 882 E(): 0; 61.1 % identity in 226 aa overlap.
+ U15184|MLU15184_16 (258 aa) opt: 549 E(): 9.8e-29; 43.8%
+ identity in 219 aa overlap. REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium tuberculosis strain H37Rv, Rv2030c exists
+ as a single gene. In Mycobacterium bovis, a frameshift due
+ to a single base deletion (g-*) splits Rv2030c into 2
+ parts, Mb2055c and Mb2056c. Protein product from Mb2056c
+ detected using shotgun mass spectrometry. Mb2056c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN [FIRST PART]"
+ /protein_id="SIU00663.1"
+ /db_xref="GOA:A0A1R3Y005"
+ /db_xref="InterPro:IPR000836"
+ /db_xref="InterPro:IPR007815"
+ /db_xref="InterPro:IPR014622"
+ /db_xref="InterPro:IPR029057"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y005"
+ /translation="MLMTAAADVTRRSPRRVFRDRREAGRVLAELLAAYRDQPDVIVL
+ GLARGGLPVAWEVAAALHAPLDAFVVRKLGAPGHDEFAVGALASGGRVVVNDDVVRGL
+ RITPQQLRDIAEREGRELLRRESAYRGERPPTDITGKTVIVVDDGLATGASMFAAVQA
+ LRDAQPAQIVIAVPAAPESTCREFAGLVDDVVCATMPTPFLAVGESFWDFRQVTDEEV
+ RRLLATPTAGPSLRRPAASTAADVLRRVAIDAPGGVPTHEVLAELVGDARIVLIGESS
+ HGTHEFYQARAAMTQWLIEEKGFGAVAAEADWPDAYRVNRYVRGLGEDTNADEALSGF
+ ERFPAWMWRNTVVRDFVEWLRTRNQRYESGALRQAGFYGLDLYSLHRSIQEVISYLDK
+ VDPRAAARARARYACFDHACADDGQAYGFAAAFGAGPSCEREAVEQLVDVQRNALAYA
+ RQDGLLAEDELFYAQQNAQTVRDAEVYYRAMFSGRVTSWNLRDQHMAQTLGSLLTHLD
+ RHLDAPPARIVVWAHNSHVGDARATEVWADGQLTLGQIVRERYGDESRSIGFSTYTGT
+ VTAASEWGGIAQRKAVRPALHAVSRSSSTRLQTVSWCQRG"
+ gene complement(2266822..2267256)
+ /gene="hspX"
+ /locus_tag="BQ2027_MB2057C"
+ CDS complement(2266822..2267256)
+ /gene="hspX"
+ /locus_tag="BQ2027_MB2057C"
+ /standard_name="acr"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2057c, hspX, len: 144 aa. Equivalent to Rv2031c,
+ len: 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 144 aa overlap). hspX, heat shock
+ protein localized in the inner membrane (see citations
+ below). Identical to P30223|14KD_MYCTU 14 KD ANTIGEN (16
+ kDa ANTIGEN) (HSP 16.3) of Mycobacterium tuberculosis (143
+ aa), FASTA scores: opt: 933, E(): 0, (100.0% identity in
+ 143 aa overlap). BELONGS TO THE SMALL HEAT SHOCK PROTEIN
+ (HSP20) FAMILY. Also known as alpha-crystallin and gene as
+ acr (see some citations below). TBparse score is 0.897.
+ Protein product from Mb2057c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2057c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="heat shock protein hspx (alpha-crystallin
+ homolog) (14 kda antigen) (hsp16.3)"
+ /protein_id="SIU00664.1"
+ /db_xref="GOA:P0A5B8"
+ /db_xref="InterPro:IPR002068"
+ /db_xref="InterPro:IPR008978"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5B8"
+ /translation="MATTLPVQRHPRSLFPEFSELFAAFPSFAGLRPTFDTRLMRLED
+ EMKEGRYEVRAELPGVDPDKDVDIMVRDGQLTIKAERTEQKDFDGRSEFAYGSFVRTV
+ SLPVGADEDDIKATYDKGILTVSVAVSEGKPTEKHIQIRSTN"
+ gene 2267453..2268448
+ /gene="acg"
+ /locus_tag="BQ2027_MB2058"
+ CDS 2267453..2268448
+ /gene="acg"
+ /locus_tag="BQ2027_MB2058"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2058, -, len: 331 aa. Equivalent to Rv2032, len:
+ 331 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 331 aa overlap). acg (for
+ acr-coregulated gene), conserved hypothetical protein
+ possibly member of a superfamily of classical
+ nitroreductases (see first citation below), similar to
+ hypothetical mycobacterial proteins Rv3127|MTCY164.37 (344
+ aa) and Rv3131|MTCY03A2.27c (332 aa). FASTA scores:
+ Z95150|MTCY164_38 Mycobacterium tuberculosis cosmid (344
+ aa) opt: 1208, E(): 0, (56.4% identity in 321 aa overlap);
+ Z83867| MTCY3A2_27 Mycobacterium tuberculosis cosmid (332
+ aa) opt: 568, E(): 8.6e-30, (36.8% identity in 321 aa
+ overlap). Similar to proteins SCJ1.11 (330 aa; AL109962)
+ and SCJ12.27c (335 aa; AL109989) in Streptomyces
+ coelicolor. Protein product from Mb2058 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2058 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Dinucleotide-utilizing enzymes involved in
+ molybdopterin and thiamine biosynthesis family 2"
+ /protein_id="SIU00665.1"
+ /db_xref="GOA:A0A1R3Y0T1"
+ /db_xref="InterPro:IPR000415"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0T1"
+ /translation="MPDTMVTTDVIKSAVQLACRAPSLHNSQPWRWIAEDHTVALFLD
+ KDRVLYATDHSGREALLGCGAVLDHFRVAMAAAGTTANVERFPNPNDPLHLASIDFSP
+ ADFVTEGHRLRADAILLRRTDRLPFAEPPDWDLVESQLRTTVTADTVRIDVIADDMRP
+ ELAAASKLTESLRLYDSSYHAELFWWTGAFETSEGIPHSSLVSAAESDRVTFGRDFPV
+ VANTDRRPEFGHDRSKVLVLSTYDNERASLLRCGEMLSAVLLDATMAGLATCTLTHIT
+ ELHASRDLVAALIGQPATPQALVRVGLAPEMEEPPPATPRRLIDEVFHVRAKDHR"
+ gene complement(2268564..2269406)
+ /locus_tag="BQ2027_MB2059C"
+ CDS complement(2268564..2269406)
+ /locus_tag="BQ2027_MB2059C"
+ /note="Mb2059c, -, len: 280 aa. Equivalent to Rv2033c,
+ len: 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 280 aa overlap). Conserved
+ hypothetical protein, similar to hypothetical protein
+ SCC77.24 (274 aa) from Streptomyces coelicolor A3(2)
+ CAB66235.1|AL13650) (50% identity in 261 aa overlap).
+ Mb2059c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="intermediary metabolism and respiration"
+ /protein_id="SIU00666.1"
+ /db_xref="InterPro:IPR021447"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y017"
+ /translation="MLDRYGTDVLAAGGRRRPRSVEHPVELGMVVEDAETGYVGAVVR
+ VEYGRIDLEDRYGKTRGFPLGPGYLLDGLPVILTAPRCAAAAGPRRTASGSVAVPGAR
+ ARVARASRIYVEGRHDAELIAAVWGADLRIEGVVVEHLGGVDDLVEIVAKFRPGPRRR
+ LGVLVDHLVAGSKEARIAEVVRRGPGGSDTLVVGHPYVDIWQAVKPQRVGLAAWPRVP
+ RHIEWKHGVCDALGWPHADQADIAAAWRRIRSQVRDWTDLEPALIGRVEELIDFVTQP
+ AGDE"
+ gene 2269618..2269941
+ /locus_tag="BQ2027_MB2060"
+ CDS 2269618..2269941
+ /locus_tag="BQ2027_MB2060"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2060, -, len: 107 aa. Equivalent to Rv2034, len:
+ 107 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 107 aa overlap). Probable repressor
+ protein similar to several belonging to the ARSR FAMILY
+ e.g. Q53040 (112 aa). FASTA scores: sptr|Q53040|Q53040
+ NITRILE HYDRATASE REGULATAR 2 (112 aa) opt: 167, E():
+ 6.7e-06; 44.7% identity in 76 aa overlap. TBparse score is
+ 0.905. Contains probable helix-turn-helix at aa 32-53 (S
+ core 1350, +3.78 SD),Mb2060 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="arsr repressor protein"
+ /protein_id="SIU00667.1"
+ /db_xref="GOA:A0A1R3Y0E0"
+ /db_xref="InterPro:IPR001845"
+ /db_xref="InterPro:IPR011991"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0E0"
+ /translation="MSTYRSPDRAWQALADGTRRAIVERLAHGPLAVGELARDLPVSR
+ PAVSQHLKVLKTARLVCDRPAGTRRVYQLDPTGLAALRTDLDRFWTRALTGYAQLIDS
+ EGDDT"
+ gene 2269938..2270426
+ /locus_tag="BQ2027_MB2061"
+ CDS 2269938..2270426
+ /locus_tag="BQ2027_MB2061"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2061, -, len: 162 aa. Equivalent to Rv2035, len:
+ 162 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 162 aa overlap). Conserved
+ hypothetical protein, similar to conserved hypothetical
+ protein (156 aa) from Sinorhizobium meliloti
+ CAC46569.1|AL591789 (34% identity in 146 aa overlap).
+ Protein product from Mb2061 detected using shotgun mass
+ spectrometry. Mb2061 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Ligand-binding SRPBCC domain CalC"
+ /protein_id="SIU00668.1"
+ /db_xref="InterPro:IPR013538"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3XZZ7"
+ /translation="MTRPRTDAIHHHVVVNAPIERAFAVFTTRFGDFKPREHNLLAIP
+ ITETVFECHAGGHIYDRGVDGSVCKWARVLVYEPPSRVLFTWDIGPTWRPETDLAKTS
+ EVEVRFTAQSAETTRVDLEHRHLDRHGPGWESVADGVDSEAGWPLYLRRYTDLLCIQV
+ QP"
+ gene 2270423..2271064
+ /locus_tag="BQ2027_MB2062"
+ CDS 2270423..2271064
+ /locus_tag="BQ2027_MB2062"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2062, -, len: 213 aa. Equivalent to Rv2036, len:
+ 213 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 213 aa overlap). Conserved hypothetical
+ protein; slight similarity to Streptomyces lincolnensis
+ protein involved in lincomycin production Q54375 (238 aa).
+ FASTA scores: sptr|Q54375|Q54375 (78-11) LINCOMYCIN
+ PRODUCTION GENES (238 aa) opt: 119, E(): 0.97; 31.3%
+ identity in 99 aa overlap. TBparse score is 0.934,Mb2062
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00669.1"
+ /db_xref="GOA:A0A1R3Y046"
+ /db_xref="InterPro:IPR017517"
+ /db_xref="InterPro:IPR024344"
+ /db_xref="InterPro:IPR034660"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y046"
+ /translation="MIAADDDTEKSMMDMARAERAELAAFLTTLTLQQWETPSLCAGW
+ SVKEVVAHMISYEDLGVFGLLKRFAKGRIVRANEVGVDEFAGLSPQELVDYVGRHLQP
+ RGLTAGFGGMIALVDGMIHHQDIRRPLGQPRTIPAQRLDRVLRLMPKNPRLRARPRIK
+ GLRLRATDLDWTIGTGPEVTGPGEALLMAMAGRPAAVSDLSGPGKPTLAGRLG"
+ gene complement(2271071..2272045)
+ /locus_tag="BQ2027_MB2063C"
+ CDS complement(2271071..2272045)
+ /locus_tag="BQ2027_MB2063C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2063c, -, len: 324 aa. Equivalent to Rv2037c,
+ len: 324 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 324 aa overlap). Possible conserved
+ transmembrane protein, similar to hypothetical proteins
+ from Mycobacterium leprae MLCB2052.31 (329 aa) and
+ Bacillus subtilis P54513|YQHO_BACSU (291 aa). FASTA
+ scores: Z98604|MLCB2052_1 6 Mycobacterium leprae cosmid
+ B205 (329 aa) opt: 1764, E(): 0; 80.5% identity in 323 aa
+ overlap and sp|P54513|YQHO_BACSU HYPOTHETICAL 32.9 KD
+ PROTEIN IN G (291 aa) opt: 328, E(): 8.8e-14; 36.6%
+ identity in 306 aa overlap. TBparse score is 0.919 Protein
+ product from Mb2063c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2063c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved transmembrane protein"
+ /protein_id="SIU00670.1"
+ /db_xref="GOA:A0A1R3Y031"
+ /db_xref="InterPro:IPR002641"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y031"
+ /translation="MALVSTARVDLVCEGGGVRGIGLVGAVDALADAGYRFPRVAGSS
+ AGAIVASLVAALQTAGEPVTRLAEMMRSIDYPKFLDRNLIGHVPLIGGGLSLLLSDGV
+ YRGAYLEQLLGGLLADLGVHTFGDLRTGEAPEQFAWSLVVTASDLSRRRLVRIPWDLD
+ SYGIHPDDFSVARAVHASSAIPFVFEPVRVRGATWVDGGLLSNFPVALFDRTDAEPRW
+ PTFGIRLSARPGIPPTRPVQGPVSLGIAAIETLVSNQDNAYIDDPCTVRRTIFVPAHD
+ VSPIDFDITAEQREALYQRGFQAGQKFLANWNYADYLADCGGPFTPSL"
+ gene complement(2272047..2273120)
+ /locus_tag="BQ2027_MB2064C"
+ CDS complement(2272047..2273120)
+ /locus_tag="BQ2027_MB2064C"
+ /note="Mb2064c, -, len: 357 aa. Equivalent to Rv2038c,
+ len: 357 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 357 aa overlap). Probable
+ sugar-transport ATP-binding protein ABC transporter (see
+ citation below), equivalent to
+ MLCB2052.30|Z98604|MLCB2052_15 from Mycobacterium leprae
+ (356 aa), FASTA scores: opt: 1866, E(): 0, (79.7% identity
+ in 355 aa overlap). Also similar to multiple sugar import
+ proteins e.g. Y08921|SRMSIK_1 msiK protein from
+ Streptomyces reticuli (377 aa), FASTA scores: opt: 1336,
+ E(): 0, (62.6% identity in 377 aa overlap); etc. Also
+ similar to several proteins from Mycobacterium
+ tuberculosis e.g. Rv2832c, Rv1238, Rv2397c, Rv3758c.
+ Contains PS00211 ABC transporters family signature and
+ PS00017 ATP/GTP-binding site motif A (P-loop). BELONGS TO
+ THE ATP-BINDING TRANSPORT PROTEIN FAMILY (ABC
+ TRANSPORTERS). Mb2064c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable sugar-transport ATP-binding protein ABC
+ transporter"
+ /protein_id="SIU00671.1"
+ /db_xref="GOA:A0A1R3Y000"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR008995"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR040582"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y000"
+ /translation="MASVSFEQATRRYPGTDRPALDRLDLIVGDGEFVVLVGPSGCGK
+ TTSLRMVAGLETLDCGRIRIGERDVTEVDPKDRDVAMVFQNYALYPHMTVAQNMGFAL
+ KVAKIGKAEIRERVLAAAKLLDLQSYLDRKPKDLSGGQRQRVAMGRAIVRRPQVFLMD
+ EPLSNLDAKLRGQTRNQIAALQRQLGTTTVYVTHDQVEAMTMGDRVAVLSDGVLQQCA
+ SPRELYRNPGNVFVAGFIGSPAMNLFRLSIADSTVSLGDWQILLPRAVVGTAAEVIIG
+ VRPEHLELGGAGIEMDVDMVEELGADAYLYGRIVSGGCEMDQSIVARVDGRGPPERGS
+ RVRLCPTPGHLHFFAVDGRRIPG"
+ gene complement(2273123..2273965)
+ /locus_tag="BQ2027_MB2065C"
+ CDS complement(2273123..2273965)
+ /locus_tag="BQ2027_MB2065C"
+ /note="Mb2065c, -, len: 280 aa. Equivalent to Rv2039c,
+ len: 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 280 aa overlap). Probable
+ sugar-transport integral membrane protein ABC transporter
+ (see citation below), equivalent to
+ MLCB2052.29|Z98604|MLCB2052_14 from Mycobacterium leprae
+ (283 aa), FASTA scores: opt: 1593, E(): 0, (79.2% identity
+ in 283 aa overlap). Also similar to maltose and lactose
+ transport proteins e.g. X66092|CPMALGHOM_1 from C.
+ perfringens (275 aa), FASTA scores: opt: 695, E(): 0,
+ (41.2% identity in 228 aa overlap); etc. Contains PS00402
+ Binding-protein-dependent transport systems inner membrane
+ comp signature. Also contains possible helix-turn-helix
+ motif at aa 171-192, although this is probably
+ fortuitous."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable sugar-transport integral membrane
+ protein ABC transporter"
+ /protein_id="SIU00672.1"
+ /db_xref="GOA:A0A1R3Y041"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y041"
+ /translation="MGWADRIVHRHFIRGLALYAGLIGIAWCALFPIIWALSGSLKAD
+ GEVTEPTLFPSHPQWSNYREVFALMPFWRMFFNTVLYAGCVTAGQVFFCSLAGYAFAR
+ LQFRGRDTLFVLYLSTLMVPLTVTVIPQFILMRIVGWVDTPWAMIVPGLFGSAFGTYL
+ MRQFFRTLPTDLEEAAILDGCSPWQIYWRILLPHSRPAVLVLGVLTWVNVWNDFLWPL
+ LMIQRNSLATLTLGLVRLRGEYVARWPVLMAASMLMLVPLVILYAVAQRSFVRGIAVT
+ GLGG"
+ gene complement(2273952..2274854)
+ /locus_tag="BQ2027_MB2066C"
+ CDS complement(2273952..2274854)
+ /locus_tag="BQ2027_MB2066C"
+ /note="Mb2066c, -, len: 300 aa. Equivalent to Rv2040c,
+ len: 300 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 300 aa overlap). Probable
+ sugar-transport integral membrane protein ABC transporter
+ (see citation below), equivalent to
+ MLCB2052.28|Z98604|MLCB2052_13 from Mycobacterium leprae
+ (319 aa), FASTA scores: opt: 1606, E(): 0, (81.6% identity
+ in 293 aa overlap). Also similar to many diverse sugar
+ transport proteins. Mb2066c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable sugar-transport integral membrane
+ protein ABC transporter"
+ /protein_id="SIU00673.1"
+ /db_xref="GOA:A0A1R3Y015"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y015"
+ /translation="MTRRRGRRAWAGRMFVAPNLAAVVVFMLFPLGFSLYMSFQKWDL
+ FTHATFVRLDNFRNLFTSDPLFLIAVVNTAVYTVGTVVPTVIVSLVVAAFLNRKIKGI
+ SLFRTVVFLPLAISSVVMAVVWQFVFNTDNGLLNIMLGWLGIGPIPWLIEPRWAMVSL
+ CLVSVWRSVPFATVVLLAAMQGVPETVYEAARIDGAGEIRQFVSITVPLIRGALSFVV
+ VISIIHAFQAFDLVYVLTGANGGPETATYVLGIMLFQHAFSFLEFGYASALAWVMFAI
+ LLVLTVLQLRITHRRSWEASRGLG"
+ gene complement(2274851..2276170)
+ /locus_tag="BQ2027_MB2067C"
+ CDS complement(2274851..2276170)
+ /locus_tag="BQ2027_MB2067C"
+ /note="Mb2067c, -, len: 439 aa. Equivalent to Rv2041c,
+ len: 439 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 439 aa overlap). Probable sugar-binding
+ lipoprotein component of sugar transport system,
+ equivalent to Z98604|MLCB2052_1|MLCB2052.27 from
+ Mycobacterium leprae (445 aa), FASTA scores: opt: 2324,
+ E(): 0, (77.4% identity in 446 aa overlap). Contains
+ signal sequence and appropriately positioned PS00013
+ Prokaryotic membrane lipoprotein lipid attachment site.
+ Protein product from Mb2067c detected using SWATH mass
+ spectrometry. Mb2067c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable sugar-binding lipoprotein"
+ /protein_id="SIU00674.1"
+ /db_xref="InterPro:IPR006059"
+ /db_xref="InterPro:IPR006311"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y269"
+ /translation="MVNKPFERRSLLRGAGALTAASLAPWAAGCAADDDDALTFFFAA
+ NPDELRPRMRVVNEFQRRYPDIKVRALLSGPGVMQQLATFCAGGKCPDVLMAWELTYA
+ ELADRGVLLDLNTLLARDQVFAAELKSDSIGALYETFTFNGGQYAFPEQWSGNFLFYN
+ KQLFDDAGVPPPPGSWERPWSFAEFLDAAQALTKQGRSGRDRQWGFVNAWVSFYAAGL
+ FAMNNGVPWSVPRMNPTHLNFDHDGFLEAVQFYADLTNKHKVAPSAAEQQSMSTADLF
+ SVGKAGIALAGHWRYQTFDRADGLDFDVAPLPIGPRGRAACSDIGVTGLAIAATSRRK
+ DQAWEFVKFATGPVGQALIGESRLFVPVLRSAINSHGFANAHRRVGNLAVLSEGPAYS
+ EGLPVTPAWEKIAALMDRYFGPVLRGSRPATSLTGLSQAVDEVLRNP"
+ gene complement(2276208..2277005)
+ /locus_tag="BQ2027_MB2068C"
+ CDS complement(2276208..2277005)
+ /locus_tag="BQ2027_MB2068C"
+ /note="Mb2068c, -, len: 265 aa. Equivalent to Rv2042c,
+ len: 265 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 265 aa overlap). Conserved
+ hypothetical protein,similar in N-terminal part to
+ hypothetical proteins MLCB2052.24 (95 aa) and
+ Rv0760c|MTCY369.05 (139 aa). FASTA scores:
+ Z98604|MLCB2052_9 Mycobacterium leprae cosmid B2052 (95
+ aa) opt: 269, E(): 2.9e-12, (55.4% identity in 92 aa
+ overlap) and Z80226|MTCY369_5 Mycobacterium tuberculosis
+ cosmid (139 aa) opt: 150, E(): 0.001, (28.7% identity in
+ 136 aa overlap). Protein product from Mb2068c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2068c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Nuclear transport factor 2"
+ /protein_id="SIU00675.1"
+ /db_xref="InterPro:IPR002075"
+ /db_xref="InterPro:IPR032710"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0U1"
+ /translation="MAPPNRDELLAAVERSPQAAAAHDRAGWVGLFTGDARVEDPVGS
+ QPQVGHEAIGRFYDTFIGPRDITFHRDLDIVSGTVVLRDLELEVAMDSAVTVFIPAFL
+ RYDLRPVTGEWQIAALRAYWELPAMMLQFLRTGSGATRPALQLSRALLGNQGLGGTAG
+ FLTGFRRAGRRHKKLVETFLNAASRADKSAAYHALSRTATMTLGEDELLDIVELFEQL
+ RGASWTKVTGAGSTVAVSLASDHRRGIMFADVPWRGNRINRIRYFPA"
+ gene complement(2277005..2277565)
+ /gene="pncA"
+ /locus_tag="BQ2027_MB2069C"
+ CDS complement(2277005..2277565)
+ /gene="pncA"
+ /locus_tag="BQ2027_MB2069C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2069c, pncA, len: 186 aa. Equivalent to Rv2043c,
+ len: 186 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 186 aa overlap). pncA,
+ pyrazinamidase/nicotinamidase (EC 3.5.1.-) (see citations
+ below). Identical to PYRAZINAMIDASE/NICOTINAMIDASE
+ involved in susceptibility or resistance to
+ antituberculous drug pyrazinamide. FASTA scores:
+ sptr|Q50575|Q50575 PYRAZINAMIDASE/NICOTINAMIDASE. (186 aa)
+ opt: 1236, E(): 0; 100.0% identity in 186 aa overlap.
+ Protein product from Mb2069c detected using SWATH mass
+ spectrometry. Mb2069c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pyrazinamidase/nicotinamidase pnca (pzase)"
+ /protein_id="SIU00676.1"
+ /db_xref="GOA:A0A1R3Y026"
+ /db_xref="InterPro:IPR000868"
+ /db_xref="InterPro:IPR036380"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y026"
+ /translation="MRALIIVDVQNDFCEGGSLAVTGGAALARAISDYLAEAADYHHV
+ VATKDFHIDPGDDFSGTPDYSSSWPPHCVSGTPGADFHPSLDTSAIEAVFYKGAYTGA
+ YSGFEGVDENGTPLLNWLRQRGVDEVDVVGIATDHCVRQTAEDAVRNGLATRVLVDLT
+ AGVSADTTVAALEEMRTASVELVCSS"
+ gene complement(2277606..2277923)
+ /locus_tag="BQ2027_MB2070C"
+ CDS complement(2277606..2277923)
+ /locus_tag="BQ2027_MB2070C"
+ /note="Mb2070c, -, len: 105 aa. Equivalent to Rv2044c,
+ len: 105 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 105 aa overlap). Conserved
+ hypothetical protein, similar to conserved hypothetical
+ protein PA3386 (121 aa) from Pseudomonas aeruginosa
+ |E83221 conserved hypothetical protein PA3386 [imported]
+ -Pseudomonas aeruginosa (strain PAO1)
+ 9949522|gb|AAG06774.1|AE004760_2 (AE004760). (46% identity
+ in 92 aa overlap). Mb2070c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative membrane protein"
+ /protein_id="SIU00677.1"
+ /db_xref="GOA:A0A1R3Y0F0"
+ /db_xref="InterPro:IPR021218"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0F0"
+ /translation="MHFAFIAYVLAGGFLALRWRRTMWLHVPAVIWGIGIAAKRVDCP
+ LTWVERWARTKAAMTPLSPDGFVAHYITGVIYPAGWVAAAQLVMFAIVAASWTLYLWL
+ PRR"
+ gene complement(2278009..2279544)
+ /gene="lipT"
+ /locus_tag="BQ2027_MB2071C"
+ CDS complement(2278009..2279544)
+ /gene="lipT"
+ /locus_tag="BQ2027_MB2071C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2071c, lipT, len: 511 aa. Equivalent to Rv2045c,
+ len: 511 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 511 aa overlap). Probable lipT,
+ carboxylesterase similar to many e.g. O08472 (489 aa) and
+ P37967|PNBA_ BACSU (489 aa). PARA-NITROBENZYL ESTERASE (EC
+ 3.1.1.-). Contains PS00941 Carboxylesterases type-B
+ signature 2. Contains PS00122 Carboxylesterases type-B
+ serine active site. FASTA scores: sptr|O08472|O08472
+ INTRACELLULAR ESTERASE B (489 aa) opt: 849, E(): 0, (36.2%
+ identity in 489 aa overlap) and sp|P37967|PNBA_BACSU
+ PARA-NITROBENZYL ESTERASE (489 aa) opt: 838, E(): 0,
+ (36.0% identity in 489 aa overlap). TBparse score is 0
+ .918 Protein product from Mb2071c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb2071c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="carboxylesterase lipt"
+ /protein_id="SIU00678.1"
+ /db_xref="GOA:A0A1R3Y007"
+ /db_xref="InterPro:IPR002018"
+ /db_xref="InterPro:IPR002168"
+ /db_xref="InterPro:IPR019819"
+ /db_xref="InterPro:IPR019826"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y007"
+ /translation="MALESATVGSMHERTVRARTATGIVEGFTRDGVHRWRSIPYARA
+ PVGSLRFRAPQPAQPWPGVRHCHTFANCAPQQRRYTVMGIGRYQTRSEDCLTLNVVTP
+ EEPATQPLPVMVFIHGGGYILGSSATPIYDGAALARRGCVYVSVNYRLGALGCLDLSS
+ LSTPQITLDSNVYLRDLVLALRWVHDNIAEFGGDPGNVTIFGESAGAHITATLLAVPA
+ AKGLFARAISESPAAGMVRSREVAAEFAARFANLIGARTQDAANALMQASPAQLVEAQ
+ HHLIRQGMRKRLGAFPIGPVFGDDYLPMDPVEAMRSGRVHAVPLIVGTNAEEGRLFTR
+ FLGMLPTNEPMVEELLSGMKPADRERITAAYPNYPAPSACIQLGGDFAFSSAAWQIAE
+ AHGANAPTYLYRYDYAPRTLRWSGFGATHATELFAVFDIYRTRFGALLTAAADRRAAL
+ RVSNEVQRRWRCFSQIGVPGDDWPAYTQDDRAVLVFDRRCRIEFDPHQHRRIAWDGFS
+ LAN"
+ gene 2279593..2280249
+ /gene="lppI"
+ /locus_tag="BQ2027_MB2072"
+ CDS 2279593..2280249
+ /gene="lppI"
+ /locus_tag="BQ2027_MB2072"
+ /note="Mb2072, lppI, len: 218 aa. Equivalent to Rv2046,
+ len: 218 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 218 aa overlap). Probable lppI,
+ lipoprotein contains signal sequence and appropriately
+ positioned PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Protein product from Mb2072 detected
+ using SWATH mass spectrometry. Mb2072 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable lipoprotein lppI"
+ /protein_id="SIU00679.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y052"
+ /translation="MRIAALVAVSLLIAGCPREVGGDVGQSQTIAPPAPAPSAAPSTP
+ PAAGAPITTIVSWIEAGHPVDPAAYHVATRDGVTTQLGDDVAFSASSGTVACMTDARH
+ TSGTLACLVRLANPPPRPETAYGEWKGGWVDFDGIHLQVGSARADPGPFVYGNGPELA
+ NGDTLSIGDYRCRSYQAGLFCVNYAHQSAVRFASAGIEPFGCLKPAPPPDGVGVAFGC
+ "
+ gene complement(2280286..2282850)
+ /locus_tag="BQ2027_MB2073C"
+ CDS complement(2280286..2282850)
+ /locus_tag="BQ2027_MB2073C"
+ /EC_number="2.7.9.2"
+ /note="Mb2073c, -, len: 854 aa. Equivalent to Rv2047c,
+ len: 854 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 854 aa overlap). Conserved
+ hypothetical protein, similar to hypothetical protein from
+ Mycobacterium tuberculosis Rv1868|MTCY359.05c (699 aa) and
+ three possible pseudogene fragments from Mycobacterium
+ leprae MLCB2052.16 (251 aa), MLCB2052.17 (120 aa),
+ MLCB2052.18 (257 aa). FASTA scores: gp|Z98604|MLCB2052_7
+ (257 aa) opt: 1248, E(): 0, (78.6% identity in 248 aa
+ overlap); and Z98604|MLCB2052_5 (251 aa) opt: 674, E(): 0,
+ (50.0% identity in 250 aa overlap); and Z98604|MLCB2052_6
+ (120 aa) opt: 608 E() : 3.6e-30, (84.0% identity in 106 aa
+ overlap); and Rv1868 Z83859|MTCY359_5 (699 aa) opt: 521
+ E(): 3e-24; (33.0% identity in 730 aa overlap). Protein
+ product from Mb2073c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2073c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Phosphoenolpyruvate synthase (EC"
+ /protein_id="SIU00680.1"
+ /db_xref="GOA:P65685"
+ /db_xref="InterPro:IPR001509"
+ /db_xref="InterPro:IPR008279"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="InterPro:IPR036637"
+ /db_xref="UniProtKB/Swiss-Prot:P65685"
+ /translation="MRIAVTGASGVLGRGLTARLLSQGHEVVGIARHRPDSWPSSADF
+ IAADIRDATAVESAMTGADVVAHCAWVRGRNDHINIDGTANVLKAMAETGTGRIVFTS
+ SGHQPRVEQMLADCGLEWVAVRCALIFGRNVDNWVQRLFALPVLPAGYADRVVQVVHS
+ DDAQRLLVRALLDTVIDSGPVNLAAPGELTFRRIAAALGRPMVPIGSPVLRRVTSFAE
+ LELLHSAPLMDVTLLRDRWGFQPAWNAEECLEDFTLAVRGRIGLGKRTFSLPWRLANI
+ QDLPAVDSPADDGVAPRLAGPEGANGEFDTPIDPRFPTYLATNLSEALPGPFSPSSAS
+ VTVRGLRAGGVGIAERLRPSGVIQREIAMRTVAVFAHRLYGAITSAHFMAATVPFAKP
+ ATIVSNSGFFGPSMASLPIFGAQRPPSESSRARRWLRTLRNIGVFGVNLVGLSAGSPR
+ DTDAYVADVDRLERLAFDNLATHDDRRLLSLILLARDHVVHGWVLASGSFMLCAAFNV
+ LLRGLCGRDTAPAAGPELVSARSVEAVQRLVAAARRDPVVIRLLAEPGERLDKLAVEA
+ PEFHSAVLAELTLIGHRGPAEVEMAATSYADNPELLVRMVAKTLRAVPAPQPPTPVIP
+ LRAKPVALLAARQLRDREVRRDRMVRAIWVLRALLREYGRRLTEAGVFDTPDDVFYLL
+ VDEIDALPADVSGLVARRRAEQRRLAGIVPPTVFSGSWEPSPSSAAALAAGDTLRGVG
+ VCGGRVRGRVRIVRPETIDDLQPGEILVAEVTDVGYTAAFCYAAAVVTELGGPMSHAA
+ VVAREFGFPCVVDAQGATRFLPPGALVEVDGATGEIHVVELASEDGPALPGSDLSR"
+ gene complement(2282855..2295310)
+ /gene="pks12"
+ /locus_tag="BQ2027_MB2074C"
+ CDS complement(2282855..2295310)
+ /gene="pks12"
+ /locus_tag="BQ2027_MB2074C"
+ /note="Mb2074c, pks12, len: 4151 aa. Equivalent to
+ Rv2048c, len: 4151 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.4% identity in 4151 aa overlap).
+ Probable pks12, polyketide synthase similar to many
+ polyketide synthases e.g. the second and third modules of
+ polyketide synthase from S. erythraea (3567 aa), many
+ other Streptomyces enzymes and putative Mycobacterium
+ tuberculosis polyketide synthases, e.g.
+ Z85982|MTCY06H11.26 (2126 aa), FASTA scores: opt: 6668,
+ E(): 0 (61.2% identity in 2058 aa overlap); and
+ Q03132|ERY2_SACER ERYTHRONOLIDE SYNTHASE, MODULES 3 from
+ S. erythraea (3567 aa), FASTA scores: opt: 5309, E(): 0,
+ (40.5% identity in 4141 aa overlap). Contains 2x PS00012
+ Phosphopantetheine attachment site, 2x PS00606
+ Beta-ketoacyl synthases active site, and PS00343
+ Gram-positive cocci surface proteins 'anchor ing'
+ hexapeptide. Protein product from Mb2074c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2074c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="polyketide synthase pks12"
+ /protein_id="SIU00681.1"
+ /db_xref="GOA:A0A1R3Y009"
+ /db_xref="InterPro:IPR001227"
+ /db_xref="InterPro:IPR006162"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR013968"
+ /db_xref="InterPro:IPR014030"
+ /db_xref="InterPro:IPR014031"
+ /db_xref="InterPro:IPR014043"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="InterPro:IPR016036"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR018201"
+ /db_xref="InterPro:IPR020801"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR020807"
+ /db_xref="InterPro:IPR020841"
+ /db_xref="InterPro:IPR020843"
+ /db_xref="InterPro:IPR032821"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="InterPro:IPR042104"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y009"
+ /translation="MVDQLQHATEALRKALVQVERLKRTNRALLERSSEPIAIVGMSC
+ RFPGGVDSPEGLWQMVADARDVMSEFPTDRGWDLAGLFDPDPDVRHKSYARTGGFVDG
+ VADFDPAFFGISPSEALAMDPQHRMLLELSWEALERAGIDPTGLRGSATGVFAGLIVG
+ GYGMLAEEIEGYRLTGMTSSVASGRVAYVLGLEGPAVSVDTACSSSLVALHMAVGSLR
+ SGECDLALAGGVTVNATPTVFVEFSRHRGLAPDGRCKPYAGRADGVGWSEGGGMLVLQ
+ RLSDARRLGHPVLAVVVGSAVNQDGASNGLTAPNGPSQQRVVRAALANAGLSAAEVDV
+ VEGHGTGTTLGDPIEAQALLATYGQDRGEPGEPLWLGSVKSNMGHTQAAAGVAGVIKM
+ VLAMRHELLPATLHVDVPSPHVDWSAGAVELLTAPRVWPAGARTRRAGVSSFGISGTN
+ AHVIIEAVPVVPRREAGWAGPVVPWVVSAKSESALRGQAARLAAYVRGDDGLDVADVG
+ WSLAGRSVFEHRAVVVGGDRDRLLAGLDELAGDQLGGSVVRGTATAAGKTVFVFPGQG
+ SQWLGMGIELLDTAPAFAQQIDACAEAFAEFVDWSLVDVLRGAPGAPGLDRVDVVQPV
+ LFAVMVSLAELWKSVAVHPDAVIGHSQGEIAAAYVAGALSLRDAARVVTLRSKLLAGL
+ AGPGGMVSIACGADQARDLLAPFGDRVSIAVVNGPSAVVVSGEVGALEELIAVCSTKE
+ LRTRRIEVDYASHSVEVEAIRGPLAEALSGIEPRSTRTVFFSTVTGNRLDTAGLDADY
+ WYRNVRQTVLFDQAVRNACEQGYRTFIESSPHPALITGVEETFAACTDGDSEAIVVPT
+ LGRGDGGLHRFLLSAASAFVAGVAVNWRGTLDGAGYVELPTYAFDKRRFWLSAEGSGA
+ DVSGLGLGASEHPLLGAVVDLPASGGVVLTGRLSPNVQPWLADHAVSDVVLFPGTGFV
+ ELAIRAGDEVGCSVLDELTLAAPLLLPATGSVAVQVVVDAGRDSNSRGVSIFSRADAQ
+ AGWLLHAEGILRPGSVEPGADLSVWPPAGAVTVDVADGYERLATRGYRYGPAFRGLTA
+ MWARGEEIFAEVRLPEAAGGVGGFGVHPALLDAVLHAVVIAGDPDELALPFAWQGVSL
+ HATGASAVRARIAPAGPSAVSVELADGLGLPVLSVASMVARPVTERQLLAAVSGSGPD
+ RLFEVIWSPASAATSPGPTPAYQIFESVAADQDPVAGSYVRSHQALAAVQSWLTDHES
+ GVLVVATRGAMALPREDVADLAGAAVWGLVRSAQTEHPGRIVLVDSDAATDDAAIAMA
+ LATGEPQVVLRGGQVYTARVRGSRAADAILVPPGDGPWRLGLGSAGTFENLRLEPVPN
+ ADAPLGPGQVRVAMRAIAANFRDIMITLGMFTHDALLGGEGAGVVVEVGPGVTEFSVG
+ DSVFGFFPDGSGTLVAGDVRLLLPMPADWSYAEAAAISAVFTTAYYAFIHLADVQPGQ
+ RVLIHAGTGGVGMAAVQLARHLGLEVFATASKGKWDTLRAMGFDDDHISDSRSLEFED
+ KFRAATGGRGFDVVLDSLAGEFVDASLRLVAPGGVFLEMGKTDIRDPGVIAQQYPGVR
+ YRAFDLFEAGPDRIAQILAELATLFGDGVLRPLPVTTFDVRRAPAALRYLSQARHTGK
+ VVMLMPGSWAAGTVLITGGTGMAGSAVARHVVARHGVRNLVLVSRRGPDAPGAAELVA
+ ELAAAGAQVQVVACDAADRAALAKVIADIPVQHPLSGVIHTAGALDDAVVMSLTPDRV
+ DVVLRSKVDAAWHLHELTRDLDVSAFVMFSSMAGLVGSSGQANYAAANSFLDALAAHR
+ RAHGLPAISLGWGLWDQASAMTSGLDAADLARLGREGVLALSTAEALELFDTAMIVDE
+ PFLAPARIDLTALRAHAVAVPPMFSDLASAPTRRQVDDSVAAAKSKSALAHRLHGLPE
+ AEQHAVLLGLVRLHIATVLGNITPEAIDPDKAFQDLGFDSLTAVEMRNRLKSATGLSL
+ SPTLIFDYPTPNRLASYIRTELAGLPQEIKHTPAVRTTSEDPIAIVGMACRYPGGVNS
+ PDDMWDMLIQGRDVLSEFPADRGWDLAGLYNPDPDAAGACYTRTGGFVDGVGDFDPAF
+ FGVGPSEALAMDPQQRMLLELSWEALERAGIDPTGLRGSATGVFAGVMTQGYGMFAAE
+ PVEGFRLTGQLSSVASGRVAYVLGLEGPAVSVDTACSSSLVALHMAVGSLRSGECDLA
+ LAGGVTVNATPDIFVEFSRWRGLSPDGRCKAFAAAADGTGFSEGGGMLVLQRLSDARR
+ LGHPVLAVVVGSAVNQDGASNGLTAPNGPSQQRVVRAALANAGLSAAEVDVVEGHGTG
+ TTLGDPIEAQALLATYGQDRGEPGEPLWLGSVKSNMGHTQAAAGVAGVIKMVLAMRHE
+ LLPATLHVDVPSPHVDWSAGAVELLTAPRVWPAGARTRRAGVSSFGISGTNAHVIIEA
+ VPVVPRREAGWAGPVVPWVVSAKSESALRGQAARLAAYVRGDDGLDVADVGWSLAGRS
+ VFEHRAVVVGGDRDRLLAGLDELAGDQLGGSVVRGTATAAGKTVFVFPGQGSQWLGMG
+ MGLHAGYPVFAEAFNTVVGELDRHLLRPLREVMWGHDENLLNSTEFAQPALFAVEVAL
+ FRLLGSWGVRPDFVMGHSIGELSAAHVAGVLSLENAAVLVAARGRLMQALPAGGAMVA
+ VQAAEEEVRPLLSAEVDIAAVNGPASLVISGAQNAVAAVADQLRADGRRVHQLAVSHA
+ FHSPLMDPMIDEFAAVAAGIAIGRPTIGVISNVTGQLAGDDFGSAAYWRRHIRQAVRF
+ ADSVRFAQAAGGSRFLEVGPSGGLVASIEESLPDVAVTTMSALRKDRPEPATLTNAVA
+ QGFVTGMDLDWRAVVGEAQFVELPTYAFQRRRFWLSGDGVAADAASLGLAASEHALLG
+ AVIDLPASGGVVLTGRLSPSVQGWLADHSVAGVTIFPGAGFVELAIRAGDEVGCGVVD
+ ELTLAAPLVLPASGSVAVQVVVNGPDESGVRGVSVYSRGDVGTGWVLHAEGALRAGSA
+ EPTADLAMWPPAGAVPVEVADGYQQLAERGYGYGPAFRGLTAMWRRGDEVFAEVALPA
+ DAGVSVTGFGVHPVLLDAALHAVVLSAESAERGQGSVLVPFSWQGVSLHAAGASAVRA
+ RIAPVGPSAVSIELADGLGLPVLSVASMLARPVTDQQLRAAVSSSGPDRLFEVTWSPQ
+ PSAAVEPLPVCAWGTTEDSAAVVFESVPLAGDVVAGVYAATSSVLDVLQSWLTRDGAG
+ VLVVMTRGAVALPGEDVTDLAGAAVWGLVRSAQTEHPGRIVLVDSDAPLDDSALAAVV
+ TTGEPQVLWRRGEVYTARVHGSRAVGGLLVPPSDRPWRLAMSTAGTFENLRLELIPDA
+ DAPLGPGQVRVAVSAIAANFRDVMIALGLYPDPDAVMGVEACGVVIETSLNKGSFAVG
+ DRVMGLFPEGTGTVASTDQRLLVKVPAGWSHTAAATTSVVFATAHYALVDLADVQPGQ
+ RVLIHAGTGGVGMAAVQLARHLGLEVFATASKGKWDTLRAMGFDDDHISDSRSLEFED
+ KFRAATGGRGFDVVLDSLAGEFVDASLRLVAPGGVFLEMGKTDIRDPGVIAQQYPGVR
+ YRAFDLFEAGPDRIAQILAELATLFGDGVLRPLPVTTFDVRRAPAALRYLSQARHTGK
+ VVMLMPGSWAAGTVLITGGTGMAGSAVARHVVARHGVRNLVLVSRRGPDAPGAAELVA
+ ELAAAGAQVQVVACDAADRAALAKVIADIPVQHPLSGVIHTAGALDDAVVMSLTPDRV
+ DVVLRSKVDAAWHLHELTRDLDVSAFVMFSSMAGLVGSSGQANYAAANSFLDALAAHR
+ RAHGLPAISLGWGLWDQASAMTSGLATVDFKRFARDGIVAMSSADALQLFDTAMIVDE
+ PFMLPAHIDFAALKVKFDGGTLPPMFVDLINAPTRRQVDDSLAAAKSKSALAHRLHGL
+ PEDEQHAVLLDLVRSHIATVLGSASPEAIDPDRAFQDLGFDSLTAVEMRNRLKSATGL
+ SLSPTLIFDYPNSAALAGYMRRELLGSSPQDTSAVAAGEAELQRIVASIPVKRLRQAG
+ VLDLLLALANETETSGQDPALAPTAEQEIADMDLDDLVNAAFRNDDE"
+ gene complement(2295617..2295841)
+ /locus_tag="BQ2027_MB2075C"
+ CDS complement(2295617..2295841)
+ /locus_tag="BQ2027_MB2075C"
+ /note="Mb2075c, -, len: 74 aa. Equivalent to Rv2049c, len:
+ 74 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 74 aa overlap). Hypothetical protein.
+ Mb2075c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein"
+ /protein_id="SIU00682.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y049"
+ /translation="MLTRGEVRALPADAVVLSADDAADLSDRVYQVRCAAEDVVTALD
+ EGAAATELRDLCDELIRAARAADGWRRAGA"
+ gene 2296145..2296480
+ /gene="rbpA"
+ /locus_tag="BQ2027_MB2076"
+ CDS 2296145..2296480
+ /gene="rbpA"
+ /locus_tag="BQ2027_MB2076"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2076, -, len: 111 aa. Equivalent to Rv2050, len:
+ 111 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 111 aa overlap). Conserved
+ hypothetical protein, similar to hypothetical proteins
+ from Mycobacterium leprae, MLCB2052.03c (113 aa), and
+ Streptomyces coelicolor A3(2), SC6D7.18c (124 aa). FASTA
+ scores: Z98604|MLCB2052_3 Mycobacterium leprae cosmid
+ B2052 (113 aa) opt: 737, E(): 0, (97.3% identity in 111 aa
+ overlap) and (55% identity in 85 aa overlap) with
+ emb|CAB61670.1|AL133213 hypothetical protein SC6D7.18c.
+ TBparse score is 0.884 Protein product from Mb2076
+ detected using shotgun mass spectrometry. Mb2076 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="RNAP Holo/RbpA/Fidaxomicin/upstream fork DNA"
+ /protein_id="SIU00683.1"
+ /db_xref="GOA:A0A1R3Y022"
+ /db_xref="InterPro:IPR025182"
+ /db_xref="InterPro:IPR038638"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y022"
+ /translation="MADRVLRGSRLGAVSYETDRNHDLAPRQIARYRTDNGEEFEVPF
+ ADDAEIPGTWLCRNGMEGTLIEGDLPEPKKVKPPRTHWDMLLERRSIEELEELLKERL
+ ELIRSRRRG"
+ gene complement(2296455..2299079)
+ /gene="ppm1"
+ /locus_tag="BQ2027_MB2077C"
+ CDS complement(2296455..2299079)
+ /gene="ppm1"
+ /locus_tag="BQ2027_MB2077C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2077c, ppm1, len: 874 aa. Equivalent to Rv2051c,
+ len: 874 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 874 aa overlap). ppm1,
+ Polyprenol-monophosphomannose synthase. Transfers mannose
+ from GDP-Mannose to all endogenous polyprenol-phosphates
+ in Mycobacterium tuberculosis, proven experimentally (A.
+ Baulard, Institut Pasteur de Lille: see citation below).
+ Very similar to polyprenol-phosphate-mannose synthases
+ from Mycobacterium smegmatis (594 aa). Two-domain protein
+ similar to products of two adjacent ORFs in Mycobacterium
+ leprae MLCB2052.01 (644 aa), probable membrane protein and
+ MLCB2052.02 (277 aa). First domain (aa 1 - 590)
+ corresponds to membrane protein with similarity to
+ P23930|LNT_ECOLI apolipoprotein n-acyltransferase (512 aa)
+ while second domain (aa 591 - 874) is similar to
+ Schizosaccharomyces pombe dolichol monophosphate mannose
+ synthase (236 aa) and to Mycobacterium tuberculosis
+ Rv0539. FASTA scores: Z 98604|MLCB2052_1 (644 aa) opt:
+ 2725 E(): 0; 67.7% identity in 601 aa overlap; and
+ Z98604|MLCB2052_2 (277 aa) opt: 1449 E(): 0; 78.9%
+ identity in 275 aa overlap; and gp|AF0078|AF007873_1
+ Schizosaccharomyces pombe dolichocholmonophosphate mannose
+ synthase (236 aa) opt: 456 E(): 7.8e-19; 34.5% identity in
+ 223 aa overlap and sp|P23930|LNT_ECOLI APOLIPOPROTEIN
+ N-ACYLTRANSFERASE (512 aa) opt: 330 E(): 1.9e-11; 26.9%
+ identity in 539 aa overlap; and
+ polyprenol-phosphate-mannose synthases from Mycobacterium
+ smegmatis (594 aa). CAC15462.1|AJ294477 putative
+ polyprenol-phosphate-mannose synthase 2 (Ppm2): (55%
+ identity in 533 aa overlap). Protein product from Mb2077c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2077c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Polyprenol-monophosphomannose synthase Ppm1"
+ /protein_id="SIU00684.1"
+ /db_xref="GOA:A0A1R3Y276"
+ /db_xref="InterPro:IPR001173"
+ /db_xref="InterPro:IPR003010"
+ /db_xref="InterPro:IPR004563"
+ /db_xref="InterPro:IPR029044"
+ /db_xref="InterPro:IPR036526"
+ /db_xref="InterPro:IPR039528"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y276"
+ /translation="MKLGAWVAAQLPTTRTAVRTRLTRLVVSIVAGLLLYASFPPRNC
+ WWAAVVALALLAWVLTHRATTPVGGLGYGLLFGLVFYVSLLPWIGELVGPGPWLALAT
+ TCALFPGIFGLFAVVVRLLPGWPIWFAVGWAAQEWLKSILPFGGFPWGSVAFGQAEGP
+ LLPLVQLGGVALLSTGVALVGCGLTAIALEIEKWWRTGGQGDAPPAVVLPAACICLVL
+ FAAIVVWPQVRHAGSGSGGEPTVTVAVVQGNVPRLGLDFNAQRRAVLDNHVEETLRLA
+ ADVHAGLAQQPQFVIWPENSSDIDPFVNPDAGQRISAAAEAIGAPILIGTLMDVPGRP
+ RENPEWTNTAIVWNPGTGPADRHDKAIVQPFGEYLPMPWLFRHLSGYADRAGHFVPGN
+ GTGVVRIAGVPVGVATCWEVIFDRAPRKSILGGAQLLTVPSNNATFNKTMSEQQLAFA
+ KVRAVEHDRYVVVAGTTGISAVIAPDGGELIRTDFFQPAYLDSQVRLKTRLTPATRWG
+ PILQWILVGAAAAVVLVAMRQNGWFPRPRRSEPKGENDDSDAPPGRSEASGPPALSES
+ DDELIQPEQGGRHSSGFGRHRATSRSYMTTGQPAPPAPGNRPSQRVLVIIPTFNEREN
+ LPVIHRRLTQACPAVHVLVVDDSSPDGTGQLADELAQADPGRTHVMHRTAKNGLGAAY
+ LAGFAWGLSREYSVLVEMDADGSHAPEQLQRLLDAVDAGADLAIGSRYVAGGTVRNWP
+ WRRLVLSKTANTYSRLALGIGIHDITAGYRAYRREALEAIDLDGVDSKGYCFQIDLTW
+ RTVSNGFVVTEVPITFTERELGVSKMSGSNIREALVKVARWGIEGRLSRSDHARARPD
+ IARPGAGGSRVSRADVTE"
+ gene complement(2299237..2300841)
+ /locus_tag="BQ2027_MB2078C"
+ CDS complement(2299237..2300841)
+ /locus_tag="BQ2027_MB2078C"
+ /note="Mb2078c, -, len: 534 aa. Equivalent to Rv2052c,
+ len: 534 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 534 aa overlap). Conserved
+ hypothetical protein, very similar to hypothetical protein
+ SC6D7.15 (536 aa) from Streptomyces coelicolor A3(2).
+ Smith-Waterman scores >emb|CAB61667.1| (AL133213)
+ hypothetical protein SC6D7.15 [Streptomyces coelicolor
+ A3(2)] Expect = e-113 Identities = 247/533 (46%) Protein
+ product from Mb2078c detected using SWATH mass
+ spectrometry. Mb2078c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Exoenzymes regulatory protein AepA in
+ lipid-linked oligosaccharide synthesis cluster"
+ /protein_id="SIU00685.1"
+ /db_xref="GOA:A0A1R3Y0U8"
+ /db_xref="InterPro:IPR011059"
+ /db_xref="InterPro:IPR013108"
+ /db_xref="InterPro:IPR032466"
+ /db_xref="InterPro:IPR033932"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0U8"
+ /translation="MSQIPVKLLVNGRVYSPTHPEATAMAVRGDVVAWLGSDDVGRDQ
+ FPDADVQDLDGRFVAPGFVDSHIHLTATGLMLSGLDLRPATSRAQCLRMVADYAADHP
+ GQPLWGHGWDESAWPENAAPSTADLDAVLGDCPAYLARIDSHSALVSSGLRRLVPELA
+ AATGYTAQRPLTGDAHHLARAAARYLLTDVQLADARAVALQAIAAAGVVAVHECAGPE
+ IGGLDDWLRLRALEHGVEVIGYWGEAVATPAQARDLVTETGARGLAGDLFVDGALGSR
+ TAWLHEPYADAPDCIGTCHLDVDGIEAHVRACTKAEVTAGFHVIGDAAVSAAVAAFER
+ VVADLGVVAVARCGHRLEHVEMVTADQAAKLGAWGVIASVQPNFDELWGGGDGMYARR
+ LGAQRGSELNPLALLASQGVPLALGSDAPVTGFDPWASVRAAVNHRTPGSGVSARAAF
+ AAATRGGWRAGGVRDGRIGTLVPGAPASYAIWDAGDFDVDAPRDAVQRWSTDPRSRVP
+ ALPRLGPTDALPRCRQTVHRGAVIYG"
+ gene complement(2300846..2301373)
+ /gene="fxsa"
+ /locus_tag="BQ2027_MB2079C"
+ CDS complement(2300846..2301373)
+ /gene="fxsa"
+ /locus_tag="BQ2027_MB2079C"
+ /note="Mb2079c, -, len: 175 aa. Equivalent to Rv2053c,
+ len: 175 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 175 aa overlap). Probable
+ transmembrane protein,Mb2079c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transmembrane protein fxsa"
+ /protein_id="SIU00686.1"
+ /db_xref="GOA:A0A1R3Y030"
+ /db_xref="InterPro:IPR007313"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y030"
+ /translation="MSRLLLSYAVVELAVVFALAATIGFGWTLLVLLATFVLGFGLLA
+ PLGGWQLGRRLLWLRSGLAEPRSALSDGALVTVASVLVLVPGLVTTTMGLLLLVPPIR
+ ALARPGLTAIAVRGFLRNVPLTADAAANMAGAFGESGTDPDFIDGEVIDVIDVEPLTL
+ QPPRVAAEPPSPGSN"
+ gene 2301449..2302162
+ /locus_tag="BQ2027_MB2080"
+ CDS 2301449..2302162
+ /locus_tag="BQ2027_MB2080"
+ /note="Mb2080, -, len: 237 aa. Equivalent to Rv2054, len:
+ 237 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 237 aa overlap). Conserved
+ hypothetical protein, some similarity to various
+ carboxymethylenebutenolidases e.g. sp|O67988|CLCD_RHOOP
+ CARBOXYMETHYLENEBUTENOLIDASE (DIENELACTONE HYDROLASE)
+ (DLH) >gi|2935034|gb|AAC38252.1| (AF003948) dienelactone
+ hydrolase [Rhodococcus opacus] Smith-Waterman scores:
+ Length = 252, Expect = 4e-08 Identities = 62/217 (28%).
+ Also similar to Rv2765. Protein product from Mb2080
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2080 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Dienelactone hydrolase family protein"
+ /protein_id="SIU00687.1"
+ /db_xref="GOA:A0A1R3Y0F5"
+ /db_xref="InterPro:IPR002925"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0F5"
+ /translation="MTTIEIDAPAGPIDALLGLPPGQGPWPGVVVVHDAVGYVPDNKL
+ ISERIARAGYVVLTPNMYARGGRARCITRVFRELLTKRGRALDDILAARDHLLAMPEC
+ SGRVGIVGFCMGGQFALVLSPRGFGATAPFYGTPLPRHLSETLNGACPIVASFGTRDP
+ LGIGAANRLRKVTAAKNIPADIKSYPGAGHSFANKLPGQPLVRIAGFGYNEAATEDAW
+ RRVFEFFGQHLRAGSPGEP"
+ gene complement(2302411..2302677)
+ /gene="rpsR2"
+ /locus_tag="BQ2027_MB2081C"
+ CDS complement(2302411..2302677)
+ /gene="rpsR2"
+ /locus_tag="BQ2027_MB2081C"
+ /note="Mb2081c, rpsR2, len: 88 aa. Equivalent to Rv2055c,
+ len: 88 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 88 aa overlap). Probable rpsR2,
+ ribosomal protein S18, similar to others e.g.
+ RR18_ODOSI|P49505 chloroplast 30S ribosomal protein S18
+ (72 aa), FASTA scores: opt: 209, E(): 4.7e-09, (51.6%
+ identity in 64 aa overlap); etc. Also similar to
+ rpsR|Rv0055|MTCY21D4.18 from Mycobacterium tuberculosis
+ (50.0% identity in 84 aa overlap). Protein product from
+ Mb2081c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2081c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s18 rpsr2"
+ /protein_id="SIU00688.1"
+ /db_xref="GOA:P66466"
+ /db_xref="InterPro:IPR001648"
+ /db_xref="InterPro:IPR018275"
+ /db_xref="InterPro:IPR036870"
+ /db_xref="UniProtKB/Swiss-Prot:P66466"
+ /translation="MAAKSARKGPTKAKKNLLDSLGVESVDYKDTATLRVFISDRGKI
+ RSRGVTGLTVQQQRQVAQAIKNAREMALLPYPGQDRQRRAALCP"
+ gene complement(2302678..2302983)
+ /gene="rpsN2"
+ /locus_tag="BQ2027_MB2082C"
+ CDS complement(2302678..2302983)
+ /gene="rpsN2"
+ /locus_tag="BQ2027_MB2082C"
+ /note="Mb2082c, rpsN2, len: 101 aa. Equivalent to Rv2056c,
+ len: 101 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 101 aa overlap). Probable rpsN2,
+ ribosomal protein S14, similar to others e.g.
+ RS14_ECOLI|P02370 30S ribosomal protein S14 from
+ Escherichia coli (100 aa), FASTA scores: opt: 290; E():
+ 1.7e- 13; (46.0% identity in 100 aa overlap); etc. Also
+ similar to rpsN|Rv0717|MTCY210.36 from Mycobacterium
+ tuberculosis, (50.0% identity in 62 aa overlap). Mb2082c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s14 rpsn2"
+ /protein_id="SIU00689.1"
+ /db_xref="GOA:P66406"
+ /db_xref="InterPro:IPR001209"
+ /db_xref="InterPro:IPR023036"
+ /db_xref="UniProtKB/Swiss-Prot:P66406"
+ /translation="MAKKSKIVKNQRRAATVARYASRRTALKDIIRSPSSAPEQRSTA
+ QRALARQPRDASPVRLRNRDAIDGRPRGHLRKFGLSRVRVRQLAHDGHLPGVRKASW"
+ gene complement(2302985..2303149)
+ /gene="rpmG1"
+ /locus_tag="BQ2027_MB2083C"
+ CDS complement(2302985..2303149)
+ /gene="rpmG1"
+ /locus_tag="BQ2027_MB2083C"
+ /note="Mb2083c, rpmG1, len: 54 aa. Equivalent to Rv2057c,
+ len: 54 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 54 aa overlap). Probable rpmG1,
+ ribosomal protein L33. FASTA results: RL33_ECOLI P02436
+ 50S ribosomal protein L33 (54 aa) opt: 183; E(): 1.6e-09;
+ 51.0% identity in 49 aa overlap. Note that previously
+ known as rpmG. Protein product from Mb2083c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2083c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l33 rpmg1"
+ /protein_id="SIU00690.1"
+ /db_xref="GOA:P0A5W1"
+ /db_xref="InterPro:IPR001705"
+ /db_xref="InterPro:IPR011332"
+ /db_xref="InterPro:IPR018264"
+ /db_xref="InterPro:IPR038584"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5W1"
+ /translation="MARTDIRPIVKLRSTAGTGYTYTTRKNRRNDPDRLILRKYDPIL
+ RRHVDFREER"
+ gene complement(2303149..2303385)
+ /gene="rpmB2"
+ /locus_tag="BQ2027_MB2084C"
+ CDS complement(2303149..2303385)
+ /gene="rpmB2"
+ /locus_tag="BQ2027_MB2084C"
+ /note="Mb2084c, rpmB2, len: 78 aa. Equivalent to Rv2058c,
+ len: 78 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 78 aa overlap). Probable rpmB2,
+ ribosomal protein L28, very similar to rL28 of M.
+ tuberculosis. FASTA results: RL28_MYCTU Q10879 50S
+ ribosomal protein L28. mycobacter (94 aa) opt: 338; E():
+ 9.8e-19; 64.9% identity in 77 aa overlap. Also similar to
+ rpmB (Rv0105c) of Mycobacterium tuberculosis. Protein
+ product from Mb2084c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2084c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l28 rpmb2"
+ /protein_id="SIU00691.1"
+ /db_xref="GOA:P66149"
+ /db_xref="InterPro:IPR001383"
+ /db_xref="InterPro:IPR026569"
+ /db_xref="InterPro:IPR034704"
+ /db_xref="InterPro:IPR037147"
+ /db_xref="UniProtKB/Swiss-Prot:P66149"
+ /translation="MSAHCQVTGRKPGFGNTVSHSHRRSRRRWSPNIQQRTYYLPSEG
+ RRIRLRVSTKGIKVIDRDGIEAVVARLRRQGQRI"
+ gene 2303498..2305033
+ /locus_tag="BQ2027_MB2085"
+ CDS 2303498..2305033
+ /locus_tag="BQ2027_MB2085"
+ /note="Mb2085, -, len: 511 aa. Equivalent to Rv2059, len:
+ 511 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 511 aa overlap). Conserved
+ hypothetical protein. Some similarity to EWLA protein
+ gp|U52850|ERU52850_1 Erysipelothrix rhusiopathiae 36 k
+ (304 aa), FASTA score, opt: 287 E(): 6.9e-09; 27.2%
+ identity in 228 aa overlap. There appears to be a
+ frameshift in this ORF around position 3315980 that causes
+ an overlap with next ORF. C-terminal end of protein may be
+ wrong. No error can be found to account for this. Mb2085
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Zinc ABC transporter, substrate-binding protein
+ ZnuA"
+ /protein_id="SIU00692.1"
+ /db_xref="GOA:A0A1R3Y059"
+ /db_xref="InterPro:IPR006127"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y059"
+ /translation="MATPVILVTGHEGTAAVTADLLGLLTDHGTATLRSVAPGSVRRA
+ DPRPRCHRREQRRRHRASMKSAIHPDHHPRRLPRCPVLRRDQVVLEMIVITMVGRPSG
+ PGERKWDVWGSVARAVTGGHVPVKSILTGAHADPHSYQASPADAAAIVDAELVIYNGG
+ GYDPWVDQVLAGHPGVQAVDAYSLLGAVGDDDAPNEHVFYDPNVAKAVAATIADRLAD
+ LDPSNSGNYRANAAEFSRGADAIAISEHAIATTYPDAAVIATEPVVHYLLAAAGLKNR
+ TPATFIAANENGNDPTPADMAAVLDMIAGREVAALLVNPQTPTAATDELQVAARRAGV
+ PITELTETLPSGTDRDQFCAADRPDRRGRSLRADHADRGLSARGHRVGDLLPTALVCH
+ RRSGGRGRPRRASARPGNCVRRTDGRGSRPGCPDRRGTPRDVFADHPRRGGRPGRGCP
+ GRRDRDLGGLRRGFRRRRHPAVAGAWSPGVGVRGHHLVCDLPDLLVAPAAPLTSRSRF
+ RPL"
+ gene 2304603..2305004
+ /locus_tag="BQ2027_MB2086"
+ CDS 2304603..2305004
+ /locus_tag="BQ2027_MB2086"
+ /note="Mb2086, -, len: 133 aa. Equivalent to Rv2060, len:
+ 133 aa, from Mycobacterium tuberculosis strain
+ H37Rv,(100.000% identity in 133 aa overlap). Possible
+ conserved integral membrane protein smaller than but
+ similar to several hypothetical bacterial proteins e.g.
+ >emb|CAC29843.1| (AL583918) putative ABC-transporter
+ transmembrane protein [Mycobacterium leprae] Length = 286
+ and P44691|YEBI_HAEIN (261 aa). FASTA scores:
+ P44691|YEBI_HAEIN HYPOTHETICAL PROTEIN HI0407 (261 aa)
+ opt: 218, E(): 4.2e-08; 31.1% identity in 122 aa overlap.
+ Maybe frameshift upstream at position 3315980 but no error
+ can be found to account for this."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible conserved integral membrane protein"
+ /protein_id="SZX79525.1"
+ /db_xref="GOA:A0A383WQC6"
+ /db_xref="InterPro:IPR001626"
+ /db_xref="InterPro:IPR037294"
+ /db_xref="UniProtKB/TrEMBL:A0A383WQC6"
+ /translation="MLTVVCLLVVTVLAICYRPLLFATVDPEVAAARGVPVRALGIVF
+ AALMGVVAAQAVQIVGALLVMSLLITPAAAAARVVVAPVAAIATSVVFAEVSAVGGIL
+ LSLAPGVPVSVFVATISFVIYLICWLLRRRR"
+ gene complement(2305005..2305409)
+ /locus_tag="BQ2027_MB2087C"
+ CDS complement(2305005..2305409)
+ /locus_tag="BQ2027_MB2087C"
+ /note="Mb2087c, -, len: 134 aa. Equivalent to Rv2061c,
+ len: 134 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 134 aa overlap). Conserved
+ hypothetical protein. Similar to conserved hypothetical
+ proteins from Mycobacterium leprae (128 aa) and
+ Streptomyces coelicolor (153 aa). Smith-Waterman scores:
+ >emb|CAC30396.1| (AL583922) [Mycobacterium leprae], Expect
+ = 7e-47, Identities = 92/131 (70%); >emb|CAC14932.1|
+ (AL449216) [Streptomyces coelicolor], Expect = 6e-19
+ Identities = 48/124 (38%). Protein product from Mb2087c
+ detected using shotgun mass spectrometry. Mb2087c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="F420-dependent enzyme Rv2061c"
+ /protein_id="SIU00693.1"
+ /db_xref="GOA:A0A1R3Y034"
+ /db_xref="InterPro:IPR011576"
+ /db_xref="InterPro:IPR012349"
+ /db_xref="InterPro:IPR019965"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y034"
+ /translation="MTPTFSDLAEAQYLLLTTFTKDGRPKPVPIWAALDTDRGDRLLV
+ ITEKKSWKVKRIRNTPRVTLATCTLRGRPTSEAVEATAAILDESQTGAVYDAIVKRYG
+ IQGKLFTFVSKLRGGMRNNIGLELKVAESETG"
+ gene complement(2305493..2309077)
+ /gene="cobN"
+ /locus_tag="BQ2027_MB2088C"
+ CDS complement(2305493..2309077)
+ /gene="cobN"
+ /locus_tag="BQ2027_MB2088C"
+ /note="Mb2088c, cobN, len: 1194 aa. Equivalent to Rv2062c,
+ len: 1194 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 1194 aa overlap). Probable cobN,
+ cobalamin biosynthesis protein - very similar to
+ COBN_PSEDE P29929 cobn protein. Pseudomonas denitrifica
+ (1275 aa), FASTA scores, opt: 831, E(): 0, (37.5% identity
+ in 983 aa overlap). Also similar to several
+ Mg2+-chelatases e.g. H64479 magnesium chelatase subunit
+ homolog (1226 aa)opt: 962 E(): 0; (27.3% identity in 846
+ aa overlap) Protein product from Mb2088c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2088c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="cobalamin biosynthesis protein cobn"
+ /protein_id="SIU00694.1"
+ /db_xref="GOA:A0A1R3Y298"
+ /db_xref="InterPro:IPR003672"
+ /db_xref="InterPro:IPR011953"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y298"
+ /translation="MPEPTVLLLSTSDTDLISARSSGKNYRWANPSRLSDLELTDLLA
+ EASIVVIRILGGYRAWQSGIDTVIAGGVPAALVSGEQAADAELTDRSTVAAGTALQAH
+ IYLAHGGVDNLRELHAFLCDTVLMTGFGFTPPVATPTWGVLERPDAGKTGPTIAVLYY
+ RAQHLAGNTGYVEALCRAIEDAGGRPLPLYCASLRTAEPRLLERLGGADAMVVTVLAA
+ GGVKPAAASAGGDDDSWNVEHLAALDIPILQGLCLTSPRDQWCANDDGLSPLDVASQV
+ AVPEFDGRIITVPFSFKEIDDDGLISYVADPERCARVAGLAVRHARLRQVAPADKRVA
+ LVFSAYPTKHARIGNAVGLDTPASAVALLQAMRQRGYRVGDLPGVESNDGDALIHALI
+ ECGGHDPDWLTEGQLAGNPIRVSAKEYRDWFATLPAELTDVVTAYWGPPPGELFVDRS
+ HDPDGEIVIAALRAGNLVLMVQPPRGFGENPVAIYHDPDLPPSHHYLAAYRWLDTGFS
+ NGFGAHAVVHLGKHGNLEWLPGKTLGMSASCGPDAALGDLPLIYPFLVNDPGEGTQAK
+ RRAHAVLVDHLIPPMARAETYGDIARLEQLLDEHASVAALDPGKLPAIRQQIWTLIRA
+ AKMDHDLGLTERPEEDSFDDMLLHVDGWLCEIKDVQIRDGLHILGQNPTGEQELDLVL
+ AILRARQLFGGAHAIPGLRQALGLAEDGTDERATVDQTEAKARELVAALQATGWDPSA
+ ADRLTGNADAAAVLRFAATEVIPRLAGTATEIEQVLRALDGRFIPAGPSGSPLRGLVN
+ VLPTGRNFYSVDPKAVPSRLAWEAGVALADSLLARYRDEHGRWPRSVGLSVWGTSAMR
+ TAGDDIAEVLALLGVRPVWDDASRRVIDLAPMQPAELGRPRIDVTVRISGFFRDAFPH
+ VVTMLDDAVRLVADLDEAAEDNYVRAHAQADLAHHGDQRRATTRIFGSKPGTYGAGLL
+ QLIDSRSWRDDADLAQVYTAWGGFAYGRDLDGREAIDDMNRQYRRIAVAAKNTDTREH
+ DIADSDDYFQYHGGMVATVRALTGQAPAAYIGDNTRPDAIRTRTLSEETTRVFRARVV
+ NPRWMAAMRRHGYKGAFEMAATVDYLFGYDATAGVMADWMYEQLTQRYVLDAQNRTFM
+ TESNPWALHGMAERLLEAAGRGLWAQPAPETLDGLRQVLLETEGDLEA"
+ gene 2309155..2309388
+ /gene="maze7"
+ /locus_tag="BQ2027_MB2089"
+ CDS 2309155..2309388
+ /gene="maze7"
+ /locus_tag="BQ2027_MB2089"
+ /note="Mb2089, -, len: 77 aa. Equivalent to Rv2063, len:
+ 77 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 77 aa overlap). Conserved hypothetical
+ protein, showing some similarity to other conserved
+ hypothetical proteins e.g. AL109974_2|SCF34.02c
+ hypothetical protein from Streptomyces coelicolor (133
+ aa), FASTA scores: opt: 102, E(): 1.7, (34.35% identity in
+ 67 aa overlap); and AE005182_1 from Escherichia coli
+ strain O157:H7 (77 aa), FASTA scores: opt: 95, E(): 3.3,
+ (34.85% identity in 66 aa overlap). This ORF replaces
+ previous Rv2063c on other strand. Protein product from
+ Mb2089 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="antitoxin maze7"
+ /protein_id="SIU00695.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0V7"
+ /translation="MSTSTTIRVSTQTRDRLAAQARERGISMSALLTELAAQAERQAI
+ FRAEREASHAETTTQAVRDEDREWEGTVGDGLG"
+ gene 2309381..2309791
+ /gene="mazF7"
+ /locus_tag="BQ2027_MB2089A"
+ CDS 2309381..2309791
+ /gene="mazF7"
+ /locus_tag="BQ2027_MB2089A"
+ /note="Mb2089A, len: 136 aa. Equivalent to Rv2063A len:
+ 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 136 aa overlap). Transferred from
+ H37Rv annotation using Rapid Annotation Transfer Tool
+ (Nucleic Acids Res. 2011 May; 39(9): e57). Possible mazF7
+ toxin, part of toxin-antitoxin (TA) operon with Rv2063
+ (See Pandey and Gerdes, 2005). Protein product from
+ Mb2089A detected using SWATH mass spectrometry. Mb2089A
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible toxin MazF7"
+ /protein_id="SIU00696.1"
+ /db_xref="GOA:A0A1R3Y048"
+ /db_xref="InterPro:IPR003477"
+ /db_xref="InterPro:IPR011067"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y048"
+ /translation="MAEPRRGDLWLVSLGAARAGEPGKHRPAVVVSVDELLTGIDDEL
+ VVVVPVSSSRSRTPLRPPVAPSEGVAADSVAVCRGVRAVARARLVERLGALKPATMRA
+ IENALTLILGLPTGPERGEAATHSPVRWTGGRDP"
+ gene 2309775..2310866
+ /gene="cobG"
+ /locus_tag="BQ2027_MB2090"
+ CDS 2309775..2310866
+ /gene="cobG"
+ /locus_tag="BQ2027_MB2090"
+ /note="Mb2090, cobG, len: 363 aa. Equivalent to Rv2064,
+ len: 363 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 363 aa overlap). Possible cobG,
+ cobalamin biosynthesis protein. Some similarity to
+ COBG_PSEDE P21637 cobg protein. pseudomonas (459 aa) FASTA
+ scores, opt: 240, E(): 1.3e-08, (27.5% identity in 407 aa
+ overlap); contains PS01156 TonB-dependent receptor
+ proteins signature 2 Protein product from Mb2090 detected
+ using SWATH mass spectrometry. Mb2090 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="precorrin-3b synthase cobg"
+ /protein_id="SIU00697.1"
+ /db_xref="GOA:A0A1R3Y0G9"
+ /db_xref="InterPro:IPR005117"
+ /db_xref="InterPro:IPR012798"
+ /db_xref="InterPro:IPR036136"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0G9"
+ /translation="MAGTRDADACPGALRPHQAADGALARIRLPGGMITAAQLATLAS
+ VASDFGSATLELTARGNVQLRGIRDVAAVADAVAKAGLLPSATHERVRNIVASPLSGR
+ AGGLADVRAWVGELDAAIRAEPRLAELGGRFWFGLDDGRADVSGLGADVGVQVFPDGP
+ RLLLTGRDTGVRVADVAETLIEVALRFVKIRETAWRVTELADIGELQSGVELGPSVRP
+ VTKTPVGWIPQDDSRVTLGAAVPLGVLPARVAECLAAIEAPLVITPWRSVLICDLDDA
+ TADAALRVLAPLGLVFDENSPWLNISACTGSPGCAHSAADVRADAARSLNVESAGHRH
+ FVGCERACGSPPAGEVLVATGGGYRRLRP"
+ gene 2310876..2311502
+ /gene="cobH"
+ /locus_tag="BQ2027_MB2091"
+ CDS 2310876..2311502
+ /gene="cobH"
+ /locus_tag="BQ2027_MB2091"
+ /note="Mb2091, cobH, len: 208 aa. Equivalent to Rv2065,
+ len: 208 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 208 aa overlap). Probable cobH,
+ precorrin-8X methylmutase (aka precorrin isomerase) (EC
+ 5.4.1.2), similar to COBH_PSEDE P21638 precorrin isomerase
+ (210 aa), FASTA scores: opt: 750, E(): 0, (55.4% identity
+ in 202 aa overlap). Protein product from Mb2091 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2091 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="precorrin-8x methylmutase cobh (aka precorrin
+ isomerase)"
+ /protein_id="SIU00698.1"
+ /db_xref="GOA:P63840"
+ /db_xref="InterPro:IPR003722"
+ /db_xref="InterPro:IPR036588"
+ /db_xref="UniProtKB/Swiss-Prot:P63840"
+ /translation="MLDYLRDAAEIYRRSFAVIRAEADLARFPADVARVVVRLIHTCG
+ QVDVAEHVAYTDDVVARAGAALAAGAPVLCDSSMVAAGITTSRLPADNQIVSLVADPR
+ ATELAARRQTTRSAAGVELCAERLPGAVLAIGNAPTALFRLLELVDEGAPPPAAVLGG
+ PVGFVGSAQAKEELIERPRGMSYLVVRGRRGGSAMAAAAVNAIASDRE"
+ gene 2311499..2313025
+ /gene="cobI"
+ /locus_tag="BQ2027_MB2092"
+ CDS 2311499..2313025
+ /gene="cobI"
+ /locus_tag="BQ2027_MB2092"
+ /note="Mb2092, cobI, len: 508 aa. Equivalent to Rv2066,
+ len: 508 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 508 aa overlap). Probable CobI-CobJ
+ fusion protein, S-adenosyl-L-methionine-precorrin-2 methyl
+ transferase and precorrin-3 methylase (EC 2.1.1.-).
+ Similar in N-terminal half (aa 1-240) to
+ COBI_PSEDE|P21639, S-adenosyl-L-methionine-precorrin-2
+ methyl transferase (244 aa), FASTA scores: opt: 759, E():
+ 4.4e-34, (49.2% identity in 238 aa overlap); and in
+ C-terminal half (aa 240-508) to P21640|COBJ_PSEDE
+ PRECORRIN-3 METHYLASE (EC 2.1.1.-) (254 aa), FASTA scores:
+ opt: 695, E(): 0, (45.3% identity in 258 aa overlap).
+ Protein product from Mb2092 detected using SWATH mass
+ spectrometry. Mb2092 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable bifunctional protein, CobI-CobJ fusion
+ protein: S-adenosyl-L-methionine-precorrin-2 methyl
+ transferase + precorrin-3 methylase"
+ /protein_id="SIU00699.1"
+ /db_xref="GOA:P66878"
+ /db_xref="InterPro:IPR000878"
+ /db_xref="InterPro:IPR003043"
+ /db_xref="InterPro:IPR006363"
+ /db_xref="InterPro:IPR006364"
+ /db_xref="InterPro:IPR012382"
+ /db_xref="InterPro:IPR014776"
+ /db_xref="InterPro:IPR014777"
+ /db_xref="InterPro:IPR035996"
+ /db_xref="UniProtKB/Swiss-Prot:P66878"
+ /translation="MSARGTLWGVGLGPGDPELVTVKAARVIGEADVVAYHSAPHGHS
+ IARGIAEPYLRPGQLEEHLVYPVTTEATNHPGGYAGALEDFYADATERIATHLDAGRN
+ VALLAEGDPLFYSSYMHLHTRLTRRFNAVIVPGVTSVSAASAAVATPLVAGDQVLSVL
+ PGTLPVGELTRRLADADAAVVVKLGRSYHNVREALSASGLLGDAFYVERASTAGQRVL
+ PAADVDETSVPYFSLAMLPGGRRRALLTGTVAVVGLGPGDSDWMTPQSRRELAAATDL
+ IGYRGYLDRVEVRDGQRRHPSDNTDEPARARLACSLADQGRAVAVVSSGDPGVFAMAT
+ AVLEEAEQWPGVRVRVIPAMTAAQAVASRVGAPLGHDYAVISLSDRLKPWDVIAARLT
+ AAAAADLVLAIYNPASVTRTWQVGAMRELLLAHRDPGIPVVIGRNVSGPVSGPNEDVR
+ VVKLADLNPAEIDMRCLLIVGSSQTRWYSVDSQDRVFTPRRYPEAGRATATKSSRHSD
+ "
+ gene complement(2312971..2314194)
+ /locus_tag="BQ2027_MB2093C"
+ CDS complement(2312971..2314194)
+ /locus_tag="BQ2027_MB2093C"
+ /note="Mb2093c, -, len: 407 aa. Equivalent to Rv2067c,
+ len: 407 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 407 aa overlap). Conserved
+ hypothetical protein, some similarity to YAT1_SYNP6 P08442
+ atp synthase subunits region ORF 1. (417 aa), FASTA
+ scores, opt: 373, E(): 4.9e-18, (27.7% identity in 358 aa
+ overlap) Protein product from Mb2093c detected using SWATH
+ mass spectrometry. Mb2093c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SAM-dependent methyltransferase"
+ /protein_id="SIU00700.1"
+ /db_xref="InterPro:IPR025714"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5G2"
+ /translation="MTDDHPRADIVSRQYHRWLYPHPIADLEAWTTANWEWFDPVHSH
+ RILWPDREYRPDLDILIAGCGTNQAAIFAFTNRAAKVVAIDISRPALDHQQYLKDKHG
+ LANLELHLLPIEELATLGRDFDLVVSTGVLHHLADPRAGMKELAHCLRRDGVVAAMLY
+ GKYGRIGVELLGSVFRDLGLGQDDASIKLAKEAISLLPTYHPLRNYLTKARDLLSDSA
+ LVDTFLHGRQRSYTVEECVDLVTSAGLVFQGWFHKAPYYPHDFFVPNSEFYAAVNTLP
+ EVKAWSVMERLETLNATHLFMACRRDRPKEQYTIDFSTVAALDYVPLMRTRCGVSGTD
+ MFWPGWRMAPSPAQLAFLQQVDGRRTIREIAGCVARTGEPSGGSLADLEEFGRKLFQS
+ LWRLDFVAVALPASG"
+ gene complement(2314210..2315133)
+ /gene="blaC"
+ /locus_tag="BQ2027_MB2094C"
+ CDS complement(2314210..2315133)
+ /gene="blaC"
+ /locus_tag="BQ2027_MB2094C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2094c, blaC, len: 307 aa. Equivalent to Rv2068c,
+ len: 307 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 307 aa overlap). blaC, class A
+ beta-lactamase (EC 3.5.2.6) (see citation below), similar
+ to e.g. BLAC_NOCLA Q06316 beta-lactamase precursor (302
+ aa), FASTA scores, opt: 860, E(): 0, (50.2% identity in
+ 283 aa overlap); eyc. Contains PS00013 Prokaryotic lipid
+ attachment site near N-terminus, and PS00146
+ Beta-lactamase class-A active site. BELONGS TO THE CLASS-C
+ BETA-LACTAMASE FAMILY. Protein product from Mb2094c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2094c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CLASS A BETA-LACTAMASE BLAC"
+ /protein_id="SIU00701.1"
+ /db_xref="GOA:P0A5I7"
+ /db_xref="InterPro:IPR000871"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="InterPro:IPR023650"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5I7"
+ /translation="MRNRGFGRRELLVAMAMLVSVTGCARHASGARPASTTLPAGADL
+ ADRFAELERRYDARLGVYVPATGTTAAIEYRADERFAFCSTFKAPLVAAVLHQNPLTH
+ LDKLITYTSDDIRSISPVAQQHVQTGMTIGQLCDAAIRYSDGTAANLLLADLGGPGGG
+ TAAFTGYLRSLGDTVSRLDAEEPELNRDPPGDERDTTTPHAIALVLQQLVLGNALPPD
+ KRALLTDWMARNTTGAKRIRAGFPADWKVIDKTGTGDYGRANDIAVVWSPTGVPYVVA
+ VMSDRAGGGYDAEPREALLAEAATCVAGVLA"
+ gene 2315268..2315825
+ /gene="sigC"
+ /locus_tag="BQ2027_MB2095"
+ CDS 2315268..2315825
+ /gene="sigC"
+ /locus_tag="BQ2027_MB2095"
+ /note="Mb2095, sigC, len: 185 aa. Equivalent to Rv2069,
+ len: 185 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 185 aa overlap). Probable sigC, RNA
+ polymerase sigma factor (see citation below), with
+ similarity to SIGX_BACSU|P35165 probable RNA polymerase
+ sigma factor from Bacillus subtilis (194 aa), FASTA
+ scores: opt: 218, E(): 4.1e-07, (32.6% identity in 129 aa
+ overlap). Belongs to ECF subfamily. Mb2095 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="rna polymerase sigma factor, ecf subfamily,
+ sigc"
+ /protein_id="SIU00702.1"
+ /db_xref="GOA:P66810"
+ /db_xref="InterPro:IPR000838"
+ /db_xref="InterPro:IPR007627"
+ /db_xref="InterPro:IPR013249"
+ /db_xref="InterPro:IPR013324"
+ /db_xref="InterPro:IPR013325"
+ /db_xref="InterPro:IPR014284"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR039425"
+ /db_xref="UniProtKB/Swiss-Prot:P66810"
+ /translation="MTATASDDEAVTALALSAAKGNGRALEAFIKATQQDVWRFVAYL
+ SDVGSADDLTQETFLRAIGAIPRFSARSSARTWLLAIARHVVADHIRHVRSRPRTTRG
+ ARPEHLIDGDRHARGFEDLVEVTTMIADLTTDQREALLLTQLLGLSYADAAAVCGCPV
+ GTIRSRVARARDALLADAEPDDLTG"
+ gene complement(2315815..2316510)
+ /gene="cobK"
+ /locus_tag="BQ2027_MB2096C"
+ CDS complement(2315815..2316510)
+ /gene="cobK"
+ /locus_tag="BQ2027_MB2096C"
+ /note="Mb2096c, cobK, len: 231 aa. Similar to Rv2070c,
+ len: 244 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.7% identity in 227 aa overlap). Probable cobK,
+ precorrin-6x reductase (EC 1.3.1.54), similar to e.g.
+ L21196|g347169|RERCOBLMK3 RERCOBLMKN from Rhodococcus sp.
+ NI86/21 (248 aa), FASTA scores: opt: 792, E(): 0, (53.6%
+ identity in 250 aa overlap). Also similarity to
+ CBIJ_SALTY|Q05591 cbij protein from Salmonella typhimurium
+ (263 aa), FASTA scores: opt: 166, E(): 9e-0 5, (26.7%
+ identity in 258 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base insertion (*-a) leads to a shorter product
+ with a different NH2 part compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (231 aa versus 244
+ aa). Protein product from Mb2096c detected using SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="precorrin-6x reductase cobk"
+ /protein_id="SIU00703.1"
+ /db_xref="GOA:A0A1R3Y042"
+ /db_xref="InterPro:IPR003723"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y042"
+ /translation="MRWRKSCNPHVEIVSSLAGRVPNPALPIGPVRIGGFGGVEGLRG
+ WLREERIDAVVDATHPFAVTITAHAAQVCGELGLPYLVLARPPWDPGTAIIAVSDIEA
+ ADVVAEQGYSRVFLTTGRSGIAAFANSDAWFLIRVVTAPDGTALPRRHKLVLSRGPYG
+ YHDEFALLREQRIDALVTKNSGGKMTRAKLDAAAALGISVVMIARPLLPAGVAAVDSV
+ HRAAMWVAGLPSR"
+ gene complement(2316547..2317302)
+ /gene="cobM"
+ /locus_tag="BQ2027_MB2097C"
+ CDS complement(2316547..2317302)
+ /gene="cobM"
+ /locus_tag="BQ2027_MB2097C"
+ /note="Mb2097c, cobM, len: 251 aa. Equivalent to Rv2071c,
+ len: 251 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 251 aa overlap). Probable cobM,
+ precorrin-3 methylase (EC 2.1.1.133), similar to e.g.
+ L21196|g347169|RERCOBLMK2 RERCOBLMK from Rhodococococcus
+ sp. NI86/21 (249 aa), FASTA scores: opt: 992, E(): 0,
+ (62.4% identity in 245 aa overlap) and to COBM_
+ PSEDE|P21922 precorrin-3 methylase (253 aa), FASTA scores:
+ opt: 863, E(): 0, (54.6% identity in 249 aa overlap).
+ Contains PS00839 Uroporphyrin-III C-methyltransferase
+ signature 1, and PS00840 Uroporphyrin-III
+ C-methyltransferase signature 2."
+ /codon_start=1
+ /transl_table=11
+ /product="precorrin-3 methylase cobm (precorrin-4
+ c11-methyltransferase)"
+ /protein_id="SIU00704.1"
+ /db_xref="GOA:A0A1R3Y2A3"
+ /db_xref="InterPro:IPR000878"
+ /db_xref="InterPro:IPR003043"
+ /db_xref="InterPro:IPR006362"
+ /db_xref="InterPro:IPR014776"
+ /db_xref="InterPro:IPR014777"
+ /db_xref="InterPro:IPR035996"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2A3"
+ /translation="MTVYFIGAGPGAADLITVRGQRLLQRCPVCLYAGSIMPDDLLAQ
+ CPPGATIVDTGPLTLEQIVRKLADADADGRDVARLHSGDPSLYSALAEQCRELDALGI
+ GYEIVPGVPAFAAAAAALKRELTVPGVAQTVTLTRVATLSTPMPPGEDLAALARSRAT
+ LVLHLAAAQIDAIVPRLLDGGYRPETPVAVVAFASWPQQRTLRGTLADIAARMHDAKI
+ TRTAVIVVGDVLTAEGFTDSYLYSVARHGRYAQ"
+ gene complement(2317299..2318132)
+ /gene="cobLb"
+ /locus_tag="BQ2027_MB2098C"
+ CDS complement(2317299..2318132)
+ /gene="cobLb"
+ /locus_tag="BQ2027_MB2098C"
+ /note="Mb2098c, cobLb, len: 294 aa. Equivalent to 3' end
+ of Rv2072c, len: 390 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.7% identity in 294 aa overlap). Probable
+ cobL, methyl transferase (EC 2.1.1.132), similar to
+ L21196|g347169|RERCOBLMK1 from Rhodocococcus sp. NI86/21
+ (447 aa), FASTA scores: opt: 892; E(): 0; (50.1% identity
+ in 369 aa overlap), and to COBL_PSEDE|P21921 precorrin-6y
+ methylase (413 aa), FASTA scores: opt: 830, E(): 0, (40.6%
+ identity in 404 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ large 2029 bp deletion (H37Rv2.2330073-2332101-*)(RD9)
+ leads to the loss of the NH2 part of cobL, the entire
+ Rv2073 and Rv2074, and the COOH part of Mb2100c. In
+ addition, while cobL exists as a single gene in
+ Mycobacterium tuberculosis strain H37Rv, in Mycobacterium
+ bovis a frameshift due to a single base insertion (*-t)
+ splits cobL into 2 parts, cobLa and cobLb."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable precorrin-6y methyltransferase CobLb
+ [SECOND PART]"
+ /protein_id="SIU00705.1"
+ /db_xref="GOA:A0A1R3Y0W7"
+ /db_xref="InterPro:IPR014008"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="InterPro:IPR035996"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0W7"
+ /translation="MYDTEVISLVTAQPHTAVRRGGRAIVLSGDRSTPQALAVLLTEH
+ GRGDSKFSVLEQLGGPAERRRDGTARAWACDPPLDVDELNVIAVRYLPDERTSWAPDE
+ AFAHDGQITKHPIRVLTLAALAPRPGQRLWDVGAGSGAIAVQWCRSWPGCTAVAFERD
+ ERRRRNIGFNAAAFGVSVDVRGDAPDAFDDAARPSVIFLGGGVTQPGLLEACLDSLPA
+ GGNLVANAVTVESEAALAHAYSRLGGELRRFQHYLGEPLGGFTGWRPQLPVTQWSVTK
+ R"
+ gene complement(2318125..2318313)
+ /gene="cobLa"
+ /locus_tag="BQ2027_MB2099C"
+ CDS complement(2318125..2318313)
+ /gene="cobLa"
+ /locus_tag="BQ2027_MB2099C"
+ /note="Mb2099c, cobLa, len: 62 aa. Similar to 5' end of
+ Rv2072c, len: 390 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (97.727% identity in 44 aa overlap).
+ Probable cobL, methyl transferase (EC 2.1.1.132), similar
+ to L21196|g347169|RERCOBLMK1 from Rhodocococcus sp.
+ NI86/21 (447 aa), FASTA scores: opt: 892; E(): 0; (50.1%
+ identity in 369 aa overlap), and to COBL_PSEDE|P21921
+ precorrin-6y methylase (413 aa), FASTA scores: opt: 830,
+ E(): 0, (40.6% identity in 404 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ large deletion of 2029 bp (H37Rv2.2330073-2332101-*) (RD9)
+ leads to the loss of the NH2 part of cobL, the entire
+ Rv2073 and Rv2074, and the COOH part of Mb2100c. In
+ addition, while cobL exists as a single gene in
+ Mycobacterium tuberculosis strain H37Rv, in Mycobacterium
+ bovis a frameshift due to a single base insertion (*-t)
+ splits cobL into 2 parts, cobLa and cobLb. Mb2099c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable precorrin-6y methyltransferase CobLa
+ [FIRST PART]"
+ /protein_id="SIU00706.1"
+ /db_xref="GOA:A0A1R3Y058"
+ /db_xref="InterPro:IPR035996"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y058"
+ /translation="MLPAVQGLSPDGADLHVVASGDPLLHGIGSTLIRLFGHDNVTVF
+ AARVRGDVGVRPDGLERV"
+ gene complement(2318388..2319176)
+ /locus_tag="BQ2027_MB2100C"
+ CDS complement(2318388..2319176)
+ /locus_tag="BQ2027_MB2100C"
+ /note="Mb2100c, -, len: 262 aa. Equivalent to 5' end of
+ Rv2075c, len: 487 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 259 aa overlap).
+ Possibly exported or envelope protein; has potential
+ signal peptide at N-terminus and hydrophobic stretch
+ around residue 430. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a large 2029 bp deletion (RD9) leads
+ to the loss of the COOH part of Mb2100c, the entire Rv2074
+ and Rv2073, and the NH2 part of cobL compared to its
+ homolog in Mycobacterium tuberculosis strain H37Rv.
+ Mb2100c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible hypothetical exported or envelope
+ protein"
+ /protein_id="SIU00707.1"
+ /db_xref="GOA:A0A1R3Y0I2"
+ /db_xref="InterPro:IPR017946"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0I2"
+ /translation="MPRARWLQSAALMGALAVVLITAAPVAADAYQVPAPPSPTASCD
+ VISPVAIPCVALGKFADAVAAECRRVGVPDARCVLPLAHRVTQAARDAYLQSWVHRTA
+ RFQDALQDPVPLRETQWLGTHNSFNSLSDSFTVSHADSNQQLSLAQQLDIDVRALELD
+ LHYLPRLEGHGAPGVTVCHGLGPKNANLGCTVEPLLATVLPQIANWLNAPGHTEEVIL
+ LYLEDQLKNASAYESVVATLDQVLRRADGTSLIYRPNPARRGPQ"
+ gene complement(2319334..2319585)
+ /locus_tag="BQ2027_MB2101C"
+ CDS complement(2319334..2319585)
+ /locus_tag="BQ2027_MB2101C"
+ /note="Mb2101c, -, len: 83 aa. Equivalent to Rv2076c, len:
+ 83 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 83 aa overlap). Unknown, questionable
+ ORF,Mb2101c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein"
+ /protein_id="SIU00708.1"
+ /db_xref="GOA:P64932"
+ /db_xref="UniProtKB/Swiss-Prot:P64932"
+ /translation="MVVCLIGGVAGSLWPRPAGRLRGGCYFAFMGVAWVLLAISAIAN
+ AVKGSLWWDIWSLGLLVLIPAVVYGKMRRSRRISSDQDR"
+ gene complement(2319620..2320591)
+ /locus_tag="BQ2027_MB2102C"
+ CDS complement(2319620..2320591)
+ /locus_tag="BQ2027_MB2102C"
+ /note="Mb2102c, -, len: 323 aa. Equivalent to Rv2077c,
+ len: 323 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 323 aa overlap). Possible conserved
+ transmembrane protein. Part of Mycobacterium tuberculosis
+ protein family with Rv2542, Rv2079, Rv2797c, Rv0963c,
+ Rv1949c. Hydrophobic stretches at C-terminus."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00709.1"
+ /db_xref="GOA:P64934"
+ /db_xref="UniProtKB/Swiss-Prot:P64934"
+ /translation="MLATLSQIRAWSTEHLIDAAGYWTETADRWEDVFLQMRNQAHAI
+ AWNGAGGDGLRQRTRADFSTVSGIADQLRRAATIARNGAGTIDAAQRRVMYAVEDAQD
+ AGFNVGEDLSVTDTKTTQPAAVQAARLAQAQALAGDIRLRVGQLVAAENEVSGQLAAT
+ TGDVGNVRFAGAPVVAHSAVQLVDFFKQDGPTPPPPGAPHPSGGADGPYSDPITSMML
+ PPAGTEAPVSDATKRWVDNMVNELAARPPDDPIAVEARRLAFQALHRPCNSAEWTAAV
+ AGFAGSSAGVVGTALAIPAGPADWALLGAALLGVGGSGAAVVNCATK"
+ gene complement(2320592..2320891)
+ /locus_tag="BQ2027_MB2103C"
+ CDS complement(2320592..2320891)
+ /locus_tag="BQ2027_MB2103C"
+ /note="Mb2103c, -, len: 99 aa. Equivalent to Rv2077A, len:
+ 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 99 aa overlap). Conserved hypothetical
+ protein, similar to P95263|Rv1951c CONSERVED HYPOTHETICAL
+ PROTEIN from Mycobacterium tuberculosis (137 aa), FASTA
+ scores: opt: 271, E(): 1.5e-11, (51.04% identity in 97 aa
+ overlap); and some similarity with P95012|Rv2541
+ HYPOTHETICAL ALANINE RICH PROTEIN from Mycobacterium
+ tuberculosis (135 aa), FASTA scores: opt: 140, E(): 0.014,
+ (32.95% identity in 88 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00710.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y068"
+ /translation="MGSNELQVVLGQLEVAASQSQGLGAQFAASATPPESGQPFQATT
+ VAVSGINAAICCAAAEFATRTQATATGVAAAAAAYAHQEATAASEMAAVTQVTVV"
+ gene 2321356..2321670
+ /locus_tag="BQ2027_MB2104"
+ CDS 2321356..2321670
+ /locus_tag="BQ2027_MB2104"
+ /note="Mb2104, -, len: 104 aa. Equivalent to Rv2078, len:
+ 104 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 104 aa overlap). Unknown"
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein"
+ /protein_id="SIU00711.1"
+ /db_xref="InterPro:IPR022534"
+ /db_xref="UniProtKB/Swiss-Prot:P59982"
+ /translation="MFVDVGLLHSGANESHYAGEHAHGGADQLSRGPLLSGMFGTFPV
+ AQTFHDAVGAAHAQQMRNLHAHRQALITVGEKARHAATGFTDMDDGNAAELKAVVCSC
+ AT"
+ gene 2321652..2323622
+ /locus_tag="BQ2027_MB2105"
+ CDS 2321652..2323622
+ /locus_tag="BQ2027_MB2105"
+ /note="Mb2105, -, len: 656 aa. Equivalent to Rv2079, len:
+ 656 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 656 aa overlap). Conserved hypothetical
+ protein; part of Mycobacterium tuberculosis protein family
+ with Rv2542, Rv2077c, Rv2797c, Rv0963c, Rv1949c. Contains
+ PS00120 Lipases, serine active site,Mb2105 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00712.1"
+ /db_xref="InterPro:IPR010427"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y081"
+ /translation="MQLRHINIRALIAEAGGDPWAIEHSLHAGRPAQIAELAEAFHAA
+ GRCTAEANAAFEEARRRFEASWNRENGEHPINDSAEVQRVTAALGVQSLQLPKIGVDL
+ ENIAADLAEAQRAAAGRIATLESQLQRIDDQLDQALELEHDPRLAAAERSELDALITC
+ LEQDAIDDTASALGQLQSIRAGYSDHLQQSLAMLRADGYDGAGLQGLDAPQSPVKLEE
+ PIQIPPPGTGAPEVHRWWTSLTSEERQRLIAEHPEQIGNLNGVPVSARSDANIAVMTR
+ DLNRVRDIATRYRTSVDDVLGDPAKYGLSAGDITRYRNADETKKGLDHNARNDPRNPS
+ PVYLFAYDPMAFGGKGRAAIAIGNPDTAKHTAVIVPGTSSSVKGGWLHDNHDDALNLF
+ NQAKAADPNNPTAVIAWMGYDAPNDFTDPRIATPMLARIGGAALAEDVNGLWVTHLGV
+ GQNVTVLGHSYGSTTVADAFALGGMHANDAVLLGCPGTDLAHSAASFHLDGGRVYVGA
+ ASTDPISMLGQLDSLSQYVNRGNLAGQLQGLAVGLGTDPAGDGFGSVRFRAEVPNSDG
+ INPHDHSYYYHRGSEALRSMADIASGHGDALASDGMLAQPRHQPGVEIDIPGLGSVEI
+ DIPGTPASIDPEWSRPPGSITDDHVFDAPLHR"
+ gene 2323603..2324166
+ /gene="lppJ"
+ /locus_tag="BQ2027_MB2106"
+ CDS 2323603..2324166
+ /gene="lppJ"
+ /locus_tag="BQ2027_MB2106"
+ /note="Mb2106, lppJ, len: 187 aa. Equivalent to Rv2080,
+ len: 187 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 187 aa overlap). Possible lppJ,
+ lipoprotein; contains prokayotic lipoprotein modification
+ site (PS00013) and signal sequence at N-terminus. Mb2106
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="lipoprotein lppj"
+ /protein_id="SIU00713.1"
+ /db_xref="GOA:Q7VER1"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VER1"
+ /translation="MPHSTADRRLRLTRQALLAAAVAPLLAGCALVMHKPHSAGSSNP
+ WDDSAHPLTDDQAMAQVVEPAKQIVAAADLQAVRAGFSFTSCNDQGDPPYQGTVRMAF
+ LLQGDHDAYFQHVRAAMLSHGWIDGPPPGQYFHGITLHKNGVTANMSLALDHSYGEMI
+ LDGECRNTTDHHHDDETTNITNQLVQP"
+ gene complement(2324362..2324805)
+ /locus_tag="BQ2027_MB2107C"
+ CDS complement(2324362..2324805)
+ /locus_tag="BQ2027_MB2107C"
+ /note="Mb2107c, -, len: 147 aa. Equivalent to Rv2081c,
+ len: 146 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 147 aa overlap). Possible transmembrane
+ unknown protein. Hydrophobic stretch from aa 32-54.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a 3
+ bp insertion (*-ggg) leads to a slightly longer product
+ compared t its homolog in Mycobacterium tuberculosis
+ strain H37Rv (147 aa versus 146 aa). Mb2107c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved transmembrane protein"
+ /protein_id="SIU00714.1"
+ /db_xref="GOA:A0A1R3Y2B4"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2B4"
+ /translation="MFANAGLSPFVAIWTARAASLYTSHNFWCAAAVSAAVYVGSAVV
+ PAAVAGPLFVGRVSATIKAAAPSTTAAIATLATAANGQLRERGGAGGWVGVHCPVVGG
+ GGGVGHPRKAIAAAVSVHSTCMPAAFGGHLGLGDRSRSVSLSGTP"
+ gene 2324842..2326310
+ /locus_tag="BQ2027_IS1556"
+ mobile_element 2324842..2326310
+ /locus_tag="BQ2027_IS1556"
+ /note="IS1556, len: 1469 nt. Equivalent to IS1556, len:
+ 1469 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(100.0% identity in 1469 nt overlap). Possible
+ IS-like region."
+ /mobile_element_type="insertion sequence:IS1556"
+ gene 2325009..2327174
+ /locus_tag="BQ2027_MB2108"
+ CDS 2325009..2327174
+ /locus_tag="BQ2027_MB2108"
+ /note="Mb2108, -, len: 721 aa. Equivalent to Rv2082, len:
+ 721 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 721 aa overlap). Conserved hypothetical
+ protein. Similar to Mycobacterium tuberculosis Rv0029, and
+ to Rv3899c and Rv3900c which may be frameshifted. Protein
+ product from Mb2108 detected using SWATH mass
+ spectrometry. Mb2108 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Vegetative cell wall protein gp1 precursor"
+ /protein_id="SIU00715.1"
+ /db_xref="InterPro:IPR040604"
+ /db_xref="InterPro:IPR040833"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0X4"
+ /translation="MAGDLPPGRWSALLVGAWWPARPDAPMAGVTYWRKAAQLKRNEA
+ NDLRNERSLLAVNQGRTADDLLERYWRGEQRLATIAHQCEVKSDQSEQVADAVNYLRD
+ RLTEIAQSGNQQINQILAGKGPIEAKVAAVNAVIEQSNAMADHVGATAMSNIIDATQR
+ VFDETIGGDAHTWLRDHGVSLDAPARPRPVTAEDMTSMTANSPAGSPFGAAPSAPSHS
+ TTTSGPPTAPTPTSPFGTAPMVLSSSSTSSGPPTAPTPTSPFGTAPMPPGPPPPGTVS
+ PPLPPSAPAVGVGGPSVPAAGMPPAAAAATAPLSPQSLGQSFTTGMTTGTPAAAGAQA
+ LSAGALHAATEPLPPPAPPPTTPTVTTPTVATATTAGIPHIPDSAPTPSPAPIAPPTT
+ DNASAMTPIAPMVANGPPASPAPPAAAPAGPLPAYGADLRPPVTTPPATPPTPTGPIS
+ GAAVTPSSPAAGGSLMSPVVNKSTAPATTQAQPSNPTPPLASATAAATTGAAAGDTSR
+ RAAEQQRLRRILDTVARQEPGLSWAAGLRDNGQTTLLVTDLASGWIPPHIRLPAHITL
+ LEPAPRRRHATVTDLLGTTTVAAAHHPHGYLSQPDPDTPALTGDRTARIAPTIDELGP
+ TLVETVRRHDTLPRIAQAVVVAATRNYGVPDNETDLLHHKTTEIHQAVLTTYPNHDIA
+ TVVDWMLLAAINALIAGDQSGANYHLAWAIAAISTRRSR"
+ gene 2327171..2328115
+ /locus_tag="BQ2027_MB2109"
+ CDS 2327171..2328115
+ /locus_tag="BQ2027_MB2109"
+ /note="Mb2109, -, len: 314 aa. Equivalent to Rv2083, len:
+ 314 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 314 aa overlap). Conserved hypothetical
+ protein. Similar to Mycobacterium tuberculosis Rv3898c
+ (110 aa) and Rv3897c (210 aa) Protein product from Mb2109
+ detected using SWATH mass spectrometry. Mb2109 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00716.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y069"
+ /translation="MTSIESHPEQYWAAAGRPGPVPLALGPVHPGGPTLIDLLMALFG
+ LSTNADLGGTNADIEGDDTDRRAHAADAARKFSANEANAAEQMQGVGAQGMAQMASGI
+ GGALSGALGGVMGPLTQLPQQAMQAGQGAMQPLMSAMQQAQGADGLAAVDGARLLDSI
+ GGEPGLGSGAGGGDVGGGGAGGTTPTGYLGPPPVPTSSPPTTPAGAPTKSATMPPPGG
+ ASPASAHMGAAGMPMVPPGAMGARGEGSGQEKPVEKRVTAPAVPNGQPVKGRLTVPPS
+ APTTKPTDGKPVVRRRILLPEHKDFGRIAPDEKTDAGE"
+ gene 2328108..2329103
+ /locus_tag="BQ2027_MB2110"
+ CDS 2328108..2329103
+ /locus_tag="BQ2027_MB2110"
+ /note="Mb2110, -, len: 331 aa. Similar to 5' end of
+ Rv2084, len: 378 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.3% identity in 284 aa overlap).
+ Hypothetical unknown protein.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv2084 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to an 11 bp
+ insertion (*-ggcgtacacac), splits Rv2084 into 2 parts,
+ Mb2110 and Mb2111. Mb2110 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00717.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0J2"
+ /translation="MSDDSSSAFDLICAEIERQLRGGELLMDAAAASELLLTVRYQLD
+ TQPRPLVIVHGPLFQAVKAARAQVYGRLIQLRHARCEVLDERWQLRPTGQRDVRALLI
+ DVLNVLLAAITAAGVERAYACAERRAMAAAVVAKNYRDALGVELQCNSVCRAAAEAIH
+ ALAHRTGATEDADCLPPVDVIHADVTRRMHGEVATDVVAAGELVIAARHLLDPMPRGE
+ LSYGPLHEGGNAARKSVYRRLVQLWQARRAVTDGDVDLRDARTLLTDLDSILREMRTA
+ ATIQQAYTRAERRAMAAAVVAKIRGDAMGLDAQRDAVHRAAADALHALQSVGIHQ"
+ gene 2329148..2329255
+ /locus_tag="BQ2027_MB2111"
+ CDS 2329148..2329255
+ /locus_tag="BQ2027_MB2111"
+ /note="Mb2111 found to be expressed during exponential
+ growth in Sauton's minimal media by
+ RNA-sequencing.,Mb2111, -, len: 110 aa. Similar to 3' end
+ of Rv2084, len: 378 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (97.0% identity in 100 aa overlap).
+ Hypothetical unknown protein.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis stain H37Rv, Rv2084 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to an 11 bp
+ insertion (*-ggcgtacacac), splits Rv2084 into 2 parts,
+ Mb2110 and Mb2111. Protein product from Mb2111 detected
+ using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00718.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y045"
+ /translation="MPGRESTPSDDGGSLHPSGRPRRVHRRRWCGLGLC"
+ gene 2329253..2330721
+ /locus_tag="BQ2027_IS1556"
+ gene 2329338..2329643
+ /locus_tag="BQ2027_MB2112"
+ CDS 2329338..2329643
+ /locus_tag="BQ2027_MB2112"
+ /note="Mb2112, -, len: 101 aa. Equivalent to Rv2085, len:
+ 101 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 101 aa overlap). Conserved
+ hypothetical protein, similar to YI32_MYCTU P19772
+ insertion element IS986 hypothetical 6.6 kda protein (59
+ aa), FASTA scores, opt: 119, E(): 0.002 9, (36.4% identity
+ in 55 aa overlap); ORFs Rv2085, Rv2086 and Rv2087
+ (MTCY49.24,25,26, and 27) all show similarity to
+ transposases but we can find no sequence errors to account
+ for the frameshifts. Contains possible helix-turn-helix
+ motif at aa 33 to 54,(+3.11 SD). Mb2112 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00719.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64936"
+ /translation="MSDMCDVVSFVGAAERVLRARFRPSPESGPPVHARRCGWSLGIS
+ AETLRRWAGQAEVDSGVVAGVSASRSGSVKTSELEQTIEILKVATSFFARKCDPRHR"
+ gene 2329622..2330227
+ /locus_tag="BQ2027_MB2113"
+ CDS 2329622..2330227
+ /locus_tag="BQ2027_MB2113"
+ /note="Mb2113, -, len: 201 aa. Equivalent to Rv2086, len:
+ 201 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 201 aa overlap). Conserved
+ hypothetical protein: low similarity to transposases; ORFs
+ Rv2085, Rv2086 and Rv2087 (MTCY49.24,25,26, and 27) all
+ show similarity to transposases but we can find no
+ sequence errors to account for the frameshifts. Start
+ changed since first submission (-16 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00720.1"
+ /db_xref="InterPro:IPR025948"
+ /db_xref="UniProtKB/Swiss-Prot:P64938"
+ /translation="MRPATPLICAFGDKHKHTYGVTPICRALAVHGVQIASRTYFADR
+ AAAPSKRALWDTTITEILAGYYEPDAEGKRPPECLYGSLKMWAHLQRQGFRWPSATVK
+ TIMRANGWRGVPLAAHITHHRTRPGRGPGPRPGGSAMAGFSNEPAGSGRLHLRADDVE
+ FRLHRVRGRRLRRCDRGLGMLADQRRSVRRTRITPRPSRLT"
+ gene 2330305..2330535
+ /locus_tag="BQ2027_MB2114"
+ CDS 2330305..2330535
+ /locus_tag="BQ2027_MB2114"
+ /note="Mb2114, -, len: 76 aa. Equivalent to Rv2087, len:
+ 76 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 76 aa overlap). Conserved hypothetical
+ protein, with low similarity to transposases; ORFs Rv2085,
+ Rv2086 and Rv2087 (MTCY49.24,25,26, and 27) all show
+ similarity to transposases but we can find no sequence
+ errors to account for the frameshifts. Start changed since
+ first submission (-45 aa). Mb2114 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00721.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y063"
+ /translation="MLAGLRPSIGIVGDALDNALCETTTGPHRTECSHGSPFRSGPIR
+ TLADLEDIASAWVEHTCHTQQGVRIPGRLQPA"
+ gene 2330722..2332491
+ /gene="pknJ"
+ /locus_tag="BQ2027_MB2115"
+ CDS 2330722..2332491
+ /gene="pknJ"
+ /locus_tag="BQ2027_MB2115"
+ /note="Mb2115, pknJ, len: 589 aa. Equivalent to Rv2088,
+ len: 589 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 589 aa overlap). Probable pknJ,
+ transmembrane serine/threonine-protein kinase (EC 2.7.1.-)
+ (see citation below), similar to other
+ serine/threonine-protein kinases e.g. PKWA_THECU|P49695
+ putative serine/threonine-protein kinase (742 aa), FASTA
+ scores: opt: 457, E(): 2.7e-15, (26.0% identity in 578 aa
+ overlap); etc. Contains PS00108 Serine/Threonine protein
+ kinases active-site signature. Contains Hank's kinase
+ subdomain. BELONGS TO THE SER/THR FAMILY OF PROTEIN
+ KINASES. Experimental studies show evidence of
+ auto-phosphorylation. Protein product from Mb2115 detected
+ using SWATH mass spectrometry. Mb2115 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="transmembrane serine/threonine-protein kinase j
+ pknj (protein kinase j) (stpk j)"
+ /protein_id="SIU00722.1"
+ /db_xref="GOA:P65733"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR008271"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="InterPro:IPR026954"
+ /db_xref="InterPro:IPR038232"
+ /db_xref="UniProtKB/Swiss-Prot:P65733"
+ /translation="MAHELSAGSVFAGYRIERMLGAGGMGTVYLARNPDLPRSEALKV
+ LAAELSRDLDFRARFVREADVAAGLDHPNIVAVHQRGQFEGRLWIAMQFVDGGNAEDA
+ LRAATMTTARAVYVIGEVAKALDYAHQQGVIHRDIKPANFLLSRAAGGDERVLLSDFG
+ IARALGDTGLTSTGSVLATLAYAAPEVLAGQGFDGRADLYSLGCALFRLLTGEAPFAA
+ GAGAAVAVVAGHLHQPPPTVSDRVPGLSAAMDAVIATAMAKDPMRRFTSAGEFAHAAA
+ AALYGGATDGWVPPSPAPHVISQGAVPGSPWWQHPVGSVTALATPPGHGWPPGLPPLP
+ RRPRRYRRGVAAVAAVMVVAAAAVTAVTMTSHQPRTATPPSAAALSPTSSSTTPPQPP
+ IVTRSRLPGLLPPLDDVKNFVGIQNLVAHEPMLQPQTPNGSINPAECWPAVGGGVPSA
+ YDLGTVIGFYGLTIDEPPTGTAPNQVGQLIVAFRDAATAQRHLADLASIWRRCGGRTV
+ TLFRSEWRRPVELSTSVPEVVDGITTMVLTAQGPVLRVREDHAIAAKNNVLVDVDIMT
+ PDTSRGQQAVIGITNYILAKIPG"
+ gene complement(2332508..2333635)
+ /gene="pepE"
+ /locus_tag="BQ2027_MB2116C"
+ CDS complement(2332508..2333635)
+ /gene="pepE"
+ /locus_tag="BQ2027_MB2116C"
+ /note="Mb2116c, pepE, len: 375 aa. Equivalent to Rv2089c,
+ len: 375 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 375 aa overlap). Probable pepE,
+ dipeptidase, similar to e.g. PEPQ_LACDL P46545, xaa-pro
+ dipeptidase (368 aa), FASTA scores, opt: 617, E(): 5.1
+ e-32, (34.7% identity in 363 aa overlap); contains PS00491
+ Aminopeptidase P and proline dipeptidase signature. Also
+ similar to Mycobacterium tuberculosis peptidases Rv2861c,
+ Rv0734, Rv2535c. Protein product from Mb2116c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2116c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="dipeptidase pepe"
+ /protein_id="SIU00723.1"
+ /db_xref="GOA:P65811"
+ /db_xref="InterPro:IPR000587"
+ /db_xref="InterPro:IPR000994"
+ /db_xref="InterPro:IPR001131"
+ /db_xref="InterPro:IPR029149"
+ /db_xref="InterPro:IPR036005"
+ /db_xref="UniProtKB/Swiss-Prot:P65811"
+ /translation="MGSRRFDAEVYARRLALAAAATADAGLAGLVITPGYDLCYLIGS
+ RAETFERLTALVLPAAGAPAVVLPRLELAALKQSAAAELGLRVCDWVDGDDPYGLVSA
+ VLGGAPVATAVTDSMPALHMLPLADALGVLPVLATDVLRRLRMVKEETEIDALRKAGA
+ AIDRVHARVPEFLVPGRTEADVAADIAEAIVAEGHSEVAFVIVGSGPHGADPHHGYSD
+ RELREGDIVVVDIGGTYGPGYHSDSTRTYSIGEPDSDVAQSYSMLQRAQRAAFEAIRP
+ GVTAEQVDAAARDVLAEAGLAEYFVHRTGHGIGLCVHEEPYIVAGNDLVLVPGMAFSI
+ EPGIYFPGRWGARIEDIVIVTEDGAVSVNNCPHELIVVPVS"
+ gene 2333684..2334808
+ /locus_tag="BQ2027_MB2117"
+ CDS 2333684..2334808
+ /locus_tag="BQ2027_MB2117"
+ /note="Mb2117, -, len: 374 aa. Equivalent to Rv2090, len:
+ 393 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (94.7% identity in 393 aa overlap). Probable 5'-3'
+ exonuclease, similar to exonuclease part of DNA
+ polymerase, e.g. DPO1_MYCTU Q07700 DNA polymerase I (EC
+ 2.7.7.7) (pol i) (904 aa), FASTA scores, opt: 461, E():
+ 1.2e-17, (38.7% identity in 292 aa overlap). BELONGS TO
+ FAMILY A OF DNA POLYMERASES.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 57 bp in-frame deletion leads to a shorter product
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv (374 aa versus 393 aa). Protein product from
+ Mb2117 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="probable 5'-3' exonuclease"
+ /protein_id="SIU00724.1"
+ /db_xref="GOA:A0A1R3Y2B9"
+ /db_xref="InterPro:IPR002421"
+ /db_xref="InterPro:IPR008918"
+ /db_xref="InterPro:IPR020045"
+ /db_xref="InterPro:IPR020046"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="InterPro:IPR036279"
+ /db_xref="InterPro:IPR038969"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2B9"
+ /translation="MPAPDPMRGDPPHPAPPRLRSPLDPTSGDPLHPAPPRLRSPLDP
+ TSGDPLHPAPPRLRSPLVLLDGASMWFRSFFGVPSSITAPDGRPVNAVRGFIDSMAVV
+ IIQQRPNRLAVCLDLDWRPQFRVDLIPSYKAHRVAEPEPNGQPDVEEVPDELTPQVDM
+ IMELLDAFGIAMAGAPGFEADDVLGTLATRERRDPVIVVSGDRDLLQVVADDPVPVRV
+ LYLGRGLAKATLFGPAEVAERYGLPAHRAGAAYAELALLRGDPSDGLPGVPGVGEKTA
+ ATLLARHGSLDQIMAAADDRKTTMAKGLRTKLLAASAYIKAADRVVRVATDAPVTLST
+ PTDRLPLVAADPERTAELATRFGVESSIARLQKALDTLPG"
+ gene complement(2334812..2335546)
+ /locus_tag="BQ2027_MB2118C"
+ CDS complement(2334812..2335546)
+ /locus_tag="BQ2027_MB2118C"
+ /note="Mb2118c, -, len: 244 aa. Equivalent to Rv2091c,
+ len: 244 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 244 aa overlap). Probable membrane
+ protein; contains potential transmembrane region.
+ Repetitive ORF. Protein product from Mb2118c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2118c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable membrane protein"
+ /protein_id="SIU00725.1"
+ /db_xref="GOA:P64940"
+ /db_xref="InterPro:IPR025637"
+ /db_xref="UniProtKB/Swiss-Prot:P64940"
+ /translation="MSGPQGSDPRQPWQPPGQGADHSSDPTVAAGYPWQQQPTQEATW
+ QAPAYTPQYQQPADPAYPQQYPQPTPGYAQPEQFGAQPTQLGVPGQYGQYQQPGQYGQ
+ PGQYGQPGQYAPPGQYPGQYGPYGQSGQGSKRSVAVIGGVIAVMAVLFIGAVLILGFW
+ APGFFVTTKLDVIKAQAGVQQVLTDETTGYGAKNVKDVKCNNGSDPTVKKGATFECTV
+ SIDGTSKRVTVTFQDNKGTYEVGRPQ"
+ gene complement(2335588..2338308)
+ /gene="helY"
+ /locus_tag="BQ2027_MB2119C"
+ CDS complement(2335588..2338308)
+ /gene="helY"
+ /locus_tag="BQ2027_MB2119C"
+ /note="Mb2119c, helY, len: 906 aa. Equivalent to Rv2092c,
+ len: 906 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 906 aa overlap). Probable helY, DNA
+ helicase (EC 3.6.1.-), with similarity to YJF0_YEAST
+ P47047 hypothetical helicase in tdh1-gyp6 intergenic
+ region, (1073 aa), FASTA scores, opt: 1004, E(): 0, (29.0%
+ identity in 970 aa o verlap); contains PS00017
+ ATP/GTP-binding site motif A, PS00402
+ Binding-protein-dependent transport systems inner membrane
+ comp signature. BELONGS TO THE SKI2 SUBFAMILY OF
+ HELICASES. Protein product from Mb2119c detected using
+ SWATH mass spectrometry. Mb2119c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="atp-dependent dna helicase hely"
+ /protein_id="SIU00726.1"
+ /db_xref="GOA:A0A1R3Y080"
+ /db_xref="InterPro:IPR001650"
+ /db_xref="InterPro:IPR011545"
+ /db_xref="InterPro:IPR012961"
+ /db_xref="InterPro:IPR014001"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y080"
+ /translation="MTELAELDRFTAELPFSLDDFQQRACSALERGHGVLVCAPTGAG
+ KTVVGEFAVHLALAAGSKCFYTTPLKALSNQKHTDLTARYGRDQIGLLTGDLSVNGNA
+ PVVVMTTEVLRNMLYADSPALQGLSYVVMDEVHFLADRMRGPVWEEVILQLPDDVRVV
+ SLSATVSNAEEFGGWIQMVRGDTTVVVDEHRPVPLWQHVLVGKRMFDLFDYRIGEAEG
+ QPQVNRELLRHIAHRREADRMADWQPRRRGSGRPGFYRPPGRPEVIAKLDAEGLLPAI
+ TFVFSRAGCDAAVTQCLRSPLRLTSEEERARIAEVIDHRCGDLADSDLAVLGYYEWRE
+ GLLRGLAAHHAGMLPAFRHTVEELFTAGLVKAVFATETLALGINMPARTVVLERLVKF
+ NGEQHMPLTPGEYTQLTGRAGRRGIDVEGHAVVIWHPEIEPSEVAGLASTRTFPLRSS
+ FAPSYNMTINLVHRMGPQQAHRLLEQSFAQYQADRSVVGLVRGIERGNRILGEIAAEL
+ GGSDAPILEYARLRARVSELERAQARASRLQRRQAATDALAALRRGDIITITHGRRGG
+ LAVVLESARDRDDPRPLVLTEHRWAGRISSADYSGTTPVGSMTLPKRVEHRQPRVRRD
+ LASALRSAAAGLVIPAARRVSEAGGFHDPELESSREQLRRHPVHTSPGLEDQIRQAER
+ YLRIERDNAQLERKVAAATNSLARTFDRFVGLLTEREFIDGPATDPVVTDDGRLLARI
+ YSESDLLVAECLRTGAWEGLKPAELAGVVSAVVYETRGGDGQGAPFGADVPTPRLRQA
+ LTQTSRLSTTLRADEQAHRITPSREPDDGFVRVIYRWSRTGDLAAALAAADVNGSGSP
+ LLAGDFVRWCRQVLDLLDQVRNAAPNPELRATAKRAIGDIRRGVVAVDAG"
+ gene complement(2338357..2339283)
+ /gene="tatC"
+ /locus_tag="BQ2027_MB2120C"
+ CDS complement(2338357..2339283)
+ /gene="tatC"
+ /locus_tag="BQ2027_MB2120C"
+ /note="Mb2120c, tatC, len: 308 aa. Equivalent to Rv2093c,
+ len: 308 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 308 aa overlap). Probable tatC,
+ transmembrane protein, component of twin-arginine
+ translocation protein export system (see citation below
+ for more information), equivalent to U00017|U00017_1 from
+ Mycobacterium leprae (317 aa), FASTA scores: opt: 1722,
+ E(): 0, (84.5% identity in 310 aa overlap). Similarity to
+ others e.g. P27857|TATC_ECOLI|MTTB|B3839|Z5360|ECS4768
+ Sec-independent protein translocase protein from E. coli
+ strain K12 and O157:H7 (258 aa), FASTA scores: opt: 344,
+ E(): 6e-16, (32.5% identity in 265 aa overlap). BELONGS TO
+ THE TATC FAMILY. Protein product from Mb2120c detected
+ using SWATH mass spectrometry. Mb2120c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="sec-independent protein translocase
+ transmembrane protein tatc"
+ /protein_id="SIU00727.1"
+ /db_xref="GOA:P66896"
+ /db_xref="InterPro:IPR002033"
+ /db_xref="InterPro:IPR019820"
+ /db_xref="UniProtKB/Swiss-Prot:P66896"
+ /translation="MRAAGLLKRLNPRNRRSRVNPDATMSLVDHLTELRTRLLISLAA
+ ILVTTIFGFVWYSHSIFGLDSLGEWLRHPYCALPQSARADISADGECRLLATAPFDQF
+ MLRLKVGMAAGIVLACPVWFYQLWAFITPGLYQRERRFAVAFVIPAAVLFVAGAVLAY
+ LVLSKALGFLLTVGSDVQVTALSGDRYFGFLLNLLVVFGVSFEFPLLIVMLNLAGLLT
+ YERLKSWRRGLIFAMFVFAAIFTPGSDPFSMTALGAALTVLLELAIQIARVHDKRKAK
+ REAAIPDDEASVIDPPSPVPAPSVIGSHDDVT"
+ gene complement(2339300..2339551)
+ /gene="tatA"
+ /locus_tag="BQ2027_MB2121C"
+ CDS complement(2339300..2339551)
+ /gene="tatA"
+ /locus_tag="BQ2027_MB2121C"
+ /note="Mb2121c, tatA, len: 83 aa. Equivalent to Rv2094c,
+ len: 83 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 83 aa overlap). Probable tatA,
+ membrane-bound protein, component of twin-arginine
+ translocation protein export system (see citation below
+ for more information), equivalent to U00017_2 from
+ Mycobacterium leprae (88 aa), FASTA scores: opt: 392, E():
+ 2e-20, (68.2% identity in 88 aa overlap). Similarity to
+ others e.g. P27856|O65938|TATA_ECOLI SEC-INDEPENDENT
+ PROTEIN TRANSLOCASE PROTEIN from E. coli strains K12 and
+ O157:H7 (261 aa), FASTA scores: opt: 111, E(): 0.25, (28.0
+ % identity in 75 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ TATA/E FAMILY. Protein product from Mb2121c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2121c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="sec-independent protein translocase
+ membrane-bound protein tata"
+ /protein_id="SIU00728.1"
+ /db_xref="GOA:P66890"
+ /db_xref="InterPro:IPR003369"
+ /db_xref="InterPro:IPR006312"
+ /db_xref="UniProtKB/Swiss-Prot:P66890"
+ /translation="MGSLSPWHWAILAVVVIVLFGAKKLPDAARSLGKSLRIFKSEVR
+ ELQNENKAEASIETPTPVQSQRVDPSAASGQDSTEARPA"
+ gene complement(2339619..2340569)
+ /gene="pafc"
+ /locus_tag="BQ2027_MB2122C"
+ CDS complement(2339619..2340569)
+ /gene="pafc"
+ /locus_tag="BQ2027_MB2122C"
+ /note="Mb2122c, -, len: 316 aa. Equivalent to Rv2095c,
+ len: 316 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 316 aa overlap). Conserved hypothetical
+ protein. Highly similar to ML1330 P54075|YY35_MYCLE
+ HYPOTHETICAL 27.0 KD PROTEIN (247 aa) opt: 1127 E(): 0,
+ (78.4% identity in 227 aa overlap). Also similar to
+ ORF11(1) of Rhodococcus erythropolis. FASTA score:
+ Z82004|REZ820043 REZ82004 NID: g1666179 - Rhodococcus (326
+ aa) opt: 624 E(): 1.1e-30; (56.7% identity in 319 aa
+ overlap). Contains possible helix-turn-helix motif at aa
+ 25-46, (+2.92 SD) Protein product from Mb2122c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2122c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="proteasome accessory factor c pafc"
+ /protein_id="SIU00729.1"
+ /db_xref="GOA:A0A1R3Y0A3"
+ /db_xref="InterPro:IPR026881"
+ /db_xref="InterPro:IPR028349"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0A3"
+ /translation="MSALSTRLVRLLNMVPYFQANPRITRAEAAAELGVTAKQLEEDL
+ NQLWMCGLPGYSPGDLIDFEFCGDTIEVTFSAGIDRPLKLTSPEATGLLVALRALADI
+ PGVVDPQAARSAIAKIAAAAGAVAAVAEQAPTESPAAAAVRAAVRNSRALTIDYYAAS
+ HDTLTTRIVDPIRVLLIGGHSYLEAWSREAEGVRLFRFDRIVDAAELGEPAVPPESAR
+ QAPPDTSLFDGDLSLPSATLRVAPSASWMLEYYPIRELRQLPDGSCEVVMTYASEDWM
+ TRLLLGFGSDVRVLAPESLAQRVRDAATAALDAYQAAAPP"
+ gene complement(2340566..2341564)
+ /gene="pafb"
+ /locus_tag="BQ2027_MB2123C"
+ CDS complement(2340566..2341564)
+ /gene="pafb"
+ /locus_tag="BQ2027_MB2123C"
+ /note="Mb2123c, -, len: 332 aa. Equivalent to Rv2096c,
+ len: 332 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 332 aa overlap). Conserved
+ hypothetical protein. Highly similar to ML1329,
+ P54076|YY36_MYCLE HYPOTHETICAL 35.4 KD PROTEIN B21 (331
+ aa) opt: 1676 E(): 0; (80.2% identity in 329 aa overlap)
+ and to ORF10(1) of Rhodococcus erythropolis,
+ Z82004|REZ820042 REZ 82004 NID: g1666179 (330 aa) opt:
+ 1232, E(): 0; 59.9% identity in 332 aa overlap Protein
+ product from Mb2123c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2123c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="proteasome accessory factor b pafb"
+ /protein_id="SIU00730.1"
+ /db_xref="InterPro:IPR026881"
+ /db_xref="UniProtKB/Swiss-Prot:P64942"
+ /translation="MATSKVERLVNLVIALLSTRGYITAEKIRSSVAGYSDSPSVEAF
+ SRMFERDKNELRDLGIPLEVGRVSALEPTEGYRINRDAYALSPVELTPDEAAAVAVAT
+ QLWESPELITATQGALLKLRAAGVDVDPLDTGAPVAIASAAAVSGLRGSEDVLGILLS
+ AIDSGQVVQFSHRSSRAEPYTVRTVEPWGVVTEKGRWYLVGHDRDRDATRVFRLSRIG
+ AQVTPIGPAGATTVPAGVDLRSIVAQKVTEVPTGEQATVWVAEGRATALRRAGRSAGP
+ RQLGGRDGEVIELEIRSSDRLAREITGYGADAIVLQPGSLRDDVLARLRAQAGALA"
+ gene complement(2341573..2342931)
+ /gene="pafa"
+ /locus_tag="BQ2027_MB2124C"
+ CDS complement(2341573..2342931)
+ /gene="pafa"
+ /locus_tag="BQ2027_MB2124C"
+ /note="Mb2124c, -, len: 452 aa. Equivalent to Rv2097c,
+ len: 452 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 452 aa overlap). Conserved
+ hypothetical protein. Similarity to YTH6_ RHOSO P43484
+ hypothetical protein in thcr 5' region (333 aa), FASTA
+ scores opt: 738, E(): 0, (38.5% identity in 330 aa
+ overlap). Also highly similar to Mycobacterium leprae
+ protein ML1328, P54077|YY37_MYCLE HYPOTHETICAL 38.1 KD
+ PROTEIN (336 aa) opt: 1985 E(): 0; (96.4% identity in 307
+ aa overlap) Protein product from Mb2124c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2124c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="proteasome accessory factor a pafa"
+ /protein_id="SIU00731.1"
+ /db_xref="GOA:P64944"
+ /db_xref="InterPro:IPR004347"
+ /db_xref="InterPro:IPR022279"
+ /db_xref="UniProtKB/Swiss-Prot:P64944"
+ /translation="MQRRIMGIETEFGVTCTFHGHRRLSPDEVARYLFRRVVSWGRSS
+ NVFLRNGARLYLDVGSHPEYATAECDSLVQLVTHDRAGEWVLEDLLVDAEQRLADEGI
+ GGDIYLFKNNTDSAGNSYGCHENYLIVRAGEFSRISDVLLPFLVTRQLICGAGKVLQT
+ PKAATYCLSQRAEHIWEGVSSATTRSRPIINTRDEPHADAEKYRRLHVIVGDSNMSET
+ TTMLKVGTAALVLEMIESGVAFRDFSLDNPIRAIREVSHDVTGRRPVRLAGGRQASAL
+ DIQREYYTRAVEHLQTREPNAQIEQVVDLWGRQLDAVESQDFAKVDTEIDWVIKRKLF
+ QRYQDRYDMELSHPKIAQLDLAYHDIKRGRGIFDLLQRKGLAARVTTDEEIAEAVDQP
+ PQTTRARLRGEFISAAQEAGRDFTVDWVHLKLNDQAQRTVLCKDPFRAVDERVKRLIA
+ SM"
+ gene complement(2342983..2344458)
+ /gene="pe21"
+ /locus_tag="BQ2027_MB2125C"
+ CDS complement(2342983..2344458)
+ /gene="pe21"
+ /locus_tag="BQ2027_MB2125C"
+ /note="Mb2125c, PE_PGRS36, len: 491 aa. Equivalent to
+ Rv2099c (PE21) and Rv2098c (PE_PGRS36), len: 58 aa and 433
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 58 aa overlap and 99.8% identity in 433 aa
+ overlap). Rv2098c|PE_PGRS36: Member of Mycobacterium
+ tuberculosis PE-family, PGRS sub-family. Frameshifted near
+ N-terminus. Rv2099c|PE21: 5'-end of Rv2098c (MTCY49.38c),
+ then frameshifts. Sequence has been checked, no errors
+ found. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, PE_PGRS36 and PE21 exist as 2
+ genes. In Mycobacterium bovis, a single base insertion
+ (*-c) leads to a single product more similar to PE_PGRS36.
+ There is also a 3 bp in-frame deletion (ggc-*)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs36"
+ /protein_id="SIU00732.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/Swiss-Prot:P0A689"
+ /translation="MSFVIASPEALLAAATDLAAIRSTIRAANAAAAVPTTGALAPAA
+ DEVSAGIAALFGAQAQSYQAVSAQAAAFHDRFVQLLNAGGGSYASAEIANAQQNLLNA
+ VNAPTQTLLGRPLVGDGADGASGPVGQPGGDGGILWGNGGNGGDSTSPGVAGGAGGSA
+ GLIGNGGRGGNGAPGGAGGNGGLGGLLLGNGGAGGVGGTGDNGVGDLGAGGGGGDGGL
+ GGRAGLIGHGGAGGNGGDGGHGGSGKAGGSGGSGGFGQFGGAGGLLYGNGGAAGSGGN
+ GGDAGTGVSSDGFAGLGGSGGRGGDAGLIGVGGGGGNGGDPGLGARLFQVGSRGGDGG
+ VGGWLYGDGGGGGDGGNGGLPFIGSTNAGNGGSARLIGNGGAGGSGGSGAPGSVSSGG
+ VGGAGNPGGSGGNGGVWYGNGGAGGAAGQGGPGMNTTSPGGPGGVGGHGGTAILFGDG
+ GAGGAGAAGGPGTPDGAAGPGGSGGTGGLLFGVPGPSGPDG"
+ gene 2344641..2346293
+ /locus_tag="BQ2027_MB2126"
+ CDS 2344641..2346293
+ /locus_tag="BQ2027_MB2126"
+ /note="Mb2126, -, len: 550 aa. Equivalent to Rv2100, len:
+ 550 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 550 aa overlap). Conserved
+ hypothetical protein. Member of Mycobacterium tuberculosis
+ 13E12 repeat family with Rv1148c, Rv1945, Rv3467, Rv0094c,
+ Rv1128c, Rv1587c, Rv1702c, Rv3466, Rv1588c."
+ /codon_start=1
+ /transl_table=11
+ /product="13E12 repeat family protein, HNH endonuclease
+ domain"
+ /protein_id="SIU00733.1"
+ /db_xref="InterPro:IPR003615"
+ /db_xref="InterPro:IPR003870"
+ /db_xref="UniProtKB/Swiss-Prot:P64946"
+ /translation="MAGALFEPSFAAAHPAGLLRRPVTRTVVLSVAATSIAHMFEISL
+ PDPTELCRSDDGALVAAIEDCARVEAAASARRLSAIAELTGRRTGADQRADWACDFWD
+ CAAAEVAAALTISHGKASGQMHLSLALNRLPQVAALFLAGHLGARLFSIIAWRTYLVR
+ DPHALSLLDAALAEHAGAWGPLSAPKLEKAIDSWIDRYDPGALRRSRISARTRDLCIG
+ DPDEDAGTAALWGRLYATDAAMLDRRLTEMAHGVCEDDPRTLAQRRADALGALAAGAD
+ HLACGCGKPDCPSGAGNDERAAGVVIHVVADASALDAQPDPHLSGDEPPSRPLTPETT
+ LFEALTPDPEPDPPATHAPAELITTGGGVVPAPLLAELIRGGATISQVRHPGDLAAEP
+ HYRPSAKLAEFVRMRDLTCRFPGCDVPAEFCDIDHSAPWPLGPTHPSNLKCACRKHHL
+ LKTFWTGWRDVQLPDGTVIWTAPNGHTYTTHPGSRIFFPTWHTTTAELPQTSTAAVNV
+ DARGLMMPRRRRTRAAELAHRINAERALNDAYMAERNKPPSF"
+ gene 2346492..2349533
+ /gene="helZ"
+ /locus_tag="BQ2027_MB2127"
+ CDS 2346492..2349533
+ /gene="helZ"
+ /locus_tag="BQ2027_MB2127"
+ /note="Mb2127, helZ, len: 1013 aa. Equivalent to Rv2101,
+ len: 1013 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.7% identity in 1013 aa overlap). Probable helZ,
+ helicase (EC 3.6.-.-), similar to many e.g.
+ PCC6803|P74552|SLL1366 HELICASE OF THE SNF2/RAD54 FAMILY
+ from Synechocystis sp. strain PCC 6803 (1039 aa), FASTA
+ scores: opt: 2015, E(): 0, (38.4% identity in 1063 aa
+ overlap); etc. Protein product from Mb2127 detected using
+ SWATH mass spectrometry. Mb2127 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE HELICASE HELZ"
+ /protein_id="SIU00734.1"
+ /db_xref="GOA:A0A1R3Y2C1"
+ /db_xref="InterPro:IPR000330"
+ /db_xref="InterPro:IPR001650"
+ /db_xref="InterPro:IPR014001"
+ /db_xref="InterPro:IPR022138"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR038718"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2C1"
+ /translation="MLVLHGFWSNSGGMRLWAEDSDLLVKSPSQALRSARPHPFAAPA
+ DLIAGIHPGKPATAVLLLPSLRSAPLDSPELIRLAPRPAARTDPMLLAWTVPVVDLDP
+ TAALAAFDQPAPDVRYGASVDYLAELAVFARELVERGRVLPQLRRDTHGAAACWRPVL
+ QGRDVVAMTSLVSAMPPVCRAEVGGHDPHELATSALDAMVDAAVRAALSPMDLLPPRR
+ GRSKRHRAVEAWLTALTCPDGRFDAEPDELDALAEALRPWDDVGIGTVGPARATFRLS
+ EVETENEETPAGSLWRLEFLLQSTQDPSLLVPAEQAWNDDGSLRRWLDRPQELLLTEL
+ GRASRIFPELVPALRTACPSGLELDADGAYRFLSGTAAVLDEAGFGVLLPSWWDRRRK
+ LGLVLSAYTPVDGVVGKASKFGREQLVEFRWELAVGDDPLSEEEIAALTETKSPLIRL
+ RGQWVALDTEQLRRGLEFLERKPTGRKTTAEILALAASHPDDVDTPLEVTAVRADGWL
+ GDLLAGAAAASLQPLDPPDGFTATLRPYQQRGLAWLAFLSSLGLGSCLADDMGLGKTV
+ QLLALETLESVQRHQDRGVGPTLLLCPMSLVGNWQQEAARFAPNLRVYAHHGGARLHG
+ EALRDHLERTDLVVSTYTTATRDIDELSEYEWNRVVLDEAQAVKNSLSRAAKAVRRLR
+ AAHRVALTGTPMENRLAELWSIMDFLNPGLLGSSERFRTRYAIPIERHGHTEPAERLR
+ ASTRPYILRRLKTDPAIIDDLPEKIEIKQYCQLTTEQASLYQAVVADMMEKIENTEGI
+ ERRGNVLAAMAKLKQVCNHPAQLLHDRSPVGRRSGKVIRLEEILEEILAEGDRVLCFT
+ QFTEFAELLVPHLAARFGRAARDIAYLHGGTPRKRRDEMVARFQSGDGPPIFLLSLKA
+ GGTGLNLTAANHVVHLDRWWNPAVENQATDRAFRIGQRRTVQVRKFICTGTLEEKIDE
+ MIEEKKALADLVVTDGEGWLTELSTRDLREVFALSEGAVGE"
+ gene 2349526..2350359
+ /locus_tag="BQ2027_MB2128"
+ CDS 2349526..2350359
+ /locus_tag="BQ2027_MB2128"
+ /note="Mb2128, -, len: 238 aa. Equivalent to Rv2102, len:
+ 238 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.000% identity in 238 aa overlap). Conserved
+ hypothetical protein, similar to part of hypothetical
+ protein D90916_18 (289 aa) from Synechocystis sp. PCC6803.
+ Contains PS00017 ATP/GTP-binding site motif A(P-loop).
+ FASTA scores: D90916|D90916_18 Synechocystis sp.PCC6803
+ complete (289 aa) opt: 498, E(): 1.9e-25; 46.7% identity
+ in 167 aa overlap. Protein product from Mb2128 detected
+ using SWATH mass spectrometry. Mb2128 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SWF/SNF family helicase Rv2102"
+ /protein_id="SIU00735.1"
+ /db_xref="GOA:A0A1R3Y0Z5"
+ /db_xref="InterPro:IPR007527"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Z5"
+ /translation="MSSTWYPPPSRPRPVEGGIKARSTRGAIAQTWWSERFIAVLEDI
+ GLGNRLQRGRSYARKGQVISLQVDAGLVTALVQGSRARPYRIRIGIPAFGKSQWAHVE
+ RTLAENAWYAAKLLSGEMPEDIEDVFAGLGLSLFPGTARELSLDCSCPDYAVPCKHLA
+ ATFYLLAESFDEDPFAILAWRGREREDLLANLAAARADGAAPAADHAEQVAQPLTDCL
+ DRYYARQADINVPSPPATPSTALLDQLPDTGLSARGRPLTELLRPAYHALTHHHNSAG
+ G"
+ gene complement(2350338..2350772)
+ /gene="vapc37"
+ /locus_tag="BQ2027_MB2129C"
+ CDS complement(2350338..2350772)
+ /gene="vapc37"
+ /locus_tag="BQ2027_MB2129C"
+ /note="Mb2129c, -, len: 144 aa. Equivalent to Rv2103c,
+ len: 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 144 aa overlap). Conserved
+ hypothetical protein, similar to hypothetical
+ mycobacterial proteins belonging to family, includes
+ Rv0749, Rv0277c, Rv2530c, Rv3320c, Rv2494, Rv2872, Rv0617,
+ Rv1242 etc. FASTA scores: sptr|Q49793|Q49793 B2126_C3_261
+ (97 aa) opt: 331, E(): 4.8e-18; 59.4% identity in 96 aa
+ overlap and gp|Z74024|MTCY274_3 Mycobacterium tuberculosis
+ cosmid (147 aa) opt: 234, E(): 1.2e-10; 34.8% identity in
+ 141 aa overlap. Protein product from Mb2129c detected
+ using shotgun mass spectrometry. Mb2129c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin vapc37. contains pin domain."
+ /protein_id="SIU00736.1"
+ /db_xref="GOA:A0A1R3Y089"
+ /db_xref="InterPro:IPR002716"
+ /db_xref="InterPro:IPR006226"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR029060"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y089"
+ /translation="MKIVDANVLLYAVNTTSEHHKPSLRWLDGALSGADRVGFAWVPL
+ LAFVRLATKVGLFPRPLPREAAITQVADWLAAPSAVLVNPTVRHADILARMLTYVGTG
+ ANLVNDAHLAALAVEHRASIVSYDSDFGRFEGVRWDQPPALL"
+ gene complement(2350779..2351033)
+ /gene="vapb37"
+ /locus_tag="BQ2027_MB2130C"
+ CDS complement(2350779..2351033)
+ /gene="vapb37"
+ /locus_tag="BQ2027_MB2130C"
+ /note="Mb2130c, -, len: 84 aa. Equivalent to Rv2104c, len:
+ 84 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 84 aa overlap). Conserved hypothetical
+ protein, similar to members of a family of hypothetical
+ mycobacterial proteins including Rv2871, Rv1241, Rv2132,
+ Rv3321c, Rv1113, Rv0657, Rv1560, etc. FASTA scores:
+ sptr|Q49787|Q49787 B2126_C2_217 (97 aa) opt: 197, E():
+ 2e-07; 57.1% identity in 56 aa overlap and
+ Z95388|MTCY270_36 Mycobacterium tuberculosis cosmid (76
+ aa) opt: 142, E(): 0.0011; 41.8% identity in 55 aa
+ overlap. Mb2130c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible antitoxin vapb37"
+ /protein_id="SIU00737.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0M6"
+ /translation="MRTTVTLDDDVEQLVRRRMAERQVSFKKALNDAIRDGASGRPAP
+ SHFSTRTADLGVPAVNLDRALQLAADLEDEELVRRQRRGS"
+ gene 2352253..2352549
+ /gene="PE22"
+ /locus_tag="BQ2027_MB2131"
+ CDS 2352253..2352549
+ /gene="PE22"
+ /locus_tag="BQ2027_MB2131"
+ /note="Mb2131, PE22, len: 98 aa. Equivalent to Rv2107,
+ len: 98 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 98 aa overlap). Member of
+ mycobacterial PE family e.g. Y03A_MYCTU Q10637
+ hypothetical glycine-rich 49.6 kd protein (603 aa), FASTA
+ scores; opt: 214 E(): 1.3e-14, 39.8% identity in 93 aa
+ overlap"
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe22"
+ /protein_id="SIU00738.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y062"
+ /translation="MSFVNVDPFGMLAAAATLESLGSHMAVSNAAVASVTTKVPPPAA
+ DYVSKKLSLFFSSHGQQYQVQAARGTAFHRKLVRTLANGALAYEEVEIANNEGF"
+ gene 2352605..2353336
+ /gene="PPE36"
+ /locus_tag="BQ2027_MB2132"
+ CDS 2352605..2353336
+ /gene="PPE36"
+ /locus_tag="BQ2027_MB2132"
+ /note="Mb2132, PPE36, len: 243 aa. Equivalent to Rv2108,
+ len: 243 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 243 aa overlap). N-terminus is similar
+ to N-terminal region of Mycobacterium tuberculosis PPE
+ family proteins eg. YX23_MYCTU Q10813 hypothetical 41.1 kd
+ protein cy274.23 (404 aa), FASTA scores; opt: 431, E():
+ 3.9e-32, 44.0% identity in 166 aa overlap"
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe36"
+ /protein_id="SIU00739.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0A7"
+ /translation="MPNFWALPPEINSTRIYLGPGSGPILAAAQGWNALASELEKTKV
+ GLQSALDTLLESYRGQSSQALIQQTLPYVQWLTTTAEHAHKTAIQLTAAANAYEQARA
+ AMVPPAMVRANRVQTTVLKAINWFGQFSTRIADKEADYEQMWFQDALVMENYWEAVQE
+ AIQSTSHFEDPPEMADDYDEAWMLNTVFDYHNENAKEEVIHLVPDVNKERGPIELVTK
+ VDKEGTIRLVYDGEPTFSYKEHPKF"
+ gene complement(2353876..2354622)
+ /gene="prcA"
+ /locus_tag="BQ2027_MB2133C"
+ CDS complement(2353876..2354622)
+ /gene="prcA"
+ /locus_tag="BQ2027_MB2133C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2133c, prcA, len: 248 aa. Equivalent to Rv2109c,
+ len: 248 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 248 aa overlap). prcA, proteasome
+ alpha-type subunit 1, highly similar to TR:Q53080
+ (EMBL:U26421) proteasome alpha-type subunit 1 from
+ Rhodococcus (259 aa), FASTA scores; opt: 1035, E(): 0,
+ 67.2% identity in 247 aa overlap. Protein product from
+ Mb2133c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2133c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="proteasome alpha subunit prca; assembles with
+ beta subunit prcb."
+ /protein_id="SIU00740.1"
+ /db_xref="GOA:Q7TZ14"
+ /db_xref="InterPro:IPR001353"
+ /db_xref="InterPro:IPR022296"
+ /db_xref="InterPro:IPR023332"
+ /db_xref="InterPro:IPR029055"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZ14"
+ /translation="MSFPYFISPEQAMRERSELARKGIARAKSVVALAYAGGVLFVAE
+ NPSRSLQKISELYDRVGFAAAGKFNEFDNLRRGGIQFADTRGYAYDRRDVTGRQLANV
+ YAQTLGTIFTEQAKPYEVELCVAEVAHYGETKPPELYRITYDGSIADEPHFVVMGGTT
+ EPIANALKESYAENASLTDALGIAVAALRAGSADTSGGDQPTLGVASLEVAVLDANRP
+ RRAFRRITGSALQALLVDQESPQSDGESSG"
+ gene complement(2354619..2355494)
+ /gene="prcB"
+ /locus_tag="BQ2027_MB2134C"
+ CDS complement(2354619..2355494)
+ /gene="prcB"
+ /locus_tag="BQ2027_MB2134C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2134c, prcB, len: 291 aa. Equivalent to Rv2110c,
+ len: 291 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 291 aa overlap). prcB, proteasome
+ beta-type subunit 2, highly similar to eg. TR:Q53083
+ (EMBL:U264 22) proteasome beta-type subunit 2 from
+ Rhodococcus (292 aa), FASTA scores; opt: 1103, E(): 0,
+ 64.5% identity in 262 aa overlap. Protein product from
+ Mb2134c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2134c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="proteasome beta subunit prcb; assembles with
+ alpha subunit prca."
+ /protein_id="SIU00741.1"
+ /db_xref="GOA:Q7TZ13"
+ /db_xref="InterPro:IPR001353"
+ /db_xref="InterPro:IPR022483"
+ /db_xref="InterPro:IPR023333"
+ /db_xref="InterPro:IPR029055"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZ13"
+ /translation="MTWPLPDRLSINSLSGTPAVDLSSFTDFLRRQAPELLPASISGG
+ APLAGGDAQLPHGTTIVALKYPGGVVMAGDRRSTQGNMISGRDVRKVYITDDYTATGI
+ AGTAAVAVEFARLYAVELEHYEKLEGVPLTFAGKINRLAIMVRGNLAAAMQGLLALPL
+ LAGYDIHASDPQSAGRIVSFDAAGGWNIEEEGYQAVGSGSLFAKSSMKKLYSQVTDGD
+ SGLRVAVEALYDAADDDSATGGPDLVRGIFPTAVIIDADGAVDVPESRIAELARAIIE
+ SRSGADTFGSDGGEK"
+ gene complement(2355491..2355685)
+ /gene="pup"
+ /locus_tag="BQ2027_MB2135C"
+ CDS complement(2355491..2355685)
+ /gene="pup"
+ /locus_tag="BQ2027_MB2135C"
+ /note="Mb2135c, -, len: 64 aa. Equivalent to Rv2111c, len:
+ 64 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 64 aa overlap). Conserved hypothetical
+ protein. Highly similar to a hypothetical protein
+ TR:Q53078 (EMBL:U26422) (64 aa) upstream of Rhodococcus
+ proteasome beta-type subunit 1, FASTA scores; opt: 349,
+ E(): 7.3e-25, 84.4% identity in 64 aa overlap Protein
+ product from Mb2135c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2135c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="prokaryotic ubiquitin-like protein pup"
+ /protein_id="SIU00742.1"
+ /db_xref="GOA:Q7TZ12"
+ /db_xref="InterPro:IPR008515"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TZ12"
+ /translation="MAQEQTKRGGGGGDDDDIAGSTAAGQERREKLTEETDDLLDEID
+ DVLEENAEDFVRAYVQKGGQ"
+ gene complement(2355798..2357405)
+ /gene="dop"
+ /locus_tag="BQ2027_MB2136C"
+ CDS complement(2355798..2357405)
+ /gene="dop"
+ /locus_tag="BQ2027_MB2136C"
+ /note="Mb2136c, -, len: 535 aa. Similar to Rv2112c, len:
+ 554 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 532 aa overlap). Conserved
+ hypothetical protein. Highly similar to a hypothetical
+ protein TR:Q53081 (EMBL:U26422) (499 aa) upstream of
+ Rhodococcus proteasome beta-type subunit 1, FASTA scores
+ opt: 2832 E(): 0, 85.3% identity in 502 aa overlap. Also
+ some similarity to Mycobacterium tuberculosis hypothetical
+ protein Rv2097c (MTCY49.37c, 38.2% identity in 419 aa
+ overlap). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a 57 bp in-frame deletion at the NH2 part, leads to
+ a shorter product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (535 aa versus 554 aa). Protein
+ product from Mb2136c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2136c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="deamidase of pup dop"
+ /protein_id="SIU00743.1"
+ /db_xref="GOA:A0A1R3Y085"
+ /db_xref="InterPro:IPR004347"
+ /db_xref="InterPro:IPR022366"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y085"
+ /translation="MFWVGGRCLMPASSAARCAARIVGGPRLYGMQRIIGTEVEYGIS
+ SPSDPTANPILTSTQAVLAYAAAAGIQRAKRTRWDYEVESPLRDARGFDLSRSAGPPP
+ VVDADEVGAANMILTNGARLYVDHAHPEYSAPECTDPLDAVIWDKAGERVMEAAARHV
+ ASVPGAAKLQLYKNNVDGKGASYGSHENYLMSRQTPFSAIITGLTPFLVSRQVVTGSG
+ RVGIGPSGDEPGFQLSQRSDYIEVEVGLETTLKRGIINTRDEPHADADRYRRLHVIIG
+ DANLAETSTYLKLGTTALVLDLIEEGPAHAIDLTDLALARPVHAVHAISRDPSLRATV
+ ALADGRELTGLALQRIYLDRVAKLVDSRDPDPRAADIVETWAHVLDQLERDPMDCAEL
+ LDWPAKLRLLDGFRQRENLSWSAPRLHLVDLQYSDVRLDKGLYNRLVARGSMKRLVTE
+ HQVLSAVENPPTDTRAYFRGECLRRFGADIAAASWDSVIFDLGGDSLVRIPTLEPLRG
+ SKAHVGALLDSVDSAVELVEQLTAEPR"
+ gene 2357466..2358659
+ /locus_tag="BQ2027_MB2137"
+ CDS 2357466..2358659
+ /locus_tag="BQ2027_MB2137"
+ /note="Mb2137, -, len: 397 aa. Equivalent to Rv2113, len:
+ 397 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 397 aa overlap). Probable integral
+ membrane protein. Protein product from Mb2137 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2137 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable integral membrane protein"
+ /protein_id="SIU00744.1"
+ /db_xref="GOA:A0A1R3Y2C2"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2C2"
+ /translation="MSLSVRRPPAARAAAIVEAESWFLKRGLPSVLTMRGRCRRLWPR
+ SAPMLAAWAVVEGCLMAVFFVTDGGEVFISATPTTAQWVILALLAVALPLASLVGWLV
+ SQISSGRGQAAVATMAVAFAAASDVIESGPIQLLRTAVVVGLVLLQTGCGVGSVLGWA
+ VRMTLEHLATVGTLAVRALPIVLLTALVFFNTYVWLMAANINGERLPLAMVFLLAIAG
+ AFVVSKTVERVRPLLRSTTVMPQGSQSLAGTPFATMGDPSPGFPLTRAERLNVVFLLA
+ ALQLVEILVVASVGAAIYLVLGMIILTPPLLREWTHYDSMTTTVLGMTFPAPDSLIRM
+ CLFLGALTFMYISARAVDDAEYRAMFLDPLIDDLHTALLARNRYRNNVVTAPCAGVDA
+ GHVDD"
+ gene 2358670..2359293
+ /locus_tag="BQ2027_MB2138"
+ CDS 2358670..2359293
+ /locus_tag="BQ2027_MB2138"
+ /note="Mb2138, -, len: 207 aa. Equivalent to Rv2114, len:
+ 207 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 207 aa overlap). Unknown Protein
+ product from Mb2138 detected using shotgun mass
+ spectrometry. Mb2138 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00745.1"
+ /db_xref="InterPro:IPR016792"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y103"
+ /translation="MSAPERVTGLSGQRYGEVLLVTPGEAGPQATVYNSFPLNDCPAE
+ LWSALDPQALATEHKAATALLNGPRYWLMNAIEKAPQGPPVTKTFGGIEMLQQATVLL
+ SSMNPAPYTVSQVSRNTVFVFNAGEEVYELQDPKGQRWVMQTWSQVVDPNLSRADLPK
+ LGERLNLPAGWSYHTRVLTSELRVDTTNREARVLQDDLTNSYSLVTA"
+ gene complement(2359297..2361126)
+ /gene="mpa"
+ /locus_tag="BQ2027_MB2139C"
+ CDS complement(2359297..2361126)
+ /gene="mpa"
+ /locus_tag="BQ2027_MB2139C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2139c, -, len: 609 aa. Equivalent to Rv2115c,
+ len: 609 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 609 aa overlap). Probable ATPase (EC
+ 3.6.1.-), similar to e.g. YB56_METJA Q58556 cell division
+ cycle protein 48 homolog (903 aa), FASTA scores; opt: 423,
+ E(): 8.1e-32, 45.8% identity in 249 aa overlap. Contains
+ PS00674 AAA-protein family signature and PS00017
+ ATP/GTP-binding site motif A (P-loop). Also some
+ similarity to other Mycobacterium tuberculosis ATPases eg.
+ Rv0435c and Rv3610c. Equivalent to Mycobacterium leprae
+ U00 017|U00017_18 (609 aa), FASTA scores; opt: 3670 E():
+ 0; 92.9% identity in 609 aa overlap. Protein product from
+ Mb2139c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2139c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="mycobacterial proteasome atpase mpa"
+ /protein_id="SIU00746.1"
+ /db_xref="GOA:P63346"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR003959"
+ /db_xref="InterPro:IPR003960"
+ /db_xref="InterPro:IPR022482"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR032501"
+ /db_xref="InterPro:IPR041626"
+ /db_xref="UniProtKB/Swiss-Prot:P63346"
+ /translation="MGESERSEAFGIPRDSPLSSGDAAELEQLRREAAVLREQLENAV
+ GSHAPTRSARDIHQLEARIDSLAARNSKLMETLKEARQQLLALREEVDRLGQPPSGYG
+ VLLATHDDDTVDVFTSGRKMRLTCSPNIDAASLKKGQTVRLNEALTVVEAGTFEAVGE
+ ISTLREILADGHRALVVGHADEERVVWLADPLIAEDLPDGLPEALNDDTRPRKLRPGD
+ SLLVDTKAGYAFERIPKAEVEDLVLEEVPDVSYADIGGLSRQIEQIRDAVELPFLHKE
+ LYREYSLRPPKGVLLYGPPGCGKTLIAKAVANSLAKKMAEVRGDDAHEAKSYFLNIKG
+ PELLNKFVGETERHIRLIFQRAREKASEGTPVIVFFDEMDSIFRTRGTGVSSDVETTV
+ VPQLLSEIDGVEGLENVIVIGASNREDMIDPAILRPGRLDVKIKIERPDAEAAQDIYS
+ KYLTEFLPVHADDLAEFDGDRSACIKAMIEKVVDRMYAEIDDNRFLEVTYANGDKEVM
+ YFKDFNSGAMIQNVVDRAKKNAIKSVLETGQPGLRIQHLLDSIVDEFAENEDLPNTTN
+ PDDWARISGKKGERIVYIRTLVTGKSSSASRAIDTESNLGQYL"
+ gene 2361407..2361976
+ /gene="lppK"
+ /locus_tag="BQ2027_MB2140"
+ CDS 2361407..2361976
+ /gene="lppK"
+ /locus_tag="BQ2027_MB2140"
+ /note="Mb2140, lppK, len: 189 aa. Equivalent to Rv2116,
+ len: 189 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 189 aa overlap). Probable lppK,
+ conserved lipoprotein, similar to Mycobacterium leprae
+ B2126_F3_115 TR:Q49803 (194 aa), FASTA scores; opt: 624,
+ E(): 3.1e-31, 51.6% identity in 190 aa overlap. Contains
+ N-terminal signal sequence and PS00013 Prokaryotic
+ membrane lipoprotein lipid attachment site. Some
+ similarity to Rv2376c. Mb2140 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved lipoprotein lppk"
+ /protein_id="SIU00747.1"
+ /db_xref="GOA:P65301"
+ /db_xref="UniProtKB/Swiss-Prot:P65301"
+ /translation="MRRNIRVTLGAATIVAALGLSGCSHPEFKRSSPPAPSLPPVTSS
+ PLEAAPITPLPAPEALIDVLSRLADPAVPGTNKVQLIEGATPENAAALDRFTTALRDG
+ SYLPMTFAANDIAWSDNKPSDVMATVVVTTAHPDNREFTFPMEFVSFKGGWQLSRQTA
+ EMLLAMGNSPDSTPSATSPAPAPSPTPPG"
+ gene 2361984..2362277
+ /locus_tag="BQ2027_MB2141"
+ CDS 2361984..2362277
+ /locus_tag="BQ2027_MB2141"
+ /note="Mb2141, -, len: 97 aa. Equivalent to Rv2117, len:
+ 97 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 97 aa overlap). Conserved hypothetical
+ protein. Similar to hypothetical proteins from
+ Mycobacterium leprae TR:Q49798 U2126J (97 aa), FASTA
+ scores; opt: 554, E(): 0, 85.6% identity in 97 aa overlap,
+ and Bacillus subtilis YLXP_BACSU P32730 hypothetical 10.7
+ kd protein (92 aa), FASTA scores; opt: 173, E(): 1.4e-11,
+ 34.1% identity in 82 aa overlap Protein product from
+ Mb2141 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="YlxP-like protein"
+ /protein_id="SIU00748.1"
+ /db_xref="InterPro:IPR007546"
+ /db_xref="InterPro:IPR036746"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y074"
+ /translation="MWIGWLEFDVLLGDVRSLKQKRSVTRPLVAELQRKFSVSAAETG
+ SHDLYRRAGIGVAVVSGDRSHAVDVLDNAERLVAAHPEFELLSVRRGLHRTDD"
+ gene complement(2362306..2363148)
+ /locus_tag="BQ2027_MB2142C"
+ CDS complement(2362306..2363148)
+ /locus_tag="BQ2027_MB2142C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2142c, -, len: 280 aa. Equivalent to Rv2118c,
+ len: 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 280 aa overlap). Possible
+ S-adenosyl-l-methionine-dependent RNA methyltransferase
+ (EC 2.1.1.-) (see citation below); corresponds to
+ Mycobacterium leprae B2126_C1_165, similar to hypothetical
+ proteins from several organisms e.g. Y134_METJA Q57598
+ hypothetical protein mj0134 (282 aa), FASTA scores; opt:
+ 256, E(): 1e-13, FASTA scores; 30.2% identity in 285 aa
+ overlap. The larger catalytic C-terminal domain binds the
+ cofactor S-adenosyl-l-methionine (AdoMet) and is involved
+ in the transfer of methyl group from AdoMet to the
+ substrate. Protein product from Mb2142c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2142c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="rna methyltransferase"
+ /protein_id="SIU00749.1"
+ /db_xref="GOA:A0A1R3Y0B7"
+ /db_xref="InterPro:IPR014816"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0B7"
+ /translation="MSATGPFSIGERVQLTDAKGRRYTMSLTPGAEFHTHRGSIAHDA
+ VIGLEQGSVVKSSNGALFLVLRPLLVDYVMSMPRGPQVIYPKDAAQIVHEGDIFPGAR
+ VLEAGAGSGALTLSLLRAVGPAGQVISYEQRADHAEHARRNVSGCYGQPPDNWRLVVS
+ DLADSELPDGSVDRAVLDMLAPWEVLDAVSRLLVAGGVLMVYVATVTQLSRIVEALRA
+ KQCWTEPRAWETLQRGWNVVGLAVRPQHSMRGHTAFLVATRRLAPGAVAPAPLGRKRE
+ GRDG"
+ gene 2363222..2364058
+ /locus_tag="BQ2027_MB2143"
+ CDS 2363222..2364058
+ /locus_tag="BQ2027_MB2143"
+ /note="Mb2143, -, len: 278 aa. Equivalent to Rv2119, len:
+ 278 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 278 aa overlap). Conserved
+ hypothetical protein. Similar to Mycobacterium leprae
+ hypothetical protein TR:Q49799 U2126V (212 aa), FASTA
+ scores; opt: 1153, E(): 0, 83.6% identity in 195 aa
+ overlap. Orthologs present in Rhodococcus erythropolis
+ (gb|AAC68687.1|(AF088800) and Streptomyces
+ emb|CAB59506.1|(AL132648),Mb2143 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="RecB family exonuclease"
+ /protein_id="SIU00750.1"
+ /db_xref="InterPro:IPR011335"
+ /db_xref="InterPro:IPR011604"
+ /db_xref="InterPro:IPR038726"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0B1"
+ /translation="MADQPDPPTPRPALSPSRATDFKQCPLLYRFRAIDRLPEATSAA
+ QLRGSVVHAALEQLYGLPAGLRSPDTARSLVQRAWDQMVAAEPELAGELDPGQPTQLL
+ EDARALVSGYYRLEDPTRFDPQCCEQRVEVELADGTLLRGYIDRIDVAATGELRVVDY
+ KTGKAPPAARALAEFKAMFQMKFYAVALFRSRGVPPTRLRLIYLADGQLLDYSPDRDE
+ LLRFEKTLMAIWRAIQSAGETGDFRPNPSRLCDWCPHQQRCPAFGGTPPPYPGWPTEP
+ AA"
+ gene complement(2364081..2364563)
+ /locus_tag="BQ2027_MB2144C"
+ CDS complement(2364081..2364563)
+ /locus_tag="BQ2027_MB2144C"
+ /note="Mb2144c, -, len: 160 aa. Equivalent to Rv2120c,
+ len: 160 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 160 aa overlap). Probable conserved
+ integral membrane protein, similar to hypothetical protein
+ from Mesorhizobium loti (153 aa). Smith-Waterman scores:
+ NP_104030.1 hypothetical protein [Mesorhizobium loti]
+ >gi|14023209|dbj|BAB49816.1| (AP003000) Identities =
+ 50/135 (37%). Mb2144c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIU00751.1"
+ /db_xref="GOA:A0A1R3Y094"
+ /db_xref="InterPro:IPR008816"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y094"
+ /translation="MTHVLVLLLALLIGVVAGLRSLTAPAVVSWAAFLGWINLHGTWA
+ SWMGNFVTVVIVSVLAVAELVNDKRPKTPPRTVTPVFAVRIILGAFAGAVIGTAWGYR
+ WGGLGAGVIGAVLGTMGGYQARTRLVAARGGHDLPIALLEDSVAVLGGFAIVAAAAAL
+ "
+ gene complement(2364642..2365496)
+ /gene="hisG"
+ /locus_tag="BQ2027_MB2145C"
+ CDS complement(2364642..2365496)
+ /gene="hisG"
+ /locus_tag="BQ2027_MB2145C"
+ /note="Mb2145c, hisG, len: 284 aa. Equivalent to Rv2121c,
+ len: 284 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 284 aa overlap). Probable hisG, ATP
+ phosphoribosyltransferase (EC 2.4.2.17) (see citation
+ below), similar to others e.g. HIS1_ECOLI|P10366 ATP
+ phosphoribosyltransferase from Escherichia coli (299 aa),
+ FASTA scores: opt: 351, E(): 4.5e-20, (31.8% identity in
+ 289 aa overlap); etc. Protein product from Mb2145c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="atp phosphoribosyltransferase hisg"
+ /protein_id="SIU00752.1"
+ /db_xref="GOA:P60760"
+ /db_xref="InterPro:IPR001348"
+ /db_xref="InterPro:IPR011322"
+ /db_xref="InterPro:IPR013115"
+ /db_xref="InterPro:IPR013820"
+ /db_xref="InterPro:IPR015867"
+ /db_xref="InterPro:IPR018198"
+ /db_xref="InterPro:IPR020621"
+ /db_xref="UniProtKB/Swiss-Prot:P60760"
+ /translation="MLRVAVPNKGALSEPATEILAEAGYRRRTDSKDLTVIDPVNNVE
+ FFFLRPKDIAIYVGSGELDFGITGRDLVCDSGAQVRERLALGFGSSSFRYAAPAGRNW
+ TTADLAGMRIATAYPNLVRKDLATKGIEATVIRLDGAVEISVQLGVADAIADVVGSGR
+ TLSQHDLVAFGEPLCDSEAVLIERAGTDGQDQTEARDQLVARVQGVVFGQQYLMLDYD
+ CPRSALKKATAITPGLESPTIAPLADPDWVAIRALVPRRDVNGIMDELAAIGAKAILA
+ SDIRFCRF"
+ gene complement(2365499..2365780)
+ /gene="hisE"
+ /locus_tag="BQ2027_MB2146C"
+ CDS complement(2365499..2365780)
+ /gene="hisE"
+ /locus_tag="BQ2027_MB2146C"
+ /standard_name="irg1"
+ /note="Mb2146c, hisE, len: 93 aa. Equivalent to Rv2122c,
+ len: 93 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 93 aa overlap). Probable hisE
+ (alternate gene name: irg1), phosphoribosyl-AMP
+ cyclohydrolase (EC 3.6.1.31) (see citation below), similar
+ to N-terminus of e.g. HIS2_SYNY3 P74755 phosphoribosyl-AMP
+ cyclohydrolase (230 aa), FASTA scores; opt: 150, E():
+ 4e-08, (37.9% identity in 87 aa overlap); etc. Note that
+ previously misnamed hisI. Protein product from Mb2146c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="phosphoribosyl-amp pyrophosphatase hise"
+ /protein_id="SIU00753.1"
+ /db_xref="GOA:P0A5B2"
+ /db_xref="InterPro:IPR008179"
+ /db_xref="InterPro:IPR021130"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5B2"
+ /translation="MQQSLAVKTFEDLFAELGDRARTRPADSTTVAALDGGVHALGKK
+ LLEEAGEVWLAAEHESNDALAEEISQLLYWTQVLMISRGLSLDDVYRKL"
+ gene 2365907..2367301
+ /gene="PPE37"
+ /locus_tag="BQ2027_MB2147"
+ CDS 2365907..2367301
+ /gene="PPE37"
+ /locus_tag="BQ2027_MB2147"
+ /standard_name="irg2"
+ /note="Mb2147, PPE37, len: 464 aa. Equivalent to Rv2123,
+ len: 473 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (97.9% identity in 473 aa overlap). PPE37 (alternate gene
+ name: irg2), member of the Mycobacterium tuberculosis PPE
+ family of proteins but the C-terminus is not repetitive.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 27 bp in-frame deletion leads to a slightly shorter
+ product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (464 aa versus 473 aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe37"
+ /protein_id="SIU00754.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2D4"
+ /translation="MTFPMWFAVPPEVPSAWLSTGMGPGPLLAAQYTEIATELASVLA
+ AVQASSWQGPSADRFVVAHQPFRYWLTHAATVATAAAAAHETAAAGYTSALGGMPTLA
+ ELAANHAMHGALVTTNFFGVNTIPIALNEADYLRMWIQAATVMSHYQAVAHESVAATP
+ STPPAPQIVTSAASSAASISFPDPTKLILQLLKDFLELLRYLAVELLPGPLGDLIAQV
+ LDWFISFVSGPVFTFLAYLVLDPLIYFGPFAPLTSPVLLPAGLTGLAGLGAVSGPAGP
+ MVERVHSDGPSRQSWPAATGVTLVGTNPAALVTTPAPAPTTSAAPTAPSTPGSSAAQG
+ LYAVGGPDGEGFNPIAKTTALAGVTTDAAAPAAKLPGDQAQSSASKATRLRRRLRQHR
+ FEFLADDGRLTMPNTPEMADVAAGNRGLDALGFAGTIPKSAPGSATGLTHLGGGFADV
+ LSQPMLPHTWDGSD"
+ gene complement(2367298..2370876)
+ /gene="metH"
+ /locus_tag="BQ2027_MB2148C"
+ CDS complement(2367298..2370876)
+ /gene="metH"
+ /locus_tag="BQ2027_MB2148C"
+ /note="Mb2148c, metH, len: 1192 aa. Equivalent to Rv2124c,
+ len: 1192 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 1192 aa overlap). Probable metH,
+ methionine synthase (EC 2.1.1.13), similar to many e.g.
+ METH_ECOLI|P13009 5-methyltetrahydrofolate--homocystein
+ methyltransferase from Escherichia coli (1226 aa), FASTA
+ scores: opt: 1446, E(): 0, (32.1% identity in 1223 aa
+ overlap); etc. Contains PS00178 Aminoacyl-transfer RNA
+ synthetases class-I signature. BELONGS TO THE VITAMIN-B12
+ DEPENDENT METHIONINE SYNTHASE FAMILY. Protein product from
+ Mb2148c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2148c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="5-methyltetrahydrofolate--homocystein
+ methyltransferase meth (methionine synthase, vitamin-b12
+ dependent isozyme) (ms)"
+ /protein_id="SIU00755.1"
+ /db_xref="GOA:A0A1R3Y112"
+ /db_xref="InterPro:IPR000489"
+ /db_xref="InterPro:IPR003726"
+ /db_xref="InterPro:IPR003759"
+ /db_xref="InterPro:IPR004223"
+ /db_xref="InterPro:IPR006158"
+ /db_xref="InterPro:IPR011005"
+ /db_xref="InterPro:IPR011822"
+ /db_xref="InterPro:IPR033706"
+ /db_xref="InterPro:IPR036589"
+ /db_xref="InterPro:IPR036594"
+ /db_xref="InterPro:IPR036724"
+ /db_xref="InterPro:IPR037010"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y112"
+ /translation="MTAADKHLYDTDLLDVLSQRVMVGDGAMGTQLQAADLTLDDFRG
+ LEGCNEILNETRPDVLETIHRNYFEAGADAVETNTFGCNLSNLGDYDIADRIRDLSQK
+ GTAIARRVADELGSPDRKRYVLGSMGPGTKLPTLGHTEYAVIRDAYTEAALGMLDGGA
+ DAILVETCQDLLQLKAAVLGSRRAMTRAGRHIPVFAHVTVETTGTMLLGSEIGAALTA
+ VEPLGVDMIGLNCATGPAEMSEHLRHLSRHARIPVSVMPNAGLPVLGAKGAEYPLLPD
+ ELAEALAGFIAEFGLSLVGGCCGTTPAHIREVAAAVANIKRPERQVSYEPSVSSLYTA
+ IPFAQDASVLVIGERTNANGSKGFREAMIAEDYQKCLDIAKDQTRDGAHLLDLCVDYV
+ GRDGVADMKALASRLATSSTLPIMLDSTETAVLQAGLEHLGGRCAINSVNYEDGDGPE
+ SRFAKTMALVAEHGAAVVALTIDEEGQARTAQKKVEIAERLINDITGNWGVDESSILI
+ DTLTFTIATGQEESRRDGIETIEAIRELKKRHPDVQTTLGLSNISFGLNPAARQVLNS
+ VFLHECQEAGLDSAIVHASKILPMNRIPEEQRNVALDLVYDRRREDYDPLQELMRLFE
+ GVSAASSKEDRLAELAGLPLFERLAQRIVDGERNGLDADLDEAMTQKPPLQIINEHLL
+ AGMKTVGELFGSGQMQLPFVLQSAEVMKAAVAYLEPHMERSDDDSGKGRIVLATVKGD
+ VHDIGKNLVDIVLSNNGYEVVNIGIKQPIATILEVAEDKSADVVGMSGLLVKSTVVMK
+ ENLEEMNTRGVAEKFPVLLGGAALTRSYVENDLAEIYQGEVHYARDAFEGLKLMDTIM
+ SAKRGEAPDENSPEAIKAREKEAERKARHQRSKRIAAQRKAAEEPVEVPERSDVAADI
+ EVPAPPFWGSRIVKGLAVADYTGLLDERALFLGQWGLRGQRGGEGPSYEDLVETEGRP
+ RLRYWLDRLSTDGILAHAAVVYGYFPAVSEGNDIVVLTEPKPDAPVRYRFHFPRQQRG
+ RFLCIADFIRSRELAAERGEVDVLPFQLVTMGQPIADFANELFASNAYRDYLEVHGIG
+ VQLTEALAEYWHRRIREELKFSGDRAMAAEDPEAKEDYFKLGYRGARFAFGYGACPDL
+ EDRAKMMALLEPERIGVTLSEELQLHPEQSTDAFVLHHPEAKYFNV"
+ gene 2371102..2371980
+ /locus_tag="BQ2027_MB2149"
+ CDS 2371102..2371980
+ /locus_tag="BQ2027_MB2149"
+ /note="Mb2149, -, len: 292 aa. Equivalent to Rv2125, len:
+ 292 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 292 aa overlap). Conserved hypothetical
+ protein. Corresponds to Mycobacterium leprae hypothetical
+ protein e.g. TR:Q49797 B2126_F1_36 (317 aa), FASTA scores;
+ opt: 1648, E(): 0, 84.1% identity in 290 aa overlap. Very
+ similar to Mycobacterium tuberculosis hypothetical protein
+ Rv2714,Mb2149 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00756.1"
+ /db_xref="InterPro:IPR008492"
+ /db_xref="InterPro:IPR019151"
+ /db_xref="InterPro:IPR038389"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0D5"
+ /translation="MTPSEGNAPLPELHNTVVVAAFEGWNDAGDAASDAVAHLAASWQ
+ ALPIVEIDDEAYYDYQVNRPVIRQVDGVTRELQWPAMRISHCRPPGSDRDVVLMCGVE
+ PNMRWRTFCDELLAVIDKLNVDTVVILGALLADTPHTRPVPVSGAAYSAASARQFGLQ
+ ETRYEGPTGIAGVFQSACVGAGIPAVTFWAAVPHYVSHPPNPKATIALLRRVEDVLDV
+ EVPLADLPAQAEAWEREITETIAEDHELAEYVQTLEQHGDAAVDMNEALGNIDGDALA
+ AEFERYLRRRRPGFGR"
+ gene complement(2372011..2373078)
+ /gene="PE_PGRS37"
+ /locus_tag="BQ2027_MB2150C"
+ CDS complement(2372011..2373078)
+ /gene="PE_PGRS37"
+ /locus_tag="BQ2027_MB2150C"
+ /note="Mb2150c, -, len: 256 aa. Equivalent to Rv2126c,
+ len: 256 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100% identity in 256 aa overlap). Possible PE_PGRS
+ pseudogene fragment, similar to the Gly-rich C-terminus of
+ many members of the Mycobacterium tuberculosis PGRS family
+ e.g. MTCY441.04c (778 aa), FASTA scores; opt: 935, E():
+ 4.4e-18, 56.1% identity in 271 aa overlap,Mb2150c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs37"
+ /protein_id="SIU00757.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0P0"
+ /translation="MAGIGSAISAANALVAGPTTALAADRRRRGVDGYRGAVRRECAG
+ IPTDQRAGGRVSRAVCRGPNLGWRVVRGRRDRQRHVGTRSAQCRQCAHPGIVGRPLIG
+ DGANGGPGQPGGPGGLLYGNGGHGGAGAAGQDRGAGNSAGLIGNGGAGGAGGNGGIGG
+ AGAPGGLGGDGGKGGFADEFTGGFAQGGRGGFGGNGNTGASGGMGGAGGAGGAGGAGG
+ LLIGDGGAGGAGGIGGAGGVGGGGGAGGTGGGGVASAFGGGNAFGGRGGDGGDGGDGG
+ TGGAGGARGAGGAGGAGGWLSGHSGAHGAMGSGGEGGAGGGGGARGEAGAGGGTSTGT
+ NPGKAGAPGTQGDSGDPGPPG"
+ gene 2373425..2374894
+ /gene="ansP1"
+ /locus_tag="BQ2027_MB2151"
+ CDS 2373425..2374894
+ /gene="ansP1"
+ /locus_tag="BQ2027_MB2151"
+ /note="Mb2151, ansP1, len: 489 aa. Equivalent to Rv2127,
+ len: 489 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 489 aa overlap). Probable ansP1,
+ L-asparagine permease, integral membrane protein highly
+ similar to many eg. ANSP_ECOLI P77610 L-asparagine
+ permease (L-asparagine transport protein) (516 aa), FASTA
+ scores: opt: 1880, E(): 0, (60.3% identity in 463 aa
+ overlap); etc. Also highly similar to Mycobacterium
+ tuberculosis permeases Rv0346c|MTCY13E10.06c, (72.1%
+ identity in 473 aa overlap) and Rv1704c|MTCI125.26c|cycA.
+ Contains PS00218 Amino acid permeases signature. SEEMS TO
+ BELONG TO THE APC FAMILY. Protein product from Mb2151
+ detected using SWATH mass spectrometry. Mb2151 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="l-asparagine permease ansp1"
+ /protein_id="SIU00758.1"
+ /db_xref="GOA:Q7VEQ4"
+ /db_xref="InterPro:IPR002293"
+ /db_xref="InterPro:IPR004840"
+ /db_xref="InterPro:IPR004841"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEQ4"
+ /translation="MSAASQRVDAFGEEAGYHKGLKPRQLQMIGIGGAIGTGLFLGAS
+ GRLAKAGPGLFLVYGVCGVFVFLILRALGELVLHRPSSGSFVSYAREFFGEKAAYAVG
+ WMYFLHWAMTSIVDTTAIATYLQRWTIFTVVPQWILALIALTVVLSMNLISVEWFGEL
+ EFWAALIKVLALMAFLVVGTVFLAGRYPVDGHSTGLSLWNNHGGLFPTSWLPLLIVTS
+ GVVFAYSAVELVGTAAGETAEPEKIMPRAINSVVARIAIFYVGSVALLALLLPYTAYK
+ AGESPFVTFFSKIGFHGAGDLMNIVVLTAALSSLNAGLYSTGRVMHSIAMSGSAPRFT
+ ARMSKSGVPYGGIVLTAVITLFGVALNAFKPGEAFEIVLNMSALGIIAGWATIVLCQL
+ RLHKLANAGIMQRPRFRMPFSPYSGYLTLLFLLVVLVTMASDKPIGTWTVATLIIVIP
+ ALTAGWYLVRKRVMAVARERLGHTGPFPAVANPPVRSRD"
+ gene 2374894..2375097
+ /locus_tag="BQ2027_MB2152"
+ CDS 2374894..2375097
+ /locus_tag="BQ2027_MB2152"
+ /note="Mb2152, -, len: 67 aa. Equivalent to Rv2128, len:
+ 67 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 67 aa overlap). Probable conserved
+ transmembrane protein. Mb2152 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved transmembrane protein"
+ /protein_id="SIU00759.1"
+ /db_xref="GOA:A0A1R3Y0C7"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0C7"
+ /translation="MLRRGESIIRNRYASKPPLYGMAMVFLAMAVVAVTAYFRMGWWS
+ IIGYAAAAIIGVIGFALAFRDLS"
+ gene complement(2375117..2375998)
+ /locus_tag="BQ2027_MB2153C"
+ CDS complement(2375117..2375998)
+ /locus_tag="BQ2027_MB2153C"
+ /note="Mb2153c, -, len: 293 aa. Equivalent to Rv2129c,
+ len: 293 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 293 aa overlap). Probable
+ oxidoreductase (EC 1.-.-.-), similar to many e.g.
+ FABG_SYNY3|P73826 3-oxoacyl-[acyl-carrier protein]
+ reductase (240 aa), FASTA scores: opt: 241, E(): 5.1e-17,
+ (32.7% identity in 196 aa overlap); etc. Also similar to a
+ number of other Mycobacterium tuberculosis oxidoreductases
+ e.g. MTCY210.04 (34.1% identity in 217 aa overlap).
+ Protein product from Mb2153c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2153c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable oxidoreductase"
+ /protein_id="SIU00760.1"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0C0"
+ /translation="MTSLQGKVVFITGAARGIGAEVARRLHNKGAKLVLTDLSKSELA
+ VMGAELGGDDRLLTVVADVRDLPAMQAAAETAVERFGGIDVVVANAGIASYGSVLKVD
+ PQAFRRVLDVNLLGNFHTVRATLPALIDRRGYVLIVSSLAAFAAPPGMAPYNMSKAGN
+ EHFANALRLEVAHLGVSVGSAHMSWIDTALVRDTKADLPAFAELLARLPWPLNKTTSV
+ NKCAAAFVNGIEGRKDRVYCPGWVALFRWLKPLLSTRVGQRPIRNTVAKLMPQMDAEV
+ AALGRFASAYTESLENS"
+ gene complement(2376024..2377268)
+ /gene="mshc"
+ /locus_tag="BQ2027_MB2154C"
+ CDS complement(2376024..2377268)
+ /gene="mshc"
+ /locus_tag="BQ2027_MB2154C"
+ /note="Mb2154c, cysS2, len: 414 aa. Equivalent to Rv2130c,
+ len: 414 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 414 aa overlap). Probable cysS2,
+ cysteinyl-tRNA synthetase, similar to many e.g.
+ SYC_ECOLI|P21888 cysteinyl-tRNA synthetase from
+ Escherichia coli (461 aa), FASTA scores: opt: 535, E(): 0,
+ (37.0% identity in 370 aa overlap); etc. Also similar to
+ Mycobacterium tuberculosis cysS|Rv3580c|MTCY06G11.27c,
+ (35.8% identity in 372 aa overlap). Protein product from
+ Mb2154c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2154c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="cysteine:1d-myo-inosityl
+ 2-amino-2-deoxy--d-glucopyranoside ligase mshc"
+ /protein_id="SIU00761.1"
+ /db_xref="GOA:P67018"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="InterPro:IPR017812"
+ /db_xref="InterPro:IPR024909"
+ /db_xref="InterPro:IPR032678"
+ /db_xref="UniProtKB/Swiss-Prot:P67018"
+ /translation="MQSWYCPPVPVLPGRGPQLRLYDSADRQVRPVAPGSKATMYVCG
+ ITPYDATHLGHAATYVTFDLIHRLWLDLGHELHYVQNITDIDDPLFERADRDGVDWRD
+ LAQAEVALFCEDMAALRVLPPQDYVGATEAIAEMVELIEKMLACGAAYVIDREMGEYQ
+ DIYFRADATLQFGYESGYDRDTMLRLCEERGGDPRRPGKSDELDALLWRAARPGEPSW
+ PSPFGPGRPGWHVECAAIALSRIGSGLDIQGGGSDLIFPHHEFTAAHAECVSGERRFA
+ RHYVHAGMIGWDGHKMSKSRGNLVLVSALRAQDVEPSAVRLGLLAGHYRADRFWSQQV
+ LDEATARLHRWRTATALPAGPAAVDVVARVRRYLADDLDTPKAIAALDGWVTDAVEYG
+ GHDAGAPKLVATAIDALLGVDL"
+ gene complement(2377326..2378129)
+ /gene="cysQ"
+ /locus_tag="BQ2027_MB2155C"
+ CDS complement(2377326..2378129)
+ /gene="cysQ"
+ /locus_tag="BQ2027_MB2155C"
+ /note="Mb2155c, cysQ, len: 267 aa. Equivalent to Rv2131c,
+ len: 267 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 267 aa overlap). cysQ, equivalent to
+ Mycobacterium leprae CYSQ_MYCLE P46726 cysQ protein
+ homolog (289 aa). Contains inositol monophosphatase family
+ signature 1 (PS00629), significance uncertain. FASTA best:
+ CYSQ_MYCLE P4672 6 cysq protein homolog (289 aa) opt:
+ 1374, E(): 0; (77.3% identity in 264 aa overlap) Protein
+ product from Mb2155c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2155c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="monophosphatase cysq"
+ /protein_id="SIU00762.1"
+ /db_xref="GOA:P65164"
+ /db_xref="InterPro:IPR000760"
+ /db_xref="InterPro:IPR020583"
+ /db_xref="UniProtKB/Swiss-Prot:P65164"
+ /translation="MVSPAAPDLTDDLTDAELAADLAADAGKLLLQVRAEIGFDQPWT
+ LGEAGDRQANSLLLRRLQAERPGDAVLSEEAHDDLARLKSDRVWIIDPLDGTREFSTP
+ GRDDWAVHIALWRRSSNGQPEITDAAVALPARGNVVYRTDTVTSGAAPAGVPGTLRIA
+ VSATRPPAVLHRIRQTLAIQPVSIGSAGAKAMAVIDGYVDAYLHAGGQWEWDSAAPAG
+ VMLAAGMHASRLDGSPLRYNQLDPYLPDLLMCRAEVAPILLGAIADAWR"
+ gene 2378220..2378450
+ /locus_tag="BQ2027_MB2156"
+ CDS 2378220..2378450
+ /locus_tag="BQ2027_MB2156"
+ /note="Mb2156, -, len: 76 aa. Equivalent to Rv2132, len:
+ 76 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 76 aa overlap). Conserved hypothetical
+ protein. Function unknown but belongs to Mycobacterium
+ tuberculosis protein family including Rv2871, Rv1241,
+ Rv3321c, Rv1113, Rv0657c, Rv1560, Rv2104c, etc. Similarity
+ to Mycobacterium tuberculosis protein Rv2871
+ (AL021924|MTV020_4, 84 aa). FASTA score: opt: 142, E():
+ 0.00036; 41.8% identity in 55 aa overlap Protein product
+ from Mb2156 detected using SWATH mass spectrometry. Mb2156
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Antitoxin to Toxin 1, PIN domain"
+ /protein_id="SIU00763.1"
+ /db_xref="GOA:A0A1R3Y0A2"
+ /db_xref="InterPro:IPR002145"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0A2"
+ /translation="MRTTVSLADDVAAAVQRLRKERSIGLSEAVNELIRAGLTKRQVA
+ NRFQQQTYDMGEGIDYSNIGDAIETLDGPASG"
+ gene complement(2378660..2379448)
+ /locus_tag="BQ2027_MB2157C"
+ CDS complement(2378660..2379448)
+ /locus_tag="BQ2027_MB2157C"
+ /note="Mb2157c, -, len: 262 aa. Equivalent to Rv2133c,
+ len: 262 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 262 aa overlap). Conserved
+ hypothetical protein. Function: unknown but equivalent to
+ hypothetical Mycobacterium leprae protein, Q49774. FASTA
+ best: Q49774 B2126_C1_150 (262 aa) opt: 1447, E(): 0;
+ (79.0% identity in 262 aa overlap),Mb2157c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Phosphatidylinositol 3- and 4-kinase"
+ /protein_id="SIU00764.1"
+ /db_xref="InterPro:IPR022292"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2F0"
+ /translation="MLADGELTVLGRIRSASNATFLCESTLGLRSLHCVYKPVSGERP
+ LWDFPDGTLAGRELSAYLVSTQLGWNLVPHTIIRDGPAGIGMLQLWVQQPGDAVDSDP
+ LPGPDLVDLFPAHRPRPGYLPVLRAYDYAGDEVVLMHADDIRLRRMAVFDVLINNADR
+ KGGHILCGIDGQVYGVDHGLCLHVENKLRTVLWGWAGKPIDDQILQAVAGLADALGGP
+ LAEALAGRIAAAEIGALRRRAQSLLDQPVMPGPNGHRPIPWPAF"
+ gene complement(2379459..2380046)
+ /locus_tag="BQ2027_MB2158C"
+ CDS complement(2379459..2380046)
+ /locus_tag="BQ2027_MB2158C"
+ /note="Mb2158c, -, len: 195 aa. Equivalent to Rv2134c,
+ len: 195 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 195 aa overlap). Conserved
+ hypothetical protein. Function: unknown but equivalent to
+ hypothetical Mycobacterium leprae protein, Q49789. FASTA
+ best: Q49789 B2126_C3_228, opt: 1192, E(): 0 (91.1%
+ identity in 192 aa overlap) Protein product from Mb2158c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2158c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00765.1"
+ /db_xref="InterPro:IPR021441"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y123"
+ /translation="MARAIHVFRTPDRFVAGTVGQPGNRTFYLQAVHDSRVVSVVLEK
+ QQVAVLAERIGALLFEVNRRFGTPVPPEPTEIDDLSPLIMPVDAEFRVGTMGLGWDSE
+ AQSVVVELLAVTDAEFDASVVLDDTEEGPDAVRVFLTPESARQFATRSYRVISAGRPP
+ CPLCDEPLDPEGHICARTNGYRRDVLLGSGDDPAG"
+ gene complement(2380110..2380820)
+ /locus_tag="BQ2027_MB2159C"
+ CDS complement(2380110..2380820)
+ /locus_tag="BQ2027_MB2159C"
+ /note="Mb2159c, -, len: 236 aa. Equivalent to Rv2135c,
+ len: 236 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 236 aa overlap). Conserved
+ hypothetical protein. Function: unknown but equivalent to
+ hypothetical Mycobacterium leprae protein, Q49773. FASTA
+ best: Q49773 B2126_C1_148 opt: 1183, E() : 0; (74.8%
+ identity in 250 aa overlap), also similar in C-terminus to
+ PMG2_ECOLI P36942 probable phosphoglycerate mutase 2 (215
+ aa), FASTA scores; opt: 212, E(): 2.5e-07 27.9% identity
+ in 190 aa overlap; and to Rv2228 and Rv2419c Protein
+ product from Mb2159c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2159c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Phosphoglycerate mutase family protein"
+ /protein_id="SIU00766.1"
+ /db_xref="InterPro:IPR013078"
+ /db_xref="InterPro:IPR022492"
+ /db_xref="InterPro:IPR029033"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0E8"
+ /translation="MTVILLRHARSTSNTAGVLAGRSGVDLDEKGREQATGLIDRIGD
+ LPIRAVASSPMLRCQRTVEPLAEALCLEPLIDDRFSEVDYGEWTGRKIGDLVDEPLWR
+ VVQAHPSAAVFPGGEGLAQVQTRAVAAVREHDRRLADQHGHDVLWLACTHGDVIKAVI
+ ADAFGMHLDSFQRITADPGSVSVVRYTQLRPFVLHVNHTGARLAPALQAAASAQGASP
+ EPNAAVPPGDAVIGGSTD"
+ gene complement(2380817..2381647)
+ /locus_tag="BQ2027_MB2160C"
+ CDS complement(2380817..2381647)
+ /locus_tag="BQ2027_MB2160C"
+ /note="Mb2160c, -, len: 276 aa. Equivalent to Rv2136c,
+ len: 276 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 276 aa overlap). Possible conserved
+ transmembrane protein, very similar to hypothetical
+ Mycobacterium leprae protein Q49783. FASTA best: Q49783
+ B2126_C2_190 opt: 1023, E(): 0; (82.4% identity in 187 aa
+ over lap) similar to BACA_ECOLI P31054 bacitracin
+ resistance protein (273 aa) opt: 477, E(): 7e-26, (35.6%
+ identity in 267 aa overlap),Mb2160c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible conserved transmembrane protein"
+ /protein_id="SIU00767.1"
+ /db_xref="GOA:Q7VEQ2"
+ /db_xref="InterPro:IPR003824"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEQ2"
+ /translation="MSWWQVIVLAAAQGLTEFLPVSSSGHLAIVSRIFFSGDAGASFT
+ AVSQLGTEAAVVIYFARDIVRILSAWVHGLVVKAHRNTDYRLGWYVIIGTIPICILGL
+ FFKDDIRSGVRNLWVVVTALVVFSGVIALAEYVGRQSRHIERLTWRDAVVVGIAQTLA
+ LVPGVSRSGSTISAGLFLGLDRELAARFGFLLAIPAVFASGLFSLPDAFHPVTEGMSA
+ TGPQLLVATLIAFVLGLTAVAWLLRFLVRHNMYWFVGYRVLVGTGMLVLLATGTVAAT
+ "
+ gene complement(2381711..2382124)
+ /locus_tag="BQ2027_MB2161C"
+ CDS complement(2381711..2382124)
+ /locus_tag="BQ2027_MB2161C"
+ /note="Mb2161c, -, len: 137 aa. Equivalent to Rv2137c,
+ len: 137 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 137 aa overlap). Conserved
+ hypothetical protein. C-terminus is very similar to
+ hypothetical Mycobacterium leprae protein B2126_C2_188
+ (150 aa). FASTA best: Q49782 B2126_C2_188. (150 aa) opt:
+ 469, E(): 9.6e-28; (77.2% identity in 101 aa overlap)
+ Protein product from Mb2161c detected using SWATH mass
+ spectrometry. Mb2161c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="secretion/lipid metabolism"
+ /protein_id="SIU00768.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y093"
+ /translation="MRNMKSTSHESESGKLLSISSCRPREMVLQRYSLGMTVTADRHL
+ ADKREEFAVEDISTGIFASGYGQVGDGRSFSFHIEHRSLVVEIYRPRVAGPVPQAEDV
+ VAMAVRGLVDIDLTDERSLAAAVRDSVASAAPVSR"
+ gene 2382139..2383215
+ /gene="lppL"
+ /locus_tag="BQ2027_MB2162"
+ CDS 2382139..2383215
+ /gene="lppL"
+ /locus_tag="BQ2027_MB2162"
+ /note="Mb2162, lppL, len: 358 aa. Equivalent to Rv2138,
+ len: 358 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 358 aa overlap). Probable lppL,
+ conserved lipoprotein, with appropriately placed
+ lipoprotein signature (PS00013) strongly similar to
+ hypothetical Mycobacterium leprae protein, Q49806. FASTA
+ best: Q49806 B2126_F3_142. (298 aa) opt: 1495, E(): 0;
+ (75.3% identity in 300 aa overlap). Protein product from
+ Mb2162 detected using SWATH mass spectrometry. Mb2162
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved lipoprotein LppL"
+ /protein_id="SIU00769.1"
+ /db_xref="InterPro:IPR015943"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0D3"
+ /translation="MLTGNKPAVQRRFIGLLMLSVLVAGCSSNPLANFAPGYPPTIEP
+ AQPAVSPPTSQDPAGAVRPLSGHPRAALFDNGTRQLVALRPGADSAAPASIMVFDDVH
+ VAPRVIFLPGPAAALTSDDHGTAFLAARGGYFVADLSSGHTARVNVADAAHTDFTAIA
+ RRSDGKLVLGSADGAVYTLAKNPAVDPASGAATVASRTKIFARVDALVTQGNTTVVLD
+ RGQTSVTTIGADGHAQQALRAGQGATTMAADPLGRVLIADTRGGQLLVYGVDPLILRQ
+ AYPVRQAPYGLAGSRELAWVSQTASNTVIGYDLTTGIPVEKVRYPTVQQPNSLAFDET
+ SDTLYVVSGSGAGVQVIEHAAGTR"
+ gene 2383529..2384602
+ /gene="pyrD"
+ /locus_tag="BQ2027_MB2163"
+ CDS 2383529..2384602
+ /gene="pyrD"
+ /locus_tag="BQ2027_MB2163"
+ /note="Mb2163, pyrD, len: 357 aa. Equivalent to Rv2139,
+ len: 357 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 357 aa overlap). Probable pyrD,
+ dihydroorotate dehydrogenase (EC 1.3.3.1); contains
+ dihydroorotate dehydrogenase signatures 1 and 2 (PS00911,
+ PS00912). FASTA best: PYRD_MYCLE P46727 dihydroorotate
+ dehydrogenase (309 aa) opt: 1653, E(): 0; (82.6% identity
+ in 304 aa overlap) Protein product from Mb2163 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2163 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable dihydroorotate dehydrogenase pyrd"
+ /protein_id="SIU00770.1"
+ /db_xref="GOA:P65909"
+ /db_xref="InterPro:IPR001295"
+ /db_xref="InterPro:IPR005719"
+ /db_xref="InterPro:IPR005720"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/Swiss-Prot:P65909"
+ /translation="MYPLVRRLLFLIPPEHAHKLVFAVLRGVAAVAPVRRLLRRLLGP
+ TDPVLASTVFGVRFPAPLGLAAGFDKDGTALSSWGAMGFGYAEIGTVTAHPQPGNPAP
+ RLFRLADDRALLNRMGFNNHGARALAIRLARHRPEIPIGVNIGKTKKTPAGDAVNDYR
+ ASARMVGPLASYLVVNVSSPNTPGLRDLQAVESLRPILSAVRAETSTPVLVKIAPDLS
+ DSDLDDIADLAVELDLAGIVATNTTVSRDGLTTPGVDRLGPGGISGPPLAQRAVQVLR
+ RLYDRVGDRLALISVGGIETADDAWERITAGASLLQGYTGFIYGGERWAKDIHEGIAR
+ RLHDGGFGSLHEAVGSARRRQPS"
+ gene complement(2384607..2385137)
+ /gene="TB18.6"
+ /locus_tag="BQ2027_MB2164C"
+ CDS complement(2384607..2385137)
+ /gene="TB18.6"
+ /locus_tag="BQ2027_MB2164C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2164c, TB18.6, len: 176 aa. Equivalent to
+ Rv2140c, len: 176 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 176 aa overlap). TB18.6,
+ conserved hypothetical protein; shows good similarity to
+ hypothetical proteins from Streptomyces coelicolor (177
+ aa; 58% identity) >emb|CAC32358.1| (AL583945) and to 17.1
+ kd Escherichia coli protein YbhB. FASTA best: YBHB_ECOLI
+ P12994 hypothetical 17.1 kd protein (158 aa) opt: 465 E():
+ 2e-23; (46.2% identity in 156 aa overlap). Protein product
+ from Mb2164c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb2164c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Phospholipid-binding protein"
+ /protein_id="SIU00771.1"
+ /db_xref="InterPro:IPR005247"
+ /db_xref="InterPro:IPR008914"
+ /db_xref="InterPro:IPR036610"
+ /db_xref="UniProtKB/Swiss-Prot:P67227"
+ /translation="MTTSPDPYAALPKLPSFSLTSTSITDGQPLATPQVSGIMGAGGA
+ DASPQLRWSGFPSETRSFAVTVYDPDAPTLSGFWHWAVANLPANVTELPEGVGDGREL
+ PGGALTLVNDAGMRRYVGAAPPPGHGVHRYYVAVHAVKVEKLDLPEDASPAYLGFNLF
+ QHAIARAVIFGTYEQR"
+ gene complement(2385185..2386531)
+ /locus_tag="BQ2027_MB2165C"
+ CDS complement(2385185..2386531)
+ /locus_tag="BQ2027_MB2165C"
+ /note="Mb2165c, -, len: 448 aa. Equivalent to Rv2141c,
+ len: 448 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 448 aa overlap). Conserved
+ hypothetical protein. Shows some similarity to conserved
+ hypothetical proteins and to acetylornithine deacetylase
+ and succinyl-diaminopimelate desuccinylase and contains
+ ArgE/dapE/ACY1/CPG2/yscS family signature 1 (PS00758).
+ FASTA best: CBPS_YEAST P27614 carboxypeptidases precursor
+ (576 aa) opt: 234, E(): 4.3e-08; (24.3% identity in 412 aa
+ overlap). Previously named dapE2 Protein product from
+ Mb2165c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2165c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="YscS-like amidohydrolase"
+ /protein_id="SIU00772.1"
+ /db_xref="GOA:A0A1R3Y0E1"
+ /db_xref="InterPro:IPR001261"
+ /db_xref="InterPro:IPR002933"
+ /db_xref="InterPro:IPR011650"
+ /db_xref="InterPro:IPR036264"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0E1"
+ /translation="MTDETGASSDHSDDVAQVVSRLIRFDTTNSGEPGTTKGEAECAR
+ WVAEQLAEVGYQPEYVESGAPGRGNVFARLAGADSSRGALLIHGHLDVVPAEPAEWSV
+ HPFSGAIEDGYVWGRGAVDMKDMVGMMIVVARHLRQAAIVPPRDLVFAFVADEEHGGK
+ YGSHWLVDNRPDLFDGITEAIGEVGGFSLTVPRHDGGERRLYLIETAEKGIQWMRLTA
+ RGRAGHGSMVHDQNAVTAVCEAVARLGRHQFPLVCTDTVAQFLAVVGEETGLAFDLDS
+ PDLAGTIDKLGPMARMLKAVLHDTANPTMLKAGYKANVVPATAEAVVDCRVLPGRRAA
+ FEAEVDALIGPDVTREWVSDLPSYETTFDGDLVAAMNAAVLAVDPDGRTVPYMLSGGT
+ DAKAFARLGIRCFGFSPLRLPPDLDFTSLFHGVDERVPIDGLRFGTEVLTHLLTHC"
+ gene 2386912..2386997
+ /locus_tag="BQ2027_LEUU"
+ tRNA 2386912..2386997
+ /locus_tag="BQ2027_LEUU"
+ /product="tRNA-Leu"
+ /note="leuU, len: 86 nt. Equivalent to leuU, len: 86 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 86 nt overlap). leu-tRNA, anticodon gag."
+ gene complement(2387118..2387435)
+ /gene="pare2"
+ /locus_tag="BQ2027_MB2166C"
+ CDS complement(2387118..2387435)
+ /gene="pare2"
+ /locus_tag="BQ2027_MB2166C"
+ /note="Mb2166c, -, len: 105 aa. Equivalent to Rv2142c,
+ len: 105 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 105 aa overlap). Hypothetical unknown
+ protein. Mb2166c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin pare2"
+ /protein_id="SIU00773.1"
+ /db_xref="InterPro:IPR007712"
+ /db_xref="InterPro:IPR035093"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0A6"
+ /translation="MTRRLRVHNGVEDDLFEAFSYYADAAPDQIDRLYNLFVDAVTKR
+ IPQAPNAFAPLFKHYRHIYLRPFRYYVAYRTTDEAIDILAVRHGMENPNAVEAEISGR
+ TFE"
+ gene complement(2387432..2387647)
+ /gene="parD2"
+ /locus_tag="BQ2027_MB2166A"
+ CDS complement(2387432..2387647)
+ /gene="parD2"
+ /locus_tag="BQ2027_MB2166A"
+ /note="Mb2166A, len: 71 aa. Equivalent to Rv2142A len: 71
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 71 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Possible parD2,
+ antitoxin, part of toxin-antitoxin (TA) operon with
+ Rv2142c (See Pandey and Gerdes, 2005). Protein product
+ from Mb2166A detected using SWATH mass spectrometry.
+ Mb2166A found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible antitoxin ParD2"
+ /protein_id="SIU00774.1"
+ /db_xref="InterPro:IPR013406"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2F4"
+ /translation="MVVNRALLASVDALSRDEQIELVEHINGNLAEGMHISEANQALI
+ EARANDTDDAHWSTIDDFDKRIRARLG"
+ gene 2387902..2388960
+ /locus_tag="BQ2027_MB2167"
+ CDS 2387902..2388960
+ /locus_tag="BQ2027_MB2167"
+ /note="Mb2167, -, len: 352 aa. Equivalent to Rv2143, len:
+ 352 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 352 aa overlap). Conserved
+ hypothetical protein, strongly similar to two hypothetical
+ mycobacterial proteins Rv2030c 2.1e-50 and Rv0571c from
+ position 120 (Q50819; Q50111). FASTA best: Q50819 opt:
+ 882, E() 0; (61.1% identity in 226 aa overlap). Also
+ similar to AL021942|MTV039_9 (443 aa), FASTA scores: opt:
+ 592, E(): 5e-30; 46.9% identity in 224 aa overlap,Mb2167
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Phosphoribosyl transferase domain protein"
+ /protein_id="SIU00775.1"
+ /db_xref="GOA:A0A1R3Y135"
+ /db_xref="InterPro:IPR000836"
+ /db_xref="InterPro:IPR029057"
+ /db_xref="InterPro:IPR032466"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y135"
+ /translation="MEAPPYAGDPTFERLRRSFQPADLLPELQAAGVHYTIAVEAADD
+ PAENESLLATARHHDWIARVIGWVPLADPDEVTESSTHGRHRPDASWRRDLRCPGLLP
+ PGCHQPVLVVGLVGQQPEMRPMNPPSGFLRRTPTRRFRDRRDAGRVLADELASYRGRD
+ RLLVLGLARGGVPVGWEVASALGAELDVFLVRKLGVPQWRELAMGALASGGGVVMNDD
+ VVSSLRITDQQVRAAIDSETAELQRRELAYRGGRPVVDPRARIVILVDDGIATGASML
+ AAVRTIRATGPESIVVAVPVGPATACRELAAEADDVVCATMPAAFEAVGQVYNDFHQV
+ TDDEVRELLATPTTGAAT"
+ gene complement(2389090..2389446)
+ /locus_tag="BQ2027_MB2168C"
+ CDS complement(2389090..2389446)
+ /locus_tag="BQ2027_MB2168C"
+ /note="Mb2168c, -, len: 118 aa. Equivalent to Rv2144c,
+ len: 118 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 118 aa overlap). Probable
+ transmembrane protein. Mb2168c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable transmembrane protein"
+ /protein_id="SIU00776.1"
+ /db_xref="GOA:A0A1R3Y0F4"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0F4"
+ /translation="MLIIALVLALIGLLALVFAVVTSNQLVAWVCIGASVLGVALLIV
+ DALRERQQGGADEADGAGETGVAEEADVDYPEEAPEESQAVDAGVIGSEEPSEEASEA
+ TEESAVSADRSDDSAK"
+ gene complement(2389541..2390323)
+ /gene="wag31"
+ /locus_tag="BQ2027_MB2169C"
+ CDS complement(2389541..2390323)
+ /gene="wag31"
+ /locus_tag="BQ2027_MB2169C"
+ /standard_name="ag84"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2169c, wag31, len: 260 aa. Equivalent to Rv2145c,
+ len: 260 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 260 aa overlap). wag31 (alternate gene
+ name: ag84). Function unknown but corresponds to antigen
+ 84 of Mycobacterium tuberculosis (wag31) (see first
+ citation below). Predicted to contain significant amount
+ of coiled coil structure. Some similarity to Rv1682 and
+ Rv2927c. FASTA best: AG84_MYCTU P46816 antigen 84. Protein
+ product from Mb2169c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2169c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="diviva family protein wag31"
+ /protein_id="SIU00777.1"
+ /db_xref="GOA:P0A5N3"
+ /db_xref="InterPro:IPR007793"
+ /db_xref="InterPro:IPR019933"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5N3"
+ /translation="MPLTPADVHNVAFSKPPIGKRGYNEDEVDAFLDLVENELTRLIE
+ ENSDLRQRINELDQELAAGGGAGVTPQATQAIPAYEPEPGKPAPAAVSAGMNEEQALK
+ AARVLSLAQDTADRLTNTAKAESDKMLADARANAEQILGEARHTADATVAEARQRADA
+ MLADAQSRSEAQLRQAQEKADALQADAERKHSEIMGTINQQRAVLEGRLEQLRTFERE
+ YRTRLKTYLESQLEELGQRGSAAPVDSNADAGGFDQFNRGKN"
+ gene complement(2390591..2390881)
+ /locus_tag="BQ2027_MB2170C"
+ CDS complement(2390591..2390881)
+ /locus_tag="BQ2027_MB2170C"
+ /note="Mb2170c, -, len: 96 aa. Equivalent to Rv2146c, len:
+ 96 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 96 aa overlap). Possible conserved
+ transmembrane protein, orthologs present in Mycobacterium
+ leprae, ML0921 (96 aa) and Streptomyces coelicolor. Second
+ start taken GTG alternative upstream but much less
+ probable in TBparse. FASTA best: Q44935 SIMILAR TO A
+ HYPOTHETICAL INTEGRAL MEMBRANE PROT EIN (97 aa) opt: 105,
+ E(): 0.093; (25.3% identity in 87 aa overlap).
+ >emb|CAC31302.1| (AL583920) possible membrane protein
+ ML0921 [Mycobacterium leprae] E(): 5e-32 (76% identity in
+ 96 aa overlap),Mb2170c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible conserved transmembrane protein"
+ /protein_id="SIU00778.1"
+ /db_xref="GOA:A0A1R3Y0A1"
+ /db_xref="InterPro:IPR003425"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0A1"
+ /translation="MVVFFQILGFALFIFWLLLIARVVVEFIRSFSRDWRPTGVTVVI
+ LEIIMSITDPPVKVLRRLIPQLTIGAVRFDLSIMVLLLVAFIGMQLAFGAAA"
+ gene complement(2391043..2391768)
+ /gene="sepF"
+ /locus_tag="BQ2027_MB2171C"
+ CDS complement(2391043..2391768)
+ /gene="sepF"
+ /locus_tag="BQ2027_MB2171C"
+ /note="Mb2171c, -, len: 241 aa. Equivalent to Rv2147c,
+ len: 241 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 241 aa overlap). Conserved
+ hypothetical protein, similar to conserved hypothetical
+ proteins in Mycobacterium leprae ML0920 (210 aa) and
+ Streptomyces coelicolor. FASTA scores: >emb|CAC31301.1|
+ (AL583920) hypothetical protein ML0920 hypothetical
+ protein (210 aa) opt: 1242, E(): 5.7e-74; 83.486% identity
+ in 218 aa overlap Protein product from Mb2171c detected
+ using SWATH mass spectrometry. Mb2171c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SepF, FtsZ-interacting protein related to cell
+ division"
+ /protein_id="SIU00779.1"
+ /db_xref="GOA:Q7TYZ5"
+ /db_xref="InterPro:IPR007561"
+ /db_xref="InterPro:IPR023052"
+ /db_xref="InterPro:IPR038594"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYZ5"
+ /translation="MNSHCSHTFITDNRSPRARRGHAMSTLHKVKAYFGMAPMEDYDD
+ EYYDDRAPSRGYARPRFDDDYGRYDGRDYDDARSDSRGDLRGEPADYPPPGYRGGYAD
+ EPRFRPREFDRAEMTRPRFGSWLRNSTRGALAMDPRRMAMMFEDGHPLSKITTLRPKD
+ YSEARTIGERFRDGSPVIMDLVSMDNADAKRLVDFAAGLAFALRGSFDKVATKVFLLS
+ PADVDVSPEERRRIAETGFYAYQ"
+ gene complement(2391765..2392541)
+ /locus_tag="BQ2027_MB2172C"
+ CDS complement(2391765..2392541)
+ /locus_tag="BQ2027_MB2172C"
+ /note="Mb2172c, -, len: 258 aa. Equivalent to Rv2148c,
+ len: 258 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 258 aa overlap). Conserved
+ hypothetical protein; should belong to the
+ YGGS/YBL036C/F09E5.8 family. FASTA best:
+ AB003132|AB003132_5 Corynebacterium glutamicum gene (221
+ aa) opt: 440, E(): 2.3e-23; 42.8% identity in 236 aa
+ overlap; and YPI1_VIBAL P52055 hypothetical protein in
+ pilt-proc intergenic region in Vibrio alginolyticus. opt:
+ 266, E(): 1.8e-11; 27.9% identity in 244 aa overlap.
+ Protein product from Mb2172c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2172c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Pyridoxal phosphate-containing protein YggS"
+ /protein_id="SIU00780.1"
+ /db_xref="GOA:P67084"
+ /db_xref="InterPro:IPR001608"
+ /db_xref="InterPro:IPR011078"
+ /db_xref="InterPro:IPR029066"
+ /db_xref="UniProtKB/Swiss-Prot:P67084"
+ /translation="MAADLSAYPDRESELTHALAAMRSRLAAAAEAAGRNVGEIELLP
+ ITKFFPATDVAILFRLGCRSVGESREQEASAKMAELNRLLAAAELGHSGGVHWHMVGR
+ IQRNKAGSLARWAHTAHSVDSSRLVTALDRAVVAALAEHRRGERLRVYVQVSLDGDGS
+ RGGVDSTTPGAVDRICAQVQESEGLELVGLMGIPPLDWDPDEAFDRLQSEHNRVRAMF
+ PHAIGLSAGMSNDLEVAVKHGSTCVRVGTALLGPRRLRSP"
+ gene complement(2392547..2393299)
+ /gene="yfiH"
+ /locus_tag="BQ2027_MB2173C"
+ CDS complement(2392547..2393299)
+ /gene="yfiH"
+ /locus_tag="BQ2027_MB2173C"
+ /note="Mb2173c, yfiH, len: 250 aa. Equivalent to Rv2149c,
+ len: 250 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 250 aa overlap). yfiH; corresponds to
+ hypothetical 25.3 kDa YfiH protein in ftsZ 3' region of
+ Streptomyces griseus, and to YfiH proteins in other
+ bacteria. Belongs to UPF0124 Family. FASTA best:
+ YFIH_STRGR P45496, (246 aa) opt: 722, E(): 1.9e-37; (49.4%
+ identity in 245 aa overlap) Protein product from Mb2173c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2173c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG00003370: Multicopper polyphenol oxidase"
+ /protein_id="SIU00781.1"
+ /db_xref="GOA:P67257"
+ /db_xref="InterPro:IPR003730"
+ /db_xref="InterPro:IPR011324"
+ /db_xref="InterPro:IPR038371"
+ /db_xref="UniProtKB/Swiss-Prot:P67257"
+ /translation="MLASTRHIARGDTGNVSVRIRRVTTTRAGGVSAPPFDTFNLGDH
+ VGDDPAAVAANRARLAAAIGLPGNRVVWMNQVHGDRVELVDQPRNTALDDTDGLVTAT
+ PRLALAVVTADCVPVLMADARAGIAAAVHAGRAGAQRGVVVRALEVMLSLGAQVRDIS
+ ALLGPAVSGRNYEVPAAMADEVEAALPGSRTTTAAGTPGVDLRAGIACQLRDLGVESI
+ DVDPRCTVADPTLFSHRRDAPTGRFASLVWME"
+ gene complement(2393310..2394449)
+ /gene="ftsZ"
+ /locus_tag="BQ2027_MB2174C"
+ CDS complement(2393310..2394449)
+ /gene="ftsZ"
+ /locus_tag="BQ2027_MB2174C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2174c, ftsZ, len: 379 aa. Equivalent to Rv2150c,
+ len: 379 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 379 aa overlap). ftsZ, cell division
+ protein (see first citation below). Contains FtsZ protein
+ signature 2 (PS01135). FASTA best: FTSZ_STRCO P45500 cell
+ division protein FtsZ (399 aa) opt: 1674, E(): 0; (77.3%
+ identity in 339 aa overlap). Protein product from Mb2174c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2174c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="cell division protein FtsZ"
+ /protein_id="SIU00782.1"
+ /db_xref="GOA:P64171"
+ /db_xref="InterPro:IPR000158"
+ /db_xref="InterPro:IPR003008"
+ /db_xref="InterPro:IPR008280"
+ /db_xref="InterPro:IPR018316"
+ /db_xref="InterPro:IPR020805"
+ /db_xref="InterPro:IPR024757"
+ /db_xref="InterPro:IPR036525"
+ /db_xref="InterPro:IPR037103"
+ /db_xref="UniProtKB/Swiss-Prot:P64171"
+ /translation="MTPPHNYLAVIKVVGIGGGGVNAVNRMIEQGLKGVEFIAINTDA
+ QALLMSDADVKLDVGRDSTRGLGAGADPEVGRKAAEDAKDEIEELLRGADMVFVTAGE
+ GGGTGTGGAPVVASIARKLGALTVGVVTRPFSFEGKRRSNQAENGIAALRESCDTLIV
+ IPNDRLLQMGDAAVSLMDAFRSADEVLLNGVQGITDLITTPGLINVDFADVKGIMSGA
+ GTALMGIGSARGEGRSLKAAEIAINSPLLEASMEGAQGVLMSIAGGSDLGLFEINEAA
+ SLVQDAAHPDANIIFGTVIDDSLGDEVRVTVIAAGFDVSGPGRKPVMGETGGAHRIES
+ AKAGKLTSTLFEPVDAVSVPLHTNGATLSIGGDDDDVDVPPFMRR"
+ gene complement(2394622..2395566)
+ /gene="ftsQ"
+ /locus_tag="BQ2027_MB2175C"
+ CDS complement(2394622..2395566)
+ /gene="ftsQ"
+ /locus_tag="BQ2027_MB2175C"
+ /note="Mb2175c, ftsQ, len: 314 aa. Equivalent to Rv2151c,
+ len: 314 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 314 aa overlap). Possible ftsQ, cell
+ division protein, with some homology to FTSQ_STRGR|P45503
+ cell division protein ftsq homolog from Streptomyces
+ griseus (208 aa), FASTA scores: opt: 204, E(): 4e-05;
+ (30.6% identity in 193 aa overlap). Protein product from
+ Mb2175c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2175c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CELL DIVISION PROTEIN FTSQ"
+ /protein_id="SIU00783.1"
+ /db_xref="GOA:P64169"
+ /db_xref="InterPro:IPR005548"
+ /db_xref="InterPro:IPR013685"
+ /db_xref="InterPro:IPR026579"
+ /db_xref="InterPro:IPR034746"
+ /db_xref="UniProtKB/Swiss-Prot:P64169"
+ /translation="MTEHNEDPQIERVADDAADEEAVTEPLATESKDEPAEHPEFEGP
+ RRRARRERAERRAAQARATAIEQARRAAKRRARGQIVSEQNPAKPAARGVVRGLKALL
+ ATVVLAVVGIGLGLALYFTPAMSAREIVIIGIGAVSREEVLDAARVRPATPLLQIDTQ
+ QVADRVATIRRVASARVQRQYPSALRITIVERVPVVVKDFSDGPHLFDRDGVDFATDP
+ PPPALPYFDVDNPGPSDPTTKAALQVLTALHPEVASQVGRIAAPSVASITLTLADGRV
+ VIWGTTDRCEEKAEKLAALLTQPGRTYDVSSPDLPTVK"
+ gene complement(2395563..2397047)
+ /gene="murC"
+ /locus_tag="BQ2027_MB2176C"
+ CDS complement(2395563..2397047)
+ /gene="murC"
+ /locus_tag="BQ2027_MB2176C"
+ /note="Mb2176c, murC, len: 494 aa. Equivalent to Rv2152c,
+ len: 494 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 494 aa overlap). Probable murC,
+ UDP-N-acetylmuramate-alanine ligase (EC 6.3.2.8). FASTA
+ best: MURC_ECOLI P17952 (491 aa) opt: 764, E(): 0; (36.9%
+ identity in 474 aa overlap) Protein product from Mb2176c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2176c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable udp-n-acetylmuramate-alanine ligase
+ murc"
+ /protein_id="SIU00784.1"
+ /db_xref="GOA:P65473"
+ /db_xref="InterPro:IPR000713"
+ /db_xref="InterPro:IPR004101"
+ /db_xref="InterPro:IPR005758"
+ /db_xref="InterPro:IPR013221"
+ /db_xref="InterPro:IPR036565"
+ /db_xref="InterPro:IPR036615"
+ /db_xref="UniProtKB/Swiss-Prot:P65473"
+ /translation="MSTEQLPPDLRRVHMVGIGGAGMSGIARILLDRGGLVSGSDAKE
+ SRGVHALRARGALIRIGHDASSLDLLPGGATAVVTTHAAIPKTNPELVEARRRGIPVV
+ LRPAVLAKLMAGRTTLMVTGTHGKTTTTSMLIVALQHCGLDPSFAVGGELGEAGTNAH
+ HGSGDCFVAEADESDGSLLQYTPHVAVITNIESDHLDFYGSVEAYVAVFDSFVERIVP
+ GGALVVCTDDPGGAALAQRATELGIRVLRYGSVPGETMAATLVSWQQQGVGAVAHIRL
+ ASELATAQGPRVMRLSVPGRHMALNALGALLAAVQIGAPADEVLDGLAGFEGVRRRFE
+ LVGTCGVGKASVRVFDDYAHHPTEISATLAAARMVLEQGDGGRCMVVFQPHLYSRTKA
+ FAAEFGRALNAADEVFVLDVYGAREQPLAGVSGASVAEHVTVPMRYVPDFSAVAQQVA
+ AAASPGDVIVTMGAGDVTLLGPEILTALRVRANRSAPGRPGVLG"
+ gene complement(2397044..2398276)
+ /gene="murG"
+ /locus_tag="BQ2027_MB2177C"
+ CDS complement(2397044..2398276)
+ /gene="murG"
+ /locus_tag="BQ2027_MB2177C"
+ /note="Mb2177c, murG, len: 410 aa. Equivalent to Rv2153c,
+ len: 410 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 410 aa overlap). Probable MURG PROTEIN
+ (UPD-N-acetylglucosamine-N-acetylmuramyl-(pentapeptide)
+ pyrophosphoryl-undecaprenol-N-acetylglucosamine
+ transferase. FASTA score: MURG_BACSU P37585 murg protein
+ (363 aa) opt: 494, E(): 1.1e-20; (27.9% identity in 365 aa
+ overlap) Protein product from Mb2177c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2177c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable
+ upd-n-acetylglucosamine-n-acetylmuramyl-(pentapeptide)
+ pyrophosphoryl-undecaprenol-n-acetylglucosamine
+ transferase murg"
+ /protein_id="SIU00785.1"
+ /db_xref="GOA:Q7VEP8"
+ /db_xref="InterPro:IPR004276"
+ /db_xref="InterPro:IPR006009"
+ /db_xref="InterPro:IPR007235"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEP8"
+ /translation="MKDTVSQPAGGRGATAPRPADAASPSCGSSPSADSLSVVLAGGG
+ TAGHVEPAMAVADALVALDPRVRITALGTPRGLETRLVPQRGYHLELITAVPMPRKPG
+ GDLARLPSRVWRAVREARDVLDDVDADVVVGFGGYVALPAYLAARGLPLPPRRRRRIP
+ VVIHEANARAGLANRVGAHTADRVLSAVPDSGLRRAEVVGVPVRASIAALDRAVLRAE
+ ARAHFGFPDDARVLLVFGGSQGAVSLNRAVSGAAADLAAAGVCVLHAHGPQNVLELRR
+ RAQGDPPYVAVPYLDRMELAYAAADLVICRAGAMTVAEVSAVGLPAIYVPLPIGNGEQ
+ RLNALPVVNAGGGMVVADAALTPELVARQVAGLLTDPARLAAMTAAAARVGHRDAAGQ
+ VARAALAVATGAGARTTT"
+ gene complement(2398273..2399847)
+ /gene="ftsW"
+ /locus_tag="BQ2027_MB2178C"
+ CDS complement(2398273..2399847)
+ /gene="ftsW"
+ /locus_tag="BQ2027_MB2178C"
+ /note="Mb2178c, ftsW, len: 524 aa. Equivalent to Rv2154c,
+ len: 524 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 524 aa overlap). Probable ftsW, cell
+ division protein, related to MTCY10H4.17c, 3.2e-17. FASTA
+ best: SP5E_BACSU P07373 stage V sporulation protein E (366
+ aa) opt: 755, E(): 1.6e-33; (38.4% identity in 357 aa
+ overlap),Mb2178c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="FtsW-like protein FtsW"
+ /protein_id="SIU00786.1"
+ /db_xref="GOA:P63763"
+ /db_xref="InterPro:IPR001182"
+ /db_xref="InterPro:IPR013437"
+ /db_xref="InterPro:IPR018365"
+ /db_xref="UniProtKB/Swiss-Prot:P63763"
+ /translation="MLTRLLRRGTSDTDGSQTRGAEPVEGQRTGPEEASNPGSARPRT
+ RFGAWLGRPMTSFHLIIAVAALLTTLGLIMVLSASAVRSYDDDGSAWVIFGKQVLWTL
+ VGLIGGYVCLRMSVRFMRRIAFSGFAITIVMLVLVLVPGIGKEANGSRGWFVVAGFSM
+ QPSELAKMAFAIWGAHLLAARRMERASLREMLIPLVPAAVVALALIVAQPDLGQTVSM
+ GIILLGLLWYAGLPLRVFLSSLAAVVVSAAILAVSAGYRSDRVRSWLNPENDPQDSGY
+ QARQAKFALAQGGIFGDGLGQGVAKWNYLPNAHNDFIFAIIGEELGLVGALGLLGLFG
+ LFAYTGMRIASRSADPFLRLLTATTTLWVLGQAFINIGYVIGLLPVTGLQLPLISAGG
+ TSTAATLSLIGIIANAARHEPEAVAALRAGRDDKVNRLLRLPLPEPYLPPRLEAFRDR
+ KRANPQPAQTQPARKTPRTAPGQPARQMGLPPRPGSPRTADPPVRRSVHHGAGQRYAG
+ QRRTRRVRALEGQRYG"
+ gene complement(2399859..2401319)
+ /gene="murD"
+ /locus_tag="BQ2027_MB2179C"
+ CDS complement(2399859..2401319)
+ /gene="murD"
+ /locus_tag="BQ2027_MB2179C"
+ /note="Mb2179c, -, len: 486 aa. Equivalent to Rv2155c,
+ len: 486 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 486 aa overlap). Probable murD,
+ UDP-N-acetylmuramoylalanine-D-glutamate ligase (EC
+ 6.3.2.9). FASTA best: MURD_BACSU Q03522 (451 aa) opt: 534,
+ E(): 2.7e-25; (28.8% identity in 483 aa overlap); contains
+ PS01011 Folylpolyglutamate synthase signature 1 Protein
+ product from Mb2179c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2179c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable udp-n-acetylmuramoylalanine-d-glutamate
+ ligase murd"
+ /protein_id="SIU00787.1"
+ /db_xref="GOA:Q7VEP7"
+ /db_xref="InterPro:IPR004101"
+ /db_xref="InterPro:IPR005762"
+ /db_xref="InterPro:IPR013221"
+ /db_xref="InterPro:IPR036565"
+ /db_xref="InterPro:IPR036615"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEP7"
+ /translation="MLDPLGPGAPVLVAGGRVTGQAVAAVLTRFGATPTVCDDDPVML
+ RPHAERGLPTVSSSDAVQQITGYALVVASPGFSPATPLLAAAAAAGVPIWGDVELAWR
+ LDAAGCYGPPRSWLVVTGTNGKTTTTSMLHAMLIAGGRRAVLCGNIGSAVLDVLDEPA
+ ELLAVELSSFQLHWAPSLRPEAGAVLNIAEDHLDWHATMAEYTAAKARVLTGGVAVAG
+ LDDSRAAALLDGSPAQVRVGFRLGEPAAGELGVRDAHLVDRAFSDDLTLLPVASIPVP
+ GPVGVLDALAAAALARSVGVPAGAIADAVTSFRVGRHRAEVVAVADGITYVDDSKATN
+ PHAARASVLAYPRVVWIAGGLLKGASLHAEVAAMASRLVGAVLIGRDRAAVAEALSRH
+ APDVPVVQVVAGEDTGMPATVEVPVACVLDVAKDDKAGETVGAAVMTAAVAAARRMAQ
+ PGDTVLLAPAGASFDQFTGYADRGEAFATAVRAVIR"
+ gene complement(2401321..2402400)
+ /gene="murX"
+ /locus_tag="BQ2027_MB2180C"
+ CDS complement(2401321..2402400)
+ /gene="murX"
+ /locus_tag="BQ2027_MB2180C"
+ /note="Mb2180c, murX, len: 359 aa. Equivalent to Rv2156c,
+ len: 359 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 359 aa overlap). Probable murX,
+ phospho-N-acetylmuramoyl-pentappeptidetransferase (EC
+ 2.7.8 .13). FASTA best: MRAY_ECOLI P15876 (360 aa) opt:
+ 572 z-sco re: 651.6 E(): 2.7e-29; (35.8% identity in 344
+ aa overlap) Protein product from Mb2180c detected using
+ SWATH mass spectrometry. Mb2180c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable
+ phospho-n-acetylmuramoyl-pentappeptidetransferase murx"
+ /protein_id="SIU00788.1"
+ /db_xref="GOA:P64260"
+ /db_xref="InterPro:IPR000715"
+ /db_xref="InterPro:IPR003524"
+ /db_xref="InterPro:IPR018480"
+ /db_xref="UniProtKB/Swiss-Prot:P64260"
+ /translation="MRQILIAVAVAVTVSILLTPVLIRLFTKQGFGHQIREDGPPSHH
+ TKRGTPSMGGVAILAGIWAGYLGAHLAGLAFDGEGIGASGLLVLGLATALGGVGFIDD
+ LIKIRRSRNLGLNKTAKTVGQITSAVLFGVLVLQFRNAAGLTPGSADLSYVREIATVT
+ LAPVLFVLFCVVIVSAWSNAVNFTDGLDGLAAGTMAMVTAAYVLITFWQYRNACVTAP
+ GLGCYNVRDPLDLALIAAATAGACIGFLWWNAAPAKIFMGDTGSLALGGVIAGLSVTS
+ RTEILAVVLGALFVAEITSVVLQILTFRTTGRRMFRMAPFHHHFELVGWAETTVIIRF
+ WLLTAITCGLGVALFYGEWLAAVGA"
+ gene complement(2402397..2403929)
+ /gene="murF"
+ /locus_tag="BQ2027_MB2181C"
+ CDS complement(2402397..2403929)
+ /gene="murF"
+ /locus_tag="BQ2027_MB2181C"
+ /note="Mb2181c, murF, len: 510 aa. Equivalent to Rv2157c,
+ len: 510 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 510 aa overlap). Probable murF,
+ UDP-N-acetylmuramoylalanyl-D-glutamyl-2,
+ 6-diaminopimelate-D -alanyl-D-alanyl ligase (EC 6.3.2.15)
+ (UDP-MURNAC-PENTAPEPTIDE SYNTHETASE) also related to other
+ Mycobacterium tuberculosis mur gene products. FASTA best:
+ MURF_ECOLI P11880 (452 aa) opt: 515, E(): 2.6e-24, (31.9%
+ identity in 511 aa overlap); deleted EC number 6.3.2.15
+ Protein product from Mb2181c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2181c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable
+ udp-n-acetylmuramoylalanyl-d-glutamyl-2,
+ 6-diaminopimelate-d-alanyl-d-alanyl ligase murf"
+ /protein_id="SIU00789.1"
+ /db_xref="GOA:P0A5L5"
+ /db_xref="InterPro:IPR000713"
+ /db_xref="InterPro:IPR004101"
+ /db_xref="InterPro:IPR005863"
+ /db_xref="InterPro:IPR013221"
+ /db_xref="InterPro:IPR035911"
+ /db_xref="InterPro:IPR036565"
+ /db_xref="InterPro:IPR036615"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5L5"
+ /translation="MIELTVAQIAEIVGGAVADISPQDAAHRRVTGTVEFDSRAIGPG
+ GLFLALPGARADGHDHAASAVAAGAAVVLAARPVGVPAIVVPPVAAPNVLAGVLEHDN
+ DGSGAAVLAALAKLATAVAAQLVAGGLTIIGITGSSGKTSTKDLMAAVLAPLGEVVAP
+ PGSFNNELGHPWTVLRATRRTDYLILEMAARHHGNIAALAEIAPPSIGVVLNVGTAHL
+ GEFGSREVIAQTKAELPQAVPHSGAVVLNADDPAVAAMAKLTAARVVRVSRDNTGDVW
+ AGPVSLDELARPRFTLHAHDAQAEVRLGVCGDHQVTNALCAAAVALECGASVEQVAAA
+ LTAAPPVSRHRMQVTTRGDGVTVIDDAYNANPDSMRAGLQALAWIAHQPEATRRSWAV
+ LGEMAELGEDAIAEHDRIGRLAVRLDVSRLVVVGTGRSISAMHHGAVLEGAWGSGEAT
+ ADHGADRTAVNVADGDAALALLRAELRPGDVVLVKASNAAGLGAVADALVADDTCGSV
+ RP"
+ gene complement(2403926..2405533)
+ /gene="murE"
+ /locus_tag="BQ2027_MB2182C"
+ CDS complement(2403926..2405533)
+ /gene="murE"
+ /locus_tag="BQ2027_MB2182C"
+ /note="Mb2182c, murE, len: 535 aa. Equivalent to Rv2158c,
+ len: 535 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 535 aa overlap). Probable murE,
+ UDP-N-acetylmuramoylalanyl-D-glutamate-2,6-diaminopimelate
+ ligase (EC 6.3.2.13; UDP-N-ACETYLMURAMYL-TRIPEPTIDE
+ SYNTHETASE) also related to other Mycobacterium
+ tuberculosis mur gene products. FASTA best: MURE_BACSU
+ Q03523 (494 aa) opt: 1020 z- score: 1110.1 E(): 0; (40.1%
+ identity in 476 aa overlap) Protein product from Mb2182c
+ detected using shotgun mass spectrometry. Mb2182c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable
+ UDP-N-acetylmuramoylalanyl-D-glutamate-2,6-diaminopimelate
+ ligase MurE"
+ /protein_id="SIU00790.1"
+ /db_xref="GOA:P65478"
+ /db_xref="InterPro:IPR000713"
+ /db_xref="InterPro:IPR004101"
+ /db_xref="InterPro:IPR005761"
+ /db_xref="InterPro:IPR013221"
+ /db_xref="InterPro:IPR035911"
+ /db_xref="InterPro:IPR036565"
+ /db_xref="InterPro:IPR036615"
+ /db_xref="UniProtKB/Swiss-Prot:P65478"
+ /translation="MSSLARGISRRRTEVATQVEAAPTGLRPNAVVGVRLAALADQVG
+ AALAEGPAQRAVTEDRTVTGVTLRAQDVSPGDLFAALTGSTTHGARHVGDAIARGAVA
+ VLTDPAGVAEIAGRAAVPVLVHPAPRGVLGGLAATVYGHPSERLTVIGITGTSGKTTT
+ TYLVEAGLRAAGRVAGLIGTIGIRVGGADLPSALTTPEAPTLQAMLAAMVERGVDTVV
+ MEVSSHALALGRVDGTRFAVGAFTNLSRDHLDFHPSMADYFEAKASLFDPDSALRART
+ AVVCIDDDAGRAMAARAADAITVSAADRPAHWRATDVAPTDAGGQQFTAIDPAGVGHH
+ IGIRLPGRYNVANCLVALAILDTVGVSPEQAVPGLREIRVPGRLEQIDRGQGFLALVD
+ YAHKPEALRSVLTTLAHPDRRLAVVFGAGGDRDPGKRAPMGRIAAQLADLVVVTDDNP
+ RDEDPTAIRREILAGAAEVGGDAQVVEIADRRDAIRHAVAWARPGDVVLIAGKGHETG
+ QRGGGRVRPFDDRVELAAALEALERRA"
+ gene complement(2405556..2406590)
+ /locus_tag="BQ2027_MB2183C"
+ CDS complement(2405556..2406590)
+ /locus_tag="BQ2027_MB2183C"
+ /note="Mb2183c, -, len: 344 aa. Equivalent to Rv2159c,
+ len: 344 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 344 aa overlap). Conserved
+ hypothetical protein; some similarity to hypothetical
+ protein from Streptomyces coelicolor SC1A6.09c (337 aa,
+ 29% identity). Smith-Waterman scores: >pir||T28690
+ hypothetical protein -Streptomyces coelicolor
+ >gi|3127841|emb|CAA18907.1| (AL023496) Expect = 2e-18
+ Protein product from Mb2183c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Peroxidase"
+ /protein_id="SIU00791.1"
+ /db_xref="GOA:A0A1R3Y0C9"
+ /db_xref="InterPro:IPR003779"
+ /db_xref="InterPro:IPR004675"
+ /db_xref="InterPro:IPR029032"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0C9"
+ /translation="MKFVNHIEPVAPRRAGGAVAEVYAEARREFGRLPEPLAMLSPDE
+ GLLTAGWATLRETLLVGQVPRGRKEAVAAAVAASLRCPWCVDAHTTMLYAAGQTDTAA
+ AILAGTAPAAGDPNAPYVAWAAGTGTPAGPPAPFGPDVAAEYLGTAVQFHFIARLVLV
+ LLDETFLPGGPRAQQLMRRAGGLVFARKVRAEHRPGRSTRRLEPRTLPDDLAWATPSE
+ PIATAFAALSHHLDTAPHLPPPTRQVVRRVVGSWHGEPMPMSSRWTNEHTAELPADLH
+ APTRLALLTGLAPHQVTDDDVAAARSLLDTDAALVGALAWAAFTAARRIGTWIGAAAE
+ GQVSRQNPTG"
+ gene complement(2406587..2407207)
+ /locus_tag="BQ2027_MB2184C"
+ CDS complement(2406587..2407207)
+ /locus_tag="BQ2027_MB2184C"
+ /note="Mb2184c, -, len: 206 aa. Similar to 5' end of
+ Rv2160A and 3' end of Rv2160c, len: 211 aa and 112 aa,
+ from Mycobacterium tuberculosis strain H37Rv, (96.3%
+ identity in 107 aa overlap and 92.0% identity in 112 aa
+ overlap). Conserved hypothetical protein, possibly a
+ tetR-family transcriptional regulator, similar to
+ N-terminal half of AL512667_12|Q9AD73|SCK31.01c PUTATIVE
+ TETR-FAMILY TRANSCRIPTIONAL REGULATOR from Streptomyces
+ coelicolor (200 aa), FASTA scores: opt: 285, E(): 1.4e-08,
+ (51.042% identity in 96 aa overlap). Next gene, Rv2160c,
+ is similar to C-terminal half of 2SCK31.01c suggesting
+ possible frameshift near 2421978 but sequence of this
+ region has been checked and is also identical in strain
+ CDC1551. Conserved hypothetical protein, possibly a
+ tetR-family transcriptional regulator, similar to
+ C-terminal half of AL512667_12|Q9AD73|SCK31.01c PUTATIVE
+ TETR-FAMILY TRANSCRIPTIONAL REGULATOR from Streptomyces
+ coelicolor (200 aa), while Rv2160A is similar to the
+ N-terminal half of 2SCK31.01c. This suggests possible
+ frameshift near 2421978 but sequence of this region has
+ been checked and is also identical in strain CDC1551.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv2160A and Rv2160c exist as 2
+ genes with an overlap region between them. In
+ Mycobacterium bovis, a 4 bp insertion (*-ggaa) leads to a
+ single product."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00792.1"
+ /db_xref="GOA:A0A1R3Y0F7"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0F7"
+ /translation="MPSADVGRQTRAQILRAAMDIASVKGLSGLSIGELAGRLGMSKS
+ GLFRHFGAKEQLQLATVEAAVSVFEAEVVAPAMAAPPGVDRVRALMHAWVGYLERDVF
+ PGGCFFAAAAADVDSQPGPVRDRIAATGRAGIAAITADVETAQRRGEIRADIEARQLA
+ FELHAYAMEANWALLLLDDDGAGERARTAIDAALARVGTTQEGVES"
+ gene complement(2407200..2408066)
+ /locus_tag="BQ2027_MB2185C"
+ CDS complement(2407200..2408066)
+ /locus_tag="BQ2027_MB2185C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2185c, -, len: 288 aa. Equivalent to Rv2161c,
+ len: 288 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 288 aa overlap). Conserved
+ hypothetical protein; shows some similarity to protein
+ involved in lincomycin production and to other M.
+ tuberculosis proteins e.g. Rv0953c, Rv0791c, Rv0132c,
+ Rv2951c, Rv1855c. FASTA best: Q54379 (78-11) LINCOMYCIN
+ PRODUCTION GENES (295 aa) opt: 243, E(): 2.4e-09; (29.5%
+ identity in 285 aa overlap). Protein product from Mb2185c
+ detected using SWATH mass spectrometry. Mb2185c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable F420-dependent oxidoreductase family
+ protein"
+ /protein_id="SIU00793.1"
+ /db_xref="GOA:A0A1R3Y0D6"
+ /db_xref="InterPro:IPR011251"
+ /db_xref="InterPro:IPR019921"
+ /db_xref="InterPro:IPR036661"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0D6"
+ /translation="MLVSLMQFVTDLTPPPQLVAVWAEERGFAGLYVPEKTHVPISRS
+ TPWPGGELPDWYRRCYDPVVALAAAAAVTTRLRVGTGACLVAVHDPILLAKQIASLCA
+ MSGERFVLGVGFGWNVEELADHGVPFADRIAVTVDKLAAMRALWAAEPVHYEGTHASV
+ PPSWAWPKPAVAPPVLFGCRPSARAFEVIARHGDGWQPIEGYGELLGALPMLHAAFER
+ AGRDPATAQVCVYSSAGDPATLHEYRRAGVAEVALALPSAGRDQVLAALDRSAPLVDA
+ FAGDDREVKSHA"
+ gene complement(2408169..2409641)
+ /gene="PE_PGRS38"
+ /locus_tag="BQ2027_MB2186C"
+ CDS complement(2408169..2409641)
+ /gene="PE_PGRS38"
+ /locus_tag="BQ2027_MB2186C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2186c, PE_PGRS38, len: 490 aa. Similar to
+ Rv2162c, len: 532 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (92.105% identity in 532 aa overlap). Member
+ of Mycobacterium tuberculosis PE_PGRS family. FASTA score:
+ Y03A_MYCTU Q 10637 hypothetical glycine-rich 49.6 kd
+ protein (603 aa) op t: 1798 z-score: 1220.0 E(): 0; (55.4%
+ identity in 590 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis,
+ in-frame deletions of 108 bp and 18 bp leads to a shorter
+ product than in Mycobacterium tuberculosis strain H37Rv
+ (490 aa versus 532 aa). Mb2186c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs38"
+ /protein_id="SIU00794.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2H6"
+ /translation="MSFVIAAPEVMAAAATDLANIGSSISAASAAAAGPTMGILAAGA
+ DEVSVAISALFGSHAQGYQTLSAQLAAYHNQFVRALNAGAGSYASAEAANVQQTLLNA
+ INAPTQTLLGRPLIGNGADGGPGQNGGPGGLLYGNGGNGGAGDTANPNGGNGGSAGLI
+ GNGGAGGAGAATGAGGAGGNGGWLYGNGGPGGAAGLGTAGGVSPAGGAGGAAGLWGHG
+ GAGGAGGSASGAPGAGGAGGDGGRGGLLYGDGGAGGAGGNGSNGVTGVHGGNGGAGGA
+ AGLIGNGGAGGDGGNGGLSNTGASGGAGGAGGAALIGNGGDGGHGGNGGHGNSGGAGG
+ AGGAGGHVGLIGNGGNGGAGGNGGNDNSSTLADAGSGGAGAAGGNGGLFYGNGGVGGR
+ GGNGGQAPTPGNAGDGGAGGNARLIGDGGRGGNGGEGGDGPPGVKGDGGNGGNGGNAV
+ VIGNGGNGGAGGFGIPVGSGGAGGSRGVLFGTPGANGADG"
+ gene complement(2409851..2411890)
+ /gene="pbpB"
+ /locus_tag="BQ2027_MB2187C"
+ CDS complement(2409851..2411890)
+ /gene="pbpB"
+ /locus_tag="BQ2027_MB2187C"
+ /note="Mb2187c, pbpB, len: 679 aa. Equivalent to Rv2163c,
+ len: 679 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 679 aa overlap). Probable pbpB,
+ penicillin-binding membrane protein, similar to many
+ bacterial PBP2 proteins e.g.
+ P11882|PBP2_NEIME|PENA|NMA2072|NMB0413 penicillin-binding
+ protein 2 (pbp-2) from Neisseria meningitidis (serogroups
+ A and B) (581 aa), FASTA scores: opt: 665, E(): 1.6e-31,
+ (33.2% identity in 591 aa overlap); etc. Also similar to
+ Rv0016c and Rv2864c from Mycobacterium tuberculosis
+ (2.8e-10). Contains PS00017 possible ATP/GTP-binding site
+ motif A (P-loop) near C-terminus. FASTA best: PBP2_NEIME
+ P11882 penicillin-binding protein 2 (pbp-2). (581 aa) opt:
+ 665, E(): 1.6e-31; (33 .2% identity in 591 aa
+ overlap),Mb2187c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable penicillin-binding membrane protein
+ pbpB"
+ /protein_id="SIU00795.1"
+ /db_xref="GOA:A0A1R3Y155"
+ /db_xref="InterPro:IPR001460"
+ /db_xref="InterPro:IPR005311"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="InterPro:IPR036138"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y155"
+ /translation="MSRAAPRRASQSQSTRPARGLRRPPGAQEVGQRKRPGKTQKARQ
+ AQEATKSRPATRSDVAPAGRSTRARRTRQVVDVGTRGASFVFRHRTGNAVILVLMLVA
+ ATQLFFLQVSHAAGLRAQAAGQLKVTDVQPAARGSIVDRNNDRLAFTIEARALTFQPK
+ RIRRQLEEARKKTSAAPDPQQRLRDIAQEVAGKLNNKPDAAAVLKKLQSDETFVYLAR
+ AVDPAVASAICAKYPEVGAERQDLRQYPGGSLAANVVGGIDWDGHGLLGLEDSLDAVL
+ AGTDGSVTYDRGSDGVVIPGSYRNRHKAVHGSTVVLTLDNDIQFYVQQQVQQAKNLSG
+ AHNVSAVVLDAKTGEVLAMANDNTFDPSQDIGRQGDKQLGNPAVSSPFEPGSVNKIVA
+ ASAVIEHGLSSPDEVLQVPGSIQMGGVTVHDAWEHGVMPYTTTGVFGKSSNVGTLMLS
+ QRVGPERYYDMLRKFGLGQRTGVGLPGESAGLVPPIDQWSGSTFANLPIGQGLSMTLL
+ QMTGMYQAIANDGVRVPPRIIKATVAPDGSRTEEPRPDDIRVVSAQTAQTVRQMLRAV
+ VQRDPMGYQQGTGPTAGVPGYQMAGKTGTAQQINPGCGCYFDDVYWITFAGIATADNP
+ RYVIGIMLDNPARNSDGAPGHSAAPLFHNIAGWLMQRENVPLSPDPGPPLVLQAT"
+ gene complement(2411887..2413041)
+ /locus_tag="BQ2027_MB2188C"
+ CDS complement(2411887..2413041)
+ /locus_tag="BQ2027_MB2188C"
+ /note="Mb2188c, -, len: 384 aa. Equivalent to Rv2164c,
+ len: 384 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 384 aa overlap). Probable pro- rich
+ conserved membrane protein, equivalent to ML0907|AL022602
+ putative conserved membrane protein from Mycobacterium
+ leprae (377 aa) (AL022602), FASTA scores: opt: 1495, E():
+ 1.7e-56, (62.217% identity in 397 aa overlap). Protein
+ product from Mb2188c detected using SWATH mass
+ spectrometry. Mb2188c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED PROLINE RICH MEMBRANE
+ PROTEIN"
+ /protein_id="SIU00796.1"
+ /db_xref="GOA:A0A1R3Y0H5"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0H5"
+ /translation="MRAKREAPKSRSSDRRRRADSPAAATRRTTTNSAPSRRIRSRAG
+ KTSAPGRQARVSRPGPQTSPMLSPFDRPAPAKNTSQAKARAKARKAKAPKLVRPTPME
+ RLAARLTSIDLRPRTLANKVPFVVLVIGSLGVGLGLTLWLSTDAAERSYQLSNARERT
+ RMLQQHKEALERDVREAASAPALAEAARRQGMIPTRDTAHLAQDPDGNWVVVGTPKPA
+ DGVPPPPLNTKLPEDPPPPPKPAAVPLEVPVRVTPGPDDPAPPARSGPEVLVRTPDGT
+ ATLGGATHLPTQAGPQLPGPVPIPGAPGPMPAPPLGAVPSPAPAENPVPLQVGAAPPA
+ GLPGPAPVAATPGLSGGSQPMVAPPAPVPANGEQFGPVTAPVPTAPGAPR"
+ gene complement(2413038..2414228)
+ /gene="rsmH"
+ /locus_tag="BQ2027_MB2189C"
+ CDS complement(2413038..2414228)
+ /gene="rsmH"
+ /locus_tag="BQ2027_MB2189C"
+ /EC_number="2.1.1.199"
+ /note="Mb2189c, -, len: 396 aa. Equivalent to Rv2165c,
+ len: 396 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 396 aa overlap). Conserved
+ hypothetical protein; shows strong similarity to several
+ hypothetical bacterial proteins but has extra 80 aa
+ residues at N-terminus FASTA best: YLXA_BACSU Q07876
+ hypothetical 35.3 kd protein in ftsl (311 aa) opt: 781,
+ E(): 0; (45.6% identity in 296 aa overlap), BELONGS TO THE
+ YABC (E.COLI), YLXA (B.SUBTILIS) FAMILY Protein product
+ from Mb2189c detected using SWATH mass spectrometry.
+ Mb2189c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="16S rRNA (cytosine(1402)-N(4))-methyltransferase
+ (EC"
+ /protein_id="SIU00797.1"
+ /db_xref="GOA:P65430"
+ /db_xref="InterPro:IPR002903"
+ /db_xref="InterPro:IPR023397"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/Swiss-Prot:P65430"
+ /translation="MQTRAPWSLPEATLAYFPNARFVSSDRDLGAGAAPGIAASRSTA
+ CQTWGGITVADPGSGPTGFGHVPVLAQRCFELLTPALTRYYPDGSQAVLLDATIGAGG
+ HAERFLEGLPGLRLIGLDRDPTALDVARSRLVRFADRLTLVHTRYDCLGAALAESGYA
+ AVGSVDGILFDLGVSSMQLDRAERGFAYATDAPLDMRMDPTTPLTAADIVNTYDEAAL
+ ADILRRYGEERFARRIAAGIVRRRAKTPFTSTAELVALLYQAIPAPARRVGGHPAKRT
+ FQALRIAVNDELESLRTAVPAALDALAIGGRIAVLAYQSLEDRIVKRVFAEAVASATP
+ AGLPVELPGHEPRFRSLTHGAERASVAEIERNPRSTPVRLRALQRVEHRAQSQQWATE
+ KGDS"
+ gene complement(2414230..2414661)
+ /gene="mraZ"
+ /locus_tag="BQ2027_MB2190C"
+ CDS complement(2414230..2414661)
+ /gene="mraZ"
+ /locus_tag="BQ2027_MB2190C"
+ /note="Mb2190c, -, len: 143 aa. Equivalent to Rv2166c,
+ len: 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 143 aa overlap). Conserved
+ hypothetical protein; shows strong similarity to several
+ hypothetical bacterial proteins such as YLLB_BACSU P55343.
+ Is equivalent to Mycobacterium leprae hypothetical protein
+ ML0905 (143 aa, 92% identity) MLCB268.11c
+ >sp|O69561|YL66_MYCLE HYPOTHETICAL 16.1 KDA PROTEIN ML0905
+ >gi|3080482|emb|CAA18677.1|(AL022602)
+ >gi|13092975|emb|CAC31286.1|(AL583920). FASTA scores:
+ ML0905|ML0905 conserved hypothetical protein (143 aa) opt:
+ 873, E(): 3.1e-52; 92.254% identity in 142 aa overlap;
+ YLLB_BACSU P55343 hypothetical 16.6 kd protein (143 aa)
+ opt: 340, E(): 3.6e-17; (35.0% identity in 143 aa
+ overlap). BELONGS TO THE YABB (E.COLI), YLLB (B.SUBTILIS),
+ MG221 (M.GENITALIUM) FAMILY Protein product from Mb2190c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2190c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator MraZ"
+ /protein_id="SIU00798.1"
+ /db_xref="GOA:P65437"
+ /db_xref="InterPro:IPR003444"
+ /db_xref="InterPro:IPR007159"
+ /db_xref="InterPro:IPR020603"
+ /db_xref="InterPro:IPR035642"
+ /db_xref="InterPro:IPR035644"
+ /db_xref="InterPro:IPR037914"
+ /db_xref="InterPro:IPR038619"
+ /db_xref="UniProtKB/Swiss-Prot:P65437"
+ /translation="MFLGTYTPKLDDKGRLTLPAKFRDALAGGLMVTKSQDHSLAVYP
+ RAAFEQLARRASKAPRSNPEARAFLRNLAAGTDEQHPDSQGRITLSADHRRYASLSKD
+ CVVIGAVDYLEIWDAQAWQNYQQIHEENFSAASDEALGDIF"
+ gene complement(2415010..2415414)
+ /locus_tag="BQ2027_MB2191C"
+ CDS complement(2415010..2415414)
+ /locus_tag="BQ2027_MB2191C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2191c, -, len: 134 aa. Equivalent to Rv2169c,
+ len: 134 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 134 aa overlap). Probable conserved
+ transmembrane protein, with orthologs in M. leprae, ML0904
+ probable membrane protein (134 aa), and Streptomyces
+ coelicolor. FASTA scores with ML0904, opt: 767, E():
+ 5.1e-43; 86.567% identity in 134 aa overlap.
+ emb|CAA18678.1| (AL022602) >gi|13092974|emb|CAC31285.1|
+ (AL583920). TBparse score is 0.934 Protein product from
+ Mb2191c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2191c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00799.1"
+ /db_xref="GOA:A0A1R3Y0G1"
+ /db_xref="InterPro:IPR021401"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0G1"
+ /translation="MPLSDHEQRMLDQIESALYAEDPKFASSVRGGGFRAPTARRRLQ
+ GAALFIIGLGMLVSGVAFKETMIGSFPILSVFGFVVMFGGVVYAITGPRLSGRMDRGG
+ SAAGASRQRRTKGAGGSFTSRMEDRFRRRFDE"
+ gene 2415680..2416300
+ /locus_tag="BQ2027_MB2192"
+ CDS 2415680..2416300
+ /locus_tag="BQ2027_MB2192"
+ /note="Mb2192, -, len: 206 aa. Equivalent to Rv2170, len:
+ 206 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 206 aa overlap). Conserved
+ hypothetical protein, equivalent to hypothetical protein
+ ML0903 (210 aa) from Mycobacterium leprae. FASTA scores:
+ ML0903 conserved hypothetical protein (210 aa) opt: 1045,
+ E(): 9.1e-57; 77.143% identity in 210 aa overlap.
+ >emb|CAA18679.1| (AL022602) >gi|13092973|emb|CAC31284.1|
+ (AL583920). Protein product from Mb2192 detected using
+ SWATH mass spectrometry. Mb2192 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="gcn5-related n-acetyltransferase"
+ /protein_id="SIU00800.1"
+ /db_xref="GOA:A0A1R3Y0H2"
+ /db_xref="InterPro:IPR000182"
+ /db_xref="InterPro:IPR013653"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0H2"
+ /translation="MAIFLIDLPPSDMERRLGDALTVYVDAMRYPRGTETLRAPMWLE
+ HIRRRGWQAVAAVEVTAAEQAEAADTTALPSAAELSNAPMLGVAYGYPGAPGQWWQQQ
+ VVLGLQRSGFPRLAIARLMTSYFELTELHILPRAQGRGLGEALARRLLAGRDEDNVLL
+ STPETNGEDNRAWRLYRRLGFTDIIRGYHFAGDPRAFAILGRTLPL"
+ gene 2416396..2417079
+ /gene="lppM"
+ /locus_tag="BQ2027_MB2193"
+ CDS 2416396..2417079
+ /gene="lppM"
+ /locus_tag="BQ2027_MB2193"
+ /note="Mb2193, lppM, len: 227 aa. Equivalent to Rv2171,
+ len: 227 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 227 aa overlap). Probable lppM,
+ conserved lipoprotein; contains putative signal peptide
+ and appropriately positioned PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site. Has hydrophobic stretch
+ at C-terminus and also contains PS00225 Crystallins beta
+ and gamma 'Greek key' motif signature. Unknown but
+ equivalent to Mycobacterium leprae lipoprotein ML0902 (239
+ aa). FASTA scores: opt: 1083, E(): 2.4e-56; 75.446%
+ identity in 224 aa overlap (5-227:16-239) >emb|CAA18680.1|
+ (AL022602) >gi|13092972|emb|CAC31283.1| (AL583920).
+ Protein product from Mb2193 detected using shotgun mass
+ spectrometry. Mb2193 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved lipoprotein lppM"
+ /protein_id="SIU00801.1"
+ /db_xref="GOA:A0A1R3Y0D8"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0D8"
+ /translation="MARTRRRGMLAIAMLLMLVPLATGCLRVRASITISPDDLVSGEI
+ IAAAKPKNSKDTGPALDGDVPFSQKVAVSNYDSDGYVGSQAVFSDLTFAELPQLANMN
+ SDAAGVNLSLRRNGNIVILEGRADLTSVSDPDADVELTVAFPAAVTSTNGDRIEPEVV
+ QWKLKPGVVSTMSAQARYTDPNTRSFTGAGIWLGIAAFAAAGVVAVLAWIDRDRSPRL
+ TASGDPPTS"
+ gene complement(2417076..2417981)
+ /locus_tag="BQ2027_MB2194C"
+ CDS complement(2417076..2417981)
+ /locus_tag="BQ2027_MB2194C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2194c, -, len: 301 aa. Equivalent to Rv2172c,
+ len: 301 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 301 aa overlap). Conserved
+ hypothetical protein, equivalent to Mycobacterium leprae
+ conserved hypothetical protein ML0901 (304 aa). FASTA
+ scores: opt: 1656, E(): 7.7e-98; 81.271% identity in 299
+ aa overlap (1-299:1-299)
+ CAA18681.1|AL022602|13092971|CAC31282.1|AL583920. TBparse
+ score is 0.905 Protein product from Mb2194c detected using
+ shotgun mass spectrometry. Mb2194c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00802.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0G5"
+ /translation="MTLNTIALELVPPNLEGGKERAIEDARKVVQYSAASGLDGRIRH
+ VMMPGMIAEDDDRPIPMQPKLDVLDFWSIIKPELAGVHGLCTQVTAFMDEPSLHRRLV
+ DLSDAGMEGIVFVGVPRTMQDGEGSGVAPTDALSLYRQLVANRGVIVIPTRDGEQGRL
+ NFKCSRGATYGMTQLLYSDAIVGFLREFARTTEHRPEILLSFGFVPKVETRIGLINWL
+ IQDPGNAAVADEQAFVQKLAGSEPARRRRLMVDLYKRVLDGVADLGFPLSIHLEATYG
+ VSAAAFETFAEMLAYWSPAEPGKPD"
+ gene 2418292..2419350
+ /gene="idsA2"
+ /locus_tag="BQ2027_MB2195"
+ CDS 2418292..2419350
+ /gene="idsA2"
+ /locus_tag="BQ2027_MB2195"
+ /note="Mb2195, idsA2, len: 352 aa. Equivalent to Rv2173,
+ len: 352 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 352 aa overlap). Probable idsA2,
+ geranylgeranyl pyrophosphate synthase (EC 2.5.1.-),
+ similar to many e.g. Q54193 geranylgeranyl pyrophosphate
+ synthase from Streptomyces griseus (425 aa). Contains
+ PS00723 and PS00444Polyprenyl synthetases signature 1 and
+ 2. FASTA scores: sptr|Q54193|Q54193 GERANYLGERANYL
+ PYROPHOSPHATE SYNTHASE (425 aa) opt: 744, E(): 0; 39.2%
+ identity in 352 aa overlap. Protein product from Mb2195
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2195 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GERANYLGERANYL PYROPHOSPHATE SYNTHETASE
+ IDSA2 (GGPPSASE) (GGPP SYNTHETASE) (GERANYLGERANYL
+ DIPHOSPHATE SYNTHASE)"
+ /protein_id="SIU00803.1"
+ /db_xref="GOA:A0A1R3Y0E9"
+ /db_xref="InterPro:IPR000092"
+ /db_xref="InterPro:IPR008949"
+ /db_xref="InterPro:IPR033749"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0E9"
+ /translation="MAGAITDQLRRYLHGRRRAAAHMGSDYDGLIADLEDFVLGGGKR
+ LRPLFAYWGWHAVASREPDPDVLLLFSALELLHAWALVHDDLIDRSATRRGRPTAQLR
+ YAALHRDRDWRGSPDQFGMSAAILLGDLAQVWADDIVSKVCQSALAPDAQRRVHRVWA
+ DIRNEVLGGQYLDIVAEASAAESIESAMNVATLKTACYTVSRPLQLGTAAAADRSDVA
+ AIFEHFGADLGVAFQLRDDVLGVFGDPAVTGKPSGDDLKSGKRTVLVAEAVELADRSD
+ PLAAKLLRTSIGTRLTDAQVRELRTVIEAVGARAAAESRIAALTQRALATLASAPINA
+ TAKAGLSELAMMAANRSA"
+ gene 2419354..2420904
+ /gene="mpta"
+ /locus_tag="BQ2027_MB2196"
+ CDS 2419354..2420904
+ /gene="mpta"
+ /locus_tag="BQ2027_MB2196"
+ /note="Mb2196, -, len: 516 aa. Equivalent to Rv2174, len:
+ 516 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 516 aa overlap). Possible conserved
+ integral membrane protein, similar to some hypothetical
+ mycobacterial proteins e.g. Mycobacterium leprae ML0899
+ probable integral-membrane protein (505 aa) and MLCL536_26
+ (593 aa). FASTA scores: ML0899 opt: 2715; 78.884% identity
+ in 502 aa overlap and gp|Z99125|MLCL536_26 Mycobacterium
+ leprae cosmid L536. (593 aa) opt: 552, E(): 7.1e-30; 31.6%
+ identity in 513 aa overlap. Also similar to Rv1459c.
+ Mb2196 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="alpha(1->6)mannosyltransferase. possible
+ conserved integral membrane protein."
+ /protein_id="SIU00804.1"
+ /db_xref="GOA:A0A1R3Y2J0"
+ /db_xref="InterPro:IPR017822"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2J0"
+ /translation="MTTPSHAPAVDLATAKDAVVQHLSRLFEFTTGPQGGPARLGFAG
+ AVLITAGGLGAGSVRQHDPLLESIHMSWLRFGHGLVLSSILLWTGVGVMLLAWLGLGR
+ RVLAGEATEFTMRATTVIWLAPLLLSVPVFSRDTYSYLAQGALLRDGLDPYAVGPVGN
+ PNALLDDVSPIWTITTAPYGPAFILVAKFVTVIVGNNVVAGTMLLRLCMLPGLALLVW
+ ATPRLASHLGTHGPTALWICVLNPLVLIHLMGGVHNEMLMVGLMTAGIALTVQGRNVA
+ GIILITVAIAVKATAGIALPFLVWVWLRHLRERRGYRPVQAFLAAAAISLLIFVAVFA
+ VLSAVAGVGLGWLTALAGSVKIINWLTVPTGAANVIHALGRGLFTVDFYTLLRITRLI
+ GIVIIAVSLPLLWWRFRRDDRAALTGVAWSMLIVVLFVPAALPWYYSWPLAVAAPLAQ
+ SRRAIAAIAGLSTWVMVIFKPDGSHGMYSWLHFWIATACALTAWYVLYRSPDRRGVQA
+ ATPVVNTP"
+ gene complement(2420891..2421331)
+ /locus_tag="BQ2027_MB2197C"
+ CDS complement(2420891..2421331)
+ /locus_tag="BQ2027_MB2197C"
+ /note="Mb2197c, -, len: 146 aa. Equivalent to Rv2175c,
+ len: 146 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 146 aa overlap). Conserved hypothetical
+ protein, possibly involved in regulation. Contains
+ possible helix-turn-helix domain at aa 31-52 (Score 1042,
+ +2.74 SD). Equivalent to Mycobacterium leprae ML0898
+ putative DNA-binding protein (134 aa). FASTA scores: opt:
+ 747; 82.090% identity in 134 aa overlap (AL022602)
+ >gi|13092969|emb|CAC31279.1| (AL583920) Protein product
+ from Mb2197c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb2197c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved regulatory protein"
+ /protein_id="SIU00805.1"
+ /db_xref="InterPro:IPR041098"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y164"
+ /translation="MPGRAPGSTLARVGSILAGDDVLDPDEPTYDLPRVAELLGVPVS
+ KVAQQLREGHLVAVRRAGGVVIPQVFFTNSGQVVKSLPGLLTILHDGGYRDTEIMRWL
+ FTPDPSLTITRDGSRDAVSNARPVDALHAHQAREVVRRAQAMAY"
+ gene 2421386..2422585
+ /gene="pknL"
+ /locus_tag="BQ2027_MB2198"
+ CDS 2421386..2422585
+ /gene="pknL"
+ /locus_tag="BQ2027_MB2198"
+ /note="Mb2198, pknL, len: 399 aa. Equivalent to Rv2176,
+ len: 399 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 399 aa overlap). Probable pknL,
+ transmembrane serine/threonine-protein kinase (EC 2.7.1.-)
+ (see citation below), similar to many e.g. MLCB1770_9 (622
+ aa). Lacks C-terminal domain and ends with putative
+ transmembrane segment. Contains PS00108 Serine/Threonine
+ protein kinases active-site signature. FASTA scores:
+ Z70722|MLC B1770_9 Mycobacterium leprae cosmid B1770 (622
+ aa) opt: 732, E(): 5.9e-23; 44.4% identity in 266 aa
+ overlap. Also similar to several Mycobacterium
+ tuberculosis STPK proteins e.g. Rv0014c|PKNB,
+ Rv0015c|PKNA, Rv1743|PKNE, Rv1266c|PKNH etc. Contains
+ Hank's kinase subdomain. BELONGS TO THE SER/THR FAMILY OF
+ PROTEIN KINASES. Protein product from Mb2198 detected
+ using SWATH mass spectrometry. Mb2198 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSMEMBRANE SERINE/THREONINE-PROTEIN
+ KINASE L PKNL (PROTEIN KINASE L) (STPK L)"
+ /protein_id="SIU00806.1"
+ /db_xref="GOA:Q7TYY6"
+ /db_xref="InterPro:IPR000719"
+ /db_xref="InterPro:IPR008271"
+ /db_xref="InterPro:IPR011009"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYY6"
+ /translation="MVEAGTRDPLESALLDSRYLVQAKIASGGTSTVYRGLDVRLDRP
+ VALKVMDARYAGDEQFLTRFRLEARAVARLNNRALVAVYDQGKDGRHPFLVMELIEGG
+ TLRELLIERGPMPPHAVVAVLRPVLGGLAAAHRAGLVHRDVKPENILISDDGDVKLAD
+ FGLVRAVAAASITSTGVILGTAAYLSPEQVRDGNADPRSDVYSVGVLVYELLTGHTPF
+ TGDSALSIAYQRLDADVPRASAVIDGVPPQFDELVACATARNPADRYADAIAMGADLE
+ AIAEELALPEFRVPAPRNSAQHRSAALYRSRITQQGQLGAKPVHHPTRQLTRQPGDCS
+ EPASGSEPEHEPITGQFAGIAIEEFIWARQHARRMVLVWVSVVLAITGLVASAAWTIG
+ SNLSGLL"
+ gene complement(2422590..2423393)
+ /locus_tag="BQ2027_IS1558'-1"
+ mobile_element complement(2422590..2423393)
+ /locus_tag="BQ2027_IS1558'-1"
+ /note="IS1558'-1, len: 804 nt. Equivalent to IS1558', len:
+ 804 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(99.9% identity in 804 nt overlap). Nearly identical
+ to complement of region 24105 24908 in EM_BA:MTCY428
+ Z81451 Mycobacterium tuberculosis cosmid Y428."
+ /mobile_element_type="insertion sequence:IS1558"
+ gene complement(2422727..2423392)
+ /locus_tag="BQ2027_MB2199C"
+ CDS complement(2422727..2423392)
+ /locus_tag="BQ2027_MB2199C"
+ /note="Mb2199c, -, len: 221 aa. Equivalent to Rv2177c,
+ len: 221 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 221 aa overlap). Possible IS1558
+ transposase (see citation below), similar to several IS
+ element proteins and transposases but nearly identical to
+ last 221 residues of MTCY428_23 (333 aa). FASTA scores:
+ Z81451|MTCY428_23 Mycobacterium tuberculosis cosmid (333
+ aa) opt: 1491, E() : 0; 98.6% identity in 221 aa overlap.
+ Mb2199c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE TRANSPOSASE"
+ /protein_id="SIU00807.1"
+ /db_xref="GOA:A0A1R3Y0U4"
+ /db_xref="InterPro:IPR003346"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0U4"
+ /translation="MRSKIPDLQRALEGRFDDHHALMCRLHLAHLDQLDAMIGALDEQ
+ IEQLMHPFCARRELIASIPGIGVGASATVISEIGADPAAWFPSAEHLASWVRLCPGNH
+ ESAGKRHHGARRKGNQHLQPVLVECAWAAVRTDGYLREYYRRQVRKFGGFRSPAANKK
+ AIIAVAHKLIVIIWHVLATGRPYQDLGADYFTTRMDPDKERRRLVAKLEAQGLGVTLE
+ PAA"
+ gene complement(2423777..2425165)
+ /gene="aroG"
+ /locus_tag="BQ2027_MB2200C"
+ CDS complement(2423777..2425165)
+ /gene="aroG"
+ /locus_tag="BQ2027_MB2200C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2200c, aroG, len: 462 aa. Equivalent to Rv2178c,
+ len: 462 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 462 aa overlap). Probable aroG,
+ 3-deoxy-D-arabino-heptulosonate 7-phosphate synthase
+ similar to many, especially those from plants. FASTA
+ scores: Y15113|M C3DDAH7P_1Morinda citrifolia mRNA for
+ 3-deoxy-D-arabino-heptulosonate 7-phosphate synthase (535
+ aa) opt: 1421, E(): 0; 48.3% identity in 443 aa overlap.
+ Protein product from Mb2200c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2200c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="3-deoxy-d-arabino-heptulosonate 7-phosphate
+ synthase arog (dahp synthetase,
+ phenylalanine-repressible)"
+ /protein_id="SIU00808.1"
+ /db_xref="GOA:A0A1R3Y0C5"
+ /db_xref="InterPro:IPR002480"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0C5"
+ /translation="MNWTVDIPIDQLPSLPPLPTDLRTRLDAALAKPAAQQPTWPADQ
+ ALAMRTVLESVPPVTVPSEIVRLQEQLAQVAKGEAFLLQGGDCAETFMDNTEPHIRGN
+ VRALLQMAVVLTYGASMPVVKVARIAGQYAKPRSADIDALGLRSYRGDMINGFAPDAA
+ AREHDPSRLVRAYANASAAMNLVRALTSSGLASLHLVHDWNREFVRTSPAGARYEALA
+ TEIDRGLRFMSACGVADRNLQTAEIYASHEALVLDYERAMLRLSDGEDGEPQLFDLSA
+ HTVWIGERTRQIDGAHIAFAQVIANPVGVKLGPNMTPELAVEYVERLDPHNKPGRLTL
+ VSRMGNHKVRDLLPPIVEKVQATGHQVIWQCDPMHGNTHESSTGFKTRHFDRIVDEVQ
+ GFFEVHRALGTHPGGIHVEITGENVTECLGGAQDISETDLAGRYETACDPRLNTQQSL
+ ELAFLVAEMLRD"
+ gene complement(2425256..2425762)
+ /locus_tag="BQ2027_MB2201C"
+ CDS complement(2425256..2425762)
+ /locus_tag="BQ2027_MB2201C"
+ /EC_number="3.1.13.-"
+ /note="Mb2201c, -, len: 168 aa. Equivalent to Rv2179c,
+ len: 168 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 168 aa overlap). Conserved
+ hypothetical protein, equivalent to conserved hypothetical
+ protein from Mycobacterium leprae ML0895 conserved
+ hypothetical protein (171 aa). FASTA scores: opt: 977,
+ E(): 1.4e-58; 82.530% identity in 166 aa overlap
+ (AL022602). Protein product from Mb2201c detected using
+ shotgun mass spectrometry. Mb2201c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="3'-5' exoribonuclease Rv2179c (EC"
+ /protein_id="SIU00809.1"
+ /db_xref="GOA:A0A1R3Y0H1"
+ /db_xref="InterPro:IPR012337"
+ /db_xref="InterPro:IPR030853"
+ /db_xref="InterPro:IPR033390"
+ /db_xref="InterPro:IPR036397"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0H1"
+ /translation="MRYFYDTEFIEDGHTIELISIGVVAEDGREYYAVSTEFDPERAG
+ SWVRTHVLPKLPPPASQLWRSRQQIRLDLEEFLRIDGTDSIELWAWVGAYDHVALCQL
+ WGPMTALPPTVPRFTRELRQLWEDRGCPRMPPRPRDVHDALVDARDQLRRFRLITSTD
+ DAGRGAAR"
+ gene complement(2425772..2426659)
+ /locus_tag="BQ2027_MB2202C"
+ CDS complement(2425772..2426659)
+ /locus_tag="BQ2027_MB2202C"
+ /note="Mb2202c, -, len: 295 aa. Equivalent to Rv2180c,
+ len: 295 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 295 aa overlap). Probable conserved
+ integral membrane protein, similar to pir||T35292 probable
+ integral membrane protein from Streptomyces coelicolor
+ >gi|5578858|emb|CAB51260.1| (AL096872) (246 aa) (36%
+ identity in 249 aa overlap). Mb2202c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved integral membrane protein"
+ /protein_id="SIU00810.1"
+ /db_xref="GOA:A0A1R3Y0H9"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0H9"
+ /translation="MEVFHWLQHDIVDRGRLPLLCCLVAFVLTFLVTRSFVRFIHRRA
+ ADGRPARWWQPRNVHIGSVHIHHVAFGVVLVMISGLTLVTLSVDGREPEFTIAASIFG
+ VGAALVLDEYALILHLSDVYWEEDGRTSVDAVFAAVAVAGLLIMGLHPLIFFLTVRQG
+ ANWVVLQTTLIAGLVLTLPLAVVVLLKGKVWTGLLGMFVVVLLVVGAVRLSRPHAPWA
+ RWRYTRHPEKMRRALQRERTWRRPVVRIKLWLQYVIAGTPRMPDERAVDAQLDQDVRP
+ APPPERTAPILISGSVWSD"
+ gene 2426747..2428030
+ /locus_tag="BQ2027_MB2203"
+ CDS 2426747..2428030
+ /locus_tag="BQ2027_MB2203"
+ /note="Mb2203, -, len: 427 aa. Equivalent to Rv2181, len:
+ 427 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 427 aa overlap). Probable conserved
+ integral membrane protein, similar to others in
+ Mycobacterium tuberculosis e.g. Rv1159 (MTCI65.26, 431
+ aa). Start uncertain. FASTA scores: Z95584|MTCI65_26 (431
+ aa) opt: 428, E(): 8e-22; 31.2% identity in 407 aa
+ overlap. Protein product from Mb2203 detected using SWATH
+ mass spectrometry. Mb2203 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="alpha(1->2)mannosyltransferase"
+ /protein_id="SIU00811.1"
+ /db_xref="GOA:A0A1R3Y0E6"
+ /db_xref="InterPro:IPR018584"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0E6"
+ /translation="MSAWRAPEVGSRLGRRVLWCLLWLLAGVALGYVAWRLFGHTPYR
+ IDIDIYQMGARAWLDGRPLYGGGVLFHTPIGLNLPFTYPPLAAVLFSPFAWLQMPAAS
+ VAITVLTLVLLIASTAIVLTGLDAWPTSRLVPAPARLRRLWLAVLIVAPATIWLEPIS
+ SNFAFGQINVVLMTLVIVDCFPRRTPWPRGLMLGLGIALKLTPAVFLLYFLLRRDGRA
+ ALTALASFAVATLLGFVLAWRDSWEYWTHTLHHTDRIGAAALNTDQNIAGALARLTIG
+ DDERFALWVAGSLLVLAATIWAMRRVLRAGEPTLAVICVALFGLVVSPVSWSHHWVWM
+ LPAVLVIGLLGWRRRNVALAMLSLAGVVLMRWTPIDLLPQHRETTAVWWRQLAGMSYV
+ WWALAVIVVAGLTVTARMTPQRSLTRGLTPAPTAS"
+ gene complement(2428031..2428774)
+ /locus_tag="BQ2027_MB2204C"
+ CDS complement(2428031..2428774)
+ /locus_tag="BQ2027_MB2204C"
+ /note="Mb2204c, -, len: 247 aa. Equivalent to Rv2182c,
+ len: 247 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 247 aa overlap). Probable
+ 1-acylglycerol-3-phosphate O-acyltransferase, similar to
+ many e.g. in Streptomyces. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). FASTA scores:
+ pir||T35503 1-acylglycerol-3-phosphate O-acyltransferase
+ (EC 2.3.1.51) homolog SC6E10.16c - Streptomyces coelicolor
+ >gi|5689932|emb|CAB51970.1| (AL109661) hypothetical
+ protein [Streptomyces coelicolor A3(2)] Length = 262,
+ Expect = 6e-61 (54% identity in 215 aa overlap). Protein
+ product from Mb2204c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2204c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="1-acylglycerol-3-phosphate O-acyltransferase"
+ /protein_id="SIU00812.1"
+ /db_xref="GOA:A0A1R3Y0H6"
+ /db_xref="InterPro:IPR002123"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0H6"
+ /translation="MWYYLFKYIFMGPLFTLLGRPKVEGLEYIPSSGPAILASNHLAV
+ ADSFYLPLVVRRRIWFLAKSEYFTGTGLKGWINRWFYSVSGQVPIDRTNADSAQGALQ
+ TAVVLLGQGKLLGMYPEGTRSPDGRLYKGKTGLARLALHTGVPVIPVAMIGTNVVNPP
+ GRKMLRFGRVTVRFGKPMDFSRFEGLAGNHFIERAVTDEVIYELMGLSGQEYVDIYAA
+ SVKDGRNAGGAGANPNSTDAARIPETAAG"
+ gene complement(2428860..2429255)
+ /locus_tag="BQ2027_MB2205C"
+ CDS complement(2428860..2429255)
+ /locus_tag="BQ2027_MB2205C"
+ /note="Mb2205c, -, len: 131 aa. Equivalent to Rv2183c,
+ len: 131 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 131 aa overlap). Conserved
+ hypothetical protein, equivalent to Mycobacterium leprae
+ hypothetical protein ML0891 (MLCB268.25c, 130 aa). FASTA
+ scores: opt: 558, E(): 8.3e-28; 61.832% identity in 131 aa
+ overlap >gi|13092963|emb|CAC31272.1| (AL583920)
+ (AL022602). Protein product from Mb2205c detected using
+ SWATH mass spectrometry. Mb2205c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="link to cyclase activity"
+ /protein_id="SIU00813.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0F8"
+ /translation="MSGAHTDVRPELRKLAQAILDGIDPAVRVAAAMASGGGPGTGKC
+ QQVWCPLCALAALVTGEQHPLLTVIADHSLALLEVIRAIVDDIDRSAKPPPEGPPGGG
+ QTGASGGENTNGEGSMKSHYQAIPVTIEE"
+ gene complement(2429252..2430391)
+ /locus_tag="BQ2027_MB2206C"
+ CDS complement(2429252..2430391)
+ /locus_tag="BQ2027_MB2206C"
+ /note="Mb2206c, -, len: 379 aa. Equivalent to Rv2184c,
+ len: 379 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 379 aa overlap). Conserved
+ hypothetical protein, equivalent to hypothetical protein
+ ML0890 (415 aa) from Mycobacterium leprae and also shows
+ some similarity to other hypothetical proteins. FASTA
+ scores: ML0890 opt: 1949; 79.630% identity in 378 aa
+ overlap >emb|CAA18692.1| (AL022602)
+ >gi|13092962|emb|CAC31271.1| (AL583920) and
+ sptr|Q55794|Q55794 HYPOTHETICAL 44.6 KD PROTEIN. (396 aa)
+ opt: 251, E(): 3.3e-09; 25.5% identity in 384 aa overlap.
+ Protein product from Mb2206c detected using SWATH mass
+ spectrometry. Mb2206c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="anion-transporting ATPase"
+ /protein_id="SIU00814.1"
+ /db_xref="GOA:A0A1R3Y2K1"
+ /db_xref="InterPro:IPR008978"
+ /db_xref="InterPro:IPR016300"
+ /db_xref="InterPro:IPR025723"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR040612"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2K1"
+ /translation="MVVSTDQAHSLGDVLGIAVPPTGQGDPVRVLAYDPEAGGGFLDA
+ LALDTLALLEGRWLHVVETLDRRFPGSELSSIAPEELCALPGIQEVLGLHAVGELAAA
+ RRWDRIVVDCASTADALRMLTLPATFGLYVERAWPRHRRLSIGADDGRSAVLAELLER
+ IRASVERLSTLLTDGALVSAHLVLTPERVVAAEAVRTLGSLALMGVRVEELLVNQLLV
+ QDENYEYRSLPDHPAFHWYAERIGEQRAVLDDLDATIGDVALVLVPHLAGEPIGPKAL
+ GGLLDSARRRQGSAPPGPLQPIVDLESGSGLASIYRLRLALPQLDPGTLTLGRADDDL
+ IVSAGGMRRRVRLASVLRRCTVLDAHLRGGELTVRFRPNPEVWPT"
+ gene complement(2430511..2430945)
+ /gene="TB16.3"
+ /locus_tag="BQ2027_MB2207C"
+ CDS complement(2430511..2430945)
+ /gene="TB16.3"
+ /locus_tag="BQ2027_MB2207C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2207c, TB16.3, len: 144 aa. Equivalent to
+ Rv2185c, len: 144 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 144 aa overlap). TB16.3,
+ conserved hypothetical protein, similar to other
+ hypothetical actinomycete proteins and equivalent to
+ Mycobacterium leprae ML0889 (144 aa). Some similarity to
+ Mycobacterium tuberculosis Rv0854, Rv0856, Rv0857, Rv0164
+ and other Mycobacterium leprae proteins. FASTA scores :
+ ML0889 opt: 811; 85.417% identity in 144 aa overlap
+ (AL022602). Protein product from Mb2207c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2207c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Cyclase/Dehydrase"
+ /protein_id="SIU00815.1"
+ /db_xref="InterPro:IPR019587"
+ /db_xref="InterPro:IPR023393"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y175"
+ /translation="MADKTTQTIYIDADPGEVMKAIADIEAYPQWISEYKEVEILEAD
+ DEGYPKRARMLMDAAIFKDTLIMSYEWPEDRQSLSWTLESSSLLKSLEGTYRLAPKGS
+ GTEVTYELAVDLAVPMIGMLKRKAERRLIDGALKDLKKRVEG"
+ gene complement(2431050..2431439)
+ /locus_tag="BQ2027_MB2208C"
+ CDS complement(2431050..2431439)
+ /locus_tag="BQ2027_MB2208C"
+ /note="Mb2208c, -, len: 129 aa. Equivalent to Rv2186c,
+ len: 129 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 129 aa overlap). Conserved
+ hypothetical protein, equivalent to hypothetical
+ Mycobacterium leprae protein ML0888 (135 aa). FASTA
+ scores: ML0888 opt: 704, E(): 2.9e-43; 80.000% identity in
+ 130 aa overlap CAA18694.1| (AL022602). Protein product
+ from Mb2208c detected using shotgun mass spectrometry.
+ Mb2208c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="link to cyclase activity"
+ /protein_id="SIU00816.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0J5"
+ /translation="MNSIQIADETYVAADAARVSAAVADRCSWRRWWPDLRLQVTEDR
+ ADKGIRWTVTGALTGTMEIWLEPSMDGVLLHYFLHAEPTGVAAWQLARMNLARMTHHR
+ RVAGKKMAFEVKTVLERSRPIGVSPVT"
+ gene 2431605..2432117
+ /locus_tag="BQ2027_FADD15"
+ CDS 2431605..2432117
+ /locus_tag="BQ2027_FADD15"
+ /note="Mb2209, -, len: 170 aa. Equivalent to 5' end of
+ Rv2187, len: 600 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 90 aa overlap). Probable
+ fadD15, long-chain-fatty-acid-CoA ligase (EC 6.2.1.3),
+ similar to several e.g. P44446|LCFH_HAEIN PUTATIVE
+ LONG-CHAIN-FATTY-ACID--CoA LIGASE from Haemophilus
+ influenzae (607 aa), FASTA scores: (607 aa) opt: 992, E():
+ 0, (31.5% identity in 578 aa overlap); etc. Contains
+ PS00455 Putative AMP-binding domain signature. BELONGS TO
+ THE ATP-DEPENDENT AMP-BINDING ENZYME FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, fadD15 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to single base
+ deletion (t-*) splits fadD15 into 2 parts, Mb2209 and
+ fadD15."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00817.1"
+ /db_xref="GOA:A0A1R3Y0V3"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0V3"
+ /translation="MREISVPAPFTVGEHDNVAAMVFEHERDDPDYVIYQRLIDGVWT
+ DVTCAEAANQIRAAALGLISLGVQAGDRVVIFSATRYEWAILDFAIRLWVRSPYRSTR
+ PRQRSRCAGFYKTPKRWCCSPKPTHTRQWSPNSPAACPPCGRYCRSPVRVPTRSIGSR
+ RRAPRSTRPS"
+ gene 2432204..2433406
+ /gene="fadD15"
+ /locus_tag="BQ2027_MB2210"
+ CDS 2432204..2433406
+ /gene="fadD15"
+ /locus_tag="BQ2027_MB2210"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2210, fadD15, len: 508 aa. Equivalent to 3' end
+ of Rv2187, len: 600 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.6% identity in 508 aa overlap). Probable
+ fadD15, long-chain-fatty-acid-CoA ligase (EC 6.2.1.3),
+ similar to several e.g. P44446|LCFH_HAEIN PUTATIVE
+ LONG-CHAIN-FATTY-ACID--CoA LIGASE from Haemophilus
+ influenzae (607 aa), FASTA scores: (607 aa) opt: 992, E():
+ 0, (31.5% identity in 578 aa overlap); etc. Contains
+ PS00455 Putative AMP-binding domain signature. BELONGS TO
+ THE ATP-DEPENDENT AMP-BINDING ENZYME FAMILY. TBparse score
+ is 0.902. REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ bovis, a frameshift due to single base deletion (t-*)
+ leads to a shorter product with a different NH2 part
+ compared to its homolog in Mycobacterium tuberculosis
+ strain H37Rv. Protein product from Mb2210 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2210 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable long-chain-fatty-acid-CoA ligase fadD15
+ (FATTY-ACID-CoA SYNTHETASE) (FATTY-ACID-CoA SYNTHASE)"
+ /protein_id="SIU00818.1"
+ /db_xref="GOA:Q7TYX8"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYX8"
+ /translation="MTQSNLVHEIKGARAYHPTLLRKGERLLVFLPLAHVLARAISMA
+ AFHSKVTVGFTSDIKNLLPMLAVFKPTVVVSVPRVFEKVYNTAEQNAANAGKGRIFAI
+ AAQTAVDWSEACDRGGPGLLLRAKHAVFDRLVYRKLRAALGGNCRAAVSGGAPLGARL
+ GHFYRGAGLTIYEGYGLSETSGGVAISQFNDLKIGTVGKPVPGNSLRIADDGELLVRG
+ GVVFSGYWRNEQATTEAFTDGWFKTGDLGAVDEDGFLTITGRKKEIIVTAGGKNVAPA
+ VLEDQLRAHPLISQAVVVGDAKPFIGALITIDPEAFEGWKQRNSKTAGASVGDLATDP
+ DLIAEIDAAVKQANLAVSHAESIRKFRILPVDFTEDTGELTPTMKVKRKVVAEKFASD
+ IEAIYNKE"
+ gene complement(2433437..2434594)
+ /gene="pimb"
+ /locus_tag="BQ2027_MB2211C"
+ CDS complement(2433437..2434594)
+ /gene="pimb"
+ /locus_tag="BQ2027_MB2211C"
+ /note="Mb2211c, -, len: 385 aa. Equivalent to Rv2188c,
+ len: 385 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 385 aa overlap). Conserved
+ hypothetical protein, possibly glycosyl transferase
+ similar to several putative glycosyl transferases and
+ hypothetical proteins e.g. P73369. Equivalent to
+ Mycobacterium leprae ML0886 putative glycosyl transferase
+ (384 aa). FASTA scores: ML0886 (CAA18697.1| (AL022602))
+ opt: 2113, E(): 1.8e-106; 81.462% identity in 383 aa
+ overlap; sptr|P73369|P73369 HYPOTHETICAL 46.2 KD PROTEIN
+ (404 aa) opt: 379, E(): 2.2e-18; 27.5% identity in 397 aa
+ overlap. Start changed since first submission, now 14 aa
+ shorter. Protein product from Mb2211c detected using SWATH
+ mass spectrometry. Mb2211c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="mannosyltransferase pimb"
+ /protein_id="SIU00819.1"
+ /db_xref="GOA:A0A1R3Y0H8"
+ /db_xref="InterPro:IPR001296"
+ /db_xref="InterPro:IPR028098"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0H8"
+ /translation="MSRVLLVTNDFPPRRGGIQSYLGEFVGRLVGSRAHAMTVYAPQW
+ KGADAFDDAARAAGYRVVRHPSTVMLPGPTVDVRMRRLIAEHDIETVWFGAAAPLALL
+ APRARLAGASRVLASTHGHEVGWSMLPVARSVLRRIGDGTDVVTFVSSYTRSRFASAF
+ GPAASLEYLPPGVDTDRFRPDPAARAELRKRYRLGERPTVVCLSRLVPRKGQDTLVTA
+ LPSIRRRVDGAALVIVGGGPYLETLRKLAHDCGVADHVTFTGGVATDELPAHHALADV
+ FAMPCRTRGAGMDVEGLGIVFLEASAAGVPVIAGNSGGAPETVQHNKTGLVVDGRSVD
+ RVADAVAELLIDRDRAVAMGAAGREWVTAQWRWDTLAAKLADFLRGDDAAR"
+ gene complement(2434691..2435464)
+ /locus_tag="BQ2027_MB2212C"
+ CDS complement(2434691..2435464)
+ /locus_tag="BQ2027_MB2212C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2212c, -, len: 257 aa. Equivalent to Rv2189c,
+ len: 257 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 257 aa overlap). Conserved
+ hypothetical protein; some similarity to hypothetical
+ protein SC6G10.07c (385 aa) from Streptomyces coelicolor
+ A3(2). Smith-Waterman scores: pir||T35516 hypothetical
+ protein SC6G10.07c -Streptomyces coelicolor
+ >gi|4539203|emb|CAB39861.1| (AL049497) Expect = 2e-08; 30%
+ identity in 245 aa overlap. TBparse score is 0.908,Mb2212c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00820.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0J0"
+ /translation="MRDGPAAPAQVVAPADGFVALRVADDRTVRLLSLGGAATDRLLS
+ RIAAGIDAAVDEVVAFWGTDWSHDIFVVAAGSDEQFHAAAGGGLASQWADIAAITVVD
+ RVDPARRTVVGQRIVFAPGAAHMSPAALRIVLGHELFHYAARADTALDAPRWLAEGVA
+ DFVARPKTPPPADAVSVALSLPSDTDLDTPGPQRSLAYDRAWWFARFVAAAYGTAKLR
+ ELYLATCGVGHFDLATAAHDVLGIDAAGLLARWQRWLMG"
+ gene complement(2435559..2436716)
+ /locus_tag="BQ2027_MB2213C"
+ CDS complement(2435559..2436716)
+ /locus_tag="BQ2027_MB2213C"
+ /note="Mb2213c, -, len: 385 aa. Equivalent to Rv2190c,
+ len: 385 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 385 aa overlap). Conserved
+ hypothetical protein; similar to other hypothetical
+ mycobacterial proteins, including Rv1477, Rv1478, Rv1566c,
+ Rv0024, that are similar to protein p60 precursors from
+ Listeria eg Q018 38|P60_LISSE protein p60 precursor
+ (invasion-associated protein) (524 aa). FASTA scores:
+ gp|Z80233|MTCY10H4_25 (281 a a) opt: 290, E(): 6.9e-05;
+ 37.0% identity in 127 aa overlap and sp|Q01838|P60_LISSE
+ PROTEIN P60 PRECURSOR (523 aa) opt: 268, E(): 0.00071;
+ 38.5% identity in 104 aa overlap. Protein product from
+ Mb2213c detected using SWATH mass spectrometry. Mb2213c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Cell wall-associated hydrolases
+ (invasion-associated proteins)"
+ /protein_id="SIU00821.1"
+ /db_xref="GOA:P67474"
+ /db_xref="InterPro:IPR000064"
+ /db_xref="InterPro:IPR038765"
+ /db_xref="UniProtKB/Swiss-Prot:P67474"
+ /translation="MRLDQRWLIARVIMRSAIGFFASFTVSSGVLAANVLADPADDAL
+ AKLNELSRQAEQTTEALHSAQLDLNEKLAAQRAADQKLADNRTALDAARARLATFQTA
+ VNKVAAATYMGGRTHGMDAILTAESPQLLIDRLSVQRVMAHQMSTQMARFKAAGEQAV
+ KAEQAAAKSAADARSAAEQAAAVRANLQHKQSQLQVQIAVVKSQYVALTPEERTALAD
+ PGPVPAVAAIAPGAPPAALPPGAPPGDGPAPGVAPPPGGMPGLPFVQPDGAGGDRTAV
+ VQAALTQVGAPYAWGGAAPGGFDCSGLVMWAFQQAGIALPHSSQALAHGGQPVALSDL
+ QPGDVLTFYSDASHAGIYIGDGLMVHSSTYGVPVRVVPMDSSGPIYDARRY"
+ gene 2437263..2439200
+ /locus_tag="BQ2027_MB2214"
+ CDS 2437263..2439200
+ /locus_tag="BQ2027_MB2214"
+ /note="Mb2214, -, len: 645 aa. Equivalent to Rv2191, len:
+ 645 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 645 aa overlap). Conserved hypothetical
+ protein, similar to SW:DP3A_B ACSU P13267 DNA polymerase
+ III, alpha chain (31.3% identity in 249 aa overlap) and
+ SW:UVRC_ECOLI P07028 excinuclease ABC subunit C (25.7%
+ identity in 230 aa overlap). Also similar to M.
+ tuberculosis Rv3711c (dnaQ DNA polymerase III e chain) and
+ Rv1420 (uvrC excinuclease ABC subunit C),Mb2214 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA polymerase III epsilon subunit-related
+ protein MSMEG4261"
+ /protein_id="SIU00822.1"
+ /db_xref="GOA:A0A1R3Y0I7"
+ /db_xref="InterPro:IPR000305"
+ /db_xref="InterPro:IPR006054"
+ /db_xref="InterPro:IPR012337"
+ /db_xref="InterPro:IPR013520"
+ /db_xref="InterPro:IPR035901"
+ /db_xref="InterPro:IPR036397"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0I7"
+ /translation="MQGPNVAAMGATGGTQLSFADLAHAQGAAWTPADEMSLRETTFV
+ VVDLETTGGRTTGNDATPPDAITEIGAVKVCGGAVLGEFATLVNPQHSIPPQIVRLTG
+ ITTAMVGNAPTIDAVLPMFFEFAGDSVLVAHNAGFDIGFLRAAARRCDITWPQPQVLC
+ TMRLARRVLSRDEAPSVRLAALARLFAVASNPTHRALDDARATVDVLHALIERVGNQG
+ VHTYAELRSYLPNVTQAQRCKRVLAETLPHRPGVYLFRGPSGEVLYVGTAADLRRRVS
+ QYFNGTDRRKRMTEMVMLASSIDHVECAHPLEAGVRELRMLSTHAPPYNRRSKFPYRW
+ WWVALTDEAFPRLSVIRAPRHDRVVGPFRSRSKAAETTALLARCTGLRTCTTRLTRSA
+ RHGPACPELEVSACPAARDVTAAQYAEAVLRAAALIGGLDNAALAAAVQQVTELAERR
+ RYESAARLRDHLATAIEALWHGQRLRALAALPELIAAKPDGPREGGYQLAVIRHGQLA
+ AAGRAPRGVPPMPVVDAIRRGAQAILPTPAPLGGALVEEIALIARWLAEPGVRIVGVS
+ NDAAGLASPVRSAGPWAAWAATARSAQLAGEQLSRGWQSDLPTEPHPSREQLFGRTGV
+ DCRTGPPQPLLPGRQPFSTAG"
+ gene complement(2439075..2440187)
+ /gene="trpD"
+ /locus_tag="BQ2027_MB2215C"
+ CDS complement(2439075..2440187)
+ /gene="trpD"
+ /locus_tag="BQ2027_MB2215C"
+ /note="Mb2215c, trpD, len: 370 aa. Equivalent to Rv2192c,
+ len: 370 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 370 aa overlap). Probable trpD,
+ anthranilate phosphoribosyltransferase (EC 2.4.2.18) (see
+ citation below), similar to e.g. TRPD_LACCA|P17170, (43.2%
+ identity in 308 aa overlap). Initiation codon uncertain,
+ gtg at 4086 in MTCY190 favoured by homology but this has
+ no clear ribosome binding site. Protein product from
+ Mb2215c detected using SWATH mass spectrometry. Mb2215c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable anthranilate phosphoribosyltransferase
+ TrpD"
+ /protein_id="SIU00823.1"
+ /db_xref="GOA:P66993"
+ /db_xref="InterPro:IPR000312"
+ /db_xref="InterPro:IPR005940"
+ /db_xref="InterPro:IPR017459"
+ /db_xref="InterPro:IPR035902"
+ /db_xref="InterPro:IPR036320"
+ /db_xref="UniProtKB/Swiss-Prot:P66993"
+ /translation="MALSAEGSSGGSRGGSPKAEAASVPSWPQILGRLTDNRDLARGQ
+ AAWAMDQIMTGNARPAQIAAFAVAMTMKAPTADEVGELAGVMLSHAHPLPADTVPDDA
+ VDVVGTGGDGVNTVNLSTMAAIVVAAAGVPVVKHGNRAASSLSGGADTLEALGVRIDL
+ GPDLVARSLAEVGIGFCFAPRFHPSYRHAAAVRREIGVPTVFNLLGPLTNPARPRAGL
+ IGCAFADLAEVMAGVFAARRSSVLVVHGDDGLDELTTTTTSTIWRVAAGSVDKLTFDP
+ AGFGFARAQLDQLAGGDAQANAAAVRAVLGGARGPVRDAVVLNAAGAIVAHAGLSSRA
+ EWLPAWEEGLRRASAAIDTGAAEQLLARWVRFGRQI"
+ gene 2440345..2440956
+ /gene="ctaE"
+ /locus_tag="BQ2027_MB2216"
+ CDS 2440345..2440956
+ /gene="ctaE"
+ /locus_tag="BQ2027_MB2216"
+ /note="Mb2216, ctaE, len: 203 aa. Equivalent to Rv2193,
+ len: 203 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 203 aa overlap). Probable ctaE,
+ cytochrome c oxidase polypeptide III (cox3) (EC 1.9.3.1),
+ with strong similarity to others e.g. COX3_SYNY3|Q06475
+ (29.8% identity in 225 aa overlap). Protein product from
+ Mb2216 detected using SWATH mass spectrometry. Mb2216
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CYTOCHROME C OXIDASE (SUBUNIT III)
+ CTAE"
+ /protein_id="SIU00824.1"
+ /db_xref="GOA:P63857"
+ /db_xref="InterPro:IPR000298"
+ /db_xref="InterPro:IPR013833"
+ /db_xref="InterPro:IPR024791"
+ /db_xref="InterPro:IPR035973"
+ /db_xref="UniProtKB/Swiss-Prot:P63857"
+ /translation="MTSAVGTSGTAITSRVHSLNRPNMVSVGTIVWLSSELMFFAGLF
+ AFYFSARAQAGGNWPPPPTELNLYQAVPVTLVLIASSFTCQMGVFAAERGDIFGLRRW
+ YVITFLMGLFFVLGQAYEYRNLMSHGTSIPSSAYGSVFYLATGFHGLHVTGGLIAFIF
+ LLVRTGMSKFTPAQATASIVVSYYWHFVDIVWIALFTVIYFIR"
+ gene 2440997..2441839
+ /gene="qcrC"
+ /locus_tag="BQ2027_MB2217"
+ CDS 2440997..2441839
+ /gene="qcrC"
+ /locus_tag="BQ2027_MB2217"
+ /note="Mb2217, qcrC, len: 280 aa. Equivalent to Rv2194,
+ len: 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 280 aa overlap). Probable qcrC,
+ Ubiquinol-cytochrome C reductase cytochrome C subunit
+ (cyoA), shows similarity to cytochrome c family; contains
+ 2 X PS00190 Cytochrome c family heme-binding site
+ signature. Protein product from Mb2217 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2217 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Ubiquinol-cytochrome C reductase QcrC
+ (cytochrome C subunit)"
+ /protein_id="SIU00825.1"
+ /db_xref="GOA:P63888"
+ /db_xref="InterPro:IPR009056"
+ /db_xref="InterPro:IPR009152"
+ /db_xref="InterPro:IPR036909"
+ /db_xref="UniProtKB/Swiss-Prot:P63888"
+ /translation="MTKLGFTRSGGSKSGRTRRRLRRRLSGGVLLLIALTIAGGLAAV
+ LTPTPQVAVADESSSALLRTGKQLFDTSCVSCHGANLQGVPDHGPSLIGVGEAAVYFQ
+ VSTGRMPAMRGEAQAPRKDPIFDEAQIDAIGAYVQANGGGPTVVRNPDGSIATQSLRG
+ NDLGRGGDLFRLNCASCHNFTGKGGALSSGKYAPDLAPANEQQILTAMLTGPQNMPKF
+ SNRQLSFEAKKDIIAYVKVATEARQPGGYLLGGFGPAPEGMAMWIIGMVAAIGLALWI
+ GARS"
+ gene 2441836..2443125
+ /gene="qcrA"
+ /locus_tag="BQ2027_MB2218"
+ CDS 2441836..2443125
+ /gene="qcrA"
+ /locus_tag="BQ2027_MB2218"
+ /note="Mb2218, qcrA, len: 429 aa. Equivalent to Rv2195,
+ len: 429 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 429 aa overlap). Probable qcrA,
+ Ubiquinol-cytochrome C reductase iron-sulfur subunit
+ (cyoB), shows some similarity to cytochrome B6-F complex
+ iron-sulphur subunits (Rieske iron-sulfur protein);
+ contains PS00200 Rieske iron-sulfur protein signature 2
+ Protein product from Mb2218 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2218 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Rieske iron-sulfur protein QcrA"
+ /protein_id="SIU00826.1"
+ /db_xref="GOA:Q7TYX4"
+ /db_xref="InterPro:IPR014349"
+ /db_xref="InterPro:IPR017941"
+ /db_xref="InterPro:IPR036922"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYX4"
+ /translation="MSRADDDAVGVPPTCGGRSDEEERRIVPGPNPQDGAKDGAKATA
+ VPREPDEAALAAMSNQELLALGGKLDGVRIAYKEPRWPVEGTKAEKRAERSVAVWLLL
+ GGVFGLALLLIFLFWPWEFKAADGESDFIYSLTTPLYGLTFGLSILSIAIGAVLYQKR
+ FIPEEISIQERHDGASREIDRKTVVANLTDAFEGSTIRRRKLIGLSFGVGMGAFGLGT
+ LVAFAGGLIKNPWKPVVPTAEGKKAVLWTSGWTPRYQGETIYLARATGTEDGPPFIKM
+ RPEDIDAGGMETVFPWRESDGDGTTVESHHKLQEIAMGIRNPVMLIRIKPSDLGRVVK
+ RKGQESFNFGEFFAFTKVCSHLGCPSSLYEQQSYRILCPCHQSQFDALHFAKPIFGPA
+ ARALAQLPITIDTDGYLVANGDFVEPVGPAFWERTTT"
+ gene 2443122..2444771
+ /gene="qcrB"
+ /locus_tag="BQ2027_MB2219"
+ CDS 2443122..2444771
+ /gene="qcrB"
+ /locus_tag="BQ2027_MB2219"
+ /note="Mb2219, qcrB, len: 549 aa. Equivalent to Rv2196,
+ len: 549 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 549 aa overlap). Probable qcrB,
+ Ubiquinol-cytochrome C reductase cytochrome B subunit
+ (cytB), integral membrane protein, low similarity in
+ amino-terminal half to cytochrome b subunits, highly
+ similar at C-terminus to SW:12KD_MYCLE P15878 12 KD
+ protein PIR:S08427 (86.9% identity in 153 aa overlap).
+ FASTA scores: sp|Q45658|QCRB_BACST MENAQUINOL-CYTOCHROME C
+ REDUCTASE (224 aa) opt: 341, E(): 6.8e-15; 28.0% identity
+ in 207 aa overlap Protein product from Mb2219 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2219 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable Ubiquinol-cytochrome C reductase QcrB
+ (cytochrome B subunit)"
+ /protein_id="SIU00827.1"
+ /db_xref="GOA:P63886"
+ /db_xref="InterPro:IPR005797"
+ /db_xref="InterPro:IPR016174"
+ /db_xref="InterPro:IPR027387"
+ /db_xref="UniProtKB/Swiss-Prot:P63886"
+ /translation="MSPKLSPPNIGEVLARQAEDIDTRYHPSAALRRQLNKVFPTHWS
+ FLLGEIALYSFVVLLITGVYLTLFFDPSMVDVTYNGVYQPLRGVEMSRAYQSALDISF
+ EVRGGLFVRQIHHWAALMFAAAIMVHLARIFFTGAFRRPRETNWVIGSLLLILAMFEG
+ YFGYSLPDDLLSGLGLRAALSSITLGMPVIGTWLHWALFGGDFPGTILIPRLYALHIL
+ LLPGIILALIGLHLALVWFQKHTQFPGPGRTEHNVVGVRVMPVFAFKSGAFFAAIVGV
+ LGLMGGLLQINPIWNLGPYKPSQVSAGSQPDFYMMWTEGLARIWPPWEFYFWHHTIPA
+ PVWVAVIMGLVFVLLPAYPFLEKRFTGDYAHHNLLQRPRDVPVRTAIGAMAIAFYMVL
+ TLAAMNDIIALKFHISLNATTWIGRIGMVILPPFVYFITYRWCIGLQRSDRSVLEHGV
+ ETGIIKRLPHGAYIELHQPLGPVDEHGHPIPLQYQGAPLPKRMNKLGSAGSPGSGSFL
+ FADSAAEDAALREAGHAAEQRALAALREHQDSIMGSPDGEH"
+ gene complement(2445062..2445706)
+ /locus_tag="BQ2027_MB2220C"
+ CDS complement(2445062..2445706)
+ /locus_tag="BQ2027_MB2220C"
+ /note="Mb2220c, -, len: 214 aa. Equivalent to Rv2197c,
+ len: 214 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 214 aa overlap). Probable conserved
+ transmembrane protein, equivalent to ML0878 conserved
+ hypothetical protein (212 aa) of Mycobacterium leprae.
+ FASTA scores: opt: 858; 62.559% identity in 211 aa overlap
+ CAC31259.1|(AL583920) Protein product from Mb2220c
+ detected using SWATH mass spectrometry. Mb2220c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved transmembrane protein"
+ /protein_id="SIU00828.1"
+ /db_xref="GOA:A0A1R3Y0G0"
+ /db_xref="InterPro:IPR024381"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0G0"
+ /translation="MVSRYSAYRRGPDVISPDVIDRILVGACAAVWLVFTGVSVAAAV
+ ALMDLGRGFHEMAGNPHTTWVLYAVIVVSALVIVGAIPVLLRARRMAEAEPATRPTGA
+ SVRGGRSIGSGHPAKRAVAESAPVQHADAFEVAAEWSSEAVDRIWLRGTVVLTSAIGI
+ ALIAVAAATYLMAVGHDGPSWISYGLAGVVTAGMPVIEWLYSRQLRRVVAPQSS"
+ gene complement(2445706..2446605)
+ /gene="mmpS3"
+ /locus_tag="BQ2027_MB2221C"
+ CDS complement(2445706..2446605)
+ /gene="mmpS3"
+ /locus_tag="BQ2027_MB2221C"
+ /note="Mb2221c, mmpS3, len: 299 aa. Equivalent to Rv2198c,
+ len: 299 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 299 aa overlap). Probable mmpS3,
+ conserved membrane protein (see citation below),
+ equivalent to ML0877|mmpS3 putative membrane protein from
+ Mycobacterium leprae (293 aa), FASTA scores: opt: 1089,
+ E(): 1.2e-43, (69.80% identity in 308 aa overlap). Also
+ similar to other proteins e.g. Rv3209 from Mycobacterium
+ tuberculosis. Contains PS00499 C2 domain signature, a
+ hydrophobic region, and a repetitive proline and threonine
+ rich region. BELONGS TO THE MMPS FAMILY. Protein product
+ from Mb2221c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb2221c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED MEMBRANE PROTEIN MMPS3"
+ /protein_id="SIU00829.1"
+ /db_xref="GOA:P65379"
+ /db_xref="InterPro:IPR008693"
+ /db_xref="InterPro:IPR038468"
+ /db_xref="UniProtKB/Swiss-Prot:P65379"
+ /translation="MSGPNPPGREPDEPESEPVSDTGDERASGNHLPPVAGGGDKLPS
+ DQTGETDAYSRAYSAPESEHVTGGPYVPADLRLYDYDDYEESSDLDDELAAPRWPWVV
+ GVAAIIAAVALVVSVSLLVTRPHTSKLATGDTTSSAPPVQDEITTTKPAPPPPPPAPP
+ PTTEIPTATETQTVTVTPPPPPPPATTTAPPPATTTTAAAPPPTTTTPTGPRQVTYSV
+ TGTKAPGDIISVTYVDAAGRRRTQHNVYIPWSMTVTPISQSDVGSVEASSLFRVSKLN
+ CSITTSDGTVLSSNSNDGPQTSC"
+ gene complement(2446791..2447210)
+ /locus_tag="BQ2027_MB2222C"
+ CDS complement(2446791..2447210)
+ /locus_tag="BQ2027_MB2222C"
+ /note="Mb2222c, -, len: 139 aa. Equivalent to Rv2199c,
+ len: 139 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 139 aa overlap). Possible conserved
+ integral membrane protein, similar to hypothetical
+ membrane proteins in Actinomycetes and equivalent to
+ Mycobacterium leprae, ML0876, putative membrane protein
+ (139 aa) FASTA scores: opt: 866, E(): 1.1e-43; 91.367%
+ identity in 139 aa overlap CAC31257.1| (AL583920),Mb2222c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible conserved integral membrane protein"
+ /protein_id="SIU00830.1"
+ /db_xref="GOA:P64948"
+ /db_xref="InterPro:IPR021050"
+ /db_xref="UniProtKB/Swiss-Prot:P64948"
+ /translation="MHIEARLFEFVAAFFVVTAVLYGVLTSMFATGGVEWAGTTALAL
+ TGGMALIVATFFRFVARRLDSRPEDYEGAEISDGAGELGFFSPHSWWPIMVALSGSVA
+ AVGIALWLPWLIAAGVAFILASAAGLVFEYYVGPEKH"
+ gene complement(2447218..2448309)
+ /gene="ctaC"
+ /locus_tag="BQ2027_MB2223C"
+ CDS complement(2447218..2448309)
+ /gene="ctaC"
+ /locus_tag="BQ2027_MB2223C"
+ /note="Mb2223c, ctaC, len: 363 aa. Equivalent to Rv2200c,
+ len: 363 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 363 aa overlap). Probable ctaC,
+ transmembrane cytochrome C oxidase (subunit II), COX2,
+ similar e.g. to JT0964 cytochrome-c oxidase chain II
+ (23.0% identity in 317 aa overlap); etc. Contains PS00078
+ Cytochrome c oxidase subunit II, copper A binding region
+ signature. BELONGS TO THE CYTOCHROME C OXIDASE SUBUNIT 2
+ FAMILY. Protein product from Mb2223c detected using
+ shotgun mass spectrometry. Mb2223c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSMEMBRANE CYTOCHROME C OXIDASE
+ (SUBUNIT II) CTAC"
+ /protein_id="SIU00831.1"
+ /db_xref="GOA:P63855"
+ /db_xref="InterPro:IPR001505"
+ /db_xref="InterPro:IPR002429"
+ /db_xref="InterPro:IPR008972"
+ /db_xref="InterPro:IPR036257"
+ /db_xref="UniProtKB/Swiss-Prot:P63855"
+ /translation="MTPRGPGRLQRLSQCRPQRGSGGPARGLRQLALAAMLGALAVTV
+ SGCSWSEALGIGWPEGITPEAHLNRELWIGAVIASLAVGVIVWGLIFWSAVFHRKKNT
+ DTELPRQFGYNMPLELVLTVIPFLIISVLFYFTVVVQEKMLQIAKDPEVVIDITSFQW
+ NWKFGYQRVNFKDGTLTYDGADPERKRAMVSKPEGKDKYGEELVGPVRGLNTEDRTYL
+ NFDKVETLGTSTEIPVLVLPSGKRIEFQMASADVIHAFWVPEFLFKRDVMPNPVANNS
+ VNVFQIEEITKTGAFVGHCAEMCGTYHSMMNFEVRVVTPNDFKAYLQQRIDGKTNAEA
+ LRAINQPPLAVTTHPFDTRRGELAPQPVG"
+ gene 2448555..2450513
+ /gene="asnB"
+ /locus_tag="BQ2027_MB2224"
+ CDS 2448555..2450513
+ /gene="asnB"
+ /locus_tag="BQ2027_MB2224"
+ /note="Mb2224, asnB, len: 652 aa. Equivalent to Rv2201,
+ len: 652 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 652 aa overlap). Probable asnB,
+ asparagine synthetase, similar to e.g. SW:ASNH_BACSU
+ P42113 putative asparagine synthetase (26.0% identity in
+ 438 aa overlap) Protein product from Mb2224 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2224 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable asparagine synthetase AsnB"
+ /protein_id="SIU00832.1"
+ /db_xref="GOA:P64248"
+ /db_xref="InterPro:IPR001962"
+ /db_xref="InterPro:IPR006426"
+ /db_xref="InterPro:IPR017932"
+ /db_xref="InterPro:IPR029055"
+ /db_xref="InterPro:IPR033738"
+ /db_xref="UniProtKB/Swiss-Prot:P64248"
+ /translation="MCGLLAFVAAPAGAAGPEGADAASAIARASHLMRHRGPDESGTW
+ HAVDGASGGVVFGFNRLSIIDIAHSHQPLRWGPPEAPDRYVLVFNGEIYNYLELRDEL
+ RTQHGAVFATDGDGEAILAGYHHWGTEVLQRLRGMFAFALWDTVTRELFCARDPFGIK
+ PLFIATGAGGTAVASEKKCLLDLVELVGFDTEIDHRALQHYTVLQYVPEPETLHRGVR
+ RLESGCFARIRADQLAPVITRYFVPRFAASPITNDNDQARYDEITAVLEDSVAKHMRA
+ DVTVGAFLSGGIDSTAIAALAIRHNPRLITFTTGFEREGFSEIDVAVASAEAIGARHI
+ AKVVSADEFVAALPEIVWYLDEPVADPALVPLFFVAREARKHVKVVLSGEGADELFGG
+ YTIYREPLSLRPFDYLPKPLRRSMGKVSKPLPEGMRGKSLLHRGSLTLEERYYGNARS
+ FSGAQLREVLPGFRPDWTHTDVTAPVYAESAGWDPVARMQHIDLFTWLRGDILVKADK
+ ITMANSLELRVPFLDPEVFAVASRLPAGAKITRTTTKYALRRALEPIVPAHVLHRPKL
+ GFPVPIRHWLRAGELLEWAYATVGSSQAGHLVDIAAVYRMLDEHRCGSSDHSRRLWTM
+ LIFMLWHAIFVEHSVVPQISEPQYPVQL"
+ gene complement(2450611..2451585)
+ /gene="adok"
+ /locus_tag="BQ2027_MB2225C"
+ CDS complement(2450611..2451585)
+ /gene="adok"
+ /locus_tag="BQ2027_MB2225C"
+ /note="Mb2225c, cbhK, len: 324 aa. Equivalent to Rv2202c,
+ len: 324 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 324 aa overlap). Probable cbhK,
+ carbohydrate kinase (but not ribose) (EC 2.7.-.-), similar
+ to several e.g. AE000915_1 Methanobacterium thermoautotrop
+ (309 aa) FASTA score: opt: 370, E(): 3.3e-18; 31.2%
+ identity in 276 aa overlap. Low similarity to carbohydrate
+ kinases, e.g. SW:RBSK_BACSU P36945 ribokinase (23.9%
+ identity in 272 aa overlap); contains PS00583 pfkB family
+ of carbohydrate kinases signature 1 Protein product from
+ Mb2225c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2225c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="adenosine kinase"
+ /protein_id="SIU00833.1"
+ /db_xref="GOA:P83736"
+ /db_xref="InterPro:IPR002173"
+ /db_xref="InterPro:IPR011611"
+ /db_xref="InterPro:IPR029056"
+ /db_xref="PDB:4UBE"
+ /db_xref="UniProtKB/Swiss-Prot:P83736"
+ /translation="MTIAVTGSIATDHLMRFPGRFSEQLLPEHLHKVSLSFLVDDLVM
+ HRGGVAGNMAFAIGVLGGEVALVGAAGADFADYRDWLKARGVNCDHVLISETAHTARF
+ TCTTDVDMAQIASFYPGAMSEARNIKLADVVSAIGKPELVIIGANDPEAMFLHTEECR
+ KLGLAFAADPSQQLARLSGEEIRRLVNGAAYLFTNDYEWDLLLSKTGWSEADVMAQID
+ LRVTTLGPKGVDLVEPDGTTIHVGVVPETSQTDPTGVGDAFRAGFLTGRSAGLGLERS
+ AQLGSLVAVLVLESTGTQEWQWDYEAAASRLAGAYGEHAAAEIVAVLA"
+ gene 2451789..2452481
+ /locus_tag="BQ2027_MB2226"
+ CDS 2451789..2452481
+ /locus_tag="BQ2027_MB2226"
+ /note="Mb2226, -, len: 230 aa. Equivalent to Rv2203, len:
+ 230 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 230 aa overlap). Possible conserved
+ membrane protein; has single hydrophobic stretch from aa
+ 75 to 97 and is equivalent to Mycobacterium leprae ML0872
+ putative membrane protein (171 aa). FASTA scores: opt:
+ 821, E(): 3.4e-42; 72.353% identity in 170 aa overlap
+ -CAC31253.1| (AL583920). 2468411. Protein product from
+ Mb2226 detected using SWATH mass spectrometry. Mb2226
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00834.1"
+ /db_xref="GOA:P64950"
+ /db_xref="UniProtKB/Swiss-Prot:P64950"
+ /translation="MPGPHSPNPGVGTNGPAPYPEPSSHEPQALDYPHDLGAAEPAFA
+ PGPADDAALPPAAYPGVPPQVSYPKRRHKRLLIGIVVALALVSAMTAAIIYGVRTNGA
+ NTAGTFSEGPAKTAIQGYLNALENRDVDTIVRNALCGIHDGVRDKRSDQALAKLSSDA
+ FRKQFSQVEVTSIDKIVYWSQYQAQVLFTMQVTPAAGGPPRGQVQGIAQLLFQRGQVL
+ VCSYVLRTAGSY"
+ gene complement(2452489..2452845)
+ /locus_tag="BQ2027_MB2227C"
+ CDS complement(2452489..2452845)
+ /locus_tag="BQ2027_MB2227C"
+ /note="Mb2227c, -, len: 118 aa. Equivalent to Rv2204c,
+ len: 118 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 118 aa overlap). Conserved
+ hypothetical protein. Similar to conserved hypothetical
+ proteins in Actinomycetes and equivalent to Mycobacterium
+ leprae ML0871|ML0871 conserved hypothetical protein (118
+ aa) and to sp|P45344|YADR_HAEIN HYPOTHETICAL PROTEIN
+ HI1723 (114 aa). FASTA score: ML0871 opt: 720, E():
+ 8.4e-45; 92.373% identity in 118 aa overlapCAC31252.1|
+ (AL583920); and P45344 opt: 346, E(): 1.8e-18; 45.6%
+ identity in 103 aa overlap. Contains PS01152 Hypothetical
+ hesB/y yadR/yfhF family signature Protein product from
+ Mb2227c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2227c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Iron-sulfur cluster insertion protein SCO2161"
+ /protein_id="SIU00835.1"
+ /db_xref="GOA:P0A5B0"
+ /db_xref="InterPro:IPR000361"
+ /db_xref="InterPro:IPR016092"
+ /db_xref="InterPro:IPR017870"
+ /db_xref="InterPro:IPR035903"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5B0"
+ /translation="MTVQNEPSAKTHGVILTEAAAAKAKSLLDQEGRDDLALRIAVQP
+ GGCAGLRYNLFFDDRTLDGDQTAEFGGVRLIVDRMSAPYVEGASIDFVDTIEKQGFTI
+ DNPNATGSCACGDSFN"
+ gene complement(2452945..2454021)
+ /locus_tag="BQ2027_MB2228C"
+ CDS complement(2452945..2454021)
+ /locus_tag="BQ2027_MB2228C"
+ /EC_number="2.7.1.31"
+ /note="Mb2228c, -, len: 358 aa. Equivalent to Rv2205c,
+ len: 358 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 358 aa overlap). Conserved
+ hypothetical protein. Very similar to YHAD_ECOLI|P23524
+ hypothetical protein (YHAD (E.coli) / YXAA (S14A)
+ (B.subtilis) family) (41.6% identity in 154 aa overlap),
+ and to other members of the glycerate kinase family. Start
+ changed since first submission; protein now 122 aa
+ shorter, owing to extension of Rv2206. Mb2228c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Glycerate kinase (EC"
+ /protein_id="SIU00836.1"
+ /db_xref="GOA:P64289"
+ /db_xref="InterPro:IPR004381"
+ /db_xref="InterPro:IPR018193"
+ /db_xref="InterPro:IPR018197"
+ /db_xref="InterPro:IPR036129"
+ /db_xref="UniProtKB/Swiss-Prot:P64289"
+ /translation="MRVLVAPDCYGDSLSAVEAAAAIATGWTRSRPGDSFIVAPQSDG
+ GPGFVEVLGSRLGETRRLRVCGPLNTVVNAAWVFDPGSATAYLECAQACGLGLLGGPP
+ TPETALAAHSKGVGQLIAAALRAGAARIVVGLGGSACTDGGKGMIAELGGLDAARRQL
+ ADVEVIAASDVEYPLLGPWGTARVFAPQKGADMATVAVLEGRLAAWAIELDAAAGRGV
+ SAEPGAGAAGGIGAGLLAVGGRYQSGAAIIAEHTHFADDLADAELIVTGEGRFDEQSL
+ HGKVVGAIAAAARPLAIPVIVLAGQVSLDKSALRSAGIMAALSIAEYAGSVRLALADA
+ ANQLMGLASQVAARLGNSGPSGYR"
+ gene 2454180..2454890
+ /locus_tag="BQ2027_MB2229"
+ CDS 2454180..2454890
+ /locus_tag="BQ2027_MB2229"
+ /note="Mb2229, -, len: 236 aa. Equivalent to Rv2206, len:
+ 236 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 236 aa overlap). Probable conserved
+ transmembrane protein. Equivalent to hypothetical protein
+ ML0869 (247 aa) of Mycobacterium leprae gZ98741|MLCB22_2
+ (247 aa), FASTA scores: opt: 1052, (67.5% identity in 237
+ aa overlap). Two hydrophobic stretches in C-terminal part.
+ Start changed since original submission (+112 aa). Protein
+ product from Mb2229 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2229 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00837.1"
+ /db_xref="GOA:P64952"
+ /db_xref="InterPro:IPR021403"
+ /db_xref="UniProtKB/Swiss-Prot:P64952"
+ /translation="MKLLGHRKSHGHQRADASPDAGSKDGCRPDSGRTSGSDTSRGSQ
+ TTGPKGRPTPKRNQSRRHTKKGPVAPAPMTAAQARARRKSLAGPKLSREERRAEKAAN
+ RARMTERRERMMAGEEAYLLPRDRGPVRRYVRDVVDSRRNLLGLFMPSALTLLFVMFA
+ VPQVQFYLSPAMLILLALMTIDAIILGRKVGRLVDTKFPSNTESRWRLGLYAAGRASQ
+ IRRLRAPRPQVERGGDVG"
+ gene 2454969..2456054
+ /gene="cobT"
+ /locus_tag="BQ2027_MB2230"
+ CDS 2454969..2456054
+ /gene="cobT"
+ /locus_tag="BQ2027_MB2230"
+ /note="Mb2230, cobT, len: 361 aa. Equivalent to Rv2207,
+ len: 361 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 361 aa overlap). Probable cobT,
+ phosphoribosyltransferase, similar to many e.g.
+ SW:COBT_ECOLI P36562
+ nicotinate-nucleotide--dimethylbenzimidazol
+ phosphoribosyltransferase (34.6% identity in 341 aa
+ overlap) Protein product from Mb2230 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2230 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable
+ nicotinate-nucleotide-dimethylbenzimidazol
+ phosphoribosyltransferase CobT"
+ /protein_id="SIU00838.1"
+ /db_xref="GOA:P63842"
+ /db_xref="InterPro:IPR003200"
+ /db_xref="InterPro:IPR017846"
+ /db_xref="InterPro:IPR023195"
+ /db_xref="InterPro:IPR036087"
+ /db_xref="UniProtKB/Swiss-Prot:P63842"
+ /translation="MIGFAPVSTPDAAAEAAARARQDSLTKPRGALGSLEDLSVWVAS
+ CQQRCPPRQFERARVVVFAGDHGVARSGVSAYPPEVTAQMVANIDAGGAAINALADVA
+ GATVRVADLAVDADPLSERIGAHKVRRGSGNIATEDALTNDETAAAITAGQQIADEEV
+ DAGADLLIAGDMGIGNTTAAAVLVAALTDAEPVAVVGFGTGIDDAGWARKTAAVRDAL
+ FRVRPVLPDPVGLLRCAGGADLAAIAGFCAQAAVRRTPLLLDGVAVTAAALVAERLAP
+ GAHRWWQAGHRSSEPGHGLALAALGLDPIVDLHMRLGEGTGAAVALMVLRAAVAALSS
+ MATFTEAGVSTRSVDGVDRTAPPAVSP"
+ gene 2456051..2456800
+ /gene="cobS"
+ /locus_tag="BQ2027_MB2231"
+ CDS 2456051..2456800
+ /gene="cobS"
+ /locus_tag="BQ2027_MB2231"
+ /note="Mb2231, cobS, len: 249 aa. Equivalent to Rv2208,
+ len: 249 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 249 aa overlap). Probable cobS,
+ cobalamin 5'-phosphate synthase; similarity to
+ SW:COBS_ECOLI P36561 cobalamin (5'-phosphate) synthase
+ (28.0% identity in 243 aa overlap),Mb2231 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable cobalamin 5'-phosphate synthase CobS"
+ /protein_id="SIU00839.1"
+ /db_xref="GOA:Q7VEN6"
+ /db_xref="InterPro:IPR003805"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEN6"
+ /translation="MMRSLATAFAFATVIPTPGSATTPMGRGPMTALPVVGAALGALA
+ AAIAWAGAQVFGPSSPLSGMLTVAVLLVVTRGLHIDGVADTADGLGCYGPPQRALAVM
+ RDGSTGPFGVAAVVLVIALQGLAFATLTTVGIAGITLAVLSGRVTAVLVCRRSVPAAH
+ GSTLGSRVAGTQPAPVVAAWLAVLLAVSVPAGPRPWQGPIAVLVAVTAGAALAAHCVH
+ RFGGVTGDVLGSAIELSTTVSAVTLAGLARL"
+ gene 2456958..2458496
+ /locus_tag="BQ2027_MB2232"
+ CDS 2456958..2458496
+ /locus_tag="BQ2027_MB2232"
+ /note="Mb2232, -, len: 512 aa. Equivalent to Rv2209, len:
+ 512 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 512 aa overlap). Probable conserved
+ integral membrane protein, similar to but longer than
+ Rv0246 gp|AL021929|MTV 034_12 Mycobacterium tuberculosis
+ (436 aa). FASTA score: opt: 712, E(): 2.8e- 32; 33.4%
+ identity in 422 aa overlap,Mb2232 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved integral membrane protein"
+ /protein_id="SIU00840.1"
+ /db_xref="GOA:P64954"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/Swiss-Prot:P64954"
+ /translation="MPASRLVRQVSAPRNLFGRLVAQGGFYTAGLQLGSGAVVLPVIC
+ AHQGLTWAAGLLYPAFCIGAILGNSLSPLILQRAGQLRHLLMAAISATAAALVVCNAA
+ VPWTGVGVAAVFLATTGAGGVVTGVSSVAYTDMISSMLPAVRRGELLLTQGAAGSVLA
+ TGVTLVIVPMLAHGNEMARYHDLLWLGAAGLVCSGIAALFVGPMRSVSVTTATRMPLR
+ EIYWMGFAIARSQPWFRRYMTTYLLFVPISLGTTFFSLRAAQSNGSLHVLVILSSIGL
+ VVGSMLWRQINRLFGVRGLLLGSALLNAAAALLCMVAESCGQWVHAWAYGTAFLLATV
+ AAQTVVAASISWISVLAPERYRATLICVGSTLAAVEATVLGVALGGIAQKHATIWPVV
+ VVLTLAVIAAVASLRAPTRIGVTADTSPQAATLQAYRPATPNPIHSDERSTPPDHLSV
+ RRGQLRHVWDSRRPAPPLNRPSCRRAARRPAPGKPAAALPQPRHPAVGVREGAPLDAG
+ QRIA"
+ gene complement(2458422..2459528)
+ /gene="ilvE"
+ /locus_tag="BQ2027_MB2233C"
+ CDS complement(2458422..2459528)
+ /gene="ilvE"
+ /locus_tag="BQ2027_MB2233C"
+ /note="Mb2233c, ilvE, len: 368 aa. Equivalent to Rv2210c,
+ len: 368 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 368 aa overlap). Probable ilvE,
+ Branched-chain-amino-acid transaminase, highly similar to
+ many e.g. YWAA_BACSU|P39576 from Bacillus subtilis (48.4%
+ identity in 339 aa overlap); etc. Protein product from
+ Mb2233c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2233c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="branched-chain amino acid transaminase ilve"
+ /protein_id="SIU00841.1"
+ /db_xref="GOA:A0A1R3Y0I1"
+ /db_xref="InterPro:IPR001544"
+ /db_xref="InterPro:IPR005786"
+ /db_xref="InterPro:IPR018300"
+ /db_xref="InterPro:IPR033939"
+ /db_xref="InterPro:IPR036038"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0I1"
+ /translation="MTSGSLQFTVLRAVNPATDAQRESMLRAPGFGKYHTDHMVSIDY
+ AEGRGWHNARVIPYGPIELDPSAIVLHYAQEVFEGLKAYRWADGSIVSFRADANAARL
+ RSSARRLAIPELPDAVFIESLRQLIAVDKAWVPGAGGEEALYLRPFIFATEPGLGVRP
+ ATQYRYLLIASPAGAYFKGGIAPVSVWVSTEYVRACPGGTGAAKFGGNYAASLLAQAE
+ AAENGCDQVVWLDAVERRYIEEMGGMNIFFVLGSGGSARLVTPELSGSLLPGITRDSL
+ LQLAIDAGFAVEERRIDIDEWQKKAAAGEITEVFACGTAAVITPVARVRHGASEFRIA
+ DGQPGEVTMALRDTLTGIQRGTFADTHGWMARLG"
+ gene complement(2459600..2460739)
+ /gene="gcvT"
+ /locus_tag="BQ2027_MB2234C"
+ CDS complement(2459600..2460739)
+ /gene="gcvT"
+ /locus_tag="BQ2027_MB2234C"
+ /note="Mb2234c, gcvT, len: 379 aa. Equivalent to Rv2211c,
+ len: 379 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 379 aa overlap). Probable gcvT,
+ aminomethyltransferase (EC 2.1.2.10), similar to many e.g.
+ GCST_ECOLI|P27248 for Escherichia coli (38.2% identity in
+ 364 aa overlap); etc. BELONGS TO THE GCVT FAMILY. Protein
+ product from Mb2234c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2234c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable aminomethyltransferase GcvT (Glycine
+ cleavage system T protein)"
+ /protein_id="SIU00842.1"
+ /db_xref="GOA:P64221"
+ /db_xref="InterPro:IPR006222"
+ /db_xref="InterPro:IPR006223"
+ /db_xref="InterPro:IPR013977"
+ /db_xref="InterPro:IPR022903"
+ /db_xref="InterPro:IPR027266"
+ /db_xref="InterPro:IPR028896"
+ /db_xref="InterPro:IPR029043"
+ /db_xref="UniProtKB/Swiss-Prot:P64221"
+ /translation="MCQQGRPLGWDAVSDVPELIHGPLEDRHRELGASFAEFGGWLMP
+ VSYAGTVSEHNATRTAVGLFDVSHLGKALVRGPGAAQFVNSALTNDLGRIGPGKAQYT
+ LCCTESGGVIDDLIAYYVSDDEIFLVPNAANTAAVVGALQAAAPGGLSITNLHRSYAV
+ LAVQGPCSTDVLTALGLPTEMDYMGYADASYSGVPVRVCRTGYTGEHGYELLPPWESA
+ GVVFDALLAAVSAAGGEPAGLGARDTLRTEMGYPLHGHELSLDISPLQARCGWAVGWR
+ KDAFFGRAALLAEKAAGPRRLLRGLRMVGRGVLRPGLAVLVGDETVGVTTSGTFSPTL
+ QVGIGLALIDSDAGIEDGQQINVDVRGRAVECQVVCPPFVAVKTR"
+ gene 2460748..2461884
+ /locus_tag="BQ2027_MB2235"
+ CDS 2460748..2461884
+ /locus_tag="BQ2027_MB2235"
+ /note="Mb2235, -, len: 378 aa. Equivalent to Rv2212, len:
+ 378 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 378 aa overlap). Conserved
+ hypothetical protein. Some similarity to adenylate
+ cyclases, e.g. SW:CYAA_STRCO P40135 (29.2% identity in 291
+ aa overlap); ttg at 24614 in MTCY190 has a better rbs.
+ Contains possible helix-turn-helix motif at aa 64- 85,
+ (+2.72 SD). Also similar to Rv1264 and Rv1647 Protein
+ product from Mb2235 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2235 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="adenylyl cyclase (atp pyrophosphate-lyase)
+ (adenylate cyclase)"
+ /protein_id="SIU00843.1"
+ /db_xref="GOA:P64266"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="InterPro:IPR032026"
+ /db_xref="UniProtKB/Swiss-Prot:P64266"
+ /translation="MYDSLDFDALEAAGIANPRERAGLLTYLDELGFTVEEMVQAERR
+ GRLFGLAGDVLLWSGPPIYTLATAADELGLSADDVARAWSLLGLTVAGPDVPTLSQAD
+ VDALATWVALKALVGEDGAFGLLRVLGTAMARLAEAESTMIRAGSPNIQMTHTHDELA
+ TARAYRAAAEFVPRIGALIDTVHRHHLASARTYFEGVIGDTSASVTCGIGFADLSSFT
+ ALTQALTPAQLQDLLTEFDAAVTDVVHADGGRLVKFIGDAVMWVSSSPERLVRAAVDL
+ VDHPGARAAELQVRAGLAYGTVLALNGDYFGNPVNLAARLVAAAAPGQILAAAQLRDM
+ LPDWPALAHGPLTLKGFDAPVMAFELHDNPRARDADTPSPAASD"
+ gene 2461896..2463443
+ /gene="pepB"
+ /locus_tag="BQ2027_MB2236"
+ CDS 2461896..2463443
+ /gene="pepB"
+ /locus_tag="BQ2027_MB2236"
+ /note="Mb2236, pepB, len: 515 aa. Equivalent to Rv2213,
+ len: 515 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 515 aa overlap). Probable pepB, leucine
+ aminopeptidase, similar to many e.g. SW:AMPA_ECOLI P11648
+ aminopeptidase A/I, (41.4% identity in 309 aa overlap).
+ Equivalent to Z98741|MLCB22_6 Mycobacterium leprae cosmid
+ B22; Am (524 aa), FASTA scores: opt: 2793, E(): 0; 83.1%
+ identity in 522 aa overlap. Contains PS00631 Cytosol
+ aminopeptidase signature, NTDAEGRL Protein product from
+ Mb2236 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2236 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable aminopeptidase PepB"
+ /protein_id="SIU00844.1"
+ /db_xref="GOA:Q7VEN5"
+ /db_xref="InterPro:IPR000819"
+ /db_xref="InterPro:IPR008283"
+ /db_xref="InterPro:IPR011356"
+ /db_xref="InterPro:IPR023042"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEN5"
+ /translation="MTTEPGYLSPSVAVATSMPKRGVGAAVLIVPVVSTGEEDRPGAV
+ VASAEPFLRADTVAEIEAGLRALDATGASDQVHRLAVPSLPVGSVLTVGLGKPRREWP
+ ADTIRCAAGVAARALNSSEAVITTLAELPGDGICSATVEGLILGSYRFSAFRSDKTAP
+ KDAGLRKITVLCCAKDAKKRALHGAAVATAVATARDLVNTPPSHLFPAELAKRAKTLS
+ ESVGLDVEVIDEKALKKAGYGGVIGVGQGSSRPPRLVRLIHRGSRLAKNPQKAKKVAL
+ VGKGITFDTGGISIKPAASMHHMTSDMGGAAAVIATVTLAARLRLPIDVIATVPMAEN
+ MPSATAQRPGDVLTQYGGTTVEVLNTDAEGRLILADAIVRACEDKPDYLIETSTLTGA
+ QTVALGTRIPGVMGSDEFRDRVAAISQRVGENGWPMPLPDDLKDDLKSTVADLANVSG
+ QRFAGMLVAGVFLREFVAESVDWAHIDVAGPAYNTGSAWGYTPKGATGVPTRTMFAVL
+ EDIAKNG"
+ gene complement(2463481..2465259)
+ /gene="ephD"
+ /locus_tag="BQ2027_MB2237C"
+ CDS complement(2463481..2465259)
+ /gene="ephD"
+ /locus_tag="BQ2027_MB2237C"
+ /note="Mb2237c, ephD, len: 592 aa. Equivalent to Rv2214c,
+ len: 592 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 592 aa overlap). Possible ephD,
+ short-chain dehydrogenase (EC 1.-.-.-) (see citation
+ below), equivalent to Z98741|MLCB22_8 Mycobacterium leprae
+ cosmid B22; (596 aa), FASTA score: opt: 3262, E(): 0;
+ 80.4% identity in 596 aa overlap. C-terminus similar to
+ short-chain alcohol dehydrogenase family, similar to
+ SW:LIGD_PSEPA Q01198 c alpha-dehydrogenase (30.7% identity
+ in 241 aa overlap); contains PS00061 Short-chain alcohol
+ dehydrogenase family signature, PS00697 ATP-dependent DNA
+ ligase AMP-binding site. N-terminus corresponds to several
+ epoxide hydrolases of plants and Mycobacterium
+ tuberculosis e.g. MTCY9F925 Protein product from Mb2237c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2237c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible short-chain dehydrogenase EphD"
+ /protein_id="SIU00845.1"
+ /db_xref="GOA:P66778"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR020904"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P66778"
+ /translation="MPATQQMSRLVDSPDGVRIAVYHEGNPDGPTVVLVHGFPDSHVL
+ WDGVVPLLAERFRIVRYDNRGVGRSSVPKPISAYTMAHFADDFDAVIGELSPGEPVHV
+ LAHDWGSVGVWEYLRRPGASDRVASFTSVSGPSQDHLVNYVYGGLRRPWRPRTFLRAI
+ SQTLRLSYMALFSVPVVAPLLLRVALSSAAVRRNMVGDIPVDQIHHSETLARDAAHSV
+ KTYPANYFRSFSSSRRGRAIPIVDVPVQLIVNSQDPYVRPYGYDQTARWVPRLWRRDI
+ KAGHFSPMSHPQVMAAAVHDFADLADGKQPSRALLRAQVGRPRGYFGDTLVSVTGAGS
+ GIGRETALAFAREGAEIVISDIDEATVKDTAAEIAARGGIAYPYVLDVSDAEAVEAFA
+ ERVSAEHGVPDIVVNNAGIGQAGRFLDTPAEQFDRVLAVNLGGVVNGCRAFGQRLVER
+ GTGGHIVNVSSMAAYAPLQSLSAYCTSKAATYMFSDCLRAELDAAGVGLTTICPGVID
+ TNIVATTGFHAPGTDEEKIDGRRGQIDKMFALRSYGPDKVADAIVSAVKKKKPIRPVA
+ PEAYALYGISRVLPQALRSTARLRVI"
+ gene 2465523..2467184
+ /gene="dlat"
+ /locus_tag="BQ2027_MB2238"
+ CDS 2465523..2467184
+ /gene="dlat"
+ /locus_tag="BQ2027_MB2238"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2238, sucB, len: 553 aa. Equivalent to Rv2215,
+ len: 553 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 553 aa overlap). Probable sucB,
+ dihydrolipoamide acetyltransferase component (E2), similar
+ to e.g. SW:O PD2_ACHLA P35489 dihydrolipoamide
+ acetyltransferase component (E2) of pyruvate dehydrogenase
+ complex (35.3% identity in 552 aa overlap); contains
+ PS00189 2-oxo acid dehydrogenases acyltransferase
+ component lipoyl binding site. Protein product from Mb2238
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2238 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="dlat, dihydrolipoamide acyltransferase, e2
+ component of pyruvate dehydrogenase"
+ /protein_id="SIU00846.1"
+ /db_xref="GOA:P65634"
+ /db_xref="InterPro:IPR000089"
+ /db_xref="InterPro:IPR001078"
+ /db_xref="InterPro:IPR003016"
+ /db_xref="InterPro:IPR004167"
+ /db_xref="InterPro:IPR011053"
+ /db_xref="InterPro:IPR014276"
+ /db_xref="InterPro:IPR023213"
+ /db_xref="InterPro:IPR036625"
+ /db_xref="UniProtKB/Swiss-Prot:P65634"
+ /translation="MAFSVQMPALGESVTEGTVTRWLKQEGDTVELDEPLVEVSTDKV
+ DTEIPSPAAGVLTKIIAQEDDTVEVGGELAVIGDAKDAGEAAAPAPEKVPAAQPESKP
+ APEPPPVQPTSGAPAGGDAKPVLMPELGESVTEGTVIRWLKKIGDSVQVDEPLVEVST
+ DKVDTEIPSPVAGVLVSISADEDATVPVGGELARIGVAADIGAAPAPKPAPKPVPEPA
+ PTPKAEPAPSPPAAQPAGAAEGAPYVTPLVRKLASENNIDLAGVTGTGVGGRIRKQDV
+ LAAAEQKKRAKAPAPAAQAAAAPAPKAPPAPAPALAHLRGTTQKASRIRQITANKTRE
+ SLQATAQLTQTHEVDMTKIVGLRARAKAAFAEREGVNLTFLPFFAKAVIDALKIHPNI
+ NASYNEDTKEITYYDAEHLGFAVDTEQGLLSPVIHDAGDLSLAGLARAIADIAARARS
+ GNLKPDELSGGTFTITNIGSQGALFDTPILVPPQAAMLGTGAIVKRPRVVVDASGNES
+ IGVRSVCYLPLTYDHRLIDGADAGRFLTTIKHRLEEGAFEADLGL"
+ gene 2467184..2468089
+ /locus_tag="BQ2027_MB2239"
+ CDS 2467184..2468089
+ /locus_tag="BQ2027_MB2239"
+ /note="Mb2239, -, len: 301 aa. Equivalent to Rv2216, len:
+ 301 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 301 aa overlap). Conserved
+ hypothetical protein, equivalent to Mycobacterium leprae
+ ML0860 (307 aa), Z98741|MLCB22_10 Mycobacterium leprae
+ cosmid B22; H (307 aa). FASTA score: opt: 1656, E(): 0;
+ 84.2% identity in 297 aa overlap. Also
+ gp|AE000319|ECAE000319_8 Escherichia coli strain K12
+ MG1655 (297 aa) opt: 640, E(): 0; 39.5% identity in 294 aa
+ overlap. Protein product from Mb2239 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2239 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Cell division inhibitor SulA"
+ /protein_id="SIU00847.1"
+ /db_xref="GOA:P67233"
+ /db_xref="InterPro:IPR001509"
+ /db_xref="InterPro:IPR010099"
+ /db_xref="InterPro:IPR013549"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/Swiss-Prot:P67233"
+ /translation="MANAVVAIAGSSGLIGSALTAALRAADHTVLRIVRRAPANSEEL
+ HWNPESGEFDPHALTDVDAVVNLCGVNIAQRRWSGAFKQSLRDSRITPTEVLSAAVAD
+ AGVATLINASAVGYYGNTKDRVVDENDSAGTGFLAQLCVDWETATRPAQQSGARVVLA
+ RTGVVLSPAGGMLRRMRPLFSVGLGARLGSGRQYMSWISLEDEVRALQFAIAQPNLSG
+ PVNLTGPAPVTNAEFTTAFGRAVNRPTPLMLPSVAVRAAFGEFADEGLLIGQRAIPSA
+ LERAGFQFHHNTIGEALGYATTRPG"
+ gene 2468142..2468834
+ /gene="lipB"
+ /locus_tag="BQ2027_MB2240"
+ CDS 2468142..2468834
+ /gene="lipB"
+ /locus_tag="BQ2027_MB2240"
+ /note="Mb2240, lipB, len: 230 aa. Equivalent to Rv2217,
+ len: 230 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 230 aa overlap). Probable lipB, similar
+ to SW:LIPB_ECOLI P30976 liopate biosynthesis protein B
+ (33.8% identity in 160 aa overlap). Equivalent to
+ gp|Z98741| MLCB22_11 Mycobacterium leprae (235 aa). FASTA
+ score: opt: 1124, E(): 0; 78.4% identity in 218 aa overlap
+ Protein product from Mb2240 detected using SWATH mass
+ spectrometry. Mb2240 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable lipoate biosynthesis protein B LipB"
+ /protein_id="SIU00848.1"
+ /db_xref="GOA:Q7VEN4"
+ /db_xref="InterPro:IPR000544"
+ /db_xref="InterPro:IPR004143"
+ /db_xref="InterPro:IPR020605"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEN4"
+ /translation="MTGSIRSKLSAIDVRQLGTVDYRTAWQLQRELADARVAGGADTL
+ LLLEHPAVYTAGRRTETHERPIDGTPVVGTDRGGKITWHGPGQLVGYPIIGLAEPLDV
+ VNYVRRLEESLIQVCADLGLHAGRVDGRSGVWLPGRPARKVAAIGVRVSRATTLHGFA
+ LNCDCDLAAFTAIVPCGISDAAVTSLSAELGRTVTVDEVRATVAAAVCAALDGVLPVG
+ DRVPSHAVPSPL"
+ gene 2468831..2469766
+ /gene="lipA"
+ /locus_tag="BQ2027_MB2241"
+ CDS 2468831..2469766
+ /gene="lipA"
+ /locus_tag="BQ2027_MB2241"
+ /note="Mb2241, lipA, len: 311 aa. Equivalent to Rv2218,
+ len: 311 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 311 aa overlap). Probable lipA, lipoic
+ acid synthetase, similar to e.g. SW:LIPA_HAEIN P44463 (42
+ .6% identity in 291 aa overlap). Equivalent to
+ Z98741|MLCB2 2_12 Mycobacterium leprae cosmid B22; (314
+ aa). FASTA score : opt: 1836, E(): 0; 86.8% identity in
+ 310 aa overlap,Mb2241 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable lipoate biosynthesis protein A LipA"
+ /protein_id="SIU00849.1"
+ /db_xref="GOA:P65284"
+ /db_xref="InterPro:IPR003698"
+ /db_xref="InterPro:IPR006638"
+ /db_xref="InterPro:IPR007197"
+ /db_xref="InterPro:IPR013785"
+ /db_xref="InterPro:IPR031691"
+ /db_xref="UniProtKB/Swiss-Prot:P65284"
+ /translation="MSVAAEGRRLLRLEVRNAQTPIERKPPWIKTRARIGPEYTELKN
+ LVRREGLHTVCEEAGCPNIFECWEDREATFLIGGDQCTRRCDFCQIDTGKPAELDRDE
+ PRRVADSVRTMGLRYATVTGVARDDLPDGGAWLYAATVRAIKELNPSTGVELLIPDFN
+ GEPTRLAEVFESGPEVLAHNVETVPRIFKRIRPAFTYRRSLGVLTAARDAGLVTKSNL
+ ILGLGETSDEVRTALGDLRDAGCDIVTITQYLRPSARHHPVERWVKPEEFVQFARFAE
+ GLGFAGVLAGPLVRSSYRAGRLYEQARNSRALASR"
+ gene 2469793..2470545
+ /locus_tag="BQ2027_MB2242"
+ CDS 2469793..2470545
+ /locus_tag="BQ2027_MB2242"
+ /note="Mb2242, -, len: 250 aa. Equivalent to Rv2219, len:
+ 250 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 250 aa overlap). Probable conserved
+ transmembrane protein. Equivalent to hypothetical membrane
+ protein ML0857 (250 aa) from Mycobacterium leprae Z98741
+ |MLCB22_13 Mycobacterium leprae cosmid B22; H (250 aa) opt
+ : 1328, E(): 0; 80.8% identity in 250 aa overlap. Protein
+ product from Mb2242 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2242 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00850.1"
+ /db_xref="GOA:A0A1R3Y0L2"
+ /db_xref="InterPro:IPR025445"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0L2"
+ /translation="MAKPRNAAESKAAKAQANAARKAAARQRRAQLWQAFTLQRKEDK
+ RLLPYMIGAFLLIVGASVGVGVWAGGFTMLTMIPLGVLLGALVAFVIFGRRAQRTVYR
+ KAEGQTGAAAWALDNLRGKWRVTPGVAATGNLDAVHRVIGRPGVIFVGEGSAARVKPL
+ LAQEKKRTARLVGDVPIYDIIVGNGDGEVPLAKLERHLTRLPANITVKQMDTVESRLA
+ ALGSRAGAGVMPKGPLPTTAKMRSVQRTVRRK"
+ gene complement(2470552..2470974)
+ /locus_tag="BQ2027_MB2243C"
+ CDS complement(2470552..2470974)
+ /locus_tag="BQ2027_MB2243C"
+ /note="Mb2243c, -, len: 140 aa. Equivalent to Rv2219A,
+ len: 140 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 140 aa overlap). Probable membrane
+ protein, similar to SC3H12.05c|AL355740_5 possible
+ integral membrane protein from Streptomyces coelicolor
+ (155 aa), FASTA scores: opt: 327, E(): 7.5e-14, (46.6%
+ identity in 133 aa overlap), also linked to glnA. Protein
+ product from Mb2243c detected using SWATH mass
+ spectrometry. Mb2243c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable conserved membrane protein"
+ /protein_id="SIU00851.1"
+ /db_xref="GOA:A0A1R3Y0I9"
+ /db_xref="InterPro:IPR010432"
+ /db_xref="InterPro:IPR016795"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0I9"
+ /translation="MTAKSPPDYPGKTLGLPDTGPGSLAPMGRRLAALLIDWLIAYGL
+ ALLGVEFGVWSTPMLSTVVLVIWLLLGVAAVRLFGFTPGQLMLGLVVVAVGGRRPVGI
+ GRLVVRGLLIGLVVPPLFTDSDGRGLHDRLTATAVVRR"
+ gene 2471173..2472609
+ /gene="glnA1"
+ /locus_tag="BQ2027_MB2244"
+ CDS 2471173..2472609
+ /gene="glnA1"
+ /locus_tag="BQ2027_MB2244"
+ /standard_name="glnA"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2244, glnA1, len: 478 aa. Equivalent to Rv2220,
+ len: 478 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 478 aa overlap). glnA1, glutamine
+ synthetase class I (EC 6.3.1.2) (see first citation
+ below), similar to many e.g. GLNA_STRCO|P15106 from
+ Streptomyces coelicolor, FASTA score: (71.4% identity in
+ 475 aa overlap); etc. Also similar to three other
+ potential glutamine synthetases in Mycobacterium
+ tuberculosis: Rv2222c|glnA2, Rv2860c|glnA4, and
+ Rv1878|glnA3. Contains PS00180 Glutamine synthetase
+ signature 1, PS00181 Glutamine synthetase putative
+ ATP-binding region signature, and PS00182 Glutamine
+ synthetase class-I adenylation site. BELONGS TO THE
+ GLUTAMINE SYNTHETASE FAMILY. Protein product from Mb2244
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2244 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="GLUTAMINE SYNTHETASE GLNA1 (GLUTAMINE SYNTHASE)
+ (GS-I)"
+ /protein_id="SIU00852.1"
+ /db_xref="GOA:P0A591"
+ /db_xref="InterPro:IPR001637"
+ /db_xref="InterPro:IPR004809"
+ /db_xref="InterPro:IPR008146"
+ /db_xref="InterPro:IPR008147"
+ /db_xref="InterPro:IPR014746"
+ /db_xref="InterPro:IPR027302"
+ /db_xref="InterPro:IPR027303"
+ /db_xref="InterPro:IPR036651"
+ /db_xref="UniProtKB/Swiss-Prot:P0A591"
+ /translation="MTEKTPDDVFKLAKDEKVEYVDVRFCDLPGIMQHFTIPASAFDK
+ SVFDDGLAFDGSSIRGFQSIHESDMLLLPDPETARIDPFRAAKTLNINFFVHDPFTLE
+ PYSRDPRNIARKAENYLISTGIADTAYFGAEAEFYIFDSVSFDSRANGSFYEVDAISG
+ WWNTGAATEADGSPNRGYKVRHKGGYFPVAPNDQYVDLRDKMLTNLINSGFILEKGHH
+ EVGSGGQAEINYQFNSLLHAADDMQLYKYIIKNTAWQNGKTVTFMPKPLFGDNGSGMH
+ CHQSLWKDGAPLMYDETGYAGLSDTARHYIGGLLHHAPSLLAFTNPTVNSYKRLVPGY
+ EAPINLVYSQRNRSACVRIPITGSNPKAKRLEFRSPDSSGNPYLAFSAMLMAGLDGIK
+ NKIEPQAPVDKDLYELPPEEAASIPQTPTQLSDVIDRLEADHEYLTEGGVFTNDLIET
+ WISFKRENEIEPVNIRPHPYEFALYYDV"
+ gene complement(2472927..2475911)
+ /gene="glnE"
+ /locus_tag="BQ2027_MB2245C"
+ CDS complement(2472927..2475911)
+ /gene="glnE"
+ /locus_tag="BQ2027_MB2245C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2245c, glnE, len: 994 aa. Equivalent to Rv2221c,
+ len: 994 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 994 aa overlap). glnE,
+ glutamate-ammonia-ligase adenylyltransferase (EC 2.7.7.42)
+ (see citations below), similar to others e.g.
+ GLNE_ECOLI|P30870 glutamate-ammonia-ligase
+ adenylyltransferase from Escherichia coli, FASTA score:
+ (24.4% identity in 721 aa overlap); GLNE_HAEIN|P44419
+ Glutamate-ammonia-ligase adenylyltransferase from
+ Haemophilus influenzae (981 aa), FASTA score: (28.1%
+ identity in 199 aa overlap); etc. Note that initiation
+ codon uncertain. Protein product from Mb2245c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2245c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="GLUTAMATE-AMMONIA-LIGASE ADENYLYLTRANSFERASE
+ GLNE (Glutamine-synthetase adenylyltransferase)"
+ /protein_id="SIU00853.1"
+ /db_xref="GOA:P69941"
+ /db_xref="InterPro:IPR005190"
+ /db_xref="InterPro:IPR013546"
+ /db_xref="InterPro:IPR023057"
+ /db_xref="UniProtKB/Swiss-Prot:P69941"
+ /translation="MVVTKLATQRPKLPSVGRLGLVDPPAGERLAQLGWDRHEDQAHV
+ DLLWSLSRAPDADAALRALIRLSENPDTGWDELNAALLRERSLRGRLFSVLGSSLALG
+ DHLVAHPQSWKLLRGKVTLPSHDQLQRSFVECVEESEGMPGSLVHRLRTQYRDYVLML
+ AALDLAATVEDEPVLPFTVVAARLADAADAALAAALRVAEASVCGEHPPPRLAVIAMG
+ KCGARELNYVSDVDVIFVAERSDPRNARVASEMMRVASAAFFEVDAALRPEGRNGELV
+ RTLESHIAYYQRWAKTWEFQALLKARPVVGDAELGERYLTALMPMVWRACEREDFVVE
+ VQAMRRRVEQLVPADVRGRELKLGSGGLRDVEFAVQLLQLVHARSDESLRVASTVDAL
+ AALGEGGYIGREDAANMTASYEFLRLLEHRLQLQRLKRTHLLPDPEDEEAVRWLARAA
+ HIRPDGRNDAAGVLREELKKQNVRVSKLHTKLFYQPLLESIGPTGLEIAHGMTLEAAG
+ RRLAALGYEGPQTALKHMSALVNQSGRRGRVQSVLLPRLLDWMSYAPDPDGGLLAYRR
+ LSEALATESWYLATLRDKPAVAKRLMHVLGTSAYVPDLLMRAPRVIQQYEDGPAGPKL
+ LETEPAAVARALIASASRYPDPERAIAGARTLRRRELARIGSADLLGLLEVTEVCRAL
+ TSVWVAVLQAALDVMIRASLPDDDRAPAAIAVIGMGRLGGAELGYGSDADVMFVCEPA
+ TGVDDARAVKWSTSIAERVRALLGTPSVDPPLELDANLRPEGRNGPLVRTLGSYAAYY
+ EQWAQPWEIQALLRAHAVAGDAELGQRFLRMVDKTRYPPDGVSADSVREIRRIKARIE
+ SERLPRGADPNTHTKLGRGGLADIEWTVQLLQLQHAHQVPALHNTSTLQSLDVIAAAD
+ LVPAADVELLRQAWLTATRARNALVLVRGKPTDQLPGPGRQLNAVAVAAGWRNDDGGE
+ FLDNYLRVTRRAKAVVRKVFGS"
+ gene complement(2475960..2477300)
+ /gene="glnA2"
+ /locus_tag="BQ2027_MB2246C"
+ CDS complement(2475960..2477300)
+ /gene="glnA2"
+ /locus_tag="BQ2027_MB2246C"
+ /note="Mb2246c, glnA2, len: 446 aa. Equivalent to Rv2222c,
+ len: 446 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 446 aa overlap). Probable glnA2,
+ glutamine synthetase class II (EC 6.3.1.2), similar to
+ others. Also similar to three other potential glutamine
+ synthetases in Mycobacterium tuberculosis: Rv2220|glnA1,
+ Rv2860c|glnA4, and Rv1878|glnA3. BELONGS TO THE GLUTAMINE
+ SYNTHETASE FAMILY. Protein product from Mb2246c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2246c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUTAMINE SYNTHETASE GLNA2 (GLUTAMINE
+ SYNTHASE) (GS-II)"
+ /protein_id="SIU00854.1"
+ /db_xref="GOA:P64246"
+ /db_xref="InterPro:IPR008146"
+ /db_xref="InterPro:IPR008147"
+ /db_xref="InterPro:IPR014746"
+ /db_xref="InterPro:IPR027303"
+ /db_xref="InterPro:IPR036651"
+ /db_xref="UniProtKB/Swiss-Prot:P64246"
+ /translation="MDRQKEFVLRTLEERDIRFVRLWFTDVLGFLKSVAIAPAELEGA
+ FEEGIGFDGSSIEGFARVSESDTVAHPDPSTFQVLPWATSSGHHHSARMFCDITMPDG
+ SPSWADPRHVLRRQLTKAGELGFSCYVHPEIEFFLLKPGPEDGSVPVPVDNAGYFDQA
+ VHDSALNFRRHAIDALEFMGISVEFSHHEGAPGQQEIDLRFADALSMADNVMTFRYVI
+ KEVALEEGARASFMPKPFGQHPGSAMHTHMSLFEGDVNAFHSADDPLQLSEVGKSFIA
+ GILEHACEISAVTNQWVNSYKRLVQGGEAPTAASWGAANRSALVRVPMYTPHKTSSRR
+ VEVRSPDSACNPYLTFAVLLAAGLRGVEKGYVLGPQAEDNVWDLTPEERRAMGYRELP
+ SSLDSALRAMEASELVAEALGEHVFDFFLRNKRTEWANYRSHVTPYELRTYLSL"
+ gene complement(2477395..2478957)
+ /locus_tag="BQ2027_MB2247C"
+ CDS complement(2477395..2478957)
+ /locus_tag="BQ2027_MB2247C"
+ /note="Mb2247c, -, len: 520 aa. Equivalent to Rv2223c,
+ len: 520 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 520 aa overlap). Probable exported
+ protease (EC 3.4.-.-); has signal sequence. Very similar
+ to three proteases/peptidases from Streptomyces spp.:
+ L42758, L42759, L27466. FASTA score: L42758|STMSLPD
+ STMSLPD NID: g940302 - Streptomyces (539 aa) opt: 1032
+ E(): 0, (37.5% identity in 533 aa overlap). Also similar
+ to hypothetical proteins SW:YZZE _ECOLI P34211 (25.4%
+ identity in 406 aa overlap) and PIR:B36944 in ompP 3'
+ region (27.5% identity in 218 aa overlap). Highly similar
+ to Rv2224c and Rv2672 (49.3% identity in 507 aa overlap);
+ contains PS00120 Lipases, serine active site,Mb2247c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable exported protease"
+ /protein_id="SIU00855.1"
+ /db_xref="GOA:P65822"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR013595"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/Swiss-Prot:P65822"
+ /translation="MAAMWRRRPLSSALLSFGLLLGGLPLAAPPLAGATEEPGAGQTP
+ GAPVVAPQQSWNSCREFIADTSEIRTARCATVSVPVDYDQPGGTQAKLAVIRVPATGQ
+ RFGALLVNPGGPGASAVDMVAAMAPAIADTDILRHFDLVGFDPRGVGHSTPALRCRTD
+ AEFDAYRRDPMADYSPAGVTHVEQVYRQLAQDCVDRMGFSFLANIGTASVARDMDMVR
+ QALGDDQINYLGYSYGTELGTAYLERFGTHVRAMVLDGAIDPAVSPIEESISQMAGFQ
+ TAFNDYAADCARSPACPLGTDSAQWVNRYHALVDPLVQKPGKTSDPRGLSYADATTGT
+ INALYSPQRWKYLTSGLLGLQRGSDAGDLLVLADDYDGRDADGHYSNDQDAFNAVRCV
+ DAPTPADPAAWVAADQRIRQVAPFLSYGQFTGSAPRDLCALWPVPATSTPHPAAPAGA
+ GKVVVVSTTHDPATPYQSGVDLARQLGAPLITFDGTQHTAVFDGNQCVDSAVMHYFLD
+ GTLPPTSLRCAP"
+ gene complement(2479019..2480581)
+ /gene="caea"
+ /locus_tag="BQ2027_MB2248C"
+ CDS complement(2479019..2480581)
+ /gene="caea"
+ /locus_tag="BQ2027_MB2248C"
+ /note="Mb2248c, -, len: 520 aa. Equivalent to Rv2224c,
+ len: 520 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 520 aa overlap). Probable exported
+ protease (EC 3.4.-.-); has signal sequence and lipoprotein
+ motif at N-terminal end. Very similar to three
+ proteases/peptidases from Streptomyces spp.: L42758,
+ L42759, L27466. FASTA score: L4 2758|STMSLPD STMSLPD NID:
+ g940302 - Streptomyces (539 aa) opt: 1032 E(): 0, (37.5%
+ identity in 533 aa overlap). Similar to hypothetical
+ protein SW:YZZE_ECOLI P34211 (27.7% identity in 412 aa
+ overlap) and highly similar to Rv2224c and Rv2672 (49.3%
+ identity in 507 aa overlap); contains PS00013, Prokaryotic
+ membrane lipoprotein lipid attachment site, and PS00120
+ Lipases, serine active site. Protein product from Mb2248c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2248c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable carboxylesterase caea"
+ /protein_id="SIU00856.1"
+ /db_xref="GOA:P65824"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/Swiss-Prot:P65824"
+ /translation="MGMRLSRRDKIARMLLIWAALAAVALVLVGCIRVVGGRARMAEP
+ KLGQPVEWTPCRSSNPQVKIPGGALCGKLAVPVDYDRPDGDVAALALIRFPATGDKIG
+ SLVINPGGPGESGIEAALGVFQTLPKRVHERFDLVGFDPRGVASSRPAIWCNSDADND
+ RLRAEPQVDYSREGVAHIENETKQFVGRCVDKMGKNFLAHVGTVNVAKDLDAIRAALG
+ DDKLTYLGYSYGTRIGSAYAEEFPQRVRAMILDGAVDPNADPIEAELRQAKGFQDAFN
+ NYAADCAKNAGCPLGADPAKAVEVYHSLVDPLVDPDNPRISRPARTKDPRGLSYSDAI
+ VGTIMALYSPNLWQHLTDGLSELVDNRGDTLLALADMYMRRDSHGRYNNSGDARVAIN
+ CVDQPPVTDRDKVIDEDRRAREIAPFMSYGKFTGDAPLGTCAFWPVPPTSQPHAVSAP
+ GLVPTVVVSTTHDPATPYKAGVDLANQLRGSLLTFDGTQHTVVFQGDSCIDEYVTAYL
+ IGGTTPPSGAKC"
+ gene 2481300..2482145
+ /gene="panB"
+ /locus_tag="BQ2027_MB2249"
+ CDS 2481300..2482145
+ /gene="panB"
+ /locus_tag="BQ2027_MB2249"
+ /note="Mb2249, panB, len: 281 aa. Equivalent to Rv2225,
+ len: 281 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 281 aa overlap). Probable panB,
+ 3-methyl-2-oxobutanoate hydroxymethyltransferase (EC
+ 2.1.2.11), similar to PANB_ECOLI|P31057
+ 3-methyl-2-oxobutanoate hydroxymethyltransferase from
+ Escherichia coli (45.9% identity in 257 aa overlap).
+ Protein product from Mb2249 detected using SWATH mass
+ spectrometry. Mb2249 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="3-methyl-2-oxobutanoate hydroxymethyltransferase
+ panb"
+ /protein_id="SIU00857.1"
+ /db_xref="GOA:P0C2T4"
+ /db_xref="InterPro:IPR003700"
+ /db_xref="InterPro:IPR015813"
+ /db_xref="InterPro:IPR040442"
+ /db_xref="UniProtKB/Swiss-Prot:P0C2T4"
+ /translation="MSEQTIYGANTPGGSGPRTKIRTHHLQRWKADGHKWAMLTAYDY
+ STARIFDEAGIPVLLVGDSAANVVYGYDTTVPISIDELIPLVRGVVRGAPHALVVADL
+ PFGSYEAGPTAALAAATRFLKDGGAHAVKLEGGERVAEQIACLTAAGIPVMAHIGFTP
+ QSVNTLGGFRVQGRGDAAEQTIADAIAVAEAGAFAVVMEMVPAELATQITGKLTIPTV
+ GIGAGPNCDGQVLVWQDMAGFSGAKTARFVKRYADVGGELRRAAMQYAQEVAGGVFPA
+ DEHSF"
+ gene 2482390..2483931
+ /locus_tag="BQ2027_MB2250"
+ CDS 2482390..2483931
+ /locus_tag="BQ2027_MB2250"
+ /note="Mb2250, -, len: 513 aa. Equivalent to Rv2226, len:
+ 513 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 513 aa overlap). Conserved hypothetical
+ protein, similar to hypothetical secreted protein (510 aa)
+ from Streptomyces coelicolor A3(2) emb|CAB59601.1|
+ (AL132662) hypothetical secreted protein [Streptomyces
+ coelicolor. Smith-Waterman scores Expect = 5e-44
+ Identities = 166/506 (32%) Protein product from Mb2250
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2250 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CHAD domain containing protein"
+ /protein_id="SIU00858.1"
+ /db_xref="InterPro:IPR007899"
+ /db_xref="InterPro:IPR023577"
+ /db_xref="InterPro:IPR033469"
+ /db_xref="InterPro:IPR038186"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0J1"
+ /translation="MPVEAPRPARHLEVERKFDVIESTVSPSFEDIAAVVRVEQSPTQ
+ QLDAVYFDTPSHDLARNQITLRRRTGGADAGWHLKLPAGPDKRTEMRAPLSASGDAVP
+ AELLDVVLAIVRDQPVQPVARISTHRESQILYGAGGDALAEFCNDDVTAWSAGAFHAA
+ GAADNGPAEQQWREWELELVTTDGTADTKLLDRLANRLLDAGAAPAGHGSKLARVLGA
+ TSPGELPNGPQPPADPVHRAVSEQVEQLLLWDRAVRADAYDAVHQMRVTTRKIRSLLT
+ DSQESFGLKESAWVIDELRELANVLGVARDAEVLGDRYQRELDALAPELVRGRVRERL
+ VDGARRRYQTGLRRSLIALRSQRYFRLLDALDALVSERAHATSGEESAPVTIDAAYRR
+ VRKAAKAAKTAGDQAGDHHRDEALHLIRKRAKRLRYTAAATGADNVSQEAKVIQTLLG
+ DHQDSVVSREHLIQQAIAANTAGEDTFTYGLLYQQEADLAERCREQLEAALRKLDKAV
+ RKARD"
+ gene complement(2484003..2484309)
+ /gene="rnpB"
+ misc_RNA complement(2484003..2484309)
+ /gene="rnpB"
+ /product="ribonuclease P RNA"
+ /note="rnpB, len: 307 nt. Equivalent to rnpB, len: 307
+ nt,from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 307 nt overlap). rna component of RNase P."
+ gene 2484489..2484809
+ /locus_tag="BQ2027_MB2251"
+ CDS 2484489..2484809
+ /locus_tag="BQ2027_MB2251"
+ /note="Mb2251, -, len: 106 aa. Equivalent to 5' end of
+ Rv2227, len: 233 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (93.8% identity in 80 aa overlap). Conserved
+ hypothetical protein, similar to conserved hypothetical
+ proteins from various bacteria e.g. gb|AAK22693.1|
+ (AE005746) conserved hypothetical protein from Caulobacter
+ crescentus (234 aa) Smith-Waterman score = 109 bits (429),
+ Expect = 1e-41 Identities = 83/167 (49%).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv2227 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a 1 bp to 2 bp
+ substitution (t-cc) splits Rv2227 in two parts, Mb2251 and
+ Mb2252."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein [FIRST PART]"
+ /protein_id="SIU00859.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0L3"
+ /translation="MGQTRRLRRLGRHRCRGQRVRWRTATSADHPRRGRPAAQAVRRR
+ RPVSLDGRYGIQAVRRRAVSIFPCPLSRADRASQAGAVSQTAADSAQLVGQTGPGGAL
+ ARQP"
+ gene 2484817..2485191
+ /locus_tag="BQ2027_MB2252"
+ CDS 2484817..2485191
+ /locus_tag="BQ2027_MB2252"
+ /note="Mb2252, -, len: 124 aa. Equivalent to 3' end of
+ Rv2227, len: 233 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.2% identity in 124 aa overlap).
+ Conserved hypothetical protein, similar to conserved
+ hypothetical proteins from various bacteria e.g.
+ gb|AAK22693.1| (AE005746) conserved hypothetical protein
+ from Caulobacter crescentus (234 aa) Smith-Waterman score
+ = 109 bits (429), Expect = 1e-41 Identities = 83/167
+ (49%). REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv2227 exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a 1 bp to 2 bp
+ substitution (t-cc) splits Rv2227 in two parts, Mb2251 and
+ Mb2252."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein [SECOND PART]"
+ /protein_id="SIU00860.1"
+ /db_xref="InterPro:IPR018655"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0M4"
+ /translation="MASCHAAGQTRSTALMLKYGTNDWNALHQDLYGELVFPLQVVIN
+ LSDPETDYTGGEFLLVEQRPRAQSRGTAMQLPQGHGYVLTTRDRPVRTSRGWSASPVR
+ HGLSTIRSGERYAMGLIFHDAA"
+ gene complement(2485203..2486297)
+ /locus_tag="BQ2027_MB2253C"
+ CDS complement(2485203..2486297)
+ /locus_tag="BQ2027_MB2253C"
+ /note="Mb2253c, -, len: 364 aa. Equivalent to Rv2228c,
+ len: 364 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 364 aa overlap). Conserved
+ hypothetical protein. Some similarity to phosphoglycerate
+ mutase and ribonuclease H. Similar to CAB88177.1|AL352972
+ putative bifunctional protein (ribonuclease
+ H/phosphoglycerate mutase) from Streptomyces coelicolor
+ A3(2) (497 aa); Smith-Waterman scores: 107 bits (424),
+ Expect = 4e-41 Identities = 160/485 (32%). Also similar in
+ C-terminal part to Rv2419c and Rv2135c. Protein product
+ from Mb2253c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb2253c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="multifunctional protein. has rnase
+ h,alpha-ribazole phosphatase, and acid phosphatase
+ activities."
+ /protein_id="SIU00861.1"
+ /db_xref="GOA:P64956"
+ /db_xref="InterPro:IPR002156"
+ /db_xref="InterPro:IPR012337"
+ /db_xref="InterPro:IPR013078"
+ /db_xref="InterPro:IPR014636"
+ /db_xref="InterPro:IPR029033"
+ /db_xref="InterPro:IPR036397"
+ /db_xref="UniProtKB/Swiss-Prot:P64956"
+ /translation="MKVVIEADGGSRGNPGPAGYGAVVWTADHSTVLAESKQAIGRAT
+ NNVAEYRGLIAGLDDAVKLGATEAAVLMDSKLVVEQMSGRWKVKHPDLLKLYVQAQAL
+ ASQFRRINYEWVPRARNTYADRLANDAMDAAAQSAAADADPAKIVATESPTSPGWTGA
+ RGTPTRLLLLRHGQTELSEQRRYSGRGNPGLNEVGWRQVGAAAGYLARRGGIAAVVSS
+ PLQRAYDTAVTAARALALDVVVDDDLVETDFGAWEGLTFAEAAERDPELHRRWLQDTS
+ ITPPGGESFDDVLRRVRRGRDRIIVGYEGATVLVVSHVTPIKMLLRLALDAGSGVLYR
+ LHLDLASLSIAEFYADGASSVRLVNQTGYL"
+ gene complement(2486294..2487031)
+ /locus_tag="BQ2027_MB2254C"
+ CDS complement(2486294..2487031)
+ /locus_tag="BQ2027_MB2254C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2254c, -, len: 245 aa. Equivalent to Rv2229c,
+ len: 245 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 245 aa overlap). Conserved hypothetical
+ protein; probable coiled-coil protein similar to conserved
+ hypothetical proteins in Actinomycetes. Equivalent to
+ Mycobacterium leprae ML1638 (232 aa), FASTA scores: opt:
+ 868 E(): 4.4e-43; 60.870% identity in 230 aa overlap
+ emb|CAC30589.1| (AL583922) Protein product from Mb2254c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2254c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Zn-ribbon protein, possibly nucleic
+ acid-binding"
+ /protein_id="SIU00862.1"
+ /db_xref="InterPro:IPR003743"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0L9"
+ /translation="MKAGVAQQRSLLELAKLDAELTRIAHRATHLPQRAAYQQVQAEH
+ NAANDRMAALRIAAEDLDGQVSRFESEIDAVRKRGDRDRSLLTSGATDAKQLADLQHE
+ LDSLQRRQASLEDALLEVLERREELQAQQTAESRALQALRADLAAAQQALDEALAEID
+ QARHQHSSQRDMLTATLDPELAGLYERQRAGGGPGAGRLQGHRCGACRIEIGRGELAQ
+ ISAAAEDEVVRCPECGAILLQLEGFEE"
+ gene complement(2487028..2488167)
+ /locus_tag="BQ2027_MB2255C"
+ CDS complement(2487028..2488167)
+ /locus_tag="BQ2027_MB2255C"
+ /note="Mb2255c, -, len: 379 aa. Equivalent to Rv2230c,
+ len: 379 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 379 aa overlap). Conserved
+ hypothetical protein. Equivalent to Mycobacterium leprae,
+ ML1639, conserved hypothetical protein (385 aa). Similar
+ to hypothetical proteins from B. subtilis, P54472, and L.
+ monocytogenes, P53434. FASTA score: ML1639 (MLCB1243.36)
+ opt: 2088, E(): 4e-107; 79.481% identity in 385 aa overlap
+ same as >pir||T44719 hypothetical protein MLCB1243.36
+ [imported] - Mycobacterium leprae
+ >gi|3150237|emb|CAA19217.1| (AL023635); P54472|YQFO_BACSU
+ HYPOTHETICAL 30. 7 KD PROTEIN IN (279 aa) opt: 604; E():
+ 2.2e-30; 38.8% identity in 258 aa overlap.
+ P53434|YRP2_LISMO HYPOTHETICAL 41.4 KD PROTEIN (373 aa)
+ opt: 595, E(): 1e-29; 30.7% identity in 326 aa overlap
+ Protein product from Mb2255c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2255c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="GTP cyclohydrolase 1 type 2 homolog YbgI"
+ /protein_id="SIU00863.1"
+ /db_xref="GOA:P0A657"
+ /db_xref="InterPro:IPR002678"
+ /db_xref="InterPro:IPR015867"
+ /db_xref="InterPro:IPR017221"
+ /db_xref="InterPro:IPR036069"
+ /db_xref="UniProtKB/Swiss-Prot:P0A657"
+ /translation="MSVRLADVIDVLDQAYPPRLAQSWDSVGLVCGDPDDVVDSVTVA
+ VDATPAVVDQVPQAGLLLVHHPLLLRGVDTVAANTPKGVLVHRLIRTGRSLFTAHTNA
+ DSASPGVSDALAHAVGLTVDAVLDPVPGAADLDKWVIYVPRENSEAVRAAVFEAGAGH
+ IGDYSHCSWSVAGTGQFLAHDGASPAIGSVGTVERVAEDRVEVVAPARARAEVLAAMR
+ AAHPYEEPAFDIFALVPPPVGSGLGRIGRLPKPEPLRTFVARLEAALPPTATGVRAAG
+ DPDLLVSRVAVCGGAGDSLLATVAAADVQAYVTADLRHHPADEHCRASQVALIDVAHW
+ ASEFPWCGQAAEVLRSHFGASLPVRVCTICTDPWNLDHETGRDQA"
+ gene complement(2488164..2489258)
+ /gene="cobC"
+ /locus_tag="BQ2027_MB2256C"
+ CDS complement(2488164..2489258)
+ /gene="cobC"
+ /locus_tag="BQ2027_MB2256C"
+ /note="Mb2256c, cobC, len: 364 aa. Equivalent to Rv2231c,
+ len: 364 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 364 aa overlap). Possible cobC,
+ aminotransferase. Note that initiation codon uncertain.
+ Similar to CobC aminotransferases e.g.
+ sp|P21633|COBC_PSEDE COBC PROTEIN (333 aa) opt: 277, E():
+ 1.7e-11; 28.8% identity in 313 aa overlap and also to e.g.
+ SW:HIS8_ECOLI P06986 histidinol-phosphate aminotransferase
+ (27.0% identity in 289 aa overlap), contains PS00105
+ aminotransferases class-I pyridoxal-phosphate attachment
+ site. Real Mycobacterium tuberculosis histidinol-phosphate
+ aminotransferase, hisC, is Rv1600 (MTCY336.04c). Protein
+ product from Mb2256c detected using SWATH mass
+ spectrometry. Mb2256c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible aminotransferase CobC"
+ /protein_id="SIU00864.1"
+ /db_xref="GOA:P63501"
+ /db_xref="InterPro:IPR004838"
+ /db_xref="InterPro:IPR004839"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="UniProtKB/Swiss-Prot:P63501"
+ /translation="MLWILGPHTGPLLFDAVASLDTSPLAAARYHGDQDVAPGVLDFA
+ VNVRHDRPPEWLVRQLAALLPELARYPSTDDVHRAQDAVAERHGRTRDEVLPLVGAAE
+ GFALLHNLSPVRAAIVVPAFTEPAIALSAAGITAHHVVLKPPFVLDTAHVPDDADLVV
+ VGNPTNPTSVLHLREQLLELRRPGRILVVDEAFADWVPGEPQSLADDSLPDVLVLRSL
+ TKTWSLAGLRVGYALGSPDVLARLTVQRAHWPLGTLQLTAIAACCAPRAVAAAAADAV
+ RLTALRAEMVAGLRSVGAEVVDGAAPFVLFNIADADGLRNYLQSKGIAVRRGDTFVGL
+ DARYLRAAVRPEWPVLVAAIAEWAKRGGRR"
+ gene complement(2489295..2489720)
+ /gene="vapC16"
+ /locus_tag="BQ2027_MB2256A"
+ CDS complement(2489295..2489720)
+ /gene="vapC16"
+ /locus_tag="BQ2027_MB2256A"
+ /note="Mb2256A, len: 141 aa. Equivalent to Rv2231A len:
+ 141 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 141 aa overlap). Transferred from
+ H37Rv annotation using Rapid Annotation Transfer Tool
+ (Nucleic Acids Res. 2011 May; 39(9): e57). Possible
+ vapC16, toxin, part of toxin-antitoxin (TA) operon with
+ Rv2231B (See Pandey and Gerdes, 2005). Nucleotide position
+ 2505919 in the genome sequence has been corrected, A:G
+ resulting in A81A."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible toxin VapC16"
+ /protein_id="SIU00865.1"
+ /db_xref="GOA:A0A1R3Y1C4"
+ /db_xref="InterPro:IPR022907"
+ /db_xref="InterPro:IPR041705"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1C4"
+ /translation="MTMACTACPTIWTLRCQTTCSNAFTGEALPHRHPRLAADAVNET
+ RAIVQDVRNSILLSAASAWEIAINYRLGKLPPPEPSASYVPDRMRRCGTSPLSVDHAH
+ TAHRRASGSPSTSIRPCAHRPGTAAWPDDHHRRRPVSCL"
+ gene complement(2489766..2489942)
+ /gene="vapB16"
+ /locus_tag="BQ2027_MB2256B"
+ CDS complement(2489766..2489942)
+ /gene="vapB16"
+ /locus_tag="BQ2027_MB2256B"
+ /note="Mb2256B, len: 58 aa. Equivalent to Rv2231B len: 58
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 58 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Possible vapB16,
+ antitoxin,part of toxin-antitoxin (TA) operon with Rv2231A
+ (See Pandey and Gerdes, 2005). Mb2256B found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible antitoxin VapB16"
+ /protein_id="SIU00866.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0S0"
+ /translation="MALWYQAMIAKFGEQVVDAKVWAPAKRVGVHEAKTRLSELLRLV
+ YGGQRLRLPAAASR"
+ gene 2489837..2490712
+ /gene="ptka"
+ /locus_tag="BQ2027_MB2257"
+ CDS 2489837..2490712
+ /gene="ptka"
+ /locus_tag="BQ2027_MB2257"
+ /note="Mb2257, -, len: 291 aa. Equivalent to Rv2232, len:
+ 291 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 291 aa overlap). Conserved
+ hypothetical protein, similar to members of haloacid
+ dehalogenase-like family from several bacteria and to
+ putative phosphatases e.g. Q9I767 and AAK78398. Contains
+ N-terminal extension. FASTA scores: Q9I767 HYPOTHETICAL
+ PROTEIN PA0065 (221 aa) opt: 439 E(): 3.2e-18; 38.679%
+ identity (40.196% ungapped) in 212 aa overlap;
+ >>tr|AAK78398 Predicted phosphatase, HAD family (216 aa)
+ opt: 427, E(): 1.5e-17; 34.762% identity (35.437%
+ ungapped) in 210 aa overlap. Replaces previous Rv2232 and
+ Rv2233. Mb2257 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="protein tyrosine kinase transcriptional
+ regulatory protein ptka"
+ /protein_id="SIU00867.1"
+ /db_xref="InterPro:IPR023198"
+ /db_xref="InterPro:IPR023214"
+ /db_xref="InterPro:IPR036412"
+ /db_xref="InterPro:IPR041492"
+ /db_xref="UniProtKB/Swiss-Prot:P68910"
+ /translation="MSSPRERRPASQAPRLSRRPPAHQTSRSSPDTTAPTGSGLSNRF
+ VNDNGIVTDTTASGTNCPPPPRAAARRASSPGESPQLVIFDLDGTLTDSARGIVSSFR
+ HALNHIGAPVPEGDLATHIVGPPMHETLRAMGLGESAEEAIVAYRADYSARGWAMNSL
+ FDGIGPLLADLRTAGVRLAVATSKAEPTARRILRHFGIEQHFEVIAGASTDGSRGSKV
+ DVLAHALAQLRPLPERLVMVGDRSHDVDGAAAHGIDTVVVGWGYGRADFIDKTSTTVV
+ THAATIDELREALGV"
+ gene 2490705..2491196
+ /gene="ptpA"
+ /locus_tag="BQ2027_MB2258"
+ CDS 2490705..2491196
+ /gene="ptpA"
+ /locus_tag="BQ2027_MB2258"
+ /standard_name="MPtpA"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2258, ptpA, len: 163 aa. Equivalent to Rv2234,
+ len: 163 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 163 aa overlap). ptpA (alternate gene
+ name: MPtpA), low molecular weight
+ protein-tyrosine-phosphatase (see citations below) (EC
+ 3.1.3.48), similar to other phosphotyrosine protein
+ phosphatases e.g. P53433|PTPA_STRCO LOW MOLECULAR WEIGHT
+ PROTEIN-TYROSINE PHOSPHATASE from Streptomyces coelicolor
+ (164 aa), FASTA scores: opt: 455, E(): 3.3e -25, (49.7%
+ identity in 155 aa overlap); PA1S_HUMAN|P24667 red cell
+ acid phosphatase 1, FASTA score: (37.7% identity in 138 aa
+ overlap); etc. Contains a phosphatase catalytic site
+ domain located in N-terminal part. Activity proven
+ biochemically. Supposed a secreted protein. Protein
+ product from Mb2258 detected using SWATH mass
+ spectrometry. Mb2258 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PHOSPHOTYROSINE PROTEIN PHOSPHATASE PTPA
+ (PROTEIN-TYROSINE-PHOSPHATASE) (PTPase) (LMW PHOSPHATASE)"
+ /protein_id="SIU00868.1"
+ /db_xref="GOA:P65717"
+ /db_xref="InterPro:IPR017867"
+ /db_xref="InterPro:IPR023485"
+ /db_xref="InterPro:IPR036196"
+ /db_xref="UniProtKB/Swiss-Prot:P65717"
+ /translation="MSDPLHVTFVCTGNICRSPMAEKMFAQQLRHRGLGDAVRVTSAG
+ TGNWHVGSCADERAAGVLRAHGYPTDHRAAQVGTEHLAADLLVALDRNHARLLRQLGV
+ EAARVRMLRSFDPRSGTHALDVEDPYYGDHSDFEEVFAVIESALPGLHDWVDERLARN
+ GPS"
+ gene 2491196..2492011
+ /locus_tag="BQ2027_MB2259"
+ CDS 2491196..2492011
+ /locus_tag="BQ2027_MB2259"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2259, -, len: 271 aa. Equivalent to Rv2235, len:
+ 271 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 271 aa overlap). Probable conserved
+ transmembrane protein (see first citation below);
+ hydrophobic regions near N- and C-terminus. Similar to
+ conserved membrane proteins in other Actinomycetes.
+ Equivalent to Mycobacterium leprae. ML1644 (270 aa). FASTA
+ scores: opt: 1357, E(): 1.2e-72; 74.170% identity in 271
+ aa overlap T44717|3150235|CAA19213.1|AL023635
+ 13093419|CAC30595.1|AL583922. Protein product from Mb2259
+ detected using SWATH mass spectrometry. Mb2259 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00869.1"
+ /db_xref="GOA:P66884"
+ /db_xref="InterPro:IPR002994"
+ /db_xref="UniProtKB/Swiss-Prot:P66884"
+ /translation="MPRLAFLLRPGWLALALVVVAFTYLCFTVLAPWQLGKNAKTSRE
+ NQQIRYSLDTPPVPLKTLLPQQDSSAPDAQWRRVTATGQYLPDVQVLARLRVVEGDQA
+ FEVLAPFVVDGGPTVLVDRGYVRPQVGSHVPPIPRLPVQTVTITARLRDSEPSVAGKD
+ PFVRDGFQQVYSINTGQVAALTGVQLAGSYLQLIEDQPGGLGVLGVPHLDPGPFLSYG
+ IQWISFGILAPIGLGYFAYAEIRARRREKAGSPPPDKPMTVEQKLADRYGRRR"
+ gene complement(2491993..2492934)
+ /gene="cobD"
+ /locus_tag="BQ2027_MB2260C"
+ CDS complement(2491993..2492934)
+ /gene="cobD"
+ /locus_tag="BQ2027_MB2260C"
+ /note="Mb2260c, cobD, len: 313 aa. Equivalent to Rv2236c,
+ len: 313 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 313 aa overlap). Probable cobD,
+ conserved membrane protein, similar to PIR:S52223
+ Rhodobacter capsulatus 945 protein BluD (39.0% identity in
+ 287 aa overlap) involved in cobinamide synthesis, and to
+ SW:COBD_PSEDE Pseudomonas dentrificans cobD protein (37.5%
+ identity in 269 aa overlap), also SW:CBIB_SALTY Salmonella
+ typhimurum cbiB protein (35.5% identity in 304 aa
+ overlap)"
+ /codon_start=1
+ /transl_table=11
+ /product="probable cobalamin biosynthesis transmembrane
+ protein cobd"
+ /protein_id="SIU00870.1"
+ /db_xref="GOA:Q7VEN1"
+ /db_xref="InterPro:IPR004485"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEN1"
+ /translation="MFASIWQTRAVGVLIGCLLDVVFGDPKRGHPVALFGRAAAKLEQ
+ ITYRDGRVAGAVHVGLLVGAVGLLGAALQRLPGRCWPVAATATATWAALGGTSLARTG
+ RQISDLLERDDVEAARRLLPSLCGRDPAQLGGPGLTRAALESVAENTADAQVVPLLWA
+ ASSGVPAVLGYRAINTLDSMIGYRSPRYLRFGWAAARLDDWANYVGARATAVLVVICA
+ PVVGGSPRGAVRAWRRDAARHPSPNAGVVEAAFAGALDVRLGGPTRYHHELQIRPTLG
+ DGRSPKVADLRRAVVLSRVVQAGAAVLAVMLVYRRRP"
+ gene 2493048..2493815
+ /locus_tag="BQ2027_MB2261"
+ CDS 2493048..2493815
+ /locus_tag="BQ2027_MB2261"
+ /note="Mb2261, -, len: 255 aa. Equivalent to Rv2237, len:
+ 255 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 255 aa overlap). Conserved
+ hypothetical protein. Similar to Mycobacterium
+ tuberculosis hypothetical proteins Rv0276, Rv0826,
+ Rv1645c. FASTA score: Rv0276 gp|AL021930|MTV035_4 (306 aa)
+ opt: 874, E(): 0; 49.6% identity in 282 aa overlap Protein
+ product from Mb2261 detected using SWATH mass
+ spectrometry. Mb2261 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00871.1"
+ /db_xref="GOA:P64958"
+ /db_xref="InterPro:IPR018713"
+ /db_xref="UniProtKB/Swiss-Prot:P64958"
+ /translation="MLLPAANVIMQLAVPGVGYGVLESPVDSGNVYKHPFKRARTTGT
+ YLAVATIGTESDRALIRGAVDVAHRQVRSTASSPVSYNAFDPKLQLWVAACLYRYFVD
+ QHEFLYGPLEDATADAVYQDAKRLGTTLQVPEGMWPPDRVAFDEYWKRSLDGLQIDAP
+ VREHLRGVASVAFLPWPLRAVAGPFNLFATTGFLAPEFRAMMQLEWSQAQQRRFEWLL
+ SVLRLADRLIPHRAWIFVYQLYLWDMRFRARHGRRIV"
+ gene complement(2493910..2494146)
+ /locus_tag="BQ2027_MB2261A"
+ CDS complement(2493910..2494146)
+ /locus_tag="BQ2027_MB2261A"
+ /note="Mb2261A, len: 78 aa. Equivalent to Rv2237A len: 78
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 78 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Conserved protein.
+ Protein product from Mb2261A detected using SWATH mass
+ spectrometry. Mb2261A found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Conserved protein"
+ /protein_id="SIU00872.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0N1"
+ /translation="MLRCRRGAGYGSVVVVGERPGFQSDSAARQTAPPVRPMTSDQLP
+ ATKADLYAAVDAMRADMRELLEQISTLIREATQK"
+ gene complement(2494157..2494228)
+ /locus_tag="BQ2027_VALV"
+ tRNA complement(2494157..2494228)
+ /locus_tag="BQ2027_VALV"
+ /product="tRNA-Val"
+ /note="valV, len: 72 nt. Equivalent to valV, len: 72 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 72 nt overlap). tRNA-Val, anticodon tac."
+ gene complement(2494274..2494735)
+ /gene="ahpE"
+ /locus_tag="BQ2027_MB2262C"
+ CDS complement(2494274..2494735)
+ /gene="ahpE"
+ /locus_tag="BQ2027_MB2262C"
+ /note="Mb2262c, ahpE, len: 153 aa. Equivalent to Rv2238c,
+ len: 153 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 153 aa overlap). ahpE, peroxiredoxin.
+ Similarity to many members of AHPC/TSA family e.g.
+ sp|Q96291|BAS1_ARATH 2-CYS PEROXIREDOXIN BAS1 PRECURSOR
+ (265 aa). FASTA score: opt: 275, E(): 2.7e-12; 35.0%
+ identity in 143 aa overlap Protein product from Mb2262c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2262c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable peroxiredoxin ahpe"
+ /protein_id="SIU00873.1"
+ /db_xref="GOA:P65689"
+ /db_xref="InterPro:IPR000866"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR024706"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/Swiss-Prot:P65689"
+ /translation="MLNVGATAPDFTLRDQNQQLVTLRGYRGAKNVLLVFFPLAFTGI
+ CQGELDQLRDHLPEFENDDSAALAISVGPPPTHKIWATQSGFTFPLLSDFWPHGAVSQ
+ AYGVFNEQAGIANRGTFVVDRSGIIRFAEMKQPGEVRDQRLWTDALAALTA"
+ gene complement(2494735..2495211)
+ /locus_tag="BQ2027_MB2263C"
+ CDS complement(2494735..2495211)
+ /locus_tag="BQ2027_MB2263C"
+ /note="Mb2263c, -, len: 158 aa. Equivalent to Rv2239c,
+ len: 158 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 158 aa overlap). Conserved
+ hypothetical protein, similar to conserved hypothetical
+ proteins from Mycobacterium leprae (ML1649, 140 aa) and
+ Streptomyces coelicolor A3(2) (SCC8A.28c, 159 aa).
+ Equivalent to ML1649 conserved hypothetical protein (140
+ aa). FASTA scores: ML1649 conserved hypothetical protein
+ (140 aa) opt: 846, E(): 6.5e-45; 86.429% identity in 140
+ aa overlap (tr|O69479|O69479 HYPOTHETICAL 15.2 KDA PROTEIN
+ (140 aa); and opt: 447, E(): 1.2e-21; 50.355% identity
+ (51.825% ungapped) in 141 aa overlap. Similarity with
+ ML1649 suggests alternative start at 251198. Protein
+ product from Mb2263c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2263c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="cell redox homeostasis"
+ /protein_id="SIU00874.1"
+ /db_xref="InterPro:IPR021412"
+ /db_xref="UniProtKB/Swiss-Prot:P64960"
+ /translation="MPIATVCTWPAETEGGSTVVAADHASNYARKLGIQRDQLIQEWG
+ WDEDTDDDIRAAIEEACGGELLDEDTDEVIDVVLLWWRDGDGDLVDTLMDAIGPLAED
+ GVIWVVTPKTGQPGHVLPAEIAEAAPTAGLMPTSSVNLGNWSASRLVQPKSRAGKR"
+ gene complement(2495249..2495839)
+ /locus_tag="BQ2027_MB2264C"
+ CDS complement(2495249..2495839)
+ /locus_tag="BQ2027_MB2264C"
+ /note="Mb2264c, len: 196 aa. Equivalent to Rv2240c len:
+ 196 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 196 aa overlap). Unknown protein. Start
+ changed since first submission (-69 aa). Protein product
+ from Mb2264c detected using SWATH mass spectrometry.
+ Mb2264c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00875.1"
+ /db_xref="GOA:A0A1R3Y1D4"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1D4"
+ /translation="MLIGWRAVPRRHGGELPRRGALALGCIALLLMGIVGCTTVTDGT
+ AMPDTNVAPAYRSSVSASVSASAATSSIRESQRQQSLTTKAIRTSCDALAATSKDAID
+ KVNAYVAAFNQGRNTGPTEGPAIDALNNSASTVSGSLSAALSAQLGDALNAYVDAARA
+ VANAIGAHASTAEFNRRVDRLNDTKTKALKMCVAAF"
+ gene 2496098..2498803
+ /gene="aceE"
+ /locus_tag="BQ2027_MB2265"
+ CDS 2496098..2498803
+ /gene="aceE"
+ /locus_tag="BQ2027_MB2265"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2265, aceE, len: 901 aa. Equivalent to Rv2241,
+ len: 901 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.9% identity in 901 aa overlap). Probable aceE,
+ pyruvate dehydrogenase E1 component (EC 1.2.4.1), similar
+ to others e.g. ODP1_ECOLI|P06958 pyruvate dehydrogenase E1
+ component from Escherichia coli, FASTA score: (51.2%
+ identity in 891 aa overlap); etc. Protein product from
+ Mb2265 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2265 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pyruvate dehydrogenase e1 component acee
+ (pyruvate decarboxylase) (pyruvate dehydrogenase) (pyruvic
+ dehydrogenase)"
+ /protein_id="SIU00876.1"
+ /db_xref="GOA:A0A1R3Y0S8"
+ /db_xref="InterPro:IPR004660"
+ /db_xref="InterPro:IPR005474"
+ /db_xref="InterPro:IPR009014"
+ /db_xref="InterPro:IPR029061"
+ /db_xref="InterPro:IPR035807"
+ /db_xref="InterPro:IPR041621"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0S8"
+ /translation="MASYLPDIDPEETSEWLESFDTLLQRCGPSRARYLMLRLLERAG
+ EQRVAIPALTSTDYVNTIPTELEPWFPGDEDVERRYRAWIRWNAAIMVHRAQRPGVGV
+ GGHISTYASSAALYEVGFNHFFRGKSHPGGGDQVFIQGHASPGIYARAFLEGRLTAEQ
+ LDGFRQEHSHVGGGLPSYPHPRLMPDFWEFPTVSMGLGPLNAIYQARFNHYLHDRGIK
+ DTSDQHVWCFLGDGEMDEPESRGLAHVGALEGLDNLTFVINCNLQRLDGPVRGNGKII
+ QELESFFRGAGWNVIKVVWGREWDALLHADRDRALVNLMNTTPDGDYQTYKANDGGYV
+ RDHFFGRDPRTKALVENMSDQDIWNLKRGGHDYRKVYAAYRAAVDHKGQPTVILAKTI
+ KGYALGKHFEGRNATHQMKKLTLEDLKEFRDTQRIPVSDAQLEENPYLPPYYHPGLNA
+ PEIRYMLDRRRALGGFVPERRTKSKALTLPGRDIYAPLKKGSGHQEVATTMATVRTFK
+ EVLRDKQIGPRIVPIIPDEARTFGMDSWFPSLKIYNRNGQLYTAVDADLMLAYKESEV
+ GQILHEGINEAGSVGSFIAAGTSYATHNEPMIPIYIFYSMFGFQRTGDSFWAAADQMA
+ RGFVLGATAGRTTLTGEGLQHADGHSLLLAATNPAVVAYDPAFAYEIAYIVESGLARM
+ CGENPENIFFYITVYNEPYVQPPEPENFDPEGVLRGIYRYHAATEQRTNKAQILASGV
+ AMPAALRAAQMLAAEWDVAADVWSVTSWGELNRDGVAIETEKLRHPDRPAGVPYVTRA
+ LENARGPVIAVSDWMRAVPEQIRPWVPGTYLTLGTDGFGFSDTRPAARRYFNTDAESQ
+ VVAVLEALAGDGEIDPSVPVAAARQYRIDDVAAAPEQTTDPGPGA"
+ gene 2498863..2500107
+ /locus_tag="BQ2027_MB2266"
+ CDS 2498863..2500107
+ /locus_tag="BQ2027_MB2266"
+ /note="Mb2266, -, len: 414 aa. Equivalent to Rv2242, len:
+ 414 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 414 aa overlap). Conserved
+ hypothetical protein. Equivalent to ML1652 conserved
+ hypothetical protein from Mycobacterium leprae (414 aa),
+ and ortholog in Streptomyces coelicolor A3(2). FASTA
+ scores: ML1652 opt: 2369, E(): 4.2e-128; 88.406% identity
+ in 414 aa overlap (AL023635)(AL583922). some similarity at
+ 3' end with S25203 srmR protein - Streptomyces ambofaciens
+ (604 aa) opt: 188 E(): 9e-05; (26.4% identity in 277 aa
+ overlap) and with SW:YAEG_HAEIN P44509 hypothetical
+ protein HI0093 (42.3% identity in 52 aa overlap). Contains
+ possible helix-turn-helix motif at aa 360-381 (+3.52 SD)
+ Protein product from Mb2266 detected using SWATH mass
+ spectrometry. Mb2266 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator, CdaR-family"
+ /protein_id="SIU00877.1"
+ /db_xref="InterPro:IPR025736"
+ /db_xref="InterPro:IPR041522"
+ /db_xref="InterPro:IPR042070"
+ /db_xref="UniProtKB/Swiss-Prot:P63750"
+ /translation="MNDNQLAPVARPRSPLELLDTVPDSLLRRLKQYSGRLATEAVSA
+ MQERLPFFADLEASQRASVALVVQTAVVNFVEWMHDPHSDVGYTAQAFELVPQDLTRR
+ IALRQTVDMVRVTMEFFEEVVPLLARSEEQLTALTVGILKYSRDLAFTAATAYADAAE
+ ARGTWDSRMEASVVDAVVRGDTGPELLSRAAALNWDTTAPATVLVGTPAPGPNGSNSD
+ GDSERASQDVRDTAARHGRAALTDVHGTWLVAIVSGQLSPTEKFLKDLLAAFADAPVV
+ IGPTAPMLTAAHRSASEAISGMNAVAGWRGAPRPVLARELLPERALMGDASAIVALHT
+ DVMRPLADAGPTLIETLDAYLDCGGAIEACARKLFVHPNTVRYRLKRITDFTGRDPTQ
+ PRDAYVLRVAATVGQLNYPTPH"
+ gene 2500346..2501254
+ /gene="fabD"
+ /locus_tag="BQ2027_MB2267"
+ CDS 2500346..2501254
+ /gene="fabD"
+ /locus_tag="BQ2027_MB2267"
+ /standard_name="mtFabD"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2267, fabD, len: 302 aa. Equivalent to Rv2243,
+ len: 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 302 aa overlap). fabD (alternate gene
+ name: mtFabD), malonyl CoA-acyl carrier protein
+ transacylase (EC 2.3.1.39) (see citations below), highly
+ similar to e.g. A57356 acyl-CoA carrier protein
+ malonyltransferase from Streptomyces coelicolor (316 aa),
+ FASTA score: opt: 955, E(): 0, (52.6% identity in 304 aa
+ overlap); FABD_HAEIN|P43712 malonyl CoA-acyl carrier
+ protein transacylase from Haemophilus influenzae, FASTA
+ score: (30.5% identity in 308 aa overlap); and
+ FABD_ECOLI|P25715 from Escherichia coli, FASTA score:
+ (31.4% identity in 309 aa overlap). Protein product from
+ Mb2267 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2267 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MALONYL CoA-ACYL CARRIER PROTEIN TRANSACYLASE
+ FABD (Malonyl CoA:AcpM acyltransferase) (MCT)"
+ /protein_id="SIU00878.1"
+ /db_xref="GOA:P63459"
+ /db_xref="InterPro:IPR001227"
+ /db_xref="InterPro:IPR014043"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="InterPro:IPR016036"
+ /db_xref="InterPro:IPR020801"
+ /db_xref="UniProtKB/Swiss-Prot:P63459"
+ /translation="MIALLAPGQGSQTEGMLSPWLQLPGAADQIAAWSKAADLDLARL
+ GTTASTEEITDTAVAQPLIVAATLLAHQELARRCVLAGKDVIVAGHSVGEIAAYAIAG
+ VIAADDAVALAATRGAEMAKACATEPTGMSAVLGGDETEVLSRLEQLDLVPANRNAAG
+ QIVAAGRLTALEKLAEDPPAKARVRALGVAGAFHTEFMAPALDGFAAAAANIATADPT
+ ATLLSNRDGKPVTSAAAAMDTLVSQLTQPVRWDLCTATLREHTVTAIVEFPPAGTLSG
+ IAKRELRGVPARAVKSPADLDELANL"
+ gene 2501330..2501677
+ /gene="acpM"
+ /locus_tag="BQ2027_MB2268"
+ CDS 2501330..2501677
+ /gene="acpM"
+ /locus_tag="BQ2027_MB2268"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2268, acpM, len: 115 aa. Equivalent to Rv2244,
+ len: 115 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 115 aa overlap). acpM, acyl carrier
+ protein, meromycolate precursor transport, involved in
+ meromycolate extension (see citations below). Highly
+ similar to others e.g. L43074|STMFABD2|STMFABD|g870805
+ acyl carrier protein from Streptomyces glaucescens (82
+ aa), FASTA scores: opt: 298, E(): 8.4e-13, (56.6% identity
+ in 76 aa overlap); and ACP_ECOLI|P02901 acyl carrier
+ protein from Escherichia coli, FASTA score: (37.3%
+ identity in 67 aa overlap); etc. Protein product from
+ Mb2268 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2268 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MEROMYCOLATE EXTENSION ACYL CARRIER PROTEIN
+ ACPM"
+ /protein_id="SIU00879.1"
+ /db_xref="GOA:P0A4W7"
+ /db_xref="InterPro:IPR003231"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4W7"
+ /translation="MPVTQEEIIAGIAEIIEEVTGIEPSEITPEKSFVDDLDIDSLSM
+ VEIAVQTEDKYGVKIPDEDLAGLRTVGDVVAYIQKLEEENPEAAQALRAKIESENPDA
+ VANVQARLEAESK"
+ gene 2501674..2502924
+ /gene="kasA"
+ /locus_tag="BQ2027_MB2269"
+ CDS 2501674..2502924
+ /gene="kasA"
+ /locus_tag="BQ2027_MB2269"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2269, kasA, len: 416 aa. Equivalent to Rv2245,
+ len: 416 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 416 aa overlap). kasA,
+ beta-ketoacyl-ACP synthase (EC 2.3.1.41), involved in
+ meromycolate extension (see citations below): belongs to
+ the FAS-II system, which utilizes primarily palmitoyl-ACP
+ rather than short-chain acyl-ACP primers. Highly similar
+ to others e.g. L43074|STMFABD3|g870805 beta-ketoacyl-ACP
+ synthase from Streptomyces glaucescens (423 aa), FASTA
+ scores: opt: 1105, E(): 0, (44.6% identity in 417 aa
+ overlap); FABF_ECOLI|P39435
+ 3-oxoacyl-[acyl-carrier-protein] synthase II from
+ Escherichia coli, FASTA score: (39.4% identity in 254 aa
+ overlap); FABB_HORVU|P23902
+ 3-oxoacyl-[acyl-carrier-protein] synthase I, FASTA score:
+ (33.4% identity in 413 aa overlap); etc. Strongest
+ similarity to downstream ORF kasB|Rv2246|MTCY427.27
+ 3-oxoacyl-[acyl-carrier-protein] synthase 2 from
+ Mycobacterium tuberculosis (438 aa), FASTA score: (66.3%
+ identity in 409 aa overlap). BELONGS TO THE
+ BETA-KETOACYL-ACP SYNTHASES FAMILY. Protein product from
+ Mb2269 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2269 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="3-OXOACYL-[ACYL-CARRIER PROTEIN] SYNTHASE 1 KASA
+ (BETA-KETOACYL-ACP SYNTHASE) (KAS I)"
+ /protein_id="SIU00880.1"
+ /db_xref="GOA:P63455"
+ /db_xref="InterPro:IPR000794"
+ /db_xref="InterPro:IPR014030"
+ /db_xref="InterPro:IPR014031"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020841"
+ /db_xref="UniProtKB/Swiss-Prot:P63455"
+ /translation="MSQPSTANGGFPSVVVTAVTATTSISPDIESTWKGLLAGESGIH
+ ALEDEFVTKWDLAVKIGGHLKDPVDSHMGRLDMRRMSYVQRMGKLLGGQLWESAGSPE
+ VDPDRFAVVVGTGLGGAERIVESYDLMNAGGPRKVSPLAVQMIMPNGAAAVIGLQLGA
+ RAGVMTPVSACSSGSEAIAHAWRQIVMGDADVAVCGGVEGPIEALPIAAFSMMRAMST
+ RNDEPERASRPFDKDRDGFVFGEAGALMLIETEEHAKARGAKPLARLLGAGITSDAFH
+ MVAPAADGVRAGRAMTRSLELAGLSPADIDHVNAHGTATPIGDAAEANAIRVAGCDQA
+ AVYAPKSALGHSIGAVGALESVLTVLTLRDGVIPPTLNYETPDPEIDLDVVAGEPRYG
+ DYRYAVNNSFGFGGHNVALAFGRY"
+ gene 2502955..2504271
+ /gene="kasB"
+ /locus_tag="BQ2027_MB2270"
+ CDS 2502955..2504271
+ /gene="kasB"
+ /locus_tag="BQ2027_MB2270"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2270, kasB, len: 438 aa. Equivalent to Rv2246,
+ len: 438 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 438 aa overlap). kasB,
+ beta-ketoacyl-ACP synthase (EC 2.3.1.41), involved in
+ meromycolate extension (see citations below). Highly
+ similar or similar to others e.g. L43074|STMFABD3|g870805
+ beta-ketoacyl-ACP synthase from Streptomyces glaucescens
+ (423 aa), FASTA scores: opt: 1091, E(): 0, (44.7% identity
+ in 416 aa overlap); FABF_ECOLI|P39435
+ 3-oxoacyl-[acyl-carrier-protein] synthase II from
+ Escherichia coli, FASTA score: (37.0% identity in 411 aa
+ overlap); FABB_HORVU|P23902
+ 3-oxoacyl-[acyl-carrier-protein] synthase I, FASTA score:
+ (32.5% identity in 415 aa overlap); etc. Strongest
+ similarity to upstream ORF Rv2245|kasA|MTCY427.26
+ 3-oxoacyl-[acyl-carrier-protein] synthase 1 from
+ Mycobacterium tuberculosis (416 aa), FASTA score: (66.3%
+ identity in 409 aa overlap). BELONGS TO THE
+ BETA-KETOACYL-ACP SYNTHASES FAMILY. Protein product from
+ Mb2270 detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2270 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="3-OXOACYL-[ACYL-CARRIER PROTEIN] SYNTHASE 2 KASB
+ (BETA-KETOACYL-ACP SYNTHASE) (KAS I)"
+ /protein_id="SIU00881.1"
+ /db_xref="GOA:P63457"
+ /db_xref="InterPro:IPR000794"
+ /db_xref="InterPro:IPR014030"
+ /db_xref="InterPro:IPR014031"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020841"
+ /db_xref="UniProtKB/Swiss-Prot:P63457"
+ /translation="MGVPPLAGASRTDMEGTFARPMTELVTGKAFPYVVVTGIAMTTA
+ LATDAETTWKLLLDRQSGIRTLDDPFVEEFDLPVRIGGHLLEEFDHQLTRIELRRMGY
+ LQRMSTVLSRRLWENAGSPEVDTNRLMVSIGTGLGSAEELVFSYDDMRARGMKAVSPL
+ TVQKYMPNGAAAAVGLERHAKAGVMTPVSACASGAEAIARAWQQIVLGEADAAICGGV
+ ETRIEAVPIAGFAQMRIVMSTNNDDPAGACRPFDRDRDGFVFGEGGALLLIETEEHAK
+ ARGANILARIMGASITSDGFHMVAPDPNGERAGHAITRAIQLAGLAPGDIDHVNAHAT
+ GTQVGDLAEGRAINNALGGNRPAVYAPKSALGHSVGAVGAVESILTVLALRDQVIPPT
+ LNLVNLDPEIDLDVVAGEPRPGNYRYAINNSFGFGGHNVAIAFGRY"
+ gene 2504302..2505723
+ /gene="accD6"
+ /locus_tag="BQ2027_MB2271"
+ CDS 2504302..2505723
+ /gene="accD6"
+ /locus_tag="BQ2027_MB2271"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2271, accD6, len: 473 aa. Equivalent to Rv2247,
+ len: 473 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 473 aa overlap). accD6,
+ Acetyl/Propionyl CoA Carboxylase, beta subunit (EC
+ 6.4.1.3) (see citations below), highly similar to e.g.
+ PCCB_RHOSO|Q06101 propionyl-CoA carboxylase beta chain,
+ FASTA score: (75.1% identity in 437 aa overlap). Similar
+ to many other Acetyl/Propionyl CoA Carboxylases from
+ Mycobacterium tuberculosis. BELONGS TO THE ACCD / PCCB
+ FAMILY. Protein product from Mb2271 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb2271
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ACETYL/PROPIONYL-CoA CARBOXYLASE (BETA SUBUNIT)
+ ACCD6"
+ /protein_id="SIU00882.1"
+ /db_xref="GOA:P63408"
+ /db_xref="InterPro:IPR011762"
+ /db_xref="InterPro:IPR011763"
+ /db_xref="InterPro:IPR029045"
+ /db_xref="InterPro:IPR034733"
+ /db_xref="UniProtKB/Swiss-Prot:P63408"
+ /translation="MTIMAPEAVGESLDPRDPLLRLSNFFDDGSVELLHERDRSGVLA
+ AAGTVNGVRTIAFCTDGTVMGGAMGVEGCTHIVNAYDTAIEDQSPIVGIWHSGGARLA
+ EGVRALHAVGQVFEAMIRASGYIPQISVVVGFAAGGAAYGPALTDVVVMAPESRVFVT
+ GPDVVRSVTGEDVDMASLGGPETHHKKSGVCHIVADDELDAYDRGRRLVGLFCQQGHF
+ DRSKAEAGDTDIHALLPESSRRAYDVRPIVTAILDADTPFDEFQANWAPSMVVGLGRL
+ SGRTVGVLANNPLRLGGCLNSESAEKAARFVRLCDAFGIPLVVVVDVPGYLPGVDQEW
+ GGVVRRGAKLLHAFGECTVPRVTLVTRKTYGGAYIAMNSRSLNATKVFAWPDAEVAVM
+ GAKAAVGILHKKKLAAAPEHEREALHDQLAAEHERIAGGVDSALDIGVVDEKIDPAHT
+ RSKLTEALAQAPARRGRHKNIPL"
+ gene 2505831..2506646
+ /locus_tag="BQ2027_MB2272"
+ CDS 2505831..2506646
+ /locus_tag="BQ2027_MB2272"
+ /note="Mb2272, -, len: 271 aa. Equivalent to Rv2248, len:
+ 271 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 271 aa overlap). Conserved hypothetical
+ protein. Very similar to hypothetical Mycobacterium
+ tuberculosis proteins Rv3517, Rv1482c, Rv3555c, Rv3714c,
+ Rv1073. FASTA score: MTCY06G11.02c MTCY6G11 NID: g1877284
+ -(289 aa) opt: 366 E(): 5.3e-18; (32.1% identity in 249 aa
+ overlap). Some similarity to M. avium protein
+ AF002133|AF0021 339 AF002133 NID: g2183254 (346 aa) opt:
+ 308 E(): 5.2e-14; (28.3% identity in 254 aa
+ overlap),Mb2272 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00883.1"
+ /db_xref="InterPro:IPR011335"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0M0"
+ /translation="MTRQQLDVQVKNGGLVRVWYGVYAAQEPDLLGRLAALDVFMGGH
+ AVACLGTAAALYGFDTENTVAIHMLDPGVRMRPTVGLMVHQRVGARLQRVSGRLATAP
+ AWTAVEVARQLRRPRALATLEAALRSMRCARSEIENAVAEQRGRRGIVAARELLPFAD
+ GRAESAMESEARLVMIDHGLPLPELQYPIHGHGGEMWRVDFAWPDMRLAAEYESIEWH
+ AGPAEMLRDKTRWAKLQELGWTIVPIVVDDVRREPGRLAARIARHLDRARMAG"
+ gene complement(2506715..2508265)
+ /gene="glpD1"
+ /locus_tag="BQ2027_MB2273C"
+ CDS complement(2506715..2508265)
+ /gene="glpD1"
+ /locus_tag="BQ2027_MB2273C"
+ /note="Mb2273c, glpD1, len: 516 aa. Equivalent to Rv2249c,
+ len: 516 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 516 aa overlap). Probable glpD1,
+ glycerol-3-phosphate dehydrogenase, similar to
+ SW:GLPD_ECOLI P13035 aerobic glycerol-3-phosphate
+ dehydrogenase (30.0% identity in 486 aa overlap) and
+ SW:GLPA_ECOLI P13032 anaerobic glycerol-3-phosphate
+ dehydrogenase (28.2% identity in 504 aa overlap). Also
+ similar to Rv3302c|glpD2 glycerol-3-phosphate
+ dehydrogenase. COFACTOR: FAD (BY SIMILARITY). BELONGS TO
+ THE FAD-DEPENDENT GLYCEROL-3-PHOSPHATE DEHYDROGENASE
+ FAMILY. Protein product from Mb2273c detected using SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLYCEROL-3-PHOSPHATE DEHYDROGENASE
+ GLPD1"
+ /protein_id="SIU00884.1"
+ /db_xref="GOA:P64183"
+ /db_xref="InterPro:IPR000447"
+ /db_xref="InterPro:IPR006076"
+ /db_xref="InterPro:IPR031656"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="InterPro:IPR038299"
+ /db_xref="UniProtKB/Swiss-Prot:P64183"
+ /translation="MLMPHSAALNAARRSADLTALADGGALDVIVIGGGITGVGIALD
+ AATRGLTVALVEKHDLAFGTSRWSSKLVHGGLRYLASGNVGIARRSAVERGILMTRNA
+ PHLVHAMPQLVPLLPSMGHTKRALVRAGFLAGDALRVLAGTPAATLPRSRRIPASRVV
+ EIAPTVRRDGLDGGLLAYDGQLIDDARLVMAVARTAAQHGARILTYVGASNVTGTSVE
+ LTDRRTRQSFALSARAVINAAGVWAGEIDPSLRLRPSRGTHLVFDAKSFANPTAALTI
+ PIPGELNRFVFAMPEQLGRIYLGLTDEDAPGPIPDVPQPSSEEITFLLDTVNTALGTA
+ VGTKDVIGAYAGLRPLIDTGGAGVQGRTADVSRDHAVFESPSGVISVVGGKLTEYRYM
+ AEDVLNRAITLRHLRAAKCRTRNLPLIGAPANPGPAPGSGAGLPESLVARYGAEAANV
+ AAAATCERPTEPVADGIDVTRAEFEYAVTHEGALDVDDILDRRTRIGLVPRDRERVVA
+ VAKEFLSR"
+ gene complement(2508259..2508828)
+ /locus_tag="BQ2027_MB2274C"
+ CDS complement(2508259..2508828)
+ /locus_tag="BQ2027_MB2274C"
+ /note="Mb2274c, -, len: 189 aa. Equivalent to Rv2250c,
+ len: 189 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 189 aa overlap). Possible
+ transcriptional regulatory protein, TetR family. Start
+ unclear; ORF has been shortened since first submission to
+ avoid overlap with Rv2251 (-30 aa). Contains probable
+ helix-turn-helix motif (Score 2243, +6.70 SD) Protein
+ product from Mb2274c detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible transcriptional regulatory protein"
+ /protein_id="SIU00885.1"
+ /db_xref="GOA:Q7VEN0"
+ /db_xref="InterPro:IPR001647"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR023772"
+ /db_xref="InterPro:IPR036271"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEN0"
+ /translation="MLSMSNDRADTGGRILRAAASCVVDYGVDRVTLAEIARRAGVSR
+ PTVYRRWPDTRSIMASMLTSHIAAVLREVPLDGDDREALVKQIVAVADRLRGDDLIMS
+ VMHSELARVYITERLGTSQQVLIEGLAARLTVAQRSGSVRSGDARRLATMVLLIAQST
+ IQSADIVDSILDSAALATELTHALNGYLC"
+ gene 2508876..2510465
+ /locus_tag="BQ2027_MB2275"
+ CDS 2508876..2510465
+ /locus_tag="BQ2027_MB2275"
+ /note="Mb2275, -, len: 529 aa. Similar to 5' end of
+ Rv2250A and 3' end of Rv2251, len: 139 aa and 475 aa, from
+ Mycobacterium tuberculosis strain H37Rv, (100.0% identity
+ in 108 aa overlap and 98.2% identity in 433 aa overlap).
+ Rv2250A: Conserved hypothetical protein, possibly
+ flavoprotein. Similar to N-terminus of
+ SCF91.28c|AL132973_28 possible flavoprotein from
+ Streptomyces coelicolor (530 aa), FASTA scores: opt: 240,
+ E(): 1.1e-07, (39.25% identity in 107 aa overlap).
+ Possible frameshift between nt 2525723 to 2525727. The
+ sequences of CDC 1551 and Mycobacterium bovis are missing
+ a single G base. Rv2251: Possible flavoprotein, probably
+ continuation of Rv2250A, similar to MTCY164.18 from
+ Mycobacterium tuberculosis and to several
+ ALKYLDIHYDROXYACETONEPHOSPHATE SYNTHASES (e.g. O00116).
+ Also some similarity to D-lactate dehydrogenases. FASTA
+ scores: sptr|O05784|O05784 HYPOTHETICAL 56.5 KD PROTEIN.
+ (527 aa) opt: 1019 E(): 0; (38.6% identity in 487 aa
+ overlap) and sp|O00116|ADAS_HUMAN ALKYLDIHYDROXYACETON
+ EPHOSPHATE SYNTHASE PRECURSOR (EC 2.5.1.26) (658 aa) opt:
+ 558 E(): 6.2e-27; (31.3% identity in 447 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis H37Rv, Rv2250A and Rv2251 exist as 2 genes
+ with an overlap region between them. In Mycobacterium
+ bovis, a single base deletion (g-*) leads to a single
+ product. Protein product from Mb2275 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2275 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE FLAVOPROTEIN"
+ /protein_id="SIU00886.1"
+ /db_xref="GOA:A0A1R3Y0U3"
+ /db_xref="InterPro:IPR004113"
+ /db_xref="InterPro:IPR006094"
+ /db_xref="InterPro:IPR016164"
+ /db_xref="InterPro:IPR016166"
+ /db_xref="InterPro:IPR016171"
+ /db_xref="InterPro:IPR036318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0U3"
+ /translation="MKWDAWGDPAAAKPLSDGVRSLLKQVVGLADSEQPELDPAQVQL
+ RPSALSGADHDALARIVGTEYFRTADRDRLLHAGGKSTPDLLRRKDTGVQDAPDAVLL
+ PGGPNGEDAVADILHYCSDHGIAVVPFGGGTSVVGGLDPVRNDFRAVISLDMRRFDRL
+ HRIDEVSGEAELEAGVTGPEAERLLGEHGFSLGHFPQSFEFATIGGFAATRSSGQDSA
+ GYGRFNDMILGLRMITPVGVLDLGRVPASAAGPDLRQLAIGSEGVFGVITRVRLRVHR
+ IPESTRYEAWSFPDFATGVAALRTITQTGTGPTVVRLSDEAETGVNLATTEAIGETQI
+ TGGCLGITVFEGTQEHTESRHAETRALLAARGGTSLGEGPARAWERGRFAAPYLRDSL
+ LAAGALCETLETATVWSNTPVLKAAVTEALTTSLAASGTPALVMCHVSHVYPTGASLY
+ FTVVAGQRGDPIEQWLAAKKAASDAIMATGGTITHHHAVGSDHRPWMRAEVGDLGVTL
+ LRTIKATLDPAGILNPGKLIP"
+ gene 2510462..2511391
+ /locus_tag="BQ2027_MB2276"
+ CDS 2510462..2511391
+ /locus_tag="BQ2027_MB2276"
+ /note="Mb2276, -, len: 309 aa. Equivalent to Rv2252, len:
+ 309 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 309 aa overlap). Conserved
+ hypothetical protein, similar to hypothetical proteins
+ from Bacillus subtilis (e.g. BSUB0004_120), Streptomyces
+ coelicolor A3(2) >emb|CAB61184.1| (AL132973) hypothetical
+ protein SCF91.27c (293 aa) and P39074. FASTA scores:
+ Z99107|BSUB0004_120 Bacillus subtilis complete genome (303
+ aa) opt: 397, E(): 1.7e-19; (26.4% identity in 299 aa
+ overlap) and P390 74|BMRU_BACSU BMRU PROTEIN (297 aa) opt:
+ 309, E(): 1.3e-13; (25.0% identity in 284 aa overlap).
+ Protein product from Mb2276 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2276 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="diacylglycerol kinase"
+ /protein_id="SIU00887.1"
+ /db_xref="GOA:A0A1R3Y113"
+ /db_xref="InterPro:IPR001206"
+ /db_xref="InterPro:IPR005218"
+ /db_xref="InterPro:IPR016064"
+ /db_xref="InterPro:IPR017438"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y113"
+ /translation="MSAGQLRRHEIGKVTALTNPLSGHGAAVKAAHGAIARLKHRGVD
+ VVEIVGGDAHDARHLLAAAVAKGTDAVMVTGGDGVVSNALQVLAGTDIPLGIIPAGTG
+ NDHAREFGLPTKNPKAAADIVVDGWTETIDLGRIQDDNGIEKWFGTVAATGFDSLVND
+ RANRMRWPHGRMRYYIAMLAELSRLRPLPFRLVLDGTEEIVADLTLADFGNTRSYGGG
+ LLICPNADHSDGLLDITMAQSDSRTKLLRLFPTIFKGAHVELDEVSTTRAKTVHVECP
+ GINVYADGDFACPLPAEISAVPAALQVLRPRHG"
+ gene 2511457..2511960
+ /locus_tag="BQ2027_MB2277"
+ CDS 2511457..2511960
+ /locus_tag="BQ2027_MB2277"
+ /note="Mb2277, -, len: 167 aa. Equivalent to Rv2253, len:
+ 167 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 167 aa overlap). Possible secreted
+ protein; has potential N-terminal signal peptide. Mb2277
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible secreted unknown protein"
+ /protein_id="SIU00888.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0L7"
+ /translation="MSGHRKKAMLALAAASLAATLAPNAVAAAEPSWNGQYLVTLSAN
+ AKTGTSMAANRPEYPHKANYTFSSRCASDVCIATVVDAPPPKNEFIPRPIEYTWNGTQ
+ WVREISWQWDCLLPDGTIEYAPAKSITAYTPGQYGILTGVFHTDIASGTCKGNVDMPV
+ SAKPIVG"
+ gene complement(2511993..2512448)
+ /locus_tag="BQ2027_MB2278C"
+ CDS complement(2511993..2512448)
+ /locus_tag="BQ2027_MB2278C"
+ /note="Mb2278c, -, len: 151 aa. Equivalent to Rv2254c,
+ len: 151 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 151 aa overlap). Probable integral
+ membrane protein. Mb2278c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable integral membrane protein"
+ /protein_id="SIU00889.1"
+ /db_xref="GOA:A0A1R3Y0P4"
+ /db_xref="InterPro:IPR001123"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0P4"
+ /translation="MRYRDLETVAAPTINVLRVWPEIVGAIVLLVIAAMGIGHGLRPS
+ PEPVPAPQKQLGCVRFALIFGLTVINPATFVYFTAVAVTLARALRATTAIAVVVGVAL
+ ASLLWQLLLVSAGAFLRSRATARVRRMTVLAGNAVIAAFGAVLVVHAFA"
+ gene complement(2512453..2512647)
+ /locus_tag="BQ2027_MB2279C"
+ CDS complement(2512453..2512647)
+ /locus_tag="BQ2027_MB2279C"
+ /note="Mb2279c, -, len: 64 aa. Equivalent to Rv2255c, len:
+ 64 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 64 aa overlap). Hypothetical unknown
+ protein. Mb2279c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00890.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Q3"
+ /translation="MDGIVDRGVRARPCQKVVAVLRRSKSHIDKRLDAATGNAFLGKQ
+ VLSAAGVVEYRPPRRSPLST"
+ gene complement(2512814..2513347)
+ /locus_tag="BQ2027_MB2280C"
+ CDS complement(2512814..2513347)
+ /locus_tag="BQ2027_MB2280C"
+ /note="Mb2280c, -, len: 177 aa. Equivalent to Rv2256c,
+ len: 177 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 177 aa overlap). Conserved hypothetical
+ protein, similar to Streptomyces glaucescens ORF5 (164 aa)
+ and Streptomyces coelicolor hypothetical protein SC4A7.19c
+ (164 aa; emb|CAB62723.1|AL133423). FASTA scores:
+ sptr|Q54209|Q54209 FABD, FABH, FABC, FABB, AND ORF5 (164
+ aa) opt: 504, E(): 3.9e-27; (44.4% identity in 162 aa
+ overlap). Protein product from Mb2280c detected using
+ SWATH mass spectrometry. Mb2280c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00891.1"
+ /db_xref="InterPro:IPR021491"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0N9"
+ /translation="MEPKEQQMRASNQFADVTSGVVYIHGSPAAVCPHVEWALSSTLQ
+ AKANLVWTPQPALPPQLRAVTNWVGPVGTGARLANALRSWSVLRFEVTEDPSPGVDGQ
+ RFSHTPQLGLWSGAMSANGDIMVGEMRLRAMMAQGADTLAAELDSVLGTAWDQALEVY
+ RDGGDAGEVTWLSRGVG"
+ gene complement(2513477..2514295)
+ /locus_tag="BQ2027_MB2281C"
+ CDS complement(2513477..2514295)
+ /locus_tag="BQ2027_MB2281C"
+ /note="Mb2281c, -, len: 272 aa. Equivalent to Rv2257c,
+ len: 272 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 272 aa overlap). Conserved
+ hypothetical protein, similar to hypothetical protein
+ SC4A7.08 from Streptomyces coelicolor (273 aa; 58%
+ identity in 243 aa overlap). Also similar to several
+ putative esterases and penicillin-binding proteins in M.
+ tuberculosis e.g. Rv1923, Rv1497, Rv2463, Rv3775, Rv1922,
+ Rv1730c. Protein product from Mb2281c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2281c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Beta-lactamase class C-like and penicillin
+ binding proteins (PBPs) superfamily"
+ /protein_id="SIU00892.1"
+ /db_xref="InterPro:IPR001466"
+ /db_xref="InterPro:IPR012338"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0P6"
+ /translation="MTALEVLGGWPVPAAAAAVIGPAGVLATHGDTARVFALASVTKP
+ LVARAAQVAVEEGVVNLDTPAGPPGSTVRHLLAHTSGLAMHSDQALARPGTRRMYSNY
+ GFTVLAESVQRESGIEFGRYLTEAVCEPLGMVTTRLDGGPAAAGFGATSTVADLAVFA
+ GDLLRPSTVSAQMHADATTVQFPGLDGVLPGYGVQRPNDWGLGFEIRNSKSPHWTGEC
+ NSTRTFGHFGQSGGFIWVDPKADLALVVLTARDFGDWALDLWPAISDAVLAEYT"
+ gene complement(2514309..2515370)
+ /locus_tag="BQ2027_MB2282C"
+ CDS complement(2514309..2515370)
+ /locus_tag="BQ2027_MB2282C"
+ /note="Mb2282c, -, len: 353 aa. Equivalent to Rv2258c,
+ len:353 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 353 aa overlap). Possible
+ transcriptional regulatory protein, similar to several
+ hypothetical proteins from C. elegans. FASTA scores:
+ sptr|O01593|O01593 CODED FOR BY C. ELEGANS CDNA YK102 F
+ (365 aa) opt: 577, E(): 6.4e-31; (30.5% identity in 341 aa
+ overlap). Contains possible helix-turn helix motif at aa
+ 47-68 (+3.65 SD) Protein product from Mb2282c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2282c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible transcriptional regulatory protein"
+ /protein_id="SIU00893.1"
+ /db_xref="InterPro:IPR025714"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0N3"
+ /translation="MSGALETTEEFGNRFVAAIDSAGLAILVSVGHQTGLLDTMAGLP
+ PATSMEIAEAAGLEERYVREWLGGMTTGQIVEYDAGSSTYSLPAHRAGMLTRAAGPDN
+ LAVIAQFVSLLGEVEQKVIRCFREGGGVPYSEYPRFHKLMAEMSGMVFDAALIDVVLP
+ LVDGLPDRLRSGADVADFGCGSGRAVKLMAQAFGASRFTGIDFSDEAVAAGTEEAARL
+ GLANATFERHDLAELDKVGAYDVITVFDAIHDQAQPARVLQNIYRALRPGGVLLMVDI
+ KASSQLEDNVGVPLSTYLYTTSLMHCMTVSLALDGAGLGTVWGRQLATSMLADAGFTD
+ VTVAEIESDVLNNYYIARK"
+ gene 2515612..2516697
+ /gene="mscr"
+ /locus_tag="BQ2027_MB2283"
+ CDS 2515612..2516697
+ /gene="mscr"
+ /locus_tag="BQ2027_MB2283"
+ /note="Mb2283, adhE2, len: 361 aa. Equivalent to Rv2259,
+ len: 361 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 361 aa overlap). Probable adhE2,
+ zinc-containing alcohol dehydrogenase, similar to several,
+ especially mycothiol-dependent formaldehyde dehydrogenase
+ from Amycolatopsis methanolica P80094 (360 aa). Contains
+ PS00059 Zinc-containing alcohol dehydrogenases signature.
+ FASTA scores: >sp|P80094|FADH_AMYME
+ NAD/MYCOTHIOL-DEPENDENT FORMALDEHYDE DEHYDROGENASE
+ (MD-FALDH) Length = 360, Expect = e-156, Identities =
+ 268/358 (74%). Also similar to Rv0162c, (MTCI28.02c, 35.0%
+ identity in 371 aa overlap). Protein product from Mb2283
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2283 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="s-nitrosomycothiol reductase mscr"
+ /protein_id="SIU00894.1"
+ /db_xref="GOA:A0A1R3Y2U2"
+ /db_xref="InterPro:IPR002328"
+ /db_xref="InterPro:IPR011032"
+ /db_xref="InterPro:IPR013149"
+ /db_xref="InterPro:IPR013154"
+ /db_xref="InterPro:IPR017816"
+ /db_xref="InterPro:IPR020843"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2U2"
+ /translation="MSQTVRGVIARQKGEPVELVNIVVPDPGPGEAVVDVTACGVCHT
+ DLTYREGGINDEYPFLLGHEAAGIIEAVGPGVTAVEPGDFVILNWRAVCGQCRACKRG
+ RPRYCFDTFNAEQKMTLTDGTELTAALGIGAFADKTLVHSGQCTKVDPAADPAVAGLL
+ GCGVMAGLGAAINTGGVTRDDTVAVIGCGGVGDAAIAGAALVGAKRIIAVDTDDTKLD
+ WARTFGATHTVNAREVDVVQAIGGLTDGFGADVVIDAVGRPETYQQAFYARDLAGTVV
+ LVGVPTPDMRLDMPLVDFFSHGGALKSSWYGDCLPESDFPTLIDLYLQGRLPLQRFVS
+ ERIGLEDVEEAFHKMHGGKVLRSVVML"
+ gene 2516697..2517332
+ /locus_tag="BQ2027_MB2284"
+ CDS 2516697..2517332
+ /locus_tag="BQ2027_MB2284"
+ /note="Mb2284, -, len: 211 aa. Equivalent to Rv2260, len:
+ 211 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 211 aa overlap). Conserved
+ hypothetical protein, similar to hypothetical proteins
+ Rv0634c, Rv1637c, Rv3677c, Rv2581c from Mycobacterium
+ tuberculosis and to various hydrolases. FASTA scores:
+ sptr|O06154|O06154 HYPOTHETICAL 21.3 KD PROTEIN (200 aa)
+ opt: 355, E(): 4e-15; (37.4% identity in 198 aa overlap).
+ Protein product from Mb2284 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2284 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative hydrolase in cluster with
+ formaldehyde/S-nitrosomycothiol reductase MscR"
+ /protein_id="SIU00895.1"
+ /db_xref="InterPro:IPR001279"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1H3"
+ /translation="MAAIERVITHGTFELDGGSWEVDNNIWLVGDDSEVVVFDAAHHA
+ APIIDAVGGRKVVAVICTHGHNDHVTVAPELGTALDAPVLMHPGDAVLWRMTHPDKSF
+ RAVSDGDAVRVGGTELRALHTPGHSPGSVCWYAPELGPGTGTVFSGDTLFAGGPGATG
+ RSYSDFPTILRSISGRLGALPGDTVVHTGHGDSTTIGDEIVHYEEWVARGH"
+ gene complement(2517409..2518917)
+ /locus_tag="BQ2027_MB2285C"
+ CDS complement(2517409..2518917)
+ /locus_tag="BQ2027_MB2285C"
+ /note="Mb2285c, -, len: 502 aa. Equivalent to Rv2262c and
+ Rv2261c, len: 360 aa and 140 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (94.7% identity in 357 aa
+ overlap and 100.0% identity in 140 aa overlap). Conserved
+ hypothetical protein, with function unknown but some
+ similarity to N-terminal 70% of
+ P23930|P77703|LNT_ECOLI|CUTE|B0657 APOLIPOPROTEIN
+ N-ACYLTRANSFERASE (EC 2.3.1.-) from Escherichia coli
+ strain K12 (512 aa), FASTA scores: opt: 239, E(): 1.6e-07,
+ (30.4% identity in 359 aa overlap). Note that neighboring
+ ORF shows similarity to N -terminal part of PCC6803
+ apolipoprotein N-acyltransferase from Synechocystis sp.,
+ suggesting possibility of frameshift. Sequence of clones
+ from two sources has been checked but no error found.
+ Appear to be two extra bases at position 1876970 compared
+ to CDC1551 strain. Conserved hypothetical protein, with
+ function unknown but some similarity to C-terminal end of
+ PCC6803 apolipoprotein N-acyltransferase from
+ Synechocystis sp. Note that next ORF shows similarity to
+ N-terminal part of P74055 APOLIPOPROTEIN N-ACYLTRANSFERASE
+ from Escherichia coli (519 aa), FASTA scores: opt: 142,
+ E(): 0.007, (29.9% identity in 117 aa overlap), suggesting
+ possible frameshift. Sequence of clones from two sources
+ has been checked but no error found.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv2262c and Rv2261c exist as 2
+ genes. In Mycobacterium bovis, a 2 bp deletion (ct-*)
+ results in a single product which is more similar to
+ Rv2262c."
+ /codon_start=1
+ /transl_table=11
+ /product="Apolipoprotein N-acyltransferase"
+ /protein_id="SIU00896.1"
+ /db_xref="GOA:A0A1R3Y0V4"
+ /db_xref="InterPro:IPR003010"
+ /db_xref="InterPro:IPR004563"
+ /db_xref="InterPro:IPR036526"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0V4"
+ /translation="MALRAGARRQPVIGCAAALVFGGLPALAFPAPSWWWLAWFGLVP
+ LLLVVRAAPTSWEGALRAWTGMGGFVLATQYWLVTSAGPMLVLLAAGLGVLWLPAGWL
+ AHRLLSVPVTTCRVGAALVVVPSAWVAAEAVRSWQSLGGPWALLGASQWSQPVTLASA
+ SLGGVWLTSFLLVATNTAIASVLVCRATGGRLVALGCVIGCAGLGPASYLLGSVPVGG
+ PTVRVALVQAGDIADAAARLAAGEEFTAAVADQRPDLVVWGESSVGQDLTRHPDVLAR
+ LAELSQRVGADLLVNVDAPAPDGGIYKSAVLVGAHEAVGSYRKTRLVPFGEYVPLRPL
+ FGWITRYSKAAAKDRQRGAGPVVLAVNSLHIAPLISYEMTFSDLTRHAARLGAALLVY
+ QSSTSTFQGSWAQPQLAAQPAVRAVEAGIPAVHASLSGDSSAFDTRGRRLAWCSAEFN
+ GAIVVNVPLASNVTLYLRLGDWVPVTAFVVMGAGFAVFLRRSLARVSDCADK"
+ gene 2519006..2519959
+ /locus_tag="BQ2027_MB2286"
+ CDS 2519006..2519959
+ /locus_tag="BQ2027_MB2286"
+ /note="Mb2286, -, len: 317 aa. Equivalent to Rv2263, len:
+ 317 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 317 aa overlap). Possible
+ oxidoreductase (EC 1.-.-.-), similar to several
+ oxidoreductases. Similarity suggests alternative GTG start
+ at 10154 but then no rbs. FASTA scores: sptr|Q544
+ 05|Q54405 PROBABLY AN NADP-DEPENDENT OXIDOREDUCTASE (297
+ aa) opt: 487, E(): 1.1e-23; (36.1% identity in 299 aa
+ overlap). Also similar to M. tuberculosis Rv0068, and
+ Rv0439c. Protein product from Mb2286 detected using SWATH
+ mass spectrometry. Mb2286 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible oxidoreductase"
+ /protein_id="SIU00897.1"
+ /db_xref="InterPro:IPR002347"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y124"
+ /translation="MAKDLVATVPDLSGKLAIITGANSGLGFGLARRLSAAGADVIMA
+ IRNRAKGEAAVEEIRTAVPDAKLTIKALDLSSLASVAALGEQLMADGRPIDLLINNAG
+ VMTPPERVTTADGFELQFGSNHLGHFALTAHLLPLLRAAQRARVVSLSSLAARRGRIH
+ FDDLQFERSYAPMTAYGQSKLAVLMFARELDRRSRAAGWGIISNAAHPGLTKTNLQIA
+ GPSHGRDKPALMERLYKTSWRFAPFLWQEIEEGILPALYAAATPQADGGAFYGPRGRY
+ EVAGGGVREAKVPAAARNDADSKRLWEVSEQLTGVSYPKSR"
+ gene complement(2519937..2521715)
+ /locus_tag="BQ2027_MB2287C"
+ CDS complement(2519937..2521715)
+ /locus_tag="BQ2027_MB2287C"
+ /note="Mb2287c, -, len: 592 aa. Equivalent to Rv2264c,
+ len: 592 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 592 aa overlap). Conserved
+ hypothetical Pro-rich protein, similar to hypothetical
+ proteins Rv0312 (MTCY63.17, 620 aa and Rv0350) that has
+ highly Pro-, Thr-rich C-terminus. Contains PS00343
+ Gram-positive cocci surface proteins 'anchoring'
+ hexapeptide. FASTA scores: Z96800|MTCY63_17 Mycobacterium
+ tuberculosis cosmid (620 aa) opt: 1075, E(): 8.8e-24;
+ (38.9% identity in 627 aa overlap). Protein product from
+ Mb2287c detected using SWATH mass spectrometry. Mb2287c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG00821990: molecular chaperone"
+ /protein_id="SIU00898.1"
+ /db_xref="GOA:A0A1R3Y0M5"
+ /db_xref="InterPro:IPR004753"
+ /db_xref="InterPro:IPR013126"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0M5"
+ /translation="MATGARPALGLSIGVTNLAAVAADHSITRKPVLTLYRQRPPEVG
+ VPSENPRLDEPGLVITDFVDRVGDSVGIVAADGSVYRSEALVADALLALAYTATGGRA
+ LPGSVTVTYPAHWGPAAVAALDSALRRASEWSHGTSSTAQPLSLLPDAAAALYAIRAD
+ PGIPARGIVAVCDFGGSGTGITLVDAADEYRPVAATVRHQAFSGDLIDQSLLSYVMSE
+ LPGTGAFDPAGTSAIGSLTKLRIECRKAKERLSSSTVTTLTDALGGDIRLTRNELEDT
+ IRDSLDSVGRALEQTLARSGIRTAELVAIVSVGGGANIPAVTTTLSGRFCVPVVRTPR
+ PQLTAAFGGALWAARRPGDTSATVLTAVTSATATAPADAPASVLQPALAWSEADEDSH
+ IGPAPGYTAARPSLSFDHDAHAEPEPKSPPIPWYRLPAVIITGTTVAVLLVGAAVAIG
+ LSTGDQPTAPGTPQRPGVTTTAAPPPSPAPASDGPTTEPAPPVQAPATGGPAPPLQQP
+ LPPPPTTTNTQPAVTTDVITPAPTTPASAPPATTQPPATTQPPATTSPSPPPIPPIPP
+ IPEIPQLPPGIPQVPGIGQFSAISGS"
+ gene 2522065..2523294
+ /locus_tag="BQ2027_MB2288"
+ CDS 2522065..2523294
+ /locus_tag="BQ2027_MB2288"
+ /note="Mb2288, -, len: 409 aa. Equivalent to Rv2265, len:
+ 409 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 409 aa overlap). Possible conserved
+ integral membrane protein, with some similarity to others
+ e.g. M. thermoauto. sp|O26855|O26855 CONSERVED PROTEIN
+ (383 aa), FASTA score: opt: 898 z-score: 1023.5 E(): 0;
+ 38.0% identity in 384 aa overlap; Q58713 HYPOTHETICAL 44.1
+ KD PROTEIN 1 317 (398 aa), FASTA scores, opt: 305 E():
+ 1.2e-11; 22.8% identity in 382 aa overlap; also KGTP_ECOLI
+ P17448 alpha-ketoglutarate permease (432 aa), FASTA
+ scores, opt: 156, E(): 0.006, (24.8% identity in 416 aa
+ overlap) Protein product from Mb2288 detected using SWATH
+ mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible conserved integral membrane protein"
+ /protein_id="SIU00899.1"
+ /db_xref="GOA:P64962"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/Swiss-Prot:P64962"
+ /translation="MGANGDVALSRIGATRPALSAWRFVTVFGVVGLLADVVYEGARS
+ ITGPLLASLGATGLVVGVVTGVGEAAALGLRLVSGPLADRSRRFWAWTIAGYTLTVVT
+ VPLLGIAGALWVACALVIAERVGKAVRGPAKDTLLSHAASVTGRGRGFAVHEALDQVG
+ AMIGPLTVAGMLAITGNAYAPALGVLTLPGGAALALLLWLQRRVPRPESYEDCPVVLG
+ NPSAPRPWALPAQFWLYCGFTAITMLGFGTFGLLSFHMVSHGVLAAAMVPVVYAAAMA
+ ADALTALASGFSYDRYGAKTLAVLPILSILVVLFAFTDNVTMVVIGTLVWGAAVGIQE
+ STLRGVVADLVASPRRASAYGVFAAGLGAATAGGGALIGWLYDISIGTLVVVVIALEL
+ MALVMMFAIRLPRVAPS"
+ gene 2523469..2524755
+ /gene="cyp124"
+ /locus_tag="BQ2027_MB2289"
+ CDS 2523469..2524755
+ /gene="cyp124"
+ /locus_tag="BQ2027_MB2289"
+ /note="Mb2289, cyp124, len: 428 aa. Equivalent to Rv2266,
+ len: 428 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 428 aa overlap). Probable cyp124,
+ cytochrome P450 (EC 1.14.-.-), similar to e.g. G405543
+ cytochrome P450 (406 aa), FASTA scores, opt: 763,E(): 0,
+ (35.4% identity in 393 aa overlap), similar to e.g.
+ MTCY50.26, 33.8% identity in 370 aa overlap Protein
+ product from Mb2289 detected using SWATH mass
+ spectrometry. Mb2289 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable cytochrome P450 124 CYP124"
+ /protein_id="SIU00900.1"
+ /db_xref="GOA:P0A517"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002397"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/Swiss-Prot:P0A517"
+ /translation="MGLNTAIATRVNGTPPPEVPIADIELGSLDFWALDDDVRDGAFA
+ TLRREAPISFWPTIELPGFVAGNGHWALTKYDDVFYASRHPDIFSSYPNITINDQTPE
+ LAEYFGSMIVLDDPRHQRLRSIVSRAFTPKVVARIEAAVRDRAHRLVSSMIANNPDRQ
+ ADLVSELAGPLPLQIICDMMGIPKADHQRIFHWTNVILGFGDPDLATDFDEFMQVSAD
+ IGAYATALAEDRRVNHHDDLTSSLVEAEVDGERLSSREIASFFILLVVAGNETTRNAI
+ THGVLALSRYPEQRDRWWSDFDGLAPTAVEEIVRWASPVVYMRRTLTQDIELRGTKMA
+ AGDKVSLWYCSANRDESKFADPWTFDLARNPNPHLGFGGGGAHFCLGANLARREIRVA
+ FDELRRQMPDVVATEEPARLLSQFIHGIKTLPVTWS"
+ gene complement(2525009..2526175)
+ /gene="stf3"
+ /locus_tag="BQ2027_MB2290C"
+ CDS complement(2525009..2526175)
+ /gene="stf3"
+ /locus_tag="BQ2027_MB2290C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2290c, -, len: 388 aa. Equivalent to Rv2267c,
+ len: 388 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 388 aa overlap). Conserved
+ hypothetical protein; some similarity to Mycobacterium
+ tuberculosis Rv3529c; gp|Z82098|MTCY3C7_27 (384 aa) FASTA
+ score: opt: 261, E(): 3.6e-10; 27.3% identity in 253 aa
+ overlap"
+ /codon_start=1
+ /transl_table=11
+ /product="Sulfotransferase"
+ /protein_id="SIU00901.1"
+ /db_xref="GOA:P64964"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P64964"
+ /translation="MKALRSSSRLSRWREWAAPLWVGCNFSAWMRLLIRNRFAVHHSR
+ WHFAVLYTFLSMVNSCLGLWQKIVFGRRVAETVIADPPIFIVGHWRTGTTLLHELLVV
+ DDRHTGPTGYECLAPHHFLLTEWFAPYVEFLVSKHRAMDNMDLSLHHPQEDEFVWCMQ
+ GLPSPYLTIAFPNRPPQYEEYLDLEQVAPRELEIWKRTLFRFVQQVYFRRRKTVILKN
+ PTHSFRIKVLLEVFPQAKFIHIVRDPYVVYPSTIHLHKALYRIHGLQQPTFDGLDDKV
+ VSTYVDLYRKLDEGRELVDPTRFYELRYEDLIGDPEGQLRRLYQHLGLGDFECYLPRL
+ RQYLADHADYKTNSYQLTVEQRAIVDEHWGEIIDRYGYDRHTPEPARLRPAVGG"
+ gene complement(2526172..2527641)
+ /gene="cyp128"
+ /locus_tag="BQ2027_MB2291C"
+ CDS complement(2526172..2527641)
+ /gene="cyp128"
+ /locus_tag="BQ2027_MB2291C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2291c, cyp128, len: 489 aa. Equivalent to
+ Rv2268c, len: 489 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 489 aa overlap).
+ Probable cyp128, cytochrome P450 (EC 1.14.-.-), similar to
+ (but longer than) cytochrome p-450 e.g. CPXK_SACER P3 3271
+ cytochrome p-450 107b1 (405 aa), FASTA scores, opt: 620,
+ E(): 8.3e-33, (31.8% identity in 406 aa overlap); contains
+ PS00086 Cytochrome P450 cysteine heme-iron ligand
+ signature, similar to MTCY50.26, 32.7% identity in 382 aa
+ overlap"
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CYTOCHROME P450 128 CYP128"
+ /protein_id="SIU00902.1"
+ /db_xref="GOA:P63714"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002397"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="UniProtKB/Swiss-Prot:P63714"
+ /translation="MTATQSPPEPAPDRVRLAGCPLAGTPDVGLTAQDATTALGVPTR
+ RRASSGGIPVATSMWRDAQTVRTYGPAVAKALALRVAGKARSRLTGRHCRKFMQLTDF
+ DPFDPAIAADPYPHYRELLAGERVQYNPKRDVYILSRYADVREAARNHDTLSSARGVT
+ FSRGWLPFLPTSDPPAHTRMRKQLAPGMARGALETWRPMVDQLARELVGGLLTQTPAD
+ VVSTVAAPMPMRAITSVLGVDGPDEAAFCRLSNQAVRITDVALSASGLISLVQGFAGF
+ RRLRALFTHRRDNGLLRECTVLGKLATHAEQGRLSDDELFFFAVLLLVAGYESTAHMI
+ STLFLTLADYPDQLTLLAQQPDLIPSAIEEHLRFISPIQNICRTTRVDYSVGQAVIPA
+ GSLVLLAWGAANRDPRQYEDPDVFRADRNPVGHLAFGSGIHLCPGTQLARMEGQAILR
+ EIVANIDRIEVVEPPTWTTNANLRGLTRLRVAVTPRVAP"
+ gene complement(2527654..2527986)
+ /locus_tag="BQ2027_MB2292C"
+ CDS complement(2527654..2527986)
+ /locus_tag="BQ2027_MB2292C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2292c, -, len: 110 aa. Equivalent to Rv2269c,
+ len: 110 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 110 aa overlap). Unknown protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00903.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64966"
+ /translation="MANDARPLARLANCRVGDQSSATHAYTVGPVLGVPPTGGVDLRY
+ GGRAGIGRSETVTDHGAVGRRYHQPCAGQIRLSELRVTILLRCETLCETAQLLRCPPL
+ PCDCSTPL"
+ gene 2528063..2528590
+ /gene="lppN"
+ /locus_tag="BQ2027_MB2293"
+ CDS 2528063..2528590
+ /gene="lppN"
+ /locus_tag="BQ2027_MB2293"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2293, lppN, len: 175 aa. Equivalent to Rv2270,
+ len: 175 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.4% identity in 175 aa overlap). Probable lppN,
+ lipoprotein; has appropriately positioned prokaryotic
+ membrane lipoprotein attachment site PS00013. Mb2293 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable lipoprotein lppN"
+ /protein_id="SIU00904.1"
+ /db_xref="GOA:Q7VEM3"
+ /db_xref="UniProtKB/Swiss-Prot:Q7VEM3"
+ /translation="MRLPGRHVLYALSAVTMLAACSSNGARGGIASTNMNPTNPPATA
+ ETATVSPTPAPQSARTETWINLQVGDCLADLPPADLSRITVTIVDCATAHSAEVYLRA
+ PVAVDAAVVSMANRDCAAGFAPYTGQSVDTSPYSVAYLIDSHQDRTGADLTPSTVICL
+ LQPANGQLLTGSARR"
+ gene 2528697..2528996
+ /locus_tag="BQ2027_MB2294"
+ CDS 2528697..2528996
+ /locus_tag="BQ2027_MB2294"
+ /note="Mb2294, -, len: 99 aa. Equivalent to Rv2271, len:
+ 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 99 aa overlap). Conserved hypothetical
+ protein; some similarity to hypothetical protein
+ AAK01340.1|AF265275_3 (AF265275) from uncultured organism
+ Pu8 (104 aa) E= 4e-10, (34% identity in 91 aa overlap)
+ Protein product from Mb2294 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2294 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00905.1"
+ /db_xref="InterPro:IPR024248"
+ /db_xref="UniProtKB/Swiss-Prot:P64968"
+ /translation="MTTPPDKARRRFLRDAYKNAERVARTALLTIDQDQLEQLLDYVD
+ ERLGEQPCDHTARHAQRWAQSHRIEWETLAEGLQEFGGYCDCEIVMNVEPEAIFG"
+ gene 2529102..2529470
+ /locus_tag="BQ2027_MB2295"
+ CDS 2529102..2529470
+ /locus_tag="BQ2027_MB2295"
+ /note="Mb2295, -, len: 122 aa. Equivalent to Rv2272, len:
+ 122 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 122 aa overlap). Probable conserved
+ transmembrane PROTEIN, similar to YIDH_ECOLI P31445
+ hypothetical 12.8 kd protein (115 aa), FASTA scores, opt:
+ 291, E(): 2.9e-14, (45.6% identity in 103 aa overlap),
+ similar to MTCY339.37c, (35.0% identity in 100 aa
+ overlap). Mb2295 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable conserved transmembrane protein"
+ /protein_id="SIU00906.1"
+ /db_xref="GOA:P64970"
+ /db_xref="InterPro:IPR003807"
+ /db_xref="UniProtKB/Swiss-Prot:P64970"
+ /translation="MADDSNDTATDVEPDYRFTLANERTFLAWQRTALGLLAAAVALV
+ QLVPELTIPGARQVLGVVLAILAILTSGMGLLRWQQADRAMRRHLPLPRHPTPGYLAV
+ GLCVVGVVALALVVAKAITG"
+ gene 2529467..2529796
+ /locus_tag="BQ2027_MB2296"
+ CDS 2529467..2529796
+ /locus_tag="BQ2027_MB2296"
+ /note="Mb2296, -, len: 109 aa. Equivalent to Rv2273, len:
+ 109 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 109 aa overlap). Probable conserved
+ transmembrane protein, similar to Rv2272 (MTCY339.38c),
+ (35.0% identity in 100 aa overlap). Mb2296 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00907.1"
+ /db_xref="GOA:P64972"
+ /db_xref="InterPro:IPR003807"
+ /db_xref="UniProtKB/Swiss-Prot:P64972"
+ /translation="MNRHSTAASDRGLQAERTTLAWTRTAFALLVNGVLLTLKDTQGA
+ DGPAGLIPAGLAGAAASCCYVIALQRQRALSHRPLPARITPRGQVHILATAVLVLMVV
+ TAFAQLL"
+ gene complement(2529853..2530170)
+ /gene="mazf8"
+ /locus_tag="BQ2027_MB2297C"
+ CDS complement(2529853..2530170)
+ /gene="mazf8"
+ /locus_tag="BQ2027_MB2297C"
+ /note="Mb2297c, -, len: 105 aa. Equivalent to Rv2274c,
+ len: 105 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.0% identity in 105 aa overlap). Unknown protein;
+ questionable ORF,Mb2297c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible toxin mazf8"
+ /protein_id="SIU00908.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0N0"
+ /translation="MSIARSAQPIGWISCPPKGGSSCCRCGGGYTHMFCVSAWTGLVV
+ DLQAEQVRSVVTERLRRRIGRGAPILAGTLAPGVGLAAQNREFRQFTGRSAPPSATIA
+ FGE"
+ gene complement(2530204..2530452)
+ /gene="mazE8"
+ /locus_tag="BQ2027_MB2297A"
+ CDS complement(2530204..2530452)
+ /gene="mazE8"
+ /locus_tag="BQ2027_MB2297A"
+ /note="Mb2297A, len: 82 aa. Equivalent to Rv2274A len: 82
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 82 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). Possible mazE8,
+ antitoxin, part of toxin-antitoxin (TA) operon with
+ Rv2274c (See Pandey and Gerdes, 2005). Mb2297A found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible antitoxin MazE8"
+ /protein_id="SIU00909.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0R0"
+ /translation="MAEPETLPGRWLPECACLAETVSWEQSRLWSRLLCRPHFRHALP
+ GLTGGSASRPSARSARLVRQPRMTLFSLDHRDGVDARC"
+ gene 2530248..2531117
+ /locus_tag="BQ2027_MB2298"
+ CDS 2530248..2531117
+ /locus_tag="BQ2027_MB2298"
+ /EC_number="2.3.2.21"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2298, -, len: 289 aa. Equivalent to Rv2275, len:
+ 289 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 289 aa overlap). Conserved
+ hypothetical protein. Some similarity to Bacillus subtilis
+ sp|O34351|O34351 YVMC (248 aa), FASTA score: opt: 280,
+ E(): 2.7e -11; 28.2% identity in 227 aa overlap,Mb2298
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Cyclo(L-tyrosyl-L-tyrosyl) synthase (EC"
+ /protein_id="SIU00910.1"
+ /db_xref="GOA:A0A1R3Y0S3"
+ /db_xref="InterPro:IPR030903"
+ /db_xref="InterPro:IPR038622"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0S3"
+ /translation="MSYVAAEPGVLISPTDDLQSPRSAPAAHDENADGITGGTRDDSA
+ PNSRFQLGRRIPEATAQEGFLVRPFTQQCQIIHTEGDHAVIGVSPGNSYFSRQRLRDL
+ GLWGLTNFDRVDFVYTDVHVAESYEALGDSAIEARRKAVKNIRGVRAKITTTVNELDP
+ AGARLCVRPMSEFQSNEAYRELHADLLTRLKDDEDLRAVCQDLVRRFLSTKVGPRQGA
+ TATQEQVCMDYICAEAPLFLDTPAILGVPSSLNCYHQSLPLAEMLYARGSGLRASRNQ
+ GHAIVTPDGSPAE"
+ gene 2531114..2532304
+ /gene="cyp121"
+ /locus_tag="BQ2027_MB2299"
+ CDS 2531114..2532304
+ /gene="cyp121"
+ /locus_tag="BQ2027_MB2299"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2299, cyp121, len: 396 aa. Equivalent to Rv2276,
+ len: 396 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 396 aa overlap). cyp121, cytochrome
+ P450 (EC 1.14.-.-) (see citation below), similar to e.g.
+ G303644 (397 aa) opt: 675, z-score: 776.4, E(): 2.7e-36,
+ (33.7% identity in 407 aa overlap); contains PS00086
+ Cytochrome P450 cysteine heme-iron ligand signature,
+ similar to MTCY339.42, 29.2% identity in 298 aa overlap.
+ Protein product from Mb2299 detected using SWATH mass
+ spectrometry. Mb2299 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Cytochrome P450 121 CYP121"
+ /protein_id="SIU00911.1"
+ /db_xref="GOA:P0A515"
+ /db_xref="InterPro:IPR001128"
+ /db_xref="InterPro:IPR002397"
+ /db_xref="InterPro:IPR017972"
+ /db_xref="InterPro:IPR036396"
+ /db_xref="PDB:5EDT"
+ /db_xref="UniProtKB/Swiss-Prot:P0A515"
+ /translation="MTATVLLEVPFSARGDRIPDAVAELRTREPIRKVRTITGAEAWL
+ VSSYALCTQVLEDRRFSMKETAAAGAPRLNALTVPPEVVNNMGNIADAGLRKAVMKAI
+ TPKAPGLEQFLRDTANSLLDNLITEGAPADLRNDFADPLATALHCKVLGIPQEDGPKL
+ FRSLSIAFMSSADPIPAAKINWDRDIEYMAGILENPNITTGLMGELSRLRKDPAYSHV
+ SDELFATIGVTFFGAGVISTGSFLTTALISLIQRPQLRNLLHEKPELIPAGVEELLRI
+ NLSFADGLPRLATADIQVGDVLVRKGELVLVLLEGANFDPEHFPNPGSIELDRPNPTS
+ HLAFGRGQHFCPGSALGRRHAQIGIEALLKKMPGVDLAVPIDQLVWRTRFQRRIPERL
+ PVLW"
+ gene complement(2532489..2533388)
+ /locus_tag="BQ2027_MB2300C"
+ CDS complement(2532489..2533388)
+ /locus_tag="BQ2027_MB2300C"
+ /note="Mb2300c, -, len: 299 aa. Equivalent to Rv2277c,
+ len: 301 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.661% identity in 295 aa overlap). Possible
+ glycerolphosphodiesterase, similar to e.g. UGPQ_ECOLI
+ P10908 glycerophosphoryldiester phosphodiesterase
+ (cytosolic) (247 aa), FASTA scores, opt: 149, E(): 0.0061,
+ (27.2% identity in 195 aa overlap). Start of protein
+ uncertain, encoded by neighbouring IS6110 as given, is
+ intact in Mycobacterium tuberculosis CDC1551.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ 1358 bp deletion containing an IS6110 sequence prior to
+ the start of Mb2300c disrupts the 5' start of Rv2277c
+ resulting in a slightly shorter product compared to the
+ homolog in Mycobacterium tuberculosis strain H37Rv (299 aa
+ versus 301 aa). Mb2300c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible glycerolphosphodiesterase"
+ /protein_id="SIU00912.1"
+ /db_xref="GOA:A0A1R3Y0R7"
+ /db_xref="InterPro:IPR017946"
+ /db_xref="InterPro:IPR030395"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0R7"
+ /translation="MLGAVALVIALGGTCGVADALPLGQTDDPMIVAHRAGTRDFPEN
+ TVLAITNAVAAGVDGMWLTVQVSSDGVPVLYRPSDLATLTDGAGPVNSKTVQQLQQLN
+ AGWNFTTPGVEGHPYRQRATPIPTLEQAIGATPPDMTLFLDPKQTPPQPLVSAVAQVL
+ TRTGAAGRSIVYSTNADITAAASRQEGLQVAESRDVTRQRLFNMALNHHCDPQPDPGK
+ WAGFELHRDVTVTEEFTLGSGISAVNAELWDEASVDCFRSQSGMKVMGFAVKTVDDYR
+ LAHKIGLDAVLVDSPLAAQQWRH"
+ gene 2533567..2534946
+ /locus_tag="BQ2027_MB2301"
+ CDS 2533567..2534946
+ /locus_tag="BQ2027_MB2301"
+ /note="Mb2301, -, len: 459 aa. Equivalent to Rv2280, len:
+ 459 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 459 aa overlap). Probable
+ dehydrogenase. Similar to D-lactate dehydrogenase
+ (cytochrome) precursor e.g. G1061264 (587 aa), FASTA
+ scores, opt: 645,E(): 1.3e-31, (28.0% identity in 478 aa
+ overlap), similar to MTCY50.25, 36.5% identity in 447 aa
+ overlap Protein product from Mb2301 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb2301
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable dehydrogenase"
+ /protein_id="SIU00913.1"
+ /db_xref="GOA:A0A1R3Y0P8"
+ /db_xref="InterPro:IPR004113"
+ /db_xref="InterPro:IPR006094"
+ /db_xref="InterPro:IPR016164"
+ /db_xref="InterPro:IPR016166"
+ /db_xref="InterPro:IPR016171"
+ /db_xref="InterPro:IPR036318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0P8"
+ /translation="MSEMTARFSEIVGNANLLTGDAIPEDYAHDEELTGPPQKPAYAA
+ KPATPEEVAQLLKAASENGVPVTARGSGCGLSGAARPVEGGLLISFDRMNKVLEVDTA
+ NQVAVVQPGVALTDLDAATADTGLRYTVYPGELSSSVGGNVGTNAGGMRAVKYGVARH
+ NVLGLQAVLPTGEIIRTGGRMAKVSTGYDLTQLIIGSEGTLALVTEVIVKLHPRLDHN
+ ASVLAPFADFDQVMAAVPKILASGLAPDILEYIDNTSMAALISTQNLELGIPDQIRDS
+ CEAYLLVALENRIADRLFEDIQTVGEMLMELGAVDAYVLEGGSARKLIEAREKAFWAA
+ KALGADDIIDTVVPRASMPKFLSTARGLAAAADGAAVGCGHAGDGNVHMAIACKDPEK
+ KKKLMTDIFALAMELGGAISGEHGVGRAKTGYFLELEDPVKISLMRRIKQSFDPAGIL
+ NPGVVFGDT"
+ gene 2535180..2536838
+ /gene="pitB"
+ /locus_tag="BQ2027_MB2302"
+ CDS 2535180..2536838
+ /gene="pitB"
+ /locus_tag="BQ2027_MB2302"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2302, pitB, len: 552 aa. Equivalent to Rv2281,
+ len: 552 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 552 aa overlap). Putative pitB,
+ phosphate-transport permease, integral membrane protein,
+ similar to YG04_HAEIN P45268 putative phosphate permease
+ hi1604 (420 aa). FASTA scores, opt: 484, E(): 5e-23,
+ (33.5% identity in 498 aa overlap) also to G399598
+ amphotropic murine retrovirus receptor (656 aa) FASTA
+ scores, opt: 453, E(): 5.8e-21, (26.8% identity in 645 aa
+ overlap). Also similar to Rv0545c|pitA from M.
+ tuberculosis. BELONGS TO THE PIT SUBFAMILY. Mb2302 found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Putative phosphate-transport permease PitB"
+ /protein_id="SIU00914.1"
+ /db_xref="GOA:P65713"
+ /db_xref="InterPro:IPR001204"
+ /db_xref="UniProtKB/Swiss-Prot:P65713"
+ /translation="MSDNAKHHRDGHLVASGLQDRAARTPQHEGFLGPDRPWHLSFSL
+ LLAGSFVLFSWWAFDYAGSGANKVILVLATVVGMFMAFNVGGNDVANSFGTSVGAGTL
+ TMKQALLVAAIFEVSGAVIAGGDVTETIRSGIVDLSGVSVDPRDFMNIMLSALSAAAL
+ WLLFANRMGYPVSTTHSIIGGIVGAAIALGMVSGQGGAALRMVQWDQIGQIVVSWVLS
+ PVLGGLVSYLLYGVIKRHILLYNEQAERRLTEIKKERIAHRERHKAAFDRLTEIQQIA
+ YTGALARDAVAANRKDFDPDELESDYYRELHEIDAKTSSVDAFRALQNWVPLVAAAGS
+ MIIVAMLLFKGFKHMHLGLTTMNNYFIIAMVGAAVWMATFIFAKTLRGESLSRSTFLM
+ FSWMQVFTASGFAFSHGSNDIANAIGPFAAILDVLRTGAIEGNAAVPAAAMVTFGVAL
+ CAGLWFIGRRVIATVGHNLTTMHPASGFAAELSAAGVVMGATVLGLPVSSTHILIGAV
+ LGVGIVNRSTNWGLMKPIVLAWVITLPSAAILASVGLVALRAIF"
+ gene complement(2536945..2537883)
+ /locus_tag="BQ2027_MB2303C"
+ CDS complement(2536945..2537883)
+ /locus_tag="BQ2027_MB2303C"
+ /note="Mb2303c, -, len: 312 aa. Equivalent to Rv2282c,
+ len: 312 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 312 aa overlap). Probable
+ transcriptional regulator, lysR family, similar to others
+ e.g. YC30_CYAPA|P48271 hypothetical transcriptional
+ regulator YCF30 (324 aa), FASTA scores: opt: 292, E():
+ 4e-12, (27.6% identity in 286 aa overlap); etc. Also
+ similar to Rv0377|MTCY39.34 from Mycobacterium
+ tuberculosis, FASTA score: (25.4% identity in 268 aa
+ overlap). Contains PS00044 Bacterial regulatory proteins,
+ lysR family signature, and contains helix-turn-helix motif
+ at aa 24 -45 (+4.93 SD). Protein product from Mb2303c
+ detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable transcription regulator (lysR family)"
+ /protein_id="SIU00915.1"
+ /db_xref="GOA:P67668"
+ /db_xref="InterPro:IPR000847"
+ /db_xref="InterPro:IPR005119"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P67668"
+ /translation="MPLSSRMPGLTCFEIFLAIAEAGSLGGAARELGLTQQAVSRRLA
+ SMEAQIGVRLAIRTTRGSQLTPAGIVVAEWAARLLEVADEIDAGLGSLRTEGRQRIRV
+ VASQTIAEQLMPHWMLSLRAADMRRGGTVPEVILTATNSEHAIAAVRDGIADLGFIEN
+ PCPPTGLGSVVVARDELVVVVPPGHKWARRSRVVSARELAQTPLVTREPNSGIRDSLT
+ AALRDTLGEDMQQAPPVLELSSAAAVRAAVLAGAGPAAMSRLAIADDLAFGRLLAVDI
+ PALNLRRQLRAIWVGGRTPPAGAIRDLLSHITSRST"
+ gene 2537948..2538142
+ /locus_tag="BQ2027_MB2304"
+ CDS 2537948..2538142
+ /locus_tag="BQ2027_MB2304"
+ /note="Mb2304, -, len: 64 aa. Equivalent to Rv2283, len:
+ 64 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 64 aa overlap). Unknown protein;
+ questionable ORF"
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00916.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64974"
+ /translation="MLEKCPHASVDCGASKIGITDNDPATATNRRLASTIRKPPIEHA
+ AGPLGSTSRAGHRSYGGVAS"
+ gene 2538152..2539447
+ /gene="lipM"
+ /locus_tag="BQ2027_MB2305"
+ CDS 2538152..2539447
+ /gene="lipM"
+ /locus_tag="BQ2027_MB2305"
+ /note="Mb2305, lipM, len: 431 aa. Equivalent to Rv2284,
+ len: 431 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 431 aa overlap). Probable lipM,
+ esterase (EC 3.1.-.-), similar to others e.g.
+ gp|Z95844|MTCY493_28 from Mycobacterium tuberculosis
+ cosmid (420 aa), FASTA scores: opt: 1266, E(): 0, (50.1%
+ identity in 411 aa overlap). Some similarity to G537514
+ arylacetamide deacetylase (399 aa), FASTA scores: opt:
+ 190, E(): 5.9e-05, (30.4% identity in 138 aa overlap).
+ Protein product from Mb2305 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2305 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable esterase LipM"
+ /protein_id="SIU00917.1"
+ /db_xref="GOA:A0A1R3Y144"
+ /db_xref="InterPro:IPR013094"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y144"
+ /translation="MGAPRLIHVIRQIGALVVAAVTAAATINAYRPLARNGFASLWSW
+ FIGLVVTEFPLPTLASQLGGLVLTAQRLTRPVRAVSWLVAAFSALGLLNLSRAGRQAD
+ AQLTAALDSGLGPDRRTASAGLWRRPAGGGTAKTPGPLRMLRIYRDYAHDGDISYGEY
+ GRANHLDIWRRPDLDLTGTAPVLFQIPGGAWTTGNKRGQAHPLMSHLAELGWICVAIN
+ YRHSPRNTWPDHIIDVKRALAWVKAHISEYGGDPDFIAITGGSAGGHLSSLAALTPND
+ PRFQPGFEEADTRVQAAVPFYGVYDFTRLQDAMHPMMLPLLERMVVKQPRTANMQSYL
+ DASPVTHISADAPPFFVLHGRNDSLVPVQQARGFVDQLRQVSKQPVVYAELPFTQHAF
+ DLLGSARAAHTAIAVEQFLAEVYATQHAGSEPGPAVAIP"
+ gene 2539480..2540817
+ /locus_tag="BQ2027_MB2306"
+ CDS 2539480..2540817
+ /locus_tag="BQ2027_MB2306"
+ /note="Mb2306, -, len: 445 aa. Equivalent to Rv2285, len:
+ 445 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 445 aa overlap). Conserved
+ hypothetical protein, member of Mycobacterium tuberculosis
+ 15-membered protein family including Rv3740c, Rv3734c,
+ Rv1425, Rv1760, Rv0895, Rv3480c. FASTA scores:
+ gp|Z95844|MTCY493_29 Mycobacterium tuberculosis cosmid
+ (459 aa) opt: 640, E(): 0; 33.4% identity in 470 aa
+ overlap. Protein product from Mb2306 detected using SWATH
+ mass spectrometry. Mb2306 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible triacylglycerol synthase
+ (diacylglycerol acyltransferase)"
+ /protein_id="SIU00918.1"
+ /db_xref="GOA:P67207"
+ /db_xref="InterPro:IPR004255"
+ /db_xref="InterPro:IPR009721"
+ /db_xref="InterPro:IPR014292"
+ /db_xref="UniProtKB/Swiss-Prot:P67207"
+ /translation="MKLLSPLDQMFARMEAPRTPMHIGAFAVFDLPKGAPRRFIRDLY
+ EAISQLAFLPFPFDSVIAGGASMAYWRQVQPDPSYHVRLSALPYPGTGRDLGALVERL
+ HSTPLDMAKPLWELHLIEGLTGRQFAMYFKAHHCAVDGLGGVNLIKSWLTTDPEAPPG
+ SGKPEPFGDDYDLASVLAAATTKRAVEGVSAVSELAGRLSSMVLGANSSVRAALTTPR
+ TPFNTRVNRHRRLAVQVLKLPRLKAVAHATDCTVNDVILASVGGACRRYLQELGDLPT
+ NTLTASVPVGFERDADTVNAASGFVAPLGTSIEDPVARLTTISASTTRGKAELLAMSP
+ NALQHYSVFGLLPIAVGQKTGALGVIPPLFNFTVSNVVLSKDPLYLSGAKLDVIVPMS
+ FLCDGYGLNVTLVGYTDKVVLGFLGCRDTLPHLQRLAQYTGAAFEELETAALP"
+ gene complement(2540884..2541147)
+ /locus_tag="BQ2027_MB2307C"
+ CDS complement(2540884..2541147)
+ /locus_tag="BQ2027_MB2307C"
+ /note="Mb2307c, -, len: 87 aa. Equivalent to 3' end of
+ Rv2286c, len: 230 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (). Conserved hypothetical protein. Similar
+ to Mycobacterium tuberculosis hypothetical protein,
+ Rv2466c, AL021246|MTV008_22 (207 aa). FASTA score: opt:
+ 324, E(): 8.9e-15; . REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv2286c exists as
+ a single gene. In Mycobacterium bovis, a frameshift due to
+ a single base transition (c-t) splits Rv2286c into 2
+ parts, Mb2307c and Mb2308c. Protein product from Mb2307c
+ detected using SWATH mass spectrometry. Mb2307c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein [SECOND PART]"
+ /protein_id="SIU00919.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0R9"
+ /translation="MPTLFLDGQCLFGPVLVDPPAGPAALNLWSVVTGMAGLPHVYEL
+ QRPKSPADVELIAQQLRPYLDGRDWVSINRGEIVDIDRLAGRS"
+ gene complement(2541175..2541576)
+ /locus_tag="BQ2027_MB2308C"
+ CDS complement(2541175..2541576)
+ /locus_tag="BQ2027_MB2308C"
+ /note="Mb2308c, -, len: 133 aa. Equivalent to 5' end of
+ Rv2286c, len: 230 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 133 aa overlap).
+ Conserved hypothetical protein. Similar to Mycobacterium
+ tuberculosis hypothetical protein, Rv2466c,
+ AL021246|MTV008_22 (207 aa). FASTA score: opt: 324, E():
+ 8.9e-15; 30.4% identity in 194 aa overlap.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv2286c exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a single
+ base transition (c-t) splits Rv2286c into 2 parts, Mb2307c
+ and Mb2308c. Mb2308c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved hypothetical protein [FIRST PART]"
+ /protein_id="SIU00920.1"
+ /db_xref="GOA:A0A1R3Y0T3"
+ /db_xref="InterPro:IPR001853"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0T3"
+ /translation="MTTVDFHFDPLCPFAYQTSVWIRDVRAQLGITINWRFFSLEEIN
+ LVAGKKHPWERDWSYGWSLMRIGALLRRTNMSLLDRWYAAIGHELHTLGGKPHDPAVA
+ RRLLCDVGVNAAILDAALDDPTTHDDVRADH"
+ gene 2541710..2543338
+ /gene="yjcE"
+ /locus_tag="BQ2027_MB2309"
+ CDS 2541710..2543338
+ /gene="yjcE"
+ /locus_tag="BQ2027_MB2309"
+ /note="Mb2309, yjcE, len: 542 aa. Equivalent to Rv2287,
+ len: 542 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 542 aa overlap). Probable yjcE,
+ conserved integral membrane transport protein, similar to
+ eukaryote NA+/H+ exchangers e.g. YJCE_ECOLI|P32703|B4065
+ Putative Na(+)/H(+) exchanger from Escherichia coli (549
+ aa), FASTA scores: opt: 436, E(): 5.6e-21, (29.4% identity
+ in 555 aa overlap); etc. SEEMS TO BELONG TO CPA1 FAMILY
+ (NA(+)/H(+) EXCHANGER FAMILY)."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved integral membrane transport
+ protein YjcE"
+ /protein_id="SIU00921.1"
+ /db_xref="GOA:P65527"
+ /db_xref="InterPro:IPR004705"
+ /db_xref="InterPro:IPR006153"
+ /db_xref="InterPro:IPR018422"
+ /db_xref="UniProtKB/Swiss-Prot:P65527"
+ /translation="MNGRRTIGEDGLVFGLVVIVALVAAVVVGTVLGHRYRVGPPVLL
+ ILSGSLLGLIPRFGDVQIDGEVVLLLFLPAILYWESMNTSFREIRWNLRVIVMFSIGL
+ VIATAVAVSWTARALGMESHAAAVLGAVLSPTDAAAVAGLAKRLPRRALTVLRGESLI
+ NDGTALVLFAVTVAVAEGAAGIGPAALVGRFVVSYLGGIMAGLLVGGLVTLLRRRIDA
+ PLEEGALSLLTPFAAFLLAQSLKCSGVVAVLVSALVLTYVGPTVIRARSRLQAHAFWD
+ IATFLINGSLWVFVGVQIPGAIDHIAGEDGGLPRATVLALAVTGVVIATRIAWVQATT
+ VLGHTVDRVLKKPTRHVGFRQRCVTSWAGFRGAVSLAAALAVPMTTNSGAPFPDRNLI
+ IFVVSVVILVTVLVQGTSLPTVVRWARMPEDVAHANELQLARTRSAQAALDALPTVAD
+ ELGVAPDLVKHLEKEYEERAVLVMADGADSATSDLAERNDLVRRVRLGVLQHQRQAVT
+ TLRNQNLIDDIVLRELQAAMDLEEVQLLDPADAE"
+ gene 2543335..2543712
+ /locus_tag="BQ2027_MB2310"
+ CDS 2543335..2543712
+ /locus_tag="BQ2027_MB2310"
+ /note="Mb2310, -, len: 125 aa. Equivalent to Rv2288, len:
+ 125 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 125 aa overlap). Unknown hypothetical
+ protein,Mb2310 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00922.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64976"
+ /translation="MSRRRPLIEPATVQVLAIAFTDSFSVSLHWPQREQGCRTAILAP
+ MRRWCDGDVDGRKLLPPARRTGTQQRRIRPAAPRVYTTGDILRDRKGIAPWQEQREPG
+ WAPFGWLHEPSGARCPKADGQSV"
+ gene 2543682..2544464
+ /gene="cdh"
+ /locus_tag="BQ2027_MB2311"
+ CDS 2543682..2544464
+ /gene="cdh"
+ /locus_tag="BQ2027_MB2311"
+ /note="Mb2311, cdh, len: 260 aa. Equivalent to Rv2289,
+ len: 260 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 260 aa overlap). Probable cdh,
+ CDP-diacylglycerol pyrophosphatase (EC 3.6.1.26), similar
+ to CDH_SALTY|P26219 cdp-diacylglycerol pyrophosphatase
+ (251 aa), FASTA scores: opt: 395, E(): 5.9e-20, (33.5%
+ identity in 221 aa overlap). Protein product from Mb2311
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2311 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable CDP-diacylglycerol pyrophosphatase Cdh
+ (CDP-diacylglycerol diphosphatase) (CDP-diacylglycerol
+ phosphatidylhydrolase)"
+ /protein_id="SIU00923.1"
+ /db_xref="GOA:P63752"
+ /db_xref="InterPro:IPR003763"
+ /db_xref="InterPro:IPR036265"
+ /db_xref="InterPro:IPR038433"
+ /db_xref="UniProtKB/Swiss-Prot:P63752"
+ /translation="MPKSRRAVSLSVLIGAVIAALAGALIAVTVPARPNRPEADREAL
+ WKIVHDRCEFGYRRTGAYAPCTFVDEQSGTALYKADFDPYQFLLIPLARITGIEDPAL
+ RESAGRNYLYDAWAARFLVTARLNNSLPESDVVLTINPKNARTQDQLHIHISCSSPTT
+ SAALRNVDTSEYVGWKQLPIDLGGRRFQGLAVDTKAFESRNLFRDIYLKVTADGKKME
+ NASIAVANVAQDQFLLLLAEGTEDQPVAAETLQDHDCSITKS"
+ gene 2544606..2544761
+ /gene="lppOa"
+ /locus_tag="BQ2027_MB2312"
+ CDS 2544606..2544761
+ /gene="lppOa"
+ /locus_tag="BQ2027_MB2312"
+ /note="Mb2312, lppOa, len: 51 aa. Equivalent to 5' end of
+ Rv2290, len: 171 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 39 aa overlap). Probable
+ lppO, conserved lipoprotein, similar to Rv3763, 19KD_MYCTU
+ P11572 19 kd lipoprotein antigen precursor (159 aa) FASTA
+ scores, opt: 119, E (): 1.3, (25.6% identity in 164 aa
+ overlap). ???Contains appropriately positioned PS00013
+ lipoprotein motif (with one mismatch).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, lppO exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (c-*), splits lppO into 2 parts, lppOa and lppOb.
+ Protein product from Mb2312 detected using shotgun mass
+ spectrometry. Mb2312 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved lipoprotein lppOa"
+ /protein_id="SIU00924.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2X6"
+ /translation="MTDPRHTVRIAVGATALGVSALGATLPACSAHSGPGSPPVRRQL
+ PRPRPSW"
+ gene 2544755..2545120
+ /gene="lppOb"
+ /locus_tag="BQ2027_MB2313"
+ CDS 2544755..2545120
+ /gene="lppOb"
+ /locus_tag="BQ2027_MB2313"
+ /note="Mb2313, lppOb, len: 121 aa. Equivalent to 3' end of
+ Rv2290, len: 171 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.2% identity in 121 aa overlap). Probable
+ lppO, conserved lipoprotein, similar to Rv3763, 19KD_MYCTU
+ P11572 19 kd lipoprotein antigen precursor (159 aa) FASTA
+ scores, opt: 119, E (): 1.3, (25.6% identity in 164 aa
+ overlap). Contains appropriately positioned PS00013
+ lipoprotein motif (with one mismatch).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, lppO exists as a single gene.
+ In Mycobacterium bovis, a frameshift due to a single base
+ deletion (c-*), splits lppO into 2 parts, lppOa and lppOb.
+ Protein product from Mb2313 detected using SWATH mass
+ spectrometry. Mb2313 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable conserved lipoprotein lppOb"
+ /protein_id="SIU00925.1"
+ /db_xref="GOA:A0A1R3Y1J8"
+ /db_xref="InterPro:IPR008691"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1J8"
+ /translation="MVEGHTHTISGAVECRTSPAVRTATPSESGTQTTRVNAHDDSAS
+ VTLSLSDSTPPDVNGFGISLKIGSVDYQMPYQPVQSPTQVEATRQGKSYTLTGTGHAV
+ IPGQTGMRELPFGVHVTCP"
+ gene 2545262..2546032
+ /gene="sseB"
+ /locus_tag="BQ2027_MB2314"
+ CDS 2545262..2546032
+ /gene="sseB"
+ /locus_tag="BQ2027_MB2314"
+ /note="Mb2314, sseB, len: 256 aa. Equivalent to 3' end of
+ Rv2291, len: 284 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.2% identity in 256 aa overlap). Probable
+ sseB, thiosulfate sulfurtransferase. Very similar to
+ thiosulfate sulfurtransferas/rhodanese from Streptomyces
+ coelicolor AL00920 4|SC9B10_21 (283 aa) opt: 765, E(): 0;
+ Smith-Waterman score: 765; 46.9% identity in 286 aa
+ overlap, similar to THTR_ECOLI P31142 putative thiosulfate
+ sulfurtransferase (280 aa), FASTA scores, opt: 478, E():
+ 1e-23, (35.1% identity in 265 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis,
+ truncation at the 5' start due to a 2 bp deletion (tg-*),
+ leads to a shorter product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (256 aa versus 284
+ aa). Protein product from Mb2314 detected using SWATH mass
+ spectrometry. Mb2314 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable thiosulfate sulfurtransferase SseB"
+ /protein_id="SIU00926.1"
+ /db_xref="GOA:A0A1R3Y0Y9"
+ /db_xref="InterPro:IPR001307"
+ /db_xref="InterPro:IPR001763"
+ /db_xref="InterPro:IPR036873"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Y9"
+ /translation="MRWRLDEPDGHAAYLQGHLPGAVFVSLEDELSDHTIAGRGRHPL
+ PSGASLQATVRRCGIRHDVPVVVYDDWNRAGSARAWWVLTAAGIANVRILDGGLPAWR
+ SAGGSIETGQVSPQLGNVTVLHDDLYAGQRLTLTAQQAGAGGVTLLDARVPERFRGDV
+ EPVDAVAGHIPGAINVPSGSVLADDGTFLGNGALNALLSDHGIDHGGRVGVYCGSGVS
+ AAVIVAALAVIGQDAALFPGSWSEWSSDPTRPVGRGTA"
+ gene complement(2546033..2547037)
+ /locus_tag="BQ2027_MB2315C"
+ CDS complement(2546033..2547037)
+ /locus_tag="BQ2027_MB2315C"
+ /EC_number="3.2.2.16"
+ /EC_number="3.2.2.9"
+ /note="Mb2315c, -, len: 334 aa. Similar to Rv2293c and
+ Rv2292c, len: 246 aa and 74 aa, from Mycobacterium
+ tuberculosis strain H37Rv, (92.2% identity in 245 aa
+ overlap and 100.0% identity in 74 aa overlap). Conserved
+ hypothetical protein; some similarity to hypothetical
+ protein (299 aa) AAK24237.1| (AE005897) belonging to
+ phosphorylase family [Caulobacter crescentus] (33%
+ identity in 131 aa overlap). Possible lipoprotein: signal
+ peptide at N-terminus. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv2293c and
+ Rv2292c exist as 2 genes. In Mycobacterium bovis, a single
+ base insertion (*-g) results in a single product which is
+ more similar to Rv2293c. Mb2315c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="5'-methylthioadenosine nucleosidase (EC @
+ S-adenosylhomocysteine nucleosidase (EC"
+ /protein_id="SIU00927.1"
+ /db_xref="GOA:P64978"
+ /db_xref="InterPro:IPR000845"
+ /db_xref="InterPro:IPR035994"
+ /db_xref="UniProtKB/Swiss-Prot:P64978"
+ /translation="MGAPLRHCLLVAAALSLGCGVAAADPGYVANVIPCEQRTLVLSA
+ FPAEADAVLAHTALDANPVVVADRRRYYLGSISGKKVIVAMTGIGLVNATNTTETAFA
+ RFTCASSIAIAAVMFSGVAGGAGRTSIGDVAIPARWTLDNGATFRGVDPGMLATAQTL
+ SVVLDNINTLGNPVCLCRNVPVVRLNHLGRQPQLFVGGDGSSSDKNNGQAFPCIPNGG
+ SVFGCQPCSAPDRSLGYTGNFFQAAGPWLKNALISNLNIVSTVNPGFDAVDQETAAAQ
+ AVADAHGVPFLGIRGMSDGPGDPLHLPGFPVQFFVYKQIAANNAARVTEAFLQNWAGV
+ "
+ gene 2547332..2548555
+ /locus_tag="BQ2027_MB2316"
+ CDS 2547332..2548555
+ /locus_tag="BQ2027_MB2316"
+ /note="Mb2316, -, len: 407 aa. Equivalent to Rv2294, len:
+ 407 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 407 aa overlap). Probable
+ aminotransferase (EC 2.6.1.-), similar to others in M.
+ tuberculosis e.g. MTV030_19, also similar to
+ PATB_BACSU|Q08432 putative aminotransferase b from
+ Bacillus subtilis (387 aa), FASTA scores: opt: 563, E(): 2
+ .8e-29, (31.4% identity in 408 aa overlap); and to
+ MALY_ECOLI|P23256 maly protein from Escherichia coli (390
+ aa), FASTA scores: opt: 530, E(): 3.6e-27, (31.3% identity
+ in 384 aa overlap). BELONGS TO CLASS-II OF
+ PYRIDOXAL-PHOSPHATE-DEPENDENT AMINOTRANSFERASES. Protein
+ product from Mb2316 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2316 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable aminotransferase"
+ /protein_id="SIU00928.1"
+ /db_xref="GOA:P63503"
+ /db_xref="InterPro:IPR004839"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="UniProtKB/Swiss-Prot:P63503"
+ /translation="MIPNPLEELTLEQLRSQRTSMKWRAHPADVLPLWVAEMDVKLPP
+ TVADALRRAIDDGDTGYPYGTEYAEAVREFACQRWQWHDLEVSRTAIVPDVMLGIVEV
+ LRLITDRGDPVIVNSPVYAPFYAFVSHDGRRVIPAPLRGDGRIDLDALQEAFSSARAS
+ SGSSGNVAYLLCNPHNPTGSVHTADELRGIAERAQRFGVRVVSDEIHAPLIPSGARFT
+ PYLSVPGAENAFALMSASKAWNLGGLKAALAIAGREAAADLARMPEEVGHGPSHLGVI
+ AHTAAFRTGGNWLDALLRGLDHNRTLLGALVDEHLPGVQYRWPQGTYLAWLDCRELGF
+ DDAASDEMTEGLAVVSDLSGPARWFLDHARVALSSGHVFGIGGAGHVRINFATSRAIL
+ IEAVSRMSRSLLERR"
+ gene 2548778..2549416
+ /locus_tag="BQ2027_MB2317"
+ CDS 2548778..2549416
+ /locus_tag="BQ2027_MB2317"
+ /note="Mb2317, -, len: 212 aa. Equivalent to Rv2295, len:
+ 212 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 212 aa overlap). Conserved
+ hypothetical protein, cysteine-rich protein, similar to
+ YIEJ_ECOLI P31469 hypothetical 22.5 kd protein in
+ tnab-bglb intergenic region (195 aa), opt: 270, E():
+ 3.4e-11, (36.4% identity in 198 aa overlap). Alternative
+ start suggested by similarity 26 codons further
+ downstream,Mb2317 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Colicin E2 tolerance protein CbrC-like protein"
+ /protein_id="SIU00929.1"
+ /db_xref="InterPro:IPR005363"
+ /db_xref="UniProtKB/Swiss-Prot:P67310"
+ /translation="MDQSANHACLPTPLASTTGRGQDHEMPVEETSTPQKLPQFRYHP
+ DPVGTGSIVADEVSCVSCEQRRPYTYTGPVYAEEELNEAICPWCIADGSAASRFDATF
+ TDAMWAVPDDVPEDVTEEVLCRTPGFTGWLQEEWLHHCGDAAAFLGPVGASEVADLPD
+ ALDALRNEYRGYDWPADKIEEFILTLDRNGLATAYLFRCLSCGVHLAYADFA"
+ gene 2549510..2550412
+ /locus_tag="BQ2027_MB2318"
+ CDS 2549510..2550412
+ /locus_tag="BQ2027_MB2318"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2318, -, len: 300 aa. Equivalent to Rv2296, len:
+ 300 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 300 aa overlap). Probable haloalkane
+ dehalogenase (EC 3.8.1.5), similar to e.g. HALO_XANAU
+ P22643, haloalkane dehalogenase, (310 aa), opt: 510
+ z-score: 577.7 E(): 3.1e-25 (39.0% identity in 315 aa
+ overlap). Protein product from Mb2318 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2318 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Probable haloalkane dehalogenase"
+ /protein_id="SIU00930.1"
+ /db_xref="GOA:P64302"
+ /db_xref="InterPro:IPR000073"
+ /db_xref="InterPro:IPR000639"
+ /db_xref="InterPro:IPR023489"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/Swiss-Prot:P64302"
+ /translation="MDVLRTPDSRFEHLVGYPFAPHYVDVTAGDTQPLRMHYVDEGPG
+ DGPPIVLLHGEPTWSYLYRTMIPPLSAAGHRVLAPDLIGFGRSDKPTRIEDYTYLRHV
+ EWVTSWFENLDLHDVTLFVQDWGSLIGLRIAAEHGDRIARLVVANGFLPAAQGRTPLP
+ FYVWRAFARYSPVLPAGRLVNFGTVHRVPAGVRAGYDAPFPDKTYQAGARAFPRLVPT
+ SPDDPAVPANRAAWEALGRWDKPFLAIFGYRDPILGQADGPLIKHIPGAAGQPHARIK
+ ASHFIQEDSGTELAERMLSWQQAT"
+ gene 2550444..2550896
+ /locus_tag="BQ2027_MB2319"
+ CDS 2550444..2550896
+ /locus_tag="BQ2027_MB2319"
+ /note="Mb2319, -, len: 150 aa. Equivalent to Rv2297, len:
+ 150 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 150 aa overlap). Unknown protein;
+ contains PS00343 Gram-positive cocci surface proteins
+ 'anchoring' hexapeptide Protein product from Mb2319
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2319 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00931.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64980"
+ /translation="MAMEMAMMGLLGTVVGASAMGIGGIAKSIAEAYVPGVAAAKDRR
+ QQMNVDLQARRYEAVRVWRSGLCSASNAYRQWEAGSRDTHAPNVVGDEWFEGLRPHLP
+ TTGEAAKFRTAYEVRCDNPTLMVLSLEIGRIEKEWMVEASGRTPKHRG"
+ gene 2551088..2552059
+ /locus_tag="BQ2027_MB2320"
+ CDS 2551088..2552059
+ /locus_tag="BQ2027_MB2320"
+ /note="Mb2320, -, len: 323 aa. Equivalent to Rv2298, len:
+ 323 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 323 aa overlap). Conserved
+ hypothetical protein. Similar to SLR0545 Synechocystis sp,
+ Q55493 hypothetical 34.6 kDa protein (314 aa), FASTA
+ scores, opt: 427, E(): 1.7e-20, (39.3% identity in 303 aa
+ overlap) and to YZAE_BACSU P46905 hypothetical protein in
+ natb 3'region (268 aa) FASTA scores, opt: 370, E():
+ 6.1e-17, (31.4% identity in 264 aa overlap) Protein
+ product from Mb2320 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2320 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Aldo/keto reductase"
+ /protein_id="SIU00932.1"
+ /db_xref="GOA:P63485"
+ /db_xref="InterPro:IPR023210"
+ /db_xref="InterPro:IPR036812"
+ /db_xref="UniProtKB/Swiss-Prot:P63485"
+ /translation="MKYLDVDGIGQVSRIGLGTWQFGSREWGYGDRYATGAARDIVKR
+ ARALGVTLFDTAEIYGLGKSERILGEALGDDRTEVVVASKVFPVAPFPAVIKNRERAS
+ ARRLQLNRIPLYQIHQPNPVVPDSVIMPGMRDLLDSGDIGAAGVSNYSLARWRKADAA
+ LGRPVVSNQVHFSLAHPDALEDLVPFAELENRIVIAYSPLAQGLLGGKYGLENRPGGV
+ RALNPLFGTENLRRIEPLLATLRAIAVDVDAKPAQVALAWLISLPGVVAIPGASSVEQ
+ LEFNVAAADIELSAQSRDALTDAARAFRPVSTGRFLTDMVREKVSRR"
+ gene complement(2552065..2554008)
+ /gene="htpG"
+ /locus_tag="BQ2027_MB2321C"
+ CDS complement(2552065..2554008)
+ /gene="htpG"
+ /locus_tag="BQ2027_MB2321C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2321c, htpG, len: 647 aa. Equivalent to Rv2299c,
+ len: 647 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 647 aa overlap). htpG, probable
+ chaperone, HSP90 familyHEAT SHOCK PROTEIN HSP90 FAMILY.
+ Similar to HTPG_BACSU|P46208 heat shock protein htpG
+ homologue from Bacillus subtilis (626 aa), FASTA scores:
+ opt: 1551, E(): 0, (39.6% identity in 631 aa overlap).
+ Contains possible helix-turn-helix motif at aa 519-540
+ (+3.77 SD). BELONGS TO THE HEAT SHOCK PROTEIN 90 FAMILY.
+ Protein product from Mb2321c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2321c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CHAPERONE PROTEIN HTPG (HEAT SHOCK
+ PROTEIN) (HSP90 FAMILY PROTEIN) (HIGH TEMPERATURE PROTEIN
+ G)"
+ /protein_id="SIU00933.1"
+ /db_xref="GOA:P64412"
+ /db_xref="InterPro:IPR001404"
+ /db_xref="InterPro:IPR003594"
+ /db_xref="InterPro:IPR019805"
+ /db_xref="InterPro:IPR020568"
+ /db_xref="InterPro:IPR020575"
+ /db_xref="InterPro:IPR036890"
+ /db_xref="InterPro:IPR037196"
+ /db_xref="UniProtKB/Swiss-Prot:P64412"
+ /translation="MNAHVEQLEFQAEARQLLDLMVHSVYSNKDAFLRELISNASDAL
+ DKLRIEALRNKDLEVDTSDLHIEIDADKAARTLTVRDNGIGMAREEVVDLIGTLAKSG
+ TAELRAQLREAKNAAASEELIGQFGIGFYSSFMVADKVQLLTRKAGESAATRWESSGE
+ GTYTIESVEDAPQGTSVTLHLKPEDAEDDLHDYTSEWKIRNLVKKYSDFIAWPIRMDV
+ ERRTPASQEEGGEGGEETVTIETETLNSMKALWARPKEEVSEQEYKEFYKHVAHAWDD
+ PLEIIAMKAEGTFEYQALLFIPSHAPFDLFDRDAHVGIQLYVKRVFIMGDCDQLMPEY
+ LRFVKGVVDAQDMSLNVSREILQQDRQIKAIRRRLTKKVLSTIKDVQSSRPEDYRTFW
+ TQFGRVLKEGLLSDIDNRETLLGISSFVSTYSEEEPTTLAEYVERMKDGQQQIFYATG
+ ETRQQLLKSPHLEAFKAKGYEVLLLTDPVDEVWVGMVPEFDGKPLQSVAKGEVDLSSE
+ EDTSEAEREERQKEFADLLTWLQETLSDHVKEVRLSTRLTESPACLITDAFGMTPALA
+ RIYRASGQEVPVGKRILELNPSHPLVTGLRQAHQDRADDAEKSLAETAELLYGTALLA
+ EGGALEDPARFAELLAERLARTL"
+ gene complement(2554082..2555014)
+ /locus_tag="BQ2027_MB2322C"
+ CDS complement(2554082..2555014)
+ /locus_tag="BQ2027_MB2322C"
+ /note="Mb2322c, -, len: 310 aa. Equivalent to Rv2300c,
+ len: 310 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 310 aa overlap). Conserved
+ hypothetical protein, similar to others e.g. Q9RXY2|DR0172
+ CONSERVED HYPOTHETICAL PROTEIN from Deinococcus
+ radiodurans (271 aa), FASTA scores: opt: 306, E():
+ 1.3e-12, (34.6% identity in 229 aa overlap); Q9HZH1|PA3037
+ HYPOTHETICAL PROTEIN from Pseudomonas aeruginosa (288 aa),
+ FASTA scores: opt: 248, E(): 7.9e-09, (31.5% identity in
+ 238 aa overlap); Q9PDL8|XF1361 HYPOTHETICAL PROTEIN from
+ Xylella fastidiosa (279 aa), FASTA scores: opt: 236, E():
+ 4.6e-08, (29.7% identity in 249 aa overlap);
+ U70053|XCU70053_3 GumP PROTEIN from Xanthomonas campestris
+ (282 aa), FASTA scores: opt: 222, E(): 3.7e-07, (30.1%
+ identity in 248 aa overlap); etc. Mb2322c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MBL-fold metallo-hydrolase superfamily"
+ /protein_id="SIU00934.1"
+ /db_xref="GOA:P64982"
+ /db_xref="InterPro:IPR001279"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/Swiss-Prot:P64982"
+ /translation="MVATRGRPCPTNFSRPQRPRVAGNGTKSQRCRGRLTTSMLGVAP
+ EAKGPPVKVHHLNCGTMNAFGIALLCHVLLVETDDGLVLVDTGFGIQDCLDPGRVGLF
+ RHVLRPAFLQAETAARQIEQLGYRTSDVRHIVLTHFDFDHIGGIADFPEAHLHVTAAE
+ ARGAIHAPSLRERLRYRRGQWAHGPKLVEHGPDGEPWRGFASAKPLDSIGTGVVLVPM
+ PGHTRGHAAVAVDAGHRWVLHCGDAFYHRGTLDGRFRVPFVMRAEEKLLSYNRNQLRD
+ NQARIVELHRRHDPDLLIVCAHDPDLYQLARDTA"
+ gene 2555021..2555713
+ /gene="cut2"
+ /locus_tag="BQ2027_MB2323"
+ CDS 2555021..2555713
+ /gene="cut2"
+ /locus_tag="BQ2027_MB2323"
+ /standard_name="cfp25"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2323, cut2, len: 230 aa. Equivalent to Rv2301,
+ len: 230 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 230 aa overlap). Probable cut2
+ (alternate gene name: cfp25), cutinase (EC 3.1.1.-),
+ highly similar to others from Mycobacteria tuberculosis
+ e.g. MTCY13E12.04|Rv3451|O06318|CUT3_MYCTU (247 aa), FASTA
+ scores: opt: 569, E(): 2.3e-27, (45.3% identity in 223 aa
+ overlap); MT2037|MTCY39.35|RV1984C|Q10837|CUT1_MYCTU (217
+ aa), FASTA scores: opt: 383, E(): 3.4e-16 (42.9% identity
+ in 217 aa overlap); O69691|Rv3724|MTV025.072 PUTATIVE
+ CUTINASE PRECURSOR (187 aa), FASTA scores: opt: 248, E():
+ 4.3e-08, (41.85% identity in 172 aa overlap); etc. Also
+ similar to few others from other organisms e.g. Q9KK87
+ SERINE ESTERASE CUTINASE from Mycobacterium avium (220
+ aa), FASTA scores: opt: 391, E(): 1.1e-16, (39.15%
+ identity in 235 aa overlap); etc. Contains PS00095 C-5
+ cytosine-specific DNA methylases C-terminal signature.
+ BELONGS TO THE CUTINASE FAMILY. Start changed since first
+ submission (+11 aa). Protein product from Mb2323 detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2323 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CUTINASE CUT2"
+ /protein_id="SIU00935.1"
+ /db_xref="GOA:P63882"
+ /db_xref="InterPro:IPR000675"
+ /db_xref="InterPro:IPR006311"
+ /db_xref="InterPro:IPR011150"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/Swiss-Prot:P63882"
+ /translation="MNDLLTRRLLTMGAAAAMLAAVLLLTPITVPAGYPGAVAPATAA
+ CPDAEVVFARGRFEPPGIGTVGNAFVSALRSKVNKNVGVYAVKYPADNQIDVGANDMS
+ AHIQSMANSCPNTRLVPGGYSLGAAVTDVVLAVPTQMWGFTNPLPPGSDEHIAAVALF
+ GNGSQWVGPITNFSPAYNDRTIELCHGDDPVCHPADPNTWEANWPQHLAGAYVSSGMV
+ NQAADFVAGKLQ"
+ gene 2555819..2556061
+ /locus_tag="BQ2027_MB2324"
+ CDS 2555819..2556061
+ /locus_tag="BQ2027_MB2324"
+ /note="Mb2324, -, len: 80 aa. Equivalent to Rv2302, len:
+ 80 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 80 aa overlap). Conserved hypothetical
+ protein, highly similar to others:
+ O53766|AL021942|Rv0569|MTV039.07 HYPOTHETICAL 9.5 KDA
+ PROTEIN from Mycobacterium tuberculosis (88 aa), FASTA
+ scores: opt: 300, E(): 1.4e-14, (61.85% identity in 76 aa
+ overlap); O88049|SCI35.11 HYPOTHETICAL 7.1 KDA PROTEIN
+ from Streptomyces coelicolor (64 aa), FASTA scores: opt:
+ 169, E(): 1.5e-05, (46.55% identity in 58 aa overlap) (has
+ its C-terminus shorter); Q9XCD1 HYPOTHETICAL 12.0 KDA
+ PROTEIN (FRAGMENT) from Thermomonospora fusca (106 aa),
+ FASTA scores: opt: 126, E(): 0.023, (50.0% identity in 34
+ aa overlap) (similarity in part for this one). Also weakly
+ similar to U650M|G699303|Q50105 HYPOTHETICAL 5.7 KDA
+ PROTEIN from Mycobacterium leprae (53 aa), FASTA scores:
+ opt: 89, E(): 0.66, (45.5% identity in 33 aa overlap); and
+ weakly similar to N-terminus of Q9RIZ1|SCJ1.23c putative
+ DNA-binding protein from Streptomyces coelicolor (323 aa),
+ FASTA scores: opt: 182, E(): 7.3e-06, (42.25% identity in
+ 71 aa overlap). Protein product from Mb2324 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2324 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved protein"
+ /protein_id="SIU00936.1"
+ /db_xref="InterPro:IPR015035"
+ /db_xref="UniProtKB/Swiss-Prot:P64984"
+ /translation="MHAKVGDYLVVKGTTTERHDQHAEIIEVRSADGSPPYVVRWLVN
+ GHETTVYPGSDAVVVTATEHAEAEKRAAARAGHAAT"
+ gene complement(2556102..2557025)
+ /locus_tag="BQ2027_MB2325C"
+ CDS complement(2556102..2557025)
+ /locus_tag="BQ2027_MB2325C"
+ /note="Mb2325c, -, len: 307 aa. Equivalent to Rv2303c,
+ len: 307 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 307 aa overlap). Probable
+ antibiotic-resistance protein, with some similarity to
+ Q54229|G153373 macrotetrolide antibiotic-resistance
+ protein (NONR) from Streptomyces griseus (347 aa) (see the
+ first citation below), FASTA scores: opt: 438, E():
+ 3.1e-21, (33.2% identity in 226 aa overlap); and other
+ hypothetical proteins e.g. P95886 ORF C02006 from
+ Sulfolobus solfataricus (269 aa), FASTA scores: opt: 252,
+ E(): 3.5e-09, (25.5% identity in 286 aa overlap). Also
+ similar to Mycobacterium tuberculosis
+ Rv3510c|O53555|MTV023.17. Note that the protein
+ Q9XDF3|NONC from Streptomyces griseus subsp. griseus (317
+ aa) is equivalent to Q54229|G153373|NONR however the
+ N-terminal end is shorter (30 aa) owing to a changed start
+ codon (see the second citation below). Protein product
+ from Mb2325c detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ANTIBIOTIC-RESISTANCE PROTEIN"
+ /protein_id="SIU00937.1"
+ /db_xref="GOA:A0A1R3Y165"
+ /db_xref="InterPro:IPR006680"
+ /db_xref="InterPro:IPR032465"
+ /db_xref="InterPro:IPR032466"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y165"
+ /translation="MTAPEPRVPVIDMWAPFVPSAEVIDDLREGFPVELLSYFEVFTK
+ TTISAEQFGAYAESLRRTDDQILDSLDDAGITRSLITGFDERSTCGVTFVHNASVAAV
+ AARYPDRFLPFAGADILAGDSAVDEFERWVVEHGFRGLSLRPFMIGRPASDPAYFPCY
+ AKCVELGVPVSIHTSADWTRTRLSDLGHPRHIDDVACRFPELTILMSHGGYPWVLQAC
+ LIAWKHPNVYLELAAHRPKYFASPGAGWEPLMRFGQTTIRNKIVYGTGGFLINRPYLQ
+ LCDEMRALPVPREVLEDWLWRNATRVLRLDT"
+ gene complement(2557022..2557231)
+ /locus_tag="BQ2027_MB2326C"
+ CDS complement(2557022..2557231)
+ /locus_tag="BQ2027_MB2326C"
+ /note="Mb2326c, -, len: 69 aa. Equivalent to Rv2304c, len:
+ 69 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 69 aa overlap). Hypothetical unknown
+ protein. Mb2326c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00938.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64986"
+ /translation="MSHDIATEEADDGALDRCVLCDLTGKRVDVKEATCTGRPATTFE
+ QAFAVERDAGFDDFLHGPVGPRSTP"
+ gene 2557815..2559104
+ /locus_tag="BQ2027_MB2327"
+ CDS 2557815..2559104
+ /locus_tag="BQ2027_MB2327"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2327, -, len: 429 aa. Equivalent to Rv2305, len:
+ 429 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 429 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb2327 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2327 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="NRPS condensation (elongation) domain containing
+ protein"
+ /protein_id="SIU00939.1"
+ /db_xref="InterPro:IPR023213"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0U0"
+ /translation="MTQTLRLTALDEMFITDDIDIVPSVQIEARVSGRFDLDRLAAAL
+ RAAVAKHALARARLGRASLTARTLYWEVPDRADHLAVEITDEPVGEVRSRFYARAPEL
+ HRSPVFAVAVVRETVGDRLLLNFHHAAFDGMGGLRLLLSLARAYADEPDEVGGPPIEE
+ ARNLKGVAGSRDLFDVLIRARGLAKPAIDRKRTTRVAPDGGSPDGPRFVFAPLTIESD
+ EMATAVARRPEGATVNDLAMAALALTILQWNRTHDVPAADSVSVNMPVNFRPTAWSTE
+ VISNFASYLAIVLRVDEVTDLEKATAIVAGITGPLKQSGAAGWVVDLLEGGKVLPAML
+ KRQLQLLLPLVEDRFVESVCLSNLGRVDVPAFGGEAGDTTEVWFSPTAAMSVMPIGVG
+ LVGFGGTLRAMFRGDGRTIGGEALGRFAALYRDTLLT"
+ gene 2559114..2559707
+ /locus_tag="BQ2027_MB2328"
+ CDS 2559114..2559707
+ /locus_tag="BQ2027_MB2328"
+ /note="Mb2328, -, len: 197 aa. Equivalent to Rv2306A, len:
+ 197 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 197 aa overlap). Possible conserved
+ membrane protein, similar to several hypothetical membrane
+ proteins from Mycobacterium tuberculosis and Streptomyces
+ coelicolor, e.g. Rv0625c|P96915|Y625_MYCTU HYPOTHETICAL
+ 25.2 KDA PROTEIN from Mycobacterium tuberculosis (246 aa),
+ FASTA scores: opt: 410, E(): 2.7e-17, (53.25% identity in
+ 139 aa overlap). First 140 aa show high similarity, this
+ then decreases but continues in next ORF Rv2306B,
+ suggesting a frameshift near nt 2577473. However the
+ sequence has been checked and no error found. The sequence
+ is identical in CDC1551 and Mycobacterium bovis. Replaces
+ original Rv2306c on other strand."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00940.1"
+ /db_xref="GOA:A0A1R3Y0V2"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0V2"
+ /translation="MTDNECPADSRRRHVLRLALFAGILLGLFYLVAVARVIHVDGVR
+ SAVVVATGPIAPLAYVVVSAALGALFVPGPILAAGSGVLFGPLLDTFVTLPAFSAGAQ
+ AGMTPRRCWVSIAPIASMHRSNGADCGRWSVSASSPASRMRWPRTPSGRSEFRCGRWS
+ LGRSSGRRHGCSSTPRWARRSPTCRRRWFTRRSRCGA"
+ gene 2559494..2559928
+ /locus_tag="BQ2027_MB2329"
+ CDS 2559494..2559928
+ /locus_tag="BQ2027_MB2329"
+ /note="Mb2329, -, len: 144 aa. Equivalent to Rv2306B, len:
+ 144 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 144 aa overlap). Possible conserved
+ membrane protein, similar to C-terminal part of several
+ hypothetical membrane proteins from Mycobacterium
+ tuberculosis and Streptomyces coelicolor e.g.
+ P96915|Y625_MYCTU|RV0625c HYPOTHETICAL 25.2 KDA PROTEIN
+ from Mycobacterium tuberculosis (246 aa), FASTA scores:
+ opt: 480, E(): 5e-24, (77.15% identity in 92 aa overlap).
+ Could be a continuation of Rv2306A suggesting there may be
+ a frameshift near nt 2577473. The C-terminal part is
+ longer than Rv0625c and the 3'-end of gene overlaps
+ Rv2307c, so maybe a further framehift. However, sequence
+ has been checked and no error found. Also same sequence as
+ strain CDC1551 and Mycobacterium bovis. Replaces original
+ Rv2306c on other strand."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU00941.1"
+ /db_xref="GOA:A0A1R3Y0T8"
+ /db_xref="InterPro:IPR015414"
+ /db_xref="InterPro:IPR032816"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0T8"
+ /translation="MWAVVGQRFVPGISDALASYTFGAFGVPLWQMVVGSFIGSAPRV
+ FVYTALGASITNLSSPLVYSAIAVWCVTAIIGAFAARRWYRKWRARPRRRCGLAQLTT
+ GSQQRHTSHRTPAGVVMPGSLSEHRRLRQEAPDRIEHHPPIE"
+ gene complement(2559857..2560702)
+ /locus_tag="BQ2027_MB2330C"
+ CDS complement(2559857..2560702)
+ /locus_tag="BQ2027_MB2330C"
+ /note="Mb2330c, -, len: 281 aa. Equivalent to Rv2307c,
+ len: 281 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 281 aa overlap). Conserved hypothetical
+ protein, similar to many other hypothetical proteins and
+ BEM1/BUD5 suppressors e.g. P77538 HYPOTHETICAL PROTEIN
+ from Escherichia coli (293 aa), FASTA scores: opt: 421,
+ E(): 2.4e-18, (32.1% identity in 268 aa overlap) (alias
+ AAG57647|Z3802|BAB36823|ECS3400 Putative enzyme (3.4.-)
+ from Escherichia coli (293 aa), FASTA scores: opt: 425,
+ E(): 1.7e-18, (32.1% identity in 268 aa
+ overlap));P54069|BE46_SCHPO|BEM46|SPBC32H8.03|PI020 BEM46
+ PROTEIN from Schizosaccharomyces pombe (Fission yeast)
+ (352 aa), FASTA scores: opt: 355, E(): 3.3e-14, (30.45%
+ identity in 279 aa overlap); O76462|BEM46 BEM46 PROTEIN
+ from Drosophila melanogaster (338 aa), FASTA scores: opt:
+ 404, E(): 2.8e-17, (32.75% identity in 281 aa overlap);
+ etc. Equivalent (but with few differences) to
+ AAK46650|MT2364 protein from Mycobacterium tuberculosis
+ strain CDC1551 (281 aa). Mb2330c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Hydrolase, alpha/beta fold family"
+ /protein_id="SIU00942.1"
+ /db_xref="InterPro:IPR022742"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0V0"
+ /translation="MSLKRCRALPVVAIVALVASGVITFIWSQQRRLIYFPSAGPVPS
+ ASSVLPAGRDVVVETQDGMRLGGWYFPHTSGGSGPAVLVCNGNAGDRSMRAELAVALH
+ GLGLSVLLFDYRGYGGNPGRPSEQGLAADARAAQEWLSGQSDVDPARIAYFGESLGAA
+ VAVGLAVQRPPAALVLRSPFTSLAEVGAVHYPWLPLRRLLLDHYPSIERIASVHAPVL
+ VIAGGSDDIVPATLSEWLVAAAAEPKRYVVVPGVGHNDPELLDGRVMLDAIRRFLTET
+ AVLGQ"
+ gene complement(2561234..2561425)
+ /locus_tag="BQ2027_MB2331C"
+ CDS complement(2561234..2561425)
+ /locus_tag="BQ2027_MB2331C"
+ /note="Mb2331c, -, len: 63 aa. Equivalent to Rv2307A, len:
+ 63 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 63 aa overlap). Hypothetical unknown
+ protein. Mb2331c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL GLYCINE RICH PROTEIN"
+ /protein_id="SIU00943.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0S7"
+ /translation="MAFVDLRYPWCRGDGWISPPVVAVALGWAMRRKPFSRFNEYVGS
+ ASNTCWFARALELRTLLIR"
+ gene complement(2561510..2561941)
+ /locus_tag="BQ2027_MB2332C"
+ CDS complement(2561510..2561941)
+ /locus_tag="BQ2027_MB2332C"
+ /note="Mb2332c, -, len: 143 aa. Equivalent to Rv2307B,
+ len: 143 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 143 aa overlap). Hypothetical unknown
+ Gly- rich protein. Equivalent to AAK46653 from
+ Mycobacterium tuberculosis strain CDC1551 (133 aa) but
+ longer 10 aa. Mb2332c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL GLYCINE RICH PROTEIN"
+ /protein_id="SIU00944.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y2Z9"
+ /translation="MEEVPTGPPAMGHRACGGQKAAFPTRMNSGVEKMYKNSIAIAIG
+ TLTMAVEFSMVSANAEPAPPPGQDPHMPNSAMGYCPGGGFGGITGWGYCDGIRYPDGS
+ YWHQVRVPAPFVGTTLTLSCVIDDGSPVPPLAAPGSCGGGA"
+ gene complement(2562034..2562216)
+ /locus_tag="BQ2027_MB2333C"
+ CDS complement(2562034..2562216)
+ /locus_tag="BQ2027_MB2333C"
+ /note="Mb2333c, -, len: 60 aa. Equivalent to Rv2307D, len:
+ 60 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 60 aa overlap). Hypothetical unknown
+ protein. Mb2333c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00945.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1L6"
+ /translation="MWRHLWLMQPQRRYPRGSGTTRTARRDAGVAPLYGVSRVTVLAS
+ TTATTAPPVKSFPDLL"
+ gene 2562425..2563141
+ /locus_tag="BQ2027_MB2334"
+ CDS 2562425..2563141
+ /locus_tag="BQ2027_MB2334"
+ /note="Mb2334, -, len: 238 aa. Equivalent to Rv2308, len:
+ 238 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 238 aa overlap). Conserved hypothetical
+ protein, sharing similarity with O53464|Rv2018|MTV018.05
+ from Mycobacterium tuberculosis (239 aa), FASTA scores:
+ opt: 142, E(): 0.034, (24.8% identity in 250 aa overlap).
+ As contains possible helix-turn-helix motif at aa 16-37
+ (Sequence: YVYAEVDKLIGLPAGTAKRWIN) (Score 1169, +3.17 SD),
+ may be a transcriptional regulator. Mb2334 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00946.1"
+ /db_xref="GOA:A0A1R3Y108"
+ /db_xref="InterPro:IPR007367"
+ /db_xref="InterPro:IPR009057"
+ /db_xref="InterPro:IPR017277"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y108"
+ /translation="MRADMSVTSMLDREVYVYAEVDKLIGLPAGTAKRWINGYERGVK
+ DHPPILRVTPGATPWVTWGEFVETRMLAEYRDRRKVPIVRQRAAIEELRARFNLRYPL
+ AHLRPFLSTHERDLTMGGEEIGLPDAEVTIRTGQALLGDARWLASIATPGRDEVGEAV
+ IVELPVDKAFPEIVINPSRYSGQPTFVGRRVSPVTIAQMVDGGEEREDLAADYGLSLK
+ QIQDAIDYTKKYRLARLVAA"
+ gene complement(2563770..2563843)
+ /locus_tag="BQ2027_METV"
+ tRNA complement(2563770..2563843)
+ /locus_tag="BQ2027_METV"
+ /product="tRNA-Met"
+ /note="metV, len: 74 nt. Equivalent to metV, len: 74 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 74 nt overlap). tRNA-Met, anticodon cat."
+ gene complement(2563849..2564304)
+ /locus_tag="BQ2027_MB2335C"
+ CDS complement(2563849..2564304)
+ /locus_tag="BQ2027_MB2335C"
+ /note="Mb2335c, -, len: 151 aa. Equivalent to Rv2309c,
+ len: 151 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 151 aa overlap). Possible integrase
+ (fragment), similar to others e.g. Q48908 INTEGRASE
+ (FRAGMENT) from Mycobacterium paratuberculos (191 aa),
+ FASTA scores: opt: 279, E(): 3.2e-11, (40.4% identity in
+ 136 aa overlap); etc. Also similar to others from
+ Mycobacterium tuberculosis e.g. Rv1055|MTV017.08 INTEGRASE
+ (FRAGMENT) (78 aa) (72.85% identity in 70 aa overlap); and
+ Rv1054|MTV017.07 INTEGRASE (FRAGMENT). COULD BELONG TO THE
+ 'PHAGE' INTEGRASE FAMILY. Mb2335c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE INTEGRASE (FRAGMENT)"
+ /protein_id="SIU00947.1"
+ /db_xref="GOA:A0A1R3Y177"
+ /db_xref="InterPro:IPR002104"
+ /db_xref="InterPro:IPR011010"
+ /db_xref="InterPro:IPR013762"
+ /db_xref="InterPro:IPR014417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y177"
+ /translation="MTGAGIVETTTNRVRHVPVPEPVSERLRDELPTEPNALVFPSYR
+ GGHLPIEEYRRAFDKGCKAVGIADLVPHGLRHTTASLAISAGANVKVVQRLLGHATAA
+ MTLDRHGHLLSDDLAGVAGLLVQAIKSAAASLRYSDPDSVAVENISAAS"
+ gene 2565051..2565338
+ /locus_tag="BQ2027_MB2336"
+ CDS 2565051..2565338
+ /locus_tag="BQ2027_MB2336"
+ /note="Mb2336, -, len: 95 aa. Equivalent to Rv2309A, len:
+ 95 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.9% identity in 95 aa overlap). Hypothetical unknown
+ protein. Equivalent to AAK46663 from Mycobacterium
+ tuberculosis strain CDC1551 (95 aa) but longer 13 aa."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00948.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0R5"
+ /translation="MATSSDDITINRHPPLNCAVNRHDESRRSPLRRGLLANGLRERQ
+ AGALFERYKSQFDSFGYIEKVRYRGSGYRVEDVYARADSGPSAGAELPVGP"
+ gene 2565441..2565785
+ /locus_tag="BQ2027_MB2337"
+ CDS 2565441..2565785
+ /locus_tag="BQ2027_MB2337"
+ /note="Mb2337, -, len: 114 aa. Equivalent to Rv2310, len:
+ 114 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 114 aa overlap). Possible excisionase,
+ showing some similarity to others e.g. Q9LCU5 PUTATIVE
+ EXCISIONASE from Arthrobacter sp. TM1 (174 aa) FASTA
+ scores: opt: 341, E(): 6.6e-15, (48.2% identity in 110 aa
+ overlap); O85865 PUTATIVE EXCISIONASE from Sphingomonas
+ aromaticivorans (152 aa), FASTA scores: opt: 205, E():
+ 2.2e-06, (41.25% identity in 80 aa overlap); etc. Also
+ similar to Rv3750c|O69717 HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis (130 aa), FASTA scores: opt:
+ 228, E(): 6.9e-08, (43.9% identity in 82 aa overlap).
+ Contains possible helix-turn-helix motif at aa 20-41
+ (Score 2181, +6.62 SD)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE EXCISIONASE"
+ /protein_id="SIU00949.1"
+ /db_xref="GOA:P64988"
+ /db_xref="InterPro:IPR009061"
+ /db_xref="InterPro:IPR010093"
+ /db_xref="InterPro:IPR041657"
+ /db_xref="UniProtKB/Swiss-Prot:P64988"
+ /translation="MVAALHAGKAVTIAPQSMTLTTQQAADLLGVSRPTVVRLIKSGE
+ LAAERIGNRHRLVLDDVLAYREARRQRQYDALAESAMDIDADEDPEVICEQLREARRV
+ VAARRRTERRRA"
+ gene 2565890..2566414
+ /locus_tag="BQ2027_MB2338"
+ CDS 2565890..2566414
+ /locus_tag="BQ2027_MB2338"
+ /note="Mb2338, -, len: 174 aa. Equivalent to Rv2311, len:
+ 174 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 174 aa overlap). Conserved
+ hypothetical protein, with similarity (in part) to
+ transfer proteins homologous TRAA e.g. Q9EUN8|TRAA
+ TRANSFER PROTEIN HOMOLOG TRAA from Corynebacterium
+ glutamicum (1160 aa), FASTA scores: opt: 221, E():
+ 2.9e-07, (36.8% identity in 136 aa overlap); Q9ETQ3|TRAA
+ CONJUGAL TRANSFER PROTEIN (TRAA-LIKE PROTEIN) from
+ Corynebacterium equii (1367 aa), FASTA scores: opt: 188,
+ E(): 5.5e-05, (33% identity in 106 aa overlap);
+ P55418|TRAA_RHISN|Y4DS PROBABLE CONJUGAL TRANSFER PROTEIN
+ from Rhizobium sp. strain NGR234 (1102 aa), FASTA scores:
+ opt: 145, E(): 0.035, (29.08% identity in 141 aa overlap);
+ etc."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00950.1"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P64990"
+ /translation="MAPTGQAVDVAVREGAGDVGYSVERENLPADDPVRNGNRWRVIA
+ VDTEHHRIAARRLGDGARAAFSGDYLHEHITHGYAITVHASQGTTAHSTHAVLGDNTS
+ RATLYVAMTPARESNTAYLCERTAGEGARVDLAGWDLWVSGKAEAMSDEKSASPVWCR
+ VGARCDHRGKRSCW"
+ gene 2566492..2566761
+ /locus_tag="BQ2027_MB2339"
+ CDS 2566492..2566761
+ /locus_tag="BQ2027_MB2339"
+ /note="Mb2339, -, len: 89 aa. Equivalent to Rv2312, len:
+ 89 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 89 aa overlap). Hypothetical unknown
+ protein. Mb2339 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00951.1"
+ /db_xref="UniProtKB/Swiss-Prot:P64992"
+ /translation="MMKEIELHLVDAAAPSGEIAIKDLAALATALQELTTRISRDPIN
+ TPGPGRTKQFMEELSQLASAPGPDIDGGIDLTDDEFQAFLQAARS"
+ gene complement(2567058..2567912)
+ /locus_tag="BQ2027_MB2340C"
+ CDS complement(2567058..2567912)
+ /locus_tag="BQ2027_MB2340C"
+ /note="Mb2340c, -, len: 284 aa. Equivalent to Rv2313c,
+ len: 284 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 284 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb2340c detected using SWATH
+ mass spectrometry. Mb2340c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00952.1"
+ /db_xref="InterPro:IPR029032"
+ /db_xref="UniProtKB/Swiss-Prot:P64994"
+ /translation="MPAPVSVRDDLCRLVALSPGDGRIAGLVRQVCARALSLPSLPCE
+ VAVNEPESPAEAVVAEFAEQFSVDVSAITGEQRSLLWTHLGEDAFGAVVAMYIADFVP
+ RVRAGLEALGVGKEYLGWVTGPISWDHNTDLSAAVFNGFLPAVARMRALDPVTSELVR
+ LRGAAQHNCRVCKSLREVSALDAGGSETLYGEIERFDTSVLLDVRAKAALRYADALIW
+ TPAHLAVDVAVEVRSRFSDDEAVELTFDIMRNASNKVAVSLGADAPRVQQGTERYRIG
+ LDGQTVFG"
+ gene complement(2567923..2569296)
+ /locus_tag="BQ2027_MB2341C"
+ CDS complement(2567923..2569296)
+ /locus_tag="BQ2027_MB2341C"
+ /note="Mb2341c, -, len: 457 aa. Equivalent to Rv2314c,
+ len: 457 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 457 aa overlap). Conserved
+ hypothetical protein, highly similar to Q9RJ51|SCI8.02
+ HYPOTHETICAL PROTEIN from Streptomyces coelicolor (464 aa)
+ FASTA scores: opt: 1485, E(): 5.2e-83, (53.5% identity in
+ 454 aa overlap); similar to AAK24788|CC2824 TldD/PmbA
+ family protein from Caulobacter crescentus (441 aa), FASTA
+ scores: opt: 364, E(): 8.3e-15, (29.8% identity in 460 aa
+ overlap); and showing similarity with Q9HJZ6|TA0814
+ HYPOTHETICAL PROTEIN from Thermoplasma acidophilum (430
+ aa), FASTA scores: opt: 220, E(): 4.7e-06, (21.85%
+ identity in 348 aa overlap). Protein product from Mb2341c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2341c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="TldE/PmbA family protein, Actinobacterial
+ subgroup"
+ /protein_id="SIU00953.1"
+ /db_xref="GOA:A0A1R3Y0T7"
+ /db_xref="InterPro:IPR002510"
+ /db_xref="InterPro:IPR036059"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0T7"
+ /translation="MIEPQHAVNIVLKEAARSGRADETMVLVTEKVEATLRWAGNSMT
+ TNGVSHSRNVTVISIVRRGDSAFVGSVVSAEVDPSVLPGLVVSSQDAARSAPEAGDAA
+ PLLADTGEPDDWDAPVPGTGAGVFTGIAGSLSRGFRGADRLYGYAHRSVSTTFLASST
+ GLRRRYTQPTGAIEINAKRGDASAWVGIGTPDFVEVPIDLMLERLSTRLRWAQRTVEL
+ PAGRYQTIMPPSTVADMMIYLGWSMAGRGAQEGRTAFSAPGGGTRVGERLTELPLTLF
+ TDPAAPGLACTPFVAVSNSSETQSVFDNGMEISQVDWIRSGVINALAYPRATAAKFDA
+ PVAVAADNLIMTGGSADLADMIAGTERGLLLTTLWYIREVDPTTLLLTGLTRDGVYLV
+ EDGEVSAAVNNFRFNESPLDLLRRATEAGVSEPTLPREWSDWVTRTAMPPLRIPDFHM
+ SSVSQAQ"
+ gene complement(2569293..2570810)
+ /locus_tag="BQ2027_MB2342C"
+ CDS complement(2569293..2570810)
+ /locus_tag="BQ2027_MB2342C"
+ /note="Mb2342c, -, len: 515 aa. Equivalent to Rv2315c,
+ len: 515 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 505 aa overlap). Conserved
+ hypothetical protein, highly similar to Q9S273|SCI28.10
+ HYPOTHETICAL 47.1 KDA PROTEIN from Streptomyces coelicolor
+ (435 aa), FASTA scores: opt: 1768, E():5.6e-101, (63.2%
+ identity in 432 overlap); and similar to others e.g.
+ AAK24787|CC2823 hypothetical protein (TldD/PmbA family)
+ from Caulobacter crescentus (543 aa), FASTA scores: opt:
+ 876, E():3.1e-46, (42.8% identity in 505 overlap);
+ O58578|PH0848 HYPOTHETICAL 54.4 KDA PROTEIN from
+ Pyrococcus horikoshii (481 aa), FASTA scores: opt: 661,
+ E(): 4.3e-33, (29.95% identity in 484 aa overlap);
+ Q9UZ95|PAB1547 HYPOTHETICAL 53.6 KDA PROTEIN from
+ Pyrococcus abyssi (473 aa), FASTA scores: opt: 656, E():
+ 8.6e-33, (29.1% identity in 481 aa overlap); etc. Protein
+ product from Mb2342c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2342c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="TldD family protein, Actinobacterial subgroup"
+ /protein_id="SIU00954.1"
+ /db_xref="GOA:A0A1R3Y309"
+ /db_xref="InterPro:IPR002510"
+ /db_xref="InterPro:IPR035068"
+ /db_xref="InterPro:IPR036059"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y309"
+ /translation="MTPNRGIDEDFLDLPRQQLADAALSAAATAGASHADLRVHRIST
+ EIIQLRDGELETAVISRELGLAVRVIVAGTWGFASHAELAPDVAAATARHAVHVATVL
+ AALNTERVRLAPEPVYTDAEWVSNYRIDPFGVPASEKIAVLRDYSGRLLDADGIDHVS
+ ASLNAVKEQTFYADTFGSSITQQRVRLLPCLDAVAVDSAAGNFESMRTLAPPTARGWE
+ VVAGDEIWNWTDELAQLPSLLAEKVRAPSVMPGPTDLVIDPTNLWLTIHESIGHATEY
+ DRAIGYEAAYAGTSFATPDKLGTLRYGSPVMNVTADRTAEFGLATVGYDDEGVAAQSW
+ DLVRDGVFVGYQLDRAFAPRLGEPRSNGCSYADSPHHVPIQRMANISLQPGIEDLSTA
+ DLIGRVDDGIYIVGDKSWSIDMQRYNFQFTGQRFFRIRGGQLYGQLRDVAYQSSTTDF
+ WNAMEAVGGPSTWRMGGAINCGKAQPGQVAAVSHGCPSALFRGVNVLNTRTEGGR"
+ gene 2570844..2571716
+ /gene="uspA"
+ /locus_tag="BQ2027_MB2343"
+ CDS 2570844..2571716
+ /gene="uspA"
+ /locus_tag="BQ2027_MB2343"
+ /note="Mb2343, uspA, len: 290 aa. Equivalent to Rv2316,
+ len: 290 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 290 aa overlap). Probable uspA,
+ sugar-transport integral membrane protein ABC transporter
+ (see citation below), most similar to Q9CBN8|USPA|ML1768
+ SUGAR TRANSPORT INTEGRAL MEMBRANE PROTEIN from
+ Mycobacterium leprae (328 aa), FASTA scores: opt: 1593,
+ E(): 1.9e-93, (82.35% identity in 289 aa overlap); and
+ similar to O32940|ML1426|MLCB2052.28 POSSIBLE SUGAR
+ TRANSPORT PROTEIN (PROBABLE ABC-TRANSPORT PROTEIN, INNER
+ MEMBRANE COMPONENT) from Mycobacterium leprae (319 aa),
+ FASTA scores: opt: 600, E(): 9.2e-31, (34.25% identity in
+ 295 aa overlap). Also similar to other proteins involved
+ in transport e.g. Q9X860|SCE134.05c PUTATIVE BINDING
+ PROTEIN DEPENDENT TRANSPORT PROTEIN from Streptomyces
+ coelicolor (327 aa), FASTA scores: opt: 639, E(): 3.2e-33,
+ (40.45% identity in 272 aa overlap); Q9K6N9|BH3689 SUGAR
+ TRANSPORT SYSTEM (PERMEASE) from Bacillus halodurans (300
+ aa), FASTA scores: opt: 590, E(): 3.7e-30, (35.65%
+ identity in 289 aa overlap); etc."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUGAR-TRANSPORT INTEGRAL MEMBRANE
+ PROTEIN ABC TRANSPORTER USPA"
+ /protein_id="SIU00955.1"
+ /db_xref="GOA:A0A1R3Y1M8"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1M8"
+ /translation="MRDAPRRRTALAYALLAPSLVGVVAFLLLPILVVVWLSLHRWDL
+ LGPLRYVGLTNWRSVLTDSGFADSLVVTAVFVAIVVPAQTVLGLLAASLLARRLPGTG
+ LFRTLYVLPWICAPLAIAVMWRWILAPTDGAISTVLGHRIEWLTDPGLALPVVSAVVV
+ WTNVGYVSLFFLAGLMAIPQDIHNAARTDGASAWQRFWRITLPMLRPTMFFVLVTGII
+ SAAQVFDTVYALTGGGPQGSTDLVAHRIYAEAFGAAAIGRASVMAVVLFVILVGATVV
+ QHLYFRRRISYELT"
+ gene 2571703..2572527
+ /gene="uspB"
+ /locus_tag="BQ2027_MB2344"
+ CDS 2571703..2572527
+ /gene="uspB"
+ /locus_tag="BQ2027_MB2344"
+ /note="Mb2344, uspB, len: 274 aa. Equivalent to Rv2317,
+ len: 274 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 274 aa overlap). Probable uspB,
+ sugar-transport integral membrane protein ABC transporter
+ (see citation below), most similar to Q9CBN7|USPE|ML1769
+ SUGAR TRANSPORT INTEGRAL MEMBRANE PROTEIN from
+ Mycobacterium leprae (274 aa), FASTA scores: opt: 1522,
+ E(): 3.4e-89, (85.0% identity in 274 aa overlap); and
+ similar to O32941|ML1425|MLCB2052.29 PROBABLE
+ ABC-TRANSPORT PROTEIN, INNER MEMBRANE COMPONENT from
+ Mycobacterium leprae (283 aa), FASTA scores: opt: 630,
+ E(): 8.4e-33, (36.55% identity in 268 aa overlap). Also
+ similar to other integral membrane proteins e.g.
+ P73854|LACG|SLR1723 LACTOSE TRANSPORT SYSTEM PERMEASE
+ PROTEIN from Synechocystis sp. strain PCC 6803 (270 aa),
+ FASTA scores: opt: 605, E(): 3.1e-31, (36.0% identity in
+ 264 aa overlap); Q9F3B8|SC5F1.11 PUTATIVE SUGAR TRANSPORT
+ INTEGRAL MEMBRANE PROTEIN from Streptomyces coelicolor
+ (307 aa), FASTA scores: opt: 582, E(): 9.7e-30, (34.45%
+ identity in 264 aa overlap); etc. Also similar to
+ O53483|Rv2039c|MTV018.26c SUGAR TRANSPORT PROTEIN from
+ Mycobacterium tuberculosis (280 aa), FASTA scores: opt:
+ 630, E(): 8.3e-89, (37.7% identity in 268 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SUGAR-TRANSPORT INTEGRAL MEMBRANE
+ PROTEIN ABC TRANSPORTER USPB"
+ /protein_id="SIU00956.1"
+ /db_xref="GOA:A0A1R3Y122"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y122"
+ /translation="MSSPSRVSNTAVYAVLTIGAVITLSPFLLGLLTSFTSAHQFATG
+ TPLQLPRPPTLANYADIADAGFRRAAVVTALMTAVILLGQLTFSVLAAYAFARLQFRG
+ RDALFWVYVATLMVPGTVTVVPLYLMMAQLGLRNTFWALVLPFMFGSPYAIFLLREHF
+ RLIPDDLINAARLDGANTLDVIVHVVIPSSRPVLAALAMITVVSQWNNFMWPLVITSG
+ HKWRVLTVATADLQSRFNDQWTLVMAATTVAIVPLIALFVTFQRHIVASIVVSGLK"
+ gene 2572524..2573846
+ /gene="uspC"
+ /locus_tag="BQ2027_MB2345"
+ CDS 2572524..2573846
+ /gene="uspC"
+ /locus_tag="BQ2027_MB2345"
+ /note="Mb2345, uspC, len: 440 aa. Equivalent to Rv2318,
+ len: 440 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 440 aa overlap). Probable uspC,
+ sugar-binding lipoprotein component of sugar transport
+ system (see citation below), most similar to
+ Q9CBN6|USPC|ML1770 SUGAR TRANSPORT PERIPLASMIC BINDING
+ PROTEIN from Mycobacterium leprae (446 aa), FASTA scores:
+ opt: 2294, E(): 8.1e-135, (74.7% identity in 446 aa
+ overlap). Also similar to other substrate-binding proteins
+ e.g. Q9RK89|SCF1.15 PUTATIVE SUBSTRATE BINDING PROTEIN
+ (EXTRACELLULAR) (BINDING-PROTEIN-DEPENDENT TRANSPORT)
+ (FRAGMENT) from Streptomyces coelicolor (221 aa), FASTA
+ scores: opt: 377, E(): 3e-16, (32.25% identity in 217 aa
+ overlap); Q9K6N8|BH3690 SUGAR TRANSPORT SYSTEM
+ (SUGAR-BINDING PROTEIN) from Bacillus halodurans (420 aa),
+ FASTA scores: opt: 227, E(): 1e-06, (25.00% identity in
+ 452 aa overlap); etc. Also similar to
+ O53485|Rv2041c|MTV018.28C LIPOPROTEIN COMPONENT OF SUGAR
+ TRANSPORT SYSTEM from Mycobacterium tuberculosis (439 aa),
+ FASTA scores: opt: 246, E(): 7e-08, (26.75% identity in
+ 325 aa overlap). Contains a hydrophobic stretch (possible
+ signal peptide) at N-terminal end. Mb2345 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PERIPLASMIC SUGAR-BINDING LIPOPROTEIN
+ USPC"
+ /protein_id="SIU00957.1"
+ /db_xref="InterPro:IPR006059"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y187"
+ /translation="MTRPRQSTLVATALVLVAILLGVTAVLLGLSAEPRGGKIVVTVR
+ LWDEPIAAAYRQSFAAFTRSHPDIEVRTNLVAYSTYFETLRTDVAGGSADDIFWLSNA
+ YFAAYADSGRLMKIQTDAADWEPAVVDQFTRSGVLWGVPQLTDAGIAVFYNADLLAAA
+ GVDPTQVDNLRWSRGDDDTLRPMLARLTVDADGRTANTPGFDARRVRQWGYNAANDPQ
+ AIYLNYIGSAGGVFQRDGKFAFDNPGAIEAFRYLVGLINDDHVAPPASDTNDNGDFSR
+ NQFLAGKMALFQSGTYSLAPVARDALFHWGVAMLPAGPAGRVSVTNGIAAAGNSASKH
+ PDAVRQVLAWMGSTEGNSYVGRHGAAIPAVLSAQPVYFDYWSARGVDVTPFFAVLNGP
+ RIAAPGGAGFAAGQQALEPYFDEMFLGRGDVTTTLRQAQAAANAATQR"
+ gene complement(2573854..2574732)
+ /locus_tag="BQ2027_MB2346C"
+ CDS complement(2573854..2574732)
+ /locus_tag="BQ2027_MB2346C"
+ /note="Mb2346c, -, len: 292 aa. Equivalent to Rv2319c,
+ len: 292 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 292 aa overlap). Hypothetical unknown
+ protein. Mb2346c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="universal stress protein family protein"
+ /protein_id="SIU00958.1"
+ /db_xref="InterPro:IPR006015"
+ /db_xref="InterPro:IPR006016"
+ /db_xref="UniProtKB/Swiss-Prot:P64996"
+ /translation="MTIVVGYLAGKVGPSALHLAVRVARMHKTSLTVATIVRRHWPTP
+ SLARVDAEYELWSEQLAAASAREAQRYLRRLADGIEVSYHHRAHRSVSAGLLDVVEEL
+ EAEVLVLGSFPSGRRARVLIGSTADRLLHSSPVPVAITPRRYRCYTDRLTRLSCGYSA
+ TSGSVDVVRRCGHLASRYGVPMRVITFAVRGRTMYPPEVGLHAEASVLEAWAAQAREL
+ LEKLRINGVVSEDVVLQVVTGNGWAQALDAADWQDGEILALGTSPFGDVARVFLGSWS
+ GKIIRYSPVPVLVLPG"
+ gene complement(2574729..2576159)
+ /gene="rocE"
+ /locus_tag="BQ2027_MB2347C"
+ CDS complement(2574729..2576159)
+ /gene="rocE"
+ /locus_tag="BQ2027_MB2347C"
+ /note="Mb2347c, rocE, len: 476 aa. Equivalent to Rv2320c,
+ len: 476 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 476 aa overlap). Probable rocE,
+ cationic amino acid (especially arginine and ornithine)
+ transporter (permease), highly similar to other amino acid
+ transporters e.g. Q9L100|SCL6.16C PUTATIVE AMINO ACID
+ TRANSPORTER from Streptomyces coelicolor (496 aa), FASTA
+ scores: opt: 1485, E(): 9.4e-82, (48.4% identity in 477 aa
+ overlap); O06479|YFNA PUTATIVE AMINO ACID TRANSPORTER from
+ Bacillus subtilis (462 aa), FASTA scores: opt: 1271, E():
+ 6.1e-69, (41.9% identity in 463 aa overlap); Q9PG94|XF0408
+ AMINO ACID TRANSPORTER from Xylella fastidiosa (509 aa),
+ FASTA scores: opt: 1128, E(): 2.5e-60, (39.5% identity in
+ 481 aa overlap); etc. Also some similarity with
+ Z99108.1|BSUB0005 from Bacillus subtilis (461 aa), FASTA
+ scores: opt: 1271, E(): 0, (41.9% identity in 463 aa
+ overlap); and G403170 ETHANOLAMINE PERMEASE (488 aa),
+ FASTA scores: opt: 468, E(): 1e-23, (28.1% identity in 462
+ aa overlap). SEEMS TO BELONG TO THE APC FAMILY. Mb2347c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CATIONIC AMINO ACID TRANSPORT INTEGRAL
+ MEMBRANE PROTEIN ROCE"
+ /protein_id="SIU00959.1"
+ /db_xref="GOA:A0A1R3Y0V6"
+ /db_xref="InterPro:IPR002293"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0V6"
+ /translation="MPTTSMSLRELMLRRRPVSGAPVASGASGNLKRSFGTFQLTMFG
+ VGATIGTGIFFVLAQAVPEAGPGVIVSFIIAGIAAGLAAICYAELASAVPISGSAYSY
+ AYTTLGEAVAMVVAACLLLEYGVATAAVAVGWSGYVNKLLSNLFGFQMPHVLSAAPWD
+ THPGWVNLPAVILIGLCALLLIRGASESARVNAIMVLIKLGVLGMFMIIAFSAYSADH
+ LKDFVPFGVAGIGSAAGTIFFSYIGLDAVSTAGDEVKDPQKTMPRALIAALVVVTGVY
+ VLVALAALGTQPWQDFAEQETAGLAIILDNVTHGEWASTILAAGAVVSIFTVTLVTMY
+ GQTRILFAMGRDGLLPARFAKVNPRTMTPVHNTVIVAIFASTLAAFIPLDSLADMVSI
+ GTLTAFSVVAVGVIVLRVREPDLPRGFKVPGYPVTPVLSVLACGYILASLHWYTWLAF
+ SGWVAVAVIFYLMWGRHHSALNEEVP"
+ gene complement(2576160..2576705)
+ /gene="rocD2"
+ /locus_tag="BQ2027_MB2348C"
+ CDS complement(2576160..2576705)
+ /gene="rocD2"
+ /locus_tag="BQ2027_MB2348C"
+ /note="Mb2348c, rocD2, len: 181 aa. Equivalent to Rv2321c,
+ len: 181 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 181 aa overlap). Probable rocD2,
+ ornithine aminotransferase (EC: 2.6.1.13), highly similar
+ to C-terminal region of other ornithine aminotransferases,
+ e.g. Q9FC90|ROCD from Streptomyces coelicolor (407 aa),
+ FASTA scores: opt: 628, E(): 1.2e-32, (55.35% identity in
+ 168 aa overlap); P3802|OAT_BACSU|ROCD from Bacillus
+ subtilis (401 aa), FASTA scores: opt: 477, E(): 4.3e-23,
+ (42.1% identity in 178 aa overlap); BAB42057|ROCD|SA0818
+ from Staphylococcus aureus subsp. aureus N315 (396 aa),
+ FASTA scores: opt: 437, E(): 1.5e-20, (41.3% identity in
+ 170 aa overlap); etc. Contains PS00600 Aminotransferases
+ class-III pyridoxal-phosphate attachment site. BELONGS TO
+ CLASS-III OF PYRIDOXAL-PHOSPHATE-DEPENDENT
+ AMINOTRANSFERASES. Rv2322c|MTCY3G12.12 (upstream ORF) and
+ Rv2321c|MTCY3G12.13 appear to be an ornithine
+ aminotransferase homologue but are frameshifted - we can
+ find no sequence error in the cosmid to account for this.
+ Mb2348c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ORNITHINE AMINOTRANSFERASE (C-terminus
+ part) ROCD2 (ORNITHINE--OXO-ACID AMINOTRANSFERASE)"
+ /protein_id="SIU00960.1"
+ /db_xref="GOA:A0A1R3Y0W4"
+ /db_xref="InterPro:IPR005814"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="InterPro:IPR034757"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0W4"
+ /translation="MIADEIQSGLACTGYPFACDHGGVLPDIYLLGKTLGGGAVPLSA
+ MVADREIFGVVHPGEHGSTFGGNPLAAAIGTPVVSMVVWGECQARSAKLGAHLHQRLA
+ DLIGDGAVALRGLGWWADVDIERALAIGTDMSMRLADRGVLLKDTYGAALRFAPPLVI
+ TAQEIDCAVRRFADALWEAGS"
+ gene complement(2576705..2577370)
+ /gene="rocD1"
+ /locus_tag="BQ2027_MB2349C"
+ CDS complement(2576705..2577370)
+ /gene="rocD1"
+ /locus_tag="BQ2027_MB2349C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2349c, rocD1, len: 221 aa. Equivalent to Rv2322c,
+ len: 221 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 221 aa overlap). Probable rocD1,
+ ornithine aminotransferase (EC: 2.6.1.13), highly similar
+ to N-terminal region of other ornithine aminotransferases,
+ e.g. Q9FC90|ROCD from Streptomyces coelicolor (407 aa),
+ FASTA scores: opt: 770, E(): 8.7e-40, (55.7% identity in
+ 201 aa overlap); BAB42057|ROCD|SA0818 from Staphylococcus
+ aureus subsp. aureus N315 (396 aa) FASTA scores: opt: 632,
+ E(): 2.2e-31, (46.1% identity in 208 aa overlap);
+ P38021|OAT_BACSU|ROCD from Bacillus subtilis (401 aa),
+ FASTA scores: opt: 626, E(): 5.1e-31, (43.1% identity in
+ 218 aa overlap); etc. BELONGS TO CLASS-III OF
+ PYRIDOXAL-PHOSPHATE-DEPENDENT AMINOTRANSFERASES.
+ Rv2322c|MTCY3G12.12 and Rv2321c|MTCY3G12.13 (upstream ORF)
+ appear to be an ornithine aminotransferase homologue but
+ are frameshifted - we can find no sequence error in the
+ cosmid to account for this. Mb2349c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE ORNITHINE AMINOTRANSFERASE (N-terminus
+ part) ROCD1 (ORNITHINE--OXO-ACID AMINOTRANSFERASE)"
+ /protein_id="SIU00961.1"
+ /db_xref="GOA:A0A1R3Y0W6"
+ /db_xref="InterPro:IPR005814"
+ /db_xref="InterPro:IPR015421"
+ /db_xref="InterPro:IPR015422"
+ /db_xref="InterPro:IPR015424"
+ /db_xref="InterPro:IPR034757"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0W6"
+ /translation="MTNLADATQATMALVERHAAHNYSPLPVVAASAEGAWIADIDGL
+ RYLDWLAAYSAVNLGHRNPASTATAHAQVDTVTLLNRALHADRLGPLGAALAQLCGKD
+ VVLPMNSDAEAVESGLRVARKWGADVNGLPAGRHDIILANNNFHGHTSSVVSFSSDPA
+ AGSGVEPSTPGLRSVPFGDAAAPAQTIDDNTVADLLEPIPGQAGIIVPADDYLPAASS
+ TTC"
+ gene complement(2577367..2578275)
+ /locus_tag="BQ2027_MB2350C"
+ CDS complement(2577367..2578275)
+ /locus_tag="BQ2027_MB2350C"
+ /EC_number="3.5.3.18"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2350c, -, len: 302 aa. Equivalent to Rv2323c,
+ len: 302 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 302 aa overlap). Conserved hypothetical
+ protein, highly similar to others eg Q9FC91|2SCG58.22
+ CONSERVED HYPOTHETICAL PROTEIN from Streptomyces
+ coelicolor (288 aa), FASTA scores: opt: 561, E(): 7.3e-28,
+ (46.95% identity in 279 aa overlap); P74535|SLL1336
+ HYPOTHETICAL 78.3 KDA PROTEIN from Synechocystis sp. (705
+ aa), FASTA scores: opt: 555, E(): 2.1e-27, (37.75%
+ identity in 265 aa overlap); etc. Also similar to various
+ hydrolases e.g. Q53797 BETA-HYDROXYLASE
+ (BLEOMYCIN/PHLEOMYCIN BINDING PROTEIN, ANKYRIN HOMOLOGUE,
+ BLEOMYCIN AND TRANSPORT PROTEIN) from Streptomyces
+ verticillus (326 aa), FASTA scores: opt: 211, E():
+ 4.5e-06, (26.75% identity in 303 aa overlap);
+ Q9X7M4|DDAH_STRCO|SC5F2A.01c NG,NG-dimethylarginine
+ dimethylaminohydrolase (EC 3.5.3.18) (Dimethylargininase)
+ (Dimethylarginine dimethylaminohydrolase) (258 aa), FASTA
+ scores: opt: 209, E(): 4.9e-06, (27.15% identity in 243 aa
+ overlap); G434715 beta-hydroxylase (bleomicin/phleomycin
+ binding protein) from Streptomyces verticillus (326 aa),
+ FASTA scores: opt: 211, E(): 4.5e-06, (26.75% identity in
+ 303 aa overlap); etc. Mb2350c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="NG,NG-dimethylarginine dimethylaminohydrolase 1
+ (EC"
+ /protein_id="SIU00962.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0X5"
+ /translation="MENTQRPSFDCEIRAKYRWFMTDSYVAAARLGSPARRTPRTRRY
+ AMTPPAFFAVAYAINPWMDVTAPVDVQVAQAQWEHLHQTYLRLGHSVDLIEPISGLPD
+ MVYTANGGFITHDIAVVARFRFPERAGESRAYASWMSSVGYRPVTTRHVNEGQGDLLM
+ VGERVLAGYGFRTDQRAHAEIAAVLGLPVVSLELVDPRFYHLDTALAVLDDHTIAYYP
+ PAFSTAAQEQLSALFPDAIVVGSADAFVFGLNAVSDGLNVVLPVAAMGFAAQLRAAGF
+ EPVGVDLSELLKGGGSVKCCTLEIHP"
+ gene 2578340..2578786
+ /locus_tag="BQ2027_MB2351"
+ CDS 2578340..2578786
+ /locus_tag="BQ2027_MB2351"
+ /note="Mb2351, -, len: 148 aa. Equivalent to Rv2324, len:
+ 148 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 148 aa overlap). Probable
+ transcriptional regulatory protein, asnC-family, similar
+ to other PUTATIVE ASNC-FAMILY REGULATORY PROTEINS e.g.
+ Q9L101|SCL6.15C from Streptomyces coelicolor (150 aa)
+ FASTA scores: opt: 466, E(): 2.4e-24, (52.8% identity in
+ 142 aa overlap); Q9RKY4|SC6D7.14 PUTATIVE ASNC-FAMILY
+ TRANSCRIPTIONAL REGULATORY PROTEIN from Streptomyces
+ coelicolor (165 aa), FASTA scores: opt: 266, E(): 5.5e-11,
+ (32.4% identity in 145 aa overlap); Q9ZEP1|LRPA|SCE94.12c
+ PUTATIVE TRANSCRIPTIONAL REGULATOR from Streptomyces
+ coelicolor (150 aa), FASTA scores: opt: 249, E(): 6.9e-10,
+ (33.35% identity in 147 aa overlap); etc. Also similar to
+ P96896|Rv3291c|MTCY71.31c from Mycobacterium tuberculosis
+ (150 aa), FASTA scores: opt: 261, E(): 1.1e-10, (36.4%
+ identity in 143 aa overlap). Mb2351 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSCRIPTIONAL REGULATORY PROTEIN
+ (PROBABLY ASNC-FAMILY)"
+ /protein_id="SIU00963.1"
+ /db_xref="GOA:A0A1R3Y0U9"
+ /db_xref="InterPro:IPR000485"
+ /db_xref="InterPro:IPR011008"
+ /db_xref="InterPro:IPR019887"
+ /db_xref="InterPro:IPR019888"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0U9"
+ /translation="MDRLDDTDERILAELAEHARATFAEIGHKVSLSAPAVKRRVDRM
+ LESGVIKGFTTVVDRNALGWNTEAYVQIFCHGRIAPDQLRAAWVNIPEVVSAATVTGT
+ SDAILHVLAHDMRHLEAALERIRSSADVERSESTVVLSNLIDRMPP"
+ gene complement(2579015..2579863)
+ /locus_tag="BQ2027_MB2352C"
+ CDS complement(2579015..2579863)
+ /locus_tag="BQ2027_MB2352C"
+ /note="Mb2352c, -, len: 282 aa. Equivalent to Rv2325c,
+ len: 282 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 282 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ O32970|MLCB22.37c|ML0849 hypothetical protein from
+ Mycobacterium leprae (283 aa), FASTA scores: opt: 1405,
+ E(): 1.8e-78, (77.7% identity in 282 aa overlap). Also
+ some similarity to other proteins e.g. Q9Z9J1|YBAF|BH0166
+ YBAF PROTEIN (BH0166 PROTEIN) (HYPOTHETICAL PROTEIN) from
+ Bacillus halodurans (265 aa), FASTA scores: opt: 288, E():
+ 2.8e-10, (25.8% identity in 264 aa overlap); P70972|YBAF
+ YBAF PROTEIN (HYPOTHETICAL PROTEIN) from Bacillus subtilis
+ (265 aa), FASTA scores: opt: 259, E(): 1.5e-08, (25.45%
+ identity in 224 aa overlap); AAK34821|SPY2193|Q99X13
+ Conserved hypothetical protein from Streptococcus pyogenes
+ (266 aa), FASTA scores: opt: 232, E(): 6.5e-07, (25.1%
+ identity in 267 aa overlap); etc. Protein product from
+ Mb2352c detected using SWATH mass spectrometry. Mb2352c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Transmembrane component of energizing module of
+ ECF transporters in Mycobacteria"
+ /protein_id="SIU00964.1"
+ /db_xref="GOA:P64998"
+ /db_xref="InterPro:IPR003339"
+ /db_xref="UniProtKB/Swiss-Prot:P64998"
+ /translation="MTTTSAPARNGTRRPSRPIVLLIPVPGSSVIHDLWAGTKLLVVF
+ GISVLLTFYPGWVTIGMMAALVLAAARIAHIPRGALPSVPRWLWIVLAIGFLTAALAG
+ GTPVVAVGGVQLGLGGALHFLRITALSVVLLALGAMVSWTTNVAEISPAVATLGRPFR
+ VLRIPVDEWAVALALALRAFPMLIDEFQVLYAARRLRPKRMPPSRKARRQRHARELID
+ LLAAAITVTLRRADEMGDAITARGGTGQLSAHPGRPKLADWVTLAITAMASGTAVAIE
+ SLILHS"
+ gene complement(2579860..2581953)
+ /locus_tag="BQ2027_MB2353C"
+ CDS complement(2579860..2581953)
+ /locus_tag="BQ2027_MB2353C"
+ /note="Mb2353c, -, len: 697 aa. Equivalent to Rv2326c,
+ len: 697 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 697 aa overlap). Putative
+ transmembrane ATP-binding protein ABC transporter (see
+ citation below). Equivalent to Q9CCF9|ML0848 ABC
+ TRANSPORTER from Mycobacterium leprae (724 aa), FASTA
+ scores: opt: 3482, E(): 2.8e-182, (76.9% identity in 697
+ aa overlap) and also to O32971|MLCB22.38c ABC-TYPE
+ TRANSPORTER from Mycobacterium leprae (726 aa), FASTA
+ scores: opt: 3482, E(): 2.8e-182, (76.9% identity in 697
+ aa overlap). Similar in part to other ABC TRANSPORTERS
+ e.g. Q9WY65|TM0222 from Thermotoga maritima (266 aa),
+ FASTA scores: opt: 407, E(): 4.2e-15, (38.0% identity in
+ 213 aa overlap); etc. Contains 2 X PS00017 ATP/GTP-binding
+ site motif A (P-loop); and 2 x PS00211 ABC transporters
+ family signature. BELONGS TO THE ATP-BINDING TRANSPORT
+ PROTEIN FAMILY (ABC TRANSPORTERS). Protein product from
+ Mb2353c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2353c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible transmembrane atp-binding protein abc
+ transporter"
+ /protein_id="SIU00965.1"
+ /db_xref="GOA:P63400"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P63400"
+ /translation="MCCAVCGPEPGRIGEVTPLGPCPAQHRGGPLRPSELAQASVMAA
+ LCAVTAIISVVVPFAAGLALLGTVPTGLLAYRYRLRVLAAATVAAGMIAFLIAGLGGF
+ MGVVHSAYIGGLTGIVKRRGRGTPTVVVSSLIGGFVFGAAMVGMLAAMVRLRHLIFKV
+ MTANVDGIAATLARMHMQGAAADVKRYFAEGLQYWPWVLLGYFNIGIMIVSLIGWWAL
+ SRLLERMRGIPDVHKLDPPPGDDVDALIGPVPVRLDKVRFRYPRAGQDALREVSLDVR
+ AGEHLAIIGANGSGKTTLMLILAGRAPTSGTVDRPGTVGLGKLGGTAVVLQHPESQVL
+ GTRVADDVVWGLPLGTTADVGRLLSEVGLEALAERDTGSLSGGELQRLALAAALAREP
+ AMLIADEVTTMVDQQGRDALLAVLSGLTQRHRTALVHITHYDNEADSADRTLSLSDSP
+ DNTDMVHTAAMPAPVIGVDQPQHAPALELVGVGHEYASGTPWAKTALRDINFVVEQGD
+ GVLIHGGNGSGKSTLAWIMAGLTIPTTGACLLDGRPTHEQVGAVALSFQAARLQLMRS
+ RVDLEVASAAGFSASEQDRVAAALTVVGLDPALGARRIDQLSGGQMRRVVLAGLLARA
+ PRALILDEPLAGLDAASQRGLLRLLEDLRRARGLTVVVVSHDFAGMEELCPRTLHLRD
+ GVLESAAASEAGGMS"
+ gene 2581994..2582485
+ /locus_tag="BQ2027_MB2354"
+ CDS 2581994..2582485
+ /locus_tag="BQ2027_MB2354"
+ /note="Mb2354, -, len: 163 aa. Equivalent to Rv2327, len:
+ 163 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 163 aa overlap). Conserved
+ hypothetical protein, similar to
+ Z80775|MTCY21D4.05c|Rv0042c from Mycobacterium
+ tuberculosis (208 aa), FASTA scores: opt: 242, E(): 5e-08,
+ (43.0% identity in 107 aa overlap). Also slight similarity
+ to putative transcriptional regulatory proteins belonging
+ to the MARR-FAMILY e.g. Q9CCY2/ML2696 from Mycobacterium
+ leprae (243 aa), FASTA scores: opt: 245, E(): 3.7e-08,
+ (35.35% identity in 150 aa overlap); Q9L135|SC6D11.20 from
+ Streptomyces coelicolor (155 aa), FASTA scores: opt: 242,
+ E(): 3.9e-08, (34.75% identity in 141 aa overlap); etc.
+ Protein product from Mb2354 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2354 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcriptional regulator Rv2327, MarR family"
+ /protein_id="SIU00966.1"
+ /db_xref="GOA:A0A1R3Y131"
+ /db_xref="InterPro:IPR000835"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y131"
+ /translation="MSPSPAAANRSEVGGPLPGLGADLLAVVARLNRLATQRIQMPLP
+ AAQARLLATIEAQGEARIGDLAAVDHCSQPTMTTQVRRLEDAGLVTRTADPGDARAVR
+ IRITPEGIRTLTAVRADRAAAIEPQLALLPPADRRVLADAVDVLRRLLDHAATTPGRA
+ TRQ"
+ gene 2582737..2583885
+ /gene="PE23"
+ /locus_tag="BQ2027_MB2355"
+ CDS 2582737..2583885
+ /gene="PE23"
+ /locus_tag="BQ2027_MB2355"
+ /note="Mb2355, PE23, len: 382 aa. Equivalent to Rv2328,
+ len: 382 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 382 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family, similar to others
+ e.g. Q9L8K5|MAG24-1 PE-PGRS HOMOLOG from Mycobacterium
+ marinum (638 aa), FASTA scores: opt: 495, E(): 6.6e-18,
+ (34.65% identity in 401 aa overlap); etc. Mb2355 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe23"
+ /protein_id="SIU00967.1"
+ /db_xref="GOA:P0A685"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/Swiss-Prot:P0A685"
+ /translation="MQFLSVIPEQVESAAQDLAGIRSALSASYAAAAGPTTAVVSAAE
+ DEVSTAIASIFGAYGRQCQVLSAQASAFHDEFVNLLKTGATAYRNTEFANAQSNVLNA
+ VNAPARSLLGHPSAAESVQNSAPTLGGGHSTVTAGLAAQAGRAVATVEQQAAAAVAPL
+ PSAGAGLAQVVNGVVTAGQGSAAKLATALQSAAPWLAKSGGEFIVAGQSALTGVALLQ
+ PAVVGVVQAGGTFLTAGTSAATGLGLLTLAGVEFSQGVGNLALASGTAATGLGLLGSA
+ GVQLFSPAFLLAVPTALGGVGSLAIAVVQLVQGVQHLSLVVPNVVAGIAALQTAGAQF
+ AQGVNHTMLAAQLGAPGIAVLQTAGGHFAQGIGHLTTAGNAAVTVLIS"
+ gene complement(2583920..2585467)
+ /gene="narK1"
+ /locus_tag="BQ2027_MB2356C"
+ CDS complement(2583920..2585467)
+ /gene="narK1"
+ /locus_tag="BQ2027_MB2356C"
+ /note="Mb2356c, narK1, len: 515 aa. Equivalent to Rv2329c,
+ len: 515 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 515 aa overlap). Probable narK1,
+ nitrite extrusion protein, possibly member of major
+ facilitator superfamily (MFS). Equivalent to
+ O32974|MLCB22.41c|NARK|ML0844 PUTATIVE NITRITE EXTRUSION
+ PROTEIN from Mycobacterium leprae (517 aa), FASTA scores:
+ opt: 2224, E(): 1.9e-129, (69.3% identity in 488 aa
+ overlap). Also highly similar to others e.g. P94933
+ NITRITE EXTRUSION PROTEIN from Mycobacterium fortuitum
+ (471 aa), FASTA scores: opt: 1969, E(): 8.6e-114, (62.1%
+ identity in 459 aa overlap); P37758|NARU_ECOLI NITRITE
+ EXTRUSION PROTEIN 2 from Escherichia coli strain K12 (462
+ aa), FASTA scores: opt: 792, E(): 2.3e-41, (36.95%
+ identity in 476 aa overlap); P10903|NARK_ECOLI nitrite
+ extrusion protein (nitrite facilitator 1) from Escherichia
+ coli strain K12 (463 aa), FASTA scores: opt: 784, E():
+ 7e-41, (35.3% identity in 468 aa overlap); etc. Also
+ similar to RV0261c|Z86089|MTCY6A4_5 from Mycobacterium
+ tuberculosis (469 aa), FASTA scores: opt: 2000, E():
+ 1.1e-115, (62.6% identity in 470 aa overlap). BELONGS TO
+ THE NARK/NASA FAMILY OF TRANSPORTERS."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NITRITE EXTRUSION PROTEIN 1 NARK1
+ (NITRITE FACILITATOR 1)"
+ /protein_id="SIU00968.1"
+ /db_xref="GOA:A0A1R3Y0T4"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0T4"
+ /translation="MEQHTLLQREESPRSPAAPSLRRLGGSRHITHWDPEDLGAWEAG
+ NKGIARRNLLWSVVTVHLGYSVWTLWPVLELLMPQDVYGFSTSDKFLLGTIATLFGAF
+ LRMPYALASAIFGGRNWATFSAIVLLIPAIGTTVLLTHPGLPLWPYLVCAALTGLGGG
+ NFASSMSNANAFYPHRLKGSALGIAGGVGNLGVPAIQLVGLLAIATVGERKPYLVCAL
+ YVVLVAIAVIGVSLFMNNVEQHRVQVNRLRPIVSAVLSTRDTWLLSLLYLGTFGSFIG
+ FSFVFGQVLQTNFLACGQSPARATLHAVELAFVGPLLAAVARIYGGRLADRVGGSRLT
+ LIVFVAMTLAAGLLISASTLEGRHVGQHRGATMVGYFVCFVALFVLSGLGNGSVYKMI
+ PTIFEACSRSLDLSEAERRDWSRIISGVVIGFVAAFGALGGVGINMALRESYLSTGSG
+ TDAFWIFMMCYAAAAVLTWKVYDRRTVTDMGMLQAALVRQPASTPAELIGPRTQSDRF
+ SGCSISA"
+ gene complement(2585701..2586228)
+ /gene="lppP"
+ /locus_tag="BQ2027_MB2357C"
+ CDS complement(2585701..2586228)
+ /gene="lppP"
+ /locus_tag="BQ2027_MB2357C"
+ /note="Mb2357c, lppP, len: 175 aa. Equivalent to Rv2330c,
+ len: 175 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 175 aa overlap). Probable lppP,
+ lipoprotein. Contains signal sequence and appropriately
+ positioned PS00013 Prokaryotic membrane lipoprotein lipid
+ attachment site. Protein product from Mb2357c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE LIPOPROTEIN LPPP"
+ /protein_id="SIU00969.1"
+ /db_xref="GOA:P65303"
+ /db_xref="InterPro:IPR025971"
+ /db_xref="UniProtKB/Swiss-Prot:P65303"
+ /translation="MRRQRSAVPILALLALLALLALIVGLGASGCAWKPPTTRPSPPN
+ TCKDSDGPTADTVRQAIAAVPIVVPGSKWVEITRGHTRNCRLHWVQIIPTIASQSTPQ
+ QLLFFDRNIPLGSPTRNPKPYITVLPAGDDTVTVQYQWQIGSDQECCPTGIGTVRFHI
+ GSDGKLEALGSIPHQ"
+ gene 2586303..2586689
+ /locus_tag="BQ2027_MB2358"
+ CDS 2586303..2586689
+ /locus_tag="BQ2027_MB2358"
+ /EC_number="1.7.99.4"
+ /note="Mb2358, -, len: 128 aa. Equivalent to Rv2331, len:
+ 128 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 128 aa overlap). Hypothetical unknown
+ protein; shortened version of MTCY3G12.03c to eliminate
+ overlap with MTCY3G12.04. Mb2358 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Assimilatory nitrate reductase large subunit
+ (EC"
+ /protein_id="SIU00970.1"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5G4"
+ /translation="MPPVFLPQIGRLTPDAVGEAIGIAADDIPMAARWIGSRPCSLIG
+ QPNTMGDEMGYLGPGLAGQRCVDRLVMGASRSTCSRLPVIASVDERLSVLKPVRPRLH
+ SISFIFKGRPGEVYLTVTGYNFRGVP"
+ gene 2586746..2587084
+ /locus_tag="BQ2027_MB2359"
+ CDS 2586746..2587084
+ /locus_tag="BQ2027_MB2359"
+ /note="Mb2359, -, len: 112 aa. Equivalent to Rv2331A, len:
+ 112 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.1% identity in 112 aa overlap). Hypothetical unknown
+ protein. Mb2359 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00971.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0X3"
+ /translation="MKGHLATFGHPALPTYRGSWLSREPGSPYRLPAGAGRDRGDACR
+ RLPRRTGSGTLLRPGQRCTFAANADPMAKGVDRALCEIVAERRQLDLDLAKAQVRSAL
+ ANQRYHRDVH"
+ gene 2587114..2588760
+ /gene="mez"
+ /locus_tag="BQ2027_MB2360"
+ CDS 2587114..2588760
+ /gene="mez"
+ /locus_tag="BQ2027_MB2360"
+ /note="Mb2360, mez, len: 548 aa. Equivalent to Rv2332,
+ len: 548 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 548 aa overlap). Probable mez, malate
+ oxidoreductase [NAD] dependant (EC 1.1.1.38) (malic
+ enzyme), highly similar to others e.g. O34389|MALS
+ PUTATIVE MALOLACTIC ENZYME [INCLUDES: MALIC ENZYME (EC
+ 1.1.1.-); L-LACTATE DEHYDROGENASE (EC 1.1.1.27)] from
+ Bacillus subtilis (566 aa), FASTA scores: opt: 1927, E():
+ 5.5e-111, (52.9% identity in 539 aa overlap);
+ P45868|MAO2_BACSU|YWKA PROBABLE NAD-DEPENDENT MALIC ENZYME
+ from Bacillus subtilis (582 aa), FASTA scores: opt: 1849,
+ E(): 3.6e-106, (50.45% identity in 543 aa overlap);
+ Q48796|MLES_OENOE MALOLACTIC ENZYME from Oenococcus oeni
+ (541 aa), FASTA scores: opt: 1540, E(): 3.6e-87, (44.2%
+ identity in 536 aa overlap); etc. BELONGS TO THE MALIC
+ ENZYMES FAMILY. N-terminus shortened since first
+ submission (previously 652 aa). Protein product from
+ Mb2360 detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE [NAD] DEPENDENT MALATE OXIDOREDUCTASE
+ MEZ (MALIC ENZYME) (NAD-MALIC ENZYME) (MALATE
+ DEHYDROGENASE (OXALOACETATE DECARBOXYLATING))
+ (PYRUVIC-MALIC CARBOXYLASE) (NAD-ME)"
+ /protein_id="SIU00972.1"
+ /db_xref="GOA:A0A1R3Y0Y2"
+ /db_xref="InterPro:IPR001891"
+ /db_xref="InterPro:IPR012301"
+ /db_xref="InterPro:IPR012302"
+ /db_xref="InterPro:IPR015884"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="InterPro:IPR037062"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Y2"
+ /translation="MSDARVPRIPAALSAPSLNRGVGFTHAQRRRLGLTGRLPSAVLT
+ LDQQAERVWHQLQSLATDLGRNLLLEQLHYRHEVLYFKVLADHLPELMPVVYTPTVGE
+ AIQRFSDEYRGQRGLFLSIDEPDEIEEAFNTLGLGPEDVDLIVCTDAEAILGIGDWGV
+ GGIQIAVGKLALYTAGGGVDPRRCLAVSLDVGTDNEQLLADPFYLGNRHARRRGREYD
+ EFVSRYIETAQRLFPRAILHFEDFGPANARKILDTYGTDYCVFNDDMQGTGAVVLAAV
+ YSGLKVTGIPLRDQTIVVFGAGTAGMGIADQIRDAMVADGATLEQAVSQIWPLDRPGL
+ LFDDMDDLRDFQVPYAKNRHQLGVAVGDRVGLSDAIKIASPTILLGCSTVYGAFTKEV
+ VEAMTASCKHPMIFPLSNPTSRMEAIPADVLAWSNGRALLATGSPVAPVEFDETTYVI
+ GQANNVLAFPGIGLGVIVAGARLITRRMLHAAAKAIAHQANPTNPGDSLLPDVQNLRA
+ ISTTVAEAVYRAAVQDGVASRTHDDVRQAIVDTMWLPAYD"
+ gene complement(2588757..2590328)
+ /gene="stp"
+ /locus_tag="BQ2027_MB2361C"
+ CDS complement(2588757..2590328)
+ /gene="stp"
+ /locus_tag="BQ2027_MB2361C"
+ /note="Mb2361c, -, len: 523 aa. Equivalent to Rv2333c,
+ len: 537 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 508 aa overlap). Probable conserved
+ integral membrane transport protein, member of major
+ facilitator superfamily (MFS) possibly involved in
+ transport of drug, highly similar to many e.g.
+ Q9RL22|C5G9.04c PUTATIVE TRANSMEMBRANE EFFLUX PROTEIN from
+ Streptomyces coelicolor (489 aa), FASTA scores: opt: 1031,
+ E(): 4e-55, (37.4% identity in 412 aa overlap);
+ Q9L0L9|SCD82.12 PUTATIVE TRANSMEMBRANE EFFLUX PROTEIN from
+ Streptomyces coelicolor (490 aa), FASTA scores: opt: 883,
+ E(): 3.8e-46, (36.35% identity in 407 aa overlap);
+ Q9ZBW5|SC4B5.03c PUTATIVE INTEGRAL MEMBRANE EFFLUX PROTEIN
+ from Streptomyces coelicolor (504 aa), FASTA scores: opt:
+ 899, E(): 4.1e-47, (37.4% identity in 415 aa overlap);
+ P39886|TCMA_STRGA tetracenomycin C resistance and export
+ protein from Streptomyces glaucescens (538 aa), FASTA
+ scores: opt: 839, E(): 1.9e-43, (32.3% identity in 489 aa
+ overlap); etc. Also highly similar to
+ Rv2459|O53186|MTV008.15 PROBABLE CONSERVED INTEGRAL
+ MEMBRANE TRANSPORT PROTEIN from Mycobacterium tuberculosis
+ strain H37Rv (508 aa), FASTA scores: opt: 1385, E():
+ 1.5e-76, (44.05% identity in 504 aa overlap); and
+ AAK46834|MT2534 DRUG TRANSPORTER from Mycobacterium
+ tuberculosis strain CDC1551 (523 aa), FASTA scores: opt:
+ 1385, E(): 1.5e-76, (44.4% identity in 504 aa overlap).
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base insertion (*-g) leads to a slightly longer
+ product with a different COOH part compared to its homolog
+ in Mycobacterium tuberculosis strain H37Rv (523 aa versus
+ 537 aa). Mb2361c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="integral membrane drug efflux protein stp"
+ /protein_id="SIU00973.1"
+ /db_xref="GOA:A0A1R3Y0V9"
+ /db_xref="InterPro:IPR004638"
+ /db_xref="InterPro:IPR005829"
+ /db_xref="InterPro:IPR011701"
+ /db_xref="InterPro:IPR020846"
+ /db_xref="InterPro:IPR036259"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0V9"
+ /translation="MNRTQLLTLIATGLGLFMIFLDALIVNVALPDIQRSFAVGEDGL
+ QWVVASYSLGMAVFIMSAATLADLYGRRRWYLIGVSLFTLGSIACGLAPSIAVLTTAR
+ GAQGLGAAAVSVTSLALVSAAFPEAKEKARAIGIWTAIASIGTTTGPTLGGLLVDQWG
+ WRSIFYVNLPMGALVLFLTLCYVEESCNERARRFDLSGQLLFIVAVGALVYAVIEGPQ
+ IGWTSVQTIVMLWTAAVGCALFVWLERRSSNPMMDLTLFRDTSYALAIATICTVFFAV
+ YGMLLLTTQFLQNVRGYTPSVTGLMILPFSAAVAIVSPLVGHLVGRIGARVPILAGLC
+ MLMLGLLMLIFSEHRSSALVLVGLGLCGSGVALCLTPITTVAMTAVPAERAGMASGIM
+ SAQRAIGSTIGFAVLGSVLAAWLSATLEPHLERAVPDPVQRHVLAEIIIDSANPRAHV
+ GGIVPRRHIEHRDPVAIAEEDFIEGIRVALLVATATLAVVFLAGWRWFPRDVQTAGSD
+ AKREAAYSDDRRVRG"
+ gene 2590803..2591735
+ /gene="cysK1"
+ /locus_tag="BQ2027_MB2362"
+ CDS 2590803..2591735
+ /gene="cysK1"
+ /locus_tag="BQ2027_MB2362"
+ /note="Mb2362, cysK1, len: 310 aa. Equivalent to Rv2334,
+ len: 310 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 310 aa overlap). Probable cysK1,
+ cysteine synthase A (EC 4.2.99.8), equivalent to
+ O32978|CYSK_MYCLE|ML0839|MLCB22.47 CYSTEINE SYNTHASE A
+ from Mycobacterium leprae (310 aa), FASTA scores: opt:
+ 1756, E(): 8.6e-96, (85.8% identity in 310 aa overlap).
+ Also highly similar to other CYSTEINE SYNTHASES e.g.
+ Q9JQL6|CYSK|NMA0974|NMB0763 PUTATIVE CYSTEINE SYNTHASE
+ from Neisseria meningitidis (serogroup A and B) (310 aa),
+ FASTA scores: opt: 1368, E(): 4.6e-73, (66.45% identity in
+ 310 aa overlap); P73410|CYSK_SYNY3|SLR1842 from
+ Synechocystis sp (312 aa), FASTA scores: opt: 1310, E():
+ 1.2e-69, (64.65% identity in 311 aa overlap);
+ Q43725|CYSM_ARATH|OASC|ACS1|AT3G59760|F24G16.30 CYSTEINE
+ SYNTHASE (MITOCHONDRIAL PRECURSOR) from Arabidopsis
+ thaliana (Mouse-ear cress) (424 aa), FASTA scores: opt:
+ 1253, E(): 3.2e-66, (59.2% identity in 309 aa overlap)
+ (has its N-terminus longer 104 aa); etc. Contains PS00901
+ Cysteine synthase/cystathionine beta-synthase P-phosphate
+ attachment site. BELONGS TO THE CYSTEINE
+ SYNTHASE/CYSTATHIONINE BETA-SYNTHASE FAMILY. Note that
+ previously known as cysK. Protein product from Mb2362
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2362 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="cysteine synthase a cysk1 (o-acetylserine
+ sulfhydrylase a) (o-acetylserine (thiol)-lyase a) (csase
+ a)"
+ /protein_id="SIU00974.1"
+ /db_xref="GOA:P0A535"
+ /db_xref="InterPro:IPR001216"
+ /db_xref="InterPro:IPR001926"
+ /db_xref="InterPro:IPR005856"
+ /db_xref="InterPro:IPR005859"
+ /db_xref="InterPro:IPR036052"
+ /db_xref="UniProtKB/Swiss-Prot:P0A535"
+ /translation="MSIAEDITQLIGRTPLVRLRRVTDGAVADIVAKLEFFNPANSVK
+ DRIGVAMLQAAEQAGLIKPDTIILEPTSGNTGIALAMVCAARGYRCVLTMPETMSLER
+ RMLLRAYGAELILTPGADGMSGAIAKAEELAKTDQRYFVPQQFENPANPAIHRVTTAE
+ EVWRDTDGKVDIVVAGVGTGGTITGVAQVIKERKPSARFVAVEPAASPVLSGGQKGPH
+ PIQGIGAGFVPPVLDQDLVDEIITVGNEDALNVARRLAREEGLLVGISSGAATVAALQ
+ VARRPENAGKLIVVVLPDFGERYLSTPLFADVAD"
+ gene 2591739..2592428
+ /gene="cysE"
+ /locus_tag="BQ2027_MB2363"
+ CDS 2591739..2592428
+ /gene="cysE"
+ /locus_tag="BQ2027_MB2363"
+ /note="Mb2363, -, len: 229 aa. Equivalent to Rv2335, len:
+ 229 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 229 aa overlap). Probable cysE, serine
+ acetyltransferase (EC 2.3.1.30), equivalent to
+ O32979|CYSE|ML0838 SERINE ACETYLTRANSFERASE from
+ Mycobacterium leprae (227 aa), FASTA scores: opt: 1152,
+ E(): 9.6e-62, (76.4% identity in 229 aa overlap). Also
+ highly similar, except in C-terminal part, to others e.g.
+ Q9HXI6|CYSE|PA3816 O-ACETYLSERINE SYNTHASE from
+ Pseudomonas aeruginosa (258 aa), FASTA scores: opt: 737,
+ E(): 6e-37, (61.3% identity in 168 aa overlap);
+ P23145|NIFP_AZOCH PROBABLE SERINE ACETYLTRANSFERASE from
+ Azotobacter chroococcum mcd 1 (269 aa), FASTA scores: opt:
+ 718, E(): 8.4e-36, (55.45% identity in 220 aa overlap);
+ Q06750|CYSE_BACSU SERINE ACETYLTRANSFERASE from Bacillus
+ subtilis (217 aa), FASTA scores: opt: 640, E(): 3.1e-31,
+ (48.0% identity in 200 aa overlap); etc. Contains PS00101
+ Bacterial hexapeptide-repeat containing-transferases
+ signature. BELONGS TO THE CYSE/LACA/LPXA/NODL FAMILY OF
+ ACETYLTRANSFERASES. COMPOSED OF MULTIPLE REPEATS OF
+ [LIV]-G-X(4). Protein product from Mb2363 detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2363 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SERINE ACETYLTRANSFERASE CYSE (SAT)"
+ /protein_id="SIU00975.1"
+ /db_xref="GOA:A0A1R3Y1P8"
+ /db_xref="InterPro:IPR001451"
+ /db_xref="InterPro:IPR005881"
+ /db_xref="InterPro:IPR011004"
+ /db_xref="InterPro:IPR018357"
+ /db_xref="InterPro:IPR042122"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1P8"
+ /translation="MLTAMRGDIRAARERDPAAPTALEVIFCYPGVHAVWGHRLAHWL
+ WQRGARLLARAAAEFTRILTGVDIHPGAVIGARVFIDHATGVVIGETAEVGDDVTIYH
+ GVTLGGSGMVGGKRHPTVGDRVIIGAGAKVLGPIKIGEDSRIGANAVVVKPVPPSAVV
+ VGVPGQVIGQSQPSPGGPFDWRLPDLVGASLDSLLTRVARLEALGGGPQAAGVIRPPE
+ AGIWHGEDFSI"
+ gene 2592844..2593812
+ /locus_tag="BQ2027_MB2364"
+ CDS 2592844..2593812
+ /locus_tag="BQ2027_MB2364"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2364, -, len: 322 aa. Equivalent to Rv2336, len:
+ 322 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 322 aa overlap). Hypothetical unknown
+ protein (see second citation below). Protein product from
+ Mb2364 detected using SWATH mass spectrometry. Mb2364
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00976.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y142"
+ /translation="MDVPHEQPALSSSKSNRFTSQRQTTGVGTTTVERLEPRLSPASR
+ HITEAKAFGTECHVSSFTREQDPDRAVRVEQIHGEAYVAAGHVYESALDELGRLDNSN
+ AEFILDKARGSTRETEVIYLHAVPAEPLSGSQGEGGLRIVGISAVGSIDDLSAFKAAK
+ PSMGLAHQRKLYDAIEDLGHGGVKEIAALSVTADAPPTVSYSLIREVLRLYHRTGEKL
+ IITFAMPAYAKMVMNFGRFAMPQVGEPFYAHRNNDPRTSNDLLLVPSIVEPSNFLENI
+ SRGVVTADDGPTARRRFATLCYMTDGLDDYFMPLTRQVLSEGIQDI"
+ gene complement(2593876..2594994)
+ /locus_tag="BQ2027_MB2365C"
+ CDS complement(2593876..2594994)
+ /locus_tag="BQ2027_MB2365C"
+ /note="Mb2365c, -, len: 372 aa. Equivalent to Rv2337c,
+ len: 372 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 372 aa overlap). Hypothetical unknown
+ protein, sharing some similarity with Q9RI33|SCJ12.27c
+ HYPOTHETICAL 37.2 KDA PROTEIN from Streptomyces coelicolor
+ (335 aa), BLAST scores: 134 AND 46, (28% AND 33% identity,
+ 52% AND 44% positive); FASTA scores: opt: 176, E():
+ 0.00042, (31.95% identity in 355 aa overlap). Mb2365c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00977.1"
+ /db_xref="GOA:A0A1R3Y1A9"
+ /db_xref="InterPro:IPR000415"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1A9"
+ /translation="MRAGRWGPGMTGLDPAEFLSLVEAAALAPSADNRREVQLEHAGR
+ RVRLWGDQTWRSAPEHRRIMSLVAIGAAVENVKLRAGRLGFETKVCWFPDSGNPGLVA
+ EIDVDRLPQTRVDPIEVAIERRRTNRRVRFRGPPLSQGELGALSAEATGIDGIQLHWF
+ DSPETRKQILRLVRLAETERFRSRELHEELFSAVRFDIGWTASSDDGLPPGSLEVEAW
+ MRPMFRGLRHWRVLRLLRTVGMHHALGLRAAYLPCRLAPHVGALTTSLDLASGALTAG
+ AVFERIWLRTTLLGAELQPFAASAVLSLPACEWVAPHVRAALVGGWNLLAPGHWPMMV
+ FRIGHARAPSVRTMRQSVEAYCYAPAERSGSDSESRFA"
+ gene complement(2595114..2596070)
+ /gene="moeW"
+ /locus_tag="BQ2027_MB2366C"
+ CDS complement(2595114..2596070)
+ /gene="moeW"
+ /locus_tag="BQ2027_MB2366C"
+ /note="Mb2366c, moeW, len: 318 aa. Equivalent to Rv2338c,
+ len: 318 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 318 aa overlap). Possible moeW,
+ molybdoptenum biosynthesis protein, showing some
+ similarity to several molybdopterin biosynthesis proteins
+ e.g. O27613|MTH1571 MOLYBDOPTERIN BIOSYNTHESIS PROTEIN
+ MOEB HOMOLOG from Methanobacterium thermoautotrophicum
+ (251 aa), FASTA scores: opt: 309, E(): 4.7e-14; (30.7%
+ identity in 254 aa overlap); Q9KPQ5|VC2311 HESA/MOEB/THIF
+ FAMILY PROTEIN from Vibrio cholerae (273 aa), FASTA
+ scores: opt: 255, E(): 4e-09, (36.25% identity in 149 aa
+ overlap); Q9PD34|XF1545 MOLYBDOPTERIN BIOSYNTHESIS PROTEIN
+ from Xylella fastidiosa (276 aa), FASTA scores: opt:
+ 233,E(): 1e-07, (33.6% identity in 128 aa overlap); etc.
+ SEEMS TO BELONG TO THE HESA/MOEB/THIF FAMILY. Protein
+ product from Mb2366c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2366c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE MOLYBDOPTERIN BIOSYNTHESIS PROTEIN
+ MOEW"
+ /protein_id="SIU00978.1"
+ /db_xref="GOA:A0A1R3Y0U6"
+ /db_xref="InterPro:IPR000594"
+ /db_xref="InterPro:IPR035985"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0U6"
+ /translation="MRAGADAPDSGRVKESAPWSYDEAFCRNLGLISPTEQQRLRNSR
+ VAIAGMGGVGGIDMVALARMGIGKFTIADPDVFEIRNSNRQYGAMRSTNGQAKAEVMR
+ NIVHDINPEAEIRAFCEPIGKENAATFLEGADVLVDGIDAFEIDLRRLLYREAQQRGI
+ YALGAGPLGFSTAWVVFDPKGMTFDRYFDLSDAMNTVDKFVAFIAGIAPSATHRRSID
+ LSYVDIENRTGPSVGLACHLASGVVAAEVLKILLGHGRVYAAPYFHQFDAYRSIYVRK
+ RLRCGNRHPLQRVKRRLLARYINRRSAGVIPGLRYHRTEPSY"
+ gene 2596701..2599181
+ /gene="mmpL9a"
+ /locus_tag="BQ2027_MB2367"
+ CDS 2596701..2599181
+ /gene="mmpL9a"
+ /locus_tag="BQ2027_MB2367"
+ /note="Mb2367, mmpL9a, len: 826 aa. Equivalent to 5' end
+ of Rv2339, len: 962 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.9% identity in 826 aa overlap). Probable
+ mmpL9, conserved transmembrane transport protein (see
+ citation below), with strong similarity to other
+ Mycobacterial proteins e.g. P54881|YV34_MYCLE|MML4_MYCLE
+ hypothetical 105.2 kd protein from Mycobacterium leprae
+ (959 aa), FASTA scores: opt: 3799, E(): 0, (59.3% identity
+ in 937 aa overlap); G699237|U1740AB from Mycobacterium
+ leprae; and MTCY20G9.34; MTCY48.08c; MTCY19G5.06 from M.
+ tuberculosis. BELONGS TO THE MMPL FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, mmpL9 exists as a single gene.
+ In Mycobacterium bovis, truncation due to a single base
+ transition (g-a) splits mmpL9 into 2 parts, mmpL9a and
+ mmpL9b, resulting in a shorter mmpL9a product. Mb2367
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL9A [FIRST PART]"
+ /protein_id="SIU00979.1"
+ /db_xref="GOA:A0A1R3Y0X6"
+ /db_xref="InterPro:IPR004869"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0X6"
+ /translation="MVPGEVHMSDTPSGPHPIIPRTIRLAAIPILLCWLGFTVFVSVV
+ VPPLEAIGETRAVAVAPDDAQSMRAMRRAGKVFNEFDSNSIAMVVLESDQPLGEKAHR
+ YYDHLVDTLVLDQSHIQHIQDFWRDPLTAAGAVSADGKAAYVQLYLAGNMGEALANES
+ VEAVRKIVANSTPPEGIRTYVTGPAALFADQIAAGDRSMKLITGLTFAVITVLLLLVY
+ RSIATTLLILPMVFIGLGATRGTIAFLGYHGMVGLSTFVVNILTALAIAAGTDYAIFL
+ VGRYQEARHIGQNREASFYTMYRGTANVILGSGLTIAGATYCLSFARLTLFHTMGPPL
+ AIGMLVSVAAALTLAPAIIAIAGRFGLLDPKRRLKTRGWRRVGTAVVRWPGPILATSV
+ ALALVGLLALPGYRPGYNDRYYLRAGTPVNRGYAAADRHFGPARMNPEMLLVESDQDM
+ RNPAGMLVIDKIAKEVLHVSGVERVQAITRPQGVPLEHASIPFQISMMGATQTMSLPY
+ MRERMADMLTMSDEMLVAINSMEQMLDLVQQLNDVTHEMAATTREIKATTSELRDHLA
+ DIDDFVRPLRSYFYWEHHCFDIPLCSATRSLFDTLDGVDTLTDQLRALTDDMNKMEAL
+ TPQFLALLPPMITTMKTMRTMMLTMRSTISGVQDQMADMQDHATAMGQAFDTAKSGDS
+ FYLPPEAFDNAEFQQGMKLFLSPNGKAVRFVISHESDPASTEGIDRIEAIRAATKDAI
+ KATPLQGAKIYIGGTAATYQDIRDGTKYDILIVGIAAVCLVFIVMLMITQSLIASLVI
+ VGTVLLSLGTAFGLSVLIWQHFVGLQVH"
+ gene 2599194..2599589
+ /gene="mmpL9b"
+ /locus_tag="BQ2027_MB2368"
+ CDS 2599194..2599589
+ /gene="mmpL9b"
+ /locus_tag="BQ2027_MB2368"
+ /note="Mb2368, mmpL9b, len: 131 aa. Equivalent to 3' end
+ of Rv2339, len: 962 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 131 aa overlap).
+ Probable mmpL9, conserved transmembrane transport protein
+ (see citation below), with strong similarity to other
+ Mycobacterial proteins e.g. P54881|YV34_MYCLE|MML4_MYCLE
+ hypothetical 105.2 kd protein from Mycobacterium leprae
+ (959 aa), FASTA scores: opt: 3799, E(): 0, (59.3% identity
+ in 937 aa overlap); G699237|U1740AB from Mycobacterium
+ leprae; and MTCY20G9.34; MTCY48.08c; MTCY19G5.06 from M.
+ tuberculosis. BELONGS TO THE MMPL FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, mmpL9 exists as a single gene.
+ In Mycobacterium bovis, truncation due to a single base
+ transition (g-a) splits mmpL9 into 2 parts, mmpL9a and
+ mmpL9b. Protein product from Mb2368 detected using SWATH
+ mass spectrometry. Mb2368 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE TRANSPORT
+ PROTEIN MMPL9B [SECOND PART]"
+ /protein_id="SIU00980.1"
+ /db_xref="GOA:A0A1R3Y0Y1"
+ /db_xref="InterPro:IPR004869"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Y1"
+ /translation="MSVIVLLAVGSDYNLLLVSRFKEEVGAGLKTGIIRAMAGTGAVV
+ TSAGLVFAFTMASMAVSELRVIGQVGTTIGLGLLFDTLVVRSFMTPSIAALLGRWFWW
+ PNMIHSRPTVPEAHTRQGARRIQPHLHRG"
+ gene complement(2599675..2600916)
+ /gene="PE_PGRS39"
+ /locus_tag="BQ2027_MB2369C"
+ CDS complement(2599675..2600916)
+ /gene="PE_PGRS39"
+ /locus_tag="BQ2027_MB2369C"
+ /note="Mb2369c, PE_PGRS39, len: 413 aa. Equivalent to
+ Rv2340c, len: 413 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 413 aa overlap). Member
+ of the Mycobacterium tuberculosis PE_family, PGRS
+ subfamily of gly-rich proteins, similar to others eg
+ YI18_MYCTU|Q50615|Rv1818c|MTCY1A11.25 PE-PGRS FAMILY
+ PROTEIN from Mycobacterium tuberculosis (498 aa), FASTA
+ scores: opt: 710, E(): 1.4e-22, (41.0% identity in 368 aa
+ overlap); O53884|Rv0872v|MTV043.65c PGRS-FAMILY PROTEIN
+ from Mycobacterium tuberculosis (606 aa), FASTA scores:
+ opt: 708, E(): 1.9e-22, (42.4% identity in 389 aa
+ overlap); etc. Mb2369c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs39"
+ /protein_id="SIU00981.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0X9"
+ /translation="MSHVTAAPNVLAASAGELAAIGSTMRAANAAAAAPTAGVLAAGG
+ DDVSAGIAALFGARAQAYQAISAQAALFHDRFVQILQEGAAAYAMAEAANALPLQKAQ
+ GVVSELAQDRTGGTGTGQSRGAGGFGGVGQAGGKGWDGGPIGNGQVGEQHGAGQLGST
+ DGNPGVAGAAHGSGVSASHGSGATGAAGVADPGGSGAGVGSAAGNGTGAGSADAVGGA
+ GTGRDIVGSVRGDGGVGMASGDGGLSTGAAGASAEGGLMPGFGGAPWVGGHWGLGGEG
+ HSGAIGGVGEQVAPAVATAPAVSPATTSAVAAESGSTPATKAQAMHATTNPGNAAHQG
+ NPADPGNSARRADGGRDEQLLLLPLTSLRGLRHTLKKLSGLRARNGLLTASGDNASGS
+ GRPWDRDQLLRALGLRPPGHE"
+ gene complement(2601415..2601487)
+ /locus_tag="BQ2027_ASNT"
+ tRNA complement(2601415..2601487)
+ /locus_tag="BQ2027_ASNT"
+ /product="tRNA-Asn"
+ /note="asnT, len: 73 nt. Equivalent to asnT, len: 73 nt,
+ from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 73 nt overlap). tRNA-Asn, anticodon gtt."
+ gene 2601605..2602024
+ /gene="lppQ"
+ /locus_tag="BQ2027_MB2370"
+ CDS 2601605..2602024
+ /gene="lppQ"
+ /locus_tag="BQ2027_MB2370"
+ /note="Mb2370, lppQ, len: 139 aa. Equivalent to Rv2341,
+ len: 139 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 139 aa overlap). Probable lppQ,
+ conserved lipoprotein, showing some similarity with
+ Rv1228|O33224|LPQX|MTCI61.11 from Mycobacterium
+ tuberculosis (185 aa), FASTA scores: opt: 155; E():
+ 0.0073; (31.9% identity in 116 aa overlap). Also shows few
+ similarity with P29228|VLPA_MYCHR variant surface antigen
+ A precursor from Mycoplasma hyorhinis (157 aa), FASTA
+ scores: opt: 96, E(): 7.3, (23.1% identity in 143 aa
+ overlap). Contains PS00013 Prokaryotic membrane
+ lipoprotein lipid attachment site. Mb2370 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN LPPQ"
+ /protein_id="SIU00982.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Y8"
+ /translation="MPVGGRQHVFEKLASILGLVAAPLMLLGLSACGRSAGKTSEPTC
+ PTEPIDAADSSTTPDPSCVVRATEINGNGSRIQTWTGSYDAAATQSGGVCGGTCNFHA
+ TVRFTVDEGQISGSVDQVYQAAMVAIATRPTSPSLAP"
+ gene 2602280..2602537
+ /locus_tag="BQ2027_MB2371"
+ CDS 2602280..2602537
+ /locus_tag="BQ2027_MB2371"
+ /note="Mb2371, -, len: 85 aa. Equivalent to Rv2342, len:
+ 85 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 85 aa overlap). Conserved hypothetical
+ protein, highly similar to Q9CCG1|ML0834 HYPOTHETICAL
+ PROTEIN from Mycobacterium leprae (100 aa), FASTA scores:
+ opt: 392, E(): 2.9e-20, (78.2% identity in 78 aa overlap).
+ N-terminus highly similar to N-terminal part of
+ Q9L085|SCC24.32 PUTATIVE SECRETED PROTEIN from
+ Streptomyces coelicolor (108 aa), FASTA scores: opt: 122,
+ E(): 0.077, (39.15% identity in 46 aa overlap). Protein
+ product from Mb2371 detected using SWATH mass
+ spectrometry. Mb2371 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU00983.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0W0"
+ /translation="MIGYVAVLGLGYVLGAKAGRRRYEQIASTYRALTGSPVARSMIE
+ GGRRKIANRISPDAGFVTLAEIDNQTAVVQRGVERQPKTAR"
+ gene complement(2602541..2604460)
+ /gene="dnaG"
+ /locus_tag="BQ2027_MB2372C"
+ CDS complement(2602541..2604460)
+ /gene="dnaG"
+ /locus_tag="BQ2027_MB2372C"
+ /note="Mb2372c, dnaG, len: 639 aa. Equivalent to Rv2343c,
+ len: 639 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 639 aa overlap). Probable dnaG, DNA
+ primase (EC 2.7.7.-), equivalent to O52200|PRIM_MYCSM|DNAG
+ DNA PRIMASE from Mycobacterium smegmatis (636 aa), FASTA
+ scores: opt: 3504, E(): 5.5e-202, (81.55% identity in 639
+ aa overlap); and Q9CCG2|DNAG|ML0833 DNA PRIMASE from
+ Mycobacterium leprae (642 aa), FASTA scores: opt: 3443,
+ E(): 2.5e-198, (80.4% identity in 642 aa overlap). Also
+ highly similar to many DNA primases e.g.
+ Q9S1N4|PRIM_STRCO|DNAG|SC7A8.07c from Streptomyces
+ coelicolor (641 aa), FASTA scores: opt: 1899, E():
+ 5.1e-106, (47.9% identity in 643 aa overlap);
+ P74893|PRIM_SYNP7|DNAG from Synechococcus sp. strain PCC
+ 7942 (Anacystis nidulans R2) (616 aa), FASTA scores: opt:
+ 860, E(): 6.6e-44, (35.3% identity in 513 aa overlap);
+ P05096|PRIM_BACSU from Bacillus subtilis (603 aa) FASTA
+ scores: opt: 800, E(): 2.5e-40, (33.7% identity in 430 aa
+ overlap); etc. Protein product from Mb2372c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2372c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DNA PRIMASE DNAG"
+ /protein_id="SIU00984.1"
+ /db_xref="GOA:P63963"
+ /db_xref="InterPro:IPR002694"
+ /db_xref="InterPro:IPR006171"
+ /db_xref="InterPro:IPR006295"
+ /db_xref="InterPro:IPR013173"
+ /db_xref="InterPro:IPR013264"
+ /db_xref="InterPro:IPR019475"
+ /db_xref="InterPro:IPR030846"
+ /db_xref="InterPro:IPR034151"
+ /db_xref="InterPro:IPR036977"
+ /db_xref="InterPro:IPR037068"
+ /db_xref="UniProtKB/Swiss-Prot:P63963"
+ /translation="MSGRISDRDIAAIREGARIEDVVGDYVQLRRAGADSLKGLCPFH
+ NEKSPSFHVRPNHGHFHCFGCGEGGDVYAFIQKIEHVSFVEAVELLADRIGHTISYTG
+ AATSVQRDRGSRSRLLAANAAAAAFYAQALQSDEAAPARQYLTERSFDAAAARKFGCG
+ FAPSGWDSLTKHLQRKGFEFEELEAAGLSRQGRHGPMDRFHRRLLWPIRTSAGEVVGF
+ GARRLFDDDAMEAKYVNTPETLLYKKSSVMFGIDLAKRDIAKGHQAVVVEGYTDVMAM
+ HLAGVTTAVASCGTAFGGEHLAMLRRLMMDDSFFRGELIYVFDGDEAGRAAALKAFDG
+ EQKLAGQSFVAVAPDGMDPCDLRLKCGDAALRDLVARRTPLFEFAIRAAIAEMDLDSA
+ EGRVAALRRCVPMVGQIKDPTLRDEYARQLAGWVGWADVAQVIGRVRGEAKRTKHPRL
+ GRLGSTTIARAAQRPTAGPPTELAVRPDPRDPTLWPQREALKSALQYPALAGPVFDAL
+ TVEGFTHPEYAAVRAAIDTAGGTSAGLSGAQWLDMVRQQTTSTVTSALISELGVEAIQ
+ VDDDKLPRYIAGVLARLQEVWLGRQIAEVKSKLQRMSPIEQGDEYHALFGDLVAMEAY
+ RRSLLEQASGDDLTA"
+ gene complement(2604465..2605760)
+ /gene="dgt"
+ /locus_tag="BQ2027_MB2373C"
+ CDS complement(2604465..2605760)
+ /gene="dgt"
+ /locus_tag="BQ2027_MB2373C"
+ /note="Mb2373c, dgt, len: 431 aa. Equivalent to Rv2344c,
+ len: 431 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 431 aa overlap). Probable dgt,
+ deoxyguanosine triphosphate triphosphohydrolase (EC
+ 3.1.5.1), equivalent to Q9CCG3|DGT|ML0831 PUTATIVE
+ DEOXYGUANOSINE TRIPHOSPHATE TRIPHOSPHOHYDROLASE from
+ Mycobacterium leprae (429 aa), FASTA scores: opt: 2316,
+ E(): 1.6e-137, (83.85% identity in 421 aa overlap); and
+ O52199|DGTP_MYCSM|AF027507_2 DEOXYGUANOSINETRIPHOSPHATE
+ TRIPHOSPHOHYDROLASE from Mycobacterium smegmatis (428 aa),
+ FASTA scores: opt: 1991, E(): 3.4e-117, (73.5% identity in
+ 422 aa overlap). Also highly similar or similar to several
+ deoxyguanosine triphosphate hydrolases e.g.
+ Q9L2E9|SC7A8.09c PUTATIVE DEOXYGUANOSINETRIPHOSPHATE
+ TRIPHOSPHOHYDROLASE from Streptomyces coelicolor (424 aa),
+ FASTA scores: opt: 1216, E(): 1e-68, (51.05% identity in
+ 425 aa overlap); BAB48544|MLL1093 DGTP TRIPHOSPHOHYDROLASE
+ from Rhizobium loti (Mesorhizobium loti) (404 aa), FASTA
+ scores: opt: 489, E(): 3.1e-23, (33.85% identity in 387 aa
+ overlap); P15723|DGTP_ECOLI|DGT|B0160 from Escherichia
+ coli strain K12 (504 aa), FASTA scores: opt: 173, E():
+ 0.0022, (31.65% identity in 259 aa overlap); etc. BELONGS
+ TO THE DGTPASE FAMILY. Protein product from Mb2373c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2373c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE DEOXYGUANOSINE TRIPHOSPHATE
+ TRIPHOSPHOHYDROLASE DGT (DGTPASE) (DGTP
+ TRIPHOSPHOHYDROLASE)"
+ /protein_id="SIU00985.1"
+ /db_xref="GOA:P0A541"
+ /db_xref="InterPro:IPR003607"
+ /db_xref="InterPro:IPR006261"
+ /db_xref="InterPro:IPR006674"
+ /db_xref="InterPro:IPR023023"
+ /db_xref="InterPro:IPR026875"
+ /db_xref="UniProtKB/Swiss-Prot:P0A541"
+ /translation="MSASEHDPYDDFDRQRRVAEAPKTAGLPGTEGQYRSDFARDRAR
+ VLHSAALRRLADKTQVVGPREGDTPRTRLTHSLEVAQIGRGMAIGLGCDLDLVELAGL
+ AHDIGHPPYGHNGERALDEVAASHGGFEGNAQNFRILTSLEPKVVDAQGLSAGLNLTR
+ ASLDAVTKYPWMRGDGLGSQRRKFGFYDDDRESAVWVRQGAPPERACLEAQVMDWADD
+ VAYSVHDVEDGVVSERIDLRVLAAEEDAAALARLGEREFSRVSADELMAAARRLSRLP
+ VVAAVGKYDATLSASVALKRLTSELVGRFASAAIATTRAAAGPGPLVRFRADLQVPDL
+ VRAEVAVLKILALQFIMSDPRHLETQARQRERIHRVAHRLYSGAPQTLDPVYAAAFNT
+ AADDAARLRVVVDQIASYTEGRLERIDADQLGVSRNALD"
+ gene 2605829..2607811
+ /locus_tag="BQ2027_MB2374"
+ CDS 2605829..2607811
+ /locus_tag="BQ2027_MB2374"
+ /note="Mb2374, -, len: 660 aa. Equivalent to Rv2345, len:
+ 660 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 660 aa overlap). Possible conserved
+ transmembrane protein, with hydrophobic stretch at
+ N-terminal end around position 180. Similar to O52198
+ HYPOTHETICAL 21.2 KDA PROTEIN (FRAGMENT) from
+ Mycobacterium smegmatis (195 aa), FASTA scores: opt: 589,
+ E(): 1.5e-23; (47.2% identity in 195 aa overlap). Protein
+ product from Mb2374 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2374 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00986.1"
+ /db_xref="GOA:A0A1R3Y161"
+ /db_xref="InterPro:IPR007621"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y161"
+ /translation="MRLVRLLGMVLTILAAGLLLGPPAGAQPPFRLSNYVTDNAGVLT
+ SSGRTAVTAAVDRLYADRRIRLWVVYVENFSGQSALNWAQRTTRTSELGNYDALLAVA
+ TTGREYAFLVPSAMPGVSEGQVDNVRRYQIEPALHDGDYSGAAVAAANGLNRSPSSSS
+ RVVLLVTVGIIVIVVAVLLVVMRHRNRRRRADELAAARRVDPTNVMALAAVPLQALDD
+ LSRSMVVDVDNAVRTSTNELALAIEEFGERRTAPFTQAVNNAKAALSQAFTVRQQLDD
+ NTPETPAQRRELLTRVIVSAAHADRELASQTEAFEKLRDLVINAPARLDLLTQQYVEL
+ TTRIGPTQQRLAELHTEFDAAAMTSIAGNVTTATERLAFADRNISAARDLADQAVSGR
+ QAGLVDAVRAAESALGQARALLDAVDSAATDIRHAVASLPAVVADIQTGIKRANQHLQ
+ QAQQPQTGRTGDLIAARDAAARALDRARGAADPLTAFDQLTKVDADLDRLLATLAEEQ
+ ATADRLNRSLEQALFTAESRVRAVSEYIDTRRGSIGPEARTRLAEAKRQLEAAHDRKS
+ SNPTEAIAYANAASTLAAHAQSLANADVQSAQRAYTRRGGNNAGAILGGIIIGDLLSG
+ GTRGGLGGWIPTSFGGSSNAPGSSPDGGFLGGGGRF"
+ gene complement(2607896..2608078)
+ /gene="esxO"
+ /locus_tag="BQ2027_MB2375C"
+ CDS complement(2607896..2608078)
+ /gene="esxO"
+ /locus_tag="BQ2027_MB2375C"
+ /standard_name="ES6_6; Mtb9.9E"
+ /note="Mb2375c, esxO, len: 60 aa. Equivalent to 3' end of
+ Rv2346c, len: 94 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (98.3% identity in 60 aa overlap). esxO,
+ putative ESAT-6 like protein 6, conserved
+ hypotheticalprotein, member of proteins family from
+ Mycobacterium tuberculosis, with O53942|Rv1793|MTV049.15,
+ O05300|Rv1198|MTCI364.10, MTCY15C10.33,
+ P96364|MTCY07H7B.03|Rv1037c|MTCY10G2.12, MTCI364.10, etc.
+ BELONGS TO THE ESAT6 FAMILY.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ large 8963 bp deletion (RD5) leads to the loss of the NH2
+ part of Mb2375c, and the 9 following CDSs up to Rv2356
+ including the 3 phospolipases C enzymes plcC, plcB and
+ plcA, compared to the homolog in Mycobacterium
+ tuberculosis H37Rv. Protein product from Mb2375c detected
+ using SWATH mass spectrometry. Mb2375c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative esat-6 like protein esxo (esat-6 like
+ protein 6)"
+ /protein_id="SIU00987.1"
+ /db_xref="InterPro:IPR010310"
+ /db_xref="InterPro:IPR036689"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1C7"
+ /translation="MLAAGDFWGGAGSVACQEFITQLGRNFQVIYEQANAHGQKVQAA
+ GNNMAQTDSAVGSSWA"
+ gene complement(2608062..2609435)
+ /gene="PPE71"
+ /locus_tag="BQ2027_MB2376C"
+ CDS complement(2608062..2609435)
+ /gene="PPE71"
+ /locus_tag="BQ2027_MB2376C"
+ /note="Mb2376c, PPE71, len: 457 aa. Equivalent to 5' end
+ of MT2423, len: 621 aa, from Mycobacterium tuberculosis
+ strain CDC1551, (98.475% identity in 459 aa overlap). PPE
+ FAMILY PROTEIN. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, there is a large 8963 bp deletion
+ (RD5) in between Mb2375c and Mb2377c compared to
+ Mycobacterium tuberculosis strain H37Rv. In this region of
+ Mycobacterium bovis two substitutions are present that
+ encode a CDS, Mb2376c, equivalent to that found in
+ Mycobacterium tuberculosis strain CDC1551. The first
+ substitution is of 1218 bp to 350 bp and the second is of
+ 123 bp to 431 bp. Mb2376c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PPE FAMILY PROTEIN"
+ /protein_id="SIU00988.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR002989"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0W9"
+ /translation="MVNFSVLPPEINSGRMFFGAGSGPMLAAAAAWDGLAAELGLAAE
+ SFGLVTSGLAGGSGQAWQGAAAAMVVAAAPYAGWLAAAAARAGGAAVQAKAVAGAFEA
+ ARAAMVDPVVVAANRSAFVQLVLSNVFGQNAPAIAAAEATYEQMWAADVAAMVGYHGG
+ ASAAAALAPWQQAVPGLLGLLDSAQSSAQAVTAQAVGSTVPGPLQGINFGFGNIGSLN
+ LGSGNTGDTNVGSGNIGNTNLGGGNIGSFNLGSGNQGDINLGIGNVGNLNLGSGNFGS
+ QNLGSGNIGSTNVGSGNIGSTNVGSGNIGDTNFGNGNNGNFNFGSGNTGSNNIGFGNT
+ GSGNFGFGNTGNNNIGIGLTGDGQIGIGGLNSGSGNIGFGNSGTGNVGLFNSGTGNVG
+ FGNSGTANTGFGNAGNVNTGFWNGGSTNTGLANAGAGNTGFFDAGNYNFGSLNAGNIN
+ SSFVGRG"
+ gene complement(2610173..2612017)
+ /gene="PPE40"
+ /locus_tag="BQ2027_MB2377C"
+ CDS complement(2610173..2612017)
+ /gene="PPE40"
+ /locus_tag="BQ2027_MB2377C"
+ /note="Mb2377c, PPE40, len: 614 aa. Equivalent to Rv2356c,
+ len: 615 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 615 aa overlap). Member of
+ Mycobacterium tuberculosis PPE_family, highly similar to
+ others e.g. Q10778|MTCY48.17|YF48_MYCTU HYPOTHETICAL
+ PPE-FAMILY PROTEIN (678 aa), FASTA scores: opt: 1888, E():
+ 1.9e-78, (54.4% identity in 667 aa overlap);
+ Q10540|MTCY31.06c, E241779|MTCY98, P42611|MTV037.06c,
+ Q10813|MTCY274.23c, P71657|MTCY02B10.25c, MTCY03C7.23,
+ P71869|MTCY03C7.24c, etc. REMARK-M.bovis-M.tuberculosis:
+ In Mycobacterium bovis, a 3 bp deletion (gcg-*) leads to a
+ slightly shorter product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (614 aa versus 615
+ aa). Mb2377c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe40"
+ /protein_id="SIU00989.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR002989"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Z4"
+ /translation="MVNFSVLPPEINSGRMFFGAGSGPMLAAAAAWDGLAAELGLAAE
+ SFGLVTSGLAGGSGQAWQGAAAAAMVVAAAPYAGWLAAAAARAGGAAVQAKAVAGAFE
+ AARAAMVDPVVVAANRSAFVQLVLSNVFGQNAPAIAAAEATYEQMWAADVAAMVGYHG
+ GASAAAALAPWQQAVPGLSGLLGGAANAPAAAAQGAAQGLAELTLNLGVGNIGSLNLG
+ SGNIGGTNVGSGNVGGTNLGSGNYGSLNWGSGNTGTGNAGSGNTGDYNPGSGNFGSGN
+ FGSGNIGSLNVGSGNFGTLNLANGNNGDVNFGGGNTGDFNFGGGNNGTLNFGFGNTGS
+ GNFGFGNTGNNNIGIGLTGDGQIGIGGLNSGTGNIGFGNSGNNNIGFFNSGDGNIGFF
+ NSGDGNTGFGNAGNINTGFWNAGNLNTGFGSAGNGNVGIFDGGNSNSGSFNVGFQNTG
+ FGNSGAGNTGFFNAGDSNTGFANAGNVNTGFFNGGDINTGGFNGGNVNTGFGSALTQA
+ GANSGFGNLGTGNSGWGNSDPSGTGNSGFFNTGNGNSGFSNAGPAMLPGFNSGFANIG
+ SFNAGIANSGNNLAGISNSGDDSSGAVNSGSQNSGAFNAGVGLSGFFR"
+ gene complement(2612155..2613546)
+ /gene="glyS"
+ /locus_tag="BQ2027_MB2378C"
+ CDS complement(2612155..2613546)
+ /gene="glyS"
+ /locus_tag="BQ2027_MB2378C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2378c, glyS, len: 463 aa. Equivalent to Rv2357c,
+ len: 463 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 463 aa overlap). Probable glyS,
+ glycyl-tRNA synthetase (EC 6.1.1.14), equivalent to
+ Q9CCG4|GLYS|ML0826 PUTATIVE GLYCYL-TRNA SYNTHASE from
+ Mycobacterium leprae (463 aa), FASTA scores: opt: 2898,
+ E(): 1e-179, (90.2% identity in 459 aa overlap). Also
+ highly similar to others e.g. Q9L2H9|SYG_STRCO|SCC121.07c
+ from Streptomyces coelicolor (460 aa), FASTA scores: opt:
+ 2210, E(): 2.9e-135, (68.3% identity in 457 aa overlap);
+ Q9PPZ7|SYG_UREPA|GLYS|UU493 GLYCYL-TRNA SYNTHETASE from
+ Ureaplasma parvum (Ureaplasma urealyticum biotype 1) (473
+ aa), FASTA scores: opt: 1254, E(): 1.7e-73, (45.25%
+ identity in 462 aa overlap);
+ P75425|SYG_MYCPN|GLYS|MPN354|MP482 GLYCYL-TRNA SYNTHETASE
+ from Mycoplasma pneumoniae (449 aa), FASTA scores: opt:
+ 1074, E(): 6.9e-62, (39.45% identity in 454 aa overlap);
+ etc. Contains PS00017 ATP/GTP-binding site motif A
+ (P-loop), and PS00179 Aminoacyl-transfer RNA synthetases
+ class-II signature 1. BELONGS TO CLASS-II AMINOACYL-TRNA
+ SYNTHETASE FAMILY. Protein product from Mb2378c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2378c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLYCYL-tRNA SYNTHETASE GLYS
+ (GLYCINE--tRNA LIGASE) (GLYRS)"
+ /protein_id="SIU00990.1"
+ /db_xref="GOA:P67033"
+ /db_xref="InterPro:IPR002314"
+ /db_xref="InterPro:IPR002315"
+ /db_xref="InterPro:IPR004154"
+ /db_xref="InterPro:IPR006195"
+ /db_xref="InterPro:IPR022961"
+ /db_xref="InterPro:IPR027031"
+ /db_xref="InterPro:IPR033731"
+ /db_xref="InterPro:IPR036621"
+ /db_xref="UniProtKB/Swiss-Prot:P67033"
+ /translation="MHHPVAPVIDTVVNLAKRRGFVYPSGEIYGGTKSAWDYGPLGVE
+ LKENIKRQWWRSVVTGRDDVVGIDSSIILPREVWVASGHVDVFHDPLVESLITHKRYR
+ ADHLIEAYEAKHGHPPPNGLADIRDPETGEPGQWTQPREFNMMLKTYLGPIETEEGLH
+ YLRPETAQGIFVNFANVVTTARKKPPFGIGQIGKSFRNEITPGNFIFRTREFEQMEME
+ FFVEPATAKEWHQYWIDNRLQWYIDLGIRRENLRLWEHPKDKLSHYSDRTVDIEYKFG
+ FMGNPWGELEGVANRTDFDLSTHARHSGVDLSFYDQINDVRYTPYVIEPAAGLTRSFM
+ AFLIDAYTEDEAPNTKGGMDKRTVLRLDPRLAPVKAAVLPLSRHADLSPKARDLGAEL
+ RKCWNIDFDDAGAIGRRYRRQDEVGTPFCVTVDFDSLQDNAVTVRERDAMTQDRVAMS
+ SVADYLAVRLKGS"
+ gene 2613728..2614135
+ /gene="smtb"
+ /locus_tag="BQ2027_MB2379"
+ CDS 2613728..2614135
+ /gene="smtb"
+ /locus_tag="BQ2027_MB2379"
+ /note="Mb2379, -, len: 135 aa. Equivalent to Rv2358, len:
+ 135 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 135 aa overlap). Probable
+ transcriptional regulator, arsR family, equivalent to
+ Q9CCG5|ML0825 PUTATIVE ARSR-FAMILY TRANSCRIPTIONAL
+ REGULATOR from Mycobacterium leprae (140 aa), FASTA
+ scores: opt: 647, E(): 2e-34, (72.9% identity in 140 aa
+ overlap). Also similar to others e.g. BAB48273|MLR0745
+ Transcriptional regulator from Rhizobium loti
+ (Mesorhizobium loti) (104 aa), FASTA scores: opt: 185,
+ E(): 3.4e-05, (43.25% identity in 74 aa overlap) (has its
+ N-terminus shorter); P15905|ARR1_ECOLI arsenical
+ resistance operon repressor from Escherichia coli (117
+ aa), FASTA scores: opt: 164, E(): 8.1e-05, (39.1% identity
+ in 69 aa overlap); etc. Also similar to
+ O53838|Rv0827|MTV043.19c PUTATIVE TRANSCRIPTIONAL
+ REGULATOR from Mycobacterium tuberculosis (130 aa), FASTA
+ scores: opt: 201, E(): 4e-06, (35.7% identity in 98 aa
+ overlap); and O69711|Rv3744|MTV025.092 PUTATIVE REGULATORY
+ PROTEIN from Mycobacterium tuberculosis (120 aa), FASTA
+ scores: opt: 209, E(): 1.2e-06, (35.5 % identity in 93 aa
+ overlap). Contains possible helix-turn-helix motif at aa
+ 72-93 (Score 1103, +2.94 SD). Belongs to the ARSR family
+ of transciptional regulators. Protein product from Mb2379
+ detected using SWATH mass spectrometry. Mb2379 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable transcriptional regulatory protein smtb
+ (probably arsr-family)"
+ /protein_id="SIU00991.1"
+ /db_xref="GOA:A0A1R3Y102"
+ /db_xref="InterPro:IPR001845"
+ /db_xref="InterPro:IPR011991"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y102"
+ /translation="MVTSPSTPTAAHEDVGADEVGGHQHPADRFAECPTFPAPPPREI
+ LDAAGELLRALAAPVRIAIVLQLRESQRCVHELVDALHVPQPLVSQHLKILKAAGVVT
+ GERSGREVLYRLADHHLAHIVLDAVAHAGEDAI"
+ gene 2614132..2614524
+ /gene="zur"
+ /locus_tag="BQ2027_MB2380"
+ CDS 2614132..2614524
+ /gene="zur"
+ /locus_tag="BQ2027_MB2380"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2380, furB, len: 130 aa. Equivalent to Rv2359,
+ len: 130 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.2% identity in 130 aa overlap). Probable furB, ferric
+ uptake regulation protein, equivalent to
+ FURB|ML0824|Q9CCG6 PUTATIVE FERRIC UPTAKE REGULATORY
+ PROTEIN from Mycobacterium leprae (131 aa), FASTA scores:
+ opt: 765, E(): 1.7e-43, (86.9% identity in 130 aa
+ overlap). Also highly similar to FERRIC UPTAKE REGULATION
+ PROTEINS e.g. Q9L2H5|SCC121.11 PUTATIVE METAL UPTAKE
+ REGULATION PROTEIN from Streptomyces coelicolor (139 aa),
+ FASTA scores: opt: 547, E(): 3.4e-29, (59.4% identity in
+ 133 aa overlap); P06975|FUR_ECOLI from Escherichia coli
+ (148 aa), FASTA scores: opt: 322, E(): 1.9e-14, (37.9%
+ identity in 132 aa overlap); P45599|FUR_KLEPN FERRIC
+ UPTAKE REGULATION PROTEIN from Klebsiella pneumoniae (155
+ aa), FASTA scores: opt: 314, E(): 6.7e-14, (36.35%
+ identity in 132 aa overlap); etc. BELONGS TO THE FUR
+ FAMILY. Protein product from Mb2380 detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb2380
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable zinc uptake regulation protein zur"
+ /protein_id="SIU00992.1"
+ /db_xref="GOA:A0A1R3Y106"
+ /db_xref="InterPro:IPR002481"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y106"
+ /translation="MSAAGVRSTRQRAAISTLLETLDDFRSAQELHDELRRRGENIGL
+ TTVYRTLQSMASSGLVDTLRTDTGESVYRRCSEHHHHHLVCRSCGSTIEVGDHEVEAW
+ AAEVATKHGFSDVSHTIEIFGTCSDCRS"
+ gene complement(2614632..2615060)
+ /locus_tag="BQ2027_MB2381C"
+ CDS complement(2614632..2615060)
+ /locus_tag="BQ2027_MB2381C"
+ /note="Mb2381c, -, len: 142 aa. Equivalent to Rv2360c,
+ len: 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 142 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb2381c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2381c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="unknown protein"
+ /protein_id="SIU00993.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0X8"
+ /translation="MPSLPDRLASILRDVLPAEEEPDGALTVRHDGTFASLRVVSIAE
+ DLELVSLTQILAWDLPLTKRLTEQVAKQARDINFGSVSLREKVSEKAARRSSGRPASN
+ TADVMLRYNFPGTGLTDDALRTLILLVLETGATIRSALVG"
+ gene complement(2615060..2615950)
+ /locus_tag="BQ2027_MB2382C"
+ CDS complement(2615060..2615950)
+ /locus_tag="BQ2027_MB2382C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2382c, -, len: 296 aa. Equivalent to Rv2361c,
+ len: 296 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 296 aa overlap). Long (C50) chain
+ Z-isoprenyl diphosphate synthase (EC 2.5.1.-) (see
+ citation below), equivalent to
+ UPPS_MYCLE|ML0634|B1937_F2_65|P38119 UNDECAPRENYL
+ PYROPHOSPHATE SYNTHETASE from Mycobacterium leprae (296
+ aa), FASTA scores: opt: 1789, E(): 1.8e-97, (86.5%
+ identity in 296 aa overlap). Also highly similar to others
+ e.g. UPPS|Q9L2H4 UNDECAPRENYL PYROPHOSPHATE SYNTHETASE
+ from Streptomyces coelicolor (277 aa), FASTA scores: opt:
+ 1098, E(): 8.2e-60, (63.5% identity in 247 aa overlap);
+ Q55482|UPPS_SYNY3|SLL0506 from Synechocystis sp. strain
+ PCC 6803 (249 aa), FASTA scores: opt: 686, E(): 4.2e-33,
+ (46.4% identity in 235 aa overlap);
+ O67291|UPPS_AQUAE|AQ_1248 from Aquifex aeolicus (231 aa),
+ FASTA scores: opt: 684, E(): 5.2e-33, (46.3% identity in
+ 229 aa overlap); etc. Also similar to Rv1086|MTV017.39
+ from Mycobacterium tuberculosis. Contains PS01066
+ Hypothetical YBR002c family signature. SEEMS TO BELONG TO
+ THE UPP SYNTHETASE FAMILY. Note that previously known as
+ uppS. Protein product from Mb2382c detected using shotgun
+ mass spectrometry and SWATH mass spectrometry. Mb2382c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="LONG (C50) CHAIN Z-ISOPRENYL DIPHOSPHATE
+ SYNTHASE (Z-DECAPRENYL DIPHOSPHATE SYNTHASE)"
+ /protein_id="SIU00994.1"
+ /db_xref="GOA:P60478"
+ /db_xref="InterPro:IPR001441"
+ /db_xref="InterPro:IPR018520"
+ /db_xref="InterPro:IPR036424"
+ /db_xref="UniProtKB/Swiss-Prot:P60478"
+ /translation="MARDARKRTSSNFPQLPPAPDDYPTFPDTSTWPVVFPELPAAPY
+ GGPCRPPQHTSKAAAPRIPADRLPNHVAIVMDGNGRWATQRGLARTEGHKMGEAVVID
+ IACGAIELGIKWLSLYAFSTENWKRSPEEVRFLMGFNRDVVRRRRDTLKKLGVRIRWV
+ GSRPRLWRSVINELAVAEEMTKSNDVITINYCVNYGGRTEITEATREIAREVAAGRLN
+ PERITESTIARHLQRPDIPDVDLFLRTSGEQRSSNFMLWQAAYAEYIFQDKLWPDYDR
+ RDLWAACEEYASRTRRFGSA"
+ gene complement(2615943..2616740)
+ /gene="reco"
+ /locus_tag="BQ2027_MB2383C"
+ CDS complement(2615943..2616740)
+ /gene="reco"
+ /locus_tag="BQ2027_MB2383C"
+ /note="Mb2383c, -, len: 265 aa. Equivalent to Rv2362c,
+ len: 265 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 265 aa overlap). Conserved
+ hypothetical protein, equivalent to the Mycobacterium
+ leprae proteins Q49754|B1937_F1_25 Hypothetical protein
+ (269 aa), FASTA scores: opt: 1561, E(): 8.5e-93, (86.6%
+ identity in 268 aa overlap); and Q9CCN0|ML0633
+ Hypothetical protein (268 aa), FASTA scores: opt: 1560,
+ E(): 8.5e-93, (86.6% identity in 268 aa overlap). Also
+ highly similar to Q9L2H3|SCC121.13c HYPOTHETICAL 27.1 KDA
+ PROTEIN from Streptomyces coelicolor (251 aa), FASTA
+ scores: opt: 843, E(): 6.9e-47, (52.2% identity in 249 aa
+ overlap); ans similar to other hypothetical proteins. Weak
+ similarity with P42095|RECO_BACSU DNA REPAIR PROTEIN
+ RECOMBINASE from Bacillus subtilis (255 aa), FASTA scores:
+ opt: 270, E(): 3.6e-10, (26.4% identity in 182 aa
+ overlap). Mb2383c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="possible dna repair protein reco"
+ /protein_id="SIU00995.1"
+ /db_xref="GOA:P65984"
+ /db_xref="InterPro:IPR003717"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR022572"
+ /db_xref="InterPro:IPR037278"
+ /db_xref="InterPro:IPR042242"
+ /db_xref="UniProtKB/Swiss-Prot:P65984"
+ /translation="MRLYRDRAVVLRQHKLGEADRIVTLLTRDHGLVRAVAKGVRRTR
+ SKFGARLEPFAHIEVQLHPGRNLDIVTQVVSVDAFATDIVADYGRYTCGCAILETAER
+ LAGEERAPAPALHRLTVGALRAVADGQRPRDLLLDAYLLRAMGIAGWAPALTECARCA
+ TPGPHRAFHIATGGSVCAHCRPAGSTTPPLGVVDLMSALYDGDWEAAEAAPQSARSHV
+ SGLVAAHLQWHLERQLKTLPLVERFYQADRSVAERRAALIGQDIAGG"
+ gene 2616802..2618256
+ /gene="amiA2"
+ /locus_tag="BQ2027_MB2384"
+ CDS 2616802..2618256
+ /gene="amiA2"
+ /locus_tag="BQ2027_MB2384"
+ /note="Mb2384, amiA2, len: 484 aa. Equivalent to Rv2363,
+ len: 484 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 484 aa overlap). Probable amiA2,
+ amidase (EC 3.5.1.4), highly similar or similar to others
+ e.g. O28325|YJ54_ARCFU|AF1954 PUTATIVE AMIDASE from
+ Archaeoglobus fulgidus (453 aa), FASTA scores: opt: 777,
+ E(): 1.1e-38, (35.0% identity in 474 aa overlap);
+ Q55424|AMID_SYNY3|SLL0828 PUTATIVE AMIDASE from
+ Synechocystis sp. strain PCC 6803 (506 aa), FASTA scores:
+ opt: 770, E(): 3e-38, (36.4% identity in 456 aa overlap);
+ Q53116|AMDA ENANTIOMERASE-SELECTIVE AMIDASE from
+ Rhodococcus sp. (462 aa), FASTA scores: opt: 701, E():
+ 3.5e-34, (32.7% identity in 468 aa overlap); etc. Also
+ highly similar to others from Mycobacterium tuberculosis
+ e.g.
+ AMI2_MYCTU|AMIB2|Q11056|Rv1263|MT1301|MTCY50.19c|cy50.19c
+ AMIDASE (462 aa), FASTA scores: opt: 1141, E(): 2.9e-60,
+ (45.4% identity in 454 aa overlap); etc. Contains PS00571
+ Amidases signature, and PS00017 ATP/GTP-binding site motif
+ A (P-loop). BELONGS TO THE AMIDASE FAMILY. Protein product
+ from Mb2384 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb2384 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE AMIDASE AMIA2 (AMINOHYDROLASE)"
+ /protein_id="SIU00996.1"
+ /db_xref="GOA:P63491"
+ /db_xref="InterPro:IPR000120"
+ /db_xref="InterPro:IPR020556"
+ /db_xref="InterPro:IPR023631"
+ /db_xref="InterPro:IPR036928"
+ /db_xref="UniProtKB/Swiss-Prot:P63491"
+ /translation="MVGASGSDAGAISGSGNQRLPTLTDLLYQLATRAVTSEELVRRS
+ LRAIDVSQPTLNAFRVVLTESALADAAAADKRRAAGDTAPLLGIPIAVKDDVDVAGVP
+ TAFGTQGYVAPATDDCEVVRRLKAAGAVIVGKTNTCELGQWPFTSGPGFGHTRNPWSR
+ RHTPGGSSGGSAAAVAAGLVTAAIGSDGAGSIRIPAAWTHLVGIKPQRGRISTWPLPE
+ AFNGVTVNGVLARTVEDAALVLDAASGNVEGDRHQPPPVTVSDFVGIAPGPLKIALST
+ HFPYTGFRAKLHPEILAATQRVGDQLELLGHTVVKGNPDYGLRLSWNFLARSTAGLWE
+ WAERLGDEVTLDRRTVSNLRMGHVLSQAILRSARRHEAADQRRVGSIFDIVDVVLAPT
+ TAQPPPMARAFDRLGSFGTDRAIIAACPSTWPWNLLGWPSINVPAGFTSDGLPIGVQL
+ MGPANSEGMLISLAAELEAVSGWATKQPQVWWTS"
+ gene complement(2618253..2619155)
+ /gene="era"
+ /locus_tag="BQ2027_MB2385C"
+ CDS complement(2618253..2619155)
+ /gene="era"
+ /locus_tag="BQ2027_MB2385C"
+ /note="Mb2385c, era, len: 300 aa. Equivalent to Rv2364c,
+ len: 300 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 300 aa overlap). Probable era,
+ GTP-binding protein, equivalent to
+ Q49768|ERA_MYCLE|ML0631|B1937_F3_102 GTP-BINDING PROTEIN
+ ERA HOMOLOG from Mycobacterium leprae (300 aa) FASTA
+ scores: opt: 1589, E(): 3.4e-88, (81.4% identity in 301 aa
+ overlap). Also highly similar to other GTP-binding
+ proteins e.g. Q9RDF2|ERA_STRCO|SCC77.06 from Streptomyces
+ coelicolor (317 aa), FASTA scores: opt: 1264, E():
+ 1.1e-68, (64.0% identity in 306 aa overlap);
+ Q9KD52|ERA_BACHD|BH1367|BEX from Bacillus halodurans (304
+ aa), FASTA scores: opt: 869, (44.8% identity in 297 aa
+ overlap); Q9KIH7|ERA_LACLA|ERAL from Lactococcus lactis
+ (subsp. lactis) (Streptococcus lactis), and Lactococcus
+ lactis (subsp. cremoris) (Streptococcus cremoris) (303
+ aa), FASTA scores: opt: 781, E(): 9.4e-40, (40.25%
+ identity in 298 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ ERA/TRME FAMILY OF GTP-BINDING PROTEINS, ERA SUBFAMILY.
+ Note that previously known as bex. Protein product from
+ Mb2385c detected using SWATH mass spectrometry. Mb2385c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GTP-BINDING PROTEIN ERA"
+ /protein_id="SIU00997.1"
+ /db_xref="GOA:P0A563"
+ /db_xref="InterPro:IPR004044"
+ /db_xref="InterPro:IPR005225"
+ /db_xref="InterPro:IPR005662"
+ /db_xref="InterPro:IPR006073"
+ /db_xref="InterPro:IPR009019"
+ /db_xref="InterPro:IPR015946"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR030388"
+ /db_xref="UniProtKB/Swiss-Prot:P0A563"
+ /translation="MTEFHSGFVCLVGRPNTGKSTLTNALVGAKVAITSTRPQTTRHA
+ IRGIVHSDDFQIILVDTPGLHRPRTLLGKRLNDLVRETYAAVDVIGLCIPADEAIGPG
+ DRWIVEQLRSTGPANTTLVVIVTKIDKVPKEKVVAQLVAVSELVTNAAEIVPVSAMTG
+ DRVDLLIDVLAAALPAGPAYYPDGELTDEPEEVLMAELIREAALQGVRDELPHSLAVV
+ IDEVSPREGRDDLIDVHAALYVERDSQKGIVIGKGGARLREVGTAARSQIENLLGTKV
+ YLDLRVKVAKNWQRDPKQLGRLGF"
+ gene complement(2619229..2619570)
+ /locus_tag="BQ2027_MB2386C"
+ CDS complement(2619229..2619570)
+ /locus_tag="BQ2027_MB2386C"
+ /note="Mb2386c, -, len: 113 aa. Equivalent to Rv2365c,
+ len: 113 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 113 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ Q49767|ML0630|B1937_F3_101|CAC30138 Hypothetical protein
+ from Mycobacterium leprae (108 aa), FASTA scores: opt:
+ 426, E(): 1.4e-18, (67.9% identity in 106 aa overlap).
+ Also highly similar to Q9RDF3|SCC77.05 from Streptomyces
+ coelicolor (132 aa), FASTA scores: opt: 254, E(): 1.9e-18,
+ (53.1% identity in 96 aa overlap). Equivalent to AAK46728
+ from Mycobacterium tuberculosis strain CDC1551 (93 aa) but
+ longer 20 aa. Protein product from Mb2386c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2386c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein involved in pyrimidine metabolism"
+ /protein_id="SIU00998.1"
+ /db_xref="GOA:A0A1R3Y0Z2"
+ /db_xref="InterPro:IPR016193"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Z2"
+ /translation="MMRRPITLAEQLDAEDAKLVVLARAAMARAEAGAGAAVRDVDGR
+ TYAAAPVALSALELTGLQAAVAAAVSSGATGLQAAVLVAGSVDDPGIAAVRELAPTAA
+ IIVTDRAGNPL"
+ gene complement(2619542..2620849)
+ /locus_tag="BQ2027_MB2387C"
+ CDS complement(2619542..2620849)
+ /locus_tag="BQ2027_MB2387C"
+ /note="Mb2387c, -, len: 435 aa. Equivalent to Rv2366c,
+ len: 435 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 435 aa overlap). Probable conserved
+ transmembrane protein, highly similar to Q9L2L3|SCC117.07
+ PUTATIVE MEMBRANE PROTEIN from Streptomyces coelicolor
+ (358 aa), FASTA scores: opt: 1159, E(): 5.5e-64, (53.0%
+ identity in 353 aa overlap); ans similar to hypothetical
+ proteins and hemolysin-related proteins e.g.
+ Q9HN02|HLP|VNG2308G HEMOLYSIN PROTEIN from Halobacterium
+ sp. strain NRC-1 (457 aa), FASTA scores: opt: 623, E():
+ 6.2e-31, (28.4% identity in 433 aa overlap); etc.
+ Potential transmembrane protein with 2 CBS domains.
+ BELONGS TO THE UPF0053 FAMILY. Protein product from
+ Mb2387c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2387c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU00999.1"
+ /db_xref="GOA:P67131"
+ /db_xref="InterPro:IPR000644"
+ /db_xref="InterPro:IPR002550"
+ /db_xref="InterPro:IPR005170"
+ /db_xref="InterPro:IPR016169"
+ /db_xref="InterPro:IPR036318"
+ /db_xref="UniProtKB/Swiss-Prot:P67131"
+ /translation="MTGYYQLLGSIVLIGLGGLFAAIDAAISTVSPARVDELVRDQRP
+ GAGSLRKVMADRPRYVNLVVLLRTSCEITATALLVVFIRYHFSMVWGLYLAAGIMVLA
+ SFVVVGVGPRTLGRQNAYSISLATALPLRLISWLLMPISRLLVLLGNALTPGRGFRNG
+ PFASEIELREVVDLAQQRGVVAADERRMIESVFELGDTPAREVMVPRTEMIWIESDKT
+ AGQAMTLAVRSGHSRIPVIGENVDDIVGVVYLKDLVEQTFCSTNGGRETTVARVMRPA
+ VFVPDSKPLDALLREMQRDRNHMALLVDEYGAIAGLVSIEDVLEEIVGEIADEYDQAE
+ TAPVEDLGDKRFRVSARLPIEDVGELYGVEFDDDLDVDTVGGLLALELGRVPLPGAEV
+ ISHGLRLHAEGGTDHRGRVRIGTVLLSPAEPDGADDEEADHPG"
+ gene complement(2620846..2621394)
+ /gene="ybeY"
+ /locus_tag="BQ2027_MB2388C"
+ CDS complement(2620846..2621394)
+ /gene="ybeY"
+ /locus_tag="BQ2027_MB2388C"
+ /note="Mb2388c, -, len: 182 aa. Equivalent to Rv2367c,
+ len: 182 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 182 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ Q49752|YN67_MYCLE|ML0628|B1937_F1_21 HYPOTHETICAL 19.8 KDA
+ PROTEIN from Mycobacterium leprae (178 aa), FASTA scores:
+ opt: 1051, E(): 2e-59, (89.1% identity in 175 aa overlap).
+ Also highly similar to others e.g. Q9L2L4|SCC117.06
+ CONSERVED HYPOTHETICAL PROTEIN from Streptomyces
+ coelicolor (165 aa), FASTA scores: opt: 599, E(): 6e-31,
+ (56.5% identity in 154 aa overlap); Q9KD56|BH1363
+ HYPOTHETICAL PROTEIN from Bacillus halodurans (159 aa),
+ FASTA scores: opt: 311, E(): 8.3e-13, (45.05% identity in
+ 111 aa overlap); etc. Protein product from Mb2388c
+ detected using shotgun mass spectrometry. Mb2388c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Metal-dependent hydrolase YbeY, involved in rRNA
+ and/or ribosome maturation and assembly"
+ /protein_id="SIU01000.1"
+ /db_xref="GOA:P67135"
+ /db_xref="InterPro:IPR002036"
+ /db_xref="InterPro:IPR020549"
+ /db_xref="InterPro:IPR023091"
+ /db_xref="UniProtKB/Swiss-Prot:P67135"
+ /translation="MREHLMSIEVANESGIDVSEAELVSVARFVIAKMDVNPCAELSM
+ LLLDTAAMADLHMRWMDLPGPTDVMSFPMDELEPGGRPDAPEPGPSMLGDIVLCPEFA
+ AEQAAAAGHSLGHELALLTIHGVLHLLGYDHAEPDEEKEMFALQDRLLEEWVADQVEA
+ YQHDRQDEKDRRLLDKSRYFDL"
+ gene complement(2621398..2622456)
+ /gene="phoH1"
+ /locus_tag="BQ2027_MB2389C"
+ CDS complement(2621398..2622456)
+ /gene="phoH1"
+ /locus_tag="BQ2027_MB2389C"
+ /note="Mb2389c, phoH1, len: 352 aa. Equivalent to Rv2368c,
+ len: 352 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 352 aa overlap). Probable phoH1,
+ phoH-like protein (phosphate starvation-induced protein),
+ probably ATP-binding protein, equivalent to
+ Q49751|PHOL_MYCLE| ML0627|B1937_F1_20 PHOH-LIKE PROTEIN
+ from Mycobacterium leprae (349 aa), FASTA scores: opt:
+ 1952, E(): 4.7e-107, (88.9% identity in 352 aa overlap).
+ Also highly similar to Q9L2L5|SCC117.05 PHOH-LIKE PROTEIN
+ from Streptomyces coelicolor (359 aa), FASTA scores: opt:
+ 1407, E(): 3.6e-75, (63.6% identity in 349 aa overlap);
+ Q9RSY1|DR1988 PHOH-RELATED PROTEIN from Deinococcus
+ radiodurans (380 aa), FASTA scores: opt: 1053, E():
+ 1.9e-54, (53.3% identity in 349 aa overlap);
+ Q9KD58|PHOH|BH1361 PHOSPHATE STARVATION-INDUCED PROTEIN
+ from Bacillus halodurans (320 aa), FASTA scores: opt:
+ 1019, E(): 1.6e-52, (54.35% identity in 300 aa overlap);
+ P46343|PHOL_BACSU PHOH-LIKE PROTEIN from Bacillus subtilis
+ (319 aa), FASTA scores: opt: 1014, E(): 3.2e-52, (50.8%
+ identity in 303 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE PHOH
+ FAMILY. Note that previously known as phoH. Protein
+ product from Mb2389c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2389c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE PHOH-LIKE PROTEIN PHOH1 (PHOSPHATE
+ STARVATION-INDUCIBLE PROTEIN PSIH)"
+ /protein_id="SIU01001.1"
+ /db_xref="GOA:P0A5S1"
+ /db_xref="InterPro:IPR003714"
+ /db_xref="InterPro:IPR004087"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR036612"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5S1"
+ /translation="MTSRETRAADAAGARQADAQVRSSIDVPPDLVVGLLGSADENLR
+ ALERTLSADLHVRGNAVTLCGEPADVALAERVISELIAIVASGQSLTPEVVRHSVAML
+ VGTGNESPAEVLTLDILSRRGKTIRPKTLNQKRYVDAIDANTIVFGIGPAGTGKTYLA
+ MAKAVHALQTKQVTRIILTRPAVEAGERLGFLPGTLSEKIDPYLRPLYDALYDMMDPE
+ LIPKLMSAGVIEVAPLAYMRGRTLNDAFIVLDEAQNTTAEQMKMFLTRLGFGSKVVVT
+ GDVTQIDLPGGARSGLRAAVDILEDIDDIHIAELTSVDVVRHRLVSEIVDAYARYEEP
+ GSGLNRAARRASGARGRR"
+ gene complement(2622428..2622730)
+ /locus_tag="BQ2027_MB2390C"
+ CDS complement(2622428..2622730)
+ /locus_tag="BQ2027_MB2390C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2390c, -, len: 100 aa. Equivalent to Rv2369c,
+ len: 100 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 100 aa overlap). Hypothetical unknown
+ protein. Mb2390c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU01002.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y116"
+ /translation="MIVGLADRHGHGRDVAAHRQAQLAGPRVAAVRRHRTGGHRQASS
+ RIKVSAHGLGVVRCAPTPSLTGVRMKLQHSSVRQVPVDRPESRHQKPGDVPRDPRC"
+ gene complement(2622727..2624040)
+ /locus_tag="BQ2027_MB2391C"
+ CDS complement(2622727..2624040)
+ /locus_tag="BQ2027_MB2391C"
+ /note="Mb2391c, -, len: 437 aa. Equivalent to Rv2370c,
+ len: 437 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 437 aa overlap). Conserved
+ hypothetical protein, member of family proteins from
+ Mycobacterium tuberculosis with Rv1453|MTCY493_01c|O06807
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium
+ tuberculosis (432 aa), FASTA scores: opt: 1943, E():
+ 9.4e-115, (69.9% identity in 409 aa overlap);
+ Rv1194c|MTCI364.06c; etc. Also similar to AAK45764|MT1500
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium
+ tuberculosis strain CDC1551 (432 aa), FASTA scores: opt:
+ 1934, E(): 9.4e-115, (69.9% identity in 409 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="Possible regulatory protein Trx"
+ /protein_id="SIU01003.1"
+ /db_xref="InterPro:IPR025736"
+ /db_xref="InterPro:IPR041522"
+ /db_xref="InterPro:IPR042070"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Y6"
+ /translation="MVLPKPTPRGRELIRQAAKVALHPTPEWLDELDRATLAAHPSIA
+ ADPALATVVSRANRSHLIHFATANLRKPGQPVPANLGPDPLRMARDLVRRGLDASALD
+ VYRVGQNVAWQRWTEIAFGLTTDPQELHELLTLPFRSASEFIDATLAGLAAQMQLEYD
+ ELTRDVHAEHRRIVELILDGAPISRQSAEAKLGYPLDRSHTAAIIWYDDPDDNQNHLD
+ HTARAFGRALGCPQPLIAVASAATRWVWVSDAATLDTDRIHQVLDHAPHARIAVGTTA
+ RGIDGFRRSHRDALATQRMLARLRSQQRLAFFADIHMIAVLTENPDSAADFITSTLGD
+ LESASPQLLTTVLTYINEQCNASRAAHVLHTHRNTLLRRLETAQRLLPRPLDHTIIQV
+ AVAISALQWRGSQTSDPVETPVEGITSPPPESLGRRRSRLAQLER"
+ gene 2624235..2624420
+ /gene="PE_PGRS40"
+ /locus_tag="BQ2027_MB2392"
+ CDS 2624235..2624420
+ /gene="PE_PGRS40"
+ /locus_tag="BQ2027_MB2392"
+ /note="Mb2392, PE_PGRS40, len: 61 aa. Equivalent to
+ Rv2371, len: 61 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100.0% identity in 61 aa overlap). Short protein,
+ member of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to
+ N-terminal part of others e.g. AAK44356|MT0132 PE_PGRS
+ FAMILY PROTEIN from Mycobacterium tuberculosis strain
+ CDC1551 (561 aa), FASTA scores: opt: 217, E(): 4.9e-08,
+ (69.65% identity in 56 aa overlap); etc. Mb2392 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs40"
+ /protein_id="SIU01004.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y370"
+ /translation="MSLVSVAPELVVTAVPDVARIGSSIGAPDTAAAARPTTSVLAAG
+ ADEVSADVVALFGWVAR"
+ gene complement(2624519..2625307)
+ /gene="rsmE"
+ /locus_tag="BQ2027_MB2393C"
+ CDS complement(2624519..2625307)
+ /gene="rsmE"
+ /locus_tag="BQ2027_MB2393C"
+ /EC_number="2.1.1.193"
+ /note="Mb2393c, -, len: 262 aa. Equivalent to Rv2372c,
+ len: 262 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 262 aa overlap). Conserved
+ hypothetical protein, equivalent to Q9CCN1|ML0626
+ HYPOTHETICAL PROTEIN from Mycobacterium leprae (257 aa),
+ FASTA scores: opt: 1277, E(): 3e-71, (77.25% identity in
+ 255 aa overlap). Also highly similar to others e.g.
+ Q9RDD9|SDRD HYPOTHETICAL 26.1 KDA PROTEIN from
+ Streptomyces coelicolor (249 aa), FASTA scores: opt: 624,
+ E(): 3.2e-31, (45.05% identity in 253 aa overlap);
+ P54461|YQEU_BACSU hypothetical 28.8 kd protein from
+ Bacillus subtilis (256 aa), FASTA scores: opt: 375, E():
+ 6e-16, (32.5% identity in 234 aa overlap); etc. C-terminal
+ half highly similar to Q49763|B1937_F2_57 from
+ Mycobacterium leprae (128 aa), FASTA scores: opt: 577,
+ E(): 1.4e-28, (75.8% identity in 124 aa overlap). BELONGS
+ TO THE UPF0088 FAMILY. Protein product from Mb2393c
+ detected using SWATH mass spectrometry. Mb2393c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="16S rRNA (uracil(1498)-N(3))-methyltransferase
+ (EC"
+ /protein_id="SIU01005.1"
+ /db_xref="GOA:P67203"
+ /db_xref="InterPro:IPR006700"
+ /db_xref="InterPro:IPR015947"
+ /db_xref="InterPro:IPR029026"
+ /db_xref="InterPro:IPR029028"
+ /db_xref="UniProtKB/Swiss-Prot:P67203"
+ /translation="MVAMLFYVDTLPDTGAVAVVDGDEGFHAATVRRIRPGEQLVLGD
+ GVGRLARCVVEQAGRGGLRARVLRRWSVPPVRPPVTVVQALPKSERSELAIELATEAG
+ ADAFLAWQAARCVANWDGARVDKGLRRWRAVVRSAARQSRRARIPPVDGVLSTPMLVQ
+ RVREEVAAGAAVLVLHEEATERIVDIAAAQAGSLMLVVGPEGGIAPDELAALTDAGAV
+ AVRLGPTVLRTSTAAAVALGAVGVLTSRWDASASDCEYCDVTRR"
+ gene complement(2625321..2626469)
+ /gene="dnaJ2"
+ /locus_tag="BQ2027_MB2394C"
+ CDS complement(2625321..2626469)
+ /gene="dnaJ2"
+ /locus_tag="BQ2027_MB2394C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2394c, dnaJ2, len: 382 aa. Equivalent to Rv2373c,
+ len: 382 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 382 aa overlap). Probable dnaJ2,
+ chaperone protein, equivalent to
+ Q49762|DNJ2_MYCLE|ML0625|B1937_F2_56 CHAPERONE PROTEIN
+ from Mycobacterium leprae (378 aa), FASTA scores: opt:
+ 2301, E(): 1.7e-120, (87.5% identity in 382 aa overlap).
+ Also highly similar to OTHER CHAPERONE PROTEINS DNAJ/DNAJ2
+ e.g. Q9RDD7|DNJ2_STRCO|SCC77.21c from Streptomyces
+ coelicolor (378 aa), FASTA scores: opt: 1456, E():
+ 1.2e-73, (54.8% identity in 385 aa overlap);
+ O52164|DNJ2_STRAL from Streptomyces albus (379 aa) FASTA
+ scores: opt: 1378, E(): 2.6e-69, (52.2% identity in 385 aa
+ overlap); Q9S5A3|DNAJ_LISMO from Listeria monocytogenes
+ (377 aa), FASTA scores: opt: 1013, E(): 4.6e-49, (41.3%
+ identity in 385 aa overlap); etc. Also similar to
+ Rv0352|MTCY13E10.12 from Mycobacterium tuberculosis.
+ Contains 1 J domain and 1 CR domain. BELONGS TO THE DNAJ
+ FAMILY. Protein product from Mb2394c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2394c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CHAPERONE PROTEIN DNAJ2"
+ /protein_id="SIU01006.1"
+ /db_xref="GOA:P63967"
+ /db_xref="InterPro:IPR001305"
+ /db_xref="InterPro:IPR001623"
+ /db_xref="InterPro:IPR002939"
+ /db_xref="InterPro:IPR008971"
+ /db_xref="InterPro:IPR012724"
+ /db_xref="InterPro:IPR036410"
+ /db_xref="InterPro:IPR036869"
+ /db_xref="UniProtKB/Swiss-Prot:P63967"
+ /translation="MARDYYGLLGVSKNASDADIKRAYRKLARELHPDVNPDEAAQAK
+ FKEISVAYEVLSDPDKRRIVDLGGDPLESAAAGGNGFGGFGGLGDVFEAFFGGGFGGG
+ AASRGPIGRVRPGSDSLLRMRLDLEECATGVTKQVTVDTAVLCDRCQGKGTNGDSVPI
+ PCDTCGGRGEVQTVQRSLLGQMLTSRPCPTCRGVGVVIPDPCQQCMGDGRIRARREIS
+ VKIPAGVGDGMRVRLAAQGEVGPGGGPAGDLYVEVHEQAHDVFVREGDHLHCTVSVPM
+ VDAALGVTVTVDAILDGLSEITIPPGTQPGSVITLRGRGMPHLRSNTRGDLHVHVEVV
+ VPTRLDHQDIELLRELKGRRDREVAEVRSTHAAAGGLFSRLRETFTGR"
+ gene complement(2626544..2627575)
+ /gene="hrcA"
+ /locus_tag="BQ2027_MB2395C"
+ CDS complement(2626544..2627575)
+ /gene="hrcA"
+ /locus_tag="BQ2027_MB2395C"
+ /note="Mb2395c, hrcA, len: 343 aa. Equivalent to Rv2374c,
+ len: 343 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 343 aa overlap). Probable hrcA,
+ heat-inducible transcriptional repressor, equivalent to
+ Q9CCN2|HRCA|ML0624 PUTATIVE HEAT-INDUCIBLE TRANSCRIPTIONAL
+ REGULATOR from Mycobacterium leprae (343 aa), FASTA
+ scores: opt: 1926, E(): 3.9e-107, (89.8% identity in 343
+ aa overlap). Also highly similar to other heat-inducible
+ transcription repressor proteins e.g.
+ Q9RDD6|HRCA|SCC77.22c from Streptomyces coelicolor (338
+ aa), FASTA scores: opt: 1227, E(): 1.1e-65, (58.8%
+ identity in 335 aa overlap); O52163|HRCA_STRAL from
+ Streptomyces albus (338 aa), FASTA scores: opt: 1196, E():
+ 7.7e-64, (56.1% identity in 335 aa overlap);
+ P25499|HRCA_BACSU HEAT-INDUCIBLE TRANSCRIPTION REPRESSOR
+ from Bacillus subtilis (343 aa), FASTA scores: opt: 538,
+ E(): 8.4e-25, (28.9% identity in 325 aa overlap); etc.
+ Almost identical, but conflict at C-terminus, to
+ Q49749|YGRP|B1937_F1_18 PUTATIVE HEAT-INDUCIBLE
+ TRANSCRIPTION REPRESSOR from Mycobacterium leprae (197 aa)
+ FASTA scores: opt: 1126, E(): 6.9e-60, (91.8% identity in
+ 195 aa overlap). BELONGS TO THE HRCA FAMILY. Protein
+ product from Mb2395c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2395c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable heat shock protein transcriptional
+ repressor hrca"
+ /protein_id="SIU01007.1"
+ /db_xref="GOA:P64399"
+ /db_xref="InterPro:IPR002571"
+ /db_xref="InterPro:IPR021153"
+ /db_xref="InterPro:IPR023120"
+ /db_xref="InterPro:IPR029016"
+ /db_xref="InterPro:IPR036388"
+ /db_xref="InterPro:IPR036390"
+ /db_xref="UniProtKB/Swiss-Prot:P64399"
+ /translation="MGSADERRFEVLRAIVADFVATQEPIGSKSLVERHNLGVSSATV
+ RNDMAVLEAEGYITQPHTSSGRVPTEKGYREFVDRLEDVKPLSSAERRAIQSFLESGV
+ DLDDVLRRAVRLLAQLTRQVAVVQYPTLSTSTVRHLEVIALTPARLLMVVITDSGRVD
+ QRIVELGDVIDDHQLAQLREILGQALEGKKLSAASVAVADLASQLGGAGGLGDAVGRA
+ ATVLLESLVEHTEERLLLGGTANLTRNAADFGGSLRSILEALEEQVVVLRLLAAQQEA
+ GKVTVRIGHETASEQMVGTSMVSTAYGTAHTVYGGMGVVGPTRMDYPGTIASVAAVAL
+ YIGDVLGAR"
+ gene 2627747..2628064
+ /locus_tag="BQ2027_MB2396"
+ CDS 2627747..2628064
+ /locus_tag="BQ2027_MB2396"
+ /note="Mb2396, -, len: 105 aa. Equivalent to Rv2375, len:
+ 105 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 105 aa overlap). Conserved
+ hypothetical protein, highly similar to only
+ CAC32314|2SCD60.09c CONSERVED HYPOTHETICAL PROTEIN from
+ Streptomyces coelicolor (98 aa), FASTA scores: opt: 425,
+ E(): 5.7e-24, (63.25% identity in 98 aa overlap). Protein
+ product from Mb2396 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2396 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Transcription regulator of the Arc/MetJ class"
+ /protein_id="SIU01008.1"
+ /db_xref="InterPro:IPR014447"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Z8"
+ /translation="MIFKGVREGKPYPEHGLSYRDWSQIPPQQIRLDELVTTTTVLAL
+ DRLLSEDSTFYGDLFPHAVKWRGTTYLEDGLHRAVRAALRNRTVLHARVFDMDASPGG
+ RRS"
+ gene complement(2628091..2628597)
+ /gene="cfp2"
+ /locus_tag="BQ2027_MB2397C"
+ CDS complement(2628091..2628597)
+ /gene="cfp2"
+ /locus_tag="BQ2027_MB2397C"
+ /standard_name="mtb12"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2397c, cfp2, len: 168 aa. Equivalent to Rv2376c,
+ len: 168 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 168 aa overlap). cfp2 (alternate gene
+ name: mtb12), low molecular weight antigen, secreted
+ protein similar to Q49771|MB12_MYCLE|ML0620|B1937_F3_91
+ LOW MOLECULAR WEIGHT ANTIGEN MTB12 HOMOLOG PRECURSOR from
+ Mycobacterium leprae (167 aa), FASTA scores: opt: 682,
+ E(): 1.7e-32, (65.5% identity in 165 aa overlap). BELONGS
+ TO THE MTB12 FAMILY. Protein product from Mb2397c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2397c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="LOW MOLECULAR WEIGHT ANTIGEN CFP2 (LOW MOLECULAR
+ WEIGHT PROTEIN ANTIGEN 2) (CFP-2)"
+ /protein_id="SIU01009.1"
+ /db_xref="GOA:P0A5P9"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5P9"
+ /translation="MKMVKSIAAGLTAAAAIGAAAAGVTSIMAGGPVVYQMQPVVFGA
+ PLPLDPASAPDVPTAAQLTSLLNSLADPNVSFANKGSLVEGGIGGTEARIADHKLKKA
+ AEHGDLPLSFSVTNIQPAAAGSATADVSVSGPKLSSPVTQNVTFVNQGGWMLSRASAM
+ ELLQAAGN"
+ gene complement(2628697..2628912)
+ /gene="mbtH"
+ /locus_tag="BQ2027_MB2398C"
+ CDS complement(2628697..2628912)
+ /gene="mbtH"
+ /locus_tag="BQ2027_MB2398C"
+ /note="Mb2398c, mbtH, len: 71 aa. Equivalent to Rv2377c,
+ len: 71 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (98.6% identity in 71 aa overlap). Putative mbtH,
+ conserved protein with no function assigned (see first and
+ second citation), similar to hypothetical proteins or
+ proteins found in several gene clusters for biosynthesis
+ or transport of siderophores and other nonribosomally
+ synthesized peptides e.g. Q9Z388|SCE8.11c PUTATIVE SMALL
+ CONSERVED HYPOTHETICAL PROTEIN from Streptomyces
+ coelicolor (71 aa), FASTA scores: opt: 345, E(): 1.4e-19,
+ (68.2% identity in 66 aa overlap); Q9F8V3|CUMB COUY
+ PROTEIN (probably involved in the biosynthesis of
+ aminocoumarin antibiotic coumermycin A(1)) (see third
+ citation below) from Streptomyces rishiriensis (71 aa),
+ FASTA scores: opt: 329, E(): 2.2e-18, (63.2% identity in
+ 68 aa overlap); Q9F5J2|SIM-CB MBTH-LIKE PROTEIN (probably
+ protein involved in the biosynthesis of aminocoumarin
+ antibiotic coumermycin A(1)) from Streptomyces
+ antibioticus (70 aa), FASTA scores: opt: 308, E():
+ 8.4e-17, (65.6% identity in 64 aa overlap); Q9FB14
+ MBTH-LIKE PROTEIN (involved in the biosynthesis of the
+ antitumor drug bleomycin) (see fourth citation below) from
+ Streptomyces verticillus FASTA scores: opt: 220, E():
+ 8.8e-10, (41.2% identity in 68 aa overlap); etc. Protein
+ product from Mb2398c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2398c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="MbtH-like NRPS chaperone => MbtH"
+ /protein_id="SIU01010.1"
+ /db_xref="InterPro:IPR005153"
+ /db_xref="InterPro:IPR037407"
+ /db_xref="InterPro:IPR038020"
+ /db_xref="UniProtKB/Swiss-Prot:P59965"
+ /translation="MSTNPFDDDNGAFFVLVNDEDQHSLWPVFADIPAGWRVVHGEAS
+ RAACLDYVEKNWTDLRPKSLRDAMAED"
+ gene complement(2628890..2630185)
+ /gene="mbtG"
+ /locus_tag="BQ2027_MB2399C"
+ CDS complement(2628890..2630185)
+ /gene="mbtG"
+ /locus_tag="BQ2027_MB2399C"
+ /note="Mb2399c, mbtG, len: 431 aa. Equivalent to Rv2378c,
+ len: 431 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 431 aa overlap). mbtG, lysine-N
+ -oxygenase (hydroxylase) (EC 1.14.13.59) showing some
+ similarity with various proteins including ornithine and
+ lysine-N-oxygenases, e.g. Q9K6Q1|TRKA|BH3677 POTASSIUM
+ UPTAKE PROTEIN from Bacillus halodurans (350 aa), FASTA
+ scores: opt: 153, E(): 0.016, (25.2% identity in 246 aa
+ overlap); P56584|SID1_USTMA L-ORNITHINE 5-MONOOXYGENASE
+ (EC 1.13.12.-) from Ustilago maydis (Smut fungus) (570
+ aa), FASTA scores: opt: 136, E(): 0.31, (22.85% identity
+ in 127 aa overlap); Q9HHV0|HXYA|VNG6214G MONOOXYGENASE
+ from Halobacterium sp. strain NRC-1 (477 aa), FASTA
+ scores: opt: 119, E(): 3.4, (40.0% identity in 70 aa
+ overlap); O69828|SC1A6.23 PUTATIVE LYSINE N-HYDROXLASE
+ (FRAGMENT) from Streptomyces coelicolor (134 aa), BLAST
+ score: 76 (similarity in part for this one); etc.
+ COFACTORS: FAD (BY SIMILARITY). Protein product from
+ Mb2399c detected using SWATH mass spectrometry. Mb2399c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="LYSINE-N-OXYGENASE MBTG (L-LYSINE
+ 6-MONOOXYGENASE) (LYSINE N6-HYDROXYLASE)"
+ /protein_id="SIU01011.1"
+ /db_xref="GOA:Q7TYQ9"
+ /db_xref="InterPro:IPR025700"
+ /db_xref="InterPro:IPR036188"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYQ9"
+ /translation="MNPTLAVLGAGAKAVAVAAKASVLRDMGVDVPDVIAVERIGVGA
+ NWQASGGWTDGAHRLGTSPEKDVGFPYRSALVPRRNAELDERMTRYSWQSYLIATASF
+ AEWIDRGRPAPTHRRWSQYLAWVADHIGLKVIHGEVERLAVTGDRWALCTHETTVQAD
+ ALMITGPGQAEKSLLPGNPRVLSIAQFWDRAAGHDRINAERVAVIGGGETAASMLNEL
+ FRHRVSTITVISPQVTLFTRGEGFFENSLFSDPTDWAALTFDERRDALARTDRGVFSA
+ TVQEALLADDRIHHLRGRVAHAVGRQGQIRLTLSTNRGSENFETVHGFDLVIDGSGAD
+ PLWFTSLFSQHTLDLLELGLGGPLTADRLQEAIGYDLAVTDVTPKLFLPTLSGLTQGP
+ GFPNLSCLGLLSDRVLGAGIFTPTKHNDTRRSGEHQSFR"
+ gene complement(2630182..2634567)
+ /gene="mbtF"
+ /locus_tag="BQ2027_MB2400C"
+ CDS complement(2630182..2634567)
+ /gene="mbtF"
+ /locus_tag="BQ2027_MB2400C"
+ /note="Mb2400c, mbtF, len: 1461 aa. Equivalent to Rv2379c,
+ len: 1461 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 1461 aa overlap). mbtF, peptide
+ synthetase (see citations below), similar in part to
+ several synthases e.g. O52820|PCZA363.4 PROTEIN from
+ Amycolatopsis orientalis (4077 aa), FASTA scores: opt:
+ 1873, E(): 1.1e-99, (35.55% identity in 1522 aa overlap);
+ O07944|SNBDE PRISTINAMYCIN I SYNTHASE 3 AND 4 from
+ Streptomyces pristinaespiralis (4848 aa), FASTA scores:
+ opt: 1817, E(): 2.1e-96, (33.65% identity in 1463 aa
+ overlap); O52821 PROTEIN SIMILAR TO PEPTIDE SYNTHETASE
+ from Amycolatopsis orientalis (1860 aa) FASTA scores: opt:
+ 1705, E(): 2.9e-90, (34.75% identity in 1344 aa overlap);
+ Q9XCF2|PSTB PUTATIVE PEPTIDE SYNTHETASE (similar to
+ Mycobacterium tuberculosis nrp protein) from Mycobacterium
+ avium (2552 aa), FASTA scores: opt: 1687, E(): 4e-89,
+ (35.45% identity in 1058 aa overlap); Q9ZET7 PEPTIDE
+ SYNTHETASE (FRAGMENT) from Mycobacterium smegmatis (1438
+ aa), FASTA scores: opt: 1479, E(): 2.5e-77, (30.45%
+ identity in 1507 aa overlap); etc. Contains PS00455
+ putative AMP-binding domain signature. BELONGS TO THE
+ ATP-DEPENDENT AMP-BINDING ENZYME FAMILY. Protein product
+ from Mb2400c detected using SWATH mass spectrometry.
+ Mb2400c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PEPTIDE SYNTHETASE MBTF (PEPTIDE SYNTHASE)"
+ /protein_id="SIU01012.1"
+ /db_xref="GOA:A0A1R3Y126"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR001242"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR010071"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR023213"
+ /db_xref="InterPro:IPR025110"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y126"
+ /translation="MGPVAVTRADARGAIDDVMALSPLQQGLFSRATLVAAESGSEAA
+ EADPYVIAMAADAAGPLDIALLRDCAAAMLTRHPNLRASFLHGNLSRPVQVIPSSAEV
+ LWRHVRAHPSEVGALAAEERRRRFDVGRGPLIRFLLIELPDECWHLVIVAHHIVIDGW
+ SLPLFVSELLALYRAGGHVAALPAAPRPYRDYIGWLAGRDQTASRAMWADHLNGLDGP
+ TLLSPALADTPVQPGIPGRTEVRLDREATAELADAARTRGVTISTLVQMAWATTLSAF
+ TGRGDVTFGVTVSGRPSELSGVETMIGLFINTVPLRVRLDARATVGGQCAVLQRQFAM
+ LRDHSYLGFNEFRAIAGIGEMFDTLLVYENFPPGEVVGTAEFVANGVTFRPVALESLS
+ HFPVTVAAHRSTGELTLLVEVLDGALGTMAPESLGRRVLAVLQRLVSRWDRPLRDVDI
+ LLDGEHDPTAPGLPDVTTSAPAVHTRFAEIAAAQPDSVAVSWADGQLTYRELDALADR
+ LATGLRRADVSRETPVAVALSRGPRYVAAMLAVLKAGGMIVPLDPAMPGERVAEILRQ
+ TSAPVVIDEGVFAASVGADILEDDRAITVPVDQAAYVIFTSGTTGTPKGVIGTHRALS
+ AYADDHIERVLRPAAQRLGRPLRIAHAWSFTFDAAWQPLVALLDGHAVHIVDDHRQRD
+ AGALVEAIDRFGLDMIDTTPSMFAQLHNAGLLDRAPLAVLALGGEALGAATWRMIQQN
+ CARTAMTAFNCYGPTETTVEAVVAAVAEHARPVIGRPTCTTRAYVMDSWLRPVPDGVA
+ GELYLAGAQLTRGYLGRPAETAARFVAEPNGRGSRMYRTGDVVRRLPDGGLEFLGRSD
+ DQVKIRGFRVEPGEIAAVLNGHHAVHGCHVTARGHASGPRLTAYVAGGPQPPPVAELR
+ AMLLERLPRYLVPHHIVVLDELPLTPHGKIDENALAAINVTEGPATPPQTPTELVLAE
+ AFADVMETSNVDVTAGFLQMGLDSIVALSVVQAARRRGIALRARLMVECDTIRELAAA
+ IDSDAAWQAPANDAGEPIPVLPNTHWLYEYGDPRRLAQTEVIRLPDRITRERLDAVLA
+ AVVDGHEVLRCRFDRDAMALVAQPKTDILSEVWVSGELVTAVAEQTLGVLASLDPQAG
+ RLLSAVWLREPDGPGVLVLTAHVLAMDPASWRIVLGELDAGLHALAAGRAPSPARENT
+ SYRQWSRLLAQRAKALDSVDFWVAELEGADPPLGARRVAPQTDRVGELAITMSISDAD
+ LTARLLSTGRSMTDLLATAAARMVTAWRRQRGQQTPAPLLALETHGRADVHVDKTADT
+ SDTVGLLSAIYPLRIHCDGATDFARIPGSGIDYGLLRYLRADTAERLRAHREPQLLLN
+ YLGSLHVGVGDLAVDRALLADVGQLPEPEQPVRHELTVLAALLGPADAPVLATRWRTL
+ PDILSADDVATLQSLWQGALAEITA"
+ gene complement(2634549..2639597)
+ /gene="mbtE"
+ /locus_tag="BQ2027_MB2401C"
+ CDS complement(2634549..2639597)
+ /gene="mbtE"
+ /locus_tag="BQ2027_MB2401C"
+ /note="Mb2401c, mbtE, len: 1682 aa. Equivalent to Rv2380c,
+ len: 1682 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100.0% identity in 1682 aa overlap). mbtE, peptide
+ synthetase (see citations below), similar in part to
+ several synthases e.g. O07944|SNBDE PRISTINAMYCIN I
+ SYNTHASE 3 AND 4 from Streptomyces pristinaespiralis (4848
+ aa), FASTA scores: opt: 2635, E(): 1.9e-146, (36.8%
+ identity in 1657 aa overlap); O05647|SNBDE VIRGINIAMYCIN S
+ SYNTHETASE (FRAGMENT) from Streptomyces virginiae (1997
+ aa) FASTA scores: opt: 2580, E(): 1.6e-143, (40.65%
+ identity in 1163 aa overlap); Q9R9I2|DHBF PROTEIN INVOLVED
+ IN SIDEROPHORE PRODUCTION from Bacillus subtilis (2378
+ aa), FASTA scores: opt: 2388, E(): 3.6e-132, (33.9%
+ identity in 1579 aa overlap); O68487|ACMB ACTINOMYCIN
+ SYNTHETASE II from Streptomyces chrysomallus (2611 aa),
+ FASTA scores: opt: 2165, E(): 4.9e-119, (35.0% identity in
+ 1634 aa overlap); etc. Equivalent to AAK46743 from
+ Mycobacterium tuberculosis strain CDC1551 (1787 aa) but
+ shorter 105 aa. Contains PS00455 putative AMP-binding
+ domain signature, and PS00012 Phosphopantetheine
+ attachment site. BELONGS TO THE ATP-DEPENDENT AMP-BINDING
+ ENZYME FAMILY. Protein product from Mb2401c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2401c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PEPTIDE SYNTHETASE MBTE (PEPTIDE SYNTHASE)"
+ /protein_id="SIU01013.1"
+ /db_xref="GOA:A0A1R3Y0Z1"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR001242"
+ /db_xref="InterPro:IPR006162"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR010071"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR023213"
+ /db_xref="InterPro:IPR025110"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Z1"
+ /translation="MWFVQMADPSGALLNICVSYRITGDIDLARLRDAVNAVARRHRI
+ LRTTYPVGDDGVAQPTVHADLRPGWTQYDLTDLSQRAQRLRLEVLAQREFCAPFELSR
+ DAPLRITVVRTAADEHVLLLVAHHIAWDDGSWRVFFTDLTQAYSRADLGADLGPEHRP
+ SAASGPDTTEADLNYWRAIMADPPEPLELPGPAGTCVPTSWRAARATLRLPADTAARV
+ ATMAKNTGCTPYMVLLAAFGALVHRYTHSDDFLVAAPVLNRGAGTEDAIGYFGNTVAM
+ RLRPQSAMSFRELLTATRDIASGAFAHQRINLDRVVRELNPDRRHGAERMTRVSFGFR
+ EPDGGGFNPPGIECERYDLRSNITQLPLGFMVEFDRAGVLVEAEHLVEILEPALAKQM
+ LRHFGVLLDNALAAPDNTLSGLALMDERDAARLREVSRGERFDTPVKTLVDLVNEQTT
+ RTPDATAVVYEGQHFTYHDLNEASNRLGHWLIEQGIGSEDRVAVLLDKSPDLIVTALG
+ VVKSGAVYVPVDPSYPQDRLDFILADCDAKLVLRTPVRELAGYRSDDPTDADRIRPLR
+ PDNTAYLIYTSGTTGLPKGVAVPHRPVAEYFVWFKGEYDVDDTDRLLQVASPSFDVSI
+ AEIFGTLACGARMVIPRPGGLTDIGYLTALLRDEGITAMHFVPSLLGLFLSLPGVSQW
+ RTLQRVPIGGEPLPGEVADKFHATFDALLHNFYGPTETVINASRFKVVGPQGTRIVPI
+ GRPKINTTMHLLDDSLQPVPTGVIGEIYIGGTHVAYGYHRRAGLTAERFVADPFNPGS
+ RMYRSGDLARRNADGDIEFVGRADEQVKIRGFRIELGDVAAAIAVDPTVGQAVVVVSD
+ LPRLGKSLVGYVTPAAGGDGPADVGVDLDRIRARVAAALPEYMLPAAYVVLDEIPITA
+ HGKIDRAALPEPQIASDTEFRAPQTATERRLAQLFGELLGRDRVGADDSFFDLGGHSL
+ LATKLVAAVRNAFGVDVGVREIFEFATVTALAGHIDTLDSDSARPRLTRVDHDGPVRL
+ SSSQMRSWFNYRFDGPNAVNNIPFAAALHGPCDTNAFAAAITDVVARHEILRTVYREI
+ GGVPHQIIQPPAEVPVRCAAGSDAAWLRAELNNERGYVFDLETDWPIRAALLSTPEQT
+ VLSLVVHHIAGDHWSAGVLFTDLLTAYRARSTGQRPSWAPLPVQYADYSVWQSALLDD
+ GAGIVGPQRDYWIRQLGGLAGETGLRPDFPRPALLSGAGDAVEFRLGAAIRDKLAAVS
+ RDLGVTEFMLLQAAVAVVLHKAGGGVDVPIGAPVAGRSEANLDQLIGFFINIVVLRND
+ LRGNPTLREVLQRTRQMALAAYAHQDLPFDQVVEAVNPQRSLSRNPLFDIVVHVREQM
+ PQDHVIDTGPDGDTTLRVLEPTFDAAQADLSVNFFACGDEYRGHVIYRTELYERATAQ
+ RFADWLVRVVEAFADRPDQPLREVEMVSAQARRRILDRSNAGAGTARVYLLDDALKPV
+ PVGVVGDVYYGGGPAVGARLARPSETATRFVADPFAAQPGSRLYRNGERGVWKADGQL
+ ELLAEIERLPTAQAAPVPAEPADTETERALAAILADVLEVGEVGRYDDFFNLGGDSIL
+ ATQVAARARDGGIPLTARMVFEHPVLCELAAAVDAKPHVEAEPDDKHHAPMSTSGLSP
+ DELSALTASWDQWP"
+ gene complement(2639737..2642751)
+ /gene="mbtD"
+ /locus_tag="BQ2027_MB2402C"
+ CDS complement(2639737..2642751)
+ /gene="mbtD"
+ /locus_tag="BQ2027_MB2402C"
+ /note="Mb2402c, mbtD, len: 1004 aa. Equivalent to Rv2381c,
+ len: 1004 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (100.0% identity in 1004 aa overlap). mbtD,
+ polyketide synthase (see citations below), similar in part
+ to several synthases e.g. Q03132|ERY2_SACER|ERYA
+ ERYTHRONOLIDE SYNTHASE, MODULES 3 AND 4 (EC 2.3.1.94) from
+ Saccharopolyspora erythraea (Streptomyces erythraeus)
+ (3567 aa), FASTA scores: opt: 971, E(): 1e-46, (29.35%
+ identity in 1043 aa overlap); Q9F829|MEGAII MEGALOMICIN
+ 6-DEOXYERYTHRONOLIDE B SYNTHASE 2 from Micromonospora
+ megalomicea subsp. nigra (3562 aa), FASTA scores: opt:
+ 787, E(): 2.4e-36, (29.35% identity in 1032 aa overlap);
+ Q9L4W4|NYSB POLYKETIDE SYNTHASE from Streptomyces noursei
+ (3192 aa), FASTA scores: opt: 761, E(): 6.6e-35, (29.55%
+ identity in 1086 aa overlap); O30764|NIDA1 POLYKETIDE
+ SYNTHASE MODULES 1 AND 2 from Streptomyces caelestis (4340
+ aa), FASTA scores: opt: 726, E(): 7.8e-33, (27.3% identity
+ in 1052 aa overlap); etc. Contains PS00012
+ Phosphopantetheine attachment site. Protein product from
+ Mb2402c detected using SWATH mass spectrometry. Mb2402c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POLYKETIDE SYNTHETASE MBTD (POLYKETIDE
+ SYNTHASE)"
+ /protein_id="SIU01014.1"
+ /db_xref="GOA:A0A1R3Y380"
+ /db_xref="InterPro:IPR001227"
+ /db_xref="InterPro:IPR006162"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR013968"
+ /db_xref="InterPro:IPR014043"
+ /db_xref="InterPro:IPR016035"
+ /db_xref="InterPro:IPR016036"
+ /db_xref="InterPro:IPR020801"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR036291"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y380"
+ /translation="MAPKQLPDGRVAVLLSAHAEELIGPDARAIADYLERFPATTVTE
+ VARQLRKTRRVRRHRAVLRAADRLELAEGLRALAAGREHPLIARSSLGSAPRQAFVFP
+ GQGGHWPGMGAVAYRELPTYRTATDTCAAAFAAAGVDSPLPYLIAPPGTDERQAFCEI
+ EIEGAQFVHAVALAEVWRSCGVLPDLTVGHSLGEVAAAYLAGSITLSDAVAVVAARAN
+ VVGRLPGRYAVAALGIGEQDASALIATTGGWLELSVVNASSTVAVSGERQAVAAIVDT
+ VRSSGHFARGITVGFPVHTSVLESLRDELCEQLPDSEFMEAPVQFIGGTTGDVVAPGT
+ TFGDYWYANLRHTVRFDRAVESAIRCGARAFIEISAHPALLFAIGQNCEGAANLPDGP
+ AVLVGSARRGERFVDALSANIVSAAVADPGYPWGDLGGDPLDGDVDLSGFPNAPMRAV
+ PMWAHPEPLPPVSGLTIAVERWERMVPSTPVAGRHRHLAVLDLGAHRALAQTLCAAID
+ SHPDTELSAARDAELILVIAPDFEHTDAVRAAGALADLVGAGLLDYPMHIGARCQSVC
+ LVTVGAEQVDAADAVPSAGQAALAAMHRSIGFEHPEQTFSHLDLPSWDLDPVLGVSVI
+ TAVLRGFGETALRGSVNGYTLFERTLADAPAVPNWSLDSGVLDDVVVTGGAGAIGMHY
+ ARYLAEHGARRIVLLSRRAADQATVAMLRKQHGTVIVSPPCDITDPTQLSAIAAEYGG
+ VGASLIVHAAGSVISGTAPGVTSAAVVDNFAAKVLGLAQMIELWPLRPDVRTLLCSSV
+ MGVWGGHGVVAYSAANRLLDVMAAQLRAQGRHCVAVKWGLWQAPKAGEPARGIADAVT
+ IARVERSGLRQMAPQQAIEASLHEFTVDPLVFAADAARLQMLLDSRQFERYEGPTDPN
+ LTIVDAVRTQLAAVLGIPQAGEVNLQESLFDLGVDSMLALDLRNRLKRSIGATVSLAT
+ LMGDITGDGLVAKLEDADERSHTAQKVDISRD"
+ gene complement(2642751..2644085)
+ /gene="mbtC"
+ /locus_tag="BQ2027_MB2403C"
+ CDS complement(2642751..2644085)
+ /gene="mbtC"
+ /locus_tag="BQ2027_MB2403C"
+ /note="Mb2403c, mbtC, len: 444 aa. Equivalent to Rv2382c,
+ len: 444 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 444 aa overlap). mbtC, polyketide
+ synthase (see citations below), similar in part to several
+ synthases e.g. Q9F7T9 AVERMECTIN POLYKETIDE SYNTHASE
+ (FRAGMENT) from Streptomyces avermitilis (3626 aa), FASTA
+ scores: opt: 1458, E(): 7e-82, (50.65% identity in 446 aa
+ overlap); AAG23264|SPNA POLYKETIDE SYNTHASE LOADING AND
+ EXTENDER MODULE 1 from Saccharopolyspora spinosa (2595 aa)
+ FASTA scores: opt: 1441, E(): 6e-81, (49.1% identity in
+ 446 aa overlap); O33954|TYLG TYLACTONE SYNTHASE STARTER
+ MODULE AND MODULES 1 & 2 from Streptomyces fradiae (4472
+ aa) FASTA scores: opt: 1439, E(): 1.2e-80, (51.0% identity
+ in 447 aa overlap); O30764|NIDA1 POLYKETIDE SYNTHASE
+ MODULES 1 AND 2 from Streptomyces caelestis (4340 aa)
+ FASTA scores: opt: 1432, E(): 3.3e-80, (50.9% identity in
+ 442 aa overlap); etc. Protein product from Mb2403c
+ detected using SWATH mass spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="POLYKETIDE SYNTHETASE MBTC (POLYKETIDE
+ SYNTHASE)"
+ /protein_id="SIU01015.1"
+ /db_xref="GOA:A0A1R3Y1U7"
+ /db_xref="InterPro:IPR014030"
+ /db_xref="InterPro:IPR014031"
+ /db_xref="InterPro:IPR016039"
+ /db_xref="InterPro:IPR020841"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1U7"
+ /translation="MSDNDPVVIVGLAIEAPGGVETADDYWTLLSEQREGLGPFPTDR
+ GWALRELFDGSRRNGFKPIHNLGGFLSSATTFDPEFFRISPREATAMDPQQRVGLRVA
+ WRTLENSGINPDDLAGHDVGCYVGASALEYGPALTEFSHHSGHLITGTSLGVISGRIA
+ YTLDLAGPALTVDTSCSSALAAFHTAVQAIRAGDCDLALAGGVCVMGTPGYFVEFSKQ
+ HALSDDGHCRPYSAHASGTAWAEGAAMFLLQRRSRATADRRRVLAEVRASCLNSDGLS
+ DGLTAPSGDAQTRLLRRAIAQAAVVPADVGMVEGHGTATRLGDRTELRSLAASYGTAP
+ AGRGPLLGSVKSNIGHAQAAAGGLGLVKVILAAQHAAIPPTLHVDEPSREIDWEKQGL
+ RLADKLTPWRAVDGWRTAAVSAFGMSGTNSHVIVSMPDTVSAPERGPECGEV"
+ gene complement(2644075..2648319)
+ /gene="mbtB"
+ /locus_tag="BQ2027_MB2404C"
+ CDS complement(2644075..2648319)
+ /gene="mbtB"
+ /locus_tag="BQ2027_MB2404C"
+ /note="Mb2404c, mbtB, len: 1414 aa. Equivalent to Rv2383c,
+ len: 1414 aa, from Mycobacterium tuberculosis strain
+ H37Rv, (99.9% identity in 1414 aa overlap). mbtB,
+ phenyloxazoline synthase (see citations below), similar to
+ the N-terminal region of several synthetases e.g.
+ Q9EWP5|SC4C2.17 PUTATIVE NON-RIBOSOMAL PEPTIDE SYNTHASE
+ from Streptomyces coelicolor (2229 aa), FASTA scores: opt:
+ 2878, E(): 4.1e-156, (46.85% identity in 1138 aa overlap);
+ Q9Z399|IRP2 YERSINIABACTIN BIOSYNTHETIC from Yersinia
+ pestis (2041 aa), FASTA scores: opt: 2297, E(): 5.3e-123,
+ (38.55% identity in 1069 aa overlap);
+ P48633|HMP2_YEREN|IRP2 HIGH-MOLECULAR-WEIGHT PROTEIN 2
+ (MAY BE INVOLVED IN THE NONRIBOSOMAL SYNTHESIS OF SMALL
+ PEPTIDES) from Yersinia enterocolitica (2035 aa), FASTA
+ scores: opt: 2275, E(): 9.4e-122, (38.45% identity in 1069
+ aa overlap); O85739|PCHE|PA4226 DIHYDROAERUGINOIC ACID
+ SYNTHETASE from Pseudomonas aeruginosa (1438 aa) FASTA
+ scores: opt: 2236, E(): 1.2e-119, (38.2% identity in 1330
+ aa overlap); Q9RFM8|PCHE PYOCHELIN SYNTHETASE from
+ Pseudomonas aeruginosa (1438 aa), FASTA scores: opt: 2229,
+ E(): 3e-119, (38.0% identity in 1329 aa overlap); etc.
+ Contains PS00455 Putative AMP-binding domain signature,
+ and PS00012 Phosphopantetheine attachment site. BELONGS TO
+ THE ATP-DEPENDENT AMP-BINDING ENZYME FAMILY. Protein
+ product from Mb2404c detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="PHENYLOXAZOLINE SYNTHASE MBTB (PHENYLOXAZOLINE
+ SYNTHETASE)"
+ /protein_id="SIU01016.1"
+ /db_xref="GOA:Q7TYQ4"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR001031"
+ /db_xref="InterPro:IPR001242"
+ /db_xref="InterPro:IPR006162"
+ /db_xref="InterPro:IPR009081"
+ /db_xref="InterPro:IPR010071"
+ /db_xref="InterPro:IPR020806"
+ /db_xref="InterPro:IPR020845"
+ /db_xref="InterPro:IPR023213"
+ /db_xref="InterPro:IPR025110"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="InterPro:IPR036736"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYQ4"
+ /translation="MVHATACSEIIRAEVAELLGVRADALHPGANLVGQGLDSIRMMS
+ LVGRWRRKGIAVDFATLAATPTIEAWSQLVSAGTGVAPTAVAAPGDAGLSQEGEPFPL
+ APMQHAMWVGRHDHQQLGGVAGHLYVEFDGARVDPDRLRAAATRLALRHPMLRVQFLP
+ DGTQRIPPAAGSRDFPISVADLRHVAPDVVDQRLAGIRDAKSHQQLDGAVFELALTLL
+ PGERTRLHVDLDMQAADAMSYRILLADLAALYDGREPPALGYTYQEYRQAIEAEETLP
+ QPVRDADRDWWAQRIPQLPDPPALPTRAGGERDRRRSTRRWHWLDPQTRDALFARARA
+ RGITPAMTLAAAFANVLARWSASSRFLLNLPLFSRQALHPDVDLLVGDFTSSLLLDVD
+ LTGARTAAARAQAVQEALRSAAGHSAYPGLSVLRDLSRHRGTQVLAPVVFTSALGLGD
+ LFCPDVTEQFGTPGWIISQGPQVLLDAQVTEFDGGVLVNWDVREGVFAPGVIDAMFTH
+ QVDELLRLAAGDDAWDAPSPSALPAAQRAVRAALNGRTAAPSTEALHDGFFRQAQQQP
+ DAPAVFASSGDLSYAQLRDQASAVAAALRAAGLRVGDTVAVLGPKTGEQVAAVLGILA
+ AGGVYLPIGVDQPRDRAERILATGSVNLALVCGPPCQVRVPVPTLLLADVLAAAPAEF
+ VPGPSDPTALAYVLFTSGSTGEPKGVEVAHDAAMNTVETFIRHFELGAADRWLALATL
+ ECDMSVLDIFAALRSGGAIVVVDEAQRRDPDAWARLIDTYEVTALNFMPGWLDMLLEV
+ GGGRLSSLRAVAVGGDWVRPDLARRLQVQAPSARFAGLGGATETAVHATIFEVQDAAN
+ LPPDWASVPYGVPFPNNACRVVADSGDDCPDWVAGELWVSGRGIARGYRGRPELTAER
+ FVEHDGRTWYRTGDLARYWHDGTLEFVGRADHRVKISGYRVELGEIEAALQRLPGVHA
+ AAATVLPGGSDVLAAAVCVDDAGVTAESIRQQLADLVPAHMIPRHVTLLDRIPFTDSG
+ KIDRAEVGALLAAEVERSGDRSAPYAAPRTVLQRALRRIVADILGRANDAVGVHDDFF
+ ALGGDSVLATQVVAGIRRWLDSPSLMVADMFAARTIAALAQLLTGREANADRLELVAE
+ VYLEIANMTSADVMAALDPIEQPAQPAFKPWVKRFTGTDKPGAVLVFPHAGGAAAAYR
+ WLAKSLVANDVDTFVVQYPQRADRRSHPAADSIEALALELFEAGDWHLTAPLTLFGHC
+ MGAIVAFEFARLAERNGVPVRALWASSGQAPSTVAASGPLPTADRDVLADMVDLGGTD
+ PVLLEDEEFVELLVPAVKADYRALSGYSCPPDVRIRANIHAVGGNRDHRISREMLTSW
+ ETHTSGRFTLSHFDGGHFYLNDHLDAVARMVSADVR"
+ gene 2648418..2650115
+ /gene="mbtA"
+ /locus_tag="BQ2027_MB2405"
+ CDS 2648418..2650115
+ /gene="mbtA"
+ /locus_tag="BQ2027_MB2405"
+ /note="Mb2405, mbtA, len: 565 aa. Equivalent to Rv2384,
+ len: 565 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 565 aa overlap). mbtA, bifunctional
+ enzyme, including salicyl-AMP ligase (Sal-AMP ligase) (EC
+ 6.-.-.-) and salicyl-S-ArCP synthetase (see first and
+ second citations below), highly similar to other ligases
+ e.g. Q9F638|MXCE from Stigmatella aurantiaca 2,3-DHBA-AMP
+ ligase (protein involved in the biosynthesis of
+ 2,3-dihydroxybenzoic acid, contains the AMP binding
+ signature) (543 aa), FASTA scores: opt: 1683, E():
+ 2.8e-90, (48.25% identity in 545 aa overlap) (see third
+ citation below); P40871|DHBE_BACSU|ENTE
+ 2,3-DIHYDROXYBENZOATE-AMP LIGASE (EC 6.3.2.-) from
+ Bacillus subtilis (539 aa), FASTA scores: opt: 1569, E():
+ 1.2e-83, (44.9% identity in 532 aa overlap);
+ O07899|VIBE_VIBCHVC0772 VIBRIOBACTIN-SPECIFIC
+ 2,3-DIHYDROXYBENZOATE-AMP LIGASE from Vibrio cholerae (543
+ aa), FASTA scores: opt: 1457, E(): 3.7e-77, (44.6%
+ identity in 545 aa overlap); etc. Also similar to
+ P95819|SNBA PRISTINAMYCIN I SYNTHETASE I from Streptomyces
+ pristinaespiralis (582 aa), FASTA scores: opt: 1532, E():
+ 1.7e-81, (46.35% identity in 548 aa overlap); and
+ Q9RFM9|PCHD SALICYL-AMP LIGASE from Pseudomonas aeruginosa
+ (547 aa), FASTA scores: opt: 1415, E(): 1e-74, (45.95%
+ identity in 533 aa overlap). Contains PS00455 Putative
+ AMP-binding domain signature. BELONGS TO THE ATP-DEPENDENT
+ AMP-BINDING ENZYME FAMILY."
+ /codon_start=1
+ /transl_table=11
+ /product="BIFUNCTIONAL ENZYME MBTA: SALICYL-AMP LIGASE
+ (SAL-AMP LIGASE) + SALICYL-S-ArCP SYNTHETASE"
+ /protein_id="SIU01017.1"
+ /db_xref="GOA:A0A1R3Y1F4"
+ /db_xref="InterPro:IPR000873"
+ /db_xref="InterPro:IPR025110"
+ /db_xref="InterPro:IPR042099"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1F4"
+ /translation="MPPKAADGRRPSPDGGLGGFVPFPADRAASYRAAGYWSGRTLDT
+ VLSDAARRWPDRLAVADAGDRPGHGGLSYAELDQRADRAAAALHGLGITPGDRVLLQL
+ PNGCQFAVALFALLRAGAIPVMCLPGHRAAELGHFAAVSAATGLVVADVASGFDYRPM
+ ARELVADHPTLRHVIVDGDPGPFVSWAQLCAQAGTGSPAPPADPGSPALLLVSGGTTG
+ MPKLIPRTHDDYVFNATASAALCRLSADDVYLVVLAAGHNFPLACPGLLGAMTVGATA
+ VFAPDPSPEAAFAAIERHGVTVTALVPALAKLWAQSCEWEPVTPKSLRLLQVGGSKLE
+ PEDARRVRTALTPGLQQVFGMAEGLLNFTRIGDPPEVVEHTQGRPLCPADELRIVNAD
+ GEPVGPGEEGELLVRGPYTLNGYFAAERDNERCFDPDGFYRSGDLVRRRDDGNLVVTG
+ RVKDVICRAGETIAASDLEEQLLSHPAIFSAAAVGLPDQYLGEKICAAVVFAGAPITL
+ AELNGYLDRRGVAAHTRPDQLVAMPALPTTPIGKIDKRAIVRQLGIATGPVTTQRCH"
+ gene 2650211..2651131
+ /gene="mbtJ"
+ /locus_tag="BQ2027_MB2406"
+ CDS 2650211..2651131
+ /gene="mbtJ"
+ /locus_tag="BQ2027_MB2406"
+ /note="Mb2406, mbtJ, len: 306 aa. Equivalent to Rv2385,
+ len: 306 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 306 aa overlap). Putative mbtJ, acetyl
+ hydrolase (EC 3.1.1.-) (see citations below), showing some
+ similarity with various hydrolases including acetyl
+ hydrolases e.g. Q9ZBM4|MLCB1450.08|ML0314 PUTATIVE
+ HYDROLASE/ESTERASE from Mycobacterium leprae (335 aa),
+ FASTA scores: opt: 449, E(): 6.7e-21, (33.85% identity in
+ 313 aa overlap); AAK47950|MT3591 Esterase from M.
+ tuberculosis strain CDC1551 (327 aa), FASTA scores: opt:
+ 469, E(): 3.6e-22, (35% identity in 283 aa overlap);
+ Q9X8J4|SCE9.22 PUTATIVE ESTERASE from Streptomyces
+ coelicolor (266 aa), FASTA scores: opt: 430,E(): 8.5e-20,
+ (38% identity in 245 aa overlap); Q01109|BAH_STRHY
+ ACETYL-HYDROLASE (EC 3.1.1.-) from Streptomyces
+ hygroscopicus (299 aa), FASTA scores: opt: 420, E():
+ 4e-19, (35.1% identity in 265 aa overlap). Equivalent to
+ AAK46748 from Mycobacterium tuberculosis strain CDC1551
+ (327 aa) but shorter 21 aa. Note that previously known as
+ lipK. Protein product from Mb2406 detected using SWATH
+ mass spectrometry. Mb2406 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PUTATIVE ACETYL HYDROLASE MBTJ"
+ /protein_id="SIU01018.1"
+ /db_xref="GOA:A0A1R3Y107"
+ /db_xref="InterPro:IPR013094"
+ /db_xref="InterPro:IPR029058"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y107"
+ /translation="MVLRPITGAIPPDGPWGIWASRRIIAGLMGTFGPSLAGTRVEQV
+ NSVLPDGRRVVGEWVYGPHNNAINAGPGGGAIYYVHGSGYTMCSPRTHRRLTSWLSSL
+ TGLPVFSVDYRLAPRYRFPTAATDVRAAWDWLAHVCGLAAEHMVIAADSAGGHLTVDM
+ LLQPEVAARPPAAVVLFSPLIDLTFRLGASRELQRPDPVVRADRAARSVALYYTGVDP
+ AHHRLALDVAGGPPLPPTLIQVGGAEILEADARQLDADIRAAGGICELQVWPDQMHVF
+ QALPRMTPEAAKAMTYVAQFIRSTTARGDL"
+ gene complement(2651135..2652487)
+ /gene="mbtI"
+ /locus_tag="BQ2027_MB2407C"
+ CDS complement(2651135..2652487)
+ /gene="mbtI"
+ /locus_tag="BQ2027_MB2407C"
+ /note="Mb2407c, mbtI, len: 450 aa. Equivalent to Rv2386c,
+ len: 450 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 450 aa overlap). Putative mbtI,
+ isochorismate synthase (see citations below), similar to
+ Q9X9I8|IRP9 SALICYLATE SYNTHETASE from Yersinia
+ enterocolitica (434 aa), FASTA scores: opt: 887, E():
+ 7.5e-48, (37.45% identity in 422 aa overlap); and similar
+ in C-terminal region to many anthranilate synthases
+ component I (EC 4.1.3.27) e.g. Q9Z4W7|TRPE_STRCO|SCE8.07c
+ from Streptomyces coelicolor (511 aa), FASTA scores: opt:
+ 509, E(): 3e-24, (40.4% identity in 255 aa overlap);
+ P33975|TRPE_HALVO from Halobacterium volcanii (Haloferax
+ volcanii) (523 aa) FASTA scores: opt: 488, E(): 6.2e-23,
+ (34.2% identity in 298 aa overlap); and similar to
+ Q08653|TRPE_THEMA|TM0142 ANTHRANILATE SYNTHASE COMPONENT I
+ from Thermotoga maritima (461 aa), FASTA scores: opt: 478,
+ E(): 2.3e-22, (28.4% identity in 440 aa overlap); etc.
+ COULD BE BELONG TO THE ANTHRANILATE SYNTHASE COMPONENT I
+ FAMILY. Note that previously known as trpE2, an
+ anthranilate synthase component I (EC 4.1.3.27). Protein
+ product from Mb2407c detected using SWATH mass
+ spectrometry."
+ /codon_start=1
+ /transl_table=11
+ /product="isochorismate synthase mbti"
+ /protein_id="SIU01019.1"
+ /db_xref="GOA:Q7TYQ1"
+ /db_xref="InterPro:IPR005801"
+ /db_xref="InterPro:IPR015890"
+ /db_xref="InterPro:IPR019996"
+ /db_xref="InterPro:IPR019999"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYQ1"
+ /translation="MSELSVATGAVSTASSSIPMPAGVNPADLAAELAAVVTESVDED
+ YLLYECDGQWVLAAGVQAMVELDSDELRVIRDGVTRRQQWSGRPGAALGEAVDRLLLE
+ TDQAFGWVAFEFGVHRYGLQQRLAPHTPLARVFSPRTRIMVSEKEIRLFDAGIRHREA
+ IDRLLATGVREVPQSRSVDVSDDPSGFRRRVAVAVDEIAAGRYHKVILSRCVEVPFAI
+ DFPLTYRLGRRHNTPVRSFLLQLGGIRALGYSPELVTAVRADGVVITEPLAGTRALGR
+ GPAIDRLARDDLESNSKEIVEHAISVRSSLEEITDIAEPGSAAVIDFMTVRERGSVQH
+ LGSTIRARLDPSSDRMAALEALFPAVTASGIPKAAGVEAIFRLDECPRGLYSGAVVML
+ SADGGLDAALTLRAAYQVGGRTWLRAGAGIIEESEPEREFEETCEKLSTLTPYLVARQ
+ "
+ gene 2652940..2653149
+ /locus_tag="BQ2027_MB2407A"
+ CDS 2652940..2653149
+ /locus_tag="BQ2027_MB2407A"
+ /note="unnamed protein product; unnamed protein product;
+ Mb2407A, len: 69 aa. No equivalent in M. tuberculosis
+ H37Rv. Identified by de novo proteomics of Mycobacterium
+ bovis AF2122/97 under exponential conditions,Mb2407A found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing"
+ /codon_start=1
+ /transl_table=11
+ /protein_id="SIU01020.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y121"
+ /translation="MFVIRLADGEEVHGECDELTINPATGVLTVCRVDGFEETTTHYS
+ PSAWRSVTHRKRGVGVRPSLVSTAQ"
+ gene 2653247..2654500
+ /locus_tag="BQ2027_MB2408"
+ CDS 2653247..2654500
+ /locus_tag="BQ2027_MB2408"
+ /note="Mb2408, -, len: 417 aa. Equivalent to Rv2387, len:
+ 417 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 417 aa overlap). Conserved
+ hypothetical protein, showing some similarities with
+ others e.g. Q9K663|BH3869 HYPOTHETICAL PROTEIN from
+ Bacillus halodurans (337 aa), FASTA scores: opt: 343, E():
+ 4.8e-14, (29.0% identity in 400 aa overlap);
+ AAK25471|CC3509 HYPOTHETICAL PROTEIN from Caulobacter
+ crescentus (365 aa), FASTA scores: opt: 282, E(): 3.2e-10,
+ (32.6% identity in 399 aa overlap); P73953|SLR1512
+ [D90911_21] CONSERVED HYPOTHETICAL PROTEIN from
+ Synechocystis sp. strain PCC6803 (374 aa), FASTA scores:
+ opt: 230, E(): 5.5e-07; (24.75% identity in 408 aa
+ overlap); etc. Contains PS00213 Lipocalin signature.
+ Mb2408 found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="putative sodium-dependent bicarbonate
+ transporter"
+ /protein_id="SIU01021.1"
+ /db_xref="GOA:A0A1R3Y132"
+ /db_xref="InterPro:IPR010293"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y132"
+ /translation="MLHEFWVNFTHNLFKPLLLFFYFGFLIPIFKVRFEFPYVLYQGL
+ TLYLLLAIGWHGGEELAKIKPSNVGAIVGFMVVGFALNFVIGTLAYFLLSKLTAMRRV
+ DRATVAGYYGSDSAGTFATCVAVLTSVGMAFDAYMPVMLAVMEIPGCLVALYLVARLR
+ HRGMNEAGYMADEPGYTTAAMIGAGPGTPARPAHSDSLTAQAERGIEEELELSLEKRE
+ HPNWDEDGVKDSGTNASIFSRELLQEVFLNPGLVLLFGGIVIGLISGLQGQKVLHDDD
+ NFFVAAFQGVLCLFLLEMGMTASRKLKDLASAGSGFVFFGLLAPNLFATLGIIVAHGY
+ AYVTNNDFAPGTYVLFAVLCGAASYIAVPAVQRLAIPEASPTLPLAASLGLTFSYNVT
+ IGIPLYIEIARIVGQWFPATGASIG"
+ gene complement(2654497..2655624)
+ /gene="hemN"
+ /locus_tag="BQ2027_MB2409C"
+ CDS complement(2654497..2655624)
+ /gene="hemN"
+ /locus_tag="BQ2027_MB2409C"
+ /note="Mb2409c, hemN, len: 375 aa. Equivalent to Rv2388c,
+ len: 375 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 375 aa overlap). Probable hemN,
+ oxygen-independent coproporphyrinogen III oxidases (EC
+ 1.3.3.-), highly similar to many PUTATIVE
+ OXYGEN-INDEPENDENT COPROPORPHYRINOGEN III OXIDASES e.g.
+ Q9RDD2|SCC77.26 from Streptomyces coelicolor (435 aa),
+ FASTA scores: opt: 1358, E(): 1.5e-76, (56.55% identity in
+ 382 aa overlap); BAB51237|MLR4627 from Rhizobium loti
+ (Mesorhizobium loti) (392 aa), FASTA scores: opt: 696,
+ E(): 1.1e-35, (36.8% identity in 383 aa overlap);
+ Q9KUR0|VC0455 from Vibrio cholerae (391 aa), FASTA scores:
+ opt: 691, 2.2e-35, (32.65% identity in 386 aa overlap);
+ P54304|HEMN_BACSU from Bacillus subtilis (366 aa), FASTA
+ scores: opt: 668, E(): 5.6e-34; (34.9% identity in 327 aa
+ overlap); etc. Equivalent to AAK46752 from Mycobacterium
+ tuberculosis strain CDC1551 (390 aa) but shorter 375 aa.
+ BELONGS TO THE ANAEROBIC COPROPORPHYRINOGEN III OXIDASE
+ FAMILY. Protein product from Mb2409c detected using SWATH
+ mass spectrometry. Mb2409c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE OXYGEN-INDEPENDENT COPROPORPHYRINOGEN
+ III OXIDASE HEMN (COPROPORPHYRINOGENASE) (COPROGEN
+ OXIDASE)"
+ /protein_id="SIU01022.1"
+ /db_xref="GOA:A0A1R3Y134"
+ /db_xref="InterPro:IPR004559"
+ /db_xref="InterPro:IPR006638"
+ /db_xref="InterPro:IPR007197"
+ /db_xref="InterPro:IPR023404"
+ /db_xref="InterPro:IPR034505"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y134"
+ /translation="MPGQPFGVYLHVPFCLTRCGYCDFNTYTPAQLGGVSPDRWLLAL
+ RAELELAAAKLDAPTVHTVYVGGGTPSLLGGERLATLLDMVRDHFVLAPDAEVSTEAN
+ PESTWPEFFATIRAAGYTRVSLGMQSVAPRVLATLDRVHSPGRAAAAATEAIAEGFTH
+ VNLDLIYGTPGESDDDLVRSVDATVQAGVDHVSAYALVVEHGTALARRVRRGELAAPD
+ DDVLAHRYELVDARLSAAGFAWYEVSNWCRPGGECRHNLGYWDGGQWWGAGPGAHGYI
+ GVTRWWNVKHPNTYAEILAGATLPVAGFEQLGADALHTEDVLLKVRLRQGLPLARLGA
+ AERERAEAVLADGLLDYHGDRLVLTGRGRLLADAVVRTLLG"
+ gene complement(2655730..2656194)
+ /gene="rpfD"
+ /locus_tag="BQ2027_MB2410C"
+ CDS complement(2655730..2656194)
+ /gene="rpfD"
+ /locus_tag="BQ2027_MB2410C"
+ /note="Mb2410c, rpfD, len: 154 aa. Equivalent to Rv2389c,
+ len: 154 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 154 aa overlap). Probable rpfD,
+ resuscitation-promoting factor. Possible autocrine and/or
+ paracrine bacterial growth factor or cytokine (see
+ citation below). Similar to others from Mycobacterium
+ tuberculosis e.g. O07747|Rv1884c|MTCY180.34|RPFC PROBABLE
+ RESUSCITATION-PROMOTING FACTOR from Mycobacterium
+ tuberculosis (176 aa), FASTA scores: opt: 382, E():
+ 2.3e-17, (55.45% identity in 101 aa overlap); etc. Also
+ similarity with Q9CBF8|ML2030 HYPOTHETICAL PROTEIN from
+ Mycobacterium leprae (157 aa), FASTA scores: opt: 397,
+ E(): 2.4e-18, (47.95% identity in 121 aa overlap);
+ Q9F2Q2|SCE41.06c PUTATIVE SECRETED PROTEIN from
+ Streptomyces coelicolor (244 aa), FASTA scores: opt: 341,
+ E(): 1.1e-14, (40.45% identity in 131 aa overlap); and
+ O86308|Z96935|MLRPF_1 RPF PROTEIN PRECURSOR from
+ Micrococcus luteus (220 aa), FASTA scores: opt: 301, E():
+ 3.6e-12, (39.4% identity in 132 aa overlap). Contains a
+ secretory signal sequence in N-terminus. Supposed acts at
+ very low concentration. Mb2410c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE RESUSCITATION-PROMOTING FACTOR RPFD"
+ /protein_id="SIU01023.1"
+ /db_xref="GOA:A0A1R3Y0Z9"
+ /db_xref="InterPro:IPR010618"
+ /db_xref="InterPro:IPR023346"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y0Z9"
+ /translation="MTPGLLTTAGAGRPRDRCARIVCTVFIETAVVATMFVALLGLST
+ ISSKADDIDWDAIAQCESGGNWAANTGNGLYGGLQISQATWDSNGGVGSPAAASPQQQ
+ IEVADNIMKTQGPGAWPKCSSCSQGDAPLGSLTHILTFLAAETGGCSGSRDD"
+ gene complement(2656191..2656748)
+ /locus_tag="BQ2027_MB2411C"
+ CDS complement(2656191..2656748)
+ /locus_tag="BQ2027_MB2411C"
+ /note="Mb2411c, -, len: 185 aa. Equivalent to Rv2390c,
+ len: 185 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 185 aa overlap). Conserved hypothetical
+ protein, similar to other Mycobacterium tuberculosis
+ proteins Q11032|YD62_MYCTU|MTCY02B10.26c|Rv1362c
+ hypothetical 23.5 kd protein (220 aa), FASTA scores: opt:
+ 223, E(): 2.1e-07, (27.4% identity in 190 aa overlap); and
+ Q11033|YD63_MYCTU|MTCY02B10.27c|Rv1363c hypothetical 28.3
+ kd protein (261 aa), FASTA scores: opt: 238, E(): 2.7e-08,
+ (27.6% identity in 163 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="FIG00821219: MCE associated membrane protein"
+ /protein_id="SIU01024.1"
+ /db_xref="GOA:A0A1R3Y390"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y390"
+ /translation="MAIFGRGHGASEPGGTGEPAETPGRGRLTRSVTGWVGAVAVVVS
+ LAGSGWCGWVLFEKHQTDVAAGQALQAARSYVVKLATMDCERIDHNMRDILEGSTGEF
+ KDKYGKSSAHLRQLLADNRVATHGTVVAASVKSATTNKVVVLMFIDQSVSNRNSPTPQ
+ IDRSRIKVIMDKVNGRWLASKVELL"
+ gene 2657161..2658852
+ /gene="sira"
+ /locus_tag="BQ2027_MB2412"
+ CDS 2657161..2658852
+ /gene="sira"
+ /locus_tag="BQ2027_MB2412"
+ /note="Mb2412, nirA, len: 563 aa. Equivalent to Rv2391,
+ len: 563 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 563 aa overlap). Probable nirA,
+ ferredoxin-dependant nitrite reductase (EC 1.7.7.1),
+ similar to many nitrate reductases e.g.
+ CAC33947|SCBAC1A6.26c Putative nitrite/sulphite reductase
+ from Streptomyces coelicolor (565 aa), FASTA scores: opt:
+ 2335, E(): 1.2e-137, (60.1% identity in 567 aa overlap);
+ Q9RZD6|DRA0013 FERREDOXIN-NITRITE REDUCTASE from
+ Deinococcus radiodurans (563 aa), FASTA scores: opt: 1141,
+ E(): 2.2e-63, (39.6% identity in 533 aa overlap);
+ Q59656|NIRA (D31732|PEENIRNRT_1) ferredoxin-dependant*
+ NITRITE REDUCTASE (*: see citation below) from Plectonema
+ boryanum (654 aa), FASTA scores: opt: 805, E(): 1.9e-42,
+ (31.7% identity in 517 aa overlap); Q55366|NIRA|SLR0898
+ FERREDOXIN-NITRITE REDUCTASE from Synechocystis sp. strain
+ PCC 6803 (502 aa), FASTA scores: opt: 799, E(): 3.7e-42,
+ (32.3% identity in 517 aa overlap). Highly similar (only
+ in N-terminal part because shortened protein (fragment)
+ owing to an IS900 insertion) to Q9K541|NIRA NITRATE
+ REDUCTASE (FRAGMENT) from Mycobacterium paratuberculosis
+ (198 aa), FASTA scores: opt: 798, E(): 2.1e-42, (65.4%
+ identity in 182 aa overlap). Protein product from Mb2412
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2412 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ferredoxin-dependent sulfite reductase sira"
+ /protein_id="SIU01025.1"
+ /db_xref="GOA:Q7TYP6"
+ /db_xref="InterPro:IPR005117"
+ /db_xref="InterPro:IPR006066"
+ /db_xref="InterPro:IPR006067"
+ /db_xref="InterPro:IPR036136"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYP6"
+ /translation="MSAKENPQMTTARPAKARNEGQWALGHREPLNANEELKKAGNPL
+ DVRERIENIYAKQGFDSIDKTDLRGRFRWWGLYTQREQGYDGTWTGDDNIDKLEAKYF
+ MMRVRCDGGALSAAALRTLGQISTEFARDTADISDRQNVQYHWIEVENVPEIWRRLDD
+ VGLQTTEACGDCPRVVLGSPLAGESLDEVLDPTWAIEEIVRRYIGKPDFADLPRKYKT
+ AISGLQDVAHEINDVAFIGVNHPEHGPGLDLWVGGGLSTNPMLAQRVGAWVPLGEVPE
+ VWAAVTSVFRDYGYRRLRAKARLKFLIKDWGIAKFREVLETEYLKRPLIDGPAPEPVK
+ HPIDHVGVQRLKNGLNAVGVAPIAGRVSGTILTAVADLMARAGSDRIRFTPYQKLVIL
+ DIPDALLDDLIAGLDALGLQSRPSHWRRNLMACSGIEFCKLSFAETRVRAQHLVPELE
+ RRLEDINSQLDVPITVNINGCPNSCARIQIADIGFKGQMIDDGHGGSVEGFQVHLGGH
+ LGLDAGFGRKLRQHKVTSDELGDYIDRVVRNFVKHRSEGERFAQWVIRAEEDDLR"
+ gene 2658849..2659613
+ /gene="cysH"
+ /locus_tag="BQ2027_MB2413"
+ CDS 2658849..2659613
+ /gene="cysH"
+ /locus_tag="BQ2027_MB2413"
+ /note="Mb2413, cysH, len: 254 aa. Equivalent to Rv2392,
+ len: 254 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 254 aa overlap). Probable cysH,
+ 3'-phosphoadenosine 5'-phosphosulfate reductase (EC
+ 1.8.4.8), similar to many e.g.
+ P94498|O34620|CYH1_BACSU|CYSH from Bacillus subtilis (233
+ aa), FASTA scores: opt: 618, E(): 8.1e-32, (46.5% identity
+ in 202 aa overlap); Q9KCT3|CYSH|BH1486 from Bacillus
+ halodurans (231 aa), FASTA scores: opt: 560, E(): 3.6e-28,
+ (41.3% identity in 230 aa overlap); P56860|CYSH_DEIRA from
+ Deinococcus radiodurans (255 aa), FASTA scores: opt: 489,
+ E(): 1.1e-23, (44.7% identity in 190 aa overlap); etc.
+ BELONGS TO THE PAPS REDUCTASE FAMILY and CYSH SUBFAMILY.
+ Note that operon cysA-cysW-cysT-subI, probably involved in
+ sulfate transport, is near this putative ORF. Protein
+ product from Mb2413 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2413 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="probable 3'-phosphoadenosine 5'-phosphosulfate
+ reductase cysh (paps reductase, thioredoxin dep.) (padops
+ reductase) (3'-phosphoadenylylsulfate reductase) (paps
+ sulfotransferase)"
+ /protein_id="SIU01026.1"
+ /db_xref="GOA:P65669"
+ /db_xref="InterPro:IPR002500"
+ /db_xref="InterPro:IPR004511"
+ /db_xref="InterPro:IPR011798"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="UniProtKB/Swiss-Prot:P65669"
+ /translation="MSGETTRLTEPQLRELAARGAAELDGATATDMLRWTDETFGDIG
+ GAGGGVSGHRGWTTCNYVVASNMADAVLVDLAAKVRPGVPVIFLDTGYHFVETIGTRD
+ AIESVYDVRVLNVTPEHTVAEQDELLGKDLFARNPHECCRLRKVVPLGKTLRGYSAWV
+ TGLRRVDAPTRANAPLVSFDETFKLVKVNPLAAWTDQDVQEYIADNDVLVNPLVREGY
+ PSIGCAPCTAKPAEGADPRSGRWQGLAKTECGLHAS"
+ gene 2659610..2660455
+ /gene="che1"
+ /locus_tag="BQ2027_MB2414"
+ CDS 2659610..2660455
+ /gene="che1"
+ /locus_tag="BQ2027_MB2414"
+ /note="Mb2414, -, len: 281 aa. Equivalent to Rv2393, len:
+ 281 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 281 aa overlap). Conserved
+ hypothetical protein, with some similarity to
+ Q9L2E8|SC7A8.10c PUTATIVE SECRETED PROTEIN from
+ Streptomyces coelicolor (274 aa), FASTA scores: opt: 407,
+ E(): 2.8e-18, (37% identity in 246 aa overlap);
+ CAC38793|SCI39.05 Conserved hypothetical protein from
+ Streptomyces coelicolor (305 aa), FASTA scores: opt: 394,
+ E(): 2e-17, (35.0% identity in 251 aa overlap);
+ AAK44492|MT0272 Chalcone/stilbene synthase family protein
+ from Mycobacterium tuberculosis (247 aa), FASTA scores:
+ opt: 350, E(): 9.2e-15, (34.0% identity in 235 aa
+ overlap); P95216|Rv0259c|MTCY06A4.03c|Z86089 hypothetical
+ protein from Mycobacterium tuberculosis (247 aa), FASTA
+ scores: opt: 345, E(): 1.9e-14,(33.6% identity in 235 aa
+ overlap). Mb2414 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ferrochelatase che1"
+ /protein_id="SIU01027.1"
+ /db_xref="GOA:A0A1R3Y1G4"
+ /db_xref="InterPro:IPR002762"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1G4"
+ /translation="MTAPATMQSAAMLRSGAIEAPPATMQSAAMRWGHLPLAEESGTI
+ APQLVLTAHGSKDPRSAANARAIAGRLARMRPGLDVRVAFCELNSPNLVDVLNRCRGA
+ AVVTPLLLADAYHARVDIPAQIASCRVGHRVRQASVLGEDIRLVSALHERLTELGVSP
+ FDHTLGVVVLAIGSSHPAANARTSTVASRLAEGTQWAAVTTAFITRPEASLADATDRL
+ RRHGARRMVIAPWLLAPGILSDRVRGYAREAGIAMAQPLGAHPMVAATMWDRYRQAVA
+ GRIAA"
+ gene 2660492..2662423
+ /gene="ggtB"
+ /locus_tag="BQ2027_MB2415"
+ CDS 2660492..2662423
+ /gene="ggtB"
+ /locus_tag="BQ2027_MB2415"
+ /note="Mb2415, ggtB, len: 643 aa. Equivalent to Rv2394,
+ len: 643 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 643 aa overlap). Probable ggtB,
+ gamma-glutamyltranspeptidase precursor (EC 2.3.2.2),
+ similar to many e.g. Q9KVF2|VC0194 from Vibrio cholerae
+ (588 aa), FASTA scores: opt: 943, E(): 7.5e-47, (40.0%
+ identity in 597 aa overlap); O69935|SC3C8.26 from
+ Streptomyces coelicolor (603 aa), FASTA scores: opt: 822,
+ E(): 7.2e-40, (33.6% identity in 622 aa overlap);
+ P54422|GGT_BACSU from Bacillus subtilis (587 aa) FASTA
+ scores: opt: 491, E(): 8.2e-21, (33.4% identity in 574 aa
+ overlap); etc. Has potential signal peptide and
+ appropriately positioned prokaryotic lipoprotein
+ attachment site (PS00013). Protein product from Mb2415
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2415 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GAMMA-GLUTAMYLTRANSPEPTIDASE PRECURSOR
+ GGTB (GAMMA-GLUTAMYLTRANSFERASE) (GLUTAMYL
+ TRANSPEPTIDASE)"
+ /protein_id="SIU01028.1"
+ /db_xref="GOA:A0A1R3Y119"
+ /db_xref="InterPro:IPR029055"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y119"
+ /translation="MSVWLRAGALVAAVMLSLSGCGGFHAGAPSTAGPCEIVPNGTPA
+ PKTPPATVPSSRNLATNPEIATGYRRDMTVVRTAHYAAATANPLATQVACRVLRDGGT
+ AADAVVAAQAVLGLVEPQSSGIGGGGYLVYFDARTGSVQAYDGREVAPAAATENYLRW
+ VSDVDRSAPRPNARASGRSIGVPGILRMLEMVHNEHGRTPWRDLFGPAVTLADGGFDI
+ SARMGAAISDAAPQLRDDPEARKYFLNPDGSPKPAGTRLTNPAYSKTLSAIASAGANA
+ FYSGDIAHDIVAAASDTSNGRTPGLLTIEDLAGYLAKRRQPLCTTYRGREICGMPSSG
+ GVAVAATLGILEHFPMSDYAPSKVDLNGGRPTVMGVHLIAEAERLAYADRDQYIADVD
+ FVQLPGGSLTTLVDPGYLAARAALISPQHSMGSARPGDFGAPTAVAPPVPEHGTSHLS
+ VVDSYGNAATLTTTVESSFGSYHLVDGFILNNQLSDFSAEPHATDGSPVANRVEPGKR
+ PRSSMAPTLVFDHSSAGRGALYAVLGSPGGSMIIQFVVKTLVAMLDWGLNPQQAVSLV
+ DFGAANSPHTNLGGENPEINTSDDGDHDPLVQGLRALGHRVNLAEQSSGLSAITRSEA
+ GWAGGADPRREGAVMGDDA"
+ gene 2662554..2662994
+ /locus_tag="BQ2027_MB2416"
+ CDS 2662554..2662994
+ /locus_tag="BQ2027_MB2416"
+ /note="Mb2416, -, len: 146 aa. Equivalent to 5' end of
+ Rv2395, len: 667 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 44 aa overlap). Probable
+ conserved integral membrane protein, similar to
+ AAK24613|CC2646 OLIGOPEPTIDE TRANSPORTER/OPT FAMILY
+ PROTEIN from Caulobacter crescentus (666 aa), FASTA
+ scores: opt: 1638, E(): 4.8e-86, (51.0% identity in 658 aa
+ overlap); Q9PIS5|CJ0204 PUTATIVE INTEGRAL MEMBRANE PROTEIN
+ from Campylobacter jejuni (665 aa), FASTA scores: opt:
+ 1484, E(): 2.9e-77, (40.6% identity in 658 aa overlap);
+ and P44016|Y561_HAEIN hypothetical integral membrane
+ protein from Haemophilus influenzae (635 aa), FASTA
+ scores: opt: 1449, E(): 2.8e-75, (42.15% identity in 624
+ aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv2395 exists as
+ a single gene. In Mycobacterium bovis, a frameshift due to
+ a single base insertion (*-t) splits Rv2395 into 2 parts,
+ Mb2416 and Mb2417. Mb2416 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN
+ [FIRST PART]"
+ /protein_id="SIU01029.1"
+ /db_xref="GOA:A0A1R3Y128"
+ /db_xref="InterPro:IPR004813"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y128"
+ /translation="MSGATVGAREITIRGVVLGALITLVFTAANVYLGLRVGLTFATS
+ HTGRGDLDGRAAVVRQPLSGGEQYCSDDRVGGRHAVVDHLRVTGTAHDRLVERVSVLD
+ NGGGVCTGRDPWRHVLNSVAPRTRHRIRPAVPRRRCRSRGSQDR"
+ gene 2663008..2664558
+ /locus_tag="BQ2027_MB2417"
+ CDS 2663008..2664558
+ /locus_tag="BQ2027_MB2417"
+ /note="Mb2417, -, len: 516 aa. Equivalent to 3' end of
+ Rv2395, len: 667 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.8% identity in 516 aa overlap). Probable
+ conserved integral membrane protein, similar to
+ AAK24613|CC2646 OLIGOPEPTIDE TRANSPORTER/OPT FAMILY
+ PROTEIN from Caulobacter crescentus (666 aa), FASTA
+ scores: opt: 1638, E(): 4.8e-86, (51.0% identity in 658 aa
+ overlap); Q9PIS5|CJ0204 PUTATIVE INTEGRAL MEMBRANE PROTEIN
+ from Campylobacter jejuni (665 aa), FASTA scores: opt:
+ 1484, E(): 2.9e-77, (40.6% identity in 658 aa overlap);
+ and P44016|Y561_HAEIN hypothetical integral membrane
+ protein from Haemophilus influenzae (635 aa), FASTA
+ scores: opt: 1449, E(): 2.8e-75, (42.15% identity in 624
+ aa overlap). REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium tuberculosis strain H37Rv, Rv2395 exists as
+ a single gene. In Mycobacterium bovis, a frameshift due to
+ a single base insertion (*-t) splits Rv2395 into 2 parts,
+ Mb2416 and Mb2417. Mb2417 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN
+ [SECOND PART]"
+ /protein_id="SIU01030.1"
+ /db_xref="GOA:A0A1R3Y129"
+ /db_xref="InterPro:IPR004813"
+ /db_xref="InterPro:IPR004814"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y129"
+ /translation="MEHNRRGIGVIALGAAAAAGYALLASLRVINNSLSATFRVGSGA
+ TMIGASLSLALIGVGHLVGVTVGVAMIVGLAIAFGVMLPIRTAGQLPPDGDYAVAVAR
+ IFSTDVRFIGAGAIAVAAAWTFLKILGPILRGIADAAVSARTRRRGQAVGQTERDIPI
+ HIVAMVVLLSLIPIGWLLADFTDGTPLDDRRPGAIAAGVLLVLVIGLMVAAVCGYMAG
+ LIGSSNSPISGVGILVVVLAGLLIKTAYGPATGSQIPALVAYTVFTAALVFGVATISN
+ DNLQDLKTGQLVGATPWKQQVALIIGVLVGSVVMAPILQLMQAGFGFQGAPGATANAL
+ AAPQAALMSALAKGVFGGSLNWSLVGVGALTGVIAVALDETLAKTTTNLRLPPLAVGM
+ GMYLPAALTLMIPIGAFLGRIYDSWARWSGDDDERKKRLGVMLATGLIVGESLYGVLF
+ AVIVATTGKEEPLAMVGDGFRFASQPLGAIVFAGLLAWLYQRTRVTASYRLAAPAGSS
+ KPLPDLPG"
+ gene 2664707..2664922
+ /gene="aprA"
+ /locus_tag="BQ2027_MB2417A"
+ CDS 2664707..2664922
+ /gene="aprA"
+ /locus_tag="BQ2027_MB2417A"
+ /note="Mb2417A, len: 71 aa. Equivalent to Rv2395A len: 71
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 71 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). AprA, acid and phagosome
+ regulated protein A, restricted to M. tuberculosis
+ complex. Note completely overlapped by sRNA mcr7. Mb2417A
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Acid and phagosome regulated protein A AprA"
+ /protein_id="SIU01031.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y138"
+ /translation="MTMTASVAKVTAARPEPSAAWAEARRRVRQRREDMLRHPAFLSK
+ QLPAEPADDDGVAAVYDIAIARRRRPA"
+ gene 2665034..2665198
+ /gene="aprB"
+ /locus_tag="BQ2027_MB2417B"
+ CDS 2665034..2665198
+ /gene="aprB"
+ /locus_tag="BQ2027_MB2417B"
+ /note="Mb2417B, len: 54 aa. Equivalent to Rv2395B len: 54
+ aa, from Mycobacterium tuberculosis strain H37Rv, (100.0%
+ identity in 54 aa overlap). Transferred from H37Rv
+ annotation using Rapid Annotation Transfer Tool (Nucleic
+ Acids Res. 2011 May; 39(9): e57). AprB, acid and phagosome
+ regulated protein B, restricted to M. tuberculosis
+ complex. Mb2417B found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Acid and phagosome regulated protein B AprB"
+ /protein_id="SIU01032.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y143"
+ /translation="MPGLVPAMPLDALRPARQPTSGLGECATMRRPEAGNEKVAVIWE
+ SLDVVPPESL"
+ gene 2665282..2666364
+ /gene="PE_PGRS41"
+ /locus_tag="BQ2027_MB2418"
+ CDS 2665282..2666364
+ /gene="PE_PGRS41"
+ /locus_tag="BQ2027_MB2418"
+ /note="Mb2418, PE_PGRS41, len: 360 aa. Equivalent to
+ Rv2396, len: 361 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (99.2% identity in 361 aa overlap). Member
+ of the Mycobacterium tuberculosis PE family, PGRS
+ subfamily of gly-rich proteins, highly similar to many
+ e.g. AAK47132|MT2812 PE_PGRS family protein from
+ Mycobacterium tuberculosis strain CDC1551 (454 aa), FASTA
+ scores: opt: 1256, E(): 2.4e-44, (56.0% identity in 377 aa
+ overlap); AAK46139|MT1866 PE_PGRS FAMILY PROTEIN from M.
+ tuberculosis strain CDC1551 (491 aa), FASTA scores: opt:
+ 1250, E(): 4.4e-44, (57.8% identity in 372 aa overlap);
+ Y278_MYCTU|Rv0278C|MTV035.06c HYPOTHETICAL PE-PGRS FAMILY
+ PROTEIN (957 aa), FASTA scores: opt: 1253, E(): 5.2e-44,
+ (55.5% identity in 400 aa overlap);
+ P71664|Rv1396c|MTCY21B4.13c HYPOTHETICAL GLYCINE-RICH 47.9
+ KDA PROTEIN (576 aa), FASTA scores: opt: 1236, E():
+ 1.8e-43, (55.55% identity in 402 aa overlap); etc.
+ Contains PS00583 pfkB family of carbohydrate kinases
+ signature 1. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 3 bp deletion (gcc-*) leads to a
+ slightly shorter product compared to its homolog in
+ Mycobacterium tuberculosis strain H37Rv (360 aa versus 361
+ aa). Mb2418 found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="pe-pgrs family protein pe_pgrs41"
+ /protein_id="SIU01033.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y109"
+ /translation="MSFLIASPEALAATATYLTGIGSAINAANAVAAAPTTEILAAGT
+ DEVSTAISALFGAHAQAYQALSAHVAAFHDQFVHTLTAGAGSYMAAEAAASPLQALQL
+ ELLNAINAPTLALLGRPLIGDGTDAAPGSGGAGGAGGILIGNGGTGGASDLAGTGRGG
+ VGGAGGAGGLFGIGGAGGGCGSAVAIGGDGGAGGAGGVFSGGGAGGAGDAIGGSGGAG
+ GTGGLLGGGGGAGGAGGAGGNGGGASNSASIGGDGGSGGAGGMLYGAGGVGGNGGAAV
+ AIGGDGGAGGRAGAIGNGGDGGNGGTSNTPGGSGGDGGNGGNAGLIGSGGNGGNAEIV
+ ISGGSVAGTGGNGGLLLGFNGTNGLP"
+ gene complement(2666389..2667444)
+ /gene="cysA1"
+ /locus_tag="BQ2027_MB2419C"
+ CDS complement(2666389..2667444)
+ /gene="cysA1"
+ /locus_tag="BQ2027_MB2419C"
+ /standard_name="cysA"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2419c, cysA1, len: 351 aa. Equivalent to Rv2397c,
+ len: 351 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 351 aa overlap). Probable cysA1,
+ sulfate-transport ATP-binding protein ABC transporter (see
+ citations below), similar to OTHER SULFATE ABC TRANSPORTER
+ ATP-BINDING PROTEINS e.g. P14788|CYSA_SYNP7 from
+ Synechococcus sp. (344 aa), FASTA scores: opt: 1112, E():
+ 2.6e-56, (54.6% identity in 328 aa overlap);
+ P74548|CYSA_SYNY3 from Synechocystis sp. (355 aa), FASTA
+ scores: opt: 1063, E(): 1.7e-53, (51.9% identity in 343 aa
+ overlap); Q9I6L0|CYSA|PA0280 from Pseudomonas aeruginosa
+ (329 aa), FASTA scores: opt: 987, E(): 3.3e-49, (49.2%
+ identity in 339 aa overlap); etc. Also similar to many
+ ATP-binding proteins from Mycobacterium tuberculosis e.g.
+ Rv2038c, Rv1238, Rv2832c, etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop), and PS00211 ABC
+ transporters family signature. BELONGS TO THE ATP-BINDING
+ TRANSPORT PROTEIN FAMILY (ABC TRANSPORTERS). Note that
+ previously known as cysA. Protein product from Mb2419c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2419c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="sulfate-transport atp-binding protein abc
+ transporter cysa1"
+ /protein_id="SIU01034.1"
+ /db_xref="GOA:P0A4W3"
+ /db_xref="InterPro:IPR003439"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR005666"
+ /db_xref="InterPro:IPR008995"
+ /db_xref="InterPro:IPR014769"
+ /db_xref="InterPro:IPR017871"
+ /db_xref="InterPro:IPR024765"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/Swiss-Prot:P0A4W3"
+ /translation="MTYAIVVADATKRYGDFVALDHVDFVVPTGSLTALLGPSGSGKS
+ TLLRTIAGLDQPDTGTITINGRDVTRVPPQRRGIGFVFQHYAAFKHLTVRDNVAFGLK
+ IRKRPKAEIKAKVDNLLQVVGLSGFQSRYPNQLSGGQRQRMALARALAVDPEVLLLDE
+ PFGALDAKVREELRAWLRRLHDEVHVTTVLVTHDQAEALDVADRIAVLHKGRIEQVGS
+ PTDVYDAPANAFVMSFLGAVSTLNGSLVRPHDIRVGRTPNMAVAAADGTAGSTGVLRA
+ VVDRVVVLGFEVRVELTSAATGGAFTAQITRGDAEALALREGDTVYVRATRVPPIAGG
+ VSGVDDAGVERVKVTST"
+ gene complement(2667461..2668279)
+ /gene="cysW"
+ /locus_tag="BQ2027_MB2420C"
+ CDS complement(2667461..2668279)
+ /gene="cysW"
+ /locus_tag="BQ2027_MB2420C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2420c, cysW, len: 272 aa. Equivalent to Rv2398c,
+ len: 272 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 272 aa overlap). Probable cysW,
+ sulfate-transport integral membrane protein ABC
+ transporter (see citations below), similar to others e.g.
+ Q9K877|CYSW|BH3129 SULFATE ABC TRANSPORTER (PERMEASE) from
+ Bacillus halodurans (287 aa), FASTA scores: opt: 765, E():
+ 4.1e-40, (43.8% identity in 249 aa overlap);
+ P27370|CYSW_SYNP7 sulfate transport system (permease)
+ protein from Synechococcus sp. strain PCC 7942 (Anacystis
+ nidulans R2) (286 aa), FASTA scores: opt: 757, E():
+ 1.3e-39, (44.3% identity in 264 aa overlap);
+ Q9I6K9|CYSW|PA0281 SULFATE TRANSPORT PROTEIN from
+ Pseudomonas aeruginosa (289 aa), FASTA scores: opt: 753,
+ E(): 2.3e-39, (44.4% identity in 250 aa overlap);
+ P16702|P76534|CYSW_ECOLI SULFATE TRANSPORT SYSTEM PERMEASE
+ from Escherichia coli (291 aa), FASTA scores: opt: 633,
+ E(): 5.7e-32, (38.2% identity in 267 aa overlap); etc.
+ Contains PS00402 Binding-protein-dependent transport
+ systems inner membrane component signature. SIMILARITY
+ WITH INTEGRAL MEMBRANE COMPONENTS OF OTHER
+ BINDING-PROTEIN-DEPENDENT TRANSPORT SYSTEMS and BELONGS TO
+ THE CYSTW SUBFAMILY. Mb2420c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SULFATE-TRANSPORT INTEGRAL MEMBRANE
+ PROTEIN ABC TRANSPORTER CYSW"
+ /protein_id="SIU01035.1"
+ /db_xref="GOA:A0A1R3Y1W5"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR005667"
+ /db_xref="InterPro:IPR011866"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1W5"
+ /translation="MTSLPAARYLVRSVALGYVFVLLIVPVALILWRTFEPGFGQFYA
+ WISTPAAISALNLSLLVVAIVVPLNVIFGVTTALVLARNRFRGKGVLQAIIDLPFAVS
+ PVIVGVSLILLWGSAGALGFVEQDLGFKIIFGLPGIVLASMFVTCPFVVREVEPVLHE
+ LGTDQEQAAATLGSGWWQTFWRITLPSIRWGLTYGIVLTVARTLGEYGAVIIVSSNLP
+ GTSQTLTLLVSDRYHRGAEYGAYALSTLLMAVSVVVLIVQMVLDAHRARAVSEG"
+ gene complement(2668276..2669127)
+ /gene="cysT"
+ /locus_tag="BQ2027_MB2421C"
+ CDS complement(2668276..2669127)
+ /gene="cysT"
+ /locus_tag="BQ2027_MB2421C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2421c, cysT, len: 283 aa. Equivalent to Rv2399c,
+ len: 283 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 283 aa overlap). Probable cysT,
+ sulfate-transport integral membrane protein ABC
+ transporter (see citations below), similar to others e.g.
+ BAB48989|MLR1667 PERMEASE PROTEIN OF SULFATE ABC
+ TRANSPORTER from Rhizobium loti (283 aa), FASTA scores:
+ opt: 756, E(): 7.9e-40, (40.95% identity in 271 aa
+ overlap); Q9K878|CYST|BH3128 SULFATE ABC TRANSPORTER
+ (PERMEASE) from Bacillus halodurans (279 aa), FASTA
+ scores: opt: 750, E(): 1.8e-39, (44.55% identity in 258 aa
+ overlap); P16701|CYST_ECOLI|CYSU|CYST|B2424 from
+ Escherichia coli (277 aa), FASTA scores: opt: 669, E():
+ 1.9e-34, (40.0% identity in 260 aa overlap); etc. Contains
+ PS00402 Binding-protein-dependent transport systems inner
+ membrane component signature, and PS00017 ATP/GTP-binding
+ site motif A (P-loop). BELONGS TO THE CYSTW SUBFAMILY.
+ Protein product from Mb2421c detected using shotgun mass
+ spectrometry. Mb2421c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SULFATE-TRANSPORT INTEGRAL MEMBRANE
+ PROTEIN ABC TRANSPORTER CYST"
+ /protein_id="SIU01036.1"
+ /db_xref="GOA:A0A1R3Y1B0"
+ /db_xref="InterPro:IPR000515"
+ /db_xref="InterPro:IPR005667"
+ /db_xref="InterPro:IPR011865"
+ /db_xref="InterPro:IPR035906"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1B0"
+ /translation="MTESLVGERRAPQFRARLSGPAGPPSVRVGMAVVWLSVIVLLPL
+ AAIVWQAAGGGWRAFWLAVSSHAAMESFRVTLTISTAVTVINLVFGLLIAWVLVRDDF
+ AGKRIVDAIIDLPFALPTIVASLVMLALYGNNSPVGLHFQHTATGVGVALAFVTLPFV
+ VRAVQPVLLEIDRETEEAAASLGANGAKIFTSVVLPSLTPALLSGAGLAFSRAIGEFG
+ SVVLIGGAVPGKTEVSSQWIRTLIENDDRTGAAAISVVLLSISFIVLLILRVVGARAA
+ KREEMAA"
+ gene complement(2669124..2670194)
+ /gene="subI"
+ /locus_tag="BQ2027_MB2422C"
+ CDS complement(2669124..2670194)
+ /gene="subI"
+ /locus_tag="BQ2027_MB2422C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2422c, subI, len: 356 aa. Equivalent to Rv2400c,
+ len: 356 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 356 aa overlap). Probable subI,
+ sulfate-binding lipoprotein component of sulfate transport
+ system (see citations below), equivalent to
+ Q9CCN3|SUBI|ML0615 (alias Q49748|B1937_F1_11, 358 aa)
+ PUTATIVE SULPHATE-BINDING PROTEIN from Mycobacterium
+ leprae (348 aa), FASTA scores: opt: 1775, E(): 2.3e-102,
+ (76.45% identity in 340 aa overlap). Also similar to
+ others and other substrate-binding proteins e.g.
+ P27366|SUBI_SYNP7|SBPA SULFATE-BINDING PROTEIN PRECURSOR
+ from Synechococcus sp. strain PCC 7942 (Anacystis nidulans
+ R2) (350 aa), FASTA scores: opt: 703, E(): 4.6e-36, (35.6%
+ identity in 351 aa overlap); Q9I6K7|SBP|PA0283
+ SULFATE-BINDING PROTEIN PRECURSOR from Pseudomonas
+ aeruginosa (332 aa), FASTA scores: opt: 591, E(): 3.7e-29,
+ (36.9% identity in 317 aa overlap); CAC49112|SMB21133
+ PUTATIVE SULFATE UPTAKE ABC TRANSPORTER PERIPLASMIC
+ SOLUTE-BINDING PROTEIN PRECURSOR from Rhizobium meliloti
+ (Sinorhizobium meliloti) (341 aa), FASTA scores: opt: 569,
+ E(): 8.8e-28, (36.15% identity in 321 aa overlap); etc.
+ BELONGS TO THE PROKARYOTIC SULFATE BINDING PROTEIN FAMILY.
+ Protein product from Mb2422c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2422c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE SULFATE-BINDING LIPOPROTEIN SUBI"
+ /protein_id="SIU01037.1"
+ /db_xref="GOA:A0A1R3Y1G6"
+ /db_xref="InterPro:IPR005669"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1G6"
+ /translation="MLSLTLSEASCIASASRWRHIIPAGVVCALIAGIGVGCHGGPSD
+ VVGRAGPDRAHTSITLVAYAVPEPGWSAVIPAFNASEQGRGVQVITSYGASADQSRGV
+ ADGKPADLVNFSVEPDIARLVKAGKVDKDWDADATKGIPFGSVVTFVVRAGNPKNIRD
+ WDDLLRPGIEVITPSPLSSGSAKWNLLAPYAAKSDGGRNNQAGIDFVNTLVNEHVKLR
+ PGSGREATDVFVQGSGDVLISYENEAIATERAGKPVQHVTPPQTFKIENPLAVVATST
+ HLGAATAFRNFQYTVQAQKLWAQAGFRPVDPAVAADFADLFPVPAKLWTIADLGGWGS
+ VDPQLFDKATGSITKIYLRATG"
+ gene 2670208..2670537
+ /locus_tag="BQ2027_MB2423"
+ CDS 2670208..2670537
+ /locus_tag="BQ2027_MB2423"
+ /note="Mb2423, -, len: 109 aa. Equivalent to Rv2401, len:
+ 109 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 109 aa overlap). Hypothetical unknown
+ protein. Equivalent to AAK46768 from Mycobacterium
+ tuberculosis strain CDC1551 (134 aa) but shorter 25 aa.
+ N-terminus extended since first submission (previously 72
+ aa)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU01038.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y130"
+ /translation="MRDFGQRSRSGGKAIAEHCRTHELHIRPRTGGESATTVQVGRSA
+ ANERADIAPRKTRCCVHVAKPNRIRLADQLARSSMGEKPGHDHQRNQRDQNQRDVRPR
+ HPGYLGA"
+ gene complement(2670522..2670725)
+ /locus_tag="BQ2027_MB2424C"
+ CDS complement(2670522..2670725)
+ /locus_tag="BQ2027_MB2424C"
+ /note="Mb2424c, -, len: 67 aa. Equivalent to Rv2401A, len:
+ 67 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 67 aa overlap). Possible conserved
+ membrane protein, highly similar, but with 29 aa shorter,
+ to ML0614|AL583919_34|Q49760 from Mycobacterium leprae (95
+ aa), FASTA scores: opt: 297, E(): 3.6e-15, (67.7% identity
+ in 65 aa overlap). Has hydrophobic stretch. Mb2424c found
+ to be expressed during exponential growth in Sauton's
+ minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE CONSERVED MEMBRANE PROTEIN"
+ /protein_id="SIU01039.1"
+ /db_xref="GOA:A0A1R3Y141"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y141"
+ /translation="MGPMNGFLSWWDGVELWLSGLPFALQALAVMPVVLALAYFTAAL
+ LDALLGRVIQLIRRARRPDQAPR"
+ gene 2670853..2672937
+ /locus_tag="BQ2027_MB2425"
+ CDS 2670853..2672937
+ /locus_tag="BQ2027_MB2425"
+ /EC_number="3.2.1.28"
+ /note="Mb2425, -, len: 642 aa. Equivalent to Rv2402, len:
+ 642 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 642 aa overlap). Conserved
+ hypothetical protein, highly similar to others e.g.
+ 9X8C4|SCE36.11c CONSERVED HYPOTHETICAL PROTEIN (FRAGMENT)
+ from Streptomyces coelicolor (612 aa), FASTA scores: opt:
+ 1283, E(): 6.5e-75, (41.9% identity in 623 aa overlap);
+ Q9RJ38|SCI8.15 HYPOTHETICAL 66.3 KDA PROTEIN from
+ Streptomyces coelicolor (595 aa), FASTA scores: opt: 1152,
+ E(): 1.7e-66, (39.9% identity in 622 aa overlap),
+ Q9S223|CI51.17 HYPOTHETICAL 68.4 KDA PROTEIN from
+ Streptomyces coelicolor (612 aa), FASTA scores: opt: 1146,
+ E(): 4.2e-66, (40.6% identity in 623 aa overlap);
+ YAY3_SCHPO|Q10211|c4h3.03c HYPOTHETICAL 74.5 kd PROTEIN
+ from Schizosaccharomyces pombe (Fission yeast) (649 aa)
+ FASTA scores: opt: 999, E(): 1.3e-56, (35.0% identity in
+ 642 aa overlap); etc. Contains possible helix-turn-helix
+ motif, at aa 224-245 (+4.68 SD). Protein product from
+ Mb2425 detected using SWATH mass spectrometry. Mb2425
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Trehalase (EC"
+ /protein_id="SIU01040.1"
+ /db_xref="GOA:A0A1R3Y140"
+ /db_xref="InterPro:IPR008928"
+ /db_xref="InterPro:IPR011613"
+ /db_xref="InterPro:IPR012341"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y140"
+ /translation="MKWTPSKSTDDDVGMVLHAQPPDQSTETAREAKALAGATDGATA
+ TSADLHAPMALSSSSPLRNPFPPIADYAFLSDWETTCLISPAGSVEWLCVPRPDSPSV
+ FGAILDRSAGHFRLGPYGVSVPSARRYLPGSLIMETTWQTHTGWLIVRDALVMGKWHD
+ IERRSRTHRRTPMDWDAEHILLRTVRCVSGTVELMMSCEPAFDYHRLGATWEYSAEAY
+ GEAIARANTEPDAHPTLRLTTNLRIGLEGREARARTRMKEGDDVFVALSWTKHPPPQT
+ YDEAADKMWQTTECWRQWINIGNFPDHPWRAYLQRSALTLKGLTYSPTGALLAASTTS
+ LPETPRGERNWDYRYAWIRDSTFALWGLYTLGLDREADDFFAFIADVSGANNNERHPL
+ QVMYGVGGERSLVEAELHHLSGYDHARPVRIGNGAYNQRQHDIWGSILDSFYLHAKSR
+ EQVPENLWPVLKRQVEEAIKHWREPDRGIWEVRGEPQHFTSSKVMCWVALDRGAKLAE
+ RQGEKSYAQQWRAIADEIKADILEHGVDSRGVFTQRYGDEALDASLLLVVLTRFLPPD
+ DPRVRNTVLAIADELTEDGLVLRYRVHETDDGLSGEEGTFTICSFWLVSALVEIGEVG
+ RAKRLCERLLSFASPLLLYAEEIEPRSGRHLGNFPQAFTHLALINAVVHVIRAEEEAD
+ SSGMFQPANAPM"
+ gene complement(2673015..2673770)
+ /gene="lppR"
+ /locus_tag="BQ2027_MB2426C"
+ CDS complement(2673015..2673770)
+ /gene="lppR"
+ /locus_tag="BQ2027_MB2426C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2426c, lppR, len: 251 aa. Equivalent to Rv2403c,
+ len: 251 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 251 aa overlap). Probable lppR,
+ conserved lipoprotein, with weak similarity with
+ MYCOBACTERIAL SERINE/THREONINE PROTEIN KINASES (EC
+ 2.7.1.-) e.g. AAK45563|MT1304 from Mycobacterium
+ tuberculosis strain CDC1551 (626 aa), FASTA scores: opt:
+ 186, E(): 0.00023, (24.4% identity in 238 aa overlap), and
+ the C-terminal part of Q11053|Rv1266c|MTCY50.16|PKNH_MYCTU
+ from Mycobacterium tuberculosis (626 aa), FASTA scores:
+ opt: 185, E()= 0.00027, (24.35% identity in 238 aa
+ overlap). Has signal peptide and appropriate positioned
+ prokaryotic lipoprotein attachment site (PS00013). Could
+ belong to the SER/THR FAMILY of protein kinases. Protein
+ product from Mb2426c detected using SWATH mass
+ spectrometry. Mb2426c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED LIPOPROTEIN LPPR"
+ /protein_id="SIU01041.1"
+ /db_xref="InterPro:IPR026954"
+ /db_xref="InterPro:IPR038232"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y147"
+ /translation="MTNRWRWVVPLFAVFLAAGCTTTTTGKAGLAPNAVPRPLMGSLI
+ QRVPLDGAALSTLLNQPFQALPPFPPVFGGSDSLGDSDVSARPADCVGVGYLTQRNVY
+ RSVEVKSVARVSWRHDGSSVKVDDLDEGVVALPSAAAADDLFARFSAQWKECDGTTLT
+ VPASAFGQRSITDVRVADSVVAATVSLRRGTHSILASVPQARAVGVRGNCVVEVAVTF
+ FGITHPSDQGSADISTSAVDIAHAMMDRISELS"
+ gene complement(2673767..2675728)
+ /gene="lepA"
+ /locus_tag="BQ2027_MB2427C"
+ CDS complement(2673767..2675728)
+ /gene="lepA"
+ /locus_tag="BQ2027_MB2427C"
+ /note="Mb2427c, lepA, len: 653 aa. Equivalent to Rv2404c,
+ len: 653 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 653 aa overlap). Probable lepA,
+ GTP-binding protein (a protein of unknown function, but
+ apparently with membrane-related functions and very
+ similar to protein synthesis elongation factors; see
+ citations below). Equivalent to
+ P53530|LEPA_MYCLE|ML0611|B1937_F3_81 GTP-BINDING PROTEIN
+ from Mycobacterium leprae (646 aa), FASTA scores: opt:
+ 3610, E(): 1.2e-205, (88.0% identity in 649 aa overlap).
+ Also highly similar to many GTP-BINDING PROTEINS LEPA e.g.
+ Q9RDC9|LEPA_STRCO|SCC77.29c from Streptomyces coelicolor
+ (622 aa), FASTA scores: opt: 3046, E(): 2.3e-172, (74.3%
+ identity in 626 aa overlap); P37949|LEPA_BACSU from B.
+ subtilis (612 aa), FASTA scores: opt: 2430, E(): 5.3e-136,
+ (58.7% identity in 610 aa overlap); etc. Contains PS00017
+ ATP/GTP-binding site motif A (P-loop), and PS00301
+ GTP-binding elongation factors signature. BELONGS TO THE
+ GTP-BINDING ELONGATION FACTOR FAMILY, LEPA SUBFAMILY.
+ Protein product from Mb2427c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2427c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GTP-BINDING PROTEIN LEPA (GTP-BINDING
+ ELONGATION FACTOR)"
+ /protein_id="SIU01042.1"
+ /db_xref="GOA:P65270"
+ /db_xref="InterPro:IPR000640"
+ /db_xref="InterPro:IPR000795"
+ /db_xref="InterPro:IPR005225"
+ /db_xref="InterPro:IPR006297"
+ /db_xref="InterPro:IPR009000"
+ /db_xref="InterPro:IPR013842"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR031157"
+ /db_xref="InterPro:IPR035647"
+ /db_xref="InterPro:IPR035654"
+ /db_xref="InterPro:IPR038363"
+ /db_xref="UniProtKB/Swiss-Prot:P65270"
+ /translation="MRTPCSQHRRDRPSAIGSQLPDADTLDTRQPPLQEIPISSFADK
+ TFTAPAQIRNFCIIAHIDHGKSTLADRMLQLTGVVDERSMRAQYLDRMDIERERGITI
+ KAQNVRLPWRVDKTDYVLHLIDTPGHVDFTYEVSRALEACEGAVLLVDAAQGIEAQTL
+ ANLYLALDRDLHIIPVLNKIDLPAADPDRYAAEMAHIIGCEPAEVLRVSGKTGEGVSD
+ LLDEVVRQVPPPQGDAEAPTRAMIFDSVYDIYRGVVTYVRVVDGKISPRERIMMMSTG
+ ATHELLEVGIVSPEPKPCEGLGVGEVGYLITGVKDVRQSKVGDTVTSLSRARGAAAEA
+ LTGYREPKPMVYSGLYPVDGSDYPNLRDALDKLQLNDAALTYEPETSVALGFGFRCGF
+ LGLLHMEITRERLEREFGLDLISTSPNVVYRVHKDDGTEIRVTNPSDWPEGKIRTVYE
+ PVVKTTIIAPSEFIGTIMELCQSRRGELGGMDYLSPERVELRYTMPLGEIIFDFFDAL
+ KSRTRGYASLDYEEAGEQEAALVKVDILLQGEAVDAFSAIVHKDTAYAYGNKMTTKLK
+ ELIPRQQFEVPVQAAIGSKIIARENIRAIRKDVLSKCYGGDITRKRKLLEKQKEGKKR
+ MKTIGRVEVPQEAFVAALSTDAAGDKGKK"
+ gene 2675749..2676318
+ /locus_tag="BQ2027_MB2428"
+ CDS 2675749..2676318
+ /locus_tag="BQ2027_MB2428"
+ /EC_number="6.5.1.4"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2428, -, len: 189 aa. Equivalent to Rv2405, len:
+ 189 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 189 aa overlap). Conserved
+ hypothetical protein, identical (but N-terminus longer 40
+ residues) to AAK46773|MT2477 HYPOTHETICAL PROTEIN from
+ Mycobacterium tuberculosis strain CDC1551. Also highly
+ similar, but N-terminus longer 38 residues, to
+ Q9RD03|SCCM1.41 HYPOTHETICAL 17.4 KDA PROTEIN from
+ Streptomyces coelicolor (154 aa), FASTA scores: opt: 451,
+ E(): 2e-22, (48.7% identity in 154 aa overlap). Shows also
+ similarity with hypothetical proteins from other species.
+ Protein product from Mb2428 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2428 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="RNA 3'-terminal phosphate cyclase (EC"
+ /protein_id="SIU01043.1"
+ /db_xref="GOA:A0A1R3Y120"
+ /db_xref="InterPro:IPR003477"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y120"
+ /translation="MQRFAENLVFTEAPKLVRHLQNTQETLRTIRQAVKITANIMTTA
+ VPSPPAEIAAGRPVTSTSCPTAARARRLVYAPDLDGRADPGEIVWTWVAYEQDPTRGK
+ DRPVLVVGRDRSVLLGLLVSSQERHAADRDWVGIGSGAWDYEGRESWVRLDRVLDVPE
+ ESIRREGAILEREVFDVVAARLRADYAWR"
+ gene complement(2676489..2676917)
+ /locus_tag="BQ2027_MB2429C"
+ CDS complement(2676489..2676917)
+ /locus_tag="BQ2027_MB2429C"
+ /note="Mb2429c, -, len: 142 aa. Equivalent to Rv2406c,
+ len: 142 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 142 aa overlap). Conserved
+ hypothetical protein. C-terminal region is identical with
+ many CBS DOMAIN PROTEIN e.g. AAK46774|MT2478 CBS DOMAIN
+ PROTEIN from Mycobacterium tuberculosis strain CDC1551 (aa
+ 47-142), FASTA scores: opt: 594, E(): 1.9e-30, (98.97%
+ identity in 97 aa overlap); etc. Also similar to other
+ hypothetical proteins e.g. AAK24594|CC2626 CBS DOMAIN
+ PROTEIN from Caulobacter crescentus (157 aa), FASTA
+ scores: opt: 377, E(): 8.3e-17, (42.55% identity in 141 aa
+ overlap); BAB47826|MLR0188 from Rhizobium loti; etc.
+ Protein product from Mb2429c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2429c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="CBS domain protein"
+ /protein_id="SIU01044.1"
+ /db_xref="InterPro:IPR000644"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y3B0"
+ /translation="MRIADVLRNKGAAVVTINPDATVGELLAGLAEQNIGAMVVVGAE
+ GVVGIVSERDVVRQLHTYGASVLSRPVAKIMSTTVATCTKSDTVDKISVLMTENRVRH
+ VPVLDGKKLIGIVSIGDVVKSRMGELEAEQQQLQSYITQG"
+ gene 2677177..2678019
+ /gene="rnz"
+ /locus_tag="BQ2027_MB2430"
+ CDS 2677177..2678019
+ /gene="rnz"
+ /locus_tag="BQ2027_MB2430"
+ /note="Mb2430, -, len: 280 aa. Equivalent to Rv2407, len:
+ 273 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (97.5% identity in 280 aa overlap). Conserved hypothetical
+ protein, highly similar (but longer at N-terminus) to
+ AAK46775|MT2479 putative arylsulfatase from Mycobacterium
+ tuberculosis strain CDC1551 (224 aa) FASTA scores: opt:
+ 1433, E(): 2.5e-81, (96.43% identity in 224 aa overlap);
+ O33130|MLCL536.01 HYPOTHETICAL PROTEIN from Mycobacterium
+ leprae (220 aa), FASTA scores: opt: 658, E(): 1.5e-33,
+ (56.75% identity in 215 aa overlap). Also similar to
+ AAK23160|CC1176 Metallo-beta-lactamase family protein from
+ Caulobacter crescentus (317 aa), FASTA scores: opt: 286,
+ E(): 1.8e-10, (33% identity in 291 aa overlap). And
+ similar to other hypothetical proteins eg
+ Q49744|B1937_C1_163 HYPOTHETICAL 22.6 KDA PROTEIN
+ (PRECURSOR) from Mycobacterium leprae (211 aa), FASTA
+ scores: opt: 623, E(): 2.1e-31, (56.3% identity in 206 aa
+ overlap); O27859|MTH1831 CONSERVED PROTEIN from
+ Methanothermobacter thermautotrophicus (307 aa), FASTA
+ scores: opt: 268, E(): 2.3e-09, (28.35% identity in 307 aa
+ overlap); etc. REMARK-M.bovis-M.tuberculosis: In
+ Mycobacterium bovis, a 21 bp in-frame insertion leads to a
+ longer product compared to its homolog in Mycobacterium
+ tuberculosis strain H37Rv (280 aa versus 273 aa). Protein
+ product from Mb2430 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2430 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="MBL-fold metallo-hydrolase superfamily"
+ /protein_id="SIU01045.1"
+ /db_xref="GOA:Q7TYN1"
+ /db_xref="InterPro:IPR001279"
+ /db_xref="InterPro:IPR013471"
+ /db_xref="InterPro:IPR036866"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYN1"
+ /translation="MLEITLLGTGSPIPDPDRAGPSTLVRAGAQAFLVDCGRGVLQRA
+ AAVGVGAAGLSAVLLTHLHSDHIAELGDVLITSWVTNFAADPAPLPIIGPPGTAEVVE
+ ATLKAFGHDIGYRIAHHADLTTPPPIEVHEYTAGPAWDRDGVTIRVAPTDHRPVTPTI
+ GFRIESDGASVVLAGDTVPCDSLDQLAAGADALVHTVIRKDIVTQIPQQRVKDICDYH
+ SSVQEAAATANRAGVGTLVMTHYVPAIGPGQEEQWRALAATEFSGRIEVGNDLHRVEV
+ HPRR"
+ gene 2678612..2679331
+ /gene="PE24"
+ /locus_tag="BQ2027_MB2431"
+ CDS 2678612..2679331
+ /gene="PE24"
+ /locus_tag="BQ2027_MB2431"
+ /note="Mb2431, PE24, len: 239 aa. Equivalent to Rv2408,
+ len: 239 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 239 aa overlap). Possibly a member of
+ PE family, similar to AAK46440|MT2159 from Mycobacterium
+ tuberculosis strain CDC1551 (491 aa) FASTA scores: opt:
+ 269, E(): 5.4e-08, (38.45% identity in 156 aa overlap) and
+ AAK45466|MT1209 from Mycobacterium tuberculosis strain
+ CDC1551 (308 aa), FASTA scores: opt: 265, E(): 6.3e-08,
+ (36.0% identity in 197 aa overlap)."
+ /codon_start=1
+ /transl_table=11
+ /product="possible pe family-related protein pe24"
+ /protein_id="SIU01046.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1C0"
+ /translation="MLIARPDILCSRGPEAMRAKAADLDLAAAAKTVGVQPAADQVAA
+ AIAAILLSHAQIYQDISTQMAAFHDQLVENRTADSTSYASAEANAQQSLLNAMDAPSW
+ QQRRETVGEVGLPADPAGSGTATAAVAAATTARAGSRSAAQATVAPIGGLKLRRESAL
+ SQPGDLHHHVEVGDALPRVDPFQRGNVGVVAAYTHTDVLLGDLIVIGGVVVPPSTGPG
+ LNPGMAAPVYRLSHHGITLRV"
+ gene complement(2679089..2679928)
+ /locus_tag="BQ2027_MB2432C"
+ CDS complement(2679089..2679928)
+ /locus_tag="BQ2027_MB2432C"
+ /note="Mb2432c, -, len: 279 aa. Equivalent to Rv2409c,
+ len: 279 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 279 aa overlap). Conserved
+ hypothetical protein, equivalent to
+ Q49757|YP69_MYCLE|G466976|B1937_F2_39 HYPOTHETICAL PROTEIN
+ from Mycobacterium leprae (279 aa), FASTA scores: opt:
+ 1564, E(): 4.6e-95, (82.1% identity in 279 aa overlap).
+ Also similar to others e.g. Q9RSX6|DR1993 from Deinococcus
+ radiodurans (274 aa), FASTA scores: opt: 494, E(): 4e-25,
+ (35.1% identity in 282 aa overlap); BAB49898|Mll2875 from
+ Rhizobium loti (Mesorhizobium loti) (294 aa), FASTA
+ scores: opt: 382, E(): 8.9e-18, (29.75% identity in 269 aa
+ overlap); Q9I305|PA1732 from Pseudomonas aeruginosa (266
+ aa), FASTA scores: opt: 326, E(): 3.7e-14, (31.25%
+ identity in 275 aa overlap); etc. Also similar to
+ Rv2569c|MTCY227.32 from Mycobacterium tuberculosis.
+ Protein product from Mb2432c detected using SWATH mass
+ spectrometry. Mb2432c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein containing transglutaminase-like domain,
+ putative cysteine protease"
+ /protein_id="SIU01047.1"
+ /db_xref="InterPro:IPR002931"
+ /db_xref="InterPro:IPR013589"
+ /db_xref="InterPro:IPR038765"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1H6"
+ /translation="MWRTRVVHTTGYVYQSPVTASYNEARLTPRSSSRQNLVLNRVET
+ IPATRSYRYIDYWGTAVTAFDLHAPHTELTVTSSSVVETERPEPLAAKATWADLQSTA
+ VIDRFDEVLRPTPHTPASARVDAVGRRIRKCHEPSEAVVAAARWARSELDYIPGTTSV
+ HSSGLDALEQGKGVCQDFVHLSLMVLRSMGIPCRYVSGYLHPKRDAVVGKTVDGRSHA
+ WVQAWTGGWWHYDPTNDNEITEQYISVGVGRDYTDVSPLKGIYSGEGVTDLDVVVEIT
+ RLA"
+ gene complement(2679928..2680905)
+ /locus_tag="BQ2027_MB2433C"
+ CDS complement(2679928..2680905)
+ /locus_tag="BQ2027_MB2433C"
+ /note="Mb2433c, -, len: 325 aa. Equivalent to Rv2410c,
+ len: 325 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 325 aa overlap). Conserved
+ hypothetical protein, equivalent to Q49770|CAC30114|ML0606
+ CONSERVED HYPOTHETICAL PROTEIN from Mycobacterium leprae
+ (325 aa), FASTA scores: opt: 1928, E(): 3.5e-117, (90.75%
+ identity in 325 aa overlap). Also some similarity with
+ other hypothetical proteins e.g. Q9RST2|DR2041 CONSERVED
+ HYPOTHETICAL PROTEIN from Deinococcus radiodurans (316
+ aa), FASTA scores: opt: 329, E(): 5.3e-14, (32.4% identity
+ in 318 aa overlap); C-terminus of Q9HUN7|PA4927
+ HYPOTHETICAL PROTEIN from Pseudomonas aeruginosa (830 aa),
+ FASTA scores: opt: 297, E(): 1.5e-11, (27.6% identity in
+ 315 aa overlap); etc. Protein product from Mb2433c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2433c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein containing domains DUF403"
+ /protein_id="SIU01048.1"
+ /db_xref="InterPro:IPR007296"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y139"
+ /translation="MLARNAEALYWIGRYVERADDTARILDVAVHQLLEDSSVDPDQA
+ SRLLLRVLGIEPPDHELDVWSLTDLVAFSTNSQGGSSIVDAISAARENAKSAREVTSS
+ ETWECLNTTYNALPERERAAKRLGPHEFLSFIEGRAAMFAGLADSTLLRDDGYRFMLL
+ GRAIERVDMTVRLLLSRVGDSASSPAWVTLLRSAGAHDTYLRTYRGVLDAGRVVEFMM
+ LDRLFPRSVFHSLKLAEHNLAELMHNPHSRIGATTEAQRLLGQARSELEFVQPGVLLE
+ TLESRLAGLQTTCRDVGDALALQYFHAAPWVAWSDAGQRGQLVGSQEES"
+ gene complement(2680905..2682560)
+ /locus_tag="BQ2027_MB2434C"
+ CDS complement(2680905..2682560)
+ /locus_tag="BQ2027_MB2434C"
+ /note="Mb2434c, -, len: 551 aa. Equivalent to Rv2411c,
+ len: 551 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 551 aa overlap). Hypothetical protein,
+ highly similar to
+ Q49755|YO11_MYCLE|ML0605|MLCL536.05c|U1937B|B1937_F1_4
+ HYPOTHETICAL 61.8 KDA PROTEIN from Mycobacterium leprae
+ (561 aa), FASTA scores, opt: 3163, E(): 4.1e-178, (87.35%
+ identity in 554 aa overlap). Also highly similar, except
+ in N-terminus, to others e.g. Q55587|Y335_SYNY3|SLL0335
+ HYPOTHETICAL PROTEIN from Synechocystis sp. strain PCC
+ 6803 (481 aa), FASTA scores: opt: 1620, E(): 1.2e-87,
+ (52.8% identity in 468 aa overlap); Q9I307|PA1730
+ HYPOTHETICAL PROTEIN from Pseudomonas aeruginosa (470 aa),
+ FASTA scores: opt: 1574, E(): 5.8e-85, (52.7% identity in
+ 467 aa overlap); Q9RST1|DR2042 CONSERVED HYPOTHETICAL
+ PROTEIN from Deinococcus radiodurans (655 aa), FASTA
+ scores: opt: 1561, E(): 4.4e-84, (53.3% identity in 467 aa
+ overlap); etc. Protein product from Mb2434c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2434c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Protein containing domains DUF404, DUF407"
+ /protein_id="SIU01049.1"
+ /db_xref="InterPro:IPR007302"
+ /db_xref="InterPro:IPR016450"
+ /db_xref="UniProtKB/Swiss-Prot:P65002"
+ /translation="MRRVSLPNQLNETRRRSPTRGERIFGGYNTSDVYAMAFDEMFDA
+ QGIVRGPYKGIYAELAPSDASELKARADALGRAFIDQGITFSLSGQERPFPLDLVPRV
+ ISAPEWTRLERGITQRVKALECYLDDIYGDQEILRDGVIPRRLVTSCEHFHRQAVGIV
+ PPNGVRIHVAGIDLIRDHRGDFRVLEDNLRSPSGVSYVMENRRTMARVFPNLFATHRV
+ RAVDDYASHLLRALRNSAATNEADPTVVVLTPGVYNSAYFEHSLLARQMGVELVEGRD
+ LFCRDNQVYMRTTEGERQVDVIYRRIDDAFLDPLQFRADSVLGVAGLVNAARAGNVVL
+ SSAIGNGVGDDKLVYTYVPTMIEYYLHEKPLLANVETLRCWLDDEREEVLDRIRELVL
+ KPVEGSGGYGIVFGPEASQAELAAVSQKIRDDPRSWIAQPMMELSTVPTRIEGTLAPR
+ YVDLRPFAVNDGNEVWVLPGGLTRVALVEGSRVVNSSQGGGSKDTWVLAPRASAAARE
+ LGAAQIVRSLPQPLCDPTVDASGYEPHDQQPQQQQQQQQQAFH"
+ gene 2682670..2682930
+ /gene="rpsT"
+ /locus_tag="BQ2027_MB2435"
+ CDS 2682670..2682930
+ /gene="rpsT"
+ /locus_tag="BQ2027_MB2435"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2435, rpsT, len: 86 aa. Equivalent to Rv2412,
+ len: 86 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 86 aa overlap). Probable rpsT, 30s
+ ribosomal protein s20, equivalent to
+ O33132|RS20_MYCLE|L0604|MLCL536.06 30S RIBOSOMAL PROTEIN
+ S20 from Mycobacterium leprae (86 aa), FASTA scores: opt:
+ 456, E(): 4.6e-24, (87.20% identity in 86 aa overlap).
+ Also highly similar or similar to others e.g.
+ Q9RDM3|RPST|SCC123.01 30S RIBOSOMAL PROTEIN S20 from
+ Streptomyces coelicolor (88 aa), FASTA scores: opt: 363,
+ E(): 7.1e-18, (70.95% identity in 86 aa overlap);
+ Q9KD79|RPST|BH1339 RIBOSOMAL PROTEIN S20 (BS20) from
+ Bacillus halodurans (91 aa), FASTA scores: opt: 252, E():
+ 1.8e-10, (49.4% identity in 85 aa overlap);
+ P02378|RS20_ECOLI 30s ribosomal protein s20 from
+ Escherichia coli (86 aa), FASTA scores: opt: 210, E():
+ 1e-07, (42.4% identity in 85 aa overlap); etc. BELONGS TO
+ THE S20P FAMILY OF RIBOSOMAL PROTEINS. Protein product
+ from Mb2435 detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb2435 found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="30s ribosomal protein s20 rpst"
+ /protein_id="SIU01050.1"
+ /db_xref="GOA:P66506"
+ /db_xref="InterPro:IPR002583"
+ /db_xref="InterPro:IPR036510"
+ /db_xref="UniProtKB/Swiss-Prot:P66506"
+ /translation="MANIKSQQKRNRTNERARLRNKAVKSSLRTAVRAFREAAHAGDK
+ AKAAELLASTNRKLDKAASKGVIHKNQAANKKSALAQALNKL"
+ gene complement(2682946..2683896)
+ /locus_tag="BQ2027_MB2436C"
+ CDS complement(2682946..2683896)
+ /locus_tag="BQ2027_MB2436C"
+ /EC_number="2.7.7.7"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2436c, -, len: 316 aa. Equivalent to Rv2413c,
+ len: 316 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 316 aa overlap). Conserved
+ hypothetical protein, highly similar to
+ O33133|MLCL536.07c|ML0603|Q49756|G466975|B1937_F2_36
+ hypothetical 39.1 KDA protein from Mycobacterium leprae
+ (389 aa), FASTA scores: opt: 1683, E(): 1.8e-88, (83.9%
+ identity in 316 aa overlap). ML0603 is a putative
+ lipoprotein with an N-terminal signal sequence and
+ appropriately positioned prokaryotic lipoprotein lipid
+ attachment site that is not present in Rv2413c as this
+ seems to be 73 aa shorter. Also some similarity with
+ various proteins from other organisms e.g.
+ Q9RDM2|SCC123.02c PUTATIVE DNA-BINDING PROTEIN from
+ Streptomyces coelicolor (336 aa), FASTA scores: opt: 792,
+ E(): 6.1e-38, (42.4% identity in 316 aa overlap);
+ Q9HX31|HOLA|PA3989 DNA POLYMERASE III, DELTA SUBUNIT from
+ Pseudomonas aeruginosa (345 aa), FASTA scores: opt: 173,
+ E(): 0.0084, (25.4% identity in 307 aa overlap); etc.
+ Protein product from Mb2436c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2436c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA polymerase III delta subunit (EC"
+ /protein_id="SIU01051.1"
+ /db_xref="GOA:A0A1R3Y156"
+ /db_xref="InterPro:IPR008921"
+ /db_xref="InterPro:IPR010372"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y156"
+ /translation="MHLVLGDEELLVERAVADVLRSARQRAGTADVPVSRMRAGDVGA
+ YELAELLSPSLFAEERIVVLGAAAEAGKDAAAVIESAAADLPAGTVLVVVHSGGGRAK
+ SLANQLRSMGAQVHPCARITKVSERADFIRSEFASLRVKVDDETVTALLDAVGSDVRE
+ LASACSQLVADTGGAVDAAAVRRYHSGKAEVRGFDIADKAVAGDVAGAAEALRWAMMR
+ GEPLVVLADALAEAVHTIGRVGPQSGDPYRLAAQLGMPPWRVQKAQKQARRWSRDTVA
+ TAMRLVAELNANVKGAVADADYALESAVRQVAELVADRGR"
+ gene complement(2683901..2685472)
+ /locus_tag="BQ2027_MB2437C"
+ CDS complement(2683901..2685472)
+ /locus_tag="BQ2027_MB2437C"
+ /note="Mb2437c, -, len: 523 aa. Similar to Rv2414c, len:
+ 514 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 483 aa overlap). Conserved
+ hypothetical protein, showing some similarity with COME
+ OPERON PROTEINS 3 (COMEC OR COME3) e.g. Q9RTB1|DR1854
+ PUTATIVE COMPETENCE PROTEIN COMEC/REC2 from Deinococcus
+ radiodurans (755 aa), FASTA scores: opt: 311, E():
+ 8.2e-11, (27.3% identity in 538 aa overlap);
+ P73100|COME|SLL1929 COME PROTEIN from Synechocystis sp.
+ strain PCC 6803 (709 aa), FASTA scores: opt: 302, E():
+ 2.6e-10, (26.3% identity in 323 aa overlap) (no similarity
+ on N-terminus); P39695|CME3_BACSU COME OPERON PROTEIN 3
+ from Bacillus subtilis (776 aa), FASTA scores: opt: 273,
+ E(): 1.4e-08, (25.2% identity in 282 aa overlap) (no
+ similarity on N-terminus); etc.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium bovis, a
+ single base insertion (*-t) leads to a longer product with
+ a different COOH part compared to its homolog in
+ Mycobacterium tuberculosis H37Rv (523 aa versus 514 aa).
+ Mb2437c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="DNA internalization-related competence protein
+ ComEC/Rec2"
+ /protein_id="SIU01052.1"
+ /db_xref="GOA:A0A1R3Y162"
+ /db_xref="InterPro:IPR004477"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y162"
+ /translation="MGFGASRLDVRLVPAALVSWIVTAAGIVWPIGNVCALCCVVVAL
+ GGGALWWCVARRSWHAPRLGSISAGLVAVGMVGAGYGLAVALRSEAVDRHPITVAFGT
+ SALVTVTPSESPVSLGRGRLMFRATVQRLRDDETSGRVVVFARALDFGELMVGQPVQF
+ RARISRPARHDLTVAVFNATGRPTVGRAGPVHRAAHIVRHRFAAAVREVLPADQATML
+ PALVLGDTSTVTALTSREFRAAGLTHLTAVSGANVTIVCAAALVSARLIGPRAAVVCA
+ AVALVAFVILVQPTASVLRAAVMGAIALVGMLSARRRQAIPALSGSVLVLLAAAPHLA
+ VDIGFALSVAATGALVVIAPVWSRRLVDRGCPKVLADALAVAAAAQLVTAPLVAAISG
+ RVSLVAVVANLAVAAVIAPITVLGSVAAVLVVPWPAGAQVLIRFTGPEVWWVLRVAHW
+ ASGVPAATVPVAAGLPGVLLVGGATVFTVAQWRLALVSRGHVQNDGGGRHMSACLVAV
+ RAGRPFVTPSWGERG"
+ gene complement(2685487..2686380)
+ /locus_tag="BQ2027_MB2438C"
+ CDS complement(2685487..2686380)
+ /locus_tag="BQ2027_MB2438C"
+ /note="Mb2438c, -, len: 297 aa. Equivalent to Rv2415c,
+ len: 297 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 297 aa overlap). Hypothetical protein,
+ with some similarity in C-terminal part to comE operon
+ proteins 1 e.g. Q9EU10|COME|COME4|COME1|COME2|COME3 COME
+ PROTEIN (a competence protein with DNA-binding activity)
+ from Neisseria gonorrhoeae (99 aa), FASTA scores: opt:
+ 190, E(): 0.0032, (49.2% identity in 61 aa overlap);
+ Q9JYB8|NMB1657 from Neisseria meningitidis (205 aa) FASTA
+ scores: opt: 191, E(): 0.0052, (49.2% identity in 61 aa
+ overlap); CME1_BACSU|P39694 come operon protein 1 from
+ Bacillus subtilis (205 aa), FASTA scores, opt: 181, E():
+ 0.017 (29.8% identity in 218 aa overlap); etc. Mb2438c
+ found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="Late competence protein ComEA, DNA receptor"
+ /protein_id="SIU01053.1"
+ /db_xref="GOA:A0A1R3Y127"
+ /db_xref="InterPro:IPR003583"
+ /db_xref="InterPro:IPR010994"
+ /db_xref="InterPro:IPR019554"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y127"
+ /translation="MRTELPAERLQRRLGAVPDIDSHAASAHLDPEPHDPTDDGPDHD
+ EPRDDPNSLLPRWLPDTSRGQGWADRIRADPGRAGAVALAVIAALAVLVTVFTLIRDR
+ TEPVMSAKLPPVEPVSPTNPRSSASPGSPDRSGLPVVVSVVGLVHTPGLVTLAPGARI
+ ADALQAAGGAVDGADTVGLNMARQLGDGEQIVVGLAPPSGQPRVLGSSVGAGTPGPAG
+ TSGTATTGPKTAPKTAEVLDLNTATVEQLDALPGIGPVTAAAIVAWRQRNGRFTSVDQ
+ LADVDGIGPARLDKLRNLVRV"
+ gene complement(2686720..2687946)
+ /gene="eis"
+ /locus_tag="BQ2027_MB2439C"
+ CDS complement(2686720..2687946)
+ /gene="eis"
+ /locus_tag="BQ2027_MB2439C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2439c, -, len: 408 aa. Equivalent to Rv2416c,
+ len: 408 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.8% identity in 408 aa overlap). Conserved hypothetical
+ protein, sharing similarity with Q9F309|SCC80.10
+ HYPOTHETICAL 44.7 KDA PROTEIN from Streptomyces coelicolor
+ (413 aa), FASTA scores: opt: 382, E(): 1e-16, (31.45%
+ identity in 407 aa overlap); Q9K4F4|SCD66.23 CONSERVED
+ HYPOTHETICAL PROTEIN from Streptomyces coelicolor (418
+ aa), FASTA scores: opt: 238, E(): 1.3e-07, (36.5% identity
+ in 364 aa overlap): and Q54238|G1139577|ORF5 hypothetical
+ protein from Streptomyces griseus (416 aa), FASTA scores:
+ opt: 237, E(): 1.5e-07, (34.0 identity in 423 aa overlap).
+ Protein product from Mb2439c detected using SWATH mass
+ spectrometry. Mb2439c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="enhanced intracellular survival protein
+ eis,gcn5-related n-acetyltransferase"
+ /protein_id="SIU01054.1"
+ /db_xref="GOA:P59772"
+ /db_xref="InterPro:IPR000182"
+ /db_xref="InterPro:IPR016181"
+ /db_xref="InterPro:IPR022902"
+ /db_xref="InterPro:IPR025559"
+ /db_xref="InterPro:IPR036527"
+ /db_xref="InterPro:IPR041380"
+ /db_xref="UniProtKB/Swiss-Prot:P59772"
+ /translation="MPQSDSVTVTLCSPTEDDWPGMFLLAAASFTDFIGPESATAWRT
+ LVPTDGAVVVRDGAGPGSEVVGMALYMDLRLAVPGEVVLPTAGLSFVAVAPTHRRRGL
+ LRAMCAELHRRIADSGYPVAALHASEGGIYGRFGYGPATTLHELTVDRRFARFHADAP
+ GGGLGGSSVRLVRPTEHRGEFEAIYERWRQQVPGGLLRPQVLWDELLAECKAAPGGDR
+ ESFALLHPDGYALYRVDRTDLKLARVSELRAVTADAHCALWRALIGLDSMERISIITH
+ PQDPLPHLLTDTRLARTTWRQDGLWLRIMNVPAALEARGYAHEVGEFSTVLEVSDGGR
+ FALKIGDGRARCTPTDAAAEIEMDRDVLGSLYLGAHRASTLAAANRLRTKDSQLLRRL
+ DAAFASDVPVQTAFEF"
+ gene complement(2688068..2688910)
+ /locus_tag="BQ2027_MB2440C"
+ CDS complement(2688068..2688910)
+ /locus_tag="BQ2027_MB2440C"
+ /note="Mb2440c, -, len: 280 aa. Equivalent to Rv2417c,
+ len: 280 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 280 aa overlap). Conserved
+ hypothetical protein, highly similar to Q9RDL7|SCC123.07c
+ HYPOTHETICAL 29.2 KDA PROTEIN from Streptomyces coelicolor
+ (281 aa), FASTA scores: opt: 579, E(): 3.6e-27, (38.3%
+ identity in 274 aa overlap). Also some similarity with
+ DEGV proteins or hypothetical proteins from other
+ organisms, e.g. Q9RSY3|DR1986 from Deinococcus radiodurans
+ (281 aa), FASTA scores: opt: 393, E(): 3.4e-16, (31.0%
+ identity in 280 aa overlap); P32436|DEGV_BACSU from
+ Bacillus subtilis (281 aa), FASTA scores: opt: 365, E():
+ 1.5e-14, (27.8% identity in 284 aa overlap);
+ BAB41937|BAB46307|SA0704|SAV0749 Conserved hypothetical
+ protein from Staphylococcus aureus strain Mu50 and N315
+ (288 aa), FASTA scores: opt: 371, E(): 7e-15, (28.85%
+ identity in 281 aa overlap); etc. Protein product from
+ Mb2440c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2440c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="DegV family protein"
+ /protein_id="SIU01055.1"
+ /db_xref="GOA:P67369"
+ /db_xref="InterPro:IPR003797"
+ /db_xref="UniProtKB/Swiss-Prot:P67369"
+ /translation="MTVVVVTDTSCRLPADLREQWSIRQVPLHILLDGLDLRDGVDEI
+ PDDIHKRHATTAGATPVELSAAYQRALADSGGDGVVAVHISSALSGTFRAAELTAAEL
+ GPAVRVIDSRSAAMGVGFAALAAGRAAAAGDELDTVARAAAAAVSRIHAFVAVARLDN
+ LRRSGRISGAKAWLGTALALKPLLSVDDGKLVLVQRVRTVSNATAVMIDRVCQLVGDR
+ PAALAVHHVADPAAANDVAAALAERLPACEPAMVTAMGPVLALHVGAGAVGVCVDVGA
+ SPPA"
+ gene complement(2688991..2689734)
+ /gene="octT"
+ /locus_tag="BQ2027_MB2441C"
+ CDS complement(2688991..2689734)
+ /gene="octT"
+ /locus_tag="BQ2027_MB2441C"
+ /EC_number="2.3.1.273"
+ /note="Mb2441c, -, len: 247 aa. Equivalent to Rv2418c,
+ len: 247 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 247 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb2441c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2441c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Diglucosylglycerate octanoyltransferase (DGG
+ octanoyltransferase) (EC"
+ /protein_id="SIU01056.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1D0"
+ /translation="MSSRRGRRPALLVFADSLAYYGPTGGLPADDPRIWPNIVASQLD
+ WDLELIGRIGWTCRDVWWAATQDPRAWAALPRAGAVIFATGGMDSLPSVLPTALRELI
+ RYVRPSWLRRWVRDGYAWVQPRLSPVARAALPPHLTAEYLEKTRGAIDFNRPGIPIIA
+ SLPSVHIAETYGKAHHGRAGTVAAITEWAQHHDIPLVDLKAAVAEQILSGYGNRDGIH
+ WNFEAHQAVAELMLKALAEAGVPNEKSRG"
+ gene complement(2689724..2690395)
+ /gene="gpgp"
+ /locus_tag="BQ2027_MB2442C"
+ CDS complement(2689724..2690395)
+ /gene="gpgp"
+ /locus_tag="BQ2027_MB2442C"
+ /note="Mb2442c, -, len: 223 aa. Equivalent to Rv2419c,
+ len: 223 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.6% identity in 223 aa overlap). Probable
+ phosphoglycerate mutase (EC 5.4.2.1), equivalent to
+ Q9CC00|ML1452 POSSIBLE PHOSPHOGLYCERATE MUTASE from
+ Mycobacterium leprae (224 aa), FASTA scores: opt: 1206,
+ E(): 8.8e-68, (80.35% identity in 224 aa overlap). Also
+ highly similar to Q9RDL0|SCC123.14c PUTATIVE
+ PHOSPHOGLYCERATE MUTASE from Streptomyces coelicolor (223
+ aa), FASTA scores: opt: 431, E(): 9.4e-20, (40.85%
+ identity in 213 aa overlap); and similar to others e.g.
+ Q9RVD2|DR1097 from Deinococcus radiodurans (232 aa), FASTA
+ scores: opt: 291, E(): 4.6e-11, (39.3% identity in 173 aa
+ overlap); etc. Some similarity to
+ Q10512|Rv2228c|Y019_MYCTU|MT2287|MTcy427.09c hypothetical
+ 39.2 kd protein from Mycobacterium tuberculosis (364 aa)
+ FASTA scores: opt: 196, E(): 2.8e-06, (45.6% identity in
+ 79 aa overlap). Contains PS00175 Phosphoglycerate mutase
+ family phosphohistidine signature. BELONGS TO THE
+ PHOSPHOGLYCERATE MUTASE FAMILY. Protein product from
+ Mb2442c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2442c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="glucosyl-3-phosphoglycerate phosphatase gpgp"
+ /protein_id="SIU01057.1"
+ /db_xref="GOA:A0A1R3Y1I3"
+ /db_xref="InterPro:IPR001345"
+ /db_xref="InterPro:IPR013078"
+ /db_xref="InterPro:IPR029033"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1I3"
+ /translation="MRARRLVMLRHGQTDYNVGSRMQGQLDTELSELGRTQAVAAAEV
+ LGKRQPLLIVSSDLRRAYDTAVKLGERTGLVVRVDTRLRETHLGDWQGLTHAQIDADA
+ PGARLAWREDATWAPHGGESRVDVAARSRPLVAELVASEPEWGGADEPDRPVVLVAHG
+ GLIAVLSAALLKLPVANWPALGGMGNASWTQLSGHWAPGSDFESIRWRLDVWNASAQV
+ SSDVL"
+ gene complement(2690392..2690772)
+ /gene="rsfS"
+ /locus_tag="BQ2027_MB2443C"
+ CDS complement(2690392..2690772)
+ /gene="rsfS"
+ /locus_tag="BQ2027_MB2443C"
+ /note="Mb2443c, -, len: 126 aa. Equivalent to Rv2420c,
+ len: 126 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 126 aa overlap). Conserved
+ hypothetical protein, equivalent to Q9CBZ9|ML1453
+ HYPOTHETICAL PROTEIN from Mycobacterium leprae (129 aa),
+ FASTA scores: opt: 681, E(): 1.6e-38, (87.0% identity in
+ 123 aa overlap). Also highly similar to Q9RDK9|SCC123.15c
+ HYPOTHETICAL PROTEIN from Streptomyces coelicolor (148
+ aa), FASTA scores: opt: 447, E(): 5.8e-23, (52.7% identity
+ in 129 aa overlap); and similar to others e.g.
+ P54457|YQEL_BACSU HYPOTHETICAL PROTEIN from Bacillus
+ subtilis (118 aa), FASTA scores: opt: 318, E(): 1.8e-14,
+ (37.3% identity in 110 aa overlap); Q9KD89|BH1328
+ HYPOTHETICAL PROTEIN from Bacillus halodurans (117 aa),
+ FASTA scores: opt: 296, E(): 5.1e-13, (37.6% identity in
+ 109 aa overlap); etc. Protein product from Mb2443c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2443c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Ribosomal silencing factor RsfA"
+ /protein_id="SIU01058.1"
+ /db_xref="GOA:A0A1R3Y150"
+ /db_xref="InterPro:IPR004394"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y150"
+ /translation="MTANREAIDMARVAAGAAAAKLADDVVVIDVSGQLVITDCFVIA
+ SGSNERQVNAIVDEVEEKMRQAGYRPARREGAREGRWTLLDYRDIVVHIQHQDDRNFY
+ ALDRLWGDCPVVPVDLSANSAGAQ"
+ gene complement(2690769..2691404)
+ /gene="nadD"
+ /locus_tag="BQ2027_MB2444C"
+ CDS complement(2690769..2691404)
+ /gene="nadD"
+ /locus_tag="BQ2027_MB2444C"
+ /note="Mb2444c, nadD, len: 211 aa. Equivalent to Rv2421c,
+ len: 211 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.5% identity in 211 aa overlap). Probable nadD,
+ nicotinate-nucleotide adenylyltransferase (EC 2.7.7.18),
+ equivalent to Q9CBZ8|NADD_MYCLE|ML1454 PROBABLE
+ NICOTINATE-NUCLEOTIDE ADENYLYLTRANSFERASE from
+ Mycobacterium leprae (214 aa), FASTA scores: opt: 1125,
+ E(): 2.7e-66, (80.2% identity in 212 aa overlap). Also
+ highly similar to Q9RDK7|NADD_STRCO PROBABLE
+ NICOTINATE-NUCLEOTIDE ADENYLYLTRANSFERASE from
+ Streptomyces coelicolor (188 aa), FASTA scores: opt: 855,
+ E(): 9.8e-49, (66.5% identity in 194 aa overlap); and
+ similar to others e.g. P54455|NADD_BACSU from Bacillus
+ subtilis (189 aa), FASTA scores: opt: 351, E(): 7e-16,
+ (36.1% identity in 191 aa overlap); etc. BELONGS TO THE
+ NADD FAMILY. Protein product from Mb2444c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2444c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NICOTINATE-NUCLEOTIDE
+ ADENYLYLTRANSFERASE NADD (DEAMIDO-NAD(+)
+ PYROPHOSPHORYLASE) (DEAMIDO-NAD(+) DIPHOSPHORYLASE)
+ (NICOTINATE MONONUCLEOTIDE ADENYLYLTRANSFERASE) (NAMN
+ ADENYLYLTRANSFERASE)"
+ /protein_id="SIU01059.1"
+ /db_xref="GOA:Q7TYM1"
+ /db_xref="InterPro:IPR004821"
+ /db_xref="InterPro:IPR005248"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYM1"
+ /translation="MGGTFDPIHYGHLVAASEVADLFDLDEVVFVPSGQPWQKGRQVS
+ AAEHRYLMTVIATASNPRFSVSRVDIDRGGPTYTKDTLADLHALHPDSELYFTTGADA
+ LASIMSWQGWEELFELARFVGVSRPGYELRNEHITSLLGQLAKDALTLVEIPALAISS
+ TDCRQRAEQSRPLWYLMPDSVVQYVSKCRLYCGACDAGARSTTSLAAGNGL"
+ gene 2691679..2691951
+ /locus_tag="BQ2027_MB2445"
+ CDS 2691679..2691951
+ /locus_tag="BQ2027_MB2445"
+ /note="Mb2445, -, len: 90 aa. Equivalent to Rv2422, len:
+ 90 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 90 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU01060.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y160"
+ /translation="MPASVSTVLVDTSVAVAPVVADHDHHEDTFQALRGRTLGLAGHA
+ AFERRTLATVAKLLAHTFPATRFLGAGAAMSLLPELAPAEIAGGAV"
+ gene 2692193..2693239
+ /locus_tag="BQ2027_MB2446"
+ CDS 2692193..2693239
+ /locus_tag="BQ2027_MB2446"
+ /note="Mb2446, -, len: 348 aa. Equivalent to Rv2423, len:
+ 348 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 348 aa overlap). Hypothetical unknown
+ protein. Protein product from Mb2446 detected using SWATH
+ mass spectrometry. Mb2446 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="SAM-dependent methyltransferase"
+ /protein_id="SIU01061.1"
+ /db_xref="InterPro:IPR029063"
+ /db_xref="InterPro:IPR041698"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y166"
+ /translation="MDNLPIESAESTRLAKAAMTRRFYTRSVVKGEITLPAVPSMIDE
+ YVTMCAGLFAGVGRKFSDEELAHLRAVLQGQLAEAYAASQRSTIVISYNAPMGPTLHY
+ QVRAQWRTVAQEYENWIATREPPLFGTEPDARVWALANEAADPTTHRVLEIGAGTGRN
+ ALALARRGHPVDVVEMTPKFADIIRSDAERDSLDVRVIMRDVFSTMDDLRQDYQLMVL
+ SEVVPDFRTTQQLRNLFELAAQCLAPGARLVFNAFLANGDYAPDQAAREFGQQMYTGM
+ CTRAEMSAAAAGLPLELVADDSVYDYEKTHLPPGAWPPTSWYADWIRGLDVFTTNVES
+ CPIEMRWLVFQRRR"
+ gene complement(2693240..2694450)
+ /locus_tag="BQ2027_IS1558-2"
+ mobile_element complement(2693240..2694450)
+ /locus_tag="BQ2027_IS1558-2"
+ /note="IS1558-2, len: 1211 nt. Equivalent to IS1558, len:
+ 999 nt, from Mycobacterium tuberculosis strain
+ H37Rv,(99.4% identity in 999 nt overlap)."
+ /mobile_element_type="insertion sequence:IS1558"
+ repeat_region 2693240..2693252
+ /note="13 bp imperfect inverted repeat, IRR,GCAGTCGTAAAAG,
+ flanking IS element IS1558."
+ /rpt_type=INVERTED
+ gene complement(2693372..2694064)
+ /locus_tag="BQ2027_MB2447C"
+ CDS complement(2693372..2694064)
+ /locus_tag="BQ2027_MB2447C"
+ /note="Mb2447c, -, len: 230 aa. Equivalent to 3' end of
+ Rv2424c, len: 333 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (98.7% identity in 230 aa overlap). Probable
+ transposase for IS1558, similar to IS element proteins
+ e.g. AL021957|Rv2177c|MTV021_10 from Mycobacterium
+ tuberculosis (221 aa), FASTA scores: opt: 1491, E():
+ 6.2e-87, (98.6% identity in 221 aa overlap);
+ P19780|YIS1_STRCO HYPOTHETICAL INSERTION ELEMENT IS110
+ from Streptomyces coelicolor (45 aa), FASTA scores: opt:
+ 203, E(): 1.7e-05; (27.3% identity in 238 aa overlap);
+ etc. Contains PS01159 WW/rsp5/WWP domain signature.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv2424c exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a 2 bp
+ deletion (gt-*) splits Rv2424c into 2 parts, Mb2447c and
+ Mb2448c. Mb2447c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSPOSASE [SECOND PART]"
+ /protein_id="SIU01062.1"
+ /db_xref="GOA:A0A1R3Y171"
+ /db_xref="InterPro:IPR003346"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y171"
+ /translation="MLADLARGSMRSKIPDLQRALEGRFDDHHALMCRLHLAHLDQLD
+ AMIGALDEQIEQLMHPFCARRELIASIPGIGVGASATVISEIGADPAAWFPSAEHLAS
+ WVRLCPGNHESAGKRHHGARRTGNQHLQPVLVECAWAAVRTDGYLREYYRRQVRKFGG
+ FRSPAANKKAIIAVAHKLIVIIWHVLATGRPYQDLGADYFTTRMDPDKERRRLVAKLE
+ AQGLGVTLEPAA"
+ gene complement(2694078..2694371)
+ /locus_tag="BQ2027_MB2448C"
+ CDS complement(2694078..2694371)
+ /locus_tag="BQ2027_MB2448C"
+ /note="Mb2448c, -, len: 97 aa. Similar to 5' end of
+ Rv2424c, len: 333 aa, from Mycobacterium tuberculosis
+ strain H37Rv, (100.0% identity in 67 aa overlap). Probable
+ transposase for IS1558, similar to IS element proteins
+ e.g. AL021957|Rv2177c|MTV021_10 from Mycobacterium
+ tuberculosis (221 aa), FASTA scores: opt: 1491, E():
+ 6.2e-87, (98.6% identity in 221 aa overlap);
+ P19780|YIS1_STRCO HYPOTHETICAL INSERTION ELEMENT IS110
+ from Streptomyces coelicolor (45 aa), FASTA scores: opt:
+ 203, E(): 1.7e-05; (27.3% identity in 238 aa overlap);
+ etc. Contains PS01159 WW/rsp5/WWP domain signature.
+ REMARK-M.bovis-M.tuberculosis: In Mycobacterium
+ tuberculosis strain H37Rv, Rv2424c exists as a single
+ gene. In Mycobacterium bovis, a frameshift due to a 2 bp
+ deletion (gt-*) splits Rv2424c into 2 parts, Mb2447c and
+ Mb2448c. Mb2448c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE TRANSPOSASE [FIRST PART]"
+ /protein_id="SIU01063.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y137"
+ /translation="MQCRAREERPGRKTDLLDAEWLVHLLECGLLRGWLIPPADIKAA
+ RDVIRYRRKLVEHRTSKLQRLGNASRRRDQGRQRGVLGHPQVGAGDGGGAHRR"
+ repeat_region complement(2694438..2694450)
+ /locus_tag="BQ2027_IS1558-2"
+ /note="13 bp imperfect inverted repeat, IRL,GCAGTCGCAAAAG,
+ flanking IS element IS1558."
+ /rpt_type=INVERTED
+ gene complement(2694460..2695902)
+ /locus_tag="BQ2027_MB2449C"
+ CDS complement(2694460..2695902)
+ /locus_tag="BQ2027_MB2449C"
+ /note="Mb2449c, -, len: 480 aa. Equivalent to Rv2425c,
+ len: 480 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 480 aa overlap). Hypothetical protein;
+ C-terminal half shares similarity to other unknown
+ conserved proteins e.g. Q53065 HYPOTHETICAL 24.3 KDA
+ PROTEIN from Rhodococcus erythropolis (219 aa), FASTA
+ scores: opt: 398, E(): 9.9e-17, (34.15% identity in 202 aa
+ overlap); C-terminus of O27843|MTH1815 CONSERVED PROTEIN
+ from Methanothermobacter thermautotrophicus (346 aa),
+ FASTA scores: opt: 341, E(): 3.7e-13, (31.35% identity in
+ 233 aa overlap); etc. Protein product from Mb2449c
+ detected using SWATH mass spectrometry. Mb2449c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Carbon monoxide oxidation accessory protein
+ CoxE"
+ /protein_id="SIU01064.1"
+ /db_xref="InterPro:IPR008912"
+ /db_xref="InterPro:IPR011195"
+ /db_xref="InterPro:IPR036465"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y3C9"
+ /translation="MAARRIRAARPLAPHGLPGHLVGFVEALRGSGISVGPSETVDAG
+ RVMATLGLGDREVLREGIACAVLRRPDHRDTYDAMFDLWFPAALGARAVITTEDESAG
+ SGGLPPDDVEAMRQLLLDLLANNQDLAGKDERLVEMIARIVEAYGKYSSSRGPSFSSY
+ QALKAMALDELEGKLLAGLLAPYGDEPTATQEQIAKALAAQKIAQLRRMVDAETKRRT
+ AEQLGREHVQMYGIPQLSENVEFLRASGEQLRQMRRVVAPLARTLATRLAARRRRARA
+ GSIDLRKTLRKSMSTGGVPIDLVLHKPRPARPELVVLCDVSGSVAGFSHFTLLLVHAL
+ RQQFSRVRVFAFIDSTDEVTHMFGPESDLAIAIQRITREAGVYARDGHSDYGNAFVSF
+ MQGFPNVLSPRSSLLVLGDGRTNYRNPATDVLADMVTASRHAHWLNPEPKHLWGSGDS
+ AVPRYQEVITMHECRSAKQLATVIDQLLPV"
+ gene complement(2695902..2696777)
+ /locus_tag="BQ2027_MB2450C"
+ CDS complement(2695902..2696777)
+ /locus_tag="BQ2027_MB2450C"
+ /note="Mb2450c, -, len: 291 aa. Equivalent to Rv2426c,
+ len: 291 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 291 aa overlap). Conserved hypothetical
+ protein, highly similar to others e.g. Q51326|ORF4 from
+ Pseudomonas carboxydovorans (295 aa), FASTA scores: opt:
+ 853, E(): 3.7e-43, (48.75% identity in 277 aa overlap);
+ BAB47746|MLR0088 from Rhizobium loti (309 aa), FASTA
+ scores: opt :809, E(): 1.5e-40, (46.5% identity in 291 aa
+ overlap); Q9Y9R8|APE2220 from Aeropyrum pernix (297 aa),
+ FASTA scores: opt: 763, E(): 7.4e-38, (47.1% identity in
+ 261 aa overlap); etc. Contains PS00017 ATP/GTP-binding
+ site motif A (P-loop). Protein product from Mb2450c
+ detected using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2450c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="Carbon monoxide oxidation accessory protein
+ CoxD"
+ /protein_id="SIU01065.1"
+ /db_xref="GOA:A0A1R3Y1Z5"
+ /db_xref="InterPro:IPR003593"
+ /db_xref="InterPro:IPR011704"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1Z5"
+ /translation="MTVPARPTPLFADIADVSRRLAETGYLPDTATATAVFLADRLGK
+ PLLVEGPAGVGKTELARAVAQATGSGLVRLQCYEGVDEARALYEWNHAKQILRIQAGS
+ GDWEATKTDVLSEEFLLQRPLLTAIRRTEPTVLLIDETDKADIEIEGLLLEVLSDFAV
+ TVPELGTLTATRAPFVLLTSNATRELSEALKRRCLYLHIDFPTPELERRILLSRVPEL
+ PEHFAEELVRIIGVLRGMQLKKVPSIAETIDWGRTVLALGLDTIDDAVVAATLGVVLK
+ HQSDQQRATGELRLN"
+ gene complement(2696804..2698051)
+ /gene="proA"
+ /locus_tag="BQ2027_MB2451C"
+ CDS complement(2696804..2698051)
+ /gene="proA"
+ /locus_tag="BQ2027_MB2451C"
+ /note="Mb2451c, proA, len: 415 aa. Equivalent to Rv2427c,
+ len: 415 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 415 aa overlap). Probable proA,
+ gamma-glutamyl phosphate reductase protein (EC 1.2.1.41),
+ equivalent to Q9CBZ7|ML1458|PROA [GAMMA]-GLUTAMYL
+ PHOSPHATE REDUCTASE from Mycobacterium leprae (409 aa),
+ FASTA scores: opt: 2120, E(): 7.4e-118, (81.9% identity in
+ 409 aa overlap). Also highly similar or similar to other
+ GAMMA-GLUTAMYL PHOSPHATE REDUCTASES PROTEINS (GPR) e.g.
+ Q9RDK1|PROA from Streptomyces coelicolor (428 aa), FASTA
+ scores: opt: 1073, E(): 4.6e-56, (60.4% identity in 429 aa
+ overlap); P45638|PROA_CORGL from Corynebacterium
+ glutamicum (432 aa), FASTA scores: opt: 993, E(): 2.4e-51,
+ (58.5% identity in 417 aa overlap); P96489|PROA_STRTR
+ GAMMA-GLUTAMYL PHOSPHATE REDUCTASE from Streptococcus
+ thermophilus (416 aa), FASTA scores: opt: 863, E():
+ 1.1e-43, (49.15% identity in 413 aa overlap); etc. BELONGS
+ TO THE GAMMA-GLUTAMYL PHOSPHATE REDUCTASE FAMILY. Protein
+ product from Mb2451c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2451c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GAMMA-GLUTAMYL PHOSPHATE REDUCTASE
+ PROTEIN PROA (GPR) (GLUTAMATE-5-SEMIALDEHYDE
+ DEHYDROGENASE) (GLUTAMYL-GAMMA-SEMIALDEHYDE
+ DEHYDROGENASE)"
+ /protein_id="SIU01066.1"
+ /db_xref="GOA:P65789"
+ /db_xref="InterPro:IPR000965"
+ /db_xref="InterPro:IPR012134"
+ /db_xref="InterPro:IPR015590"
+ /db_xref="InterPro:IPR016161"
+ /db_xref="InterPro:IPR016162"
+ /db_xref="InterPro:IPR016163"
+ /db_xref="InterPro:IPR020593"
+ /db_xref="UniProtKB/Swiss-Prot:P65789"
+ /translation="MTVPAPSQLDLRQEVHDAARRARVAARRLASLPTTVKDRALHAA
+ ADELLAHRDQILAANAEDLNAAREADTPAAMLDRLSLNPQRVDGIAAGLRQVAGLRDP
+ VGEVLRGYTLPNGLQLRQQRVPLGVVGMIYEGRPNVTVDAFGLTLKSGNAALLRGSSS
+ AAKSNEALVAVLRTALVGLELPADAVQLLSAADRATVTHLIQARGLVDVVIPRGGAGL
+ IEAVVRDAQVPTIETGVGNCHVYVHQAADLDVAERILLNSKTRRPSVCNAAETLLVDA
+ AIAETALPRLLAALQHAGVTVHLDPDEADLRREYLSLDIAVAVVDGVDAAIAHINEYG
+ TGHTEAIVTTNLDAAQRFTEQIDAAAVMVNASTAFTDGEQFGFGAEIGISTQKLHARG
+ PMGLPELTSTKWIAWGAGHTRPA"
+ gene complement(2698134..2698439)
+ /locus_tag="BQ2027_MB2452C"
+ CDS complement(2698134..2698439)
+ /locus_tag="BQ2027_MB2452C"
+ /note="unnamed protein product; unnamed protein product;
+ Mb2452c, -, len: 101 aa. Equivalent to the second part of
+ oxyR' pseudogene (see citation below)"
+ /codon_start=1
+ /transl_table=11
+ /protein_id="SIU01067.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1J3"
+ /translation="MHEGHCLRDQTLDAAQHPGGVAGHRRAVRDRRAGGDTDSADRGR
+ RRDHAKPAGTRPIRRPCPARRIGLVFSSFGGREKSYQRLAGIIGKLIRGDRQVRLIA"
+ gene complement(2698440..2698634)
+ /locus_tag="BQ2027_MB2453C"
+ CDS complement(2698440..2698634)
+ /locus_tag="BQ2027_MB2453C"
+ /note="unnamed protein product; unnamed protein product;
+ Mb2453c, -, len: 64 aa. Equivalent to the first part of
+ oxyR' pseudogene. Mb2453c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing"
+ /codon_start=1
+ /transl_table=11
+ /protein_id="SIU01068.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y157"
+ /translation="MAGLRAFAAVAAKQWFSSAASILDMSQSTLRRAVVGSRSRCTPR
+ ACLSGKQRVPLTALSELTLL"
+ gene 2698767..2699354
+ /gene="ahpC"
+ /locus_tag="BQ2027_MB2454"
+ CDS 2698767..2699354
+ /gene="ahpC"
+ /locus_tag="BQ2027_MB2454"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2454, ahpC, len: 195 aa. Equivalent to Rv2428,
+ len: 195 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 195 aa overlap). ahpC, alkyl
+ hydroperoxide reductase C (EC 1.-.-.-) (see citations
+ below), equivalent to other alkyl hydroperoxide reductases
+ C mycobacterial proteins e.g. Q9CBF5|AHPC|ML2042 ALKYL
+ HYDROPEROXIDE REDUCTASE from Mycobacterium leprae (195 aa)
+ FASTA scores: opt: 1183, E(): 2.6e-72, (88.20% identity in
+ 195 aa overlap); O87323|AHPC from Mycobacterium marinum
+ (195 aa), FASTA scores: opt: 1215, E(): 1.9e-74, (90.8%
+ identity in 195 aa overlap); Q57413|AHPC|AVI-3 from
+ Mycobacterium avium (195 aa), FASTA scores: opt: 1201,
+ E(): 1.6e-73, (90.25% identity in 195 aa overlap). Also
+ highly similar to others from other organisms e.g.
+ Q9FBP5|AHPC ALKYL HYDROPEROXIDE REDUCTASE from
+ Streptomyces coelicolor (184 aa), FASTA scores: opt: 768,
+ E(): 1.7e-44, (62.45% identity in 189 aa overlap); etc.
+ Protein product from Mb2454 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2454 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="ALKYL HYDROPEROXIDE REDUCTASE C PROTEIN AHPC
+ (ALKYL HYDROPEROXIDASE C)"
+ /protein_id="SIU01069.1"
+ /db_xref="GOA:A0A1R3Y168"
+ /db_xref="InterPro:IPR000866"
+ /db_xref="InterPro:IPR013766"
+ /db_xref="InterPro:IPR024706"
+ /db_xref="InterPro:IPR036249"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y168"
+ /translation="MPLLTIGDQFPAYQLTALIGGDLSKVDAKQPGDYFTTITSDEHP
+ GKWRVVFFWPKDFTFVCPTEIAAFSKLNDEFEDRDAQILGVSIDSEFAHFQWRAQHND
+ LKTLPFPMLSDIKRELSQAAGVLNADGVADRVTFIVDPNNEIQFVSATAGSVGRNVDE
+ VLRVLDALQSDELCACNWRKGDPTLDAGELLKASA"
+ gene 2699380..2699913
+ /gene="ahpD"
+ /locus_tag="BQ2027_MB2455"
+ CDS 2699380..2699913
+ /gene="ahpD"
+ /locus_tag="BQ2027_MB2455"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2455, ahpD, len: 177 aa. Equivalent to Rv2429,
+ len: 177 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 177 aa overlap). ahpD, alkyl
+ hydroperoxide reductase (EC 1.-.-.-), similar to other
+ alkyl hydroperoxide reductases D proteins e.g. Q9RN73|AHPD
+ from Streptomyces coelicolor (178 aa), FASTA scores: opt:
+ 611, E(): 1.4e-33, (57.4% identity in 169 aa overlap);
+ Q50441|AHPD_MYCSM AHPD PROTEIN (FRAGMENT) from
+ Mycobacterium smegmatis (52 aa), FASTA score: opt:196.
+ Protein product from Mb2455 detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2455 found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ALKYL HYDROPEROXIDE REDUCTASE D PROTEIN AHPD
+ (ALKYL HYDROPEROXIDASE D)"
+ /protein_id="SIU01070.1"
+ /db_xref="GOA:P0A5N5"
+ /db_xref="InterPro:IPR003779"
+ /db_xref="InterPro:IPR004674"
+ /db_xref="InterPro:IPR004675"
+ /db_xref="InterPro:IPR029032"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5N5"
+ /translation="MSIEKLKAALPEYAKDIKLNLSSITRSSVLDQEQLWGTLLASAA
+ ATRNPQVLADIGAEATDHLSAAARHAALGAAAIMGMNNVFYRGRGFLEGRYDDLRPGL
+ RMNIIANPGIPKANFELWSFAVSAINGCSHCLVAHEHTLRTVGVDREAIFEALKAAAI
+ VSGVAQALATIEALSPS"
+ gene complement(2699910..2700494)
+ /gene="PPE41"
+ /locus_tag="BQ2027_MB2456C"
+ CDS complement(2699910..2700494)
+ /gene="PPE41"
+ /locus_tag="BQ2027_MB2456C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2456c, PPE41, len: 194 aa. Equivalent to Rv2430c,
+ len: 194 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 194 aa overlap). Member of the
+ Mycobacterium tuberculosis PPE family similar to others
+ e.g. AAK46014|Rv1745|MT1745 from Mycobacterium
+ tuberculosis (385 aa) FASTA scores: opt: 389, E():
+ 1.2e-17, (35.95% identity in 192 aa overlap); etc. Protein
+ product from Mb2456c detected using SWATH mass
+ spectrometry. Mb2456c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="ppe family protein ppe41"
+ /protein_id="SIU01071.1"
+ /db_xref="InterPro:IPR000030"
+ /db_xref="InterPro:IPR038332"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y173"
+ /translation="MHFEAYPPEVNSANIYAGPGPDSMLAAARAWRSLDVEMTAVQRS
+ FNRTLLSLMDAWAGPVVMQLMEAAKPFVRWLTDLCVQLSEVERQIHEIVRAYEWAHHD
+ MVPLAQIYNNRAERQILIDNNALGQFTAQIADLDQEYDDFWDEDGEVMRDYRLRVSDA
+ LSKLTPWKAPPPIAHSTVLVAPVSPSTASSRTDT"
+ gene complement(2700541..2700840)
+ /gene="PE25"
+ /locus_tag="BQ2027_MB2457C"
+ CDS complement(2700541..2700840)
+ /gene="PE25"
+ /locus_tag="BQ2027_MB2457C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2457c, PE25, len: 99 aa. Equivalent to Rv2431c,
+ len: 99 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 99 aa overlap). Member of the
+ Mycobacterium tuberculosis PE family (see first citation
+ below), similar to others e.g. AAK47158|MT2839 from
+ Mycobacterium tuberculosis (275 aa) FASTA scores: opt:
+ 194, E(): 2.5e-06, (40.0% identity in 95 aa overlap); etc.
+ Protein product from Mb2457c detected using SWATH mass
+ spectrometry. Mb2457c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="pe family protein pe25"
+ /protein_id="SIU01072.1"
+ /db_xref="InterPro:IPR000084"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y179"
+ /translation="MSFVITNPEALTVAATEVRRIRDRAIQSDAQVAPMTTAVRPPAA
+ DLVSEKAATFLVEYARKYRQTIAAAAVVLEEFAHALTTGADKYATAEADNIKTFS"
+ gene complement(2701011..2701421)
+ /locus_tag="BQ2027_MB2458C"
+ CDS complement(2701011..2701421)
+ /locus_tag="BQ2027_MB2458C"
+ /note="Mb2458c, -, len: 136 aa. Equivalent to Rv2432c,
+ len: 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 136 aa overlap). Hypothetical unknown
+ protein. Mb2458c found to be expressed during exponential
+ growth in Sauton's minimal media by RNA-sequencing (TPM >
+ 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU01073.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y148"
+ /translation="MTVRAEHCRGAGGCDECPSVMPEHPTALFHDVAAIALAQPGAEP
+ GAMMGFPCRPALLPHLSRAVMRCVRTRSASTSLGVSVIAGQLPAAGSRHRLGAPCRHV
+ RWWLASDGHWGMVSYIPTALNVSMGGIVGWRCVP"
+ gene complement(2701418..2701708)
+ /locus_tag="BQ2027_MB2459C"
+ CDS complement(2701418..2701708)
+ /locus_tag="BQ2027_MB2459C"
+ /note="Mb2459c, -, len: 96 aa. Equivalent to Rv2433c, len:
+ 96 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 96 aa overlap). Hypothetical unknown
+ protein."
+ /codon_start=1
+ /transl_table=11
+ /product="HYPOTHETICAL PROTEIN"
+ /protein_id="SIU01074.1"
+ /db_xref="GOA:A0A1R3Y3D5"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y3D5"
+ /translation="MGLRDADERWDTVGQAIGLFLRGHTLRTAAPTALIVGTVLCAVN
+ QGATLAEGAATIGTWVRMVINYLVPFLVASVGYLGARRGVRRASGRSDPSAQ"
+ gene complement(2701689..2703134)
+ /locus_tag="BQ2027_MB2460C"
+ CDS complement(2701689..2703134)
+ /locus_tag="BQ2027_MB2460C"
+ /note="Mb2460c, -, len: 481 aa. Equivalent to Rv2434c,
+ len: 481 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 481 aa overlap). Probable conserved
+ transmembrane protein, with some similarity to
+ BAB48444|MLR0973 PROBABLE INTEGRAL MEMBRANE PROTEIN from
+ Rhizobium loti (410 aa), FASTA scores: opt: 298, E():
+ 4.1e-11, (27.25% identity in 389 aa overlap); and also
+ similarity with other hypothetical proteins and/or
+ putative integral membrane proteins. Mb2460c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED TRANSMEMBRANE PROTEIN"
+ /protein_id="SIU01075.1"
+ /db_xref="GOA:A0A1R3Y204"
+ /db_xref="InterPro:IPR000595"
+ /db_xref="InterPro:IPR006685"
+ /db_xref="InterPro:IPR010920"
+ /db_xref="InterPro:IPR014710"
+ /db_xref="InterPro:IPR016846"
+ /db_xref="InterPro:IPR018490"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y204"
+ /translation="MNLLDSTWFYWAVGIAIGLPAGLIVLTELHNILVRRNSHLARQA
+ SLLRNYLLPLGAVLLLLVKASEVPAEDPTVRVLTTAFGFLVLVLLLSLLNATLFQGAP
+ QQSWRKRLPAIFVDVARFALIGIGLAVILSYIWGVRVGGLFAALGVTSVVIGLMLQNS
+ VGQIVSGLFMLFEQPFRIDDWLETPTARGRVVEVNWRAVHIDTGSGLQIMPNSMLATT
+ AFTNLSRPAGAHECSITTTFSTSDPPDKVCAMLNRAASALPHVKPGVVPATIARGAAE
+ YRTTVRLTSPADEGPTQATFLRWVWYAARREGLHLDEADDEFSTAERVESALRTVVGP
+ ELRLSSSDQQSLARYARLVRYGTDEIVQHAGVVPMGITFVIAGSVRLTVTTDDGSVVA
+ IATLKKGTFLGLTALTRQPDPAGAVALEEVTALQIGREHLEQVVMNKPMLLQELGRVI
+ DERQRKAQQAIRRDLHQSPAAAGEHRGPARR"
+ gene complement(2703131..2705323)
+ /locus_tag="BQ2027_MB2461C"
+ CDS complement(2703131..2705323)
+ /locus_tag="BQ2027_MB2461C"
+ /note="Mb2461c, -, len: 730 aa. Equivalent to Rv2435c,
+ len: 730 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 730 aa overlap). Probably a cyclase
+ (adenylyl- or guanylyl-cyclase; EC 4.6.1.1 or 4.6.1.2
+ respectively); C-terminal domain (aa 500-730) similar to
+ domain at C-terminus of a series of adenylate/guanylate
+ cyclases (EC 4.6.-.-) e.g. O30820|CYA AAK45931|MT1661 from
+ Mycobacterium tuberculosis (443 aa) FASTA scores: opt:
+ 446, E(): 1.3e-19, (30.55% identity in 301 aa overlap);
+ BAB50179|MLL3242 CYCLASE (ADENYLYL OR GUANYLYL) from
+ Rhizobium loti (356 aa), FASTA scores: opt: 372, E():
+ 3.4e-15, (28.75% identity in 219 aa overlap); etc. BELONGS
+ TO ADENYLYL CYCLASE CLASS-4/GUANYLYL CYCLASE FAMILY.
+ Mb2461c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="probable cyclase (adenylyl-or
+ guanylyl-)(adenylate-or guanylate-)"
+ /protein_id="SIU01076.1"
+ /db_xref="GOA:A0A1R3Y1E6"
+ /db_xref="InterPro:IPR001054"
+ /db_xref="InterPro:IPR003660"
+ /db_xref="InterPro:IPR029787"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1E6"
+ /translation="MTSGEALDSVAESESTPAKKRHKNVLRRRPRFRASIQSKLMVLL
+ LLTSIVSVAAIAAIVYQSGRTSLRAAAYERLTQLRESQKRAVETLFSDLTNSLVIYER
+ GLTVVDAVVRFTAGFDQLADATISPAQQQAIVNYYNNEFITPVERTTGDKLDITALLP
+ TSPAQRYLQAYYTAPFTSDQDAMRLDDAGDGSAWSAANAQFNSYFREIVTRFDYDDAV
+ LLDTRGNIVYTLSKDPDLGTNILTGPYRESNLRDAYLKALGANAVDFTWITDFKPYQP
+ QLGVPTAWLVAPVEAGGKTQGVLALPLPIDKINKIMTADRQWQAAGMGSGTETYLAGP
+ DSLMRSDSRLFLQDPEEYRKQVVAAGTSLDVVNRAIQFGGTTLLQPVATEGLRAAQRG
+ QTGTVTSTDYTGSRELEAYAPLNVPDSDLHWSILATRNDSEAFAAVASFSRALVLVTV
+ GIIVVICVASMLIAHAMVRPIRRLEVGTQKISAGDYEVNIPVKSRDEIGDLTAAFNEM
+ SRNLQTKEELLNEQRKENDRLLLSMMPEPVVERYRLGEQTIAQEHQDVTVLFADILGV
+ DEISSGLSGNELVKIVDELVRQFDSAAEHLGVERIRTLHNGYLAGCGVTTPRLDNIPR
+ TVDFALEMRRIVDRFNCQTGNDLHLRVGINTGDVISGLVGRSSVVYDMWGAAVSLAYQ
+ MHSGSPQPGIYVTSQVYEAMRDVWQFTAAGTISVGGLEEPIYRLSERS"
+ gene 2705804..2706718
+ /gene="rbsK"
+ /locus_tag="BQ2027_MB2462"
+ CDS 2705804..2706718
+ /gene="rbsK"
+ /locus_tag="BQ2027_MB2462"
+ /note="Mb2462, rbsK, len: 304 aa. Equivalent to Rv2436,
+ len: 304 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.3% identity in 304 aa overlap). Probable rbsK,
+ ribokinase (EC 2.7.1.15), similar to others e.g.
+ Q9RZ99|DRA0055 from Deinococcus radiodurans (300 aa) FASTA
+ scores: opt: 485, E(): 9.1e-21, (44.55% identity in 301 aa
+ overlap); P36945|P96733|RBSK_BACSU from Bacillus subtilis
+ (293 aa), FASTA scores: opt: 398, E(): 8.5e-16, (36.35%
+ identity in 297 aa overlap);
+ P05054|RBSK_ECOLI|B3752|Z5253|ECS4694 from Escherichia
+ coli strain K12 (309 aa), FASTA scores: opt: 387, E():
+ 3.8e-15, (34.7% identity in 314 aa overlap); etc. Contains
+ PS00583 pfkB family of carbohydrate kinases signature 1.
+ BELONGS TO THE PFKB FAMILY OF CARBOHYDRATE KINASES.
+ Protein product from Mb2462 detected using SWATH mass
+ spectrometry. Mb2462 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="RIBOKINASE RBSK"
+ /protein_id="SIU01077.1"
+ /db_xref="GOA:A0A1R3Y1K3"
+ /db_xref="InterPro:IPR002139"
+ /db_xref="InterPro:IPR011611"
+ /db_xref="InterPro:IPR011877"
+ /db_xref="InterPro:IPR029056"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1K3"
+ /translation="MANASETNVGPMAPRVCVVGSVNMDLTFVVDALPRPGETVLAAS
+ LTRTPGGKGANQAVAAARAGAQVQFSGAFGDDPAAAQLRAHLRANAVGLDRTVTVPGP
+ SGTAIIVVDASAENTVLVAPGANAHLTPVPSAVANCDVLLTQLEIPVATALAAARAAQ
+ SADAVVMVNASPAGQDRSSLQDLAAIADVVIANEHEANDWPSPPTHFVITLGVRGARY
+ VGADGVFEVPAPTVTPVDTAGAGDVFAGVLAANWPRNPGSPAERLRALRRACAAGVLA
+ TLVSGAGDCAPAAAAIDAALRANRHNGS"
+ gene 2706950..2707369
+ /locus_tag="BQ2027_MB2463"
+ CDS 2706950..2707369
+ /locus_tag="BQ2027_MB2463"
+ /note="Mb2463, -, len: 139 aa. Equivalent to Rv2437, len:
+ 139 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 139 aa overlap). Conserved
+ hypothetical protein, with some similarity to CONSERVED
+ HYPOTHETICAL PROTEINS e.g. O06539|RV1139C|MTCI65.06c from
+ Mycobacterium tuberculosis (166 aa); AAK45430|MT1172 from
+ Mycobacterium tuberculosis (124 aa), FASTA scores: opt:
+ 166, E(): 0.00013, (35.7% identity in 112 aa overlap);
+ BAB48937|Mlr1600 from Rhizobium loti (222 aa), FASTA
+ scores: opt: 163, E(): 0.00033, (28.1% identity in 121 aa
+ overlap); etc. Mb2463 found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="conserved transmembrane protein"
+ /protein_id="SIU01078.1"
+ /db_xref="GOA:A0A1R3Y167"
+ /db_xref="InterPro:IPR007318"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y167"
+ /translation="MLQRTNVVQPLNTLRMVWIQVAGIIPATAGIAATVYAQLAMGDS
+ WRIGVDEQENTTLVRTGPFKWVRHPIYTAMMAFGLGLLLVTPNLVALAGFILLVATLE
+ VHVRRVEEPYLLRTHSAVYRGYTASVGRFVPGVGLIR"
+ gene complement(2707366..2709405)
+ /gene="nadE"
+ /locus_tag="BQ2027_MB2464C"
+ CDS complement(2707366..2709405)
+ /gene="nadE"
+ /locus_tag="BQ2027_MB2464C"
+ /note="Mb2464c, nadE, len: 679 aa. Equivalent to Rv2438c,
+ len: 679 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 679 aa overlap). nadE,
+ glutamine-dependent NAD(+) synthetase (EC 6.3.5.1) (see
+ citation below), equivalent to Q9CBZ6|NADE_MYCLE|ML1463
+ Glutamine-dependent NAD(+) synthetase from Mycobacterium
+ leprae (680 aa), FASTA scores: opt: 3877, E(): 0. Also
+ similar to others e.g. O83759|NADE_TREPA|TP0780 from
+ Treponema pallidum (679 aa), FASTA scores: opt: 543, E():
+ 1.1e-25; O74940|NADE_SCHPO|SPCC553.02 from
+ Schizosaccharomyces pombe (Fission yeast) (700 aa), FASTA
+ scores: opt: 354, E(): 4.7e-14; P38795|NADE_YEAST|YHR074W
+ from Saccharomyces cerevisiae (Baker's yeast) (714 aa),
+ FASTA scores: opt: 339, E(): 4e-13; etc. Contains PS00591
+ Glycosyl hydrolases family 10 active site. BELONGS TO THE
+ NAD SYNTHETASE FAMILY IN THE C-TERMINAL SECTION.
+ N-terminus shorter since first submission. Protein product
+ from Mb2464c detected using shotgun mass spectrometry and
+ SWATH mass spectrometry. Mb2464c found to be expressed
+ during exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="GLUTAMINE-DEPENDENT NAD(+) SYNTHETASE NADE
+ (NAD(+) SYNTHASE [GLUTAMINE-HYDROLYSING])"
+ /protein_id="SIU01079.1"
+ /db_xref="GOA:P0A5L7"
+ /db_xref="InterPro:IPR003010"
+ /db_xref="InterPro:IPR003694"
+ /db_xref="InterPro:IPR014445"
+ /db_xref="InterPro:IPR014729"
+ /db_xref="InterPro:IPR022310"
+ /db_xref="InterPro:IPR036526"
+ /db_xref="InterPro:IPR041856"
+ /db_xref="UniProtKB/Swiss-Prot:P0A5L7"
+ /translation="MNFYSAYQHGFVRVAACTHHTTIGDPAANAASVLDMARACHDDG
+ AALAVFPELTLSGYSIEDVLLQDSLLDAVEDALLDLVTESADLLPVLVVGAPLRHRHR
+ IYNTAVVIHRGAVLGVVPKSYLPTYREFYERRQMAPGDGERGTIRIGGADVAFGTDLL
+ FAASDLPGFVLHVEICEDMFVPMPPSAEAALAGATVLANLSGSPITIGRAEDRRLLAR
+ SASARCLAAYVYAAAGEGESTTDLAWDGQTMIWENGALLAESERFPKGVRRSVADVDT
+ ELLRSERLRMGTFDDNRRHHRELTESFRRIDFALDPPAGDIGLLREVERFPFVPADPQ
+ RLQQDCYEAYNIQVSGLEQRLRALDYPKVVIGVSGGLDSTHALIVATHAMDREGRPRS
+ DILAFALPGFATGEHTKNNAIKLARALGVTFSEIDIGDTARLMLHTIGHPYSVGEKVY
+ DVTFENVQAGLRTDYLFRIANQRGGIVLGTGDLSELALGWSTYGVGDQMSHYNVNAGV
+ PKTLIQHLIRWVISAGEFGEKVGEVLQSVLDTEITPELIPTGEEELQSSEAKVGPFAL
+ QDFSLFQVLRYGFRPSKIAFLAWHAWNDAERGNWPPGFPKSERPSYSLAEIRHWLQIF
+ VQRFYSFSQFKRSALPNGPKVSHGGALSPRGDWRAPSDMSARIWLDQIDREVPKG"
+ gene 2709283..2709561
+ /locus_tag="BQ2027_MB2465"
+ CDS 2709283..2709561
+ /locus_tag="BQ2027_MB2465"
+ /note="Mb2465, -, len: 92 aa. Equivalent to Rv2438A, len:
+ 92 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 92 aa overlap). Conserved hypothetical
+ protein, showing few similarity with various enzymes e.g.
+ part of O83441|VAA1_TREPA|ATPA1|TP0426 V-TYPE ATP SYNTHASE
+ ALPHA CHAIN 1 (EC 3.6.1.34) from Treponema pallidum (589
+ aa), FASTA scores: opt: 110, E(): 1.5, (40.3% identity in
+ 72 aa overlap); N-terminus of O95178|NIGM_HUMAN
+ NADH-UBIQUINONE OXIDOREDUCTASE AGGG SUBUNIT PRECURSOR (EC
+ 1.6.5.3) (EC 1.6.99.3) from Homo sapiens (105 aa), FASTA
+ scores: opt: 109, E(): 1.5, (35.5% identity in 62 aa
+ overlap); N-terminus of Q9HJ76|TA1096 PROBABLE GLYCEROL
+ KINASE from Thermoplasma acidophilum (488 aa); etc."
+ /codon_start=1
+ /transl_table=11
+ /product="CONSERVED HYPOTHETICAL PROTEIN"
+ /protein_id="SIU01080.1"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y181"
+ /translation="MARTGHVQYRRGVGRRVTDGGVVSAGGNAHEPVLVGGVKVHRPF
+ IVAQRRQNARITRRVSTLDTVESPALLADGGIDRRGDATDWAAADPGP"
+ gene complement(2709691..2710821)
+ /gene="proB"
+ /locus_tag="BQ2027_MB2466C"
+ CDS complement(2709691..2710821)
+ /gene="proB"
+ /locus_tag="BQ2027_MB2466C"
+ /note="Mb2466c, proB, len: 376 aa. Equivalent to Rv2439c,
+ len: 376 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (99.7% identity in 376 aa overlap). Probable proB,
+ glutamate 5-kinase protein (GK) (EC 2.7.2.11), equivalent
+ to Q9CBZ5|PROB|ML1464 from Mycobacterium leprae (367 aa)
+ FASTA scores: opt: 1937, E(): 1.1e-102, (84.4% identity in
+ 366 aa overlap). Also highly similar to other glutamate
+ 5-kinase proteins e.g. P46546|PROB_CORGL from
+ Corynebacterium glutamicum (Brevibacterium flavum) (369
+ aa), FASTA scores: opt: 1241, E(): 3e-63, (54.35% identity
+ in 368 aa overlap); Q9ZG98|PROB_MEIRU GLUTAMATE 5-KINASE
+ from Meiothermus ruber (390 aa), FASTA scores: opt: 825,
+ E(): 1.2e-39, (45.05% identity in 353 aa overlap);
+ Q9RDJ9|PROB|SCC123.25c from Streptomyces coelicolor (374
+ aa), FASTA scores: opt: 1193, E(): 1.6e-60, (55.85%
+ identity in 367 aa overlap); etc. Contains PS00902
+ Glutamate 5-kinase signature. BELONGS TO THE GLUTAMATE
+ 5-KINASE FAMILY. Protein product from Mb2466c detected
+ using SWATH mass spectrometry. Mb2466c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GLUTAMATE 5-KINASE PROTEIN PROB
+ (GAMMA-GLUTAMYL KINASE) (GK)"
+ /protein_id="SIU01081.1"
+ /db_xref="GOA:P59958"
+ /db_xref="InterPro:IPR001048"
+ /db_xref="InterPro:IPR001057"
+ /db_xref="InterPro:IPR002478"
+ /db_xref="InterPro:IPR005715"
+ /db_xref="InterPro:IPR011529"
+ /db_xref="InterPro:IPR015947"
+ /db_xref="InterPro:IPR019797"
+ /db_xref="InterPro:IPR036393"
+ /db_xref="InterPro:IPR036974"
+ /db_xref="InterPro:IPR041739"
+ /db_xref="UniProtKB/Swiss-Prot:P59958"
+ /translation="MRSPHRDAIRTARGLVVKVGTTALTTPSGMFDAGRLAGLAEAVE
+ RRMKAGSDVVIVSSGAIAAGIEPLGLSRRPKDLATKQAAASVGQVALVNSWSAAFARY
+ GRTVGQVLLTAHDISMRVQHTNAQRTLDRLRALHAVAIVNENDTVATNEIRFGDNDRL
+ SALVAHLVGADALVLLSDIDGLYDCDPRKTADATFIPEVSGPADLDGVVAGRSSHLGT
+ GGMASKVSAALLAADAGVPVLLAPAADAATALADASVGTVFAARPARLSARRFWVRYA
+ AEATGALTLDAGAVRAVVRQRRSLLAAGITAVSGRFCGGDVVELRAPDAAMVARGVVA
+ YDASELATMVGRSTSELPGELRRPVVHADDLVAVSAKQAKQV"
+ gene complement(2710821..2712260)
+ /gene="obg"
+ /locus_tag="BQ2027_MB2467C"
+ CDS complement(2710821..2712260)
+ /gene="obg"
+ /locus_tag="BQ2027_MB2467C"
+ /note="Mb2467c, obg, len: 479 aa. Equivalent to Rv2440c,
+ len: 479 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 479 aa overlap). Probable obg,
+ nucleotide-binding protein, equivalent to Q9CBZ4|ML1465
+ GTP1/OBG-FAMILY GTP-BINDING PROTEIN from Mycobacterium
+ leprae (478 aa), FASTA scores: opt: 1328, E(): 8.4e-70,
+ (58.9% identity in 479 aa overlap). Also highly similar to
+ others e.g. P95722|OBG GTP-BINDING PROTEIN from
+ Streptomyces coelicolor (478 aa), FASTA scores: opt: 1311,
+ E(): 8.2e-69, (60.7% identity in 476 aa overlap);
+ P20964|OBG_BACSU SPO0B-ASSOCIATED GTP-BINDING PROTEIN from
+ Bacillus subtilis (428 aa), FASTA scores: opt: 1006, E():
+ 3.9e-51, (42.9% identity in 436 aa overlap);
+ Q9KDK0|OBG|BH1213 GTP-BINDING PROTEIN INVOLVED IN
+ INITIATION OF SPORULATION from Bacillus halodurans (427
+ aa), FASTA scores: opt: 978, E(): 1.7e-49, (41.95%
+ identity in 436 aa overlap); etc. Highly similar
+ (identical but shorter 5 aa) to AAK46813|MT2516
+ GTP-BINDING PROTEIN from Mycobacterium tuberculosis strain
+ CDC1551 (484 aa), FASTA scores: opt: 3205, E(): 7.9e-179,
+ (100% identity in 479 aa overlap). Contains PS00017
+ ATP/GTP-binding site motif A (P-loop). BELONGS TO THE
+ GTP1/OBG FAMILY. Protein product from Mb2467c detected
+ using SWATH mass spectrometry. Mb2467c found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE GTP1/OBG-FAMILY GTP-BINDING PROTEIN
+ OBG"
+ /protein_id="SIU01082.1"
+ /db_xref="GOA:Q7TYK5"
+ /db_xref="InterPro:IPR006073"
+ /db_xref="InterPro:IPR006074"
+ /db_xref="InterPro:IPR006169"
+ /db_xref="InterPro:IPR014100"
+ /db_xref="InterPro:IPR015349"
+ /db_xref="InterPro:IPR027417"
+ /db_xref="InterPro:IPR031167"
+ /db_xref="InterPro:IPR036346"
+ /db_xref="InterPro:IPR036726"
+ /db_xref="UniProtKB/Swiss-Prot:Q7TYK5"
+ /translation="MPRFVDRVVIHTRAGSGGNGCASVHREKFKPLGGPDGGNGGRGG
+ SIVFVVDPQVHTLLDFHFRPHLTAASGKHGMGNNRDGAAGADLEVKVPEGTVVLDENG
+ RLLADLVGAGTRFEAAAGGRGGLGNAALASRVRKAPGFALLGEKGQSRDLTLELKTVA
+ DVGLVGFPSAGKSSLVSAISAAKPKIADYPFTTLVPNLGVVSAGEHAFTVADVPGLIP
+ GASRGRGLGLDFLRHIERCAVLVHVVDCATAEPGRDPISDIDALETELACYTPTLQGD
+ AALGDLAARPRAVVLNKIDVPEARELAEFVRDDIAQRGWPVFCVSTATRENLQPLIFG
+ LSQMISDYNAARPVAVPRRPVIRPIPVDDSGFTVEPDGHGGFVVSGARPERWIDQTNF
+ DNDEAVGYLADRLARLGVEEELLRLGARSGCAVTIGEMTFDWEPQTPAGEPVAMSGRG
+ TDPRLDSNKRVGAAERKAARSRRREHGDG"
+ gene complement(2712346..2712606)
+ /gene="rpmA"
+ /locus_tag="BQ2027_MB2468C"
+ CDS complement(2712346..2712606)
+ /gene="rpmA"
+ /locus_tag="BQ2027_MB2468C"
+ /note="Mb2468c, rpmA, len: 86 aa. Equivalent to Rv2441c,
+ len: 86 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 86 aa overlap). Probable rpmA, 50S
+ RIBOSOMAL PROTEINS L27, equivalent to Q9CBZ3|RL27_MYCLE
+ from Mycobacterium leprae (88 aa), FASTA scores: opt: 504,
+ E(): 7.6e-28, (93.2% identity in 81 aa overlap). Also
+ highly similar to others e.g. P95757|RL27_STRGR from
+ Streptomyces griseus (85 aa), FASTA scores: opt: 442, E():
+ 1.2e-23, (81.5% identity in 81 aa overlap); etc. Contains
+ PS00831 Ribosomal protein L27 signature. BELONGS TO THE
+ L27P FAMILY OF RIBOSOMAL PROTEINS. Protein product from
+ Mb2468c detected using shotgun mass spectrometry and SWATH
+ mass spectrometry. Mb2468c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l27 rpma"
+ /protein_id="SIU01083.1"
+ /db_xref="GOA:P66128"
+ /db_xref="InterPro:IPR001684"
+ /db_xref="InterPro:IPR018261"
+ /db_xref="UniProtKB/Swiss-Prot:P66128"
+ /translation="MAHKKGASSSRNGRDSAAQRLGVKRYGGQVVKAGEILVRQRGTK
+ FHPGVNVGRGGDDTLFAKTAGAVEFGIKRGRKTVSIVGSTTA"
+ gene complement(2712621..2712935)
+ /gene="rplU"
+ /locus_tag="BQ2027_MB2469C"
+ CDS complement(2712621..2712935)
+ /gene="rplU"
+ /locus_tag="BQ2027_MB2469C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2469c, rplU, len: 104 aa. Equivalent to Rv2442c,
+ len: 104 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 104 aa overlap). Probable rplU, 50S
+ RIBOSOMAL PROTEIN L21, equivalent to Q9CBZ2|RL21_MYCLE
+ from Mycobacterium leprae (103 aa), FASTA scores: opt:
+ 579, E(): 4.8e-31, (91.1% identity in 102 aa overlap).
+ Also highly similar to others e.g. P95756|RL21_STRGR from
+ Streptomyces griseus (106 aa), FASTA scores: opt: 362,
+ E(): 5.4e-17, (56.0% identity in 100 aa overlap); etc.
+ Protein product from Mb2469c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2469c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="50s ribosomal protein l21 rplu"
+ /protein_id="SIU01084.1"
+ /db_xref="GOA:P66118"
+ /db_xref="InterPro:IPR001787"
+ /db_xref="InterPro:IPR018258"
+ /db_xref="InterPro:IPR028909"
+ /db_xref="InterPro:IPR036164"
+ /db_xref="UniProtKB/Swiss-Prot:P66118"
+ /translation="MMATYAIVKTGGKQYKVAVGDVVKVEKLESEQGEKVSLPVALVV
+ DGATVTTDAKALAKVAVTGEVLGHTKGPKIRIHKFKNKTGYHKRQGHRQQLTVLKVTG
+ IA"
+ gene 2713283..2714758
+ /gene="dctA"
+ /locus_tag="BQ2027_MB2470"
+ CDS 2713283..2714758
+ /gene="dctA"
+ /locus_tag="BQ2027_MB2470"
+ /note="Mb2470, dctA, len: 491 aa. Equivalent to Rv2443,
+ len: 491 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 491 aa overlap). Probable dctA,
+ C4-dicarboxylate-transport transmembrane protein, similar
+ to other C4-DICARBOXYLATE TRANSPORT PROTEINS e.g.
+ AAK46817|MT2519 from Mycobacterium tuberculosis strain
+ CDC1551 (491 aa); Q9L1K8|SC6A11.12 PUTATIVE
+ SODIUM:DICARBOXYLATE SYMPORTER from Streptomyces
+ coelicolor (466 aa), FASTA scores: opt: 1797, E():
+ 2.9e-98, (61.3% identity in 452 aa overlap); Q9RRG7|DR2525
+ from Deinococcus radiodurans (463 aa); P50334|DCTA_SALTY
+ from Salmonella typhimurium (428 aa) FASTA scores: opt:
+ 1241, E(): 1.3e-65, (47.2% identity in 415 aa overlap);
+ etc. BELONGS TO THE SODIUM DICARBOXYLATE SYMPORTER FAMILY
+ (SDF) (DAACS FAMILY). Protein product from Mb2470 detected
+ using SWATH mass spectrometry. Mb2470 found to be
+ expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE C4-DICARBOXYLATE-TRANSPORT
+ TRANSMEMBRANE PROTEIN DCTA"
+ /protein_id="SIU01085.1"
+ /db_xref="GOA:A0A1R3Y209"
+ /db_xref="InterPro:IPR001991"
+ /db_xref="InterPro:IPR036458"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y209"
+ /translation="MTAPLDRAPVTDLPANNKGRDRTHWLYLAVIFAVIAGVIVGLTA
+ PSTGKSLTVLGTVFVNLIKMMIAPVIFCTIVLGIGSVRKAAAVGKVGGLALAYFLTMS
+ SVALGIGLIVGNLLSPGRDLHLRPGAVGSGAALAGQAAESHGIAGFIQQIIPRSLPSA
+ LTEGNVLQVLLVALLVGFAVQGLGPAGESILRAVENLQKLVFKVLVMVLWLAPIGAFG
+ AIANIVATTGFNAVTNLLLLMAGFYLTCVVFVFGVLGVLLRIVSGLSIFRLLRYLARE
+ YLLIFATSSSEVVLPRLITKMKHLGVQSSTVGVVVPTGYSFNLDGTAIYLTMASLFIA
+ DAMGHRLTWGEQIALLAFMIIASKGAAGVSGAGLATLAGGLQAHRPELLDGVGLIVGI
+ DRFMSEARSLTNFSGNAVATILVASWTKTIDLSKADEVLRGRDPFDESTMVDPHDEEP
+ PAATPHGGGVPTNPALCDFEQVSLGGLVGRPAGPQRADVDG"
+ gene complement(2714697..2717558)
+ /gene="rne"
+ /locus_tag="BQ2027_MB2471C"
+ CDS complement(2714697..2717558)
+ /gene="rne"
+ /locus_tag="BQ2027_MB2471C"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2471c, rne, len: 953 aa. Equivalent to Rv2444c,
+ len: 953 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 953 aa overlap). Possible rne,
+ ribonuclease E (EC 3.1.-.-), highly similar to others e.g.
+ Q9CBZ1|ML1468 POSSIBLE RIBONUCLEASE from Mycobacterium
+ leprae (924 aa), FASTA scores: opt: 3713, E(): 2.4e-174,
+ (74.2% identity in 966 aa overlap); Q9SI08|AT2G04270
+ PUTATIVE RIBONUCLEASE E from Arabidopsis thaliana (502
+ aa), FASTA scores: opt: 674, E(): 7.5e-26, (31.2% identity
+ in 410 aa overlap); etc. Similar at C-terminal end to
+ P21513|RNE_ECOLI|AMS|HMP1|B1084 ribonuclease E (EC
+ 3.1.4.-) (RNASE E) from Escherichia coli strain K12 (1061
+ aa), FASTA scores: opt: 554, E(): 9.9e-20, (37.8% identity
+ in 386 aa overlap). Also similar in medium part to several
+ cytoplasmic axial filament proteins e.g.
+ Q9HVU4|CAFA|PA4477 from Pseudomonas aeruginosa (485 aa),
+ FASTA scores: opt: 664, E(): 2.3e-25, (42.8% identity in
+ 418 aa overlap); etc. Equivalent to AAK46818 from
+ Mycobacterium tuberculosis strain CDC1551 (621 aa) but
+ longer 332 aa in N-terminal part. SEEMS TO BELONG TO THE
+ RNE FAMILY. Protein product from Mb2471c detected using
+ shotgun mass spectrometry and SWATH mass spectrometry.
+ Mb2471c found to be expressed during exponential growth in
+ Sauton's minimal media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="POSSIBLE RIBONUCLEASE E RNE"
+ /protein_id="SIU01086.1"
+ /db_xref="GOA:A0A1R3Y1F2"
+ /db_xref="InterPro:IPR003029"
+ /db_xref="InterPro:IPR004659"
+ /db_xref="InterPro:IPR012340"
+ /db_xref="InterPro:IPR019307"
+ /db_xref="InterPro:IPR022967"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y1F2"
+ /translation="MIDGAPPSDPPEPSQHEELPDRLRVHSLARTLGTTSRRVLDALT
+ ALDGRVRSAHSTVDRVDAVRVRDLLATHLETAGVLAASVHAPEASEEPESRLMLETQE
+ TRNADVERPHYMPLFVAPQPIPEPLADDEDVDDGPDYVADDSDADDEGQLDRPANRRR
+ RRGRRGRGRGRGEQGGSDGDPVDQQSEPRAQQFTSADAAETDDGDDRDSEDTEAGDNG
+ EDENGSLEAGNRRRRRRRRRKSASGDDNDAALEGPLPDDPPNTVVHERVPRAGDKAGN
+ SQDGGSGSTEIKGIDGSTRLEAKRQRRRDGRDAGRRRPPVLSEAEFLARREAVERVMV
+ VRDRVRTEPPLPGTRYTQIAVLEDGIVVEHFVTSAASASLVGNIYLGIVQNVLPSMEA
+ AFVDIGRGRNGVLYAGEVNWDAAGLGGADRKIEQALKPGDYVVVQVSKDPVGHKGARL
+ TTQVSLAGRFLVYVPGASSTGISRKLPDTERQRLKEILREVVPSDAGVIIRTASEGVK
+ EDDIRADVARLRERWEQIEAKAQETKEKAAGAAVALYEEPDVLVKVIRDLFNEDFVGL
+ IVSGDEAWNTINEYVNSVAPELVSKLTKYESADGPDGQSAPDVFTVHRIDEQLAKAMD
+ RKVWLPSGGTLVIDRTEAMTVIDVNTGKFTGAGGNLEQTVTKNNLEAAEEIVRQLRLR
+ DIGGIVVIDFIDMVLESNRDLVLRRLTESLARDRTRHQVSEVTSLGLVQLTRKRLGTG
+ LIEAFSTSCPNCSGRGILLHADPVDSAAATGRKSEPGARRGKRSKKSRSEESSDRSMV
+ AKVPVHAPGEHPMFKAMAAGLSSLAGRGDEESGEPAAELAEQAGDQPPTDLDDTAQAD
+ FEDTEDTDEDEDELDADEDLEDLDDEDLDEDLDVEDSDSDDEDSDEDAADADVDEEDA
+ AGLDGSPGEVDVPGVTELAPTRPRRRVAGRPAGPPIRLD"
+ gene complement(2717888..2718298)
+ /gene="ndkA"
+ /locus_tag="BQ2027_MB2472C"
+ CDS complement(2717888..2718298)
+ /gene="ndkA"
+ /locus_tag="BQ2027_MB2472C"
+ /standard_name="ndk"
+ /experiment="experimental evidence, no additional details
+ recorded"
+ /note="Mb2472c, ndkA, len: 136 aa. Equivalent to Rv2445c,
+ len: 136 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 136 aa overlap). Probable ndkA
+ (alternate gene name: ndk), nucleoside diphosphate kinase
+ (EC 2.7.4.6), equivalent to Q9CBZ0|NDK|ML1469 from
+ Mycobacterium leprae (136 aa), FASTA scores: opt: 762,
+ E(): 1.5e-42, (87.4% identity in 135 aa overlap); and
+ O85501|NDK from Mycobacterium smegmatis (139 aa), FASTA
+ scores: opt: 714, E(): 1.9e-39, (80.7% identity in 135 aa
+ overlap). Also highly similar to others e.g.
+ P50589|NDK_STRCO from Streptomyces coelicolor (137 aa),
+ FASTA scores: opt: 535, 6.8e-28, (60.3% identity in 136 aa
+ overlap); O29491|NDK_ARCFU|AF0767 from Archaeoglobus
+ fulgidus (151 aa), FASTA scores: opt: 521, E(): 5.9e-27,
+ (58.0% identity in 131 aa overlap); P31103|NDK_BACSU from
+ Bacillus subtilis (151 aa), FASTA scores: opt: 515, E():
+ 1.4e-26, (56.5% identity in 131 aa overlap); etc. BELONGS
+ TO THE NDK FAMILY. Protein product from Mb2472c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2472c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE NUCLEOSIDE DIPHOSPHATE KINASE NDKA
+ (NDK) (NDP KINASE) (NUCLEOSIDE-2-P KINASE)"
+ /protein_id="SIU01087.1"
+ /db_xref="GOA:P84283"
+ /db_xref="InterPro:IPR001564"
+ /db_xref="InterPro:IPR034907"
+ /db_xref="InterPro:IPR036850"
+ /db_xref="UniProtKB/Swiss-Prot:P84283"
+ /translation="MTERTLVLIKPDGIERQLIGEIISRIERKGLTIAALQLRTVSAE
+ LASQHYAEHEGKPFFGSLLEFITSGPVVAAIVEGTRAIAAVRQLAGGTDPVQAAAPGT
+ IRGDFALETQFNLVHGSDSAESAQREIALWFPGA"
+ gene complement(2718341..2718712)
+ /locus_tag="BQ2027_MB2473C"
+ CDS complement(2718341..2718712)
+ /locus_tag="BQ2027_MB2473C"
+ /note="Mb2473c, -, len: 123 aa. Equivalent to Rv2446c,
+ len: 123 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 123 aa overlap). Probable conserved
+ integral membrane protein, highly similar to Q9CBY9|ML1470
+ CONSERVED MEMBRANE PROTEIN from Mycobacterium leprae (123
+ aa), FASTA scores: opt: 468, E(): 6.7e-23, (66.65%
+ identity in 108 aa overlap). Also similar to
+ Q9L1G5|SCC88.24c PUTATIVE MEMBRANE PROTEIN from
+ Streptomyces coelicolor (118 aa), FASTA scores: opt: 130,
+ E(): 0.13, (37.2% identity in 86 aa overlap); and some
+ similarity to O06852|Y13070 hypothetical Streptomyces
+ coelicolor gene also between fpgs and ndk genes (see
+ citation below) (117 aa), FASTA scores: opt: 128, E():
+ 0.17, (36.0% identity in 86 aa overlap). Mb2473c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE CONSERVED INTEGRAL MEMBRANE PROTEIN"
+ /protein_id="SIU01088.1"
+ /db_xref="GOA:A0A1R3Y174"
+ /db_xref="InterPro:IPR025327"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y174"
+ /translation="MTDRSREPADPWKGFSAVMAATLILEAIVVLLAIPVVDAVGGGL
+ RPASLGYLVGLAVLLILLTGLQRRPWAIWVNLGAQPVLVAGFAVYPGVGFIGVLFAAL
+ WVLIAYLRAEVRRRRDYRVSQ"
+ gene complement(2718709..2720172)
+ /gene="folC"
+ /locus_tag="BQ2027_MB2474C"
+ CDS complement(2718709..2720172)
+ /gene="folC"
+ /locus_tag="BQ2027_MB2474C"
+ /note="Mb2474c, folC, len: 487 aa. Equivalent to Rv2447c,
+ len: 487 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 487 aa overlap). Probable folC,
+ folylpolyglutamate synthase (EC 6.3.2.17), equivalent to
+ Q9CBY8|FOLC|ML1471 from Mycobacterium leprae (485 aa),
+ FASTA scores: opt: 2425, E(): 2.2e-134, (78.7% identity in
+ 483 aa overlap). Also highly similar to others e.g.
+ Q9L1G4|FPGS|O08416|Y13070 from Streptomyces coelicolor
+ (444 aa), FASTA scores: opt: 774, E(): 6.3e-38, (53.9%
+ identity in 462 aa overlap); P15925|FOLC_LACCA|FGS from
+ Lactobacillus casei (428 aa), FASTA scores: opt: 631, E():
+ 1.4e-29, (34.55% identity in 437 aa overlap);
+ Q05865|FOLC_BACSU from Bacillus subtilis (430 aa), FASTA
+ scores: opt: 421, E(): 2.6e-17, (32.9% identity in 383 aa
+ overlap); etc. Contains PS01012 Folylpolyglutamate
+ synthase signature 2. BELONGS TO THE FOLYLPOLYGLUTAMATE
+ SYNTHASE FAMILY. Protein product from Mb2474c detected
+ using shotgun mass spectrometry and SWATH mass
+ spectrometry. Mb2474c found to be expressed during
+ exponential growth in Sauton's minimal media by
+ RNA-sequencing."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE FOLYLPOLYGLUTAMATE SYNTHASE PROTEIN
+ FOLC (FOLYLPOLY-GAMMA-GLUTAMATE SYNTHETASE) (FPGS)"
+ /protein_id="SIU01089.1"
+ /db_xref="GOA:A0A1R3Y188"
+ /db_xref="InterPro:IPR001645"
+ /db_xref="InterPro:IPR004101"
+ /db_xref="InterPro:IPR013221"
+ /db_xref="InterPro:IPR018109"
+ /db_xref="InterPro:IPR036565"
+ /db_xref="InterPro:IPR036615"
+ /db_xref="UniProtKB/TrEMBL:A0A1R3Y188"
+ /translation="MNSTNSGPPDSGSATGVVPTPDEIASLLQVEHLLDQRWPETRID
+ PSLTRISALMDLLGSPQRSYPSIHIAGTNGKTSVARMVDALVTALHRRTGRTTSPHLQ
+ SPVERISIDGKPISPAQYVATYREIEPLVALIDQQSQASAGKGGPAMSKFEVLTAMAF
+ AAFADAPVDVAVVEVGMGGRWDATNVINAPVAVITPISIDHVDYLGADIAGIAGEKAG
+ IITRAPDGSPDTVAVIGRQVPKVMEVLLAESVRADASVAREDSEFAVLRRQIAVGGQV
+ LQLQGLGGVYSDIYLPLHGEHQAHNAVLALASVEAFFGAGAQRQLDGDAVRAGFAAVT
+ SPGRLERMRSAPTVFIDAAHNPAGASALAQTLAHEFDFRFLVGVLSVLGDKDVDGILA
+ ALEPVFDSVVVTHNGSPRALDVEALALAAGERFGPDRVRTAENLRDAIDVATSLVDDA
+ AADPDVAGDAFSRTGIVITGSVVTAGAARTLFGRDPQ"
+ gene complement(2720169..2722799)
+ /gene="valS"
+ /locus_tag="BQ2027_MB2475C"
+ CDS complement(2720169..2722799)
+ /gene="valS"
+ /locus_tag="BQ2027_MB2475C"
+ /note="Mb2475c, valS, len: 876 aa. Equivalent to Rv2448c,
+ len: 876 aa, from Mycobacterium tuberculosis strain H37Rv,
+ (100.0% identity in 876 aa overlap). Probable valS,
+ valyl-tRNA synthetases (EC 6.1.1.9), equivalent to
+ Q9CBY7|VALS|ML1472 VALYL-TRNA SYNTHASE from Mycobacterium
+ leprae (886 aa), FASTA scores: opt: 5181,E(): 0, (85.4%
+ identity in 876 aa overlap). Also highly similar to others
+ e.g. O06851|SYV_STRCO from Streptomyces coelicolor (874
+ aa), FASTA scores: opt: 2470, E(): 1.6e-143, (60.45%
+ identity in 880 aa overlap); Q9X2D7|SYV_THEMA|VALS|TM1817
+ from Thermotoga maritima (865 aa), FASTA scores: opt:
+ 2418, E(): 2.4e-140, (44.2% identity in 891 aa overlap);
+ Q05873|SYV_BACSU|VALS from Bacillus subtilis (880 aa),
+ FASTA scores: opt: 2063, E(): 1.4e-118, (46.08% identity
+ in 894 aa overlap); etc. Contains PS00178
+ Aminoacyl-transfer RNA synthetases class-I signature.
+ Contains probable coiled-coil from aa 810 to 846. BELONGS
+ TO CLASS-I AMINOACYL-TRNA SYNTHETASE FAMILY. Protein
+ product from Mb2475c detected using shotgun mass
+ spectrometry and SWATH mass spectrometry. Mb2475c found to
+ be expressed during exponential growth in Sauton's minimal
+ media by RNA-sequencing (TPM > 20)."
+ /codon_start=1
+ /transl_table=11
+ /product="PROBABLE VALYL-tRNA SYNTHASE PROTEIN VALS
+ (VALYL-tRNA SYNTHETASE) (VALINE--tRNA LIGASE) (VALINE
+ TRANSLASE)"
+ /protein_id="SIU01090.1"
+ /db_xref="GOA:P67600"
+ /db_xref="InterPro:IPR001412"
+ /db_xref="InterPro:IPR002300"
+ /db_xref="InterPro:IPR002303"
+ /db_xref="InterPro:IPR009008"
+ /db_xref="InterPro:IPR009080"
+ /db_xref="InterPro:IPR010978"
+ /db_xref="InterPro:IPR013155"
+ /db_xref="InterPro:IPR014729"
+